WIDA/프로젝트 보고서

[WIDA] 3학년_3차 보고서

김다피 2024. 11. 11. 16:29

주제 :  머신러닝 및 딥러닝 모델을 통한 고랭지 배추 가격 예측 

 

<문제 정의>

배추는 국내 채소류 5대 수급 민감 품목으로 불릴 정도로 가격 변동에 국민 체감이 높은 식품으로서, 고추, 마늘, 양파와 비교하였을 때도 가격 진폭계수가 높은 것으로 나타난다.  농림축산식품부의 2021년 농림축산식품 주요통계에 따르면 1인당 연간채소 소비량 중 배추가 차지하는 비중이 35.65%에 달한다.

배추는 생산량 대비 수입량이 적은 품목으로서, 높은 소빙류과 낮은 수입률로 인해 국내 생산량에 민감하다고 볼 수 있다.배추는 저장성이 약한 데 비해 신선도가 중요한 식품 품목으로서, 생산성 변동에 다른 가격 변동이 민감함을 볼 수 있었다. 

또한 도메인에 대한 파악 중, 농림수산품 물가가 이번년도 9월까지의 폭염으로 급상승하였고, 그 중 배추가 61%로 큰 영향을 받았음을 확인할 수 있었다. 

이런 배경에 따라, 배추 가격 변화 추세를 예측하여 시장을 안정시키고, 배추 수급에 대처할 수 있도록 하고자 한다.

 

<사용 데이터>

  • 고랭지 배추 가격 데이터
    • 농넷에서 제공하는 2020년 7월 1일부터 2024년 6월 30일까지의 데이터
    • 거래 단위 : 10kg 그물망(전체 데이터 중 약 95% 차지 )
    • 산지 시군구 : 평창, 태백, 강릉, 정선, 삼척(고랭지배추 주 생산지 5곳을 선정)
  • 날씨 데이터
    • EDA 및 전처리 현재 진행 중

  • 물가 지수 데이터
    • 품목별 생산자물가지수
    • 품목성질별 소비자물가지수

<전처리>

  • 결측치 처리
    • 일강수량(mm) : 비가 오지 않는 날을 null로 기입한 것으로 확인하여 0으로 대체
    • 일강수량 외의 컬럼 : 전년도 혹은 전전년도의 데이터로 대체값 입력함

<사용 모델>

  • 선행 연구의 방법론을 따라, 앙상블_randomforest, decision tree, linear regression, Gradient Boosting , xgboost 모델들을 시도
  • 고랭지 배추는 특정 기간에만 자라고 판매되는 채소인 만큼, 시계열모델보다 다른 머신러닝 모델들을 사용하면 좋을 것이라는 가설을 시도해보는 과정을 거치고 있음
  • 여러 모델링을 적용해보아 좋은 성능을 가진 모델을 취하 선택할 예정이며, 이에 따라 어떤 요소가 고랭지배추 가격에 영향을 많이 주는지에 대한 인사이트를 얻고자 함

 

<추후 계획>

  • 이 프로젝트에 제일 적합한 모델이 무엇일지에 대한 선행연구 스터디를 진행할 예정

'WIDA > 프로젝트 보고서' 카테고리의 다른 글

[WIDA] 3학년_4차 보고서  (0) 2024.11.12
[WIDA] 2학년_3차 보고서  (0) 2024.11.08
[WIDA]3학년_중간발표자료  (1) 2024.10.09
[ WIDA ] 2학년_중간 발표자료  (1) 2024.10.09
[WIDA] 1학년조 중간발표 ppt  (0) 2024.10.09