๐Ÿ’ก WIDA/DACON ๋ถ„๋ฅ˜-ํšŒ๊ท€

[DACON/์ตœ๋‹ค์˜ˆ] ๋ถ„๋ฅ˜ ๋ชจ๋ธ ์•Œ์•„๋ณด๊ธฐ

๋‹ค์˜ˆ๋ป 2023. 3. 23. 23:57

K-Nearest Neighbor (KNN)

KNN์€ ์ง€๋„ ํ•™์Šต(Supervised Learning)์˜ ์ผ์ข…์œผ๋กœ, ๋ถ„๋ฅ˜(Classification)์™€ ํšŒ๊ท€(Regression) ๋ฌธ์ œ์— ๋ชจ๋‘ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค.

๋ฐ์ดํ„ฐ ์ ๋“ค ๊ฐ„์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ •ํ•˜์—ฌ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ์ด์›ƒ๋“ค์„ ์ฐพ์•„๋‚ด๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋งํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ์ฐพ์•„๋‚ธ ์ด์›ƒ๋“ค์˜ ๋ ˆ์ด๋ธ”์„ ๋ถ„๋ฅ˜ ๋ฌธ์ œ(Classification)์—์„œ๋Š” ๋‹ค์ˆ˜๊ฒฐ ํˆฌํ‘œ๋ฅผ ํ†ตํ•ด, ํšŒ๊ท€ ๋ฌธ์ œ(Regression)์—์„œ๋Š” ์ด์›ƒ๋“ค์˜ ํ‰๊ท ๊ฐ’์„ ๊ณ„์‚ฐํ•˜์—ฌ ์˜ˆ์ธกํ•œ๋‹ค.

์žฅ์ 

  • ๋ธ์„ ํ•™์Šต์‹œํ‚ค๋Š” ๊ณผ์ •์ด ์—†๊ธฐ ๋•Œ๋ฌธ์—, ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฅ˜ํ•˜๊ฑฐ๋‚˜ ์˜ˆ์ธกํ•˜๋Š” ๋ฐ์— ์ ํ•ฉ
  • ์ดํ•ดํ•˜๊ธฐ ์‰ฌ์šด ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๊ธฐ ๋•Œ๋ฌธ์—, ๋น„์ „๋ฌธ๊ฐ€๋„ ์‰ฝ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Œ

๋‹จ์ 

  • ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ ๊ฐ„์˜ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ„์‚ฐํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ๋ฐ์ดํ„ฐ์˜ ์ฐจ์›์ด ๋Š˜์–ด๋‚ ์ˆ˜๋ก ๊ณ„์‚ฐ ๋น„์šฉ์ด ์ฆ๊ฐ€ํ•˜๋ฉฐ, ์ด์ƒ์น˜(Outlier)์— ๋ฏผ๊ฐํ•ด์ง
  • ์ด์›ƒ์˜ ์ˆ˜(K)๋ฅผ ์–ด๋–ป๊ฒŒ ์„ค์ •ํ•˜๋Š๋ƒ์— ๋”ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ€ ํฌ๊ฒŒ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์—, ์ ์ ˆํ•œ K๊ฐ’์„ ์ฐพ๋Š” ๊ฒƒ์ด ์ค‘์š”
  • ์ด์ƒ์ ์ธ K๊ฐ’์„ ์ฐพ๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ๋Š”, ๊ต์ฐจ ๊ฒ€์ฆ(Cross Validation)์„ ํ†ตํ•ด K๊ฐ’์„ ๋ฐ”๊พธ์–ด๊ฐ€๋ฉฐ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ์ด ์žˆ์Œ

Random Forest

๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ๋Š” ์˜์‚ฌ ๊ฒฐ์ • ๋‚˜๋ฌด(Decision Tree)๋ฅผ ์—ฌ๋Ÿฌ ๊ฐœ ์—ฐ๊ฒฐํ•˜์—ฌ ๋งŒ๋“  ์•™์ƒ๋ธ”(Ensemble) ๋ชจ๋ธ์ด๋‹ค. ๊ฐ๊ฐ์˜ ์˜์‚ฌ ๊ฒฐ์ • ๋‚˜๋ฌด๋“ค์€ ๋žœ๋คํ•˜๊ฒŒ ์„ ํƒ๋œ ๋ณ€์ˆ˜๋“ค์„ ๊ธฐ์ค€์œผ๋กœ ํ•™์Šตํ•˜๋ฉฐ, ์ด๋ ‡๊ฒŒ ๋งŒ๋“ค์–ด์ง„ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์˜์‚ฌ ๊ฒฐ์ • ๋‚˜๋ฌด๋“ค์„ ์กฐํ•ฉํ•˜์—ฌ ์ตœ์ข… ์˜ˆ์ธก ๋ชจ๋ธ์„ ๋งŒ๋“ ๋‹ค.

์žฅ์ 

  • ๋†’์€ ์˜ˆ์ธก ์ •ํ™•๋„ :
  • ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์˜์‚ฌ ๊ฒฐ์ • ๋‚˜๋ฌด๋“ค์„ ์กฐํ•ฉํ•จ์œผ๋กœ์จ, ๊ฐœ๋ณ„ ์˜์‚ฌ ๊ฒฐ์ • ๋‚˜๋ฌด์˜ ๋‹จ์ ์„ ๋ณด์™„ํ•˜๊ณ  ์˜ˆ์ธก ์ •ํ™•๋„๋ฅผ ํ–ฅ์ƒ์‹œํ‚ด
  • ๊ณผ์ ํ•ฉ ๋ฐฉ์ง€ :
  • ๊ฐ๊ฐ์˜ ์˜์‚ฌ ๊ฒฐ์ • ๋‚˜๋ฌด๋“ค์ด ๋žœ๋คํ•˜๊ฒŒ ์„ ํƒ๋œ ๋ณ€์ˆ˜๋“ค์„ ๊ธฐ์ค€์œผ๋กœ ํ•™์Šตํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ๊ณผ์ ํ•ฉ(Overfitting)์„ ๋ฐฉ์ง€ํ•  ์ˆ˜ ์žˆ์Œ
  • ๋ณ€์ˆ˜ ์ค‘์š”๋„ ํŒŒ์•… :
  • ๋žœ๋ค ํ•™์Šต์œผ๋กœ, ๊ฐ ๋ณ€์ˆ˜๋“ค์˜ ์ค‘์š”๋„๋ฅผ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Œ

๋‹จ์ 

  • ๋†’์€ ๊ณ„์‚ฐ ๋น„์šฉ :
  • ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์˜์‚ฌ ๊ฒฐ์ • ๋‚˜๋ฌด๋“ค์„ ํ•™์Šตํ•˜๊ณ  ์กฐํ•ฉํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ํ•™์Šต ์‹œ๊ฐ„๊ณผ ์˜ˆ์ธก ์‹œ๊ฐ„์ด ์˜ค๋ž˜ ๊ฑธ๋ฆด ์ˆ˜ ์žˆ์Œ
  • ํ•ด์„๋ ฅ ๋‚ฎ์Œ :
  • ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์˜์‚ฌ ๊ฒฐ์ • ๋‚˜๋ฌด๋“ค์„ ์กฐํ•ฉํ•˜์—ฌ ๋งŒ๋“ค๊ธฐ ๋•Œ๋ฌธ์—, ์ตœ์ข… ๋ชจ๋ธ์˜ ํ•ด์„๋ ฅ์ด ๋‚ฎ์„ ์ˆ˜ ์žˆ์Œ

๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ๋Š” ๋ถ„๋ฅ˜(Classification)์™€ ํšŒ๊ท€(Regression) ๋ฌธ์ œ์— ๋ชจ๋‘ ์ ์šฉ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ๋‹ค.

 

 

https://dad-rock.tistory.com/714