K-Nearest Neighbor (KNN)
KNN์ ์ง๋ ํ์ต(Supervised Learning)์ ์ผ์ข ์ผ๋ก, ๋ถ๋ฅ(Classification)์ ํ๊ท(Regression) ๋ฌธ์ ์ ๋ชจ๋ ์ฌ์ฉ๋ ์ ์๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค.
๋ฐ์ดํฐ ์ ๋ค ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ ํ์ฌ ๊ฐ์ฅ ๊ฐ๊น์ด ์ด์๋ค์ ์ฐพ์๋ด๋ ์๊ณ ๋ฆฌ์ฆ์ ๋งํ๋ค. ์ด๋ ๊ฒ ์ฐพ์๋ธ ์ด์๋ค์ ๋ ์ด๋ธ์ ๋ถ๋ฅ ๋ฌธ์ (Classification)์์๋ ๋ค์๊ฒฐ ํฌํ๋ฅผ ํตํด, ํ๊ท ๋ฌธ์ (Regression)์์๋ ์ด์๋ค์ ํ๊ท ๊ฐ์ ๊ณ์ฐํ์ฌ ์์ธกํ๋ค.
์ฅ์
- ๋ธ์ ํ์ต์ํค๋ ๊ณผ์ ์ด ์๊ธฐ ๋๋ฌธ์, ์ค์๊ฐ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฅํ๊ฑฐ๋ ์์ธกํ๋ ๋ฐ์ ์ ํฉ
- ์ดํดํ๊ธฐ ์ฌ์ด ์๊ณ ๋ฆฌ์ฆ์ด๊ธฐ ๋๋ฌธ์, ๋น์ ๋ฌธ๊ฐ๋ ์ฝ๊ฒ ์ดํดํ ์ ์์
๋จ์
- ๋ฐ์ดํฐ ํฌ์ธํธ ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํ๊ธฐ ๋๋ฌธ์, ๋ฐ์ดํฐ์ ์ฐจ์์ด ๋์ด๋ ์๋ก ๊ณ์ฐ ๋น์ฉ์ด ์ฆ๊ฐํ๋ฉฐ, ์ด์์น(Outlier)์ ๋ฏผ๊ฐํด์ง
- ์ด์์ ์(K)๋ฅผ ์ด๋ป๊ฒ ์ค์ ํ๋๋์ ๋ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ ํฌ๊ฒ ๋ฌ๋ผ์ง ์ ์๊ธฐ ๋๋ฌธ์, ์ ์ ํ K๊ฐ์ ์ฐพ๋ ๊ฒ์ด ์ค์
- ์ด์์ ์ธ K๊ฐ์ ์ฐพ๋ ๋ฐฉ๋ฒ์ผ๋ก๋, ๊ต์ฐจ ๊ฒ์ฆ(Cross Validation)์ ํตํด K๊ฐ์ ๋ฐ๊พธ์ด๊ฐ๋ฉฐ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๋ ๊ฒ์ด ์์
Random Forest
๋๋ค ํฌ๋ ์คํธ๋ ์์ฌ ๊ฒฐ์ ๋๋ฌด(Decision Tree)๋ฅผ ์ฌ๋ฌ ๊ฐ ์ฐ๊ฒฐํ์ฌ ๋ง๋ ์์๋ธ(Ensemble) ๋ชจ๋ธ์ด๋ค. ๊ฐ๊ฐ์ ์์ฌ ๊ฒฐ์ ๋๋ฌด๋ค์ ๋๋คํ๊ฒ ์ ํ๋ ๋ณ์๋ค์ ๊ธฐ์ค์ผ๋ก ํ์ตํ๋ฉฐ, ์ด๋ ๊ฒ ๋ง๋ค์ด์ง ์ฌ๋ฌ ๊ฐ์ ์์ฌ ๊ฒฐ์ ๋๋ฌด๋ค์ ์กฐํฉํ์ฌ ์ต์ข ์์ธก ๋ชจ๋ธ์ ๋ง๋ ๋ค.
์ฅ์
- ๋์ ์์ธก ์ ํ๋ :
- ์ฌ๋ฌ ๊ฐ์ ์์ฌ ๊ฒฐ์ ๋๋ฌด๋ค์ ์กฐํฉํจ์ผ๋ก์จ, ๊ฐ๋ณ ์์ฌ ๊ฒฐ์ ๋๋ฌด์ ๋จ์ ์ ๋ณด์ํ๊ณ ์์ธก ์ ํ๋๋ฅผ ํฅ์์ํด
- ๊ณผ์ ํฉ ๋ฐฉ์ง :
- ๊ฐ๊ฐ์ ์์ฌ ๊ฒฐ์ ๋๋ฌด๋ค์ด ๋๋คํ๊ฒ ์ ํ๋ ๋ณ์๋ค์ ๊ธฐ์ค์ผ๋ก ํ์ตํ๊ธฐ ๋๋ฌธ์, ๊ณผ์ ํฉ(Overfitting)์ ๋ฐฉ์งํ ์ ์์
- ๋ณ์ ์ค์๋ ํ์ :
- ๋๋ค ํ์ต์ผ๋ก, ๊ฐ ๋ณ์๋ค์ ์ค์๋๋ฅผ ํ์ ํ ์ ์์
๋จ์
- ๋์ ๊ณ์ฐ ๋น์ฉ :
- ์ฌ๋ฌ ๊ฐ์ ์์ฌ ๊ฒฐ์ ๋๋ฌด๋ค์ ํ์ตํ๊ณ ์กฐํฉํ๊ธฐ ๋๋ฌธ์, ํ์ต ์๊ฐ๊ณผ ์์ธก ์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆด ์ ์์
- ํด์๋ ฅ ๋ฎ์ :
- ์ฌ๋ฌ ๊ฐ์ ์์ฌ ๊ฒฐ์ ๋๋ฌด๋ค์ ์กฐํฉํ์ฌ ๋ง๋ค๊ธฐ ๋๋ฌธ์, ์ต์ข ๋ชจ๋ธ์ ํด์๋ ฅ์ด ๋ฎ์ ์ ์์
๋๋ค ํฌ๋ ์คํธ๋ ๋ถ๋ฅ(Classification)์ ํ๊ท(Regression) ๋ฌธ์ ์ ๋ชจ๋ ์ ์ฉ๋ ์ ์์ผ๋ฉฐ, ๋ค์ํ ๋ถ์ผ์์ ์ฌ์ฉ๋๊ณ ์๋ค.
'๐ก WIDA > DACON ๋ถ๋ฅ-ํ๊ท' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[DACON/๊น๊ท๋ฆฌ] ๋ถ๋ฅ ๋ชจ๋ธ ์์๋ณด๊ธฐ (1) | 2023.03.24 |
---|---|
[DACON/์กฐ์์] ๋ถ๋ฅ ๋ชจ๋ธ ์์๋ณด๊ธฐ (0) | 2023.03.24 |
[DACON/๊น์ธ์ฐ] ๋ถ๋ฅ ๋ชจ๋ธ ์์๋ณด๊ธฐ (0) | 2023.03.23 |
[DACON/๊น๊ฒฝ์] ๋ถ๋ฅ ๋ชจ๋ธ ์์๋ณด๊ธฐ (0) | 2023.03.23 |
[DACON/๊น๋ฏผํ] ๋ถ๋ฅ ๋ชจ๋ธ ์์๋ณด๊ธฐ (1) | 2023.03.22 |