๐ ์ ์ถ ๋ฐฉ์
ipynb ํ์ผ์ ๋ฉ์ผ๋ก ์ ์ถ (dsob2021swu@gmail.com)
๐ ์ ์ถ ์์
[์ด๋ฆ] 4์ฐจ์ ๋ณต์ต๊ณผ์
[์ด๋ฆ] 4์ฐจ์ ๋ณต์ต๊ณผ์ .ipynb
๐ ๊ณผ์ ํ์ด ๋ฐฉ์
์ฃผํผํฐ ๋ ธํธ๋ถ ํน์ ์ฝ๋ฉ์ ์ด์ฉํ์ฌ ์๋์ ๋ฌธ์ ๋ค์ ํ๋ํ๋ ํ์ด๋ณธ๋ค.
์ฝ๋๋ฅผ ์์ฑํ๊ณ ์ฃผ์์ ์ถฉ๋ถํ ๋ฌ์์ฃผ์ด์ผ ํ๋ฉฐ, markdown๋ ์ด์ฉํ์ฌ ๋ณธ์ธ์ ์๊ฐ์ ์ ํํํ ์ ์๋๋ก ํ๋ค.
๐ ๊ณผ์ ๋ด์ฉ
์๋์ ๋งํฌ๋ sklearn์์ ์ ๊ณตํ๊ณ ์๋ ๋ฐ์ดํฐ์ ์ ๋๋ค.
https://scikit-learn.org/stable/datasets/toy_dataset.html
7.1. Toy datasets
scikit-learn comes with a few small standard datasets that do not require to download any file from some external website. They can be loaded using the following functions: These datasets are usefu...
scikit-learn.org
1. ์์ ๋ฐ์ดํฐ์ ์ค ๋ง์๋๋ ๊ฒ์ ๊ณจ๋ผ ๋ถ๋ฌ์ต๋๋ค.
2. ํด๋น ๋ฐ์ดํฐ์ ์ supervised, unsupervised, reinforcement learning ์ค ์ด๋ค ํ์ต์ ์ ์ฉ ๊ฐ๋ฅํ ๋ฐ์ดํฐ์ธ์ง ์์๋ด ์๋ค.
3. ์ด๋ค ํ์ต์ ์ ์ฉ์ด ๊ฐ๋ฅํ์ง ์์๋ณด์๋์? ๊ทธ๋ ๋ค๋ฉด class(target = label)์ features๋ฅผ ํ์ธํด๋ด ์๋ค.
์ฐ์ํ(continuous)์ธ๊ฐ์? ์ด์ฐํ(discrete)์ธ๊ฐ์?
4. ๊ทธ๋ฆฌ๊ณ ์ด ๋ฐ์ดํฐ๋ ์ด๋ค ๋ชจ๋ธ์ ์ ์ฉํ ์ ์๋์ง ์์๋ด ์๋ค.
e.g. clustering, regression, classification ...๋ฑ๋ฑ
5. ๋ถ๋ฌ์จ ๋ฐ์ดํฐ์ class(target = label)๋ฅผ ํ์ธํด๋ด ์๋ค.
binary class ์ธ๊ฐ์? multi class ์ธ๊ฐ์? ์ฐ์ํ์ด๋ผ binary๋ multi class๋ผ๊ณ ๋งํ ์ ์๋์?
6. ํด๋น ๋ฐ์ดํฐ๋ฅผ ํ์ต์ํฌ ๊ตฌ์ฒด์ ์ธ ๋ชจ๋ธ์ ๋ถ๋ฌ์๋ด ์๋ค. ์๋ฌด๊ฑฐ๋ ๊ด์ฐฎ์ต๋๋ค. ๋ค๋ง 3, 4๋ฒ์ ๋ต๊ณผ ๊ด๋ จ์๋ ๋ชจ๋ธ์ ๋ถ๋ฌ์ค์ธ์.
e.g. Unsupervised learning์์ ์ฌ์ฉํ ์ ์๋ ๋ฐ์ดํฐ์ด๋ Unsupervised learning ๋ชจ๋ธ๋ค ์ค K-means clustering ๋ชจ๋ธ์ ์ฌ์ฉํด์ผ๊ฒ ๊ตฐ!
7. ๋ชจ๋ธ์ ๋ถ๋ฌ์ ํ์ต์์ผ๋ณด์๋์? ์ฌ์ค ์ด๊ฒ ์ค์ํ ๊ฒ์ด ์๋๋๋ค. ๋ถ๋ฌ์จ ๋ชจ๋ธ๊ณผ ๊ด๋ จ์๋ ํ๊ฐ๋ฐฉ์๋ค์ ์ด์ฉํด ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํด๋ณด์ธ์.
8. ๊ฒฐ๊ณผ๊ฐ์ด ์ด๋ค๊ฐ์? ํด์ํด๋ด ์๋ค.
'๐ ์คํฐ๋ > [์ฌ๋ฆ๋ฐฉํ] ์คํฐ๋ ๊ณผ์ ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[์ฌ๋ฆ๋ฐฉํ] 6์ฐจ์ ๋จธ์ ๋ฌ๋ ๋ณต์ต๊ณผ์ (0) | 2023.09.01 |
---|---|
[์ฌ๋ฆ๋ฐฉํ] 6์ฐจ์ ๋จธ์ ๋ฌ๋ ์์ต๊ณผ์ (0) | 2023.08.19 |
[์ฌ๋ฆ๋ฐฉํ] 4์ฐจ์ ๋จธ์ ๋ฌ๋ ์์ต๊ณผ์ (0) | 2023.08.06 |
[3์กฐ] 3์ฐจ์ EDA ๋ฐํ (0) | 2023.07.20 |
[5์กฐ] 3์ฐจ์ EDA ๋ฐํ (0) | 2023.07.20 |