์๊ฐ ๋ฐ์ด์ฝ ์ฒ์ฒด ์ ํ ๋ถ๋ฅ ๋ํ๋ฅผ ์ํ ์ง์ ์๊ธฐ
1. ๋ฐ์ดํฐ ์ดํด๋ณด๊ธฐ
train.csv ๊ธฐ์ค
- ์ปฌ๋ผ ์ข
๋ฅ
- id
- type
- fiberID
- psfMag
- psfMag_u
- psfMag_g
- psfMag_r
- psfMag_i
- psfMag_z
- fiberMag
- fiberMag_u
- fiberMag_g
- fiberMag_r
- fiberMag_i
- fiberMag_z
- petroMag
- petroMag_u
- petroMag_g
- petroMag_r
- petroMag_i
- petroMag_z
- modelMag
- modelMag_u
- modelMag_g
- modelMag_r
- modelMag_i
- modelMag_z
- ์ปฌ๋ผ ์ค๋ช
(์ถ์ฒ: http://classic.sdss.org/dr7/algorithms/photometry.html, https://brunch.co.kr/@tobesoft-ai/14,https://dacon.io/competitions/official/235573/talkboard/400354?page=3&dtype=recent)
- type
- ํญ์ฑ ์ข ๋ฅ๋ค๋ก ์ด 19๊ฐ์ง์ ๊ฐ์ด ์กด์ฌ
- ํ์ฅ๋(****_u,g,r,i,z)
- ์ข
๋ฅ
- u : Ultraviolet
- g : Green
- r : Red
- i : Near infrared(๊ทผ์ ์ธ์ )
- z : Infrared(์ ์ธ์ )
- ์ ์ธ์ : ๋น์ ์คํํธ๋ผ์์ ์ ์ ๋ฐ๊นฅ์ชฝ์ ์ ์ธ์
- ๊ทผ์ ์ธ์ : ์ ์ธ์ ์ ๊ฐ์๊ด์ ๋ณด๋ค ํ์ฅ์ด ๊ธด๋ฐ, ๊ทธ ์ค์์ ํ์ฅ์ด ๊ฐ์ฅ ์งง์ 0.75~3ใ์ธ ๊ฒ์ ๊ทผ์ ์ธ์ ์ด๋ผ ํ๋ค.(https://terms.naver.com/entry.naver?docId=1069620&cid=40942&categoryId=32298)
- ์ข
๋ฅ
- ***Mag
- mag๊ฐ magnitudes ๊ท๋ชจ(์ค์๋)๋ฅผ ์๋ฏธํ๋ฉฐ ์์ ์ค๋ psd, petro, model, fiber์ ๊ท๋ชจ ์ธก์ ๋ฐฉ๋ฒ์ ์ข ๋ฅ๋ค์ ๋ปํ๋ ๊ฒ์ผ๋ก ์ถ์ ๋จ
- ๊ทธ๋ฐ๋ฐ ๊ท๋ชจ๊ฐ ์๋ ๊ด๋๋ก ๋ณด๋ ๊ฒ์ด ๋ง์ง ์๋ ์ถ์ง๋ง ์ฐธ๊ณ ํ ์ฌ์ดํธ์์ ๊ท๋ชจ๋ผ๊ณ ํ์๊ธฐ์..
- psfMag
- psf์ ํ๋ค์์ Point Spread Function
- point spread function์ด๋ ์ด๋ฏธ์ง ๊ธฐ๋ฒ์ ์ฌ์ฉํ๋ ๋ฏํจ
- ๊ด์ฌ์ ํต๊ณผํ๋ ๋น์ ๋ฐ๊ธฐ
- petroMag
- ์ฒ์ฒด ์ค์ฌ์ผ๋ก๋ถํฐ ํน์ ๊ฑฐ๋ฆฌ์ ๋ฐ๊ธฐ
- modelMag
- ๊ด์ธก์ ์ฌ์ฉ๋ ๊ด์ฌ์ ์ ๊ตฌ๋ถ์
- fiberMag
- ์ฒ์ฒด๋ฅผ 3์ธ์น ๊ด์ฌ์ ๋ก ๊ด์ธกํ ๋ ์ธก์ ๋ ๊ด๋
- type
2. Classification & Regression
๋จธ์ ๋ฌ๋์ ์ข ๋ฅ๋ ํฌ๊ฒ 3๊ฐ์ง
- Supervised Learning(์ง๋ํ์ต) : Classification (๋ถ๋ฅ), Regression (ํ๊ท)
- Unsupervised Learning(๋น์ง๋ํ์ต):Clustering (๊ตฐ์งํ), Dimension Reduction (์ฐจ์ ์ถ์), Underlying Probability, Density Estimation (๋ถํฌ ์ถ์ )
- Reinforcement Learning(๊ฐํํ์ต) : ์์ฌ๊ฒฐ์ ํ๋ก์ธ์ค
๊ทธ์ค ์ฐ๋ฆฌ๊ฐ ๋ค๋ฃฐ Classification ๊ณผ Regression์ ๋ํด ์์ธํ ์์๋ณด์
๋๊ฐ์ง ๋ชจ๋ Supervised Learning(์ง๋ํ์ต)์ ์ํจ
- ์ง๋ํ์ต? ์ ๋ ฅ๊ฐ๊ณผ ์ถ๋ ฅ๊ฐ ๋ชจ๋ ์ ๊ณตํด์ค์ผ ํจ, ์ฌ๋์ด ์ง์ ๊ฐ ๋ฐ์ดํฐ ์ถ๋ ฅ๊ฐ์ ๋ผ๋ฒจ๋งํด์ผ ํจ
classification
- ๋ฐ์ดํฐ๊ฐ ์ด๋ ์ข ๋ฅ์ ์ํ๋์ง ํ๋ณํ๋ ๋ฐฉ๋ฒ
- ์ฃผ๋ก Categorical Data(๋ฒ์ฃผํ ๋ฐ์ดํฐ)์ ์ ์ฉ
- ์ ํ ๋ชจ๋ธ์ ์ํ๋๋ฐ ์ ์ฆ, ๊ฒฐ์ ๊ฒฝ๊ณ๋ฅผ ํ์ฉํ์ฌ ๋ฐ์ดํฐ๋ค์ ๋ถ๋ฅ
- yes/ no์ ๊ฐ์ด ๊ฒฐ๊ณผ๊ฐ์ด ์ด์ฐ์
- ์ฃผ๋ก ์ฐ์ด๋ ์ฌ๋ก
- ์ปจํ ์ธ ์ถ์ฒ
- ์คํธ๋ฉ์ผ ๋ถ๋ฅ
- ์ด๋ฏธ์ง·์ผ๊ตด·๊ธ์·์์ฑ ์ธ์
- ์ง๋ณ ์ง๋จ
- ์ ์ ์ ๋ฐ์ดํฐ ์ธ์
- ์ฌ์ ์ํ ํ์ ๊ณผ ๊ด๋ฆฌ
- ์ฃผ๊ฐ ์์ธก
regression
- ๋ ๋ฆฝ๋ณ์์ ์ข ์๋ณ์ ๊ฐ ์ฐ๊ด์ฑ์ ๋ถ์ํ๋ ๋ฐฉ๋ฒ
- ์ฃผ๋ก Continuous Data(์ฐ์์ ๋ฐ์ดํฐ)์ ์ ์ฉ
- ์ด ๋ํ ์ ํ ๋ชจ๋ธ์ ์ํจ
- Continuous Number Variable(์ฐ์์ ์ธ ์ซ์ ๋ณ์)๋ค ๊ฐ์ ์๊ด๊ด๊ณ๋ฅผ ํ์ ํ๋ ๊ณผ์
- ์ฃผ๋ก ์ฐ์ด๋ ์ฌ๋ก
- ๊ณผ๊ฑฐ ์จ๋ ๋ฐ์ดํฐ๋ค์ ํตํด ๋ด์ผ ์จ๋๋ฅผ ์์ธก
- ์ฃผ์์์ธ ์ ๋ณด๋ฅผ ํตํด ๋ฏธ๋ ์ฃผ์ ๊ฐ๊ฒฉ์ ์์ธก
- ์ ๋์ธ๊ตฌ, ๋ ์จ, ๊ฐ๊ฒฉ์ ๋ณด๋ฅผ ์ด์ฉํด ์์์ ์ ์์ ๋งค์ถ์ ์์ธก
- ๊ตฌ๋งค์์ ๋์ด, ์ฐ ์๋์ ์ด์ฉํด ํน์ ์ ํ์ ์์ ํ๋งค๋์ ์์ธก
๋จธ์ ๋ฌ๋ ํํธ ์ฐธ๊ณ ์ฌ์ดํธ
https://dad-rock.tistory.com/702
[Machine Learning] Machine Learning Overview | ๋จธ์ ๋ฌ๋ ๊ฐ์
Machine Learning Overview ๋จธ์ ๋ฌ๋ ๊ฐ์ - ์ธ๊ณต์ง๋ฅ์ ํ ๋ถ์ผ๋ก, ์ธ๊ณต์ง๋ฅ์ ํจํด์ธ์๊ณผ ๊ณ์ฐ ํ์ต ์ด๋ก ์์ ๋ฐ์ ํ ์ปดํจํฐ๊ณผํ์ ํ ๋ถ์ผ์ด๋ค. - ๋จธ์ ๋ฌ๋์์๋ ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ตํ๊ณ ์
dad-rock.tistory.com