์ฌ๋ก ๋์งํธ ์ฒ์ฒด ๊ด์ธก(Sloan Digital Sky Survey:SDSS)
๋ชฉํ : train data๋ก ํ์ต์ ํ๊ณ test data์ ์ฒ์ฒด์ type์ ์์๋ด๋ ๊ฒ
[type]
= Source type : ์ฒ์ฒด์ ๋ถ๋ฅ
QSO : ํ์ด์ฌ
- ํ๋์ํํต(Active Galactic Nucleus, AGN)์ ๊ฐ๋ ๋งค์ฐ ๋ฉ๊ณ ๋ฐ์ ์ํ
- ๊ฐ์ฅ ๋ฐ์ ์ฒ์ฒด ์ค์ ํ๋
- ๋์ ์ ํญ์ ๋ฐฉ์ถ์ ์ ๊ฐ์ง๋ฉฐ, ๊ฐ์๊ด์ ๊ณผ ์์ค์ (X-ray) ์์ญ๋์์ ๊ฐํ ๋ฐฉ์ถ์ ์ ๊ฐ์ง
- ์ ์ํธ์ด ๊ฐ์ ๋งค์ฐ ํผ
(https://terms.naver.com/entry.naver?docId=5741238&cid=60217&categoryId=60217)
STAR_RED_DWARF : ์ ์์์ฑ
STAR_WHITE_DWARF : ๋ฐฑ์์์ฑ
STAR_BROWN_DWARF : ๊ฐ์์์ฑ
- ๊ฐ์ฅ ๊ฐ๋ฒผ์ด ํญ์ฑ(์ด๋ฅผํ ๋ฉด M9V์ธ ์ ์์์ฑ)๊ณผ ๊ฐ์ฅ ๋ฌด๊ฑฐ์ด ๊ธฐ์ฒด ํ์ฑ(๋ชฉ์ฑ ์ง๋์ ์ฝ 13๋ฐฐ ์ ๋๋๋ ๊ฑฐ๋ ๋ชฉ์ฑํ ํ์ฑ)์ฌ์ด์ ์ง๋์ ๊ฐ์ง ์คํญ์ฑ์ฒ์ฒด(substellar object)
(https://terms.naver.com/entry.naver?docId=5753054&cid=62801&categoryId=62801)
STAR_SUB_DWARF : ์์์ํ
- ์ง๋์ด ๋ณดํต์ํ์ 1/100๋ฐฐ์์ 1/1000๋ฐฐ์ ๋ถ๊ณผํ ์์ ์ํ
(https://m.terms.naver.com/entry.naver?docId=3557852&cid=40942&categoryId=32290)
STAR_BHB : ์ํ๊ฑฐ์ด์ฑ
STAR_CATY_VAR : ๊ฒฉ๋ณ๋ณ๊ด์ฑ
- ์์ฑ๊ณ ํ์ชฝ์ ๋ณ์ด ๋ฐฑ์์์ฑ์ด๋ ์ค์ฑ์๋ณใ๋ธ๋ํ์ด ๋์ด ์์ผ๋ฉฐ, ๋ค๋ฅธ ์ชฝ์ ์ ์๊ฑฐ์ฑ์ ๋๊ธฐ๊ฐ ์ ์ ๋์์ ๋ ๊ธ๊ฒฉํ ์ฆ๊ด์ ๋ณด์ด๋ ์ฒ์ฒด
(https://terms.naver.com/entry.naver?docId=1621093&cid=50316&categoryId=50316)
SERENDIP_RED, SERENDIP_BLUE, SERENDIP_DISTANT : ํญ์ฑ ๊ตฌ์ญ ์ธ๋ถ์ ๋์ธ ์ฒ์ฒด
- ํญ์ฑ์ ์ฐ๋ฆฌ๊ฐ ํํ ์๊ณ ์๋ ๋ณ์ ๋ค๋ฅธ ์ด๋ฆ
(https://astro.kasi.re.kr/learning/pageView/6372)
SERENDIPITY_FIRST : ์ฒซ ๋ฒ์งธ ๊ด์ธก์์ ํ์ด์ฌ๋ก ๋ถ๋ฅ๋์์ง๋ง, ์ด์ด์ง ๊ด์ธก์์๋ ๋ ํ๋ฆฟํ ์ฒ์ฒด
SERENDIPITY_MANUAL : ์๋์ผ๋ก ๊ด์ธก๋ ์ฒ์ฒด
SKY : ๋น ํ๋
ROSAT_D : X-์ ํ์ฅ๋์์ ๊ด์ธกํ ์ฒ์ฒด์ด์ง๋ง, SDSS ๋ง์๊ฒฝ์์๋ ๊ด์ธก๋๋ ์ฒ์ฒด
GALAXY : ์ํ
STAR_CARBON : ํ์๋ณ
- ๋๊ธฐ์ ์ฐ์๋ณด๋ค ํ์๋ฅผ ๋ ๋ง์ด ๊ฐ์ง๊ณ ์๋ ๋ณ
SERENDIPITY_RED : ?
SPECTROPHOTO_STD : ?
REDDEN_STD : ?
ROSAT_D : ?
[๋น์ ๋ฐ๊ธฐ]
u : Ultraviolet (์์ธ์ )
g : Green
r : Red
i : Near Infrared (๊ทผ์ ์ธ์ : ์ ์ธ์ ์ค ํ์ฅ์ด ๊ฐ์ฅ ์งง์ ๊ฒ)
z : Infrared
fiberID : ์ฒ์ฒด๋ฅผ ๊ด์ธกํ ๋ ์ฌ์ฉ๋ ๊ด์ฌ์ ์๋ณ๋ฒํธ
- ๊ด์ฌ์ ๋ ์ ๋ฐ์ฌ๋ฅผ ํตํด ๋น์ ์์ค ์์ด ์ ๋ฌ์ํค๋ ์ฌ์
- ๊ตฌ๋ฆฌ์ ์ ๋นํด ํจ์ฌ ๋ง์ ์์ ๋ฐ์ดํฐ๋ฅผ ๋ฉ๋ฆฌ๊น์ง ์ ๋ฌ ๊ฐ๋ฅ
- ๊ด์ฌ์ ์ ์ ๋ฆฌ ์ฌ์ ๊ฐ ์ฐ์ด๋ ์ด์ ๋ ๋ฐ์ดํฐ ์์ค์ด ์ ๊ณ ์ ์๊ธฐ์ ์ธ ๊ฐ์ญ๋ ํจ์ฌ ์ ๊ณ ๊ณ ์จ์ด ์ ๋ฒํฐ๊ธฐ ๋๋ฌธ
(https://terms.naver.com/entry.naver?docId=5741207&cid=60217&categoryId=60217)
psfMag : Point spread function magnitudes
- ๋จผ ์ฒ์ฒด๋ฅผ ํ ์ ์ผ๋ก ๊ฐ์ ํ์ฌ ์ธก์ ํ ๋น์ ๋ฐ๊ธฐ
fiberMag : Fiber magnitudes
- ์ฒ์ฒด๋ฅผ 3์ธ์น ๊ด์ฌ์ ๋ก ๊ด์ธกํ ๋ ์ธก์ ๋ ๊ด๋
- ๊ด์ฌ์ ๋ฅผ ํต๊ณผํ๋ ๋น์ ๋ฐ๊ธฐ
petroMag : Petrosian Magnitudes
- ์ฒ์ฒด์ ์์น์ ๊ฑฐ๋ฆฌ์ ์๊ด์์ด ๋น์ ๋ฐ๊ธฐ๋ฅผ ๋น๊ตํ๊ธฐ ์ํ ์์น
modelMag : Model magnitudes
- ์ฒ์ฒด ์ค์ฌ์ผ๋ก๋ถํฐ ํน์ ๊ฑฐ๋ฆฌ์ ๋ฐ๊ธฐ
(https://moondol-ai.tistory.com/m/59)
Regression๊ณผ Classification
Regression๊ณผ Classification์ ๋จธ์ ๋ฌ๋์์ ๋งค์ฐ ์ค์ํ ๋ฌธ์ ์ ํ์ผ๋ก, ๋ฐ์ดํฐ ๋ถ์์์ ๊ฐ์ฅ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋จ
์ด ๋ ์ ํ์ ๋ชจ๋ ์ง๋ํ์ต(Supervised Learning)์ ์ผ๋ถ
์ง๋ํ์ต์ ์ ๋ ฅ ๋ฐ์ดํฐ์ ์ ๋ต(label)์ด ์กด์ฌํ๋ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ์ฌ ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ฐฉ๋ฒ์ผ๋ก, ํ์ต๋ ๋ชจ๋ธ์ ์๋ก์ด ์ ๋ ฅ๊ฐ์ ๋ํด ์ ํํ ์์ธก์ ์ํํจ
- Regression
์ฐ์์ ์ธ ๊ฐ์ ์์ธกํ๋ ๋ฌธ์
์ ๋ ฅ ๋ณ์์ ์ถ๋ ฅ ๋ณ์ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ์ฐพ์๋ด๋ ๊ฒ
์ ๋ ฅ ๋ณ์ = ๋ ๋ฆฝ ๋ณ์, ์ถ๋ ฅ ๋ณ์ = ์ข ์ ๋ณ์
์ฃผ๋ก Linear Regression, Polynomial Regression, Support Vector Regression ๋ฑ์ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉ
์ด ์๊ณ ๋ฆฌ์ฆ๋ค์ ์ ๋ ฅ ๋ณ์์ ์ถ๋ ฅ ๋ณ์ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ๋ชจ๋ธ๋งํ์ฌ, ์๋ก์ด ์ ๋ ฅ ๊ฐ์ ๋ํ ์ถ๋ ฅ ๊ฐ์ ์์ธกํ๋ ๋ฐ ์ฌ์ฉ
ex) ์ํํธ์ ๊ฐ๊ฒฉ์ ์์ธก - ์ํํธ์ ๋ฉด์ , ์์น, ์ธต์ ๋ฑ์ ๋ ๋ฆฝ ๋ณ์๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์ ์ํํธ์ ๊ฐ๊ฒฉ์ ์์ธก
- Classification
์ ๋ ฅ ๊ฐ์ ๋ช ๊ฐ์ง์ ๋ฒ์ฃผ๋ก ๋ถ๋ฅํ๋ ๋ฌธ์
์ถ๋ ฅ ๊ฐ์ ํด๋์ค(class) ๋๋ ๋ ์ด๋ธ(label)์ด๋ผ๊ณ ํจ
์ฃผ๋ก Logistic Regression, Decision Tree, Random Forest, Naive Bayes, Support Vector Machine ๋ฑ์ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉ
์ด ์๊ณ ๋ฆฌ์ฆ๋ค์ ์ฃผ์ด์ง ์ ๋ ฅ ๋ฐ์ดํฐ์ ํด๋์ค ์ฌ์ด์ ๊ด๊ณ๋ฅผ ํ์ตํ์ฌ, ์๋ก์ด ์ ๋ ฅ ๊ฐ์ ๋ํ ํด๋์ค๋ฅผ ์์ธกํ๋ ๋ฐ ์ฌ์ฉ
ex) ์ด๋ฉ์ผ์ด ์คํธ ๋ฉ์ผ์ธ์ง ์๋์ง๋ฅผ ์์ธก - ์ด๋ฉ์ผ์ ์ ๋ชฉ, ๋ณธ๋ฌธ ๋ฑ์ ์ ๋ ฅ ๋ณ์๋ฅผ ์ฌ์ฉํ์ฌ ์ด๋ฉ์ผ์ ์คํธ ๋ฉ์ผ์ธ์ง ์๋์ง๋ก ๋ถ๋ฅ
Regression๊ณผ Classification์ ๋จธ์ ๋ฌ๋์์ ๊ฐ์ฅ ์ค์ํ ๋ฌธ์ ์ ํ์ผ๋ก, ๋ฐ์ดํฐ ๋ถ์์์ ๋ค์ํ ๋ถ์ผ์์ ์ฌ์ฉ๋จ
์ด ๋ ๋ฌธ์ ์ ํ์ ๋ํ ์ดํด๋ ๋จธ์ ๋ฌ๋์ ๊ธฐ์ด๋ฅผ ์ดํดํ๋ ๋ฐ ๋งค์ฐ ์ค์