๐Ÿ’ก WIDA/DACON ๋ถ„๋ฅ˜-ํšŒ๊ท€

[DACON/๊น€๊ทœ๋ฆฌ] ์ฒœ์ฒด ์œ ํ˜• ๋ถ„๋ฅ˜ ๋Œ€ํšŒ๋ฅผ ์œ„ํ•œ ๋„๋ฉ”์ธ ์ง€์‹ ์•Œ์•„๋ณด๊ธฐ

kyuree 2023. 3. 17. 00:23

์›”๊ฐ„ ๋ฐ์ด์ฝ˜ ์ฒœ์ฒด ์œ ํ˜• ๋ถ„๋ฅ˜ ๋Œ€ํšŒ๋ฅผ ์œ„ํ•œ ์ง€์‹ ์Œ“๊ธฐ

 

 

1. ๋ฐ์ดํ„ฐ ์‚ดํŽด๋ณด๊ธฐ

train.csv ๊ธฐ์ค€

  • ์ปฌ๋Ÿผ ์ข…๋ฅ˜ 
    • id 
    • type 
    • fiberID
    • psfMag 
      • psfMag_u
      • psfMag_g
      • psfMag_r
      • psfMag_i
      • psfMag_z
    • fiberMag 
      • fiberMag_u
      • fiberMag_g
      • fiberMag_r
      • fiberMag_i
      • fiberMag_z
    • petroMag
      • petroMag_u
      • petroMag_g
      • petroMag_r
      • petroMag_i
      • petroMag_z
    • modelMag
      • modelMag_u
      • modelMag_g
      • modelMag_r
      • modelMag_i
      • modelMag_z
  •  ์ปฌ๋Ÿผ ์„ค๋ช…(์ถœ์ฒ˜: http://classic.sdss.org/dr7/algorithms/photometry.html, https://brunch.co.kr/@tobesoft-ai/14,https://dacon.io/competitions/official/235573/talkboard/400354?page=3&dtype=recent)
    • type
      • ํ•ญ์„ฑ ์ข…๋ฅ˜๋“ค๋กœ ์ด 19๊ฐ€์ง€์˜ ๊ฐ’์ด ์กด์žฌ
    •  ํŒŒ์žฅ๋Œ€(****_u,g,r,i,z)
      • ์ข…๋ฅ˜
        • u : Ultraviolet
        • g : Green
        • r : Red
        • i : Near infrared(๊ทผ์ ์™ธ์„ )
        • z : Infrared(์ ์™ธ์„ )
          • ์ ์™ธ์„ : ๋น›์˜ ์ŠคํŽ™ํŠธ๋Ÿผ์—์„œ ์ ์ƒ‰ ๋ฐ”๊นฅ์ชฝ์„ ์ ์™ธ์„ 
          • ๊ทผ์ ์™ธ์„ : ์ ์™ธ์„ ์€ ๊ฐ€์‹œ๊ด‘์„ ๋ณด๋‹ค ํŒŒ์žฅ์ด ๊ธด๋ฐ, ๊ทธ ์ค‘์—์„œ ํŒŒ์žฅ์ด ๊ฐ€์žฅ ์งง์€ 0.75~3ใŽ›์ธ ๊ฒƒ์„ ๊ทผ์ ์™ธ์„ ์ด๋ผ ํ•œ๋‹ค.(https://terms.naver.com/entry.naver?docId=1069620&cid=40942&categoryId=32298)
    • ***Mag
      • mag๊ฐ€ magnitudes ๊ทœ๋ชจ(์ค‘์š”๋„)๋ฅผ ์˜๋ฏธํ•˜๋ฉฐ ์•ž์— ์˜ค๋Š” psd, petro, model, fiber์€ ๊ทœ๋ชจ ์ธก์ • ๋ฐฉ๋ฒ•์˜ ์ข…๋ฅ˜๋“ค์„ ๋œปํ•˜๋Š” ๊ฒƒ์œผ๋กœ ์ถ”์ •๋จ
      • ๊ทธ๋Ÿฐ๋ฐ ๊ทœ๋ชจ๊ฐ€ ์•„๋‹Œ ๊ด‘๋„๋กœ ๋ณด๋Š” ๊ฒƒ์ด ๋งž์ง€ ์•Š๋‚˜ ์‹ถ์ง€๋งŒ ์ฐธ๊ณ ํ•œ ์‚ฌ์ดํŠธ์—์„œ ๊ทœ๋ชจ๋ผ๊ณ  ํ•˜์˜€๊ธฐ์—..
    •  psfMag
      • psf์˜ ํ’€๋„ค์ž„์€ Point Spread Function
      • point spread function์ด๋ž€ ์ด๋ฏธ์ง• ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜๋Š” ๋“ฏํ•จ
      • ๊ด‘์„ฌ์œ  ํ†ต๊ณผํ•˜๋Š” ๋น›์˜ ๋ฐ๊ธฐ
    • petroMag
      • ์ฒœ์ฒด ์ค‘์‹ฌ์œผ๋กœ๋ถ€ํ„ฐ ํŠน์ • ๊ฑฐ๋ฆฌ์˜ ๋ฐ๊ธฐ
    • modelMag
      • ๊ด€์ธก์— ์‚ฌ์šฉ๋œ ๊ด‘์„ฌ์œ ์˜ ๊ตฌ๋ถ„์ž
    •  fiberMag
      • ์ฒœ์ฒด๋ฅผ 3์ธ์น˜ ๊ด‘์„ฌ์œ ๋กœ ๊ด€์ธกํ•  ๋•Œ ์ธก์ •๋  ๊ด‘๋„

 

 

 

2. Classification & Regression 

๋จธ์‹ ๋Ÿฌ๋‹์˜ ์ข…๋ฅ˜๋Š” ํฌ๊ฒŒ 3๊ฐ€์ง€

- Supervised Learning(์ง€๋„ํ•™์Šต) :  Classification (๋ถ„๋ฅ˜), Regression (ํšŒ๊ท€)

- Unsupervised Learning(๋น„์ง€๋„ํ•™์Šต):Clustering (๊ตฐ์ง‘ํ™”)Dimension Reduction (์ฐจ์› ์ถ•์†Œ)Underlying Probability, Density Estimation (๋ถ„ํฌ ์ถ”์ •)

- Reinforcement Learning(๊ฐ•ํ™”ํ•™์Šต) : ์˜์‚ฌ๊ฒฐ์ • ํ”„๋กœ์„ธ์Šค

 

 

๊ทธ์ค‘ ์šฐ๋ฆฌ๊ฐ€ ๋‹ค๋ฃฐ Classification ๊ณผ Regression์— ๋Œ€ํ•ด ์ž์„ธํžˆ ์•Œ์•„๋ณด์ž

๋‘๊ฐ€์ง€ ๋ชจ๋‘ Supervised Learning(์ง€๋„ํ•™์Šต)์— ์†ํ•จ

  • ์ง€๋„ํ•™์Šต? ์ž…๋ ฅ๊ฐ’๊ณผ ์ถœ๋ ฅ๊ฐ’ ๋ชจ๋‘ ์ œ๊ณตํ•ด์ค˜์•ผ ํ•จ, ์‚ฌ๋žŒ์ด ์ง์ ‘ ๊ฐ ๋ฐ์ดํ„ฐ ์ถœ๋ ฅ๊ฐ’์— ๋ผ๋ฒจ๋งํ•ด์•ผ ํ•จ

 

classification

  • ๋ฐ์ดํ„ฐ๊ฐ€ ์–ด๋Š ์ข…๋ฅ˜์— ์†ํ•˜๋Š”์ง€ ํŒ๋ณ„ํ•˜๋Š” ๋ฐฉ๋ฒ•
  • ์ฃผ๋กœ Categorical Data(๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ)์— ์ ์šฉ
  • ์„ ํ˜• ๋ชจ๋ธ์— ์†ํ•˜๋Š”๋ฐ ์„  ์ฆ‰, ๊ฒฐ์ •๊ฒฝ๊ณ„๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋“ค์„ ๋ถ„๋ฅ˜
  • yes/ no์™€ ๊ฐ™์ด ๊ฒฐ๊ณผ๊ฐ’์ด ์ด์‚ฐ์ 
  • ์ฃผ๋กœ ์“ฐ์ด๋Š” ์‚ฌ๋ก€
    • ์ปจํ…์ธ  ์ถ”์ฒœ
    • ์ŠคํŒธ๋ฉ”์ผ ๋ถ„๋ฅ˜
    • ์ด๋ฏธ์ง€·์–ผ๊ตด·๊ธ€์ž·์Œ์„ฑ ์ธ์‹
    • ์งˆ๋ณ‘ ์ง„๋‹จ
    • ์œ ์ „์ž ๋ฐ์ดํ„ฐ ์ธ์‹
    • ์žฌ์ • ์œ„ํ—˜ ํŒŒ์•…๊ณผ ๊ด€๋ฆฌ
    • ์ฃผ๊ฐ€ ์˜ˆ์ธก

regression

  • ๋…๋ฆฝ๋ณ€์ˆ˜์™€ ์ข…์†๋ณ€์ˆ˜ ๊ฐ„ ์—ฐ๊ด€์„ฑ์„ ๋ถ„์„ํ•˜๋Š” ๋ฐฉ๋ฒ•
  • ์ฃผ๋กœ Continuous Data(์—ฐ์†์  ๋ฐ์ดํ„ฐ)์— ์ ์šฉ
  • ์ด ๋˜ํ•œ ์„ ํ˜• ๋ชจ๋ธ์— ์†ํ•จ
  • Continuous Number Variable(์—ฐ์†์ ์ธ ์ˆซ์ž ๋ณ€์ˆ˜)๋“ค ๊ฐ„์˜ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ํŒŒ์•…ํ•˜๋Š” ๊ณผ์ •
  • ์ฃผ๋กœ ์“ฐ์ด๋Š” ์‚ฌ๋ก€
    1. ๊ณผ๊ฑฐ ์˜จ๋„ ๋ฐ์ดํ„ฐ๋“ค์„ ํ†ตํ•ด ๋‚ด์ผ ์˜จ๋„๋ฅผ ์˜ˆ์ธก
    2. ์ฃผ์‹์‹œ์„ธ ์ •๋ณด๋ฅผ ํ†ตํ•ด ๋ฏธ๋ž˜ ์ฃผ์‹ ๊ฐ€๊ฒฉ์„ ์˜ˆ์ธก
    3. ์œ ๋™์ธ๊ตฌ, ๋‚ ์”จ, ๊ฐ€๊ฒฉ์ •๋ณด๋ฅผ ์ด์šฉํ•ด ์Œ์‹์ ์˜ ์˜ˆ์ƒ ๋งค์ถœ์„ ์˜ˆ์ธก
    4. ๊ตฌ๋งค์ž์˜ ๋‚˜์ด, ์—ฐ ์†Œ๋“์„ ์ด์šฉํ•ด ํŠน์ • ์ œํ’ˆ์˜ ์˜ˆ์ƒ ํŒ๋งค๋Ÿ‰์„ ์˜ˆ์ธก

 

๋จธ์‹ ๋Ÿฌ๋‹ ํŒŒํŠธ ์ฐธ๊ณ  ์‚ฌ์ดํŠธ

https://dad-rock.tistory.com/702

 

[Machine Learning] Machine Learning Overview | ๋จธ์‹ ๋Ÿฌ๋‹ ๊ฐœ์š”

Machine Learning Overview ๋จธ์‹ ๋Ÿฌ๋‹ ๊ฐœ์š” - ์ธ๊ณต์ง€๋Šฅ์˜ ํ•œ ๋ถ„์•ผ๋กœ, ์ธ๊ณต์ง€๋Šฅ์˜ ํŒจํ„ด์ธ์‹๊ณผ ๊ณ„์‚ฐ ํ•™์Šต ์ด๋ก ์—์„œ ๋ฐœ์ „ํ•œ ์ปดํ“จํ„ฐ๊ณผํ•™์˜ ํ•œ ๋ถ„์•ผ์ด๋‹ค. - ๋จธ์‹ ๋Ÿฌ๋‹์—์„œ๋Š” ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ํ•™์Šตํ•˜๊ณ  ์˜ˆ

dad-rock.tistory.com