๐Ÿ’ก WIDA/DACON ๋ถ„๋ฅ˜-ํšŒ๊ท€

[DACON/๊น€๊ฒฝ์€] ๊ธฐ๋ง ํ”„๋กœ์ ํŠธ ์—์„ธ์ด

๊ฒฝ์€ 2023. 5. 30. 13:06

ugriz ํ•„ํ„ฐ

"5๊ฐœ์˜ SDSS ํ•„ํ„ฐ์—์„œ ์ธก์ •๋œ ์€ํ•˜์˜ ๊ฒ‰๋ณด๊ธฐ ๋“ฑ๊ธ‰"

๊ฐ ํ•„ํ„ฐ๋Š” ํŠน์ • ํŒŒ์žฅ ์ฃผ๋ณ€์˜ ๋น›์ด ๋“ค์–ด์˜ค๋„๋ก ์„ค๊ณ„๋˜์—ˆ๋‹ค. 

ํ•„ํ„ฐ๋Š” ๋ณด๋„๋ก ์„ค๊ณ„๋œ ํŒŒ์žฅ ์ฃผ๋ณ€์˜ ๋น›์„ ์ œ์™ธํ•œ ๋ชจ๋“  ํŒŒ์žฅ์˜ ๋น›์„ ์ฐจ๋‹จํ•˜์—ฌ ์ž‘๋™ํ•œ๋‹ค. 

SDSS ์นด๋ฉ”๋ผ์—๋Š” ๋‹ค์„ฏ ๊ฐ€์ง€ ํ•„ํ„ฐ๊ฐ€ ๋‚ด์žฅ๋˜์–ด ์žˆ๋Š”๋ฐ, ์ด ํ•„ํ„ฐ๋Š” ๊ทผ์ž์™ธ์„ ์—์„œ ๊ทผ์ ์™ธ์„ ์— ์ด๋ฅด๋Š” ์ž‘์€ ํŒŒ์žฅ ์ฐฝ์—์„œ ๋ฌผ์ฒด์˜ ๋ฐ๊ธฐ๋ฅผ ์ธก์ •ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค.

 

SDSS์˜ 5๊ฐœ ํ•„ํ„ฐ๊ฐ€ ๊ฐ€์žฅ ์ž˜ ์ž‘๋™ํ•˜๋Š” ํŒŒ์žฅ์ด๋‹ค.

์ž์™ธ์„ (u)
์ฒญ์ƒ‰ ๋ฐ ๋…น์ƒ‰ ๊ฐ€์‹œ ๊ด‘์„ (g)
ํ™ฉ์ƒ‰ ๋ฐ ์ ์ƒ‰ ๊ฐ€์‹œ๊ด‘์„ (r)
๊ทผ์ ์™ธ์„ (i)
์ ์™ธ์„ (z)

SDSS ์นด๋ฉ”๋ผ๋Š” ๊ฐ ํ•„ํ„ฐ๋ฅผ ํ†ต๊ณผํ•˜๋Š” ๋น›์˜ ์–‘์„ ์ธก์ •ํ•œ๋‹ค. 

์ „์ž๊ธฐ ์ŠคํŽ™ํŠธ๋Ÿผ์„ ๋”ฐ๋ผ ์„œ๋กœ ๋‹ค๋ฅธ ์œ„์น˜์—์„œ ์ „์†ก๋˜๋Š” ๋น›์˜ ๊ฐ•๋„์ธ ์ด ์ •๋ณด๋Š” ์ฒœ๋ฌธํ•™์ž๋“ค์ด ํ•˜๋Š˜์— ์žˆ๋Š” ๋ฌผ์ฒด์˜ ๋ฐ๊ธฐ์™€ ์ƒ‰์ƒ์„ ์ฃผ์˜ ๊นŠ๊ฒŒ ์ธก์ •ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ•๋ ฅํ•œ ๋„๊ตฌ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.

 

asinh ํฌ๊ธฐ ์‚ฌ์šฉ

 

์‹œ๊ฐํ™”

train ๋ฐ์ดํ„ฐ์…‹์„ ๊ทธ๋Œ€๋กœ ๊ฐ€์ ธ์™€์„œ ๋ฐ•์Šคํ”Œ๋กฏ์„ ์ง„ํ–‰ํ•˜๋ฉด ๊ทน๋‹จ๊ฐ’ ๋•Œ๋ฌธ์— ๋ˆˆ์œผ๋กœ ๋ถ„ํฌ๋ฅผ ํ™•์ธํ•˜๊ธฐ ์–ด๋ ค์› ๋‹ค.

๋”ฐ๋ผ์„œ ๊ฐ™์€ ํ•„ํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์นผ๋Ÿผ์„ ๋น„๊ตํ•ด๋ณด๊ธฐ ์œ„ํ•ด ๊ทน๋‹จ๊ฐ’์„ ์ œ๊ฑฐํ•˜์—ฌ ๋ฐ•์Šคํ”Œ๋กฏ์œผ๋กœ ์‹œ๊ฐํ™”๋ฅผ ์ง„ํ–‰

 

 

u

 

g

 

r

 

i

 

z

 

์นผ๋Ÿผ๋ณ„๋กœ y์ถ•์˜ ๋ฒ”์œ„๊ฐ€ ๋‹ค ๋‹ฌ๋ผ์„œ ํ™•์ธํ•˜๋Š”๋ฐ ์–ด๋ ค์›€์ด ์žˆ์ง€๋งŒ

๋ชจ๋ธ๊ณผ ์ƒ๊ด€์—†์ด ๊ฐ™์€ ํ•„ํ„ฐ๋ผ๋ฆฌ ์œ ์‚ฌํ•œ ๋ถ„ํฌ๋ฅผ ๋ณด์ด๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. 

PetroMag์˜ ๊ฒฝ์šฐ ๋‹ค๋ฅธ Mag์— ๋น„ํ•ด ๊ทน๋‹จ๊ฐ’์ด ๋” ํฐ ์ˆ˜์น˜๋กœ ์กด์žฌํ•˜๋Š”๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.

 

 

์ „์ฒ˜๋ฆฌ ๋ฐฉ์•ˆ

fiberID ์™€ ๊ฐ™์€ ๊ฒฝ์šฐ ์‹ฌํ•œ ํด๋ž˜์Šค ๋ถˆ๊ท ํ˜•

  • Data argumentation : ๊ฐ–๊ณ  ์žˆ๋Š” ๋ฐ์ดํ„ฐ์…‹์„ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๋ฐฉ๋ฒ•์œผ๋กœ augmentํ•˜์—ฌ ์‹ค์งˆ์ ์ธ ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹์˜ ๊ทœ๋ชจ๋ฅผ ํ‚ค์šธ ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ๋ฐ์ดํ„ฐ์˜ ์–‘์„ ๋Š˜๋ฆฌ๊ธฐ ์œ„ํ•ด ์›๋ณธ์— ๊ฐ์ข… ๋ณ€ํ™˜์„ ์ ์šฉํ•˜์—ฌ ๊ฐœ์ˆ˜๋ฅผ ์ฆ๊ฐ•์‹œํ‚ค๋Š” ๊ธฐ๋ฒ•์ด๋‹ค. 
  • Class weight : ์ „์ฒด ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ ํด๋ž˜์Šค๋ณ„ ๊ฐ€์ค‘์น˜๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ๊ฐ™์€ ํด๋ž˜์Šค ๋‚ด์˜ ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ์€ ๊ฐ™์€ weight๊ฐ’์„ ๊ฐ–๋Š”๋‹ค.
  • Sample weight : ๊ฐœ๋…์ ์œผ๋กœ๋Š” class wieght์™€ ๊ฐ™์ง€๋งŒ ์ „์ฒด ๋ฐฐ์น˜๊ฐ€ ์•„๋‹ˆ๋ผ ๋ฏธ๋‹ˆ ๋ฐฐ์น˜ ์ƒ์—์„œ sample ์ˆ˜๋ฅผ ๊ณ ๋ คํ•ด loss๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•