분류 전체보기 498

[DACON/김규리] 천체 유형 분류 대회를 위한 도메인 지식 알아보기

월간 데이콘 천체 유형 분류 대회를 위한 지식 쌓기 1. 데이터 살펴보기 train.csv 기준 컬럼 종류 id type fiberID psfMag psfMag_u psfMag_g psfMag_r psfMag_i psfMag_z fiberMag fiberMag_u fiberMag_g fiberMag_r fiberMag_i fiberMag_z petroMag petroMag_u petroMag_g petroMag_r petroMag_i petroMag_z modelMag modelMag_u modelMag_g modelMag_r modelMag_i modelMag_z 컬럼 설명(출처: http://classic.sdss.org/dr7/algorithms/photometry.html, https://brun..

[DACON/최다예] 천체 유형 분류 대회를 위한 도메인 지식 알아보기

슬론 디지털 천체 관측(Sloan Digital Sky Survey:SDSS) 목표 : train data로 학습을 하고 test data의 천체의 type을 알아내는 것 [type] = Source type : 천체의 분류 QSO : 퀘이사 - 활동은하핵(Active Galactic Nucleus, AGN)을 갖는 매우 멀고 밝은 은하 - 가장 밝은 천체 중의 하나 - 넓은 선폭의 방출선을 가지며, 가시광선과 엑스선(X-ray) 영역대에서 강한 방출선을 가짐 - 적색편이 값은 매우 큼 (https://terms.naver.com/entry.naver?docId=5741238&cid=60217&categoryId=60217) STAR_RED_DWARF : 적색왜성 STAR_WHITE_DWARF : 백색왜..

[DACON/김경은] 천체 유형 분류 대회를 위한 도메인 지식 알아보기

월간 데이월간 데이콘 천체 유형 분류 대회 천체 유형 분류 알고리즘 개발 test 데이터 셋과 train 데이터 셋에서 도메인 지식 알아보기 fiber ID 천체를 관측할 때 사용된 광섬유의 식별번호 type QSO 퀘이사 STAR_RED_DWARF 적색왜성 STAR_BHB 수평거열성 STAR_CARBON 탄소로 된 왜성 STAR_BROWN_DWARF 갈색왜성 STAR_SUB_DWARF 저광도인 왜성에 준하는 행성 STAR_CATY_VAR 격변변광성 STAR_RED_DWARF 적색왜성 STAR_WHITE_DWARF 백색왜성 SERENDIP_RED, SERENDIP_BLUE, SERENDIP_DISTANT 항성 구역 외부에 놓인 천체 SERENDIPITY_FIRST 첫번째 관측에서 퀘이사로 분류되었지만, ..

[1팀/허서원] 2차시 파이썬 스터디 - 자료형

참고자료 : 데이터 과학을 위한 파이썬 프로그래밍 (최성철) 2. 파이썬 기초 - 01 자료형 변수와 자료형 · 화면 입출력과 리스트 학습목표 변수의 개념, 변수와 메모리의 단계에 대해 알아본다. 변수명을 선언하는 규칙에 대해 이해한다. 기본 자료형 (정수형, 실수형, 불린형)에 대해 학습한다. 사칙연산을 비롯한 간단한 연산을 수행한다. 자료형 간 변환하는 방법에 대해 알아보고, 자료형을 확인하는 방법을 학습한다. 사용자 인터페이스를 학습하고. CLI 환경에 대해 이해한다. 표준 입력 함수인 inputO 함수와 표준 출력 함수인 print() 함수에 대해 알아본다. 리스트의 필요성과 개념에 대해 이해한다. 리스트의 가장 중요한 특징인 인덱싱과 슬라이싱에 대해 학습한다. 리스트의 연산과 리스트를 추가하고 ..

[DACON/김세연] 천체 유형 분류 대회를 위한 도메인 지식 알아보기

머신 러닝의 종류 및 특징 1) 지도학습 (supervised learning) : 정답과 가이드가 있음 : 과거의 데이터를 통해 배움 : 종속변수와 독립변수가 있음 -분류 (classification) -회귀 (regression) 2) 비지도학습 (supervised learning) : 정답과 가이드가 없음 -군집화 (clustering) -변환 (transform) -연관 (association) 3) 강화학습 (reinforce learning) #분류: 예측하고 싶은 종속변수가 이름,문자일 때 Decision TreeClassifier KNeighborsClassifier LogisiticRegression SVC RandomForestClassfier XGBClassifier accuracy..

[2팀/김세연] 2차시 파이썬 스터디 - 자료형

2주차 자료형 참고자료: 데이터 과학을 위한 파이썬 프로그래밍, 점프 투 파이썬 변수와 메모리 변수 :프로그래밍에서는 어떤 값을 저장하는 장소 :수학에서의 변수와 비슷하지만 약간 다름 변수명다른 사람도 이해할 수 있는 변수명을 정하는 것이 좋음:특별한 의미가 있는 예약어 사용 안됨 :대소문자 구분 주의 professer Professer :알파벳,숫자,밑줄(_) 사용, 한글X 예시 professer = 'Yerim Choi' a = 3 b = 7 month_price = 32460 birth_00 = 1126 birth_00 = '011126' professer이라는 변수에 ‘yerim Choi’라는 문자데이터를 할당(변수에 데이터를 넣는 과정)함 데이터 타입 숫자형 :정수형(int) - 0, 17 ,-..

[DACON/조아영] 천체 유형 분류 대회를 위한 도메인 지식 알아보기

월간 데이콘 천체 유형 분류 대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io 데이콘에서 2020년에 열렸던 월간 데이콘 대회 중 하나 천체 유형 분류 대회를 통해 분류모델을 학습하는 시간을 가질 예정이다. 일단 주어진 training dataset을 바탕으로 우리가 알아야 할 도메인 지식들을 알아보았다. 1. id, type, fiberID id 그냥 데이터 하나하나에 붙여준 것이라 구체적으로 볼 필요가 없는 것 같다. type type은 자세히 살펴볼 필요가 있다. GALAXY : 주 표본 은하 QSO : 퀘이사 REDDEN_STD ROSAT_D : X선 파장대에서 관측한 천체이나 SDSS 망원경에서도 관측되는 천체 SERENDIPITY_..

[DACON/김민혜] 천체 유형 분류 대회를 위한 도메인 지식 알아보기

Dacon 천체 유형 분류 경진대회 대회 개요 천체 데이터인 ‘슬론 디지털 천체 관측(SDSS)’ 데이터를 활용하여 새로운 천체 유형 분류를 위한 예측 분류 모델을 생성. 천체를 관측하여 측정된 21개의 데이터를 이용하여 이미 정의된 19개의 천체 유형을 분류하는 대회 5개 종류의 천체 관측 데이터 → 규모(magnitude) 데이터는 5개의 세부 데이터를 가짐 기본지식 천체의 종류 (출처: 🔗LINK) 항성 star DEF) 핵융합 반응을 통해 스스로 빛을 내는 천체 행성 planet DEF) 항성을 중심으로 공전하고 있는 천체 관측하기 쉬운 편 밝게 빛나는 것이 많으며 육안으로 찾기도 쉽다 소구경 망원경으로도 형태를 쉽게 관찰할 수 있음 위성 satellite DEF) 행성을 공전하고 있는 천체 특징..

[1팀/한규림] 2차시 파이썬 스터디 - 자료형

티스토리에는 업로드에 한계가 있어 강의안 pdf를 참고하시기 바랍니다. 2주차 강의 주제는 자료형입니다. 01. 변수의 이해 1. 변수와 값 >>> dsob = "swu" >>> print(dsob) swu dsob = “swu“ 의 의미? dsob의 이름은 swu이다. dsob은 swu이다. dsob과 swu는 같다. dsob에 swu를 넣어라. ‘ = ’ 기호의 의미 일반적으로 → ‘~와 같다’ 프로그래밍에서 → ‘dsob 이라는 공간에 swu 라는 글자를 넣어라.’ → dsob 이라는 변수에 swu 라는 값을 넣어라. >>> a = 7 >>> b = 5 >>> print(a + b) 12 >>> a = 7 >>> b = 5 >>> print("a + b") a + b 따옴표(“ “) 사용 여부에 따..

[1팀/지다인] 2차시 파이썬 스터디- 자료형

💡 데이터 과학을 위한 파이썬 프로그래밍을 수업에 맞게 정리한 교안입니다. 무단 공유와 배포는 금지합니다. 파이썬 경험 유무, 어느 정도 알고 있는지, 1주차 잘 모르는 부분 check w1 review 요약 코딩이란 프로그래밍을 하는 행위이며, 프로그래밍은 프로그래밍 언어를 사용하여 프로그램을 개발하는 것이다. 프로그래밍 언어는 인간이 원하는 것을 컴퓨터로 실행시키기 위해 사용하는 컴퓨터가 이해할 수 있는 언어이다. 파이썬은 귀도 반 로섬이 개발한 언어이고 이후 다양한 기능이 추가되었다. 파이썬은 플랫폼 독립적인 언어, 인터프리터 언어, 객체 지향 언어, 동적 타이핑 언어라는 특징을 갖고 있다. 화면 입출력 함수인 input(), print()함수에 대해 배웠다. input()은 사용자로부터 값을 입력..