classification 2

[DACON/김민혜] 파이썬을 이용한 EDA

글을 작성하기에 앞서... 사실 EDA를 이렇게 진행하는 것이 맞는지 확실하지는 않으나 최대한 열심히 공부해보았습니다.. 하하 EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 참고: https://jalynne-kim.medium.com/데이터분석-기초-eda의-개념과-데이터분석-잘-하는-법-a3cac2cc5ebc 개념 벨연구소의 수학자 ‘존 튜키’가 개발한 데이터분석 과정에 대한 개념으로, 데이터를 분석하고 결과를 내는 과정에 있어서 지속적으로 해당 데이터에 대한 ‘탐색과 이해’를 기본으로 가져야 한다는 것을 의미 처음에 로우데이터(raw data)를 접할 때부터 데이터를 잘 이해하고 파악한 다음, 어떤 결과를 만들어낼 지 ‘이 feature(column)로 필터해보고, 저..

[DACON/김민혜] 분류 모델 뜯어보기, 분류모델 평가방식

☝🏻 WIDA_4주차 파이썬으로 모델 불러와서 간단하게 모델 돌려보고 accuracy 측정해보기 (decision tree 제외 한가지 골라서) 그 모델의 하이퍼파라미터 분석하기 평가 방법 알아보기(log loss 포함 2가지) 랜덤포레스트 모델 실행 코드 from sklearn.ensemble import RandomForestClassifier from sklearn.ensemble import BaggingClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score import pandas as pd import warnings warnings.filterwarnings..