'💡 WIDA/DACON 분류-회귀' 카테고리의 글 목록 (3 Page)

💡 WIDA/DACON 분류-회귀 43

jupyter notebook 환경에서 작업해봤습니다~ 필요한 라이브러리 불러오기 #필요한 라이브러리 불러오기 import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns color = sns.color_palette() sns.set_style('darkgrid') # 그래프 해상도 업그레이드 %config InlineBackend.figure_format = 'retina' # 경고문 무시 import warnings warnings.filterwarnings('ignore') %matplotlib inline의 의미 notebook을 실행한 브라우저에서 바로 그..

💡 WIDA/DACON 분류-회귀 2023.04.07

[DACON/김경은] 파이썬을 이용한 EDA

EDA 진행 라이브러리 불러오기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns 데이터 불러오기 train = pd.read_csv("C:/Users/twink/Documents/카카오톡 받은 파일/train.csv") test = pd.read_csv("C:/Users/twink/Desktop/test.csv") sub = pd.read_csv("C:/Users/twink/Desktop/sample_submission.csv") 데이터를 불러와서 어떤 형태의 데이터가 있는지 살펴보기 pandas 의 메서드를 통한 간단한 탐색 .head() : 상위 5개, 괄호 안에 숫자로 개수 변경 가..

💡 WIDA/DACON 분류-회귀 2023.04.07

[DACON/김세연] 파이썬을 이용한 EDA

#1 import pandas as pd #2 import numpy as np #3 import matplotlib.pyplot as plt #4 import seaborn as sns #5 df=pd.read_csv("C:/Users/lucy8/PycharmProjects/test2/DSOB/train.csv") #6 print(df.head(3)) #7 print(df.shape) #8 print(df.isnull().sum()) #9 print(df.info()) df 파일에 할당된 데이터 중에 3개를 뽑아, 데이터의 형태 등을 파악함 좌(7행,8행)는 데이터의 개수를 행렬로 알려주고, null값이 있는지 알려줌 (null값이 있다면, 해결해야함 (평균,삭제 등)) 우(9행)는 데이터 타입을 알려..

💡 WIDA/DACON 분류-회귀 2023.04.07

[DACON/조아영] 파이썬을 이용한 EDA

Dacon 코드 공유에서 제공하고있는 코드들도 참고하였으나, 이해가 안되는 코드들은 과감하게 버리고 이해되는 부분만 파악해보았습니다. # 사용할 라이브러리 불러오기 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 데이터 불러오기 train_df = pd.read_csv("./dataset/train.csv") train_df # 데이터의 총 행열 개수 확인 train_df.shape # null값이 존재하는지 확인 train_df.isnull().sum() # 기본적인 데이터 정보들을 얻어냄 # 각 column별 데이터 타입도 얻을 수 있음 train_df.info() # 각 열별 기초 통계량을 확인함 train_df..

💡 WIDA/DACON 분류-회귀 2023.04.07

[DACON/김민혜] 파이썬을 이용한 EDA

글을 작성하기에 앞서... 사실 EDA를 이렇게 진행하는 것이 맞는지 확실하지는 않으나 최대한 열심히 공부해보았습니다.. 하하 EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 참고: https://jalynne-kim.medium.com/데이터분석-기초-eda의-개념과-데이터분석-잘-하는-법-a3cac2cc5ebc 개념 벨연구소의 수학자 ‘존 튜키’가 개발한 데이터분석 과정에 대한 개념으로, 데이터를 분석하고 결과를 내는 과정에 있어서 지속적으로 해당 데이터에 대한 ‘탐색과 이해’를 기본으로 가져야 한다는 것을 의미 처음에 로우데이터(raw data)를 접할 때부터 데이터를 잘 이해하고 파악한 다음, 어떤 결과를 만들어낼 지 ‘이 feature(column)로 필터해보고, 저..

💡 WIDA/DACON 분류-회귀 2023.04.07

[DACON/김세연] 분류 모델 뜯어보기, 분류 모델 평가방식

#새로운 분류모델 돌려보기 import warnings warnings.filterwarnings('ignore') from sklearn.model_selection import train_test_split import pandas as pd # training dataset 불러오기 data = pd.read_csv("C:/Users/lucy8/OneDrive/바탕 화면/train.csv", encoding = 'utf-8') # 맞춰야 하는 것은 type이기 때문에 type과 나머지 데이터들을 분리해줌 X = data[data.columns[:, :]] y = data[["class"]] # training dataset과 test dataset으로 쪼개기 # training과 test의 비율은 ..

💡 WIDA/DACON 분류-회귀 2023.03.31

[DACON/김경은] 분류 모델 뜯어보기, 분류 모델 평가방식

서포트벡터머신 모델 #필요 패키지 불러오기 from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score import pandas as pd import warnings warnings.filterwarnings('ignore') from sklearn import svm #데이터 불러오기 train_data = pd.read_csv("C:/Users/twink/Documents/카카오톡 받은 파일/train.csv") # type과 나머지 데이터들을 분리 X = train_data.iloc[:, 2:] y = train_data.iloc[:, 1] # training dataset과 test d..

💡 WIDA/DACON 분류-회귀 2023.03.31

[DACON/김규리] 분류 모델 뜯어보기, 분류 모델 평가방식

저번 시간에 알아본 나이브 베이즈 분류 모델을 직접 실습해보도록 하겠습니다~ *출처* https://m.blog.naver.com/baek2sm/221786426960 파이썬 나이브 베이즈 분류 머신러닝 알고리즘 예제 머신러닝&딥러닝 쿡북(MLCook) 사이킷런 나이브 베이즈 분류 예제 안녕하세요. 동네코더입니다. 이... blog.naver.com (이 분의 글을 참고하여 거의 똑같이 실습했기에 출처를 먼저 밝힙니다) 1. 나이브 베이즈 분류 모델 개요 - 머신러닝 기법 중 하나이며 전통적으로 텍스트 분류를 위해 사용되었던 알고리즘 - 지도학습 알고리즘 - 기본 원리는 베이즈 정리(Baye’s theorem)를 적용한 원리 - 흔히 스팸 메일 분류로 설명됨 스팸 메일 분류 텍스트에 등장하는 단어들의 빈..

💡 WIDA/DACON 분류-회귀 2023.03.31

[DACON/최다예] 분류 모델 뜯어보기, 분류모델 평가방식

KNN 알고리즘 구현하기 # 필요한 패키지 import import pandas as pd from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score # 데이터 로드 train_data = pd.read_csv("C:/Users/allye/Desktop/DSOB/WIDA Dacon/DCSTree/train.csv") # type과 나머지 데이터들을 분리해줌 X = train_data.iloc[:, 2:] y = train_data.iloc[:, 1] # 데이터셋 분할 (학습용 데이터와 검증용 데이터) #..

💡 WIDA/DACON 분류-회귀 2023.03.30

[DACON/조아영] 분류 모델 뜯어보기, 분류모델 평가방식 (svm 모델도 추가할 예정)

Decision Tree 코드는 블럭으로 따로 첨부 X https://github.com/cAhyoung/dacon_stars_type_clf/blob/main/practive_code/dt_rf_practice.py Hyper parameter criterion(기준) : default=”gini”, 데이터를 분류하기 위한 척도 “gini” 지니계수를 기반으로 한 데이터 분류 “entropy” 엔트로피 값을 기반으로 한 데이터 분류 “log_loss” log_loss를 기반으로 한 데이터 분류 splitter(분할) : default=”best” “best” 가장 좋은 분할 방식을 찾음 “random” 가장 좋은 랜덤 분할 방식을 찾음 max_depth : default=None 트리구조의 최고 깊이를..

💡 WIDA/DACON 분류-회귀 2023.03.30

1 2 3 4 5

✨ Data Shows the wOrld Better ✨ DSOB은 데이터를 통해 세상의 숨겨진 인사이트를 발견하고, 이를 이해하며, 문제를 해결하고자 하는 열정을 가진 사람들과 함께합니다.

dacon, 1차시과제, 코딩천재, 3팀, DSOB #파이썬 #입출력, 5주차, dsob, DSOB #Python #자료형, DSOB #python #조건문, 김경은, 3차시, Python, 데이터분석, 4차시, classification, 김수경, 함수, 반복문, randomforest, 데이터사이언스 #분류 #분류모델 #dacon,

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

💡 WIDA/DACON 분류-회귀 43

티스토리툴바