dsob 6

[4팀/김민혜] 7차시 파이썬 스터디 - 자료구조

1. 자료구조의 이해 개념 DEF) 특징이 있는 데이터를 메모리에 효율적으로 저장 및 반환하는 방법으로 데이터를 관리하는 방식 사례 전화번호부 - 효율적으로 전화번호를 찾기 위해 이름을 기준으로 가나다 순으로 저장되어 있음 은행 번호표 - 사용자가 대기표를 뽑을 때마다 대기 인원 1씩 증가, 은행 서비스 이용 종료시 1씩 감소 택배 수화물 - 나중에 배달되는 수화물일수록 트럭 안쪽에 배치, 먼저 배달되는 수화물일수록 트럭 입구족에 배치 파이썬에서의 자료구조 (← 간단한 개요 수준에서만 학습)자료구조명 특징 스택 stack 나중에 들어온 값이 먼저 나갈 수 있도록 해주는 자료구조 (last in first out) 큐 queue 먼저 들어온 값이 먼저 나갈 수 있도록 해주는 자료구조 (first in fi..

[4팀/김민혜] 6차시 파이썬 스터디 - 문자열

1. 문자열 string 개념 앱을 만들거나 데이터를 분석할 때 매우 중요하게 다루어지는 자료형 중 하나 시퀀스 자료형 sequence data type : 데이터를 순차적으로 메모리에 저장하는 형식의 데이터 문자열의 메모리 공간은 1바이트byte(8비트=2의 8승) import sys print(sys.getsizeof("a"), sys.getsizeof("ab"), sys.getsizeof("abc")) 50 51 52 => 메모리 크기가 1씩 증가하는 것을 확인할 수 있음. 여기서 출력된 숫자는 byte를 의미 컴퓨터의 특징 컴퓨터는 문자를 직접 인식하지 X 문자를 숫자로 변환하여 인식 문자를 숫자로 변환하기 위한 규칙을 만듦 1개의 영문자를 1바이트byte, 즉 2의 8제곱 정도의 공간에 저장 ⇒..

[4팀/김민혜] 5차시 파이썬 스터디 - 함수

1. 함수 - 기초 개념 DEF) 어떤 일을 수행하는 코드의 덩어리, 또는 코드의 묶음 장점 필요할 때마다 호출이 가능하다 반복적으로 수행해야 하는 업무를 한 번만 작성해 놓아도 됨 ⇒ 코드 수정 시 같은 작업을 여러 번 반복하지 않아도 된다는 점! 논리적인 단위로 분할이 가능하다 간단히 도형을 계산하는 프로그램을 작성하더라도 곱셈 코드, 덧셈 코드, 나눗셈 코드 등으로 나눌 수 있음 코드의 캡슐화 함수의 인터페이스만 잘 정의한다면 다른 사람이 쉽게 코드를 가져다 사용할 수 있음 인터페이스의 정의 = 입력값(input)과 출력값(output)을 명확히 하는 것 코드의 내부 구조를 몰라도 함수 사용 가능 함수 선언과 실행 def 함수이름 (매개변수 #1 ...): 명령문1 명령문2 return 코드설명 d..

[DACON/김민혜] 파이썬을 이용한 EDA

글을 작성하기에 앞서... 사실 EDA를 이렇게 진행하는 것이 맞는지 확실하지는 않으나 최대한 열심히 공부해보았습니다.. 하하 EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 참고: https://jalynne-kim.medium.com/데이터분석-기초-eda의-개념과-데이터분석-잘-하는-법-a3cac2cc5ebc 개념 벨연구소의 수학자 ‘존 튜키’가 개발한 데이터분석 과정에 대한 개념으로, 데이터를 분석하고 결과를 내는 과정에 있어서 지속적으로 해당 데이터에 대한 ‘탐색과 이해’를 기본으로 가져야 한다는 것을 의미 처음에 로우데이터(raw data)를 접할 때부터 데이터를 잘 이해하고 파악한 다음, 어떤 결과를 만들어낼 지 ‘이 feature(column)로 필터해보고, 저..

[4팀/김민혜] 4차시 파이썬 스터디 - 반복문

1. 반복문 loop 개념 DEF) 문장을 반복하도록 만드는 것. 정해진 동작을 반복적으로 수행할 때 사용하는 명령어 일상에서의 예 학생 100명의 성적 산출 쇼핑몰에서 상품 추천 ← 사용자의 상품 구매 특징 vs 다른 상품 간의 특징 MS워드에서 단어 바꾸기 명령 실행 ← 바꾸고자 하는 단어와 각 단어의 비교를 통한 전체 단어에 적용 구성 요소: 반복 시작 조건, 종료 조건, 수행 명령 for, while이라는 명령 키워드 사용 2. 명령어 for문 DEF) 가장 기본적인 반복문으로, 반복 범위를 지정하여 반복을 수행 for를 입력하고 반복되는 범위의 지정 필요 for looper in [1,2,3,4,5]: print("hello") hello hello hello hello hello *리스트에 있..

[DACON/김민혜] 분류 모델 뜯어보기, 분류모델 평가방식

☝🏻 WIDA_4주차 파이썬으로 모델 불러와서 간단하게 모델 돌려보고 accuracy 측정해보기 (decision tree 제외 한가지 골라서) 그 모델의 하이퍼파라미터 분석하기 평가 방법 알아보기(log loss 포함 2가지) 랜덤포레스트 모델 실행 코드 from sklearn.ensemble import RandomForestClassifier from sklearn.ensemble import BaggingClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score import pandas as pd import warnings warnings.filterwarnings..