전체 글 486

[2팀/김세연] 6차시 파이썬 스터디 - 문자열

문자열의 이해 :문자열을 이해하기 위해서는 문자열의 특징을 이해해야함 :문자열은 시퀀스 자료형으로 리스트처럼 데이터를 순차적으로 저장 문자열과 메모리 공간 :영문자 한 글자당 1바이트의 메모리 공간을 사용 :컴퓨터는 문자를 직접 인식하지 못함 :컴퓨터는 문자를 숫자로 변환하려 인식함 :사람들은 문자를 숫자로 변환하기 위한 규칙을 만듦 :일반적으로 이 규칙은 1개의 영문자를 1바이트, 2의 8승 정도의 공간에 저장함 -문자열 인덱싱 :리스트와 같이 문자하나 하나가 상대적인 주소를 갖음 a = "abcde" print(a [0], a [4]) a e print(a [-1], a [-5]) e a -문자열 슬라이싱(=리스트 슬라이싱) : 문자열의 주소값을 이용해 문자열의 부분값을 추출해내는 기법 a = "TE..

[DACON/참고자료] 앙상블 모델

1. 개요 1) 앙상블이란? 여러개의 classifier를 생성하고 각 classifier가 예측한 값들을 결합함으로써 정확한 최종 예측 결과를 도출하는 기법 대부분의 정형데이터 분류 시 앙상블 모델들이 뛰어난 성능을 나타냄 랜덤 포레스트, 그래디언트 부스팅 등의 모델들이 있음 2) 학습 유형 투표를 통해 최종 예측 결과 결정 보팅 배깅 여러개의 분류기가 순차적으로 삭습 수행, 예측이 틀린 데이터에 대해서는 가중치 부여 부스팅 여러가지 다른 모델들의 예측 결과값을 학습 데이터로 만들고, 다른 모델(메타모델)에 이를 재학습시켜 결과를 예측 스태킹 이 외에도 다양한 유형이 있음 2. 앙상블 학습 유형 1) 보팅 일반적으로 서로 다른 알고리즘을 가진 classifier를 결합함 보팅 유형 하드보팅 다수결의 원..

[3팀/김규리] 6차시 파이썬 스터디 - 문자열

*모든 출처는 도서 "데이터 과학을 위한 파이썬 프로그래밍"입니다* #1. 문자열의 이해 문자열(string)의 개념 중요하게 다뤄지는 자료형 중 하나 문자열 특징 시퀀스 자료형 데이터를 순차적으로 메모리에 저장 문자열의 인덱싱과 슬라이싱 인덱싱 또 다른 시퀀스 자료형인 리스트와 비슷한 특징 갖고 있음 상대적 주소인 인덱스 활용 인덱싱 사용 방법 형식 문자열 저장된 변수명[인덱스 주소] a = 'apple' print(a[0], a[3]) #a l print(a[-1], a[-5]). #e a 슬라이싱 주소값 활용하여 문자열의 부분 추출 리스트의 슬라이싱과 동일 a = 'Do it yourself!' print(a[3:6], 'and', a[-9:]) #it and yourself! print(a[:] ..

[4팀/김민혜] 6차시 파이썬 스터디 - 문자열

1. 문자열 string 개념 앱을 만들거나 데이터를 분석할 때 매우 중요하게 다루어지는 자료형 중 하나 시퀀스 자료형 sequence data type : 데이터를 순차적으로 메모리에 저장하는 형식의 데이터 문자열의 메모리 공간은 1바이트byte(8비트=2의 8승) import sys print(sys.getsizeof("a"), sys.getsizeof("ab"), sys.getsizeof("abc")) 50 51 52 => 메모리 크기가 1씩 증가하는 것을 확인할 수 있음. 여기서 출력된 숫자는 byte를 의미 컴퓨터의 특징 컴퓨터는 문자를 직접 인식하지 X 문자를 숫자로 변환하여 인식 문자를 숫자로 변환하기 위한 규칙을 만듦 1개의 영문자를 1바이트byte, 즉 2의 8제곱 정도의 공간에 저장 ⇒..

[4팀/이제은] 6차시 파이썬 스터디 - 문자열

01 문자열의 이해 이번 장에서는 그동안 변수로만 봐왔던 문자열형에 대해 알아보는 장입니다. > 문자열의 개념 시퀀스 자료형 : 리스트와 같이 데이터를 순차적으로 저장하는 형식의 데이터 → 문자열은 시퀀스 자료형! > 문자열과 메모리 공간 - 컴퓨터는 이진수만 사용하므로 컴퓨터가 숫자를 인식하는 최소 단위는 1비트이다. - 1비트는 0과 1만을 표현할 수 있는 크기이다. - 1바이트 = 8비트이며 2의 8제곱인 256까지의 숫자를 저장할 수 있다. 다음과 같이 코드를 통해서 문자열이 저장된 공간의 크기를 눈으로 확인해볼 수 있습니다. import sys print(sys.getsizeof("a"), sys.getsizeof("ab"), sys.getsizeof("abc")) 50 51 52 - sys.g..

[DACON/참고자료] SVM 참고자료

또 다른 모델, SVM from sklearn import svm from sklearn.metrics import accuracy_score from sklearn.model_selection import train_test_split import pandas as pd # svm 모델 불러오기 7가지 모델 중 svm.SVC로 불러옴 svm_clf = svm.SVC(kernel="linear") # training dataset 불러오기 train_data = pd.read_csv("C:/Users/1ayou/PycharmProjects/dacon_astronomy/dataset/train.csv") X = train_data.iloc[:, 2:] y = train_data.iloc[:, 1] X_tr..

[4팀 / 김유경] 5차시 파이썬 과제 - 함수형

문제1: 함수 "비트코인" 문자열을 화면에 출력하는 print_coin() 함수를 정의하라. def print_coin(): print("비트코인") 문제2: 호출 문제1에서 정의한 함수를 100번 호출하라. def print_coin(): print("비트코인") for i in range(100): print_coin() 문제3: 함수와 에러 아래의 에러가 발생하는 이유에 대해 설명하라. hello() def hello(): print("Hi") NameError: name 'hello' is not defined 정답: 함수의 정의를 먼저 한 후에 호출을 해야한다. 문제4: 함수 아래 코드의 실행 결과를 예측하라. 예측: A C B E D 문제5: 함수 아래 코드의 실행 결과를 예측하라. 예측: B..

[4팀/김민혜] 5차시 파이썬 스터디 - 함수

1. 함수 - 기초 개념 DEF) 어떤 일을 수행하는 코드의 덩어리, 또는 코드의 묶음 장점 필요할 때마다 호출이 가능하다 반복적으로 수행해야 하는 업무를 한 번만 작성해 놓아도 됨 ⇒ 코드 수정 시 같은 작업을 여러 번 반복하지 않아도 된다는 점! 논리적인 단위로 분할이 가능하다 간단히 도형을 계산하는 프로그램을 작성하더라도 곱셈 코드, 덧셈 코드, 나눗셈 코드 등으로 나눌 수 있음 코드의 캡슐화 함수의 인터페이스만 잘 정의한다면 다른 사람이 쉽게 코드를 가져다 사용할 수 있음 인터페이스의 정의 = 입력값(input)과 출력값(output)을 명확히 하는 것 코드의 내부 구조를 몰라도 함수 사용 가능 함수 선언과 실행 def 함수이름 (매개변수 #1 ...): 명령문1 명령문2 return 코드설명 d..

[3팀 / 김은수] 5차시 파이썬 과제 - 함수형

1번 정답 : 1번 2번 정답:2 3번 정답: 3번 print(f(3))을 하면 y=3, x=7이니 반환 값으로 21이 나옵니다. print(x)를 시행하면 전역변수 x=4이 의해 4가 나옵니다. 4번 정답: 1번 키워드 인수는 순서에 상관없이 원하는 변수에 인수를 넣기 때문입니다. 5번 정답 : 1번 매개변수가 없을 때 반환값만 있는 경우 그 반환값만 도출되기 때문입니다. 6번 정답: 1번 전역변수가 더 우선이기 때문입니다. 7번 정답: 1번 say_myself함수가 다 돌아간 뒤 if문이 시행되기 때문에 이름 나이 성별 순서대로 값이 출력될 것입니다. 8번 정답 : Value: 10 Value: 20 exam함수안에 있는 x는 지역변수이기 때문에 10이 나오고 마지막 줄에는 전역변수 값인 20이 들어..

[2팀/이유진] 5차시 파이썬 과제- 함수

파이참이 실행되지 않아 replit 사이트를 이용하여 과제 진행하였습니다. 1. 두 정수를 입력 받아 더한 값을 반환하는 함수(add_numbers)를 작성하시오. 2. 두 수를 비교하는 compare_numbers 함수를 사용한 프로그램을 작성하시오. (백준 1330) 입력 조건: 첫째 줄에 두 정수 A와 B가 주어진다. (−10,000 ≤ A, B ≤ 10,000) 3. 문자열을 입력 받아 거꾸로 뒤집은 문자열을 반환하는 함수(reverse_string)를 작성하시오 - 해결못함 4. 정수 n개가 주어졌을 때, n개의 합을 구하는 solve 함수를 작성하시오. (백준 15596) 5. 문자열과 문자를 입력 받아 해당 문자열에서 해당 문자가 몇 번 나오는지 반환하는 함수 (count_char)를 작성하..