스터디/[여름방학] 스터디 과제

[여름방학] 4차시 머신러닝 복습과제

려우 2023. 8. 11. 19:30

🔑 제출 방식

ipynb 파일을 메일로 제출 (dsob2021swu@gmail.com)

 

🔑 제출 양식

[이름] 4차시 복습과제

[이름] 4차시 복습과제.ipynb

 

🔑 과제 풀이 방식

주피터 노트북 혹은 코랩을 이용하여 아래의 문제들을 하나하나 풀어본다.

코드를 작성하고 주석을 충분히 달아주어야 하며, markdown도 이용하여 본인의 생각을 잘 표현할 수 있도록 한다.


🔑 과제 내용

아래의 링크는 sklearn에서 제공하고있는 데이터셋입니다.

https://scikit-learn.org/stable/datasets/toy_dataset.html

 

7.1. Toy datasets

scikit-learn comes with a few small standard datasets that do not require to download any file from some external website. They can be loaded using the following functions: These datasets are usefu...

scikit-learn.org

 

1. 위의 데이터셋 중 맘에드는 것을 골라 불러옵니다.

 

2. 해당 데이터셋은 supervised, unsupervised, reinforcement learning 중 어떤 학습에 적용 가능한 데이터인지 알아봅시다.

 

3. 어떤 학습에 적용이 가능한지 알아보았나요? 그렇다면 class(target = label)와 features를 확인해봅시다.

연속형(continuous)인가요? 이산형(discrete)인가요?

 

4. 그리고 이 데이터는 어떤 모델에 적용할 수 있는지 알아봅시다.

e.g. clustering, regression, classification ...등등

 

5. 불러온 데이터의 class(target = label)를 확인해봅시다.

binary class 인가요? multi class 인가요? 연속형이라 binary나 multi class라고 말할 수 없나요?

 

6. 해당 데이터를 학습시킬 구체적인 모델을 불러와봅시다. 아무거나 괜찮습니다. 다만 3, 4번의 답과 관련있는 모델을 불러오세요.

e.g. Unsupervised learning에서 사용할 수 있는 데이터이니 Unsupervised learning 모델들 중 K-means clustering 모델을 사용해야겠군!

 

7. 모델을 불러와 학습시켜보았나요? 사실 이게 중요한 것이 아닙니다. 불러온 모델과 관련있는 평가방식들을 이용해 결과를 평가해보세요.

 

8. 결과값이 어떤가요? 해석해봅시다.