๐ก WIDA/DACON ๋ถ๋ฅ-ํ๊ท
[Drug/๊น์ธ์ฐ, ์ต๋ค์] EDA ๋ฐ ์ ์ฒ๋ฆฌ ๊ณผ์
์ ์ ์๋ ์ฌ์ฉ์
2023. 7. 23. 23:59
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
from sklearn.preprocessing import LabelEncoder
- 10๋๋ถํฐ 70๋ ๊น์ง ๊ณจ๊ณ ๋ฃจ ๋ถํฌํด์์
- 20๋ ์ด๋ฐ, 30๋ ํ๋ฐ, 40๋ ํ๋ฐ ๋น์จ์ด ๊ฐ์ฅ ๋์
- Drug Y : ๋ชจ๋ ์ข ๋ฅ์ BP๊ฐ ๋ค ๋ํ๋จ, HIGH > LOW > NORMAL ์
- Drug A, B : HIGH BP๋ง ๋ํ๋จ
- Drug C : LPW BP๋ง ๋ํ๋จ
- Drug X : NORMAL > LOW ์์ผ๋ก ๋ํ๋จ
- ๋จ์ ํน์ ์ฌ์๊ฐ ํน๋ณํ ์ ํธํ๋ ์ฝ๋ฌผ์ ์์ (๋น์ทํ ๋น์จ)
- DrugB : 60~70๋ ์ฌ์ด์ ๋ถํฌ๋์ด ์์
- DrugY : ๊ด๋ฒ์ํ๊ฒ ๋ถํฌ๋์ด ์์
- DrugA : 3๋ฒ์งธ๋ก ๋ง์์๋ ๋ถ๊ตฌํ๊ณ 30~40๋์ ์ง์ค์ ์ผ๋ก ๋ถํฌ๋์ด ์์
- DrugC : ๋ฐ์ดํฐ ์๊ฐ ๊ฐ์ฅ ์ ์์๋ ๋ถ๊ตฌํ๊ณ 30~50๋์ ๊ด๋ฒ์ํ๊ฒ ๋ถํฌํจ
- DrugY๊ฐ ๋ค๋ฅธ ๊ฒ๋ค์ ๋นํด ์๋์ ์ผ๋ก Na_to_K ๊ฐ์ด ๋์
- Drug Y์ Na_to_K๋ง ํ๊ท ์ด 20์ด์์ผ๋ก ๋๊ณ ๋๋จธ์ง ์ฝ๋ค์ ํ๊ท ์ด 10 ์ ๋์ ๋จธ๋ฌผ๋ฌ ์์
- X์ถ : ๋ง์ฝ์ ์ข ๋ฅ, Y์ถ : Na_to_K, ํฌ์ธํธ : BP
- DrugY : ์ ์ผํ๊ฒ Na_to_K๊ฐ์ด 15์ด์๋ง ์กด์ฌํจ, BP์ ์ธ ์ข ๋ฅ๊ฐ ๋ชจ๋ ๊ณ ๋ฃจ ๋ถํฌํจ
- DrugA,B : Na_to_K๊ฐ 15 ์ดํ๋ง ์กด์ฌํ๋ฉฐ, HIGH BP๋ง์ ๊ฐ์ง
- DrugC : Na_to_K๊ฐ 15 ์ดํ๋ง ์กด์ฌํ๋ฉฐ, LOW BP๋ง์ ๊ฐ์ง
- DrugX : Na_to_K๊ฐ 15 ์ดํ๋ง ์กด์ฌํ๋ฉฐ, LOW, NORMAL BP๋ง์ ๊ฐ์ง
- BP์ Cholesterol์ด NORMAL์ธ ๊ฐ๋ค
- BP์ Cholersterol์ด ๋ชจ๋ ์ ์์ธ ์ฌ๋์ Drug X์ Y์ ๋ถํฌํจ
- Na_to_K ๊ฐ์ด 10~20 ์ฌ์ด์ ๋ง์ด ๋ถํฌํจ
- Drug์ Na_to_K๋ ์์ ์๊ด๊ด๊ณ๋ฅผ ๊ฐ์ง(-0.69)
- Drug์ BP๋ ์์ ์๊ด๊ด๊ณ๋ฅผ ๊ฐ์ง(0.42)
์ ์ฒ๋ฆฌ
- DrugY๋ง ์์ด ๋๋ฌธ์๋ก ํ์๋์ด์์ด ์ถํ ํ์ธ์ด ํ์ํจ
- ๋ฐ์ดํฐ ๋ถ๊ท ํ ๋ฌธ์ ํด๊ฒฐ (DrugY์ DrugC์ ์ฐจ์ด๊ฐ 4๋ฐฐ)
- Na_to_K ์์์ ์๋ฆฌ ์ ํต์ผ์ํค๊ธฐ (์์์ ๋์งธ์๋ฆฌ๋ฅผ ๊ธฐ์ค์ผ๋ก)