에세이/결석에세이

결석에세이_김가림

omomirg 2023. 5. 11. 23:45

데이터사이언스학과를 입학하고 나서 

 

소학회 결석 에세이를 쓰는 겸 1학년 때 진행 했던 프로젝트에 대해 작성해보도록 하겠다. 

작년에 해본 활동이라고는 크게 3가지 정도로 적을 수 있을 것 같다.

소학회에서 한 프로젝트인 주가예측프로그램 만들기 그리고

전공 수업인 캡스톤1에서 했던 온라인 쇼핑몰에서 소비자를 겨냥한 패션 마케팅 전략 : 추구하는 style별 옷 소비에 미치는 영향탐구 라는 주제로 프로젝트, 

그리고 프로젝트 말고도 친구들과 함께 빅콘테스트라는 데이터 활용 아이디어 리그 공모전에 나갔다. 물론 수상하진 못했지만 본선에 나가 발표까지 하고 왔다.

1학년 때 한 활동들이라 그런지 썩 결과물이 좋지는 않다. 

 

먼저 나는 2022년 서울여자대학교 데이터사이언스학과에 입학했다. 

그러고는 데이터사이언티스트 직군 소학회인 디솝에 들어가게 되었는데

이유는 과학생회를 하고 있었는데 학생회 언니들이 모두 소학회를 하고 있었기 때문이다.

나는 그래서 소학회를 꼭 해야하구나 라는 생각을 가지게 되었다.

우리 학교에는 직군 별로 소학회가 4개로 나누어져있는데 소학회를 찾던 중 제일 먼저 공고가 올라온 소학회가 디솝이었다 그렇게 디솝에 지원하게 되었다.

수시 원서를 쓰면서 데이터사이언스학과를 처음 알게 된 나는 당연히 데이터 사이언티스트니 데이터 애널리스트니 데이터 엔지니어니 희망 직군도 없었고 애초에 무엇을 하는지도 몰랐다 면접 하루 전날에 유튜브에서 데이터사이언티스트 관련 영상만 30개는 본 것 같다.

그렇게 벼락치기 학습 하고 면접을 보고 소학회에 참여하게 되었다.

2022년에는 올해와 달리 1학기는 머신러닝, 파이썬 스터디 2학기 때 위다 프로젝트라는 이름으로 자기가 하고 싶은 주제를 발표한 뒤 소학회원들 끼리 공통된 관심사나 선호 하는 주제를 찾아 팀을 구성하는 방식으로 팀을 짰다.

나는 우리과 선배와 수학과에서 데이터과학 연계전공을 하고 있는 언니 그리고 나 3명이서 팀을 구성하게 되었다. 

우리가 팀을 이루게 된 계기는 금융이라는 관심사 때문이었고 우리 과 선배가 발표한 주제인 주가 예측 프로그램 구현을 목표로 프로젝트를 진행하였다. 

또 서울여자대학교 데이터사이언스학과는 1학년 2학기 커리큘럼에 캡스톤디자인1이라는 수업이있다. 처음에 캡스톤을 할 땐 아는게 없는 상태에서 대체 뭘 할 수 있지 ? 라는 생각으로 가득찼지만 캡스톤을 하는 과정에서 정말 많이 배웠고 현재 나는 캡스톤을 통해 데이터사이언스에서 ㄷ 정도는 아는 수준이 되었지 않나 싶다 5프로 정도 감만 잡았다는 소리다.

캡스톤디자인1 수업에서는 패션에 관심이 많은 동기 언니와 함께 온라인 쇼핑몰에서 <소비자를 겨냥한 패션 마케팅 전략 : 추구하는 style별 옷 소비에 미치는 영향탐구> 라는 주제로 프로젝트를 진행하였다. 1학년 수업인 만큼 당연히 결과물은 데이터 수집 까지였다. 

21년도에는 전처리까지라 들었는데 22년도에도 전처리까지 해야했으면 아마 우리팀은 결과물이 없었을 것이다. 

왜냐하면 수집된 데이터를 spss돌렸을 때 결과물을 차마 말할 수 없을 정도로 우리가 수집한 데이터들은 엉망이었다. 

지금도 모르긴 하지만 하고자 하는 분석에 맞게 가공을 어떻게 해야하는지도 모르고 교육용 데이터로 실습밖에 안 해봤기에 그냥 일단 수집한 데이터를 엑셀로 정리해 csv파일로 만드는게 최선이었다. 

아무튼 다행히 우리는 데이터 수집과정까지 였기에 에이쁠을 성취할 수 있었다 

서론을 너무 길게 적은 느낌이 없지 않아 있지만 지각 에세이는 8천자이기에 여기까지 쓰고 이제 내가 했던 프로젝트에 대해 상세히 서술해보도록 하겠다.

먼저 우리는 <파이썬으로 배우는 금융 분석> 이라는 책을 통해 스터디를 먼저 하였는데 

18년도 저서기에 업데이트 되어 작동되지 않는 모듈이 너무 많았다 그렇기에 <금융 파이썬 쿡북> 이라는 저서를 통해 다시 스터디를 시작하였다 우리 팀은 백테스팅 기법을 이용해 투자 전략을 최적화하고 개선하고자 하였는데 백테스팅 시물레이션 방법 가이드도 상세히 적혀있었기에 이 저서를 통해 다시 스터디를 해보았다. 중간발표 까지의 우리 주제는 과거 주가 데이터를 수집해 미래 수익률을 예측 해보는 것이었는데

사진처럼 어떤 모델을 쓸지만 장황히 설정하고 너무 넓은 주제를 설정했었다.

먼저 나는 2022년 서울여자대학교 데이터사이언스학과에 입학했다. 

그러고는 데이터사이언티스트 직군 소학회인 디솝에 들어가게 되었는데

이유는 과학생회를 하고 있었는데 학생회 언니들이 모두 소학회를 하고 있었기 때문이다.

나는 그래서 소학회를 꼭 해야하구나 라는 생각을 가지게 되었다.

우리 학교에는 직군 별로 소학회가 4개로 나누어져있는데 소학회를 찾던 중 제일 먼저 공고가 올라온 소학회가 디솝이었다 그렇게 디솝에 지원하게 되었다.

수시 원서를 쓰면서 데이터사이언스학과를 처음 알게 된 나는 당연히 데이터 사이언티스트니 데이터 애널리스트니 데이터 엔지니어니 희망 직군도 없었고 애초에 무엇을 하는지도 몰랐다 면접 하루 전날에 유튜브에서 데이터사이언티스트 관련 영상만 30개는 본 것 같다.

그렇게 벼락치기 학습 하고 면접을 보고 소학회에 참여하게 되었다.

2022년에는 올해와 달리 1학기는 머신러닝, 파이썬 스터디 2학기 때 위다 프로젝트라는 이름으로 자기가 하고 싶은 주제를 발표한 뒤 소학회원들 끼리 공통된 관심사나 선호 하는 주제를 찾아 팀을 구성하는 방식으로 팀을 짰다.

나는 우리과 선배와 수학과에서 데이터과학 연계전공을 하고 있는 언니 그리고 나 3명이서 팀을 구성하게 되었다. 

우리가 팀을 이루게 된 계기는 금융이라는 관심사 때문이었고 우리 과 선배가 발표한 주제인 주가 예측 프로그램 구현을 목표로 프로젝트를 진행하였다. 

또 서울여자대학교 데이터사이언스학과는 1학년 2학기 커리큘럼에 캡스톤디자인1이라는 수업이있다. 처음에 캡스톤을 할 땐 아는게 없는 상태에서 대체 뭘 할 수 있지 ? 라는 생각으로 가득찼지만 캡스톤을 하는 과정에서 정말 많이 배웠고 현재 나는 캡스톤을 통해 데이터사이언스에서 ㄷ 정도는 아는 수준이 되었지 않나 싶다 5프로 정도 감만 잡았다는 소리다.

캡스톤디자인1 수업에서는 패션에 관심이 많은 동기 언니와 함께 온라인 쇼핑몰에서 <소비자를 겨냥한 패션 마케팅 전략 : 추구하는 style별 옷 소비에 미치는 영향탐구> 라는 주제로 프로젝트를 진행하였다. 1학년 수업인 만큼 당연히 결과물은 데이터 수집 까지였다. 

21년도에는 전처리까지라 들었는데 22년도에도 전처리까지 해야했으면 아마 우리팀은 결과물이 없었을 것이다. 

왜냐하면 수집된 데이터를 spss돌렸을 때 결과물을 차마 말할 수 없을 정도로 우리가 수집한 데이터들은 엉망이었다. 

지금도 모르긴 하지만 하고자 하는 분석에 맞게 가공을 어떻게 해야하는지도 모르고 교육용 데이터로 실습밖에 안 해봤기에 그냥 일단 수집한 데이터를 엑셀로 정리해 csv파일로 만드는게 최선이었다. 

아무튼 다행히 우리는 데이터 수집과정까지 였기에 에이쁠을 성취할 수 있었다 

서론을 너무 길게 적은 느낌이 없지 않아 있지만 지각 에세이는 8천자이기에 여기까지 쓰고 이제 내가 했던 프로젝트에 대해 상세히 서술해보도록 하겠다.

먼저 우리는 <파이썬으로 배우는 금융 분석> 이라는 책을 통해 스터디를 먼저 하였는데 

18년도 저서기에 업데이트 되어 작동되지 않는 모듈이 너무 많았다 그렇기에 <금융 파이썬 쿡북> 이라는 저서를 통해 다시 스터디를 시작하였다 우리 팀은 백테스팅 기법을 이용해 투자 전략을 최적화하고 개선하고자 하였는데 백테스팅 시물레이션 방법 가이드도

소학회 결석 에세이를 쓰는 겸 1학년 때 진행 했던 프로젝트에 대해 작성해보도록 하겠다. 

작년에 해본 활동이라고는 크게 3가지 정도로 적을 수 있을 것 같다.

소학회에서 한 프로젝트인 주가예측프로그램 만들기 그리고

전공 수업인 캡스톤1에서 했던 온라인 쇼핑몰에서 소비자를 겨냥한 패션 마케팅 전략 : 추구하는 style별 옷 소비에 미치는 영향탐구 라는 주제로 프로젝트, 

그리고 프로젝트 말고도 친구들과 함께 빅콘테스트라는 데이터 활용 아이디어 리그 공모전에 나갔다. 물론 수상하진 못했지만 본선에 나가 발표까지 하고 왔다.

1학년 때 한 활동들이라 그런지 썩 결과물이 좋지는 않다. 

 

먼저 나는 2022년 서울여자대학교 데이터사이언스학과에 입학했다. 

그러고는 데이터사이언티스트 직군 소학회인 디솝에 들어가게 되었는데

이유는 과학생회를 하고 있었는데 학생회 언니들이 모두 소학회를 하고 있었기 때문이다.

나는 그래서 소학회를 꼭 해야하구나 라는 생각을 가지게 되었다.

우리 학교에는 직군 별로 소학회가 4개로 나누어져있는데 소학회를 찾던 중 제일 먼저 공고가 올라온 소학회가 디솝이었다 그렇게 디솝에 지원하게 되었다.

수시 원서를 쓰면서 데이터사이언스학과를 처음 알게 된 나는 당연히 데이터 사이언티스트니 데이터 애널리스트니 데이터 엔지니어니 희망 직군도 없었고 애초에 무엇을 하는지도 몰랐다 면접 하루 전날에 유튜브에서 데이터사이언티스트 관련 영상만 30개는 본 것 같다.

그렇게 벼락치기 학습 하고 면접을 보고 소학회에 참여하게 되었다.

2022년에는 올해와 달리 1학기는 머신러닝, 파이썬 스터디 2학기 때 위다 프로젝트라는 이름으로 자기가 하고 싶은 주제를 발표한 뒤 소학회원들 끼리 공통된 관심사나 선호 하는 주제를 찾아 팀을 구성하는 방식으로 팀을 짰다.

나는 우리과 선배와 수학과에서 데이터과학 연계전공을 하고 있는 언니 그리고 나 3명이서 팀을 구성하게 되었다. 

우리가 팀을 이루게 된 계기는 금융이라는 관심사 때문이었고 우리 과 선배가 발표한 주제인 주가 예측 프로그램 구현을 목표로 프로젝트를 진행하였다. 

또 서울여자대학교 데이터사이언스학과는 1학년 2학기 커리큘럼에 캡스톤디자인1이라는 수업이있다. 처음에 캡스톤을 할 땐 아는게 없는 상태에서 대체 뭘 할 수 있지 ? 라는 생각으로 가득찼지만 캡스톤을 하는 과정에서 정말 많이 배웠고 현재 나는 캡스톤을 통해 데이터사이언스에서 ㄷ 정도는 아는 수준이 되었지 않나 싶다 5프로 정도 감만 잡았다는 소리다.

캡스톤디자인1 수업에서는 패션에 관심이 많은 동기 언니와 함께 온라인 쇼핑몰에서 <소비자를 겨냥한 패션 마케팅 전략 : 추구하는 style별 옷 소비에 미치는 영향탐구> 라는 주제로 프로젝트를 진행하였다. 1학년 수업인 만큼 당연히 결과물은 데이터 수집 까지였다. 

21년도에는 전처리까지라 들었는데 22년도에도 전처리까지 해야했으면 아마 우리팀은 결과물이 없었을 것이다. 

왜냐하면 수집된 데이터를 spss돌렸을 때 결과물을 차마 말할 수 없을 정도로 우리가 수집한 데이터들은 엉망이었다. 

지금도 모르긴 하지만 하고자 하는 분석에 맞게 가공을 어떻게 해야하는지도 모르고 교육용 데이터로 실습밖에 안 해봤기에 그냥 일단 수집한 데이터를 엑셀로 정리해 csv파일로 만드는게 최선이었다. 

아무튼 다행히 우리는 데이터 수집과정까지 였기에 에이쁠을 성취할 수 있었다 

서론을 너무 길게 적은 느낌이 없지 않아 있지만 지각 에세이는 8천자이기에 여기까지 쓰고 이제 내가 했던 프로젝트에 대해 상세히 서술해보도록 하겠다.

먼저 우리는 <파이썬으로 배우는 금융 분석> 이라는 책을 통해 스터디를 먼저 하였는데 

18년도 저서기에 업데이트 되어 작동되지 않는 모듈이 너무 많았다 그렇기에 <금융 파이썬 쿡북> 이라는 저서를 통해 다시 스터디를 시작하였다 우리 팀은 백테스팅 기법을 이용해 투자 전략을 최적화하고 개선하고자 하였는데 백테스팅 시물레이션 방법 가이드도 상세히 적혀있었기에 이 저서를 통해 다시 스터디를 해보았다. 중간발표 까지의 우리 주제는 과거 주가 데이터를 수집해 미래 수익률을 예측 해보는 것이었는데

사진처럼 어떤 모델을 쓸지만 장황히 설정하고 너무 넓은 주제를 설정했었다.

에세이를 쓰기 위해 프로젝트했던 카톡방에 들어가 우리가 어떻게 뭘 했는지 살펴보고 있는데 기억이 잘 나진 않지만 발표 때 질문 받으면 답하려고 개념 하나하나 정리해서 공유했었던 것 같다. 공유 해보자면 

 

-SMA, EMA

EMA 메서드 : 지수 이동 평균, 

SMA 메서드 : 단순 이동 평균

 

EMA 메서드가 SMA 메서드보다 훨씬 빠르게 가격변동에 적응한다. (실제 주식 흐름과 더 유사하다는 뜻)

 

- VIX 지수

https://www.cmegroup.com/ko/insights/economic-research/2022/could-vix-yield-curve-cycle-predict-next-recession.html 

제시한 지표는 정적/동적 프로빗 모델을 모두 활용하여 표본내 및 표본외에서 1990~2021년의 미국 경기침체를 예측하는 데 있어 수익률곡선 스프레드보다 훨씬 높은 적중률을 보입니다. VIX-수익률곡선 사이클은 다른 주요 경제지표를 능가하는 예측력도 보여줍니다.

 

의미 : 주식시장 변동성지수, 공포지수, 시장의 기대심리 지수

투자 시장에서는 투자자들의 심리적 요인이 많이 작용하여  시장 가격의 변동성을 바탕으로 시장의 투자 심리를 분석한다.

 

시장에서 변동성이 크다는 것은 시장에서 결정되는 가격의 변화가 크게 나타날 수 있음을 의미함. 

 

-> 상승/하락 추세 또는 안정상태를 확인하기 위해 변화 양상을 관찰할 수 있다. 

 

VIX지수는 증시 지수와 반비례 경향.

VIX지수 상승, 주가 하락

VIX지수 하락 또는 안정세, 주가 상승

 

 

- Step-down 형 ELS

    -ELS는 주가연계증권, 주가와 연계되어 수익률이 결정되는 금융상품. /개별 주식 혹은 주가지수 등의 기초자산의 가격과 연계하여 미리 정해진 방법으로 투자 수익이 결정되는 증권으로서 법적 용어가 아닌 실무적,관행적으로 사용되는 용어

 

ELS는 원금 보장 여부에 따라 원금보장 ELS와 원금비보장 ELS로, 발행 방식에 따라 공모 ELS, 사모 ELS로 나눌 수 있다. 또한 내재된 이 색 옵션(Exotic Option)의 종류에 따라 낙아웃(knock-out)형, 불 스프레 드(Bull Spread)형, 리버스 컨버터블(Reverse Convertible)형, 디지털 (Digital)형, 그리고 최근 가장 많이 발행되고 있는 조기상환 스텝다운 (Step-Down)형 등으로 분류할 수 있다

 

ELS의 종류를 적용하는 시스템 설계는 매우 복잡하고 효율성이 떨 어질 것이라 판단하였다. 따라서 본 연구에서는 가장 비중이 큰 ELS 상 품인 Step-Down형이며 지수형인 ELS를 대상으로 시스템을 구현하였다.( slow down 형 사용 이유)

투자 기간에 상환평가일마다 일정한 조기상환 조건을 충족시키면 제시된 수익률을 얻는 구조이며, 조기상환 조건이 계단식으로 낮아지는 특징이 있습니다. 조기상환 조건보다 낮은 구간에 낙인 배리어(Knock-In Barrier)가 있으며, 만기 전까지 조기상환 조건을 충족시키지 못했어도, 기초자산 가치가 낙인 배리어 아래로 떨어진 적이 없으면 제시된 수익률을 얻을 수 있습니다. 투자 기간에 기초자산의 가치가 낙인배리어 아래로 떨어진 적이 있어도, 만기 전까지 모든 기초자산이 상환조건을 만족할 정도로 반등한다면 원금 및 제시된 수익률을 얻을 수 있습니다.

 

 

Max-Return and Min-Risk,

    -구성 종목 간의 분산을 최소화시키는 마코위츠 모델의 안정성을 포함하면서 그와 동시에 수익률 또한 최대화하는 방법. 이 모델의 목적함수는 종목 간 공분산을 분모로 설정하고 포트폴리오 기대수익률을 분자로 설정하고 이를 최대화킨다.

 

Entering/ Leaving Rule모델

    -포트폴리오 모델링의 업그레이드 측면에서는 수익률이 저조한 종목을 포트폴리오

에서 제외시키고 이 종목과 유사도가 가장 낮은 새로운 종목을 포함시키는 방법. 개별종목 최소기대수익률(k)에 부합하지 않는 종목을 Leaving시킨다. 그리고 전체종목 중 그 종목과 가장 유사도가 낮은 종목을 선택하여 포트폴리오 구성종목에 Entering시킨다.

 

 

Semi-Supervised Learning알고리즘

    -다양한 금융지표 간의 인과적 복잡성 및 상호연관성을 네트워크로 표현하여 주가를 예측한다.  전체 데이터 n개 중에서 1개의 레이블이 있는 데이터, n-1개의레이블이 정해지지 않은 데이터를 사용한다. 각 지표들간의 상관성 및 인과관계를 나타내는 것은 유사행렬 W를 사용한다. 유사행렬 W를 만드는 방법으로는 주로 KNN 또는 일정 반경 내에서의 유클리드 거리를 활용한 방법이 주로 사용된다.

 

GBM(기하브라운운동, 주가 수익률분포는 정규분포로 가정) 모형

 

ARIMA 모델

    -시계열 데이터 기반 분석 기법으로 과거지식이나 경험을 바탕으로 한 행동에 따라 경제가 움직이고 있음을 기초로 한다. ARIMA 모델은 정상성이 아닌 데이터를 차분이라는 개념을 통해 정상성을 교정하여 좀더 나은 예측을 가능하게 한다.

 

LSTM 모델

    -주가와 같은 시계열 데이터셋에서 효과적인 딥러닝 모델 중 하나. lstm 모델은 데이터의 정상성을 교정하지 않아도 된다는 장점이 있다. 그러나 직관적인 예측결과를 낼수있어("28일의 주식가격 어떻게 될거같냐고" 물어보시면 "27일의 주식가격이랑 같습니다" 라고 답변) 그를 보완하기 위한 다른 방법들을 고안해야할듯

만약 lstm모델을 사용한다면 keras라이브러리를 통해 사용할 예정

 

 

Logistic Regression (LR)

: 독립 변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는 데 사용되는 통계 기법

ex)특정기간 동안 몇 번이나 주가가 상승했는지 확인하고 연속 상승하는 여부를 고려하여 모델 형성 가능. 모델 성능 확인

https://aplab.tistory.com/entry/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EB%A1%9C%EC%A7%80%EC%8A%A4%ED%8B%B1-%ED%9A%8C%EA%B7%80%EB%B6%84%EC%84%9D 

Decision Tree (DT)

https://stock79.tistory.com/entry/%EC%8B%A4%EC%A0%84-%ED%88%AC%EC%9E%90-%EC%A0%84%EB%9E%B5-28-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98kNN-SVM-Decision-tree%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-%EC%A0%88%EB%8C%80%EC%88%98%EC%9D%B5-%EC%A0%84%EB%9E%B53 

: 각 데이터들이 가진 속성들로부터 패턴을 찾아내서 분류 과제를 수행할 수 있도록 하는 지도학습 머신러닝 모델

이렇게 특정 기준(질문)에 따라 데이터를 구분하는 모델

 

K-nearest neighbors(K-NN)

 

Random Forest(RF)

장점 : 직관적인 이해가 가능

단점 : 과거 데이터에 최적화된 구조, 새로운 데이터가 들어왔을 때 정확도가 떨어질 수 있음. Decision tree모델의 학습 데이터 일부와 여러 개의 학습 데이터 셋을 만들고 가장 높은 가능성을 보이는 쪽으로 분류 (편향 유지, 분산 감소 -> 정확도가 높아짐) 

Extreme Gradient Boosting(XGBoost)

여러 개의 decision tree를 조합해서 사용하는 ensemble 알고리즘.

(ensemble이란 여러 개의 모델을 조합해서 정확도를 높이는 방법. ) 

(boosting - ensemble에서 모델들을 조합하는 방식. 어떤 한 모델의 결과값 중에서 예측이 잘못된 값들에 대해 가중치를 반영하여 다음 모델에 입력함. )

 

https://superhky.tistory.com/87 

 

 

액면분할 : 주식의 액면가격을 일정 비율로 분할해 주식 수를 늘리는 것. 납입자본금의 증감없이 기존 발행주식을 일정 비율로 분할해 발행주식의 총 수를 늘리는 방식. 

 

수정주가 : 이전 주가와 현재의 주가를 비교할 때 주가에 연속성을 부여해야하는데 여기서 수정된 주가를 수정주가라고 함. 유상ㆍ무상 증자나 액면 분할 따위가 실시될 경우에 나타나는 주식 가격의 차이를 수정한 주가

 

하지만 교수님 말고는 질문이 없었다. 하지만 정말 이해가 됐다 왜냐하면 나도 중간발표까지 이해를 제대로 못했기 때문이다. 투자를 한 번도 안 해봐서 투자가 어떻게 돌아가는지 시장이 열리는 시간이 있고 닫히는 시간이 있는지 프로젝트를 통해 처음 알았다. 나는 주식이 24시간 편의점처럼 그냥 24시간 동안 번개장터 플미마냥 비싸게 팔고 싸게 팔고 환율 마냥 바뀌는 줄 알았다. 

아무튼 이렇게 중간발표를 끝내고 교수님이 주신 피드백을 공유해보면 

 

논문내 사용한 데이터 개수 비교 (공정한 비교위해)

투자전략을 잘 세우기위한 가설 ?

백테스팅 스터디 더 필요해보임 (연구 프로세스 등)

전략을 세워보면 하고자하는 게 더 명확해질듯

논문 찾을 때 목적성 생길듯

디테일한 전략

방향이잡히면 좋겠다

 

논문 전에 텍스트북이 필요

금융 도메인

 

예측과 백테스팅은 다름

백테스팅 과거를 기반으로 투자전략 싸는 것 

포트폴리오 구성 전략 = 투자 전략

전략으로 얼마만한 수익률을 얻느냐

 

발표내에서는 주식예측

 

모델 > 지수 예측 ?

백테스팅을 위해서는 투자 전략을 만드는 것

 

1. 기초적인 공부가 조금 더 

2. 배경이론 후 목표 (백테스팅 (전략후 수익률높), 가격 거래량 종가등 다양한 지표를 예측하고싶은지) 선택후 어떤 모델을 적용할 수 있을지 봐야됨 (예측과 전략은 모델이 다름) 공부 하다보면 논문이 보일듯 (한계점을 꼽고 한계점을 보완)

 

디솝 wida 피드백

 

- 데이터개수 동일하게 맞춰보고 비교

 

- 연구 프로세스를 잘 맞춰보자. 어떤 전략을 세울거냐 

 

 

- 공부(백테스팅할 건지, 지수예측할 건지)

 

- Lstm xgboost 지수예측 (데이터-종가) -과거데이터,미래데이터 

 

백테스팅 - 과거데이터,투자전략 (수익률)

 

1.공부

2.논문

3.한계점 찾기

4.모델구현

 

-발표할 때 금융 설명 더 필요할 듯

 

정리를 하지 않고 쓴 거라 보기 불편할 수도 있지만 일단 옮겨봤다. 

 

카톡방을 보면서 느꼈는데 정말 열심히 했던 것 같다. 근데 결과물이 썩 좋지 않은 이유는 우리가 잘 알고 있던 분야도 아니었고 금융 자체가 공부해야할 양이 많았고 분석기법을 잘 아는 것도 아니었고 팀이 2학년 1명 신입생 1명 연전생 1명 나는 기말 발표를 잘 끝낸 것 만으로 너무 만족하고 너무 많이 배운 프로젝트라 만족한다. 그냥 짧게 줄이면 역량 부족이다.

 

아무튼 우리는 중간 발표 피드백을 거치고 열심히 다시 소학회 활동을 한 후 

최종 발표를 하게 되었다. 

 

우리의 처음 주제는 과거 주가데이터를 수집해 백테스팅 전략을 세워 미래 주가 수익률을 높여본다였는데 피드백 후 우리는 새로운 투자전략을 만드는 것을 할지 모델을 사용해 주가 예측을 해볼지 고민을 하다가 아무래도 역량의 문제로 주가 예측을 하기로 했다 하지만 그냥 주가 예측만 해서는 의미가 없을 것 같아서 뉴스 이슈 분석도 함께 해보았다. 기업 관련, 분야 관련 뉴스를 분석해 주가를 예측해보겠다는 취지였다. 

RNN, LSTM, ARIMA 총 3가지 모델을 사용했는데

중간 발표에서 너무 모델을 남용하지 않냐는 대체 뭘 하고 싶은지 모르겠다는 피드백을 들었음에도 왜 모델을 3가지를 사용 했냐면 오류 해결을 하지 못했기 때문이다.

제대로 끝까지 돌아간 것은 아리마 하나 뿐이었다. 우리는 세가지를 사용했지만 결국 하나가 되어버렸다. 

아무튼 아리마 모델을 활용해 주가를 예측하고 뉴스 크롤링를 통해 데이터를 수집한 후 매수 매도 시점에서의 이슈 분석을 했다. 

우리가 세운 가설은

가설1: 매수 시점에서 하루 전날 긍정적인 단어의 빈도수가 더 많을 것이다.

가설2: 매도 시점에서 하루 전날 부정적인 단어의 빈도수가 더 많을 것이다.

이렇게 되는데 이미있는 결과값을 내지 못했다. 아마도 빈도수로 설정한 문제가 있는 것 같다. 아무래도 기업의 이슈가 터졌어도 한 이슈당 뉴스 기사가 600개 되는 것도 아니고 큰 의미를 얻긴 힘들었고 또 접속사같은 것들만 제거를 하고 분석을 한 원인도 있는 것 같다. 

왜냐하면 이슈 분석 결과값에 주가, 거래, 흐름, 보증 이러한 단어들 위주로만 추출되었기 때문이다.

 

아무튼 결과물이 썩 좋지 않았지만 소학회는 끝이 났고 아쉽지만 프로젝트는 이렇게 끝났다.

벌써 8000자를 다 채웠다. 

나중에 지각이나 결석을 해 또 에세이를 쓰게 되는 날이 온다면 캡스톤 디자인1에서 했던 프로젝트와 공모전에 제출한 프로젝트에 대해 서술해보도록 하겠다.

 

 

 

 

 

'에세이 > 결석에세이' 카테고리의 다른 글

결석에세이_강구슬  (3) 2024.09.19
결석에세이_김규의  (0) 2024.07.15
결석에세이_김윤아  (0) 2024.04.12
결석에세이_허서원  (0) 2023.07.14
결석 에세이_이유진  (1) 2023.05.21