Using Deep Learning Neural Networks and Candlestick Chart Representation to Predict Stock Market
위의 제목을 한 논문이 있습니다. 이름부터 꽤 흥미가 있어서 논문을 읽어보았습니다.
1. 소개와 이전연구
논문의 주된 내용은 주식 데이터를 Candlestick chart로 바꿔서 딥러닝을 통해 학습 했다는 내용입니다. 그 이전에도 캔들스틱 차트를 이용해서 머신러닝, 인공신경망 등을 학습한 연구가 있었습니다. 최근에는 딥러닝을 통해 주식 시장을 예측할때, 뉴스 데이터, 재무 데이터, SNS에서 가져온 감정 데이터 등 주가 외의 데이터를 이용하는 경우도 많았습니다.
이 논문의 contribution은, 캔들스틱 차트를 데이터로 사용하고, 모델로는 여러가지 CNN 구조를 사용했다는 점 이라고 합니다.
2. 모델의 구조
이 논문은 'DeepCandle' 이라는 이름으로 서버를 공개해놓았습니다. 데이터를 가공하는 것 부터, 예측하는 것 까지 구현을 해두었죠. 또한 소스코드도 공개해놔서 확인할 수가 있습니다.
위와 같습니다. 데이터를 캔들 스틱 차트 형태로 만들고, VGG, resnet 등의 모델을 통해 그 다음날 주가가 상승할지, 아닐지를 예측합니다. 그리고 대만과 인도네시아 주식 시장에서 테스트를 했을때는 무려 정확도가 92%.... 라고 합니다.
캔들스틱 차트는 위에 보이는 그림처럼 보통 Open, High, Low, Close + (Volume) 데이터를 포함합니다. Volume을 포함하는지 안하는지, 차트에 포함 시킬 기간은 얼마인지, 그림 사이즈는 얼마로 설정할지를 두고 여러가지 실험을 진행했습니다.
3. 결론
캔들 스틱 차트 이미지를 이용할 때 CNN이 짱이다. 왜냐면 CNN이 캔들 스틱 차트 내부의 패턴을 찾기 때문이다. 라고 합니다. 그리고 캔들스틱 차트에 거래량을 추가한다고 해서 딱히 도움이 되는 것 같지는 않다고 합니다. 그리고 이후 연구로는 주가의 움직임의 percentage를 예측하고자 한다고 합니다.
4. 내 생각
이쪽 논문을 천천히 살펴보고 있는 저로써는 캔들스틱 차트 이미지를 데이터로 사용한다는 점이 매우 흥미로웠습니다. 같은 주가 데이터라고 해도 1차원으로 나열한 데이터와 2차원 차트 이미지는 좀 다른 형태이고, 이쪽이 CNN을 적용시키는데 더 유리해보이기 때문입니다.
제일 중요한 건 캔들스틱 차트 이미지를 어떤 방식으로 만드냐 인 것 같습니다. 캔들스틱 차트 이미지를 만들기 위해서 주식 데이터를 어떤 방식으로 정제 해야하는지, 며칠간의 데이터로 만들지, 이미지 크기는 어떻게 해야할지 등등을 고려해야할 것 같습니다. 또 논문에서는 예를 들어 50x50 이미지에 20일차의 데이터를 넣는다고 했을때, 이게 어떻게 50x50 이미지에 들어가는지...를 아직 잘 이해가 안되더라구요.
그래서 향후에는 deep candle의 소스코드도 살펴보고, 다른 논문들도 살펴보고 해서 캔들 스틱 차트 이미지를 이용한 모델링을 시도해볼 생각 입니다!
'주식 데이터 모델링' 카테고리의 다른 글
간단한 모델링 코드 공유 - github (2) | 2019.12.15 |
---|---|
딥러닝으로 캔들스틱 차트 이용해서 주식 예측 - 예제코드 (10) | 2019.12.01 |
주식 정규화 전 EDA - 주식은 60일 거래일 동안 얼마나 오르고 떨어질까 (0) | 2019.10.31 |
시계열 데이터 분석에 딥러닝을 사용할 이유 3가지 (1) | 2019.10.26 |
LightGBM으로 주식 모델링 해보기 [머신러닝] - Classification, 머신러닝으로 모델링이 가능한가? (0) | 2019.10.25 |