본문 바로가기

주식 데이터 모델링

딥러닝으로 캔들스틱 차트 이용해서 주식 예측 - 논문요약

Using Deep Learning Neural Networks and Candlestick Chart Representation to Predict Stock Market

 

 위의 제목을 한 논문이 있습니다. 이름부터 꽤 흥미가 있어서 논문을 읽어보았습니다. 

 

1. 소개와 이전연구

 

 논문의 주된 내용은 주식 데이터를 Candlestick chart로 바꿔서 딥러닝을 통해 학습 했다는 내용입니다. 그 이전에도 캔들스틱 차트를 이용해서 머신러닝, 인공신경망 등을 학습한 연구가 있었습니다. 최근에는 딥러닝을 통해 주식 시장을 예측할때, 뉴스 데이터, 재무 데이터, SNS에서 가져온 감정 데이터 등 주가 외의 데이터를 이용하는 경우도 많았습니다. 

 

 이 논문의 contribution은, 캔들스틱 차트를 데이터로 사용하고, 모델로는 여러가지 CNN 구조를 사용했다는 점 이라고 합니다. 

 

2. 모델의 구조

 

 이 논문은 'DeepCandle' 이라는 이름으로 서버를 공개해놓았습니다. 데이터를 가공하는 것 부터, 예측하는 것 까지 구현을 해두었죠. 또한 소스코드도 공개해놔서 확인할 수가 있습니다.

 

 

 위와 같습니다. 데이터를 캔들 스틱 차트 형태로 만들고, VGG, resnet 등의 모델을 통해 그 다음날 주가가 상승할지, 아닐지를 예측합니다. 그리고 대만과 인도네시아 주식 시장에서 테스트를 했을때는 무려 정확도가 92%.... 라고 합니다.

 

 

 캔들스틱 차트는 위에 보이는 그림처럼 보통 Open, High, Low, Close + (Volume) 데이터를 포함합니다. Volume을 포함하는지 안하는지, 차트에 포함 시킬 기간은 얼마인지, 그림 사이즈는 얼마로 설정할지를 두고 여러가지 실험을 진행했습니다.

 

3. 결론

 

 캔들 스틱 차트 이미지를 이용할 때 CNN이 짱이다. 왜냐면 CNN이 캔들 스틱 차트 내부의 패턴을 찾기 때문이다. 라고 합니다. 그리고 캔들스틱 차트에 거래량을 추가한다고 해서 딱히 도움이 되는 것 같지는 않다고 합니다. 그리고 이후 연구로는 주가의 움직임의 percentage를 예측하고자 한다고 합니다. 

 

 

4. 내 생각

 

 이쪽 논문을 천천히 살펴보고 있는 저로써는 캔들스틱 차트 이미지를 데이터로 사용한다는 점이 매우 흥미로웠습니다. 같은 주가 데이터라고 해도 1차원으로 나열한 데이터와 2차원 차트 이미지는 좀 다른 형태이고, 이쪽이 CNN을 적용시키는데 더 유리해보이기 때문입니다.

 

 제일 중요한 건 캔들스틱 차트 이미지를 어떤 방식으로 만드냐 인 것 같습니다. 캔들스틱 차트 이미지를 만들기 위해서 주식 데이터를 어떤 방식으로 정제 해야하는지, 며칠간의 데이터로 만들지, 이미지 크기는 어떻게 해야할지 등등을 고려해야할 것 같습니다. 또 논문에서는 예를 들어 50x50 이미지에 20일차의 데이터를 넣는다고 했을때, 이게 어떻게 50x50 이미지에 들어가는지...를 아직 잘 이해가 안되더라구요.

 

 그래서 향후에는 deep candle의 소스코드도 살펴보고, 다른 논문들도 살펴보고 해서 캔들 스틱 차트 이미지를 이용한 모델링을 시도해볼 생각 입니다!