섀플리 값 추정을 이용한 주가 변화 원인 설명 문장 분류 모델 분석Model Analysis using Estimation of Shapley Value on Classification of Sentences Explaining Causes of Changes in Stock Prices
최근 인공지능 기술의 발전으로 투자 자동화가 이루어지고 있지만, 투자자가 인공지능의 주가예측 결과를 이해하고 판단 내리기는 더욱 어려워졌다. 따라서 투자자가 이해할 수 있도록 주가예측에 대한 원인 설명 제공이 필요하다. 이를 위해 본 연구에서는 기업이 제공하는 공시보고서에서 주가 상승 및 하락의 이유를 설명하는 문장 데이터를 수집 후 분류한다. 해당 데이터를 다항 분포 나이브 베이즈 분류, 로지스틱 회기, LSTM, 양방향 LSTM, 주의 LSTM 및 주의 양방향 LSTM 모델에 적용한 후 성능을 비교하였다. 또한, 각 학습모델의 의사 결정이 인간의 이유 설명 판단과 유사한지 판단하기 위해 나이브 베이즈 모델과 SHAP을 이용하여 분석하였다. 그 결과, 주의 양방향 LSTM 모델이 인간의 판단과 가장 유사한 것으로 나타났다.