증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용한 공모주의 상장 이후 주가 등락 예측The prediction of the stock price movement after IPO using machine learning and text analysis based on TF-IDF

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 74
  • Download : 0
DC FieldValueLanguage
dc.contributor.author양수연ko
dc.contributor.author이채록ko
dc.contributor.author원종관ko
dc.contributor.author홍태호ko
dc.date.accessioned2022-12-11T05:03:05Z-
dc.date.available2022-12-11T05:03:05Z-
dc.date.created2022-12-11-
dc.date.created2022-12-11-
dc.date.issued2022-06-
dc.identifier.citation지능정보연구, v.28, no.2, pp.237 - 262-
dc.identifier.issn2288-4866-
dc.identifier.urihttp://hdl.handle.net/10203/302715-
dc.description.abstract본 연구는 개인투자자들의 투자의사결정에 도움을 주고자, 증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용해 공 모주의 상장 5거래일 이후 주식 가격 등락을 예측하는 모델을 제시한다. 연구 표본은 2009년 6월부터 2020년 12월 사이 에 신규 상장된 691개의 국내 IPO 종목이다. 기업, 공모, 시장과 관련된 다양한 재무적 및 비재무적 IPO 관련 변수와 증 권신고서의 어조를 분석하여 예측했고, 증권신고서의 어조 분석을 위해서 TF-IDF (Term Frequency - Inverse Document Frequency)에 기반한 텍스트 분석을 이용해 신고서의 투자위험요소란의 텍스트를 긍정적 어조, 중립적 어조, 부정적 어조 로 분류하였다. 가격 등락 예측에는 로지스틱 회귀분석(Logistic Regression), 랜덤 포레스트(Random Forest), 서포트벡터 머신(Support Vector Machine), 인공신경망(Artificial Neural Network) 기법을 사용하였고, 예측 결과 IPO 관련 변수와 증 권신고서 어조 변수를 함께 사용한 모델이 IPO 관련 변수만을 사용한 모델보다 높은 예측 정확도를 보였다. 랜덤 포레스 트 모형은 1.45%p 높아진 예측 정확도를 보였으며, 인공신공망 모형과 서포트벡터머신 모형은 각각 4.34%p, 5.07%p 향 상을 보였다. 추가적으로 모형간 차이를 맥니마 검정을 통해 통계적으로 검증한 결과, 어조 변수의 유무에 따른 예측 모형 의 성과 차이가 유의확률 1% 수준에서 유의했다. 이를 통해, 증권신고서에 표현된 어조가 공모주의 가격 등락 예측에 영 향을 미치는 요인이라는 것을 확인할 수 있었다.-
dc.languageKorean-
dc.publisher한국지능정보시스템학회-
dc.title증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용한 공모주의 상장 이후 주가 등락 예측-
dc.title.alternativeThe prediction of the stock price movement after IPO using machine learning and text analysis based on TF-IDF-
dc.typeArticle-
dc.type.rimsART-
dc.citation.volume28-
dc.citation.issue2-
dc.citation.beginningpage237-
dc.citation.endingpage262-
dc.citation.publicationname지능정보연구-
dc.identifier.kciidART002854902-
dc.contributor.localauthor양수연-
dc.contributor.nonIdAuthor이채록-
dc.contributor.nonIdAuthor원종관-
dc.contributor.nonIdAuthor홍태호-
dc.description.isOpenAccessN-
dc.subject.keywordAuthor주가 예측-
dc.subject.keywordAuthorIPO-
dc.subject.keywordAuthorTF-IDF-
dc.subject.keywordAuthor기계학습-
dc.subject.keywordAuthor어조 텍스트 분석-
dc.subject.keywordAuthorStock Price Prediction-
dc.subject.keywordAuthorIPO-
dc.subject.keywordAuthorTF-IDF-
dc.subject.keywordAuthorMachine Learning-
dc.subject.keywordAuthorTone Analysis-
Appears in Collection
RIMS Journal Papers
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0