사회 지표와 연관된 토픽모델Associated topic model with social measurement

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 645
  • Download : 0
토픽 모델링은 대량의 텍스트 분석을 모델링 하는데 있어서 효율적인 도구이다. 몇몇의 과거의 연구들은 이러한 토픽 모델링 방법을 이용하여 특정 수치 지표인 시 계열 데이터와의 연관성을 분석하였지만, 토픽 모델링을 텍스트의 전처리 과정에서만 이용함으로써 몇몇 한계점을 드러내었다. 이러한 문제를 해결하기 위하여 본 논문에서는 특정 사회지표와 텍스트 데이터를 함께 확률 모델링을 한 사회 지표와 연관된 토픽 모델(ATMs)을 제시한다. 제시된 ATMs을 이용함으로써 텍스트 내부에 존재하는 사회 지표와 연관된 토픽을 추출하는 것뿐만이 아니라 토픽과 사회지표가 가진 비례 혹은 반비례 관계를 추출하고 그 영향력의 크기에 대한 정보도 얻을 수 있다. 모델의 평가와 응용을 위해서 경제 뉴스인 Bloomberg데이터와 주가 데이터인 DJIA를 적용한 결과, ATMs가 기존의 토픽모델링 방법보다 사회지표에 대한 높은 설명력을 가진 것을 확인하였다.
Advisors
문일철researcherMoon, Il-Chul
Description
한국과학기술원 : 산업및시스템공학과,
Publisher
한국과학기술원
Issue Date
2014
Identifier
568913/325007  / 020123271
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 산업및시스템공학과, 2014.2, [ v, 55 p. ]

Keywords

확률모델; Time Series Models; Topic modeling; Text mining; Probabilistic Graphical Model; 시계열 모델; 텍스트마이닝; 토픽모델링

URI
http://hdl.handle.net/10203/198095
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=568913&flag=dissertation
Appears in Collection
IE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0