한국어 트윗의 문체 기반 자질 분석을 통한 연령대 예측 Age Prediction from Korean Tweets with Style-based Feature Analysis

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 360
  • Download : 1
주어진 글로부터 문체를 분석하여 글쓴이를 파악하는 일을 저자 판별이라 한다. 최근 저자 판별은 인터넷의 보편화로 인해 저자가 알려진 많은 글들에 접근 할 수 있게 됨에 따라, 대량의 글에서 집단의 문체를 분석해서 예측하는 방향으로 발달하고 있는데, 그 중에서 활발하게 진행되고 있는 방향 중 하나가 연령대에 따른 분석이다. 이에 따라 본 논문에서는 한국어 트윗(트위터에서 사용하는 글의 단위)을 대상으로 연령대에 따라 어떤 경향을 나타내는지를 이모티콘, 자모의 나열, 비문법적인 표현의 빈도를 토대로 분석한 뒤, 저자들의 연령대를 예측 하여 10-20 대와 30-40 대에서 0.75 이상의 비교적 높은 정확도를 보였다.
Publisher
HCI 학회
Issue Date
2012-01
Language
Korean
Citation

HCI 2012 학술대회, pp.177 - 180

URI
http://hdl.handle.net/10203/170466
Appears in Collection
CS-Conference Papers(학술회의논문)
Files in This Item

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0