문체 분석을 활용한 한국어 트위터 사용자의 연령대 및 성별 예측

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 465
  • Download : 1
DC FieldValueLanguage
dc.contributor.author김상채ko
dc.contributor.author박종철ko
dc.date.accessioned2013-03-29T11:45:36Z-
dc.date.available2013-03-29T11:45:36Z-
dc.date.created2012-07-13-
dc.date.created2012-07-13-
dc.date.issued2012-06-
dc.identifier.citation한국 컴퓨터 종합 학술대회, pp.303 - 305-
dc.identifier.urihttp://hdl.handle.net/10203/170467-
dc.description.abstract사람들은 주변의 영향을 받아 가면서 각자의 독특한 글쓰기 양식을 만들어간다. 따라서 같은 연령대와 성별을 가지는 사람들은 유사한 글쓰기 양식을 나타내는 경향이 있다. 이와 같은 가정을 바탕으로, 본 연구에서는 다양한 연령대와 성별의 사람들이 작성한 트윗의 문체를 분석하여 임의의 트윗을 작성한 저자의 연령대와 성별을 예측하는 실험을 진행하였다. 한국어 웹 언어에서 자주 보이는 표현들을 토대로 구성한 자질들과, 그에 비해 데이터와 관계가 적은 n-gram 단위의 자질들을 함께 사용하여 예측을 진행함으로써, 최대 공산 기준치보다 25%가량 높은 정확도를 보이는 예측 결과를 얻게 되었다. 이와 함께 각 자질 구성이 예측에 얼마나 효율적으로 기여하는지에 대한 이해도를 높일 수 있었다.-
dc.languageKorean-
dc.publisher한국정보과학회-
dc.title문체 분석을 활용한 한국어 트위터 사용자의 연령대 및 성별 예측-
dc.typeConference-
dc.type.rimsCONF-
dc.citation.beginningpage303-
dc.citation.endingpage305-
dc.citation.publicationname한국 컴퓨터 종합 학술대회-
dc.identifier.conferencecountryKO-
dc.identifier.conferencelocation휘닉스 아일랜드, 제주-
dc.embargo.liftdate9999-12-31-
dc.embargo.terms9999-12-31-
dc.contributor.localauthor박종철-
dc.contributor.nonIdAuthor김상채-
Appears in Collection
CS-Conference Papers(학술회의논문)
Files in This Item

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0