위키피디아 스케일의 디비피디아 온톨로지 기반 개체명 코퍼스 구축 방법 연구 = A method for constructing wikipedia-scale named entity corpus based on dbpedia ontology

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 865
  • Download : 0
본 논문에서는 위키피디아 스케일의 개체명 코퍼스를 디비피디아 온톨로지를 활용하여 자동으로 구축하는 방법을 제안한다. 대부분의 개체명 인식 시스템은 학습 데이터로서 개체명 코퍼스를 요구하는데, 이는 비용과 시간을 많이 요구하는 어노테이션 작업을 요구한다. 특히 최근의 개체명 인식 시스템들은 다양한 개체명 분류체계를 사용하며, 다양한 도메인에 대한 개체명 인식을 요구한다. 그러나 기존에 존재하는 개체명 코퍼스들은 그 구축의 어려움 때문에 이러한 최근의 요구에 부합하지 못하는 것이 사실이며, 또한 공개된 코퍼스들의 경우에도 특정 언어에 대해서만 공개된 경우가 많아 연구의 어려움이 있는 것이 사실이다. 이러한 문제를 극복하기 위한 대안으로서, 개체명 코퍼스를 자동으로 구축하는 silver-standard 코퍼스 구축에 관한 연구가 제시되었다. 본 논문에서는 기존의 gold-standard코퍼스는 물론 기존의 silver-standard 코퍼스들이 갖고 있는 문제들을 분석하고, 이러한 문제들을 극복할 수 있는 silver-standard 코퍼스로서의 조건을 밝히고, 그 조건에 부합하는 코퍼스를 구축하여 공개한다.
Advisors
최기선researcherChoi, Key-Sun
Description
한국과학기술원 : 웹사이언스공학전공,
Publisher
한국과학기술원
Issue Date
2014
Identifier
569166/325007  / 020123762
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 웹사이언스공학전공, 2014.2, [ vi, 46 p. ]

Keywords

개체명 인식; 링크드 데이터; Corpus; Named Entity Recognition; 코퍼스; Linked Data

URI
http://hdl.handle.net/10203/197112
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=569166&flag=dissertation
Appears in Collection
WST-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0