DSpace at KOASAS: 한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소

DSpace at KOASAS

College of Engineering(공과대학)School of Computing(전산학부)CS-Conference Papers(학술회의논문)

한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소

Cited 0 time in webofscience

Cited 0 time in scopus

Hit : 471
Download : 29

Export

DC Field	Value	Language
dc.contributor.author	김영식	ko
dc.contributor.author	최기선	ko
dc.contributor.author	함영균	ko
dc.contributor.author	김지성	ko
dc.contributor.author	황도삼	ko
dc.date.accessioned	2016-07-13T04:38:01Z	-
dc.date.available	2016-07-13T04:38:01Z	-
dc.date.created	2016-01-05	-
dc.date.issued	2014-10-10	-
dc.identifier.citation	2014년 제26회 한글 및 한국어 정보처리 학술대회	-
dc.identifier.uri	http://hdl.handle.net/10203/211316	-
dc.description.abstract	URI spotting (탐지) 문제는 텍스트에 있는 단어열 중에서 URI로 대표되는 개체(entity)에 해당되는 것을 탐지하는 것이다. 이 문제는 두 개의 작은 문제를 순차적으로 해결하는 과제이다. 즉, 첫째는 어느 단어열이 URI에 해당하는 개체인가를 인식하는 것이고, 둘째는 개체 중의성 해소 문제로서 파악된 개체가 복수의 URI에 해당할 수 있는 의미적 모호성이 있을 때 그 URI중 하나를 선택하여 모호성을 해소하는 것이다. 이 논문은 디비피디아 URI를 대상으로 한다. URI 탐지 문제는 개체명 인식 문제와 비슷하나, URI(예를 들어 디비피디아 URI, 즉 Wikipedia 등재어)에 매핑될 수 있는 개체로 한정되므로 일반적인 개체명 인식 문제에서 단어열의 품사열이 기계학습의 자질로 들어가는 방법론과는 다른 자질을 사용할 수 있다. 이 논문에서는 한국어 텍스트를 대상으로 한국어 디비피디아 URI 탐지문제로서 SVM을 이용한 개체경계 인식 방법을 제시하여, 일반적 개체명 인식에서 나타나는 품사태거의 오류파급효과를 없애고자 한다. 또한 개체 중의성 해소 문제는 의미모호성이 주변 문장들의 토픽에 따라 달라지므로, LDA를 활용하며 이를 영어 디비피디아 URI탐지에서 쓰인 방법들과 비교한다.	-
dc.language	Korean	-
dc.publisher	HCLT	-
dc.title	한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소	-
dc.type	Conference	-
dc.type.rims	CONF	-
dc.citation.publicationname	2014년 제26회 한글 및 한국어 정보처리 학술대회	-
dc.identifier.conferencecountry	KO	-
dc.identifier.conferencelocation	강원대학교 춘천캠퍼스 60주년 기념관	-
dc.embargo.liftdate	9999-12-31	-
dc.embargo.terms	9999-12-31	-
dc.contributor.localauthor	최기선	-
dc.contributor.nonIdAuthor	김영식	-
dc.contributor.nonIdAuthor	함영균	-
dc.contributor.nonIdAuthor	김지성	-
dc.contributor.nonIdAuthor	황도삼	-

Appears in Collection: CS-Conference Papers(학술회의논문)

Files in This Item

Display Simple Item Record

qr_code

트윗하기

KOASAS

Knowledge Service Development Team, KAIST 291 Daehak-ro, Yuseong-gu, Daejeon 34141, Republic of Korea. T. 82-42-350-4493 Email. koasas@kaist.ac.kr
Copyright © 2016. Korea Advanced Institute of Science and Technology. All Rights Reserved.

KOASAS

KOASAS

Browse

한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소

KOASAS

Communities & Collections