Experiential knowledge mining from text텍스트로부터의 경험지식 마이닝

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 570
  • Download : 0
최근 인터넷과 웹 기술의 발달은 인간 행위와 경험에 대한 정보와 지식을 공유하는 것을 가능하게 하였다. 인간의 경험을 경험 지식의 형태로 담아내는 것은 사용자의 행동과 의도를 해석할 이해할 뿐만 아니라 수집된 과거의 경험을 기반으로 맥락에 따른 해결방법을 제공할 수 있게 한다. 이 논문의 핵심 질문은 텍스트에 나타난 대량의 경험관련 정보를 쉽게 사용할 수 있도록 충분히 자세한 수준의 형태로 변화시키는 방법에 관련된다. 이 논문에서 우리는 경험 지식이 개개의 경험 실례를 수집하여 얻게 되는 것으로 가정한다. 경험 지식은 수집된 경험 실례는 추상화와 일반화 과정을 통해 정제된다. 이 연구는 경험 지식 마이닝의 연구 쟁점에 대해 이야기하며 자연언어 문서의 집합으로부터 경험 지식 베이스를 구축하는 방법을 제안한다. 특히 두 핵심 쟁점인 경험 실례의 구성요소의 인식과 온톨로지 또는 개념 텍소노미를 사용하여 추상화된 경험 데이터로부터 일반화된 지식을 생성을 다룬다. 이벤트의 인식과 분류에서 우리는 구문 의존성과 깊은 수준의 의미의 중요성에 주목한다. 그리고 이벤트와 구문적으로 관계된 단어 사이에 존재하는 의존성에 기반을 둔 결합 자질을 제안하였다. 그 자질은 또한 깊은 수준의 어휘 의미를 사용한다. 그러나 깊은 수준의 어휘 의미의 활용과 구문 의존성을 활용하는 접근 방법은 너무 큰 자질 공간을 요구하는 한계를 가지고 있다. 이 문제를 해결하기 위해 우리는 자질의 의미 위계를 활용하는 새로운 자질 선택 방법론을 고안하였다. 이 연구의 최종 목표는 하나 이상의 경험 튜플 구성 성분을 공유하는 개개의 경험 실례를 모아 경향성 값을 할당하는 것이다. 단순한 동시-발생 통계가 경험 경향을 계산하는데 부적절함을 보였고, 서로 다른 경향의 측면을 계산하는 척도와 이를 결합하는 방법론을 제안하였다. 우리는 개념 텍소노미의 모양에 따라 척도의 결합 가중치를 조절하는 경향 랭킹 모델을 고안하였다. 실험 결과는 제안한 모델이 주어진 맥락과 경험자에 대해 대표적인 경향을 검색하는데 있어, 향상된 성능을 가짐을 보여준다. 베이스라인과 비교하였을 때, 장소, 시간, 참여자 맥락에 대해 각각 3%, 23%, 29%의 성능 향상이 있었다. 또한 분석을 통해, 텍소노미의 구조에 상관없이 제안하는 모델이 베이스라인보다 향상되거나 적어도 유사한 결과를 보여준다는 결론에 도달하였다.
Advisors
Myaeng, Sung Hyonresearcher맹성현researcher
Description
한국과학기술원 :전산학부,
Publisher
한국과학기술원
Issue Date
2015
Identifier
325007
Language
eng
Description

학위논문(박사) - 한국과학기술원 : 전산학부, 2015.8 ,[vii, 88 p. :]

Keywords

event extraction; experience mining; natural language processing; ranking model; text mining; 경험 마이닝; 랭킹 모델; 이벤트 추출; 자연어 처리; 텍스트 마이닝

URI
http://hdl.handle.net/10203/206698
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=628714&flag=dissertation
Appears in Collection
CS-Theses_Ph.D.(박사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0