복수 문서 기반 인지적 도메인 지식 구조 자동 생성 기술Automated methods of cognitive domain knowledge structure creation from multiple documents

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 645
  • Download : 0
본 논문은 복수 개의 학습 문서 상에서 도메인 지식 구조를 자동 생성하기 위한 3가지 방법을 제안하고, 이들의 성능을 서로 비교하고 분석한다. 도메인 지식 구조를 생성하기 위한 첫 번째 방법은 각 학습 문서를 통합된 하나의 단일 문서로 통합한 다음, 통합된 하나의 문서 상에서 핵심 개념들과 그들의 연관 관계를 추출하는 “Dependent Integration of Multiple Documents”이다. 도메인 지식 구조를 생성하기 위한 두 번째 방법은 각 학습 문서의 핵심 개념에 대한 정보는 그대로 유지하고, 핵심 개념 간의 연관 관계는 통합된 단일 문서 상에서 추출하는 “Independent Integration of Multiple Documents”이다. 도메인 지식 구조를 생성하기 위한 세 번째 방법은 각 학습 문서의 지식 구조끼리 융합하는 “Integration of Knowledge Networks”이다. 특히, 세 번째 방법인 “Integration of Knowledge Networks”는 각 학습 문서에서 4가지의 연관 관계 분석 기법인 Sentence co-occurrence Similarity (SS), Paragraph co-occurrence Similarity (PS), Sentence Cosine Similarity (SCS), Paragraph Cosine Similarity (PCS)를 통해 생성된 다양한 지식 구조끼리의 융합을 가능하게 한다. 그리고 본 논문에서 제안한 3가지 도메인 지식 구조 생성 방법 중 세 번째 방법인 “Integration of Knowledge Networks”가 각 학습 문서의 지식 구조끼리 융합해서 도메인 지식 구조를 생성하기 때문에 Processing Time의 관점에서 성능이 가장 좋으며, 첫 번째 방법인 “Dependent Integration of Multiple Documents”는 각 학습 문서를 거대한 단일 문서로 통합한 후 핵심 개념과 핵심 개념 간의 연관 관계 모두 추출해서 도메인 지식 구조를 생성하기 때문에 Processing Time의 관점에서 가장 좋지 않다. 하지만 도메인 지식 구조를 생성할 때의 두 번째 방법인 “Independent Integration of Multiple Documents” 또한 핵심 개념 간의 연관 관계를 첫 번째 방법과 동일하게 통합된 단일 문서 상에서 추출하기 때문에 통합된 문서가 길수록 상당한 Processing Time의 지연을 초래한다. 본 논문의 실험은 크게 학습자 지식 구조와 기계적으로 자동 생성되는 지식 구조에 대해 수행한다. 첫 번째 실험은 복수 개의 학습 문서 상에서 기계적으로 자동 생성되는 도메인 지식 구조와 학습자 지식 구조 간의 유사도를 기존의 KNOT 프로그램에서 사용되고 있는 Similarity Measure와 본 논문에서 제안한 Similarity Measure [α]를 사용해서 측정한다. 이에 대한 실험 결과는 “Integration of Knowledge Networks”가 학습자의 지식 구조와 가장 유사했으며, 지식 구조 간의 유사도를 측정하는 두 방법 모두 동일한 결과를 산출했다. 두 번째 실험은 복수 개의 문서 상에서 도메인 지식 구조를 생성할 때의 3가지 이슈에 대해 본 논문에서 제안한 방법들이 어떻게 반영되는지 관찰한다. 첫 번째 이슈인 짧은 문서와 긴 문서의 특징을 도메인 지식 구조에 반영하는 방법으로 각 학습 문서의 Word 수를 기반한 “Term Frequency-Inverse Word Frequency (TF-IWF)” 기법을 제안하고 실제 TF-IWF가 짧은 문서와 긴 문서의 특징을 해당 도메인 지식 구조에 잘 표현됨을 알 수 있었다. 두 번째 이슈인 각 학습 문서들이 서로 다른 가중치를 가질 때, 이를 도메인 지식 구조에 반영하는 방법으로 핵심 개념에 가중치를 부여하는 “TF-Differential Weight” 기법과 핵심 개념과 핵심 개념 간의 연관 관계 모두 가중치를 부여하는 “Differential Weight” 기법을 제안하고, 실제 ...
Advisors
이문용researcherYi, Mun-Yong
Description
한국과학기술원 : 지식서비스공학과,
Publisher
한국과학기술원
Issue Date
2013
Identifier
567098/325007  / 020093676
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 지식서비스공학과, 2013.8, [ xiv, 211 p. ]

Keywords

도메인 지식 구조; 문서 빈도수 기반의 문서 동등 가중치 기법; TF-Equal Weight; Differential Weight; Frequency-Inverse Word Frequency (TF-IWF); Similarity Measure; 지식 네트워크 간의 통합 기법; 지식 구조 간의 유사도 측정 방법; 단어 빈도수-역 워드 빈도수 (TF-IWF); 문서 차등 가중치 기법; Domain Knowledge Structure; Integration of Knowledge Networks

URI
http://hdl.handle.net/10203/197084
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=567098&flag=dissertation
Appears in Collection
IE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0