DSpace at KOASAS: 복수 문서 기반 인지적 도메인 지식 구조 자동 생성 기술

DSpace at KOASAS

College of Engineering(공과대학)Dept. of Industrial and Systems Engineering(산업및시스템공학과)IE-Theses_Master(석사논문)

복수 문서 기반 인지적 도메인 지식 구조 자동 생성 기술Automated methods of cognitive domain knowledge structure creation from multiple documents

Cited 0 time in webofscience

Cited 0 time in scopus

Hit : 665
Download : 0

Export

김경진 / Kim, Kyung-Jin

본 논문은 복수 개의 학습 문서 상에서 도메인 지식 구조를 자동 생성하기 위한 3가지 방법을 제안하고, 이들의 성능을 서로 비교하고 분석한다. 도메인 지식 구조를 생성하기 위한 첫 번째 방법은 각 학습 문서를 통합된 하나의 단일 문서로 통합한 다음, 통합된 하나의 문서 상에서 핵심 개념들과 그들의 연관 관계를 추출하는 “Dependent Integration of Multiple Documents”이다. 도메인 지식 구조를 생성하기 위한 두 번째 방법은 각 학습 문서의 핵심 개념에 대한 정보는 그대로 유지하고, 핵심 개념 간의 연관 관계는 통합된 단일 문서 상에서 추출하는 “Independent Integration of Multiple Documents”이다. 도메인 지식 구조를 생성하기 위한 세 번째 방법은 각 학습 문서의 지식 구조끼리 융합하는 “Integration of Knowledge Networks”이다. 특히, 세 번째 방법인 “Integration of Knowledge Networks”는 각 학습 문서에서 4가지의 연관 관계 분석 기법인 Sentence co-occurrence Similarity (SS), Paragraph co-occurrence Similarity (PS), Sentence Cosine Similarity (SCS), Paragraph Cosine Similarity (PCS)를 통해 생성된 다양한 지식 구조끼리의 융합을 가능하게 한다. 그리고 본 논문에서 제안한 3가지 도메인 지식 구조 생성 방법 중 세 번째 방법인 “Integration of Knowledge Networks”가 각 학습 문서의 지식 구조끼리 융합해서 도메인 지식 구조를 생성하기 때문에 Processing Time의 관점에서 성능이 가장 좋으며, 첫 번째 방법인 “Dependent Integration of Multiple Documents”는 각 학습 문서를 거대한 단일 문서로 통합한 후 핵심 개념과 핵심 개념 간의 연관 관계 모두 추출해서 도메인 지식 구조를 생성하기 때문에 Processing Time의 관점에서 가장 좋지 않다. 하지만 도메인 지식 구조를 생성할 때의 두 번째 방법인 “Independent Integration of Multiple Documents” 또한 핵심 개념 간의 연관 관계를 첫 번째 방법과 동일하게 통합된 단일 문서 상에서 추출하기 때문에 통합된 문서가 길수록 상당한 Processing Time의 지연을 초래한다. 본 논문의 실험은 크게 학습자 지식 구조와 기계적으로 자동 생성되는 지식 구조에 대해 수행한다. 첫 번째 실험은 복수 개의 학습 문서 상에서 기계적으로 자동 생성되는 도메인 지식 구조와 학습자 지식 구조 간의 유사도를 기존의 KNOT 프로그램에서 사용되고 있는 Similarity Measure와 본 논문에서 제안한 Similarity Measure [α]를 사용해서 측정한다. 이에 대한 실험 결과는 “Integration of Knowledge Networks”가 학습자의 지식 구조와 가장 유사했으며, 지식 구조 간의 유사도를 측정하는 두 방법 모두 동일한 결과를 산출했다. 두 번째 실험은 복수 개의 문서 상에서 도메인 지식 구조를 생성할 때의 3가지 이슈에 대해 본 논문에서 제안한 방법들이 어떻게 반영되는지 관찰한다. 첫 번째 이슈인 짧은 문서와 긴 문서의 특징을 도메인 지식 구조에 반영하는 방법으로 각 학습 문서의 Word 수를 기반한 “Term Frequency-Inverse Word Frequency (TF-IWF)” 기법을 제안하고 실제 TF-IWF가 짧은 문서와 긴 문서의 특징을 해당 도메인 지식 구조에 잘 표현됨을 알 수 있었다. 두 번째 이슈인 각 학습 문서들이 서로 다른 가중치를 가질 때, 이를 도메인 지식 구조에 반영하는 방법으로 핵심 개념에 가중치를 부여하는 “TF-Differential Weight” 기법과 핵심 개념과 핵심 개념 간의 연관 관계 모두 가중치를 부여하는 “Differential Weight” 기법을 제안하고, 실제 ...

Advisors: 이문용 researcher; Yi, Mun-Yong

Description: 한국과학기술원 : 지식서비스공학과,

Publisher: 한국과학기술원

Issue Date: 2013

Identifier: 567098/325007 / 020093676

Language: kor

Description: 학위논문(석사) - 한국과학기술원 : 지식서비스공학과, 2013.8, [ xiv, 211 p. ]

Keywords: 도메인 지식 구조; 문서 빈도수 기반의 문서 동등 가중치 기법; TF-Equal Weight; Differential Weight; Frequency-Inverse Word Frequency (TF-IWF); Similarity Measure; 지식 네트워크 간의 통합 기법; 지식 구조 간의 유사도 측정 방법; 단어 빈도수-역 워드 빈도수 (TF-IWF); 문서 차등 가중치 기법; Domain Knowledge Structure; Integration of Knowledge Networks

URI: http://hdl.handle.net/10203/197084

Link: http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=567098&flag=dissertation

Appears in Collection: IE-Theses_Master(석사논문)

Files in This Item: There are no files associated with this item.

Display Full Item Record

qr_code

트윗하기

KOASAS

Knowledge Service Development Team, KAIST 291 Daehak-ro, Yuseong-gu, Daejeon 34141, Republic of Korea. T. 82-42-350-4493 Email. koasas@kaist.ac.kr
Copyright © 2016. Korea Advanced Institute of Science and Technology. All Rights Reserved.

KOASAS

KOASAS

Browse

복수 문서 기반 인지적 도메인 지식 구조 자동 생성 기술Automated methods of cognitive domain knowledge structure creation from multiple documents

KOASAS

Communities & Collections