수사구조를 이용한 텍스트 자동요약Text summarization using rhetorical structure

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 666
  • Download : 0
요약이란 내용축약을 통하여 원문 텍스트로부터 요약문으로 변형하는 축약과정이다. 요약문 생성은 기계번역과 같이 자연 언어 처리의 궁극적인 목적 중의 하나이다. 그러나 기존의 단어 빈도수 기반 방법은 문장간 분석, 담화 분석이 결여되어 있다. 또한 정보 추출기반 방법은 한정된 도메인에서만 적용될 수 있으며, 다양한 텍스트에 적용되기 어렵다. 인간과 유사한 방법으로 요약문을 생성하기 위해서는 담화 구조에 대한 분석 이론이 선행되어야 한다. 일반적으로 인간은 논리적인 사고의 흐름을 가지고 글을 전개하게 된다. 그러므로 글은 논리적인 구조를 가지며, 이는 문장들간의 관계를로 표현될 수 있다. 본 논문에서는 수사구조를 이용한 요약문 생성 방법을 제안한다. 수사구조란 문장들간의 관계를 나타낸다. 이러한 관계를 분석하기 위해서 접속사나 접속어구와 갈은 어휘적인 표지들을 사용하였으며, 전체 텍스트에 대응하는 구조를 생성하기 위해서, 장이나 절과 같은 문서 구조 정보를 사용하였다. 수사구조 파싱과정은 두 단계로 이루어진다. 최종적으로 생성된 트리로부터 가중치를 계산하여, 중요 문장을 요약문으로 추출한다. 실험 결과는 단어 빈도수 기반 방법보다 약 6.7%의 재현율 향상을 보였다.
Advisors
최기선researcherChoi, Key-Sunresearcher
Description
한국과학기술원 : 전산학전공,
Publisher
한국과학기술원
Issue Date
2000
Identifier
157562/325007 / 000983431
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학전공, 2000.2, [ iv, 41 p. ]

Keywords

텍스트 요약; 수사 구조; Rhetorical structure; Text summarization

URI
http://hdl.handle.net/10203/34396
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=157562&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0