DSpace at KOASAS: 음성 문서의 고속 검색을 위한 기대정합치 기반의 음성 문서 확장 기법

DSpace at KOASAS

College of Engineering(공과대학)School of Computing(전산학부)CS-Theses_Master(석사논문)

음성 문서의 고속 검색을 위한 기대정합치 기반의 음성 문서 확장 기법Expected matching score based spoken document expansion for fast retrieval of spoken documents

Cited 0 time in webofscience

Cited 0 time in scopus

Hit : 440
Download : 0

Export

서민구 / Seo, Min-Koo

질의가 주어졌을 때, 해당 질의와 관련된 음성 문서(인간의 음성을 담고 있는 웨이브 형태의 오디오 파일)를 검색하는 기법인 음성 문서 검색에 대한 연구가 최근 증가하는 멀티미디어 데이터에 발맞추어 활발히 이루어져왔다. 음성 문서 검색에서는 크게 신조어와 고유 명사와 같은 음성 인식기에 등록되어있지 않은 어휘(Out of Vocabulary; OOV)의 검색과 음성 인식에서 필연적으로 발생하는 음성 인식 오류의 해결이 가장 중요한 문제로 부각된다. 이들 문제의 해결을 위해 서브 워드 기반의 색인과 질의 확장 또는 문서 확장의 기법의 결합이 널리 사용되어왔다. 그러나 서브 워드와 문서 확장을 결합한 기법은 많은 계샨량이 필요하여 검색에 지나치게 오랜 시간이 소요된다는 문제가 있다. 따라서 본 논문에서는 음성 인식의 정확도를 사전에 예측한 값인 기대 정합치(Expected Matching Score; EMS)와 음소 n-gram 간의 유사도의 상한인 상한 정합치(Upper Matching Score; UMS)를 사용하여 UMS가 EMS보다 같거나 클 경우에만 Dynamic Programming을 사용해 음소 n-gram간의 비교를 수행함으로써 계샨량을 줄이는 음성 문서 확장 기법을 제안한다. 실험 결과 제안된 시스템의 검색 정확도 저하는 0.3%에 불과하나 검색 속도의 향상은 17.5배에 달하는 것으로 나타났다.

Advisors: 오영환 researcher; Oh, Yung-Hwan researcher

Description: 한국과학기술원 : 전산학전공,

Publisher: 한국과학기술원

Issue Date: 2007

Identifier: 265043/325007 / 020053267

Language: kor

Description: 학위논문(석사) - 한국과학기술원 : 전산학전공, 2007.2, [ vi, 39 p. ]

Keywords: 음성 문서 확장; 문서 확장; Document Expansion; Spoken Document Retrieval

URI: http://hdl.handle.net/10203/34762

Link: http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=265043&flag=dissertation

Appears in Collection: CS-Theses_Master(석사논문)

Files in This Item: There are no files associated with this item.

Display Full Item Record

qr_code

트윗하기

KOASAS

Knowledge Service Development Team, KAIST 291 Daehak-ro, Yuseong-gu, Daejeon 34141, Republic of Korea. T. 82-42-350-4493 Email. koasas@kaist.ac.kr
Copyright © 2016. Korea Advanced Institute of Science and Technology. All Rights Reserved.

KOASAS

KOASAS

Browse

음성 문서의 고속 검색을 위한 기대정합치 기반의 음성 문서 확장 기법Expected matching score based spoken document expansion for fast retrieval of spoken documents

KOASAS

Communities & Collections