음성 문서의 고속 검색을 위한 기대정합치 기반의 음성 문서 확장 기법Expected matching score based spoken document expansion for fast retrieval of spoken documents

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 440
  • Download : 0
질의가 주어졌을 때, 해당 질의와 관련된 음성 문서(인간의 음성을 담고 있는 웨이브 형태의 오디오 파일)를 검색하는 기법인 음성 문서 검색에 대한 연구가 최근 증가하는 멀티미디어 데이터에 발맞추어 활발히 이루어져왔다. 음성 문서 검색에서는 크게 신조어와 고유 명사와 같은 음성 인식기에 등록되어있지 않은 어휘(Out of Vocabulary; OOV)의 검색과 음성 인식에서 필연적으로 발생하는 음성 인식 오류의 해결이 가장 중요한 문제로 부각된다. 이들 문제의 해결을 위해 서브 워드 기반의 색인과 질의 확장 또는 문서 확장의 기법의 결합이 널리 사용되어왔다. 그러나 서브 워드와 문서 확장을 결합한 기법은 많은 계샨량이 필요하여 검색에 지나치게 오랜 시간이 소요된다는 문제가 있다. 따라서 본 논문에서는 음성 인식의 정확도를 사전에 예측한 값인 기대 정합치(Expected Matching Score; EMS)와 음소 n-gram 간의 유사도의 상한인 상한 정합치(Upper Matching Score; UMS)를 사용하여 UMS가 EMS보다 같거나 클 경우에만 Dynamic Programming을 사용해 음소 n-gram간의 비교를 수행함으로써 계샨량을 줄이는 음성 문서 확장 기법을 제안한다. 실험 결과 제안된 시스템의 검색 정확도 저하는 0.3%에 불과하나 검색 속도의 향상은 17.5배에 달하는 것으로 나타났다.
Advisors
오영환researcherOh, Yung-Hwanresearcher
Description
한국과학기술원 : 전산학전공,
Publisher
한국과학기술원
Issue Date
2007
Identifier
265043/325007  / 020053267
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학전공, 2007.2, [ vi, 39 p. ]

Keywords

음성 문서 확장; 문서 확장; Document Expansion; Spoken Document Retrieval

URI
http://hdl.handle.net/10203/34762
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=265043&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0