질의가 주어졌을 때, 해당 질의와 관련된 음성 문서(인간의 음성을 담고 있는 웨이브 형태의 오디오 파일)를 검색하는 기법인 음성 문서 검색에 대한 연구가 최근 증가하는 멀티미디어 데이터에 발맞추어 활발히 이루어져왔다. 음성 문서 검색에서는 크게 신조어와 고유 명사와 같은 음성 인식기에 등록되어있지 않은 어휘(Out of Vocabulary; OOV)의 검색과 음성 인식에서 필연적으로 발생하는 음성 인식 오류의 해결이 가장 중요한 문제로 부각된다. 이들 문제의 해결을 위해 서브 워드 기반의 색인과 질의 확장 또는 문서 확장의 기법의 결합이 널리 사용되어왔다. 그러나 서브 워드와 문서 확장을 결합한 기법은 많은 계샨량이 필요하여 검색에 지나치게 오랜 시간이 소요된다는 문제가 있다. 따라서 본 논문에서는 음성 인식의 정확도를 사전에 예측한 값인 기대 정합치(Expected Matching Score; EMS)와 음소 n-gram 간의 유사도의 상한인 상한 정합치(Upper Matching Score; UMS)를 사용하여 UMS가 EMS보다 같거나 클 경우에만 Dynamic Programming을 사용해 음소 n-gram간의 비교를 수행함으로써 계샨량을 줄이는 음성 문서 확장 기법을 제안한다. 실험 결과 제안된 시스템의 검색 정확도 저하는 0.3%에 불과하나 검색 속도의 향상은 17.5배에 달하는 것으로 나타났다.