L1-MAP 기법을 이용한 Subspace Gaussian Mixture Model에서의 화자 적응L1-MAP-based speaker adaptation of subspace gaussian mixture model

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 712
  • Download : 0
DC FieldValueLanguage
dc.contributor.advisor김회린-
dc.contributor.advisorKim, Hoi Rin-
dc.contributor.author구자현-
dc.contributor.authorGoo, Jahyun-
dc.date.accessioned2016-05-03T19:39:11Z-
dc.date.available2016-05-03T19:39:11Z-
dc.date.issued2015-
dc.identifier.urihttp://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=608473&flag=dissertationen_US
dc.identifier.urihttp://hdl.handle.net/10203/206854-
dc.description학위논문(석사) - 한국과학기술원 : 전기및전자공학과, 2015.2 ,[v, 48 p. :]-
dc.description.abstract화자간 변이는 음성인식의 성능을 저하시키는 주요한 원인이다. 이를 대처하기 위해서는 화자에 따른 음소 변이를 더욱 잘 담아내는 적응기법을 고안해야 한다. 부분공간 가우시안 혼합 모델은 개별 음소 정보를 다른 음향 정보와 효율적으로 분리해낼 수 있는 음향 모델이다. 분리한 음소 정보는 부분공간 가우시안 혼합 모델에서 음소상태벡터 형태로 저장된다. 따라서 음향모델을 개별 화자에 맞게 적응시킬 때 음소상태벡터만을 변화시키는 방법을 생각해볼 수 있다. 본 학위논문에서는 음소상태벡터에 최대사후확률 적응을 적용하는 방법을 제안하고, 더불어 L1-norm regularization 기반의 최대사후확률 적응을 통해 화자적응 모델의 저장 효율을 높였다. 이 방법을 통해 Wall Street Journal 데이터베이스에서 최대사후확률 적응으로는 단어 오류율 기준 17.5%의 상대적인 성능 향상을 얻을 수 있었고, L1 노름 정규화로는 15.6%의 성능 향상과 38%의 저장 효율을 얻을 수 있었다.ㅜ-
dc.languagekor-
dc.publisher한국과학기술원-
dc.subject부분공간 가우시안 혼합 모델-
dc.subject최대사후확률 적응-
dc.subjectL1 노름 정규화-
dc.subject화자적응-
dc.subject음성인식-
dc.subjectsubspace Gaussian mixture model-
dc.subjectmaximum a posteriori adaptation-
dc.subjectl1-norm regularization-
dc.subjectspeaker adaptation-
dc.subjectspeech recognition-
dc.titleL1-MAP 기법을 이용한 Subspace Gaussian Mixture Model에서의 화자 적응-
dc.title.alternativeL1-MAP-based speaker adaptation of subspace gaussian mixture model-
dc.typeThesis(Master)-
dc.identifier.CNRN325007-
dc.description.department한국과학기술원 :전기및전자공학과,-
dc.contributor.localauthor김회린-
dc.contributor.localauthorKim, Hoi Rin-
Appears in Collection
EE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0