기본주파수와 성도길이의 상관관계를 이용한 HTS 음성합성기에서의 목소리 변환Voice Transformation for HTS using Correlation between Fundamental Frequency and Vocal Tract Length

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 448
  • Download : 0
통계적 매개변수 기반 음성 합성 방법의 가장 큰 장점은 음성 특징을 자유롭게 수정하여 다양한 목소리를 만들 수 있다는 것이다. 음성 합성 시스템과 목소리 변환 기법이 융합되어 개인화된 텍스트 음성 변환시스템이 구현될 수 있는데 이는 많은 분야에서 사용되고 있다. 음성의 기본주파수와 스펙트럼 포락선을 독립적으로 수정하여 목소리의 특징을 변환 할 수 있는데, 이 때 음질의 저하가 없고 자연스러움을 유지하는 것이 중요하다. 본 연구에서는 STRAIGHT 보코더를 사용하고 은닉 마르코프 모델에 기반을 둔 음성 합성 시스템을 구축하여 음성의 기본주파수와 스펙트럼 포락선 파라미터의 수정을 통해 목소리 변환을 시도한다. 기본주파수는 스케일링하는 방법으로 변환하고, 스펙트럼 포락선은 주파수 와핑을 통해 변환하여 화자의 성도길이를 조절한다. 특히 본 연구에서는 기본주파수와 성도길이의 상관관계를 모델링하고 이를 적용한 목소리 변환 방법을 제안한다. 주관적 선호도 평가 결과로 상관관계 모델을 적용한 방식에서 더 높은 선호도를 나타냈으며, 주관적 음질 평가 결과로 연구에서 활용한 목소리 변환방법은 음질 저하를 일으키지 않는 것을 확인하였다.
Advisors
김회린researcherKim, Hoirinresearcher
Description
한국과학기술원 :전기및전자공학부,
Publisher
한국과학기술원
Issue Date
2017
Identifier
325007
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전기및전자공학부, 2017.2,[iii, 47 p. :]

Keywords

목소리 변환; 은닉 마르코프 모델 기반의 음성 합성; STRAIGHT 보코더; 기본주파수; 성도길이; voice transformation; HMM-based speech synthesis; STRAIGHT vocoder; fundamental frequency; vocal tract length

URI
http://hdl.handle.net/10203/243301
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=675409&flag=dissertation
Appears in Collection
EE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0