Pitch-synchronous 음성 파형 벡터 양자화Pitch-synchronous speech waveform vector quantization

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 643
  • Download : 0
본 논문에서는 pitch-synchronous 음성 파형 부호화 방식을 제안하였으며, computer simulation을 통하여 이에 대한 성능 분석을 하였다. Pitch-synchronous 파형 부호화 방식의 목적은 음성의 유성음 부분을 전송할 때 유성음의 한 pitch 주기 단위로 파형 부호화 함으로써 전송 속도를 감소시키는 것이다. 유성음을 한 pitch 주기 단위로 파형 부호화하기 위해서는 우선 유성음의 pitch 주기를 측정한 후, 유성음을 pitch 주기 단위로 구분(segment)해야 한다. 유성음을 pitch 주기 단위로 구분하기 위해서는 pitch 주기의 시작점이 정의되어야 한다. 본 연구에서는 pitch 주기의 시작점을 유성음의 한 pitch 주기에 나타나는 peak가 시작되기 바로 전의 영 교차점으로 정의하였다. Pitch 주기의 시작점으로 부터 시작하여 뽑아낸 유성음의 한 주기 파형을 codebook에 있는 유성음의 한 주기 파형과 비교하여 distortion이 가장 작은 codeword를 찾아내기 위해서는, 뽑아낸 유성음의 한 주기 파형의 길이가 codebook의 dimension과 같아야 한다. 이를 위해서 codebook의 dimension을 충분히 크게 잡은 뒤, 뽑아낸 유성음의 한 주기 파형의 길이를 codebook의 dimension과 같아지도록 interpolation 하였다. 무성음인 경우에는 똑같은 길이 단위로 벡타 양자화 하였다. 유성음/무성음/묵음 구별은 pitch 주기의 검출 유.무와 영 교차율, 그리고 energy level에 의해 결정하였다. 벡타 양자화 방식은 gain/shape VQ를 사용하였다. 무성음과 유성음에 대한 codebook은 각각 따로 만들었는데, gain codebook의 크기는 무성음과 유성음 똑같이 128개로 하였다. 유성음의 경우에는 파형에 대한 codebook의 dimension을 130으로 하였고, codebook의 크기를 64, 128, 256, 512로 변화시켜 가면서 시험해 보았다. 무성음의 경우에는 파형에 대한 codebook의 dimension을 15로 하였고, codebook의 크기를 64, 128, 256로 변화시키며 시험하였다. Subjective 청취 실험 결과 유성음의 codebook 크기를 증가시켜 감에 따라 재생된 음질의 충실도(fidelity)가 향상되었다. 유성음의 codebook 크기를 512로 하였을 때 평균 전송 속도는 약 4700 bps 이었다.
Advisors
이황수researcherLee, Hwang-Sooresearcher
Description
한국과학기술원 : 전기 및 전자공학과,
Publisher
한국과학기술원
Issue Date
1989
Identifier
66819/325007 / 000871179
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전기 및 전자공학과, 1989.2, [ iv, 67 p. ]

URI
http://hdl.handle.net/10203/39302
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=66819&flag=dissertation
Appears in Collection
EE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0