Quality improvement of G.718 SWB codec with normalized spectral envelope information-based spectral shape modification = 정규화된 Spectral Envelope 정보기반 Spectral Shape 개선을 통한 G.718 초광대역 부호화기 성능 개선

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 417
  • Download : 0
최근 음성 코덱 기술은 협대역에서 광대역, 그리고 초광대역 코덱으로 발전해 나가고 있다. 기존에는 유선전화망이나 이동통신망에서는 300 Hz - 3400 Hz의 대역폭을 갖는 협대역 코덱을 주로 사용해 왔지만 50 Hz - 7 kHz의 대역폭을 갖는 광대역 코덱과 50 Hz - 14 kH의 대역폭을 갖는 초광대역 코덱이 표준화가 되고 현재 광대역 코덱이 이동통신망에서 사용되는 추세이다. 광대역 코덱은 1988 년부터 표준화되기 시작하였지만, 협대역 특성을 가지고 있는 기존 전화망과의 인터페이스 때문에 널리 사용되지는 않다가, 네트워크 기술의 발전으로 좀 더 나은 통화품질이 요구되면서부터 음질이 우수한 광대역, 초광대역 코덱에 많은 관심이 모아지고 있다. 나아가 기술적으로 코덱간의 호환성 문제를 근원적으로 해결하고 음성서비스와 음악서비스를 대역폭 확장을 통해 동시에 제공할 수 있는 초광대역 음성기반 오디오 융합코덱 표준화가 이루어지고 있다. 임베디드 가변비트율 코덱기술을 대표하는 광대역 코덱인 G.718, G.729.1 코덱과 호환성을 제공하여 기존의 통신 시스템에 대한 영향을 최소로 하면서 초광대역 음성 및 오디오 품질을 필요로 하는 응용분야에 사용하기 위해 지난 2007 년부터 표준화가 이루어졌다. 현재 3GPP에서는 SA4 산하에 EVS (Enhanced Voice Service) 그룹을 구성하여 AMR-WB, AMR-WB+ 코덱에 후속하여 LTE 서비스를 위한 EVS의 표준화를 위해 기술적 요구사항을 도출하고 있으며 이는 기본적으로 음성정보와 오디오 대역(20 - 20,000 Hz)의 정보를 모두 처리할 수 있는 음성 오디오 융합코덱 형태의 기술개발과 표준화가 진행되어가고 있다. G.718B 초광대역 코덱에서는 저주파수 영역(0 - 7 kHz)과 고주파수 영역(7 - 14 kHz)을 신호 레벨에서 독립적으로 양자화를 수행한다. 저주파수 영역에서는 기존의 G.718 양자화가 그대로 사용되며 고주파수 영역에서는 신호의 특성(tonality detec-tion)에 따라서 양자화를 달리하고 있다. 고주파수 영역에서는 기본적으로 신호의 MDCT 변환이 이루어지며 검출된 신호의 특성, 즉, 토널 성분의 존재 여부에 따라서 generic mode coding 과 sinusoidal mode coding 기법이 병행되어 사용된다. 기존 G.718 코덱에서 지원되는 비트율은 8, 12, 16, 24, 32 kbps이다. ITU-T에서 표준화된 G.718 코덱은 8 - 32 kbps 범위 내에서 임베디드 형태로 비트열 계층을 쌓아가는 구조로 협대역 신호부터 광대역 신호를 압축, 복원한다. G.718B 초광대역 코덱은 G.718 코덱의 확장 코덱으로 기존 32 kbps에서 더해져, 36 kbps, 40 kbps, 48 kbps가 지원된다. AMR-WB로 널리 알려진 G.722.2 부호화기의 12.65 kbps 모드와 호환성을 제공하며, 구조는 비트율이 높아짐에 따라 비트를 쌓아 올리는 임베디드 가변 비트율 부호화 기술로 이루어져 있다. G.718B 초광대역 코덱으로 확장될 때, 레이어 구조를 형성한다. 각 레이어 마다 다른 기술이 사용되어 있는데, 특히 초광대역으로 확장된 첫 번째 레이어인 Layer 6mo에서는 Generic mode 혹은 sinusoidal mode가 사용된다. G.718 광대역 코덱에서 16 kHz 신호가 다운샘플링 되어 수행되어지고, 초광대역 확장 레이어에서는 32 kHz 신호가 입력으로 사용된다. 초광대역 인코더에서 먼저 입력 신호를 MDCT 도메인으로 변환하고, 변환된 MDCT를 가지고 토널 성분을 측정하게 된다. 토널 성분을 측정하여 토널이 존재하면 sinusoidal mode로 들어가서 코딩이 수행되고, 토널이 존재하지 않으면 generic mode로 들어가서 코딩이 수행된다. 이는 전체 초광대역 확장 코덱에서 첫번째 레이어에서 수행이 이루어진다. 그 이후 레이어에서는 추가적인 sinusoidal mode를 통해 sinusoidal coding을 통해 원음에 가깝게 코딩과 양자화가 수행되어 비트율에 따라 음질이 향상된다. 본 논문에서 첫 번째 연구 주제로써 Cepstral envelope coding과 기존의 양자화된 광대역 신호를 AbS 방식을 통해 복사해 오는 방법을 이용하여 개선된 G.718B 초광대역 코덱의 밴드 확장 방법을 제안하였다...
Advisors
Hahn, Min Sooresearcher한민수researcher
Description
한국과학기술원 :전기및전자공학과,
Publisher
한국과학기술원
Issue Date
2015
Identifier
325007
Language
eng
Description

학위논문(박사) - 한국과학기술원 : 전기및전자공학과, 2015.2 ,[ix, 96 p. :]

Keywords

AbS; BWE; cepstral coefficients; Generic mode; G.718B; SWB; 합성에의한분석방식; 밴드확장; 캡스트럼 계수; 제네릭 모드; G.718 초광대역코덱; 초광대역

URI
http://hdl.handle.net/10203/206904
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=615691&flag=dissertation
Appears in Collection
EE-Theses_Ph.D.(박사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0