MP3 음악 요약의 성능 향상을 위한 효과적인 세그먼트 구성Effective segment construction for MP3-based music summarization

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 551
  • Download : 0
음악 요약은 악곡에서 반복되는 구간을 추출하는 것을 목표로 한다. 유사도 매트릭스 분석은 기존 음악 요약 연구에서 즐겨 사용되고 있는 방법으로, 반복되는 구간은 유사도 매트릭스 상에서 대각선 선(diagonal stripes)나 체크 보드 패턴으로 나타난다. 대각선 선은 반복이 단순한 악곡에는 유용하나, 복잡한 음악에는 적용되어 질 수 없다. 반면,체크 보드 패턴은 일반화된 방법으로, 90% 의 정확성으로 반복되는 후렴구 구간을 찾을 수 있다. 그러나, 이런 방법은 곡의 전체 구조를 나타내도록 세그먼트가 나누어져야 한다는 가정이 존재한다. 하지만, 이런 세그먼트 분할 문제는 쉬운 문제가 아니다. 세그먼트 분할이 적절치 않으면, 이런 체크 보드 방법을 적용할 수 없다. 따라서, 본 논문에서는 불완전한 세그먼트 상에서 세그먼트 재구성을 위하여 K-means 클러스터링과 SVD(Singular Value Decomposition)의 반복 전용을 이용한 음악 요약을 제안한다. K-means 클러스터링을 통한 세그먼트 재분할의 후처리 부분을 통해 세그먼트는 단계적으로 악곡에 적합한 형태로 재구성되어 진다. 결과적으로 세그먼트 재분할 결과가 수렴하면, 후렴구 구간이 얻어 진다. 현재, 음악 분석에서 주로 쓰이는 특징 벡터는 음성 연구에서 주료 사용되어 지던 것으로, 음성에는 적합한 것이나, 음악에 특화되어 있지 않다.크로마 특징 벡터는 음악에 특화된 것으로, 음악 분석에 있어 더 향상된 결과를 나타내고 있다. MP3는 오늘날 널리 쓰이는 디지털 미디어로써, MP3와 같은 압축된 도메인에서의 음악 요약 연구가 절실히 요구되어 지고 있다. 크로마는 원래 PCM 도메인에서 연구되어 졌으나, 본 논문에서는 크로마를 MP3 도메인에 적용하였다. 제안된 시스템은 MP3 형태의 가요에 대해 실험되어 졌으며, 기존의 적합한 세그먼트를 가정한 체크보드 방법과 유사한 결과를 보여주는 실험 결과를 얻었다.
Advisors
오영환researcherOh, Yung-Hwanresearcher
Description
한국과학기술원 : 전산학전공,
Publisher
한국과학기술원
Issue Date
2006
Identifier
255597/325007  / 020043018
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학전공, 2006.2, [ iii, 45 p. ]

Keywords

Music analysis; Music information retrieval; 음악 분석; 음악 정보 추출; 음악 요약; Music summarization

URI
http://hdl.handle.net/10203/34720
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=255597&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0