비디오 내 음원 위치 추정 모델의 성능 향상을 위한 클래스 인지 대조 학습 기법 제안Class-Aware Contrastive Learning for Improving Performance of Sound Source Localization Model in Videos

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 77
  • Download : 0
DC FieldValueLanguage
dc.contributor.author선주형ko
dc.contributor.author김재윤ko
dc.contributor.author김주영ko
dc.contributor.author이영주ko
dc.contributor.author한혜경ko
dc.contributor.author윤성의ko
dc.date.accessioned2023-12-01T10:00:11Z-
dc.date.available2023-12-01T10:00:11Z-
dc.date.created2023-12-01-
dc.date.created2023-12-01-
dc.date.issued2023-11-
dc.identifier.citation정보과학회 컴퓨팅의 실제 논문지, v.29, no.11, pp.518 - 524-
dc.identifier.issn2383-6318-
dc.identifier.urihttp://hdl.handle.net/10203/315632-
dc.description.abstract비디오 상의 음원 위치를 추정하는 신경망 모델 학습은 이미지 및 오디오 멀티 모달 연구의 중요 분야 중 하나이다. 최근 연구들은 대조 학습법(contrastive learning)을 사용하여 음원 위치 추정 모델을 지도하는 방법을 제안하는데, 이 방법은 서로 다른 비디오는 서로 다른 클래스의 객체를 표현한다고 가정한다. 그러나, 일반적인 학습 데이터셋에는 동일한 객체를 담은 비디오가 존재하기 마련이다. 기존의 학습 과정에는 이러한 비디오들이 학습 배치 내에 함께 존재하여 모델에게 잘못된 지도를 제공할 수 있다. 이러한 문제를 바로잡고자, 본 논문은 음원 위치 추정 모델이 비디오 상의 객체 클래스를 미리 예측하여 데이터를 재배치하는 정확한 대조 학습법을 제안한다. 제안하는 방법은 추가적인 레이블 없이도 기존의 음원 위치 추정 모델의 성능을 개선하였다. 음원 위치 추정 연구 분야의 성능 검증 실험을 통해 이를 뒷받침한다.-
dc.languageKorean-
dc.publisher한국정보과학회-
dc.title비디오 내 음원 위치 추정 모델의 성능 향상을 위한 클래스 인지 대조 학습 기법 제안-
dc.title.alternativeClass-Aware Contrastive Learning for Improving Performance of Sound Source Localization Model in Videos-
dc.typeArticle-
dc.type.rimsART-
dc.citation.volume29-
dc.citation.issue11-
dc.citation.beginningpage518-
dc.citation.endingpage524-
dc.citation.publicationname정보과학회 컴퓨팅의 실제 논문지-
dc.identifier.kciidART003015248-
dc.contributor.localauthor윤성의-
dc.contributor.nonIdAuthor선주형-
dc.contributor.nonIdAuthor김재윤-
dc.contributor.nonIdAuthor김주영-
dc.contributor.nonIdAuthor이영주-
dc.contributor.nonIdAuthor한혜경-
dc.description.isOpenAccessN-
dc.subject.keywordAuthor심층 학습-
dc.subject.keywordAuthor멀티 모달 학습-
dc.subject.keywordAuthor음원 위치 추정-
dc.subject.keywordAuthor대조 학습-
dc.subject.keywordAuthordeep learning-
dc.subject.keywordAuthormulti-modal learning-
dc.subject.keywordAuthorsound source localization-
dc.subject.keywordAuthorcontrastive learning-
Appears in Collection
CS-Journal Papers(저널논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0