Addressing Low-Resource Problems in Statistical Machine Translation of Sign Language

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 238
  • Download : 0
최근 통계적 기계 번역 기법을 이용한 수화 번역 연구가 활발해짐에도 불구하고, 병렬 말뭉치 자원의 희소성 문제는 아직 해결되지 못하고 있다. 본 연구는 통계적 기계 번역 방법을 이용하여 구어로 표현 될 수 있는 언어를 수지 표현으로 이루어진 수화로 번역 할 때, 자원 희소성에 기인하는 문제점들을 해결할 수 있는 세 가지 전처리 방법을 제시한다. 결과적으로 자원 희소성 문제를 안고 있는 수화 번역에서 실제로 번역 성능을 향상시킬 수 있는 방법들이 무엇인지를 실험을 통해 확인한다. 본 연구에서 제안하는 전처리 방법은 구어 문장의 패러프레이징을 통한 말뭉치 확장 방법, 구어 단어의 표제어화를 통한 개별 어휘 빈도를 높이는 방법, 그리고 수지 정보로 표현되지 않는 구어 품사에 해당하는 단어를 제거함으로써 구어와 수화 간 문장 성분을 일치시키는 방법이다. 영어와 미국 수화 병렬 말뭉치를 이용한 실험을 통하여 세 가지 전처리 방법 중 패러프레이즈 생성 및 표제어화의 적용 시에만 번역 품질이 향상된다는 사실을 알 수 있었다. 특히, 두 방법이 같이 적용될 때 가장 높은 성능을 보였다.
Publisher
Proceedings of Korea Computer Congress (KCC)
Issue Date
2016-06
Language
Korean
Citation

Proceedings of Korea Computer Congress (KCC), pp.714 - 716

URI
http://hdl.handle.net/10203/228549
Appears in Collection
CS-Conference Papers(학술회의논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0