RNN을 이용한 한국어 문장 간 구문 유사도 측정

문장 간 구문 유사도(syntactic similarity) 검사는 문장 생성 모델의 자동평가 도구로 이용되는 중요한 기술이다. 최근 딥러닝을 이용한 문장 임베딩(sentence embedding), 즉 문장 간 인코더-디코더에 관한 연구들이 진행 되고 있으며, 이를 이용한 기계 번역이 괄목할 만한 성과를 거두고 있다. 본 연구에서는 패러프레이징의 평가 도구로서 인코더-디코더 모델을 활용하고자 한다. 본 논문에서는 한국어 문장을 한국 어 위키피디아 말뭉치를 이용해 RNN(recurrent neural network)으로 학습한 인코더-디코더 모델을 이용한 문장 간 유사도 분석 실험을 실시하였다.
Publisher
한국정보과학회
Issue Date
2016-07-01
Language
Korean
Citation

한국컴퓨터종합학술대회 2016

URI
http://hdl.handle.net/10203/210042
Appears in Collection
CS-Conference Papers(학술회의논문)
Files in This Item
KCC2016_이동건_Publish.pdf(126.94 kB)Download
  • Hit : 287
  • Download : 624
  • Cited 0 times in thomson ci

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0