기계학습에 기반한 생의학분야 전문용어의 자동 인식Machine-Learning Based Biomedical Term Recognition

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 961
  • Download : 0
분야의 문서들에서 그 분야 특징을 반영하는 전문용어를 자동으로 인식하는 연구에 대한 관심이 증가하고 있다. ‘전문용어 인식’은 문서에서 전문용어가 될 수 있는 언어적 단위를 파악하는 ‘용어추출’과정과 ‘용어추출’과정에서 얻어진 용어목록 중 해당분야의 전문용어를 고르는 ‘전문용어 선택’ 과정으로 구성된다. ‘전문용어 선택’과정은 용어목록을 전문용어의 특징에 따라 순위화한 후 타당한 전문용어를 파악하는 작업으로 정의된다. 따라서 전문용어 선택 문제는 용어목록의 순위화 작업과 순위화된 목록에서 전문용어와 비전문용어 간의 경계를 인식하는 작업으로 정의된다. 기존의 전문용어 선택 기법은 주로 용어의 빈도수 등과 같은 통계적 특징만을 이용하였다. 하지만 통계적 특징만으로는 효과적으로 전문용어를 선택하기 어렵다. 본 논문의 논제는 전문용어 선택에서 다양한 전문용어의 특징을 고려하고 이들 중 전문용어 선택에서 효과적인 특징을 찾으려는 것이다. 순위화 문제는 다양한 전문용어 특징을 도출하고 이들을 기계학습방법으로 통합하여 해결한다. 경계인식 문제는 전문용어와 비전문용어의 이진 분류 문제로 정의하고 기계학습방법으로 해결한다. 본 논문의 기법은 경계인식측면에서 78~86%의 정확률과 87%~90%의 재현율을 나타내었으며, 순위화 측면에서 89%~92%의 11포인트 평균정확률을 나타내었다. 또한 기존 연구보다 최고 26%의 성능향상을 보였다.
Publisher
한국정보과학회
Issue Date
2006-08
Language
Korean
Citation

정보과학회논문지 : 소프트웨어 및 응용, v.33, no.8, pp.718 - 729

ISSN
1229-6848
URI
http://hdl.handle.net/10203/87587
Appears in Collection
CS-Journal Papers(저널논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0