Entity resolution for integrating biomedical data: a hybrid machine-expert approach생체 의학 데이터 통합을 위한 엔티티 레졸루션: 기계-전문가 하이브리드 접근

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 438
  • Download : 0
최근 생체 의학 데이터베이스의 출현으로 인해, 컴퓨터를 사용한 접근법이 가능해 지면서 생체 의학 데이터에 대한 분석은 매우 중요한 연구 분야로 각광받아 오고 있다. 또한, 이러한 생체 의학 데이터의 통합은 좀 더 풍요롭고 확장적인 분석을 하는 데 있어 필수적이다. 생체 의학 데이터를 통해 분석된 데이터는 인간의 건강과 삶에 직접적으로 연관되기 때문에, 통합을 위해 가장 중요한 이슈 중 하나는 신뢰성이다. 신뢰성 있는 통합을 위한 요구사항을 만족시키기 위해서는 같은 엔티티를 가르키는 중복 레코드를 해결해야 한다. 이것을 엔티티 레졸루션이라고도 한다. 본 논문에서는, 생체 의학 데이터 통합을 위한 엔티티 레졸루션 시스템을 제안하며, 데이터 소스로서 생체 의학 데이터베이스 중 하나인 천연물 데이터베이스에 초점을 맞춘다. 높은 신뢰성을 만족하기 위해, 기계가 거짓 양성과 거짓 음성을 줄이면서도 효율적으로 후보군을 생성하고 분야 해당 전문가가 각 후보군에서 직접 중복 엔티티를 결정하도록 한다. 게다가, 전문가의 결정 결과를 가지고 전문가와 기계가 상호작용하면서 기계가 지속적으로 발전되도록 설계한다. 실험 결과의 합리적인 예를 보여주는 사례 연구를 통해 본 엔티티 레졸루션 시스템을 평가한다.
Advisors
Kim, Myoung Horesearcher김명호researcher
Description
한국과학기술원 :전산학과,
Publisher
한국과학기술원
Issue Date
2015
Identifier
325007
Language
eng
Description

학위논문(석사) - 한국과학기술원 : 전산학과, 2015.2 ,[v, 24 p. :]

Keywords

Entity Resolution; Duplicate Record Detection; Biomedical Data Integration; 엔티티 레졸루션; 중복 레코드 탐지; 생체 의학 데이터 통합

URI
http://hdl.handle.net/10203/206645
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=608626&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0