주소 영상에서의 문맥 정보를 이용한 문자 인식 후보 재정렬Reordering of character recognition candidates using contextual information in address image

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 465
  • Download : 0
우편 영상 내 수신 부분 주소 인식을 위해서 기본 낱자 인식기의 저조한 1순위 인식률을 충분히 보완할 수 있는 방법이 필요하다. 따라서 주소열을 분할한 분할 요소별로 다수의 인식 후보를 가지는데, 인식 후보의 개수가 증가함에 따라 고려해야 하는 주소열 후보의 수가 기하 급수적으로 증가하는 문제점이 발생하게 된다. 이는 빠른 우편물 처리가 요구되는우편물 영상의 인식에서 바람직하지 못하다. 본 논문에서는 이를 해결하기 위한 방법으로, 문맥 정보를 이용한 인식 후보 재정렬 방법을 제안했다.주소는 제한된 어휘와 정형화된 구조를 가지기 때문에 이웃한 분할 요소들의 문맥 정보를 고려하면 주소열을 인식하는데 효과적으로 도움이 될 수 있다. 문맥 정보를 이용하기 위하여 낱자 n-gram 언어 모델을 사용하였는데, 이는 방대한 주소 정보를 모두 저장하고 있는 복잡한 주소 사전 방식 대신, 빈도수에 기반한 간단한 조건부 확률로 표현된다. 그러나 낱자 n-gram 모델만을 이용하여 인식 후보를 재정렬할 시, 지역적으로 빈도수가 많은 조합에 대해 인식 후보의 순위가 높아지는 문제점이 발생한다. 따라서 동적 프로그래밍 기법을 이용하여 문맥 정보를 전역적으로 확장해서 주소열 전체를 고려한 효과를 내도록 하였다. 실험을 통하여 제안한 방법이 효율적인 정답 순위 상승 효과가 있다는 것을 알았다. rescoring 방법 중에는 forward rescoring 방법이 인식률 향상이 높았으며, 언어 모델은 실행 속도 측면에서는 bigram 언어 모델이, 인식률 향상 측면에서는 trigram 언어 모델을 사용하는 것이 효과가 있었다. 이는 제안한 방법으로 실용적인 주소 인식 후처리를 실현할 수 있다는 것을 의미하며, 궁극적으로는 분할 요소별 인식 후보 갯수의 축소를 통하여 효과적으로 주소열 탐색 시간과 공간을 절약할 수 있다는 의의가 있다.
Advisors
김진형researcherKim, Jin-Hyungresearcher
Description
한국과학기술원 : 전산학전공,
Publisher
한국과학기술원
Issue Date
2004
Identifier
238492/325007  / 020013011
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학전공, 2004.2, [ vii, 35 p. ]

Keywords

문맥 정보; 문자 인식 후보 재정렬; 주소 영상; ADDRESS; CONTEXTUAL INFORMATION; CHARACTER RECOGNITION CANDIDATES

URI
http://hdl.handle.net/10203/34583
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=238492&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0