KR101016544B1 - 단어 인식 방법 및 기록 매체 - Google Patents

단어 인식 방법 및 기록 매체 Download PDF

Info

Publication number
KR101016544B1
KR101016544B1 KR1020087020028A KR20087020028A KR101016544B1 KR 101016544 B1 KR101016544 B1 KR 101016544B1 KR 1020087020028 A KR1020087020028 A KR 1020087020028A KR 20087020028 A KR20087020028 A KR 20087020028A KR 101016544 B1 KR101016544 B1 KR 101016544B1
Authority
KR
South Korea
Prior art keywords
word
character
matching
score
quality score
Prior art date
Application number
KR1020087020028A
Other languages
English (en)
Other versions
KR20090088304A (ko
Inventor
도모유끼 하마무라
Original Assignee
가부시끼가이샤 도시바
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시끼가이샤 도시바 filed Critical 가부시끼가이샤 도시바
Publication of KR20090088304A publication Critical patent/KR20090088304A/ko
Application granted granted Critical
Publication of KR101016544B1 publication Critical patent/KR101016544B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)

Abstract

판독 재료에 기록된 문자 정보의 문자의 판독에 의해서 획득된 각 단어 후보에 대하여 인식 처리를 수행하는 단어 인식 방법이 제공된다. 이러한 단어 인식 방법은, 각각의 단어 후보를 단어 사전 내의 복수의 단어와 대조하고, 모든 단어에 대하여 각 단어 후보가 단어와 정합하는 정도를 나타내는 정합 스코어를 계산하는 정합 처리 단계(12)와, 각 단어 후보를 구성하는 문자 후보가 임의의 문자와 정합하는 정도를 나타내는 문자 퀄러티 스코어를 계산하는 문자 퀄러티 스코어 계산 단계(13)와, 문자 퀄러티 스코어 계산 단계(13)에서 획득된 문자 퀄러티 스코어에 기초하여 정합 처리 단계(12)에서 획득된 정합 스코어를 보정하는 보정 단계(14)를 포함하는 방법이 제공된다.
문자 후보, 문자 인식, 단어 인식, 문자 퀄러티 스코어, 정합 처리

Description

단어 인식 방법 및 기록 매체{WORD RECOGNITION METHOD AND RECORDING MEDIUM}
본 발명은 단어를 인식하는 단어 인식 방법과, 예컨대 판독 재료(reading material)에 기록된 복수의 문자를 포함하는 단어를 광학적으로 판독하는 광학 문자 판독 장치에서 단어 인식 처리를 실행하는 데에 이용되는 단어 인식 프로그램에 관한 것이다.
예컨대, 광학 문자 판독 장치에서, 판독 재료에 기록된 문자를 판독하는 때에, 각 문자의 인식에 대한 정확도가 낮은 경우에도 단어의 정보를 이용하여 실제 판독이 통상적으로 수행될 수 있다. 다양한 종류의 방법이 실행 방법으로서 전통적으로 제안되어 왔다.
무엇보다도, 일본 특허 출원 공개 제2001-283157호(Jpn. Pat. Appln. KOKAI Publication No. 2001-283157)에 각 단어에 대한 평가치(evaluation value)로서 사후 확률(posteriori pobability)을 이용하여 문자의 수가 고정되지 않는 경우에도 정화한 단어 인식을 가능하게 하는 방법이 개시되어 있다.
도 1은 본 발명의 일 실시예에 따른 단어 인식 방법을 구현하는 단어 인식 시스템의 구조를 개략적으로 도시하는 블록도.
도 2는 단어 인식 방법의 개요를 설명하는 흐름도.
도 3은, 예컨대 스캐너에 의해서 페치(fetch)되는, 알파벳 사용 국가에서의 소정의 형식의 이미지의 일 예를 도시하는 도면.
도 4는 페치된 이미지로부터 검출되는 단어 후보의 일 예를 도시하는 도면.
도 5는 등록된 도시명 단어를 가지는 단어 사전의 일 예를 도시하는 도면.
도 6은 보정 처리를 포함하는 단어 인식 방법을 설명하는 흐름도.
도 7은 정합 스코어 표에 저장된 정합 스코어의 일 예를 도시하는 도면.
도 8은 문자 퀄러티 스코어 표(character quality score table)에 저장된 문자 퀄러티 스코어의 일 예를 도시하는 도면.
도 9는 보정된 스코어 표에 저장된 보정 스코어의 일 예를 도시하는 도면.
도 10은 도 6의 단어 정합 처리의 세부사항을 설명하는 흐름도.
도 11은 도 6의 단어 퀄러티 스코어 계산 처리의 세부사항을 설명하는 흐름도.
도 12는 도 6의 보정된 스코어 계산 처리의 세부사항을 설명하는 흐름도.
(해결하고자 하는 과제)
그러나, 전술한 문헌에 기재된 방법은 단어가 기록되는 위치가 이미 알려졌다는 가정하에 제공되는 것이며, 단어가 기록된 위치가 알려지지 않은 때에는 충분한 정확도를 가지고서 단어 인식이 행해질 수 없다. 예를 들면, 정확한 단어가 무질서하게 기록되거나, 정확하지 않은 단어가 적절하게 기록된 때에는, 올바르지 않은 단어와 유사한 사전 내의 단어의 평가치(정합 스코어, matching score)는 상승하고, 이로 인하여 잘못된 인식이 수행되기 쉽다.
따라서, 본 발명의 목적은 기록된 단어의 위치가 알려지지 않은 경우에도 단어 인식을 정확하게 수행할 수 있는 단어 인식 방법 및 단어 인식 프로그램을 제공하는 것이다.
(과제 해결 수단)
본 발명에 따르면, 판독 재료에 기록된 문자 정보의 문자의 판독에 의해서 획득된 각 단어 후보(word candidate)에 대하여 인식 처리를 수행하는 단어 인식 방법으로서, 각각의 단어 후보를 단어 사전 내의 복수의 단어와 대조하고, 모든 단어에 대하여 각 단어 후보가 단어와 정합하는 정도를 나타내는 정합 스코어를 계산하는 정합 처리 단계와, 각 단어 후보를 구성하는 문자 후보가 임의의 문자(arbitrary character)와 정합하는 정도를 나타내는 문자 퀄러티 스코어를 계산하는 문자 퀄러티 스코어 계산 단계와, 문자 퀄러티 스코어 계산 단계에서 획득된 문자 퀄러티 스코어에 기초하여 정합 처리 단계에서 획득된 정합 스코어를 보정하는 보정 단계를 포함하는 방법이 제공된다.
본 발명에 따르면, 컴퓨터로 하여금 판독 재료에 기록된 문자 정보에서의 문자 판독에 의해서 획득된 단어 후보에 대한 인식 처리를 수행할 수 있도록 하는 단어 인식 프로그램으로서, 각 단어 후보를 단어 사전 내의 복수의 단어와 대조하고, 모든 단어에 대하여 각 단어 후보가 단어와 정합하는 정도를 나타내는 정합 스코어를 계산하는 정합 처리 단계와, 각 단어 후보를 구성하는 문자 후보가 임의의 문자와 정합하는 정도를 나타내는 문자 퀄러티 스코어를 계산하는 문자 퀄러티 스코어 계산 단계와, 문자 퀄러티 스코어 계산 단계에서 획득된 문자 퀄러티 스코어에 기초하여 정합 처리 단계에서 획득된 정합 스코어를 보정하는 보정 단계를 포함하는 단어 인식 프로그램이 제공된다.
이제, 본 발명에 따른 일 실시예가 첨부된 도면을 참조하여 아래에서 설명될 것이다.
도 1은 본 발명의 일 실시예에 따른 단어 인식 방법을 구현하는 단어 인식 시스템의 구조를 도시한다.
도 1에서, 이러한 단어 인식 시스템은 CPU(1), 입력 장치(2), 이미지 입력 수단으로서의 스캐너(3), 디스플레이 장치(4), 저장 수단으로서의 제1 메모리(5), 저장 수단으로서의 제2 메모리(6), 판독 장치 및 기타 장치로 구성된다.
CPU(1)는 제2 메모리(6)에 저장된 오퍼레이팅 시스템 프로그램 및 제2 메모리(6)에 저장된 애플리케이션 프로그램(예컨대, 단어 인식 프로그램)을 실행하여, 예컨대 아래에서 상세히 설명될 단어 인식 처리를 수행한다.
입력 장치(2)는, 예컨대 키보드, 마우스 등으로 구성되며, 사용자에 의해서 이용되어, 다양한 종류의 동작을 수행하거나, 다양한 종류의 데이터를 입력한다.
스캐너(3)는 광학 스캐너에 기초하여 판독 재료에 기록된 단어의 각 문자를 판독하고, 판독된 문자를 입력한다.
디스플레이 장치(4)는, 예컨대 디스플레이 장치 또는 프린터로 구성되며, 다양한 종류의 데이터를 출력한다.
제1 메모리(5)는, 예컨대 RAM으로 구성되며, CPU(1)를 위한 작업 메모리로서 이용되어 처리되는 다양한 종류의 데이터를 일시적으로 저장한다. 예를 들면, 제1 메모리(5)는, 아래에서 설명될 문자 사전(9), 단어 사전(10), 확률표(11) 등을 일시적으로 저장한다.
제2 메모리(6)는, 예컨대 하드 디스크 장치로 구성되며, CPU(1)를 동작시키기 위한 다양한 프로그램 등을 저장한다. 제2 메모리(6)는 입력 장치(2), 스캐너(3), 디스플레이 장치(4), 제1 메모리(5), 제2 메모리(6), 판독 장치 등을 동작시키는 데에 이용되는 오퍼레이팅 시스템 프로그램과, 단어 인식 프로그램과, 각 단어를 구성하는 문자의 인식을 위한 문자 사전(9)과, 단어 인식을 위한 단어 사전(10)과, 각 단어를 구성하는 문자의 출현 확률을 저장하기 위한 단어 사전(10) 등을 저장한다. 단어 사전(10)은 미리 인식되어야 할 복수의 단어 후보를 저장하며, 이것은 도시명 사전으로, 이 영역에 단어 인식 시스템이 설치된다. 예컨대, 주(state)의 도시명이 등록된다.
판독 장치(7)는, 예컨대 CD-ROM 드라이브 장치로 구성되며, 저장 매체로서의 CD-ROM(8)에 저장된 단어 인식을 위한 단어 인식 프로그램 또는 단어 사전(10)을 판독한다. 판독 장치(7)에 의해서 판독되는 단어 인식 프로그램, 문자 사전(9), 단어 사전(10) 및 확률표(11)는 제2 메모리(6)에 저장된다.
이제, 도 2의 흐름도를 참조하여 아래에서 단어 인식 방법의 개요가 설명될 것이다.
먼저, 스캐너(3)에 의해서 우편물(P)의 이미지를 페치(판독)하는 이미지 페치 처리가 수행된다(단계 ST1). 이러한 이미지 페치 처리에 의해서 페치된 이미지에 기초하여 주소가 기록된 영역을 검출하는 영역 검출 처리가 수행된다(단계 ST2). 이러한 영역 검출 처리에 의해서 검출된 어드레스 기록 영역으로부터 도시명에 대응하는 단어의 각 문자에 따라 직사각형(rectangular) 영역 내에 문자 패턴을 오려내기 위한 수직 투사(projection) 또는 수평 투사를 이용하는 컷아웃(cutout) 처리가 수행된다(단계 ST3). 이러한 컷아웃 처리에 의해서 오려진 단어의 각 문자의 문자 패턴을 문자 사전(9)에 저장된 문자 패턴과 비교함으로써 획득된 유사도에 기초하여 문자 인식 후보를 획득하는 문자 인식 처리가 시행된다(단계 ST4). 단어 사전(10)의 각 도시명의 사후 확률을 계산하고, 문자 인식 처리에 의해서 획득된 각 단어의 인식 결과, 단어 사전(10)에 저장된 도시명의 각 문자 및 확률표(11)를 이용하여 가장 높은 사후 확률을 가지는 도시명을 단어로서 인식하는 단어 인식 처리가 수행된다(단계 ST5). 각 처리는 CPU(1)에 의해서 제어된다.
이제, 구체적인 예로서, 예컨대 알파벳 사용 국가의 소정의 형식으로 기록된 주소로부터 도시명을 판독하는 일 예에 관하여 설명할 것이다.
도 3은, 예컨대 스캐너에 의해서 페치된 알파벳 사용 국가의 소정의 형식의 이미지의 일 예를 도시한다. 도 4는, 예컨대 스캐너에 의해서 페치된 이미지로부터 검출된 단어 후보의 일 예를 도시하는 도면이다. 도 5는 등록된 도시명을 가지는 단어 사전의 일 예를 도시한다. 이 경우에, 도 4의 이미지에 도시된 이러한 단 어 후보는 도 3의 이미지로부터 검출되며, 이러한 단어 후보는 (예컨대, 도 5의 단어 사전에 등록된 도시명과 같은) 단어 사전에 등록된 단어에서 찾아지며, (예컨대, 도시명과 같은) 그러한 형태 등으로 기록된 단어가 특정된다. 이때, 특히 본실시예에서 단어 후보와 단어 사전의 단어에 대한 정합 처리의 결과에 대하여 사전결정된 보정 처리가 수행된다.
여기서, 이제는 본 실시예에 따른 보정 처리를 포함하는 단어 인식 방법이 도 6의 흐름도를 참조하여 기술될 것이다.
예컨대, 도 3에 도시된 것과 같은 형식의 이미지가 스캐너를 통해서 페치되는 때에, 이미지 내에 포함된 각 단어 후보는 도 4에 도시된 것과 같이 검출된다(단계 11). 각각의 검출된 단어 후보에는 일련번호가 부여된다.
각 단어 후보에 대한 단어 정합 처리가 수행된다(단계 12). 단어 정합 처리는 각 단어 후보를 복수의 단어와 대조하여 모든 단어에 대하여 그 단어 후보가 사전의 단어와 정합하는 정도를 나타내는 정합 스코어를 계산하는 처리이다.
DP(Dynamic Programming) 정합(또는, "다이내믹 플래닝법(dynamic planning method)")으로 불리는 공지된 기술이 이러한 단어 정합 처리에 이용될 수 있다. 이러한 DP 정합은, 예컨대 상이한 요소 수(element number)(예컨대, 문자 수)를 가지는 대상(예컨대, 단어)을 대조할 때에 유사도의 계산 처리를 최소화하는 알고리즘으로 잘 알려져 있으며, 예를 들면 요소들의 편차(deviance)를 고려하면서 요소들 (정렬) 간의 연관(association)을 수행하여 최적의 대조 처리를 구현한다. 이러한 기술의 이용은, 예컨대 정합 처리의 속도의 향상을 실현 가능하게 한다.
단어 정합 처리에 의해서 계산된 정합 스코어(matching score)는 정합 스코어 표에 저장된다. 도 7은 정합 스코어 표에 저장된 정합 스코어의 일 예를 도시하는 도면이다. 이러한 정합 스코어 표는 모든 단어에 대하여 일련 번호 1 내지 7을 가지는 개별적인 단어 후보와 단어 사전 내의 도시명 단어 "STOCKHOLM", "TOCHICA", "MOHEDA",...의 정합 처리 결과로서 정합 스코어를 저장한다.
"TOSHIBA"는 일련 번호 3을 가지는 단어 후보로서 실제 형식으로 기록된 도시명이며, 단어 사전의 각 도시명에 대한 정합 스코어가 낮아지는 것을 예상할 수 있다. 그러나, 단어 사전은 "TOSHIBA"와 정합하는 다섯 문자의 도시명 단어 "TOCHICA"를 가진다. "TOSHIBA"를 구성하는 각 문자는 형식에 맞게 잘 기록되어 있으므로, 단어 사전의 도시명 "TOCHICA"에 대한 정합 스코어(참조 부호 a)는 다섯 문자의 정합에 기인하여 높아진다.
반면에, 도시명을 나타내는 "StockHolm"은 일련 번호 6을 가지는 단어 후보로서 실제 형식으로 기록되며, 단어 사전의 도시명 "STOCKHOLM"에 대한 정합 스코어가 높아지는 것 예상할 수 있다. 그러나, 단어 사전의 "STOCKHOLM"은 무질서한 형식으로 기록되어 있어, 정합 스코어(참조 부호 b)는 예상만큼 높지않다.
이때에, 참조 부호 a로 표시된 정합 스코어는 참조 부호 b로 표시된 정합 스코어보다 높으며, 따라서, 형식에 맞게 기재된 "TOSHIBA"는 아마도 도시명 "TOCHICA"로 잘못 인식될 수 있을 것이다. 본 실시예는 아래의 개별적인 단계에 기초하여 이러한 잘못된 인식을 회피한다.
단어 정합 처리 이후에, 각 단어 후보에 대한 문자 퀄러티 스코어 계산 처리 가 수행된다(단계 13). 이러한 문자 퀄러티 스코어 계산 처리는 각 단어 후보를 구성하는 각 문자가 임의의 문자(문자 사전 내의 임의의 알파벳 문자)와 정합하는 정도를 나타내는 문자 퀄러티 스코어를 계산하는 처리이다. 예를 들면, 소정의 단어 후보의 소정의 문자 후보의 퀄러티 스코어를 계산하는 때에, 이러한 문자 후보가 문자 사전 내의 임의의 알파벳과 정합할 확률(또는 유사도)이 계산된다. 각 문자 후보에 대한 이러한 계산 처리를 수행함으로써 획득되는 개별적인 퀄러티 스코어의 추가의 결과는 이 단어 후보의 문자 퀄러티 스코어로서 채택된다.
이러한 문자 퀄러티 스코어 계산 처리에서, 전술한 DP 정합은 문자 후보 정합 처리를 수행하는 때에 유사하게 이용될 수 있다.
문자 쿨러티 스코어 계산 처리에 의해서 계산된 문자 퀄러티 스코어는 문자 퀄러티 스코어 표에 저장된다. 도 8은 문자 퀄러티 스코어 표에 저장된 문자 퀄러티 스코어의 일 예를 도시하는 도면이다. 이러한 문자 퀄러티 스코어 표는 일련 번호 1 내지 7을 가지는 단어 후보에 대한 문자 퀄러티 스코어를 저장한다.
예컨대, 형식에 맞추어 기재된 일련 번호 3을 가지는 단어 후보 또는 일련 번호 7을 가지는 단어 후보에서, 각 문자는 올바르게 기록되어 있다. 특히, 문자 간의 경계가 명확하므로, 각 문자는 실패없이 특정될 수 있다. 특정될 각 문자의 형태는 단어 사전 내의 임의의 알파벳과 실질적으로 정합하기 때문에, 이러한 후보의 문자 퀄러티 스코어는 다른 후보의 문자 퀄러티 스코어보다 높다. 예컨대, 일련 번호 3을 가지는 단어 후보 "TOSHIBA"의 경우에, "T", "O", "S", "H", "I", "B" 및 "A"는 적절하여, 이들은 문자 사전의 알파벳 "T", "O", "S", "H", "I", "B" 및 "A"와 정합하고(이들 문자가 이들 알파벳과 정합하거나 유사한 정도가 높음), 따라서 높은 스코어가 주어진다. 일련 번호 7을 가지는 단어 후보의 경우에, 높은 스코어가 주어질 것이다.
반면에, 형식에 맞게 기록된 일련 번호 4를 가지는 단어 후보 또는 일련 번호 6을 가지는 단어 후보에서, 각 문자는 필기체로 무질서하게 기록되어 있다. 특히, 문자 간의 경계가 불명확하므로, 각 문자를 특정하는 것이 어려우며, 각 문자는 잘못 특정되기 쉽다. 각 문자가 올바르게 특정되는 경우에도, 각 문자의 형태가 문자 사전 내의 임의의 알파벳과 실질적으로 정합하지 않는 경우가 종종 있다. 따라서, 이러한 단어 후보는 다른 후보의 문자 퀄러티 스코어보다 낮은 문자 퀄러티 스코어를 가진다. 예컨대, 일련 번호 6을 가지는 무질서하기 기록된 단어 후보 "StockHolm"이 이 경우에 해당하며, 낮은 스코어를 가진다. 마찬가지로 일련 번호 4를 가지는 단어 후보는 낮은 스코어를 가진다.
문자 퀄러티 스코어 계산 처리 이후에, 각 단어 후보에 대하여 보정된 스코어 계산 처리가 수행된다(단계 14). 보정된 스코어 계산 처리는 문자 퀄러티 스코어 계산 처리에 의해서 획득된 문자 퀄러티 스코어에 기초하여 단어 정합 처리에 의해서 획득된 정합 스코어를 보정하는 처리이다. 예컨대, 단어 정합 프로세싱에 의해서 획득된 정합 스코어로부터 문자 퀄러티 스코어 계산 처리에 의해서 획득된 문자 퀄러티 스코어를 감산하는 처리이다. 그 결과, 적절하게 기록된 문자를 가지는 단어 후보의 정합 스코어가 보정 처리에 의해서 상당히 감소되는 반면, 무질서하게 기록된 문자를 가지는 단어 후보의 정합 스코어는 보정 처리에 의해서 약간 감소된다.
보정된 계산 처리에 의해서 계산된 보정 스코어는 보정된 스코어 표에 저장된다. 도 9는 보정된 스코어 표의 보정된 스코어의 일 예를 도시한다. 이러한 보정된 스코어 표는 개별적인 단어의 보정된 스코어를 일련 번호 1 내지 7을 가지는 개별적인 단어 후보 및 단어 사전 내의 도시명 단어 "STOCKHOLM", "TOCHICA", "MOHEDA", ...의 정합 처리의 결과인 보정 정합 스코어의 결과로서 저장한다.
단어 정합 처리가 수행되는 시점에서, 일련 번호 3을 가지는 단어 후보와 사전의 단어 "TOCHICA"의 정합 스코어(참조 부호 a)가 일련 번호 6을 가지는 단어 후보와 사전의 단어 "STOCKHOLM"의 정합 스코어(참조 부호 b)보다 높지만, 보정된 스코어 계산 처리 이후에 스코어의 레벨은 역전된다. 즉, 보정된 스코어 계산 처리 이후에, 일련 번호 6을 가지는 단어 후보와 사전의 단어 "STOCKHOLM"의 정합 스코어(보정된 스코어)(참조 부호 b')는 일련 번호 3을 가지는 단어 후보와 사전의 단어 "TOCHICA"의 정합 스코어(보정된 스코어)(참조 부호 a')보다 높다. 결과적으로, 보정 인식 결과를 획득하는 것이 예상된다.
보정된 스코어 계산 처리 이후에, 보정된 스코어 표에서 가장 높은 보정된 스코어를 가지는 도시명이 단어 사전으로부터 선택되고, 선택된 도시명이 인식 결과로서 출력된다(단계 15).
이제, 도 6에 도시된 단어 정합 처리의 세부사항이 도 10의 흐름도를 참조하여 설명될 것이다.
먼저, 단어 후보의 수 i에 1이 설정된다(단계 21). 그 후에, i번째 후보가 선택된다(단계 22).
이어서, 단어 사전의 수 j에 1이 설정된다(단계 23). 또한, 단어 사전의 j번째 단어가 선택된다(단계 24).
그 후에, 선택된 i번째 단어 후보와 사전의 j번째 단어에 대한 정합 처리가 실행되어 정합 스코어를 계산한다(단계 25). 또한, 정합 스코어가 정합 스코어 표의 위치(i, j)에 기록된다(단계 26).
여기서, j가 사전 내의 모든 단어의 수와 비교된다(단계 27). j가 사전 내의 모든 단어의 수보다 작은 경우에는, j에 1이 더해지며, 단계 24부터의 처리가 반복된다. 반면에, j가 더 작지 않은 경우에는, i가 모든 단어 후보의 수와 비교된다(단계 29). i가 모든 단어 후보의 수보다 작은 경우에는, 1이 i에 더해지며(단계 30), 단계 22부터의 처리가 반복된다. 반면에, i가 더 작지 않은 경우에는 단어 정합 처리가 종료된다.
이제, 도 6의 문자 퀄러티 스코어 계산 처리의 세부사항이 도 11의 흐름도를 참조하여 설명될 것이다.
먼저, 단어 후보의 수 i에 1이 설정된다(단계 41). 또한, i번째 단어 후보가 선택된다(단계 42).
그 후에, 단어 후보를 구성하는 문자 후보의 문자 퀄러티 스코어가 계산된다(단계 43). 추가적으로, 문자 퀄러티 스코어 표의 위치 i에 문자 퀄러티 스코어가 기록된다(단계 44).
이어서, i가 모든 단어 후보의 수와 비교된다(단계 45). i가 모든 단어 후 보보다 작은 경우에는, i에 1이 더해지며(단계 46), 단계 42부터의 처리가 반복된다. 반면에, i가 더 작지 않은 경우에는 문자 퀄러티 스코어 계산 처리가 종료된다.
이제, 도 6의 보정된 스코어 계산 처리의 세부사항이 도 12의 흐름도를 참조하여 설명될 것이다.
먼저, 단어 후보의 수 i에 1이 설정된다(단계 51). 또한, 문자 퀄러티 스코어 표의 위치 i에서의 값이 보정값 h로서 설정된다(단계 52).
그 후에, 단어 사전의 단어의 수 j에 1이 설정된다(단계 53). 또한, 정합 스코어 표의 위치 (j, j)에서의 값이 스코어 s로 판독된다(단계 54). 또한, 보정값 h가 스코어 s로부터 감산되며, 계산 결과가 보정된 스코어 표의 위치 (i, j)에 기록된다(단계 55).
이어서, j가 사전 내의 모든 단어의 수와 비교된다(단계 56). j가 사전의 모든 단어의 수보다 작은 경우에는, j에 1이 더해지고(단계 57), 단계 54부터의 처리가 반복된다. 반면에, j가 더 작지 않은 경우에는, i가 모든 단어 후보의 수와 비교된다(단계 58). i가 모든 단어 후보의 수보다 작은 경우에는, i에 1이 더해지며(단계 59), 단계 52부터의 처리가 반복된다. 반면에, i가 더 작은 경우에는, 보정돈 스코어 계산 처리가 종료한다.
이제, 다양한 종료의 스코어를 계산하는 데에 이용되는 계산식의 다양한 특정 예가 설명될 것이다.
여기서, 단어 사전의 단어, 모든 문자 후보의 문자 인식 결과, 문자 후보의 위치의 전체 집합 및 소정의 위치의 좌측 끝에서 우측 끝까지의 경로의 전체 집합이 각각 다음과 같이 규정된다.
사전의 단어: wi=(ci1, ci2,...), cij∈c(c는 알파벳의 집합)
모든 문자 후보의 문자 인식 결과: r=(r1, r2,...)
위치의 전체 집합: L∈L
위치 L의 좌측 끝에서 우측 끝까지의 경로의 전체 집합: n∈N
소정의 단어 후보와 사전의 소정의 단어의 정합 스코어를 계산하기 위하여, 사후 확률비(posteriori probability ratio)를 이용하는 계산이 수행된다. 이 경우에, 기본적인 계산식으로서, 예컨대 아래의 수학식 1이 채택된다.
Figure 112008058312922-pct00001
수학식의 좌측의 분수 부분의 분자는 사후 확률에 대응하며, 분모는 사후 확률의 분모에 대응한다.
수학식 1에 기초하여 단어 정합 처리에서의 정합 스코어(도 7의 스코어 표에 대응함)를 계산하기 위하여, 다음과 같은 수학식 2가 이용된다.
Figure 112008058312922-pct00002
또한, 문자 퀄러티 스코어 계산 처리에서의 문자 퀄러티 스코어(도 8의 스코어 표에 대응함)를 계산하기 위하여, 아래의 수학식 3이 이용된다.
Figure 112008058312922-pct00003
여기서 수학식 3의 "C*"는 임의의 알파벳을 나타낸다.
마지막으로, 보정된 스코어 계산 처리에서의 보정된 스코어(도 9의 스코어 표에 대응함)의 최대값을 계산하기 위하여, 아래의 수학식 4가 평가 함수로서 이용된다.
Figure 112008058312922-pct00004
전술한 실시예에 따르면, 단어가 기록된 위치가 알려지지 않은 경우에도, 단어 인식이 정확하게 수행될 수 있다. 예컨대, 정확한 단어가 무질서하게 기록되고, 부정확한 단어가 적절히 기록된 경우에도, 정합 스코어가 보정되며, 적절한 평가 값이 획득되어 잘못된 인식의 발생을 회피한다.
사실 본 발명은 전술한 실시예에 한정되지 않으며, 구성 요소가 본 발명의 범위로부터 벗어나지 않고서 구현 단계에서 변경되어 구현될 수 있다. 또한, 전술한 실시예에 기술된 복수의 구성 요소의 적절한 조합에 기초하여 다양한 발명이 이루어질 수 있다. 예컨대, 몇몇 구성 요소는 본 실시예에 기술된 모든 구성 요소로부터 제거될 수 있다. 또한, 상이한 실시예에서의 구성 요소가 적절히 결합될 수 있다.
본 발명에 따르면, 예컨대 판독 재료에 기록된 복수의 문자로 구성되는 단어를 광학적으로 판독하는 광학 문자 판독 장치에서 단어 인식을 수행할 때에, 단어가 기록된 위치가 알려지지 않은 경우에도 단어 인식이 정확하게 수행될 수 있다.

Claims (5)

  1. 판독 재료(reading material)에 기록된 문자 정보에서의 문자의 판독에 의해서 획득된 각 단어 후보(word candidate)에 대한 인식 처리를 수행하는 단어 인식 방법으로서,
    각 단어 후보를 단어 사전 내의 복수의 단어와 대조하고, 모든 단어에 대하여 각 단어 후보가 단어와 정합하는 정도를 나타내는 정합 스코어(matching score)를 계산하는 정합 처리 단계(12)와,
    각 단어 후보를 구성하는 문자 후보가 임의의 문자와 정합하는 정도를 나타내는 문자 퀄러티 스코어(character quality score)를 계산하는 문자 퀄러티 스코어 계산 단계(13)와,
    상기 문자 퀄러티 스코어 계산 단계(13)에서 획득된 문자 퀄러티 스코어에 기초하여 상기 정합 처리 단계(12)에서 획득된 정합 스코어를 보정하는 보정 단계(14)
    를 포함하는 단어 인식 방법.
  2. 제1항에 있어서,
    상기 보정 단계(14)는, 상기 정합 처리 단계(12)에서 획득된 상기 정합 스코어로부터 상기 문자 퀄러티 스코어 계산 단계(13)에서 획득된 상기 문자 퀄러티 스코어를 감산(subtract)하는 처리를 포함하는 단어 인식 방법.
  3. 제1항에 있어서,
    상기 임의의 문자는 알파벳 문자(alphabetical letter) 중 하나인 단어 인식 방법.
  4. 제1항에 있어서,
    상기 보정 단계(14)에서 보정된 개별적인 정합 스코어에서 가장 높은 정합 스코어를 가지는 단어를 인식 결과로서 출력하는 단계(15)를 더 포함하는 단어 인식 방법.
  5. 컴퓨터로 하여금 판독 재료에 기록된 문자 정보에서의 문자 판독에 의해서 획득된 단어 후보에 대한 인식 처리를 수행할 수 있도록 하는 단어 인식 프로그램을 기록한 컴퓨터 판독가능한 기록 매체로서,
    각 단어 후보를 단어 사전 내의 복수의 단어와 대조하고, 모든 단어에 대하여 각 단어 후보가 단어와 정합하는 정도를 나타내는 정합 스코어를 계산하는 정합 처리 단계(12)와,
    각 단어 후보를 구성하는 문자 후보가 임의의 문자와 정합하는 정도를 나타내는 문자 퀄러티 스코어를 계산하는 문자 퀄러티 스코어 계산 단계(13)와,
    상기 문자 퀄러티 스코어 계산 단계(13)에서 획득된 문자 퀄러티 스코어에 기초하여 상기 정합 처리 단계(12)에서 획득된 정합 스코어를 보정하는 보정 단계(14)
    를 포함하는 단어 인식 프로그램을 기록한 컴퓨터 판독가능한 기록 매체.
KR1020087020028A 2007-03-14 2008-02-27 단어 인식 방법 및 기록 매체 KR101016544B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2007-00065522 2007-03-14
JP2007065522A JP4672692B2 (ja) 2007-03-14 2007-03-14 単語認識システムおよび単語認識プログラム

Publications (2)

Publication Number Publication Date
KR20090088304A KR20090088304A (ko) 2009-08-19
KR101016544B1 true KR101016544B1 (ko) 2011-02-24

Family

ID=39759341

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087020028A KR101016544B1 (ko) 2007-03-14 2008-02-27 단어 인식 방법 및 기록 매체

Country Status (5)

Country Link
US (1) US8208685B2 (ko)
EP (1) EP2138959B1 (ko)
JP (1) JP4672692B2 (ko)
KR (1) KR101016544B1 (ko)
WO (1) WO2008111399A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090208112A1 (en) * 2008-02-20 2009-08-20 Kabushiki Kaisha Toshiba Pattern recognition method, and storage medium which stores pattern recognition program
US8676001B2 (en) 2008-05-12 2014-03-18 Google Inc. Automatic discovery of popular landmarks
US8396287B2 (en) 2009-05-15 2013-03-12 Google Inc. Landmarks from digital photo collections
US9183224B2 (en) * 2009-12-02 2015-11-10 Google Inc. Identifying matching canonical documents in response to a visual query
US9984131B2 (en) 2015-09-17 2018-05-29 International Business Machines Corporation Comparison of anonymized data
JP2018088116A (ja) * 2016-11-29 2018-06-07 キヤノン株式会社 情報処理装置、プログラム、情報処理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06111079A (ja) * 1992-09-30 1994-04-22 Nippon Telegr & Teleph Corp <Ntt> 単語読み取り装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3264961B2 (ja) * 1992-01-30 2002-03-11 松下電器産業株式会社 文字認識装置
JPH0684006A (ja) * 1992-04-09 1994-03-25 Internatl Business Mach Corp <Ibm> オンライン手書き文字認識方法
JP3375766B2 (ja) * 1994-12-27 2003-02-10 松下電器産業株式会社 文字認識装置
US5963666A (en) * 1995-08-18 1999-10-05 International Business Machines Corporation Confusion matrix mediated word prediction
JP2000353215A (ja) * 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体
US6847734B2 (en) 2000-01-28 2005-01-25 Kabushiki Kaisha Toshiba Word recognition method and storage medium that stores word recognition program
JP4601835B2 (ja) 2000-01-28 2010-12-22 株式会社東芝 単語認識方法および単語認識プログラムおよび単語認識装置
JP4744317B2 (ja) * 2006-02-16 2011-08-10 富士通株式会社 単語検索装置、単語検索方法、及びコンピュータプログラム
JP4686433B2 (ja) 2006-10-13 2011-05-25 株式会社東芝 単語認識方法および単語認識装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06111079A (ja) * 1992-09-30 1994-04-22 Nippon Telegr & Teleph Corp <Ntt> 単語読み取り装置

Also Published As

Publication number Publication date
EP2138959B1 (en) 2016-09-28
US20080292186A1 (en) 2008-11-27
JP2008226030A (ja) 2008-09-25
KR20090088304A (ko) 2009-08-19
WO2008111399A1 (ja) 2008-09-18
EP2138959A1 (en) 2009-12-30
JP4672692B2 (ja) 2011-04-20
US8208685B2 (en) 2012-06-26
EP2138959A4 (en) 2013-09-11

Similar Documents

Publication Publication Date Title
Fischer et al. Transcription alignment of Latin manuscripts using hidden Markov models
CN110135414B (zh) 语料库更新方法、装置、存储介质及终端
KR101016544B1 (ko) 단어 인식 방법 및 기록 매체
US20090041361A1 (en) Character recognition apparatus, character recognition method, and computer product
US10963717B1 (en) Auto-correction of pattern defined strings
CN111401099B (zh) 文本识别方法、装置以及存储介质
US11315532B2 (en) Chord information extraction device, chord information extraction method and non-transitory computer readable medium storing chord information extraction program
JP2018147178A (ja) コンテナ番号読取り装置、コンテナ番号読取り方法およびコンテナ番号読取りプログラム
CN114677689B (zh) 一种文字图像识别纠错方法和电子设备
JP5357711B2 (ja) 文書処理装置
JP7021496B2 (ja) 情報処理装置及びプログラム
JP2019175317A (ja) 文字認識装置、文字認識方法およびプログラム
Mohapatra et al. Spell checker for OCR
JP2022095391A (ja) 情報処理装置、及び情報処理プログラム
Sturgeon Unsupervised extraction of training data for pre-modern Chinese OCR
JP6511942B2 (ja) 情報処理装置および情報処理プログラム
JP6260350B2 (ja) 画像処理装置及び画像処理プログラム
US20230419712A1 (en) Image processing apparatus, image processing method, and storage medium
JP2018060474A (ja) 地名抽出プログラム、地名抽出装置および地名抽出方法
JP2011018108A (ja) 認識文字列補正装置および認識文字列補正用プログラム
JP4442136B2 (ja) 文字認識方法および装置
JP2004272396A (ja) 文字認識装置、文字認識方法、文字認識プログラム、及び記録媒体
JP2010015502A (ja) 情報処理装置、その制御方法、制御プログラム、および記録媒体
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
CN118036597A (zh) 基于自适应空间度量的结构化信息抽取方法、系统及介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140120

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150120

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160106

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170119

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee