KR20110076750A - 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치 - Google Patents

단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치 Download PDF

Info

Publication number
KR20110076750A
KR20110076750A KR1020100103284A KR20100103284A KR20110076750A KR 20110076750 A KR20110076750 A KR 20110076750A KR 1020100103284 A KR1020100103284 A KR 1020100103284A KR 20100103284 A KR20100103284 A KR 20100103284A KR 20110076750 A KR20110076750 A KR 20110076750A
Authority
KR
South Korea
Prior art keywords
character
word
character string
recognition
candidates
Prior art date
Application number
KR1020100103284A
Other languages
English (en)
Other versions
KR101199747B1 (ko
Inventor
토모요시 아이자와
Original Assignee
오므론 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오므론 가부시키가이샤 filed Critical 오므론 가부시키가이샤
Publication of KR20110076750A publication Critical patent/KR20110076750A/ko
Application granted granted Critical
Publication of KR101199747B1 publication Critical patent/KR101199747B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 인식 대상의 문자열에 해당하는 단어를 특정하는 처리를 단축한다.
해결수단으로서는, 인식 대상 문자열의 화상에 대해, 구성 문자마다 하나 이상의 문자 후보가 신뢰도와 함께 도출되면, 단어 인식 처리부(105)는, 인식 대상 문자열과 구성 문자 수가 일치하는 단어를 단어 후보로서 초기 설정한 후에, 인식 대상 문자열의 각 문자를 문자의 나열 순으로 1 문자씩 처리 대상으로 설정하여, 처리 대상의 문자마다 2종류의 엄선 처리를 실행한다. 제 1의 엄선 처리에서는, 처리 대상의 문자에 대해 설정된 문자 후보 중에서 미리 정한 조건을 충족시키는 신뢰도가 얻어진 후보를 추출한다. 제 2의 엄선 처리에서는, 현시점의 단어 후보 중에서, 인식 대상 문자열 중의 처리 대상의 문자와 같은 위치의 문자가 제 1의 엄선 처리에 의해 엄선된 문자 후보와 일치하는 것을 추출한다. 그리고, 최종적으로 엄선된 단어 후보 중에서 인식 대상 문자열에 해당하는 것을 특정한다.

Description

단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치{WORD RECOGNITION METHOD AND RECORDING MEDIUM OF PROGRAM RECOGNITION WORD AND INFORMATION PROCESS DEVICE}
본 발명은, 카메라나 작도(作圖) 처리 등에 의해 생성된 문자열의 화상을 대상으로 한 인식 처리에 의해, 문자열을 구성하는 각 문자의 문자 후보가 각각 신뢰도와 함께 도출된 것에 응하여, 문자열에 해당하는 단어를 인식하는 기술에 관한 것이다.
일반적인 문자 인식 처리에서는, 인식 대상의 문자열의 화상을 2가화한 후에, 2가 화상으로부터 개개의 문자에 대응하는 영역을 개별적으로 잘라내고, 각 영역의 화상을 각각 문자의 종류마다 등록되어 있는 모델 화상과 대조하고, 가장 높은 유사도가 얻어진 때에 사용된 모델 화상에 대응하는 문자를, 화상 중의 문자에 해당하는 것으로서 특정한다.
단, 처리 대상의 화상의 상태에 의해서는 오인식이 생기는 일이 있기 때문에, 이 점을 고려한 인식 처리 방법이 제안되어 있다. 예를 들면, 특허 문헌 1에는, 인식한 문자에 의해 생성된 문자열에 의해 사전을 검색하고, 사전 내에 검색 대상의 문자열과 동일한 것이 있으면, 인식 결과가 올바르다고 판정하여 문자열을 확정하고, 검색 대상의 문자열과 동일한 것이 발견되지 않은 경우에는, 문자 인식 처리를 다시 하는 것이 기재되어 있다.
또한 특허 문헌 2에는, 문자 인식 대상 데이터에 포함되는 문자마다, 인식 후보 문자와 인식 신뢰도의 조합을 복수 생성한 후에, 각 인식 후보 문자를 복수가지로 조합시켜서 단어 후보를 생성하는 것, 우선도가 높은 단어 후보를 차례로 사용하여 단어 사전을 검색하고, 단어 사전에 포함되는 정보(사전 단어)를 엄선하는 것, 엄선된 사전 단어 중에서 단어 후보와의 유사도가 가장 높은 것을 선정하는 것, 등이 기재되어 있다.
[특허 문헌]
특허 문헌 1 : 일본 특개평5-46814호 공보
특허 문헌 2 : 일본 특개2006-163830호 공보
상기한 각 문헌과 같이, 문자 후보의 조합에 의해 단어 데이터베이스를 대조하는 방법을 취하면, 다수의 조합이 설정되고, 처리 시간이 길어질 우려가 있다. 이 점에 관해, 이하, 구체적인 예를 이용하여 설명한다.
도 10의 (1)은, 문자 인식 대상의 화상의 예로서, 「三三九度」라는 문자열을 촬상함에 의해 생성된 화상을 도시한다. 도 10의 (2)는, 이 화상 중의 4개의 문자에 대한 인식 처리에 의해 도출된 문자 후보를 표 형식으로 하여 도시한 것으로, 이 예에서는, 문자마다 5개의 문자 후보가 얻어진 것으로 하고, 이들의 문자 후보를 신뢰도가 높은 순서로 배치하고 있다.
또한, 이 명세서에서 말하는 신뢰도는, 화상으로부터 잘라내어진 문자 영역을 문자의 모델 화상과 대조한 때에 얻어지는 양자 간의 유사도에 의거하여 설정된다.
도 10의 (2)의 예에 의하면, 인식 대상의 문자열의 2번째의 문자 「三」 및 4번째의 문자 「度」에 대해서는, 각각 올바른 문자가 제 1위의 문자 후보로 설정되어 있지만, 1번째의 문자 「三」 및 3번째의 문자 「九」에는, 각각 잘못된 문자가 제 1위의 문자 후보로 설정되어 있다.
도 10의 (3)은, 도 10의 (2)에 도시한 각 문자 후보의 조합예와, 조합에 의해 생성된 문자열에 의해 단어 데이터베이스를 대조한 결과를, 대응시켜서 도시한다(×표시는 해당하는 단어를 발견하지 못한 것을 나타내고, ○표시는 해당하는 단어를 발견한 것을 나타낸다). 이 예에서는, 각 문자 후보를 신뢰도가 높은 순서로 선택하여 조합을 설정하고, 매회, 1 문자씩 조합 중의 문자 후보를 변경하여 단어 데이터베이스 내의 단어와 대조하고 있는데, 상위의 문자 후보에게 잘못된 문자가 설정되어 있기 때문에, 좀처럼 대조에 성공하지 못한다. 이 때문에, 올바른 단어를 특정하는데는 상당한 시간이 필요해진다. 또한, 이 방법에 의하면 인식 대상의 문자열의 문자열 길이가 길어질수록, 문자 후보의 조합의 수가 증대하여 처리에 필요로 하는 시간도 길어진다.
이와 같이, 상기한 방법에서는, 올바른 단어를 인식할 수는 있지만, 처리 시간이 상당히 길어질 가능성이 있기 때문에, 다른 처리를 병렬하여 실행하는 타입의 기기에 적용하기는 어렵다. 예를 들면, 문자 인식 기능이 설정된 휴대 전화에 있어서, 문자 인식 처리를 행하고 있을 때에 착신을 접수한 경우에는, 착신을 알리는 효과음의 출력이나 표시를 행할 필요가 있는데, 문자 인식 처리가 길어지면, 착신의 통보를 신속하게 행할 수가 없어서, 휴대 전화의 기본적인 기능에 지장이 생길 우려가 있다.
본 발명은 상기한 문제에 착안해 이루어진 것으로, 인식 대상의 문자열에 해당하는 단어를 특정하는 처리시간을 단축하는 것을 과제로 한다.
본 발명에 의한 단어 인식 방법은, 문자열의 화상에 대한 인식 처리의 결과로서, 문자열을 구성하는 문자마다 하나 이상의 문자 후보를 취득한 것에 응하여, 복수의 단어가 등록된 단어 데이터베이스를 이용하여 문자열에 해당하는 단어를 인식하는 것이다. 또한, 문자열의 화상에 대한 인식 처리에서는, 각 문자 후보에 대해, 문자 인식할 때의 모델 화상과의 대조에 의해 도출된 유사도에 의거한 신뢰도를 설정하는 것이 바람직하다. 신뢰도의 높이를 나타내는 수치는, 신뢰도가 높아질수록 큰 값으로 변화하는 경우도 있다면, 신뢰도가 높아질수록 작은 값으로 변화하는 경우도 있다.
본 발명에 의한 단어 인식 방법에서는, 단어 데이터베이스에 포함되는 소정수의 단어를 초기의 단어 후보로 설정한다. 그리고, 인식 대상의 문자열을 구성하는 각 문자를 1 문자씩 처리 대상으로 설정함과 함께, 처리 대상의 문자를 설정할 때마다, 그 설정시의 단어 후보를 대상으로 하여, 인식 대상의 문자열에 있어서 처리 대상의 문자가 배치되어 있는 위치와 같은 위치에 해당 처리 대상의 문자에 대해 취득한 문자 후보가 배치되어 있는 구성의 단어로 단어 후보를 엄선하는 처리를 실행한다.
또한, 「단어 데이터베이스에 포함되는 소정수의 단어를 초기의 단어 후보로 설정」하는 처리란, 단어 데이터베이스에 포함되는 일부의 단어를 초기의 단어 후보로서 추출하는 처리 외에, 단어 데이터베이스에 포함되는 모든 단어를 초기의 단어 후보로 설정하는 처리도 의미하는 것으로 한다. 즉, 단어 데이터베이스에 포함되는 일부의 단어를 대상으로, 1회째의 엄선 처리를 행하여도 좋고, 단어 데이터베이스에 포함되는 모든 단어를 대상으로, 1회째의 엄선 처리를 행하여도 좋다.
또한, 본 발명에 의한 단어 인식 방법에서는, 인식 대상의 문자열 중의 최후의 처리 대상의 문자에 대한 엄선 처리가 종료된 때, 그 시점에서 추출되어 있는 단어 후보 중에서 상기 문자열에 해당하는 단어를 특정한다.
상기한 방법에 의하면, 최초는, 인식 대상의 문자열에 대한 유사 정도에 관계없이, 다수의 단어가 단어 후보로서 설정되어도, 인식 대상의 문자열을 구성하는 각 문자를 1 문자씩 처리 대상으로 설정하여, 처리 대상의 문자마다 단어 후보의 엄선 처리를 행함에 의해, 단어 후보는 점차로 감소한다. 또한, 당초의 단어 후보 중에, 일부의 문자가 문자 후보에 일치하는 단어가 포함되는 경우에도, 그와 같은 단어는, 다른 위치에 있는, 문자 후보에 일치하지 않는 문자에 대한 엄선 처리에 의해 단어 후보로부터 제외된다. 따라서, 최종적으로, 인식 대상의 문자열의 각 구성 문자에 대응하는 문자 후보가 각각 대응하는 구성 문자와 같은 위치에 배치된 구성의 문자열이고, 단어로서 단어 데이터베이스에 등록되어 있는 것만을, 단어 후보로서 남겨 둘 수 있다.
또한, 이 방법에 의하면, 종래와 같이 문자열의 단위로 대조를 행하는 것이 아니라, 단어 중의 1문자를 문자 후보와 대조하면 좋기 때문에, 대조에 있어서 부하가 경감된다. 게다가, 처리가 진행됨에 따라, 대조 대상의 단어 후보의 수가 감소하기 때문에, 종래에 비하여, 처리 시간을 대폭적으로 단축하는 것이 가능해진다.
상기한 방법의 바람직한 실시 양태로서는, 처리 대상의 문자를 설정할 때마다, 그 처리 대상의 문자에 대해 인식 처리에 의해 취득한 문자 후보 중에서, 해당 인식 처리에서 미리 정한 조건에 의거한 허용치를 상회하는 신뢰도가 얻어진 문자 후보를 추출하고, 추출된 문자 후보만으로 대상을 한정하여 단어 후보를 엄선하는 처리를 실행한다.
문자 인식에 오류가 생겨서 올바른 문자가 제 1위의 문자 후보로 설정되지 않은 경우에도, 올바른 문자라면, 어느 정도의 신뢰도를 획득할 수 있다. 따라서, 예를 들면, 시험적인 문자 인식의 결과에 의거하여, 올바른 문자를 문자 후보로서 안정하게 추출할 수 있는 조건을 설정하여, 처리 대상의 문자에 대해 취득한 문자 후보 중에서 상기한 조건에 의거한 허용치를 상회하는 신뢰도가 얻어져 있는 문자 후보를 추출하면, 인식 대상의 문자열에 해당하는 단어가 단어 후보로부터 벗어나는 것을 막음과 함께, 문자 후보의 수를 한정할 수 있다.
보다 바람직하게는, 소정의 임계치를 상회하고, 또한 처리 대상의 문자에 대응하는 문자 후보 중의 최대의 신뢰도에 대한 차가 미리 정한 일정한 값 이내가 되는 신뢰도가 얻어져 있는 것을, 문자 후보를 추출하기 위한 조건으로 하여도 좋다. 이와 같은 조건을 설정하면, 임계치를 상회하는 신뢰도가 얻어진 문자 후보라도, 그 신뢰도의 최대의 신뢰도에 대한 차가 큰 것을, 엄선의 범위로부터 제외할 수 있기 때문에, 노이즈가 될 가능성이 높은 문자 후보를 삭감할 수 있다.
다른 바람직한 양태에 의한 단어 인식 방법에서는, 상기 단어 데이터베이스에 등록되어 있는 단어 중, 상기 인식 대상의 문자열과 구성 문자 수가 일치하는 단어를 초기의 단어 후보로 설정한다. 이와 같이 설정하면, 최초는, 인식 대상의 문자열과 구성 문자 수가 일치하는 단어가 전부 단어 후보로 설정되지만, 인식 대상의 문자열의 각 구성 문자를 차례로 처리 대상으로 설정하여 엄선 처리를 행함에 의해, 최종적으로, 각 구성 문자에 대응하는 문자 후보가 각각에 대응하는 구성 문자와 같은 위치에 배치된 문자열이고, 단어로서 단어 데이터베이스에 등록되어 있는 것으로, 단어 후보를 엄선할 수 있다.
다른 바람직한 양태에 의한 단어 인식 방법에서는, 인식 대상의 문자열 중의 최후의 처리 대상의 문자에 대한 엄선 처리가 종료된 때에 복수의 단어 후보가 추출되어 있을 때, 이들의 단어 후보마다, 그 단어 후보를 구성하는 각 문자에 대응하는 문자 후보의 신뢰도의 평균치를 산출하고, 신뢰도의 평균치가 가장 높은 단어 후보를 문자열에 해당하는 단어로서 특정한다.
일반적으로, 인식 대상의 문자열에 완전 일치하는 단어에서는, 모든 구성 문자가 문자 인식 처리할 때에 높은 신뢰도를 얻을 수 있는 상태에 있기 때문에, 다른 유사한 구성의 단어보다도 신뢰도의 평균치가 높아질 가능성이 높다. 따라서 최종적으로 남은 단어 후보 중에서 신뢰도의 평균치가 가장 높은 것을 문자열에 해당하는 단어로서 특정함에 의해, 해당하는 단어를 올바르게 인식할 수 있을 확률을 높이는 것이 가능해진다.
다음에, 본 발명에 의한 단어 인식용 프로그램은, 복수의 단어가 등록된 단어 데이터베이스가 설정되고, 문자열의 화상에 대한 인식 처리의 결과로서, 해당 문자열을 구성하는 문자마다 하나 이상의 문자 후보를 취득한 컴퓨터에, 상기 문자열에 해당하는 단어를 인식하는 처리를 행하게 하기 위한 것으로, 이하의 초기 설정 수단, 엄선 수단, 단어 특정 수단, 출력 수단으로서 컴퓨터를 기능 시키는 것을 특징으로 한다.
초기 설정 수단은, 단어 데이터베이스에 등록되어 있는 소정수의 단어를 단어 후보로서 초기 설정한다. 또한, 초기 설정 수단은, 단어 데이터베이스에 포함되는 일부의 단어를 초기의 단어 후보로서 설정하여도 좋고, 단어 데이터베이스에 포함되는 모든 단어를 초기의 단어 후보로서 설정하여도 좋다.
엄선 수단은, 인식 대상의 문자열을 구성하는 각 문자를 1 문자씩 처리 대상으로 설정함과 함께, 처리 대상의 문자를 설정할 때마다, 그 설정시의 단어 후보를 대상으로 하여, 인식 대상의 문자열에 있어서 처리 대상의 문자가 배치되어 있는 위치와 같은 위치에 해당 처리 대상의 문자에 대해 취득한 문자 후보가 배치되어 있는 구성의 단어로 단어 후보를 엄선하는 처리를 실행한다.
단어 특정 수단은, 인식 대상의 문자열 중의 최후의 처리 대상의 문자에 대한 엄선 처리가 종료된 때, 그 시점에서 추출되어 있는 단어 후보 중에서 상기 문자열에 해당하는 단어를 특정한다. 출력 수단은, 단어 특정 수단에 의해 특정된 단어를 인식 결과로서 출력한다.
상기한 프로그램에 의하면, 문자 인식 기능을 구비하는 컴퓨터에 또한 인식 대상의 문자열에 해당하는 단어를 특정하는 기능을 설정하여, 인식 대상의 문자열에 해당하는 단어를 인식하는 처리를, 정밀도 좋으면서 고속으로 실시하는 것이 가능해진다.
출력 수단은, 예를 들면, 단어 특정 수단에 의해 특정된 단어를 모니터에 표시하는 수단으로서 구성되지만 이것으로 한정되지 않고, 특정된 단어를 나타내는 전자 데이터를 출력할 수도 있다. 또한, 문자 인식 처리에 있어서, 도출된 각 문자 후보 중 신뢰도가 높은 것을 우선적으로 선택하여 인식 문자열을 조립하는 경우에는, 상기한 프로그램에는, 특정된 단어에 의해 인식 문자열을 보정하는 수단으로서, 컴퓨터를 기능 시키는 프로그램을 포함할 수 있다.
본 발명에 의한 정보 처리 장치는, 복수의 단어가 등록된 단어 데이터베이스와, 문자열의 화상에 대한 인식 처리를 행하여, 해당 문자열을 구성하는 문자마다 하나 이상의 문자 후보를 취득하는 문자 인식 수단과, 단어 데이터베이스 및 문자 인식 수단에 의한 인식 결과를 이용하여 상기 문자열에 해당하는 단어를 인식하는 단어 인식 수단을 구비한다. 또한, 본 발명에 의한 정보 처리 장치는, 상기한 프로그램에 의한 초기 설정 수단, 엄선 수단, 단어 특정 수단, 및 출력 수단의 각 수단을 구비한다.
본 발명에 의하면, 문자열의 화상에 대한 인식 처리에 의해 취득한 문자 후보에 의거하여, 단어 데이터베이스로부터 단어 후보를 효율 좋게 엄선하여, 화상 중의 문자열에 해당하는 단어를 특정하는 처리를 고속으로 실시할 수 있다.
도 1은 문자 인식용의 어플리케이션이 조립된 휴대 전화의 외관을 도시하는 도면.
도 2는 상기한 휴대 전화의 구성을 도시하는 블록도.
도 3은 문자 인식용의 어플리케이션에 의해 제시되는 화면의 예를 도시하는 도면.
도 4는 문자 인식용의 어플리케이션의 구성을 도시하는 기능 블록도.
도 5는 인식 대상 문자열에 대한 문자 인식 처리의 결과를 표 형식으로 하여 도시한 도면.
도 6은 문자 후보에 의거한 대조 처리에 의해 단어 후보가 엄선되는 양상을 도시하는 도면.
도 7은 문자 인식 처리부에 의해 실행되는 처리의 순서를 도시하는 플로우 차트.
도 8은 도 7의 처리에 계속된 순서를 도시하는 플로우 차트.
도 9는 단어의 인식을 할 수가 없는 경우의 표시 화면의 예를 도시하는 도면.
도 10은 종래의 인식 처리에 관해, 인식 대상의 문자열의 화상, 문자 후보의 설정예 및 문자 후보의 조합과 대조 결과와의 대응 관계를 도시하는 도면.
도 1은, 본 발명이 적용된 휴대 전화의 외관을, 도 2는, 이 휴대 전화의 전기 구성을, 각각 도시한다.
이 실시예의 휴대 전화(1)는, 표시부(3)나 조작부(4)가 마련된 몸체(1A)의 내부에, 카메라(2), 화상 프로세서(5), 통신 회로(6), 제어 회로(10) 등이 수용된 구성의 것이다. 표시부(3)는, 액정 패널에 의해 구성되고, 조작부(4)에는, 텐 키를 포함하는 복수의 키가 배치된다.
카메라(2)는, CCD 또는 CMOS를 갖는 디지털 카메라이고, 화상 프로세서(5)를 통하여 제어부(10)에 접속된다. 화상 프로세서(5)는, 제어부(10) 내의 CPU(11)로부터의 지령에 의거하여 카메라(2)를 구동하고, 카메라(2)로부터 출력된 화상 데이터를 CPU(11)에 출력한다.
제어부(10)에는, CPU(11) 외에, 주메모리(12), 작업용 메모리(13) 등이 포함된다. 주메모리(12)는, 플래시 메모리 등의 불휘발성 메모리이고, 프로그램이나 설정용의 데이터 등이 보존된다. 한편, 작업용 메모리(13)는 휘발성 메모리(RAM)이고, 카메라(2)에 의해 생성된 화상 데이터나, 후기하는 문자 후보나 단어 후보 등을 일시 보존하는 목적에 사용된다.
상기한 휴대 전화(1)의 제어부(10)에는, 문자열을 대상으로 한 촬영에 의해 생성된 화상을 대상으로 하여 문자 인식을 실행하는 어플리케이션이 실장되어 있다. 도 3은, 이 인식 처리에 응하여 표시부(3)에 제시되는 화면의 한 예를 도시한다.
이 예의 화면에는, 카메라(2)로부터 입력된 화상을 표시하는 영역(30) 외에, 메시지나 인식 결과 등을 표시하기 위한 영역(31)이나, 조작 대상의 키의 기능을 나타내는 영역(32)이 마련된다.
도면 중의 왼쪽의 화면(ㄱ)은, 일련의 인식 처리가 실시되기 전의 상태를 나타내는 것으로, 영역(30) 내에 표시되어 있는 화상에는, 인식 대상의 문자열의 추출 범위를 나타내는 테두리(R)가 겹쳐서 표시되어 있다. 또한, 영역(31)에는, 인식 대상 범위의 지정을 촉구하는 메시지가 표시되어 있다. 이 표시에 대해, 유저는, 테두리(R)의 범위를 확인하고, 필요에 응하여 수정을 행하고, 확정 조작을 행한다. 이 조작에 응하여, 테두리(R) 내의 문자열을 인식하는 처리가 실행되고, 화면은 (ㄱ)의 상태로부터 (ㄴ)의 상태로 변화한다. 변화후의 화면의 영역(31)은, 인식된 문자열을 표시하는 란(31a)과, 이 문자열의 사전 데이터를 표시하는 란(31b)으로 분할되고, 각 란에 각각 대응하는 정보가 표시된다.
도 4는, 상기한 문자 인식용의 어플리케이션의 구성을 도시하는 기능 블록도이다. 이 어플리케이션(100)은, 문자 인식용 데이터베이스(101), 단어 데이터베이스(102), 전처리부(103), 문자 인식 처리부(104), 단어 인식 처리부(105), 인식 결과 보정부(106), 표시 제어부(107) 등을 포함한다. 이들 중, 문자 인식용 데이터베이스(101) 및 단어 데이터베이스(102)는, 주메모리(12)에 격납된 데이터 파일이고, 그 밖의 구성의 실체는, 주메모리(12)에 격납된 프로그램에 의해 움직이는 CPU(11)이다.
문자 인식용 데이터베이스(101)에는, 복수 종의 문자의 모델 화상이 해당 문자를 나타내는 데이터(JIS 코드 등의 코드 정보)에 연관되어 등록되어 있다. 단어 데이터베이스(102)에는, 복수의 단어에 관해, 각각 그 단어의 표기를 나타내는 문자열과 의미 등을 나타내는 사전 데이터가 등록되어 있다.
이 어플리케이션(100)이 기동하면, 화상 프로세서(5)는, 일정한 시간마다 카메라(2)에 촬상을 행하게 하고, 생성된 화상을 어플리케이션(100)에 대해 출력한다. 전처리부(103)는, 화상 프로세서(5)로부터 출력되는 매시(每時)의 화상을 받아들여서, 일단계 전의 화상에 대한 변화량을 추출한다. 또한, 추출된 변화량이 소정의 임계치를 하회하는 상태가 되면, 전처리부(103)는, 그 시점의 화상부터 문자열을 포함하는 영역을 추출하고, 그 영역의 위치나 크기를 표시 제어부(107)에 연락한다.
표시 제어부(107)는, 표시부(3)에 도 3에 도시한 화면을 시작하고, 영역(30) 내에 화상 프로세서(5)로부터 공급된 화상을 표시한다. 또한, 전처리부(103)로부터의 연락에 의해 문자열을 포함하는 영역의 위치나 크기를 취득하면, 이들의 정보에 의거하여, 표시중의 화상에 테두리(R)를 겹쳐서 표시하거나, 영역(31) 내에 메시지를 표시하는 등의 처리를 실행한다.
상기한 화면 표시에 대해, 유저가 테두리(R)에 의해 나타나는 인식 대상 범위를 확정하는 조작을 행하면, 문자 인식 처리부(104)에 의해, 확정된 범위 내의 화상에 대한 인식 처리가 실행된다. 이 처리는 종래와 마찬가지이지만, 이하에 간단히 설명한다.
우선, 문자 인식 처리부(104)는, 테두리(R) 내의 화상을 2가화하고, 2가 화상을 수평, 수직의 각 방향에 따라 투영함에 의해, 개개의 문자에 대응하는 영역(문자 영역)을 추출한다. 다음에, 추출된 문자 영역마다, 그 영역 내의 화상을 문자 인식용 데이터베이스(101) 내의 각 문자의 모델 화상과 대조하여 유사도를 산출하고, 유사도가 소정의 임계치를 초과한 모델 화상에 대응하는 문자를 문자 후보로 설정한다. 또한, 설정된 문자 후보에 대해, 상기한 대조 처리할 때에 산출된 유사도를 신뢰도로서 조합시킨다. 이에 의해, 지정된 범위에 문자열이 포함되어 있는 경우에는, 그 문자열을 구성하는 문자마다, 문자 후보와 신뢰도의 조합을 1조(組) 이상 얻을 수 있다. 또한, 이 실시예의 문자 인식 처리부(104)는, 각 문자의 제 1위의 문자 후보를 조합시키고, 이 대조에 의해 생긴 문자열을 인식 결과를 나타내는 문자열로 설정한다.
이하에서는, 이 문자 인식 처리부(104)의 인식 대상이 되는 문자열(테두리(R) 내에 포함되는 문자열)을 「인식 대상 문자열」이라고 하고, 문자 인식 처리부(104)에 의해 인식 결과로서 설정된 문자열을 「인식 결과 문자열」이라고 한다. 이 실시예에서는, 인식 결과 문자열을 인식 결과 보정부(106)에 제공하는 한편으로, 각 문자의 문자 후보와 신뢰도의 조합을 단어 인식 처리부(105)에 제공한다. 단어 인식 처리부(105)는, 제공된 정보에 의거하여, 인식 결과 문자열과는 관계없이 인식 대상 문자열에 해당하는 단어를 특정한다. 인식 결과 보정부(106)는, 단어 인식 처리부(105)에 의해 특정된 단어를 인식 결과 문자열과 비교하고, 양자가 일치하지 않는 경우에는, 단어 인식 처리부(105)에 의해 특정된 단어에 의해 인식 결과 문자열을 치환한다.
단어 인식 처리부(105)는, 문자 인식 처리부(104)에 의해 설정된 문자 후보를 이용하여, 단어 데이터베이스(102)를 이용한 대조 처리를 행함에 의해, 인식 대상 문자열에 해당할 가능성이 있는 단어의 후보(이하, 「단어 후보」라고 한다)를 서서히 엄선한다. 또한, 단어 인식 처리부(105)는, 최종적으로 엄선된 단어 후보 중에서 인식 대상 문자열에 해당하는 단어를 특정하고, 그 단어의 사전 데이터를 단어 데이터베이스(102)로부터 판독한다. 특정된 단어는 인식 결과 보정부(106)에 제공되고, 사전 데이터는 표시 제어부(107)에 제공된다.
표시 제어부(107)는, 인식 결과 보정부(106)에 의한 처리를 경유한 인식 결과 문자열과, 단어 인식 처리부(105)로부터 제공된 사전 데이터를 이용하여, 도 3의 화면(ㄴ)을 표시한다. 이에 의해, 유저에게 인식 결과가 통지된다.
도 5는, 도 3의 화면(ㄱ)에서 지정된 범위에 포함되어 있던 문자열(인식 대상 문자열)에 대한 문자 인식 처리부(104)의 인식 결과를 표 형식으로 하여 도시한 것이다. 이 실시예에서는, 「三三九度」라는 인식 대상 문자열의 4개의 구성 문자가 올바르게 잘라 나뉘어져서, 문자마다, 5개의 문자 후보가 설정된 것으로 한다. 도 5에서는, 구성 문자마다, 각 문자 후보를 각각 신뢰도에 대응시켜서, 신뢰도가 높은 순서로 나열하여 나타내고 있다. 또한, 신뢰도의 단위는 %이다.
도 6은, 대조 대상의 단어를 세로나열로 배치한 리스트를 이용하여, 단어 인식 처리부(105)가 상기한 문자 후보에 의거한 대조 처리를 행함에 의해 단어 후보가 엄선되는 양상을 도시한다. 또한, 도면중의 리스트에서는, 각 단어의 구성 문자의 위치를, 1, 2, 3, 4의 번호에 의해 나타내고 있다.
이 실시예에서는, 단어 데이터베이스(102)에 등록되어 있는 단어 중에서, 인식 대상 문자열과 같은 문자열 길이의 단어를 추출하고, 이들의 단어를 초기의 단어 후보로 설정한다. 도 6의 리스트(A)는, 이 초기 상태의 단어 후보를 나타내는 것이다.
이 실시예에서는, 문자 인식 처리부(104)에 의해 추출된 4개의 문자를 선두부터 차례로 처리 대상으로 설정하고, 처리 대상의 문자마다, 이하의 2가지의 엄선 처리를 실행한다.
제 1의 엄선 처리에서는,
(1) 60% 이상의 신뢰도가 얻어져 있을 것,
(2) 처리 대상의 문자에 대해 취득한 신뢰도의 최대치와 (1)의 신뢰도와의 차가 20% 이내일 것,
의 2가지를 조건으로 하여, 처리 대상의 문자에 설정되어 있는 문자 후보 중에서, 조건(1) 및 (2)를 충족시키고 있는 것을 추출한다.
제 2의 엄선 처리에서는, 현재 유효로 설정되어 있는 단어 후보를 대상으로, 인식 대상 문자열 중의 처리 대상의 문자와 같은 위치에 배치되어 있는 문자를 제 1의 엄선 처리에 의해 추출된 문자 후보와 대조하고, 양자가 일치하는 단어 후보를 추출하고, 그 밖의 단어 후보를 제외한다. 이 대조 처리에 의하면, 대조의 대상이 되는 단어 후보는 점차로 삭감되고, 최종적으로, 제 1의 엄선 처리에 의해 엄선된 문자 후보의 조합에 일치하는 구성의 단어만이 남아 있게 된다.
도 6의 리스트(B 내지 E)는, 각각 인식 대상 문자열의 1번째, 2번째, 3번째, 4번째의 문자를 처리 대상으로 하여, 문자 후보와 단어 후보의 대조 처리를 상기한 엄선 처리를 실행한 결과를 나타낸다. 구체적으로는, 대조에 의해 문자 후보와의 일치가 인정된 문자의 표시란에 패턴 칠함을 시행하는 한편, 대조에 의해 문자 후보에의 일치가 인정되지 않고, 단어 후보로부터 제외된 단어에 이중선을 긋고 있다. 패턴 칠함이 설정되어 있어도, 이중선이 그어져 있는 단어는, 도중에서 단어 후보로부터 제외되어 있다.
구체적으로, 도 5 및 도 6을 참조하여, 단어 인식 처리부(105)에 의해 실시되는 처리의 개요를 설명한다.
우선, 도 5에 의하면, 인식 대상의 문자열의 선두 문자(제 1 문자)를 처리 대상으로 하여, 제 1의 엄선 처리를 실행하는 경우에는, 앞에 나온 (1) 및 (2)의 조건에 의거하여, 85%부터 65%까지의 범위의 신뢰도가 얻어져 있는 문자 후보가 추출된다. 구체적으로는, 이 예에서는, 도면 중의 「五」 「玉」 「王」 「三」 「二」의 5개의 문자 후보의 전부가 추출된다. 이 후의 제 2의 엄선 처리에서는, 초기의 단어 후보(도 6의 리스트 A)의 1번째의 문자를 상기 5개의 문자 후보와 대조하고, 어느 하나의 문자 후보와의 일치가 인정된 단어만을 단어 후보에게 남겨 둔다.
도 6에 의하면, 제 1 문자를 처리 대상으로 한 제 1의 엄선 처리에서는, 제 1위의 문자 후보인 『五』에 대해 「五三昧所」 「五時五敎」 「五日一石」의 각 단어가 히트하고, 제 3위의 『王』에 대해 「王道樂土」가 히트하고, 제 4위의 『三』에 대해 「三五之隆」 「三顧之禮」 「三三九度」 「三三五五」의 각 단어가 히트하고, 제 5위의 『2』에 대해 「二度三度」 「二人三脚」의 각 단어가 히트한다. 따라서, 도 6의 리스트(B)에 나타내는 바와 같이, 히트한 10개의 단어가 단어 후보로서 남아 있고, 그 밖의 단어는 단어 후보로부터 제외된다.
다음에, 인식 대상의 문자열의 2번째의 문자(제 2 문자)를 처리 대상으로 한 경우에는, 제 1의 엄선 처리에서는, 93%부터 73%까지의 범위의 신뢰도가 얻어져 있는 문자 후보가 추출된다. 따라서 『三』 『五』 『日』의 3후보가 추출되게 된다. 제 2의 엄선 처리에서는, 제 1 문자에 대한 처리에 의해 엄선된 단어 후보의 2번째의 문자를 이들의 문자 후보에 의해 대조하는데, 도면중의 리스트(B)에서 이 대조에 의해 문자 후보에 대해 히트한 것은, 「五三昧所」 「五日一石」 「三五之隆」 「三三九度」 「三三五五」의 5개가 된다. 따라서, 도 6의 리스트(C)에 나타내는 바와 같이, 단어 후보는 이들 5개의 단어로 엄선되고, 다른 단어( 「王道樂土」 「五時五敎」 「三顧之禮」 「二度三度」 「二人三脚」는 단어 후보로부터 제외된다.
인식 대상의 문자열의 3번째의 문자(제 3 문자)를 처리 대상으로 한 경우에는, 제 1의 엄선 처리에서는, 89%부터 69%까지의 범위의 신뢰도가 얻어져 있는 문자 후보가 추출된다. 따라서 『丸』 『九』 『之』의 3후보가 추출되게 된다. 제 2의 엄선 처리에서는, 제 2 문자에 대한 처리에 의해 엄선된 단어 후보의 3번째의 문자를 이들의 문자 후보에 의해 대조하는데, 도면 중의 리스트(C)에서 이 대조에 의해 히트하는 것은, 「三五之隆」 「三三九度」의 2단어가 된다. 따라서, 도 6의 리스트(D)에 나타내는 바와 같이, 단어 후보는 이들의 2단어로 엄선되고, 「五三昧所」 「五日一石」 「三三五五」는 단어 후보로부터 제외된다.
인식 대상의 문자열의 4번째의 문자(제 4 문자)를 처리 대상으로 한 경우에는, 제 1의 엄선 처리에서는, 95%부터 75%까지의 범위의 신뢰도가 얻어져 있는 문자 후보가 추출된다. 따라서 『度』 『庚』의 2후보가 추출되게 된다. 제 2의 엄선 처리에서는, 제 3 문자에 대한 처리에 의해 엄선된 단어 후보의 4번째의 문자를 이들의 문자 후보에 의해 대조하는데, 도면중의 리스트(D)에서 이 대조에 의해 문자 후보에 대해 히트하는 것은, 「三三九度」만이 된다. 따라서, 리스트(E)에 나타내는 바와 같이, 인식 대상 문자열의 모든 문자에 대한 처리가 종료된 시점에서 단어 후보로서 남아 있는 것은 「三三九度」만이 된다.
이와 같이, 도 5, 6의 예에서는, 인식 대상의 문자열의 각 구성 문자를 선두부터 차례로 처리 대상으로 설정하여, 제 1 및 제 2의 엄선 처리를 처리 대상의 문자마다 실행함에 의해, 최종적으로 4문자 구성의 단어 중에서 「三三九度」만이 단어 후보로서 엄선된 상태가 된다. 따라서, 이 최종의 단어 후보를 인식 대상의 문자열에 해당하는 단어로서 특정함에 의해, 문자열을 올바르게 인식하는 것이 가능해진다.
상기한 바와 같이, 제 1의 엄선 처리에 의해, 인식 대상 문자열의 구성 문자마다, 그 문자에 해당할 가능성이 높은 문자만으로 문자 후보가 엄선되고, 제 2의 엄선 처리에 의해, 엄선된 문자 후보를 조합시켰던 구성의 문자열만이 단어 후보로서 남아 있는 상태가 된다. 따라서, 인식 대상 문자열에 해당하는 단어를 용이하게 특정할 수 있다. 또한, 제 2의 엄선 처리에서는, 한정된 수의 문자 후보를 이용하여 1문자를 대상으로 한 대조를 행할 뿐이면 좋고, 또한 처리가 진행됨에 따라 대조 대상의 단어 후보의 수가 감소하기 때문에, 종래의 대조 처리와 비교하면 처리 시간을 대폭적으로 단축하는 것이 가능해진다.
또한, 처리중에 착신을 받은 경우에는, 그 시점에서의 나머지 처리 대상 문자의 수나 조건(1) (2)을 충족시키는 문자 후보의 수, 및 단어 후보의 수 등으로부터, 착신의 통보 처리가 실행 가능해지기 까지의 시간을 예정하는 것이 가능해진다. 따라서, 그 예정에 의거하여, 착신의 통보에 관한 준비를 행할 수가 있기 때문에, 착신에 대한 응답이 대폭적으로 지연되는 것을 방지하는 것이 가능해진다.
도 7 및 도 8은, 단어 인식 처리부(105)에 의해 실행되는 처리의 상세한 순서를 도시한다. 이하, 이 플로우 차트에 따라, 인식 대상 문자열에 해당하는 단어를 특정하기 위해 단어 인식 처리부(105)가 실행하는 처리를 상세히 설명한다.
이 처리에서는, 우선, 단어 데이터베이스(102)로부터 인식 대상 문자열에 대응하는 문자 길이의 단어를 추출하고, 추출된 단어를 작업용 메모리(13) 내에 격납한다(스텝 S1). 또한, 이 때의 단어의 추출수를 단어 총수(W_num) 및 유효 단어수(TR_num)에 각각 격납한다(스텝 S2).
다음에, 이 실시예에서는, 작업용 메모리(13)에 격납된 각 단어가 단어 후보로서 유효화되어 있는지의 여부를, 배열(W(k))(k는 1부터 W_num까지의 값을 취한다)에 의해 관리하도록 하고 있다. 스텝 S3은, 이 배열(W(k))의 각 요소를 전부 「TRUE」, 즉 유효로 설정한다.
다음의 스텝 S4에서는, 인식 대상 문자열 중의 문자를 특정하기 위한 카운터(i)를 「1」로 설정한다. 이에 의해 인식 대상 문자열의 제 1 문자가 처리 대상으로 설정되게 된다.
스텝 S5에서는, 인식 대상 문자열의 i번째의 문자에 대해 설정되어 있는 문자 후보 중에서, 앞에 나온 조건(1) (2)를 충족시킨 것을 추출한다. 이 처리가 제 1의 엄선 처리에 상당한다.
이 후, 대조 대상의 단어를 나타내는 카운터(k)에 초기치인 「1」을 세트하고(스텝 S6), 이하, 이 k의 값에 의해 각 단어에 차례로 주목하면서, 대조 처리를 실행한다(스텝 S7 내지 S13). 이 스텝 S7 내지 13의 루프에 의한 처리가 제 2의 엄선 처리에 상당한다.
이 루프 내의 구체적인 처리를 설명한다. 우선 배열(W(k))의 값을 체크하고, W(k)가 TRUE(유효)이면, k번째의 단어의 i번째의 문자를 스텝 S5에서 추출된 각 문자 후보와 대조한다(스텝 S8). 여기서, 대조 대상의 문자가 어떠한 문자 후보에 일치한 경우(스텝 S9가 「YES」)에는, 카운터(k)를 잉크리먼트함에 의해, 다음의 단어로 대조 대상을 변경한다(스텝 S12). 한편, 대조 대상의 문자가 어느 문자 후보에도 일치하지 않은 경우(스텝 S9가 「NO」)에는, W(k)를 FALSE(무효)로 설정하는 처리(스텝 S10)와, 유효 단어수(TR_num)를 디크리먼트하는 처리(스텝 S11)를 실행하고 나서, 스텝 S12로 진행한다. 스텝 S10, S11의 처리에 의해, k번째의 단어는 단어 후보로부터 제외된 상태가 된다.
인식 대상 문자열의 1번째의 문자가 처리 대상으로 설정되어 있는 단계에서는, 스텝 S1에서 추출된 모든 단어가 단어 후보로 설정되어 있기 때문에, 어느 단어에 대해서도, 스텝 S8, S9가 실행된다. 따라서, 각 단어는, 단어 후보로서 유지된 것과, 단어 후보로부터 제외되는 것으로 분배된다. 이 분배 처리가 종료되면(스텝 S13이 「NO」), 카운터(i)를 잉크리먼트함에 의해, 처리 대상의 문자를 제 2 문자로 변경한다(스텝 S14).
2번째부터 말미까지의 각 문자에 대해서도, 상기한 바와 같은 순서로, 제 1의 엄선 처리(스텝 S5) 및 제 2의 엄선 처리(스텝 S7 내지 S13)를 실행한다. 이에 의해, 도 6에 예시한 바와 같은 단어 후보의 엄선을 실현한다.
모든 문자에 대한 처리가 종료되어, i의 값이 인식 대상 문자열의 문자열 길이를 상회하는 상태가 되면(스텝 S15가 「NO」), 그 시점의 유효 단어수(TR_num)의 값을 체크한다. 여기서 TR_num가 0, 즉 단어 후보가 모두 없음으로 되어 있는 경우(스텝 S16이 「NO」)에는, 단어 인식 처리부(105)는, 인식 결과 보정부(106) 및 표시 제어부(107)에, 인식 대상 문자열에 해당하는 단어가 없는 취지를 연락한다(스텝 S17).
상기에 대해, TR_num>0인 경우(스텝 S16이 「YES」)에는, 단어 인식 처리부(105)는, 값이 TRUE로 설정되어 있는 배열(W(k))의 k의 값에 의거하여, 단어 후보로서 엄선되어 있는 단어를 추출한다(스텝 S18). 여기서 TR_num=1 즉 엄선된 단어 후보가 하나인 경우(스텝 S19가 「NO」)에는, 상기한 스텝 S18에서 추출한 단어를 인식 대상의 문자열에 해당하는 단어로서 특정한다(스텝 S22).
한편, TR_num>1, 즉 최종적으로 복수의 단어 후보가 남은 경우(스텝 S19가 「YES」)에는, 이들의 단어에 관해, 각각각 구성 문자의 신뢰도의 평균치를 산출하고(스텝 S20), 평균치가 가장 높아진 단어를 인식 대상 문자열에 해당하는 단어로서 특정한다(스텝 S21). 또한, 스텝 S20에서는, 각 구성 문자의 신뢰도로서, 그 구성 문자와 일치하는 문자 후보에게 조합되어 있는 신뢰도를 사용한다.
문자 인식 처리부(104)에 의한 문자 인식 처리에서는, 도 5의 예와 같이, 올바른 문자인데도 제 1위의 문자 후보로서 인식되지 않는 문자가 있다. 그러나, 추출된 문자 후보에 의한 조합 중에서 의미를 만들어내는 문자열을 구성하는 조합은 한정되어 있고, 그중)에서, 올바른 문자의 조합에 대해 구한 신뢰도의 평균치는, 다른 조합에 대해 구한 신뢰도의 평균치보다도 높아질 가능성이 높다. 따라서, 최종적으로 복수의 단어 후보가 남은 경우에 스텝 S20 및 S21의 처리를 행함에 의해, 올바른 단어를 높은 확률로 특정하는 것이 가능해진다.
최후의 스텝 S23에서, 단어 인식 처리부(105)는, 상기한 스텝 S21 또는 스텝 S22에서 특정한 단어를 인식 결과 보정부(106)에 연락하고, 그 단어의 사전 데이터를 표시 제어부(107)에 제공한다.
상기한 연락을 받은 인식 결과 보정부(106)는, 연락된 단어를 문자 인식 처리부(104)로부터 제공되어 있는 인식 결과 문자열과 대조하고, 양자가 다른 경우에는, 단어 인식 처리부(105)로부터 제공된 단어에 의해 인식 결과 문자열을 치환한다. 표시 제어부(107)는, 최종적인 인식 결과 문자열과, 단어 인식 처리부(105)로부터 제공된 사전 데이터를 이용하여, 도 3(ㄴ)에 도시한 화면을 표시한다.
또한, 모든 문자에 대한 처리가 종료된 때의 유효 단어수(TR_num)가 0이 되어(스텝 S16이 「NO」), 인식 결과 보정부(106)나 표시 제어부(107)에 해당하는 단어가 없는 취지가 연락된 경우(스텝 S17)에는, 인식 결과 보정부(106)는, 상기한 보정을 행하지 않고, 문자 인식 처리부(104)로부터 제공된 인식 결과 문자열을 그대로 표시 제어부(107)에 건네주게 된다.
도 9는, 인식 대상으로 하여야 할 문자열 「三三九度」중, 선두 문자인 「三」이 포함되지 않는 화상이 생성되고, 그 화상에 대한 인식 처리가 실행된 경우의 결과 표시 화면의 예를 도시한다.
이 예에서는, 최종적으로 단어 후보가 남지 않고, 표시 제어부(107)에 사전 데이터가 건네지지 않았기 때문에, 사전 데이터의 게재란(31b)에 「사전 데이터는 없습니다.」라는 메시지가 표시된다. 또한, 그 위의 인식 결과 문자열의 표시란(31a)에는, 문자 인식 처리부(104)에 의해 작성된 인식 결과 문자열이 보정되지 않고 표시되어 있지만, 이것은, 화상 중의 문자 「三」 「九」 「度」에 대해, 이 예에서도 도 5에 도시한 것과 마찬가지의 인식 결과가 얻어져 있다고 가정하였기 때문이다. 이 경우, 단어 인식 처리부(105)가 인식 대상 문자열에 해당하는 단어를 특정할 수가 없었기 때문에, 인식 결과 보정부(106)에 의한 처리는 행하여지지 않고, 각 구성 문자에 대해 설정된 제 1위의 문자 후보의 조합에 의해, 「三丸度」라는 잘못한 인식 결과 문자열이 표시되어 있다.
상기한 예와 같이, 의미를 만들어내지 않는 문자열이 인식 대상 문자열로 설정된 경우에는, 단어 데이터베이스(102)에 해당하는 단어가 등록되어 있지 않기 때문에, 올바른 인식 결과가 표시되지 않는 경우가 있다. 그러나, 이와 같은 표시를 행함에 의해, 사전 데이터의 존재가 인식의 정밀도에 영향을 미치는 것을, 유저에게 알릴 수가 있다.
또한, 도 7, 8에 도시한 처리에서는, 초기의 단어 후보가 되는 각 단어를 단어 데이터베이스(102)로부터 추출하여 작업용 메모리(13)에 격납함과 함께, 이들의 단어의 유효·무효를 배열(W(k))에 의해 관리하고, 단어 후보로부터 제외된 단어를 포함하는 모든 단어의 유효·무효를 매회 확인하고 있지만, 알고리즘은 이것으로 한정되는 것이 아니다. 예를 들면, 배열(W(k))을 설정하지 않고, 단어 후보로부터 벗어난 후보를 작업용 메모리(13)에서 삭제하고, 매회, 작업용 메모리(13)에 남아 있는 단어를 대상으로 문자 후보의 대조를 행하도록 하여도 좋다. 이와 같이 하면, 단어의 유효·무효를 확인하는 처리가 불필요해지기 때문에, 처리를 보다 고속으로 하는 것이 가능해진다.
또한, 상기한 실시예에서는, 인식 대상 문자열에 대응하는 문자 길이(4문자)의 단어를 단어 데이터베이스(102)로부터 추출하고, 초기의 단어 후보로서 설정하였지만, 이것로 한하지 않고, 인식 대상 문자열과는 구성 문자 수가 다른(구성 문자 수가 많은, 또는 적은) 문자 수의 단어가 초기의 단어 후보에게 포함되어 있어도 좋다.
또한, 단어 데이터베이스(102)에 포함되는 모든 단어를 초기의 단어 후보로 하여도 좋다. 또한, 단어 데이터베이스(102)로부터 일부의 단어를 추출하고, 초기의 단어 후보로서 설정하는 경우에, 상기한 실시예에서는, 단어의 문자 길이에 의거한 추출 처리를 행하였지만, 이것으로 한하지 않고, 문자 종류별(예를 들면 영문자, 한자, 가타카나) 등에 의거하여, 초기의 단어 후보가 되는 단어를 추출하여도 좋다.
또한, 상기한 실시예에서는, 인식 대상 문자열의 각 구성 문자를 선두의 문자부터 차례로 처리 대상으로 설정하여 제 1 및 제 2의 엄선 처리를 실행하였지만, 이것과는 역으로, 말미의 문자부터 문자의 나열 방향에 따라 순번대로 처리 대상 문자를 선택하여, 마찬가지의 엄선 처리를 행하여도 좋다.
또한, 인식 대상 문자열은 일본어로 한하지 않고, 단어 데이터베이스(102)의 데이터 구성을 정돈하면, 영어나 한국어 등의 외국어를 대상으로 한 인식 처리를 행하는 것도 가능하다. 또한, 인식 대상 문자열은, 카메라(2)에 의해 생성된 화상 중의 문자열로 한하지 않고, 작도용의 어플리케이션에 의해 묘화된 문자열 등을 대상으로 하는 것도 가능하다.
더하여, 상기한 실시예에서는, 최종적인 인식 결과 문자열을 사전 데이터와 함께 표시하였지만, 이 기능을 OCR 소프트에 적용하는 경우에는, 인식 결과 문자열만을 표시하여도 좋다. 또한 표시에 대신하여, 다른 어플리케이션(메일 에디터, 메모장 등)의 작업용의 데이터 파일에 인식 결과 문자열의 텍스트 데이터나 사전 데이터를 출력하거나, 인식 결과 문자열을 음성 변환하여, 스피커로부터 출력하도록 하여도 좋다.
또한, 상기한 인식 처리는 휴대 전화로 한하지 않고, 다른 모바일 기기나 퍼스널 컴퓨터에 적용하는 것도 가능하다. 또한, 기존의 OCR 소프트가 조립되어 있는 퍼스널 컴퓨터에, 도 4의 단어 인식 처리부(105)나 인식 결과 보정부(106)의 기능을 도입하면, OCR 소프트로 인식된 결과의 오류를 보정하는 것이 가능하다.
1 : 휴대 전화 2 : 가메라
3 : 표시부 11 : CPU
12 : 주메모리 13 : 작업용 메모리
100 : 문자 인식용의 어플리케이션 101 : 문자 인식용 데이터베이스
102 : 단어 데이터베이스 103 : 전처리부
104 : 문자 인식 처리부 105 : 단어 인식 처리부
107 : 표시 제어부

Claims (6)

  1. 문자열의 화상에 대한 인식 처리의 결과로서, 상기 문자열을 구성하는 문자마다 하나 이상의 문자 후보를 취득한 것에 응하여, 복수의 단어가 등록된 단어 데이터베이스를 이용하여 상기 문자열에 해당하는 단어를 인식하는 방법에 있어서,
    상기 단어 데이터베이스에 포함되는 소정수의 단어를 초기의 단어 후보로 설정하는 단계와,
    상기 인식 대상의 문자열을 구성하는 각 문자를 1 문자씩 처리 대상으로 설정함과 함께, 처리 대상의 문자를 설정할 때마다, 그 설정시의 단어 후보를 대상으로 하여, 상기 인식 대상의 문자열에 있어서 처리 대상의 문자가 배치되어 있는 위치와 같은 위치에 해당 처리 대상의 문자에 대해 취득한 문자 후보가 배치되어 있는 구성의 단어로 단어 후보를 엄선하는 처리를 실행하는 단계와,
    상기 인식 대상의 문자열 중의 최후의 처리 대상의 문자에 대한 엄선 처리가 종료된 때, 그 시점에서 추출되어 있는 단어 후보 중에서 상기 문자열에 해당하는 단어를 특정하는 단계를 포함하는 것을 특징으로 하는 단어 인식 방법.
  2. 제 1항에 있어서,
    상기 처리 대상의 문자를 설정할 때마다, 그 처리 대상의 문자에 대해 상기 인식 처리에 의해 취득한 문자 후보 중에서, 해당 인식 처리에서 미리 정한 조건에 의거한 허용치를 상회하는 신뢰도가 얻어진 문자 후보를 추출하고, 추출된 문자 후보만으로 대상을 한정하여 상기 단어 후보를 엄선하는 처리를 실행하는 것을 특징으로 하는 단어 인식 방법.
  3. 제 1항에 있어서,
    상기 초기의 단어 후보를 설정하는 처리에서는, 상기 단어 데이터베이스에 등록되어 있는 단어 중, 상기 인식 대상의 문자열과 구성 문자 수가 일치하는 단어를 초기의 단어 후보로 설정하는 것을 특징으로 하는 단어 인식 방법.
  4. 제 1항에 있어서,
    상기 인식 대상의 문자열 중의 최후의 처리 대상의 문자에 대한 엄선 처리가 종료된 때에 복수의 단어 후보가 추출되어 있을 때, 이들의 단어 후보마다, 그 단어 후보를 구성하는 각 문자에 대응하는 문자 후보의 신뢰도의 평균치를 산출하고, 신뢰도의 평균치가 가장 높은 단어 후보를 상기 문자열에 해당하는 단어로서 특정하는 것을 특징으로 하는 단어 인식 방법.
  5. 복수의 단어가 등록된 단어 데이터베이스가 설정되고, 문자열의 화상에 대한 인식 처리의 결과로서, 해당 문자열을 구성하는 문자마다 하나 이상의 문자 후보를 취득한 컴퓨터에, 상기 문자열에 해당하는 단어를 인식하는 처리를 행하게 하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 있어서,
    상기 단어 데이터베이스에 등록되어 있는 소정수의 단어를 단어 후보로서 초기 설정하는 초기 설정 수단과,
    상기 인식 대상의 문자열을 구성하는 각 문자를 1 문자씩 처리 대상으로 설정함과 함께, 처리 대상의 문자를 설정할 때마다, 그 설정시의 단어 후보를 대상으로 하여, 상기 인식 대상의 문자열에 있어서 처리 대상의 문자가 배치되어 있는 위치와 같은 위치에 해당 처리 대상의 문자에 대해 취득한 문자 후보가 배치되어 있는 구성의 단어로 단어 후보를 엄선하는 처리를 실행하는 엄선 수단과,
    상기 인식 대상의 문자열 중의 최후의 처리 대상의 문자에 대한 엄선 처리가 종료된 때, 그 시점에서 추출되어 있는 단어 후보 중에서 상기 문자열에 해당하는 단어를 특정하는 단어 특정 수단과,
    단어 특정 수단에 의해 특정된 단어를 인식 결과로서 출력하는 출력 수단의 각 수단으로서 상기 컴퓨터를 기능 시키는 것을 특징으로 하는 단어 인식용의 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  6. 복수의 단어가 등록된 단어 데이터베이스와, 문자열의 화상에 대한 인식 처리를 행하여, 해당 문자열을 구성하는 문자마다 하나 이상의 문자 후보를 취득하는 문자 인식 수단과, 상기 단어 데이터베이스 및 상기 문자 인식 수단에 의한 인식 결과를 이용하여 상기 문자열에 해당하는 단어를 인식하는 단어 인식 수단을 구비하는 정보 처리 장치에 있어서,
    상기 단어 데이터베이스에 등록되어 있는 소정수의 단어를 단어 후보로서 초기 설정하는 초기 설정 수단과,
    상기 인식 대상의 문자열을 구성하는 각 문자를 1 문자씩 처리 대상으로 설정함과 함께, 처리 대상의 문자를 설정할 때마다, 그 설정시의 단어 후보를 대상으로 하여, 상기 인식 대상의 문자열에 있어서 처리 대상의 문자가 배치되어 있는 위치와 같은 위치에 해당 처리 대상의 문자에 대해 취득한 문자 후보가 배치되어 있는 구성의 단어로 단어 후보를 엄선하는 처리를 실행하는 엄선 수단과,
    상기 인식 대상의 문자열 중의 최후의 처리 대상의 문자에 대한 엄선 처리가 종료된 때, 그 시점에서 추출되어 있는 단어 후보 중에서 상기 문자열에 해당하는 단어를 특정하는 단어 특정 수단과,
    단어 특정 수단에 의해 특정된 단어를 인식 결과로서 출력한 출력 수단의 각 수단을 더 구비하는 것을 특징으로 하는 정보 처리 장치.
KR1020100103284A 2009-12-29 2010-10-22 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치 KR101199747B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2009-299227 2009-12-29
JP2009299227A JP5434586B2 (ja) 2009-12-29 2009-12-29 単語認識方法および単語認識用のプログラムならびに情報処理装置

Publications (2)

Publication Number Publication Date
KR20110076750A true KR20110076750A (ko) 2011-07-06
KR101199747B1 KR101199747B1 (ko) 2012-11-08

Family

ID=44174382

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100103284A KR101199747B1 (ko) 2009-12-29 2010-10-22 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치

Country Status (4)

Country Link
US (1) US8855424B2 (ko)
JP (1) JP5434586B2 (ko)
KR (1) KR101199747B1 (ko)
CN (1) CN102110229B (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020022574A1 (en) * 2018-07-23 2020-01-30 Hewlett-Packard Development Company, L. P. Character recognition using previous recognition result of similar character
WO2023229153A1 (ko) * 2022-05-25 2023-11-30 (주)그리드원 Ocr 대상 문자열에 대한 문자열 보정 방법 및 상기 문자열 보정 방법을 수행하는 컴퓨팅 장치

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982012B (zh) * 2011-09-07 2017-03-22 百度在线网络技术(北京)有限公司 一种用于获取失序文本中的目标字符串的方法与设备
JP2014078168A (ja) * 2012-10-11 2014-05-01 Fuji Xerox Co Ltd 文字認識装置及びプログラム
US9147275B1 (en) * 2012-11-19 2015-09-29 A9.Com, Inc. Approaches to text editing
US9043349B1 (en) 2012-11-29 2015-05-26 A9.Com, Inc. Image-based character recognition
US20150356173A1 (en) * 2013-03-04 2015-12-10 Mitsubishi Electric Corporation Search device
JP6131765B2 (ja) * 2013-08-06 2017-05-24 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
CN103473309B (zh) * 2013-09-10 2017-01-25 浙江大学 一种基于概率单词选择和监督主题模型的文本分类方法
CN105404903B (zh) * 2014-09-15 2020-06-23 联想(北京)有限公司 信息处理方法、装置及电子设备
CN104268603B (zh) * 2014-09-16 2017-04-12 科大讯飞股份有限公司 用于文字性客观题的智能阅卷方法及系统
WO2018062580A1 (ko) * 2016-09-28 2018-04-05 주식회사 시스트란인터내셔널 문자를 번역하는 방법 및 그 장치
JP6593303B2 (ja) * 2016-10-31 2019-10-23 京セラドキュメントソリューションズ株式会社 問題作成装置、問題作成方法、及び画像形成装置
WO2018079426A1 (ja) * 2016-10-31 2018-05-03 パナソニックIpマネジメント株式会社 加熱調理器および加熱調理器の制御方法
US10467494B2 (en) 2016-12-16 2019-11-05 Tata Consultancy Services Limited Method and system for container code recognition
CN108984513B (zh) * 2017-06-05 2022-03-04 阿里巴巴集团控股有限公司 一种词串识别方法和服务器
JP6780129B1 (ja) * 2019-03-27 2020-11-04 三菱電機ビルテクノサービス株式会社 設備機器情報収集システム
CN110414450A (zh) * 2019-07-31 2019-11-05 北京字节跳动网络技术有限公司 关键词检测方法、装置、存储介质及电子设备
CN111274369A (zh) * 2020-01-09 2020-06-12 广东小天才科技有限公司 一种英文单词的识别方法及装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54854A (en) 1977-06-03 1979-01-06 Sharp Corp Multi-function analog signal process circuit
US4764972A (en) * 1985-05-23 1988-08-16 Nec Corporation Continuous characters recognition system
JPH0540854A (ja) * 1991-08-06 1993-02-19 Oki Electric Ind Co Ltd 文字認識結果の後処理方法
JPH0546814A (ja) 1991-08-20 1993-02-26 Nec Corp 文字読み取り装置
JPH07182465A (ja) * 1993-12-22 1995-07-21 Hitachi Ltd 文字認識方法
JP2734386B2 (ja) * 1994-12-20 1998-03-30 日本電気株式会社 文字列読み取り装置
JPH08249427A (ja) * 1995-03-09 1996-09-27 Fujitsu Ltd 文字認識方法および装置
JPH0991386A (ja) * 1995-09-28 1997-04-04 Toshiba Corp 文書解析装置及び形態素解析方法
US6246794B1 (en) 1995-12-13 2001-06-12 Hitachi, Ltd. Method of reading characters and method of reading postal addresses
JP3452774B2 (ja) * 1997-10-16 2003-09-29 富士通株式会社 文字認識方法
US7679534B2 (en) 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
WO2000057350A1 (en) * 1999-03-19 2000-09-28 Raf Technology, Inc. Rollup functions for efficient storage, presentation, and analysis of data
JP2006163830A (ja) 2004-12-07 2006-06-22 Nec Corp 文字認識装置、文字認識方法、および文字認識プログラム
US8065135B2 (en) * 2006-04-06 2011-11-22 Research In Motion Limited Handheld electronic device and method for employing contextual data for disambiguation of text input
US8189919B2 (en) * 2007-12-27 2012-05-29 Chung Mong Lee Method and system for container identification

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020022574A1 (en) * 2018-07-23 2020-01-30 Hewlett-Packard Development Company, L. P. Character recognition using previous recognition result of similar character
WO2023229153A1 (ko) * 2022-05-25 2023-11-30 (주)그리드원 Ocr 대상 문자열에 대한 문자열 보정 방법 및 상기 문자열 보정 방법을 수행하는 컴퓨팅 장치

Also Published As

Publication number Publication date
JP5434586B2 (ja) 2014-03-05
US8855424B2 (en) 2014-10-07
KR101199747B1 (ko) 2012-11-08
CN102110229A (zh) 2011-06-29
CN102110229B (zh) 2015-01-21
JP2011138435A (ja) 2011-07-14
US20110158548A1 (en) 2011-06-30

Similar Documents

Publication Publication Date Title
KR101199747B1 (ko) 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치
CN109344831B (zh) 一种数据表识别方法、装置及终端设备
US9589198B2 (en) Camera based method for text input and keyword detection
US10489672B2 (en) Video capture in data capture scenario
JP4995554B2 (ja) 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法
JP6527410B2 (ja) 文字認識装置、文字認識方法、及びプログラム
US10089557B2 (en) Method and apparatus for recognizing characters
CN107451127B (zh) 一种基于图像的单词翻译方法及系统、移动设备
KR101002899B1 (ko) 문자 인식 방법 및 장치
KR101078086B1 (ko) 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법
WO2013118672A1 (ja) 文字読取用のプログラムおよび文字読取装置ならびに文字読取方法
CN111353501A (zh) 一种基于深度学习的书本点读方法及系统
US20230215201A1 (en) Identify card number
EP3553702A1 (en) Image recognition-based communication method and device
JP6253354B2 (ja) 帳票読取装置、プログラムおよび帳票読取システム
US20130314755A1 (en) Image capture device for extracting textual information
JP2006209599A (ja) 携帯端末、文字読取方法および文字読取プログラム
JP4800144B2 (ja) 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体
JP2009223556A (ja) 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造
US20130330005A1 (en) Electronic device and character recognition method for recognizing sequential code
JP2008282094A (ja) 文字認識処理装置
CN113435217B (zh) 语言测试处理方法、装置及电子设备
JP2003030654A (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E601 Decision to refuse application
AMND Amendment
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20151016

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20161020

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20171018

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20181023

Year of fee payment: 7