KR100411697B1 - 문자판독방법및주소판독방법 - Google Patents
문자판독방법및주소판독방법 Download PDFInfo
- Publication number
- KR100411697B1 KR100411697B1 KR1019960064613A KR19960064613A KR100411697B1 KR 100411697 B1 KR100411697 B1 KR 100411697B1 KR 1019960064613 A KR1019960064613 A KR 1019960064613A KR 19960064613 A KR19960064613 A KR 19960064613A KR 100411697 B1 KR100411697 B1 KR 100411697B1
- Authority
- KR
- South Korea
- Prior art keywords
- character
- pattern
- temporary
- string
- address
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
우편물에 손으로 쓴 주소 문자를 올바르게 판독하기 위하여 문자 분할의 정확도와 문자열 인식의 정확도를 향상시킨 문자 판독 방법이 기재되어 있다. 이 방법은 주소 문자열의 영상 정보로부터 임시적인 문자 패턴을 추출하고(단계 206), 임시 문자 패턴의 표(219)를 작성하고 임시 문자 패턴에 대해서 문자 식별을 수행하며(단계 207), 특히 주소 문자열의 번지 부분의 문자들에 대하여 임시 문자 패턴의 주변 정보(가로와 세로의 길이, 가로와 세로의 길이비와, 패턴 간격 등)를 추출하고(단계 212), 그 정보에 기초하여 문자열을 문자들로 분할한다(단계 215).
Description
본 발명은 문자를 판독하는 방법에 관한 것으로서, 더욱 상세하게는 문자열, 특히 우편물등의 서면에 기재되어 있는 주소에 있어서, 한자를 포함하며 손으로 씌어진 문자열을 판독하는 방법에 관한 것이다.
우편물 등의 서면에 씌어 있는 주소의 문자열을 자동으로 판독하기 위해서는, 우편물 서면의 화상을 전기신호로 변환하고, 이어서 문자열이 기재되어 있는 영역을 검출한다. 다음으로, 검출된 문자열 기재 영역의 화상신호에 기초하여 문자열의 문자를 식별한다. 다음과 같은 처리에 의하여 문자열의 각 문자를 판독한다.
(1) 문자열을 구성하는 문자라고 판단되는 영상 패턴을 분할에 의하여 추출한다(문자 분할).
(2) 분할된 문자 패턴의 문자 종류(문자코드)를 식별한다(문자 식별).
(3) 식별된 문자 코드를 결합하여 형성된 문자열을 주소 등의 문자열을 포함한 표(문자열 사전)와 비교하여, 문자열을 특정한 주소등으로 판독한다(문자열 정합).
도 1 및 도 34A와 관련하여 후술하는 바와 같이, 서면 위의 문자열은 손으로 쓴 문자인 경우, 하나의 문자가 복수의 문자로 구성된 한자(漢字)인 경우, 및 가로 쓰기 또는 세로 쓰기 형식으로 씌어진 문자인 경우를 포함하여 다양하므로, 위의 처리 중에서 (1)의 문자 분할이 가장 어렵다.
서면으로부터 읽어들인 문자열에서 각각의 문자를 분할하는 종래 기술에 관해서는, 다중 가설 검정법(over segmentation approach)이 효과가 있는 것으로 알려져 있다. 다중 가설 검정법에서는, 문자열의 영상 신호를 문자로 성립할 가능성이 있는 복수의 문자 패턴으로 분리하고, 분리된 문자 패턴이 어느 문자 코드에 속하는지를 식별하며, 문자 패턴의 식별된 문자 코드와의 유사도에 관한 정보와 문자 코드열과 참조 사전의 문자열의 비교 결과를 이용하여 문자 패턴의 분할이 올바른지 여부를 결정한다.
다중 가설 검정법에 관한 종래 기술의 한 예로서, 문자 식별 결과에 의해 인식 후보 문자를 검사하는 후지마와(Fujimawa) 등이 제안한 방식(1984년도 IEIC 가을 학회의 "손으로 쓴 연결된 숫자의 자동 분리를 행하는 문자 분할 방식")이 있다.
또한, 문자의 형태로부터 인식 후보 문자 패턴의 정확성을 검사하는 방식으로서는 이시데라(Ishidera) 등이 제안한 방식(1995년도 IEIC 봄 학회의 "손으로 쓴주소의 판독을 위한 문자분할법")이 있다.
또한, 문자 식별 결과 및 문자열 비교 결과에 기초하여 가설을 검사하는 방식으로서는 무라세(Murase) 등의 방식(IEIC(D) 논문집 제J69-D권 제9호 "언어 정보를 이용한 손으로 쓴 문자열의 분할과 판독")과 오오이(Ooi)의 방식(IECE PRU 기술 보고서 92-40 "주소 의 번지(street number) 판독 방식") 등이 있다.
또한, IECE(D) 보고서 제J68-D권 제12호의 페이지 2123-2131에 개시된 바와 같이, 문자 폭, 문자 피치(pitch) 및 문자 간격등을 기초로 하여 문자 분할의 정확도를 평가하는 방법이 알려져 있다. 또한, IECE(D) 보고서 제J68-D권 제4호의 페이지 765-772에 기재된 바와 같이, 문자 패턴과 그 문자 코드의 유사도(similarity) 등의 정보를 이용하여 문자 분할의 정확도를 평가하는 방법도 알려져 있다.
그러나, 전술한 종래의 다중 가설 검정법에 있어서도, 다음에 예시된 바와 같이, 정확한 문자 분할이 곤란한 때가 있다.
우편물에 손으로 씌어진 주소(101)를 나타낸 도 1에서, 번지(street number) 부분(102)은 사람의 눈에는 한자 숫자 "三-二-一"인 것으로 보일 수 있다. 이 경우 전술한 다중 가설 검정법에 의한 문자 판독 장치로 읽어들일 때에는, 문자 기재 영역(102)은 점선으로 표시한 문자 패턴의 분할이 행해진다. 즉, 문자 패턴의 가로와 세로의 길이 및 가로와 세로의 길이 비율이 개개의 문자코드에 따라서 크게 변동하므로, 6가지의 가능한 경우(103) 중에서 올바른 문자열을 선택하기가 어렵다.
도 33A는 문자간격을 크게 하여 손으로 쓴 문자열의 경우를 나타낸 것이다. 문자열은 점선으로 표시한 경계에서 분할되며 도 34A에 보인 바와 같은 문자 패턴의 인식 후보가 생성된다. 도 34A에는 문자 패턴과 그 인접한 문자 패턴 사이의 경계를 나타내는 노드(node)와 문자 패턴을 나타내는 아크(arc)를 사용하여 문자 패턴의 후보들 간의 관계가 도식적으로 표현되어 있으며, 이것을 분할 그래프(segmentation hypothesis network)라 한다.
전술한 다중 가설 검정법에 기초한, 문자 패턴의 올바른 분할은, 분할 그래프의 시작 노드로부터 끝 노드⑨에 이르는 최적 경로를 찾는 과정에 의해 이루어진다. 도 34A에서 아크로 표현된 문자 패턴은 그에 해당하는 문자 코드로 식별된다. 위의 경우, 문자 "木", "反", "板"이 극히 유사하기 때문에 종래의 기술에 의해 문자열을 분할하는 것은 어렵다.
전술한 종래의 기술 중에서 후지마와 등에 의해 제안된 것 및 이시데라 등에 의해 제안된 것은 문자 패턴 각각의 타당성을 판단하도록 되어 있으나, 인접한 문자 패턴과의 상관관계를 이용하지는 않는다.
한편, 오오이 및 무라세 등에 의해 제안된 것은 문자열의 정합을 위해 인접한 문자 패턴과의 상관관계를 이용하지만, 문자 간격 등과 같은 인접한 문자와의 상대적 특징값에 대한 정보는 이용하지 않는다.
따라서, 본 발명의 주된 목적은 분할된 문자 패턴의 열로부터 올바른 문자 패턴을 결정하고 문자 패턴을 정확하게 식별하는 문자 판독 방법을 제공하는 것이다.
본 발명의 다른 목적은 우편물의 서면에 씌어진 지명(town name) 부분과 번지(street number) 부분으로 이루어진 주소 문자열에 대한 영상 신호로부터 주소의 문자열을 정확하게 판독할 수 있는 방법을 제공하는 것이다.
본 발명은 또 다른 목적은 다중 가설 검정법에 의해 주소 문자열을 판독하는데 있어서, 분할된 후보 문자 패턴이 문자 식별과 문자열 정합의 결과만을 이용하는 경우에는 정확하게 검사될 수 없는 주소 문자열에 대해서, 현재 처리중인 패턴과 인접한 패턴의 상대적인 특징값을 이용하여 정확하게 문자 패턴을 분할하는 방법을 제공하는 것이다.
이러한 목적을 달성하기 위해서 본 발명에 의한 문자 판독 방법은 영상 입력 장치에 의해서 전기적인 영상 신호로 변환된 인식할 문자열에서 연결된 성분들(예를 들면, 연결된 흑색 화소들에 의해 형성된 획)을 결합함으로써, 문자로 성립할 가능성이 있는 문자 패턴(아직 식별되지 않은 분할된 문자 패턴을 이하 "임시 문자 패턴(assumed character pattern)"이라 부른다.)으로 문자열을 분할하는 제1 단계와, 문자 식별 사전을 참조하여 임시 문자 패턴에 대해서 문자 식별을 행함으로써, 임시 문자 패턴에 대한 부수적인 정보(인식 후보 문자 및 인식 후보 문자와 임시 문자 패턴과의 유사도)를 얻는 제2 단계와, 임시 문자 패턴에 대한 주변 정보(border information)를 얻는 제3 단계와, 제 2단계에서 얻은 인식 후보 문자를 키로 하여 주변 정보가 저장된 분할용 사전을 참조함으로써 제 3단계에서 얻은 임시 문자 패턴의 주변 정보에 대한 신뢰도를 구하고, 임시 문자 패턴에 가중치를 설정하는 제 4단계와, 임시 문자 패턴에 설정된 가중치를 기초로 문자 분할을 결정하는 제 5단계와, 제5 단계에서 결정된 임시 문자 패턴으로부터 얻은 식별된 문자코드에 대해서 문자 식별 사전을 이용하여 단어 정합을 수행하고, 문자열의 문자들을 식별하는 제6 단계로 구성되어 있다.
또한, 지명 부분과 번지 부분으로 이루어진 주소 문자열을 읽기 위해 문자 판독 방법을 사용하는 경우에는, 문자열의 영상을 전기 신호로 변환하고, 이 전기 영상 신호로부터 문자열 기재 영역을 추출하고, 전술한 제1 단계에서 분할된 문자열의 연결된 성분을 결합하여 수개의 임시 문자 패턴을 생성한다.
각각의 임시 문자 패턴에 대해서 문자 식별 사전을 사용하여 문자 식별이 수행됨으로써, 임시 문자 패턴과 유사한 후보 문자들에 대한 정보가 얻어진다. 후보 문자의 정보를 이용하고 지명 사전을 참조하여 주소의 지명 부분을 판독하고, 번지 부분의 처음 위치가 검출된다. 지명 사전에는 실제로 있을 수 있는 모든 지명이 저장되어 있다.
번지 부분의 처음 위치를 검출한 후, 번지에 대한 임시 문자 패턴의 주변 정보가 얻어지고, 문자 분할용 사전을 참조함으로써 주변 정보의 신뢰도가 구해진다. 번지 부분의 문자들에 대한 임시 문자 패턴의 문자 분할은 신뢰도를 판단할 때 다시 수행되고, 얻어진 임시 문자 패턴과 유사한 후보 문자에 대한 정보를 이용하고 번지 사전을 참조함으로써 번지 부분이 식별된다. 번지 사전은 현존하는 번지의 모든 문자 정보를 포함한다.
본 발명의 다른 바람직한 실시예에 따르면, 전술한 제3 단계의 주변 정보는 개형 페널티인데, 이 개형 페널티는 각 분할된 임시 문자 패턴이 잘못된 분할에 의한 것이라는 가정의 타당성을 평가하기 위한 것으로, 예상할 수 있는 유형의 오류가 발생했을 때의 각 임시 문자 패턴의 인접한 문자 패턴에 대한 상대적인 특징값에 기초한 정보이다.
전술한 바와 같이, 본 발명에 의한 문자 판독 방법은 문자 식별에서 얻어진 유사도가 문자 분할에 반영되는 문자열 분할 방식과, 문자 패턴에 대한 임시 문자 패턴의 주변 정보를 결합하는 방식에 기초하여, 양 방식이 상호 보완하도록 함으로써, 문자식별에 효과적인 정보를 최대한 활용하여, 문자 폭과, 문자 피치와, 문자 간격이 일정하지 않은 문자열의 경우에도 정확한 분할이 가능하다.
모든 문자에 공통인 가상의 문자 폭, 문자 피치, 및 문자 간격의 값에 기초하여 손으로 쓴 문자를 분할하는 것이 쉽지 않다는 문제점을 해결하기 위해서, 본 발명은 임시 문자 분할을 평가하기 위해 작성된 문자 분할용 사전을 참조하여, 문자 패턴의 특징값들을 비교함으로써, 문자 분할의 신뢰도를 평가한다. 문자 분할용 사전은 특징값에 대한 패턴의 신뢰도로써 우도 분포를 저장하고 있다. 신뢰도를 계산하는데 많은 인력과, 시간과, 경험이 축적된 지식이 필요하지만, 본 발명에 의한 방법은 화면에 임시 문자 분할을 표시하여 조작자(operator)가 올바른 임시 문자 분할을 선택하게 함으로써, 각 문자 코드에 대해서 최적화된 가중치의 신뢰도 계산을 가능하게 한다.
도 1은 종래의 기술의 경우 문자 분할이 모호한 입력 영상의 한 예를 보인 도면.
도 2는 본 발명의 실시예에 기초한 문자 판독 방법을 보인 흐름도.
도 3은 본 발명의 문자 판독 방법을 실시하는 문자 인식 장치의 블록도.
도 4는 도 2의 문자열 추출 단계(204)를 설명하기 위한 도면.
도 5는 도 2의 가로 쓰기와 세로 쓰기의 형식을 구별하는 단계(205)를 설명하기 위한 도면.
도 6은 도 2의 임시 문자 패턴 생성 단계(206)를 입력 영상에 대응하여 설명하기 위한 도면.
도 7은 도 2의 패턴 표(219)의 데이터 구조를 보인 도면.
도 8은 도 2의 임시 문자 패턴 결정 단계(209)에 의해 유일하게 결정된 임시 문자 패턴의 열을 보인 개념도.
도 9는 도 2의 래티스 생성 단계(210)와 지명 정합 단계(211)를 설명하기 위한 도면.
도 10은 번지 부분의 한자와 아라비아 숫자를 처리하기 위한 도 2의 문자 분할 재결정 단계(215)를 설명하기 위한 도면.
도 11은 입력 영상과 임시 문자 패턴 사이의 대응에 기초한 번지 부분의 문자 식별을 설명하기 위한 도면.
도 12는 도 10의 임시 문자 패턴의 신뢰도를 계산하기 위한 단계를 설명하기 위한 도면.
도 13은 번지 부분에 대하여 패턴의 신뢰도를 계산하고, 임시 문자 분할의 아크에 대해 가중치를 둔 결과를 보인 도면.
도 14는 번지 부분에 대한 문자 분할 재결정 단계에서 선택된 문자 분할을 보인 도면.
도 15는 지명 부분과 번지 부분의 인식 결과를 결합하여 생성된 주소 문자열 전체의 인식 결과를 보인 도면.
도 16은 본 발명에 의한 주소 인식 장치의 유지와 기능 확장 및 사전의 생성과 갱신을 위해 사용되는 장치의 화면상에 표시되는 한 예를 보인 도면.
도 17은 본 발명의 전체적인 처리 과정의 한 예를 보인 흐름도.
도 18은 본 발명에 의한 한 실시예를 보인 도면.
도 19는 패턴과 그 경계의 관계를 보인 도면.
도 20은 분할 그래프의 아크를 포함하는 패턴 표의 구조를 보인 표.
도 21은 분할 그래프의 노드를 포함하는 노드 표의 구조를 보인 표.
도 22는 개형 페널티의 계산과정을 보인 흐름도.
도 23은 분할 오류의 유형을 보인 표.
도 24는 분할 오류 평가 단계를 보인 흐름도.
도 25는 분할 오류 평가 단계에서 사용되는 특징값을 보인 도면.
도 26은 분할 오류 평가 단계의 원리를 보인 도면.
도 27은 주소 사전 정합 단계를 보인 흐름도.
도 28은 사전 정합 단계의 원리를 보인 도면.
도 29는 샘플 수집 장치의 화면 상에 표시되는 한 예를 보인 도면.
도 30은 파라미터 사전의 학습을 보인 흐름도.
도 31은 파라미터 사전의 구조를 보인 표.
도 32는 개형 페널티 계산 단계를 보인 흐름도.
도 33A와 도 33B는 인식할 주소 문자열의 예를 보인 도면.
도 34A와 도 34B는 분할 그래프와 임시 분할 오류의 예를 보인 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
203 : 주소 기재 영역 추출 단계
204 : 문자열 분할 단계
205 : 가로 쓰기와 세로 쓰기 결정 단계
206 : 임시 문자 패턴 생성 단계
207 : 문자 식별 단계
208 : 문자 식별 사전
209 : 임시 문자 패턴 선택 단계
210 : 지명 부분의 래티스 생성 단계
211 : 지명 정합 단계
212 : 패턴 주변 정보 추출 단계
213 : 패턴 신뢰도 계산 단계
214 : 문자 분할용 사전
215 : 문자 분할 재결정 단계
216 : 번지 부분의 래티스 생성 단계
217 : 번지 정합 단계
218 : 주소 판독 결과
도 2는 본 발명에 의한 문자 판독 방법의 한 실시예를 보인 흐름도이다. 본 실시예는 우편물의 서면에 씌어진 주소를 읽기 위한 자동 문자 판독 장치에 적용한 것이다. 지명(town name)과 번지(street number)로 이루어진 주소 문자열을 판독하기 위한 과정은 다음과 같이 수행된다.
주소가 씌어진 면(201)은 영상 수단(스캐너)에 의해 영상 신호로 변환되고(202), 영상 신호로부터 주소 기재 영역 정보가 추출되고(203), 주소 기재 영역에 대한 영상 정보에 기초하여 문자열이 분할된다(204).
문자열이 분할되면, 영상 신호가 가로 쓰기인지 세로 쓰기인지를 판정하는 단계를 거치고(205), 이 판정 결과에 따라 가로 쓰기 모드(mode) 혹은 세로 쓰기 모드(mode)로 전환된다(221). 이 단계들(201 내지 221)은 종래의 방법에 의해 수행된다. 우편물에 기재된 군(郡, 일본의 행정구역)이나 정(町, 일본의 행정구획)의 이름 등의 주소 문자열을 전자 장치 등으로 자동으로 판독하는 여러가지 방법이 고안되어 왔다. 예를 들면, 일본국 특허출원공개 평(平)2-64882에는 주소 문자열의 처음부터 정(町)의 이름까지로 구성된 문자열 부분과 번지로 구성된 문자열 부분에 대해서 각기 다른 문자 분할 처리를 수행하는 주소 인식 방법이 개시되어 있다. 또한, 일본국 특허출원공개 평(平)5-151389에는 우편 번호의 위치를 미리 검출하여 우편물의 주소 기재 영역을 검출하는 방법이 제안되어 있다.
주소 기재 영역에 있는 문자열을 분할하는 방법에 대해서는, 일본국 특허공고 제60-41396호에 기재되어 있는데, 이 방법에 따르면 우편물 등에 기재되어 있는 문자 등으로 이루어진 영역의 패턴에 대한 세로 길이를 측정하고, 측정된 높이와 같은 세로 길이를 가진 문자열을 검출하여 주소 기재 영역의 문자를 분할하게 된다. 일본국 특허출원공개 제JP-A-소(昭)-63-18785호에서는, 주소 기재 영역에 기재된 문자들의 가로 길이와 세로 길이를 측정하고 이 측정된 길이들을 서로 비교함으로써 분할된 문자가 가로 쓰기인지 혹은 세로 쓰기인지 여부를 판정하는 방법이 제안되어 있다.
다음으로, 영상 정보의 문자열 중에 연속되는 흑색 화소(pixel)들(즉, 획)을 결합함으로써 문자를 구성할 가능성이 있는 곳에서 임시 문자 패턴(assumed character pattern)을 분할하는 단계를 수행한다. 임시 문자 패턴을 분할하는 이 단계를 "임시 문자 패턴 생성 단계(206)"라 부른다. 임시 문자 패턴은 인식될 올바른 문자 패턴 뿐만 아니라 부적당한 패턴을 포함할 수도 있다. 분할된 임시 문자 패턴은 패턴 표(219)에 등록된다. 임시 문자 패턴 및 패턴 표(219)에 대해서는 도 6 및 도 7과 관련하여 후술하기로 한다.
패턴 표(219)에 등록된 임시 문자 패턴 각각에 대해서 문자 식별 사전(208)을 이용하여 문자 식별을 수행한다(207). 이 문자 식별 단계에서, 각 임시 문자 패턴과 유사한 복수의 인식 후보 문자와, 각각의 인식 후보 문자의 임시 문자 패턴에 대한 유사도와, 문자열에서의 임시 문자 패턴의 위치와, 연결된 성분(연속되는 흑색 화소)의 수에 대한 정보와, 각각의 임시 문자 패턴에 대한 속성 정보를 주변 정보(border information)로서 얻는다. 이 인식 후보 문자 및 주변 정보를 패턴 표(219)에 각 임시 문자 패턴에 대응하여 기록한다. 인식 후보 문자 및 속성 정보(주변 정보)가 저장된 패턴 표(219)를 기초로 하여 문자 분할을 위해 적합한 임시 문자 패턴을 선택한다(209). 문자 분할 결정에서 선택된 문자 패턴에 대응하는 인식 후보 문자로부터 인식 후보 문자의 집합, 즉 인식 후보 문자열이 생성된다(210). 각각의 문자 패턴에 대한 인식 후보 문자열에 대해서 하위의 후보문자까지의 문자 코드(character species)를 등록한다. 이 등록된 문자 코드들을 "래티스(lattice)"라고 부른다.
래티스를 지명 사전(220)과 비교하는 지명 정합(town matching) 단계(211)를 수행하여, 주소의 지명 문자에 대하여 적합한 인식 문자열을 구성한다. 지명 사전(220)에는 현존하는 모든 지명이 저장되어 있다. 지명 정합 단계(211)에 의한 지명의 문자 판독이 끝나면, 지명에 대한 문자열의 마지막 문자가 결정되고 번지(street number)의 처음 위치에 대한 정보가 얻어진다.
번지의 처음 위치에 대한 정보가 얻어지면, 임시 문자 패턴에 대한 가로 및 세로 길이, 가로 길이와 세로 길이의 비, 패턴의 간격 및 연결된 흑색 화소의 수에 대한 정보[이하 패턴 주변 정보(pattern border information)라 한다]가 구해진다(212). 주변 정보의 신뢰도(credibility)는 문자 분할용 사전(214)을 이용하여 계산된다(213). 이렇게 계산된 신뢰도는 패턴 표(219)에 해당 임시 문자 패턴에 대한 속성으로서 기록된다.
이전 선택을 재결정하기 위해 신뢰도를 이용하여 패턴 표(219) 중 임시 문자 패턴을 다시 선택한다. 즉, 임시 문자 패턴 결정 단계(209)에서 선택된 임시 문자 패턴과 번지만 다르도록 재결정하기 위해 문자 분할이 결정된다(215). 문자 분할 재결정(215)이 행해진 후에, 그 정보를 이용하여 래티스가 다시 작성된다(216). 재 작성된 래티스에 대해서 번지 사전(222)을 이용하여 번지 정합(street matching)을 행하고(217), 번지 문자의 판독이 수행된다. 번지 사전(222)은 어떠한 번지도 표현할 수 있도록 모든 문자가 저장되어 있다. 판독된 결과는 지명 정합 단계(211)에서판독된 지명의 문자들과 결합되며, 이로써 주소 전체의 판독이 완료된다(218).
다음은 도 2에 보인 각각의 단계들과 이 단계들을 수행할 장치들을 상세히 설명한 것이다. 영상 신호 입력단계(202)부터 가로 쓰기 및 세로 쓰기 모드 변환 단계(221)까지의 모든 단계들은 종래의 기술과 동일하며, 임시 문자 패턴 생성 단계(206)부터 지명 정합 단계(211)까지의 단계들은 앞에서 설명한 IEIC 논문집 제4권 페이지 765-772의 기술등이 적용될 수 있다.
도 3은 앞에서 설명한 주소를 판독하는 방법을 실시하는 장치의 구성을 보인 것이다. 도 3에서 두꺼운 화살표는 우편물의 흐름을 나타낸다. 영상 신호(202)는 스캐너(scanner, 301)를 통해 입력된다. 주소를 판독하기 위한 시간을 벌기 위해서 우편물 반송로에는 딜레이 라인(delay line, 314)이 구비되어 있다. 스캐너(301)는 문자 판독 장치(312)와 입출력 케이블(304)을 통해 연결되어 있고, 문자 판독 장치(312)는 다른 입출력 케이블(305)을 통해 정렬기(sorter, 303)와 연결되어 있다
문자 판독 장치(312)는 내부 장치들을 연결하기 위한 내부 버스(313)와, 스캐너(301)와의 통신을 위한 I/O 인터페이스(306)와, 판독 장치(312)를 전체적으로 제어하고 주소 판독 처리를 수행하기 위한 수치 연산 장치(CPU, 307)와, 정렬기(303)와의 통신을 위한 I/O 인터페이스(308)와, 기동시의 조작 등을 행하기 위한 키보드(309)와, 처리 상태를 표시하기 위한 CRT(310), 및 주소의 판독을 위한 표, 프로그램 및 사전을 저장하기 위한 메모리(311)로 구성되어 있다.
도 4는 영상 신호 입력 단계(202)부터 문자열 분할 단계(204)까지의 과정을설명하기 위한 그림이다. 참조번호(407)는 주소 기재 영역 추출 단계(203)에서 영상 신호(202)로부터 추출된 주소 기재 영역의 영상이다. 참조번호(403), (404) 및 (405)에 보인 것은 주소 기재 영역(407)에 포함된 흑색 화소들을 y축(402)에 평행한 축(408)에 투영한 히스토그램(histogram)이다. 이 히스토그램의 값에 의해서, 점선(406)으로 표시된 문자열의 상단 및 하단의 y 좌표값이 계산되고 주소 기재 영역의 문자열이 추출된다(204).
도 5는 가로 쓰기와 세로 쓰기 판정 단계(205)를 설명하기 위한 그림이다. 참조번호(501)은 횡서방향으로 씌어진 문자열의 영상을 나타낸다. 참조번호(502 및 503)는 문자열의 처음 문자와 끝 문자의 문자 패턴을 보인 것이며, 문자열로부터 추출된 본래의 문자 패턴이 참조번호(505 및 509)이다. 참조번호(506 및 510)에 보인 것은 문자 패턴(502) 및 문자 패턴(503)으로부터 얻어진 문자 패턴을 패턴 회전 단계(504, 511)에서 90도 회전한 문자 패턴이다. 이러한 문자 패턴에 대해서 문자 인식을 수행한다(507). 그 결과 얻어진 유사도를 서로 비교하고(508), 이 비교결과를 이용하여 가로 쓰기와 세로 쓰기의 판정을 수행한다(205). 이 판정 결과에 기초하여, 특징 추출 단계는 세로 쓰기 또는 가로 쓰기 중의 어느 하나의 형식으로 전환된다(도 2의 221).
영상의 레이아웃(layout) 정보를 이용하여 가로 쓰기 및 세로 쓰기 형식을 판별하는 방법의 경우에는 표준 레이아웃과 일치하지 않는 주소 문자열을 포함한 입력 영상에 대해서 잘못된 판단을 할 수 있지만, 본 실시예에서는 문자 인식 자체를 이용하여 그 형식을 판별하기 때문에 신뢰할 수 있는 가로 쓰기 및 세로 쓰기형식의 판별이 가능하다. 주소 문자 열의 처음 문자와 끝 문자 및 이들을 90도 회전시킨 문자들과의 유사도를 볼 때 그 차이가 크지 않은 경우에는, 처음과 끝 문자에 인접한 문자들에 대해서 차례대로 위와 같은 가로 쓰기 및 세로 쓰기 형식의 판별을 수행하게 된다. 즉, 한자의 "田"이나 "山"과 같이 90도 회전하였을 때에 그 유사도에 차이가 거의 없는 문자는 피하고, 판별에 적당한 문자에 대해서 가로 쓰기 및 세로 쓰기 형식 판별을 행함으로써 판별의 정확성을 향상시킬 수 있다.
도 6은 입력 영상에 대한 임시 문자 패턴을 설명하기 위한 것이다. 손으로 쓴 주소 문자열(601)을 인식하기 위해서, 임시 문자 패턴 생성 단계(도2의 206)에서는 입력 영상의 문자열을 문자간의 경계[점선(603 - i, i = 1, 2 … n)로 나타낸다]에서 분할한다. 점선(603 - i, i = 1, 2 … n)으로 표시된 점 ①, ② … ⑧ (602 - i, i = 1, 2 … n)은 "노드"라 부른다. 서로 인접한 두 노드를 연결하는 곡선(604)은 "아크"라 하고, 아크들(604)에 대응하는 패턴(605, 606, …, 611)들은 "임시 문자 패턴"이라 한다. 즉, 도 6의 오른쪽에 분할 그래프 도시되어 있다. 예를 들면, 인식할 문자 패턴 "兵"인 경우, 가능한 임시 문자 패턴으로는 "兵"(605)을 포함해서 "丘"(606)와 "八"이 있을 수 있다. 같은 방법으로, 문자 패턴 "可"에 대해서는 임시 문자 패턴으로서 "可"(610)를 포함해서 "一"(609)와 "口ㅣ"(611)이 있을 수 있다. 아크로 연결된 각각의 노드들 사이에는 그에 해당하는 임시 문자 패턴이 형성된다.
도 7은 패턴 표(219)에 저장된 데이타를 보인 것이다. 참조번호(701)는 임시 문자 패턴으로 분할된 영상 정보가 저장되어 있는 메모리의 위치를 지시하는 포인터를 나타낸다. 위치(702)에는 임시 문자 패턴에 대응하는 아크의 신뢰도(가중치를 표시하는 신뢰도는 두 노드간의 거리에 따라 다르다)가 저장되어 있다. 위치(703)에는 임시 문자 패턴에 있는 연결된 성분의 개수가 저장되고(예를 들면, 문자 패턴 "三"에 대해서는 3이, 문자 패턴 "八"에 대해서는 2가 저장된다), 위치(704)에는 임시 문자 패턴의 X 및 Y 좌표값이 저장된다(임시 문자 패턴을 둘러싸는 정방형의 왼쪽 상단 모서리와 오른쪽 하단 모서리의 좌표값이 저장된다). 위치(705)에는 아크의 상단에 위치하는 노드의 노드 번호가 저장되며, 위치(706)에는 아크의 하단에 위치하는 노드의 노드 번호가 저장된다. 노드 번호를 참조함으로써, 패턴 데이타를 임시 문자 패턴의 네트웍, 즉 분할 그래프로 표현할 수 있다. 위치(707)에는 문자 식별 사전(208)을 참조하여 임시 문자 패턴의 문자 식별(207)과정에서 얻어진 몇 개의 후보 문자들이 저장되고, 위치(708)에는 임시 문자 패턴에 대한 후보 문자들의 유사도 값이 저장된다. 유사도를 계산하는 방법은 특별히 정해져 있지 않으며, 이미 알려진 방법을 사용할 수 있다.
굵은 선(709)은 각각의 임시 문자 패턴에 해당하는 표의 영역을 구분하는데, 이 영역은 하나의 아크에 해당한다. 예를 들면, 임시 문자 패턴 "兵"에 대해서 영역은 아크 (604-1)에 해당한다. 따라서, 위치(705)에 저장되는 앞 노드 번호는이고 위치(706)에 저장되는 뒷 노드 번호는 ②가 된다.
도 8은 도 6의 임시 문자 패턴 결정 단계(209) 또는 도 2의 문자 판정 단계를 설명한 것이다. 패턴 표(219)에 저장된 데이타를 기초로 임시 문자 패턴 결정 단계에서 결정된 임시 문자 패턴을 볼 수 있다. 임시 문자 패턴 결정 단계(209)에서는, 패턴 표 전체의 임시 문자 패턴에 대하여 문자 식별을 행할 때에 얻은 후보 문자의 유사도를 각각의 신뢰도(702)로서 등록하고, 노드에서 ⑧을 연결하는 모든 가능한 경로에 대한 아크의 신뢰도를 합하여, 합한 값이 가장 큰 경로에 해당하는 임시 문자 패턴들로 구성된 열을 문자 분할로 결정한다. 도 8의 예에서는 신뢰도의 합이 가장 큰 경로가 노드, ②, ③, ④, ⑤, ⑦, ⑧들을 연결한 경로가 됨을 알 수 있다.
도 8을 도 6과 비교하면, 도 6의 노드과 ①, 노드 ①과 ②, 노드 ①과 ③ 을 연결하는 아크들(604)이 도 8에는 나타나 있지 않고, 노드 ④와 ⑥, 노드 ⑤와 ⑥, 노드 ⑥과 ⑦을 연결하는 아크들(604) 역시 도 8에 나타나 있지 않은 것을 볼 수 있다. 이와 같은 방법으로, 패턴 표(219)의 모든 임시 문자 패턴을 문자 식별을 통해 평가함으로써, 향상된 신뢰도의 임시 문자 패턴을 가지는 문자 분할이 결정된다(도 2의 209).
도 9는 위의 방법으로 유일하게 결정된 분할에 대한 문자 식별의 결과를 입력받아, 지명 정합 단계(211)에서 얻어진 지명 부분의 문자 인식 결과와, 번지 부분의 처음 위치를 설명하기 위한 것이다. 참조번호(601)은 판독할 주소 문자열의 영상을 나타내고, 점선(902)은 결정된 문자 분할의 경계 또는 노드를 나타내며, (707)은 분할된 임시 문자 패턴에 대한 문자 식별 결과인 후보 문자들의 집합을 보인 것이다. 원으로 둘러싸여진 문자(903)는 후보 문자 집합(707)중에서 지명 정합 단계(도 2의 211)의 결과 선정된 문자를 나타낸다. 선정된 문자들 "兵", "庫", …, "荷"을 모두 연결하면 지명 판독의 결과인 문자열(910)이 생성된다. 한 쌍의점선(905)은 지명 정합에서 결정된 문자열에 해당하는 입력 영상(601)의 영역을 표시한다. 지명 정합 단계(211)를 수행한 결과 번지 부분의 처음 위치(911)가 결정된다.
그림에서, 참조번호(906, 907, 908 및 909)는 번지 부분에 대한 임시 문자 패턴을 보인 것이고, 참조번호(912 내지 916)는 번지 부분의 임시 문자 패턴에 대해서 문자 식별과정을 거친 결과 얻어진 문자열의 집합을 나타낸다. 후보 문자들은 래티스 생성 단계(211)까지의 단계들에서 이미 얻어진 것이다. 주소 기재 영역 중에서 번지의 처음 위치(911)부터 시작되는 번지 부분은 대개의 경우 한자 숫자 또는 아리비아 숫자로 씌어져 있기 때문에, 번지 부분의 문자 분할 과정은 한자로 씌어진 지명 부분의 문자 분할 과정과 다르다. 예를 들면, 번지 부분에 지명 부분에 적용되는 문자 분할 과정을 적용하면, 문자 패턴 "三"과 "二"는 각각 임시 문자 패턴(906)과 임시 문자 패턴(907) 및 임시 문자 패턴(908)과 임시 문자 패턴(909)으로 나누어지게 된다. 또한, 번지 부분에는 더욱 적은 종류의 문자들만이 이용될 것이다.
도 10은 번지 부분의 문자 분할 재결정의 과정을 보인 흐름도인데, 이 과정은 패턴 주변 정보 추출 단계(도 2의 212)로부터 문자 분할 재결정 단계(도 2의 215)까지의 단계들로 이루어져 있다. 문자 패턴에 대한 예는 도 11 내지 도 14와 관련하여 뒤에 상세히 설명할 것이다.
지명 정합 단계(211)로부터 입력된 영상 정보(911)에서 번지 부분의 처음 위치를 결정하고(1013), 번지 부분의 임시 문자 패턴에 대한 인식 후보 문자를 문자코드 정보로서 패턴 표(219)로부터 추출한다(1002). 본 실시예에서는, 문자 식별 단계(207)의 결과인 후보 문자열 중에서 유사도가 가장 큰 후보 문자를 문자 코드 정보로 사용한다. 추출된 문자코드 정보를 키(key)로 하여 분할용 사전 또는 파라미터(214)를 참조한다. 문자 코드 추출 단계(1002)에서는, 문자 코드에 해당하는 임시 문자 패턴에 대한 주변 정보가 얻어진다(212). 이 주변 정보에는 임시 문자 패턴에 대한 가로 및 세로 길이와, 가로 길이와 세로 길이의 비와, 패턴 간격 및 연결된 부분의 갯수가 있다.
임시 문자 패턴에 대한 가로 및 세로 길이, 가로 길이와 세로 길이의 비, 패턴 간격 및 연결된 부분의 갯수를 포함하는 주변 정보에 대한 우도비(likelihood ratio)를 구하기 위해 문자 코드를 키로 하여 분할용 사전(214)을 참조한다. 분할용 사전(214)은 주변 정보에 대응하는 우도비의 값이 저장되어 있으며, 각각의 주변 정보에 대한 우도비는 신뢰도로서 계산된다(1005, 1006, 1007, 1008). 계산된 각각의 신뢰도 값은 모두 합해진다(1010). 분할된 임시 문자 패턴이 문자 식별된 문자 코드로서 올바른 경우를 나타내는 사건을 H라 하고, 패턴 주변 정보의 특징값을 e1, e2, e3, … , en라 하며, H가 일어났을 때에 e가 발생할 확률을 P(e|H)라 하면, 특징값 ek에 대한 우도비 L(ek|H)는 다음과 같이 계산된다.
H가 일어난 경우의 확률을 P(H)라 하면, 특징값 e1, e2, e3, … , en에 대한H의 확률 P(H|e1, e2, e3, … , en)은 Bayes rule을 이용하면 식 (1)로부터 다음과 같이 구할 수 있다.
신뢰도 총합 단계(1010)에서는 Bayes rule에 의한 식(2)를 이용하여 단계(1005, 1006, 1007 및 1008)에서 계산된 우도비의 총합이 구해진다. 다음에, 신뢰도의 총합에 문자 식별 결과 구해진 유사도를 곱한 것을 아크의 가중치로 한다. 가중치가 주어진 아크로부터 얻어진 임시 문자 패턴의 데이터에 기초하여, 처음 노드와 마지막 노드를 연결하는 최적 경로를 찾음으로써 문자 분할 경로가 구해진다(1012). 그 결과는 번지 정합 단계(도 2의 217)에 사용된다.
도 11은 주소 문자열의 번지 부분의 임시 문자 패턴을 설명하기 위한 것이다. 주소 문자열의 입력 영상 중에서 번지 부분(1102)은 경계선(1104)을 이용한 임시 문자 패턴 생성 단계(도 2의 206)를 통해 이미 분할이 이루어져 있으며, 분할 결과는 패턴 표(219)에 저장된다. 패턴 표의 데이터 구조는 도 6 및 도 7과 관련하여 이미 설명한 것과 동일하다. 두 점선(1103)은 분할 경계선(1104)과 노드 번호(1105)(원으로 둘러싸인 번호 50, 51, 52, …, 55)의 대응관계를 보인다. 예를 들면, 임시 문자 패턴 "三"(1106, 아크 1107에 해당한다.)의 문자 식별 단계에서는 후보문자들(1108)로서 "三"과, "3" 및 "五"가 생성된다. 같은 방법으로 임시 문자 패턴 "三 |"(1109, 아크 1111에 해당한다)에 대해서는 후보 문자들(1110)로서 "示"와, "未" 및 "身"이 생성된다.
위의 임시 문자 패턴들의 아크들은 도 10과 관련하여 이미 설명한 바와 같이 가중치가 설정된다. 예를 들면, 문자 코드 "示", "未" 및 "身"(1110)은 번지에 사용하기에 부적당한 문자이기 때문에 임시 문자 패턴(1109)에 해당하는 아크 (1111)에 대한 가중치는 줄어들게 된다. 가중치를 주는 과정에 의해서, 번지로서 명백히 부적당한 아크들은 제거되는 것이다. 남은 임시 문자 패턴(예를 들면 "二", "一", "一", "ㅣ" 등)도 각각에 대해서 가중치를 주는 과정을 거침으로써 부적당한 아크가 제거된다.
도 12는 번지 부분에서 임시 문자 패턴 "三"(1106)에 대해서 아크에 가중치를 주는 과정(도 10의 1011)을 설명한 것이다. 먼저, 임시 문자 패턴 "三"으로부터 주변 정보를 추출한다(212). 주변 정보에는 문자의 가로 및 세로 길이와, 가로 길이와 세로 길이의 비와, 패턴 간격 및 연결된 부분들의 갯수가 포함된다. 이어서, 문자 식별의 결과로서 후보 문자 "三", "3" 및 "五" 중에서 가장 가능성이 크게 나타난 "三"도 참조된다. 위 정보들은 블록 (1213) 내부의 (1214)와 (1215)로 표현되어 있다.
문자 코드 추출 단계(1002)에서는, 문자 코드 "三"에 대한 정보(1214)가 분할용 사전(214)으로 보내진다. 분할용 사전(214)은 문자 코드를 키로 하여 참조되며, 아크에 가중치를 설정하기 위한 데이터(1205)가 저장되어 있다. 문자 코드 추출 단계(1002)에서 얻어진 문자 코드를 키로 하여 분할용 사전(214)중에서 인텍스(index) "三"을 검색한다. 인덱스 "三"에 대한 데이터(1205)를 검색함으로써, 세로 길이 또는 높이(1206)와, 가로 길이 또는 폭(1207)과, 가로 길이와 세로 길이의 비(1208)와, 연결된 부분의 갯수(1209) 및 패턴 간격(1210)에 해당하는 우도비를 읽어내고, 주변 정보에 대한 신뢰도 값을 계산하며(1204), 우도비들(신뢰도1, 2, 3, 4, 5)의 총합을 구하며(1010), 임시 문자 패턴 "三"(1106)에 대응하는 아크(1107)에 가중치를 설정한다(1011). 이와 같은 방법으로, 패턴 주변 정보를 임시 문자 패턴(1106)에 대응하는 아크(1107)에 반영함으로써 문자 코드를 고려한 최적의 가중치 설정을 행할 수 있다.
도 13은 가중치를 설정한 결과를 아크 선의 두께를 이용하여 표현한 것이다. 참조번호(1301)는 임시 문자 패턴 "三"(1106)에 대한 주변 정보를 기준으로 가중치가 설정된 아크를 나타낸다. 아크(1303)는 임시 문자 패턴 "ㅣ"에 대한 주변 정보에 따라 증가되는 가중치를 가진다. 노드 (52)와 (54)를 연결하는 아크 (1302)는 패턴 "三"의 하단의 연결된 부분 두개에 의해 형성된 문자 패턴 "二"와 유사한 문자 패턴에 해당한다. 임시 문자 패턴 "二"에 대한 문자 식별을 통해 도 11에 보인 바와 같은 문자 코드 "二", "三" 및 "2"로 이루어진 후보 문자들이 얻어지며, 이 후보 문자들 중 문자 코드 "二"가 가장 큰 유사도를 가지고 있어서 정확한 추정으로 잘못 판단될 가능성이 있다. 그러나, 주변 정보를 통해 아크(1302)의 패턴이 바로 위의 패턴으로부터 너무 가깝게 떨어져 있음을 알 수 있으며, 분할용 사전(214)을 참조하면 보다 적은 신뢰도를 가지게 될 것이다. 따라서, 아크(1302)는 단순히 유사도만을 기준으로 가중치를 설정한 경우보다 적은 가중치를 가지게 됨에 따라 아크(1301) 보다 적은 가중치를 가지는 것이다. 결과적으로, 아크 (1302)를 포함하는 경로는 아크(1301)를 포함하는 경로보다 상대적으로 적은 가중치의 합계를 가지게 된다.
도 14는 번지 부분에 대한 문자 분할을 재결정한 결과 얻어진 임시 문자 패턴의 열을 나타낸다. 아크 가중치 설정 단계(도 10의 1011)를 통해 임시 문자 패턴에 대한 아크에 대해서 가중치를 설정하고, 가중치의 합이 가장 큰 경로가 정해지는 것이다. 따라서, 임시 문자 패턴 "三"에 대한 아크 중에서 아크(1301)와 "ㅣ"의 아크(1303)를 포함하는 경로가 선택된다. 즉, 번지 부분의 문자 분할의 재결정을 통해, 임시 문자 패턴 "三", "ㅣ", "二", "ㅣ" 및 "一"에 해당하는 아크를 포함하는 경로가 선택되는 것이다. 선택된 아크의 패턴들에 대응하는 후보 문자열은 번지 부분의 래티스를 생성하는데 사용된다(216).
도 15는 본 실시예에 의한 전체 주소 문자열의 판독 결과를 나타낸다. 즉, 도 15는 번지 부분에 대한 문자 분할 과정과, 래티스 생성 과정과, 번지 정합 과정 및 이 번지 부분과 지명 정합 과정의 결과를 합한 결과를 보인 것이다. 주소 문자열의 입력 영상(601)으로부터 이어지는 한 쌍의 점선(905)은 지명 부분의 영역을 나타내고, 참조번호(910)은 지명 정합의 결과를 나타낸다. 점선(1510)은 문자 분할의 재결정에 의한 경계를 나타내고, 문자들의 집합(1506)은 각각의 문자의 문자 식별에 의한 후보 문자들을 나타낸다. 점선(1507)과 점선(1509)은 번지 부분의 영역을 나타내고, 문자열(1508)은 문자 식별에 의한 후보 문자 집합으로부터 번지 정합 단계(217)를 통해 얻어진 번지 판독의 결과이다. 문자열(1504)은 번지 정합의 결과(1508)와 지명 정합의 결과(1502)를 연결함으로써 얻어진 전체 주소 문자열의판독 결과이다. 이러한 방법으로 번지 부분에 대해서만 문자 분할을 따로 하고, 그 결과를 지명 정합의 결과와 결합함으로써 전체 주소 문자열에 대한 판독 결과의 정확성이 보다 향상된다.
도 16은 입력 주소 문자열과 문자 분할을 위한 패턴 표와 문자 식별의 결과를 화면 상에 표시한 예를 보인 것이다. 표시 장치(도 3의 310)의 화면(1600)상에는 입력 주소 문자열의 영상(1601)과, 패턴 표의 노드(1602-i, (i = 1, 2, …, 8))와, 노드들을 연결하는 아크(1603-1, 1603-4)와, 서로 인접한 노드를 연결하는 아크와, 임시 문자 패턴(1604-j, (j = 1, 2, …, 8))과, 임시 문자 패턴(1604-j)에 대해서 문자 식별을 행함으로써 얻어진 후보 문자들의 집합(1605)이 표시된다. 표시 장치(310)의 화면(1600)상에 위의 내용들을 표시함으로써, 문자 분할과 주소 문자열의 판독 중의 문자 식별 단계의 진행에 대한 직감적인 파악을 가능하게 하고, 장치의 유지 보수와 기능의 확장에 도움을 준다. 또한, 문자 분할용 사전(214)을 작성하거나 갱신할 때의 가설에 의해 분할된 패턴의 주변 정보를 수집하는 데에도 필요하다.
식 (1)를 참조하면, 문자 분할용 사전에 저장된 우도비는 올바르게 문자 분할을 행한 경우의 가설 문자들에 대한 주변 정보의 분포를 문자 분할을 잘못 행한 경우의 가설 문자들에 대한 주변 정보의 분포로 나눈 값을 가지는 것을 알 수 있다. 따라서, 도 16에 도시된 것처럼 표시된 화면상에 포인터를 이용하여 지정한 아크에 대한 주변 정보와 문자 식별 결과에 대한 값의 정보를 출력할 수 있다면, 패턴 주변 정보를 올바로 분할을 행한 경우와 분할을 잘못 행한 경우에 대해서 따로따로 수집하는 것이 가능하다. 또한 표시 장치는 문자 분할용 사전을 작성하거나 갱신할 때에 필요한 문자 패턴의 수집에도 유용하다.
도 17은 본 발명의 다른 실시예에 의한 문자 판독 방법을 보인 흐름도이다. 이 실시예는 또한 도 3에 보인 자동 우편 주소 판독 장치에 대해서 적용되는 문자 판독 방법에 관한 것이다.
주소 문자열 추출 단계(171)에서는 우편물의 영상 신호로부터 주소 기재 영역이 추출된다. 다음 임시 문자 패턴 추출 단계(172)에서는 문자열로부터 임시 문자 패턴을 추출하여 분할 그래프를 생성한다. 개형 페널티(external form penalty) 산출 단계(173)에서는 각 임시 문자 패턴에 대한 개형 페널티(p)를 산출한다. 문자 식별 단계(174)에서는 각 임시 문자 패턴을 식별하고 복수의 후보 문자 코드를 만들어, 후보 문자와 임시 문자 패턴의 유사도를 계산한다. 패턴 신뢰도 산술 단계(175)에서는 유사도와 개형 페널티를 이용하여 각 임시 문자 패턴의 신뢰도를 산출한다. 주소 사전 정합 단계(176)에서는 패턴의 신뢰도에 기초하여 임시 문자 패턴을 선택하고 문자 식별 단계에서 구한 후보 문자열을 주소 사전과 비교한다.
도 18은 우편물 서면이 표시된 영상을 보인 것이다. 문자열 추출 단계(171)에서는 우편물 영상(181)으로부터 지명과 번지의 문자열을 포함하는 직사각형 영역(182)을 추출한다. 영역(182)에는 한 개 이상의 주소 문자열이 포함되어 있을 수 있으며, 이 경우 문자열 추출 단계는 한 개 이상의 주소 문자열을 포함하는 영역을 추출하게 된다. 주소 기재 영역을 추출하는 방법은 앞에서 설명한 실시예에서 사용하는 방법과 동일하다.
도 19는, 임시 문자 패턴 추출 단계(172)를 설명하기 위해서, 도 18의 영역 내부의 문자열 영상을 확대한 것이다. 도 19에서부터 ⑨까지의 세로선은 경계의 후보를 나타낸다. 이 경계의 후보는 기술 보고서 IE88-138의 "비정규 피치(pitch)를 가지는 문자열을 포함한 인쇄된 문자열의 문자 분할 방법"에 소개된 것과 같은 직사각형들의 간격을 나타낸다. 경계의 오른쪽에 위치한 문자 패턴의 왼쪽 끝 X좌표값으로부터 경계의 왼쪽에 위치한 문자 패턴의 오른쪽 끝 X 좌표값을 뺀 것을 "경계 간격"이라 하고, 경계의 오른쪽에 위치한 문자 패턴의 왼쪽 끝 X 좌표값과 경계의 왼쪽에 위치한 문자 패턴의 오른쪽 끝 X 좌표값의 평균을 "경계 좌표값"이라 한다. 예를 들면, 경계 ④의 경계 좌표값은 경계 (194)의 X 좌표값이고, 경계 간격은 폭(195)이다.
또한, 경계 좌표값들의 차이가 문자열의 세로 길이로부터 추정한 문자 크기 보다 크지 않은 경계들을 조합하여, 이 경계들 사이에 있는 패턴을 임시 문자 패턴으로 등록한다. 도 19의 예에서는, 경계 좌표값들의 차이(191와 192)는 추정된 문자 크기보다 크지 않으나, 경계 좌표값들의 차이(193)는 문자 크기보다 크다. 따라서, 경계과 ①의 사이에 있는 문자 패턴과 경계과 ②의 사이에 있는 문자 패턴은 등록하고, 경계과 ③의 사이에 있는 문자 패턴은 등록하지 않는다.
도 20은 임시 문자 패턴 분할 단계(172)의 수행 결과로써 얻어진 분할 그래프의 아크에 대한 데이터가 포함되어 있는 패턴 표의 형식을 보인 것이다. 패턴 표의 각 레코드(record)는 각각의 임시 문자 패턴 하나에 대한 것이다. 이 표에는, 체인 코드(chain code)로 표현된 패턴의 형상을 저장하기 위한 필드(2001)와, 임시문자 패턴의 왼쪽 경계의 번호와 오른쪽 경계의 번호를 저장하기 위한 필드(2002, 2003)와, 문자 식별의 결과인 후보 문자 코드를 저장하기 위한 필드(2004)와, 필드(2004)의 후보 문자 코드의 유사도 값을 저장하기 위한 필드(2005) 및 패턴의 신뢰도를 저장하기 위한 필드(2006)를 가지고 있다. 위의 항목 중에서, 경계 번호는 문자열의 왼쪽 끝을이라하여 시작하고 오른쪽으로 가면서 커지는 순서로 설정하고, 필드(2004)와 필드(2005)에는 세 개 이하의 후보 문자 코드와 유사도 값을 왼쪽맞춤 정렬하여 저장하며, 필드(2004)와 필드(2005)에 저장할 값이 없는 경우에는 각각 널 코드(null code) 및 "0"을 채워 넣는다.
도 21은 문자 패턴 후보 추출 단계(172)에서 생성된 분할용 그래프의 노드에 관한 데이터를 저장한 경계 표의 형식을 보인 것이다. 이 경계 표의 각 레코드는 하나의 경계에 해당한다. 이 표는 경계 번호를 저장하기 위한 필드(2101)와, 경계 좌표값을 저장하기 위한 필드(2102) 및 경계 간격을 저장하기 위한 필드(2103)로 구성되어 있다.
본 실시예에서 사용된 문자 식별 단계(174)는 기존에 알려진 방법과 동일하다. 한자, 히라가나 문자, 가다가나 문자, 아라비아 숫자 및 심볼(symbol)을 포함한 문자들중에서 지명과 번지를 나타내는데 사용되는 문자들만 문자 식별 단계에서 다루게 된다. 문자 식별 단계를 수행하면 복수의 후보 문자 코드와 각각의 후보 문자 코드의 표준 패턴에 대한 입력 문자 패턴의 유사도 값이 얻어진다.
도 22는 개형 페널티 산출 단계(173)의 흐름도를 보인 것이다. 이 단계의 입력으로서의 임시 문자 패턴은 패턴 표(도 20)의 레코드와 경계 표(도 21)로 표현된다. 복수의 분할 평가 단계(2201, 2202, 2203)에서는 각각의 임시 문자 패턴에 대해서 분할 오류에 대한 평가가 행해진다. 이 단계들의 출력 pi(i = 1, 2, 3)이 클수록 분할 오류의 가정에 대한 신뢰도가 큰 것이다. 출력 pi는 단계 (2204)에서 모두 합해지며, 그 결과는 개형 페널티 p로서 출력된다.
도 23은 도 22의 분할 오류의 형태를 설명한 것이며, E1부터 E7까지의 7가지 분할 오류 유형이 있다. 도 23에서, 검고 두꺼운 선은 임시 문자 패턴을, 점선 블록은 정확한 문자 패턴에 접하는 직사각형을, 희고 두꺼운 선은 임시 문자 패턴의 주변에 있는 패턴의 일부를 나타낸다. 예를 들면, 분할 오류 유형 E1은 문자의 왼쪽 부분을 임시 패턴으로 잘못 분할한 것을 나타낸다. 분할 오류 유형 E7은 두 문자를 하나의 임시 패턴으로 잘못 분할한 것을 보인 것이다.
도 24는 분할 오류의 평가 단계를 설명하기 위한 흐름도이다. 분할 오류의 평가 단계에 입력되는 임시 문자 패턴은 패턴 표의 레코드(문자 코드)와 경계 표에 표현되어 있다. 분할 오류 평가 단계(2401)는 가설 평가 단계들(2201, 2202, 2203) 중 어느 하나에 해당한다. 특징 추출 단계(2402)에서는 입력된 임시 문자 패턴으로부터 문자 패턴 크기와 인접한 문자 패턴과의 위치 관계와 같은 특징을 추출해 낸다. 그 특징은 다음과 같은 n차 벡터로서 표현된다.
이어서, 단계(2403)에서는 특징 F로부터 페널티 pi가 계산된다. 페널티 pi는 도 23의 Ei와 같은 오류 결과로부터 정확하게 분할된 문자 패턴을 구분하는 선형인식 함수의 값으로서 다음과 같이 정의된다.
여기에서 Vi는 선형 인식 함수의 가중 벡터이고, ci는 상수이며, F·Vi는 Vi와 F의 내적이다.
Vi와 ci의 값들은 후술하는 방법에 의한 학습에 의해 결정되며 미리 파라미터 사전(2204)에 저장된다. 본 실시예와 또 다른 한가지 방법으로서, 문자 식별 결과의 후보 문자에 따라 파라미터 사전이 전환될 수 있다.
도 25는 앞에서 설명한 특성 F를 설명하기 위한 문자 패턴을 보인 것이다. 그림에서, 흑색의 두꺼운 선(2501)은 임시 문자 패턴을, 희고 굵은 선(2502과 2503)은 인접한 문자 패턴을, 점선 블록은 각 문자 패턴에 접하는 직사각형을 나타낸다.
본 예에 있어서, 특징 F의 차수는 6이며 각각의 특징값들은 다음과 같이 정의된다.
f1 : 문자 패턴의 높이
f2 : 문자 패턴의 폭
f3 : 문자 패턴의 왼쪽에 인접한 문자 패턴으로부터의 간격
f4 : 문자 패턴의 오른쪽에 인접한 문자 패턴으로부터의 간격
f5 : 문자 패턴의 간격의 최대값
f6 : 문자 패턴의 연결된 부분의 개수
본 예에서는 모든 분할 오류 평가에 대해서 모두 같은 특징값을 사용하나 다른 값들이 사용될 수도 있다. 또한, 각각의 특징값들을 문자열의 높이 h와 같은 문자열의 대표적인 특징에 대해서 정규화할 수도 있다.
도 26은 분할 오류 평가 단계의 원리를 설명하기 위한 것이다. 참조번호(2601)와 참조번호(2602)는 실제로는 n차 유클리드 공간의 두 좌표축을 나타낸다. 패턴 그룹 (2603)은 정확하게 분할된 임시 문자 패턴의 특징 F의 분포를, 다른 패턴 그룹 (2604)는 분할 오류 유형 Ei의 임시 문자 패턴에 대한 특징 F의 분포를 표시한다. 도 26에서, Wi는 인식 함수의 가중 벡터로서 패턴 그룹(2603)과 패턴 그룹(2604)을 구별하며, 패턴 그룹(2603)과 패턴 그룹(2604)을 나누는 초월공간 B와 직교 한다.
이 초월공간 B는 다음 식을 만족하는 F의 집합으로써 표현된다.
여기에서, a는 원점에서 초월공간 B까지의 유클리드 거리를, Wi·F는 Wi와 F의 내적을, |Wi|는 Wi의 놈(norm)을 나타낸다.
그룹(2603)과 그룹(2604)을 구별하는 선형 인식 함수는 다음과 같이 표현되는 값 d를 가진다.
d가 0보다 크면 F는 그룹(2604)에 속하게 되며, 그렇지 않으면 그룹(2603)에 포함된다.
Wi와 a·|Wi|는 또한 토리와키(Toriwaki)가 쓴 "인식 공학"(ISBN-339-01059-6, C3355, P2781E, 코로나사)의 페이지 113-119에 소개된 방법에 의해 계산될 수도있다. 그러나, 선형 인식 함수의 pi값에 대해서 d를 그대로 사용하는 것은 유클리드 공간에서 각각의 Ei가 다른 분포를 가지고 있기 때문에 적당하지 않다. 따라서, 다음과 같이 인식 함수의 정규화된 값을 pi로 사용한다.
여기에서, s는 그룹(2603)과 그룹(2604)을 모두 포함하는 집합에 대한 d의 분산을 나타낸다.
그리고, 파라미터 사전(2404)에 저장된 선형 인식 함수의 가중 벡터 Vi와 상수 ci는 다음과 같이 구해진다.
다음, 패턴 신뢰도 계산 단계(175)가 간단하게 설명될 것이다. 패턴 신뢰도는 분할 그래프 또는 후보 문자에 대응하는 아크의 신뢰도의 정도를 나타내는 것으로서 다음과 같이 계산된다.
여기에서, p는 개형 페널티이고, c1과 c2는 시스템 특정 상수이다.
도 27은 주소 사전 정합 단계(176)를 보인 흐름도이다. 이 단계에서는 앞에서 설명한 패턴 표와 경계 표로부터 임시 문자 패턴과, 패턴 신뢰도와, 후보 문자와, 유사도를 입력받는다. 우선, 임시 문자 패턴 선택 단계(2701)에서는 특정한 값보다 작은 패턴 신뢰도 값을 갖는 임시 문자 패턴을 선택한다. 도 34A의 예에서는, 문자 식별의 결과 문자 패턴②와③등이 작은 유사도 값을 가지며, 결과적으로 작은 패턴 신뢰도를 가지게 되는 것이다. 따라서, 위의 패턴들은 제거되어 분할 그래프는 도 34B에 보인 바와 같이 간단하게 된다. 문자 패턴④⑥은 큰 개형 페널티를 가지기 때문에 작은 패턴 신뢰도를 가지게 되며 제거되는 것이다.
다음으로, 사전 정합 단계(2703)에서는 문자 식별 결과 얻어진 각각의 임시 문자 패턴의 후보 문자들을 먼저 주소 사전(2704)에 저장된 주소 문자열과 비교하고, 정합을 성공한 주소 문자열을 후보 문자열로서 출력한다. 후보 주소 문자열을 정렬(sorting)하는 단계(2705)에서는 후보 문자와 후보 문자열의 정합 정도가 줄어드는 순서대로 후보 문자열을 재정렬한다. 더 큰 정합 정도를 가지는 후보 문자열이 더욱 신뢰할 수 있는 것으로 볼 수 있다.
도 28은 사전 정합 단계(2703)를 개략적으로 설명한 것이다. 본 단계에서는, 문자 식별 결과에 기초해서 생성된 오토마톤(automaton)에 의해서 수리된 주소 문자열을 주소 사전(2704)으로부터 선택한다. 오토마톤에 의해서 수리된 주소 문자열의 결정을 위해서는 마루가와(Marukawa) 등이 제안한 방법(IIE 논문집 제35권 제6호 "한자 주소 인식 : 오류 보정 알고리즘")이 사용될 수 있다. 도 28에 있는 프레임(2801)은 임시 문자 패턴의 선별 후, 문자 식별 결과의 후보 문자로부터 생성된 오토마톤을 모식적으로 보인 것이다. 패턴 사이의 경계는 상태를, 문자 식별 결과 얻어진 후보 문자는 천이를 나타낸다. 각 상태의 번호는 분할 그래프의 노드 번호와 일치한다. 오토마톤은 패턴 표와 같은 구조를 가지는 표에 의해 실현된다. 오토마톤(2801)의 굵은 선은 주소 사전(2704)에서 오토마톤(2801)에 의해 수리된 문자열(2803, 中住市水反町12)의 경로를 보인 것이다. 오토마톤(2801)이 주소 사전(2704)에 있는 문자열을 수리하면, 문자열을 후보 문자열로 출력한다. 정합 신뢰도 mc는 정합 단계에서 천이가 일어나는 경우의 신뢰도 tc(천이 신뢰도)의 총합이며 다음과 같이 계산된다.
천이 신뢰도는 다음과 같이 계산된다.
여기에서, sm은 각 천이에 대한 후보 문자의 유사도를, jm은 천이의 전후에 있어서 상태 번호의 차이를 나타낸다.
상수 c1과 c2는 패턴 신뢰도를 계산하는데 사용되는 것과 동일하다. 도 28의 예에서는, 또 다른 문자열 "中住市水反町11" 또한 수리되어 주소 인식의 결과(2802)로서 출력된다. 그러나, 후자의 경우는 전자의 경우보다 작은 유사도의 후보 문자를 사용하여 수리된 것이므로 정합 신뢰도가 작아진다.
도 29는 도 24에 보인 분할 오류 평가 단계(2401)에 사용되는 파라미터 사전(2404)의 학습을 위해서 샘플을 수집하는 샘플 수집 장치의 표시 화면의 한 예를 보인 것이다. 도 29에서, 참조번호(2901)는 CRT화면을 나타내며, 참조번호(2902)는 문자열의 영상을 표시하기 위한 창이다. 창에 표시된 문자열에서, 현재 처리중인 문자 패턴은 다른 색(도 29에서는 흑색의 두꺼운 선)으로 표시된다. 조작자(operator)는 창(1902)의 영상을 보면서 패턴이 정확하게 분할되었는지 여부를 판단한다. 부정확한 분할을 발견한 경우, 조작자는 도 23에 보인 분할 오류의 유형을 찾아 커서(2904)를 이용하여 패널(2903)에 표시된 해당하는 키를 클릭한다. 조작자의 키 클릭에 대한 응답으로, 샘플 수집 장치는 처리중인 패턴의 특징값을 오류 형태에 관한 파일에 저장하고 창(2902)에 다른 문자 패턴을 표시한다.
도 30은 도 24의 파라미터 사전(2404)의 학습을 위한 단계를 보인 흐름도이다. 샘플 수집 장치(3002)는 미리 수집된 주소열 영상 데이터베이스(3001, DB)를 이용하여 정확한 분할 패턴 데이터베이스(3003)와 도 23의 부정확한 분할의 패턴 데이터베이스 E1부터 E7까지에 해당하는 부정확한 분할 패턴 데이터베이스(3004, 3005 등)를 만들어낸다. 학습 장치(3006)는 정확한 분할 패턴 데이터베이스(3003)와 E1에 대한 부정확한 분할 패턴 데이터베이스(3004)의 데이터를 입력받아, 가중 벡터 V1과 상수 c1을 도 26에서 설명한 것과 같은 방법으로 계산하고, 계산된 값들을 파라미터 사전(3008)으로 출력한다. 유사한 방법으로, 위 단계는 다른 학습 장치(3007 등)를 이용하여 부정확한 분할 패턴 데이터베이스(3005 등)에 대한 가중 벡터 Vi와 상수 ci를 계산하고, 계산된 값들을 파라미터 사전(3008)으로 출력한다.
도 31은 파라미터 사전의 표 구조를 나타낸다. 표의 각 레코드 pdic[i]는 Ei에 대응하는 파라미터 vi와 ci를 저장한다. 예를 들면, 이 표의 처음 레코드 pdic[1](3103)는 V1과 c1을, 위에서부터 i번째 레코드(3104)는 Vi와 ci를 저장한다. 각 레코드에 대해서 ci와 Vi는 각각 필드(3101)와 필드(3102)에 저장된다.
도 32는 개형 페널티를 계산하는 단계의 흐름을 보인 것이다. 첫 번째 단계(3201)에서 변수 p를 0으로 초기화한다. 다음 단계(3203)와 단계(3204)에서 제어 루프 (3202)에서 i를 증가시키면서 계속 반복된다. 단계(3203)에서는 분할 오류 평가 단계가 시작되고, 단계(3204)에서는 분할 오류 평가 단계의 결과인 pi를 p에 더한다. 단계(3208)에서는 변수 p를 개형 페널티로서 출력한다. 단계(3205)와 단계(3206)는 분할 오류 평가 단계의 서브루틴을 나타낸다. 단계(3205)에서는 파라미터 사전에서 읽어들인 ci에 대한 식 pdic[i]·c의 값을 변수 pi에 대입한다. 단계(3206)은 특징 추출에서 구한 F와 파라미터 사전에서 읽어들인 Vi의 내적을 계산하기 위한 제어 루프이다. 즉, 변수 j의 값을 특징의 차수까지 증가시키는 동안 Vi에 대한 pdic[i]·V[j]의 값과 F[j]의 값을 곱한 것을 계속해서 pi에 더한다.
본 발명에 의한 문자 판독 방법은 분할된 문자 패턴의 열로부터 올바른 문자 패턴을 결정하고 문자 패턴을 정확하게 식별하는 것이 가능하다.
본 발명은 우편물의 서면에 씌어진 지명 부분과 번지 부분으로 이루어진 주소 문자열에 대한 영상 신호로부터 주소의 문자열을 정확하게 판독할 수 있는 방법을 제공한다.
본 발명은 또한, 다중 가설 검정법에 의해 주소 문자열을 판독하는데 있어서, 분할된 후보 문자 패턴이 문자 식별과 문자열 정합의 결과만을 이용하는 경우에는 정확하게 검사될 수 없는 주소 문자열에 대해서도, 현재 처리중인 패턴과 인접한 패턴의 상대적인 특징값을 이용하여 정확하게 문자 패턴을 분할하는 방법을제공한다. 따라서, 본 발명에 의한 문자 판독 방법에서는 문자 폭, 문자 피치, 및 문자 간격이 일정하지 않은 문자열의 경우에도 정확한 분할이 가능하다.
Claims (13)
- 서면 상에 기재된 영상 정보를 전기 신호로 변환하고 상기 영상 정보에 포함된 문자열의 문자를 판독하여 문자를 판독하는 방법에 있어서,상기 영상 정보에 대한 상기 전기 신호에서 문자열 기재 영역의 위치를 찾고, 상기 문자열 기재 영역 중의 문자열에 대한 영상 정보를 복수의 임시 문자 패턴으로 분할하는 제1 단계와,문자 식별 사전을 참조하여 상기 임시 문자 패턴에 대하여 문자 식별을 하여 상기 각각의 임시 문자 패턴에 대응하는 복수의 인식 후보 문자를 얻는 제2 단계와,상기 임시 문자 패턴에 대하여 주변 정보를 추출하는 제3 단계와,상기 제2 단계에서 얻은 인식 후보 문자를 키(key)로 하여 상기 주변 정보를 포함하는 문자 분할용 사전을 참조함으로써, 상기 제3 단계에서 얻은 상기 임시 문자 패턴의 주변 정보의 신뢰도를 구하고, 상기 임시 문자 패턴에 가중치를 설정하는 제4 단계와,상기 임시 문자 패턴의 가중치에 따라 상기 문자 패턴 분할을 결정하는 제5 단계와,상기 제5 단계에서 결정된 상기 임시 문자 패턴으로부터 생성된 식별 문자 코드(character species)의 집합을 기초로 상기 문자 식별 사전을 이용하여 단어 정합을 행하여 상기 서면상에 기재된 문자열의 문자를 식별하는 제6 단계를 포함하는 문자 판독 방법.
- 제1항에 있어서, 상기 임시 문자 패턴의 주변 정보는 상기 문자 패턴의 가로 길이, 세로 길이, 가로 길이와 세로 길이의 비, 패턴 간격, 및 연결된 성분의 수 중에서 적어도 하나를 포함하고, 상기 문자 분할용 사전은 각 문자에 대한 가로 길이, 세로 길이, 가로 길이와 세로 길이의 비, 패턴 간격, 및 연결된 성분의 수 중에서 적어도 하나에 대한 우도(likelihood) 분포 정보를 포함하며, 상기 제4 단계의 상기 문자 분할용 사전의 참조 키는 문자 식별의 결과인 후보 문자의 문자 코드인 문자 판독 방법.
- 제1항에 있어서, 제4 단계는 상기 문자 분할용 사전을 생성하고 갱신하는 생성 및 갱신 단계를 포함하고, 상기 생성 및 갱신 단계는 표시 장치의 화면 상에 판독할 문자열의 입력 영상, 상기 임시 문자 패턴, 및 상기 임시 문자 패턴에 대한 문자 식별의 결과인 후보 문자를 표시하는 단계와, 상기 표시 장치 화면상의 표시를 이용하여 문자 분할용 사전의 갱신을 행하는 단계와, 문자열에 대한 인식 처리의 상태를 상기 화면상에 그래픽으로 표시하는 단계를 포함하는 문자 판독 방법.
- 주소 판독 방법에 있어서,지명 부분과 번지 부분을 가지는 문자열 정보를 포함하는 영상 정보를 전기 신호로 변환하는 제1 단계와,상기 영상 정보에 대한 전기신호에서 문자열 기재 영역의 위치를 찾고, 상기 문자열 기재 영역중에서 문자를 구성하는 연결된 성분들의 결합을 임시 문자 패턴으로서 추출하는 제2 단계와,문자 식별 사전을 참조하여 상기 임시 문자 패턴 각각에 대하여 문자식별을 행하여, 인식 후보 문자 및 상기 인식 후보 문자와 상기 임시 문자 패턴과의 유사도를 얻는 제3 단계와,상기 인식 후보 문자들로 이루어진 래티스(lattice)를 형성하고, 상기 래티스에 대하여 지명 사전과의 정합을 행하여 상기 임시 문자 패턴의 상기 지명 부분에 대한 문자열을 인식하며, 상기 번지 부분의 처음 위치 정보를 검출하는 제4 단계와;상기 제 4 단계에서 얻은 상기 처음 위치 정보에 기초하여 상기 번지 부분의 임시 문자 패턴에 대한 인식 후보 문자에 대응하는 임시 문자 패턴의 주변 정보를 추출하고, 상기 인식 후보 문자를 키로 사용하여 상기 주변 정보의 우도를 포함하는 문자 분할용 사전을 참조하여 상기 임시 문자 패턴의 주변 정보에 대한 신뢰도를 구하기 위해 상기 임시 문자 패턴에 가중치를 설정하는 제5 단계와,상기 가중치에 기초하여 상기 번지 부분을 문자들로 분할하는 제6 단계와,상기 제6 단계에서 생성된 문자 식별 결과의 집합에 대하여 번지 사전과의 단어 정합을 행함으로써 번지의 문자열을 식별하는 제7 단계를 포함하는 주소 판독 방법.
- 제4항에 있어서, 상기 제2 단계는 상기 추출된 문자열의 처음과 끝으로부터 문자를 추출하고, 상기 추출된 문자 패턴에 대한 식별에 기초하여 세로 쓰기인지 가로 쓰기인지를 판별하는 단계를 더 포함하는 문자 판독 방법.
- 제4항에 있어서, 상기 패턴 주변 정보는 문자 패턴의 세로 길이, 가로 길이, 가로 길이와 세로 길이의 비, 패턴 간격, 및 연결된 성분의 수 중에서 적어도 하나를 포함하고, 상기 문자 분할용 사전은 각 문자에 대한 세로 길이, 가로 길이, 가로 길이와 세로 길이의 비, 패턴 간격, 및 연결된 성분의 수 중에서 적어도 하나에 대한 우도의 분포에 대한 정보를 포함하며, 상기 제5 단계의 상기 인식 후보 문자인 참조키는 상기 문자 분할용 사전의 문자인 문자 판독 방법.
- 제4항에 있어서, 상기 제5 단계는 상기 문자 분할용 사전을 생성하고 갱신하는 단계를 포함하고, 상기 생성 및 갱신 단계는 표시 장치의 화면에 인식할 주소 문자열의 입력 영상, 상기 문자 패턴, 및 상기 문자 패턴에 대한 문자 식별 결과 생성된 후보 문자를 표시하는 단계와, 상기 표시 장치 화면 상의 표시를 이용하여 상기 문자 분할용 사전을 갱신하는 단계와, 상기 주소 문자열에 대한 인식 처리의 상태를 상기 화면에 그래픽으로 표시하는 단계를 포함하는 문자 판독 방법.
- 서면 상에 기재된 영상 정보를 전기 신호로 변환하기 위한 영상 입력 수단과, 상기 영상으로부터 상기 서면에 씌어진 문자열을 판독하기 위한 수단을 포함하는 판독 장치의 문자 판독 방법에 있어서,상기 영상의 전기 신호로부터 상기 문자열에 대한 신호를 추출하는 제1 단계와,상기 문자열에 대한 신호로부터 하나의 문자를 형성하는 것으로 판단되는 하나의 임시 문자 패턴을 추출하거나, 하나의 임시 문자 패턴이 유일하게 정해질 수 없는 경우에는 복수의 임시 문자 패턴을 추출하는 제2 단계와,상기 추출된 임시 문자 패턴에 대해서 문자 식별을 행하는 제3 단계와,문자 분할 오류의 가능한 유형에 따른 주변 정보의 평가에 기초하여 개형 페널티(external form penalty)를 계산하는 제4 단계와;상기 제3 단계의 문자 식별 결과 및 상기 제4 단계에서 계산된 개형 페널티에 따라 임시 문자 패턴의 후보를 결정하고, 상기 서면 상에 기재 되어 있을 가능성이 있는 문자열을 포함하는 사전에 미리 저장된 문자열과 상기 문자 패턴과의 정합을 행함으로써 상기 서면에 기재된 문자열을 인식하는 문자 판독 방법.
- 제8항에 있어서, 상기 서면 상에 기재되어 있는 상기 문자열은 주소를 나타내는 문자열이고, 상기 서면 상에 기재되어 있을 가능성이 있는 문자열을 포함하는 상기 사전은 주소가 기재된 사전을 포함하는 문자 판독 방법.
- 제8항에 있어서, 상기 제4 단계는 올바로 분할된 임시 문자 패턴과 잘못 분할된 후보 문자를 구별하는 인식 함수들을 사용하는 문자 판독 방법.
- 제10항에 있어서, 상기 인식 함수 중의 하나는 각 임시 문자 패턴과 그 인접한 패턴과의 간격을 특징값의 하나로 하는 문자 판독 방법.
- 제10항에 있어서, 상기 인식 함수 중의 하나는 각 패턴의 간격을 특징값의 하나로 하는 문자 판독 방법.
- 제10항에 있어서, 상기 제4 단계의 상기 인식 함수는상기 문자열의 영상으로부터 하나의 문자열을 형성하는 것으로 판단되는 하나의 임시 문자 패턴을 추출하거나, 임시 문자 패턴이 유일하게 정해질 수 없는 경우에는 복수의 임시 문자 패턴을 추출하는 단계와,상기 임시 문자 패턴이 올바르게 분할되어 있는지 또는 그렇지 않은지에 관한 정보를 입력하는 단계로서, 분할 오류가 발생한 경우에는 분할 오류의 유형이 수동적으로 정렬되는 단계와,상기 분할 오류의 판단 단계의 결과에 따라 상기 임시 문자 패턴을 정렬시킴으로써 상기 임시 문자 패턴을 메모리에 저장하는 단계와,상기 패턴 저장 단계에 의해 상기 메모리에 저장된 상기 임시 문자 패턴을 이용하여 식별 장치의 학습을 수행하는 단계를 포함하는 방법에 의해서 생성되는 문자 판독 방법.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32451695A JP3232991B2 (ja) | 1995-12-13 | 1995-12-13 | 文字読取り方法及び住所読取り方法 |
JP95-324516 | 1995-12-13 | ||
JP00043896A JP3313272B2 (ja) | 1996-01-08 | 1996-01-08 | 住所読み取り方法および識別関数重みベクトル生成方法 |
JP96-000438 | 1996-01-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970049823A KR970049823A (ko) | 1997-07-29 |
KR100411697B1 true KR100411697B1 (ko) | 2004-03-30 |
Family
ID=26333419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019960064613A KR100411697B1 (ko) | 1995-12-13 | 1996-12-12 | 문자판독방법및주소판독방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6246794B1 (ko) |
KR (1) | KR100411697B1 (ko) |
CN (1) | CN1151464C (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101012729B1 (ko) * | 2008-10-31 | 2011-02-09 | 한국과학기술원 | 마커를 이용한 문자열 추출 시스템 및 그 방법 |
US8855424B2 (en) | 2009-12-29 | 2014-10-07 | Omron Corporation | Word recognition method, word recognition program, and information processing device |
US11348331B2 (en) * | 2020-03-10 | 2022-05-31 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium |
Families Citing this family (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11226513A (ja) * | 1998-02-18 | 1999-08-24 | Toshiba Corp | 郵便物宛先読取装置及び郵便物区分装置 |
JP3482191B2 (ja) * | 1999-05-12 | 2003-12-22 | シーメンス アクチエンゲゼルシヤフト | 住所読み取りのための方法 |
JP3709305B2 (ja) * | 1999-07-01 | 2005-10-26 | 日立オムロンターミナルソリューションズ株式会社 | 地名文字列照合方法、地名文字列照合装置、地名文字列認識装置及び郵便物区分システム |
JP3204259B2 (ja) * | 1999-10-06 | 2001-09-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置 |
JP2001134716A (ja) * | 1999-11-09 | 2001-05-18 | Toshiba Corp | 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置 |
US6360001B1 (en) * | 2000-05-10 | 2002-03-19 | International Business Machines Corporation | Automatic location of address information on parcels sent by mass mailers |
GB2367917A (en) * | 2000-10-12 | 2002-04-17 | Qas Systems Ltd | Retrieving data representing a postal address from a database of postal addresses using a trie structure |
JP2002163637A (ja) * | 2000-11-27 | 2002-06-07 | Omron Corp | 画像検査装置及び画像検査方法 |
JP4136316B2 (ja) * | 2001-01-24 | 2008-08-20 | 富士通株式会社 | 文字列認識装置 |
US7693917B2 (en) | 2001-11-30 | 2010-04-06 | Intelligent Medical Objects, Inc. | Method for adaptive data management |
US8589400B2 (en) | 2001-11-30 | 2013-11-19 | Intelligent Medical Objects, Inc. | Longitudinal electronic record system and method |
US8103104B2 (en) * | 2002-01-11 | 2012-01-24 | Hewlett-Packard Development Company, L.P. | Text extraction and its application to compound document image compression |
CA2375355A1 (en) * | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
US20040065598A1 (en) * | 2002-06-17 | 2004-04-08 | Ross David Justin | Address disambiguation for mail-piece routing |
US7415130B1 (en) * | 2002-10-30 | 2008-08-19 | Lockheed Martin Corporation | Mail image profiling and handwriting matching |
US7167858B2 (en) * | 2003-08-15 | 2007-01-23 | Intelligent Medical Objects, Inc. | Identification mapping and translation method |
EP1684919A1 (en) * | 2003-11-18 | 2006-08-02 | Siemens AG | Method and apparatus for forwarding a mail item |
US7406201B2 (en) * | 2003-12-04 | 2008-07-29 | International Business Machines Corporation | Correcting segmentation errors in OCR |
CN100407231C (zh) * | 2004-06-10 | 2008-07-30 | 中国煤炭地质总局航测遥感局 | 用于图像转图形中边界线追踪的优化方法 |
US7492943B2 (en) * | 2004-10-29 | 2009-02-17 | George Mason Intellectual Properties, Inc. | Open set recognition using transduction |
US8175889B1 (en) | 2005-04-06 | 2012-05-08 | Experian Information Solutions, Inc. | Systems and methods for tracking changes of address based on service disconnect/connect data |
CN100354876C (zh) * | 2005-04-13 | 2007-12-12 | 佳能株式会社 | 增强字符行图像的方法和设备 |
JP4807618B2 (ja) * | 2006-03-06 | 2011-11-02 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
US20080110810A1 (en) * | 2006-11-01 | 2008-05-15 | Raf Technology, Inc. | Mailpiece reject processing and labeling |
CN101409686B (zh) * | 2007-10-11 | 2011-09-28 | 鸿富锦精密工业(深圳)有限公司 | 电子邮件附件内容检查系统及方法 |
WO2009094446A1 (en) * | 2008-01-22 | 2009-07-30 | Digital Business Processes, Inc. | Method and apparatus for cropping images |
TW201001303A (en) * | 2008-06-27 | 2010-01-01 | Univ Nat Taiwan Science Tech | System and method for recognizing document immediately |
KR101035744B1 (ko) * | 2008-12-08 | 2011-05-20 | 삼성전자주식회사 | 카메라를 이용한 문자 인식 장치 및 방법 |
US8527086B2 (en) * | 2009-06-23 | 2013-09-03 | Raf Technology, Inc. | Return address destination discrimination technology |
US8554742B2 (en) * | 2009-07-06 | 2013-10-08 | Intelligent Medical Objects, Inc. | System and process for record duplication analysis |
EP2593920A4 (en) * | 2010-07-12 | 2016-05-04 | Google Inc | SYSTEM AND METHOD FOR DETERMINING BUILDING NUMBERS |
JP5721539B2 (ja) * | 2011-05-30 | 2015-05-20 | 沖電気工業株式会社 | サーバ、情報処理方法および情報処理システム |
US8526743B1 (en) | 2010-11-01 | 2013-09-03 | Raf Technology, Inc. | Defined data patterns for object handling |
JP5699570B2 (ja) * | 2010-11-30 | 2015-04-15 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
US9152862B2 (en) | 2011-09-15 | 2015-10-06 | Raf Technology, Inc. | Object identification and inventory management |
US8774455B2 (en) | 2011-03-02 | 2014-07-08 | Raf Technology, Inc. | Document fingerprinting |
US9443298B2 (en) | 2012-03-02 | 2016-09-13 | Authentect, Inc. | Digital fingerprinting object authentication and anti-counterfeiting system |
JP5647919B2 (ja) * | 2011-03-07 | 2015-01-07 | 株式会社Nttドコモ | 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム |
US9361596B2 (en) | 2011-10-04 | 2016-06-07 | Raf Technology, Inc. | In-field device for de-centralized workflow automation |
JP5712415B2 (ja) * | 2011-11-14 | 2015-05-07 | 日立オムロンターミナルソリューションズ株式会社 | 帳票処理システム及び帳票処理方法 |
CN103310209A (zh) * | 2012-03-09 | 2013-09-18 | 富士通株式会社 | 识别图像中的字符串的方法和装置 |
US9795997B2 (en) | 2013-03-15 | 2017-10-24 | United States Postal Service | Systems, methods and devices for item processing |
JP6131765B2 (ja) * | 2013-08-06 | 2017-05-24 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US10102536B1 (en) | 2013-11-15 | 2018-10-16 | Experian Information Solutions, Inc. | Micro-geographic aggregation system |
US20150371100A1 (en) * | 2014-06-23 | 2015-12-24 | Xerox Corporation | Character recognition method and system using digit segmentation and recombination |
CN104624509B (zh) * | 2015-01-16 | 2017-06-13 | 浙江百世技术有限公司 | 一种快递自动分拣系统及自动分拣方法 |
CN107533652B (zh) | 2015-05-11 | 2021-01-12 | 株式会社东芝 | 识别装置、识别方法及记录介质 |
CN107533651B (zh) | 2015-05-11 | 2021-05-04 | 株式会社东芝 | 识别装置、识别方法及计算机可读取的记录介质 |
CN104992175B (zh) * | 2015-07-10 | 2018-02-13 | 河海大学常州校区 | 一种基于树型关系的过粘连钢坯字符分割方法 |
US10572883B2 (en) | 2016-02-19 | 2020-02-25 | Alitheon, Inc. | Preserving a level of confidence of authenticity of an object |
EP3236401A1 (en) | 2016-04-18 | 2017-10-25 | Alitheon, Inc. | Authentication-triggered processes |
US10614302B2 (en) | 2016-05-26 | 2020-04-07 | Alitheon, Inc. | Controlled authentication of physical objects |
US10740767B2 (en) | 2016-06-28 | 2020-08-11 | Alitheon, Inc. | Centralized databases storing digital fingerprints of objects for collaborative authentication |
US10915612B2 (en) | 2016-07-05 | 2021-02-09 | Alitheon, Inc. | Authenticated production |
US10902540B2 (en) | 2016-08-12 | 2021-01-26 | Alitheon, Inc. | Event-driven authentication of physical objects |
US10839528B2 (en) | 2016-08-19 | 2020-11-17 | Alitheon, Inc. | Authentication-based tracking |
US10949660B2 (en) | 2017-04-10 | 2021-03-16 | Pearson Education, Inc. | Electronic handwriting processor with convolutional neural networks |
US11062118B2 (en) | 2017-07-25 | 2021-07-13 | Alitheon, Inc. | Model-based digital fingerprinting |
EP3514715A1 (en) | 2018-01-22 | 2019-07-24 | Alitheon, Inc. | Secure digital fingerprint key object database |
CN109087368B (zh) * | 2018-06-14 | 2023-04-07 | 创新先进技术有限公司 | 一种字符串图形化方法和装置 |
US10963670B2 (en) | 2019-02-06 | 2021-03-30 | Alitheon, Inc. | Object change detection and measurement using digital fingerprints |
EP3734506A1 (en) | 2019-05-02 | 2020-11-04 | Alitheon, Inc. | Automated authentication region localization and capture |
EP3736717A1 (en) | 2019-05-10 | 2020-11-11 | Alitheon, Inc. | Loop chain digital fingerprint method and system |
CN110728526B (zh) * | 2019-08-19 | 2024-04-02 | 创新先进技术有限公司 | 地址识别方法、设备以及计算机可读介质 |
US11238146B2 (en) | 2019-10-17 | 2022-02-01 | Alitheon, Inc. | Securing composite objects using digital fingerprints |
EP3859603A1 (en) | 2020-01-28 | 2021-08-04 | Alitheon, Inc. | Depth-based digital fingerprinting |
US11341348B2 (en) | 2020-03-23 | 2022-05-24 | Alitheon, Inc. | Hand biometrics system and method using digital fingerprints |
EP3885984A1 (en) | 2020-03-23 | 2021-09-29 | Alitheon, Inc. | Facial biometrics system and method of using digital fingerprints |
EP3929806A3 (en) | 2020-04-06 | 2022-03-09 | Alitheon, Inc. | Local encoding of intrinsic authentication data |
US11663849B1 (en) | 2020-04-23 | 2023-05-30 | Alitheon, Inc. | Transform pyramiding for fingerprint matching system and method |
US11983957B2 (en) | 2020-05-28 | 2024-05-14 | Alitheon, Inc. | Irreversible digital fingerprints for preserving object security |
EP3926496A1 (en) | 2020-06-17 | 2021-12-22 | Alitheon, Inc. | Asset-backed digital security tokens |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63182793A (ja) * | 1987-01-26 | 1988-07-28 | Sharp Corp | 文字切り出し方式 |
EP0325233B1 (en) * | 1988-01-18 | 1994-07-27 | Kabushiki Kaisha Toshiba | Character string recognition system |
US5216725A (en) * | 1990-10-31 | 1993-06-01 | Environmental Research Institute Of Michigan | Apparatus and method for separating handwritten characters by line and word |
US5161245A (en) * | 1991-05-01 | 1992-11-03 | Apple Computer, Inc. | Pattern recognition system having inter-pattern spacing correction |
JP3260843B2 (ja) * | 1992-08-25 | 2002-02-25 | 株式会社リコー | 文字認識方法 |
-
1996
- 1996-12-11 US US08/763,515 patent/US6246794B1/en not_active Expired - Lifetime
- 1996-12-12 KR KR1019960064613A patent/KR100411697B1/ko not_active IP Right Cessation
- 1996-12-13 CN CNB961215445A patent/CN1151464C/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101012729B1 (ko) * | 2008-10-31 | 2011-02-09 | 한국과학기술원 | 마커를 이용한 문자열 추출 시스템 및 그 방법 |
US8855424B2 (en) | 2009-12-29 | 2014-10-07 | Omron Corporation | Word recognition method, word recognition program, and information processing device |
US11348331B2 (en) * | 2020-03-10 | 2022-05-31 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium |
Also Published As
Publication number | Publication date |
---|---|
US6246794B1 (en) | 2001-06-12 |
KR970049823A (ko) | 1997-07-29 |
CN1158465A (zh) | 1997-09-03 |
CN1151464C (zh) | 2004-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100411697B1 (ko) | 문자판독방법및주소판독방법 | |
US6021220A (en) | System and method for pattern recognition | |
US5251273A (en) | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms | |
US5943443A (en) | Method and apparatus for image based document processing | |
JP3824209B2 (ja) | 文書自動分割装置 | |
KR100248917B1 (ko) | 패턴인식장치및방법 | |
US7792369B2 (en) | Form processing method, form processing device, and computer product | |
US5923778A (en) | Hierarchical representation of reference database for an on-line Chinese character recognition system | |
US5579408A (en) | Character recognition method and apparatus | |
US6320983B1 (en) | Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein | |
US6763137B1 (en) | Recognition and clustering of connected components in bi-level images | |
JPH05217019A (ja) | ビジネスフォーム識別システム及び画像処理システム | |
US12051256B2 (en) | Entry detection and recognition for custom forms | |
JPH06508465A (ja) | 文字ビットマップにおける終点特性を測定する手段を用いる文字認識システム及び方法 | |
US5926564A (en) | Character recognition method and apparatus based on 0-1 pattern representation of histogram of character image | |
JPH08508128A (ja) | 分布マップを用いる画像の分類方法及び装置 | |
JP3917349B2 (ja) | 文字認識結果を利用して情報を検索する検索装置および方法 | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
JP3232991B2 (ja) | 文字読取り方法及び住所読取り方法 | |
EP0042968B1 (en) | Multi-registration in optical character recognition | |
CN115131806B (zh) | 一种基于深度学习的各类证件ocr图像信息识别方法、系统 | |
JPH08287188A (ja) | 文字列認識装置 | |
JP2001506383A (ja) | ピクセルマトリクス上で文字認識を実行する方法 | |
CN111626281B (zh) | 基于自适应学习的纸质影像地图中文标注信息识别方法及系统 | |
JP2592756B2 (ja) | 文字切り出し装置およびこれを用いた文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20081202 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |