KR19990036515A

KR19990036515A - 문자 인식/수정 방법 및 장치

Info

Publication number: KR19990036515A
Application number: KR1019980020532A
Authority: KR
Inventors: 야수나오 이자키
Original assignee: 이데이 노부유끼; 소니 가부시끼 가이샤
Priority date: 1997-10-16
Filing date: 1998-06-03
Publication date: 1999-05-25
Also published as: CN1215201A; CN1140878C; JPH11120293A; JP3452774B2; KR100412317B1

Abstract

본 발명은 각종 전표에 기입되는 불규칙한 문자 간격 또는 불규칙한 기입 방법으로 기입되는 저품질의 문자열을 정밀도가 좋게 인식하는 것에 있다.

입력 문자열(101)과 특정 문자 표준 패턴 사전(107)사이에서 제1 매칭 처리가 실행되는 것에 의해 입력 문자열(101)중에서 특정 문자 또는 특정 문자열이 추출된다. 그 후에는 소정의 카테고리에 속하고, 또한 입력 문자열(101)중에서 추출된 각 특정 문자 또는 특정 문자열의 전후 입력 문자열(101)중의 영역에 위치할 가능성이 있는 후보 단어군이 특정 문자 사전(110) 및 그것에 링크하는 지식 사전(111)에서 추출된다. 그리고, 후보 단어군에 속하는 각 후보 단어마다 그 각 후보 단어에 관한 정보에 기초하여 그것이 위치하는 입력 문자열(101)중의 각 영역에 대하여 표준 패턴 사전(113)을 이용하여 제2 매칭 처리가 실행되는 것에 의해 입력 문자열(101)을 구성하는 문자가 인식된다.

Description

문자 인식/수정 방법 및 장치

본 발명은 통상 흔히 보는 각종 전표에 기입되는 문자열로서, 불규칙한 문자 간격 또는 불규칙한 기입 방법으로 기입되어, 인접 문자간에 접촉, 분리가 발생하는 경우가 있는 저품질의 문자열을 인식하는 기술에 관한 것이다.

이미지 데이터를 판독하여 문자 부호 데이터로 변환하는 OCR(광학적 문자 판독 장치)은 그 적용 분야가 넓어짐에 따라 여러가지 업무에 사용되고 있다. 업무마다 다른 문서가 사용되고, 거기에 기입되는 문자열과 기입자도 다양화 되고 있다.

종래의 OCR용 문서에 있어서 문자 기입 테두리는 1문자씩 인쇄된 문자 테두리가 사용되고, 특히 한자가 기입되는 경우에는 큰 문자 테두리가 사용되고 있다. 이것은 OCR 장치에 있어서 기입되는 문자를 1문자씩 검출하기 쉽게 하고, 기입자에 대해서는 기입시에 기입되는 문자가 옆의 문자와 접촉하지 않도록 하기 위한 것이다.

이러한 문서의 경우, 예컨대 주소나 성명이 2, 3군데에 기입되는 것 만으로도 기입되는 문자 수는 수십 문자로 되고 결과적으로 사이즈가 큰 문서가 필요하게 되어 비용이 든다. 또한, 기입자에 대하여도 1문자씩 테두리속에 기입하지 않으면 안되는 불편함이 있었다.

OCR의 적용 분야가 넓어짐에 따라서, 통상의 문서와 같은 작은 문서속에 한자 문자열을 문자 테두리에 구애받지 않고 기입할 수 있고, 실용가능한 인식 정밀도로 인식할 수 있으며, 읽을 수 없는 문자를 수정할 때에도 효율적으로 수정할 수 있는 문자 인식/수정 기술이 필요하게 되고 있다.

종래의 대표적인 문자 인식 방법에서는 인식 대상 문자열이 기입되는 문자 테두리의 문서상에서 좌표 위치가 격납된 정의체(正義體)라고 불리우는 파일이 참조되면서, 기입된 문자가 1문자씩 검출되어 절출된다. 그리고, 그 절출된 각 문자에 대하여 인식 처리가 실행되는 것에 의해 인식 결과인 후보 문자군이 출력된다.

절출된 문자의 인식 처리는, 예컨대 다음과 같이 실행된다.

우선, 다수의 불특정한 필기자에 의해 미리 정해진 서식에 따라서 기입된 문자가 수집되고 이들 문자로부터 인식 방식에 의존하는 특징량이 추출되어 통계적인 수법등(예컨대 클러스터링 수법)에 의해 표준 패턴이 작성된다. 그리고, 목적으로 하는 문자 종류마다의 표준 패턴으로부터 표준 패턴 사전이 작성된다.

표준 패턴은 예컨대 수집된 각 문자 패턴을 평균하여 얻어지는 평균 패턴으로서 작성된다. 보다 구체적으로는 수집된 각 문자에 대응하는 특징량의 평균이 연산됨으로써 얻어지는 평균 특징량에 의해 평균 패턴이 표현된다.

손으로 쓴 문자의 인식 처리에 있어서는 기입자에 따라 글자 형태에 큰 변형이 생기기 때문에 각 문자 종류마다 복수의 표준 패턴이 작성된다. 통상 1개의 표준 패턴은 템플릿이라고 불리고 상기 각 문자 종류마다 복수의 표준 패턴으로부터 작성되는 사전은 복수 템플릿 사전이라고 불린다.

문자 인식 처리는 상술한 표준 패턴 사전 또는 복수 템플릿 사전을 이용하여 실행된다. 구체적으로는 입력 문서로부터 절출된 1문자에서 특징량이 추출되고 이 특징량과 표준 패턴 사전(또는 복수 템플릿 사전)을 구성하는 각 템플릿(표준 패턴)의 특징량 사이에서 유사도나 거리(유클리드(Euclid)거리, 마하라노비스 거리등)가 계산된다. 그리고, 유사도가 큰 차례나 거리가 좁은 순으로 소정 순위(예컨대 8위)까지의 각 템플릿이 속하는 각 문자 종류 카테고리가 후보 문자군으로서 출력된다.

여기서, 인식되는 문자가 주소나 성명을 나타내는 문자인 경우에는 일반적으로 상기 후보 문자군에 대하여 주소 단어, 성명 단어를 사용한 지식 처리가 실행된다.

보다 구체적으로는, 우선 각 기입 위치마다의 후보 문자군이 기입 위치 전체로 조합되는 것에 의해 후보 문자열군이 출력된다.

다음에, 이 후보 문자열군을 구성하는 각 후보 문자열마다 지식 처리 대상의 주소 사전이나 성명 사전내의 각 단어 문자열이 그 후보 문자열중에 존재하는지 아닌지가 비교된다.

그리고, 그 비교 결과와, 예컨대 후보 문자열을 구성하는 각 후보 문자의 순위등에 따라서 그 후보 문자열에 대하여 득점이 부가된다.

이 처리가 모든 후보 문자열에 대하여 실행된 후 가장 득점이 높은 후보 문자열이 지식 처리 결과로서 출력된다.

이러한 지식 처리에 관한 종래 기술로서는 예컨대 일본국 특허 공개 공보: 일본 특허 공개 소61-107486호에 개시된 것이 공지되어 있다.

여기서, 통상의 전표에 기입하는 것과 같이 프리피치(free-pitch)로 기입된 주소, 성명과 같은 한자 문자열이 인식되는 경우 인접하는 문자끼리 접촉하는 것은 일반적으로 많이 발생하고, 반대로 한자에는 편(偏)과 방(旁)과 같이 분리하여 기입되는 문자도 존재한다.

이 때문에, 기입 문자가 1문자씩 검출되고 절출되어 인식되는 종래의 문자 인식 방법에서는 어느 범위가 1문자의 범위인지를 판단하는 것이 곤란하여 실제로 사용할 수 있는 인식 정밀도를 실현하는 것이 곤란하다.

또한, 각 문자를 정확하게 인식할 수 없으면 어떤 문자가 기입되어 있는지 조차 판단할 수 없는 경우도 있고 단어를 구성하는 문자수가 확정되어 있는 것을 전제로 하는 종래의 지식 처리에서 인식 정밀도의 향상을 꾀하는 것에는 한계가 있다.

특히, 주소 지명등의 인식 처리에 있어서, 예컨대 상위 레벨의 단어(예컨대 東京都, 大阪府등)가 지식 처리에 의해 인식되지 않는 경우에 그 단계에서 하위 레벨의 단어는 지식 처리되지 않는 것이 일반적이기 때문에, 주소 지명을 수정하기 위해서는 첫번째 문자부터 모든 문자열을 순차적으로 수정할 필요가 있다.

상술한 바와 같이 프리피치의 문자열을 인식하기 위한 제1 종래 기술로서, 일본국 특허 공보: 일본 특허 공고 평8-23875호 「단어 판독 방식」에 개시된 것이 공지되어 있다. 이 제1 종래 기술에서는 인식 결과인 후보 문자열과 단어 사전이 DP 매칭등에 의해 대조되어 일치하는 문자가 많은 단어가 선택되고 불일치하는 부분은 재차 절출되며 그 절출된 문자열에 대하여 재인식이 행하여진다.

프리피치의 문자열을 인식하기 위한 제2 종래 기술로서 일본국 특허 공개 공보: 일본 특허 공개 소63-136291호 「단어 판독 방식」에 개시된 것이 공지되어 있다. 제2 종래 기술에서는 문자의 편, 방의 각 부분을 나타내는 부분 패턴을 표준 패턴으로서 갖는 표준 패턴 사전을 이용하여 인식 처리가 실행되어 후보 문자열의 각 문자의 편, 방으로 문자열이 생성되고 그것과 단어 사전의 매칭 처리가 실행된다.

프리피치의 문자열을 인식하기 위한 제3 종래 기술로서 일본국 특허 공개 공보: 일본 특허 공개 평8-171614호 「문자열 판독 장치」에 개시된 것이 공지되어 있다. 이 제3 종래 기술에서는 후보 문자열중에 정해(正解) 문자가 포함되지 않아서 건너 뛰어 판독하는 것이 발생한 경우나 정해 문자와 경합하는 문자 후보의 존재에 의해서 복수의 판독 후보가 발생한 경우등에 대하여 예상 문자열의 존재 가능성이 검증된다. 이 경우의 검증 수단으로서 몇가지 실현 방법이 개시되어 있다.

그러나, 우리들이 일상적으로 기입하는 문자열, 즉 인접 문자간 접촉이 빈번히 발생하고 문자 폭도 문자마다 크게 변화하는 찌그러짐이나 긁힘이 많은 저품질의 문자열에 대한 인식 처리를 검토한 경우에 상기 제1 내지 제3 종래 기술은 이하와 같은 문제점을 갖고 있다.

우선, 제1 종래 기술에서는 후보 문자열의 어느 문자가 우선적으로 취급되는지는 정해져 있지 않고 후보 문자열중의 모든 문자가 대등하게 취급되기 때문에 최초의 문자 절출 위치에 따라서는 전혀 부적절한 단어만 후보로 선택될 가능성이 있다고 하는 문제점을 갖고 있다.

다음의 제2 종래 기술에서는 인접 문자끼리 접촉한 영역에 대한 처리에 문제가 있다.

또한, 제3 종래 기술에서는 검증 수단의 실현 방법으로서 몇가지 방법이 기재되어 있지만 어느쪽 방법도 문자 후보의 편성을 이용한 것으로 그것들의 검증 성능은 최초의 문자 절출 결과에 크게 의존한다는 문제점을 갖고 있다.

본 발명의 과제는 특정한 문자에 착안함으로서 저품질 문자열의 정밀도를 좋게 인식하는 것에 있다.

도 1은 본 발명의 실시예의 구성도.

도 2는 본 발명의 실시예의 전체 제어 동작 순서도(제1 순서도).

도 3은 본 발명의 실시예의 전체 제어 동작 순서도(제2 순서도).

도 4는 본 발명의 실시예의 전체 제어 동작 순서도(제3 순서도).

도 5의 (a) 및 (b)는 기입 필드 정의의 데이터 포맷 예를 도시하는 도면.

도 6은 문자 절출부의 제어 동작 순서도(제1 순서도).

도 7은 특징 추출부의 제어 동작 순서도(제2 순서도).

도 8의 (a) 내지 (d)는 문자 절출부의 제어 동작의 설명도.

도 9는 표기의 요동에 대한 제어 동작 순서도.

도 10은 지식 사전(주소)의 구조도.

도 11은 특정 문자 사전의 구조도.

도 12는 특정 문자 사전(110)의 구조예(제 1)를 도시한 도면.

도 13은 특정 문자 사전(110)의 구조예(제 2)를 도시한 도면.

도 14는 특정 문자 사전(110)의 구조예(제 3)를 도시한 도면.

도 15는 특정 문자 사전(110)의 구조예(제 4)를 도시한 도면.

도 16은 표기 요동의 제어 동작의 설명도.

도 17은 후보 단어 검색부의 동작 설명도(제1 설명도).

도 18은 후보 단어 검색부의 동작 설명도(제2 설명도).

도 19는 후보 단어 검색부의 동작 설명도(제3 설명도).

도 20은 표준 패턴 사전에 의한 문자열 검출/인식 동작의 설명도.

도 21은 입력부와 표시부의 동작 설명도(제1 설명도).

도 22는 입력부와 표시부의 동작 설명도(제2 설명도).

도 23은 입력부와 표시부의 동작 설명도(제3 설명도).

도 24는 본 실시예를 실현하는 프로그램이 기록된 기록 매체의 설명도.

〈도면의 주요 부분에 대한 부호의 설명〉

101 : 입력 문자열

102 : 이미지 메모리

103 : 문자 절출부

104 : 기입 필드 정의

105 : 특징 추출부

106 : 매칭부

107 : 특정 문자 표준 패턴 사전

108 : 후보 문자열 버퍼

109 : 후보 단어 검색부

110 : 특정 문자 사전

111 : 지식 사전

112 : 후보 단어 버퍼

113 : 표준 패턴 사전

114 : 지식 처리부

115 : 인식 결과 버퍼

116 : 인터페이스부

117 : 표시부

118 : 입력부

119 : 정해 문자 버퍼

120 : 영역 좌표 버퍼

본 발명은 소정의 카테고리를 갖는 기입 필드에 기입된 입력 문자열을 구성하는 문자를 인식하는 문자 인식/수정 방법, 그것과 동등한 기능을 갖는 문자 인식 장치, 또는 컴퓨터 독출 가능 기록 매체를 전제로 한다.

본 발명에 있어서, 우선 입력 문자열과 제1 인식 사전(특정 문자 표준 패턴 사전(107)) 사이에서 제1 매칭 처리가 실행됨으로서 입력 문자열중에서 특정 문자 또는 특정 문자열이 추출된다. 보다 구체적으로는 제1 인식 사전에 특정 문자 또는 특정 문자열에 대응하는 표준 패턴이 기억되고 입력 문자열의 패턴과 제1 인식 사전내의 각 표준 패턴사이에서 제1 매칭 처리가 실행됨으로서 입력 문자열중에서 특정 문자 또는 특정 문자열이 추출된다. 상술한 바와 같이 특정 문자 또는 특정 문자열은 예컨대 소정의 카테고리에 있어서 출현하는 빈도가 높은 것이나 인식 정밀도가 높은 것이다.

이어서, 소정의 카테고리(예컨대, 주소 문자열)에 속하고 또한 입력 문자열중에서 추출된 각 특정 문자 또는 특정 문자열의 전후의 입력 문자열중의 영역에 위치할 가능성이 있는 후보 단어군이 카테고리별 단어 사전(특정 문자 사전(110), 지식 사전(111))에서 추출된다.

그리고, 그 추출된 후보 단어군에 속하는 각 후보 단어마다 각 후보 단어에 관한 정보에 기초하여 각 후보 단어가 위치하는 입력 문자열중의 각 영역에 대하여 제2 인식 사전(표준 패턴 사전(113))을 이용하여 제2 매칭 처리가 실행됨으로서 입력 문자열을 구성하는 문자가 인식된다. 보다 구체적으로는 제2 인식 사전에 후보 단어군에 속하는 후보 단어에 관련된 문자 또는 문자열에 대응하는 표준 패턴이 기억되고, 후보 단어군에 속하는 각 후보 단어마다 그 각 후보 단어에 관한 정보에 기초하여 각 후보 단어가 위치하는 입력 문자열중의 각 영역에 대하여 각 후보 단어의 패턴과 제2 인식 사전내의 각 표준 패턴 사이에서 제2 매칭 처리가 실행됨으로서 입력 문자열을 구성하는 문자가 인식된다. 이 경우에 각 후보 단어에 관한 정보로서, 예컨대 각 후보 단어의 문자수의 정보가 사용된다. 또한, 제2 인식 사전은 제1 인식 사전을 포함하도록 구성되어도 좋다.

상술한 발명의 구성에 의해 입력 문자열중의 특정 문자 또는 특정 문자열이 우선적으로 인식되고, 그 인식 결과에 기초하여 그 전후의 후보 단어가 가정되며, 또한 그 후보 단어의 정보를 이용하여 입력 문자열을 구성하는 문자가 재인식되는 것에 의해, 통상 흔히 보는 각종 문서(전표)에 기입되는 불규칙한 간격, 기입 방법으로 기입된 입력 문자열을 구성하는 문자를 높은 정밀도로 인식하는 것이 가능하게 된다.

상술한 발명의 구성에 있어서, 입력 문자열을 구성하는 문자의 인식 결과가 입력 문자열과 병렬로 표시되고 그 표시되는 입력 문자열상의 소정의 영역이 이용자에 의해서 지정되어 그 소정의 영역에 대응하는 문자 또는 문자열이 수정되며 그 수정에 의해 부여된 정해 문자 또는 정해 문자열에 관한 정보에 기초하여 후보 단어군의 추출 처리 및 제2 매칭 처리가 재차 실행되어 입력 문자열을 구성하는 문자가 재차 인식되도록 구성할 수 있다. 이 경우에 표시되는 입력 문자열상의 소정 영역의 지정에 응답하여 그 소정의 영역에 있어서의 복수의 후보 인식 결과가 표시되도록 구성할 수 있다.

이러한 문자 수정 기술에 의해 특정한 문자 또는 문자열만을 수정함으로서 다른 인식 불능 부분도 자동적으로 수정할 수 있다.

또한, 상술한 발명의 구성에 있어서 각 후보 단어에 대하여 표기상의 요동을 갖는 단어가 후보 단어군에 속하는 새로운 후보 단어로서 출력되도록 구성할 수 있다.

이러한 표기상의 요동의 제어 기술에 의해 여러가지 기입 방법에 유연하게 대처할 수 있다.

이하, 도면을 참조하면서 본 발명의 실시예에 대하여 상세히 설명한다. <본 발명의 실시예의 구성 및 개략 구성>

도 1은 본 발명의 실시예의 구성도이다.

우선, 문자 절출부(103)가 문서의 기입 필드 위치에 관한 정보를 정의한 기입 필드 정의(104)를 이용하여 이미지 메모리(102)로부터 독출된 문서에 기입된 입력 문자열(101)중의 선두부터 차례로 1문자씩을 절출한다.

이어서, 특징 추출부(105)가 그 절출된 문자에서 특징량을 추출한다.

계속해서 매칭부(106)가 그 절출된 문자의 특징량과 특정 문자 표준 패턴 사전(107)내의 각 특정 문자 표준 패턴의 특징량사이의 매칭 처리를 실행하고 매칭도가 높은 순으로 소정 순위까지의 각 특정 문자 표준 패턴이 속하는 각 특정 문자의 문자 종류 카테고리를 상기 절출된 문자에 대한 후보 특정 문자로서 후보 문자열 버퍼(108)에 출력한다.

문자 절출부(103), 특징 추출부(105) 및 매칭부(106)에 의한 상기 일련의 특정 문자 인식 처리는 문자 절출부(103)가 입력 문자열(101)의 선두부터 차례로 절출한 문자마다 실행된다. 이 결과, 후보 문자열 버퍼(108)에는 입력 문자열(101)로부터 절출된 문자의 배열순에 대응하는 배열순으로 각 문자에 대응하는 후보 특정 문자가 유지된다.

후보 단어 검색부(109)는 후보 문자열 버퍼(108)에 얻어진 후보 특정 문자열중에서 인접하는 임의의 2개의 특정 문자로 이루어지는 조(특정 문자조)를 모두 추출하고 각각의 특정 문자조가 특정 문자 사전(110)에 등록되어 있는지 아닌지를 검색한다.

후보 단어 검색부(109)는 1조의 특정 문자조가 특정 문자 사전(110)에 등록되어 있는 경우 그 등록 레코드에 링크하는 지식 사전(111)중의 레코드에서 그 특정 문자조를 구성하는 2개의 특정 문자에 의해 사이에 끼워지는 단어군을 검색하고, 그 검색된 단어군을 후보 단어군으로서 후보 단어 버퍼(112)에 유지한다.

후보 단어 검색부(109)는 후보 문자열 버퍼(108)에서 추출한 상기 특정 문자조마다 그것에 대응하는 후보 단어군을 추출하여 후보 단어 버퍼(112)에 유지한다.

결국, 후보 단어 버퍼(112)에는 1조의 특정 문자조에 대하여 1개 이상의 후보 단어군이 얻어지고, 최종적으로 복수의 특정 문자조분의 후보 단어군의 집합이 얻어지게 된다.

1조의 특정 문자조에 대하여 후보 단어 버퍼(112)에 얻어진 후보 단어군에 속하는 각 후보 단어는 순차 독출되어 각각에 대하여 이하의 일련의 처리가 실행된다.

우선, 문자 절출부(103)는 이미지 메모리(102)로부터 독출되는 입력 문자열(101)에 있어서 후보 단어 버퍼(112)로부터 출력된 후보 단어의 정보를 사용하여 그 후보 단어가 속하는 특정 문자조를 구성하는 2개의 특정 문자 사이에 끼워진 문자열 영역내의 문자열을 재차 절출한다.

특징 추출부(105)는 재차 절출된 문자열에서 특징량을 추출한다.

더욱이, 매칭부(106)는 그 재차 절출된 문자열의 특징량과 제2 사전인 표준 패턴 사전(113)내의 각 표준 패턴의 특징량의 매칭 처리를 실행하고 매칭도가 높은 순으로 소정 순위까지의 각 표준 패턴이 속하는 문자열의 카테고리를 상기 후보 단어에 대한 후보 인식 결과군으로서 후보 문자열 버퍼(108)에 유지한다.

문자 절출부(103), 특징 추출부(105) 및 매칭부(106)에 의한 상기 일련의 재인식 처리는 상기 1조의 특정 문자조에 대하여 후보 단어 버퍼(112)에 얻어진 후보 단어군에 속하는 후보 단어의 각각에 대하여 실행되어 각 후보 단어마다 소정 순위까지의 후보 인식 결과군이 후보 문자열 버퍼(108)에 얻어진다.

그리고, 매칭부(106)는 상기 1조의 특정 문자조에 속하는 각 후보 단어마다 후보 문자열 버퍼(108)에 얻어지는 소정 순위까지의 모든 후보 인식 결과군중에서 가장 타당하고 신뢰도가 높은 인식 결과, 보다 구체적으로는 가장 매칭도가 높은 후보 인식 결과를 상기 1조의 특정 문자조를 구성하는 2개의 특정 문자 사이에 끼워진 부분의 인식 결과로서 지식 처리부(114)에 출력한다.

문자 절출부(103), 특징 추출부(105) 및 매칭부(106)에 의한 1조의 특정 문자조의 후보 단어군에 속하는 후보 단어마다의 상기 일련의 재인식 처리는 후보 단어 버퍼(112)에 등록되어 있는 각 특정 문자조마다 실행된다. 이 결과, 지식 처리부(114)에는 각 특정 문자조를 구성하는 2개의 특정 문자 사이에 끼워진 각 문자 영역에 대응하는 인식 결과가 출력되게 된다.

지식 처리부(114)는 각 특정 문자조를 구성하는 2개의 특정 문자 사이에 끼워진 각 문자 영역에 대응하는 인식 결과에 대하여, 기입 필드 정의(104) 및 지식 사전(111)을 이용한 지식 처리에 의해 상기 각 문자 영역으로 이루어지는 전체 문자 영역의 최종 인식 결과를 결정하고 그것을 인식 결과 버퍼(115)에 출력한다.

상술한 일련의 인식 처리에 있어서 인식 조건을 최후까지 충족하지 않는 문자 또는 문자열의 부분에 대해서는 리젝트(인식 불능) 정보가 부가된다.

이 경우에, 인식 결과 버퍼(115)에 얻어진 인식 결과가 인터페이스부(116)를 통해 표시부(117)에 표시된다. 이용자는 표시부(117)에서의 인식 결과의 표시에 대하여 마우스 및 키보드등으로 이루어지는 입력부(118)에서 인식 불능 문자/문자열을 수정할 수 있다.

이용자는 입력부(118)에서 인식 불능 문자/문자열중의 특정한 정해 문자를 지정하는 것만으로 그 정해 문자에 관한 정보가 인터페이스부(116)로부터 정해 문자 버퍼(119) 및 영역 좌표 버퍼(120)에 출력된다.

후보 단어 검색부(109)는 정해 문자 버퍼(119)에 얻어진 정해 문자에 관한 정보를 특정 문자의 정보로서 전술한 특정 문자 사전(110)과 지식 사전(111)을 이용한 후보 단어의 검색 처리를 실행함으로서 인식 불능 문자를 정확하게 재인식시킬 수 있다. 또한, 문자 절출부(103)는 이용자에 의해 지정된 정해 문자의 절출 위치를 영역 좌표 버퍼(120)로부터 취득하는 것에 의해 정확한 문자의 절출을 실행할 수 있다.

이상과 같이, 본 실시예에서는 문서중의 각 기입 필드에 기입되는 주소, 성명, 품명등의 입력 문자열(101)에 대하여 각 필드마다 출현 빈도가 높은 문자 또는 특정한 문자/문자열에 착안함으로서 지식 사전(111)이 유지하는 단어 정보와 계층 구조를 갖는 주소등의 문자열의 경우는 각 문자 영역마다의 접속 정보를 이용하여 상기 특정 문자 사이에 끼워진 문자 영역의 후보 단어를 선택할 수 있다. 더욱이, 본 실시예에서는 그 후보 단어의 정보를 이용하여 입력 문자열(101)로부터 상기 특정 문자사이에 끼워진 문자 영역의 추출과 그 문자 영역에 대한 재인식 처리가 실행됨으로서 인접 문자사이에서 접촉, 분리가 많이 발생하는 서식으로 기입된 문자열을 높은 인식 정밀도로 인식할 수 있다.

<본 발명의 실시예의 상세 동작>

도 2∼도 4는 도 1에 도시되는 구성을 갖는 본 발명의 실시예가 실현하는 전체 제어를 나타내는 동작 순서도이다.

〈특정 문자의 인식 처리〉

우선, 문자 절출부(103)가 문서의 기입 필드 위치에 관한 정보를 정의한 기입 필드 정의(104)를 이용하여 이미지 메모리(102)로부터 2치화 화상 데이터로서 독출된 문서에 기입된 입력 문자열(101)중의 선두부터 차례로 1문자씩을 절출한다(도 2의 스텝 201).

도 5는 문자 절출부(103)가 사용하는 기입 필드 정의(104)의 데이터 포맷예를 도시한 도면이다.

예컨대, 문서상에 필드(1,2)가 배치되어 있고 이 2개의 필드에 기입된 문자열이 인식되는 경우 기입 필드 정의(104)는 이하와 같이 결정된다.

우선, 문서의 상부가 좌표 원점으로 되고 가로 방향이 x축, 세로 방향이 y축으로 각각 정의되고, 필드(1,2)의 각각에 대하여 그 필드의 왼쪽 상단의 위치의 좌표(필드 원점 좌표)와 x축 방향의 필드 폭 및 y축 방향의 필드 높이로 이루어지는 필드의 크기 데이터가 도 5의 (a)에 도시되는 바와 같이 정의된다. 길이의 단위는 미리미터 또는 인치이다.

다음에, 필드(1,2)의 각각에 대하여 각 필드에 어떠한 종별의 문자열이 기입되는지를 나타내는 필드 종별이 정의된다.

이들 정보가 도 5의 (b)에 도시되는 표형식으로 기입 필드 정의(104)로서 특별히 도시하지 않은 기억 장치에 유지된다.

문자 절출부(103)는 상술한 기입 필드 정의(104)를 이용하는 것에 의해, 이미지 메모리(102)로부터 독출된 이미지 데이터상에서 각 필드마다 문자 영역을 결정한 뒤, 그 문자 영역내의 이미지 데이터에 대하여 도 6에 도시되는 동작 순서도에 의해 도시되는 문자 절출 제어를 실행한다.

여기서, 도 8의 (a)에 도시되는 바와 같이, 기입 필드 정의(104)로부터 추출되는 대상 영역의 필드 원점 좌표를(x_o, y_o), X축 방향의 필드 폭을 dx, y축 방향의 필드 높이를 dy로 한다.

우선 문자 절출부(103)는 x축 방향의 각 주사 라인마다 흑(黑)화소수를 누산함으로서, 각 y좌표 위치마다의 x축 방향의 흑화소의 출현 빈도를 나타내는 수평 히스토그램을 도 8의 (b)에 도시하는 바와 같이 산출한다(도 6의 스텝 601).

이어서, 도 8의 (b)에 도시되는 바와 같이 문자 절출부(103)는 상기 수평 히스토그램상을 그 윗쪽 및 아래쪽 각각에서 주사하여 최초로 빈도치(C)를 초과하는 위치(α, β)를 산출하고, 더욱이 그것들로부터 산출되는 값(α-β)을 그 대상 영역에 있어서의 문자열 높이(h)로 한다(스텝 602).

다음에, 문자 절출부(103)는 y축 방향의 각 주사 라인마다 흑화소수를 누산함으로서, 각 x좌표 위치마다의 y축 방향의 흑화소의 출현 빈도를 나타내는 수직 히스토그램을 도 8의 (c)에 도시되는 바와 같이 산출한다(도 6의 스텝 603).

계속해서, 도 8의 (c)에 도시되는 바와 같이, 문자 절출부(103)는 상기 수직 히스토그램상을 그 왼쪽부터 주사하여, 빈도치가 임계치(d)이하에서부터 임계치(d) 이상으로 변화하는 점(x₁, x₃, x₅, ···(x_2n-1:n=1, 2,···))을 절출하여 후보 위치로서 산출하고, 또한 빈도치가 임계치(d)이상에서부터 임계치(d)이하로 변화하는 점(x₂, x₄, x₆, ··· (x_2m:m=1, 2, ···))도 역시 절출 후보 위치로서 산출한다(스텝 604).

이어서, 문자 절출부(103)는 하기 조건식을 충족하는 영역 [x_2m, x_2n-1]을 산출하고, 그것을 문자 절출 결과로 한다(스텝 605).

여기서, h는 전술한 스텝 602에 있어서 산출된 문자열 높이 t₁및 t₂는 입력 문자열(101)의 학습 샘플에 의해 결정되는 파라미터이다. 도 8의 (c)의 예에서는 이하의 3개의 영역이 문자 절출 결과로서 산출된다.

[x₁, x₂]

[x₃, x₄]

[x₅, x₈]

문자 절출부(103)는 스텝 605의 처리 결과, 이하의 조건식을 충족하는 영역이 남았는지 아닌지를 판정한다(스텝 606).

스텝 606의 판정이 NO이면, 문자 절출부(103)는 그 제어 처리를 종료한다.

스텝 606의 판정이 YES이면, 문자 절출부(103)는 영역 [x_2l-1, x_2l]에 있어서, 스텝 603에서 산출된 수직 히스토그램의 빈도치가 임계치(d)보다 큰 소정치이하이고, 또한 이하의 조건식을 충족하는 값(k)을 산출한다.

h≒(x_2l-x_2l-1)/K

이 결과, 영역 [x_2l-1, x_2l]을 k분할한 각 위치를 문자 절출 위치로서 산출한다(이상, 스텝 607). 도 8의 (d)의 예에 있어서는 l=1, k=2로 되고, 영역 [x₁, x₂]을 2분할한 위치(x')가 문자 절출 위치로서 산출된다.

그 후, 문자 절출부(103)는 그 제어 처리를 종료한다.

이상 설명한 도 6의 동작 순서도는 문자 절출부(103)가 문자수가 부여되어 있지 않은 필드에 대하여 실행하는 문자 절출 처리에 대응하는 것이다.

이것에 대하여, 후보 단어 버퍼(112)로부터 독출되는 후보 단어의 정보에 기초하여 재인식 처리가 실행되는 경우와 같이 문자 절출부(103)가 문자 절출의 대상으로 되는 영역과 그 영역내의 문자수가 미리 부여되어 있는 필드에 대하여 문자 절출 처리를 실행하는 경우도 있다.

이 경우에는, 문자 절출부(103)는 도 6의 스텝 605∼607의 처리군 대신에 도 7의 스텝 701의 처리를 실행한다.

즉, 문자 절출의 대상으로 되는 영역의 좌단의 x좌표가 x_s, 우단의 x좌표가 x_t, 상기 영역내의 문자수가 n으로서 주어졌을 때에 문자 절출부(103)는 도 6의 스텝 603에서 산출된 수직 히스토그램의 빈도치가 소정치 이하이고, 또한 이하의 조건식을 충족하는 값(X_n)에 가까운 인접 간격을 갖는 위치를 문자 절출 위치로서 산출한다.

(x_t-x_s)/n=Xn

구체적으로는, 인접하는 2개의 문자 절출 위치를 x_i, x_i+1(i=1, 2,···, x_s≤x_i, x_i+1≤x_t)로 하였을 때에 문자 절출부(103)는 하기 조건식을 충족하는 문자 절출 위치(x_i)(x_i≠x_s, x_t)를 산출한다.

Xn-t₅≤x_i+1-X_i≤X_n+t₆

여기서, t₅및 t₆은 입력 문자열(101)의 학습 샘플에 의해 결정되는 파라미터이다.

이상 설명한 문자 절출부(103)에 의한 문자 절출 처리후 특징 추출부(105)가 그 절출된 1문자에서 인식을 위한 특징량인 특징 벡터를 추출한다(도 2의 스텝 202).

구체적으로 특징 추출부(105)는 예컨대 이하의 일련의 처리에 의해서 특징 벡터를 추출한다.

즉, 특징 추출부(105)는 절출된 문자의 이미지 데이터로부터 문자 윤곽 화소를 추출한다.

다음에, 특징 추출부(105)는 그 절출된 영역을 복수의 분할 영역으로 분할한다.

더욱이, 특징 추출부(105)는 각 분할 영역에 대하여 그 분할 영역내의 윤곽 화소마다 방향 성분(예컨대, 세로 방향, 가로 방향, 왼쪽 경사 방향, 오른쪽 경사 방향의 4방향 성분)을 추출하고 그 분할 영역내의 모든 윤곽 화소의 방향 성분을 집계함으로서 그 분할 영역내의 각 방향 성분마다의 집계치를 산출하며 그것들을 각 방향 성분에 대응하는 요소치로서 갖는 부분 특징 벡터를 산출한다.

최후에, 특징 추출부(105)는 모든 분할 영역의 부분 특징 벡터의 각 요소를 통합하는 것에 의해 특징 벡터를 추출한다.

상술한 바와 같이 특징 추출부(105)가 절출된 문자의 특징 벡터를 추출한 후에, 매칭부(106)가 그 절출된 문자의 특징 벡터와 특정 문자 표준 패턴 사전(107)내의 각 특정 문자 표준 패턴의 특징 벡터사이의 매칭 처리를 실행하고(도 2의 스텝 203), 매칭도가 높은 순으로 소정 순위까지의 각 특정 문자 표준 패턴이 속하는 각 특정 문자의 문자 종류 카테고리를 상기 절출된 문자에 대한 후보 특정 문자군으로서 후보 문자열 버퍼(108)에 출력한다(도 2의 스텝 204).

보다 구체적으로 매칭부(106)가 그 절출된 문자의 특징 벡터와 특정 문자 표준 패턴 사전(107)내의 각 특정 문자 표준 패턴의 특징 벡터사이에서, 예컨대 거리(유클리드 거리, 마하라노비스 거리등)를 계산한다. 그리고, 매칭부(106)는 거리가 작은 순으로 소정 순위(n위)까지의 각 특정 문자 표준 패턴이 속하는 각 특정 문자의 문자 종류 카테고리를 상술의 절출된 특정 문자에 대한 후보 특정 문자군으로서 후보 문자열 버퍼(108)에 출력한다.

또, 1위의 특정 문자 표준 패턴의 거리가 소정의 임계치(T₁)보다 큰 경우는 그 절출된 문자에는 리젝트(인식 불능) 정보가 부가된다.

여기서, 상술의 특정 문자 표준 패턴 사전(107)에 대하여 구체예를 들어 설명한다.

가령, 입력 문자열(101)이 주소 문자열인 경우를 생각하자.

본 실시예에서 최초는 예컨대 주소 문자열에 있어서 그 계층 구조의 단락을 나타내는 출현 빈도가 높은 「都」「道」「府」「縣」「市」「區」「郡」「町」「村」「字」「大字」등의 1문자 또는 2문자로 이루어지는 특정 문자만이 인식되면 좋다. 또한, 주소 문자열에 있어서 「東」「西」「南」「北]등의 특정 문자도 출현 빈도가 높다.

이 때문에, 본 실시예에서는 이들 특정 문자의 인식 정밀도를 높이기위해서 이들 특정 문자의 표준 패턴만으로 구성되고 사전 용량이 작은 특정 문자 표준 패턴 사전(107)이 사용된다.

이러한 특정 문자 표준 패턴 사전(107)이 표준 패턴 사전(113)과는 별도로 준비됨으로서 인식 처리 속도를 단축하고 인식 정밀도를 높일 수 있다.

또한, 특정 문자 표준 패턴 사전(107)이 표준 패턴 사전(113)과 동일한 사전으로서 구성되고 특정 문자의 인식 정밀도를 높이기 위해서 각 특정 문자마다 많은 템플릿(표준 패턴)이 기억되도록 구성되어도 좋다.

한편, 입력 문자열(101)이 성명 문자열인 경우에는 주소 문자열과 같이 단락으로 되는 문자는 존재하지 않지만 출현 빈도가 높은 문자 종류는 존재한다. 예컨대, 성에 사용되는 문자는 출현 빈도에 있어서 상위 500위까지의 문자 종류가 82% 정도를 커버하고 있기 때문에 상위 N문자로 특정 문자 표준 패턴 사전(107)이 작성되도록 구성할 수 있다.

또는 표준 패턴 사전(113)으로부터 선택적으로 N문자 종류만이 특정 문자의 인식에 사용되도록 구성되어도 좋다.

그리고, 특정 문자 사전(110)은 상술한 특정한 문자 종류에 대응하도록 구성된다.

또한, 출현 빈도에 의해 문자 종류를 선택하는 것이 아니라 인식하기 쉬운 문자를 다수의 실시간으로부터 통계적으로 결정하고 그것들의 결정된 문자 종류를 선택하도록 구성하여도 좋다.

문자 절출부(103), 특징 추출부(105) 및 매칭부(106)에 의한 상기 일련의 특정 문자 인식 처리는 문자 절출부(103)가 입력 문자열(101)의 선두부터 차례로 절출 문자마다 실행된다(도 2의 스텝 205→202의 반복). 이 결과, 후보 문자열 버퍼(108)에는 입력 문자열(101)로부터 절출된 문자의 배열순에 대응하는 배열순으로 각 문자마다의 후보 특정 문자군이 유지된다.

〈특정 문자간 영역의 후보 단어의 검색과 그 영역에서의 재인식 처리〉

후보 단어 검색부(109)는 후보 문자열 버퍼(108)에 얻어진 후보 특정 문자군의 집합중에서 인접하는 임의의 2개의 특정 문자로 이루어지는 조(특정 문자조)를 모두 추출하고, 각각의 특정 문자조가 특정 문자 사전(110)에 등록되어 있는지 아닌지를 검색한다. 그리고, 후보 단어 검색부(109)는 1조의 특정 문자조가 특정 문자 사전(110)에 등록되어 있는 경우 그 등록 레코드에 링크하는 지식 사전(111)중의 레코드에서 그 특정 문자조를 구성하는 2개의 특정 문자에 의해 사이에 끼워지는 단어군을 검색하고 그 검색된 단어군을 후보 단어군으로서 후보 단어 버퍼(112)에 유지한다(이상, 도 3의 스텝 206).

가령, 입력 문자열(101)이 주소 문자열인 경우를 생각하자. 또, 주소 문자열 이외의 성명 문자열, 품명 문자열등에 있어서는 계층 구조를 가지지 않기 때문에 계층 구조에 관한 부분을 제외하고 주소 문자열의 경우와 동일하게 실현된다.

주소 사전인 지식 사전(111)의 구조는, 예컨대 도 10에 도시되는 바와 같이 주소의 계층 구조에 따라서 레벨 1:都道府縣, 레벨 2:市區郡, 레벨 3:町村, ···과 같이 분할되어 각각의 계층에 속하는 단어가 격납되어 있다.

한편, 특정 문자 사전(110)에는 도 11에 도시되는 바와 같이 「文字 1」과 「文字 2」라고 하는 2개의 특정 문자로 이루어지는 특정 문자조에 대응하는 레코드마다 그 특정 문자조를 구성하는 2개의 특정 문자에 의해 사이에 끼워지는 단어군이 격납되어 있는 지식 사전(111)상의 레코드의 집합을 나타내기 위한 포인터 정보와 그 포인터에서 시작하는 데이터수 정보로 이루어지는 데이터조가 격납되어 있다. 이 데이터조로서는 도 11에 도시된 바와 같이 복수조를 지정할 수 있고 특정 문자 사전(110)의 각 특정 문자조마다의 레코드에는 도 11에 도시된 바와 같이 상기 포인터 정보와 데이터수 정보의 데이터조의 수에 대응하는 포인터수 정보(N)도 기억된다.

도 12의 예에서는 특정 문자 사전(110)내의 공백 문자와 「縣」이라고 하는 2개의 특정 문자로 이루어지는 특정 문자조에 대응하는 레코드에는 도 10에 도시되는 지식 사전(111)내의 레벨 1 영역내의 단어 「靑森」으로 시작하는 n₁개의 레코드와 마찬가지로 레벨 1 영역내의 단어 「神奈川」으로 시작하는 n₂개의 레코드를 각각 나타내는 데이터조(포인터 정보와 데이터수 정보)와 포인터수 N=2가 등록되어 있다.

또한 도 13의 예에서는 특정 문자 사전(110)내의 「都」와 「區」라고 하는 2개의 특정 문자로 이루어지는 특정 문자조에 대응하는 레코드에는 도 10에 도시되는 지식 사전(111)내의 레벨 2 영역내의 단어 「千代田」으로 시작하는 n₃개의 레코드와 포인터수 N=1이 등록되어 있다.

또한, 주소는 통상 「···丁目···番地···方」이라고 하는 서식으로 끝나지만 이러한 특정 문자 「丁目」「番地」「番」「方」「號」사이에 끼워진 영역에는 단어가 아니라 숫자가 기입되는 경우가 많다. 이와 같은 경우에는, 도 14에 도시된 바와 같이 특정 문자 사전(110)내의 상기 특정 문자로 이루어지는 특정 문자조에 대응하는 레코드에는 전술한 바와 같은 포인터 정보와 데이터수 정보로 이루어지는 데이터조가 아니라 「숫자*n」과 같은 기호가 설정된다. 후보 단어 검색부(109)는 특정 문자 사전(110)으로부터 상술한 바와 같은 기호가 설정되어 있는 레코드를 검색한 경우에는 상술과 같은 특정 문자사이에 끼워진 영역에는 숫자가 연속하여 기입되어 있는 것을 검출하고 그 취지를 나타내는 검출 결과를 후보 단어 버퍼(112)에 기록한다.

더욱이, 예컨대 도 15에 도시된 바와 같은 특정 문자 사전(110) 및 지식 사전(111)의 구성도 가능하다.

즉, 도 15의 예에서는 특정 문자 사전(110)내의 공백 문자와 「川」이라 하는 2개의 특정 문자로 이루어지는 특정 문자조에 대응하는 레코드에는 지식 사전(111)내의 4문자의 단어 「神奈川縣」을 나타내는 포인터 정보 및 데이터수=1과 지식 사전(111)내의 2문자의 단어 「神奈」를 가리키는 포인터 정보 및 데이터수=1이 설정된다.

또한 특정 문자 사전(110)내의 「川」과 「中」이라고 하는 2개의 특정 문자로 이루어지는 특정 문자조에 대응하는 레코드에는 지식 사전(111)내의 2문자의 단어 「崎市」를 나타내는 포인터 정보 및 데이터수=1이 설정된다.

더욱이 특정 문자 사전(110)내의 「中」과 「中」이라고 하는 2개의 특정 문자로 이루어지는 특정 문자조에 대응하는 레코드에는 지식 사전(111)내의 5문자의 단어 「原區上小田」을 나타내는 포인터 정보 및 데이터수=1이 설정된다.

이와 같이, 주소 문자열에 높은 빈도로 출현하는 특정 문자 및 단어에 대응하는 정보를 특정 문자 사전(110)과 지식 사전(111)에 기억시키는 것도 가능하다.

다음에, 도 16에 도시된 바와 같이 특정 문자 사전(110)내의 「區」와 주소의 끝을 나타내는 특정 문자의 2개의 특정 문자로 이루어지는 특정 문자조에 대응하는 레코드에 지식 사전(111)내의 단어 「丸の內」가 링크되어 있는 경우에 표시의 요동으로 인하여 「丸の內」가 아니라 「丸ノ內」라고 하는 문자열이 기입될 가능성이 있다. 이러한 경우에, 지식 사전(111)에 모든 표기의 요동에 대응하는 단어를 기억시키는 것은 소용없다.

그래서, 본 실시예에서는 특정 문자 사전(110)으로부터 링크하는 지식 사전(111)내의 단어 검색시에 도 9의 동작 순서도로 표시되는 표기의 요동에 대처하기 위한 제어 동작이 실행된다.

우선, 후보 단어 검색부(109)는 1조의 특정 문자조에 대하여 특정 문자 사전(110) 및 지식 사전(111)을 지금까지 설명한 규칙에 따라서 검색하고 그 결과, 검색된 단어군을 현재 처리중의 특정 문자조에 대응하는 후보 단어군으로서 후보 단어 버퍼(112)에 기록한다(도 9의 스텝 901). 이 스텝 901은 도 3의 스텝 206의 일부이다.

다음에, 도 3의 스텝 206의 일부로서 후보 단어 검색부(109)는 1조의 특정 문자조에 대하여 후보 단어 버퍼(112)에 얻어진 후보 단어군의 각각에 대하여 도 9의 스텝 902∼910으로 도시되는 일련의 처리를 반복하여 실행한다.

즉, 후보 단어 검색부(109)는 검출한 단어를 구성하는 문자에 히라가나가 존재하는 경우에 그 히라가나를 카다카나로 변경하고 그 결과 얻어지는 단어를 현재 처리중의 특정 문자조에 대응하는 다른 후보 단어로서 후보 단어 버퍼(112)에 기록한다(도 9의 스텝 902→903).

다음에, 후보 단어 검색부(109)는 검출한 단어를 구성하는 문자에 카다카나가 존재하는 경우에 그 카다카나를 히라가나로 변경하고 그 결과 얻어지는 단어를 현재 처리중의 특정 문자조에 대응하는 다른 후보 단어로서 후보 단어 버퍼(112)에 기록한다(도 9의 스텝 904→905).

다음에, 후보 단어 검색부(109)는 검출한 단어를 구성하는 문자에 한자 숫자가 존재하는 경우에 그 한자 숫자를 아라비아 숫자로 변경하고 그 결과 얻어지는 단어를 현재 처리중의 특정 문자조에 대응하는 다른 후보 단어로서 후보 단어 버퍼(112)에 기록한다(도 9의 스텝 906→907).

다음에, 후보 단어 검색부(109)는 검출한 단어를 구성하는 문자에 아라비아 숫자가 존재하는 경우에 그 아라비아 숫자를 한자 숫자로 변경하고 그 결과 얻어지는 단어, 현재 처리중의 특정 문자조에 대응하는 다른 후보 단어로서 후보 단어 버퍼(112)에 기록한다(도 9의 스텝 908→909).

최후에 후보 단어 검색부(109)는 검출한 단어를 구성하는 문자에 생략 가능 문자(예컨대 「溝ノ口」가 「溝口」로 생략되었을 때의 「ノ」)가 존재하는 경우에 그 생략 가능 문자를 생략하여 얻어지는 문자열을 현재 처리중의 특정 문자조에 대응하는 다른 후보 단어로서 후보 단어 버퍼(112)에 기록한다(도 9의 스텝 908→909).

후보 단어 검색부(109)는 1조의 특정 문자조에 대하여 후보 단어 버퍼(112)에 아직 표기의 요동에 대한 제어 처리를 실행하지 않은 후보 단어군이 있는 경우에는 상술한 도 9의 스텝 902∼910으로 도시되는 일련의 처리를 반복 실행한다(도 9의 스텝 911→902∼910→911의 반복).

상술한 바와 같이 1조의 특정 문자조에 대한 후보 단어 버퍼(112)에 얻어진 후보 단어군에 대해 표기의 요동에 대한 제어가 실현된다.

이상과 같이 후보 문자열 버퍼(108)로부터 선택된 1조의 특정 문자조에 대하여 후보 단어 버퍼(112)에 후보 단어군이 얻어진다.

가령, 예컨대 도 17에 도시되는 입력 문자열(101)이 기입되면 전술한 도 2의 스텝 201∼205의 특정 문자의 인식 처리에 의해서 영역(1701)이 특정 문자 「都」, 영역(1702)이 특정 문자 「區」로 인식된다.

이 인식 결과에 대하여 후보 단어 검색부(109)는 상술한 도 3의 스텝 206에서 특정 문자 사전(110)에 있어서 공백 문자와 특정 문자 「都」로 이루어지는 특정 문자조의 레코드를 검출하고 그 등록 레코드에 링크하는 지식 사전(111)중의 엔트리로부터 그 특정 문자조를 구성하는 2개의 특정 문자에 의해 사이에 끼워지는 1개의 단어 「東京」을 검색하며 그 검색된 단어를 공백 문자와 특정 문자 「都」로 이루어지는 특정 문자조에 대응하는 후보 단어군으로서 후보 단어 버퍼(112)에 유지한다. 이 경우는 상기 특정 문자조에 대한 후보 단어군의 수는 1개로, 도 18에 도시된 바와 같이 후보 단어 「東京」의 문자수는 2문자로 된다.

또한, 후보 단어 검색부(109)는 후술하는 도 3의 스텝 211의 판정후에 2회째에 실행되는 도 3의 스텝 206에서 특정 문자 사전(110)에 있어서 특정 문자 「都」와 「區」로 이루어지는 특정 문자조의 레코드를 검출하고 그 등록 레코드에 링크하는 도 10에 도시되는 지식 사전(111)중의 엔트리로부터 그 특정 문자조를 구성하는 2개의 특정 문자에 의해 사이에 끼워지는 23개의 단어 「千代田」「中央」「港」···를 검색하고, 그들 검색된 단어군을 상기 특정 문자조에 대응하는 후보 단어군으로서 후보 단어 버퍼(112)에 유지한다. 이 경우는, 상기 특정 문자조에 대한 후보 단어군의 수는 23개가 되고 도 19에 도시된 바와 같이 각 후보 단어의 문자수는 3문자, 2문자, 또는 1문자중 어느 하나로 된다.

이렇게 하여, 후보 문자열 버퍼(108)로부터 선택된 1조의 특정 문자조에 대하여 후보 단어 버퍼(112)에 후보 단어군이 얻어진 후 그 후보 단어군에 속하는 후보 단어의 각각에 대하여 문자 절출부(103), 특징 추출부(105) 및 매칭부(106)가 도 3의 스텝 207∼211의 일련의 재인식 처리를 실행함으로서 각 후보 단어마다 소정 순위까지의 후보 인식 결과군을 추출한다.

우선, 문자 절출부(103)는 이미지 메모리(102)로부터 독출되는 입력 문자열(101)에 있어서 후보 단어 버퍼(112)로부터 출력되는 후보 단어의 정보를 사용하여 그 후보 단어가 속하는 특정 문자조를 구성하는 2개의 특정 문자사이에 끼워진 문자열 영역내의 문자열을 재차 절출한다(도 3의 스텝 207).

이 경우, 후보 단어의 문자수가 예컨대 도 18에 도시되는 「東京」 또는 도 19에 도시되는 「中央」과 같이 2문자인 경우에는 문자 절출부(103)는 전술한 도 6의 스텝 601∼604 및 도 7의 스텝 701로 도시되는 동작 순서도에 따라서 문자 절출의 대상으로 되는 영역을 2분할하여(전술한 수학식 3에 있어서의 n=2) 각 문자의 절출 위치를 결정한다.

또한 후보 단어의 문자수가 예컨대 도 19에 도시되는 「千代田」과 같이 3문자인 경우는 문자 절출부(103)는 문자 절출의 대상으로 되는 영역을 3분할하여(전술한 수학식 3에 있어서의 n=3) 각 문자의 절출 위치를 결정한다.

더욱이 후보 단어의 문자수가 예컨대 도 19에 도시되는 「港」과 같이 1문자인 경우는 문자 절출부(103)는 문자 절출의 대상으로 되는 영역에 1문자만이 존재한다고 가정한다(전술한 수학식 3에 있어서의 n=1).

다음에 특징 추출부(105)는 재차 절출된 문자열에 대하여 1문자씩 상술한 바와 같이 하여 특징 벡터를 추출한다(도 3의 스텝 208).

더욱이, 매칭부(106)는 상기 각 문자마다 그 문자의 특징 벡터와 제2 사전인 표준 패턴 사전(113)내의 각 표준 패턴의 특징 벡터 사이의 매칭 처리를 실행하고(도 3의 스텝 209) 매칭도가 높은 순으로 소정 순위까지의 각 표준 패턴이 속하는 각 문자 종류 카테고리를 상기 문자에 대한 후보 문자군으로서 후보 문자열 버퍼(108)에 출력한다(도 3의 스텝 210).

보다 구체적으로는 매칭부(106)가 상기 문자의 특징 벡터와 표준 패턴 사전(113)내의 각 표준 패턴의 특징 벡터 사이에서, 예컨대 거리(유클리드 거리, 마하라노비스 거리등)를 계산한다. 그리고, 매칭부(106)는 거리가 작은 순으로 소정 순위(n위)까지의 각 표준 패턴이 속하는 각 문자 종류 카테고리를 상술의 문자에 대한 후보 문자군으로서 후보 문자열 버퍼(108)에 출력한다.

문자 절출부(103)에 의해 재차 절출된 문자열을 구성하는 각 문자의 각각에 대하여 상술과 같이 거리가 작은 순으로 소정 순위까지의 후보 문자군이 후보 문자열 버퍼(108)에 얻어진 후 1개의 특정 문자조에 대하여 후보 단어 버퍼(112)에 얻어진 후보 단어군에 속하는 다른 후보 단어에 대하여 스텝 207∼210의 일련의 처리가 반복 실행된다.

1개의 특정 문자조에 대한 후보 단어 버퍼(112)에 얻어진 후보 단어군에 속하는 모든 후보 단어에 대해 각각을 구성하는 문자마다 소정의 순위까지의 후보 문자군이 후보 문자열 버퍼(108)에 얻어지면 매칭부(106)는 각 후보 단어의 각각에 대하여 각각을 구성하는 문자마다의 소정의 순위까지의 후보 문자군의 모두를 조합하여 후보 문자열군을 생성하고 그것에 포함되는 각 후보 문자열마다 다음 수학식에 의해 그 평균 거리를 계산한다(도 3의 스텝 212).

(D₁+D₂+⋅⋅⋅+D_m)/m

여기서, m은 대상 후보 단어의 문자수이고 D_i(1≤i≤m)는 대상 후보 단어내의 i문자째에 있어서 대상 후보 문자열을 구성하기 위해 선택된 후보 문자의 거리를 나타낸다.

그리고, 매칭부(106)는 1개의 특정 문자조에 대한 모든 후보 단어에 대응하여 생성된 후보 문자열군중에서 그것을 구성하는 각 후보 문자열에 대응하는 평균 거리가 작은 순으로 소정수(P개)의 후보 문자열을 선택하고 그것들을 상기 특정 문자조를 구성하는 2개의 특정 문자에 의해 사이에 끼워진 문자 영역의 인식 결과로서 지식 처리부(114)에 출력한다.

이렇게 하여, 1개의 특정 문자조를 구성하는 2개의 특정 문자에 의해 사이에 끼워진 문자 영역의 인식 결과가 얻어지면 다시 도 3의 스텝 213에서 스텝 206의 처리로 되돌아간다.

그리고, 전술한 도 2의 스텝 201∼205의 특정 문자의 인식 처리에 의해 후보 문자열 버퍼(108)에 얻어져 있는 후보 특정 문자군의 집합중에서 인접하는 다른 임의의 2개의 특정 문자로 이루어지는 다른 특정 문자조가 다시 추출되고, 그 특정 문자조에 대하여 도 3의 스텝 206∼212의 일련의 제어 처리가 다시 실행되는 것에 의해 그 특정 문자조를 구성하는 2개의 특정 문자에 의해 사이에 끼워진 문자 영역의 인식 결과가 산출되는 동작이 각 특정 문자조마다 반복 실행된다(도 3의 스텝 213→206∼212→213의 반복).

지식 처리부(114)는 각 특정 문자조를 구성하는 2개의 특정 문자사이에 끼워진 각 문자 영역에 대응하는 인식 결과에 대하여 기입 필드 정의(104) 및 지식 사전(111)을 이용한 지식 처리에 의해 상기 각 문자 영역으로 이루어지는 전체 문자 영역의 최종 인식 결과를 결정하고 그것을 인식 결과 버퍼(115)에 출력한다(도 4의 스텝 214).

이상 설명한 도 2의 스텝 201∼도 4의 스텝 214의 일련 제어 처리가 문서의 기입 필드 위치마다 반복하여 실행됨으로써, 각 기입 필드에 대한 최종 인식 결과가 결정된다(도 4의 스텝 215→도 2의 스텝 201의 반복).

상술한 일련의 인식 처리에 있어서, 인식 조건을 최후까지 충족하지 않은 문자 또는 문자열의 부분에 대해서는 리젝트(인식 불능) 정보가 부가된다.

이 경우에, 인식 결과 버퍼(115)에 얻어진 인식 결과가 인터페이스부(116)를 통해 표시부(117)에 표시된다. 이용자는 표시부(117)에서의 인식 결과의 표시에 대하여 마우스 및 키보드등으로 이루어지는 입력부(118)로 인식 불능 문자/문자열을 수정할 수 있다.

이용자는 입력부(118)로 인식 불능 문자/문자열중의 특정한 정해 문자를 지정하는 것만으로 그 정해 문자에 관한 정보가 인터페이스부(116)로부터 정해 문자 버퍼(119) 및 영역 좌표 버퍼(120)에 출력된다.

도 21의 예에서는 표시부(117)에 인식 결과(2102)와 병렬로 대상 문자열의 이미지(2101)가 표시된다. 이용자는 이미지(2101)상의 특정 영역(2103)을 입력부(118)인 마우스등으로 지시하면 그것에 대응하는 인식 결과 문자(2104)가 강조 또는 반전 표시등으로 된다. 이 표시에 대하여 이용자가 입력부(118)인 키보드등으로 정해 문자 「都」를 입력하면 그 정해 문자 「都」에 관한 정보가 인터페이스부(116)로부터 정해 문자 버퍼(119) 및 영역 좌표 버퍼(120)에 출력된다. 당연히, 이용자가 이미지(2101)상의 예컨대 「東京」에 대응하는 영역을 지시하고 그것에 대응하는 인식 결과 「束長」을 「東京」으로 수정하면 그 정해 문자 「東京」에 관한 정보가 인터페이스부(116)로부터 정해 문자 버퍼(119) 및 영역 좌표 버퍼(120)에 출력된다.

후보 단어 검색부(109)는 정해 문자 버퍼(119)에 얻어진 정해 문자에 관한 정보를 특정 문자의 정보로서, 전술한 특정 문자 사전(110)과 지식 사전(111)을 이용한 후보 단어의 검색 처리를 실행함으로서 인식 불능 문자를 정확하게 재인식시킬 수 있다. 또한, 문자 절출부(103)는 이용자에 의해 지정된 정해 문자의 절출 위치를 영역 좌표 버퍼(120)로부터 취득하는 것에 의해 정확한 문자의 절출을 실행할 수 있다.

또한, 도 22의 예에서는 표시부(117)에 인식 결과(2202)와 병렬로 대상 문자열의 이미지가 표시된다. 이용자는 그 이미지상의 특정 영역(2201)을 입력부(118)인 마우스등으로 지시하면 그것에 대응하는 인식 결과 문자(2203)가 강조 또는 반전 표시등으로 됨과 동시에 지시 부분에 인식 결과 후보(2204)가 표시된다. 이 표시에 대하여 이용자가 입력부(118)인 키보드등으로 정해 문자 「都」를 선택하면 그 정해 문자 「都」에 관한 정보가 인터페이스부(116)로부터 정해 문자 버퍼(119) 및 영역 좌표 버퍼(120)에 출력된다. 이 경우에, 지시 부분에 표시되는 인식 결과 후보(2204)는 표시되는 문자의 출현 빈도순이나 주소 문자열과 같이 계층 구조를 갖는 경우에는 그 계층 구조에 의한 결정순이나 단순히 문자 코드순으로 표시되도록 구성할 수 있다.

도 22의 예에 계속해서 도 23에 도시되는 바와 같이 지시 위치(2301)와 그것에 대응하는 인식 결과 위치(2302)에 대해서도 동일한 수정 처리가 행하여짐으로써 문자열(2303)을 정확하게 재인식시키는 것이 가능하게 된다.

여기서, 각 특정 문자조를 구성하는 2개의 특정 문자사이에 끼워진 각 문자 영역에 대한 재인식 처리에 대하여 전술한 도 3의 스텝 207∼212에 있어서는 1개의 후보 단어를 구성하는 문자마다 개별로 재인식 처리가 실행되고 최종적으로 그 후보 단어에 대한 인식 결과가 출력되도록 구성되어 있다.

이 경우에, 매칭부(106)가 표준 패턴 사전(113)상에서 검색하는 문자 종류가 후보 단어가 속하는 카테고리의 문자 종류로 한정됨으로서 효율적인 재인식 처리가 실현된다.

한편, 2개의 특정 문자사이에 끼워진 문자 영역 전체에 대하여 특징 벡터의 추출과 매칭부(106)에 의한 매칭 처리가 실행되도록 구성되어도 좋다. 이 경우에는, 표준 패턴 사전(113)에는 「川崎」「橫兵」「橫須賀」···의 각각의 단어를 1개의 패턴으로 하는 표준 패턴의 특징 벡터가 유지되고 매칭부(106)는 1개의 후보 단어의 전체를 1개의 패턴으로 하는 특징 벡터와 표준 패턴 사전(113)내의 각 표준 패턴의 특징 벡터의 매칭 처리를 실행한다.

이 경우에, 매칭부(106)가 표준 패턴 사전(113)상에서 검색하는 단어군이 후보 단어가 속하는 카테고리의 단어군으로 한정됨으로서 효율적인 재인식 처리가 실현된다.

보다 구체적으로는, 예컨대 주소 문자열의 인식에 있어서 매칭부(106)가 표준 패턴 사전(113)상에서 검색하는 단어군이 후보 단어가 속하는 계층 레벨을 구성하는 단어군으로 한정됨으로서 효율적인 재인식 처리가 실현된다.

예컨대, 도 20에 도시되는 바와 같이 2개의 특정 문자 「縣」과 「市」사이에 끼워진 영역의 재인식 처리에 있어서 표준 패턴 사전(113)을 「川崎」「橫兵」「橫須賀」···등의 시(市)를 나타내는 단어군만인 것으로 한정할 수 있다.

또한, 예컨대 주소 문자열의 인식에 있어서, 상위 레벨의 인식 결과가 얻어져 있을 때에는 매칭부(106)가 표준 패턴 사전(113)상에서 검색하는 단어군이 그 상위 레벨의 인식 결과에 속하고 또한 후보 단어가 속하는 하위 레벨을 구성하는 단어군으로 한정되는 것에 의해 더욱 효율적인 재인식 처리가 실현된다.

예컨대, 주소 문자열의 레벨 1의 인식 결과가 「靑森」인 경우에 레벨 2의 표준 패턴은 2개의 특정 문자 「縣」과 「市」사이에 끼워져 출현할 수 있는 모든 단어군이 아니라 「靑森縣」에 속하는 시(市)를 나타내는 단어군으로 한정할 수 있다.

상기와는 역으로 예컨대 주소 문자열의 인식에 있어서 하위 레벨의 인식 결과가 얻어져 있을 때에는 매칭부(106)가 표준 패턴 사전(113)상으로부터 검색하는 단어군이 그 하위 레벨의 인식 결과가 속하고 또한 후보 단어가 속하는 상위 레벨을 구성하는 단어군으로 한정됨으로서 상위 레벨의 인식 불능 상태를 구제할 수도 있다.

<본 실시예를 실현하는 프로그램이 기록된 기록 매체에 대한 보충>

본 발명은 컴퓨터에 의해 사용될 때에 상술한 본 발명의 실시예의 각 구성에 의해서 실현되는 기능과 동일한 기능을 컴퓨터에 행하게 하기 위한 컴퓨터 독출 가능 기록 매체로서 구성할 수도 있다.

이 경우에, 도 24에 도시되는 바와 같이 예컨대 플로피 디스크, CD-ROM 디스크, 광 디스크, 착탈 가능 하드 디스크등의 가반형(可搬型) 기록 매체(2402)나 네트워크 회선(2403) 경유로 본 발명의 실시예의 각종 기능을 실현하는 프로그램이 컴퓨터(2401)의 본체(2404)내의 메모리(RAM 또는 하드 디스크등)(2405)에 로드되어 실행된다.

본 발명의 문자 인식 기술에 의하면 입력 문자열중의 특정 문자 또는 특정 문자열이 우선적으로 인식되고 그 인식 결과에 기초하여 그 전후의 후보 단어가 가정되며 그 후보 단어의 정보를 이용하여 입력 문자열을 구성하는 문자가 재인식됨으로서, 통상 흔히 보는 각종 문서(전표)에 기입되는 불규칙한 간격, 기입 방법으로 기입된 입력 문자열을 구성하는 문자를 높은 정밀도로 인식할 수 있게 된다.

본 발명의 문자 수정 기술에 의하면 특정한 문자 또는 문자열만을 수정함으로서 다른 인식 불능 부분도 자동적으로 수정할 수 있게 된다.

본 발명의 표기 요동의 제어 기술에 의하면 여러가지 기입 방법에 유연하게 대처할 수 있게 된다.

Claims

소정의 카테고리를 갖는 기입 필드에 기입된 입력 문자열을 구성하는 문자를 인식하는 문자 인식 방법에 있어서,

상기 입력 문자열과 제1 인식 사전사이에서 제1 매칭 처리를 실행함으로서 상기 입력 문자열중에서 특정 문자 또는 특정 문자열을 추출하는 단계와;

상기 소정 카테고리에 속하고 또한 상기 입력 문자열중에서 추출된 각 특정 문자 또는 특정 문자열의 전후의 상기 입력 문자열중의 영역에 위치할 가능성이 있는 후보 단어군을 카테고리별 단어 사전에서 추출하는 단계와;

상기 추출된 후보 단어군에 속하는 각 후보 단어마다 이 각 후보 단어에 관한 정보에 기초하여 이 각 후보 단어가 위치하는 상기 입력 문자열중의 각 영역에 대하여 제2 인식 사전을 이용하여 제2 매칭 처리를 실행함으로서, 상기 입력 문자열을 구성하는 문자를 인식하는 단계를 포함하는 것을 특징으로 하는 문자 인식 방법.
제1항에 있어서, 상기 제1 인식 사전에 상기 특정 문자 또는 특정 문자열에 대응하는 표준 패턴을 기억하는 단계와;

상기 입력 문자열의 패턴과 상기 제1 인식 사전내의 각 표준 패턴사이에서 상기 제1 매칭 처리를 실행함으로써 상기 입력 문자열중에서 상기 특정 문자 또는 특정 문자열을 추출하는 단계를 포함하는 것을 특징으로 하는 문자 인식 방법.
제1항 또는 제2항에 있어서, 상기 제2 인식 사전에 상기 후보 단어군에 속하는 후보 단어에 관련된 문자 또는 문자열에 대응하는 표준 패턴을 기억하는 단계와;

상기 후보 단어군에 속하는 각 후보 단어마다 이 각 후보 단어에 관한 정보에 기초하여 이 각 후보 단어가 위치하는 상기 입력 문자열중의 각 영역에 대하여 이 각 후보 단어의 패턴과 상기 제2 인식 사전내의 각 표준 패턴사이에서 상기 제2 매칭 처리를 실행함으로써 상기 입력 문자열을 구성하는 문자를 인식하는 단계를 포함하는 것을 특징으로 하는 문자 인식 방법.
제1항 내지 제3항중 어느 한 항에 있어서, 상기 각 후보 단어에 관한 정보로서, 이 각 후보 단어의 문자수의 정보를 사용하는 단계를 포함하는 것을 특징으로 하는 문자 인식 방법.
제1항 내지 제4항중 어느 한 항에 있어서, 상기 제1 인식 사전으로서, 이 제1 인식 사전을 포함하는 상기 제2 인식 사전을 사용하는 단계를 포함하는 것을 특징으로 하는 문자 인식 방법.
제1항 내지 제5항중 어느 한 항에 있어서, 상기 입력 문자열과 상기 제1 인식 사전사이에서 제1 매칭 처리를 실행함으로써 상기 입력 문자열중에서 상기 소정 카테고리에 있어서 출현하는 빈도가 높은 특정 문자 또는 특정 문자열을 추출하는 단계를 포함하는 것을 특징으로 하는 문자 인식 방법.
제1항 내지 제5항중 어느 한 항에 있어서, 상기 입력 문자열과 상기 제1 인식 사전사이에서 제1 매칭 처리를 실행함으로써 상기 입력 문자열중에서 인식 정밀도가 높은 특정 문자 또는 특정 문자열을 추출하는 단계를 포함하는 것을 특징으로 하는 문자 인식 방법.
제1항 내지 제7항중 어느 한 항에 기재된 문자 인식 방법을 이용한 문자 수정 방법에 있어서,

상기 입력 문자열을 구성하는 문자의 인식 결과를 상기 입력 문자열과 병렬로 표시하는 단계와;

상기 표시된 입력 문자열상의 소정의 영역을 지정하여 이 소정 영역에 대응하는 문자 또는 문자열을 수정하는 단계와;

상기 수정에 의해 부여된 정해 문자 또는 정해 문자열에 관한 정보에 기초하여 상기 후보 단어군의 추출 처리 및 제2 매칭 처리를 재차 실행함으로써 상기 입력 문자열을 구성하는 문자를 재차 인식하는 단계를 포함하는 것을 특징으로 하는 문자 수정 방법.
제8항에 있어서, 상기 표시되는 입력 문자열상의 소정 영역의 지정에 응답하여 이 소정의 영역에 있어서의 복수의 후보 인식 결과를 표시하는 단계를 포함하는 것을 특징으로 하는 문자 수정 방법.
제1항 내지 제9항중 어느 한 항에 있어서, 상기 각 후보 단어에 대하여 표기상의 요동을 갖는 단어를 상기 후보 단어군에 속하는 새로운 후보 단어로서 출력하는 단계를 포함하는 것을 특징으로 하는 문자 인식 방법 및 문자 수정 방법.
소정 카테고리를 갖는 기입 필드에 기입된 입력 문자열을 구성하는 문자를 인식하는 문자 인식 장치에 있어서,

상기 입력 문자열과 제1 인식 사전사이에서 제1 매칭 처리를 실행함으로써 상기 입력 문자열중에서 특정 문자 또는 특정 문자열을 추출하는 특정 문자/특정 문자열 추출 수단과;

상기 소정 카테고리에 속하고, 상기 입력 문자열중에서 추출된 각각의 특정 문자 또는 특정 문자열의 전후의 상기 입력 문자열중의 영역에 위치할 가능성이 있는 후보 단어군을 카테고리별 단어 사전에서 추출하는 후보 단어군 추출 수단과;

상기 추출된 후보 단어군에 속하는 각 후보 단어마다 상기 각 후보 단어에 관한 정보에 기초하여 각 후보 단어가 위치하는 상기 입력 문자열중의 각 영역에 대하여 제2 인식 사전을 이용하여 제2 매칭 처리를 실행함으로써 상기 입력 문자열을 구성하는 문자를 인식하는 입력 문자열 인식 수단을 포함하는 것을 특징으로 하는 문자 인식 장치.
컴퓨터에 의해 사용되었을 때에 그것에 의해 독출되는 프로그램을 기록한 기록 매체에 있어서,

소정 카테고리를 갖는 기입 필드에 기입된 입력 문자열과 제1 인식 사전사이에서 제1 매칭 처리를 실행함으로써 상기 입력 문자열중에서 특정 문자 또는 특정 문자열을 추출하는 기능과;

상기 소정 카테고리에 속하고, 상기 입력 문자열중에서 추출된 각 특정 문자 또는 특정 문자열의 전후의 상기 입력 문자열중의 영역에 위치할 가능성이 있는 후보 단어군을 카테고리별 단어 사전에서 추출하는 기능과;

상기 추출된 후보 단어군에 속하는 각 후보 단어마다 상기 각 후보 단어에 관한 정보에 기초하여 각 후보 단어가 위치하는 상기 입력 문자열중의 각 영역에 대하여 제2 인식 사전을 이용하여 제2 매칭 처리를 실행함으로써 상기 입력 문자열을 구성하는 문자를 인식하는 기능을 상기 컴퓨터로 실행시키기 위한 프로그램을 기록하는 것을 특징으로 하는 컴퓨터 독출가능 기록 매체.