KR100571080B1 - 문서 인식 장치 및 우편 구분기 - Google Patents

문서 인식 장치 및 우편 구분기 Download PDF

Info

Publication number
KR100571080B1
KR100571080B1 KR1019990049385A KR19990049385A KR100571080B1 KR 100571080 B1 KR100571080 B1 KR 100571080B1 KR 1019990049385 A KR1019990049385 A KR 1019990049385A KR 19990049385 A KR19990049385 A KR 19990049385A KR 100571080 B1 KR100571080 B1 KR 100571080B1
Authority
KR
South Korea
Prior art keywords
character
candidate
destination number
character recognition
name
Prior art date
Application number
KR1019990049385A
Other languages
English (en)
Other versions
KR20000035325A (ko
Inventor
오가따히사오
후지사와히로미찌
후루까와나오히로
사꼬히로시
데라모또마사또
와따나베시게루
Original Assignee
가부시키가이샤 히타치세이사쿠쇼
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 히타치세이사쿠쇼 filed Critical 가부시키가이샤 히타치세이사쿠쇼
Publication of KR20000035325A publication Critical patent/KR20000035325A/ko
Application granted granted Critical
Publication of KR100571080B1 publication Critical patent/KR100571080B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)

Abstract

수신인 이름 표기 중에, 의미의 해석에 애매성이 있는 문자 간의 공백 정보나 행바꿈 정보(改行情報)가 존재하는 경우에 수신인 이름 정보를 고정밀도로 인식 해석하는 장치를 제공하는 것이다.
문자 식별 처리(1101)에서는 각 문자 패턴을 식별한 결과의 후보 문자 래티스를 출력한다. 기하학적 분리 정보 추출 수단(1102)으로는 수신인 이름 문자열 중의 공백, 혹은 행바꿈의 분리 정보 가설을 추출하여 후보 문자 래티스에 관련지어 출력한다. 와일드 카드 래티스 생성 처리(1103)에서는 임의의 영숫자를 나타내는 와일드 카드 기호로 표현된 래티스를 생성한다. 표기 패턴 대조 수단(1104)으로는 상기 와일드 카드 기호로 표현된 쵸메(丁目) 번지의 여러가지 표기를 단어 문자열로서 유지하는 표기 패턴 사전과 와일드 카드 래티스를 대조한다. 여기에, 분리 정보 가설이 존재하는 특정한 장소를 주목할 때, 거기에 분리 정보가 존재한다고 가정한 표기 패턴 후보 및 분리 정보가 존재하지 않는다고 가정한 표기 패턴 후보 각각을 생성한다. 문자열 후보 생성 수단(1105)으로는 상기 각각의 표기 패턴 가설의 영숫자에 해당하는 부분을 원래의 문자열로 복원하여 문자열 후보를 출력한다. 수신처 번호 대조(1106)로서는 실제로 존재하는 주소 코드를 저장한 수신처 번호 사전(1109)에 등록되어 있는 문자열 후보를 선택하여 출력한다.
문자 식별, 문자 패턴, 표기 패턴 대조, 문자열 후보, 주소 코드, 수신처 사전

Description

문서 인식 장치 및 우편 구분기{APPARATUS FOR RECOGNIZING A DOCUMENT AND SORTER OF MAIL}
도 1은 쵸메(丁目) 번지, 건물 번호, 방 번호 표기의 예를 나타내는 도면.
도 2는 문서 인식 장치의 기본 기능 구성을 나타내는 도면.
도 3은 수신인 이름 문자 정보의 예를 나타내는 도면.
도 4는 문자행 추출 결과의 예를 나타내는 도면.
도 5는 문자 추출 가설 네트워크를 나타내는 도면.
도 6은 마치(町) 지역명 인식 데이터 흐름을 나타내는 도면.
도 7은 선택된 패스에 대응하는 문자 후보 래티스를 나타내는 도면.
도 8은 마치(町) 지역명 지식의 예를 나타내는 도면.
도 9는 유한 오토마톤을 이용한 단어 대조를 나타내는 도면.
도 10은 단어 후보 래티스의 형식의 예를 나타내는 도면.
도 11은 쵸메(丁目) 번지, 건물 번호, 방 번호 인식 처리 흐름을 나타내는 도면.
도 12는 기하학적 분리 정보 추출 결과의 예를 나타내는 도면.
도 13은 기하학적 분리 정보 속성 부착 래티스의 예를 나타내는 도면.
도 14는 와일드 카드 변환 규칙을 나타내는 도면.
도 15는 와일드 카드 래티스를 나타내는 도면.
도 16은 쵸메(丁目) 번지, 건물 번호, 방 번호의 표기 패턴 지식의 예를 나타내는 도면.
도 17은 유한 오토마톤을 이용한 표기 패턴의 단어 대조를 나타내는 도면.
도 18은 단어 후보 래티스의 형식의 예를 나타내는 도면.
도 19는 표기 패턴 후보 생성 결과를 나타내는 도면.
도 20은 영숫자 복원 후보를 나타내는 도면.
도 21은 수신처 번호 사전의 구성예를 나타내는 도면.
도 22는 카테고리 기호열 후보 트리(木)의 예.
도 23은 문서 인식 장치를 포함하는 우편 구분기의 구성을 나타내는 도면.
<도면의 주요 부분에 대한 부호의 설명>
301 : 용지
2002 : 스캐너
2000 : 우편 구분기의 기구부
2001 : 공급 기구
2003 : 반송 기구
2004 : 구분 기구
2005 : 조작 패널
2007 : 문서 인식 장치
2008 : 입력 인터페이스
2009 : 중앙 처리 장치(CPU)
2010 : 중앙 처리 장치(CPU)
2013 : 메모리
2011 : 통신 인터페이스
2014 : 2차 기억 장치
2012 : 버스
본 발명은 문자 인식 기술을 이용하여 지면(紙面)에 기재된 문자 정보를 판독하여 해석하는 문서 인식 장치와, 이 문서 인식 장치를 이용한 우편 구분기에 관한 것이다.
종래, 문자열로 표현된 지면 상의 문자 정보를 문자 인식 기술을 이용하여 판독할 때는 그 문자열을 좌측으로부터 우측으로(위에서 아래로) 한 문자씩 순서대로 판독한다. 그리고, 그 판독 결과에 기초하여 예를 들면, 수신인 이름 정보의 경우, 켄(縣)명, 시읍면(市町村)명, 쵸메(丁目) 번지, 건물 번호, 방 번호 등의 해석을 차례대로 부여하고 있었다. 그 중에서, 쵸메(丁目) 번지, 건물 번호, 방 번호에 해석을 부여하기 위해서는 이들에 관한 표기의 지식을 이용하는 것이 유효하며, 예를 들면 공개 특허 공보 "주소 판독 장치 및 방법"(특개평 8-243505)이 알려져 있다. 여기에, 그 내용을 간단하게 언급한다. 쵸메(丁目) 번지의 예로서 「1- 2」 「1番2號」 「一番二號」는 다른 표기이지만 전부 동일한 주소를 나타낸다. 지면 상의 수신인 이름 정보가 어떤 표기에 해당하는지를 판별할 수 있다면 판독 정밀도가 향상될 수 있음을 알 수 있을 것이다. 그래서, 이들의 표기 지식을 이용하기 위해서 표기 패턴을 나타내는 문자열을 사전에 유지해두고, 그 표기 패턴과 한 문자씩 판독한 결과와의 대조를 행하여 쵸메(丁目) 번지, 방 번호에 대한 해석을 부여한다. 전술한 「1-2」 「1番2號」 「一番二號」에 대응하는 표기 패턴은 「N-N」 「N番N號」 「K番K號」가 된다. 여기서, 「N」은 숫자를 나타내는 와일드 카드 기호, 「K」는 한 숫자를 나타내는 와일드 카드 기호이다. 「-」「番」「號」는 영숫자끼리를 구분하는 분리 기호이다.
이러한 문서 인식 장치를 응용하는 분야 중 하나로서, 우편 구분기에 의한 우편물의 도로 순서 조립이라는 업무가 있다. 이 업무에서는 수신인 이름의 마치(町) 지역명 외에 쵸메(丁目) 번지, 건물 번호, 방 번호 등 주소를 특정하기 위해서 필요한 문자 정보를 전부 판독하여 우편물의 배달인이 배달하는 순서대로 재배열할 필요가 있다. 종래, 이 업무는 전부 사람의 손으로 행해지고 있었고, 이것을 우편 구분기를 이용한 기계화를 통해 인건비 절약이나 일손 부족을 해소하고자 하고 있다.
한편, 구분기로 판독할 수 없었던 우편물은 사람의 손을 통하여 구분되므로, 그 만큼 인건비가 많이 들게 된다. 그 때문에, 우편 구분기에 의한 수신인 이름 정보의 판독율의 향상은 배달 비용 삭감을 위해서 매우 중요하다. 특히, 10만통의 우편물의 1%는 1,000통으로, 판독 정밀도 향상에 따른 비용 삭감의 효과는 매우 높 다. 따라서, 쵸메(丁目) 번지, 건물 번호, 방 번호의 인식율이 높다는 것은 우편 구분기의 분야에서는 매우 중요한 의미를 갖는다.
그러나, 우편의 수신인 이름에는 고정밀도한 인식율을 저지하는 다음과 같은 표기 상의 문제가 존재한다.
(1) 문자 패턴 간의 공백
우편 수신인 이름에는 도 1의 (1)과 같이, 쵸메(丁目) 번지와 방 번호의 경계를 표현하기 위해서 문자 패턴 간의 간격을 주위의 문자보다도 비워두어 거기에 공백이 존재하는 것과 같은 표기가 존재한다. 활자의 경우는 문자를 등피치로 쓰는 경우가 많으므로 이 공백 정보의 검출은 쉽다. 그러나, 도 1의 (2)와 같이 손으로 쓴 문자 패턴의 피치나 사이즈의 변동이 크기 때문에, 문자 패턴 간에 공백 정보가 존재하는지의 여부가 반드시 명시적이지 않다. 그 때문에, 공백이 존재하면 검지된 장소에서 숫자끼리가 분리되어 있는지의 여부를 판별하여 정확하게 수신인 이름 정보를 판독하는 것은 매우 곤란하다.
(2) 행바꿈(改行)
우편 수신인 이름에는 도 1의 (3)과 같이, 쵸메(丁目) 번지와 방 번호의 경계를 표현하기 위해서 행바꿈을 이용한 표기가 존재한다. 한편, 도 1의 (4)의 예와 같이 경계를 의도하지 않은 장소에서 강제적으로 행바꿈된 표기도 마찬가지로 존재한다. 이러한 예는 다이렉트 메일에서 자주 보여지는 표기로, 1행의 문자수가 일정치를 넘은 경우는 강제적으로 주소가 다음행으로 넘어가 인쇄된다. 그 때문에, 수신인 이름 표기 중에 행바꿈의 정보가 존재한 경우, 행바꿈에 의해 숫자끼리 가 분리되어 있는지의 여부를 판별하여 정확하게 수신인 이름 정보를 판독하는 것은 매우 곤란하다.
따라서, 본 발명은 쵸메(丁目) 번지, 건물 번호, 방 번호를 높은 정밀도로 판독하기 위해서 이하에 나타내는 2개의 과제를 해결하는 것을 목적으로 한다.
(1) 문자 패턴 간의 공백 정보의 해석과 그 정보를 이용한 수신인 이름의 고정밀도 인식 문자 패턴 간의 피치나 문자 사이즈로부터 거기에 공백의 정보가 존재한다고 인식 장치가 검지한 경우에, 그 정보가 쵸메(丁目) 번지, 건물 번호, 방 번호 각각을 분리하기 위한 분리 정보로서 해석해도 되는지의 여부의 판정을 할 필요가 있다.
해석에 애매성이 있는 경우에 분리 정보이다, 아니다의 양쪽의 가설을 세워서, 각각의 가설을 후단의 처리로 검증하여 고정밀도로 인식하는 방식을 실현하는 것을 본 발명의 목적으로 한다.
(2) 행바꿈 정보의 해석과 그 정보를 이용한 수신인 이름의 고정밀도 인식
문자 패턴 간의 상대적 위치 관계로부터 거기에 행바꿈의 정보가 존재한다고 인식 장치가 검지한 경우에, 그 정보가 쵸메(丁目) 번지, 건물 번호, 방 번호의 각각을 분리하기 위한 분리 정보로서 해석해도 되는지의 여부의 판정을 할 필요가 있다. 해석에 애매성이 있는 경우에 분리 정보이다, 아니다의 양쪽의 가설을 세워서, 각각의 가설을 후단의 처리로 검증하여 고정밀도로 인식하는 방식을 실현하는 것을 본 발명은 목적으로 한다.
상기한 과제를 해결하기 위해서, 본 발명 방식은 용지 상에 기재된 수신인 이름 정보를 디지탈 화상 데이터로 변환하고, 상기 디지탈 화상 데이터를 이용하여, 수신인 이름 정보에 관한 지식 데이터 베이스에 기초하여 수신인 이름 정보의 인식을 행하는 문서 인식 장치에 있어서,
상기 디지탈 화상 데이터를 입력하고 입력된 화상으로부터 문자행 정보를 추출하고, 또한 문자 정보를 추출하여 인식하고, 추출된 각 문자 패턴에 대하여 인식 후보 문자군을 출력하는 문자 인식 수단과, 문자 인식 수단으로부터 출력된 인식 후보 문자군과 마치(町) 지역명 정보를 저장한 마치(町) 지역명 사전과 대조함으로써 마치(町) 지역명을 인식함과 함께, 추출된 문자행 중에서 쵸메(丁目) 번지, 건물 번호, 방 번호가 쓰여져 있다고 추정되는 영역의 선두 혹은 말미를 검출하는 마치(町) 지역명 인식 수단과, 상기 쵸메(丁目) 번지 추정 영역의 선두 또는 말미로부터 미처리의 각 문자 패턴 간의 상대적인 기하학적 관계로부터 문자열끼리를 분리하기 위한 분리 정보 가설을 생성하는 기하학적 분리 정보 가설 생성 수단과, 상기 쵸메(丁目) 번지 추정 영역의 선두 또는 말미로부터 미처리의 각 문자 패턴에 대응하는 후보 문자군 중의 영숫자를 임의의 영숫자를 나타내는 와일드 카드 기호로 치환한 후보 문자군으로 변환하는 와일드 카드 변환 수단과, 와일드 카드 변환 수단으로부터의 출력과, 상기 기하학적 분리 정보 가설을 입력하여 상기 와일드 카드 기호로 표현한 쵸메(丁目) 번지, 건물 번호, 방 번호의 표기 패턴을 생성할 때에 기하학적 분리 정보 가설을 표기 패턴 중의 분리 정보로서 사용한 표기 패턴 가 설과, 분리 정보로서 사용하지 않은 표기 패턴 가설의 각각의 가설을 생성하는 표기 패턴 가설 생성 수단과 상기 표기 패턴 가설 생성 수단으로부터 출력된 표기 패턴 가설과, 문자 인식 수단으로부터 출력되는 후보 문자군을 대조하여 표기 패턴 가설 중의 와일드 카드 기호를 원래의 후보 문자로 복원하고, 쵸메(丁目) 번지, 건물 번호, 방 번호의 문자열 후보를 출력하는 문자열 후보 생성 수단과, 상기 마치(町) 지역명 인식 수단으로부터 출력된 인식 결과와, 상기 문자열 복원 수단으로부터 출력된 쵸메(丁目) 번지, 건물 번호, 방 번호 후보를 대조하여 주소를 나타내는 문자열 및 그에 수반하는 주소를 나타내는 주소 코드를 생성하고, 그 주소 코드가 수신처 번호 사전 중에 존재하는지의 여부를 판정하여 존재하는 후보를 출력하는 수신처 번호 대조 수단을 구비하는 것을 특징으로 한다.
또한, 본 발명의 표기 패턴 가설 생성 수단은 상기 와일드 카드 기호 표현한 쵸메(丁目) 번지, 건물 번호, 방 번호의 여러가지 표기 패턴을 단어 문자열로서 유지하는 표기 패턴 단어 사전을 내부에 가지며, 와일드 카드 변환 수단의 출력과 표기 패턴 단어 사전의 단어를 오토마톤(automaton)을 이용하여 대조하고, 또한 문자행 중에서 상기 기하학적 분리 정보 가설이 존재하는 특정한 장소를 주목할 때, 주목된 장소에 분리 정보가 존재한다고 가정한 표기 패턴 가설 및 분리 정보가 존재하지 않는다고 가정한 표기 패턴 가설의 각각을 생성하는 것을 특징으로 한다.
또한, 본 발명의 표기 패턴 가설 생성 수단은 상기 와일드 카드 기호로 표현한 쵸메(丁目) 번지, 건물 번호, 방 번호의 여러가지 표기 패턴을 단어 문자열로서 유지하는 표기 패턴 단어 사전과, 와일드 카드 변환 수단의 출력 결과와 표기 패턴 단어 사전에 저장된 단어를 오토마톤을 이용해서 대조하여 여러개의 표기 패턴 단어 가설을 출력하는 표기 패턴 단어 대조 수단과, 문자행 중에서 상기 기하학적 분리 정보 가설이 존재하는 위치에서, 상기 표기 단어 대조 수단으로부터 출력된 표기 패턴 단어 가설끼리를 접속하여 쵸메(丁目) 번지, 건물 번호, 방 번호 표기 패턴 가설을 생성할 때, 접속한 단어 가설 간에 분리 정보의 속성을 부여한 표기 패턴 가설 및 분리 정보의 속성을 부여하지 않은 표기 패턴 가설의 각각을 생성하는 표기 패턴 단어 통합 수단을 구비하는 것을 특징으로 한다.
또한, 본 발명은 우편물에 기재된 수신인 이름 정보를 인식하여 인식 결과에 기초하여 우편물을 수신처별로 구분하는 우편 구분기에 있어서 상기 수신인 이름 정보를 인식하기 위한 장치로서, 상기한 구성의 문서 인식 장치를 구비하는 것을 특징으로 하고 있다.
최초에 본 발명의 원리를 간단하게 설명한다.
수신인 이름 표기의 예로서 도 1의 (3)의 경우를 생각한다. 도면에서는 「1-2」와 「1-201」 간에 행바꿈의 정보가 존재하지만, 이것이 문자열을 나누는 분리 정보를 나타내는 것인지의 여부를 화상 정보로부터만으로는 판단할 수 없다. 그래서, 행바꿈이라는 문자 패턴 간의 기하학적 정보, 문자 패턴의 식별 결과, 그리고, 쵸메(丁目) 번지의 표기의 지식을 이용하여 행바꿈이 분리 정보를 나타내지 않는다고 가정한 쵸메(丁目) 번지 가설 「1-21-201」과, 행바꿈이 분리 정보를 나타낸다고 가정한 가설 「1-2-1-201」의 2개의 가설을 생성한다. 그 후, 실제로 존재하는 주소의 코드를 저장한 수신처 번호 사전과, 각각의 쵸메(丁目) 번지 가설을 대조하여 사전에 등록되어 있는 쪽이 옳은 해석이라고 생각하여 한쪽을 출력한다.
이와 같이, 행바꿈이나 공백이라는 해석에 애매성이 존재하는 정보가 있는 경우에는 복수의 가설을 세워서 후단의 처리로 어느 가설이 옳은지를 검증한다고 하는 다중 가설 검정 방식을 본 발명은 기본으로 하고 있다.
이하에, 본 실시 형태에 대하여 자세하게 설명한다.
도 2는 문서 인식 장치의 기본적인 기능 구성이다. 판독 대상 용지(301)는 예를 들면 도 3에 도시한 바와 같은 기재가 있다. 동일 용지는 화상 취득 처리(201)에 의해서 스캐너를 통하여 화상을 입력하고, 그 후 디지탈 화상 데이터로 변환된다. 문서 인식 장치는 이 화상 데이터에 대하여, 문자 영역의 추출(202), 문자 추출 가설의 생성(203), 마치(町) 지역명 인식(204), 쵸메(丁目) 번지 인식(205)을 행하여 인식 결과(208)를 출력한다.
문서 인식의 제1 처리는 문자 영역의 추출(202)이다. 용지(301)의 화상으로부터 기재 영역(302)을 검출하고, 또한 문자행마다 도 4에 도시한 바와 같이 화상 영역(401, 402)을 추출한다.
다음 처리는 문자 추출 가설의 생성 처리(203)이다. 여기서, "가설"이란 "후보"와 동일한 의미이다.
한행씩 추출된 문자행 화상(401, 402)을 처리하여 도 5에 도시한 바와 같이, 문자 추출 가설을 만들어서 네트워크로서 나타낸다(도 2는 도 4의 문자행의 일부에 대해서만 나타낸다).
화상을 구성하는 화소의 값이 1(흑을 나타낸다)인 연속된 영역을 라벨링이라 고 부르는 처리로 추출한다. 추출되는 연결된 흑화소의 덩어리(패턴)를 흑연결 성분이라고 부른다. 인접하는 흑연결 성분(1개 또는 복수)을 1 문자를 구성하는 최소 부분(기초 성분)이라고 간주하여, 이들로 도 5에 도시하는 네트워크의 기간부(基幹部)를 구성한다. 이어서, 1 문자를 구성할 가능성이 있을 것 같은 몇개의 인접하는 기본 성분을 통합하여 그래프의 변을 추가한다. 이 처리를 전체에 대하여 행함으로써 도 5에 나타내는 것과 같은 문자 추출 가설 네트워크를 만들 수 있다.
문자의 추출은 어렵고 문자 식별 전에 일의적으로 결정할 수는 없다. 따라서, 도 5에 도시한 바와 같이 가능성이 있는 추출쪽을 가설의 형태로 남겨두고, 이들 복수의 가설을 대상으로 다음의 각 인식 처리를 행한다.
여기서 도 5는 도 4의 문자행(401)의 전반 부분에 대해서만 나타내고 있다. 즉, 「1-2」 이후의 문자열에 대응하는 부분도 데이터로서는 존재하지만, 도 5에서는 도면의 간단화를 위해서 도시하지 않는다.
동일 네트워크는 추출된 문자(또는 그 부분)의 화상과, 이들의 대조(1개인 경우도 있다)의 화상을 아크(그래프에서의 변)에 부속시켜서, 각각 다른 추출쪽을 하나의 그래프(네트워크) 중에 표현한다. 도 5는 이것을 도식적으로 나타내고 있지만 계산기 내부의 데이터로서도 표현할 수 있다. 동일 도면에서 아크 3은 「都」의 변의 부분에 대응하는 부분 화상을, 아크 4는 「都」의 변의 부분에 대응하는 부분 화상을 나타내고 있다. 또한, 아크 16은 이들 2개의 부분 화상을 대조한 것으로 별도의 추출 가설을 나타내고 있다.
마치(町) 지역명 인식(204)은 상기한 추출 가설 네트워크(206)를 입력한 후, 사전 지식을 이용한 문자 식별과 지식 처리를 행하고, 마치(町) 지역명 후보 및 추출 가설 네트워크에서 어디까지 인식 대조를 행하는지의 포인터 정보(207)를 출력한다.
마치(町) 지역명 인식 처리의 상세에 관하여 도 6을 이용하여 설명한다. 문자 식별(601)은 상기한 문자 추출 가설 네트워크의 아크에 부속된 부분 화상을 문자 식별 사전(604)을 참조하여 처리한 후, 그 정보를 기초로 아크의 대조을 결정하고, 도 7에 도시한 바와 같은 문자 후보 래티스를 출력한다.
문자 식별 방식으로서는 종래 기술을 이용할 수 있다. 인쇄 한자 및 손으로 쓴 한자를 식별하는 방식으로서는 문자 스트로크의 방향성을 추출하는 "방향성 패턴 정합법"이 알려져 있다. 여기서는 상세를 생략하지만, 패턴 정합법으로서는 미지 패턴의 화상(또는 특징 벡터)과 별도 문자 식별 사전에 기억해둔 참조 패턴(화상 또는 특징 벡터)과의 유사성을 유사도라고 부르는 0 내지 1의 수치(실수)로서 계측할 수 있다.
도 7에 나타내는 식별 결과는 유사도가 큰 순서로 문자 카테고리와 그 유사도를 나열한 것으로, 문자 후보 래티스라고 부른다. 도 7에서 제2 컬럼의 ID는 도 6에서의 선택된 아크 번호이며, 문자 식별 결과의 유사도가 높은 패턴의 대조을 나열한 것이다.
여기서 의도하고 있는 것은 다음의 것이다. 도 5에서 아크1, 2와 같이, 부분 화상 또는 그 대조 화상이 실제로 존재할 수 있는 패턴이면, 그것은 패턴 사전에 등록되어 있는 참조 패턴과 닮아 있으므로 유사도는 커질 것으로 추측된다. 반 대로 아크4, 7과 같이 부분 화상이 실제로는 존재하지 않은 패턴이면 패턴 사전에도 그에 해당하는 참조 패턴이 존재하지 않으므로 유사도는 작아질 것으로 기대된다. 이와 같이, 문자 식별을 이용하여 유사도가 큰 부분 화상의 대조을 만드는 것으로 문자 식별과 추출을 실행한다.
실제로는 이 최적 패스가 틀린 경우도 있으므로 유사도의 총합이 최대인 패스뿐만아니라 제2위, 제3위 등의 복수의 패스를 선택하여 후단의 처리로 보낸다. 따라서, 문자 후보 래티스는 그 수만큼 만들어진다. 그 이후의 처리는 이들 복수의 문자 후보 래티스를 대상으로 한다. 또, 도 5 및 도 7에서는 일부분에 대해서만 기록했지만, 이들의 처리는 도 4에 도시하는 모든 문자행에 대해서 행한다.
이어서, 마치(町) 지역명 대조 처리(602)는 모든 문자행에서부터 만들어지는 복수의 문자 후보 래티스에 대하여 행해진다. 동일 처리부는 도 8에 도시하는 마치(町) 지역명 지식을 표데이터의 형식으로 유지하고 있는 마치(町) 지역명 대조 사전을 참조하여 처리를 행한다. 동일 사전은 도도후켄(都道府縣)명, 시읍면(市町村)명, 마치(町)명에 나타나는 단어 지식을 구비한다(도 8a, 도 8b, 도 8c). 또한, 이 단어 지식에는 어떤 단어가 어떤 단어로 이어질 수 있는지의 정보인 통어 지식(統語知識)도 포함한다.
예를 들면, 도 8의 (b)에서 시(市) ID가 C0517의 「千代田區」는 부모 ID가 K31이라고 기억되어 있으며, 그것은 도 8의 (a)의 도도후켄(都道府縣)명 리스트를 보면 「東京都」인 것이 기억되고 있다. 즉, 단어 「東京都」 후에는 단어 「千代田區」가 이어질 수 있는 것을 나타내고 있다. 마찬가지로, 「千代田區」에는 도 8의 (c)의 동명 리스트 「千代田區」에서부터 「神田駿河台」 등이 이어지는 것이 기억되고 있다.
마치(町) 지역명 대조 처리는 이들의 단어 지식과 이들의 통어 지식(統語知識)을 이용하여 문자 후보 래티스로부터 단어열(구), 예를 들면 「東京都·千代田區·神田駿河台」를 인식하는 처리로, 이미 알려져 있는 방식이 있다. 이하, 본 발명의 이해를 돕기 위하여 그 방식을 설명한다.
거기에는, 우선 문자 후보 래티스로부터 도 9에 도시한 바와 같은 유한 오토마톤을 구성하고, 이 오토마톤에 단어(문자열)를 유입시킴으로써, 그 단어가 이 문자 후보 집합으로부터 재구성할 수 있는 단어인지의 여부, 즉 그 단어를 인식 결과로서 좋은지의 여부를 판단할 수 있다. 이 처리가 단어 대조의 처리이다.
구체적으로는, 래티스의 행의 수보다 1개 많은 상태(도 9에서의 동그라미 표시)를 만들어서, 1개의 문자 후보를 어느 상태로부터 다음의 상태로의 천이 링크(화살표)로 나타낸다. 예를 들면, 제1 문자의 제1위 후보 「東」은 상태 0으로부터 상태 1에 이르는 제1 천이 링크, 동일 제2위 후보「菓」는 상태 0에서부터 상태 1에 이르는 제2 천이 링크, 제2 문자의 제1위 후보「宗」은 상태 1에서부터 상태 2에 이르는 천이 링크라는 상태로 오토마톤을 만든다. 유한 오토마톤은 공지의 방법에 의해서 소프트웨어적으로는 상태 천이표를 이용하여 용이하게 만들 수 있다.
어떤 단어가 문자 후보 집합으로부터 재구성할 수 있는지의 여부는, 그 단어를 구성하는 문자열의 각 문자가 이 유한 오토마톤의 어떤 천이 링크를 통과할지로 판단할 수 있다.
예를 들면, 단어 「東京都」가 최초의 3문자에 존재하는지의 여부를 보기 위해서는 우선 문자 「東」이 상태 0으로부터 어떤 링크를 통하여 상태 1에 이르는지를 본다. 상태 천이표를 이용하는 오토마톤은 이 검색을 고속으로 실현할 수 있다. 도 9의 경우, 제1 링크가 「東」인 것을 알 수 있다. 이어서, 문자 「京」이 상태 1로부터 상태 2에 어느 링크를 통하여 천이하는지를 마찬가지로 검색한다. 이 경우, 제2 링크인 것을 알 수 있다.
마찬가지로, 문자 「都」는 제2 링크를 통하여, 상태 2로부터 상태 3으로 이르는 것을 알 수 있다. 이 때, 단어 「東京都」의 존재하는 확신도는 각각의 문자 후보의 유사도 총합으로 나타낼 수 있다.
혹은, 어느 링크를 통과했는지로 페널티를 계산하는 방법도 있다. 이 경우, 제1 링크를 통과할 때는 페널티 0, 제2 링크를 통과할 때는 페널티 1, 제3 링크를 통과할 때는 페널티 2라는 상태로 한다. 이 예의 경우는 「東京都」의 페널티는 0 + 1 + 1 = 2가 된다.
이 검색 처리로, 혹시, 어느 문자에 대하여 대응하는 천이 링크가 존재하지 않을 때는 도 9의 "기타"라는 천이 링크를 통하게 한다. "기타"의 링크에 대응하는 유사도나 페널티는 사전에 파라메터 중 하나로서 상수(정수)를 충당한다.
이 처리는 논리적으로는 가능성이 있는 모든 단어에 대하여, 모든 상태로부터 개시하여 행한다. 그 결과는 도 10의 단어 후보 래티스의 형식으로 나타낼 수 있다. 예를 들면, 도 10은 상태 0(1문자째)으로부터 단어 「東京都」와 「XXX」가, 상태 1(2문자째)로부터 단어 「京都」가, 상태 2(3문자째)로부터 단어 「YYY」 가 후보로서 오른 것을 나타내고 있다. 최후의 후보는 상태 6(7문자째)으로부터 시작되는 단어 「SSS」와 「神田駿河台」이다. 이와 같이 단어 후보 래티스는 어떤 위치에 어떠한 단어가 있을 것인지를 확신도 혹은 페널티부로 나타내고 있다. 이 단어 후보 래티스를 만든 곳까지가 마치(町) 지역명 대조 처리(602)의 전반(前半)의 처리이다.
마치(町) 지역명 대조 처리(602)의 후반의 처리는 단어 후보 중에서부터 통어규칙(統語規則)을 만족하는 단어만을 골라낸 것이다. 이것은 단어 후보 래티스의 말단(우단)의 단어 후보로부터 시작해서 순차적으로 좌측으로 접속할 수 있는 단어가 단어 후보 래티스 중에 있는지의 여부를 도 8에 도시한 마치(町) 지역명 지식 중의 단어 접속 정보를 참조하여 검증한다.
그 결과, 도 10에 도시한 바와 같이, 「神田駿河台」는 「千代田區」를 접속할 수 있지만, 단어 「SSS」에 접속할 수 있는 단어 후보는 존재하지 않는 것을 알 수 있다.
최종적으로, 「東京都·千代田區·神田駿河台」를 구의 후보로 할 수 있다.
경우에 따라서는, 복수의 구가 후보가 되는 경우가 있지만, 그 경우는 종합 확신도 혹은 종합 페널티를 이용하여 순위가 매겨진 좋은 쪽을 선택할 수 있다.
혹은 이들 복수의 후보를 나란히 놓고 후단의 처리로 이송하여, 최종 판단을 후단으로 하게 할 수도 있다.
후보 채용 판정(603)으로는 마치(町) 지역명 대조 처리(602)로부터 출력된 마치(町) 지역명 후보가 타당한 대조 결과인지의 판정을 행한다. 예를 들면, 마치(町) 지역명 후보의 확신도의 값을 보고 임계치 처리를 행한다.
이상에 의해 마치(町) 지역명 인식 처리(204)가 행해지며, 그 결과 예를 들면 문자열 「東京都千代田區神田駿河台」가 인식되게 되며, 그 문자열과 그것을 나타내는 거리 ID「T2121」이 데이터(207)로서 후단의 처리부로 보내진다.
다만, 이 데이터에는 소위 인식 결과 「東京都千代田區神田駿河台」뿐만아니라, 문자 후보 래티스의 어느 부분에 대응하는 것인지를 나타내는 데이터도 포함한다. 이에 의해서, 후단의 처리 예를 들면, 쵸메(丁目) 번지 인식 처리(205)는 자기가 이어서 처리하는 부분은 어디인지를 알 수 있다.
보다 구체적으로는, 도 4의 문자행, 제1 행째의 「東京都...」로부터 시작해서 「...神田駿河台」까지의 인식 대조 처리를 행한 것을 나타내는 포인터 정보를 포함한다. 이것에 의해서, 이어서 처리하여야 할 부분은 「1-2」 이후의 문자열인 것을 알 수 있다. 이 경우, 포인터 정보는 도 7의 문자 후보 래티스에서의 ID 번호의 형식으로 나타낼 수 있다.
다음에, 쵸메(丁目) 번지 인식(205)에 관하여 도 11을 이용하여 설명한다. 쵸메(丁目) 번지 인식으로서는 아직 처리되지 않은 처리 대상 「1-2」 이후의 문자열의 인식 대조 처리를 행한다.
문자 식별 처리(1101)로서는 문자 추출 가설(203), 마치(町) 지역명 인식 결과(207)를 입력한 후, 문자 식별 사전(1108)을 이용하여 마치(町) 지역명 인식(204)에서의 문자 식별(601)과 마찬가지의 방식에 의해 문자 식별을 행하고 후보 문자 래티스(1111)를 출력한다.
기하학적 정보 추출 처리(1102)는, 문자 추출 가설(203)과 후보 문자 래티스(1111)를 입력하여, 문자 간의 공백이나 행바꿈과 같은 기하학적 분리 정보 가설 속성과 관련지어진 기하학적 분리 정보 속성 부착 래티스(1112)를 출력한다. 이 처리는 기지의 방식을 이용하여 실현할 수 있다. 본 처리의 상세를 도 12를 이용하여 설명한다.
공백 정보를 추출하기 위해서, 우선, 문자 추출 가설에 수반하는 기하학적 정보로부터 행방향에 대한 개개의 추출된 문자 화상의 중심을 구하여, 인접하는 중심 간의 거리를 측정한다. 1201은 그 결과를 나타낸다. 1202의 부분은 인접하는 중심 간의 거리보다도 2배의 거리가 있다. 그리고, 그 중심 간의 거리가 행의 높이에 관하여 어느 일정한 임계치 이상이면 거기에 공백이 존재한다고 하여 추출된 화상에 관련시켜서 그 속성을 부여한다. 1204는 공백 정보의 후보가 그 문자 패턴의 직후에 존재하는 것을 나타내고 있다. 행바꿈 속성에 대해서도 문자 패턴 간의 상대적 위치 관계를 판정하여 동일한 속성을 부여한다. 1203은 이들의 처리의 결과로, 기하학적 분리 정보의 가설은 심볼열로서 표현된다. 최종적으로 기하학적 분리 정보 가설은, 도 13과 같이 문자 후보 래티스에 대하여 대응하는 장소에 관련지어서, 기하학적 분리 정보 속성 부착 래티스(1112)로서 출력된다.
와일드 카드 래티스 생성 처리(1103)는 기하학적 분리 정보 속성 부착 래티스(1112)를 수취하고, 도 14에 나타내는 와일드 카드 변환 룰을 참조하여 래티스 중의 후보 문자를 와일드 카드 기호로 변환한다. 예를 들면, 도 13에서의 기입 문자 번호 13과 같이, 기입 문자 「1」에 대하여 후보 「1」「7」이 래티스에 오르고 있는 경우를 생각한다. 이들의 후보 문자는 각각 기호 「N」「N」으로 변환되며, 이 경우 동일한 기호가 되므로 하나로 병합한다. 기입 문자 번호 14의 기입 문자 「-」에 대해서는 후보 「ノ」「-」가 래티스에 오르고 있으므로, 각각 기호 「ノ」「-」로 변환된다. 이하, 마찬가지의 처리를 반복한다. 변환된 와일드 카드 래티스를 도 15에 도시한다. 이 래티스로서는 기하학적 분리 정보 속성과 필드 카드 문자 래티스가 관련지어져 저장되어 있다. 그리고, 이 와일드 카드 래티스(1113)를 후단의 처리를 위해서 출력한다.
표기 패턴 대조 처리(1104)는 와일드 카드 래티스(1113)를 수취하고, 표기 패턴 사전(1109)을 참조하여 대조 처리를 행한다. 동일 사전은 내부에 도 16에 도시하는 쵸메(丁目) 번지, 건물 번호, 방 번호, 각각의 표기 지식을 표 형식의 데이터로 유지한다. 구체적으로는 쵸메(丁目) 번지 표기, 건물 번호 표기, 방 번호 표기(예를 들면, 「1-2」의 부분의 표기)에는 어떤 형식이 있을 수 있는 것인지를 기억하는 표이다. 도 16에서 기호 「N」은 아라비아 숫자를, 기호 「NN」은 2자릿수의 아라비아 숫자, 기호 「NNN」은 3자릿수의 아라비아 숫자, 「A」는 알파벳 또한 「の」「ノ」「-」는 분리 기호(디리미터)를 나타낸다. 이 도면에는 도시하지 않았지만, 거리구 표기 패턴 리스트에는 상기한 「1番2號」나 종서 시의 「一の二」 등의 표기 방법에 대응하는 패턴도 등록해둔다.
우선, 와일드 카드 래티스(1113)로부터 도 17에 도시한 바와 같은 유한 오토마톤을 만들어서, 거기에 P001, P002, P003, P004에 대응하는 표기 패턴(「N-N」 등)을 유입시켜서, 각 상태 사이를 천이하면서 통과하는 경로에 따른 비용을 적산 한다.
이 처리는 마치(町) 지역명 대조 처리(602)와 마찬가지의 수법을 이용하여 실행한다. 오토마톤에서의 대조의 개시 위치를 제어함으로서, 임의의 위치에서 단어 대조를 행한다. 단지, 이 오토마톤으로는 쵸메(丁目) 번지는 선두에 위치하므로 상태 1만으로부터 단어 대조가 실행된다. 단어 대조의 결과는 도 18에 도시한 바와 같은 단어 래티스로서 출력된다.
단어 대조의 후, 쵸메(丁目) 번지, 건물 번호, 방 번호, 각각의 표기 패턴 단어를 접속하여 쵸메(丁目) 번지, 건물 번호, 방 번호를 늘어놓은 일련의 표기를 생성한다. 여기서, 각 단어의 접속을 문자 후보 래티스에 수반하고 있는 공백 속성이나 행바꿈 속성에 의해서 제어한다. 즉, 접속 대상 표기 패턴 단어의 접속 부분이 숫자끼리인 경우, 접속하는 부분에 공백이나 행바꿈의 속성이 존재하고 있을 때에는 거기에 분리 정보의 속성을 부가하여 접속한다. 반대로 공백이나 행바꿈에 일치하지 않은 경우는 접속하면 중복된 표기 패턴 가설이 생성되게 되므로 접속을 행하지 않는다.
예를 들면, 도 18에서 화살표로 나타낸 단어간 접속은 접속 위치에 공백이나 행바꿈의 속성이 존재하므로 접속 가능하다고 판정된 표기 패턴 후보이다. 가령, 공백 속성(1804)이 존재하지 않는다고 가정한 경우, 단어 1801, 1802, 1803에 주목하면, 경우는 1801과 1803을 접속하면, 1802와 동일한 가설이 생성되어 중복된다. 이와 같이, 숫자끼리를 접속하여 표기 가설을 생성하는 경우는 거기에 분리 정보의 속성이 존재하지 않으면 다른 표기 패턴 단어와 동일한 가설을 생성하게 된다. 따 라서, 표기 패턴 단어의 접속은 행하지 않는다.
상기한 룰에 따라 접속한 결과, 중복된 표기라고 간주되는 경우는 중복되어 있는 표기를 삭제한다. 예를 들면, 「N-」에 「N」을 접속한 표기와 「N-N」은 동일하기 때문에 한쪽을 삭제한다.
또한, 쵸메(丁目) 번지, 건물 번호, 방 번호의 표기의 말미는 공백 혹은 행말에 일치하는 경우가 많다. 그래서, 말미가 공백이나 행바꿈과 일치하지 않는 후보는 부적절한 가설의 가능성이 높다고 하여 페널티를 추가한다.
이들의 표기 패턴 대조의 결과, 도 19에 도시하는 표기 패턴의 후보(1114)가 출력된다. 도면에서 「=」는 기하학적 분리 정보가 거기에 삽입되어 있는 것을 나타내고 있다.
문자열 후보 생성 처리(1105)로는 상위에 올라간 표기 패턴 후보(1114)와 기하학적 분리 정보 속성 부착 래티스(1112)를 입력한 후, 표기 패턴 중의 영숫자 부분을 대응하는 래티스의 후보 문자와 비교하여 원래의 문자로 복귀한 문자열 후보(1115)를 출력한다. 도 20의 (1) ∼ (4)는 각각 도 19의 (1) ∼ (4)에 대응하는 후보이다.
수신처 번호 대조(1106)로는 문자열 후보 생성 처리(1105)에서 얻어진 후보가 실제로 존재하는지의 여부를 수신처 번호 사전(1110)을 참조하여 대조한다. 도 21에 수신처 번호 사전의 구성예를 나타낸다. 도면에 도시한 바와 같이 실제로 존재하는 주소를 계층적으로 사전에 유지하고 있으며, 이 사전에 등록되어 있는 주소 중에 영숫자 복원 처리(1105)로 얻어진 후보가 존재하는지의 여부를 판정한다. 혹 시, 존재한다고 판정되면 후단에 후보를 출력하고, 존재하지 않는다고 판정되면 그 후보는 리젝트된다. 도 20의 후보 중에서는 (1)이 선택되어 수신처 번호 대조 후보(1116)로서 출력된다.
후보 채용 판정(1107)으로는 전단의 대조로 얻어진 후보가 타당한 것인지의 판정을 마치(町) 지역명 인식(204)의 후보 채용 판정(603)과 마찬가지로 행한다.
본 실시예에서는, 기하학적 분리 정보로서 문자 간의 공백이나 행바꿈을 채택하였지만 이들에 한하는 것은 아니고, 색정보, 하부선의 유무, 폰트 형상, 문자의 크기나, 행폭의 차이 등 다른 정보를 사용하여도 좋다.
또한, 기하학적 분리 정보를 이용한 표기 패턴 가설의 생성 방식은 본 실시예에 한하는 것은 아니다. 본 실시예에서는 기하학적 분리 정보가 삽입된 표기 패턴 가설과 삽입되지 않은 표기 패턴 가설의 각각의 가설 생성을 표기 패턴 단어 접속의 제어로 분리 정보를 이용하는 것으로 실현하였다. 예를 들면 이하에 설명하도록 다른 수단에 의해서도 실현할 수 있다.
우선 제1 방식으로서는, 본 실시예와 동일하게 기하학적 분리 정보 속성 래티스를 입력으로 하고 표기 패턴 단어와의 대조를 행한다. 그 후에, 표기 패턴 단어접속의 제어로 분리 정보를 이용하지 않고서 단어끼리를 접속한다. 그 결과, 상위에 올려진 표기 패턴 후보에 대하여 이하의 처리를 실행한다. 특정한 기하학적 분리 정보가 존재하는 장소에 주목하여, 거기에 분리 정보가 존재한다고 가정하여 표기 패턴 단어로 분리 정보를 삽입한 표기 패턴 가설을 추가 생성한다. 예를 들면, 도 19(2)의 예에서는 「N-NN-NNN」의 표기 패턴 단어로부터 「N-N=N-NNN」이나 「N-N=N-NN=N」을 생성한다. 여기서 「=」는 기하학적 정보로부터 생성된 분리 정보를 나타내고 있다.
제2 방식으로서는, 표기 패턴 단어에 공백을 삽입한 단어와 삽입하지 않은 단어를 양쪽 모두 사전에 등록한 후, 특정한 기하학적 분리 정보가 존재하는 장소에 주목한 경우에, 후보 문자 래티스가 해당하는 장소에 예를 들면 공백의 문자 코드를 삽입한 래티스와, 삽입하지 않은 래티스를 각각 생성하여, 전술한 각 후보 문자 래티스와의 대조를 행함으로써 생성하는 것이 가능하다. 즉, 기하학적 분리 정보를 문자 코드로서 나타낸 여러개의 후보 문자 래티스를 생성하여, 각각에 대하여 표기 패턴 대조를 실행하는 방식이다.
제3 방식으로서는, 표기 패턴의 정보를 사전에 저장된 문자열의 정보로서 표현하는 것은 아니고 예를 들면, 특개평 6-124366으로 나타내고 있는 방식에 대해서도 동일한 공백이나 행바꿈의 정보를 이용한 표기 패턴 가설을 생성할 수 있다. 이 발명에서는, 문자 추출의 후보를 위치 관계의 제약을 고려하여 트리 구조로서 표현하고, 또한 그 노드에 대응하는 인식 결과를 글자 종류에 기초하여 라벨을 붙여서, 그 라벨의 열을 검증하여 표기 패턴의 가설을 생성한다. 여기에서, 열을 검증하는 규칙 중에 공백이나 행바꿈을 분리 정보로서 사용하는 열의 룰을 추가해둔다. 또한, 공백이나 행바꿈과 같은 기하학적 분리 정보의 속성을 각 노드에 부여해두고, 열을 검증하여 표기 패턴 가설을 생성할 때에 공백이나 행바꿈의 분리 정보를 삽입한 표기 패턴 가설과 삽입하지 않은 표기 패턴 가설을 각각 생성한다.
제4 방식으로서는, 특개평 8-180142에서 나타내고 있는 바와 같이, 미리 정해진 표기 규칙을 만족하는 카테고리 기호열 후보를 트리 구조로 표기 패턴을 표현하는 방식에 대해서도 마찬가지의 공백이나 행바꿈의 정보를 이용한 표기 패턴 가설을 생성할 수 있다. 이 발명에서는 문자 추출의 후보에 대응하는 인식 결과로부터 글자 종류에 기초하여 카테고리를 부여한다. 그 후, 문자 추출 후보의 위치 관계의 제약과, 카테고리 기호 간의 접속 관계의 제약에 기초하여, 카테고리 기호열 후보를 트리 구조로 표현한다. 그 트리 구조로부터 각 카테고리 기호의 발생원인 문자에 재차 전개하여 문자열 후보를 작성한 후, 쵸메(丁目) 번지 범위 규칙을 적용하여 문자열 후보를 선택한다. 여기에서, 문자 추출의 후보 간에 존재할 수 있는 공백이나 행바꿈과 같은 기하학적 분리 정보의 속성을 문자 추출의 후보에게 부여해두고 카테고리의 열을 검증하여 트리 구조를 생성할 때에, 공백이나 행바꿈의 분리 정보를 삽입한 표기 가설과 삽입하지 않은 표기 가설을 각각 생성한다. 도 22에 생성한 후보 트리(木)의 예를 나타낸다. 점선으로 둘러싼 부분이 본 발명에 의해 추가된다. 도면에서 「N」은 숫자를 나타내는 카테고리 기호, 「Sh」는 「-」을 나타내는 카테고리 기호, 「Si」는 기하학적 분리 정보를 나타내는 카테고리 기호이다.
도 23에 문서 인식 장치를 탑재한 우편 구분기의 개략 구성을 나타낸다.
참조부호(2000)는 우편 구분기의 본 체계(기구부)이며, 다수의 용지를 순차 스캐너에 공급하는 공급 기구(2001)와, 스캐너(2002)와, 스캔한 용지를 구분 기구에 반송하는 반송 기구(2003)와, 용지의 반송처를 결정하는 구분 정보를 중앙의 제어 컴퓨터(2006)로부터 받아서, 용지의 구분을 행하는 구분 기구(2004)로 이루어지며 또한 기구부(2000)에는 복수의 제어용 컴퓨터가 구비되며, 이들의 컴퓨터는 중앙의 제어 컴퓨터(2006)로부터의 지시 하에 기구부(2000) 전체를 제어한다.
참조부호(2007)는 문서 인식 장치이며 스캐너(2002)로부터의 용지에 기재된 수신인 이름 정보를 판독한 화상 데이터를 입력하고, 중앙 처리 장치(CPU)에 출력하는 입력 인터페이스(2008)와, 화상 데이터를 입력하여 수신인 이름 정보의 인식을 행하는 중앙 처리 장치(CPU ; 2009, 2010)와, 수신인 이름 정보 인식 처리를 위한 프로그램이나 인식 대조에 이용되는 사전 지식을 기억하는 메모리(2013)와, 메모리(2013)에 로드하는 프로그램이나 사전 지식을 저장하고 있는 2차 기억 장치(2014)와, 중앙 처리 장치(CPU)에서 인식한 인식 결과 데이터를 중앙의 제어 컴퓨터(2006)에 출력하는 통신 인터페이스(2016)로 이루어진다.
도 22에서는 중앙 처리 장치(CPU)는 2대 나타내고 있지만, 처리 능력이 부족한 경우에는 그 이상의 대수가 실장될 수 있다. 또는 문서 인식 장치(2007)가 필요 대수 병렬로 나열된다. 이들의 문서 인식 장치는 고속으로 판독되는 화상 데이터(2015)를 분담하여 처리한다.
중앙의 제어 컴퓨터(2006)는 통신 인터페이스(2011)로부터 통신 데이터(2016) 중에 포함되는 인식 결과 데이터를 해석하고, 미리 프로그램된 논리에 따라서 구분 정보를 작성하여 구분 기구에 출력한다.
또, 본 실시예에서는 지면 상에 쓰여진 문자 정보를 스캐너로 화상 정보로서 판독하여 문자 인식하는 방법으로서 설명하였지만, 최근에는 전자적인 화상 정보가 이미 컴퓨터 시스템에 축적되어 있는 경우도 많으며, 그와 같은 화상 정보를 인식, 해석하는 경우에 적용할 수 있는 것은 물론이다.
이상과 같이, 본 발명에 따르면, 문자열을 나누기 위한 기하학적 분리 정보 가설이 존재하는 특정한 장소를 주목한 경우에, 거기에 분리 정보가 존재한다고 가정한 표기와, 존재하지 않는다고 가정한 표기의 각각의 표기 패턴 가설을 생성한다.
그 후, 이들의 표기 패턴 가설과 문자 식별 결과로부터 주소 코드를 생성하고 실제의 주소가 저장되어 있는 수신처 번호 사전과의 대조에 의해서 정확하게 해석된 표기를 특정하여 주소를 인식한다. 이들의 처리에 의해, 공백이나 행바꿈 등의 기하학적 분리 정보를 이용하여 표기된 수신인 이름 정보를 정확하게 인식하는 것이 가능해진다.
또한, 도 1의 (3)(4)와 같이, 본 발명에 의해서 처음으로 행바꿈의 정보를 정확하게 해석하여 수신인 이름을 판독할 수 있는 표기는 다이렉트 메일과 같은 동일한 종류의 우편물을 대량으로 작성하는 경우의 수신인 이름에 많다. 우체국에서는 이러한 동일한 종류의 우편물은 통합하여 우편 구분기에 걸려서 구분되는 경우가 많다. 여기서, 우편 구분기는 우편물 상의 수신인 이름 정보를 판독하여 배달처마다 우편물을 구분하는 기능을 갖는다. 따라서, 전술한 것과 같은 우편 구분기의 운용 방법으로는 우편물의 수신인 이름을 판독하여 구분하는 구분율 향상의 효과는 특히 커진다.

Claims (10)

  1. 용지 상에 기재된 수신인 이름 정보를 디지탈 화상 데이터로서 판독하는 화상 판독 수단과,
    상기 디지탈 화상 데이터로부터 상기 수신인 이름 정보를 포함하는 문자행을 추출하여 출력하는 문자행 추출 수단과,
    문자 식별 사전을 구비하고, 상기 추출된 상기 문자행을 입력하고, 문자 정보를 추출하여 상기 문자 식별 사전을 참조하여 문자 인식을 행하고, 복수의 문자 인식 후보를 출력하는 문자 인식 수단과,
    마치(정;町) 지역명 대조 사전을 구비하고, 상기 복수의 문자 인식 후보를 입력하고, 상기 마치(町) 지역명 대조 사전을 참조하여 상기 복수의 문자 인식 후보로부터 마치(町) 지역명을 대조하고, 해당 마치(町) 지역명 후보를 출력하는 마치(町) 지역명 대조 수단과,
    상기 마치(町) 지역명 후보를 입력하고, 상기 마치(町) 지역명 후보를 마치(町) 지역명 인식 결과로서 채용하는지의 여부를 판정하고, 채용한다고 판정된 경우에는 상기 마치(町) 지역명 후보를 마치(町) 지역명 인식 결과로서 출력하는 제1 후보 채용 판정 수단과,
    상기 복수의 문자 인식 후보와 상기 마치(町) 지역명 인식 결과를 입력하고, 기호 또는 숫자로 나타낸 쵸메(丁目) 번지, 건물 번호, 방 번호 중 어느 하나를 포함하는 수신처 번호의 표기 패턴을 유지한 표기 패턴 사전과, 마치(町) 지역명과, 쵸메(정목;丁目) 번지, 건물 번호, 방 번호 중 어느 하나를 포함하는 수신처 번호와의 대응을 유지한 수신처 번호 사전을 구비하고, 상기 복수의 문자 인식 후보에 포함되는 하나 또는 복수의 문자를 상기 표기 패턴 사전과 대조하여 상기 표기 패턴의 대조 결과를 출력하고, 상기 표기 패턴의 대조 결과와 상기 마치(町) 지역명 인식 결과와 상기 수신처 번호 사전을 참조하여, 상기 복수의 문자 인식 후보로부터 쵸메(丁目) 번지, 건물 번호, 방 번호 중 어느 하나를 포함하는 수신처 번호를 대조하고, 상기 수신처 번호 후보를 출력하는 수신처 번호 대조 수단과,
    상기 수신처 번호 후보를 입력하고, 상기 수신처 번호 후보를 수신처 번호 인식 결과로서 채용하는지의 여부를 판정하고, 채용한다고 판정된 경우에는, 상기 수신처 번호 후보를 수신처 번호 인식 결과로서 출력하는 제2 후보 채용 판정 수단을 구비하는 문장 인식 장치에 있어서,
    상기 수신처 번호 대조 수단은, 상기 복수의 문자 인식 후보에 포함되는 하나 또는 복수의 문자의 기하학적 배치 관계를 검출하여, 상기 복수의 문자 인식 후보에 포함되는 문자열끼리를 분리하는 제1 분리 정보 가설과, 상기 복수의 문자 인식 후보에 포함되는 문자열끼리를 분리하지 않은 제2 분리 정보 가설을 생성하는 기하학적 분리 정보 가설 생성 수단을 포함하고, 상기 제1 상기 분리 정보 가설과 상기 제2 상기 분리 정보 가설을 참조하여 수신처 번호를 대조하는 것을 특징으로 하는 문장 인식 장치.
  2. 제1항에 있어서, 상기 수신처 번호 대조 수단이 수신처 번호를 대조하는 상 기 복수의 문자 인식 후보는,
    상기 문자 인식 수단으로부터 출력된 상기 복수의 문자 인식 후보로부터 상기 마치(町) 지역명 대조 수단으로 대조된 상기 복수의 문자 인식 후보를 제외한 것을 특징으로 하는 문장 인식 장치.
  3. 제1항에 있어서, 상기 기하학적 배치 관계는, 상기 복수의 문자 인식 후보에 포함되는 2개의 문자 간의 공백 또는 상기 복수의 문자 인식 후보에 포함되는 행바꿈인 것을 특징으로 하는 문장 인식 장치.
  4. 제1항에 있어서, 상기 기하학적 분리 정보 가설 생성 수단은, 상기 복수의 문자 인식 후보에 포함되는 문자의 문자 화상의 중심을 구하여 인접하는 문자 간의 거리를 측정해서, 상기 두개의 문자 간의 공백을 검출하는 것을 특징으로 하는 문장 인식 장치.
  5. 제1항에 있어서, 상기 수신처 번호 대조 수단은, 상기 복수의 문자 인식 후보에 포함되는 하나 또는 복수의 문자를 기호 또는 숫자로 치환하여 상기 표기 패턴 사전과 대조하는 것을 특징으로 하는 문장 인식 장치.
  6. 용지 상에 기재된 수신인 이름 정보를 디지탈 화상 데이터로서 판독하는 화상 판독 수단과,
    상기 디지탈 화상 데이터로부터 상기 수신인 이름 정보를 포함하는 문자행을 추출 출력하는 문자행 추출 수단과,
    문자 식별 사전을 구비하고, 상기 추출된 상기 문자행을 입력하고, 문자 정보를 추출하여 상기 문자 식별 사전을 참조하여 문자 인식을 행하여, 복수의 문자 인식 후보를 출력하는 문자 인식 수단과,
    마치(町) 지역명 대조 사전을 구비하고, 상기 복수의 문자 인식 후보를 입력하고, 상기 마치(町) 지역명 대조 사전을 참조하여, 상기 복수의 문자 인식 후보로부터 마치(町) 지역명을 대조하고, 상기 마치(町) 지역명 후보를 출력하는 마치(町) 지역명 대조 수단과,
    상기 마치(町) 지역명 후보를 입력하고, 상기 마치(町) 지역명 후보를 마치(町) 지역명 인식 결과로서 채용하는지의 여부를 판정하고, 채용한다고 판정된 경우에는 상기 마치(町) 지역명 후보를 마치(町) 지역명 인식 결과로서 출력하는 제1 후보 채용 판정 수단과,
    상기 복수의 문자 인식 후보와 상기 마치(町) 지역명 인식 결과를 입력하고, 기호 또는 숫자로 나타낸 쵸메(丁目) 번지, 건물 번호, 방 번호 중 어느 하나를 포함하는 수신처 번호의 표기 패턴을 유지한 표기 패턴 사전과, 마치(町) 지역명과, 쵸메(丁目) 번지, 건물 번호, 방 번호 중 어느 하나를 포함하는 수신처 번호와의 대응을 유지한 수신처 번호 사전을 구비하고, 상기 복수의 문자 인식 후보에 포함되는 하나 또는 복수의 문자를 상기 표기 패턴 사전과 대조하여 상기 표기 패턴의 대조 결과를 출력하고, 상기 표기 패턴의 대조 결과와 상기 마치(町) 지역명 인식 결과와 상기 수신처 번호 사전을 참조하여, 상기 복수의 문자 인식 후보로부터 쵸메(丁目) 번지, 건물 번호, 방 번호 중 어느 하나를 포함하는 수신처 번호를 대조하고, 상기 수신처 번호 후보를 출력하는 수신처 번호 대조 수단과,
    상기 수신처 번호 후보를 입력하고, 상기 수신처 번호 후보를 수신처 번호 인식 결과로서 채용하는지의 여부를 판정하고, 채용한다고 판정된 경우에는 상기 수신처 번호 후보를 수신처 번호 인식 결과로서 출력하는 제2 후보 채용 판정 수단을 구비하는 우편 구분기에 있어서,
    상기 수신처 번호 대조 수단은, 상기 복수의 문자 인식 후보에 포함되는 하나 또는 복수의 문자의 기하학적 배치 관계를 검출하여, 상기 복수의 문자 인식 후보에 포함되는 문자열끼리를 분리하는 제1 분리 정보 가설과, 상기 복수의 문자 인식 후보에 포함되는 문자열끼리를 분리하지 않은 제2 분리 정보 가설을 생성하는 기하학적 분리 정보 가설 생성 수단을 포함하고, 상기 제1 상기 분리 정보 가설과 상기 제2 상기 분리 정보 가설을 참조하여 수신처 번호를 대조하는 것을 특징으로 하는 우편 구분기.
  7. 제6항에 있어서, 상기 수신처 번호 대조 수단이 수신처 번호를 대조하는 상기 복수의 문자 인식 후보는,
    상기 문자 인식 수단으로부터 출력된 상기 복수의 문자 인식 후보로부터 상기 마치(町) 지역명 대조 수단으로 대조된 상기 복수의 문자 인식 후보를 제외한 것을 특징으로 하는 우편 구분기.
  8. 제6항에 있어서, 상기 기하학적 배치 관계는, 상기 복수의 문자 인식 후보에 포함되는 두개의 문자 간의 공백 또는 상기 복수의 문자 인식 후보에 포함되는 행바꿈인 것을 특징으로 하는 우편 구분기.
  9. 제6항에 있어서, 상기 기하학적 분리 정보 가설 생성 수단은, 상기 복수의 문자 인식 후보에 포함되는 문자의 문자 화상의 중심을 구하여 인접하는 문자 간의 거리를 측정하여, 상기 두개의 문자 간의 공백을 검출하는 것을 특징으로 하는 우편 구분기.
  10. 제6항에 있어서, 상기 수신처 번호 대조 수단은, 상기 복수의 문자 인식 후보에 포함되는 하나 또는 복수의 문자를 기호 또는 숫자로 치환하여 상기 표기 패턴 사전과 대조하는 것을 특징으로 하는 우편 구분기.
KR1019990049385A 1998-11-10 1999-11-09 문서 인식 장치 및 우편 구분기 KR100571080B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP10318693A JP2000148906A (ja) 1998-11-10 1998-11-10 文書認識装置および郵便区分機
JP1998-318693 1998-11-10

Publications (2)

Publication Number Publication Date
KR20000035325A KR20000035325A (ko) 2000-06-26
KR100571080B1 true KR100571080B1 (ko) 2006-04-14

Family

ID=18101967

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990049385A KR100571080B1 (ko) 1998-11-10 1999-11-09 문서 인식 장치 및 우편 구분기

Country Status (3)

Country Link
JP (1) JP2000148906A (ko)
KR (1) KR100571080B1 (ko)
CN (1) CN1124562C (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100442014B1 (ko) * 2001-12-07 2004-07-30 주식회사 한틀시스템 자동개표 시스템에서의 투표용지 인식 방법
JP4039093B2 (ja) * 2002-03-20 2008-01-30 富士ゼロックス株式会社 画像読取装置、複写装置、およびプログラム
US20120072013A1 (en) * 2010-09-16 2012-03-22 Kabushiki Kaisha Toshiba Character recognition apparatus, sorting apparatus, sorting control apparatus, and character recognition method
JP6334209B2 (ja) * 2014-03-06 2018-05-30 株式会社東芝 認識装置、認識方法およびプログラム
WO2016181458A1 (ja) 2015-05-11 2016-11-17 株式会社東芝 認識装置、認識方法およびプログラム
CN109784308B (zh) * 2019-02-01 2020-09-29 腾讯科技(深圳)有限公司 一种地址纠错方法、装置及存储介质

Also Published As

Publication number Publication date
CN1124562C (zh) 2003-10-15
JP2000148906A (ja) 2000-05-30
CN1254903A (zh) 2000-05-31
KR20000035325A (ko) 2000-06-26

Similar Documents

Publication Publication Date Title
EP0844583B1 (en) Method and apparatus for character recognition
EP1362322B1 (en) Holistic-analytical recognition of handwritten text
KR100324847B1 (ko) 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법
CN113168498A (zh) 语言校正系统及其方法以及系统中的语言校正模型学习方法
JPH05307638A (ja) ビットマップ・イメージ・ドキュメントのコード化データへの変換方法
Sinha et al. Hybrid contextural text recognition with string matching
JPH0684006A (ja) オンライン手書き文字認識方法
JP2007122403A (ja) 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム
Sinha et al. Visual text recognition through contextual processing
US20040117192A1 (en) System and method for reading addresses in more than one language
Kompalli et al. Devanagari OCR using a recognition driven segmentation framework and stochastic language models
KR100571080B1 (ko) 문서 인식 장치 및 우편 구분기
Lehal et al. A post-processor for Gurmukhi OCR
Tateisi et al. Using stochastic syntactic analysis for extracting a logical structure from a document image
JP3201207B2 (ja) 住所読取装置及び方法
Belaid et al. Part-of-speech tagging for table of contents recognition
Baird Recognition technology frontiers
Wenzel Supporting information extraction from printed documents by lexico-semantic pattern matching
Srihari From pixels to paragraphs: the use of contextual models in text recognition
JP2009163689A (ja) 住所認識方法及び装置、並びに郵便あて名区分機
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
Lii et al. Address block location using character recognition and address syntax
KR101025227B1 (ko) 배송분류정보를 생성하는 운송장
JPH10328624A (ja) 文書理解装置および郵便区分機
JPH11300288A (ja) 文書理解装置および郵便区分機

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee