KR100324847B1 - 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법 - Google Patents

수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법 Download PDF

Info

Publication number
KR100324847B1
KR100324847B1 KR1019990003877A KR19990003877A KR100324847B1 KR 100324847 B1 KR100324847 B1 KR 100324847B1 KR 1019990003877 A KR1019990003877 A KR 1019990003877A KR 19990003877 A KR19990003877 A KR 19990003877A KR 100324847 B1 KR100324847 B1 KR 100324847B1
Authority
KR
South Korea
Prior art keywords
recipient name
character
string
pattern
candidate
Prior art date
Application number
KR1019990003877A
Other languages
English (en)
Other versions
KR19990072440A (ko
Inventor
고가마사시
가게히로다츠히코
우에다요
와타나베시게루
후지사와히로미치
Original Assignee
가나이 쓰도무
가부시끼가이샤 히다치 세이사꾸쇼
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가나이 쓰도무, 가부시끼가이샤 히다치 세이사꾸쇼 filed Critical 가나이 쓰도무
Publication of KR19990072440A publication Critical patent/KR19990072440A/ko
Application granted granted Critical
Publication of KR100324847B1 publication Critical patent/KR100324847B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S209/00Classifying, separating, and assorting solids
    • Y10S209/90Sorting flat-type mail

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)
  • Character Input (AREA)

Abstract

우편물, 택배물 등(이하, 우편물 등)의 문서상에 기재된 주소를 리드하는 수신인명 리드장치에 관한 것으로서, 우편물 등상의 수신인명을 리드할 때 여러개의 수신인명영역의 후보에서 정확한 수신인명영역을 고정밀도로 선택하기 위해서, 문자열 저장수단, 표준패턴 저장수단, 화상입력수단, 문자행 추출수단, 부분패턴 분리수단 및 문자열 검출수단을 갖고, 검출된 패턴열에 대응하는 문자코드열을 인식결과로 하는 문자열 인식방법에 있어서, 문자열 검출수단이 부분패턴열의 개시위치에 여러개의 후보를 마련하고, 각각의 개시위치의 후보를 기준으로 해서 인접하는 부분패턴을 재귀적으로 탐색하고, 각각의 부분패턴과 대응하는 문자의 표준패턴의 유사도가 모두 미리 정한 기준값을 상회하고 있는 부분패턴열을 구한다.
이것에 의해, 레이아웃정보만으로는 곤란한 수신인명 영역후보 선택을 고정밀도로 실행할 수 있고, 또 문자방향이 미지인 경우에도 정확하게 수신인명영역을 선택할 수 있으며, 수신인명과 혼동하기 쉬운 문자열이 우편물 등에 기재되어 있는 경우에도 고정밀도이고 또한 고속으로 정확한 수신인명영역을 선택할 수 있다는 효과가 있다.

Description

수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법{ADDRESS READER AND MAILS SEPARATER, AND CHARACTER STRING RECOGNITION METHOD}
본 발명은 우편물, 택배물 등(이하, 우편물 등)의 문서상에 기재된 주소를 리드하는 수신인명(address) 리드장치에 관한 것이다.
우편물 등에 기재되어 있는 수신인명의 리드로서는 일반적으로는 다음과 같은 수순이 알려져 있다.
<1> 우편물 등의 상을 광전변환해서 디지탈화상으로서 리드한다(화상입력).
<2> 수신인명 문자행의 후보 및 문자행 후보의 집합으로 이루어지는 수신인명 영역후보를 추출한다(문자행추출, 수신인명 영역후보추출).
<3> 수신인명 영역후보중의 문자를 리드해서 문자열로서 해석한다(수신인명 인식).
<2>에 적용할 수 있는 종래기술로는 야시로 히로시 외 저'A New Method of Document Structure Extraction using Generic Layout Knowledge'(Proc. of International Workshop on Industrial Applications of Machine Intelligence and Vision(MIV-89))와 같이 보틈업(bottom up)적으로 문자행을 추출한 후에 영역을 추출하는 방식이나 아키야마 외 저「주변분포특징과 선밀도특징을 병용한 반복형 문서화상영역 분리법」(신학기법PRL85-41)과 같이 톱다운(top down)적으로 영역을 추출한 후에 영역중의 문자행을 추출하는 방식 등이 있다.
우편물 등의 경우 상기와 같은 방식에서는 여러개의 수신인명영역의 후보가 생성되는 경우가 많다. 정확한 수신인명영역 즉 우편물 등의 수취인의 주소, 우편번호, 성명을 포함하는 영역을 선택하기 위해서는 나카지마 노보루 외 저'Analysis of Address Layout on Japanese Handwritten Mail'(Proc. of ICPR '96)과 같이 수신인명 영역후보나 문자행 등의 위치나 형상에 관한 정보(레이아웃정보)를 사용한 방식이 있다. 일반적으로 레이아웃정보에 따른 수신인명영역 선택은 문자방향에 의존해서 처리결과가 다르다. 그러나, 레이아웃정보만으로는 문자방향 즉 어느 방향이 문자의 상측방향에 대응하는지를 정확하게 판별하는 것은 곤란하다. 예를 들면, 도 3의 (A)에 도시한 예에서는 「川中市 小ケ谷(가와나카시 오가야)....」가 정확한 수신인명영역이다. 이 경우, 문자행의 위치나 형상만으로는 이 우편물 등이 횡장횡서(橫長橫書)(즉 도면의 상측방향이 문자의 상측방향)인지, 종장종서(縱長縱書)(즉 도면의 우측방향이 문자의 상측방향)인지, 상하역방향의 횡장횡서(즉 도면의 하측방향이 문자의 상측방향)인지 판단할 수 없다. 이 때문에, 레이아웃에 관한 지식을 사용하는 방식만으로는 정확하게 수신인명영역을 선택할 수 없다. 또, 나카오 외 저「수신인명영역 처리장치」(일본국 특허출원 평성8-224550)과 같이 각 수신인명영역중의 문자행후보의 배치를 해석하고 이 수신인명 영역후보의 필두행을 선택하고 필두행중의 패턴을 문자인식해서 주소로서 의미를 갖는지의 여부를 판단하는 것에 의해 수신인명영역을 선택하는 방식이 있다. 그러나, 수신인명의 근방에 문자와 혼동하기 쉬운 노이즈가 있거나 우편번호나 광고 등 수신인명과 혼동하기 쉬운 문자가 존재하는 경우도 많다. 이 때문에, 문자인식을 사용하지 않고 수신인명 영역후보에서 필두행을 검출하는 것은 곤란하다. 또, 필두행을 구하기 위해서는 문자의 방향을 알 필요가 있는 한편, 상술한 바와 같이 레이아웃에 관한 정보만으로는 문자방향을 구하는 것이 어렵다는 문제점이 있다.
본 발명은 상기 과제를 해결하기 위해 이루어진 것으로서, 본 발명의 제1의 목적은 상술한 바와 같은 여러개의 수신인명 영역후보에서 정확한 수신인명영역을 선택하는 처리에 있어서, 노이즈나 불필요한 문자로 인해 필두행을 구하는 것이 곤란한 상황에 있어서도 정확하게 수신인명 문자열에 대응하는 패턴의 열(키패턴열)을 찾아내어 정확한 수신인명영역을 정밀도 좋게 고속으로 선택하는 것이다.
본 발명의 제2의 목적은 상술한 바와 같은 여러개의 수신인명 영역후보에서 정확한 수신인명영역을 선택하는 처리에 있어서, 문자방향이 미지인 경우에 있어서도 정확한 수신인명영역을 정밀도 좋게 고속으로 선택하는 것이다.
본 발명의 제3의 목적은 상술한 바와 같은 여러개의 수신인명 영역후보에서 정확한 수신인명영역을 선택하는 처리에 있어서, 특히 우편물 등에 발신인의 주소, 성명 등이 기재되어 있어 수신인명 영역후보중에 혼동하기 쉬운 후보가 존재하는 경우에도 정확한 수신인명영역을 정밀도 좋게 선택하는 것이다.
도 1은 본 발명의 1실시예의 데이타흐름을 도시한 도면,
도 2는 본 발명의 1실시예의 처리흐름을 도시한 도면,
도 3은 수신인명 영역후보의 예를 도시한 도면,
도 4는 문자방향 선택처리에서 사용되는 사전지식의 예를 도시한 도면,
도 5는 본 발명에서 사용되는 문자열 탐색처리의 데이타흐름을 도시한 도면,
도 6은 분리가설 네트워크의 예를 도시한 도면,
도 7은 식별결과 네트워크의 예를 도시한 도면,
도 8은 식별결과 네트워크를 실현하는 테이블의 형식을 도시한 도면,
도 9는 탐색트리의 테이블의 형식을 도시한 도면,
도 10은 문자열 탐색처리의 처리흐름을 도시한 도면,
도 11은 위치관계 해석처리에서 사용되는 사전지식의 예를 도시한 도면,
도 12는 본 발명의 하드웨어구성을 도시한 도면.
<부호의 설명>
101…문자행 추출수단, 102…수신인명 영역후보 추출수단, 116…수신인명 영역후보 선택수단, 103…수신인명 영역후보 검정수단, 104…방향선택수단,107…문자열 검출수단, 111…패턴열위치 검정수단, 112…위치관계 해석수단, 113…발신원정보 참조수단, 117…수신인명 인식수단, 109…문자표준패턴, 110…키문자열사전.
본 발명의 주된 특징의 하나인 수신인명영역 선택방법에 있어서는 도자와 외 저「접촉한 수서(手書)문자의 자동분리를 실행하는 문자분리방식」(소화 59년도 전자통신학회 종합전국대회 1558) 등의 'Over Segmentation방식'을 확장한 문자열 탐색식을 사용한다. 이것은 문자행중에서 그의 일부의 화상패턴 즉 부분패턴을 분리하고 분리된 부분패턴의 집합중에서 수신인명 문자열에 대응하는 부분패턴의 배열 즉 키패턴열을 탐색적으로 검출하는 것이다. 이 때, 키패턴열의 선두위치에 여러개의 가설을 마련해서 탐색적으로 키패턴열을 구하므로, 수신인명 근방에 노이즈나 불필요한 문자가 있는 경우에도 정확하게 키패턴열을 검출할 수 있다. 이 문자열 탐색방식을 수신인명 영역후보의 선택에 사용하는 것에 의해 대폭적으로 선택의 정밀도를 향상시킬 수 있다.
또, 본 발명의 주된 특징의 하나인 수신인명 영역선택방법에 있어서는 여러개의 문자방향의 가설하에서 문자열탐색을 실행한다. 이 때문에, 수신인명의 문자방향이 미지인 경우에도 정밀도 좋게 수신인명영역을 선택할 수 있다. 또, 이 때, 수신인명영역의 위치에 따라 있을 수 있는 문자방향의 가설을 한정하는 수단을 마련하는 것에 의해서, 고정밀도이고 고속으로 수신인명 영역후보를 선택할 수 있다.
또, 본 발명의 주된 특징의 하나인 수신인명영역 선택방법에 있어서는 키패턴열을 검출한 후 그 결과 얻어진 수신인명의 위치 및 문자방향의 정보를 레이아웃에 관한 사전지식과 대조하는 수단을 마련한다. 이것에 의해, 발신인의 주소 및 성명을 잘못 기재한 영역을 잘못 선택하는 것을 회피할 수 있다. 또, 레이아웃정보에서도 수신인명영역을 특정할 수 없는 경우에는 미리 기억하고 있는 우편물 등의 발신원에 관한 정보를 참조해서 발신인의 주소가 기재되어 있는 수신인명 영역후보를 제외하고 정확하게 수신인명영역을 선택한다.
본 발명의 실시예의 1예에 있어서의 데이타흐름을 도 1의 데이타흐름도를 사용해서 설명한다. 본 명세서에서는 데이타흐름도는 게인색손기법에 따른다(J. 마틴 「소프트웨어구조화기법」근대과학사, ISBN4-7649-0124-2 C3050 P5562E).
본 실시예는 우편물 등의 화상을 입력하고 우편물 등중의 수신인명영역을 검출하여 수신인명을 인식하는 수신인명 리드장치를 예로 하고 있다. 본 실시예의 수신인명 리드장치는 도 1에 도시한 바와 같이 우편물 등의 상을 광전변환해서 디지탈화한 화상을 얻기 위한 화상입력수단(115), 입력한 화상에서 수신인명 문자행의 후보를 추출하는 문자행 추출수단(101), 문자행후보의 집합으로 이루어지는 수신인명 영역후보를 추출하는 수신인명 영역후보 추출수단(102), 수신인명 영역후보에서 가장 정확한 수신인명으로서 확실한 것을 선택하는 수신인명 영역후보 선택수단(116), 선택된 수신인명 영역후보중의 수신인명을 인식하는 수신인명 인식수단(117)로 이루어진다.
수신인명 영역후보 선택수단(116)은 우편물 등의 전체화상 및 수신인명 영역후보의 집합을 입력으로 하고 사전에 기억하고 있는 수신인명영역 금지영역(118), 문자표준패턴(109), 키문자열사전(110), 패턴열 금지영역(120), 위치관계(121), 발신원정보(114)를 참조해서 가장 수신인명으로서 확실한 수신인명 영역후보를 출력한다. 문자표준패턴(109)는 수신인명 영역후보 선택수단(116)중의 문자식별처리에서 사용하기 위한 문자패턴의 표준적인 특징량 벡터의 테이블이다. 키문자열사전(110)은 수신인명영역에 포함되어 있어야 할 문자열 및 키문자열을 저장한다. 키문자열에는 주소문자열의 일부나 「받는 사람」「수취인」「고객」 등을 사용한다. 수신인명영역 금지영역(118)은 문자의 기재의 방향마다 수신인명영역의 존재를 금지하는 영역을 저장한다. 패턴열 금지영역(120)은 문자의 기재의 방향마다 키문자열에 대응하는 부분패턴의 열 즉 키패턴열의 존재를 금지하는 영역을 저장한다. 위치관계(121)에는 여러개의 키패턴열이 검출되었을 때 수신인명영역을 선택하기 위한 키패턴열끼리의 위치관계를 저장한다. 발신원정보(114)는 우편물 등이 투함된 우체통의 위치 등 우편물 등의 발신원에 관한 정보를 저장한다.
수신인명 영역후보 선택수단(116)은 수신인명 영역후보 검정수단(103), 위치관계 해석수단(112), 수신원정보 참조수단(113)으로 이루어진다. 수신인명 영역후보 검정수단(103)은 각 수신인명 영역후보중에서 키문자열에 대응하는 패턴의 열 즉 키패턴열을 탐색하고 수신인명 영역후보를 검정한다. 즉, 수신인명영역중의 적정한 위치에 키패턴열이 검출된 경우에는 상기 수신인명영역을 수리하고, 키패턴열이 검출되지 않은 경우 및 검출되어도 위치가 부적절한 경우에는 거절해서 후보에서 제외한다. 수신인명 영역후보 검정수단(103)이 여러개의 수신인명 영역후보를 수리한 경우에는 또 위치관계 해석수단(112)에 의해 키패턴열 끼리의 위치관계를 해석하고 가장 수신인명으로서 확실한 수신인명 영역후보를 선택한다. 위치관계 해석수단(112)에 있어서 수신인명영역을 선택할 수 없는 경우에는 또 발신원정보 참조수단(113)에 의해 발신원정보(114)를 참조해서 발신인의 주소가 기재되어 있다고 고려되는 수신인명 영역후보를 배제하고 수신인명으로서 가장 확실한 수신인명 영역후보를 선택한다.
수신인명 영역후보 검정수단(103)은 방향선택수단(104)와 1방향가설 수신인명 영역후보 검정수단(106)으로 구성된다. 방향선택수단(104)는 수신인명 영역후보의 위치, 형상, 문자행의 방향에 따라서 문자의 방향으로서 있을 수 있는 것을 선택한다. 문자행의 방향이라는 것은 도 4의 (A)와 같이 문자행이 수평방향인지 도 4의 (E)와 같이 수직방향인지의 구별이고, 문자행 추출수단(101)에 있어서 검출된다. 1방향가설 수신인명 영역후보 검정수단(106)은 방향선택수단(104)가 출력한 문자방향을 가정하고 키패턴열을 수신인명 영역후보중에서 탐색한다. 만일, 방향선택수단(104)가 있을 수 있는 문자방향을 1개로 제한하지 않는 경우에는 문자방향의 후보마다 1방향가설 수신인명 영역후보 검정수단(106)을 기동시킨다.
1방향가설 수신인명 영역후보 검정수단(106)은 지정된 문자방향의 키패턴열의 유무에 따라서 수신인명 영역후보를 검정하는 처리에 의해 문자열 검출수단(107)과 패턴열위치 검정수단(111)로 구성된다. 문자열 검출수단(107)은 수신인명 영역후보중의 문자행에서 부분패턴을 분리하고, 각각의 부분패턴과 기준패턴의 유사도를 조사하는 것에 의해 키패턴열을 검출한다. 패턴열 위치검정(111)은 패턴열 금지영역을 참조해서 검출된 키패턴열의 위치 및 문자방향이 타당한지의 여부를 조사하고, 타당하지 않는 경우에는 상기 키패턴열을 후보에서 제외한다.
본 실시예는 수신인명 영역선택후 수신인명 인식수단(117)을 기동하는 구성으로 되어 있지만, 키문자열 사전에 리드대상의 모든 문자열을 저장하는 것에 의해 수신인명 영역후보 리드의 결과를 그대로 수신인명 인식결과로서 유용하는 것도 가능하다. 또, 키패턴열의 상세한 위치나 문자방향을 수신인명 인식수단(117)에 통지하는 것에 의해 수신인명 인식수단(117)에 있어서 필요한 처리의 일부를 할애하는 것도 가능하다. 또, 문자방향을 검출하는 것만이 목적이라면 키문자열에는 1문자 또는 2문자의 짧은 단어를 다수 사용해서 발신원정보 참조수단(113)을 할애해도 좋다.
본 실시예의 수신인명영역 선택수단의 처리흐름을 도 2에 도시한다. 우선, 제어루프(203)에 있어서, 모든 수신인명 영역후보에 대해서 수신인명 영역후보 방향선택처리(204)를 실행한다. 그 결과, 얻어진 문자방향의 후보를 사용해서 이 수신인명영역에 대해 문자열 탐색처리(207)을 실행한다. 그 결과 얻어진 패턴열의 후보에 대해서 패턴열위치 검정처리(211)을 실행하고, 위치가 부적절한 키패턴열은 후보에서 삭제한다. 제어루프(203)의 종료후 여러개의 수신인명 영역후보가 수리된 경우에는 위치관계 해석처리(212)에 의해 수리된 수신인명 영역후보의 위치관계를 해석하고 수신인명영역을 선택한다. 만일, 위치관계 해석처리(212)에 의해 수신인명영역을 결정할 수 없다고 판단된 경우에는 또 발신원정보 참조처리(213)에 있어서 우편물 등의 발신원에 관한 정보를 참조해서 발신인의 주소가 기재되어 있다고 고려되는 수신인명 영역후보를 배제하고 가장 수신인명으로서 확실한 수신인명 영역후보를 선택한다.
이하, 도 3∼도 11을 사용해서 본 실시예의 각 부를 설명한다.
문자행 추출수단(101), 수신인명 영역후보 추출수단(102)의 입출력의 예를 도 3에서 설명한다. 도 3의 (A)는 우편물 등의 전체화상의 예이다. 이것에서 예를 들면 야시로 히로시 외 저'A New Method of Document Structure Extraction using Generic Layout Knowledge' (Proc. of International Workshop on Industrial Applications of Machine Intelligence and Vision (MIV-89))와 같은 기지의 방식으로 처리하면 도 3의 (B), (C)와 같이 2개의 수신인명 영역후보가 얻어진다. 도 3의 (B), (C)의 가장 외측의 직사각형은 수신인명 영역후보의 좌표를 나타내고, 그 내측의 세선의 직사각형은 추출된 문자행의 좌표를 나타낸다. 이 후, 「수신인명 영역후보」라는 것은 도 3의 (B), (C)에 도시한 바와 같은 수신인명영역의 좌표, 수신인명 영역후보에 포함되는 문자행의 좌표, 문자행의 방향, 문자행에 포함되는 연결성분(연결한 흑화소의 집합) 등의 수신인명영역후보에 관한 정보의 총칭으로 한다. 이 예에서는 도 3의 (B)가 정확한 수신인명의 영역이다. 그러나, 가령 문자방향이 미지인 것으로 하면 도 3의 (B), (C) 중의 어느 것이 수신인명인지를 판단하는 것은 곤란하다. 또, 수신인명 부근에 광고 등의 불필요한 문자나 노이즈가 존재하는 경우도 많다. 예를 들면 도 3의 (B)에서는 문자행의 근방의 노이즈를 문자행의 일부로 잘못 간주해 버리고 있다. 또, 이 예에서는 불필요한 문자나 노이즈의 집합이 수신인명의 1행으로 잘못 간주되어 수신인명 영역후보에 포함되어 있다. 이 때문에, 레이아웃의 정보만으로 수신인명 영역후보중에서 수신인명이 기재되어 있다고 예상되는 행(나카오 외 「수신인명영역 처리장치」(일본국 특허출원 평성8-224550)에서의 필두행)을 검출하는 것은 곤란하다.
문자방향 선택수단(104)는 수신인명 영역후보의 좌표 및 수신인명 영역후보중의 문자행의 방향에 의해 있을 수 있는 문자방향을 구한다. 도 4는 문자방향 선택수단(104)가 참조하는 수신인명영역 금지영역(118)의 예를 모식적으로 도시한 도면이다. 수신인명영역 금지영역(118)은 하기와 같은 우편물 등상에서의 수신인명의 배치에 관한 사전지식을 반영한 것이다.
·횡장의(가로로 긴) 우편물 등에 횡서로 수신인명이 기재되는 경우(도 4의 (A) 또는 (B)의 경우), 수신인명은 우편물 등의 아래쪽에 쓰여지는 일은 없다.
·종장의(세로로 긴) 우편물 등에 종서로 수신인명이 기재되는 경우(도 4의 (C) 또는 (D)의 경우), 수신인명이 우편물 등의 좌측에 쓰여지는 일은 없다.
·종장의 우편물 등에 횡서로 수신인명이 기재되는 경우(도 4의 (E) 또는 (F)의 경우), 수신인명의 위치는 우편물 등의 하측에 쓰여지는 일은 없다.
이러한 사전지식을 이용해서 본 실시예에서는 다음과 같이 금지영역을 정한다.
(A) 문자행방향이 X축과 평행하고 문자방향이 상측방향인 경우
Y > W/3 (W:우편물 등의 폭)
(B) 문자행방향이 X축과 평행하고 문자방향이 하측방향인 경우
Y < W/3
(C) 문자행방행이 X축과 평행하고 문자방향이 우측방향인 경우
Y < W/2
(D) 문자행방향이 X축과 평행하고 문자방향이 좌측방향인 경우
Y > W/2
(E) 문자행방향이 Y축과 평행하고 문자방향이 우측방향인 경우
X > L/3 (L:우편물 등의 길이)
(F) 문자행방향이 Y축과 평행하고 문자방향이 좌측방향인 경우
X < L·2/3
(G) 문자행방향이 Y축과 평행하고 문자방향이 상측방향인 경우
우편물 등상의 모든 영역
(H) 문자행방향이 Y축과 평행하고 문자방향이 하측방향인 경우
우편물 등상의 모든 영역
문자방향 선택수단(104)는 각 문자방향의 가설마다 수신인명영역이 완전히 금지영역에 포함되어 있는지의 여부를 조사하고, 수신인명영역이 금지영역에 포함되지 않는 문자방향을 문자방향의 후보로서 선택한다. 예를 들면, (D)의 경우에 수신인명영역후보가 금지영역에 포함되어 있으므로, (D)와 같은 위치에 있는 문자행방향이 X축과 평행한 수신인명 영역후보에 대해서는 문자방향이 좌측방향이라는 가설은 기각하고 상측방향, 하측방향, 우측방향을 문자방향의 후보로 한다.
다음에, 문자열 검출수단(107)을 도 5∼도 10을 사용해서 상세하게 설명한다.
우선, 분리가설 네트워크 생성수단(502)에 있어서 분리가설 네트워크를 생성한다. 분리가설 네트워크라는 것은 도 6에 도시한 바와 같이 문자로서 있을 수 있는 크기, 형상을 갖는 문자행중의 부분패턴의 순서관계를 네트워크로 표현한 것이다. 네트워크의 마디점이 패턴의 경계 또는 행의 단락부(「5」와 「日(일)」의 사이 등)에 대응하고, 변이 패턴에 대응하고 있다.
다음에, 문자식별수단(503)에 있어서 분리가설 네트워크상의 각 패턴을 문자식별한다. 문자식별에는 도리와키 저「인식공학」(ISBN4-339-01059-6, 텔레비젼학회)pp. 52-53, pp. 179-181)에 기재된 바와 같은 패턴정합법에 따른 방식을 사용한다. 즉, 입력인 부분패턴에서 특징벡터를 생성하고 각 표준패턴의 특징벡터와의 유사도를 조사해서 유사도가 일정값 이상인 것을 후보문자로서 선택한다. 유사도가 일정값 이상으로 되는 것이 없는 경우에는 후보문자를 출력하지 않는다. 이 때, 각 부분패턴은 지정된 문자방향하에서 표준패턴과 일치시킨다. 예를 들면, 문자방향이 우측방향으로 지정되어 있는 경우에는 패턴을 좌회전으로 90도 회전시켜 특징벡터를 생성하고 표준패턴과 일치시킨다. 문자식별의 결과는 도 7에 도시한 바와 같은 문자식별결과와 그 순서관계를 네트워크로 표현한 것(식별결과 네트워크)에 저장한다. 네트워크의 마디점이 패턴의 경계 또는 행의 경계에 대응하고, 변이 문자식별의 결과 얻어진 후보문자의 1개에 대응하고 있다. 마디점에는 각각 동그라미속의 수자와 같은 고유의 정수(식별자)를 부여한다. 1개의 패턴에서 2개 이상의 후보문자가 얻어진 경우 2개의 마디점 사이에 후보문자분의 변을 긋는다. 마디점2와 마디점5 사이의 예에서는 「川」에 해당하는 패턴을 문자식별한 결과 「川」과 「小」의 2개의 후보문자가 얻어졌기 때문에, 식별결과네트워크상에 2개의 변이 그어져 있다. 한편, 마디점1과 마디점2 사이와 같이 부분패턴이 존재해도 문자식별에서 후보문자가 하나도 나오지 않았던 경우에는 식별결과 네트워크상에는 변은 그어지지 않는다.
식별결과 네트워크는 도 8에 도시한 바와 같은 식별결과테이블에 의해 실현된다. 테이블중의 1레코드는 1개의 후보문자 즉 식별결과 네트워크상의 1개의 변에 대응한다. 각 레코드는 변의 시점 및 종점의 식별자(pnd, nnd), 식별결과 문자코드(cd), 문자식별결과의 확신도(crd), 패턴정보로의 포인터(ptn)로 구성된다. 패턴정보에는 모리 저「패턴인식」(ISBN4-88552-075-4 C3055, 전자정보 통신학회)에 기재되어 있는 바와 같은 형식의 체인코드로 기술된 패턴의 형상과 패턴의 위치를 저장한다. 확신도에는 예를 들면 표준패턴과 입력패턴의 유사도를 사용한다.
식별결과경로 탐색수단(504)는 오하라 저「인공지능의 기초지식」(ISBN4-7649-0145-5, 근대과학사)에 기재되어 있는 바와 같은 폭우선탐색의 알고리듬에 따라서 키문자열 즉 키문자열사전(110)에 저장되어 있는 문자열을 식별결과 네트워크중에서 탐색한다. 예를 들면, 도 7의 식별결과 네트워크에서 키문자열「川中市小ケ谷(가와나카시 오가야)」을 탐색할 때 생성되는 탐색트리의 예를 도 9의 (A)에 도시한다. 도면중의 동그라미속에 쓰여진 숫자는 식별결과 네트워크상에서의 마디점의 식별자를 나타낸다. 또, 변상에 쓰여진 문자는 대응하는 식별결과의 문자코드를 나타낸다. 이 경우, 키문자열의 선두문자「川」에 대응하는 식별결과가 2개소에서 검출되었기 때문에, (901), (902)와 2개로 분할된 트리가 생성된다. 또, 마디점의 식별자를 0-3으로 탐색한 경우 및 2-5-6-8로 탐색한 경우에는 그 이후에 키문자열에 대응하는 식별결과가 식별결과 네트워크상에 존재하지 않았기 때문에, 탐색이 도중에서 정지하고 있다. 2-5-6-7-9-10-11로 탐색한 경우에는 키문자열의 최후까지 대응되고 있다. 이와 같이 키문자열의 최후까지 대응된 경우, 이 키문자열이 수리되었다고 간주하고 탐색경로에 대응하는 부분패턴의 열을 키패턴열로서 출력한다.
식별결과경로 탐색수단(504)에서는 도 9의 (B)에 도시한 바와 같은 탐색트리테이블로 탐색트리를 표현한다. 탐색트리테이블의 1레코드는 1개의 탐색트리의 가지에 대응한다. 각 레코드는 탐색트리상에서의 친(parent) 가지로의 포인터(prv), 탐색깊이(dpt), 식별결과데이타로의 포인터(pcls)로 이루어진다. 가지가 탐색트리의 뿌리에 인접하고 있는 경우((901)의 가지 0-2, (902)의 가지 2-5)는 prv의 값은 NULL로 한다. dpt는 주목하고 있는 가지가 키문자열의 몇문자째에 대응하고 있는지를 나타내는 값으로서 문자열의 선두를 0문자째로 센다.
식별결과경로 탐색수단(504)에 있어서의 처리흐름을 도 10에 도시한다. 본 도면중에서 각 레코드중의 데이타항목의 참조방법은 C언어의 사양에 준거한다. 우선, 스텝(1001)에서 포인터pc(주목하고 있는 탐색트리 가지데이타로의 포인터)와 pw(신규탐색트리 가지데이타 라이트지)를 탐색트리테이블 선두에 세트한다. 이후의 처리는 제어루프(1002)에 의해 키문자열을 1개씩 처리하도록 제어된다. 각각 키문자열마다 우선 제어루프(1003)에 의해 식별결과 테이블을 주사하고, 식별결과 문자코드가 키문자열의 선두의 문자와 일치하는 것을 검출한다. 만일 검출된 경우에는 이 식별결과에 대응하는 가지를 생성한다. 이 스텝에서 생성된 가지의 시점의 마디점이 탐색트리의 뿌리에 상당한다. 다음에, 제어루프(1004)에 있어서 pc와 pw가 일치하지 않는 한 이하의 처리를 계속한다. 만일, 탐색깊이가 키문자열길이보다 1 작은 즉 주목하고 있는 가지가 키문자열의 최후의 문자에 대응하는 것이면, 키문자열이 검출된 것으로 하고 탐색경로에 대응하는 패턴의 열을 키패턴열로서 출력한다. 그렇게 하지 않으면, 제어루프(1005)에 있어서 식별결과 테이블을 주사해서 식별결과 문자코드가 키문자열의 다음의 문자와 일치하고 또한 식별결과 네트워크상에서 인접하고 있다는 등의 식별결과를 검출한다. 해당하는 식별결과 데이타가 검출되었으면 이것에 대응하는 탐색트리의 가지를 생성한다. 어느 하나의 처리가 완료된 후 pw를 증가시킨다. 이상이 제어루프(1004)의 처리이다. 이러한 처리를 반복해서 pc와 pw가 일치한 경우 즉 탐색도중의 마디점이 없어진 경우에는 루프를 종료하고 다음의 키문자열을 처리한다.
만일, 식별결과경로 탐색처리에 있어서 여러개의 후보가 출력된 경우 키패턴열선택수단(505)에 의해 최적인 키패턴열을 선택한다. 선택방법으로는 예를 들면 문자식별결과의 확신도의 총합이 가장 큰 것을 선택하는 등의 방식이 있다.
이상에 의해 문자열 검출수단(107)의 설명을 종료하고 이하에서 본 실시예의 나머지 각 부를 설명한다.
문자열 검출수단(107)에 있어서, 검출된 키패턴열을 패턴열위치 검정수단(111)이 그 위치가 타당한지의 여부를 판정한다. 패턴열위치 검정수단(111)은 패턴열 금지영역(120)을 참조해서 검출된 키패턴열이 해당하는 문자열방향 및 문자방향의 금지영역에 완전히 포함되는지의 여부를 조사하고 완전히포함되는 경우에는 이 키패턴열을 후보에서 제외한다. 패턴열 금지영역(120)은 상기 수신인명영역 금지영역(118)과 마찬가지의 형식으로 기억한다. 예를 들면, 도 4에서 가령 [ABC]로 쓰여진 부분이 키패턴열인 것으로 하면, (D)와 (F)의 후보는 제외된다. 한편, 금지영역에 포함되지 않았던 키패턴열은 패턴열 위치검정(111)에 의해 수리된 것으로 한다.
만일 수신인명 영역후보 검정수단(103)에 의해 여러개의 수신인명 영역후보에서 키패턴열이 수리된 경우, 위치관계 해석수단(112)에 있어서 수신인명의 위치에 관한 사전지식에 따라서 수신인명 영역후보를 선택한다. 위치관계 해석수단(112)에서 사용하는 사전지식에는 다음과 같은 것이 있다.
·도 11의 (A)와 같이 횡장횡서로 2개의 수신인명 영역후보에서 키문자열사전(110)중의 문자열이 검출된 경우, 좌측상부에 있는 것이 수신인명이고 우측하부의 것이 발신인이다.
·도 11의 (B)와 같이 1개의 수신인명 영역후보가 극단적으로 좌측상부에 편중되어 있고, 다른 하나가 우편물 등의 중앙에 있는 경우에는 중앙의 것이 수신인명이다.
·도 11의 (C)와 같이 종장종서로 2개소에서 키문자열사전중의 문자열이 검출된 경우에는 우측에 있는 것이 수신인명이다.
·도 11의 (D)와 같이 종장횡서로 2개소에서 키문자열사전중의 문자열이 검출된 경우에는 상측에 있는 것이 수신인명이다. 이러한 사전지식을 이용하여 다음과 같은 룰을 위치관계 기억수단(121)에 기억하고 어느 하나의 룰의 사전조건이 참으로 된 경우에 이 룰에 따라 수신인명영역을 선택한다.
(A) 횡장횡서의 경우
(x1, y1) : 수신인명 영역후보 1의 중심의 좌표
(x2, y2) : 수신인명 영역후보 2의 중심의 좌표
L : 우편물 등의 길이로 하고,
x1<x2 또한 y1<y2 또한 |x2-L/2|>L/5
이면 수신인명 영역후보 1을 선택
(B) 횡장횡서에서
x1<x2 또한 y1<y2 또한 |x2-L/2|<L/5
이면 수신인명 영역후보 2를 선택
(C) 종장종서에서
y1>y2
이면 수신인명 영역후보 1을 선택
(D) 종장횡서에서
x1>x2
이면 수신인명 영역후보 1을 선택
한편, 도 11의 (E)와 같이 어느 하나의 위치관계의 사전조건도 만족시키지 않고 수신인명인지 판단할 수 없는 경우에는 위치관계 해석수단(112)는 판정불능을 출력한다. 또한, 「수취인」 등의 특정의 키문자열이 검출되어 있었던 경우에는 수신인명 영역후보의 위치에 관계없이 키문자열이 검출된 수신인명 영역후보를 선택한다.
발신원정보 참조수단(113)은 만일 위치관계 해석수단(112)가 유일한 수신인명 영역후보를 선택한 경우에는 이것을 수신인명 영역후보 선택결과로서 출력한다. 만일, 위치관계 해석수단(112)에 있어서 수신인명 영역후보가 판정불능으로 된 경우에는 발신원정보(114)를 비교하고 발신원과 일치하지 않는 주소문자열이 키문자열로서 검출되어 있지 않은지의 여부를 조사한다. 만일, 해당하는 키문자열이 1개뿐이라면, 그 키문자열이 검출된 수신인명 영역후보를 수신인명영역후보 선택결과로서 출력한다. 그렇지 않으면 수신인명 영역선택수단(116)은 처리실패를 상위로 통지해서 종료한다.
이상에 의해 본 실시예의 각 부의 설명을 종료한다.
본 발명에 있어서의 수신인명 리드장치를 포함하는 우편구분기의 구성을 도 12에 도시한다. 상술한 본 발명은 예를 들면 동일도면과 같은 우편물 등 구분기의 수신인명 리드를 담당하는 수신인명 리드장치(1205)에 적용된다. 도면중의 굵은 선은 우편물 등의 흐름을 나타낸다. (1201)은 화상입력을 담당하는 스캐너이다. 스캐너(1201)은 문자행 추출 및 수신인명 영역후보추출을 담당하는 전처리장치(1204)에 접속한다. 전처리장치(1204)는 입출력용 인터페이스(1207)을 거쳐서 인식장치의 버스(1210)에 접속한다. (1202)는 주소리드시간을 확보하기 위해 우편물 등 반송로상에 마련하는 딜레이라인(지연용 반주로)이다. (1203)은 주소리드결과에 따라서 우편물 등을 구분하는 분류기(sorter)이다. 분류기(1203)은 입출력용 인터페이스(1208)을 거쳐서 인식장치의 버스(1210)에접속한다. (1206)은 본 발명에 필요한 프로그램, 문자식별용 표준패턴, 주소트리 등을 저장해 두기 위한 외부기억장치이다. 외부기억장치에는 하드디스크 등을 사용한다. 외부기억장치는 입출력용 인터페이스(1209)를 거쳐서 인식장치의 버스(1210)에 접속한다.
수신인명 리드장치(1205)에는 인식장치내부의 각 부분을 접속하기 위한 버스(1210), 인식장치 전체의 제어 및 주소식별처리를 담당하는 연산처리장치(1211), 외부의 장치와의 입출력을 담당하는 입출력용 인터페이스(1207), (1208), (1209), 주소식별에 필요한 프로그램, 테이블, 사전 등을 저장하기 위한 메모리(1212)를 구비한다.
장치 기동시에는 우선 외부기억장치(1206)에서 프로그램, 표준패턴사전, 키문자열사전이 메모리(1212)로 로드된다. 로드완료후 전처리장치(1204)에서 수신인명 영역후보가 수신인명 리드장치(1205)로 문자행화상이 공급되면, 문자행화상은 메모리(1212)에 복사된다. 또, 연산처리장치(1211)은 본 발명에서 설명한 방식에 따라 분리가설 네트워크, 탐색트리를 메모리(1212)상에 생성하면서 키문자열을 탐색해서 수신인명영역을 선택하고 선택결과를 수신인명 인식장치(1213)로 발신한다. 수신인명 인식장치(1213)은 선택된 수신인명영역중의 수신인명을 리드하고 분류기(1203)으로 인식결과를 발신한다. 분류기(1203)은 인식결과에 따라서 우편물 등을 구분한다.
수신인명 주소문자열이나 「수취인」 등, 수신인명을 특정하는 단서로 되는문자열을 탐색적으로 리드하는 것에 의해 레이아웃정보만으로는 곤란한 수신인명 영역후보 선택을 고정밀도로 실행할 수 있다. 또, 문자방향이 미지인 경우에도 정확하게 수신인명영역을 선택할 수 있다. 또, 문자방향의 가설과 패턴열의 위치를 대조하는 것에 의해 수신인명과 혼동하기 쉬운 문자열이 우편물 등에 기재되어 있는 경우에도 고정밀도이고 또한 고속으로 정확한 수신인명영역을 선택할 수 있다.

Claims (12)

  1. 인식대상의 문자코드열을 1개 이상 저장하는 문자열 저장수단,
    인식대상의 문자코드열의 각 문자의 표준패턴을 저장하는 표준패턴 저장수단,
    문서의 화상을 전기신호로 변환해서 입력하는 화상입력수단,
    화상상에서 문자행을 추출하는 문자행 추출수단,
    문자행후보의 화상에서 부분패턴을 분리하는 부분패턴 분리수단 및
    문자행중에서 연속되어 있는 부분패턴의 열로서 각각의 부분패턴이 인식대상인 문자코드열의 1개에 포함되는 각각의 문자와 유사한 부분패턴열을 부분패턴 분리수단의 출력에서 검출하는 문자열 검출수단을 갖고,
    검출된 패턴열에 대응하는 문자코드열을 인식결과로 하는 문자열 인식방법에 있어서,
    문자열 검출수단이 부분패턴열의 개시위치에 여러개의 후보를 마련하고, 각각의 개시위치의 후보를 기준으로 해서 인접하는 부분패턴을 재귀적으로 탐색하고, 각각의 부분패턴과 대응하는 문자의 표준패턴의 유사도가 모두 미리 정한 기준값을 상회하고 있는 부분패턴열을 구하고, 수신인명 영역후보 선택수단에 의해 이 부분패턴열이 검출된 영역을 수신인명 영역후보로 하는 것을 특징으로 하는 문자열 인식방법.
  2. 우편물 등상에 기재된 화상정보를 전기신호로 변환해서 입력하는 화상입력수단,
    화상상에서 수신인명 주소가 기재되어 있는 문자행의 후보를 추출하는 문자행 추출수단,
    문자행후보의 집합으로 이루어지는 수신인명 영역후보를 적어도 1개 이상 추출하는 수신인명 영역후보 추출수단,
    수신인명 영역후보에서 기재되어 있는 수신인명 주소를 리드하는 수신인명 인식수단을 갖는 수신인명 리드장치에 있어서,
    미리 정해진 문자코드의 배열인 키문자열을 1개 이상 저장하는 키문자열 저장수단,
    키문자열의 각 문자코드의 표준패턴을 저장하는 표준패턴 저장수단,
    문자행후보의 화상에서 부분패턴을 분리하는 부분패턴 분리수단,
    문자행중에서 연속해서 배치되어 있는 부분패턴의 열로서 각각의 부분패턴이 1개의 키문자열중의 각각의 문자에 대응하고, 지정된 문자방향의 가정하에서 각각의 부분패턴과 대응하는 문자의 표준패턴의 유사도가 모두 미리 정한 기준값을 상회하고 있는 것 즉 키패턴열을 부분패턴 분리수단의 출력에서 검출하는 문자열 검출수단 및
    적어도 1개 이상의 문자방향을 가정해서 문자열 검출수단을 기동하고 키패턴열이 검출된 수신인명 영역후보를 선택해서 수신인명 인식수단의 입력으로 하는 수신인명 영역후보 선택수단을 갖는 것을 특징으로 하는 수신인명 리드장치.
  3. 제2항에 있어서,
    리드대상의 주소문자열 중의 적어도 1개의 적어도 일부분을 키문자열 저장수단중에 저장하는 것을 특징으로 하는 수신인명 리드장치.
  4. 제2항에 있어서,
    문자의 기재방향마다 수신인명영역의 존재를 금지하는 영역을 저장하는 수신인명영역 금지영역 기억수단과
    각 수신인명 영역후보에 대해서 이 수신인명 영역후보의 위치가 수신인명영역 금지영역 기억수단에 의해 지정된 금지영역의 조건을 만족시키지 않는 문자방향의 후보를 구하는 문자방향 선택수단을 갖고,
    수신인명 영역후보 선택수단이 상기 문자방향 선택수단에 의해 얻어진 문자방향의 후보마다 문자방향을 가정해서 문자열 검출수단을 기동하고, 키패턴열이 검출된 수신인명 영역후보를 선택해서 수신인명 인식수단의 입력으로 하는 것을 특징으로 하는 수신인명 리드장치.
  5. 제2항에 있어서,
    문자의 기재방향마다 키패턴열의 존재를 금지하는 영역을 저장하는 패턴열 금지영역 기억수단과
    검출된 키패턴열의 위치와 문자열 검출수단에 의해 가정한 문자방향의 관계가 패턴열 금지영역 기억수단에 저장된 금지영역의 조건을 만족시키는지의 여부를 판단하는 패턴열위치 검정수단을 갖고,
    수신인명 영역후보 선택수단이 패턴열위치 검정수단에 의해 금지영역의 조건을 만족시키지 않는다고 판단된 키패턴열이 검출된 수신인명 영역후보를 선택하고 수신인명 영역수단의 입력으로 하는 것을 특징으로 하는 수신인명 리드장치.
  6. 제2항에 있어서,
    1개의 수신인명 영역후보에서 키패턴열이 검출된 경우에는 수신인명 영역후보 선택수단이 상기 수신인명 영역후보를 선택하고,
    여러개의 수신인명 영역후보에서 키패턴열이 검출된 경우에는 미리 정해진 키패턴열 끼리의 위치관계에 따라 수신인명 영역후보를 선택하는 것을 특징으로 하는 수신인명 리드장치.
  7. 제2항에 있어서,
    문자열 검출수단에 의해 얻어진 키패턴열의 위치에 따라서 수신인명 인식수단이 수신인명영역중의 리드대상의 패턴을 제한하는 것을 특징으로 하는 수신인명 리드장치.
  8. 제2항에 있어서,
    문자열 검출수단에 의해 얻어진 키패턴열이 가정한 문자방향에 따라 수신인명 인식수단이 수신인명영역의 문자를 리드하는 것을 특징으로 하는 수신인명 리드장치.
  9. 제2항에 있어서,
    키문자열의 적어도 1개가 「받는 사람」 또는 「수취인」 또는 「고객」을 포함하는 것을 특징으로 하는 수신인명 리드장치.
  10. 제2항에 있어서,
    처리대상의 우편물 등의 발신원에 관한 정보를 저장하는 발신원정보 저장수단을 갖고, 여러개의 키패턴열이 검출된 경우에는 상기 발신원정보 저장수단을 참조해서 발신원이 아닌 주소문자열에 대응하는 키패턴열을 포함하는 수신인명 영역후보를 선택하는 것을 특징으로 하는 수신인명 리드장치.
  11. 우편물 등에 기재된 수신인명정보를 리드하고 인식결과에 따라 우편물 등을 수신지별로 구분하거나 또는 인식결과를 바코드로 우편물 등에 인쇄하는 우편구분기에 있어서,
    수신인명정보를 리드하기 위한 장치로서 특허청구범위 제2항∼제10항 중의 어느 한항에 기재된 수신인명 리드장치를 구비하는 것을 특징으로 하는 우편구분기.
  12. 우편물 등에 기재된 수신인명정보를 리드하고 인식결과에 따라서 우편물 등을 수신지별로 구분하거나 또는 인식결과를 바코드로 우편물 등에 인쇄하는 우편구분기에 있어서,
    수신인명정보를 리드하기 위한 수단으로서 특허청구범위 제1항에 기재된 문자열 인식방법을 구비하는 것을 특징으로 하는 우편구분기.
KR1019990003877A 1998-02-10 1999-02-05 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법 KR100324847B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP02807798A JP3246432B2 (ja) 1998-02-10 1998-02-10 宛名読取り装置および郵便物等区分機
JP1998-28077 1998-02-10

Publications (2)

Publication Number Publication Date
KR19990072440A KR19990072440A (ko) 1999-09-27
KR100324847B1 true KR100324847B1 (ko) 2002-02-20

Family

ID=12238719

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990003877A KR100324847B1 (ko) 1998-02-10 1999-02-05 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법

Country Status (4)

Country Link
US (2) US6291785B1 (ko)
JP (1) JP3246432B2 (ko)
KR (1) KR100324847B1 (ko)
CN (1) CN1168040C (ko)

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1159705B1 (de) * 1999-02-12 2002-09-11 Siemens Dematic AG Verfahren zum lesen von dokumenteintragungen und adressen
DE19933984C2 (de) * 1999-07-20 2001-05-31 Siemens Ag Verfahren zur Bildung und/oder Aktualisierung von Wörterbüchern zum automatischen Adreßlesen
US7060925B1 (en) * 1999-08-31 2006-06-13 United States Of America Postal Service Apparatus and methods for processing mailpiece information by an identification code server
US6977353B1 (en) 1999-08-31 2005-12-20 United States Postal Service Apparatus and methods for identifying and processing mail using an identification code
US7081595B1 (en) 1999-08-31 2006-07-25 United States Postal Service Apparatus and methods for processing mailpiece information in a mail processing device using sorter application software
JP4409702B2 (ja) * 2000-03-14 2010-02-03 株式会社東芝 認識装置
US7788602B2 (en) 2000-06-06 2010-08-31 Microsoft Corporation Method and system for providing restricted actions for recognized semantic categories
US7421645B2 (en) * 2000-06-06 2008-09-02 Microsoft Corporation Method and system for providing electronic commerce actions based on semantically labeled strings
US7712024B2 (en) 2000-06-06 2010-05-04 Microsoft Corporation Application program interfaces for semantically labeling strings and providing actions based on semantically labeled strings
US7716163B2 (en) 2000-06-06 2010-05-11 Microsoft Corporation Method and system for defining semantic categories and actions
US7770102B1 (en) 2000-06-06 2010-08-03 Microsoft Corporation Method and system for semantically labeling strings and providing actions based on semantically labeled strings
DE10111885C2 (de) * 2001-03-13 2003-02-20 Siemens Production & Logistics Verfahren zum Ermitteln gültiger Adresskodes
US7346591B2 (en) 2001-03-27 2008-03-18 Pitney Bowes Inc. Messaging services for uniquely identified mail
US6993491B2 (en) * 2001-03-27 2006-01-31 Pitney Bowes Inc. Method for a carrier to determine the location of a missing person
US7085811B2 (en) * 2001-03-27 2006-08-01 Pitney Bowes Inc. Sender elected messaging services
US20040094615A1 (en) * 2001-03-27 2004-05-20 Pitney Bowes Incorporated Recipient elected messaging services enabled by processing codes printed on mail
US7386458B2 (en) 2001-03-27 2008-06-10 Pitney Bowes Inc. Recipient elected messaging services for mail that is transported in trays or tubs
US7389238B2 (en) * 2001-03-27 2008-06-17 Pitney Bowes Inc. Recipient elected messaging services
US7386457B2 (en) 2001-03-27 2008-06-10 Pitney Bowes Inc. Messaging services for the visually impaired
US7778816B2 (en) 2001-04-24 2010-08-17 Microsoft Corporation Method and system for applying input mode bias
JP2004537416A (ja) * 2001-08-13 2004-12-16 シーメンス アクチエンゲゼルシヤフト 分配アドレスに従って送付物を仕分けする方法
US7707496B1 (en) 2002-05-09 2010-04-27 Microsoft Corporation Method, system, and apparatus for converting dates between calendars and languages based upon semantically labeled strings
US7707024B2 (en) 2002-05-23 2010-04-27 Microsoft Corporation Method, system, and apparatus for converting currency values based upon semantically labeled strings
US7742048B1 (en) 2002-05-23 2010-06-22 Microsoft Corporation Method, system, and apparatus for converting numbers based upon semantically labeled strings
US7827546B1 (en) 2002-06-05 2010-11-02 Microsoft Corporation Mechanism for downloading software components from a remote source for use by a local software application
US7356537B2 (en) 2002-06-06 2008-04-08 Microsoft Corporation Providing contextually sensitive tools and help content in computer-generated documents
US20040065598A1 (en) * 2002-06-17 2004-04-08 Ross David Justin Address disambiguation for mail-piece routing
US7716676B2 (en) * 2002-06-25 2010-05-11 Microsoft Corporation System and method for issuing a message to a program
US7209915B1 (en) 2002-06-28 2007-04-24 Microsoft Corporation Method, system and apparatus for routing a query to one or more providers
US7084365B2 (en) * 2002-08-19 2006-08-01 Lands' End Direct Merchants, Inc. Methods and apparatus for a non-discrete sortation process
RU2251738C2 (ru) * 2003-01-28 2005-05-10 "Аби Софтвер Лтд." Способ приведения в соответствие заполненной машиночитаемой формы и ее шаблона при наличии искажений (варианты)
US7783614B2 (en) 2003-02-13 2010-08-24 Microsoft Corporation Linking elements of a document to corresponding fields, queries and/or procedures in a database
US7711550B1 (en) * 2003-04-29 2010-05-04 Microsoft Corporation Methods and system for recognizing names in a computer-generated document and for providing helpful actions associated with recognized names
US7266218B2 (en) * 2003-05-08 2007-09-04 Lockheed Martin Corporation Method and system for providing a measure of performance of region of interest identification algorithms
US7739588B2 (en) 2003-06-27 2010-06-15 Microsoft Corporation Leveraging markup language data for semantically labeling text strings and data and for providing actions based on semantically labeled text strings and data
US7992085B2 (en) 2005-09-26 2011-08-02 Microsoft Corporation Lightweight reference user interface
US7788590B2 (en) 2005-09-26 2010-08-31 Microsoft Corporation Lightweight reference user interface
US20080110810A1 (en) * 2006-11-01 2008-05-15 Raf Technology, Inc. Mailpiece reject processing and labeling
US20090046938A1 (en) * 2007-08-15 2009-02-19 Lockheed Martin Corporation Character contour correction
US20100100233A1 (en) * 2008-10-22 2010-04-22 Lockheed Martin Corporation Universal intelligent postal identification code
US8176080B2 (en) * 2009-03-06 2012-05-08 Hewlett-Packard Development Company, L.P. Desensitizing character strings
JP4875723B2 (ja) * 2009-04-24 2012-02-15 シャープ株式会社 画像形成装置
WO2010151575A1 (en) * 2009-06-23 2010-12-29 Raf Technology, Inc. Return address destination discrimination technology
JP2011086178A (ja) * 2009-10-16 2011-04-28 Toshiba Corp 料額印検出方法及び料額印検出装置
JP5591578B2 (ja) * 2010-04-19 2014-09-17 日本電産サンキョー株式会社 文字列認識装置および文字列認識方法
JP5204803B2 (ja) * 2010-05-10 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ データ処理装置、入力支援方法及びプログラム
US8526743B1 (en) 2010-11-01 2013-09-03 Raf Technology, Inc. Defined data patterns for object handling
US8774455B2 (en) 2011-03-02 2014-07-08 Raf Technology, Inc. Document fingerprinting
US9443298B2 (en) 2012-03-02 2016-09-13 Authentect, Inc. Digital fingerprinting object authentication and anti-counterfeiting system
US9152862B2 (en) 2011-09-15 2015-10-06 Raf Technology, Inc. Object identification and inventory management
US9361596B2 (en) 2011-10-04 2016-06-07 Raf Technology, Inc. In-field device for de-centralized workflow automation
US10346852B2 (en) 2016-02-19 2019-07-09 Alitheon, Inc. Preserving authentication under item change
US9390393B2 (en) * 2013-05-24 2016-07-12 Bank Of America Corporation Routing from a mail sorting assembly similarly addressed mail items to different destinations
CN104346801B (zh) * 2013-08-02 2018-07-20 佳能株式会社 图像构图评估装置、信息处理装置及其方法
JP6131765B2 (ja) * 2013-08-06 2017-05-24 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
EP3236401A1 (en) 2016-04-18 2017-10-25 Alitheon, Inc. Authentication-triggered processes
US10614302B2 (en) 2016-05-26 2020-04-07 Alitheon, Inc. Controlled authentication of physical objects
US10740767B2 (en) 2016-06-28 2020-08-11 Alitheon, Inc. Centralized databases storing digital fingerprints of objects for collaborative authentication
US10915612B2 (en) 2016-07-05 2021-02-09 Alitheon, Inc. Authenticated production
US10902540B2 (en) 2016-08-12 2021-01-26 Alitheon, Inc. Event-driven authentication of physical objects
US10839528B2 (en) 2016-08-19 2020-11-17 Alitheon, Inc. Authentication-based tracking
JP6949596B2 (ja) * 2017-07-20 2021-10-13 東芝テック株式会社 商品データ処理装置及び商品データ処理プログラム
EP3435287A3 (en) 2017-07-25 2019-05-01 Alitheon, Inc. Model-based digital fingerprinting
US11087013B2 (en) 2018-01-22 2021-08-10 Alitheon, Inc. Secure digital fingerprint key object database
CN108683589B (zh) * 2018-07-23 2020-07-14 清华大学 垃圾邮件的检测方法、装置及电子设备
JP7172351B2 (ja) * 2018-09-21 2022-11-16 富士フイルムビジネスイノベーション株式会社 文字列認識装置及び文字列認識プログラム
JP7302175B2 (ja) * 2019-01-17 2023-07-04 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
US10963670B2 (en) 2019-02-06 2021-03-30 Alitheon, Inc. Object change detection and measurement using digital fingerprints
EP3734506A1 (en) 2019-05-02 2020-11-04 Alitheon, Inc. Automated authentication region localization and capture
EP3736717A1 (en) 2019-05-10 2020-11-11 Alitheon, Inc. Loop chain digital fingerprint method and system
US11238146B2 (en) 2019-10-17 2022-02-01 Alitheon, Inc. Securing composite objects using digital fingerprints
EP3859603A1 (en) 2020-01-28 2021-08-04 Alitheon, Inc. Depth-based digital fingerprinting
US11341348B2 (en) 2020-03-23 2022-05-24 Alitheon, Inc. Hand biometrics system and method using digital fingerprints
EP3885984A1 (en) 2020-03-23 2021-09-29 Alitheon, Inc. Facial biometrics system and method of using digital fingerprints
US11948377B2 (en) 2020-04-06 2024-04-02 Alitheon, Inc. Local encoding of intrinsic authentication data
US11663849B1 (en) 2020-04-23 2023-05-30 Alitheon, Inc. Transform pyramiding for fingerprint matching system and method
US11983957B2 (en) 2020-05-28 2024-05-14 Alitheon, Inc. Irreversible digital fingerprints for preserving object security
US11700123B2 (en) 2020-06-17 2023-07-11 Alitheon, Inc. Asset-backed digital security tokens

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61103282A (ja) * 1984-10-26 1986-05-21 Nippon Telegr & Teleph Corp <Ntt> イメ−ジ情報処理方式
JPS6394384A (ja) * 1986-10-08 1988-04-25 Nec Corp 文字行方向判定方式
JP3038344B2 (ja) * 1987-02-24 2000-05-08 株式会社東芝 郵便物読取処理装置
US5031223A (en) * 1989-10-24 1991-07-09 International Business Machines Corporation System and method for deferred processing of OCR scanned mail
US5315668A (en) * 1991-11-27 1994-05-24 The United States Of America As Represented By The Secretary Of The Air Force Offline text recognition without intraword character segmentation based on two-dimensional low frequency discrete Fourier transforms
US5321768A (en) * 1992-09-22 1994-06-14 The Research Foundation, State University Of New York At Buffalo System for recognizing handwritten character strings containing overlapping and/or broken characters
JP2977431B2 (ja) * 1993-12-27 1999-11-15 株式会社東芝 ビデオコーディング装置
JP3388867B2 (ja) * 1994-03-31 2003-03-24 株式会社東芝 宛名領域検出装置および宛名領域検出方法
JP2734386B2 (ja) * 1994-12-20 1998-03-30 日本電気株式会社 文字列読み取り装置
JP3441249B2 (ja) * 1995-07-24 2003-08-25 株式会社東芝 コーディングシステム及び郵便物処理システム
JP3232991B2 (ja) * 1995-12-13 2001-11-26 株式会社日立製作所 文字読取り方法及び住所読取り方法
JPH09245120A (ja) * 1996-03-11 1997-09-19 Hitachi Ltd 文字切出し方法

Also Published As

Publication number Publication date
US6291785B1 (en) 2001-09-18
JP3246432B2 (ja) 2002-01-15
US20010021261A1 (en) 2001-09-13
KR19990072440A (ko) 1999-09-27
CN1237742A (zh) 1999-12-08
US6470091B2 (en) 2002-10-22
CN1168040C (zh) 2004-09-22
JPH11232391A (ja) 1999-08-27

Similar Documents

Publication Publication Date Title
KR100324847B1 (ko) 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법
US6335986B1 (en) Pattern recognizing apparatus and method
EP0163377B1 (en) Pattern recognition system
JP2973944B2 (ja) 文書処理装置および文書処理方法
US6950555B2 (en) Holistic-analytical recognition of handwritten text
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
Yamada et al. Cursive handwritten word recognition using multiple segmentation determined by contour analysis
US20040146200A1 (en) Segmenting touching characters in an optical character recognition system to provide multiple segmentations
Koga et al. Lexical search approach for character-string recognition
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
JPH07271899A (ja) 文字認識装置
Lee et al. Rapid analytical verification of handwritten alphanumeric address fields
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JP3105918B2 (ja) 文字認識装置、および文字認識方法
JPH11312219A (ja) 宛名読取り装置および郵便物等区分機および文字列認識方法
Wolf et al. Form-based localization of the destination address block on complex envelopes
JP2000207491A (ja) 文字列読取方法及び装置
JPH09245120A (ja) 文字切出し方法
Shi et al. A system for text recognition based on graph embedding matching
Nakajima et al. Analysis of address layout on Japanese handwritten mail-a hierarchical process of hypothesis verification
Lee RAPID ANALYTICAL VERIFICATION OF HANDWRITTEN ALPHANUMERIC ADDRESS FIELDS Lee, CK; Leedham, G.
LEEDHAM RAPID ANALYTICAL VERIFICATION OF HANDWRITTEN ALPHANUMERIC ADDRESS FIELDS
JPH10162103A (ja) 文字認識装置
JPH07271909A (ja) 文字認識装置及び文字認識方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090203

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee