KR100248917B1 - 패턴인식장치및방법 - Google Patents

패턴인식장치및방법 Download PDF

Info

Publication number
KR100248917B1
KR100248917B1 KR1019970000322A KR19970000322A KR100248917B1 KR 100248917 B1 KR100248917 B1 KR 100248917B1 KR 1019970000322 A KR1019970000322 A KR 1019970000322A KR 19970000322 A KR19970000322 A KR 19970000322A KR 100248917 B1 KR100248917 B1 KR 100248917B1
Authority
KR
South Korea
Prior art keywords
character
pattern
recognition
line
processing
Prior art date
Application number
KR1019970000322A
Other languages
English (en)
Other versions
KR19980023917A (ko
Inventor
사토시 나오이
미사코 스와
요시노부 홋타
Original Assignee
아끼구사 나오유끼
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP00173096A external-priority patent/JP3345246B2/ja
Application filed by 아끼구사 나오유끼, 후지쯔 가부시끼가이샤 filed Critical 아끼구사 나오유끼
Publication of KR19980023917A publication Critical patent/KR19980023917A/ko
Application granted granted Critical
Publication of KR100248917B1 publication Critical patent/KR100248917B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

환경 인식부는 입력 이미지으로부터 제 1∼N 번째의 상태를 추출하고, 인식부를 실행시키기 위해 제 1∼N 번째의 패턴 인식부로부터 제 1∼N 번째의 상태에 대응하는 데이타를 호출한다.

Description

패턴 인식 장치 및 방법{PATTERN RECOGNIZING APPARATUS AND METHOD}
본 발명은 패턴 인식을 위한 장치 및 방법에 관한 것으로, 특히 수기 문자 인식 장치뿐만 아니라 인쇄 문자 인식 장치 및 그래픽 인식 장치와 함께 사용될 시에 입력 이미지의 각종 상태에 따라 문자, 그래픽 및 기호를 정확하게 인식할 수 있는 패턴 인식 장치 및 방법에 관한 것이다.
광학 문자 판독기(OCR)와 같은 종래의 수기 문자 인식 장치는 회계 장부 등에 기록된 문자를 자동적으로 판독하여 이 문자를 자동으로 입력하도록 설계되므로 회계 장부 등에 기록된 문자를 수동으로 판별하여 키보드를 통해 이 문자를 입력시킬 필요성을 제거한다.
도 1은 종래의 수기 문자 인식 장치의 구조를 도시하는 블록도이다.
도 1에서는 스캐너를 사용하여 서식/문서(311)를 판독함으로써 서식/문서(311)의 다중값 이미지를 얻는다.
전처리부(312)는 다중값 이미지를 이진화하고, 잡음을 제거하여 서식/문서(311)의 위치를 수정한다.
그리고나서, 문자 검출부(313)는 미리 정의된 괘선 정보 및 문자의 위치 정보에 따라 각각의 문자를 검출한다.
문자 인식부(314)는 각각의 문자를 인식하여 문자 코드를 출력한다. 문자 검출부(313)에 의해 검출된 미지 문자 패턴의 각각의 특징을 인식 사전(315)에 미리 등록된 각각의 문자 카테고리의 특징을 가지고 조회함으로써 문자가 인식된다.
예를 들어, 2차원 문자 패턴을 문자의 특징을 표현하는 특징 공간에서의 특징 벡터로 변환함으로써, 미지 문자 패턴과 인식 사전(315)에 사전 등록된 문자 카테고리간의 유사도로서 특징 공간에서의 특징 벡터간의 거리를 산출한다. 미지 문자 패턴의 특징 벡터와 인식 사전(315)에 사전 등록된 문자 카테고리의 특징 벡터간의 거리가 최단 거리일때, 미지 문자 패턴에 대응하여 문자 카테고리가 인식된다.
삭제 라인, 잡음 및 기호 등의 비문자를 문자로 잘못 인식하여 비문자에 대해 문자 코드를 출력하는 것을 방지하기 위해 2개의 특징 벡터간의 거리에 대해 임계값을 설정한다. 2개의 특징 벡터간의 거리가 임계값 이상인 경우, 미지 문자 패턴이 인식 사전(315)에 사전 등록되어 있는 대응 문자 카테고리를 갖고 있지 않는 것으로 판정하거나 또는 미지 문자 패턴이 비문자를 지칭하는 것으로 판정하여 거부 코드를 출력한다.
인식 사전(315)은 또한 고품질 문자, 모호한 문자, 변형된 문자의 문자 카테고리의 특징을 포함한다. 고품질 문자에 대해서는 고품질 문자 인식 사전(315)이 사용되고, 모호한 문자에 대해서는 모호한 문자 인식 사전(315)이 사용되며, 변형된 문자에 대해서는 변형 문자 인식 사전(315)이 사용된다. 따라서, 서식/문서(311)에서의 문자의 품질의 차이에 따라 처리될 수 있다.
도 2는 삭제 라인을 갖는 문자를 인식하기 위한 문자 인식 장치의 구조를 도시한다.
도 2에 도시된 문자 인식 장치는 문자를 포함하는 원본 이미지를 취입하여 입력 이미지로부터 문자를 검출 또는 전처리하기 위한 이미지 입력부(491) 및 문자의 특징을 추출하고 이 추출된 특징을 인식 사전(315)에 저장된 표준 패턴의 특징과 비교함으로써 문자를 식별하기 위한 식별부(492)를 포함한다.
서식에 잘못 기재된 문자가 삭제 라인을 이용하여 제거될때, 이 문자에 6개 이상의 수평 라인이 부가된다. 이와 같인 6개 이상의 수평 라인이 부가된 문자는 식별될 수 없는 것으로 판정되며, 이 문자는 인식 사전에 저장된 어떠한 표준 패턴과도 부합하지 않으므로 식별부(492)에 의해 거부된다.
그러나, 도 1에 도시된 수기 문자 인식 장치는 동일한 인식 사전(315)을 사용하여 모호한 문자, 변형된 문자, 고품질 문자중에서 검출된 문자를 동일하게 처리한다.
따라서, 인식 사전(315)에 등록된 모호한 문자에 대한 정보가 고품질 문자 인식 처리에 대해 악영향을 주어 인식 사전(315)에 등록된 모호한 문자가 고품질 문자의 성공적인 판독을 방해한다는 문제점이 있다.
모호한 상태 및 변형된 상태외에도, 문자에 대한 각종의 환경이 존재한다. 예를 들어, 문자는 그 문자 테두리와 접촉할 수도 있다. 단일 인식 사전(315)이 각종 환경에서 참조될때, 이러한 환경이 서로 영향을 끼침으로써 인식 처리가 향상된 정밀도로 수행될 수 없다는 문제점이 발생한다.
도 2에 도시된 문자 인식 장치가 문자를 인식할 때, 입력된 문자를 삭제 라인을 사용하여 삭제하기 위해 6개 이상의 수평 라인이 요구된다. 이러한 점은 사용자에게 많은 부담을 주어 완벽하게 인지할 수 없다. 그 결과, 명백한 삭제 라인을 갖는 문자는 인식 사전에 저장된 표준 패턴으로부터 조금의 거리가 있어, 삭제 라인이 없는 문자와 명백하게 구분되지 않는다. 따라서, 삭제되어야할 문자가 거부되지 않고 잘못 판독된다.
예를 들어, 도 3a에 도시된 바와 같이, 삭제되어야할 '0'는 거부되지 않고 '8'로 인식된다. 도 3b에 도시된 바와 같이, 삭제되어야할 '1'은 거부되지 않고 '8'로 인식된다. 도 3c에 도시된 바와 같이, 삭제되어야할 '7'은 거부되지 않고 '4'로 인식된다. 도 3d에 도시된 바와 같이, 삭제되어야할 '6'은 거부되지 않고 '6'으로 인식된다.
본 발명은 문자의 환경에 따라 고정밀도로 문자를 적합하게 인식할 수 있는 패턴 인식 장치 및 방법을 제공하는 것을 목적으로 한다.
본 발명의 특징에 따르면, 입력 패턴으로부터 제1 소정 특징을 추출하고 제1 특징이 추출된 입력 패턴으로부터 제2 소정 특징을 추출함으로써 입력 패턴이 인식된다.
그 결과, 문자의 각각의 환경에 따라 인식 처리가 수행될 수 있다.
본 발명의 다른 특징에 따르면, 입력 이미지로부터 처리 대상의 상태를 추출하고 각각의 처리 대상에 대한 상태에 적합한 인식 처리를 선택함으로써 패턴이 인식된다.
따라서, 각종 상태를 갖는 입력 이미지에 대한 각각의 상태에 대해 패턴 인식 처리가 적합하게 수행될 수 있고, 이로써 고정밀도의 인식 처리를 실현할 수 있다.
본 발명의 다른 특징에 따르면, 처리 대상의 상태가 입력 이미지로부터 추출되며, 제1 상태에 있는 처리 대상에 대해서는 제1 상태 전용의 패턴 인식 처리가 수행되고, 제2 상태에 있는 처리 대상에 대해서는 제2 상태 전용의 패턴 인식 처리가 수행된다.
따라서, 제1 상태에 있는 처리 대상에 대한 인식 처리와 제2 상태에 있는 처리 대상에 대한 인식 처리는 상호 작용하므로 고정밀도의 인식 처리를 성공적으로 수행할 수 있다.
본 발명의 다른 특징에 따르면, 각종 상태의 입력 이미지에 대해 인식 사전이 적절하게 선택된다.
예를 들어, 모호한 문자, 변형된 문자 및 고품질 문자가 입력 이미지에 혼합되어 있는 경우에도, 모호한 문자에 대해서는 모호한 문자 인식 사전을, 변형된 문자에 대해서는 변형 문자 인식 사전을, 고품질 문자에 대해서는 고품질 문자 인식 사전을 사용함으로써 고정밀도로 인식 처리를 수행할 수 있다.
본 발명의 다른 특징에 따르면, 각종 상태에서의 입력 이미지에 대해 식별 함수가 적절하게 선택된다.
예를 들어 1문자 테두리에 기록된 문자에 대해서는 시티블록 거리(city block distance)를 사용하여 문자를 인식하고, 자유피치 테두리내에 기록된 문자에 대해서는 판별 함수를 사용하여 문자 검출 신뢰도를 고려하여 문자를 인식함으로써 고정밀도로 인식 처리를 수행할 수 있다.
본 발명의 다른 특징에 따라, 각종 상태의 입력 이미지에 대해 지식이 적절하게 선택된다.
예를 들어 미지 문자가 현저하게 변형되고 인식 사전에 저장된 문자 카테고리와의 대응관계가 없을때 문자를 문자 세그먼트로 분할함으로써 미지 문자와 문자 카테고리간의 대응관계를 설정하고, 문자가 문자열로부터 검출될때 학습 패턴을 기초로 발생된 판별 함수를 사용하여 검출 신뢰도를 산출하고, 그리고 테두리 접촉 문자가 인식될때 학습 패턴을 통해 얻어진 신뢰도를 사용하여 테두리 접촉 문자에 대한 인식 신뢰도를 평가함으로써 고정밀도로 인식 처리를 수행할 수 있다.
본 발명의 다른 특징에 따르면, 특정 처리 대상에 대해 복수의 인식 처리가 호출될때 인식 처리의 신뢰도가 소정값에 도달할때까지 우선순위에 따라 인식 처리가 수행된다.
따라서, 인식 처리의 신뢰도가 향상되고 처리의 정밀도가 성공적으로 개선될 수 있다.
본 발명의 다른 특징에 따르면, 입력 이미지로부터 비문자를 추출하고, 추출된 비문자에 대해 비문자 인식 처리와 문자 인식 처리를 별도로 수행한다.
그 결과, 비문자가 문자로 잘못 판독되고 문자가 비문자로 잘못 판독되는 경우가 감소되어 고정밀도로 인식 처리를 실행할 수 있다.
본 발명의 다른 특징에 따르면, 입력 패턴으로부터 제1 소정 특징을 추출하고, 제1 소정 특징이 추출되지 않는 입력 패턴으로부터 제2 소정 특징을 추출함으로써 입력 패턴을 인식한다.
따라서, 삭제 라인을 갖는 문자가 삭제 라인을 갖지 않는 문자와 구별될 수 있고, 삭제 라인을 갖지 않는 문자만이 인식될 수 있다. 따라서, 삭제 라인을 갖는 문자가 다른 문자로 잘못 인식되는 것을 방지할 수 있다.
본 발명의 다른 특징에 따르면, 제1 소정 특징이 입력 패턴으로부터 추출되고, 제1 소정 특징에 기여하는 부분이 상기 제1 소정 특징이 추출된 입력 패턴으로부터 제거될 수 있으며, 제1 소정 특징에 기여하는 부분이 제거된 패턴을 기초로 입력 패턴이 인식된다.
따라서, 문자가 인식될때 삭제 라인을 갖는 문자로부터 삭제 라인만이 제거될 수 있으며, 이로써 문자 인식의 정밀도가 향상된다.
도 1은 종래의 문자 인식 장치의 구조를 도시하는 블록도.
도 2는 종래의 문자 인식 장치의 구조를 도시하는 블록도.
도 3a 내지 도 3d는 삭제 라인을 갖는 문자를 인식하는 예를 도시하는 도면.
도 4는 본 발명의 제1 실시예에 따른 패턴 인식 장치의 구조를 도시하는 블록도.
도 5는 본 발명의 제2 실시예에 따른 패턴 인식 장치의 기능을 도시하는 블록도.
도 6은 도 5에 도시된 환경 인식부의 실제 구조에 대한 실시예를 도시하는 블록도.
도 7은 도 5에 도시된 패턴 인식 장치의 구조에 대한 실시예를 도시하는 블록도.
도 8은 도 1에 도시된 환경 인식 시스템의 전체 동작의 실시예를 도시하는 흐름도.
도 9는 도 8에 도시된 전처리부의 동작의 실시예를 도시하는 흐름도.
도 10은 도 8에 도시된 레이아웃 분석부의 동작의 실시예를 도시하는 흐름도.
도 11은 도 8에 도시된 품질 분석부의 동작의 실시예를 도시하는 흐름도.
도 12는 도 8에 도시된 정정 분석부의 동작의 실시예를 도시하는 흐름도.
도 13은 도 8에 도시된 문자/비문자 인식 처리를 제어하기 위한 제어부의 동작의 실시예를 도시하는 흐름도.
도 14는 본 발명의 실시예에 따른 패턴 인식 장치의 구조를 도시하는 블록도.
도 15는 본 발명의 실시예에 따른 패턴 인식 장치의 실제 구조를 도시하는 블록도.
도 16은 본 발명의 실시예에 따른 패턴 인식 장치의 라벨링 처리의 일예를 도시하는 도면.
도 17a 내지 도 17d는 본 발명의 실시예에 따른 패턴 인식 장치의 라벨링 처리를 압축하는 표현을 도시하는 도면.
도 18은 본 발명의 실시예에 따른 패턴 인식 장치의 텍스트 추출 처리의 일예를 도시하는 도면.
도 19a 내지 도 19d는 본 발명의 실시예에 따른 패턴 인식 장치의 텍스트 추출 처리에서의 부분 영역의 일예를 도시하는 도면.
도 20은 본 발명의 실시예에 따른 패턴 인식 장치의 괘선 추출 처리에서의 인접 투영법을 도시하는 도면.
도 21은 본 발명의 실시예에 따른 패턴 인식 장치의 괘선 추출 처리에서의 패턴 투영 결과를 도시하는 도면.
도 22는 본 발명의 실시예에 따른 패턴 인식 장치의 괘선 추출 처리를 도시하는 흐름도.
도 23a 및 도 23b는 본 발명의 실시예에 따른 패턴 인식 장치의 괘선 추출 처리를 도시하는 도면.
도 24는 본 발명의 실시예에 따른 패턴 인식 장치의 괘선 추출 처리에서의 모호한 괘선을 보완하는 방법을 도시하는 도면.
도 25는 본 발명의 실시예에 따른 패턴 인식 장치의 모호한 괘선 보완 방법을 도시하는 흐름도.
도 26은 본 발명의 실시예에 따른 패턴 인식 장치에 의해 모호한 괘선이 보완될시의 검색 방향을 도시하는 도면.
도 27은 본 발명의 실시예에 따른 패턴 인식 장치의 1문자 테두리 추출 처리를 도시하는 흐름도.
도 28은 본 발명의 실시예에 따른 패턴 인식 장치의 블록 문자 테두리 추출 처리를 도시하는 흐름도.
도 29a 내지 도 29e는 본 발명의 실시예에 따른 패턴 인식 장치에 사용된 테두리 및 표의 종류를 도시하는 도면.
도 30은 본 발명의 실시예에 따른 패턴 인식 장치의 이미지 축소 처리를 도시하는 흐름도.
도 31a 내지 도 31e는 본 발명의 실시예에 따른 패턴 인식 장치의 테두리 접촉 상태 판정 처리를 도시하는 도면.
도 32는 본 발명의 실시예에 따른 패턴 인식 장치의 테두리 접촉 상태 판정 처리를 도시하는 흐름도.
도 33a 내지 도 33e는 본 발명의 실시예에 따른 패턴 인식 장치에 사용된 삭제 라인의 종류를 도시하는 도면.
도 34a 내지 도 34c는 본 발명의 실시예에 따른 패턴 인식 장치에 사용된 수정된 문자의 특징을 산출하는 방법을 도시하는 도면.
도 35는 도 7에 도시된 기본 문자 인식부의 일예의 구조를 도시하는 블록도.
도 36a 내지 도 36d는 도 7에 도시된 기본 문자 인식부에서의 특징 벡터를 산출하는 방법의 일예를 도시하는 도면.
도 37은 도 7에 도시된 기본 문자 인식부에서의 특징 벡터간의 거리를 산출하는 방법의 일예를 도시하는 도면.
도 38a 내지 도 38c는 도 7에 도시된 기본 문자 인식부와 함께 사용하기 위한 상세 식별법에 의해 문자 세그먼트를 추출하는 방법을 도시하는 도면.
도 39는 도 7에 도시된 기본 문자 인식부와 함께 사용하기 위한 상세 식별법에서의 종료점(end point)을 검출하는 방법을 도시하는 도면.
도 40은 도 7에 도시된 기본 문자 인식부와 함께 사용하기 위한 상세 식별법에서의 각도 변화를 검출하는 방법을 도시하는 도면.
도 41a 및 도 41b는 도 7에 도시된 기본 문자 인식부와 함께 사용하기 위한 상세 식별법에서의 문자 세그먼트들간의 대응관계를 도시하는 도면.
도 42는 도 7에 도시된 기본 문자 인식부와 함께 사용하기 위한 상세 식별법의 처리를 도시하는 흐름도.
도 43a 내지 도 43c는 도 7에 도시된 테두리 접촉 문자 인식부에 의해 문자를 보완하는 방법을 도시하는 도면.
도 44a 내지 도 44d는 도 7에 도시된 테두리 접촉 문자 인식부에 의한 재보완법을 도시하는 도면.
도 45a 내지 도 45c는 도 7에 도시된 테두리 접촉 문자 인식부에 의한 보완된 오독 문자의 일예를 도시하는 도면.
도 46은 도 7에 도시된 테두리 접촉 문자 인식부에 의해 문자를 학습하는 방법의 일예를 도시하는 블록도.
도 47a 및 도 47b는 도 7에 도시된 테두리 접촉 문자 인식부에 의해 테두리 접촉 문자를 생성하는 방법을 도시하는 도면.
도 48a 내지 도 48f는 도 7에 도시된 테두리 접촉 문자 인식부에 의해 테두리 접촉 문자를 생성하는 일예를 도시하는 도면.
도 49는 도 7에 도시된 테두리 접촉 문자 인식부에 사용하기 위한 지식표의 일예를 도시하는 도면.
도 50은 도 7에 도시된 테두리 접촉 문자 인식부에 사용하기 위한 지식표에 입력된 변화의 종류 및 양의 일예를 도시하는 도면.
도 51a 및 도 51b는 도 7에 도시된 테두리 접촉 문자 인식부에 의해 강조된 재인식 영역의 일예를 도시하는 도면.
도 52a 내지 도 52d는 도 7에 도시된 테두리 접촉 문자 인식부에 의한 강조 영역을 사용하는 재인식법을 도시하는 도면.
도 53은 도 7에 도시된 테두리 접촉 문자 인식부에 의한 강조 영역을 사용하는 재인식 처리를 도시하는 흐름도.
도 54a 및 54b는 도 7에 도시된 테두리 접촉 문자 인식부와 함께 사용하기 위한 문자 재인식법의 일예를 도시하는 블록도.
도 55는 도 7에 도시된 테두리 접촉 문자 인식부와 함께 사용하기 위한 문자 재인식 처리를 도시하는 블록도.
도 56은 도 7에 도시된 문자열 인식부에 의해 수행된 통계 처리에서의 파라미터의 회화적 의미를 나타내는 도면.
도 57은 도 7에 도시된 문자열 인식부에 의해 수행된 통계적 처리를 도시하는 흐름도.
도 58은 도 7에 도시된 문자열 인식부에 의해 수행된 분리 문자 처리에서의 파라미터의 회화적 의미를 나타내는 도면.
도 59는 도 7에 도시된 문자열 인식부에 의해 수행된 분리 문자 처리를 도시하는 흐름도.
도 60은 도 7에 도시된 문자열 인식부에 의해 수행된 위첨자 획선 처리에서의 파라미터의 회화적 의미를 나타내는 도면.
도 61은 도 7에 도시된 문자열 인식부에 의해 수행된 위첨자 획선 처리를 도시하는 흐름도.
도 62는 도 7에 도시된 문자열 인식부의 문자 검출 확률 데이타의 처리를 도시하는 흐름도.
도 63은 도 7에 도시된 문자열 인식부의 문자 검출 신뢰도를 양자화하는 방법을 도시하는 도면.
도 64는 도 7에 도시된 문자열 인식부의 주파수 분포를 발생하는 방법을 도시하는 도면.
도 65는 도 7에 도시된 문자열 인식부의 문자 검출 신뢰도를 산출하는 방법을 도시하는 흐름도.
도 66은 도 7에 도시된 문자열 인식부에 의한 문자 검출의 성공 및 실패에 대한 히스토그램 분포의 일예를 도시하는 도면.
도 67은 도 7에 도시된 문자열 인식부에 의한 문자 검출의 성공 및 실패의 중첩 영역을 산출하는 방법을 도시하는 도면.
도 68은 도 7에 도시된 문자열 인식부에 의한 문자 검출 처리의 흐름을 도시하는 도면.
도 69는 도 7에 도시된 문자열 인식부에 의해 수행된 비통계 처리에서의 문자 검출 처리의 흐름을 도시하는 도면.
도 70은 도 7에 도시된 모호한 문자 인식부의 구조의 일예를 도시하는 블록도.
도 71은 도 7에 도시된 삭제 라인 인식부에 의해 수행된 처리의 일예를 도시하는 블록도.
도 72는 도 7에 도시된 특이 문자 분석부에 의해 수행된 클러스터링 처리의 흐름을 도시하는 도면.
도 73은 도 7에 도시된 특이 문자 분석부에 의해 수행된 클러스터링 처리를 도시하는 흐름도.
도 74는 도 7에 도시된 특이 문자 분석부에 의해 수행된 문자 카테고리 판정결과 정정 처리의 흐름을 도시하는 도면.
도 75는 도 7에 도시된 특이 문자 분석부에 의해 수행된 문자 카테고리 판정결과 정정 처리를 나타내는 흐름도.
도 76은 본 발명에 따른 패턴 인식 장치에 의해 처리될 목록의 일예를 도시하는 도면.
도 77은 본 발명의 실시예에 따른 패턴 인식 장치에 사용하기 위한 중간 처리 결과표의 일예를 도시하는 도면.
도 78은 본 발명의 실시예에 따른 패턴 인식 장치에 사용하기 위한 처리 순서표의 일예를 도시하는 도면.
도 79는 본 발명의 실시예에 따른 패턴 인식 장치에 사용하기 위한 중간 처리 결과표의 일예를 도시하는 도면.
도 80은 본 발명의 실시예에 따른 패턴 인식 장치에 사용하기 위한 중간 처리 결과표의 일예를 도시하는 도면.
도 81은 본 발명의 실시예에 따른 패턴 인식 장치에 사용하기 위한 중간 처리 결과표의 일예를 도시하는 도면.
도 82는 본 발명의 실시예에 따른 패턴 인식 장치에 사용하기 위한 중간 처리 결과표의 일예를 도시하는 도면.
도 83은 본 발명의 제3 실시예에 따른 패턴 인식 장치의 기능을 도시하는 블록도.
도 84는 본 발명의 제4 실시예에 따른 패턴 인식 장치의 기능을 도시하는 블록도.
도 85는 본 발명의 제5 실시예에 따른 패턴 인식 장치의 기능을 도시하는 블록도.
도 86은 본 발명의 제6 실시예에 따른 패턴 인식 장치의 기능을 도시하는 블록도.
도 87은 본 발명의 제7 실시예에 따른 패턴 인식 장치의 기능을 도시하는 블록도.
도 88은 본 발명의 제8 실시예에 따른 패턴 인식 장치에 의해 수행된 동작을 도시하는 흐름도.
도 89는 본 발명의 제9 실시예에 따른 패턴 인식 장치에 의해 수행된 동작을 도시하는 흐름도.
도 90은 본 발명의 제10 실시예에 따른 패턴 인식 장치에 의해 수행된 동작을 도시하는 흐름도.
도 91은 본 발명의 제11 실시예에 따른 패턴 인식 장치에 의해 수행된 동작을 도시하는 흐름도.
도 92는 본 발명의 제12 실시예에 따른 패턴 인식 장치의 기능을 도시하는 블록도.
도 93a 내지 도 93f는 본 발명의 실시예에 따른 패턴 인식 장치의 복잡도의 양을 나타내는 도면.
도 94는 도 92에 도시된 패턴 인식 장치의 동작을 도시하는 흐름도.
도 95는 도 92에 도시된 패턴 인식 장치의 동작을 도시하는 흐름도.
(도면의 주요 부분에 대한 부호의 설명)
1 : 환경 인식부
12 : 문자 인식부
25 : 비문자 인식부
121 : 특징 추출부
122 : 기본 사전
123 : 조회부
161 : 테두리 접촉 문자 자동 생성부
162 : 문자 테두리 제거부
164 : 문자 재보완부
165 : 기본 문자 인식부
411 : 이미지 입력부
412 : 삭제 라인 문자 판별부
413 : 식별부
167 : 지식표
본 발명의 제1 실시예에 따른 패턴 인식 장치를 첨부된 도면을 참조하여 설명한다.
도 4는 본 발명의 제1 실시예에 따른 패턴 인식 장치의 기능을 도시하는 블록도이다.
도 4에서, 특징 추출부(1000)는 입력 패턴으로부터 제1 소정 특징을 추출한다. 패턴 인식부(1001)는 특징 추출부(1000)에 의해 제1 특징이 추출된 입력 패턴으로부터 제2 소정 특징을 추출함으로써 입력 패턴을 인식한다.
따라서, 패턴 인식부(1001)는 제1 소정 특징을 갖는 입력 패턴만을 인식할 수 있고, 입력 패턴의 각각의 환경에 대해 인식 처리를 수행할 수 있어 인식 처리 정밀도를 향상시킨다.
패턴 인식부(1001)는 또한 특징 추출부(1000)가 제1 특징을 추출하지 않은 입력 패턴으로부터 제2 소정 특징을 추출함으로써 입력 패턴을 인식할 수도 있다.
패턴 인식부(1001)는 처리 대상으로부터 제1 소정 특징을 갖는 입력 패턴을 제거할 수 있고, 오직 적절한 처리 대상만이 선택 및 인식될 수 있으며, 이로써 인식 처리의 정밀도가 향상된다.
본 발명의 제2 실시예에 따른 패턴 인식 장치를 첨부 도면을 참조하여 설명한다.
도 5는 본 발명의 제2 실시예에 따른 패턴 인식 장치의 기능을 도시하는 블록도이다.
도 5에서, 환경 인식부(1)는 입력 이미지로부터 제1 상태 내지 제N 상태를 추출한다. 입력 이미지로부터 추출된 상태는 예를 들어 문자가 기록되어 있는 1문자 테두리, 자유피치 테두리, 표 등과 같은 포맷; 문자와 그 테두리간의 관계; 문자의 모호한 정도; 문자의 변형; 삭제 라인 등을 이용한 문자의 삭제와 관련한다.
제1 패턴 인식부(2)는 제1 상태에 있는 처리 대상의 패턴을 전용으로 인식한다. 제2 패턴 인식부(4)는 제2 상태에 있는 처리 대상의 패턴을 전용으로 인식한다. 제N 번째의 패턴 인식부(6)는 제N 번째의 상태에 있는 처리 대상의 패턴을 전용으로 인식한다.
제1∼N 번째의 패턴 인식부(2,4,6)는 각각 신뢰도 산출부(3,5,7)를 포함하고, 제1∼N 번째의 패턴 인식부(2,4,6)에 의해 얻어진 인식 결과의 신뢰도를 산출한다.
환경 인식부(1)는 인식 처리를 수행하기 위해 제1∼N 번째의 상태에 대응하는 제1∼N 번째의 패턴 인식부(2,4,6)중의 하나를 호출한다.
예를 들어, 환경 인식부(1)가 입력 이미지로부터 제1 상태를 추출하면, 제1 상태에 있는 처리 대상에 대해 제1 패턴 인식부(2)에 의해 수행될 패턴 인식 처리가 호출된다. 입력 이미지로부터 제2 상태가 추출되면, 제2 상태에 있는 처리 대상에 대해 제2 패턴 인식부(4)에 의해 수행될 패턴 인식 처리가 호출된다. 제N 번째의 상태가 입력 이미지로부터 추출되면, 제N 번째의 상태에 있는 처리 대상에 대해 제N 번째의 패턴 인식부(6)에 의해 수행될 패턴 인식 처리가 호출된다.
환경 인식부(1)가 예를 들어 단일 처리 대상에 대해 제1 및 제2 상태를 추출하면, 처리 대상에 대해 제1 패턴 인식부(2) 및 제2 패턴 인식부(4)에 의해 각각 수행될 패턴 인식 처리가 호출된다.
제1 상태는 문자가 1문자 테두리에 기록되는 상태이고, 제2 상태는 문자가 자유피치 문자 테두리에 기록되는 상태이며, 제3 상태는 문자가 그 문자 테두리와 접촉하는 상태이고, 제4 상태는 문자가 모호한 상태이며, 제5 상태는 문자가 변형된 상태이고, 제6 상태는 문자가 삭제 라인을 사용하여 수정되는 상태라고 가정한다. 이와 같이 정의된 상태를 가지고, 제1 패턴 인식부(2)는 1문자 테두리에 기록된 문자를 인식하고, 제2 패턴 인식부(4)는 자유피치 테두리에 기록된 문자열을 인식하며, 제3 패턴 인식부는 테두리 접촉 문자를 인식하고, 제4 패턴 인식부는 모호한 문자를 인식하며, 제5 패턴 인식부는 변형된 문자를 인식하고, 제6 패턴 인식부는 수정된 문자를 인식한다.
환경 인식부(1)가 입력 이미지로부터 1문자 테두리를 추출하면, 제1 패턴 인식부(2)는 1문자 테두리에 기록된 문자에 대한 인식 처리를 수행한다. 환경 인식부(1)가 입력 이미지로부터 자유피치 테두리를 추출하면, 제2 패턴 인식부(4)는 자유피치 테두리에 기록된 문자에 대한 인식 처리를 수행한다. 환경 인식부(1)가 입력 이미지로부터 테두리 접촉 문자를 추출하면, 제3 패턴 인식부는 테두리 접촉 문자에 대한 인식 처리를 수행한다. 환경 인식부(1)가 입력 이미지로부터 모호한 문자를 추출하면, 제4 패턴 인식부는 모호한 문자에 대한 인식 처리를 수행한다. 환경 인식부(1)가 입력 이미지로부터 변형된 문자를 추출하면, 제5 패턴 인식부는 변형된 문자에 대한 인식 처리를 수행한다. 환경 인식부(1)가 입력 이미지로부터 수정된 문자에 대한 후보를 추출할 때, 제6 패턴 인식부는 수정된 문자에 대한 후보에 관해 인식 처리를 수행한다.
예를 들어, 환경 인식부(1)가 입력 이미지로부터 자유피치 테두리와 접촉하는 테두리 접촉 문자를 추출할 때, 패턴 인식부(2) 및 패턴 인식부(4)가 자유피치 테두리에 접촉하는 테두리 접촉 문자에 대한 인식 처리를 수행한다. 환경 인식부(1)가 입력 이미지로부터 자유피치 테두리에 접촉하는 삭제 라인을 갖는 테두리 접촉 문자를 추출할 때, 제2 패턴 인식부(4), 제3 패턴 인식부 및 제6 패턴 인식부가 자유피치 테두리에 접촉하는 삭제 라인을 갖는 테두리 접촉 문자에 대한 인식 처리를 수행한다.
단일 처리 대상으로부터 복수의 상태가 추출되어 복수의 패턴 인식부(2,4,6)가 호출될때, 복수의 패턴 인식부(2,4,6)에 의해 수행될 인식 처리의 순서는 복수의 패턴 인식부(2,4,6) 호출 순서를 저장하는 처리 순서표에 따라 결정된다. 따라서, 복수의 패턴 인식부(2,4,6)에 의해 수행될 인식 처리는 패턴 인식부(2,4,6)에 의해 수행될 인식 처리에서 신뢰도 산출부(3,5,7)에 의해 소정 임계 이상의 신뢰도가 획득될때까지 그 호출 순서로 순차적으로 수행된다.
예를 들어, 환경 인식부(1)가 자유피치 테두리에 접촉하는 테두리 접촉 문자를 입력 이미지로부터 추출할 때, 최초로 제3 패턴 인식부가 인식 처리를 수행하고, 그리고나서 제2 패턴 인식부(4)가 자유피치 테두리에 접촉하는 테두리 접촉 문자에 대한 인식 처리를 수행한다. 환경 인식부(1)가 자유피치 테두리에 접촉하는 삭제 라인을 갖는 테두리 접촉 문자를 입력 이미지로부터 추출할 때, 최초로 제3 패턴 인식부가 인식 처리를 수행하고, 제6 패턴 인식부가 인식 처리를 수행하며, 그리고나서 제2 패턴 인식부(4)가 자유피치 테두리에 접촉하는 삭제 라인을 갖는 테두리 접촉 문자에 대한 인식 처리를 수행한다.
도 6은 도 1에 도시된 환경 인식부의 실시예에 대한 구조를 도시하는 블록도이다.
도 6에서, 상태 추출부(1a)는 제1∼N 번째의 상태를 입력 이미지로부터 추출한다.
인식 처리 제어부(1b)는 인식 처리에 사용하기 위해 상태 추출부(1a)에 의해 추출된 제1∼N 번째의 상태에 대응하는 도 5에 도시된 제1∼N 번째의 패턴 인식부(2,4,6)중 하나 또는 복수 개를 호출한다.
처리 순서표(1f)는 제1∼N 번째의 패턴 인식부(2,4,6)중에서 복수의 인식부가 호출될때 제1∼N 번째의 패턴 인식부(2,4,6)의 처리 순서를 나타내는 처리 순서를 저장한다.
처리 순서 제어 규칙 저장부(1d)는 상태 추출부(1a)에 의해 추출된 제1∼N 번재의 상태를 기초로 제1∼N 번째의 패턴 인식부(2,4,6)중에서 호출될 인식부를 나타내는 처리 절차를 저장한다.
중간 처리 결과표 생성부(1c)는 처리 순서 제어 규칙 저장부(1d)에 저장된 호출 절차 및 처리 순서표(1f)에 저장된 처리 순서에 따라 제1∼N 번째의 패턴 인식부(2,4,6)의 처리 순서를 나타내는 중간 처리 결과표를 생성한다.
처리 수행 규칙 저장부(1e)는 중간 처리 결과표에 입력된 인식 처리의 결과를 기초로 수행될 다음 처리를 나타내는 절차를 저장한다.
전술한 바와 같이, 도 5에 도시된 패턴 인식 장치는 처리 대상의 상태를 입력 이미지로부터 추출하고 각각의 처리 대상에 대한 상태에 적합한 인식 처리를 선택함으로써 각종 상태를 갖는 입력 이미지에 대한 각각의 상태에 대해 적합한 패턴 인식 처리가 수행될 수 있다. 이로써 고정밀도의 인식 처리가 수행된다. 상태가 추출되고 처리 대상에 대한 인식 처리가 수행될때 처리 대상이 평가되므로, 인식 처리의 정밀도가 더욱 향상될 수 있다.
예를 들어, 입력 이미지로부터 처리 대상의 상태를 추출하여 제1 상태를 갖는 처리 대상의 제1 상태에 대해 전용으로 패턴 인식 처리를 수행하고 제2 상태를 갖는 처리 대상의 제2 상태에 대해 전용으로 패턴 인식 처리를 수행함으로써, 제1 상태를 갖는 처리 대상에 대한 인식 처리와 제2 상태를 갖는 처리 대상에 대한 인식 처리간의 상호 영향이 억제되며, 이로써 고정밀도로 인식 처리를 수행할 수 있다.
더욱이, 인식 처리의 신뢰도가 소정 값에 도달할때까지 단일 처리 대상에 대해 복수의 인식 처리를 수행함으로써 인식 처리의 신뢰도를 고정밀도로 향상시킬 수 있다.
도 7은 본 발명의 일시예에 따른 패턴 인식 장치의 실제 구성을 도시한 블록도이다.
도 7에서, 환경 인식 시스템(11)은 입력 이미지의 상태를 추출하고, 추출된 상태를 기초로 하여 문자 인식부(12)의 기본 문자 인식부(17), 문자열 인식부(15), 테두리 접촉 문자 인식부(13), 모호한 문자 인식부(19) 및 변형 문자 인식부(21)와, 비문자 인식부(25)의 삭제 라인 인식부(26) 및 잡음 인식부(28)중 하나 또는 복수 개를 호출한다.
문자 인식부(12)는 입력 이미지의 각 상태에 대한 문자 인식 처리를 수행하며, 문자를 인식하기 위한 기본 문자 인식부(17), 문자열에 대해 문자 인식 처리 B 및 문자 검출 처리 B를 실시하기 위한 문자열 인식부(15), 테두리 접촉 문자에 대해 문자 인식 처리 A 및 문자 검출 처리 A를 실시하기 위한 테두 접촉 문자 인식부(13), 모호한 문자에 대해 문자 인식 처리 C 및 문자 검출 처리 C를 실시하기 위한 모호한 문자 인식부(19), 변형된 문자에 대해 문자 인식 처리 D 및 문자 검출 처리 D를 실시하기 위한 변형 문자 인식부(21), 특이 문자에 대해 특이 문자 인식 처리 E 및 문자 검출 처리 E를 실시하기 위한 특이 문자 인식부(23)를 구비한다.
기본 문자 인식부(17), 문자열 인식부(15), 테두리 접촉 문자 인식부(13), 모호한 문자 인식부(19), 변형 문자 인식부(21) 및 특이 문자 인식부(23)는 문자 인식 방법에 대한 지식을 저장하는 지식표(14, 16, 18, 20, 22, 24)를 각각 구비한다. 지식표(14)는 인식 처리의 테두리 접촉 상태 및 신뢰도에 대한 지식을 저장하며 중복 부분 패턴법의 지식을 저장한다. 지식표(16)는 예컨대 검출 처리의 신뢰도에 대한 지식, 검출 처리 및 인식 처리를 결합하는 방법에 대한 지식을 저장한다. 지식표(18)는 예를 들어 상세한 인식 방법에 대한 지식을 저장한다.
전술한 구성에 있어, 인식 처리는 각종 상태를 가진 입력 이미지에 대하여 각 상태에 대한 적절한 지식을 선택하고 참조함으로써 실시되며, 그에 따라 인식 처리의 정밀도를 향상시킬 수 있다.
또한, 인식 처리는 각종 상태를 가진 입력 이미지에 대하여 각 상태에 대한 적절한 인식 사전을 선택하고 참조하여 실시될 수 있으며, 그에 따라 인식 처리의 정밀도를 향상시킬 수 있다.
또한, 인식 처리는 각종 상태를 가진 입력 이미지에 대하여 각 상태에 대한 적절한 식별 기능을 선택하여 실시될 수 있으며, 그에 따라 인식 처리의 정밀도를 향상시킬 수 있다.
비문자 인식부(25)는 입력 이미지의 각 상태에 대한 비문자 인식 처리를 수행하며, 삭제 라인을 가진 문자에 대해 비문자 인식 처리 F 및 비문자 검출 처리 F를 실시하기 위한 삭제 라인 인식부(26), 잡음에 대해 비문자 인식 처리 G 및 비문자 검출 처리 G를 실시하기 위한 잡음 인식부(28)를 구비한다.
삭제 라인 인식부(26) 및 잡음 인식부(28)는 비문자 인식 방법의 지식을 저장하는 지식표(27,29)를 각각 구비한다.
그러므로, 문자와 비문자를 분리하여 인식 처리를 수행함으로써 비문자를 문자로 오독하거나 문자를 비문자로 오독하는 일이 없이 고정밀도로 실행될 수 있다.
도 8는 환경 인식 시스템(11)의 전체 처리의 일예를 도시한 흐름도이다.
도 8의 스텝 S1에서는 입력 이미지가 전처리된다. 입력 이미지의 전처리는 팩시밀리, 스캐너 등에 의해 이진화된 입력 이미지를 라벨링하여 실시되며, 입력 이미지 및 라벨링된 이미지가 저장된다. 입력 이미지 및 라벨링된 이미지는 후속 처리시 언제든지 억세스될 수 있는 방법으로 저장된다.
도 9는 도 8에 도시된 입력 이미지의 전처리를 도시한 흐름도이다.
도 9의 스텝 S11에서는 이진화된 입력 이미지로부터 연결 패턴이 추출되어 라벨링되며, 추출되어 라벨링된 이미지 및 입력 이미지가 저장된다. 이 때에, 외접 사각형을 추가 및 제거하여 라벨링된 연결 패턴을 압축함으로써 메모리 용량을 절약할 수 있다. 라벨링된 연결 패턴을 압축함으로써, 예컨대 400 dpi의 고해상도로 스캐너가 읽어들이는 A4 사이즈 문서/서식(약 3000 x 4000 픽셀)을 수백 킬로바이트 내에서 표현할 수 있다.
다음으로, 도 8에 도시된 스텝 S2에서 레이아웃이 분석된다. 레이아웃의 분석은 텍스트를 인식하고, 괘선을 추출하고, 문자 테두리를 추출하고, 테두리 및 표의 종류를 결정하고, 테두리 접촉 문자의 유무를 판별하고, 라벨링된 연결 패턴의 사이즈 및 배치 등을 기초로 도면을 인식함으로써 수행된다.
도 10는 도 8에 도시된 레이아웃 분석을 상세히 도시하는 흐름도이다.
도 10에서, 텍스트는 스텝 S21에서 인식된다. 텍스트 인식시, 라벨링된 연결 패턴의 사이즈가 분석되고, 상대적으로 작은 사이즈의 연결 패턴이 추출되어 문자의 후보로 정해진다. 그런 다음, 그 후보를 인접한 문자 후보와 통합하여 텍스트가 추출된다.
다음에, 스텝 S22에서 괘선이 추출된다. 괘선은 스텝 S21에서 텍스트로 인식되지 않은 연결 패턴에 대한 수직 또는 수평 방향의 비교적 큰 히스토그램 값을 나타내는 패턴을 조사함으로써 추출될 수 있다.
문자 테두리는 스텝 S23에서 추출된다. 문자 테두리는 스텝 S22에서 추출된 괘선으로부터 테두리의 4 측면에 대응하는 괘선을 검출함으로써 추출된다.
스텝 S24에서 테두리와 표의 종류가 판별된다. 테두리 및 표의 종류를 판별함으로써, 스텝 S23에서 추출된 문자 테두리의 종류가 판별되고 문자 테두리의 종류의 속성이 지정된다. 문자 테두리의 종류의 속성은 1문자 테두리, 블록 문자 테두리, 자유피치 문자 테두리, 표 등이 될 수 있다.
스텝 S25에서, 테두리 접촉 문자의 존재 여부가 판별된다. 테두리 접촉 문자의 판별은 문자 테두리가 문자 테두리 라인을 따라 탐색될 때 교차 패턴을 검출함으로써 실시된다. 교차 패턴이 존재하면, 문자가 문자 테두리를 접촉하는 것으로 판별한다. 인접한 문자 테두리내의 다른 문자가 부분적으로 그 테두리에서 나와 현재 테두리로 들어올 수도 있다. 그러므로, 이러한 경우에 문자가 자신의 테두리에서 일부 벗어나 있는 문자는 현재 문자 테두리에 대한 테두리 접촉 문자로서 규정되지 않는다.
그 다음, 스텝 S26에서 도면이 인식된다. 도면 인식시, 텍스트, 문자 테두리, 표 등과 같은 속성으로 지정되지 않은 비교적 큰 사이즈의 연결 패턴이 도면의 속성으로 지정된다.
도 8에 도시된 스텝 S3에서 품질이 분석된다. 품질 분석에서는 입력 이미지내의 모호성, 변형성 등이 검출된다. 전체적인 품질 분석 및 국부적인 품질 분석이 실시될 수 있다.
상기 품질 분석에서는, 「각각의 소정 임계값보다 작은 면적, 길이, 폭을 갖는 연결 영역의 수」를 「소정 영역의 모든 연결 영역의 수」로 나누어 얻어진 값이 소정값보다 큰 경우, 소정 영역에서 모호한 문자가 검출된 것으로 판별한다.
또한, 「모호한 괘선이 보완되었을 때 보완된 부분의 전체 길이」를 「각 괘선의 전체 길이」로 나누어 얻어진 값이 괘선 추출시 모호한 괘선이 부분적으로 통합된 정보에 따른 소정값보다 큰 경우에도 소정 영역에서 모호성이 검출된 것으로 판별한다.
또한, 「소정 임계값보다 큰 흑 화소 밀도를 나타내는 연결 영역의 수」를 「소정 영역에 있는 연결 영역의 전체 수」로 나누어 얻어진 값이 소정값보다 큰 경우 소정 영역에서 변형성이 검출된 것으로 판별된다.
도 11은 도 8에 도시된 품질 분석 단계의 흐름도이다.
도 11에서, 전체적인 품질 분석은 스텝 S31에서 실시된다. 전체적인 품질 분석은 모든 문서/서식에 대해 실시되며, 입력 이미지를 이진화하는데 사용된 임계값이 적절한지, 팩시밀리를 통해 전송된 후에 제공된 잡음을 가진 문서/서식의 품질이 허용가능한 것인지, 모호성 또는 변형성이 발생되었는지 여부를 판별한다.
그런 다음, 국부적인 품질 분석이 스텝 S32에서 실시된다. 국부적인 품질 분석은 모호성 또는 변형성이 발생되었는지 또는 레이아웃 분석에서 1문자 테두리, 텍스트, 자유피치 문자 테두리, 표 등의 속성이 지정된 각 영역에서 잡음이 발생되었는지를 체크하는 것으로 실시된다.
다음에, 도 8에 도시된 스텝 S4에서 정정 분석이 실시된다. 정정 분석에서는 입력 이미지로부터 삭제 라인이 추출되며, 삭제 라인으로 정정된 문자에 대한 문자 인식 처리는 생략될 수 있다.
도 12는 도 8에 도시된 정정 분석 단계를 도시하는 흐름도이다.
도 12에서, 정정 특징이 스텝 S41에서 추출된다. 상기 정정 특징 추출시 정정된 문자의 특징이 추출된다. 정정 문자는 변형 문자, 이중 라인으로 제거된 문자, 대각선으로 제거된 문자, 기호 "x"로 제거된 문자 등 4가지 종류의 문자중 하나로 될 수 있다. 정정 문자 각각의 특징은 흑 화소 밀도, 라인 밀도, 오일러 수, 히스토그램 값 등을 계산하여 추출될 수 있다.
다음에는 스텝 S42에서 정정 문자 후보 추출 처리가 실시된다. 정정 문자에 대한 후보는 정정된 문자의 특징을 나타내는 특징 공간에서 정정된 문자와 비정정 통상 문자와의 차이를 기초로 하여 추출된다.
다음, 도 8에 도시된 스텝 S5에서 문자 비문자 인식 제어가 실시된다. 문자/ 비문자 인식 제어에서는 도 8에 도시된 스텝 S2 내지 S4에서 추출된 입력 이미지의 상태를 기초로 하여 문자 인식부(12)의 기본 문자 인식부(17), 문자열 인식부(15), 테두리-접촉 문자 인식부(13), 모호한 문자 인식부(19) 및 변형 문자 인식부(21)와, 비문자 인식부(25)의 삭제 라인 인식부(26) 및 잡음 인식부(28)중에서 어떤 것을 호출할지 결정한다. 상기 제어에서, 중간 처리 결과표가 판독되고, 처리 순서 제어 규칙이 종결되며, 제어 실행 규칙에 따라 처리가 실시된다.
처리 순서 제어 규칙은 환경 인식 시스템(11)에 의해 추출된 상태를 기초로 하여 문자 인식부(12)의 기본 문자 인식부(17), 문자열 인식부(15), 테두리 접촉 문자 인식부(13), 모호한 문자 인식부(19) 및 변형 문자 인식부(21)와, 비문자 인식부(25)의 삭제 라인 인식부(26) 및 잡음 인식부(28)중에서 호출되는 호출 절차를 보여준다.
처리 실행 규칙은 처리 순서 제어 규칙에 따라 호출된 인식 처리의 결과를 기초로 하여 다음번 실행될 처리의 절차를 가리켜준다.
중간 처리 결과표는 레이아웃 분석을 통해 1문자 테두리, 텍스트, 자유피치 문자 테두리, 표 등의 속성이 지정된 영역 각각에 대해 도 8에 도시된 스텝 S2 내지 S4에서 추출된 입력 이미지의 상태를 포함한다. 중간 처리 결과표에는 입력 처리 순서 제어 규칙에 따라 호출된 처리가 처리 순서표에 저장되는 처리 순서로 입력된다.
예를 들어, 환경 인식 시스템(11)이 문자를 추출할 때 기본 문자 인식부(17)가 호출되어 문자에 대한 인식 처리를 실행한다. 환경 인식 시스템(11)이 도 10에 도시된 스텝 S21에서 텍스트를 추출할 때에는 문자열 인식부(15)가 호출되어 텍스트에 대한 인식 처리를 실행한다. 환경 인식 시스템(11)이 도 10에 도시된 스텝 S25에서 테두리 접촉 문자를 추출할 때에는 테두리 접촉 문자 인식부(13)가 호출되어 테두리 접촉 문자에 대한 인식 처리를 실행한다. 스텝 S32에서 환경 인식 시스템(11)이 「각각의 소정 임계값보다 작은 면적, 길이, 폭을 갖는 연결 영역의 수」를 「소정 영역의 모든 연결 영역의 수」로 나누어 얻어진 값이 소정값보다 큰 것으로 판별하는 경우, 모호한 문자 인식부(19)가 호출되어 그 영역내의 문자에 대한 인식 처리를 실행한다. 스텝 S32에서 환경 인식 시스템(11)이 「소정 임계값보다 큰 흑 화소 밀도를 나타내는 연결 영역의 수」를 「소정 영역에 있는 연결 영역의 전체 수」로 나누어 얻어진 값이 소정값보다 큰 것으로 판별하는 경우, 변형 문자 인식부(21)가 호출되어 그 영역내의 문자에 대한 인식 처리를 실행한다. 환경 인식 시스템(11)이 도 12에 도시된 스텝 S42에서 정정 문자에 대한 후보를 추출할 때에는 삭제 라인 인식부(26)가 호출되어 정정 문자의 후보에 대한 인식 처리를 실행한다. 환경 인식 시스템(11)이 도 11에 도시된 스텝 S32에서 잡음을 검출하는 경우, 잡음 인식부(28)가 호출되어 잡음에 대한 인식 처리를 실행한다.
도 13은 도 8에 도시된 문자 인식 처리/비문자 인식 처리의 제어를 나타내는 흐름도이다.
도 13에서는 중간 처리 결과표가 판독되고 처리 순서 제어 규칙이 스텝 S51에서 실행된다.
스텝 S52에서는 처리가 종료되었는지 여부를 판별한다. 중간 처리 결과표 상의 모든 처리가 처리 순서 제어 규칙을 기초로 하여 종료되고 중간 처리 결과표 상의 모든 처리 지시란이 종료 엔트리를 포함하는 경우, 처리가 종료된 것으로 판별한다. 처리가 아직 종료되지 않았다고 판별되면, 처리 실행 규칙에 따른 처리를 실시한 후 제어가 스텝 S53을 통해 스텝 S51으로 복귀하며, 스텝 S52에서 처리가 종료된 것으로 판별될 때까지 전술한 처리 과정이 반복된다.
도 14는 본 발명의 일실시예에 따른 패턴 인식 장치의 구성을 도시한 블록도이다.
도 14에서, 이미지 저장부(41)는 서식 이미지를 저장한다. 처리 조건 저장부(42)는 서식의 레이아웃 구조와 같은 정의를 저장하며, 문자 정보 예컨대 문자 테두리의 위치, 종류 및 사이즈, 문자의 종류, 문자의 수 등을 판독한다. 라벨링된 이미지 저장부(43)는 압축되고 라벨링된 이미지를 저장한다.
환경 인식 시스템(30)은 레이아웃 분석부(31) 및 정정 분석부(32)를 구비한다. 환경 인식 시스템(38)은 특이 문자 분석부(39) 및 종료 판정부(40)를 구비한다. 문자/비문자 인식 시스템(33)은 기본 문자 인식부(34), 흑 문자 테두리 접촉 문자 인식부(35), 자유피치 문자열 인식부(36), 삭제 라인 인식부(37)를 구비한다.
레이아웃 분석부(31)는 라벨링된 이미지 저장부(43)에 저장된 라벨링된 이미지에 대한 처리 조건 저장부(42)에 저장된 정의를 참조하여, 괘선, 문자 테두리, 흑 문자-테두리 접촉 문자를 추출한다. 문자 테두리의 위치 및 사이즈에 관한 포맷 정보 및 리스트 데이타로서 문자 테두리의 포즈에 관한 정보를 미리 저장하는 방법은 예컨대 특개소 62-21288 및 특개평 3-126186에 기재되어 있다.
예를 들어, 특개평 6-309498 및 7-28937에 기재된 바와 같이, 괘선 및 문자 테두리는 문자 테두리의 위치 및 사이즈와 같은 포맷 정보를 입력하지 않고도 추출될 수 있다.
정정 분석부(32)는 삭제 라인에 대한 후보를 추출한다. 특이 문자 분석부(39)는 개인 수기 특성을 갖는 특이 문자를 분석한다. 종료 판정부(40)는 문자 인식 처리의 종료을 판정하며, 처리가 종료되었다고 판정되면 문자 인식 결과를 출력한다.
기본 문자 인식부(34)는 검출된 문자를 하나씩 인식한다. 흑 문자 테두리 접촉 문자 인식부(35)는 흑 문자 테두리 접촉 문자로부터 문자 테두리를 제거하고, 문자 테두리를 제거하여 모호한 문자를 보완한 다음 문자를 인식한다. 자유피치 문자열 인식부(36)는 문자가 문자열로부터 검출될 때 검출 신뢰도를 고려하여 문자열의 문자를 인식한다. 삭제 라인 인식부(37)는 정정된 문자의 흑 화소 밀도, 라인 밀도, 오일러 수, 히스토그램 등을 기초로 하여 삭제 라인을 인식한다.
중간 처리 결과표(44)는 문자/비문자 인식 시스템(33)의 어떤 처리가 실행될 것인지 지시하는 처리 순서와, 환경 인식 시스템(30, 38)에 의해 추출된 상태를 기초로 하여 상기 처리 결과를 저장한다.
도 15는 도 5 내지 도 7에 도시한 패턴 인식 장치가 추가된 문자 인식 시스템의 실제 구성을 도시하는 블록도이다.
도 15에서, 중앙 처리부(CPU)(51)는 각종 처리를 실행한다. 프로그램 메모리(50)는 CPU(51)가 실행할 프로그램을 저장한다. 이미지 메모리(52)는 이미지 데이타를 비트맵 포맷으로 저장한다. 작업 메모리(53)는 이미지 처리에 사용된다. 스캐너(59)는 이미지를 광학적으로 판독한다. 메모리(58)는 스캐너(59)가 판독한 정보를 임시적으로 저장한다. 사전 파일(60)은 각 문자 이미지의 특징을 저장한다. 디스플레이(56)는 인식 결과를 디스플레이하고, 프린터(57)는 인식 결과를 프린트한다. 인터페이스 회로(55)가 디스플레이(56) 및 프린터(57)를 위해 작용한다. 버스(54)는 CPU(51), 프로그램 메모리(50), 이미지 메모리(52), 작업 메모리(53), 메모리(58), 사전 파일(60), 인터페이스 회로(55)를 연결시킨다.
문자 인식 시스템은 스캐너(59)가 판독한 이미지 데이타를 메모리(58)에 일시적으로 저장시키고 이미지 데이타를 비트맵 포맷으로 만들어 이미지 메모리(52)에 기억시킨다. 그 다음, 이미지 메모리(52)로부터 작업 메모리(53)에 복사된 이진 이미지 데이타에 대한 패턴 추출 처리를 실행한다. 그 결과를 기초로 하여, 스캐너(59)가 판독한 이미지 데이타로부터 문자 이미지를 검출한다. 검출된 문자 이미지의 특징이 사전 파일(60)에 저장된 특징 데이타와 비교되어 문자를 인식한 다음 인식 결과는 디스플레이(56) 또는 프린터(57)로 출력된다.
상기 문자 인식 시스템에서, 도 5 내지 도 7에 도시된 패턴 인식 장치는 프로그램 메모리(50)에 저장된 프로그램에 따라 처리를 실행하는 CPU(51)의 기능을 가짐으로써 실현될 수 있다.
이하, 도 7에 도시된 환경 인식 시스템(11), 문자 인식부(12), 비문자 인식부(25)의 구성에 대해 설명하겠다.
도 16은 도 9에 도시된 스텝 S11에서 실행된 라벨링 처리를 도시한 것이다.
"0" 및 "1"로 구성되는 이진 이미지가 도 16에 도시된 바와 같은 라벨링부(70)로 입력될 때, 라벨링부(70)는 입력 이진 이미지로부터 연결 화소를 포함하는 연결 패턴을 추출하고, 각각의 연결 패턴에 대한 라벨이 지정된 라벨링된 이미지를 작성하여, 라벨링 이미지 저장부(71)에 저장시킨다. 예를 들어, "0" 및 "1"로 구성되는 이진 이미지(72)가 입력되면, 각각의 연결 패턴에 라벨 "1", "2", "3"이 지정되어 있는 라벨링된 이미지(73)가 발생된다.
하나의 이미지가 255개 연결 패턴을 포함한다면, 총 255개 라벨이 필요하다. 하나의 화소가 8비트를 필요로 하므로, 라벨링된 이미지 저장부(71)의 저장 용량은 전체 이미지의 화소수의 8배와 같으며, 따라서 라벨링된 이미지를 저장하기 위해서는 많은 저장 용량이 필요하다.
도 17a 내지 도 17d는 도 16에 도시된 라벨링된 이미지(73)를 압축함으로써 라벨링 이미지 저장부(71)에 필요로 하는 저장 용량을 감소시키는 방법을 도시한 것이다.
도 17a 및 도 17b에서 도시한 바와 같이 연결 패턴 A1및 A2에 각각 라벨 "1" 및 "2"이 지정된다. 도 17c에 도시된 바와 같이 사각형 B1은 연결 패턴 A1을 둘러싸고, 사각형 B2는 연결 패턴 A2을 둘러싼다. 외접 사각형 B1및 B2는 도 17d에 도시된 바와 같이 외접 사각형 B1및 B2의 좌상 정점의 좌표 (x1, y1) 및 우하 정점의 좌표(x2, y2)에 의해 특정될 수 있다.
다음에, 연결 패턴 A1을 둘러싸는 사각형 B1이 연결 패턴 A2을 둘러싸는 사각형 B2과 중첩하는지 여부를 판별한다. 연결 패턴 A1을 둘러싸는 사각형 B1이 연결 패턴 A2을 둘러싸는 사각형 B2과 중첩하지 않는다면, 외접 사각형 B1및 B2의 좌상 정점의 좌표 (x1, y1) 및 우하 정점의 좌표 (x2, y2)가 저장된다.
한편, 연결 패턴 A1을 둘러싸는 사각형 B1이 연결 패턴 A2을 둘러싸는 사각형 B2과 중첩한다면, 외접 사각형 B1및 B2은 더 작은 사각형 영역으로 분할되어 그 외접 사각형들이 다른 외접 사각형과 중첩되지 않게 한다. 그 다음, 각각의 분할된 사각형 영역이 원래의 외접 사각형 B1및 B2에 속하는지 판별한다. 연결 패턴 A1및 A2은 가산, 감산 등과 같은 대수 연산에 의해 표현된다.
예를 들어, 도 17c에서, 연결 패턴 A1은 하기의 식과 같이 사각형 영역(1-1) 과 사각형 영역 (1-2)간의 차로 표현될 수 있는데, 여기서 (1-1)은 연결 패턴 A1에 속하는 최대 사각형 영역을 가리키며, (1-2)는 사각형 영역 (1-1)에 포함된 사각형 영역을 나타낸다.
유사하게, 연결 패턴 A2은 A2= (2 - 1) - (2 - 2) + (2 - 3)와 같이 사각형 영역 (2-1)과 사각형 영역 (2-2)간의 차에 사각형 영역 (2-3)을 더한 것으로 표현될 수 있는데, 여기서 (2-1)은 연결 패턴 A2에 속하는 최대 사각형 영역을 가리키며, (2-2)은 사각형 영역 (2-1)에 포함된 사각형 영역을 가리키고, (2-3)은 사각형 영역 (2-2)에 포함된 사각형 영역을 가리킨다.
따라서, 라벨링된 이미지를 저장하는데 필요한 저장 용량은 일련의 화소를 둘러싸는 사각형으로 연결 패턴을 표현하여 연결 패턴을 나타내는 정보의 용량을 감소시킴으로써 감소될 수 있다.
라벨링된 이미지를 압축하는 방법은 특개평 8-55219에 개시되어 있다.
도 18은 도 10에 도시된 스텝 S21에서의 텍스트 인식 처리의 일예를 도시하는 흐름도이다.
도 18에 도시된 바와 같이, 스텝 S61에서 스캐너에 의해 문서를 판독하고 판독된 문서의 이미지 데이타를 메모리에 저장한다.
다음, 스텝 S62에서는 스텝 S61에서 판독된 이미지 데이타중 수평 방향의 특정 스트립 부분만을 주목하고, 주목한 부분에 대해 라벨링 처리를 실행하여, 흑 연결 화소의 외접 사각형을 구한다.
예를 들어, 처리 대상으로서 복수의 문서 A, B, C가 처리되고, 도 19a의 문서 A의 문자열(81) 영역이 도 19d에 도시된 바와 같이 구간 A내에 있고, 도 19b의 문서 B의 문자열(82) 영역이 도 19d에 도시된 바와 같이 구간 A내에 있고, 도 19c의 문서 C의 문자열(83) 영역이 도 19d에 도시된 바와 같이 구간 B내에 있다면, 구간 A 및 B에 있는 부분 영역만이 주목되며, 연결된 흑 화소의 외접 사각형을 얻기 위해 그 부분 영역의 스트립 부분내에서만 라벨링 처리가 실행된다.
스텝 S63에서는 스텝 S62에서 구한 외접 사각형의 높이와 사전에 구한 사각형의 ylen 간의 차이가 임계값 thy 보다 작고, 스텝 S62에서 구한 외접 사각형의 폭과 사전에 구한 사각형의 폭 xlen 간의 차이가 임계값 thx 보다 작은 외접 사각형만을 추출한다. 그런 다음, 외접 사각형의 y 방향(수직 방향)의 좌표를 구하여 메모리에 저장한다.
스텝 S64에서는 스텝 S63에서 구한 y 방향의 좌표를 중심으로 하여 스텝 S62에서 추출한 사각형을 포함하고 좌우 방향의 폭이 이미지의 폭과 동일한 부분 영역을 주목한다.
스텝 S65에서는 스텝 S64에서 구한 부분 영역을 라벨링함으로써 연결된 흑 화소의 외접 사각형을 구한다.
스텝 S66에서는 스텝 S65에서 구한 외접 사각형의 높이와 사전에 구한 사각형의 높이 ylen 간의 차이가 임계값 thy 보다 작고 스텝 S65에서 구한 외접 사각형의 폭과 사전에 구한 사각형의 폭 xlen 간의 차가 임계값 thx 보다 작은 외접 사각형만을 추출하여, 메모리에 저장한다.
스텝 S67에서는 스텝 S66에서 추출한 사각형을 x 좌표로 소트하고, 추출한 사각형의 중심선의 간격으로부터 피치를 계산하여, 계산에 의해 구해진 피치와 사전에 구한 작은 피치간의 차가 임계값 thPITCH 보다 사각형이 수평 방향으로 소정수 thPITCH 또는 그 이상으로 배열된 것을 텍스트로서 출력한다.
상기 텍스트 추출법은 예컨대 특개평 8-171609에 개시되어 있다.
이하, 도 10에 도시한 스텝 S22에서의 괘선 추출 처리의 한 예를 설명한다.
괘선 추출 처리에서는 라벨링 처리로 구한 연결 패턴이 수평 및 수직 방향으로 복수의 섹션으로 분할된다. 수평 및 수직으로 분할된 패턴의 각 섹션내에서 연결 패턴의 인접 투영값이 계산된다. 그러므로, 괘선은 사각형의 근사치를 통해 라인의 소정 길이의 한 부분을 검출함으로써 추출된다.
상기 예의 인접 투영에서는 대상의 행 또는 열의 투영값과 그 주변의 행 또는 열의 투영값의 합을 참조한다. 대상의 행 또는 열의 투영값은 그 행 또는 열에 존재하는 흑 화소의 전체 수를 계산하여 구해진다.
도 20는 인접 투영 처리를 도시한 것이다.
도 20에서, i 행의 투영값을 p(i)라 하면, 인접 투영값 P(i)은 하기의 수학식 1에 의해 계산될 수 있다.
P(i) = p(i-j) + ··· + p(i) + ··· + p(i+j)
도 20의 예에 있어서, 수학식 1의 j는 1로 한다.
도 21는 부분 패턴의 투영값의 일예를 도시한다. 도 21에서, 길이 Ly및 폭 Lx을 갖는 사각형(84)에서 수평 방향 j의 투영값 Ph(i)이 HP(i)이고, 수직 방향 i의 투영값 Pv(j)이 VP(j)라고 하면, HP(1) = HP(n) = m, HP(2) ~ HP(n-1) = 2, VP(1) = VP(m) = n, VP(2) ~ VP(m-1) = 2 이 된다.
만일 사각형(84)의 일부를 형성하는 직선이 존재한다면, 투영값은 커진다. 따라서 괘선의 일부를 형성하는 직선이 추출될 수 있다.
예를 들어, 괘선의 일부를 형성하는 직선에 대한 후보는 각각의 수직 및 수평 분할 길이에 대한 인접 투영값의 비율이 소정 임계값보다 작거나 같은 부분 패턴을 검출함으로써 추출될 수 있다.
도 22는 괘선 추출 처리를 도시하는 흐름도이다.
도 22에서, 각각의 수직 및 수평 분할 길이에 대한 인접 투영값의 비율이 소정의 임계값보다 크거나 같은지의 여부를 스텝 S601에서 판별한다. 소정 임계값보다 크거나 같지 않다면, 스텝 S602으로 진행되고 괘선의 일부를 형성하는 선분이 존재하지 않는 것으로 가정한다.
스텝 S601에서 각각의 수직 및 수평 분할 길이에 대한 인접 투영값의 비율이 소정의 임계값보다 크거나 같다고 판별되면, 스텝 S603으로 진행되고 괘선의 일부를 형성하는 선분이 존재한다고 가정한다.
스텝 S604에서는 스텝 S603에서 라인으로 간주된 패턴이 그 상하의 라인과 접하는지의 여부를 판별한다. 패턴이 상하의 라인에 접촉하지 않는 것으로 판별되면, 스텝 S605으로 진행하여, 그 패턴은 사각형의 라인 선분으로 규정된다.
스텝 S604에서, 스텝 S603에서 라인으로 간주된 패턴이 패턴 라인과 접촉하는 것으로 판별되면, 스텝 S606으로 진행되어 그 패턴이 패턴 상하의 라인에 통합된다. 스텝 S607에서는 스텝 S606에서 통합된 라인이 사각형 라인으로 검출된다. 예컨대, 도 23a에 도시된 3개의 사각형 라인(85)이 통합되어 도 23b에 표시된 사각형 라인(86)이 얻어진다. 그에 따라, 스텝 S605 또는 S607에서 구해진 사각형 라인에 대한 탐색을 통해 괘선이 추출된다.
전술한 괘선 추출 처리는 특개평 6-309498 호에 개시되어 있다.
도 24는 도 10에 도시된 스텝 S22의 괘선 추출 처리에서 모호한 괘선을 보완하면서 실행되는 탐색 방법을 도시한다.
모호한 괘선을 보완하는 방법은 직선을 형성하는 패턴에 대한 탐색을 행하고 나서 실행된다. 패턴을 갖지 않는 영역이 탐색 방향에 존재하는 경우에도, 소정값보다 작은 화소수를 포함하는 공백 영역에 패턴이 존재하는 것으로 가정한다.
예를 들면, 직선(91)의 일부를 형성하는 화소(92)가 도 24에 도시된 바와 같이 직선(91)으로부터 검색되는 경우, 소정값보다 작은 화소의 수를 포함하는 공백 영역(93)에 대해서는 화소(92)가 존재하는 것으로 가정하여 탐색된다.
도 25는 괘선 추출 처리에서 모호한 괘선을 보완하는 방법을 나타내는 흐름도이다.
도 25에서, 스텝 S71에서는 소정의 사각형 영역에서 패턴의 가장 좁은 부분의 X 좌표를 산출한다.
스텝 S72에서는 스텝 S71에서 산출된 X 좌표에서의 패턴의 중심점을 산출한다. 스텝 S73에서는 스텝 S72에서 산출된 패턴의 중심점이 탐색 개시점으로 설정된다. 탐색 개시점은 패턴의 가장 좁은 부분에 설정되는데, 그 이유는 가장 좁은 부분이 문자일 가능성이 적으며 문자 테두리의 직선 선분이 검출될 가능성이 크기 때문이다.
스텝 S74에서는 직선의 탐색 방향을 "우측"으로 설정한다.
다음에, 스텝 S75에서는 공백 영역의 길이를 카운트하는 변수 K의 초기값을 0으로 설정한다.
스텝 S76에서는 스텝 S73에서 구한 개시점을 패턴 탐색의 현재 위치로 설정한다.
스텝 S77에서는 스텝 S76에서 설정된 현재 탐색 위치가 스텝 S71에서 주목된 사각형의 범위내에 있는지 판별한다. 현재 탐색 위치가 스텝 S71에서 주목된 사각형의 범위내에 있지 않다면 스텝 S86으로 진행한다.
스텝 S77에서, 현재 탐색 위치가 스텝 S71에서 주목된 사각형의 범위내에 있는 것으로 판별되면, 스텝 S78으로 진행하여 패턴이 탐색 방향에서 현재 탐색 위치 다음에 위치하는지 여부를 판별한다. 탐색 방향에서 현재 탐색 위치 다음에 위치한 패턴은 도 26에 도시된 바와 같이 패턴(101) 우측의 패턴(102)을 참조한다. 패턴(102)이 탐색 방향에서 현재 탐색 위치 다음에 위치하는 것으로 판별되면, 스텝 S81으로 진행하여 탐색 방향에서 현재 위치 다음의 패턴(102)이 현재 위치로 설정된다.
스텝 S78에서 패턴이 탐색 방향에서 현재 위치 다음에 위치하지 않는 것으로 판별되면, 스텝 S79으로 진행하여 패턴이 탐색 방향에서 현재 위치의 대각선 위 또는 아래에 위치하는지의 여부가 판별된다.
탐색 방향에서 현재 위치의 대각선 위 또는 아래에 위치하는 패턴은 도 26에 도시된 바와 같이 패턴(103)의 대각선 위 또는 아래의 패턴(104a 또는 104b)을 참조한다. 패턴(104a 및 104b)이 탐색 방향에서 현재 위치의 대각선 위 또는 아래에 위치하는 것으로 판별되면, 스텝 S83으로 진행하여 현재 위치의 대각선 위 또는 아래의 패턴(104a 및 104b)이 현재 위치로 설정된다. 탐색 방향의 현재 위치의 대각선 위 또는 아래에 2개의 패턴(104a 및 104b)이 있다면, 패턴(104a 및 104b)중 하나가 현재 위치로 설정된다.
스텝 S79에서 패턴(104a 및 104b)이 탐색 방향에서 현재 위치의 대각선 위 또는 아래에 위치하지 않는 것으로 판별되면, 스텝 S80으로 진행하여 공백 영역의 길이를 카운트하는데 사용하는 변수 K가 소정의 임계값보다 작거나 같은지의 여부를 판별한다. 공백 영역의 길이를 카운트하는데 사용하는 변수 K가 소정의 임계값보다 작거나 같다고 판별되면, 스텝 S84으로 진행하여 탐색 방향에서 인접하여 있고 패턴의 일부를 형성하지 않는 화소가 현재 위치로 설정된다. 예를 들어, 도 24에 도시된 바와 같이 소정수 또는 그 이하의 화소를 갖는 공백 영역(93)에 대해 패턴이 존재하는 것으로 가정하고 탐색 처리를 실시한다.
스텝 S85에서는 공백 영역의 길이를 카운트하는데 사용하는 변수 K를 1 도트씩 증가시키고, 그 후 스텝 S77으로 복귀한다.
스텝 S80에서 공백 영역의 길이를 카운트하는데 사용하는 변수 K가 소정 임계값보다 작거나 같지 않은 것으로 판별되면, 스텝 S86으로 진행하여 탐색 방향이 "우측"으로 설정되었는지의 여부를 판별한다. "우측"으로 설정되지 않았으면 처리를 종결한다.
스텝 S86에서 탐색 방향이 "우측"으로 설정되었다면, 스텝 S87으로 진행하여 탐색 방향이 "좌측"으로 설정된다. 그 다음, 스텝 S75 내지 S85의 처리를 탐색 방향이 "우측"으로 설정되었을 때와 동일하게 반복하여 실시한다.
탐색 방향을 "좌측"으로 설정하여 처리를 실행하는 경우, 탐색 방향에서 현재 탐색 위치 다음에 위치한 패턴으로서 도 26에 도시된 바와 같이 패턴(105)의 좌측의 패턴(106)이 참조된다. 탐색 방향의 현재 위치의 대각선 위 또는 아래에 위치하는 패턴은 도 26에 도시된 바와 같이 패턴(107)의 대각선 위 또는 아래의 패턴(108a 또는 108b)을 참조한다.
다음에, 스텝 S23에서의 문자 테두리 추출 처리에 대해 설명한다.
도 27는 1문자 테두리 추출 처리의 한 예를 나타내는 흐름도이다.
도 27에 도시된 바와 같이, 스텝 S91에서는 도 22에 도시된 처리에 따라 사각형의 한 라인으로 검출된 패턴에 대해 탐색이 실시된다. 이 때, 도 25의 흐름도에 도시된 바와 같이 소정 길이의 공백 영역에 대해 패턴이 존재한다고 가정하여 탐색 처리가 실시되므로, 모호성 문제는 해결될 수 있다.
스텝 S91에서의 탐색 후에 스텝 S92에서는 패턴이 소정 길이로 절단되었는지 여부를 판별한다. 소정 길이로 절단되지 않았다면, 도 28에 도시된 블록 문자 테두리 추출 처리로 진행한다. 소정 길이로 패턴이 절단되었다면, 스텝 S93으로 진행하여 탐색된 라인을 직선으로 통합한다.
다음에, 스텝 S94에 도시된 바와 같이 사각형을 형성하는 직선은 스텝 S93에서 검출된 직선으로부터 추출된다.
스텝 S95에서는 4개의 직선에 의해 둘러 싸여진 부분의 크기가 이미지내의 1 문자 테두리의 크기의 소정 범위내에 있는지의 여부를 결정한다. 만일 4개의 직선에 의해 둘러 싸여진 부분의 크기가 이미지내의 1문자 테두리의 크기의 소정 범위 이내인 것으로 판정되면, 스텝 S96으로 진행하여 상기 4개의 직선에 의해 둘러 싸여진 부분이 1문자 테두리로서 간주된다. 만일 4개의 직선에 의해 둘러 싸여진 부분의 크기가 이미지내의 1문자 테두리의 크기의 소정 범위 이내가 아닌 것으로 판정되면, 스텝 S97로 진행하여 상기 4개의 직선에 의해 둘러 싸여진 부분이 1문자 테두리로서 간주되지 않는다.
도 28은 블록 문자 테두리 추출 처리의 실시예를 도시하는 흐름도이다.
도 28에 도시한 바와 같이, 스텝 S101에서는 탐색 처리에서 검출된 수평선이 소정값보다 긴지의 여부가 결정한다. 만일 탐색 처리에서 검출된 수평선이 소정값보다 짧으면, 스텝 S102로 진행하여 상기 수평선을 테두리의 수평선 형성부로서 간주하지 않는다. 만일 탐색 처리에서 검출된 수평선이 소정값과 동일하거나 긴 것으로 결정되면, 스텝 S102로 진행하여 상기 탐색 처리에서 검출된 수평선을 테두리의 수평선 형성부로서 간주한다.
문자 테두리의 인접한 2개의 수평 선분은 스텝 S104에 나타낸 바와 같이 스텝 S103에서 추출된 수평선으로부터 추출된다.
이어서, 스텝 S104에서 추출된 테두리의 2개의 수평 선분에 의해 둘러 싸여진 영역이 스텝 S105에서 1행의 블록 문자 테두리로서 간주된다.
스텝 S106에서는 도 22에 도시된 처리에서 검출된 사각형을 형성하는 직선을 추출함으로써 수직선을 검출한다.
이어서, 스텝 S107에서는 스텝 S106에서 검출된 수직선이 탐색된다. 스텝 S108에서는 상기 수직선이 스텝 S104에서 검출된 문자 테두리부를 형성하는 수평선에 도달되어 있는지의 여부가 결정된다. 만일 상기 수직선이 상기 테두리의 수평 선분에 도달되어 있지 않으면, 스텝 S109로 진행하여, 상기 수직선을 수직선에 대한 후보로부터 제거한다. 상기 수직선이 상기 테두리의 상부 및 하부측에 접촉할 경우에는 스텝 S110으로 진행하여, 상기 수직선을 상기 테두리의 수직 선분의 후보로서 간주한다.
스텝 S111에서는 처리 대상이 규칙적인 표 형식 블록 문자 테두리인지 또는 불규칙적인 표 형식 블록 문자 테두리인지의 여부가 판정된다. 만일 상기 처리 대상이 규칙적인 표형 블록 문자 테두리이면, 스텝 S112로 진행하여 스텝 S110에서 문자선의 수직 선분의 후보로서 간주된 수직선들간의 간격을 산출하는 동시에 산출된 수직선간의 간격과 수직선의 출현 빈도와의 관계를 나타내는 히스토그램을 산출한다.
스텝 S113에서는 다른 간격과 상이한 간격을 형성하는 수직선을 문자 테두리의 인접한 2개의 수평선 형성부에 의해 둘러 싸여진 범위내의 문자 테두리의 수직선 형성부의 후보에서 제거한다. 나머지 수직선은 테두리의 수직선 형성부로서 간주됨으로써 처리가 종료된다.
만일 스텝 S111에서 상기 처리 대상이 불규칙적인 표 형식 블록 테두리인 것으로 판정되면, 스텝 S110에서 판정된 수직선에 대한 모든 후보가 테두리의 수직 선분으로서 간주됨으로써 처리가 종료된다.
이하에서는 도 10에 도시한 스텝 S24에서의 테두리의 종류/표 판별 처리에 관해 기술한다.
도 29a 내지 도 29e는 도 10에 도시한 스텝 S23의 테두리 추출 처리에서 추출된 문자 테두리 및 표의 예를 도시하고 있다.
도 29a는 1문자 테두리를 나타내고, 도 29b는 자유피치 테두리를 나타내며, 도 29c는 블록 문자 테두리를 나타내고, 도 29d는 규칙적인 표를 나타내며, 도 29e는 불규칙적인 표를 나타낸다. 1문자 테두리는 1문자 테두리의 속성이 지정된다. 자유피치 테두리는 자유피치 테두리의 속성이 지정된다. 블록 문자 테두리는 블록 문자 테두리의 속성이 지정된다. 표는 표의 속성이 지정된다.
상기 문자 테두리 추출 처리 및 테두리의 종류/표 판별 처리는 일본 특개평 7-28937 호에 개시되어 있다.
다음에는 도 10에 도시한 스텝 S25의 문자의 테두리 접촉 유무를 판별하는 처리에 관해 기술한다. 이 처리에서, 원래의 입력 이미지는 OR 처리에서 1/n의 축소율을 사용해서 축소되고, 이어서 테두리 접촉 문자의 유무의 판별 처리가 행해진다. 상기 이미지의 각각의 화소에 대응하여 좌표가 설정된다. X 좌표는 이미지의 수평 방향을 따라 설정된다. Y 좌표는 이미지의 수직 방향을 따라 설정된다. X 좌표는 우측 방향으로 증가하고, Y 좌표는 하부 방향으로 증가한다.
도 30은 입력 이미지의 축소 처리의 실시예를 나타내는 흐름도이다.
도 30의 스텝 S121에서는 원래의 이미지가 입력된다.
이어서, 스텝 S122에서는 원래의 이미지의 좌측 상부로부터 수평 n 화소 × 수직 n 화소의 범위[좌측 상부 좌표(1,1), 우측 하부 좌표(X,Y)]가 설정된다.
스텝 S123에서는 원래의 이미지의 정해진 범위내에 흑 화소가 존재하는지의 여부가 판정된다. 만일 원래의 이미지의 정해진 범위내에 흑 화소가 존재하면, 스텝 S124로 진행하여 축소 이미지의 좌표(X/n,Y/n)의 화소를 흑 화소로 한다. 만일 원래의 이미지의 정해진 범위내에 흑 화소가 존재하지 않으면, 스텝 S125로 진행하여 축소 이미지의 좌표(X/n,Y/n)의 화소를 백 화소로 한다.
이어서, 스텝 S126에서는 원래의 이미지의 우측 하부까지 처리가 실행되었는지의 여부가 판정된다. 만일 원래의 이미지의 우측 하부까지 처리가 실행되었으면, 스텝 S127로 진행하여 가장 우측의 부분까지 처리가 실행되었는지의 여부를 판정한다.
만일 가장 우측의 부분까지 처리가 실행되지 않았으면, 처리된 범위의 우측에 수평 n화소 × 수직 n화소의 범위[좌측 상부 좌표(x,y), 우측 하부 좌표(X,Y)]를 설정한다. 만일 가장 우측의 부분까지 처리가 실행되었으면, 처리된 범위의 하부 및 원래의 이미지의 우측에 수평 n화소 × 수직 n화소의 범위[좌측 상부 좌표(x,y), 우측 하부 좌표(X,Y)]를 설정한다. 이어서,스텝 123으로 복귀하여 원래의 이미지의 전범위에 걸쳐 축소 처리가 완료될때까지 상술한 처리를 반복한다.
문자 테두리의 직선 선분의 내측을 따라 입력 이미지 축소 처리에서 처리된 압축 이미지 데이타의 탐색 처리가 실행됨으로써 문자의 테두리 접촉 여부가 결정된다. 사각형 영역은 문자와 접촉하는 측면에서 외측으로 소정의 거리만큼 확대된다. 확대된 사각형 영역의 좌표는 원래의 이미지 데이타의 좌표로 변환된다.
예컨대, 도 31a에 도시된 바와 같이, 압축된 이미지 데이타의 문자 테두리의 범위(110)가 추출되고, 문자 '4'(112)가 문자 테두리에 의해 둘러 싸여진 사각형 영역에 존재하며, 문자 '4'(112)가 문자 테두리의 하부측(111)에 접촉하는 것으로 가정한다.
도 31b에 도시한 바와 같이, 탐색 처리는 문자 테두리의 내측을 따라 직선으로 실행된다. 만일 탐색 라인이 임의의 패턴과 교차하면, 문자가 문자 테두리의 부근에 존재하여 문자가 문자 테두리에 접촉할 가능성이 있고, 문자 테두리에 의해 둘러 싸여진 사각형 영역에 존재하는 문자 '4'(112)는 문자 테두리와 접촉하는 것으로 가정한다. 이 예에서, 문자 '4'(112)는 문자 테두리의 하부측(111)에 접촉하는 것으로 가정한다.
이어서, 탐색 처리는 상기 문자 테두리의 하부측(111)의 내측을 따라 실행된다. 문자(112)가 문자 테두리의 하부측(111)을 접촉하는 것으로 간주되면, 테두리의 측면으로 둘러 싸여진 사각형 영역은 도 31c에 나타낸 바와 같이 문자(112)가 접촉하는 테두리의 하부측(111)에서 외측으로 확대된다. 확대된 사각형 영역(113)은 문자(112)를 포함하는 문자 영역으로 정해진다. 만일 문자가 테두리의 측면과 접촉하지 않는 것으로 가정하면, 테두리로 둘러 싸여진 부분은 문자 영역으로 정해진다.
이어서, 도 31c에 나타낸 사각형 영역(113)의 좌표는 원래의 이미지 데이타의 문자 영역을 압축 이미지 데이타의 문자 영역으로부터 얻기 위하여 원래의 이미지 데이타의 좌표로 변환된다. 따라서, 사각형 영역(116)은 도 31d에 도시한 바와 같이 원래의 이미지 데이타내에서 얻어질 수 있다.
사각형 영역(116)에서 문자 테두리의 측면(114)에 대해 투영 처리가 행해지고, 측면(114)의 좌표가 원래의 이미지 데이타로부터 계산된다. 이때, 문자 테두리의 측면(114)이 소정 길이의 스트립 형태의 사각형으로 표시된다. 도 31e에 나타낸 바와 같이, 사각형 영역(116)내의 패턴은 문자 보완 처리되도록 전송되고, 보완 처리는 원래의 이미지 데이타에 따라서 계산되는 문자 테두리의 측면(114)의 좌표에 기초하여 문자 테두리의 측면(114)에 접촉하는 문자(115)에 대해 행해진다.
도 32는 문자의 테두리에 접촉하는 문자의 유무를 판단하는 처리의 실시예를 도시하는 흐름도이다.
도 32의 스텝 S131에서는 예컨대 도 30에 나타낸 처리로 사각형을 압축 이미지 데이터로 표현한다.
스텝 S132에서는 4개의 수직 및 수평 직선으로 둘러싸인 사각형 부분을 추출한다.
이어서, 스텝 S133에서는 사각형 내부의 좌측 상부 코너 및 우측 하부 코너를 나타내는 좌표를 계산한다.
스텝 S134에서는 문자 테두리 내부의 사각형의 4개의 측면(수평 상부 측면, 수평 하부 측면, 수직 우측 측면 및 수직 좌측 측면)을 따라 압축 이미지를 검색한다.
스텝 S135에서의 검색 처리중에 상기 4개의 측면중 하나가 이미지 패턴과 교차하는 경우, 문자가 현재 검색되는 측면과 접촉하는 것으로 가정한다.
스텝 S136에서는 원래의 이미지 데이타의 사각형 영역이 압축 이미지 데이타의 사각형 영역으로부터 계산될 수 있도록 문자 테두리의 내측의 사각형의 좌표값을 원래의 이미지의 좌표값으로 변환한다.
스텝 S137에서는 스텝 S136에서 계산된 사각형 영역을 원래의 이미지 데이타의 문자 영역으로 한다. 문자가 테두리와 접촉하는 경우, 테두리 접촉 문자 범위 산출 처리는 스텝 S139 내지 S143에서 실행된다.
테두리 접촉 문자 범위 획득 처리에 있어서, 스텝 S139에서는 문자가 접촉하는 측면에서 외측으로 문자 영역을 확대하고, 스텝 S137에서 계산된 문자 영역 위치의 소정의 거리 외측의 위치를 문자 영역의 끝으로 한다.
스텝 S140에서는 스텝 S139에서 계산된 문자 영역에 포함된 문자 테두리의 측면의 위치 좌표를 원래의 이미지의 좌표로 변환시킴으로써 압축 이미지 문자 데이타의 테두리의 측면의 위치 좌표로부터 원래의 이미지 데이터의 문자 테두리의 측면의 위치 좌표를 계산한다.
스텝 S141에서는 스텝 S140에서 계산된 원래의 이미지 데이타의 문자 테두리의 위치 좌표에 기초하여 획득한 원래의 이미지 데이타의 테두리 영역에 대해, 수평 측면에 대해서는 수평 방향으로 그리고 수직 측면에 대해서는 수직 방향으로 투영 처리를 행한다.
다음에, 스텝 S142에서는 투영값이 일정치 이상인 영역을 원래 이미지의 테두리 좌표로 가정한다.
이어서, 스텝 S143에서는 계산된 원래 이미지 문자 영역의 좌표값과 문자 영역내의 테두리의 위치를 표시하는 좌표값을 문자 보완 처리에 보낸다.
스텝 S144에서는 계산된 원래 이미지 문자 영역의 좌표를 문자 영역으로 정한다.
이하에서는 도 12에 도시된 스텝 S41의 정정 특징 추출 처리 및 스텝 S42의 정정 문자 후보 추출 처리에 관해서 기술한다.
도 33a 내지 도 33e는 정정 문자의 실시예를 도시한다.
도 33a 내지 도 33e에서, 문자는 삭제 라인으로 정정된다. 문자는 도 33a 내지 도 33e에 도시한 바와 같이 도 33a에 나타낸 '×' 와, 도 33b에 나타낸 수평 이중선(=)과, 도 33c에 나타낸 대각선(//)과, 도 33d에 나타낸 불규칙적인 선과, 도 33e에 나타낸 블랙 페인팅(선을 칠함)에 의해서 삭제될 수 있다.
이러한, 정정 문자에 대해서는 정정 문자의 특징이 추출될 수 있다. 정정 문자의 특징으로서는 소정 방향의 라인 밀도, 오일러수 및 흑 화소 밀도를 예로 들수 있다.
'소정 방향의 라인 밀도'는 사각형내의 이미지를 소정의 일정 방향에 따라 주사할 때에 백화소에서 흑화소(또는 흑화소에서 백화소)로 변화하는 회수를 계수한 값이다. 또한, 소정 방향은 삭제 라인으로 가정한 선에 대해 수직 방향으로 설정된다.
예컨대, 도 34a는 문자 '6'에 대하여 수직 방향의 최대 라인 밀도를 계수한 예를 나타내고 있다. 이 예에서 수직 방향의 최대 라인 밀도는 3이다.
정정 문자의 '소정 방향의 라인 밀도'는 통상 문자의 '소정 방향의 라인 밀도'에 비해 증가하게 된다. 이 '소정 방향의 라인 밀도'를 계산함으로써 정정 문자의 후보를 추출할 수 있다.
오일러수 'E'는 이미지 내에 서로 연결된 연결 성분의 개수 C로부터 그 이미지가 갖고 있는 홀의 수 H를 감산함으로써 얻을 수 있다.
예컨대, 도 34b는 서로 연결된 연결 성분이 이미지내에 2개 존재하고, 그 이미지내에 단지 하나의 홀을 갖고 있는 예를 나타내고 있다. 이 예에서 오일러수 E는 E = C - H = 2 - 1 = 1 이다.
정정 문자의 오일러수는 절대값이 큰 음의 수가 되는 경향이 있고, 통상 문자의 오일러수는 절대값이 작은 값(2 ∼ -1)이 되는 경향이 있다. 따라서, 오일러수를 계산함으로써 삭제된 문자에 대한 후보를 추출한다.
흑화소의 밀도 D는 대상 이미지를 둘러싸는 사각형의 면적 S 대 대상 이미지의 면적 B(흑 화소의 수)의 비율을 나타낸다.
예컨대, 도 34c는 흑화소의 밀도 D가 문자 '4'에 대한 계산된 경우의 예를 나타내고 있다. S가 문자 '4'를 둘러싸는 사각형의 면적을 나타내고, B가 문자 '4'의 면적을 나타내는 것으로 하면, 밀도 D는 D = B/S로 나타낼 수 있다.
정정 문자의 '흑화소 밀도'는 통상 문자의 '흑화소 밀도' 이상이 될 것이다. '흑화소의 밀도'를 계산함으로써 정정 문자에 대한 후보를 추출한다.
이하에서는 도 7에 도시된 기본 문자 인식부(17)에 대하여 구체적으로 기술한다.
도 35는 기본 인식부(17)의 구성의 실시예를 나타내는 블록도이다.
도 35에서, 특징 추출부(121)는 미지의 입력 문자 패턴으로부터 문자의 특징을 추출하여 그 추출된 문자의 특징을 특징 벡터로서 나타낸다. 한편, 기본 사전(122)은 각각의 문자 카테고리의 특징 벡터를 저장한다.
조회부(123)는 특징 추출부(121)에 의해 추출된 미지 문자 패턴의 특징 벡터를 기본 사전(122)에 저장된 각각의 문자 카테고리의 특징 벡터와 대조하여, 특징 공간내의 특징 벡터들간의 거리(Dij)(i는 미지 문자의 특징 벡터를 나타내며, j는 기본 사전(122)의 카테고리의 특징 벡터를 나타냄)를 계산한다. 그 결과, 상기 특징 벡터들간의 가장 짧은 거리 Dij를 최소로 하는 카테고리 j를 미지 문자 i로서 인식한다.
특징 공간에서의 특징 벡터들간의 거리(Dij)는 유클리드 거리 ∑ (i-j)2, 시티블록 거리 ∑│i-j│, 또는 판별 함수와 같은 식별 함수를 사용하여 계산될 수 있다.
제1 카테고리로부터의 거리를 Dij1로 하고, 제2 카테고리로부터의 거리를 Dij2로 하면, 표 1은 제1 카테고리 j1, 제2 카테고리 j2, 거리(Dij2- Dij1), 및 카테고리간의 신뢰도를 사용하여 미리 작성된다. 또한, 표 2는 제1 카테고리로부터의 거리 Dij1, 제1 카테고리 j1, 및 신뢰도를 사용하여 작성된다. 표 1 또는 표 2 로부터 구한 보다 낮은 신뢰도가 중간 처리 결과표에 저장된다.
도 36a 내지 도 36d는 특징 벡터의 산출예를 도시하고 있다.
이 예에서 문자 '2'는 20 블록(수직 방향으로 5, 수평 방향으로 4)의 칼럼내에 기입된다. 흑색 블록은 '1'을 표시하고, 백색 블록은 '0'을 표시한다. 상기 블록들은 좌측 상부 블록으로부터 우측 하부 블록으로 순차적으로 조사된다. 문자 '1' 또는 '0'은 특징 벡터로서 재배열된다.
예컨대, 도 36b에 나타낸 특징 벡터 A는 벡터 A = (1,1,1,1,0,0,0, 1,1,1,1,1,1,0,0,0,1,1,1,1,)으로 나타내진다. 도 36c에 나타낸 특징 벡터 B는 벡터 B = (0,1,1,1,0,0,0,1,1,1,1,1,1,0,0,0,1,1,1,1,)으로 나타내진다. 도 36d에 나타낸 특징 벡터 C는 벡터 C = (1,1,1,1,0,0,0,1,0, 1,1,0,1,0,0,0,1,1,1,1,)으로 나타내진다.
도 37은 시티블록 거리 d(i,j)를 사용하여 특징 벡터들간의 거리 Dij의 산출예를 도시하고 있다.
N이 특징 벡터의 차수를 나타내고, i가 특징 벡터의 번호를 나타내는 것으로 하면, i 번째의 특징 벡터 Xi는 Xi= (Xi1, Xi2, Xi3,…, XiN)으로 표시되고, j 번째의 특징 벡터 Xj는 시티블록 d(i,j) 내에서 Xj= (Xj1, Xj2, Xj3,…, XjN)으로 표시된다. i 번째의 특징 벡터 Xi와 j 번째의 특징 벡터 Xj간의 시티블록 거리 d(i,j)는 다음과 같이 정의된다.
Figure pat00001
예컨대, 도 37에서 기본 사전(122)은 '1','2','3', 및 '4'의 문자 카테고리의 특징 벡터를 포함한다. '1'의 문자 카테고리의 특징 벡터 1은 벡터 1 = (0,1,1,0,0,1,1,0,0,1,1,0,0,1,1,0,0,1,1,0,)으로 나타내진다. '2'의 문자 카테고리의 특징 벡터 2는 벡터 2 = (1,1,1,1,0,0,0,1,1,1,1,1,1,0,0,0,1,1,1,1,)으로 나타내진다. '3'의 문자 카테고리의 특징 벡터 3은 벡터 3 = (1,1,1,1,0,0,0,1,1,1,1,1,0,0,0,1,1,1,1,1,)으로 나타내진다. '4'의 문자 카테고리의 특징 벡터 4는 벡터 4 = (1,0,1,0,1,0,1,0,1,1,1,1,0,0,1,0,0,0,1,0,)으로 나타내진다.
특징 벡터가 벡터 = (0,1,1,1,0,0,0,1,1,1,1,1,1,0,0,0,1,1,1,1,)인 미지 문자가 입력되면, 이 특징 벡터와, 기본 사전(122)에 입력되어 있는 '1'의 문자 카테고리의 특징 벡터 1, '2'의 문자 카테고리의 특징 벡터 2, '3'의 문자 카테고리의 특징 벡터 3, 및 '4'의 문자 카테고리의 특징 벡터 4와간의 각각의 시티블록 거리 d(i,j)는 상기 수학식 2에 의해 계산된다.
즉, 미지 문자의 벡터와 '1'의 문자 카테고리의 특징 벡터 1간의 시티블록 거리 d(i,j)는 d(i,j) = │벡터 - 벡터 1│ = │0 - 0│ + │1 - 1│ + │1 - 1│ + │1 - 0│ + │0 - 0│ + │0 - 1│ + │0 - 1│ + │1 - 0│ + │1 - 0│ + │1 - 1│ + │1 - 1│ + │1 - 0│ + │1 - 0│ + │0 - 1│ + │0 - 1│ + │0 - 0│ + │1 - 0│ + │1 - 1│ + │1 - 1│ + │1 - 0│ = 11 로서 표시된다.
또한, 미지 문자의 벡터와 '2'의 문자 카테고리의 특징 벡터 2간의 시티블록 거리 d(i,j)는 d(i,j) = │벡터 - 벡터 2│ = 1 로서 표시된다. 미지 문자의 벡터와 '3'의 문자 카테고리의 특징 벡터 3간의 시티 블록 거리 d(i,j)는 d(i,j) = │벡터 - 벡터 3│ = 3으로서 표시된다. 미지 문자의 벡터와 '4'의 문자 카테고리의 특징 벡터 4간의 시티 블록 거리 d(i,j)는 d(i,j) = │벡터 - 벡터 4│ = 11 로서 표시된다.
특징 벡터와, '1'의 문자 카테고리의 특징 벡터 1, '2'의 문자 카테고리의 특징 벡터 2, '3'의 문자 카테고리의 특징 벡터 3, 및 '4'의 문자 카테고리의 특징 벡터 4와간의 각각의 시티블록 거리 d(i,j) 중에서 특징 벡터와 '2'의 문자 카테고리의 특징 벡터 2간의 시티블록 거리 d(i,j)가 최소값을 나타낸다.
따라서, 특징 벡터 = (0,1,1,1,0,0,0,1,1,1,1,1,1,0,0,0,1,1,1,1,)인 미지 문자는 '2'의 문자 카테고리에 속하는 것으로 판정된다.
다음에는 도 7에 도시된 기본 문자 인식부(17)의 지식표(18)에 저장되는 세부 사항 식별법을 기술한다. 이와 같은 세부 식별 방법에 있어서, 국부적인 부분 패턴이 문자 세그먼트로서 추출되고, 미지 문자의 문자 세그먼트의 위치 및 각도의 변화가 세그먼트 사전에 미리 저장된 문자 세그먼트의 위치 및 각도의 변화와 비교된다. 따라서, 상기 문자는 문자 카테고리에 대응하는 미지 문자를 작성함으로써 인식될 수 있다.
도 38a 내지 도 38c는 문자 세그먼트를 추출하는 방법을 도시하고 있다. 도 38a는 문자 '2'에 대한 이진 이미지 패턴을 나타내며, 대각선 부분이 흑화소로 표시된 문자이다.
도 38b는 도 38a에 의해 표시된 이진 이미지 패턴으로부터 추출된 문자의 윤곽을 나타내고 있다. 점선부는 원래의 이진 이미지 패턴을 나타낸다.
도 38c는 도 38b에 의해 표시된 윤곽을 문자 세그먼트 S1 및 S2 와, 끝점 부분 T1 및 T2로 도시하고 있다. 끝점 부분 T1 및 T2는 도 38a에 도시한 문자 '2'의 개시점 및 종료점에 해당한다.
도 39는 끝점을 검출하는 방법을 도시하고 있다. 도 39에서 끝점은 윤곽선의 경사가 급격한 변화를 나타내는 부분으로서 검출된다. 구체적으로는 소정의 간격을 둔 3개의 점 A, B, C를 윤곽선 S 상에 설정한다. 점 B와 점 C 사이의 윤곽상의 점 A를 정점으로 하는 각도 θ가 소정치 이하로 되는 윤곽선상의 영역을 끝점으로서 검출한다.
끝점에서 문자의 윤곽선을 분할함으로써 이진 이미지 패턴으로부터 문자 세그먼트를 추출하면, 예컨대 문자 세그먼트상에 대표점 X,Y,Z를 소정의 간격으로 설정한다. 연속하는 대표점 X,Y,Z에서 형성되는 각을 구하고, 대표점 X,Y,Z에서의 특징량으로서 문자 세그먼트상의 최초 대표점에서 각 대표점까지의 각도 변화량의 누적값을 구한다.
도 40은 각도 변화의 검출법을 도시한다.
도 40에서 대표점 X,Y,Z를 윤곽선 S 상에 소정 간격으로 설정한다. 대표점 X에서 대표점 Y 로의 벡터 XY 와, 대표점 Y에서 대표점 Z 로의 벡터 YZ를 형성한다. 벡터 XY와 벡터 YZ 간의 각도 θ2가 대표점 Y에서의 각도 변화로서 정의된다.
각도 변화의 초기값인 윤곽선 S 상의 대표점 X에서의 각도 변화는 문자의 중심 G에서 대표점 X로의 벡터 GX와 벡터 XY로 이루어지는 각 θ1으로 나타내 진다.
대표점 X,Y,Z에서의 각각의 특징량은 각도 변화의 초기값을 갖는 대표점 X에서 각각의 대표점 Y 및 Z까지의 각도 변화량의 누적값에 의해 표시된다. 예컨대, 대표점 Y에서의 특징량은 θ1+ θ2로서 표현된다.
미지 문자의 문자 세그먼트상의 대표점에서의 각도 변화량의 누적값을 구한 후, 그 미지 문자의 문자 세그먼트의 대표점을 세그먼트 사전에 저장되어 있는 문자 세그먼트상의 대표점과 대응시킨다. 즉, 미지 문자의 문자 세그먼트상의 대표점에서의 각도 변화량의 누적값과 세그먼트 사전에 저장되어 있는 문자 세그먼트상의 대표점에서의 각도 변화량의 누적값간의 거리를 계산한다. 가장 짧은 거리를 나타내는 세그먼트 사전의 문자 세그먼트상의 대표점을 미지 문자의 문자 세그먼트의 대표점에 대응시킨다.
도 41a는 미지 문자상의 문자 세그먼트의 대표점과 세그먼트 사전의 문자 세그먼트상의 대표점의 대응 관계를 도시한다.
도 41a에서, 대표점 a1 내지 a8은 미지 문자의 문자 세그먼트상의 대표점을 나타내고, 대표점 b1 내지 b8은 세그먼트 사전에 저장되어 있는 문자 세그먼트상의 대표점을 나타낸다. 미지 문자의 문자 세그먼트상의 대표점 a1 내지 a8의 각각은 세그먼트 사전에 저장되어 있는 문자 세그먼트상의 대표점 b1 내지 b8 중 하나에 대응한다.
미지 문자의 문자 세그먼트상의 대표점과 세그먼트 사전의 문자 세그먼트상의 대표점간의 대응관계를 구한 후, 세그먼트 사전에 저장되어 있는 문자 세그먼트상의 기준점에 대응하는 미지 문자의 문자 세그먼트상의 대표점을 검사점으로 설정한다.
도 41b는 기준점과 검사점간의 대응관계를 도시한다.
도 41b에서, 세그먼트 사전에 저장되어 있는 문자 세그먼트의 기준점 d1 및 d2는 미지 문자의 문자 세그먼트의 검사점 c1 및 c2에 각각 대응한다.
기준점과 검사점간의 대응관계를 구한 후, 미지 문자의 문자 세그먼트의 검사점 c1 및 c2에 대해 검사 정보를 계산한다.
이 검사 정보는 예컨대 1개의 검사점에 대해서는 그 검사점이 전체 문자 이미지내의 어떤 위치에 존재하는지에 관한 개개의 검사점의 절대 위치 정보와, 2개의 검사점에 대해서는 이들 검사점간의 거리, 방향 등에 관한 상대 위치 정보와, 2개 이상의 검사점에 대해서는 이들 검사점간의 각도 변화, 직선성 등의 정보로 되어 있다.
그리고, 검사점에서의 검사 정보를 계산한 결과, 소정의 판정 조건을 충족하는 경우, 그 판정 조건을 충족하고 세그먼트 사전에 저장되어 있는 문자 세그먼트의 문자 카테고리를 미지 문자의 인식 결과로서 출력한다.
예컨대, 판정 조건으로서, 도 41b에 표시된 문자 세그먼트상의 검사점 c1에서 문자 세그먼트에 따른 검사점 c2 까지의 각도 변화를 조사 정보로 사용하는 경우, 그 각도 변화가 60°이상인 문자 세그먼트의 문자 이미지가 문자 세그먼트에 대응하여 저장되어 있는 세그먼트 사전내의 '2'의 문자 카테고리에 속하게 될 때, 도 41b에 도시된 문자 세그먼트상의 검사점 c1에서 문자 세그먼트에 따른 검사점 c2 까지의 각도 변화를 계산함으로써 도 38a의 문자 패턴이 '2'의 문자 카테고리에 속하는 것으로 인식할 수 있다.
도 42는 세부 식별 방법에 의한 문자 인식 처리를 도시하는 흐름도이다.
예컨대, 도 42의 스텝 S150에서는 문자 인식될 목록을 스캐너에 의해 스캐닝하고, 판독된 문자 이미지를 이진 흑백 이미지로 이진화한다.
이어서, 스텝 S151에서는 스텝 S150에서 얻어진 이진 이미지로부터 문자 세그먼트를 추출된다.
스텝 S152에서는 세그먼트 사전에 저장된 복수의 문자 세그먼트로부터 미지 문자의 문자 세그먼트와의 대응 관계가 부여되어 있지 않은 문자 세그먼트를 취출한다.
스텝 S153에서는 세그먼트 사전으로부터 취출된 문자 세그먼트와 미지 문자의 문자 세그먼트와의 대응 관계를 부여한다.
스텝 S154에서는 미지 문자의 문자 세그먼트상의 대표점으로부터 검사점을 선택 결정하여 그 검사점에 대한 검사 정보를 계산한다.
스텝 S155에서는 스텝 S154에서 계산된 검사 정보에 기초하여 상기 세그먼트 사전으로부터 취출된 문자 세그먼트를 미지 문자의 문자 세그먼트와 비교하여, 세그먼트 사전으로부터 취출된 문자 세그먼트의 검사 정보와 미지 문자 세그먼트의 검사 정보가 일치하는지의 여부를 판정함으로써 미지 문자에 대응하는 문자 후보를 결정한다.
이어서, 스텝 S156에서는 미지 문자에 대한 문자 후보를 결정하는 처리로 문자 후보가 결정되면, 스텝 S153에서 취출된 문자 세그먼트에 대응하는 문자 카테고리를 인식 결과로서 출력한다. 한편, 문자에 대한 후보가 결정되지 않으면, 스텝 S157로 진행하여 미지 문자의 문자 세그먼트와의 대응 관계가 부여되어 있지 않은 미처리된 문자 세그먼트가 세그먼트 사전에 있는지를 판단한다. 만일 상기 세그먼트 사전내에 미처리된 문자 세그먼트가 있으면, 스텝 S152로 복귀하여 상기한 처리를 반복한다.
한편, 미지 문자의 문자 세그먼트와의 대응 관계가 부여되어 있지 않은 미처리된 문자 세그먼트가 세그먼트 사전내에 존재하지 않는 경우, 입력되는 미지 문자는 인식 불가로 판정하여 '인식 불가'라는 인식 결과를 출력한다.
이에 대한 세부 식별 방법은 일본국 특개평 6-309501 호에 개시되어 있다.
이하에서는 도 7에 도시된 테두리 접촉 문자 인식부(13)의 실시예에 관해서 기술한다.
도 43a 내지 도 43c는 테두리 접촉 문자 인식부(13)에 의해 실행되는 문자 보완 처리를 도시한다.
이와 같은 문자 보완 처리에 있어서, 테두리 접촉 문자의 이진 이미지에서 문자 테두리만이 추출된다. 이 때, 테두리 접촉 문자의 문자 테두리와 접촉하는 문자 획선중 테두리 접촉 부분이 모호해지고, 문자 획선이 복수의 부분으로 단절된다. 따라서, 단절된 문자 획선에 대하여 각 라벨이 부여된 문자 획선간의 거리, 방향 등의 기하학적 구조를 평가하여 문자를 보완한다.
예컨대, 도 43a에 도시된 바와 같이, 라벨 1은 '3'을 표시하는 문자 패턴(131)과 문자에 접촉하는 문자 테두리(132)의 이진 이미지로 지정된다. 이어서, '3'을 표시하는 문자 패턴(131)은 도 43a에 도시된 이진 이미지로부터 테두리(132)를 추출하여 그 테두리(132)를 제거함으로써 도 43b에 나타낸 3개의 부분으로 분할된다. 따라서, 라벨 1,2,3이 부여된 3개의 문자 획선이 생성된다.
라벨 1,2,3이 부여된 상기 3개의 문자 획선의 거리, 방향 등과 같은 기하학적 구조를 평가하여 문자를 보완한다. 따라서, 라벨 1,2,3이 부여된 3개의 문자 획선이 연결되어 도 43c에 도시한 바와 같이 라벨 1을 갖는 '3'을 표시하는 문자 보완 패턴(132)이 생성된다.
문자 보완 처리로 복구된 문자는 인식 문자의 후보로서 인식 처리가 행해진다. 이 인식 처리에서는 문자 카테고리 사전에 등록되어 있는 표준 패턴과 조회하여 최소의 차이를 나타내는 문자 카테고리의 코드를 출력한다.
도 44a 내지 도 44d는 테두리 접촉 문자 인식부(13)에 의해 실행되는 재보완 처리를 도시하고 있다.
이와 같은 재보완 처리에서는 테두리에 평행한 문자 획선이 테두리에 접촉하고 테두리를 제거한 때에 테두리에 평행한 문자 획선이 제거되는 경우, 그 문자 획선이 보간된다. 테두리 접촉 문자를 라벨링에 의한 연결성을 이용하여 추출하고, 문자 보완 처리에 의해 보완된 보완 문자 패턴과 테두리 접촉 문자간의 연결성이 일치하는 것을 검출함으로써, 테두리에 평행한 문자 획선을 보완한다.
예컨대, 도 44a에 도시된 바와같이 테두리(142)에 접촉하는 '7'을 표시하는 문자 패턴(141)의 이진 이미지는 라벨 1로 지정된다. 테두리(142)는 도 44a에 도시된 이진 이미지에서 추출되어 제거된다. 도 44b에 도시된 바와같이, '7'을 표시하는 문자 패턴(141)은 3 부분으로 분할되고, 라벨 1,2,3 이 부여된 3개의 문자 획선이 생성된다.
라벨 1,2,3 이 부여된 3개의 문자 획선의 거리, 방향 등과 같은 기하학적 구조를 평가하고 문자를 보완한다. 따라서, 라벨 1,2,3이 부여된 3개의 문자 획선에 대하여, 도 44c에 도시한 바와 같이 라벨 1 및 2가 부여된 2개의 문자 획선으로 형성된 문자 보완 패턴(142)이 생성된다.
문자 보완 처리에 있어서, 문자는 도 44b에 도시된 바와같이 라벨 1이 지정된 부분과 라벨 2가 지정된 부분 사이에만 보완된다. 그러나, 문자는 도 44b에 도시된 바와같이 라벨 1이 지정된 부분과 라벨 3이 지정된 부분 사이에서는 보완되지 않는다. 이 문자는 도 44b에 도시된 바와같이 라벨 1이 지정된 부분과 라벨 3이 지정된 부분 사이의 보완 처리에서 보완된다.
재보완 처리에서는 라벨에 의한 연결성을 이용하여 테두리 접촉 문자를 미리 추출하고, 도 44c에 도시된 패턴과 테두리 접촉 문자의 연결성이 일치한다는 것을 검출함으로써 테두리에 평행한 문자 획선을 보간한다. 즉, 도 44c에 도시된 바와같이 라벨 1 과 2가 지정된 패턴은 도 44a에 도시된 바와같이 테두리를 제거하기 전에 서로 연결되어 있던 것이므로 도 44c에 도시된 바와같이 라벨 1 과 2이 부여된 패턴을 테두리에 평행한 문자 획선을 이용하여 서로 연결한다.
따라서, 도 44c에 도시된 바와같이 라벨 1 과 2로 지정된 2개의 문자로 분할된 이진 이미지 '7'이 보완될 수 있고, 라벨 1 을 갖는 '7'을 표시하는 재보완 패턴(143)이 도 44d에 도시된 바와같이 생성된다.
문자 보완 처리로 복구된 문자는 인식 문자의 후보로서 인식 처리된다. 이와같은 인식 처리에 있어서 문자는 문자 카테고리 사전에 등록되어 있는 표준 패턴과 조회되어, 최소의 차이를 나타내는 문자 카테고리의 코드가 출력된다.
즉, 도 44a 내지 도 44d에 도시된 예에서, 도 44c에 도시된 문자 보완 패턴(142)은 문자 'リ' 의 카테고리에 속하는 것으로서 인식된다. 도 44d에 도시된 문자 보완 패턴(143)은 문자 '7'의 카테고리에 속하는 것으로 인식된다. '7'이 'リ' 보다 더 작은 차이를 나타내는 것으로 결정된 후, 문자는 최종적으로 '7'로 인식되고, 그 문자 코드가 출력된다.
이하에서는 지식표(14)를 참고로 하여 도 7에 도시된 테두리 접촉 문자 인식부(13)에 의해 인식 처리가 실행되는 경우에 대해 기술한다.
도 45a 내지 도 45c는 한쌍의 문자 및 잘못 판독된 문자를 학습하여 이 문자들을 지식표(14)에 등록함으로써 테두리 접촉 문자를 인식하는 예를 도시하고 있다.
이 예에서, 도 45a에 도시된 바와같이 라벨 1은 '2'를 표시하는 문자 패턴(151)의 이진 이미지로 지정되고, 이 문자는 테두리(152)에 접촉한다. 이때, '2'를 표시하는 문자 패턴(151)은 도 45a에 도시된 이진 이미지로부터 테두리(152)를 추출하여 그 테두리(152)를 제거함으로써 도 45b에 도시된 라벨 1 및 2를 갖는 2개의 부분 패턴으로 분할된다.
도 45c에 도시된 바와같이, 도 45b에 도시된 라벨 1 및 2를 갖는 2개의 부분 패턴이 문자 보완 처리에 의해 연결되어 문자 보완 패턴(153)이 생성된다.
이 경우, '2'를 표시하는 문자 패턴(151)의 하위 획선은 테두리(152)의 하부측에 접촉하고, 문자의 접촉부는 테두리(152)에 거의 완전히 중첩되어 있다. 따라서, 재보완 처리가 '2'를 표시하는 문자 패턴(151)의 하위 획선을 보완할 수 없을 때에 문자 '2'를 '7'로 잘못 판독할 수 있는 가능성이 높다.
그러므로, 테두리 접촉 문자는 문자 테두리 외부에 부분적으로 기록되지 않고 문자 테두리에 완전히 중첩된다. 따라서, 테두리 접촉 문자가 다른 문자로서 잘못 판독될 수 있는 경우, 테두리 접촉 문자는 문자와 그 오독 문자의 쌍의 학습을 통해 테두리 접촉 문자를 등록함으로써 정확하게 인식되어야만 한다.
다음에는 문자와 그 오독 문자의 쌍을 등록함으로써 테두리 접촉 문자를 인식하는 방법에 대해 설명한다.
도 46은 도 7에 도시된 테두리 접촉 문자 인식부에서 문자 및 그 오독 문자를 학습하기 위한 구조를 도시하는 블록도이다.
테두리 접촉 문자 자동 생성부(161)는 문자가 문자 테두리에 접촉하지 않을때 학습 문자에 문자 테두리를 중첩시킴으로써 테두리 접촉 문자를 생성한다. 그 문자 테두리에 대해 학습 문자를 변동시키는 방법에 의해, 단일 학습 문자에 대해 복수의 테두리 접촉 문자가 생성될 수 있다. 도 46에서, '2'로 표시된 학습 문자가 테두리 접촉 문자 자동 생성부(161)에 입력되어 문자 '2'의 하부 획선이 문자 테두리의 하부측에 중첩하는 테두리 접촉 문자(169)가 생성된다. 테두리 접촉 문자 자동 생성부(161)에 의해 생성된 정보는 지식표(167)에 등록된다.
학습 문자를 그 문자 테두리에 중첩시키기 위한 두 가지의 문자 변동 방법이 있는데, 그 하나는 학습 문자를 그 문자 테두리에 대해 변동시키는 것이고, 다른 하나는 문자 테두리를 변동시키는 것이다. 문자를 그 문자 테두리에 대해 변동시키는 방법으로는 예를들어 변위(displacement), 크기 변동, 자세 변동 등이 가능하다. 문자 테두리를 변동시키는 방법으로는 예를들어 자세 변동, 문자 테두리 폭의 변동, 크기 변동, 문자 테두리의 요철화 등이 가능하다.
다음 파라미터는 전술된 변동의 각각에서의 변동량을 나타낸다. x 축은 수직 방향을 나타내고, y 축은 수평 방향을 나타낸다.
1. 문자 테두리에 대한 문자의 변동
변위 : dx, dy
여기서, dx(도 47b에 흑점으로 표시된 위치) 및 dy(도 47b에 x 로 표시된 위치)는 각각 문자 중심과 문자 테두리 중심의 위치차의 x 방향과 y 방향의 크기를 나타낸다.
크기 변동 : dsx, dsy
여기서, dsx 및 dsy는 각각 문자의 x 방향과 y 방향의 크기를 나타낸다.
자세 변동 : dα
여기서, dα는 수직선에 대한 문자 자세의 각도를 나타낸다.
2. 문자 테두리의 변동
자세 변동 : fα
여기서, fα는 수직선에 대한 문자 테두리 자세의 각도를 나타낸다.
문자 테두리 폭의 변동 : w
여기서, w는 문자 테두리의 폭을 나타낸다.
크기 변동 : fsx, fsy
여기서, fsx 및 fsy는 각각 문자의 x 방향과 y 방향의 크기를 나타낸다.
문자 테두리의 요철 : fδ
여기서, fδ는 예를들어 팩시밀리 등으로 인쇄된 문자 테두리의 품질 열화 등을 고려한 문자 테두리의 요철을 제어하는 파라미터이다. 문자 테두리의 둘레를 L로 나타내면, f은 크기 L의 배열 fδ[L] 로서 표현된다. 이 배열에서, 각각의 요소 fδ[i](i=1,2,3,…)는 난수발생(random number)에 의해 결정된 -β∼+β의 범위에 있는 정수치를 갖는다.
전술된 변동의 종류 및 변동량을 기초로, 학습 문자에 대하여 조작 F(dx,dy,dsx,dsy,dα,w,fsx,fsy,fα,fδ)를 실시함으로써 테두리 접촉 문자를 생성한다.
도 47a 및 도 47b는 '7'로 나타낸 학습 문자(171)에 문자 테두리(172)를 지정함으로써 테두리 접촉 문자를 생성하는 예를 도시하고 있다.
도 47a에 도시된 바와같이, '7'이라는 학습 문자(171)에 대하여 변환 조작 F(dx,dy,dsx,dsy,dα,w,fsx,fsy,fα,fδ)를 실시함으로써 도 47b에 도시된 바와같이 문자 테두리(172)에 접촉하는 테두리 접촉 문자 '7'을 생성한다.
즉, 학습 문자(171)와 문자 테두리(172)가 서로 중첩하도록 학습 문자(171)와 문자 테두리(172)에 대해 변환 조작 F(dx,dy,dsx,dsy,dα,w,fsx,fsy,fα,fδ)를 실시함으로써 테두리 접촉 문자가 생성될 수 있다. 이 경우, 예를들어 문자 테두리(172)의 중심의 위치를 고정시키면서 변환조작 F(dx,dy,dsx,dsy,dα,w,fsx,fα,fδ)를 시행한다.
도 48a 내지 도 48f는 x 방향에서의 크기 변동 fsx 및 y 방향에서의 크기 변동 fsy를 고정하고 문자 테두리의 크기를 고정한 경우에 있어서 학습 문자 '3'에 대해 생성한 테두리 접촉 문자의 각각의 종류의 예를 도시하고 있다.
도 48a는 변동의 종류가 "변위" 인 경우의 예로서, 여기서 변동량은 dx=0 및 dy>0 이다. 이 경우에 문자 '3'은 부분적으로 문자 테두리의 하부측 외부에 존재한다(하위 변동).
도 48b는 변동의 종류가 "변위" 인 경우의 예로서, 변동량은 dsx=fsx 및 dsy=fsy 이다. 이 경우에 문자 '3'은 문자 테두리의 상부, 하부, 좌측 및 우측에 접촉한다. '3'에 접하는 사각형이 문자 테두리와 동일하게 된다.
도 48c는 변동의 종류가 "문자의 자세 변동" 인 경우의 예로서, 변동량은 dα=10°이다.
도 48d는 변동의 종류가 "문자 테두리의 자세 변동" 인 경우의 예로서, 변동량은 fα=-10°이다.
도 48e는 변동의 종류가 "문자 테두리 폭의 변동" 인 경우의 예로서, 변동량은 w=5 이다.
도 48f는 변동의 종류가 "문자 테두리의 요철 변동" 인 경우의 예로서, 변동량 fδ[L]의 각 요소 fδ[i] 를 제어한 경우이다.
다음에 도 46에 도시된 문자 테두리 제거부(162)는 테두리 접촉 문자 자동 생성부(161)에 의해 생성된 테두리 접촉 문자로부터 문자 테두리만을 추출하고, 문자 테두리를 제거함으로써 획득된 모호한 문자에 대한 이미지 데이타를 문자 보완부(163)에 출력한다.
문자 보완부(163)는 문자 테두리 제거부(162)에 의해 문자 테두리가 제거된 이미지 데이타를 라벨이 부여된 문자 획선간의 거리나 방향성 등의 기하학적 구조를 평가하여 보완한다. 도 46은 테두리 접촉 문자 자동 생성부(161)에 의해 생성된 테두리 접촉 문자(169)로부터 문자 테두리를 제거한 후 문자 보완부(163)에 의해 테두리 접촉 문자를 보완함으로써 문자 보완 패턴(170)을 생성하는 예를 도시하고 있다.
문자 재보완부(164)는 문자 보완부(163)가 이미지 데이타를 보완하지 않은 영역에서 라벨링에 의한 연결성을 기초로 테두리 접촉 문자를 미리 추출하고, 문자 보완부(163)에 의해 보완된 패턴과 테두리 접촉 문자간의 연결성이 일치되는 지의 여부를 검출함으로써 문자 테두리에 평행한 문자 획선을 보완한다.
문자 보완부(163)에 의해 보완된 문자 보완 패턴 및 문자 재보완부(164)에 의해 재보완된 재보완 패턴은 기본 문자 인식부(165)에 입력된다.
기본 문자 인식부(165)는 문자 보완부(163)에 의해 보완된 문자 보완 패턴 및 문자 재보완부(164)에 의해 재보완된 재보완 패턴에 대한 문자 인식 처리를 수행한다. 그리고나서, 기본 문자 인식부(165)는 각각의 학습 문자에 대한 인식 결과를 문자 테두리 접촉 상태 및 인식 지식 획득부(166)로 출력한다.
문자 테두리 접촉 상태 및 인식 지식 획득부(166)는 기본 문자 인식부(165)로부터의 인식 결과 출력을 사전 제공되어 있는 정해 데이타(solution data)와 비교하고, 전체 샘플 데이타에 대한 인식율을 획득한다. 그리고나서, 문자 테두리 접촉 상태 및 인식 지식 획득부(166)는 이 인식율을 신뢰도로서 지식표(167)에 등록하고, 오독(오인식) 문자와 정확한 문자의 조합을 문자와 그 오독 문자의 쌍으로 등록한다. 전술된 문자와 그 오독 문자의 쌍은 예를들어 문자 코드로 등록된다. 문자 테두리 접촉 상태 및 인식 지식 획득부(166)는 또한 문자의 상태와 그 문자에 접촉하는 문자 테두리의 특징을 나타내는 파라미터를 추출하고, 이 특징을 지식표(167)에 등록한다.
그러므로, 지식표(167)는 문자와 그 오독 문자의 쌍과 함께 문자와 문자 테두리간의 각종 접촉 상태에서의 문자에 대한 인식율을 각각의 문자 카테고리에 대해 포함한다.
도 49는 문자의 학습을 통해 생성된 지식표(167)의 일례를 도시하고 있다.
도 49에서, 지식표(167)에는 문자와 그 오독 문자쌍 [2 와 7] 및 신뢰도 77% 가 "하위 위치 변동"의 변동량 dy=5 및 w=5 등과 함께 등록된다. 테두리 접촉 문자 '2' 가 "하위 위치 변동"에서 dy=5 및 w=5의 변동량을 나타낸다면, 기본 문자 인식부(165)가 '2'를 '7'로 오독할 가능성은 23% 이다. 이 경우에, 기본 문자 인식부(165)가 '2'를 '7'로 오독한다 하더라도, 신뢰도가 77% 이므로 문자가 실제로 '2'일 가능성이 23% 라는 것을 지식표(167)를 참조함으로써 판단할 수 있다.
동일하게, 문자 테두리 접촉 상태 및 인식 지식 획득부(166)는 오독되기 쉬운 다른 문자에 대해서도 "변동량", "문자 테두리의 폭", "문자 및 그 오독 문자 쌍" 및 신뢰도를 지식표(167)에 등록한다.
문자 및 그 오독 문자의 쌍(L1, L2)은 문자 "L1"이 실제로 "L2" 로 오독될 수 있다는 것을 나타낸다. 상기 문자 "L1" 및 "L2" 로는 해당 문자 "L1" 및 "L2"에 대한 문자 코드가 등록되어 있다.
지식표(167)에는 도 49에 도시된 변동량 dy=5 및 w=5의 "하위 위치 변동" 외에도, 도 50에 도시된 바와 같이, "문자 테두리에 대한 문자 자세의 변동"(이 경우에는 좌측편에 접촉함) 등의 도 47에 도시된 각각의 변동에 대하여 각각의 문자 카테고리에 등록된다.
즉, 예를 들어 도 50에 도시된 바와 같이, 문자 테두리의 좌측편에 접촉하는 문자 자세의 변동에 대하여 dx='-3'∼'+3', dy='-3'∼'+3', w=5, dsy=1, dα='-20'∼'+20', fα='-10'∼'+10' 이 등록된다.
문자 인식법은 그 신뢰도가 소정 임계값(예를들어, 90%)과 동일하거나 이하인 문자 및 그 오독 문자의 쌍(L1, L2)에 대해 신뢰도가 소정 임계값과 동일하거나 또는 그 이상이 되도록 시행된다. 학습 문자 인식법은 지식표(167)에 등록된다.
예를들어, dy=5 및 w=5 를 갖는 "하위 위치 변동"의 상태에 있는 테두리 접촉 문자 '2'의 문자 인식의 신뢰도는 도 49에 도시된 바와같이 77% 이다. 문자가 '7' 로 오독될 가능성이 크기 때문에, 문자 보완부(163)에 의해 보완된 문자 보완 패턴 및 문자 재보완부(164)에 의해 재보완된 문자 재보완 패턴은 예를들어 특정 영역을 강조하여 패턴을 재차 인식함으로써 인식율이 향상될 수 있는 학습 후에 지식표(167)에 등록된다.
문자 및 그 오독 문자의 쌍 [2 와 7]에 대한 특정 영역을 강조하는 방법은 도 51a 및 도 51d를 참조하여 설명된다.
먼저, 도 51a에 도시된 바와같이, 문자 보완부(163)에 의해 보완된 문자 보완 패턴 또는 문자 재보완부(164)에 의해 재보완된 재보완 패턴에 외접하는 외접 사각형(180)은 m열×n행의 m×n 분할 영역으로 분할된다. 그리고나서, 사선을 갖는 도 51b에 도시된 바와같이, 문자를 재차 인식하기 위해 외접 사각형(180)의 상반부 m/2×n 영역이 강조된다.
즉, m/2×n 영역의 특징 파라미터가 추출되고, 문자 보완부(163)에 의해 보완된 문자 보완 패턴 및 문자 재보완부(164)에 의해 문자 재보완된 재보완 패턴이 '2' 또는 '7'인지의 여부가 검사된다. 영역 강조 방법은 인식율을 95% 까지 향상시킨다. 도 49에 도시된 지식표(167)에는 문자 및 그 오독 문자의 쌍이 [2 와 7] 인 행에 재인식 방법으로서 "강조 영역"이, 재인식 영역으로서 "m/2×n"이, 재인식 신뢰도로서 "95%" 가 등록된다.
영역 강조 방법은 도 52a에 도시된 테두리 접촉 문자에 대해 효율적이다. 도 52a는 '2'를 나타내는 문자 패턴의 하위부가 문자 테두리(182)에 접촉하는 일례이다.
이 경우에, 문자 보완부(163)는 도 52b에 도시된 바와같은 '7'과 유사한 문자 보완 패턴(183)을 얻는다. 도 52c에 도시된 바와 같은 외접 사각형(184)은 문자 보완 패턴(183)에 대응하여 연산된다. 도 51b에 도시된 바와같이 외접 사각형(184)이 m×n 영역으로 분할되어 문자가 인식될때 상반부 m/2×n 부분 영역(185)이 특별히 강조되는 경우, 문자 보완 패턴(183)이 '2'로 인식될 수 있는 가능성이 높아지게 된다. 즉, 정해(신뢰도)가 높은 비율로 획득될 수 있음이 학습되며, 전술된 영역 강조 방법이 지식표(167)에 문자 테두리 접촉에 의한 문자와 그 오독 문자의 쌍 [2 와 7]에 대한 재인식법으로서 등록된다.
도 53은 특정 영역을 강조함으로써 문자 패턴을 재인식하는 방법을 도시하는 흐름도이다.
도 53에서, 저신뢰도를 나타내는 문자 및 그 오독 문자의 쌍의 데이타가 스텝 S161에서 지식표(167)로부터 검색된다. 문자 및 그 오독 문자의 쌍의 좌측 문자에 대응하여, 2진 학습 데이타로서의 문자 패턴과, 문자 보완부(163)에 의해 보완된 문자 보완 패턴 또는 문자 재보완부(164)에 의해 재보완된 문자 재보완 패턴이 입력된다.
문자 보완 패턴 또는 문자 재보완 패턴은 지식표(167)에 등록된 변동량 파라미터에 의해 규정되며, 동일 카테고리에 있어서도 복수 형상의 패턴을 취할 수 있다.
스텝 S161에서의 학습 데이타 입력으로서의 문자 패턴과, 문자 보완부(163)에 의해 보완된 문자 보완 패턴 또는 문자 재보완부(164)에 의해 재보완된 문자 재보완 패턴은 스텝 S162에서 m×n 으로 분할된다.
스텝 S163에서, m×n 영역에서의 X×Y 부분 패턴에 대해 문자 인식 처리가 수행되며, 인식율 z가 획득된다.
전술된 X×Y 부분 패턴은 X와 Y가 각각 m×n 영역에서의 X와 Y 방향에서의 길이를 나타내고 X≤m 및 Y≤n 인 인식 영역이다. 전술된 인식율 z는 정확한 정해가 전술된 X×Y 부분 패턴을 사용하여 인식된 문자를 갖고 출력될 수 있는 가능성을 나타낸다.
즉, 학습 데이타로서의 문자 패턴의 부분 패턴의 문자 인식 결과가 정해로서 간주된다. 문자 보완부(163)에 의해 보완된 문자 보완 패턴 및 문자 재보완부(164)에 의해 재보완된 문자 재보완 패턴에 대한 복수의 부분 패턴에 대한 문자 인식 결과가 학습 데이타로서의 문자 패턴의 부분 패턴에 대한 문자 인식 결과와 비교된다. 그 결과, 문자 보완부(163)에 의해 보완된 문자 보완 패턴 또는 문자 재보완부(164)에 의해 재보완된 문자 재보완 패턴에 대한 문자 패턴의 인식율 z가 획득된다.
그리고나서, 스텝 S164에서, 인식율 z가 최대 인식율 max 이상인지의 여부가 판별된다. 최대 인식율 z는 X×Y의 부분 패턴이 변화하는 동안 획득된 인식율 z의 최대값을 기억하는 변수이다. 먼저, 초기값이 설정된다(예를들어, '0').
인식율 z가 최대 인식율 max 이상인 경우, 스텝 S165 로 진행하여 최대 인식율 max 를 인식율 z에 의해 대체하며, 스텝 S166에서 길이 X 및 Y가 가변적인지의 여부를 검사한다. 스텝 S164에서 인식율 z가 최대 인식율 max와 동일하거나 작은 경우, 스텝 S166 으로 곧바로 진행한다.
길이 X 와 Y 를 변화시키는 것은 길이 X와 Y의 크기를 변화시키는 것이고, 또한 X×Y의 부분 패턴의 m×n 영역에서의 위치 변환을 수반한다.
스텝 S166에서 길이 X 와 Y 가 가변적이라고 판정되는 경우, 스텝 S163으로 복귀하여 길이 X와 Y를 변화시키고, X×Y의 새로운 부분 패턴이 결정되며, 이 부분 패턴에서 문자가 인식된다.
스텝 S166에서 길이 X와 Y가 변경될 수 없다고 판정될 때까지 스텝 S163∼S166에서의 처리가 반복된다. 스텝 S166에서 길이 X와 Y가 변경될 수 없다고 판명되는 경우, 최대 인식율 max 및 이 최대 인식율 max 이 획득되는 X×Y의 부분 패턴이 각각 재인식 신뢰도 및 재인식 영역으로서 지식표(167)에 등록된다. "영역 강조"는 지식표(167)에 재인식법으로서 등록된다.
도 53은 영역 강조법을 사용하여 문자를 재인식하는 방법을 학습하는 일례를 도시하는 흐름도이다. 문자 재인식법은 영역 강조 방법과는 다른 방법에 의해 학습될 수도 있다.
도 54a 및 도 54b는 테두리 접촉 문자가 학습을 통해 획득된 지식표(167)에 따라 인식되는 구조를 도시하는 블록도이다.
도 54a에서, 테두리 접촉 상태 검출부(191)는 미지의 테두리 접촉 문자가 입력될때 문자와 문자 테두리간의 접촉 상태를 검출한다. 도 54a에 도시된 예에서는 테두리 접촉 문자 패턴(201)['2']의 하위부가 문자 테두리의 하부측에 부분적으로 중첩하고 있고, 도 54b에 도시된 예에서는 테두리 접촉 문자 패턴(203)['2']의 하위부가 문자 테두리의 하부측에 완전히 중첩하고 있다. 테두리 접촉 상태 검출부(191)는 테두리 접촉 문자 패턴(201) 및 테두리 접촉 문자 패턴(203)을 검출한다.
문자 테두리 제거부(192)는 테두리 접촉 상태 검출부(191)에 의해 검출된 테두리 접촉 문자 패턴으로부터 문자 테두리를 제거한다.
문자 보완부(193)는 문자 테두리가 문자 테두리 제거부(192)에 의해 제거되는 문자 패턴상의 라벨링된 문자의 거리, 방향 등의 기하학적 구조를 평가하여 문자를 보완한다.
문자 재보완부(194)는 문자 보완부(193)가 이미지 데이타를 보완하지 않는 영역에서 라벨링을 이용한 연계성을 기초로 테두리 접촉 문자를 사전 추출하고, 문자 보완부(193)에 의해 보완된 문자와 테두리 접촉 문자간의 연계성으로 일치 여부를 검출함으로써 문자 테두리에 평행한 문자 획선을 보완한다. 재보완 패턴(202)은 도 54a에 의해 도시된 바와 같이 테두리 접촉 문자 패턴(201)에 대해 재보완부(194)에 의해 수행된 재보완 처리에서 보완된 패턴을 도시한다. 재보완 패턴(204)은 도 54b에 의해 도시된 바와 같이 테두리 접촉 문자 패턴(203)에 대해 재보완부(194)에 의해 수행된 재보완 처리에서 보완될 수 없는 패턴을 도시한다.
기본 문자 인식부(195)는 문자 보완부(193)에 의해 보완된 문자 보완 패턴 및 문자 재보완부(194)에 의해 재보완된 문자 재보완 패턴에 대해 문자 인식 처리를 수행한다. 그 결과, 도 54a에 의해 도시된 바와 같은 문자 재보완 패턴(202)에 대해 '2'의 문자 코드가 출력되며, 도 54b에 의해 도시된 바와 같은 문자 재보완 패턴(204)에 대해 '7'의 문자 코드가 출력된다. 인식 결과로서 획득된 문자 코드는 문자 테두리 접촉 상태 및 인식 지식 획득부(196)에 출력된다.
문자 테두리 접촉 상태 및 인식 지식 획득부(196)는 문자 보완부(193)에 의해 보완된 문자 보완 패턴 및 문자 재보완부(194)에 의해 재보완된 문자 재보완 패턴에 외접하는 사각형에 대한 위치 정보와, 도 54a에 도시된 바와 같은 테두리 접촉 문자 패턴(201) 또는 도 54b에 의해 도시된 바와 같은 테두리 접촉 문자 패턴(203)으로부터 추출된 문자 테두리에 대한 위치 정보 및 폭 정보에 따라 변동의 종류를 획득한다.
즉, 도 47에 도시된 바와 같은 변위, 크기 변동, 자세 변동 등의 그 문자 테두리에 대한 문자의 변동, 또는 자세 변동, 문자 테두리의 폭 변동, 문자 테두리의 요철 등의 문자 테두리에 대한 변동이 획득된다. 더욱이, 전술된 바와 같은 각각의 변동의 종류에 대해 변화량 dx,dy,dsx,dsy,dα,w,fsx,fsy,fα 또는 fδ이 산출된다.
그리고나서, 기본 문자 인식부(195)로부터 입력된 문자 코드, 산출된 변동 종류 정보, 및 변화량 정보를 키 항목으로 사용하여 지식표(167)가 검색된다. 지식표(167)에 키 항목과 일치하는 변동 종류 정보, 변동량 정보, 및 문자와 그 오독 문자의 쌍을 포함하는 행이 등록되어 있는지가 검사된다.
키 항목과 일치하는 행이 존재하는 경우, 그 행에 기억된 신뢰도가 소정 임계값에 동일하거나 그 이상인지의 여부가 판정된다. 임계값보다 작은 경우, 문자 보완부(193)에 의해 보완된 문자 보완 패턴 또는 문자 재보완부(194)에 의해 보완된 문자 재보완 패턴이 문자 재인식부(197)에 출력된다. 이 문자는 그 행에 등록된 재인식법에 의해 재차 인식된다.
즉, 미지의 이미지 테이타에서의 테두리 접촉 문자는 문자 보완부(193)에 의해 보완된 문자 보완 패턴, 문자 재보완부(194)에 의해 재보완된 문자 재보완 패턴 또는 미지 문자의 이진 이미지 테이타를 사용하여 기본 문자 인식부(195)에 의한 방법과는 다른 방법에 의해 재인식된다. 그리고나서, 재인식 처리에서 획득된 문자 코드가 출력된다.
예를들어, 기본 문자 인식부(195)가 재보완부(194)에 의해 재보완된 재보완 패턴(204)에 대한 인식 결과로서 '7'의 문자 코드를 출력할 때, 문자 테두리 접촉 상태 및 인식 지식 획득부(196)는 재보완 패턴(204)에 외접하는 사각형에 대한 위치 정보와, 테두리 접촉 문자 패턴(203)으로부터 추출된 문자 테두리에 대한 위치 정보 및 폭 정보에 따른 변동 종류 및 변동량을 획득한다. 그 결과, 변동 종류로서 "하위 위치 변동" 이 산출되고, "하위 위치 변동"에서의 변동량으로서는 'dy=5' 가 획득되며, 문자 테두리의 폭으로서 'w=5' 가 산출된다.
그리고나서, 문자 테두리 접촉 상태 및 인식 지식 획득부(196)는 변동의 종류로서 "하위 위치 변동" 을, 하위 위치 변동량으로서 'dy=5' 를, 문자폭으로서 'w=5' 를, 키 항목으로서 기본 문자 인식부(195)로부터 수신된 '7'의 문자 코드를 사용하여 도 49에 도시된 지식표(167)를 검색한다. 검색 결과, 키 항목에 대응하는 행이 문자와 그 오독 문자의 쌍 [2 와 7], 및 기본 문자 인식부(195)에 의해 재인식된 문자 코드 '7'의 신뢰도를 기억하며, 이로써 문자 '2'가 23%의 가능성을 가지고 '7'로 오독된다는 것을 참조할 수 있다.
이 경우에, 이러한 키 항목에 대응하는 행에 등록된 신뢰도가 소정 임계값 이하이므로, 문자 재인식부(197)는 기본 문자 인식부(195)에 의한 방법과는 다른 방법에 의해 미지의 이미지 데이타에 포함된 테두리 접촉 문자 패턴(203)을 재인식한다. 이 경우, 문자 재인식부(197)는 재인식 방법을 특정하기 위해 지식표(167)상의 키 항목에 대응하는 행을 참조한다.
즉, 문자 재인식부(197)는 재인식 방법으로서 "영역 강조법" 이 제공되고, "영역 강조 처리" 가 수행될때 재인식 영역으로서 재인식 패턴(204)의 상반부 m/2×n 영역(205)이 제공된다. 또한, 95%의 인식 신뢰도의 정보가 제공된다.
문자 재인식부(197)는 지식표(167)에 등록된 재인식법에 의해 재인식 패턴(204)의 상반부 영역(205)만을 인식한다. 문자 재인식부(197)는 재보완 패턴(204)의 상반부(205)가 문자 코드 '2'에 대응하는 문자 패턴(206)의 부분 영역(207)에 일치할 가능성이 95% 이고, 문자 코드 '7'에 대응하는 문자 패턴(208)의 부분 영역(209)에 일치할 가능성이 5% 라는 정보가 제공되며, 미지 문자의 테두리 접촉 문자 패턴(203)의 문자 테두리에 접촉하는 문자의 인식 결과로서 문자 코드 '2' 를 출력한다.
도 55는 문자 테두리 접촉 상태 및 인식 지식 획득부(196)의 동작을 나타내는 흐름도이다.
도 55에서, 그 문자 테두리에 대한 문자의 변동량은 미지의 테두리 접촉 문자 패턴 및 이 테두리 접촉 문자 패턴과는 별도의 문자 패턴으로부터 추출된 문자 테두리를 기초로 산출되며, 스텝 S171에서 키 항목으로서 변동량을 사용하여 지식표(167)가 검색된다. 그리고나서, 지식표(167)에 산출된 변동량에 일치하는 변동량을 포함하는 행이 등록되어 있는지의 여부를 검사한다.
하위 위치 변동을 나타내는 문자 '2'에 대한 변동량이 예를들어 dx=5 및 w=5 로서 획득될때, 도 49에 도시된 바와 같이 지식표(167)상의 최상위 행이 검출된다.
변화량이 일치하는 행이 존재하는 경우, 스텝 S172로 진행하며, 기본 문자 인식부(195)로부터 입력되는 문자 코드(문자 인식 코드)를 문자와 그 오독 문자의 쌍에 포함하고 있는 행이 변동량이 일치하는 행중에 존재하는지가 검사된다.
하위 위치 변동을 나타내고 있는 문자 '2'인 경우 도 49에 도시된 바와 같이 지식표(167)의 최상위 행이 검출된다.
스텝 S173에서, 기본 문자 인식부(195)로부터 입력되는 문자 코드를 문자와 그 오독 문자의 쌍에 포함하고 있는 행이 변동량이 일치하는 행중에 존재한다면, 지식표(167)상의 대응 행에 등록된 재인식 신뢰도가 기본 문자 인식부(195)에 의해 산출된 신뢰도와 비교된다. 지식표(167)상의 대응 행에 등록된 재인식 신뢰도가 기본 문자 인식부(195)에 의해 산출된 신뢰도 이상인지의 여부가 판정된다.
그 하위 위치에서 변동된 문자 '2'의 경우, 도 49에 도시된 지식표(167)상의 최상위 행에 등록된 재인식 신뢰도 및 기본 문자 인식부(195)에 의해 산출된 신뢰도는 각각 95% 와 77% 이다. 따라서, 지식표(167)상의 대응 행에 등록된 재인식 신뢰도가 기본 문자 인식부(195)에 의해 산출된 신뢰도 이상이라는 것이 판명된다.
지식표(167)상의 대응 행에 등록된 재인식 신뢰도가 기본 문자 인식부(195)에 의해 산출된 신뢰도 이상인 경우, 스텝 S174로 진행하며, 지식표(167)상의 대응 행에 등록된 재인식 신뢰도가 소정 임계값 th1 이상인지의 여부가 판정된다. 소정 임계값 th1 이상인 경우, 스텝 S175 로 진행하며, 지식표(167)상의 행에 등록되어 있고 스텝 S172에서 검출된 재인식 방법 및 재인식 영역이 참조된다.
다음에, 스텝 S176에서, 지식표(167)상에 표시된 재인식 영역이 문자 보완부(193)에 의해 보완된 문자 보완 패턴 또는 문자 재보완부(194)에 의해 재보완된 재보완 패턴으로부터 검출되며, 지식표(167)상에 표시된 재인식법에 의해 검출 영역에 대해 문자 재인식 처리가 수행된다. 그 후, 문자 재인식 처리에서 획득된 문자 코드가 출력된다.
임계값 th1 가 95% 이하인 경우, 그 하위 위치 변동을 나타내고 문자 인식부(195)에 의해 입력되는 문자 '2'의 보완 패턴에 대한 상반부 'm/2×n' 영역을 사용하여 영역 강조법에 의해 문자 재인식 처리를 수행함으로써 '2'의 문자 코드가 최종적으로 출력된다.
도 7에 도시된 문자열 인식부(15)의 실시예가 설명된다.
문자열 인식부(15)는 도 8에 도시된 스텝 S2에서의 레이아웃 분석에 의해 추출된 문자열로부터 문자를 한 문자씩 검출할 때 사용되는 특징값으로서의 파라미터에 있어서 문자를 통합 판정할때의 임계값을 교습법(heuristic manner)으로 결정하지 않고 통계학적으로 타당한 값으로 결정한다.
구체적으로, 각 파라미터마다, 파라미터값과 그 파라미터값에 대응하는 문자의 통합의 성공 또는 실패에 관한 통계 데이타를 획득한다. 각각의 파라미터는 개별적으로 평가되지 않고 다차원 공간에서의 한점으로서 카운트되며, 다변량 분석(multivariate analysis)의 수법을 이용하여 통합이 성공적인 경우와 통합이 실패한 경우와의 두 그룹으로 분리하는 판별면(discriminate phase)을 상기 다차원 공간내에서 획득한다.
즉, 패턴의 특징을 나타내는 P개의 특징값을 포함하는 샘플 데이타를 2개의 그룹, 즉 검색 성공을 나타내는 제1 그룹 및 검색 실패를 나타내는 제2 그룹으로 분할한다. 제1 그룹과 제2 그룹간의 판별면을 2차원 공간에 생성한다.
판별면은 예를들어 판별 분석법에 의해 획득될 수 있다. 즉, 판별면이 선형 판별 함수에 의해 형성될때, 판별 함수의 계수 벡터는 다음과 같이 표현된다.
Figure pat00002
여기서, ∑는 제1, 2 그룹의 모분산 공분산 행렬(the variance co-variance matrix)이고, μ1는 제1 그룹의 평균 벡터이며, μ2는 제2 그룹의 평균 벡터이다.
수학식 3에서 계수 벡터를 갖는 판별 함수는 제1 및 제2 그룹의 각각의 중심으로부터 등거리가 되도록 구성된다.
판별 함수의 계수 벡터는 제1 그룹과 제2 그룹간의 그룹간 변동 대 그룹내 변동(inter-group variation to intra-group variation)의 비율이 가능한 최대가 될 수 있도록 하는 기준에 기초하여 산출될 수 있다.
문자열로부터 문자를 검출하는 처리는 문자 패턴의 외접 사각형의 위치, 크기, 배열 등을 참조한 문자 패턴을 통합하는 통계적 처리 및 문자열의 위첨자 획선과 분리 문자 등을 정확하게 처리하기 위해 문자 패턴의 형태를 고찰하는 비통계적 처리에 의해 별도로 수행된다.
통계적 처리에서는 검출 파라미터가 사용된다. 검출 파라미터로는 패턴의 외접 사각형의 위치, 패턴의 외접 사각형의 수직 크기 대 수평 크기의 비, 문자 크기 대 평균 문자 크기의 비, 패턴간의 중첩 폭, 문자열의 조밀도 등이 사용된다.
도 56에 도시된 바와 같이 검출 파라미터의 샘플은 다음과 같다:
1) 외접 사각형(211)의 우측과 외접 사각형(212)의 좌측간의 거리; a
2) 외접 사각형(211)의 좌측과 외접 사각형(212)의 우측간의 거리; b
3) 외접 사각형(211)의 좌측과 외접 사각형(212)의 우측간의 거리 b에 대한 외접 사각형(211)의 우측과 외접 사각형(212)의 좌측간의 거리 a의 비; c
4) 외접 사각형의 평균폭 MX에 대한 외접 사각형(211)의 좌측과 외접 사각형(212)의 우측간의 거리 b의 비; d
5) 외접 사각형(213)의 하위측의 중점에서부터 외접 사각형(214)의 하위측의 중점을 연결하는 직선과 외접 사각형(213)의 하위측간에 형성된 각도; e
6) 외접 사각형(213)의 우하귀의 꼭지점으로부터 외접 사각형(214)의 좌하귀 꼭지점을 연결하는 직선과 외접 사각형(213)의 하위측간에 형성된 각도; f
7) 외접 사각형(215)이 외접 사각형(216)에 중첩하는 경우, 외접 사각형(215)의 좌측과 외접 사각형(216)의 우측의 거리 q에 대한 외접 사각형(215)의 우측과 외접 사각형(216)의 좌측의 거리 p의 비; g
c = a/b
d = b/MX
g = p/q
통계적 처리는 도 57에 도시된 흐름도를 참조하여 설명된다.
스텝 S181에서는 연결 패턴의 외접 사각형을 취출한다.
스텝 S182에서는 스텝 S181에서 취출된 외접 사각형의 우측에 다른 외접 사각형이 존재하는지의 여부를 검사한다. 스텝 S181에서 취출된 외접 사각형의 우측에서는 외접 사각형이 존재하지 않는 경우, 스텝 S181에서 검색된 외접 사각형을 통게적 처리의 대상으로부터 제거한다.
스텝 S182에서 스텝 S181에 의해 취출된 외접 사각형의 우측에 다른 외접 사각형이 존재하는 것으로 판명되는 경우, 스텝 S184 로 진행한다.
스텝 S183에서는 문자열에 외접하는 사각형의 평균 크기가 산출된다. 문자열에 외접하는 사각형의 크기가 산출되는 경우, 각각의 문자가 아직 취출되지 않았기 때문에 정확한 평균 문자 크기가 즉각적으로 산출될 수 없다.
예를들어, 연결 패턴에 외접하는 사각형을 임시 통합(temporary integration)함으로써 잠정적인 평균 문자 크기를 산출한다. 임시 통합은 예를들어 통합 연결 패턴의 수직-수평 비 P 가 다음 식을 충족할 때 수행된다.
N(=0.8)<P<M(=1.2)
임시 통합 후에 평균 문자 크기를 산출한다. 또한, 문자열에 외접하는 사각형의 평균 문자 크기는 또한 외접 사각형의 크기별 빈도 히스토그램을 생성함으로써 얻어질 수도 있다.
그 후, 스텝 S184에서는 도 56에 도시된 파라미터 a∼g 를 산출한다.
비통계적인 처리에서, 문자열에서의 분리 문자 및 위첨자 획선은 각각 분리 문자 처리 및 위첨자 처리로 처리된다.
분리 문자 처리에서는 패턴의 자세 및 조밀도와, 인접 패턴을 통합함으로써 획득된 통합 패턴의 크기와, 패턴간의 거리가 검출 파라미터로서 사용된다.
예를들어, 도 58에 도시된 바와 같이 다음의 값이 검출 파라미터로서 사용된다:
8) 외접 사각형(221)의 좌측과 외접 사각형(222)의 우측간의 거리 b에 대한 외접 사각형(221)의 우측과 외접 사각형(222)의 좌측간의 거리 a의 비; p
9) 외접 사각형의 평균폭 MX에 대한 외접 사각형(221)의 좌측과 외접 사각형(222)의 우측간의 거리 b의 비; q
10) 외접 사각형(221)의 면적 c와 외접 사각형(22)의 면적 d의 곱 대 외접 사각형의 평균폭 MX 와 외접 사각형 평균 높이 MY 의 곱의 제곱과의 비;r
즉, 이들 파라미터는 다음의 식과 같이 된다.
p = a/b
q = b/MX
r = (c×d)/(MX×MY)2
도 59에 나타낸 흐름도를 참조하여 분리 문자 처리를 설명한다. 이 분리 문자 처리는 'ル' 또는 'ハ' 등과 같은 2 개 이상의 연결 패턴으로 구성되는 분리 문자를 검출하기 위한 것이다.
스텝 S191에서는 우측 상향(right-lifted) 패턴이 연결 패턴중에 존재하는지의 여부가 판정된다. 우측 상향 패턴이 전혀 존재하지 않으면, 분리 문자 처리는 수행되지 않는다.
우측 상향 패턴이 스텝 S191에서 검출되지 않으면, 스텝 S192로 진행되며, 상술한 우측 상향 패턴의 우측에 인접하고 또한 좌측 하향하는 패턴, 즉 예를들어 'ハ' 패턴 또는 우측 상향 패턴의 우측에 인접하고 또한 직각 방향으로 탐색한 경우의 패턴과 교차하는 회수(직각 라인 밀도)가 2인 패턴, 즉 예를들어 'ル'에 대응하는 패턴이 존재하는지가 판정된다. 패턴이 'ハ' 또는 'ル' 형태의 패턴이 아니라면, 분리 문자 처리는 수행되지 않는다.
스텝 S192에서 상기 패턴이 'ハ' 또는 'ル' 형태의 패턴인 것으로 판정되면, 스텝 S194로 진행된다.
스텝 S191 및 S192 과 별도로 문자열의 외접 사각형의 평균 문자 크기가 스텝 S193에서 계산된다.
상술한 스텝 S192 와 S193가 완료된 후, 스텝 S194에서는 도 54에 나타낸 파라미터 p 내지 r의 값이 계산된다.
위첨자 획선 처리시 위첨자 획선을 갖는 패턴의 후보가 이들 패턴간의 거리와, 통합된 인접 패턴의 크기와, 검출 파라미터인 평균 문자의 크기대 문자의 크기비의 이용을 위해 검사된다.
즉, 다음의 값이 도 56에 나타낸 것과 같은 검출 파라미터로서 이용된다:
11) 외접 사각형(231)의 우측과 외접 사각형(232)의 좌측간의 거리 a 대 외접 사각형(231)의 좌측과 외접 사각형(232)의 우측간의 거리 b의 비; p
12) 외접 사각형(231)의 좌측과 외접 사각형(232)의 우측간의 거리 b 대 외접 사각형들의 평균폭 MX 의 비; q
13) 외접 사각형(231)의 면적 c와, 외접 사각형(232)의 면적 d의 곱 대 외접 사각형들의 평균폭 MX 와 외접 사각형들의 평균 높이 MY 의 곱의 제곱과의 비; r
즉, 파라미터 p 내지 r이 수학식 7 내지 수학식 9에서와 동일하게 표현될 수 있다.
도 61에 나타낸 흐름도를 참조하여 위첨자 획선 처리를 설명한다.
먼저 스텝 S201에서는 위첨자 획선용 후보 패턴을 추출한다. 예를들어, 연결 패턴 추출부에 의해 추출된 2개의 연결 패턴이 인접할 경우, 또한 이들 인접 패턴을 통합한 때의 크기와 문자열의 외접 사각형의 평균 문자 크기의 비가 소정의 임계 이하, 예를들어 1/4 이하인 경우, 위첨자 획선을 갖는 패턴의 후보로서 추출된다.
스텝 S202에서는 위첨자 획선 후보가 되는 패턴의 좌측에 인접하여 외접 사각형이 존재하는지의 여부가 조사된다. 위첨자 획선의 후보가 되는 패턴의 좌측에 인접하는 외접 사각형이 존재하지 않는다면, 이 위첨자 획선의 후보가 되는 패턴은 위첨자 획선 처리의 대상에서 제거된다.
스텝 S202에서 위첨자 획선 후보가 되는 패턴의 좌측에 인접 외접 사각형이 존재하는 것으로 판정되면, 스텝 S204 로 진행된다.
스텝 S203에서 상술된 스텝 S201 및 S202 와 별도로 문자열의 외접 사각형의 평균 문자 크기가 계산된다. 스텝 S202 와 S203의 처리가 완료된 후, 스텝 S204에서는 도 60에 나타낸 파라미터 p 내지 r 의 값이 계산된다.
다음에, 학습 데이타를 사용하여 미지의 수기 문자열에 대한 문자의 검출시의 신뢰도를 계산하기 위한 판별면을 설정한다. 파라미터의 개수가 n이라면, 검출이 성공된 그룹과 검출이 실패한 그룹의 2개의 그룹을 n 차원 공간상에 생성한다.
도 62는 검출 성공시와 검출 실패시의 데이타를 계산하는 방법을 나타내는 흐름도이다.
도 62의 스텝 S211에서, 미리 수집된 학습 데이타에 대해, 대상 외접 사각형과 인접 외접 사각형을 통합하여 1문자로 할 수 있는지를 육안으로 판단한다. 대상 외접 사각형과 인접 외접 사각형을 통합하여 1문자로 만들 수 있는 경우, 스텝 S212로 진행된다. 대상 외접 사각형과 인접 외접 사각형을 통합하여 1문자로 만들 수 없는 경우, 스텝 S213으로 진행된다.
스텝 S212에서 대상 외접 사각형과 인접 외접 사각형이 단일 문자로 통합될 수 있다면, 대상 외접 사각형과 인접 외접 사각형의 파라미터의 값이 기록된다. 대상 외접 사각형과 인접 외접 사각형의 파라미터들은 통계적 처리의 경우 도 52에 나타낸 파라미터 a 내지 g를 이용할 수 있고, 비통계적 처리의 경우 도 58 및 도 60에 나타낸 파라미터 p 내지 r을 이용할 수 있다.
스텝 S213에서 대상 외접 사각형과 인접 외접 사각형이 단일 문자로 성공적으로 통합될 수 없다면, 대상 외접 사각형과 인접 외접 사각형의 파라미터의 값이 기록된다.
이어서, 통계적 처리와 비통계적 처리에 있어서의 검출 파라미터의 값이 미지 문자열에 대해 계산된다. 학습 데이타로부터 얻어진 판별면의 거리가 파라미터의 값에 의해 결정된 다차원 공간상의 점에 대해 계산된다. 이것을 검출 신뢰도로서 정량화한다.
예를 들어 특징량 파라미터수가 3일 때, H는 2개의 그룹, 즉 검출 성공 문자와 검출 실패 문자를 판별하기 위해 이용하는 판별면을 나타내고, n은 도 63에 나타낸 바와 같이 판별면 H의 단위 법선 벡터를 나타낸다. 파라미터의 값과 p 의 벡터값이 동일하면, 파라미터값에 대응하는 3차원 공간내의 점 p 와 판별면간의 거리 h는 다음 수학식과 같이 표현될 수 있다.
h = OP·n
여기서, OP는 3차원 공간의 원점 O에서 3차원 공간내의 점 P로 향하는 벡터이다.
판별면 H 로부터의 거리 h가 양인지 또는 음인지에 의해 파라미터값이 검출 성공 그룹 또는 검출 실패 그룹의 어느 그룹에 속하는지를 판정하고, 이 파라미터의 값이 상기 판별면 H 로부터 어느 정도로 떨어져 있는지를 판정한다.
도 64에 나타낸 바와 같이, 다차원 공간의 학습 데이타의 전체 파라미터에 대해 판별면 H로부터의 거리 h에 기초하여 검출 성공한 히스토그램(241)과 검출 실패한 히스토그램(242)이 얻어진다. 통상적으로, 히스토그램 분포(241,242)는 정규 분포이므로 히스토그램 분포(241, 242)를 정규 분포에 근사시킨다. 이러한 정규 분포에서는 부분적으로 중복하는 영역이 발생한다.
본 발명에 따르면, 상기 중복 영역에 위치하는 검출 파라미터를 갖는 인접 패턴의 검출 신뢰도에 문자 인식의 신뢰도를 부가하여 이들 패턴들의 통합 여부가 결정된다.
도 65는 검출 신뢰도의 계산 방법에 대한 예를 나타내는 흐름도이다.
도 65의 스텝 S221에서는 판별면 H로부터 복수의 파라미터에 의해 결정된 다차원 공간내의 점까지의 거리 h가 상술된 수학식 10에 의해 계산된다.
스텝 S222에서는 학습 데이타로부터 얻은 복수의 파라미터값의 히스토그램 분포가 정규 분포를 이용하여 근사된다. 즉, 도 66에 나타낸 바와 같이 검출 성공 패턴의 히스토그램 분포는 정규 분포(251)를 이용하여 근사되고, 검출 실패 패턴의 히스토그램 분포는 정규 분포(252)를 이용하여 근사된다.
스텝 S223에서 2 그룹의 중복 영역이 계산된다. 예를 들어 검출 성공 패턴 정규 분포(251)와 검출 실패 패턴 정규 분포(252)간의 중복 영역은 도 66에 나타낸 바와 같이 2 그룹의 중복 영역(254)으로서 계산된다. 이때 검출 성공 패턴 정규 분포(251)내의 2 그룹의 중복 영역(254) 이외의 영역(253)은 검출 성공 영역으로서 설정된다. 검출 실패 패턴 정규 분포(252)내의 2 그룹의 중복 영역(254) 이외의 영역(255)은 검출 실패 영역으로서 설정된다.
스텝 S224에서는 히스토그램 분포 상에서의 미지 문자에 대한 입력 파라미터값의 위치가 결정된다.
스텝 S225에서는 미지 문자에 대한 입력 파라미터값의 히스토그램 분포상에서의 위치를 판정한 결과, 미지 문자에 대한 입력 파라미터값이 2 그룹의 중복 영역(254)에 포함되면, 스텝 S226으로 진행된다. 그리고, 2 그룹의 중복 영역(254)내의 미지 문자에 대한 입력 파라미터값의 위치에 기초하여 검출 신뢰도가 계산된다.
스텝 S225에서 미지 문자에 대한 입력 파라미터값이 2 그룹의 중복 영역(254)에 포함되지 않는 것으로 판정되면, 스텝 S226으로 진행되며, 미지 문자에 대한 입력 파라미터값이 검출 성공 영역(253)에 포함되는지가 판정된다.
미지 문자에 대한 입력 파라미터값이 검출 성공 영역(253)에 포함되는 것으로 판정되면, 스텝 S228로 진행되고, 검출 신뢰도가 '1'로 설정된다. 미지 문자에 대한 입력 파라미터값이 검출 성공 영역(253)에 포함되지 않는 것으로 판정되면, 스텝 S229로 진행되고, 검출 신뢰도는 '0'으로 설정된다.
예를들어, 판별면으로부터 미지 문자에 대한 입력 파라미터값까지의 거리를 계산한 결과, 그 거리가 2 그룹의 중복 영역(254)내에 포함되는 경우, 판별면으로부터 미지 문자에 대한 입력 파라미터값까지의 거리에 기초하여 검출 신뢰도가 계산된다. 판별면으로부터 미지 문자에 대한 입력 파라미터값까지의 거리가 검출 성공 영역(253)에 포함되면 검출 신뢰도는 '1'로 설정된다. 판별면으로부터 미지 문자에 대한 입력 파라미터값까지의 거리가 검출 실패 영역(255)에 포함되면, 검출 신뢰도는 '0'으로 설정된다.
도 67은 2 그룹의 중복 영역의 예를 나타내는 흐름도이다.
도 67의 스텝 S231에서는 학습 데이타로부터 얻어지는 검출 성공 패턴과 검출 실패 패턴의 히스토그램 분포에 대해 히스토그램(261)의 평균값 m 과 분산값 v 가 계산된다.
스텝 S232에서는 검출 성공 패턴과 검출 실패 패턴의 히스토그램 분포에 대하여 정규 분포 곡선(262)과 히스토그램(261)의 제곱 오차의 합 d가 계산된다.
스텝 S233에서는 적합도 T 가 다음의 수학식 11에 의해 계산된다.
T=d/S
여기서, S는 정규 분포 곡선(262)의 면적을 나타낸다.
스텝 S234에서는 정규 분포 곡선(262)의 중심에서 끝단까지의 거리 L이 다음의 수학식 12에 의해 계산된다.
L = K×(1 + T)×V1/2
여기서, k는 비례 상수를 나타내고, V1/2은 표준 편차와 동일하다.
스텝 S235에서는 정규 분포 곡선(263)의 우측 끝단(267)에서부터 정규 분포 곡선(264)의 왼쪽 끝단(266)까지의 영역이 2 그룹의 중복 영역(265)으로서 설정된다.
다음에 도 65에 나타낸 처리에서 얻어진 검출 신뢰도에 따라 인식 처리가 수행되는지의 여부가 결정된다. 이 경우, 예를들어 인식 처리는 높은 검출 신뢰도를 갖는 검출된 문자의 후보에 대해서는 수행되지 않지만 낮은 검출 신뢰도를 갖는 검출된 문자의 후보에 대해서는 수행된다.
검출된 문자에 대한 복수의 후보에 대해 인식 신뢰도와 검출 신뢰도를 고려하여 검출될 문자가 선택된다. 그 결과, 부분적으로 문자가 나타나지만 잘못된 문자열이 완전히 나타나는 문자의 후보는 검출될 문자로부터 제거될 수 있다. 예를들어 전체 검출 신뢰도 R은 다음과 같이 표현된다.
R = ∑(j·αi+ βi)
여기서, αi는 인접 패턴의 검출 신뢰도 또는 검출 판정부를 나타내고, βi는 인식 신뢰도를 나타내며, j는 가중 계수를 나타낸다.
이어서 검출될 복수의 문자에 대한 후보로부터 검출될 최종 문자로서 보다 큰 전체 신뢰도 R을 갖는 문자가 선택된다.
도 68은 각 문자가 문자열 'グンマ'로부터 검출되는 경우를 도시하고 있다. 이 경우, 문자열 'グンマ'로부터 검출되기 전에 통계적 및 비통계적 처리에 대한 판별면과 히스토그램값의 정규 분포 곡선이 학습 데이타를 사용하여 각각 얻어진다.
통계적 처리에 있어서, 도 56에 나타낸 파라미터 c, e 및 f는 문자열의 성공적인 검출 또는 비성공적인 검출을 판정하기 위한 파라미터로서 사용된다. 학습 데이타를 사용하여 얻은 식별 상태는 다음과 같이 표현된다.
0.84 × 0 + 0.43 × 1 + 0.33 × 2 - 145.25 = 0
도 67에 나타낸 학습 데이타의 검출 성공을 나타내는 히스토그램 분포의 평균값 m은 128.942 이다. 표준 편차는 34.77이다. 적합도 T는 수학식 11에 따라 0.12이다. 비례 상수 k가 2 라면 분포의 중심에서 끝단까지의 거리는 수학식 12에 따라 77.8 이 된다.
도 67에 나타낸 학습 데이타의 검출 실패를 나타내는 히스토그램 분포의 평균값은 71.129이다. 평균 분포는 36.26이다. 적합도 T는 수학식 11에 따라 0.35 이다. 비례 정수 k가 2라면 분포의 중심에서 끝단까지의 거리 L은 수학식 10에 따라 92.2 이 된다.
도 68의 스텝 S241에서는 입력 이미지로부터 미지 문자의 입력 패턴이 판독된다.
다음에, 스텝 S242에서는 라벨을 사용하여 연결 패턴이 추출되고, 라벨 번호 <1> 내지 <6>이 추출된 각각의 연결 패턴에 도 68에 나타낸 바와 같이 부여된다.
스텝 S245에서는 스텝 S243의 통계적 처리와 스텝 S244 의 비통계적 처리에 따라 검출 신뢰도가 정량화된다.
스텝 S243의 통계적 처리에 있어서 인접 연결 패턴이 통합될 때 검출 신뢰도는 판별면으로부터 파라미터 c, e, f의 값을 갖는 3차원 공간상의 점까지의 거리 h에 따라 계산된다. 예를들어, 이러한 검출 신뢰도 α는 다음과 같이 표현될 수 있다.
α = (h - w1)/(w2- w1)×100
w1은 2 그룹의 중복 영역의 좌단의 위치를 나타낸다.
w2은 2 그룹의 중복 영역의 우단의 위치를 나타낸다.
예를들어, 라벨 번호 <2>가 할당된 패턴에 라벨 번호 <1>이 할당된 패턴이 통합될 때 얻어진 검출 신뢰도는 80이다. 라벨 번호 <3>이 할당된 패턴에 라벨 번호 <2>가 할당된 패턴이 통합될 때 얻어진 검출 신뢰도는 12이다. 라벨 번호 <4>가 할당된 패턴에 라벨 번호 <3>이 할당된 패턴이 통합될 때 얻어진 검출 신뢰도는 28이다. 라벨 번호 <5>가 할당된 패턴에 라벨 번호 <4>가 할당된 패턴이 통합될 때 얻어진 검출 신뢰도는 92이다. 라벨 번호 <6>이 할당된 패턴에 라벨 번호 <5>가 할당된 패턴이 통합될 때 얻어진 검출 신뢰도는 5 이다.
스텝 S244 의 비통계적 처리에서 위첨자 획선을 갖는 패턴 'グ'의 검출 신뢰도는 판별면으로부터 도 60의 파라미터 p 내지 r의 값을 갖는 3 차원 공간상의 점까지의 거리 h에 따라 계산된다.
예를들어, 라벨 번호 <2>와 <3>이 할당된 패턴으로 이루어진 검출결정부(271)의 위첨자 문자 패턴내에 라벨 번호 <1>이 할당된 패턴이 통합될 때 얻어진 검출 신뢰도는 85이다.
도 69는 스텝 S244 의 비통계적 처리로 검출 신뢰도를 계산하는 방법을 나타내는 도면이다.
스텝 S251에서 패턴(272)이 위첨자 획선의 후보로서 추출된다. 예를들어, 2개의 연결 패턴이 인접하여 존재하는 경우, 또 이들을 통합한 때의 크기와 문자열의 외접 사각형의 평균 문자 크기의 비가 소정의 임계값 이하인 경우, 이 패턴이 위첨자 획선의 후보가 된다.
스텝 252에서는 위첨자 획선 후보가 되는 패턴(272)의 좌측에 인접하는 외접 사각형(281)이 존재하는지의 여부가 결정된다. 위첨자 획선 후보가 되는 패턴(272)의 좌측에 인접하는 외접 사각형(281)이 존재한다면, 스텝 S253으로 진행되어 도 60에 나타낸 파라미터 p 내지 r 의 값이 계산된다.
도 69에 나타낸 예에서 각 파라미터의 값은 다음과 같이 계산된다.
p = a/b = 0.1
q = b/MX = 1.3
r = (c × d) / (MX × MY)2= 0.3
여기서 a는 외접 사각형(281)의 우측과 외접 사각형(272)의 좌측간의 거리를 나타내고, b는 외접 사각형(281)의 좌측과 외접 사각형(272)의 우측간의 거리를 나타내고, c는 외접 사각형(281)의 면적을 나타내며, d는 외접 사각형(272)의 면적을 나타내며, MX는 외접 사각형의 평균 폭을 나타내고, MY는 외접 사각형의 평균 높이를 나타낸다.
스텝 S254에서는 판별면(293)으로부터 파라미터 p 내지 r의 값을 갖는 3차원 공간상의 점까지의 거리가 계산된다. 판별면(293)에서부터 파라미터 p 내지 r 의 값을 갖는 3차원 공간상의 점까지의 거리를 계산하기 위해 학습 패턴에 기초하여 판별면(293)이 계산된다. 이 판별면(293)은 예를들어 학습 패턴에 대한 문자열의 검출 성공을 나타내는 히스토그램 분포(292)와 검출 실패를 나타내는 히스토그램 분포(291)에 기초하여 수학식 3에 의해 얻어질 수 있다. 위첨자 획선의 추출에 파라미터 p 내지 r을 사용하는 판별면(293)에 대한 수학식은 3차원 공간의 평면 방정식으로 지칭되는 다음의 식으로 표현된다.
0.17 × X0+ 0.75 × X1+ 0.64 × X2+ 30.4 = 0
따라서, 판별면(293)에서부터의 거리 h는 다음과 같이 수학식 16 내지 18에 의해 얻어진 값을 수학식 19에 대입함으로써 계산된다.
h = 0.17 × 0.1 - 0.75 × 1.3 + 0.64 × 0.3 + 30.4 = 29.6
학습 데이타의 성공적인 검출을 나타내는 히스토그램 분포(292)의 평균치 m은 38이고, 표준 편차는 25이다. 적합도 T는 수학식 11에 따라 0.2 이다.
도시된 학습 데이타의 검출 실패를 나타내는 히스토그램 분포(291)의 평균치 m은 -34이고, 표준 편차는 28이며, 적합도 T는 수학식 11에 따라 0.3 이다.
학습 데이타의 성공적인 검출을 나타내는 히스토그램 분포(292)의 좌단 W1은 비례 상수 K 를 2로 하면 수학식 12에 의해 다음과 같이 계산된다.
W1= 38 - 2 × (1 + 0.2) × 25 = -22
학습 데이타의 검출 실패를 나타내는 히스토그램 분포(291)의 우단 W2은 비례 상수 K 를 2로 하면 수학식 12에 의해 다음과 같이 계산된다.
W2= - 34 + 2 × (1 + 0.3) × 28 = 38.8
따라서, 2 그룹의 중복 영역(294)은 판별면에서부터 -22 내지 38.8의 거리에 위치한다.
다음에, 스텝 S255에서 검출 신뢰도 α가 계산된다. 검출 신뢰도 α는 다음과 같이 수학식 20 내지 22에 의해 얻어진 값에 수학식 15에 대입함으로써 계산된다.
α = [{29.6 - (-22)} / {38.8 - (-22)}] × 100 = 85
따라서, 검출 판정부(271)는 라벨 번호 <2> 와 <3>이 할당된 패턴을 통합함으로써 생성된다.
도 68에 나타낸 스텝 S246에서는 통계적 처리와 비통계적 처리의 신뢰도가 합성된다. 이때, 검출 판정부가 있다면 이것을 우선으로 한다. 따라서, 검출 판정부(271)의 신뢰도가 우선하여 합성된다.
그 결과, 검출 판정부(271)의 패턴과 라벨 <1>이 할당된 패턴을 통합함으로써 얻어지는 검출 신뢰도는 85이다. 라벨 <4>가 할당된 패턴내에 검출 판정부(271)의 패턴을 통합함으로써 얻어지는 검출 신뢰도는 30이다. 라벨 <5>가 할당된 패턴과 라벨 번호 <4>가 할당된 패턴을 통합함으로써 얻어지는 검출 신뢰도는 92 이다. 라벨 번호 <6>이 할당된 패턴과 라벨 번호 <5>가 할당된 패턴을 통합함으로써 얻어지는 검출 신뢰도는 5이다.
검출 신뢰도가 소정의 임계값(예를들어 90) 이상이거나 또는 검출 신뢰도가 소정의 임계값(예를들어 70) 이상이고 또한 그 인접 검출패턴의 검출 신뢰도에 대한 신뢰도의 비율이 소정의 값(예컨대 5) 이상이면 패턴이 통합된다.
검출 신뢰도가 소정의 임계값 이하(예를들어 8)라면 패턴은 통합되지 않는다. 검출 판정부(271)의 패턴과 라벨 <1>이 할당된 패턴을 통합함으로써 얻어진 검출 신뢰도가 85이고, 라벨 <4>가 할당된 인접패턴의 검출 신뢰도와의 비율이 85/30 = 2.8 이기 때문에, 라벨 번호 <1>이 할당된 패턴은 검출 판정부(271)의 패턴과 통합되지 않는다. 라벨 번호 <4>가 할당된 패턴과 검출 판정부(271)의 패턴을 통합함으로써 얻어진 검출 신뢰도가 30 이므로, 검출 판정부(271)의 패턴은 라벨 번호 <4>가 할당된 패턴과 통합되지 않는다.
라벨 번호 <5>가 할당된 패턴과 라벨 번호 <4>가 할당된 패턴을 통합함으로써 얻어지는 검출 신뢰도가 92 이기 때문에 라벨 번호 <4>가 할당된 패턴은 라벨 번호 <5>가 할당된 패턴과 통합된다. 라벨 번호 <6>이 할당된 패턴과 라벨 번호 <5>가 할당된 패턴을 통합함으로써 얻어지는 검출 신뢰도가 5 이기 때문에, 라벨 번호 <5>가 할당된 패턴은 라벨 번호 <6>이 할당된 패턴과 통합되지 않는다.
따라서, 라벨 번호 <5>가 할당된 패턴과 라벨 번호 <4>가 할당된 패턴을 통합함으로써 얻어지는 검출 판정부(273)에 대응하는 외접 사각형(275)과 라벨 번호 <6>이 할당된 패턴에 대응하는 외접 사각형(276)이 생성된다.
이어서, 검출 판정부(271)의 패턴과 새롭게 생성된 검출 판정부(273)의 패턴이 통합될 때 검출 신뢰도가 얻어진다. 검출 신뢰도는 도 68에 나타낸 예에서 60 이다.
스텝 S247에서는 검출 신뢰도에 따른 패턴의 통합이 종료된 시점에서 검출 후보(1)와 검출 후보(2)가 추출된다. 이어서, 검출 후보 1과 2의 각 문자에 대해 인식 처리가 수행된다. 검출 후보 1과 2의 문자의 검출 신뢰도 α와 β는 각 문자에 대해 얻어지고 검출 신뢰도 α와 β의 합은 전체 신뢰도 R 로 정의된다.
예를들어, 검출 후보(1)로서 외접 사각형(275,276,278)이 검출되면, 외접 사각형(278)내의 패턴에 대해 문자 인식 처리가 수행될 때 얻어진 인식 신뢰도 β는 80 이 되고, 외접 사각형(275)내의 패턴에 대해 문자 인식 처리가 수행될 때 얻어진 인식신뢰도 β는 90이 되며, 외접 사각형(276)의 패턴에 대해 문자 인식 처리가 수행될 때 얻어진 인식 신뢰도 β는 85이다.
검출 판정부(271)의 패턴과 라벨 번호 <1>이 할당된 패턴이 통합될 때 얻어진 검출 신뢰도 α는 85이기 때문에 전체 신뢰도 R은 가중 계수 j를 1로 하면 수학식 13에 의해 345가 된다.
예를들어, 검출 후보(2)로서 외접 사각형(276, 281, 282)이 검출되면 외접 사각형(281)내의 패턴에 대해 문자 인식 처리가 수행될 때 얻어진 인식 신뢰도 β는 83 이 되고, 외접 사각형(282)내의 패턴에 대해 문자 인식 처리가 수행될 때 얻어진 인식 신뢰도 β는 55가 되며, 외접 사각형(276)의 패턴에 대해 문자 인식 처리가 수행될 때 얻어진 인식 신뢰도 β는 85이다.
검출 판정부(273)의 패턴과 검출 판정부(271)의 패턴이 통합될 때의 검출 신뢰도 α가 60이므로, 전체 신뢰도 R은 283이다.
스텝 S248에서 검출 후보 1 또는 검출 후보 2 중 어느 것이든 전체 신뢰도 R 이 큰 것이 성공적으로 검출된 문자의 후보로서 선택된다. 그 결과, 문자열 'グンマ'로부터 각각의 문자 'グ','ン','マ'가 정확히 검출된다.
이하, 도 17의 모호한 문자 인식부(19)의 동작이 상술된다.
도 70은 상기 모호한 문자 인식부(19)의 구성에 대한 실시예를 나타내는 블록도이다.
도 70에서, 특징 추출부(301)는 모호한 문자로부터 문자의 특징을 추출하여 추출된 특징을 특징 벡터로 나타낸다. 모호한 문자 사전(302)은 모호한 문자의 각 카테고리에 대한 특징 벡터를 기억한다. 조회부(303)는 모호한 문자 사전(302)에 기억된 각 카테고리의 특징 벡터를 갖는 특징 추출부(301)에 의해 추출되는 문자 패턴의 특징 벡터를 조회하고, 특징 공간상에서의 특징 벡터간의 거리 Dij(i는 미지 문자의 특징 벡터를 나타내고, j는 모호한 문자 사전(302)내의 카테고리의 특징 벡터를 나타냄)를 계산한다. 그 결과, 특징 벡터간의 최단거리 Dij를 나타내는 카테고리 j는 미지 문자 i로 인식된다.
특징 공간내의 특징 벡터간의 거리 Dij는 예를 들어 유클리드 거리 Σ(1-j)2, 과 시티블록 거리 Σ│i-j│, 식별 함수 등과 같은 식별 함수를 이용하여 계산될 수 있다.
제1 카테고리로부터의 거리를 Dij1로 하고 제2 카테고리로부터의 거리를 Dij2로 하여, 상기 제1 카테고리 j1, 제2 카테고리 j2, 카테고리간의 거리(Dij2- Dij1) 및 신뢰도에 관한 표 1을 미리 작성한다. 또한, 제1 카테고리로부터의 거리 Dij1, 제1 카테고리 j1 및 신뢰도에 관한 표 2도 미리 작성한다. 표 1과 2에서 보다 낮은 신뢰도를 갖는 데이타가 중간 처리 결과표에 기억된다.
도 7에 나타낸 변형 문자 인식부(21)는 변형 문자 인식부(21)가 변형된 문자의 각 카테고리내에 특징 벡터를 기억시키는 변형 문자 사전을 이용하는 것을 제외하면 모호한 문자 인식부(19)와 유사하게 설계될 수 있다.
이하 도 7에 나타낸 삭제 라인 인식부(26)의 실시예를 설명한다. 삭제 라인 인식부(26)는 예를들어 도 8의 스텝 S4의 정정 분석에 의해 추출된 정정 문자에 대한 후보의 수평 방향 화소수의 합을 포함하는 히스토그램을 작성하고, 히스토그램값이 소정값을 초과하는 영역에 수평 라인이 존재한다는 것을 인식함으로써 영역내의 수평 라인을 제거한다.
다음에, 수평 라인의 제거와 더불어 모호한 부분을 보완하고, 사전을 이용하여 보완된 패턴을 조회함으로써 문자가 인식된다. 그 결과, 문자로 인식된 패턴에 대해서는 정정 문자의 후보가 삭제 라인이 있는 문자로 간주된다. 거부된 패턴에 대해서는 정정 문자의 후보가 통상 문자로 간주된다.
도 71에서 예를들어 정정된 문자의 후보로서 이중 수평선에 의해 정정된 상태의 문자 '5'가 입력된다. 임계값 N 이상의 수평 히스토그램값을 나타내는 이중 수평선을 검출한 후 그리고 이 이중 수평선이 제거된 후, '5'의 카테고리로서 보완된 패턴을 인식함으로써 입력 패턴이 인식된다. 문자 '5'가 정정 문자의 후보로서 입력되면, 임계값 N 이상의 수평 히스토그램값을 나타내는 수평 라인이 검출된다. 문자 '5'로부터 수평 라인이 제거되고 패턴이 거부되면, 정정 문자로서의 입력 패턴이 인식되지 않는다.
이하 도 7에 나타낸 특이 문자 분석부(23)의 실시예가 설명된다. 특이 문자분석부(23)는 동일 카테고리에 속하는 것으로 인식된 수기 문자를 소정의 클러스터수로 밀집(클러스터링)시킨다. 상이한 카테고리에 속하는 클러스터간의 거리가 작은 것에 대해서는 보다 적은 개수의 요소를 포함하는 클러스터의 문자 카테고리를 보다 많은 개수의 요소를 포함하는 클러스터의 문자 카테고리로 수정함으로써 다른 문자 카테고리에 속하는 것으로 잘못 판독된 수기 문자가 정확히 판독될 수 있다.
도 72는 '4'의 문자 카테고리에 속하는 것으로 인식된 수기 문자의 특징 벡터를 이용한 클러스터링 처리를 나타낸다.
도 72에는 인식 사전에 기억된 '4'의 문자 카테고리의 특징 벡터와의 거리가 가깝기 때문에 '4'의 인식 결과 카테고리에 속하는 것으로 판정된 수기 문자가 도시되어 있다. 이러한 인식 처리에 있어서, 수기 문자 '2'는 '4'의 인식 결과 카테고리에 속하는 것으로 잘못 인식되고 있다.
제1 클러스터링 처리에 있어서, '4'의 문자 카테고리에 속하는 것으로 판정된 수기 문자가 각각 1개의 클러스터로서 간주된다. 제2 클러스터링 처리에서는 클러스터로서 간주된 문자간의 특징 벡터의 거리가 계산되고, 특징 벡터의 거리가 가장 짧은 것이 하나의 클러스터에 통합된다. 그 결과, 클러스터의 개수는 도 72에 나타낸 바와 같이 11에서 10으로 하나가 감소한다.
제3 클러스터링 처리 및 그 이후의 클러스터링 처리에 있어서, 클러스터의 개수는 클러스터들간의 특징 벡터의 거리를 계산하고, 특징 벡터의 거리가 가장 짧은 것을 통합함으로써 클러스터수를 감소시켜 제11 클러스터링 처리에서 클러스터수는 1이 된다.
클러스터들이 통합될 때 단지 하나의 요소만을 포함하는 것들은 예를들어 시티 블록 거리를 사용하여 서로 간의 거리가 비교된다. 클러스터들이 복수의 요소를포함할 때 중심법(center-of-gravity method)이 사용된다. 중심법은 M개의 요소를 포함하는 클러스터의 i번째 요소의 특징 벡터 xi(i=1,2,3,...,M)를 xi=(xi1,x12,x13,...,xiN)로 표현할 때 그 클러스터의 대표 벡터 xm을 다음과 같이 클러스터의 요소의 특징 벡터 xi의 평균으로 표현하는 방법이다.
Figure pat00003
복수의 소자를 포함하는 클러스터는 대표 벡터 xm간의 시티블록 거리를 계산함으로써 서로 비교된다.
클러스터의 개수가 1로 감소될 때까지 클러스터링 처리가 반복되면, '4'의 문자 카테고리에 속하는 것으로 잘못 인식된 수기 문자 '2'는 '4'의 문자 카테고리에 속하는 것으로 정확히 인식된 수기 문자 '4'와 동일한 문자 카테고리에 속하는 것으로 간주되므로 클러스터링 처리를 중도에 중단시키기 위한 클러스터링 중단 조건을 설정해야 한다.
클러스터링 중단 조건으로서 다음의 경우가 있다.
(1) 클러스터의 개수가 소정의 값(예를들어 3)에 도달하는 경우,
(2) 클러스터들이 통합될 때 클러스터들간의 거리가 소정의 임계값을 초과하는 경우,
(3) 클러스터들이 통합될 때 클러스터들간의 거리의 증가율이 임계값을 초과하는 경우.
도 73은 클러스터 처리를 나타내는 흐름도이다.
도 73에 나타낸 바와 같이 스텝 S261에서는 어떤 특정 문자 카테고리에 속하는 것으로 인식된 수기 문자의 특징 벡터만이 추출된다. 추출된 각 수기 문자의 특징 벡터는 하나의 클러스터로 간주된다.
스텝 S262에서는 클러스터링 중단 조건이 설정된다.
스텝 S263에서는 어떤 문자 카테고리에서의 전체 클러스터 중에서 가장 근접한 2개의 클러스터가 선택된다.
스텝 S264에서는 스텝 S262에서 설정된 클러스터 중단 조건이 충족되는지의 여부가 판정된다. 스텝 S262에서 설정된 클러스터 중단 조건이 충족되지 않으면, 스텝 S265로 진행되어 스텝 S263에서 선택된 2개의 클러스터가 통합되며, 그 후 스텝 S263으로 복귀하여 클러스터를 통합하는 처리를 반복한다.
클러스터 통합 처리를 반복한 결과, 스텝 S264에서 클러스터링 중단 조건이 충족된 것으로 판정되면, 스텝 S266으로 진행되어 전체 문자 카테고리에 대해 클러스터링 처리가 수행되었는지의 여부가 판정된다. 전체 문자 카테고리에 대해 클러스터링 처리가 수행되지는 않았다면, 스텝 S261 로 복귀하여 미처리된 문자 카테고리에 대해 클러스터링 처리가 수행된다.
전체 문자 카테고리에 대해 클러스터링 처리가 수행되었다면, 스텝 S267로 진행하여 그 클러스터링 결과가 메모리에 기억된다.
이어서, 클러스터링 처리에서 얻어진 클러스터링 결과에 기초하여 상이한 카테고리에 속하는 것으로 오인된 수기 문자가 정확하게 판독된다.
도 74는 '4'의 문자 카테고리에 속하는 것으로 오인된 수기 문자 '2'를 정확한 문자 카테고리 '2'로 정확하게 판독하는 처리를 도시한다.
도 74에는 '2'의 인식 결과 카테고리에 속하는 것으로 판정된 수기 문자와 '4'의 인식 결과 카테고리에 속하는 것으로 판정된 수기 문자가 도시되어 있다. 수기 문자 '3'은 '2'의 인식 결과 카테고리에 속하는 것으로 오인되고, 수기 문자 '2'는 '4'의 인식 결과 카테고리에 속하는 것으로 오인된다. 수기 문자 '4'는 어떠한 인식 결과 카테고리에도 속하지 않는 것으로 거부된다.
동일 카테고리내의 클러스터의 수가 3에 도달할 때를 클러스터링 중단 조건으로 설정하여 클러스터링 처리를 실행함으로써, '2'의 인식 결과 카테고리에 대해서는 클러스터 a, b 및 c가 발생되고, '4'의 인식 결과 카테고리에 대해서는 클러스터 d, e 및 f가 발생된다. 3개의 거부된 수기 문자 '4'에 대해서는 클러스터 g, h 및 i가 발생된다.
그후, '2'의 인식 결과 카테고리에 속하는 클러스터 a, b 및 c 또는 '4'의 인식결과 카테고리에 속하는 클러스터 d, e 및 f 중에서 문자수가 작은 클러스터를 오독 클러스터 후보로서 추출한다.
오독 후보 클러스터 a에서 각각의 다른 클러스터 b, c, d, e 및 f까지의 거리와 오독 후보 클러스터 d에서 각각의 다른 클러스터 a, b, c, e 및 f까지의 거리가 계산된다. 클러스터 b가 오독 후보 클러스터 a에 가장 근접한 클러스터로서 추출된다. 오독 후보 클러스터 a와 b 사이의 거리가 소정값보다 작은지의 여부가 판정된다. 오독 후보 클러스터 a와 b 사이의 거리가 소정값보다 작지 않기 때문에, 오독 후보 클러스터 a는 거부된다.
그 결과, '2'의 인식 결과 카테고리에 속하는 것으로 오인된 수기 문자 '3'이 '2'의 인식 결과 카테고리에서 제거된다.
클러스터 b가 오독 후보 클러스터 d에 가장 근접한 클러스터로서 추출된다. 오독 후보 클러스터 d와 클러스터 b 사이의 거리가 소정값보다 작은지의 여부가 판정된다. 오독 후보 클러스터 d와 클러스터 b 사이의 거리가 소정값보다 작기 때문에, 오독 후보 클러스터 d는 클러스터 j를 발생하기 위해 클러스터 b와 통합된다. 클러스터 j가 다수의 요소를 포함하는 클러스터 b에 속한 '2'의 인식 결과 카테고리에 속하는 것으로 판정된다. 그러므로, '4'로 오독되어 오독 후보 클러스터 d에 속하는 것으로 판정된 수기 문자 '2'가 정확하게 판독될 수 있다.
이어서, 어떠한 인식 결과 카테고리에도 속하지 않는 것으로서 거부된 클러스터 g, h 및 I와 그 이외의 클러스터 a 내지 f 간의 거리가 계산된다. 클러스터 e는 클러스터 g에 가장 근접한 클러스터로서 추출된다. 클러스터 g와 e 사이의 거리가 소정값보다 작은지의 여부가 판정된다. 클러스터 g와 e 사이의 거리가 소정값보다 작기 때문에, 클러스터 g는 클러스터 e와 통합된다.
클러스터 e는 클러스터 h에 가장 근접한 클러스터로서 추출된다. 클러스터 h와 e 사이의 거리가 소정값보다 작은지의 여부가 판정된다. 클러스터 h와 e 사이의 거리가 소정값보다 작기 때문에, 클러스터 h는 클러스터 e와 통합된다. 클러스터 g 및 h를 클러스터 e에 통합된 후, 클러스터 k가 발생된다. 클러스터 k는 요소수가 가장 많은 클러스터 e에 속하는 '4'의 인식 결과 카테고리에 속하는 것으로 판정되어 인식 불가능한 것으로서 거부된 수기 문자 '4'가 정확하게 판독될 수 있다.
클러스터 e는 클러스터 i에 가장 근접한 클러스터로서 추출된다. 클러스터 i와 클러스터 e 사이의 거리가 소정값보다 작은지의 여부가 판정된다. 클러스터 i와 클러스터 e 사이의 거리가 소정값보다 작기 때문에, 클러스터 i는 클러스터 e와 통합된다.
도 75는 문자 카테고리 인식 결과 수정 처리를 도시하는 흐름도이다.
도 75의 스텝 S271에서, 도 73에 도시되어 있는 클러스터링 처리에서 얻어진 클러스터링 결과의 데이타가 메모리로부터 판독된다.
그후, 스텝 S272에서, 도 73에 도시되어 있는 클러스터링 처리에서 얻어진 모든 카테고리내의 전체 클러스터에 대해 클러스터간의 거리가 계산되고, 각 클러스터간의 거리가 비교된다.
스텝 S273에서, 클러스터간의 거리가 소정의 임계값보다 작은 클러스터가 존재하는지의 여부가 판정된다. 클러스터간의 거리가 소정의 임계값보다 작은 클러스터가 존재하면, 스텝 S274로 진행하여 그 클러스터들이 통합된다. 클러스터간의 거리가 소정의 임계값보다 작은 클러스터가 존재하지 않으면, 이들 클러스터는 거부된다.
클러스터의 통합시의 클러스터간의 거리의 임계값으로서는 예컨대, 다수의 요소를 포함하는 클러스터내의 벡터간의 거리의 정수배를 이용할 수 있다. 즉, m개의 요소를 포함하는 클러스터 A가 N개(M>N)의 요소를 포함하는 클러스터 B와 통합될 때, 클러스터 A의 대표 벡터간의 거리 dth는 수학식 25와 같이 표시된다.
Figure pat00004
여기서, xai(i=1, 2, …, M)는 클러스터 A내의 특징 벡터를 나타내고, xam은 클러스터 A의 대표 벡터를 나타내며, xbm은 클러스터 B의 대표 벡터를 나타낸다.
따라서, 클러스터 통합 조건은 예를들어 1.5로 정수를 설정하면
Figure pat00005
와 같이 표시될 수 있다.
그후, 스텝 S275에서, 스텝 S274에서 통합된 모든 클러스터에 대해 클러스터내의 문자 카테고리가 판정된다.
스텝 S276에서, 통합된 클러스터들의 문자 카테고리가 서로 상이한지의 여부가 결정된다. 통합된 클러스터의 문자 카테고리가 서로 상이하면, 스텝 S277로 진행하여, 작은 수의 요소를 포함하는 문자 카테고리가 다수의 요소를 포함하는 클러스터의 문자 카테고리로 수정되며, 그리고나서 스텝 S278로 진행된다. 클러스터들의 문자 카테고리가 일치하면, 스텝 S277을 스킵하여 제어가 스텝 S278로 진행된다.
그후, 스텝 S278에서, 클러스터내의 문자에 대해 그 문자의 카테고리가 출력된다.
본 발명에 따른 패턴 인식부의 동작은 도 76에 도시되어 있는 서식이 처리되는 경우를 참조하여 구체적으로 기술된다.
도 76은 본 발명의 실시예에 따른 패턴 인식부에 대한 서식 입력의 예를 도시한다.
도 76에 도시되어 있는 서식은 테두리 번호 1을 갖는 자유피치 테두리와; 테두리 번호 2, 3, 또는 4를 갖는 1문자 테두리와; 테두리 번호 5를 갖는 블록 문자 테두리와; 테두리 번호 6을 갖는 불규칙한 표를 포함한다. 테두리 번호 1을 갖는 자유피치 테두리는 이중 수평선으로 정정된 테두리 접촉 문자 '5'; 테두리 접촉 문자 '3'과 '2'; 테두리 접촉 모호한 문자 '7'; 특이 문자 '4'와 '6'; 및 부분적으로 테두리 외부로 벗어난 특이 문자 '4'를 포함한다.
테두리 번호 2를 갖는 1문자 테두리는 '5'를 포함한다. 테두리 번호 3을 갖는 1문자 테두리는 '3'을 포함한다. 테두리 번호 4를 갖는 1문자 테두리는 이중 수평선으로 정정된 부분적으로 테두리 외부의 문자 '8'을 포함한다. 테두리 번호 5를 갖는 블록 문자 테두리에서, 테두리 번호 5-1을 갖는 문자 테두리는 이중 수평선으로 정정된 특이 문자 '6'을 포함하고, 테두리 번호 5-2를 갖는 문자 테두리는 테두리 접촉 문자 '2'를 포함하며, 테두리 번호 5-3을 갖는 문자 테두리는 특이 문자 '4'를 포함한다.
테두리 번호 6을 갖는 불규칙한 표에서, 테두리 번호 6-1-1을 갖는 문자 테두리는 부분적으로 테두리 외부로 벗어난 문자 '3', '2' 및 '1'을 포함하고, 테두리 번호 6-1-2를 갖는 문자 테두리는 문자 6, 3 및 8을 포함하며, 테두리 번호 6-1-3, 6-1-4-1, 6-1-4-2, 6-1-4-3, 6-2-1, 6-2-2 및 6-2-3은 공란을 유지한다. 문자 테두리 번호 6을 갖는 전체 불규칙 표는 "x" 표시로 정정되어 있다.
이어서, 도 7에 도시되어 있는 환경 인식 시스템(11)이 도 9 내지 도 12에 도시되어 있는 처리를 실행하며, 그것에 의해 도 76에 도시되어 있는 서식으로부터 입력 이미지의 상태를 추출한다.
예컨대, 테두리 번호 1을 갖는 자유피치 문자 테두리, 테두리 번호 2, 3 및 4를 갖는 1문자 테두리, 테두리 번호 5를 갖는 블록 문자 테두리 및 테두리 번호 6을 갖는 불규칙한 표가 도 10에 도시되어 있는 레이아웃 분석을 실행함으로써 도 76에 도시되어 있는 서식으로부터 추출된다. 또한, 8개의 패턴이 테두리 번호 1을 갖는 자유피치 테두리로부터 문자의 후보로서 추출된다. 테두리 번호 2, 3 및 4를 갖는 1문자 테두리들의 각각으로부터 문자의 후보로서 임의의 패턴이 추출된다. 테두리 번호 5를 갖는 블록 문자 테두리로부터 문자의 후보로서 3개의 패턴이 추출된다. 테두리 번호 6-1-1을 갖는 문자 테두리로부터 문자의 후보로서 3개의 패턴이 추출된다. 테두리 번호 6-1-2를 갖는 문자 테두리로부터 문자의 후보로서 3개의 패턴이 추출된다. 테두리 번호 6-1-3, 6-1-4-1, 6-1-4-2, 6-1-4-3, 6-2-1, 6-2-2 및 6-2-3을 갖는 문자 테두리로부터 문자의 후보로서 추출되는 패턴은 존재하지 않는다.
도 76에 도시되어 있는 서식으로부터 문자열을 추출하기 위해, 도 18 및 도 19에 도시되어 있는 테스트 추출 방법이 사용된다. 도 76에 도시되어 있는 서식으로부터 괘선을 추출하기 위해, 도 20 및 도 26에 도시되어 있는 괘선 추출 방법이 사용된다. 도 76에 도시되어 있는 서식으로부터 문자 테두리 또는 표를 추출하기 위해, 도 27 및 도 28에 도시되어 있는 테두리 추출 방법이 사용된다.
테두리 번호 1을 갖는 자유피치 테두리로부터 추출된 제1, 제2, 제4 및 제8 패턴은 테두리 접촉 문자의 후보로 간주된다. 테두리 번호 4를 갖는 1문자 테두리로부터 추출된 패턴, 테두리 번호 5-2를 갖는 문자 테두리로부터 추출된 패턴, 테두리 번호 6-1-1을 갖는 문자 테두리로부터 추출된 제1 패턴은 테두리 접촉 문자의 후보로 간주된다.
도 76에 도시되어 있는 서식으로부터 테두리 접촉 문자의 후보를 추출하기 위해, 도 31 및 도 32에 도시되어 있는 테두리 접촉 문자 추출 방법이 사용된다.
도 11에 도시되어 있는 품질 분석을 통해, 모호한 문자, 변형 문자 및 고품질 문자들이 도 76에 도시되어 있는 서식에서 검출된다. 이러한 예에서, 이미지의 품질이 정상이지만, 모호한, 변형된, 또는 고품질 문자들이 검출되지 않는다.
도 76에 도시되어 있는 목록으로부터 도 12에 도시되어 있는 정정 분석을 통해 정정 문자의 후보가 추출된다. 이러한 예에서, 테두리 번호 1을 갖는 자유피치 테두리로부터 추출된 제1 패턴, 테두리 번호 2 및 4를 갖는 1문자 테두리로부터 추출된 패턴, 테두리 번호 5-1을 갖는 문자 테두리로부터 추출된 패턴, 및 테두리 번호 6을 갖는 불규칙한 표로부터 추출된 패턴은 보정된 문자의 후보로 간주된다.
도 76에 도시되어 있는 서식으로부터 보정된 문자의 후보를 추출하기 위해, 예컨대, 도 34에 도시되어 있는 특징 추출 방법이 사용된다.
이어서, 환경 인식 시스템(11)이 입력 이미지로부터 추출된 문자의 후보의 각각에 대해 도 9 내지 도 12에 도시되어 있는 처리에서 서식으로부터 추출된 상태를 포함하는 중간 처리 결과표를 발생한다.
도 77은 도 9 내지 도 12의 처리에서 서식으로부터 추출된 상태를 포함하는 중간 처리 결과표를 도시한다.
도 77에서, 테두리 번호 1을 갖는 문자 테두리의 란은 테두리의 종류로 '자유피치' 및 문자의 수로 '8'을 포함한다. 테두리 번호 1을 갖는 테두리에서 제1 패턴의 란은 테두리 접촉 문자의 존재를 나타내는 '유', 삭제 라인들의 존재를 나타내는 '유 2', 및 품질을 나타내는 '정상'을 포함한다. 테두리 번호 1을 갖는 테두리에서 제2 패턴의 란은 테두리 접촉 문자의 존재를 나타내는 '유', 삭제 라인들이 존재하지 않음을 나타내는 '무', 및 품질을 나타내는 '정상'을 포함한다. 테두리 번호 1을 갖는 테두리에서 제8 패턴의 란은 테두리 접촉 문자의 존재를 나타내는 '유', 삭제 라인들이 존재하지 않음을 나타내는 '무', 및 품질을 나타내는 '정상'을 포함한다.
삭제 라인들의 존재를 나타내는 '유'는 복수의 문자에 대한 삭제 라인들의 후보가 존재한다는 것을 나타낸다. 삭제 라인들의 존재를 나타내는 '유 2'는 단일 문자에 대한 삭제 라인들의 후보가 존재한다는 것을 나타낸다.
테두리 번호 2를 갖는 문자 테두리의 란은 테두리의 형태에 대한 '1문자', 테두리 접촉 문자가 존재하지 않음을 나타내는 '무', 삭제 라인들의 존재를 나타내는 '유 2', 품질을 나타내는 '정상', 및 문자의 수를 나타내는 '1'을 포함한다. 테두리 번호 3을 갖는 문자 테두리의 란은 테두리의 형태에 대한 '1문자', 테두리 접촉 문자가 존재하지 않음을 나타내는 '무', 삭제 라인들이 존재하지 않음을 나타내는 '무', 품질을 나타내는 '정상', 및 문자의 수를 나타내는 '1'을 포함한다.
테두리 번호 5를 갖는 문자 테두리의 란은 테두리의 형태를 나타내는 '각각의 문자 테두리', 문자의 수를 나타내는 '3'을 포함한다. 테두리 번호 5-1을 갖는 문자 테두리의 란은 테두리 접촉 문자가 존재하지 않음을 나타내는 '무', 삭제 라인의 존재를 나타내는 '유 2', 품질을 나타내는 '정상', 및 문자의 수를 나타내는 '1'을 포함한다. 테두리 번호 5-2를 갖는 문자 테두리의 란은 테두리 접촉 문자의 존재를 나타내는 '유', 삭제 라인이 존재하지 않음을 나타내는 '무', 품질을 나타내는 '정상', 및 문자의 수를 나타내는 '1'을 포함한다.
테두리 번호 6을 갖는 문자 테두리의 란은 문자 테두리의 형태를 나타내는 '표'를 포함한다. 테두리 번호 6-1-1을 갖는 문자 테두리의 란은 문자 테두리의 형태를 나타내는 '자유피치', 테두리 접촉 문자의 존재를 나타내는 '유', 삭제 라인의 존재를 나타내는 '유 1', 및 품질을 나타내는 '정상'을 포함한다. 테두리 번호 6-2-2를 갖는 문자 테두리의 란은 문자 테두리의 형태를 나타내는 '자유피치', 테두리 접촉 문자가 존재하지 않음을 나타내는 '무', 삭제 라인의 존재를 나타내는 '유 1', 및 품질을 나타내는 '정상'을 포함한다
환경 인식 시스템(11)은 도 9 내지 도 12에 도시되어 있는 처리의 서식으로부터 추출된 상태에 기초하여 도 13에 도시되어 있는 처리를 실행한다.
즉, 환경 인식 시스템(11)은 처리 순서 제어 규칙을 참조하여 도 7에 도시되어 있는 문자 인식부(12)의 기본 문자 인식부(17), 문자열 인식부(15), 테두리 접촉 문자 인식부(13), 모호한 문자 인식부(19), 또는 변형 문자 인식부(19)에 의해 실행되는 처리인지, 또는 비문자 인식부(25)의 삭제 라인 인식부(26) 또는 잡음 인식부(25)의 잡음 인식부(28)에 의해 실행되는 처리인지를 결정한다. 결정된 처리는 도 77에 도시되어 있는 중간 처리 결과표의 '처리 호출'란에 기입된다. 그후, 처리 순서표를 참조함으로써, 도 77에 도시되어 있는 중간 처리 결과표의 '처리 호출'란에 기입된 처리가 어떤 순서로 실행되어지는지를 결정한다. 결정된 순서는 도 77에 도시되어 있는 중간 처리 결과표의 '처리 순서'란에 기입된다.
처리 순서 제어 규칙의 예로서는,
(A1) 중간 처리 결과표의 상태를 나타내는 란이 특정 처리 대상에 대해 '유'를 포함하고 상태에 대응하는 처리가 실행되지 않았다면, 중간 처리 결과표의 '처리 호출'란에 상기 상태에 대응하는 처리가 기입된다.
(A2) 중간 처리 결과표의 상태를 나타내는 모든 란이 특정 처리 대상에 대해 '무' 또는 '정상'을 포함하고 기본 문자 인식부(17)에 의해 실행될 처리가 실행되지 않았다면, 중간 처리 결과표의 '처리 호출'란에 "기본"이 기입된다.
(A3) 처리 대상에 대해 중간 처리 결과표에 입력되는 상태에 대응하는 복수의 처리가 존재하면, 복수의 처리의 순서를 결정하는데 사용하는 중간 처리 결과표는 '처리 호출'란의 순서를 재배치하도록 액세스된다.
(A4) 중간 처리 결과표에 입력된 상태에 대응하는 처리가 처리 대상에 대해 실행되었다면, 완료된 처리가 '처리 완료'란에 기입되고, 후속 명령 또는 처리의 중지 또는 완료에 대한 정보가 중간 처리 결과표의 '처리 명령'란에 기입되며, 중간 처리 결과표의 '처리 호출'란의 순서가 상기 정보에 따라서 재배치된다.
도 78은 처리 순서표의 예를 도시한다.
도 78에서, 처리 순서표는 아래의 과정을 기억한다.
(B1) 처리 대상에 대해 중간 처리 결과표의 '처리 호출'란에 단지 하나의 처리가 기입되면, 중간 처리 결과표의 '처리 순서'란에 입력된다.
(B2) 처리 대상에 대해 중간 처리 결과표의 '처리 호출'란에 '흑 문자 테두리/자유피치'가 기입되면, 중간 처리 결과표의 '처리 순서'란에 '흑 문자 테두리→자유피치'가 기입된다.
(B3) 처리 대상에 대해 중간 처리 결과표의 '처리 호출'란에 '삭제 라인(유 2)/흑 문자 테두리'가 기입되면, '흑 문자 테두리→문자 삭제 라인'으로 기입된다.
(B4) 처리 대상에 대해 중간 처리 결과표의 '처리 호출'란에 '흑 문자 테두리/자유피치/삭제(유 2)'가 기입되면, 중간 처리 결과표의 '처리 순서'란에 '흑 문자 테두리→문자 삭제 라인→자유피치'가 기입된다.
(B5) 처리 대상에 대해 중간 처리 결과표의 란 '처리 호출'에 '흑 문자 테두리/자유피치/삭제(유 1)'가 기입되면, 복수의 문자에 대해 중간 처리 결과표의 '처리 순서'란에 '문자 삭제 라인→흑 문자 테두리→자유피치'가 기입된다.
(B6) 처리 대상에 대해 중간 처리 결과표의 '처리 호출'란에 '자유피치/삭제(유 1)'가 기입되면, 중간 처리 결과표의 '처리 순서'란에 '복수의 문자 삭제 라인→자유피치'가 기입된다.
(B7) 처리 대상에 대해 중간 처리 결과표의 '처리 호출'란에 '처리 A, B 및 C'가 기입되면, 중간 처리 결과표의 '처리 순서'란에 '처리 B→처리 A→처리 C'가 기입되고, 중간 처리 결과표의 '처리의 완료'란에 '처리 B'가 기입되며, 중간 처리 결과표의 '처리 순서'란이 '처리 A→처리 C'로 갱신된다.
(B8) 처리 대상에 대해 중간 처리 결과표의 '처리 호출'란에 '처리 A, B 및 C'가 기입되면, 중간 처리 결과표의 '처리 순서'란에 '처리 B→처리 A→처리 C'가 기입되고, 중간 처리 결과표의 '처리의 완료'란에 '처리 B'가 기입되며, 중간 처리 결과표의 '처리 명령'란에 '처리 C로 스킵'이 기입되고, 중간 처리 결과표의 '처리 순서'란이 '처리 C'로 갱신된다.
(B9) 처리 대상에 대해 중간 처리 결과표의 '처리 호출'란에 '처리 A, B 및 C'가 기입되면, 중간 처리 결과표의 '처리 순서'란에 '처리 B→처리 A→처리 C'가기입되고, 중간 처리 결과표의 '처리의 완료'란에 '처리 B'가 기입되며, 중간 처리 결과표의 '처리 명령'란에 '처리 C 및 A 사이의 순서 반전'이 기입되고, 중간 처리 결과표의 '처리 순서'란이 '처리 C→처리 A'로 갱신된다.
(B10) 처리 대상에 대해 중간 처리 결과표의 '처리 호출'란에 '처리 B 및 A'가 기입되면, 중간 처리 결과표의 '처리의 완료'란에 '처리 A'가 기입되고, 중간 처리 결과표의 '처리 명령'란에 '종료'가 기입되며, 그후 중간 처리 결과표의 '처리 순서'란에 '종료'가 기입된다.
도 79는 도 77에 도시되어 있는 중간 처리 결과표에 기입되는 입력 이미지의 상태에 기초하여 호출될 처리인 '처리 호출'란 및 '처리 호출'란에 기입된 처리를 실행하는 순서인 '처리 순서'란에 기입하는 예를 도시한다.
도 79에서, 테두리 번호 1을 갖는 문자 테두리의 란은 테두리의 형태에 대해 '자유피치'를 포함한다. 테두리 번호 1을 갖는 테두리에서 제1 패턴의 란은 테두리 접촉 문자의 존재를 나타내는 '유' 및 삭제 라인의 존재를 나타내는 '유 2'를 포함한다. 그러므로, 처리 순서 제어 규칙의 (A1)에 따라서, '처리 호출'란에 '흑 문자 테두리/자유피치/삭제 라인(유 2)'이 기입되면, 처리 순서표의 (B4)는 처리 순서 제어 규칙의 (A3)에 따라서 참조되고, '처리 순서'란에 '흑 문자 테두리→한 문자 삭제 라인→자유피치'가 기입된다.
테두리 번호 1을 갖는 테두리에서 제2 패턴의 란은 테두리 접촉 문자의 존재를 나타내는 '유', 삭제 라인이 존재하지 않음을 나타내는 '무', 및 '품질'로서 '정상'을 포함한다. 그러므로, 처리 순서 제어 규칙의 (A1)에 따라서, '처리 호출'란에 '흑 문자 테두리/자유피치'가 기입되고, 처리 순서표의 (B2)는 처리 순서 제어 규칙의 (A3)에 따라 참조되며, '처리 순서'란에 '흑 문자 테두리→자유피치'가 기입된다.
테두리 번호 1을 갖는 테두리에서 제8 패턴의 란은 테두리 접촉 문자의 존재를 나타내는 '유', 삭제 라인이 존재하지 않음을 나타내는 '무', 및 '품질'로서 '정상'을 포함한다. 그러므로, 처리 순서 제어 규칙의 (A1)에 따라서, '처리 호출'란에 '흑 문자 테두리/자유피치'가 입력되고, 처리 순서표의 (B2)는 처리 순서 제어 규칙의 (A3)에 따라서 참조되며, '처리 순서'란에 '흑 문자 테두리→자유피치'가 기입된다.
테두리 번호 2를 갖는 문자 테두리의 란은 테두리의 형태에 대한 '한 문자', 테두리 접촉 문자가 존재하지 않음을 나타내는 '무', 삭제 라인의 존재를 나타내는 '유 2', 및 품질을 나타내는 '정상'을 포함한다. 그러므로, 처리 순서 제어 규칙의 (A1)에 따라서, '처리 호출'란에 '삭제 라인(유 2)'이 기입되고, 처리 순서 제어 규칙의 (A1)에 따라서 '처리 순서'란에 '한 문자 삭제 라인'이 기입된다.
테두리 번호 3을 갖는 문자 테두리의 란은 테두리의 종류에 대해 '1문자', 테두리 접촉 문자가 존재하지 않음을 나타내는 '무', 삭제 라인이 존재하지 않음을 나타내는 '무', 및 품질을 나타내는 '정상'을 포함한다. 그러므로, 처리 순서 제어 규칙의 (A2)에 따라서, '처리 호출'란에 '기본'이 기입되고, 처리 순서 제어 규칙의 (A1)에 따라서 '처리 순서'란에 '기본'이 기입된다.
테두리 번호 4를 갖는 문자 테두리의 란은 테두리의 종류에 대해 '1문자', 테두리 접촉 문자의 존재를 나타내는 '유', 삭제 라인의 존재를 나타내는 '유 2', 및 품질을 나타내는 '정상'을 포함한다. 그러므로, 처리 순서 제어 규칙의 (A1)에 따라서, '처리 호출'란에 '흑 문자 테두리/삭제 라인(유 2)'이 기입되고, 처리 순서표의 (B3)이 참고되어 처리 순서 제어 규칙의 (A3)에 따라서 '처리 순서'란에 '흑 문자 테두리→한 문자 삭제 라인'이 기입된다.
테두리 번호 5를 갖는 문자 테두리의 란은 테두리의 형태에 대해 '각각의 문자 테두리'를 포함한다. 테두리 번호 5-1을 갖는 문자 테두리의 란은 테두리 접촉 문자가 존재하지 않음을 나타내는 '무', 삭제 라인의 존재를 나타내는 '유 2', 및 품질을 나타내는 '정상'을 포함한다. 그러므로, 처리 순서 제어 규칙의 (A1)에 따라서, '처리 호출'란에 '삭제 라인(유 2)'이 기입되고, 처리 순서 제어 규칙의 (A1)에 따라서 '처리 순서'란에 '1문자 삭제 라인'이 기입된다.
테두리 번호 5-2를 갖는 문자 테두리의 란은 테두리 접촉 문자의 존재를 나타내는 '유', 삭제 라인이 존재하지 않음을 나타내는 '무', 및 품질을 나타내는 '정상'을 포함한다. 그러므로, 처리 순서 제어 규칙의 (A1)에 따라서, '처리 호출'란에 '흑 문자 테두리'가 기입되고, 처리 순서 제어 규칙의 (A1)에 따라서 '처리 순서'란에 '흑 문자 테두리'가 기입된다.
테두리 번호 5-3을 갖는 문자 테두리의 란은 테두리 접촉 문자가 존재하지 않음을 나타내는 '무', 삭제 라인이 존재하지 않음을 나타내는 '무', 및 품질을 나타내는 '정상'을 포함한다. 그러므로, 처리 순서 제어 규칙의 (A2)에 따라서, '처리 호출'란에 '기본'이 기입되고, 처리 순서 제어 규칙의 (A1)에 따라서 '처리 순서'란에 '기본'이 기입된다.
테두리 번호 6을 갖는 문자 테두리의 란은 테두리의 종류를 나타내는 '표'를 포함한다. 테두리 번호 6-1-1을 갖는 문자 테두리의 란은 문자 테두리의 종류를 나타내는 '자유피치', 테두리 접촉 문자의 존재를 나타내는 '유', 삭제 라인의 존재를 나타내는 '유 1', 및 품질을 나타내는 '정상'을 포함한다. 그러므로, 처리 순서 제어 규칙의 (A1)에 따라서, '처리 호출'란에 '흑 문자 테두리/자유피치/삭제 라인(유 1)'이 기입되고, 처리 순서표의 (B5)가 처리 순서 제어 규칙의 (A3)에 따라서 참조되며, '처리 순서'란에 '복수의 문자 삭제 라인→흑 문자 테두리→자유피치'가 기입된다.
테두리 번호 6-2-2를 갖는 문자 테두리의 란은 문자 테두리의 종류를 나타내는 '자유피치', 테두리 접촉 문자가 존재하지 않음을 나타내는 '무', 삭제 라인의 존재를 나타내는 '유 1', 및 품질을 나타내는 '정상'을 포함한다. 그러므로, 처리 순서 제어 규칙의 (A1)에 따라서, '처리 호출'란에 '자유피치/삭제 라인(유 1)'이 기입되고, 처리 순서표의 (B6)이 처리 순서 제어 규칙의 (A3)에 따라서 참조되며, '처리 순서'란에 '복수의 문자 삭제 라인→자유피치'가 기입된다.
이어서, 도 78에 도시되어 있는 제1 인식 처리가 "처리 호출"란 및 "처리 순서"란내에 기입된 데이타를 가지고 도 79에 도시되어 있는 중간 처리 결과표에 기초한 처리 실행 규칙을 참고함으로써 수행된다. 중간 처리 결과표상의 "처리 완료"란에 "인식 처리 완료"가 기입되며, 상기 인식 처리에서 얻어진 신뢰도가 중간 처리 결과표상의 "신뢰도"란에 기입된다.
중간 처리 결과표상의 "처리 순서"란은 도 78에 도시한 처리 순서표 상의 (B7) 내지 (B9)에 따라 갱신된다. 후속 처리가 처리 실행 규칙에 따라 특정되는 경우, 상기 처리는 중간 처리 결과표상의 "처리 명령"란에 기입된다.
처리 실행 규칙은 아래와 같이 기술할 수 있다.
(C1) 어떤 처리 대상에 대해 중간 처리 결과표상의 "처리 순서"란에 기입되어 있는 처리가 존재한다면, 우선순위가 가장 높은 처리를 실행한다. 그리소, 실행한 처리가 종료하면, 중간 처리 결과표상의 "처리 완료"란에 "처리 종료"를 기입하고, 중간 처리 결과 테이블의 "처리 순서"란에서 그 처리를 삭제한다. 또한, 다음에 실행하는 처리를 지시하는 경우에는 중간 처리 결과표상의 "처리 명령"란에 그 처리를 기입한다.
(C2) 어떤 처리를 실행한 결과, 어떤 패턴이 문자 패턴인지 또는 비문자 패턴인지를 판정하고, 그 문자 코드가 소정값 이상의 신뢰도를 가지고 계산된 경우, "개인 수기 특성"에 의한 문자 인식 처리 호출이 중간 처리 결과표상의 "처리 명령"란에 기입된다.
(C3) 어떠한 처리를 실행한 결과, 어떤 패턴이 삭제 라인이고, 그 삭제 라인이 소정값 이상의 신뢰도로 계산된 경우, 중간 처리 결과표상의 "처리 명령"란에 "종료"가 기입되고, 중간 처리 결과표상의 "처리 순서"란에 기입된 후속 처리는 포기되고, 처리가 종료된다.
(C4) 중간 처리 결과표상의 "처리 순서"란이 최초에 "자유피치"로 기입되고, 동일한 테두리 번호의 다른 처리 대상에 대해서의 "자유피치"에 의해 이전의 처리가 처리되지 않을 경우, 동일한 테두리 번호의 모든 처리 대상의 "처리 순서" 란에 최초에 "자유피치" 로 기입된 후, 동일한 테두리 번호의 모든 처리 대상의 "자유피치" 처리가 동시에 실행된다.
(C5) 중간 처리 결과표상의 "처리 순서"란에 기입된 모든 처리가 종료되고, 모든 처리 대상에 대해 중간 처리 결과표상의 "처리 명령"란에 "종료"가 기입되거나 또는 "개인 수기 특성"이 기입되면, "처리 명령"란에 "개인 수기 특성"이 기입되어 있는 처리 대상에 대해 "개인 수기 특성"에 의한 문자 인식 처리를 호출하여 그 처리를 실행하고, "개인 수기 특성"에 의한 문자 인식 처리가 종료되면, 중간 처리 결과표상의 "처리 명령"란에 "종료"를 기입한다.
(C6) 모든 처리 대상에 대해 중간 처리 결과표상의 "처리 명령"란에 "종료"가 기입된 경우, 모든 처리는 종료되고, 인식 결과가 출력된다.
도 80은 도 79에 도시되어 있는 중간 처리 결과표에 기초한 처리 실행 규칙을 참조함으로써 인식 처리를 실행하고, 그 때의 인식 처리에서 얻어진 신뢰도를 중간 처리 결과표상의 "신뢰도"란에 기입하고, 처리 실행 규칙에 기초하여 중간 처리 결과표상의 "처리 순서"란을 갱신하는 동시에 중간 처리 결과표상의 "처리 명령"란에 기입하는 예를 도시한다.
도 79에 도시되어 있는 중간 처리 결과표상의 테두리 번호 1을 갖는 문자 패턴의 "처리 순서"란에 있어서, 최초에 "흑 문자 테두리"로 지시되어 있으므로, 처리 실행 규칙의 (C1)에 따라, 도 76에 도시되어 있는 바와 같은 테두리 번호 1의 자유피치 문자 테두리로부터 추출된 제1 패턴에 대해 "흑 문자 테두리"에 대응하는 도 7의 접촉 문자 인식부(13)의 처리가 실행된다.
테두리 접촉 문자 인식부(13)는 도 43 및 도 44에 도시한 바와 같이 문자 테두리가 제거된 패턴에 대해 문자 보완 또는 재보완을 행함으로써, 문자 테두리 접촉 문자에 대해 문자 인식을 행한다. 문자 보완 또는 재보완 후에도 충분한 신뢰도가 얻어지지 않는 패턴에 대해서는 지식표(14)를 참조하여 도 46 내지 도 55에 도시한 학습 문자 패턴에 대한 재문자 인식을 행함으로써 접촉 문자에 대해 문자 인식을 행한다.
접촉 문자 인식부(13)의 문자 인식 처리에 의해, 도 76에 도시되어 있는 바와 같은 테두리 번호 1을 갖는 자유피치 테두리로부터 추출된 제1 패턴의 인식 신뢰도가 20%로 계산되는 경우, 도 76에 도시되어 있는 바와 같은 테두리 번호 1을 갖는 자유피치 테두리로부터 추출된 제1 패턴은 비문자로 간주되고, 중간 처리 결과표상의 "문자 코드"란에 "거부"로 기입되는 동시에 중간 처리 결과표상의 "신뢰도"란에 "20%"로 기입된다.
중간 처리 결과표상의 '처리 완료'란에 '흑 문자 테두리'가 기입되고, 중간 처리 결과표상의 '처리 순서'란이 '1 문자 삭제 라인→자유피치'로 갱신된다.
이어서, 도 79에 도시되어 있는 중간 처리 결과표상의 테두리 번호 1을 갖는 문자 테두리의 '처리 순서'란에 있어서, 최초에 '흑 문자 테두리'로 지시되어 있으므로, 처리 실행 규칙(C1)에 따라, 도 76에 도시되어 있는 테두리 번호 1을 갖는 피치 없는 문자 테두리로부터 추출된 제2 패턴에 대해, '흑 문자 테두리'에 대응하는 도 7의 접촉 문자 인식부(13)의 처리를 실행하고, 문자 테두리 접촉 문자에 대해 문자 인식을 행한다.
접촉 문자 인식부(13)에 의해 실행되는 문자 인식 처리에 의해, 도 76에 도시되어 있는 테두리 번호 1을 갖는 자유피치 문자 테두리에서 추출되는 제2 패턴은 60%의 인식 신뢰도로 문자 카테고리 「3」으로 인식되며, 중간 처리 결과표상의 '문자 코드'란에 「3」이 기입되는 동시에 중간 처리 결과표상의 '신뢰도'란에 '60%'가 기입된다.
또한, 중간 처리표상의 '처리 종료'란에 '흑 문자 테두리'로 기입되고, 중간 처리 결과표상의 '처리 순서'란이 '자유피치'로 갱신된다.
이어서, 도 79에 도시되어 있는 중간 처리 결과표상의 테두리 번호 1을 갖는 문자 테두리의 '처리 순서'란에 있어서, 최초에 '흑 문자 테두리'로 지시되어 있으므로, 처리 실행 규칙(C1)에 따라, 도 76에 도시되어 있는 테두리 번호 1을 갖는 피치 없는 문자 테두리로부터 추출된 제8 패턴에 대해 '흑 문자 테두리'에 대응하는 도 7의 접촉 문자 인식부(13)의 처리를 실행하고, 테두리 접촉 문자에 대해 문자 인식을 행한다.
테두리 접촉 문자 인식부(13)에 의해 실행되는 문자 인식 처리에 의해, 도 76에 도시되어 있는 테두리 번호 1을 갖는 자유피치 테두리에서 추출되는 제8 패턴은 95%의 인식 신뢰도로 문자 카테고리 4로서 인식되며, 중간 처리 결과표상의 '문자 코드'란에 '4'가 기입되는 동시에 중간 처리 결과표상의 '신뢰도'란에 '95%'가 기입된다.
또한, 중간 처리표상의 '처리 완료'란에 '흑 문자 테두리'가 기입되고, 중간 처리 결과표상의 '처리 순서'란은 '자유피치'로 갱신된다.
이어서, 도 79에 도시되어 있는 중간 처리 결과표상의 테두리 번호 2를 갖는 문자 테두리의 '처리 순서'란에 '1문자 삭제 라인'이 지정되어 있으므로, 처리 실행 규칙(C1)에 따라, 도 76에 도시한 테두리 번호 2를 갖는 1문자 테두리로부터 추출된 패턴에 대해, '1 문자 삭제 라인'에 대응하는 도 7에 도시되어 있는 삭제 라인 인식부(26)의 처리가 실행된다.
삭제 라인 인식부(26)는 도 71에 도시되어 있는 정정 문자의 후보로서 추출된 패턴으로부터 소정값 이상의 히스토그램 값을 나타내는 수평 라인을 제거한다. 수평 라인이 제거된 패턴이 문자로 인식되는 경우에는 제거한 수평 라인을 삭제 라인으로 간주함으로써 정정 문자의 후보로서 추출한 패턴을 정정 문자로 인식하고, 소정값 이상의 히스토그램값을 갖는 수평 라인을 제거한 패턴이 거부되는 경우에는 제거한 수평 라인을 삭제 라인으로 간주하지 않고 문자의 일부로 간주함으로써 정정 문자의 후보로 추출된 패턴을 통상 문자로 인식한다.
삭제 라인 인식부(26)에 의해 실행된 삭제 라인 인식 처리에 있어서, 도 76에 도시된 테두리 번호 2를 갖는 1문자 테두리로부터 추출된 패턴의 인식 신뢰도가 10%로 산출되었다. 도 76에 도시된 테두리 번호 2를 갖는 1문자 테두리로부터 추출된 패턴은 정정된 문자로 간주되지 않으며, 중간 처리 결과표의 '신뢰도' 란에 '10%'로 기입되는 동시에 중간 처리 결과표의 '처리 명령' 란에 '기본'이 기입된다.
또한, 중간 처리 결과표의 '처리 완료' 란에 '삭제 라인'이 기입되고, 중간 처리 결과표의 '처리 순서'란에 '기본'이 기입된다.
다음으로, 도 79에 도시된 중간 처리 결과표의 테두리 번호 3을 갖는 문자 테두리의 '처리 순서'란에 '기본'으로 지시되어 있으므로, 처리 실행 규칙(C1)에 따라, 도 76에 도시된 것과 같은 테두리 번호 3을 갖는 1문자 테두리로부터 추출된 패턴에 대해 '기본'에 대응하는 도 7에 도시된 기본 문자 인식부(17)의 처리가 실행된다.
기본 문자 인식부(17)는 도 35에 도시된 것과 같은 입력 미지 문자의 특징을 추출하고, 이 미지 문자의 특징을 특징 벡터에 의해 나타내며, 이 특징 벡터를 기본 사전에 미리 기억된 각각의 카테고리의 특징 벡터와 조회함으로써, 특징 공간상에서의 특징 벡터간의 거리를 산출하고, 특징 벡터간의 거리를 최소로 하는 문자 카테고리를 미지 문자로 인식한다.
또한, 기본 문자 인식부(17)는 미지 문자의 윤곽의 요철의 개수를 산출함으로써, 미지 문자의 변형도를 산출한다. 그리고, 미지 문자의 변형도가 크고, 인식률이 저하될 경우에는 지식 테이블(18)을 참조하여, 도 38 내지 도 42에 나타낸 상세 식별법을 이용하여 문자 인식을 실행한다.
기본 문자 인식부(17)의 문자 인식 처리에 의해, 도 76의 테두리 번호 3의 1문자 테두리로부터 추출된 패턴은 인식 신뢰도가 95%의 확률로 문자 카테고리 '3'으로 인식되며, 중간 처리 결과표의 '문자 코드'란에 '3'이 기입되는 동시에 중간 처리 결과표의 '신뢰도'란에 '95%'가 기입된다.
또한, 중간 처리 결과표의 '처리 완료'란에 '기본'이 기입되고, 중간 처리 결과표의 '처리 순서'란은 공란이 된다.
다음에, 도 79의 중간 처리 결과표의 테두리 번호 4의 '처리 순서'란에 있어서, 처음에 '흑 문자 테두리'로 지시되어 있으므로, 처리 실행 규칙 (Cl)에 따라서, 도 76의 테두리 번호 4의 1문자로부터 추출된 패턴에 대해, '흑 문자 테두리'에 대응하는 도 3의 접촉 문자 인식부(13)의 처리를 실행하며, 테두리 접촉 문자에 대한 문자 인식을 행한다.
접촉 문자 인식부(13)의 문자 인식 처리에 의해, 도 76의 테두리 번호 4의 1문자 테두리로부터 추출된 패턴의 인식 신뢰도가 15%로 산출된 결과, 도 76의 테두리 번호 4의 1문자 테두리로부터 추출된 패턴은 문자가 아니라고 간주되며, 중간 처리 결과표의 '문자 코드'란에 '거부'라고 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '15%'로 기입된다.
또한, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리'라고 기입되고, 중간 처리 결과표의 '처리 순서'란이 '1문자 삭제 라인'으로 갱신된다.
다음에, 도 79의 중간 처리 결과표의 테두리 번호 5-1의 '처리 순서'란에 있어서, '1문자 삭제 라인'으로 지시되어 있으므로, 처리 실행 규칙 (Cl)에 따라서, 도 76의 테두리 번호 5-1의 테두리로부터 추출된 패턴에 대하여, '1문자 삭제 라인'에 대응하는 도 7의 삭제 라인 인식부(26)의 처리를 실행하며, 정정 문자의 후보로서 추출된 패턴의 인식 처리를 행한다.
삭제 라인 인식부(26)의 삭제 라인 인식 처리에 의해, 도 76의 테두리 번호 5-1의 테두리로부터 추출된 패턴의 인식 신뢰도가 95%로 산출된 결과, 도 76의 테두리 번호 5-1의 테두리로부터 추출된 패턴은 정정 문자로 간주되어, 중간 처리 결과표의 '신뢰도'란에 '95%'로 기입되는 동시에, 중간 처리 결과표의 '처리 완료'란에 '삭제 라인'이라고 기입된다.
또한, 중간 처리 결과표의 '처리 지시'란에 '종료'라고 기입되는 동시에, 중간 처리 결과표의 '처리 순서'란은 공란이 된다.
다음에, 도 79의 중간 처리 결과표의 테두리 번호 5-2의 '처리 순서'란에 있어서, '블랙 테두리'로 지시되어 있으므로, 처리 실행 룰 (Cl)에 따라서, 도 72의 테두리 번호 5-2의 테두리로부터 추출된 패턴에 대하여, '흑 문자 테두리'에 대응하는 도 7의 접촉 문자 인식부(13)의 처리를 실행하며, 테두리 접촉 문자에 대한 문자 인식을 행한다.
여기서, 도 76의 테두리 번호 5-2의 테두리로부터 추출된 패턴은 하측 부분이 테두리와 접촉하고, 도 43의 문자 보완이나 도 44의 재보완에 의한 처리로서는 충분한 신뢰도를 얻을 수 없으므로, 도 54b에 도시한 바와 같이, 도 49의 지식 테이블(167)을 참조함으로써, 오독 문자쌍 [2, 7]을 획득하여, 도 51에 나타낸 영역 강조법에 의해, 재문자 인식을 행한다.
접촉 문자 인식부(13)의 문자 인식 처리에 의해, 도 76의 테두리 번호 5-2의 테두리로부터 추출된 패턴은 인식 신뢰도가 95%의 확률로 문자 카테고리 '2'로 인식되고, 중간 처리 결과표의 '문자 코드'란에 '2'로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '95%'라고 기입된다.
또한, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리'로 기입되고, 중간 처리 결과표의 '처리 순서'의 란은 공란이 된다.
다음에, 도 79의 중간 처리 결과표의 테두리 번호 5-3의 '처리 순서'란에 있어서, '기본'으로 지시되어 있으므로, 처리 실행 규칙 (Cl)에 따라, 도 76의 테두리 번호 5-3의 테두리로부터 추출된 패턴에 대하여, '기본'에 대응하는 도 7의 기본 문자 인식부(17)의 처리를 실행하며, 기본 문자에 대한 문자 인식 처리를 행한다.
기본 문자 인식부(17)의 문자 인식 처리에 의해, 도 76의 테두리 번호 5-3의 테두리로부터 추출된 패턴은 인식 신뢰도가 90%의 확률로 문자 카테고리 '6'으로 인식되며, 중간 처리 결과표의 '문자 코드'란에 '6'으로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '90%'라고 기입된다.
또한, 중간 처리 결과표의 '처리 완료'란에 '기본'으로 기입되고, 중간 처리 결과표의 '처리 순서'란은 공란이 된다.
다음에, 도 79의 중간 처리 결과표의 테두리 번호 6-1-1의 '처리 순서'란에 있어서, 처음에 '복수 문자 삭제 라인'으로 지시되어 있으므로, 처리 실행 규칙 (C1)에 따라서, '복수 문자의 삭제 라인'에 대응하는 도 7의 삭제 라인 인식부(26)의 처리를 실행하여, 삭제 라인의 인식 처리를 행한다.
삭제 라인 인식부(26)의 삭제 라인 인식 처리에 의해, 테두리 번호 6-1-1의 표로부터 삭제 라인이 추출되고, 그 삭제 라인의 인식 신뢰도가 98%로 산출된 결과, 도 76의 테두리 번호 6-1-1의 테두리로부터 추출된 패턴은 정정 문자로 간주되며, 중간 처리 결과표의 '문자 코드'란에 '삭제 라인'으로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '98%'로 기입되고, 중간 처리 결과표의 '처리 완료'란에 '삭제 라인'으로 기입된다.
또한, 처리 실행 규칙 (C3)에 따라서, 중간 처리 결과표의 '처리 지시'란에 '종료'라고 기입되는 동시에, 중간 처리 결과표의 '처리 순서'란은 공란이 된다.
다음에, 도 79의 중간 처리 결과표의 테두리 번호 6-2-2의 '처리 순서'란에 있어서, 처음에 '복수 문자 삭제 라인'으로 지시되어 있으므로, 처리 실행 규칙 (C1)에 따라서, '복수 문자의 삭제 라인'에 대응하는 도 7의 삭제 라인 인식부(26)의 처리를 실행하여, 삭제 라인의 인식 처리를 행한다.
삭제 라인 인식부(26)의 삭제 라인 인식 처리에 의해, 테두리 번호 6의 표로부터 삭제 라인이 추출되고, 그 삭제 라인의 인식 신뢰도가 98%로 산출된 결과, 도 76의 테두리 번호 6-2-2의 테두리로부터 추출된 패턴은 정정 문자로 간주되며, 중간 처리 결과표의 '문자 코드'란에 '삭제 라인'으로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '98%'라고 기입되고, 중간 처리 결과표의 '처리 완료'란에 '삭제 라인'으로 기입된다.
또한, 처리 실행 규칙 (C3)에 따라, 중간 처리 결과표의 '처리 지시'란에 '종료'라고 기입되는 동시에, 중간 처리 결과표의 '처리 순서'란은 공란이 된다.
이상 처리에 의해, 도 80의 중간 처리 결과표가 생성된다. 여기서, 도 80의 중간 처리 결과표의 '처리 순서'란에는 다음에 호출하는 처리가 기입되어 있으므로, 처리 실행 규칙(C1)에 따라서 처리를 지속한다.
도 81은 도 80의 중간 처리 결과표에 기초하여 인식 처리를 지속하고 그 때에 얻어진 결과를 나타내는 도면이다.
먼저, 도 80의 중간 처리 결과표의 테두리 번호 1의 제1 패턴의 '처리 순서'란에 있어서, 처음에 '1문자 삭제 라인'으로 지시되어 있으므로, 처리 실행 규칙 (C1)에 따라서, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제1 패턴에 대하여, '1문자 삭제 라인'에 대응하는 도 7의 삭제 라인 인식부(26)의 처리를 실행하여, 정정 문자에 대한 인식 처리를 행한다.
삭제 라인 인식부(26)의 인식 처리에 의해, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제1 패턴의 인식 신뢰도가 96%로 산출된 결과, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제1 패턴은 정정 문자로 간주되고, 중간 처리 결과표의 '문자 코드'란에 '삭제 라인'으로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '96%'로 기입되며, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리/삭제 라인'으로 기입된다.
또한, 중간 처리 결과표의 '처리 지시'란에 '종료'라고 기입되는 동시에, 중간 처리 결과표의 '처리 순서'란은 공란이 된다.
다음에, 도 79의 중간 처리 결과표의 테두리 번호 1의 제2 패턴의 '처리 순서'란에 있어서, '자유피치'로 지시되어 있으므로, 처리 실행 규칙 (C4)에 따라서, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제2 패턴에 대하여, 같은 테두리 번호 1의 다른 모든 패턴의 '처리 순서'란이 '자유피치'가 될 때까지 대기하고, 테두리 번호 1의 모든 패턴의 '처리 순서'란이 '자유피치'가 되었을 때, 테두리 번호 1의 자유피치 테두리로부터 추출된 모든 패턴을 대상으로 하여 '자유피치'에 대응하는 도 7의 문자열 인식부(15)의 처리를 실행하고, 문자의 검출 신뢰도를 고려하면서 문자 인식을 행한다.
다음에, 도 79의 중간 처리 결과표의 테두리 번호 1의 제8 패턴의 '처리 순서'란에 있어서, '자유피치'로 지시되어 있으므로, 처리 실행 규칙 (C4)에 따라서, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제8 패턴에 대해, 같은 테두리 번호 1의 다른 모든 패턴의 '처리 순서'란이 '자유피치'가 될 때까지 대기하고, 테두리 번호 1의 모든 패턴의 '처리 순서'란이 '자유피치'가 되었을 때, 테두리 번호 1의 자유피치 테두리로부터 추출된 모든 패턴을 대상으로 하여 '자유피치'에 대응하는 도 7의 문자열 인식부(15)의 처리를 실행하며, 문자의 검출 신뢰도를 고려하면서 인식 처리를 행한다.
그리고, 테두리 번호 1의 모든 패턴의 '처리 순서'란이 '자유피치'가 되었을 경우, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 모든 패턴을 대상으로 하여, 문자열 인식부(15)의 문자 인식 처리를 행한다.
여기서, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제1 패턴에 대해서는 도 81의 중간 처리 결과표의 테두리 번호 1의 제1 패턴의 '처리 지시'란이 '종료'로 되어 있으므로, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제1 패턴을 문자열 인식부(15)의 처리 대상에서 제외하고, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제2 패턴에서부터 제8 패턴에 대해 문자열 인식부(15)의 인식 처리를 실행한다.
이 문자열 인식부(15)에서는 예컨대, 도 56 내지 도 69에 나타낸 바와 같이, 문자를 검출했을 때의 신뢰도를 판별면에서부터의 거리에 기초하여 산출하고, 문자 검출 신뢰도와 문자 인식 신뢰도와의 곱이 최대가 되는 것을 검출 문자로 한다.
문자열 인식부(15)의 인식 처리에 의해, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제2 패턴은 인식 신뢰도가 95%의 확률로 문자 카테고리 '3'이라고 인식되며, 중간 처리 결과표의 '문자 코드'란에 '3'으로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '95%'로 기입된다.
또한, 처리 실행 규칙 (C1)에 따라, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리/자유피치'로 기입되고, 중간 처리 결과표의 '처리 순서'란이 공란이 되며, 처리 실행 규칙 (C4)에 따라 중간 처리 결과표의 '처리 지시'란에 '개인 수기 특성'으로 기입된다.
도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제8 패턴은 인식 신뢰도가 98%의 확률로 문자 카테고리 '4'로 인식되고, 중간 처리 결과표의 '문자 코드'란에 '4'로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '98%'라고 기입된다.
또한, 처리 실행 규칙 (C1)에 따라서, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리/자유피치'라고 기입되고, 중간 처리 결과표의 '처리 순서'란이 공란이 되며, 처리 실행 규칙 (C4)에 따라, 중간 처리 결과표의 '처리 지시'란에 '개인 수기 특성'으로 기입된다.
또한, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제3 패턴은 문자 카테고리 '2'로 인식되며, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제4 패턴과 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제5 패턴은 문자열 인식부(15)의 인식 처리에 의해 1개의 문자로 통합되어 문자 카테고리 '7'로 인식되며, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제6 패턴은 문자 카테고리 '4'로 인식되며, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제7 패턴은 문자 카테고리 '6'으로 인식된다.
그 결과, 도 81의 중간 처리 결과표의 '문자수'란은 '7'로 변경된다.
다음에, 도 80의 중간 처리 결과표의 테두리 번호 2의 '처리 순서'란에 있어서, '기본'으로 지시되어 있으므로, 처리 실행 규칙 (C1)에 따라, 도 76의 테두리 번호 2의 1문자 테두리로부터 추출된 패턴에 대해 '기본'에 대응하는 도 7의 기본 문자 인식부(17)의 처리를 실행하며, 기본 문자에 대한 문자 인식 처리를 행한다.
기본 문자 인식부(17)의 문자 인식 처리에 의해, 도 76의 테두리 번호 2의 1문자 테두리로부터 추출된 패턴은 인식 신뢰도가 97%의 확률로 문자 카테고리 '5'로 인식되며, 중간 처리 결과표의 '문자 코드'란에 '5'로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '97%'로 기입된다.
또한, 중간 처리 결과표의 '처리 호출'란에 '삭제 라인(유 2)/기본'으로 기입되고, 중간 처리 결과표의 '처리 완료'란에 '삭제 라인/기본'이라 기입되며, 중간 처리 결과표의 '처리 순서'란은 공란이 되고, 처리 실행 규칙 (C4)에 따라서, 중간 처리 결과표의 '처리 지시'란에 '개인 수기 특성'으로 기입된다.
다음에, 도 80의 중간 처리 결과표의 테두리 번호 3의 '처리 순서'란은 공란으로 되어 있으므로, 처리 실행 규칙 (C4)에 따라 중간 처리 결과표의 '처리 지시'란에 '개인 수기 특성'으로 기입된다.
다음에, 도 80의 중간 처리 결과표의 테두리 번호 4의 '처리 순서'란에 있어서, '1문자 삭제 라인'으로 지시되어 있으므로, 처리 실행 규칙 (Cl)에 따라 도 76의 테두리 번호 4의 1문자 테두리로부터 추출된 패턴에 대해 '1문자 삭제 라인'에 대응하는 도 7의 삭제 라인 인식부(26)의 처리를 실행하여 정정 문자의 후보로서 추출된 패턴의 인식 처리를 행한다.
삭제 라인 인식부(26)의 삭제 라인 인식 처리에 의해, 도 76의 테두리 번호 4의 1문자 테두리로부터 추출된 패턴의 인식 신뢰도가 95%로 산출된 결과, 도 76의 테두리 번호 4의 1문자 테두리로부터 추출된 패턴은 정정 문자로 간주되고, 중간 처리 결과표의 '신뢰도'란에 '95%'로 기입되는 동시에, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리/삭제 라인'으로 기입된다.
또한, 중간 처리 결과표의 '처리 지시'란에 '종료'로 기입되는 동시에, 중간 처리 결과표의 '처리 순서'란은 공란이 된다.
다음에, 도 80의 중간 처리 결과표의 테두리 번호 5-1의 '처리 지시'란에 '종료'라고 기입되어 있으므로, 도 76의 테두리 번호 5-1의 테두리로부터 추출된 패턴에 대해서는 처리를 행하지 않는다.
다음에, 도 80의 중간 처리 결과표의 테두리 번호 5-2의 '처리 순서'란은 공란으로 되어 있으므로, 처리 실행 규칙 (C4)에 따라서, 중간 처리 결과표의 '처리 지시'란에 '개인 수기 특성'으로 기입된다.
다음에, 도 80의 중간 처리 결과표의 테두리 번호 5-3의 '처리 순서'란은 공란으로 되어 있으므로, 처리 실행 규칙 (C4)에 따라서, 중간 처리 결과표의 '처리 지시'란에 '개인 수기 특성'으로 기입된다.
다음에, 도 80의 중간 처리 결과표의 테두리 번호 6-1-1의 '처리 지시'란에 '종료'라고 기입되어 있으므로, 도 76의 테두리 번호 6-1-1의 테두리로부터 추출된 패턴에 대해서는 처리를 행하지 않는다.
다음에, 도 80의 중간 처리 결과표의 테두리 번호 6-2-2의 '처리 지시'란에 '종료'라고 기입되어 있으므로, 도 76의 테두리 번호 6-1-1의 테두리로부터 추출된 패턴에 대해서는 처리를 행하지 않는다.
이상 처리에 의해, 도 81의 중간 처리 결과표가 생성된다. 여기서, 도 81의 중간 처리 결과표의 '처리 지시'란에는 '개인 수기 특성'으로 기입되어 있으므로, 처리 실행 규칙 (C5)에 따라서 처리를 지속한다.
도 82는 도 81의 중간 처리 결과표에 기초하여 인식 처리를 지속하고, 그 때에 얻어진 결과를 나타내는 도면이다.
먼저, 도 80의 중간 처리 결과표의 테두리 번호 1의 제1 패턴의 '처리 지시'란에 '종료'라고 기입되어 있으므로, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제1 패턴에 대해서는 처리를 행하지 않는다.
다음에, 도 81의 중간 처리 결과표의 테두리 번호 1의 제2 패턴의 '처리 지시'란에 '개인 수기 특성'으로 기입되어 있으므로, 처리 실행 규칙 (C5)에 따라서, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제2 패턴에 대해 '개인 수기 특성'에 대응하는 도 7의 특이 문자 분석부(23)의 처리를 실행한다.
이 특이 문자 분석부(23)는 예컨대, 도 72 내지 도 75에 도시한 바와 같이, 동일 필자가 기입한 수기 문자를 각 카테고리마다 클러스터링하여, 클러스터링에 의해 얻어진 수기 문자의 제1 클러스터와 거리가 가깝고 또한 다른 카테고리에 속하는 제2 클러스터에서 요소수가 적은 것을 제1 클러스터에 통합함으로써, 제2 클러스터에 속하는 수기 문자의 카테고리를 제1 클러스터의 카테고리로 수정한다.
특이 문자 분석부(23)의 분석 처리에 의해, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제2 패턴은 인식 신뢰도가 97%의 확률로 문자 카테고리 '3'으로 인식되며, 중간 처리 결과표의 '문자 코드'란에 '3'으로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '97%'로 기입된다.
또한, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리/자유피치/개인 수기 특성'으로 기입되는 동시에, 중간 처리 결과표의 '처리 지시'란에 '종료'로 기입된다.
다음에, 도 81의 중간 처리 결과표의 테두리 번호 1의 제8 패턴의 '처리 지시'란에 '개인 수기 특성'으로 기입되어 있으므로, 처리 실행 규칙 (C5)에 따라서, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제8 패턴에 대해 '개인 수기 특성'에 대응하는 도 7의 특이 문자 분석부(23)의 처리를 실행한다.
특이 문자 분석부(23)의 분석 처리에 의해, 도 76의 테두리 번호 1의 자유피치 테두리로부터 추출된 제8 패턴은 인식 신뢰도가 98%의 확률로 문자 카테고리 '4'로 인식되며, 중간 처리 결과표의 '문자 코드'란에 '4'로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '98%'로 기입된다.
또한, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리/자유피치/개인 수기 특성'으로 기입되는 동시에, 중간 처리 결과표의 '처리 지시'란에 '종료'로 기입된다.
다음에, 도 81의 중간 처리 결과표의 테두리 번호 2의 '처리 지시'란에 '개인 수기 특성'으로 기입되어 있으므로, 처리 실행 규칙 (C5)에 따라, 도 76의 테두리 번호 2의 1문자 테두리로부터 추출된 패턴에 대해 '개인 수기 특성'에 대응하는 도 7의 특이 문자 분석부(23)의 처리를 실행한다.
특이 문자 분석부(23)의 분석 처리에 의해, 도 76의 테두리 번호 2의 1문자 테두리로부터 추출된 패턴은 인식 신뢰도가 97%의 확률로 문자 카테고리 '5'로 인식되며, 중간 처리 결과표의 '문자 코드'란에 '5'로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '97%'로 기입된다.
또한, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리/자유피치/개인 수기 특성'으로 기입되는 동시에, 중간 처리 결과표의 '처리 지시'란에 '종료'로 기입된다.
다음에, 도 81의 중간 처리 결과표의 테두리 번호 3의 '처리 지시'란에 '개인 수기 특성'으로 기입되어 있으므로, 처리 실행 규칙 (C5)에 따라, 도 76의 테두리 번호 3의 1문자 테두리로부터 추출된 패턴에 대하여, '개인 수기 특성'에 대응하는 도 7의 특이 문자 분석부(23)의 처리를 실행한다.
특이 문자 분석부(23)의 분석 처리에 의해, 도 76의 테두리 번호 3의 1문자 테두리로부터 추출된 패턴은 인식 신뢰도가 97%의 확률로 문자 카테고리 '3'으로 인식되며, 중간 처리 결과표의 '문자 코드'란에 '3'으로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '97%'로 기입된다.
또한, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리/자유피치/개인 수기 특성'으로 기입되는 동시에, 중간 처리 결과표의 '처리 지시'란에 '종료'로 기입된다.
다음에, 도 81의 중간 처리 결과표의 테두리 번호 4의 '처리 지시'란에 '종료'로 기입되어 있으므로, 도 76의 테두리 번호 4의 1문자 테두리로부터 추출된 패턴에 대해서는 처리를 행하지 않는다.
다음에, 도 81의 중간 처리 결과표의 테두리 번호 5-1의 '처리 지시'란에 '종료'로 기입되어 있으므로, 도 76의 테두리 번호 5-1의 테두리로부터 추출된 패턴에 대해서는 처리를 행하지 않는다.
다음에, 도 81의 중간 처리 결과표의 테두리 번호 5-2의 '처리 지시'란에 '개인 수기 특성'으로 기입되어 있으므로, 처리 실행 규칙 (C5)에 따라, 도 76의 테두리 번호 5-2의 테두리로부터 추출된 패턴에 대해 '개인 필기 특성'에 대응하는 도 7의 특이 문자 분석부(23)의 처리를 실행한다.
특이 문자 분석부(23)의 분석 처리에 의해, 도 76의 테두리 번호 5-2의 테두리로부터 추출된 패턴은 인식 신뢰도가 97%의 확률로 문자 카테고리 '2'로 인식되며, 중간 처리 결과표의 '문자 코드'란에 '2'로 기입되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '97%'로 기입된다.
또한, 중간 처리 결과표의 '처리 완료'란에 '흑 문자 테두리/개인 필기 특성'으로 기입되는 동시에, 중간 처리 결과표의 '처리 지시'란에 '종료'로 기입된다.
다음에, 도 81의 중간 처리 결과표의 테두리 번호 5-3의 '처리 지시'란에 '개인 수기 특성'으로 기입되어 있으므로, 처리 실행 규칙 (C5)에 따라서, 도 76의 테두리 번호 5-3의 테두리로부터 추출된 패턴에 대해 '개인 수기 특성'에 대응하는 도 7의 특이 문자 분석부(23)의 처리를 실행한다.
특이 문자 분석부(23)의 분석 처리에 의해, 도 76의 테두리 번호 5-3의 테두리로부터 추출된 패턴은 인식 신뢰도가 96%의 확률로 문자 카테고리 '4'로 인식되며, 중간 처리 결과표의 '문자 코드'란이 '4'로 변경되는 동시에, 중간 처리 결과표의 '신뢰도'란에 '96%'로 기입된다.
또한, 중간 처리 결과표의 '처리 완료'란에 '기본/개인 수기 특성'으로 기입되는 동시에, 중간 처리 결과표의 '처리 지시'란에 '종료'로 기입된다.
다음에, 도 81의 중간 처리 결과표의 테두리 번호 6-1-1의 '처리 지시'란에 '종료'로 기입되어 있으므로, 도 76의 테두리 번호 6-1-1의 테두리로부터 추출된 패턴에 대해서는 처리를 행하지 않는다.
다음에, 도 81의 중간 처리 결과표의 테두리 번호 6-2-2의 '처리 지시'란에 '종료'로 기입되어 있으므로, 도 76의 테두리 번호 6-1-1의 테두리로부터 추출된 패턴에 대해서는 처리를 행하지 않는다.
이상 처리에 의해, 도 82의 중간 처리 결과표가 생성된다. 여기서, 도 82의 중간 처리 결과표의 '처리 지시'란은 모든 처리 대상에 대하여 '종료'라고 기입되어 있으므로, 처리 실행 규칙 (C6)에 따라 모든 처리를 종료한다.
이상 설명한 바와 같이, 본 발명의 실시예에 따르면, 문자 인식부(12) 및 비문자 인식부(25)에서는 환경 인식 시스템(11)에서 인식된 입력 화상의 상태를 처리하기 위해 적합한 인식 처리를 행한다.
예컨대, 환경 인식 시스템(11)이 괘선에 접촉한 문자를 추출한 경우, 괘선에 접촉한 문자에 대한 인식 처리를 전용으로 행하는 접촉 문자 인식부(13)를 사용하고, 환경 인식 시스템(11)이 자유피치 문자열을 추출한 경우, 자유피치 문자열에 대한 인식 처리를 전용으로 행하는 문자열 인식부(15)를 사용하며, 환경 인식 시스템(11)이 모호한 문자를 추출한 경우, 모호한 문자에 대한 인식 처리를 전용으로 행하는 모호한 문자 인식부(19)를 사용하고, 환경 인식 시스템(11)이 변형 문자를 추출한 경우, 변형 문자에 대한 인식 처리를 전용으로 행하는 변형 문자 인식부(21)를 사용하며, 환경 인식 시스템(11)이 비문자를 추출한 경우, 비문자에 대한 인식 처리를 전용으로 비문자 인식부(25)를 사용한다.
또한, 문자 인식부(19) 또는 비문자 인식부(25)의 인식 결과에 대한 신뢰도를 산출하여, 신뢰도가 낮은 문자나 비문자에 대해서는 환경 인식 시스템(11), 문자 인식부(19) 및 비문자 인식부(25)간에 서로 피드백을 행하도록 하여 다른 처리를 다시 하도록 함으로써 신뢰도가 높아지거나 또는 실행 가능한 처리가 없는 경우에 전체의 처리를 종료한다.
이와 같이, 본 발명의 실시예에 따르면, 문자가 기입되어 있는 환경에 따라서, 문자를 인식할 때에 사용하는 특징 및 식별법을 적응성으로 변화시켜 인식 처리를 실행할 수 있으므로, 문서나 서식의 여러가지 환경에 대응한 고정밀도의 문자 인식이 가능하다.
또한, 문자 코드만을 인식 결과로서 출력하는 것뿐만 아니라, 환경 인식 시스템(11)에 의한 환경 인식 결과를 문자 인식 결과와 동시에 출력할 수 있는 동시에, 환경 인식 결과와 문자 인식 결과가 서로 일치했을 때에 문자 인식 결과를 출력하는 것이 가능해지며, 문자 인식 결과에 대한 확인 기능 및 신뢰성을 향상시킬 수 있다.
또, 비문자 인식부(25)를 전용으로 설치하여, 비문자 인식을 문자 인식으로 독립하여 행할 수 있으므로, 문자 인식 및 비문자 인식의 신뢰성을 향상시킬 수 있다.
또, 각 문자가 기록되어 있는 환경에 따른 독립의 인식 처리를 행할 수 있으므로, 각 인식 처리에 있어서의 사전이나 지식을 증가시킴으로써 인식 신뢰도를 향상시킬 수 있다.
이하 본 발명의 제3 실시예에 따른 패턴 인식부에 관해 기술한다.
제3 실시예에 따른 패턴 인식부는 문자의 삭제를 명백히 나타내는 삭제 라인을 거부하여 문자가 오독되는 것을 방지하지만, 삭제 라인이 있는 문자가 아닌문자를 잘못 거부하지 않게 함으로써, 사용자가 큰 부담을 갖지 않고 높은 신뢰도로 문자를 인식할 수 있게 된다.
도 83에 도시된 제3 실시예는 이미지를 수신하고, 입력 이미지로부터 문자 패턴을 검출하며, 이 검출된 패턴을 전처리하는 이미지 입력부(411)와, 문자의 삭제를 나타내는 수평 라인에 의해 간단하게 형성된 단순한 삭제 라인이나 삭제 라인 없는 통상 문자의 삭제 라인과 관련된 문자를 판별하는 삭제 라인 문자 판별부(412)와, 문자를 식별하는 식별부(413)를 구비한다.
"이미지의 입력"은 문자를 나타내는 최초의 이미지를 입력하는 것을 말한다. 예컨대, 서식상의 문자가 인식될 때, 서식상의 문자 패턴은 광-전기 변환기의 판독 영역에 전달되어, 문자 패턴을 판독하고, 이 판독된 문자 패턴을 전기 신호로 변환시켜, 이진화를 거쳐 디지탈 신호를 출력하게 된다.
'문자 검출'은 입력 디지탈 이미지의 서식 데이터로부터 문자부만을 검출하고, 다른 서식 데이터로부터 각 문자를 분리하는 것을 말한다.
'전처리'는 잡음 제거와, 문자의 위치, 크기, 자세, 라인 두께 등의 정량화를 말한다.
'삭제 라인에 있는 문자'는 문자의 삭제를 나타내는 삭제 라인이 부가된 문자를 말한다. 본 발명의 제3 실시예에 따라, 삭제 라인은 간단한 삭제 라인이나 복잡한 삭제 라인이 된다.
'간단한 삭제 라인'은 문자의 삭제를 나타내기 위해 가정한 수평 라인에 의해 형성된 삭제 라인을 말한다. 간단한 삭제 라인은 하나 이상의 수평 라인이 이용될 수 있다.
'수평 라인'은 항상 정확한 수평 라인은 아니며, 수평 방향으로 경사진 라인도 포함한다.
그러므로, 명백한 수평 삭제 라인에 있는 문자는 오류 없이 삭제될 수 있으며, 오독이 제거될 수 있다.
이후에 기술되는 실시예에 있어서, 수평 삭제 라인은 연속적인 투영에 의해 판별된다.
'복잡한 삭제 라인'은 삭제될 문자상에 그려진 복잡한 라인이나 획선을 말한다. 라인이 복잡한 삭제 라인인지 아닌지를 판정하기 위해, 도 84에 도시된 패턴 인식부에 의해 복잡량이 얻어진다.
'문자 식별'은 특성 추출, 획득된 특징 벡터의 입력, 특징 벡터 및 표준 특징 벡터(즉, 미리 기억된 식별 사전)간의 일치 상태의 산출을 의미한다. 가장 높은 유사성을 나타내는 표준 특징 벡터의 카테고리가 인식 결과로 출력된다.
본 실시예에 따르면, 단순한 삭제 라인 또는 복잡한 삭제 라인을 갖는 문자에 관해 통상 문자를 판별하기 위한 판별 처리가 실행된다.
그러므로, 이러한 소정의 수평 라인과 같은 삭제 라인, 소정의 수평 라인으로부터 약간 불규칙적인 단순하고 명백한 삭제 라인 및 단순한 삭제 라인과는 상당히 다른 복잡하고 명백한 삭제 라인이 성공적으로 삭제 라인으로 판별될 수 있다.
도 84는 본 발명의 제4 실시예에 따른 패턴 인식부의 구조를 도시한 블록도이다.
도 84에서, 삭제 라인 문자 판별부(412)는 복잡한 삭제 라인 문자 판별부(414)가 패턴이 복잡한 삭제 라인을 가진 문자가 아니라는 것을 결정한 경우 단순한 삭제 라인 후보가 단순한 삭제 라인을 갖는 문자 후보로부터 제거되는 경우에 단순한 삭제 라인을 갖는 문자 후보가 문자로서 식별될 수 있는 지의 여부를 결정함으로써 단순한 삭제 라인을 갖는 문자를 판별하는 단순한 삭제 라인 문자 판별부(415)와 복잡한 삭제 라인을 갖는 문자를 판별하는 복잡한 삭제 라인 문자 판별부(414)를 구비한다.
도 84의 패턴 인식부에 따르면, 단순한 삭제 라인을 갖는 문자는 그 문자가 복잡한 삭제 라인을 갖는 문자인지를 우선 결정한 후에 문자에 복잡한 삭제 라인이 부여되지 않는 경우에만 판별될 수 있다. 그러므로, 패턴 인식부는 문자로부터 단순한 삭제 라인을 제거한 후에 문자로서 판별될 수 없는 경우 삭제 라인을 갖지 않는 문자에 대하여 문자를 오독하지 않고, 따라서 고신뢰도로 삭제 라인을 갖는 문자의 후보를 판별하게 된다.
도 85는 본 발명의 제5 실시예에 따른 패턴 인식부의 구조를 도시한 블록도이다.
도 85에서, 삭제 라인 문자 판별부(412)는 대상 수평 주사 라인 및 대상 수평 주사 라인의 상하 소정의 범위의 인접 라인내의 흑화소가 수평 방향으로 가산되어 카운트되는 인접 투영에 의해 얻어진 화소수 히스토그램과 검출되고 전처리된 문자 패턴으로부터 도면의 복잡도를 나타내는 복잡량중의 적어도 하나를 포함하는 문자 형태 정보를 추출하는 문자 형태 정보 추출부(416)와; 문자 형태 정보 추출부(416)에 의해 추출된 문자 형태 정보에 따라 복잡한 삭제 라인을 갖는 문자 후보 또는 단순한 삭제 라인을 갖는 문자 후보를 판별하는 삭제 라인 문자 후보 식별부(417)와; 단순한 삭제 라인을 갖는 문자 후보로부터 삭제 라인 후보를 제거한 후에 식별부(413)에 의해 문자로서 식별될 수 있는 경우 그 문자를 단순한 삭제 라인을 갖는 문자로 판정하는 삭제 라인 문자 판정부(418)를 구비한다.
'문자 형태 정보'는 '수평 방향으로 행해지는 인접 투영에 의해 얻어진 화소 수 히스토그램' 과 '복잡량'중 적어도 하나를 포함한다.
'소정의 범위'는 대상 수평 라인 상하의 인접 라인의 범위를 말한다. 예를 들면, 이 범위는 하술되어 있는 실시예에 따라 대상 수평 라인, 대상 수평 라인 바로 상부 및 대상 수평 라인 바로 하부의 3개의 라인을 포함할 수 있다.
만일 "소정의 범위'가 좁게 설정되는 경우, 수평 방향의 라인만이 단순한 삭제 라인으로 인식될 수 있다. 만일 범위가 크게 설정되는 경우, 수평 라인과 각을 이루는 라인도 단순 삭제 라인으로서 인식될 수 있다. 그러나, 만일 범위가 너무 크게 정해지는 경우, 화소 히스토그램의 피크가 분명치 않게 되고 수평 라인이 정확히 판정될 수 없다. 그러므로, 범위는 경험과 실험을 통해 적절하게 정해진다.
'수평 방향으로의 인접 투영'에서, 흑화소의 수는 대상 수평 주사 라인 및 대상 라인 상하의 인접 라인을 포함하는 소정의 범위의 라인에 있는 흑화소를 더함으로써 카운트된다.
'복잡량'은 예를 들어, 소정의 방향에서 라인 밀도, 오일러수, 흑화소의 수 등으로 표현될 수 있다.
본 발명에 따르면, 단순한 삭제 라인을 갖는 문자는 수평 방향으로의 인접 투영에 의해 얻어진 화소수 히스토그램에 의해 판별되고, 복잡한 삭제 라인을 갖는 문자는 복잡량에 의해 판별된다.
상기된 복잡량 또는 수평 방향으로의 인접 투영에 의해 얻어진 화소수 히스토그램은 객관적으로, 쉽게, 빠르게, 그리고 고신뢰도로 얻어질 수 있다. 그러므로, 삭제 라인을 갖는 문자는 고속 및 고신뢰도로 쉽게 판별될 수 있다.
도 86은 본 발명의 제6 실시예에 따른 패턴 인식부의 구조를 도시한 블록도이다.
도 86에서, 복잡한 삭제 라인 문자 식별 처리부(414)는 도면의 복잡도를 나타내는 복잡량을 추출하는 복잡량 추출부(419)와, 추출된 복잡량에 기초하여 복잡한 삭제 라인을 갖는 문자를 판별하는 복잡한 삭제 라인 문자 판별부(420)를 구비한다. 단순 삭제 라인 문자 판별부(415)는 대상 수평 주사 라인과 대상 라인의 상하의 소정 범위의 인접 라인에 있는 흑화소를 수평 방향으로 가산하여 카운트하는 인접 투영에 의한 화소수 히스토그램을 산출하는 화소수 히스토그램 산출부(421)와; 산출된 화소수에 기초하여 단순한 삭제 라인을 갖는 문자 후보를 판별하는 단순 삭제 라인 문자 후보 판별부(422)와, 단순한 삭제 라인을 갖는 문자 후보로부터 삭제 라인 후보를 제거한 후에 식별부(413)에 의해 문자로서 식별될 수 있을 때 그 문자를 단순 삭제 라인을 갖는 문자로 판정하는 단순 삭제 라인 문자 판정부(423)를 구비한다.
도 86에 도시된 패턴 인식부에 따르면, 삭제 라인을 갖는 문자는 수평 방향으로의 인접 투영에 의해 얻어지는 화소수 히스토그램과 복잡량에 기초하여 판별될 수 있다.
그러므로, 도 84에 도시된 패턴 인식부에 의해 얻어지는 효과에 부가하여,삭제 라인을 갖는 문자가 고신뢰도로 판별될 수 있다.
도 87은 본 발명의 제7 실시예에 따른 패턴 인식부의 구조를 도시하는 블록도이다.
도 87에서, 단순 삭제 라인 문자 판정부(423)는 판별된 단순 삭제 라인을 갖는 문자 후보로부터 삭제 라인 후보를 제거하고 그 결과를 식별부(413)에 전송하는 삭제 라인 제거부(424)와; 삭제 라인 후보를 제거하기 전에 단순한 삭제 라인을 갖는 문자 후보의 본래 이미지를 기억하는 기억부(426)와; 단순한 삭제 라인을 갖는 문자 후보가 문자로부터 삭제 라인을 제거한 후에도 문자로서 식별될 수 있을 때 단순한 삭제 라인을 갖는 문자로서 단순한 삭제 라인을 갖는 문자 후보를 확정하고, 단순한 삭제 라인이 있는 후보가 문자로부터 삭제 라인을 제거한 후에 문자로서 식별되지 못할때 기억부(426)에 기억되어 있는 단순한 삭제 라인을 갖는 문자 후보를 통상 문자로서 규정하여 그 결과를 식별부(413)에 전송하는 삭제 라인 문자 판정부(425)를 구비한다.
도 87에 도시된 패턴 인식부에 따르면, 삭제 라인 제거부(424)에 의해 삭제 라인을 갖는 문자 후보로부터 삭제 라인 후보를 제거하기 전의 본래 이미지가 기억부(426)에 일시 기억된다.
그러므로, 만약 삭제 라인 후보가 제거된 삭제 라인을 갖는 문자 후보가 문자로서 식별될 수 없는 경우, 삭제 라인이 있는 문자 후보의 본래 이미지가 기억부(426)로부터 판독되어 문자 식별을 위한 식별부(413)에 전송된다. 따라서, 본 발명에 따르면 문자가 단순한 구조로 고속으로 식별될 수 있다.
도 88은 본 발명의 제8 실시예에 따른 패턴 인식부의 동작을 도시하는 흐름도이다.
도 88에서, 입력 이미지로부터 문자 패턴이 검출되고, 검출된 결과가 스텝 S301에서 전처리된다. 그 다음, 스텝 S302에서는 현재 문자가 문자의 삭제를 나타내기 위해 복잡한 획선에 의해 그려진 복잡한 삭제 라인인지, 또는 수평 라인으로만 형성된 단순한 라인의 삭제 라인을 갖는 문자인지, 또는 삭제 라인이 없는 통상 문자인지에 관하여 검출됨으로써 전처리된 문자에 대해 판별 처리가 실행된다. 그리고, 스텝 303에서는 삭제 라인이 없는 통상 문자가 문자로 식별된다.
도 88에 도시된 패턴 인식 동작에 따르면, 현재 문자가 삭제 라인이 없는 통상 문자 인지 또는 복잡 라인 또는 단순 라인의 삭제 라인을 갖는 문자인지가 판정된다. 따라서, 통상 문자가 문자로서 식별될 수 있다.
그러므로, 유저가 삭제 라인에 정통하지 않거나 또는 삭제 라인에 관한 설명을 받지 않아도 분명한 삭제 라인을 갖는 문자가 반드시 제거될 수 있기 때문에, 유저는 고신뢰도 및 단순 구조로 문자를 인식할 수 있게 된다.
그러므로, 서식 등의 기입에 대한 제한이 감소될 수 있고 유저의 부담을 상당히 경감시킬 수 있다.
도 89는 본 발명의 제9 실시예에 따른 패턴 인식 동작을 도시한 흐름도이다.
도 89의 스텝 S304에서는 입력 이미지로부터 문자 패턴이 검출되어, 그 결과가 전처리된다. 그 다음, 스텝 S305에서는 검출되고 전처리된 문자 패턴에 관하여 복잡한 형태를 가지는 복잡한 삭제 라인을 갖는 문자에 대한 판별 처리가 실행된다. 만일 현재 문자가 복잡한 삭제 라인을 갖는 문자가 아니라고 판정된 경우, 스텝 S306에서는 현재 문자가 문자의 삭제를 나타내기 위해 수평 라인만으로 형성된 단순한 삭제 라인을 갖는 문자인지 또는 삭제 라인을 갖지 않는 문자인지가 판정된다. 그러므로, 스텝 S307에서는 삭제 라인이 없는 통상 문자가 문자로 식별될 수 있다.
그러므로, 도 89에 도시된 패턴 인식 동작에 따르면, 판별 처리가 삭제 라인을 갖는 문자에 관하여 실행되는 경우, 먼저 복잡한 삭제 라인을 갖는 문자에 관하여 실행된다. 현재 문자가 복잡한 삭제 라인을 갖는 문자가 아님이 판정된 경우에만, 단순한 삭제 라인을 갖는 문자 후보에 관해 판별 처리가 실행된다.
그러므로, 문자가 효율적이고 빠르게 판별될 수 있다.
문자 후보로부터 삭제 라인 후보를 제거한 후에도 문자가 문자로 식별될 수 있을 때, 단순한 삭제 라인을 갖는 문자 후보는 단순한 삭제 라인을 갖는 문자로 확정된다. 만일 문자 후보가 문자로 식별될 수 없을 경우, 통상 문자로 확정된다.
복잡한 삭제 라인이 제거되었기 때문에, 복잡한 라인이 있는 문자는 통상 문자 사이에 혼합되지 않으며 잘못된 문자로 오독되지 않는다.
또한, 단순한 삭제 라인을 갖는 문자 후보가 문자로 식별될 수 있는지의 여부가 판정되므로, 문자 후보가 삭제 라인을 갖는 문자인지의 여부에 관한 판정이 고신뢰도로 정확하게 행해질 수 있다.
도 90은 본 발명의 제10 실시예에 따른 패턴 인식 동작을 도시한 흐름도이다.
도 90의 스텝 S311에서는 입력 이미지로부터 문자 패턴이 검출되어, 검출된 결과가 전처리된다. 스텝 S312에서는 검출되고 전처리된 문자의 복잡량이 산출된다. 스텝 S313에서는 복잡량에 기초하여 복잡한 획선에 의해 나타나는 복잡한 삭제 라인을 갖는 문자에 관한 판별 처리가 실행된다. 문자가 복잡한 삭제 라인을 갖지 않는 것으로 판정되는 경우, 단계 S314에서는 대상 수평 주사 라인과 대상 라인 상하의 소정의 범위의 인접 라인에 있는 흑화소가 수평 방향으로 가산되어 카운트되는 인접 투영에 의해 화소수 히스토그램이 얻어진다. 스텝 S315에서는 단순한 삭제 라인을 갖는 문자 후보에 대해 판별 처리가 실행된다. 만일 삭제 라인 후보가 단순한 삭제 라인을 갖는 문자 후보로부터 제거되어 그 결과가 문자로 식별될 수 있는 경우, 그 문자 후보는 단순한 삭제 라인을 갖는 문자로 확정된다. 만일 문자로 식별될 수 없는 경우, 스텝 S316에서는 그 문자 후보가 통상 문자로 확정되고, 확정된 통상 문자가 문자로 식별될 수 있는지의 여부가 스텝 S317에서 판정된다.
따라서, 도 90에 도시된 패턴 인 동작부에 따르면, 복잡량을 추출하거나 인접 투영을 실행함으로써 단순한 삭제 라인을 갖는 문자 또는 복잡한 삭제 라인을 갖는 문자에 관하여 판별 처리가 실행된다.
그러므로, 판별 처리가 단순한 구조로 쉽게 그리고 정확하게 고속 실행된다.
도 91은 본 발명의 제11 실시예에 따른 패턴 인식 동작을 도시한 흐름도이다.
도 91의 스텝 S321에서는 검출되고 전처리된 문자에 대해 오일러수, 라인 밀도, 복잡량, 흑화소의 밀도 등과 같은 복잡량이 산출된다. 스텝 S322에서는 산출된 복잡량에 기초하여 현재 문자가 복잡한 삭제 라인을 갖는지의 여부에 관한 판정이 소정의 임계를 이용하여 행해진다. 만일 현재 문자가 복잡한 삭제 라인을 갖는 문자인 것으로 판정되는 경우, 스텝 S323에서는 거부 코드가 출력된다. 만일 현재 문자가 복잡한 삭제 라인을 갖지 않는 문자라고 판정된 경우, 스텝 S314에서 수평 방향 인접 투영 히스토그램이 산출되고, 스텝 S351에서 단순한 삭제 라인을 갖는 문자 후보의 존재 여부가 판정된다. 단순 삭제 라인 후보가 존재한다면, 스텝 S352에서는 이 삭제 라인 후보가 단순한 삭제 라인을 갖는 문자 후보로부터 제거된다. 삭제 라인 후보가 단순한 삭제 라인을 갖는 문자 후보로부터 제거되어 그 결과가 문자로 식별될 수 있다면, 단순한 삭제 라인을 갖는 문자 후보는 단순 삭제 라인을 갖는 문자로 확정된다. 그 결과가 문자로 식별될 수 없는 경우, 스텝 S351에서는 현재 문자가 단순한 삭제 라인을 갖는 문자인지의 여부가 판정된다. 만일 후보가 삭제 라인을 갖는 문자 후보라면, 삭제 라인 후보는 스텝 S352에서 제거되고, 삭제 라인 후보가 제거된 삭제 라인을 갖는 문자 후보가 문자로 식별될 수 있는지의 여부가 조사된다. 문자로 식별되는 경우, 단순한 삭제 라인을 갖는 문자로 확정되고 거부 코드가 출력된다(스텝 S355). 만일 문자로 식별되지 않는 경우에는 통상 문자로 확정된다(스텝 S353, S354). 통상 문자를 식별하는 처리(스텝 S317)에서, 스텝 S361 및 S362에 의해 확정된 통상 문자가 문자로서 식별될 수 있는지의 여부가 점검된다. 통상 문자가 문자로서 식별되지 않는 경우, 스텝 S363에서 거부 코드가 출력된다. 통상 문자가 문자로서 식별되는 경우, 인식 결과 문자 코드가 출력된다(스텝 S364).
도 92는 본 발명의 제12 실시예에 따른 패턴 인식부의 구조를 도시한 블록도이다.
도 92에서, 패턴 인식 장치는 서식에 기입된 전송 문자 패턴을 광학적으로 판독하고 문자 패턴을 전기 신호로 변환하며 이진화 등을 통해 디지탈 신호를 출력하는 광판독부(430)와; 광판독부(430)의 광학 판독 영역으로 서식을 전송하는 전송부(431)와; 문자의 표준 특징 벡터를 기억하는 사전(432)과; 스크린상에 문자를 디스플레이하는 디스플레이부와; 종이상에 문자를 프린트하는 출력부(433)와; 다양한 작업을 실행하는 작업부(434)와; 문자 인식을 위한 다양한 기능을 갖는 CPU 및 메모리(435)를 구비한다.
도 92에 도시된 바와 같이, CPU 및 메모리(435)는 입력 이미지로부터 문자를 검출하여 전처리하는 문자 검출 및 전처리부(436)와; 복잡한 획선에 의해 표현되는 복잡한 삭제 라인을 갖는 문자에 관하여 판별 처리를 실행하는 복잡한 삭제 라인 문자 판별 처리부(437)와; 문자가 복잡한 삭제 라인을 갖지 않는 것으로 복잡한 삭제 라인 문자 판정 처리부(437)에 의해 판정되는 경우, 문자의 삭제를 나타내기 위해 수평 라인으로만 형성된 단순한 삭제 라인을 갖는 문자 후보에 관하여 판별 처리를 실행하는 단순한 삭제 라인 문자 판별부(438)와; 문자를 식별하는 식별부(439)와; 만일 문자가 식별 라인이 있는 문자로 판별되는 경우 문자를 거부하고, 통상 문자로 판별되는 경우 문자 식별 결과를 출력하고, 만일 문자가 통상 문자로 판별되지만 문자로 식별되지 않는 경우 거부를 출력하도록 지시하는 결과 출력 지시부(440)를 구비한다.
도 92에 도시된 바와 같이, 문자 검출 및 전처리부(436)는 입력 디지탈 이미지의 서식 이미지로부터 문자 부분만을 검출하고 상호 문자간을 분리시키는 문자 검출부(441)와, 검출된 문자 신호로부터의 잡음을 제거하여 문자의 위치, 크기 등을 정량화하는 전처리부(442)를 구비한다.
광판독부(430), 전송부(431) 및 문자 검출 및 전처리부(436)는 이미지 입력부에 해당한다.
복잡한 삭제 라인 문자 판별 처리부(437)는 문자 패턴으로부터의 복잡량을 추출하는 복잡량 추출부(443)와; 추출된 복잡량에 기초하여 문자 패턴이 복잡한 삭제 라인을 갖는 문자인지의 여부를 판별하는 복잡 삭제 라인 문자 판별부(444)를 구비한다.
'복잡량'은 소정의 방향에서의 라인 밀도, 오일러수, 흑화소 밀도 등으로 나타내진다.
'소정의 방향에서의 라인 밀도'는 사각형내의 이미지가 소정의 방향으로 주사되는 경우 백화소가 흑화소로 변하는(또는 흑화소가 백화소로 변하는) 부분을 카운트함으로써 얻어지는 값을 말한다. 예를 들면, 도 93a에 도시된 바와 같이 만일 문자 패턴이 삭제 라인(501)을 갖는 문자 "2" 로 형성되는 경우, 수직 방향의 라인 밀도는 도 93d에 나타난 바와 같이 6이 된다.
'소정 방향'은 문자에 대해 수직 또는 수평 방향을 말한다. '오일러수(E)"는 연결 요소의 수(C)에서 홀의 수(H)를 뺀 것, 즉 E=C-H 로 나타내지며, 여기서 C는 이미지에서 서로 접속된 연결 요소수를 나타내고, H는 이미지에서의 홀의 수를 나타낸다.
예를 들면, 만일 문자 패턴이 도 93b에 나타난 바와 같이 삭제 라인(502)을 갖는 문자 '2' 로 형성된 경우, 도 93e에 나타난 바와 같이 오일러수(E)는 -4 이다.
'흑화소 밀도(D=B/S)'는 대상 이미지의 외접 사각형에서 흑화소의 총수(B)에 관한 대상 이미지의 외접 사각형의 면적(S)(총화소수)의 비율을 나타낸다.
예를 들면, 만일 문자 패턴이 도 93c에 나타난 바와 같이 삭제 라인(503)을 갖는 문자 '2'로 형성되는 경우, 흑화소 밀도(D)는 도 93f에 나타난 바와 같이 D=B/S 로 나타내진다.
도 93a 내지 도 93c는 복잡한 삭제 라인을 갖는 문자의 예를 도시한다.
복잡한 삭제 라인 문자 판별부(444)는 추출된 특징에 대한 라인 밀도, 오일러수, 또는 흑화소 밀도 또는 이들의 적절한 조합과 같은 복잡량에 기초하여 판별 처리를 실행한다.
추출된 복잡량, 통상 문자 또는 삭제 라인을 갖는 문자의 일반적인 성향은 다음과 같다.
특징/성향 통상 문자 삭제 라인이 있는 문자
최대 라인 밀도 작다 크다
오일러수 작은 절대값(2∼-1) 음수로서 큰 절대값
흑화소 밀도 작다 크다
임계값 등을 미리 설정함으로써 현재 문자가 삭제 라인을 갖는지의 여부가 복잡량에 기초하여 판정된다.
도 92에 도시된 단순 삭제 라인 문자 판별부(438)는 대상 수평 주사 라인과 대상 라인 상하의 소정 범위의 인접 라인에 있는 흑화소가 수평 방향으로 가산되어 카운트되는 인접 투영에 의해 화소수 히스토그램을 산출하는 화소 히스토그램 산출부(445)와; 산출된 화소수에 기초하여 단순한 삭제 라인을 갖는 문자 후보에 관하여 판별 처리를 실행하는 단순한 삭제 라인 문자 후보 판별부(446)와; 삭제 라인 후보가 판별된 단순한 삭제 라인을 갖는 문자 후보로부터 삭제될 때 식별부(439)가 문자라고 식별하는 경우 단순한 삭제 라인을 갖는 문자를 판정하는 단순 삭제 라인 문자 판정부(447)를 구비한다.
"수평 방향으로의 인접 투영'은 대상 수평 주사 라인과 대상 라인의 상하 소정 범위의 인접 라인에 있는 흑화소를 수평 방향으로 가산하여 카운트하는 것을 말한다.
본 실시예의 일특징에 따르면, 소정의 범위는 3 라인을 포함한다.
단순 삭제 라인 문자 후보 판별부(446)는 화소수 히스토그램이 소정의 임계값을 초과하는 피크를 갖는 단순한 수평 삭제 라인을 갖는 문자 후보를 판정하고, 해당 라인을 삭제 라인 후보로서 인식한다.
도 71에 도시된 바와 같이, 만일 단순한 삭제 라인 문자 후보 판별부(446)에 의해 판정되고 삭제 라인 제거부(450)에 의해 삭제 라인 후보가 제거된 삭제 라인을 갖는 문자 후보가 문자로서 식별될 수 있다면, 단순 삭제 라인 문자 판정부(448)에 의해 삭제 라인을 갖는 문자로서 확정된다. 만일 후보가 문자로서 식별될 수 없다면, 통상 문자(삭제 라인을 갖지 않는 문자)로서 확정된다. 삭제 라인 후보는 삭제 라인 제거부(450)에 의해 현존 이미지 처리 방법으로 제거된다.
도 92에 도시된 바와 같이, 단순 삭제 라인 문자 판정부(447)는 판별된 단순한 삭제 라인을 갖는 문자 후보로부터 삭제 라인 후보를 제거하여 그 결과를 식별부(439)에 전송하는 삭제 라인 제거부(450)와; 판별된 단순 삭제 라인을 갖는 문자에 대하여 판별된 후보가 문자로서 인식되는 경우 단순 삭제 라인을 갖는 문자로서 단순한 삭제 라인을 갖는 문자 후보를 확정하고, 후보가 문자로서 인식되지 않는 경우에 그것을 통상 문자로 판정하여 식별부(439)에 전송하는 단순한 삭제 라인 문자 판정부(448)와; 삭제 라인 제거부(450)에 의해 제거되는 삭제 라인을 갖는 문자 후보를 기억하는 문자 후보 기억부(449)를 구비한다.
또한, 식별부(439)는 각각의 문자 패턴의 특징치를 추출하여 데이터를 압축하는 특징 추출부(451)와; 문자 패턴을 사전, 즉 각각의 문자형의 표준 특징 벡터로 조회하는 사전 조회부(452)를 구비한다.
도 92에 도시된 패턴 인식부의 동작은 도 94 및 도 95 를 참조하여 기술된다.
도 94에 도시된 바와 같이, 전송부(431)는 광판독부(430)의 판독 영역에 기입된 문자를 포함하는 서식을 전송하고 스텝 SJ1에서 그 서식을 OCR 입력한다.
스텝 SJ2에서, 광판독부(430)는 광-전기 변환에서 그 서식상의 문자 패턴을 전기 신호로 변환하고, 2진화 등을 통해 전기 신호를 디지탈 신호로 출력한다.
그 서식은 기입된 문자 및 동일 컬러의 문자 테두리를 포함할 수 있다.
스텝 SJ3에서, 문자 검출부(441)는 디지탈 신호로부터 문자 부분을 검출하여 문자들을 서로 분리한다. 처리부(442)는 위치, 크기, 사선 굵기 등을 정량화한다.
스텝 SJ4에서, 복잡한 삭제 라인 문자 판별 처리부(437)는 복잡한 삭제 라인을 갖는 문자에 관하여 판별 처리를 실행한다. 스텝 SJ5에서, 복잡한 삭제 라인 문자 판별 처리부(437)가 현행 문자 패턴을 복잡한 삭제 라인을 갖는 문자로서 인식하지 못한다.
도 95에 도시된 삭제 라인 존재 판정부(A)는 복잡한 삭제 라인 문자 판별 처리부(437)에 의해 실행되는 처리의 내용을 나타내는 스텝 SJ4 및 SJ5에서의 처리를 도시한다.
스텝 SJ41에서, 복잡량 추출부(443)는 오일러수, 라인 밀도, 흑화소 밀도 등과 같은 복잡량을 추출하여 현재 문자 패턴이 복잡한 삭제 라인을 갖는 문자인지의 여부를 판정한다.
스텝 SJ42에서, 복잡한 삭제 라인 문자 판정부(444)는 대상 문자 패턴이 복잡한 삭제 라인을 갖는 문자인지 또는 통상 문자인지를 소정의 임계값을 이용하여 판정한다.
예를 들어, 수평 방향 주사에 의한 라인 밀도의 임계값이 2 이고, 수직 방향 주사에 의한 라인 밀도의 임계값은 3 이고, 오일러수의 임계값은 -1 이고, 흑화소 밀도의 임계값은 0.6 이라고 가정하면, 수평 방향 주사에 의한 라인 밀도가 2 이하이고, 수직 방향 주사에 의한 라인 밀도가 3 이하이고, 오일러수가 -1 이상이고, 흑화소 밀도가 0.6 이하인 경우에는 문자 패턴이 복잡한 삭제 라인을 갖지 않는 것으로 판정된다. 그렇지 않은 경우에는, 문자 패턴은 복잡한 삭제 라인을 갖는 문자로서 판별된다.
문자 패턴이 스텝 SJ43에서 복잡한 삭제 라인을 갖는 문자로서 판정되는 경우, 스텝 SJ5에서 인식 결과로서 거부 코드를 출력한다.
문자 패턴이 복잡한 삭제 라인을 갖는 문자로서 판별되지 않는 경우에는 도 94에 도시된 바와 같이 스텝 SJ6으로 진행되고, 단순한 삭제 라인 문자 판별부(438)는 수평 라인, 즉 하나의 삭제 라인이 존재하는지의 여부를 판정하는 처리를 실행한다. 만일 패턴이 삭제 라인을 갖는 문자로서 판별되는 경우, 스텝 SJ7에서 인식 결과로서 거부 코드를 출력한다.
도 95는 삭제 라인 존재 판정부(B)에 의한 판별 처리를 나타낸다.
도 95에 도시된 바와 같이, 화소 히스토그램 산출부(445)는 스텝 SJ61에서 수평 방향 인접 투영 히스토그램을 생성한다.
인접 히스토그램은 예를 들어, 수평 라인을 따라 n=3 라인마다 흑화소를 더함으로써 얻어질 수 있는데, 도 20에 도시된 바와 같이 각 라인은 수평 단순 삭제 라인에 수직 방향으로 이동된다. 그러므로, 수평 단순 삭제 라인이 정확히 수평이 아니더라도, 단순한 삭제 라인으로서 정확하게 판별될 수 있다.
스텝 SJ62에서 히스토그램이 그 피크가 임계값(N)를 초과하는 것으로 나타난 경우, 단순한 삭제 라인 문자 후보 판별부(446)는 스텝 SJ63에서 삭제 라인 후보가 있는지를 판정하고 패턴을 단순한 삭제 라인을 갖는 문자 후보로서 판별한다. 이러한 피크가 존재하지 않는다면, 패턴이 삭제 라인 후보를 내포하고 있지 않는 것으로 판별되며 패턴은 통상 문자로서 판별된다. 만일 문자 크기가 전처리에서 정량화되는 경우, N은 고정값이 될 수 있다. 만일 전처리에서 정량화되지 않는 경우에는, N은 대상 문자를 둘러싸는 사각형의 폭에 따라 가변하게 한다. 이 경우에, 외접 사각형의 폭에 대한 임계값(N)의 비율은 고정값으로 적절하게 주어져야 한다.
스텝 SJ63에서 만일 단순한 삭제 라인 문자 후보 판별부(446)가 패턴을 삭제 라인을 갖는 문자 후보로 판별하는 경우, 스텝 SJ64로 진행되고, 문자 후보 기억부(449)는 삭제 라인을 갖는 문자 후보를 기억한다(삭제 라인을 제거하기 전에). 삭제 라인 제거부(450)는 삭제 라인을 갖는 문자 후보의 수평 방향의 단순 삭제 라인을 검출하여 제거한다.
삭제 라인 후보는 현존 방법, 예를들면 n 라인의 실행 길이 등을 통하여 한 라인을 추출하는 방법에 의해 제거된다.
스텝 SJ8에서 삭제 라인이 제거된 문자 패턴에 관하여 식별부(439)에 의해 특징 추출 처리를 실행한다. 스텝 SJ9에서, 추출된 특징이 사전에서 조회된다.
사전 조회에서, 주어진 표준 특징 벡터를 참조하여 일치 정도가 산출되고, 가장 유사함을 나타내는 특징 벡터를 가진 문자 종류가 인식 결과로서 출력된다.
만일 스텝 SJ65에서 조회 결과가 거부를 나타내는 것으로 판정되는 경우, 단계 SJ66에서 단순한 삭제 라인 문자 판정부(448)가 삭제 라인을 갖는 문자 후보가 삭제 라인을 갖지 않는 문자라는 것으로 판정하여, 스텝 SJ67에서 문자 후보 기억부(449)에 일시 기억된 삭제 라인을 갖는 문자 후보의 본래 이미지가 문자를 식별하는 식별부(439)에 전송한다. 결과 출력 지시부(440)는 출력부(433)가 식별 결과를 출력하게 한다.
만일 스텝 SJ65에서 조회 처리 후에 패턴이 문자로서 식별되는 것으로 판정되는 경우, 스텝 SJ68로 진행되고, 단순한 삭제 라인 문자 판정부(448)는 삭제 라인을 갖는 문자로서 삭제 라인을 갖는 문자 후보를 판별하고, 스텝 SJ69에서 결과 출력 지시부(440)가 출력부(433)에 "거부"라는 인식 결과를 출력한다.
도 71의 상부 라인은 단순한 삭제 라인을 갖는 문자 후보에 관하여 삭제 라인 후보를 인식하고 삭제 라인 후보가 제거된 패턴을 '5'로 식별하는 삭제 라인 문자 패턴 판정의 일예를 도시한다. 도 71의 하부 라인은 단순 삭제 라인을 갖는 문자 후보에서 삭제 라인 후보를 인식하고, 삭제 라인 후보가 제거된 패턴을 거부하여, 단순 삭제 라인이 있는 본래 문자 후보를 통상 문자로 판별하는 일예를 도시한다.
전술된 바와 같이, 본 실시예에 따르면 소정 방향의 최대 라인 밀도, 오일러수, 흑화소 밀도 모두를 포함하는 복잡량에 기초하여 복잡한 삭제 라인을 갖는 문자에 대한 판별 처리를 행할 수 있다.
그러므로, 본 실시예는 복잡한 삭제 라인을 갖는 문자 판별을 고속 및 고신뢰도로 실현한다.
또한, 본 실시예에 따르면, 단순한 삭제 라인을 갖는 문자 후보는 인접 투영 방법으로 화소수를 카운트함으로써 판정될 수 있다.
결국, 수평 방향의 검출 삭제 라인 뿐만아니라 거칠게 수평 방향으로 그려진 라인을 포함하는 삭제 라인을 갖는 문자 후보가 단순한 구조 및 고신뢰도로 신속하며 용이하게 판정될 수 있다.
전술된 바와 같이, 본 실시예의 한 측면에 따르면 삭제 라인을 갖는 문자의 오독이 삭제 라인 존재 판정 처리를 함으로써 감소될 수 있다. 또한, 삭제 라인에 의해 삭제된 문자가 정확하게 거부될 수 있다.

Claims (52)

  1. 입력 이미지의 레이아웃을 분석하는 레이아웃 분석 수단과;
    상기 입력 이미지의 품질을 분석하는 품질 분석 수단과;
    상기 입력 이미지의 정정 상태를 분석하는 정정 분석 수단과;
    상기 입력 이미지의 처리 대상의 각 상태에 대해 패턴 인식 처리를 수행하는 패턴 인식 수단과;
    상기 레이아웃, 품질 또는 정정 상태에 기초하여 상기 입력 이미지의 처리 대상의 상태를 추출하고, 처리 대상의 각 상태에 대해 하나 이상의 패턴 인식 처리를 선택함으로써 인식 처리를 수행하는 환경 인식 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  2. 제1항에 있어서, 처리 대상의 각 상태에 대한 패턴을 검출하는 패턴 검출 수단을 추가로 포함하는 것을 특징으로 하는 패턴 인식 장치.
  3. 제1항에 있어서, 상기 환경 인식 수단은 상기 처리 대상의 각 상태에 대한 판정 결과에 따라 상기 패턴 인식 수단에 의해 수행된 각 상태에 대한 인식 처리를 기억하는 중간 처리 결과표를 작성하는 중간 처리 결과표 작성 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  4. 제1항에 있어서, 상기 환경 인식 수단은 다수의 인식 처리가 특정 처리 대상에 대해 요구되는 경우 상기 인식 처리의 신뢰도가 소정의 값을 초과할때까지 우선순위에 따라 인식 처리를 수행하는 것을 특징으로 하는 패턴 인식 장치.
  5. 제1항에 있어서, 상기 패턴 인식 수단은 각 문자의 품질에 대해 제공되는 인식 사전을 포함하며, 상기 품질 분석 수단에 의해 분석된 품질에 기초하여 다수의 인식 사전을 적절하게 이용함으로써 문자를 인식하는 것을 특징으로 하는 패턴 인식 장치.
  6. 제5항에 있어서, 상기 인식 사전은 표준 사전, 모호한 문자 사전, 변형된 문자 사전, 프레임-화이트 문자 사전 및 텍스쳐-백그라운드 문자 사전중 적어도 하나를 포함하는 것을 특징으로 하는 패턴 인식 장치.
  7. 제1항에 있어서, 상기 패턴 인식 수단은 처리 대상의 상태에 기초한 지식을 이용하여 인식 처리를 수행하는 것을 특징으로 하는 패턴 인식 장치.
  8. 제1항에 있어서, 상기 패턴 인식 수단은 처리 대상의 상태에 기초한 식별 함수를 이용하여 인식 처리를 수행하는 것을 특징으로 하는 패턴 인식 장치.
  9. 제1항에 있어서, 상기 환경 인식 수단은 상기 패턴 인식 수단이 각 상태에 대한 다수의 인식 처리를 문서 단위 또는 서식 페이지 단위로 수행하도록 하는 것을 특징으로 하는 패턴 인식 장치.
  10. 제1항에 있어서, 상기 품질 분석 수단은 소정 영역에 대해 [각각의 소정의 임계값보다 작은 면적, 길이 및 폭을 갖는 연결 영역의 수]를 [상기 소정 영역의 모든 연결 영역의 수]로 나눔으로써 획득된 값이 소정의 값보다 클때 모호한 문자로 판단하는 것을 특징으로 하는 패턴 인식 장치.
  11. 제1항에 있어서, 상기 품질 분석 수단은 소정 영역에 대해 [모호한 괘선이 보완될때의 보안된 부분의 길이의 합계]를 [괘선의 길이의 합계]로 나눔으로써 획득된 값이 소정의 값보다 클때 모호한 문자로 판단하는 것을 특징으로 하는 패턴 인식 장치.
  12. 제1항에 있어서, 상기 품질 분석 수단은 소정 영역에 대해 [흑화소의 밀도가 소정의 임계값보다 큰 연결 영역의 수]를 [상기 소정 영역의 모든 연결 영역의 수]로 나눔으로써 획득된 값이 소정의 값보다 클때 변형된 문자로 판단하는 것을 특징으로 하는 패턴 인식 장치.
  13. 입력 이미지로부터 처리 대상의 상태를 추출하는 상태 추출 수단과;
    처리 대상의 각 상태에 대해 패턴 인식 처리를 수행하는 패턴 인식 수단과;
    상기 상태 추출 수단에 의해 추출된 처리 대상의 각 상태에 대해 하나 이상의 패턴 인식 처리를 호출함으로써 인식 처리가 수행되도록 하는 인식 처리 제어 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  14. 제13항에 있어서, 상기 상태 추출 수단은,
    입력 이미지로부터 소정의 크기의 영역을 갖는 연결 패턴을 문자에 대한 후보로서 추출하는 문자 추출 수단과;
    다수의 문자 후보중 인접하여 있는 문자를 문자열에 대한 후보로서 추출하는 문자열 추출 수단과;
    입력 이미지로부터 괘선을 추출하는 괘선 추출 수단과;
    상기 4개의 괘선으로 둘러싸는 패턴을 문자 테두리로서 추출하는 문자 테두리 추출 수단과;
    문자 테두리에 접촉하는 문자를 추출하는 접촉 문자 추출 수단과;
    입력 이미지로부터 모호한 상태를 분석하는 모호한 문자 분석 수단과;
    입력 이미지로부터 변형 상태를 분석하는 변형된 문자 분석 수단과;
    입력 이미지로부터 정정 상태를 추출하는 정정 특징 추출 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  15. 제14항에 있어서, 상기 문자 테두리 추출 수단은,
    괘선의 연결 상태 및 문자 테두리의 크기에 기초하여 1문자 테두리, 블록 문자 테두리, 자유피치 문자 테두리, 규칙적인 표 및 불규칙적인 표중의 한 속성을 문자 테두리에 부여하는 속성 부여 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  16. 제14항에 있어서, 상기 접촉 문자 추출 수단은,
    상기 문자 테두리 추출 수단에 의해 추출된 문자 테두리의 내측을 문자 테두리를 따라 주사하는 주사 수단과;
    상기 주사에 의해 교차 패턴이 존재하는지를 검출하는 교차 검출 수단과;
    상기 교차 검출 수단이 패턴을 교차 패턴이라고 검출하면 상기 패턴이 문자 테두리와 교차하는 테두리 접촉 문자인지를 판별하는 판별 수단과;
    패턴이 주사된 문자 테두리의 내측에서 외측으로 부분적으로 기록되어 있는 지를 판단하는 일부가 외측으로 벗어난 문자 검출 수단과;
    주사된 문자 테두리의 테두리 접촉 문자로부터 문자 테두리의 내측에서 외측으로 부분적으로 기록된 패턴을 제거하는 제거 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  17. 제14항에 있어서, 상기 정정 특징 추출 수단은,
    사각형 영역내의 이미지가 특정 방향으로 주사될때 백화소가 흑화소로 또는 흑화소가 백화소로 변화하는 회수를 계수함으로써 특정 방향에서의 라인 밀도를 산출하는 라인 밀도 산출 수단과;
    이미지의 연결 성분의 개수로부터 이미지에 포함된 홀의 개수를 감산함으로써 오일러수를 산출하는 오일러수 산출 수단과;
    대상 이미지의 면적 대 대상 이미지의 외접 사각형의 면적의 비를 계산함으로써 흑화소 밀도를 산출하는 흑화소 밀도 산출 수단과;
    라인 밀도가 소정의 값을 초과할때 상기 사각형에 의해 둘러싸인 이미지가 정정 문자에 대한 후보인지를 판정하는 라인 밀도 판정 수단과;
    오일러수가 음수이고 소정의 값보다 큰 절대값을 가질때 이미지가 정정 문자에 대한 후보인지를 판정하는 오일러수 판정 수단과;
    흑화소 밀도가 소정의 값을 초과할때 이미지가 정정 문자의 후보인지를 판정하는 흑화소 밀도 판정수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  18. 제14항에 있어서, 상기 패턴 인식 수단은,
    문자의 패턴을 인식하는 문자 인식 수단과;
    문자열의 패턴을 인식하는 문자열 인식 수단과;
    문자 테두리에 접촉하는 문자의 패턴을 인식하는 접촉 문자 인식 수단과;
    모호한 문자의 패턴을 인식하는 모호한 문자 인식 수단과;
    변형된 문자의 패턴을 인식하는 변형 문자 인식 수단과;
    정정된 문자의 패턴을 인식하는 정정 문자 인식 수단과;
    특이 문자의 패턴을 인식하는 특이 문자 인식 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  19. 제18항에 있어서, 상기 문자 인식 수단은,
    입력된 미지 문자의 특징을 특징 벡터로서 추출하는 특징 추출부와;
    문자 카테고리의 특징을 특징 벡터로서 사전에 저장하고 있는 기본 사전과;
    미지 문자의 특징 벡터와 문자 카테고리의 특징 벡터간의 거리를 산출하며, 미지 문자의 문자 벡터간의 거리가 가장 짧은 문자 카테고리를 미지 문자로서 인식하는 조회부를 포함하는 것을 특징으로 하는 패턴 인식 장치.
  20. 제18항에 있어서, 상기 문자 인식 수단은,
    미지 문자의 윤곽의 요철수를 산출함으로써 미지 문자의 변형도를 산출하는 변형도 산출 수단과;
    문자 카테고리의 특징을 문자 벡터로서 사전에 저장하고 있는 세그먼트 사전과;
    문자의 윤곽을 끝점에서 분할하고, 문자 세그먼트를 생성하는 문자 세그먼트 생성부와;
    상기 변형도가 소정의 값보다 큰 값을 나타낼때 문자 세그먼트의 각도 변동량의 누적값이 서로 근접하도록 미지 문자의 문자 세그먼트와 문자 카테고리의 문자 세그먼트 사이의 대응관계를 생성하는 대응관계 생성부와;
    상기 대응관계에 기초하여 미지 문자의 특징 벡터와 문자 카테고리의 특징 벡터간의 거리를 산출하며, 미지 문자의 문자 벡터간의 거리가 가장 짧은 문자 카테고리를 미지 문자로서 인식하는 조회부를 포함하는 것을 특징으로 하는 패턴 인식 장치.
  21. 제18항에 있어서, 상기 문자열 인식 수단은,
    패턴의 특징을 나타내는 P 특징값에 의해 표시되는 샘플 데이타를 검출 성공의 제1 그룹 및 검출 실패의 제2 그룹으로 분류하며, 상기 제1 그룹 및 제2 그루의 중심으로부터 동일한 거리에서 판별면을 P차원 공간상에 생성하는 판별면 생성 수단과;
    P차원 공간 내에서 입력 데이타의 P 특징값의 위치와 상기 판별면 사이의 거리를 구하며, 이 거리에 기초하여 입력 데이타의 검출 신뢰도를 산출하는 신뢰도 산출 수단과;
    입력 데이타의 검출 신뢰도와 검출된 입력 데이타의 인식 신뢰도에 기초하여 입력 데이타가 검출되는 위치를 결정하는 검출 결정 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  22. 제18항에 있어서, 상기 접촉 문자 인식 수단은,
    테두리 접촉 문자로부터 문자 테두리를 제거하는 문자 테두리 제거 수단과;
    문자 테두리를 제거함으로써 분리된 라인의 방향을 따라 문자 테두리를 제거함으로써 모호한 문자로부터 문자를 보완하는 문자 보완 수단과;
    문자 테두리를 제거하기 전에 문자 테두리와 중첩하는 라인을 보간함으로써 문자 테두리가 제거될때 분리되는 패턴을 보완하는 재보완 수단과;
    문자와 문자 테두리가 소정의 조건 하에서 서로 접촉하는 학습 패턴을 생성하는 학습 패턴 생성 수단과;
    학습 패턴의 인식 신뢰도를 상기 소정의 조건과 함께 기억하고, 인식 신뢰도가 소정의 값보다 낮을때 학습 패턴에 대한 문자 재인식 방법을 기억하는 지식표와;
    상기 문자 보완 수단에 의해 보완된 패턴 또는 상기 재보완 수단에 의해 보완된 패턴이 소정의 조건을 충족시킬때 상기 지식표에 기억된 문자 재인식 방법에 의해 문자를 인식하는 문자 재인식 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  23. 제18항에 있어서, 상기 모호한 문자 인식 수단은,
    입력 미지 입력 문자의 특징을 특징 벡터로서 추출하는 특징 추출부와;
    모호한 문자의 문자 카테고리의 특징을 사전에 저장하고 있는 모호한 문자 사전과;
    미지 문자의 특징 벡터와 문자 카테고리의 특징 벡터 사이의 거리를 산출하여, 미지 문자의 특징 벡터간의 거리가 가장 짧은 문자 카테고리를 미지 문자로서 인식하는 조회부를 포함하는 것을 특징으로 하는 패턴 인식 장치.
  24. 제16항에 있어서, 상기 변형된 문자 인식 수단은,
    입력 미지 문자의 특징을 특징 벡터로서 추출하는 특징 추출부와;
    변형된 문자의 문자 카테고리의 특징을 사전에 저장하고 있는 변형 문자 사전과;
    미지 문자의 특징 벡터와 문자 카테고리의 특징 벡터간의 거리를 산출하여, 미지 문자의 특징 벡터간의 거리가 가장 짧은 문자 카테고리를 미지 문자로서 인식하는 조회부를 포함하는 것을 특징으로 하는 패턴 인식 장치.
  25. 제18항에 있어서, 상기 정정 문자 인식 수단은,
    정정 문자에 대한 후보로서 추출된 패턴의 소정 방향의 히스토그램값을 산출하는 히스토그램값 산출 수단과;
    소정의 값보다 큰 히스토그램값을 갖는 라인을 제거하는 라인 제거 수단과;
    상기 라인을 제거함으로써 모호하게된 패턴의 모호한 부분을 보간함으로써 보완 패턴을 생성하는 보완 수단과;
    상기 보완 패턴에 있어서의 문자를 인식하는 문자 인식 수단과;
    상기 보완 패턴이 문자로서 인식될때 상기 라인 제거 수단에 의해 제거된 라인을 제거 라인으로서 간주하며, 보완 패턴이 거부될때 상기 라인 제거 수단에 의해 삭제된 라인을 문자의 일부분으로서 간주하는 삭제 라인 인식 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  26. 제18항에 있어서, 상기 특이 문자 인식 수단은,
    각 카테고리에 대해 수기 문자를 클러스터링한 후에 한명의 필자에 의해 수기된 문자를 요소로 하는 다수의 클러스터를 각 카테고리에 생성하는 클러스터링 수단과;
    상기 클러스터링 수단에 의해 생성된 클러스터로부터 소정의 값보다 작은 요소수를 포함하는 클러스터를 추출하는 클러스터 추출 수단과;
    상기 클러스터 추출 수단에 의해 추출된 제1 클러스터와 다른 카테고리에 속한 제2 클러스터간의 거리를 산출하는 클러스터간 거리 산출 수단과;
    제1 클러스터와 제2 클러스터간의 거리가 소정의 값보다 작을때 상기 제1 클러스터와 제2 클러스터를 통합하며, 제1 클러스터에 속한 수기 문자의 카테고리를 제2 클러스터의 카테고리로 정정하는 카테고리 정정 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  27. 제18항에 있어서, 상기 인식 처리 제어 수단은 상기 문자 추출 수단이 문자에 대한 후보를 추출할때 상기 문자 인식 수단을 호출하며, 상기 문자열 추출 수단이 문자에 대한 후보를 추출할때 상기 문자열 인식 수단을 호출하며, 상기 접촉 문자 추출 수단이 문자 테두리에 접촉하는 문자를 추출할때 상기 접촉 문자 인식 수단을 호출하며, 상기 모호한 문자 분석 수단이 입력 이미지의 모호한 상태를 추출할때 상기 모호한 문자 인식 수단을 호출하며, 상기 변형된 문자 분석 수단이 입력 이미지의 변형된 상태를 추출할때 상기 변형 문자 인식 수단을 호출하며, 상기 정정 특징 추출 수단이 입력 이미지의 정정 상태를 추출할때 상기 정정 문자 인식 수단을 호출하는 것을 특징으로 하는 패턴 인식 장치.
  28. 제18항에 있어서, 상기 인식 처리 제어 수단은 상기 문자 인식 수단에 의해 판정된 문자 신뢰도가 소정의 값보다 클때 상기 특이 문자 인식 수단을 호출하는 것을 특징으로 하는 패턴 인식 장치.
  29. 제16항에 있어서, 상기 인식 처리 제어 수단은,
    입력 이미지로부터 처리 대상의 상태의 추출 결과에 기초하여 상기 패턴 인식 수단에 의해 수행된 인식 처리가 호출되도록 지시하는 호출 순서를 저장하는 처리 순서 제어 규칙 저장 수단과;
    특정 대상에 대한 다수의 인식 처리가 상기 패턴 인식 수단에 의해 호출될때의 호출 순서를 저장하는 처리 순서표와;
    호출 절차 및 각 처리 대상에 대한 순서에 따라 상기 패턴 인식 수단에 의한 인식 처리를 수행하는 순서를 나타내는 중간 처리 결과표를 작성하는 중간 처리 결과표 작성 수단과;
    상기 중간 처리 결과표에 기입된 인식 처리의 결과에 기초하여 후속 처리를 지시하는 순서를 저장하는 처리 실행 규칙 저장 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  30. 입력 이미지로부터 문자를 추출하는 문자 추출 수단과;
    입력 이미지로부터 비문자를 추출하는 비문자 추출 수단과;
    문자를 인식하는 문자 인식 수단과;
    비문자를 인식하는 비문자 인식 수단과;
    상기 문자 추출 수단이 문자를 추출할때 상기 문자 인식 수단이 인식 처리를 수행하도록 지시하며, 상기 비문자 추출 수단이 비문자를 추출할때 상기 비문자 인식 수단이 인식 처리를 수행하도록 지시하는 환경 인식 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  31. 제30항에 있어서, 상기 환경 인식 수단은 상기 문자 추출 수단이 문자를 추출하면 상기 문자 인식 수단으로부터 획득된 인식 결과에 대한 정확도를 나타내는 신뢰도를 산출하며, 상기 문자 인식 수단으로부터 획득된 인식 결과에 대한 신뢰도가 소정의 값보다 작을때 상기 문자 추출 수단에 의해 추출된 문자를 비문자 인식 수단이 비문자로 간주하는 인식 처리를 수행하도록 지시하는 것을 특징으로 하는 패턴 인식 장치.
  32. 제30항에 있어서, 상기 환경 인식 수단은 상기 비문자 추출 수단이 비문자를 추출하면 상기 비문자 인식 수단으로부터 획득된 인식 결과에 대한 정확도를 나타내는 신뢰도를 산출하며, 상기 비문자 인식 수단으로부터 획득된 인식 결과에 대한 신뢰도가 소정의 값보다 작을때 상기 비문자 추출 수단에 의해 추출된 비문자를 상기 문자 인식 수단이 문자로 간주하는 인식 처리를 수행하도록 지시하는 것을 특징으로 하는 패턴 인식 장치.
  33. 입력 이미지로부터 소정의 특징을 추출하는 환경 인식 수단과;
    상기 환경 인식 수단에 의해 추출된 특징에 기초하여 처리를 변경한 후에 패턴 인식 처리를 수행하는 패턴 인식 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  34. 제1 상태의 처리 대상의 패턴을 인식하는 제1 패턴 인식 수단과;
    제2 상태의 처리 대상의 패턴을 인식하는 제2 패턴 인식 수단과;
    입력 이미지로부터 처리 대상의 상태를 추출하며, 상기 제1 패턴 인식 수단으로 하여금 제1 상태의 처리 대상에 대해 인식 처리를 수행하도록 지시하며, 상기 제2 패턴 인식 수단으로 하여금 제2 상태의 처리 대상에 대해 인식 처리를 수행하도록 지시하는 환경 인식 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  35. 제34항에 있어서, 상기 환경 인식 수단은 상기 제1 및 제2 상태가 단일 처리 대상으로부터 추출될때 상기 제1 및 제2 패턴 인식 수단으로 하여금 처리 대상에 대해 인식 처리를 수행하도록 지시하는 것을 특징으로 하는 패턴 인식 장치.
  36. 제34항에 있어서, 상기 환경 인식 수단은 상기 제1 및 제2 패턴 인식 수단에 의해 획득된 인식 결과에 대한 정확도를 나타내는 신뢰도를 산출하며, 이 신뢰도가 소정의 값보다 클때 최종 결과로서 상기 인식 결과를 출력하는 것을 특징으로 하는 패턴 인식 장치.
  37. 이미지를 취입하고 취입된 이미지로부터 문자 패턴을 검출하여 전처리를 수행하는 이미지 입력 수단과;
    문자가 삭제 라인이 없는 통상의 문자인지 또는 문자의 삭제를 나타내는 수평 라인을 포함하는 단순한 삭제 라인 또는 복잡한 형태의 복잡한 삭제 라인을 갖는 문자인지를 판별하는 삭제 라인 문자 판별 수단과;
    문자를 식별하는 식별 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  38. 제37항에 있어서, 상기 삭제 라인 문자 판별 수단은,
    복잡한 삭제 라인을 갖는 문자를 판별하는 복합한 삭제 라인 문자 판별 처리 수단과;
    상기 복잡한 삭제 라인 판별 수단이 복잡한 삭제 라인을 갖는 문자를 판별하지 못할때 그 삭제 라인이 제거된 대상이 문자로서 식별될 수 있는 지에 기초하여 단순한 삭제 라인을 갖는 것으로 판단된 단순한 삭제 라인 문자의 후보에 대하여 단순한 삭제 라인을 갖는 문자를 판별하는 단순 삭제 라인 문자 판별 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  39. 제37항에 있어서, 상기 삭제 라인 문자 판별 수단은,
    검출되고 전처리된 문자 패턴에 대해, 그래픽의 복잡도를 나타내는 복잡량과 대상 수평 주사 라인 및 대상 수평 주사 라인의 상하에 인접한 소정의 범위에 있는 라인의 흑화소가 가산되는 수평 방향의 인접 투영에 의해 획득된 화소수 히스토그램중의 적어도 하나를 포함하는 문자 형태 정보를 추출하는 문자 형태 정보 추출 수단과;
    상기 문자 형태 정보 추출 수단에 의해 추출된 문자 형태 정보에 따라 단순한 삭제 라인을 갖는 문자의 후보 또는 복잡한 삭제 라인을 갖는 문자의 후보를 판별하는 판별 수단과;
    적어도 단순한 삭제 라인을 갖는 문자에 대한 상기 후보로부터 삭제 라인을 제거한 후에 상기 식별 수단이 문자를 식별할 수 있을때 단순한 삭제 라인을 갖는 문자로 확정하는 삭제 라인 문자 확정 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  40. 제38항에 있어서, 상기 복잡한 삭제 라인 문자 판별 처리 수단은 그래픽의 복잡도를 나타내는 복잡량을 추출하는 복잡량 추출 수단과, 복잡한 삭제 라인을 갖는 문자를 판별하는 복잡한 삭제 라인 문자 판별 수단을 포함하며;
    상기 단순한 삭제 라인 문자 판별 수단은 대상 수평 주사 라인과 대상 수평 주사 라인의 상하로 인접한 소정의 범위에 있는 라인의 흑화소가 가산되는 수평 방향의 인접 투영에 의해 화소수를 산출하는 화소수 히스토그램 산출 수단과, 상기 산출된 화소수에 기초하여 단순한 삭제 라인 후보를 갖는 문자를 판별하는 단순 삭제 라인 문자 후보 판별 수단과, 판별된 단순한 삭제 라인을 갖는 문자의 후보로부터 삭제 라인을 제거한 후에 상기 식별 수단이 문자를 식별하면 단순 삭제 라인을 갖는 문자로 확정하는 단순 삭제 라인 문자 확정 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  41. 제40항에 있어서, 상기 단순 삭제 라인 문자 확정 수단은,
    판별된 단순한 삭제 라인을 갖는 문자 후보로부터 삭제 라인을 제거하는 삭제 라인 제거 수단과;
    상기 삭제 라인을 제거하기 전에 단순한 삭제 라인을 갖는 문자에 대한 후보를 저장하는 문자 후보 저장 수단과;
    단순한 삭제 라인을 갖는 문자에 대한 후보가 삭제 라인의 제거 후에 문자로서 식별될 수 있을때 단순한 삭제 라인을 갖는 문자의 후보를 단순한 삭제 라인을 갖는 문자로서 판정하며, 단순한 삭제 라인을 갖는 문자 후보가 문자로서 식별될 수 없을때 상기 문자 후보 기억 수단에 기억된 단순한 삭제 라인을 갖는 문자 후보를 통상 문자로 판정하며, 상기 판정 결과를 상기 식별 수단에 전달하는 삭제 라인 판정 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  42. 입력 패턴으로부터 제1 소정 특징을 추출하는 특징 추출 수단과;
    상기 제1 소정 특징이 추출된 입력 패턴으로부터 제2 소정 특징을 추출함으로써 입력 패턴을 인식하는 패턴 인식 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  43. 입력 패턴으로부터 제1 소정 특징을 추출하는 특징 추출 수단과;
    상기 제1 소정 특징이 추출되지 않은 입력 패턴으로부터 제2 소정 특징을 추출함으로써 입력 패턴을 인식하는 패턴 인식 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  44. 입력 패턴으로부터 제1 소정 특징을 추출하는 특징 추출 수단과;
    상기 제1 소정 특징이 추출된 입력 패턴으로부터 상기 제1 소정 특징에 기여하는 부분을 제거하는 제거 수단과;
    상기 제1 소정 특징에 기여하는 부분이 제거된 패턴에 기초하여 입력 패턴을 인식하는 패턴 인식 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  45. 입력 이미지로부터 제1 패턴을 추출하는 패턴 추출 수단과;
    상기 제1 패턴에 존재하는 제3 패턴을 제거함으로써 획득되는 제2 패턴을 생성하는 패턴 생성 수단과;
    상기 제2 패턴에 대해 인식 처리를 수행하는 패턴 인식 수단과;
    상기 패턴 인식 수단이 제2 패턴을 거부하면 제3 패턴을 제1 패턴의 성분으로 간주하는 판정 수단을 포함하는 것을 특징으로 하는 패턴 인식 장치.
  46. 입력 이미지로부터 처리 대상의 상태를 추출하는 단계와;
    상기 처리 대상을 위해 상기 상태에 적합한 인식 처리를 선택함으로써 패턴을 인식하는 단계를 포함하는 것을 특징으로 하는 패턴 인식 방법.
  47. 입력 이미지로부터 처리 대상의 상태를 추출하는 단계와;
    제1 상태의 처리 대상에 대해 제1 상태 전용으로 패턴 인식 처리를 수행하는 단계와;
    제2 상태의 처리 대상에 대해 제2 상태 전용으로 패턴 인식 처리를 수행하는 단계를 포함하는 것을 특징으로 하는 패턴 인식 방법.
  48. 이미지를 취입하고 취입된 이미지로부터 문자 패턴을 검출하여 전처리를 수행하는 단계와;
    검출되거나 전처리된 문자 패턴에 대해 문자가 삭제 라인이 없는 통상의 문자인지 또는 문자의 삭제를 나타내는 수평 라인을 포함하는 단순한 삭제 라인 또는 복잡한 형태의 복잡한 삭제 라인이 부여된 삭제 라인을 갖는 문자인지를 판별하는 단계와;
    삭제 라인 없는 통상의 문자를 식별하는 단계를 포함하는 것을 특징으로 하는 패턴 인식 방법.
  49. 이미지를 취입하고 취입 이미지로부터 문자 패턴을 검출하여 전처리를 수행하는 단계와;
    검출되거나 전처리된 문자 패턴에 대해 복잡한 삭제 라인이 부여된 문자인지를 판별하는 단계와;
    문자가 복잡한 삭제 라인을 갖는 문자가 아닌 것으로 판별되면 문자가 삭제 라인이 없는 통상의 문자인지 또는 문자의 삭제를 나타내는 수평 라인만을 포함하는 단순 삭제 라인을 갖는 문자인지를 판별하는 단계와;
    삭제 라인 없는 통상 문자를 식별하는 단계를 포함하는 것을 특징으로 하는 패턴 인식 방법.
  50. 이미지를 취입하며 취입된 이미지로부터 문자 패턴을 검출하여 전처리를 수행하는 단계와;
    검출되거나 전처리된 문자 패턴에 대해 복잡한 삭제 라인이 부여된 문자인지를 판별하는 단계와;
    검출되거나 전처리된 문자에 대해, 그 문자가 복잡한 삭제 라인을 갖는 문자가 아닌 경우, 대상 수평 주사 라인 및 대상 수평 주사 라인의 상하에 인접한 소정의 범위에있는 라인의 흑화소가 가산되는 수평 방향의 인접 투영에 의해 화소수 히스토그램을 산출하는 단계와;
    화소수 히스토그램에 기초하여 단순한 삭제 라인을 갖는 문자에 대한 후보를 판정하는 단계와;
    삭제 라인이 제거된 단순 삭제 라인을 갖는 문자에 대한 후보가 문자로서 식별될 수 있을때 단순한 삭제 라인을 갖는 문자로 확정하며, 상기 문자 후보가 문자로서 식별될 수 없을때 통상 문자로 확정하는 단계와;
    상기 확정된 통상 문자의 문자를 식별하는 단계를 포함하는 것을 특징으로 하는 패턴 인식 방법.
  51. 제50항에 있어서, 삭제 라인이 제거된 단순한 삭제 라인을 갖는 문자에 대한 후보가 문자로 식별될 수 있을때 단순한 삭제 라인을 갖는 문자로 확정하고, 상기 문자 후보가 문자로 식별될 수 없을때 통상 문자로 확정하는 단계와;
    문자가 단순한 삭제 라인을 갖는 문자 후보인지를 판정하는 단계와;
    문자가 단순한 삭제 라인을 갖는 문자 후보일때 삭제 라인을 제거하는 단계와;
    삭제 라인이 제거된 삭제 라인을 갖는 문자 후보가 문자로서 식별될 수 있는 지를 판정하며, 그 문자 후보가 문자로서 식별될 수 있을때 단순한 삭제 라인을 갖는 문자 후보로 확정하며, 그 문자 후보가 문자로서 식별될 수 없을때 통상 문자로 확정하는 단계와;
    상기 통상 문자의 식별시 상기 확정된 통상 문자가 문자로서 식별될 수 있는 지를 판정하는 단계와;
    상기 통상 문자가 문자로서 식별될 수 없을때 거부 코드를 출력하는 단계와;
    상기 통상의 문자가 문자로서 식별될 수 있을때 문자 종류 코드를 출력하는 단계와;
    문자에 삭제 라인이 제공될때 거부 코드를 출력하는 단계를 포함하는 것을 특징으로 하는 패턴 인식 방법.
  52. 입력 패턴으로부터 다수의 특징을 추출하는 단계와;
    상기 다수의 특징에 기초하여 입력 패턴에 대해 패턴 인식 처리를 수행하는 단계를 포함하는 것을 특징으로 하는 패턴 인식 방법.
KR1019970000322A 1996-01-09 1997-01-09 패턴인식장치및방법 KR100248917B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP00173096A JP3345246B2 (ja) 1996-01-09 1996-01-09 文字認識装置及び文字認識方法
JP96-001730 1996-01-09
JP96-255217 1996-09-27
JP25521796 1996-09-27

Publications (2)

Publication Number Publication Date
KR19980023917A KR19980023917A (ko) 1998-07-06
KR100248917B1 true KR100248917B1 (ko) 2000-03-15

Family

ID=26335003

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970000322A KR100248917B1 (ko) 1996-01-09 1997-01-09 패턴인식장치및방법

Country Status (3)

Country Link
US (4) US6104833A (ko)
KR (1) KR100248917B1 (ko)
CN (1) CN1156791C (ko)

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6519046B1 (en) * 1997-03-17 2003-02-11 Fuji Photo Film Co., Ltd. Printing method and system for making a print from a photo picture frame and a graphic image written by a user
JPH1196301A (ja) * 1997-09-22 1999-04-09 Hitachi Ltd 文字認識装置
JP3584458B2 (ja) * 1997-10-31 2004-11-04 ソニー株式会社 パターン認識装置およびパターン認識方法
US7130487B1 (en) * 1998-12-15 2006-10-31 Matsushita Electric Industrial Co., Ltd. Searching method, searching device, and recorded medium
CN1237476C (zh) * 1999-02-19 2006-01-18 株式会社理光 图形检测方法、图像处理控制方法、图像处理装置
JP4412762B2 (ja) * 1999-05-31 2010-02-10 富士通株式会社 点線抽出方法、その装置及びその記録媒体
US6563502B1 (en) 1999-08-19 2003-05-13 Adobe Systems Incorporated Device dependent rendering
JP3604993B2 (ja) * 2000-03-16 2004-12-22 シャープ株式会社 画像符号化装置、画像符号化方法、画像復号装置、および画像復号方法
EP1310904A4 (en) * 2000-06-02 2007-03-28 Japan Science & Tech Agency DOCUMENT PROCESSING METHOD, RECORDING MEDIA RECORDING A DOCUMENT PROCESSING PROGRAM AND DOCUMENT PROCESSOR
US7027649B1 (en) * 2000-11-27 2006-04-11 Intel Corporation Computing the Euler number of a binary image
US7598955B1 (en) 2000-12-15 2009-10-06 Adobe Systems Incorporated Hinted stem placement on high-resolution pixel grid
US6681060B2 (en) 2001-03-23 2004-01-20 Intel Corporation Image retrieval using distance measure
JP4846924B2 (ja) * 2001-05-31 2011-12-28 キヤノン株式会社 パターン認識装置
WO2002103617A1 (en) * 2001-06-15 2002-12-27 Koninklijke Philips Electronics N.V. Automatic natural content detection in video information
JP4100885B2 (ja) * 2001-07-11 2008-06-11 キヤノン株式会社 帳票認識装置、方法、プログラムおよび記憶媒体
JP3863775B2 (ja) * 2001-12-25 2006-12-27 株式会社九州エレクトロニクスシステム 画像情報圧縮方法及び画像情報圧縮装置並びに画像情報圧縮プログラム
CA2375355A1 (en) * 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
US7016529B2 (en) * 2002-03-15 2006-03-21 Microsoft Corporation System and method facilitating pattern recognition
JP2004145072A (ja) * 2002-10-25 2004-05-20 Riso Kagaku Corp 手書き文字フォント作成装置及び手書き文字フォント作成プログラム
US7227993B2 (en) * 2003-01-27 2007-06-05 Microsoft Corporation Learning-based system and process for synthesizing cursive handwriting
US20040146200A1 (en) * 2003-01-29 2004-07-29 Lockheed Martin Corporation Segmenting touching characters in an optical character recognition system to provide multiple segmentations
US20040151377A1 (en) * 2003-02-04 2004-08-05 Boose Molly L. Apparatus and methods for converting network drawings from raster format to vector format
US7606915B1 (en) 2003-02-25 2009-10-20 Microsoft Corporation Prevention of unauthorized scripts
US7624277B1 (en) * 2003-02-25 2009-11-24 Microsoft Corporation Content alteration for prevention of unauthorized scripts
JP4144395B2 (ja) * 2003-03-25 2008-09-03 ブラザー工業株式会社 画像処理装置およびそれを備えた画像形成装置
US7006107B2 (en) * 2003-05-16 2006-02-28 Adobe Systems Incorporated Anisotropic anti-aliasing
US7002597B2 (en) * 2003-05-16 2006-02-21 Adobe Systems Incorporated Dynamic selection of anti-aliasing procedures
JP2004348591A (ja) * 2003-05-23 2004-12-09 Canon Inc 文書検索方法及び装置
CN1303563C (zh) * 2003-09-29 2007-03-07 摩托罗拉公司 用于压缩手写字符模板的方法和系统
EP1703445A4 (en) * 2004-01-08 2011-07-27 Nec Corp CHARACTER RECOGNITION DEVICE, MOBILE COMMUNICATION SYSTEM, MOBILE TERMINAL DEVICE, FIXED STATION DEVICE, CHARACTER RECOGNITION METHOD, AND CHARACTER RECOGNITION PROGRAM
US7602995B2 (en) * 2004-02-10 2009-10-13 Ricoh Company, Ltd. Correcting image distortion caused by scanning
JP3861157B2 (ja) * 2004-02-27 2006-12-20 国立大学法人広島大学 参照データ最適化装置とパターン認識システム
JP2005251115A (ja) * 2004-03-08 2005-09-15 Shogakukan Inc 連想検索システムおよび連想検索方法
US7333110B2 (en) * 2004-03-31 2008-02-19 Adobe Systems Incorporated Adjusted stroke rendering
US7639258B1 (en) 2004-03-31 2009-12-29 Adobe Systems Incorporated Winding order test for digital fonts
US7602390B2 (en) * 2004-03-31 2009-10-13 Adobe Systems Incorporated Edge detection based stroke adjustment
US7580039B2 (en) * 2004-03-31 2009-08-25 Adobe Systems Incorporated Glyph outline adjustment while rendering
US7719536B2 (en) * 2004-03-31 2010-05-18 Adobe Systems Incorporated Glyph adjustment in high resolution raster while rendering
US8249309B2 (en) * 2004-04-02 2012-08-21 K-Nfb Reading Technology, Inc. Image evaluation for reading mode in a reading machine
JP4398777B2 (ja) * 2004-04-28 2010-01-13 株式会社東芝 時系列データ分析装置および方法
US7561738B2 (en) * 2004-09-22 2009-07-14 Microsoft Corporation Symbol grouping and recognition in expression recognition
US20060075392A1 (en) * 2004-10-05 2006-04-06 International Business Machines Corporation System and method for reverse engineering of pattern string validation scripts
JP3962748B2 (ja) * 2005-03-28 2007-08-22 キヤノン株式会社 情報処理装置及びその方法
US7724981B2 (en) * 2005-07-21 2010-05-25 Ancestry.Com Operations Inc. Adaptive contrast control systems and methods
JP4920928B2 (ja) * 2005-08-08 2012-04-18 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US20070127824A1 (en) * 2005-12-07 2007-06-07 Trw Automotive U.S. Llc Method and apparatus for classifying a vehicle occupant via a non-parametric learning algorithm
US7583841B2 (en) * 2005-12-21 2009-09-01 Microsoft Corporation Table detection in ink notes
US7664325B2 (en) * 2005-12-21 2010-02-16 Microsoft Corporation Framework for detecting a structured handwritten object
US7734092B2 (en) * 2006-03-07 2010-06-08 Ancestry.Com Operations Inc. Multiple image input for optical character recognition processing systems and methods
US7756340B2 (en) * 2006-07-11 2010-07-13 Pegasus Imaging Corporation Method and apparatus for identifying and/or removing combs from scanned images
JP4443576B2 (ja) * 2007-01-18 2010-03-31 富士通株式会社 パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
US7873215B2 (en) * 2007-06-27 2011-01-18 Seiko Epson Corporation Precise identification of text pixels from scanned document images
JP2009070226A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd マッチング装置
EP2223265A1 (en) * 2007-11-20 2010-09-01 Lumex As A method for resolving contradicting output data from an optical character recognition (ocr) system, wherein the output data comprises more than one recognition alternative for an image of a character
US8634645B2 (en) * 2008-03-28 2014-01-21 Smart Technologies Ulc Method and tool for recognizing a hand-drawn table
US7471826B1 (en) 2008-03-31 2008-12-30 International Business Machines Corporation Character segmentation by slices
US7809195B1 (en) * 2008-09-18 2010-10-05 Ernest Greene Encoding system providing discrimination, classification, and recognition of shapes and patterns
US8239435B2 (en) * 2008-11-04 2012-08-07 Seiko Epson Corporation Thresholding of image diffences maps using first and second two-dimenstional array wherein respective euler number is determined
JP5343617B2 (ja) * 2009-02-25 2013-11-13 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置
KR20100120753A (ko) * 2009-05-07 2010-11-17 (주)실리콘화일 문자인식을 위한 이미지 센서 및 이미지 센싱 방법
JP5586917B2 (ja) * 2009-10-27 2014-09-10 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
WO2011079432A1 (en) * 2009-12-29 2011-07-07 Nokia Corporation Method and apparatus for generating a text image
KR101214772B1 (ko) * 2010-02-26 2012-12-21 삼성전자주식회사 문자의 방향성을 기반으로 한 문자 인식 장치 및 방법
JP5591578B2 (ja) * 2010-04-19 2014-09-17 日本電産サンキョー株式会社 文字列認識装置および文字列認識方法
US9285983B2 (en) * 2010-06-14 2016-03-15 Amx Llc Gesture recognition using neural networks
US8737702B2 (en) * 2010-07-23 2014-05-27 International Business Machines Corporation Systems and methods for automated extraction of measurement information in medical videos
CN102375988B (zh) * 2010-08-17 2013-12-25 富士通株式会社 文件图像处理方法和设备
US8947736B2 (en) * 2010-11-15 2015-02-03 Konica Minolta Laboratory U.S.A., Inc. Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US9319556B2 (en) 2011-08-31 2016-04-19 Konica Minolta Laboratory U.S.A., Inc. Method and apparatus for authenticating printed documents that contains both dark and halftone text
JP6008076B2 (ja) * 2011-10-13 2016-10-19 セイコーエプソン株式会社 プロジェクター及び画像描画方法
KR102073024B1 (ko) * 2012-11-30 2020-02-04 삼성전자주식회사 사용자 단말에서 메모 편집장치 및 방법
JP2014127188A (ja) * 2012-12-27 2014-07-07 Toshiba Corp 整形装置及び方法
JP2014215877A (ja) * 2013-04-26 2014-11-17 株式会社デンソー 物体検出装置
KR101532652B1 (ko) * 2013-05-22 2015-06-30 재단법인대구경북과학기술원 영상 인식 계산 장치 및 그 방법
EP2818948B1 (en) * 2013-06-27 2016-11-16 ABB Schweiz AG Method and data presenting device for assisting a remote user to provide instructions
KR101526490B1 (ko) * 2013-10-25 2015-06-08 경희대학교 산학협력단 클라우드 컴퓨팅에서의 효율적 자원관리를 위한 시각 데이터 가공장치 및 그 방법
KR20150049700A (ko) * 2013-10-30 2015-05-08 삼성전자주식회사 전자 장치에서 입력을 제어하는 방법 및 장치
US9928572B1 (en) 2013-12-20 2018-03-27 Amazon Technologies, Inc. Label orientation
CN104978782B (zh) * 2014-04-11 2017-09-19 南京视察者图像识别科技有限公司 基于触屏技术的客流分析方法
JP6045752B2 (ja) * 2014-05-14 2016-12-14 共同印刷株式会社 二次元コード、二次元コードの解析システム及び二次元コードの作成システム
CN104156694B (zh) * 2014-07-18 2019-03-19 百度在线网络技术(北京)有限公司 一种用于识别图像中的目标对象的方法与设备
JP2016153933A (ja) * 2015-02-20 2016-08-25 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、プログラム、及び記録媒体
JP6390501B2 (ja) * 2015-04-15 2018-09-19 京セラドキュメントソリューションズ株式会社 学習支援装置および学習支援方法
JP6705237B2 (ja) * 2016-03-18 2020-06-03 株式会社リコー 画像圧縮装置、画像形成装置、画像圧縮方法およびプログラム
JP2017215807A (ja) * 2016-05-31 2017-12-07 富士ゼロックス株式会社 プログラムおよび情報処理装置
US10372980B2 (en) * 2016-11-16 2019-08-06 Switch, Inc. Electronic form identification using spatial information
JP2018112839A (ja) * 2017-01-10 2018-07-19 富士通株式会社 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法
US11004205B2 (en) * 2017-04-18 2021-05-11 Texas Instruments Incorporated Hardware accelerator for histogram of oriented gradients computation
JP2019139592A (ja) * 2018-02-13 2019-08-22 シャープ株式会社 文字認識装置、文字認識方法
US10565443B2 (en) * 2018-02-16 2020-02-18 Wipro Limited Method and system for determining structural blocks of a document
GB2571530B (en) * 2018-02-28 2020-09-23 Canon Europa Nv An image processing method and an image processing system
JP7259491B2 (ja) * 2019-04-01 2023-04-18 富士フイルムビジネスイノベーション株式会社 画像処理装置及びプログラム
WO2021054850A1 (ru) * 2019-09-17 2021-03-25 Публичное Акционерное Общество "Сбербанк России" Способ и система интеллектуальной обработки документа
CN110968667B (zh) * 2019-11-27 2023-04-18 广西大学 一种基于文本状态特征的期刊文献表格抽取方法
JP7484198B2 (ja) * 2020-02-03 2024-05-16 富士フイルムビジネスイノベーション株式会社 文書処理装置およびプログラム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057477A (ja) 1983-09-08 1985-04-03 Fuji Xerox Co Ltd パタ−ン認識装置
US5253303A (en) * 1988-02-15 1993-10-12 Nec Corporation Character recognizing method and apparatus thereof
WO1990001198A1 (en) * 1988-07-20 1990-02-08 Fujitsu Limited Character recognition apparatus
JPH0772906B2 (ja) * 1991-07-10 1995-08-02 富士ゼロックス株式会社 文書認識装置
EP0831418B1 (en) * 1991-10-21 2002-03-13 Canon Kabushiki Kaisha Method and apparatus for character recognition
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
DE69328640T2 (de) * 1992-02-07 2000-09-28 Canon Kk Verfahren und Einrichtung zur Mustererkennung
US5481621A (en) * 1992-05-28 1996-01-02 Matsushita Electric Industrial Co., Ltd. Device and method for recognizing an image based on a feature indicating a relative positional relationship between patterns
JP2951814B2 (ja) * 1993-02-25 1999-09-20 富士通株式会社 画像抽出方式
JP3250317B2 (ja) * 1993-04-20 2002-01-28 富士通株式会社 文字認識装置
US5761340A (en) * 1993-04-28 1998-06-02 Casio Computer Co., Ltd. Data editing method and system for a pen type input device
JP2933801B2 (ja) * 1993-06-11 1999-08-16 富士通株式会社 文字の切り出し方法及びその装置
JP3269889B2 (ja) 1993-09-03 2002-04-02 沖電気工業株式会社 光学式文字読取システム
JPH07160827A (ja) * 1993-12-09 1995-06-23 Matsushita Electric Ind Co Ltd 手書きストローク編集装置及び方法
US5745599A (en) * 1994-01-19 1998-04-28 Nippon Telegraph And Telephone Corporation Character recognition method
JP3453422B2 (ja) * 1994-02-10 2003-10-06 キヤノン株式会社 文字パターンのユーザ辞書への登録方法及び該ユーザ辞書を有する文字認識装置
US5470313A (en) * 1994-02-24 1995-11-28 Cardiovascular Dynamics, Inc. Variable diameter balloon dilatation catheter
JP3400151B2 (ja) * 1994-12-08 2003-04-28 株式会社東芝 文字列領域抽出装置および方法
JPH08221576A (ja) * 1994-12-12 1996-08-30 Toshiba Corp 文字列における直線検出方式、直線除去方式および宛名領域判別装置
JP3437296B2 (ja) * 1994-12-16 2003-08-18 富士通株式会社 文字列高速抽出装置
JP2817646B2 (ja) * 1995-02-01 1998-10-30 日本電気株式会社 文書編集装置
US6512848B2 (en) * 1996-11-18 2003-01-28 Canon Kabushiki Kaisha Page analysis system

Also Published As

Publication number Publication date
US20030113016A1 (en) 2003-06-19
US6104833A (en) 2000-08-15
US6687401B2 (en) 2004-02-03
CN1156791C (zh) 2004-07-07
US6850645B2 (en) 2005-02-01
CN1162795A (zh) 1997-10-22
US6335986B1 (en) 2002-01-01
US20020061135A1 (en) 2002-05-23
KR19980023917A (ko) 1998-07-06

Similar Documents

Publication Publication Date Title
KR100248917B1 (ko) 패턴인식장치및방법
US7120318B2 (en) Automatic document reading system for technical drawings
US8442319B2 (en) System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
Shafait et al. Performance evaluation and benchmarking of six-page segmentation algorithms
Manmatha et al. A scale space approach for automatically segmenting words from historical handwritten documents
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
JP2973944B2 (ja) 文書処理装置および文書処理方法
Lee et al. Binary segmentation algorithm for English cursive handwriting recognition
JPH08305796A (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
Filipski et al. Automated conversion of engineering drawings to CAD form
US6246793B1 (en) Method and apparatus for transforming an image for classification or pattern recognition
CN112241730A (zh) 一种基于机器学习的表格提取方法和系统
Rane et al. Chartreader: Automatic parsing of bar-plots
JP2007058882A (ja) パターン認識装置
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
Boraik et al. Characters segmentation from Arabic handwritten document images: hybrid approach
ALshebeili et al. Arabic character recognition using 1-D slices of the character spectrum
JP4176175B2 (ja) パターン認識装置
Nath et al. Improving various offline techniques used for handwritten character recognition: a review
RU2582064C1 (ru) Способы и системы эффективного автоматического распознавания символов с использованием леса решений
JP2007026470A (ja) パターン認識装置
Amin Recognition of printed Arabic text using machine learning
JP7404625B2 (ja) 情報処理装置、及びプログラム
JP2592756B2 (ja) 文字切り出し装置およびこれを用いた文字認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111202

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20121130

Year of fee payment: 14

LAPS Lapse due to unpaid annual fee