KR100211856B1 - 패턴 추출장치, 패턴 재인식 테이블작성장치, 및 패턴 인식장치 - Google Patents

패턴 추출장치, 패턴 재인식 테이블작성장치, 및 패턴 인식장치 Download PDF

Info

Publication number
KR100211856B1
KR100211856B1 KR1019960005703A KR19960005703A KR100211856B1 KR 100211856 B1 KR100211856 B1 KR 100211856B1 KR 1019960005703 A KR1019960005703 A KR 1019960005703A KR 19960005703 A KR19960005703 A KR 19960005703A KR 100211856 B1 KR100211856 B1 KR 100211856B1
Authority
KR
South Korea
Prior art keywords
character
pattern
line
recognition
image
Prior art date
Application number
KR1019960005703A
Other languages
English (en)
Other versions
KR960035329A (ko
Inventor
마키 야부키
사토시 나오이
Original Assignee
아끼구사 나오유끼
후지쓰 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아끼구사 나오유끼, 후지쓰 가부시끼가이샤 filed Critical 아끼구사 나오유끼
Publication of KR960035329A publication Critical patent/KR960035329A/ko
Application granted granted Critical
Publication of KR100211856B1 publication Critical patent/KR100211856B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

문자박스추출부는 문자박스를 형성하는 선을 추출한다. 다음에, 문자박스교점산출부는 문자박스와 문자패턴과의 교점을 산출한다. 교점대응부는 문자선의 방향성, 문자선간의 거리등에 근거하여 서로의 교점을 대응시킨다. 박스내 문자추출부는 교점간의 대응정보에 따라 가상화상을 추출한다. 문자크기평가부는 가상화상을 포함하는 문자의 평균문자크기를 선택하는 문자열에서 구하여, 평균문자크기에 근거하여 용장의 가상화상에 대응하는 실제 화상을 작성된 테이블에서 구하여, 문자패턴을 추출하는 것에 의하여, 선이패턴과 교차하는 화상에서 패턴이 정확히 추출된다.

Description

패턴 추출장치, 패턴재인식 테이블 작성장치, 및 패턴인식장치
제1도는 종래의 화학추출장치의 구성을 도시한 블럭도.
제2도는 종래의 문자인식장치의 구성을 도시한 블럭도.
제3(a), 3(b), 및 3(c)도는 제2도에 도시한 종래의 문자인식장치에 문자를 보완하는 방법을 도시한 도.
제4(a), 4(b), 4(c) 및 4(d)도는 제2도에 도시한 종래의 문자인식장치에 문자를 보완하는 방법을 도시한 도.
제5(a)도 및 제5(b)도는 가는선(fine-line)처리의 문제를 도시한 도.
제6도는 성공적으로 추출한 문자박스에서 종래기술을 방지하는 문제를 도시한 도.
제7(a), 7(b) 및 7(c)도는 제2도에 도시한 종래의 문자인식장치에 문자를 보완하지 않는 예를 도시한 도.
제8도는 본 발명의 제1의 원리를 도시한 도.
제9도는 본 발명의 제2의 원리를 도시한 도.
제10도는 본 발명의 제3의 원리를 도시한 도.
제11도는 본 발명의 제4의 원리를 도시한 도.
제12도는 본 발명의 제5의 원리를 도시한 도.
제13도는 본 발명의 제6의 원리를 도시한 도.
제14도는 본 발명의 제7의 원리를 도시한 도.
제15도는 본 발명의 제8의 원리를 도시한 도.
제16도는 본 발명의 제9의 원리를 도시한 도.
제17도는 본 발명의 제10의 원리를 도시한 도.
제18도는 본 발명의 제11의 원리를 도시한 도.
제19도는 본 발명의 제12의 원리를 도시한 도.
제20도는 본 발명의 제13의 원리를 도시한 도.
제21도는 본 발명의 제14의 원리를 도시한 도.
제22도는 본 발명에 의한 화상추출장치의 구성을 도시한 도.
제23(a), 23(b), 및 23(c)도는 본 발명에 의해 처리되는 각 문자박스의 형태를 도시한 도.
제24도는 문자박스추출부의 제1실시예를 도시한 블럭도.
제25도는 라벨링(labeling)처리로 종횡방향으로 링크(link)패턴 추출부으로 얻어진 부분패턴의 투영을 도시한 도.
제26도는 문자박스의 성분을 도시한 도.
제27(a)도 및 제27(b)도는 각각 굵은선과 가는선에서의 문자박스의 예를 도시한 도.
제28도는 n선의 런(run)길이를 도시한 도.
제29도는 교점산출부의 구성예를 도시한 도.
제30도는 문자박스 분리부의 구성예를 도시한 도.
제31(a)도 및 제31(b)도는 굵은선과 가는선으로 문자박스를 형성하는 골격선, 외부테두리, 내부테두리 및 선두께를 도시한 도.
제32도는 본 실시예에 의한 좌표계를 도시한 도.
제33도는 3개의 교점산출부의 구성예를 도시한 도.
제34도는 2개의 교점산출부의 구성예를 도시한 도.
제35도는 문자가 동일한 방향을 표시할때의 문자와 문자박스와의 교점간의 대응관계를 도시한 도.
제36도는 문자가 다른 방향을 표시할때의 문자와 문자박스와의 교점간의 대응관계를 도시한 도.
제36도는 문자가 다른 방향을 표시할때의 문자와 문자박스와의 교점간의 대응관계를 도시한 도.
제37도는 3개의 교점대응부의 예를 상세히 도시한 흐름도.
제38(a), 38(b) 및 38(c) 또는 제38도에 도시한 흐름도에 따라 문자박스를 형성하는 선의 교점이 문자와 문자박스를 형성하는 선과의 교점에 대응하는 예를 도시한 도.
제39(a)도 및 제39(b)도는 제38도에 도시한 흐름도에 따라 문자박스를 형성하는 선의 교점에 대응하지 않는 예를 도시한 도.
제40도는 2개의 교점대응부으로 행한 처리예를 상세히 도시한 흐름도.
제41(a)도 및 제41(b)도는 문자박스내의 문자추출부에 의해 문자의 일부를 형성하는 가상선으로서 추출된 패턴의 예를 도시한 도.
제42도는 문자박스내의 문자추출부으로 행한 처리예를 상세히 도시한 흐름도.
제43도는 문자박스내의 문자보간부의 구성예를 도시한 도.
제44(a)도 및 제44(b)도는 일 대 일 단순 보간의 예를 도시한 도.
제45도는 단순보간부으로 행한 처리예를 상세히 도시한 흐름도.
제46(a)도 및 제46(b)도는 교점차에서의 보간예를 도시한 도.
제47도는 교차점 산출부으로 행한 처리예를 상세히 도시한 흐름도.
제48도는 내부교차점 보간부으로 행한 처리예를 상세히 도시한 흐름도.
제49도는 외부교차점 보간부으로 행한 처리예를 상세히 도시한 흐름도.
제50도는 선보간부으로 행한 처리예를 상세히 도시한 흐름도.
제51도는 대응을 규정지을 수 없는 교점에 대하여 선보간부으로 행한 처리예를 상세히 도시한 흐름도.
제52도는 평균크기산출부으로 행한 처리예를 상세히 도시한 흐름도.
제53도는 문자크기산정부으로 행한 처리예를 도시한 흐름도.
제54도는 최대 및 최소문자크기를 도시한 도.
제55(a), 55(b) 및 55(c)도는 국소대응을 갖는 부분과 국소대응을 갖지 않는 부분에 대한 문자패턴의 예를 도시한 도.
제56(a), 56(b) 및 56(c)도는 제47도에 도시한 문자패턴을 문자크기산정부에 의하여 정확히 검색(retrieve)하는 예를 도시한 도.
제57(a), 57(b) 및 57(c)도는 다수개의 문자가 오버행(overhang)으로 1개의 문자로서 검색되는 것을 쉽게 방지하는 예를 도시한 도.
제58도는 문자구조 분석 산정부으로 행한 처리예를 도시한 도.
제59도는 문자구조정의 테이블의 예를 도시한 도.
제60도는 8개로 형상된 허상의 문자일부를 형성하는 가상선의 구조를 도시한 도.
제61(a)도 및 제61(b)도는 허상이 N개로 형상된 경우에 문자를 정확히 검색하는 예를 도시한 도.
제62(a)도 및 제62(b)도는 허상이 반전된 N개로 형상된 경우에 문자를 정확히 검색하는 예를 도시한 도.
제63(a)도 및 제63(b)도는 8개로 형상된 허상으로서 나타나는 것 같은 선 접촉문자의 예를 도시한 도.
제64(a)도 및 제64(b)도는 제63도에 도시한 선 접촉문자를 정확히 검색하는 예를 도시한 도.
제65도는 문자가 문자박스를 접촉할때의 선 접촉부의 확대도.
제66도는 문자구조 분석산정부에 의하여 허상의 형태를 판정하는 처리를 도시한 흐름도.
제67도는 제65도에 도시한 바와 같은 교점대응부에 의해 연결된 4개의 교점중에서의 대응관계를 도시한 도.
제68도는 제67도에 도시한 바와 같이 결합된 8개의 형상화된 허상에서 문자의 일부를 형성하는 실선을 추출하는 처리를 도시한 흐름도.
제69(a), 69(b), 및 69(c)도는 문자박스의 오버행 상태에서 수서(手書)된 문자 5와 1을 정확히 검색하는 예를 도시하는 도.
제70(a), 70(b), 70(c) 및 70(d)도는 오버행 상태에서 N개의 형상화된 허상의 일부를 형성하는 2개의 수서문자를 검색하는 예를 도시한 도.
제71도는 오버행 상태에서 8개의 형상화된 허상의 일부를 형성하는 2개의 수서문자를 검색하는 예를 도시한 도.
제72(a)도 및 제72(b)도는 문자박스의 일부를 형성하는 선의 테두리에서 문자와 문자박스와의 2개 및 3개의 교점을 갖는 선 접촉문자의 확대도.
제73도는 제72도에 도시한 형태의 허상 테이블의 구성을 도시한 도.
제74(a)도 및 제74(b)도는 제73도에 도시한 테이블에 다수개의 구조를 규정하는 경우에 대한 단일 판정조건을 도시한 도.
제75도는 문자박스의 일부를 형성하는 선의 양테두리에서 문자와 문자박스와의 교점 3개를 갖는 선 접촉문자의 확대도.
제76도는 제75도에 도시한 구조의 허상테이블의 제1구성을 도시한 도.
제77도는 제75도에 도시한 구조의 허상테이블의 제2구성을 도시한 도.
제78도는 제75도에 도시한 구조의 허상테이블의 제3구성을 도시한 도.
제79도는 본 발명의 실시예에 의한 제1신뢰도 테이블 작성장치의 구성을 도시한 블럭도.
제80도는 본 발명의 실시예에 의한 제1문자인식장치의 구성을 도시한 블럭도.
제81도는 본 발명의 실시예에 의한 제2신뢰도 테이블 작성장치의 구성을 도시한 블럭도.
제82도는 선 접촉문자의 생성방법을 도시한 도.
제83(a), 83(b), 83(c), 83(d), 83(e) 및 83(f)도는 선 접촉문자의 생성예를 도시한 도.
제84도는 제81도에 도시한 신뢰도 테이블 작성장치에 의해 생성된 신뢰도 테이블의 일반적인 구성을 도시한 도.
제85도는 신뢰도 테이블에 기입된 변화와 변화량의 다른예를 도시한 도.
제86(a)도 및 제86(b)도는 재인식방법으로서 영역을 강조하는 예를 도시한 도.
제87(a), 87(b) 및 87(c)도는 문자 2가 선 접촉문자일때의 보간 패턴을 에워싸는 직사각형을 얻는 방법을 도시한 도.
제88도는 본 발명의 실시예에 의한 제2문자인식장치의 구성을 도시한 블럭도.
제89도는 제81도에 도시한 문자재인식부의 동작예를 도시한 흐름도.
제90도는 제88도에 도시한 재인식부의 예를 도시한 흐름도.
본 발명은 패턴추출장치에 관한 것으로서, 특히 수서문자인식장치 뿐만 아니라 인쇄문자인식장치에 저장된 문자와 기호를 검색하고 대상물체에서의 선, 문자에서의 그림등을 분리함으로써 직선 문자, 그림등의 각종의 패턴의 조합에서 패턴을 추출하는 패턴추출장치에 관한 것이다.
즉, 본 발명은 예를 들면 수서문자인식장치, 예로서 광학문자판독기등에 저장된 접촉하는 문자박스, 선등에서 문자, 도형등의 패턴을 추출하는 패턴추출장치에 관한 것이다.
최근에, 수서문자인식장치는 수서문자 입력/출력 장치로서 요망되어 왔다. 이러한 수서문자인식장치에서 개개의 문자를 정확히 인식하기 위하여는, 문자를 인식하기 위한 선처리로서 문자를 정확히 검색하는 것이 중요하다.
문자위치, 영역등을 리스트, 테이블등에 초기에 지정하는 문서에 문자가 인식된다. 이러한 문서에서는, 박스를 초기에 인쇄하여 글자의 색과 같은 색 또는 짙은색등의 드롭 아웃 칼라(drop-out color)가 아닌 논드롭 아웃 칼라(non drop-out color)로 글자의 위치를 나타낸다. 그 결과, 논드롭 아웃 칼라로 인쇄된 문서에서는, 문자가 블랙 프레임 박스에 의해 확인되는 입력문자의 지정영역에 포함되도록 문자를 산뜻하게 쓰는 경우에만 문자를 고인식률로 자동인식 할 수가 있다. 그러나, 문자가 지정된 영역상에 쓰여지거나 입력문자 위치를 확인하는 선에 접촉하는 경우에는, 인식율이 상당히 저하된다.
그러므로, 인식율을 향상시키기 위하여는, 문자위치를 논드롭 아웃 칼라에 의해 확인하는 리스트, 테이블등에서의 정확한 검색을 위해 접촉선, 박스등에서 문자, 그림, 기호등만을 추출하여야 한다.
본 발명의 출원인은 일본특허청에 제출된 평 5-103257에 제1도에 도시한 제1화상추출시스템을 개시하였다. 이 시스템으로 처리되는 입력패턴은 극도의 사선, 회전등을 제거하기 위해 수정되고 노이즈, 낮은 스포트(spot)등을 제거하기 위해 선처리되는 2치 화상이다. 그래서, 문자박스는 예를 들면 입력패턴에 의한 짙은 칼라 문자박스를 가진 리스트와 테이블에서 제거된다. 예를 들면, 다수의 1열 문자박스가 제공된다. 박스중 몇개는 크기, 위치 또는 사선이 정의되어 있지 않다. 이들 박스에 문자를 수서하면, 문자가 박스에 접촉하거나 선과 부분적으로 중첩하더라도 박스만을 제거할 수가 있다.
제1도에 도시한 바와 같이, 제1화상추출시스템은 링크패턴추출부 1, 선검출부 2, 직선검출부 3, 박스검출부 4, 및 박스분리부 5로 구성되어 있다. 링크패턴추출부 1은 박스, 선등으로 이루어지는 직선부와 그래프, 문자 또는 기호로 구성되는 입력패턴에서 화소를 연결한 링크패턴을 추출하는 것이다. 선검출부 2는 가는선 처리를 포함하고 링크패턴의 소정의 길이에 대해 직선일부 또는 파선을 검출한다. 직선검출부 3은 얻어진 직선일부 또는 파선을 통합함으로써 긴 직선을 검출한다. 박스검출부 4는 예를 들면 얻어진 직선간의 간격을 인식함으로써 문자박스의 일부를 형성하는 직선을 추출한다. 박스분리부 5는 추출된 직선의 교점을 얻고, 문자박스를 교점정보에 따라 각각 1개의 문자를 포함하는 다수개의 보다 작은 문자박스로 분할하여, 보다 작은 문자박스를 형성하는 선의 두께를 산출한다. 그 다음에, 문자박스를 형성하는 선의 두께에 근거하여 링크패턴으로 부터 문자박스를 분리한다.
입력패턴에서 제거되는 문자박스가 상술한 문자박스와는 다른 박스에 대하여는, 일본특허 소 62-212888, 평 3-126186에 의해 개시된 바와 같은 문자박스추출법도 제안되어 있다. 이들 문자박스추출법에 있어서는, 위치, 크기 등에 관련한 형태정보와 사선에 대한 다른 정보를 목록 데이타로서 입력하여 저장한다. 이 저장된 정보에 근거하여 문자박스를 제거한다.
제1화상추출시스템 이외에, 본 출원인은 또한 접촉하는 문자박스에서 문자만을 추출하기 위하여 일본 특허청에 제출된 평 6-309498에 제2화상추출시스템을 개시하였다.
제2도는 이 시스템의 전체구성을 도시한 블럭도이다.
제2도에서, 문자박스추출부 11은 문자박스를 접촉하는 문자(선 접촉문자)의 2치화상에서 문자박스만을 추출하여 문자박스를 제거한다.
이 처리에서, 선 접촉문자의 일부를 형성하는 선의 선 접촉부는 낮은 스포트를 나타냄으로써 문자의 일부를 형성하는 선중 파선을 나타낸다.
예를 들면, 제3(a)도에 도시한 라벨 1로 연결된 3의 2치 화상은 제3(b)도에 도시한 바와 같이 문자박스 21의 추출과 제거의 결과로서 문자의 일부를 형성하는 3개의 파선으로 분할된다. 3개의 파선은 라벨 1, 2 및 3으로 할당된다. 제4(a)도에 도시한 라벨 1로 연결된 7의 2치 화상은 제4(b)도에 도시한 바와 같이 문자박스 23의 추출과 제거의 결과로서 문자의 일부를 형성하는 3개의 파선으로 분할된다. 3개의 파선은 라벨 1, 2 및 3으로 할당된다.
보간부 12는 기하학구조, 예를 들면 문자의 일부를 형성하여 라벨로 할당되는 선의 방향과 그 사이의 틈을 산정한 후에 필요한 요소를 보간한다.
그래서, 제3(b)도에 도시한 바와 같이 그 선 접촉부에서 파단된 3의 2치 화상을 보완할 수 있어서, 제3(c)도에 도시한 바와 같이 라벨 1을 가진 문자 3이 완성된다. 제4(b)도에 도시한 바와 같이 그 선 접촉부에서 파단된 7의 2치 화상을 보완한다. 그러나, 제4(c)도에 도시한 바와 같이 라벨 1과 3의 선 사이가 아닌 라벨 1과 2의 선 사이에서만 필요한 요소를 보간한다. 그 결과, 문자 7은 제4(c)도에 도시한 바와 같이 라벨 1과 2의 2개의 파선으로서 분할된 상태로 있는다.
재보간부 13은 문자가 문자박스를 형성하는 선과 평행하게 바로 접촉하는 선을 갖는 경우에 필요한 요소를 문자의 일부를 형성하는 파선으로 보간한다. 이 처리에서, 선접촉문자에 할당된 라벨에 의한 연결에 따라 일시적으로 추출되고, 상술한 선접촉문자의 연결과 보간부 12에 의해 보간된 패턴과의 일치를 검출하여 문자박스를 형성하는 선에 평행하여 접촉하는 필요한 선을 보간한다.
그래서, 제4(c)도에 도시한 바와 같이 라벨 1과 2의 2개의 파선으로 분할된 2치 화상 7이 제4(d)도에 도시한 문자로 완성될 수가 있다.
그 결과, 선접촉문자는 문자박스의 제거후에 보간부 12 또는 재보간부 13에 의해 복원될 수가 있다.
보간부 12와 재보간부 13에 의해 각각 출력된 보완 및 재보완 패턴이 인식부 14에 입력된다. 인식부 14는 다수의 문자 카페고리 사전을 비교하여서, 보완 또는 재보완된 패턴에서 가장 작은 차를 나타내는 문자 카페고리의 코드를 출력한다. 즉, 제4도에 도시한 예에서, 제4(c)도에 도시한 패턴이 루(リ)의 문자 카페고리에 속하다는 것이 인식된다. 마찬가지로, 제4(d)도에 도시한 패턴이 7의 문자 카페고리에 속하다는 것이 인식된다. 그 다음에, 7이 보다 작은 차를 나타내고, 문자가 7로서 최종 인식되며, 7의 문자코드가 출력된다는 것이 판정된다.
그러나, 본 발명에 의해 개시된 제1화상추출시스템은 다음같은 문제점이 있으므로, 더 개선되어야 할 필요가 있다. 첫번째 문제점은 문자박스가 1개의 문자를 포함하지 않거나 문자열을 포함할때, 즉 문자박스가 목록식으로 또는 자유형태으로 설계될때 문자박스가 성공적으로 추출될 수 없다는 것이다. 두번째 문제점은 선검출부 2가 가는선 처리를 행하기 위한 가는선 처리를 포함함으로써 긴 처리시간이 소요된다는 것이다. 더우기, 가는선 처리는 원화상의 선형화를 해친다. 그러므로, 제5(a)도에 도시한 바와 같이 문자박스를 형성하는 선을 부분적으로 중첩하는 6의 원화상에 가는선 처리를 행하면, 출력패턴이 제5(b)도에 도시한 바와 같은 곡선의 조합을 나타낸다. 문자박스가 직선으로 검출될 수가 없으므로, 정확히 추출될 수가 없다. 세번째 문제점은 파선의 검출시에 문자박스가 1개의 문자박스 또는 1조의 문자박스로서 인식되지 않아 다음의 처리가 중단되기 때문에 문자가 문자박스를 형성하는 다수개의 인접선에 접촉할때 문자박스를 추출할 수 없다는 것이다. 네번째 문제점은 문자박스의 원화상의 부분패턴을 추적하여 문자박스를 추출하기 때문에 정확한 시작점에서 검색이 시작되지 않는 경우에 문자박스를 검색하지 못한 후에 문자박스를 정확히 추출할 수 없다는 것이다.
네번째 문제점을 제6도에 도시한 예를 참조하여 이하 설명한다. 아래쪽으로 향하여 부분패턴을 검색할 수가 있다. 아래쪽의 검색이 밑바닥에 도달하였을 경우에는, 예를 들면 문자박스를 형성하는 선의 두께에 대응하는 소정수의 화소에 의해 좌측방향 또는 우측방향으로 검색을 한다. 그러므로, 검색이 A점에서 시작할때는, 제26도에 화살표 26으로 표시한 바와 같이 양호한 상태에서 검색을 한다. 그러나, 검색이 B점에서 시작하면, 아래쪽에서 부분패턴의 검색을 할 수가 없다.
부분패턴이 하부영역에 존재하지 않기 때문에 제6도에 도시한 화살표 27을 사용하여 성공적으로 검색할 수가 없다. 그 결과, 검색이 B점에서 시작하는 경우에는 문자박스를 추출할 수가 없다.
상술한 일본특허 소 62-212888과 평 3-126186의 공보에 의해 개시된 문자박스추출법으로는, 문자박스가 테이블 형태에서 1조의 문자박스이더라도 추출될 수가 없다. 그러나, 위치, 크기, 사선등의 형태정보를 목록 데이타로서 임시적으로 입력하여 저장할 수 있으므로, 이 방법은 문자박스에 의해 이루어진 요철면 또는 약간의 경사에 영향을 받는 문제점이 있다. 그러므로, 소정위치에서 약간 벗어난 문자박스를 문자로서 인식할 수가 있고 문자박스로서 추출할 수가 없다. 그렇지 않으면, 문자가 문자박스의 일부로서 추출될 수도 있다. 더우기, 사용자가 목록에 모든 문자박스에 대한 정보를 입력하는 것이 요구되므로, 입력과정이 장시간 요하고 사용자에게 큰 부담감을 주게 된다.
상술한 제2화상추출시스템은 다음같은 문제점이 있다.
이 방법에서는, 상술한 바와 같이, 인식부 14가 각종의 문자 카테고리 사전에 입력된 표준패턴과 보완패턴 또는 재보완 패턴을 비교하여, 인식결과로서 가장 작은 차를 나타내는 문자코드를 출력한다. 이 예에서, 보간부 12 또는 재보간부 13은 각각 필요한 요소를 선접촉문자에 보간 또는 재보간한다. 운좋은 경우에는, 문자의 일부를 형성하는 파선을 문자박스를 접촉하는 부분에 의해 보완할 수가 있다. 그러나, 운나쁜 경우에는, 파선을 보완할 수가 없다. 제7도는 이러한 예를 도시한 것이다.
제7(a)도에 도시한 바와 같이, 문자패턴 2의 하부선은 문자박스 29를 접촉하고 선접촉부는 거의 완전히 문자박스 29에 접한다. 이 경우에, 문자박스추출부 11은 제7(b)도에 도시한 바와 같이 문자박스 29를 제거하고 2의 문자패턴을 라벨 1과 2의 부분패턴으로 분할한다. 그 다음에, 보간부 12는 2개의 부분패턴을 연결하여 제7(c)도에 도시한 바와 같이 라벨 1의 패턴으로 한다. 문자 2를 형성하는 하부선이 보완되지 않으므로, 인식부 14가 2가 아닌 7로서 잘못하여 제7(c)도에 도시한 패턴을 인식할 가능성이 있다.
선접촉문자의 일부가 문자박스의 선에 걸쳐 쓰여지지 않으면, 선접촉부가 보간부 12 또는 재보간부 13에 의해 보완될 수가 없다. 그 결과, 인식부 14가 선접촉문자를 정확히 인식하는 것이 거의 불가능하다.
그러므로, 일본특허청에 제출된 평 3-122786의 광학문자판독장치는 문자박스를 제거한 후에 문자박스에 쓰여진 문자 또는 선접촉문자에 대한 부분패턴을 저장함으로써 사전을 사용하여 선접촉문자를 인식하는 시스템을 개시하였다. 그러나, 상당수의 접속상태가 문자와 그 문자박스사이에 있는 것으로 추정될 수 있으므로, 모든 문자에 대한 모든 부분패턴을 저장할 수 없다. 인식율을 개선시키면 극도로 커지게 되는 사전의 기억용량으로 비용이 증가하게 된다. 더우기, 저장되는 부분패턴의 수가 제한되기 때문에 인식율의 개선이 제한된다. 사전에 저장된 부분패턴의 수의 증가에 따라, 사전에 대한 액세스시간도 증가하여 인식속도가 저하된다.
일본특허청에 제출된 평 6-62044의 광학문자판독장치에는 문자박스영역 또는 언더라인(underline) 영역을 제거하고 사전에 저장된 각 문자 카테고리의 표준문자에 대한 이원패턴정보와 문자패턴을 비교함으로써 문자를 인식하는 시스템을 개시하였다. 이 방법에서는, 제7a도와 제7b도에 예로 도시한 바와 같이, 선접촉부가 제거되어 나머지 문자패턴이 다른 문자 카테고리와 유사한 경우에 문자를 정확히 인식할 수가 없다. 이 시스템에서는, 문자를 인식할때 언더라인 영역 또는 문자박스 영역을 제공하지만, 문자박스상에 쓰여진 문자의 일부가 보완되지 않는다. 그러므로, 문자가 그 문자박스와 부분적으로 중첩하면, 인식율이 저하된다.
본 발명은 상술한 문제점을 개선하기 위해 개발되어, 테이블을 형성하는 선, 문자박스등의 직선부분에서 문자, 도형, 기호등의 일부를 형성하는 부분을 정확히 추출함으로써 문자박스, 테이블을 형성하는 선등의 직선부에 접촉하는 문자, 도형, 기호등을 정확히 검색할 수 있는 화상추출장치를 제거하는 데 목적이 있다. 더우기, 그 문자박스, 테이블을 형성하는 선등에 접촉하거나 부분적으로 중첩하는 문자에 대한 인식율을 향상시켜서 오인식율을 저감시키는 데 목적이 있다.
이들 목적을 달성하기 위하여, 본 발명은 직선과 패턴으로 형성된 화상에서 패턴만을 추출하기 위한 패턴추출장치를 제공한다. 패턴추출장치는 직선과 패턴으로 형성된 화상에서 직선을 추출하는 선추출부, 선추출부에 의해 추출된 직선과 패턴과의 교점을 산출하는 교점산출부, 교점산출부에 의해 얻어진 교점정보에 따라 선과 부분적으로 중첩하는 상기의 패턴에 대응하는 부분을 허상으로서 추출하는 허상추출부, 및 허상추출부에 의해 추출된 허상에서 상기의 패턴의 화상만을 추출하는 실상추출부를 포함한다.
또한, 본 발명은 패턴인식테이블생성장치를 제공한다. 패턴인식테이블생성장치는 선과 접촉하는 패턴을 포함하는 화상에서 패턴만을 분리 추출하는 패턴분리부, 패턴분리부에 추출된 패턴을 인식하는 패턴인식부, 대상물체 화상을 형성하는 패턴과 선사이에서 접촉상태의 각각에 대해 패턴인식부에 의해 인식된 패턴의 신뢰도를 산출하는 신뢰도산출부, 및 소정의 임계값 보다 작은 신뢰도(신뢰도 산출부에 의해 산출됨)을 가진 선패턴 접촉상태에 대해 일련의 패턴, 즉 패턴인식부에 의해 오인식된 패턴과 예기된 패턴과 함께 신뢰도 데이타를 저장하기 위한 테이블을 생성하는 테이블 작성부를 포함한다.
더우기, 본 발명에 의한 패턴재인식 테이블 작성장치는 선과 접촉하는 패턴을 포함하는 화상에서 패턴만을 분리추출하는 패턴분리부, 패턴분리부에 의해 추출된 패턴을 인식하는 패턴인식부, 대상물체 화상을 형성하는 패턴과 선사이에의 각각의 접촉상태에 대해 패턴인식부에 의해 인식된 패턴의 신뢰도를 산출하는 신뢰도 산출부, 소정의 임계값보다 작은 신뢰도(신뢰도 산출부에 의해 산출됨)을 가진 선패턴 접촉상태에 대한 패턴인식으로 신뢰도를 향상시키게 문자를 재인식하는 방법을 얻는 문자재인식부, 및 일련의 패턴, 즉 패턴인식부에 의해 오인식된 패턴과 예기된 패턴과 함께 문자재인식부으로 얻은 문자를 재인식하는 방법을 저장하기 위한 테이블을 생성하는 테이블생성부를 포함한다.
더우기, 본 발명에 의한 패턴재인식 테이블 작성장치는 그 문자박스 또는 괘선과의 접촉으로서 문자를 포함하는 화상에서 문자만을 분리추출하는 문자분리부, 문자분리부에 의해 추출된 문자를 인식하는 문자인식부, 각 선-문자접촉상태에 대해 문자인식부에 의해 인식된 문자의 신뢰도를 산출하는 신뢰도 산출부, 및 소정의 임계값보다 작은 신뢰도(신뢰도 산출부에 의해 산출됨) 선-문자접촉상태에 대해 문자쌍, 즉 문자인식부에 의해 오인식된 문자와 예기된 문자와 함께 신뢰도 데이타를 저장하기 위한 테이블을 생성하는 테이블생성부를 포함한다.
더우기, 본 발명에 의한 패턴재인식 테이블장치는 그 문자박스의 선 또는 괘선과 접촉하는 문자를 포함하는 화상에서 문자만을 분리추출하는 문자분리부, 문자분리부에 의해 추출된 문자를 선 사이의 각 접촉상태에 대해 문자인식부에 의해 인식된 문자의 신뢰도를 산출하는 신뢰도 산출부, 소정의 임계값보다 작은 신뢰도(신뢰도 산출부에 의해 산출됨)으로 선-문자접촉상태에 대한 문자인식의 신뢰도를 향상시키기 위해 문자를 재인식하는 방법을 얻는 문자재인식부, 및 문자쌍, 즉 문자인식부에 의해 오인식된 문자와 예기된 문자와 함께 문자인식부에 의해 얻은 문자를 재인식하는 방법을 저장하기 위한 테이블을 생성하는 테이블 작성부를 포함한다.
본 발명에 의한 패턴인식부는 선과 부분적으로 중첩하는 패턴을 포함하는 화상에서 패턴만을 분리추출하는 패턴분리부, 패턴분리부에 의해 추출된 패턴을 인식하는 패턴인식부, 대상물체 화상을 형성하는 선과 부분적으로 중첩하는 패턴의 각 상태에 대해 패턴인식부에 의해 인식된 패턴의 신뢰도를 산출하는 신뢰도 산출부, 및 신뢰도 산출부에 의해 산출된 신뢰도의 소정의 임계값보다 작은 선과 부분적으로 중첩하는 패턴의 상태에 대해 패턴인식부의 방법과는 다른 방법에 의해 패턴을 재인식하는 재인식부를 포함한다.
패턴인식장치는 패턴인식부에 의해 인식된 신뢰도의 소정의 임계값보다 작은 선과 부분적으로 중첩하는 상태에 대해 패턴인식의 신뢰도를 향상시키기 위해 패턴재인식방법을 입력하는 테이블을 더 포함한다. 재인식부는 테이블에 입력된 재인식방법에 의해 패턴을 재인식한다.
더우기, 본 발명에 의한 패턴인식장치는 그 문자박스의 선 또는 괘선과 접촉하는 문자를 포함하는 화상에서 문자만을 분리추출하는 문자분리부, 문자분리부에 의해 추출된 문자를 인식하는 문자인식부, 대상물체 화상을 형성하는 문자와 선 사이의 각 접촉상태에 대해 문자인식부에 의해 인식된 문자의 신뢰도를 산출하는 신뢰도 산출부, 소정의 임계값보다 작은 신뢰도(신뢰도 산출부에 의해 산출됨)을 가진 선-문자접촉상태에 대해 문자인식부의 방법과는 다른 방법에 의해 문자를 재인식하는 재인식부를 포함한다.
패턴인식장치는 소정의 임계값보다 작은 신뢰도(문자인식부에 의해 인식됨)을 가진 선-문자접촉상태에 대해 문자인식의 신뢰도를 향상시키기 위해 문자재인식방법을 입력한 테이블을 더 포함한다. 재인식부는 테이블에 입력된 재인식방법에 의해 문자를 재인식한다.
패턴인식장치는 소정의 임계값보다 작은 신뢰도(문자인식부에 의해 인식됨)신뢰도를 가진 선-접촉 접촉상태에 대해, 선접촉 문자인식의 신뢰도를 향상시키기 위해 문자쌍, 즉 문자재인식방법과 함께 문자인식부에 의해 오인식된 문자와 예기된 문자를 포함하는 테이블을 더 포함한다. 재인식부는 문자인식부에 의해 인식된 문자가 테이블에 입력된 재인식방법에 의해 문자를 재인식할 수 있도록 구성되어 있다.
패턴인식장치는 소정의 임계값보다 작은 신뢰도(문자인식부에 의해 인식됨)을 가진 선-문자접촉상태에 대해, 선 접촉문자인식의 신뢰도를 향상시키기 위해 문자재인식방법과 함께 신뢰도 데이타, 문자쌍, 즉 문자인식부에 의해 오인식된 문자와 예기된 문자를 포함하는 테이블을 더 포함한다. 재인식부는 문자인식부에 의해 인식된 문자가 테이블에 입력된 문자쌍에 포함되고 테이블에 등록된 문자인식부에 의한 문자인식의 신뢰도이 소정의 임계값보다 작은 경우에 테이블에 입력된 재인식방법에 의해 문자를 재인식할 수 있도록 구성되어 있다.
패턴인식장치는 소정의 임계값보다 작은 신뢰도(문자인식부에 의해 인식됨)신뢰도를 가진 선-문자접촉에 대해, 선 접촉문자인식의 신뢰도를 향상시키기 위해 문자재인식방법과 함께 접촉상태의 성질을 나타내는 파라미터, 신뢰도 데이타, 문자쌍, 즉 문자인식부에 의해 오인식된 문자와 예기된 문자를 포함하는 테이블을 더 포함한다. 재인식부는 선-문자접촉상태의 성질을 나타내는 각 파라미터의 값을 산출할 수 있고, 문자인식부에 의해 인식된 문자와 파라미터가 테이블에 입력된 문자인식부에 의한 문자인식의 신뢰도이 소정의 임계값보다 작은 경우에 테이블에 입력된 재인식방법에 의해 문자를 재인식할 수 있도록 구성되어 있다.
이하 본 발명의 원리에 대하여 설명한다.
제8도∼제15도는 선위에 쓰여진 패턴을 갖는 것으로 표시된 화상으로부터 하나의 패턴만을 추출하기 위한 패턴추출장치에 관하여 본 발명의 원리를 도시한 것이다.
제8도는 본 발명의 전체구성을 도시한 블럭도이다.
선 추출부 31은 선과 패턴이 부분적으로 중첩된 화상으로부터 선을 추출하는 것이다.
교점산출부 32는 선추출부 31에 의해 추출된 선과 패턴의 교점을 산출하는 것이다.
허상추출부 33은 교점산출부 32에 의해 얻어진 교점정보에 따라 선위에 쓰여진 패턴의 일부를 추측하고, 허상으로서의 일부를 추출하는 것이다.
실상추출부 34는 허상추출부 33에 의해 추출된 허상으로부터 실상으로서의 패턴상만을 추출한 것이다.
제9도는 실상추출부 34의 구성예를 도시한 것이다.
실상판정부 35는 허상에서의 패턴상에 대응하는 실상을 판정한다.
영역제거부 36은 실상판정부 35에 의해 실상으로 판정된 부분외의 다른 영역을 화상으로부터 제거하는 것이다.
제10도는 실상판정부 35의 구성예를 도시한 것이다.
테이블 38은 허상의 구조로부터 허상의 패턴상에 대응하는 실상만을 추출할때 사용하기 위한 정보를 저장한 것이다.
선택부 39는 허상의 구조를 판정하고, 테이블 38을 참조하여 허상의 패턴상에 대응하는 실상을 선택한다.
패턴이 상술한 구성을 갖는 문자를 참조하는 경우, 테이블 38은 각각의 문자유형에 대해 개별적으로 제공된다. (예를 들어, 숫자 문자, 알파벳 문자, 일본어 문자, 중국어 문자등에 대하여 별개호 제공된다.)
제11도∼제15도는 문자패턴의 처리를 목적으로 하는 본 발명의 제2양상에 의한 구성을 도시한 블럭도이다.
제11도는 실상판정부 35의 다른 구성을 도시한 블럭도이다.
평균 문자크기 산출부 41은 평균문자크기, 즉 허상을 포함하는 문자패턴의 문자열에서 1문자 패턴의 평균크기를 산출한다.
선택부 42는 평균 문자크기 산출부 41에 의해 산출된 평균 문자크기에 근거하여 허상에서 상술한 문자패턴의 문자의 일부를 형성하는 선에 대한 실상을 선택한다.
제12도는 선택부 41의 구성예를 도시한 블럭도이다.
임계설정부 45는 평균 문자크기 산출부 41에 의해 산출된 평균 문자크기에 근거하여 최대 및 최소문자크기를 설정한다.
가상패턴과 국부적으로 연결된 문자패턴이 평균문자크기 산출부 41에 의해 얻어진 최대문자크기보다 크기가 큰 경우에는, 판정부 46은 실상을 문자패턴에서 연결된 허상을 제거하여 얻은 다수개의 패턴에서 상술한 최대문자크기보다 크기가 작은 화상과 국부적으로 연결된 허상으로서 간주한다. 임계설정부 45와 판정부 46은 다음과 같이 구성될 수가 있다.
즉, 임계설정부 45는 평균문자크기 산출부 41에 의해 산출된 상술한 평균문자크기에 근거하여 최대문자크기를 판정한다. 상술한 문자열의 문자패턴이 임계설정부 45에 의해 설정된 최대문자크기보다 큰 경우에는, 판정부 46은 문자패턴이 1개 문자의 실상에 관계한다고 판정한다.
제13도는 실상판정부 35의 다른 구성예를 도시한 것이다.
패턴이 문자패턴에 관계하는 경우에는, 평균문자크기 산출부 47은 허상을 포함하는 문자패턴의 문자열에서 1문자의 패턴의 평균크기를 나타내는 평균문자크기를 산출한다.
제1판정부 48은 평균문자크기 산출부 47에 의해 얻은 평균문자크기에 근거하여 문자열중의 허상을 포함하는 문자패턴의 문자열에서 1문자의 패턴의 평균크기를 나타내는 평균문자크기를 산출한다.
제1판정부 48은 평균 문자측 산출부 47에 의해 얻은 평균문자크기에 근거하여 문자열중의 허상을 포함하는 문자패턴에서 문자의 일부를 형성하는 실선의 화상을 판정한다.
테이블 49는 가상선으로 형성된 허상의 구조에서 허상의 문자를 형성하는 실선의 화상만을 추출하는데 사용하는 정보를 저장한다.
제2판정부 50은 허상의 구조를 판단하고, 테이블 49를 참조하여 실선으로 형성된 실상을 허상에 근거하여 판정한다.
제14도는 실상추출부 34의 구성예를 도시한 것이다.
패턴이 문자패턴에 관계하는 경우에는, 평균문자크기 산출부 51은 평균문자크기, 즉 허상을 포함하는 문자패턴의 문자열에서 1문자패턴의 평균크기를 산출한다.
영역제거부 52는 평균문자크기 산출부 51에 의해 얻은 평균문자크기에 근거하여 문자열중의 허상을 포함하는 문자패턴에서 문자패턴의 실상과는 다른 영역을 제거한다.
제15도는 영역제거부 52의 구성예를 도시한 것이다.
임계설정부 53은 평균문자크기에 근거하여 최대 및 최소문자크기를 설정한다.
허상에 국부적으로 대응하는 문자패턴이 임계설정부 53에 의해 얻은 최대문자크기보다 큰 경우에는, 허상제거부 54는, 문자패턴에서 국부적으로 대응하는 허상을 제거할때 얻어진 다수의 문자패턴이 상술한 최소문자크기보다 큰 경우에만 국부적으로 대응하는 허상을 제거한다.
제8도에 도시한 발명에 의하면, 선추출부 31은 직선상에 쓰여진 패턴에 의해 형성된 화상에서 직선만을 추출한다. 그래서, 예를 들면, 문자박스와 테이블의 일부를 형성하는 직선만이 문자박스, 테이블등의 선상에 쓰여진 문자에 의해 형성된 화상에서 추출된다.
그 다음에, 교점산출부 32는 추출된 선과 패턴 사이의 교점을 산출한다. 그래서, 문자박스, 테이블등을 형성하는 선과 문자의 일부를 형성하는 선 사이의 교점의 좌표를 문자박스, 테이블등을 형성하는 선과 접촉하거나 부분적으로 중첩하는 것처럼 쓰여진 문자에 대해 산출할 수가 있다.
다음에, 허상추출부 33은 패턴의 화상이 교점정보에 따라 선과 부분적으로 중첩하여 이를 허상으로서 추출한다는 것으로 추정한다. 허상은 예를 들면 교점을 연결하는 가상선(문자를 형성하는 가상선)을 포함한다.
실상추출부 34는 허상에서 패턴의 화상에 의해 형성된 실상을 추출한다.
그 결과, 문자박스, 테이블등을 형성하는 선과 부분적으로 중첩하는 문자, 기호, 도형등과 같은 각종의 패턴에 의해 형성된 화상에서 대상물체의 패턴을 정확히 추출(검색)할 수가 있다.
예를 들면, 문자가 문자박스, 테이블등의 일부를 형성하는 선과 접촉하거나 부분적으로 중첩하거나, 또는 수서문자가 괘선위에 걸치는 경우에도, 문자박스 또는 테이블의 일부를 형성하는 선과 부분적으로 중첩하는 문자의 화상을 정확히 추출할 수가 있다.
제16도는 본 발명의 다른 양상의 원리를 도시한 블럭도이다.
패턴분리부 55는 선과 접촉하는 것으로서 쓰여진 패턴에 의해 형성된 화상에서 패턴만을 분리한다. 접촉은 또한 선과 부분적으로 중첩하는 문자에 관계한다. 이하의 설명에서 마찬가지의 상태를 고려할 수가 있다.
패턴인식부 56은 패턴분리부 55에 의해 추출된 패턴을 인식한다.
신뢰도 산출부 57은 선과 접촉하는 패턴의 각 상태에 대해 패턴인식부 56에 의해 인식된 패턴의 신뢰도를 산출한다.
테이블 작성부 58은 소정의 임계값보다 작은 신뢰도(신뢰도 산출부 57에 의해 산출됨)을 가진 선-패턴 접촉상태에 대해 일련의 패턴, 즉 패턴인식부 56에 의해 오인식된 패턴과 예기된 패턴과 함께 신뢰도 데이타를 저장하는 테이블 59를 생성한다.
제16도에 도시된 양상에 의하면, 패턴분리부 55는 선과 접촉하는 패턴을 포함하는 화상으로부터 패턴만을 분리하여 추출한다. 패턴인식부 56은 패턴분리부 55에 의해 추출된 패턴을 인식한다. 신뢰도 산출부 57은 선과 패턴사이의 각 접촉상태에 대하여 패턴인식부 56이 인식한 패턴의 신뢰도를 산출한다. 테이블 작성부 58은 소정의 임계값보다 작은 신뢰도(신뢰도 산출부 57에 의해 산출됨)을 가진 선-패턴 접촉상태에 대해 일련의 패턴, 즉 패턴인식부 56에 의해 오인식된 패턴과 예기된 패턴과 함께 신뢰도를 저장하는 테이블 59를 생성한다.
그래서, 사용자는 테이블 59를 참조하여 패턴인식부 56에 의해 얻어진 인식패턴의 신뢰도를 조사할 수가 있다.
제17도는 본 발명의 다른 양상의 원리를 도시한 블럭도이다.
패턴분리부 61은 선과 접촉하는 것으로서 쓰여진 패턴에 의해 형성된 화상에서 패턴만을 분리한다.
패턴인식부 62는 패턴분리부 61에 의해 추출된 패턴을 인식한다.
신뢰도 산출부 63은 선과 접촉하는 패턴의 각 상태에 대해 패턴인식부 62에 의해 인식된 패턴의 신뢰도를 산출한다.
문자재인식부 64는 문자를 재인식하는 방법으로 소정의 값보다 작은 신뢰도(신뢰도 산출부 63에 의해 산출됨)을 가진 선-패턴 접촉상태에 대해 패턴인식의 신뢰도를 향상시키게 한다.
테이블생성부 65는 일련의 패턴, 즉 패턴인식부 62에 의해 오인식된 패턴과 예기된 패턴과 함께 문자재인식부 64에 의해 얻은 문자를 재인식하는 방법을 저장하는 테이블 66을 생성한다.
제17도에 도시한 본 발명의 양상에 의하면, 패턴분리부 61은 선-패턴 접촉화상 패턴만을 분리추출하고 나서, 패턴인식부 62는 패턴분리부 61에 의해 추출된 패턴을 인식한다.
그 다음에, 신뢰도 산출부 63은 각 선-패턴 접촉상태에 대해 패턴인식부 62에 의해 인식된 패턴의 신뢰도를 산출한다. 문자인식부 64는 문자를 인식하는 방법으로 소정의 임계값보다 작은 신뢰도(신뢰도 산출부 63에 의해 산출됨)을 가진 선-패턴 접촉상태에 대해 패턴인식의 신뢰도를 향상시키게 한다. 그 다음에, 테이블생성부 65는 일련의 패턴, 즉 패턴인식부 62에 의해 오인식된 패턴과 예기된 패턴과 함께 문자재인식부 64에 의해 얻은 문자를 재인식하는 방법을 저장하는 테이블 66을 생성한다.
그러므로, 패턴인식부 62에 의해 인식된 패턴의 신뢰도를 테이블 66에 참조할 수 있다.
제18도는 본 발명의 또다른 양상의 원리를 도시한 블럭도이다.
문자분리부 70은 그 문자박스 또는 괘선과 접촉하는 것으로서 문자를 포함하는 화상에서 문자만을 분리추출한다. 접촉은 또한 선과 부분적으로 중첩하는 문자에 관계한다. 이하의 설명에서 마찬가지의 상태를 고려할 수가 있다.
문자인식부 71은 문자분리부 70에 의해 추출된 문자를 인식한다.
신뢰도 산출부 72는 각 선-문자접촉상태에 대해 문자인식부 71에 의해 인식된 문자의 신뢰도를 산출한다.
테이블 작성부 73은 소정의 임계값보다 작은 신뢰도(신뢰도 산출부 72에 의해 산출됨)을 가진 선-문자접촉상태에 대해 문자쌍, 즉 문자인식부 71에 의해 오인식된 문자와 예기된 문자와 함께 신뢰도 데이타를 저장하는 테이블 74를 생성한다.
그 결과, 사용자는 문자분리부 70에 의해 인식된 문자의 신뢰도를 참조할 수 있는 테이블 74를 생성할 수가 있다.
제19도는 본 발명의 또다른 양상의 원리를 도시한 블럭도이다.
문자분리부 75는 그 문자박스 또는 괘선과 접촉하는 것으로서 문자를 포함하는 화상에서 문자만을 분리 추출한다.
문자인식부 76은 문자분리부 75에 의해 추출된 문자를 인식한다.
신뢰도 산출부 77은 각 선-문자접촉상태에 대해 문자인식부 76에 의해 인식된 문자의 신뢰도를 산출한다.
문자재인식부 78은 소정의 임계값보다 작은 신뢰도(신뢰도 산출부 77에 의해 산출됨)을 가진 선-문자접촉상태에 대해 문자인식의 신뢰도를 향상시키도록 문자를 재인식하는 방법을 학습한다.
테이블생성부 79는 일련의 패턴, 즉 패턴인식부에 의해 오인식된 패턴과 예기된 패턴과 함께 문자재인식부 78에 의해 학습된 문자를 재인식하는 방법을 저장하는 테이블 80을 생성한다.
신뢰도 산출부 77은 예를 들면, 문자박스와 테이블을 형성하는 각종의 화상 패턴 접촉선을 생성하는 선-접촉문자 생성부 및 선-접촉문자 생성부에 의해 생성된 화상패턴에 대해 문자인식부 76에 의해 저장된 문자의 인식율을 조사하는 신뢰도 설정부으로 구성된다.
선-접촉문자 생성부는 각종의 형태에의 각 문자를 문자박스, 테이블등의 일부를 형성하는 소정의 선위에 겹쳐놓음으로써 화상패턴을 생성한다.
또한, 선-접촉문자생성부는 문자박스, 테이블등의 일부를 형성하는 선의 중력중심근처에 회전도를 변화시킴으로써 화상패턴을 생성한다.
선-접촉문자 생성부는 각 문자의 크기를 변화시킴으로써 화상패턴을 생성한다.
더우기, 선-접촉문자 생성부는 각 문자를 그 중력종심주변에 회전도로 변화시킴으로써 화상패턴을 생성한다.
또한, 선-접촉문자 생성부는 각종의 형태에의 문자박스, 테이블등의 일부를 형성하는 선을 소정의 형태에의 각 문자위에 겹쳐놓음으로써 화상패턴을 생성한다.
또한, 선-접촉문자 생성부는 문자박스, 테이블등의 일부를 형성하는 선의 두께를 변화시킴으로써 화상패턴을 생성한다.
또한, 선-접촉문자 생성부는 각 위치에 따라 문자박스, 테이블등의 일부를 형성하는 선의 두께를 변화시킴으로써 선-접촉문자를 생성한다.
또한, 선-접촉문자 생성부는 각종의 형태에의 문자박스, 테이블등의 선형부를 각종의 형태에의 각 문자위에 겹쳐놓음으로써 화상패턴을 생성한다.
또한, 선-접촉문자 생성부는 문자의 중력중심과 문자박스, 선등의 일부를 형성하는 선의 중력중심과의 상대적 위치를 변화시킴으로써 선-접촉문자를 생성한다.
제19도에 도시한 본 발명에 의하면, 문자분리부 75는 그 문자박스 또는 괘선과 접촉하는 것으로서 문자를 포함하는 화상에서 문자만을 분리추출한다. 문자인식부 76은 문자분리부 75에 의해 추출된 문자를 인식한다. 신뢰도 산출부 77은 각 선-문자접촉상태에 대해 문자인식부 76에 의해 인식된 문자로 신뢰도를 산출한다. 문자재인식부 78은 소정의 임계값보다 작은 신뢰도(신뢰도 산출부 77에 의해 산출됨)을 가진 선-문자접촉상태에 대해 문자인식의 신뢰도를 향상시키도록 문자를 재인식하는 방법을 학습한다. 테이블 작성부 79는 일련의 패턴, 즉 패턴인식부에 의해 오인식된 패턴과 예기된 패턴과 함께 문자재인식부 78에 의해 학습된 문자를 재인식하는 방법을 저장하는 테이블 80을 생성한다.
그래서, 사용자는 문자분리부 75에 의해 인식된 문자의 신뢰도를 참조할 수 있는 테이블 80을 생성할 수가 있다.
제20도는 본 발명의 또다른 양상의 원리를 도시한 블럭도이다.
패턴분리부 81은 선과 부분적으로 중첩하는 패턴에 의해 형성된 화상에서 패턴만을 분리한다.
패턴인식부 82는 패턴분리부 81에 의해 추출된 패턴을 인식한다.
신뢰도 산출부 83을 선과 부분적으로 중첩하는 패턴의 각 상태에 대해 패턴인식부 82에 의해 인식된 패턴의 신뢰도를 산출한다.
재인식부 84는 소정의 임계값보다 작은 신뢰도(신뢰도 산출부 83에 의해 산출됨)을 가진 선과 부분적으로 중첩하는 패턴의 상태에 대해 패턴인식부 82의 방법과는 다른 방법에 의해 패턴을 재인식한다.
제20도에 도시한 본 발명의 또다른 양상은 소정의 임계값보다 작은 신뢰도(패턴인식부 82에 의해 인식됨)을 가진 선과 부분적으로 중첩하는 패턴의 각 상태에 대해 패턴인식의 신뢰도를 향상시키는 패턴재인식방법을 포함하는 테이블 85로 더 구성된다. 재인식부 84는 테이블 85에 입력된 재인식방법에 의해 재인식처리를 행하도록 설계되어 있다.
테이블 85에 입력된 재인식방법은 패턴분리부 81에 의해 분리된 패턴의 특정영역을 사용하는 패턴을 인식하는 것이다.
패턴의 특정영역은 패턴을 에워싸는 직사각형의 분할영역이다.
테이블 85로 구성되지 않은 본 발명의 또다른 양상에 의하면, 패턴분리부 81은 선과 부분적으로 중첩하는 패턴에 의해 형성된 화상에서 패턴만을 분리한다. 패턴인식부 82는 패턴분리부 81에 의해 추출된 패턴을 인식한다. 신뢰도 산출부 83은 선과 부분적으로 중첩하는 패턴의 각 상태에 대해 패턴인식부 82에 인식된 패턴의 각 상태에 대해 패턴인식부 82에 인식된 패턴의 신뢰도를 산출한다. 재인식부 84는 소정의 값보다 작은 신뢰도(신뢰도 산출부 83에 의해 산출됨)을 가진 선과 부분적으로 중첩하는 패턴의 상태에 대해 패턴인식부 82의 방법과는 다른 방법에 의해 패턴을 재인식한다.
패턴분리부 81에 의해 인식된 패턴의 신뢰도 값이 소정의 임계값보다 작으면, 패턴은 패턴에 대한 인식율을 향상시키기 위한 다른 패턴인식방법에 의해 재인식된다.
제20도에 도시한 테이블 85로 구성되는 본 발명의 또다른 양상에 의하면, 재인식부 84는 소정의 임계값보다 작은 신뢰도(패턴인식부 82에 의해 인식됨)을 가진 선과 부분적으로 중첩하는 패턴의 상태에 대해, 패턴인식의 신뢰도를 향상시키는 패턴재인식방법을 포함하는 테이블 85를 참조하여, 테이블에 입력된 재인식방법에 의한 소정의 임계값보다 작은 패턴인식부 82에 의해 인식된 패턴의 신뢰도를 가진 패턴을 재인식한다.
이와 같이, 소정의 임계값보다 작은 패턴인식부 82에 의해 인식된 패턴의 신뢰도를 가진 패턴을 고인식율로 인식할 수가 있다.
제21도는 본 발명의 또다른 양상의 원리를 도시한 블럭도이다.
제21도에 도시한 본 발명의 제1양상은 다음같은 구성부으로 구성되어 있다.
문자분리부 86은 그 문자박스 또는 괘선과 접촉하는 것으로서 문자를 포함하는 화상에서 문자만을 분리추출한다.
문자인식부 87은 문자분리부 86에 의해 추출된 문자를 인식한다.
신뢰도 산출부 88은 각 선-문자접촉상태에 대해 문자인식부 87에 의해 인식된 문자의 신뢰도를 산출한다.
문자재인식부 89는 소정의 임계값보다 작은 신뢰도(신뢰도 산출부 88에 의해 산출됨)을 가진 선-문자접촉상태에 대해 문자인식부 87의 방법과는 다른 방법에 의해 문자를 재인식한다.
제21도에 도시한 본 발명의 또다른 양상은 소정의 임계값보다 작은 신뢰도(패턴인식부 87에 의해 인식됨)을 가진 선-문자접촉상태에 대해, 문자인식의 신뢰도를 향상시키는 문자재인식방법을 포함하는 테이블 90으로 구성된다. 재인식부 89는 테이블 90에 입력된 재인식방법에 의해 재인식처리를 행하도록 설계되어 있다.
테이블 90에 입력된 재인식방법은 문자분리부 86에 의해 분리된 문자의 특정영역을 사용하는 문자를 재인식하는 것이다.
문자의 특정영역은 문자를 에워싸는 직사각형의 분할영역이다.
제21도에 도시한 본 발명의 제3양상은 소정의 임계값보다 작은 신뢰도(문자인식부 87에 의해 인식됨)을 가진 선-문자접촉상태에 대해, 선-접촉문자인식의 신뢰도를 향상시키는 문자재인식부방법과 함께, 문자쌍, 즉 문자인식부 87에 의해 오인식된 문자와 예기된 문자를 포함하는 테이블 90으로 더 구성된다. 재인식부 89는 문자인식부 87에 의해 인식된 문자가 테이블 90에 입력된 문자쌍에 포함되는 경우에 테이블 90에 입력된 재인식방법으로 문자를 재인식할 수 있도록 구성되어 있다.
테이블 90에 입력된 재인식방법은 예를 들면, 문자분리부 87에 의해 분리된 문자의 특정영역을 사용하는 문자를 재인식하는 방법이다.
문자의 특정영역은, 예를 들면 문자를 에워싸는 분할된 직사각형 영역이다.
제21도에 도시한 본 발명의 제4양상은 소정의 임계값보다 작은 신뢰도(문자인식부 87에 의해 인식됨)을 가진 선-문자접촉상태에 대해, 문자쌍, 즉 문자인식부 87에 의해 오인식된 문자와 예기된 문자, 및 선-접촉문자인식의 신뢰도를 향상시키는 문자재인식방법을 포함하는 테이블 90으로 더 구성된다. 재인식부 89는 문자인식부 87에 의해 인식된 문자가 테이블 90에 입력된 문자쌍에 포함되고 테이블 90에 입력된 문자인식부 87에 의해 인식된 문자의 신뢰도이 소정의 임계값보다 작은 경우에 테이블 90에 입력된 재인식방법으로 문자를 재인식할 수 있도록 구성되어 있다.
테이블 90에 입력된 재인식방법은, 예를 들면 문자분리부 87에 의해 분리된 문자의 특정영역을 사용하는 문자를 재인식하는 방법이다.
문자의 특정영역은, 예를 들면 문자를 에워싸는 분할된 직사각형 영역이다.
제21도에 도시한 본 발명의 제5양상은 소정의 임계값보다 작은 신뢰도(문자인식부 87에 의해 인식됨)을 가진 선-문자접촉상태에 대해, 접촉상태의 특징을 파라미터, 신뢰도, 문자쌍, 즉 문자인식부 87에 의해 오인식된 문자와 예기된 문자, 및 선-접촉문자인식이 신뢰도를 향상시키는 문자재인식방법을 포함하는 테이블 90으로 더 구성된다. 재인식부 89는 재인식부 89에 의해 산출되는, 선-문자접촉상태의 특징을 나타내는 파라미터와 문자인식부 87에 의해 인식된 문자가 테이블 90에 입력된 문자쌍에 포함되고, 테이블 90에 입력된 문자인식부 87에 의해 인식된 문자의 신뢰도이 소정의 임계값보다 작은 경우에 테이블 90에 입력된 재인식방법으로 문자를 재인식할 수 있도록 구성되어 있다.
테이블 90에 입력된 재인식방법은, 예를 들면 문자분리부 86에 의해 분리된 문자의 특정영역을 사용하여 문자를 재인식하는 방법이다.
문자의 특정영역은, 예를 들면 문자를 에워싸는 분할된 직사각형 영역이다.
본 발명의 제1양상에 의하면, 문자분리부 86은 그 문자박스 또는 괘선과 접촉하는 것으로서 문자를 포함하는 화상에서 문자만을 분리추출한다. 문자인식부 87은 문자분리부 86에 의해 추출된 문자를 인식한다. 신뢰도 산출부 88은 각 선-문자접촉상태에 대해 문자인식부 87에 의해 인식된 문자의 신뢰도를 산출한다. 문자재인식부 89는 소정의 임계값보다 작은 신뢰도(신뢰도 산출부 88에 의해 산출됨)을 가진 선-문자접촉상태에 대해 문자인식부 87의 방법과는 다른 방법에 의해 문자를 인식한다.
그러므로, 소정의 임계값보다 작은 신뢰도를 가진 문자인식부 87에 의해 인식된 문자를 향상된 인식율로 인식할 수가 있다.
제21도에 도시한 본 발명의 제2양상에 의하면, 재인식부 89는 소정의 임계값보다 작은 신뢰도(문자인식부 87에 의해 인식됨)을 가진 선-문자접촉상태에 대해, 문자인식의 신뢰도를 향상시키는 문자재인식방법을 포함하는 테이블 90을 참조한다. 이와 같이, 재인식부 89는 소정의 임계값보다 작은 신뢰도를 가진 문자인식부 87에 의해 문자를 테이블 90에 입력된 재인식방법으로 재인식한다.
그러므로, 소정의 임계값보다 작은 신뢰도를 가진 문자인식부 87에 의해 인식된 문자를 향상된 인식율로 인식할 수가 있다.
제21도에 도시한 본 발명의 제3양상에 의하면, 재인식부 89는 소정의 임계값보다 작은 신뢰도(문자인식부 87에 의해 인식됨)을 가진 선-문자접촉상태에 대해, 선-접촉문자인식의 신뢰도를 향상시키는 문자재인식방법과 함께, 문자쌍, 즉 문자인식부 87에 의해 오인식된 문자와 예기된 문자를 포함하는 테이블 90을 참조한다. 재인식부 89는 문자인식부 87에 의해 등록된 문자가 테이블 90에 입력된 문자쌍에 포함되는 경우에 테이블 90에 입력된 재인식방법으로 문자를 재인식할 수 있도록 구성되어 있다.
그러므로, 소정의 임계값보다 작은 신뢰도를 가진 문자인식부 87에 의해 인식된 문자를 향상된 인식율로 인식할 수가 있다.
제21도에 도시한 본 발명의 제4양상에 의하면, 재인식부 89는 소정의 임계값보다 작은 신뢰도(문자인식부 87에 의해 인식됨)을 가진 선-문자접촉상태에 대해, 문자쌍, 즉 문자인식부 87에 의해 오인식된 문자와 예기된 문자, 및 선-접촉문자인식의 신뢰도를 향상시키는 문자재인식방법을 포함하는 테이블 90을 참조한다. 재인식부 89는 문자인식부 87에 의해 인식된 문자가 테이블 90에 입력된 문자쌍에 포함되고, 테이블 90에 입력된 문자인식부 87에 의해 인식된 문자의 신뢰도이 소정의 임계값보다 작은 경우에 테이블 90에 입력된 재인식방법으로 문자를 재인식할 수 있도록 구성되어 있다.
그러므로, 소정의 임계값보다 작은 신뢰도를 가진 문자인식부 87에 의해 인식된 문자를 향상된 인식율로 인식할 수가 있다.
제21도에 도시한 본 발명의 제1양상에 의하면, 재인식부 89는 소정의 임계값보다 작은 신뢰도(문자인식부 87에 의해 인식됨)을 가진 선-문자접촉상태에 대해, 접촉상태의 특징을 나타내는 파라미터, 신뢰도, 문자쌍, 즉 문자인식부 87에 의해 오인식된 문자와 예기된 문자, 및 선-접촉문자인식의 신뢰도를 향상시키는 문자-재인식방법을 포함하는 테이블 90을 참조한다. 재인식부 89는 선-문자접촉상태의 특징을 나타내는 파라미터와 문자인식부 87에 의해 인식된 문자가 테이블 90에 입력된 문자쌍에 포함되고, 테이블 90에 입력된 문자인식부 87에 의해 인식된 문자의 신뢰도이 소정의 임계값보다 작은 경우에 테이블 90에 입력된 재인식방법으로 문자를 재인식할 수 있도록 구성되어 있다.
그러므로, 소정의 임계값보다 작은 신뢰도를 가진 문자인식부 87에 의해 인식된 문자를 향상된 인식율로 인식할 수가 있다.
이하, 첨부한 도면을 참조하여 본 발명의 실시예를 상세히 설명한다.
제22도는 본 발명의 제1실시예에 의한 화상추출장치의 구성을 도시한 블럭도이다. 이 장치에 의하면, 장치에 의해 처리되는 입력패턴이 극도의 경사, 회전등을 나타내는 경우에 임시적으로 보정되어 노이즈와 낮은 스포트 제거처리로 처리된 2치 화상이다. 본 실시예에 의하면, 테이블의 일부를 형성하는 박스와 흑선을 선 또는 박스접촉문자에서 제거할 수가 있다. 즉, 문자가 미지의 위치와 경도의 문자박스내에 수서되고 문자박스와 접촉하거나 부분적으로 중첩하는 경우에도 선 또는 문자박스만을 제거할 수가 있다. 처리되는 문자박스, 예를 들면 제23(a)도에 도시된 바와 같은 정규 테이블 형태의 블럭의 문자박스, 제23(b)도에 도시된 바와 같은 비정규 자유형식 블럭의 문자박스, 제23(c)도에 도시된 자유형식 문자박스이다.
링크패턴추출부 101은 상술한 바와 같은 경사와 회전을 보정하고 노이즈, 낮은 스포트등을 제거하여 선처리된 입력패턴을 수납한다. 링크패턴추출부 101의 라벨링부이 문자박스의 위치에 관계없이 선-접촉문자에 대한 후보자를 선택하므로, 8개 방향(상향, 하향, 우향, 좌향, 및 대각선 방향)중 어느 한 방향의 점에서 연결된 링크패턴이 라벨링 처리로 추출된다. 8개 링크를 나타내는 라벨에 따라 얻어진 링크패턴은 (a) 문자와 접촉하지 않는 문자박스, (b) 문자박스와 접촉하지 않는 문자, 또는 문자의 일부, 또는 (c) 문자박스와 접촉하는 문자를 참조한다.
라벨링처리로 얻어진 링크패턴의 크기가 최종공정에서 요구되므로, 링크패턴은 라벨링처리에서 직사각형으로서 근사되고 직사각형의 모서리의 좌표가 얻어져 메모리에 저장된다.
문자박스추출부 102는 링크패턴추출부 101에 의해 추출된 링크패턴에서 문자박스에 대응하는 선을 추출한다. 선(문자박스)를 먼저 추출하여 전체처리를 가속한다. 굵은선이 추출되지 않으면, 가는선(문자박스)을 추출한다.
제24도는 문자박스추출부 102의 실시예를 도시한 블럭도이다.
투영부 102a는 링크패턴추출부 102의 실시예을 도시한 블럭도이다.
투영부 102a는 링크패턴추출부 101에 의해 추출된 부분패턴을 수직 또는 수평으로 투영한다. 선검출부 102b는 투영부 102a에 의해 얻어진 수평 또는 수직의 투영정보에서 수평 또는 수직선을 검출한다. 제1의 4측면검출부 102c는 선검출부 102b에 의해 검출된 선에 의해 형성된 직사각형의 4측면을 검출한다. 추적부 102b는 선검출부 102b 또는 제1의 4측면 검출부 102c에 의해 검출되지 않은 가는선을 얻기 위하여 후술하는 n선 런길이 방법에 의해 선을 추적한다. 제2의 4측면 검출부 102e는 추적부 102d에 의해 얻어진 가는선에 의해 형성된 직사각형의 4측면을 검출한다. 문자박스추출부 102f는 4측면 검출부 102c와 102e에 의해 얻어진 직사각형 정보에서 문자박스를 추출한다.
이하, 상술한 바와 같이 설계된 문자박스추출부 102의 동작에 대하여 설명한다.
(A) 굵은선과 문자박스의 추출
문자박스의 크기가 알려져 있지 않고 문자가 문자박스와 접촉하는 경우에도, 문자박스가 정확히 추출되어야 한다. 투영부 102a는 라벨링 처리로 얻어진 각 부분패턴을 투영한다. 선 검출부 102b는 부분패턴에서 직사각형까지의 근사에 의해 얻어진 크기에 대한 투영값의 비를 산출하여, 이 비가 소정의 임계값보다 큰 경우에 선을 긴측면으로 고려한다.
선이 문자박스의 일부를 형성하는 선이 아닌 문자의 스트로크(stroke)일 수 있으므로, 최외곽의 직사각형의 4측면을 가능한한 형성하는 선을 얻어야 한다.
제25도는 링크패턴추출부 101의 라벨링 처리에 의해 얻어진 부분패턴의 수평 및 수직방향의 투영을 도시한 것이다. 제25도에 있어서, 라벨링 처리로 얻어진 부분패턴 141은 길이 Lx와 Ly로 형성된다. 부분패턴은 수직방향 i에서의 투여 VP와 수평방향 j에서의 투영 HP를 갖는다. 설명의 편의상, 화상의 크기가 m행 Xn열이고, 제25도에 도시한 편평한 좌표계에서의 좌표(i,j)의 밀도는 f(i,j)이고, 선 i의 수평방향으로의 투영은 ph(i)이며, 행 j에서 수직방향의 투영가 pv(j)라고 가정하면, ph(i)와 pv(j)는 하기식 (1)과 (2)로 표현될 수가 있다.
선 검출부 102b는 링크패턴추출부 101에 의해 얻어진 부분패턴의 직사각형 좌표를 갖는 직사각형의 길이 Lx와 폭 Ly에 근거하여 하기식 (3)에 의해 수평방향의 투영 ph(i)에 대한 길이 Lx의 비를 얻고, 또한 하기식 (4)에 의해 수직방향의 투영 pv(j)에 대한 폭 Ly의 비를 얻어, 이들비와 임계값 THL을 비교한다.
식 (3)과 (4)에 의해 얻어진 비가 임계값 THL보다 큰 경우에는, 부분패턴은 문자박스의 일부를 형성하는 선의 후보자를 참조한다. 즉, 추출된 부분패턴이 제25도에 도시한 바와 같은 직사각형일 수 있는 경우에는, 선의 수평 투영값ph(i)와 수직 투영값 pv(j)는 최대값을 나타내고 폭 Ly에 대한 길이 Lx의 비가 보다 큰 값을 나타낸다. 그래서, 선은 식 (3)과 (4)에 따라 문자박스의 일부를 형성하는 선인 것으로 고려된다.
제26도는 문자박스의 구성요소를 도시한 것이다. 문자박스는 상측 145, 하측 146, 좌측 147, 우측 148로 구성된다. 상측 145는 선(직선) i1과 i11로 구성된다. 하측 146은 선 i2와 i222로 구성된다. 좌측 147은 선 jⅠ과 jⅡ로 구성되고, 라벨링 처리로 얻어진 부분패턴의 직사각형의 길이와 폭이 제25도에 도시한 바와 같이 Lx와 Ly인 경우에 직사각형의 각 크기에 대한 투영의 비가 소정의 임계값 THL보다 크면, 부분패턴은 문자박스의 일부를 형성하는 선의 부호자일 수가 있다.
문자박스추출부 102f는 제1의 4측면 검출부 102c의 검출결과에 따라 문자박스를 추출한다. 즉, 제1의 4측면 검출부 102c가 선을 검출할때, 문자박스 선정보에 따라 추출된다. 선이 검출되지 않으면, 문자박스를 추출하도록 검색한다.
상술한 바와 같이 문자박스의 골격을 형성하는 선을 구한 후, 이 선에서 연속하여 수평선 또는 수직선이 몇개 존재하는지를 계산한다. 계산된 값을 각 측면의 두께에 대한 기준값으로 한다.
제27(a)도는 상술한 바와 같이 추출된 굵은선으로 형성된 문자박스의 예를 도시한 것이다. 제27(a)도에 도시한 예에 의하면, 파선으로 표시된 골격선 152가 추출된 문자박스 151에 대하여 얻어진다. 2개의 화소가 이 예에서는 각 측면의 두께를 형성한다.
(B) 가는선/문자박스의 추출
가는선/문자박스 제27(a)도에 도시한 굵은선/문자박스를 추출할때에 추출되지 않는 부분패턴을 조사함으로써 추출된다.
제27(b)도는 가는선 문자박스 153과 그 골격선 154의 예를 도시한 것이다.
제27(b)도에 도시한 바와 같이, 가는선 문자박스는 1개 화소의 두께의 선으로 형성되고 직선이 아닌 경사진 상태로 보이는 패턴을 포함한다. 제27(b)도에 도시한 가는선 문자박스를 정확히 추출하기 위하여, 본 실시예에 따라 다음과 같이 문자박스를 검색한다.
즉, 선의 길이를 나타내는 n선 런 렝쓰(run lenght)는 선이 경사를 나타내는 경우에도 선을 검출하기 위해 정의된다.
통상의 런 렝쓰에서는, 수평 또는 수직으로 배열된 화소수를 계산한다. 그러므로, 제27(b)도에 도시한 바와 같이 경사를 나타내는 긴 직선은 다수개의 짧은 선으로 분할된다. 제28도에 도시한 n선 런 렝쓰에서는, n선 런 렝쓰로서 n선의 8링크 런 렝쓰를 계산한다. n값은 경사의 값에 의존한다. 경사가 클수록, n값은 더 커지게 된다. n=1일때, 통상의 런 렝쓰가 적용된다.
n값은 제28도에 도시한 예에서는 3이다. 이 예에서, 7개의 화소의 선을 수평선으로서 추출할 수가 있다.
상술한 n선 런 렝쓰에 근거하여, 문자박스추출부 102f의 추적부 102d는 링크패턴추출부 101의 라벨링부로 얻어진 직사각형의 좌표로 확인되는 직사각형의 일부를 형성하는 선의 양단, 중점증에서의 복수의 점에서 문자박스내부에서 인출된 수직선과 접촉한 부분패턴의 개시점에서 부분패턴을 따라 좌우, 또는 상향으로 선을 검색한다.
상술한 방법에서는, 문자가 문자박스의 부분적으로 중첩하더라도 가는선 문자박스를 정확히 얻을 수가 있다.
제1의 4측면 검출부 102c는 수평선의 후보에 대한 Nhi와 수직선의 후보에 대한 Nvj를 규정한다. 링크패턴추출부 101의 라벨링부에 의해 얻어진 부분패턴의 직사각형 좌표를 갖는 직사각형의 길이 Lx, 폭 Ly에 근거하여 하기식 (5)에 의해 수평선의 후보의 길이 Nhi에 대한 길이 Lx의 비를 얻고, 또한 하기식 (6)에 의해 수평선의 후보의 길이 Nvj에 대한 폭 Ly의 비를 얻어, 이들 비를 임계값 THL과 비교한다.
식 (5)와 (6)에 의해 얻어진 비가 임계값 THL보다 큰 경우에는, 수평선과 수직선의 각 후보가 문자박스의 부분을 형성하는 선의 후보인 것으로 한다.
제1의 4측면 검출부 102c는 선 검출부 102b에 의해 검출된 수평선과 수직선의 후보의 최외곽 직사각형의 수평선 i1과 i11를 조사하여 하기식 (7)과 (8)에 의해 계산을 한 후, 그 결과를 임계값 THL'과 비교한다.
문자박스추출부 102f는 상술한 바와 같이 제1의 4측면 검출부 102c에서의 검출결과에 따라 문자박스를 추출한다. 즉, 제1의 4측면 검출부 102c가 선을 검출하면, 문자박스는 이 선에 근거하여 추출된다. 선이 검출되지 않으면, 다른 후보를 검색하고, 이들 처리를 반복하여 문자박스를 최종 추출한다. 구체적으로는, 후보가 식 (7)과 (8)을 충족하면, 선을 문자박스의 부분을 형성하는 선으로서 간주한다. 후보가 상기 식들을 충족하지 않으면, 다른 후보를 검색하고 이들 처리를 반복한다. 선의 두께의 기준값은 최대좌표와 최소좌표간의 차로서 얻어진다.
1문자박스를 얻은 후에, 전체 화상에 대하여 추출된 문자박스를 스켄한다. 이 문자박스를 링크패턴추출부 101에 의해 추출된 부분패턴과 매칭(matching)시킴으로써, 다른 문자박스를 추출하는 것이 가능하다.
더우기, 추출된 문자박스의 크기에 좌우, 상하의 범위내에 존재하는 부분패턴을 추출하여, 추출한 모든 부분패턴이 후술하는 속성부가부 124d에 있어서 문자만을 포함하는 것으로서 간주된다고 판정되는 경우에, 추출된 문자박스를 이러한 부에 의하면, 문자박스에 상당하는 직사각형으로 이루어지는 國한자가 문자박스로서 일부가 오인식되는 것이 방지될 수가 있다.
문자박스교점 산출부 103은 문자박스내에 쓰여지는 문자와 문자박스와의 교점을 산출한다. 제29도에 도시한 바와 같이, 문자박스교점 산출부 103은 링크패턴 속성부가부 123, 접촉상태검출부 131, 문자박스 분리부 124, 교점 산출부 125-2, 3교점 산출부 125-1등으로 구성된다.
링크패턴 속성부가부 123은 문자박스추출부 102에서의 추출결과에 근거하여, 링크패턴추출부 101에 의해 추출된 링크패턴에 문자박스, 문자패턴의 전부 또는 일부, 또는 문자박스와 문자패턴 또는 그 일부와 접촉상태의 어느 하나의 속성을 부가한다.
문자와 문자박스사이의 접촉패턴을 의미하는 문자-박스 접촉패턴으로 할당된 링크패턴에 대하여, 접촉상태 검출부 131은 문자박스와 문자의 두께와 문자와 문자박스사이의 접촉상태를 검출한다. 즉, 문자의 두께가 문자박스의 두께보다 크고 문자가 문자박스와 약간 접촉하면, 접촉상태는 적다 한편, 문자의 두께가 문자박스의 두께와 같거나 문자가 문자박스위에 쓰여지는 경우에는, 접촉상태 많다고 판정된다. 접촉상태가 적은 경우에는, 먼저 문자박스 분리부 124는 문자박스를 분리하고 2교점 산출부 125-2는 문자와 그 문자박스와의 교점을 산출한다. 접촉상태가 많은 경우에는 3교점 산출부 125-1은 문자와 그 문자박스와의 교점을 산출한다.
3교점 산출부 125-1이 3교점을 산출한 후에는 문자박스에서 문자를 정확히 추출할 수가 있지만, 이 처리는 긴 처리시간을 필요로 한다. 그러므로, 접촉상태를 산출할 때 단지 문자와 문자박스와의 접촉상태가 복잡하게 되면, 3교점 산출부 125-1에 의해 3개의 교점을 산출한다. 그렇지 않으면, 문자-선 추출처리를 가속하기 위하여 2교점 산출부 125-2에 의해 2개의 교점을 산출할 수가 있고, 또는 시스템을 2교점 산출부 125-2 또는 3교점 산출부 125-1없이 구성될 수 있지만, 이들 중 어느 하나로 구성된다.
문자박스 분리부 124는 링크패턴 속성부가부 123에 의해 속성 문자박스 또는 문자와 문자박스와의 접촉패턴 (접촉패턴)으로 할당된 링크패턴에서 문자박스를 분리한다. 문자박스 분리부 124는 예를 들면, 제30도에 도시된 바와 같이, 문자박스의 측면의 두께를 산출하는 박스-측면 두께 산출부 124a, 문자박스를 제거하는 문자-박스 제거부 124b, 문자-박스-제거된 패턴에 라벨을 다시 부여하여 노이즈로서 작은 영역의 패턴을 제거하는 문자-박스 노이즈 제거부 124c, 및 속성부가부 124d로 구성된다. 상술한 속성부가부 124d는 문자박스를 제거한 후에도 남아있는 패턴에 속성 선-접촉문자패턴을 부가하고 문자박스를 제거한 후에 아무것도 나타내지 않는 패턴에 속성 문자박스를 부가한다.
(4) 문자박스의 분리
박스-측면 두께 산출부 124a는 문자박스의 외부 및 내부윤곽(contour)의 평탄성을 조사하고, 문자박스를 추출할때 얻어진 선의 두께의 기준값과 2(외부윤곽에 대한 1과 내부윤곽에 대한 1)의 합을 선두께로서 얻고, 문자박스를 추출할때 산출된 골격선 또는 문자박스를 추출할 때의 최대/최소위치에 근거하여 문자박스의 외부 및 내부윤곽의 좌표를 결정한다.
제31(a)도 및 제31(b)도는 문자박스의 가는선과 굵은선으로서 외부 및 내부윤곽과 골격선을 도시한 것이다. 굵은선은 외부윤곽을, 파선은 내부윤곽을 가는선은 골격선을 나타낸다. 제31(a)도는 굵은선 문자박스를 도시한 것이고, 제31(b)도는 가는선 문자박스를 도시한 것이다. 박스-측면 두께 산출부 124a는 제31(a)도와 제31(b)도에 도시한 바와 같이 가는선과 굵은선에 의해 형성된 문자박스의 외부 및 내부윤곽의 좌표를 결정한다. 제31(a)도와 제31(b)도에 있어서, 좌표계는 제32도에 도시한 바와 같이 설정된다.
박스-측면 두께 산출부 124a는 상부 문자박스의 좌표(i1-1, i11+1)를 결정하여, 문자박스의 상측의 외부 및 내부윤곽의 i의 좌표가 i1과 i11이고 선두께가 w1인 경우에 측면의 두께는 w1+2이다. 박스-측면 두께 산출부 124a는 문자박스의 하측의 좌표(i2+1, i22-1)를 결정하여, 문자박스의 하측의 외부 및 내부윤곽의 i의 좌표가 i2와 i22이고 선두께가 w2인 경우에 측면의 두께는 w2+2이다. 마찬가지로, 박스-측면 두께 산출부 124a는 문자박스의 좌측의 좌표(j1-1, j11+1)를 결정하여, 문자박스의 좌측의 외부 및 내부윤곽의 j의 좌표가 j1과 j11이고 선두께가 w3인 경우에 측면의 두께는 w3+2이다. 박스-측면 두께 산출부 124a는 문자박스의 우측의 좌표(j2+1, j22-1)를 결정하여, 문자박스의 우측의 좌표(j2+1,j22-1)를 결정하여, 문자박스의 우측의 외부 및 내부윤곽의 j의 좌표가 j2와 j22이고 선두께가 w4인 경우에 측면의 두께는 w4+2이다.
문자-박스 제거부 124b는 박스-측면 두께 산출부 124a에 의해 얻어진 문자박스의 외부 및 내부윤곽의 좌표에 근거하여 외부와 내부윤곽사이에 존재하는 문자박스의 패턴을 제거한다.
문자-박스 노이즈 제거부 124c는 문자-박스 제거부 124b에 의해 문자박스를 제거한 패턴에 라벨을 다시 부여하고, 각 라벨에 대하여 작은 영역등과 같은 패턴의 특징을 추출하여, 추출정보에 따라 문자박스의 일부로서 남아있는 패턴을 제거한다.
속성부가부 124d는 링크패턴 속성부가부 123에 의해 속성을 할당하지 않은 패턴을 조사하고, 패턴의 내부윤곽을 제거한 후에 아직도 남아있는 패턴에, 패턴이 선-접촉패턴 또는 문자의 일부인 것으로 하는 패턴의 속성을 부가한다. 문자박스를 제거한 후에 사라지는 패턴에 문자박스를 나타내는 패턴속성을 부가한다.
그 다음에, 문자 또는 선-접촉 문자패턴의 일부가 후술하는 바와 같은 문자박스내에 문자부분을 보간한 후에 문자 또는 선-접촉문자 패턴의 일부로 일체화 되는지가 판정되거나 단일 패턴으로서 규정된다.
제33도는 3교점 산출부 125-1의 구성예를 도시한 블럭도이다.
접촉상태가 많고 문자가 문자박스와 복잡하게 접촉하면, 문자박스를 분리함이 없이 3교점 산출부에 의해 문자박스와 문자와의 교점을 산출한다.
문자/박스 교점 산출부 2511은 선-접촉문자패턴 또는 문자의 부분과 그 문자박스와의 교점을 산출한다. 즉, 문자박스분리부 124에 의해 얻어진 문자박스의 외부 및 내부윤곽의 부분을 형성하는 선에 대한 정보에 따라서, 문자박스의 외부윤곽의 외측의 1화소의 첫번째 선과 문자박스의 내부윤곽의 내측의 1화소의 두번째 선이 얻어진다. 선-접촉문자패턴 또는 문자의 부분과 첫번째 및 두번째 선과의 교점에서, 패턴이 흑에서 백으로, 또는 백에서 흑으로 변화되는 점을 얻어 교점(문자와 문자박스와의 교점)으로서 추출한다. 본 실시예에서는, 문자와 문자박스와의 교점을 2개의 점 x와 y를 사용하여(x,y)로서, 즉 문자와 소정의 선의 두께와의 교점으로서 표시한다. x와 y는 상술한 통상의 i-j좌표계에서는 (i,j)로 표시된다. 즉, 상측의 외부윤곽과 문자와의 교점, 상측의 내부윤곽과 문자와의 교점, 및 마찬가지로 문자와 문자박스의 하측, 좌우측의 외부 및 내부윤곽의 교점을 산출한다.
박스외 문자교점 산출부 2512는 안쪽의 방향, 즉 각 문자와 그 문자박스와의 교점에서 문자박스의 중심으로의 방향으로 문자의 일부를 형성하는 선을 검색하고, 문자박스의 교점을 산출하여 문자의 일부를 형성하는 선이 선 검색시에 부서진 경우에는, 산출된 교점이 문자와 문자박스와의 교점이 아닌 것으로 판정된다.
박스외 문자교점산출부 2513은 바깥의 방향, 즉 문자박스에서 문자박스의 외측으로의 방향으로 문자의 일부를 형성하는 선의 면적을 구한다. 바깥쪽의 방향은 문자박스에서 외측으로의 방향이고 안쪽의 방향과 반대이다. 외측의 교점은 문자박스에서 벗어난 교점을 가리킨다. 상기 문자의 일부를 형성하는 2개 선의 면적의 합이 소정의 값보다 작으면, 문자/박스 교점판정부 2514는 문자를 형성하는 선을 노이즈로서 판정하여 이를 제거하고, 교점이 문자와 문자박스와의 교점이 아니라고 판정한다.
제34도는 2교점 산출부 125-2의 실시예를 도시한 블럭도이다. 문자/박스 교점 산출부 2511은 상기한 선-접촉문자패턴에서 문자박스와 문자와의 교점을 산출한다. 박스외 문자교점 산출부 2513은 문자박스를 형성하는 선두께에 의해 바깥쪽의 방향, 즉 문자박스에서 문자박스의 외측으로의 방향으로 문자의 일부를 형성하는 선을 검색하고, 문자박스의 외측의 교점을 산출하여 문자의 일부를 형성하는 선의 면적을 구한다.
박스내 문자교점 산출부 2512에 의해 얻어진 문자선의 면적이 소정의 임계값보다 작으면, 박스외 문자교점산출부 2513은 문자선이 노이즈인 것으로 하여 이를 제거하여 교점이 문자와 그 문자박스와의 교점이 아닌 것으로 판정한다.
이하에 제22도에 도시한 블럭도에 대하여 설명한다.
교점대응부 104는 문자박스교점산출부 103에 의해 얻어진 교점정보에 따라 선-접촉문자를 형성하는 선의 방향성을 구한다. 그 다음에, 문자박스의 양측과 접촉하는 2개의 문자선간의 거리 d1를 구한다. 더우기, 교점대응부104는 상기 방향성, 2개의 문자선간의 거리 d1,및 그 방향에 의한 문자선의 연속성의 조건에 따라 문자와 그 문자박스와의 교점을 대응시킨다. 교점대응부 104는 예를 들면 3교점대응부와 2교점대응부으로 구성된다.
3교점대응부는 3교점산출부 125-1에 의해 얻어진 3종류의 교점정보, 문자박스에서 벗어난 교점, 문자와 그 문자박스와의 교점, 및 박스내 교점에 따라 문자선의 방향성을 구한다. 더우기, 상술한 방향성, 문자선과 문자박스와의 교점에서 얻어진 2개 문자선간의 거리 d1,및 그 방향에 의한 문자선의 연속성의 조건에 따라 문자와 문자박스와의 교점을 대응시킨다.
2교점대응부는 2교점대응부 125-2에 의해 얻어진 2종류의 교점정보 문자와 문자박스와의 교점, 문자박스외 교점에 따라 문자선의 방향성을 구한다. 더우기, 상술한 방향성, 문자박스외 교점에 의해 얻어진 문자선간의 거리, 그 방향에 의한 문자박스의 연속성의 조건에 따라 문자와 문자박스와의 교점을 대응시킨다. 그 다음에, 대응시킨 교점을 접속하여 문자박스분리부 124에 의해 그 문자박스와 분리된 문자패턴을 복구하는 보간처리를 행한다.
본 실시예에서는, 보간된 문자패턴을 가상문자선으로서 취급한다.
3교점대응부에 의해 행해진 처리를 보다 상세히 설명한다.
3교점대응부 3종류의 교점정보, 문자박스에서 벗어난 교점, 문자와 문자박스와의 교점, 및 박스내 교점에 따라 문자선의 방향성을 구한다. 문자선의 방향이 같은 것으로 판정되는 경우에는, 문자와 그 문자박스와의 교점을 대응시킨다. 방향성이 서로 관련되는 조건 또는 연속성에 관련하는 조건 또는 연속성에 관련하는 조건이 만족되는 경우에는 문자와 문자박스와의 교점을 대응시킨다. 문자박스내의 교점을 대응시키기 위해 조건을 판정하므로, 문자와 그 문자박스와의 교점을 정확히 대응시킬 수가 있다.
제35도는 방향성이 일치하는 경우에 문자와 그 문자박스와의 교점간의 대응관계를 도시한 것이다. 제35도에 있어서, 빗금친 부분은 예를 들면, 테이블에서 광학적으로 판독된 흑화소의 화상을 표시한 것이다. 흑도트(black dot)는 문자와 문자박스와의 교점을, 흑삼각형은 문자박스에서 벗어난 교점을, 화살표 H1과 H2는 방향성을 표시한 것이다. 제36도는 방향성이 일치하지 않는 경우에 문자와 문자박스와의 교점간의 대응관계를 도시한 것이다. 제36도에 있어서, 빗금친 부분은 예를 들면, 테이블에서 광학적으로 판독된 흑화소의 화상을, 흑도트는 문자박스와 문자와의 교점을, 흑삼각형은 문자박스에서 벗어난 교점을, 화살표 H1'과 H2'는 방향성을 표시한 것이다.
제35도에 있어서는, 문자박스내의 가상 문자선이 대각선 방향에 있다는 것으로 판단되고, 제36도에 있어서는, 문자박스내의 가상 문자선이 방향성을 갖지 않는다는 것으로 판단된다.
제37도는 상술한 3교점대응부에 의해 행한 처리의 실시예를 보다 상세히 도시한 흐름도이다.
먼저, 3교점대응부는 3교점대응부 125-1에서 교점등에 관한 정보를 받고(단계 S61), 다음에 문자박스의 일부를 형성하는 선두께를 설정한다(단계 S62). 그 다음에, 문자박스의 외측의 문자선의 하나의 패턴(제1의 패턴)의 방향성 H1을, 문자와 문자박스와의 교점 P11(A,B), 문자박스내의 교점 P1n(An, Bn), 및 문자박스에서 벗어난 교점 P1t(At,Bt)에 근거하여 구한다(단계 S63). 교점 P11(A,B)는 교점 P11의 좌단의 좌표가 A, 우단의 좌표가 B인 것을 표시한다. 그 밖의 교점 P1n과Plt뿐만 아니라P21, P2n, P2t에 대하여도 마찬가지의 정보를 얻을 수 있다. 더우기, 문자와 문자박스와의 교점P21(C,D), 문자박스내의 교점 P2n(Cn,Dn), 및 문자박스에서 벗어난 교점 P2t(Ct,Dt)에 근거하여 문자박스의 외측의 문자선의 다른 패턴(제2의 패턴)의 방향성 H2를 구한다. 그 다음에, 상기의 방향성H1이 방향성H2와 같은 것으로 간주될 수 있는지 여부가 판단된다(단계 S65). 이와 같이, 단계 S63∼S65에서 문자박스의 외측의 2개 문자선 패턴의 방향성이 서로 일치하는지 여부를 확인한다.
단계 S65에서의 판정결과가 NO이면, 문자박스내의 교점 P1n의 중점 T1을 식(An+Bn)/2에 의해 구할 수가 있다(단계 S66). 그 다음에, 문자박스내의 교점 P2n의 중점T2를 식(Cn+Dn)/2에 의해 구할 수가 있다(단계 S67). 다음에, 문자박스내의 교점 P1n과 P2n간의 거리 KN을 ABS(T1-T2)에서 구한다(단계 S68). ABS는 (T1-T2)의 절대값을 나타내는 기호이다.
다음에, KN이 W보다 작은지 (KNW)의 여부를 판정한다(단계 S69). 단계 S69에서의 판정결과가 NO이면, 2개 교점 P11과 P21의 좌단과 우단간의 거리 L1과 L2를 식 (C-B)와 (A-D)에 의해 구한다(단계 S70). 다음에, 거리 L1이 0보다 큰지의 여부를 판정한다(단계 S71). 그 판정결과가 단계 S71에서 YES이면, L1이 w/2보다 작은지 (L1w/2)의 여부, 즉 거리 L1이 문자박스의 일부를 형성하는 선두께의 절반보다 작은지의 여부를 판정한다(단계 S72). 단계 S71 또는 S72에서의 판정결과가 NO이면, L2가 0보다 큰지 (L20)의 여부, 즉 상기한 거리 L2가 0보다 큰지의 여부를 판정한다(단계 S73). 단계 S73에서의 판정결과가 YES이면, L2가 w/2보다 작은지 (L2w2)의 여부를 판정한다. 즉, 거리 L2가 문자박스 w의 두께의 절반보다 작은지의 여부를 판정한다(단계 S74).
이와 같이, 문자박스내의 2개의 교점 P1n과 P2n간의 거리 KN과 문자와 문자박스와의 교점 P11과 P21간의 거리 L1과 L2와 문자박스의 두께 w와의 거리관계를 판정한다.
단계 S73 또는 S74에서 판정결과가 NO이면, AnCnBn의 여부를 판정한다(단계 S75). 단계 S75에서의 판정결과가 NO이면, AnDnBn의 여부를 판정한다(단계 S76). 단계 S76에서의 판정결과가 NO이면, 처리는 단계 S63으로 복귀된다.
이와 같이, 단계 S75와 S76에서, 문자와 문자박스와의 교점 P11과 P12의 위치정보 A, B, C, 및 D에 근거하여 문자박스의 외측의 2개의 문자선에 대하여 선의 연속성의 조건이 만족되는지 여부를 확인한다.
단계 S65, S69, S72, S74, 또는 S76에서의 판정결과가 YES이면, 후술하는 박스내 문자추출부 105에 의해 행해지는 처리로 이행한다(단계 S77).
3교점대응부이 제37도의 흐름도로 도시한 처리에 따라 문자박스내의 교점을 대응시키기 위한 조건을 판정하므로, 문자와 문자박스와의 교점을, 예를 들면 제38(a)도, 제38(b)도, 제38(c)도, 제39(a)도 및 제39(b)도에 도시한 바와 같이 정확히 대응시킬 수가 있다.
제38(a)도-제38(c)도는 문자박스내에 교점을 대응시킨 경우를 도시한 것이다. 빗금친 부분은 예를 들면 테이블에서 광학적으로 판독된 흑화소의 화상을, 흑도트는 문자박스와 문자와의 교점을, 흑직사각형은 문자박스내의 교점을 표시한 것이다. 제38(a)도는 테이블등에서 판독된 실제의 화상패턴을 도시한 것이고, 제38(b)도는 문자와 그 문자박스와의 교점을 대응시킨 것이 아니라 제38(c)도에 도시한 바와 같이 문자와 문자박스와의 2개의 교점 P11(A,B)와 P21(C,D)를 제37도에 도시한 흐름도에서 단계 S75에서 만족된 조건 AnCnBn으로 서로 대응시킨 것을 도시한 것이다.
제39도는 문자박스내의 교점을 대응시키지 않은 경우를 도시한 것이다. 빗금친 부분은 테이블등에서 광학적으로 판독된 흑화소의 화상을, 흑도트는 문자박스와 문자와의 교점을, 흑직사각형은 문자박스내의 교점을 표시한 것이다. 제39(a)도는 실제의 화상패턴을 도시한 것이다. 제39(b)도는 문자박스내의 2개의 교점 P1n(An,Bn)과 P2n(Cn,Dn)의 위치를 고려하여, 문자와 그 문자박스와의 2개의 교점 P11(A,B)와 P21(C,D)를 서로 대응시키지 않는 것을 도시한 것이다. 제38(c)도와 제39(b)도에 있어서는, 문자박스내의 교점 An, Bn, Cn 및 Dn을 설명이 이해하기 쉽도록 문자박스의 외주상에 도식화하였다
이하에, 2교점대응부의 동작을 상세히 설명한다.
2교점대응부는 문자박스에서 벗어난 교점과 문자와 문자박스와의 교점의 좌표에 근거하여 문자박스상에 쓰여진 2개 문자선의 패턴의 방향성을 산출한다. 2개 문자선의 방향이 거의 같은 경우에는, 그 방향성이 동일하고 문자와 문자박스와의 2개의 교점을 서로 대응한 것으로 판정한다. 방향성이 일치하지 않는 경우에도, 문자와 문자박스와의 2개의 교점을 서로 대응한 것으로 판정한다. 방향성이 일치하지 않는 경우에도, 문자와 문자박스와의 교점간의 거리의 조건 또는 연속성의 조건이 만족되면 문자와 문자박스와의 2개 교점을 대응시킨다.
제40도는 2교점대응부에 의해 행해진 처리의 실시예를 보다 상세히 도시한 흐름도이다. 교점 P11(A,B), P1t(At,Bt), P21(C,D) 및 P2t(Ct,Dt)는 제37도의 흐름도에 도시한 것과 같다.
먼저, 교점등에 관한 정보를 2교점산출부 125-2에서 받고(단계 S81), 문자박스를 형성하는 선두께를 w로 설정한다(단계 S82). 그 다음에, 문자박스상의 한쪽의 교점에서의 문자와 문자박스와의 교점 P11(A,B)와 문자박스상의 다른쪽의 교점에서의 교점 P11에 상당하는 교점P1t(At,Bt)에 근거하여 문자박스의 외측의 한쪽의 문자선의 패턴(제1의 패턴)의 방향성 H1을 구한다(단계 S83). 그 다음에, 문자박스상의 한 교점에서의 문자와 문자박스의 교점 P21(C,D)와 문자박스상의 다른 교점에서의 교점 P21에 상당하는 교점P2t(Ct,Dt)에 근거하여 문자박스의 외측의 다른쪽의 문자선의 패턴(제2의 패턴)의 방향성 H2를 구한다(단계 S84). 그 다음에, 방향성 H1과 H2가 동일한지의 여부를 판정한다(단계 S85). 이와 같이, 단계 S83∼S85에서 문자박스의 외측의 2개의 문자선의 패턴의 방향성간의 대응관계를 판정할 수가 있다. 단계 85에서의 판정결과가 NO이면, 문자와 문자박스와의 교점 P11의 중점 T1의 좌표(A+B)를 2((A+B)/2)로 나눈다(단계 S87). 그 다음에, 2개의 교점 P11과 P12간의 거리 K의 ABS(T1-T2)의 절대값을 표시한다.
K가 w보다 작은지 (Kw)의 여부를 판정한다(단계 S89). 단계 S89에서의 판정결과가 NO이면, 상기 2개의 교점 P11과 P21의 우단과 좌단간의 거리 L1과 L2를 각각 (C-B)와 (A-D)를 산출함으로써 구한다. 그 다음에, L1이 0보다 큰지 (L10)의 여부를 판정한다(단계 S91). 단계 S91에서의 판정결과가 YES이면, L1w인지의 여부를 판정한다(단계 S92). 단계 S91 또는 S92에서의 판정결과가 NO이면, L2가 0보다 큰지 (L20)의 여부를 판정한다(단계 S93). 단계 S93에서의 판정결과가 YES이면, L2w/2인지의 여부를 판정한다(단계 S94).
이와 같이, 문자와 문자박스와의 교점 P11과 P21간의 거리 k와 문자박스의 두께 w와의 차와, 교점 P11과 P21의 양단과 좌단간의 거리 L1과 L2와 문자박스를 형성하는 선의 두께 w와의 차를 판정한다.
단계 S93 또는 S94에서의 판정결과가 NO이면, ACB인지의 여부를 판정한다(단계 S95). 단계 S95에서의 판정결과가 NO이면, ADB인지의 여부를 판정한다(단계 S96). 단계 S96에서의 판정결과가 NO이면, 단계 S83으로 복귀된다.
이와 같이, 단계 S95와 S96에서 연속성의 조건이 문자와 문자박스와의 교점 P11과 P21에 관한 위치정보 A, B, C 및 D에 따라 문자박스의 외측의 2개의 대응하는 문자선에 만족되는지 여부를 확인한다.
단계 S85, S89, S92, S94 또는 S96에서의 판정결과가 YES이면, 박스내 문자추출부 105에서의 박스내 문자보간부 1051로 이행한다(단계 S97).
제22도에 도시한 박스내 문자추출부 105는 교점대응부 104에 의해 대응시킨 교점에 의해 규정된 문자박스내의 화상이 문자성분인 것으로 판정한다. 문자성분을 추출하여 다른 문자성분을 문자박스를 형성하는 화상으로 인식하여 제거한다. 이와 같이, 제41(a)도에 도시한 패턴의 경우에서는, 도트로 표시된 문자성분 161을 제41(b)도에 도시한 바와 같이 가상 문자성분으로서 잠정적으로 추출한다. 제41(a)도와 제41(b)도에 있어서, 빗금친 부분은 테이블등에서 광학적으로 판독된 흑화소의 화상을, 흑점은 문자박스와 문자와의 교점을 표시한다.
제42도는 박스내 문자추출부 105에 의해 행해진 처리의 실시예를 보다 상세히 도시한 흐름도이다.
박스내 문자추출부 105는 3교점대응부에 의해 상술한 바와 같이 대응시킨 교점등에 관한 정보를 받고(단계 S101), 이 정보에 따라 대응시킨 교점 P11(A,B)와 P21(C,D)을 지나가는 선 L1과 L2를 산출한다. 그 다음에, 교점 P11을 갖는 문자박스의 외부의 부분을 형성하는 선 L3을 산출하고(단계 S103), 교점 P21을 갖는 문자박스의 다른쪽의 외주의 부분을 형성하는 선 L4를 산출한다(단계 S104). 4개의 선 L1, L2, L3 및 L4에 의해 에워싸는 문자박스내의 흑화소의 부분이 있는지의 여부를 판정한다(단계 S105). 단계 S105에서의 판정결과가 YES이면, 즉 대응하는 흑화소가 존재하면, 흑화소를 가상 문자선으로서 추출하여(단계 S106), 문자열추출처리로 이행한다(단계 S108). 한편, 단계 S105에서의 판정결과가 NO이면, 문자박스를 제거하여(단계 S107), 단계 S108로 이행한다.
이하에, 박스내 문자추출부 105내의 박스내 문자보간부 1051에 대하여 설명한다. 박스내 문자보간부 1051은 상술한 2교점대응부에 대응하여 설치된다. 교점이 일 대 일로 대응하는 경우와 일 대 다로 대응하는 경우에 대하여 선-접촉문자패턴 또는 그 일부의 교점을 원활하게 접속하여 문자박스를 제거할 때 손실된 문자패턴을 보간한다. 본 실시예에서는, 보간된 문자선이 가상 문자선인 것으로 한다.
제43도는 박스내 문자보간부 1051의 실시예를 도시한 블럭도이다. 제43도에 도시한 단순보간부 1051a는 일 대 일 대응 선-접촉문자패턴 또는 그 일부의 교점을 원활하게 접속하여 가상 문자선을 생성한다. 일 대 일 보간인 경우에는, 교점간의 문자선의 윤곽에 대하여 방향벡터를 산출한다. 이 방향벡터에 따라 각 교점에서 직선을 인출한다. 선들간의 교점에서 문자선을 접속한다. 방향벡터 산출처리를 생략하기 위하여, 대응된 교점을 접속하여 보간할 수가 있다.
제44(a)도 및 제44(b)도는 일 대 일 단순보간의 예를 도시한 것이다. 제44(a)도는 문자선 171a와 171b 및 문자박스 172를 도시한 것이고, 제44(b)도는 보간된 문자선 173을 도시한 것이다. 이 예에서는, 대응하는 교점을 접속하여 보간을 한다. 제44(a)도와 제44(b)도에 도시한 바와 같이, 문자선 171a와 문자박스 172와의 교점의 좌단의 점에서의 화소 ak, 문자선 171b와의 교점의 좌단의 점에서의 화소 ak, 문자선 171b와 문자박스 172와의 접촉의 좌단의 점에서의 화소 a'k, 문자선 171a와 문자박스 172와의 교점의 우단의 점에서의 화소 bk, 및 문자선 171b과 문자박스 172와의 교점의 우단의 점에서의 화소 b'k를 2개의 선 La와 Lb에 의해 접속한다. 문자박스 172내의 2개의 선 La와 Lb에 의해 둘러싸인 영역을 제44(b)도에 빗금친 직사각형으로 표시한 바와 같이 다수개의 흑화소 74로 매립하여, 2개의 문자선 171a와 171b를 보간하여 보간된 문자선 173을 구한다. 본 실시예에 의하면, 문자박스 172내에 흑화소 174로 매립된 보간 문자선 173의 부분을 잠정적으로 가상 문자선인 것으로 한다.
제45도는 단순 보간부 1051a에 의해 행해진 처리의 실시예를 보다 상세히 도시한 흐름도이다.
이하, 설명의 이해를 돕기 위하여, 제44(a)도와 제44(b)도에 도시한 예를 설명한다. 제44(a)도와 제44(b)도에 있어서, f(cc,p)는 보간에 의해 생성된 흑화소의 좌표를, 값(cc,p)는 흑화소의 위치를 표시한다. cc는 i축의 값이고 p는 j축의 갑이다(제44(a)도 참조).
제44(a)도에 있어서, 2개의 화소 ak를 a'k와 접속하는 선 La와 2개의 화소 bk를 b'k와 접속하는 선 Lb를 구한다(단계 S131). 다음에, 제44(a)도에서, 각 문자선 171a와 171b에 대하여 문자박스 172를 형성하는 선에서 아래쪽으로 1화소의 점의 i좌표를 c와 c'로서 구하므로, c≤cc≤c'의 범위내의 모든 i좌표에 대하여 단계 S132와 S133의 처리를 행한다. 즉, j좌표 pa와 pb를 선 La와 Lb와 문자박스 172내의 선 i=cc와의 교점으로서 구한다(단계 S132). 다음에, j방향으로의 값을 나타내는 변수 p를 pa≤p≤pb의 범위내에서 변화시키면서, 상술한 조건을 만족시키는 좌표값 p마다 화소의 위치(cc,p)에서의 흑화소 f(cc,p)를 생성한다. 이 흑화소 f(cc,p)에 의해 형성된 가상 문자선에 패턴을 설정한다(단계 S133).
이와 같이, 단계 S132와 S133의 처리는 c≤cc≤c'의 범위내에서 cc값을 변화시키면서 반복된다. 최종적으로, c≤cc≤c'의 범위내에서 i좌표와 pa≤p≤pb의 범위내에서 j좌표의 조건을 충족하는 모든 흑화소 f(cc,p)를 가상 문자선을 형성하는 화소로서 생성한다.
일 대 다 교점보간처리에서는, 교차점 산출부 1051b는 각 문자선의 윤곽의 방향벡터를 산출하고, 방향벡터에 따라 각 문자선과 문자박스와의 접점에서 선을 인출하여 선의 교점을 구한다. 방향벡터의 산출처리를 생략하기 위하여, 방향벡터를 대응시킨 교점을 접속하는 선으로 대체할 수가 있다.
상술한 바와 같이 교차점 산출부 1051b가 산출한 후에, 박스내 교차점 보간부 1051b가 요소를 보간한다.
제46(a)도 및 제46(b)도는 박스내 교차점 보간부 1051c에 의해 박스내 교점에 대한 요소를 보간하는 예를 도시한 것이다. 제46(a)도는 3개의 문자선 181a, 181b, 181c, 문자박스 182, 문자박스 182의 외부윤곽 182a, 내부윤곽 182b를 도시하고 있다. 제46(b)도는 상술한 3개의 문자선 181a, 181b, 181c를 보간하여 얻은 문자선 183을 도시하고 있다. 이 예에서는, 교점대응부 104에 의해 대응시킨 교점(AK와 AK', BK와 B'K, CK와 A'K, DK와 B'K)를 연결하는 4개의 선 L1, L2, L3 및 L4로 방향벡터를 대체한다. 대응시킨 교점을 직선으로 연결하고 선의 교차점 CRP가 제46(b)도에 도시한 바와 같이 문자박스 182내에 있는 경우에는, 상술한 교점을 연결하는 선 L1, L2, L3 및 L4로 방향벡터를 대체한다. 대응시킨 교점을 직선으로 연결하고 선의 교차점 CRP가 제46(b)도에 도시한 바와 같이 문자박스 182내에 있는 경우에는, 상술한 교점을 연결하는 선 L1, L2, L3 및 L4로 둘러싸인 영역을 흑화소 184로 매립하여 문자선 183을 생성한다. 흑화소 184로 매립된 패턴은 가상 문자선으로서 규정된다.
제47도는 상술한 대응선의 교차점 산출부 1051b의 처리의 실시예를 보다 상세히 도시한 것이고, 처리를 소프트웨어로 실현하는 경우의 흐름도이다. 설명의 이해를 돕기 위하여, 이하에 제46(a)도에 도시한 예를 설명한다.
제47도에 있어서, 교점대응부 104에 의해 입력된 교점에 관한 정보에 근거하여 일 대 다 보간을 하는지의 여부를 판정한다(단계 S141). 단계 S141에서의 판정결과가 YES이면, 제46(a)도에 도시한 바와 같이 대응시킨 교점을 연결하는 선 L1∼Ln(n=2,3,…)을 산출한다. 상술한 단계 S142 또는 S143후에, 교점이 문자박스 182내에 있는지의 여부를 판정한다(단계 S144). 이하에 설명된 박스내 교차점 보간부 1051c의 처리로 이행한다(단계 S145). 단계 S144에서의 판정결과가 NO이면, 교차점이 문자박스내에 있는지의 여부를 판정한다(단계 S146). 단계 S146에서의 판정결과가 YES이면, 박스외 교차점 보간부 1051d에 의한 처리로 이행한다(단계 S147). 단계 S146에서의 판정결과가 NO이면, 선 보간부 1051e에 의한 처리로 이행한다(단계 S148).
제48도는 박스내 교차점 보간부 1051c에 의한 처리의 실시예를 보다 상세히 도시한 흐름도이다. 제48도에서, 제46(a)도에 도시한 문자박스 182의 외부윤곽 182a의 i좌표는 in이고 문자박스 182의 내부윤곽 182b의 i좌표는 ig이다. 더우기, 변수 q와 p는 각각 i와 j좌표의 할당값이다. f(q,p)는 (q,p)에서 화소의 밀도를 표시한다. 제46(a)도에 도시한 문자박스 182내의 교차점 CRP, 즉 문자박스 182내의 2개의 선 L2와 L3의 교차점 CRP의좌표는 (ik,jk)이다.
제48도에 있어서, 단계 S162∼S165의 처리를 i좌표의 값이 설정되는 변수 q의 값을 in≤q≤ik의 범위내에서 변화시키면 반복한다. 즉, 선 L1, L2와 선 i=q와의 교점으로서 j좌표의 값 pa, pb를 구한다(단계 S162). j좌표의 값이 설정되는 변수 p의 값을 pa≤p≤pb의 범위내에서 변화시키면서 화소 f(q,p)를 가상 문자선의 일부를 형성하는 흑화소로서 설정한다(단계 S163). 상술한 단계 S162와 S163과 병행하여 다음의 단계 S164와 S165를 행한다.
즉, j좌표의 값 pa, pb를 선 L3, L4와 선 i=q와의 교점으로서 구한다(단계 S164). 변수 p의 값을 pa≤p≤pb의 범위내에서 변화시키면서 화소 f(q,p)를 가상 문자선의 일부를 흑화소로 설정한다(단계 S165).
단계 S162∼S165의 처리를 종료하면, 변수 q를 ik≤q≤ig의 범위내에서 변화시키면서 단계 S166과 S167의 처리를 반복한다. 즉, j좌표의 값 pa, pb를 선 L1, L4와 선 i=q와의 교점으로서 구한다(단계 S167). 변수 p를 pa≤p≤pb의 범위내에서 변화시키면서 화소 f(q,p)를 가상 문자선의 일부를 형성하는 흑화소로서 설정한다(단계 S168).
이와 같이, 문자박스 182내의 문자선 183을 제46도에 도시한 바와 같이 생성한다.
제49도는 박스외 교차점 보간부 1051d에 의한 처리의 실시예를 보다 상세히 도시한 흐름도이다. 제49도에 있어서는, 제48도에 도시한 단계에 대하여 동일한 단계번호를 부여하였고, 그 설명은 생략한다. 제49도에 도시한 흐름도에서의, 문자박스를 형성하는 선두께에 의한 문자박스의 외부윤곽의 i좌표 ig의 안쪽(i좌표의 음방향)의 i좌표는 (ig-w)이다.
제49도에 도시한 흐름도에 의한 처리는, 변수 q를 in≤q≤ig-w의 범위내에서 변화시키면서 단계 S162∼S165의 처리를 반복하고 변수 q를 iq-w≤1≤ig의 범위내에서 변화시키면서 단계 S166∼S167의 처리를 반복한다는 것이외는 제48도에 도시한 것과 거의 같다.
제50도는 선보간부 1051e에 의한 처리의 실시예를 보다 상세히 도시한 흐름도이다. 제50도에 있어서, 제48도에 도시한 단계에 대하여 동일한 단계부호를 부여하였고, 그 설명은 생략한다.
제50도에 도시한 흐름도에 의한 처리는 변수 i를 특정값으로 고정하고, 변수 p를 pa≤p≤pb의 범위내에서 변화시키면서 단계 S162와 S163에서의 처리와 단계 S164과 S165에서의 처리를 반복하며, 변수 q를 is≤q≤is+w의 범위내에서 변화시키면서 단계 S166과 S167에서의 처리를 반복한 것 이외는 제48도에 도시한 것과 거의 동일하다.
교점이 다른 어떠한 교점으로도 대응될 수 없는 경우에는, 제51도에 도시한 흐름도에 따라 처리되어야 한다. 제48도에 도시한 단계에 대하여는 동일한 단계번호를 부여하였고, 그 설명은 생략한다.
제51도에 도시한 처리는 단계 S161의 처리를 변수 q를 단계 S166c에서 is≤q≤ig의 범위내로 설정한 것 이외는 제48도에 도시한 것과 거의 동일하다.
본 실시예에 의하면, 문자박스내의 선-접촉문자의 일부를 형성하는 선을 가상 문자선으로서 잠정적으로 추출한다. 다음에, 평균문자크기 산출부 106은 상술한 가상 문자선을 추출한 문자를 포함하는 문자열에서 평균문자크기를 구한다. 이러한 문자열은 테이블에 행 또는 열로 쓰여질 수도 있다.
제52도는 제22도에 도시한 평균문자크기 산출부 106에 의한 처리를 도시한 흐름도이다.
평균문자크기 산출부 106은 박스내 문자추출부 105에 의해 추출된 각 문자의 크기를 구한다. 문자는 선-접촉문자일 수 있고 상술한 가상 문자선을 포함한다. 문자크기의 산출시에, 링크패턴추출부 101에 의해 얻어진 후에 각 문자에 관한 링크정보를 사용할 수가 있다. 즉, 각 문자의 링크정보에 따라 링크화상을 근사시킴으로써 얻어진 직사각형의 정점의 좌표를 사용하여 문자크기를 산출한다(단계 S171).
그 다음에, 박스내 문자추출부 105에 의해 추출된 문자의 라벨위치정보에 따라 문자열을 추출한다(단계 S172).
다음에, 각 추출된 문자열에 대하여 평균문자크기 TH를 산출한다(단계 S173). 테이블과 목록이 수직 및 수평방향으로 문자박스를 포함할 수 있으므로, 상술한 단계 S173 이전의 선처리로서 문자박스가 수직인지 수평인지를 판정한다. 평균문자크기 TH는 문자를 포함하는 수평 직사각형 또는 수직 직사각형중 어느 하나에 관한 크기정보를 포함한다.
평균문자크기 TH는 예를 들면, 이하의 방법에 의해 산출될 수가 있다. 먼저, 물체문자열의 문자수를 n으로 표시한다. 물체문자열의 문자크기는 수평방향에서 j[m]이고 수직방향에서는 i[n]이다. 평균문자크기 TH는 수평방향에서 avej이고 수직방향에서는 avei이다.
문자크기 산정부 107은 평균문자크기 산출부 106에 의해 얻어진 문자열의 평균문자크기 TH와 각 추출된 문자의 크기와를 비교한다. 부적당한 크기인 것으로 간주되는 문자패턴이 여분의 가상 문자선을 포함하는 경우에는, 문자크기 산정부 107은 문자패턴에서 여분의 가상 문자선을 분리한다.
제53도는 제22도에 도시한 문자크기 산정부 107의 실시예를 도시한 흐름도이다.
문자크기 산정부 107은 평균문자크기 산출부 106에 의해 얻어진 평균문자크기 TH에 근거하여 최대문자크기 THmax와 최소문자크기 THmin을 산출한다(단계 S181). 최대문자크기 THmax와 최소문자크기 THmin은 추출된 문자패턴에서 문자를 정확히 검색할때에 임계값으로서 사용된다.
최대문자크기 THmax는 이하식으로 산출될 수가 있다. THmaxj=avej+5 또는 THmaxi=avei+5(5는 1화소의 5배정도 큰 크기를 나타낸다.)
최소문자크기 THmin은 이하식으로 산출될 수가 있다. THminj=avej-5 또는 THmini=avei-5(5는 1화소의 5배정도 큰 크기를 나타낸다.)
또는 THminj=avej×0.9 또는 THmini=avei×0.9
제54도는 최대문자크기와 최소문자크기의 예를 도시한 것이다.
제54도에 있어서, 이중선 직사각형 191은 평균문자크기 TH를, 단일 실선 직사각형 192는 최대 평균문자크기 THmax를, 파선 직사각형 193은 최소문자크기 THmin을 표시한다.
문자열중의 모든 문자에 대하여 단계 S183∼S187의 처리를 아래와 같이 행한다. 즉, 문자열에서 제1의 문자(문자패턴)를 검색하고(단계 S182), 문자패턴이 최대문자크기 THmax보다 큰지의 여부를 판정한다(단계 S183). 문자패턴이 최대문자크기 THmax보다 큰 경우에는(단계 S183에서 yes인 경우에는), 문자패턴이 국부적으로 대응된 부분인지의 여부를 판정한다(단계 S184). 국부적으로 대응된 부분은 문자박스의 추출후에 가상 문자선에 의해 형성되고(국부적으로 대응되고) 박스내 문자추출부 105에 의해 행해진 문자 보간처리에 의해 생성된 화상인 것으로 한다. 즉, 단계 S184에서, 단계 S182에서 검색된 문자패턴이 가상 문자선을 포함하는지의 여부를 판정한다.
교점대응부 104에 의해 얻어진 교점(문자와 그 문자박스와의 교점)간의 대응정보에 따라 문자가 국부적으로 대응된 부분인지의 여부에 대한 판정을 한다. 즉, 문자와 문자박스와의 교점이 다른 교점과 대응되는 경우에, 문자가 국부적으로 대응된 부분을 갖는 것으로 판정한다.
이러한 국부적으로 대응된 부분이 상술한 문자패턴에 존재하지 않는다고 판정되는 경우(단계 S184에서 NO인 경우)에, 상술한 문자패턴을 단일 문자로서 인식하여 단계 S188로 이행한다.
제55(a)도, 55(b)도 및 55(c)도는 문자패턴의 판정예를 도시한 것이다. 제55(a), 55(b), 55(c)도에 있어서, 대각선으로 표시된 패턴은 화상스캐너등으로 판독된 문자화상이다. 점으로 표시된 패턴은 교점정보에 따라 박스내 문자추출부 105에 의해 대응된 국부적으로 대응된 화상이다.
제55(a)도에 도시한 바와 같이, 문자화상 201이 최대문자크기 THmax보다 크고 국부적으로 대응된 부분이 없는 경우에는, 문자화상 201이 단일문자로서 인식된다. 즉, 이 예에서는, 평균문자크기 TH보다 큰 문자 8이 입력된 것으로 고려하여 단일문자 8을 검색한다.
단계 S184에서 이러한 국부적으로 대응된 부분이 상술한 문자패턴에 존재한다고 판정되는 경우(단계 S184에서 yes인 경우)에는, 상술한 문자패턴에서 국부적으로 대응된 부분(가상 문자선의 화상)을 삭제하여 얻어진 각종의 패턴의 문자크기를 산출할 수가 있다(단계 S185). 다음에, 삭제에 의해 분리된 각 패턴의 크기가 최소문자크기THmin보다 큰지의 여부를 판정한다(단계 S186). 패턴크기의 어느것도 최소문자크기 THmin과 같거나 작은 경우에, 국부적으로 대응된 화상, 즉 여분의 가상 문자선을 문자패턴에서 해제하여 문자패턴을 다수개의 패턴으로 분할한다(단계 S187).
여분의 가상 문자선을 다음과 같이 해제시킨다. 즉, 교점대응부 104에 의해 설정된 여분의 문자선에 관계하는 교점간의 대응관계를 해제시킬 수 있다.
이와 같이, 예를 들면, 제55(b)도에 도시된 바와 같이 문자박스상에 서로 접촉하는 5와 3으로 쓰여진 2개의 문자화상 202와 203이 국부적으로 대응된 화상 204a와 204b를 해제함으로써 제56(b)도에 도시한 바와 같이 정확히 검색된다.
국부적으로 대응된 화상(가상 문자선으로 형성된 화상)을 분리하여 얻은 다수의 문자화상 중 어느 것도 단계 S186에서 최소문자크기 THmin보다 작은 경우(단계 S186에서 NO인 경우)에는, 문자패턴이 국부적으로 대응된 화상을 문자패턴의 일부로서 간주함으로써 단일 문자로서 인식된다.
제55(c)도는 상술한 패턴의 예를 도시한 것이다. 제55(c)도는 박스내 문자추출부 105에 의해 얻어진 문자박스를 부분적으로 중첩하는 문자 d의 화상패턴을 도시한 것이다. 화상패턴은 2개의 문자화상 205와 206과 국부적으로 대응된 화상(가상 문자선을 포함하는 화상) 207에 의해 형성된다. 이 화상패턴에서, 국부적으로 대응된 화상 207를 해제함으로써 얻어진 제1문자화상 205(파선의 직사각형에 의해 둘러싸인 부분)는 최소문자선 THmin과 같거나 작다. 그러므로, 이 예에서는, 국부적으로 대응된 화상 207를 실제 문자선으로서 간주한다. 이와 같이, 문자박스상에 최대문자크기 THmax보다 큰 문자로서 부분적으로 수서된 문자 d를 제56(c)도에 도시한 바와 같이 단일 문자화상 208로서 정확히 검색한다.
문자패턴(국부적으로 대응된 화상을 포함하는 문자패턴을 포함)이 단계 S183에서 최대문자크기 THmax와 같거나 작으면, 문자패턴을 단일 문자로서 간주한다.
문자열중의 모든 문자패턴에 대하여 단계 S183∼S187의 처리를 행하여, 그 처리를 종료한 것으로 판정되는 경우(단계 S188에서 NO인 경우)에는, 제53도의 흐름도에 도시한 처리를 종료한다.
문자 2와 1이 제57(a)도에 도시한 바와 같이 문자박스상에 부분적으로 수서되는 경우에는, 2개의 문자가 종래의 방법에서 처럼 제57(c)도에 도시한 바와 같이 단일문자로서 박스내 문자추출부 105에 의해 잘못 추출되는 것이 방지될 수가 있다. 즉, 제57(a)도에 도시한 국부적으로 대응된 화상 223과 대응된 문자패턴이 최대문자크기 THmax보다 크고 국부적으로 관련된 화상 223을 갖는 것으로서 인식된다. 국부적으로 관련된 화상 223을 삭제하면, 문자화상 225가 최소문자크기 THmin보다 작은 것으로 판정된다. 문자화상 225는 국부적으로 대응된 화상 223을 통하여 상술한 문자 2의 일부를 형성하는 2개의 문자화상 226과 227과 포함된다. 이와 같이, 문자 2를 정확히 검색할 수가 있다.
국부적으로 대응된 화상 223을 해제하여 얻은 A의 문자화상 228이 최소문자크기 THmin보다 크므로, 단일문자인 것으로서 인식된다. 그러므로, 교점 2∼4와 교점 2∼5를 연결하는 국부적으로 대응된 화상 223을 여분의 가상선으로서 제거한다. 그 결과, 2개의 문자 2와 A를 제57(b)도에 도시한 바와 같이 정확히 검색할 수가 있다.
제58도는 제22도에 도시한 문자구조분석 및 산정부 108에 의한 처리를 도시한 흐름도이다.
문자구조분석 및 산정부 108은 문자구조정의 테이블을 메모리내에 부하한다(단계 S201).
문자구조정의 테이블은 예를 들면, 숫자, 알파벳문자, 일문자, 한자등의 문자형태에 따라 생성된다.
제59도는 문자구조정의 테이블의 내용의 예를 도시한 것이다.
이 예에서는, N형, 역 N형 및 8형을 가상화상의 구조를 형성하는 형태로서 입력한다. 그 다음에, 3개 형태의 다수의 가상 문자선으로 형성된 가상선의 구조와 가상 문자선에 대응하는 실제 문자선으로 형성된 실제 화상의 구조에 관한 정보를 입력한다.
N형과 역 N형의 가상화상에 대응하는 실제 화상의 구조는 제59도에 도시한 바와 같이 단지 하나의 형태이다. N형 또는 역 N형 가상화상에 대하여 이 테이블을 참조함으로써, 가상화상에서 실제 문자선만을 추출한 후에 실제 화상을 성공적으로 얻을 수가 있다. 한편, 실제 화상구조의 2개 형태는 제59도에 도시한 바와 같이 존재한다. 교점대응부 104에 얻은 가상 문자선의 방향성에 관한 정보에 따라 실제 화상이 실제 8형 가상화상에 대응하는지를 판정한다.
제60도를 참조하여 8형의 가상화상 형태의 2개의 방향성에 대하여 설명한다. 제60도에 있어서는, 점패턴은 화상스캐너등으로 판독된 박스내 추출화상을 표시한다. 8형의 가상화상은 4개의 가상 문자선 AB, AC, BD, CD로 형성된다. 이 경우에, 가상 문자선 AB는 교점 A와 B와 대응된다. 마찬가지로, 가상 문자선 AC, BD, CD는 각각 교점 A와 C, B와 D, C와 D와 대응된다. 이 예에서, 교점 A와 B 및 교점 B와 D가 교점대응부 104에 의해 얻어진 방향정보에 따라 대응되는 경우에는, 8형의 가상화상을 대각선 방향으로 대응되는 것으로서 규정한다. 가상화상이 상술된 바와 같이 대응되지 않는다면, 즉 교점 A와 B 및 C와 D가 별개로 대응된다면, 8형의 가상화상이 수직 및 수평방향으로 대응되는 것으로서 규정된다.
단계 S201의 처리후에, 교점대응부 104에 의해 대응되는 것으로서 간주되는 가상 문자선과 문자박스와의 교점과 대응정보(방향성에 관한 정보를 포함)에 따라 가상화상의 구조를 분석한다(단계 S202). 가상화상 구조분석처리에 대하여는 이후에 상세히 설명한다.
단계 S201에서 설정된 테이블에 입력된 가상화상의 구조정보와 분석정보를 비교하여 가상화상의 구조종류를 평가한다(단계 S203).
그 다음에, 산정에 의해 얻어진 가상화상의 구조가 일의적으로 결정될 수 있는지의 여부를 판정한다(단계 S204). 즉, 가상화상의 구조가 제59도에 도시한 바와 같이 N형 또는 역 N형인 것으로서 인식되는 경우에, 실제 화상 구조가 일의적으로 결정된다(단계 S204에서는 NO). 한편, 가상화상의 구조가 제59도에 도시한 바와 같이 8형인 것으로서 인식되는 경우에, 실제 화상구조는 2종류일 수 있고 하나밖에 확인될 수가 없다(단계 S204에서는 Yes).
가상화상에 대응하는 실제 상황이 단계 S204에서 테이블에서 하나밖에 확인되는 경우(단계 S204에서 NO인 경우)에는, 실제 화상에 의해 요구되지 않는 가상 문자선을 가상화상에서 분리(해제)하여 실제 화상을 얻는다(단계 S206).
대각선을 형성하는 가상 문자선은 제59도에 도시한 N형 또는 역 N형인 것으로서 산정된 가상화상에서 해제된다. 그 다음에, 제59도에 도시한 실제 화상을 최종적으로 얻을 수가 있다.
제61(a), 61(b), 62(a) 및 62(b)도는 박스내 문자추출부 105에 의해 추출된 박스내 추출화상, 즉 가상화상이 N형과 역 N형일 때 단계 S201∼S204 및 S206에서의 처리에서 가상화상에서 실제 화상을 추출하여 문자를 정확히 검색하는 실용적인 예를 도시한 것이다.
제61(a)도 및 61(b)도는 문자박스 231과 접촉하는 것으로서 쓰여지는 3을 정확히 검색하는 예를 도시한 것이다. 제62(a)도 및 62(b)도는 문자박스 231과 접촉하는 것으로서 쓰여지는 9를 정확히 검색하는 예를 도시한 것이다. 제61(a), 61(b), 62(a) 및 62(b)도에 있어서, 빗금친 패턴 232는 가상 문자선이다. 흑점 A, B, C 및 A', B', C' 및 D'는 문자선 232와 문자박스 231과의 교점이다.
제61(a)도 61(b)도에 도시한 예에 있어서는, 가상화상 233N은 단계 S202와 S203의 처리에서 N형 가상화상인 것으로서 인식된다. 즉, 교점대응부 104에 의해 얻어진 교점 A와 B, A와 C, 및 C와 D를 대응시키는 정보에 따라 판정을 한다. 단계 S201에서 설정된 테이블을 참조하여, 가상 문자선 AC, 즉 대각선만을 제61(a)도에 도시한 가상화상 233N에서 제거하므로 제61a도에 도시한 문자화상 3을 정확히 검색할 수가 있다.
제62(a)도와 62(b)도에 도시한 예에서는, 가상화상 233RN이 단계 S202와 S203의 처리에서 역 N형 가상화상인 것으로서 인식된다. 즉, 교점대응부 104에 의해 얻어진 교점 A'와 B', B'와 C' 및 C'와 D'를 대응시키는 정보에 따라 판정을 한다. 단계 S201에서 설정된 테이블을 참조하여, 가상 문자선 B'C', 즉 대각선만을 제62(a)도에 도시한 가상화상 233RN에서 제거하므로 제62(b)도에 도시한 문자화상 9를 정확히 검색할 수가 있다.
대응하는 가상화상에 대하여 단계 S204에서 테이블에 다수의 실제 상황을 입력한다. 대응하는 실제상황이 일의적으로 결정되지 않는 경우(단계 S204에서 Yes인 경우)에는, 가상 문자선과 문자박스간의 대응조건을 구한다. 예를 들면 교점대응부 104에 의해 대응조건을 구한다. 대응조건과 테이블에 입력된 실제 화상을 하나밖에 확인하는 조건과를 비교하여서, 실제 문자선을 하나밖에 일의적으로 결정하고(단계 S205) 그 판정에 따라 가상화상에서 여분의 문자선을 해제(제거)한 후에 상술한 테이블에 입력된 실제 화상을 얻는다(단계 S206).
가상화상의 구조가 예를 들면 제63도에 도시한 바와 같이 8형인 경우에는, 단계 S205에서 상술한 가상 문자선의 방향이 수직 또는 대각방향인지를 판정한다. 다음에, 제59도에 도시한 테이블에 입력된 실제 화상 정보를 일의적으로 판정하는 조건에 따라 실제 화상의 구조를 일의적으로 판정한다.
제63(a), 63(b), 64(a) 및 64(b)도를 참조하여 본 실시예에 의한 수서선-접촉문자에서 실제 문자선만을 추출하는 예를 설명한다. 제63도와 제64도에 있어서, 선 243a와 243b는 가상화상을 표시한다.
제63(a)도는 수서문자 8이 그 교차점에서 문자박스와 접촉하는 예를 도시한 것이다. 박스내 문자추출부 105는 문자박스에서 여분의 가상 문자선을 포함하는 8형의 가상화상 243a를 추출한다. 또한 제63(b)도는 수서문자 8이 그 하부에서 문자박스와 접촉하는 예를 도시한 것이다. 박스내 문자추출부 105는 문자박스에서 여분의 가상 문자선을 포함하는 8형의 가상화상 243b를 추출한다.
제58도의 흐름도에 도시한 단계 S205에서 교점대응부 104에 의해 얻어진 교점을 대응시키는 방향정보에 따라 제63(a)도에 도시한 예에서 가상화상 243a가 대각방향으로 쓰여지는 것으로 판정된다. 다음에, 제64(a)도에 도시한 실제 문자선 241에 의해서만 형성된 8형의 문자화상을 단계 S205에서 검색한다. 단계 S205에서 교점대응부 104에 의해 얻어진 교점을 대응시키는 방향정보에 따라, 제63(b)도에 도시한 예에서 가상화상 243b가 수직방향으로 쓰여지는 것으로 판정된다. 그 다음에, 제64(b)도에 도시한 실제 문자선 241에 의해서만 형성된 8형의 문자화상을 단계 S205에서 검색한다.
이하, 제58도에 도시한 흐름도에 따라 단계 S202의 처리에 대하여 상세히 설명한다.
제65도는 문자박스 246을 부분적으로 중첩하는 문자의 선-접촉부분의 확대화상을 도시한 것이다. 이 경우에, 4개의 문자선 247이 문자박스 246을 교차한다. 1∼4는 문자선 247과 문자박스 246과의 교점이다. 이 예에서는, 4개의 교점에 관한 대응정보에 따라 제66도의 흐름도에 의해 도시된 알고리듬에 근거하여 가상화상의 구조를 판정한다.
즉, 4개의 교점에 관한 대응정보에 따라, 교점 1∼4와 대응된 다른 교점수를 계수한다(단계 S301).
다음에, 교점 1∼4와 대응된 교점수가 각각 1, 2, 2, 및 1을 나타내는지의 여부를 판정한다(단계 S302). 이 조건이 만족되는 경우(단계 S302에서 Yes인 경우)에는, 가상화상은 역 N형 화상인 것으로서 규정된다(단계 S303).
이 조건이 만족되지 않는 경우(단계 S302에서 NO인 경우)에는, 교점 1, 2, 3, 및 4와 대응된 교점수가 각각 2, 1, 1, 및 2인지의 여부를 판정한다(단계 S304). 이 조건이 만족되는 경우(단계 S304에서 Yes인 경우)에는, 가상화상은 N형인 것으로 고려된다(단계 S305).
단계 S304에서의 조건이 만족되지 않는 경우(단계 S304에서 NO인 경우)에는, 교점 1, 2, 3, 및 4와 대응된 교점수가 각각 2, 2, 2, 및 2인지의 여부를 더 판정한다(단계 S306). 이 조건이 만족되는 경우(단계 S306에서 Yes인 경우)에는, 가상화상은 8형인 것으로 고려된다(단계 S307).
교점수가 4이면, 제65도에 도시한 바와 같이 위치된 교점 1, 2, 3 또는 4와 대응된 다른 교점수를 조사함으로써 가상화상을 미리 결정된 N형, 역 N형 또는 8형인 것으로서 식별할 수가 있다.
이하에, 제58도에 도시한 흐름도에 따라 단계 S205의 처리를 제67도와 제68도를 참조하여 설명한다.
제67도는 제65도에 도시한 바와 같이 교점대응부 104에 의해 대응된 4개의 1∼4간의 관계를 도시한 것이다.
제67도에 있어서, 교점 1과 3, 교점 1과 4, 교점 2와 3, 및 교점 2와 4가 대응된다. 이 예에서의 대응조건은 방향선 또는 거리인 것으로 한다.
제68도는 8형의 가상화상에서 실제 문자선을 추출하는 처리를 도시한 흐름도이다.
먼저, 교점대응부 104가 방향성 조건에서 교점 1과 4, 및 교점 2와 3과 대응하였는지의 여부를 판정한다(단계 S401). 상술한 2개의 교점이 방향선 조건에서 대응하는 경우(단계 S401에서 Yes인 경우)에는, 교점 1과 3, 및 교점 2와 4간의 대응관계를 해제한다(단계 S402). 이에 의해, 교점 1과 3 및 1과 3 및 교점 2와 4를 접속하는 가상 문자선이 삭제된다.
한편, 상기한 2개의 교점이 방향성 조건에서 대응되지 않는 경우(단계 S401에서 NO인 경우)에는, 교점 1과 3 및 교점 2와 4가 수직방향에서 대응되는 것으로 판단한다. 그 다음에, 교점 1과 4, 및 교점 2와 3간의 대응관계를 해제한다(단계 S403). 이에 의해, 교점 1과 4, 교점 2와 3을 접속하는 가상 문자선이 삭제된다.
이하에, 상기한 본 실시예를 그 문자박스를 부분적으로 중첩하는 문자에 적용하는 구체예를 설명한다.
제69(a)도, 69(b)도, 및 69(c)도에 도시한 바와 같이, 문자박스 250를 통하여 부분적으로 수서된 5와 1의 각 문자가 본 실시예에 의해 정확히 회복된다.
제69(a)도에 도시한 바와 같이, 문자박스를 부분적으로 중첩하는 문자 5와 1은 문자박스 250와 4개의 교점을 형성하고, 박스내 문자추출부 105는 역 N형 가상화상을 추출한다. 그러므로, 이 예에서는, 교점 1과 3, 및 교점 2와 4간의 가상 문자선은 실제 문자선으로서 추출되지만, 교점 2와 3간의 가상 문자선은 허위 문자선으로 해제된다. 그 결과, 문자 5와 1은 제69(b)도에 도시한 바와 같이 정확히 추출된다. 종래에는 모든 가상 문자선이 실제선으로 추출되므로, 제69(c)도에 도시한 바와 같이 문자 3과 9가 잘못 추출된다.
제70도는 문자박스를 부분적으로 중첩하는 문자에 의해 N형의 가상화상을 형성하는 2개의 수서문자의 검색에 본 실시예를 적용한 예를 도시한 것이다. 제70(a)도에 있어서, 2개의 문자 4와 j는 문자박스를 통하여 부분적으로 수서된다. 박스내 문자추출부 105는 문자와 문자박스 250과의 4개의 교점 1∼4에 관한 대응정보에서 N형의 가상화상을 추출한다. 그러므로, 이 예에서는, 교점 1과 3, 및 교점 2와 4간의 가상 문자선이 실제 문자선으로서 추출되지만, 교점 1과 4간의 가상 문자선이 허위 문자선으로서 해제된다. 그 결과, 문자 4와 j는 제70(b)도에 도시한 바와 같이, 정확히 추출된다. 종래에는 모든 가상 문자선이 실제선으로서 추출되고 2개의 문자 4와 j가 제70(c)도에 도시한 바와 같이 단일 문자로서 검색된다. 그렇치 않으면, 제70(d)도에 도시한 바와 같이 문자박스 250이 추출된 후에는, 문자박스 250내에 수서된 문자선이 성공적으로 보완되지 않고 문자박스 250상의 문자선이 삭제되어서, 무의미한 화상이 남게되어 문자 4와 j를 정확히 검색하지 못한다.
제71도는 문자박스를 통하여 부분적으로 쓰여진 문자로 8형의 가상화상을 형성하는 2개의 수서문자를 검색하는 본 실시예의 예를 도시한 것이다. 제71(a)도에 있어서, 2개의 문자 5와 T는 문자박스를 통하여 부분적으로 수서된다. 박스내 문자추출부 105는 문자박스 250과 문자와의 4개의 교점 1∼4에 관한 대응정보에 8형 가상화상을 추출한다. 그러므로, 예를 들면, 수평방향으로 교점 1이 3과 대응되고 교점 2가 4와 대응되면, 2개의 문자 5와 T는 제71(b)도에 도시한 바와 같이 정확히 검색된다. 종래에는, 허위 문자선(교점 1과 4를 접속하는 문자선과 교점 2와 3을 접속하는 문자선)도 제71(c)도에 도시한 바와 같이 실제 문자선으로 추출되므로, 문자 5와 T는 단일문자로서 연결되어 추출된다. 그렇지 않으면, 문자박스 150은 삭제되고, 실제 문자선 263과 264가 서로 분리되어 제71(d)도에 도시한 바와 같이 2개의 문자 5와 T를 정확히 검색할 수가 없다.
상술한 실시예에 의하면, 양측상의 2점에서 문자와 문자박스 사이에 문자박스와 접촉하는 2개의 문자가 검색된다. 그러나, 본 발명은 제72(a)도와 제72(b)도에 도시한 바와 같이 일측상의 2점과 다른 측상의 3점에서 이들사이에서 문자박스와 접촉하는 문자에 더 적용될 수가 있다. 이 경우에는, 문자구조 분석 및 평가부 108은 제66도에 도시한 정보를 저장하는 테이블을 미리 설정한다. 제73도는 1형∼6형까지의 6종류의 가상화상의 구조를 도시한 것이다. 이들 화상중에서, 2형, 3형, 5형 및 6형의 구조는 테이블을 검색함으로써 실제 문자선으로 이루어지는 것으로서 일의적으로 결정될 수가 있다. 한편, 1형과 4형의 구조는 2종류로 나누어지고 수평방향으로 더 두꺼워지는 교점 1과 2에 따라 결정될 수가 있다. 교점이 제74(a)도에 도시한 바와 같이 형태 1과 4로 더 두꺼워지면, 제73도에 도시한 실제 문자선 구조 기억영역에서의 좌측에 표시된 실제 문자선의 구조가 선택된다. 마찬가지로, 제72(b)도에 도시한 가상화상의 경우에는, 테이블이 생성될 수가 있다. 이 경우에는, 테이블내에 저장된 가상화상의 구조와 가상화상에 대응하는 실제 문자선의 구조에 관한 정보가 제73도에 도시한 정보와 대칭이다.
이하의 실시예에 따라, 문자박스를 통하여 부분적으로 수서된 문자가 제75도에 도시한 바와 같이 양측에 3개의 교점(1∼3과 4∼6)을 형성하는 경우에 본 발명을 적용한다. 이 경우에는, 제78도에 도시한 내용을 갖는 테이블이 문자구조분석 및 평가부 108에 입력된다. 제75도에서, 점부분은 가상 문자선을, 대각선으로 표시된 부분은 문자화상을, 수직선으로 표시된 부분은 문자박스를 나타낸다.
상술한 테이블내에 입력된 가상화상의 구조는 38형태(1∼38)이다. 이들 중 몇 형태는 일의적으로 결정된 실제 문자선의 구조를 갖고 나머지 형태는 1개 구조를 선택하는 2 또는 3개의 실제 문자선의 구조를 갖는다. 제76도∼제78도에 도시한 실제 문자선 기억영역에 저장된 3개 문자선의 구조는 좌에서 우로 (a), (b) 및 (c)로 명명된다.
실제 문자선의 구조는 조건 (1)∼(3)에서 상술한 테이블에서 선택된다.
(1) 교점 1과 5 및 교점 2와 4가 방향성의 대응조건에서 대응관계에 있는 경우는 (b), 교점 2와 6 및 교점 3과 5가 방향대응조건에서 대응관계에 있는 경우는 (c), 그렇치 않으면, 구조 (a)가 선택된다.
(2) 교점 1과 5 및 교점 2와 4가 방향성의 대응조건에서 대응관계에 있는 경우는 (b), 그렇치 않으면, 구조 (a)가 선택된다.
(3) 교점 2와 6 및 교점 3과 5가 방향성의 대응조건에서 대응관계에 있는 경우는 (c), 그렇치 않으면, 구조 (a)가 선택된다.
상술한 실시예에서는, 테이블을 사용하여 가상화상에서 실제 문자선을 추출한다. 그러나, 본 발명은 이에 한정되지는 않는다. 즉, 실제 문자선을 알고리듬에 의해서만 추출할 수가 있고 각종의 형태로 이행할 수가 있다. 상술한 실시예에서는, 수서문자가 목록 및 테이블의 문자박스에서 추출되지만, 본 발명은 이에 한정되지 않는다. 선, 문자, 도형 또는 기호가 도형인식장치등의 화상인식장치에서 서로 접촉하는 화상으로 부터 문체를 검색(추출)하는데 적용될 수가 있다.
본 실시예에 의하면, 선이 패턴과 교차하는 화상에서 선을 추출하고 나서 선과 패턴과의 교점을 산출한다. 그 다음에, 교점정보에 따라 선의 상기 패턴의 화상을 평가하여 화상을 가상화상으로서 추출한다. 다음에, 경험에 의해 얻어진 정보등에 따라 패턴만의 화상을 추출한다.
그러므로, 테이블 형태에서의 문자박스를 통하여 부분적으로 수서된 문자를 문자인식장치에서 정확히 검색할 수 있으므로, 문자를 개선된 정확도로 검색할 수 있으므로, 문자를 개선된 정확도로 검색할 수가 있다. 더우기, 물체도형을 문자인식장치 뿐만 아니라 도형인식장치에서 정확히 추출할 수도 있다.
이하에 설명된 실시예에 의하면, 선-접촉문자가 문자박스 또는 테이블 선과 접촉하거나 문자 또는 테이블과 부분적으로 중첩하더라도 향상된 인식율로 문자를 인식할 수가 있다.
제79도는 신뢰도 테이블생성장치(문자재인식 테이블생성장치) 270의 구성을 도시한 블럭도이다.
문자박스추출부 271은 각 문자 카테고리에 대하여 다수의 샘플의 학습 데이타를 입력한다. 학습 데이타는 문자박스와 이와 접촉하는 문자(선-접촉문자)로 이루어지는 2치 화상 데이타이다. 문자는 통상적으로 알려진 문자이다. 각 샘플은 문자박스와 문자간의 접촉상태에서 서로 다르다. 문자박스추출부 271은 학습 데이타에서 문자박스만의 화상 데이타를 추출한다. 문자를 형성하는 화상 데이타를 보간부 272에 출력한다.
보간부 272는 예를 들면 보간부 12의 방법과 마찬가지의 방법에 의해 문자박스추출부 271에 의해 제거된 문자의 화상 데이타(제거영역)을 보완한다.
재보간부 273은 제2도에 도시한 재보간부 13의 방법과 마찬가지의 방법에 의해 보간부 272에 의해 보완되지 않는 제거영역을 보간한다.
보간부 272에 의해 생성된 보간 패턴과 재보간부 273에 의해 생성된 보간 패턴과 재보간부 273에 의해 생성된 재보간 패턴은 문자인식부 274에 입력된다.
문자인식부 274는 각 문자 카테고리에서의 복수개의 학습 데이타에 대하여 보간 패턴과 재보간 패턴을 입력할 때 문자인식을 개시한다. 그 다음에, 각 학습 데이타에 대한 인식결과를 신뢰도 테이블생성부 275에 출력한다.
신뢰도 테이블 작성부 275는 문자인식부 274에서 출력된 상술한 인식결과와 미리 결정된 정확한 데이타를 비교하여 전체 샘플 데이타에 대한 인식율을 구한다. 구해진 인식율을 신뢰도 테이블 276내에 신뢰도 레벨로서 입력한다. 잘못된 문자와 정확한 문자쌍(잘못 인식된 문자에 대하여)와 예기된 문자도 신뢰도 테이블 276내에 잘못된 문자 세트로서 입력한다. 잘못된 문자와 정확한 문자쌍은 예를 들면 문자코드로서 입력된다. 신뢰도 테이블생성부 275는 학습 데이타에서 문자와 그 문자박스간의 접촉상태의 특징을 나타내는 파라미터를 추출하여 신뢰도 테이블 276내에 입력한다.
이와 같이, 신뢰도 테이블 276은 각 문자 카테고리에 대한 각종의 상태로 문자박스와 접촉하는 문자(선-접촉문자)에 대하여 잘못된 문자쌍과 함께 문자인식부 274의 인식율을 저장한다.
제80도는 신뢰도 테이블 작성장치 270에 의해 생성된 신뢰도 테이블 276을 사용하는 선-접촉문자에서 문자를 인식하는 문자인식장치 280의 구성을 도시한 블럭도이다.
제80도에서, 문자박스추출부 281은 문자와 그 문자박스(선-접촉문자)로 이루어지는 미지의 2치 화상 데이타를 받아, 전체 화상 데이타에서 문자박스의 화상 데이타를 추출하여, 문자박스의 화상 데이타의 추출후에 얻어진 문자패턴의 화상 데이타를 보간부 282에 출력한다.
보간부 282는 상술한 바와 같이 문자박스의 화상 데이타를 추출할 때 제거된 화상 데이타를 복원하여 입력문자패턴의 화상 데이타를 보완하여서, 이 보간처리로 얻어진 화상 데이타를 보완하여서, 이 보간처리로 얻어진 화상 데이타(보간 패턴)을 보간부 283에 출력한다.
재보간부 283은 라벨링에 의한 연결성을 사용하여 보간부282에 의해 보간되지 못한 부분을 보간함으로써 재보간 패턴을 생성한다.
문자인식장치 284는 보간부 282에 의해 생성된 보간 패턴과 재보간부 283에 의해 생성된 재보간 패턴에 대해 문자인식을 개시한다. 인식결과는 문자코드로 표현되는 것으로서 재인식부 285에 출력된다.
재인식부 285는 상술한 문자코드이외에 미지의 2치 화상 데이타를 받아, 2치 화상 데이타에서 문자와 그 문자박스간의 접촉상태의 특징을 나타내는 파라미터를 추출하고, 중요한 항목으로서 파라미터와 문자코드를 사용하는 신뢰도 테이블 작성장치 270에 의해 생성된 신뢰도 테이블 276을 참조하여, 문자인식장치 284에 의해 인식된 문자코드의 신뢰도 레벨을 조사한다. 신뢰도 레벨이 높은 경우에는, 문자코드를 최종 인식결과로서 출력한다. 신뢰도 레벨이 낮은 경우에는, 재인식부 285는 상술한 보간 패턴, 재보간 패턴, 또는 미지의 2치 화상 데이타를 사용하는 문자인식장치 284의 방법과는 다른 방법에 의해 미지의 2치 화상 데이타에 포함된 선-접촉문자를 재인식한다. 다음에, 재인식처리로 얻어진 문자코드를 출력한다.
제81도는 신뢰도 테이블 작성장치(문자재인식 테이블 작성장치) 300의 구성을 도시한 블럭도이다.
변동종류결정부 301은 학습 데이타, 즉 2치 화상의 문자패턴을 입력한다. 학습 데이타는 문자박스와 접촉하지 않는 문자패턴과 그 문자코드로 되어 있다. 변동종류결정부 301은 입력된 학습 데이타의 문자패턴에 대하여 행해진 변동의 종류를 결정하여, 결정된 변동종류를 변동량결정부 302와 신뢰도 테이블생성부 306에 출력한다. 이 변동종류는 예를 들면, 제83(a)도∼제83(f)도에 도시한 바와 같이 문자박스에 대한 문자의 변동과 문자박스의 변동의 2종류가 있다. 문자박스에 대한 문자의 변동으로는 예를 들면, 위치오차, 크기변동, 문자박스의 두께변동, 크기변동, 문자박스의 요철등이 있다.
변동량결정부 302는 변동종류결정부 301에 의해 결정된 변동의 조작량을 결정하여 변동량 정보를 선-접촉문자 생성부 303과 신뢰도 테이블 작성부 306에 출력한다. 본 실시예에서는, 이 변동량을 나타내는 파라미터로서 이하의 파라미터를 사용한다. 수직방향으로 x축을, 수평방향으로 y축을 설정한다.
1. 문자박스에 대한 문자의 변동
위치오차:dx와 dy로 표시됨. dx는 제82(b)도에 흑점으로, dy는 제82(b)도에 x로 표시한다. dx와 dy는 각각 문자의 중력중심과 문자박스의 중력중심에 대한 x와 y방향의 차이를 나타낸다.
크기변동:dsx와 dsy로 표시됨. dsx와 dsy는 각각 x방향과 y방향으로의 문자크기를 나타낸다.
경사변동:dα로 표시됨. 수직선에 대한 문자박스의 경사(각도)를 나타낸다.
문자박스의 두께변동:w로 표시됨. 문자박스의 두께를 나타낸다.
크기변동:fsx와 fsy로 표시됨. 각각 x와 y방향으로의 문자박스의 크기를 나타낸다.
문자박스의 요철:fδ로 표시됨. fδ는 팩시밀리장치에 인쇄된 문자박스의 품질 열화를 고려하여 문자박스의 요철을 제거하는 파라미터이다. 예를 들면, fδ는 문자박스의 파라미터를 L로 하면, 이 크기 L의 배열 fδ[L]로서 표현되고, 이 배열의 각 요소 fδ[i](i=1,2,3,…)는 -β에서 +β의 범위내에의 정수로 표시된다.
선-접촉문자 생성부 303은 변동종류결정부 301에 의해 결정된 종류의 변동량에 근거하여 상술한 학습 데이타에 대하여 조작 F(dx,dy,dsx,dsy,dα,w,fsx,fsy,fα,fδ)를 행하여, 학습 데이타의 선-접촉문자를 생성한다.
제82(a)도 및 제82(b)도는 선-접촉문자 생성부 303에 의해 생성된 선-접촉문자 7의 예를 도시한 것이다.
선-접촉문자 생성부 303은 제82(a)도에 도시한 7의 학습 데이타 320에 대하여 변동조작 F(dx,dy,dsx,dsy,dα,w,fsx,fsy,fd,fδ)를 행함으로써 제82(b)도에 도시한 바와 같이 문자박스 330과 접촉하는 선-접촉문자 7를 생성한다. 즉, 선-접촉문자 생성부 303은 학습 데이타 및 문자박스에 대하여 변동조작 F(dx,dy,dsx,dsy,dα,w,fsx,fsy,fα,fδ)를 행하여 그 문자박스내에 변동된 학습 데이타를 위치시킴으로써 선-접촉문자를 생성한다. 이 예에서는, 문자박스의 중력중심의 위치를 고정하여 변동조작 F(dx,dy,dsx,dsy,dα,w,fsx,fsy,fα,fδ)를 행한다.
제83(a)도-제83(f)도는 fsx와 fsy를 고정하여(문자박스의 크기를 고정하여) 문자 3의 학습 데이타(문자패턴)에 대하여 선-접촉문자 생성부 303에 의해 생성된 각종의 선-접촉문자의 예를 도시한 것이다.
제83(a)도는 변동량이 dx=0와 dy0인 경우의 변동종류로서 위치오차의 예를 도시한 것이다. 이 예에서는, 문자 3이 문자박스 331의 아래쪽으로 부분적으로 중첩한다(하부 위치오차). 제83(b)도는 변동량이 dsx=fsx와 dsy=fsy인 경우의 크기변동의 예를 도시한 것이다. 이 예에서는, 문자 3은 문자박스를 형성하는 상하, 좌우선에 접촉함으로써, 문자 3을 둘러싸는 직사각형을 문자박스 33과 같게 한다.
더우기, 제83(c)도는 변동량이 dα=10도인 경우의 경사변동의 예를 도시한 것이다. 제83d도는 변동량이 w=5인 경우의 문자박스를 형성하는 선의 두께변동의 예를 도시한 것이다. 제83(e)도는 변동 fδ[i]의 각 요소 f△[i]를 제어한 경우의 문자박스의 요철의 예를 도시한 것이다.
제83(a)도에 도시한 바와 같이 위치오차에 유효한 변동량은 dx와 dy이다. 마찬가지로, 제83(a)도, 83(b)도, 83(c)도, 83(d)도, 83(e)도, 및 83(f)도에 도시한 각 변동에 유효한 변동은 각 도면에 표시되어 있다.
선-접촉문자 분리부 304는 선-접촉문자 생성부 303에 의해 생성된 선-접촉문자에서 문자박스를 추출하여 제거함으로써 단절된 문자선을 보완하거나 재보완함으로써 상술한 선-접촉문자의 2치 화상에서 문자의 2치 화상만을 복원할 수가 있다. 이 처리는 일본 특허청에 제출한 특개평 6-309498호의 화상추출방식에 개시된 방법에 의해 행해진다. 보간처리에 의해 복원된 패턴을 보간 패턴으로, 재보간처리에 의해 복원된 문자패턴을 재보간 패턴으로 명명한다. 이 보간 패턴과 재보간 패턴을 문자인식부 305와 문자재인식부 505에 출력한다.
문자인식부 305는 선-접촉문자 분리부 304에 의해 얻어진 문자패턴에 대하여 문자를 인식하여, 인식된 문자에 대응하는 코드(문자코드)를 신뢰도 테이블 작성부 306에 출력한다. 문자인식은 예를 들면, 통계적 방법에 의한 수서문자인식(수서문자인식기술의 과거, 현재, 미래 전기통신 강연회 논문집. pp 38-45, 1993. 4)에 기재된 방법에 의해 행한다.
신뢰도 테이블 작성부 306은 문자인식부 305에 의해 입력된 문자코드와 학습 데이타의 문자코드(정확한 문자코드)를 비교하여, 문자인식부 305가 선-접촉문자 분리부 304에서 출력된 보가 또는 재보간 패턴에서 문자를 정확히 결정하였는지의 여부를 판정한다. 다음에, 제77도에 도시한 신뢰도 테이블 400을 작성한다.
즉, 변동종류 결정부 301, 변동량 결정부 302, 및 선-접촉문자 생성부 303은 특정의 카테고리의 문자패턴의 학습 데이타에 대하여 복수형태의 선-접촉문자를 자동 생성한다. 신뢰도 분리부 304는 선-접촉문자에서 문자박스를 추출제거하여 보간 패턴 또는 재보간 패턴을 생성한다. 문자인식부 305는 패턴의 문자를 인식한다.
신뢰도 테이블 작성부 306은 문자인식결과가 학습 데이타의 정확히 인식된 문자코드를 비교한 후에 문자인식부 305에 의한 문자인식결과의 인식율을 신뢰도 레벨로서 산출한다. 다음에, 그밖의 각 카테고리에 대하여 문자패턴과 문자코드를 신뢰도 테이블 작성장치 300에 입력하고 상술한 처리를 행하여, 신뢰도 레벨을 산출한다.
상술한 처리에서는, 신뢰도 테이블 작성부 306은 변동량이 dy=5와 w=5의 위치오차 변동을 가진 선-접촉문자 2에 대하여 선-접촉문자 분리부 304와 문자인식부 305씩 구성되는 문자인식장치가 23%의 비율로 2를 7로 잘못 인식하는 것을 학습한다. 그 다음에, 잘못된 문자와 정확한 문자쌍(2와 7)와 신뢰도 77%를 변동량 dy=5, w=5등의 위치오차의 변동종류등의 정보와 함께 신뢰도 테이블 400에 등록한다.
즉, 문자인식부 305가 문자를 7로서 인식하더라도, 신뢰도는 77%이고, 문자 2를 정확히 인식하는 22%의 가능성이 신뢰도 테이블 400에 등록된다. 마찬가지로, 신뢰도 테이블 작성부 306에 의하여 기타 잘못 인식되기 쉬운 문자쌍, 및 신뢰도를 신뢰도 테이블 400에 등록한다. 잘못된 문자와 정확한 문자쌍(L1과 L2)는 L1이 L2로 잘못 인식된 것을 나타낸다. L1과 L2에 대하여는, 문자에 해당하는 문자코드가 등록된다.
신뢰도 테이블 400에는 제84도에 도시한 아래쪽으로의 위치오차 이외의 제83도에 도시한 바와 같이 문자박스에 대한 문자의 경사변동(이 예에서는, 문자의 좌측접촉)등의 각종의 정보가 제85도에 도시한 바와 같이 등록된다.
즉, 제85도에 도시한 바와 같이 아래쪽으로의 위치오차에 대하여는, dx=-3∼+3, dy=5, w=5, dsy=1, dα=-10∼+10, fα=-10∼+10이 신뢰도 테이블 400에 등록된다. 이와 같이, 신뢰도 테이블 400에 등록된 변동량은 dx와 dy뿐만 아니라 아래쪽으로의 위치오차가 등록될때의 다른 값이다. 문자박스에 대한 좌측의 선-접촉문자의 경사변동에 대하여는, dx=-3∼+3, dy=-3∼+3, w=5, dsy=1, dα=-20∼+20, fα=-10∼+10이 신뢰도 테이블 400에 등록된다. 변동량의 값은 특정값에 한정되지 않고 값범위, 예를 들면 제85도에 도시한 dx, dy, dα, fα의 값일 수도 있다.
문자재인식부 307은 신뢰도이 미리 결정된 임계값(예를 들면, 90%) 이하인 잘못된 문자와 정확한 문자쌍(L1과 L2)에 대하여 신뢰도이 미리 결정된 임계값 이상이도록 한 문자인식방법을, 선-접촉문자 생성부 303에 의해 생성된 보간 또는 재보간 패턴을 사용하여 학습한다.
예를 들면, 제84도에 도시한 바와 같이, dy=5, w=5의 아래쪽으로의 위치오차로서 쓰여진 선-접촉문자 2에 대한 문자인식의 신뢰도는 77%이다. 문자가 7로서 잘못 인식될 수도 있으므로, 문자재인식부 307은 선-접촉문자 분리부 304에 의해 얻어진 보가 또는 재보간 패턴을 예를 들면, 영역강조 방법에 의해 재인식하면 인식율이 향상할 수 있는 것을 학습한다.
잘못된 문자와 정확한 문자 세트(2와 7)로 사용된 영역강조방법에 대하여는 제86(a)도와 제86(b)도를 참조하여 이하에 설명한다.
먼저, 제86(a)도에 도시한 바와 같이, 보간 또는 재보간 패턴을 둘러싸는 직사각형 810을 m행 xn열으로 분할한다. 제86(b)도에 도시한 바와 같이 빗금친 영역으로서 표시된 바와 같이, 직사각형의 상부 m/2×n영역을 강조하여 이 영역의 문자를 처리하여 인식한다. 즉, m/2×n영역의 보간 또는 재보간 패턴의 특징을 나타내는 파라미터를 추출하고 나서, 상술한 보간 또는 재보간 패턴이 2 또는 7인 것인지를 조사한다. 이에 의해, 인식율이 95%까지 향상될 수가 있다. 그 다음에, 문자인식부 307은 제85도에 도시한 바와 같이(2,7)에 잘못된 문자와 정확한 문자쌍, 재인식방법으로서 강조영역, 재인식영역으로서 m/2×n, 및 재인식 신뢰도으로서 95%를 등록한다.
강조영역 방법은 제87(a)도에 도시한 선-접촉문자에 대하여도 유효하다. 제87(a)도는 문자 2의 하부가 문자박스 420과 접촉하는 예를 도시한 것이다. 이 예에서는, 선-접촉문자 생성부 303은 제87(b)도에 도시한 7과 유사한 보간 패턴 421를 얻는다. 이 보간 패턴 421에 대하여 제87(c)도에 도시한 둘러싼 직사각형 422를 산출한다. 둘러싼 직사각형 422는 제86(a)도에 도시한 둘러싼 직사각형 410에 대응한다.
문자인식부 305가 둘러싼 직사각형 422를 제86(b)도에 도시한 바와 같이 m×n영역으로 분할하여 상반부의 m/2×n영역을 강조시켜 문자를 인식하면, 보간 패턴 421이 2로서 인식되는 확률이 높고, 즉 인식율(신뢰도)이 향상될 수가 있어서, 선-접촉문자에 대해 준비된 잘못된 문자와 정확한 문자쌍(2,7)에 대한 재인식방법으로서 상술한 강조영역 방법을 신뢰도 테이블 작성부 306을 통하여 신뢰도 테이블 400에 등록한다.
선-접촉문자 분리부 304가 선-접촉문자에 대하여 보간과 재보간 패턴을 얻으면, 보간 패턴 또는 재보간 패턴을 문자재인식에 사용하여야 하는지에 대한 정보를 문자재인식부 307의 학습결과에 근거하여 신뢰도 테이블 400에 초기에 등록할 수가 있다. 정보를 등록할 수 있으면, 재인식처리를 고속으로 효율좋게 행할 수가 있다.
잘못된 문자와 정확한 문자쌍의 결과로서 얻어진 재인식 신뢰도이 임계값 미만인 경우에는, 문자재인식부 307은 신뢰도 테이블 400에 등록된 물체에서 잘못된 문자와 정확한 문자쌍을 제거한다. 이에 의해, 신뢰도 테이블 400의 용량을 삭감할 수가 있고, 인식 신뢰도이 낮은 문자를 인식할때 신뢰도 테이블 400의 검색시간을 문자인식장치 500으로 단축할 수가 있다.
제88도는 신뢰도 테이블 작성장치 300에 의해 작성된 신뢰도 테이블 400을 사용하여 미지의 선-접촉문자에서 예기된 문자를 인식하는 문자인식장치 500의 구성을 도시한 블럭도이다.
선-접촉문자 분리부 501은 문자박스와 문자박스를 통하여 부분적으로 수서된 문자(선-접촉문자)의 2치 화상 데이타를 입력하고, 선-접촉문자에서 문자박스를 추출하여, 추출에 의해 제거된 문자선을 보간 또는 재보간함으로써, 원래의 수서문자를 복원한다. 이 처리는 본 출원인에 의해 일본 특허청에 제출한 특개평 6-309498호의 화상추출방식에 기재되어 있는 방법에 의해 행한다. 그래서, 보간 또는 재보간에 의해 얻어진 보간 또는 재보간 패턴을 변동종류 산출부 502, 문자인식부 504, 및 재인식부 505에 출력한다.
변동종류 산출부 502는 선-접촉문자 분리부 501에 의해 복원된 보간 또는 재보간 패턴을 둘러싸는 직사각형에 관한 위치정보, 문자박스에 관한 위치정보, 및 문자박스를 형성하는 선두께에 관한 정보에 따라 변동종류를 구한다. 즉, 변동종류 산출부 502는 위치오차, 크기변동, 경사변동등의 문자변동, 및 경사변동, 문자박스의 두께변동, 크기변동, 문자박스의 요철등의 문자박스변동을 구한다.
변동량 산출부 503은 선-접촉문자 분리부 501에 의해 얻어진 보간 패턴 또는 재보간 패턴과 관련된 문자박스에 근거하여 변동종류 산출부 502에 의해 얻어진 각 변동의 변동량 dx, dy, dsy, dα, fsx, fsy, fα, 및 fδ를 산출한다. 예를 들면, dx, dy는 보간 또는 재보간 패턴에 관한 중력중심 정보와 문자박스에 관한 중력중심 정보에 따라 산출된다. dx와 dy는 둘러싼 직사각형의 보간 또는 재보간 패턴에 관한 정보에 따라 산출된다. fα는 본 발명의 출원인에 의해 1994년 2월 28일자에 출원한 문자검색회로와 문자검색방법에 기재된 방법에 의해 산출될 수가 있다. w는 선-접촉문자 분리부 501이 문자박스를 추출할때 산출되어 변동량 산출부 503에 입력된다. 또한, fα는 문자박스의 4개 모서리의 위치좌표에 근거하여 산출될 수가 있다. fδ는 문자박스의 2치 화상 정보에 따라 산출된다.
문자인식부 504는 선-접촉문자 분리부 501에 의해 복원된 보간 또는 재보간 패턴을 사용하여 문자를 인식한다. 인식결과(문자코드)는 재인식부 505에 출력된다. 이 문자인식은 기무라, 와카바야시, 오하시등에 의한 통계적 방법에 의한 수서 숫자인식에 기재된 방법에 의해 행한다.
재인식부 505는 문자인식부 504에서 입력되는 문자코드, 변동종류 산출부 502에서 입력되는 변동종류 정보, 및 변동량 산출부 503에서 입력되는 변동량 정보를 키(key)로 하여 신뢰도 테이블400을 검색한다. 그 다음에, 그 키에 대응하는 변동종류 정보, 변동량 정보, 및 잘못된 문자와 정확한 문자세트를 포함하는 행이 신뢰도 테이블 400에 등록되는지의 여부를 조사한다. 이 때에, 잘못된 문자와 정확한 문자쌍에 대하여 문자코드가 등록되는지의 여부를 조사한다. 키에 대응하는 행이 존재한 경우에는, 행에 등록된 신뢰도 레벨이 상기한 임계값보다 높은지의 여부를 판정한다. 이 레벨이 임계값보다 미만이면, 행에 등록된 재인식방법에 따라 선-접촉문자 분리부 501에 의해 복원된 보간 또는 재보간 패턴의 문자를 재인식한다.
문자인식부 504가 미지의 2치 화상 데이타의 선-접촉문자를 7로 인식하고, 변동종류 산출부 502가 아래쪽으로의 위치오차를 변동종류로서 출력하고, 변동량 산출부 503이 아래쪽으로의 위치오차의 양으로 dy=5를 얻는다고 가정한다. 재인식부 505는 이 정보를 키로하여 신뢰도 테이블 400을 검색하여 이 경우의 7의 인식 신뢰도이 77%로서 임계값보다 낮다는 것을 통지받는다. 그 다음에, 신뢰도 테이블에 등록된 재인식방법에 따라서 선-접촉문자 분리부 501에 의해 복원된 보간 또는 재보간 패턴의 상반부 영역(m/2×n)만을 강조함으로써 문자를 재인식한다. 이와 같이, 미지의 2치 화상 데이타의 선-접촉문자는 2로서 재인식된다.
재인식부 505가 신뢰도 테이블 400을 검색하여 문자인식부 504에 의해 인식된 문자의 신뢰도이 임계값보다 높은 경우에는, 문자가 재인식되지는 않지만, 문자인식부 504에서 입력된 문자코드가 출력된다.
제81도에 도시한 신뢰도 테이블 작성장치 300의 문자재인식부 307의 동작에 대하여는 제81도에 도시한 흐름도를 참조하여 이하에 설명한다. 이 흐름도는 문자재인식부 307이 신뢰도 테이블 400에 강조영역의 인식방법을 등록하는 경우의 동작을 설명한 것이다.
문자재인식 307은 신뢰도 테이블 작성부 306을 통하여 신뢰도 테이블 400에서 신뢰도 레벨이 낮은 잘못된 문자와 정확한 문자쌍의 데이타를 검색한다. 이 잘못된 문자와 정확한 문자쌍의 좌측에 등록되는 문자에 대하여, 2치의 학습 데이타(문자패턴)과 선-접촉문자 분리부 304에 의해 생성된 패턴(보간 패턴 또는 재보간 패턴)을 입력한다(단계 S501).
이 보간 패턴 또는 재보간 패턴은 신뢰도 테이블 400에 등록되는 변동량 파라미터에 의해 규정되고, 동일한 카테고리에서도 각종의 형상의 패턴을 취한다.
다음에, 상기한 학습 데이타의 문자패턴(이하, 제1의 패턴이라고 함)과 선-접촉문자 분리부 304에 의해 생성된 패턴(이하, 제2의 패턴이라고 함)을 m×n영역으로 분할한다(단계 S502).
그래서, m×n영역내의 X×Y의 부분패턴에 대하여 문자인식을 실행하여 인식율 z를 구한다(단계 S503).
X×Y의 부분패턴은 X와 Y가 각각 m×n의 영역의 X방향, Y방향의 크기를 나타내는 변수인 인식영역이다(X≤m, Y≤n). 인식율 z는 상기 X×Y의 부분패턴을 사용하여 문자인식을 행할때의 정확히 인식될 수 있는 확률이다. 즉, 제1의 패턴의 부분패턴의 문자인식결과를 정확한 결과로서 인식하여, 다수개의 제2의 패턴의 부분패턴의 문자인식결과와 제1의 패턴의 부분패턴의 문자인식결과를 비교함으로써 제2의 패턴의 부분패턴의 인식율 z를 구할 수가 있다.
그 다음에, 인식율 z가 최대 인식율 max보다 큰지의 여부를 판정한다(S504). 최대 인식율 max는 X×Y 부분패턴을 변화시킨 경우에서의 인식율의 최대값을 기억하는 변수이고, 최초에는, 초기값(예를 들면, 0)이 설정된다.
인식율 z가 최대 인식율 max보다 크면(단계 S504에서 yes), 단계 S503으로 복귀되어 X와 Y를 변경시키고, X와 Y에 대하여 새로운 부분패턴을 판정하여 이 부분패턴에 대하여 문자인식을 행한다.
단계 S507에서 최대 인식율 max가 임계값보다 작거나 문자인식부 305의 인식율(신뢰도 테이블 400에 등록된 신뢰도)보다 작고 재인식의 효과가 현저하지 않는 경우에는, 신뢰도 테이블 400에 등록을 중지할 수가 있다.
제82도의 흐름도에 도시된 알고리듬은 영역강조의 방법을 사용하여 문자재인식방법을 학습하는 예이다. 문자재인식부 307은 영역강조의 방법과는 다른 방법에 대하여도 문자재인식방법을 학습할 수가 있다.
제90도는 문자인식장치 500의 재인식부 505의 동작을 설치하는 흐름도이다.
재인식부 505는 이하의 데이타 1∼3을 입력하여 상술한 흐름도에 도시한 처리를 행한다.
1. 선-접촉문자 분리부 501에서 등록된 신뢰도의 분리패턴(보간 패턴 또는 재보간 패턴).
2. 변동량 산출부 503에서 등록된 변동량.
3. 문자인식부 504에서 등록된 문자코드(문자인식코드).
재인식부 505는 먼저 변동량 산출부 503에서 변동량을 입력하고 신뢰도 테이블 400을 검색하여, 변동량 산출부 503에서 입력된 변동량에 일치하는 변동량이 등록되어 있는 행이 존재하는지의 여부를 조사한다(S601).
아래쪽으로의 위치오차를 나타내는 문자 2에 대하여, 변동량 dx=5, w=5가 입력되면, 신뢰도 테이블 400의 최상위의 행이 검출된다.
변동량이 일치하는 행이 존재하면, 이 행중에 문자인식부 504에서 입력되는 문자코드(문자인식코드)를 포함하는 잘못된 문자와 정확한 문자쌍을 갖는 행이 존재하는지의 여부를 판정한다(단계 S602).
이에 의해, 아래쪽으로의 위치오차를 나타내는 문자 2에 대하여 상술한 최상위의 행이 검출된다.
상술한 행이 존재하면, 행에 입력된 재인식 신뢰도와 신뢰도를 비교하여, 재인식 신뢰도이 신뢰도보다 높은지의 여부를 판정한다(단계 S603).
그 결과, 아래쪽으로의 위치오차를 나타내는 문자 2에 대하여 최상위의 행에 등록되는 재인식 신뢰도와 신뢰도이 각각 95%와 77%이고 재인식 신뢰도이 신뢰도보다 높다고 판정된다.
재인식 신뢰도이 신뢰도보다 높으면(단계 S603에서 yes), 재인식 신뢰도이 미리 결정된 임계값 th1보다 높은지의 여부를 더 판정한다(단계 S604). 임계값 th1보다 높으면(단계 S604에서 yes), 단계 S602에서 신뢰도 테이블 400에서 검출된 행에 등록되는 재인식방법과 재인식 영역을 참조한다(단계 S605).
그 다음에, 선-접촉문자 분리부 501에서 입력되는 분리패턴(보간 패턴 또는 재보간 패턴)에서 재인식 영역을 잘라내고, 이 잘라내진 영역에 대하여 상기 재인식방법에 의해 문자인식을 실행한다. 이 문자인식처리에 의해 얻어진 문자코드를 출력한다(단계 S606).
상기 임계값 th1이 95%보다 작으면, 선-접촉문자 분리부 501에서 입력되는 상기 아래쪽으로의 위치오차를 나타내는 문자 2의 보간 패턴에 대하여 상반부의 m/2×n영역을 사용한 영역강조방법에 의해 문자인식처리가 재실행되어, 최종적으로 문자 2의 문자코드가 출력된다.
상술한 바와 같이, 각 문자 카테고리에 대하여 각종의 형태로의 선-접촉문자인식율을 신뢰도 레벨로 하여, 그 문자와 문자박스간의 접촉상태를 나타내는 패턴에 관한 정보와 함께, 본 실시형태에 따라 인식율을 향상시키는 인식방법을 신뢰도 테이블 400에 등록한다.
그러므로, 그 신뢰도 테이블 400을 참조함으로써, 입력된 미지의 선-접촉문자에 대한 인식결과의 신뢰도를 구할 수가 있다. 신뢰도 레벨이 낮으면, 신뢰도 테이블 400에 등록되는 재인식방법에 의해 미지의 선-접촉문자를 인식함으로써 문자인식의 정확도를 향상시킬 수가 있다.
파라미터의 값이 신뢰도 테이블 400에 등록되는 경우에는, 신뢰도 테이블 400의 용량을 삭감할 수가 있고 특정값이 아닌 그 범위내에서 값을 등록함으로써 검색처리를 고속으로 행할 수가 있다. 등록되는 파라미터의 종류가 자유롭게 선택될 수가 있으므로, 대부부의 미지의 선-접촉문자를 본 실시예에 의해 처리할 수가 있다. 이러한 시스템은 신뢰도 테이블 400의 용량을 크게 하는 것을 필요로 하지 않는다.
상기 실시예는 본 발명의 문자인식장치에의 적용예이지만, 본 발명은 이에 한정되지는 않고, 직선과 도형, 기호등의 각종 패턴을 포함하는 화상에서 목적으로 하는 화상을 정확히 추출하는 패턴추출장치, 및 패턴추출장치에 의해 추출된 패턴을 재인식하는 패턴재인식장치와 같은 화상인식시스템에 관계되는 각종의 기술에 적용될 수가 있다.
더우기, 본 실시예에 의하면, 각종의 형태에서 문자박스, 테이블등의 선과 접촉하는 선-접촉문자의 인식의 신뢰도를 미리 학습할 수가 있고 이 신뢰도를 테이블에 등록시킨다. 그러므로, 미지의 선-접촉문자가 인식되는 경우에 미지의 선-접촉문자의 신뢰도이 인식된다.
테이블을 참조하여 다른 방법에 의해 재인식함으로써 인식 신뢰도이 낮아지는 미지의 박스-접촉문자에 대해 잘못된 인식을 감소시킬 수가 있다. 더우기, 신뢰도를 향상시키는 재인식방법을 학습하여 테이블에 이 신뢰도의 방법을 등록함으로써, 신뢰도 레벨이 낮은 선-접촉문자의 재이식 신뢰도이 테이블에 등록되는 재인식방법에 의해 문자를 재인식하는 것에 의해 정확히 향상될 수가 있다.
상기의 효과는 작은 용량의 테이블을 사용하여 실현될 수가 있다. 문자패턴이외에도, 도형이나 기호등의 각종 패턴에 대해 인식율을 향상시킬 수가 있다.

Claims (43)

  1. 직선과 이와 접촉하는 패턴으로 구성된 화상에서 패턴만을 추출하는 패턴추출장치에 있어서, 직선과 이와 접촉하는 패턴으로 된 화상에서 직선을 추출하는 선추출수단, 상기 선추출수단에 의해 추출된 직선과 패턴과의 교점을 산출하는 교점산출수단, 상기 교점산출수단에 의해 얻어진 교점정보에 따라 패턴에 대응하는 부분을 가상화상으로 추출하는 가상화상추출수단, 및 상기 가상화상추출수단에 의해 추출된 가상화상에서 패턴의 화상만을 추출하는 실제화상추출수단으로 구성되는 패턴추출장치.
  2. 제1항에 있어서, 상기 실제 화상 추출수단이 가상화상중에 패턴의 화상에 대응하는 실제 화상을 판정하는 실제 화상 판정수단, 및 가상화상에서 상기 실제 화상 판정수단에 의해 실제 화상인 것으로 판정된 부분이외의 영역을 제거하는 영역제거수단으로 구성되는 패턴추출장치.
  3. 제2항에 있어서, 상기 실제 화상 판정수단이 가상화상중에 패턴의 화상에 대응하는 실제 화상만을 가상화상의 구조에서 추출하기 위한 정보를 저장하는 테이블, 및 가상화상의 구조를 판정하여, 상기 테이블을 참조하여 가상화상의 패턴의 화상에 대응하는 실제 화상을 선택하는 선택수단으로 구성되는 패턴추출장치.
  4. 제3항에 있어서, 상기 패턴이 문자패턴이고, 상기 테이블이 문자의 각 종류의 설치되는 패턴추출장치.
  5. 제2항에 있어서, 상기 실제 화상 판정수단이 가상화상의 구조를 판정하여, 그 판정한 구조에 근거하여 가상화상에 포함되는 패턴의 화상에 대응하는 실제 화상의 부분을 판정하는 패턴추출장치.
  6. 제1항에 있어서, 상기 패턴이 문자패턴인 패턴추출장치.
  7. 제6항에 있어서, 상기 실제 화상 판정수단이 가상화상을 포함하는 문자패턴의 문자열에서 1문자패턴의 평균크기인 평균문자크기를 산출하는 평균문자크기 산출수단, 및 상기 평균문자크기 산출수단에 의해 산출된 평균문자크기에 근거하여 가상화상에서 문자패턴을 갖는 문자의 부분을 형성하는 선에 대한 실제 화상을 선택하는 선택수단으로 구성되는 패턴추출장치.
  8. 제7항에 있어서, 상기 선택수단이 상기 평균문자크기 산출수단에 의해 산출된 평균문자크기에 근거하여 최대 및 최소문자크기를 설정하는 임계값 설정수단, 및 가상화상과 국부적으로 대응된 문자패턴이 상기 평균문자크기 산출수단에 의해 얻어진 최대문자크기보다 크기가 큰 경우에 문자패턴에서 가상화상을 제거함으로써 얻어진 다수개의 패턴중에 최소문자크기보다 작은 패턴과 가상화상을 실제 화상으로서 판독되는 판정수단으로 구성되는 패턴추출장치.
  9. 제7항에 있어서, 상기 선택수단이 상기 평균문자크기 산출수단에 의해 산출된 평균문자크기에 근거하여 최대문자크기를 판정하는 임계값 설정수단, 및 문자열중의 문자패턴이 상기 임계값 설정수단에 의해 설정된 최대문자크기보다 큰 경우에 문자패턴이 1문자의 실제 화상인 것으로 판정하는 판정수단으로 구성되는 패턴추출장치.
  10. 제6항에 있어서, 상기 실제 화상 판정수단이 가상화상을 포함하는 문자패턴의 문자열에서 1문자패턴의 평균크기인 평균문자크기를 산출하는 평균문자크기 산출수단, 상기 평균문자크기 산출수단에 의해 얻어진 평균문자크기에 근거하여 문자열중에 가상화상을 포함하는 문자패턴에서 문자의 부분을 형성하는 실제선의 화상을 판정하는 제1판정수단, 가상선으로 된 가상화상의 구조에서 가상화상내의 문자를 형성하는 실제선의 화상만을 추출하기 위한 정보를 저장하는 테이블, 및 상기 테이블을 참조하여 가상화상의 구조를 판정하여서 이 가상화상에 근거하여 실제선으로 된 실제 화상을 판정하는 제2판정수단으로 구성되는 패턴추출장치.
  11. 제6항에 있어서, 상기 실제 화상 추출수단이 가상화상을 포함하는 문자패턴의 문자열에서 1문자열에서 1문자패턴의 평균크기인 평균문자크기를 산출하는 평균문자크기 산출수단, 및 상기 평균문자크기 산출수단에 의해 얻어진 평균문자크기에 근거하여 문자열중에 가상화상을 포함하는 문자패턴에서 문자패턴의 실제 화상 이외의 영역을 제거하는 영역제거수단으로 구성되는 패턴추출장치.
  12. 제11항에 있어서, 상기 영역제거수단은 평균문자크기에 근거하여 최대 및 최소문자크기를 설정하는 임계값 설정수단, 및 가상화상에 국부적으로 대응하는 문자패턴이 상기 임계값 설정수단에 의해 얻어진 최대문자크기보다 큰 경우, 그 문자패턴이 최소문자크기보다 크면 가상화상만을 제거하는 가상화상 제거수단으로 구성되는 패턴추출장치.
  13. 선과 접촉하는 패턴에 의해 형성된 화상에서 패턴만을 분리하는 패턴분리수단, 상기 패턴분리수단에 의해 추출된 패턴을 인식하는 패턴인식수단, 상기 패턴인식수단에 의해 인식된 패턴의 신뢰도를 선과 접촉하는 패턴의 각 상태에 대해 선출하는 신뢰도 산출수단, 및 상기 신뢰도 산출수단에 의해 산출되는 신뢰도이 미리 결정된 임계값보다 작은 선과 패턴과의 접촉상태에 대하여, 일련의 패턴, 즉 상기 패턴인식수단에 의해 오인식된 패턴과 함께 신뢰도 데이타를 저장하기 위한 테이블을 생성하는 테이블생성수단으로 구성되는 패턴재인식 테이블생성장치.
  14. 선과 접촉하는 패턴에 의해 형성된 화상에서 패턴만을 분리하는 패턴분리수단, 상기 패턴인식수단에 의해 인식된 패턴의 선과 접촉하는 패턴의 각 상태에 대해 산출하는 신뢰도 산출수단, 상기 신뢰도 산출수단에 의해 산출되는 신뢰도이 미리 결정된 임계값보다 작은 선과 패턴과의 접촉상태에 대하여 패턴인식의 신뢰도를 향상시키는 문자재인식의 방법을 학습하는 문자재인식수단, 및 상기 문자재인식수단에 의해 학습된 문자재인식의 방법을, 상기 패턴인식수단에 의해 오인식된 패턴과 예기된 패턴으로 된 일련의 패턴과 함께 기억하는 테이블을 생성하는 테이블 작성수단으로 구성되는 패턴재인식 테이블생성장치.
  15. 문자박스 또는 괘선과 접촉하는 것으로서 문자를 포함하는 화상에서 문자만을 분리추출하는 문자분리수단, 상기 문자분리수단에 의해 추출된 문자를 인식하는 문자인식수단, 상기 문자인식수단에 의해 인식된 문자의 신뢰도를 각 선-문자접촉상태에 대해 산출하는 신뢰도 산출수단, 및 상기 신뢰도 산출수단에 의해 산출되는 신뢰도이 미리 결정된 임계값보다 작은 선-문자접촉상태에 대하여, 상기 문자인식수단에 의해 오인식된 문자와 예기된 문자로 된 문자쌍과 함께 신뢰도 데이타를 기억하는 테이블을 생성하는 테이블 작성수단으로 구성되는 패턴재인식 테이블생성장치.
  16. 문자박스 또는 괘선의 선과 접촉하는 문자를 포함하는 화상에서 문자만을 분리추출하는 문자분리수단, 상기 문자분리수단에 의해 추출된 문자를 인식하는 문자인식수단, 상기 문자인식수단에 의해 인식된 문자의 신뢰도를 목적으로 하는 화상을 형성하는 문자와 선과의 접촉상태마다 산출하는 신뢰도 산출수단, 상기 신뢰도 산출수단에 의해 산출되는 신뢰도이 미리 결정된 임계값보다 작은 선-문자접촉상태에 대하여, 문자인식의 신뢰도를 향상시키는 문자재인식의 방법을 학습하는 문자재인식수단, 및 상기 문자재인식수단에 의해 오인식된 문자와 예기된 문자로 되는 문자쌍과 함께 상기 문자재인식수단에 의해 학습된 문자재인식의 방법을 기억하는 테이블을 생성하는 테이블 작성수단으로 구성되는 패턴재인식 테이블 작성장치.
  17. 제16항에 있어서, 상기 신뢰도 산출수단이 문자박스와 테이블을 형성하는 선과 접촉하는 각종의 화상 패턴을 생성하는 선-접촉문자 생성수단, 및 상기 문자인식수단에 의해 인식된 문자의 인식율을 상기 선-접촉문자 생성수단에 의해 생성된 화상패턴에 대해 조사하는 신뢰도 설정수단으로 구성되는 패턴재인식 테이블생성장치.
  18. 제17항에 있어서, 상기 선-접촉문자 생성수단이 미리 결정된 문자박스, 테이블등의 부분을 형성하는 선에 각종의 형태로 변화시키는 각 문자를 중첩시켜서 화상패턴을 생성하는 패턴재인식 테이블생성장치.
  19. 제18항에 있어서, 상기 선-접촉문자 생성수단이 각 문자의 크기를 변화시켜서 화상패턴을 생성하는 패턴재인식 테이블생성장치.
  20. 제18항에 있어서, 상기 선-접촉문자 생성수단이 각 문자를, 그 중력중심을 중심으로 하는 회전각도를 변화시켜서 화상패턴을 생성하는 패턴재인식 테이블생성장치.
  21. 제17항에 있어서, 상기 선-접촉문자 생성수단은 미리 결정된 형태의 각 문자에 각종의 형태로 변화시키는 문자박스, 테이블등의 부분을 형성하는 선을 중첩하여 화상패턴을 생성하는 패턴재인식 테이블생성장치.
  22. 제21항에 있어서, 상기 선-접촉문자 생성수단은 문자박스, 테이블등의 부분을 형성하는 선을, 그 중력중심을 중심으로 하는 회전각도를 변화시켜서 화상패턴을 생성하는 패턴재인식 테이블생성장치.
  23. 제21항에 있어서, 상기 선-접촉문자 생성수단은 문자박스, 테이블등의 부분을 형성하는 선의 두께를 변화시켜서 화상패턴을 생성하는 패턴재인식 테이블생성장치.
  24. 제21항에 있어서, 상기 선-접촉문자 생성수단은 문자박스, 테이블등의 부분을 형성하는 선의 두께를 각 위치에 따라 변화시켜서 선-접촉문자를 생성하는 패턴재인식 테이블생성장치.
  25. 제17항에 있어서, 상기 선-접촉문자 생성수단이 각종의 형태로 변화시키는 각 문자에 각종의 형태로 변화시킨 문자박스, 테이블등의 부분을 형성하는 선을 중첩시켜서 화상패턴을 생성하는 패턴재인식 테이블생성장치.
  26. 제17항에 있어서, 상기 선-접촉문자 생성수단이 문자의 중력중심과 문자박스, 규정된 선등의 부분을 형성하는 선의 중력중심과의 상대적인 위치관계를 변화시켜서 선-접촉문자를 생성하는 패턴재인식 테이블생성장치.
  27. 선과 부분적으로 중첩하는 패턴을 포함하는 화상에서 패턴만을 분리추출하는 패턴분리수단, 상기 패턴분리수단에 의해 추출된 패턴을 인식하는 패턴인식수단, 상기 패턴인식수단에 의해 인식된 패턴의 신뢰도를 목적으로 하는 화상을 형성하는 선과 부분적으로 중첩하는 패턴의 상태마다 산출하는 신뢰도 산출수단, 상기 신뢰도 산출수단에 의해 산출된 신뢰도이 미리 결정된 임계값보다 작은 선과 부분적으로 중첩하는 패턴의 상태에 대하여 패턴인식수단과는 다른 방법에 의해 패턴을 재인식하는 재인식수단으로 구성되는 패턴인식장치.
  28. 제27항에 있어서, 상기 패턴인식수단에 의해 인식된 신뢰도이 미리 결정된 임계값보다 작은 선과 부분적으로 중첩하는 패턴의 상태에 대하여 패턴인식의 신뢰도를 향상시키는 패턴재인식방법이 등록되는 테이블로 더 구성되어, 상기 재인식수단이 이 테이블에 등록된 재인식방법에 의해 패턴을 재인식하는 패턴인식장치.
  29. 제28항에 있어서, 상기 테이블에 등록되는 상기 재인식방법에 상기 패턴분리수단에 의해 분리된 패턴의 특정영역을 사용하여 패턴을 인식하는 방법인 패턴인식장치.
  30. 제29항에 있어서, 상기 패턴의 특정영역이 패턴을 둘러싸는 분할된 직사각형 영역인 패턴인식장치.
  31. 문자박스 또는 괘선의 선과 접촉하는 문자를 포함하는 화상에서 문자만을 분리추출하는 문자분리수단, 상기 문자분리수단에 의해 추출된 문자를 인식하는 문자인식수단, 목적으로 하는 화상을 형성하는 문자와 선과의 접촉상태마다 문자인식수단에 의해 인식된 문자의 신뢰도를 산출하는 신뢰도 산출수단, 상기 신뢰도 산출수단에 의해 산출되는 신뢰도이 미리 결정된 임계값보다 작은 선-문자접촉상태에 대하여 상기 문자인식수단과는 다른 방법에 의해 문자를 재인식하는 재인식수단으로 구성되는 패턴인식장치.
  32. 제31항에 있어서, 상기 문자인식수단에 의해 인식되는 신뢰도이 미리 결정된 임계값보다 작은 선-문자접촉상태에 대하여 문자인식의 신뢰도를 향상시키는 문자재인식방법에 등록되는 테이블로 구성되어, 상기 재인식수단이 이 테이블에 등록되는 재인식방법에 의해 문자를 재인식하는 패턴인식장치.
  33. 제32항에 있어서, 테이블에 등록되는 상기 재인식방법이 상기 문자분리수단에 의해 분리되는 문자의 특정영역을 사용하여 문자를 재인식하는 방법인 패턴인식장치.
  34. 제33항에 있어서, 상기 문자의 특정영역이 문자를 둘러싸는 직사각형의 분할영역인 패턴인식장치.
  35. 제31항에 있어서, 상기 문자인식수단에 의해 인식되는 신뢰도이 미리 결정된 임계값보다 작은 선-문자접촉상태에 대하여 상기 문자인식수단에 의해 오인식된 문자와 예기된 문자로 된 문자쌍과, 선-접촉문자인식의 신뢰도를 향상시키는 문자재인식방법을 포함하는 테이블로 구성되어, 상기 재인식수단이 상기 문자인식수단에 의해 인식된 문자가 상기 테이블에 등록되는 문자쌍에 포함되는 경우에 테이블에 등록되는 재인식방법에 의해 문자를 재인식할 수 있도록 구성되는 패턴인식장치.
  36. 제35항에 있어서, 테이블에 등록되는 상기 재인식방법이 상기 문자분리수단에 의해 분리된 문자의 특정영역을 사용하여 문자를 재인식하는 방법인 패턴인식장치.
  37. 제26항에 있어서, 상기 문자의 특정영역이 문자를 둘러싸는 직사각형의 분할영역인 패턴인식장치.
  38. 제31항에 있어서, 상기 문자인식수단에 의해 인식되는 신뢰도이 미리 결정된 임계값보다 작은 선-문자접촉상태에 대하여, 상기 문자인식수단에 의해 쉽게 오인식되는 문자와 예기된 문자로 되는 문자쌍과, 선-접촉문자인식의 신뢰도를 향상시키는 문자재인식방법을 포함하는 테이블로 더 구성되어, 상기 재인식수단은 상기 문자인식수단에 의해 인식된 문자가 테이블에 등록되는 문자쌍에 포함되고 테이블에 등록되는 상기 문자인식수단에 의한 문자인식의 신뢰도이 미리 결정된 임계값보다 작은 경우에 테이블에 등록되는 재인식방법에 의해 문자를 재인식할 수 있도록 구성되는 패턴인식장치.
  39. 제38항에 있어서, 테이블에 등록되는 상기 재인식방법이 상기 문자분리수단에 의해 분리된 문자의 특정영역을 사용하여 문자를 재인식하는 방법인 패턴인식장치.
  40. 제39항에 있어서, 상기 문자의 특정영역이 문자를 둘러싸는 직사각형의 분할영역인 패턴인식장치.
  41. 제31항에 있어서, 상기 문자인식수단에 의해 인식되는 신뢰도이 미리 결정된 임계값보다 작은 선-문자접촉상태에 대하여, 접촉상태의 특징을 나타내는 파라미터, 신뢰도 데이타, 상기 문자인식수단에 의해 오인식되기 쉬운 문자와 예기된 문자로 되는 문자쌍, 선-접촉문자인식의 신뢰도를 향상시키는 문자재인식방법을 포함하는 테이블로 더 구성되어, 상기 재인식수단은 상기 재인식수단이 선-문자접촉상태의 특징을 나타내는 각 파라미터의 값을 산출하고, 파라미터와 상기 문자인식수단에 인식된 문자가 테이블에 등록되는 문자쌍에 포함되며 테이블에 등록되는 상기 문자인식수단에 의한 문자인식의 신뢰도이 미리 결정된 임계값보다 작은 경우에 테이블에 등록된 재인식방법에 의해 문자를 재인식할 수 있도록 구성되는 패턴인식장치.
  42. 제41항에 있어서, 테이블에 등록되는 상기 재인식방법에 상기 문자분리수단에 의해 분리된 문자의 특정영역을 사용하여 문자를 재인식하는 방법인 패턴인식장치.
  43. 제41항에 있어서, 상기 문자의 특정영역이 문자를 둘러싸는 직사각형의 분할영역인 패턴인식장치.
KR1019960005703A 1995-03-06 1996-03-05 패턴 추출장치, 패턴 재인식 테이블작성장치, 및 패턴 인식장치 KR100211856B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP95-045597 1995-03-06
JP4559795 1995-03-06
JP20556495A JP3345224B2 (ja) 1995-03-06 1995-08-11 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP95-205564 1995-08-11

Publications (2)

Publication Number Publication Date
KR960035329A KR960035329A (ko) 1996-10-24
KR100211856B1 true KR100211856B1 (ko) 1999-08-02

Family

ID=26385617

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960005703A KR100211856B1 (ko) 1995-03-06 1996-03-05 패턴 추출장치, 패턴 재인식 테이블작성장치, 및 패턴 인식장치

Country Status (3)

Country Link
US (2) US5889887A (ko)
JP (1) JP3345224B2 (ko)
KR (1) KR100211856B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150106143A (ko) * 2014-03-11 2015-09-21 주식회사 유니온커뮤니티 패턴 이미지 획득장치 및 그 방법
KR20150143136A (ko) 2014-06-13 2015-12-23 권영모 조립식 등신대 장치

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3345224B2 (ja) * 1995-03-06 2002-11-18 富士通株式会社 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP3411472B2 (ja) * 1997-05-30 2003-06-03 富士通株式会社 パターン抽出装置
US6539112B1 (en) 1999-02-26 2003-03-25 Raf Technology, Inc. Methods and system for identifying a reference region on an image of a dropped-out form
AU4077300A (en) 1999-04-07 2000-10-23 Raf Technology, Inc. Extracting user data from a scanned image of a pre-printed form
JP4416890B2 (ja) 1999-12-20 2010-02-17 富士通株式会社 帳票識別装置
US6570562B1 (en) * 2000-05-03 2003-05-27 Hewlett-Packard Development Company, L.P. Method for drawing patterned lines in a system supporting off-screen graphics
JP4613397B2 (ja) * 2000-06-28 2011-01-19 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US20020198866A1 (en) * 2001-03-13 2002-12-26 Reiner Kraft Credibility rating platform
KR100449805B1 (ko) * 2001-12-26 2004-09-22 한국전자통신연구원 붙은 필기체 숫자열의 분할인식방법
US20030198386A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for identifying and extracting character strings from captured image data
JP4834351B2 (ja) * 2005-08-22 2011-12-14 株式会社東芝 文字認識装置及び文字認識方法
JP5034398B2 (ja) * 2006-09-14 2012-09-26 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置
US8244036B2 (en) * 2007-01-24 2012-08-14 Bluebeam Software, Inc. Method for emphasizing differences in graphical appearance between an original document and a modified document with annotations
US8000535B2 (en) 2007-06-18 2011-08-16 Sharp Laboratories Of America, Inc. Methods and systems for refining text segmentation results
AU2009217445A1 (en) * 2009-09-22 2011-04-07 Canon Kabushiki Kaisha Fast line linking
JP5677139B2 (ja) * 2011-03-07 2015-02-25 三菱電機株式会社 帳票文字認識装置
US8760451B2 (en) 2011-06-30 2014-06-24 Google Inc. Rendering a text image using texture map character center encoding with character reference encoding
US8400453B2 (en) * 2011-06-30 2013-03-19 Google Inc. Rendering a text image following a line
EP2727006B1 (en) * 2011-06-30 2018-10-31 Google LLC Rendering a text image following a line
US8687890B2 (en) * 2011-09-23 2014-04-01 Ancestry.Com Operations Inc. System and method for capturing relevant information from a printed document
US8949110B2 (en) 2011-09-23 2015-02-03 Ancestry.Com Operations Inc. System and method for extracting categories of data
KR102161053B1 (ko) * 2013-09-06 2020-09-29 삼성전자주식회사 영상에 포함된 표의 구조를 생성하는 방법 및 이를 위한 장치
JP6255929B2 (ja) * 2013-11-15 2018-01-10 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
JP6471796B2 (ja) * 2017-12-07 2019-02-20 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3201752A (en) * 1962-06-11 1965-08-17 Control Data Corp Reading machine with mark separation
US4292622A (en) * 1980-02-21 1981-09-29 Hendrix Electronics, Inc. System and method for processing horizontal line characteristics in an image
US4741045A (en) * 1983-09-23 1988-04-26 Dest Corporation Optical character isolation system, apparatus and method
JPS6115284A (ja) * 1984-06-29 1986-01-23 Toshiba Corp 光学的文字読取装置
JPH03160582A (ja) * 1989-11-20 1991-07-10 Sanyo Electric Co Ltd 文書画像データに於ける罫線と文字の分離方法
JPH03212779A (ja) * 1990-01-18 1991-09-18 Yokogawa Electric Corp 文字認識装置
US5444840A (en) * 1990-06-12 1995-08-22 Froessl; Horst Multiple image font processing
US5875263A (en) * 1991-10-28 1999-02-23 Froessl; Horst Non-edit multiple image font processing of records
JP3345224B2 (ja) * 1995-03-06 2002-11-18 富士通株式会社 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150106143A (ko) * 2014-03-11 2015-09-21 주식회사 유니온커뮤니티 패턴 이미지 획득장치 및 그 방법
KR101642959B1 (ko) * 2014-03-11 2016-07-26 주식회사 유니온커뮤니티 패턴 이미지 획득장치 및 그 방법
KR20150143136A (ko) 2014-06-13 2015-12-23 권영모 조립식 등신대 장치

Also Published As

Publication number Publication date
KR960035329A (ko) 1996-10-24
US6052480A (en) 2000-04-18
JP3345224B2 (ja) 2002-11-18
US5889887A (en) 1999-03-30
JPH08305796A (ja) 1996-11-22

Similar Documents

Publication Publication Date Title
KR100211856B1 (ko) 패턴 추출장치, 패턴 재인식 테이블작성장치, 및 패턴 인식장치
US5774580A (en) Document image processing method and system having function of determining body text region reading order
Kasturi et al. Document image analysis: A primer
Seni et al. External word segmentation of off-line handwritten text lines
US4813078A (en) Character recognition apparatus
KR100248917B1 (ko) 패턴인식장치및방법
EP0543599B1 (en) Method and apparatus for image hand markup detection
US5572602A (en) Image extraction system for extracting patterns such as characters, graphics and symbols from image having frame formed by straight line portions
Razak et al. Off-line handwriting text line segmentation: A review
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
EP0063454B1 (en) Method for recognizing machine encoded characters
US20020159639A1 (en) Form identification method
US6917708B2 (en) Handwriting recognition by word separation into silhouette bar codes and other feature extraction
US11823497B2 (en) Image processing system and an image processing method
Roy et al. Text line extraction in graphical documents using background and foreground information
Lehal et al. Feature extraction and classification for OCR of Gurmukhi script
US6005976A (en) Image extraction system for extracting patterns such as characters, graphics and symbols from image having frame formed by straight line portions
Kiessling A modular region and text line layout analysis system
StevensÝ et al. Automatic processing of document annotations
Kim et al. Word segmentation of printed text lines based on gap clustering and special symbol detection
Roy et al. Word-wise hand-written script separation for indian postal automation
Doermann Document image understanding: integrating recovery and interpretation
Shakunthala et al. Enhanced text line segmentation and skew estimation for handwritten Kannada document
Srinivas et al. An overview of OCR research in Indian scripts
Amano et al. DRS: A workstation-based document recognition system for text entry

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120423

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20130502

Year of fee payment: 15

LAPS Lapse due to unpaid annual fee