KR20050090945A - 문자 인식 장치, 문자 인식 방법, 매체 처리 방법, 문자인식 프로그램 및 문자 인식 프로그램을 기록한 컴퓨터판독 가능한 기록 매체 - Google Patents

문자 인식 장치, 문자 인식 방법, 매체 처리 방법, 문자인식 프로그램 및 문자 인식 프로그램을 기록한 컴퓨터판독 가능한 기록 매체 Download PDF

Info

Publication number
KR20050090945A
KR20050090945A KR1020040077435A KR20040077435A KR20050090945A KR 20050090945 A KR20050090945 A KR 20050090945A KR 1020040077435 A KR1020040077435 A KR 1020040077435A KR 20040077435 A KR20040077435 A KR 20040077435A KR 20050090945 A KR20050090945 A KR 20050090945A
Authority
KR
South Korea
Prior art keywords
character
image
area
recognition
outer part
Prior art date
Application number
KR1020040077435A
Other languages
English (en)
Other versions
KR100625755B1 (ko
Inventor
가나모토코우이치
가츠마타유타카
에구치시니치
Original Assignee
후지쯔 가부시끼가이샤
후지츠 프론테크 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤, 후지츠 프론테크 가부시키가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20050090945A publication Critical patent/KR20050090945A/ko
Application granted granted Critical
Publication of KR100625755B1 publication Critical patent/KR100625755B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/88Image or video recognition using optical means, e.g. reference filters, holographic masks, frequency domain filters or spatial domain filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1429Identifying or ignoring parts by sensing at different wavelengths
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/01Solutions for problems related to non-uniform document background
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 컬러 장표에 기재된 문자를 고정밀도로 인식할 수 있도록 하는 것을 목적으로 한다.
배경 인정부(13)와, 문자 외선분 인정부(14)와, 원화상으로부터 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부(17)와, 제1 문자 영역 인정부(15)와, 확대 화상 작성부(16)와, 제2 문자 외선분 제거 화상 작성부(17)와, 원화상에 있어서 문자와 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부(18)와, 문자 화상에 관한 색정보와 문자 외선분에 관한 색정보의 차이에 기초로 하여 문자 화상의 복원을 행하는 문자 화상 복원부(19)와, 제2 문자 영역 인정부(20)와, 제2 문자 영역 인정부(20)에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부(21)를 갖춰 구성한다.

Description

문자 인식 장치, 문자 인식 방법, 매체 처리 방법, 문자 인식 프로그램 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체{CHARACTER RECOGNITION METHOD}
본 발명은 예컨대 금융기관에서의 장표 처리에 이용하기 적합한 문자 인식 장치, 문자 인식 방법, 매체 처리 방법, 문자 인식 프로그램 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체로서, 특히, 컬러 장표에 기재된 문자의 인식을 행하기 위한 문자 인식 장치, 문자 인식 방법, 매체 처리 방법, 문자 인식 프로그램 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 관한 것이다.
금융기관 등에 있어서는 장표에 기재된 문자 정보를 이미지 데이터로서 판독하고 나서 문자 인식하는 장치로서, 광학 문자 판독 장치(OCR(Optical Character Recognition) 장치) 등의 이미지 판독 장치가 이용되고, 이 OCR 장치를 이용하는 것에 의해 업무의 효율화를 도모하고 있다.
종래의 OCR 기법에서는 장표의 이미지 데이터를 모노크롬의 2진 이미지로서 취득하여, 그 문자 인식을 행하고 있고, 예컨대, 녹색이나 적색 등의 미리 정해진 드롭아웃 색으로 괘선이나 가이드 문자 등을 인쇄한 장표에 관해서 그 문자 인식 대상 영역(문자 기입란)에 드롭아웃 색 이외의 색(흑색 등)으로 기재된 문자를 OCR 장치를 이용하여 모노크롬 2진 화상으로서 판독하여, 이 2진 화상에 기초로 하여 문자 인식 처리를 행하고 있다(하기 특허문헌 1∼3 참조).
[특허문헌 1]특허 공개 2000-322510호 공보
[특허문헌 2]특허 공개 2001-297303호 공보
[특허문헌 3]특허 공개 2003-196592호 공보
그런데, 장표에 기재된 정보를 보기 쉽게 하거나, 문자의 기입을 알기 쉽게 하기 위해 괘선이나 배경, 가이드 문자 등을 여러 가지의 색을 이용하여 인쇄한 컬러 장표가 사용되는 경우가 있다.
종래의 OCR 기법에 있어서는 장표의 이미지 데이터를 모노크롬의 2진 화상으로서 취득하여, 이 2진 화상에 기초로 하여 문자 인식을 행하고 있기 때문에 전술된 바와 같이 드롭아웃색 이외의 색으로 괘선이나 배경, 가이드 문자 등을 인쇄한 컬러 장표에 있어서는 기입된 문자의 근방에 이들 괘선이나 배경, 가이드 문자 등이 있거나, 또, 이들 괘선이나 배경, 가이드 문자에 기입된 문자가 접촉·교차하고 있거나 하면, 그 기입된 문자에 관한 문자 인식이 방해되어 문자 인식율이 저하한다고 하는 과제가 있다. 또, 문자 인식 대상 영역에 배경색이나 스크린 등의 면 도포가 행해지고 있는 경우에도 마찬가지로 그 문자 인식이 방지되어 문자 인식율이 저하한다.
즉, 종래의 OCR 기법에 있어서는 드롭아웃색 이외의 색을 이용하여 행해진 면 도포 내에 기재된 문자나, 마찬가지로 드롭아웃색 이외의 색을 이용한 괘선이나 배경, 가이드 문자 등의 근방 혹은 이들에 접촉·교차하는 문자에 관해서는 문자 인식을 고정밀도로 행할 수 없다. 또, 원래 OCR 장치에 의한 문자 인식을 전제로 하지 않고서 기입란에 여러 가지의 색으로 면 도포나 가이드 문자가 기입된 컬러 장표에 관해서 그 기입란에 기재된 문자 정보를 OCR 장치를 이용하여 판독할 수 있으면 편리성이 높다.
본 발명은 이러한 과제를 감안하여 창안된 것으로, 컬러 장표에 기재된 문자를 고정밀도로 인식할 수 있도록 한 문자 인식 장치, 문자 인식 방법, 매체 처리 방법, 문자 인식 프로그램 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체를 제공하는 것을 목적으로 한다.
이를 위해, 본 발명의 문자 인식 장치(청구항 1)는 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하여, 상기 문자 화상에 관한 문자를 인식하는 문자 인식 장치로서, 상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정부와, 상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와, 상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와, 상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서, 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와, 상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와, 상기 확대 화상 작성부에 의해서 작성된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와, 상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와, 상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에, 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와, 상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와, 상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부를 갖추는 것을 특징으로 한다.
또한, 본 발명의 문자 인식 방법(청구항 2)은 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하여, 상기 문자 화상에 관한 문자를 인식하는 문자 인식 방법으로서, 상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정 단계와, 상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정 단계와, 상기 원화상에 있어서 상기 문자 외선분 인정 단계에 있어서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성 단계와, 상기 제1 문자 외선분 제거 화상 작성 단계에 있어서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정 단계와, 상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성 단계와, 상기 확대 화상 작성 단계에 있어서 작성한 상기 확대 화상에 있어서 상기 문자 외선분 인정 단계에 있어서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성 단계와, 상기 문자 외선분 인정 단계에 있어서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정 단계에 있어서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단 단계와, 상기 간섭 판단 단계에 있어서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원 단계와, 상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정 단계와, 상기 제2 문자 영역 인정 단계에 있어서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식 단계를 갖추는 것을 특징으로 한다.
또한, 본 발명의 매체 처리 방법(청구항 3)은 문자가 기재된 매체로부터 판독한 매체 화상에 기초로 하여 문자 인식을 행하는 매체 처리 방법으로서, 상기 매체 화상에 기초로 하여 상기 매체 화상의 레이아웃의 특징을 추출하여 상기 레이아웃의 구성을 해석하는 레이아웃 해석 단계와, 상기 레이아웃 해석 단계에 있어서의 해석 결과에 기초로 하여 문자 인식을 행하는 대상이 되는 문자 화상을 갖춘 원화상을 작성하는 원화상 작성 단계와, 상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정 단계와, 상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정 단계와, 상기 원화상에 있어서 상기 문자 외선분 인정 단계에 있어서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성 단계와, 상기 제1 문자 외선분 제거 화상 작성 단계에 있어서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정 단계와, 상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성 단계와, 상기 확대 화상 작성 단계에 있어서 작성한 상기 확대 화상에 있어서 상기 문자 외선분 인정 단계에 있어서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성 단계와, 상기 문자 외선분 인정 단계에 있어서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정 단계에 있어서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단 단계와, 상기 간섭 판단 단계에 있어서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원 단계와, 상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정 단계와, 상기 제2 문자 영역 인정 단계에 있어서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식 단계를 갖추는 것을 특징으로 한다.
또한, 본 발명의 문자 인식 프로그램(청구항 4)은 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하여, 상기 문자 화상에 관한 문자를 인식하는 문자 인식 기능을 컴퓨터에 실행시키기 위한 문자 인식 프로그램으로서, 상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역를 인정하는 배경 인정부와, 상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와, 상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와, 상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와, 상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와, 상기 확대 화상 작성부에 의해서 작성된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와, 상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와, 상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와, 상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와, 상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부로서 상기 컴퓨터를 기능시키는 것을 특징으로 한다.
또한, 본 발명의 컴퓨터 판독 가능한 기록 매체(청구항 5)는 전술한 문자 인식 프로그램을 기록한 것이다.
본 발명에 따르면 컬러 장표에 기재된 문자를 고정밀도로 인식할 수 있는 이점이 있다.
이하, 도면을 참조하여 본 발명의 실시형태를 설명한다.
(A) 실시형태의 설명
도 1은 본 발명의 일 실시예로서 장표 인식 장치의 구성을 모식적으로 도시한 도면, 도 2(a), (b), (c), (d)는 각각 본 장표 인식 장치에 의해서 식별되는 장표를 설명하기 위한 도면이며, 도 2(a)는 장표를 부분적으로 도시한 도면, 도 2(b)는 그 문자 부분을 도시한 도면, 도 2(c)는 그 프리인쇄 부분을 도시한 도면, 도 2(d)는 그 배경 부분을 나타내는 도면이다.
본 장표 인식 장치(매체 처리 장치, 문자 인식 장치)(1)는, 예컨대 금융기관에서 이용되는 장표(매체)를 읽어내어, 그 소정의 항목에 기재된 문자를 인식하는 것으로, 특히, 괘선이나 배경, 가이드 문자 등으로 이루어지는 프리인쇄 부분을 기입되는 문자색이나 드롭아웃색 이외의 색으로 구성한 컬러 장표에 기재된 문자 인식을 행하는 것이다.
본 장표 인식 장치(1)에 있어서는 도 2(a)에 도시하는 컬러 장표에 관해서 그 색정보에 기초로 하여 배경(도 2(d) 참조)나 프리인쇄 부분(도 2(c) 참조)을 제거한 문자 부분(도 2(b) 참조)을 추출하여, 그 문자 인식을 행하게 되어 있다. 예컨대, 도 2(a)∼(d)에 도시하는 예에 있어서는 프리인쇄 부분을 적색으로 구성한 컬러 장표에 청색의 문자를 기입한 예를 나타내고 있으며, 이들 색정보(색상, 휘도)를 이용하여 인식 대상의 문자 화상을 추출하여, 그 문자 인식을 행하는 것이다. 이하, 본 실시형태에 있어서는 컬러 장표를 단순히 장표라 하는 경우도 있다.
본 장표 인식 장치(1)는 도 1에 도시한 바와 같이, 컬러 이미지 리더(2), 메모리(3), 하드디스크(4), 모니터(5), 키보드(6) 및 CPU(Central Processing Unit)(10)를 갖춘 컴퓨터 시스템(정보처리장치)으로서 구성되고, CPU(10)가 메모리(3)나 하드디스크(4)에 보존된 프로그램(문자 인식 프로그램, 매체 처리 프로그램)을 실행함으로써 기능하도록 되어 있다.
컬러 이미지 리더(2)는 컬러 장표에 관해서 그 이미지 데이터(매체 화상)를 읽어내는 것으로, 예컨대, 광학식 문자 판독 장치(OCR 장치)나 이미지 스캐너를 이용할 수 있다. 그리고, 본 장표 인식 장치(1)에 있어서는 컬러 이미지 리더(2)는 컬러 장표의 이미지 데이터를 컬러 화상 혹은 그레이 스케일 화상(다중값 화상)으로 판독하게 되어 있다.
하드디스크(4)는 컬러 이미지 리더(2)에 의해서 판독된 장표의 이미지 데이터를 보존하거나, 전술한 프로그램을 보존하거나 하는 것이다. 또, 이 하드디스크(4)는 사전 등록 데이터베이스(22)를 보존하도록 되어 있다.
사전 등록 데이터베이스(22)는 괘선 레이아웃 정보나 문자 인식의 정의 정보 등의 장표에 관한 정보를 미리 등록하여 구성되는 것이다(도 18 참조). 괘선 레이아웃 정보로서는 종선이나 횡선으로서 형성되는 괘선의 시점(개시 위치)나 종점(종료 위치)의 좌표 위치나, 날짜란이나 금액 기입란 등의 장표에 갖춰지는 항목(괘선 항목)의 구형 좌표 등이 이용된다. 또, 문자 인식의 정의 정보로서는 인식하는 구형 좌표나 식별 카테고리(예컨대, 숫자, 영자, 히라가나 등의 문자종별), 기입 프레임을 구성하는 괘선의 선류나 좌표 등이 이용된다.
메모리(3)는 CPU(10)가 여러 가지의 처리를 행할 때에, 데이터를 전개하거나일시적으로 저장하거나 하는 것이며, 또, 이 메모리(3)에 전술한 프로그램을 보존하더라도 좋다. 모니터(5)는 장표의 화상이나 문자 인식의 결과, 오퍼레이터가 이용하는 조작 화면 등을 표시하는 것이며, 키보드(6)는 오퍼레이터가 여러 가지의 조작·입력을 행하는 것이다.
CPU(10)는 여러 가지의 연산 처리를 행하는 것이며, 도 1에 도시한 바와 같이 레이아웃 해석부(11), 부분 화상 작성부(원화상 작성부)(12), 배경 인정부(13), 괘선 추출부(문자 외선분 인정부)(14), 제1 문자 영역 인정부(15), 확대 화상 작성부(16), 괘선 제거부(제1 문자 외선분 제거 화상 작성부, 제2 문자 외선분 제거 화상 작성부)(17), 간섭 판단부(18), 문자 화상 복원부(19), 제2 문자 영역 인정부(20), 문자 인식부(21)로서 기능하도록 되어 있다.
레이아웃 해석부(11)는 장표의 이미지 데이터(매체 화상)에 기초로 하여 그 이미지 데이터의 레이아웃의 특징을 추출하여, 장표의 레이아웃의 구성을 해석하는 것이며, 장표의 이미지 데이터에 기초로 하여 괘선 레이아웃 정보를 추출하여, 이 추출한 괘선 레이아웃 정보와 사전 등록 데이터베이스(22)에 등록되어 있는 괘선 레이아웃 정보를 대조하여 문자 인식의 정의 정보를 취득하도록 되어 있다. 또, 이 레이아웃 해석부(11)에 의한 처리는, 예컨대, 특허번호 제3 088019호(명칭: 매체 처리 장치 및 매체 처리 방법)에 개시된 기법에 의해서 실현할 수 있다.
부분 화상 작성부(원화상 작성부)(12)는 레이아웃 해석부(11)에 의한 해석 결과에 기초로 하여 문자 인식을 행하는 대상이 되는 문자 화상을 갖춘 부분 화상(원화상)을 작성하는 것이며, 레이아웃 해석부(11)에 의해서 취득된 문자 인식의 대상인 항목 등의 좌표에 기초로 하여 장표의 이미지 데이터로부터 문자 인식을 행하는 부분 화상(원화상)을 추출함으로써 이 부분 화상을 작성하도록 되어 있다.
배경 인정부(13)는 부분 화상 작성부(12)에 의해서 작성된 부분 화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 것이다.
여기서, 본 장표 인식 장치(1)의 배경 인정부(13)에 의한 배경색의 결정 기법을 도 3, 도 4(a), (b) 및 도 5(a), (b)를 참조하면서 도 6에 도시하는 흐름도(단계 A10∼A70)에 따라서 설명한다.
또, 도 3은 종축을 채도 S, 횡축을 명도 L로 했을 때의 적의 색의 채도 S와 명도 L과의 관계를 도시한 도면, 도 4(a), (b), 도 5(a), (b)는 각각 본 발명의 일 실시예로서 장표 인식 장치(1)의 배경 인정부(13)에 의해서 작성되는 막대 그래프의 예를 도시하는 도면으로, 도 4(a)는 배경용 색상 막대 그래프의 예를 도시하는 도면, 도 4(b)는 배경용 휘도 막대 그래프의 예를 도시하는 도면, 도 5(a)는 배경 이외용 색상 막대 그래프의 예를 도시하는 도면, 도 5(b)는 배경 이외용 휘도 막대 그래프의 예를 도시하는 도면이다. 또, 도 4(a), (b)는 배경이 백색인 경우의 예를 도시하고 있다.
배경 인정부(13)는 부분 화상 중 소정 사이즈의 영역(본 실시형태에서는 8화소 ×8화소의 구형 영역; 이하, 이 8 ×8화소의 구형 영역을 화소 블록이라 하는 경우도 있다)에 있어서, 이 8 ×8의 화소 블록의 각 화소의 R(Red), G(Green), B(Blue)의 각 색의 데이터(계조치)의 평균치(RAVE, GAVE, BAVE)를 산출하고, 각 화소의 R, G, B 데이터와, 8 ×8화소 영역의 R, G, B 데이터의 평균치(RAVE, GAVE, BAVE)와의 차분으로부터 8 ×8화소 영역의 색치 분산량을 산출하도록 되어 있다. 즉, 배경 인정부(13)는 8 ×8화소 블록내의 화소가 균일한지 여부를 조사하기 위해서 편차를 이용하고 있는 것이다.
그리고, 배경 인정부(13)는 이들 RAVE, GAVE, BAVE, R, G, B의 각 값을 이용하여 화소 블록에 있어서의 화소의 색치 분산량을 각각 하기의 식(1)을 이용하여 산출하고(단계 A10), 또, 이 색치 분산량이 작은지 여부, 즉, 미리 설정된 임계치(예컨대 10) 이하인지 여부를 판단하도록 되어 있다(단계 A20).
색치 분산량=max(AR, AG, AB)···(1)
단,
△R=│RAVE-R│
△G=│GAVE-G│
△B=│BAVE-B│
또, max()는 ()안의 각 수치의 최대치를 나타내는 것으로 한다.
또한, 배경 인정부(13)는 각 화소의 R, G, B치에 기초로 하여 하기 식(2)을 이용하여 HSV 변환을 행하여, 색상 H와 채도 S와 명도 L로 이루어지는 데이터로 변환하여 각 화소가 유채색인지 무채색인지를 판단하도록 되어 있다.
S=(V-X)/V···(2)
단,
V=max(R, G, B)
X=min(R, G, B)
이며, min()은 ()안의 각 수치의 최소치를 나타내는 것으로 한다.
또한, H는 이하의 식으로 나타내는 것으로 한다.
R=V의 경우, H=(pi/3)*(b-g)
G=V의 경우, H=(pi/3)*(2+r-b)
B=V의 경우, H=(pi/3)*(4+g-r)
L=(max(R, G, B)+ min(R, G, B))/2
단,
r=(V-R)/(V-X)
g=(V-G)/(V-X)
b=(V-B)/(V-X)
pi는 원주율이며,
H: 0∼360
S: 0∼1
V: 0∼1
L: 0∼1
R, G, B: 0∼1로 한다.
여기서, 색치 분산량이 작은(예컨대 10 이하) 경우에는(단계 A20의 YES 루트 참조), 그 화소가 배경을 구성하는 것이라고 판단하고, 색치 분산량이 큰(예컨대 10 보다도 크다) 경우에는(단계 A20의 NO 루트 참조), 그 화소가 배경 이외의 영역을 구성하는 것이라고 판단하도록 되어 있다.
또한, 배경 인정부(13)는 부분 화상에 관해서 배경을 구성한다고 판단한 화소와, 배경 이외의 영역이라고 판단한 화소에서 각각 별도의 막대 그래프를 작성하도록 되어 있고, 또, 이들 막대 그래프는 유채색과 무채색으로 각각 별도의 막대 그래프(색상 막대 그래프, 휘도 막대 그래프)로서 작성되도록 되어 있다(단계 A30, A40; 도 4(a), (b) 및 도 5(a), (b) 참조).
도 3에 있어서는 종축의 채도 S의 값이 클수록 선명한 색을 나타내고, 횡축의 명도 L의 값이 클수록 밝은 색을 나타낸다. 또, 2차 곡선(f1, f2)은 각각 시각 특성상의 유채색의 경계와 무채색의 경계를 도시하는 곡선이며, 2차 곡선(f1, f2)의 사이의 색은 유채색, 무채색의 어떤 것도 판정할 수 없는 부정색이 된다.
이들 2차 곡선(f1, f2)은 이하의 식(3), (4)과 같이 나타낼 수 있다.
f1=(1/4000)(255-LUM)2+10···(3)
f2=(1/2)(1/4000)(255-LUM)2+10···(4)
화소의 채도 S와 명도 L(LUM)이 결정되면 상기한 식(3)으로부터 각 명도에 있어서의 유채색이 되는 채도 S의 하한치를 계산할 수 있다. 따라서, 채도 S가 그 하한치 이상인지 여부에 의해 그 화소가 유채색인지 여부를 판정할 수 있다. 또한, 상기한 식(4)으로부터 각 명도에 있어서의 무채색의 상한치를 계산할 수 있다. 따라서, 채도 S가 상한치 이하인지 여부에 의해 그 화소가 무채색인지 여부를 판정할 수 있다. 이하, 전술과 같이 유채색, 무채색 및 부정색을 분류하는 것을 색상 클러스터 분류라 하는 경우가 있다.
또, 유채색의 하한치를 도시하는 2차 곡선(f1)의 값과, 무채색의 상한치를 도시하는 2차 곡선(f2)의 값을 각 명도 LUM에 관해서 미리 계산하여, 유채색의 판정 테이블과 무채색의 판정 테이블을 각각 작성하여, 이들 판정 테이블을 이용하여 판정하더라도 좋다.
배경 인정부(13)는 화소가 유채색인 경우에는 도 4(a), 도 5(a)에 도시한 바와 같이 그 화소의 색상 H를 색상 막대 그래프에 반영시키고, 화소가 무채색인 경우에는 도 4(b), 도 5(b)에 도시한 바와 같이 그 화소의 휘도를 휘도 막대 그래프에 반영시키도록 되어 있다. 즉, 유채색의 각 색상 H의 값의 출현 횟수를 계수하여 색상 막대 그래프(유채색의 색상 막대 그래프)를 작성하고, 또, 무채색의 각 휘도의 값의 출현 횟수를 계수하여 휘도 막대 그래프(무채색의 막대 그래프)를 작성하는 것이다.
그리고, 배경 인정부(13)는 8 ×8의 화소 블록을 구성하는 전화소에 관해서 상기 단계 A10∼A40에 관한 처리를 행하는 동시에, 부분 화상의 모든 화소 블록에 관해서 상기 단계 A10∼A40에 관한 처리를 행하는지 여부를 판단하고(단계 A50), 모든 화소 블록에 관해서 처리를 행하고 있지 않은 경우에는(단계 A50의 NO 루트 참조), 단계 A10으로 되돌아간다. 모든 화소에 관해서 처리를 행한 경우에는(단계 A50의 YES 루트 참조), 배경 인정부(13)는 배경용 막대 그래프(색상 막대 그래프, 휘도 막대 그래프)에 대하여 피크치 검출을 행하여, 출현 횟수가 피크치의 색상이나 휘도를 배경색이라 인정한다(단계 A60).
또, 도 4(a), (b)에 도시하는 예에 있어서는 휘도 막대 그래프에 있어서의 백색을 도시하는 휘도에 있어서 피크치가 검출된 상태를 나타내고 있고, 이에 따라, 배경이 백색인 것을 알 수 있다.
본 장표 인식 장치(1)에 있어서는 전술한 단계 A30, A40에 있어서 화소가 유채색인 경우에는 색상 막대 그래프를 형성하고, 무채색인 경우에는 휘도 막대 그래프를 형성함으로써 백색 등의 무채색의 화소에 관해서도 그 출현 빈도를 검출할 수 있고, 이에 따라, 배경색이 유채색이라도 무채색이라도 인정할 수 있는 것이다.
다음에, 배경 인정부(13)는 단계 A40에 있어서 작성한 배경 이외용 막대 그래프(도 5(a), (b) 참조)에 기초로 하여 그 부분 화소에 있어서의 배경 이외의 영역에 관해서 문자나 괘선의 식별에 색상을 이용한 기법(색상 분리; 상세한 것은 후술)을 적용할 수 있는지 여부를 판단한다(단계 A70). 구체적으로는, 배경 인정부(13)는 배경 이외용 막대 그래프에 기초로 하여 단계 A60에 있어서 배경으로서 인정한 색상치/휘도치 이외의 피크치(막대 그래프에 있어서의 산)를 탐색하여, 배경 이외에 색상 막대 그래프에 피크가 하나 이상이고, 또한, 색상 막대 그래프와 휘도 막대 그래프를 더불어 2 이상의 피크가 있는 경우에 색상 분리(색상 처리; 후술)를 행할 수 있다고 판단하며, 또, 이들 배경 이외용 막대 그래프에 있어서 피크의 수가 상기 조건을 만족하지 않는 경우에는 색상 분리는 불가능하며, 후술하는 휘도치에 기초하는 분리(그레이 처리)를 행할 필요가 있다고 판단한다.
괘선 추출부(문자 외선분 인정부)(14)는 부분 화상에 있어서의 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 문자 이외의 괘선(문자 외선분)을 인정하는 동시에, 괘선 정보(문자 외선분 정보)를 취득·추출하는 것이다.
이 괘선 추출부(14)는 부분 화상의 세로 방향과 가로 방향에 관해서 각각 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포를 구하여, 그 결과에 있어서 소정치 이상의 횟수를 갖는 위치를 괘선의 후보 위치(문자 외선분 후보 위치)라 인정하는 괘선 위치 추정부(문자 외선분 위치 추정부)(23)를 갖추고 있다.
또한, 괘선 추출부(14)는 이 괘선 위치 추정부(23)에 의해서 인정된 괘선의 후보 위치에 있어서의 색상 막대 그래프(색정보에 관한 횟수 분포)에 기초로 하여 그 괘선에 관한 색상(색정보)을 특정하는 색상 특정부(색정보 특정부)(24)를 갖추는 동시에, 이 색상 특정부(24)에 의해서 특정된 색상과 동일한 색상에 관한 화소의 연속성에 기초로 하여 괘선에 관한 괘선 정보를 취득하는 괘선 정보 취득부(문자 외선분 정보 취득부)(25)를 갖추고 있다.
본 장표 인식 장치(1)에 있어서의 괘선 추출부(14)에 의한 괘선 정보의 추출 기법을 도 7(a), (b), (c), 도 8, 도 9(a), (b)를 참조하면서 도 10에 도시하는 흐름도(단계 B10∼B110)에 따라서 설명한다. 또, 도 7(a), (b), (c)는 부분 화상의 세로 방향 및 가로 방향에서의 막대 그래프의 예를 도시하는 도면이며, 도 7(a)은 부분 화상의 예를 도시하는 도면, 도 7(b)은 가로 방향에서의 화소의 막대 그래프의 예를 도시하는 도면, 도 7(c)은 세로 방향에서의 화소의 막대 그래프의 예를 도시하는 도면이다. 또, 도 8 및 도 9(a), (b)는 각각 괘선(횡선분)의 작성 기법을 설명하기 위한 도면이며, 도 8은 선분 정보의 예를 도시하는 도면, 도 9(a), (b)는 도 8에 도시한 선분 정보에 기초로 하여 선정보를 작성하는 기법을 설명하기 위한 도면이다.
괘선 추출부(14)는 부분 화상 작성부(12)에 의해서 작성된 부분 화상(도 7(a) 참조)에 관해서 이 부분 화상에 있어서의 배경 이외의 영역에 관한 화소의 가로 방향의 막대 그래프(도 7(b) 참조)와, 세로 방향의 막대 그래프(도 7(c) 참조)를 작성한다(단계 B10).
그리고, 괘선 추출부(14)는 우선, 가로 방향의 막대 그래프(도 7(b) 참조)에 있어서 소정량 이상의 출현 횟수가 있는 위치(가로 위치)를 탐색하고(단계 B20), 이러한 소정량 이상의 출현 횟수가 있는 가로 위치가 검출되었는지 여부를 판단한다(단계 B30). 가로 방향의 막대 그래프에 있어서 이러한 위치가 검출된 경우에는(단계 B30의 YES 루트 참조), 괘선 위치 추정부(23)가 부분 화상에 있어서의 그 가로 위치에 괘선의 후보가 존재한다고 판단한다(문자 외선분 위치 추정 단계). 그리고, 괘선 추출부(14)는 부분 화상에 있어서의 그 가로 위치에서, 그 가로 위치에 위치하는 각 화소의 색상 막대 그래프를 작성하고, 색상 특정부(24)가 그 색상 막대 그래프에 있어서 가장 출현 빈도가 많은 색상치를 괘선의 색상으로서 결정한다(단계 B40; 색정보 특정 단계).
또한, 괘선 정보 취득부(25)가 단계 B40에 있어서 괘선 후보가 존재한다고 판단된 부분 화상에 있어서의 상기 가로 위치에 존재하는 각 화소에 관해서, 단계 B40에 있어서 결정된 색상치의 화소로서 소정수 이상 연속하는 화소(연속 화소)를 일정 범위마다 추출하여, 이들 연속 화소를 각각 횡선분(선분, 선분 정보)으로서 작성한다(단계 B50; 도 8 참조).
또, 도 8에 도시하는 예에 있어서는 괘선 추출부(14)는 연속 화소를 일정 범위(소정 길이)의 선분 정보로서 추출함으로써 복수의 선분을 취득하도록 되어 있고, 이와 같이, 소정 길이를 갖는 선분 정보를 복수 취득함으로써 경사도의 발생을 방지하여, 괘선의 위치 어긋남 등의 발생을 방지하여 판독 품질을 향상시킬 수 있다.
그리고, 괘선 추출부(14)는 단계 B50에 있어서 작성된 선분 정보(도 9(a) 참조)를 통합하여(연결하여), 하나의 괘선 정보를 작성하고(단계 B60, 도 9(b) 참조), 단계 B20으로 되돌아간다. 즉, 괘선 추출부(14)는 단계 B50에 있어서 작성된 횡선분에 기초로 하여 선정보를 작성하는 것이다(문자 외선분 정보 취득 단계).
또한, 가로 방향의 막대 그래프에 있어서 소정량 이상의 출현 빈도가 있는 가로 위치의 전부에 관한 처리가 완료하고, 괘선 정보의 작성 등이 미처리의 가로 위치가 검출되지 않는 경우에는(단계 B30의 NO 루트 참조), 이번엔 세로 방향의 막대 그래프(도 7(c) 참조)에 있어서 소정량 이상의 출현 횟수가 있는 위치(세로 위치)를 탐색하여(단계 B70), 이러한 소정량 이상의 출현 횟수가 있는 세로 위치가 검출되었는지 여부를 판단한다(단계 B80). 세로 방향의 막대 그래프에 있어서 이러한 위치가 검출된 경우에는(단계 B80의 YES 루트 참조), 괘선 위치 추정부(23)가 부분 화상에 있어서의 그 세로 위치에 괘선의 후보가 존재한다고 판단한다. 그리고, 괘선 추출부(14)는 부분 화상에 있어서의 그 세로 위치에서, 그 세로 위치에 위치하는 각 화소의 색상 막대 그래프를 작성하고, 색상 특정부(24)가 그 색상 막대 그래프에 있어서 가장 출현 빈도가 많은 색상치를 괘선의 색상으로서 결정한다(단계 B90).
또한, 괘선 정보 취득부(25)가 단계 B90에 있어서 괘선 후보가 존재한다고 판단된 부분 화상에 있어서의 상기 세로 위치에 존재하는 각 화소에 관해서 이번엔 단계 B90에 있어서 결정된 색상치의 화소로서 소정수 이상 연속하는 화소(연속 화소)를 일정 범위마다 추출하여, 이들 연속 화소를 각각 종선분(선분, 선분 정보)으로서 작성한다(단계 B100).
그리고, 괘선 추출부(14)는 단계 B100에 있어서 작성된 선분 정보를 통합하여(연결하여), 하나의 괘선 정보를 작성하고(단계 B110), 단계 B70으로 되돌아간다. 즉, 괘선 추출부(14)는 단계 B100에 있어서 작성된 횡선분에 기초로 하여 선정보를 작성하는 것이다.
한편, 세로 방향의 막대 그래프에 있어서 소정량 이상의 출현 빈도가 있는 세로 위치의 전부에 관한 처리가 완료하고, 괘선 정보의 작성 등이 미처리의 세로 위치가 검출되지 않는 경우에는(단계 B80의 NO 루트 참조), 처리를 종료한다.
괘선 제거부(제1 문자 외선분 제거 화상 작성부, 제2 문자 외선분 제거 화상 작성부)(17)는 부분 화상에 있어서 괘선 추출부(14)에 의해서 인정된 괘선을 배경과 동일한 색성분을 갖는 화소로 치환함으로써 제거하여, 제1 괘선 제거 화상(제1 문자 외선분 제거 화상)을 작성하는 것이다.
이 괘선 제거부(17)는 전술한 기법을 이용하여 부분 화상으로부터 괘선을 제거하여 제1 괘선 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부로서 기능하는 것 외, 후술하는 확대 화상 작성부(16)에 의해서 작성된 확대 화상에 있어서도 마찬가지로 그 확대 화상으로부터 괘선을 제거하여 제2 괘선 제거 화상(제2 문자 외선분 제거 화상)을 작성하는 제2 문자 외선분 제거 화상 작성부로서 기능하도록 되어 있다. 또, 이하 제1 괘선 제거 화상의 작성에 관한 괘선의 삭제를 일차 제거라고 하고, 제2 괘선 제거 화상의 작성에 관한 괘선의 삭제를 2차 제거라 하는 경우가 있다.
제1 문자 영역 인정부(15)는 괘선 제거부(17)에 의해서 작성된 제1 괘선 제거 화상에 있어서 그 배경 영역 이외의 영역으로서 서로 동일한 색상(색특성)을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 동시에, 그 색상을 문자의 색상으로서 인정하도록 되어 있다.
확대 화상 작성부(16)는 부분 화상에 기초로 하여 확대 화상을 작성하는 것이며, 본 장표 인식 장치(1)에 있어서는 확대 화상 작성부(16)는 부분 화상을 구성하는 화소의 서브픽셀화를 행하는 것에 의해 확대 화상을 작성하도록 되어 있다. 이 서브픽셀화란 부분 화상을 구성하는 각 화소를 각각 복수의 화소에 가상적으로 나누거나, 혹은 복수의 화소로 치환하는 처리를 말한다.
도 11(a), (b)는 본 장표 인식 장치(1)의 확대 화상 작성부(16)에 의한 확대 화상의 작성 기법의 예를 설명하기 위한 도면이며, 도 11(a)은 확대전의 화상의 상태를 도시한 도면, 도 11(b)은 확대 화상의 상태의 예를 도시하는 도면이다. 도 11(a)에 도시한 바와 같은 3 ×3화소의 화상(원래 화상)을 서브픽셀화에 의해 도 11(b)에 도시한 바와 같은 5 ×5화소의 화상(확대 화상)으로 확대하는 경우에는, 우선, 원래 화상을 구성하는 각 화소를 각각 인접하는 화소사이에 소정수(도 11(b)에 도시하는 예에서는 하나)의 화소를 배치할 수 있는 간격을 두어 배치(좌표 변환)함으로써 확대 화상에 카피한다.
그리고, 이 확대 화상을 구성하는 각 화소사이(간극)의 영역에 보완을 행한다. 구체적으로는, 이들 간극의 영역에 배치하는 화소에 그 간극을 형성하는 원래 화상의 화소의 평균치를 화소치(색상)로서 설정한다. 예컨대, 도 11(b)에 도시하는 예에 있어서는, 부호(1)를 붙인 화소에는 그 좌우 방향에서 인접하는 화소(화소 1-1, 1-2)의 평균치를 설정하고, 부호(2)를 붙인 화소에는 그 상하 방향에서 인접하는 화소(화소 1-1, 2-1)의 평균치를 설정한다. 또, 부호(3)를 붙인 화소에는 그 화소를 둘러싸는 화소(화소 1-1, 1-2, 2-1, 2-2)의 평균치를 설정한다. 즉, 확대 화상 작성부(16)는 이들 처리를 부분 화상을 구성하는 각 화소에 대하여 행하는 것에 의해 부분 화상의 확대 화상을 작성하는 것이다.
또, 확대 화상 작성부(16)에 의한 확대 화상의 작성 기법은 전술한 방법에 한정되는 것이 아니라, 본 발명의 취지를 일탈하지 않는 범위에서 여러 가지 변형하여 실시할 수 있다.
간섭 판단부(18)는 괘선 추출부(14)에 의해서 취득된 괘선 정보와, 제1 문자 영역 인정부(15)에 의해서 인정된 문자 영역에 기초로 하여 부분 화상에 있어서 문자와 괘선이 간섭(접촉 혹은 중합)하고 있는지 여부를 판단하는 것이다. 구체적으로는, 괘선 추출부(14)에 의해서 취득된 괘선 정보와, 제1 문자 영역 인정부(15)에 의해서 인정된 문자 영역을 비교하여 괘선과 문자가 간섭하고 있다고 생각되는 위치를 특정한 후에, 확대 화상 작성부(16)에 의해서 작성된 확대 화상에 있어서 괘선과 동일한 색상의 화소와 문자와 동일한 색상의 화소가 인접하고 있는 장소를 문자와 괘선이 간섭하고 있다고 판단하도록 되어 있다.
문자 화상 복원부(19)는 간섭 판단부(18)에 의해서 문자 화상과 괘선이 간섭하고 있다고 판단된 경우에, 제2 괘선 제거 화상에 있어서의 문자 화상과 괘선과의 간섭 위치에 관해서 문자 화상에 관한 색상과 괘선에 관한 색상과의 차이에 기초로 하여 문자 화상의 복원을 행하는 것이다.
본 장표 인식 장치(1)에 있어서는 문자 화상과 괘선이 간섭(중합)하고 있는 경우(도 12 참조)에 괘선 제거부(17)에 의해 확대 화상으로부터 괘선을 제거하면 그 제2 괘선 제거 화상에서는 문자 화상에 있어서 괘선과 중합하고 있던 부분(간섭 위치)의 문자 화상이 괘선과 함께 삭제되고, 부분적으로 누락한 문자 화상(도 13 참조)이 형성된다. 문자 화상 복원부(19)는 이와 같이 부분적으로 삭제된 문자 화상을 누락이 없는 상태로 복원하는 것이다.
구체적으로는, 문자 화상 복원부(19)는 우선 제2 괘선 제거 화상을 참조하거나 간섭 판단부(18)에 의한 판단 결과 등을 참조하기도 하고, 제2 괘선 제거 화상에 있어서 부분적으로 문자 화상이 삭제된 위치(문자와 괘선이 간섭하고 있던 위치; 이하, 누락 위치라 하는 경우도 있다)를 취득하고, 확대 문자 화상을 참조하여 그 누락 위치에 있어서의 문자와 괘선과의 색상의 차를 이용하여, 누락 위치에 있어서의 문자 윤곽을 복원하도록 되어 있다.
즉, 문자 화상 복원부(19)는 확대 화상에 있어서의 누락 위치에 해당하는 위치에 관해서 문자의 색상과 괘선의 색상이 다른 부분이 소정 화소 이상 연속하는 부분을 문자와 괘선과의 경계라고 인식하여, 그 위치를 확대 화상에 있어서의 누락 위치에 플롯함으로써 문자 윤곽을 설정하고, 또, 이 문자 윤곽을 스플라인 곡선으로 연결함으로써 문자 윤곽을 매끈하게 형성하도록 되어 있다.
그리고, 문자 화상 복원부(19)는 이와 같이 하여 형성한 문자 윤곽의 내측(문자 내부)을 제1 문자 영역 인정부(15)에 의해서 문자의 색상으로서 인정된 색상과 동일한 색상의 화소로 매립하는 것에 의해 문자 화상의 복원을 행하도록 되어 있다.
본 장표 인식 장치(1)에 있어서의 괘선 제거로부터 문자 화상의 복원에 이르기까지의 처리를 도 12∼도 15를 참조하면서 도 16에 도시하는 흐름도(단계 C10∼C60)에 따라서 설명한다. 또, 도 12∼도 15는 각각 그 괘선 제거의 과정에서의 문자 화상이 예를 도시하는 도면이다.
도 12에 도시한 바와 같이 괘선 제거부(17)는 괘선의 제거를 행하는 대상의 화상(부분 화상, 확대 화상)에 있어서, 괘선 추출부(14)에 의해서 인정된 괘선을 구성하는 각 화소를 괘선 정보 취득부(25)에 의해서 취득된 괘선 정보에 기초로 하여 배경과 동일한 색의 화소로 치환함으로써 괘선 영역을 배경색으로 매립하여 괘선을 삭제한다(단계 C10).
다음에 괘선 제거부(17)는 2차 제거인지 여부를 판단하여(단계 C20), 2차 제거가 아닌 경우에는(단계 C20의 NO 루트 참조), 처리를 종료한다. 또, 2차 제거인 경우에는(단계 C20의 YES 루트 참조), 간섭 판단부(18)가 괘선 추출부(14)에 의해서 취득된 괘선 정보와, 제1 문자 영역 인정부(15)에 의해서 인정된 문자 영역에 기초로 하여 부분 화상에 있어서 문자와 괘선이 간섭(접촉 혹은 중합)하고 있는지 여부를 판단한다(단계 C30).
그리고, 부분 화상에 있어서 문자와 괘선이 간섭(접촉 혹은 중합)하고 있는지 여부의 판단 결과에 기초로 하여(단계 C40), 문자와 괘선이 간섭하고 있는 경우에는(단계 C40의 YES 루트, 도 12 참조), 단계 C10에 있어서의 괘선의 삭제에 의해 부분적으로 누락한 문자 화상이 형성된다(도 13 참조). 문자 화상 복원부(19)는 문자 화상의 복원을 행하는 동시에(단계 C50, 도 14 참조), 그 문자 괘선과의 경계 부분(도 15(a) 참조)을 스플라인 곡선에 의해 보완함으로써 매끄러운 문자 화상을 작성한다(단계 C60, 도 15(b) 참조). 한편, 문자와 괘선이 간섭하지 않는 경우에는(단계 C40의 NO 루트 참조), 처리를 종료한다.
제2 문자 영역 인정부(20)는 제2 괘선 제거 화상에 있어서 배경 영역 이외의 영역으로서, 동일한 색상을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 것이며, 문자 인식부(21)는 제2 문자 영역 인정부(20)에 의해서 인정된 문자 영역에 관해서 문자 화상 복원부(19)에 의해서 복원된 문자 화상을 2진화하여 문자 인식을 행하는 것이며, 예컨대 공지의 OCR 기법에 의해서 실현되는 것이다.
전술한 바와 같이 구성된 본 발명의 일 실시예로서 장표 인식 장치(1)에 있어서의 문자 인식 처리를 도 17에 도시하는 흐름도(단계 D10∼D80)에 따라서 설명한다.
우선, 배경 인정부(13)가 색상 클러스터 분류 등을 이용하여 배경색을 구하고(단계 D10; 배경 인정 단계), 괘선 추출부(14)가 괘선 정보를 추출한다(단계 D20; 문자 외선분 인정 단계). 그리고, 괘선 제거부(17)가 부분 화상에 있어서 괘선을 제거(일차 제거)함으로써 제1 괘선 제거 화상을 작성하고(단계 D30; 제1 문자 외선분 제거 화상 작성 단계), 제1 문자 영역 인정부(15)가 괘선 제거부(17)에 의해서 작성된 제1 괘선 제거 화상에 있어서 문자 영역을 인정하는 동시에, 그 문자의 색상을 인정한다(단계 D40; 제1 문자 영역 인정 단계).
확대 화상 작성부(16)가 부분 화상에 기초로 하여 확대 화상을 작성하고(단계 D50; 확대 화상 작성 단계), 괘선 제거부(17)가 이 확대 화상에 있어서 괘선 제거(2차 제거)를 행하는 것에 의해 제2 괘선 제거 화상을 작성한다(단계 D60; 제2 문자 외선분 제거 화상 작성 단계). 또, 이 때, 간섭 판단부(18)에 의해 문자와 괘선이 간섭하고 있다고 판단된 경우에는(간섭 판단 단계) 문자 화상 복원부(19)가 2차 제거에 의해서 부분적으로 누락한 문자 화상의 복원을 행한다(문자 화상 복원 단계).
그 후, 제2 문자 영역 인정부(20)가 문자 영역의 인정(추출)을 행하고(단계 D70; 제2 문자 영역 인정 단계), 문자 인식부(21)가 이 제2 문자 영역 인정부(20)에 의해서 인정된 문자 영역에 관해서 문자 화상을 2진화하여 문자 인식을 행한다(단계 D80; 문자 인식 단계).
본 발명은 전술한 실시형태에 한정되는 것이 아니라, 본 발명의 취지를 일탈하지 않는 범위에서 여러 가지 변형하여 실시할 수 있다.
예컨대, 전술한 실시형태에 있어서는 컬러 장표의 이미지 데이터를 컬러 화상으로서 취득하고, 그 계조치(R, G, B)나, 색상, 휘도 등을 색성분이나 색정보로서 이용하여 배경이나 괘선, 문자 화상의 추출을 행하고 있지만, 이것에 한정되는 것이 아니라, 컬러 장표의 이미지 데이터를 그레이 스케일 데이터(단색의 다계조 화상)로서 취득하고, 그 휘도를 색정보로서 이용하여 배경이나 괘선, 문자 화상의 추출 등을 행하더라도 좋다.
이와 같이, 컬러 장표의 이미지 데이터를 그레이 스케일 데이터로서 취득하는 경우에는 색상 대신에 휘도(휘도 계조)를 색정보로서 이용하는 것에 의해 전술한 실시형태와 같은 작용 효과를 얻을 수 있다. 또, 도 6에 도시한 배경 인정부(13)에 의한 배경색의 결정 기법을 그레이 스케일 이미지에 기초로 하여 행하는 경우에는 배경용 막대 그래프의 휘도 막대 그래프만 작성한다.
여기서, 본 발명의 일 실시예로서 장표 인식 장치(1)에 있어서의 장표 인식에 관한 처리를 도 18에 도시하는 흐름도(단계 E10∼E80)에 따라서 설명한다. 본 예에 있어서는 컬러 장표의 이미지 데이터를 컬러 화상(컬러 이미지)으로 처리하는 경우와, 컬러 장표의 이미지 데이터를 그레이 스케일 화상(그레이 스케일 이미지)으로 처리하는 경우와의 두 가지의 기법내에서 한쪽을 선택하여 실시할 수 있다.
컬러 장표의 이미지 데이터를 컬러 화상(컬러 이미지)으로 처리하는 경우에는 장표 인식 장치(1)는, 우선, 컬러 이미지 리더(2)에 의해 컬러 장표의 컬러 화상을 취득하고(단계 E10), 이 취득한 컬러 화상(R, G, B)으로부터 그레이 스케일 화상(휘도)에의 변환을 행한다(단계 E20). 또, 컬러 화상의 R, G, B의 각 값으로부터 휘도 Y를 구하는 변환식에는, 예컨대 이하의 식을 이용할 수 있다.
Y(휘도)=R ×0.298912+G ×0.586611+B ×0.114478
그 후, 그레이 스케일 이미지(휘도)를 2진 이미지로의 변환을 행한다(단계 E30). 또, 그레이 스케일 이미지로부터 2진 이미지로의 변환(2진 이미지화)은 고정 슬라이스법 등의 기지의 기법을 이용하는 것에 의해 실현할 수 있다.
한편, 컬러 장표의 이미지 데이터를 그레이 스케일로 처리하는 경우에는 장표 인식 장치(1)는 컬러 이미지 리더(2)에 의해 컬러 장표의 그레이 스케일 화상을 취득하고(단계 E80), 단계 E30으로 이행한다.
그 후, 레이아웃 해석부(11)가 예컨대 특허 제3088019호에 개시된 기법을 이용하여 단계 E30에 있어서 작성된 2진화 이미지에 기초로 하여 괘선 레이아웃 정보의 추출을 행하는 동시에(단계 E40), 추출한 레이아웃 정보와 사전 등록 데이터베이스(22)에 미리 등록되어 있는 괘선 레이아웃 정보를 대조하여, 문자 인식의 정의정보를 취득한다(단계 E50; 레이아웃 해석 단계).
그리고, 부분 화상 작성부(12)가 단계 E50에 있어서 취득한 정의 정보에 기초로 하여 장표의 이미지 데이터(원화; 컬러이미지 혹은 그레이 스케일 이미지)위의 좌표를 구하여, 문자 인식을 행하는 부분 화상(부분이미지)을 작성한다(단계 E60; 원화상 작성 단계). 그 후, 이 작성된 부분 화상에 관해서 배경 인정부(13), 괘선 추출부(14), 제1 문자 영역 인정부(15), 확대 화상 작성부(16), 괘선 제거부(17), 간섭 판단부(18), 문자 화상 복원부(19), 제2 문자 영역 인정부(20) 및 문자 인식부(21)에 의한 문자 인식 처리(도 17 참조)를 행한다(단계 E70).
전술한 바와 같이, 본 발명의 일 실시예로서 장표 인식 장치(1)에 따르면 컬러 장표의 이미지 데이터를 컬러 화상으로서 취득하고, 그 계조치(R, G, B)나, 색상, 휘도 등을 색성분이나 색정보로서 이용하여 배경이나 괘선, 문자 화상의 추출을 행하는 것에 의해 문자 인식의 저해 요건이 될 수 있는 괘선, 배경, 가이드 문자 등을 제거하고, 노이즈가 없는 문자 인식 이미지를 추출하여, OCR 인식을 가능한 장표 종류를 확대하는 동시에, 문자 인식 정밀도를 향상시킬 수 있다.
또한, 배경 인정부(13)가 부분 화상에 있어서의 색상의 분산량이나 출현 빈도(색상 막대 그래프)에 기초로 하여 배경 화소를 용이하고 또한 고속으로 검출할 수 있으며, 또, 괘선 추출부(14)(괘선 위치 추정부(23))가 부분 화상의 세로 방향과 가로 방향에 관해서 각각 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포를 구하고, 그 결과에 있어서 소정치 이상의 횟수를 갖는 위치를 괘선의 후보 위치라 인정함으로써 괘선의 위치를 용이하고 또한 고속으로 인정할 수 있다.
또한, 괘선 추출부(14)(색상 특정부(24))가 괘선 위치 추정부(23)에 의해서 인정된 괘선의 후보 위치에 있어서의 색상 막대 그래프에 기초로 하여 그 괘선에 관한 색상을 특정하는 것에 의해 괘선의 색상을 용이하고 또한 고속으로 특정할 수 있다.
또한, 괘선 추출부(14)(괘선 정보 취득부(25))가 색상 특정부(24)에 의해서 특정된 색상과 동일한 색상에 이러한 화소의 연속성에 기초로 하여 괘선에 관한 괘선 정보를 취득함으로써 괘선(괘선 정보)을 용이하고 또한 확실하게 특정할 수 있다.
제1 문자 영역 인정부(15)가 괘선 제거부(17)에 의해서 작성된 제1 괘선 제거 화상에 있어서 문자 영역이나 그 색상(휘도)을 용이하고 또한 고속으로 인정할 수 있다.
확대 화상 작성부(16)가 서브픽셀화 기법에 의해 부분 화상에 기초로 하여 확대 화상을 작성하고, 이 확대 화상에 기초로 하여 괘선 제거나 문자 화상의 복원을 행하기 때문에 문자 화상과 괘선이 간섭(중합)하고 있는 경우에 있어서도 고정밀도인 문자 화상을 추출할 수 있고, 문자의 인식 정밀도를 향상시킬 수 있다.
(B) 기타
본 장표 인식 장치(1)에 있어서는 정보 처리 장치(컴퓨터)의 CPU(Central Processing Unit)가 문자 인식 프로그램(매체 처리 프로그램)을 실행함으로써 전술한 레이아웃 해석부(11), 부분 화상 작성부(원화상 작성부)(12), 배경 인정부(13), 괘선 추출부(문자 외선분 인정부)(14), 제1 문자 영역 인정부(15), 확대 화상 작성부(16), 괘선 제거부(제1 문자 외선분 제거 화상 작성부, 제2 문자 외선분 제거 화상 작성부)(17), 간섭 판단부(18), 문자 화상 복원부(19), 제2 문자 영역 인정부(20), 문자 인식부(21)로서 기능하도록 되어 있다.
또, 이들 레이아웃 해석부(11), 부분 화상 작성부(원화상 작성부)(12), 배경 인정부(13), 괘선 추출부(문자 외선분 인정부)(14), 제1 문자 영역 인정부(15), 확대 화상 작성부(16), 괘선 제거부(제1 문자 외선분 제거 화상 작성부, 제2 문자 외선분 제거 화상 작성부)(17), 간섭 판단부(18), 문자 화상 복원부(19), 제2 문자 영역 인정부(20), 문자 인식부(21)로서의 기능을 실현하기 위한 프로그램(문자 인식 프로그램, 매체 처리 프로그램)은, 예컨대 플렉시블 디스크, CD-ROM, CD-R, CD-R/W, DVD, DVD-R, DVD-R/W, 자기디스크, 광디스크, 광자기디스크 등의 컴퓨터 판독 가능한 기록 매체에 기록된 형태로 제공된다. 그리고, 컴퓨터는 그 기록 매체로부터 프로그램을 읽어내어 내부 기억 장치 또는 외부 기억 장치에 전송하여 저장하여 이용한다. 또, 그 프로그램을 예컨대 자기디스크, 광디스크, 광자기디스크 등의 기억 장치(기록 매체)에 기록해 두고, 그 기억 장치로부터 통신 경로를 통해 컴퓨터에 제공하도록 하더라도 좋다.
레이아웃 해석부(11), 부분 화상 작성부(원화상 작성부)(12), 배경 인정부(13), 괘선 추출부(문자 외선분 인정부)(14), 제1 문자 영역 인정부(15), 확대 화상 작성부(16), 괘선 제거부(제1 문자 외선분 제거 화상 작성부, 제2 문자 외선분 제거 화상 작성부)(17), 간섭 판단부(18), 문자 화상 복원부(19), 제2 문자 영역 인정부(20), 문자 인식부(21)로서의 기능을 실현할 때는 내부 기억 장치(본 실시형태에서는 컴퓨터의 RAM이나 ROM, 하드디스크 등)에 저장된 프로그램이 컴퓨터의 마이크로프로세서(본 실시형태에서는 CPU(10))에 의해서 실행된다. 이 때, 기록 매체에 기록된 프로그램을 컴퓨터가 판독하여 실행하도록 하더라도 좋다.
또, 본 실시형태에 있어서 컴퓨터란 하드웨어와 오퍼레이팅 시스템을 포함하는 개념이며, 오퍼레이팅 시스템의 제어하에서 동작하는 하드웨어를 의미하고 있다. 또, 오퍼레이팅 시스템이 불필요하고 어플리케이션 프로그램 단독으로 하드웨어를 동작시키는 경우에는 그 하드웨어 자체가 컴퓨터에 해당한다. 하드웨어는 적어도 CPU 등의 마이크로프로세서와, 기록 매체에 기록된 컴퓨터 프로그램을 읽어내기 위한 수단을 갖추고 있고, 본 실시형태에 있어서는 장표 인식 장치(1)가 컴퓨터로서의 기능을 갖고 있는 것이다.
또한, 본 실시형태에 있어서의 기록 매체로서는 전술한 플렉시블 디스크, CD-ROM, CD-R, CD-R/W, DVD, DVD-R, DVD-R/W, 자기디스크, 광디스크, 광자기 디스크 외에, IC카드, ROM 카트리지, 자기테이프, 펀치 카드, 컴퓨터의 내부 기억 장치(RAM이나 ROM 등의 메모리), 외부 기억 장치 등이나, 바코드 등의 부호가 인쇄된 인쇄물 등의 컴퓨터 판독 가능한 여러 가지의 매체를 이용할 수 있다.
도 19는 본 발명의 일 실시예로서 장표 인식 장치(1)에 있어서의 색상 클러스터 분류 기법을 설명하기 위한 도면이며, 도 2(a)에 도시한 장표의 부분 화상에 관한 색상 막대 그래프의 예를 도시하는 도면이다.
도 2(a)에 도시하는 화상의 동일한 색상 성분의 색상 막대 그래프를 작성하면 도 19에 도시한 바와 같이 입력된 문자(도 2(b) 참조)의 청색 화소의 색상 막대 그래프(도 19의 부호(i)참조)와, 프리인쇄 부분(도 2(c) 참조)의 적색 화소의 색상 막대 그래프(도 19의 부호(ii) 참조)를 작성할 수 있다. 또, 도 19의 횡축은 색상치, 종축은 색상치의 출현 횟수를 나타내고 있다.
본 장표 인식 장치(1)에 있어서는 컬러 장표의 이미지 데이터를 컬러 화상으로 처리하는 경우에 이러한 색상 클러스터 분류를 행하는 것에 의해 배경 부분이나 문자 부분, 프리인쇄 부분의 판정(색상 분리, 색상 처리)을 가능하게 하고 있다.
또, 여러 종류의 색으로 인쇄된 장표 등의 원고를 스캐너로 판독한 경우, 판독한 화상은 도 19에 도시한 바와 같이 인쇄된 잉크의 농담의 얼룩 등에 의해 색상치가 약간 다른 화소 데이터가 생성되고, 출현 횟수의 피크치의 근방에 복수의 피크치가 검출된다. 그래서, 본 실시형태에 있어서는 동일 색상의 일정한 색상치의 폭 중에 존재하는 피크치를 하나로 통합하고 있다. 그 때, 색상치의 폭(도 19의 막대 그래프의 횡축)이 색상에 의해 다르기 때문에 피크치의 통합의 기준이 되는 폭을 색상에 의해 개별로 정한 통합 판정 테이블을 작성하고, 그 통합 판정 테이블을 참조하여 피크치를 통합하더라도 좋다.
또한, 도 20은 본 발명의 일 실시예로서 장표 인식 장치(1)에서의 휘도 클러스터 분류 기법을 설명하기 위한 도면이며, 도 2(a)에 도시한 장표의 부분 화상에 관한 휘도 막대 그래프의 예를 도시하는 도면이다.
도 2(a)에 도시하는 화상의 동일한 휘도 성분의 휘도 막대 그래프를 작성하면 도 20에 도시한 바와 같이 입력된 문자(도 2(b) 참조)의 휘도에 관한 휘도 막대 그래프(도 20의 부호(i) 참조)와, 프리인쇄 부분(도 2(c) 참조)의 휘도의 휘도 막대 그래프(도 20의 부호(ii) 참조) 및: 배경 부분(도 2(d) 참조)의 휘도의 휘도 막대 그래프(도 20의 부호(iii) 참조)를 작성할 수 있다. 또, 도 20의 횡축은 휘도치, 종축은 휘도치의 출현 횟수를 나타내고 있다.
본 장표 인식 장치(1)에 있어서는 컬러 장표의 이미지 데이터를 그레이 스케일 화상으로 처리하는 경우에 이러한 휘도 클러스터 분류를 행하는 것에 의해 배경 부분이나 문자 부분, 프리인쇄 부분의 판정(그레이 처리)을 가능하게 하고 있다.
또, 본 발명의 각 실시형태가 개시되어 있으면, 본 발명을 당업자에 의해서 실시·제조하는 것이 가능하다.
(C) 부기
(부기 1) 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하고, 상기 문자 화상에 관한 문자를 인식하는 문자 인식 장치로서,
상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정부와,
상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와,
상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와,
상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와,
상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와,
상기 확대 화상 작성부에 의해서 작성된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와,
상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와,
상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와,
상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와,
상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부를 갖추는 것을 특징으로 하는 문자 인식 장치.
(부기 2) 상기 문자 외선분 인정부가,
상기 원화상의 세로 방향과 가로 방향에 관해서 각각 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포를 구하고, 그 결과에 있어서 소정치 이상의 횟수를 갖는 위치를 문자 외선분 후보 위치라 인정하는 문자 외선분 위치 추정부와,
상기 문자 외선분 위치 추정부에 의해서 인정된 문자 외선분 후보 위치에 있어서의 색정보에 관한 횟수 분포에 기초로 하여 상기 문자 외선분에 관한 색정보를 특정하는 색정보 특정부와,
상기 색정보 특정부에 의해서 특정된 상기 색정보와 동일한 색정보에 관한 화소의 연속성에 기초로 하여 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 정보 취득부를 갖추는 것을 특징으로 하는 부기 1에 기재한 문자 인식 장치.
(부기 3) 상기 문자 화상 복원부가,
상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보의 차이에 기초로 하여 상기 문자 화상에 있어서의 문자 윤곽을 스플라인 곡선으로 형성하는 동시에,
상기 문자 윤곽에 의해서 둘러싸이는 영역을 상기 문자 화상에 관한 색정보와 동일한 색정보를 갖는 화소로 매립하는 것을 특징으로 하는 부기 1또는 부기 2에 기재한 문자 인식 장치.
(부기 4) 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하고, 상기 문자 화상에 관한 문자를 인식하는 문자 인식 방법으로서,
상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정 단계와,
상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정 단계와,
상기 원화상에 있어서 상기 문자 외선분 인정 단계에 있어서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성 단계와,
상기 제1 문자 외선분 제거 화상 작성 단계에 있어서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정 단계와, 상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성 단계와,
상기 확대 화상 작성 단계에 있어서 작성한 상기 확대 화상에 있어서 상기 문자 외선분 인정 단계에 있어서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성 단계와,
상기 문자 외선분 인정 단계에 있어서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정 단계에 있어서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단 단계와,
상기 간섭 판단 단계에 있어서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원 단계와,
상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정 단계와,
상기 제2 문자 영역 인정 단계에 있어서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식 단계를 갖추는 것을 특징으로 하는 문자 인식 방법.
(부기 5) 상기 문자 외선분 인정 단계가,
상기 원화상의 세로 방향과 가로 방향에 관해서 각각 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포를 구하고, 그 결과에 있어서 소정치 이상의 횟수를 갖는 위치를 문자 외선분 후보 위치라 인정하는 문자 외선분 위치 추정 단계와,
상기 문자 외선분 위치 추정 단계에 있어서 인정된 문자 외선분 후보 위치에 있어서의 색정보에 관한 횟수 분포에 기초로 하여 상기 문자 외선분에 관한 색정보를 특정하는 색정보 특정 단계와,
상기 색정보 특정 단계에 있어서 특정된 상기 색정보와 동일한 색정보에 관한 화소의 연속성에 기초로 하여 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 정보 취득 단계를 갖추는 것을 특징으로 하는 부기 4에 기재한 문자 인식 방법.
(부기 6) 상기 문자 화상 복원 단계에 있어서,
상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상에 있어서의 문자 윤곽을 스플라인 곡선으로 형성하는 동시에,
상기 문자 윤곽에 의해서 둘러싸이는 영역을 상기 문자 화상에 관한 색정보와 동일한 색정보를 갖는 화소로 매립하는 것을 특징으로 하는 부기 4 또는 부기 5에 기재한 문자 인식 방법.
(부기 7) 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하고, 상기 문자 화상에 관한 문자를 인식하는 문자 인식 기능을 컴퓨터에 실행시키기 위한 문자 인식 프로그램으로서,
상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정부와,
상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와,
상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와,
상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와,
상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와,
상기 확대 화상 작성부에 의해서 작성된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와,
상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와,
상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와,
상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와,
상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부로서 상기 컴퓨터를 기능시키는 것을 특징으로 하는 문자 인식 프로그램.
(부기 8) 상기 문자 외선분 인정부로서 상기 컴퓨터를 기능시킬 때에,
상기 원화상의 세로 방향과 가로 방향에 관해서 각각 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포를 구하고, 그 결과에 있어서 소정치 이상의 횟수를 갖는 위치를 문자 외선분 후보 위치라 인정하는 문자 외선분 위치 추정부와,
상기 문자 외선분 위치 추정부에 의해서 인정된 문자 외선분 후보 위치에 있어서의 색정보에 관한 횟수 분포에 기초로 하여 상기 문자 외선분에 관한 색정보를 특정하는 색정보 특정부와,
상기 색정보 특정부에 의해서 특정된 상기 색정보와 동일한 색정보에 관한 화소의 연속성에 기초로 하여 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 정보 취득부로서 상기 컴퓨터를 기능시키는 것을 특징으로 하는 부기 7에 기재한 문자 인식 프로그램.
(부기 9) 상기 문자 화상 복원부로서 상기 컴퓨터를 기능시킬 때에,
상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상에 있어서의 문자 윤곽을 스플라인 곡선으로 형성하는 동시에,
상기 문자 윤곽에 의해서 둘러싸이는 영역을 상기 문자 화상에 관한 색정보와 동일한 색정보를 갖는 화소로 매립하도록 상기 컴퓨터를 기능시키는 것을 특징으로 하는 부기 7 또는 부기 8에 기재한 문자 인식 프로그램.
(부기 10) 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하여, 상기 문자 화상에 관한 문자를 인식하는 문자 인식 기능을 컴퓨터에 실행시키기 위한 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체로서,
상기 문자 인식 프로그램이,
상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정부와,
상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와,
상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와,
상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와,
상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와,
상기 확대 화상 작성부에 의해서 작성된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와,
상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와,
상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에, 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와,
상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와,
상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부로서 상기 컴퓨터를 기능시키는 것을 특징으로 하는 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
(부기 11) 상기 문자 인식 프로그램이 상기 문자 외선분 인정부로서 상기 컴퓨터를 기능시킬 때에,
상기 원화상의 세로 방향과 가로 방향에 관해서 각각 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포를 구하고, 그 결과에 있어서 소정치 이상의 횟수를 갖는 위치를 문자 외선분 후보 위치라 인정하는 문자 외선분 위치 추정부와,
상기 문자 외선분 위치 추정부에 의해서 인정된 문자 외선분 후보 위치에 있어서의 색정보에 관한 횟수 분포에 기초로 하여 상기 문자 외선분에 관한 색정보를 특정하다 색정보 특정부와,
상기 색정보 특정부에 의해서 특정된 상기 색정보와 동일한 색정보에 관한 화소의 연속성에 기초로 하여 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 정보 취득부로서 상기 컴퓨터를 기능시키는 것을 특징으로 하는 부기 10에 기재한 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
(부기 12) 문자가 기재된 매체로부터 판독한 매체 화상에 기초로 하여 문자 인식을 행하는 매체 처리 장치로서,
상기 매체 화상에 기초로 하여 상기 매체 화상의 레이아웃의 특징을 추출하여 상기 레이아웃의 구성을 해석하는 레이아웃 해석부와,
상기 레이아웃 해석부에 의한 해석 결과에 기초로 하여 문자 인식을 행하는 대상이 되는 문자 화상을 갖춘 원화상을 작성하는 원화상 작성부와,
상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정부와,
상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와,
상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와,
상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와,
상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와,
상기 확대 화상 작성부에 의해서 작성·된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와,
상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와,
상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에, 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와,
상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와,
상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부를 갖추는 것을 특징으로 하는 매체 처리 장치.
(부기 13) 상기 문자 외선분 인정부가,
상기 원화상의 세로 방향과 가로 방향에 관해서 각각 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포를 구하고, 그 결과에 있어서 소정치 이상의 횟수를 갖는 위치를 문자 외선분 후보 위치라 인정하는 문자 외선분 위치 추정부와,
상기 문자 외선분 위치 추정부에 의해서 인정된 문자 외선분 후보 위치에 있어서의 색정보에 관한 횟수 분포에 기초로 하여 상기 문자 외선분에 관한 색정보를 특정하는 색정보 특정부와,
상기 색정보 특정부에 의해서 특정된 상기 색정보와 동일한 색정보에 관한 화소의 연속성에 기초로 하여 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 정보 취득부를 갖추는 것을 특징으로 하는 부기 12에 기재한 매체 처리 장치.
(부기 14) 문자가 기재된 매체로부터 판독한 매체 화상에 기초로 하여 문자 인식을 행하는 매체 처리 방법으로서,
상기 매체 화상에 기초로 하여 상기 매체 화상의 레이아웃의 특징을 추출하여 상기 레이아웃의 구성을 해석하는 레이아웃 해석 단계와,
상기 레이아웃 해석 단계에 있어서의 해석 결과에 기초로 하여 문자 인식을 행하는 대상이 되는 문자 화상을 갖춘 원화상을 작성하는 원화상 작성 단계와,
상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정 단계와,
상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정 단계와,
상기 원화상에 있어서 상기 문자 외선분 인정 단계에 있어서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성 단계와,
상기 제1 문자 외선분 제거 화상 작성 단계에 있어서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정 단계와,
상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성 단계와,
상기 확대 화상 작성 단계에 있어서 작성한 상기 확대 화상에 있어서 상기 문자 외선분 인정 단계에 있어서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성 단계와,
상기 문자 외선분 인정 단계에 있어서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정 단계에 있어서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단 단계와,
상기 간섭 판단 단계에 있어서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에, 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원 단계와,
상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정 단계와,
상기 제2 문자 영역 인정 단계에 있어서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식 단계를 갖추는 것을 특징으로 하는 매체 처리 방법.
(부기 15) 상기 문자 외선분 인정 단계가,
상기 원화상의 세로 방향과 가로 방향에 관해서 각각 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포를 구하고, 그 결과에 있어서 소정치 이상의 횟수를 갖는 위치를 문자 외선분 후보 위치라 인정하는 문자 외선분 위치 추정 단계와,
상기 문자 외선분 위치 추정 단계에 있어서 인정된 문자 외선분 후보 위치에 있어서의 색정보에 관한 횟수 분포에 기초로 하여 상기 문자 외선분에 관한 색정보를 특정하는 색정보 특정 단계와,
상기 색정보 특정 단계에 있어서 특정된 상기 색정보와 동일한 색정보에 관한 화소의 연속성에 기초로 하여 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 정보 취득 단계를 갖추는 것을 특징으로 하는 부기 14에 기재한 매체 처리 방법.
(부기 16) 문자가 기재된 매체로부터 판독한 매체 화상에 기초로 하여 문자 인식을 행하는 매체 처리 기능을 컴퓨터에 실행시키기 위한 매체 처리 프로그램으로서,
상기 매체 화상에 기초로 하여 상기 매체 화상의 레이아웃의 특징을 추출하여 상기 레이아웃의 구성을 해석하는 레이아웃 해석부와,
상기 레이아웃 해석부에 의한 해석 결과에 기초로 하여 문자 인식을 행하는 대상이 되는 문자 화상을 갖춘 원화상을 작성하는 원화상 작성부와,
상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정부와,
상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와,
상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와,
상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와,
상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와,
상기 확대 화상 작성부에 의해서 작성된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와,
상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와,
상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에, 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와,
상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와,
상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부로서 상기 컴퓨터를 기능시키는 것을 특징으로 하는 매체 처리 프로그램.
(부기 17) 상기 문자 외선분 인정부로서 상기 컴퓨터를 기능시킬 때에,
상기 원화상의 세로 방향과 가로 방향에 관해서 각각 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포를 구하고, 그 결과에 있어서 소정치 이상의 횟수를 갖는 위치를 문자 외선분 후보 위치라 인정하는 문자 외선분 위치 추정부와,
상기 문자 외선분 위치 추정부에 의해서 인정된 문자 외선분 후보 위치에 있어서의 색정보에 관한 횟수 분포에 기초로 하여 상기 문자 외선분에 관한 색정보를 특정하는 색정보 특정부와,
상기 색정보 특정부에 의해서 특정된 상기 색정보와 동일한 색정보에 관한 화소의 연속성에 기초로 하여 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 정보 취득부로서 상기 컴퓨터를 기능시키는 것을 특징으로 하는 부기 16에 기재한 매체 처리 프로그램.
(부기 18) 문자가 기재된 매체로부터 판독한 매체 화상에 기초로 하여 문자 인식을 행하는 매체 처리 기능을 컴퓨터에 실행시키기 위한 매체 처리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체로서,
상기 매체 처리 프로그램이,
상기 매체 화상에 기초로 하여 상기 매체 화상의 레이아웃의 특징을 추출하여 상기 레이아웃의 구성을 해석하는 레이아웃 해석부와,
상기 레이아웃 해석부에 의한 해석 결과에 기초로 하여 문자 인식을 행하는 대상이 되는 문자 화상을 갖춘 원화상을 작성하는 원화상 작성부와,
상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정부와,
상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와,
상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와,
상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와,
상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와,
상기 확대 화상 작성부에 의해서 작성된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와,
상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와,
상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에, 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 이러한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와,
상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와,
상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부로서 상기 컴퓨터를 기능시키는 것을 특징으로 하는 매체 처리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
(부기 19) 상기 매체 처리 프로그램이 상기 문자 외선분 인정부로서 상기 컴퓨터를 기능시킬 때에,
상기 원화상의 세로 방향과 가로 방향에 관해서 각각 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포를 구하고, 그 결과에 있어서 소정치 이상의 횟수를 갖는 위치를 문자 외선분 후보 위치라 인정하는 문자 외선분 위치 추정부와,
상기 문자 외선분 위치 추정부에 의해서 인정된 문자 외선분 후보 위치에 있어서의 색정보에 관한 횟수 분포에 기초로 하여 상기 문자 외선분에 관한 색정보를 특정하는 색정보 특정부와,
상기 색정보 특정부에 의해서 특정된 상기 색정보와 동일한 색정보에 관한 화소의 연속성에 기초로 하여 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 정보 취득부로서 상기 컴퓨터를 기능시키는 것을 특징으로 하는 부기 18에 기재한 매체 처리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
(부기 20) 상기 매체 처리 프로그램이 상기 문자 화상 복원부로서 상기 컴퓨터를 기능시킬 때에,
상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상에 있어서의 문자 윤곽을 스플라인 곡선으로 형성하는 동시에,
상기 문자 윤곽에 의해서 둘러싸이는 영역을 상기 문자 화상에 관한 색정보와 동일한 색정보를 갖는 화소로 매립하도록 상기 컴퓨터를 기능시키는 것을 특징으로 하는 부기 18 또는 부기 19에 기재한 매체 처리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
복수색을 이용하여 작성된 컬러 원고에 기재된 문자 정보의 인식에도 적용할 수 있다.
도 1은 본 발명의 일 실시예로서 장표 인식 장치의 구성을 모식적으로 도시하는 도면이다.
도 2의 (a), (b), (c), (d)는 각각 본 장표 인식 장치에 의해서 식별되는 장표를 설명하기 위한 도면이다.
도 3은 적색의 채도 S와 명도 L과의 관계를 도시하는 도면이다.
도 4의 (a), (b)는 각각 본 발명의 일 실시예로서 장표 인식 장치의 배경 인정부(13)에 의해서 작성되는 배경용 막대 그래프의 예를 도시하는 도면이다.
도 5의 (a), (b)는 각각 본 발명의 일 실시예로서 장표 인식 장치의 배경 인정부(13)에 의해서 작성되는 배경 이외용 막대 그래프의 예를 도시하는 도면이다.
도 6은 본 발명의 일 실시예로서 장표 인식 장치의 배경 인정부에 의한 배경색의 결정 기법을 설명하기 위한 흐름도이다.
도 7의 (a), (b), (c)는 부분 화상의 세로 방향 및 가로 방향에서의 히스토그램의 예를 도시하는 도면이다.
도 8은 본 발명의 일 실시예로서 장표 인식 장치에 있어서의 괘선(횡선분)의 작성 기법을 설명하기 위한 도면이다.
도 9의 (a), (b)는 각각 본 발명의 일 실시예로서 장표 인식 장치에 있어서의 괘선(횡선분)의 작성 기법을 설명하기 위한 도면이다.
도 10은 본 발명의 일 실시예로서 장표 인식 장치에 있어서의 괘선 추출부에 의한 괘선 정보의 추출 기법을 설명하기 위한 흐름도이다.
도 11의 (a), (b)는 본 발명의 일 실시예로서 장표 인식 장치의 확대 화상 작성부에 의한 확대 화상의 작성 기법의 예를 설명하기 위한 도면이다.
도 12는 본 발명의 일 실시예로서 장표 인식 장치의 괘선 제거의 과정에서의 문자 화상의 예를 도시하는 도면이다.
도 13은 본 발명의 일 실시예로서 장표 인식 장치의 괘선 제거의 과정에서의 문자 화상의 예를 도시하는 도면이다.
도 14는 본 발명의 일 실시예로서 장표 인식 장치의 괘선 제거의 과정에서의 문자 화상의 예를 도시하는 도면이다.
도 15의 (a), (b)는 본 발명의 일 실시예로서 장표 인식 장치의 괘선 제거의 과정에서의 문자 화상의 예를 도시하는 도면이다.
도 16은 본 발명의 일 실시예로서 장표 인식 장치에 있어서의 괘선 제거로부터 문자 화상의 복원에 이르기까지의 처리를 설명하기 위한 흐름도이다.
도 17은 본 발명의 일 실시예로서 장표 인식 장치에 있어서의 문자 인식처리를 설명하기 위한 흐름도이다.
도 18은 본 발명의 일 실시예로서 장표 인식 장치에 있어서의 장표 인식에 관한 처리를 설명하기 위한 흐름도이다.
도 19는 본 발명의 일 실시예로서 장표 인식 장치에 있어서의 색상 클러스터 분류 기법을 설명하기 위한 도면이다.
도 20은 본 발명의 일 실시예로서 장표 인식 장치에 있어서의 휘도 클러스터 분류 기법을 설명하기 위한 도면이다.
* 도면의 주요부분에 대한 부호의 설명 *
1: 장표 인식 장치(매체 처리 장치, 문자 인식 장치)
2: 컬러 이미지 리더
3: 메모리
4: 하드디스크
5: 모니터
6: 키보드
10: CPU
11: 레이아웃 해석부
12: 부분 화상 작성부(원화상 작성부)
13: 배경 인정부
14: 괘선 추출부(문자 외선분 인정부)
15: 제1 문자 영역 인정부
16: 확대 화상 작성부
17: 괘선 제거부(제1 문자 외선분 제거 화상 작성부, 제2 문자 외선분 제거 화상 작성부)
18: 간섭 판단부
19: 문자 화상 복원부
20: 제2 문자 영역 인정부
21: 문자 인식부
22: 사전 등록 데이터베이스
23: 괘선 위치 추정부(문자 외선분 위치 추정부)
24: 색상 특정부(색정보 특정부)
25: 괘선 정보 취득부(문자 외선분 정보 취득부)

Claims (5)

  1. 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하여, 상기 문자 화상에 관한 문자를 인식하는 문자 인식 장치로서,
    상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정부와,
    상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와,
    상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와,
    상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와, 상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와,
    상기 확대 화상 작성부에 의해서 작성된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와,
    상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와,
    상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에, 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와,
    상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와,
    상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부를 갖추는 것을 특징으로 하는 문자 인식 장치.
  2. 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하여, 상기 문자 화상에 관한 문자를 인식하는 문자 인식 방법으로서,
    상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정 단계와,
    상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정 단계와,
    상기 원화상에 있어서 상기 문자 외선분 인정 단계에 있어서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성 단계와,
    상기 제1 문자 외선분 제거 화상 작성 단계에 있어서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정 단계와, 상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성 단계와,
    상기 확대 화상 작성 단계에 있어서 작성한 상기 확대 화상에 있어서 상기 문자 외선분 인정 단계에 있어서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성 단계와,
    상기 문자 외선분 인정 단계에 있어서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정 단계에 있어서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단 단계와,
    상기 간섭 판단 단계에 있어서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원 단계와,
    상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정 단계와, 상기 제2 문자 영역 인정 단계에 있어서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식 단계를 갖추는 것을 특징으로 하는 문자 인식 방법.
  3. 문자가 기재된 매체로부터 판독한 매체 화상에 기초로 하여 문자 인식을 행하는 매체 처리 방법으로서,
    상기 매체 화상에 기초로 하여 상기 매체 화상의 레이아웃의 특징을 추출하여 상기 레이아웃의 구성을 해석하는 레이아웃 해석 단계와,
    상기 레이아웃 해석 단계에 있어서의 해석 결과에 기초로 하여 문자 인식을 행하는 대상이 되는 문자 화상을 갖춘 원화상을 작성하는 원화상 작성 단계와,
    상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정 단계와,
    상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정 단계와,
    상기 원화상에 있어서 상기 문자 외선분 인정 단계에 있어서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성 단계와,
    상기 제1 문자 외선분 제거 화상 작성 단계에 있어서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정 단계와,
    상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성 단계와,
    상기 확대 화상 작성 단계에 있어서 작성한 상기 확대 화상에 있어서 상기 문자 외선분 인정 단계에 있어서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성 단계와,
    상기 문자 외선분 인정 단계에 있어서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정 단계에 있어서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단 단계와,
    상기 간섭 판단 단계에 있어서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원 단계와,
    상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정 단계와,
    상기 제2 문자 영역 인정 단계에 있어서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식 단계를 갖추는 것을 특징으로 하는 매체 처리 방법.
  4. 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하여, 상기 문자 화상에 관한 문자를 인식하는 문자 인식 기능을 컴퓨터에 실행시키기 위한 문자 인식 프로그램으로서,
    상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역를 인정하는 배경 인정부와,
    상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와,
    상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와,
    상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와,
    상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와,
    상기 확대 화상 작성부에 의해서 작성된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와,
    상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와,
    상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 관한 색정보와 상기 문자 외선분에 관한 색정보와의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와,
    상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와,
    상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부로서 상기 컴퓨터를 기능시키는 것을 특징으로 하는 문자 인식 프로그램.
  5. 문자 화상을 포함하는 원화상으로부터 상기 문자 화상을 추출하여, 상기 문자 화상에 이러한 문자를 인식하는 문자 인식 기능을 컴퓨터에 실행시키기 위한 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체로서,
    상기 문자 인식 프로그램이,
    상기 원화상에 있어서의 색성분의 분산량과 색정보에 관한 횟수 분포에 기초로 하여 배경 영역을 인정하는 배경 인정부와,
    상기 원화상에 있어서의 상기 배경 영역을 구성하는 화소와는 다른 색정보를 갖는 화소의 횟수 분포와, 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소에 기초로 하여 상기 문자 이외의 문자 외선분을 인정하는 동시에, 상기 문자 외선분에 관한 문자 외선분 정보를 취득하는 문자 외선분 인정부와,
    상기 원화상에 있어서 상기 문자 외선분 인정부에 의해서 인정된 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 화소로 치환함으로써 상기 원화상으로부터 상기 문자 외선분을 제거한 제1 문자 외선분 제거 화상을 작성하는 제1 문자 외선분 제거 화상 작성부와,
    상기 제1 문자 외선분 제거 화상 작성부에 의해서 작성된 상기 제1 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 서로 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 영역을 문자 영역으로서 인정하는 제1 문자 영역 인정부와,
    상기 원화상에 기초로 하여 확대 화상을 작성하는 확대 화상 작성부와,
    상기 확대 화상 작성부에 의해서 작성된 상기 확대 화상에 있어서 상기 문자 외선분 인정부에 의해서 취득된 상기 문자 외선분 정보에 기초로 하여 상기 문자 외선분을 상기 배경과 동일한 색성분을 갖는 배경 화소로 치환함으로써 상기 확대 화상으로부터 상기 문자 외선분을 제거한 제2 문자 외선분 제거 화상을 작성하는 제2 문자 외선분 제거 화상 작성부와,
    상기 문자 외선분 인정부에 의해서 취득된 문자 외선분 정보와, 상기 제1 문자 영역 인정부에 의해서 인정된 문자 영역에 기초로 하여 상기 원화상에 있어서 상기 문자와 상기 문자 외선분이 간섭하고 있는지 여부를 판단하는 간섭 판단부와,
    상기 간섭 판단부에 의해서 상기 문자 화상과 상기 문자 외선분이 간섭하고 있다고 판단된 경우에, 상기 제2 문자 외선분 제거 화상에 있어서의 상기 문자 화상과 문자 외선분과의 간섭 위치에 관해서 상기 문자 화상에 이러한 색정보와 상기 문자 외선분에 관한 색정보의 차이에 기초로 하여 상기 문자 화상의 복원을 행하는 문자 화상 복원부와,
    상기 제2 문자 외선분 제거 화상에 있어서 상기 배경 영역 이외의 영역으로서 동일한 색특성을 갖는 화소가 소정수 이상 연속하는 연속 화소를 포함하는 소정 사이즈 이상의 영역을 문자 영역으로서 인정하는 제2 문자 영역 인정부와,
    상기 제2 문자 영역 인정부에 의해서 인정된 문자 영역을 2진화하여 문자 인식을 행하는 문자 인식부로서 상기 컴퓨터를 기능시키는 것을 특징으로 하는 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
KR1020040077435A 2004-03-10 2004-09-24 문자 인식 장치, 문자 인식 방법, 매체 처리 방법 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 KR100625755B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2004-00067728 2004-03-10
JP2004067728A JP4603807B2 (ja) 2004-03-10 2004-03-10 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体

Publications (2)

Publication Number Publication Date
KR20050090945A true KR20050090945A (ko) 2005-09-14
KR100625755B1 KR100625755B1 (ko) 2006-09-20

Family

ID=34824584

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040077435A KR100625755B1 (ko) 2004-03-10 2004-09-24 문자 인식 장치, 문자 인식 방법, 매체 처리 방법 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체

Country Status (6)

Country Link
US (1) US7324692B2 (ko)
EP (1) EP1574987B1 (ko)
JP (1) JP4603807B2 (ko)
KR (1) KR100625755B1 (ko)
CN (1) CN1313963C (ko)
DE (1) DE602004022130D1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011093568A1 (ko) * 2010-01-26 2011-08-04 광주과학기술원 레이아웃 기반의 인쇄매체 페이지 인식방법
US8315460B2 (en) 2009-02-12 2012-11-20 Samsung Electronics Co., Ltd Method for recognizing text from image

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005073015A (ja) * 2003-08-26 2005-03-17 Canon Inc 画像処理装置及び画像処理方法及びコンピュータプログラム
EP1555804A3 (en) * 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
US7734089B2 (en) * 2005-08-23 2010-06-08 Trident Microsystems (Far East) Ltd. Method for reducing mosquito noise
JP4215038B2 (ja) * 2005-09-16 2009-01-28 セイコーエプソン株式会社 画像処理装置、画像処理方法、およびプログラム
CN100419781C (zh) * 2005-10-05 2008-09-17 三菱电机株式会社 图像识别装置
CN101154291B (zh) * 2006-09-29 2010-05-12 国际商业机器公司 图像数据压缩方法、图像显示方法及其相应装置
JP4443576B2 (ja) * 2007-01-18 2010-03-31 富士通株式会社 パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
US7853074B2 (en) * 2007-02-26 2010-12-14 Eastman Kodak Company Multi-color dropout for scanned document
US8000535B2 (en) * 2007-06-18 2011-08-16 Sharp Laboratories Of America, Inc. Methods and systems for refining text segmentation results
US8315482B2 (en) 2007-06-26 2012-11-20 Microsoft Corporation Integrated platform for user input of digital ink
US8041120B2 (en) * 2007-06-26 2011-10-18 Microsoft Corporation Unified digital ink recognition
US8094939B2 (en) * 2007-06-26 2012-01-10 Microsoft Corporation Digital ink-based search
US8326028B2 (en) 2007-12-26 2012-12-04 Hitachi Computer Peripherals Co., Ltd. Dropout color processing method and processing apparatus using same
KR101023309B1 (ko) 2008-03-31 2011-03-18 후지츠 프론테크 가부시키가이샤 문자 인식 장치
JP4909311B2 (ja) * 2008-03-31 2012-04-04 富士通フロンテック株式会社 文字認識装置
JP5049920B2 (ja) * 2008-08-26 2012-10-17 キヤノン株式会社 画像処理装置及び画像処理方法
JP5229328B2 (ja) * 2008-11-12 2013-07-03 富士通株式会社 文字領域抽出装置,文字領域抽出機能を備えた撮像装置,および文字領域抽出プログラム
JP5182523B2 (ja) * 2009-03-04 2013-04-17 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4798236B2 (ja) 2009-03-06 2011-10-19 カシオ計算機株式会社 撮像装置、画像処理方法及びプログラム
JP5385372B2 (ja) * 2009-03-31 2014-01-08 富士通フロンテック株式会社 文字認識装置及び文字認識方法
JP5332838B2 (ja) * 2009-04-07 2013-11-06 ソニー株式会社 情報処理装置、および実行制御方法
JP5337563B2 (ja) * 2009-04-08 2013-11-06 日立コンピュータ機器株式会社 帳票認識方法および装置
JP5279654B2 (ja) * 2009-08-06 2013-09-04 キヤノン株式会社 画像追尾装置、画像追尾方法、及びコンピュータプログラム
TWI408610B (zh) 2009-12-30 2013-09-11 Ind Tech Res Inst 姿勢辨識方法與系統,及其電腦程式產品
CN102136070B (zh) * 2010-01-22 2013-10-30 财团法人工业技术研究院 姿势辨识方法与系统,及其计算机程序产品
CN101916327B (zh) * 2010-07-09 2011-11-09 北京商纳科技有限公司 一种生成错题本的方法及系统
CN102455628B (zh) * 2010-10-29 2014-08-13 京瓷办公信息系统株式会社 图像形成装置
JP5598325B2 (ja) * 2010-12-29 2014-10-01 コニカミノルタ株式会社 文字検出装置、文字検出方法、およびコンピュータプログラム
JP2011175663A (ja) * 2011-04-22 2011-09-08 Casio Computer Co Ltd 撮像装置、画像処理方法及びプログラム
JP5826081B2 (ja) * 2012-03-19 2015-12-02 株式会社Pfu 画像処理装置、文字認識方法及びコンピュータプログラム
JP2014002662A (ja) * 2012-06-20 2014-01-09 Hitachi Solutions Ltd 帳票印刷システム
JP5887242B2 (ja) * 2012-09-28 2016-03-16 日立オムロンターミナルソリューションズ株式会社 画像処理装置、画像処理方法、及びプログラム
JP5822865B2 (ja) * 2013-04-25 2015-11-25 京セラドキュメントソリューションズ株式会社 画像処理装置、罫線判定方法、及び罫線判定プログラム
WO2015129062A1 (ja) * 2014-02-28 2015-09-03 オリンパス株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP6350069B2 (ja) * 2014-07-22 2018-07-04 富士ゼロックス株式会社 情報処理システム、情報処理装置およびプログラム
JP2016110354A (ja) 2014-12-05 2016-06-20 三星ディスプレイ株式會社Samsung Display Co.,Ltd. 画像処理装置、画像処理方法、およびプログラム
US9536167B2 (en) * 2014-12-10 2017-01-03 Ricoh Co., Ltd. Realogram scene analysis of images: multiples for scene analysis
CN107025452A (zh) * 2016-01-29 2017-08-08 富士通株式会社 图像识别方法和图像识别设备
CN107346580B (zh) * 2016-05-05 2019-11-05 腾讯科技(深圳)有限公司 票据信息识别方法及装置
US10068132B2 (en) * 2016-05-25 2018-09-04 Ebay Inc. Document optical character recognition
CN109948507B (zh) * 2019-03-14 2021-05-07 北京百度网讯科技有限公司 用于检测表格的方法和装置
JP7379876B2 (ja) * 2019-06-17 2023-11-15 株式会社リコー 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
CN111145126B (zh) * 2019-12-31 2023-04-07 陈文海 一种图像文字快速抹除方法
CN111275051A (zh) * 2020-02-28 2020-06-12 上海眼控科技股份有限公司 字符识别方法、装置、计算机设备和计算机可读存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5335292A (en) * 1988-12-21 1994-08-02 Recognition International Inc. Document processing system and method
JP2637541B2 (ja) 1989-02-02 1997-08-06 富士通株式会社 色識別方法及び装置
JPH0388019A (ja) * 1989-08-31 1991-04-12 Toshiba Corp データ処理装置
US5459797A (en) * 1991-03-30 1995-10-17 Kabushiki Kaisha Toshiba Character reading system
JP3258122B2 (ja) 1993-03-31 2002-02-18 株式会社東芝 画像処理装置
JPH0851540A (ja) * 1994-08-04 1996-02-20 Canon Inc 画像処理装置及び方法
JPH08123901A (ja) * 1994-10-26 1996-05-17 Nec Corp 文字抽出装置及び該装置を用いた文字認識装置
EP1818857B1 (en) * 1995-07-31 2010-06-23 Fujitsu Limited Document processor and document processing method
JP3207338B2 (ja) * 1995-09-11 2001-09-10 沖電気工業株式会社 光学式文字読取り装置
JP2871590B2 (ja) * 1996-05-13 1999-03-17 日本電気株式会社 画像抽出方式
US6366699B1 (en) * 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data
JP3895473B2 (ja) 1998-08-10 2007-03-22 株式会社リコー 記入情報抽出方法および記入情報抽出方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体
JP3204245B2 (ja) 1999-04-27 2001-09-04 インターナショナル・ビジネス・マシーンズ・コーポレーション 罫線除去方法および装置
JP2001092912A (ja) 1999-09-24 2001-04-06 Toshiba Corp データ入力装置及びデータ入力方法
JP2001297303A (ja) * 2000-02-09 2001-10-26 Ricoh Co Ltd 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP2002342710A (ja) * 2001-05-16 2002-11-29 Nec Corp 文字切出し装置及びそれに用いる文字切出し方法並びにそのプログラム
JP3949954B2 (ja) 2001-12-27 2007-07-25 富士通株式会社 ドロップアウトカラー識別処理プログラム、方法、および装置
JP3955467B2 (ja) 2001-12-27 2007-08-08 株式会社日立製作所 画像処理プログラム及び画像処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8315460B2 (en) 2009-02-12 2012-11-20 Samsung Electronics Co., Ltd Method for recognizing text from image
WO2011093568A1 (ko) * 2010-01-26 2011-08-04 광주과학기술원 레이아웃 기반의 인쇄매체 페이지 인식방법

Also Published As

Publication number Publication date
EP1574987A3 (en) 2006-09-06
US7324692B2 (en) 2008-01-29
JP2005258683A (ja) 2005-09-22
JP4603807B2 (ja) 2010-12-22
EP1574987A2 (en) 2005-09-14
CN1667641A (zh) 2005-09-14
KR100625755B1 (ko) 2006-09-20
US20050201620A1 (en) 2005-09-15
CN1313963C (zh) 2007-05-02
DE602004022130D1 (de) 2009-09-03
EP1574987B1 (en) 2009-07-22

Similar Documents

Publication Publication Date Title
KR100625755B1 (ko) 문자 인식 장치, 문자 인식 방법, 매체 처리 방법 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
KR100927528B1 (ko) 전자 워터마크 매립 장치 및 검출 장치
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
KR100512831B1 (ko) 이미지 처리 방법, 장치 및 프로그램 저장 매체
JP3258122B2 (ja) 画像処理装置
JP5830338B2 (ja) 帳票認識方法および帳票認識装置
JP2009265751A (ja) 文字認識装置、光学式文字認識システム及び文字認識プログラム
JP2003228712A (ja) イメージからテキスト状のピクセルを識別する方法
JP5337563B2 (ja) 帳票認識方法および装置
CN102473278B (zh) 图像处理装置、图像处理方法和存储介质
US11935314B2 (en) Apparatus for generating a binary image into a white pixel, storage medium, and method
JP4423333B2 (ja) 背景領域特定方法、背景領域特定システム、背景色決定方法、制御プログラム、および、記録媒体
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
US8249364B2 (en) Method for resolving contradicting output data from an optical character recognition (OCR) system, wherein the output data comprises more than one recognition alternative for an image of a character
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
KR100449486B1 (ko) 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
JP2003087562A (ja) 画像処理装置および画像処理方法
JP2016181111A (ja) 画像処理装置、及び画像処理プログラム
Kleber et al. Document reconstruction by layout analysis of snippets
JP2005071134A (ja) 光学的文字読取装置
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
JP2001043312A (ja) 文書画像処理装置
KR100977252B1 (ko) 슬래브 영상의 관리번호 자동 추출 방법
JPH05135204A (ja) 文字認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120821

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20130822

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140825

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20150819

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160818

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20170818

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20180816

Year of fee payment: 13