KR19990036622A - 비트맵 이미지의 처리 방법 및 처리 장치, 비트맵 이미지의처리를 행하는 이미지 처리 프로그램을 저장한 기억 매체 - Google Patents

비트맵 이미지의 처리 방법 및 처리 장치, 비트맵 이미지의처리를 행하는 이미지 처리 프로그램을 저장한 기억 매체 Download PDF

Info

Publication number
KR19990036622A
KR19990036622A KR1019980036901A KR19980036901A KR19990036622A KR 19990036622 A KR19990036622 A KR 19990036622A KR 1019980036901 A KR1019980036901 A KR 1019980036901A KR 19980036901 A KR19980036901 A KR 19980036901A KR 19990036622 A KR19990036622 A KR 19990036622A
Authority
KR
South Korea
Prior art keywords
bitmap image
specific information
horizontal line
information
bitmap
Prior art date
Application number
KR1019980036901A
Other languages
English (en)
Other versions
KR100315318B1 (ko
Inventor
미찌또시 스미까와
히로야스 다까하시
Original Assignee
포만 제프리 엘
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포만 제프리 엘, 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 포만 제프리 엘
Publication of KR19990036622A publication Critical patent/KR19990036622A/ko
Application granted granted Critical
Publication of KR100315318B1 publication Critical patent/KR100315318B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

문서에 페이지 마크(page mark)나 기준 마크(reference mark)가 없고 스캐너가 이 문서의 에지를 검출할 수 없는 경우에도 문자 프레임의 특정과 문자의 인식을 가능하게 한다. 또한, 고속으로 검출할 수 있는 수평 선분(horizontal line segments)으로 형성된 외접 직사각형을 기준으로 하여 이미지의 비교를 행함으로써 비트맵 이미지의 식별 처리를 고속화한다.
OCR에서 페이지 마크가 없는 흑색 문자 프레임을 갖는 문서(300)를 식별하고, 문자를 인식하는 경우 등, 문서 상의 문자 프레임(323, 327)이나 괘선(301, 303) 등의 수평 선분을 포함하는 비트맵 이미지의 식별을 행할 때, 수평 선분을 그 문서의 특징으로서 추출하고, 그 수평 선분에 의해 생성되는 영역에 외접 직사각형(350)을 형성하고, 문자 프레임 위치의 추정 기준이나 문서의 종류를 식별하기 위한 정보로 한다. 이것을 OCR에 적용함으로써, 페이지 마크 혹은 기준 마크가 없는 문서라도 인식할 수 있게 된다. 또한, 추출한 수평 선분 자체도 미리 등록한 문서 정의체의 수평 선분과 비교하여 유사도를 비교함으로써 보다 정확한 문서의 식별이 가능해진다.

Description

비트맵 이미지의 처리 방법 및 처리 장치, 비트맵 이미지의 처리를 행하는 이미지 처리 프로그램을 저장한 기억 매체
본 발명은 이미지 처리 방법에 관한 것으로, 특히 비트맵 이미지의 식별 방법에 관한 것이다.
종래, 문서의 식별과 문자의 인식 처리로서, 문자 프레임등의 위치를 이미지 상에서 특정하기 위해서는,
(1) 페이지 마크(page mark) 혹은 기준 마크(reference mark)를 기준으로 이용하는 방식,
(2) 스캐너에 문서의 배경을 흑으로 하여 문서의 에지를 검출하는 기능이 있는 경우, 그 에지를 기준으로 이용하는 방식,
(3) 흑색 문자 프레임을 개별적으로 검출하고, 그 프레임과 미리 정의되어 있는 프레임과의 매칭을 하는 방식이 채용되어 왔다.
그러나, 방식 (1)에서는 문서에 페이지 마크 혹은 기준 마크가 요구되어 사용자가 사용할 수 있는 영역이 좁아지는 등의 제한이 있다. 또한, 이 방식으로는 페이지 마크 혹은 기준 마크가 없는 문서에 대응할 수 없다고 하는 문제점이 있었다.
방식 (2)는 이러한 기능이 갖춰져 있는 OCR 전용의 고가의 스캐너가 아니면 적용할 수 없다고 하는 문제점이 있었다.
방식 (3)은, 흑색 문자 프레임을 검출하기 위해 수평 선분(horizontal line segments)뿐만 아니라 수직 선분도 특징으로서 추출할 필요가 있으므로, 처리 속도가 저하한다.
또한, 전처리(preprocessing)로서 이미지 그 자체를 스큐 보정(skew correction)하여 스큐가 전혀 없는 상태로 하므로, 처리가 느려진다고 하는 문제점이 있었다. 특히, 문서의 내용을 이용하여 식별하는 방식으로는 스큐나 위치 편차가 있는 경우 분석 논리가 복잡해지는 경향이 있고, 처리 속도가 저하하는 경향이 있었다.
본 발명의 목적은 문서에 페이지 마크 혹은 기준 마크가 없고, 또한 스캐너가 문서의 에지를 검출할 수 없는 경우에도 문자 프레임의 특정과 문자의 인식을 가능하게 하는 것이다.
본 발명의 또 다른 목적은, 고속으로 인식할 수 있는 수평 선분만으로 형성된 외접 직사각형을 기준으로 하여 비트맵 이미지의 비교를 행함으로써, 비트맵 이미지의 식별 처리를 고속화하는 것이다.
본 발명의 또 다른 목적은, 이미지 그 자체를 스큐 보정하지 않고, 이상적인 이미지로 맵핑함으로써 비트맵 이미지의 식별 처리를 고속화하는 것이다.
본 발명의 또 다른 목적은, 외접 직사각형의 4개의 코너를 가상 페이지 마크로 함으로써, 종래의 페이지 마크를 기준으로 한 문자 프레임을 검출하도록 설계된 현재의 논리(existing logic)가 가상 페이지 마크(virtual page mark)의 검출에 전용되도록 하는 것이다.
본 발명의 또 다른 목적은, 외접 직사각형이나 수평 선분의 정의 정보(definition information)를 기존의 문서 정의체(document definition set)에 추가 가능하게 함으로써, 종래의 문서 정의체의 정보를 그대로 이용할 수 있고, 문서 정의체를 작성하는 오퍼레이터의 부담을 경감하는 것이다.
OCR에서 페이지 마크가 없는 흑색 문자 프레임을 갖는 문서를 식별하고, 문자를 인식하는 경우 등, 문서상의 문자 프레임이나 괘선 등의 수평 선분을 포함하는 비트맵 이미지의 식별을 행할 때, 수평 선분을 그 문서의 특징으로서 추출하고, 그 수평 선분에 의해 생성되는 영역에 외접 직사각형을 형성하여, 문자 프레임의 위치의 추정 기준이나 문서의 종류를 식별하기 위한 정보로 한다. 이것을 OCR에 적용함으로써 페이지 마크 혹은 기준 마크가 없는 문서라도 식별이 가능해진다. 또한, 추출한 수평 선분 자체도 미리 등록한 문서 정의체의 수평 선분과 비교하여 유사도를 비교함으로써, 보다 정확한 문서의 식별이 가능해진다.
본 발명의 한 형태에서는, 비트맵 이미지의 종류를 특정하기 위해 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체를 갖는 비트맵 이미지 식별 장치 상에서 실행되는 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 방법으로서,
(a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분(horizontal line segment)의 특정 정보를 추출하는 단계와,
(b) 상기 복수의 수평 선분 정의 정보에 기초하여 외접 직사각형의 특정 정보를 추출하는 단계와,
(c) 상기 추출된 외접 직사각형의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 외접 직사각형 특정 정보와 유사한지의 여부를 검사하는 단계를 포함하는 비트맵 이미지의 식별 방법이 제공된다.
또, 본원 명세서의 특허 청구의 범위에서 「비트맵 이미지의 정의체」는, 본 발명의 바람직한 실시예에서의 문서 정의체에 대응하는 개념이지만, 문서에 한하지 않고, 여러가지의 비트맵 이미지의 종류를 식별하기 위한 정보를 유지하는 것을 포함하는 개념이다.
또한, 본원 명세서의 특허 청구의 범위에서 「수평 선분」은, 비트맵 이미지의 주사 방향에 대해 거의 평행한 선분을 의미한다.
또한, 본원 명세서의 특허 청구의 범위에서 「수평 선분의 특정 정보」는, 선분을 정의하는 2점의 좌표뿐만 아니라, 벡터 정보등을 포함하는 개념이다.
본 발명의 다른 한 형태에서는, 비트맵 이미지의 종류를 특정하기 위해 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체를 갖는 비트맵 이미지 식별 장치 상에서 실행되는 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 방법으로서,
(a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하는 단계와,
(b) 상기 추출된 복수의 수평 선분의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 수평 선분의 특정 정보가 유사한지의 여부를 검사하는 단계를 포함하는 비트맵 이미지의 식별 방법이 제공된다.
본 발명의 다른 한 형태에서는, 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하기 위한 정보의 취득 방법으로서,
(a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하는 단계와,
(b) 상기 복수의 수평 선분 정의 정보에 기초하여 상기 복수의 수평 선분 중 2개의 적어도 일부분을 그 수평변(horizontal side)에 포함하는 구형(rectangle)의 특정 정보를 추출하는 단계와,
(c) 상기 복수의 수평 선분 정의 정보로부터 계산된 스큐 정보(skew information)에 기초하여 상기 구형의 특정 정보를 변환하는 단계와,
(d) 상기 변환된 구형의 정의 정보를 저장하는 단계를 포함하는 비트맵 이미지의 식별을 행하기 위한 정보의 취득 방법이 제공된다.
또, 본원 명세서의 특허 청구의 범위에서 「구형」은, 본 발명의 바람직한 실시예에서의 외접 직사각형에 대응하는 개념이지만, 외접 직사각형에 한하지 않고, 특정한 수평 선분에 기초하여 형성되는 구형도 포함하는 개념이다.
본 발명의 다른 한 형태에서는 비트맵 이미지에 포함되는 문자 프레임의 위치를 인식하는 방법으로서,
(a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하는 단계와,
(b) 상기 복수의 수평 선분 정의 정보에 기초하여 외접 직사각형의 특정 정보를 추출하는 단계와,
(c) 상기 비트맵 이미지에 포함되는 문자 프레임의 특정 정보를 추출하는 단계와,
(d) 상기 추출된 문자 프레임의 특정 정보를 상기 외접 직사각형의 하나의 정점을 기준으로 하는 위치 정보로서 저장하는 단계를 포함하는 문자 프레임의 식별 방법이 제공된다.
본 발명의 다른 한 형태에서는, 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 비트맵 이미지 식별 장치로서,
(a) 복수의 수평 선분 이미지를 포함하는 비트맵 이미지를 유지하는 이미지 입력부와,
(b) 비트맵 이미지의 종류를 특정하는 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체와,
(c1) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하고,
(c2) 상기 복수의 수평 선분 정의 정보에 기초하여 외접 직사각형의 특정 정보를 추출하고,
(c3) 상기 추출된 외접 직사각형의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 외접 직사각형 특정 정보와 유사한지의 여부를 검사하는 이미지 해석부를 포함하는 비트맵 이미지 식별 장치가 제공된다.
본 발명의 다른 한 형태에서는, 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 비트맵 이미지 식별 장치로서,
(a) 복수의 수평 선분 이미지를 포함하는 비트맵 이미지를 유지하는 이미지 입력부와,
(b) 비트맵 이미지의 종류를 특정하는 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체와,
(c1) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하고,
(c2) 상기 추출된 복수의 수평 선분의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 수평 선분의 특정 정보와 유사한지의 여부를 검사하는 이미지 해석부를 포함하는 비트맵 이미지 식별 장치가 제공된다.
본 발명의 다른 한 형태에서는, 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하기 위한 정보를 취득하는 비트맵 이미지 처리 장치로서,
(a1) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하고,
(a2) 상기 복수의 수평 선분 정의 정보에 기초하여 상기 복수의 수평 선분 중 2개의 적어도 일부분을 그 수평변으로 포함하는 구형의 특정 정보를 추출하고,
(a3) 상기 복수의 수평 선분 정의 정보로부터 계산된 스큐 정보에 기초하여 상기 구형의 특정 정보를 변환하는 이미지 해석부와,
(b) 상기 변환된 구형의 정의 정보를 저장하는 비트맵 이미지 정의체를 포함하는 비트맵 이미지 처리 장치가 제공된다.
본 발명의 다른 한 형태에서는, 비트맵 이미지에 포함되는 문자 프레임의 위치를 인식하는 비트맵 이미지 처리 장치로서,
(a1) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하고,
(a2) 상기 복수의 수평 선분 정의 정보에 기초하여 외접 직사각형의 특정 정보를 추출하고,
(a3) 상기 비트맵 이미지에 포함되는 문자 프레임의 특정 정보를 추출하는 이미지 해석부와,
(b) 상기 추출된 문자 프레임의 특정 정보를 상기 외접 직사각형의 하나의 정점을 기준으로 한 위치 정보로서 저장하는 비트맵 이미지 정의체를 포함하는 비트맵 이미지 처리 장치가 제공된다.
본 발명의 다른 한 형태에서는, 비트맵 이미지의 종류를 특정하기 위해 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체를 갖는 비트맵 이미지 식별 장치 상에서 실행되는 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 이미지 처리 프로그램을 저장한 기록 매체로서,
상기 이미지 처리 프로그램은,
(a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하도록 상기 비트맵 이미지 식별 장치에 지시하기 위한 프로그램 코드와,
(b) 상기 복수의 수평 선분 정의 정보에 기초하여 외접 직사각형의 특정 정보를 추출하도록 상기 비트맵 이미지 식별 장치에 지시하기 위한 프로그램 코드와,
(c) 상기 추출된 외접 직사각형의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 외접 직사각형 특정 정보와 유사한지의 여부를 검사하도록 상기 비트맵 이미지 식별 장치에 지시하기 위한 프로그램 코드를 포함하는 기록 매체가 제공된다.
본 발명의 다른 한 형태에서는, 비트맵 이미지의 종류를 특정하기 위해 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체를 갖는 비트맵 이미지 식별 장치 상에서 실행되는 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 이미지 처리 프로그램을 저장한 기록 매체로서,
상기 이미지 처리 프로그램은,
(a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하도록 상기 비트맵 이미지 식별 장치에 지시하기 위한 프로그램 코드와,
(b) 상기 추출된 복수의 수평 선분의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 수평 선분의 특정 정보와 유사한지의 여부를 검사하도록 상기 비트맵 이미지 식별 장치에 지시하기 위한 프로그램 코드를 포함하는 기록 매체가 제공된다.
본 발명의 다른 한 형태에서는, 비트맵 이미지 처리 장치에서 실행되고, 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하기 위한 정보의 취득하는 이미지 처리 프로그램을 저장한 기록 매체로서,
상기 이미지 처리 프로그램은,
(a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
(b) 상기 복수의 수평 선분 정의 정보에 기초하여 상기 복수의 수평 선분 중 2개의 적어도 일부분을 그 수평변으로 포함하는 구형의 특정 정보를 추출하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
(c) 상기 복수의 수평 선분 정의 정보로부터 계산된 스큐 정보에 기초하여 상기 구형의 특정 정보를 변환하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
(d) 상기 변환된 구형의 정의 정보를 저장하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드를 포함하는 기록 매체가 제공된다.
본 발명의 다른 한 형태에서는, 비트맵 이미지 처리 장치에서 실행되고, 비트맵 이미지에 포함되는 문자 프레임의 위치를 인식하는 이미지 처리 프로그램을 저장한 기록 매체로서,
상기 이미지 처리 프로그램은,
(a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
(b) 상기 복수의 수평 선분 정의 정보에 기초하여 외접 직사각형의 특정 정보를 추출하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
(c) 상기 비트맵 이미지에 포함되는 문자 프레임의 특정 정보를 추출하도록상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
(d) 상기 추출된 문자 프레임의 특정 정보를 상기 외접 직사각형의 하나의 정점을 기준으로 하는 위치 정보로서 저장하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드를 포함하는 기록 매체가 제공된다.
도 1은 하드웨어 구성을 나타내는 블럭도.
도 2는 처리 요소의 블럭도.
도 3은 문서 정의체(document definition set)의 개념도.
도 4는 속성 정의를 행하기 위한 사용자 인터페이스의 실시예를 나타내는 도면.
도 5는 본 발명의 바람직한 실시예에서의 문서 정의체 작성 처리의 순서를 나타내는 흐름도.
도 6은 실제로 각 필드에 기입된 문서가 입력된 경우의, 문서의 이미지를 나타내는 도면.
도 7은 문서 이미지로부터 추출된 수평 선분의 개념도.
도 8은 문서 이미지로 형성된 외접 직사각형의 개념도.
도 9는 본 발명의 바람직한 실시예에서의 문서 식별/문자 인식 처리의 순서를 나타내는 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
100 : 이미지 처리 시스템
101 : 사용자 입력부
103 : 제어부
105 : 이미지 해석부
107 : 이미지 표시부
109 : 속성 정보 입력 제어부
111 : 이미지 입력부
113 : 정의체 저장부
200 : 문서(비트맵 이미지) 정의체
A. 하드웨어 구성
이하, 도면을 참조하여 본 발명의 실시예를 설명한다.
도 1을 참조하면, 본 발명의 이미지 처리 시스템을 실시하기 위한 하드웨어 구성의 개관도가 도시되어 있다. 이미지 처리 시스템(100)은, 중앙 처리 장치(CPU : 1)와 메모리(4)를 포함하고 있다. CPU(1)와 메모리(4)는 버스(2) 등을 통해 보조 기억 장치인 하드디스크 장치(13,30)에 접속되어 있다. 플로피 디스크 장치(또는 MO:28, CD-ROM:26,29 등의 매체 구동 장치:26,28,29,30)(20)는 플로피 디스크 콘트롤러(또는 IDE 콘트롤러(25), SCSI 콘트롤러(27) 등의 각종 콘트롤러)(19)를 통해 버스(2)에 접속되어 있다.
플로피 디스크 장치(또는 MO, CD-ROM 등의 매체 구동 장치 26, 28, 29, 30)(20)에는 플로피 디스크(또는 MO, CD-ROM 등의 매체)가 삽입되고, 이 플로피 디스크 등이나 하드디스크 장치(13), ROM(14) 등의 기억 매체에는 본 발명을 실시하기 위한 컴퓨터 프로그램의 코드가 기록될 수 있다. 이러한 컴퓨터 프로그램 코드는 메모리(4)에 로드되어 오퍼레이팅 시스템과 협력하여 CPU 등에 명령을 내리게 된다. 이 컴퓨터 프로그램의 코드는 압축되거나 또는 복수의 세그멘트로 분할되어 복수의 매체에 걸쳐 기록될 수 있다. 마찬가지로, 상기 각종 기억 매체에는 입력되는 이미지 데이터나 처리 결과의 이미지 데이터를 저장할 수 있다.
이미지 처리 시스템(100)에는 또한, 사용자 인터페이스 하드웨어가 제공될 수 있고, 사용자 인터페이스 하드웨어로는 예를 들면 화면 위치 정보를 입력하기 위한 포인팅 디바이스(마우스, 조이스틱, 트랙볼 등)(7), 키입력을 지원하는 키보드(6)나, 이미지 데이터를 사용자에게 제시하기 위한 디스플레이(11, 12)가 있다. 또한, 스피커(23)는 오디오 콘트롤러(21)로부터 음성 신호를, 증폭기(22)를 통해 수령하여 음성으로서 출력한다.
본 발명의 이미지 처리 시스템(100)의 입력이 되는 이미지 데이터는 바람직하게는 스캐너(31)에 의해 작성되고, SCSI 인터페이스(27)를 통해 본 이미지 처리 시스템(100)으로 입력된다. 단, 스캐너에 의해 작성된 이미지 데이터는, SCSI 인터페이스(27)가 아니라 병렬 포트(16)나 다른 인터페이스를 통해 본 이미지 처리 시스템(100)에 입력되어도 좋다. 또한, 본 발명의 시스템(100)은 직렬 포트(15) 및 모뎀 또는 토큰링 등의 통신 어댑터(18) 등을 통해 다른 컴퓨터나 FAX 등과 통신을 행할 수도 있고, 플로피 디스크(24)와 같은 기억 매체로부터의 입력을 수령할 수도 있다. 더욱이 본원 발명의 시스템(100)은 직렬 포트(15) 등을 통해 디지탈 카메라와 접속되어 이미지 데이터를 수령할 수도 있다.
이와 같이, 본 발명은 통상의 퍼스널 컴퓨터(PC)나, 워크스테이션이나 전용 OCR, 텔레비젼이나 FAX 등의 각종 가전 제품에 내장된 컴퓨터 또는 이들 조합에 의해 실시 가능하다는 것을 용이하게 이해할 수 있을 것이다. 단, 이들 구성 요소는 예시이고, 그 모든 구성 요소가 본 발명의 필수 구성 요소가 되는 것은 아니다. 특히, 본 발명은 비트맵 이미지의 인식을 행하는 것이 때문에, 직렬 포트(15), 통신 어댑터 카드(18), 오디오 콘트롤러(21), 증폭기(22), 스피커(23) 등의 구성 요소는 본 발명을 구현하는데 있어서 필수의 것은 아니다.
오퍼레이팅 시스템으로는 Windows(마이크로소프트의 상표), OS/2(IBM의 상표), AIX(IBM의 상표) 상의 X-WINDOW 시스템(MIT의 상표) 등, 표준 GUI 멀티 윈도우 환경을 지원하는 것이 바람직하지만, 본 발명이 특정 오퍼레이팅 시스템 환경에 한정되는 것은 아니다.
또한, 도 1은 스탠드 얼론 환경의 시스템을 도시하고 있지만, 클라이언트/서버 시스템으로서 본 발명을 실현하고, 클라이언트 머신은 서버 머신에 대해 이서넷 토큰링 등으로 LAN 접속하고, 클라이언트 머신측에는 후술하는 사용자 입력부와, 이미지 표시부와, 이미지 입력부만을 배치하고, 그 밖의 기능을 서버 머신측에 배치해도 좋다. 이와 같이, 서버 머신측과 클라이언트 머신측에 어떠한 기능을 배치할지는 설계할 때 자유롭게 변경할 수 있는 사항이고, 복수의 머신을 조합하고, 이들에 어떠한 기능을 배분하고, 실시할지 등의 여러 변경은 본 발명의 사상에 포함되는 개념이다.
B. 시스템 구성
이어서, 도 2의 블럭도를 참조하여 본 발명의 시스템 구성에 대해 설명한다. 본 발명의 바람직한 실시예에서 이미지 처리 시스템(100)은 사용자 입력부(101), 제어부(103), 이미지 해석부(105), 이미지 표시부(107), 이미지 입력부(111), 및 정의체 저장부(113)에 의해 구성된다.
이 사용자 입력부(101)는 처리의 개시, 종료의 명령의 입력이나, 포인팅 디바이스를 사용한 화면상의 좌표치의 입력 등을 사용자로부터 수신하여 제어부(103)로 전달하는 기능을 갖는다. 이미지 입력부(111)는 스캐너 등으로부터 입력된 문서 이미지 등의 이미지 정보를 유지하고, 그 이미지 정보를 제어부(103)로 전달한다. 이미지 해석부(105)는 이미지 입력부(111)에서 유지된 이미지 정보를 해석하고, 검출한 선분을 특정하기 위한 좌표치 등을 도출하여 제어부(103)로 돌려준다. 이미지 표시부(107)는 이미지 입력부가 유지하는 문서 이미지 등의 이미지 정보나, 정의체 저장부(113)에 저장된, 필드의 위치 정보나 속성 정보를 표시 화면상에 표시한다. 이상 설명한 각 기능 블럭의 자세한 기능에 대해서는 후술한다.
이상 도 2에 도시된 각 기능 블럭을 설명했지만, 이들 기능 블럭은 논리적 기능 블록이다. 따라서, 각 기능 블록이 통합 하드웨어나 소프트웨어에 의해 실현되는 것을 의미하는 것은 아니고, 복합적이거나 또는 공통 하드웨어나 소프트웨어에 의해 실현될 수도 있다.
C. 동작 설명
본 발명은 OCR에만 한정되는 것이 아니고, 일반적인 비트맵 이미지의 인식이나 식별에도 적용할 수 있지만, 본 발명의 바람직한 실시예에서는 본 발명을 OCR에 적용한 경우의 예를 중심으로 설명한다.
문서 식별 기능을 갖는 OCR 소프트웨어는 문자를 인식할 때, 미리 문자 프레임의 위치나 문자 속성 등을 기술한 파일(이후 문서 정의체라고 함)을 사용하여 실제로 문자가 기입된 문서를 식별하고, 문자가 기입되어 있는 장소인 문자 필드를 특정하여 문자를 인식/코드화하고 있다.
도 3은 본 발명의 바람직한 실시예의 문서 정의체(200)의 내용을 나타내는 개념도이다. 본 발명의 바람직한 실시예의 문서 정의체(200)에는 종래의 문서 정의체에 대응하는 문서/문자 프레임 정의 정보부(210)와, 본 발명에 따라 개량된 외접 직사각형/수평 선분 정의 정보부(230)를 갖고 있다. 본 발명의 바람직한 실시예에서의 정의체 저장부(113)는 복수의 문서 정의체(200)를 저장하고 있다.
문서/문자 프레임 정의 정보부(210)는 문서 번호(213)의 정보를 포함하고 있다. 또한, 이 문서에 포함되는 문자 프레임에 대해 문자 프레임 번호(221), 문자 프레임의 개시 위치(223)(문자 프레임의 좌측 상부의 정점의 좌표 위치), 문자 프레임의 크기(폭 및 높이의 정보)(225), 문자수(227), 속성(229) 등의 정보를 관리하고 있다.
한편, 외접 직사각형/수평 선분 정의 정보부(230)는, 각 문서마다 문서/문자 프레임 정의 정보부(210)에 링크되어 있고, 외접 직사각형의 좌측 상부의 x, y 좌표(241), 외접 직사각형의 우측 상부의 x 좌표(243), 외접 직사각형의 좌측 아래의 x, y 좌표(245), 외접 직사각형의 우측 하부의 x 좌표(247), 수평 선분의 갯수(249)의 정보를 포함하고 있다. 또한, 이 문서에 포함되는 선분의 각각에 대해 선분의 개시 위치(231), 선분의 길이(233), 선분의 굵기(235) 등의 정보를 관리하고 있다. 이 외접 직사각형/수평 선분 정의 정보부(230)의 4개의 코너의 정보(241∼ 247)에 대해서는 종래의 문서 정의체에 포함되어 있는 페이지 마크/기준 마크의 정의 영역을 유용(流用)하는 것도 가능하다.
종래의 문서 정의체(도 3의 문서/문자 프레임 정의 정보부에 상당)를 생성하는 기술은 본원 발명의 출원시에 공지된 기법이지만, 간단히 설명한다. 새롭게 작성된 OCR용 문서를 문자 인식 프로그램에 인식시키는 OCR의 문서 정의 작업(문서 정의체 생성 작업)을 행할 때, 고전적 수법으로는 문서의 사이즈, 페이지 마크/위치 보정 마크(타이밍 마크 또는 기준 마크라고도 함)/문자 필드/문자의 상대적인 위치와 사이즈 등을 자를 사용하여 측정하고, 그 수치를 입력하여 문서 정의체를 생성하였다.
그러나, 이 기법은 오퍼레이터(정의체 작성자)에게 번거로운 것이었기 때문에, 현재 몇 가지 개량된 기법이 제안되고 있다. 일례를 들면, 미디어 드라이브사의 「WinReader Hand v1.5 사용자 메뉴얼, 필드의 설정(p19, 20)」(「WinReader Hand」은 미디어 드라이브사의 상표)에 기재된 바와 같이 흑색 프레임의 문서로서는 미기입의 문서 이미지를 스캐너로 읽어들여 디스플레이 상에 표시하고, 모든 검은 세로선과 가로선을 자동 검출하고, 오퍼레이터가 직선이 정확하게 검출된 것을 확인하고 나서 문자 인식 필드를 설정하는 방식이 있다.
또한, 본 발명의 출원인이 평성8년 11월 28일에 출원한 특원평8-317242호 공보에 기재된 바와 같이 문자 프레임을 포함하는 문서의 스캔한 이미지를 디스플레이 상에 표시하고, 인식 필드마다 좌단의 문자 프레임 안을 마우스로 클릭하고 이어서, 동일 필드의 우단의 문자 프레임 안을 클릭함으로써 자동적으로 필드를 지정하는 기술이 있다. 본 발명에서는, 문자 프레임 검출 프로그램을 실행한 후, 도 4에 도시한 바와 같이 검출된 문자 프레임의 재 설정, 속성 정보의 설정을 행할 수 있다.
이 필드의 속성을 설정하면 숫자 항목 중 숫자의 「0」을 잘못하여 영문자의 「O」라고 인식하는 것을 피할 수 있고, 또한 대비되는 집합이 적어지기 때문에, 고속으로 인식을 행할 수 있다고 하는 장점이 있다. 특히 수기 문자 인식에서는 숫자의 「0」과 영자의 「O」등 판별이 곤란한 문자도 존재하기 때문에, 속성 정보를 포함하는 문서 정의체를 이용하지 않아도 인식은 가능하지만, 실용적으로 감당할 수 있는 속도, 및 인식율을 얻는 것은 곤란하고, 또한 인식한 문자의 이후의 취급(주소, 성명, 금액 등)이 불명확해지기 쉽다. 따라서, 문서를 인식하는 처리는 통상 문서 정의체의 작성과 그것에 기초하는 실제 문서(actual document)의 인식이라는 2개의 단계로 구성되어 있다.
본 발명도, 이 OCR 처리에서의 문서 정의체의 작성에의 적용과 문서 식별/문자 인식에의 적용의 2개의 단계로 응용할 수 있다. 이하, 각 단계에서의 본 발명의 적용예를 설명한다.
C1. 문서 정의체 작성에의 적용
문서 정의체 작성 처리의 흐름은, 도 5에 도시된 바와 같이 이하의 순서가 된다.
1. 수평 선분의 추출(블럭 401)
2. 외접 직사각형의 형성(블럭 403)
3. 외접 직사각형을 기준으로 하여 각 문자 필드의 위치 및 인식 속성을 지정(블럭 405)
4. 외접 직사각형의 좌측 상부를 기준으로 하는 역회전에 의한 코너와 각 문자 필드의 스큐 보정(블럭 407)
5. 외접 직사각형의 보정 후의 4개의 코너의 위치를 보존(블럭 409)
6. 수평 선분 정보의 보존(블럭 411)
C1. 1. 수평 선분의 추출
우선, 수평 선분의 추출 처리로서, 문서의 이미지로부터 수평 방향의 주사에 의해 고속으로 처리할 수 있는 수평 선분만을 검출한다. 이 때, 문자 등을 형성하는 쓸모없는 짧은 선분이나 노이즈의 영향을 피하기 위해 수평 선분의 길이 및 굵기에 제한을 둔다. 예를 들면, 길이 7㎜ 이하 혹은 굵기 0.3㎜ 이하의 선분은 무시하는 것이다.
도 6은, 본 발명의 바람직한 실시예에서 사용되는 문서이고, 도 7은 이 수평선문의 추출 처리에 따라 추출된 선분의 개념도이다. 본 발명의 바람직한 실시예에서는 선분을 특정하는 정보로서 각 선분(선폭의 중앙)의 시점, 종점의 x, y 좌표, 선분 굵기의 정보를 선분 특정 정보로서 유지한다. 각 선분의 시점의 x, y 좌표, 선분의 길이, 굵기의 정보를 선분 특정 정보로서 유지하는 것도 유효하다.
C1. 2. 외접 직사각형의 형성
이어서, 추출된 수평 선분의 집합으로부터 문서에 유일한 평균 스큐 값을 계산하고, 그 각도를 갖는 외접 직사각형을 형성한다. 구체적으로는 선분 정보의 시점, 종점의 x, y 좌표로부터 각 선분의 기울기를 구하고, 그 평균치를 평균 스큐 값으로 한다.
또한, 각 선분의 시점의 최소 및 최대의 y좌표, 최소의 x좌표, 각 선분의 최대의 x 좌표의 정보로부터, 외접 직사각형의 정의 정보로서, 외접 직사각형의 4개의 코너의 점을 유지한다. 도 8은, 외접 직사각형의 형성 처리에 따라 작성된 외접 직사각형의 개념도이다.
본 발명의 한 형태에서는, 검출된 선분을 전부 포함하는 외접 직사각형을 기준으로 문서의 비교를 행하기 때문에, 생각할 수 있는 가장 오차가 적은 안정된 기준을 얻을 수 있다. 직사각형의 각에 수평 선분이 없는 경우(도 8의 정점(345)과 같이 외접 직사각형을 형성하는 수평 선분의 x 좌표가 수평 선분 x 좌표의 최대치 또는 최소치가 아닐 때)는, 수평 선분 x 좌표의 최대치 또는 최소치를 이용하여 직선방정식으로 산출한다.
이상, 「C1. 1. 수평 선분의 추출」 및 「C1. 2. 외접 직사각형의 형성」에서 추출된 정보는, 도 3에 도시된 바와 같이 각 문서에 링크한 외접 직사각형/수평 선분 정의 정보부(230)에 저장된다.
C1. 3. 외접 직사각형을 기준으로 하여 문자 필드의 위치 및 인식 속성을 지정 외접 직사각형의 좌측 상부를 원점으로 하여, 문자 프레임의 상대적인 위치를 결정한다. 본 발명의 실시예에서는 종래의 문서 정의체(200)로서, 문서/문자 프레임 정의 정보부(210)만이 먼저 작성되고, 그 생성되어 있는 문서 정의체(200)에, 외접 직사각형/수평 선분 정의 정보부(230)를 추가하고 있다. 이 형태에서는 각 문자 프레임의 개시 위치(223)의 x 좌표 y 좌표의 값이 외접 직사각형의 좌측 상부의 위치(241)의 x 좌표 y 좌표의 값에 의해 감산된다.
본 발명의 다른 한 형태에서는 문서/문자 프레임 정의 정보부(210)와, 외접 직사각형/수평 선분 정의 정보부(230)를 일련의 처리로 정의한다. 이 형태에서는, 먼저 추출된 외접 직사각형의 좌측 상부의 위치(241)를 기점으로 하여, 공지된 문자 프레임의 검출 프로그램을 실행하고, 문자 프레임의 개시 위치(223)의 추출을 행하고 있다.
또한, 외접 직사각형의 좌측 상부의 위치(241)와 우측 상부의 위치(243)를 페이지 마크라고 간주하여 사용함으로써, 종래의 페이지 마크를 사용한 프로그램을 큰 변경을 가하지 않고 사용할 수 있다.
C1. 4. 외접 직사각형의 좌측 상부를 기준으로 한 역회전에 의한 코너와 각 문자 필드의 스큐 보정
블럭(401)에서 요구한 각 선분의 시점, 종점의 정보로부터 수평 선분의 기울기(기울기의 평균치)를 산출하고, 이 기울기에 기초를 둔 회전각을 이용하고, 외접 직사각형의 나머지 3개의 코너 및 문자 프레임의 위치를 외접 직사각형의 좌측 상부를 기초로 계산 상의 역회전 보정을 한다. 이에 따라 산출된 외접 직사각형의 4코너의 위치 정보를 문서 정의체(200)의 외접 직사각형의 4코너의 위치 정보(241 ∼ 247)로 치환한다. 이와 같이, 이미지 그 자체를 회전시키지 않고, 소위 위치 정보의 맵핑만으로 이론 상의 스큐 보정을 행하므로 고속으로 처리를 할 수 있다. 또한, 문자 프레임의 개시 위치(223)를 스큐 보정 후의 정보로 치환한다.
C1. 5. 외접 직사각형의 보정 후의 4개의 코너의 위치를 보존
외접 직사각형의 보정 후의 4개의 코너의 위치를, 현행 페이지 마크의 위치 정보로서 보존한다. 이에 따라, 이 보정 후의 4코너의 위치 정보는 가상 페이지 마크로서 현행의 페이지 마크를 이용한 문자 프레임 검출 논리로 유용할 수 있다.
C1. 6. 수평 선분 정보의 보존
도 3에 도시된 바와 같이 검출한 수평 선분의 갯수 249, 개시 위치(231), 길이(233), 굵기(235) 등의 각종 정보를 문서 정의체(200)로 보존한다. 이 정보는, 문서 식별할 때에 사용한다.
C2. 문서 식별/문자 인식에의 적용
이어서, 문서 정의체(200)의 작성 후에 행해지는 실제의 문서(기입이 끝난 문서) 인식 처리에의 본 발명의 응용예를 설명한다. 본 발명의 바람직한 실시예에서의 문서 식별/문자 인식의 처리의 흐름은, 도 9에 도시된 바와 같이 아래와 같다.
1. 수평 선분의 추출(블럭 431)
2. 외접 직사각형의 형성(블럭 433)
3. 스큐의 이론적 보정(블럭 435)
4. 외접 직사각형의 유사도에 따른 압축(블럭 437)
5. 수평 선분 정보의 유사도에 의한 압축(블럭 439)
6. 정의체 정보를 바탕으로 문서 식별과 문자 인식(블럭 441)
이하의 설명에서는, 복수 종류의 문서에 각각 고유의 문서 정의체(200)가 정의되고 있고, 이들이 정의체 저장부(113)(도 2)에 저장되어 있고, 복수 종류의 입력 문서가 어디에 대응할지는 OCR 시스템은, 사전에 모르는 것으로 한다. 문서 정의체(200)의 파일명은, 정의체 파일 리스트에 등록되어 있다.
C2. 1. 수평 선분의 추출
문서 정의의 경우와 마찬가지로, 문서의 이미지로부터 수평 방향의 주사에 의해 고속으로 처리할 수 있는 수평 선분만을 검출한다. 이때도, 문자 등을 형성하는 쓸모없는 짧은 선분이나 노이즈의 영향을 피하기 위해 수평 선분의 길이 및 굵기에 제한을 둔다.
C2. 5. 외접 직사각형의 형성
문서 정의의 경우와 마찬가지로, 추출된 수평 선분의 집합으로부터 문서에 유일한 평균 스큐 값을 계산하고, 그 각도를 갖는 외접 직사각형을 형성한다.
C2. 3. 스큐의 이론적 보정
C1. 3과 C1. 4의 경우와 마찬가지로 문자 프레임의 위치 등을 검출하여 보정한다. 이에 따라 문서 정의시와 인식시의 스큐가 달라지거나 위치 편차가 있어도, 동일한 이상적인 이미지(ideal image) 상에서 서로 대응하도록 할 수 있다.
C2. 4. 외접 직사각형의 유사도에 의한 압축
형성된 외접 직사각형의 가로 세로의 길이를 문서 정의체(200)의 외접 직사각형의 4개의 코너의 정보(241∼247)로부터 산출된 외접 직사각형의 가로 세로의 길이와 비교한다. 유사도가 소정의 임계치보다 큰 경우는 다음 처리로 진행한다. 불합격인 경우에는 별도의 문서 정의체와 유사도 비교를 행한다(블럭 443, 445). 또, 본 발명의 바람직한 실시예에서는, 문서 상에 문서 ID가 존재하는지의 여부를 검사하고, 문서 ID가 존재하는 경우는 그것을 인식하고, 문서 정의체(200)의 문서 번호(213)와 비교함으로써 문서 식별을 완료한다.
C2. 5. 수평 선분 정보의 유사도에 의한 압축
추출된 수평 선분을 문서 정의체에 보존되어 있는 수평 선분 정보와 직사각형 내의 위치, 길이에 대해 비교한다. 유사도가 소정의 임계치보다 큰 경우에는 다음 수평 선분의 비교 처리로 진행한다. 본 발명의 바람직한 실시예에서는 최종적으로 갯수는 반드시 일치하지 않아도 되는 것으로 한다. 이것은, 기입된 문자 등에 의한 수평 선분의 오류 검출이나 검출 누설에 의한 영향을 적게 하기 위해서이다. 이들 유사도 비교에 합격하면 다음 처리로 진행한다. 불합격의 경우에는 별도의 문서 정의체와 유사도 비교를 행한다.
C2. 6. 정의체 정보를 바탕으로 문서 식별과 문자 인식
형성된 외접 직사각형의 4개의 코너의 위치 정보, 회전각, 문서 정의체의 문자 프레임의 위치 정보나 속성 정보 등을 기초로 문자 인식 처리를 행한다. (외접 직사각형의 4코너의 위치 정보는, 문서 정의의 경우와 마찬가지로 가상 페이지 마크로 함으로써, 현행의 페이지 마크로부터의 문자 프레임 검출 논리를 유용할 수 있다.) 이 후에 스캔한 문서와 추정한 문서가 일치하지 않은 경우에는 C2. 4로 되돌아가 다른 정의체를 조사한다. 이러한 에러는 수평 선분이 일치하고 있지만 문서가 서로 다른 경우 또는 수평 선분의 유사도를 결정하기 위한 임계치가 엄격하지 않은 경우에 발생될 수 있다.
블럭(437, 439, 441)의 조건을 만족하는 문서인 경우에는, 그 정의체의 문서와 일치하는 문서로서 OCR 처리된다. 현재의 문서가 문서 정의체(200)에 정의된 문서 중 어느 문서와도 일치하지 않는다면 그 문서는 인식 불능의 문서로 판단되어 에러 처리가 행해진다.
이상 설명한 바와 같이, 본 발명에 따르면 문서가 페이지 마크 혹은 기준 마크를 갖고 있지 않고, 또한 스캐너가 문서의 에지를 검출할 수 없는 경우에도 문자 프레임의 특정과 문자의 인식이 가능해진다.
또한, 본 발명에 따르면, 고속으로 인식할 수 있는 수평 성분만으로 형성한 외접 직사각형을 기준으로 하여 비트맵 이미지를 비교함으로써 비트맵 이미지의 식별 처리를 고속화할 수 있다.
또한, 본 발명에 따르면 이미지 그 자체를 스큐 보정하지 않고, 이상적인 이미지에 맵핑을 함으로써, 비트맵 이미지의 식별 처리를 고속화할 수 있다.
그리고, 본 발명에 따르면 외접 직사각형의 4개의 코너를 가상 페이지 마크로 처리함으로써, 종래의 페이지 마크를 기준으로 한 문자 프레임의 검출 논리를 가상 페이지 마크의 검출에 전용할 수 있다.
또한, 본 발명에 따르면, 외접 직사각형이나 수평 선분의 정의 정보를 기존의 문서 정의체에 추가할 수 있도록 함으로써, 종래의 문서 정의체의 정보를 그대로 이용할 수 있어 문서 정의체를 작성하는 오퍼레이터의 부담을 경감할 수 있다.

Claims (12)

  1. 비트맵 이미지의 종류를 특정하기 위해 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체(bitmap image definition set)를 갖는 비트맵 이미지 식별 장치 상에서 실행되는, 복수의 수평 선분 이미지(horizontal line segment image)를 포함하는 비트맵 이미지의 종류를 식별하는 방법에 있어서,
    (a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하는 단계와,
    (b) 상기 복수의 수평 선분의 특정 정보에 기초하여 외접 직사각형의 특정 정보를 추출하는 단계와,
    (c) 상기 추출된 외접 직사각형의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 외접 직사각형 특정 정보와 유사한지의 여부를 검사하는 단계
    를 포함하는 비트맵 이미지의 식별 방법.
  2. 비트맵 이미지의 종류를 특정하기 위해 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체를 갖는 비트맵 이미지 식별 장치 상에서 실행되는, 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 방법에 있어서,
    (a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하는 단계와,
    (b) 상기 추출된 복수의 수평 선분의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 수평 선분의 특정 정보와 유사한지의 여부를 검사하는 단계
    를 포함하는 비트맵 이미지의 식별 방법.
  3. 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하기 위한 정보의 취득 방법에 있어서,
    (a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하는 단계와,
    (b) 상기 복수의 수평 선분의 특정 정보에 기초하여 상기 복수의 수평 선분중 2개의 적어도 일부분을 그 수평변(horizontal side)으로 포함하는 구형(rectangle)의 특정 정보를 추출하는 단계와,
    (c) 상기 복수의 수평 선분의 특정 정보로부터 계산된 스큐 정보(skew information)에 기초하여 상기 구형의 특정 정보를 변환하는 단계와,
    (d) 상기 변환된 구형의 정의 정보를 저장하는 단계
    를 포함하는 비트맵 이미지의 식별을 행하기 위한 정보의 취득 방법.
  4. 비트맵 이미지에 포함되는 문자 프레임의 위치를 인식하는 방법에 있어서,
    (a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하는 단계와,
    (b) 상기 복수의 수평 선분의 특정 정보에 기초하여 외접 직사각형의 특정 정보를 추출하는 단계와,
    (c) 상기 비트맵 이미지에 포함되는 문자 프레임의 특정 정보를 추출하는 단계와,
    (d) 상기 추출된 문자 프레임의 특정 정보를 상기 외접 직사각형의 하나의 정점(vertex)을 기준으로 하는 위치 정보로서 저장하는 단계
    를 포함하는 문자 프레임의 식별 방법.
  5. 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 비트맵 이미지 식별 장치에 있어서,
    (a) 복수의 수평 선분 이미지를 포함하는 비트맵 이미지를 유지하는 이미지 입력부와,
    (b) 비트맵 이미지의 종류를 특정하는 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체와,
    (c) (c1) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하고,
    (c2) 상기 복수의 수평 선분의 특정 정보에 기초하여 외접 직사각형의 특정 정보를 추출하고,
    (c3) 상기 추출된 외접 직사각형의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 외접 직사각형 특정 정보와 유사한지의 여부를 검사하는 이미지 해석부
    를 포함하는 비트맵 이미지 식별 장치.
  6. 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 비트맵 이미지 식별 장치에 있어서,
    (a) 복수의 수평 선분 이미지를 포함하는 비트맵 이미지를 유지하는 이미지 입력부와,
    (b) 비트맵 이미지의 종류를 특정하는 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체와,
    (c) (c1) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하고,
    (c2) 상기 추출된 복수의 수평 선분의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 수평 선분의 특정 정보와 유사한지의 여부를 검사하는 이미지 해석부
    를 포함하는 비트맵 이미지 식별 장치.
  7. 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하기 위한 정보를 취득하는 비트맵 이미지 처리 장치에 있어서,
    (a) (a1) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하고,
    (a2) 상기 복수의 수평 선분의 특정 정보에 기초하여 상기 복수의 수평 선분 중 2개의 적어도 일부분을 그 수평변으로 포함하는 구형의 특정 정보를 추출하고,
    (a3) 상기 복수의 수평 선분의 특정 정보로부터 계산된 스큐 정보에 기초하여 상기 구형의 특정 정보를 변환하는 이미지 해석부와,
    (b) 상기 변환된 구형의 정의 정보를 저장하는 비트맵 이미지 정의체
    를 포함하는 비트맵 이미지 처리 장치.
  8. 비트맵 이미지에 포함되는 문자 프레임의 위치를 인식하는 비트맵 이미지 처리 장치에 있어서,
    (a) (a1) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하고,
    (a2) 상기 복수의 수평 선분의 특정 정보에 기초하여 외접 직사각형의 특정 정보를 추출하고,
    (a3) 상기 비트맵 이미지에 포함되는 문자 프레임의 특정 정보를 추출하는 이미지 해석부와,
    (b) 상기 추출된 문자 프레임의 특정 정보를 상기 외접 직사각형의 하나인 정점을 기준으로 한 위치 정보로서 저장하는 비트맵 이미지 정의체
    를 포함하는 비트맵 이미지 처리 장치.
  9. 비트맵 이미지의 종류를 특정하기 위해 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체를 갖는 비트맵 이미지 식별 장치 상에서 실행되는, 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 이미지 처리 프로그램을 저장한 기록 매체에 있어서,
    상기 이미지 처리 프로그램은
    (a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하도록 상기 비트맵 이미지 식별 장치에 지시하기 위한 프로그램 코드와,
    (b) 상기 복수의 수평 선분의 특정 정보에 기초하여 외접 직사각형의 특정 정보를 추출하도록 상기 비트맵 이미지 식별 장치에 지시하기 위한 프로그램 코드와,
    (c) 상기 추출된 외접 직사각형의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 외접 직사각형 특정 정보와 유사한지의 여부를 검사하도록 상기 비트맵 이미지 식별 장치에 지시하기 위한 프로그램 코드
    를 포함하는 기록 매체.
  10. 비트맵 이미지의 종류를 특정하기 위해 복수의 비트맵 이미지의 식별 정보를 포함하는 비트맵 이미지 정의체를 갖는 비트맵 이미지 식별 장치 상에서 실행되는, 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하는 이미지 처리 프로그램을 저장한 기록 매체에 있어서,
    상기 이미지 처리 프로그램은
    (a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하도록 상기 비트맵 이미지 식별 장치에 지시하기 위한 프로그램 코드와,
    (b) 상기 추출된 복수의 수평 선분의 특정 정보가 미리 등록된 비트맵 이미지 정의체의 수평 선분의 특정 정보와 유사한지의 여부를 검사하도록 상기 비트맵 이미지 식별 장치에 지시하기 위한 프로그램 코드
    를 포함하는 기록 매체.
  11. 비트맵 이미지 처리 장치에서 실행되고, 복수의 수평 선분 이미지를 포함하는 비트맵 이미지의 종류를 식별하기 위한 정보를 취득하는 이미지 처리 프로그램을 저장한 기록 매체에 있어서,
    상기 이미지 처리 프로그램은
    (a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
    (b) 상기 복수의 수평 선분의 특정 정보에 기초하여 상기 복수의 수평 선분 중 2개의 적어도 일부분을 그 수평변으로 포함하는 구형의 특정 정보를 추출하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
    (c) 상기 복수의 수평 선분의 특정 정보로부터 계산된 스큐 정보에 기초하여 상기 구형의 특정 정보를 변환하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
    (d) 상기 변환된 구형의 정의 정보를 저장하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드
    를 포함하는 기록 매체.
  12. 비트맵 이미지 처리 장치에 있어서 실행되고, 비트맵 이미지에 포함되는 문자 프레임의 위치를 인식하는 이미지 처리 프로그램을 저장한 기록 매체에 있어서,
    상기 이미지 처리 프로그램은
    (a) 상기 비트맵 이미지를 주사함으로써 복수의 수평 선분의 특정 정보를 추출하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
    (b) 상기 복수의 수평 선분의 특정 정보에 기초하여 외접 직사각형의 특정 정보를 추출하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
    (c) 상기 비트맵 이미지에 포함되는 문자 프레임의 특정 정보를 추출하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드와,
    (d) 상기 추출된 문자 프레임의 특정 정보를 상기 외접 직사각형의 하나의 정점을 기준으로 하는 위치 정보로서 저장하도록 상기 비트맵 이미지 처리 장치에 지시하기 위한 프로그램 코드
    를 포함하는 기록 매체.
KR1019980036901A 1997-10-17 1998-09-08 비트맵이미지의처리방법및처리장치,비트맵이미지의처리를행하는이미지처리프로그램을저장한기억매체 KR100315318B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP9285709A JPH11143986A (ja) 1997-10-17 1997-10-17 ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体
JP97-285709 1997-10-17

Publications (2)

Publication Number Publication Date
KR19990036622A true KR19990036622A (ko) 1999-05-25
KR100315318B1 KR100315318B1 (ko) 2002-01-12

Family

ID=17695020

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980036901A KR100315318B1 (ko) 1997-10-17 1998-09-08 비트맵이미지의처리방법및처리장치,비트맵이미지의처리를행하는이미지처리프로그램을저장한기억매체

Country Status (3)

Country Link
US (1) US6356655B1 (ko)
JP (1) JPH11143986A (ko)
KR (1) KR100315318B1 (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718059B1 (en) * 1999-12-10 2004-04-06 Canon Kabushiki Kaisha Block selection-based image processing
JP4401560B2 (ja) * 1999-12-10 2010-01-20 キヤノン株式会社 画像処理装置、画像処理方法、及び記憶媒体
JP4416890B2 (ja) 1999-12-20 2010-02-17 富士通株式会社 帳票識別装置
US6694065B2 (en) 2000-03-10 2004-02-17 Fujitsu Limited Image collating apparatus and image collating method
EP1310904A4 (en) * 2000-06-02 2007-03-28 Japan Science & Tech Agency DOCUMENT PROCESSING METHOD, RECORDING MEDIA RECORDING A DOCUMENT PROCESSING PROGRAM AND DOCUMENT PROCESSOR
JP3864246B2 (ja) * 2001-05-30 2006-12-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 画像処理方法、画像処理システムおよびプログラム
US7099508B2 (en) * 2001-11-29 2006-08-29 Kabushiki Kaisha Toshiba Document identification device, document definition method and document identification method
KR100449486B1 (ko) * 2001-12-29 2004-09-22 한국전자통신연구원 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
CA2375355A1 (en) * 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
US7925987B2 (en) * 2002-05-14 2011-04-12 Microsoft Corporation Entry and editing of electronic ink
US7158675B2 (en) * 2002-05-14 2007-01-02 Microsoft Corporation Interfacing with ink
US8166388B2 (en) 2002-05-14 2012-04-24 Microsoft Corporation Overlaying electronic ink
US20030214553A1 (en) * 2002-05-14 2003-11-20 Microsoft Corporation Ink regions in an overlay control
US7283669B2 (en) * 2003-01-29 2007-10-16 Lockheed Martin Corporation Fine segmentation refinement for an optical character recognition system
JP2005151282A (ja) * 2003-11-18 2005-06-09 Fuji Xerox Co Ltd 画像処理装置、画像処理方法、およびプログラム
US20070168382A1 (en) * 2006-01-03 2007-07-19 Michael Tillberg Document analysis system for integration of paper records into a searchable electronic database
US8045798B2 (en) * 2007-08-30 2011-10-25 Xerox Corporation Features generation and spotting methods and systems using same
US8014603B2 (en) * 2007-08-30 2011-09-06 Xerox Corporation System and method for characterizing handwritten or typed words in a document
US8340428B2 (en) 2008-04-02 2012-12-25 Xerox Corporation Unsupervised writer style adaptation for handwritten word spotting
JP5278093B2 (ja) * 2009-03-26 2013-09-04 大日本印刷株式会社 記事関連情報提供方法、装置、プログラム、記録媒体
WO2010129330A1 (en) * 2009-04-28 2010-11-11 Perceptive Software, Inc. Automatic forms processing systems and methods
CN102196112B (zh) * 2010-03-01 2014-09-24 佳能株式会社 用于检测页边界的方法和装置
WO2013140563A1 (ja) * 2012-03-22 2013-09-26 グローリー株式会社 紙葉類記番号読取システム及び紙葉類記番号読取方法
JP5844698B2 (ja) * 2012-07-30 2016-01-20 富士通フロンテック株式会社 文字認識装置
CN104616009B (zh) 2015-02-13 2018-05-18 广州广电运通金融电子股份有限公司 一种字符切割识别方法
JP6520279B2 (ja) * 2015-03-24 2019-05-29 富士ゼロックス株式会社 処理装置、画像処理システム、およびプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61289476A (ja) 1985-06-18 1986-12-19 Fujitsu Ltd 文字読取装置のフオ−マツト生成方式
JPH0223492A (ja) 1988-07-13 1990-01-25 Toshiba Corp 光学的文字読取装置
US5305396A (en) * 1992-04-17 1994-04-19 International Business Machines Corporation Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
JP3272842B2 (ja) * 1992-12-17 2002-04-08 ゼロックス・コーポレーション プロセッサベースの判定方法
JPH0721309A (ja) * 1993-06-30 1995-01-24 Matsushita Electric Ind Co Ltd 文書認識装置
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JP3338537B2 (ja) * 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置
US5835640A (en) * 1995-05-03 1998-11-10 Seiko Epson Corporation Method and apparatus for identifying and fixing horizontal and vertical lines in digitized images
JP3586949B2 (ja) 1995-11-16 2004-11-10 松下電器産業株式会社 帳票認識装置
JPH09185675A (ja) 1995-12-28 1997-07-15 Hitachi Ltd 様式解析方法
US5923782A (en) * 1996-08-01 1999-07-13 Nynex Science & Technology, Inc. System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings

Also Published As

Publication number Publication date
US6356655B1 (en) 2002-03-12
JPH11143986A (ja) 1999-05-28
KR100315318B1 (ko) 2002-01-12

Similar Documents

Publication Publication Date Title
KR100315318B1 (ko) 비트맵이미지의처리방법및처리장치,비트맵이미지의처리를행하는이미지처리프로그램을저장한기억매체
US5410611A (en) Method for identifying word bounding boxes in text
US5539841A (en) Method for comparing image sections to determine similarity therebetween
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
KR100658119B1 (ko) 문자 인식 장치 및 방법
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US5335290A (en) Segmentation of text, picture and lines of a document image
JP3805005B2 (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
JP2940936B2 (ja) 表領域識別方法
JP3113827B2 (ja) 矩形オブジェクトの認識方法及び認識装置
JP5616308B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法
US6614929B1 (en) Apparatus and method of detecting character writing area in document, and document format generating apparatus
JP3864246B2 (ja) 画像処理方法、画像処理システムおよびプログラム
EP1017011A2 (en) Block selection of table features
JP2010250425A (ja) 下線除去装置
US6947596B2 (en) Character recognition method, program and recording medium
US6968501B2 (en) Document format identification apparatus and method
JPH11219409A (ja) 文書読取装置
JPH07230526A (ja) 文字読取装置
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
US11710331B2 (en) Systems and methods for separating ligature characters in digitized document images
JP7417116B2 (ja) 情報処理システム、情報処理方法、プログラム
JP3186712B2 (ja) 文書読取装置
JP3000480B2 (ja) 文字領域区切り検出方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20040916

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee