KR0167616B1 - 화상 처리 장치 및 방법 - Google Patents

화상 처리 장치 및 방법 Download PDF

Info

Publication number
KR0167616B1
KR0167616B1 KR1019940033248A KR19940033248A KR0167616B1 KR 0167616 B1 KR0167616 B1 KR 0167616B1 KR 1019940033248 A KR1019940033248 A KR 1019940033248A KR 19940033248 A KR19940033248 A KR 19940033248A KR 0167616 B1 KR0167616 B1 KR 0167616B1
Authority
KR
South Korea
Prior art keywords
diffusion
image
dots
image processing
characters
Prior art date
Application number
KR1019940033248A
Other languages
English (en)
Other versions
KR950020289A (ko
Inventor
다까시 하라다
가즈또시 시마다
에이사꾸 다쯔미
시게끼 모리
가즈히로 마쯔바야시
시니찌 스나까와
가쯔히꼬 나가사끼
Original Assignee
미따라이 하지메
캐논 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 미따라이 하지메, 캐논 가부시끼가이샤 filed Critical 미따라이 하지메
Publication of KR950020289A publication Critical patent/KR950020289A/ko
Application granted granted Critical
Publication of KR0167616B1 publication Critical patent/KR0167616B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

스캐너 등에 의해 입력되는, 문자들과 선들을 포함하는 화상은 2치화되고, 메모리에 저장된다. 확산 처리는 선정된 조건이 만족될 때까지, 메모리에 저장된 유의 비트들의 그룹들에 반복해서 적용된다. 이 처리 후에, 확산된 화상은 선들을 제거하기 위해 적어도 확산 처리가 반복되는 회수보다 더 많은 회수만큼 수축된다. 그 결과로, 문자들은 남아 있는 유의 도트들로 구성되는 그룹들이 존재하는 영역에 존재하도록 결정되고, 그 후 문자들은 남아 있는 유의 도트들로 구성되는 그룹들의 영역을 기초로 해서 입력 화상으로부터 분리된다.

Description

화상 처리 장치 및 방법
제1도는 제1실시예에 따른 화상 처리 장치의 블록도.
제2도는 제1실시예에 따른 처리를 도시한 플로우챠트.
제3도는 제1실시예에 따른 확산 처리(thickening process)에서 화상의 변화를 도시한 도면.
제4도는 제1실시예에 따른 수축 처리(thinning process)에서 화상의 변화를 도시한 도면.
제5도는 제2실시예에 따른 처리를 도시한 플로우챠트.
제6도는 제3실시예에 따른 처리를 도시한 플로우챠트.
제7도는 확산 처리가 반복되는 회수를 설정하기 위한 표의 한 예.
제8도는 다른 실시예에 따른 화상 처리 장치의 구성을 도시한 블럭도.
* 도면의 주요부분에 대한 부호의 설명
1 : 스캐너 2 : RAM
3 : CUP 4 : 어드레스 버스
5 : 데이터 버스 6 : 프로그램 메모리
7 : VRAM 8 : 표시 장치
본 발명은 화상 처리 장치 및 방법, 특히 화상에서 문자들과 선들을 분리시킬 수 있는 화상 처리 장치 및 방법에 관한 것이다.
스캐너 또는 그와 같은 것에 의해 판독되는, 지도와 도면과 같은 문자들과 선들을 갖고 있는 원고 화상이 컴퓨터에 의해, 문자들에 대해 처리, 예를 들면, 편집 및/또는 검색된다고 가정한다. 종래에, 원고 화상은 2치화, 레이블(label) 및 수축 등이 되고, 레이블된 픽셀 그룹의 수와 길이가 결정되며, 그 후, 상대적으로 많은 수의 픽셀들을 갖고 있는(긴 길이를 갖는) 레이블된 픽셀 그룹들은 선들로 인식되고, 상대적으로 짧은 길이의 레이블된 픽셀 그룹들은 문자들로 인식된다. 따라서 선들과 문자들 모두 동시에 추출된다.
상술된 종래의 방법에서, 문자 및 선의 인식과 동시에 추출이 병행으로 수행된다. 따라서, 처리를 위한 준비 시간이 꽤 오래 걸린다는 문제가 발생한다.
본 발명은 상술된 상황을 고려하여 이루어진 것으로, 그 목적은 선들과 문자들을 갖고 있는 화상이 입력되었을 때 문자들과 선들을 효율적으로 분리시킬 수 있는 화상 처리 장치 및 방법을 제공하는 것이다.
본 발명에 따르면, 상술된 목적은 각각의 확산 처리 후에 새롭게 추가된 도트들이 선정된 조건을 만족할 때까지 입력 화상의 유의 도트 그룹들을 반복해서 확산하기 위한 확산 수단; 확산 처리가 반복되는 회수보다 적어도 많은 회수만큼, 확산 수단에 의해 확산된 화상을 수축하기 위한 수축 수단; 및 수축 처리 후에 남겨지는, 유의 도트들의 영역을 문자 영역으로 결정하기 위한 결정 수단을 포함하는, 문자들과 선들을 포함하는 화상을 입력하고 문자들을 분리하는 화상 처리 장치를 제공함으로써 달성된다.
게다가, 상술된 목적은 각각의 확산 단계 후에 새롭게 추가된 도트들이 선정된 조건을 만족할 때까지 입력 화상의 유의 도트 그룹들을 반복해서 확산하는 단계; 확산 단계가 반복되는 회수보다 적어도 많은 회수만큼, 확산 단계에서 확산된 화상을 수축하는 단계; 및 수축 단계 후에 남겨지는, 유의 도트들의 영역을 문자 영역으로 결정하는 단계를 포함하는, 문자들과 선들을 포함하는 화상을 입력하고 문자들을 분리하는 화상 처리 방법을 제공함으로써 달성된다.
상술된 바와 같이 본 발명의 화상 처리 장치 및 방법의 구성에 따르면, 확산 처리는 각각의 확산 처리 후에 새롭게 추가된 유의 도트들의 수가 선정된 조건을 만족할 때까지 입력 화상에 대해서 반복해서 수행된다. 다음으로, 수축 처리는 선들을 제거하기 위해, 확산 처리가 반복되는 회수 보다 많은 회수만큼 반복된다. 그 결과로, 남아 있는 유의 픽셀들이 존재하는 영역들은 문자 화상 영역들로 결정된다.
본 발명의 상술된 목적과 다른 목적 및 특징은 도면을 통하여 동일하거나 유사한 부분에 유사한 참조부호를 병기한 첨부된 도면을 참조한 다음의 설명으로부터 명확히 파악될 것이다.
이하, 첨부 도면을 참조하여 본 발명을 상세히 설명하고자 한다.
제1도는 제1실시예에 따른 화상 처리 장치의 구성을 도시한 것이고, 제2도는 제1도의 CPU(3)에 의해 수행되는 처리 순서를 도시한 것이며, 처리를 제어하는 프로그램은 제1도의 프로그램 메모리(6)에 저장된다.
제1도에서, 참조 번호(1)은 원고 화상을 판독하기 위한 화상 입력 장치로서의 스캐너를 지시하고, 참조 번호(2)는 스캐너(1)로부터 전송되는, 화상 데이터와 같은 다양한 종류의 데이터를 일시적으로 저장하기 위한 RAM을 지시하며, 참조 번호(3)은 화상 입력 장치의 전체 동작을 제어하기 위한 CPU를 지시하는데, CUP(3)은 프로그램 메모리(6)에 저장된 제어 프로그램을 기초로 한 제2도에 도시된 처리를 제어한다. 또한, 참조 번호(4)는 RAM(2)에 저장된 데이터를 액세스하는 어드레스를 지정하기 위한 어드레스 버스를 지시하고; 참조 번호(5)는 어드레스 버스(4)에 의해 지정되는 어드레스의 데이터를 입력 및 출력하고, 스캐너(1)로부터의 데이터를 RAM(2) 또는 CUP(3)으로 전송하기 위한 데이터 버스를 지시하며; 참조 번호(7)은 표시 장치(8)상에 표시될 데이터를 저장하기 위한 VRAM을 지시한다.
제1실시예에 따른 CUP(3)의 동작은 제2도를 참조하여 설명하기로 한다.
먼저, S1 단계에서, 화상 데이터는 스캐너(1)에 의해 판독되고, RAM(2)에 저장된다. 다음, S2 단계에서, 화상 데이터가 2치화(binarized)된다. S3 단계에서, 확산 처리가 다음의 함수 (1)에 따라, S2 단계에서 2치화된 화상 데이터의 임의 픽셀 fij에 대해 실시된다.
여기서 “1”은 유의 도트(significant dots), 즉 프린트 도트를 가리킨다.
이 처리는 문자열을 럼프(lump)로 결합함과 동시에 선들의 폭을 더 확산시킨다. 이 처리에서 선들 및 문자들의 변화는 제3도에 도시되어 있다.
이 실시예에서, 선들은 1도트의 폭, 75도트의 길이를 가지고, 선들 사이의 거리는 4도트라고 가정된다. 확산 처리가 한번 수행된 후에, 선들의 폭은 3도트가 되고 (2도트를 얻고), 3개의 선들에 추가된 유의 도트들의 전체 수는 468(= {75 × 2 + (1 + 2) × 2} × 3}이다.
확산 처리가 반복된 후에, 이미 확산된 선들에 새롭게 추가된 유의 도트들의 수는 480(= {(75 × 2) ×2 + (3 + 2) × 2} × 3}이다. 확산 처리를 2번 수행한 후에, 3개의 선들은 제3도의 하부에 도시된 바와 같이 하나의 럼프가 됨을 주의하라.
더욱이, 한번 더 확산 처리가 수행되면, 새롭게 추가된 유의 도트들의 수는 188(= {(75 + 2 + 2) × 2) +15 × 2}이다. 따라서 새롭게 추가된 유의 도트들의 수는 2개 이전 확산 처리와 비교하여 감소한다.
따라서, 확산 처리는 현재의 확산 처리 동안 추가된 도트들의 수가 이전의 확산 처리 동안 추가된 도트들의 수 보다 적을 때 2회 전에 종료된다. 요구되는 회수만큼 확산 처리를 반복한 후에, 얻어진 화상 데이터가 S3 단계에서 출력된다.
오직 하나의 선이 존재할 경우에, 새롭게 추가된 유의 도트들의 수가 각각의 확산 처리 후에 결코 감소하지 않기 때문에, 처리는 선정된 회수만큼 반복되어야만 한다.
S4 단계에서, 다음 식 (2)에 기초하여 S3 단계에서 출력되는 화상 데이터의 임의의 도트, fij에 대해서 수축 처리가 수행된다.
여기서 수축 처리 전의 fij가“1”이고 인접하는 8개의 픽셀들이 모두“1”이라면, fij는“1”이 된다.
이 동작을 수행함으로써, 선들의 폭은 수축될 수 있다. 화상의 변화는 제4도에 도시되어 있다. S3 단계의 처리와는 달리, 제거된 유의 도트들의 수가 S4 단계에서 계산된다. 수축 처리를 3회 반복한 후에, 럼프된 문자들의 유의 도트들만이 남겨져서, 처리가 1회 더 반복된다면, 이전의 처리 후의 제거된 유의 도트들의 수와 비교하여 더 적은 수의 유의 도트들이 제거된다. 따라서, 새롭게 제거된 유의 도트들의 수가 급격히 감소할 때까지 수축 처리가 반복된다.
그 결과로, 확산 처리 및 수축 처리를 반복하는 회수를 각각 m 및 n으로 한다면, m n일 때, 선들은 전체적으로 사라진다. 예를 들면, m = n + α(α = 1, 2, ...)와 같이, n은 m에 기초하여 결정된다는 것에 유의한다. 게다가, 확산 및 수축 처리 후에 문자열을 나타내는 결합된 유의 도트들의 영역은 원고 화상에서 대응하는 문자열 영역 보다 더 작다. 따라서, 확산 처리는 S5 단계에서 (n - m)회 반복된다.
다음으로, 유의 도트들의 럼프가 S5 단계에서 출력된 화상 데이터로부터 추출되고, 그 후 럼프를 둘러싸는 직사각형 영역이 S6 단계에서 결정된다, 특히, S5 단계에서 확산 처리 후에 얻어진 화상 데이터와 입력 직후 2치화된 화상 데이터 사이의 “AND” 논리 연산이 수행된다.
S7 단계에서, 결정된 직사각형 영역에 대응하는 직사각형 영역이 원고 화상 데이터로부터 추출되고, 그 후 문자들이 추출된 직사각형 영역으로부터 추출된다. 추출된 영역에서 문자들을 분리하기 위해, 먼저, 프린트 도트들의 수가 수직 및 수평 방향으로 계산되고, 계산된 수에 기초하여 히스토그램이 만들어진다. 그 후, 히스토그램에서 국부적인 최소수들을 갖고 있는 영역들이 문자들 사이의 공간으로서 결정되고, 전역 및 국부적인 최대수들을 갖고 있는 영역들은 문자로서 결정된다.
제1실시예에서, 먼저 입력 원고 화상 데이터가 RAM(2)에 저장된 후, 2치화되는 것에 유의하여야 한다. 그러나, RAM(2)이 2치화된 화상을 저장하도록, 스캐너(1)로부터 화상 데이터를 선정된 임계값과 비교함으로써 입력동안 원고 화상은 2치화 될 수 있다.
더욱이, 상술된 예에 따르면, 문자들을 나타내는 유의 도트들의 럼프들은 확산 처리 및 수축 처리를 반복함으로써 남겨진다. 제1실시예에 따른 처리를 달성하기 위해서는, 처리되지 않은 원고 화상 데이터를 저장하기 위한 RAM(2)에 추가적인 메모리 공간이 필요하거나 또는 원고 화상이 다시 판독될 필요가 있다. 그러므로, 원고 화상은 일시적으로 저가 하드디스크 등에 저장될 수 있고, 그 후 상술된 처리를 수행함으로써 RAM(2) 내의 문자 영역에 대한 필요한 정보들이 추출된 후에, 문자들을 분리 및 인식하기 위해 RAM(2)에 원고 화상이 기록될 수 있다. 하드디스크에 원고 화상을 저장하는 이러한 대안적인 방법은 본 실시예에 적용될 수 있다.
상술된 제1실시예에 따르면, 문자 영역들은 간간한 처리들을 수행함으로써 문자들과 선 모두를 혼합해서 포함하는 원고 화상 데이터로부터 고속으로 추출될 수 있다.
따라서, 상술된 구성이 이용된 문자 인식 장치를 사용함으로써, 문자 화상들의 추출을 시작하기 전의 준비 시간(preperation time)이 단축되어, 조작자의 관점에서 볼 때 문자 인식이 고속으로 수행된다.
제2실시예는 제5도의 플로우챠트를 참조하여 설명된다. 제5도의 플로우챠트에 기초한 프로그램이 제2실시예에 따른 처리를 수행하기 위해 제1도의 프로그램 메모리(6)에 저장된다는 것을 알아야 한다.
먼저, S11 단계에서, 화상 데이터가 스캐너(1)에 의해 판독되고, RAM(2)에 저장된다. 그 후, S12 단계에서, 입력 화상 데이터가 2치화된다. S13 단계에서, 확산 처리가 다음 식 (3)에 기초하여 S12 단계에서 출력되는 2치화된 화상 데이터의 임의 도트, fij에 대해 수행된다.(도트 위치의 2치화된 데이터, gij가 결정된다).
확산 처리가 수평 방향으로만 수행되어, 수평 방향으로 늘어선 문자들이 결합됨은 물론 수직선들의 폭은 원고 화상 데이터에 있는 수직선들 보다 더 두껍게 된다. 확산 처리를 반복하는 회수는 제1실시예에 설명된 것과 같은 방식으로 결정된다. 다음으로, S14 단계에서, 다음 식 (4)에 기초하여 S13 단계에서 출력되는 화상 데이터의 임의 도트, fij에 대해 수축 처리가 적용된다.
여기서 수축 처리 전의 fij가“1”이고 오른쪽 또는 왼쪽 픽셀들이 모두“1”이라면, fij는“1”이 된다.
수축 처리를 반복하는 회수는 제1실시예에 설명된 것과 같은 방식으로 결정된다. 식 (3)에 기초한 확산 처리 및 식 (4)에 기초한 수축 처리를 반복하는 회수가 각각, m1 및 n1 이라면, m1 n1일 때, 수직선들은 사라진다. 수축 처리 후의 화상에 있는 문자열을 나타내는 결합된 유의 도트들의 크기는 원고 화상 데이터에서 문자들을 나타내는 영역 보다 더 작다. 따라서, S15 단계에서, 식 (3)에 기초한 확산 처리가 처리된 화상에 대해 (n1 - m1)회 수행된다.
그 후, S16 단계에서, 확산 처리가 다음의 식 (5)에 기초하여 S15 단계에서 출력되는 화상 데이터의 임의 도트, fij에 대해 수행된다. 확산 처리를 반복하는 회수는 S13 단계에서와 동일한 방법으로 결정된다는 것을 알아야 한다.
확산 처리가 수직 방향으로 수행되고, 수직 방향으로 눌어선 문자들이 결합됨과 동시에 수평 선들의 폭은 원고 화상 데이터에 있는 수평 선들 보다 더 두껍게 된다. 다음 S17 단계에서, 다음 식 (6)에 기초하여 S16 단계에서 출력되는 화상 데이터의 임의 도트, fij에 대해 수축 처리가 수행된다.
여기서 수축 처리 전의 fij가“1”이고 위 또는 아래 픽셀들이 모두“1”이라면, fij는“1”이 된다.
수축 처리를 반복하는 회수는 S14 단계에서 설명된 것과 같은 방식으로 결정된다. 식 (5)에 기초한 확산 처리 및 식 (6)에 기초한 수축 처리를 반복하는 회수가 각각, m2 및 n2이면, m2 n2일 때, 수평선들은 사라진다. 확산 및 수축 처리 후의 화상 데이터에 있는 문자열을 나타내는 결합된 유의 도트들의 크기는 원고 화상 데이터에 있는 문자들을 나타내는 영역 보다 더 작다. 따라서, S18 단계에서, 식 (5)에 기초한 확산 처리가 처리된 화상에 대해 (n2 - m2)회 수행된다. 다음으로, S19 단계에서, S18 단계에서 출력되는 화상 데이터에 있는 결합된 유의 도트들이 추출되고, S19 단계에서 결합된 도트들을 둘러싸는 직사각형 영역들이 결정된다.
S20 단계에서, 상기 검출된 직사각형 영역에 대응하는 직사각형 영역이 원고 화상 데이터로부터 추출된 후, 상기 추출된 직사각형 영역으로부터 문자들이 추출된다. 문자들을 분리하는 방법은 제1실시예에 기술된 방법과 동일하다.
상술된 제2실시예에 따르면, 수직 및 수평 방향으로 확산 및 수축 처리들을 수행함으로써, 제1실시예와 비교하여 유의 도트들의 추가 및 제거가 수직 및 수평 방향으로만 수행되기 때문에, 문자들을 나타내는 영역들이 더 빠르게 추출된다.
제3실시예가 제6도를 참조하여 설명된다. 제3 실시예에서, 다음 과정을 제어하는 프로그램도 역시 제2실시예에서와 같이 프로그램 메모리(6)에 저장된다.
제3실시예에서, 문자들을 포함하는 직사각형 영역이 제2실시예에서 설명된 방법과 동일한 방법으로 S21 내지 S29 단계(제6도의 S21 내지 S29단계는 제5도의 S11 내지 S19 단계에 각각 대응한다)에서 원고 화상으로부터 추출된다. 다음으로, S30 단계에서, 동일하고 유일한 숫자가 직사각형 영역 내부의 다음 유의 픽셀에 결합된 각각의 유의 픽셀들에 할당(레이블링)된다. S31 단계에서, 문자들이 각각의 레이블된 픽셀들의 그룹의 상대적인 위치를 고려함으로써 추출된다.
예를 들면, 문자 화상, “aj”를 레이블하기 위해,“1”이“a”를 구성하는 픽셀들에 할당되고,“2”가“j”의 점(“j”의 상부)을 구성하는 픽셀에 할당되며,“3”이 상기점을 제외한“j”의 하부를 구성하는 픽셀들에 할당된다.
그 후, 각각의 레이블된 픽셀 그룹을 둘러싸는 사각형들과 각각의 레이블된 픽셀 그룹의 중심들이 결정된다. 그 결과로서, 레이블된 그룹들(2 및 3)의 중심들 사이의 거리가 레이블된 그룹(1)과 레이블된 그룹(2 또는 3)의 중심들 사이의 거리 보다 훨씬 작기 때문에, 레이블된 그룹(2)와 레이블된 그룹(3)을 형성하는 픽셀들이 동일한 문자가 되도록 결정된다. 같은 방식으로, 레이블된 그룹(1)의 중심들과 레이블된 그룹들(2 및 3)의 중심들이 많이 떨어져 있기 때문에, 레이블된 그룹(1)을 형성하는 픽셀들이 동일한 문자들로 간주된다. 따라서, 각각의 문자가 추출된다. 특히, 임계값이 설정되고, 이 레이블된 그룹과 다른 레이블된 그룹들의 중심들 사이의 거리들이 임계값 보다 더 크다면, 단일 문자를 구성하는 레이블된 그룹의 픽셀들이 결정된다.
원고 화상 데이터로부터의 문자들을 포함하는 직사각형 영역들을 추출하기 위해, 제1실시예에서 S1 내지 S6 단계에 도시된 처리가 이용될 수 있다는 것을 알아야 한다.
2치화는 유의 픽셀들을 고려함으로써 수행되는데, 지도와 같은 원고 화상이 칼라들을 포함하는 경우에는, 원고 화상에 있는 칼라들 중 하나의 칼라를 고려함으로써 상술된 것과 같은 과정을 수행함으로써 문자들이 추출될 수 있다.
예를 들어서, 실시예에서 화상 처리 장치에 제어판을 더 설치하여, 제어판에 대한 입력키를 사용함으로써 원하는 칼라를 지정할 수 있다. 스캐너(1)로부터 판독되는 원고 화상 데이터는 지정된 칼라 데이터에“1”을 할당하고 다른 칼라들에“0”을 할당함으로써 2치화된다. 2치화된 데이터가 RAM(2)에 저장된다. 그 결과로, 지정된 칼라의 문자들과 선들만이 RAM(2)에 저장된다. 그러므로, 상술된 실시예에서와 동일한 처리를 수행함으로써, RAM(2)에 저장된 화상 데이터로부터 문자들만이 추출될 수 있어, 지도와 같은, 원고 화상에 있는 칼라화된 문자들이 인식될 수 있다.
게다가, 예를 들면, 지도가 다수의 칼라들로 프린트될 수 있어, 청색 문자들과 적색 문자들과 같은 상이한 칼라들의 문자들을 찾아 볼 수 있다. 그러므로, 칼라를 지정할 때는 다수의 칼라들을 지정하는 것이 더 바람직하다. 그 후, 스캐너(1)에 의해 스캔된 원고 화상 데이터를 2치화한 후 2치화된 화상 데이터를 RAM(2)에 저장하기 위해 지정된 칼라들의 화상 데이터는“1”로 할당되고, 다른 칼라들은“0”으로 할당된다. 그 결과로, 다수의 칼라들의 문자들을 동시에 분리할 수 있다. 게다가, 지정되지 않은 칼라들의 화상 데이터가“0”으로 할당되기 때문에 RAM(2)에 저장된 화상 데이터는 오직 지정된 칼라들의 문자들과 선들이다. 따라서, 확산 처리 및 수축 처리가 단순화되어, 처리가 고속으로 수행된다.
상술된 제3실시예에 따르면, 선들을 제거하고 문자들을 나타내는 영역들을 추출한 후 문자들을 추출함으로써 처리 시간이 감소될 수 있다.
게다가, 화상 처리 장치가 상술된 실시예에서 단일 장치로 구성되지만, 본 발명은 상술된 처리를 수행하기 위한 화상 판독 유니트 및 처리기를 독립적으로 갖고 있는 시스템에 적용될 수 있다. 예를 들면, 시스템은 화상 스캐너와 개인용 컴퓨터로 구성될 수 있다. 게다가, 본 발명은 장치 또는 시스템에 외부 프로그램을 제공 할 수 있다.
실시예에서 선들은 1도트 폭이지만, 선의 폭을 나타내는 도트들의 수는 스캐너의 해상도, 선의 두께, 폰트 크기 등등에 따라 변한다. 따라서 선의 폭을 나타내는 도트들의 수는 필요에 따라 조작자에 의해 지정될 수 있다. 선의 폭의 도트들의 수를 변경함으로써, 확산 처리 및 수축 처리를 반복하는 회수가 도트들의 지정된 수에 따라 변한다.
게다가, 제3도는 3개의 선들이 서로 밀접하게 배치된 예를 도시한 것이다. 오직 하나의 선이 존재할 경우에, 각각의 확산 처리 후에 새롭게 추가된 도트들의 수가 계속 증가되기 때문에, 확산 처리가 종료되는 시간을 모른다. 이 문제를 해결하기 위해, 선정된 회수만큼 확산 처리를 수행한 후에 새롭게 추가된 도트들의 수가 감소되지 않는 경우에, 확산 처리는 종료되도록 설정된다. 그러므로, 확산 처리를 반복하는 최대 회수를 설정하도록 장치를 구성하는 것이 바람직하다.
확산 처리를 반복하는 최대 회수를 설정하는 다른 이유는, 문자들이 유의 도트들의 럼프가 될 때 및/또는 문자들이 결합되어 럼프를 형성할 때의 시간이 예를 들면, 판독 해상도, 원고 화상의 폰트 크기 등등에 따라 다르기 때문이다.
판독 해상도의 경우 조작자는 해상도가 장치에 저장될 때마다 설정할 필요는 없다. 반면, 문자들의 크기 및 선들의 폭의 경우 필요하다면 장치에 제공된 제어판으로부터 지정되어야만 한다. 예를 들면, 문자들의 크기 및 선들의 폭은 3개의 상이한 크기들 또는 폭들로부터 선택될 수 있다.
확산 및 수축 처리들을 반복하는 최대 회수를 설정하기 위한 다른 방법으로, 제7도에 도시된 바와 같이, 판독 해상도, 지정된 선들의 폭과, 폰트 크기에 따라 확산 처리를 반복하는 최대 회수로 구성되는 표가 프로그램 메모리(6)에 저장된 후, 확산 처리를 반복하는 최대 회수가 표를 참조하여 CUP(3)에 의해 얻어진다.
게다가, 제8도에 도시된 바와 같이, 문자들의 두께 및 선들의 폭이 입력되도록, 장치는 정보를 입력할 수 있는 키보드(9)와 같은 장치에 연결될 수 있다. 게다가, 칼라 데이터가 처리될 필요가 있는 경우에, 칼라 또는 칼라들이 키보드(9)를 사용함으로써 지정될 수 있다.
게다가, 키보드(9)를 사용하는 대신, 상술된 선택된 조건들이 표시 장치(8)상에 표시될 수 있고, 예를 들면, 마우스와 같은 포인팅 장치(pointing device)를 사용하여 적당한 아이콘들을 가리킴으로써 선택될 수 있다.
게다가, 실시예에서 원고 화상은 스캐너(1)로부터 직접 입력되지만, 문자들과 선들을 포함하는 화상은 플로피 디스크 등으로부터 판독될 수 있거나, 통신 선들을 경유하여 수신될 수 있다.
상술된 본 발명에 따르면, 문자들과 선들을 포함하는 화상이 입력될 때, 문자들이 화상으로부터 효율적으로 분리될 수 있다.
본 발명은 다수의 장치에 의해 구성되는 시스템이나 단일 장치를 포함하는 장치에 적용될 수 있다. 게다가, 본 발명은 본 발명의 목적이 시스템이나 장치에 프로그램을 제공함으로써 달성되는 경우에도 또한 적용될 수 있다.
지금까지, 본 발명의 양호한 실시예에 관하여 상세하게 기술하였지만, 이 설명은 단지 예에 불과하고, 제한적 의미로 해석되지 않는다. 또한, 본 분야에 숙련된 기술자들은 본 발명의 실시예를 여러가지 형태로 수정 및 변경시킬 수 있다. 이러한 수정 및 변경을 첨부된 특허 청구의 범위에 속하는 것으로 해석되어야 한다.

Claims (18)

  1. 문자들과 선들을 포함하는 화상을 입력하고 상기 문자들을 분리하는 화상 처리 장치에 있어서, 각각의 확산 처리 후에 새롭게 추가된 도트들의 수가 선정된 조건을 만족한다고 결정될 때까지 상기 입력 화상의 유의 도트들의 그룹들을 반복해서 확산하기 위한 확산 수단; 상기 확산 처리가 반복되는 회수보다 적어도 많은 회수만큼 상기 확산 수단에 의해 확산된 화상을 수축하기 위한 수축 수단; 및 수축 처리 후에 남겨지는 유의 도트들의 영역을 문자 영역으로 결정하기 위한 결정 수단을 포함하는 것을 특징으로 하는 화상 처리 장치
  2. 제1항에 있어서, 확산 처리 및 수축 처리가 반복되는 회수에 근거하여 상기 확산 및 수축 수단에 의해 확산 및 수축되는 화상을 확산하기 위한 제2확산 수단; 및 제2확산 처리 후에 얻어지는 유의 도트들의 영역에 기초하여 입력 화상으로부터 문자들을 추출하는 추출 수단을 더 포함하는 것을 특징으로 하는 화상 처리 장치.
  3. 제2항에 있어서, 상기 추출 수단이 상기 제2확산 수단에 의해 확산된 화상과 입력 화상 사이에서 논리 연산을 수행하기 위한 논리 연산 수단을 포함하는 것을 특징으로 하는 화상 처리 장치
  4. 제2항에 있어서, 상기 추출 수단에 의해 추출된 문자들을 인식하기 위한 인식 수단을 더 포함하는 것을 특징으로 하는 화상 처리 장치.
  5. 제1항에 있어서, 확산 및 수축 처리들이 상기 확산 및 수축 수단에 의해 화상의 수직 및 수평 방향으로 동작되는 것을 특징으로 하는 화상 처리 장치.
  6. 제1항에 있어서, 상기 선정된 조건은 현재의 확산 처리 동안의 도트들의 수가 이전의 확산 처리 동안 추가된 도트들의 수와 비교하여 감소하는 경우, 또는 확산 처리를 반복하는 회수가 선정된 값에 도달하는 경우 중 어느 하나인 것을 특징으로 하는 화상 처리 장치
  7. 제6항에 있어서, 상기 선정된 값이 변할 수 있는 것을 특징으로 하는 화상 처리 장치.
  8. 제1항에 있어서, 입력 화상의 지정된 칼라 또는 칼라들만이 통과하도록 제어하기 위한 필터 수단을 더 포함하는 것을 특징으로 하는 화상 처리 장치.
  9. 제8항에 있어서, 상기 필터 수단을 통과하는 입력 화상의 칼라 또는 칼라들을 설정하기 위한 설정 수단을 더 포함하는 것을 특징으로 하는 화상 처리 장치.
  10. 문자들과 선들을 포함하는 화상을 입력하고 상기 문자들을 분리하는 화상 처리 방법에 있어서, 각각의 확산 단계 후에 새롭게 추가된 도트들의 수가 선정된 조건을 만족한다고 결정될 때까지 상기 입력 화상의 유의 도트들의 그룹들을 반복해서 확산하는 단계; 상기 확산 단계가 반복되는 회수 보다 적어도 많은 회수만큼 상기 확산 단계에서 확산된 화상을 수축하는 단계; 및 상기 수축 단계 후에 남겨지는 유의 도트들의 영역을 문자 영역으로 결정하는 단계를 포함하는 것을 특징으로 하는 화상 처리 방법.
  11. 제10항에 있어서, 확산 단계 및 수축 단계가 반복되는 회수에 근거하여 상기 확산 및 수축 단계에서 확산 및 수축된 화상을 확산하는 제2확산 단계; 및 상기 제2확산 단계 후에 얻어지는 유의 도트들의 영역에 기초하여 입력 화상으로부터 문자들을 추출하는 추출 단계를 더 포함하는 것을 특징으로 하는 화상 처리 방법.
  12. 제11항에 있어서, 상기 추출 단계가 상기 제2확산 단계에서 확산된 화상과 입력 화상 사이에서 논리 연산을 수행하기 위한 논리 연산 단계를 포함하는 것을 특징으로 하는 화상 처리 방법.
  13. 제11항에 있어서, 상기 추출 단계에서 추출된 문자들을 인식하는 인식 단계를 더 포함하는 것을 특징으로 하는 화상 처리 방법.
  14. 제10항에 있어서, 상기 확산 및 수축 단계가 화상의 수직 및 수평 방향으로 동작되는 것을 특징으로 하는 화상 처리 방법.
  15. 제10항에 있어서, 상기 선정된 조건은 현재의 확산 단계 동안 추가된 도트들의 수가 이전의 확산 단계 동안 추가된 도트들의 수와 비교하여 감소하는 경우, 또는 확산 단계를 반복하는 회수가 선정된 값에 도달하는 경우 중 어느 하나인 것을 특징으로 하는 화상 처리 방법.
  16. 제15항에 있어서, 상기 선정된 값이 변할 수 있는 것을 특징으로 하는 화상 처리 방법
  17. 제10항에 있어서, 입력 화상의 지정된 칼라 또는 칼라들만이 통과하도록 제어하는 필터링 단계를 더 포함하는 것을 특징으로 하는 화상 처리 방법.
  18. 제17항에 있어서, 상기 필터링 단계에서 통과하는 입력 화상의 칼라 또는 칼라들을 설정하는 설정 단계를 더 포함하는 것을 특징으로 하는 화상 처리 방법.
KR1019940033248A 1993-12-09 1994-12-08 화상 처리 장치 및 방법 KR0167616B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP93-309142 1993-12-09
JP5309142A JP3062382B2 (ja) 1993-12-09 1993-12-09 画像処理装置及び方法

Publications (2)

Publication Number Publication Date
KR950020289A KR950020289A (ko) 1995-07-24
KR0167616B1 true KR0167616B1 (ko) 1999-01-15

Family

ID=17989418

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940033248A KR0167616B1 (ko) 1993-12-09 1994-12-08 화상 처리 장치 및 방법

Country Status (5)

Country Link
US (1) US5974191A (ko)
EP (1) EP0657838B1 (ko)
JP (1) JP3062382B2 (ko)
KR (1) KR0167616B1 (ko)
DE (1) DE69425807D1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10271497A (ja) 1997-03-24 1998-10-09 Minolta Co Ltd 画像処理装置
JP3777785B2 (ja) * 1998-03-18 2006-05-24 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
US6532302B2 (en) * 1998-04-08 2003-03-11 Canon Kabushiki Kaisha Multiple size reductions for image segmentation
US6671395B1 (en) * 1999-10-15 2003-12-30 D. Michael Ott Document image processing with stroke preservation and background suppression
US6950553B1 (en) 2000-03-23 2005-09-27 Cardiff Software, Inc. Method and system for searching form features for form identification
US6920247B1 (en) * 2000-06-27 2005-07-19 Cardiff Software, Inc. Method for optical recognition of a multi-language set of letters with diacritics
KR101169140B1 (ko) * 2010-02-17 2012-07-30 고려대학교 산학협력단 문자 영역 추출을 위한 영상 생성 장치 및 방법
JP6056319B2 (ja) * 2012-09-21 2017-01-11 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム
CN103425986B (zh) * 2013-08-31 2016-08-10 西安电子科技大学 基于边缘邻域加权的乳腺肿块图像特征提取方法
CN104182755B (zh) * 2014-08-30 2017-04-12 西安电子科技大学 基于塔形pca的乳腺钼靶x线图像块特征提取方法
JP6867609B2 (ja) * 2018-03-16 2021-04-28 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
JP2022026507A (ja) 2020-07-31 2022-02-10 キヤノン株式会社 画像記録装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5202933A (en) * 1989-12-08 1993-04-13 Xerox Corporation Segmentation of text and graphics
US5065437A (en) * 1989-12-08 1991-11-12 Xerox Corporation Identification and segmentation of finely textured and solid regions of binary images
JPH0528317A (ja) * 1991-07-23 1993-02-05 Canon Inc 画像処理方法及び装置

Also Published As

Publication number Publication date
EP0657838A3 (en) 1995-11-22
US5974191A (en) 1999-10-26
DE69425807D1 (de) 2000-10-12
JPH07160812A (ja) 1995-06-23
JP3062382B2 (ja) 2000-07-10
KR950020289A (ko) 1995-07-24
EP0657838B1 (en) 2000-09-06
EP0657838A2 (en) 1995-06-14

Similar Documents

Publication Publication Date Title
US5091964A (en) Apparatus for extracting a text region in a document image
US4750209A (en) System for processing an image having both letter and photographic information
US5129014A (en) Image registration
US8077976B2 (en) Image search apparatus and image search method
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
KR0167616B1 (ko) 화상 처리 장치 및 방법
JP2010218420A (ja) 文字認識装置、画像読取装置、およびプログラム
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
JP4390523B2 (ja) 最小領域による合成画像の分割
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP2890307B2 (ja) 表領域分離装置
JP4763113B2 (ja) 高速ラベリング方式
JPH03269689A (ja) 文書読み取り装置
JP2001143076A (ja) 画像処理装置
JP2784059B2 (ja) 2値画像のノイズ除去方法および装置
JPH06348891A (ja) 図形混在文書画像の構造解析方法
JPH04207857A (ja) 着色処理装置
JP2002354238A (ja) 像域分離システムおよびそれを適用した画像処理システム
JPH10222610A (ja) 文書画像構成要素抽出方法および装置
JP2002032713A (ja) 文字認識処理方法
JPH0652353A (ja) 文書認識システム
JPH0573721A (ja) 表認識装置
JPS6148078A (ja) ドツト文字処理方式
JPH0554182A (ja) 文字列の切り出し方式

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20050926

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee