KR960005110B1 - 문서인식장치의 영역분할 방법 - Google Patents

문서인식장치의 영역분할 방법 Download PDF

Info

Publication number
KR960005110B1
KR960005110B1 KR1019930001475A KR930001475A KR960005110B1 KR 960005110 B1 KR960005110 B1 KR 960005110B1 KR 1019930001475 A KR1019930001475 A KR 1019930001475A KR 930001475 A KR930001475 A KR 930001475A KR 960005110 B1 KR960005110 B1 KR 960005110B1
Authority
KR
South Korea
Prior art keywords
block
information
image
extracting
string
Prior art date
Application number
KR1019930001475A
Other languages
English (en)
Other versions
KR940020246A (ko
Inventor
노희호
Original Assignee
엘지전자주식회사
구자홍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자주식회사, 구자홍 filed Critical 엘지전자주식회사
Priority to KR1019930001475A priority Critical patent/KR960005110B1/ko
Publication of KR940020246A publication Critical patent/KR940020246A/ko
Application granted granted Critical
Publication of KR960005110B1 publication Critical patent/KR960005110B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

내용 없음.

Description

문서인식장치의 영역분할 방법
제 1 도는 본 발명의 문서인식 영역분할 방법을 수행하는 문서인식장치의 블럭구성도.
제 2 도는 본 발명의 영역분할 방법의 플로우 챠트.
제 3 도는 본 발명에 의한 영역분할과정에서 특징추출방법의 예.
* 도면의 주요부분에 대한 부호의 설명
1 : 스캐너부 2 : 스캐너 인터페이스
3 : 디지탈 신호 처리부 4 : 데이타 메모리
5 : 호스트 인터페이스 6 : 호스트 컴퓨터
7 : 버퍼 8 : 메모리 제어부
9 : 화상 메모리
본 발명은 문서인식 장치에서 문서를 이루고 있는 그림과 문자영역등의 입력 화상 영역을 분할하여 문자를 인식할 수 있도록 한 문서인식장치의 영역분할 방법에 관한 것이다.
종래의 문서인식장치의 영역분할 방법은 문서를 구성하고 있는 각 영역(그림영역, 문자영역)의 구분을 위하여 스캐너로 입력된 문서의 영상을 압축과 축소를 반복하여 영역을 구분하거나 또는 입력 영상을 압축하여 수직과 수평 방향으로 스무딩(smoothing)과정을 거치고 이 영상에 대하여 이진 논리곱 처리를 수행하며 논리곱된 영상에 대하여 윤곽선 추적을 수행하므로 그림 영역과 글자 영역을 구해내는 것으로 이와같은 영역분할 방법에 의하면 많은 용량의 메모리를 필요로 하게되어 하드웨어의 구성이 복잡해지는 문제점과 처리과정이 여러 단계의 과정으로 이루어지는데 따라 영역분할 처리시간이 길어지게 되는 문제점이 있다.
본 발명은 스캐너로 입력된 영상의 특징을 추출하고 이 특징정보를 이용하여 영역을 블럭화한 후 추출된 블럭으로부터 문자열 블럭을 추출하여 그림영역과 문자영역을 분할하므로서 문서 인식 장치의 구성을 간소화하고 문서 인식 처리 시간을 단축시키며 이를 통한 시스템의 성능 향상을 기할 수 있도록 한 문서인식장치의 영역분할 방법을 제공함을 목적으로 하며 이하 첨부된 도면을 참조하여 본 발명의 영역분할 방법이 이루어지는 문서 인식 장치의 구성부터 설명하면 다음과 같다.
제 1 도를 참조하면 본 발명에 의한 문서인식장치는, 처리할 문서의 영상정보를 입력시키는 스캐너(1)와, 상기 스캐너와 디지탈 신호 처리부 및 호스트 사이의 정보전달을 위한 스캐너 인터페이스(2)와, 상기 스캐너로 입력된 영상정보의 영역분할 처리를 수행하는 디지탈 신호 처리부(3)와, 상기 디지탈 신호 처리부의 처리데이타가 저장되는 데이타메모리(4)와, 상기 디지탈 신호 처리부와 호스트 및 버퍼 사이의 정보 전달을 위한 호스트 인터페이스(5)와, 상기 문서인식을 위한 장치 전체의 동작을 통제하는 호스트 컴퓨터(6)와, 상기 디지탈 신호 처리부와 메모리 제어부 사이의 데이타 전송을 위한 버퍼(7)와, 상기 스캐너로부터 입력된 영상 정보의 저장 및 해독을 위한 메모리 제어를 수행하는 메모리 제어부(8)와, 상기 메모리 제어부의 제어를 받아 상기 입력 영상정보가 저장 및 해독되는 화상 메모리(9)로 구성된다.
상기한 바와같이 구성된 문서인식장치에 의하여 수행되는 본 발명의 영역분할 방법은, 제 2 도를 참조하면, 입력문서의 화상정보를 읽어들이는 스캐닝과정과, 상기 스캐닝된 입력 영상으로부터 그림부분과 문자부분을 구분짓는 특징정보를 추출하는 특징 추출과정과, 상기 추출된 특징정보로부터 영상 영역을 블럭화하는 블럭 추출과정과, 상기 추출된 블럭 정보를 이용하여 블럭의 종류를 판단하고 이로부터 문자열 블럭을 추출하는 문자열 추출 과정으로 이루어진다.
이와같이 이루어지는 본 발명의 문서인식장치의 영역분할 방법을 상기 제 1 도와 제 2 도 및 도면 제 3 도를 참조하여 설명하면 다음과 같다.
스캐너(1)는 호스트 컴퓨터(6)의 스캐닝 구동 제어를 받아 문서를 읽어서 문서의 화상(영상)정보를 전기 신호로 읽어들이고 이 읽어들인 영상 정보는 메모리 제어부(8)의 제어를 받아 화상 메모리(9)에 저장된다.
이어서 디지탈 신호 처리부(3)는 상기 화상 메모리(9)에 저장된 입력 문서의 영상정보를 데이타 메모리(4)로 가져와서 영역분할을 수행하고 수행된 결과를 갖고 있거나 또는 호스트 컴퓨터(6)에 제공한다.
상기 제반 정보의 전송에 있어 스캐너 인터페이스(2)는 스캐너(1)로 입력된 영상정보를 디지탈 신호 처리부(3)에 전달해주고, 호스트 인터페이스(5)는 디지탈 신호 처리부(3)의 영역분할에 관련된 정보를 호스트 컴퓨터(6)사이에서 전송해준다.
상기한 바와같이 문서의 영상정보가 화상메모리(9)에 저장되고 이 정보를 디지탈 신호 처리부(3)가 해석하여 입력 문서에 대한 특징량을 추출하여 데이타 메모리(4)에 저장한 다음 이 정보를 이용하여 블럭을 추출하고 추출된 블럭의 종류를 판별하여 문자 블럭에 대하여는 문자열을 추출하므로서 영역분할을 완료한다.
먼저, 입력화상의 특징정보를 추출하는 과정부터 설명한다.
입력 문서에 대하여 제 3 도와 같이 문서의 좌측으로부터 우측 방향으로 스캐닝을 수행하면서 입력된 영상정보의 가로방향 각각에 대하여 첫번째로 나타나는 흑색 화소의 위치를 레지스터(l_bound[row])에 저장하고, 한 라인의 마지막에 나타나는 흑색 화소의 위치를 레지스터(r_bound[row])에 저장한다.
이어서 흑백 변화율(그 다음 위치의 백색 화소에서 흑색 화소로 바뀌는 휫수)을 산출하여 레지스터(trans[row])에 저장한다.
상기 row값은 입력 문서의 높이(hgt)에 의하여 결정되며 그 범위는 0 내지 hgt가 된다. 이와같은 과정을 입력 문서에 대하여 수행하면 각 라인에 대한 그림과 글자의 영역(즉, 문서내에서 실제 화상이 존재하는 정보영역)이 구해진다.
이어서 상기한 가로방향 각각에 대한 첫 흑백화소 위치값(l_bound[row])을 검색하여 그중 최소의 것을 레지스터(left_min)에 저장하고, 상기 한 라인의 마지막 흑색 화소의 위치와 첫 흑색 화소의 위치의 차(rbound[row]-l_bound[row])를 구하고 그 중에서 최대인 것을 레지스터(str_max)에 저장한다.
이와같이 하여 입력 문서의 영상을 특징지우는 특징정보, 즉 각 라인의 첫번째와 마지막 흑색 화소의 위치, 흑백변화율, 첫 흑백화소의 최소값, 첫번째 및 마지막 흑백화소의 차의 최대값을 구하는 것이다.
이와같이 구한 특징정보를 이용하여 영역을 블럭화한다.
먼저 의미가 있는 정보가 존재하는 각 라인을 구해 이를 string[row]=1로 세팅시키는데 다음 조건하에서 string을 1로 세팅시킨다.
조건 : l_bound[i]-l_bound[i+2] : -left_min>str_max/5이거나
l_bound[i]>f_wid/3을 만족하면 string[i]=1,
만족하지 못하면 string[i]=0.
(단, 0<i<hgt)
이와같이 의미가 있는 정보 라인을 스트링정보(string)로 세팅한 다음 이 스트링 정보를 이용하여 영역을 블럭화한다.
즉, string[i]=1인 경우가 연속하여 20회 이상 존재하면 그 처음과 끝을 각 각 블럭의 상단과 하단으로 정하고, 블럭의 상단과 하단이 정해지면 이 블럭의 상하단을 경계로하여 좌우단의 경계값을 상기 흑백화소의 처음과 마지막 위치값(l_bound)(r_bound)을 이용하여 구하므로서 블럭화를 완료한다.
상기 설명과 같이 블럭화된 것이 블럭정보이며, 이 블럭정보는 블럭의 길이, 블럭의 폭, 블럭 영역내의 흑백화소의 평균 변화율 등을 나타내는 정보이다.
이와같이 블럭화가 완료되면 상기 블럭 정보를 이용하여 문자열을 추출한다.
문자열은 그림영역과 물리적으로 다르게 나타나는 다음의 특성을 이용하여 추출할 수 있다. 즉, 문자열은 그림영역과는 달리 가늘고 긴 특징이 있고 또한 문자열 영역에서는 흑백화소의 변화가 그림 영역에 비하여 훨씬 규칙적으로 나타나며 그 변화정도가 그림영역보다 크고, 블럭 사이의 간격이 일정하다.
따라서 상기 특성들을 상기한 블럭 정보를 해석하므로서 추론하여 원하는 문자영역의 추출이 가능하게 된다.
즉, 제 3 도와 같이 블럭의 길이(L)가 블럭의 폭(B)의 10배 이상이고 영역 사이의 흑백화소의 평균 변화율이 면적대비 0.3 이하인 블럭을 찾아내서 이러한 조건을 만족하는 블럭이 있으면 그 블럭을 문자열 블럭, 즉 문자영역으로 판정하고, 나머지는 그림영역으로 판정한다.
이로써 입력된 문서에 대한 그림 영역과 문자영역의 분할이 완료된다.
이상에서 설명한 바와같이 본 발명에 의하면 입력 영상의 1회 스캐닝을 통해 화상 정보를 구하고 이 정보의 특징 추출을 통해 문서의 그림과 글자영역을 분할해 내므로 고속의 문자영역 추출이 가능하고 이에따른 문서처리 능력의 향상이 가능하며 특히 종래와 같은 화상의 압축과 축소 조작에 필요한 메모리 사용이 배제되므로 저 용량의 메모리 채용을 통해서도 효율적인 문서 인식이 가능한 효과가 있다.

Claims (4)

  1. 입력문서의 화상정보를 읽어들이는 스캐닝과정과, 상기 스캐닝된 입력 영상으로부터 그림부분과 문자부분을 구분짓는 특징정보를 추출하는 특징 추출과정과 상기 추출된 특징정보로부터 영상 영역을 블럭화하는 블럭 추출과정과, 상기 추출된 블럭 정보를 이용하여 블럭의 종류를 판단하고 이로부터 문자열 블럭을 추출하는 문자열 추출과정으로 이루어진 문서인식장치의 영역분할 방법.
  2. 제 1 항에 있어서, 상기 특징추출과정은, 입력문서의 영상을 스캐닝하면서 가로 방향 각각에 대한 첫번째와 마지막 흑백화소의 위치를 구하는 제 1 과정과, 상기 각 라인에서 백색 화소로부터 흑색 화소로 변화되는 휫수의 흑백화소 변화율을 구하는 제 2 과정으로 이루어진 문서인식장치의 영역분할 방법.
  3. 제 1 항에 있어서, 상기 블럭추출과정은, 상기 특징정보를 일정한 조건과 비교하여 의미있는 정보가 존재하는 라인을 스트링 정보로 세팅하여 구하는 제 1 과정과, 상기 제 1 과정에서 구한 라인의 스트링값으로부터 블럭의 상단과 하단을 정하고 이 상하단을 경계로하여 상기 흑백화소의 처음과 마지막위치값을 이용하여 좌우단의 경계값을 구하는 제 2 과정으로 이루어진 문서인식장치의 영역분할 방법.
  4. 제 1 항에 있어서, 상기 문자열 추출과정은, 문자열의 길이를 문자열의 폭의 소정배수와 비교하는 제 1 과정과, 상기 블럭 영역사이의 흑백화소의 평균 변화율을 면적하여 대비하여 비교하는 제 2 과정과, 상기 제 1 과정에서의 비교결과 문자열의 길이가 문자열의 폭의 소정배수 이상이고 상기 제 2 과정에서의 비교결과 흑백화소의 평균 변화율이 면적대비 소정 비율 이상인 경우의 블럭을 문자열로 판정하는 제 3 과정으로 이루어진 문서인식장치의 영역분할 방법.
KR1019930001475A 1993-02-04 1993-02-04 문서인식장치의 영역분할 방법 KR960005110B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019930001475A KR960005110B1 (ko) 1993-02-04 1993-02-04 문서인식장치의 영역분할 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019930001475A KR960005110B1 (ko) 1993-02-04 1993-02-04 문서인식장치의 영역분할 방법

Publications (2)

Publication Number Publication Date
KR940020246A KR940020246A (ko) 1994-09-15
KR960005110B1 true KR960005110B1 (ko) 1996-04-20

Family

ID=19350360

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019930001475A KR960005110B1 (ko) 1993-02-04 1993-02-04 문서인식장치의 영역분할 방법

Country Status (1)

Country Link
KR (1) KR960005110B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102043693B1 (ko) * 2018-09-28 2019-11-12 김지성 기계 학습 기반의 문서 관리 시스템

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100420065B1 (ko) * 1997-01-20 2004-04-17 삼성전자주식회사 이치화된 혼재 이미지에서 글씨영역과 그림영역을 구분하는 방법
KR100412176B1 (ko) * 2002-01-24 2003-12-24 이호석 문자와 이미지가 포함된 문서의 압축, 복원 시스템 및방법
JP2006277167A (ja) * 2005-03-29 2006-10-12 Fuji Xerox Co Ltd アノテーションデータ処理プログラム、装置、方法
KR100693296B1 (ko) * 2005-06-07 2007-03-13 (주)디디오넷 컴퓨터 스크린 이미지 압축 장치 및 그 방법
US8098934B2 (en) 2006-06-29 2012-01-17 Google Inc. Using extracted image text
KR101421704B1 (ko) * 2006-06-29 2014-07-22 구글 인코포레이티드 이미지의 텍스트 인식

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102043693B1 (ko) * 2018-09-28 2019-11-12 김지성 기계 학습 기반의 문서 관리 시스템

Also Published As

Publication number Publication date
KR940020246A (ko) 1994-09-15

Similar Documents

Publication Publication Date Title
US5048107A (en) Table region identification method
US5033104A (en) Method for detecting character strings
EP0093244A2 (en) Apparatus and method for transmitting compressed data
US7317835B2 (en) Image processing method and apparatus
US5081690A (en) Row-by-row segmentation and thresholding for optical character recognition
JP2766053B2 (ja) 画像データ処理方法
KR960005110B1 (ko) 문서인식장치의 영역분할 방법
US6690492B2 (en) Image processing method and apparatus
JP2001203897A (ja) パタンマッチング符号化装置及び方法
US20100238474A1 (en) Document image processing apparatus, document image processing method, and computer-readable recording medium having recorded document image processing program
US20010012398A1 (en) Multi-color image encoding apparatus and method, multi-color image decoding apparatus and method
US5835640A (en) Method and apparatus for identifying and fixing horizontal and vertical lines in digitized images
US6175662B1 (en) Region extraction method and apparatus
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
AU785095B2 (en) Image processing method, apparatus therefor and storing medium
JP2004140749A (ja) 画像圧縮方法
JP3854849B2 (ja) データ伸長処理方法およびデータ伸長処理装置
US6219445B1 (en) Multi-color image encoding and/or decoding apparatus containing color order table and the method thereof
JPH08237404A (ja) 光学文字認識モードの選択方法
US20030002062A1 (en) Image processing apparatus, method and program, and storage medium
JP2908495B2 (ja) 文字画像抽出装置
JPH04276888A (ja) 文字読取装置
JP3681919B2 (ja) 情報コードの切り出し方法
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
JP3774490B2 (ja) 画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070329

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee