KR100243222B1 - 문서 인식시 삽입 페이지 제거방법 - Google Patents

문서 인식시 삽입 페이지 제거방법 Download PDF

Info

Publication number
KR100243222B1
KR100243222B1 KR1019970032920A KR19970032920A KR100243222B1 KR 100243222 B1 KR100243222 B1 KR 100243222B1 KR 1019970032920 A KR1019970032920 A KR 1019970032920A KR 19970032920 A KR19970032920 A KR 19970032920A KR 100243222 B1 KR100243222 B1 KR 100243222B1
Authority
KR
South Korea
Prior art keywords
block
width
image
next page
page
Prior art date
Application number
KR1019970032920A
Other languages
English (en)
Other versions
KR19990010222A (ko
Inventor
송영민
Original Assignee
윤종용
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자주식회사 filed Critical 윤종용
Priority to KR1019970032920A priority Critical patent/KR100243222B1/ko
Publication of KR19990010222A publication Critical patent/KR19990010222A/ko
Application granted granted Critical
Publication of KR100243222B1 publication Critical patent/KR100243222B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

본 발명은 문서인식시 삽입 페이지 제거방법에 관한 것으로, 문서인식시 삽입 페이지 제거방법은 문서영상을 입력하는 제1단계; 여백으로 둘러싸인 문자열들의 블록에 대해, 제1단계에서 입력된 문서로부터 각 블록의 위치 및 크기를 구하는 제2단계; 제2단계에서 구한 각 블록의 위치 및 크기에 따라 각 블록을 정렬하는 제3단계; 제3단계에서 정렬된 블록간 여백의 폭을 비교하여 다음 페이지의 일부가 영상내에 포함되었는지를 판단하는 제4단계; 및 제4단계에서 다음 페이지의 일부가 영상내에 포함된 것으로 판단된 경우, 다음 페이지의 일부를 제거하는 제5단계로 이루어진다.
본 발명에 의하면, 문서인식시 한 페이지와 다음 페이지의 일부가 영상입력으로 들어온 경우, 다음 페이지의 일부를 영상에서 제거하여 불필요한 인식요소를 줄이므로써, 인식 속도와 성능을 향상시킨다.

Description

문서인식시 삽입 페이지 제거방법{Method for removing the inserted page before performing document recognition}
본 발명은 문서인식 방법에 관한 것으로, 보다 상세하게는 문서인식시 한 페이지이외에 다음 페이지가 삽입된 경우 그 삽입 페이지를 제거하는 방법에 관한 것이다.
일반적으로, 책, 신문 혹은 잡지 등과 같은 문서 인식시, 도 1과 같이 한 페이지내의 블록들 A,B,C와 다음 페이지의 일부 블록 D가 영상입력된 경우, D블록은 완전한 내용이 아니므로 인식할 필요가 없으며, 인식하게 되는 경우 인식 속도와 성능을 저하시킨다. 여기서, 블록은 여백으로 둘러싸인 문자열을 말한다.
이런 경우, 스캐너(scanner)의 입력부 크기에 정확하게 문서크기를 맞춰야하지만, 사용자가 부주의하거나 문서의 크기가 스캐닝 영역크기와 다를 경우에 상술한 D블록을 제거할 필요가 있다. 특히, 시각장애인의 경우 임의의 부분을 선택해서 스캐너로 입력하기가 불편하므로 상술한 D블록제거가 필요하다.
본 발명은 상술한 문제점을 해결하기 위해 창안된 것으로, 한 페이지와 다음 페이지의 일부가 영상입력으로 들어온 경우, 다음 페이지의 일부를 영상에서 제거하는 문서인식시 삽입 페이지 제거방법을 제공함에 그 목적이 있다.
도 1은 문서의 한 페이지와 다음 페이지의 일부가 영상입력된 경우의 도면이다.
도 2는 본 발명에 따른 문서인식시 삽입 페이지 제거방법에 대한 흐름도이다.
도 3은 도 2의 문서구조분석단계 결과 얻어진 블록의 구조이다.
도 4는 도 3의 블록구조를 블록열로 정렬한 도면이다.
도 5는 문서의 한 페이지와 다음 페이지의 한 블록열이 여백과 함께 영상입력된 경우의 도면이다.
상기 목적을 달성하기 위한, 본 발명에 따른 문서인식시 삽입 페이지 제거방법은 문서영상을 입력하는 제1단계; 여백으로 둘러싸인 문자열들의 블록에 대해, 상기 제1단계에서 입력된 문서로부터 상기 각 블록의 위치 및 크기를 구하는 제2단계; 상기 제2단계에서 구한 각 블록의 위치 및 크기에 따라 각 블록을 정렬하는 제3단계; 상기 제3단계에서 정렬된 블록간 여백의 폭을 비교하여 상기 다음 페이지의 일부가 영상내에 포함되었는지를 판단하는 제4단계; 및 상기 제4단계에서 상기 다음 페이지의 일부가 영상내에 포함된 것으로 판단된 경우, 상기 다음 페이지의 일부를 제거하는 제5단계를 포함함이 바람직하다.
이하에서 첨부된 도면을 참조하여 본 발명의 동작을 보다 상세하게 설명하기로 한다. 도 2는 본 발명에 따른 문서인식시 삽입 페이지 제거방법에 대한 흐름도로서, 도 2에 따른 문서인식시 삽입 페이지 제거방법은 문서영상입력단계(200), 문서구조분석단계(202), 블록정렬단계(203~214), 블록간 여백점검단계(216), 이입된 페이지 제거단계(218~224)로 이루어진다.
먼저, 스캐너와 같은 영상 입력장치를 통해서 문서가 입력되면(200단계), 문자와 비문자가 분리된 다음(202단계), 각 문자블록의 위치에 따라 블록구조가 형성한다. 형성된 크고 작은 블록들은 좌측으로부터 정렬되어 블록열(block column)로 정렬된다(203단계). 블록 정렬방법은 다음과 같다.
도 3에 도시된 복잡한 구조를 갖는 문서를 예로 들어 설명하기로 한다. 먼저, 각 블록들은 좌측상단으로부터 1,2,3,…순으로 정렬된 다음, 각 블록의 위치와 폭이 차례로 비교된다. 만일 도 3의 1과 2처럼 블록폭의 차이가 있다면(204단계), 그 폭이 큰 블록 1이 블록열의 폭으로 선택된다(206단계). 이 때, 블록 1과 5처럼 블록겹침이 있다면(208단계), 블록 1과 5를 연결한 폭을 블록열의 폭으로 설정한다. 블록 6 및 7과 같이 블록겸침이 없이 여백으로 분리되어 있다면, 블록 7의 폭이 다음 블록열의 폭이 되고, 다시 블록 7과 8이 비교된다(211단계). 모든 블록들이 비교, 점검되었다면(212단계), 도 4에 도시된 바와 같이 블록열로 정리된 다음(214단계), 블록열간의 여백을 비교하여 가장 큰 여백을 선택한다(216단계). 도 4를 참조하면 여백 e는 비교에서 제외되고, 여백 f와 여백 g중에서 여백g가 선택된다.
216단계에서 선택된 여백 g를 가로측으로 등분하는 중앙선을 기준으로 좌우측의 폭이 비교되어(218단계), 작은 쪽 폭≤ (큰 쪽 폭)/2이면(220단계), 작은 쪽 부분이 제거된다. 만일, 작은 쪽 폭〉 (큰 쪽 폭)/2이면, 한 페이지내의 블록이므로 제거하지 않는다.
여기서, 도 5와 같이 입력영상 안에 한 페이지와 다음 페이지의 일부분이 여백과 함께 입력된 경우를 더 고려하기로 한다. 도 5를 참조하면 상술한 220단계에서 (작은 쪽 폭 d)≤(큰 쪽 폭 c)/2 이고, 다시 여백 a, b가 a≥7b이면(222단계) 다른 페이지의 일부분으로 간주하여 작은 쪽 폭인 d부분을 제거한다(224단계). 여기서 7은 d부분이 다음 페이지로부터 삽입되었는지의 여부를 판단하는데 있어서 최적이라고 간주되는 배수이다.
만일 (작은 쪽 폭 d)≤(큰 쪽 폭 c)/2 이고 여백 a, b가 a〈7b이면, d부분이 다음 페이지에서 삽입되었다 하더라도 한 페이지내의 블록으로 간주되어 제거되지않는다.
본 발명에 의하면, 문서인식시 한 페이지와 다음 페이지의 일부가 영상입력으로 들어온 경우, 다음 페이지의 일부를 영상에서 제거하여 불필요한 인식요소를 줄이므로써, 문서인식시 인식 속도와 성능을 향상시킨다.

Claims (4)

  1. 문서인식시 한 페이지와 그 다음 페이지의 일부가 영상입력되었을 때, 상기 다음 페이지의 일부를 영상에서 제거하는 방법에 있어서,
    문서영상을 입력하는 제1단계;
    여백으로 둘러싸인 문자열들의 블록에 대해, 상기 제1단계에서 입력된 문서로부터 상기 각 블록의 위치 및 크기를 구하는 제2단계;
    상기 제2단계에서 구한 각 블록의 위치 및 크기에 따라 각 블록을 정렬하는 제3단계;
    상기 제3단계에서 정렬된 블록간 여백의 폭을 비교하여 상기 다음 페이지의 일부가 영상내에 포함되었는지를 판단하는 제4단계; 및
    상기 제4단계에서 상기 다음 페이지의 일부가 영상내에 포함된 것으로 판단된 경우, 상기 다음 페이지의 일부를 제거하는 제5단계를 포함함을 특징으로하는 문서인식시 삽입 페이지 제거방법.
  2. 제1항에 있어서, 상기 제3단계는
    각 블록들을 좌측상단으로부터 정렬하는 제6단계;
    상기 제6단계에서 정렬된 각 블록의 위치와 폭을 좌측상단측에서부터 차례로 비교하는 제7단계;
    상기 제7단계에서의 비교결과, 비교된 블록들의 폭이 서로 다른 경우, 블록폭이 큰 블록을 블록열의 폭으로 선택하는 제8단계;
    상기 제7단계에서 블록간의 겹침이 있는 경우 상기 두 블록을 연결한 폭을 블록열의 폭으로 선택하는 제9단계;
    상기 제7단계에서 비교된 블록들이 여백으로 분리된 경우 각 블록폭을 해당 블록열의 폭으로 선택하는 제10단계; 및
    상기 제7단계 내지 제10단계를 모든 블록에 대해 수행한 후, 블록열로 정리하는 단계를 구비함을 특징으로하는 문서인식시 삽입 페이지 제거방법.
  3. 제1항에 있어서, 상기 제4단계는
    블록간 여백을 비교하여 가장 큰 여백을 선택하는 제11단계;
    상기 제11단계에서 구한 가장 큰 여백의 위치를 중심으로 영상내의 좌우측 폭을 비교하는 제12단계; 및
    상기 제12단계에서 (작은 쪽의 폭)≤(큰 쪽의 폭)/2면, 상기 다음 페이지의 일부가 영상내에 포함된 것으로 판단하고, (폭이 작은 쪽의 폭)〉(폭이 큰 쪽의 폭)/2면, 상기 다음 페이지의 일부가 영상내에 포함되지 않은 것으로 판단하는 제13단계를 구비함을 특징으로하는 문서인식시 삽입 페이지 제거방법.
  4. 제3항에 있어서,
    영상내의 최우측에 여백이 있는 경우, 상기 제12단계에서 (폭이 작은 쪽의 폭)≤(폭이 큰 쪽의 폭)/2이면, (영상내의 최좌측 여백 폭)〉7*(영상내의 최우측 여백 폭)인가를 점검하여 상기 조건을 만족하면 상기 다음 페이지의 일부가 영상내에 포함된 것으로 판단함을 더 구비하는 문서인식시 삽입 페이지 제거방법.
KR1019970032920A 1997-07-15 1997-07-15 문서 인식시 삽입 페이지 제거방법 KR100243222B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970032920A KR100243222B1 (ko) 1997-07-15 1997-07-15 문서 인식시 삽입 페이지 제거방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970032920A KR100243222B1 (ko) 1997-07-15 1997-07-15 문서 인식시 삽입 페이지 제거방법

Publications (2)

Publication Number Publication Date
KR19990010222A KR19990010222A (ko) 1999-02-05
KR100243222B1 true KR100243222B1 (ko) 2000-02-01

Family

ID=19514570

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970032920A KR100243222B1 (ko) 1997-07-15 1997-07-15 문서 인식시 삽입 페이지 제거방법

Country Status (1)

Country Link
KR (1) KR100243222B1 (ko)

Also Published As

Publication number Publication date
KR19990010222A (ko) 1999-02-05

Similar Documents

Publication Publication Date Title
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US5265171A (en) Optical character reading apparatus for performing spelling check
JP5790082B2 (ja) 文書認識装置、文書認識方法、プログラム及び記憶媒体
JP5950700B2 (ja) 画像処理装置、画像処理方法及びプログラム
KR100243222B1 (ko) 문서 인식시 삽입 페이지 제거방법
JPH08320914A (ja) 表認識方法および装置
KR100277831B1 (ko) 문서 영상에서의 표 분석방법
JP3197441B2 (ja) 文字認識装置
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH03142691A (ja) 表形式文書認識方式
JPH09288714A (ja) 表認識方法および装置
US20100149604A1 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
JPH0514952B2 (ko)
JP2001266070A (ja) 文字認識装置、文字認識方法および記憶媒体
JP3060237B2 (ja) 日本語文字認識装置
JPH0443476A (ja) 文字認識装置
JPH01300385A (ja) 空白文字の切出し方法
JPS63223987A (ja) 文字検索方法
JPH08329191A (ja) 文字列切り出し方法
JPS6344269A (ja) 文書認識処理装置
JPH02264385A (ja) パターンの切り出し方法
JP2002262093A (ja) 画像処理方法及び画像処理装置及び画像処理プログラム並びに記録媒体
JPH0378892A (ja) 表形式文書の認識装置
JPH06131501A (ja) 光学文字読取装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080918

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee