KR930005568B1 - 오 추출 라인 검출 방법 - Google Patents

오 추출 라인 검출 방법 Download PDF

Info

Publication number
KR930005568B1
KR930005568B1 KR1019900003707A KR900003707A KR930005568B1 KR 930005568 B1 KR930005568 B1 KR 930005568B1 KR 1019900003707 A KR1019900003707 A KR 1019900003707A KR 900003707 A KR900003707 A KR 900003707A KR 930005568 B1 KR930005568 B1 KR 930005568B1
Authority
KR
South Korea
Prior art keywords
line
extracted
detection method
area
extraction line
Prior art date
Application number
KR1019900003707A
Other languages
English (en)
Other versions
KR910017329A (ko
Inventor
노희호
Original Assignee
주식회사 금성사
이헌조
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 금성사, 이헌조 filed Critical 주식회사 금성사
Priority to KR1019900003707A priority Critical patent/KR930005568B1/ko
Publication of KR910017329A publication Critical patent/KR910017329A/ko
Application granted granted Critical
Publication of KR930005568B1 publication Critical patent/KR930005568B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

내용 없음.

Description

오 추출 라인 검출 방법
제1도는 본 고안에 따른 오 추출 라인 검출 장치 구성 블럭도.
제2도는 본 발명에 따른 좌표 정보 상태 설명도.
제3도는 본 발명에 따른 오 추출 라인 검출 방법 흐름도.
* 도면의 주요부분에 대한 부호의 설명
1 : 스캐너 2 : PC
3 : 모니터 4 : 하드디스크
5 : DSP 칩 6 : 데이타 메모리
본 발명은 오 추출라인 검출방법에 관한 것으로 특히 한국어 문서에서 라인 추출시 잘못 추출된 라인의 검출에 적당하도록한 오 추출 라인 검출방법에 관한 것이다.
본 발명은 제1도에 도시된 바와같이 스캐너(Scanner)(1)와 모니터(3) 및 하드디스크(4)가 연결된 PC(Personal Computer)(2)상에서 실행될수도 있으며, 처리속도를 증가시키기 위하여 상기 PC(2)상에서 실행될수도 있으며, 처리속도를 증가시키기 위하여 상기 PC(2)에 데이타 메모리(6)가 연결된 DSP 칩(5)을 결합시켜 운용시킬수도 있다.
이를 제2도 내지는 제3도를 참고로 좀더 구체적으로 설명하면 다음과 같다.
우선 제2도에 도시된 바와같이 라인(Line)은 표현하기 위해서는 4개의 좌표(Linex〔i〕〔0〕, Linex〔i〕〔1〕, Linex〔i〕〔2〕, Linex〔i〕〔3〕), (Linex〔 〕〔 〕는 라인의 좌표를 저장하기위한 2차원 array이다)가 필요하게 되는데, 라인의 상하 일정 면적에 있는 흑화수소를 조사하여 이 라인이 문자영역에서 출되었는가 아닌가를 판단하게 된다.
즉, 제3도에 도시된 흐름도를 참고로 설명하면, 먼저 라인의 상단부 5픽셀 부터 2픽셀 까지의 영역을 조사한다.
이 영역에서 X좌표를 1씩 증가시키면서 Tmage〔x〕〔y〕(Image〔 〕〔 〕는 입력화상의 화소값(흑화소는 1, 백화소는 0)을 나타내기 위한 Array 이다)를 조사한다.
만약 Tmage〔x〕〔y〕=1이면 흑화소수 카운터 num1(필셀수를 세기위한 카운터 변수)을 증가시킨다.
이와같이 전영역에 대하여 Tmage〔 〕〔 〕를 조사하여 num1을 구한다.
(step1)이후 라인의 하단부 2픽셀에서 5픽셀 부분을 조사하여 흑화소수 num2를 구한다.(step2)
상기 Step1과 Step2에서 구한 num1, num2를 라인의 면적(Line을 구성하는 전화수소)으로 나눈 값을 div1, div2(라인을 구성하는 화소수에 대한 인접 흑화소수의 비율)라 하고, 이 값중의 어느한 값이라도 임계치 α(임계 값을 저장하기 위한 변수로서 한국어 문자에서는 1/4이 가장적합)를 넘으면 문자 영역에서 추출된 라인으로 인장하여 이 라인을 추출된 라인 엔트리에서 삭제한다.
이때 라인의 상하 2~5 픽셀 사이를 조사한 것을 한국어 문자의 특성을 고려한것으로 이 경우가 오 분류된 라인을 가장 잘 추출하였다.
따라서 본 발명에 따른 오 추출라인 검출방법은 문서의 그래픽 부분을 처리할때 라인의 오추출 에러(error)를 줄여 문서 인식을 위한 그래픽 부분 처리를 정확하게 할수 있는 효과를 갖는다.

Claims (1)

  1. 문자문서의 라인추출에 있어서, 라인을 상단부영역과 하단부영역으로 분리하고 라인의 상단부영역 및 하단부영역의 데이타를 조사하여 좌표값을 증가시켜가면서 흑화소수의 누적값(num1, num2)을 각각 구한후 상기 상단부영역 및 하단부영역의 누적 혹화수소값을 각각 라인의 면적으로 나눈값이(div1, div2) 어느한 값이라도 설정한 임계치를 넘으면 문자영역에서 추출된 라인으로 인정하여 이 라인을 추출된 엔트리 라인에서 삭제하도록 진행되는 것을 특징으로 하는 오 추출라인 검출방법.
KR1019900003707A 1990-03-20 1990-03-20 오 추출 라인 검출 방법 KR930005568B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019900003707A KR930005568B1 (ko) 1990-03-20 1990-03-20 오 추출 라인 검출 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019900003707A KR930005568B1 (ko) 1990-03-20 1990-03-20 오 추출 라인 검출 방법

Publications (2)

Publication Number Publication Date
KR910017329A KR910017329A (ko) 1991-11-05
KR930005568B1 true KR930005568B1 (ko) 1993-06-23

Family

ID=19297146

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019900003707A KR930005568B1 (ko) 1990-03-20 1990-03-20 오 추출 라인 검출 방법

Country Status (1)

Country Link
KR (1) KR930005568B1 (ko)

Also Published As

Publication number Publication date
KR910017329A (ko) 1991-11-05

Similar Documents

Publication Publication Date Title
Antonacopoulos Page segmentation using the description of the background
JP2940936B2 (ja) 表領域識別方法
US5563403A (en) Method and apparatus for detection of a skew angle of a document image using a regression coefficient
US5033104A (en) Method for detecting character strings
Yuan et al. Text extraction from gray scale document images using edge information
US20010012400A1 (en) Page analysis system
US6711292B2 (en) Block selection of table features
JP2006067585A (ja) デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置
US9189459B2 (en) Document image layout apparatus
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
US5455871A (en) Detecting function words without converting a scanned document to character codes
Dori et al. Segmentation and recognition of dimensioning text from engineering drawings
KR930002349B1 (ko) 압축영상의 문자열 분리방법
KR930005568B1 (ko) 오 추출 라인 검출 방법
Chang Retrieving information from document images: problems and solutions
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
KR19980058361A (ko) 한글 문자 인식 방법 및 시스템
JP4079411B2 (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体
JPH0564396B2 (ko)
JPH07160810A (ja) 文字認識装置
JP3406942B2 (ja) 画像処理装置及び方法
JP2888885B2 (ja) 文字切出し装置
JPH02166583A (ja) 文字認識装置
JP3190794B2 (ja) 文字切り出し装置
JP2878327B2 (ja) 文字切り出し装置

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 19981221

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee