KR930005568B1 - 오 추출 라인 검출 방법 - Google Patents
오 추출 라인 검출 방법 Download PDFInfo
- Publication number
- KR930005568B1 KR930005568B1 KR1019900003707A KR900003707A KR930005568B1 KR 930005568 B1 KR930005568 B1 KR 930005568B1 KR 1019900003707 A KR1019900003707 A KR 1019900003707A KR 900003707 A KR900003707 A KR 900003707A KR 930005568 B1 KR930005568 B1 KR 930005568B1
- Authority
- KR
- South Korea
- Prior art keywords
- line
- extracted
- detection method
- area
- extraction line
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
내용 없음.
Description
제1도는 본 고안에 따른 오 추출 라인 검출 장치 구성 블럭도.
제2도는 본 발명에 따른 좌표 정보 상태 설명도.
제3도는 본 발명에 따른 오 추출 라인 검출 방법 흐름도.
* 도면의 주요부분에 대한 부호의 설명
1 : 스캐너 2 : PC
3 : 모니터 4 : 하드디스크
5 : DSP 칩 6 : 데이타 메모리
본 발명은 오 추출라인 검출방법에 관한 것으로 특히 한국어 문서에서 라인 추출시 잘못 추출된 라인의 검출에 적당하도록한 오 추출 라인 검출방법에 관한 것이다.
본 발명은 제1도에 도시된 바와같이 스캐너(Scanner)(1)와 모니터(3) 및 하드디스크(4)가 연결된 PC(Personal Computer)(2)상에서 실행될수도 있으며, 처리속도를 증가시키기 위하여 상기 PC(2)상에서 실행될수도 있으며, 처리속도를 증가시키기 위하여 상기 PC(2)에 데이타 메모리(6)가 연결된 DSP 칩(5)을 결합시켜 운용시킬수도 있다.
이를 제2도 내지는 제3도를 참고로 좀더 구체적으로 설명하면 다음과 같다.
우선 제2도에 도시된 바와같이 라인(Line)은 표현하기 위해서는 4개의 좌표(Linex〔i〕〔0〕, Linex〔i〕〔1〕, Linex〔i〕〔2〕, Linex〔i〕〔3〕), (Linex〔 〕〔 〕는 라인의 좌표를 저장하기위한 2차원 array이다)가 필요하게 되는데, 라인의 상하 일정 면적에 있는 흑화수소를 조사하여 이 라인이 문자영역에서 출되었는가 아닌가를 판단하게 된다.
즉, 제3도에 도시된 흐름도를 참고로 설명하면, 먼저 라인의 상단부 5픽셀 부터 2픽셀 까지의 영역을 조사한다.
이 영역에서 X좌표를 1씩 증가시키면서 Tmage〔x〕〔y〕(Image〔 〕〔 〕는 입력화상의 화소값(흑화소는 1, 백화소는 0)을 나타내기 위한 Array 이다)를 조사한다.
만약 Tmage〔x〕〔y〕=1이면 흑화소수 카운터 num1(필셀수를 세기위한 카운터 변수)을 증가시킨다.
이와같이 전영역에 대하여 Tmage〔 〕〔 〕를 조사하여 num1을 구한다.
(step1)이후 라인의 하단부 2픽셀에서 5픽셀 부분을 조사하여 흑화소수 num2를 구한다.(step2)
상기 Step1과 Step2에서 구한 num1, num2를 라인의 면적(Line을 구성하는 전화수소)으로 나눈 값을 div1, div2(라인을 구성하는 화소수에 대한 인접 흑화소수의 비율)라 하고, 이 값중의 어느한 값이라도 임계치 α(임계 값을 저장하기 위한 변수로서 한국어 문자에서는 1/4이 가장적합)를 넘으면 문자 영역에서 추출된 라인으로 인장하여 이 라인을 추출된 라인 엔트리에서 삭제한다.
이때 라인의 상하 2~5 픽셀 사이를 조사한 것을 한국어 문자의 특성을 고려한것으로 이 경우가 오 분류된 라인을 가장 잘 추출하였다.
따라서 본 발명에 따른 오 추출라인 검출방법은 문서의 그래픽 부분을 처리할때 라인의 오추출 에러(error)를 줄여 문서 인식을 위한 그래픽 부분 처리를 정확하게 할수 있는 효과를 갖는다.
Claims (1)
- 문자문서의 라인추출에 있어서, 라인을 상단부영역과 하단부영역으로 분리하고 라인의 상단부영역 및 하단부영역의 데이타를 조사하여 좌표값을 증가시켜가면서 흑화소수의 누적값(num1, num2)을 각각 구한후 상기 상단부영역 및 하단부영역의 누적 혹화수소값을 각각 라인의 면적으로 나눈값이(div1, div2) 어느한 값이라도 설정한 임계치를 넘으면 문자영역에서 추출된 라인으로 인정하여 이 라인을 추출된 엔트리 라인에서 삭제하도록 진행되는 것을 특징으로 하는 오 추출라인 검출방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019900003707A KR930005568B1 (ko) | 1990-03-20 | 1990-03-20 | 오 추출 라인 검출 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019900003707A KR930005568B1 (ko) | 1990-03-20 | 1990-03-20 | 오 추출 라인 검출 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR910017329A KR910017329A (ko) | 1991-11-05 |
KR930005568B1 true KR930005568B1 (ko) | 1993-06-23 |
Family
ID=19297146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019900003707A KR930005568B1 (ko) | 1990-03-20 | 1990-03-20 | 오 추출 라인 검출 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR930005568B1 (ko) |
-
1990
- 1990-03-20 KR KR1019900003707A patent/KR930005568B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR910017329A (ko) | 1991-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Antonacopoulos | Page segmentation using the description of the background | |
JP2940936B2 (ja) | 表領域識別方法 | |
US5563403A (en) | Method and apparatus for detection of a skew angle of a document image using a regression coefficient | |
US5033104A (en) | Method for detecting character strings | |
Yuan et al. | Text extraction from gray scale document images using edge information | |
US20010012400A1 (en) | Page analysis system | |
US6711292B2 (en) | Block selection of table features | |
JP2006067585A (ja) | デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置 | |
US9189459B2 (en) | Document image layout apparatus | |
US5502777A (en) | Method and apparatus for recognizing table and figure having many lateral and longitudinal lines | |
US5455871A (en) | Detecting function words without converting a scanned document to character codes | |
Dori et al. | Segmentation and recognition of dimensioning text from engineering drawings | |
KR930002349B1 (ko) | 압축영상의 문자열 분리방법 | |
KR930005568B1 (ko) | 오 추출 라인 검출 방법 | |
Chang | Retrieving information from document images: problems and solutions | |
US20030123730A1 (en) | Document recognition system and method using vertical line adjacency graphs | |
KR19980058361A (ko) | 한글 문자 인식 방법 및 시스템 | |
JP4079411B2 (ja) | 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体 | |
JPH0564396B2 (ko) | ||
JPH07160810A (ja) | 文字認識装置 | |
JP3406942B2 (ja) | 画像処理装置及び方法 | |
JP2888885B2 (ja) | 文字切出し装置 | |
JPH02166583A (ja) | 文字認識装置 | |
JP3190794B2 (ja) | 文字切り出し装置 | |
JP2878327B2 (ja) | 文字切り出し装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 19981221 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |