KR930008060B1 - 문서 인식방법 - Google Patents

문서 인식방법 Download PDF

Info

Publication number
KR930008060B1
KR930008060B1 KR1019910010479A KR910010479A KR930008060B1 KR 930008060 B1 KR930008060 B1 KR 930008060B1 KR 1019910010479 A KR1019910010479 A KR 1019910010479A KR 910010479 A KR910010479 A KR 910010479A KR 930008060 B1 KR930008060 B1 KR 930008060B1
Authority
KR
South Korea
Prior art keywords
group
input image
height
recognition
width
Prior art date
Application number
KR1019910010479A
Other languages
English (en)
Other versions
KR930001094A (ko
Inventor
노희호
Original Assignee
주식회사 금성사
이헌조
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 금성사, 이헌조 filed Critical 주식회사 금성사
Priority to KR1019910010479A priority Critical patent/KR930008060B1/ko
Publication of KR930001094A publication Critical patent/KR930001094A/ko
Application granted granted Critical
Publication of KR930008060B1 publication Critical patent/KR930008060B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

내용 없음.

Description

문서 인식방법
제 1 도는 본 발명에 따른 문서 인식회로도.
제 2 도는 본 발명에 따른 문서 인식방법 알로리즘도.
제 3 도는 4×4메쉬(mesh)를 보인 도면.
[표 1]은 각 군에 속하는 기호를 보인 표.
본 발명은 문서 인식의 한 분야인 숫자등의 인식에 관한 것으로, 특히 문서상에 존재하는 기호들을 별도로 구별하지 않고 이들을 인식함으로써 인식속도를 향상시키고 보다 간단한 알로리즘을 이용하여 인식률이 향상되도록 한 문서 인식방법에 관한 것이다.
일반적으로 문자부분을 제외한 문서상에 존재하는 숫자, 기호등을 구별하지 않고 동시에 인식하는 종래 방법은 없으며 숫자인식의 경우에도 주로 숫자영상을 세선화하여 굴곡점, 단점등의 특징을 이용하여 인식을 행하는 수법이 주종을 이루고 있으며 이럴 경우에는 세선화 과정에 많은 시간이 걸리고 인식률도 이 세선화 방법에 좌우되는 단점을 가지고 있었다.
이에따라 본 발명은 인식대상을 다수의 군으로 나누고 각 군별로 별도의 인식 알고리즘을 적용하여 숫자, 기호등이 동시에 인식되도록 창안한 것으로 이를 상세히 설명하면 다음과 같다.
제 1 도는 본 발명에 따른 회로의 블럭구성도로서 이에 도시한 바와같이 입력형상을 받아들이는 스캐너(1)와, 상기 스캐너(1)와 DSP칩(5) 또는 스캐너(1)와 호스트 컴퓨터(4)를 연결시키는 스캐너 인터페이스(2)와, 전체 시스템을 제어하는 DSP칩(5)와 호스트 컴퓨터(4), DSP칩(5)에 부착된 프로그램 메모리(6) 및 데이타 메모리(7)과 DSP칩(5)와 호스트 컴퓨터(4)사이에 정보전달을 매개하는 호스트 인터페이스(3)로 구성된다.
상기와 같이 구성되는 본 발명의 회로에 대하여 그 동작 및 작용효과를 설명하면 다음과 같다. 먼저 DSP칩(5)은 프로그램 메모리(6)에 저장되어 있는 알고리즘을 사용하여 입력영상을 인식하고 인식된 영상의 코드값은 데이타 메모리(7)에 저장되며 또다른 인식 루트는 스캐너(1), 스캐너 인터페이스(2) 및 호스트 컴퓨터(4)를 통한 루트로 입력된 영상을 호스트 컴퓨터(4)가 직접 억세스하여 입력영상을 인식한다.
또한 상기와는 다른 인식 루트로서 인식은 DSP칩(5)이 수행하고 데이타 메모리(7)에 저장된 인식 코드값을 호스트 인터페이스(3)를 통하여 호스트 컴퓨터(4)가 억세스하여 파일을 재구성한다든가 인식 코드값을 프린트하게 된다.
한편, 인식하고자 하는 대상은 그 크기, 입력문자열상에서 이 위치등이 서로 상이하여 이들을 동시에 인식하는 것이 어려우므로 인식대상을 표1과 같이 4개의 군으로 나누어 각 군별로 별도의 인식 알고리즘을 적용하여 인식하며 각 군별로 나누는 기준은 문자열의 위치와 영상의 크기정보를 이용하여 실험적으로 군을 분류하는데 영상을 군별로 분류하여 인식하는 과정을 제 2 도의 신호 흐름도와 함께 설명하면 다음과 같다.
즉, 영상이 입력되면 이 영상에 대하여 수평 및 수직방향으로 흑화소의 덩어리(Cluster)수를 구한 다음 입력영상의 높이가 문자열 높이의 1/2이하이면 이 영상을 제 1 군의 기호로 분류하여 인식을 행하고 그렇지 않으면 수평 및 수직방향의 흑화소 덩어리의 수를 구하는데 예를들어 "="의 경우에는 수평방향의 클러스터는 2이고 수직방향의 클러스터는 1이 된다. 즉, 영상을 수평방향으로 스캔하면 흑화소가 존재하지 않는 영역이 흑화소 사이에 존재하므로 흑화소 클러스터 수는 2가 되며 수직방향으로 독립된 흑화소군이 하나이므로 수직클럭스터 수는 1이 된다.
이와같이 수평방향의 클러스터 수가 2이고 수직방향의 클러스터 수가 1인 영상들을 제 2 군으로 분류하여 이를 인식하게 되며 다음에 1, 2군에 속하지 않는 영상들은 그 높이가 폭보다 3배 이상이거나 높이와 폭의 차가 폭과 높이중 작은 값의 1/4보다 작으면 제 3 군으로 분류하여 인식하고 그렇지 않으면 제 4 군으로 분류하여 인식하게 된다.
한편 상기와 같이 4개의 군으로 분류된 영상에 대하여 이를 인식하는 방법을 설명하면 다음과 같다.
먼저 제 1 군에 속하는 기호(.,""-_=*)를 인식하는데 있어서, 수직클러스터의 수 및 수평클러스터 수가 1인 경우에는 문자열의 위치, 폭/높이의 비율을 이용하거나, 입력영상의 하단부의 굴곡을 조사하거나, 하단점의 위치를 조사하거나, 수평 런 랭스(run length), 영상의 폭 또는 영상의 높이를 서로 비교하여 인식하고, 제 2 군에 속하는 기호(: ; =?)는 입력영상의 높이가 폭의 2배 이상이면 상하 클러스터의 수직 런랭스와 하단 클러스터의 굴곡과 수평 런 랭스를 이용하여 인식하고, 입력영상의 높이가 폭의 2배 이하일때는 영상의 높이와 폭의 비를 이용하여 2군의 부호를 인식하고, 입력영상의 높이가 2배 이하일 때는 영상의 높이와 폭의 비를 이용하여 2군의 부호를 인식하며, 제 3 군에 속하는 기호([ ] 〈 〉@8)({ })는 기호의 특성상 수직방향의 중간 영역이 그 중요한 특징이 되므로 입력영상의 좌, 우 투영특성(projection profile)를 구하여 5구간으로 영역을 분할하고 각 구간에 대해 흑화소가 처음 나오는 거리의 평균값을 구해 좌측의 값들을 각각 cell[0]∼cell[3]으로 하고 우측의 값들을 각각 celr[0]∼celr[3]으로 하고 이 값들을 이용하여 각 구간의 특징값들을 양자화하는데, 이때 양자화된 값을 좌, 우측 각각 ref[0]....ref[3], refr[0]....refr[3]라 한다. 이때 a=cell[0]-cell[1]이라고 할 때 a≥4이면 ref[0]=4, 2≤a≤4이면 ref[0]=3, -2〈a〈2이면 ref[0]=2, -4〈a〈-2이면 ref[0]=1, a≤-4이면 ref[0]=0으로 하며 ref[1]에서부터는 다음과 같이 바로 윗영역의 값과 비교하여 결정한다. 즉, ref[1]는 a=cell[0]-cell[1]의 값으로 상기와 같은 방법으로 결정하며, ref[2]는 a=cell[1]-cell[2]의 값으로 상기와 같이 결정하고, ref[3]는 a=cell[2]-cell[3]의 값으로 결정하는데 우측의 특성값 refr[ ]의 값도 cell[ ]을 사용하는 대신 celr[ ]을 사용하는 것을 제외하고는 ref[ ]의 값을 구하는 방법과 동일하다.
또한 ref[0]∼ref[3]과 refr[0]∼ref[3]의 값들을 기준값(reference)과 패턴 매칭(pattern matching)을 하여 숫자를 인식한다.
한편, 제 4 군에 속하는 기호(1234567890 ? *+&$/#%)는 정규화된 메쉬(mesh)를 이용하여 인식하는데 먼저 입력영상을 32×32화소의 영역으로 정규화하고 이 정규화된 영상을 제 3 도에서와 같이 4×4메쉬로 구성된 16개의 영역을 분할하며 16개의 각 영역에 대하여 흑화소의 밀도를 구하고 이를 이용하여 각 영역의 특성을 구하는데 cell[i][j]를 (32×32메쉬의 서브영역)의 밀도를 den이라 하고 구해진 특성값을 cham[i][j](i, j=0......3)이라 하면 cham[i][j]는 다음과 같이 구해진다. 즉 den≤0.2이면 cham[i][j]=1이고, 0.2≤den≤0.4이면 cham[i][j]=2이며, 0.4≤den≤0.6이면 cham[i][j]=3, 0.6≤den≤0.8이면 cham[i][j]=4, 0.8≤den≤1이면 cham[i][j]=5로 하여 상기 cham[i][j]값을 기준값(reference)과 패턴 매칭(pattern matching)을 하여 제 4 군에 속하는 요소를 인식하게 된다.
이상에서와 같이 본 발명은 인식대상을 먼저 다수의 군으로 나누고 각 군별로 별도의 알고리즘을 적용하여 숫자, 기호등이 동시에 인식되도록 함으로써 문서의 인식 효율을 높이고 시간을 단축시키는 효과를 제공한다.
[표]

Claims (3)

  1. 문서인식에 있어, 입력영상의 특징에 따라 4개의 군으로 대별할 때, 입력영상의 높이가 그 폭의 1/2보다 작으면 제 1 군으로 분류하여 인식을 수행하고, 수직클러스터의 수가 1이고 수평클러스터의 수가 1이 아니면 제 2 군으로 분류하여 인식을 수행하며, 입력영상의 높이가 그 폭보다 3배 이상이거나 높이와 폭의 차의 절대값이 높이와 폭중 작은 값의 1/4보다 작으면 제 3 군으로 분류하여 인식을 수행하고, 그 이외의 입력 영상은 제 4 군으로 분류하여 인식을 수행하는 것을 특징으로 하는 문서 인식방법.
  2. 제 1 항에 있어서, 제 1 군은 작은 기호군으로(.,''"-_=*)를 포함하고, 제 2 군은 분리된 심볼로서(: ; = ?)를 포함하며, 제 3 군은 ([ ]〈 〉@8) ({ })를 포함하고, 제 4 군은 (1234567890 ? *+&$/#%)를 포함하도록 분류하는 것을 특징으로 하는 문서 인식방법.
  3. 제 2 항에 있어서, 제 1 군은 수평 수직방향의 클러스터의 수와 입력영상의 문자열에서의 위치, 입력영상의 하단부의 굴곡과 수평방향의 런 랭스 및 입력영상의 높이와 폭의 비를 이용하여 인식하며, 제 2 군은 입력영상이 상하 클러스터의 최대 런 랭스와 하단 클러스터의 수평 런 랭스, 입력영상의 수평 및 수직길이를 이용하여 인식하며, 제 3 군은 영상의 좌우 투영 특성을 이용하여 인식하고, 제 4 군은 정규화된 8×8메쉬를 이용하여 인식하는 것을 특징으로 하는 문서 인식방법.
KR1019910010479A 1991-06-24 1991-06-24 문서 인식방법 KR930008060B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019910010479A KR930008060B1 (ko) 1991-06-24 1991-06-24 문서 인식방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019910010479A KR930008060B1 (ko) 1991-06-24 1991-06-24 문서 인식방법

Publications (2)

Publication Number Publication Date
KR930001094A KR930001094A (ko) 1993-01-16
KR930008060B1 true KR930008060B1 (ko) 1993-08-25

Family

ID=19316194

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910010479A KR930008060B1 (ko) 1991-06-24 1991-06-24 문서 인식방법

Country Status (1)

Country Link
KR (1) KR930008060B1 (ko)

Also Published As

Publication number Publication date
KR930001094A (ko) 1993-01-16

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US5212739A (en) Noise tolerant optical character recognition system
JP2940936B2 (ja) 表領域識別方法
CN1121662C (zh) 以直线段为主的手写体字符的预处理方法和手写体识别设备
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US4903313A (en) Character recognition method
EP0381773B1 (en) Character recognition apparatus
US20100239166A1 (en) Character recognition device, image-reading device, computer readable medium, and character recognition method
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
JPH1196301A (ja) 文字認識装置
Herwanto et al. Zoning feature extraction for handwritten Javanese character recognition
KR930008060B1 (ko) 문서 인식방법
CN109800758A (zh) 一种极大值区域检测的自然场景文字检测方法
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
Okun et al. A survey of texture-based methods for document layout analysis
JP3113769B2 (ja) 文字認識装置
JP3196291B2 (ja) 文字認識方法および装置
JPS615383A (ja) 文字パタ−ン分離装置
JP3104355B2 (ja) 特徴抽出装置
JP2613211B2 (ja) 画像入力装置
JPH11120291A (ja) パタン認識システム
JPS60147891A (ja) 文字認識装置
JPH09128478A (ja) 画像処理装置
JP3277977B2 (ja) 文字認識方法
JPH03126188A (ja) 文字認識装置

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 19961230

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee