KR20000034645A - 대용량 인쇄체 문자인식을 위한 특징 추출방법 - Google Patents

대용량 인쇄체 문자인식을 위한 특징 추출방법 Download PDF

Info

Publication number
KR20000034645A
KR20000034645A KR1019980052019A KR19980052019A KR20000034645A KR 20000034645 A KR20000034645 A KR 20000034645A KR 1019980052019 A KR1019980052019 A KR 1019980052019A KR 19980052019 A KR19980052019 A KR 19980052019A KR 20000034645 A KR20000034645 A KR 20000034645A
Authority
KR
South Korea
Prior art keywords
feature
characters
character
feature extraction
extracting
Prior art date
Application number
KR1019980052019A
Other languages
English (en)
Other versions
KR100317653B1 (ko
Inventor
지수영
장대근
오원근
Original Assignee
정선종
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정선종, 한국전자통신연구원 filed Critical 정선종
Priority to KR1019980052019A priority Critical patent/KR100317653B1/ko
Publication of KR20000034645A publication Critical patent/KR20000034645A/ko
Application granted granted Critical
Publication of KR100317653B1 publication Critical patent/KR100317653B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 다국어 문서 내에 포함된 모든 문자에 대하여 문자 영상의 변형과 크기에 무관한 대용량 인쇄체 문자인식에 적합한 특징 추출 방법에 관한 것으로서, 망(mesh) 값의 위치변형에 대한 누적빈도와 해밍 디스턴스(Hamming distance)의 누적 값의 조합에 의해 문자의 특징을 추출하는 대용량 인쇄체 문자인식을 위한 특징 추출 방법에 관한 것이다.
본 발명은 문자영상 획득 과정에서 광학 스캐너로 대용량 인쇄체 문자영상을 입력하는 단계와, 상기 문자영상 획득 과정에서 입력된 문자영상의 글자 크기가 각기 다른 문자들에 대해 전처리 과정에서 일정한 크기의 패턴으로 문자들을 정규화 하는 단계와, 상기 전처리 과정을 통해 정규화된 문자들에 대해 특징 추출 과정에서 특징별로 추출하는 단계와, 상기 특징 추출 과정을 통해 특징별로 추출된 문자들에 대해 대분류 과정에서 특징별로 재분류 하는 단계로 이루어진 대용량 인쇄체 문자인식을 위한 특징 추출 방법을 제시한다.

Description

대용량 인쇄체 문자인식을 위한 특징 추출 방법
본 발명은 다국어 문서 내에 포함된 모든 문자에 대하여 문자 영상의 변형과 크기에 무관한 대용량 인쇄체 문자인식에 적합한 특징 추출 방법에 관한 것으로서, 망(mesh) 값의 위치변형에 대한 누적빈도와 해밍 디스턴스(Hamming distance)의 누적 값의 조합에 의해 문자의 특징을 추출하는 대용량 인쇄체 문자인식을 위한 특징 추출 방법에 관한 것이다.
인식기의 성능은 사용되는 특징에 매우 민감하므로 효율적이고 신뢰도가 높은 안정적인 특징 추출방법이 필요하다. 또한 적절한 특징이란 입력문자의 변형에 대하여 영향을 적게 받아 입력의 특징을 최대한 나타내며, 인식율과 인식속도에 만족해야 한다. 특히 우리 나라에서 사용되는 한글문서는 폰트의 종류 및 활자체 변형이 매우 많고 심하기 때문에 폰트의 특성에 따라 인식에 적합한 특징추출 기술이 필수적으로 요구된다. 인쇄체 문자인식을 위한 기존의 여러 특징추출 방법들이 제안되었다.
망 특징, 문자영상을 수직, 수평으로 투영한 값을 특징으로 하는 투영 특징(Projection Feature), 기준점으로부터 수평, 수직으로 검출선을 그어 첫번째 검은 화소를 만날 때까지의 거리 값을 특징으로 사용하는 교차 거리 특징(Cross Distance Feature), 고리 투영(ring projection)에 의한 특징추출 방법 등이 있다. 이중에서 가장 많이 사용되는 특징은 인식율과 추출속도가 비교적 우수하다고 알려진 그물망(mesh feature)이 있다.
문자의 전체적인 특성을 반영하는 그물망은 문자패턴을 획의 배열로, 즉 검은 픽셀의 존재로서 특성을 줄 수가 있다. 망의 특징점은 검은 스트로크(stroke) 부분의 모양을 반영한다.
이 특징점을 추출하는 기존의 방법은 문자패턴을 M x N의 부분지역(cell)으로 나눈다. 그리고 각 지역의 검은 부분의 면적에 해당하는 값을 계산한다. 기존의 이 방법은 검은 픽셀이 속한 문자의 스트로크만을 대상으로 하기 때문에 문자의 큰 특징이 될 수 있는 배경부분을 놓치는 잘못을 안고 있다. 따라서 글자부분의 검은 부분의 면적을 특징점으로 하는 기존의 이 방법은 문자간의 다양한 변형과 유사성등 대용량 인쇄체 문자인식에 적합한 특징을 나타내기에는 다소 어려움이 있다.
따라서, 본 발명은 다국어 문서 내에 포함된 모든 문자 -한글, 한자, 영문자, 숫자, 특수기호- 에 대하여 문자 영상의 변형과 크기에 무관한 대용량 인쇄체 문자인식을 위하여 망 값의 위치변형에 대한 누적빈도와 해밍 디스턴스의 누적값의 조합에 의해 문자의 특징을 추출함으로써, 상기한 단점을 해소할 수 있는 대용량 인쇄체 문자인식을 위한 특징 추출 방법을 제공하는 데 그 목적이 있다.
상술한 목적을 달성하기 위한 본 발명에 따른 대용량 인쇄체 문자인식을 위한 특징 추출 방법은 문자영상 획득 과정에서 광학 스캐너로 대용량 인쇄체 문자영상을 입력하는 단계와, 상기 문자영상 획득 과정에서 입력된 문자영상의 글자 크기가 각기 다른 문자들에 대해 전처리 과정에서 일정한 크기의 패턴으로 문자들을 정규화 하는 단계와, 상기 전처리 과정을 통해 정규화된 문자들에 대해 특징 추출 과정에서 특징별로 추출하는 단계와, 상기 특징 추출 과정을 통해 특징별로 추출된 문자들에 대해 대분류 과정에서 특징별로 재분류 하는 단계를 포함하여 이루어진 것을 특징으로 한다.
또한, 전처리 과정에서 일정한 패턴으로 문자들을 정규화 시켜주기 위한 과정은 각 문자의 망 값을 망 값의 분포에 따라 8개의 위치 좌표로 표현하여 같은 글자를 모두 누적하여 위치좌표로 계산하는 제 1 단계와, 상기 위치좌표에 의해 글자부분과 배경부분을 각기 분리하는 제 2 단계와, 상기 글자들 상호간의 유사도를 측정하기 위하여 해밍 디스턴스를 이용하여 특징 값을 구하는 제 3 단계와, 상기 특징 값을 가지고 가중치 정규화를 수행하는 제 4 단계를 포함하여 이루어진 것을 특징으로 한다.
또한 본 발명은 문자영상 획득 과정에서 광학 스캐너로 대용량 인쇄체 문자영상을 입력하는 단계와, 상기 문자영상 획득 과정에서 입력된 문자영상의 글자 크기가 각기 다른 문자들에 대해 전처리 과정에서 일정한 크기의 패턴으로 문자들을 정규화 하는 단계와, 상기 전처리 과정을 통해 정규화된 문자들에 대해 특징 추출 과정에서 특징별로 추출하는 단계와, 상기 특징 추출 과정을 통해 특징별로 추출된 문자들에 대해 대분류 과정에서 특징별로 재분류 하는 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체인 것을 특징으로 한다.
도 1은 본 발명에 따른 대용량 인쇄체 문자인식을 위한 특징 추출에 관한 흐름도.
도 2는 본 발명에 따른 대용량 인쇄체 문자인식을 위한 특징 추출 방법을 설명하기 위해 도시한 흐름도.
도 3은 도 2에서의 망 특징 값의 변환 과정을 나타낸 도면.
도 4는 도 3에서 각 글자에 대해 글자, 배경부분을 분리하는 과정을 나타낸 도면.
도 5는 도 4에서 글자부분의 특징을 추출하는 과정을 나타낸 도면.
도 6은 도 4에서 배경부분의 특징을 추출하는 과정을 나타낸 도면.
<도면의 주요 부분에 대한 부호의 설명>
10: 문자영상 획득 11: 전처리
12: 특징 추출 13: 대분류
이하, 첨부된 도면을 참조하여 본 발명을 상세히 설명하기로 한다.
도 1은 본 발명에 따른 대용량 인쇄체 문자인식을 위한 특징 추출에 관한 흐름도이다.
문자영상 획득(10) 과정에서 광학 스캐너로 대용량 인쇄체 문자들을 입력하게 된다. 전처리(11) 과정에서는 상기 문자영상 획득(10) 과정을 통해 입력되는 글자 크기가 다른 문자들을 일정한 패턴으로 정규화 시켜준다. 각 문자의 망 값을 망 값의 분포(농도)에 따라 8개의 위치 좌표로 표현하여 같은 글자를 모두 누적하여 위치좌표로 계산하고, 위치좌표에 의해 글자부분과 배경부분을 각기 분리하며, 글자들 상호간의 유사도를 측정하기 위하여 해밍 디스턴스를 이용하여 특징을 구한다. 특징 추출(12) 과정에서는 상기 전처리(11) 과정에서 정규화된 가중치 값을 가지고 문자의 스트로크 부분과 배경부분의 특징을 추출한다. 대분류(13) 과정에서는 상기 특징 추출(12) 과정에서 특징별로 분류된 문자들을 분류하게 된다.
도 2는 본 발명에 따른 대용량 인쇄체 문자인식을 위한 특징 추출 방법을 설명하기 위해 도시한 흐름도이다.
입력된 문서 영상(20)으로부터 글자의 스트로크 부분과 배경부분의 특징을 추출하기 위하여 각 문자 크기에서 흑 연결성분의 최소 외접사각형(MBR) 문자 부분을 검출하여 문자를 분리(21)한다. 상기 최소 외접사각형 문자분리 과정은 입력문서 영상의 최좌상 화소로부터 행 우선 순서로 스캔(scan)하여 흑화소가 나타날 경우, 이를 시작으로 연결된 영역을 추적하여 이의 외접 사각형을 구한다. 이때 외접 사각형을 결정하는 정보는 입력문서 영상의 최좌상 좌표를 원점(0,0)으로 다음과 같이 최좌상, 최우하 좌표로 표현한다.
최좌상 좌표 = (min(Xi, Xj), min(Yi, Yj))
최우하 좌표 = (max(Xi, Xj), max(Yi, Yj))
상기 최소 외접사각형 문자부분 분리 방법으로 분리한 문자에 대해 문자크기 정규화(22) 과정을 수행한다. 분리된 문자들의 크기가 각기 다르므로 이를 일정한 크기로 정규화 과정이 필요하다. 본 발명에서는 모든 글자들에 대해 48 x 48의 2차원 크기로 일정하게 정규화 한다. 상기 정규화(22) 과정에 의해 만들어진 형판(template)을 가지고 3 x 3 망 오퍼레이션(mesh operation; 23) 과정을 수행하여 망 크기가 16 x 16 인 문자의 형판(template)을 생성(24)한다.
도 3은 도 2에서의 망 특징 값의 변환 과정을 나타낸 도면으로서, 대용량 인쇄체 문자인식을 위한 특징을 추출하기 위해 각 문자의 16 x 16 크기의 망 값을 망 값의 분포(농도)에 따라 8개의 위치 좌표로 표현한 후 같은 글자를 모두 누적하여 위치좌표로 변환하는 과정을 나타낸다. 16 x 16 크기로 정규화된 망 형판(30)상에서 각 망 값(mesh value)은 흑화소의 농도에 따라 망 오퍼레이션(23) 과정을 통하여 0-9 까지의 값을 갖는다. 글자 '가'에 대한 스트로크 값을 표시한 것이 도면부호 (31)이고, 이 값들은 흑화소의 농도에 따라 도면부호 (32)처럼 0-7까지의 위치좌표로 표현된다. 배경부분은 흑화소가 거의 없기 때문에 도면부호 (33)에서와 같이 0의 위치로 표시되고, 흑화소가 있는 도면부호 (36)은 도면부호 (34)처럼 7의 위치로 표현된다. 이렇게 하여 도 3과 같이 모든 문자에 대해 스트로크 부분과 배경부분을 위치 좌표 값으로 모두 누적하여 표현한다.
도 4는 도 3에서 각 글자에 대해 글자, 배경부분을 분리하는 과정을 나타낸 도면이다.
도면부호 (44)는 상기 도 3의 한글 '가'자를 표현한 것이고, 도면부호 (40)과 (41)처럼 한 글자에 대해 스트로크와 배경 부분에 대한 두개의 망 형판을 갖는다. 스트로크 부분은 6번과 7번의 위치 값의 합(41)으로 다시 표현하고, 배경부분은 0번과 1번 위치의 합(43)으로 새롭게 표현한다.
도 5는 도 4에서 글자부분의 특징을 추출하는 과정을 나타낸 도면이다.
스트로크 부분에 대해 4 x 4 영역의 총 16개의 구역으로 나누고 도면부호 (50), (51), (52) 및 (53) 각 구역에서 상기의 도 4에서 얻어진 특징의 누적 값을 가지고 특징 값의 크기가 최대인 좌표 값(54)을 하나씩 모두 16개를 한 문자의 스트로크에 대하여 크기순으로 저장한다.
도 6은 도 4에서 배경부분의 특징을 추출하는 과정을 나타낸 도면이다.
배경부분에 대해 경계 망(60), (61), (62) 및 (63)을 제외한 5 x 5 망 4개, 5 x 4 망 4개, 4 x 4 망 1개 총 9개의 구역으로 나누고, 각 구역에서 상기의 도 4에서 얻어진 배경부분 특징의 누적 값을 가지고 특징 값의 크기가 최대인 좌표 값(64)을 하나씩 모두 9개를 한 문자의 배경에 대하여 크기순으로 저장한다.
본 발명은 상기와 같이 한 문자에 대하여 스트로크 부분 16개, 배경부분 9개 등 총 25개의 위치좌표 값을 그 문자의 특징으로 추출하는 방법이다.
이상에서 설명한 본 발명은 본 발명이 속하는 기술분야에서 통상의 지식을 가진자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능함으로 전술한 실시 예 및 첨부된 도면에 한정되는 것이 아니다.
상술한 바와 같이 본 발명은 다국어 문서내에 포함된 모든 문자 -한글, 한자, 영문자, 숫자, 특수기호- 에 대하여 문자 영상의 변형과 크기에 무관한 대용량 인쇄체 문자인식을 위하여 망 값의 위치변형에 대한 누적빈도와 해밍 디스턴스의 누적값의 조합에 의해 문자의 특징을 추출하도록 함으로써, 문자간의 다양한 변형과 유사성 등 대용량 인쇄체 문자인식의 특징 추출에 적합하다.

Claims (5)

  1. 문자영상 획득 과정에서 광학 스캐너로 대용량 인쇄체 문자영상을 입력하는 단계와,
    상기 문자영상 획득 과정에서 입력된 문자영상의 글자 크기가 각기 다른 문자들에 대해 전처리 과정에서 일정한 크기의 패턴으로 문자들을 정규화 하는 단계와,
    상기 전처리 과정을 통해 정규화된 문자들에 대해 특징 추출 과정에서 특징별로 추출하는 단계와,
    상기 특징 추출 과정을 통해 특징별로 추출된 문자들에 대해 대분류 과정에서 특징별로 재분류 하는 단계를 포함하여 이루어진 것을 특징으로 하는 대용량 인쇄체 문자인식을 위한 특징 추출 방법.
  2. 제 1 항에 있어서,
    상기 전처리 과정에서 일정한 패턴으로 문자들을 정규화 시켜주기 위한 과정은 각 문자의 망 값을 망 값의 분포에 따라 8개의 위치 좌표로 표현하여 같은 글자를 모두 누적하여 위치좌표로 계산하는 제 1 단계와,
    상기 위치좌표에 의해 글자부분과 배경부분을 각기 분리하는 제 2 단계와,
    상기 글자들 상호간의 유사도를 측정하기 위하여 해밍 디스턴스를 이용하여 특징 값을 구하는 제 3 단계와,
    상기 특징 값을 가지고 가중치 정규화를 수행하는 제 4 단계를 포함하여 이루어진 것을 특징으로 하는 대용량 인쇄체 문자인식을 위한 특징 추출 방법.
  3. 제 1 항에 있어서,
    상기 정규화된 문자들에 대해 특징 추출 과정에서 특징별로 추출하기 위해 정규화된 가중치 값을 가지고 문자의 스트로크 부분과 배경 부분의 특징을 추출하는 것을 특징으로 하는 대용량 인쇄체 문자인식을 위한 특징 추출 방법.
  4. 제 3 항에 있어서,
    상기 정규화된 가중치 값을 가지고 문자의 스트로크 부분과 배경부분의 특징을 추출하는 과정은 각 문자 크기에서 흑 연결성분의 최소 외접사각형 문자 부분을 검출하여 문자를 분리하는 단계와,
    상기 최소 외접사각형 문자부분 분리 방법으로 분리한 문자에 대해 문자크기 정규화 과정을 수행하는 단계와,
    상기 정규화 과정에 의해 만들어진 형판을 가지고 3 x 3 망 오퍼레이션 과정을 수행하여 망 크기가 16 x 16 인 문자의 형판을 생성하는 단계를 포함하여 이루어진 것을 특징으로 하는 대용량 인쇄체 문자인식을 위한 특징 추출 방법.
  5. 문자영상 획득 과정에서 광학 스캐너로 대용량 인쇄체 문자영상을 입력하는 단계와,
    상기 문자영상 획득 과정에서 입력된 문자영상의 글자 크기가 각기 다른 문자들에 대해 전처리 과정에서 일정한 크기의 패턴으로 문자들을 정규화 하는 단계와,
    상기 전처리 과정을 통해 정규화된 문자들에 대해 특징 추출 과정에서 특징별로 추출하는 단계와,
    상기 특징 추출 과정을 통해 특징별로 추출된 문자들에 대해 대분류 과정에서 특징별로 재분류 하는 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1019980052019A 1998-11-30 1998-11-30 대용량인쇄체문자인식을위한특징추출방법 KR100317653B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980052019A KR100317653B1 (ko) 1998-11-30 1998-11-30 대용량인쇄체문자인식을위한특징추출방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980052019A KR100317653B1 (ko) 1998-11-30 1998-11-30 대용량인쇄체문자인식을위한특징추출방법

Publications (2)

Publication Number Publication Date
KR20000034645A true KR20000034645A (ko) 2000-06-26
KR100317653B1 KR100317653B1 (ko) 2002-02-19

Family

ID=19560598

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980052019A KR100317653B1 (ko) 1998-11-30 1998-11-30 대용량인쇄체문자인식을위한특징추출방법

Country Status (1)

Country Link
KR (1) KR100317653B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100408082B1 (ko) * 2001-07-30 2003-12-03 (주)유라비젼 인식률 및 가독성이 높은 한글 필기용 광학적 문자인식입력 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100408082B1 (ko) * 2001-07-30 2003-12-03 (주)유라비젼 인식률 및 가독성이 높은 한글 필기용 광학적 문자인식입력 방법

Also Published As

Publication number Publication date
KR100317653B1 (ko) 2002-02-19

Similar Documents

Publication Publication Date Title
Guo et al. Separating handwritten material from machine printed text using hidden markov models
KR100658119B1 (ko) 문자 인식 장치 및 방법
Pal et al. Automatic identification of english, chinese, arabic, devnagari and bangla script line
US8442319B2 (en) System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
US5369714A (en) Method and apparatus for determining the frequency of phrases in a document without document image decoding
US6674900B1 (en) Method for extracting titles from digital images
US5390259A (en) Methods and apparatus for selecting semantically significant images in a document image without decoding image content
Pal et al. Identification of different script lines from multi-script documents
JP2713622B2 (ja) 表形式文書読取装置
Pal et al. Automatic separation of words in multi-lingual multi-script Indian documents
JPH01253077A (ja) 文字列検出方法
Pal et al. Automatic separation of machine-printed and hand-written text lines
Casey et al. Document-analysis systems and techniques
Chanda et al. English, Devanagari and Urdu text identification
JP5538812B2 (ja) 画像処理装置、画像処理方法及びプログラム
Aravinda et al. Template matching method for Kannada handwritten recognition based on correlation analysis
Dhandra et al. Word-wise script identification from bilingual documents based on morphological reconstruction
Sinha et al. Word–wise script identification from indian documents
Srinivas et al. An overview of OCR research in Indian scripts
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
Padma et al. Script Identification from Trilingual Documents using Profile Based Features.
JPH0721817B2 (ja) 文書画像処理方法
Tsai et al. Efficiently extracting and classifying objects for analyzing color documents
Chanda et al. Identification of Japanese and English script from a single document page
KR100315428B1 (ko) 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121129

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20131128

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20141224

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20160805

Year of fee payment: 15

R401 Registration of restoration
FPAY Annual fee payment

Payment date: 20161125

Year of fee payment: 16

FPAY Annual fee payment

Payment date: 20171110

Year of fee payment: 17