KR100383858B1 - 문자인식장치의 문자추출방법 및 장치 - Google Patents

문자인식장치의 문자추출방법 및 장치 Download PDF

Info

Publication number
KR100383858B1
KR100383858B1 KR10-2000-0032889A KR20000032889A KR100383858B1 KR 100383858 B1 KR100383858 B1 KR 100383858B1 KR 20000032889 A KR20000032889 A KR 20000032889A KR 100383858 B1 KR100383858 B1 KR 100383858B1
Authority
KR
South Korea
Prior art keywords
character
image
characters
binary image
memory
Prior art date
Application number
KR10-2000-0032889A
Other languages
English (en)
Other versions
KR20010015025A (ko
Inventor
아카기다쿠마
Original Assignee
가부시끼가이샤 도시바
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시끼가이샤 도시바 filed Critical 가부시끼가이샤 도시바
Publication of KR20010015025A publication Critical patent/KR20010015025A/ko
Application granted granted Critical
Publication of KR100383858B1 publication Critical patent/KR100383858B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)

Abstract

본 발명은 문자추출방법에 관한 것으로, 입력된 문자화상의 명암화상에 기초하여 문자인식을 하기 위한 문자인식장치에서, 입력된 문자화상의 명암화상은 적어도 화소의 농도값을 이용하여 문자영역과 배경영역으로 분리되고, 상기 문자영역은 적어도 화소의 농도값을 이용하여 다시 2개 이상의 영역으로 분리되며, 이러한 재분리에 의해 얻어진 영역정보에 기초하여 문자들을 각각의 문자로 분리하는 것을 특징으로 한다.

Description

문자인식장치의 문자추출방법 및 장치{CHARACTER EXTRACTING METHOD AND DEVICE}
본 발명은, 예를 들어 입력된 명암 문자화상에 따라 문자를 인식하는 문자인식장치에서 각 문자로부터 접촉 문자를 각각 추출하는 문자추출방법 및 장치에 관한 것이다.
일반적으로, 문자인식기술은 문자화상의 입력, 문자열의 추출, 문자 추출, 및 문자 인식등으로 크게 나누어진다.
일반적으로, 접촉 문자는 입력된 문자화상을 2치화한 후 추출된다. 입력된 문자화상은 문자영역 및 배경영역으로 나누어진다. 그때, 다수의 문자는 접촉상태에서 하나의 문자영역으로 추출된다. 종래 기술에서, 이들 접촉 문자는 접촉 문자의 형상에 따라 구조분석적으로 분리점을 구함으로써 서로 분리되었다. 즉, 접촉 문자의 형상이 계곡과 같이 움푹들어간 곳이 있는 경우, 움푹 패인 곳이 접촉점으로 판단되어 문자영역이 각각의 문자로 분리되었다.
그러나, 접촉 문자의 접촉점의 형상에 대해 다수의 패턴이 고려되고, 종래 기술에 따라 분리될 수 있는 패턴은 이들 패턴중 소수의 특수형상에만 제한된다.
일반적으로, 손으로 쓰여진 문자의 문서화상의 경우, 그들을 추출할 때 접촉 문자의 대부분은 문서가 입력될 때 처음부터 입력된 문서화상상의 문자가 이미 접촉된 경우가 많다.
반대로, 인쇄활자의 문서화상의 경우, 문자들이 추출될 때 문제가 되는 문자 접촉 원인의 대부분은, 문자들이 실제로 접촉하는 것이 아니라 스캐너(문자화상 입력장치)의 저해상도 및 2치화 처리동안 2치화 실수에 기인한다.
따라서, 2치화된 입력된 문자화상인 명암화상으로 되돌아가는 경우, 문자들간의 접촉점이 비교적 용이하게 검출가능해야 한다.
그러나, 단순하게 명암화상만이 이용되는 경우, 문자영역의 특징, 처리속도의 지연을 포함하여 문제가 더 복잡해지고, 또한 문자위치 추정에서의 오류등과 같은 좋지못한 효과가 발생되며, 성능이 더 저하된다.
따라서, 본 발명의 목적은 형상으로부터 발견하기 어려운 접촉 문자를 고정밀 고효율적으로 발견하고 그들을 분리할 수 있는 문자추출방법을 제공하는 것이다.
도 1은 스캐너에 의한 입력전의 입력된 문서화상의 한 예를 나타내는 확대도,
도 2는 메쉬로 구획하여 문서화상의 입력 상태를 설명하기 위한 도면,
도 3은 스캐너에 의해 입력된 명암화상의 한 예를 나타내는 도면,
도 4는 도 3에 도시된 명암화상을 2치화하여 2치화된 화상의 한 예를 나타내는 도면,
도 5는 본 발명의 문자추출방법이 적용가능한 문자추출장치의 구성을 개략적으로 나타낸 블럭도,
도 6은 본 발명의 문자추출방법을 설명하는 플로우차트,
도 7은 제 1의 2치화부에서 2치화된 제 1의 2치화 화상의 한 예를 나타내는 도면,
도 8은 제 2의 2치화부에서 2치화된 제 2의 2치화 화상의 한 예를 나타내는 도면, 및
도 9는 문자분리부에서 접촉 문자 위치를 판정하는 방법을 설명하는 플로우차트이다.
* 도면의 주요부분에 대한 부호의 설명 *
1 : 스캐너 2 : 제 1 화상메모리
3 : 제 1의 2치화부 4 : 제 2 화상메모리
5 : 접촉 문자 추정부 6 : 제 2의 2치화부
7 : 제 3 화상메모리 8 : 문자분리부
9 : 선택부
본 발명에 따르면, 입력된 문자화상에 따라 문자를 인식하는 문자인식장치의 문자추출방법을 제공하고, 상기 방법은 상기 입력된 문자화상을 제 1의 2치화처리에 의해 문자영역과 배경영역으로 분리하는 제 1 단계; 상기 제 1 단계에서 분리된 상기 문자영역에서 상기 문자화상의 각 화소의 농도값을 이용하여 제 2의 2치화처리에 따라 상기 문자영역을 2 개 이상의 영역으로 분리하는 제 2 단계; 및 상기 제 2 단계에 의해 얻어진 영역정보를 기초로 문자와 문자를 분리하는 제 3 단계로 이루어진다.또한, 본 발명에 따르면, 입력된 문자화상에 따라 문자를 인식하고 추출하는 문자추출장치를 제공하고, 상기 장치는 상기 입력된 제 1의 2치화처리에 의해 문자영역과 배경영역으로 분리하는 제 1 분리수단; 상기 제 1 분리수단으로 분리된 상기 문자영역에서 상기 문자화상의 각 화소의 농도값을 이용하여 제 2의 2치화처리에 의해 상기 문자영역을 2 개 이상의 영역으로 분리하는 제 2 분리수단; 및 상기 제 2 분리수단에 의해 얻어진 영역정보를 기초로 문자와 문자를 분리하는 제 3 분리수단으로 이루어진다.
첨부된 도면을 참조하여 본 발명의 적절한 실시예를 후술한다.
또한, 다음의 설명에서, 화소의 농도값이 작아질수록 그들 화소가 더 검어지고, 농도값이 커질수록 화소가 더 희게 된다고 가정한다.
도 1은 스캐너에 의한 입력전의 확대된 입력된 문서화상을 나타낸다. 도 "1"과 도 "2"는 서로 근접하게 도시되었지만, 그들 사이에 공백이 있기 때문에 서로 접촉하지 않는다. 이제, 스캐너를 이용하여 그러한 문서화상을 판독하는 경우를 생각해보자.
스캐너는 도 2에 도시된 바와 같은 메쉬에서 문서화상을 구획하고, 각각의 직사각형내 농도의 평균값을 취하며, 직사각형에 대응하여 화소의 대표 농도로서 평균 농도값을 입력한다. 도 3에 스캐너에 의해 입력된 명암화상의 한 예가 도시되어 있다. 이러한 예에서, 명암화상은 세로로 6도트, 가로로 12도트 화상이다.
도 3에서, 검게 색칠된 a부분은 최고 농도 화소를 나타내고, 교차 사선으로 도시된 b부분은 화소 a보다 농도가 작은 화소를 나타내며, 굵은 사선으로 도시된 c부분은 화소 b보다 농도가 작은 화소를 나타내고, 가는 사선으로 도시된 d부분은 화소 c보다 농도가 작은 화소를 각각 나타낸다.
문자들간의 공백의 폭이 스캐너에 의해 취해진 직사각형보다 얇은 경우, 그들이 도 3에 도시된 바와 같은 공백부에 있는 경우라도 저농도의 화소가 얻어진다. 따라서, 이 화상이 2치화될 때, 도 4에 도시된 바와 같이 2개의 접촉 문자 형상인 2치화상이 얻어진다.
종래의 문자추출방법에서, 도 4에 도시된 2치화상만을 이용하여 접촉 문자가 분리되었다.
그러나, 도 3에 도시된 명암화상을 보면, 문자의 윤곽이 문자의 중심부보다 더 고농도이다. 문자의 접촉부 또한 예외가 아니고, 공백에 대응하는 화소가 문자부보다 더 고농도이다.
따라서, 본 발명에서, 고농도인 부분이 효과적으로 발견되고, 접촉 문자부를 결정함으로써 문자영역이 각각의 문자로 분리된다. 이것이 상세하게 후술되어 있다.
도 5는 본 발명의 문자추출방법이 적용될 수 있는 문자추출장치의 구조를 나타내는 블럭도이다. 도 5에서, 문자화상 입력수단인 스캐너(1)는 광학적으로 입력된 문서화상을 판독하고, 도 3에 도시된 바와 같은 명암화상을 입력한다. 스캐너(1)에 의해 입력된 명암화상은 제 1 화상메모리(2)에 임시 저장된다.
제 1의 2치화부(3)는 예를 들어 공지된 오츠(Ohtsu)의 2치화법(노부유키 오츠(Nobuyuki Ohtsu)의 "Automatic Threshold Selection Method according to Discrimination and Minimum Square Standard"(Shingakuron(D), vol.J63-D, no.4, pp.349-356, 1980) 참조)에 따라 제 1 화상메모리(2)에 임시 저장된 명암화상을 2치화하고, 도 4에 도시된 바와 같은 제 1의 2치화상을 출력한다.
또한, 명암화상을 위한 2치화방법이 미국특허 제5,784,500호(1988.7.21)에 개시되어 있다.
제 1의 2치화부(3)로부터 출력된 제 1의 2치화상은 제 2 화상메모리(4)에 임시 저장된다. 접촉 문자 추정부(5)는 제 2 화상메모리에 임시 저장된 제 1의 2치화상에 기초하여 접촉 문자가 있는가를 추정(판단)한다. 추정 기준을 고려하면, 흑화소영역의 측면크기가 종방향 크기보다 큰 경우, 다수의 문자들이 접촉하고 있는 것으로 추정된다.
제 2의 2치화부(6)는 다수의 문자가 접촉하는 것으로 접촉 문자 추정부(5)가 추정될 때 동작하고, 제 1 화상메모리(2)에 임시 저장된 명암화상 및 제 2 화상메모리(4)에 임시 저장된 제 1의 2치화상이 입력될 때, 제 1의 2치화상의 흑화소의 위치에 대응하는 명암화상 화소로부터만 농도값이 취해지고, 히스토그램에 등록된다.
그리고, 얻어진 히스토그램에 기초하여, 제 2의 2치화부(6)는 상기한 공지된 오츠의 2치화법을 이용하여 히스토그램의 농도값을 이등분하는 임계값을 얻는다. 2치화상의 흑화소중 명암화상의 동일한 좌표의 농도값이 얻어진 임계값보다 큰 경우에만 흑화소가 백화소로 반전되고, 새로운 2치화상(제 2의 2치화상)이 형성된다.
제 2의 2치화부(6)로부터 출력된 제 2의 2치화상은 제 3 화상메모리(7)에 임시 저장된다. 문자 분리부(8)는 제 1 화상메모리(2)에 임시 저장된 명암화상, 제 2 화상메모리(4)에 임시 저장된 제 1의 2치화상, 및 제 3 화상메모리(7)에 임시 저장된 제 2의 2치화상에 기초하여 접촉 문자 위치를 결정하고, 이렇게 결정된 문자 접촉위치상의 정보에 기초하여 문자화상을 각각의 문자로 분리한다. 이때 제 1의 2치화부(3)에서 얻어진 문자화상(제 1의 2치화상)이 분리된다.
선택부(9)는 접촉 문자 추정부(5)에 의한 추정 결과에 기초하여 문자 분리부(8)의 출력 또는 제 2 화상메모리(4)의 저장내용을 선택한다. 즉, 접촉된 문자가 없다고 접촉 문자 추정부(5)가 추정한 경우, 제 2 화상메모리(4)의 저장 내용이 선택되고, 접촉 문자가 있다고 추정한 경우, 문자 분리부(8)의 출력이 선택된다.
다음, 본 발명의 문자추출방법이 도 6에 도시된 플로우차트를 참조하여 상세하게 후술된다. 먼저, 스캐너(1)에 명암문자화상이 입력되고, 제 1 화상메모리(2)에 임시 저장된다(S1). 그리고, 제 1 화상메모리(2)내 명암화상은 오츠의 2치화법을 이용하여 제 1의 2치화부(3)내 제 1의 2치화상으로 변환되고, 제 2 화상메모리(4)에 임시 저장된다.
그리고, 접촉 문자 추정부(5)는 제 2 화상메모리(4)내 얻어진 제 1의 2치화상에 기초하여 접촉 문자가 있는지를 판단한다(S3). 접촉 문자 판단을 위한 기준을 고려하면, 흑화소영역의 측면 크기가 종방향 크기보다 큰 경우, 다수의 문자가 접촉되는 것으로 판단한다. 접촉 문자가 없는 경우, 처리가 종료된다. 이러한 경우, 선택부(9)는 제 2 화상메모리(4)내 제 1의 2치화상을 선택하고, 그것을 다음 인식처리로 전송한다.
접촉 문자가 있는 것으로 판단될 때, 제 2의 2치화부(6)는 제 1의 2치화부(3)내 얻어진 제 1의 2치화상의 흑화소의 위치에 대응하는 명암화상 화소만으로부터 농도값을 취하고, 히스토그램에 등록한다(S4). 그리고, 얻어진 히스토그램에 기초하여, 오츠의 2치화법을 이용하여 히스토그램의 농도값을 이등분하는 임계값이 얻어진다. 2치화상의 흑화소중 명암화상의 동일 좌표의 농도값이 얻어진 임계값보다 큰 경우, 흑화소는 백화소로 반전되고, 제 2의 2치화상이 형성되어 제 3 화상메모리(7)에 임시 저장된다(S5).
도 7은 제 1의 2치화부(3)내 2치화된 제 1의 2치화상의 한 예를 나타내고, 도 8은 제 2의 2치화부(6)내 2치화된 제 2의 2치화상의 한 예를 나타내며, 도 7-8에서, 흑직사각형은 2치화에서 흑화소가 될 것으로 생각되는 부분이고, 백직사각형은 2치화에서 백화소가 될 것으로 생각되는 부분이다.
농도 히스토그램이 문자영역에 대해서만 다시 기입되고 2치화되는 경우, 상기한 바와 같이 스캐너의 양자화 오차에 의해 흑화소가 된 부분, 즉 문자들간의 근접부 또는 문자들의 윤곽은 농도값때문에 백화소로 변한다. 따라서, 도 8에서 문자 "2"와 "5", 그리고 "5"와 "3" 사이에 새로운 공백이 생성되는 것을 볼 수 있다(도면의 화살표부).
그리고, 문자분리부(8)에서, 제 2의 2치화부(6)에서 얻어진 제 2의 2치화상, 제 1의 2치화부(3)에서 얻어진 제 1의 2치화상, 및 스캐너(1)에서 입력된 명암화상에 기초하여 접촉 문자 위치가 결정된다(S6). 접촉 문자 위치의 결정이 상세하게 후술된다. 그리고, 결정된 접촉 문자 위치에 대한 정보에 기초하여, 문자화상(제 1의 2치화부(3)에서 얻어진 제 1의 2치화상)은 각각의 문자(S7)로 분리된다. 이러한 경우, 선택부(9)는 문자분리부(8)의 출력을 선택하고, 그것을 다음 인식처리로 전달한다.
다음, 문자분리부(8)에서 접촉 문자 위치 결정방법이 도 9에 도시된 플로우차트를 참조하여 상세하게 설명될 것이다. 먼저, 제 1의 2치화부(3)에서 얻어진 제 1의 2치화상은 제 2의 2치화부(6)에서 얻어진 제 2의 2치화상과 비교되고, 백화소로 새롭게 반전된 다수의 화소를 포함하는 열이 검지된다(S11). 그리고, 단계(S11)에서 검지된 열은 제 2의 2치화상의 종방향으로 단일 흑화소가 있는지가 점검된다(S12).
상기 점검 결과 종방향에서 단일 흑화소가 검지되지 않는 경우, 단계(S14)로 동작이 진행된다. 흑화소가 검출되는 경우, 스캐너(1)에 의해 입력된 명암화상이 점검된다(S13). 즉, 명암화상의 동일 열에서 상기 열의 제 1의 2치화상내 흑화소의 위치에서의 평균 농도값이 얻어진다. 상기 열의 좌우에 있는 여러 열들에서 동일한 처리가 실행된다. 상기 열이 좌우 열에 대해 리지(ridge)인 경우; 즉, 좌우 열의 농도값의 평균값이 동일한 열의 농도값의 평균값보다 작은가를 판정한다. 판정 결과 평균값이 더 작은 경우 단계(S14)로 진행하고, 작지 않은 경우 화상이 분리후보에서 제외된다(문자가 분리되지 않는다).
그리고, 단계(S12) 또는 단계(S13)의 처리에서 얻어진 열의 좌우측(양측)에 문자가 있는가 점검된다(S14). 도 8에 도시된 바와 같이 제 2의 2치화상으로부터 얻어진 백화소는 문자의 접촉점외에 문자 가장자리에 나타난다. 따라서, 상기 열의 양단부에 문자가 있는가를 점검할 필요가 있다. 예를 들어, 제 1의 2치화상에 기초하여 상기 열의 양단부에서 여러 열에 걸쳐 흑화소의 수가 카운트되고, 일정값 이상의 흑화소가 있는 경우, 문자가 존재하는 것으로 간주된다.
단계(S14)의 점검 결과 문자가 발견되지 않는 경우, 분리후보에서 화상이 제외되고(문자가 분리되지 않고), 문자가 있는 경우, 문자분리부에 의해 문자 분리처리가 실행된다(S15).
또한, 도 9에 도시된 플로우차트의 단계(S12)에서 문자화상을 입력하는 스캐너(1)의 해상도가 낮은 경우, 일부 흑화소가 있는 경우라도 단계(S14)로 이동한다. 이러한 경우, 분리후보 판단기준으로, 제 1의 2치화부(3)에서 얻어진 제 1의 2치화상의 흑화소와 제 2의 2치화부(6)에서 얻어진 제 2의 2치화상의 흑화소와의 차이가 취해지고, 더 큰 차이를 갖는 열이 문자분리를 위한 후보열이 된다. 이러한 경우, 차이 크기를 나타내는 임계값이 낮아서, 스캐너(1)의 해상도가 낮아지도록 한다.
상기한 바와 같이, 상기 실시예에 따르면, 지금까지 2치화상에 의해서만 분리될 수 없었던 접촉 문자를 분리하는 것이 가능하다. 또한, 명암화상만 이용하는 모든 처리보다 상당히 적은 부하로 접촉 문자 분리가 처리될 수 있다. 따라서, 형상적으로는 발견하기 어려운 접촉 문자가 발견되고 고정밀 고효율적으로 분리될 수 있다.
상세하게 설명한 바와 같이, 본 발명에 따르면 형상적으로 접촉 문자를 발견하고 고정밀 고효율적으로 분리할 수 있는 문자추출방법이 제공될 수 있다.

Claims (13)

  1. 입력된 문자화상에 따라 문자를 인식하는 문자인식장치의 문자추출방법에 있어서,
    상기 입력된 문자화상을 제 1의 2치화처리에 의해 문자영역과 배경영역으로 분리하는 제 1 단계;
    상기 제 1 단계에서 분리된 상기 문자영역에서 상기 문자화상의 각 화소의 농도값을 이용하여 제 2의 2치화처리에 따라 상기 문자영역을 2 개 이상의 영역으로 분리하는 제 2 단계; 및
    상기 제 2 단계에 의해 얻어진 영역정보를 기초로 문자와 문자를 분리하는 제 3 단계를 포함하는 것을 특징으로 하는 문자추출방법.
  2. 제 1 항에 있어서,
    제 3 단계는 제 1 단계에서 얻어진 문자영역과 제 2 단계에서 얻어진 영역 사이에 큰 차이를 갖는 화소행 또는 화소열을 분리점으로 이용하여 문자들을 각각의 문자로 분리하는 단계를 포함하는 것을 특징으로 하는 문자추출방법.
  3. 제 1 항에 있어서,
    제 3 단계는 분리될 영역 자체의 농도값과 분리될 영역의 양단에서의 농도값을 비교하고, 양단에서의 농도값이 분리될 영역 자체의 농도값보다 작은 경우에만 문자들을 각각의 문자로 분리하는 단계를 포함하는 것을 특징으로 하는 문자추출방법.
  4. 제 1 항에 있어서,
    제 2 단계는 문자영역에 대해 적용가능한 위치에서의 화소의 농도값을 이용하여 형성되는 히스토그램에 기초하여 문자들을 각각의 문자로 분리하는 단계를 포함하는 것을 특징으로 하는 문자추출방법.
  5. 제 2 항에 있어서,
    제 1 단계에서 얻어진 문자영역의 농도값과 제 2 단계에서 얻어진 영역의 농도값과의 차이에 기초하여 분리점을 결정하는 경우, 분리점을 결정하는 임계값은 입력된 문자화상의 해상도값에 기초하여 변하는 것을 특징으로 하는 문자추출방법.
  6. 입력된 문자화상에 따라 문자를 인식하고 추출하는 문자추출장치에 있어서,
    상기 입력된 제 1의 2치화처리에 의해 문자영역과 배경영역으로 분리하는 제 1 분리수단;
    상기 제 1 분리수단으로 분리된 상기 문자영역에서 상기 문자화상의 각 화소의 농도값을 이용하여 제 2의 2치화처리에 의해 상기 문자영역을 2 개 이상의 영역으로 분리하는 제 2 분리수단; 및
    상기 제 2 분리수단에 의해 얻어진 영역정보를 기초로 문자와 문자를 분리하는 제 3 분리수단을 포함하는 것을 특징으로 하는 문자추출장치.
  7. 제 6 항에 있어서,
    제 3 분리수단은 제 1 분리수단에 의해 얻어진 문자영역과 제 2 분리수단에 의해 얻어진 영역 사이에 큰 차이를 갖는 화소행 또는 화소열을 분리점으로 이용하여 문자들을 각각의 문자로 분리하는 수단을 포함하는 것을 특징으로 하는 문자추출장치.
  8. 제 6 항에 있어서,
    제 3 분리수단은 분리될 영역 자체의 농도값과 분리될 영역의 양단에서의 농도값을 비교하고, 양단에서의 농도값이 분리될 영역 자체의 농도값보다 작은 경우에만 문자들을 각각의 문자로 분리하는 수단을 포함하는 것을 특징으로 하는 문자추출장치.
  9. 제 6 항에 있어서,
    제 2 분리수단은 문자영역에 대해 적용가능한 위치에서의 화소의 농도값을 이용하여 형성되는 히스토그램에 기초하여 문자들을 각각의 문자로 분리하는 수단을 포함하는 것을 특징으로 하는 문자추출장치.
  10. 제 7 항에 있어서,
    제 1 분리수단에 의해 얻어진 문자영역의 농도값과 제 2 분리수단에 의해 얻어진 영역의 농도값과의 차이에 기초하여 분리점을 결정하는 경우, 분리점을 결정하는 임계값은 입력된 문자화상의 해상도 값에 기초하여 변하는 것을 특징으로 하는 문자추출장치.
  11. 제 1 메모리에 입력된 문자화상을 저장하는 단계;
    제 1 메모리에 저장된 문자화상을 제 1의 2치화상으로 변환하고, 제 1의 2치화상을 제 2 메모리에 저장하는 단계;
    제 2 메모리에 저장된 제 1의 2치화상에 기초하여 문자화상이 접촉하는가를 판정하는 단계;
    판정단계에서 문자들이 접촉하는 것으로 판정되는 경우, 제 2 메모리에 저장된 제 1의 2치화상의 흑화소의 위치에 대응하는 문자화상의 화소로부터 농도값을 얻어 히스토그램을 제공하는 단계;
    제공된 히스토그램에 기초하여 히스토그램상의 농도값을 이등분하는 임계값을 얻는 단계;
    흑화소를 백화소로 반전하여 제 2의 2치화상을 제공하고, 2치화상의 흑화소중 문자화상의 동일 좌표에서의 농도값이 얻어진 임계값보다 큰 경우에만 제 2의 2치화상을 제 3 메모리에 저장하는 단계;
    제 1 메모리에 저장된 문자화상, 제 1의 2치화상, 및 제 2의 2치화상에 따라 접촉 문자의 위치를 판정하는 단계; 및
    판정된 접촉 문자 위치에 대한 정보에 따라 제 1의 2치화상을 각각의 문자화상으로 분리하는 단계로 이루어지는 것을 특징으로 하는 문자분리방법.
  12. 제 11 항에 있어서,
    접촉 문자 위치판정단계는:
    다수의 새롭게 반전된 백화소를 포함하는 열을 검지하기 위해 제 1의 2치화상과 제 2의 2치화상을 비교하는 단계;
    제 2의 2치화상의 종방향에 단일 흑화소가 있는가를 판정하기 위해 검지된 열을 점검하는 단계;
    점검 결과 흑화소가 검지되는 경우 좌우 열의 농도값의 평균값이 각각의 열의 농도의 평균값보다 작은가에 대해서 제 1 메모리에 저장된 문자화상을 판단하는 단계;
    제 1의 2치화상에 기초하여 각각의 열의 양단에서의 여러 열에 걸친 흑화소의 수를 카운트하는 단계; 및
    흑화소의 수를 카운트하는 단계의 결과 일정값 이상의 흑화소가 있는 경우 열의 양단에 문자가 존재한다고 간주하는 단계를 포함하는 것을 특징으로 하는 문자분리방법.
  13. 입력된 문서화상을 광학적으로 판독하여 문자화상을 얻기 위한 스캐너;
    스캐너에 의해 얻어진 문자화상을 저장하기 위한 제 1 화상메모리;
    제 1 화상메모리에 저장된 문자화상을 2치화하고 제 1의 2치화상을 출력하는 제 1의 2치화부;
    제 1의 2치화부로부터 출력된 제 1의 2치화상을 저장하기 위한 제 2 화상메모리;
    제 2 화상메모리에 저장된 제 1의 2치화상에 따라 접촉 문자가 있는가를 추정하기 위한 접촉 문자 추정부;
    접촉 문자 추정부가 다수의 접촉문자를 추정했을 경우 흑화소를 백화소로 반전하여 제 2의 2치화상을 제공하기 위한 제 2의 2치화부;
    제 2의 2치화부에 의해 제공된 제 2의 2치화상을 저장하기 위한 제 3 화상메모리; 및
    제 1 화상메모리에 저장된 문자화상, 제 2 화상메모리에 저장된 제 1의 2치화상, 및 제 3 화상메모리에 저장된 제 2의 2치화상에 기초하여 접촉 문자위치를 판정하고, 판정된 문자위치 정보에 따라 접촉 문자화상을 각각의 문자로 분리하기 위한 문자분리부로 이루어지고,
    농도값은 제 1 화상메모리에 저장된 문자화상 및 제 2 화상메모리에 저장된 제 1의 2치화상에 기초하여 제 1의 2치화상의 흑화소의 위치와 대응하는 위치에 문자화상의 화소만으로부터 취해지며 히스토그램이 등록되고, 등록된 히스토그램에 기초하여 제 1의 2치화상의 흑화소중 문자화상의 동일 좌표의 농도값은 얻어진 임계값보다 큰 것을 특징으로 하는 문자인식장치의 문자추출장치.
KR10-2000-0032889A 1999-07-30 2000-06-15 문자인식장치의 문자추출방법 및 장치 KR100383858B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP21715199A JP4392907B2 (ja) 1999-07-30 1999-07-30 文字切出し方法
JPP11-217151 1999-07-30

Publications (2)

Publication Number Publication Date
KR20010015025A KR20010015025A (ko) 2001-02-26
KR100383858B1 true KR100383858B1 (ko) 2003-05-14

Family

ID=16699666

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2000-0032889A KR100383858B1 (ko) 1999-07-30 2000-06-15 문자인식장치의 문자추출방법 및 장치

Country Status (5)

Country Link
EP (1) EP1073002B1 (ko)
JP (1) JP4392907B2 (ko)
KR (1) KR100383858B1 (ko)
CN (1) CN1192324C (ko)
DE (1) DE60024535T2 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100872983B1 (ko) * 2001-12-22 2008-12-08 주식회사 포스코 슬래브의 문자인식 및 확인용 장치
EP1398726B1 (en) * 2002-09-11 2008-07-30 Samsung Electronics Co., Ltd. Apparatus and method for recognizing character image from image screen
JP3950777B2 (ja) * 2002-09-30 2007-08-01 キヤノン株式会社 画像処理方法、画像処理装置および画像処理プログラム
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
US8723964B2 (en) 2003-09-12 2014-05-13 Sony Corporation Method and device for communication using an optical sensor
CN1310182C (zh) * 2003-11-28 2007-04-11 佳能株式会社 用于增强文档图像和字符识别的方法和装置
JP4423076B2 (ja) * 2004-03-22 2010-03-03 キヤノン株式会社 認識対象切出し装置および方法
CN100369049C (zh) * 2005-02-18 2008-02-13 富士通株式会社 灰度字符的精确分割装置及方法
JP4658848B2 (ja) * 2006-03-30 2011-03-23 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
EP2348487A3 (en) 2010-01-22 2017-09-13 Samsung Electronics Co., Ltd. Method and apparatus for creating animation message
CN103034855A (zh) * 2012-12-05 2013-04-10 曙光信息产业(北京)有限公司 在图像中识别字符区域的方法
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
JP7030462B2 (ja) * 2017-09-21 2022-03-07 キヤノン株式会社 スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0258186A (ja) * 1988-08-24 1990-02-27 Fujitsu Ltd 切断分離を伴う文字認識方法
KR930014166A (ko) * 1991-12-30 1993-07-22 이헌조 문서인식장치의 개별문자 절출방법
JPH07200739A (ja) * 1994-01-07 1995-08-04 Nippon Steel Corp マーキング文字認識方法
US5448651A (en) * 1989-03-20 1995-09-05 Hitachi, Ltd. Texture discrimination method
JPH08129611A (ja) * 1994-10-31 1996-05-21 Sony Corp 文字識別方法及び検査基準文字登録方法
KR970049825A (ko) * 1995-12-06 1997-07-29 구자홍 문자 인식장치의 접촉문자 분리 및 특징 추출방법
KR19980068924A (ko) * 1997-02-25 1998-10-26 구자홍 선과 겹친문자 영상복원을 이용한 필기체 인식 방법
KR19990056813A (ko) * 1997-12-29 1999-07-15 구자홍 개별문자의 가로/세로비를 이용한 접촉문자 분리방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0634256B2 (ja) * 1987-03-04 1994-05-02 シャープ株式会社 接触文字切出し方法
JP3805005B2 (ja) * 1994-11-09 2006-08-02 キヤノン株式会社 画像処理装置及び光学的文字認識装置及びそれらの方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0258186A (ja) * 1988-08-24 1990-02-27 Fujitsu Ltd 切断分離を伴う文字認識方法
US5448651A (en) * 1989-03-20 1995-09-05 Hitachi, Ltd. Texture discrimination method
KR930014166A (ko) * 1991-12-30 1993-07-22 이헌조 문서인식장치의 개별문자 절출방법
JPH07200739A (ja) * 1994-01-07 1995-08-04 Nippon Steel Corp マーキング文字認識方法
JPH08129611A (ja) * 1994-10-31 1996-05-21 Sony Corp 文字識別方法及び検査基準文字登録方法
KR970049825A (ko) * 1995-12-06 1997-07-29 구자홍 문자 인식장치의 접촉문자 분리 및 특징 추출방법
KR19980068924A (ko) * 1997-02-25 1998-10-26 구자홍 선과 겹친문자 영상복원을 이용한 필기체 인식 방법
KR19990056813A (ko) * 1997-12-29 1999-07-15 구자홍 개별문자의 가로/세로비를 이용한 접촉문자 분리방법

Also Published As

Publication number Publication date
DE60024535D1 (de) 2006-01-12
EP1073002A2 (en) 2001-01-31
CN1192324C (zh) 2005-03-09
DE60024535T2 (de) 2006-08-17
JP4392907B2 (ja) 2010-01-06
CN1291756A (zh) 2001-04-18
KR20010015025A (ko) 2001-02-26
EP1073002A3 (en) 2003-10-29
EP1073002B1 (en) 2005-12-07
JP2001043313A (ja) 2001-02-16

Similar Documents

Publication Publication Date Title
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US9158986B2 (en) Character segmentation device and character segmentation method
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
KR100383858B1 (ko) 문자인식장치의 문자추출방법 및 장치
US20150278626A1 (en) Character recognition device and character segmentation method
JPS63158678A (ja) 単語間スペ−ス検出方法
JP2006338578A (ja) 文字認識装置
JP3411472B2 (ja) パターン抽出装置
KR101793184B1 (ko) 촬영된 음악 악보 영상의 자동연주를 위한 가사 영역 추출장치 및 방법
US7319776B2 (en) Image processing method and image processing program
JP4244692B2 (ja) 文字認識装置及び文字認識プログラム
JP2001109887A (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP3019897B2 (ja) 行切出し方法
JPH07160810A (ja) 文字認識装置
JP2630261B2 (ja) 文字認識装置
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JP2581809B2 (ja) 文字切出し装置
JPS596419B2 (ja) 文字切出し方式
JPH11250256A (ja) 図形認識処理方法及びそのプログラムを記録した記録媒体
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法
JP2578768B2 (ja) 画像処理方法
JP2000113101A (ja) 文字切り出し方法および装置
JPH03122786A (ja) 光学的文字読取装置
JPH05135204A (ja) 文字認識装置
JPH03290773A (ja) 文字種判定装置及び文字認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment
FPAY Annual fee payment
LAPS Lapse due to unpaid annual fee