KR970002420B1 - 원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치 - Google Patents

원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치 Download PDF

Info

Publication number
KR970002420B1
KR970002420B1 KR1019940004751A KR19940004751A KR970002420B1 KR 970002420 B1 KR970002420 B1 KR 970002420B1 KR 1019940004751 A KR1019940004751 A KR 1019940004751A KR 19940004751 A KR19940004751 A KR 19940004751A KR 970002420 B1 KR970002420 B1 KR 970002420B1
Authority
KR
South Korea
Prior art keywords
line
document
determining
character
generating
Prior art date
Application number
KR1019940004751A
Other languages
English (en)
Other versions
KR940024625A (ko
Inventor
스피쯔 로렌스
Original Assignee
가또 마사오
후지제록스 가부시끼가이샤
존. 이백
제록스 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가또 마사오, 후지제록스 가부시끼가이샤, 존. 이백, 제록스 코오포레이션 filed Critical 가또 마사오
Publication of KR940024625A publication Critical patent/KR940024625A/ko
Application granted granted Critical
Publication of KR970002420B1 publication Critical patent/KR970002420B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

내용없음.

Description

원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치
제1도는 광학문자인식 시스템 개통도.
제2도는 원고(text)의 샘플과 수직스플래잉(splaying)전후의 수직프로필(profile)를 나타낸 도면으로서 제2a도는 수직스플래잉전의 도면이고, 2b도는 수직스플래잉후의 도면.
제3도는 제2a도 에 보인 문서의 각 문자 구성요소마다의 경계박스(bex)를 나타낸 도면.
제4도는 원고라인의 상관위치들을 나타내는 원고열(string)를 나타내는 도면.
제5도는 제2a도의 원고샘플의 수평스프래잉 전후와 문자구성요소분할(splitting) 전후를 나타내는 도면으로서, 제5a도는 수평스프래잉전의 도면, 제4b도는 수평스프래잉 후의 도면.
제6도는 본 발명의 공간 특징 판정방법의 후로우 챠트도.
제7도는 제2도의 원고샘플에 문자셀들과 경계박스를 나타낸 도면.
본 발명은 자동문서인식방법 및 장치에 관한 것이며, 좀더 구체적으로는 문서내의 원고라인 워드 및 문자셀 공간 특징들을 자동 판정하는 방법에 관한 것이다.
디지털 컴퓨터에서 사용적합한 원고 데이터로 주사한 화상데이타를 변환하기 위한 광학문자인식 및 그의 사용에 관해서는 이미 잘 알려져 있다. 그밖에 주사된 화상데이타를 원고 데이터로 변환하는 방법들과 그러한 방법에서 발생하는 에러의 형태들에 대해서도 잘 알려져 있다. 주사한 화상데이타를 원고데이타로 변환시의 한 문제점은 원고의 각 라인들을 서로 구별 가능하게 하고, 원고의 한라인내의 군집되어 있는 워드들을 구별가능하게 하고, 원고의 한 라인내의 문자셀들의 수직 및 수평범위를 판정하고, 원고의 한라인내의 문자구성 요소들간의 연자(ligature)와 활자의 돌출부(kern)를 적당히 분리하는 것에 있다.
본 발명의 목적은 개선된 원고라인, 워드 및 문자셀 특징을 인식하는 능력을 갖는 광학문자인식 시스템을 제공하는데 있다.
본 발명의 다른 목적은 문서의 원고라인, 워드 및 문자셀 공간 특징들을 자동으로 판정하는데 있다.
본 발명의 제1실시예의 방법 및 장치에 의하면 문서화상의 원고부분의 복수의 문자구성요소들을 둘러싸는 복수의 경계박스들을 발생시킨 다음 경계박스들과 문자구성요소들을 수직방향으로 스플래이하여 현재라인의 경계박스들과 이 현재라인에 수직으로 인접한 라인들의 경계박스들간의 중첩을 분리시킨다. 각 라인의 문자구성요소들의 주식프로필을 생성하여 상부와 하부피이크들(peak)를 위치시킨다. 문자구성요소들의 하부와 상부위치들에 관한 개별수직프로필들을 생성하여 기준라인(base line)와 X -라인 위치들을 제각기 판정한다(가능할 경우), 원고부분의 각 라인이 일단 확인되면 그 다음 경계박스들과 문자구성요소들을 수평으로 스플래쉬하여 경계박스들의 중첩을 제거한다. 각 라인마다 그 라인의 문자구성요소들의 모달 스트로크폭 값(modal stroke width value)를 판정한다. 문자구성요소들의 실제의 스크로크폭들을 이 모달 스트로크폭과 비교한다. 만일 어떤 문자구성요소가 소정수의 모달 스트로크폭보다 더 큰 실제의 스트로크폭을 가질 경우, 각각의 그러한 문자구성요소는 2이상의 개별 문자구성요소들을 가능성을 갖는 연자인 것으로 생각된다. 이 경우에 문자구성요소들을 분할할 수도 있다. 그러한 연자들은 더 이상 분할할 수 없을 때까지 반복적으로 분할한다. 일단 가능한 만큼 분할을 완료하면 연결된 인접요소들간의 공간을 분석하여 각 라인의 워드와 문자간격을 판정한다.
일단 화상이 원고부분을 조절하여 줌으로써 그 문자구성요소들이 둘러싸고 있는 문자구성요소들로부터 수직 및 수평으로 뚜렷하게 분리되면 각 라인의 상부 및 하부 위치들 간에서 수직으로 정렬된 문자구성요소들의 각 그룹을 문자로써 함께 모아 1문자셀로 만든다.
제 2의 양호한 실시예에서는 만일 문서의 원고부분을 디지털 데이터 신호로 변환할 필요가 있을 경우, 문서를 주사한 다음 원고가 아닌 모든 정보를 제거한다.
그 다음 필요할 경우 원고화상의 어긋남(skew)와 기타 주사영향들을 교정한다. 일단 문서화상의 주사와 교정이 완료되면 화상을 화상농도와 위치들을 갖는 화소들의 비트맵(bitmap)으로부터 복수의 문자구성요소들로 변환한다. 문자구성요소들을 생성후 경계박스를 각 문자구성요소마다 발생시킨다.
이하 첨부도면을 참조하여 발명을 상세히 설명하면 다음과 같다.
도1에 나타낸 바와 같이 본 발명의 광학문자인식시스템은 전하결합장치(CCD)등을 갖는 스캐너(110)를 구비하고 있다.
스캐너(110)는 도(2A)와 (B}에 나타낸 바와 같이 화상(102)를 갖는 문서 (100)를 주사한다. 여기서 화상(102)은 미지의 스크립트(script)와 언어의 원고부분(104)으로 되어 있다. 스캐너(110)는 최초의 문서(100)의 화상(102)를 구성하는 복수의 화소들의 화상농도와 위치들을 나타내는 디지털 데이터 신호를 출력한다. 이 디지털 데이터 신호는 메모리 (112)로 보내져서 일시적 또는 무한정으로 기억된다.
이 디지털 데이터 신호가 메모리(112)로부터 출력될때는 범용 디지털 컴퓨터(114)로 입력된다. 일단 입력되면 이 디지털 데이터 신호는 일단 원고부분(104)만 남기고 비원고 부분을 제거하는 교정처리를 받는다. 또한 어긋남등과 같은 디지털 신호가 받은 어떤 스캐너영향을 제거한다. 그 다음 교정된 디지털 테이타 신호는 컴퓨터 (114)의 메모리 (26)내에 기억되거나 또는 메모리 (112)에 기억된다. 또다른 방법으로 스캐너는 스캐너영향을 제거하는 것과 같은 어떤 사전처리를 행할 수 있다.
도1에 나타낸 바와 같이 본 발명의 범용 디지털 컴퓨터(114)는 콘트롤 프로그램을 기억하는 메모리(22)와, 메모리(112)로부터 디지털 데이터 신호를 입력하여 원고부(104)의 상기 판정된 문자셀들을 나타내는 신호를 출력하는 입/출력회로 (24)를 포함한다. 범용 디지털 컴퓨터(114)는 또한 디지털 데이터 신호를 기억하는 화상(RAM26)과, 상기 디지털 데이터 신호로부터 문자구성요소들을 생성하는 문자구성요소발생수단(28)과, 각각의 문자구성요소에 대한 경계박스내의 디지트화한 화상의 화소들과 경계박스의 좌표들을 판정하는 경계박스 발생수단(30)과, 원고부(104)를 수직으로 스프래잉하는 수직스프래잉수단(32)와 스플래이안된원고부(104)의 수직프로필을 생성하는 수직프로필수단(34)와, 상기 원고부 (104)를 수평으로 스프래잉하는 워드공간특징판정수단(36)와, 문자구성요소들을 문자셀들로 그룹화하여 문자와 워드디비죤들(division)을 식별하는 문자셀 발생수단 (38)을 구비한다.
수직프로필수단(34)은 원고부 (140)의 수직프로필들, 원고부(104)의 각 라인 및 각 라인의 부분들을 생성하는 수직프로필 발생수단(340)과, 적어도 각 라인의 상부, 하부기준 라인 및 가능한 X -라인위치들을 판정하는 수직위치판정수단(342)를 구비한다.
라인공간 특징 판정수단 (36)은 원고부(104)의 각 라인을 수평으로 스프래잉하는 수평스프래잉수단 (4360)과, 원고부(104)의 각 라인내의 인터워드(interword)와 인트라워드(intraword)간격들을 판정하는 워드간격판정수단 (362)과, 각 라인의 모달스트로크폭과 원고부(104)의 각 문자구성요소에 대한 실제스트로크폭을 판정하는 스트로크폭 판정수단 (364)과, 어느 문자구성요소들이 원고부(104)의 각 라인에 속하는지를 판정하는 라인내용판정수단(도시안됨)을 구비한다. 콘트롤 프로그램을 기억하는 메모리(22)는 ROM(22a)또는 RAM(22b으므로 구성할 수도 있다.
동작에 있어 도2에 나타낸 바와 같이 화상(102)을 포함하는 문서 (100)를 스캐너 (110)에 넣고 주사하여 직렬 또는 병렬 디지털 데이터 신호가 발생한다. 디지털 데이터 신호는 복수의 신호부분들로 구성되며, 각 신호부분은 최초의 화상(102)의 상응하는 화소를 나타낸다. 화상(102)의 각 화소는 화상(102)내의 위치와 화상농도를 갖고 있다. 따라서 디지털 데이터 신호의 각 신호부분의 상응하는 화소의 화상농도와 위치를 나타내는 데이터를 포함한다.
그다음 스캐너(110)에 의해 출력된 디지털 데이터 신호는 메모리(112)에 기억된다. 메모리(112)는 RAM, 플래쉬 메모리, 디스크 메모리등으로 구성할 수도 있다. 메모리(112)는 유형과 무관하게 디지털 데이터 신호는 각 신호부분내의 위치와 화상농도 데이터에 응답하여 메모리(112)내에 기억된다. 물론 디지털 데이터 신호는 중간 메모리(112)내로 보다는 오히려 범용 디지털 컴퓨터(114)로 직접 입력된다. 또 다른 방법으로 메모리(112)는 범용 디지탈 컴퓨터(114)내에 내장시킬 수 있다. 어느 경우에나 메모리(112)는 화상(102)를 장기간 기억시키기 위해 사용된다는 것을 주지해야 한다.
일단 오퍼레이터가 문자들을 스캐너 (110)내에 입력 완료했거나 또는 시스템이 메모리 (112)내에 기억된 화상(102)을 나타내는 디지털 데이터 신호가 원고 데이터로 변환되어야 함을 판정 또는 명령했으면 화상(102)를 나타내는 디지털 데이터 신호는 메모리 (112)로부터 범용 디지털 컴퓨터(114)로 출력된다. 물론 특수용 디지털 컴퓨터 또는 고정배선된 논리회로를 범용 디지털 컴퓨터(114)대신 사용할 수도 있다.
메모리(112)내에 기억된 디지털 화상데이타 신호부분은 범용 디지털 컴퓨터 (114)로 출력된다.
이때, 입/출력수단(24)를 통해 화상메모리(26)로 입력된다. 일단 디지털 데이터 신호가 화상 메모리 (26)에 완전히 기억되면 이 디지털 데이터 신호는 문자구성요소 발생수단(28)으로 입력될 수 있다. 문자구성요소발생수단(28)은 화상(102)를 나타내는 이 디지털 데이터 신호를 복수의 문자구성요소들로 분할한다.
여기서 각 문자구성요소는 하나 이상의 신호부분들을 포함한다. 각 문자구성요소는 어떤 최소한 화상농도를 가지며, 또한 연속경로를 형성하는 최초의 화상(102)의 화소들에 상응하는 신호부분들을 포함한다. 각각의 스크립트 문자는 일반적으로 Fuji의 F 에서와 같이 하나의 문자구성요소에 또는 Fuji의 J또는 i 에서와 같이 하나 이상의 문자구성요소에 상응한다. 문자구성요소 발생수단 (28)에 의해 생성된 문자구성요소들의 발생수단(28)에 의해 생성된 문자구성요소들의 리스트는 화상메모리 (26) 및/또는 메모리(112)내에 기억된다.
일단 문자구성요소 발생수단(28)이 디지털 데이터 신호로부터 화상(102)에 대한 복수의 문자구성요소들을 생성하면 화상메모리(26)상에 기억된 화상 (102)에 상응하는 디지털 데이터 신호와 문자구성요소 발생수단 (28)에 의해 생성된 문자구성요소들의 리스트가 경계박스 발생수단 (30)으로 출력된다.
경계박스 발생수단(30)은 화상(102)를 나타내는 디지털 데이터 신호를 도3에 나타낸 바와 같이 복수의 경계박스들로 재분할한다. 여기서 각각의 경계박스는 하나의 문자구성요소를 포함하며, 신호부분들에 인접하여 또는 부근에 DNL치된 디지털 데이터 신호의 0또는 하나의 이상의 신호부분들은 문자구성요소를 포함한다. 원고부의 화소들에 상응하는 이들 추가신호부분들은 각각의 문자구성요소를 둘러싼다.
각각의 경계박스의 칫수는 상응하는 문자구성요소를 포함하는 최좌, 최우, 최상, 최하 신호부분들의 위치 디지털 데이터에 의해 판정된다. 따라서 경계박스내의 신호부분들은 그들의 화상농도데이타와 무관하게 경계박스의 경계들내에 그들을 위치시키는 위치 데이터를 갖는 신호부분들과 문자구성요소를 포함하는 것들이다. 일단 경계박스들과 각 경계박스를 포함하는 신호부분들의 리스트가 경계박스 발생수단(36)에 의해 발생되면 경계박스의 리스트는 화상메모리(26)또는 메모리(112)로 입력된다.
복수의 신호부분들과 경계박스들 및 문자구성요소들의 리스트들은 수직스프래잉수단(32)으로 출력된다.
수직스프래잉수단(32)은 수직으로 정렬된 문자구성요소들간에 비정상적으로 많은 량의 백색간격(리딩(leading)를 발생시키도록 원고부 (104)내의 각 경계박스의 원점을 이동시킴으로써 원고부(104)를 수직으로 스플래이 한다.
일반적으로 문자의 원고부내의 라인들은 다양한 백색공간 또는 리딩량에 의해 분리된다. 여기서 리딩은 현재라인의 문자들과 수직인접라인들의 문자들간의 선형수평백색경로로서 정의된다.
일반적으로 아시아스트립트 유형들은 움직임이 좋으므로 문자구성요소들의 어센팅(ascending)또는 디센딩(descending)부분들을 갖지 않는다. 따라서 통상적으로 스프래잉없이 아시아 스크립트 문서들 내에 원고의 라인들을 분명하게 위치시키는 것이 가능하다. 이와 대조적으로 유럽 스크립트 유형은 움직임이 좋지 않으므로 통상적으로 어센딩과 디센딩부분을 갖고 있다.
이들 어센딩과 디센딩부분들은 종종 수평으로 접촉하거나 또는 단순 중첩하므로 그들은 때때로 수직방향으로 1차 스프래잉함이 없이 유럽 스크립트 문자들 내의 원고라인들을 분명하게 위치시키는 것이 어렵다.
그러나 소모시간과 필요한 처리파워면에서 스프래잉 비용이 아주 낮기 때문에 스프래잉을 필요로 하는 다른 특정라인들 및/또는 스크립트형의 판정을 시도하기 보다는 오히려 스크립트형과 무관하게 (바람직하게는 1차 스크립트형 판정없이 )모든 것을 수직으로 스플래이하는 것이 더욱 간단하다.
물론 스프래잉비용이 올라가면 본 발명은 원고부(104)의 스프래잉이 필요한 지를 판정하는 수단을 포함하도록 쉽게 수정될 수 있다. 도2(a)에 나타낸 바와 같이 원고부분(104)은 수직프로필이 라인들간에 백색간격이 없음을 나타내는 식으로 어센더들과 디센더들을 갖는다.
만일 Cy가 도3에 나타낸 바와 같이 문자구성요소를 둘러싸는 경계박스의 원점의 최초 경계박스 y-축위치이고, 그리고 Cy' 가 스프래잉후 경계박스의 원점의 최종 경계박스 y-축 위치일 경우, 하기식으로 나타낼 수 있다.
상기 식중 Ch는 문자구성요소의 높이이고, f( )는 스프래잉 함수이다.
본 실시예에서 f는 1 f 5범위의 기선택된 일정의 스프래잉팩터(factor:f)이다.
그러나 f는 문자 i 의 2부분들과 같이 수직으로 인접하여 관련된 요소들간의 분리가 인터라인(interline)리딩에 대해 잘못되지 않을 정도로 그렇게 크지 않아야 한다.
바람직하게는 f=1.2이다.
도2(a)는 샘플원고부(104)와, 이 원고부의 각 문자구성요소를 도3에서와 같이 둘러싸는 경계박스들과 경계박스들의 수직프로필을 나타낸다. 이 수직프로필로부터 Fuji에서 j 를 둘러싸는 경계박스가 3400에서 처음0과 접촉하는 것을 명확히 알 수 있다.
그러나, j와 0의 문자구성요소의 원점을 수직방향으로 이동시키기 위해 상기 수직스프래잉 팩터를 적용후, 제2b도에 나타낸 바와 같이 각 수직인접라인쌍들간에 중단되지 않은 백색간격이 있다.
도2(a)에서 원고의 각 라인의 경계박스들의 수직분포 프로필들을 비교시에 볼 수 있는 바와 같이 한라인의 상부 또는 하부의 수직으로 종전의 연속라인의 하부 또는 상부로부터 제각기 구별될 수 없다. 그러나 도2(b)에서 한 라인의 상부 및 하부와 그의 인접라인들의 하부와 상부는 명확하게 확립될 수 있다. 스프래잉에 의해 한 라인의 경계박스들과 수직인접라인들의 경계박스들간의 상관수직위치들이 이동되지만 스프래잉에 의해 경계박스들의 원래 칫수가 변경되지는 않는다.
원고부분(104)를 수직으로 스프래잉 후, 수직스프래잉수단(32)은 어느 문자구성요소들과 경계박스들이 원고의 각 라인을 포함하는지를 판정한다. 그다음 라인들과 상응하는 문자구성요소들의 리스트는 화상메모리 (26) 및/또는 메모리 (112)내에 기억된다.
그 다음 라인들과 상응하는 문자구성요소들의 리스트, 문자구성요소들의 리스트 및 원고부(104)를 포함하는 원래 스플래이되지 않은 신호부분들은 수직프로필수단(34)으로 출력된다. 수직프로필수단(34)은 스플래이 되지 않은 원고부(104)마다 원고의 각 라인의 상부 및 하부 위치들과 최우 및 최좌 위치들을 판정한다. 수직프로필수단(34)은 우선 원고의 각 라인의 문자구성요소들의 수직분포 프로필을 생성한다. 이 수직분포 프로필로부터 제4도에 보인 바와 같이 원고의 한 라인의 상부와 하부위치들이 확실하게 확립될 수 있다. 그 다음 수직프로필수단(34)의 원고의 각 라인마다 수직프로필의 최상 및 최하 위치들을 판정한다. 제4도에 보인 바와 같이 원고라인의 하부지점은 수직분포 프로필의 최하지점인 한편, 제4도에 보인 바와 같이 원고라인의 상부지점은 수직프로필의 최상지점이다. 그다음 수직프로필수단(34)은 원고의 각 라인마다 2개의 추가 수직프로필들을 생성한다. 즉, 하나는 라인의 문자구성요소들의 하부위치들만 생성하고, 다른 하나는 라인의 문자구성요소들의 상부위치들만을 생성한다. 그 다음 기준라인과 X-라인위치들은 일반적으로 제각기 하부와 상부 위치 수직 분포 프로필들의 피이크들의 수직위치들이 될 것입니다.
어센딩 또는 디센딩 문자구성요소들이 없는 원고라인에서는 상부와 X -라인, 또는 하부와 기준라인 위치들이 일치하는 것이 가능하다.
또한 어센딩 문자들의 높은 퍼센트(%)를 갖는 원고라인에서 X -라인 위치를 정확히 판정하는 것이 불가능할 수도 있다. 일단 모든 라인들에 대해 수직프로필수단(34)이 ON되어 동작되면 각 라인에 상응하는 하부, 상부, 기준라인 및 X-라인 위치들과 라인들의 리스트가 화상메모리 (26)로 출력된다.
원고의 한 라인에 상응하는 문자구성요소들은 상부와 하부위치들간에 완전히 들어오는 문자구성요소들이다.
물론 이것은 포지티브-다운(positive-down) 좌표시스템에서 많은 문자구성요소들에 대해 네가티브 y-원점들이 될 것이다.
그다음 원고부분(104)의 각 라인에 상응하는 문자구성요소들과 경계박스들의 리스트들과 복수의 신호부분들은 워드공간 특징판정수단(36)으로 출력된다. 워드공간특징판정수단(36)의 수평스프래잉수단(360)은 단일 라인의 경계박스들과 개별 문자구성요소들을 수평으로 스플래이하는 2이상의 문자구성요소들의 중첩들 또는 연자들 (ligature)또는 2이상의 독립된 문자구성요소들에 상응하는 경계박스들을 제거한다.
일반적으로 원고가 한 라인내의 문자들은 다양한 백색간격의 가변량만큼 분리된다.
여기서 백색공간이라 함은 현재 라인내의 문자들간의 선형수직백색경로를 뜻한다. 또 다시 아시아스크립트 유형들은 통상적으로 움직임이 좋기 때문에 일반적으로 문자들간에 그러한 백색간격들이 존재하는 것을 보장하도록 아시아 스크립트 문서의 라인들을 수평으로 수플레이할 필요가 없다.
이와 대조적으로 비레적으로 간격진 유럽 스크립트들에서는 문자들과 워드들은 통상적으로 백색간격에 의해 분리되어 있지만 워ㄷ들 내부와 워드들간의 백색간격의 크기와 분포가 아주 다양하다. 그것은 종종 사용된 폰트(font)에 따라 인간에 의해 인식될 정도로 정밀하게 수직할 필요가 없으므로 고의로 생략할 수도 있다. 다시 스프래잉의 비용이 낮기 때문에 일반적으로 원고부(104)의 스크립트 유형 또는 특정 라인의 스프래잉이 필요한지 여부를 판정할 필요도 없고, 요망되지도 않는다. 그러나 상술한 바와 같이 스프래잉 비용이 오르면 그러한 정보가 얻어질 수 있다. 경계박스들이 중첩하게 되는 쌍돌기부들 (pairkern)은 도2a의 샘플원고에서 Fuji 의 uj 또는 Avenue 의 Av 등과 같이 종종 발생한다. 또한 어떤 폰트들에서는 어쩔 수 없는 연자들 또는 문자구성요소중첩들이 도2a 에서 confidence 의 fi 와 같이 발생한다.
본 발명의 양호한 실시예에서는 수평스프래잉수단(360)이 원고부의 각 라인을 수평으로 스플래이 하여 인접한 경계박스들 간의 중첩들을 제거한다. 그 다음 각각의 수평으로 스플래이된 라인을 분석하여 라인내에 존재하는 나머지 연자들을 위치시킨다. 위치된 연자들을 식별한 후, 그들을 분석하여 많아야 하나의 분할지점(splitting point)에 위치시킨다. 만일 문자구성요소내에 분할지점이 위치되면 그 연자는 2문자구성요소들로 분할된다. 위치된 연자들을 스프래잉한 후, 현재 라인의 문자구성요소들을 재점검하여 어떤 가능한 연자들이 남아 있는지를 판정한다.
수평스프래잉수단(360)은 수직스프래잉수단(32)와 동일하게 동작하지만 원고의 각 라인의 각 경계박스의 수직보다는 오히려 수평위치들에 대해 작용한다.
원고부(104)의 원고의 각 라인을 수평으로 스플래이하기 위해 수평스프래잉수단(360)은 원고의 현재 라인의 각 경계박스의 원점을 이동시켜 수평으로 인접한 문자구성 요소들의 각 쌍간에 비교적 큰 양의 백색간격을 발생한다. 만일 Cx가 최초 경계박스 X-축위치이고, C'X가 스프래잉후의 최종 경계박스 X-축위치일 경우, 하기식으로 표시되다.
상기 식중 Cw는 현재 문자구성요소의 폭이고, f( )는 스프래잉함수이다. 본 실시예에서는 f가 기선택된 일정의 스프래잉펙터로서 5f 1의 범위내이다. 그러나 f는 한 워드내의 수평으로 인접한 문자구성요소들 간의 분리가 워드들간의 간격에 대해 잘못되지 않을 정도로 그렇게 크지 않아야 한다.
그에 따라 f값은 1, 2가 바람직하다.
도5(a)는 수평스프래잉 이전에 도2의 수직으로 스플래이된 원고샘플을 나타낸다. Fuji 와 u 와 v에 대한 경계박스들간의 중첩들은 seized 에서 iz 와 international에서 in 및 rn rhk 같은 고의가 아닌 연자들과 그리고 confidence에서 fi의 고의적인 연자에서와 같이 명백하다. 수평으로 스플래이된 원고부(104)는 도5(b)에 나타낸다.
경계박스들의 고의가 아닌 중첩들은 단순히 스프래잉에 의해 제거되지만 수평스프래잉은 고의 또는 고의가 아닌 연자들을 제거할 수 없다. 이들 연자들은 그들을 단일 문자구성요소들로서 식별할 때, 단일 경계박스들로 표시된다.
연자들을 분리시키기 위해 스트로크폭판정수단(364)은 원고의 각 라인마다 그 라인에 대한 그를 나타내는 스트로크폭(Sw)를 판정한다. 평균스트로프폭은 특정원고라인과 연관된 복수의 문자구성요소들내에 존재하는 실행길이(run length)의 모달값을 판정함으로써 결정된다. 스트로크폭 판정수단(364)은 소정폭위에 넓은 문자구성요소들을 위치시키기 위한 넓은 문자구성요소 위치설정수단(3640)과, 각각의 넓은 문자구성요소의 코스트(cost)분포를 생성하기 위한 코스트 분포발생수단(3642)과, 코스트분포내에 미니멈들(minimun)를 위치설정하기 위한 코스트미니멈 위치설정수단(3644)과, 단일 문자구성요소를 위치설정된 미니멈에서 2문자 구성요소들로 분할하기 위한 문자구성요소분리수단(3646)를 구비한다.
동작에 있어 상응하는 스트로크폭(Sw)의 3배 이상의 폭(Cw)를 갖는 라인내의 각 문자구성요소가 식별처리된다. 상기 스트로크폭(Sw)이 적어도 3배의 폭(Cw)을 갖는 문자구성요소를 처리하기 위해 그 문자 구성요소의 각 컬럼은 각각의 인접한 컬럼과 앤드(AND)연tks되고, 앤드 연산된 칼럼들의 on 화소들의 수가 판정되어 문자구성요소보다 1화소 좁은 코스트 분포를 생성한다. 그 다음 코스트 분vh를 분석하여 미니멈들을 위치설정한다. 상응하는 스트로크폭(SW)이하의 값을 갖고, 또한 상기 수평폭(Sw)의 1.5배 이상 상응하는 경계박스의 좌측경계의 우측과 우측경계의 좌측 양쪽으로 위치설정된 최대한 한 미니멈(바람직하게는 동일 값을 갖는 2이상의 미니멈이 있을 경우, 최좌측 미니멈 )에 대해 문wk구성요소는 2문자구성요소들로 분할된다.
이것은 필요한 경우 모든 플라그멘트들(fragment)이 재점검되어제분할될때까지 각각의 최종 프라그멘트마다에 반복적으로 적용된다. 도5(b)에 나타낸 바와 같이 만일 연자가 confidence 에서 fi와 같이 어쩔 수 없이 있을 경우, 종종 미니멈이 밝혀지지 않는다. 이 경우에 연자는 단일 문자로서 처리될 것이다.
원고부(104)의 각 라인이 판정된 후, 워드간격판정수단(362)이 원고부(104)의 원고의 각 라인내의 문자와 워드간격들을 판정한다. 워드간격판정수단(362)은 각 라인의 좌·우 연부들을 판정하는 라인범위판정수단(3620)와, 상기 판정된 간격폭들의 분포를 생성하는 간격폭 분포판정수단(3622)과, 상기 간격폭 분포를 분석하는 간격폭 분석수단 (3624)를 구비한다. 간격폭분포 분석수단은 상기 간격폭 분포내에 피이크들을 위치설정하는 분포피이크위치설정수단(3626)과 인터워드 또는 이트라워드를 나타내는 위치설정된 피이크들을 판정하는 분포피이크분석수단(3628)를 구비한다.
동작에 있어 라인들의 시작과 종료를 워드들의 시작과 종료로 가정하고, 1라인내에서 문자구성요소들간의 수평으로 스플래이된 원고내의 간격들을 위치설정하고, 그 간격들의 폭들의 분포곡선을 생성한다. 간격들의 폭을 좌측인접 문자구성요소의 최우연부와 우측인접 문자구성요소의 최좌연부간의 거리로서 측정한다.
일반적으로 분포곡선은 워드들내의 문자들간의 좁은 간격들과 워드들간의 넓은 간격을 나타내는 피이크들을 갖는 2분포양식이다.
만일 인트라워드 간격을 나타내는 낮은 피이크가 없을 경우, 원고는 조밀한 배치(set tight)일 수도 있다. 스플래이 되지 않은 원고부의 분포곡선의 최고 피이크를 수평으로 스플래이된 원고부의 분포곡선과 비교하여 만일 그 피이크가 문자셀간 간격(inter-character-cell spacing)과 일치하지 않을 경우, 그것은 워드간격이고, 만일 상부 피이크가 없거나 또는 인터워드 간격과 일치할 경우, 그것은 원고의 라인이 단일 워드를 포함하고 있음을 뜻한다.
본 발명의 방법과 장치는 통계에 근거하기 때문에 그들은 아주 확실하므로 아주 불량하게 인쇄 및/또는 주사된 문자일지라도 견뎌낼 수 있다. 즉, 디지털 데이터 신호 또는 이 신호로부터 생성된 문자구성요소들 이 문서의 모든 문자를 완전하게 표시될 필요가 없다. 오히려 본 발명은 단일 문자구성요소문자를 2이사의 문자구성요소들을 분할하거나 또는 상기2이상의 분리된 문자구성요소들을 단일 문자구성요소로 조합하는 등에서의 공통적인 주사에러들을 견뎌낼 수 있다.
그 다음 수평으로 스플래이된 원고는 원고의 각 라인내의 문자셀들을 생성하는 문자셀 발생수단(38)으로 입력된다.
하나 이상의 수직으로 정렬된 (즉, 수평으로 중첩되는)문자구성요소들의 각 세트마다 문자구성요소들을 둘러싸는 문자셀이 문자셀 발생수단(38)에 의해 형성된다. 각 문자셀의 칫수들은 도5(c)에 나타낸 바와 같이 원고의 상응하는 라인의 상부위치에서 하부위치까지 그리고 문자셀의 문자구성요소들의 최좌위치에서 문자셀의 문자구성요소들의 최우위치까지 연장될 것이다.
상술한 스크립트 판정 시스템의 동작을 간략화 한 후로우챠트가 도6에 도시되어있다. 단계 S100에서 시스템이 시작하면 단계 S100에서 문서를 주사하여 디지털 화상데이타 신호를 생성한다. 그 다음 단계 S120에서 이 디지털 화상데이타 신호에 원하는 사전처리 알고리즘을 행하여 디지털 화상데이타 신호를 교정한후, 단계 S130에서 이 디지털 화상데이타 신호의 문자구성요소들을 식별하고, 단계 S140에서 각각의 판정된 문자구성요소들마다 경계박스들을 생성한다.
그다음 단계 S150에서 원고부를 수직으로 스플래이하고, 단계 S160에서 원고 라인들을 상기 스플래이된 원고로부터 식별해내고, 단계 S170에서 각 라인의 수직프로필들을 생성하며, 상,하, 최좌, 최우 기준라인 및 가능하면 X-라인 위치들을 판정한다. 단계 S180에서 각 라인에 상응하는 문자구성요소들과 경계박스들을 식별한다.
그 다음 단계 S190에서 원고부의 각 라인을 수평으로 스플래이 하고, 단계 S200에서 모달스트로크폭을 각 라인마다 판정하고, 단계 S120에서 원고부내의 가능한 연자들을 위치설정하고, 단계 S220에서 위치설정되 연자들을 그들의 구성개별 문자구성요소들로 반복분할하고, 단계 S230에서 각 라인내의 문자의 워드간격들을 식별하고, 단계 S240에서 각 라인의 문자셀들을 식별하여 그들의 칫수를 판정하고, 단계 S250에서 경계박스들과 문자구성요소들에 상응하는 문자셀들의 리스트를 출력한다. 그다음 단계 S260에서 정지한다.
지금까지 본 발명을 양호한 실시예들을 참조하여 설명했으나, 본 발명은 그러한 실시예들에 국한되지 않고, 본 발명의 정신과 첨부된 청구범위에서 벗어나지 않은 범위내에서 여러 다른 실시예들로 수정변경이 가능하다.

Claims (34)

  1. 제1거리만큼 분리된 적어도 2원고라인을 갖는 문서화상의 스플래이안된 원고부의 원고특징을 판정하는 자동원고특징 판정장치에 있어서, 상기 스플래이안된 원고부를 나타내는 디지털 데이터 신호를 입력하는 입력수단과, 상기 디지털 데이터 신호는 복수의 신호부분들을 포함하며, 상기 각 신호부분은 복수의 화소들중 하나의 상응하며, 상기 복수의 신호부분들로부터 복수의 문자구성요소들을 생성하는 문자구성요소발생수단과, 상기 복수의 문자구성요소들중 상응하는 것을 각각 둘러싸는 복수의 경계박스들을 생성하는 경계박스 발생수단과, 상기 스플래이안된 원고부의 원고의 각 라인의 공간특징을 판정하며, 상기 원고의 각 라인은 복수의 문자구성요소들중 적어도 하나를 포함하는 라인 공간 특징 판정수단을 포함하며, 상기 라인 공간특징판정수단은 상기 스플래이안된 원고를 상기 제1거리보다 큰 제2거리만큼 적어도 2원고라인을 갖는 수직으로 스플래이된 원고부로 수직으로 스플래잉 수직스플래잉수단과, 상기 수직으로 스플래이된 원고부와 수직프로필을 생성하는 수직프로필수단을 포함하는 것이 특징인 자동원고 특징판정장치.
  2. 제1항에 있어서, 상기 라인공간특징판정수단은 상기 복수의 문자구성요소들중 어느 것들이 상기 스플래이된 원고부의 각 라인에 상응하는지를 판정하는 라인내용 판정수단을 더 포함하는 것이 특징인 자동원고 특징판정장치.
  3. 제2항에 있어서, 상기 수직프로필수단은 상기 스플래이안된 원고부의 각 라인마다 복수의 문자구성요소들중 상응하는 것들에 근거하여 상부위치 및 하부위치와 기준라인위치와 X-라인위치중 적어도 하나를 판정하는 수직 위치판정수단을 더 포함하는 것이 특징인 자동원고특징 판정장치.
  4. 제3항에 있어서, 상기 수직 위치판정수단은 각 라인에 상응하는 수직프로필의 0에서 영이 아닌 값으로의 변환들에 근거하여 적어도 한 라인의 상부 및 하부 위치들을 판정하는 것이 특징인 자동원고특징 판정장치.
  5. 제3항에 있어서, 상기 수직프로필수단은 상기 복수의 문자구성요소들중 상응하는 것들의 상부위치들의 상부위치수직프로필과 하부위치들의 하부위치 수직프로필을 생성하는 수직프로필 발생수단을 더 포함하는 것이 특징인 자동원고 특징판정장치.
  6. 제5항에 있어서, 상기 수직프로필 수단은 각 라인에 제각기 상승하는 상부위치와 하부위치 수직프로필들의 피이크로부터 스플래이안된 원고의 각 라인의 기준라인과 X-라인 위치들을 판정하는 것이 특징인 자동원고 특징판정장치.
  7. 제1항에 있어서, 상기 공간특징 판정수단은 스플래이안된 원고부의 적어도 하나의 라인을 수평으로 스프래잉하는 수평스프래잉 수단과, 각 라인의 인접한 문자구성요소들간의 수평으로 스플래이된 원고부의 간격폭들을 판정하는 간격폭 판정수단과, 수평으로 스플래이된 원고를 근거로 스플래이안된 원고부의 각 라인내의 적어도 한 문자셀을 생성하는 문자셀 발생수단을 포함하며, 상기 각 문자셀은 수평으로 스플래이된 원고부의 적어도 하나의 수직으로 정렬된 문자구성요소의 일군을 포함하는 것이 특징인 자동원고 특징판정장치.
  8. 제1거리만큼 분리된 적어도 2원고라인을 갖는 문서화상의 스플래이안된 원고부의 원고특징을 판정하는 자동원고특징 판정장치에 있어서, 상기 스플래이안된 원고부를 나타내는 디지털 데이터 신호를 입력하는 입력수단과, 상기 디지털 데이터 신호는 복수의 신호부분들을 포함하며, 상기 각 신호부분은 복수의 화소들중 하나에 상응하며, 상기 복수의 신호부분들로부터 복수의 문자구성요소들을 생성하는 문자구성요소발생수단과, 상기 복수의 문자구성요소들중 상응하는 것을 각각 둘러싸는 복수의 경계박스들을 생성하는 경계박스 발생수단과, 상기 스플래이안된 원고부의 원고의 각 라인의 공간특징을 판정하며, 상기 원고의 각 라인은 복수의 문자구성요소들 중 적어도 하나를 포함하는 라인 공간특징 판정수단을 포함하며, 상기 라인 공간 특징판정수단은 각각의 적어도 한 라인마다 모달스트로크폭을 판정하는 스트로크폭 판정수단과 상응하는 라인에 대한 소정수의 모달스트로크폭보다 큰 폭을 갖는 넓은 문자구성요소들을 위치설정하는 수단과, 각각의 넓은 문자구성요소 모다 코스트 분포를 생성하는 수단과, 넓은 문자구성요소들중 하나의 소정부분에 각각 상응하는 코스트 분포들내에 미니멈들을 위치설정하는 수단과, 적어도 하나의 미니멈이 위치설정된 각각의 넓은 문자구성요소를 스플래이안된 원고부의 2개별 문자구성요소들로 분할하는 수단을 포함하는 것이 특징인 자동원고 특징판정장치.
  9. 제8항에 있어서, 상기 소정수는 3인 것이 특징인 자동원고 특징판정수단.
  10. 제8항에 있어서, 상기 각각의 넓은 문자구성요소의 소정부분은 넓은 문자구성 요소의 최좌위치의 우측으로의 모달 스트로크폭의 제2소정수인 제1지점으로부터 넓은 문자구성요소의 최우위치의 좌측으로의 평균스트로크폭의 제2소정수인 제2지점까지 연장되는 것이 특징인 자동원고 특징판정장치.
  11. 10항에 있어서, 상기 제2소정수는 1.5인 것이 특징인 자동원고 특징판정장치.
  12. 제8항에 있어서, 상기 미니멈은 소정값 이하인 것이 특징인 자동원고 특징판정장치.
  13. 제12항에 있어서, 상기 소정값은 모달스트로크폭과 동일한 것이 특징인 자동원고 특징판정장치.
  14. 제8항에 있어서, 상기 수평스플레잉수단은 넓은 문자구성요소에 상응하는 경계박스의 인접 칼럼들을 앤드연산함으로써 코스트 분포를 생성하는 것이 특징인 자동원고 특징판정장치.
  15. 제7항에 있어서, 상기 문자셀 발생수단은 각 문자셀마다 적어도 하나의 수직 정렬된 문자구성요소의 상응하는 그룹의 최좌위치와 최우위치를 판정하고, 각 라인의 각 문자셀의 경계들은 상기 정렬된 문자구성요소들의 상응하는 그룹의 최좌위치 및 최우위치와 상응하는 라인의 상하위치들을 포함하는 것이 특징인 자동원고 특징판정장치.
  16. 제7항에 있어서, 상기 라인공간 특징판정수단은 인트라워드와 인터워드 간격을 판정하는 워드간격 판정수단을 더 포함하며, 상기 워드간격 판정수단은 라인시작위치와 라인종료위치를 판정하는 수단과, 상기 스플래이된 원고의 각 라인의 문자구성요소들간의 간격들의 칫수를 판정하는 수단과, 공간 칫수의 분포를 판정하는 수단과, 간격칫수를 분포내에 적어도 하나의 피이크를 위치설정하는 수단을 포함하는 것이 특징인 자동원고 특징판정장치.
  17. 제16항에 있어서, 상기 워드간격판정수단은 각 라인마다 적어도 하나의 피이크가 인터워드간격과 인트라워드 간격중 하나를 나타내는지를 판정하는 수단과 상응하는 피이크 판정을 근거하여 각 라인내의 적어도 한 간격이 인터워드 간격과 인터워드간격 중 하나를 나타내는지를 판정하는 수단을 더 포함하는 것이 특징인 자동원고 특징판정장치.
  18. 문서의 화상의 스플래이안된 원고부의 원고특징들은 자동으로 판정하는 방법에 있어서, 상기 스플래이안된 원고부를 나타내며, 각각 복수의 화소들중 하나에 상응하는 복수의 신호부분들을 포함하는 디지털 데이터 신호를 입력하는 단계와, 상기 복수의 신호부분으로부터 복수의 문자구성요소들을 생성하는 단계와, 상기 복수의 문자구성요소들중 상응하는 것을 각각 둘러싸는 복수의 경계박스들을 생성하는 단계와, 상기 스플래이안된 원고부에서 복수의 문자구성요소들중 적어도 하나를 포함하는 원고의 각 라인의 공간특징을 판정하는 단계와, 상기 스플래이안된 원고부를 상기 제1거리보다 큰 제2거리만큼 적어도 2원고라인을 갖는 수직으로 스플래이된 원고부로 수직 스플래이하는 단계와, 상기 수직스플래이된 원고부의 수직프로필을 생성하는 단계를 포함하는 것이 특징인 자동원고 특징판정방법.
  19. 제18항에 있어서, 상기 수직프로필 단계는 복수의 문자구성요소들중 어느 것들이 원고부의 각 라인에 상응하는지를 판정하는 단계를 포함하는 것이 특징인 자동원고 특징판정방법.
  20. 제19항에 있어서, 상기 수직프로필 생성단계는 원고부마다 각 라인에 대한 복수의 문자구성요소들중 상응하는 것들을 근거로 상부 및 하부위치와 기준위치와 X-선 위치중 적어도 하나를 판정하는 단계를 포함하는 것이 특징인 자동원고 특징판정방법.
  21. 제20항에 있어서, 상기 판정단계는 각 라인에 상응하는 수직프로필에 관해 제각기 맥시멈 피이크와 미니멈피이크로부터 각 라인의 상부와 하부위치들을 판정하는 것이 특징인 자동원고 특징판정방법.
  22. 제20항에 있어서, 상기 수직프로필생성단계는 상기 복수의 문자구성요소들중 상응하는 것들의 상부위치들의 상부위치 수직프로필과 하부위치들의 하부위치수직프로필을 생성하는 단계를 더 포함하는 것이 특징인 자동원고 특징판정방법.
  23. 제20항에 있어서, 상기 판정단계는 각 라인에 상응하는 각각의 상부위치와 하부위치 수직프로필들의 피이크로부터 각 라인의 X-라인과 기준라인 위치들을 판정하는 것이 특징인 자동원고 특징판정방법.
  24. 문서의 화상의 스플래이안된 원고부의 원고특징들을 자동으로 판정하는 방법에 있어서, 상기 스플래이안된 원고부를 나타내며, 각각의 복수의 화소들중 하나에 상응하는 복수의 신호부분들을 포함하는 디지털 데이터 신호를 입력하는 단계와, 상기 복수의 신호부분으로부터 복수의 문자구성요소들을 생성하는 단계와, 상기 복수의 문자구성요소들중 상응하는 것을 각각 둘러싸는 복수의 경계박스들을 생성하는 단계와, 상기 스플래이안된 원고부에 복수의 문자구성요소들중 적어도 하나를 포함하는 원고의 각 라인의 공간특징을 판정하는 단계와, 상기 스플래이안된 원고부의 적어도 한 라인을 수평으로 스프래잉하는 단계와, 각 라인의 인접한 문자구성요소들간의 수평으로 스플래이된 원고부의 간격폭들을 판정하는 단계와, 상기 수평으로 스플래이된 원고를 근거로 스플래이안된 원고부의 각 라인의 적어도 한 문자셀을 생성하는 단계를 포함하며, 상기 각 문자셀은 수평으로 스플래이된 원고부의 적어도 하나의 수직 정렬된 문자구성요소 한 그룹을 포함하는 것이 특징인 자동원고 특징판정방법.
  25. 문서의 화상의 스플래이안된 원고부의 원고특징들을 자동으로 판정하는 방법에 있어서, 상기 스플래이안된 원고부를 나타내며, 각각 복수의 화소들중 하나에 상응하는 복수의 신호부분들을 포함하는 디지털 데이터 신호를 입력하는 단계와, 상기 복수의 신호부분으로부터 복수의 문자구성요소들을 생성하는 단계와, 상기 복수의 문자구성요소들중 상응하는 것을 각각 둘러싸는 복수의 경계박스들을 생성하는 단계와, 상기스플래이안된 원고부에서 복수의 문자구성요소들중 적어도 하나를 포함하는 원고의 각 라인의 공간특징을 판정하는 단계와, 적어도 한 라인마다 모달 스트로크폭을 판정하는 단계와, 상응하는 라인에 대해 모달스트로크폭의 소정수보다 큰 폭들을 갖는 넓은 문자구성요소들을 위치설정하는 단계와, 상기 넓은 문자 구성요소들중 하나의 소정부분에 각각 상응하는 코스크분포들내의 코스크 미니멈들을 위치설정하는 단계와, 적어도 하나의 코스트미니멈이 위치설정된 각각의 넓은 문자구성요소를 2개별 문자구성요소들로 분할하는 단계를 더 포함하는 것이 특징인 자동원고 특징판정방법.
  26. 제25항에 있어서, 상기 소정수는 3인 것이 특징인 자동원고 특징판정방법.
  27. 제25항에 있어서, 상기 각각의 넓은 문자구성요소의 소정부분은 넓은 문자구성요소의 최좌위치의 우측으로의 모달 스트로크폭의 제2소정수인 제1지점으로부터 넓은 문자구성요소의 최우위치의 좌측으로의 평균 스트로크폭의 제2소정수인 제2지점까지 연장되는 것이 특징인 자동원고 특징판정방법.
  28. 제27항에 있어서, 상기 제2소정수는 1.5인 것이 특징인 자동원고 특징판정방법.
  29. 제25항에 있어서, 상기 미니멈은 소정값 이하인 것이 특징인 자동원고 특징판정방법.
  30. 제29항에 있어서, 상기 소정값은 모달 스트로크폭과 동일한 것이 특징인 자동원고 특징판정방법.
  31. 제 25항에 있어서, 상기 수평스프래잉 단계는 넓은 문자구성요소에 상응하는 경계박스의 인접칼럼들을 앤드연산함으로써 코스트 분포를 생성하는 것이 특징인 자동원고 특징판정방법.
  32. 제24항에 있어서, 상기 문자셀 발생단계는 각 문자셀마다 적어도 하나의 수직 정렬된 문자구성요소의 상응하는 그룹의 최좌위치와 최우위치를 판정하고, 각 라인의 각 문자셀의 경계들은 수직 정렬된 문자구성요소들의 상응하는 그룹의 최좌위치 및 최우위치와 상응하는 라인의 상하위치들을 포함하는 것이 특징인 자동원고 특징판정방법.
  33. 제24항에 있어서, 상기 간격폭들 판정단계는 라인시작위치와 라인종료위치를 판정하는 단계와, 공간 칫수의 분포를 판정하는 단계와, 간격 칫수분포내에 적어도 하나의 피이크를 위치설정하는 단계를 포함하는 것이 특징인 자동원고 특징판정방법.
  34. 제33항에 있어서, 상기 간격폭 판정 단계는 각 라인마다 적어도 하나의 피이크가 인터워드 간격과 인트라워드 간격중 하나를 나타내는지를 판정하는 단계와, 상응하는 피이크 판정을 근거하여 각 라인내의 적어도 한 간격이 인터워드 간격과 인트라워드 간격중 하나를 나타내는지를 판정하는 단계를 더 포함하는 것이 특징인 자동원고 특징판정방법.
KR1019940004751A 1993-04-19 1994-03-11 원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치 KR970002420B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/047,514 1993-04-19
US08/047,514 US5384864A (en) 1993-04-19 1993-04-19 Method and apparatus for automatic determination of text line, word and character cell spatial features
US8/047,514 1993-04-19

Publications (2)

Publication Number Publication Date
KR940024625A KR940024625A (ko) 1994-11-18
KR970002420B1 true KR970002420B1 (ko) 1997-03-05

Family

ID=21949404

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940004751A KR970002420B1 (ko) 1993-04-19 1994-03-11 원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치

Country Status (5)

Country Link
US (1) US5384864A (ko)
EP (1) EP0621554B1 (ko)
JP (1) JPH0713995A (ko)
KR (1) KR970002420B1 (ko)
DE (1) DE69425084T2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011112522A2 (en) * 2010-03-10 2011-09-15 Microsoft Corporation Text enhancement of a textual image undergoing optical character recognition

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69330423T2 (de) * 1993-01-11 2002-05-16 Canon Kk Gerät und Verfahren zur Bildverarbeitung
US5513304A (en) * 1993-04-19 1996-04-30 Xerox Corporation Method and apparatus for enhanced automatic determination of text line dependent parameters
US5517578A (en) * 1993-05-20 1996-05-14 Aha! Software Corporation Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
US6535897B1 (en) 1993-05-20 2003-03-18 Microsoft Corporation System and methods for spacing, storing and recognizing electronic representations of handwriting printing and drawings
JP3042945B2 (ja) * 1993-07-07 2000-05-22 富士通株式会社 画像抽出装置
EP0634704B1 (en) * 1993-07-16 2000-04-26 Sharp Kabushiki Kaisha Image processor
EP0702322B1 (en) * 1994-09-12 2002-02-13 Adobe Systems Inc. Method and apparatus for identifying words described in a portable electronic document
CA2154952A1 (en) * 1994-09-12 1996-03-13 Robert M. Ayers Method and apparatus for identifying words described in a page description language file
JP3805005B2 (ja) * 1994-11-09 2006-08-02 キヤノン株式会社 画像処理装置及び光学的文字認識装置及びそれらの方法
EP0807297B1 (en) * 1995-01-31 1999-09-29 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
US5999647A (en) * 1995-04-21 1999-12-07 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus for extracting character data from a text image
MY121607A (en) * 1995-07-10 2006-02-28 Hyundai Curitel Inc Grid moving method of object image and apparatus using the same and compaction/motion estimation method using the same and apparatus thereof
US5867597A (en) * 1995-09-05 1999-02-02 Ricoh Corporation High-speed retrieval by example
US5737442A (en) * 1995-10-20 1998-04-07 Bcl Computers Processor based method for extracting tables from printed documents
US5892842A (en) * 1995-12-14 1999-04-06 Xerox Corporation Automatic method of identifying sentence boundaries in a document image
US5850476A (en) * 1995-12-14 1998-12-15 Xerox Corporation Automatic method of identifying drop words in a document image without performing character recognition
US5848191A (en) * 1995-12-14 1998-12-08 Xerox Corporation Automatic method of generating thematic summaries from a document image without performing character recognition
US5683586A (en) * 1996-02-05 1997-11-04 Harcourt; Gregory A. Method and apparatus for magnetically treating a fluid
US5909510A (en) * 1997-05-19 1999-06-01 Xerox Corporation Method and apparatus for document classification from degraded images
US6687404B1 (en) 1997-06-20 2004-02-03 Xerox Corporation Automatic training of layout parameters in a 2D image model
JP4320064B2 (ja) * 1998-07-10 2009-08-26 富士通株式会社 画像処理装置及び記録媒体
JP3897272B2 (ja) * 1999-09-28 2007-03-22 富士フイルム株式会社 画像解析装置
US8682077B1 (en) 2000-11-28 2014-03-25 Hand Held Products, Inc. Method for omnidirectional processing of 2D images including recognizable characters
US7239747B2 (en) * 2002-01-24 2007-07-03 Chatterbox Systems, Inc. Method and system for locating position in printed texts and delivering multimedia information
US7120297B2 (en) 2002-04-25 2006-10-10 Microsoft Corporation Segmented layered image system
US7110596B2 (en) 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US7263227B2 (en) 2002-04-25 2007-08-28 Microsoft Corporation Activity detector
US7024039B2 (en) 2002-04-25 2006-04-04 Microsoft Corporation Block retouching
US7043079B2 (en) 2002-04-25 2006-05-09 Microsoft Corporation “Don't care” pixel interpolation
US7164797B2 (en) 2002-04-25 2007-01-16 Microsoft Corporation Clustering
US7392472B2 (en) 2002-04-25 2008-06-24 Microsoft Corporation Layout analysis
JP2004038321A (ja) * 2002-06-28 2004-02-05 Fujitsu Ltd 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法
US7302098B2 (en) * 2004-12-03 2007-11-27 Motorola, Inc. Character segmentation method and apparatus
WO2006066325A1 (en) * 2004-12-21 2006-06-29 Canon Kabushiki Kaisha Segmenting digital image and producing compact representation
US7602972B1 (en) * 2005-04-25 2009-10-13 Adobe Systems, Incorporated Method and apparatus for identifying white space tables within a document
US7650041B2 (en) 2006-02-24 2010-01-19 Symbol Technologies, Inc. System and method for optical character recognition in an image
WO2009094446A1 (en) * 2008-01-22 2009-07-30 Digital Business Processes, Inc. Method and apparatus for cropping images
US8620080B2 (en) * 2008-09-26 2013-12-31 Sharp Laboratories Of America, Inc. Methods and systems for locating text in a digital image
EP2275972B1 (en) * 2009-07-06 2018-11-28 AO Kaspersky Lab System and method for identifying text-based spam in images
US9003531B2 (en) 2009-10-01 2015-04-07 Kaspersky Lab Zao Comprehensive password management arrangment facilitating security
US8571270B2 (en) * 2010-05-10 2013-10-29 Microsoft Corporation Segmentation of a word bitmap into individual characters or glyphs during an OCR process
US9237255B1 (en) 2014-08-25 2016-01-12 Xerox Corporation Methods and systems for processing documents
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
US20170068868A1 (en) * 2015-09-09 2017-03-09 Google Inc. Enhancing handwriting recognition using pre-filter classification
US9842251B2 (en) * 2016-01-29 2017-12-12 Konica Minolta Laboratory U.S.A., Inc. Bulleted lists
KR101999549B1 (ko) 2017-07-25 2019-07-12 주식회사 한글과컴퓨터 셀 자동 분할 장치

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3613080A (en) * 1968-11-08 1971-10-12 Scan Data Corp Character recognition system utilizing feature extraction
US4206442A (en) * 1974-07-03 1980-06-03 Nippon Electric Co., Ltd. Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails
US4173015A (en) * 1978-08-16 1979-10-30 Recognition Equipment Incorporated System and method for character presence detection
JPS56129981A (en) * 1980-03-14 1981-10-12 Toshiba Corp Optical character reader
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
EP0120334B1 (en) * 1983-03-01 1989-12-06 Nec Corporation Letter pitch detection system
US4918740A (en) * 1985-10-01 1990-04-17 Palantir Corporation Processing means for use in an optical character recognition system
US4899394A (en) * 1986-05-09 1990-02-06 Prodigy Systems Corporation Apparatus and method for image compression
US5001766A (en) * 1988-05-16 1991-03-19 At&T Bell Laboratories Apparatus and method for skew control of document images
US5062141A (en) * 1988-06-02 1991-10-29 Ricoh Company, Ltd. Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition
JPH0816918B2 (ja) * 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011112522A2 (en) * 2010-03-10 2011-09-15 Microsoft Corporation Text enhancement of a textual image undergoing optical character recognition
WO2011112522A3 (en) * 2010-03-10 2011-11-03 Microsoft Corporation Text enhancement of a textual image undergoing optical character recognition
CN102782706A (zh) * 2010-03-10 2012-11-14 微软公司 经历光学字符识别的文本图像的文本增强
US8526732B2 (en) 2010-03-10 2013-09-03 Microsoft Corporation Text enhancement of a textual image undergoing optical character recognition

Also Published As

Publication number Publication date
JPH0713995A (ja) 1995-01-17
DE69425084D1 (de) 2000-08-10
EP0621554A2 (en) 1994-10-26
DE69425084T2 (de) 2000-11-09
EP0621554A3 (en) 1995-05-24
KR940024625A (ko) 1994-11-18
US5384864A (en) 1995-01-24
EP0621554B1 (en) 2000-07-05

Similar Documents

Publication Publication Date Title
KR970002420B1 (ko) 원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치
EP0621541B1 (en) Method and apparatus for automatic language determination
US5513304A (en) Method and apparatus for enhanced automatic determination of text line dependent parameters
US6741745B2 (en) Method and apparatus for formatting OCR text
US4903312A (en) Character recognition with variable subdivisions of a character region
US5563403A (en) Method and apparatus for detection of a skew angle of a document image using a regression coefficient
KR970002421B1 (ko) 자동문자 스크립트 판정방법 및 장치
EP0138445B1 (en) Method and apparatus for segmenting character images
JP4821869B2 (ja) 文字認識装置、画像読取装置、およびプログラム
US20120243785A1 (en) Method of detection document alteration by comparing characters using shape features of characters
JP3774690B2 (ja) 画像を文字画像行に分割する方法および装置、ならびに、文字画像認識方法および装置
EP0780782B1 (en) Separation of touching characters in optical character recognition
EP0461760B1 (en) Image processing apparatus and method
KR20030017304A (ko) 망점 제거 방법 및 시스템
US20040001628A1 (en) Apparatus and method of analyzing layout of document, and computer product
US10458923B2 (en) Print data processing method, print data processing device, and recording medium having recorded therein print data processing program
JP3796276B2 (ja) 自動テキスト特徴決定システム
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JP3187895B2 (ja) 文字領域抽出方法
JPH0766413B2 (ja) 文書文字方向検出装置
KR19990011500A (ko) 화상 시스템의 국부 이치화 방법
JP3104355B2 (ja) 特徴抽出装置
JP3071479B2 (ja) 行間スペース検出方法
KR19990016658A (ko) 화상의 국부 이치화 장치 및 방법
JP2001143076A (ja) 画像処理装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20000222

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee