KR20010015046A

KR20010015046A - 구조화된 배경 모델과 문자의 조합에 의한 배경위의 문자자동 인식 방법

Info

Publication number: KR20010015046A
Application number: KR1020000033785A
Authority: KR
Inventors: 스트링가루이지
Original assignee: 다니엘구이산,화우스토지오리; 드라루지오리에쓰.에이.
Priority date: 1999-06-21
Filing date: 2000-06-20
Publication date: 2001-02-26
Also published as: KR100691651B1; JP4593729B2; DE60032413D1; AU767855B2; EP1063606B1; US6690824B1; EP1063606A3; CA2310874A1; AU3937000A; DE60032413T2; UA70933C2; MC2491A1; CN1282070A; EP1063606A2; CN1172264C; ATE349047T1; JP2001022892A

Abstract

본 발명은 현저하게 대비색으로 구조화된 배경 도안 그림위의 가변 위치에 인쇄된 문자들을 전자 수단에 의해 자동으로 인식하는 방법에 관한 것이다. 상기 방법은 우선, 상기 이미지상에 상기 배경만이 있고, 여러개의 샘플의 이미지들을 전자 카메라로 포획하여 얻어진, 상기 배경 모델을 생성하는 단계를 포함한다. 그런 다음, 인식될 부호들(예컨대, 알파벳, 숫자, 문자)의 모델들은 흰색 배경위에 인쇄된 문자의 집합의 이미지들을 포획하거나, 상업적으로 입수 가능한 선택된 폰트의 문자로 된 컴퓨터 파일을 사용하여 생성된다. 인식 단계에서, 인식될 각 문자들의 위치는 우선, 상기 배경의 도안 그림의 인쇄 위치에 대해 측정된다. 이후에, 인식될 각 문자는, 알려지지 않은 문자의 동일한 상대적 위치로 상기 부호의 모델을 상기 배경 모델과 결합하여 얻어진 모델들과 비교된다. 따라서, 상기 배경과 함께 상기 문자를 인식하는 동작은, 어떤 잘 알려진 인식 기술을 사용하여, 동일 위치의 동일 배경과 결합된 문자의 모델과의 비교에 의해 달성된다.

Description

구조화된 배경 모델과 문자의 조합에 의한 배경위의 문자 자동 인식 방법{Automatic Recognition of Characters on Structured Background by Combination of the Models of the Background and of the Characters}

본 발명은 현저하게 대비되는 구조형상을 나타냄으로써 문자의 구조를 크게 간섭하는 배경이 있는 어떤 매체상에 인쇄된 문자들을 자동으로 인식하는 방법에 관한 것이다.

대부분의 공지된 문자 인식 시스템들은 매우 독창적이고 정교한 한계값(thresholds)에 의해 배경으로부터 문자를 분리하려고 시도함으로써 문제점을 다루고 있다. 그러나, 이러한 기술은 배경 구조형상이 상당히 대조될 때, 특히 상기 문자들의 위치가 상기 배경 구조형상에 대해 변경되는 경우에, 실패한다. 따라서, 상기 문자들의 이미지는 (상기 한계값을 초과하는) 상기 배경의 일부 부호(signs)를 포함하거나, 완전하지 않은데, 그 이유는 상기 문자의 구조형상의 일부가 상기 한계값을 초과하지 않았기 때문이다. 예컨대, 은행 지폐가 그런 경우인데, 상기 은행 지폐의 일련 번호는, 일반적으로 그 지폐면의 나머지 영역을 인쇄한 후에 서로 다른 프린터로 상기 나머지 인쇄 영역으로부터 분리된 상태에서 인쇄된다. 따라서, 인쇄시 정합(registration)은 완전해 질 수 없고, 그 결과, 상기 지폐의 일련 번호는 상기 배경에 대해 "이동(move)"하게 된다: 만약, 상기 일련 번호들이 상기 지폐의 구조화 영역위, 즉 그림 영역(drawn area)위에 인쇄되면, 상기 일련 번호들은 상기 배경의 (그림) 구조에 대해 움직이게 된다. 더욱이, 상기 언급된 경우에, 상기 문자들에 대한 탐색 및 분할(segmenting)은 상기 배경의 구조를 고려하여 볼 때, 실패할 위험성이 있다.

사실상, 많은 양의 변화가 발생된다 하더라도 추출(extraction) 및 인식(recognition) 과정은 거의 항상 다음과 같은 단계들을 포함한다:

(가) 문서의 이미지 및 보다 일반적으로는 인식될 문자들을 포함하는 대상(object) 의 포획(capture). 상기 포획 과정은 전자 카메라에 의해 달성되고, 일반적으로 그 후속 단계로서 대비(contrast)율을 향상시키고 잡음을 감소시키기 위한 계산(computations)과정을 수반한다.

(나) 인식될 문자들의 위치에 대한 이미지의 탐색(search). 상기 탐색 과정은 (흰색에서 검정색으로의 절환동작과 같은) 조명의 갑작스런 변화, 특히 공간 분배(spatial distributions)에 대한 분석에 근거한다.

(다) 단일 문자를 각각 포함하는 부영역(subareas)으로 확인된 영역의 분할(segmentation). 상기 분할 과정은 예컨대, 문자 라인의 베이스에 평행한 세그먼트상으로 검정색 밀도의 투사(projection)량을 분석함으로써 달성된다. 이 검정색 밀도의 최소량은 문자간의 흰색 공간과 상호 연관될 수 있다.

(라) 따라서, 분리된 각 문자는, 중첩능력(superposability)("형판-정합(template-matching)으로 알려진 기술)이나, 수직, 수평 또는 비스듬한 사선 형태등과 같은 특징적 구조형상(characteristic structures)의 연속("특징 추출(features extraction)" 또는 구조 분석으로 알려진 기술)에 기초하여 모든 글자 및/또는 모든 숫자의 원형(prototypes)(모델)과 비교된다.

어떤 경우에 있어서, 만약, 문자로서 분할된 이미지의 일부가 실제 문자의 형태와 무관한 구조(예컨대, 배경의 구조형상에 속하는 선(lines))를 포함한다면, 상기 원형과의 비교동작이 실패할 가능성이 매우 높다. 이것은 또한, 문자/배경 분리 단계(character/background separation phase)에서 지나치게 강렬한 스레쇼울딩(thresholding) 과정에 후속하는 상기 문자의 구조형상의 일부를 식별할 때 손실의 연속이 될 수도 있는 위험성을 내포한다.

그 이유는 고밀도로 구조화된 배경위에 인쇄된 문자들을 자동으로 인식하기 위한 이전의 해결방법은 충분한 수익성이 없었기 때문이다.

따라서, 본 발명의 목적은 전술한 종래 기술의 문제점을 해소하고자, 본 발명의 목적은 문자 구조형상의 콘트라스트(contrast)와 비교 가능한 대비색을 갖는 고밀도로 구조화된 배경위에 인쇄되는 문자들의 전자 이미지를 자동으로 인식하는데 있다.

도 1은 (a)에는 흰색 배경위에 인쇄된 일련의 연속된 문자가 예시된 플레이트(plate)가 도시되고, (b)에는 상기 배경위에 사선으로 상호 교차하여 그려진 선들이 예시되고, (c)에는 상기 사선 배경 (b)위에 인쇄된 일련의 연속된 문자가 예시된 플레이트가 도시되어 있는, 고밀도로 구조화된 배경위에 짙은 대비색으로 인쇄된 문자의 예를 도시한 도면.

도 2(a)는 도 1(c)과 동일한 반면, 도 2(b)는 완전하게 인쇄된 이미지로부터 등록된 배경 모델을 제거한 결과의 플레이트를 도시한 도면.

도 3(a)은 인식 대상 문자를 포함하는 도 1 및 도 2에 도시된 플레이트의 예인 은행 지폐의 일부를 도시한 것이고, 도 3(b)은 분할된 각 문자 위치에 해당하는 부이미지(subimages)를 도시한 것이고, 도 3(c)은 각 문자 위치에 대해 모든 가능한 부호(symbols) 모델과의 상기 등록 배경의 부이미지의 해당 조합과, 그에 따라 본 명세서에 설명되는 부호 조합 모델을 도시한 것으로서, 처리 대상 문자(b)가 어떻게 흰색 배경위에 인쇄된 부호(도 3(d)의 예 참조) 모델보다 상기 부호 조합 모델과 비교한 경우에 보다 더 효과적으로 인식될 수 있는지를 설명한 도면.

도 4(a)는 본 명세서에 설명되는 문자 인식 시스템의 전형적인 구성을 도시한 개략도.

본 발명에 따르면, 인식될 문자들이 인쇄되는 물체는, 인식될 문자의 전자 이미지를 발생시키기 위해 원하는 해상도(resolution)를 갖는 예컨대, (선형 또는 매트릭스 타입의 검정 및 흰색의) CCD 카메라와 같은 잘 알려진 광전자 수단에 의해 광학적으로 분석될 수 있다.

이하에서, "이미지"란 용어는 전자 이미지(electronic image)의 의미, 특히 일반적으로는 장방형 매트릭스로서 구성되는 분리된 밀도값의 집합(a discrete set of density values)의 의미로 사용될 것이다. 소위 화소(pixel)라고 불리는 상기 매트릭스의 각 요소는 상기 물체의 대응 부분에 의해 반사되는 빛의 강도(세기)의 크기이다. 칼라 이미지의 경우, 일반적으로 각 화소의 적색(red), 녹색(green) 및 청색(blue) 성분에 해당하는 3개의 매트릭스로 구성된다. 설명의 단순화를 위해, 이하에서는 검정색과 흰색의 경우에 대해서 설명하기로 한다. 즉, 색의 확대는 상기 3가지 매트릭스에 대해 동일한 동작을 반복함으로써 달성된다. 본 발명의 기초가 되는 상기 문자 자동 인식 방법의 제 1 단계는 어떠한 문자도 없이 배경의 사선 그림만이 존재하는 하나 이상의 샘플들의 이미지를 포획함으로써 획득될 수 있는 배경 모델을 생성하는 과정을 포함한다(도 1(b)참조).

특히, 소위 샘플의 이미지의 평균을 모델로서 사용할 수 있다: 검정색과 흰색 이미지의 경우에, 단일 평균 -매트릭스가 존재하는 반면, 칼라 이미지의 경우에는, 예컨대, 적색, 녹색 및 청색의 3 가지 평균 매트릭스가 존재하게 된다. 인식될 부호(예컨대, 문자 및/또는 숫자)의 모델은 흰색 배경위에 인쇄된 문자 집합의 이미지를 포획하거나, 오늘날 대부분의 "폰트(fonts)"로서 상업적으로 입수 가능한 컴퓨터 파일의 전자 이미지를 직접 사용하여 후속적으로 생성된다. 첫 번째 경우에, 인식될 각 부호의 모델은 흰색 배경위에 인쇄되는 동일한 부호의 다수의 견본의 이미지 평균으로서 구성될 수 있다.

일단, 상기 인식될 부호의 모델과 상기 배경의 모델이 구성되고 나면, "학습 단계(learning phase)라고도 불리는 상기 문자 자동 인식 방법의 제 1 단계가 종료된다.

상기 인식 단계중에, 다음과 같은 후속 단계들이 수행된다: 즉,

-알려지지 않은 위치에 있는 배경위에 인쇄된 알려지지 않은 문자들을 포함하는, 인식될 샘플의 이미지를 포획하는 단계;

-예컨대, 최소한의 상관관계 방법을 사용하여 이미지를 정합(registering)시키기 위한 잘 알려진 기술들 중 어느 한 가지 기술을 사용하여 포획된 이미지와 상기 배경의 모델을 정합시키는 단계;

-상기 포획된 이미지로부터 상기 정합된 모델을 제거하는 단계(상기 배경이 거의 제거되는 차 이미지(difference image)는 문자의 위치를 분명히 명시해준다: 상기 정합된 배경의 모델이 제거된 이미지의 차(도 2(b)참조));

-상기 차 이미지에 있는 각 문자의 위치를 탐색하는 단계(상기 탐색 동작은 검정색/흰색 절환 형태의 갑작스런 밀도 변화를 분석하는 것과 같이, 문자들의 위치를 알아내고 상기 문자들을 분할하기 위한 잘 알려진 기술들 중 어느 한 가지 기술을 사용하여 달성된다. 따라서, 각 문자 위치의 경우, 그 크기가 상기 부호의 것과 동일한 부 이미지(subimage)(도 3(b)의 분할된 문자의 부이미지참조)를 분리시킬 것이다.);

-알려지지 않은 각 문자에 해당하는 상기 배경의 부 이미지로부터 상기 정합된 배경의 모델을 추출하는 단계; 상기 각 문자의 위치에 대해, 상기 부호의 모델들을 상기 대응하는 배경 모델의 부 이미지와 결합하는 단계(도 3(c)참조). 상기 배경 모델은 상기 결합된 부 이미지에서 인식될 문자들을 포함하는 이미지의 배경과 정합(배경 모델-숫자 및/또는 문자 모델)되었기 때문에, 상대적인 문자/배경 위치는 알려지지 않은 이미지에서와 동일하다. 따라서, 종합하는 과정 중에, 상기 알려지지 않은 이미지와 동일한 배경을 갖는 부호(문자 및/또는 숫자)의 새로운 원형(prototypes)(결합된 모델)이 각 문자 위치에 생성될 것이다. 한 가지 개발된 결합 기술은 본 명세서의 "일부 양호한 변형 실시예의 설명에서" 언급될 것이지만, 다른 저자들에 의해 제안된 방법들 중 어느 한 방법이 사용될 수도 있다.

-상기 각각의 알려지지 않은 문자들을 상기 이전 단계들에서 결합된 모든 모델과 비교하는 단계: 따라서, 상기 문자를 배경과 함께 인식하는 과정은 상기 부호 모델을 동일 위치에 있는 동일 배경과 비교함으로써 달성된다. 형판 정합 방법 또는 특징 추출 방법등과 같은 상기 잘 알려진 인식 기술들 중 어느 한 기술이 사용될 수도 있다.

이하, 본 발명의 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.

이하에서는, 은행 지폐면에 인쇄되는 일련 번호의 자동 인식에 관한 양호한 변형 실시예가 본 발명의 제한되지 않은 일례로서 설명될 것이다. 사실상, 여러 가지 형태의 지폐의 경우, 부분적으로 또는 전체적으로 일련 번호가 지폐의 도안 부분위에 인쇄된다. 은행 지폐 표면에 상기 일련 번호를 인쇄하는 과정은 특히 서로 다른 기술의 혼합으로, 일반적으로는 적어도 오프셋 인쇄 기술 및 동판 인쇄 기술로 달성된다. 특히, 상기 동판 인쇄 기술은 일반적으로 매우 강렬하게 대비되는 많은 수의 선들이 도안된 영역들을 나타내고, 일련 번호를 상기 영역들 중 어느 한 영역위에 인쇄하는 경우 배경으로부터 문자들을 분리하여 이들 문자를 인식해내는 종래의 기술로는 그 작업이 어렵게 수행된다. 더욱이, 상기 일련 번호는 통상 오프셋 인쇄 및 동판 인쇄 과정 이후 최종 제조 단계에서 서로 다른 인쇄기 위에서 인쇄된다. 비록, 매우 정교한 인쇄 정합 시스템(sophisticated registration systems)이 사용된다 하더라도, 상기 일련 번호와 상기 지폐의 배경 도안 그림간의 상대적인 정합은 매우 가변적인 것으로 밝혀지고 있고, 일반적으로 수 밀리미터의 간격만큼 "이동"할 수 도 있다.

도 4는 은행 지폐의 일련 번호를 인식하기 위한 시스템의 구성을 도시한 것으로서, 상기 시스템의 렌즈(2)를 구비한 선형 CCD 카메라(1) 및 그 조명 시스템(3)은, 일련 번호를 판독하고자 할 때 동안 흡입 리본(sucker ribbon)(5)에 의해 옮겨지는 지폐(4)의 이미지를 포획하는데 사용된다.

상기 카메라에 의해 주사되는 배경 도안 선들은 이미지 계산 서브시스템(image computation subsystem)(6)의 제 1 버퍼 메모리에 연속적으로 저장되어 각 지폐의 전자 이미지를 생성한다.

DSP(디지털 신호 처리기:Digital Signal Processor), 매우 신속한 PC등과 같은 프로그램가능한 컴퓨터 또는 특수 하드웨어에 기초할 수 있는 상기 이미지 계산 서브 시스템(6)은 (상기 배경 모델 및 상기 문자 모델의) 상기 학습 단계 및 상기 인식 단계 중에 여러 가지 동작들을 수행한다.

상기 배경 모델의 학습 단계 중에, 상기 이미지 계산 서브 시스템(6)은,

-"배경 학습 세트(BLS:Background Learning Set)"로서 선택된 일련 번호가 매겨지지 않은 지폐의 이미지를 포획하고, 그 포획된 이미지를 적절한 메모리에 저장하고;

-인쇄 정합을 위해 조작자 인터페이스(operator interface)(7)의 콘솔(console)에 의해 자동으로 또는 조작자의 도움으로 상기 BLS로부터 "기준" 이미지를 추출하고;

-상기 기준 이미지에 대해 각 이미지의 수평 변위량 Δx 및 수직 변위량 Δy를 우선적으로 확인한 다음, -Δx 및 -Δy의 이동량(shift)을 적용함으로써 상기 BLS의 모든 이미지를 정합한다. 상기 변형 실시예에서, 상기 변위량은 최대 상관관계 방법를 사용하여 측정된다: 예컨대, (문자 인쇄 영역밖에 있는) 조작자에 의해 선택된 좌표 x_o,y_o상의 중심을 갖는 상기 기준 이미지의 작은 장방형 부분 So(정합 코어:registration core)은 상기 BLS의 이미지의 각 위치(화소)상으로 단계적으로 변위되는 중심을 갖는 동일한 크기 부분 S₁과 비교됨으로써, 상기 위치 x_o,y_o를 찾을 수 있다(여기서, 상관 계수는 그 최대값을 갖는다(이 값은 상기 두 개의 이미지의 최상의 중첩(superposition)에 해당한다). 상기 변위량은 다음과 같이 계산된다:

Δx = x₁-x_o및 Δy = y₁-y_o.

상기 변형 실시예에 따라, 상기 배경 모델 M_b는 상기 기준 이미지와 정합된 상기 BLS의 이미지의 산술평균으로서 얻어진다.

상기 부호 모델의 학습 단계중에, 상기 이미지 계산 서브 시스템(6)은,

-흰색 배경위에 상기 일련 번호로 사용되는 모든 숫자 및/또는 문자들을 각각 한번에 공지된 위치에(문자 학습 세트-CLS:Character Learning Set) 인쇄하고자 하는 지폐 세트의 이미지들을 포획하고,

-상기 CLS의 이미지들을 단일 문자를 각각 포함하는 부이미지로 연속하여 분할하고(금번 변형 실시예에서, 상기 분할 과정은 상기 문자들이 흰색 배경위에 인쇄될 때 매우 효과적인 흰색/검정색 변화를 분석하기 위한 표준 기술로 달성됨),

-각 부호(문자 또는 숫자)의 모델 M_s를, 예컨대, 기준으로서 취해진 상기 CLS의 제 1 지폐의 것과 정합된, 각 위치의 부 이미지의 CLS상의 평균으로서 생성한다. 상기 정합 및 평균화 과정은 상기 배경의 경우에서와 같이 수행되지만, 상기 정합 코어는 전체적인 문자 부이미지와 일치한다.

일반적으로, 상기 은행 지폐의 일련 번호는 단일 폰트로된 알파벳과 숫자 문자를 사용한다. 따라서, 각 부호당 상기 CLS 지폐상에 한 위치로 충분하다(단일 A, 단일 B, 등). 만약, 그렇지 않으면, 이용되는 폰트 개수만큼의 부호당 위치의 수를 마련하는 것이 필요할 것이다(예컨대, A New York, A Courier, A Geneva, 등).

상기 인식 단계중에, 본 발명의 금번 변형 실시예에 따라, 상기 이미지 계산 서브 시스템(6)은, 이미지 포획 과정이후에,

-우선, 판독될 각 지폐의 배경 이미지를, 상기 배경 모델을 학습하는데 사용되는 동일한 정합 코어에 의해 동일한 상관 기술을 사용하여 상기 배경 모델과 정합시키고,

-그에 따라, 배경 차 이미지(background difference image)의 모델이 제거된 (정합된) 완전한 지폐를 만든 다음, 문자 위치들을 탐색하고(여기서, 사용된 기술은 이미 앞서 언급된 바 있는 위치 변화 분석 과정에 기초한다. 일반적으로, 상기 탐색 과정은, 상기 인쇄되는 일련 번호가 수 밀리미터 간격 만큼만 상기 배경의 그림 도안부분에 대해 이동하기 때문에, 상기 지폐의 제한된 영역위에서 수행될 수 있다),

-상기 차 이미지상에서 정합된 각각의 문자 위치에 대해 상기 정합된 배경 모델의 해당 부이미지를 추출하고(상기 부이미지는 정확히 상기 알려지지 않은 문자가 인쇄된 배경의 일부분이 된다),

-각 문자 위치에 대해, 상기 (정합된) 배경의 모델 M_b의 해당 부이미지를 상기 부호의 모델 M_s와 결합한다.

또한, 문자에 배경이 삽입된 새로운 모델은, 판독될 지폐상의 위치와 동일한 상대적 위치로 각 문자 위치에 대해 얻어질 것이다. 본 발명의 금번 변형 실시예에서, 상기 조합 모델 M_c는 다음과 같은 방정식으로 화소마다 얻어진다:

M_c= K_oM_bM_s+ K₁(1-) (1)

만약, 상기 배경이 먼저 인쇄된 다음, 문자들이 인쇄되었다면, 다음과 같이 된다.

M_c= K_oM_bM_s+ K₁(1-) (2)

어떤 경우에, K_o및 K₁은 이용된 잉크 및 종이의 특성인 상수이다. 상기 방정식 (1) 및 (2)에서, 첫 번째 항(곱 K_oM_bM_s)은 이용된 잉크의 투과율(transmissivity) 및 종이의 반사력(reflectivity)을 고려하는 반면, 그 두 번째 항은 최종적으로 인쇄된 잉크의 표면의 반사력에 관한 것이다.

또한, 상기 이미지 계산 서브 시스템(6)은,

-각 문자 위치에 대해, 상기 지폐의 해당 부이미지와 (문자에 배경이 삽입된) 상기 모든 새로운 모델간의 상관 계수를 계산하고(:처리될 문자는 상기 상관 계수의 최대값에 해당하는 상기 결합 모델의 문자로서 인식됨),

-본 발명의 금번 변형 실시예에 따라, 더욱이, 상기 상관 계수의 최대값을 한계값과 비교하여 각 문자 위치에 해당하는 부이미지의 배경 및 문자의 인쇄 품질을 검증한다. 만약, 상기 인쇄 품질이 양호하면(처리될 부이미지와 결합된 모델이 거의 동일하면), 상기 상관 계수는 거의 1이 되는 반면, 매우 양호한 인쇄 품질이면 0에 가까운 상관 계수가 생성된다.

다른 양호한 변형 실시예는,

(a) 문자, 그림 엽서(postcards), 라벨(labels), 은행 수표 또는 우편환등과 같은 은행 지폐이외의 문서상에 인쇄된 문자들의 인식에 적용.

(b) 리본 이송 시스템(ribbon transport system)을 예컨대, 인쇄기에서 사용되거나 또는 기준(4)의 특허 따라 사용되는 실린더와 같은, 대형 크기의 종이에 바람직한 이송 수단으로의 대체.

(c) 상기 선형 카메라를 매트릭스 형태의 카메라로의 대체.

(d) 상기 BLS의 이미지 평균을 상기 배경의 정합을 위한 기준 이미지로서 사용.

(e) 예컨대, 기준(1)에서 제안된 기술에 따른, 상기 배경의 정합을 위한 정합 코어의 자동 추출.

(f) 예컨대, 기준(2)에서 제안된 기술에 따른, 평균화 과정이외의 과정을 통한 상기 배경 모델의 구성.

지금까지, 본 발명을 특정 실시예와 관련하여 도시하고 설명하였지만, 상기 본 발명에 대한 개시는 단지 본 발명의 적용예에 불과한 것이고, 본 발명을 수행하기 위한 최상 모드로서 본 명세서에 개시된 특정 실시예에 국한되는 것은 아니다.

또한, 이하의 특허청구의 범위에 의해 마련되는 본 발명의 정신이나 범위를 이탈하지 않는 한도내에서 본 발명이 다양하게 수정 및 변경될 수 있다는 것을 당업계에서 통상의 지식을 가진자라면 용이하게 이해할 수 있을 것이다.

따라서, 본 발명에 따른 문자 자동 인식 방법에 의하면, 인식될 문자들이 인쇄되는 물체가, 인식될 문자의 전자 이미지를 발생시키기 위해 원하는 해상도를 갖는 예컨대, (선형 또는 매트릭스 타입의 검정 및 흰색의) CCD 카메라와 같은 잘 알려진 광전자 수단에 의해 광학적으로 분석될 수 있다.

Claims

이미지 포획을 위한 광전자 장치 및 이미지 계산 시스템을 사용하여 어떤 매체상의 현저하게 대비되는 구조형상을 나타내는 배경위에 인쇄된 문자들을 전자 수단에 의해 자동으로 인식하는 방법에 있어서,

(a) (a.1) 상기 이미지상에 상기 배경만이 있고, 하나 이상의 샘플의 이미지들을 포획하여 얻어진, 상기 배경 모델의 생성 및,

(a.2) 부호당 적어도 하나의 문자를 포함하는 흰색 배경위에 인쇄된 문자의 집합의 이미지들을 포획하여 얻어진 문자(부호, 알파벳 및/또는 숫자)의 모델의 생성을 학습하는 단계와;

(b) (b.1) 상기 배경위에 인쇄된 알려지지 않은 문자들을 포함하는, 인식될 상기 샘플의 이미지를 포획하고,

(b.2) 상기 배경의 모델을 상기 포획된 이미지의 배경과 정합하고,

(b.3) 각각의 알려지지 않은 문자에 해당하는 배경의 부이미지로부터 상기 정합된 배경의 모델을 추출하고,

(b.4) 각 문자 위치에 대해, 문자 및/또는 숫자의 모델을 상기 해당 배경(결합 모델)의 부이미지와 결합하고,

(b.5) 상기 알려지지 않은 문자들을 상기 동일한 문자 위치에 해당하는 모든 결합 모델과 결합하고,

(b.6) "형판-정합" 기술에 따라, 부호에 해당하는 알려지지 않은 각 문자를, 상기 부호와 최상으로 중첩되는 결합 모델로서 인식하는 인식 단계를 포함하는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 배경의 모델은 BLS(배경 학습 세트)의 이미지들 중 하나인 것을 특징으로 하는 방법.
제1항에 있어서, 상기 배경의 모델은 상호 정합되는, 상기 BLS의 이미지들의 평균인 것을 특징으로 하는 방법.
제1항에 있어서, 상기 배경의 모델은 예컨대, 기준(2)에서 제안된 기술과 같은 잘 알려진 문자/배경 분리 기술에 따라, 상기 배경 또는 상기 문자들을 포함하는 샘플 집합을 통해 얻어지는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 인식될 부호의 모델은 상기 CLS의 해당 이미지의 평균으로서 얻어지는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 인식될 부호의 모델은 컴퓨터 파일을 통해 얻어지는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 형판 정합 기술이외의, 상기 잘 알려진 인식 기술들 중 어느 한 기술을 사용하는 것을 특징으로 하는 방법.
제1항에 있어서, 칼라 이미지 포획 시스템을 사용하여, 최상의 중첩 기능을 제공하는 칼라 채널에서 상기 인식 기술이 이용되는 것을 특징으로 하는 방법.
제1항에 있어서, 칼라 이미지 포획 시스템을 사용하여, 기준(3)에 따른 조합을 포함하는, 상기 칼라 채널의 조합에서 상기 인식 기술이 이용되는 것을 특징으로 하는 방법.
처리될 각 이미지를 얻는 방법에 있어서,

제 1 항에 따라 구성되는, 상기 정합된 배경의 모델을 제거하여 상기 배경으로부터 상기 알려지지 않은 문자를 분리하는 단계를 포함하는 것을 특징으로 하는 방법.
제 1 항에 있어서, 상기 배경의 모델과 상기 부호의 조합은,

M_c= K_oM_bM_s+ K₁(1-) 및 M_c= K_oM_bM_s+ K₁(1-)(여기서, M_c는 조합모델이고, M_b는 배경 모델이고, M_s는 부호 모델이고,K_o및 K₁은 이용된 잉크 및 종이의 특성 상수임)에 의해 얻어지는 것을 특징으로 하는 방법.
제 1 항에 있어서, 상기 배경의 모델과 상기 부호의 조합은, 이미 공지된 또 다른 기술에 의해 얻어지는 특징으로 하는 방법.
제 1 항에 있어서, 상기 방법은 상기 인식 단계에서 선택된 상기 해당 결합 모델과 상기 각 문자 위치의 부이미지간의 상관 계수의 값을 스레쇼울딩함으로써 인쇄 품질을 검증하는데 사용되는 것을 특징으로 하는 방법.