KR20010015046A - 구조화된 배경 모델과 문자의 조합에 의한 배경위의 문자자동 인식 방법 - Google Patents

구조화된 배경 모델과 문자의 조합에 의한 배경위의 문자자동 인식 방법 Download PDF

Info

Publication number
KR20010015046A
KR20010015046A KR1020000033785A KR20000033785A KR20010015046A KR 20010015046 A KR20010015046 A KR 20010015046A KR 1020000033785 A KR1020000033785 A KR 1020000033785A KR 20000033785 A KR20000033785 A KR 20000033785A KR 20010015046 A KR20010015046 A KR 20010015046A
Authority
KR
South Korea
Prior art keywords
background
model
image
character
characters
Prior art date
Application number
KR1020000033785A
Other languages
English (en)
Other versions
KR100691651B1 (ko
Inventor
스트링가루이지
Original Assignee
다니엘구이산,화우스토지오리
드라루지오리에쓰.에이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다니엘구이산,화우스토지오리, 드라루지오리에쓰.에이. filed Critical 다니엘구이산,화우스토지오리
Publication of KR20010015046A publication Critical patent/KR20010015046A/ko
Application granted granted Critical
Publication of KR100691651B1 publication Critical patent/KR100691651B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/01Solutions for problems related to non-uniform document background

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Inspection Of Paper Currency And Valuable Securities (AREA)
  • Image Processing (AREA)

Abstract

본 발명은 현저하게 대비색으로 구조화된 배경 도안 그림위의 가변 위치에 인쇄된 문자들을 전자 수단에 의해 자동으로 인식하는 방법에 관한 것이다. 상기 방법은 우선, 상기 이미지상에 상기 배경만이 있고, 여러개의 샘플의 이미지들을 전자 카메라로 포획하여 얻어진, 상기 배경 모델을 생성하는 단계를 포함한다. 그런 다음, 인식될 부호들(예컨대, 알파벳, 숫자, 문자)의 모델들은 흰색 배경위에 인쇄된 문자의 집합의 이미지들을 포획하거나, 상업적으로 입수 가능한 선택된 폰트의 문자로 된 컴퓨터 파일을 사용하여 생성된다. 인식 단계에서, 인식될 각 문자들의 위치는 우선, 상기 배경의 도안 그림의 인쇄 위치에 대해 측정된다. 이후에, 인식될 각 문자는, 알려지지 않은 문자의 동일한 상대적 위치로 상기 부호의 모델을 상기 배경 모델과 결합하여 얻어진 모델들과 비교된다. 따라서, 상기 배경과 함께 상기 문자를 인식하는 동작은, 어떤 잘 알려진 인식 기술을 사용하여, 동일 위치의 동일 배경과 결합된 문자의 모델과의 비교에 의해 달성된다.

Description

구조화된 배경 모델과 문자의 조합에 의한 배경위의 문자 자동 인식 방법{Automatic Recognition of Characters on Structured Background by Combination of the Models of the Background and of the Characters}
본 발명은 현저하게 대비되는 구조형상을 나타냄으로써 문자의 구조를 크게 간섭하는 배경이 있는 어떤 매체상에 인쇄된 문자들을 자동으로 인식하는 방법에 관한 것이다.
대부분의 공지된 문자 인식 시스템들은 매우 독창적이고 정교한 한계값(thresholds)에 의해 배경으로부터 문자를 분리하려고 시도함으로써 문제점을 다루고 있다. 그러나, 이러한 기술은 배경 구조형상이 상당히 대조될 때, 특히 상기 문자들의 위치가 상기 배경 구조형상에 대해 변경되는 경우에, 실패한다. 따라서, 상기 문자들의 이미지는 (상기 한계값을 초과하는) 상기 배경의 일부 부호(signs)를 포함하거나, 완전하지 않은데, 그 이유는 상기 문자의 구조형상의 일부가 상기 한계값을 초과하지 않았기 때문이다. 예컨대, 은행 지폐가 그런 경우인데, 상기 은행 지폐의 일련 번호는, 일반적으로 그 지폐면의 나머지 영역을 인쇄한 후에 서로 다른 프린터로 상기 나머지 인쇄 영역으로부터 분리된 상태에서 인쇄된다. 따라서, 인쇄시 정합(registration)은 완전해 질 수 없고, 그 결과, 상기 지폐의 일련 번호는 상기 배경에 대해 "이동(move)"하게 된다: 만약, 상기 일련 번호들이 상기 지폐의 구조화 영역위, 즉 그림 영역(drawn area)위에 인쇄되면, 상기 일련 번호들은 상기 배경의 (그림) 구조에 대해 움직이게 된다. 더욱이, 상기 언급된 경우에, 상기 문자들에 대한 탐색 및 분할(segmenting)은 상기 배경의 구조를 고려하여 볼 때, 실패할 위험성이 있다.
사실상, 많은 양의 변화가 발생된다 하더라도 추출(extraction) 및 인식(recognition) 과정은 거의 항상 다음과 같은 단계들을 포함한다:
(가) 문서의 이미지 및 보다 일반적으로는 인식될 문자들을 포함하는 대상(object) 의 포획(capture). 상기 포획 과정은 전자 카메라에 의해 달성되고, 일반적으로 그 후속 단계로서 대비(contrast)율을 향상시키고 잡음을 감소시키기 위한 계산(computations)과정을 수반한다.
(나) 인식될 문자들의 위치에 대한 이미지의 탐색(search). 상기 탐색 과정은 (흰색에서 검정색으로의 절환동작과 같은) 조명의 갑작스런 변화, 특히 공간 분배(spatial distributions)에 대한 분석에 근거한다.
(다) 단일 문자를 각각 포함하는 부영역(subareas)으로 확인된 영역의 분할(segmentation). 상기 분할 과정은 예컨대, 문자 라인의 베이스에 평행한 세그먼트상으로 검정색 밀도의 투사(projection)량을 분석함으로써 달성된다. 이 검정색 밀도의 최소량은 문자간의 흰색 공간과 상호 연관될 수 있다.
(라) 따라서, 분리된 각 문자는, 중첩능력(superposability)("형판-정합(template-matching)으로 알려진 기술)이나, 수직, 수평 또는 비스듬한 사선 형태등과 같은 특징적 구조형상(characteristic structures)의 연속("특징 추출(features extraction)" 또는 구조 분석으로 알려진 기술)에 기초하여 모든 글자 및/또는 모든 숫자의 원형(prototypes)(모델)과 비교된다.
어떤 경우에 있어서, 만약, 문자로서 분할된 이미지의 일부가 실제 문자의 형태와 무관한 구조(예컨대, 배경의 구조형상에 속하는 선(lines))를 포함한다면, 상기 원형과의 비교동작이 실패할 가능성이 매우 높다. 이것은 또한, 문자/배경 분리 단계(character/background separation phase)에서 지나치게 강렬한 스레쇼울딩(thresholding) 과정에 후속하는 상기 문자의 구조형상의 일부를 식별할 때 손실의 연속이 될 수도 있는 위험성을 내포한다.
그 이유는 고밀도로 구조화된 배경위에 인쇄된 문자들을 자동으로 인식하기 위한 이전의 해결방법은 충분한 수익성이 없었기 때문이다.
따라서, 본 발명의 목적은 전술한 종래 기술의 문제점을 해소하고자, 본 발명의 목적은 문자 구조형상의 콘트라스트(contrast)와 비교 가능한 대비색을 갖는 고밀도로 구조화된 배경위에 인쇄되는 문자들의 전자 이미지를 자동으로 인식하는데 있다.
도 1은 (a)에는 흰색 배경위에 인쇄된 일련의 연속된 문자가 예시된 플레이트(plate)가 도시되고, (b)에는 상기 배경위에 사선으로 상호 교차하여 그려진 선들이 예시되고, (c)에는 상기 사선 배경 (b)위에 인쇄된 일련의 연속된 문자가 예시된 플레이트가 도시되어 있는, 고밀도로 구조화된 배경위에 짙은 대비색으로 인쇄된 문자의 예를 도시한 도면.
도 2(a)는 도 1(c)과 동일한 반면, 도 2(b)는 완전하게 인쇄된 이미지로부터 등록된 배경 모델을 제거한 결과의 플레이트를 도시한 도면.
도 3(a)은 인식 대상 문자를 포함하는 도 1 및 도 2에 도시된 플레이트의 예인 은행 지폐의 일부를 도시한 것이고, 도 3(b)은 분할된 각 문자 위치에 해당하는 부이미지(subimages)를 도시한 것이고, 도 3(c)은 각 문자 위치에 대해 모든 가능한 부호(symbols) 모델과의 상기 등록 배경의 부이미지의 해당 조합과, 그에 따라 본 명세서에 설명되는 부호 조합 모델을 도시한 것으로서, 처리 대상 문자(b)가 어떻게 흰색 배경위에 인쇄된 부호(도 3(d)의 예 참조) 모델보다 상기 부호 조합 모델과 비교한 경우에 보다 더 효과적으로 인식될 수 있는지를 설명한 도면.
도 4(a)는 본 명세서에 설명되는 문자 인식 시스템의 전형적인 구성을 도시한 개략도.
본 발명에 따르면, 인식될 문자들이 인쇄되는 물체는, 인식될 문자의 전자 이미지를 발생시키기 위해 원하는 해상도(resolution)를 갖는 예컨대, (선형 또는 매트릭스 타입의 검정 및 흰색의) CCD 카메라와 같은 잘 알려진 광전자 수단에 의해 광학적으로 분석될 수 있다.
이하에서, "이미지"란 용어는 전자 이미지(electronic image)의 의미, 특히 일반적으로는 장방형 매트릭스로서 구성되는 분리된 밀도값의 집합(a discrete set of density values)의 의미로 사용될 것이다. 소위 화소(pixel)라고 불리는 상기 매트릭스의 각 요소는 상기 물체의 대응 부분에 의해 반사되는 빛의 강도(세기)의 크기이다. 칼라 이미지의 경우, 일반적으로 각 화소의 적색(red), 녹색(green) 및 청색(blue) 성분에 해당하는 3개의 매트릭스로 구성된다. 설명의 단순화를 위해, 이하에서는 검정색과 흰색의 경우에 대해서 설명하기로 한다. 즉, 색의 확대는 상기 3가지 매트릭스에 대해 동일한 동작을 반복함으로써 달성된다. 본 발명의 기초가 되는 상기 문자 자동 인식 방법의 제 1 단계는 어떠한 문자도 없이 배경의 사선 그림만이 존재하는 하나 이상의 샘플들의 이미지를 포획함으로써 획득될 수 있는 배경 모델을 생성하는 과정을 포함한다(도 1(b)참조).
특히, 소위 샘플의 이미지의 평균을 모델로서 사용할 수 있다: 검정색과 흰색 이미지의 경우에, 단일 평균 -매트릭스가 존재하는 반면, 칼라 이미지의 경우에는, 예컨대, 적색, 녹색 및 청색의 3 가지 평균 매트릭스가 존재하게 된다. 인식될 부호(예컨대, 문자 및/또는 숫자)의 모델은 흰색 배경위에 인쇄된 문자 집합의 이미지를 포획하거나, 오늘날 대부분의 "폰트(fonts)"로서 상업적으로 입수 가능한 컴퓨터 파일의 전자 이미지를 직접 사용하여 후속적으로 생성된다. 첫 번째 경우에, 인식될 각 부호의 모델은 흰색 배경위에 인쇄되는 동일한 부호의 다수의 견본의 이미지 평균으로서 구성될 수 있다.
일단, 상기 인식될 부호의 모델과 상기 배경의 모델이 구성되고 나면, "학습 단계(learning phase)라고도 불리는 상기 문자 자동 인식 방법의 제 1 단계가 종료된다.
상기 인식 단계중에, 다음과 같은 후속 단계들이 수행된다: 즉,
-알려지지 않은 위치에 있는 배경위에 인쇄된 알려지지 않은 문자들을 포함하는, 인식될 샘플의 이미지를 포획하는 단계;
-예컨대, 최소한의 상관관계 방법을 사용하여 이미지를 정합(registering)시키기 위한 잘 알려진 기술들 중 어느 한 가지 기술을 사용하여 포획된 이미지와 상기 배경의 모델을 정합시키는 단계;
-상기 포획된 이미지로부터 상기 정합된 모델을 제거하는 단계(상기 배경이 거의 제거되는 차 이미지(difference image)는 문자의 위치를 분명히 명시해준다: 상기 정합된 배경의 모델이 제거된 이미지의 차(도 2(b)참조));
-상기 차 이미지에 있는 각 문자의 위치를 탐색하는 단계(상기 탐색 동작은 검정색/흰색 절환 형태의 갑작스런 밀도 변화를 분석하는 것과 같이, 문자들의 위치를 알아내고 상기 문자들을 분할하기 위한 잘 알려진 기술들 중 어느 한 가지 기술을 사용하여 달성된다. 따라서, 각 문자 위치의 경우, 그 크기가 상기 부호의 것과 동일한 부 이미지(subimage)(도 3(b)의 분할된 문자의 부이미지참조)를 분리시킬 것이다.);
-알려지지 않은 각 문자에 해당하는 상기 배경의 부 이미지로부터 상기 정합된 배경의 모델을 추출하는 단계; 상기 각 문자의 위치에 대해, 상기 부호의 모델들을 상기 대응하는 배경 모델의 부 이미지와 결합하는 단계(도 3(c)참조). 상기 배경 모델은 상기 결합된 부 이미지에서 인식될 문자들을 포함하는 이미지의 배경과 정합(배경 모델-숫자 및/또는 문자 모델)되었기 때문에, 상대적인 문자/배경 위치는 알려지지 않은 이미지에서와 동일하다. 따라서, 종합하는 과정 중에, 상기 알려지지 않은 이미지와 동일한 배경을 갖는 부호(문자 및/또는 숫자)의 새로운 원형(prototypes)(결합된 모델)이 각 문자 위치에 생성될 것이다. 한 가지 개발된 결합 기술은 본 명세서의 "일부 양호한 변형 실시예의 설명에서" 언급될 것이지만, 다른 저자들에 의해 제안된 방법들 중 어느 한 방법이 사용될 수도 있다.
-상기 각각의 알려지지 않은 문자들을 상기 이전 단계들에서 결합된 모든 모델과 비교하는 단계: 따라서, 상기 문자를 배경과 함께 인식하는 과정은 상기 부호 모델을 동일 위치에 있는 동일 배경과 비교함으로써 달성된다. 형판 정합 방법 또는 특징 추출 방법등과 같은 상기 잘 알려진 인식 기술들 중 어느 한 기술이 사용될 수도 있다.
이하, 본 발명의 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.
이하에서는, 은행 지폐면에 인쇄되는 일련 번호의 자동 인식에 관한 양호한 변형 실시예가 본 발명의 제한되지 않은 일례로서 설명될 것이다. 사실상, 여러 가지 형태의 지폐의 경우, 부분적으로 또는 전체적으로 일련 번호가 지폐의 도안 부분위에 인쇄된다. 은행 지폐 표면에 상기 일련 번호를 인쇄하는 과정은 특히 서로 다른 기술의 혼합으로, 일반적으로는 적어도 오프셋 인쇄 기술 및 동판 인쇄 기술로 달성된다. 특히, 상기 동판 인쇄 기술은 일반적으로 매우 강렬하게 대비되는 많은 수의 선들이 도안된 영역들을 나타내고, 일련 번호를 상기 영역들 중 어느 한 영역위에 인쇄하는 경우 배경으로부터 문자들을 분리하여 이들 문자를 인식해내는 종래의 기술로는 그 작업이 어렵게 수행된다. 더욱이, 상기 일련 번호는 통상 오프셋 인쇄 및 동판 인쇄 과정 이후 최종 제조 단계에서 서로 다른 인쇄기 위에서 인쇄된다. 비록, 매우 정교한 인쇄 정합 시스템(sophisticated registration systems)이 사용된다 하더라도, 상기 일련 번호와 상기 지폐의 배경 도안 그림간의 상대적인 정합은 매우 가변적인 것으로 밝혀지고 있고, 일반적으로 수 밀리미터의 간격만큼 "이동"할 수 도 있다.
도 4는 은행 지폐의 일련 번호를 인식하기 위한 시스템의 구성을 도시한 것으로서, 상기 시스템의 렌즈(2)를 구비한 선형 CCD 카메라(1) 및 그 조명 시스템(3)은, 일련 번호를 판독하고자 할 때 동안 흡입 리본(sucker ribbon)(5)에 의해 옮겨지는 지폐(4)의 이미지를 포획하는데 사용된다.
상기 카메라에 의해 주사되는 배경 도안 선들은 이미지 계산 서브시스템(image computation subsystem)(6)의 제 1 버퍼 메모리에 연속적으로 저장되어 각 지폐의 전자 이미지를 생성한다.
DSP(디지털 신호 처리기:Digital Signal Processor), 매우 신속한 PC등과 같은 프로그램가능한 컴퓨터 또는 특수 하드웨어에 기초할 수 있는 상기 이미지 계산 서브 시스템(6)은 (상기 배경 모델 및 상기 문자 모델의) 상기 학습 단계 및 상기 인식 단계 중에 여러 가지 동작들을 수행한다.
상기 배경 모델의 학습 단계 중에, 상기 이미지 계산 서브 시스템(6)은,
-"배경 학습 세트(BLS:Background Learning Set)"로서 선택된 일련 번호가 매겨지지 않은 지폐의 이미지를 포획하고, 그 포획된 이미지를 적절한 메모리에 저장하고;
-인쇄 정합을 위해 조작자 인터페이스(operator interface)(7)의 콘솔(console)에 의해 자동으로 또는 조작자의 도움으로 상기 BLS로부터 "기준" 이미지를 추출하고;
-상기 기준 이미지에 대해 각 이미지의 수평 변위량 Δx 및 수직 변위량 Δy를 우선적으로 확인한 다음, -Δx 및 -Δy의 이동량(shift)을 적용함으로써 상기 BLS의 모든 이미지를 정합한다. 상기 변형 실시예에서, 상기 변위량은 최대 상관관계 방법를 사용하여 측정된다: 예컨대, (문자 인쇄 영역밖에 있는) 조작자에 의해 선택된 좌표 xo,yo상의 중심을 갖는 상기 기준 이미지의 작은 장방형 부분 So(정합 코어:registration core)은 상기 BLS의 이미지의 각 위치(화소)상으로 단계적으로 변위되는 중심을 갖는 동일한 크기 부분 S1과 비교됨으로써, 상기 위치 xo,yo를 찾을 수 있다(여기서, 상관 계수는 그 최대값을 갖는다(이 값은 상기 두 개의 이미지의 최상의 중첩(superposition)에 해당한다). 상기 변위량은 다음과 같이 계산된다:
Δx = x1-xo및 Δy = y1-yo.
상기 변형 실시예에 따라, 상기 배경 모델 Mb는 상기 기준 이미지와 정합된 상기 BLS의 이미지의 산술평균으로서 얻어진다.
상기 부호 모델의 학습 단계중에, 상기 이미지 계산 서브 시스템(6)은,
-흰색 배경위에 상기 일련 번호로 사용되는 모든 숫자 및/또는 문자들을 각각 한번에 공지된 위치에(문자 학습 세트-CLS:Character Learning Set) 인쇄하고자 하는 지폐 세트의 이미지들을 포획하고,
-상기 CLS의 이미지들을 단일 문자를 각각 포함하는 부이미지로 연속하여 분할하고(금번 변형 실시예에서, 상기 분할 과정은 상기 문자들이 흰색 배경위에 인쇄될 때 매우 효과적인 흰색/검정색 변화를 분석하기 위한 표준 기술로 달성됨),
-각 부호(문자 또는 숫자)의 모델 Ms를, 예컨대, 기준으로서 취해진 상기 CLS의 제 1 지폐의 것과 정합된, 각 위치의 부 이미지의 CLS상의 평균으로서 생성한다. 상기 정합 및 평균화 과정은 상기 배경의 경우에서와 같이 수행되지만, 상기 정합 코어는 전체적인 문자 부이미지와 일치한다.
일반적으로, 상기 은행 지폐의 일련 번호는 단일 폰트로된 알파벳과 숫자 문자를 사용한다. 따라서, 각 부호당 상기 CLS 지폐상에 한 위치로 충분하다(단일 A, 단일 B, 등). 만약, 그렇지 않으면, 이용되는 폰트 개수만큼의 부호당 위치의 수를 마련하는 것이 필요할 것이다(예컨대, A New York, A Courier, A Geneva, 등).
상기 인식 단계중에, 본 발명의 금번 변형 실시예에 따라, 상기 이미지 계산 서브 시스템(6)은, 이미지 포획 과정이후에,
-우선, 판독될 각 지폐의 배경 이미지를, 상기 배경 모델을 학습하는데 사용되는 동일한 정합 코어에 의해 동일한 상관 기술을 사용하여 상기 배경 모델과 정합시키고,
-그에 따라, 배경 차 이미지(background difference image)의 모델이 제거된 (정합된) 완전한 지폐를 만든 다음, 문자 위치들을 탐색하고(여기서, 사용된 기술은 이미 앞서 언급된 바 있는 위치 변화 분석 과정에 기초한다. 일반적으로, 상기 탐색 과정은, 상기 인쇄되는 일련 번호가 수 밀리미터 간격 만큼만 상기 배경의 그림 도안부분에 대해 이동하기 때문에, 상기 지폐의 제한된 영역위에서 수행될 수 있다),
-상기 차 이미지상에서 정합된 각각의 문자 위치에 대해 상기 정합된 배경 모델의 해당 부이미지를 추출하고(상기 부이미지는 정확히 상기 알려지지 않은 문자가 인쇄된 배경의 일부분이 된다),
-각 문자 위치에 대해, 상기 (정합된) 배경의 모델 Mb의 해당 부이미지를 상기 부호의 모델 Ms와 결합한다.
또한, 문자에 배경이 삽입된 새로운 모델은, 판독될 지폐상의 위치와 동일한 상대적 위치로 각 문자 위치에 대해 얻어질 것이다. 본 발명의 금번 변형 실시예에서, 상기 조합 모델 Mc는 다음과 같은 방정식으로 화소마다 얻어진다:
Mc= KoMbMs+ K1(1-) (1)
만약, 상기 배경이 먼저 인쇄된 다음, 문자들이 인쇄되었다면, 다음과 같이 된다.
Mc= KoMbMs+ K1(1-) (2)
어떤 경우에, Ko및 K1은 이용된 잉크 및 종이의 특성인 상수이다. 상기 방정식 (1) 및 (2)에서, 첫 번째 항(곱 KoMbMs)은 이용된 잉크의 투과율(transmissivity) 및 종이의 반사력(reflectivity)을 고려하는 반면, 그 두 번째 항은 최종적으로 인쇄된 잉크의 표면의 반사력에 관한 것이다.
또한, 상기 이미지 계산 서브 시스템(6)은,
-각 문자 위치에 대해, 상기 지폐의 해당 부이미지와 (문자에 배경이 삽입된) 상기 모든 새로운 모델간의 상관 계수를 계산하고(:처리될 문자는 상기 상관 계수의 최대값에 해당하는 상기 결합 모델의 문자로서 인식됨),
-본 발명의 금번 변형 실시예에 따라, 더욱이, 상기 상관 계수의 최대값을 한계값과 비교하여 각 문자 위치에 해당하는 부이미지의 배경 및 문자의 인쇄 품질을 검증한다. 만약, 상기 인쇄 품질이 양호하면(처리될 부이미지와 결합된 모델이 거의 동일하면), 상기 상관 계수는 거의 1이 되는 반면, 매우 양호한 인쇄 품질이면 0에 가까운 상관 계수가 생성된다.
다른 양호한 변형 실시예는,
(a) 문자, 그림 엽서(postcards), 라벨(labels), 은행 수표 또는 우편환등과 같은 은행 지폐이외의 문서상에 인쇄된 문자들의 인식에 적용.
(b) 리본 이송 시스템(ribbon transport system)을 예컨대, 인쇄기에서 사용되거나 또는 기준(4)의 특허 따라 사용되는 실린더와 같은, 대형 크기의 종이에 바람직한 이송 수단으로의 대체.
(c) 상기 선형 카메라를 매트릭스 형태의 카메라로의 대체.
(d) 상기 BLS의 이미지 평균을 상기 배경의 정합을 위한 기준 이미지로서 사용.
(e) 예컨대, 기준(1)에서 제안된 기술에 따른, 상기 배경의 정합을 위한 정합 코어의 자동 추출.
(f) 예컨대, 기준(2)에서 제안된 기술에 따른, 평균화 과정이외의 과정을 통한 상기 배경 모델의 구성.
지금까지, 본 발명을 특정 실시예와 관련하여 도시하고 설명하였지만, 상기 본 발명에 대한 개시는 단지 본 발명의 적용예에 불과한 것이고, 본 발명을 수행하기 위한 최상 모드로서 본 명세서에 개시된 특정 실시예에 국한되는 것은 아니다.
또한, 이하의 특허청구의 범위에 의해 마련되는 본 발명의 정신이나 범위를 이탈하지 않는 한도내에서 본 발명이 다양하게 수정 및 변경될 수 있다는 것을 당업계에서 통상의 지식을 가진자라면 용이하게 이해할 수 있을 것이다.
따라서, 본 발명에 따른 문자 자동 인식 방법에 의하면, 인식될 문자들이 인쇄되는 물체가, 인식될 문자의 전자 이미지를 발생시키기 위해 원하는 해상도를 갖는 예컨대, (선형 또는 매트릭스 타입의 검정 및 흰색의) CCD 카메라와 같은 잘 알려진 광전자 수단에 의해 광학적으로 분석될 수 있다.

Claims (13)

  1. 이미지 포획을 위한 광전자 장치 및 이미지 계산 시스템을 사용하여 어떤 매체상의 현저하게 대비되는 구조형상을 나타내는 배경위에 인쇄된 문자들을 전자 수단에 의해 자동으로 인식하는 방법에 있어서,
    (a) (a.1) 상기 이미지상에 상기 배경만이 있고, 하나 이상의 샘플의 이미지들을 포획하여 얻어진, 상기 배경 모델의 생성 및,
    (a.2) 부호당 적어도 하나의 문자를 포함하는 흰색 배경위에 인쇄된 문자의 집합의 이미지들을 포획하여 얻어진 문자(부호, 알파벳 및/또는 숫자)의 모델의 생성을 학습하는 단계와;
    (b) (b.1) 상기 배경위에 인쇄된 알려지지 않은 문자들을 포함하는, 인식될 상기 샘플의 이미지를 포획하고,
    (b.2) 상기 배경의 모델을 상기 포획된 이미지의 배경과 정합하고,
    (b.3) 각각의 알려지지 않은 문자에 해당하는 배경의 부이미지로부터 상기 정합된 배경의 모델을 추출하고,
    (b.4) 각 문자 위치에 대해, 문자 및/또는 숫자의 모델을 상기 해당 배경(결합 모델)의 부이미지와 결합하고,
    (b.5) 상기 알려지지 않은 문자들을 상기 동일한 문자 위치에 해당하는 모든 결합 모델과 결합하고,
    (b.6) "형판-정합" 기술에 따라, 부호에 해당하는 알려지지 않은 각 문자를, 상기 부호와 최상으로 중첩되는 결합 모델로서 인식하는 인식 단계를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서, 상기 배경의 모델은 BLS(배경 학습 세트)의 이미지들 중 하나인 것을 특징으로 하는 방법.
  3. 제1항에 있어서, 상기 배경의 모델은 상호 정합되는, 상기 BLS의 이미지들의 평균인 것을 특징으로 하는 방법.
  4. 제1항에 있어서, 상기 배경의 모델은 예컨대, 기준(2)에서 제안된 기술과 같은 잘 알려진 문자/배경 분리 기술에 따라, 상기 배경 또는 상기 문자들을 포함하는 샘플 집합을 통해 얻어지는 것을 특징으로 하는 방법.
  5. 제1항에 있어서, 상기 인식될 부호의 모델은 상기 CLS의 해당 이미지의 평균으로서 얻어지는 것을 특징으로 하는 방법.
  6. 제1항에 있어서, 상기 인식될 부호의 모델은 컴퓨터 파일을 통해 얻어지는 것을 특징으로 하는 방법.
  7. 제1항에 있어서, 상기 형판 정합 기술이외의, 상기 잘 알려진 인식 기술들 중 어느 한 기술을 사용하는 것을 특징으로 하는 방법.
  8. 제1항에 있어서, 칼라 이미지 포획 시스템을 사용하여, 최상의 중첩 기능을 제공하는 칼라 채널에서 상기 인식 기술이 이용되는 것을 특징으로 하는 방법.
  9. 제1항에 있어서, 칼라 이미지 포획 시스템을 사용하여, 기준(3)에 따른 조합을 포함하는, 상기 칼라 채널의 조합에서 상기 인식 기술이 이용되는 것을 특징으로 하는 방법.
  10. 처리될 각 이미지를 얻는 방법에 있어서,
    제 1 항에 따라 구성되는, 상기 정합된 배경의 모델을 제거하여 상기 배경으로부터 상기 알려지지 않은 문자를 분리하는 단계를 포함하는 것을 특징으로 하는 방법.
  11. 제 1 항에 있어서, 상기 배경의 모델과 상기 부호의 조합은,
    Mc= KoMbMs+ K1(1-) 및 Mc= KoMbMs+ K1(1-)(여기서, Mc는 조합모델이고, Mb는 배경 모델이고, Ms는 부호 모델이고,Ko및 K1은 이용된 잉크 및 종이의 특성 상수임)에 의해 얻어지는 것을 특징으로 하는 방법.
  12. 제 1 항에 있어서, 상기 배경의 모델과 상기 부호의 조합은, 이미 공지된 또 다른 기술에 의해 얻어지는 특징으로 하는 방법.
  13. 제 1 항에 있어서, 상기 방법은 상기 인식 단계에서 선택된 상기 해당 결합 모델과 상기 각 문자 위치의 부이미지간의 상관 계수의 값을 스레쇼울딩함으로써 인쇄 품질을 검증하는데 사용되는 것을 특징으로 하는 방법.
KR1020000033785A 1999-06-21 2000-06-20 배경 모델과 문자 모델의 결합에 의해 구조화된 배경 상의 문자를 자동 인식하는 방법 KR100691651B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
MC2427.99.2491 1999-06-21
MC2427A MC2491A1 (fr) 1999-06-21 1999-06-21 Reconnaissance automatique de caractères sur fond structuré par combinaison des modèles du fond et des caractères

Publications (2)

Publication Number Publication Date
KR20010015046A true KR20010015046A (ko) 2001-02-26
KR100691651B1 KR100691651B1 (ko) 2007-03-09

Family

ID=19738388

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000033785A KR100691651B1 (ko) 1999-06-21 2000-06-20 배경 모델과 문자 모델의 결합에 의해 구조화된 배경 상의 문자를 자동 인식하는 방법

Country Status (11)

Country Link
US (1) US6690824B1 (ko)
EP (1) EP1063606B1 (ko)
JP (1) JP4593729B2 (ko)
KR (1) KR100691651B1 (ko)
CN (1) CN1172264C (ko)
AT (1) ATE349047T1 (ko)
AU (1) AU767855B2 (ko)
CA (1) CA2310874A1 (ko)
DE (1) DE60032413T2 (ko)
MC (1) MC2491A1 (ko)
UA (1) UA70933C2 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190010640A (ko) * 2016-05-25 2019-01-30 이베이 인크. 문서의 광학 문자 인식 기법
KR20210035361A (ko) * 2019-09-23 2021-04-01 주식회사 딥비전 사용자 중심의 도안 생성 방법 및 시스템

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002112005A (ja) * 2000-09-29 2002-04-12 Minolta Co Ltd 画像出力システム
JP4661034B2 (ja) * 2003-07-28 2011-03-30 富士ゼロックス株式会社 印刷品質検査装置及び方法
KR100778014B1 (ko) * 2005-09-16 2007-11-21 한국건설기술연구원 영상을 이용한 액체 높이 측정 장치 및 방법
DE102006029718A1 (de) * 2006-06-28 2008-01-10 Siemens Ag Verfahren zur Auswertung zweier Abbilder sowie medizinisches Abbildungssystem
US8611665B2 (en) * 2006-12-29 2013-12-17 Ncr Corporation Method of recognizing a media item
WO2008141293A2 (en) * 2007-05-11 2008-11-20 The Board Of Regents Of The University Of Oklahoma One Partner's Place Image segmentation system and method
JP5253788B2 (ja) * 2007-10-31 2013-07-31 富士通株式会社 画像認識装置、画像認識プログラムおよび画像認識方法
WO2009070032A1 (en) * 2007-11-28 2009-06-04 Lumex A/S A method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
CN101887520B (zh) * 2009-05-12 2013-04-17 华为终端有限公司 一种图像中的文字定位方法和装置
EP2807602A1 (en) * 2012-01-23 2014-12-03 Microsoft Corporation Pattern matching engine
US9977957B2 (en) 2013-02-28 2018-05-22 Glory Ltd. Method and system for identifying characters on a valuable medium
DE102015003480A1 (de) * 2015-03-18 2016-03-10 Giesecke & Devrient Gmbh Vorrichtung und Verfahren zum Prüfen von Wertdokumenten, insbesondere Banknoten, sowie Wertdokumentbearbeitungssystem
JP2019040315A (ja) * 2017-08-23 2019-03-14 グローリー株式会社 不可視特性検知装置、シート識別装置、シート処理装置、印刷検査装置、及び不可視特性検知方法
JP7379876B2 (ja) * 2019-06-17 2023-11-15 株式会社リコー 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
WO2022044311A1 (ja) * 2020-08-31 2022-03-03 富士通フロンテック株式会社 データ生成装置、データ生成方法およびデータ生成プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63137383A (ja) * 1986-11-29 1988-06-09 Toshiba Corp 文字読取装置
US5335292A (en) * 1988-12-21 1994-08-02 Recognition International Inc. Document processing system and method
JP2783033B2 (ja) * 1992-01-13 1998-08-06 日本電気株式会社 カラー画像の領域抽出方法および装置
EP0566015A3 (en) * 1992-04-14 1994-07-06 Eastman Kodak Co Neural network optical character recognition system and method for classifying characters in amoving web
JP3037432B2 (ja) * 1993-11-01 2000-04-24 カドラックス・インク 光波オーブンによる食物調理方法および調理装置
IT1269506B (it) 1994-02-04 1997-04-01 De La Rue Giori Sa Impianto di controllo di qualita' di fogli stampati in particolare di carte-valore
IT1276010B1 (it) * 1995-03-07 1997-10-24 De La Rue Giori Sa Procedimento per produrre un modello di riferimento destinato ad essere utilizzato per il controllo automatico della qualita' di
US5943438A (en) * 1995-03-07 1999-08-24 Siemens Aktiengesellschaft Method for pattern recognition
JP2879800B2 (ja) * 1995-05-09 1999-04-05 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 電子走査ピクチャの背景除去方法
IT1284432B1 (it) 1996-03-22 1998-05-21 De La Rue Giori Sa Procedimento di controllo automatico della qualita' di stampa di un'immagine policroma
US5915039A (en) * 1996-11-12 1999-06-22 International Business Machines Corporation Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190010640A (ko) * 2016-05-25 2019-01-30 이베이 인크. 문서의 광학 문자 인식 기법
US11893611B2 (en) 2016-05-25 2024-02-06 Ebay Inc. Document optical character recognition
KR20210035361A (ko) * 2019-09-23 2021-04-01 주식회사 딥비전 사용자 중심의 도안 생성 방법 및 시스템

Also Published As

Publication number Publication date
KR100691651B1 (ko) 2007-03-09
JP4593729B2 (ja) 2010-12-08
DE60032413D1 (de) 2007-02-01
AU767855B2 (en) 2003-11-27
EP1063606B1 (fr) 2006-12-20
US6690824B1 (en) 2004-02-10
EP1063606A3 (fr) 2003-01-08
CA2310874A1 (en) 2000-12-21
AU3937000A (en) 2001-01-04
DE60032413T2 (de) 2007-09-27
UA70933C2 (uk) 2004-11-15
MC2491A1 (fr) 1999-11-22
CN1282070A (zh) 2001-01-31
EP1063606A2 (fr) 2000-12-27
CN1172264C (zh) 2004-10-20
ATE349047T1 (de) 2007-01-15
JP2001022892A (ja) 2001-01-26

Similar Documents

Publication Publication Date Title
KR20010015046A (ko) 구조화된 배경 모델과 문자의 조합에 의한 배경위의 문자자동 인식 방법
US5119433A (en) Method and system for locating the amount field on a document
Amano et al. A feature calibration method for watermarking of document images
Aradhye A generic method for determining up/down orientation of text in roman and non-roman scripts
JPH07200720A (ja) 脱落書式文書画像圧縮
US5915039A (en) Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
JP5934174B2 (ja) 印刷文書を認証するための方法及びプログラム
EP0807297A2 (en) Method and apparatus for separating foreground from background in images containing text
EP2014082A1 (en) Generating a bitonal image from a scanned colour image
JP2008269509A (ja) 画像処理プログラム及び画像処理装置
CN100568265C (zh) 字符识别装置、字符识别方法
Dhandra et al. Script identification based on morphological reconstruction in document images
JP3018949B2 (ja) 文字読取装置およびその方法
CN112308063B (zh) 文字识别装置、翻译笔、图像翻译方法及图像翻译装置
Khan et al. Car Number Plate Recognition (CNPR) system using multiple template matching
Chakraborty et al. Review of various image processing techniques for currency note authentication
JP2003305927A (ja) プリンタ検査装置
JP2021044803A (ja) 画像処理装置、画像処理方法、及びプログラム
CN116758550A (zh) 表单图像的文本识别方法及其装置、电子设备、存储介质
RU2249251C2 (ru) Автоматическое распознавание символов на структурированном фоне при помощи комбинирования моделей фона и символов
US6678427B1 (en) Document identification registration system
Konya et al. Adaptive methods for robust document image understanding
JPS6254380A (ja) 文字認識装置
JPS6227887A (ja) 文字種分離方式
JP2923004B2 (ja) 画像生成装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100122

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee