KR960001102B1

KR960001102B1 - 수서인식 시스템에서의 케이스 혼동을 해결하는 방법

Info

Publication number: KR960001102B1
Application number: KR1019930005736A
Authority: KR
Inventors: 후지사키 데쯔노스케; 지브 유켈손 미칼; 스티븐 웬스트럽 케니스
Original assignee: 인터내셔널 비제네스 머진즈 코포레이션; 죤 디. 크레인
Priority date: 1992-04-07
Filing date: 1993-04-06
Publication date: 1996-01-18
Also published as: EP0564826A3; CA2087500A1; JPH0684016A; EP0564826A2; KR930022232A

Abstract

내용 없음.

Description

수서인식 시스템에서의 케이스 혼동을 해결하는 방법

제1도는 본 발명의 개시에 따라 구성되고 동작하는 수서인식 시스템의 블록도.

제2도는 제1도의 Φ를 상세하게 도시한 블록도.

제3도는 제2도의 알파 디지트 케이스 분별자의 상세한 흐름도.

제4도는 제2도의 업-로우 케이스 분별자의 상세한 흐름도.

제5도는 제3도의 선택적 디지트 알파 다수 투표 블록의 상세한 흐름도.

제6도는 제3도의 약 디지트를 알파 블록으로 대치하고 약 알파를 디지트 블록으로 대치하는 것을 나타내는 상세한 흐름도.

* 도면의 주요부분에 대한 부호의 설명

10 : 문자 인식 시스템 20 : 후처리 블록

22 : 알파 디지트 케이스 분별장치

본 발명은 수서인식(handwriting recognition)분야에 속하는 것으로, 특히 상이한 케이스 문법 부류(case-grammar classes)에 연관된 문자들에 속하는 유사한 형태의 모형(similariy shaped prototypes)들을 구별하는데 있어서의 문제점을 해결하는 것에 관한 것이다.

온 라인(on-line) 수서인식 시스템(handwriting recognitions system)에서, 탐색-내장 케이스 모델(search-embedded cassemodel)은 기상(walkup) 및 훈련의 초기 단계와 같은 기본 정확도(base accuracy)가 낮은 환경에 적용될 때, 다음과 같은 증상을 다루기가 어렵다 :

1) 어떤 알파벳(alphabets)에 대해 인식기(recognizer)는 알파 편향형(alpha-biased), 즉 디지트와 디지트 기호(digits & digits symbols)보다는 글자가 리스트(list)의 최상위에 올 확률이 많다.

이것은 알파벳중에 디지트가 차지하는 비율이 작기 때문이다.

2) 영어 알파벳과 같은 어떤 알파벳에 대해서, 인식기는 하위케이스 편향형(lowercase-biased)인 경향이 있다. 이것은 하위케이스 모형(lowercase protypes)에 용인 가능한 변화가 더 많아서 리스트의 최상위에 하위케이스 모형이 나타날 가능성이 보다 높다는 사실 때문이다.

3) 상이한 케이스 그룹(case groups)의 문자들을 나타내는 모형들중 어떤 것들은 유사한 형태를 공유하고 있으며 혼동가능 문자(confusable characters)로 불린다.

예 : 단일 휙 디지트(stroke digits) 0, 1, 2, 5 대 0, o, l, i, z, Z, S, s.

상위케이스(uppercase) C,F,K,O,U,S,X 대 하위케이스 c,f,k,o,u,s,x.

처음의 소수의 문자들이 케이스-혼동가능(case-confus-able)인 단어에 주어질 때, 탐색-내장 케이스 모델은 이미 존재하는 인식기의 바이어스에 대해 증폭기로서 동작할 것이고 이로부터 복원하기 위해서, 허용불가능한 역행(backtracking)이 필요할 것이다(허용 불가능 노트 패드(note pad)환경의 속도 및 메모리 제한의 관점에서).

이러한 수서인식 시스템에서, 수서(handwriting)와 같은 기호는, 전자평판(electronic tablets)상에서 추적될때, 전형적으로 x-y 좌표상의 시퀀스(sequences)들에 의해 표현된다. 수서의 기본 단위는 각각 x-y 좌표에 의해 표현되며, 필자의 평판 펜-하향(tablet pen-down) 및 터블렛 펜-상향(tablet pen-up) 동작 사이에서 발생되는 점들이 시퀀스로 간주될 수 있는 문자 및 기호는 이런 획의 집합이다.

문자 식별 시스템(character identification system)에서 제1의 처리 단계는 분할(segmentation)로 알려져 있다. 분할은 문자 인식기에 의한 처리에 앞선, 획 입력 데이터를 문자, 기호 또는 아마도 단어의 획으로 분할하는 신호처리(pre-processing)를 포함한다.

선행 기술의 다양한 수서 분할 방법 및 장치가 다음과 같은 문서에 기술되어 있다. 허브스트(Herbst)등에 1977년 5월 17일에 허여된 미합중국 특허 제 4,024,500호는 탐침속도(stylus velocity) 및 문자들이 분석되는 세개의 정밀 영역(precisezones)에 대한 결정을 이용하는 분할 방법 및 장치를 개시한다. 후지사와(Fujisawa)등에 1987년 3월 31일에 허여된 미합중국 특허 제 4,654,873호는 다수의 가상 단위 패턴(hypothetical unit patterns)(2열, 5-8행)을 사용하는 패턴 분할기(pattern segmenter) 및 분석기(analyzer)를 개시한다. 5열 61행에서 6열 36행까지에서 분할 프로세스(segmentation process) 및 인식 프로세스(recognition process)가 제9도와 관련하여 기술되어 있다. 단계(703)는 문자들의 가상 경계(hypothetical boundary)가 요소 속성 리스트(element attribute list)(714) 및 양식사전(form dictionary)(950)내의 정보에 기초하여 확립됨을 도시한다. 쿠주누키(Kuzunuki)등에 1987년 7월 14일에 허여된 미합중국 특허 제 4,680,804 호는 문자 또는 그래픽 인식 모드(graphics recognition mode)를 지정하는 방법을 개시한다. 소지마(Shojima)등에 1988년 1월 5일에 허여된 미합중국 특허 제 4,718,103호는 수서 패턴의 인접 분할부사이의 각도변이(angular variation) 및 후보 패턴(candidate patterns)을 구비하는 사전을 채용하는 수서 패턴 인식 시스템(handwritten pattern recognition system)을 개시한다. 요시다(Yoshiad)등에 1988년 8월 16일에 허여된 미합중국 특허 제 4,764,972호는 고립된 문자들(isolated characters)을 저장하는 제1메모리와 획간 문자 정보(interstroke charcater information)를 저장하는 제2메모리를 채용하는 인식 시스템을 개시한다. 디클락(D. Clark)에 1989년 2월 14일에 허여된 미합중국 특허 제 4,805,225호는 학습(learning) 및 인식(recognition)모드를 포함하고 다수의 기본 특징 인식기(basic feature recognizers)로 구성되는 범용 패턴 인식 방법 및 장치를 개시한다.

1988년 2월 23일에 폭스(Fox)등에 허여되고 함께 양도된 미합중국 특허 제 4,727,588호는 쉽게 편집되어 정보처리 시스템(information processing system)내에 차후에 저장될 수 있는 문서의 수서 이미지(handwritten images)들을 발생하는 전자 평판 및 전점 번지지정 가능 디스플레이(all-points-addressable display)를 개시한다.

씨.씨. 태퍼트(C.C. Tappert)에 1988년 3월 15일에 허여되고 함께 양도된 미합중국 특허 제 4,731,857호는 수서 문자들의 가능한 분할점(segmentation points)들을 결정하고 문자일 수 있는 세그먼트들의 모든 조합을 문자 인식기에게 전달하는 것을 포함하는 방법을 개시한다(3열, 47-68행). 제4도의 다중 정렬 서브루틴(Multi-Sort subroutine)에 관련하여, 태퍼트는, 사전 참조(dictionary look-up)와 구문(syntactic) 및 어의적(semantic)처리가 유효한 단어가 하나도 없는 글자연쇄(letterchain)선택들을 제거하기 위해 사용될 수 있다고 기술한다. 그러나, 태퍼트에 의해 계획된 구문 및 어의적 처리의 유형은 비교적 간단한 단어에 대해서도 잠재적으로 방대한 수의 획 조합일 수 있는 모든 입력 획(input strokes)에 대해 동작하는 방대한 계산을 요하는 프로세스이다. 이처럼, 태퍼트의 프로세서는, 사전 참조와 같은 부가적인 프로세서가 사용되면, 실시간(real time)문자 인식에 대해 적절하지 않을 수 있다. 또한, 태퍼트는 선택가능 또한 전환가능 구문 또는 어의적 처리 요소들의 제공을 개시하지 않는다.

후지사키(Fujisaki)등에 1991년 7월 2일에 허여되고 함께 양도된 미합중국 특허 제 5,029,223호는 일련의 수서 획으로부터 유효한 기호 또는 유효한 기호들의 문자열(string)을 식별하는 방법 및 장치를 개시한다. 이 방법, (a) 하나 또는 그 이상의 수서 획에 응답하여 각각 연관된 점수(score)를 구비하는 다수의 획 라벨(stroke lables)을 발생하는 단계와 ; (b) 유효한 기호 또는 유효한 기호의 부분을 표시하는 획 라벨을 식별하기 위해 빔탐색과 같은 기법(beam search-like technique)에 따라 다수의 획 라벨을 처리하는 단계와 ; (c) 유효한 기호 또는 유효한 기호들의 문자열의 정체(identity)를 결정하기 위해 식별된 획 라벨들을 함께 연관하는 단계를 포함한다.

본 발명의 일실시예는 각각의 제한 검증 필터(constraint validation filters)들이 직렬 필터 연쇄(serial filter chain)에 전환 가능하게 결합되는 것이다. 이 스위치들은 필터 입력을 획 라벨에 연결하거나 또는 이 입력의 연글을 끊도록 기능하여 이 필터 블록 주위에 경로를 제공한다. 응용 필자(application writer)는 다수의 제한 필터들을 이용할 수 있다. 응용 필자는 제한 필터중 어느 것 또는 어느 것들이 특정한 일련의 휙에 대해 적용되는가를 특정한다. 후지사키 특허는 참조로써 본 명세서에 포함된다.

상기 참조중 어느것도 후처리 케이스 모델(post processing case model)의 사용을 가르치거나 암시하지 않는다. 본 발명에 따르면, 수서인식을 돕기 위해 케이스 문법 문맥(case-grammar context)을 사용하는 후처리 케이스 모델이 사용된다. 이것은 상이한 케이스 문법 부류에 연관된 문자들에 속하는 유사한 형태의 모형을 구별하는 문제를 해결하는데 도움이 된다.

본 발명의 목적은 개선된 수서인식 시스템을 제공하는 것이다.

본 발명의 또 다른 목적은 후처리 케이스 모델을 사용하는 개선된 수서인식 시스템을 제공하는 것인데, 이 후처리 케이스 모델은 수서인식을 돕기 위해 케이스 문법내용을 사용한다.

본 발명의 또 다른 목적은 상이한 케이스 문법 부류들과 연관된 문자들에 속하는 유사한 형태의 모형들을 식별하는데 있어서의 문제점을 해결하는 개선된 수서인식 시스템을 제공하는 것이다.

본 발명의 또 다른 목적은 다수결 원칙에 의해 케이스 혼동을 해결하는 개선된 수서인식 시스템을 제공하는 것이다.

본 발명의 또 다른 목적은 노트패드 컴퓨터 환경의 실시간 속도 및 메모리 제한하에서 상기한 것을 성취하는 것이다.

온 라인 수서인식 시스템에서, 케이스 혼동(caseconfusion)은 다수결 원칙(majority voting rule)에 의해 해결된다. 후처리 케이스 모델은 주어진 단어내의 각 문자에 관련하여 알파벳/수자 및 상위케이스/하위케이스를 결정한다. 후 프로세서(postprocessor)에 의해 수신되는 단어는 주어진 부류내의 각 문자에 대해 비-케이스-혼동 가능 멤버(non-case-confusable)들을 계수한다. 각 부류에 대한 비-케이스-혼동 가능 발생(non-case-confusable occurrences)의 회수에 따라서, 단어내의 대부분의 문자들이 주로 수치 디지트(numeric digits)인지 또는 알파벳글자(alphabetic letters)인지, 만약 글자라면, 대부분 상위케이스 또는 하위케이스인가가 결정된다. 그후 단어는 다수 케이스 그룹으로부터의 유사 모형으로 변환될 것인가 또는 다수 비혼동가능 케이스 발생(nonconfusable case occurrences)에 근거하여 변경되지 않고 남을 것인가를 결정하기 위해 다시 한번 프로세스된다.

제1도를 참조하면, 전자평판(14)과 문자인식기(character recognizer)(18)사이에 결합된 분할 프로세서(segmentation processor)(12)를 포함하는 문자 인식 시스템(character recognition system)(10)이 블록 다이아그램(block diagram)형태로 도시되어 있다. 평판(14)은 다수의 적절한 시중에서 구입가능한 전자평판중 하나이다. 이 평판(14)은, 펜 하향(pen-down)위치에서, 사용자가 평판(14)의 표면에 블록 프린팅(block printing) 또는 스크립트 영숫자 문자(script alphanumeric character)와 같은 기호를 형성하게끔 하여 주는 탐침(stylus) 또는 펜을 더불어 포함한다. 평판(14)은 x-y 평판 좌표 시스템상에서 펜의 위치를 나타내는 x축 및 y축 출력신호를 가진다. 획 포획 수단(stroke capture means)(16)은 분할 프로세서(12)에 대해 x-y 위치쌍 데이터를 발생하기 위해 평판으로부터 x-y 출력들을 가로채는(intercepts) 소프트웨어 작업일 수 있다. 분할 프로세서(12)의 출력은 본 발명의 문자 인식기(18)에 입력되는 연결 획(connected strokes) 및 비연결 획(unconnected strikes)을 나타내는 데이터이다. 문자 인식기(18)은 분할된 획의 연결 그룹(connected group)의 정체를 판단하도록 동작하고 영숫자문자와 같은 식별된 기호들을 나타내는 출력(18a)을 가진다.

이런 관점에서, 본 발명은 주어진 기호가 적어도 하나의 분할된 획으로 구성되는 다수의 수서 기호(hend-drawn symbols)들을 인식하는데 적용될 수 있음을 인식하여야 한다. 본 발명이 개시하는 것을 사용함으로써 시스템(10)은 다양한 언어와 수학적 및 다른 유형의 기호들로 쓰여진 문자들과 관련된 기호들을 쉽게 인식한다.

라인(18a)상의 문자 인식기(18)출력은 라인(19a)상에 최상위 응답(top answer) 및 라인(19b)상에 상이한 경로의 캐시(cache of different paths)를 제공하는 탐색 블록(19)에 제공된다. 블록(14-19)의 보다 더 상세한 기술은 본 명세서에서 참조로서 포함되는 후지사키의 미합중국 특허 제 5,029,233호에 있다. 후처리는 이때 후처리 블록 Φ(20)에서 수행된다.

최상위 응답은 하나의 인식된 단어에 대한 최상 후보를 산출하는 탐색의 결과이고, 또한 후프로세서(20)에 입력되는 단어이다. 상이한 경로의 캐시는 인식된 단어당 인식된 문자들의 최상 후보에 대한 탐색의 결과이다.

이 문자들은 4케이스의 부류 즉, 1) 알파벳글자-알파벳문맥에서 사용되는 구두점(punctuations)들을 포함하는 알파벳글자 ; 2) 수지 디지트-수치 기호들을 포함하는 수치 디지트 ; 3) 상위 케이스 글자 ; 4) 하위케이스 글자들중 하나에 속한다. 인식된 단어내의 각 글자에 대해 그것이 어느 부류에 속하는가에 관한 혼동이 있을 수 있다. 이런 혼동은 블록(20)에서 해결된다.

일반적으로, 블록(20)은 문자가 알파벳글자 또는 수치 디지트 인가를 결정하고 글자가 상위케이스 또는 하위케이스 인가를 결정하기 위해서 후처리 케이스 모델을 다음과 같이 구현한다.

1) 출력 단어를 검토하고 각 부류의 비-케이스-혼동가능 멤버들을 계수한다.

디지트-알파(digit-alpha)의 예 : 출력단어 ˝49zz18d˝는 3개의 비-케이스-혼동가능 디지트(4,9,8) 및 1개의 비-케이스-혼동가능 글자(d)를 가진다. 업-로우(up-low)의 예 : 단어 ˝gUICkly˝는 2개의 비-케이스-혼동가능 하위케이스(g,y)를 가지고 비-케이스-혼동가능 상위케이스는 가지지 않는다.

2) 비-케이스-혼동 가능 발생의 다수에 따라-케이스를 결정한다.

˝49zz18d˝는 대부분 디지트로 선택될 것이다.

˝gUICkly˝는 대부분 하위케이스로 선택될 것이다.

3) 다수 케이스에 따라 결정한 후, 다시 한번 단어를 검토하고, 각 문자에 대해 다음과 같은 기준을 사용하여 이 문자를 변환할 것인가를 결정한다.

a) 만약 그것이 케이스-혼동가능 모형이면, 다수 케이스 그룹으로부터의 그의 대응 유사 모형으로 그것을 변환하라-케이스 문법(U11,111,UUU등)에 대한 자동장치(automaton)를 사용하여,

예 : ˝gUICkly˝-U, I, C는 u, i, c로 변환될 것이다.

˝49zz18˝-z, z, 1은 2, 2, 1로 변환될 것이다.

b) 아니면 그대로 놔둬라.

제2도를 참조하면, 상기 사항을 구현한 후처리 블록(20)이 상세히 도시된다. 라인(19a)상의 최상위 응답 단어는 알파 디지트 케이스 분별장치(alpha-digit case discrimintor)(22)에 입력 단어로 인가되는데, 이 알파 디지트 케이스 분별장치는 문자가 더 많은 알파벳글자(부류 1) 또는 더 많은 수치 디지트(부류 2)로 구성되는가를 결정한다. 만약 더 많은 알파벳글자가 있으면, 이 문자라는 라인(22a)을 통해 인가되고 블록(24)에서 이들이 상위케이스 또는 하위케이스 인가가 결정된다. 만약 더 많은 디지트가 있으면, 이 문자를 블록(24)의 출력인 출력라인(24a)에 라인(22b)을 통해 인가된다. 이는 다음에 보다 더 상세하게 설명된다.

제3도를 참조하면, 제2도의 알파 디지트 케이스 분별장치(22)가 상세하게 도시되어 있다. 라인(19a)상의 최상위 응답 단어는 선택적 디지트 알파 다수 투표 블록(26)에 입력단어로서 인가되는데, 이 블록은 최상위 응답 단어내의 다수 문자들이 1) 알파벳 ; 2) 수치 ; 또는 3) 알파벳 및 수치 문자들의 수가 같은가에 대한 다수 계수(majority count)를 제공한다.

판단 블록(28)에서, 다수 계수가 알파벳글자를 지지하는가가 결정된다. 만약 그렇다면, 라인(19b)상의 상이한 경로의 캐시 신호에 의해 제어되어 약 디지트가 알파벳글자로 대치되는 블록(30)으로 진행된다. 약 디지트 잠재적으로 또다른 알파로 혼동 가능한 것이다. 최고 점수(the highest score)의 글자가 수치를 대치하고, 알파 후처리된 모두 알파벳으로 된 단어는 알파 단어로서 라인(32)상에 제공되어 블록(24)(제2도 및 제4도)에 제공된다.

판단 블록(28)에서, 만약 다수의 계수가 알파벳을 지지하지 않으면, 다수 계수가 디지트를 지지하는가가 판단되는 판단블록(34)으로 진행된다. 만약 그렇다면, 약 알파들이 디지트로 대치되는 블록(36)으로 진행된다. 약 알파는 잠재적으로 또다른 디지트로서 혼동 가능한 것이다. 최고 점수의 디지트가 이 알파를 대치하고, 디지트 후처리된 모두 디지트인 단어는 디지트 단어로서 라인(33)상에 제공되어 출력단어를 형성하기 위하여 라인(44)(제4도)에 제공된다.

판단 블록(34)에서, 만약 다수 계수가 디지트를 지지하지 않으면, 이것은 그 단어내의 알파벳 글자와 수치 디지트의 수가 같음을 의미하며, 그 단어는 변경되지 않으며, 라인(33)에 제공되어 출력단어를 평성하기 위하여 제4도의 라인(44)에 제공된다.

제4도를 참조하면, 제2도의 블록(24)이 상세하게 도시되어 있다. 제3도의 블록(30)으로부터의 라인(32)상의 알파 후처리된 단어는 알파 단어내의 각 문자에 대해 그것이 상위케이스 또는 하위케이스 인가를 결정하기 위해 선택적 업-로우 다스 투표계수(selective up-low majority count) 블록(38)에 인가된다. 판단블록(40)에서, 다수 계수가 상위케이스를 지지하는가가 결정된다. 만약 그렇다면, 라인(19b)상의 상이한 경로들의 캐시 신호에 의해 제어되는 바와같이 약 하위케이스 글자들이 대치되는 블록(42)으로 진행한다. 약 하위케이스 글자는 잠재적으로 상위케이스 글자로 혼동가능한 것이다. 그후, 출력단어는 라인(44)상에 제공된다.

만약 판단블록(40)에서 다수 계수가 상위케이스를 지지하지 않으면, 다수 계수가 하위케이스를 지지하는지의 여부를 결정하는 판단 블록(46)으로 진행한다. 만약 그렇다면, 약 상위케이스 글자가 하위케이스 글자로 대치되는 블록(48)으로 진행한다. 약 상위케이스 글자는 잠재적으로 하위케이스 글자로 혼동가능한 것이다. 한가지 예외는 단어내의 제1문자이다. 그후 출력 단어는 라인(44)상에 제공된다.

만약 다수가 계수가 블록(46)에서 하위케이스를 지지하지 않으면, 이것은 다수 투표가 모두 상위케이스 또는 하위케이스인지를 결정함에 있어 충분한 정보를 제공하지 않음을 의미하며 이 단어는 라인(50)상에서 출력단어로서 라인(44)상에 제공된다.

제5도를 참조하면, 제3도의 선택적 디지트-알파 다수 투표 블록(26)이 상세히 도시되어 있다. 라인(19a)상의 최상위 응답 단어는 입력단어로서 블록(46)에 인가되는데, 이 블록(46)에서 수치 디지트 계수는 영으로 초기화되고 ; 계수기들은 영으로 초기화되며 ; 포인터(pointer)는 이 단어의 제1문자에 위치된다. 다음에 이 제1문자가 케이스 혼동가능인가를 결정하는 판단 블록(48)으로 진행한다. 만약 그것이 케이스 혼동 기능이면, 그것은 아직 글자 또는 디지트인가가 알려지지 않은 것이므로 계수에 포함되지 않는다. 그런 다음에 라인(50)을 통해 이것이 그 단어의 마지막 문자인지 여부를 결정하는 판단 블록(52)으로 진행한다.

만약 판단 블록(48)에서 단어의 제1문자가 케이스 혼동 가능이 아니면, 이 문자가 디지트 그룹에 속하는지 여부를 결정하는 판단 블록(54)으로 진행한다. 만약 그렇다면, 블록(56)에서 디지트 계수가 증분된다. 그런다음 라인(50)을 통해 이것이 그 단어의 마지막 문자인지 여부를 결정하는 블록(52)으로 진행한다.

만약 판단블록(54)에서, 제1문자가 디지트가 아니라고 판단되면, 제1문자가 알파벳 글자인지를 판단하는 판단 블록(58)으로 진행한다. 만약 알파벳 문자라면 알파계수는 블록(60)에서 증분되며, 라인(50)을 통해 이것이 그 단어의 마지막 문자인지 여부를 결정하는 블록(52)으로 진행한다.

만약 판단 블록(58)에서, 제1문자가 알파벳이 아님이 판단되면, 이것은 제1문자가 마침표(.), 콤마(,) 등과 같은 알파 또는 디지트와 연관될 수 있는 구두점(punctuation)의 형태라는 것을 의미한다. 그런 경우, 이것이 단어의 마지막 문자인지 여부를 판단하는 블록(52)으로 진행한다. 만약 이것이 마지막 문자가 아니면, 단어의 다음 문자로 진행하기 위해 블록(64)으로 진행한다. 그런다음, 단어의 제2문자에 대해 이제까지 설명된 프로세스가 진행되는 판단 블록(48)으로 진행한다. 이는 판단블록(52)에서 판단되는 바와같이 단어의 마지막 문자가 처리될 때까지 계속된다. 라인(66)에서 나타난 바와같이 마지막 단어까지 처리된 경우, 블록(56)에서의 디지트 계수 내용 및 블록(60)에서의 알파 계수의 내용은 제3도와 관련하여 상술된 것처럼 알파 디지트 케이스 분별장치(22)에 의해 조사된다.

제5도에서의 논리와 비슷한 논리가 상위케이스 및 하위케이스 다수 계수를 결정하기 위해 포함된다. 이예에서, 상위케이스 계수, 하위케이스 계수 및 부수논리(attendant logic)가 있을 것인데, 이것은 제5도의 논리와 같은 방식으로 동작한다.

제6도를 참조하면, 제3도의 블록(30)이 상세히 도시되어 있다. 블록(36)이 이와 동일한 방식으로 기능함을 이해해야 할 것이다. 전술한 바와같이, 블록(30)의 기능은 약 디지트를 글자로 대치하는 것과 관련된 결정을 하는 것임에 반해, 블록(36)의 기능은 약 글자를 디지트로 대치하는 것과 관련된 결정을 하는 것이다.

블록(68)에서, 단어의 처음에서 시작하고 단어의 각 문자에 대해 다음과 같이 처리한다.

판단 블록(70)에서 문자가 그 단어에 대해 선택된 케이스 그룹에 속하는가 여부가 판단된다. 이 예에서는, 그 문자는 글자인가가 판단된다. 만약 그렇다면, 어떠한 대치(replacement)도 필요없음을 나타내는 라인(72)으로 진행한다. 만약 문자가 글자가 아니면 즉, 그것이 디지트이면, 그 단어에서의 위치, 그 단어의 케이스 그룹 및 그 단어에 대한 앞선 라벨 정보를 이용하여 이 문자에 대한 허용 가능한 라벨(allowableblabels)의 리스트(list)를 발생시키기 위해 블록(74)으로 진행한다. 라벨들의 사용은 후지사키의 미합중국 특허 제 5,029,223 호에서 설명된다.

이 특정한 문자에 대한 점수가 사전 결정된 임계치보다 더 나쁜가를 판단하는 판단 블록(76)으로 진행한다. 이것은 이 문자에 대해 최초로 선택된 라벨에 대한 낮은 수준의 신뢰를 나타낼 것이고 보다 적극적인 대치 수단을 허락할 것이다. 만약 그렇다면, 라벨이 허용 가능 리스트내에 있는 것이 발견될 때까지 이 문자에 대한 모든 다른 후보들이 ˝점수에 의한 정렬(sorted-by-score)˝ 기법에 의해 조사되는 블록(78)으로 진행한다. 리스트에서 어느 것도 발견되지 않으면, 대응하는 라벨이 혼동행렬(confusion matrix)로부터 얻어지고 이 문자는 대치로 된다.

사용된 혼동 행렬은 문법내의 존재하는 케이스 부류 각각에 대해 혼동 쌍(confusion pairs)들의 리스트를 포함하는, 문자 모형 세트와 연관된 구조를 가진다. 싸혼동 쌍 중에서, 하나는 그 케이스 부류에 속하는 문자의 모형이고 나머지 하나는 제1모형과 형태상 유사한 상이한 케이스 부류로 부터의 문자이므로 혼동되기 쉽다.

혼동 행렬은 연관된 모형세트(prototype-set)를 사용하여 각 모형이 각각의 그 세트내의 다른 멤버(members)의 하나와 얼마나 자주 혼동되는가를 계수함으로써 테스트 데이터(test data)에 대한 에러 통계치(error statistices)에 의해 갱신된다. 이러한 인식 테스트(recognition tests)들은 문자별 모드(character-by-character mode), 즉, 인식을 도와줄 문맥정보(context information)를 갖추지 않은 모드이다. 생성된 테이블 가운데, 단지 가장 빈번한 혼동쌍들만이 유지된다.

만약 판단 블록(76)에서 문자에 대한 점수가 사전 결정된 임계치보다 더 나쁘지 않다고 판단되면, 블록(80)으로 진행하여 다음 조건을 만족하는 이 문자에 대한 모든 후보들의 정렬된 리스트를(상단부 점수로부터 시작하여)탐색한다 : 후보점수가 임계치보다 더 작다. 이것은 탄성 거리 점수(elastic distance score)가 상단부 점수의 델타(delta)내에 있음(혼동가능할 만큼 충분히 가깝다)을 의미한다. 만약 발견되면, 문자를 대치한다. 점수가 좋은 경우, 보다 더 적극적인 대치는 예를들면 부품번호(part-numbers)(J2-f23)와 같은 ˝규칙에 대한 예외(exception to rules)˝가 이런 필터를 통과하게 한다.

임계치는 인식 출력문자에 대한 통계치에 의해 얻어지는 탄성 거리 점수인데, 이것은 출력문자들이 정확하게 인식되는가를 알아내기 위해 의도된 라벨을 출력문자들과 비교하고 인식기에 의해 이들에게 주어진 점수를 샘플링(sampling)하여 얻어진다. 정확하게 인식된 문자들의 점수들은 수집되어 분석된다. 잘못인식된 문자들에 대한 점수들도 수집되어 분석된다. 올바른 문자와 혼동의 경우에 인식기에 의해 추천되는 최상위 선택 문자(top choice charcter)사이의 접수 차이들도 수집되어 분석된다. 이런 분석으로부터 다음 임계치가 추정된다 :

a) 나쁜-점수 임계치(Bad Score Thershold).

어떤 문자기 이 점수보다 더 높은 점후를 갖는다면, 문자가 잘못인식되었을 확률이 높다(이것은 보통 조악하게 쓰여진 문자에서 발생한다). 제6도에서, 그 점수가 이러한 임계치를 초과하는 모든 문자는 박스(78)로 진행할 것이고 적극적으로 대치될 것이다(이 단어에 대한 다수 부류에 속하는 캐시에서의 어떤 한 후보에 의해서도, 또는 어느 것도 존재하지 않으면 혼동 행렬을 참조함으로써).

b) 혼동가능성-델타-임계치(Confusabilitiy Delta Thershold).

캐시내의 후보 중 하나가 이 임계치보다 더 작은 것에 의해 최상위 선택 점수 보다 더 나쁜(큰) 탄성 매치 점수(elastic match score)를 가진다면, 혼동(Confusability)이 가능하다(통계 데이터 내의 대부분 혼동 가능한 올바른 선택이 이 델타보다 더 작은 것에 의해 최상위 선택과 다르다. 제6도에서, 이 점수는 박스(80)에서 사용된다. 박스(80)에서 대치되는 문자들은 초기의 좋은 점수를 가졌으므로, 캐시 리스트내에 그것들과 혼동되었을 가능성이 큰 충분히 밀접한 후보가 존재할 경우에만 대치될 것이다.

Claims

수서인식 시스템(handwriting recognition system)에서의 케이스 혼동(case confusion)을 해결하는 방법에 있어서, 상기 방법이 : 케이스 문법 부류(case-grammer classes)에 속하는 다수의 모형문자들(prototype characters)을 저장하는 단계와 ; 각각이 적어도 하나의 문자로 구성되는 다수의 단어들을 포함하는 수서를 샘플링(sampling)하는 단계와 ; 각 샘플된 단어에 대해 출력단어를 생성하기 위해 상기 샘플된 수서를 상기 다수의 모형 문자들과 비교하는 단계와 ; 출력 단어내의 어느 문자 이든지의 케이스 문법부류에 관한 케이스 혼동이 있는가를 판단하는 단계와 ; 상기 출력 단어내의 다른 문자들의 케이스 문법 부류에 기초하여 상기 출력 단어내의 상기 임의의 문자의 케이스 혼동을 해결하는 단계를 포함하는 수서인식 시스템에서의 케이스 혼동을 해결하는 방법.
수서인식 시스템에서의 케이스 혼동을 해결하는 방법으로서, 상기 방법이 : 알파벳(alphabletic), 수치(numertic), 상위케이스(upper case) 및 하위케이스(lower case)를 포함하는 케이스 부류(case classes)에 속하는 다수의 모형 문자들을 저장하는 단계와 ; 각각이 적어도 하나의 케이스 부류중의 적어도 하나의 문자로 구성되는 다수의 단어들을 포함하는 수서를 샘플링하는 단계와 ; 각 샘플된 단어에 대해 적어도 하나의 케이스 부류의 적어도 하나의 문자의 출력 단어를 생성하기 위해 상기 샘플된 수서를 상기 다수 모형의 문자들과 비교하는 단계와 ; 각 혼동가능 케이스 부류의 케이스 혼동가능 멤버(case confusable members)들의 리스트를 제공하는 단계와 ; 상기 출력단어에서 각 케이스 부류의 비-케이스-혼동가능 멤버(non-case-confusable members)들의 수를 계수하는 단계와 ; 비-케이스-혼동가능 멤버들의 상기 계수된 수에 기초하여 상기 출력 단어내의 각 문자의 다수 케이스 부류(majority case class)를 결정하는 단계와 ; 각 케이스-혼동가능 멤버를 상기 다수 케이스 부류로 부터의 대응하는 유사한 문자로 변환하는 단계를 포함하는 수서인식 시스템에서의 케이스 혼동을 해결하는 방법.
제3항에 있어서, 상기 케이스 혼동가능 멤버들이 케이스 혼동가능 쌍(case confusable pairs)을 포함하는 수서인식 시스템에서의 케이스 혼동을 해결하는 방법.
수서인식 시스템에서의 케이스 혼동을 해결하는 방법으로서, 상기 방법이 : 알파벳, 수치, 상위케이스 및 하위케이스를 포함하는 케이스 부류에 속하는 다수의 모형 문자들을 저장하는 단계와 ; 각각이 적어도 하나의 케이스 부류중의 적어도 하나의 문자로 구성되는 다수의 단어들을 포함하는 수서를 샘플링하는 단계와 ; 각 샘플된 단어에 대해 적어도 하나의 케이스 부류의 적어도 하나의 입력 단어를 생성하기 위해 상기 샘플된 수서를 상기 다수의 모형 문자들과 비교하는 단계와 ; 각 케이스 부류의 케이스 혼동가능 멤버들의 리스트를 제공하는 단계와 ; 상기 제1단어에서 각 케이스 부류의 비-케이스-혼동가능 멤버들의 수를 계수하는 단계와 ; 상기 제1단어의 계수된 비-케이스-혼동가능 멤버들의 다수(majority)가 알파벳인가 여부를 결정하고, 알파벳이면 알판단어를 생성하도록 상기 제1단어 내의 수치 문자들을 알파벳 문자들과 대치하는 단계와 ; 차모가 아니라면, 상기 입력단어내의 계수된 비-케이스-혼동 가능 멤버들의 다수가 수치인지 여부를 결정하고, 수치이면, 출력 단어를 생성하도록 상기 입력 단어내의 알파벳 문자들을 수치문자들과 대치하는 단계와 ; 수치가 아니라면, 출력 단어를 생성하도록 상기 제1단어를 변경하지 않는 단계와 ; 상기 알파 단어에서 상위케이스 및 하위케이스 문자들의 수를 계수하는 단계와 ; 계수된 상위 및 하위케이스 문자들의 다수가 상위케이스인지 여부를 결정하고, 상위케이스라면, 출력단어를 생성하도록 상기 알판단어 내의 하위케이스 문자들을 상위케이스 글자들로 대치하는 단계와 ; 상위케이스가 아니면, 상위 및 하위케이스 문자들의 다수가 하위케이스 인지 여부를 결정하고, 하위케이스이면, 출력단어를 생성하도록 상기 알파 단어내의 상위케이스 문자들을 하위케이스 문자들로 대치하는 단계와 ; 하위케이스가 아니면, 변경되지 않는 상기 알판단어를 출력단어로서 사용하는 단계를 포함하는 수서인식 시스템에서의 케이스 혼동을 해결하는 방법.
제4항에 있어서, 상기 혼동가능 케이스 멤버들이 혼동가능 케이스 쌍을 포함하는 수서인식 시스템에서의 케이스 혼동을 해결하는 방법.
제5항에 있어서, 혼동가능 케이스 상을 대치하는 것이 상기 혼동가능 케이스 쌍을 대치하기 위해 선택된 문자들에 대한 사전 결정된 임계치에 의거하는 수서인식 시스템에서의 케이스 혼동을 해결하는 방법.