KR101150058B1

KR101150058B1 - 적응성 핸드라이팅 인식을 위한 방법, 시스템, 컴퓨터 판독가능 기록 매체 및 장치

Info

Publication number: KR101150058B1
Application number: KR1020040026970A
Authority: KR
Inventors: 보 티에손; 크리스토퍼에이. 미크
Original assignee: 마이크로소프트 코포레이션
Priority date: 2003-05-21
Filing date: 2004-04-20
Publication date: 2012-07-02
Also published as: US20040234128A1; EP1480158A1; JP4724776B2; KR20040100883A; JP2010102742A; CN100380394C; CN1573799A; JP4564277B2; US7460712B2; US7184591B2; US20070127818A1; JP2004348714A

Abstract

본 발명은 최소의 사용자별 등록 데이타를 가지고 적응성 핸드라이팅 인식(adaptive handwriting recognition)을 제공하기 위하여 핸드라이팅 샘플의 일반 및 사용자별 특징을 사용한다. 인식 처리에서 일반 및 사용자별 분류자를 허용함으로써, 특정 사용자의 핸드라이팅의 특징은 그 사용자에 의해 아직 입력되지 않은 핸드라이팅 문자의 특성을 신속하게 확인하는 데 활용될 수 있다. 따라서, 새로운 문자는 사용자가 등록 또는 "트레이닝된(trained)" 데이타로서의 문자를 먼저 입력하도록 요구하지 않고 인식될 수 있다. 본 발명의 일례에서, 일반 특징의 처리는 다수의 사용자 상에서 트레이닝(train)된 일반 분류자에 의해 수행된다. 본 발명의 다른 예에서, 사용자별 분류자는 사용자별 핸드라이팅 인식을 제공하도록 요구될 때 일반 분류자의 분류를 수정하는 데 사용된다.

핸드라이팅

Description

적응성 핸드라이팅 인식을 위한 방법, 시스템, 컴퓨터 판독가능 기록 매체 및 장치{SYSTEM AND METHODS FOR ADAPTIVE HANDWRITING RECOGNITION}

도 1은 본 발명의 양태에 따른 핸드라이팅 인식 시스템의 블록도.

도 2는 본 발명의 양태에 따른 핸드라이팅 관찰 처리의 블록도.

도 3은 본 발명의 양태에 따른 핸드라이팅 관찰 처리의 다른 블록도.

도 4는 본 발명의 양태에 따른 핸드라이팅 관찰 처리의 또 다른 블록도.

도 5는 본 발명의 양태에 따른 특징 집합의 다이어그램.

도 6은 본 발명의 양태에 따른 핸드라이팅 문자 특징의 다이어그램.

도 7은 본 발명의 양태에 따른 연계 집합의 다이어그램.

도 8은 본 발명의 양태에 따른 문자의 그룹을 위한 연계 집합의 일례.

도 9는 본 발명의 양태에 따른 혼동 규칙의 설명.

도 10은 본 발명의 양태에 따른 사용자별 분류자의 예의 블록도.

도 11은 본 발명의 양태에 따른 핸드라이팅 인식 시스템을 구성하는 방법의 흐름도.

도 12는 본 발명의 양태에 따른 핸드라이팅 인식 시스템을 사용하는 방법의 흐름도.

도 13은 본 발명의 양태에 따른 사용자별 데이타를 분류하는 방법의 흐름도.

도 14는 본 발명이 기능할 수 있는 예시적인 수행 환경을 도시.

도 15는 본 발명이 기능할 수 있는 다른 예시적인 수행 환경을 도시.

<도면의 주요 부분에 대한 부호의 설명>

120 : 핸드라이팅 데이타

104 : 일반 분류자

106 : 사용자별 분류자

318 : 짧은 사용자별 등록

1004 : MLLR 적응 밀도 모델

1006 : 직접 밀도 모델

1008 : 직접 식별 모델

본 발명은 일반적으로 핸드라이팅 인식(handwriting recognition)에 관한 것으로, 더 상세하게는 일반 및 사용자별 분류자를 사용하는 적응성 핸드라이팅 인식을 위한 시스템 및 방법에 관한 것이다.

컴퓨터는 사회의 필수 요소가 되었다. 매일 사람들은 일과 레저 활동 양자를 용이하게 하는 이러한 기술에 더욱 의존하게 된다. 이러한 기술의 중대한 단점은, "아날로그" 환경에서 그것이 기능하고 있는 데에 반하여, 자신은 "디지털"적인 본질을 갖는다는 것이다. 컴퓨팅 기술은, 정보가 처리되기 위하여 개별 상태들이 식별될 필요가 있는 디지털 영역에서 동작한다. 간단히 표현해서, 정보는 일련의 "온" 및 "오프" 상태로 컴퓨터 시스템에 입력되어야 한다. 그러나, 인간은 사건이 흑백으로 발생하지 않고, 항상 그 사이 또는 회색의 그림자에서 발생하는 것처럼 보이는 명백한 아날로그 세계에서 살고 있다. 그러므로, 디지털과 아날로그 간의 주요 차이는 아날로그가 시간 상 연속적인 반면 디지털은 시간 상 분리된 개별 상태 예를 들어, 별개의 레벨을 요구한다는 것이다. 인간은 본래 아날로그 양식으로 동작하기 때문에, 컴퓨팅 기술은 "비-디지털 실체" 또는 인간과 인터페이스할 때 갖는 충돌을 줄이도록 발달해 왔다.

조직화된 키 집합은 최초의 인간-기계 인터페이스 장치 중 하나이며, 전통적으로 타자기에서 사용되었다. 이러한 인터페이스 시스템은 기계적인 키 및 종이를 가지고 상호작용하는 것이 아니라 컴퓨팅 시스템으로 전송될 개별 상태를 트리거하도록 적응되었다. 따라서, 인간이 기존의 친숙한 인터페이스를 사용하여 친숙하지 않은 기술에 이터페이스하는 것을 허용하는 컴퓨터 "키보드"가 개발되었다. 이것은 컴퓨터 시대로의 이행을 쉽게 하였다. 유감스럽게도, 컴퓨터를 사용하기를 원하는 모든 사람이 타이핑 방법을 아는 것은 아니다. 이것은 컴퓨팅 기술을 적절하게 사용할 수 있는 컴퓨터 사용자 수를 제한했다. 하나의 해결책은 사용자가 컴퓨팅 모니터로부터 그림을 선택하여 컴퓨터가 태스크를 수행하게 하는 것을 허용하는 그래픽 사용자 인터페이스를 도입하는 것이었다. 따라서, 컴퓨팅 시스템의 제어는 일반적으로 "마우스"로서 알려진 포인팅 및 선택하는 장치로 획득되었다. 이것은 더 많은 사용자가 키보드 사용법을 배울 필요 없이 컴퓨팅 기술을 사용하는 것을 허용하였다. 이러한 유형의 장치는 컴퓨팅 기술을 사용하는 것을 더 쉽게 하였지만, 아직도 인류의 역사 만큼이나 오래된 통신 수단인 핸드라이팅을 처리하지는 못한다.

우선, 기존의 타이핑 또는 조판된 정보를 컴퓨터에 입력하려는 데에 기술의 초점을 맞추었다. 초기에, 스캐너 또는 광 이미저(imager)는 그림을 "디지털화"(예를 들어, 이미지를 컴퓨팅 시스템에 입력)하는 데 사용되었다. 이미지가 컴퓨팅 시스템 내로 디지털화되면, 인쇄 또는 조판된 자료도 디지털화될 수 있게 된다. 그러나, 스캔된 문서 페이지의 이미지는 컴퓨터 시스템 내로 불리워진 후에 문서로서 다루어질 수 없다. 문자 및 단어는 "그림"이며, 사실상 편집 가능한 문서가 아니다. 따라서, 문서를 편집 가능한 페이지로서 디지털화하는 스캐닝 기술을 사용하기 위하여 광 문자 인식(OCR) 기술이 개발되었다. OCR 소프트웨어가 스캔된 이미지를 편집 가능한 문서로 번역하는 것을 허용하는 특정 문서 폰트가 사용되는 경우, 이러한 기술은 상당히 잘 동작했다. 초기에, 이러한 기술은 약 50% 내지 60%의 정확도를 가졌지만, 현재는 거의 98% 내지 99% 또는 그 이상의 정확도로 진보하였다. OCR 기술은 문서 문자를 인식하는 것 뿐만 아니라, 그래프 및 페이지 포맷팅, 심지어 폰트 특성까지도 보유하는 것을 고려할 수 있는 수준으로 발달되었다.

그 결과로서, OCR 기술은 핸드라이팅을 인식하기 위하여 OCR 기술을 사용하는 것이 실용적으로 보이는 정밀도 수준을 달성하였다. 그러나, 핸드라이팅이 컴퓨팅 시스템 내로 바로 디지털화될 수 있다면 왜 키보드를 통하여 핸드라이팅을 문서로 변환하는가? 이러한 접근에 대한 문제점은 기존 OCR 기술이 가능한 폰트 유 형의 제한된 또는 유한한 선택을 인식하도록 조정되었다는 것이다. 따라서, OCR 기술은 문자를 미리 존재하는 폰트의 데이타 베이스와 비교함으로써 "인식"할 수 있다. 폰트가 일관되지 않다면, OCR 기술은 미지의 또는 "존재하지 않는" 문자를 복귀시켜 문서를 인식하지 못했음을 나타낼 것이다. 핸드라이팅은 이러한 문제의 더욱 극단적인 경우임이 입증되었다. 사람이 글씨를 쓸 때, 자신의 특정 스타일이 자신의 필적을 통해 나타난다. 이러한 유일성으로 인해, 서명은 한 사람을 다른 모든 사람으로부터 구별시키므로 법적 서류에서 사용된다. 따라서, 본질적으로 핸드라이팅은 동일한 문자에 대해서 조차도 무한한 형식을 갖는다. 특정 문자에 대한 핸드라이팅의 상상할 수 있는 모든 형식을 저장하는 것이 불가능하다는 것은 명백히 입증될 것이다. 핸드라이팅 인식을 현실화하기 위하여 다른 수단이 획득될 필요가 있다.

핸드라이팅 인식에서의 초기의 시도 중 하나는 실제로는 전혀 핸드라이팅이 아닌 "핸드라이팅"을 포함하였다. "획" 또는 선의 시스템은 디지털화되어 컴퓨터 시스템 내로 번역될 수 있는 "터블렛" 또는 기입 표면을 통한 컴퓨팅 시스템 내로의 입력으로서 사용되었다. 획들이 프린트된 문서 문자를 잘 상징하도록 하기 위한 시도가 있었지만, 컴퓨팅 시스템은 사실상 핸드라이팅을 인식하지 못하였다. 사실, 이러한 방법은, 사용되고 있는 기계 또는 시스템에 인간이 적응하도록 강요한다. 진짜 핸드라이팅을 실제로 인식하기 위하여 그 이상의 개발이 이루어졌다. 다시, 시스템이 문자의 상상할 수 있는 모든 변화를 주어진 데이타베이스 내의 것과 대조해야 한다면, 엄청난 처리 자원 및 시간이 소모될 것이다. 그러므로, 다소 크더라도 적어도 유한한 가능성의 그룹을 갖는 범위에서 최초 진보 중 일부가 이루어졌다. 그 결과로서 생긴 기술은 우편물을 분류하는 것과 같은 동작에 대하여 평가할 수 없을 만큼의 가치가 있는 것으로 입증되었다. 이러한 경우에, 예를 들어 도시 이름을 광학적으로 인식하기 위한 시도가 이루어질 수 있다. 컴퓨팅 시스템이 이름을 "이해"하는데 실패한다면, 우편물이 어느 주에서부터 온 것이지, 및 시스템이 도시 이름의 문자들 중 적어도 일부를 인식하는지와 같은 "문맥"을 사용할 수 있다. 이것은 주의 도시 이름의 데이타베이스 내에서 검색이 진행되는 것을 허용하여, 종종 불일치를 해결하고 "판독 가능한" 주소가 더 많아지게 한다.

물론, 미국에서의 우편 번호의 도입은 이름 주소를 판독하는 것에 대한 OCR 기술의 중요성을 최소화한다. 따라서, 기술은 주로 문자를 제외하고 숫자만 인식하는 데 집중한다. 이것은 필수적인 번역을 10개의 문자(0에서 9)만으로 제한한다. 그러나, 지역, 학교 교육 및 다른 요인에 따라 사람들은 숫자 표기를 상이하게 학습할 것이다. 가장 흔하게 변화하는 숫자는 2 및 4이다. 사람들은 종종 고리와 함께 또는 고리 없이 2를 표기하고, 꼭대기를 연 채 또는 열지 않은 채 4를 표기한다. 동일한 문자의 이러한 변화는 핸드라이팅 기술에 의해 고려되어 동일한 문자의 상이한 변화는 컴퓨터 시스템에 의해 동일한 문자로서 해석된다. 이것은 제한된 수의 문자로 인해, 그리고 그에 따른 제한된 수의 허용된 변화로 인해 상당히 효율적으로 작용한다.

숫자를 인식하는 것이 적절한 방책임을 알 수 있다. 그러나, 대부분의 컴퓨팅 시스템 사용자는, 시스템이 숫자만이 아니라, '#', '$' 등과 같은 특수 문자는 물론, 모든 알파벳 문자를 직접 인식하기를 원할 것이다. 사람들은 자신이 기계 동작 방법에 적응하기 보다 기계가 자신으로부터 학습하게 하고 싶어한다. 따라서, "학습하는" 컴퓨팅 시스템은 이러한 영역의 인간-기계 인터페이스에서 용이하도록 발달되었다. 핸드라이팅 인식은, 컴퓨팅 시스템이 사용자의 독특한 필기 스타일에 대처할 수 있게 하는 기술에 의해 더 향상된 수준으로 이루어졌다. 이러한 문맥에서, 사용자가 일정 시간 동안 입력한 것을 정확하게 해석하고 활용하기 위한 방법이 사용된다. 학습 처리 속도를 높이기 위하여, 종종 기술은 기술의 성능을 증가시키는 조직화된 사용자 입력 또는 "등록" 정보를 요구할 것이다. 전형적인 등록은 인식을 위한 컴퓨팅 시스템을 조정하기 위하여 사용자가 숫자, 문자, 특수 문자 및 특정 그래프를 기록하도록 요구할 것이다. 현재, 이것은 꽤 긴 처리일 수 있고, 높은 정확도가 획득될 수 있기 전에 처리가 상당한 시간이 걸리는 것은 드물지 않다.

핸드라이팅 인식 기술을 트레이닝하는 것이 어려워 보일 수 있지만, 전통적인 컴퓨팅 시스템 인터페이스에 대하여 이러한 능력을 갖는 장점은 대단한 것이다. 현재, 다수의 사용자가 시스템에 정보를 입력하는 대부분의 효율적인 수단은 키보드를 통해서이다. 이것은 키보드가 일반적으로 디자인에서 보편적이어서 항상 표준화된 인터페이스이며 많은 개별 사용자에 의해 쉽게 사용가능하다는 점 때문이다. 그러나, 키보드에 대한 인간 공학(예를 들어, 장치를 사용하는 인간의 편의)은 키가 특정 간격을 유지할 것을 요구한다. 이것은 키보드 전체에 대해 특정 최소 크기를 조장하여 휴대 사용이 불편하도록 만든다. 핸드헬드 컴퓨팅 장치 등은 소형이고 휴대에 적합한 반면, 암호 획 인식(cryptic stroke recognition) 및/또는 테핑(tapping) 기술을 사용하는 이러한 유형의 장치를 위한 데이타 입력은, 이러한 장치를 사용하기 지루하게 만드는 경향이 있다. 다시 한번, 기계가 사용자를 학습하기 보다 사용자가 기계를 학습하도록 강요된다. 일부 제조자는 이러한 결함을 극복하기 위하여 더 작은 초소형 키보드를 생산하기를 시도했으나, 그에 의해 제조된 장치가 방해가 되거나/되고 인간 환경 공학적이지 못하기 때문에 이러한 "향상"은 사용자에게 불편하다고 입증되었다. 휴대용 및 휴대용이 아닌 컴퓨팅 장치는 사용자가 일반 핸드라이팅을 통해 정보를 직접 입력할 수 있을 때 가장 가치있는 것으로 입증된다. 이것은 이러한 장치들이 숙련된 및 숙련되지 않은 사용자 등에 의해 사용되는 것을 허용한다.

일반 및 사용자별 분류자가 인식 처리를 용이하게 하는 것을 허용함으로써, 특정 사용자의 핸드라이팅의 특징은 일부 샘플 문자로부터 추출될 수 있고 사용자에 의해 아직 입력되지 않은 핸드라이팅 문자의 특징을 신속하게 확인하는 데 활용될 수 있다.

이하는 본 발명의 일부 양태에 대한 기본적인 이해를 제공하기 위하여 본 발명의 간략한 요약을 제공한다. 이러한 요약은 본 발명의 광범위한 개관이 아니다. 그것은 본 발명의 핵심적/결정적인 요소를 식별하기 위한 것도 아니고, 본 발명의 범주를 서술하려는 것도 아니다. 그 유일한 목적은 나중에 제공되는 더 상세한 설 명에 대한 서두로서 간략한 형식으로 본 발명의 일부 개념을 나타내는 것이다.

본 발명은 일반적으로 핸드라이팅 인식에 관한 것으로, 더 상세하게는 일반 및 사용자별 분류자를 사용하는 적응성 핸드라이팅 인식을 위한 시스템 및 방법에 관한 것이다. 핸드라이팅 샘플의 일반 및 사용자별 특징은 사용자별 핸드라이팅 인식에 최소 수준의 사용자별 등록 데이타를 제공하는 적응성 핸드라이팅 시스템을 통해 영향을 받는다. 일반 및 사용자별 분류자가 인식 처리를 용이하게 하는 것을 허용함으로써, 특정 사용자의 핸드라이팅의 특징은 일부 샘플 문자로부터 추출될 수 있고 사용자에 의해 아직 입력되지 않은 핸드라이팅 문자의 특징을 신속하게 확인하는 데 활용될 수 있다. 이것은 적응성 핸드라이팅 시스템이 사용자에게 등록 또는 "트레이닝" 데이타로서 그러한 문자의 예를 먼저 입력하도록 요구하지 않고 일부 문자에 적응하는 것을 허용한다. 감소한 등록 데이타 집합이 사용될 수 있기 때문에, 등록 기간은 본 발명을 사용함으로써 실질적으로 감소되는 한편, 동시에 핸드라이팅 인식 동안에 높은 정확성을 유지한다. 본 발명은 일반 특징 및 사용자별 특징에 관련하여 핸드라이팅 샘플의 특징을 인식함으로써 이것을 달성한다. 이것은 일반 분류자에 의한 일반 특징의 처리를 허용하며, 하나 이상의 사용자별 특징 분류자를 통해 사용자별 특징을 더 분류한다. 특정 분류자에 대하여 실질적으로 유사한 사용자별 특징을 나타내는 문자는 "연계(tying)" 집합들로 그룹화된다. 따라서, 특징은 사용자가 특정 연계 집합의 모든 문자를 입력할 필요없이 해당 연계 집합 내의 다른 문자들에 외삽될 수 있어서, 본 발명의 분류자를 트레이닝하기 위한 등록 기간이 실질적으로 감소되는 것을 허용하고, 인식 정확도를 여전히 유지 하면서 핸드라이팅 인식 분류자를 트레이닝하는 사용자의 노력 및 시간을 감소시킨다.

본 발명은 일반 및 사용자별 분류자가 상호작용하는 것도 허용함으로써 핸드라이팅 인식을 용이하게 한다. 이것은 상이한 입상(granularity)이 핸드라이팅 샘플에 관련하여 획득되는 것을 허용한다. 따라서, 일반 분류자가 특징을 쉽게 분별할 수 있다면 그것은 즉시 식별된다. 그러나, 모호하거나 "혼동"될 수 있는 데이타는, 특정 혼동 규칙 내에 포함되는 문자를 분류하기 위하여 사용자별 포스트-프로세서 기술을 사용하는 "혼동 규칙(confusing rule)"을 통하여 처리된다. 예를 들어, MLLR(Maximum Likelihood Linear Regression) 적응 밀도 모델, 직접 밀도 모델 및 직접 식별 모델 등과 같은 상이한 유형의 포스트-프로세서 분류가 본 발명 내에서 사용될 수 있다. 상이한 모델 및 분류자를 사용하는 이러한 유연성은 본 발명이 기존 핸드라이팅 인식 기술과 쉽게 통합될 수 있게 한다. 따라서, 특정 사용자로부터의 데이타를 식별하는 핸드라이팅 인식 시스템의 능력을 강화하기 위하여, 본 발명은 다수의 사용자로부터의 집단 관찰에 기초한 일반 분류자, 및/또는 본 발명에서의 사용자별 분류자 이외의 수단에 의해 일반 분류자로부터 적응된 사용자별 분류자를 사용할 수 있다.

본 발명은 마이크소프트의 윈도우 XP® 태블릿 PC와 같은 휴대 소프트웨어 제품을 매우 강화할 수 있다. 태블릿 PC는, 사용자가 필기용 태블릿과 같은 디스플레이를 사용하여 자신의 핸드라이팅으로 정보를 입력할 수 있게 함으로써, 펜 및 종이의 편의를 제공한다. 이것은, 예를 들어 워드 프로세서, 스프레드 시트 및 이 메일 등의 소프트웨어 어플리케이션과 같은 컴포넌트 내에서의 사용을 위한 문서로 전환된다. 본 발명에 의해 제공되는 것과 같은 디지털 인식 시스템을 사용하면, 사용자는 핸드라이팅 인식-호환가능한 소프트웨어 프로그램으로 임포트(import)된 기존 서류를 마크업(mark up)할 수 있다. 본 발명은 태블릿 PC와 같은 제품에 의해 인식되는 형태로 사용자의 핸드라이팅을 신속하게 해석하고 적응한다. 본 발명이 없다면, 핸드라이팅 해석은 처리하는 데 실질적으로 더 오래 걸리고 더 낮은 정확도를 가질 것이다. 따라서, 휴대 제품은 본 발명의 예를 사용함으로써 자신의 효용을 증가시킬 수 있다.

상기에 언급한 것과 그에 관련된 목적 달성을 위하여, 본 발명의 특정한 예시적인 양태가 이하의 설명 및 첨부 도면에 관련하여 여기에 기술된다. 이러한 양태는 지시적이지만, 본 발명의 원리가 사용될 수 있는 다양한 방법의 일부일 뿐이며, 본 발명은 모든 그러한 양태 및 그 등가물을 포함하고자 한다. 본 발명의 다른 장점 및 새로운 특징은 이하의 발명의 상세한 설명을 도면과 관련하여 숙지함으로써 명백해질 것이다.

본 발명은 도면을 참조하여 설명되며, 이러한 도변 전체에서 동일한 참조 번호는 동일한 구성요소를 나타낸다. 이하의 설명에서, 설명의 목적을 위하여 다수의 특정 세부 사항은 본 발명의 완전한 이해를 제공하기 위하여 설명된다. 그러나, 본 발명이 이러한 상세한 세부 사항 없이 실행될 수 있다는 것은 분명할 수 있다. 다른 예에서, 잘 알려진 구조 및 장치가 본 발명을 설명하는 데 용이하게 하기 위하여 블록도의 형식으로 도시된다.

본 출원에서 사용되는 용어 "컴포넌트"는 하드웨어, 소프트웨어, 하드웨어와 소프트웨어의 조합, 또는 실행 중인 소프트웨어인 컴퓨터 관련 실체를 설명하고자 하는 것이다. 예를 들어, 컴포넌트는 프로세서 상에서 실행 중인 프로세스, 프로세서, 오브젝트, 실행파일, 실행 쓰레드, 프로그램 및/또는 컴퓨터일 수 있으나 이것으로 제한되는 것은 아니다. 예를 들어, 서버와 그 서버 상에서 실행 중인 어플리케이션 양자 모두 컴퓨터 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세스 및/또는 실행 쓰레드와 함께 존재할 수 있고, 컴포넌트는 하나의 컴퓨터 상에 위치할 수 있으며/있거나 둘 이상의 컴퓨터 간에 분산될 수 있다. "쓰레드"는 오퍼레이팅 시스템 커널이 실행을 위해 스케줄링하는 프로세스 내의 실체이다. 본 분야에서 잘 알려진 바와 같이, 각각의 쓰레드는 쓰레드의 실행에 관련된 휘발성 데이타인 관련된 "문맥"을 갖는다. 쓰레드의 문맥은 시스템 레지스터의 내용 및 쓰레드의 프로세스에 속하는 가상 주소를 포함한다. 따라서, 쓰레드의 문맥을 포함하는 실제 데이타는 그것이 실행하는 것에 따라 다양한다.

본 발명은 특정 사용자에 대하여 분류 정확성을 향상시키기 위하여 그 사용자에 대한 일반 분류 모델의 적응을 가능하게 하는 시스템 및 방법을 포함한다. 매우 짧은 등록 기간(소수의 예만 필요함) 및 신속한 적응이 본 발명의 특성이다. 본 발명에 의해 사용자에 적응된 분류자에 있어서, 분류는 우선 일반적인(모든 사용자에게) 분류 모델과 다음으로 포스트-프로세서로서 실행하는 작은 분류 모델의 집합의 조합에 기초한다. 포스트-프로세서 모델은 사용자별이므로, 등록 정보로부터 직접 학습되고/학습되거나 적응된다. 이러한 모델 또는 "이원적" 분류자는 이 하에 설명되는 바와 같이 상이한 특징 집합 상에 작용한다. 이러한 설정에서, 본 발명의 사용자별 분류자 이외의 수단에 의해 일반 분류자로부터 적응된 사용자별 분류자가 일반 인식자 대신에 사용될 수 있고, 설명의 편의를 위하여 이하에서 일반 분류자로서 (의미적으로 틀리게) 설명될 것이다.

종종, 특징 벡터는 일반적 특징을 가진 부분과 사용자별 특징의 하나 이상의 부분으로 분리될 수 있다. 일반적으로, 관찰된 값이 모든 사용자에 걸쳐 실질적으로 유사하다면 특징을 일반 특징으로 선택하고, 관찰된 값이 모든 사용자에 걸쳐 실질적으로 상이하지만 특정 사용자에게 있어서 실질적으로 유사하다면 특징을 사용자별 특징으로서 선택한다. 단일 문자 핸드라이팅 인식에 있어서, 예를 들어 특징 벡터의 일반 부분은 스케일된 모양 관련 특징으로 구성될 수 있고, 사용자 관련 부분은 크기 및 위치 특징으로 구성될 수 있다. 예를 들어, 특정 문자에 대한 스케일된 관찰은 다수의 사용자 사이에서 실질적으로 유사하게 보일 수 있는 반면, 개별 문자의 크기 및 위치(스케일링 없이)는 핸드라이팅을 특정 사용자에 대한 것으로 개별화하는 것의 실질적인 부분을 차지할 수 있다.

일반적으로, 본 발명의 일례는 3개의 양태로 구성된다. 제1 양태는 다수의 사용자로부터의 관찰에 의해 트레이닝되는 일반 분류 모델 또는 "분류자"이다. 이러한 모델에 대하여 사용되는 특징은 일반 특징만일 수도 있고, 일반 및 사용자별 특징일 수도 있다. 제2 양태는 복수의 등록 분류 모델을 포함하며, 이들은 우선 다수의 사용자로부터의 관찰데 의해 트레이닝된 후에 사용자의 짧은 등록을 통하여 얻어지는 관찰로부터 특정 사용자에 적응하거나, 획득된 등록 데이타에 의해 직접 트레이닝된다. 이러한 모델에서 사용되는 특징은 사용자별 특징뿐이다. 제3 양태는 일반 및 사용자별 등록 분류 모델 또는 분류자를 조합하기 위한 시스템 및/또는 방법이다.

도 1에서, 본 발명의 양태에 따른 핸드라이팅 인식 시스템(100)의 블록도가 도시된다. 핸드라이팅 인식 시스템(100)은 적어도 하나의 일반 분류자 컴포넌트(104) 및/또는 적어도 하나의 사용자별 분류자 컴포넌트(106)를 갖는 인식 컴포넌트(102)로 구성된다. 본 발명의 이러한 예에서, 일반 분류자 컴포넌트(104)는 일반 분류자 #1-N(108-112)으로 구성되며, 여기서 N은 1 내지 무한대의 임의의 정수를 나타낸다. 사용자별 분류자 컴포넌트(106)는 사용자별 분류자 #1-M(114-118)으로 구성되며, 여기서 M은 1 내지 무한대의 임의의 정수를 나타낸다. 인식 컴포넌트(102)는 핸드라이팅 데이타(120)를 수신하고 분석한다. 일반 분류자 컴포넌트(104) 및 사용자별 분류자 컴포넌트(106)는 인식 컴포넌트(102)에 의한 분석을 용이하게 하는 데 관련될 수 있다. 본 발명의 일례에서, 일반 분류자 컴포넌트(104)는 사용자들 사이에서 실질적으로 유사한 핸드라이팅 데이타의 분류를 제공하는 데 사용되고, 사용자별 분류자 컴포넌트(106)는 사용자별 데이타의 분류를 결정하는 것을 용이하게 하는 데 사용된다.

본 발명이 핸드라이팅을 효율적으로 분석하도록 하기 위하여, 본 발명은 핸드라이팅 양태를 인식하도록 다양한 데이타 소스로부터 배우거나 "트레이닝"된다. 도 2에서, 본 발명의 양태에 따른 핸드라이팅 관찰 처리(200)의 블록도가 도시된다. 본 발명의 이러한 예에서, 핸드라이팅 관찰 처리(200)는 일반 분류자 #1- N(204-208)를 갖는 일반 분류자 컴포넌트(202) 및 다수의 사용자 #1-X(212-216)로부터의 데이타를 포함하는 핸드라이팅 관찰 데이타(210)로 구성되며, 여기서 N 및 X는 1 내지 무한대의 임의의 정수를 나타낸다. 이러한 처리(200)에서, 일반 분류자 컴포넌트(202)는 다수의 사용자(212-216)로부터의 데이타(210)에 의해 자신의 분류자(204-208)를 트레이닝한다. 일반 분류자 컴포넌트(202)를 트레이닝하기 위해 사용되는 관찰은 일반 특징 및/또는 사용자별 특징으로 구성될 수 있다.

도 3에서, 본 발명의 양태에 따른 핸드라이팅 관찰 처리(300)의 다른 블록도가 도시된다. 본 발명의 이러한 예에서, 핸드라이팅 관찰 처리(300)는 사용자별 분류자 #1-M(304-308)을 갖는 사용자별 분류자 컴포넌트(302), 다수의 사용자 #1-X(312-316)로부터의 데이타를 포함하는 핸드라이팅 관찰 데이타(310) 및 사용자별 등록 데이타(318)로 구성되며, 여기서 M 및 X는 1 내지 무한대의 임의의 정수를 나타낸다. 이러한 처리(300)에서, 사용자별 분류자 컴포넌트(302)는 자신의 분류자(304-308)를 다수의 사용자(312-316)로부터의 데이타(310)에 의해 트레이닝한 후에, 사용자별 등록 데이타(318)에 기초하여 자신의 분류자(304-308)를 적응시킨다. 사용자별 분류자 컴포넌트(302)를 트레이닝하기 위해 사용되는 관찰은 사용자별 특징으로만 구성된다.

도 4를 참조하여, 본 발명의 양태에 따른 핸드라이팅 관찰 처리(400)의 또 다른 블록도가 도시된다. 본 발명의 이러한 예에서, 핸드라이팅 관찰 처리(400)는 사용자별 분류자 #1-M(404-408)을 갖는 사용자별 분류자 컴포넌트(402) 및 사용자별 등록 데이타(410)를 포함하며, 여기서 M은 1 내지 무한대의 임의의 정수를 나타 낸다. 이러한 처리(400)에서, 사용자별 분류자 컴포넌트(402)는 자신의 분류자(404-408)를 사용자별 등록 데이타(410)에 의해 트레이닝한 후에, 사용자별 등록 데이타(410)에 기초하여 자신의 분류자(404-408)를 적응시킨다. 사용자별 분류자 컴포넌트(402)를 트레이닝 하기 위해 사용되는 관찰은 사용자별 특징으로만 구성된다.

도 5에서, 본 발명의 양태에 따른 특징 집합(502)의 다이어그램이 도시된다. 일반 및 사용자별 양태를 갖는 특징 집합의 개념을 더 설명하자면, 특징 집합(502)은 일반 특징 F_g(504) 및 사용자별 특징 F_p(506)로 구성되며, 여기서 아래 첨자 'g'는 임의의 일반 특징을, 'p'는 임의의 사용자별(또는 개인의) 특징을 나타낸다. 사용자별 특징(506)은 하위특징 F_p1-F_pn(508-512)으로 구성된다. 형식적으로, 전체 특징 집합 F=F_g∪F_p1∪F_p2∪...∪F_pn이며, 여기서 F_g는 일반 특징이고, F_pi는 i=1,...,n인 사용자별 특징의 부분집합이다.

이러한 개념은 도 6에서 더 설명되며, 여기서 본 발명의 양태에 따른 핸드라이팅 문자 특징(600)의 다이어그램이 도시된다. 이 도면에서, 문자 "A"(602)는 일반적으로 및 사용자별로 문자 "B"(604)에 교차 분석된다. 본 예에서, 3개의 하위특징(606 및 610), 즉 문자의 모양, 크기 및 위치가 분석된다. 그 후, 임의의 하위특징(606 및 610)이 문자 사이에서 "공통적" 또는 일반적인지를 결정하기 위하여 "A"와 "B" 사이의 비교가 수행된다. F_gA는 "A"의 모양을 나타내고, "B"의 모양을 나타내는 F_gB에 비교된다. 이러한 설명에서, 모양은 일반적인 특징으로 간주되고 "A"와 "B" 사이에서 유일하다. 따라서, 이러한 예에서, 모양 하위특징에 대한 일반적인 분류자는 "A"와 "B" 사이에서 쉽게 식별할 수 있다. 이러한 설명적 목적을 위해, 하위특징 크기 및 위치는 사용자별 특징으로 간주된다. 크기 및 위치가 문자 사이에서 비교될 경우, 그들은 실질적으로 동일하다. 그러므로, "A"의 사용자별 하위특징(608)은 "B"의 사용자별 하위특징(612)도 실질적으로 나타내는 것으로 파악된다. 따라서, 다른 문자의 이러한 특징을 인식하기 위하여, 사용자별 분류자는 문자들 중 하나만을 등록하면 되므로, 해당 문자를 인식하기 위해 요구되는 사용자별 등록 데이타의 양이 감소된다.

짧은 사용자 등록은, 다수의 문자/클래스가 선택된 사용자별 특징에 대하여 실질적으로 유사하지만, 동시에 일반 특징에 대해 실질적으로 구별 가능할 것을 조건으로 한다. 예를 들어, 전술한 핸드라이팅 예에 있어서, "A" 및 "B"는 일반 모양 하위특징을 통해 고려될 때 실질적으로 구별 가능하지만, 크기 및 위치만 고려될 때는 실질적으로 동일하게 보인다. 따라서, 적응가능한 사용자별 모델을 학습할 때, "A"에 대한 관찰은 "B"에 대한 관찰만큼 양호하므로, 모든 문자에 적용하는 데 더 적은 관찰이 요구되는 것이다. 이러한 개념은 "연계(tying)"로서 표시되며, 함께 연계되는 클래스/문자는 "연계 집합"으로서 표시된다. 빈번하게, 사용자별 특징을 다수의 특징 집합으로 분류하는 것이 바람직하다. 이러한 특징의 상이한 부분집합 또는 하위특징은 상이하게 작용한다. 예를 들어, "f" 및 "g"는 크기 특 징에 대해서는 실질적으로 동일하게 보일 수 있지만, 위치 특징에 대해서는 실질적으로 상이하다.

도 7에서 도시되는 바와 같이, 사용자별 특징의 상이한 부분집합는 고려 중인 클래스/문자에 대한 상이한 연계 집합으로 귀착할 수 있다. 이러한 도면에서, 본 발명의 한 양태에 따른 연계 집합의 다이어그램(700)이 도시된다. 다이어그램(700)은 클래스/문자 열(702), F_p1 연계 특징 클래스(704) 및 F_p2 연계 특징 클래스(706)로 구성된다. 다이어그램(700)은 다양한 클래스/문자와 관련된 사용자별 하위특징 F_p1 및 F_p2 간의 관계를 도시한다. 클래스/문자는 숫자 0-9로서 나타나지만, 글자 등이 될 수 있다. 다이어그램(700)으로부터, F_p1 연계 특징 클래스(704)가 제1 및 제2 F_p1연계 집합(714 및 716)으로 구성되는 것이 보여진다. 제1 F_p1 연계 집합(714)은 F_p1에 의해 나타나는 사용자별 하위특징의 양태를 위해 클래스/문자 0-5를 함께 연결한다. 제2 F_p1 연계 집합(716)은 F_p1에 의해 나타나는 사용자별 하위특징의 다른 양태를 위해 클래스/문자 6-9를 연결한다. 이것은 특정 사용자를 위한 이러한 하위특징에 대한 더 제한된 등록 요구를 허용한다. 따라서, 특정 사용자는 F_p1 하위특징 등록 데이타에게 특정 연계 집합 내의 단 하나의 클래스/문자를 제공하기만 하면 된다. 이와 같이, F_p2 연계 특징 클래스(706)는 제1, 제2 및 제3 F_p2 연계 집합(718-722)으로 구성된다. 제1 F_p2 연계 집합(718)은 F_p2에 의해 나타나는 사용자별 하위특징의 양태를 위해 클래스/문자 0-2를 함께 연결한다. 제2 F_p2 연계 집합(720)은 동일한 하위특징의 다른 양태를 위해 클래스/문자 3-8을 함께 연결한다. 제3 F_p2 연계 집합(722)은 클래스/문자 9만 포함한다. 단 2개의 하위특징 클래스만 도시되었지만, 본 발명에서는 어떠한 임의의 수의 하위특징 클래스라도 가능하다. 마찬가지로, 각각의 클래스 내의 연계 집합의 수는 도시된 것보다 더 많거나 적을 수 있다. 클래스가 단 하나의 연계 집합을 갖는 것도 가능하다. 선(708-712)은 F_p1및 F_p2내의 연계 집합에 따른 클래스/문자의 가장 미세한 입도의 파티션을 나타낸다. 따라서, 선(710)은 F_p1에 의해 야기되는 파티션을 나타내는 한편, 선(708 및 712)은 F_p2 클래스에 의해 야기되는 파티션을 나타낸다. 이것은 이하에 논의되는 소정의 소형 포스트-프로세서를 위해 사용된다.

연계 집합을 더 설명하기 위하여, 도 8은 본 발명의 양태에 따른 문자의 그룹을 위한 연계 집합의 예(800)를 나타낸다. 예(800)는 문자 열(802), F_p1 연계 특징(높이) 열(804) 및 F_p2 연계 특징(넓이) 열(806)로 구성된다. 이러한 예(800)는 문자 열(802) 내의 핸드라이팅 샘플 문자 "a", "c", "b", "d" 및 "l"를 도시한다. F_p1 연계 특징(높이) 열(804)은 동일한 연계 집합을 동일한 숫자로 나타낸다. 따라서, 숫자 "1"을 갖는 임의의 행은 동일한 F_p1 연계 특징(높이) 열(804)에서 숫자 "1"을 가진 임의의 다른 행과 동일한 하위특징을 갖는다는 것을 나타낸다. F_p1 높 이 특징 열(804)로부터, "a" 및 "c"가 연계 집합 "1" 내에 있고, "b", "d" 및 "l"은 연계 집합 "2" 내에 있다는 것이 분명하다. 이것은 문자 높이의 하위특징에 있어서, "a" 및 "e"가 실질적으로 유사한 높이 특성을 갖는다는 것을 나타내는 한편, "b", "d" 및 "l"이 실질적으로 유사한 높이 특성을 갖는다는 것을 나타낸다. 그러므로, 하나의 "b"만을 포함하는 등록 샘플은 "d" 및 "l"의 높이 하위특징 특성을 제공하는 데도 사용될 수 있어 하위특징에 대해 요구되는 등록 데이타를 감소시킨다. "a" 및 "c"에 대한 높이 하위특징에 대해서도 동일하게 성립된다. 이러한 문자 중 하나는 나머지 하나의 높이 하위특징을 구성하는 데 사용될 수 있다.

유사한 처리가 F_p2 연계 특징 (넓이) 열(806)에 적용될 수 있다. 여기서, 연계 집합의 동일한 구성원은 대문자 "A" 또는 대문자 "B"에 의해 나타난다. 이것으로부터, 문자 "a", "c", "b" 및 "d"는 실질적으로 유사한 넓이 특성을 갖고 집합적으로 연계 집합 "A"를 나타내는 반면, 문자 "l"은 유일한 문자 넓이를 갖고 따라서 연계 집합 "B" 내의 유일한 문자라는 것을 확인할 수 있다. 다시 한번, 이러한 특정 사용자에 대한 등록 데이타는, 동일한 연계 집합 내의 임의의 문자에 대한 넓이를 구성하는 연계 집합 내의 하나의 문자 예만 포함하면 되므로, 요구되는 등록 데이타를 감소시킨다.

본 발명의 효율은, 사용자별 특징에 있어서는 구별가능하지만 일반 특징에 있어서는 유사한 (또는 "혼동가능한") 일부 클래스/문자에도 의존한다. 예를 들어, "c" 및 "C"는 스케일된 모양 특징에 대하여 실질적으로 유사해 보이지만 특정 사용자에게 있어서 크기 및 위치 특징에 대하여 실질적으로 구별가능하다. 그러한 클래스/문자를 위해 "혼동 규칙"이 정의된다. 혼동 규칙은 클래스/문자를 일반 분류자가 혼동할 수 있는 클래스/문자의 집합과 관련시킨다. 혼동 규칙의 예는 c-{C}, C-{c} 및 9-{q,g}이며, 이들은 각각 다음과 같은 의미를 갖는다. 일반 분류자에 의해 'c'로서 식별되면, 그것은 "C"일 가능성도 있다. 일반 분류자에 의해 "C"로서 식별되면, "c"일 가능성도 있다. 일반 분류자에 의해 9로서 식별되면, "q" 또는 "g"일 가능성도 있다. 클래스/문자는 혼동 규칙 집합의 좌변부에 최대 한번만 나타나야 한다.

도 9와 관련하여, 본 발명의 양태에 따른 혼동 규칙(900)의 설명이 전술한 예에 대하여 도시된다. 다양한 혼동 규칙의 좌변부(902) 및 우변부(904)를 포함하는 규칙(906-910)의 집합이 도시된다. 좌변부(902)는 일반적으로 일반 분류자에 의해서 혼동될 수 있는 문자를 나타낸다. 우변부(904)는 일반적으로 좌변부(902)로부터의 혼동시키는 문자와 실질적으로 유사한 문자를 나타낸다. 규칙의 집합 내의 규칙 수는 규칙 "Z"에 의해 나타나는 것과 같이 임의의 수가 될 수 있으며, 여기서 Z는 1 내지 무한대의 임의의 정수를 나타낸다. 예를 들어, 규칙 "Z"는 사용자가 "9"를 기록할 때 일반 분류자가 혼동될 수 있는 것도 설명한다. 규칙 "Z"는 "9"가 "q" 또는 "g"일 수도 있다는 것을 나타낸다. 이와 같이, 규칙 "1"(906) 및 "2"(908)는 "c" 및 "C"가 충돌될 때 앞에서 설명된 대로 따르는 규칙을 나타낸다.

본 발명에서, 각각의 규칙에 대한 작은 2원 분류자는, 문자가 규칙의 좌변 또는 우변에 있는지를 판별하도록 구성된다. 일반 분류자가 규칙의 좌변에서 나타 나는 분류를 수행한다면, 작은 사용자별 2원 분류자가 개입하여, 분류가 정확한지 또는 규칙의 우변의 문자일 수 있는지를 판별한다. 이러한 분류가 우변으로서 판명되면 2가지 가능성이 있을 수 있다. 규칙의 우변이 단 하나의 클래스/문자로 구성되어 있다면, 본래의 분류는 이 클래스/문자로서 파기(overrule)되고, 규칙의 우변이 복수의 클래스/문자로 구성되어 있다면, 본래의 일반 분류자는 이러한 가능성들 중 정확한 문자를 결정하는 것이 허용된다.

도 10에서, 본 발명의 양태에 따른 사용자별 분류자의 예(1000)의 블록도가 도시된다. 등록 모델의 상이한 유형이 핸드라이팅 인식 시스템의 분류를 용이하게 하는 작은 포스트-프로세서 분류자 또는 "2원" 분류자로서 본 발명에서 사용될 수 있다. 본 발명의 이러한 예에서, 예(1000)는 사용자별 분류자 컴포넌트(1002) 및 MLLR 적응 밀도 모델(1004), 직접 밀도 모델(1006), 직접 식별 모델(1008) 및 모델 "Y"(1010)을 포함하는 데이타를 분류하기 위한 다양한 모델로 구성되며, 여기서 Y는 사용자별 분류자 컴포넌트(1002)를 위해 요구되는 기능을 제공하는 데 사용될 수 있다. MLLR 적응 밀도 모델(1004)은 혼동 규칙의 각각의 문자를 위한 밀도 모델을 구성하고, 문자 밀도 모델을 등록 데이타를 사용하는 특정 사용자에게 적응하고, 적응된 모델을 2원 분류를 결정하는 데 사용하는 기능을 제공한다. 이러한 밀도 모델은 규칙과 관련된 F_pi 내의 특징을 위해 구성되고, 일반적으로 대각선 및/또는 완전한 공분산 매트릭스를 갖는 가우스의 혼합이다. 레게터&우드랜드(Leggetter&Woodland)(1994){캠브리지 대학 공과대 및 개일즈&우드랜드(1996)의 학술 조사 보고서인 '선형 회귀를 사용하는 HMM의 스피커 적응', 캠브리지 대학 공과대의 학술 조사 보고서인 'MLLR 프레임워크 내의 의미 및 변화 적응'}에서, 이러한 모델을 특정 사용자에 대한 짧은 등록 기간을 통하여 얻어진 데이타에 기초하여 그 사용자에 적응시키는 것으로 설명되는 바와 같이, 최대 우도 선형 회귀 방법(maximum likelihood linear regression method)은 이러한 기능을 위하여 사용될 수 있다. 연계 집합의 구현으로 인하여, 필요한 데이타 양은 적다. 적응된 모델은 혼동 규칙을 위한 2원 분류를 결정하기 위해 사용된다. 일례의 밀도가 혼동 규칙의 우변보다 혼동 규칙의 좌변에 대해서 더 크다면, 그것은 좌변 분류이다. 그렇지 않으면, 그것은 우변 분류이다. 본 발명의 또 다른 예에서, 적응된 사용자별 모델에 대한 우도는 예를 들어 승산 처리를 통해 일반 모델과 결합될 수 있다.

직접 밀도 모델(1006)은 사용자별 하위특징의 집합 F_pi의 각각의 연계 집합을 위한 밀도 모델을 구축하고 혼동 규칙을 위한 2원 분류를 결정하기 위해 연계 집합 밀도 모델을 사용하는 기능을 제공한다. 밀도 모델은 연계되어 있는 모든 문자에 대한 등록 데이타를 사용하는 각각의 연계 집합을 위해 구성된다. 개별 밀도 모델은 연계 집합이 정의되는 특징을 위해 구축된다. 이러한 모델은 2원 분류를 위해 사용된다. 규칙에 관련된 사용자별 특징 집합 F_pi에 대하여, 혼동 규칙의 좌변에 있는 클래스/문자는 혼동 규칙의 우변에 있는 클래스/문자와 동일한 연계 집합 내에 존재하지 않아야 한다. 본 발명의 또 다른 예에서, 모델에 대한 우도는 예를 들어 승산 처리를 통해 일반 모델과 결합될 수 있다.

직접 식별 모델(1008)은 관찰된 등록 데이타를 사용하는 분류자 모델을 제공하고 혼동 규칙을 위한 2원 분류를 결정하기 위해 분류자 모델을 생성한다. 클래스/문자에 대한 데이타가 개별 사용자별 특징을 위한 연계 집합의 세부 파티션에 따라 연계되는 등록 데이타를 사용하는 분류자가 구축된다. 도 7의 선(708-712)을 참조한다. 연계 집합 및 혼동 규칙은 혼동 규칙의 좌변의 클래스/문자가 혼동 규칙의 우변의 클래스/문자와 동일한 연계 집합 내에 있지 않다는 것을 확인하는 방법으로 구성되어야 한다. 이러한 모델은 포스트-프로세서 분류를 위해 사용된다.

유사하게, 모델 "Y"(1010)은 등록 데이타를 사용하는 분류자를 구축하고 2원 분류를 결정하기 위해 분류자 모델을 구성하기 위한 기능을 제공하는 추가적인 모델을 나타낸다. "Y"는 요구되는 기능을 제공할 수 있는 1 내지 무한대의 임의의 수의 모델을 나타낸다.

앞에서 도시된 설명되는 예시적인 시스템의 관점에서, 본 발명에 따라 구현될 수 있는 방법론은 도 11-13의 흐름도를 참조하여 더 잘 이해될 것이다. 간단히 설명하기 위하여 방법론이 일련의 블록으로서 도시되고 설명되지만, 본 발명은 블록의 순서에 의해 제한되지 않으며, 본 발명에 따르면 일부 블록은 상이한 순서로 그리고/또는 여기서 도시되고 설명되는 것과 다른 블록과 동시에 함께 발생할 수 있다는 것을 이해하고 알것이다. 더욱이, 모든 설명된 블록이 본 발명에 따른 방법론을 구현하는 데 요구되는 것이 아닐 수 있다.

본 발명은 프로그램 모듈과 같은 컴퓨터 실행가능 명령의 일반적인 문맥에서 설명되고 하나 이상의 컴포넌트에 의해 실행될 수 있다. 일반적으로, 프로그램 모 듈은 특정 태스크를 수행하거나 특정 추상 데이타 타입을 구현하는 루틴, 프로그램, 오브젝트, 데이타 구조 등을 포함한다. 일반적으로, 프로그램 모듈의 기능은 다양한 구현에서 요구되는 대로 결합되거나 분배될 수 있다.

도 11에서, 본 발명에 따른 핸드라이팅 인식 시스템을 구성하는 방법(1100)의 흐름도를 도시한다. 방법(1100)은 다수의 사용자로부터의 핸드라이팅 데이타를 사용하는 적어도 하나의 일반 분류자를 구축함(1104)으로써 시작(1102)한다. 일반 분류자에 의해 사용되는 데이타는 일반 특징 및/또는 사용자별 특징을 포함할 수 있다. 일반 분류자는 일반적으로 핸드라이팅 데이타를 분류하기 위한 제1 프로세서로서 사용된다. 본 발명의 다른 예에서, 이러한 기능은 기존 시스템에 의해서 제공된다. 특정 사용자로부터의 데이타를 사용하는 일반 분류자는 적응(1106)될 수 있다. 본 발명의 다른 예에서, 이러한 방법으로 일반 분류자를 적응시키는 것은 옵션이다. 특정 사용자, 또는 특정 사용자와 다수의 사용자 양자로부터의 핸드라이팅 데이타를 사용하여 각각의 연계 특징의 클래스에 대한 사용자별 분류자가 구성(1108)된다. 일반 및 사용자별 분류자는 결합(1110)되고 흐름도(1112)는 종료한다. 본 발명의 일례에서, 예를 들어 결합된 분류자는 이하와 같이 사용된다. 일반 분류자가 규칙의 좌변에서 나타나는 분류를 수행하면, 사용자별 분류자가 개입하여, 분류가 정확한지 또는 규칙의 우변의 문자일 수 있는지를 결정한다. 이러한 분류가 우변으로 판명되면, 2가지 가능성이 존재할 수 있다. 규칙의 우변이 단 하나의 클래스/문자로 구성되어 있다면, 본래의 분류는 이 클래스/문자로서 파기되고, 규칙의 우변이 복수의 클래스/문자로 구성되어 있다면 본래의 일반 분류자는 이러한 가능성들 중 정확한 문자를 결정하는 것이 허용된다.

도 12에서는, 본 발명의 양태에 따른 핸드라이팅 인식 시스템을 사용하는 방법(1200)의 흐름도가 도시된다. 방법(1200)은 제1 및 제2 부분을 갖는 혼동 규칙을 수립함(1204)으로써 시작(1202)한다. 혼동 규칙은 혼동 규칙 내에 속해있는 클래스/문자의 분류에 관하여 안내한다. 제1 및 제2 분류를 갖는 2원 분류자는 각각의 혼동 규칙에 제공(1206)된다. 이것은 일반 분류자가 혼동할 때 사용자별 분류자가 클래스/문자 분류를 더 용이하게 하는 것을 허용한다. 일반 분류자는 핸드라이팅 샘플의 분류를 결정하는 데 사용된다(1208). 분류가 제1 분류에 포함되는 지에 대한 결정이 수행된다. 제1 분류는 일반적으로 혼동 규칙의 제1 부분(예를 들어, 좌변부)을 나타낸다. 포함되지 않는다면, 일반 분류자에 의한 분류가 수용되고(1212) 흐름도를 종료(1214)한다. 그러나, 그것이 제1 분류 내에 있다고 결정되면, 혼동 규칙의 제2 부분(예를 들어, 우변부)이 하나 이상의 문자(1216)를 포함하는 지에 대한 결정(1216)이 수행된다. 규칙의 우변이 하나의 클래스/문자만 포함한다면, 본래의 분류는 이 클래스/문자로서 파기되고(1220) 흐름도를 종료(1214)한다. 그러나, 규칙의 우변이 다수의 클래수/문자로 구성되어 있다면, 본래의 일반 분류자는 이러한 가능성 중에 정확한 문자를 결정하는 것이 허용(1218)되고, 흐름도를 종료(1214)한다.

도 13을 보면, 본 발명의 양태에 따른 사용자별 데이타를 분류하기 위한 방법(1300)을 구성하는 흐름도가 설명된다. 본 발명은 혼동 규칙을 지원하는 2원 분류자를 제공하는 임의의 방법을 사용할 수 있다. 도 13은 본 발명에 의해 사용가능한 일부 예를 설명한다. 방법(1300)은 MLLR 기반 방법이 사용되는 지에 대한 결정(1304)으로 시작(1302)한다. MLLR 기반 방법이 사용된다면, 혼동 규칙에서 나타나는 각각의 문자에 대하여 다수의 사용자가 트레이닝하는 데이타에 기초하여 밀도 모델이 구성된다(1312). 이 밀도 모델은 F_pi관련 규칙 내의 특징을 위하여 구성되며 일반적으로 대각선 또는 완전한 공분산 매트릭스를 갖는 가우스의 혼합이다. 레게터&우드랜드(Leggetter&Woodland)(1994) 및 개일즈&우드랜드(1996)에서 설명되는 것과 같은 최대 우도 선형 회귀(MLLR) 방법은, 밀도 모델을 특정 사용자에 대한 짧은 등록 기간을 통하여 얻어진 데이타에 기초하여 그 사용자에 적응시키는 데 사용되고(1314) 흐름도를 종료(1310)한다. 요구되는 데이타의 양은 연계 집합을 사용하기 때문에 작다. 적응된 밀도 모델은 혼동 규칙을 위한 2원 분류자로서 사용가능하다. 그러나, MLLR이 사용되지 않는다면(1304), 직접 밀도 모델이 사용되는 지에 대한 결정(1306)이 수행된다. 직접 밀도 모델이 사용된다면, 연계되어 있는 모든 문자를 위한 등록 데이타를 사용하는 각각의 연계 집합에 대하여 밀도 모델이 구성되고(1316), 흐름도를 종료(1310)한다. 규칙에 관한 사용자별 특징 집합 F_pi에 대하여, 혼동 규칙의 좌변의 클래스/문자는 혼동 규칙의 우변의 클래스/문자와 동일한 연계 집합 내에 있으면 안된다. 이 밀도 모델은 혼동 규칙을 위한 2원 분류자로서 사용된다. 그러나, 직접 밀도 모델이 사용되지 않는다면(1306), 직접 식별 모델이 사용되는 지에 대한 결정이 수행(1308)된다. 직접 식별 모델이 사용된다면, 등록 데이타를 사용하여 개별 사용자별 특징에 대한 연계 집합의 미세 파티션에 따라 클래스/문자에 대한 데이타가 묶여지는 분류자가 구성되고(1318), 흐름도는 종료(1310)한다. 실질적으로, 연계 집합 및 혼동 규칙은, 혼동 규칙의 좌변의 클래스/문자가 혼동 규칙의 우변의 클래스/문자와 동일한 연계 집합 내에 존재하지 않도록 구성되어야 한다. 이 모델은 혼동 규칙에 대한 2원 분류자로서 사용된다. 그러나, 직접 식별 모델이 사용되지 않는다면(1308), 흐름도를 종료(1310)한다. 흐름도의 종료(1310)는 추가적인 모델을 본 발명에 의해 사용되는 것으로부터 배제하지 않는다. 그것은 전술한 본 발명의 이러한 예에 대하여 논의된 3개의 모델링 방법의 가능성의 종료를 나타낼 뿐이다.

본 발명의 다양한 양태를 구현하는 데 추가적인 문맥을 제공하기 위하여, 도 14 및 이하의 논의는 본 발명의 다양한 양태가 구현될 수 있는 적합한 컴퓨팅 환경(1400)에 대한 간략하고 일반적인 설명을 제공하고자 한다. 본 발명이 로컬 및/또는 원격 컴퓨터 상에서 실행하는 컴퓨터 프로그램의 컴퓨터 실행가능한 명령의 일반적인 문맥에서 전술된 반면, 본 분야에 숙련된 기술자는 본 발명이 다른 프로그램 모듈과의 조합에서도 구현될 수 있다는 것을 인식할 것이다. 일반적으로, 프로그램 모듈은 특정 태스크를 수행하고/수행하거나 특정 추상 데이타 타입을 구현하는 루틴, 프로그램, 컴포넌트, 데이타 구조 등을 포함한다. 더욱이, 본 분야에 숙련된 기술자는 이 독창적인 발명이 단일 프로세서 또는 다중 프로세서 컴퓨터 시스템, 미니컴퓨터, 메인프레임 컴퓨터 뿐만 아니라 각각이 하나 이상의 관련 장치와 효과적으로 통신할 수 있는 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 장치, 마이크로 프로세서 기반 및/또는 프로그램가능한 가전 제품 등을 포함하는 다른 컴퓨터 시스 템 구성과 함께 실행될 수 있다는 것을 알 것이다. 본 발명의 설명된 양태는 특정 태스크가 통신 네트워크를 통하여 링크된 원격 프로세싱 장치에 의해 수행되는 분산 컴퓨팅 환경에서도 실행될 수 있다. 그러나, 본 발명의 전체가 아닌 일부 양태는 자립형 컴퓨터 상에서 실행될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및/또는 원격 메모리 저장 장치 내에 위치할 수 있다.

이 어플리케이션에서 사용되는 용어 "컴포넌트"는 하드웨어, 소프트웨어, 하드웨어와 소프트웨어의 조합, 또는 실행 중인 소프트웨어인 컴퓨터 관련 엔터티를 설명하고자 하는 것이다. 예를 들어, 컴포넌트는 프로세서 상에서 실행 중인 프로세스, 프로세서, 오브젝트, 실행, 실행 쓰레드, 프로그램 및 컴퓨터일 수 있으나 이것으로 제한되는 것은 아니다. 예를 들어, 서버와 그 서버 상에서 실행 중인 어플리케이션은 컴포넌트일 수 있다. 또한, 컴포넌트는 하나 이상의 서브컴포넌트를 포함할 수 있다.

도 14에 관련하여, 본 발명의 다양한 양태를 구현하기 위한 예시적인 시스템 환경(1400)은 시스템 메모리를 포함한 다양한 시스템 컴포넌트를 프로세싱 유닛(1404)에 연결하는 시스템 버스(1408), 프로세싱 유닛(1404) 및 시스템 메모리(1406)를 포함하는 통상적인 컴퓨터(1402)를 포함한다. 프로세싱 유닛(1404)은 임의의 상업적으로 사용가능하거나 독점적인 프로세서일 수 있다. 더욱이, 프로세싱 유닛은 병렬로 연결될 수 있는 것과 같이 하나 이상의 프로세서로 형성된 다중 프로세서로서 구현될 수 있다.

시스템 버스(1408)는 PIC, VESA, 마이크로채널, ISA 및 EISA와 같은 다양한 통상적인 버스 아키텍처 중 임의의 것을 사용하는 로컬 버스, 메모리 버스 또는 메모리 제어기 및 주변장치 버스를 포함하는 다양한 유형의 버스 구조 중 임의의 것이 될 수 있다. 시스템 메모리(1406)는 ROM(read only memory)(1410) 및 RAM(random access memory)(1412)을 포함한다. 컴퓨터(1402) 내의 요소들 사이의 정보를 전달하는 것을 돕는 시작 동안과 같은 기본 루틴을 포함하는 기본 입/출력 시스템(BIOS)(1414)은 ROM(1410) 내에 저장된다.

예를 들어, 컴퓨터(1402)는 하드 디스크(1016), 예를 들어 분리형 디스크(1420)로부터 판독하거나 분리형 디스크(1420)에 기록하는 자기 디스크 드라이브(1418) 및 예를 들어 CD-ROM 디스크(1424) 또는 기타 광 매체로부터 판독하거나 CD-ROM 디스크(1424) 또는 기타 광 매체에 기록하기 위한 광 디스크 드라이브도 포함할 수 있다. 하드 디스크 드라이브(1416), 자기 디스크 드라이브(1418) 및 광 디스크 드라이브(1422)는 각각 하드 디스크 드라이브 인터페이스(1426), 자기 디스크 드라이브 인터페이스(1428) 및 광 드라이브 인터페이스(1430)에 듸해 시스템 버스(1408)에 연결된다. 드라이브(1416-1422) 및 그와 관련된 컴퓨터 판독가능한 매체는 컴퓨터(1402)에 데이타, 데이타 구조, 컴퓨터 실행가능한 명령 등의 비휘발성 저장 장치를 제공한다. 컴퓨터 판독가능한 매체에 대한 전술은 하드 디스크, 분리형 자기 디스크 및 CD를 의미하지만, 본 분야에 숙련된 기술자는, 자기 카집합, 플래시 메모리 카드, 디지털 비디오 디스크, 베르누이 카트리지 등과 같은 컴퓨터에 의해 판독가능한 다른 유형의 매체도 예시적인 오퍼레이팅 환경(1400)에서 사용될 수 있고, 더 나아가 임의의 그러한 매체는 본 발명의 방법을 수행하기 위한 컴퓨터 실행가능한 명령을 포함할 수 있다는 것을 알 것이다.

다수의 프로그램 모듈은 드라이브(1416-1422) 및 오퍼레이팅 시스템(1432), 하나 이상의 어플리케이션 프로그램(1434), 기타 프로그램 모듈(1436) 및 프로그램 데이타(1438)를 포함하는 RAM(1412) 내에 저장될 수 있다. 오퍼레이팅 시스템(1432)은 임의의 적합한 오퍼레이팅 시스템 또는 오퍼레이팅 시스템의 조합이 될 수 있다. 예를 들어, 어플리케이션 프로그램(1434)은 본 발명의 양태에 따른 적응성 핸드라이팅 인식 시스템을 포함할 수 있다.

사용자는 키보드(1440) 및 포인팅 장치{예를 들어, 마우스(1442)}와 같은 하나 이상의 사용자 입력 장치를 통하여 컴퓨터(1402)에 명령 및 정보를 입력할 수 있다. 기타 입력 장치(도시되지 않음)는 마이크로폰, 조이스틱, 게임 패드, 위성 접시, 무선 리모트, 스캐너 등을 포함할 수 있다. 이러한 및 기타 입력 장치는 종종 시스템 버스(1408)에 연결된 직렬 포트 인터페이스(1444)를 통하여 프로세스 유닛(1404)에 접속되지만, 병렬 포트, 게임 포트 또는 유니버설 시리얼 포트(USB)와 같은 다른 인터페이스에 의해 접속될 수 있다. 모니터(1446) 또는 기타 유형의 디스플레이 장치도 비디오 어댑터(1448)와 같은 인터페이스를 통하여 시스템 버스(1408)에 접속될 수 있다. 모니터(1446) 뿐만 아니라, 컴퓨터(1402)는 스피커, 프린터 등과 같은 기타 주변장치 출력 장치(도시되지 않음)를 포함할 수 있다.

컴퓨터(1402)가 하나 이상의 원격 컴퓨터(1406)로의 논리적 접속을 사용한 네트워크화된 환경에서 동작할 수 있다는 것은 이해될 것이다. 원격 컴퓨터(1460)는 워크스테이션, 서버 컴퓨터, 라우터, 동등 장치 또는 기타 일반적인 네트워크 노드가 될 수 있으며, 간단히 설명하기 위하여 메모지 저장 장치(1462)만 도 14에서 도시되지만 일반적으로 컴퓨터(1402)에 관하여 설명된 요소 모두 또는 다수를 포함한다. 도 14에서 도시된 논리적인 접속은 LAN(local area network)(1464) 및 WAN(wide area network)(1466)을 포함할 수 있다. 그러한 네트워킹 환경은 사무실, 기업-형 컴퓨터 네트워크, 인트라넷 및 인터넷에서 흔하다.

LAN 네트워킹 환경에서 사용될 때, 예를 들어 컴퓨터(1402)는 네트워크 인터페이스 또는 어댑터(1468)를 통해 로컬 네트워크(1464)에 접속된다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(1402)는 일반적으로 모뎀(예를 들어, 텔레폰, DSL, 케이블 등)(1470)을 포함하거나, LAN 상의 통신 서버에 접속되거나, 인터넷과 같은 WAN(1466) 상의 통신을 수립하기 위한 기타 수단을 가질 수 있다. 컴퓨터(1402)에 관하여 내부 또는 외부적일 수 있는 모뎀(1470)은 직렬 포트 인터페이스(1444)를 통하여 시스템 버스(1408)에 접속된다. 네트워크화 된 환경에서, 프로그램 모듈{어플리케이션 프로그램(1434)을 포함하여} 및/또는 프로그램 데이타(1438)는 원격 저장 장치(1462) 내에 저장 될 수 있다. 도시된 네트워크 접속은 예시적인 것이며 본 발명의 양태를 수행할 때 컴퓨터(1402 및 1460) 사이의 통신 연결을 수립하는 기타 수단(예를 들어, 유선 또는 무선)이 사용될 수 있다는 것이 이해될 것이다.

컴퓨터 프로그래밍 분야에 숙련된 기술자의 습관에 따라서, 본 발명은 컴퓨터(1402) 또는 원격 컴퓨터(1460)과 같은 컴퓨터에 의해 수행되는 동작의 행위 및 상징적 표현에 대하여 설명되었다. 그러한 행위 및 동작은 때때로 컴퓨터 실행되는 것으로서 나타난다. 행위 및 상직적으로 표현되는 동작은, 전자 신호 표현의 결과적 변형 또는 삭감을 유발하는 데이타 비트를 나타내는 전자 신호의 프로세싱 유닛(1404)에 의한 처리, 및 그것에 의해 형성하거나 그렇지 않으면 시그널의 다른 프로세싱 뿐만 아니라 컴퓨터 시스템의 동작을 바꾸기 위하여 메모리 시스템{시스템 메모리(1406), 하드 드라이브(1416), 플로피 디스크(1420), CD-ROM(1424) 및 원격 메모리(1462)를 포함하는} 내의 메모리 위치에서의 데이타 비트의 보존을 포함한다. 그러한 데이타 비트가 보존되는 메모리 위치는 데이타 비트에 대응하여 특정 전자, 자기 또는 광 속성을 갖는 물리적 위치이다.

도 15는 본 발명이 상호 작용할 수 있는 샘플 컴퓨팅 환경(1500)의 다른 블록도이다. 시스템(1500)은 하나 이상의 클라이언트(1502)를 포함하는 시스템을 더 설명한다. 클라이언트(들)(1502)는 하드웨어 및/또는 소프트웨어(예를 들어, 쓰레드, 프로세스, 컴퓨팅 장치)일 수 있다. 시스템(1500)은 하나 이상의 서버(1504)도 포함할 수도 있다. 서버(들)(1504)도 하드웨어 및/또는 소프트웨어(예를 들어, 쓰레드, 프로세스, 컴퓨팅 장치)일 수 있다. 서버(1504)는 예를 들어 본 발명을 사용함으로써 변형을 수행하는 쓰레드를 수용할 수 있다. 클라이언트(1502)와 서버(1504) 간의 한가지 가능한 통신은 둘 이상의 컴퓨터 프로세스 간에 전달되는 데 적응된 데이타 패킷 형태 일 수 있다. 시스템(1500)은 클라이언트(들)와 서버(들) 강의 통신을 용이하게하는 데 사용될 수 있는 통신 프레임워크(1508)를 포함한다. 클라이언트(들)(1502)은 클라이언트(들)(1502)에게 로컬인 정보를 저장하는 데 사용될 수 있는 하나 이상의 클라이언트 데이타 저장(들)(1510)에 동작 가능하게 연결된다. 마찬가지로, 서버(들)(1504)는 서버(1504)에게 로컬인 정보를 저장하는 데 사용될 수 있는 하나 이상의 서버 데이타 저장(들)(1506)에 동작 가능하게 연결된다.

본 발명의 일례에서, 핸드라이팅 데이타를 분류하기 위하여 일반 분류자 및 사용자별 분류자를 사용하는 핸드라이팅 인식 시스템으로부터의 핸드라이팅 관련 정보를 적어도 일부 포함하는 데이타 패킷을 가지고 핸드라이팅 인식을 용이하게 하는 둘 이상의 컴퓨터 컴포넌트 간에 데이타 패킷이 전달된다.

본 발명의 다른 예에서, 핸드라이팅 인식을 용이하게 하기 위하여 시스템의 컴퓨터 실행가능 컴포넌트를 저장하는 컴퓨터 판독가능 매체는, 핸드라이팅 데이타를 분류하기 위하여 서로에 대하여 동작가능한 일반 분류자 및 사용자별 분류자를 적어도 일부 포함하는 핸드라이팅 인식 시스템으로 구성된다.

장치, 시스템 및/또는 본 발명의 방법이 컴퓨터 컴포넌트 및 논-컴퓨터 관련 컴포넌트와 유사한 것을 용이하게 하기 위한 핸드라이팅 인식 스킴에서 사용될 수 있다는 것은 이해될 것이다. 더욱이, 본 분야에 숙련된 기술자는 본 발명의 시스템 및/또는 방법이 컴퓨터, 서버 및/또는 핸드헬드 전자 장치 등을 포함하는 다수의 전자 관련 기술에서 사용될 수 있으며 이것으로 제한되는 것은 아님을 인식할 것이다.

전술한 것은 본 발명의 예를 포함한다. 물론 본 발명을 설명하기 위하여 컴포넌트 또는 방법론의 상상할 수 있는 모든 조합을 설명하는 것은 불가능하지만, 본 분야에 통상의 기술을 가진 자는 본 발명의 다수의 심층 조합 및 변경이 가능하다는 것을 인식할 수 있다. 따라서, 본 발명은 첨부 청구항의 취지 및 범주 내에 포함되는 모든 그러한 변경, 수정 및 변화를 포함하고자 한다. 더욱이, 용어 "포함한다"는, 상세한 설명 또는 청구항 내에서 사용되는 한, 청구항에서 전환어로서 사용될 때의 "포함하는"이 해석되는 것과 마찬가지로, 포괄적이도록 의도된 것이다.

특징은 사용자가 특정 연계 집합의 모든 문자를 입력할 필요없이 해당 연계 집합 내의 다른 문자들에 외삽될 수 있어서, 본 발명의 분류자를 트레이닝하기 위한 등록 기간이 실질적으로 감소되는 것을 허용하고, 인식 정확도를 여전히 유지하면서 핸드라이팅 인식 분류자를 트레이닝하는 사용자의 노력 및 시간을 감소시킨다.

Claims

적응성 핸드라이팅 인식(adaptive handwriting recognition)을 용이하게 하는 시스템에 있어서,

핸드라이팅 데이타를 수신하는 컴포넌트; 및

상기 핸드라이팅 데이타를 그것의 인식과 관련하여 분석하는 인식 컴포넌트를 포함하고,

상기 인식 컴포넌트는 상기 분석과 관련하여 적어도 하나의 일반 분류자(generic classifier) 및 적어도 하나의 사용자별 분류자(user-specific classifier)를 사용하고, 상기 적어도 하나의 일반 분류자에 대하여 적어도 하나의 혼동 규칙(confusion rule)이 수립되고, 상기 적어도 하나의 혼동 규칙 각각은 제1 문자를 상기 적어도 하나의 일반 분류자에 대하여 상기 제1 문자와 혼동 가능한 하나 이상의 제2 문자의 집합과 관련시키고, 상기 적어도 하나의 혼동 규칙 각각은 적어도 제1 부분 및 제2 부분을 가지며, 상기 제1 부분은 상기 제1 문자를 정의(define)하고, 상기 제2 부분은 상기 하나 이상의 제2 문자의 집합을 정의하고, 상기 적어도 하나의 일반 분류자는 상기 핸드라이팅 데이타를 분류하도록 사용되고, 상기 적어도 하나의 일반 분류자에 의한 상기 핸드라이팅 데이타의 분류를 더 세밀하게 하도록 상기 적어도 하나의 사용자별 분류자는 특정 사용자에 대해 실질적인 특이성을 나타내는 상기 핸드라이팅 데이타의 특정 특징에 대하여 적용되고, 상기 적어도 하나의 사용자별 분류자가 사용될 때 상기 혼동 규칙의 상기 제2 부분에서 정의된 상기 집합 내의 상기 제2 문자의 개수가 판정되고, 상기 혼동 규칙의 상기 제2 부분에서 정의된 상기 집합 내에 상기 제2 문자가 단 하나만 있는 경우, 상기 적어도 하나의 일반 분류자에 의해 행해진 분류가 파기(overrule)되는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제1항에 있어서,

상기 적어도 하나의 일반 분류자는 복수의 사용자 사이에서 실질적인 공통성을 나타내는 상기 핸드라이팅 데이타의 일반적인 특징에 대하여 적용되는 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제2항에 있어서,

상기 일반적인 특징은 스케일된 모양 특징, 크기 특징 및 위치 특징으로 이루어진 그룹으로부터 선택된 적어도 하나를 적어도 부분적으로 포함하는 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
삭제
제1항에 있어서,

상기 특정 특징은 크기 특징 및 위치 특징으로 이루어진 그룹으로부터 선택된 적어도 하나를 적어도 부분적으로 포함하는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제1항에 있어서,

복수의 제2 사용자별 분류자를 더 포함하고, 상기 제2 사용자별 분류자들 각각은 대응되는 사용자별 특징 집합과 관련되는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제6항에 있어서,

상기 사용자별 특징 집합들은 서로소 집합들(disjoint sets)인, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
삭제
제7항에 있어서,

혼동 규칙의 각각의 문자에 대하여 구성된 밀도 모델을 사용하는 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제9항에 있어서,

적어도 하나의 상기 밀도 모델이 MLLR 적응 밀도 모델(MLLR adapted density model)을 포함하는 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제7항에 있어서,

혼동 규칙의 각각의 문자에 대하여 구성된 직접 식별 모델(direct discriminative model)을 사용하는 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제1항에 있어서,

상기 일반 분류자는 초기에 제공된 일반 분류자의 적응된 버전인 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
핸드라이팅 인식 시스템을 구축하는 방법에 있어서,

복수의 사용자와 관련된 핸드라이팅 데이타를 사용하는 적어도 하나의 일반 분류자를 구축하는 단계;

상기 일반 분류자에 대하여 적어도 하나의 혼동 규칙을 수립하는 단계 - 상기 혼동 규칙 각각은 제1 문자를 상기 적어도 하나의 일반 분류자에 대하여 상기 제1 문자와 혼동 가능한 하나 이상의 제2 문자의 집합과 관련시키고, 상기 적어도 하나의 혼동 규칙 각각은 적어도 제1 부분 및 제2 부분을 가지며, 상기 제1 부분은 상기 제1 문자를 정의(define)하고, 상기 제2 부분은 상기 하나 이상의 제2 문자의 집합을 정의함 - ;

특정 사용자 및 복수의 사용자 양자와 특정 사용자로 구성된 그룹으로부터 선택된 적어도 하나에 의해 제공되는 핸드라이팅 데이타를 사용하는 적어도 하나의 사용자별 분류자를 구축하는 단계;

상기 핸드라이팅 데이타를 분류하도록 상기 적어도 하나의 일반 분류자를 사용하는 단계;

상기 적어도 하나의 사용자별 분류자를 사용할 때 상기 혼동 규칙의 상기 제2 부분에서 정의된 상기 집합의 상기 제2 문자의 개수를 판정하는 단계; 및

상기 혼동 규칙의 상기 제2 부분에서 정의된 상기 집합 내에 상기 제2 문자가 단 하나만 있는 경우, 상기 적어도 하나의 일반 분류자에 의해 행해진 분류를 파기(overrule)하는 단계

를 포함하는 핸드라이팅 인식 시스템 구축 방법.
제13항에 있어서,

상기 적어도 하나의 사용자별 분류자를 트레이닝하기 위하여 적어도 하나의 연계(tying) 집합을 갖는 적어도 하나의 연계 클래스 및 일반 분류 모델을 사용하는 단계를 더 포함하는 핸드라이팅 인식 시스템 구축 방법.
제14항에 있어서,

상기 적어도 하나의 연계 클래스에 대한 상기 적어도 하나의 연계 집합과 관련된 데이타가 MLLR을 사용하는 모델들의 집합을 적응시키는 데 사용되는 핸드라이팅 인식 시스템 구축 방법.
제14항에 있어서,

상기 적어도 하나의 연계 클래스에 대한 상기 적어도 하나의 연계 집합과 관련된 데이타가 직접 밀도 모델들의 집합을 구축하는 데 사용되는 핸드라이팅 인식 시스템 구축 방법.
제14항에 있어서,

상기 적어도 하나의 연계 클래스에 대한 상기 적어도 하나의 연계 집합과 관련된 데이타가 직접 식별 모델을 구축하는 데 사용되는 핸드라이팅 인식 시스템 구축 방법.
제17항에 있어서,

상기 직접 식별 모델은 적어도 하나의 사용자별 특징에 대한 상기 적어도 하나의 연계 집합의 적어도 하나의 최고 미세 파티션(finest grained partition)에 연계된 클래스/문자 데이타를 갖는 분류자에 기초하는 핸드라이팅 인식 시스템 구축 방법.
핸드라이팅을 인식하는 시스템에 있어서,

복수의 사용자로부터의 데이타를 통해 트레이닝된 핸드라이팅 정보의 분류, 및 적어도 하나의 일반 분류자 혼동 규칙을 일반적으로(generically) 결정하기 위한 수단 - 상기 혼동 규칙은 적어도 제1 부분 및 제2 부분을 가짐 - ;

적어도 부분적으로 특정 사용자로부터의 데이타를 통해 트레이닝된 핸드라이팅 정보의 분류를 상세하게(specifically) 결정하기 위한 수단;

상기 일반적으로 결정하는 수단 및 상기 상세하게 결정하는 수단 양자를 동작시켜, 핸드라이팅 데이타를 분류하기 위한 수단;

상기 상세하게 결정하는 수단을 사용할 때 상기 혼동 규칙의 상기 제2 부분 내의 문자의 수를 결정하기 위한 수단; 및

상기 혼동 규칙의 상기 제2 부분 내에 단 하나의 문자만이 있는 경우, 상기 일반 분류자를 무효화하기 위한 수단

을 포함하는 핸드라이팅 인식 시스템.
제19항에 있어서,

적어도 하나의 일반 분류자 혼동 규칙에 대하여 핸드라이팅 데이타를 분류하기 위한 수단을 더 포함하는 핸드라이팅 인식 시스템.
제20항에 있어서,

적어도 하나의 혼동 규칙에 기초하여 적어도 하나의 일반 분류를 무효화하기 위한 수단을 더 포함하는 핸드라이팅 인식 시스템.
핸드라이팅을 인식하는 방법에 있어서,

핸드라이팅 데이타의 적어도 하나의 분류를 수립하도록 적어도 하나의 일반 분류자를 사용하여 상기 핸드라이팅 데이타를 처리하는 단계;

상기 일반 분류자에 대하여 적어도 하나의 혼동 규칙을 수립하는 단계 - 상기 혼동 규칙 각각은 제1 문자를 상기 적어도 하나의 일반 분류자에 대하여 상기 제1 문자와 혼동 가능한 하나 이상의 제2 문자의 집합과 관련시키고, 상기 적어도 하나의 혼동 규칙 각각은 적어도 제1 부분 및 제2 부분을 가지며, 상기 제1 부분은 상기 제1 문자를 정의(define)하고, 상기 제2 부분은 상기 하나 이상의 제2 문자의 집합을 정의함 - ;

상기 일반 분류자에 의한 상기 데이타의 분류를 더 세밀하게 하기 위해서, 상기 핸드라이팅 데이타의 적어도 하나의 사용자별 특징에 따라 상기 핸드라이팅 데이타를 분류하도록 적어도 하나의 사용자별 분류자를 사용하는 단계;

상기 사용자별 분류자를 사용할 때 상기 혼동 규칙의 상기 제2 부분에서 정의된 상기 집합 내의 상기 제2 문자의 개수를 판정하는 단계; 및

상기 혼동 규칙의 상기 제2 부분에서 정의된 상기 집합에 상기 제2 문자가 단 하나만 있는 경우, 상기 적어도 하나의 일반 분류자에 의해 행해진 상기 적어도 하나의 분류를 파기(overrule)하는 단계

를 포함하는 핸드라이팅 인식 방법.
제22항에 있어서,

상기 적어도 하나의 사용자별 분류자에 의한 사용을 위하여 각각의 상기 혼동 규칙에 대하여 적어도 2원 분류자(two-way classifier)를 구축하는 단계를 더 포함하고,

상기 2원 분류자는 상기 혼동 규칙의 적어도 상기 제1 부분을 나타내는 적어도 제1 분류 및 상기 혼동 규칙의 적어도 상기 제2 부분을 나타내는 적어도 제2 분류를 포함하는 핸드라이팅 인식 방법.
제23항에 있어서,

상기 2원 분류자는 MLLR 적응된 밀도 모델, 직접 밀도 모델 및 직접 식별 모델로 이루어진 그룹으로부터 선택된 적어도 하나를 적어도 부분적으로 포함하는 핸드라이팅 인식 방법.
제23항에 있어서,

상기 2원 분류자는 적어도 하나의 적응된 사용자별 모델 및 적어도 하나의 일반 모델로부터의 우도(likelihood)들의 조합을 통하여 발전된 모델을 포함하는 핸드라이팅 인식 방법.
제25항에 있어서,

상기 조합은 상기 적응된 사용자별 모델 및 상기 일반 모델로부터의 우도들의 승산 처리의 결과를 포함하는 핸드라이팅 인식 방법.
제23항에 있어서,

상기 일반 분류자를 사용하여 데이타가 상기 제1 분류 내에 있는 지를 결정하는 단계;

상기 일반 분류자가 상기 데이타가 상기 제1 분류 내에 있다고 결정하는 경우, 상기 사용자별 분류자를 사용하여 상기 데이타를 더 상세히 구별하는 단계; 및

상기 데이타가 상기 제1 분류가 아닌 분류 내로 분류되는 경우, 상기 일반 분류자의 결정을 수용하는 단계

를 더 포함하는 핸드라이팅 인식 방법.
제27항에 있어서,

상기 혼동 규칙의 상기 제2 부분 내에 둘 이상의 문자가 있는 경우, 상기 혼동 규칙의 상기 제2 부분 내의 문자들 간에서 상기 일반 분류자를 통하여 문자를 분류하는 단계를 더 포함하는 핸드라이팅 인식 방법.
컴퓨터를 제1항의 적응성 핸드라이팅 인식을 용이하게 하는 시스템의 상기 핸드라이팅 데이타를 수신하는 컴포넌트와 상기 인식 컴포넌트로서 기능하도록 구성시키는 컴퓨터 실행 가능한 명령어들이 저장되어 있는 컴퓨터 판독가능 기록 매체.
제22항의 핸드라이팅 인식 방법을 사용하고, 컴퓨터, 서버 및 핸드헬드 전자 장치로 이루어진 그룹으로부터 선택된 적어도 하나를 포함하는 장치.
제1항의 적응성 핸드라이팅 인식을 용이하게 하는 시스템을 사용하고, 컴퓨터, 서버 및 핸드헬드 전자 장치로 이루어진 그룹으로부터 선택된 적어도 하나를 포함하는 장치.
제22항의 핸드라이팅 인식 방법을 수행하기 위한 컴퓨터 실행가능 명령어가 저장되어 있는 컴퓨터 판독가능 기록 매체.
적응성 핸드라이팅 인식을 용이하게 하는 시스템에 있어서,

핸드라이팅 데이타를 수신하는 컴포넌트; 및

상기 핸드라이팅 데이타를 그것의 인식과 관련하여 분석하는 인식 컴포넌트 - 상기 인식 컴포넌트는 상기 분석과 관련하여, 상기 핸드라이팅의 일반적인 특징에 대한 적어도 하나의 일반 분류자, 및 상기 핸드라이팅의 사용자별 특징에 대한 적어도 하나의 사용자별 분류자를 사용함 -

를 포함하고,

상기 적어도 하나의 사용자별 분류자를 트레이닝하기 위해 적어도 하나의 연계 집합을 갖는 적어도 하나의 연계 클래스를 사용하여, 상기 연계 집합 내의 문자의 하나 이상의 특징이 상기 연계 집합 내의 다른 문자들에 외삽(extrapolate)될 수 있도록 하고,

한 특정 분류자에 대하여 실질적으로 유사한 사용자별 특징들을 나타내는 하나 이상의 문자가 상기 연계 집합으로 그룹화되는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제33항에 있어서,

상기 적어도 하나의 일반 분류자는 복수의 사용자 사이에서 실질적인 공통성(commonality)을 나타내는 상기 핸드라이팅 데이타의 일반적인 특징에 대하여 적용되는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제34항에 있어서,

상기 일반적인 특징은 스케일된 모양 특징, 크기 특징 및 위치 특징으로 이루어진 그룹으로부터 선택된 적어도 하나를 적어도 부분적으로 포함하는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제33항에 있어서,

상기 적어도 하나의 사용자별 분류자는, 특정 사용자에게 실질적인 특이성(uniqueness)을 나타내는 상기 핸드라이팅 데이타의 특정 특징에 대하여 적용되는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제36항에 있어서,

상기 특정 특징은 크기 특징 및 위치 특징으로 이루어진 그룹으로부터 선택된 적어도 하나를 적어도 부분적으로 포함하는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제33항에 있어서,

복수의 제2 사용자별 분류자를 더 포함하고 상기 제2 사용자별 분류자 각각은 대응되는 사용자별 특징 집합과 관련되는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제38항에 있어서,

상기 사용자별 특징 집합은 서로소 집합들(disjoint sets)인, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제33항에 있어서,

상기 인식 컴포넌트는 클래스/문자를 상기 일반 분류자에 대하여 혼동가능한 클래스/문자 집합과 관련시키는 혼동 규칙을 사용하는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제40항에 있어서,

상기 적어도 하나의 사용자별 분류자는 상기 일반 분류자를 무효로 할 수 있는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제39항에 있어서,

혼동 규칙의 각각의 문자에 대하여 구성된 밀도 모델을 사용하는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제42항에 있어서,

적어도 하나의 상기 밀도 모델이 MLLR 적응 밀도 모델(MLLR adapted density model)을 포함하는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제39항에 있어서,

혼동 규칙의 각각의 문자에 대하여 구성된 직접 식별 모델(direct discriminative model)을 사용하는, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
제33항에 있어서,

상기 일반 분류자는 초기에 제공된 일반 분류자의 적응된 버전인, 적응성 핸드라이팅 인식을 용이하게 하는 시스템.
핸드라이팅 인식 시스템을 구축하는 방법에 있어서,

복수의 사용자와 관련된 핸드라이팅 데이타를 사용하는 적어도 하나의 일반 분류자를 구축하는 단계;

특정 사용자와, 특정 사용자 및 복수의 사용자 양자로 구성된 그룹으로부터 선택된 적어도 하나에 의해 제공되는 핸드라이팅 데이타를 사용하는 적어도 하나의 사용자별 분류자를 구축하는 단계 - 상기 적어도 하나의 사용자별 분류자를 트레이닝하기 위해, 특정 사용자에 관련된 유사한 특징들을 나타내는 복수의 문자를 포함하는 적어도 하나의 연계 집합을 갖는 적어도 하나의 연계 클래스를 사용하고, 상기 연계 집합 내의 문자의 특징은, 상기 특정 사용자가 해당 특정 연계 집합의 모든 문자를 입력하는 것을 요구하지 않고, 상기 연계 집합 내의 다른 문자들에 외삽될 수 있음 - ; 및

상기 핸드라이팅 데이타의 분류와 관련하여, 상기 적어도 하나의 일반 분류자 및 상기 적어도 하나의 사용자별 분류자를 이용하는 단계

를 포함하는 핸드라이팅 인식 시스템 구축 방법.
제46항에 있어서,

상기 적어도 하나의 연계 클래스에 대한 상기 적어도 하나의 연계 집합과 관련된 데이타가 MLLR을 사용하는 모델들의 집합을 적응시키는 데 사용되는, 핸드라이팅 인식 시스템 구축 방법.
제46항에 있어서,

상기 적어도 하나의 연계 클래스에 대한 상기 적어도 하나의 연계 집합과 관련된 데이타가 직접 밀도 모델의 집합을 구축하는 데 사용되는, 핸드라이팅 인식 시스템 구축 방법.
제46항에 있어서,

상기 적어도 하나의 연계 클래스에 대한 상기 적어도 하나의 연계 집합과 관련된 데이타가 직접 식별 모델을 구축하는 데 사용되는, 핸드라이팅 인식 시스템 구축 방법.
제49항에 있어서,

상기 직접 식별 모델은 적어도 하나의 사용자별 특징에 대한 상기 적어도 하나의 연계 집합의 적어도 하나의 최고 미세 파티션에 연계된 클래스/문자 데이타를 갖는 분류자에 기초하는, 핸드라이팅 인식 시스템 구축 방법.
핸드라이팅을 인식하는 시스템에 있어서,

복수의 사용자로부터의 데이타를 통해 트레이닝된 핸드라이팅 정보의 분류를 일반적으로 결정하기 위한 수단;

적어도 부분적으로 특정 사용자로부터의 데이타를 통해 트레이닝된 핸드라이팅 정보의 분류를 상세하게 결정하기 위한 수단; 및

상기 일반적으로 결정하는 수단 및 상기 상세하게 결정하는 수단 양자를 동작시켜, 핸드라이팅 데이타를 분류하기 위한 수단

을 포함하고,

상기 상세하게 결정하는 수단을 트레이닝하기 위해, 적어도 하나의 연계 집합을 갖는 적어도 하나의 연계 클래스를 사용하고,

상기 연계 집합 내의 문자의 특징은 상기 연계 집합 내의 다른 문자들에 외삽될 수 있는 핸드라이팅 인식 시스템.