KR100733740B1 - 수기 표시로부터 문자 식별 - Google Patents

수기 표시로부터 문자 식별 Download PDF

Info

Publication number
KR100733740B1
KR100733740B1 KR1020050071850A KR20050071850A KR100733740B1 KR 100733740 B1 KR100733740 B1 KR 100733740B1 KR 1020050071850 A KR1020050071850 A KR 1020050071850A KR 20050071850 A KR20050071850 A KR 20050071850A KR 100733740 B1 KR100733740 B1 KR 100733740B1
Authority
KR
South Korea
Prior art keywords
adaptive
pdf
handwritten
pdfs
stroke segment
Prior art date
Application number
KR1020050071850A
Other languages
English (en)
Other versions
KR20060050275A (ko
Inventor
용 제
리-신 젠
Original Assignee
모토로라 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모토로라 인코포레이티드 filed Critical 모토로라 인코포레이티드
Publication of KR20060050275A publication Critical patent/KR20060050275A/ko
Application granted granted Critical
Publication of KR100733740B1 publication Critical patent/KR100733740B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2276Character recognition characterised by the type of writing of cursive writing using stroke segmentation with probabilistic networks, e.g. hidden Markov models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)

Abstract

문자를 나타내는 수기 표시(scribed indicium)에 적응형 템플릿을 할당하는 방법이 개시되며, 상기 방법은 상기 수기 표시로부터 복수의 획 세그먼트 벡터들을 추출하는 단계(블록 602); 각각의 추출된 획 세그먼트(stroke segment) 벡터에 대해, 각각의 참조 획 세그먼트 벡터들에 대한 복수의 기억된 확률분포함수들(probability distribution functions; PDFs) 중 가장 근접한 것을 결정하는 단계(블록 604); 및 상기 수기 표시에 상기 적응형 템플릿을 할당하는 단계를 포함하고, 상기 적응형 템플릿이 각각의 추출된 획 세그먼트 벡터에 대해 상기 가장 근접한 기억된 PDF를 식별하는 식별자들을 포함하며 상기 수기 표시가 나타내는 문자에 상기 수기 표시를 링크하고(블록 605) 적응형 사전에 기억한다(블록 607).
수기 표시, 획 세그먼트 벡터, 적응형 템플릿, 식별자, 확률분포함수

Description

수기 표시로부터 문자 식별{Identifying characters from scribed indicium}
도 1은 문자 형상 변형의 예들을 도시한 도면.
도 2는 실시예에 따라 방법 및 시스템의 구현을 위한 전자 디바이스를 예시한 개략도.
도 3은 본 발명의 실시예에 따라, 사용자 적응형 기능을 갖는 문자 인식용 분류기를 예시한 흐름도.
도 4는 획 부합에 기초한 분류를 예시한 개략도.
도 5는 수기 표시의 세그먼트들에 대한 가우시안 확률밀도함수 코드북 선택의 개략도.
도 6은 실시예에 따른 새로운 적응형 템플릿을 생성하는 흐름도.
도 7은 실시예에 따른 새로운 적응형 템플릿을 부가하는 흐름도.
본 발명은 일반적으로 문자를 나타내는 수기 표시(scribed indicium)에 적응형 템플릿을 할당하는 방법, 문자를 나타내는 수기 문자를 인식하는 방법, 및 전자 디바이스에 관한 것이다.
사용자에 의해 수기 표시로부터 문자들을 인식하는 것은 최근의 휴먼-디바이스 인터페이스 기술들에서 두드러진 해결해야 할 것들 중 하나이다. 예를 들면, 휴대 디바이스들이 점점 더 보급됨에 따라, 단문 메시지들과 같은 텍스트를 쉽게 입력할 방법의 필요성이 훨씬 더 중요해지고 있다. 터치 스크린이 사용될 수 있을 때, 수기 문자들(표시)의 필적 인식은 가장 자연스런 텍스트 입력 인터페이스, 특히 중국문자와 같은 동양의 표의문자 세트들(이것으로 한정되는 것은 아님)을 제공한다.
손으로 쓴 수기 문자들의 온라인 인식은 어려운 패턴 인식 문제로서 알려져 있다. 한 어려움은 문자 내의 형태 변화성이 큰 것에서 온다. 작성자들마다 이들의 일상생활에서 다른 잉크(ink) 형태들을 작성할 수도 있다. 도 1은 중국어 문자들에 있어 두 종류의 형태 변형들을 예시한 것이다. 도 1(a) 및 도 1(b)에서, 문자들(100, 102)은 각각 표준 형태들이고, 문자들(104, 106)은 각각 사용자에 따른 변형들을 예시한 것이다. 통계학적 패턴인식 방법을 적용함으로써, 인식기는 훈련 샘플들에 나타났던 문자 형태들을 아마도 정확하게 인식할 수 있다. 그러나 실제로, 모든 변형들을 커버할 만큼 충분한 훈련 샘플들을 모으는 것은 거의 불가능하다.
그러므로, 비교적 복잡한 문자들을 나타내는 속기 수기 표시와 같은 사용자에 의한 수기 문자들을 인식하도록 적응될 수 있는 적응성 인식기 기술에 대한 필요성이 있다.
본 발명의 제 1 면에 따라서, 문자를 나타내는 수기 표시(scribed indicium)에 적응형 템플릿을 할당하는 방법에 있어서, 상기 수기 표시로부터 복수의 획 세그먼트 벡터(stroke segment)들을 추출하는 단계; 각각의 추출된 획 세그먼트 벡터에 대해, 각각의 참조 획 세그먼트 벡터들에 대한 복수의 기억된 확률분포함수들(probability distribution functions; PDFs) 중 가장 근접한 것을 결정하는 단계; 및 상기 수기 표시에 상기 적응형 템플릿을 할당하는 단계를 포함하고, 상기 적응형 템플릿이 각각의 추출된 획 세그먼트 벡터에 대해 상기 가장 근접한 기억된 PDF를 식별하는 식별자들을 포함하며, 상기 수기 표시를 그가 나타내는 문자에 링크하고 적응형 사전에 기억하는, 수기 표시에 적응형 템플릿 할당방법이 제공된다.
복수의 기억된 PDF들은 PDF 사전 및 PDF 코드북 형태로 기억되고, 상기 PDF 코드북에 기억된 PDF들의 수는 상기 PDF 사전 내 PDF들의 수보다 적으며, 상기 PDF 사전 내 각각의 PDF는 상기 PDF 코드북 내 하나의 가장 유사한 PDF를 식별하는 포인터에 연관된다.
PDF 코드북내 PDF들은 왜곡 측정을 계산하기 위한 쿨백-라이블러 발산(Kullback-Leibler divergence)을 이용하여 PDF 사전 내 PDF들의 양자화에 기초하여 선택될 수 있다.
각각의 참조 획 세그먼트 벡터들에 대해 기억된 PDF들은 다른 참조 문자들에 연관될 수 있다.
본 방법은 수명시간 값 ToL을 상기 적응형 템플릿에 할당하는 단계, 및 상기 적응형 템플릿 및 할당된 ToL을 적응형 사전에 기억하는 단계를 더 포함할 수 있다.
상기 적응형 템플릿을 기억하는 단계는 가장 큰 ToL을 갖는 상기 적응형 사전내 기존의 엔트리를 대체하는 단계, 및 다른 기존의 엔트리들의 ToL들을 미리결정된 양만큼 증가시키는 단계를 포함할 수 있다.
본 발명의 제 2 면에 따라서, 문자를 나타내는 수기 표시를 인식하는 방법에 있어서, 상기 수기 표시로부터 복수의 획 세그먼트 벡터들을 추출하는 단계; 각각의 추출된 획 세그먼트 벡터에 대해, 각각의 참조 획 세그먼트 벡터들에 대한 복수의 기억된 확률분포함수들(PDFs) 중 가장 근접한 것을 결정하는 단계; 및 상기 결정된 가장 근접한 PDF들에 기초해서 상기 수기 표시의 인식을 위한 부합(match)을 결정하기 위해 적응형 템플릿 사전을 탐색하는 단계를 포함하고, 각각의 적응형 템플릿이 참조문자의 각각의 획 세그먼트 벡터에 대해 상기 기억된 PDF들 중 하나를 식별하는 식별자들을 포함한다.
본 방법은 본 발명의 제 1 면에 따라 새로운 적응형 템플릿을 할당하는 단계를 더 포함할 수 있다.
본 발명의 제 3 면에 따라서, 전자 디바이스에 있어서, 문자를 나타내는 수기 표시의 입력을 위한 사용자 인터페이스; 메모리 유닛; 및 프로세서를 포함하며, 상기 프로세서는 상기 수기 표시로부터 복수의 획 세그먼트 벡터들을 추출하고, 상기 메모리 유닛에서, 각각의 추출된 획 세그먼트 벡터에 대해, 각각의 참조 획 세그먼트 벡터들에 대한 복수의 기억된 확률분포함수들(PDFs) 중 가장 근접한 것을 결정하고, 적응형 템플릿을 상기 수기 표시에 할당하며, 상기 적응형 템플릿이 각각의 추출된 획 세그먼트 벡터에 대해 가장 근접한 기억된 PDF를 식별하는 식별자들을 포함하며, 상기 수기 표시를 그가 나타내는 문자에 링크하고, 상기 메모리 유닛 내 적응형 사전에 기억하는, 전자 디바이스가 제공된다.
복수의 기억된 PDF들은 PDF 사전 및 PDF 코드북 형태로 메모리 유닛에 기억될 수 있고, 상기 PDF 코드북에 기억된 PDF들의 수는 상기 PDF 사전 내 PDF들의 수보다 적으며, 상기 PDF 사전 내 각각의 PDF는 상기 PDF 코드북 내 한 가장 유사한 PDF를 식별하는 포인터에 연관된다.
PDF 사전 및 PDF 코드북은 메모리 유닛의 리드 온리 메모리(ROM) 요소에 기억될 수 있다.
PDF 코드북내 PDF들은 왜곡 측정을 계산하기 위한 쿨백-라이블러 발산을 이용하여 PDF 사전 내 PDF들의 양자화에 기초하여 선택될 수 있다.
각각의 참조 획 세그먼트 벡터들에 대해 기억된 PDF들은 다른 참조 문자들에 연관될 수 있다.
프로세서는 수명시간 값 ToL을 상기 적응형 템플릿에 할당할 수 있고, 상기 적응형 템플릿 및 할당된 ToL은 메모리 유닛 내 적응형 사전에 기억된다.
프로세서는 가장 큰 ToL을 갖는 상기 적응형 사전에 현존의 엔트리를 대체할 수 있고, 다른 현존의 엔트리들의 ToL들을 미리결정된 양만큼 증가시킨다.
적응형 사전은 랜덤 액세스 메모리(RAM) 요소 또는 메모리 유닛의 플래시 요소에 기억될 수 있다.
본 발명의 제 4 면에 따라서, 전자 디바이스에 있어서, 문자를 나타내는 수기 표시의 입력을 위한 사용자 인터페이스; 메모리 유닛; 및 프로세서를 포함하며, 상기 프로세서는 상기 수기 표시로부터 복수의 획 세그먼트 벡터들을 추출하고, 각각의 추출된 획 세그먼트 벡터에 대해, 메모리 유닛 내 복수의 기억된 PDF들 중 가장 근접한 것을 결정하고, 결정된 가장 근접한 PDF들에 기초하여 수기 표시의 인식을 위한 부합(match)을 결정하기 위해 메모리 유닛 내 적응형 사전을 탐색하며, 적응형 사전 내 적응형 템플릿들 각각은 참조 문자의 각각의 획 세그먼트 벡터에 대해 기억된 PDF들 중 하나를 식별하는 식별자들을 포함한다.
프로세서는 새로운 적응형 템플릿을 입력문자에 할당할 수 있고, 적응형 템플릿이 각각의 획 세그먼트 벡터에 대해 가장 근접한 기억된 PDF를 식별하는 식별자들의 어레이를 포함하고, 적응형 사전에 기억한다.
본 발명의 실시예들은 도면을 참조하여 단지 예로서, 다음의 상세한 설명으로부터 당업자에게 이해되고 명백하게 될 것이다.
도 2를 참조하면, 전자 디바이스(201)가 도시되어 있다. 도시된 디바이스(201)는 프로세서(203)와 통신하도록 결합된 라디오 주파수 통신유닛(202)을 포함한 휴대 PDA 전화이다. 터치 스크린(205) 형태의 사용자 인터페이스(통상 액정 디스플레이) 및 선택적 키패드(206)는 프로세서(203)와 통신하게 또한 결합된다.
프로세서(203)는 전자 디바이스(201)에 의해 송신 또는 수신될 수 있는 음성 또는 그 외 신호들을 엔코딩 및 디코딩하기 위한 데이터를 기억한 연관된 코드 리드 온리 메모리(ROM)(212)를 갖는 엔코더/디코더(211)를 포함한다. 프로세서(203) 는 또한 엔코더/디코더(211) 및 관련된 문자 리드 온리 메모리(ROM)(214) 모두에 공통버스(211)에 의해 결합된 마이크로프로세서(213)를 포함한다. 마이크로프로세서(213)는 또한 랜덤 액세스 메모리(RAM)(204) 및 정적 프로그램가능 메모리(216)에 공통버스(218)에 의해 결합된다. 정적 프로그램가능 메모리(216)는 다른 특징들 및 기능들 중에서도, 문자 인식을 위한 적응형 템플릿들, 번호들 및 연관된 식별자들(각 번호에 연관된 사람들의 이름들)의 전화 번호부 데이터베이스를 기억한다.
마이크로프로세서(213)의 보조 출력들은 통상적으로 스피커, 진동기 모터 및 연관된 구동기들을 내장한 경보 모듈(215)에 결합된다. 문자 리드 온리 메모리(214)는 통신유닛(202)에 의해 수신될 수도 있는 텍스트 메시지들, 터치 스크린(205) 또는 선택적인 키패드(206)에 입력을 디코딩 또는 엔코딩하기 위한 코드를 기억하고 있다. 이 실시예에서 문자 리드 온리 메모리(214)는 또한 마이크로프로세서(213)를 위한 운영 코드(operating code; OC), 및 문자 인식을 위한 고정된 인식 사전을 기억하고 있다. 운영코드(OC)는 애플리케이션들을 전자 디바이스(201)에서 실행되게 하는데 사용된다.
라디오 주파수 통신유닛(202)은 공통 안테나(207)를 갖는 것으로 수신기 및 송신기가 결합된 것이다. 통신유닛(202)은 라디오 주파수 증폭기(209)를 통해 안테나(207)에 결합된 트랜시버(208)를 갖는다. 트랜시버(208)는 또한 프로세서(203)에 통신유닛(202)을 결합시키는 것인, 결합된 변조기/복조기(210)에 결합된다.
도 3은 본 발명의 예로서의 실시예에 따른, 사용자 적응형 기능을 갖는 분류기(classifier)의 흐름도이다. 박스(301)에서, 문자를 나타내는 수기 표시가, 예 를 들면, PDA 전화(201)와 같은 휴대 디바이스의 터치 스크린(도 2)을 이용하여 입력된다.
수기 표시에 대해서, 블록(302)은 스무딩(smoothing), 잡음제거, 크기 정규화를 수행하고, 획 세그먼트 벡터들을 추출한다. 스무딩은 어떤 점의 좌표들 (x, y)를 이 점의 이웃들과 평균을 취하고, 그 점의 (x, y) 좌표값들을 계산된 평균값으로 대체함으로써 행해진다. 스무딩 후에, 고주파 잡음에 의해 야기되는 여분의 점들이 제거된다. 여분의 점들은 (x, y) 좌표값들이 이들의 선행의 것들과 동일한 점들이다. 이어서, 표준 사각형, 예를 들면 이 본 발명의 실시예에서 180x180에 맞추도록 수기 표시의 크기를 조절한다.
본 실시예에서 획 세그먼트는 수기 표시의 국부적인 최대 방향성 각도 변화들 사이의 선분이다. 획 세그먼트 벡터는 각 세그먼트로부터 도출된 2차원 벡터 ot =(dx, dy)이며, dx 및 dy는 세그먼트의 시작점과 종점 사이의 좌표 차이들이다. 수기 표시의 복잡도에 따라, 획 세그먼트의 개수가 달라질 수 있다.
박스들(303, 304)은 본 실시예에서 흐름도(300)의 탐색단계(308)를 구성한다. 탐색단계(308)에서, 박스(302)에서 추출된 각각의 획 세그먼트는 확률분포함수(PDF), 예를 들면
Figure 112005043412395-pat00001
형태의 가우시안 혼합 PDF에 의해 모델링된다. 도 4에 도시된 바와 같이, 고정된 인식 사전 내 각 문자 모델은 일련의 가우시안 혼합 PDF들(b1, b2,...bN), 예를 들면 402이며, N은 문자에 대한 평균 획수이다. 기억된 문자 모델들 예를 들면 402의 각각(고정 사전 내 PDF 열) 을, 추출된 획 세그먼트들 예를 들면 406에 기초하여 모델링된 획 세그먼트 열들과 부합하기 위해 동적 프로그래밍(PD) 절차가 사용된다. 최대 부합 스코어들을 제공하는 문자 모델이, 수기 표시(404)에 대한 인식결과이다.
당업자는 고정된 인식 사전에 기억된 문자 모델들, 예를 들면 402는 사전에 모아 놓은 훈련 샘플들의 풀로부터 비롯된 것임을 알 것이다. 각각의 훈련 샘플에 대해서, 주어진 문자를 나타내는 수기 표시의 획 세그먼트들이 추출된다. 각각의 추출된 획 세그먼트의 일련의 가우시안 혼합 PDF들인 문자 모델이, 모델링되고 샘플 수기 표시가 나타내는 문자에 링크된다.
도 3에서, 블록(304)은 본 실시예에서 적응형 사전을 탐색하는 것을 수행한다. 적응형 사전의 상세에 대해 이하 기술한다. 블록(305)에서, 입력된 문자가 탐색단계(308) 후 정확하게 인식되지 않는다면, 새로운 문자 모델이 생성되고(블록(306)) 적응형 사전의 갱신이 수행된다(블록 307). 본 실시예의 블록들(306, 307)의 상세를 이하 기술한다.
예를 들어, 중국어 문자 세트와 같은 표의 문자 세트는 어휘수가 방대하고, 각 문자는 많은 획 세그먼트들(도 4에서 문자(404) 및 세그먼트들, 예를 들면 406 참조)을 가질 수 있다. 각 획 세그먼트는 예를 들면 가우시안 혼합 PDF에 의해 모델링되기 때문에, 블록(403)에서 사용되는 고정된 인식 사전은 매우 큰 기억 메모리를 점유할 수 있다. 본 실시예에서, 블록(303)에서 모든 가우시안 PDF들은 일정 수(예를 들면 256)의 가우시안 PDF들로 코드북에 양자화된다. 본 실시예에의 가우 시안 PDF 클러스터링에서, 두 가우시안 PDF들
Figure 112005043412395-pat00002
Figure 112005043412395-pat00003
간의 왜곡 측정값은 쿨백-라이블러(KL) 발산에 의해 계산된다. 두 가우시안 PDF들
Figure 112005043412395-pat00004
Figure 112005043412395-pat00005
의 쿨백-라이블러 발산은 다음과 같이 정의된다.
Figure 112005043412395-pat00006
여기서 "tr[]"은 행렬의 트레이스를 나타낸다.
더 자세한 것에 대해선, 참조로 본 명세서에 포함시키는, "S. Kullback, Information Theory and Statistics. New York: Wiley, 1959"를 참조할 수 있다.
도 5에 도시된 바와 같이, 사용자에 의한(즉, 속기 문자 또는 개인화된 문자) 수기 표시(501)는 세그먼트 모델 열들로 세그먼트된다. 세그먼트 모델 열들 각각은 어떤 가우시안 PDF를 가지며 고정된 인식 사전(502) 내 각각의 가우시안 PDF 예를 들면 500에 대해서, 코드북(506) 내 코드워드(504)라 언급된 가장 유사한 PDF가 발견된다. 이에 따라, 블록(203)에서 사용된 각각의 가우시안 PDF 예를 들면 500(도 2)이, 실제로, 본 실시예에서 코드북 내 256개의 코드워드들 중 하나, 예를 들면 504를 가리키는 인덱스이다.
도 6은 본 실시예에서 새로운 적응형 템플릿을 생성하는 방법을 기술한다. 블록(601)에서 문자 입력을 나타내는 수기 표시에 대해서, 그리고 이 수기 표시를 전처리한 후에, T 획 세그먼트 벡터들 {o1, o2, o3,...,oT}을 가진 획 세그먼트 벡터 열이 블록(602)에서 추출된다. 카운터 i=0이 설정되고(블록 603), 각각의 획 세그 먼트 벡터 oi에 대해, 가장 근접한 가우시안 코드워드
Figure 112005043412395-pat00007
,
Figure 112005043412395-pat00008
가 결정된다(블록 604). i번째 획 벡터에 대해 결정된 가장 근접한 가우시안 코드워드를 확인하여, A[i]=j가 설정된다(블록 605). 블록들(604, 605)은 i=T일 때까지 반복된다(블록 606). 식별자들 A[0,,,N-1]은 본 실시예에서 수기 표시가 나타내는 문자에 수기 표시를 링크시키는 적응형 템플릿으로서 할당된다.
수기 표시가 나타내는 문자는, 예를 들면 "학습모드"에서 PDA 전화(201)(도 2)의 터치 스크린(205)(도 2) 상에 표시된 복수의 문자들 중에서 선택에 의해, 수기 표시의 초기 입력의 부분으로서 명시될 수도 있다. 그러나, 수기 표시가 나타내는 문자는, 적응형 사전에 적응형 템플릿을 부가할 때(블록 607) 인덱스 어레이 A[0,,,T-1]의 결정 후를 포함하는, 다른 실시예들에서 새로운 적응형 템플릿의 생성의 다른 지점들에서 명시될 수도 있음을 알 것이다.
도 3의 블록(303)에서 언급된 고정된 인식 사전은 ROM(214)에 기억될 수 있고, 반면 적응형 사전(도 3에서 블록(304))은 메모리(216)에 기억되고 기동시 RAM(204)에 다운로드된다. 수기 엔진용으로 사용될 수 있는 RAM(204)은 매우 제한될 수 있는데, 예를 들면, 단지 100개의 적응형 템플릿들만이 기억될 수도 있다. 본 실시예에서, 적응형 사전을 갱신하는 방법(도 3의 블록(307))은 도 7을 참조로 이하 기술된 바와 같이 제공된다.
각각의 현존의 적응형 템플릿에 대한 수명시간(ToL) 값을 기록하기 위한 증 분 정수(incremental integer number)가 사용되고, 이 숫자는 적응형 사전에 각각의 적응형 템플릿이 기억된 순서를 반드시 확인한다. 블록(701)에서 문자 입력에 대한 각각의 수기 표시에 대해, 확 세그먼트 벡터 열들이 추출되고(블록 702), 고정된 인식 사전 및 적응형 사전 내 적응형 템플릿들과 맞추어 본다(블록 703). 적응형 템플릿들에 맞추어 보는 것은 각각의 추출된 획 세그먼트 벡터에 대해, 각각의 참조 획 세그먼트 벡터들에 대한 복수의 기억된 PDF들 중 가장 근접한 것을 결정하는 것과, 추출된 획 세그먼트 벡터들에 대해 결정된 것들과 동일한 PDF들을 식별하는 적응형 템플릿을 찾는 것을 포함한다.
블록(703)으로부터 블록들(704, 708)로 이행되는 두 개의 출력들이 있다. 블록(703)으로부터 블록(708)으로의 이행을 고찰하면, 탑 후보(C1)가 적응형 사전으로부터의 것일 경우(블록 708), 이 템플릿의 ToL 값은 0으로 설정된다(블록 709). 이에 택일적으로, 블록(708)에서 탑 후보(C1)가 적응형 사전으로부터의 것이 아닌 것으로 결정되면 블록(710)은 우회되고 ToL 값은 변경되지 않는다.
블록(703)으로부터 블록(704)로의 이행을 고찰한다. 블록(704)에서, 후보 문자가 적응형 사전에 부가될 필요가 있다면, 즉 후보(C1)(블록 703)이 입력 문자의 정확한 인식이 아니라면, 새로운 적응형 템플릿이 도 6을 참조로 위에 기술된 바와 같이 발생된다. 그렇지 않다면 방법은 종료한다.
단계 704에서, 후보 문자가 적응형 사전에 부가될 필요가 있는 것으로 결정되면, 블록(705)에서 적응형 사전이 다 차 있는지를 체크한다. 적응형 사전이 다 차 있지 않다면, 그 후 새로운 템플릿이 사전에 부가되고(블록 710) 템플릿에 대한 ToL 값이 0으로 설정된다. 적응형 사전이 다 차 있다면, 그 후 최대 ToL 값을 갖는 템플릿이 발견되고, 이를 대체하기 위해 새로운 템플릿이 사용된다(블록 706). 새로운 템플릿에 대한 ToL 값은 또한 0으로 설정된다. 마지막으로, ToL 값들은 모든 현존의 적응형 템플릿들에 대해 증가된다(예를 들면, ToL=ToL+1)(블록(707)). 모든 ToL 값들이 블록(707)에서 증분될지라도, 값 ToL 값 카운트는 어떤 문자들에 대해선 과도하게 커지게 될 수도 있고 이에 따라 이들 카운트 값들의 정규화가, 예를 들면 모든 ToL 값들의 정수 나누기에 의해 가능할 수도 있는 것에 유의한다.
본 실시예는 사용자에 의한 문자들을 인식하는 방법을 제공한다. 추계통계학적 세그먼트 부합 분류화 및 가우시안 PDF 클러스터링 방법에 기초해서, 특정의 사용자를 위한 수기 인식(HWR) 제품의 유용성을 향상시키기 위해 적응형 템플릿 발생 방법 및 사전 갱신 방법이 본 실시예에서 제공된다. 이에 따라, 사용자는 비교적 복잡한 문자들에 대해 속기한 개인화된 수기 표시(들)를 기입할 수 있다. 수기 표시(들)는 코드북을 통해 복잡한 문자에 연관되고 디바이스에 문자를 입력하는데 사용될 수 있다.
당업자는 넓게 기술된 본 발명의 정신 또는 범위 내에서 구체적인 실시예들에 나타낸 바와 같이 본 발명에 많은 변형들 및/또는 수정들이 행해질 수 있음을 알 것이다. 그러므로, 본 실시예들은 모든 면에서 예시적이고, 제한하는 것은 아닌 것으로 고려된다.

Claims (9)

  1. 문자를 나타내는 수기 표시(scribed indicium)에 적응형 템플릿을 할당하는 방법에 있어서,
    상기 수기 표시로부터 복수의 획 세그먼트(stroke segment) 벡터들을 추출하는 단계;
    각각의 추출된 획 세그먼트 벡터에 대해, 각각의 참조 획 세그먼트 벡터들에 대한 복수의 기억된 확률분포함수들(Probability Distribution Functions; PDFs) 중 가장 근접한 것을 결정하는 단계; 및
    상기 수기 표시에 상기 적응형 템플릿을 할당하는 단계를 포함하고,
    상기 적응형 템플릿은 각각의 추출된 획 세그먼트 벡터에 대해 상기 가장 근접한 기억된 PDF를 식별하는 식별자들을 포함하며, 적응형 사전에 기억하기 위해 상기 수기 표시를 상기 수기 표시가 나타내는 문자에 링크하는, 수기 표시에 적응형 템플릿 할당방법.
  2. 제 1 항에 있어서,
    상기 복수의 기억된 PDF들은 PDF 사전 및 PDF 코드북 형태로 기억되고, 상기 PDF 코드북에 기억된 PDF들의 수는 상기 PDF 사전 내 PDF들의 수보다 적으며, 상기 PDF 사전 내 각각의 PDF는 상기 PDF 코드북 내 하나의 가장 유사한 PDF를 식별하는 포인터에 연관되는, 수기 표시에 적응형 템플릿 할당방법.
  3. 제 2 항에 있어서,
    상기 PDF 코드북 내 상기 PDF들은 왜곡 측정을 계산하기 위해 쿨백-라이블러 발산(Kullback-Leibler divergence)을 이용하여 상기 PDF 사전 내 상기 PDF들의 양자화에 기초하여 선택되는, 수기 표시에 적응형 템플릿 할당방법.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 각각의 참조 획 세그먼트 벡터들에 대한 상기 기억된 PDF들은 다른 참조 문자들에 연관되는, 수기 표시에 적응형 템플릿 할당방법.
  5. 제 1 항에 있어서,
    수명시간 값 ToL을 상기 적응형 템플릿에 할당하는 단계, 및 상기 적응형 템플릿 및 할당된 ToL을 적응형 사전 내에 기억하는 단계를 더 포함하는, 수기 표시에 적응형 템플릿 할당방법.
  6. 제 5 항에 있어서,
    상기 적응형 템플릿을 기억하는 단계는 가장 큰 ToL을 갖는 상기 적응형 사전내 기존의 엔트리를 대체하는 단계, 및 다른 기존의 엔트리들의 ToL들을 미리결정된 양만큼 증가시키는 단계를 포함하는, 수기 표시에 적응형 템플릿 할당방법.
  7. 문자를 나타내는 수기 표시를 인식하는 방법에 있어서,
    상기 수기 표시로부터 복수의 획 세그먼트 벡터들을 추출하는 단계;
    각각의 추출된 획 세그먼트 벡터에 대해, 각각의 참조 획 세그먼트 벡터들에 대한 복수의 기억된 확률분포함수들(PDFs) 중 가장 근접한 것을 결정하는 단계; 및
    상기 결정된 가장 근접한 PDF들에 기초해서 상기 수기 표시의 인식을 위한 부합(match)하는 것을 결정하기 위해 적응형 템플릿 사전을 탐색하는 단계를 포함하고, 각각의 적응형 템플릿이 참조문자의 각각의 획 세그먼트 벡터에 대해 상기 기억된 PDF들 중 하나를 식별하는 식별자들을 포함하는, 수기 표시 인식방법.
  8. 제 7 항에 있어서,
    부합되는 것이 없을 때, 제 1 항의 방법에 따라 새로운 적응형 템플릿을 할당하는 단계를 더 포함하는, 수기 표시 인식방법.
  9. 전자 디바이스에 있어서,
    문자를 나타내는 수기 표시의 입력을 위한 사용자 인터페이스;
    메모리 유닛; 및
    프로세서를 포함하며,
    상기 프로세서는 상기 수기 표시로부터 복수의 획 세그먼트 벡터들을 추출하고, 상기 메모리 유닛에서, 각각의 추출된 획 세그먼트 벡터에 대해, 각각의 참조 획 세그먼트 벡터들에 대한 복수의 기억된 PDF들 중 가장 근접한 것을 결정하고, 적응형 템플릿을 상기 수기 표시에 할당하며,
    상기 적응형 템플릿은 각각의 추출된 획 세그먼트 벡터에 대해 가장 근접한 기억된 PDF를 식별하는 식별자들을 포함하고, 상기 메모리 유닛 내 적응형 사전에 기억하기 위해 상기 수기 표시를 상기 수기 표시가 나타내는 문자에 링크하는, 전자 디바이스.
KR1020050071850A 2004-08-06 2005-08-05 수기 표시로부터 문자 식별 KR100733740B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200410056512.6 2004-08-06
CNB2004100565126A CN100405389C (zh) 2004-08-06 2004-08-06 从划线标记识别字符的方法和装置

Publications (2)

Publication Number Publication Date
KR20060050275A KR20060050275A (ko) 2006-05-19
KR100733740B1 true KR100733740B1 (ko) 2007-07-02

Family

ID=35963763

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050071850A KR100733740B1 (ko) 2004-08-06 2005-08-05 수기 표시로부터 문자 식별

Country Status (4)

Country Link
JP (1) JP4335185B2 (ko)
KR (1) KR100733740B1 (ko)
CN (1) CN100405389C (ko)
SG (1) SG119356A1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003034325A1 (en) * 2001-10-15 2003-04-24 Silverbrook Research Pty Ltd A method and apparatus for decoding handwritten characters
KR20030066774A (ko) * 2000-12-27 2003-08-09 아스라브 쏘시에떼 아노님 입력 존에서 수작업으로 그려넣어진 문자들을 인식하기위한 방법 및 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1012818B (zh) * 1987-12-28 1991-06-12 中国石油化工总公司石油化工科学研究院 一种硫磷氮型极压抗磨剂的制备方法
JP3017740B2 (ja) * 1988-08-23 2000-03-13 ソニー株式会社 オンライン文字認識装置およびオンライン文字認識方法
CZ6196A3 (en) * 1994-05-10 1996-06-12 Motorola Inc Method of segmentation of draws for hand-writing input

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030066774A (ko) * 2000-12-27 2003-08-09 아스라브 쏘시에떼 아노님 입력 존에서 수작업으로 그려넣어진 문자들을 인식하기위한 방법 및 장치
WO2003034325A1 (en) * 2001-10-15 2003-04-24 Silverbrook Research Pty Ltd A method and apparatus for decoding handwritten characters

Also Published As

Publication number Publication date
CN100405389C (zh) 2008-07-23
SG119356A1 (en) 2006-02-28
JP2006048708A (ja) 2006-02-16
CN1731415A (zh) 2006-02-08
JP4335185B2 (ja) 2009-09-30
KR20060050275A (ko) 2006-05-19

Similar Documents

Publication Publication Date Title
EP1564675B1 (en) Apparatus and method for searching for digital ink query
US7428516B2 (en) Handwriting recognition using neural networks
US6795579B2 (en) Method and apparatus for recognizing handwritten chinese characters
CN102449640B (zh) 识别手写单词
US8176054B2 (en) Retrieving electronic documents by converting them to synthetic text
EP0844583B1 (en) Method and apparatus for character recognition
US10242296B2 (en) Method and device for realizing chinese character input based on uncertainty information
KR970049823A (ko) 문자 판독 방법 및 주소 판독 방법
KR100412317B1 (ko) 문자인식/수정방법및장치
JP5502814B2 (ja) アラビア語テキストに発音区別符号を付与するための方法およびシステム
KR20210017090A (ko) 필기 입력을 텍스트로 변환하는 방법 및 전자 장치
CN113343678A (zh) 一种文本纠错的方法、装置、电子设备及存储介质
Singh et al. Online handwritten Gurmukhi words recognition: An inclusive study
CN100501656C (zh) 一种音形结合的向电子设备中手写汉字的输入法
KR100733740B1 (ko) 수기 표시로부터 문자 식별
JP2019175317A (ja) 文字認識装置、文字認識方法およびプログラム
Nagy et al. Adaptive and interactive approaches to document analysis
JPH08263587A (ja) 文書入力方法および文書入力装置
KR100204618B1 (ko) 문자 또는 도형의 인식 방법 및 시스템
CN116959000A (zh) 笔迹识别方法、装置、计算机设备及存储介质
KR100762831B1 (ko) 입력창 경계선을 이용한 한글 입력 방법
CN114356114A (zh) 文字输入系统及方法
KR100277941B1 (ko) 식별력있는한글자소설계와이를이용한필기인식방법
KR20040099937A (ko) 터치스크린을 이용한 문자입력장치 및 그 방법
JPH07271917A (ja) 手書き文字認識辞書作成方法および装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130531

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140529

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150608

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160615

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170614

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180614

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20190613

Year of fee payment: 13