KR100858545B1 - 핸드라이팅 인식용 장치 및 방법 - Google Patents

핸드라이팅 인식용 장치 및 방법 Download PDF

Info

Publication number
KR100858545B1
KR100858545B1 KR1020067023041A KR20067023041A KR100858545B1 KR 100858545 B1 KR100858545 B1 KR 100858545B1 KR 1020067023041 A KR1020067023041 A KR 1020067023041A KR 20067023041 A KR20067023041 A KR 20067023041A KR 100858545 B1 KR100858545 B1 KR 100858545B1
Authority
KR
South Korea
Prior art keywords
character
substring
string
strings
unrecognized
Prior art date
Application number
KR1020067023041A
Other languages
English (en)
Other versions
KR20070010163A (ko
Inventor
존 리에만
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20070010163A publication Critical patent/KR20070010163A/ko
Application granted granted Critical
Publication of KR100858545B1 publication Critical patent/KR100858545B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2272Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0354Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2276Character recognition characterised by the type of writing of cursive writing using stroke segmentation with probabilistic networks, e.g. hidden Markov models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Preparation Of Clay, And Manufacture Of Mixtures Containing Clay Or Cement (AREA)

Abstract

입력 문자열을 나타내는 핸드라이팅 입력(handwritten input)의 문자들을 인식하는 장치 및 방법에 제공된다. 상기 입력 문자열에서 미인식 문자에 선행하는 문자 부분열이 결정된다. 핸드라이팅 인식(handwrting recognition)을 사용하여 상기 미인식 문자에 대한 1 이상의 후보 문자가 제공되도록 한다. 그 다음 상기 1 이상의 후보 문자 중에서 한 후보 문자가 선택된다. 상기 선택된 후보 문자는, 상기 결정된 문자 부분열을 기반으로 상기 미인식 문자에 대한 가장 정확한 인식이 될 수 있는 후보 문자이다.

Description

핸드라이팅 인식용 장치 및 방법{Apparatus and method for handwriting recognition}
본 발명은 일반적으로 전자장치들에 대한 핸드라이팅 입력에 관한 것이며, 더 구체적으로는 핸드라이팅 인식용 장치 및 방법에 관한 것이다.
전자장치들에서 핸드라이팅 입력(handwriting input)을 사용하는 것은, 예컨대 핸드라이팅이 개별적이라는 사실 및 여러 핸드라이팅 문자들을 서로 구별하는 것이 때때로 어렵다는 사실에 기인한 일련의 문제를 지닌다. 키보드들, 키패드들 등으로 타이핑하는 대신 핸드라이팅에 의해 전자장치들로의 문자 입력을 용이하게 할 목적으로 지금까지 여러 가지 시스템들이 개발되어 왔다.
핸드라이팅 인식(handwriting recognition)의 정확성을 높이려는 노력으로, 여러 가지 문자들을 구별하는 여러 가지 방법들이 제안되어 왔다. 예컨대, 몇몇 시스템들은 사용자로 하여금 문자들을 특별한 방식으로 기재하도록 요구하며, 다른 시스템들은 개별 사용자들의 핸드라이팅을 "학습(learn)"할 수 있는 수단을 포함한다.
또한, 핸드라이팅 인식은 문자들이 출현하는 콘텍스트(context)와 관련된 정보를 고려할 수 있다.
공개번호 제US 2004/0017946호의 미국 출원에는 타자 입력을 기반으로 한 예상 중국어 문자 리스트를 포함하는 핸드라이팅된 중국어 문자 입력 방법 및 시스템이 개시되어 있다. 타자 입력이 늘어날수록 상기 중국 문자 리스트가 조정되며, 상기 리스트에 필요한 중국 문자가 나타났을 때, 사용자는 선택 움직임, 이를테면 마우스 또는 스타일러스(stylus) 또는 핑커탭핑(finger tapping)에 의해 상기 문자를 선택할 수 있다.
유럽 특허 제EP 0 686 291호에는 입력 핸드라이팅 단어(input handwritten word)를 인식하기 위한 사전(dictionary)을 사용하는 핸드라이팅 인식 방법이 개시되어 있다. 상기 입력 핸드라이팅 단어의 각 문자에 대해 후보 문자(candidate character)들이 식별되고 그리고 상기 후보 문자들의 조합들이 상기 사전의 엔트리(entry)들과 비교되어 상기 입력을 표현할 수 있는 후보 단어(candidate word)들을 제공하도록 한다. 또한, 상기 사전과 무관하게 가장 정확하게 결합되었을 가능성을 지니는 후보 문자들의 조합으로서 가장 유력한 문자열이 식별된다. 상기 가장 유력한 문자열이 상기 후보 단어들 중 하나가 아니라면 상기 후보 단어들 및 상기 가장 유력한 문자열을 포함하는 리스트가 제공된다.
여러 후보 문자들의 조합에 의한 단어들의 인식은 많은 양의 처리 및 매우 큰 사전을 필요로 한다. 따라서, 이러한 결점들을 경감시키지만 여전히 높은 인식 정확성(recognition accuracy)을 유지하는 핸드라이팅 인식에 대한 요구가 현존하고 있다.
입력 문자열을 나타내는 핸드라이팅 입력(handwritten input)의 문자들을 인식하는 방법이 제공된다. 상기 방법에 따르면, 상기 입력 문자열에서 미인식 문자(unrecognized character)에 선행하는 문자 부분열(sub-string)이 결정된다. 핸드라이팅 인식이 사용되어 상기 미인식 문자에 대해 1 이상의 후보 문자(candidate character)를 제공하도록 한다. 그 다음 상기 1 이상의 후보 문자 중 한 후보 문자가 선택된다. 상기 선택된 후보 문자는, 상기 결정된 문자 부분열을 기반으로 상기 미인식 문자에 대한 가장 정확한 인식이 될 수 있는 후보 문자이다.
따라서, 상기 방법에 따르면, 문자들은 한번에 한 문자씩 인식된다. 상기 문자 인식은 후보 문자들을 제공하는 핸드라이팅 인식 및 인식되어야 할 문자에 선행하는 기인식된 문자 부분열을 기반으로 한다.
한번에 한 문자씩으로 인식을 제한함으로써 즉, 한번에 2 이상의 후보 문자들에 대한 여러 조합을 고려하지 않음으로써, 처리량이 경감된다. 동시에, 미인식 문자에 선행하는 상기 결정된 문자 부분열을 고려함으로써 정확성이 달성된다.
1 이상의 후보 문자 중 하나의 후보 문자를 선택하기 위해 결정된 문자 부분열(determined character sub-string)을 사용하는 한 방식은, 저장 문자열(stored character string)들의 사용을 더 포함해야 한다. 그때는 1 이상의 후보 문자열(candidate character string)들이 상기 저장 문자열들 중에서 식별될 수 있으며, 상기 후보 문자열들은 제각기 상기 결정된 문자 부분열과 동일한 이니셜 문자 부분열(initial character sub-string)을 포함한다. 상기 선택은 상기 1 이상의 후보 문자열을 기반으로 할 수 있다. 보다 구체적으로 상기 선택은 상기 1 이상의 후보 문자열들 각각의 이니셜 문자 부분열의 뒤에 오는 다음 문자를 기반으로 할 수 있다.
상기 방법은 문자열의 다른 문자들에 대해서는 다른 핸드라이팅 인식용 방법들을 사용하여 오직 단일 문자에 대해 수행될 수 있다. 또한, 상기 방법은 문자열에 대해 한번에 한 문자씩 순차적으로 수행될 수 있다.
입력 문자열을 나타내는 핸드라이팅 입력(handwritten input)의 문자들을 인식하는 장치가 제공된다. 상기 장치에 있어서, 프로세서는 입력 문자열에서 미인식 문자에 선행하는 문자 부분열을 결정하도록 구성된다. 상기 프로세서는 또한 핸드라이팅 인식을 사용하여 상기 미인식 문자에 대한 1 이상의 후보 문자들을 제공하도록 준비된다. 또한, 상기 프로세서는 상기 1 이상의 후보 문자들 중에서 한 후보 문자를 선택하도록 구성되며, 상기 선택된 후보 문자는 상기 결정된 문자 부분열을 기반으로 상기 미인식 문자의 가장 정확한 인식이 될 수 있는 후보 문자이다.
이하에서, 본 발명은 첨부도면들을 참조하여 제한으로서가 아닌 실시예로서 설명될 것이다.
도 1은 본 발명에 따른 장치의 일 실시예가 구현되어 있는 장치에 관한 개략적인 블록도이다.
도 2는 본 발명에 따른 방법의 일 실시예에 관한 흐름도이다.
도 3a 내지 도 3c는 본 발명에 따른 핸드라이팅 단어 인식을 예시하는 도면이다.
도 1에는 본 발명에 따른 장치(100)의 일 실시예가 구현되어 있는 장치에 관한 개략적인 블록도가 도시되어 있다. 상기 장치(100)는 예컨대, 휴대 장치 이를테면, 모바일 전화, PDA(personal digital assistant) 등, 또는 핸드라이팅 입력(handwritten input)이 용이하거나 용이하여야 하는 그 밖의 장치일 수 있다.
상기 장치(100)는 핸드라이팅 입력 수단(110)을 포함한다. 유의할 점은 본 발명에 따라 핸드라이팅 입력을 제공하는 임의의 방식 및 수단, 이를테면 스타일러스(stylus)에 의해 핸드라이팅 입력을 제공할 수 있는 압력 감지 스크린(pressure sensitive screen)이 사용될 수 있다는 것이다. 그러한 방식들 및 수단들은 종래기술에 공지되어 있으며, 따라서 본 명세서에서는 더 이상 설명되지 않을 것이다.
상기 장치(100)는 상기 핸드라이팅 입력 수단(110)에 연결되어 동작하는 프로세서(120)를 더 포함한다. 본 발명이 구현될 수 있는 장치들은 1 이상의 마이크로프로세서들 또는 그 밖의 디지털 처리용 장치들을 포함하는 것이 일반적이다. 또한, 본 발명의 실시예들이 구현될 수 있는 장치들은 기존의 디지털 처리용 장치들에 의해 수행되는 여러 계산적인 방법(computational method)을 구현하기 위한 플랫폼을 포함하는 것이 일반적이다. 따라서, 기존의 프로세서들 중 한 프로세서가 상기 프로세서(120)로서 사용되는 것이 필수적이진 않지만 바람직하며, 본 발명에 따른 방법의 실시예들의 단계들로서 상기 프로세서(120)에 의해 수행되는 단계들은 당업자에 의해 쉽게 구현된다.
상기 장치(100)는 문자열들을 저장하는 메모리(130)를 더 포함한다. 상기 메 모리는 상기 프로세서(120)에 연결되어 동작한다. 상기 프로세서(120)의 경우와 같이, 본 발명이 구현될 수 있는 장치들은 1 이상의 메모리 또는 그 밖의 디지털 저장용 장치를 포함하는 것이 일반적이다. 또한, 몇몇 장치들은 사전(dictionary)까지도 포함할 수 있다. 따라서, 그러한 기존의 메모리가 상기 메모리(130)로 사용되는 것이 필수적이진 않지만 바람직하다. 저장 문자열들과 관련하여 프로세서로 하여금 메모리에 접근하도록 하는 본 발명의 방법의 단계들은, 당업자에 의해 쉽게 구현된다.
본 발명의 실시예가 구현되는 장치가 그러한 처리 장치, 플랫폼, 메모리 등이 포함하지 않더라도, 이들은 종래기술에 공지되어 있기 때문에 이들은 쉽게 포함된다.
상기 장치(100)는 압력 감지 스크린(pressure sensitive screen) 등을 통해 핸드라이팅 문자열들을 직접 전자장치에 입력하는데 관련되지만, 유의할 점은 본 발명의 실시예들은 또한 문자 인식이 사용되는 다른 애플리케이션들, 이를테면 종이 등에 핸드라이팅된 메시지들에 대한 광 문자 인식(optical character recognition) 방법들에도 사용될 수 있다는 것이다.
도 2에는 본 발명에 따른 방법의 일 실시예에 관한 흐름도가 도시되어 있다. 전자장치, 예컨대 도 1에 예시된 그리고 도 1을 참조하여 설명된 타입의 장치에 핸드라이팅 입력이 주어진다. 상기 핸드라이팅 입력은 입력 문자열, 즉 알파벳 문자들, 숫자들, 부호들 등, 또는 그들의 조합으로 이루어진 열을 나타낸다. 인식되어야 할 문자(뒤에 오는 미인식 문자)에 선행하는(즉, 인식되어야 할 문자 직전 문자 까지의) 핸드라이팅 입력 문자들은, 본 발명에 따른 방법으로 제한되는 것이 아니라 본 발명에 따른 방법을 포함하는 핸드라이팅 인식 방법에 의해 인식된다.
단계(210)에서, 입력 문자열의 문자 부분열(character sub-string)이 결정된다. 상기 문자 부분열은 핸드라이팅 입력에 의해 표현되는 입력 문자열에서 미인식 문자에 선행하는 모든 문자들로 이루어질 수 있거나 또는 미인식 문자에 선행하는 문자들의 터미널 문자 부분열(terminal character sub-string)로 이루어질 수 있다. 이 점에 있어서, 문자열의 터미널 문자 부분열이란 문자열의 첫 번째 문자 뒤에 오는 문자 또는 더 뒤의 문자에서 시작하여 상기 문자열의 마지막 문자로 끝나는 문자열이다.
사용될 문자 부분열의 결정은 저장 문자열(stored character string)들을 기반으로 수행될 수 있다. 상기 저장 문자열들은 적어도 빈출 단어 세트를 포함하지만, 또한 구(phrase)들과, 언어에서 중요한 빈출 단어 스터브(word stub)들 및 문자 시퀀스들, 이를테면 "tion", "ly" 등을 포함하는 것이 바람직하다.
입력 문자열에서 미인식 문자에 선행하는 완성된 문자열(complete character string)이 상기 저장 문자열들 중 한 저장 문자열과 동일하거나 또는 1 이상의 저장 문자열의 이니셜 문자 부분열과 동일한 몇몇 경우에 있어서, 상기 결정된 문자 부분열이 상기 미인식 문자에 선행하는 상기 완성된 문자열이 된다. 환언하면, 입력 문자열에서 현재까지 인식된 문자들이 저장 문자열들 중에 존재하는 구, 단어, 또는 문자 시퀀스가 입력되었음을 표시하는 한, 모든 선행 문자들은 후속 문자를 인식하기 위한 기초로 사용된다. 이 점에 있어서, 문자열의 이니셜 문자 부분 열(initial character sub-string)이란 문자열의 첫 번째 문자에서 시작하여 상기 문자열의 마지막 문자 전에 끝나는 문자열이다.
입력 문자열에서 미인식 문자에 선행하는 완성된 문자열이 모든 저장 문자열 또는 모든 저장 문자열의 이니셜 문자 부분열과 동일하지 않은 다른 경우들에 있어서, 결정된 문자 부분열은 완성된 문자열이 되지 않는다. 그러한 경우들에 있어서 입력 문자열에서 현재까지 인식된 문자들 중 첫 번째 문자로서, 저장 문자열들 중에 존재하지 않는 구, 단어 또는 문자 시퀀스가 입력되었음을 지시하는 첫 번째 문자는 상기 결정된 문자 부분열의 첫 번째 문자로 사용된다. 더 구체적으로는, 입력 문자열의 임의의 이니셜 문자 부분열로서 미인식 문자에 선행하는 이니셜 문자 부분열이 식별되며, 상기 이니셜 문자 부분열은 저장 문자열들 중 한 저장 문자열과 동일하거나 또는 저장 문자열들 중 한 저장 문자열의 이니셜 문자 부분열과 동일하고, 그리고 후속 문자가 더해진 상기 이니셜 문자 부분열은 상기 저장 문자열들 중 어떠한 문자열과도 동일하지 않거나 또는 상기 저장 문자열들 중 어떠한 문자열의 이니셜 문자 부분열과도 동일하지 않다. 그때 결정된 문자 부분열은 상기 후속 문자로 시작되고 상기 미인식 문자에 선행하는 문자로 끝난다.
본 발명을 특정 언어들에 적용할 때, 문자 부분열의 결정은 예컨대, 계산의 복잡성을 완화하기 위해 달리 지정될 수 있다. 미인식 문자를 인식할 때 상기 방법이 모든 선행 문자들을 고려하도록 허용하는 변형예에 있어서, 상기 결정은 상기 미인식 문자가 속한 단어의 선행 문자들만을 고려하도록 지정될 수 있다. 그러한 변형예에 있어서, 문자 부분열의 결정은 단어들 또는 표시들을 구분하는 식별 단 어, 이를테면 스페이스 문자들을 포함한다. 그때는 미인식 문자가 속하는 단어의 선행 문자들이 상기 미인식 문자 이전의 마지막 스페이스 문자 또는 다른 단어 구분 표시들의 뒤에 오는 입력 문자열의 문자들로서 쉽게 식별된다. 단어가 입력 문자열의 첫 번째 단어라면, 미인식 문자에 선행하는 다음의 모든 문자들은 문자 부분열로 식별된다.
부분열들의 결정에 관한 다른 변형예들, 이를테면 미인식 문자가 속하는 단어의 선행 문자들 및 상기 미인식 문자에 선행하는 완성된 단어들의 문자들로 이루어지는 부분열 결정이 가능하다. 상기 단어들은 문자들 또는 표시들을 분리하는 단어, 이를테면 스페이스 문자들에 의해 쉽게 식별된다.
단계(210)에서 문자 부분열을 결정한 후에, 단계(220)에서 1 이상의 후보 문자열(candidate character string)들이 식별된다. 상기 후보 문자열들은, 저장 문자열들 중에서 상기 결정된 문자 부분열과 동일한 이니셜 문자 부분열을 포함하는 임의의 저장 문자열로서 식별된다. 종래기술에 공지된 것들을 포함하여 문자열들을 저장 문자열들과 매치시키는 그 밖의 접근법들, 및 그러한 접근법들을 구현하는 수단들이 사용될 수 있다.
유의할 점은, 지금까지 저장 문자열에서의 룩업(lookup)의 사용을 설명하였지만, 소정 문자열을 기반으로 다음 문자를 예상하는 그 밖의 다른 방법, 이를테면 소정 문자가 소정 문자열 다음에 올 확률에 관한 저장 확률들에서의 룩업이 사용될 수 있다.
단계(230)에서 미인식 문자에 대한 1 이상의 후보 문자가 제공된다. 상기 후 보 문자들은 핸드라이팅 인식에 의해 제공된다. 후보 문자들을 제공하기 위해 모든 타입의 핸드라이팅 인식, 이를테면 종래기술에 공지된 핸드라이팅 인식이 사용될 수 있다.
최종적으로, 단계(240)에서는 상기 1 이상의 후보 문자들 중에서 한 후보 문자가 선택된다. 상기 선택된 후보 문자는 미인식 문자에 대한 가장 정확한 인식이 될 수 있는 후보 문자이다. 후보 문자의 가능성은 1 이상의 후보 문자열 각각의 이니셜 문자 부분열 뒤에 오는 다음 문자를 기반으로 한다.
상기 1 이상의 후보 문자열 각각의 이니셜 문자 부분열 뒤에 오는 다음 문자를 사용하는 변형예에 있어서, 소정 문자가 소정 문자열의 뒤에 올 확률을 제공하는 모든 방법이 사용될 수 있다.
유의할 점은, 도 2를 참조하여 위에서 설명한 본 발명의 실시예가 선행 문자들이 인식되었다는 사실을 전제로 단일 문자에 대해 적용되더라도, 상기 방법은 먼저 인식된 문자들을 기반으로 한 번에 한 문자씩 모든 문자를 인식하기 위해 순차적으로 사용될 수 있다는 것이다. 이런 경우에 상기 문자 부분열 결정에 있어서의 모든 단계들이 각각의 문자에 대해 반복될 필요는 없으나, 인식되어야 할 현재 문자와 관련되는 문자 부분열을 결정함에 있어서 선행 문자에 대한 문자 부분열의 결정에서 나온 정보가 사용될 수 있다. 이는 도 3a 내지 도 3c를 참조한 이하의 설명으로부터 더 명료해질 것이다.
도 3a 내지 도 3c에는 본 발명에 따른 핸드라이팅 단어(handwritten word) 인식이 예시되어 있다. 박스들(310a 내지 310c)은 입력 핸드라이팅 단어를 포함하 고, 박스들(320a 내지 320c)은 상기 박스들(310a 내지 310c)의 핸드라이팅 문자들에 대한 후보 문자들을 포함하고, 그리고 박스들(330a 내지 330c)은 저장 문자열들 중에서 식별되는 후보 열들을 알파벳 순서로 포함한다.
아래에서, 핸드라이팅 입력의 문자들이 장치에 입력될 때 이들이 한번에 한 문자씩 인식되더라도, 상기 인식은 모든 문자들이 입력된 후 한번에 한 문자씩 순차적으로 수행되는 편이 낫다.
도 3a에서 박스(310a)에 표시된 바와 같이 핸드라이팅 미인식 문자가 입력되고, 박스(310b)에 표시된 바와 같이 핸드라이팅 인식에 의해 제공된 유일한 후보 문자는 "t"이다. 따라서, 문자 "t"가 상기 박스(310a) 내의 핸드라이팅 문자에 대한 가장 유력한 인식으로 선택된다.
도 3b에서 박스(310b)에 표시된 바와 같이 두 번째 핸드라이팅 미인식 문자가 입력된다. 박스(320b)에서 핸드라이팅 인식에 의해 문자 "h" 및 문자 "n" 양자 모두 후보 문자들로 제공된다. 이 경우, 결정된 문자 부분열은 "t"이다. 박스(330b)에서 상기 결정된 문자 부분열을 기반으로 다수의 후보 문자열, 이를테면 "than", "that", "the",..., "title", 및 "to"가 식별된다. 후보 문자열들은 알파벳 순서로 나타나기 때문에 "tn"으로 시작되는 모든 후보 문자열은 "title" 및 "to" 사이에 나타났을 것이다. 상기 후보 문자열들 중에서 부분열 "t" 이후에 다음 문자로서 "n"을 지니는 후보 문자열들이 존재하지 않고 그리고 상기 후보 문자열들 중에서 부분열 "t" 이후에 다음 문자로서 "h"를 지니는 후보 문자열이 세 개 이상 존재하기 때문에, 박스(310b) 내의 두 번째 핸드라이팅 문자에 대한 가장 유력한 인식으로서 "h"가 선택된다.
도 3c에서 박스(310c)에 표시된 바와 같이 세 번째 핸드라이팅 미인식 문자가 입력된다. 박스(320c)에서 핸드라이팅 인식에 의해 문자 "e" 및 문자 "l" 양자 모두 후보 문자들로 제공된다. 이 경우, 결정된 문자 부분열은 "th"이다. 박스(330c)에서 상기 결정된 문자 부분열을 기반으로 다수의 후보 문자열들, 이를테면 "the", "theatre", "theft",..., "this", 및 "thorn"이 식별된다. 후보 문자열들은 알파벳 순서로 나타나기 때문에 "thl"로 시작되는 모든 후보 문자열은 "this" 및 "thorn" 사이에 나타났을 것이다. 상기 후보 문자열들 중에서 부분열 "th" 이후에 다음 문자로서 "n"을 지니는 후보 문자열들이 존재하지 않고 그리고 상기 후보 문자열들 중에서 부분열 "th" 이후에 다음 문자로서 "e"를 지니는 후보 문자열이 세 개 이상 존재하기 때문에, 박스(310c)의 세 번째 핸드라이팅 문자에 대한 가장 유력한 인식으로서 "e"가 선택된다.
도 3a 내지 도 3c를 참조하여 설명된 상기 실시예에서, 문자열은 항상 저장 문자열들 중 한 저장 문자열 또는 1 이상의 저장 문자열의 이니셜 문자 부분열과 동일하기 때문에, 결정된 문자열은 항상 미인식 문자에 선행하는 완성된 문자열이다. 대신 핸드라이팅 단어가 "salsa"라면, 그리고 저장 문자 부분열들 중에 상기 단어 또는 이니셜 문자 부분열로서 "sals"를 지니는 다른 단어가 존재하지 않지만, 단어 "sale"은 존재한다면, 다음의 접근법이 사용될 수 있다. 미인식 문자로서 두 번째 "s"에 이르기까지, 상기 미인식 문자에 선행하는 완성된 문자열은 결정된 부분 문자열(determined sub-character string)로서 사용된다. 미인식 문자로서 두 번째 "s"에 대해, 후보 문자열들이 식별되지 않고, 1 이상의 후보 문자 중 한 후보 문자의 선택은 핸드라이팅 인식을 기반으로 한다. 변형적으로 상기 상황에서 상기 선택이 또한 선행 단일 문자를 기반으로 하는 다른 접근법이 사용될 수 있다. 미인식 문자로서 문자 "a"에 대해, "sal"은 저장 문자열 "sale"의 이니셜 문자 부분열 "sal"과 동일하고, 후속 문자 "s"가 더해진 "sal"은 상기 저장 문자열들 중 어떠한 저장 문자열과도 동일하지 않거나 또는 상기 저장 문자열들 중 어느 한 저장 문자열의 이니셜 문자 부분열과도 동일하지 않다. 그때는 결정된 문자 부분열이 상기 후속 문자 "s"로 시작하고 미인식 문자에 선행하는 문자로 끝나며, 상기 경우에는 상기 선행 문자도 "s"이다. 예컨대, 상기 경우 핸드라이팅 인식에 의해 후보 문자들이 "a" 및 "d"이면, 이니셜 문자 부분열로서 "sa"를 지니는 다수의 후보 문자열, 이를테면 "sale"이 식별될 것이나, 아마도 이니셜 문자 부분열로서 "sd"를 지니는 후보 문자열은 식별되지 않을 것이다. 따라서, 문자 "a"가 핸드라이팅 문자의 가장 유력한 인식으로 선택된다. 단어 "schoolboy"는 저장 문자열들 중 하나가 아니지만, "school" 및 "boy"가 상기 저장 문자열들 중 하나이거나 "school" 또는 "boy"로 시작하는 이니셜 문자 부분열을 지니는 다른 문자열이 상기 저장 문자열들 중 하나인 경우에 "schoolboy"와 같은 단어들에 대해 유사한 접근법이 사용될 수 있다.
상기 본 발명의 실시예들이 영어용으로 주어졌지만, 본 발명을 라틴 알파벳, 키릴 알파벳 등을 사용하는 다른 언어들의 핸드라이팅 인식에 적용하는 방법은 당업자에게 자명할 것이다.
본 발명은 또한, 문자들이 음절을 표시하고 각각의 단어가 1 이상의 문자로 이루지는 언어들, 이를테면 중국어에 대한 핸드라이팅 인식에 적용될 수 있다.
문자 중국어에 있어서, 단어들은 단일 문자이거나 2 이상의 문자일 수 있다. 예컨대, "Beijing"을 나타내는 단어는 두 개의 문자를 지니며, 상기 문자는 상기 단어의 각각의 음절을 나타낸다. 관용구들은 몇몇 문자들로 이루어질 수 있다. 사전(dictionary)들은 문자들, 단어들, 구들을 목록화(list)한다. 이러한 사전들의 버전들은 컴퓨터들 또는 그 밖의 이동 장치들에 전자적으로 저장될 수 있다.
중국어 텍스트는 접촉 감지면(touch-sensitive surface)에 각각의 문자를 기재함으로써 컴퓨터 또는 이동 장치에 입력될 수 있다. 몇몇 문자들은 단지 작은 차이들에 의해서만 구별되며, 종종 시스템이 2 이상의 유사한 문자들 중 어느 문자가 의도된 것인지를 결정하는 것이 어려울 수 있다.
본 발명은 다른 언어들에 관해 설명된 방식과 유사한 방식으로 모호한 중국어 문자들에 대한 인식을 개선할 수 있다. 시스템이 문자를 식별할 수 없을 때, 본 발명은 현재의 미인식 문자보다 먼저 입력된 몇몇 또는 모든 문자들로 이루어지는 부분열을 식별할 수 있다. 본 발명은 상용 단어들 및 상용 구들에 관한 저장 정보를 사용하여 상기 부분열의 다음에 올 가능성 있는 문자들을 결정하도록 할 수 있다. 본 발명은 그 결과를 사용하여 핸드라이팅 인식 시스템에 의해 제안되는 후보 문자들 중에서 선택하도록 할 수 있다.
중국어와 같은 언어들의 문자 텍스트에는 영어와 같은 언어들의 문자 텍스트에서처럼 스페이스 문자들에 의해 단어들 간의 구분이 표시되지 않기 때문에, 중국 어 핸드라이팅 문자 인식에 있어서의 문자 부분열의 결정에서는 단지 스페이스 문자들만을 사용하여 단어 구분이 식별되도록 할 수는 없다. 대신, 위에서 도 2를 참조하여 개시한 선행 문자들의 사용 및 상용 단어들과 상용 구들에 관한 저장 정보와의 비교가 문자 부분열을 결정하는데 적용될 수 있다. 또한, 문자 부분열의 결정은 예컨대, 처음에는 한 문자로 이루어진 부분열이 사용되고, 그 다음에는 두 문자로 이루어진 부분열이 사용되는 등, 반복적일 수도 있다. 변형적으로, 사용자는 핸드라이팅 문자들을 입력할 때 몇몇 방식으로 단어들 간의 구분을 표시할 수 있으며, 그러한 표시는 위에서 도 2를 참조하여 개시한 바와 같이 스페이스 문자들이 사용되는 방식과 유사한 방식으로 사용될 수 있다.

Claims (25)

  1. 입력 문자열을 나타내는 핸드라이팅 입력(handwritten input)의 문자들을 인식하는 방법에 있어서,
    상기 입력 문자열에서 미인식 문자(unrecognized character)에 선행하는, 상기 입력 문자열의 터미널 문자 부분열(terminal character sub-string)로 이루어진, 문자 부분열(character sub-string)을 결정하는 단계;
    핸드라이팅 인식(handwriting recognition)에 의해, 상기 미인식 문자에 대한 1 이상의 후보 문자(candidate character)를 제공하는 단계; 및
    상기 결정된 문자 부분열을 기반으로, 상기 1 이상의 후보 문자 중에서 상기 미인식 문자에 대한 가장 정확한 인식이 될 수 있는 한 후보 문자를 선택하는 단계를 포함하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  2. 제1항에 있어서,
    상기 문자 부분열 다음에 올 최고 확률을 가지는 후보 문자가 선택되는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  3. 제1항에 있어서,
    상기 핸드라이팅 입력 문자 인식 방법은, 저장 문자열(stored character string)들 중에서 상기 결정된 문자 부분열과 동일한 이니셜 문자 부분열(initial character sub-string)을 포함하는 1 이상의 후보 문자열을 식별하는 단계를 더 포 함하고,
    상기 선택 단계는, 상기 1 이상의 후보 문자열들을 기반으로 하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  4. 제3항에 있어서,
    상기 선택 단계는, 상기 1 이상의 후보 문자열 각각의 이니셜 문자 부분열의 뒤에 오는 다음 문자를 기반으로 하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  5. 제1항에 있어서,
    문자 부분열을 결정하는 상기 결정 단계는, 상기 입력 문자열의 문자들로서 상기 미인식 문자에 선행하는 모든 문자들로 이루어지는 문자 부분열을 결정하는 단계를 포함하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  6. 삭제
  7. 제1항에 있어서,
    문자 부분열을 결정하는 상기 결정 단계는,
    상기 입력 문자열 내의 스페이스 문자(space character)들을 식별하는 단계; 및
    상기 입력 문자열의 터미널 문자 부분열로서 상기 미인식 문자에 선행하는 그리고 식별된 스페이스 문자의 뒤에 오는 터미널 문자 부분열로 이루어지는 문자 부분열을 결정하는 단계를 포함하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  8. 제7항에 있어서,
    상기 입력 문자열의 터미널 문자 부분열로서 상기 미인식 문자에 선행하는 그리고 상기 미인식 문자 이전에 최후로 식별된 스페이스 문자의 뒤에 오는 터미널 문자 부분열로 이루어지는 문자 부분열이 결정되는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  9. 제3항에 있어서,
    문자 부분열을 결정하는 상기 결정 단계는,
    상기 입력 문자열의 임의의 이니셜 문자 부분열로서 상기 미인식 문자에 선행하는 임의의 이니셜 문자 부분열을 식별하는 단계로서, 상기 임의의 이니셜 문자 부분열이 상기 저장 문자열들 중 한 저장 문자열과 동일하거나 또는 상기 저장 문 자열들 중 1 이상의 저장 문자열의 이니셜 문자 부분열과 동일하고, 후속 문자가 더해진 상기 임의의 이니셜 문자 부분열이 상기 저장 문자열들 중 어떠한 저장 문자열과도 동일하지 않거나 또는 상기 저장 문자열들 중 어떠한 저장 문자열의 이니셜 문자 부분열과도 동일하지 않은 식별 단계; 및
    상기 입력 문자열의 터미널 문자 부분열로서 상기 미인식 문자에 선행하는 그리고 상기 식별된 임의의 이니셜 문자 부분열의 뒤에 오는 터미널 문자 부분열로 이루어지는 문자 부분열을 결정하는 단계를 포함하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  10. 제3항에 있어서,
    문자 부분열을 결정하는 상기 결정 단계는,
    상기 입력 문자열 내의 스페이스 문자들을 식별하는 단계;
    상기 입력 문자열의 임의의 단어 이니셜 문자 부분열(word initial character sub-string)로서 상기 미인식 문자에 선행하는 그리고 상기 미인식 문자 이전에 최후로 식별된 스페이스 문자 뒤에 오는 임의의 단어 이니셜 문자 부분열을 식별하는 단계로서, 상기 임의의 단어 이니셜 문자 부분열이 상기 저장 문자열들 중 한 저장 문자열과 동일하거나 또는 상기 저장 문자열들 중 1 이상의 저장 문자열의 이니셜 문자 부분열과 동일하고, 후속 문자가 더해진 상기 임의의 단어 이니셜 문자 부분열이 상기 저장 문자열들 중 어떠한 저장 문자열과도 동일하지 않거나 또는 상기 저장 문자열들 중 어떠한 저장 문자열의 이니셜 문자 부분열과도 동일하 지 않은 식별 단계; 및
    상기 입력 문자열의 터미널 문자 부분열로서 상기 미인식 문자에 선행하는 그리고 상기 식별된 임의의 단어 이니셜 문자 부분열의 뒤에 오는 터미널 문자 부분열로 이루어지는 문자 부분열을 결정하는 단계를 포함하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  11. 제3항에 있어서,
    상기 저장 문자열들은 다음 타입의 문자열들: 구(phrase)들, 단어(word)들, 단어 스터브(word stub)들 및 자주 쓰이는 문자 시퀀스(character sequence)들로부터 선택되는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  12. 제1항에 있어서,
    상기 핸드라이팅 입력 문자 인식 방법은, 상기 입력 문자열의 순서에 따른 각각의 문자로서 상기 미인식 문자에 선행하는 각각의 문자에 대하여,
    핸드라이팅 인식에 의해, 상기 문자에 대한 1 이상의 후보 문자를 제공하는 단계; 및
    상기 입력 문자열에서 상기 문자에 선행하는 문자들을 기반으로, 상기 1 이상의 후보 문자 중에서 상기 문자에 대한 가장 정확한 인식이 될 수 있는 한 후보 문자를 선택하는 단계를 포함하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  13. 입력 문자열을 나타내는 핸드라이팅 입력(handwritten input)의 문자들을 인식하는 장치에 있어서,
    상기 입력 문자열에서 미인식 문자(unrecognized character)에 선행하는, 상기 입력 문자열의 터미널 문자 부분열(terminal character sub-string)로 이루어진, 문자 부분열(character sub-string)을 결정하고, 핸드라이팅 인식에 의해 상기 미인식 문자에 대한 1 이상의 후보 문자를 제공하고, 그리고 상기 결정된 문자 부분열을 기반으로 상기 1 이상의 후보 문자 중에서 상기 미인식 문자에 대한 가장 정확한 인식이 될 수 있는 한 후보 문자를 선택하도록 구성되는 프로세서를 포함하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 장치.
  14. 제13항에 있어서,
    상기 프로세서는, 상기 문자 부분열의 뒤에 올 가장 높은 확률을 가지는 후보 문자를 선택하도록 구성되는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 장치.
  15. 제13항에 있어서,
    상기 핸드라이팅 입력 문자 인식 장치는, 문자열들을 저장하는 메모리를 더 포함하고,
    상기 프로세서는 또한, 저장 문자열(stored character string)들 중에서 상기 결정된 문자 부분열과 동일한 이니셜 문자 부분열을 포함하는 1 이상의 후보 문 자열을 식별하고, 그리고 상기 1 이상의 후보 문자열을 기반으로 상기 1 이상의 후보 문자 중에서 상기 미인식 문자에 대한 가장 정확한 인식이 될 수 있는 한 후보 문자를 선택하도록 구성되는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 장치.
  16. 제15항에 있어서,
    상기 프로세서는, 상기 1 이상의 후보 문자열 각각의 이니셜 문자 부분열의 뒤에 오는 다음 문자를 기반으로 상기 1 이상의 후보 문자 중에서 상기 미인식 문자에 대한 가장 정확한 인식이 될 수 있는 한 후보 문자를 선택하도록 구성되는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 장치.
  17. 제13항에 있어서,
    상기 프로세서는 또한, 상기 입력 문자열 내의 스페이스 문자(space character)들을 식별하고, 그리고 상기 입력 문자열의 터미널 문자 부분열(terminal character sub-string)로서 상기 미인식 문자에 선행하는 그리고 상기 미인식 문자 이전에 최후로 식별된 스페이스 문자의 뒤에 오는 터미널 문자 부분열로 이루어지는 문자 부분열을 결정하도록 구성되는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 장치.
  18. 제13항에 있어서,
    상기 저장 문자열은, 다음 타입의 문자열들: 구(phrase)들, 단어(word)들, 단어 스터브(word stub)들 및 자주 쓰이는 문자 시퀀스(character sequence)들로부터 선택되는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 장치.
  19. 제13항에 있어서,
    상기 핸드라이팅 입력 문자 인식 장치는 이동 단말기인 것을 특징으로 하는 핸드라이팅 입력 문자 인식 장치.
  20. 입력 문자열을 나타내는 핸드라이팅 입력(handwritten input)의 문자들을 인식하는 방법에 있어서,
    상기 입력 문자열에서 미인식 문자(unrecognized character)에 선행하는, 상기 입력 문자열의 터미널 문자 부분열(terminal character sub-string)로 이루어진, 문자 부분열(character sub-string)을 결정하는 단계;
    저장 문자열(stored character string)들 중에서, 상기 결정된 문자 부분열과 동일한 이니셜 문자 부분열(initial character sub-string)로 이루어지는 1 이상의 후보 문자열을 식별하는 단계;
    핸드라이팅 인식(handwriting recognition)에 의해, 상기 미인식 문자에 대한 1 이상의 후보 문자를 제공하는 단계; 및
    상기 1 이상의 후보 문자열들 각각의 이니셜 문자 부분열의 뒤에 오는 다음 문자를 기반으로, 상기 1 이상의 후보 문자들 중에서 상기 미인식 문자에 대한 가장 정확한 인식이 될 수 있는 한 후보 문자를 선택하는 단계를 포함하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  21. 제20항에 있어서,
    문자 부분열을 결정하는 상기 결정 단계는,
    상기 입력 문자열 내의 스페이스 문자(space character)들을 식별하는 단계; 및
    상기 입력 문자열의 터미널 문자 부분열(terminal character sub-string)로서 상기 미인식 문자에 선행하는 그리고 상기 미인식 문자 이전에 최후로 식별된 스페이스 문자의 뒤에 오는 터미널 문자 부분열로 이루어지는 문자 부분열을 결정하는 단계를 포함하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  22. 제20항에 있어서,
    문자 부분열을 결정하는 상기 결정 단계는,
    상기 입력 문자열 내의 스페이스 문자들을 식별하는 단계;
    상기 입력 문자열의 임의의 단어 이니셜 문자 부분열(word initial character sub-string)로서 상기 미인식 문자에 선행하는 그리고 상기 미인식 문자 이전에 최후로 식별된 스페이스 문자의 뒤에 오는 임의의 단어 이니셜 문자 부분열을 식별하는 단계로서, 상기 임의의 단어 이니셜 문자 부분열이 상기 저장 문자열들 중 한 저장 문자열과 동일하거나 또는 상기 저장 문자열들 중 1 이상의 저장 문자열의 이니셜 문자 부분열과 동일하고, 후속 문자가 더해진 상기 임의의 단어 이니셜 문자 부분열이 상기 저장 문자열들 중 어떠한 저장 문자열과도 동일하지 않거 나 또는 상기 저장 문자열들 중 어떠한 저장 문자열의 이니셜 문자 부분열과도 동일하지 않은 식별 단계; 및
    상기 입력 문자열의 터미널 문자 부분열로서 상기 미인식 문자에 선행하는 그리고 상기 식별된 임의의 단어 이니셜 문자 부분열의 뒤에 오는 터미널 문자 부분열로 이루어지는 문자 부분열을 결정하는 단계를 포함하는 것을 특징으로 하는 핸드라이팅 입력 문자 인식 방법.
  23. 이동 단말기에 있어서,
    입력 문자열을 나타내는 핸드라이팅 입력(handwritten input)을 검색하는 인터페이스;
    빈출 문자열들을 저장하는 메모리; 및
    상기 입력 문자열에서 미인식 문자(unrecognized character)에 선행하는, 상기 입력 문자열의 터미널 문자 부분열(terminal character sub-string)로 이루어진, 문자 부분열(character sub-string)을 결정하고, 상기 저장 문자열들 중에서 상기 결정된 문자 부분열과 동일한 이니셜 문자 부분열을 포함하는 1 이상의 후보 문자열을 식별하고, 핸드라이팅 인식에 의해 상기 미인식 문자에 대한 1 이상의 후보 문자를 제공하고, 그리고 상기 1 이상의 후보 문자열 각각의 이니셜 문자 부분열의 뒤에 오는 다음 문자를 기반으로 상기 1 이상의 후보 문자 중 상기 미인식 문자에 대한 가장 정확한 인식이 될 수 있는 한 후보 문자를 선택하도록 구성되는 프로세서를 포함하는 것을 특징으로 하는 이동 단말기.
  24. 제23항에 있어서,
    상기 프로세서는 또한, 상기 입력 문자열 내의 스페이스 문자(space character)들을 식별하고, 상기 입력 문자열의 터미널 문자 부분열(terminal character sub-string)로서 상기 미인식 문자에 선행하는 그리고 상기 미인식 문자 이전에 최후로 식별된 스페이스 문자의 뒤에 오는 터미널 문자 부분열로 이루어지는 문자 부분열을 결정하도록 구성되는 것을 특징으로 하는 이동 단말기.
  25. 제23항에 있어서,
    상기 입력 문자열 내의 스페이스 문자들을 식별하는 단계;
    상기 입력 문자열의 임의의 단어 이니셜 문자 부분열(word initial character sub-string)로서 상기 미인식 문자에 선행하는 그리고 상기 미인식 문자 이전에 최후로 식별된 스페이스 문자의 뒤에 오는 임의의 단어 이니셜 문자 부분열을 식별하는 단계로서, 상기 임의의 단어 이니셜 문자 부분열이 상기 저장 문자열들 중 한 저장 문자열과 동일하거나 또는 상기 저장 문자열들 중 1 이상의 저장 문자열의 이니셜 문자 부분열과 동일하고, 후속 문자가 더해진 상기 임의의 단어 이니셜 문자 부분열이 상기 저장 문자열들 중 어떠한 저장 문자열과도 동일하지 않거나 또는 상기 저장 문자열들 중 어떠한 저장 문자열의 이니셜 문자 부분열과도 동일하지 않은 식별 단계; 및
    상기 입력 문자열의 터미널 문자 부분열로서 상기 미인식 문자에 선행하는 그리고 상기 식별된 임의의 단어 이니셜 문자 부분열의 뒤에 오는 터미널 문자 부 분열로 이루어지는 문자 부분열을 결정하는 단계에 의해, 상기 프로세서가 문자 부분열을 결정하는 것을 특징으로 하는 이동 단말기.
KR1020067023041A 2004-05-04 2005-04-26 핸드라이팅 인식용 장치 및 방법 KR100858545B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/838,388 2004-05-04
US10/838,388 US8411958B2 (en) 2004-05-04 2004-05-04 Apparatus and method for handwriting recognition

Publications (2)

Publication Number Publication Date
KR20070010163A KR20070010163A (ko) 2007-01-22
KR100858545B1 true KR100858545B1 (ko) 2008-09-12

Family

ID=34967445

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067023041A KR100858545B1 (ko) 2004-05-04 2005-04-26 핸드라이팅 인식용 장치 및 방법

Country Status (9)

Country Link
US (1) US8411958B2 (ko)
EP (1) EP1743275B1 (ko)
KR (1) KR100858545B1 (ko)
CN (1) CN100416593C (ko)
AT (1) ATE454676T1 (ko)
DE (1) DE602005018764D1 (ko)
HK (1) HK1100586A1 (ko)
MX (1) MXPA06012760A (ko)
WO (1) WO2005106771A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461059B2 (en) * 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US7734094B2 (en) * 2006-06-28 2010-06-08 Microsoft Corporation Techniques for filtering handwriting recognition results
US8438489B2 (en) * 2008-01-24 2013-05-07 Paulo Barthelmess System and method for document markup
US8229225B2 (en) * 2008-05-06 2012-07-24 Wu Yingchao Candidate selection method for handwriting input
US8285049B2 (en) * 2008-06-06 2012-10-09 Microsoft Corporation Corrections for recognizers
KR101238292B1 (ko) * 2008-09-22 2013-03-04 글로리 가부시키가이샤 지엽류관리장치, 지엽류관리방법, 및 지엽류관리프로그램을 기록한 컴퓨터로 판독 가능한 기록매체
US8766918B2 (en) * 2009-07-10 2014-07-01 Koninklijke Philips N.V. User friendly entry of text items
US9898186B2 (en) 2012-07-13 2018-02-20 Samsung Electronics Co., Ltd. Portable terminal using touch pen and handwriting input method using the same
US10254952B2 (en) 2012-09-26 2019-04-09 Google Llc Progress display of handwriting input
WO2015015644A1 (ja) 2013-08-02 2015-02-05 株式会社 東芝 電子機器、方法及びプログラム
US9201592B2 (en) 2013-08-09 2015-12-01 Blackberry Limited Methods and devices for providing intelligent predictive input for handwritten text
JP2015094977A (ja) 2013-11-08 2015-05-18 株式会社東芝 電子機器及び方法
JP2015114976A (ja) * 2013-12-13 2015-06-22 株式会社東芝 電子機器及び方法
JP6342194B2 (ja) * 2014-03-28 2018-06-13 株式会社東芝 電子機器、方法及びプログラム
US9916300B2 (en) * 2015-11-16 2018-03-13 Lenovo (Singapore) Pte. Ltd. Updating hint list based on number of strokes
KR20200103236A (ko) * 2019-02-22 2020-09-02 삼성전자주식회사 수기에 기반한 입력을 디스플레이하기 위한 방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5151950A (en) * 1990-10-31 1992-09-29 Go Corporation Method for recognizing handwritten characters using shape and context analysis
US5347295A (en) 1990-10-31 1994-09-13 Go Corporation Control of a computer through a position-sensed stylus
WO1997033249A1 (en) * 1996-03-08 1997-09-12 Motorola Inc. Method and device for handwritten character recognition
US5835635A (en) 1994-09-22 1998-11-10 Interntional Business Machines Corporation Method for the recognition and completion of characters in handwriting, and computer system
US20040037470A1 (en) * 2002-08-23 2004-02-26 Simske Steven J. Systems and methods for processing text-based electronic documents

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5343537A (en) * 1991-10-31 1994-08-30 International Business Machines Corporation Statistical mixture approach to automatic handwriting recognition
CA2153684C (en) 1993-12-01 2000-03-21 John L. C. Seybold Combined dictionary based and likely character string method of handwriting recognition
US6970599B2 (en) 2002-07-25 2005-11-29 America Online, Inc. Chinese character handwriting recognition system
CN1372186A (zh) * 2001-02-23 2002-10-02 无敌科技(西安)有限公司 具智能联想中文输入方法
US7158678B2 (en) * 2001-07-19 2007-01-02 Motorola, Inc. Text input method for personal digital assistants and the like

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5151950A (en) * 1990-10-31 1992-09-29 Go Corporation Method for recognizing handwritten characters using shape and context analysis
US5347295A (en) 1990-10-31 1994-09-13 Go Corporation Control of a computer through a position-sensed stylus
US5835635A (en) 1994-09-22 1998-11-10 Interntional Business Machines Corporation Method for the recognition and completion of characters in handwriting, and computer system
WO1997033249A1 (en) * 1996-03-08 1997-09-12 Motorola Inc. Method and device for handwritten character recognition
US20040037470A1 (en) * 2002-08-23 2004-02-26 Simske Steven J. Systems and methods for processing text-based electronic documents

Also Published As

Publication number Publication date
WO2005106771A1 (en) 2005-11-10
MXPA06012760A (es) 2007-01-16
ATE454676T1 (de) 2010-01-15
HK1100586A1 (en) 2007-09-21
EP1743275A1 (en) 2007-01-17
EP1743275B1 (en) 2010-01-06
CN1950831A (zh) 2007-04-18
CN100416593C (zh) 2008-09-03
US20050249419A1 (en) 2005-11-10
US8411958B2 (en) 2013-04-02
DE602005018764D1 (de) 2010-02-25
KR20070010163A (ko) 2007-01-22

Similar Documents

Publication Publication Date Title
KR100858545B1 (ko) 핸드라이팅 인식용 장치 및 방법
CN107045496B (zh) 语音识别后文本的纠错方法及纠错装置
US8594999B2 (en) Typing candidate generating method for enhancing typing efficiency
KR100912753B1 (ko) 언어 입력 인식 방법, 기계 판독 가능 매체, 데이터 처리시스템, 사용자 언어 입력 처리 방법 및 언어 입력 예측방법
JPH08506444A (ja) 統合辞書ベースで、ありそうな文字列の手書き認識方法
WO2005064490A1 (en) System for recognising and classifying named entities
US20140380169A1 (en) Language input method editor to disambiguate ambiguous phrases via diacriticization
US9824139B2 (en) Method of searching for integrated multilingual consonant pattern, method of creating character input unit for inputting consonants, and apparatus for the same
Luu et al. A pointwise approach for Vietnamese diacritics restoration
Uthayamoorthy et al. Ddspell-a data driven spell checker and suggestion generator for the tamil language
Chaudhuri Reversed word dictionary and phonetically similar word grouping based spell-checker to Bangla text
US20150186738A1 (en) Text Recognition Based on Recognition Units
Wang et al. Chinese-braille translation based on braille corpus
US20210374189A1 (en) Document search device, document search program, and document search method
Munkhjargal et al. Named entity recognition for Mongolian language
CN111553155B (zh) 基于语义结构的口令分词系统及方法
Nguyen et al. An in-depth analysis of OCR errors for unconstrained Vietnamese handwriting
Mon Spell checker for Myanmar language
Wang et al. A conditional random fields approach to biomedical named entity recognition
JP2014164260A (ja) 情報処理装置およびその方法
Mon et al. Myanmar spell checker
Nedjo et al. Challenges of Diacritical Marker or Hudhaa Character in Tokenization of Oromo Text.
US20020057842A1 (en) Smart handwriting recognition apparatus and methods
JPH0684019A (ja) 手書き入力文字処理装置における句点認識装置
JPH03156589A (ja) 誤読文字の検出,修正方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120821

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130820

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140825

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150819

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160818

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170818

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180816

Year of fee payment: 11