CN101021850B - 单词检索设备和单词检索方法 - Google Patents

单词检索设备和单词检索方法 Download PDF

Info

Publication number
CN101021850B
CN101021850B CN2006100924749A CN200610092474A CN101021850B CN 101021850 B CN101021850 B CN 101021850B CN 2006100924749 A CN2006100924749 A CN 2006100924749A CN 200610092474 A CN200610092474 A CN 200610092474A CN 101021850 B CN101021850 B CN 101021850B
Authority
CN
China
Prior art keywords
word
character
character string
retrieval
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006100924749A
Other languages
English (en)
Other versions
CN101021850A (zh
Inventor
田中宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN101021850A publication Critical patent/CN101021850A/zh
Application granted granted Critical
Publication of CN101021850B publication Critical patent/CN101021850B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/387Matching; Classification using human interaction, e.g. selection of the best displayed recognition candidate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了单词检索设备、单词检索方法,以及记录介质。利用单词词典和用于存储手写字符的标准字符模式的坐标数据与字符的字符识别词典,由此来从单词词典中检索包括与一个或多个通过执行模式匹配而提取的字符模式对应的字符的单词。从单词词典的检索结果中仅提取与一个或多个字符模式对应的字符串,来产生部分字符串。接收在所产生的字符串部分之中对一个部分字符串的选择,并且从基于单词词典的检索结果中仅提取包括所选择的部分字符串的单词,以便显示所提取的单词。

Description

单词检索设备和单词检索方法
技术领域
本发明涉及单词检索设备和单词检索方法,它们用于具有诸如笔型输入板、鼠标等的坐标输入装置的个人计算机(此后称为PC),并使用通过手写输入、鼠标输入等书写的手写字符作为检索关键词,来从作为检索目标的单词词典中检索希望的单词。 
背景技术
使用手写字符作为检索关键词来检索单词的单词检索设备,被用于具有坐标输入装置(如笔型输入板、鼠标等)的PC。使用手写字符作为检索关键词的传统单词检索设备,通过获取用户书写的字符的手写数据的坐标值,并把获取的手写数据的坐标值与存储在字符识别词典中的标准字符模式进行比较,来识别字符。然后,该传统单词检索设备基于所识别的字符的结果来检索希望的单词,从而在显示单元上显示检索结果(参考日本专利特开No.9-259218)。 
图1是例示传统手写单词检索的示例的框图,其中双线包围的部分示出了基于字符识别结果检索出的检索结果的代表示例。在图1的示例中,字符识别结果未显示为用户识别为正确的“富士通”,而是显示为其中第二个字符不正确的“富さ通”。用户通过利用用于更正差错的装置,可以把第二个字符更正为“士”,从而获得包括希望单词的单词列表,作为检索结果。 
用于更正差错的装置具体不限于此,而是例如,当在表中列出字符识别结果的候选字符(串)时,用户通过利用笔型输入板、鼠标等指出不正确的字符,在表中列出的候选字符(串)之中选择希望的字符(串),从而更正差错。 
在一些用于通过使用手写字符作为检索关键词来检索单词的单词检索设备中,不采用如上所述的更正差错字符的方法,而是采用这样的方法,即,其利用包括识别候选字符的检索关键词来检索单词。在这种情况下,如果存在与优先级是第二级或更低的识别候选字符相匹配的字符,就认为该字符与检索关键词匹配,并且检索到对应的单词。同时,即使识别候选字符中没有用户希望的字符,也存在这样的方法,其在发现了除识别候选字符之外的其他字符时,把该字符用作单词检索的候选(参见日本专利特开No.8-305722)。 
发明内容
考虑到上述情况而作出本发明,并且本发明旨在提供这样的单词检索设备、单词检索方法,以及记录介质,即,它们能够将检索到的单词的数量抑制到预定限度,而又不会在更正差错时从识别候选字符中漏掉希望的字符。 
为了达到上述目的,依照本发明第一方面的单词检索设备包括:单词词典,用于存储多个单词;字符识别词典,用于存储手写字符的标准字符模式的坐标数据,以及对应于所述坐标数据的字符;以及手写字符接收装置,用于接收手写字符的输入,其中,从单词词典中检索包括与一个或多个字符模式对应的字符的单词,所述一个或多个字符模式是通过在由手写字符输入装置接收的手写字符与字符识别词典之间执行模式匹配而提取的,所述单词检索设备进一步包括:部分字符串产生装置,用于从单词词典的检索结果中仅提取与一个或多个字符模式对应的字符串,来产生部分字符串;接收装置,用于接收从所产生的部分字符串中对一个部分字符串的选择;提取装置,用于从基于单词词典的检索结果中仅提取包括所选择的部分字符串的单词;以及显示装置,用于显示所提取的单词。 
依照本发明第二方面的单词检索设备包括:单词词典,用于存储多个单词;字符识别词典,用于存储手写字符的标准字符模式的坐标数据,以及对应于所述坐标数据的字符;以及手写字符接收装置,用于接收手写字符的输入,其中,从单词词典中检索包括与一个或多个字符模式对 应的字符的单词,所述一个或多个字符模式是通过在由手写字符输入装置接收的手写字符与字符识别词典之间执行模式匹配而提取的,所述单词检索设备进一步包括:部分字符串产生装置,用于从单词词典的检索结果中仅提取与一个或多个字符模式对应的字符串,来产生部分字符串;候选字符提取装置,用于基于所产生的部分字符串提取针对每个字符的候选字符;接收装置,用于接收在所提取的候选字符中对一个候选字符的选择;部分字符串重构装置,用于基于所选择的候选字符,重构部分字符串;提取装置,用于从基于单词词典的检索结果中仅提取包括重构的部分字符串的单词;以及显示装置,用于显示所提取的单词。 
依照本发明第三方面的单词检索设备,在本发明的第一方面或第二方面基础上,还包括:计数装置,用于基于单词词典的检索结果,对检索到的单词的数量进行计数;和确定装置,用于确定计数的单词的数量是否大于预定值,其中,只有在确定装置确定计数的单词的数量大于预定值时,字符串产生装置才产生所述部分字符串,而在确定装置确定计数的单词的数量不大于预定值时,从单词词典的检索结果中接收选择。 
依照本发明第四方面的单词检索方法利用以下部分:单词词典,用于存储多个单词;字符识别词典,用于存储手写字符的标准字符模式的坐标数据,以及对应于所述坐标数据的字符,其中,接收手写字符的输入,并从单词词典中检索包括与一个或多个字符模式对应的字符的单词,所述一个或多个字符模式是通过在所接收的手写字符与字符识别词典之间执行模式匹配而提取的,其中,所述单词检索方法包括以下步骤:部分字符串产生步骤,从单词词典的检索结果中仅提取与一个或多个字符模式对应的字符串,来产生部分字符串;接收步骤,接收在所产生的部分字符串中对一个部分字符串的选择;提取步骤,从基于单词词典的检索结果中仅提取包括所选择的部分字符串的单词;以及显示步骤,显示所提取的单词。 
依据本发明第五方面的单词检索方法利用以下部分:单词词典,用于存储多个单词;和字符识别词典,用于存储手写字符的标准字符模式的坐标数据,以及对应于所述坐标数据的字符,其中,接收手写字符的 输入,并从单词词典中检索包括与一个或多个字符模式对应的字符的单词,所述一个或多个字符模式是通过在所接收的手写字符与字符识别词典之间执行模式匹配而提取的,其中,所述单词检索方法包括以下步骤:部分字符串产生步骤,从单词词典的检索结果中仅提取与一个或多个字符模式对应的字符串,来产生部分字符串;候选字符提取步骤,基于所产生的部分字符串,提取针对每个字符的候选字符;接收步骤,接收在所提取的候选字符中对一个候选字符的选择;部分字符串重构步骤,基于所选择的候选字符,重构部分字符串;提取步骤,从基于单词词典的检索结果中仅提取包括重构的部分字符串的单词;以及显示步骤,显示所提取的单词。 
依照本发明第六方面的单词检索方法,在本发明的第四方面或第五方面基础上,还包括以下步骤:计数步骤,基于单词词典的检索结果,对检索到的单词的数量进行计数;确定步骤,确定计数的单词的数量是否大于预定值,并且只有在确定计数的单词的数量大于预定值时,才产生所述部分字符串,而在确定计数的单词的数量不大于预定值时,从单词词典的检索结果中接收选择。 
依照本发明第七方面的记录介质包括:单词词典,用于存储多个单词;和字符识别词典,用于存储手写字符的标准字符模式的坐标数据,以及对应于所述坐标数据的字符,其中,接收手写字符的输入,并从单词词典中检索包括与一个或多个字符模式对应的字符的单词,所述一个或多个字符模式是通过在所接收的手写字符与字符识别词典之间执行模式匹配而提取的,其中,所述记录介质中记录的计算机程序产品使计算机充当以下装置:部分字符串产生装置,用于从单词词典的检索结果中仅提取与一个或多个字符模式对应的字符串,来产生部分字符串;接收装置,用于接收在所产生的部分字符串中对一个部分字符串的选择;提取装置,用于从基于单词词典的检索结果中仅提取包括所选择的部分字符串的单词;以及显示装置,用于显示所提取的单词。 
依照本发明第八方面的记录介质包括:单词词典,用于存储多个单词;字符识别词典,用于存储手写字符的标准字符模式的坐标数据,以 及对应于所述坐标数据的字符,其中,接收手写字符的输入,并从单词词典中检索包括与一个或多个字符模式对应的字符的单词,所述一个或多个字符模式是通过在所接收的手写字符与字符识别词典之间执行模式匹配而提取的,其中,所述记录介质中记录的计算机程序产品使计算机充当以下装置:部分字符串产生装置,用于从单词词典的检索结果中仅提取与一个或多个字符模式对应的字符串,来产生部分字符串;候选字符提取装置,用于基于所产生的部分字符串提取针对每个字符的候选字符;接收装置,用于接收在所提取的候选字符中对一个候选字符的选择;部分字符串重构装置,用于基于所选择的候选字符,重构部分字符串;提取装置,用于从基于单词词典的检索结果中仅提取包括重构的部分字符串的单词;以及显示装置,用于显示所提取的单词。 
依照本发明第九方面的记录介质,在本发明的第七方面或第八方面基础上,使计算机充当以下装置:计数装置,用于基于单词词典的检索结果,对检索到的单词的数量进行计数;确定装置,用于确定计数的单词的数量是否大于预定值,并且只有在确定装置确定计数的单词的数量大于预定值时,才由字符串产生装置产生所述部分字符串,而在确定装置确定计数的单词的数量不大于预定值时,从单词词典的检索结果中接收选择。 
在本发明的第一、第四以及第七方面中,从单词词典中检索包括与一个或多个字符模式对应的字符的单词,所述一个或多个字符模式是通过在所接收的手写字符与字符识别词典之间执行模式匹配而提取的。从单词词典的检索结果中仅提取与一个或多个字符模式对应的字符串,来产生部分字符串。接收在所产生的部分字符串中对一个部分字符串的选择,从基于单词词典的检索结果中仅提取包括所选择的部分字符串的单词,并显示所提取的单词。结果,可以把部分字符串限于用于在单词词典中进行检索的关键词信息,从而使得可以显著减少作为检索候选的单词的数量。因此,可以显著改进单词检索设备的可用性。 
在本发明的第二、第五以及第八方面中,从单词词典中检索包括与一个或多个字符模式对应的字符的单词,所述一个或多个字符模式是通 过在所接收的手写字符与字符识别词典之间执行模式匹配而提取的。从单词词典的检索结果中仅提取与一个或多个字符模式对应的字符串,来产生部分字符串。基于所产生的部分字符串提取针对每个字符的候选字符,在所提取的候选字符中接收对一个候选字符的选择,并基于所选择的候选字符重构部分字符串。从基于单词词典的检索结果中仅提取包括重构的部分字符串的单词,并且显示所提取的单词。结果,可以把部分字符串限于用于在单词词典中进行检索的关键词信息,从而使得可以显著减少作为检索候选的单词的数量。因此,可以显著改进单词检索设备的可用性。此外,因为在对字符进行差错更正时,识别候选字符中确实存在希望的字符,所以可以执行差错更正,而无需重新输入手写字符以再次执行字符识别,从而使得可以顺利执行单词检索。 
在本发明的第三、第六以及第九方面中,基于单词词典的检索结果,对检索到的单词的数量进行计数,确定计数的单词的数量是否大于预定值,并且只有在确定计数的单词的数量大于预定值时,才产生部分字符串,而在确定计数的单词的数量不大于预定值时,从单词词典的检索结果中接收选择。结果,只有在要被输出为检索结果的单词的数量变大时,才可以产生部分字符串,从而可以不对正常的单词检索增加数据处理负担,由此可以预先防止检索响应的劣化。 
依据本发明的第一、第四以及第七方面,可以将部分字符串限于用于在单词词典中进行检索的关键词信息,从而使得可以显著减少作为检索候选的单词的数量。因此,可以显著改进单词检索设备的可用性。 
依据本发明的第二、第五以及第八方面,可以将部分字符串限于用于在单词词典中进行检索的关键词信息,从而使得可以显著减少作为检索候选的单词的数量。因此,可以显著改进单词检索设备的可用性。此外,因为在对字符进行差错更正时,识别候选字符中确实存在希望的字符,所以可以执行差错更正,而无需重新输入手写字符以再次执行字符识别,从而使得可以顺利执行单词检索。 
依据本发明的第三、第六以及第九方面,只有在要被输出为检索结果的单词的数量变大时,才可以产生部分字符串,从而可以不对正常的 单词检索增加数据处理负担,由此可以预先防止检索响应的劣化。 
根据下面结合附图的详细描述,本发明的上述和进一步的目的与特征将更充分地显现。 
附图说明
图1是例示传统手写单词检索的示例的图; 
图2是例示依照本发明第一实施例的单词检索设备的构成的框图; 
图3是例示在带框架的输入的情况下,剪切出手写字符的示例的图; 
图4是例示在不带框架的输入的情况下,剪切出手写字符的示例的图; 
图5是例示识别候选字符与单词字符串之间的比较示例的图; 
图6是例示用于把识别候选字符与单词字符串进行匹配的程序产品的具体示例的图; 
图7是示意性地例示依照本发明第一实施例的单词检索设备的检索结果限制过程的图; 
图8是例示在依照本发明第一实施例的单词检索设备中使用的CPU的过程的流程图; 
图9A和9B是例示依照第一实施例的单词检索设备的显示屏面的示例的图; 
图10是例示在手写字符是字母单词时,识别候选字符与单词字符串之间的比较示例的图; 
图11是示意性地例示在手写字符是字母单词时,单词检索设备的检索结果限制过程的图; 
图12A和12B是例示在手写字符是字母单词时,单词检索设备的显示屏面的示例的图; 
图13是例示候选字符列表的示例的图; 
图14是例示在依照本发明第二实施例的单词检索设备中使用的CPU的过程的流程图; 
图15是示意性地例示用于产生候选字符列表的过程的图; 
图16是示意性地例示部分字符串重构过程的图; 
图17是例示在更正候选字符时的显示屏面的示例的图; 
图18是例示优先字符串的示例的图; 
图19是例示在获取普通写法(in longhand)的“fuji”的坐标数据作为手写字符时的候选字符列表的示例的图; 
图20是示意性地例示用于在手写字符是字母单词时,产生候选字符列表的过程的图; 
图21是示意性地例示在手写字符是字母单词时的部分字符串重构处理的图; 
图22是例示在手写字符是字母单词时对候选字符进行更正的屏面显示的示例的图; 
图23是例示在手写字符是字母单词时的优先字符串的示例的图;以及 
图24是例示在依照本发明第三实施例的单词检索设备中使用的CPU的过程的流程图。 
具体实施方式
在上述用于通过使用手写字符作为检索关键词来检索单词的常规单词检索设备中,当在字符识别中出现差错时,需要用户来更正差错或者检索希望的单词,所述希望的单词包括已通过使用优先级是第二级或更低级的识别候选字符作为检索关键词而检索到的单词。在前面的情况中,必需从识别候选字符中选择希望的字符,从而存在这样的问题,即,当识别候选字符中不存在希望的字符时,不能执行差错更正。在这种情况下,用户需要重新输入手写字符以再次执行字符识别,由此使得差错更正操作变复杂了。特别地,当用户以连体字方式书写手写字符时,在识别候选字符中可能不包括希望字符的可能性很高,从而使得难以顺利地执行单词检索。 
同时,在包括已通过使用优先级是第二级或更低级的识别候选字符作为检索关键词而检索到的单词的情况下,存在检索结果的单词数量显 著增大的问题。例如,当识别候选字符中漏掉希望的字符时,检索到的单词的数量进一步增大,并且检索结果的单词数量也增大了,使得选择希望的单词的操作变得更复杂,从而导致单词检索设备的可用性显著下降。 
考虑到上述情况而作出本发明,并且本发明旨在提供这样的单词检索设备、单词检索方法,以及记录介质,即,它们能够将检索到的单词的数量抑制到预定限度,而又不会差错更正时从识别候选字符中漏掉希望的字符,其中本发明的目的通过在下文描述的实施例来实现。 
(第一实施例) 
此后,具体参照附图对依照本发明第一实施例的单词检索设备进行描述。图2是例示依照本发明第一实施例的单词检索设备1的构成的框图。在图2中,单词检索设备1至少包括:CPU(中央处理单元)11、存储装置12、RAM(存储器)13、与外部通信装置相连接的通信接口部14、用于接收手写字符输入的手写字符输入装置15(如笔型输入板)、输入装置16(如鼠标、键盘等)、显示装置17(如监视器等),以及辅助存储装置18。 
CPU 11经由内部总线19与上述单词检索设备1的硬件的各个部分相连接,其中CPU 11控制上述硬件的各个部分,并且还依据存储装置12中存储的计算机程序产品3来执行各种基于软件的功能。存储装置12中存储的计算机程序产品3,可以在单词检索设备1发货时就已存储在存储装置12中,或者可以利用诸如DVD、CD-ROM等的便携型记录介质2,经由辅助存储装置18而存储在存储装置12中。 
存储装置12是以硬盘为代表的固定型记录介质,并且是用于存储待执行的计算机程序产品3、在待执行的计算机程序产品3中使用的数据等的存储装置。而且,存储装置12设有用于单词检索的单词词典121,和用于存储每个字符的坐标数据的标准模式的字符识别词典122。RAM 13包括SRAM、闪存等,并存储在软件执行期间产生的临时数据。 
通信接口部14与内部总线19相连接,并且通过与诸如LAN、WAN等的缆线相连接,来发送并接收处理所需的数据。手写字符输入装置15 也与内部总线19相连接,并且包括诸如记录笔、笔型输入板等的手写字符输入介质,从而接收手写字符的笔迹作为坐标数据。输入装置16也与内部总线19相连接,并且包括诸如鼠标、输入板等的定点装置(pointingdevice),以及以键盘为代表的键入装置等。显示装置17也与内部总线19相连接,并且包括液晶显示器、CRT显示器等。 
具有上述构成的单词检索设备1,通过根据检索结果的单词列表产生对应于书写输入的多个部分字符串,来使用户在其中选择一个正确的部分字符串,并且把检索结果的单词列表限制到包括所选择的部分字符串的单词,然后显示限制的单词。 
手写字符输入装置15接收由笔型输入板、记录笔等书写的手写字符的笔迹,作为坐标数据。坐标数据的原点不受具体限制,而可以是显示屏面的中心、或者显示屏面的四个角中的任何一个。另外,手写字符输入装置15可以是以叠置形式布置在显示装置17的屏幕上的透明输入板,或者可以不受具体限制,只要它是一种能够获取单独布置的输入板等的笔迹的坐标数据的装置即可。 
单词检索设备1的CPU 11基于获取的手写字符的笔迹的坐标数据,输出一系列识别候选字符串。然后,CPU 11根据手写字符的笔迹的坐标数据,产生对于每个单字符分离的坐标数据,并基于针对每个字符与字符识别词典122中存储的标准模式的比较而输出识别候选字符。在书写手写字符串时,存在带框架的输入和不带框架的输入,在带框架的输入中,在针对每个单字符的字符框中书写手写字符串,在不带框架的输入中,在没有字符框的区域中书写手写字符串。在带框架的输入的情况下,预先对于每个字符分离了手写数据。 
图3是例示在带框架的输入情况下剪切出手写字符的示例的图。在带框架的输入的情况下,如图3所示,针对每个字符框书写的坐标数据可以被获取为字符框中的坐标数据。图4是例示在不带框架的情况下剪切出手写字符的示例的图。在不带框架的输入的情况下,如图4所示,必需在针对每个字符分割手写字符串之后获取坐标数据。针对每个字符分割不带框架的字符串的方法不受具体限制,而是可以利用任何公知的 方法(例如,在“Institute of Electronics,Information and CommunicationEngineers seminar technical research report PRMU 98-139”中公开的分割方法)。 
CPU 11比较针对每个字符的识别候选字符与作为检索对象的单词,并从单词词典121中提取匹配的单词。单词词典121中存储有多个单词字符串,并且基于每个单词与所述识别候选字符之间的比较,获得用于指示匹配程度的评估值(评分)。CPU 11按评分的降序排列显示具有不低于某个值的评分的单词。在此注意,对单词的显示顺序进行排序可以按照评分的顺序来简单地重新排列这些单词,并且可以使用公知的排序算法,如二叉树排序、快速排序等。 
CPU 11顺序比较识别候选字符与单词字符串。在此,假定这样表示:用于匹配目标的单词字符串是S(i),而识别候选字符是R(j)(k)。图5是例示识别候选字符与单词字符串之间的比较的示例的图。在图5中,L、M以及D分别代表检索到的单词的单词长度、获取为手写字符的字符串长度,以及识别候选字符的数量。在图5示出的示例中,可以用S(0)表示“秋田富士通株式会社”中的“秋”,并且单词长度L是“9”。另外,手写的字符串长度M是“3”,而相应的识别候选字符的数量D是“5”。因此,例如,可以用R(1)(2)表示第二个字符的第三个候选的字符“土”。 
图6是例示用于对识别候选字符与单词字符串进行匹配的程序产品的具体示例的图。在图6中,采用C语言的单词匹配算法来描述程序产品。在图6中,假定R是结构数组(struct RS),其中字符码(code)和指示字符匹配程度的评分(score)是元素。当把识别候选字符R(j)(k)和单词S(i)提供给实参(argument)时,函数匹配检索单词与识别候选字符之间的匹配程度最高的部分,从而计算评分。如果发现与单词中的字符相匹配的字符,就把该字符的评分加到总评分maxScore上,而如果没有发现,就把恒定值CONST加到其上。在此,如果匹配的字符在数量上未达到书写字符的一半,则评分将是“0”,同时没有匹配。 
依据在图6中描述的程序产品,作为在单词与识别候选字符之间进行比较的结果,如果数量不小于某个值的字符与之匹配,就把匹配程度 存储在实参pSc中,并且函数匹配返回TRUE(真)。在此情况下,分别把与单词匹配的起始位置(在图5的情况下,因为其从第三个字符“富”开始,所以起始位置是“2”),以及匹配候选的历史记录分别存储在pSt、pPath中。 
图7是示意性地例示依照本发明第一实施例的单词检索设备1的检索结果限制过程的图。CPU 11,通过基于上述的模式匹配来产生多个识别候选字符串,并通过使用所述多个识别候选字符串作为关键词信息来在单词词典121中进行检索,来提取多个单词作为检索结果,如图7所示。单词检索设备1的CPU 11从提取的检索结果中提取与用户实际书写的字符串对应的部分字符串。例如,在图7中,当检索到的单词是“富士通明石工埸”时,与书写的部分相匹配的字符是从第一个字符到第三个字符的“富士通”。结果,把“富士通”提取为部分字符串。 
依据图6中描述的程序产品,部分字符串的位置被存储在作为函数匹配的实参pSt所指示的区域。因为用*pSt表示匹配部分的第一个字符的位置,所以第一个字符(即,“富”)是S(*pSt),而第二个字符是S(*pSt+1)。如上所述,通过把历史记录存储在检索结果中,可以容易地产生部分字符串。 
此外,在图6示出的程序产品中,针对一个单词字符串获得一个部分字符串。通过把这个过程应用于所有的检索结果,可以获得如图7的左侧表所示的表,其中部分字符串与每个检索单词相关联。这里,相同的部分字符串被合并成一个,并且它们中的每一个都创建链接信息。对于用于合并相同字符串的处理,可以按类似于字符串排序处理的方式使用广泛使用的技术。基于上述过程,可以获得部分字符串信息,其描述了检索结果单词与对应于每个检索结果单词的部分字符串之间的对应关系。 
与此类似地产生部分字符串组,例如,包括“富士通”、“冨山通”、“けさ通”等的部分字符串组,呈现给用户的部分字符串的数量将低于单词词典121的检索结果。结果,可以减少显示为检索结果的单词的数量。 
图8是例示在依照本发明第一实施例的单词检索设备1中使用的CPU 11的过程的流程图。单词检索设备1的CPU 11获取由笔型输入板、记录笔等书写的手写字符的笔迹的坐标数据(步骤S801)。CPU 11基于获取的手写字符的笔迹的坐标数据,参照字符识别词典122,来提取一系列识别候选字符串(步骤S802)。 
CPU 11将针对每个字符的识别候选字符与作为检索目标的单词进行比较,从而从单词词典121中获取包括该识别候选字符的单词作为检索结果(步骤S803)。CPU 11从提取的检索结果中,提取与用户实际书写的字符串(手写字符的识别结果)对应的部分字符串(步骤S804)。 
CPU 11确定所提取的部分字符串是否已被提取过,即,所提取的部分字符串是否已存储在RAM 13中(步骤S805)。如果CPU 11确定其尚未被提取过(步骤S805:否),则CPU 11把提取的部分字符串存储在RAM13中(步骤S806),而如果CPU 11确定其已被提取过(步骤S805:是),则CPU 11跳过步骤S806。在此注意,不限于如上所述的在获取所有的检索结果之后获取部分字符串的方法,而可以是例如只要检索到一个部分字符串就检索部分字符串的方法。 
CPU 11确定是否已对所有提取的检索结果完成了部分字符串提取处理(步骤S807)。如果CPU 11确定尚未完成该处理(步骤S807:否),则CPU 11把处理返回到步骤S804,来重复上述处理。如果CPU 11确定已完成所述处理(步骤S807:是),则CPU 11只向显示装置18输出包括存储在RAM 13中的部分字符串的检索结果,来显示该检索结果(步骤S808)。 
与此类似地产生部分字符串组,例如,包括“富士通”、“冨山通”、“けさ通”等的部分字符串组,从而呈现给用户的部分字符串的数量将低于单词词典121的检索结果。结果,可以减少显示为检索结果的单词的数量。 
CPU 11将处于等待状态,直到接收到用户对检索结果的选择(步骤S809),并且如果CPU 11确定接收到选择(步骤S809:是),则CPU 11完成单词检索处理。 
图9A和9B是例示依照第一实施例的单词检索设备1的显示屏面的示例的图。在图9A和9B中,显示屏面由手写字符输入区域91、部分字符串显示区域92、以及检索结果显示区域93组成。如图9A所示,当以手写字符将“富士通”输入到手写字符输入区域91中,同时在检索结果显示区域93中显示单词词典121的检索结果时,在部分字符串显示区域92中显示由上述处理提取的部分字符串。 
如图9B所示,用户利用记录笔等来从部分字符串显示区域92中显示的部分字符串中选择希望的部分字符串。通过选择部分字符串,将大大减少显示在检索结果显示区域92中的检索结果的数量。用户通过利用记录笔等来从检索结果显示区域93中显示的检索结果候选中选择希望的结果,可以容易地检索单词。 
也可以在字母单词中实现类似的处理。例如,当把普通写法的“fuji”的坐标数据获取为手写字符时,识别候选字符和单词字符串之间的比较将如图10所示。图10是例示在手写字符是字母单词时,识别候选字符与单词字符串之间的比较示例的图。在图10中,L、M以及D分别代表检索到的单词的单词长度、获取为手写字符的字符串长度、以及识别候选字符的数量。在图10示出的示例中,可以用S(0)表示“fijitsu labs.”中的“f”,并且单词长L度是“13”。另外,书写字符串长度M是“4”,并且相应的识别候选字符的数量D是“5”。因此,例如,可以用R(1)(2)表示作为第二个字符的第三候选的字符“u”。 
依据图6中示出的程序产品来执行匹配处理,并且如果数量不低于某个值的字符与此匹配,则把匹配程度存储在实参pSc中,并且函数匹配返回TRUE。在此情况下,把与单词匹配的起始位置(在图10的情况下,因为从第一字符“f”开始,所以起始位置是“0”),以及匹配候选的历史记录分别存储在pSt、pPath中。 
图11是示意性地例示在手写字符是字母单词时的单词检索设备1的检索结果限制过程的图。CPU 11通过基于上述的模式识别来产生多个识别候选字符串,并通过使用所述多个识别候选字符串作为关键词信息而在单词词典121中进行检索,来提取多个单词作为检索结果,如图11所 示。单词检索设备1的CPU 11从提取的检索结果中提取与用户实际书写的字符串相对应的部分字符串。例如,在图11中,当检索到的单词是“fujitsu”时,与书写部分匹配的字符是从第一个字符到第四个字符的“fuji”。结果,把“fuji”提取为部分字符串。 
在图6描述的程序产品中,把部分字符串的位置存储在作为函数匹配的实参pSt所指示的区域中。因为用*pSt代表匹配部分的第一个字符的位置,所以第一个字符(即,“f”)是S(*pSt),而第二个字符是S(*pSt+1)。如上所述,通过把历史记录存储在检索结果中,可以容易地产生部分字符串。 
此外,在图6示出的程序产品中,针对一个单词字符串获得一个部分字符串。通过把该过程应用于所有的检索结果,可以获得如图11的左侧表所示的表,其中部分字符串与每个检索单词相关联。这里,相同的部分字符串被合并成一个,并且它们中的每一个都创建链接信息。对于用于合并相同字符串的处理,可以按类似于字符串排序处理的方式,使用广泛使用的技术。基于上述过程,可以获得部分字符串信息,其描述检索结果单词与对应于每个检索结果单词的部分字符串之间的对应关系。 
与此类似地产生部分字符串组,例如,包括“fuji、“tutt”、“gual”等的部分字符串组,使得呈现给用户的部分字符串的数量将低于单词词典121的检索结果。在此,从显示的部分字符串中选择用户希望的部分字符串,并且只显示包括所选择的部分字符串的检索结果,从而使得可以进一步减少显示为检索结果的单词的数量。 
图12A和12B是例示在手写字符是字母单词时的单词检索设备1的显示屏面的示例的图。如图12A所示,当以手写字符将“fuji”输入到手写字符输入区域91中,同时在检索结果显示区域93中显示单词词典151的检索结果时,在部分字符串显示区域92中显示通过上述处理提取的部分字符串。 
如图12B所示,用户利用记录笔等从部分字符串显示区域92中显示的部分字符串中选择希望的部分字符串(例如“fuji”)。通过选择部分字 符串,将大大减少显示在检索结果显示区域92中的检索结果的数量。用户通过利用记录笔等从显示在检索结果显示区域93中的检索结果候选中选择希望的结果,可以容易地检索单词。 
如上所述,依据第一实施例,可以把部分字符串限于用于在单词词典中进行检索的关键词信息,从而使得可以显著减少作为检索候选的单词的数量。结果,可以减少要呈现给用户的单词候选的数量,从而可以实现单词检索效率的提高,由此使得可以期待在用户执行单词检索时的诸如减轻疲劳等的优点。 
(第二实施例) 
此后,将参照附图具体描述依照本发明第二实施例的单词检索设备1。因为依照本发明第二实施例的单词检索设备1的构成类似于第一实施例的单词检索设备1的构成,所以对于具有类似功能的部分赋予相同的标号,并且将略去对其的详细描述。本第二实施例与第一实施例的不同之处在于:产生用于针对每个候选字符分割部分字符串的候选字符列表,并且用户可以更正针对每个单字符的识别差错。 
图13是例示候选字符列表的示例的图。候选字符列表是用于基于预定的优先级显示候选字符的列表信息,所述候选字符是提取的部分字符串的字符单元。在图13的示例中,部分字符串具有3个字符,对于每个字符都把相同的候选字符合并成一个,并将其转换成候选字符列表。 
图14是例示在依照本发明第二实施例的单词检索设备1中使用的CPU 11的过程的流程图。单词检索设备1的CPU 11获取由笔型输入板、记录笔等书写的手写字符的笔迹的坐标数据(步骤S1401)。CPU 11基于获取的手写字符的笔迹的坐标数据,参照字符识别词典122,来提取一系列识别候选字符串(步骤S1402)。 
CPU 11将针对每个字符的识别候选字符与作为检索目标的单词进行比较,来从单词词典121中获取匹配的单词作为检索结果(步骤S1403)。CPU 11从所提取的检索结果中,提取与用户实际书写的字符串(手写字符的识别结果)对应的部分字符串(步骤S1404)。 
然后,CPU 11把提取的部分字符串分割成字符单元(步骤S1405), 计算每个分割字符的优先级(步骤S1406),并创建候选字符列表(步骤S1407)。在进行更正处理时,按照优先级在显示装置上显示所产生的候选字符列表,并接收用户的选择,从而使得可以更正识别差错。在此注意,不具体限制优先级的计算方法,而是可以使用包括下文描述的方法等的任何方法,只要其可以指定列表顺序即可。 
图15是示意性地例示用于产生候选字符列表的过程的图。如图15所示,针对每个字符分割提取的部分字符串,并且把相同位置上的相同字符合并成一个,以便产生候选字符列表。在更正识别差错时,针对每个字符显示候选字符列表,并接收通过记录笔等的选择。 
CPU 11确定是否已接收到针对每个字符的更正选择(步骤S1408),并且如果CPU 11确定已接收到更正选择(步骤S1408:是),则其在接收到的字符中把选定字符的优先级设置成最高,并且把这个字符识别为第一优先字符(步骤S1409)。 
CPU 11基于更正之后的字符重构部分字符串(步骤1410),并继续第一实施例的步骤S805之后的处理。部分字符串的重构是用于利用通过接收选择而确定的字符来重新产生部分字符串的处理。图16是示意性地例示部分字符串重构过程的图。在图16中,当选择并确定第三个字符“通”时,可以组成的包括其他候选字符的字符串的数量将被限制到20,如图16中间的表所示。使用限制后的字符串作为识别候选字符串,来提取与获取为手写字符的字符串相匹配的字符串,作为部分字符串,从而重构了在图16的右侧表中所表示的3个部分字符串。 
如上所述,通过根据部分字符串产生候选字符列表,即使从识别候选字符中漏掉了应当被正确识别的字符,也可以从显示为检索结果的单词中补足字符,使得可以在更正时的候选字符列表中显示所述字符,作为要被选择的字符。 
在此注意,不具体限制在显示候选字符列表中指定显示优先级的方法。例如,其可以是这种方法:按更高的优先级显示这样的候选字符,即,所述候选字符用于组成用户将针对候选选择中的字符而呈现给用户的字符候选列表与其他字符组合获得的相同部分字符串。结果,选择正 确字符变得更容易。 
图17是例示更正候选字符时的屏面显示的示例的图。在图17中,以第一优先级显示3个字符“富士通”,并且显示其中第3个字符“通”是更正目标的候选字符列表。如图17所示,在候选字符列表中的第3个字符处,呈现3个候选字符“通”、“道”以及“遅”。然而,因为包括在第一个字符和第二个字符处显示的“富”和“士”的部分字符串只有“富士通”和“富士道”,所以第3个字符按更高的优先级显示“通”和“道”。尽管在图17中用虚线来表示具有较低优先级的“遅”,但也可以显示或不显示这个字符。 
此外,对于在除作为候选字符的选择目标的字符(即,图17中的第3个字符“通”)之外的位置处显示的字符串,可以基于候选字符的显示状态在其前部或后部产生新的字符串,以按更高的优先级显示与该新的字符串关系更近的候选字符。图18是例示优先字符串的示例的图。在图18中,第3个字符“通”是候选字符的选择目标,其中“秋田”和“士通”分别被产生为前优先字符串和后优先字符串。CPU 11从多个部分字符串中选择包括全部两种优先字符串的字符串,来重新排列候选字符列表,以便可以按更高优先级显示包括在其中的候选字符。结果,可以按更高优先级显示与当前显示的字符串关系更近的候选字符,从而,使得用户选择候选字符变得更容易。 
也可以按与第一实施例中类似的方式在字母单词中实现类似的处理。图19是例示在把普通书写的“fuji”的坐标数据获取为手写字符时的候选字符列表的示例的图。候选字符列表是用于基于预定的优先级显示候选字符的列表信息,候选字符是提取的部分字符串的字符单元。在图19的示例中,部分字符串具有4个字符,并且针对每个字符都把相同的候选字符合并成一个,并将其转换成候选字符列表。 
图20是示意性地例示在手写字符是字母单词时用于产生候选字符列表的过程的图。如图20所示,针对每个字符分割所提取的部分字符串,并且把相同位置上的相同字符串合并成一个,从而产生候选字符列表。在针对每个字符更正识别差错时显示候选字符列表,并接收记录笔等的 选择。 
图21是示意性地例示在手写字符是字母单词时的部分字符串重构过程的图。在图21中,当选择并确定了第四个字符“i”时,可以组成的包括其他候选字符的字符串的数量将被限制到24,如图21中间的表所示。使用限制后的字符串作为识别候选字符串,来提取与获取为手写字符的字符串相匹配的字符串,作为部分字符串,从而重构了在图21的右侧表中表示的两个部分字符串“fuji和“lyti”。 
如上所述,通过根据部分字符串产生候选字符列表,即使从识别候选字符中漏掉了应当被正确识别的字符,也可以从显示为检索结果的单词中补足字符,从而可以在更正时的候选字符列表中把所述字符显示为要被选择的字符。 
在此注意,不具体限制在显示候选字符列表中指定显示优先级的方法。例如,其可以是这样的方法:按更高的优先级显示这样的候选字符,即,所述候选字符用于组成用户将针对候选选择中的字符而呈现给用户的字符候选列表与其他字符组合获得的相同部分字符串。结果,选择正确字符变得更容易。 
图22是例示在手写字符是字母单词时更正候选字符的屏面显示的示例的图。在图22中,以第一优先级显示4个字符“fuji”,并且显示其中第4个字符“i”是更正目标的候选字符列表。如图22所示,在候选字符列表中的第3个字符处呈现了3个候选字符“j”、“t”和“a”。然而,因为包括从第1个字符到第3个字符显示的“f”、“u”和“j”的部分字符串只有“fuji”,所以第4个字符只有按更高优先级显示“i”。尽管在图22中用虚线来表示具有较低优先级的“t”和“l”,但也可以显示或不显示它们。 
此外,对于在除作为候选字符的选择目标的字符之外的位置处显示的字符串,可以基于候选字符的显示状态在其前部和后部产生新的字符串,来按更高的优先级显示与该新的字符串关系更近的候选字符。图23是例示在手写字符是字母单词时的优先字符串的示例的图。在图23中,第3个字符“j”是候选字符的选择目标,其中分别把“fu”和“i”产生 为前优先字符串和后优先字符串。CPU 11从多个部分字符串中选择包括全部两种优先字符串的字符串,来重新排列候选字符列表,以便可以按更高优先级显示包括在其中的候选字符。结果,可以按更高优先级显示与当前显示的字符串关系更近的候选字符,从而使得用户选择候选字符变得更容易。 
如上所述,依据第二实施例,可以把部分字符串限于用于在单词词典中进行检索的关键词信息,从而使得可以显著减少作为检索候选的单词的数量。结果,可以减少要呈现给用户的单词候选的数量,以便可以实现单词检索效率的提高,由此,使得可以期待在用户执行单词检索时的诸如减轻疲劳等的优点。此外,根据部分字符串产生候选字符列表,使得可以预先防止漏掉候选字符,从而使得用户可以无误地更正识别差错。 
(第三实施例) 
下面,将参照附图具体描述依照本发明第三实施例的单词检索设备1。因为依照本发明第三实施例的单词检索设备1的构成类似于第一实施例的单词检索设备1的构成,所以对具有类似功能的部分赋予相同的标号,并且将略去其详细的描述。本第三实施例的特征在于:只有在要输出并显示为检索结果的单词的数量大于预定值时,才执行用于产生上述部分字符串的单词检索处理。 
换句话说,当检索结果的单词数量不是那么多时,没有必要特别基于部分字符串来限制单词数量,以便用户可以在显示为检索结果的单词中直接选择希望的单词。为此,CPU 11对显示为检索结果的单词的总数量进行计数,并且确定计数的单词的数量是否超出预定值,例如,可以一次显示在屏面上的约10个单词。如果CPU 11确定不多于10个单词,则可以不执行如第一和第二实施例的部分字符串产生处理。 
图24是例示在依照本发明第三实施例的单词检索设备1中使用的CPU 11的过程的流程图。单词检索设备1的CPU 11获取由笔型输入板、记录笔等书写的手写字符的笔迹的坐标数据(步骤S2401)。CPU 11基于获取的手写字符的笔迹的坐标数据,参照字符识别词典122,来提取一系 列识别候选字符串(步骤S2402)。 
CPU 11将针对每个字符的识别候选字符与作为检索对象的单词进行比较,从而从单词词典121中获取匹配的单词作为检索结果(步骤S2403),并且对提取的单词的数量进行计数(步骤S2404)。CPU 11确定计数的单词的数量是否大于预定值,例如“10”(步骤S2405)。 
如果CPU 11确定计数的单词的数量不大于预定值(步骤S2405:否),则CPU 11确定不需要特别产生部分字符串来减少检索单词,并执行正常的单词检索过程。如果CPU 11确定计数的单词的数量大于预定值(步骤S2405:是),则CPU 11将处理转到第一实施例的步骤S804或者第二实施例的步骤S1404,来执行前述过程。 
如上所述,依据本第三实施例,只有当用户的选择处理达到难以处理的数量时,例如当要输出为检索结果的单词的数量超出可以显示在屏面上的单词数量等时,才可以产生部分字符串,从而可以不对正常的单词检索增加数据处理负担,由此使得可以预先防止检索响应的劣化。 

Claims (8)

1.一种单词检索设备,该单词检索设备包括:
单词词典,用于存储多个单词;
字符识别词典,用于存储手写字符的标准字符模式的坐标数据,以及对应于所述坐标数据的字符;
手写字符输入装置,用于接收所述手写字符的输入;
模式匹配装置,用于从所述单词词典中检索由所述手写字符输入装置接收的手写字符与所述字符识别词典之间的匹配;
单词提取装置,用于提取包括与一个或多个字符模式对应的字符的单词;
部分字符串产生装置,用于从所述单词词典的检索结果中仅提取与一个或多个所述字符模式对应的字符串,来产生部分字符串;
接收装置,用于接收从所产生的部分字符串中对一个部分字符串的选择;
提取装置,用于从基于所述单词词典的检索结果中仅提取包括所选择的部分字符串的单词;以及
显示装置,用于显示所提取的单词。
2.如权利要求1所述的单词检索设备,该单词检索设备包括:
计数装置,用于基于所述单词词典的检索结果,对检索到的单词的数量进行计数;和
确定装置,用于确定所计数的单词的数量是否大于预定值,其中
只有在所述确定装置确定所计数的单词的数量大于所述预定值时,所述字符串产生装置才产生所述部分字符串,而在所述确定装置确定所计数的单词的数量不大于所述预定值时,接收从所述单词词典的检索结果中的选择。
3.一种单词检索设备,该单词检索设备包括:
单词词典,用于存储多个单词;
字符识别词典,用于存储手写字符的标准字符模式的坐标数据,以及对应于所述坐标数据的字符;以及
手写字符输入装置,用于接收所述手写字符的输入,其中
从所述单词词典中检索包括与一个或多个字符模式对应的字符的单词,所述一个或多个字符模式是通过在由所述手写字符输入装置接收的所述手写字符与所述字符识别词典之间执行模式匹配而提取的;
所述单词检索设备进一步包括:
部分字符串产生装置,用于从所述单词词典的检索结果中仅提取与一个或多个所述字符模式对应的字符串,来产生部分字符串;
候选字符提取装置,用于基于所产生的部分字符串提取针对每个字符的候选字符;
接收装置,用于接收在所提取的候选字符中对一个候选字符的选择;
部分字符串重构装置,用于基于所选择的候选字符,重构所述部分字符串;
提取装置,用于从基于所述单词词典的检索结果中仅提取包括重构的部分字符串的单词;以及
显示装置,用于显示所提取的单词。
4.如权利要求3所述的单词检索设备,该单词检索设备包括:
计数装置,用于基于所述单词词典的检索结果,对检索到的单词的数量进行计数;和
确定装置,用于确定所计数的单词的数量是否大于预定值,其中
只有在所述确定装置确定所计数的单词的数量大于所述预定值时,所述字符串产生装置才产生所述部分字符串,而在所述确定装置确定所计数的单词的数量不大于所述预定值时,接收从所述单词词典的检索结果中的选择。
5.一种单词检索方法,该单词检索方法使用以下部分:
单词词典,用于存储多个单词;和
字符识别词典,用于存储手写字符的标准字符模式的坐标数据,以及对应于所述坐标数据的字符,
该单词检索方法包括以下步骤:
接收手写字符的输入;
在所接收的手写字符与所述字符识别词典之间执行模式匹配;
提取包括与所述模式匹配的一个或多个字符模式相关的字符的单词;
从所述单词词典中检索所提取的单词;
从所述单词词典的检索结果中仅提取与一个或多个所述字符模式对应的字符串,来产生部分字符串;
接收在所产生的部分字符串之中对一个部分字符串的选择;
从基于所述单词词典的检索结果中仅提取包括所选择的部分字符串的单词;以及
显示所提取的单词。
6.如权利要求5所述的单词检索方法,该单词检索方法进一步包括以下步骤:
基于所述单词词典的检索结果,对检索到的单词的数量进行计数;
确定所计数的单词的数量是否大于预定值,并且
只有在确定所计数的单词的数量大于所述预定值时,才产生所述部分字符串,而在确定所计数的单词的数量不大于所述预定值时,接收从所述单词词典的检索结果中的选择。
7.一种单词检索方法,该单词检索方法包括以下步骤:
接收手写字符的输入;
在所接收的手写字符与字符识别词典之间执行模式匹配,所述字符识别词典用于存储手写字符的标准字符模式的坐标数据以及对应于所述坐标数据的字符;
提取包括与所述模式匹配的一个或多个字符模式相关的字符的单词;
从用于存储多个单词的单词词典中检索所提取的单词;
从所述单词词典的检索结果中仅提取与一个或多个所述字符模式对应的字符串,来产生部分字符串;
基于所产生的部分字符串,提取针对每个字符的候选字符;
接收在所提取的候选字符之中对一个候选字符的选择;
基于所选择的候选字符,重构所述部分字符串;
从基于所述单词词典的检索结果中仅提取包括重构的部分字符串的单词;以及
显示所提取的单词。
8.如权利要求7所述的单词检索方法,该单词检索方法进一步包括以下步骤:
基于所述单词词典的检索结果,对检索到的单词的数量进行计数;
确定所计数的单词的数量是否大于预定值,并且
只有在确定所计数的单词的数量大于所述预定值时,才产生所述部分字符串,而在确定所计数的单词的数量不大于所述预定值时,接收从所述单词词典的检索结果中的选择。
CN2006100924749A 2006-02-16 2006-05-31 单词检索设备和单词检索方法 Expired - Fee Related CN101021850B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006039815A JP4744317B2 (ja) 2006-02-16 2006-02-16 単語検索装置、単語検索方法、及びコンピュータプログラム
JP2006-039815 2006-02-16
JP2006039815 2006-02-16

Publications (2)

Publication Number Publication Date
CN101021850A CN101021850A (zh) 2007-08-22
CN101021850B true CN101021850B (zh) 2011-06-01

Family

ID=38368541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100924749A Expired - Fee Related CN101021850B (zh) 2006-02-16 2006-05-31 单词检索设备和单词检索方法

Country Status (3)

Country Link
US (1) US8208730B2 (zh)
JP (1) JP4744317B2 (zh)
CN (1) CN101021850B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8077974B2 (en) * 2006-07-28 2011-12-13 Hewlett-Packard Development Company, L.P. Compact stylus-based input technique for indic scripts
CN101206659B (zh) * 2006-12-15 2013-09-18 谷歌股份有限公司 自动搜索查询校正
JP4672692B2 (ja) * 2007-03-14 2011-04-20 株式会社東芝 単語認識システムおよび単語認識プログラム
US9261979B2 (en) * 2007-08-20 2016-02-16 Qualcomm Incorporated Gesture-based mobile interaction
WO2009026337A1 (en) * 2007-08-20 2009-02-26 Gesturetek, Inc. Enhanced rejection of out-of-vocabulary words
WO2009029865A1 (en) * 2007-08-31 2009-03-05 Google Inc. Automatic correction of user input
US7650445B2 (en) * 2007-09-12 2010-01-19 Motorola, Inc. System and method for enabling a mobile device as a portable character input peripheral device
US8103506B1 (en) * 2007-09-20 2012-01-24 United Services Automobile Association Free text matching system and method
US8229225B2 (en) * 2008-05-06 2012-07-24 Wu Yingchao Candidate selection method for handwriting input
US20100104189A1 (en) * 2008-10-23 2010-04-29 Aravamudhan Bharath Handwriting Identification Method, Program And Electronic Device
US9101961B2 (en) * 2009-09-24 2015-08-11 Nec Corporation Word recognition apparatus, word recognition method, non-transitory computer readable medium storing word recognition program, and delivery item sorting apparatus
TW201216124A (en) * 2010-10-12 2012-04-16 Inventec Corp Multi-block handwriting system and method thereof
CN101996238A (zh) * 2010-10-15 2011-03-30 无敌科技(西安)有限公司 运用多种语言输入提高搜寻匹配度的方法及其装置
CN102682033A (zh) * 2011-03-17 2012-09-19 环达电脑(上海)有限公司 通过二进制特征值匹配以查询文字的方法
KR20130080515A (ko) * 2012-01-05 2013-07-15 삼성전자주식회사 디스플레이 장치 및 그 디스플레이 장치에 표시된 문자 편집 방법.
WO2014174665A1 (ja) * 2013-04-26 2014-10-30 株式会社 東芝 システムおよび筆跡検索方法
KR20150007577A (ko) * 2013-07-11 2015-01-21 삼성전자주식회사 데이터 병합을 제어하는 휴대 단말 및 방법
US10684771B2 (en) 2013-08-26 2020-06-16 Samsung Electronics Co., Ltd. User device and method for creating handwriting content
CN105204658B (zh) * 2014-06-27 2019-02-05 联想(北京)有限公司 电子设备及其输入控制方法
JP6337661B2 (ja) * 2014-07-08 2018-06-06 富士通株式会社 入力支援装置、入力支援システム、入力支援方法、および入力支援プログラム
US20160154555A1 (en) * 2014-12-02 2016-06-02 Lenovo (Singapore) Pte. Ltd. Initiating application and performing function based on input
US9710701B2 (en) * 2015-03-26 2017-07-18 Lenovo (Singapore) Pte. Ltd. Handwriting data search
JP6679350B2 (ja) * 2016-03-09 2020-04-15 キヤノン株式会社 情報処理装置、プログラム及び情報処理方法
JP6506427B1 (ja) * 2018-01-25 2019-04-24 株式会社リクルート 情報処理装置、動画検索方法、生成方法及びプログラム
CN112836624B (zh) * 2021-01-29 2024-07-05 北京大米科技有限公司 一种文本处理方法、装置、存储介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1117319A (zh) * 1993-12-01 1996-02-21 摩托罗拉公司 以字典为基础与可能的字符串结合的手写物识别方法
CN1150279A (zh) * 1995-06-20 1997-05-21 索尼公司 识别手写字符的装置和方法
US6970877B2 (en) * 2002-06-28 2005-11-29 Microsoft Corporation Reducing and controlling sizes of prototype-based recognizers

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58155443A (ja) * 1982-03-11 1983-09-16 Fujitsu Ltd 日本語入力方式
JPS5953985A (ja) * 1982-09-20 1984-03-28 Toshiba Corp 文字認識装置
JPS6097477A (ja) * 1983-10-31 1985-05-31 Fujitsu Ltd 誤読文字修正方式
US5191622A (en) * 1987-07-17 1993-03-02 Hitachi, Ltd. Hand-written character recognition apparatus with a personal dictionary preparation function
US5022081A (en) * 1987-10-01 1991-06-04 Sharp Kabushiki Kaisha Information recognition system
US5167016A (en) * 1989-12-29 1992-11-24 Xerox Corporation Changing characters in an image
US5649027A (en) * 1992-07-24 1997-07-15 Microsoft Corporation Recognition of handwritten words
JP2917748B2 (ja) * 1993-06-01 1999-07-12 三菱電機株式会社 文字入力装置
JP3220886B2 (ja) * 1993-06-23 2001-10-22 株式会社日立製作所 文書検索方法および装置
US5734749A (en) * 1993-12-27 1998-03-31 Nec Corporation Character string input system for completing an input character string with an incomplete input indicative sign
JP3230641B2 (ja) * 1995-05-08 2001-11-19 シャープ株式会社 文字列検索装置
TW338815B (en) * 1995-06-05 1998-08-21 Motorola Inc Method and apparatus for character recognition of handwritten input
US5818437A (en) * 1995-07-26 1998-10-06 Tegic Communications, Inc. Reduced keyboard disambiguating computer
JP4326591B2 (ja) * 1995-07-26 2009-09-09 テジック・コミュニケーションズ・インコーポレーテッド 減少型キーボード曖昧さ除去システム
US5917941A (en) * 1995-08-08 1999-06-29 Apple Computer, Inc. Character segmentation technique with integrated word search for handwriting recognition
JP3383485B2 (ja) * 1995-09-04 2003-03-04 シャープ株式会社 情報検索装置
JP3376808B2 (ja) * 1996-03-22 2003-02-10 三菱電機株式会社 単語入力装置並びに単語入力方法
ES2182363T3 (es) * 1997-09-25 2003-03-01 Tegic Communications Inc Sistema de resolucion de ambiguedades de teclado reducido.
US6377965B1 (en) * 1997-11-07 2002-04-23 Microsoft Corporation Automatic word completion system for partially entered data
US5896321A (en) * 1997-11-14 1999-04-20 Microsoft Corporation Text completion system for a miniature computer
US7319957B2 (en) * 2004-02-11 2008-01-15 Tegic Communications, Inc. Handwriting and voice input with automatic correction
US6801659B1 (en) * 1999-01-04 2004-10-05 Zi Technology Corporation Ltd. Text input system for ideographic and nonideographic languages
US6618697B1 (en) * 1999-05-14 2003-09-09 Justsystem Corporation Method for rule-based correction of spelling and grammar errors
US7030863B2 (en) * 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
AU5299700A (en) * 1999-05-27 2000-12-18 America Online, Inc. Keyboard system with automatic correction
US7286115B2 (en) * 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
US7194404B1 (en) * 2000-08-31 2007-03-20 Semantic Compaction Systems Linguistic retrieval system and method
JP2004046388A (ja) * 2002-07-10 2004-02-12 Hitachi Ltd 情報処理システムおよび文字修正方法
JP3979288B2 (ja) * 2002-12-26 2007-09-19 日本電気株式会社 文書検索装置および文書検索プログラム
WO2005008899A1 (en) * 2003-07-17 2005-01-27 Xrgomics Pte Ltd Letter and word choice text input method for keyboards and reduced keyboard systems
US7088861B2 (en) * 2003-09-16 2006-08-08 America Online, Inc. System and method for chinese input using a joystick
US6989822B2 (en) * 2003-11-10 2006-01-24 Microsoft Corporation Ink correction pad
JP2005301914A (ja) * 2004-04-15 2005-10-27 Sharp Corp 携帯情報機器
US8077974B2 (en) * 2006-07-28 2011-12-13 Hewlett-Packard Development Company, L.P. Compact stylus-based input technique for indic scripts

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1117319A (zh) * 1993-12-01 1996-02-21 摩托罗拉公司 以字典为基础与可能的字符串结合的手写物识别方法
CN1150279A (zh) * 1995-06-20 1997-05-21 索尼公司 识别手写字符的装置和方法
US6970877B2 (en) * 2002-06-28 2005-11-29 Microsoft Corporation Reducing and controlling sizes of prototype-based recognizers

Also Published As

Publication number Publication date
CN101021850A (zh) 2007-08-22
US8208730B2 (en) 2012-06-26
JP2007219849A (ja) 2007-08-30
US20070189613A1 (en) 2007-08-16
JP4744317B2 (ja) 2011-08-10

Similar Documents

Publication Publication Date Title
CN101021850B (zh) 单词检索设备和单词检索方法
US11514698B2 (en) Intelligent extraction of information from a document
Roman-Rangel et al. Analyzing ancient maya glyph collections with contextual shape descriptors
CN104809142A (zh) 商标查询系统和方法
JPH10507025A (ja) 走査された及びリアルタイムの手書き文字の識別を行う文字認識システム
Noce et al. Embedded textual content for document image classification with convolutional neural networks
CN105095878A (zh) 网络查询中的在线手写识别系统和方法
JP2011248596A (ja) 画像入り文書の検索システム及び検索方法
CN107291682A (zh) 一种基于跳转处理及双重校验的多篇电子文档分篇算法
CN102243708B (zh) 一种手写识别方法、系统及手写识别终端
Abdallah et al. Transformers and language models in form understanding: A comprehensive review of scanned document analysis
M’rabet et al. TextFlow: a text similarity measure based on continuous sequences
Abirami et al. Handwritten mathematical recognition tool
JP6763967B2 (ja) データ変換装置とデータ変換方法
JPH08305722A (ja) 文字列検索装置
Lu et al. Mining discriminative patches for script identification in natural scene images
CN110378378B (zh) 事件检索方法、装置、计算机设备及存储介质
EP2026216A1 (en) Data processing method, computer program product and data processing system
CN112579740A (zh) 用于医药检索的检索结果卡片化展示系统及方法
Le et al. Automated labeling of zones from scanned documents
Giguet et al. Daniel@ FinTOC-2021: Taking advantage of images and vectorial shapes in native PDF document analysis
JP5233424B2 (ja) 検索装置およびプログラム
JP7453731B2 (ja) 半構造化ドキュメントから情報を取り出す方法及びシステム
KR102649429B1 (ko) 반정형 문서로부터 정보를 추출하는 방법 및 시스템
JP5610019B2 (ja) 検索装置およびプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110601

Termination date: 20180531

CF01 Termination of patent right due to non-payment of annual fee