CN103076892B - 一种用于提供输入字符串所对应的输入候选项的方法与设备 - Google Patents

一种用于提供输入字符串所对应的输入候选项的方法与设备 Download PDF

Info

Publication number
CN103076892B
CN103076892B CN201210592774.9A CN201210592774A CN103076892B CN 103076892 B CN103076892 B CN 103076892B CN 201210592774 A CN201210592774 A CN 201210592774A CN 103076892 B CN103076892 B CN 103076892B
Authority
CN
China
Prior art keywords
input
character string
candidate item
input character
contextual information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210592774.9A
Other languages
English (en)
Other versions
CN103076892A (zh
Inventor
陆阳阳
孟可丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210592774.9A priority Critical patent/CN103076892B/zh
Publication of CN103076892A publication Critical patent/CN103076892A/zh
Priority to EP13867100.3A priority patent/EP2940557B1/en
Priority to PCT/CN2013/086968 priority patent/WO2014101577A1/zh
Priority to JP2015549962A priority patent/JP6114403B2/ja
Priority to US14/412,287 priority patent/US20150293972A1/en
Application granted granted Critical
Publication of CN103076892B publication Critical patent/CN103076892B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Abstract

本发明的目的是提供一种用于提供输入字符串所对应的输入候选项的方法与设备。其中,输入设备获取输入字符串;确定所述输入字符串的上下文信息;根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。与现有技术相比,本发明通过根据输入字符串的上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;并将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用;从而提高了输入灵活度,与用户的输入需求相匹配,还提高了输入法的输入效率,改善了用户体验。

Description

一种用于提供输入字符串所对应的输入候选项的方法与设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于提供输入字符串所对应的输入候选项的技术。
背景技术
对于中文输入而言,存在大量的同音异义词,而实际用户在输入过程中仅会选择其中的一个,当前的输入法将多个输入候选项提供给用户,由用户根据需求进行选择,当输入候选项较多时,用户进行选择操作则会导致输入的缓慢低效。考虑到文字的输入间具有一定的语义或逻辑关系,如何利用所述语义或逻辑关系,对输入候选项进行处理,从而提升用户的使用体验,成为本领域技术人员亟需解决的一个问题。
发明内容
本发明的目的是提供一种用于提供输入字符串所对应的输入候选项的方法与设备。
根据本发明的一个方面,提供了一种用于提供输入字符串所对应的输入候选项的方法,其中,该方法包括以下步骤:
a获取输入字符串;
b确定所述输入字符串的上下文信息;
c根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;
d将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。
根据本发明的另一方面,还提供了一种用于提供输入字符串所对应的输入候选项的输入设备,其中,该设备包括:
获取装置,用于获取输入字符串;
上下文确定装置,用于确定所述输入字符串的上下文信息;
候选项确定装置,用于根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;
提供装置,用于将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。
与现有技术相比,本发明通过根据输入字符串的上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;并将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用;从而提高了输入灵活度,与用户的输入需求相匹配,还提高了输入法的输入效率,改善了用户体验。
而且,本发明还可以通过对与所述输入字符串对应的一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项;进一步地,还可以根据所述初步输入候选项与所述上下文信息对应的搭配相关度信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项;更进一步地,还可以根据对文本信息的分析处理,获得搭配频度满足一定阈值的分词搭配关系,从而建立或更新所述词语搭配数据库;从而提高了输入字符串与输入候选项的匹配准确度,与用户的输入需求相匹配,提高了输入法的输入效率,改善了用户体验。
而且,本发明还可以确定包含所述输入字符串的增补字符串,并根据所述增补字符串,获得与所述增补字符串对应的一个或多个增补输入候选项,通过对所述增补输入候选项进行筛选处理,以获得所述一个或多个输入候选项;从而提高了输入灵活度,提高了输入字符串与输入候选项的匹配准确度,与用户的输入需求相匹配,提高了输入法的输入效率,改善了用户体验。
而且,本发明还可以所述输入字符串所对应的相关文本进行自然语言处理,从所述相关文本提取对应的焦点词语,以作为所述上下文;从而提高了输入字符串与输入候选项的匹配准确度,与用户的输入需求相匹配,提高了输入法的输入效率,改善了用户体验。
而且,本发明还可以检测所述输入字符串是否超出预定的长度阈值,若所述输入字符串超出所述长度阈值,根据所述输入字符串,以及所述上下文信息,迭代确定与所述输入字符串对应的一个或多个输入候选项;进一步地,通过检测所述输入字符串在输入词库中对应的一个或多个抽样输入候选项中至少一个中的字数是超出预定的字数阈值,以确定所述输入字符串是否超出预定的长度阈值;进一步地,当所述输入字符串超出所述长度阈值,还可以确定部分输入候选项与其余输入候选项,并根据所述一个或多个部分输入候选项,以及所述一个或多个其余输入候选项,确定所述一个或多个输入候选项;从而提高了输入灵活度,提高了输入字符串与输入候选项的匹配准确度,与用户的输入需求相匹配,提高了输入法的输入效率,改善了用户体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种用于提供输入字符串所对应的输入候选项的输入设备示意图;
图2示出根据本发明一个优选实施例的一种用于提供输入字符串所对应的输入候选项的输入设备示意图;
图3示出根据本发明另一个优选实施例的一种用于提供输入字符串所对应的输入候选项的输入设备示意图;
图4示出根据本发明另一个方面的一种用于提供输入字符串所对应的输入候选项的方法流程图;
图5示出根据本发明一个优选实施例的一种用于提供输入字符串所对应的输入候选项的方法流程图;
图6示出根据本发明另一个优选实施例的一种用于提供输入字符串所对应的输入候选项的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的一种用于提供输入字符串所对应的输入候选项的输入设备示意图;其中,所述输入设备包括获取装置11、上下文确定装置12、候选项确定装置13、提供装置14。具体地,获取装置11获取输入字符串;上下文确定装置12确定所述输入字符串的上下文信息;候选项确定装置13根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;提供装置14将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。在此,输入设备包括但不限于网络设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设备。其中,所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解,其他的输入设备同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地或者按照设定的或实时调整的工作模式要求,进行输入字符串的获取、上下文信息的确定、输入候选项的确定、输入候选项的提供等,直至输入设备停止获取输入字符串。
获取装置11获取输入字符串。具体地,所述获取装置11通过从输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入的字符串;或者根据各种通信协议(Communications Protocol),通过各种数据传输接口,获取从其他应用的输入框中的字符串;其中,所述输入框如短信编辑框、内容输入框等。其中,所述输入字符串包括但不限于通过如全拼或简拼等方式所输入的拼音编码字符等。
上下文确定装置12确定所述输入字符串的上下文信息。具体地,所述上下文确定装置12通过根据获取装置11所获取的输入字符串,利用当前所输入的字符串所属的文字等,将所述当前输入字符串所属的文字与一个或多个词库进行匹配,获取与所述输入字符串相关联的一种或多种匹配信息,并作为所述输入字符串的上下文信息;例如,当输入“huacao”时,先确定所述输入字符串所属的文字可能为“花草”,根据“花草”在所属词库中的匹配信息,确定其下文信息可能为“茶”等;或者,所述上下文确定装置12通过根据与所述输入字符串相对应的历史记录信息,对所述输入字符串的上下文信息进行确定,例如,所述输入字符串前刚刚上屏的前一个输入字符串,则可作为所述输入字符串的前文信息。在此,所述上下文信息包括但不限于与所述输入字符串相对应的上文信息或下文信息;例如,当所述输入为“shishi”时,当前次输入所上屏的词组为“客观”时,则所述“shishi”对应的上文信息为“客观”;若屏幕上存在一个词组“计划”,且输入“shishi”时,光标位于“计划”前,则其所对应的下文信息为“计划”等。
候选项确定装置13根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项。具体地,候选项确定装置13通过根据获取装置11所获取的输入字符串,以及上下文确定装置12所确定的上下文信息,通过将与所述输入字符串相对应的一个或多个上下文信息直接作为一个或多个输入候选项,或者将所述输入字符串相对应的上下文信息进行处理后作为输入候选项的方式,确定与所述输入字符串对应的一个或多个输入候选项。例如,继上例,当所述输入字符串为“shishi”时,其所对应的上文信息可能为“客观”,“我”,“谈论”等,当所述上文信息为“客观”时,通过利用将所述输入字符串,以及所述上下文信息进行匹配等的方式,确定输入候选项为“事实”、“实时”、“实施”等;当所述上文信息为“我”时,确定输入候选项为“试试”、“实施”、“试试”等;当所述上文信息为“谈论”时,确定输入候选项为“时事”、“事实”、“世事”等。
提供装置14将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。具体地,提供装置14通过直接提供,或根据各种通信协议(Communications Protocol),通过各种数据传输接口,通过例如重新排序或筛选等方式,将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中,所述目标应用包括但不限于与所述获取装置11所对应的输入框相对应的相同应用,或者与所述获取装置11所对应的输入框相关联的其他应用等,如直接利用所述输入候选项进行搜索等。
优选地,所述候选项确定装置13还可以根据所述输入字符串,以及所述上下文信息,确定包含所述输入字符串的增补字符串,其中,所述增补字符串还包括所述上下文信息所对应的字符串;根据所述增补字符串,在输入词库中进行匹配查询,以获得与所述增补字符串对应的一个或多个增补输入候选项;根据所述上下文信息,对所述一个或多个增补输入候选项进行筛选处理,以获得所述一个或多个输入候选项。具体地,所述候选项定装置13还可以根据所述输入字符串,以及所述上下文信息,通过将所述输入字符串结合所述上下文信息与例如输入词库进行匹配等方式,确定包含所述输入字符串的增补字符串,例如,当输入字符串为“xuxu”时,当上下文信息为“形态”,则确定所述增补字符串为“rusheng”;或者,当输入字符串为”tianan”,上下文信息为“北京”,则确定所述增补字符串为“men”,在此,所述增补字符串包括但不限于通过匹配等方式,确定一个或多个通过拼接而成的多段字符串。所述候选项定装置13通过将所述增补字符串在输入词库中进行匹配查询,以获得与所述增补字符串对应的一个或多个增补输入候选项;继前例,所述增补字符串为“rusheng”时所对应的增补输入候选项如“如生”、“入声”、“入胜”等,所述增补字符串为“men”时,所对应的增补输入候选项如“天安门”、“门”等。或者,所述增补输入候选项还可以直接包括所述上下文信息,如直接生成“形态栩栩如生”、“北京天安门”等。根据所述上下文信息,对所述一个或多个增补输入候选项进行筛选处理,继前例,根据上下文信息,分别确定输入候选项为“栩栩如生”、“天安门”从而获得所述一个或多个输入候选项;在此,若所述增补输入候选项中包含上下文信息,则将所述增补输入候选项中的上下文信息删除后,获得所述一个或多个输入候选项,如所述增补输入候选项“北京天安门”中的“北京”删除,获得所述一个或多个输入候选项“天安门”。
优选地,所述上下文确定装置12还可以通过对所述输入字符串所对应的相关文本进行自然语言处理,从所述相关文本提取对应的焦点词语,以作为所述上下文,其中,所述焦点词语邻近所述输入字符串所对应的输入位置。具体地,所述上下文确定装置12还可以通过分词或语义分析等方式,对所述输入字符串所对应的相关文本进行自然语言处理,其中,所述相关文本包括但不限于所述输入字符串本身所对应的文本,或者所述输入字符串所对应的输入位置前后已经上屏的相关文本;通过对所述相关文本中经由自然语言处理,提取对应的焦点词语以作为所述上下文。例如,当所述输入字符串为“shishi”时,其对应的相关文本为“上海地铁一期工程”,且所述输入字符串位于“上海地铁一期工程”之后,通过对所述相关文本进行自然语言处理,提取焦点词语为“工程”,并将“工程”作为上下文。进一步地,因此,当输入字符串为“shishi”时,该输入设备根据所述上下文“工程”,确定输入候选项为“实施”、“实时”、“试试”等。
图2示出根据本发明一个优选实施例的一种用于提供输入字符串所对应的输入候选项的输入设备示意图;其中,所述输入设备包括获取装置11’、上下文确定装置12’、候选项确定装置13’、提供装置14’,在此,所述候选项确定装置13’包括匹配单元131’和处理单元132’。具体地,获取装置11’获取输入字符串;上下文确定装置12’确定所述输入字符串的上下文信息;匹配单元131’根据所述输入字符串,在输入词库中进行匹配查询,以获得与所述输入字符串对应的一个或多个初步输入候选项;处理单元132’根据所述上下文信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项;提供装置14’将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中,所述获取装置11’、上下文确定装置12’、提供装置14’与图1所示对应装置相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地或者按照设定的或实时调整的工作模式要求,进行输入字符串的获取、上下文信息的确定、初步输入候选项的获取、输入候选项的确定、输入候选项的提供等,直至输入设备停止获取输入字符串。
匹配单元131’根据所述输入字符串,在输入词库中进行匹配查询,以获得与所述输入字符串对应的一个或多个初步输入候选项。具体地,所述匹配单元131’通过获取所述输入字符串,将所述输入字符串与输入词库中的词进行匹配,以获得与所述输入字符串对应的一个或多个初步输入候选项。例如,当输入字符串为“shishi”时,根据在输入词库中进行匹配查询后,获取“实时”、“试试”、“实施”、“事实”、“适时”、“逝世”等多个初步输入候选项。
处理单元132’根据所述上下文信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项。具体地,处理单元132’根据所述输入字符串的上下文信息,通过根据自然语言模型或词语搭配数据库等,确定上下文信息与初步输入候选项的搭配概率,并根据所述搭配概率对所述初步输入候选项进行筛选或排序,以获得输入候选项。例如,继前例,当上下文信息为“客观”,则经处理后,将初步输入候选项进行重新排序,顺序变为“事实”、“实时”、“试试”、“实施”、“适时”、“逝世”等。
优选地,所述处理单元132’还可以根据所述上下文信息,在词语搭配数据库中进行匹配查询,以确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息;根据所述搭配相关度信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项。具体地,所述处理单元132’还可以根据所述上下文信息,在词语搭配数据库中进行匹配查询,通过根据所述词语搭配数据库中的一个或多个词条与所述上下文的匹配关系等,确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息;例如若或为bull变量,则所述搭配相关度信息表示如是否存在搭配;或为连续变量,如所述搭配相关度信息表示搭配概率为多少;在此,所述搭配相关度信息可根据如词语搭配数据库或其他相关数据库中的上下文与初步输入候选项的组合频率等通过机器学习获得。根据所述搭配相关度信息,通过对所述一个或多个初步输入候选项进行如筛选或排序处理,获得所述一个或多个输入候选项。
更优选地,所述输入设备还包括文本处理装置(未示出)和建立装置(未示出);其中,文本处理装置对一个或多个文本信息进行分析处理,以获得搭配频度满足一定阈值的分词搭配关系;建立装置根据所述分词搭配关系,建立或更新所述词语搭配数据库。具体地,文本处理装置例如通过对各类日志、各类文章等进行获取,并对所获取文本信息进行如先分词,后统计相邻词间的共现频率等分析方法,当所述共现频率超过一定阈值时,则判断所述相邻词间存在一定的搭配关系,从而获得搭配频度满足一定阈值的分词搭配关系;建立装置根据所述分词搭配关系,建立所述词语搭配数据库,或对现有词语搭配数据库进行更新等,在此,所述词语搭配数据库中包括但不限于分词搭配关系以及分词搭配关系之间的搭配概率信息;并且,所述词语搭配数据库中可包含现有固定词语,如成语、俗语等,同时经过所述更新,可以将由于现有网络应用的快速发展所产生的新的词语及表述进行包含,从而有效提高用户的输入效率。
图3示出根据本发明另一个优选实施例的一种用于提供输入字符串所对应的输入候选项的输入设备示意图;其中,所述输入设备包括获取装置11”、上下文确定装置12”、候选项确定装置13”、提供装置14”,在此,所述候选项确定装置13”包括检测单元133”和迭代单元134”。具体地,获取装置11”获取输入字符串;上下文确定装置12”确定所述输入字符串的上下文信息;检测单元133”检测所述输入字符串是否超出预定的长度阈值;若所述输入字符串超出所述长度阈值,迭代单元134”根据所述输入字符串,以及所述上下文信息,迭代确定与所述输入字符串对应的一个或多个输入候选项;提供装置14”将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中,所述获取装置11”、上下文确定装置12”、提供装置14”与图1所示对应装置相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地或者按照设定的或实时调整的工作模式要求,进行输入字符串的获取、上下文信息的确定、长度阈值的检测、输入候选项的确定、输入候选项的提供等,直至输入设备停止获取输入字符串。
检测单元133”检测所述输入字符串是否超出预定的长度阈值。具体地,所述检测单元133”通过基于预置的或用户自行设置的长度阈值,对所述输入字符串的长度进行检测,检测所述输入字符串的长度是否超出了预定的长度阈值。例如,当预定的字符长度阈值为N,当所述输入字符串的长度为N+1时,则检测单元133”检测所述输入字符串超出了预定的长度阈值。
若所述输入字符串超出所述长度阈值,迭代单元134”根据所述输入字符串,以及所述上下文信息,迭代确定与所述输入字符串对应的一个或多个输入候选项。具体地,若所述输入字符串超出所述长度阈值,迭代单元134”通过根据所述输入字符串,以及所述上下文信息,通过例如根据所述长度阈值,对所述输入字符串进行分段等处理,确定与第一个长度阈值的输入字符串所对应的所述输入候选项,并将所确定的输入候选项再次作为上下文信息,从而迭代确定下一个长度阈值的输入字符串所对应的输入候选项等的方式,确定与所述输入字符串对应的一个或多个输入候选项。
优选地,所述检测单元133”还可以获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项;检测所述一个或多个抽样输入候选项中至少一个中的字数是超出预定的字数阈值,以确定所述输入字符串是否超出预定的长度阈值。具体地,所述检测单元133”还可以通过例如将所述输入字符串直接在所述输入词库中进行匹配,获取与所述全部输入字符串所对应的一个或多个输入候选项,并从中随机抽取或指定抽取(如选择第一个输入候选项等)方式,获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项;通过对所述一个或多个抽样输入候选项进行检测,如所述抽样输入候选项中的其中至少一个字数超出预定的字数阈值,则确定所述输入字符串是否超出预定的长度阈值。
优选地,所述迭代单元134”还可以当所述输入字符串超出所述长度阈值,根据所述上下文信息,以及所述输入字符串中与所述上下文信息相邻的部分输入字符串,确定与所述部分输入字符串对应的一个或多个部分输入候选项;根据所述部分输入字符串,以及所述输入字符串中其余输入字符串,确定与所述其余输入字符串对应的一个或多个其余输入候选项,其中,所述部分输入候选项被用作所述其余输入字符串的上下文信息;根据所述一个或多个部分输入候选项,以及所述一个或多个其余输入候选项,确定所述一个或多个输入候选项。
具体地,当所述输入字符串超出所述长度阈值,根据所述上下文信息,通过例如分词等处理,对所述输入字符串进行分词或分段等,从而获取所述输入字符串中与所述上下文信息相邻的部分输入字符串,通过将所述部分输入字符串结合所述上下文信息,确定与所述部分输入字符串对应的一个或多个部分输入候选项;在此,所述确定方法与图1中所述候选项确定装置13中的确定方法相同或相似,故此处不再赘述,并通过引用的方式包含于此。所述迭代单元134”将所述部分输入候选项作为其余输入字符串的上下文信息,通过迭代的方式,确定与所述其余输入字符串相对应的一个或多个其余输入候选项;迭代后通过例如对字符串之间的关系,对所述部分输入候选项与其余输入候选项进行拼接等方式,确定一个或多个输入候选项。
图4示出根据本发明另一个方面的一种用于提供输入字符串所对应的输入候选项的方法流程图。具体地,在步骤s1中,输入设备获取输入字符串;在步骤s2中,输入设备确定所述输入字符串的上下文信息;在步骤s3中,输入设备根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;在步骤s4中,输入设备将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。
上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地或者按照设定的或实时调整的工作模式要求,进行输入字符串的获取、上下文信息的确定、输入候选项的确定、输入候选项的提供等,直至输入设备停止获取输入字符串。
在步骤s1中,输入设备获取输入字符串。具体地,在步骤s1中,输入设备通过从输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入的字符串;或者根据各种通信协议(CommunicationsProtocol),通过各种数据传输接口,获取从其他应用的输入框中的字符串;其中,所述输入框如短信编辑框、内容输入框等。其中,所述输入字符串包括但不限于通过如全拼或简拼等方式所输入的拼音编码字符等。
在步骤s2中,输入设备确定所述输入字符串的上下文信息。具体地,在步骤s2中,输入设备通过根据步骤s1所获取的输入字符串,利用当前所输入的字符串所属的文字等,将所述当前输入字符串所属的文字与一个或多个词库进行匹配,获取与所述输入字符串相关联的一种或多种匹配信息,并作为所述输入字符串的上下文信息;例如,当输入“huacao”时,先确定所述输入字符串所属的文字可能为“花草”,根据“花草”在所属词库中的匹配信息,确定其下文信息可能为“茶”等;或者,在步骤s2中,输入设备通过根据与所述输入字符串相对应的历史记录信息,对所述输入字符串的上下文信息进行确定,例如,所述输入字符串前刚刚上屏的前一个输入字符串,则可作为所述输入字符串的前文信息。在此,所述上下文信息包括但不限于与所述输入字符串相对应的上文信息或下文信息;例如,当所述输入为“shishi”时,当前次输入所上屏的词组为“客观”时,则所述“shishi”对应的上文信息为“客观”;若屏幕上存在一个词组“计划”,且输入“shishi”时,光标位于“计划”前,则其所对应的下文信息为“计划”等。
在步骤s3中,输入设备根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项。具体地,在步骤s3中,输入设备通过根据步骤s1中所获取的输入字符串,以及步骤s1中所确定的上下文信息,通过将与所述输入字符串相对应的一个或多个上下文信息直接作为一个或多个输入候选项,或者将所述输入字符串相对应的上下文信息进行处理后作为输入候选项的方式,确定与所述输入字符串对应的一个或多个输入候选项。例如,继上例,当所述输入字符串为“shishi”时,其所对应的上文信息可能为“客观”,“我”,“谈论”等,当所述上文信息为“客观”时,通过利用将所述输入字符串,以及所述上下文信息进行匹配等的方式,确定输入候选项为“事实”、“实时”、“实施”等;当所述上文信息为“我”时,确定输入候选项为“试试”、“实施”、“试试”等;当所述上文信息为“谈论”时,确定输入候选项为“时事”、“事实”、“世事”等。
在步骤s4中,输入设备将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。具体地,在步骤s4中,输入设备通过直接提供,或根据各种通信协议(CommunicationsProtocol),通过各种数据传输接口,通过例如重新排序或筛选等方式,将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中,所述目标应用包括但不限于与所述步骤s1中所对应的输入框相对应的相同应用,或者与所述步骤s1中所对应的输入框相关联的其他应用等,如直接利用所述输入候选项进行搜索等。
优选地,在步骤s3中,输入设备还可以根据所述输入字符串,以及所述上下文信息,确定包含所述输入字符串的增补字符串,其中,所述增补字符串还包括所述上下文信息所对应的字符串;根据所述增补字符串,在输入词库中进行匹配查询,以获得与所述增补字符串对应的一个或多个增补输入候选项;根据所述上下文信息,对所述一个或多个增补输入候选项进行筛选处理,以获得所述一个或多个输入候选项。具体地,在步骤s3中,输入设备还可以根据所述输入字符串,以及所述上下文信息,通过将所述输入字符串结合所述上下文信息与例如输入词库进行匹配等方式,确定包含所述输入字符串的增补字符串,例如,当输入字符串为“xuxu”时,当上下文信息为“形态”,则确定所述增补字符串为“rusheng”;或者,当输入字符串为”tianan”,上下文信息为“北京”,则确定所述增补字符串为“men”,在此,所述增补字符串包括但不限于通过匹配等方式,确定一个或多个通过拼接而成的多段字符串。在步骤s3中,输入设备通过将所述增补字符串在输入词库中进行匹配查询,以获得与所述增补字符串对应的一个或多个增补输入候选项;继前例,所述增补字符串为“rusheng”时所对应的增补输入候选项如“如生”、“入声”、“入胜”等,所述增补字符串为“men”时,所对应的增补输入候选项如“天安门”、“门”等。或者,所述增补输入候选项还可以直接包括所述上下文信息,如直接生成“形态栩栩如生”、“北京天安门”等。根据所述上下文信息,对所述一个或多个增补输入候选项进行筛选处理,继前例,根据上下文信息,分别确定输入候选项为“栩栩如生”、“天安门”从而获得所述一个或多个输入候选项;在此,若所述增补输入候选项中包含上下文信息,则将所述增补输入候选项中的上下文信息删除后,获得所述一个或多个输入候选项,如所述增补输入候选项“北京天安门”中的“北京”删除,获得所述一个或多个输入候选项“天安门”。
优选地,在步骤s2中,输入设备还可以通过对所述输入字符串所对应的相关文本进行自然语言处理,从所述相关文本提取对应的焦点词语,以作为所述上下文,其中,所述焦点词语邻近所述输入字符串所对应的输入位置。具体地,在步骤s2中,输入设备还可以通过分词或语义分析等方式,对所述输入字符串所对应的相关文本进行自然语言处理,其中,所述相关文本包括但不限于所述输入字符串本身所对应的文本,或者所述输入字符串所对应的输入位置前后已经上屏的相关文本;通过对所述相关文本中经由自然语言处理,提取对应的焦点词语以作为所述上下文。例如,当所述输入字符串为“shishi”时,其对应的相关文本为“上海地铁一期工程”,且所述输入字符串位于“上海地铁一期工程”之后,通过对所述相关文本进行自然语言处理,提取焦点词语为“工程”,并将“工程”作为上下文。进一步地,因此,当输入字符串为“shishi”时,该输入设备根据所述上下文“工程”,确定输入候选项为“实施”、“实时”、“试试”等。
图5示出根据本发明一个优选实施例的一种用于提供输入字符串所对应的输入候选项的方法流程图。具体地,在步骤s1’中,输入设备获取输入字符串;在步骤s2’中,输入设备确定所述输入字符串的上下文信息;在步骤s31’中,输入设备根据所述输入字符串,在输入词库中进行匹配查询,以获得与所述输入字符串对应的一个或多个初步输入候选项;在步骤s32’中,输入设备根据所述上下文信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项;在步骤s4’中,输入设备将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中,所述步骤s1’、步骤s2’、步骤s4’与图4所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地或者按照设定的或实时调整的工作模式要求,进行输入字符串的获取、上下文信息的确定、初步输入候选项的获取、输入候选项的确定、输入候选项的提供等,直至输入设备停止获取输入字符串。
在步骤s31’中,输入设备根据所述输入字符串,在输入词库中进行匹配查询,以获得与所述输入字符串对应的一个或多个初步输入候选项。具体地,在步骤s31’中,输入设备通过获取所述输入字符串,将所述输入字符串与输入词库中的词进行匹配,以获得与所述输入字符串对应的一个或多个初步输入候选项。例如,当输入字符串为“shishi”时,根据在输入词库中进行匹配查询后,获取“实时”、“试试”、“实施”、“事实”、“适时”、“逝世”等多个初步输入候选项。
在步骤s32’中,输入设备根据所述上下文信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项。具体地,在步骤s32’中,输入设备根据所述输入字符串的上下文信息,通过根据自然语言模型或词语搭配数据库等,确定上下文信息与初步输入候选项的搭配概率,并根据所述搭配概率对所述初步输入候选项进行筛选或排序,以获得输入候选项。例如,继前例,当上下文信息为“客观”,则经处理后,将初步输入候选项进行重新排序,顺序变为“事实”、“实时”、“试试”、“实施”、“适时”、“逝世”等。
优选地,在步骤s32’中,输入设备还可以根据所述上下文信息,在词语搭配数据库中进行匹配查询,以确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息;根据所述搭配相关度信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项。具体地,在步骤s32’中,输入设备还可以根据所述上下文信息,在词语搭配数据库中进行匹配查询,通过根据所述词语搭配数据库中的一个或多个词条与所述上下文的匹配关系等,确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息;例如若或为bull变量,则所述搭配相关度信息表示如是否存在搭配;或为连续变量,如所述搭配相关度信息表示搭配概率为多少;在此,所述搭配相关度信息可根据如词语搭配数据库或其他相关数据库中的上下文与初步输入候选项的组合频率等通过机器学习获得。根据所述搭配相关度信息,通过对所述一个或多个初步输入候选项进行如筛选或排序处理,获得所述一个或多个输入候选项。
更优选地,所述方法还包括步骤s5’(未示出)和步骤s6’(未示出);其中,在步骤s5’中,输入设备对一个或多个文本信息进行分析处理,以获得搭配频度满足一定阈值的分词搭配关系;在步骤s6’中,输入设备根据所述分词搭配关系,建立或更新所述词语搭配数据库。具体地,在步骤s5’中,输入设备例如通过对各类日志、各类文章等进行获取,并对所获取文本信息进行如先分词,后统计相邻词间的共现频率等分析方法,当所述共现频率超过一定阈值时,则判断所述相邻词间存在一定的搭配关系,从而获得搭配频度满足一定阈值的分词搭配关系;在步骤s6’中,输入设备根据所述分词搭配关系,建立所述词语搭配数据库,或对现有词语搭配数据库进行更新等,在此,所述词语搭配数据库中包括但不限于分词搭配关系以及分词搭配关系之间的搭配概率信息;并且,所述词语搭配数据库中可包含现有固定词语,如成语、俗语等,同时经过所述更新,可以将由于现有网络应用的快速发展所产生的新的词语及表述进行包含,从而有效提高用户的输入效率。
图6示出根据本发明另一个优选实施例的一种用于提供输入字符串所对应的输入候选项的方法流程图。具体地,在步骤s1”中,输入设备获取输入字符串;在步骤s2”中,输入设备确定所述输入字符串的上下文信息;在步骤s33”中,输入设备检测所述输入字符串是否超出预定的长度阈值;若所述输入字符串超出所述长度阈值,在步骤s34”中,输入设备根据所述输入字符串,以及所述上下文信息,迭代确定与所述输入字符串对应的一个或多个输入候选项;在步骤s4”中,输入设备将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中,所述步骤s1”、步骤s2”、步骤s4”与图4所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地或者按照设定的或实时调整的工作模式要求,进行输入字符串的获取、上下文信息的确定、长度阈值的检测、输入候选项的确定、输入候选项的提供等,直至输入设备停止获取输入字符串。
在步骤s33”中,输入设备检测所述输入字符串是否超出预定的长度阈值。具体地,在步骤s33”中,输入设备通过基于预置的或用户自行设置的长度阈值,对所述输入字符串的长度进行检测,检测所述输入字符串的长度是否超出了预定的长度阈值。例如,当预定的字符长度阈值为N,当所述输入字符串的长度为N+1时,则在步骤s33”中,输入设备检测所述输入字符串超出了预定的长度阈值。
若所述输入字符串超出所述长度阈值,在步骤s34”中,输入设备根据所述输入字符串,以及所述上下文信息,迭代确定与所述输入字符串对应的一个或多个输入候选项。具体地,若所述输入字符串超出所述长度阈值,在步骤s34”中,输入设备通过根据所述输入字符串,以及所述上下文信息,通过例如根据所述长度阈值,对所述输入字符串进行分段等处理,确定与第一个长度阈值的输入字符串所对应的所述输入候选项,并将所确定的输入候选项再次作为上下文信息,从而迭代确定下一个长度阈值的输入字符串所对应的输入候选项等的方式,确定与所述输入字符串对应的一个或多个输入候选项。
优选地,在步骤s33”中,输入设备还可以获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项;检测所述一个或多个抽样输入候选项中至少一个中的字数是超出预定的字数阈值,以确定所述输入字符串是否超出预定的长度阈值。具体地,在步骤s33”中,输入设备还可以通过例如将所述输入字符串直接在所述输入词库中进行匹配,获取与所述全部输入字符串所对应的一个或多个输入候选项,并从中随机抽取或指定抽取(如选择第一个输入候选项等)方式,获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项;通过对所述一个或多个抽样输入候选项进行检测,如所述抽样输入候选项中的其中至少一个字数超出预定的字数阈值,则确定所述输入字符串是否超出预定的长度阈值。
优选地,在步骤s34”中,输入设备还可以当所述输入字符串超出所述长度阈值,根据所述上下文信息,以及所述输入字符串中与所述上下文信息相邻的部分输入字符串,确定与所述部分输入字符串对应的一个或多个部分输入候选项;根据所述部分输入字符串,以及所述输入字符串中其余输入字符串,确定与所述其余输入字符串对应的一个或多个其余输入候选项,其中,所述部分输入候选项被用作所述其余输入字符串的上下文信息;根据所述一个或多个部分输入候选项,以及所述一个或多个其余输入候选项,确定所述一个或多个输入候选项。
具体地,当所述输入字符串超出所述长度阈值,根据所述上下文信息,通过例如分词等处理,对所述输入字符串进行分词或分段等,从而获取所述输入字符串中与所述上下文信息相邻的部分输入字符串,通过将所述部分输入字符串结合所述上下文信息,确定与所述部分输入字符串对应的一个或多个部分输入候选项;在此,所述确定方法与图4中所述步骤s3中的确定方法相同或相似,故此处不再赘述,并通过引用的方式包含于此。在步骤s34”中,输入设备将所述部分输入候选项作为其余输入字符串的上下文信息,通过迭代的方式,确定与所述其余输入字符串相对应的一个或多个其余输入候选项;迭代后通过例如对字符串之间的关系,对所述部分输入候选项与其余输入候选项进行拼接等方式,确定一个或多个输入候选项。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (12)

1.一种用于提供输入字符串所对应的输入候选项的方法,其中,该方法包括以下步骤:
a获取输入字符串;
b通过对所述输入字符串所对应的相关文本进行自然语言处理,从所述相关文本提取对应的焦点词语,以作为所述输入字符串的上下文信息,其中,所述焦点词语邻近所述输入字符串所对应的输入位置;
c根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;
d将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用;
其中,所述步骤c包括:
c2检测所述输入字符串是否超出预定的长度阈值;
-当所述输入字符串超出所述长度阈值,根据所述上下文信息,以及所述输入字符串中与所述上下文信息相邻的部分输入字符串,确定与所述部分输入字符串对应的一个或多个部分输入候选项;
-根据所述部分输入字符串,以及所述输入字符串中其余输入字符串,确定与所述其余输入字符串对应的一个或多个其余输入候选项,其中,所述部分输入候选项被用作所述其余输入字符串的上下文信息;
-根据所述一个或多个部分输入候选项,以及所述一个或多个其余输入候选项,确定所述一个或多个输入候选项。
2.根据权利要求1所述的方法,其中,所述步骤c包括:
-根据所述输入字符串,在输入词库中进行匹配查询,以获得与所述输入字符串对应的一个或多个初步输入候选项;
c1根据所述上下文信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项。
3.根据权利要求2所述的方法,其中,所述步骤c1包括:
-根据所述上下文信息,在词语搭配数据库中进行匹配查询,以确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息;
-根据所述搭配相关度信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项。
4.根据权利要求3所述的方法,其中,该方法还包括:
-对一个或多个文本信息进行分析处理,以获得搭配频度满足一定阈值的分词搭配关系;
-根据所述分词搭配关系,建立或更新所述词语搭配数据库。
5.根据权利要求1所述的方法,其中,所述步骤c包括:
-根据所述输入字符串,以及所述上下文信息,确定包含所述输入字符串的增补字符串,其中,所述增补字符串还包括所述上下文信息所对应的字符串;
-根据所述增补字符串,在输入词库中进行匹配查询,以获得与所述增补字符串对应的一个或多个增补输入候选项;
-根据所述上下文信息,对所述一个或多个增补输入候选项进行筛选处理,以获得所述一个或多个输入候选项。
6.根据权利要求1所述的方法,其中,所述步骤c2包括:
-获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项;
-检测所述一个或多个抽样输入候选项中至少一个中的字数是否超出预定的字数阈值,以确定所述输入字符串是否超出预定的长度阈值。
7.一种用于提供输入字符串所对应的输入候选项的输入设备,其中,该设备包括:
获取装置,用于获取输入字符串;
上下文确定装置,用于通过对所述输入字符串所对应的相关文本进行自然语言处理,从所述相关文本提取对应的焦点词语,以作为所述输入字符串的上下文信息,其中,所述焦点词语邻近所述输入字符串所对应的输入位置;
候选项确定装置,用于根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;
提供装置,用于将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用;
其中,所述候选项确定装置包括:
检测单元,用于检测所述输入字符串是否超出预定的长度阈值;
迭代单元,用于当所述输入字符串超出所述长度阈值,根据所述上下文信息,以及所述输入字符串中与所述上下文信息相邻的部分输入字符串,确定与所述部分输入字符串对应的一个或多个部分输入候选项;根据所述部分输入字符串,以及所述输入字符串中其余输入字符串,确定与所述其余输入字符串对应的一个或多个其余输入候选项,其中,所述部分输入候选项被用作所述其余输入字符串的上下文信息;根据所述一个或多个部分输入候选项,以及所述一个或多个其余输入候选项,确定所述一个或多个输入候选项。
8.根据权利要求7所述的输入设备,其中,所述候选项确定装置包括:
匹配单元,用于根据所述输入字符串,在输入词库中进行匹配查询,以获得与所述输入字符串对应的一个或多个初步输入候选项;
处理单元,用于根据所述上下文信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项。
9.根据权利要求8所述的输入设备,其中,所述处理单元用于:
-根据所述上下文信息,在词语搭配数据库中进行匹配查询,以确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息;
-根据所述搭配相关度信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选项。
10.根据权利要求9所述的输入设备,其中,该设备还包括:
文本处理装置,用于对一个或多个文本信息进行分析处理,以获得搭配频度满足一定阈值的分词搭配关系;
建立装置,用于根据所述分词搭配关系,建立或更新所述词语搭配数据库。
11.根据权利要求7所述的输入设备,其中,所述候选项确定装置用于:
-根据所述输入字符串,以及所述上下文信息,确定包含所述输入字符串的增补字符串,其中,所述增补字符串还包括所述上下文信息所对应的字符串;
-根据所述增补字符串,在输入词库中进行匹配查询,以获得与所述增补字符串对应的一个或多个增补输入候选项;
-根据所述上下文信息,对所述一个或多个增补输入候选项进行筛选处理,以获得所述一个或多个输入候选项。
12.根据权利要求7所述的输入设备,其中,所述检测单元用于:
-获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项;
-检测所述一个或多个抽样输入候选项中至少一个中的字数是否超出预定的字数阈值,以确定所述输入字符串是否超出预定的长度阈值。
CN201210592774.9A 2012-12-31 2012-12-31 一种用于提供输入字符串所对应的输入候选项的方法与设备 Active CN103076892B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201210592774.9A CN103076892B (zh) 2012-12-31 2012-12-31 一种用于提供输入字符串所对应的输入候选项的方法与设备
EP13867100.3A EP2940557B1 (en) 2012-12-31 2013-11-12 Method and device used for providing input candidate item corresponding to input character string
PCT/CN2013/086968 WO2014101577A1 (zh) 2012-12-31 2013-11-12 一种用于提供输入字符串所对应的输入候选项的方法与设备
JP2015549962A JP6114403B2 (ja) 2012-12-31 2013-11-12 入力文字列に対応する入力候補アイテムを提供する方法及び装置
US14/412,287 US20150293972A1 (en) 2012-12-31 2013-11-12 Method and device used for providing input candidate items corresponding to an input character string

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210592774.9A CN103076892B (zh) 2012-12-31 2012-12-31 一种用于提供输入字符串所对应的输入候选项的方法与设备

Publications (2)

Publication Number Publication Date
CN103076892A CN103076892A (zh) 2013-05-01
CN103076892B true CN103076892B (zh) 2016-09-28

Family

ID=48153448

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210592774.9A Active CN103076892B (zh) 2012-12-31 2012-12-31 一种用于提供输入字符串所对应的输入候选项的方法与设备

Country Status (5)

Country Link
US (1) US20150293972A1 (zh)
EP (1) EP2940557B1 (zh)
JP (1) JP6114403B2 (zh)
CN (1) CN103076892B (zh)
WO (1) WO2014101577A1 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103076892B (zh) * 2012-12-31 2016-09-28 百度在线网络技术(北京)有限公司 一种用于提供输入字符串所对应的输入候选项的方法与设备
CN103353824B (zh) * 2013-06-17 2016-08-17 百度在线网络技术(北京)有限公司 语音输入字符串的方法、装置和终端设备
CN103440299B (zh) * 2013-08-20 2016-12-28 陈喜 一种基于焦点上下文联想词的信息快速输入方法
TW201514726A (zh) * 2013-10-14 2015-04-16 Chi-Lin Hong 一種串聯式文字輸入裝置和方法
CN104111738A (zh) * 2014-06-06 2014-10-22 珠海市魅族科技有限公司 一种字符关联方法及终端
CN105302332A (zh) * 2014-07-25 2016-02-03 中国移动通信集团公司 一种拼音输入法及其实现装置
TWI518616B (zh) * 2014-09-24 2016-01-21 國立清華大學 穿搭評選方法與電子裝置
CN104808808A (zh) * 2015-03-23 2015-07-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN104766077B (zh) * 2015-04-03 2017-04-12 北京奇虎科技有限公司 一种识别图片中的字符的方法和装置
CN104809192B (zh) * 2015-04-22 2019-06-18 北京奇虎科技有限公司 提取输入法候选项的方法以及装置
CN104917669A (zh) * 2015-05-29 2015-09-16 北京搜狗科技发展有限公司 一种信息处理方法和装置
CN105404401A (zh) * 2015-11-23 2016-03-16 小米科技有限责任公司 输入处理方法、装置及设备
CN105653061B (zh) * 2015-12-29 2020-03-31 北京京东尚科信息技术有限公司 针对拼音输入法的词条检索及错词检测的方法和系统
CN105511642A (zh) * 2016-01-07 2016-04-20 珠海市魅族科技有限公司 一种输入方法及装置
CN105653064A (zh) * 2016-01-07 2016-06-08 珠海市魅族科技有限公司 一种输入方法及装置
EP3483745A4 (en) * 2016-07-22 2019-07-10 Huawei Technologies Co., Ltd. METHOD AND TERMINAL DEVICE FOR PRESENTING A CANDIDATE ELEMENT
CN107765883A (zh) * 2016-08-22 2018-03-06 富士通株式会社 输入法的候选词语的排序方法和排序设备
CN106527752B (zh) * 2016-09-23 2019-03-19 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
CN106484135B (zh) * 2016-09-23 2019-03-19 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
EP3358471A1 (en) * 2017-02-04 2018-08-08 Tata Consultancy Services Limited Systems and methods for assessing quality of input text using recurrent neural networks
CN108509058B (zh) * 2017-02-28 2022-08-16 微软技术许可有限责任公司 输入方法与相关设备
CN108536653B (zh) * 2017-03-03 2022-09-30 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
US10493798B2 (en) 2017-03-24 2019-12-03 Cnh Industrial America Llc Air strut suspension system for a self-propelled high ground clearance product applicator
CN109917927B (zh) * 2017-12-13 2022-07-08 北京搜狗科技发展有限公司 一种候选项确定方法和装置
US11132622B2 (en) * 2017-12-27 2021-09-28 International Business Machines Corporation Autonomous system for hypotheses generation
CN109976548B (zh) * 2017-12-28 2022-07-19 北京搜狗科技发展有限公司 一种输入方法及输入装置
CN109164921B (zh) * 2018-07-09 2023-04-07 北京左医科技有限公司 聊天框动态显示输入建议的控制方法及装置
CN110858099B (zh) * 2018-08-20 2024-04-12 北京搜狗科技发展有限公司 候选词生成方法及装置
CN109634436B (zh) * 2018-10-25 2023-11-10 平安科技(深圳)有限公司 输入法的联想方法、装置、设备及可读存储介质
CN111832310B (zh) * 2019-04-23 2024-04-16 北京嘀嘀无限科技发展有限公司 一种文本处理方法及装置
CN112000877A (zh) * 2020-07-15 2020-11-27 北京搜狗科技发展有限公司 一种数据处理方法、装置和介质
CN117037184A (zh) * 2023-10-10 2023-11-10 深圳牛图科技有限公司 一种基于云匹配的ocr模糊识别系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101013443A (zh) * 2007-02-13 2007-08-08 北京搜狗科技发展有限公司 一种智能组词输入的方法和一种输入法系统及其更新方法
CN101246410A (zh) * 2007-02-12 2008-08-20 谷歌股份有限公司 上下文或语境输入法和系统
CN102253929A (zh) * 2011-06-03 2011-11-23 北京搜狗科技发展有限公司 一种提示用户输入字符的方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7149550B2 (en) * 2001-11-27 2006-12-12 Nokia Corporation Communication terminal having a text editor application with a word completion feature
US9606634B2 (en) * 2005-05-18 2017-03-28 Nokia Technologies Oy Device incorporating improved text input mechanism
JP4547366B2 (ja) * 2006-11-09 2010-09-22 株式会社ソニー・コンピュータエンタテインメント 文字入力装置、その制御方法、プログラム及び情報記憶媒体
US7809719B2 (en) * 2007-02-08 2010-10-05 Microsoft Corporation Predicting textual candidates
CN101266520B (zh) * 2008-04-18 2013-03-27 上海触乐信息科技有限公司 一种可实现灵活键盘布局的系统
DE602008005428D1 (de) * 2008-06-11 2011-04-21 Exb Asset Man Gmbh Vorrichtung und Verfahren mit verbessertem Texteingabemechanismus
US9026429B2 (en) * 2012-12-05 2015-05-05 Facebook, Inc. Systems and methods for character string auto-suggestion based on degree of difficulty
CN103076892B (zh) * 2012-12-31 2016-09-28 百度在线网络技术(北京)有限公司 一种用于提供输入字符串所对应的输入候选项的方法与设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246410A (zh) * 2007-02-12 2008-08-20 谷歌股份有限公司 上下文或语境输入法和系统
CN101013443A (zh) * 2007-02-13 2007-08-08 北京搜狗科技发展有限公司 一种智能组词输入的方法和一种输入法系统及其更新方法
CN102253929A (zh) * 2011-06-03 2011-11-23 北京搜狗科技发展有限公司 一种提示用户输入字符的方法和装置

Also Published As

Publication number Publication date
EP2940557A4 (en) 2016-11-02
EP2940557A1 (en) 2015-11-04
WO2014101577A1 (zh) 2014-07-03
JP2016508264A (ja) 2016-03-17
CN103076892A (zh) 2013-05-01
JP6114403B2 (ja) 2017-04-12
US20150293972A1 (en) 2015-10-15
EP2940557B1 (en) 2022-11-02

Similar Documents

Publication Publication Date Title
CN103076892B (zh) 一种用于提供输入字符串所对应的输入候选项的方法与设备
CN105094368B (zh) 一种对输入法候选项进行调频排序的控制方法及控制装置
CN102937864B (zh) 一种用于在触摸终端上确定所选文本的方法与设备
CN104281649A (zh) 一种输入方法、装置及电子设备
CN105335348B (zh) 基于目标语句的依存句法分析方法、装置及服务器
CN102722709B (zh) 一种垃圾图片识别方法和装置
CN103092826B (zh) 一种根据用户的输入信息构建输入词条的方法与设备
CN106776544A (zh) 人物关系识别方法及装置和分词方法
CN108062304A (zh) 一种基于机器学习的商品评论数据的情感分析方法
CN107526846B (zh) 频道排序模型的生成、排序方法、装置、服务器和介质
CN104778283B (zh) 一种基于微博的用户职业分类方法及系统
CN103123624A (zh) 确定中心词的方法及装置、搜索方法及装置
CN103678460B (zh) 用于识别适于在多语言环境中进行通信的非文本元素的方法和系统
CN103927330A (zh) 一种在搜索引擎中确定形近字的方法和装置
CN109947934A (zh) 针对短文本的数据挖掘方法及系统
CN105956158B (zh) 基于海量微博文本和用户信息的网络新词自动提取的方法
CN105488206B (zh) 一种基于众包的安卓应用演化推荐方法
CN106537387A (zh) 检索/存储与事件相关联的图像
CN114092948A (zh) 一种票据识别方法、装置、设备以及存储介质
CN103064967B (zh) 一种用于建立用户二元关系库的方法与设备
CN112148852A (zh) 一种智能客服方法、装置、存储介质及计算机设备
CN104076945A (zh) 用于在终端中显示输入键盘的装置和方法
CN103778210B (zh) 一种待分析文件的文件具体类型的判断方法及装置
CN114780821A (zh) 文本处理方法、装置、设备、存储介质和程序产品
CN113255324B (zh) 一种用于专利数据中发明人姓名消歧的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant