CN106371624A - 一种用于提供输入候选项的方法与装置 - Google Patents

一种用于提供输入候选项的方法与装置 Download PDF

Info

Publication number
CN106371624A
CN106371624A CN201610849612.7A CN201610849612A CN106371624A CN 106371624 A CN106371624 A CN 106371624A CN 201610849612 A CN201610849612 A CN 201610849612A CN 106371624 A CN106371624 A CN 106371624A
Authority
CN
China
Prior art keywords
character string
input
string
syllable
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610849612.7A
Other languages
English (en)
Other versions
CN106371624B (zh
Inventor
陈丽敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610849612.7A priority Critical patent/CN106371624B/zh
Publication of CN106371624A publication Critical patent/CN106371624A/zh
Application granted granted Critical
Publication of CN106371624B publication Critical patent/CN106371624B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的目的是提供一种用于提供输入候选项的方法与装置。提供装置首先根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库,然后,获取所述用户的输入字符串,并根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项。与现有技术相比,本发明对用户的历史输入记录进行处理后,利用该记录的分层检索结构以支持前缀匹配的特性,能够在用户输入少量输入字符串时,就提供给用户更完整的输入候选项,因此扩展了首页的候选结果,实现了快速、智能化的输入,满足用户的输入需求,提升用户的输入效率,改善了用户体验。

Description

一种用于提供输入候选项的方法与装置
技术领域
本发明涉及输入法技术领域,尤其涉及一种用于提供输入候选项的技术。
背景技术
在现有技术中,用户每输入一个输入字符串,则输入法会给出与该输入字符串对应的输入候选项。例如,当用户输入“danshi”时,会给出“但是”、“单是”等输入候选项,当用户输入“dangranle”,会给出“当然了”等输入候选项。
这种输入方法的问题是,所给出的候选结果与所述输入候选项是一一对应的。例如,当用户输入“dan”时,所给出的输入候选项是“但”、“单”等单个字,当用户输入“danshi”,所给出的输入候选项是“但是”、“单是”等双字。换言之,这种传统的输入方式仅能提供基本的输入候选项,而无法根据用户的输入字符串给出更为丰富的输入候选项,因此无法支持快速输入,很难大幅提升用户的输入效率。
发明内容
本发明的目的是提供一种用于提供输入候选项的方法与装置。
根据本发明的一个方面,提供了一种用于提供输入候选项的方法,其中,该方法包括:
用于根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库的步骤,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息;
用于获取所述用户的输入字符串的步骤;
用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的步骤,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
可选地,获取一个或多个输入候选项的步骤包括:
用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串的步骤,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配;
用于根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的步骤,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
可选地,确定与所述输入字符串相匹配的音节标识串的步骤包括:
根据所述输入字符串,根据深度遍历方式,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。
可选地,所述检索的终止条件包括以下至少任一项:
检索得到与所述输入字符串相匹配的全部音节标识串;
检索达到了所设置的最大检索层次;
检索达到了所设置的最大堆栈存储长度。
可选地,确定与所述输入字符串相匹配的音节标识串的步骤包括:
确定与所述输入字符串相对应的一个或多个相关输入字符串;
根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串,其中,所述输入字符串和/或所述相关输入字符串与所述音节标识串中的部分音节标识串匹配。
可选地,根据所述定位信息提取输入候选项的步骤包括:
根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个候选输入候选项,其中,所述候选输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串;
根据所述候选输入候选项所对应的历史输入相关信息,确定与所述输入字符串相对应的输入候选项。
可选地,建立或更新与所述用户相对应的用户词库的步骤包括:
根据用户的历史输入记录,结合所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,以确定与所述用户相对应的一条或多条词条数据信息;
根据所述词条数据信息,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。
可选地,所述音节标识串包括所述词条数据信息所对应的多个音节的组合,或者包括能够对应于所述多个音节的标识信息的组合。
根据本发明的另一方面,还提供了一种用于提供输入候选项的提供装置,其中,该提供装置包括:
用于根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库的装置,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息;
用于获取所述用户的输入字符串的装置;
用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的装置,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
可选地,获取一个或多个输入候选项的步骤的装置包括:
用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串的单元,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配;
用于根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的单元,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
可选地,确定与所述输入字符串相匹配的音节标识串的单元用于:
根据所述输入字符串,根据深度遍历方式,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。
可选地,所述检索的终止条件包括以下至少任一项:
检索得到与所述输入字符串相匹配的全部音节标识串;
检索达到了所设置的最大检索层次;
检索达到了所设置的最大堆栈存储长度。
可选地,确定与所述输入字符串相匹配的音节标识串的单元用于:
确定与所述输入字符串相对应的一个或多个相关输入字符串;
根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串,其中,所述输入字符串和/或所述相关输入字符串与所述音节标识串中的部分音节标识串匹配。
可选地,根据所述定位信息提取输入候选项的单元用于:
根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个候选输入候选项,其中,所述候选输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串;
根据所述候选输入候选项所对应的历史输入相关信息,确定与所述输入字符串相对应的输入候选项。
可选地,建立或更新与所述用户相对应的用户词库的装置用于:
根据用户的历史输入记录,结合所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,以确定与所述用户相对应的一条或多条词条数据信息;
根据所述词条数据信息,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。
可选地,所述音节标识串包括所述词条数据信息所对应的多个音节的组合,或者包括能够对应于所述多个音节的标识信息的组合。
根据本发明的另一方面,还提供了一种输入设备,包括如上述任一项所述的提供装置。
与现有技术相比,本发明首先根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息,然后,获取所述用户的输入字符串,并根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。从而,本发明对用户的历史输入记录进行处理后,利用该记录的分层检索结构以支持前缀匹配的特性,能够在用户输入少量输入字符串时,就提供给用户更完整的输入候选项,因此扩展了首页的候选结果,实现了快速、智能化的输入,满足用户的输入需求,提升用户的输入效率,改善了用户体验。
而且,本发明还可以根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配,然后,根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串;从而先确定音节标识串,再从用户词库中提取相对应的词条数据信息,使得所述用户词库中的存储结构更加完整,检索起来更加便捷,提高了处理效率,实现了快快速、智能化的输入,满足用户的输入需求,提升用户的输入效率,改善了用户体验。
而且,本发明还可以根据所述输入字符串,根据深度遍历方式,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,进一步地,还可以设置一个或多个检索的终止条件,以基于不同的终止条件来停止遍历;从而能够提供与所述输入字符串相对应的全部或部分输入候选项,因此扩展了首页的候选结果,实现了快速、智能化的输入,满足用户的输入需求,提升用户的输入效率,改善了用户体验。
而且,本发明还可以确定与所述输入字符串相对应的一个或多个相关输入字符串,然后根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串;从而,可以基于更加丰富、完整、准确的相关输入字符串或原输入字符串来进行检索匹配,进一步地,使得所确定的输入候选项更加丰富准确,实现了快速、智能化的输入,满足用户的输入需求,提升用户的输入效率,改善了用户体验。
而且,本发明还可以根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个候选输入候选项,然后根据所述候选输入候选项所对应的历史输入相关信息,确定与所述输入字符串相对应的输入候选项;从而给出了如何对输入候选项进行优化的方法,使得所确定的输入候选项更加符合用户的需求,实现了快速、智能化的输入,提升用户的输入效率,改善了用户体验。
而且,本发明还可以根据用户的历史输入记录,结合所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,以确定与所述用户相对应的一条或多条词条数据信息,然后,根据所述词条数据信息,建立或更新与所述用户相对应的用户词库;从而使得所确定的词条更加符合用户的输入习惯,所确定的输入候选项更加符合用户的需求,实现了快速、智能化的输入,提升用户的输入效率,改善了用户体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种用于提供输入候选项的提供装置示意图;
图2示出根据本发明的一个优选实施例的一种用于提供输入候选项的提供装置示意图;
图3示出根据本发明另一个方面的一种用于提供输入候选项的方法流程图;
图4示出根据本发明的一个优选实施例的一种用于提供输入候选项的方法流程图;
图5示出了根据本发明的一个优选实施例的一种用于提供输入候选项的检索树结构示意图;
图6示出了根据本发明的一个优选实施例的一种词库数据文件结构示意图;
图7(a)与图7(b)示出了根据本发明的一个优选实施例的一种检索遍历流程图;
图8示出了根据本发明的一个优选实施例的一种输入效果图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在上下文中所称“提供装置”即为“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。
所述计算机设备包括用户设备和/或网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
本领域技术人员应能理解,本发明中所述的“提供装置”可以仅是用户设备,即由用户设备来执行相应的操作;也可以是由用户设备与网络设备或服务器相集成来组成,即由用户设备与网络设备相配合来执行相应的操作。
需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
需要说明的是,优选地,本发明所述的“提供装置”可包括输入法、包含在输入法中的装置等。其中,本发明所述的提供装置可由计算机设备的生产厂商或销售服务商预先安装至该计算机设备,也可由计算机设备从服务器加载到计算机设备。本领域技术人员应能理解,任何可用于实现本发明中的功能的装置,无论是否被加载至计算机设备中,均包含在本发明的保护范围内。
在此,本领域技术人员应能理解,本发明可应用于移动端与非移动端,例如,当用户使用手机或PC时,均可利用本发明所述的方法或装置来进行提供与呈现。
这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的一种用于提供输入候选项的提供装置示意图;其中,所述提供装置包括用于根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库的装置(以下简称“建立装置1”),其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息;用于获取所述用户的输入字符串的装置(以下简称“获取装置2”);用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的装置(以下简称“确定装置3”),其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
所述建立装置1根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。
具体地,所述建立装置1在每次用户进行输入时,获取并存储用户的输入记录,以作为所述历史输入记录;或者,所述建立装置1与其他能够提供所述历史输入记录的设备相交互,以获取所述用户的一个或多个历史输入记录。
若所述历史输入记录以词条形式存储,则所述建立装置1直接对所述词条进行分析,以获取所述词条中各个文字的音节标识串(如拼音串),进一步地,所述建立装置1还可以统计所述词条在所述历史输入记录中的出现频率,以作为该词条的词频信息。
若所述历史输入记录未以词条形式存储,如所述历史输入记录信息是以整段整句的形式所存储的,则所述建立装置1对所述历史输入记录进行分词等分词处理,以将所述历史输入记录转化为词条形式;然后,所述建立装置1对所述词条进行分析,以获取所述词条中各个文字的音节标识串,进一步地,所述建立装置1还可以统计所述词条在所述历史输入记录中的出现频率,以作为该词条的词频信息。
在此,所述音节标识串包括所述词条数据信息所对应的多个音节的组合,或者包括能够对应于所述多个音节的标识信息的组合。其中,所述音节是声母与韵母的组合,如能够组合的声母韵母或零声母韵母;每个音节均对应于一个汉字。所述标识信息包括但不限于能够标识所述音节的数字、代码或其他方式,并在后续中可利用该标识信息进行检索。
换言之,所述音节标识串可以直接是所述词条所对应的拼音串,也可以是能够标识所述拼音串的其他标识信息;例如,当词条为“但是”时,其所对应的拼音串为“danshi”,所述建立装置1可以直接将“danshi”作为其音节标识串,也可以利用如预定的编号表、音节ID表等来替代所述拼音串,并将编号表或音节ID表所对应的信息作为其音节标识串,例如,若“dan”对应数字189,“shi”对应数字“151”,“但是”所对应的音节标识串为“189-151”。
然后,所述建立装置1根据上述处理信息,建立或更新与所述用户相对应的用户词库。即若不存在用户词库,则建立所述用户词库;若已存在所述用户词库,则根据上述处理信息,对所述用户词库进行更新。
其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息。所述词条数据信息包括但不限于为所述词条所对应的文字、拼音串、音节标识串,进一步地,还可以包含所述词条的词频等;所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。在此,所述定位信息即为偏移信息,即根据所述定位信息,可以查找到所述词条数据信息在数据库中的存储位置,以调用所述词条数据信息。
本领域技术人员应能理解,在实际存储中,所述词条数据信息可以存储在数据文件中,所述索引信息可以存储在所述数据文件中,也可以存储在内存中。
优选地,所述建立装置1根据用户的历史输入记录,结合所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,以确定与所述用户相对应的一条或多条词条数据信息;根据所述词条数据信息,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。
具体地,所述建立装置1对所述用户的历史输入记录进行分析,根据所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,然后,根据所分词的结果,确定与所述用户相对应的一条或多条词条数据信息。其中,所述上屏信息,可以根据用户所输入的空格或回车等控制按键进行判断,也可以根据用户执行输入时的输入时间间隔进行判断等。
然后,所述建立装置1根据所述词条数据信息,建立或更新与所述用户相对应的用户词库。在此,建立或更新的方法与图1所述的建立装置相同或相似,故在此不再赘述,并通过引用的方式包含于此。
例如,若用户的输入记录为“今天诞生啦”,并分别上屏“今天”“诞生啦”,则所述建立装置1首先对其进行分词,确定与该输入记录相对应的词条数据信息为“今天”、“诞生啦”;然后,根据“今天”、“诞生啦”的文字、拼音串、音节标识串、词频以及该音节标识串所对应的所述词条数据信息的定位信息等,建立或更新与所述用户相对应的用户词库。其中,所述文字、拼音串、音节标识串以及词频等属于该词条的词条数据信息;所述音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息属于该词条的索引信息。
所述获取装置2获取所述用户的输入字符串。
所述获取装置2通过与键盘等输入设备相交互,或者通过与输入法等的应用接口相连接,以获取用户所输入的输入字符串;其中,所述输入字符串例如“d”、“danshi”、“dangranle”等拼音字符串,或者是基于其他输入方法下的、以字母表示的字符串。
在此,所述输入字符串包括单个输入字符(如“d”)或多个输入字符(如“dan”)的组合。
所述确定装置3根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
具体地,若所述用户词库中的音节标识串为音节本身,则所述确定装置3直接基于所述输入字符串,在所述索引信息中进行检索;若所述用户词库中的音节标识串为所述音节的标识信息,则所述确定装置2将所述输入字符串基于同样的转换规则,转换为相应的标识信息后,在所述索引信息中进行检索。
若所述输入字符串中未对应于一个完整的音节,则可先根于预先设定的音节表,获取与所述字符串相对应的一个或多个可能的音节;然后,基于所述可能的音节,分别在索引信息中进行检索。例如,若用户输入了“d”,则可先确定以d为起始的所有音节,包括“dang、dian、dong、ding、deng、duan、diao、dao、dei、dui、dou、duo、dan、dai、dun、diu、die、dia、den、de、da、di、du”;然后,以这些音节为起始位置,找到在数据库中所存储的包含d开头的音节,如“dan”。
然后,所述确定装置3基于与所述输入字符串相对应的索引信息,获取所述索引信息所对应的所述词条数据信息的定位信息,从而基于所述定位信息,得到所述词条数据信息;最后根据所述词条数据信息中的文字,将该文字词条作为与所述输入字符串相对应的一个或多个输入候选项;进一步地,还可以根据所述词条数据信息中的词频,对所获取的一个或多个输入候选项进行排序,并依据排序顺序,将所述输入候选项提供给所述用户。
其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。换言之,所述用户所输入的输入字符串直接对应的文字,仅属于所述输入候选项中的部分文字,用户可以通过输入少量字符,来完成多个文字的输入。
例如,当用户输入“d”,基于上述处理,可根据用户记录调用“但是”、“当然了”等作为输入候选项;当用户输入“dan”,基于上述处理,可根据用户记录调用“但是”、“当然了”等作为输入候选项;而当用户输入“dang”,则可将“当然了”作为输入候选项。
图2示出根据本发明的一个优选实施例的一种用于提供输入候选项的提供装置示意图;其中,所述提供装置包括用于根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库的装置(以下简称“建立装置1’”),其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息;用于获取所述用户的输入字符串的装置(以下简称“获取装置2’”);用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的装置(以下简称“确定装置3”),其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
其中,所述确定装置3’包括用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串的单元(以下简称“检索单元31’”),其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配;用于根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的单元(以下简称“提取单元32’”),其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
其中,所述建立装置1’、所述获取装置2’与图1中所述对应装置相同或相似,故在此不再赘述,并通过引用的方式包含于此。
所述检索单元31’根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。
具体地,若所述用户词库中的音节标识串为音节本身,则所述检索单元31’直接基于所述输入字符串,在所述索引信息中进行检索,以确定与所述输入字符串相匹配的音节标识串;若所述用户词库中的音节标识串为所述音节的标识信息,则所述检索单元31’将所述输入字符串基于同样的转换规则,转换为相应的标识信息后,在所述索引信息中进行检索,以确定与所述输入字符串相匹配的音节标识串。
若所述输入字符串中未对应于一个完整的音节,则可先根于预先设定的音节表,获取与所述字符串相对应的一个或多个可能的音节;然后,基于所述可能的音节,分别在索引信息中进行检索。
其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。在此,所述匹配包括该输入字符串对应于所述音节标识串中的部分声母或韵母。例如,若输入字符串为“d”,则所述音节字符串可以是“dan”、“dangranle”、“danshi”等。
优选地,所述检索单元31’可以根据所述输入字符串,根据深度遍历方式,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。
具体地,所述检索单元31’根据所述输入字符串,在所述用户词库中进行深度遍历,以查询得到与所述输入字符串所相匹配的一个或多个音节标识串;本领域技术人员应能理解所述深度查询的基本方法,所述匹配方式与图2中所述的检索单元31’相同或相似,故不再赘述,并通过引用的方式包含于此。
更优选地,所述检索的终止条件包括以下至少任一项:
-检索得到与所述输入字符串相匹配的全部音节标识串:即对整个用户词库进行检索,并查询得到了与所述输入字符串相匹配的全部音节标识串;
-检索达到了所设置的最大检索层次:例如,限制最大检索层次为3,即表示限制所得到的音节标识串中所包含的音节数最大为3等。优选地,可以将最大检索层次设置为[1至3]+k,其中k为误差系数,1至3则表示了大多数用户的上屏词的长度;
-检索达到了所设置的最大堆栈存储长度:例如,在检索过程中,检索信息(如各个音节标识串的各个音节节点)不断入栈出栈,直到其到达了最大堆栈存储长度,则将小于或等于该最大堆栈存储长度的音节标识串作为与所述输入字符串相匹配的音节标识串。
优选地,所述检索单元31’确定与所述输入字符串相对应的一个或多个相关输入字符串;根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串,其中,所述输入字符串和/或所述相关输入字符串与所述音节标识串中的部分音节标识串匹配。
具体地,所述检索单元31’可以通过对所述输入字符串进行补充、纠错、变形等操作,确定与所述输入字符串相对应的一个或多个相关输入字符串;即本发明可以对输入字符串进行模糊搜索。
例如,若用户输入“shaung”,则可纠错为“shuang”;若用户输入“d”,则可补充为“dan”、“dang”等;若用户输入“dang”,也可以变形为“dan”等。
然后,所述检索单元31’根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串。在此,所述检索方式与图2中所述检索单元31’相同或相似,故在此不再赘述,并通过引用的方式包含于此。
所述提取单元32’根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
具体地,所述提取单元32’基于所述定位信息,得到所述词条数据信息;最后根据所述词条数据信息中的文字,将该文字词条作为与所述输入字符串相对应的一个或多个输入候选项;进一步地,还可以根据所述词条数据信息中的词频,对所获取的一个或多个输入候选项进行排序,并依据排序顺序,将所述输入候选项提供给所述用户。
其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。换言之,所述用户所输入的输入字符串直接对应的文字,仅属于所述输入候选项中的部分文字,用户可以通过输入少量字符,来完成多个文字的输入。
优选地,所述提取单元32’根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个候选输入候选项,其中,所述候选输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串;根据所述候选输入候选项所对应的历史输入相关信息,确定与所述输入字符串相对应的输入候选项。
具体地,所述提取单元32’基于所述定位信息,得到所述词条数据信息;最后根据所述词条数据信息中的文字,将该文字词条作为与所述输入字符串相对应的一个或多个候选输入候选项。
其中,所述候选输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
然后,所述提取单元32’根据所述候选输入候选项所对应的历史输入相关信息,对所述候选输入候选项进行优选或排序,从而将优选后的候选输入候选项作为所述输入候选项,或者按照所述排序后的顺序,将所述候选输入候选项提供给所述用户,以作为所述输入候选项。
其中,所述历史输入相关信息可以从所述候选输入候选项中的词条数据信息中直接获取,或者对所述词条数据信息进行分析后获取;或者,还可以与其他设备相交互,以获取其他设备所提供的所述历史输入相关信息。
所述历史输入相关信息包括输入频率、输入时间等;例如输入频率越高,则权重越高,排序越靠前;输入时间与当前时间越接近,则权重越高,排序越靠前等。
图3示出根据本发明另一个方面的一种用于提供输入候选项的方法流程图。在步骤S1中,所述提供装置根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息;在步骤S2中,所述提供装置获取所述用户的输入字符串;在步骤S3中,所述提供装置根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
在步骤S1中,所述提供装置根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。
具体地,在步骤S1中,所述提供装置在每次用户进行输入时,获取并存储用户的输入记录,以作为所述历史输入记录;或者,在步骤S1中,所述提供装置与其他能够提供所述历史输入记录的设备相交互,以获取所述用户的一个或多个历史输入记录。
若所述历史输入记录以词条形式存储,则在步骤S1中,所述提供装置直接对所述词条进行分析,以获取所述词条中各个文字的音节标识串(如拼音串),进一步地,在步骤S1中,所述提供装置还可以统计所述词条在所述历史输入记录中的出现频率,以作为该词条的词频信息。
若所述历史输入记录未以词条形式存储,如所述历史输入记录信息是以整段整句的形式所存储的,则在步骤S1中,所述提供装置对所述历史输入记录进行分词等分词处理,以将所述历史输入记录转化为词条形式;然后,所述提供装置对所述词条进行分析,以获取所述词条中各个文字的音节标识串,进一步地,所述提供装置还可以统计所述词条在所述历史输入记录中的出现频率,以作为该词条的词频信息。
在此,所述音节标识串包括所述词条数据信息所对应的多个音节的组合,或者包括能够对应于所述多个音节的标识信息的组合。其中,所述音节是声母与韵母的组合,如能够组合的声母韵母或零声母韵母;每个音节均对应于一个汉字。所述标识信息包括但不限于能够标识所述音节的数字、代码或其他方式,并在后续中可利用该标识信息进行检索。
换言之,所述音节标识串可以直接是所述词条所对应的拼音串,也可以是能够标识所述拼音串的其他标识信息;例如,当词条为“但是”时,其所对应的拼音串为“danshi”,在步骤S1中,所述提供装置可以直接将“danshi”作为其音节标识串,也可以利用如预定的编号表、音节ID表等来替代所述拼音串,并将编号表或音节ID表所对应的信息作为其音节标识串,例如,若“dan”对应数字189,“shi”对应数字“151”,“但是”所对应的音节标识串为“189-151”。
然后,在步骤S1中,所述提供装置根据上述处理信息,建立或更新与所述用户相对应的用户词库。即若不存在用户词库,则建立所述用户词库;若已存在所述用户词库,则根据上述处理信息,对所述用户词库进行更新。
其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息。所述词条数据信息包括但不限于为所述词条所对应的文字、拼音串、音节标识串,进一步地,还可以包含所述词条的词频等;所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。在此,所述定位信息即为偏移信息,即根据所述定位信息,可以查找到所述词条数据信息在数据库中的存储位置,以调用所述词条数据信息。
本领域技术人员应能理解,在实际存储中,所述词条数据信息可以存储在数据文件中,所述索引信息可以存储在所述数据文件中,也可以存储在内存中。
优选地,在步骤S1中,所述提供装置根据用户的历史输入记录,结合所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,以确定与所述用户相对应的一条或多条词条数据信息;根据所述词条数据信息,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。
具体地,在步骤S1中,所述提供装置对所述用户的历史输入记录进行分析,根据所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,然后,根据所分词的结果,确定与所述用户相对应的一条或多条词条数据信息。其中,所述上屏信息,可以根据用户所输入的空格或回车等控制按键进行判断,也可以根据用户执行输入时的输入时间间隔进行判断等。
然后,在步骤S1中,所述提供装置根据所述词条数据信息,建立或更新与所述用户相对应的用户词库。在此,建立或更新的方法与图3所述的步骤S1相同或相似,故在此不再赘述,并通过引用的方式包含于此。
例如,若用户的输入记录为“今天诞生啦”,并分别上屏“今天”“诞生啦”,则在步骤S1中,所述提供装置首先对其进行分词,确定与该输入记录相对应的词条数据信息为“今天”、“诞生啦”;然后,根据“今天”、“诞生啦”的文字、拼音串、音节标识串、词频以及该音节标识串所对应的所述词条数据信息的定位信息等,建立或更新与所述用户相对应的用户词库。其中,所述文字、拼音串、音节标识串以及词频等属于该词条的词条数据信息;所述音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息属于该词条的索引信息。
在步骤S2中,所述提供装置获取所述用户的输入字符串。
在步骤S2中,所述提供装置通过与键盘等输入设备相交互,或者通过与输入法等的应用接口相连接,以获取用户所输入的输入字符串;其中,所述输入字符串例如“d”、“danshi”、“dangranle”等拼音字符串,或者是基于其他输入方法下的、以字母表示的字符串。
在此,所述输入字符串包括单个输入字符(如“d”)或多个输入字符(如“dan”)的组合。
在步骤S3中,所述提供装置根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
具体地,若所述用户词库中的音节标识串为音节本身,则在步骤S3中,所述提供装置直接基于所述输入字符串,在所述索引信息中进行检索;若所述用户词库中的音节标识串为所述音节的标识信息,则在步骤S3中,所述提供装置将所述输入字符串基于同样的转换规则,转换为相应的标识信息后,在所述索引信息中进行检索。
若所述输入字符串中未对应于一个完整的音节,则可先根于预先设定的音节表,获取与所述字符串相对应的一个或多个可能的音节;然后,基于所述可能的音节,分别在索引信息中进行检索。例如,若用户输入了“d”,则可先确定以d为起始的所有音节,包括“dang、dian、dong、ding、deng、duan、diao、dao、dei、dui、dou、duo、dan、dai、dun、diu、die、dia、den、de、da、di、du”;然后,以这些音节为起始位置,找到在数据库中所存储的包含d开头的音节,如“dan”。
然后,在步骤S3中,所述提供装置基于与所述输入字符串相对应的索引信息,获取所述索引信息所对应的所述词条数据信息的定位信息,从而基于所述定位信息,得到所述词条数据信息;最后根据所述词条数据信息中的文字,将该文字词条作为与所述输入字符串相对应的一个或多个输入候选项;进一步地,还可以根据所述词条数据信息中的词频,对所获取的一个或多个输入候选项进行排序,并依据排序顺序,将所述输入候选项提供给所述用户。
其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。换言之,所述用户所输入的输入字符串直接对应的文字,仅属于所述输入候选项中的部分文字,用户可以通过输入少量字符,来完成多个文字的输入。
例如,当用户输入“d”,基于上述处理,可根据用户记录调用“但是”、“当然了”等作为输入候选项;当用户输入“dan”,基于上述处理,可根据用户记录调用“但是”、“当然了”等作为输入候选项;而当用户输入“dang”,则可将“当然了”作为输入候选项。
图4示出根据本发明的一个优选实施例的一种用于提供输入候选项的方法流程图。在步骤S1’中,所述提供装置根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息;在步骤S2’中,所述提供装置获取所述用户的输入字符串;在步骤S31’中,所述提供装置根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配;在步骤S32’中,所述提供装置根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
其中,所述步骤S1’、所述步骤S2’与图3中所述对应步骤相同或相似,故在此不再赘述,并通过引用的方式包含于此。
在步骤S31’中,所述提供装置根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。
具体地,若所述用户词库中的音节标识串为音节本身,则在步骤S31’中,所述提供装置直接基于所述输入字符串,在所述索引信息中进行检索,以确定与所述输入字符串相匹配的音节标识串;若所述用户词库中的音节标识串为所述音节的标识信息,则在步骤S31’中,所述提供装置将所述输入字符串基于同样的转换规则,转换为相应的标识信息后,在所述索引信息中进行检索,以确定与所述输入字符串相匹配的音节标识串。
若所述输入字符串中未对应于一个完整的音节,则可先根于预先设定的音节表,获取与所述字符串相对应的一个或多个可能的音节;然后,基于所述可能的音节,分别在索引信息中进行检索。
其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。在此,所述匹配包括该输入字符串对应于所述音节标识串中的部分声母或韵母。例如,若输入字符串为“d”,则所述音节字符串可以是“dan”、“dangranle”、“danshi”等。
优选地,在步骤S31’中,所述提供装置可以根据所述输入字符串,根据深度遍历方式,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。
具体地,在步骤S31’中,所述提供装置根据所述输入字符串,在所述用户词库中进行深度遍历,以查询得到与所述输入字符串所相匹配的一个或多个音节标识串;本领域技术人员应能理解所述深度查询的基本方法,所述匹配方式与图4中所述的步骤S31’相同或相似,故不再赘述,并通过引用的方式包含于此。
更优选地,所述检索的终止条件包括以下至少任一项:
-检索得到与所述输入字符串相匹配的全部音节标识串:即对整个用户词库进行检索,并查询得到了与所述输入字符串相匹配的全部音节标识串;
-检索达到了所设置的最大检索层次:例如,限制最大检索层次为3,即表示限制所得到的音节标识串中所包含的音节数最大为3等。优选地,可以将最大检索层次设置为[1至3]+k,其中k为误差系数,1至3则表示了大多数用户的上屏词的长度;
-检索达到了所设置的最大堆栈存储长度:例如,在检索过程中,检索信息(如各个音节标识串的各个音节节点)不断入栈出栈,直到其到达了最大堆栈存储长度,则将小于或等于该最大堆栈存储长度的音节标识串作为与所述输入字符串相匹配的音节标识串。
优选地,在步骤S31’中,所述提供装置确定与所述输入字符串相对应的一个或多个相关输入字符串;根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串,其中,所述输入字符串和/或所述相关输入字符串与所述音节标识串中的部分音节标识串匹配。
具体地,在步骤S31’中,所述提供装置可以通过对所述输入字符串进行补充、纠错、变形等操作,确定与所述输入字符串相对应的一个或多个相关输入字符串;即本发明可以对输入字符串进行模糊搜索。
例如,若用户输入“shaung”,则可纠错为“shuang”;若用户输入“d”,则可补充为“dan”、“dang”等;若用户输入“dang”,也可以变形为“dan”等。
然后,在步骤S31’中,所述提供装置根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串。在此,所述检索方式与图4中所述步骤S31’相同或相似,故在此不再赘述,并通过引用的方式包含于此。
在步骤S32’中,所述提供装置根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
具体地,在步骤S32’中,所述提供装置基于所述定位信息,得到所述词条数据信息;最后根据所述词条数据信息中的文字,将该文字词条作为与所述输入字符串相对应的一个或多个输入候选项;进一步地,还可以根据所述词条数据信息中的词频,对所获取的一个或多个输入候选项进行排序,并依据排序顺序,将所述输入候选项提供给所述用户。
其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。换言之,所述用户所输入的输入字符串直接对应的文字,仅属于所述输入候选项中的部分文字,用户可以通过输入少量字符,来完成多个文字的输入。
优选地,在步骤S32’中,所述提供装置根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个候选输入候选项,其中,所述候选输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串;根据所述候选输入候选项所对应的历史输入相关信息,确定与所述输入字符串相对应的输入候选项。
具体地,在步骤S32’中,所述提供装置基于所述定位信息,得到所述词条数据信息;最后根据所述词条数据信息中的文字,将该文字词条作为与所述输入字符串相对应的一个或多个候选输入候选项。
其中,所述候选输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
然后,在步骤S32’中,所述提供装置根据所述候选输入候选项所对应的历史输入相关信息,对所述候选输入候选项进行优选或排序,从而将优选后的候选输入候选项作为所述输入候选项,或者按照所述排序后的顺序,将所述候选输入候选项提供给所述用户,以作为所述输入候选项。
其中,所述历史输入相关信息可以从所述候选输入候选项中的词条数据信息中直接获取,或者对所述词条数据信息进行分析后获取;或者,还可以与其他设备相交互,以获取其他设备所提供的所述历史输入相关信息。
所述历史输入相关信息包括输入频率、输入时间等;例如输入频率越高,则权重越高,排序越靠前;输入时间与当前时间越接近,则权重越高,排序越靠前等。
以下通过一个优选输入示例,来说明本发明的词库文件存储、检索树结构、检索遍历流程以及输入效果等内容。
首先,假设预设词库中存在以下几个音节及其对应的音节标识信息,在此,所述音节标识信息利用数字来表示。本领域技术人员应能理解,在此,为简便说明起见,所列举的仅为部分音节,其他音节同样存在对应的音节标识信息,并未在此列出。此外,其他的标识音节的方式也适用于本发明,并包含在本发明的保护范围内。
表1部分音节的编号表(实际的编号情况可以发生变化)
音节 sheng dang rang shi ran dan le la ...
音节标识信息 6 42 66 151 176 189 331 371 ....
假设用户曾经有如下历史输入过程,以下过程并不需要连续输入。在此为了简化示例,假设当前用户词库为空:
1.输入danshi,上屏【但是】
2.输入dangranle,上屏【当然了】
3.输入danshengla,上屏【诞生啦】
上屏的词条进入用户词库进行学习,词库记录词条的汉字串、音拼音串、音节标识串,同时在索引树添加该新词条的索引信息。
在该示例中,用户词库的支持以音节标识串为索引的检索方式,检索方式为三叉索引树。图5示出了根据本发明的一个优选实施例的一种用于提供输入候选项的检索树结构示意图,如图5所示,所述三叉索引树也可以称作分层索引二叉树。
在图5中,off1,off2,off3分别表示各个词条在词库数据文件中对应的定位信息(或称文件偏移),根据所述定位信息,能够在用户词库中得到相应的词条数据信息。
图6示出了根据本发明的一个优选实施例的一种词库数据文件结构示意图。图6省略了词频、权重、流水号等等词条相关信息,仅用于示例。
当用户输入输入字符串时,例如,用户输入了输入字符串“d”,则首先音节图添加以d为起始的所有音节,包括:
dang、dian、dong、ding、deng、duan、diao、dao、dei、dui、dou、duo、dan、dai、dun、diu、die、dia、den、de、da、di、du
在此,上述音节是用户词库的预置内容,不对应于任何词条。
然后,所述提供装置以这些音节为起始位置,在所述用户词库中进行查询,以找到距离起始位置最近的一个或多个尾节点。在此,优选地,所述遍历方式为深度遍历。
在此,检索循环终止条件包括以下至少任一项:栈为空,无法pop出数据、限制了最高的检索层次、限制了栈的最大存储长度,避免树太深导致的性能问题。
图7(a)与图7(b)出了根据本发明的一个优选实施例的一种检索遍历流程图;该流程图以dan-189为起始音节检索举例:
在图7(a)中:
循环开始:
起始节点189入栈->
栈顶元素189出栈->
189的左孩子42入栈->
189的next节点151入栈->
栈顶元素42出栈->
42的next节点176入栈->
栈顶元素176出栈->
176的next节点331入栈->
栈顶元素331出栈->
331的左孩子331-end入栈->
栈顶元素331-end出栈,331-end为尾节点,即找到第一个结果->“当然了”
继续以上过程。
返回起始节点189的右孩子节点151
栈顶元素151出栈->
151的左孩子151-end入栈->
栈顶元素151-end出栈,151-end为尾节点,即找到第二个结果->“但是”
在图7(b)中:
栈顶元素151的右孩子节点6入栈->
栈顶元素6出栈->
6的next节点371入栈->
栈顶元素371出栈->
371的左孩子371-end入栈->
栈顶元素371-end出栈,371-end为尾节点,即找到第三个结果->“诞生啦”。
最终结果为联想结果,结果按照词频和输入流水号等属性排序,例如词频高的最新输入在前。优选地,为了不耽误正常结果的出词,该输入候选项可以延迟返回。
图8示出了根据本发明的一个优选实施例的一种输入效果图。
即当输入“d”,则可以直接给出“但是”、“当然了”、“诞生啦”作为输入候选项。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
虽然前面特别示出并且描述了示例性实施例,但是本领域技术人员将会理解的是,在不背离权利要求书的精神和范围的情况下,在其形式和细节方面可以有所变化。这里所寻求的保护在所附权利要求书中做了阐述。在下列编号条款中规定了各个实施例的这些和其他方面:
1.一种用于提供输入候选项的方法,其中,该方法包括以下步骤:
a根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息;
b获取所述用户的输入字符串;
c根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
2.根据条款1所述的方法,其中,所述步骤c包括:
c1根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配;
c2根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
3.根据条款2所述的方法,其中,所述步骤c1包括:
-根据所述输入字符串,根据深度遍历方式,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。
4.根据条款3所述的方法,其中,所述检索的终止条件包括以下至少任一项:
-检索得到与所述输入字符串相匹配的全部音节标识串;
-检索达到了所设置的最大检索层次;
-检索达到了所设置的最大堆栈存储长度。
5.根据条款2至4中任一项所述的方法,其中,所述步骤c1包括:
-确定与所述输入字符串相对应的一个或多个相关输入字符串;
-根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串,其中,所述输入字符串和/或所述相关输入字符串与所述音节标识串中的部分音节标识串匹配。
6.根据条款2至5中任一项所述的方法,其中,所述步骤c2包括:
-根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个候选输入候选项,其中,所述候选输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串;
-根据所述候选输入候选项所对应的历史输入相关信息,确定与所述输入字符串相对应的输入候选项。
7.根据条款1至6中任一项所述的方法,其中,所述步骤a包括:
-根据用户的历史输入记录,结合所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,以确定与所述用户相对应的一条或多条词条数据信息;
-根据所述词条数据信息,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。
8.根据条款1至7中任一项所述的方法,其中,所述音节标识串包括所述词条数据信息所对应的多个音节的组合,或者包括能够对应于所述多个音节的标识信息的组合。
9.一种用于提供输入候选项的提供装置,其中,该提供装置包括:
建立装置,用于根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息;
获取装置,用于获取所述用户的输入字符串;
确定装置,用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
10.根据条款1所述的提供装置,其中,所述确定装置包括:
检索单元,用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配;
提取单元,用于根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
11.根据条款10所述的提供装置,其中,所述检索单元用于:
-根据所述输入字符串,根据深度遍历方式,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。
12.根据条款11所述的提供装置,其中,所述检索的终止条件包括以下至少任一项:
-检索得到与所述输入字符串相匹配的全部音节标识串;
-检索达到了所设置的最大检索层次;
-检索达到了所设置的最大堆栈存储长度。
13.根据条款10至12中任一项所述的提供装置,其中,所述检索单元用于:
-确定与所述输入字符串相对应的一个或多个相关输入字符串;
-根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串,其中,所述输入字符串和/或所述相关输入字符串与所述音节标识串中的部分音节标识串匹配。
14.根据条款10至13中任一项所述的提供装置,其中,所述提取单元用于:
-根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个候选输入候选项,其中,所述候选输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串;
-根据所述候选输入候选项所对应的历史输入相关信息,确定与所述输入字符串相对应的输入候选项。
15.根据条款9至14中任一项所述的提供装置,其中,所述建立装置用于:
-根据用户的历史输入记录,结合所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,以确定与所述用户相对应的一条或多条词条数据信息;
-根据所述词条数据信息,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。
16.根据条款9至15中任一项所述的提供装置,其中,所述音节标识串包括所述词条数据信息所对应的多个音节的组合,或者包括能够对应于所述多个音节的标识信息的组合。
17.一种输入设备,包括如条款9至16中任一项所述的提供装置。

Claims (17)

1.一种用于提供输入候选项的方法,其中,该方法包括:
用于根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库的步骤,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息;
用于获取所述用户的输入字符串的步骤;
用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的步骤,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
2.根据权利要求1所述的方法,其中,获取一个或多个输入候选项的步骤包括:
用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串的步骤,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配;
用于根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的步骤,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
3.根据权利要求2所述的方法,其中,确定与所述输入字符串相匹配的音节标识串的步骤包括:
根据所述输入字符串,根据深度遍历方式,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。
4.根据权利要求3所述的方法,其中,所述检索的终止条件包括以下至少任一项:
检索得到与所述输入字符串相匹配的全部音节标识串;
检索达到了所设置的最大检索层次;
检索达到了所设置的最大堆栈存储长度。
5.根据权利要求2至4中任一项所述的方法,其中,确定与所述输入字符串相匹配的音节标识串的步骤包括:
确定与所述输入字符串相对应的一个或多个相关输入字符串;
根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串,其中,所述输入字符串和/或所述相关输入字符串与所述音节标识串中的部分音节标识串匹配。
6.根据权利要求2至5中任一项所述的方法,其中,根据所述定位信息提取输入候选项的步骤包括:
根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个候选输入候选项,其中,所述候选输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串;
根据所述候选输入候选项所对应的历史输入相关信息,确定与所述输入字符串相对应的输入候选项。
7.根据权利要求1至6中任一项所述的方法,其中,建立或更新与所述用户相对应的用户词库的步骤包括:
根据用户的历史输入记录,结合所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,以确定与所述用户相对应的一条或多条词条数据信息;
根据所述词条数据信息,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。
8.根据权利要求1至7中任一项所述的方法,其中,所述音节标识串包括所述词条数据信息所对应的多个音节的组合,或者包括能够对应于所述多个音节的标识信息的组合。
9.一种用于提供输入候选项的提供装置,其中,该提供装置包括:
用于根据用户的历史输入记录,建立或更新与所述用户相对应的用户词库的装置,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息;
用于获取所述用户的输入字符串的装置;
用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以获取与所述索引信息相对应的一个或多个词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的装置,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
10.根据权利要求1所述的提供装置,其中,获取一个或多个输入候选项的步骤的装置包括:
用于根据所述输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串的单元,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配;
用于根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个输入候选项的单元,其中,所述输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串。
11.根据权利要求10所述的提供装置,其中,确定与所述输入字符串相匹配的音节标识串的单元用于:
根据所述输入字符串,根据深度遍历方式,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串相匹配的音节标识串,其中,所述输入字符串与所述音节标识串中的部分音节标识串匹配。
12.根据权利要求11所述的提供装置,其中,所述检索的终止条件包括以下至少任一项:
检索得到与所述输入字符串相匹配的全部音节标识串;
检索达到了所设置的最大检索层次;
检索达到了所设置的最大堆栈存储长度。
13.根据权利要求10至12中任一项所述的提供装置,其中,确定与所述输入字符串相匹配的音节标识串的单元用于:
确定与所述输入字符串相对应的一个或多个相关输入字符串;
根据所述输入字符串和/或所述相关输入字符串,利用所述用户词库的索引信息进行检索,以确定与所述输入字符串和/或所述相关输入字符串相匹配的音节标识串,其中,所述输入字符串和/或所述相关输入字符串与所述音节标识串中的部分音节标识串匹配。
14.根据权利要求10至13中任一项所述的提供装置,其中,根据所述定位信息提取输入候选项的单元用于:
根据所述音节标识串所对应的所述词条数据信息的定位信息,从所述用户词库中提取所述词条数据信息,并作为与所述输入字符串相对应的一个或多个候选输入候选项,其中,所述候选输入候选项中的部分文字的至少部分音节标识串对应于所述输入字符串;
根据所述候选输入候选项所对应的历史输入相关信息,确定与所述输入字符串相对应的输入候选项。
15.根据权利要求9至14中任一项所述的提供装置,其中,建立或更新与所述用户相对应的用户词库的装置用于:
根据用户的历史输入记录,结合所述用户在历史输入记录中的上屏信息,对所述历史输入记录进行分词,以确定与所述用户相对应的一条或多条词条数据信息;
根据所述词条数据信息,建立或更新与所述用户相对应的用户词库,其中,所述用户词库包括一条或多条词条数据信息以及对应的索引信息,所述索引信息包括所述词条数据信息的音节标识串以及所述音节标识串所对应的所述词条数据信息的定位信息。
16.根据权利要求9至15中任一项所述的提供装置,其中,所述音节标识串包括所述词条数据信息所对应的多个音节的组合,或者包括能够对应于所述多个音节的标识信息的组合。
17.一种输入设备,包括如权利要求9至16中任一项所述的提供装置。
CN201610849612.7A 2016-09-23 2016-09-23 一种用于提供输入候选项的方法、装置和输入设备 Active CN106371624B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610849612.7A CN106371624B (zh) 2016-09-23 2016-09-23 一种用于提供输入候选项的方法、装置和输入设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610849612.7A CN106371624B (zh) 2016-09-23 2016-09-23 一种用于提供输入候选项的方法、装置和输入设备

Publications (2)

Publication Number Publication Date
CN106371624A true CN106371624A (zh) 2017-02-01
CN106371624B CN106371624B (zh) 2019-03-19

Family

ID=57898054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610849612.7A Active CN106371624B (zh) 2016-09-23 2016-09-23 一种用于提供输入候选项的方法、装置和输入设备

Country Status (1)

Country Link
CN (1) CN106371624B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106896935A (zh) * 2017-02-22 2017-06-27 李晓明 输入法
CN107357444A (zh) * 2017-07-18 2017-11-17 赵宇航 一种基于使用场景的输入模式智能切换方法及装置
CN108304367A (zh) * 2017-04-07 2018-07-20 腾讯科技(深圳)有限公司 分词方法及装置
CN108459733A (zh) * 2018-02-06 2018-08-28 广州阿里巴巴文学信息技术有限公司 辅助输入方法、装置、计算设备及存储介质
CN109426356A (zh) * 2017-09-01 2019-03-05 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109521888A (zh) * 2017-09-19 2019-03-26 北京搜狗科技发展有限公司 一种输入方法、装置和介质
CN109901726A (zh) * 2017-12-08 2019-06-18 北京搜狗科技发展有限公司 一种候选词生成方法、装置及用于候选词生成的装置
CN109947779A (zh) * 2019-03-29 2019-06-28 北京金山安全软件有限公司 用户输入词汇的存储方法、装置及设备
CN111400576A (zh) * 2020-03-19 2020-07-10 安徽火蓝数据有限公司 一种基于文字输入的数据检索方法
CN111522448A (zh) * 2019-02-02 2020-08-11 北京搜狗科技发展有限公司 一种提供输入候选项的方法、装置和设备
CN115577694A (zh) * 2022-11-15 2023-01-06 南方电网科学研究院有限责任公司 标准编写的智能推荐方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100468A (ja) * 2004-12-24 2005-04-14 Mitsubishi Electric Corp 文字入力装置
JP2009009461A (ja) * 2007-06-29 2009-01-15 Fujifilm Corp キーワードの入力支援システム、コンテンツ検索システム、コンテンツ登録システム、コンテンツ検索・登録システム、およびこれらの方法、並びにプログラム
CN103455160A (zh) * 2012-05-29 2013-12-18 阿里巴巴集团控股有限公司 一种根据地理位置推荐候选词的方法和装置
CN104298429A (zh) * 2014-09-25 2015-01-21 北京搜狗科技发展有限公司 一种基于输入的信息展示方法和输入法系统
CN104423621A (zh) * 2013-08-22 2015-03-18 北京搜狗科技发展有限公司 拼音字符串处理方法和装置
CN105094368A (zh) * 2015-07-24 2015-11-25 上海二三四五网络科技有限公司 一种对输入法候选项进行调频排序的控制方法及控制装置
CN105302332A (zh) * 2014-07-25 2016-02-03 中国移动通信集团公司 一种拼音输入法及其实现装置
CN105824436A (zh) * 2015-01-06 2016-08-03 阿里巴巴集团控股有限公司 一种字符输入方法以及输入法系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100468A (ja) * 2004-12-24 2005-04-14 Mitsubishi Electric Corp 文字入力装置
JP2009009461A (ja) * 2007-06-29 2009-01-15 Fujifilm Corp キーワードの入力支援システム、コンテンツ検索システム、コンテンツ登録システム、コンテンツ検索・登録システム、およびこれらの方法、並びにプログラム
CN103455160A (zh) * 2012-05-29 2013-12-18 阿里巴巴集团控股有限公司 一种根据地理位置推荐候选词的方法和装置
CN104423621A (zh) * 2013-08-22 2015-03-18 北京搜狗科技发展有限公司 拼音字符串处理方法和装置
CN105302332A (zh) * 2014-07-25 2016-02-03 中国移动通信集团公司 一种拼音输入法及其实现装置
CN104298429A (zh) * 2014-09-25 2015-01-21 北京搜狗科技发展有限公司 一种基于输入的信息展示方法和输入法系统
CN105824436A (zh) * 2015-01-06 2016-08-03 阿里巴巴集团控股有限公司 一种字符输入方法以及输入法系统
CN105094368A (zh) * 2015-07-24 2015-11-25 上海二三四五网络科技有限公司 一种对输入法候选项进行调频排序的控制方法及控制装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106896935A (zh) * 2017-02-22 2017-06-27 李晓明 输入法
CN108304367A (zh) * 2017-04-07 2018-07-20 腾讯科技(深圳)有限公司 分词方法及装置
CN107357444A (zh) * 2017-07-18 2017-11-17 赵宇航 一种基于使用场景的输入模式智能切换方法及装置
CN109426356B (zh) * 2017-09-01 2022-07-15 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109426356A (zh) * 2017-09-01 2019-03-05 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109521888B (zh) * 2017-09-19 2022-11-01 北京搜狗科技发展有限公司 一种输入方法、装置和介质
CN109521888A (zh) * 2017-09-19 2019-03-26 北京搜狗科技发展有限公司 一种输入方法、装置和介质
CN109901726A (zh) * 2017-12-08 2019-06-18 北京搜狗科技发展有限公司 一种候选词生成方法、装置及用于候选词生成的装置
CN108459733A (zh) * 2018-02-06 2018-08-28 广州阿里巴巴文学信息技术有限公司 辅助输入方法、装置、计算设备及存储介质
CN111522448A (zh) * 2019-02-02 2020-08-11 北京搜狗科技发展有限公司 一种提供输入候选项的方法、装置和设备
CN111522448B (zh) * 2019-02-02 2024-04-30 北京搜狗科技发展有限公司 一种提供输入候选项的方法、装置和设备
CN109947779A (zh) * 2019-03-29 2019-06-28 北京金山安全软件有限公司 用户输入词汇的存储方法、装置及设备
CN109947779B (zh) * 2019-03-29 2021-01-22 北京金山安全软件有限公司 用户输入词汇的存储方法、装置及设备
CN111400576A (zh) * 2020-03-19 2020-07-10 安徽火蓝数据有限公司 一种基于文字输入的数据检索方法
CN111400576B (zh) * 2020-03-19 2023-05-12 安徽火蓝数据有限公司 一种基于文字输入的数据检索方法
CN115577694A (zh) * 2022-11-15 2023-01-06 南方电网科学研究院有限责任公司 标准编写的智能推荐方法

Also Published As

Publication number Publication date
CN106371624B (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN106371624A (zh) 一种用于提供输入候选项的方法与装置
CN107797991B (zh) 一种基于依存句法树的知识图谱扩充方法及系统
CN104915340B (zh) 自然语言问答方法及装置
CN102135814B (zh) 一种字词输入方法及系统
US20170185673A1 (en) Method and Electronic Device for QUERY RECOMMENDATION
CN104008166B (zh) 一种基于形态和语义相似度的对话短文本聚类方法
JP6466952B2 (ja) 文章生成システム
KR20190038751A (ko) 사용자 키워드 추출장치, 방법 및 컴퓨터 판독 가능한 저장매체
KR101252397B1 (ko) 웹을 이용한 정보 검색 방법 및 이를 사용하는 음성 대화 방법
US20170103061A1 (en) Interaction apparatus and method
JP5010885B2 (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP2015506515A (ja) タグをドキュメントに自動的に追加するための方法、装置およびコンピュータ記憶媒体
CN103514230B (zh) 一种用于根据语料序列训练语言模型的方法与设备
CN104951219B (zh) 一种移动终端文本输入的方法及移动终端
CN105956158B (zh) 基于海量微博文本和用户信息的网络新词自动提取的方法
CN113705237A (zh) 融合关系短语知识的关系抽取方法、装置和电子设备
CN110866408B (zh) 数据库制作装置以及检索系统
CN104021202B (zh) 一种知识共享平台的词条处理装置和方法
US11468346B2 (en) Identifying sequence headings in a document
TW201335776A (zh) 辭典產生裝置、辭典產生方法、辭典產生程式、及記憶該程式之電腦可讀取記錄媒體
CN103076894A (zh) 一种用于根据对象标识信息构建输入词条的方法与设备
CN109543002B (zh) 简写字符的还原方法、装置、设备及存储介质
CN106372038A (zh) 关键词的抽取方法及装置
CN111339778B (zh) 文本处理方法、装置、存储介质和处理器
US20130202208A1 (en) Information processing device and information processing method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant