WO2014101577A1 - 一种用于提供输入字符串所对应的输入候选项的方法与设备 - Google Patents

一种用于提供输入字符串所对应的输入候选项的方法与设备 Download PDF

Info

Publication number
WO2014101577A1
WO2014101577A1 PCT/CN2013/086968 CN2013086968W WO2014101577A1 WO 2014101577 A1 WO2014101577 A1 WO 2014101577A1 CN 2013086968 W CN2013086968 W CN 2013086968W WO 2014101577 A1 WO2014101577 A1 WO 2014101577A1
Authority
WO
WIPO (PCT)
Prior art keywords
input
string
candidates
context information
character string
Prior art date
Application number
PCT/CN2013/086968
Other languages
English (en)
French (fr)
Inventor
陆阳阳
孟可丰
Original Assignee
百度在线网络技术(北京)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 百度在线网络技术(北京)有限公司 filed Critical 百度在线网络技术(北京)有限公司
Priority to US14/412,287 priority Critical patent/US20150293972A1/en
Priority to JP2015549962A priority patent/JP6114403B2/ja
Priority to EP13867100.3A priority patent/EP2940557B1/en
Publication of WO2014101577A1 publication Critical patent/WO2014101577A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种用于提供输入字符串所对应的输入候选项的方法与设备。该方法包括:输入设备获取输入字符串;确定所述输入字符串的上下文信息;根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。与现有技术相比,该方法和设备通过根据输入字符串的上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;并将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用;从而提高了输入灵活度,与用户的输入需求相匹配,还提高了输入法的输入效率,改善了用户体验。

Description

一种用于提供输入字符串所对应的输入候选项的方法与 设备
技术领域
本发明涉及互联网技术领域, 尤其涉及一种用于提供输入字符串 所对应的输入候选项的技术。 背景技术
对于中文输入而言, 存在大量的同音异义词, 而实际用户在输入 过程中仅会选择其中的一个, 当前的输入法将多个输入候选项提供给 用户, 由用户根据需求进行选择, 当输入候选项较多时, 用户进行选 择操作则会导致输入的緩慢低效。 考虑到文字的输入间具有一定的语 义或逻辑关系, 如何利用所述语义或逻辑关系, 对输入候选项进行处 理, 从而提升用户的使用体验, 成为本领域技术人员亟需解决的一个 问题。 发明内容
本发明的目的是提供一种用于提供输入字符串所对应的输入候选 项的方法与设备。
根据本发明的一个方面, 提供了一种用于提供输入字符串所对应 的输入候选项的方法, 其中, 该方法包括以下步骤:
a 获取输入字符串;
b 确定所述输入字符串的上下文信息;
c 根据所述输入字符串, 以及所述上下文信息, 确定与所述输入 字符串对应的一个或多个输入候选项;
d 将所述一个或多个输入候选项中至少一个提供给所述输入字 符串所对应的目标应用。
根据本发明的另一方面, 还提供了一种用于提供输入字符串所对 应的输入候选项的输入设备, 其中, 该设备包括:
获取装置, 用于获取输入字符串;
上下文确定装置, 用于确定所述输入字符串的上下文信息; 候选项确定装置, 用于根据所述输入字符串, 以及所述上下文信 息, 确定与所述输入字符串对应的一个或多个输入候选项;
提供装置, 用于将所述一个或多个输入候选项中至少一个提供给 所述输入字符串所对应的目标应用。
与现有技术相比, 本发明通过根据输入字符串的上下文信息, 确 定与所述输入字符串对应的一个或多个输入候选项; 并将所述一个或 多个输入候选项中至少一个提供给所述输入字符串所对应的目标应 用; 从而提高了输入灵活度, 与用户的输入需求相匹配, 还提高了输 入法的输入效率, 改善了用户体验。
而且, 本发明还可以通过对与所述输入字符串对应的一个或多个 初步输入候选项进行处理, 以获得所述一个或多个输入候选项; 进一步 地, 还可以根据所述初步输入候选项与所述上下文信息对应的搭配相关 度信息, 对所述一个或多个初步输入候选项进行处理, 以获得所述一个 或多个输入候选项; 更进一步地, 还可以根据对文本信息的分析处理, 获得搭配频度满足一定阈值的分词搭配关系, 从而建立或更新所述词语 搭配数据库; 从而提高了输入字符串与输入候选项的匹配准确度, 与 用户的输入需求相匹配,提高了输入法的输入效率,改善了用户体猃。
而且, 本发明还可以确定包含所述输入字符串的增补字符串, 并根 据所述增补字符串, 获得与所述增补字符串对应的一个或多个增补输入 候选项, 通过对所述增补输入候选项进行筛选处理, 以获得所述一个或 多个输入候选项; 从而提高了输入灵活度, 提高了输入字符串与输入候 选项的匹配准确度, 与用户的输入需求相匹配, 提高了输入法的输入 效率, 改善了用户体 ^r。
而且,本发明还可以所述输入字符串所对应的相关文本进行自然语 言处理, 从所述相关文本提取对应的焦点词语, 以作为所述上下文; 从 而提高了输入字符串与输入候选项的匹配准确度, 与用户的输入需求 相匹配, 提高了输入法的输入效率, 改善了用户体 ^r。
而且, 本发明还可以检测所述输入字符串是否超出预定的长度阈 值, 若所述输入字符串超出所述长度阈值, 根据所述输入字符串, 以及 所述上下文信息, 迭代确定与所述输入字符串对应的一个或多个输入候 选项; 进一步地, 通过检测所述输入字符串在输入词库中对应的一个或 多个抽样输入候选项中至少一个中的字数是超出预定的字数阈值, 以确 定所述输入字符串是否超出预定的长度阈值; 进一步地, 当所述输入字 符串超出所述长度阈值, 还可以确定部分输入候选项与其余输入候选 项, 并才艮据所述一个或多个部分输入候选项, 以及所述一个或多个其余 输入候选项,确定所述一个或多个输入候选项;从而提高了输入灵活度, 提高了输入字符串与输入候选项的匹配准确度, 与用户的输入需求相 匹配, 提高了输入法的输入效率, 改善了用户体验。 附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述, 本发明的其它特征、 目的和优点将会变得更明显:
图 1示出根据本发明一个方面的一种用于提供输入字符串所对应 的输入候选项的输入设备示意图;
图 2示出根据本发明一个优选实施例的一种用于提供输入字符串 所对应的输入候选项的输入设备示意图;
图 3示出根据本发明另一个优选实施例的一种用于提供输入字符 串所对应的输入候选项的输入设备示意图;
图 4示出根据本发明另一个方面的一种用于提供输入字符串所对 应的输入候选项的方法流程图;
图 5示出根据本发明一个优选实施例的一种用于提供输入字符串 所对应的输入候选项的方法流程图;
图 6示出根据本发明另一个优选实施例的一种用于提供输入字符 串所对应的输入候选项的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。 具体实施方式
下面结合附图对本发明作进一步详细描述。
图 1示出根据本发明一个方面的一种用于提供输入字符串所对应 的输入候选项的输入设备示意图; 其中, 所述输入设备包括获取装置
11、 上下文确定装置 12、 候选项确定装置 13、 提供装置 14。 具体地, 获取装置 11获取输入字符串; 上下文确定装置 12确定所述输入字符 串的上下文信息; 候选项确定装置 13根据所述输入字符串, 以及所 述上下文信息, 确定与所述输入字符串对应的一个或多个输入候选 项; 提供装置 14将所述一个或多个输入候选项中至少一个提供给所 述输入字符串所对应的目标应用。 在此, 输入设备包括但不限于网络 设备、 用户设备、 或网络设备与用户设备通过网络相集成所构成的设 备。 其中, 所述网络设备其包括但不限于计算机、 网络主机、 单个网 络服务器、 多个网络服务器集或多个服务器构成的云; 在此, 云由基 于云计算( Cloud Computing )的大量计算机或网络服务器构成,其中, 云计算是分布式计算的一种, 由一群松散耦合的计算机集组成的一个 虚拟超级计算机。 所述用户设备其包括但不限于任何一种可与用户通 过键盘、 遥控器、 触摸板、 或声控设备进行人机交互的电子产品, 例 如计算机、 智能手机、 PDA, 游戏机、 或 IPTV等。 所述网络包括但 不限于互联网、 广域网、 城域网、 局域网、 VPN网络、 无线自组织网 络(Ad Hoc 网络) 等。 本领域技术人员应能理解, 其他的输入设备 同样适用于本发明, 也应包含在本发明保护范围以内, 并在此以引用 方式包含于此。
上述各装置之间是持续不断工作的, 在此, 本领域技术人员应理 解"持续"是指上述各装置分别实时地或者按照设定的或实时调整的 工作模式要求, 进行输入字符串的获取、 上下文信息的确定、 输入候 选项的确定、 输入候选项的提供等, 直至输入设备停止获取输入字符 串。
获取装置 11获取输入字符串。 具体地, 所述获取装置 11通过从 输入框中接收用户或其他应用等通过输入、 选择、 点击等操作所输入 的字符串; 或者根据各种通信协议 (Communications Protocol), 通过各 种数据传输接口, 获取从其他应用的输入框中的字符串; 其中, 所述 输入框如短信编辑框、 内容输入框等。 其中, 所述输入字符串包括但不 限于通过如全拼或简拼等方式所输入的拼音编码字符等。
上下文确定装置 12确定所述输入字符串的上下文信息。 具体地, 所述上下文确定装置 12通过根据获取装置 11所获取的输入字符串, 利用当前所输入的字符串所属的文字等, 将所述当前输入字符串所属 的文字与一个或多个词库进行匹配, 获取与所述输入字符串相关联的 一种或多种匹配信息, 并作为所述输入字符串的上下文信息; 例如, 当输入 "huacao" 时, 先确定所述输入字符串所属的文字可能为 "花 草", 根据 "花草" 在所属词库中的匹配信息, 确定其下文信息可能 为 "茶" 等; 或者, 所述上下文确定装置 12通过根据与所述输入字 符串相对应的历史记录信息, 对所述输入字符串的上下文信息进行确 定, 例如, 所述输入字符串前刚刚上屏的前一个输入字符串, 则可作 为所述输入字符串的前文信息。 在此, 所述上下文信息包括但不限于 与所述输入字符串相对应的上文信息或下文信息; 例如, 当所述输入 为 "shishi"时, 当前次输入所上屏的词组为 "客观"时,则所述 "shishi" 对应的上文信息为 "客观"; 若屏幕上存在一个词组 "计划", 且输入 "shishi" 时, 光标位于 "计划" 前, 则其所对应的下文信息为 "计 划" 等。
候选项确定装置 13根据所述输入字符串, 以及所述上下文信息, 确定与所述输入字符串对应的一个或多个输入候选项。 具体地, 候选 项确定装置 13通过根据获取装置 11所获取的输入字符串, 以及上下 文确定装置 12所确定的上下文信息, 通过将与所述输入字符串相对 应的一个或多个上下文信息直接作为一个或多个输入候选项, 或者将 所述输入字符串相对应的上下文信息进行处理后作为输入候选项的 方式, 确定与所述输入字符串对应的一个或多个输入候选项。 例如, 继上例, 当所述输入字符串为 "shishi" 时, 其所对应的上文信息可 能为 "客观", "我", "谈论" 等, 当所述上文信息为 "客观" 时, 通 过利用将所述输入字符串, 以及所述上下文信息进行匹配等的方式, 确定输入候选项为 "事实"、 "实时"、 "实施" 等; 当所述上文信息为 "我" 时, 确定输入候选项为 "试试"、 "实施"、 "试试" 等; 当所述 上文信息为 "谈论" 时, 确定输入候选项为 "时事"、 "事实"、 "世事" 等。
提供装置 14将所述一个或多个输入候选项中至少一个提供给所 述输入字符串所对应的目标应用。 具体地, 提供装置 14通过直接提 供, 或才艮据各种通信协议 (Communications Protocol), 通过各种数据传 输接口, 通过例如重新排序或筛选等方式, 将所述一个或多个输入候 选项中至少一个提供给所述输入字符串所对应的目标应用。 其中, 所 述目标应用包括但不限于与所述获取装置 11 所对应的输入框相对应 的相同应用, 或者与所述获取装置 11 所对应的输入框相关联的其他 应用等, 如直接利用所述输入候选项进行搜索等。
优选地, 所述候选项确定装置 13还可以才艮据所述输入字符串, 以 及所述上下文信息, 确定包含所述输入字符串的增补字符串, 其中, 所 述增补字符串还包括所述上下文信息所对应的字符串; 才艮据所述增补字 符串, 在输入词库中进行匹配查询, 以获得与所述增补字符串对应的一 个或多个增补输入候选项; 才艮据所述上下文信息, 对所述一个或多个增 补输入候选项进行筛选处理, 以获得所述一个或多个输入候选项。 具体 地, 所述候选项定装置 13 还可以根据所述输入字符串, 以及所述上下 文信息, 通过将所述输入字符串结合所述上下文信息与例如输入词库进 行匹配等方式, 确定包含所述输入字符串的增补字符串, 例如, 当输入 字符串为 "xuxu" 时, 当上下文信息为 "形态", 则确定所述增补字符 串为 "rusheng"; 或者, 当输入字符串为" tianan", 上下文信息为 "北 京", 则确定所述增补字符串为 "men" , 在此, 所述增补字符串包括但 不限于通过匹配等方式, 确定一个或多个通过拼接而成的多段字符串。 所述候选项定装置 13 通过将所述增补字符串在输入词库中进行匹配查 询, 以获得与所述增补字符串对应的一个或多个增补输入候选项; 继前 例, 所述增补字符串为 "rusheng"时所对应的增补输入候选项如 "如生"、 "入声"、 "入胜" 等, 所述增补字符串为 "men" 时, 所对应的增补输 入候选项如 "天安门"、 "门" 等。 或者, 所述增补输入候选项还可以 直接包括所述上下文信息, 如直接生成 "形态栩栩如生"、 "北京天安门" 等。 根据所述上下文信息, 对所述一个或多个增补输入候选项进行筛选 处理, 继前例, 根据上下文信息, 分别确定输入候选项为 "栩栩如生"、 "天安门" 从而获得所述一个或多个输入候选项; 在此, 若所述增补输 入候选项中包含上下文信息, 则将所述增补输入候选项中的上下文信息 删除后, 获得所述一个或多个输入候选项, 如所述增补输入候选项 "北 京天安门" 中的 "北京" 删除, 获得所述一个或多个输入候选项 "天安 门,,。
优选地, 所述上下文确定装置 12还可以通过对所述输入字符串所 对应的相关文本进行自然语言处理, 从所述相关文本提取对应的焦点词 语, 以作为所述上下文, 其中, 所述焦点词语邻近所述输入字符串所对 应的输入位置。 具体地, 所述上下文确定装置 12还可以通过分词或语 义分析等方式, 对所述输入字符串所对应的相关文本进行自然语言处 理, 其中, 所述相关文本包括但不限于所述输入字符串本身所对应的文 本, 或者所述输入字符串所对应的输入位置前后已经上屏的相关文本; 通过对所述相关文本中经由自然语言处理, 提取对应的焦点词语以作为 所述上下文。 例如, 当所述输入字符串为 "shishi" 时, 其对应的相关文 本为 "上海地铁一期工程", 且所述输入字符串位于 "上海地铁一期工 程"之后,通过对所述相关文本进行自然语言处理,提取焦点词语为 "工 程",并将"工程"作为上下文。进一步地,因此,当输入字符串为 "shishi" 时, 该输入设备才艮据所述上下文 "工程", 确定输入候选项为 "实施"、 "实时"、 "试试" 等。
图 2示出根据本发明一个优选实施例的一种用于提供输入字符串 所对应的输入候选项的输入设备示意图; 其中, 所述输入设备包括获 取装置 11 '、上下文确定装置 12'、候选项确定装置 13'、提供装置 14' , 在此, 所述候选项确定装置 13,包括匹配单元 131,和处理单元 132,。 具体地, 获取装置 1 Γ获取输入字符串; 上下文确定装置 12'确定所述 输入字符串的上下文信息; 匹配单元 131,才艮据所述输入字符串, 在输 入词库中进行匹配查询, 以获得与所述输入字符串对应的一个或多个初 步输入候选项; 处理单元 132,根据所述上下文信息, 对所述一个或多个 初步输入候选项进行处理, 以获得所述一个或多个输入候选项; 提供装 置 14'将所述一个或多个输入候选项中至少一个提供给所述输入字符 串所对应的目标应用。其中,所述获取装置 11,、上下文确定装置 12,、 提供装置 14,与图 1所示对应装置相同或基本相同,故此处不再赘述, 并通过引用的方式包含于此。
上述各装置之间是持续不断工作的, 在此, 本领域技术人员应理 解"持续"是指上述各装置分别实时地或者按照设定的或实时调整的 工作模式要求, 进行输入字符串的获取、 上下文信息的确定、 初步输 入候选项的获取、 输入候选项的确定、 输入候选项的提供等, 直至输 入设备停止获取输入字符串。
匹配单元 131,根据所述输入字符串, 在输入词库中进行匹配查询, 以获得与所述输入字符串对应的一个或多个初步输入候选项。 具体地, 所述匹配单元 131,通过获取所述输入字符串, 将所述输入字符串与输入 词库中的词进行匹配, 以获得与所述输入字符串对应的一个或多个初步 输入候选项。 例如, 当输入字符串为 "shishi" 时, 根据在输入词库中进 行匹配查询后, 获取 "实时"、 "试试"、 "实施"、 "事实"、 "适时"、 "逝 世" 等多个初步输入候选项。
处理单元 132,根据所述上下文信息, 对所述一个或多个初步输入候 选项进行处理, 以获得所述一个或多个输入候选项。 具体地, 处理单元 132'根据所述输入字符串的上下文信息, 通过根据自然语言模型或词语 搭配数据库等, 确定上下文信息与初步输入候选项的搭配概率, 并根据 所述搭配概率对所述初步输入候选项进行筛选或排序, 以获得输入候选 项。 例如, 继前例, 当上下文信息为 "客观", 则经处理后, 将初步输 入候选项进行重新排序, 顺序变为 "事实"、 "实时"、 "试试"、 "实施"、 "适时"、 "逝世" 等。 优选地, 所述处理单元 132,还可以根据所述上下文信息, 在词语搭 配数据库中进行匹配查询, 以确定所述初步输入候选项与所述上下文信 息对应的搭配相关度信息; 根据所述搭配相关度信息, 对所述一个或多 个初步输入候选项进行处理, 以获得所述一个或多个输入候选项。 具体 地, 所述处理单元 132,还可以根据所述上下文信息, 在词语搭配数据库 中进行匹配查询, 通过才艮据所述词语搭配数据库中的一个或多个词条与 所述上下文的匹配关系等, 确定所述初步输入候选项与所述上下文信息 对应的搭配相关度信息; 例如若或为 bull变量, 则所述搭配相关度信息 表示如是否存在搭配; 或为连续变量, 如所述搭配相关度信息表示搭配 概率为多少; 在此, 所述搭配相关度信息可根据如词语搭配数据库或其 他相关数据库中的上下文与初步输入候选项的组合频率等通过机器学 习获得。 根据所述搭配相关度信息, 通过对所述一个或多个初步输入候 选项进行如筛选或排序处理, 获得所述一个或多个输入候选项。
更优选地, 所述输入设备还包括文本处理装置 (未示出)和建立 装置 (未示出); 其中, 文本处理装置对一个或多个文本信息进行分析 处理, 以获得搭配频度满足一定阈值的分词搭配关系; 建立装置根据所 述分词搭配关系, 建立或更新所述词语搭配数据库。 具体地, 文本处理 装置例如通过对各类日志、 各类文章等进行获取, 并对所获取文本信息 进行如先分词, 后统计相邻词间的共现频率等分析方法, 当所述共现频 率超过一定阈值时, 则判断所述相邻词间存在一定的搭配关系, 从而获 得搭配频度满足一定阈值的分词搭配关系; 建立装置根据所述分词搭配 关系,建立所述词语搭配数据库,或对现有词语搭配数据库进行更新等, 在此, 所述词语搭配数据库中包括但不限于分词搭配关系以及分词搭配 关系之间的搭配概率信息; 并且, 所述词语搭配数据库中可包含现有固 定词语, 如成语、 俗语等, 同时经过所述更新, 可以将由于现有网络应 用的快速发展所产生的新的词语及表述进行包含, 从而有效提高用户的 输入效率。
图 3示出根据本发明另一个优选实施例的一种用于提供输入字符 串所对应的输入候选项的输入设备示意图; 其中, 所述输入设备包括 获取装置 11"、 上下文确定装置 12"、 候选项确定装置 13"、 提供装置 14", 在此, 所述候选项确定装置 13"包括检测单元 133"和迭代单元 134"。 具体地, 获取装置 11"获取输入字符串; 上下文确定装置 12" 确定所述输入字符串的上下文信息; 检测单元 133"检测所述输入字 符串是否超出预定的长度阈值; 若所述输入字符串超出所述长度阈值, 迭代单元 134 艮据所述输入字符串, 以及所述上下文信息,迭代确定与 所述输入字符串对应的一个或多个输入候选项; 提供装置 14"将所述一 个或多个输入候选项中至少一个提供给所述输入字符串所对应的目 标应用。 其中, 所述获取装置 11"、 上下文确定装置 12"、 提供装置 14"与图 1 所示对应装置相同或基本相同, 故此处不再赘述, 并通过 引用的方式包含于此。
上述各装置之间是持续不断工作的, 在此, 本领域技术人员应理 解"持续"是指上述各装置分别实时地或者按照设定的或实时调整的 工作模式要求, 进行输入字符串的获取、 上下文信息的确定、 长度阈 值的检测、 输入候选项的确定、 输入候选项的提供等, 直至输入设备 停止获取输入字符串。
检测单元 133"检测所述输入字符串是否超出预定的长度阈值。 具 体地, 所述检测单元 133"通过基于预置的或用户自行设置的长度阈值, 对所述输入字符串的长度进行检测, 检测所述输入字符串的长度是否超 出了预定的长度阈值。 例如, 当预定的字符长度阈值为 N, 当所述输入 字符串的长度为 N+1时, 则检测单元 133"检测所述输入字符串超出了 预定的长度阈值。
若所述输入字符串超出所述长度阈值,迭代单元 134"根据所述输入 字符串, 以及所述上下文信息, 迭代确定与所述输入字符串对应的一个 或多个输入候选项。 具体地, 若所述输入字符串超出所述长度阈值, 迭 代单元 134"通过根据所述输入字符串, 以及所述上下文信息, 通过例 如根据所述长度阈值, 对所述输入字符串进行分段等处理, 确定与第 一个长度阈值的输入字符串所对应的所述输入候选项, 并将所确定的 输入候选项再次作为上下文信息, 从而迭代确定下一个长度阈值的输 入字符串所对应的输入候选项等的方式, 确定与所述输入字符串对应 的一个或多个输入候选项。
优选地, 所述检测单元 133"还可以获取所述输入字符串在输入词 库中对应的一个或多个抽样输入候选项; 检测所述一个或多个抽样输入 候选项中至少一个中的字数是超出预定的字数阈值, 以确定所述输入字 符串是否超出预定的长度阈值。 具体地, 所述检测单元 133"还可以通 过例如将所述输入字符串直接在所述输入词库中进行匹配, 获取与所 述全部输入字符串所对应的一个或多个输入候选项, 并从中随机抽取 或指定抽取(如选择第一个输入候选项等) 方式, 获取所述输入字符 串在输入词库中对应的一个或多个抽样输入候选项; 通过对所述一个或 多个抽样输入候选项进行检测, 如所述抽样输入候选项中的其中至少一 个字数超出预定的字数阈值, 则确定所述输入字符串是否超出预定的长 度阈值。
优选地, 所述迭代单元 134"还可以当所述输入字符串超出所述长 度阈值, 根据所述上下文信息, 以及所述输入字符串中与所述上下文信 息相邻的部分输入字符串, 确定与所述部分输入字符串对应的一个或多 个部分输入候选项; 根据所述部分输入字符串, 以及所述输入字符串中 其余输入字符串, 确定与所述其余输入字符串对应的一个或多个其余输 入候选项, 其中, 所述部分输入候选项被用作所述其余输入字符串的上 下文信息; 才艮据所述一个或多个部分输入候选项, 以及所述一个或多个 其余输入候选项, 确定所述一个或多个输入候选项。
具体地, 当所述输入字符串超出所述长度阈值, 根据所述上下文信 息, 通过例如分词等处理, 对所述输入字符串进行分词或分段等, 从而 获取所述输入字符串中与所述上下文信息相邻的部分输入字符串, 通过 将所述部分输入字符串结合所述上下文信息, 确定与所述部分输入字符 串对应的一个或多个部分输入候选项; 在此, 所述确定方法与图 1中所 述候选项确定装置 13 中的确定方法相同或相似, 故此处不再赘述, 并 通过引用的方式包含于此。 所述迭代单元 134"将所述部分输入候选项 作为其余输入字符串的上下文信息, 通过迭代的方式, 确定与所述其 余输入字符串相对应的一个或多个其余输入候选项;迭代后通过例如对 字符串之间的关系, 对所述部分输入候选项与其余输入候选项进行拼接 等方式, 确定一个或多个输入候选项。
图 4示出根据本发明另一个方面的一种用于提供输入字符串所对 应的输入候选项的方法流程图。 具体地, 在步骤 si 中, 输入设备获 取输入字符串; 在步骤 s2 中, 输入设备确定所述输入字符串的上下 文信息; 在步骤 S3 中, 输入设备根据所述输入字符串, 以及所述上 下文信息, 确定与所述输入字符串对应的一个或多个输入候选项; 在 步骤 s4 中, 输入设备将所述一个或多个输入候选项中至少一个提供 给所述输入字符串所对应的目标应用。
上述各步骤之间是持续不断工作的, 在此, 本领域技术人员应理 解"持续"是指上述各步骤分别实时地或者按照设定的或实时调整的 工作模式要求, 进行输入字符串的获取、 上下文信息的确定、 输入候 选项的确定、 输入候选项的提供等, 直至输入设备停止获取输入字符 串。
在步骤 si中, 输入设备获取输入字符串。 具体地, 在步骤 si中, 输入设备通过从输入框中接收用户或其他应用等通过输入、 选择、 点 击等操作所输入的字符串; 或者根据各种通信协议 (Communications Protocol), 通过各种数据传输接口, 获取从其他应用的输入框中的字 符串; 其中, 所述输入框如短信编辑框、 内容输入框等。 其中, 所述输 入字符串包括但不限于通过如全拼或简拼等方式所输入的拼音编码字 付矛。
在步骤 s2 中, 输入设备确定所述输入字符串的上下文信息。 具 体地,在步骤 s2中,输入设备通过根据步骤 si所获取的输入字符串, 利用当前所输入的字符串所属的文字等, 将所述当前输入字符串所属 的文字与一个或多个词库进行匹配, 获取与所述输入字符串相关联的 一种或多种匹配信息, 并作为所述输入字符串的上下文信息; 例如, 当输入 "huacao" 时, 先确定所述输入字符串所属的文字可能为 "花 草", 根据 "花草" 在所属词库中的匹配信息, 确定其下文信息可能 为 "茶" 等; 或者, 在步骤 s2 中, 输入设备通过根据与所述输入字 符串相对应的历史记录信息, 对所述输入字符串的上下文信息进行确 定, 例如, 所述输入字符串前刚刚上屏的前一个输入字符串, 则可作 为所述输入字符串的前文信息。 在此, 所述上下文信息包括但不限于 与所述输入字符串相对应的上文信息或下文信息; 例如, 当所述输入 为 "shishi"时, 当前次输入所上屏的词组为 "客观"时,则所述 "shishi" 对应的上文信息为 "客观"; 若屏幕上存在一个词组 "计划", 且输入 "shishi" 时, 光标位于 "计划" 前, 则其所对应的下文信息为 "计 划" 等。
在步骤 S3 中, 输入设备根据所述输入字符串, 以及所述上下文 信息,确定与所述输入字符串对应的一个或多个输入候选项。具体地, 在步骤 S3中, 输入设备通过根据步骤 si中所获取的输入字符串, 以 及步骤 si 中所确定的上下文信息, 通过将与所述输入字符串相对应 的一个或多个上下文信息直接作为一个或多个输入候选项, 或者将所 述输入字符串相对应的上下文信息进行处理后作为输入候选项的方 式, 确定与所述输入字符串对应的一个或多个输入候选项。 例如, 继 上例, 当所述输入字符串为 "shishi" 时, 其所对应的上文信息可能 为 "客观", "我", "谈论" 等, 当所述上文信息为 "客观" 时, 通过 利用将所述输入字符串, 以及所述上下文信息进行匹配等的方式, 确 定输入候选项为 "事实"、 "实时"、 "实施"等; 当所述上文信息为 "我" 时, 确定输入候选项为 "试试"、 "实施"、 "试试" 等; 当所述上文信 息为 "谈论" 时, 确定输入候选项为 "时事"、 "事实"、 "世事" 等。
在步骤 s4 中, 输入设备将所述一个或多个输入候选项中至少一 个提供给所述输入字符串所对应的目标应用。 具体地, 在步骤 s4中, 输入设备通过直接提供, 或 4艮据各种通信协议(Communications Protocol), 通过各种数据传输接口,通过例如重新排序或筛选等方式, 将所述一个或多个输入候选项中至少一个提供给所述输入字符串所 对应的目标应用。 其中, 所述目标应用包括但不限于与所述步骤 si 中所对应的输入框相对应的相同应用, 或者与所述步骤 si 中所对应 的输入框相关联的其他应用等, 如直接利用所述输入候选项进行搜索 等。
优选地, 在步骤 s3中, 输入设备还可以根据所述输入字符串, 以 及所述上下文信息, 确定包含所述输入字符串的增补字符串, 其中, 所 述增补字符串还包括所述上下文信息所对应的字符串; 才 据所述增补字 符串, 在输入词库中进行匹配查询, 以获得与所述增补字符串对应的一 个或多个增补输入候选项; 才艮据所述上下文信息, 对所述一个或多个增 补输入候选项进行筛选处理, 以获得所述一个或多个输入候选项。 具体 地, 在步骤 s3中, 输入设备还可以根据所述输入字符串, 以及所述上 下文信息, 通过将所述输入字符串结合所述上下文信息与例如输入词库 进行匹配等方式, 确定包含所述输入字符串的增补字符串, 例如, 当输 入字符串为 "xuxu" 时, 当上下文信息为 "形态", 则确定所述增补字 符串为 "rusheng"; 或者, 当输入字符串为" tianan", 上下文信息为 "北 京", 则确定所述增补字符串为 "men" , 在此, 所述增补字符串包括但 不限于通过匹配等方式, 确定一个或多个通过拼接而成的多段字符串。 在步骤 s3 中, 输入设备通过将所述增补字符串在输入词库中进行匹配 查询, 以获得与所述增补字符串对应的一个或多个增补输入候选项; 继 前例, 所述增补字符串为 "rusheng"时所对应的增补输入候选项如 "如 生"、 "入声"、 "入胜" 等, 所述增补字符串为 "men" 时, 所对应的增 补输入候选项如 "天安门"、 "门" 等。 或者, 所述增补输入候选项还 可以直接包括所述上下文信息, 如直接生成 "形态栩栩如生"、 "北京天 安门" 等。 根据所述上下文信息, 对所述一个或多个增补输入候选项进 行筛选处理, 继前例, 才艮据上下文信息, 分别确定输入候选项为 "栩栩 如生"、 "天安门" 从而获得所述一个或多个输入候选项; 在此, 若所述 增补输入候选项中包含上下文信息, 则将所述增补输入候选项中的上下 文信息删除后, 获得所述一个或多个输入候选项, 如所述增补输入候选 项 "北京天安门" 中的 "北京" 删除, 获得所述一个或多个输入候选项 "天安门"。
优选地, 在步骤 s2中, 输入设备还可以通过对所述输入字符串所 对应的相关文本进行自然语言处理, 从所述相关文本提取对应的焦点词 语, 以作为所述上下文, 其中, 所述焦点词语邻近所述输入字符串所对 应的输入位置。 具体地, 在步骤 s2中, 输入设备还可以通过分词或语 义分析等方式, 对所述输入字符串所对应的相关文本进行自然语言处 理, 其中, 所述相关文本包括但不限于所述输入字符串本身所对应的文 本, 或者所述输入字符串所对应的输入位置前后已经上屏的相关文本; 通过对所述相关文本中经由自然语言处理, 提取对应的焦点词语以作为 所述上下文。 例如, 当所述输入字符串为 "shishi" 时, 其对应的相关文 本为 "上海地铁一期工程", 且所述输入字符串位于 "上海地铁一期工 程"之后,通过对所述相关文本进行自然语言处理,提取焦点词语为 "工 程",并将"工程"作为上下文。进一步地,因此,当输入字符串为 "shishi" 时, 该输入设备才艮据所述上下文 "工程", 确定输入候选项为 "实施"、 "实时"、 "试试" 等。
图 5示出根据本发明一个优选实施例的一种用于提供输入字符串 所对应的输入候选项的方法流程图。 具体地, 在步骤 sl,中, 输入设 备获取输入字符串; 在步骤 s2,中, 输入设备确定所述输入字符串的 上下文信息; 在步骤 s31,中, 输入设备根据所述输入字符串, 在输入 词库中进行匹配查询, 以获得与所述输入字符串对应的一个或多个初步 输入候选项; 在步骤 s32,中, 输入设备根据所述上下文信息, 对所述一 个或多个初步输入候选项进行处理, 以获得所述一个或多个输入候选 项; 在步骤 s4'中, 输入设备将所述一个或多个输入候选项中至少一 个提供给所述输入字符串所对应的目标应用。 其中, 所述步骤 sl '、 步骤 s2,、 步骤 s4,与图 4所示对应步骤相同或基本相同, 故此处不再 赘述, 并通过引用的方式包含于此。
上述各步骤之间是持续不断工作的, 在此, 本领域技术人员应理 解"持续"是指上述各步骤分别实时地或者按照设定的或实时调整的 工作模式要求, 进行输入字符串的获取、 上下文信息的确定、 初步输 入候选项的获取、 输入候选项的确定、 输入候选项的提供等, 直至输 入设备停止获取输入字符串。 在步骤 s31 '中, 输入设备根据所述输入字符串, 在输入词库中进 行匹配查询, 以获得与所述输入字符串对应的一个或多个初步输入候选 项。 具体地, 在步骤 s31,中, 输入设备通过获取所述输入字符串, 将所 述输入字符串与输入词库中的词进行匹配, 以获得与所述输入字符串对 应的一个或多个初步输入候选项。 例如, 当输入字符串为 "shishi" 时, 根据在输入词库中进行匹配查询后, 获取 "实时"、 "试试"、 "实施"、 "事 实"、 "适时"、 "逝世" 等多个初步输入候选项。
在步骤 s32,中, 输入设备根据所述上下文信息, 对所述一个或多 个初步输入候选项进行处理, 以获得所述一个或多个输入候选项。 具体 地, 在步骤 s32,中, 输入设备根据所述输入字符串的上下文信息, 通过 根据自然语言模型或词语搭配数据库等, 确定上下文信息与初步输入候 选项的搭配概率, 并根据所述搭配概率对所述初步输入候选项进行筛选 或排序, 以获得输入候选项。 例如, 继前例, 当上下文信息为 "客观 ", 则经处理后, 将初步输入候选项进行重新排序, 顺序变为 "事实"、 "实 时"、 "试试"、 "实施"、 "适时"、 "逝世" 等。
优选地, 在步骤 s32,中, 输入设备还可以根据所述上下文信息, 在词语搭配数据库中进行匹配查询, 以确定所述初步输入候选项与所述 上下文信息对应的搭配相关度信息; 根据所述搭配相关度信息, 对所述 一个或多个初步输入候选项进行处理, 以获得所述一个或多个输入候选 项。 具体地, 在步骤 s32,中, 输入设备还可以根据所述上下文信息, 在 词语搭配数据库中进行匹配查询, 通过根据所述词语搭配数据库中的一 个或多个词条与所述上下文的匹配关系等, 确定所述初步输入候选项与 所述上下文信息对应的搭配相关度信息; 例如若或为 bull变量, 则所述 搭配相关度信息表示如是否存在搭配; 或为连续变量, 如所述搭配相关 度信息表示搭配概率为多少; 在此, 所述搭配相关度信息可根据如词语 搭配数据库或其他相关数据库中的上下文与初步输入候选项的组合频 率等通过机器学习获得。 根据所述搭配相关度信息, 通过对所述一个或 多个初步输入候选项进行如筛选或排序处理, 获得所述一个或多个输入 候选项。 更优选地, 所述方法还包括步骤 s5, (未示出)和步骤 s6, (未示 出); 其中, 在步骤 s5'中, 输入设备对一个或多个文本信息进行分析处 理, 以获得搭配频度满足一定阈值的分词搭配关系; 在步骤 s6,中, 输 入设备根据所述分词搭配关系, 建立或更新所述词语搭配数据库。 具体 地, 在步骤 s5'中, 输入设备例如通过对各类日志、 各类文章等进行获 取, 并对所获取文本信息进行如先分词, 后统计相邻词间的共现频率等 分析方法, 当所述共现频率超过一定阈值时, 则判断所述相邻词间存在 一定的搭配关系, 从而获得搭配频度满足一定阈值的分词搭配关系; 在 步骤 s6,中, 输入设备根据所述分词搭配关系, 建立所述词语搭配数据 库, 或对现有词语搭配数据库进行更新等, 在此, 所述词语搭配数据库 中包括但不限于分词搭配关系以及分词搭配关系之间的搭配概率信息; 并且, 所述词语搭配数据库中可包含现有固定词语, 如成语、 俗语等, 同时经过所述更新, 可以将由于现有网络应用的快速发展所产生的新的 词语及表述进行包含, 从而有效提高用户的输入效率。
图 6示出根据本发明另一个优选实施例的一种用于提供输入字符 串所对应的输入候选项的方法流程图。 具体地, 在步骤 si ',中, 输入 设备获取输入字符串; 在步骤 s2"中, 输入设备确定所述输入字符串 的上下文信息; 在步骤 s33"中, 输入设备检测所述输入字符串是否超 出预定的长度阈值; 若所述输入字符串超出所述长度阈值, 在步骤 s34" 中, 输入设备根据所述输入字符串, 以及所述上下文信息, 迭代确定与 所述输入字符串对应的一个或多个输入候选项; 在步骤 s4"中, 输入设 备将所述一个或多个输入候选项中至少一个提供给所述输入字符串 所对应的目标应用。 其中, 所述步骤 sl "、 步骤 s2"、 步骤 s4"与图 4 所示对应步骤相同或基本相同, 故此处不再赘述, 并通过引用的方式 包含于此。
上述各步骤之间是持续不断工作的, 在此, 本领域技术人员应理 解"持续"是指上述各步骤分别实时地或者按照设定的或实时调整的 工作模式要求, 进行输入字符串的获取、 上下文信息的确定、 长度阈 值的检测、 输入候选项的确定、 输入候选项的提供等, 直至输入设备 停止获取输入字符串。
在步骤 s33"中, 输入设备检测所述输入字符串是否超出预定的长 度阈值。 具体地, 在步骤 s33"中, 输入设备通过基于预置的或用户自 行设置的长度阈值, 对所述输入字符串的长度进行检测, 检测所述输入 字符串的长度是否超出了预定的长度阈值。 例如, 当预定的字符长度阈 值为 N, 当所述输入字符串的长度为 N+1时, 则在步骤 s33"中, 输入 设备检测所述输入字符串超出了预定的长度阈值。
若所述输入字符串超出所述长度阈值, 在步骤 s34"中, 输入设备 根据所述输入字符串, 以及所述上下文信息, 迭代确定与所述输入字符 串对应的一个或多个输入候选项。 具体地, 若所述输入字符串超出所述 长度阈值, 在步骤 s34"中, 输入设备通过根据所述输入字符串, 以及 所述上下文信息, 通过例如根据所述长度阈值, 对所述输入字符串进 行分段等处理, 确定与第一个长度阈值的输入字符串所对应的所述输 入候选项, 并将所确定的输入候选项再次作为上下文信息, 从而迭代 确定下一个长度阈值的输入字符串所对应的输入候选项等的方式, 确 定与所述输入字符串对应的一个或多个输入候选项。
优选地, 在步骤 s33"中, 输入设备还可以获取所述输入字符串在 输入词库中对应的一个或多个抽样输入候选项; 检测所述一个或多个抽 样输入候选项中至少一个中的字数是超出预定的字数阈值, 以确定所述 输入字符串是否超出预定的长度阈值。 具体地, 在步骤 s33"中, 输入设 备还可以通过例如将所述输入字符串直接在所述输入词库中进行匹 配, 获取与所述全部输入字符串所对应的一个或多个输入候选项, 并 从中随机抽取或指定抽取(如选择第一个输入候选项等)方式, 获取 所述输入字符串在输入词库中对应的一个或多个抽样输入候选项; 通过 对所述一个或多个抽样输入候选项进行检测, 如所述抽样输入候选项中 的其中至少一个字数超出预定的字数阈值, 则确定所述输入字符串是否 超出预定的长度阈值。
优选地, 在步骤 s34"中, 输入设备还可以当所述输入字符串超出 所述长度阈值, 根据所述上下文信息, 以及所述输入字符串中与所述上 下文信息相邻的部分输入字符串, 确定与所述部分输入字符串对应的一 个或多个部分输入候选项; 根据所述部分输入字符串, 以及所述输入字 符串中其余输入字符串, 确定与所述其余输入字符串对应的一个或多个 其余输入候选项, 其中, 所述部分输入候选项被用作所述其余输入字符 串的上下文信息; 才 据所述一个或多个部分输入候选项, 以及所述一个 或多个其余输入候选项, 确定所述一个或多个输入候选项。
具体地, 当所述输入字符串超出所述长度阈值, 根据所述上下文 信息, 通过例如分词等处理, 对所述输入字符串进行分词或分段等, 从而获取所述输入字符串中与所述上下文信息相邻的部分输入字符 串, 通过将所述部分输入字符串结合所述上下文信息, 确定与所述部 分输入字符串对应的一个或多个部分输入候选项; 在此, 所述确定方 法与图 4 中所述步骤 s 3 中的确定方法相同或相似, 故此处不再赘述, 并通过引用的方式包含于此。 在步骤 s 34"中, 输入设备将所述部分输 入候选项作为其余输入字符串的上下文信息, 通过迭代的方式, 确 定与所述其余输入字符串相对应的一个或多个其余输入候选项; 迭代 后通过例如对字符串之间的关系, 对所述部分输入候选项与其余输入 候选项进行拼接等方式, 确定一个或多个输入候选项。
对于本领域技术人员而言, 显然本发明不限于上述示范性实施例 的细节, 而且在不背离本发明的精神或基本特征的情况下, 能够以其 他的具体形式实现本发明。 因此, 无论从哪一点来看, 均应将实施例 看作是示范性的, 而且是非限制性的, 本发明的范围由所附权利要求 而不是上述说明限定, 因此旨在将落在权利要求的等同要件的含义和 范围内的所有变化涵括在本发明内。 不应将权利要求中的任何附图标 记视为限制所涉及的权利要求。 此外, 显然"包括"一词不排除其他单元 或步骤, 单数不排除复数。 装置权利要求中陈述的多个单元或装置也 可以由一个单元或装置通过软件或者硬件来实现。 第一, 第二等词语 用来表示名称, 而并不表示任何特定的顺序。

Claims

权 利 要 求 书
1. 一种用于提供输入字符串所对应的输入候选项的方法, 其中, 该 方法包括以下步骤:
a获取输入字符串;
b确定所述输入字符串的上下文信息;
c才艮据所述输入字符串, 以及所述上下文信息, 确定与所述输入字 符串对应的一个或多个输入候选项;
d 将所述一个或多个输入候选项中至少一个提供给所述输入字符 串所对应的目标应用。
2. 根据权利要求 1所述的方法, 其中, 所述步骤 c包括:
-根据所述输入字符串, 在输入词库中进行匹配查询, 以获得与所 述输入字符串对应的一个或多个初步输入候选项;
cl 根据所述上下文信息,对所述一个或多个初步输入候选项进行处 理, 以获得所述一个或多个输入候选项。
3. 根据权利要求 2所述的方法, 其中, 所述步骤 cl包括:
-根据所述上下文信息, 在词语搭配数据库中进行匹配查询, 以确 定所述初步输入候选项与所述上下文信息对应的搭配相关度信息;
-根据所述搭配相关度信息, 对所述一个或多个初步输入候选项进 行处理, 以获得所述一个或多个输入候选项。
4. 根据权利要求 3所述的方法, 其中, 该方法还包括:
-对一个或多个文本信息进行分析处理, 以获得搭配频度满足一定 阈值的分词搭配关系;
-根据所述分词搭配关系, 建立或更新所述词语搭配数据库。
5. 根据权利要求 1所述的方法, 其中, 所述步骤 c包括:
-根据所述输入字符串, 以及所述上下文信息, 确定包含所述输入 字符串的增补字符串, 其中, 所述增补字符串还包括所述上下文信息所 对应的字符串;
-根据所述增补字符串, 在输入词库中进行匹配查询, 以获得与所 述增补字符串对应的一个或多个增补输入候选项;
-才艮据所述上下文信息, 对所述一个或多个增补输入候选项进行筛 选处理, 以获得所述一个或多个输入候选项。
6. 根据权利要求 1至 5中任一项所述的方法, 其中, 所述步骤 b包 括:
- 通过对所述输入字符串所对应的相关文本进行自然语言处理, 从 所述相关文本提取对应的焦点词语, 以作为所述上下文, 其中, 所述焦 点词语邻近所述输入字符串所对应的输入位置。
7. 根据权利要求 1至 6中任一项所述的方法, 其中, 所述步骤 c包 括:
c2检测所述输入字符串是否超出预定的长度阈值;
c3 若所述输入字符串超出所述长度阈值,根据所述输入字符串, 以 及所述上下文信息, 迭代确定与所述输入字符串对应的一个或多个输入 候选项。
8. 根据权利要求 7所述的方法, 其中, 所述步骤 c2包括:
- 获取所述输入字符串在输入词库中对应的一个或多个抽样输入候 选项;
-检测所述一个或多个抽样输入候选项中至少一个中的字数是超出 预定的字数阈值, 以确定所述输入字符串是否超出预定的长度阈值。
9. 根据权利要求 7或 8所述的方法, 其中, 所述步骤 c3包括:
- 当所述输入字符串超出所述长度阈值, 根据所述上下文信息, 以 及所述输入字符串中与所述上下文信息相邻的部分输入字符串, 确定与 所述部分输入字符串对应的一个或多个部分输入候选项;
-根据所述部分输入字符串, 以及所述输入字符串中其余输入字符 串, 确定与所述其余输入字符串对应的一个或多个其余输入候选项, 其 中, 所述部分输入候选项被用作所述其余输入字符串的上下文信息;
-才艮据所述一个或多个部分输入候选项, 以及所述一个或多个其余 输入候选项, 确定所述一个或多个输入候选项。
10. 一种用于提供输入字符串所对应的输入候选项的输入设备, 其 中, 该设备包括:
获取装置, 用于获取输入字符串;
上下文确定装置, 用于确定所述输入字符串的上下文信息; 候选项确定装置,用于才艮据所述输入字符串, 以及所述上下文信息, 确定与所述输入字符串对应的一个或多个输入候选项;
提供装置, 用于将所述一个或多个输入候选项中至少一个提供给所 述输入字符串所对应的目标应用。
11. 根据权利要求 10所述的输入设备, 其中, 所述候选项确定装置 包括:
匹配单元,用于根据所述输入字符串,在输入词库中进行匹配查询, 以获得与所述输入字符串对应的一个或多个初步输入候选项;
处理单元, 用于根据所述上下文信息, 对所述一个或多个初步输入 候选项进行处理, 以获得所述一个或多个输入候选项。
12. 根据权利要求 11所述的输入设备, 其中, 所述处理单元用于:
-根据所述上下文信息, 在词语搭配数据库中进行匹配查询, 以确 定所述初步输入候选项与所述上下文信息对应的搭配相关度信息;
-根据所述搭配相关度信息, 对所述一个或多个初步输入候选项进 行处理, 以获得所述一个或多个输入候选项。
13. 根据权利要求 12所述的输入设备, 其中, 该设备还包括: 文本处理装置, 用于对一个或多个文本信息进行分析处理, 以获得 搭配频度满足一定阈值的分词搭配关系;
建立装置, 用于根据所述分词搭配关系, 建立或更新所述词语搭配 数据库。
14. 根据权利要求 10所述的输入设备, 其中, 所述候选项确定装置 用于:
-根据所述输入字符串, 以及所述上下文信息, 确定包含所述输入 字符串的增补字符串, 其中, 所述增补字符串还包括所述上下文信息所 对应的字符串;
-根据所述增补字符串, 在输入词库中进行匹配查询, 以获得与所 述增补字符串对应的一个或多个增补输入候选项;
-才艮据所述上下文信息, 对所述一个或多个增补输入候选项进行筛 选处理, 以获得所述一个或多个输入候选项。
15. 根据权利要求 10至 14中任一项所述的输入设备, 其中, 所述 上下文确定装置用于:
- 通过对所述输入字符串所对应的相关文本进行自然语言处理, 从 所述相关文本提取对应的焦点词语, 以作为所述上下文, 其中, 所述焦 点词语邻近所述输入字符串所对应的输入位置。
16. 根据权利要求 10至 15中任一项所述的输入设备, 其中, 所述 候选项确定装置包括:
检测单元, 用于检测所述输入字符串是否超出预定的长度阈值; 迭代单元, 用于若所述输入字符串超出所述长度阈值, 根据所述输 入字符串, 以及所述上下文信息, 迭代确定与所述输入字符串对应的一 个或多个输入候选项。
17. 根据权利要求 16所述的输入设备, 其中, 所述检测单元用于:
- 获取所述输入字符串在输入词库中对应的一个或多个抽样输入候 选项;
-检测所述一个或多个抽样输入候选项中至少一个中的字数是超出 预定的字数阈值, 以确定所述输入字符串是否超出预定的长度阈值。
18. 根据权利要求 16或 17所述的输入设备, 其中, 所述迭代单元 用于:
- 当所述输入字符串超出所述长度阈值, 根据所述上下文信息, 以 及所述输入字符串中与所述上下文信息相邻的部分输入字符串, 确定与 所述部分输入字符串对应的一个或多个部分输入候选项;
-根据所述部分输入字符串, 以及所述输入字符串中其余输入字符 串, 确定与所述其余输入字符串对应的一个或多个其余输入候选项, 其 中, 所述部分输入候选项被用作所述其余输入字符串的上下文信息;
-才艮据所述一个或多个部分输入候选项, 以及所述一个或多个其余 输入候选项, 确定所述一个或多个输入候选项。
PCT/CN2013/086968 2012-12-31 2013-11-12 一种用于提供输入字符串所对应的输入候选项的方法与设备 WO2014101577A1 (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US14/412,287 US20150293972A1 (en) 2012-12-31 2013-11-12 Method and device used for providing input candidate items corresponding to an input character string
JP2015549962A JP6114403B2 (ja) 2012-12-31 2013-11-12 入力文字列に対応する入力候補アイテムを提供する方法及び装置
EP13867100.3A EP2940557B1 (en) 2012-12-31 2013-11-12 Method and device used for providing input candidate item corresponding to input character string

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210592774.9 2012-12-31
CN201210592774.9A CN103076892B (zh) 2012-12-31 2012-12-31 一种用于提供输入字符串所对应的输入候选项的方法与设备

Publications (1)

Publication Number Publication Date
WO2014101577A1 true WO2014101577A1 (zh) 2014-07-03

Family

ID=48153448

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/086968 WO2014101577A1 (zh) 2012-12-31 2013-11-12 一种用于提供输入字符串所对应的输入候选项的方法与设备

Country Status (5)

Country Link
US (1) US20150293972A1 (zh)
EP (1) EP2940557B1 (zh)
JP (1) JP6114403B2 (zh)
CN (1) CN103076892B (zh)
WO (1) WO2014101577A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104808808A (zh) * 2015-03-23 2015-07-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN111832310A (zh) * 2019-04-23 2020-10-27 北京嘀嘀无限科技发展有限公司 一种文本处理方法及装置

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103076892B (zh) * 2012-12-31 2016-09-28 百度在线网络技术(北京)有限公司 一种用于提供输入字符串所对应的输入候选项的方法与设备
CN103353824B (zh) * 2013-06-17 2016-08-17 百度在线网络技术(北京)有限公司 语音输入字符串的方法、装置和终端设备
CN103440299B (zh) * 2013-08-20 2016-12-28 陈喜 一种基于焦点上下文联想词的信息快速输入方法
TW201514726A (zh) * 2013-10-14 2015-04-16 Chi-Lin Hong 一種串聯式文字輸入裝置和方法
CN104111738A (zh) * 2014-06-06 2014-10-22 珠海市魅族科技有限公司 一种字符关联方法及终端
CN105302332A (zh) * 2014-07-25 2016-02-03 中国移动通信集团公司 一种拼音输入法及其实现装置
TWI518616B (zh) * 2014-09-24 2016-01-21 國立清華大學 穿搭評選方法與電子裝置
CN104766077B (zh) * 2015-04-03 2017-04-12 北京奇虎科技有限公司 一种识别图片中的字符的方法和装置
CN104809192B (zh) * 2015-04-22 2019-06-18 北京奇虎科技有限公司 提取输入法候选项的方法以及装置
CN107070779B (zh) * 2015-05-29 2021-09-03 北京搜狗科技发展有限公司 一种信息处理方法和装置
CN105404401A (zh) * 2015-11-23 2016-03-16 小米科技有限责任公司 输入处理方法、装置及设备
CN105653061B (zh) * 2015-12-29 2020-03-31 北京京东尚科信息技术有限公司 针对拼音输入法的词条检索及错词检测的方法和系统
CN105653064A (zh) * 2016-01-07 2016-06-08 珠海市魅族科技有限公司 一种输入方法及装置
CN105511642A (zh) * 2016-01-07 2016-04-20 珠海市魅族科技有限公司 一种输入方法及装置
WO2018014341A1 (zh) * 2016-07-22 2018-01-25 华为技术有限公司 展示候选项的方法和终端设备
CN107765883A (zh) * 2016-08-22 2018-03-06 富士通株式会社 输入法的候选词语的排序方法和排序设备
CN106484135B (zh) * 2016-09-23 2019-03-19 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
CN106527752B (zh) * 2016-09-23 2019-03-19 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
US11151130B2 (en) * 2017-02-04 2021-10-19 Tata Consultancy Services Limited Systems and methods for assessing quality of input text using recurrent neural networks
CN108509058B (zh) * 2017-02-28 2022-08-16 微软技术许可有限责任公司 输入方法与相关设备
CN108536653B (zh) * 2017-03-03 2022-09-30 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
US10493798B2 (en) 2017-03-24 2019-12-03 Cnh Industrial America Llc Air strut suspension system for a self-propelled high ground clearance product applicator
CN109917927B (zh) * 2017-12-13 2022-07-08 北京搜狗科技发展有限公司 一种候选项确定方法和装置
US11132622B2 (en) * 2017-12-27 2021-09-28 International Business Machines Corporation Autonomous system for hypotheses generation
CN109976548B (zh) * 2017-12-28 2022-07-19 北京搜狗科技发展有限公司 一种输入方法及输入装置
CN109164921B (zh) * 2018-07-09 2023-04-07 北京左医科技有限公司 聊天框动态显示输入建议的控制方法及装置
CN110858099B (zh) * 2018-08-20 2024-04-12 北京搜狗科技发展有限公司 候选词生成方法及装置
CN109634436B (zh) * 2018-10-25 2023-11-10 平安科技(深圳)有限公司 输入法的联想方法、装置、设备及可读存储介质
CN112000877A (zh) * 2020-07-15 2020-11-27 北京搜狗科技发展有限公司 一种数据处理方法、装置和介质
CN117037184A (zh) * 2023-10-10 2023-11-10 深圳牛图科技有限公司 一种基于云匹配的ocr模糊识别系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246410A (zh) * 2007-02-12 2008-08-20 谷歌股份有限公司 上下文或语境输入法和系统
CN102346743A (zh) * 2010-08-02 2012-02-08 腾讯科技(深圳)有限公司 生成候选词的方法及装置
CN103076892A (zh) * 2012-12-31 2013-05-01 百度在线网络技术(北京)有限公司 一种用于提供输入字符串所对应的输入候选项的方法与设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7149550B2 (en) * 2001-11-27 2006-12-12 Nokia Corporation Communication terminal having a text editor application with a word completion feature
US9606634B2 (en) * 2005-05-18 2017-03-28 Nokia Technologies Oy Device incorporating improved text input mechanism
JP4547366B2 (ja) * 2006-11-09 2010-09-22 株式会社ソニー・コンピュータエンタテインメント 文字入力装置、その制御方法、プログラム及び情報記憶媒体
US7809719B2 (en) * 2007-02-08 2010-10-05 Microsoft Corporation Predicting textual candidates
CN100458795C (zh) * 2007-02-13 2009-02-04 北京搜狗科技发展有限公司 一种智能组词输入的方法和一种输入法系统及其更新方法
CN101266520B (zh) * 2008-04-18 2013-03-27 上海触乐信息科技有限公司 一种可实现灵活键盘布局的系统
ATE501478T1 (de) * 2008-06-11 2011-03-15 Exb Asset Man Gmbh Vorrichtung und verfahren mit verbessertem texteingabemechanismus
CN102253929A (zh) * 2011-06-03 2011-11-23 北京搜狗科技发展有限公司 一种提示用户输入字符的方法和装置
US9026429B2 (en) * 2012-12-05 2015-05-05 Facebook, Inc. Systems and methods for character string auto-suggestion based on degree of difficulty

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246410A (zh) * 2007-02-12 2008-08-20 谷歌股份有限公司 上下文或语境输入法和系统
CN102346743A (zh) * 2010-08-02 2012-02-08 腾讯科技(深圳)有限公司 生成候选词的方法及装置
CN103076892A (zh) * 2012-12-31 2013-05-01 百度在线网络技术(北京)有限公司 一种用于提供输入字符串所对应的输入候选项的方法与设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2940557A4 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104808808A (zh) * 2015-03-23 2015-07-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN111832310A (zh) * 2019-04-23 2020-10-27 北京嘀嘀无限科技发展有限公司 一种文本处理方法及装置
CN111832310B (zh) * 2019-04-23 2024-04-16 北京嘀嘀无限科技发展有限公司 一种文本处理方法及装置

Also Published As

Publication number Publication date
JP2016508264A (ja) 2016-03-17
EP2940557A1 (en) 2015-11-04
JP6114403B2 (ja) 2017-04-12
CN103076892A (zh) 2013-05-01
EP2940557A4 (en) 2016-11-02
EP2940557B1 (en) 2022-11-02
US20150293972A1 (en) 2015-10-15
CN103076892B (zh) 2016-09-28

Similar Documents

Publication Publication Date Title
WO2014101577A1 (zh) 一种用于提供输入字符串所对应的输入候选项的方法与设备
WO2018205389A1 (zh) 语音识别方法、系统、电子装置及介质
CN104572958B (zh) 一种基于事件抽取的敏感信息监控方法
US10558754B2 (en) Method and system for automating training of named entity recognition in natural language processing
US20210209416A1 (en) Method and apparatus for generating event theme
US10713302B2 (en) Search processing method and device
WO2016197577A1 (zh) 评论信息的标注方法、装置和计算机设备
CN101593200A (zh) 基于关键词频度分析的中文网页分类方法
CN110020422A (zh) 特征词的确定方法、装置和服务器
CN104133877B (zh) 软件标签的生成方法和装置
CN102937864B (zh) 一种用于在触摸终端上确定所选文本的方法与设备
WO2007143914A1 (fr) Procédé, dispositif et système de saisie pour la création d'une base de données de fréquence de mots basée sur des informations issues du web
CN102722483A (zh) 用于确定输入法的候选项排序的方法、装置和设备
US10949418B2 (en) Method and system for retrieval of data
CN112269862B (zh) 文本角色标注方法、装置、电子设备和存储介质
CN112989208B (zh) 一种信息推荐方法、装置、电子设备及存储介质
WO2020026366A1 (ja) 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム
CN114021577A (zh) 内容标签的生成方法、装置、电子设备及存储介质
CN103076894A (zh) 一种用于根据对象标识信息构建输入词条的方法与设备
CN110909528A (zh) 剧本解析方法、剧本展示方法、装置和电子设备
CN104076945B (zh) 用于在终端中显示输入键盘的装置和方法
US9336317B2 (en) System and method for searching aliases associated with an entity
CN111460257A (zh) 专题生成方法、装置、电子设备和存储介质
CN112307200A (zh) 情感属性获取方法、装置、设备、及存储介质
CN102982150A (zh) 一种基于客户端快速输入的搜索方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13867100

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015549962

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14412287

Country of ref document: US

Ref document number: 2013867100

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE