CN110716653A - 一种联想源确定方法和装置 - Google Patents

一种联想源确定方法和装置 Download PDF

Info

Publication number
CN110716653A
CN110716653A CN201810759120.8A CN201810759120A CN110716653A CN 110716653 A CN110716653 A CN 110716653A CN 201810759120 A CN201810759120 A CN 201810759120A CN 110716653 A CN110716653 A CN 110716653A
Authority
CN
China
Prior art keywords
screen
association source
result vector
phrase
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810759120.8A
Other languages
English (en)
Other versions
CN110716653B (zh
Inventor
费腾
崔欣
张扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201810759120.8A priority Critical patent/CN110716653B/zh
Publication of CN110716653A publication Critical patent/CN110716653A/zh
Application granted granted Critical
Publication of CN110716653B publication Critical patent/CN110716653B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例公开了一种联想源确定方法和装置,确定用户上屏的上屏词组,将该上屏词组输入到深度学习模型中,可以得到第一结果向量,该第一结果向量可以标识在上屏词组后出现不同词的概率。根据该上屏词组可以确定出至少一个待定联想源,若根据深度学习模型能够得到一个待定联想源对应的第二结果向量,该第二结果向量可以标识在所述待定联想源后出现不同词的概率。由于由多个最近上屏的上屏词所构成的上屏词组能够在语义上较为准确的体现出用户当前的实际输入需求,故此根据第一结果向量和第二结果向量可以确定出待定联想源是否为能够联想出用户当前实际所需上屏候选项的目标联想源。

Description

一种联想源确定方法和装置
技术领域
本申请涉及输入法领域,特别是涉及一种联想源确定方法和装置。
背景技术
输入法属于一种常用的文字输入工具,例如可以根据用户输入的字符串展示对应的候选项,并将用户选择的候选项进行上屏。而候选项的联想是一种协助用户输入的机制,输入法可以将用户刚刚上屏的文字作为联想源,联想出用户可能基于该文字继续上屏的文字,并以候选项的形式展示给用户,若联想出的候选项中包括了用户希望继续上屏的文字,用户可以直接选择上屏,免去了用户输入对应字符串的输入操作,提高了输入效率。
传统方式中,将上一次上屏的词作为联想源,例如上一次上屏的词为“太平”,那么可以将“太平”作为联想源联想得到候选项“公主”、“盛世”等,当用户需要输入的是“太平公主”或“太平盛世”的情况下,可以直接选择候选项“公主”或“盛世”上屏即可,不必在输入“公主”或“盛世”对应的字符串。
然而,由于传统方式中确定联想源的方式单一,确定出的联想源可能与用户后续输入需求并不相关,导致联想出的候选项不是用户所需,降低了用户的输入体验。
发明内容
为了解决上述技术问题,本申请提供了一种联想源确定方法和装置,根据上屏词组对应的第一结果向量和待定联想源对应的第二结果向量可以确定出该待定联想源是否为能够联想出用户当前实际所需上屏候选项的目标联想源。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种联想源确定方法,所述方法包括:
确定上屏词组,所述上屏词组包括用户依次上屏的多个上屏词;
根据所述上屏词组和深度学习模型得到第一结果向量,所述第一结果向量用于标识第一词集合中各个词出现在所述上屏词组后的概率;
根据所述上屏词组确定待定联想源,并根据所述待定联想源和所述深度学习模型得到第二结果向量,所述第二结果向量用于标识第二词集合中各个词出现在所述待定联想源后的概率;
根据所述第一结果向量和所述第二结果向量确定所述待定联想源是否作为用于联想候选项的目标联想源。
可选的,所述根据所述第一结果向量和所述第二结果向量确定所述待定联想源是否作为用于联想候选项的目标联想源,包括:
若所述第一结果向量和所述第二结果向量间的向量距离满足预设条件,将所述待定联想源作为用于联想候选项的目标联想源。
可选的,作为所述目标联想源的待定联想源包括至少两个上屏词。
可选的,所述待定联想源包括所述上屏词组中所述用户最近一次上屏的上屏词。
可选的,在将所述待定联想源作为所述目标联想源后,所述方法还包括:
根据所述目标联想源联想并展示候选项。
可选的,所述上屏词组包括的上屏词数量小于预定阈值,或者,所述上屏词组包括的上屏词是根据间隔符确定的。
可选的,所述上屏词组是根据上屏编辑区域中输入焦点的位置确定的。
可选的,所述上屏词组中至少包括所述输入焦点所在位置的前一个上屏词。
第二方面,本申请实施例提供了一种联想源确定装置,所述装置包括第一确定单元、学习单元、第二确定单元和第三确定单元:
所述第一确定单元,用于确定上屏词组,所述上屏词组包括用户依次上屏的多个上屏词;
所述学习单元,用于根据所述上屏词组和深度学习模型得到第一结果向量,所述第一结果向量用于标识第一词集合中各个词出现在所述上屏词组后的概率;
所述第二确定单元,用于根据所述上屏词组确定待定联想源,并根据所述待定联想源和所述深度学习模型得到第二结果向量,所述第二结果向量用于标识第二词集合中各个词出现在所述待定联想源后的概率;
所述第三确定单元,用于根据所述第一结果向量和所述第二结果向量确定所述待定联想源是否作为用于联想候选项的目标联想源。
可选的,所述第三确定单元,还用于若所述第一结果向量和所述第二结果向量间的向量距离满足预设条件,将所述待定联想源作为用于联想候选项的目标联想源。
可选的,作为所述目标联想源的待定联想源包括至少两个上屏词。
可选的,所述待定联想源包括所述上屏词组中所述用户最近一次上屏的上屏词。
可选的,所述装置还包括展示单元:
所述展示单元,用于根据所述目标联想源联想并展示候选项。
可选的,所述上屏词组包括的上屏词数量小于预定阈值,或者,所述上屏词组包括的上屏词是根据间隔符确定的。
可选的,所述上屏词组是根据上屏编辑区域中输入焦点的位置确定的。
可选的,所述上屏词组中至少包括所述输入焦点所在位置的前一个上屏词。
第三方面,本申请实施例提供了一种联想源确定设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如第一方面中任意一项所述联想源确定方法。
第四方面,本申请实施例提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面中任意一项所述联想源确定方法。
由上述技术方案可以看出,确定用户上屏的上屏词组,该上屏词组中可以包括用户依次上屏的多个上屏词,将该上屏词组输入到深度学习模型中,可以得到第一结果向量,该第一结果向量可以标识在上屏词组后出现不同词的概率,第一结果向量所标识的一个词的概率越高,在语义上,这个词继续出现在该上屏词组后的可能性就越大。根据该上屏词组可以确定出至少一个待定联想源,若根据深度学习模型能够得到一个待定联想源对应的第二结果向量,该第二结果向量可以标识在所述待定联想源后出现不同词的概率,第二结果向量所标识的一个词的概率越高,在语义上,这个词继续出现在该待定联想源后的可能性就越大。由于由多个最近上屏的上屏词所构成的上屏词组能够在语义上较为准确的体现出用户当前的实际输入需求,故此根据第一结果向量和第二结果向量可以确定出待定联想源是否为能够联想出用户当前实际所需上屏候选项的目标联想源。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种联想源确定系统示意图;
图2为本申请实施例提供的一种联想源确定方法的方法流程图;
图3为本申请实施例提供的一种联想源确定装置的装置结构图;
图4为本申请实施例提供的一种用于联想源确定方法的装置结构图;
图5为本申请实施例提供的一种服务器的结构图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
由于传统方式中一般将用户上一次的上屏词作为联想源,而并为考虑该上屏词在语义上是否能够体现用户当前的实际输入需求。故根据该联想源联想出的候选项往往不能起到协助用户输入的作用,降低了用户的输入体验。
为此,本申请实施例提供了一种候联想源确定方法,该方法可以应用于设置了输入法的终端中,该终端例如可以是安装有输入法的手机、笔记本电脑、台式电脑、平板电脑、电子书阅读器、动态影像专家压缩标准音频层面4(Moving Picture Experts Group AudioLayer IV,MP4)播放器、可穿戴设备(比如智能手表)、智能音箱和膝上型便携计算机等。
用户可以使用该终端所设置的输入法输入字符串,并通过选择对应字符串展示的候选项实现上屏。用户可以使用不同方式通过输入法输入字符串,例如通过虚拟键盘输入、通过手写区域输入或者通过语音输入等。所输入的字符串可以是不同语种下的字符,可以包括文字、字母、数字、符号等。例如在中文这一语种下,字符串可以包括拼音、手写输入的汉字等。需要注意的是,在本申请实施例中输入法除了可以包括常见的中文输入法(比如拼音输入法、五笔输入法、注音输入法等)以外,也可以包括其他语种的输入法(比如日文平假名输入法、韩文输入法等)。
在用户选择字符串对应的候选项上屏后,本申请实施例中可以通过深度学习模型以及用户依次上屏的多个上屏词来确定合适的联想源。在本申请实施例中,一个词可以为一个基本的语言组成单位,以中文为例,一个词可以包括一个汉字也可以包括多个汉字,一个词也可以是一个间隔符,例如标点符号。一个词能够提供完整的语义信息,具体可以通过对词组进行语义切分得到。而上屏词可以是用户选择上屏的词,上屏词组为用户选择上屏的多个上屏词构成的词组。当用户输入的上屏词组为“仙界不太平”时,通过切分可以得到三个上屏词,分别为“仙界”、“不”和“太平”。
例如图1所示的终端中,展示的可以是社交软件的会话窗口或短信、邮件的编辑窗口。
其中,101为上屏编辑区域,用于显示用户上屏的、且尚未发送的文字内容,用户可以对该区域中的文字进行编辑。
102为候选项展示区域,可以展示用户输入字符串对应的候选项,也可以展示通过联想源联想的候选项。
需要注意的是,图1展示的仅为本申请实施例的一个可能的输入场景,并不起到限定本申请实施例仅能在图1所示场景中应用的作用,例如,用户撰写文档的输入场景下,文档内展示用户上屏文字的区域也可以为上屏编辑区域。
通过上屏词组和深度学习模型103(例如可以是1stm模型)可以确定出该上屏词组对应的第一结果向量,该第一结果向量可以标识第一词集合中各个词出现在上屏词组后的概率,其中,第一词集合中所包括的词为从语义或输入习惯上,在上屏了上屏词组后可能接着继续上屏的词。第一结果向量所标识的一个词的概率越高,在语义上,这个词继续出现在该上屏词组后的可能性就越大。例如上屏词组为“仙界不太平”时,第一结果向量中所标识词中概率较高的可以为“了”、“啊”、“!”等。
而通过上屏词组还可以确定出多个待定联想源,待定联想源可以由一个或多个上屏词构成,例如上屏词组为“仙界不太平”时,所确定出的多个待定联想源可以包括“仙界”、“仙界不”、“太平”、“不太平”、“仙界不太平”等。一个待定联想源通过待定联想源和深度学习模型103可以确定出该待定联想源对应的第二结果向量,该第二结果向量可以标识第二词集合中各个词出现在所述待定联想源后的概率,其中,第二词集合中所包括的词为从语义或输入习惯上,在上屏了待定联想源后可能接着继续上屏的词。第二结果向量所标识的一个词的概率越高,在语义上,这个词继续出现在该待定联想源后的可能性就越大。例如待定联想源为“太平”时,第二结果向量中所标识词中概率较高的可以为“公主”、“天国”等。例如待定联想源为“不太平”时,第二结果向量中所标识词中概率较高的可以为“了”、“啊”、“!”等。
如果依据传统方式确定“仙界不太平”的联想源,将会直接把用户最近一次上屏的“太平”作为联想源,以此联想出的候选项可以为“公主”、“盛世”等。然而从语义角度考虑,“仙界不太平公主”或“仙界不太平盛世”从语义上并不通顺,用户在上屏了“仙界不太平”后继续上屏“公主”、“盛世”的可能性很低。故依据传统方式确定出的联想源联想得到的候选项“公主”、“盛世”并不能符合用户的输入需求。
而由多个最近上屏的上屏词所构成的上屏词组能够在语义上较为准确的体现出用户当前的实际输入需求,故此根据第一结果向量和第二结果向量可以确定出待定联想源是否为能够联想出用户当前实际所需上屏候选项的目标联想源。例如图1所示的场景中,确定出能够作为目标联想源的待定联想源可以是“不太平”,而不会是“太平”,从而可以以此在候选项展示区域102处展示出联想得到的候选项“了”、“啊”、“!”、“。”以辅助用户输入。而这些候选项更能够符合用户的输入需求,起到提高用户输入效率的作用。
接下来结合附图说明本申请实施例提供的联想源确定方法,如图2所示,所述方法包括:
S201:确定上屏词组。
本申请实施例提供了多种确定上屏词组的方式。一般来说,上屏词组所包括的上屏词数量不应太多,过多的上屏词构成的上屏词组所体现出的输入需求可以与用户的实际输入需求有些出入,而且过多上屏词构成的上屏词组通过深度学习模型时会增加计算量,提高系统负担。
故为此,可以通过预设的预定阈值限制上屏词组中上屏词的数量,也可以通过上屏内容中的间隔符确定上屏词组,由于间隔符起到分隔句子的作用,故通过间隔符确定出的上屏词组最多包括一个句子,也能起到限定上屏词组中上屏词数量的作用。
需要注意的是,上屏词组所包括的是用户依次上屏的多个上屏词,而将哪些用户依次上屏的上屏词作为上屏词组可以根据输入焦点确定。
首先介绍本申请实施例中提到的输入焦点。输入焦点处于上屏编辑区域中,用于标识下一次上屏时文字出现的位置,一般可以通过闪烁显示的方式提示用户,也可以处于不可见的状态。在图1所示的输入场景中,104可以为输入焦点,用于标识当用户继续上屏文字将出现在“平”的后面。用户可以根据输入需求调整输入焦点在上屏文字中的位置,例如用户在上屏了“仙界不太平”后,想在“仙界”后上屏文字“这段时间”的话,可以将输入焦点移至“港”和“不”之间。
在上屏文字是从左往右排列展示的情况下,用户依次上屏的上屏词处于输入焦点的前面,即在输入焦点所处位置之前用户依次上屏的上屏词。当输入焦点如图1的104所示位置时,用户依次上屏的上屏词按照先后顺序分别为“仙界”、“不”和“太平”,由此确定的上屏词组可以为“仙界不太平”。当输入焦点被移动至“不”和“太”之间时,用户依次上屏的上屏词按照先后顺序分别为“仙界”和“不”,由此确定的上屏词组可以为“仙界不”。
需要注意的是,由于该上屏词组的作用是为从多个待定联想源中确定出上屏词组对应目标联想源的依据,而包括了输入焦点所在位置的前一个上屏词的上屏词组在语义上可以较为准确的体现出用户当前的实际输入需求,故在一种可能的实现方式中,在通过输入焦点确定上屏词组时,确定出的上屏词组中至少包括输入焦点所在位置的前一个上屏词。例如,当输入焦点如图1的104所示位置时,输入焦点所在位置的前一个上屏词为“太平”,确定出的上屏词组中至少需要包括“太平”。
S202:根据所述上屏词组和深度学习模型得到第一结果向量。
其中,第一结果向量用于标识第一词集合中各个词出现在所述上屏词组后的概率。
S203:根据所述上屏词组确定待定联想源,并根据所述待定联想源和所述深度学习模型得到第二结果向量。
其中,第二结果向量用于标识第二词集合中各个词出现在所述待定联想源后的概率。
根据上屏词组确定出的待定联想源可以是上屏词组中所包括多个上屏词的任意组合,在上屏词组所包括上屏词的数量较多时,确定出的待定联想源的数量也可以由多个。例如上屏词组为“仙界不太平”时,确定出的待定联想源可以包括“仙界”、“仙界不”、“太平”、“不太平”、“仙界不太平”等。
在一些输入场景下,基于文字表达连续性的特点,用户希望在上屏词组后继续上屏的词可能与上屏词组中用户最近一次上屏的上屏词关系较大,故在根据上屏词组确定待定联想源时,可以将上屏词组中用户最近一次上屏的上屏词作为构成待定联想源的必要组成部分,以减少待定联想源的数量,减轻后续的计算量。例如上屏词组为“仙界不太平”时,确定出的待定联想源可以包括“太平”、“不太平”、“仙界不太平”。
在一些输入场景下,用户希望在上屏词组后继续上屏的词可能与用户最近一次上屏的上屏词关系并不大,故在根据上屏词组确定待定联想源时,需要更为全面的确定出待定联想源。例如上屏词组为“你是男生还是”时,确定出的待定联想源可以包括“你”、“你是”、“你是男生”、“你是男生还是”等。
S204:根据所述第一结果向量和所述第二结果向量确定所述待定联想源是否作为用于联想候选项的联想源。
由于由多个最近上屏的上屏词所构成的上屏词组能够在语义上较为准确的体现出用户当前的实际输入需求,且第一结果向量和第二结果向量可以分别标识上屏词组后出现不同词的概率和待定联想源后出现不同词组的概率。故根据第一结果向量和第二结果向量可以确定出待定联想源是否为能够联想出用户当前实际所需上屏候选项的联想源。
当一个待定联想源的第二结果向量与第一结果向量相似,那么可以确定这个待定联想源在语义上能够较为准确的体现出用户当前的实际输入需求,可以作为目标联想源为用户提供联想得到的候选项,当一个待定联想源的第二结果向量与第一结果向量相差较大,那么可以确定这个待定联想源在语义上不能准确的体现出用户当前的实际输入需求,不应作为目标联想源为用户提供联想得到的候选项。
可见,在本申请实施例中,可以先确定用户上屏的上屏词组,该上屏词组中可以包括用户依次上屏的多个上屏词,将该上屏词组输入到深度学习模型中,可以得到第一结果向量,该第一结果向量可以标识在上屏词组后出现不同词的概率,第一结果向量所标识的一个词的概率越高,在语义上,这个词继续出现在该上屏词组后的可能性就越大。根据该上屏词组可以确定出至少一个待定联想源,若根据深度学习模型能够得到一个待定联想源对应的第二结果向量,该第二结果向量可以标识在所述待定联想源后出现不同词的概率,第二结果向量所标识的一个词的概率越高,在语义上,这个词继续出现在该待定联想源后的可能性就越大。由于由多个最近上屏的上屏词所构成的上屏词组能够在语义上较为准确的体现出用户当前的实际输入需求,故此根据第一结果向量和第二结果向量可以确定出待定联想源是否为能够联想出用户当前实际所需上屏候选项的目标联想源。
针对S204,本申请实施例提供了一种根据第一结果向量和第二结果向量从待定联想源中确定出目标联想源的方式。其中,将以第一结果向量和第二结果向量间的向量距离作为确定依据。
若第一结果向量和第二结果向量间的向量距离满足预设条件,将待定联想源作为用于联想候选项的目标联想源。
若第一结果向量和第二结果向量间的向量距离不满足预设条件,不将待定联想源作为用于联想候选项的目标联想源。
该预设条件用于限定第一结果向量和第二结果向量间的向量距离不应超出一定阈值,该阈值的大小可以根据具体应用场景或计算需求确定,一般来说,该阈值越小,根据确定出的目标联想源联想得到的候选项与用户当前的实际输入需求越接近。
通过该预设条件确定出能够作为目标联想源的待定联想源可以包括上屏词组中的至少一个上屏词,例如在上屏词组为“仙界不太平”的情况下,确定出的联想源可以是包括了上屏词“不”和“太平”的“不太平”。
需要注意的是,在待定联想源的数量有多个的情况下,能够作为目标联想源的待定联想源可以有多个,在确定出多个目标联想源时,可以将分别通过不同目标联想源联想得到的候选项都进行展示。
接下来通过具体场景介绍本申请实施例提供的从待定联想源中确定出目标联想源的方式。如图1所示,上屏词组为“仙界不太平”,确定出的待定联想源可以包括“仙界”、“仙界不”、“太平”、“不太平”、“仙界不太平”等。每一个待定联想源单独通过深度学习模型103都可以得到一个对应的第二结果向量。通过预设条件确定第一结果向量和每一个第二结果向量间的向量距离,可以确定待定联想源“不太平”的第二结果向量与第一结果向量间的向量距离满足预设条件,可以作为目标联想源;待定联想源“仙界不太平”的第二结果向量与第一结果向量间的向量距离满足预设条件,可以作为目标联想源;待定联想源“仙界”的第二结果向量与第一结果向量间的向量距离不满足预设条件,不可以作为目标联想源等。
在确定出联想源后,可以通过该联想源联想候选项,并将联想出的候选项进行展示。例如图1所示,确定出的联想源为“不太平”,基于“不太平”联想并展示的候选项为候选项展示区域102处所展示的候选项“了”、“啊”、“!”、“。”。
图3为本申请实施例提供的一种联想源确定装置的装置结构图,所述装置包括第一确定单元301、学习单元302、第二确定单元303和第三确定单元304:
所述第一确定单元301,用于确定上屏词组,所述上屏词组包括用户依次上屏的多个上屏词;
所述学习单元302,用于根据所述上屏词组和深度学习模型得到第一结果向量,所述第一结果向量用于标识第一词集合中各个词出现在所述上屏词组后的概率;
所述第二确定单元303,用于根据所述上屏词组确定待定联想源,并根据所述待定联想源和所述深度学习模型得到第二结果向量,所述第二结果向量用于标识第二词集合中各个词出现在所述待定联想源后的概率;
所述第三确定单元304,用于根据所述第一结果向量和所述第二结果向量确定所述待定联想源是否作为用于联想候选项的目标联想源。
可选的,所述第三确定单元,还用于若所述第一结果向量和所述第二结果向量间的向量距离满足预设条件,将所述待定联想源作为用于联想候选项的目标联想源。
可选的,作为所述目标联想源的待定联想源包括至少两个上屏词。
可选的,所述待定联想源包括所述上屏词组中所述用户最近一次上屏的上屏词。
可选的,所述装置还包括展示单元:
所述展示单元,用于根据所述目标联想源联想并展示候选项。
可选的,所述上屏词组包括的上屏词数量小于预定阈值,或者,所述上屏词组包括的上屏词是根据间隔符确定的。
可选的,所述上屏词组是根据上屏编辑区域中输入焦点的位置确定的。
可选的,所述上屏词组中至少包括所述输入焦点所在位置的前一个上屏词。
可见,确定用户上屏的上屏词组,该上屏词组中可以包括用户依次上屏的多个上屏词,将该上屏词组输入到深度学习模型中,可以得到第一结果向量,该第一结果向量可以标识在上屏词组后出现不同词的概率,第一结果向量所标识的一个词的概率越高,在语义上,这个词继续出现在该上屏词组后的可能性就越大。根据该上屏词组可以确定出至少一个待定联想源,若根据深度学习模型能够得到一个待定联想源对应的第二结果向量,该第二结果向量可以标识在所述待定联想源后出现不同词的概率,第二结果向量所标识的一个词的概率越高,在语义上,这个词继续出现在该待定联想源后的可能性就越大。由于由多个最近上屏的上屏词所构成的上屏词组能够在语义上较为准确的体现出用户当前的实际输入需求,故此根据第一结果向量和第二结果向量可以确定出待定联想源是否为能够联想出用户当前实际所需上屏候选项的目标联想源。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种联想源确定装置400的框图。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,文字区域确定设备400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件406,音频组件410,输入/输出(I/O)的接口412,传感器组件414,以及通信组件416。
处理组件402通常控制设备400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理部件402可以包括多媒体模块,以方便多媒体组件406和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在设备400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件406包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件406包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如传感器组件414可以检测到设备400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
本申请实施例还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种联想源确定方法,所述方法包括:
确定上屏词组,所述上屏词组包括用户依次上屏的多个上屏词;
根据所述上屏词组和深度学习模型得到第一结果向量,所述第一结果向量用于标识第一词集合中各个词出现在所述上屏词组后的概率;
根据所述上屏词组确定待定联想源,并根据所述待定联想源和所述深度学习模型得到第二结果向量,所述第二结果向量用于标识第二词集合中各个词出现在所述待定联想源后的概率;
根据所述第一结果向量和所述第二结果向量确定所述待定联想源是否作为用于联想候选项的目标联想源。
图5是本申请实施例中服务器的结构示意图。该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)522(例如,一个或一个以上处理器)和存储器532,一个或一个以上存储应用程序542或数据544的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器532和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器522可以设置为与存储介质530通信,在服务器500上执行存储介质530中的一系列指令操作。
服务器500还可以包括一个或一个以上电源526,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口555,一个或一个以上键盘556,和/或,一个或一个以上操作系统541,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-only memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (11)

1.一种联想源确定方法,其特征在于,所述方法包括:
确定上屏词组,所述上屏词组包括用户依次上屏的多个上屏词;
根据所述上屏词组和深度学习模型得到第一结果向量,所述第一结果向量用于标识第一词集合中各个词出现在所述上屏词组后的概率;
根据所述上屏词组确定待定联想源,并根据所述待定联想源和所述深度学习模型得到第二结果向量,所述第二结果向量用于标识第二词集合中各个词出现在所述待定联想源后的概率;
根据所述第一结果向量和所述第二结果向量确定所述待定联想源是否作为用于联想候选项的目标联想源。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一结果向量和所述第二结果向量确定所述待定联想源是否作为用于联想候选项的目标联想源,包括:
若所述第一结果向量和所述第二结果向量间的向量距离满足预设条件,将所述待定联想源作为用于联想候选项的目标联想源。
3.根据权利要求1或2所述的方法,其特征在于,作为所述目标联想源的待定联想源包括至少两个上屏词。
4.根据权利要求1或2所述的方法,其特征在于,所述待定联想源包括所述上屏词组中所述用户最近一次上屏的上屏词。
5.根据权利要求2所述的方法,其特征在于,在将所述待定联想源作为所述目标联想源后,所述方法还包括:
根据所述目标联想源联想并展示候选项。
6.根据权利要求1或2所述的方法,其特征在于,所述上屏词组包括的上屏词数量小于预定阈值,或者,所述上屏词组包括的上屏词是根据间隔符确定的。
7.根据权利要求1或2所述的方法,其特征在于,所述上屏词组是根据上屏编辑区域中输入焦点的位置确定的。
8.根据权利要求7所述的方法,其特征在于,所述上屏词组中至少包括所述输入焦点所在位置的前一个上屏词。
9.一种联想源确定装置,其特征在于,所述装置包括第一确定单元、学习单元、第二确定单元和第三确定单元:
所述第一确定单元,用于确定上屏词组,所述上屏词组包括用户依次上屏的多个上屏词;
所述学习单元,用于根据所述上屏词组和深度学习模型得到第一结果向量,所述第一结果向量用于标识第一词集合中各个词出现在所述上屏词组后的概率;
所述第二确定单元,用于根据所述上屏词组确定待定联想源,并根据所述待定联想源和所述深度学习模型得到第二结果向量,所述第二结果向量用于标识第二词集合中各个词出现在所述待定联想源后的概率;
所述第三确定单元,用于根据所述第一结果向量和所述第二结果向量确定所述待定联想源是否作为用于联想候选项的目标联想源。
10.一种联想源确定设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如权利要求1至8中任意一项所述联想源确定方法。
11.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至8中任意一项所述联想源确定方法。
CN201810759120.8A 2018-07-11 2018-07-11 一种联想源确定方法和装置 Active CN110716653B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810759120.8A CN110716653B (zh) 2018-07-11 2018-07-11 一种联想源确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810759120.8A CN110716653B (zh) 2018-07-11 2018-07-11 一种联想源确定方法和装置

Publications (2)

Publication Number Publication Date
CN110716653A true CN110716653A (zh) 2020-01-21
CN110716653B CN110716653B (zh) 2023-11-21

Family

ID=69208188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810759120.8A Active CN110716653B (zh) 2018-07-11 2018-07-11 一种联想源确定方法和装置

Country Status (1)

Country Link
CN (1) CN110716653B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014183587A1 (zh) * 2013-11-01 2014-11-20 中兴通讯股份有限公司 一种联想输入的方法及终端
WO2016107344A1 (zh) * 2014-12-30 2016-07-07 北京奇虎科技有限公司 对输入法的上屏候选项进行筛选的方法和装置
CN106959766A (zh) * 2017-03-16 2017-07-18 努比亚技术有限公司 输入法联想方法及联想装置
CN107247518A (zh) * 2017-08-01 2017-10-13 微云数聚(北京)科技有限公司 多元联想输入的方法、装置、设备以及可读存储介质
CN107608532A (zh) * 2016-07-11 2018-01-19 北京搜狗科技发展有限公司 一种联想输入方法、装置及电子设备
WO2018076450A1 (zh) * 2016-10-31 2018-05-03 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014183587A1 (zh) * 2013-11-01 2014-11-20 中兴通讯股份有限公司 一种联想输入的方法及终端
CN104615261A (zh) * 2013-11-01 2015-05-13 中兴通讯股份有限公司 一种联想输入的方法及终端
WO2016107344A1 (zh) * 2014-12-30 2016-07-07 北京奇虎科技有限公司 对输入法的上屏候选项进行筛选的方法和装置
CN107608532A (zh) * 2016-07-11 2018-01-19 北京搜狗科技发展有限公司 一种联想输入方法、装置及电子设备
WO2018076450A1 (zh) * 2016-10-31 2018-05-03 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置
CN106959766A (zh) * 2017-03-16 2017-07-18 努比亚技术有限公司 输入法联想方法及联想装置
CN107247518A (zh) * 2017-08-01 2017-10-13 微云数聚(北京)科技有限公司 多元联想输入的方法、装置、设备以及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李卫疆;王胜;余正涛;: "基于深度学习的概念语义空间查询扩展研究", 软件导刊, no. 05 *
李源, 何清, 史忠植: "基于概念语义空间的联想检索", 北京科技大学学报, no. 06 *

Also Published As

Publication number Publication date
CN110716653B (zh) 2023-11-21

Similar Documents

Publication Publication Date Title
US10296201B2 (en) Method and apparatus for text selection
CN107688399B (zh) 一种输入方法和装置、一种用于输入的装置
CN108536653B (zh) 一种输入方法、装置和用于输入的装置
CN110795014A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN111679746A (zh) 一种输入方法、装置和电子设备
CN109308126B (zh) 一种候选词展示方法和装置
CN107340881B (zh) 一种输入方法及电子设备
CN110780749B (zh) 一种字符串纠错方法和装置
CN109917927B (zh) 一种候选项确定方法和装置
CN110716653B (zh) 一种联想源确定方法和装置
CN107977089B (zh) 一种输入方法和装置、一种用于输入的装置
CN109426359B (zh) 一种输入方法、装置以及机器可读介质
CN111258691B (zh) 一种输入法界面的处理方法、装置和介质
CN110580126B (zh) 一种虚拟键盘和基于虚拟键盘的输入方法
CN109388328B (zh) 一种输入方法、装置和介质
CN109271094B (zh) 一种文本编辑的方法、装置及设备
CN113342183A (zh) 一种输入方法、装置和用于输入的装置
CN115877955A (zh) 一种输入方法、装置和用于输入的装置
CN107015736B (zh) 一种按键处理方法和装置、一种用于按键处理的装置
CN113220392A (zh) 一种界面展示方法、装置和用于展示界面的装置
CN113885714A (zh) 输入方法、装置和介质
CN112445347A (zh) 一种输入方法、装置和用于输入的装置
CN112905023A (zh) 一种输入纠错方法、装置和用于输入纠错的装置
CN115705095A (zh) 一种输入联想方法、装置和用于输入联想的装置
CN114967939A (zh) 输入方法、装置和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant