CN110874145A - 一种输入方法、装置及电子设备 - Google Patents

一种输入方法、装置及电子设备 Download PDF

Info

Publication number
CN110874145A
CN110874145A CN201811003841.2A CN201811003841A CN110874145A CN 110874145 A CN110874145 A CN 110874145A CN 201811003841 A CN201811003841 A CN 201811003841A CN 110874145 A CN110874145 A CN 110874145A
Authority
CN
China
Prior art keywords
input
current
character string
deep learning
input data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811003841.2A
Other languages
English (en)
Inventor
姚波怀
张扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201811003841.2A priority Critical patent/CN110874145A/zh
Publication of CN110874145A publication Critical patent/CN110874145A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明公开了一种输入方法、装置及电子设备。该输入方法包括:在输入时,获取用户输入的当前字符串和当前输入位置对应的上下文信息;基于当前字符串和上下文信息生成输入数据;通过预先训练好的端到端深度学习模型基于输入数据对当前字符串进行字符串转换、排序,获得当前字符串对应的候选项序列并展现。在上述技术方案中,通过端到端深度学习模型基于当前字符串和上下文信息获得候选项序列,不依赖于人为设定的规则,通过模型的复杂性能够更好的理解用户复杂的输入过程,提供更为准确的候选项和排序,解决了现有技术中输入法存在的候选项转换、排序准确性较低的技术问题,提高了输入过程中候选项的提供、排序的准确性。

Description

一种输入方法、装置及电子设备
技术领域
本发明涉及软件技术领域,特别涉及一种输入方法、装置及电子设备。
背景技术
随着科学技术的不断发展,人机交互越来越频繁,其交互的方式也越来越多样,如语音交互、鼠标交互、输入法交互等等,其中通过输入法进行人机交互为最重要的交互方式之一。
目前,在通过输入法进行输入时,输入法将用户输入字符串与词库中的字符串进行对比,将用户的输入字符串转换为词,作为候选项提供给用户。输入法提供的各种功能(调频、纠错、组词)需要人为制定一系列的规则,将用户输入的字符串转换成候选项,如将拼音转换为汉字。这些人为制定的规则难以做到足够完善,难以准确理解用户复杂多变的输入过程,其候选项的转换、排序存在准确性较低的技术问题。
发明内容
本发明实施例提供一种输入方法、装置及电子设备,用于解决现有技术中输入法存在的候选项转换、排序准确性较低的技术问题。
本发明实施例提供一种输入方法,应用于输入法客户端,所述输入法客户端安装有用于字符转换和排序的端到端深度学习模型,所述端到端深度学习模型通过大数据训练获得,所述方法包括:
获取用户输入的当前字符串和当前输入位置对应的上下文信息;
基于所述当前字符串和所述上下文信息生成输入数据;
通过所述端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
可选的,所述基于所述当前字符串和所述上下文信息生成输入数据,包括:
获得所述用户当前输入行为对应的环境信息和/或位置信息;
基于所述当前字符串和所述上下文信息,以及所述环境信息和/或位置信息,生成所述输入数据。
可选的,若所述端到端深度学习模型为循环神经网络,通过所述端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,包括:
通过所述循环神经网络基于所述输入数据和所述循环神经网络上一时刻的输出状态对所述当前字符串进行字符串转换、排序。
可选的,所述端到端深度学习模型的训练方法包括:
获得各个输入法客户端运行过程中的输入日志集,所述输入日志集中每条输入日志包括:用户的历史输入数据、所述历史输入数据对应的上屏词,所述历史输入数据包括每次输入行为对应的输入字符串、上下文信息及环境信息和/或位置信息;
将每条输入日志作为一个样本:所述历史输入数据为模型的当前输入、所述上屏词作为模型的期待值,训练获得所述端到端深度学习模型。
可选的,所述输入日志集包括:用户选择由所述输入法客户端的纠错功能、模糊音识别功能、组词功能提供的候选项进行上屏的输入日志。
本申请实施例还提供一种输入装置,应用于输入法客户端,所述输入法客户端安装有用于字符转换和排序的端到端深度学习模型,所述端到端深度学习模型通过大数据训练获得,所述装置包括:
获取单元,用于获取用户输入的当前字符串和当前输入位置对应的上下文信息;
生成单元,用于基于所述当前字符串和所述上下文信息生成输入数据;
转换单元,用于通过所述端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
可选的,所述生成单元用于:
获得所述用户当前输入行为对应的环境信息和/或位置信息;
基于所述当前字符串和所述上下文信息,以及所述环境信息和/或位置信息,生成所述输入数据。
可选的,若所述端到端深度学习模型为循环神经网络,所述转换单元用于:
通过所述循环神经网络基于所述输入数据和所述循环神经网络上一时刻的输出状态对所述当前字符串进行字符串转换、排序。
可选的,训练单元,用于通过如下方法训练所述端到端深度学习模型:
获得各个输入法客户端运行过程中的输入日志集,所述输入日志集中每条输入日志包括:用户的历史输入数据、所述历史输入数据对应的上屏词,所述历史输入数据包括每次输入行为对应的输入字符串、上下文信息及环境信息和/或位置信息;
将每条输入日志作为一个样本:所述历史输入数据为模型的当前输入、所述上屏词作为模型的期待值,训练获得所述端到端深度学习模型。
可选的,所述输入日志集包括:用户选择由所述输入法客户端的纠错功能、模糊音识别功能、组词功能提供的候选项进行上屏的输入日志。
本申请实施例还提供一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户输入的当前字符串和当前输入位置对应的上下文信息;
基于所述当前字符串和所述上下文信息生成输入数据;
通过端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
获取用户输入的当前字符串和当前输入位置对应的上下文信息;
基于所述当前字符串和所述上下文信息生成输入数据;
通过端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
本申请实施例中的上述一个或多个技术方案,至少具有如下技术效果:
本申请实施例提供一种输入方法,在输入法客户端安装用于字符转换的端到端深度学习模型,在输入时,获取用户输入的当前字符串和上下文信息;基于当前字符串和上下文信息生成输入数据;通过端到端深度学习模型基于输入数据对所述当前字符串进行字符串转换、排序,获得当前字符串对应的候选项序列并展现。由于候选项序列包括候选项转换和排序,是通过端到端深度学习模型基于当前字符串和上下文信息获得,端到端深度学习模型以大量的输入数据为样本进行训练,不依赖于人为设定的规定,通过端到端深度学习模型进行候选项的提供和排序,更能满足用户复杂的输入过程,提供更为准确的候选项和排序,解决了现有技术中输入法存在的候选项转换、排序准确性较低的技术问题,提高了输入过程中候选项的提供、排序的准确性。
附图说明
图1为本申请实施例提供的一种输入方法的流程示意图;
图2为本申请实施例提供的一种输入装置的方框图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
在本申请实施例提供的技术方案中,提供一种输入方法,通过大数据预先训练端到端深度学习模型来理解用户复杂的输入过程,通过预先训练的端到端深度学习模型基于当前字符串和上下文信息来进行更为准确的字符转换、排序,以解决现有技术中输入法存在的候选项转换、排序准确性较低的技术问题。
下面结合附图对本申请实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细的阐述。
实施例
本申请实施例提供一种输入方法,该方法应用于输入法客户端。在输入法客户端安装有用于字符转换和排序的端到端深度学习模型,该深度学习模型可以是循环神经网络(Recurrent Neural Network,RNN)、卷积神经网络(Convolutional Neural Network,CNN)、长短期记忆网络(Long Short-Term Memory,LSTM)、封闭复发单元(Gated RecurrentUnit,GRU)等。针对该端到端深度学习模型,本实施例通过大数据预先训练获得。具体的,搜集大量的用户输入日志形成输入日志集,来对端到端深度学习模型进行训练,以获得能够理解用户复杂输入过程中端到端深度学习模型。
具体的,端到端深度学习模型的训练方法如下:
首先,获得各个输入法客户端运行过程中的输入日志集。
输入日志集中每条输入日志包括:用户的历史输入数据、历史输入数据对应的上屏词,历史输入数据包括每次输入行为对应的输入字符串、上下文信息及环境信息和/或位置信息。即获得用户每一次输入行为对应的输入字符串、上下文信息、环境信息、位置信息等能够帮助理解用户意图的信息,并将其作为模型输入来进行模型训练,提升模型输出的准确性。
其中,输入日志集中包含的输入日志越多训练获得的模型的准确性越高。每条输入日志中,上下文信息包括当前输入行为所在的当前输入位置对应的上文信息和/或下文信息。上文信息可以为上文分词序列(包含分词之间的顺序),例如:用户在输入上文“今天可能要下暴雨,记得带”之后输入“yus”,那么可以获得上文信息为“下暴雨,/记得/带”,即上文信息是对用户在前输入内容的分词并按其词序获得。上文信息也可以是用户在前上屏的上屏词,例如:用户在上屏“带”之后输入“yus”,那么可以获得上屏词“带”为上文信息。很多时候某一个上屏词并不能很好的表示用户意图,尤其是用户拆分输入的时候,例如:用户依次上屏“太”、“阳”、“的”,单独根据“的”并不能很好的理解用户当前输入“houyi”的输入意图是“后羿”还是“后裔”,相对而言,基于上文分词序列“太阳/的”作为输入数据,则能够使模型在训练或者使用时能够更全面、准确的理解用户输入意图为“后裔”,从而提供模型或者模型输出的准确性。同样的,下文信息也可以为下文分词序列或者用户在后上屏的上屏词。
环境信息则为用户当前输入所在的应用环境,例如:用户在电影APP中输入“yaoshen”,根据其电影环境,输入“药神”的可能性则大于“沈瑶”。同样的,位置信息也可以帮助模型理解用户的输入意图,此处的位置信息是指用户所在的地理位置信息,而上文所述的当前输入位置是指当前输入光标所在的位置。如:用户在成都输入“hongqi”时,由于成都有很多“红旗超市”,用户上屏“红旗”的概率大于“宏碁”,即通过环境信息和/或位置信息也能够帮助模型理解用户意图,将这些帮助模型理解用户意图的信息作为输入数据进行模型训练,使得训练获得的模型能够更准确的理解用户的输入意图,从而在使用时提供更为准确的候选项及排序。
进一步的,在获得输入日志集的过程中,获取多种类型的输入日志,包括:用户选择由输入法客户端的纠错功能、模糊音识别功能、组词功能等提供的候选项进行上屏的输入日志。当然,多种类型的输入日志还可以包括:用户采用全拼、全简拼、末字简拼等方式进行输入的输入日志。通过不同类型是输入日志来训练模型,使得端到端深度学习模型可以将正常输入、纠错、组词等功能学习到一个模型当中,各个功能对应的候选可以在一个模型下获得,因此候选项的得分在统一维度从而达到可以比较的目的,解决目前输入法多种规则排序无法比较的问题。
接着,在获得输入日志集之后,将每条输入日志作为一个样本:历史输入数据为模型的当前输入、上屏词作为模型的期待值,训练获得端到端深度学习模型。具体的,若端到端深度学习模型为循环神经网络,在训练时,还可以将历史输入数据中的输入字符串及环境信息和/或位置信息作为当前输入,将上文信息作为循环神经网络上一时刻的输出状态和/或将下文信息作为循环神经网络当前时刻的下一时刻的输出状态,基于当前输入和输出状态进行模型训练。
请参考图1,基于预先训练好的端到端深度学习模型,在输入法客户端,执行本实施例提供的一种输入方法,该方法包括:
S110:获取用户输入的当前字符串和当前输入位置对应的上下文信息;
S120:基于所述当前字符串和所述上下文信息生成输入数据;
S130:通过所述端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
同样的,与端到端深度学习模型的训练过程类似,S110获取用户输入的当前字符串时,对应获取当前输入行为对应的上下文信息,如获取上文分词序列或者当前输入行为之前的上屏词。
接着,执行S120基于获取到的当前字符串和上下文信息生成输入数据。具体的,在生成输入数据时,还可以获取用户当前输入行为对应的环境信息和/或位置信息,基于当前字符串和上下文信息,以及环境信息和/或位置信息,生成输入数据。输入数据可以是当前字符串、上下文信息、及环境信息及位置信息按序排列形成的输入序列,以按序输入端到端深度学习模型。
进一步的,在S120之后执行S130通过端到端深度学习模型基于输入数据对当前字符串进行字符串转换、排序,获得当前字符串对应的候选项序列并展现。即端到端深度学习模型会综合考虑上下文信息、环境信息、位置信息等计算当前字符串转换得到的候选项的概率或得分,并按照其概率或得分的大小进行排序获得候选项序列,以输出给用户供用户选择上屏。若端到端深度学习模型为循环神经网络,通过端到端深度学习模型进行字符串转换、排序时,可以通过循环神经网络基于输入数据和输入数据对应的上下文信息对当前字符串进行字符串转换、排序。若用户的当前输入位置是上一时刻的输入位置之后的相邻位置,由于循环神经网络上一时刻的输出状态即可认为是上文信息,该输出状态模型通常为自动记录,因此可以略去上文信息的获取,直接获取下文信息,若无下文信息,可以只获取上文信息。若所要获取的上文信息是上文分词序列,那么循环神经网络上一时刻的输出状态为上文分词序列的最后一个分词,获取上文信息时,获取上文分词序列的前n个分词,n≥1。同样的,若所要获取的下文信息是下文分词序列,获取下文信息时,获取下文分词序列的前m个分词,m≥1。
下面以循环神经网络RNN为例,对本实施例的输入过程进行举例说明:
假设:用户输入“wo”,模型将拼音序列送入训练好的RNN模型,计算模型此时t时刻的状态h(t)=f(h(t-1),x(t)),其中h(t-1)为模型上一个时刻的状态,包含了用户的输入的上文信息。x(t)代表拼音串、环境等其他信息。模型根据h(t),计算获得所有词(包括直接匹配的“我”,简拼组词“我哦”,纠错组词“沃派”等)的概率或者得分,然后给出排序提供给用户,若用户选择“我”上屏,那模型最终输出“我”。接着,用户继续输入“fangan”,模型将拼音串送入模型,计算t+1时刻模型的状态h(t+1)=f(h(t),x(t+1)),其中h(t)即上一时刻的模型状态如“我”。然后模型利用t+1时刻的状态h(t+1)计算的所有词(包括“方案”“反感”等结果)参考上文信息,利用上述步骤统一打分排序之后返回候选项序列给用户。同样的,若用户的当前输入位置对应有上文信息和下文信息,那么模型将拼音串送入模型,计算当前时刻t模型的状态h(t)=f(h(t-1),x(t),h(t+1)),其中h(t-1)为模型t-1时刻的输出状态取上文信息替代,h(t+1)为模型t+1时刻的输出状态取下文信息替代。然后,模型利用t-1时刻的状态和t+1时刻的状态计算的所有h(t)的打分排序之后返回候选项序列给用户。
在上述实施例中,重新设计了一种应用于输入法中的端到端深度学习模型,将用户通过输入法输入的过程参考上下文信息,用类似于翻译的方式处理得到候选结果并排序展示给用户,所述模型通过收集的大数据(包括各种类型的输入日志)训练得到,模型中涵盖了正常输入、纠错、组词等功能,可以基于用户的输入字符串直接转换为词语或者是语句,并在同一维度上对候选项进行排序,能够提高候选的质量,克服了现有方法不同功能在不同维度对候选进行评价排序导致的排序准确性较低的技术问题。
针对上述实施例提供一种输入方法,本申请实施例还对应提供一种输入装置,应用于输入法客户端,所述输入法客户端安装有用于字符转换和排序的端到端深度学习模型,所述端到端深度学习模型通过大数据训练获得,请参考图2,该装置包括:
获取单元21,用于获取用户输入的当前字符串和当前输入位置对应的上下文信息;
生成单元22,用于基于所述当前字符串和所述上下文信息生成输入数据;
转换单元23,用于通过所述端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
作为一种可选的实施方式,所述生成单元22用于:获得所述用户当前输入行为对应的环境信息和/或位置信息;基于所述当前字符串和所述上下文信息,以及所述环境信息和/或位置信息,生成所述输入数据。
作为一种可选的实施方式,若所述端到端深度学习模型为循环神经网络,所述转换单元23用于:通过所述循环神经网络基于所述输入数据和所述循环神经网络上一时刻的输出状态对所述当前字符串进行字符串转换、排序。
作为一种可选的实施方式,本装置还包括:训练单元24,用于通过如下方法训练所述端到端深度学习模型:
获得各个输入法客户端运行过程中的输入日志集,所述输入日志集中每条输入日志包括:用户的历史输入数据、所述历史输入数据对应的上屏词,所述历史输入数据包括每次输入行为对应的输入字符串、上下文信息及环境信息和/或位置信息;将每条输入日志作为一个样本:所述历史输入数据为模型的当前输入、所述上屏词作为模型的期待值,训练获得所述端到端深度学习模型。
作为一种可选的实施方式,所述输入日志集包括:用户选择由所述输入法客户端的纠错功能、模糊音识别功能、组词功能提供的候选项进行上屏的输入日志。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图3是根据一示例性实施例示出的一种用于实现输入方法的电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/展现(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个展现接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为展现和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于展现音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由电子设备800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种输入方法,所述方法包括:获取用户输入的当前字符串和当前输入位置对应的上下文信息;基于所述当前字符串和所述上下文信息生成输入数据;通过端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种输入方法,应用于输入法客户端,其特征在于,所述输入法客户端安装有用于字符转换和排序的端到端深度学习模型,所述端到端深度学习模型通过大数据训练获得,所述方法包括:
获取用户输入的当前字符串和当前输入位置对应的上下文信息;
基于所述当前字符串和所述上下文信息生成输入数据;
通过所述端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
2.如权利要求1所述的方法,其特征在于,所述基于所述当前字符串和所述上下文信息生成输入数据,包括:
获得所述用户当前输入行为对应的环境信息和/或位置信息;
基于所述当前字符串和所述上下文信息,以及所述环境信息和/或位置信息,生成所述输入数据。
3.如权利要求1所述的方法,其特征在于,若所述端到端深度学习模型为循环神经网络,通过所述端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,包括:
通过所述循环神经网络基于所述输入数据和所述循环神经网络上一时刻的输出状态对所述当前字符串进行字符串转换、排序。
4.如权利要求1~3任一所述的方法,其特征在于,所述端到端深度学习模型的训练方法包括:
获得各个输入法客户端运行过程中的输入日志集,所述输入日志集中每条输入日志包括:用户的历史输入数据、所述历史输入数据对应的上屏词,所述历史输入数据包括每次输入行为对应的输入字符串、上下文信息及环境信息和/或位置信息;
将每条输入日志作为一个样本:所述历史输入数据为模型的当前输入、所述上屏词作为模型的期待值,训练获得所述端到端深度学习模型。
5.如权利要求4所述的方法,其特征在于,所述输入日志集包括:用户选择由所述输入法客户端的纠错功能、模糊音识别功能、组词功能提供的候选项进行上屏的输入日志。
6.一种输入装置,应用于输入法客户端,其特征在于,所述输入法客户端安装有用于字符转换和排序的端到端深度学习模型,所述端到端深度学习模型通过大数据训练获得,所述装置包括:
获取单元,用于获取用户输入的当前字符串和当前输入位置对应的上下文信息;
生成单元,用于基于所述当前字符串和所述上下文信息生成输入数据;
转换单元,用于通过所述端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
7.如权利要求6所述的装置,其特征在于,所述生成单元用于:
获得所述用户当前输入行为对应的环境信息和/或位置信息;
基于所述当前字符串和所述上下文信息,以及所述环境信息和/或位置信息,生成所述输入数据。
8.如权利要求6所述的装置,其特征在于,若所述端到端深度学习模型为循环神经网络,所述转换单元用于:
通过所述循环神经网络基于所述输入数据和所述循环神经网络上一时刻的输出状态对所述当前字符串进行字符串转换、排序。
9.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户输入的当前字符串和当前输入位置对应的上下文信息;
基于所述当前字符串和所述上下文信息生成输入数据;
通过端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:
获取用户输入的当前字符串和当前输入位置对应的上下文信息;
基于所述当前字符串和所述上下文信息生成输入数据;
通过端到端深度学习模型基于所述输入数据对所述当前字符串进行字符串转换、排序,获得所述当前字符串对应的候选项序列并展现。
CN201811003841.2A 2018-08-30 2018-08-30 一种输入方法、装置及电子设备 Pending CN110874145A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811003841.2A CN110874145A (zh) 2018-08-30 2018-08-30 一种输入方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811003841.2A CN110874145A (zh) 2018-08-30 2018-08-30 一种输入方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN110874145A true CN110874145A (zh) 2020-03-10

Family

ID=69715541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811003841.2A Pending CN110874145A (zh) 2018-08-30 2018-08-30 一种输入方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110874145A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111665955A (zh) * 2020-04-17 2020-09-15 北京百度网讯科技有限公司 候选字符串的处理方法、装置、电子设备及存储介质
CN112698736A (zh) * 2020-12-31 2021-04-23 上海臣星软件技术有限公司 信息输出方法、装置、电子设备及计算机存储介质
CN112783337A (zh) * 2020-12-31 2021-05-11 科大讯飞股份有限公司 输入法候选项的排序方法及相关模型的训练方法
CN113010635A (zh) * 2021-02-19 2021-06-22 网易(杭州)网络有限公司 一种文本纠错方法及装置
CN113589954A (zh) * 2020-04-30 2021-11-02 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
WO2023280265A1 (zh) * 2021-07-08 2023-01-12 华为技术有限公司 一种词句生成方法、模型训练方法及相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714141A (zh) * 2013-12-24 2014-04-09 百度国际科技(深圳)有限公司 信息推送方法及装置
CN106774970A (zh) * 2015-11-24 2017-05-31 北京搜狗科技发展有限公司 对输入法的候选项进行排序的方法和装置
CN107621891A (zh) * 2017-09-28 2018-01-23 北京新美互通科技有限公司 一种文本输入方法、装置及电子设备
CN108446374A (zh) * 2018-03-16 2018-08-24 北京三快在线科技有限公司 用户意图预测方法、装置、电子设备、存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714141A (zh) * 2013-12-24 2014-04-09 百度国际科技(深圳)有限公司 信息推送方法及装置
CN106774970A (zh) * 2015-11-24 2017-05-31 北京搜狗科技发展有限公司 对输入法的候选项进行排序的方法和装置
CN107621891A (zh) * 2017-09-28 2018-01-23 北京新美互通科技有限公司 一种文本输入方法、装置及电子设备
CN108446374A (zh) * 2018-03-16 2018-08-24 北京三快在线科技有限公司 用户意图预测方法、装置、电子设备、存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王明亭 等: "信息技术基础知识", 天津:南开大学出版社, pages: 55 - 56 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111665955A (zh) * 2020-04-17 2020-09-15 北京百度网讯科技有限公司 候选字符串的处理方法、装置、电子设备及存储介质
CN113589954A (zh) * 2020-04-30 2021-11-02 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
CN112698736A (zh) * 2020-12-31 2021-04-23 上海臣星软件技术有限公司 信息输出方法、装置、电子设备及计算机存储介质
CN112783337A (zh) * 2020-12-31 2021-05-11 科大讯飞股份有限公司 输入法候选项的排序方法及相关模型的训练方法
CN112783337B (zh) * 2020-12-31 2024-04-12 科大讯飞股份有限公司 输入法候选项的排序方法及相关模型的训练方法
CN113010635A (zh) * 2021-02-19 2021-06-22 网易(杭州)网络有限公司 一种文本纠错方法及装置
WO2023280265A1 (zh) * 2021-07-08 2023-01-12 华为技术有限公司 一种词句生成方法、模型训练方法及相关设备

Similar Documents

Publication Publication Date Title
CN110874145A (zh) 一种输入方法、装置及电子设备
EP3133532A1 (en) Method and device for training classifier and recognizing a type of information
US11138422B2 (en) Posture detection method, apparatus and device, and storage medium
US20210224592A1 (en) Method and device for training image recognition model, and storage medium
CN109961094B (zh) 样本获取方法、装置、电子设备及可读存储介质
CN111638832A (zh) 信息展示方法、装置、系统、电子设备及存储介质
CN110781813B (zh) 图像识别方法及装置、电子设备和存储介质
US11335348B2 (en) Input method, device, apparatus, and storage medium
CN112148980B (zh) 基于用户点击的物品推荐方法、装置、设备和存储介质
CN112291614A (zh) 一种视频生成方法及装置
CN111797262A (zh) 诗词生成方法、装置、电子设备和存储介质
CN112784151B (zh) 一种确定推荐信息的方法及相关装置
CN110650364B (zh) 视频态度标签提取方法及基于视频的交互方法
CN112631435A (zh) 一种输入方法、装置、设备及存储介质
CN115424044A (zh) 基于多模态的图像标注方法、装置及电子设备
CN108345590B (zh) 一种翻译方法、装置、电子设备以及存储介质
CN110858099B (zh) 候选词生成方法及装置
CN113589949A (zh) 一种输入方法、装置和电子设备
CN107765884B (zh) 一种滑行输入方法、装置及电子设备
CN110554780A (zh) 一种滑行输入的方法和装置
EP3872675A1 (en) Text labeling method and device
CN110334338B (zh) 分词方法、装置及设备
CN108874170B (zh) 一种输入方法及装置
US10871832B2 (en) Method and device for obtaining operation entry, and storage medium
CN109213332B (zh) 一种表情图片的输入方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination