CN115454259A - 一种输入方法、装置和用于输入的装置 - Google Patents

一种输入方法、装置和用于输入的装置 Download PDF

Info

Publication number
CN115454259A
CN115454259A CN202110644356.9A CN202110644356A CN115454259A CN 115454259 A CN115454259 A CN 115454259A CN 202110644356 A CN202110644356 A CN 202110644356A CN 115454259 A CN115454259 A CN 115454259A
Authority
CN
China
Prior art keywords
historical
input
candidate item
conversion model
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110644356.9A
Other languages
English (en)
Inventor
余天照
崔欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202110644356.9A priority Critical patent/CN115454259A/zh
Publication of CN115454259A publication Critical patent/CN115454259A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例公开了一种输入方法、装置和用于输入的装置。该方法的实施例包括:获取目标用户的实时输入串;将实时输入串输入至转换模型,得到实时输入串对应的至少一个候选项,转换模型为端到端模型,转换模型基于历史输入串和历史输入串对应的历史上屏候选项预先训练得到;展示所述至少一个候选项。该实施方式降低了选取候选项的复杂度和人力成本,提高了候选项的输出效率。

Description

一种输入方法、装置和用于输入的装置
技术领域
本申请实施例涉及计算机技术领域,具体涉及一种输入方法、装置和用于输入的装置。
背景技术
随着计算机技术的发展,输入法应用的功能越来越丰富。在接收到用户的输入串后,可提供词条、表情等候选项,还可以进行纠错等。
现有技术中,为了支持组词、纠错、表情等功能,通常需要设定多路召回策略以召回候选项,并配置多种规则和统计模型来对所召回的候选项进行排序和选取。这种基于规则的候选项选取过程较为复杂,导致候选项的输出效率较低,同时,规则和统计模型的设定需要耗费大量人力成本。
发明内容
本申请实施例提出了一种输入方法、装置和用于输入的装置,以解决现有技术中候选项选取的复杂度较高、输出效率较低以及人力成本较高的技术问题。
第一方面,本申请实施例提供了一种输入方法,该方法包括:获取目标用户的实时输入串;将所述实时输入串输入至转换模型,得到所述转换模型输出的至少一个候选项,所述转换模型基于历史输入串和所述历史输入串对应的历史上屏候选项对端到端模型预先训练得到;展示所述至少一个候选项。
第二方面,本申请实施例提供了一种输入装置,该装置包括:获取单元,被配置成获取目标用户的实时输入串;输入单元,被配置成将所述实时输入串输入至转换模型,得到所述转换模型输出的至少一个候选项,所述转换模型基于历史输入串和所述历史输入串对应的历史上屏候选项对端到端模型预先训练得到;展示单元,被配置成展示所述至少一个候选项。
第三方面,本申请实施例提供了一种用于输入的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,所述程序被一个或者一个以上处理器执行时,实现上述第一方面所描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所描述的方法。
本申请实施例提供的输入方法、装置和用于输入的装置,通过获取目标用户的实时输入串,而后将实时输入串输入至基于历史输入串和历史上屏候选项预先训练得到的转换模型,得到与该实时输入串对应的至少一个候选项,从而可展示上述至少一个候选项。由于转换模型基于历史输入串和历史输入串对应的历史上屏候选项对端到端模型预先训练得到,因此转换模型可从历史数据中自动学习到输入串与其所对应的上屏候选项的转换规则,如词条、表情等的转换规则以及纠错规则,无需进行规则和统计模型的设定以及多路召回策略的设定,降低了人力成本和选取候选项的复杂度。同时,省略了现有技术中通过多个规则和统计模型得到多类型候选并排序的中间过程,提高了候选项的输出效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是根据本申请的输入方法的一个实施例的流程图;
图2是根据本申请的输入方法的又一个实施例的流程图;
图3是根据本申请的输入装置的一个实施例的结构示意图;
图4是根据本申请的一种用于输入的装置的结构示意图;
图5是根据本申请的一些实施例中服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,其示出了根据本申请的输入方法的一个实施例的流程100。上述输入方法可运行于各种电子设备,上述电子设备包括但不限于:服务器、智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture Experts GroupAudio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
本申请实施例中所提到的输入法应用能够支持多种输入法。其中,输入法可以是一种为了将各种符号输入到如计算机、手机等电子设备而采用的编码方法,用户可以使用输入法应用便利地将需要的字符或者字符串输入电子设备。需要注意的是,在本申请实施例中输入法除了支持常见的中文输入法(比如拼音输入法、五笔输入法、注音输入法、语音输入法、手写输入法等)以外,还可以支持其他语种的输入法(比如英文输入法、日文平假名输入法、韩文输入法等),在此不对输入法以及输入法的语言种类做任何限定。
本实施例中的输入方法,可以包括以下步骤:
步骤101,获取目标用户的实时输入串。
在本实施例中,输入方法的执行主体(如上述电子设备)可以安装有输入法应用。上述执行主体可以实时获取目标用户在输入法应用的键盘界面中所输入的输入串(可称为实时输入串)。实践中,用户可采用拼音、五笔等各种编码输入方式进行输入串的输入。以拼音输入为例,用户具体可采用全拼、简拼、末字简拼等多种方式中的任一种进行输入。目标用户可以是任一使用输入法应用进行输入的用户。
步骤102,将实时输入串输入至转换模型,得到转换模型输出的至少一个候选项。
在本实施例中,上述执行主体中可以存储有预先训练的转换模型。将所获取的实时输入串输入至该转换模型,即可得到转换模型输出的至少一个候选项。此处,转换模型可以用于表征输入串与候选项的对应关系。转换模型可采用机器学习方法训练得到,具体可基于历史输入串和历史输入串对应的历史上屏候选项作为训练样本,对端到端模型(endto end)预先训练得到。上述历史输入串和历史上屏候选项可来自于多个用户的历史输入数据。上述多个用户中可以包括目标用户,例如,上述多个用户可以是全量用户或者包括目标用户的部分用户(如同城用户、同性别用户等)。或者,上述多个用户也可以是用户特征与目标用户的用户特征的相似度大于预设阈值的用户。其中,用户特征可包括但不限于以下至少一项:性别、年龄段、城市、偏好等。上述用户特征可在用户同意后获取。
在本实施例中,在端到端模型的训练过程中,在将数据(如历史输入串)输入至端到端模型后,该模型的输出端会得到一个预测结果(如预测出的上屏候选项)。将该预测结果与真实结果(即历史上屏候选项)进行比较,即可得到误差。将误差反向传播到端到端模型的各层网络结构,即可对各层网络的参数进行调整。迭代执行此过程直至模型达到预期效果,即可完成端到端模型的训练,得到转换模型。
在本实施例的一些可选的实现方式中,端到端模型中包括编码器(encoder)和解码器(decoder)。编码器与解码器相连接。编码器与解码器可分别包含至少一层网络结构。例如,编码器和解码器可以采用RNN(Recurrent Neural Network,循环神经网络)、LSTM(Long Short-Term Memory,长短期记忆网络)等网络结构。
作为示例,端到端模型可以是transformer(转换器)模型。transformer模型是一种基于注意力机制(Attention)的网络模型。transformer模型中的编码器可以包含多层网络结构(例如6层相同的网络结构)。每层网络结构中又可以包含两个子层,分别为自注意力(self-attention)层和前馈神经网络(Feed forward)层。编码器能够对输入至模型的输入串进行编码,从而生成编码向量序列。上述自注意力层可提供注意力机制。使用自注意力机制的transformer模型能够对输入串的语义进行更为充分的理解。transformer模型中的解码器也可以包含多层网络结构(例如6层相同的网络结构)。每层网络结构中又可以包含三个子层,分别为两层自注意力(self-attention)层和一层前馈神经网络(Feed forward)层。编码器能够对解码器输出的编码向量序列进行进一步的分析处理,输出预测出的与输入串对应的候选项。
作为又一示例,端到端模型可采用包含transformer结构的其他模型,如BERT(Bidirectional Encoder Representations from Transformer,基于转换器的双向编码器表示)模型等。BERT模型是一种应用于自然语言处理任务的开源的语言模型。BERT模型包含多层transformer结构(具体为transformer结构中的编码器(encoder))。因此通过BERT得到的编码向量与传统的编码向量相比更具有全局性。
在本实施例的一些可选的实现方式中,转换模型具体可通过如下步骤训练得到:
第一步,获取样本集。
此处,样本集中可包括大量的样本。每个样本可以是一个二元组。二元组中可包括一个历史输入串和该历史输入串对应的历史上屏候选项。样本可来自于多个用户的历史输入数据。
第二步,将样本集中的历史输入串作为端到端模型的输入,基于历史上屏候选项对端到端模型进行训练,得到转换模型。
此处,在训练过程中,可以逐一地将样本中的历史输入串输入至端到端模型,得到端到端模型输出的预测结果(即预测出的候选项)。而后,可以基于预测结果与所输入的历史输入串对应的历史上屏候选项,确定端到端模型的损失值。上述损失值为损失函数(lossfunction)的值,损失函数是一个非负实值函数,可以用于表征检测结果与真实结果的差异。一般情况下,损失值越小,模型的鲁棒性就越好。损失函数可以根据实际需求来设置。之后,可以利用该损失值,更新端到端模型的参数。由此,每输入一次历史输入串,可以基于该历史输入串对应的损失值,对端到端模型的参数进行一次更新,直至训练完成。
实践中,可以通过多种方式确定是否训练完成。作为示例,当端到端模型输出的结果预测的准确性达到预设值时(例如99%),可确定训练完成。作为又一示例,若端到端模型的训练次数等于预设次数时,可以确定训练完成。此处,若端到端模型训练完成,即可将训练后的端到端模型作为转换模型,以用于对目标用户的实时输入串进行候选项预测。
在本实施例的一些可选的实现方式中,样本集中的样本可通过如下步骤生成:
第一步,获取多个用户的历史输入数据。
此处,历史输入数据中包括多个用户在输入法键盘界面中输入的历史操作信息以及历史操作信息对应的历史上屏候选项。其中,历史输入信息可包括限不限于历史按键串、历史手写操作信息等。历史按键串中可包括但不限于输入串、用户点击的功能按键(如回车键、删除键等)。历史手写操作信息可包括但不限于历史手写字符串、用户点击的功能按键(如回车键、删除键等)等。历史上屏候选项包括但不限于以下至少一项:词条、表情、图片、视频。
作为示例,用户输入的历史按键串为“s”-“r”-“f”。在输入该按键串后,输入法界面中展示有“输入法”、“三人份”、“受让方”等多个候选项。在用户点击“输入法”这一候选项后,即可对该候选项“输入法”进行上屏。此时,“输入法”即为该输入历史按键串对应的历史上屏候选项。
作为又一示例,用户在历史输入过程中进行了手动纠错,输入的历史按键串为“d”-“e”-“删除键”-“w”-“y”。在输入该按键串后,用户上屏的“动物园”这一词,此时,“动物园”即为该输入历史按键串对应的历史上屏候选项。
作为再一示例,用户输入的历史按键串为“h”-“h”。在输入该按键串后,输入法界面中展示有“还好”、“哈哈”以及笑脸表情等候选项。在用户点击笑脸表情这一候选项后,即可对该笑脸表情进行上屏。此时,该笑脸表情即为该历史按键串对应的历史上屏候选项。
第二步,从历史操作信息中提取历史输入串,将历史按键串和历史上屏候选项汇总为样本。
此处,每一个历史按键串可对应一个历史上屏候选项,由此,从每一个历史按键串中提取出的历史输入串,可对应一个历史上屏候选项。上述执行主体可以从历史按键串中提取有效的字符串,从而得到历史输入串。有效的字符串可以是用户选中后未删除的字符串。作为示例,用户输入的历史按键串为“s”-“r”-“f”,该历史按键串“s”-“r”-“f”即为历史输入串。作为又一示例,用户输入的历史按键串为“d”-“e”-“删除键”-“w”-“y”,由于用户在此次输入过程中对所输入的字符“e”进行了删除,因此历史输入串为删除该字符“e”后的拼音串“d”-“w”-“y”。
在本实施例的一些可选的实现方式中,样本集中的样本可通过如下步骤生成:首先,获取多个用户的历史输入数据,历史输入数据中包括多个用户的历史输入串以及历史输入串对应的历史上屏候选项;而后,将历史输入串和历史输入串对应的历史上屏候选项汇总为样本。
需要说明的是,样本集中的历史输入串既可以包括无需纠错处理的正确历史输入串,也可以包括需要经过纠错处理的错误历史输入串。例如,在历史输入过程中,用户意图上屏“放假”,但将“fangjia”错输成了“fanjia”,输入法应用触发纠错功能后在候选项中展示了“放假”这一候选项,用户对其进行上屏。则依然可将“fanjia”作为历史输入串,将“放假”作为该历史输入串对应的历史上屏候选项,构建一个样本。由此,在训练转换模型的过程中,模型不仅可学习到正确输入串与候选项的转换规则,还可学习到输入串的纠错转换规则,无需进行规则和统计模型的设定以及多路召回策略的设定,降低了人力成本和选取候选项的复杂度。
此外,由于样本集中的历史上屏候选项可包括但不限于词条、表情、图片、视频等,因此,在训练转换模型的过程中,模型不仅可学习到输入串与词条的转换规则,还可以学习到输入串与表情、图片、视频等的转换规则,在将当前输入串输入模型后,也可以输出词条、表情、图片、视频中的一项或多项,无需进行多种规则和多路召回策略的设定,降低了人力成本和选取候选项的复杂度。
步骤103,展示上述至少一个候选项。
在本实施例中,在得到转换模型输出的至少一个候选项后,上述执行主体可以在输入法界面中(如在输入法界面的候选栏中)展示上述至少一个候选项。实践中,转换模型所输出的每一个候选项可具有一个得分,用以表征与当前输入串的匹配程度。上述至少一个候选项可按照得分顺序进行排列和展示。
需要说明的是,候选项的展示方式和展示样式可以根据需要预先设定,此处不作限定。用户在通过选取其中一个候选项,实现对所选中的候选项的上屏。
本申请的上述实施例提供的方法,通过获取目标用户的实时输入串,而后将实时输入串输入至基于历史输入串和历史上屏候选项预先训练得到的转换模型,得到与该实时输入串对应的至少一个候选项,从而可展示上述至少一个候选项。由于转换模型基于历史输入串和历史输入串对应的历史上屏候选项对端到端模型预先训练得到,因此转换模型可从历史数据中自动学习到输入串与其所对应的上屏候选项的转换规则,如词条、表情等的转换规则以及纠错规则,无需进行规则和统计模型的设定以及多路召回策略的设定,降低了人力成本和选取候选项的复杂度。同时,省略了现有技术中通过多个规则和统计模型得到多类型候选并排序的中间过程,提高了候选项的输出效率。
进一步参考图2,其示出了输入方法的又一个实施例的流程200。该输入方法的流程200,包括以下步骤:
步骤201,获取目标用户的实时输入串。
本实施例的步骤201可参见图1对应实施例的步骤101,此处不再赘述。
步骤202,将实时输入串输入至转换模型,得到转换模型输出的至少一个候选项。
本实施例的步骤202可参见图1对应实施例的步骤102,此处不再赘述。
步骤203,展示上述至少一个候选项。
本实施例的步骤203可参见图1对应实施例的步骤103,此处不再赘述。
步骤204,在检测到目标用户对上述至少一个候选项中的任一候选项的选中操作时,将目标用户选中的候选项作为目标候选项进行上屏。
在本实施例中,上述执行主体可以实时检测用户在输入法界面中的操作。在检测到用户选中(如点击)任一候选项时,可将该候选项作为目标候选项进行上屏。
步骤205,将实时输入串作为转换模型的输入,基于目标候选项对转换模型进行再训练,以更新转换模型。
在本实施例中,在目标候选项上屏后,上述执行主体可以将实时输入串和目标候选项作为一组新的样本,利用该样本对转换模型进行再训练,以更新转换模型。具体地,可以将实时输入串作为转换模型的输入,基于目标候选项对转换模型进行再训练。
此处,可以将当前输入串输入至转换模型,得到转换模型输出的预测结果(即预测出的候选项)。而后,可以基于预测结果与目标上屏候选项,确定转换模型的损失值。之后,可以利用该损失值,更新转换模型的参数,由此实现对转换模型的更新。再训练的方式与初次训练转换模型的方式基本相同,此处不再赘述。
需要说明的是,可以多个用户(如全量用户或者具有相同或相似特征的用户)共用同一个转换模型,也可以针对不同用户配置不同的转换模型,此处不作具体限定。此外,可以每得到一个实时输入串和目标候选项后,对转换模型进行一次再训练,也可以在得到多组实时输入串和目标候选项构成的新样本后,对转换模型进行一次再训练,此处对再训练的时机不作具体限定。
从图2中可以看出,与图1对应的实施例相比,本实施例中的输入方法的流程200涉及了基于用户当前输入串以及针对当前输入串上屏的目标候选项对已训练的转换模型进行再训练的步骤。转换模型可基于用户实时输入情况进行实时动态地更新,因此可以学习到最新的转换规则,提高了转换模型的转换效果。
进一步参考图3,作为对上述各图所示方法的实现,本申请提供了一种输入装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,本实施例上述的输入装置300包括:获取单元301,被配置成获取目标用户的实时输入串;输入单元302,被配置成将上述实时输入串输入至转换模型,得到上述转换模型输出的至少一个候选项,所述转换模型为端到端模型,所述转换模型基于历史输入串和所述历史输入串对应的历史上屏候选项预先训练得到;展示单元303,被配置成展示上述至少一个候选项。
在本实施例的一些可选的实现方式中,上述转换模型通过如下步骤训练得到:获取样本集,上述样本集中的样本为二元组,上述二元组中包括多个用户的历史输入串和上述历史输入串对应的历史上屏候选项;将上述历史输入串作为端到端模型的输入,基于上述历史上屏候选项对上述端到端模型进行训练,得到转换模型。
在本实施例的一些可选的实现方式中,上述装置还包括再训练单元,被配置成:在检测到上述目标用户对上述至少一个候选项中的任一候选项的选中操作时,将上述目标用户选中的候选项作为目标候选项进行上屏;将上述实时输入串作为上述转换模型的输入,基于上述目标候选项对上述转换模型进行再训练,以更新上述转换模型。
在本实施例的一些可选的实现方式中,上述获取样本集中的样本通过如下步骤生成:获取多个用户的历史输入数据,所述历史输入数据中包括所述多个用户的历史输入串以及所述历史输入串对应的历史上屏候选项;将所述历史输入串和所述历史输入串对应的历史上屏候选项汇总为样本。
在本实施例的一些可选的实现方式中,上述多个用户中包括上述目标用户;或者,上述多个用户的用户特征与上述目标用户的用户特征的相似度大于预设阈值。
在本实施例的一些可选的实现方式中,上述历史上屏候选项包括以下至少一项:词条、表情、图片、视频;所述转换模型输出的候选项包括以下至少一项:词条、表情、图片、视频。
在本实施例的一些可选的实现方式中,上述端到端模型中包括编码器和解码器,上述编码器与上述解码器相连接,上述编码器和上述解码其分别包括至少一层网络结构。
本申请的上述实施例提供的装置,通过获取目标用户的实时输入串,而后将实时输入串输入至基于历史输入串和历史上屏候选项预先训练得到的转换模型,得到与该实时输入串对应的至少一个候选项,从而可展示上述至少一个候选项。由于转换模型基于历史输入串和历史输入串对应的历史上屏候选项对端到端模型预先训练得到,因此转换模型可从历史数据中自动学习到输入串与其所对应的上屏候选项的转换规则,如词条、表情等的转换规则以及纠错规则,无需进行规则和统计模型的设定以及多路召回策略的设定,降低了人力成本和选取候选项的复杂度。同时,省略了现有技术中通过多个规则和统计模型得到多类型候选并排序的中间过程,提高了候选项的输出效率。。
图4是根据一示例性实施例示出的用于输入的装置400的框图,该装置400可以为智能终端或者服务器。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件408,音频组件410,输入/输出(I/O)的接口412,传感器组件414,以及通信组件416。
处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件408包括在上述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。上述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与上述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到设备400的打开/关闭状态,组件的相对定位,例如上述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,上述通信组件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,上述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图5是本申请的一些实施例中服务器的结构示意图。该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)522(例如,一个或一个以上处理器)和存储器532,一个或一个以上存储应用程序542或数据544的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器532和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器522可以设置为与存储介质530通信,在服务器500上执行存储介质530中的一系列指令操作。
服务器500还可以包括一个或一个以上电源526,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口558,一个或一个以上键盘556,和/或,一个或一个以上操作系统541,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当上述存储介质中的指令由装置(智能终端或者服务器)的处理器执行时,使得装置能够执行一种输入方法,上述方法包括:获取目标用户的实时输入串;将所述实时输入串输入至转换模型,得到所述转换模型输出的至少一个候选项,所述转换模型为端到端模型,所述转换模型基于历史输入串和所述历史输入串对应的历史上屏候选项预先训练得到;展示所述至少一个候选项。
可选的,所述转换模型通过如下步骤训练得到:获取样本集,所述样本集中的样本为二元组,所述二元组中包括历史输入串和所述历史输入串对应的历史上屏候选项;将所述样本集中的历史输入串作为端到端模型的输入,基于所述历史上屏候选项对所述端到端模型进行训练,得到转换模型。
可选的,在展示所述至少一个候选项之后,所述装置经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:在检测到所述目标用户对所述至少一个候选项中的任一候选项的选中操作时,将所述目标用户选中的候选项作为目标候选项进行上屏;将所述实时输入串作为所述转换模型的输入,基于所述目标候选项对所述转换模型进行再训练,以更新所述转换模型。
可选的,所述样本集中的样本通过如下步骤生成:获取多个用户的历史输入数据,所述历史输入数据中包括所述多个用户的历史输入串以及所述历史输入串对应的历史上屏候选项;将所述历史输入串和所述历史输入串对应的历史上屏候选项汇总为样本。
可选的,所述多个用户中包括所述目标用户;或者,所述多个用户的用户特征与所述目标用户的用户特征的相似度大于预设阈值。
可选的,所述历史上屏候选项包括以下至少一项:词条、表情、图片、视频;所述转换模型输出的候选项包括以下至少一项:词条、表情、图片、视频。
可选的,所述端到端模型中包括编码器和解码器,所述编码器与所述解码器相连接,所述编码器和所述解码其分别包括至少一层网络结构。
本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
以上上述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
以上对本申请所提供的一种输入方法、装置和一种用于输入的装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (15)

1.一种输入方法,其特征在于,所述方法包括:
获取目标用户的实时输入串;
将所述实时输入串输入至转换模型,得到所述转换模型输出的至少一个候选项,所述转换模型为端到端模型,所述转换模型基于历史输入串和所述历史输入串对应的历史上屏候选项预先训练得到;
展示所述至少一个候选项。
2.根据权利要求1所述的方法,其特征在于,所述转换模型通过如下步骤训练得到:
获取样本集,所述样本集中的样本为二元组,所述二元组中包括历史输入串和所述历史输入串对应的历史上屏候选项;
将所述样本集中的历史输入串作为端到端模型的输入,基于所述历史上屏候选项对所述端到端模型进行训练,得到转换模型。
3.根据权利要求1所述的方法,其特征在于,在展示所述至少一个候选项之后,所述方法还包括:
在检测到所述目标用户对所述至少一个候选项中的任一候选项的选中操作时,将所述目标用户选中的候选项作为目标候选项进行上屏;
将所述实时输入串作为所述转换模型的输入,基于所述目标候选项对所述转换模型进行再训练,以更新所述转换模型。
4.根据权利要求2所述的方法,其特征在于,所述样本集中的样本通过如下步骤生成:
获取多个用户的历史输入数据,所述历史输入数据中包括所述多个用户的历史输入串以及所述历史输入串对应的历史上屏候选项;
将所述历史输入串和所述历史输入串对应的历史上屏候选项汇总为样本。
5.根据权利要求2所述的方法,其特征在于,所述多个用户中包括所述目标用户;或者,
所述多个用户的用户特征与所述目标用户的用户特征的相似度大于预设阈值。
6.根据权利要求2所述的方法,其特征在于,所述历史上屏候选项包括以下至少一项:词条、表情、图片、视频;
所述转换模型输出的候选项包括以下至少一项:词条、表情、图片、视频。
7.根据权利要求1所述的方法,其特征在于,所述端到端模型中包括编码器和解码器,所述编码器与所述解码器相连接,所述编码器和所述解码其分别包括至少一层网络结构。
8.一种输入装置,其特征在于,所述方法包括:
获取单元,被配置成获取目标用户的实时输入串;
输入单元,被配置成将所述实时输入串输入至转换模型,得到所述转换模型输出的至少一个候选项,所述转换模型为端到端模型,所述转换模型基于历史输入串和所述历史输入串对应的历史上屏候选项预先训练得到;
展示单元,被配置成展示所述至少一个候选项。
9.根据权利要求8所述的装置,其特征在于,所述转换模型通过如下步骤训练得到:
获取样本集,所述样本集中的样本为二元组,所述二元组中包括多个用户的历史输入串和所述历史输入串对应的历史上屏候选项;
将所述历史输入串作为端到端模型的输入,基于所述历史上屏候选项对所述端到端模型进行训练,得到转换模型。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括再训练单元,被配置成:
在检测到所述目标用户对所述至少一个候选项中的任一候选项的选中操作时,将所述目标用户选中的候选项作为目标候选项进行上屏;
将所述实时输入串作为所述转换模型的输入,基于所述目标候选项对所述转换模型进行再训练,以更新所述转换模型。
11.根据权利要求9所述的装置,其特征在于,所述获取样本集中的样本通过如下步骤生成:
获取多个用户的历史输入数据,所述历史输入数据中包括所述多个用户的历史输入串以及所述历史输入串对应的历史上屏候选项;
将所述历史输入串和所述历史输入串对应的历史上屏候选项汇总为样本。
12.根据权利要求9所述的装置,其特征在于,所述多个用户中包括所述目标用户;或者,
所述多个用户的用户特征与所述目标用户的用户特征的相似度大于预设阈值。
13.根据权利要求9所述的装置,其特征在于,所述历史上屏候选项包括以下至少一项:词条、表情、图片、视频;
所述转换模型输出的候选项包括以下至少一项:词条、表情、图片、视频。
14.一种用于输入的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,所述程序被一个或者一个以上处理器执行时,实现权利要求1-7中任一所述方法的步骤。
15.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN202110644356.9A 2021-06-09 2021-06-09 一种输入方法、装置和用于输入的装置 Pending CN115454259A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110644356.9A CN115454259A (zh) 2021-06-09 2021-06-09 一种输入方法、装置和用于输入的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110644356.9A CN115454259A (zh) 2021-06-09 2021-06-09 一种输入方法、装置和用于输入的装置

Publications (1)

Publication Number Publication Date
CN115454259A true CN115454259A (zh) 2022-12-09

Family

ID=84294477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110644356.9A Pending CN115454259A (zh) 2021-06-09 2021-06-09 一种输入方法、装置和用于输入的装置

Country Status (1)

Country Link
CN (1) CN115454259A (zh)

Similar Documents

Publication Publication Date Title
CN107291690B (zh) 标点添加方法和装置、用于标点添加的装置
CN107564526B (zh) 处理方法、装置和机器可读介质
CN107688399B (zh) 一种输入方法和装置、一种用于输入的装置
CN108073291B (zh) 一种输入方法和装置、一种用于输入的装置
CN110968246A (zh) 中文智能手写输入识别方法及装置
CN110795014A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN115454259A (zh) 一种输入方法、装置和用于输入的装置
CN110858099B (zh) 候选词生成方法及装置
CN113515618A (zh) 语音处理方法、装置和介质
CN113407099A (zh) 输入方法、装置和机器可读介质
CN109388252B (zh) 一种输入方法及装置
CN109426359B (zh) 一种输入方法、装置以及机器可读介质
CN107977089B (zh) 一种输入方法和装置、一种用于输入的装置
CN112181163A (zh) 一种输入方法、装置和用于输入的装置
WO2022105229A1 (zh) 一种输入方法、装置和用于输入的装置
CN110780749A (zh) 一种字符串纠错方法和装置
CN115509371A (zh) 一种按键识别方法、装置和用于识别按键的装置
CN115543099A (zh) 输入方法、装置和用于输入的装置
CN115494965A (zh) 一种请求发送方法、装置和用于发送请求的装置
CN113703590A (zh) 一种输入方法、装置和用于输入的装置
CN115373523A (zh) 一种输入方法、装置和用于输入的装置
CN114115550A (zh) 联想候选的处理方法、装置和用于处理联想候选的装置
CN114518800A (zh) 一种请求发送方法、装置和用于发送请求的装置
CN114442816A (zh) 一种联想预取方法、装置和用于联想预取的装置
CN113703588A (zh) 一种输入方法、装置和用于输入的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination