CN115509371A - 一种按键识别方法、装置和用于识别按键的装置 - Google Patents
一种按键识别方法、装置和用于识别按键的装置 Download PDFInfo
- Publication number
- CN115509371A CN115509371A CN202110702389.4A CN202110702389A CN115509371A CN 115509371 A CN115509371 A CN 115509371A CN 202110702389 A CN202110702389 A CN 202110702389A CN 115509371 A CN115509371 A CN 115509371A
- Authority
- CN
- China
- Prior art keywords
- key
- historical
- behavior information
- sequence
- information sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 238000012549 training Methods 0.000 claims abstract description 49
- 230000008569 process Effects 0.000 claims abstract description 30
- 230000006399 behavior Effects 0.000 claims description 188
- 230000015654 memory Effects 0.000 claims description 17
- 238000003825 pressing Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000005291 magnetic effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请实施例公开了一种按键识别方法、装置和用于识别按键的装置。该方法的实施例包括:获取用户输入过程中的按键行为信息,得到待测按键行为信息序列;将待测按键行为信息序列输入至预先训练的按键识别模型,得到待测按键行为信息序列对应的目标按键序列,按键识别模型为端到端模型,按键识别模型基于历史按键行为信息序列和历史按键行为信息序列对应的历史按键序列训练得到。该实施方式降低了按键识别的复杂度,提高了输入过程中的按键识别效率。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及一种按键识别方法、装置和用于识别按键的装置。
背景技术
随着计算机技术的发展,越来越多的电子设备及其所运行的客户端应用中配置有虚拟键盘,电子设备可通过识别用户在虚拟键盘中所触摸的按键,来接收用户输入的信息。
现有技术中,在识别按键时,通常需要基于每个按键的响应区域确定用户的按键序列,之后结合按键的前后关系来调整按键序列,从而得到按键识别结果。这种方式需要设定各种规则,如按键转换规则、误触识别规则等,导致按键识别的复杂度较高以及按键识别的效率较低。
发明内容
本申请实施例提出了一种按键识别方法、装置和用于识别按键的装置,以解决现有技术中按键识别的复杂度较高以及按键识别的效率较低的技术问题。
第一方面,本申请实施例提供了一种按键识别方法,该方法包括:获取用户输入过程中的按键行为信息,得到待测按键行为信息序列;将所述待测按键行为信息序列输入至预先训练的按键识别模型,得到所述待测按键行为信息序列对应的目标按键序列,所述按键识别模型为端到端模型,所述按键识别模型基于历史按键行为信息序列和所述历史按键行为信息序列对应的历史按键序列训练得到。
第二方面,本申请实施例提供了一种按键识别装置,该装置包括:获取单元,被配置成获取用户输入过程中的按键行为信息,得到待测按键行为信息序列;输入单元,被配置成将所述待测按键行为信息序列输入至预先训练的按键识别模型,得到所述待测按键行为信息序列对应的目标按键序列,所述按键识别模型为端到端模型,所述按键识别模型基于历史按键行为信息序列和所述历史按键行为信息序列对应的历史按键序列训练得到。
第三方面,本申请实施例提供了一种用于识别按键的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,所述程序被一个或者一个以上处理器执行时,实现上述第一方面所描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所描述的方法。
本申请实施例提供的按键识别方法、装置和用于识别按键的装置,通过获取用户输入过程中的按键行为信息,得到待测按键行为信息序列,从而将待测按键行为信息序列输入至预先训练的按键识别模型,得到待测按键行为信息序列对应的目标按键序列。由于按键识别模型为端到端模型且基于历史按键行为信息序列和上述历史按键行为信息序列对应的历史按键序列训练得到,因而按键识别模型可从训练数据中学习到按键行为信息序列与按键序列的对应关系和转换规则,无需进行多种规则(如按键转换规则、误触识别规则等)的设定,降低了按键识别的复杂度。同时,省略了现有技术中通过多个规则得到按键识别结果的中间过程,提高了按键识别效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是根据本申请的按键识别方法的一个实施例的流程图;
图2是根据本申请的按键识别模型的训练过程的流程图;
图3是根据本申请的按键识别方法的又一个实施例的流程图;
图4是根据本申请的按键识别装置的一个实施例的结构示意图;
图5是根据本申请的一种用于识别按键的装置的结构示意图;
图6是根据本申请的一些实施例中服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,其示出了根据本申请的按键识别方法的一个实施例的流程100。上述按键识别方法可运行于各种电子设备,上述电子设备包括但不限于:服务器、智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
本申请实施例中所提到的输入法应用可以指输入法客户端,其能够支持多种输入法。用户可以使用输入法应用便利地将需要的字符或者字符串输入电子设备。需要注意的是,在本申请实施例中输入法除了支持常见的中文输入法(比如拼音输入法、五笔输入法、注音输入法、语音输入法、手写输入法等)以外,还可以支持其他语种的输入法(比如英文输入法、日文平假名输入法、韩文输入法等),在此不对输入法以及输入法的语言种类做任何限定。本申请实施例可以应用于全拼、简拼、九键、26键等多种输入场景。
本实施例中的按键识别方法,可以包括以下步骤:
步骤101,获取用户输入过程中的按键行为信息,得到待测按键行为信息序列。
在本实施例中,按键识别方法的执行主体(如上述电子设备)可以安装有输入法应用、即时通讯应用等各种客户端应用。所安装的一个或多个客户端应用中可具有输入界面,输入界面中可呈现有多个按键。以输入法应用为例,输入界面可以是输入法的键盘面板,键盘面板中可呈现有多个编码按键(如“a”、“b”、“c”等拼音键)和功能按键(如删除、确认等按键)。用户可以通过触摸界面中的按键,进行内容输入,从而实现与上述执行主体的人机交互。
在本实施例中,上述执行主体可以实时检测用户输入过程中的按键行为。例如,当通过压力传感器检测到用户在输入界面对应的屏幕区域中执行了触摸操作,即可认为用户执行了按键行为。在每次检测到用户的按键行为后,上述执行主体可以获取按键行为信息。按键行为信息可以是用于描述按键行为的特征的信息,可作为按键行为的特征信息。通常用户输入过程中会连续触发多个按键进行内容输入,因而上述执行主体可以获得多个按键行为信息,并将所获得的按键行为信息按时间先后顺序依次汇总,得到待测按键行为信息序列。
在一些示例中,按键行为信息可以包括但不限于以下至少一项:触摸力度、触摸时长、触摸按下坐标、触摸抬起坐标、按键时的手势信息。其中,按键时的手势信息可通过上述执行主体中安装的信息采集装置采集。信息采集装置可包括以下至少一项:摄像头、陀螺仪。
需要说明的是,在得到按键行为信息后,还可将按键行为信息中的各项数据进行处理(如数值变换、归一化等),并将其转换为特征向量等形式,以便于按键识别模型处理。数据处理方式可根据需要进行设定,此处不作限定。
步骤102,将待测按键行为信息序列输入至预先训练的按键识别模型,得到待测按键行为信息序列对应的目标按键序列。
在本实施例中,上述执行主体中可以存储有预先训练的按键识别模型。上述执行主体可以将待测按键行为信息序列输入至预先训练的按键识别模型,得到该按键识别模型预测出的目标按键序列。目标按键序列即为与待测按键行为信息序列对应的按键序列。
需要说明的是,由于用户在输入过程中通常持续点击若干按键,因此待测按键行为信息序列会随着用户触发按键的增加而更新,由于模型输入存在更新,因此模型输出的目标按键序列也会随着用户持续点击按键而进行实时更新。
在本实施例中,按键识别模型可以采用机器学习方法预先训练得到,具体可基于历史按键行为信息序列和历史按键行为信息序列对应的历史按键序列,对端到端模型(endto end)训练得到。由此,按键识别模型也为端到端模型。在端到端模型的训练过程中,在将历史按键行为信息序列输入至端到端模型后,该模型的输出端会得到一个识别结果(如识别出的按键序列)。将该识别结果与真实结果(即历史按键行为信息序列对应的历史按键序列)进行比较,即可得到误差。将误差反向传播到端到端模型的各层网络结构,即可对各层网络的参数进行调整。迭代执行此过程直至模型达到预期效果,即可完成端到端模型的训练,得到按键识别模型。
在本实施例中,端到端模型中可包括编码器(encoder)和解码器(decoder)。编码器与解码器相连接。编码器与解码器可分别包含至少一层网络结构。例如,编码器和解码器可以采用RNN(Recurrent Neural Network,循环神经网络)、LSTM(Long Short-TermMemory,长短期记忆网络)等网络结构。
在一些示例中,端到端模型可以是transformer(转换器)模型。transformer模型是一种基于注意力机制(Attention)的网络模型。transformer模型中的编码器可以包含多层网络结构(例如6层相同的网络结构)。每层网络结构中又可以包含两个子层,分别为自注意力(self-attention)层和前馈神经网络(Feed forward)层。编码器能够对输入至模型的输入串进行编码,从而生成编码向量序列。上述自注意力层可提供注意力机制。使用自注意力机制的transformer模型能够对输入串的语义进行更为充分的理解。transformer模型中的解码器也可以包含多层网络结构(例如6层相同的网络结构)。每层网络结构中又可以包含三个子层,分别为两层自注意力(self-attention)层和一层前馈神经网络(Feedforward)层。编码器能够对解码器输出的编码向量序列进行进一步的分析处理,输出预测出的与输入串对应的候选项。
在又一些示例中,端到端模型可采用包含transformer结构的其他模型,如BERT(Bidirectional Encoder Representations from Transformer,基于转换器的双向编码器表示)模型等。BERT模型是一种应用于自然语言处理任务的开源的语言模型。BERT模型包含多层transformer结构(具体为transformer结构中的编码器(encoder))。因此通过BERT得到的编码向量与传统的编码向量相比更具有全局性。
在本实施例的一些可选的实现方式中,参见图2所示的按键识别模型的训练过程的流程,按键识别模型可以通过如下子步骤S11至子步骤S13训练得到:
子步骤S11,从用户的历史行为数据中,提取多个历史按键行为信息序列。
此处,用户的历史行为数据可以是用户历史输入过程中所产生的行为数据。该行为数据既可以是单个用户(如步骤101中所提到的用户)的行为数据,也可以是多个用户(如全量用户、部分满足特定条件的用户)的行为数据,此处不作具体限定。其中,若使用多个用户的行为数据进行模型训练,则上述多个用户中可包括步骤101中所提到的用户。用户行为数据中可包括各次历史输入过程中的历史按键行为信息。将每一次历史输入过程所产生的历史按键行为信息按照时间先后顺序进行汇总,即可得到一个历史按键行为信息序列。
子步骤S12,确定各历史按键行为信息序列对应的历史按键序列。
此处,历史按键序列即为用户意图输入的按键序列。用户每次历史输入过程连续点击若干按键后,会进行候选项的上屏。基于用户上屏的候选项,即可得知用户意图输入的按键序列。
具体地,上述执行主体可以首先从历史输入数据中查询各历史按键行为信息序列对应的历史上屏候选项。之后,确定对各历史上屏候选项上屏所需的按键序列,从而得到各历史按键行为信息序列对应的历史按键序列。其中,历史按键行为既可以包括准确的按键行为,也可以包括误触行为。由此,模型可自动识别用户输入中的误触行为,并且进行纠正。
其中,对历史上屏候选项上屏所需的按键序列可结合用户的输入方式(如全拼、简拼等)确定。作为示例,某一历史输入过程中,用户使用全拼方式依次点击了若干按键后,上屏了“输入法”,此时可将“输入法”对应的拼音串为“shurufa”作为历史按键序列。作为又一示例,用户使用简拼方式依次点击了若干按键后,上屏了“动物园”,此时可将“动物园”对应的简拼串为“dwy”作为历史按键序列。需要说明的是,确定历史上屏候选项上屏所需的按键序列不限于结合用户的输入方式,还可以结合更多的信息,如用户的按键次数、用户所使用的键盘类型(如九键、26键等)等,此处不作限定。
子步骤S13,基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型。
此处,可以将每个历史按键行为信息序列和对应历史按键序列汇总为一个样本,得到样本集。而后,将样本集中的历史按键行为信息序列作为端到端模型的输入,基于输入的历史按键行为信息序列对应的历史按键序列,对端到端模型进行有监督训练,得到按键识别模型。
在训练过程中,可以逐一地将样本中的历史按键行为信息序列输入至端到端模型,得到端到端模型输出的识别结果(即识别出的按键序列)。而后,可以基于识别结果与所输入的历史按键行为信息序列对应的历史按键序列,确定端到端模型的损失值。上述损失值为损失函数(loss function)的值,损失函数是一个非负实值函数,可以用于表征检测结果与真实结果的差异。一般情况下,损失值越小,模型的鲁棒性就越好。损失函数可以根据实际需求来设置。之后,可以利用该损失值,更新端到端模型的参数。由此,每输入一次历史按键行为信息序列,可以基于该历史按键行为信息序列对应的历史按键序列,对端到端模型的参数进行一次更新,直至训练完成。
实践中,可以通过多种方式确定是否训练完成。作为示例,当端到端模型输出的识别结果的准确性达到预设值时(例如99%),可确定训练完成。作为又一示例,若端到端模型的训练次数等于预设次数时,可以确定训练完成。此处,若端到端模型训练完成,即可将训练后的端到端模型作为按键识别模型,以用于对用户的实时按键行为对应的按键序列进行识别。
需要说明的是,在初次训练按键识别模型或者按照特定周期更新按键识别模型时,可使用特定群体或全量用户的历史行为数据作为训练数据。在将按键识别模型部署于某个用户的客户端后,可实时地使用该用户的行为数据更新该按键识别模型,以使该按键识别模型适配该用户的输入习惯。
本申请的上述实施例提供的方法,通过获取用户输入过程中的按键行为信息,得到待测按键行为信息序列,从而将待测按键行为信息序列输入至预先训练的按键识别模型,得到待测按键行为信息序列对应的目标按键序列。由于按键识别模型为端到端模型且基于历史按键行为信息序列和上述历史按键行为信息序列对应的历史按键序列训练得到,因而按键识别模型可从训练数据中学习到按键行为信息序列与按键序列的对应关系和转换规则,无需进行多种规则(如按键转换规则、误触识别规则等)的设定,降低了按键识别的复杂度。同时,省略了现有技术中通过多个规则得到按键识别结果的中间过程,提高了按键识别效率。
进一步参考图3,其示出了按键识别方法的又一个实施例的流程300。该按键识别方法的流程300,包括以下步骤:
步骤301,获取用户输入过程中的按键行为信息,得到待测按键行为信息序列。
本实施例的步骤301可参见图1对应实施例的步骤101,此处不再赘述。
在本实施例的一些可选的实现方式中,按键行为信息可以包括以下至少一项:触摸力度、触摸时长、触摸按下坐标、触摸抬起坐标、按键时的手势信息。
在本实施例的一些可选的实现方式中,执行主体中可以安装有信息采集装置,输入手势信息通过信息采集装置获取,信息采集装置包括以下至少一项:摄像头、陀螺仪。
步骤302,将待测按键行为信息序列输入至预先训练的按键识别模型,得到待测按键行为信息序列对应的目标按键序列。
本实施例的步骤302可参见图1对应实施例的步骤102,此处不再赘述。
在本实施例的一些可选的实现方式中,按键识别模型可以通过如下步骤训练得到:从用户的历史行为数据中,提取多个历史按键行为信息序列;确定各历史按键行为信息序列对应的历史按键序列;基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型。
在本实施例的一些可选的实现方式中,确定各历史按键行为信息序列对应的历史按键序列,包括:从历史输入数据中,查询各历史按键行为信息序列对应的历史上屏候选项;确定对各历史上屏候选项上屏所需的按键序列,得到各历史按键行为信息序列对应的历史按键序列。
在本实施例的一些可选的实现方式中,基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型,包括:将每个历史按键行为信息序列和对应历史按键序列汇总为一个样本,得到样本集;将样本集中的历史按键行为信息序列作为端到端模型的输入,基于输入的历史按键行为信息序列对应的历史按键序列,对端到端模型进行有监督训练,得到按键识别模型。
步骤303,显示目标按键序列对应的至少一个候选项。
在本实施例中,在得到待测按键行为信息序列对应的目标按键序列后,按键识别方法的执行主体可以在输入界面中(如在输入法界面的候选栏中)展示目标按键序列对应的至少一个候选项。需要说明的是,候选项的展示方式和展示样式可以根据需要预先设定,此处不作限定。用户可通过选取其中一个候选项,实现对所选中的候选项的上屏。
步骤304,在检测到用户对至少一个候选项中的任一候选项上屏时,将用户上屏的候选项作为目标候选项,确定目标候选项对应的按键序列。
在本实施例中,在检测到用户对至少一个候选项中的任一候选项上屏时,上述执行主体可以将用户上屏的候选项作为目标候选项,确定目标候选项对应的按键序列。例如,用户采用全拼方式输入其上屏的候选项为“输入法”,则对应的正确的按键序列应为“shurufa”。
步骤305,响应于目标候选项对应的按键序列与目标按键序列不同,基于待测按键行为信息序列和目标候选项对应的按键序列,对按键识别模型进行再训练,以更新按键识别模型。
在本实施例中,上述执行主体可以检测目标候选项对应的按键序列与目标按键序列是否相同。响应于目标候选项对应的按键序列与目标按键序列不同,可以认为按键识别模型输出的目标按键序列有误,可将待测按键行为信息序列和目标候选项对应的按键序列组成一个新样本,利用该新样本对按键识别模型进行再训练,以更新按键识别模型。再训练的方式与初次训练按键识别模型的方式基本相同,此处不再赘述。
从图3中可以看出,与图1对应的实施例相比,本实施例中的按键识别方法的流程300涉及了基于待测按键行为信息序列和目标候选项对应的按键序列,对按键识别模型进行再训练的步骤,由此,按键识别模型可基于用户实时输入情况进行实时动态地更新,因此可以学习到最新的按键识别规则,提高了按键识别模型的准确性。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种按键识别装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例上述的按键识别装置400包括:获取单元401,被配置成获取用户输入过程中的按键行为信息,得到待测按键行为信息序列;输入单元402,被配置成将上述待测按键行为信息序列输入至预先训练的按键识别模型,得到上述待测按键行为信息序列对应的目标按键序列,上述按键识别模型为端到端模型,上述按键识别模型基于历史按键行为信息序列和上述历史按键行为信息序列对应的历史按键序列训练得到。
在本实施例的一些可选的实现方式中,上述按键识别模型通过如下步骤训练得到:从用户的历史行为数据中,提取多个历史按键行为信息序列;确定各历史按键行为信息序列对应的历史按键序列;基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型
在本实施例的一些可选的实现方式中,上述确定各历史按键行为信息序列对应的历史按键序列,包括:从上述历史输入数据中,查询各历史按键行为信息序列对应的历史上屏候选项;确定对各历史上屏候选项上屏所需的按键序列,得到各历史按键行为信息序列对应的历史按键序列。
在本实施例的一些可选的实现方式中,上述基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型,包括:将每个历史按键行为信息序列和对应历史按键序列汇总为一个样本,得到样本集;将上述样本集中的历史按键行为信息序列作为端到端模型的输入,基于上述输入的历史按键行为信息序列对应的历史按键序列,对上述端到端模型进行有监督训练,得到按键识别模型。
在本实施例的一些可选的实现方式中,上述装置还包括再训练单元,被配置成:显示上述目标按键序列对应的至少一个候选项;在检测到用户对上述至少一个候选项中的任一候选项上屏时,将用户上屏的候选项作为目标候选项,确定上述目标候选项对应的按键序列;响应于目标候选项对应的按键序列与上述目标按键序列不同,基于上述待测按键行为信息序列和上述目标候选项对应的按键序列,对上述按键识别模型进行再训练,以更新上述按键识别模型。
在本实施例的一些可选的实现方式中,上述按键行为信息包括以下至少一项:触摸力度、触摸时长、触摸按下坐标、触摸抬起坐标、按键时的手势信息。
在本实施例的一些可选的实现方式中,上述方法应用于电子设备,上述电子设备中安装有信息采集装置,上述输入手势信息通过上述信息采集装置获取,上述信息采集装置包括以下至少一项:摄像头、陀螺仪。
本申请的上述实施例提供的装置,通过获取用户输入过程中的按键行为信息,得到待测按键行为信息序列,从而将待测按键行为信息序列输入至预先训练的按键识别模型,得到待测按键行为信息序列对应的目标按键序列。由于按键识别模型为端到端模型且基于历史按键行为信息序列和上述历史按键行为信息序列对应的历史按键序列训练得到,因而按键识别模型可从训练数据中学习到按键行为信息序列与按键序列的对应关系和转换规则,无需进行多种规则(如按键转换规则、误触识别规则等)的设定,降低了按键识别的复杂度。同时,省略了现有技术中通过多个规则得到按键识别结果的中间过程,提高了按键识别效率。
图5是根据一示例性实施例示出的用于识别按键的装置500的框图,该装置500可以为智能终端或者服务器。例如,装置500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,输入/输出(I/O)的接口512,传感器组件514,以及通信组件516。
处理组件502通常控制装置500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在装置500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件506为装置500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。
多媒体组件508包括在上述装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。上述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与上述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
I/O接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为装置500提供各个方面的状态评估。例如,传感器组件514可以检测到设备500的打开/关闭状态,组件的相对定位,例如上述组件为装置500的显示器和小键盘,传感器组件514还可以检测装置500或装置500一个组件的位置改变,用户与装置500接触的存在或不存在,装置500方位或加速/减速和装置500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,上述通信组件516还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由装置500的处理器520执行以完成上述方法。例如,上述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图6是本申请的一些实施例中服务器的结构示意图。该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在服务器600上执行存储介质630中的一系列指令操作。
服务器600还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,一个或一个以上键盘656,和/或,一个或一个以上操作系统641,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当上述存储介质中的指令由装置(智能终端或者服务器)的处理器执行时,使得装置能够执行一种按键识别方法,上述方法包括:获取用户输入过程中的按键行为信息,得到待测按键行为信息序列;将所述待测按键行为信息序列输入至预先训练的按键识别模型,得到所述待测按键行为信息序列对应的目标按键序列,所述按键识别模型为端到端模型,所述按键识别模型基于历史按键行为信息序列和所述历史按键行为信息序列对应的历史按键序列训练得到。
可选的,所述按键识别模型通过如下步骤训练得到:从用户的历史行为数据中,提取多个历史按键行为信息序列;确定各历史按键行为信息序列对应的历史按键序列;基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型。
可选的,所述确定各历史按键行为信息序列对应的历史按键序列,包括:从所述历史输入数据中,查询各历史按键行为信息序列对应的历史上屏候选项;确定对各历史上屏候选项上屏所需的按键序列,得到各历史按键行为信息序列对应的历史按键序列。
可选的,所述基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型,包括:将每个历史按键行为信息序列和对应历史按键序列汇总为一个样本,得到样本集;将所述样本集中的历史按键行为信息序列作为端到端模型的输入,基于所述输入的历史按键行为信息序列对应的历史按键序列,对所述端到端模型进行有监督训练,得到按键识别模型。
可选的,所述装置经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:显示所述目标按键序列对应的至少一个候选项;在检测到用户对所述至少一个候选项中的任一候选项上屏时,将用户上屏的候选项作为目标候选项,确定所述目标候选项对应的按键序列;响应于目标候选项对应的按键序列与所述目标按键序列不同,基于所述待测按键行为信息序列和所述目标候选项对应的按键序列,对所述按键识别模型进行再训练,以更新所述按键识别模型。
可选的,所述按键行为信息包括以下至少一项:触摸力度、触摸时长、触摸按下坐标、触摸抬起坐标、按键时的手势信息。
可选的,所述方法应用于电子设备,所述电子设备中安装有信息采集装置,所述输入手势信息通过所述信息采集装置获取,所述信息采集装置包括以下至少一项:摄像头、陀螺仪。
本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
以上上述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
以上对本申请所提供的一种按键识别方法、装置和一种用于识别按键的装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (15)
1.一种按键识别方法,其特征在于,所述方法包括:
获取用户输入过程中的按键行为信息,得到待测按键行为信息序列;
将所述待测按键行为信息序列输入至预先训练的按键识别模型,得到所述待测按键行为信息序列对应的目标按键序列,所述按键识别模型为端到端模型,所述按键识别模型基于历史按键行为信息序列和所述历史按键行为信息序列对应的历史按键序列训练得到。
2.根据权利要求1所述的方法,其特征在于,所述按键识别模型通过如下步骤训练得到:
从用户的历史行为数据中,提取多个历史按键行为信息序列;
确定各历史按键行为信息序列对应的历史按键序列;
基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型。
3.根据权利要求2所述的方法,其特征在于,所述确定各历史按键行为信息序列对应的历史按键序列,包括:
从所述历史输入数据中,查询各历史按键行为信息序列对应的历史上屏候选项;
确定对各历史上屏候选项上屏所需的按键序列,得到各历史按键行为信息序列对应的历史按键序列。
4.根据权利要求2所述的方法,其特征在于,所述基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型,包括:
将每个历史按键行为信息序列和对应历史按键序列汇总为一个样本,得到样本集;
将所述样本集中的历史按键行为信息序列作为端到端模型的输入,基于所述输入的历史按键行为信息序列对应的历史按键序列,对所述端到端模型进行有监督训练,得到按键识别模型。
5.根据权利要求1所述的方法,其特征在于,在得到所述待测按键行为信息序列对应的目标按键序列之后,所述方法还包括:
显示所述目标按键序列对应的至少一个候选项;
在检测到用户对所述至少一个候选项中的任一候选项上屏时,将用户上屏的候选项作为目标候选项,确定所述目标候选项对应的按键序列;
响应于目标候选项对应的按键序列与所述目标按键序列不同,基于所述待测按键行为信息序列和所述目标候选项对应的按键序列,对所述按键识别模型进行再训练,以更新所述按键识别模型。
6.根据权利要求1所述的方法,其特征在于,所述按键行为信息包括以下至少一项:触摸力度、触摸时长、触摸按下坐标、触摸抬起坐标、按键时的手势信息。
7.根据权利要求6所述的方法,其特征在于,所述方法应用于电子设备,所述电子设备中安装有信息采集装置,所述输入手势信息通过所述信息采集装置获取,所述信息采集装置包括以下至少一项:摄像头、陀螺仪。
8.一种按键识别装置,其特征在于,所述装置包括:
获取单元,被配置成获取用户输入过程中的按键行为信息,得到待测按键行为信息序列;
输入单元,被配置成将所述待测按键行为信息序列输入至预先训练的按键识别模型,得到所述待测按键行为信息序列对应的目标按键序列,所述按键识别模型为端到端模型,所述按键识别模型基于历史按键行为信息序列和所述历史按键行为信息序列对应的历史按键序列训练得到。
9.根据权利要求8所述的装置,其特征在于,所述按键识别模型通过如下步骤训练得到:
从用户的历史行为数据中,提取多个历史按键行为信息序列;
确定各历史按键行为信息序列对应的历史按键序列;
基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型。
10.根据权利要求9所述的装置,其特征在于,所述确定各历史按键行为信息序列对应的历史按键序列,包括:
从所述历史输入数据中,查询各历史按键行为信息序列对应的历史上屏候选项;
确定对各历史上屏候选项上屏所需的按键序列,得到各历史按键行为信息序列对应的历史按键序列。
11.根据权利要求9所述的装置,其特征在于,所述基于各历史按键行为信息序列和历史按键序列的对应关系,对端到端模型进行有监督训练,得到按键识别模型,包括:
将每个历史按键行为信息序列和对应历史按键序列汇总为一个样本,得到样本集;
将所述样本集中的历史按键行为信息序列作为端到端模型的输入,基于所述输入的历史按键行为信息序列对应的历史按键序列,对所述端到端模型进行有监督训练,得到按键识别模型。
12.根据权利要求8所述的装置,其特征在于,所述装置还包括再训练单元,被配置成:
显示所述目标按键序列对应的至少一个候选项;
在检测到用户对所述至少一个候选项中的任一候选项上屏时,将用户上屏的候选项作为目标候选项,确定所述目标候选项对应的按键序列;
响应于目标候选项对应的按键序列与所述目标按键序列不同,基于所述待测按键行为信息序列和所述目标候选项对应的按键序列,对所述按键识别模型进行再训练,以更新所述按键识别模型。
13.根据权利要求8所述的方法,其特征在于,所述按键行为信息包括以下至少一项:触摸力度、触摸时长、触摸按下坐标、触摸抬起坐标、按键时的手势信息。
14.一种用于识别按键的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,所述程序被一个或者一个以上处理器执行时,实现权利要求1-7中任一所述方法的步骤。
15.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110702389.4A CN115509371A (zh) | 2021-06-22 | 2021-06-22 | 一种按键识别方法、装置和用于识别按键的装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110702389.4A CN115509371A (zh) | 2021-06-22 | 2021-06-22 | 一种按键识别方法、装置和用于识别按键的装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115509371A true CN115509371A (zh) | 2022-12-23 |
Family
ID=84499539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110702389.4A Pending CN115509371A (zh) | 2021-06-22 | 2021-06-22 | 一种按键识别方法、装置和用于识别按键的装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115509371A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109358802A (zh) * | 2018-10-11 | 2019-02-19 | 科大讯飞股份有限公司 | 一种信息输入方法、装置、设备及可读存储介质 |
CN110389666A (zh) * | 2018-04-16 | 2019-10-29 | 北京搜狗科技发展有限公司 | 一种输入纠错方法和装置 |
CN110764647A (zh) * | 2019-10-21 | 2020-02-07 | 科大讯飞股份有限公司 | 输入纠错方法、装置、电子设备和存储介质 |
CN110874145A (zh) * | 2018-08-30 | 2020-03-10 | 北京搜狗科技发展有限公司 | 一种输入方法、装置及电子设备 |
CN111665955A (zh) * | 2020-04-17 | 2020-09-15 | 北京百度网讯科技有限公司 | 候选字符串的处理方法、装置、电子设备及存储介质 |
CN111708477A (zh) * | 2020-06-09 | 2020-09-25 | 北京百度网讯科技有限公司 | 按键识别方法、装置、设备以及存储介质 |
-
2021
- 2021-06-22 CN CN202110702389.4A patent/CN115509371A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110389666A (zh) * | 2018-04-16 | 2019-10-29 | 北京搜狗科技发展有限公司 | 一种输入纠错方法和装置 |
CN110874145A (zh) * | 2018-08-30 | 2020-03-10 | 北京搜狗科技发展有限公司 | 一种输入方法、装置及电子设备 |
CN109358802A (zh) * | 2018-10-11 | 2019-02-19 | 科大讯飞股份有限公司 | 一种信息输入方法、装置、设备及可读存储介质 |
CN110764647A (zh) * | 2019-10-21 | 2020-02-07 | 科大讯飞股份有限公司 | 输入纠错方法、装置、电子设备和存储介质 |
CN111665955A (zh) * | 2020-04-17 | 2020-09-15 | 北京百度网讯科技有限公司 | 候选字符串的处理方法、装置、电子设备及存储介质 |
CN111708477A (zh) * | 2020-06-09 | 2020-09-25 | 北京百度网讯科技有限公司 | 按键识别方法、装置、设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107436691B (zh) | 一种输入法进行纠错的方法、客户端、服务器及装置 | |
CN107688399B (zh) | 一种输入方法和装置、一种用于输入的装置 | |
CN107544684B (zh) | 一种候选词显示方法及装置 | |
CN108958503A (zh) | 输入方法和装置 | |
CN107132927B (zh) | 输入字符的识别方法及装置和用于识别输入字符的装置 | |
CN107797676B (zh) | 一种单字输入方法及装置 | |
CN107422921B (zh) | 一种输入方法、装置、电子设备以及存储介质 | |
CN113936697B (zh) | 语音处理方法、装置以及用于语音处理的装置 | |
CN108073291B (zh) | 一种输入方法和装置、一种用于输入的装置 | |
CN110554780A (zh) | 一种滑行输入的方法和装置 | |
CN110795014A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN112306251A (zh) | 一种输入方法、装置和用于输入的装置 | |
CN113805707A (zh) | 一种输入方法、装置和用于输入的装置 | |
CN115509371A (zh) | 一种按键识别方法、装置和用于识别按键的装置 | |
CN113407099A (zh) | 输入方法、装置和机器可读介质 | |
CN113741783B (zh) | 按键识别方法、装置和用于识别按键的装置 | |
CN113515618A (zh) | 语音处理方法、装置和介质 | |
CN111103986A (zh) | 用户词库管理方法及装置、输入方法及装置 | |
CN114442816B (zh) | 一种联想预取方法、装置和用于联想预取的装置 | |
CN115454259A (zh) | 一种输入方法、装置和用于输入的装置 | |
US20230196001A1 (en) | Sentence conversion techniques | |
CN113220208B (zh) | 一种数据处理方法、装置和电子设备 | |
CN114967939B (zh) | 输入方法、装置和介质 | |
CN112925423B (zh) | 一种动态纠错方法、装置和用于动态纠错的装置 | |
CN111124142B (zh) | 一种输入方法、装置和用于输入的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |