CN109582930B - 一种滑动输入解码方法、装置及电子设备 - Google Patents

一种滑动输入解码方法、装置及电子设备 Download PDF

Info

Publication number
CN109582930B
CN109582930B CN201710908748.5A CN201710908748A CN109582930B CN 109582930 B CN109582930 B CN 109582930B CN 201710908748 A CN201710908748 A CN 201710908748A CN 109582930 B CN109582930 B CN 109582930B
Authority
CN
China
Prior art keywords
decoded
preset
track
sample
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710908748.5A
Other languages
English (en)
Other versions
CN109582930A (zh
Inventor
高淼
贾倪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Internet Security Software Co Ltd
Original Assignee
Beijing Kingsoft Internet Security Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Internet Security Software Co Ltd filed Critical Beijing Kingsoft Internet Security Software Co Ltd
Priority to CN201710908748.5A priority Critical patent/CN109582930B/zh
Publication of CN109582930A publication Critical patent/CN109582930A/zh
Application granted granted Critical
Publication of CN109582930B publication Critical patent/CN109582930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种滑动输入解码方法、装置及电子设备,该方法包括:获得待解码滑动轨迹对应的待解码轨迹字符串;基于包含每一预设字符与索引的对应关系的预设编码规则,对待解码轨迹字符串进行编码,获得待解码轨迹索引串;基于预设滑动输入解码网络模型以及待解码轨迹索引串,确定待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,每一解码概率包括:所对应待解码轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率;依据所确定的待解码轨迹索引串中每一待解码轨迹索引所处位置对应的解码概率,确定待解码滑动轨迹对应的解码所得的单词。应用本发明实施例,以实现得到解码准确率高的滑动输入解码方式。

Description

一种滑动输入解码方法、装置及电子设备
技术领域
本发明涉及信息输入技术领域,特别是涉及一种滑动输入解码方法、装置及电子设备。
背景技术
滑动输入作为一种高效的用于终端设备的输入方式,得到迅猛发展。滑动输入不同于传统的点击输入,滑动输入需要借助于用户的手指或触摸笔等在电子设备的触摸屏中的虚拟键盘区域,通过滑动来选择字符,其滑动顺序为要输入的字符输入序列的先后顺序,手指或触摸笔等抬起,即手指或触摸笔等离开屏幕时代表输入完毕,以滑出一条连续的轨迹;后续的通过解码上述轨迹,以得到相应的字符输入序列,即解码得到用户所需输入的单词。
然而,由于滑动的轨迹具有很强的变化性以及随机性,而且滑动过程中可能会引入抖动等噪声的,给解码上述滑动轨迹以得到相应的字符输入序列带来一定的挑战。
那么,如何提供一种解码准确率高的滑动输入解码方式,成为亟待解决的问题。
发明内容
本发明实施例的目的在于提供一种滑动输入解码方法、装置及电子设备,以实现得到解码准确率高的滑动输入解码方式。具体技术方案如下:
一方面,本发明实施例提供了一种滑动输入解码方法,所述方法包括:
获得待解码滑动轨迹对应的待解码轨迹字符串;
基于预设编码规则,对所述待解码轨迹字符串进行编码,获得待解码轨迹索引串,其中,所述预设编码规则包含:每一预设字符与索引的对应关系;
基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,其中,每一解码概率包括:所对应待解码轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率,所述预设标识为:用于表征每一待解码轨迹索引所处位置不输出任一预设字符的标识,所述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,每一样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,每一样本单词索引串为:根据所对应样本单词确定的一串索引;
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
可选地,所述待解码滑动轨迹中包含至少一个第一采样点;
所述获得待解码滑动轨迹对应的待解码轨迹字符串的步骤,包括:
获得对应预设键盘的待解码滑动轨迹,所述预设键盘中包含所述预设字符;
根据每一预设字符在所述预设键盘中的位置以及所述待解码滑动轨迹中每一第一采样点在所述预设键盘中的位置,确定所述待解码滑动轨迹中每一第一采样点对应的预设字符,得到所述待解码滑动轨迹对应的待解码轨迹字符串。
可选地,在所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率的步骤之前,所述方法还包括:训练得到所述预设滑动输入解码网络模型的过程,其中,所述过程包括:
获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串;
基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型。
可选地,所述获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串的步骤,包括:
获得多个样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串,其中,所述样本滑动轨迹中包含至少一个第二采样点,所述样本滑动轨迹为:对应预设键盘获得的滑动轨迹,所述预设键盘中包含所述预设字符;
针对每一样本滑动轨迹,根据每一预设字符在所述预设键盘中的位置以及所述样本滑动轨迹中每一第二采样点在所述预设键盘中的位置,确定所述样本滑动轨迹中每一第二采样点对应的预设字符,得到所述样本滑动轨迹对应的样本轨迹字符串;
针对每一样本单词字符串,对所述样本单词字符串中连续的重复的字符进行去重处理,获得处理后的样本单词字符串;
从所获得的处理后的样本单词字符串中,确定出满足预设保留条件的样本单词字符串,其中,所述满足预设保留条件为:不为任一样本轨迹字符串的字符串子集的条件;
针对每一满足所述预设保留条件的样本单词字符串,利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串进行编码,得到样本单词索引串;
并利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串对应的样本轨迹字符串进行编码,得到样本轨迹索引串。
可选地,所述初始滑动输入解码网络模型包括:预设嵌入层和概率评估层,其中,所述概率评估层包括:第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层;
所述基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型的步骤,包括:
随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于所述特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量;
将该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量,输入所述概率评估层,基于所述概率评估层中的所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层,对所述样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量进行概率评估,获得所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率,其中,每一当前概率包括:样本轨迹索引所处位置输出每一预设字符的概率以及输出所述预设标识的概率;
将所获得的所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率与所对应的样本单词索引串进行匹配;
当匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型;
当匹配不成功时,调整所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的参数;重新执行所述随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于所述特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量的步骤;
直至匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型。
可选地,所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率的步骤,包括:
将所述待解码轨迹索引串输入所述预设滑动输入解码网络模型;
所述预设滑动输入解码网络模型,基于所述特征向量,对所述待解码轨迹索引串进行所述嵌入编码,获得所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量;
所述预设滑动输入解码网络模型,对所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量进行概率评估,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率。
可选地,所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串的步骤,包括:
采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
可选地,所述采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串的步骤,包括:
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串,其中,所述预设词典模型包含:预设单词字符串以及每一预设单词字符串中每一预设字符之间的连接关系。
可选地,在所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串的步骤之后,所述方法还包括:
获得在所述待解码滑动轨迹之前所输入的单词字符串,作为历史单词字符串;
利用所述历史单词字符串、所确定的待解码滑动轨迹对应的解码所得的单词字符串以及预设语言模型,确定所述待解码滑动轨迹对应的解码所得的每一单词字符串与所述历史单词的连接关系,其中,所述预设语言模型包含:预设单词字符串组以及每一预设单词字符串组中各个单词字符串之间的连接关系;
基于所确定的连接关系,对所述待解码滑动轨迹对应的解码所得的单词字符串进行排序;
以排序顺序展示所述待解码滑动轨迹对应的解码所得的单词字符串。
另一方面,本发明实施例提供了一种滑动输入解码装置,所述装置包括:
第一获得模块,用于获得待解码滑动轨迹对应的待解码轨迹字符串;
第二获得模块,用于基于预设编码规则,对所述待解码轨迹字符串进行编码,获得待解码轨迹索引串,其中,所述预设编码规则包含:每一预设字符与索引的对应关系;
第一确定模块,用于基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,其中,每一解码概率包括:所对应待解码轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率,所述预设标识为:用于表征每一待解码轨迹索引所处位置不输出任一预设字符的标识,所述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,每一样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,每一样本单词索引串为:根据所对应样本单词确定的一串索引;
第二确定模块,用于依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
可选地,所述待解码滑动轨迹中包含至少一个第一采样点;
所述第一获得模块,具体用于获得对应预设键盘的待解码滑动轨迹,所述预设键盘中包含所述预设字符;
根据每一预设字符在所述预设键盘中的位置以及所述待解码滑动轨迹中每一第一采样点在所述预设键盘中的位置,确定所述待解码滑动轨迹中每一第一采样点对应的预设字符,得到所述待解码滑动轨迹对应的待解码轨迹字符串。
可选地,所述装置还包括训练得到模块,所述训练得到模块,用于训练得到所述预设滑动输入解码网络模型,其中,所述训练得到模块包括:获得单元和训练得到单元;
所述获得单元,用于在所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率之前,获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串;
所述训练得到单元,用于基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型。
可选地,所述获得单元,具体用于
获得多个样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串,其中,所述样本滑动轨迹中包含至少一个第二采样点,所述样本滑动轨迹为:对应预设键盘获得的滑动轨迹,所述预设键盘中包含所述预设字符;
针对每一样本滑动轨迹,根据每一预设字符在所述预设键盘中的位置以及所述样本滑动轨迹中每一第二采样点在所述预设键盘中的位置,确定所述样本滑动轨迹中每一第二采样点对应的预设字符,得到所述样本滑动轨迹对应的样本轨迹字符串;
针对每一样本单词字符串,对所述样本单词字符串中连续的重复的字符进行去重处理,获得处理后的样本单词字符串;
从所获得的处理后的样本单词字符串中,确定出满足预设保留条件的样本单词字符串,其中,所述满足预设保留条件为:不为任一样本轨迹字符串的字符串子集的条件;
针对每一满足所述预设保留条件的样本单词字符串,利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串进行编码,得到样本单词索引串;
并利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串对应的样本轨迹字符串进行编码,得到样本轨迹索引串。
可选地,所述初始滑动输入解码网络模型包括:预设嵌入层和概率评估层,其中,所述概率评估层包括:第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层;
所述训练得到单元包括第一输入子模块、第二输入子模块、匹配子模块、获得子模块和调整子模块;
所述第一输入子模块,用于随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于所述特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量;
所述第二输入子模块,用于将该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量,输入所述概率评估层,基于所述概率评估层中的所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层,对所述样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量进行概率评估,获得所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率,其中,每一当前概率包括:样本轨迹索引所处位置输出每一预设字符的概率以及输出所述预设标识的概率;
所述匹配子模块,用于将所获得的所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率与所对应的样本单词索引串进行匹配;
所述获得子模块,用于当匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型;
所述调整子模块,用于当匹配不成功时,调整所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的参数;重新触发所述第一输入子模块;
直至匹配成功时,触发所述获得子模块。
可选地,所述第一确定模块,具体用于
将所述待解码轨迹索引串输入所述预设滑动输入解码网络模型;
所述预设滑动输入解码网络模型,基于所述特征向量,对所述待解码轨迹索引串进行所述嵌入编码,获得所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量;
所述预设滑动输入解码网络模型,对所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量进行概率评估,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率。
可选地,所述第二确定模块,具体用于:
采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
可选地,所述第二确定模块,具体用于:
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,获得所述待解码滑动轨迹对应的解码所得的单词字符串,其中,所述预设词典模型包含:预设单词字符串以及每一预设单词字符串中每一预设字符之间的连接关系。
可选地,所述装置还包括第三获得模块、第三确定模块、排序模块和展示模块;
所述第三获得模块,用于在所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串之后,获得在所述待解码滑动轨迹之前所输入的单词字符串,作为历史单词字符串;
所述第三确定模块,用于利用所述历史单词字符串、所确定的待解码滑动轨迹对应的解码所得的单词字符串以及预设语言模型,确定所述待解码滑动轨迹对应的解码所得的每一单词字符串与所述历史单词的连接关系,其中,所述预设语言模型包含:预设单词字符串组以及每一预设单词字符串组中各个单词字符串之间的连接关系;
所述排序模块,用于基于所确定的连接关系,对所述待解码滑动轨迹对应的解码所得的单词字符串进行排序;
所述展示模块,用于以排序顺序展示所述待解码滑动轨迹对应的解码所得的单词字符串。
另一方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的计算机程序时,实现本发明实施例所提供的上述任一所述的滑动输入解码方法步骤。
另一方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例所提供的上述任一所述的滑动输入解码方法步骤。
本发明实施例中,获得待解码滑动轨迹对应的待解码轨迹字符串;基于预设编码规则,对待解码轨迹字符串进行编码,获得待解码轨迹索引串,其中,预设编码规则包含:每一预设字符与索引的对应关系;基于预设滑动输入解码网络模型以及待解码轨迹索引串,确定待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,其中,每一解码概率包括:待解码轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率,预设标识为:用于表征每一待解码轨迹索引所处位置不输出任一预设字符的标识,预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,每一样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,每一样本单词索引串为:根据所对应样本单词字符串确定的一串索引;依据所确定的待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定待解码滑动轨迹对应的解码所得的单词字符串。
可见,本发明实施例中,上述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,上述样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,上述样本滑动轨迹为在真实滑动环境下获得的轨迹,基于上述在真实滑动环境下获得的轨迹以及上述轨迹对应的样本单词,所训练所得的模型,更能很好的解码得到在真实滑动环境下所获得的待解码滑动轨迹对应的单词字符串,即用户所需输入的单词,以实现得到解码准确率高的滑动输入解码方式。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的一种滑动输入解码方法的流程示意图;
图2为本发明实施例所得到的概率矩阵的一种示意图;
图3为得到预设滑动输入解码网络模型的流程示意图;
图4为获得样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串的一种流程示意图;
图5为训练初始滑动输入解码网络模型的一种流程示意图;
图6为一种LSTM Cell的结构示意图;
图7A为预设词典模型的一种结构示意图;
图7B为预设语言模型的一种结构示意图;
图8为本发明实施例所提供的一种滑动输入解码装置的结构示意图;
图9为本发明实施例所提供的训练得到模块的结构示意图;
图10为本发明实施例所提供的训练得到单元的结构示意图;
图11为本发明实施例所提供的一种滑动输入解码装置的另一结构示意图;
图12为本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种滑动输入解码方法、装置及电子设备,以实现得到解码准确率高的滑动输入解码方式。
如图1所示,本发明实施例提供了一种滑动输入解码方法,可以包括如下步骤:
S101:获得待解码滑动轨迹对应的待解码轨迹字符串;
本发明实施例所提供的一种滑动输入解码方法,可以应用于任一基于触摸屏的电子设备中,该电子设备可以支持滑动输入方式。该电子设备可以为电脑、智能手机以及游戏机等等。其中,实现本发明实施例所提供的滑动输入解码方法的功能软件,可以是专门的客户端软件,也可以是任一能够支持滑动输入功能的客户端软件的插件,例如:输入法客户端软件等等,这都是合理的。
在一种实现方式中,电子设备可以获得用户滑动输入所生成的滑动轨迹,本发明实施例中可以称上述滑动轨迹为待解码滑动轨迹。电子设备可以基于上述待解码滑动轨迹,获得待解码轨迹字符串。
可以理解的是,滑动轨迹由一系列在不同采样时刻所采样的采样点构成的,上述每一采样点基于其所对应采样时刻的先后顺序排列。本发明实施例中,可以认为滑动轨迹中的每一采样点所处位置为滑动轨迹中的一帧(frame)。可以理解的是,滑动轨迹中的每一采样点对应一预设字符,基于滑动轨迹中的每一采样点对应的预设字符,可以得到一串字符串,所得到的一串字符串为滑动轨迹对应的轨迹字符串。在轨迹字符串中,也可以认为每一字符所处位置为滑动轨迹对应的轨迹字符串中的一帧。在后续的轨迹索引串中,也可以认为每一索引所处位置为滑动轨迹对应的轨迹索引串中的一帧。
S102:基于预设编码规则,对待解码轨迹字符串进行编码,获得待解码轨迹索引串;
其中,预设编码规则可以包含:每一预设字符与索引的对应关系;
上述索引均具有唯一性,可以唯一表征预设字符。在一种实现方式中,上述预设字符可以为a~z26个字母中的任一字母,上述索引可以为0~25数值中的任一数值,其中,每一预设字符与索引的对应关系可以是a~z分别对应0~25,即a对应0、b对应1、c对应2……以此类推,z对应25。在另一种实现方式中,上述预设字符可以为a~z26个字母中的任一字母,或任一符号,如,逗号、句号、问号等。上述预设字符可以为字母、符号、数字等。
本发明实施例中,电子设备可以基于上述预设编码规则,对待解码轨迹字符串进行编码,获得待解码轨迹索引串;即电子设备可以依据上述每一预设字符与索引的对应关系,确定待解码轨迹字符串中每一字符对应的索引,并将上述待解码轨迹字符串中每一字符对应的索引,所组成的索引串作为上述待解码轨迹索引串。举例而言,上述预设字符为a~z26个字母中的任一字母,上述索引为0~25数值中的任一数值,其中,每一预设字符与索引的对应关系可以是a~z分别对应0~25,即a对应0、b对应1、c对应2……以此类推,z对应25;电子设备获得待解码滑动轨迹对应的待解码轨迹字符串为“t,t,y,u,o,h,g,f,d,s,a,f,y”,电子设备基于预设编码规则,对待解码轨迹字符串“t,t,y,u,o,h,g,f,d,s,a,f,y”进行编码,获得待解码轨迹索引串为“19,19,24,20,14,7,6,5,3,18,0,5,24”。
S103:基于预设滑动输入解码网络模型以及待解码轨迹索引串,确定待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率;
其中,每一解码概率包括:所对应待解码轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率,预设标识为:用于表征每一待解码轨迹索引所处位置不输出任一预设字符的标识,预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,每一样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,每一样本单词索引串为:根据所对应样本单词字符串确定的一串索引;
本步骤中,上述预设滑动输入解码网络模型可以为:基于样本数据预先训练所得的机器学习模型,上述样本数据可以包括上述的相对应的样本轨迹索引串以及样本单词索引串。
电子设备在训练上述机器学习模型时,可以首先获得上述训练所需的样本数据,即上述相对应的样本轨迹索引串以及样本单词索引串。电子设备获得上述相对应的样本轨迹索引串以及样本单词索引串的过程,可以是:电子设备首先获得样本滑动轨迹,以及样本滑动轨迹对应的样本单词字符串。其中,上述样本滑动轨迹可以是用户基于所需输入的单词,在预设键盘中进行滑动输入操作所生成的轨迹,上述所需输入的单词即可以作为本发明实施例中的样本单词字符串。可以理解的是,上述预设键盘中包含上述预设字符,上述样本滑动轨迹中包含多个采样点。
后续的,电子设备可以基于上述所获得的样本滑动轨迹中每一采样点在预设键盘中的位置,以及每一预设字符在预设键盘中的位置,确定所获得的样本滑动轨迹对应的样本轨迹字符串;进而,在一种情况中,电子设备可以直接基于上述预设编码轨迹规则,分别对上述所确定的样本轨迹字符串以及每一样本轨迹字符串对应的样本单词字符串进行编码,得到样本轨迹索引串和每一样本轨迹索引串对应的样本单词索引串。在另一种情况中,电子设备可以首先对上述所确定的样本轨迹字符串以及每一样本轨迹字符串对应的样本单词字符串进行预处理,获得预处理后的样本轨迹字符串,以及预处理后的样本单词字符串,然后,基于上述预设编码轨迹,分别对上述预处理后的样本轨迹字符串,以及预处理后的样本单词字符串进行编码,得到样本轨迹索引串和每一样本轨迹索引串对应的样本单词索引串。其中,上述预处理后的样本轨迹字符串与与处理后的样本单词字符串也存在对应关系。
可以理解的是,上述样本滑动轨迹与样本单词存在对应关系,上述样本滑动轨迹与上述样本轨迹索引串存在关系,因此,上述样本轨迹索引串与样本单词存在对应关系。本发明实施例中,上述样本轨迹索引串与样本单词存在的对应关系可以为一一对应的关系。
电子设备将上述所获得的相对应的样本轨迹索引串以及样本单词索引串,输入初始模型,基于初始模型,对每一样本轨迹索引串进行嵌入编码,获得每一样本轨迹索引串中的每一样本轨迹索引对应的嵌入向量,其中,上述嵌入向量可以表征:每一样本轨迹索引串中的每一样本轨迹索引的特征;电子设备基于所获得的每一样本轨迹索引串中的每一样本轨迹索引对应的嵌入向量,确定每一样本轨迹索引所处位置对应的解码概率,进一步的,根据所确定的每一样本轨迹索引所处位置对应的解码概率以及每一样本轨迹索引串对应的样本单词索引串,训练上述初始模型,即调整上述初始模型中的参数,直至上述初始模型收敛为止,得到上述预设滑动输入解码网络模型。
后续的,电子设备获得待解码滑动轨迹对应的待解码轨迹字符串,利用所得到的预设滑动输入解码网络模型,对待解码轨迹字符串进行嵌入编码,获得待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量;进而,利用所获得的待解码嵌入向量,待解码轨迹索引串中每一待解码轨迹索引所处位置对应的解码概率。其中,上述初始模型可以为基于RNN(Recurrent neural Network,循环神经网络)网络的模型。
可以理解的是,本发明实施例中所提的单词字符串,包括样本单词字符串和上述解码所得的单词字符串,可以是英文单词所包含的字符串,也可以是汉字的拼音所包含的字符串,这都是可以的。上述预设标识可以用“ctc_blank”标识。
在一种实现方式中,上述概率的取值范围可以是(0,1),上述概率可以包括解码概率以及后续提到的当前概率。每一轨迹索引所处位置对应的概率之和为1,即每一轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率之和为1,其中,上述轨迹索引可以包括待解码轨迹索引和样本轨迹索引。
在一种实现方式中,上述所确定的待解码轨迹索引串中每一待解码轨迹索引所处位置对应的解码概率可以以概率向量的形式输出,并且上述待解码轨迹索引串中所有待解码轨迹索引所处位置对应的解码概率可以组成一概率矩阵,其中,上述概率矩阵中每一列为一概率向量。上述概率向量的大小为N*1,N等于上述的预设字符的总数加一,可以用“logit-t”标识上述待解码轨迹索引串中第t帧对应的概率向量,可以用“logit”标识上述概率矩阵,即上述预设滑动输入解码网络模型的输出可以为上述概率矩阵,可以用“logit”标识。如图2所示,为上述概率矩阵的一种示意图,其中,上述预设字符为a~z26个字母中的任一字母,上述预设标识可以用“ctc_blank”标识,上述待解码轨迹索引串中包含T个待解码轨迹索引。
S104:依据所确定的待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定待解码滑动轨迹对应的解码所得的单词字符串。
在一种实现方式中,电子设备可以从所确定的待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率中,确定出待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的最大概率,并确定出该最大概率对应的预设字符或预设标识,并将所确定出的每一待解码轨迹索引所处位置对应的最大概率所对应的预设字符或预设标识,所组成的字符序列,作为待解码滑动轨迹对应的解码所得的单词字符串。其中,当待解码轨迹索引串中,一待解码轨迹索引所处位置所对应概率最大的是上述预设标识时,可以表征该待解码轨迹索引所处位置不输出任一预设字符。以待解码轨迹索引串中一个待解码轨迹索引所处位置为例进行说明,例如:
上述预设字符包括a~z26个字母,上述预设标识用“ctc_blank”标识;
电子设备确定出待解码轨迹索引串中,一待解码轨迹索引所处位置A对应输出a~m、p~z以及“ctc_blank”的概率之和为0.10,对应输出n的概率为0.90,此时,可以确定该待解码轨迹索引所处位置A对应的最大概率为0.90,该最大概率0.90对应n,此时电子设备可以确定待解码轨迹索引所处位置A对应预设字符n,即该待解码轨迹索引所处位置A对应输出的预设字符为n;
电子设备确定出待解码轨迹索引串中,一待解码轨迹索引所处位置B对应输出“ctc_blank”的概率为0.60,对应输出a~z的概率之和为0.40,此时,电子设备可以确定该待解码轨迹索引所处位置B对应的最大概率为0.60,该最大概率0.60对应“ctc_blank”,此时电子设备可以确定待解码轨迹索引所处位置B对应“ctc_blank”,即该待解码轨迹索引所处位置B不输出任一预设字符。
本发明实施例中,上述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,上述样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,上述样本滑动轨迹为在真实滑动环境下获得的轨迹,基于上述在真实滑动环境下获得的轨迹以及上述轨迹对应的样本单词,所训练所得的模型,更能很好的解码得到在真实滑动环境下所获得的待解码滑动轨迹对应的单词字符串,即用户所需输入的单词,以实现得到解码准确率高的滑动输入解码方式。
在一种实现方式中,上述待解码滑动轨迹中可以包含至少一个第一采样点;
上述获得待解码滑动轨迹对应的待解码轨迹字符串(S101)的步骤,可以包括:
获得对应预设键盘的待解码滑动轨迹,预设键盘中包含预设字符;
根据每一预设字符在预设键盘中的位置以及待解码滑动轨迹中每一第一采样点在预设键盘中的位置,确定待解码滑动轨迹中每一第一采样点对应的预设字符,得到待解码滑动轨迹对应的待解码轨迹字符串。
本发明实施例中,电子设备获得在预设键盘中进行滑动输入操作所生成的待解码滑动轨迹,上述待解码滑动轨迹中可以包含有多个第一采样点,电子设备可以首先确定上述每一第一采样点在预设键盘中的位置;后续的,电子设备根据每一预设字符在预设键盘中的位置以及待解码滑动轨迹中每一第一采样点在预设键盘中的位置,确定待解码滑动轨迹中每一第一采样点对应的预设字符。在一种情况中,可以预先基于预设键盘建立坐标系,上述每一第一采样点在预设键盘中的位置可以为:每一第一采样点在上述所建立的坐标系下的坐标,上述每一预设字符在预设键盘中的位置可以为:每一预设字符在上述所建立的坐标系下的坐标。在一种实现方式中,上述待解码滑动轨迹中所包含的每一第一采样点,可以通过该第一采样点在上述所建立的坐标系下的坐标进行标识,上述待解码滑动轨迹可以标识为[(x1,y1),(x2,y2),(x3,y3),……,(xT,yT)],其中,(xT,yT)可以标识上述待解码滑动轨迹中第T个第一采样点在上述所建立的坐标系下的坐标。
在一种实现方式中,电子设备可以基于最近邻算法,确定待解码滑动轨迹中每一第一采样点对应的预设字符。在一种情况中,电子设备可以针对每一第一采样点,计算该第一采样点在预设键盘中的位置,与每一预设字符在预设键盘中的位置之间的距离,确定与该第一采样点距离最近的预设字符,将所确定的与该第一采样点距离最近的预设字符,作为该第一采样点对应的预设字符。在另一种情况中,电子设备可以针对每一第一采样点,以该第一采样点在预设键盘中的位置为圆心,并获得作为半径的第一预设数值,在预设键盘中确定一待检测区域,电子设备判断该待检测区域中是否包含预设字符,当判断该待检测区域中包含预设字符时,电子设备计算该第一采样点与该待检测区域中所包含的每一预设字符之间的距离,并确定出数值最小的距离对应的预设字符,为该第一采样点对应的预设字符,结束本次流程;当判断该待检测区域中不包含预设字符时,获得作为距离阶梯的第二预设数值,基于第一预设数值与第二预设数值确定新的半径,并基于新的半径在预设键盘中确定一新的待检测区域,直至确定出的新的待检测区域中包含预设字符,执行上述的电子设备计算该第一采样点与该待检测区域中所包含的每一预设字符之间的距离,并确定出数值最小的距离对应的预设字符,为该第一采样点对应的预设字符的步骤,其中,上述基于第一预设数值与第二预设数值确定新的半径的方式可以是:将第一预设数值与(N-1)倍的第二预设数值的和,作为新的半径,其中,上述N为确定半径的次数,上述N为正整数。
电子设备得到每一第一采样点对应的预设字符后,依据每一第一采样点在上述待解码滑动轨迹中的排列顺序,顺序排列每一预设字符,得到待解码滑动轨迹对应的待解码轨迹字符串。
在一种实现方式中,在上述基于预设滑动输入解码网络模型以及待解码轨迹索引串,确定待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率(S103)的步骤之前,所述方法还可以包括:训练得到预设滑动输入解码网络模型的过程,其中,如图3所示,该过程可以包括:
S301:获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串;
S302:基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到预设滑动输入解码网络模型。
在一种实现方式中,电子设备可以直接获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串,其中,电子设备获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串的过程,可以是:电子设备可以首先获得样本单词字符串;电子设备基于预设编码规则,对所获得的样本单词字符串进行编码,获得每一样本单词字符串对应的样本单词索引串;电子设备基于所获得的样本单词字符串以及预设键盘,获得每一样本单词字符串对应的样本轨迹字符串,然后,电子设备基于预设编码规则,对所获得的样本轨迹字符串进行编码,获得每一样本轨迹字符串对应的样本轨迹索引串。
可以理解的是,样本单词字符串与样本单词索引串存在对应关系,样本轨迹字符串与样本轨迹索引串存在对应关系,样本单词字符串与样本轨迹字符串存在对应关系,即样本单词索引串与样本轨迹索引串存在对应关系。
后续的,电子设备可以直接将上述每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,作为训练样本集,并基于上述训练样本集,训练初始滑动输入解码网络模型,即调整上述初始滑动输入解码网络模型的参数,得到预设滑动输入解码网络模型。
在另一种实现方式中,为了训练得到预测结果更好的预设滑动输入解码网络模型,电子设备可以首先获得用户在真实滑动环境下执行滑动输入操作所生成的滑动轨迹,作为本发明实施例所提的样本滑动轨迹;以及获得用户执行上述滑动输入操作后,所选择的单词,作为本发明实施例所提的样本单词字符串,其中,每一样本滑动轨迹对应一样本单词字符串。然后,电子设备基于上述所获得的样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串,获得相互对应的样本轨迹索引串以及样本单词索引串。
如图4所示,上述获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串(S301)的步骤,可以包括:
S401:获得多个样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串,其中,样本滑动轨迹中包含至少一个第二采样点,样本滑动轨迹为:对应预设键盘获得的滑动轨迹,预设键盘中包含预设字符;
S402:针对每一样本滑动轨迹,根据每一预设字符在预设键盘中的位置以及样本滑动轨迹中每一第二采样点在预设键盘中的位置,确定样本滑动轨迹中每一第二采样点对应的预设字符,得到样本滑动轨迹对应的样本轨迹字符串;
S403:针对每一样本单词字符串,对样本单词字符串中连续的重复的字符进行去重处理,获得处理后的样本单词字符串;
S404:从所获得的处理后的样本单词字符串中,确定出满足预设保留条件的样本单词字符串,其中,满足预设保留条件为:不为任一样本轨迹字符串的字符串子集的条件;
S405:针对每一满足所述预设保留条件的样本单词字符串,利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串进行编码,得到样本单词索引串;
S406:并利用预设编码规则,对该满足预设保留条件的样本单词字符串对应的样本轨迹字符串进行编码,得到样本轨迹索引串。
可以理解的是,上述训练过程中所获得的样本滑动轨迹所基于的预设键盘,与上述待解码滑动轨迹所基于的预设键盘可以相同,即预设键盘中各字符的分布情况可以相同。
本发明实施例中,电子设备可以首先获得多个样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串;其中,上述样本滑动轨迹可以为:用户在预设键盘中执行滑动输入操作所生成的滑动轨迹,上述每一样本滑动轨迹对应的样本单词字符串可以为:用户在预设键盘中执行滑动输入操作后,所选择的单词,可以用“iword”标识。
在一种实现方式中,电子设备可以基于最近邻算法,确定样本滑动轨迹中每一第二采样点对应的预设字符。在一种情况中,电子设备可以针对每一第二采样点,计算该第一采样点在预设键盘中的位置,与每一预设字符在预设键盘中的位置之间的距离,确定与该第二采样点距离最近的预设字符,将所确定的与该第二采样点距离最近的预设字符,作为该第二采样点对应的预设字符。并在得到每一第二采样点对应的预设字符后,电子设备可以依据每一第二采样点在样本滑动轨迹中的排列顺序,顺序排列每一预设字符,以得到样本滑动轨迹对应的样本轨迹字符串,其中,上述样本轨迹字符串可以用“traject”标识。
在一种情况中,可能出现用户在滑动输入过程中,可能是由于用户在一采样点停留时间过短,导致电子设备采样次数不够,例如,用户在滑动输入“hello”的过程中,需要在“l”处滑动持续两个采样时刻,但是由于用户在“l”处停留时间过短,电子设备仅采样“l”一次,此时电子设备基于上述滑动轨迹确定的轨迹字符串中可能仅包含一个“l”,而该滑动轨迹对应的单词字符串中包含两个“l”,当利用上述滑动轨迹与滑动轨迹对应的单词字符串作为样本,训练初始滑动输入解码网络模型时,可能会影响所获得的预设滑动输入解码网络模型,使得预设滑动输入解码网络模型的预测结果出错。
鉴于上述情况,为了提高所训练的预设滑动输入解码网络模型预测结果的准确性,电子设备还可以针对所获得的针对每一样本单词字符串,确定该样本单词字符串中连续的重复的字符,并对所确定的该样本单词字符串中连续的重复的字符进行去重处理,获得每一处理后的样本单词字符串;例如:样本单词字符串为“hello”,该样本单词字符串中连续的重复的字符为“ll”,可以对该样本单词字符串“hello”中的连续的重复的字符“ll”进行去重处理,即删除其中的一个“l”,得到处理后的样本单词字符串“helo”。其中,上述进行去重处理后所得到的处理后的样本单词字符串可以用“iword_contract”标识。
另外为了更好的提高训练所得的预设滑动输入解码网络模型的性能,使得利用上述预设滑动输入解码网络模型所获得的预测结果的准确性更高,电子设备还可以从所获得的处理后的样本单词字符串,确定出满足预设保留条件的样本单词字符串,进而对每一满足预设保留条件的样本单词字符串,利用预设编码规则,对该满足预设保留条件的样本单词字符串进行编码,得到样本单词索引串,其中,上述样本单词索引串可以用“iword_label”标识;并利用预设编码规则,对该满足预设保留条件的样本单词字符串对应的样本轨迹字符串进行编码,得到样本轨迹索引串,上述样本轨迹索引串可以用“itraject”标识。其中,上述预设保留条件可以为:不为任一样本轨迹字符串的字符串子集的条件。
在一种实现方式中,电子设备从所获得的处理后的样本单词字符串,确定出满足预设保留条件的样本单词字符串的过程,可以是:针对每一处理后的样本单词字符串,将该处理后的样本单词字符串与每一样本轨迹字符串进行匹配,确定该处理后的样本单词字符串是否为至少一样本轨迹字符串的字符串子集;当确定该处理后的样本单词字符串不为任一样本轨迹字符串的字符串子集时,则确定该处理后的样本单词字符串为满足预设保留条件的样本单词字符串。
针对处理后的样本单词字符串不为样本轨迹字符串的字符串子集的情况,举例说明:假设处理后的样本单词字符串为“ask”,样本轨迹字符串为“asdfghjkl”,可以确定上述处理后的样本单词字符串“ask”不为样本轨迹字符串“asdfghjkl”的字符串子集。
可以理解的是,本发明实施例中上述提到的“第一采样点”中的“第一”以及上述提到的“第二采样点”中的“第二”,仅用于在命名上区别不同的采样点,并不具有其他限定意义。
在一种实现方式中,上述初始滑动输入解码网络模型可以包括:预设嵌入层和概率评估层,其中,上述概率评估层可以包括:第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层;
如图5所示,上述基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到预设滑动输入解码网络模型(S203)的步骤,可以包括:
S501:随机选择样本滑动轨迹对应的样本轨迹索引串,并输入预设嵌入层,基于特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量;
S502:将该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量,输入概率评估层,基于概率评估层中的第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层,对样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量进行概率评估,获得样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率,其中,每一当前概率包括:样本轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率;
S503:将所获得的样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率与所对应的样本单词索引串进行匹配;
S504:当匹配成功时,获得包含预设嵌入层中特征向量、第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层的预设滑动输入解码网络模型;
S505:当匹配不成功时,调整预设嵌入层中特征向量、第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层的参数;重新执行S501;
直至匹配成功时,执行S504。
其中,上述所获得的当前概率与样本轨迹索引串存在对应关系,样本轨迹索引串与样本单词索引串存在对应关系,则可以确定:所获得的当前概率与样本单词索引串存在对应关系。
在一种情况中,上述将所获得的当前概率与所对应的样本单词索引串进行匹配的过程,可以为:利用预设的损失函数计算所获得的当前概率与所对应的样本单词索引串的差值,即利用预设的损失函数计算样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率,与所对应的样本单词索引串的差值;当所计算差值在预设允许损失范围内,则确定匹配成功,当所计算差值不在预设允许损失范围内,则确定匹配不成功。此时,可以基于将所获得的当前概率与所对应的样本单词索引串的差值变小的原则,调整上述预设嵌入层中特征向量、第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层的参数参数;再重新返回执行随机选择样本滑动轨迹对应的样本轨迹索引串,并输入预设嵌入层,基于特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量的步骤。其中,在一种实现方式中,由于上述样本轨迹索引串与所对应的样本单词索引串的索引串的长度存在不同,上述预设的损失函数在计算差值时,可以是基于样本轨迹索引串中,所有样本轨迹索引所处位置对应的当前概率与所对应的样本单词索引串计算差值。
在另一种情况中,上述将所获得的当前概率与所对应的样本单词索引串进行匹配的过程,也可以为:利用所获得的当前概率,即样本轨迹索引串中,每一样本轨迹索引所处位置对应的输出每一预设字符的概率以及输出所述预设标识的概率,确定出单词字符串,对比每一所确定的单词字符串与每一所确定的单词字符串所对应的样本单词字符串。此时,当对比结果表征所确定的单词字符串与所确定的单词字符串所对应的样本单词字符串相同的概率不低于第一预定概率阈值时,确定匹配成功;反之,当对比结果表征所确定的单词字符串与所确定的单词字符串所对应的样本单词字符串相同的概率低于第一预定概率阈值时,可以基于提高所确定的单词字符串与所确定的单词字符串所对应的样本单词字符串相同的概率的原则,调整上述预设嵌入层中特征向量、第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层的参数参数;再重新返回执行随机选择样本滑动轨迹对应的样本轨迹索引串,并输入预设嵌入层,基于特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量的步骤。
在一种实现方式中,电子设备可以基于Adadelta算法,以及上述所获得的每一样本轨迹索引所处位置对应的当前概率与所对应的样本单词索引串,调整上述预设嵌入层中特征向量、第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层的参数。
在一种实现方式中,上述预设嵌入层可以用“embedding层”标识,可以预先设置上述“embedding层”中特征向量的大小,其中,上述特征向量的大小可以用“embedding size”标识。在一种情况中,上述“embedding size”取64时,上述特征向量为大小为64*1的向量。
上述第一层双向长短时记忆循环神经网络(BLSTM,Bi-directional RecurrentNeural Network+Long Short-Term Memory)层中可以包含预定数量的隐层节点LSTM(LongShort Term Memory networks,长短期内存网络)Cell,上述预定数量可以用“hiddenlayer size”标识,上述第一层双向长短时记忆循环神经网络层可以用“BLSTM层”标识。上述第一层投影层中可以包含权重为2*hidden layer sizeXhidden layer size的矩阵,上述第一层投影层可以用“project layer”标识。其中,第一层双向长短时记忆循环神经网络层中各LSTM Cell的结构可以如图6所示,其中,图6中的椭圆可以表示一个LSTM Cell,第一排的LSTM Cell可以被称为前向Cell,第二排的LSTM Cell可以被称为反向Cell,前向Cell之间共享权值,反向Cell之间共享权值,图6中的箭头可以表示状态信息的传输方向。每一LSTM Cell中可以包括输入门、遗忘门、输出门以及状态单元,状态单元中的状态记忆可以包括当前输入LSTM Cell的信息的前一时刻及前一时刻之前所确定的字符的状态,即当前输入LSTM Cell的信息为轨迹字符串中的第t帧时,即当前需要确定出轨迹字符串中的第t帧对应的输出每一预设字符的概率以及输出预设标识的概率时,上述状态单元中的状态记忆可以包括轨迹字符串中的第t-1帧对应的输出每一预设字符的概率以及输出预设标识的概率,以及轨迹字符串中的第t-1帧之前的所有帧对应的输出每一预设字符的概率以及输出预设标识的概率。
上述第二层双向长短时记忆循环神经网络层中可以包含预定数量的隐层节点LSTMCell,上述第二层双向长短时记忆循环神经网络层也可以用“BLSTM层”标识。
上述第二层投影层中可以包含权重为2*hidden layer size*class size的矩阵,其中,上述“class size”可以等于上述预设字符的总个数加1,可以用于承载在滑动输入解码过程中的,每一待解码轨迹索引所处位置对应的第二层投影层的输出,每一待解码轨迹索引所处位置对应的第二层投影层所得的输出,也可以理解为:待解码轨迹索引串中每一帧对应的第二层投影层所得的输出,每一帧对应的第二层投影层所得的输出为一“classsize”*1的矩阵,上述第二层投影层也可以用“project layer”标识。
上述预设函数变换层包含预设函数softmax函数,以对第二层投影层的输出进行变换。其中,上述softmax函数可以标识如下公式1:
Figure BDA0001424375130000251
其中,上述zj可以标识每一帧对应的第二层投影层所得的输出中的第j个元素值,其中,j取值范围为[1,“class size”+1],上述σ(z)j可以标识每一帧对应的第二层投影层所得的输出中的第j个元素值对应的变换后的输出,上述zk可以标识每一帧对应的第二层投影层所得的输出中的第k个元素值,k的取值范围为[1,K],上述K的取值为“class size”加一;
上述预设嵌入层的输入为待解码轨迹索引串时,上述的每一帧可以为待解码轨迹索引串中的每一帧;上述预设嵌入层的输入为样本轨迹索引串时,上述的每一帧可以为样本轨迹索引串中的每一帧。
一种情况下,进行训练的样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串的数量越多,训练所得的预设滑动输入解码网络模型越稳定,进一步的,利用上述预设滑动输入解码网络模型,所确定出的每一待解码轨迹索引所处位置对应的输出每一预设字符的概率以及输出预设标识的概率越准确,进一步的,解码所得的单词字符串的准确率越高。
在一种实现方式中,上述基于预设滑动输入解码网络模型以及待解码轨迹索引串,确定待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率的步骤,可以包括:
将待解码轨迹索引串输入预设滑动输入解码网络模型;
预设滑动输入解码网络模型,基于特征向量,对待解码轨迹索引串进行嵌入编码,获得待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量;
预设滑动输入解码网络模型,对待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量进行概率评估,确定待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率。
本发明实施例中,电子设备将待解码轨迹索引串输入预设滑动输入解码网络模型的预设嵌入层,上述预设嵌入层基于特征向量对上述待解码轨迹索引串进行嵌入编码,获得上述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量;电子设备将上述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量,输入预设滑动输入解码网络模型的概率评估层,上述概率评估层利用第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层,对待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量进行概率评估,确定待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的输出每一预设字符的概率以及输出预设标识的概率,作为解码概率。
举例而言,电子设备基于预设编码规则,对所获得的待解码滑动轨迹对应的待解码轨迹字符串进行编码,获得待解码轨迹索引串,其中,上述待解码轨迹索引串包含T帧;
电子设备将上述待解码轨迹索引串,输入上述预设滑动输入解码网络模型的预设嵌入层,其中,上述特征向量的大小为“embedding size”;
预设嵌入层,基于特征向量,对每一帧进行嵌入编码,得到大小为“embeddingsize”的待解码嵌入向量x0,x1,……,xt,……xT-1,其中,xt标识可以标识第t帧对应的待解码嵌入向量,t可以的取值范围为0~T-1;
将所得到的待解码嵌入向量x0,x1,……,xt,……xT-1,输入第一层双向长短时记忆循环神经网络层,进行处理,分别得到大小为“2*hidden layer size”的第一向量m0,m1,……,mt,……mT-1,其中,上述第一层双向长短时记忆循环神经网络层所包含隐层节点数为“hidden layer size”,mt标识可以标识第t帧对应的第一向量;
将所得到的第一向量m0,m1,……,mt,……mT-1,输入第一层投影层,进行偏置,得到大小为“hidden layer size”的第二向量n0,n1,……,nt,……,nT-1,其中,第一层投影层的权重为“2*hidden layer size*hidden layer size”的矩阵,nt标识可以标识第t帧对应的第二向量;
将所得到第二向量n0,n1,……,nt,……,nT-1,输入第二层双向长短时记忆循环神经网络层,进行处理,得到第三向量大小为“2*hidden layer size”的y0,y1,……,yt,……,yT-1,其中,第二层双向长短时记忆循环神经网络层所包含隐层节点数为“hiddenlayer size”,yt标识可以标识第t帧对应的第三向量;
将所得到的第三向量y0,y1,……,yt,……,yT-1,输入第二层投影层,进行偏置,得到大小为class size的第四向量z0,z1,……,zt,……,zT-1,其中,第二层投影层的权重为“2*hidden layer size*class size”的矩阵,zt标识可以标识第t帧对应的第四向量,上述class size等于预设字符的总数量加一;
将所得到的第四向量z0,z1,……,zt,……,zT-1,输入预设函数变换层,进行变换,得到第五向量logit0,logit2,……,logitt,……,logitT-1,logitt标识可以标识第t帧对应的第五向量,上述第五向量中所包含的内容,即为所得到的解码概率,上述预设函数变换层可以包含softmax函数,如公式1所示。
在一种实现方式中,为了更好的解码出准确率较高的单词字符串上述依据所确定的待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定待解码滑动轨迹对应的解码所得的单词字符串的步骤,可以包括:
采用预设集束搜索方式,依据所确定的待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定待解码滑动轨迹对应的解码所得的单词字符串。
其中,上述预设集束搜索方式可以为基于Beam-Search算法的搜索方式,基于Beam-Search算法的搜索方式的原理可以为:使用广度优先策略建立搜索树,在树的每一层,按照启发代价对当前层的节点进行排序,然后,仅保留当前层中排序中的前预设个数(即Beam Width-集束宽度)个节点;后续的,基于所保留的节点在当前层的下一层进行扩展,删除其他节点。如果集束宽度无穷大,那该搜索就是宽度优先搜索。本发明实施例中,电子设备可以基于上述搜索原理,依据解码轨迹索引串中,每一待解码轨迹索引所处位置对应的输出每一预设字符的概率以及输出预设标识的概率,确定出待解码滑动轨迹对应的解码所得的单词字符串,其中,过程可以是:针对解码轨迹索引串中,每一待解码轨迹索引所处位置对应的输出每一预设字符的概率以及输出预设标识的概率,即解码概率,从当前的待解码轨迹索引所处位置对应的解码概率中,确定出概率最大的前预设数量个预设字符和/或预设标识,将所确定出的概率最大的前预设数量个预设字符和/或预设标识,作为当前的待解码轨迹索引所处位置的输出,基于当前的待解码轨迹索引所处位置的输出;在该当前的待解码轨迹索引所处位置的下一个解码轨迹索引所处位置中,确定出该位置对应的输出,即从该解码轨迹索引所处位置对应的解码概率中,确定出概率最大的前预设数量个预设字符和/或预设标识,将所确定出的概率最大的前预设数量个预设字符和/或预设标识,作为该位置的对应的输出,以此类推,确定出每一待解码轨迹索引所处位置对应的输出,将每一待解码轨迹索引所处位置的输出
在一种情况中,本发明实施例中,可以通过FST(Finite-State Transducers,有限状态传感器,又称有限状态机)实现对所确定的待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率的Beam-Search解码,以确定出待解码滑动轨迹对应的解码所得的单词字符串。在一种实现方式中,可以首先利用预设单词字符串以及OpenFST(加权有限状态机),构建预设词典模型;利用所构建的预设词典模型中所包含的预设单词字符串以及每一预设单词字符串中每一预设字符之间的连接关系,以及待解码轨迹索引串中每一待解码轨迹索引所处位置对应的解码概率,能够避免解码得到没有实际含义的单词字符串,例如:“helo”,使得解码所得的单词字符串为有实际含义的单词,例如:“hello”。上述采用预设集束搜索方式,依据所确定的待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串的步骤,可以包括:
依据所确定的待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定待解码滑动轨迹对应的解码所得的单词字符串,其中,预设词典模型可以包含:预设单词字符串以及每一预设单词字符串中每一预设字符之间的连接关系。
在另一种实现方式中,还可以利用预设单词字符串组以及OpenFST,构建预设语言模型,其中,上述预设单词字符串组可以是用户历史输入过的语句和/或具有实际含义的词组、短语等。在上述依据所确定的待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定待解码滑动轨迹对应的解码所得的单词字符串的步骤之后,所述方法还可以包括:
获得在待解码滑动轨迹之前所输入的单词字符串,作为历史单词字符串;
利用历史单词字符串、所确定的待解码滑动轨迹对应的解码所得的单词字符串以及预设语言模型,确定待解码滑动轨迹对应的解码所得的每一单词字符串与历史单词字符串的连接关系,其中,预设语言模型包含:预设单词字符串组以及每一预设单词组中各个单词字符串之间的连接关系;
基于所确定的连接关系,对待解码滑动轨迹对应的解码所得的单词字符串进行排序;
以排序顺序展示所述待解码滑动轨迹对应的解码所得的单词字符串。
为了更好的提高用户的使用体验,可以在基于上述预设词典模型,保证解码所得的单词字符串均为具有含义的单词之后,还可以利用历史单词字符串以及预设语言模型中的预设单词字符串组以及每一预设单词组中各个单词字符串之间的连接关系,确定出每一解码所得的单词字符串符合当前语境的符合程度,即每一解码所得的单词字符串与历史单词字符串的连接关系,符合程度越大连接关系越紧密。此时,电子设备可以依据所确定的连接关系,对上述解码所得的单词字符串进行排序,并按排序顺序展示。其中,与历史单词字符串的连接关系越紧密的解码所得的单词字符串,越先展示,即展示位置越靠前。
上述预设词典模型可以为基于FST以及预设单词字符串建立的模型,上述预设词典模型中可以包含各预设单词字符串,即各具有实际含义的单词,例如:英文单词。预设词典模型可以用“L-FST”标识,上述预设语言模型可以为基于FST以及预设单词字符串组建立的模型,上述预设单词字符串组可以为预存的语句,可以为用户历史输入过的语句,也可以为具有实际含义的词组、短语等,上述预设语言模型可以用“G-FST”标识。在FST中,每条边可以包含输入和/或相应的权重、输出和/或相应的权重,在“L-FST”中,其每条边的输入为字符,输出为单词字符串,不带权重。在“G-FST”中,其中的每条边的输入为单词字符串,输出也为单词字符串,该“G-FST”描述了一个n-gram语言模型,每条边的权重为:在一语境下,预设单词字符串组中每一单词字符串出现的概率。
举例而言,上述预设词典模型中包含预设单词字符串分别为I,love,you;如图7A所示,为上述预设词典模型在存储预设单词字符串I,love,you时的一种结构示意图,其中,图7A中圆圈中的数字可以标识各状态,图7A中的“y:ε”可以表征输入“y”,图7A中的“ε:you”可以表征输出“you”。上述预设语言模型中包括预设单词字符串组为I love you,如图7B所示,为上述预设语言模型在存储上述预设单词字符串组I love you时的一种结构示意图,其中,图7B中圆圈中的数字可以标识各状态,图7B中“i:0.6”可以表征状态0后出现单词字符串“I”的权重为0.6,图7B中“love:0.3”可以表征状态0后出现单词字符串“love”的权重为0.3,图7B中“you:0.1”可以表征状态0后出现单词字符串“you”的权重为0.1;图7B中“love:1”可以表征状态0后输出“i”之后,状态1后出现单词字符串“love”的权重为1;图7B中“you:1”表征状态0后输出“i”,且状态1后输出单词字符串“love”之后,状态2后出现单词字符串“you”的权重为1,或者表征状态0后输出“love”之后且状态4后出现单词字符串“you”的权重为1;
电子设备基于上述预设滑动输入解码网络模型,获得解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,其中,该解码概率通过一概率向量logit-T标识,其中,该概率向量logit-T包含:所对应待解码轨迹索引所处位置,即第T帧,输出每一预设字符的概率以及输出预设标识的概率,解码轨迹索引串对应的多个概率向量logit-T可以组成一概率矩阵logit;利用上述“L-FST”和“G-FST”进行Beam-Search解码,设置Beam=2,即每一帧最多保留两个概率最大的字符;
假设用户当前已经输入了“i”和“love”,此时G-FST中状态处于状态2处。L-FST状态重置到状态0位置处;
假设第0帧logit中输出为i,l和y的概率值分别为0.05,0.1,0.7,输出其他字符和ctc_blank概率和为0.15。可以得到概率最大的Beam(2)个分支为:
“y:0.7”此时L-FST状态转移到状态1;
“l:0.1”此时L-FST状态转移到状态6;
假设第1帧logit中输出为o的概率为0.5,输出为p的概率为0.3,输出其他字符概率总和为0.2,以上一步得到的Beam(2)个分支为前缀,可以得到概率最大的Beam(2)个分支为:
“y->o:0.7*0.5”此时L-FST状态转移到状态2;
“l->o:0.1*0.5”此时L-FST状态转移到状态7;
假设第2帧logit中输出为u的概率为0.7,输出为v的概率为0.2,输出其他字符概率总和为0.1,以上一步得到的Beam(2)个分支为前缀,可以得到概率最大的Beam(2)个分支为:
“y->o->u:0.7*0.5*0.7”此时L-FST状态转移到状态3;
“l->o->v:0.1*0.5*0.2”此时L-FST状态转移到状态8;
假设第3帧logit中输出为ctc_blank的概率为0.9,输出为e的概率为0.09,输出其他字符概率总和为0.01,以上一步得到的Beam(2)个分支为前缀,可以得到概率最大的Beam(2)个分支为:
“y->o->u:0.7*0.5*0.7*0.9”此时L-FST状态转移到状态3
“l->o->v->e:0.1*0.5*0.2*0.09”此时L-FST状态转移到状态9
假设logit此时已经全部处理结束,那么最后概率最大的Beam(2)个分支为:
“y->o->u:0.7*0.5*0.7*0.9”此时L-FST状态转移到状态4,输出单词字符串you
“l->o->v->e:0.1*0.5*0.2*0.09”此时L-FST状态转移到状态4,输出单词字符串love;
可以理解的是,L-FST的输出,可以作为G-FST输入,激励G-FST状态进行转移:
对于分支“y->o->u:0.7*0.5*0.7*0.9”,G-FST由状态2转移到状态3得到分支“y->o->u:0.7*0.5*0.7*0.9*1”,其中,“1”为预设语言模型G-FST输出“y->o->u:0.7*0.5*0.7*0.9”对应的权值;
对于分支“l->o->v->e:0.1*0.5*0.2*0.09”,由于G-FST处于状态2,状态2后没有一条边能够接收输入单词字符串love,因而,G-FST的状态由状态2移动到状态4,由于状态4后仍然没有一条边能够接收输入单词字符串love,G-FST的状态由状态4移动到状态0,状态0为uni-gram状态,其后连接所有单词(权重为词频),状态0其后找到能够接收输入单词love的边,其权重为0.3,进而得到分支“l->o->v->e:0.1*0.5*0.2*0.09*0.3”(其中,“0.3”为预设语言模型G-FST输出“l->o->v->e:0.1*0.5*0.2*0.09”对应的权值);
最终所确定的结果,即单词字符串和相应的概率值为:
you-0.7*0.5*0.7*0.9*1;
love-0.1*0.5*0.2*0.09*0.3;
其中,上述概率值可以表征上述单词字符串与历史单词字符串之间的连接关系,其中,概率值越大,所对应的单词字符串与历史单词字符串之间的连接关系越紧密;
此时,电子设备在展示上述所确定的结果即单词字符串时,单词字符串“you”的展示位置,在单词字符串“love”的展示位置之前。
相应于上述方法实施例,本发明实施例提供了一种滑动输入解码装置,如图8所示,所述装置可以包括:
第一获得模块810,用于获得待解码滑动轨迹对应的待解码轨迹字符串;
第二获得模块820,用于基于预设编码规则,对所述待解码轨迹字符串进行编码,获得待解码轨迹索引串,其中,所述预设编码规则包含:每一预设字符与索引的对应关系;
第一确定模块830,用于基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,其中,每一解码概率包括:所对应待解码轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率,所述预设标识为:用于表征每一待解码轨迹索引所处位置不输出任一预设字符的标识,所述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,每一样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,每一样本单词索引串为:根据所对应样本单词确定的一串索引;
第二确定模块840,用于依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
本发明实施例中,上述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,上述样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,上述样本滑动轨迹为在真实滑动环境下获得的轨迹,基于上述在真实滑动环境下获得的轨迹以及上述轨迹对应的样本单词,所训练所得的模型,更能很好的解码得到在真实滑动环境下所获得的待解码滑动轨迹对应的单词字符串,即用户所需输入的单词,以实现得到解码准确率高的滑动输入解码方式。
在一种实现方式中,所述所述待解码滑动轨迹中包含至少一个第一采样点;
所述第一获得模块810,具体用于获得对应预设键盘的待解码滑动轨迹,所述预设键盘中包含所述预设字符;
根据每一预设字符在所述预设键盘中的位置以及所述待解码滑动轨迹中每一第一采样点在所述预设键盘中的位置,确定所述待解码滑动轨迹中每一第一采样点对应的预设字符,得到所述待解码滑动轨迹对应的待解码轨迹字符串。
在一种实现方式中,如图9所示,所述装置还可以包括训练得到模块900,所述训练得到模块900,用于训练得到所述预设滑动输入解码网络模型,其中,所述训练得到模块包括:获得单元910和训练得到单元920;
所述获得单元910,用于在所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率之前,获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串;
所述训练得到单元920,用于基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型。
在一种实现方式中,所述获得单元910,具体用于
获得多个样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串,其中,所述样本滑动轨迹中包含至少一个第二采样点,所述样本滑动轨迹为:对应预设键盘获得的滑动轨迹,所述预设键盘中包含所述预设字符;
针对每一样本滑动轨迹,根据每一预设字符在所述预设键盘中的位置以及所述样本滑动轨迹中每一第二采样点在所述预设键盘中的位置,确定所述样本滑动轨迹中每一第二采样点对应的预设字符,得到所述样本滑动轨迹对应的样本轨迹字符串;
针对每一样本单词字符串,对所述样本单词字符串中连续的重复的字符进行去重处理,获得处理后的样本单词字符串;
从所获得的处理后的样本单词字符串中,确定出满足预设保留条件的样本单词字符串,其中,所述满足预设保留条件为:不为任一样本轨迹字符串的字符串子集的条件;
针对每一满足所述预设保留条件的样本单词字符串,利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串进行编码,得到样本单词索引串;
并利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串对应的样本轨迹字符串进行编码,得到样本轨迹索引串。
在一种实现方式中,所述初始滑动输入解码网络模型可以包括:预设嵌入层和概率评估层,其中,所述概率评估层包括:第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层;
如图10所示,所述训练得到单元920可以包括第一输入子模块921、第二输入子模块922、匹配子模块923、获得子模块924和调整子模块925;
所述第一输入子模块921,用于随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于所述特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量;
所述第二输入子模块922,用于将该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量,输入所述概率评估层,基于所述概率评估层中的所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层,对所述样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量进行概率评估,获得所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率,其中,每一当前概率包括:样本轨迹索引所处位置输出每一预设字符的概率以及输出所述预设标识的概率;
所述匹配子模块923,用于将所获得的所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率与所对应的样本单词索引串进行匹配;
所述获得子模块924,用于当匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型;
所述调整子模块925,用于当匹配不成功时,调整所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的参数;重新触发所述第一输入子模块921;
直至匹配成功时,触发所述获得子模块924。
在一种实现方式中,所述第一确定模块830,具体用于
将所述待解码轨迹索引串输入所述预设滑动输入解码网络模型;
所述预设滑动输入解码网络模型,基于所述特征向量,对所述待解码轨迹索引串进行所述嵌入编码,获得所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量;
所述预设滑动输入解码网络模型,对所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量进行概率评估,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率。
在一种实现方式中,所述第二确定模块840,具体用于:
采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
在一种实现方式中,所述第二确定模块840,具体用于:
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,获得所述待解码滑动轨迹对应的解码所得的单词字符串,其中,所述预设词典模型包含:预设单词字符串以及每一预设单词字符串中每一预设字符之间的连接关系。
在一种实现方式中,如图11所示,所述装置还可以包括第三获得模块1110、第三确定模块1120、排序模块1130和展示模块1140;
所述第三获得模块1110,用于在所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串之后,获得在所述待解码滑动轨迹之前所输入的单词字符串,作为历史单词字符串;
所述第三确定模块1120,用于利用所述历史单词字符串、所述待解码滑动轨迹对应的解码所得的单词字符串以及预设语言模型,确定所述待解码滑动轨迹对应的解码所得的每一单词字符串与所述历史单词的连接关系,其中,所述预设语言模型包含:预设单词字符串组以及每一预设单词字符串组中各个单词字符串之间的连接关系;
所述排序模块1130,用于基于所确定的连接关系,对所述待解码滑动轨迹对应的解码所得的单词字符串进行排序;
所述展示模块1140,用于以排序顺序展示所述待解码滑动轨迹对应的解码所得的单词字符串。
相应于上述方法实施例,本发明实施例还提供了一种电子设备,如图12所示,包括处理器1210、通信接口1220、存储器1230和通信总线1240,其中,处理器1210,通信接口1220,存储器1230通过通信总线1240完成相互间的通信,
存储器1230,用于存放计算机程序;
处理器1210,用于执行存储器1230上所存放的计算机程序时,实现本发明实施例所提供的上述的任一滑动输入解码方法,其中,该方法可以包括步骤:
获得待解码滑动轨迹对应的待解码轨迹字符串;
基于预设编码规则,对所述待解码轨迹字符串进行编码,获得待解码轨迹索引串,其中,所述预设编码规则包含:每一预设字符与索引的对应关系;
基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,其中,每一解码概率包括:所对应待解码轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率,所述预设标识为:用于表征每一待解码轨迹索引所处位置不输出任一预设字符的标识,所述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,每一样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,每一样本单词索引串为:根据所对应样本单词确定的一串索引;
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
本发明实施例中,上述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,上述样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,上述样本滑动轨迹为在真实滑动环境下获得的轨迹,基于上述在真实滑动环境下获得的轨迹以及上述轨迹对应的样本单词,所训练所得的模型,更能很好的解码得到在真实滑动环境下所获得的待解码滑动轨迹对应的单词字符串,即用户所需输入的单词,以实现得到解码准确率高的滑动输入解码方式。
上述电子设备提到的通信总线可以是外设部件互连标准(PeripheralComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在一种实现方式中,所述待解码滑动轨迹中包含至少一个第一采样点;
所述获得待解码滑动轨迹对应的待解码轨迹字符串,包括:
获得对应预设键盘的待解码滑动轨迹,所述预设键盘中包含所述预设字符;
根据每一预设字符在所述预设键盘中的位置以及所述待解码滑动轨迹中每一第一采样点在所述预设键盘中的位置,确定所述待解码滑动轨迹中每一第一采样点对应的预设字符,得到所述待解码滑动轨迹对应的待解码轨迹字符串。
在一种实现方式中,在所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率之前,所述方法还包括:训练得到所述预设滑动输入解码网络模型的过程,其中,所述过程包括:
获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串;
基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型。
在一种实现方式中,所述获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串,包括:
获得多个样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串,其中,所述样本滑动轨迹中包含至少一个第二采样点,所述样本滑动轨迹为:对应预设键盘获得的滑动轨迹,所述预设键盘中包含所述预设字符;
针对每一样本滑动轨迹,根据每一预设字符在所述预设键盘中的位置以及所述样本滑动轨迹中每一第二采样点在所述预设键盘中的位置,确定所述样本滑动轨迹中每一第二采样点对应的预设字符,得到所述样本滑动轨迹对应的样本轨迹字符串;
针对每一样本单词字符串,对所述样本单词字符串中连续的重复的字符进行去重处理,获得处理后的样本单词字符串;
从所获得的处理后的样本单词字符串中,确定出满足预设保留条件的样本单词字符串,其中,所述满足预设保留条件为:不为任一样本轨迹字符串的字符串子集的条件;
针对每一满足所述预设保留条件的样本单词字符串,利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串进行编码,得到样本单词索引串;
并利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串对应的样本轨迹字符串进行编码,得到样本轨迹索引串。
在一种实现方式中,所述初始滑动输入解码网络模型包括:预设嵌入层和概率评估层,其中,所述概率评估层包括:第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层;
所述基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型,包括:
随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于所述特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量;
将该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量,输入所述概率评估层,基于所述概率评估层中的所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层,对所述样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量进行概率评估,获得所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率,其中,每一当前概率包括:样本轨迹索引所处位置输出每一预设字符的概率以及输出所述预设标识的概率;
将所获得的所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率与所对应的样本单词索引串进行匹配;
当匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型;
当匹配不成功时,调整所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的参数;重新执行所述随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于所述特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量;
直至匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型。
在一种实现方式中,所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,包括:
将所述待解码轨迹索引串输入所述预设滑动输入解码网络模型;
所述预设滑动输入解码网络模型,基于所述特征向量,对所述待解码轨迹索引串进行所述嵌入编码,获得所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量;
所述预设滑动输入解码网络模型,对所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量进行概率评估,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率。
在一种实现方式中,所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串,包括:
采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
在一种实现方式中,所述采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串,包括:
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串,其中,所述预设词典模型包含:预设单词字符串以及每一预设单词字符串中每一预设字符之间的连接关系。
在一种实现方式中,在所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串之后,所述方法还包括:
获得在所述待解码滑动轨迹之前所输入的单词字符串,作为历史单词字符串;
利用所述历史单词字符串、所确定的待解码滑动轨迹对应的解码所得的单词字符串以及预设语言模型,确定所述待解码滑动轨迹对应的解码所得的每一单词字符串与所述历史单词的连接关系,其中,所述预设语言模型包含:预设单词字符串组以及每一预设单词字符串组中各个单词字符串之间的连接关系;
基于所确定的连接关系,对所述待解码滑动轨迹对应的解码所得的单词字符串进行排序;
以排序顺序展示所述待解码滑动轨迹对应的解码所得的单词字符串。
相应于上述方法实施例,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例所提供的上述的任一滑动输入解码方法,其中,该方法可以包括步骤:
获得待解码滑动轨迹对应的待解码轨迹字符串;
基于预设编码规则,对所述待解码轨迹字符串进行编码,获得待解码轨迹索引串,其中,所述预设编码规则包含:每一预设字符与索引的对应关系;
基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,其中,每一解码概率包括:所对应待解码轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率,所述预设标识为:用于表征每一待解码轨迹索引所处位置不输出任一预设字符的标识,所述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,每一样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,每一样本单词索引串为:根据所对应样本单词确定的一串索引;
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
本发明实施例中,上述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,上述样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,上述样本滑动轨迹为在真实滑动环境下获得的轨迹,基于上述在真实滑动环境下获得的轨迹以及上述轨迹对应的样本单词,所训练所得的模型,更能很好的解码得到在真实滑动环境下所获得的待解码滑动轨迹对应的单词字符串,即用户所需输入的单词,以实现得到解码准确率高的滑动输入解码方式。
在一种实现方式中,所述待解码滑动轨迹中包含至少一个第一采样点;
所述获得待解码滑动轨迹对应的待解码轨迹字符串,包括:
获得对应预设键盘的待解码滑动轨迹,所述预设键盘中包含所述预设字符;
根据每一预设字符在所述预设键盘中的位置以及所述待解码滑动轨迹中每一第一采样点在所述预设键盘中的位置,确定所述待解码滑动轨迹中每一第一采样点对应的预设字符,得到所述待解码滑动轨迹对应的待解码轨迹字符串。
在一种实现方式中,在所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率之前,所述方法还包括:训练得到所述预设滑动输入解码网络模型的过程,其中,所述过程包括:
获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串;
基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型。
在一种实现方式中,所述获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串,包括:
获得多个样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串,其中,所述样本滑动轨迹中包含至少一个第二采样点,所述样本滑动轨迹为:对应预设键盘获得的滑动轨迹,所述预设键盘中包含所述预设字符;
针对每一样本滑动轨迹,根据每一预设字符在所述预设键盘中的位置以及所述样本滑动轨迹中每一第二采样点在所述预设键盘中的位置,确定所述样本滑动轨迹中每一第二采样点对应的预设字符,得到所述样本滑动轨迹对应的样本轨迹字符串;
针对每一样本单词字符串,对所述样本单词字符串中连续的重复的字符进行去重处理,获得处理后的样本单词字符串;
从所获得的处理后的样本单词字符串中,确定出满足预设保留条件的样本单词字符串,其中,所述满足预设保留条件为:不为任一样本轨迹字符串的字符串子集的条件;
针对每一满足所述预设保留条件的样本单词字符串,利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串进行编码,得到样本单词索引串;
并利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串对应的样本轨迹字符串进行编码,得到样本轨迹索引串。
在一种实现方式中,所述初始滑动输入解码网络模型包括:预设嵌入层和概率评估层,其中,所述概率评估层包括:第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层;
所述基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型,包括:
随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于所述特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量;
将该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量,输入所述概率评估层,基于所述概率评估层中的所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层,对所述样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量进行概率评估,获得所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率,其中,每一当前概率包括:样本轨迹索引所处位置输出每一预设字符的概率以及输出所述预设标识的概率;
将所获得的所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率与所对应的样本单词索引串进行匹配;
当匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型;
当匹配不成功时,调整所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的参数;重新执行所述随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于所述特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量;
直至匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型。
在一种实现方式中,所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,包括:
将所述待解码轨迹索引串输入所述预设滑动输入解码网络模型;
所述预设滑动输入解码网络模型,基于所述特征向量,对所述待解码轨迹索引串进行所述嵌入编码,获得所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量;
所述预设滑动输入解码网络模型,对所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量进行概率评估,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率。
在一种实现方式中,所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串,包括:
采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
在一种实现方式中,所述采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串,包括:
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串,其中,所述预设词典模型包含:预设单词字符串以及每一预设单词字符串中每一预设字符之间的连接关系。
在一种实现方式中,在所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串之后,所述方法还包括:
获得在所述待解码滑动轨迹之前所输入的单词字符串,作为历史单词字符串;
利用所述历史单词字符串、所确定的待解码滑动轨迹对应的解码所得的单词字符串以及预设语言模型,确定所述待解码滑动轨迹对应的解码所得的每一单词字符串与所述历史单词的连接关系,其中,所述预设语言模型包含:预设单词字符串组以及每一预设单词字符串组中各个单词字符串之间的连接关系;
基于所确定的连接关系,对所述待解码滑动轨迹对应的解码所得的单词字符串进行排序;
以排序顺序展示所述待解码滑动轨迹对应的解码所得的单词字符串。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (20)

1.一种滑动输入解码方法,其特征在于,所述方法包括:
获得待解码滑动轨迹对应的待解码轨迹字符串;
基于预设编码规则,对所述待解码轨迹字符串进行编码,获得待解码轨迹索引串,其中,所述预设编码规则包含:每一预设字符与索引的对应关系;
基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,其中,每一解码概率包括:所对应待解码轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率,所述预设标识为:用于表征每一待解码轨迹索引所处位置不输出任一预设字符的标识,所述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,每一样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,每一样本单词索引串为:根据所对应样本单词确定的一串索引;
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
2.根据权利要求1所述的方法,其特征在于,所述待解码滑动轨迹中包含至少一个第一采样点;
所述获得待解码滑动轨迹对应的待解码轨迹字符串的步骤,包括:
获得对应预设键盘的待解码滑动轨迹,所述预设键盘中包含所述预设字符;
根据每一预设字符在所述预设键盘中的位置以及所述待解码滑动轨迹中每一第一采样点在所述预设键盘中的位置,确定所述待解码滑动轨迹中每一第一采样点对应的预设字符,得到所述待解码滑动轨迹对应的待解码轨迹字符串。
3.根据权利要求1所述的方法,其特征在于,在所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率的步骤之前,所述方法还包括:训练得到所述预设滑动输入解码网络模型的过程,其中,所述过程包括:
获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串;
基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型。
4.根据权利要求3所述的方法,其特征在于,所述获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串的步骤,包括:
获得多个样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串,其中,所述样本滑动轨迹中包含至少一个第二采样点,所述样本滑动轨迹为:对应预设键盘获得的滑动轨迹,所述预设键盘中包含所述预设字符;
针对每一样本滑动轨迹,根据每一预设字符在所述预设键盘中的位置以及所述样本滑动轨迹中每一第二采样点在所述预设键盘中的位置,确定所述样本滑动轨迹中每一第二采样点对应的预设字符,得到所述样本滑动轨迹对应的样本轨迹字符串;
针对每一样本单词字符串,对所述样本单词字符串中连续的重复的字符进行去重处理,获得处理后的样本单词字符串;
从所获得的处理后的样本单词字符串中,确定出满足预设保留条件的样本单词字符串,其中,所述满足预设保留条件为:不为任一样本轨迹字符串的字符串子集的条件;
针对每一满足所述预设保留条件的样本单词字符串,利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串进行编码,得到样本单词索引串;
并利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串对应的样本轨迹字符串进行编码,得到样本轨迹索引串。
5.根据权利要求3所述的方法,其特征在于,所述初始滑动输入解码网络模型包括:预设嵌入层和概率评估层,其中,所述概率评估层包括:第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层;
所述基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型的步骤,包括:
随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量;
将该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量,输入所述概率评估层,基于所述概率评估层中的所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层,对所述样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量进行概率评估,获得所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率,其中,每一当前概率包括:样本轨迹索引所处位置输出每一预设字符的概率以及输出所述预设标识的概率;
将所获得的所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率与所对应的样本单词索引串进行匹配;
当匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型;
当匹配不成功时,调整所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的参数;重新执行所述随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于所述特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量的步骤;
直至匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型。
6.根据权利要求5所述的方法,其特征在于,所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率的步骤,包括:
将所述待解码轨迹索引串输入所述预设滑动输入解码网络模型;
所述预设滑动输入解码网络模型,基于所述特征向量,对所述待解码轨迹索引串进行所述嵌入编码,获得所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量;
所述预设滑动输入解码网络模型,对所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量进行概率评估,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串的步骤,包括:
采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
8.根据权利要求7所述的方法,其特征在于,所述采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串的步骤,包括:
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串,其中,所述预设词典模型包含:预设单词字符串以及每一预设单词字符串中每一预设字符之间的连接关系。
9.根据权利要求8所述的方法,其特征在于,在所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串的步骤之后,所述方法还包括:
获得在所述待解码滑动轨迹之前所输入的单词字符串,作为历史单词字符串;
利用所述历史单词字符串、所确定的待解码滑动轨迹对应的解码所得的单词字符串以及预设语言模型,确定所述待解码滑动轨迹对应的解码所得的每一单词字符串与所述历史单词的连接关系,其中,所述预设语言模型包含:预设单词字符串组以及每一预设单词字符串组中各个单词字符串之间的连接关系;
基于所确定的连接关系,对所述待解码滑动轨迹对应的解码所得的单词字符串进行排序;
以排序顺序展示所述待解码滑动轨迹对应的解码所得的单词字符串。
10.一种滑动输入解码装置,其特征在于,所述装置包括:
第一获得模块,用于获得待解码滑动轨迹对应的待解码轨迹字符串;
第二获得模块,用于基于预设编码规则,对所述待解码轨迹字符串进行编码,获得待解码轨迹索引串,其中,所述预设编码规则包含:每一预设字符与索引的对应关系;
第一确定模块,用于基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,其中,每一解码概率包括:所对应待解码轨迹索引所处位置输出每一预设字符的概率以及输出预设标识的概率,所述预设标识为:用于表征每一待解码轨迹索引所处位置不输出任一预设字符的标识,所述预设滑动输入解码网络模型为:预先基于相对应的样本轨迹索引串以及样本单词索引串训练所得的模型,每一样本轨迹索引串为:根据所对应样本滑动轨迹确定的一串索引,每一样本单词索引串为:根据所对应样本单词确定的一串索引;
第二确定模块,用于依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
11.根据权利要求10所述的装置,其特征在于,所述待解码滑动轨迹中包含至少一个第一采样点;
所述第一获得模块,具体用于获得对应预设键盘的待解码滑动轨迹,所述预设键盘中包含所述预设字符;
根据每一预设字符在所述预设键盘中的位置以及所述待解码滑动轨迹中每一第一采样点在所述预设键盘中的位置,确定所述待解码滑动轨迹中每一第一采样点对应的预设字符,得到所述待解码滑动轨迹对应的待解码轨迹字符串。
12.根据权利要求10所述的装置,其特征在于,所述装置还包括训练得到模块,所述训练得到模块,用于训练得到所述预设滑动输入解码网络模型,其中,所述训练得到模块包括:获得单元和训练得到单元;
所述获得单元,用于在所述基于预设滑动输入解码网络模型以及所述待解码轨迹索引串,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率之前,获得多个样本轨迹索引串以及每一样本轨迹索引串对应的样本单词索引串;
所述训练得到单元,用于基于每一样本滑动轨迹对应的样本轨迹索引串以及每一样本滑动轨迹对应的样本单词索引串,训练初始滑动输入解码网络模型,得到所述预设滑动输入解码网络模型。
13.根据权利要求12所述的装置,其特征在于,所述获得单元,具体用于
获得多个样本滑动轨迹以及每一样本滑动轨迹对应的样本单词字符串,其中,所述样本滑动轨迹中包含至少一个第二采样点,所述样本滑动轨迹为:对应预设键盘获得的滑动轨迹,所述预设键盘中包含所述预设字符;
针对每一样本滑动轨迹,根据每一预设字符在所述预设键盘中的位置以及所述样本滑动轨迹中每一第二采样点在所述预设键盘中的位置,确定所述样本滑动轨迹中每一第二采样点对应的预设字符,得到所述样本滑动轨迹对应的样本轨迹字符串;
针对每一样本单词字符串,对所述样本单词字符串中连续的重复的字符进行去重处理,获得处理后的样本单词字符串;
从所获得的处理后的样本单词字符串中,确定出满足预设保留条件的样本单词字符串,其中,所述满足预设保留条件为:不为任一样本轨迹字符串的字符串子集的条件;
针对每一满足所述预设保留条件的样本单词字符串,利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串进行编码,得到样本单词索引串;
并利用所述预设编码规则,对该满足所述预设保留条件的样本单词字符串对应的样本轨迹字符串进行编码,得到样本轨迹索引串。
14.根据权利要求12所述的装置,其特征在于,所述初始滑动输入解码网络模型包括:预设嵌入层和概率评估层,其中,所述概率评估层包括:第一层双向长短时记忆循环神经网络层、第一层投影层、第二层双向长短时记忆循环神经网络层、第二层投影层以及预设函数变换层;
所述训练得到单元包括第一输入子模块、第二输入子模块、匹配子模块、获得子模块和调整子模块;
所述第一输入子模块,用于随机选择样本滑动轨迹对应的样本轨迹索引串,并输入所述预设嵌入层,基于特征向量对该样本轨迹索引串进行嵌入编码,获得该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量;
所述第二输入子模块,用于将该样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量,输入所述概率评估层,基于所述概率评估层中的所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层,对所述样本轨迹索引串中每一样本轨迹索引对应的当前嵌入向量进行概率评估,获得所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率,其中,每一当前概率包括:样本轨迹索引所处位置输出每一预设字符的概率以及输出所述预设标识的概率;
所述匹配子模块,用于将所获得的所述样本轨迹索引串中,每一样本轨迹索引所处位置对应的当前概率与所对应的样本单词索引串进行匹配;
所述获得子模块,用于当匹配成功时,获得包含所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的所述预设滑动输入解码网络模型;
所述调整子模块,用于当匹配不成功时,调整所述预设嵌入层中所述特征向量、所述第一层双向长短时记忆循环神经网络层、所述第一层投影层、所述第二层双向长短时记忆循环神经网络层、所述第二层投影层以及所述预设函数变换层的参数;重新触发所述第一输入子模块;
直至匹配成功时,触发所述获得子模块。
15.根据权利要求14所述的装置,其特征在于,所述第一确定模块,具体用于
将所述待解码轨迹索引串输入所述预设滑动输入解码网络模型;
所述预设滑动输入解码网络模型,基于所述特征向量,对所述待解码轨迹索引串进行所述嵌入编码,获得所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量;
所述预设滑动输入解码网络模型,对所述待解码轨迹索引串中每一待解码轨迹索引对应的待解码嵌入向量进行概率评估,确定所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率。
16.根据权利要求10-15任一项所述的装置,其特征在于,所述第二确定模块,具体用于:
采用预设集束搜索方式,依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率,确定所述待解码滑动轨迹对应的解码所得的单词字符串。
17.根据权利要求16所述的装置,其特征在于,所述第二确定模块,具体用于:
依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,获得所述待解码滑动轨迹对应的解码所得的单词字符串,其中,所述预设词典模型包含:预设单词字符串以及每一预设单词字符串中每一预设字符之间的连接关系。
18.根据权利要求17所述的装置,其特征在于,所述装置还包括第三获得模块、第三确定模块、排序模块和展示模块;
所述第三获得模块,用于在所述依据所确定的所述待解码轨迹索引串中,每一待解码轨迹索引所处位置对应的解码概率以及预设词典模型,确定所述待解码滑动轨迹对应的解码所得的单词字符串之后,获得在所述待解码滑动轨迹之前所输入的单词字符串,作为历史单词字符串;
所述第三确定模块,用于利用所述历史单词字符串、所确定的待解码滑动轨迹对应的解码所得的单词字符串以及预设语言模型,确定所述待解码滑动轨迹对应的解码所得的每一单词字符串与所述历史单词的连接关系,其中,所述预设语言模型包含:预设单词字符串组以及每一预设单词字符串组中各个单词字符串之间的连接关系;
所述排序模块,用于基于所确定的连接关系,对所述待解码滑动轨迹对应的解码所得的单词字符串进行排序;
所述展示模块,用于以排序顺序展示所述待解码滑动轨迹对应的解码所得的单词字符串。
19.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的计算机程序时,实现权利要求1-9任一所述的滑动输入解码方法的步骤。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-9任一所述的滑动输入解码方法的步骤。
CN201710908748.5A 2017-09-29 2017-09-29 一种滑动输入解码方法、装置及电子设备 Active CN109582930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710908748.5A CN109582930B (zh) 2017-09-29 2017-09-29 一种滑动输入解码方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710908748.5A CN109582930B (zh) 2017-09-29 2017-09-29 一种滑动输入解码方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN109582930A CN109582930A (zh) 2019-04-05
CN109582930B true CN109582930B (zh) 2022-12-20

Family

ID=65914350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710908748.5A Active CN109582930B (zh) 2017-09-29 2017-09-29 一种滑动输入解码方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN109582930B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159107B (zh) * 2019-12-30 2023-03-21 北京明略软件系统有限公司 数据处理方法和服务器集群

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102736821A (zh) * 2011-03-31 2012-10-17 腾讯科技(深圳)有限公司 基于滑动轨迹确定候选词的方法和装置
CN103000176A (zh) * 2012-12-28 2013-03-27 安徽科大讯飞信息科技股份有限公司 语音识别方法和系统
US8612213B1 (en) * 2012-10-16 2013-12-17 Google Inc. Correction of errors in character strings that include a word delimiter
CN104750666A (zh) * 2015-03-12 2015-07-01 明博教育科技有限公司 一种文本字符编码方式的识别方法及系统
CN105117054A (zh) * 2015-08-12 2015-12-02 珠海优特电力科技股份有限公司 一种手写输入的识别方法及系统
CN105260113A (zh) * 2015-09-18 2016-01-20 科大讯飞股份有限公司 滑行输入方法、装置及终端设备
CN106569618A (zh) * 2016-10-19 2017-04-19 武汉悦然心动网络科技股份有限公司 基于循环神经网络模型的滑动输入方法及系统
CN106843737A (zh) * 2017-02-13 2017-06-13 北京新美互通科技有限公司 文本输入方法、装置及终端设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112013032418B1 (pt) * 2012-06-04 2023-04-11 Sun Patent Trust Método e aparelho de codificação de imagem em movimento, método e aparelho de decodificação de imagem em movimento, e aparelho de codificação e decodificação de imagem em movimento
US9026428B2 (en) * 2012-10-15 2015-05-05 Nuance Communications, Inc. Text/character input system, such as for use with touch screens on mobile phones

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102736821A (zh) * 2011-03-31 2012-10-17 腾讯科技(深圳)有限公司 基于滑动轨迹确定候选词的方法和装置
US8612213B1 (en) * 2012-10-16 2013-12-17 Google Inc. Correction of errors in character strings that include a word delimiter
CN103000176A (zh) * 2012-12-28 2013-03-27 安徽科大讯飞信息科技股份有限公司 语音识别方法和系统
CN104750666A (zh) * 2015-03-12 2015-07-01 明博教育科技有限公司 一种文本字符编码方式的识别方法及系统
CN105117054A (zh) * 2015-08-12 2015-12-02 珠海优特电力科技股份有限公司 一种手写输入的识别方法及系统
CN105260113A (zh) * 2015-09-18 2016-01-20 科大讯飞股份有限公司 滑行输入方法、装置及终端设备
CN106569618A (zh) * 2016-10-19 2017-04-19 武汉悦然心动网络科技股份有限公司 基于循环神经网络模型的滑动输入方法及系统
CN106843737A (zh) * 2017-02-13 2017-06-13 北京新美互通科技有限公司 文本输入方法、装置及终端设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Euler"s Discretization of Single Input Sliding-Mode Control Systems;Zbigniew Galias; Xinghuo Yu;《IEEE》;20070917;第52卷(第9期);1726-1730 *
基于双向非线性学习的轨迹跟踪和识别;胡昭华等;《计算机学报》;20070815(第08期);全文 *
基于触摸显示屏的手势输入字符方法研究;刘宇尘等;《微型机与应用》;20120625;第31卷(第12期);全文 *

Also Published As

Publication number Publication date
CN109582930A (zh) 2019-04-05

Similar Documents

Publication Publication Date Title
JP6955580B2 (ja) 文書要約自動抽出方法、装置、コンピュータ機器及び記憶媒体
CN112329465B (zh) 一种命名实体识别方法、装置及计算机可读存储介质
CN111523306A (zh) 文本的纠错方法、装置和系统
WO2020073673A1 (zh) 一种文本分析方法及终端
CN110163181B (zh) 手语识别方法及装置
CN110222328B (zh) 基于神经网络的分词和词类标注方法、装置、设备及存储介质
CN108681541B (zh) 图片搜索方法、装置及计算机设备
CN112528637A (zh) 文本处理模型训练方法、装置、计算机设备和存储介质
CN110874401B (zh) 信息处理方法、模型训练方法、装置、终端及计算设备
CN110825857A (zh) 多轮问答识别方法、装置、计算机设备及存储介质
CN111078847A (zh) 电力用户意图识别方法、装置、计算机设备和存储介质
CN111738002A (zh) 基于Lattice LSTM的古文领域命名实体识别方法和系统
CN112528634A (zh) 文本纠错模型训练、识别方法、装置、设备及存储介质
CN112861518B (zh) 文本纠错方法、装置和存储介质及电子装置
CN109408813A (zh) 一种文本纠正方法及装置
CN114036950B (zh) 一种医疗文本命名实体识别方法及系统
CN112966476B (zh) 文本处理方法、装置、电子设备及存储介质
CN110795935A (zh) 文字词向量模型的训练方法、装置、终端及存储介质
CN115062134B (zh) 知识问答模型训练及知识问答方法、装置和计算机设备
CN115147849A (zh) 字符编码模型的训练方法、字符匹配方法和装置
CN112329454A (zh) 语种识别方法、装置、电子设备及可读存储介质
CN107357776B (zh) 一种相关词挖掘方法及装置
CN113553847A (zh) 用于对地址文本进行解析的方法、装置、系统和存储介质
CN109582930B (zh) 一种滑动输入解码方法、装置及电子设备
CN111079433A (zh) 一种事件抽取方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant