CN112801239A

CN112801239A - 输入识别方法、装置、电子设备和存储介质

Info

Publication number: CN112801239A
Application number: CN202110116416.XA
Authority: CN
Inventors: 徐小玉; 童鹏; 邢猛
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2021-01-28
Filing date: 2021-01-28
Publication date: 2021-05-14
Anticipated expiration: 2041-01-28
Also published as: CN112801239B

Abstract

本发明提供一种输入识别方法、装置、电子设备和存储介质，其中方法包括：基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果；其中，当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型，环境语种用于表征当前输入行为所处的语言环境；基于意图识别结果以及当前输入行为的手写识别结果，确定当前输入行为的识别结果。本发明实施例提供的输入识别方法、装置、电子设备和存储介质，基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，并综合得到的意图识别结果与当前输入行为的手写识别结果，得到当前输入行为的识别结果，提高了手写输入识别的准确性。

Description

输入识别方法、装置、电子设备和存储介质

技术领域

本发明涉及手写识别技术领域，尤其涉及一种输入识别方法、装置、电子设备和存储介质。

背景技术

随着各种电子设备在人们的生活工作中普及，手写输入作为重要的输入方式之一，其识别准确性的提高得到了越来越多的关注。

然而，目前的手写输入识别方法仅通过手写轨迹坐标点训练模型，在模型训练不足时，识别率低下，进而降低了最终识别结果的准确性。

发明内容

本发明提供一种输入识别方法、装置、电子设备和存储介质，用以解决现有技术中手写识别准确性欠佳的缺陷。

本发明提供一种输入识别方法，包括：

基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果；其中，所述当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型，所述环境语种用于表征当前输入行为所处的语言环境；

基于所述意图识别结果以及所述当前输入行为的手写识别结果，确定所述当前输入行为的识别结果。

根据本发明提供的一种输入识别方法，所述基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果，包括：

将各候选字符的所属语种与所述环境语种进行匹配，得到各候选字符的第一匹配结果；

和/或，将各候选字符的应用场景类型和衍生应用场景类型与所述当前应用场景类型进行匹配，得到各候选字符的第二匹配结果；其中，任一字符的衍生应用场景类型为所述任一字符所属词或词组的应用场景类型；

基于各候选字符的第一匹配结果和/或第二匹配结果，确定所述意图识别结果。

根据本发明提供的一种输入识别方法，所述将各候选字符的所属语种与所述环境语种进行匹配，得到各候选字符的第一匹配结果，包括：

基于各候选字符所属语种的字符编码范围以及所述环境语种的字符编码范围之间的重合度，确定各候选字符的第一匹配结果。

根据本发明提供的一种输入识别方法，所述基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果，之后还包括：

基于历史输入关联信息进行输入意图识别，得到历史意图识别结果；

基于所述历史意图识别结果，调整所述意图识别结果。

根据本发明提供的一种输入识别方法，所述历史输入关联信息包括当前输入轮次的上文信息和/或历史输入轮次的历史输入信息；

所述基于历史输入关联信息进行输入意图识别，得到历史意图识别结果，包括：

将各候选字符与所述上文信息进行匹配，得到各候选字符的第三匹配结果；

和/或，确定与所述当前输入行为的手写轨迹匹配的历史输入信息，并基于所述匹配的历史输入信息中的每一历史选择字符及其选择频率，确定各候选字符的第四匹配结果；

基于各候选字符的第三匹配结果和/或第四匹配结果，确定所述历史意图识别结果。

根据本发明提供的一种输入识别方法，所述基于所述意图识别结果以及所述当前输入行为的手写识别结果，确定所述当前输入行为的识别结果，之前还包括：

基于用户的手写倾斜习惯，对所述当前输入行为的手写轨迹进行倾斜校正；

对倾斜校正后的手写轨迹进行手写识别，得到所述手写识别结果；

其中，所述手写倾斜习惯是基于所述用户的若干个历史手写轨迹及其对应的历史选择字符确定的。

根据本发明提供的一种输入识别方法，所述手写倾斜习惯是基于如下步骤确定的：

基于所述用户的任一历史手写轨迹中的关键点坐标，以及与所述任一历史手写轨迹对应的历史选择字符的关键点坐标，确定所述任一历史手写轨迹的倾斜检测结果；

基于每一历史手写轨迹的倾斜检测结果，确定所述用户的手写倾斜习惯。

根据本发明提供的一种输入识别方法，所述基于所述用户的任一历史手写轨迹中的关键点坐标，以及与所述任一历史手写轨迹对应的历史选择字符的关键点坐标，确定所述任一历史手写轨迹的倾斜检测结果，包括：

基于所述用户的任一历史手写轨迹的起始点与所述任一历史手写轨迹对应的历史选择字符的标准起始点间的相对位置关系，对所述任一历史手写轨迹对应的历史选择字符的标准坐标进行坐标转换，使得所述任一历史手写轨迹的起始点与对应的历史选择字符的标准起始点重合；

基于所述任一历史手写轨迹的起始点和终止点，以及对应的历史选择字符在坐标转换后的标准终止点，确定所述任一历史手写轨迹的倾斜检测结果。

本发明还提供一种输入识别装置，包括：

意图识别单元，用于基于当前输入行为对应的当前应用场景类型和/或系统语种进行输入意图识别，得到意图识别结果；其中，所述当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型，所述环境语种用于表征当前输入行为所处的语言环境；

识别结果筛选单元，用于基于所述意图识别结果以及所述当前输入行为的手写识别结果，确定所述当前输入行为的识别结果。

本发明还提供一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述任一种所述输入识别方法的步骤。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述输入识别方法的步骤。

本发明提供的输入识别方法、装置、电子设备和存储介质，基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，并综合得到的意图识别结果与当前输入行为的手写识别结果，得到当前输入行为的识别结果，提高了手写输入识别的准确性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的输入识别方法的流程示意图；

图2为本发明提供的意图识别方法的流程示意图；

图3为本发明提供的意图识别方法的流程示意图；

图4为本发明提供的历史意图识别结果确定方法的流程示意图；

图5为本发明提供的手写倾斜习惯确定方法的流程示意图；

图6为本发明提供的倾斜计算方法的示意图；

图7为本发明提供的输入识别方法的流程示意图；

图8为本发明提供的输入识别装置的结构示意图；

图9为本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

现有的手写输入识别方式中，通常需要获取用户的手写轨迹坐标信息，然后基于手写输入的不同输入模式(例如行写，叠写，单字等)对应的识别模型，从目标字符集中筛选出得分高的结果，作为手写识别结果显示给用户，以供用户进行最终的选择。其中各个输入模式对应的识别模型是通过样本手写轨迹坐标点训练得到的。上述仅通过识别模型进行手写输入识别的方式较为机械，且当模型训练不足时，手写输入识别的准确性也欠佳。

对此，本发明实施例提供了一种输入识别方法。图1为本发明实施例提供的输入识别方法的流程示意图，如图1所示，该方法包括：

步骤110，基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果；其中，当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型，环境语种用于表征当前输入行为所处的语言环境；

具体地，用户在进行手写输入时，输入行为对应的当前应用场景类型和当前的环境语种不同时，用户对手写输入的识别结果的预期也是不同的。其中，当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型，如导航场景、音乐播放场景以及视频播放场景等。当前应用场景类型可以通过获取为当前输入行为提供输入接口的应用程序类型得到，如在导航应用内进行输入，则可以确定当前应用场景类型为导航场景；当前应用场景类型还可以通过进一步获取提供输入接口的应用程序子界面的类型得到，例如在视频播放应用内的电影栏目内进行输入，则可以确定当前应用场景类型为电影播放场景，本发明实施例对此不作具体限定。

当前输入行为对应的当前应用场景类型不同，用户意图输入的字符类型也可能存在差异。例如，若当前应用场景类型为导航场景，则用户意图输入的字符类型为POI(Pointof Interest，兴趣点)类型的可能性较大，若当前应用场景类型为音乐播放场景，则用户意图输入的字符类型为歌曲名或歌手名的可能性较大。因此，可以基于当前输入行为对应的当前应用场景类型进行输入意图识别，对用户当前的输入意图进行预测，从而从各个候选字符中筛选出更符合用户预期的结果。

环境语种用于表征当前输入行为所处的语言环境，例如中文环境或英文环境等，其可以通过获取系统语言或者获取提供输入接口的应用程序版本语言获得，本发明实施例对此不作具体限定。当前输入行为所在的环境语种不同，用户意图输入的字符类型也可能不同。例如，若环境语种为英文，则用户意图输入的字符为英文字符的可能性较大。因此，还可以基于当前输入行为对应的环境语种进行输入意图识别，对用户当前的输入意图进行预测，以从各个候选字符中筛选出更符合用户预期的结果。

此处，可以仅基于当前输入行为对应的当前应用场景类型或环境语种进行输入意图识别，得到意图识别结果。其中，意图识别结果可以包括各个候选字符符合用户意图的程度。还可以分别基于当前输入行为对应的当前应用场景类型和环境语种进行输入意图识别，并将分别确定得到的各个候选字符符合用户意图的程度进行融合，得到意图识别结果。

步骤120，基于意图识别结果以及当前输入行为的手写识别结果，确定当前输入行为的识别结果。

具体地，结合步骤110中获得的意图识别结果，以及对当前输入行为的手写轨迹进行手写识别得到的手写识别结果，可以更准确地从各个候选字符中选取与手写轨迹匹配且更符合用户输入意图的字符作为识别结果，以供用户从该识别结果中选择最终的输入字符。其中，手写识别结果可以包括各个候选字符与手写轨迹的匹配程度。此处，可以将意图识别结果中各个候选字符符合用户意图的程度与手写识别结果中各个候选字符与手写轨迹的匹配程度进行融合，得到各个候选字符的识别得分，从而筛选出识别得分较高的候选字符作为识别结果。

本发明实施例提供的方法，基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，并综合得到的意图识别结果与当前输入行为的手写识别结果，得到当前输入行为的识别结果，提高了手写输入识别的准确性。

基于上述实施例，图2为本发明实施例提供的意图识别方法的流程示意图，如图2所示，步骤110包括：

步骤111，将各候选字符的所属语种与环境语种进行匹配，得到各候选字符的第一匹配结果。

具体地，可以预先获取各候选字符的所属语种，并将各候选字符的所属语种与环境语种进行匹配，得到各候选字符的第一匹配结果。其中，第一匹配结果可以包括各候选字符的所属语种与环境语种的匹配程度。任一候选字符的所属语种与环境语种越接近，其匹配程度越高，例如，当环境语种为英语时，所属语种为德语的候选字符与环境语种的匹配程度高于所属语种为汉语的候选字符。

和/或，步骤112，将各候选字符的应用场景类型和衍生应用场景类型与当前应用场景类型进行匹配，得到各候选字符的第二匹配结果；其中，任一字符的衍生应用场景类型为该字符所属词或词组的应用场景类型。

具体地，可以获取各候选字符的应用场景类型和衍生应用场景类型。其中，任一字符的应用场景类型为该字符通常适用的场景类型，而任一字符的衍生应用场景类型为该字符所属词或词组通常适用的场景类型。此处，可以设立场景类型池，将所有的场景类型置于该池中，然后根据任一字符的语义，从场景类型池中匹配得到该字符的应用场景类型。此外，还可以根据该字符的常用搭配词或词组的语义，从场景类型池中匹配得到该字符的衍生应用场景类型。

将各候选字符的应用场景类型和衍生应用场景类型与当前应用场景类型进行匹配，得到各候选字符的第二匹配结果。其中，第二匹配结果可以包括各候选字符的应用场景类型和衍生应用场景类型与当前应用场景类型的匹配程度。进行场景类型的匹配之前，可以构建场景匹配表，该表中预设有不同应用场景类型间的匹配程度。根据该场景匹配表，将任一候选字符的应用场景类型和衍生应用场景类型依次与当前应用场景类型进行匹配，并取最高的匹配程度作为该候选字符的第二匹配结果。

步骤113，基于各候选字符的第一匹配结果和/或第二匹配结果，确定意图识别结果。

具体地，当仅执行步骤111时，可以将各候选字符的第一匹配结果作为意图识别结果；当仅执行步骤112时，可以将各候选字符的第二匹配结果作为意图识别结果；当既执行步骤111又执行步骤112时，可以将各候选字符的第一匹配结果和第二匹配结果进行结果融合，得到意图识别结果。此处，可以直接将任一候选字符的第一匹配结果和第二匹配结果对应相加，实现该候选字符的结果融合；还可以为第一匹配结果和第二匹配结果设置相应的权重，并将任一候选字符的第一匹配结果和第二匹配结果加权相加，实现该候选字符的结果融合，本发明实施例对此不作具体限定。

基于上述任一实施例，步骤111包括：

基于各候选字符所属语种的字符编码范围以及环境语种的字符编码范围之间的重合度，确定各候选字符的第一匹配结果。

具体地，每一个语种均有对应的字符编码范围，例如Unicode编码范围，且相近语种的字符编码范围也较接近。因此，可以将各候选字符所属语种的字符编码范围与环境语种的字符编码范围进行匹配，得到各候选字符所属语种的字符编码范围与环境语种的字符编码范围之间的重合度，进而确定各候选字符的第一匹配结果。其中，任一候选字符所属语种的字符编码范围与环境语种的字符编码范围之间的重合度越高，表明该候选字符的所属语种与环境语种越接近，其越有可能符合用户的输入意图，因此对应的匹配程度也越高。

在确定各候选字符所属语种的字符编码范围以及环境语种的字符编码范围之间的重合度之前，可以构建语种匹配表，该表中预设有各语种与环境语种的字符编码范围之间的重合度。根据该语种匹配表，可以直接获取各候选字符所属语种的字符编码范围以及环境语种的字符编码范围之间的重合度。此处，任一语种与环境语种的字符编码范围之间的重合度可以基于两个语种字符编码范围的终止编码的差值、起始编码的差值，以及环境语种的终止编码与起始编码的差值确定得到。例如，可以将环境语种与任一语种的终止编码的差值与起始编码的差值相加，再除以环境语种的终止编码与起始编码的差值，得到该语种与环境语种的字符编码范围之间的重合度。

本发明实施例提供的方法，基于各候选字符所属语种的字符编码范围以及环境语种的字符编码范围之间的重合度，确定各候选字符的第一匹配结果，提高了候选字符语种与环境语种的匹配准确性，有助于提高手写输入识别的准确性。

基于上述任一实施例，图3为本发明实施例提供的意图识别方法的流程示意图，如图3所示，步骤110之后还包括：

步骤1101，基于历史输入关联信息进行输入意图识别，得到历史意图识别结果；

步骤1102，基于历史意图识别结果，调整意图识别结果。

具体地，除了当前输入行为对应的当前应用场景类型和环境语种以外，该用户的历史输入关联信息也有助于推测用户当前的输入意图。其中，历史输入关联信息为与该用户的历史输入行为相关的信息，例如该用户在此之前曾输入的文本信息，该用户过去的手写输入方式，如书写各个字符的手写轨迹等。由于同一用户的历史输入行为与当前输入行为之间存在一定的关联，因此历史输入关联信息可以辅助确定当前输入行为可能输入的字符。

因此，可以基于历史输入关联信息进行输入意图识别，得到历史意图识别结果，并基于历史意图识别结果，调整基于当前输入行为对应的当前应用场景类型和/或环境语种确定的意图识别结果，以进一步提高意图识别的准确性。其中，历史意图识别结果中可以包括各候选字符与历史输入关联信息间的匹配程度。调整意图识别结果时，可以将历史意图识别结果中各候选字符与历史输入关联信息间的匹配程度，与意图识别结果中各候选字符符合用户意图的程度进行融合，例如直接相加或加权相加等，本发明实施例对此不作具体限定。

本发明实施例提供的方法，基于历史输入关联信息进行输入意图识别，并基于得到的历史意图识别结果，调整意图识别结果，进一步提高了意图识别的准确性。

基于上述任一实施例，历史输入关联信息包括当前输入轮次的上文信息和/或历史输入轮次的历史输入信息。

图4为本发明实施例提供的历史意图识别结果确定方法的流程示意图，如图4所示，步骤1101包括：

步骤1101-1，将各候选字符与上文信息进行匹配，得到各候选字符的第三匹配结果。

具体地，同一输入轮次输入的信息之间具有紧密的关联性，因此，可以基于当前输入轮次的上文信息推测用户当前意图输入的字符。例如，若上文信息为“导航到”，则各候选字符中与地址相关的字符与该上文信息的相关性更强，其更有可能为用户意图输入的字符。因此，可以将各候选字符与上文信息进行匹配，得到各候选字符的第三匹配结果。其中，第三匹配结果中可以包括各候选字符与上文信息的匹配程度。

和/或，步骤1101-2，确定与当前输入行为的手写轨迹匹配的历史输入信息，并基于匹配的历史输入信息中的每一历史选择字符及其选择频率，确定各候选字符的第四匹配结果。

具体地，历史输入轮次的历史输入信息中包含该用户在历史输入轮次中每一次手写输入的历史手写轨迹以及用户最终选择的历史选择字符。由于同一用户的书写习惯较为稳定，书写同一字符时的手写轨迹相似度也较高，因此可以根据该用户过去输入类似手写轨迹时选择的历史选择字符，推测该用户当前意图输入的字符。其中，对于与当前输入的手写轨迹类似的历史手写轨迹，用户选择次数最多的历史选择字符为用户当前意图输入的字符的可能性较高。

具体而言，可以将当前输入行为的手写轨迹与该用户的历史输入信息中的历史手写轨迹进行匹配，并获取相匹配的历史输入信息。随后，基于匹配的历史输入信息中的每一历史选择字符及其选择频率，确定各候选字符的第四匹配结果。其中，第四匹配结果可以表征各候选字符被用户选择的概率。此处，可以将各候选字符与相匹配的历史输入信息的历史选择字符进行比对，若任一候选字符为上述任一相匹配的历史选择字符，则可以基于该历史选择字符的选择频率确定该候选字符的第四匹配结果。

步骤1101-3，基于各候选字符的第三匹配结果和/或第四匹配结果，确定历史意图识别结果。

具体地，当仅执行步骤1101-1时，可以将各候选字符的第三匹配结果作为历史意图识别结果；当仅执行步骤1101-2时，可以将各候选字符的第四匹配结果作为历史意图识别结果；当既执行步骤1101-1又执行步骤1101-2时，可以将各候选字符的第三匹配结果和第四匹配结果进行结果融合，得到历史意图识别结果。此处，可以直接将任一候选字符的第三匹配结果和第四匹配结果对应相加，实现该候选字符的结果融合；还可以为第三匹配结果和第四匹配结果设置相应的权重，并将任一候选字符的第三匹配结果和第四匹配结果加权相加，实现该候选字符的结果融合，本发明实施例对此不作具体限定。

本发明实施例提供的方法，通过将各候选字符与上文信息进行匹配，得到各候选字符的第三匹配结果，和/或，基于匹配的历史输入信息中的每一历史选择字符及其选择频率，确定各候选字符的第四匹配结果，有助于提高意图识别的准确性。

基于上述任一实施例，步骤120之前还包括：

基于用户的手写倾斜习惯，对当前输入行为的手写轨迹进行倾斜校正；

对倾斜校正后的手写轨迹进行手写识别，得到手写识别结果；

其中，手写倾斜习惯是基于用户的若干个历史手写轨迹及其对应的历史选择字符确定的。

具体地，用户在进行手写输入时，手写轨迹通常存在一定的倾斜，可能对手写识别产生不良影响，因此在进行手写识别之前，可以对当前输入行为的手写轨迹进行倾斜校正，再对倾斜校正后的手写轨迹进行手写识别，得到手写识别结果。其中，在进行倾斜校正时，考虑到用户存在稳定的书写习惯，例如用户在进行手写输入时，描绘的手写轨迹的倾斜程度大多较为接近，因此可以基于用户的手写倾斜习惯对当前输入行为的手写轨迹进行倾斜校正，降低倾斜校正的运算量，从而提高倾斜校正的效率。此处，手写倾斜习惯可以基于用户的若干个历史手写轨迹及其对应的历史选择字符确定得到。其中，根据历史手写轨迹及其对应的历史选择字符，可以获知该用户在手写输入各历史选择字符时可能存在的倾斜角度和倾斜方向，从而得到该用户的手写倾斜习惯。

本发明实施例提供的方法，基于用户的手写倾斜习惯，对当前输入行为的手写轨迹进行倾斜校正，提高了倾斜校正的效率；再对倾斜校正后的手写轨迹进行手写识别，提高了手写识别的准确性。

基于上述任一实施例，手写倾斜习惯是基于如下步骤确定的：

基于该用户的任一历史手写轨迹中的关键点坐标，以及与该历史手写轨迹对应的历史选择字符的关键点坐标，确定该历史手写轨迹的倾斜检测结果；

基于每一历史手写轨迹的倾斜检测结果，确定该用户的手写倾斜习惯。

具体地，针对该用户的任一历史手写轨迹，可以提取该历史手写轨迹中的若干个关键点，例如该历史手写轨迹的起始点、结束点、交叉点等可以体现该手写轨迹特性的坐标点。相应地，还可以提取与该历史手写轨迹对应的历史选择字符的若干个关键点，此处，历史选择字符的关键点与历史手写轨迹的关键点对应。根据该历史手写轨迹中的各个关键点坐标，以及对应的历史选择字符的关键点坐标，可以确定历史手写轨迹与其对应的历史选择字符的标准写法之间的区别，从而确定用户在描绘该历史手写轨迹时是否存在倾斜以及具体的倾斜角度。其中，可以根据历史手写轨迹中各个关键点间的相对位置关系，以及历史选择字符中各个对应关键点间的相对位置关系，判断历史手写轨迹是否存在倾斜。例如，可以对比历史手写轨迹中各个关键点的连线角度，与历史选择字符中各个关键点的连线角度，从而确定历史手写轨迹是否存在倾斜并计算具体的倾斜角度。

确定得到该用户多个历史手写轨迹的倾斜检测结果后，可以利用统计学方法，确定该用户的手写倾斜习惯。例如，若多个历史手写轨迹中存在倾斜的情况占多数，可以确定该用户手写时存在倾斜；还可以将各个历史手写轨迹的倾斜检测结果中的倾斜角度平均值或中位值，作为该用户的倾斜角度；还可以将多个历史手写轨迹中占多数的倾斜方向作为该用户的倾斜方向，本发明实施例对此不作具体限定。

基于上述任一实施例，图5为本发明实施例提供的手写倾斜习惯确定方法的流程示意图，如图5所示，该方法包括：

步骤510，基于用户的任一历史手写轨迹的起始点与该历史手写轨迹对应的历史选择字符的标准起始点间的相对位置关系，对该历史手写轨迹对应的历史选择字符的标准坐标进行坐标转换，使得该历史手写轨迹的起始点与对应的历史选择字符的标准起始点重合。

具体地，图6为本发明实施例提供的倾斜计算方法的示意图，如图6所示，对于该用户的任一历史手写轨迹(即图6中的虚线字符)，可以获取该历史手写轨迹的起始点A1与该历史手写轨迹对应的历史选择字符(即图6中的实线字符)的标准起始点M之间的相对位置关系。例如，可以获取标准起始点M到起始点A1的向量MA1，该向量可以指示两点间的相对位置关系。其中，历史选择字符的坐标是预先设定的该历史选择字符在无倾斜且位置尺寸标准化情况下的标准坐标。另外，历史手写轨迹也经过了尺寸标准化操作，以消除用户手写输入时描绘的字符大小不一带来的不利影响。

然后，基于起始点A1与标准起始点M之间的相对位置关系，对该历史手写轨迹对应的历史选择字符的标准坐标进行坐标转换，例如，可以根据向量MA1，将历史选择字符的标准坐标进行平移，使得该历史手写轨迹的起始点A1与对应的历史选择字符的标准起始点M重合。

步骤520，基于该历史手写轨迹的起始点和终止点，以及对应的历史选择字符在坐标转换后的标准终止点，确定该历史手写轨迹的倾斜检测结果。

具体地，基于该历史手写轨迹的起始点A1和终止点B1，以及对应的历史选择字符在坐标转换后的标准终止点B2，可以确定该历史手写轨迹的倾斜检测结果。其中，倾斜检测结果可以包括该历史手写轨迹是否存在倾斜，还可以包括存在倾斜时的倾斜角度和倾斜方向。如图6所示，可以计算连线A1B1和连线A1B2之间的夹角，若该夹角小于预设阈值，则可以认为两条连线基本重合，该历史手写轨迹不存在倾斜，否则，即可将连线A1B1和连线A1B2之间的夹角作为该历史手写轨迹的倾斜角度φ。例如，可以根据余弦定理，计算倾斜角度φ的余弦值：cosφ＝(A1B1²+A1B2²–B1B2²)/(2×A1B1×A1B2)，从而计算得到φ的值。

此外，根据连线A1B1和连线A1B2之间的相对位置，还可以确定该历史手写轨迹的倾斜方向。例如，可以确定历史手写轨迹的终止点B1与历史选择字符在坐标转换后的标准终止点B2构成的向量B1B2，根据向量B1B2的方向，确定该历史手写轨迹的倾斜方向。例如，可以将终止点B1作为原点构建直角坐标系，若向量B1B2指向第一象限，则倾斜方向为左倾，若向量B1B2指向第四象限，则倾斜方向为右倾。

本发明实施例提供的方法，基于用户的任一历史手写轨迹的起始点与该历史手写轨迹对应的历史选择字符的标准起始点间的相对位置关系，对该历史手写轨迹对应的历史选择字符的标准坐标进行坐标转换，基于该历史手写轨迹的起始点和终止点，以及对应的历史选择字符在坐标转换后的标准终止点，确定该历史手写轨迹的倾斜检测结果，从而确定该用户的手写倾斜习惯，运算量较低，耗时较少，可以提高倾斜检测的效率。

基于上述任一实施例，图7为本发明实施例提供的输入识别方法的流程示意图，如图7所示，该方法包括：

首先，采集用户当前输入行为的手写轨迹。此外，获取输入意图识别所需的外部因素以及用户的手写倾斜习惯，其中外部因素包括当前输入行为对应的当前应用场景类型和环境语种，以及当前输入轮次的上文信息和历史输入轮次的历史输入信息。然后，根据上述外部因素对输入意图识别的影响程度进行权重分配，并保证各个外部因素的权重之和为一。即：α(当前应用场景类型)+β(历史输入信息)+γ(上文信息)+δ(环境语种)＝1。其中，对输入意图识别影响越大的外部因素的权重越高。此处，可以根据层次分析法(the AnalyticHierarchy Process，AHP)构建判断矩阵，分析各外部因素在输入意图识别时的重要性大小，计算得到每个外部因素的重要性，然后将每个外部因素的重要性除以总重要性得到各外部因素的权重。

随后，基于各个外部因素及其权重进行输入意图识别，得到意图识别结果，并结合意图识别结果和手写识别结果筛选出最符合用户预期的识别结果。

具体而言，首先根据用户的手写倾斜习惯对当前输入行为的手写轨迹进行倾斜校正。

然后对倾斜校正后的手写轨迹进行手写识别。与此同时，基于上述外部因素进行意图识别：将各候选字符的应用场景类型和衍生应用场景类型与当前应用场景类型进行匹配，并在匹配得分a的基础上乘以当前应用场景类型对应的权重α，得到各候选字符的第二匹配结果A；确定与当前输入行为的手写轨迹匹配的历史输入信息，并基于匹配的历史输入信息中的每一历史选择字符及其选择频率，确定各候选字符的匹配得分b，在此基础上乘以历史输入信息的权重β，得到各候选字符的第四匹配结果B；将各候选字符与上文信息进行匹配，并在匹配得分c的基础上乘以上文信息对应的权重γ，得到各候选字符的第三匹配结果C；将各候选字符的所属语种与环境语种进行匹配，并在匹配得分d的基础上乘以环境语种对应的权重δ，得到各候选字符的第一匹配结果D。将各候选字符的第一匹配结果、第二匹配结果、第三匹配结果和第四匹配结果相加，得到意图识别结果。

基于意图识别结果以及当前输入行为的手写识别结果，确定当前输入行为的识别结果。此处，可以利用手写识别结果从各候选字符中筛选部分手写识别得分较高的字符作为候选识别结果，再基于各候选字符的意图识别结果，从候选识别结果中二次筛选出更符合用户预期的识别结果。其中，在筛选识别结果时，可以先确定所有候选字符中，各个外部因素对应的最高匹配得分A-High、B-High、C-High和D-High，并累加得到最高匹配总分score：score＝A-High+B-High+C-High+D-High。随后，基于最高匹配总分score和阈值系数ζ，确定阈值匹配分ε，即ε＝score*ζ。其中，阈值系数ζ可以动态调节，根据对于识别结果的需求(更准确还是范围更广)，将阈值系数设置为高或者低。阈值系数还可以在识别过程中不断的调整，在准确性和结果范围之间选取一个平衡数值作为阈值系数。然后，根据阈值匹配分ε筛选出超出阈值匹配分的识别结果，并显示给用户。

下面对本发明提供的输入识别装置进行描述，下文描述的输入识别装置与上文描述的输入识别方法可相互对应参照。

基于上述任一实施例，图8为本发明实施例提供的输入识别装置的结构示意图，如图8所示，该装置包括意图识别单元810和识别结果筛选单元820。

其中，意图识别单元810用于基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果；其中，当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型，环境语种用于表征当前输入行为所处的语言环境；

识别结果筛选单元820用于基于意图识别结果以及当前输入行为的手写识别结果，确定当前输入行为的识别结果。

本发明实施例提供的装置，基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，并综合得到的意图识别结果与当前输入行为的手写识别结果，得到当前输入行为的识别结果，提高了手写输入识别的准确性。

基于上述任一实施例，意图识别单元810具体包括：

语种匹配单元，用于将各候选字符的所属语种与环境语种进行匹配，得到各候选字符的第一匹配结果；

和/或，场景匹配单元，用于将各候选字符的应用场景类型和衍生应用场景类型与当前应用场景类型进行匹配，得到各候选字符的第二匹配结果；其中，任一字符的衍生应用场景类型为该字符所属词或词组的应用场景类型；

意图识别结果确定单元，用于基于各候选字符的第一匹配结果和/或第二匹配结果，确定意图识别结果。

基于上述任一实施例，语种匹配单元具体用于：

本发明实施例提供的装置，基于各候选字符所属语种的字符编码范围以及环境语种的字符编码范围之间的重合度，确定各候选字符的第一匹配结果，提高了候选字符语种与环境语种的匹配准确性，有助于提高手写输入识别的准确性。

基于上述任一实施例，该装置还包括历史意图识别单元，用于：

基于历史意图识别结果，调整意图识别结果。

本发明实施例提供的装置，基于历史输入关联信息进行输入意图识别，并基于得到的历史意图识别结果，调整意图识别结果，进一步提高了意图识别的准确性。

历史意图识别单元具体包括：

上文信息匹配单元，用于将各候选字符与上文信息进行匹配，得到各候选字符的第三匹配结果；

和/或，历史输入信息匹配单元，用于确定与当前输入行为的手写轨迹匹配的历史输入信息，并基于匹配的历史输入信息中的每一历史选择字符及其选择频率，确定各候选字符的第四匹配结果；

历史意图识别结果确定单元，用于基于各候选字符的第三匹配结果和/或第四匹配结果，确定历史意图识别结果。

本发明实施例提供的装置，通过将各候选字符与上文信息进行匹配，得到各候选字符的第三匹配结果，和/或，基于匹配的历史输入信息中的每一历史选择字符及其选择频率，确定各候选字符的第四匹配结果，有助于提高意图识别的准确性。

基于上述任一实施例，该装置还包括手写识别单元，用于：

本发明实施例提供的装置，基于用户的手写倾斜习惯，对当前输入行为的手写轨迹进行倾斜校正，提高了倾斜校正的效率；再对倾斜校正后的手写轨迹进行手写识别，提高了手写识别的准确性。

基于上述任一实施例，该装置还包括手写倾斜习惯确定单元，用于：

倾斜检测单元，用于基于用户的任一历史手写轨迹中的关键点坐标，以及与该历史手写轨迹对应的历史选择字符的关键点坐标，确定该历史手写轨迹的倾斜检测结果；

倾斜习惯获取单元，用于基于每一历史手写轨迹的倾斜检测结果，确定用户的手写倾斜习惯。

基于上述任一实施例，倾斜检测单元用于：

基于用户的任一历史手写轨迹的起始点与该历史手写轨迹对应的历史选择字符的标准起始点间的相对位置关系，对该历史手写轨迹对应的历史选择字符的标准坐标进行坐标转换，使得该历史手写轨迹的起始点与对应的历史选择字符的标准起始点重合；

基于该历史手写轨迹的起始点和终止点，以及对应的历史选择字符在坐标转换后的标准终止点，确定该历史手写轨迹的倾斜检测结果。

本发明实施例提供的装置，基于用户的任一历史手写轨迹的起始点与该历史手写轨迹对应的历史选择字符的标准起始点间的相对位置关系，对该历史手写轨迹对应的历史选择字符的标准坐标进行坐标转换，基于该历史手写轨迹的起始点和终止点，以及对应的历史选择字符在坐标转换后的标准终止点，确定该历史手写轨迹的倾斜检测结果，从而确定该用户的手写倾斜习惯，运算量较低，耗时较少，可以提高倾斜检测的效率。

图9示例了一种电子设备的实体结构示意图，如图9所示，该电子设备可以包括：处理器(processor)910、通信接口(Communications Interface)920、存储器(memory)930和通信总线940，其中，处理器910，通信接口920，存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令，以执行输入识别方法，该方法包括：基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果；其中，所述当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型，所述环境语种用于表征当前输入行为所处的语言环境；基于所述意图识别结果以及所述当前输入行为的手写识别结果，确定所述当前输入行为的识别结果。

此外，上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的输入识别方法，该方法包括：基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果；其中，所述当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型，所述环境语种用于表征当前输入行为所处的语言环境；基于所述意图识别结果以及所述当前输入行为的手写识别结果，确定所述当前输入行为的识别结果。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各提供的输入识别方法，该方法包括：基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果；其中，所述当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型，所述环境语种用于表征当前输入行为所处的语言环境；基于所述意图识别结果以及所述当前输入行为的手写识别结果，确定所述当前输入行为的识别结果。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种输入识别方法，其特征在于，包括：

2.根据权利要求1所述的输入识别方法，其特征在于，所述基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果，包括：

3.根据权利要求2所述的输入识别方法，其特征在于，所述将各候选字符的所属语种与所述环境语种进行匹配，得到各候选字符的第一匹配结果，包括：

4.根据权利要求1至3中任一项所述的输入识别方法，其特征在于，所述基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果，之后还包括：

基于所述历史意图识别结果，调整所述意图识别结果。

5.根据权利要求4所述的输入识别方法，其特征在于，所述历史输入关联信息包括当前输入轮次的上文信息和/或历史输入轮次的历史输入信息；

6.根据权利要求1至3任一项所述的输入识别方法，其特征在于，所述基于所述意图识别结果以及所述当前输入行为的手写识别结果，确定所述当前输入行为的识别结果，之前还包括：

7.根据权利要求6所述的输入识别方法，其特征在于，所述手写倾斜习惯是基于如下步骤确定的：

8.根据权利要求7所述的输入识别方法，其特征在于，所述基于所述用户的任一历史手写轨迹中的关键点坐标，以及与所述任一历史手写轨迹对应的历史选择字符的关键点坐标，确定所述任一历史手写轨迹的倾斜检测结果，包括：

9.一种输入识别装置，其特征在于，包括：

意图识别单元，用于基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别，得到意图识别结果；其中，所述当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型，所述环境语种用于表征当前输入行为所处的语言环境；

10.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至8任一项所述输入识别方法的步骤。

11.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至8任一项所述输入识别方法的步骤。