CN109346059A

CN109346059A - 一种方言语音的识别方法及电子设备

Info

Publication number: CN109346059A
Application number: CN201811559908.0A
Authority: CN
Inventors: 崔颖
Original assignee: Guangdong Genius Technology Co Ltd
Current assignee: Guangdong Genius Technology Co Ltd
Priority date: 2018-12-20
Filing date: 2018-12-20
Publication date: 2019-02-15
Anticipated expiration: 2038-12-20
Also published as: CN109346059B

Abstract

本发明实施例公开了一种方言语音的识别方法及电子设备，该方法包括：获取用户的当前位置信息，并根据当前位置信息确定用户所处的当前地域信息；查找预设的绑定当前地域信息的目标语音模型，该目标语音模型包括当前地域信息对应的方言语音与标准普通话语音的映射关系的集合；从映射关系的集合中确定出目标映射关系，目标映射关系中的当前地域信息对应的方言语音的内容与用户输入的即时方言语音的内容相同；从目标映射关系中获取与用户输入的即时方言语音相互映射的标准普通话语音；将与用户输入的即时方言语音相互映射的标准普通话语音转换为文本信息，并输出文本信息。实施本发明实施例，能够正确识别方言语音，提高语音识别的正确率。

Description

一种方言语音的识别方法及电子设备

技术领域

本发明涉及电子设备技术领域，尤其涉及一种方言语音的识别方法及电子设备。

背景技术

随着科学技术的发展，学生使用电子设备(如家教机)进行学习已经越来越普遍，学生可以使用电子设备通过语音问答的交互方式进行学习。但是，目前的电子设备在某一应用程序进行语音问答的过程中，会受到不同地区的用户不同方言的影响和干扰，使得用户语音识别的正确率下降，无法识别带有方言的用户的正确语音意图，导致无法输出正确识别后的文本。

发明内容

本发明实施例公开了一种方言语音的识别方法及电子设备，能够正确识别方言语音，提高语音识别的正确率。

本发明实施例第一方面公开一种方言语音的识别方法，所述方法包括：

电子设备获取用户的当前位置信息，并根据所述当前位置信息确定所述用户所处的当前地域信息；

所述电子设备查找预设的绑定所述当前地域信息的目标语音模型；其中，所述目标语音模型包括所述当前地域信息对应的方言语音与标准普通话语音的映射关系的集合；

所述电子设备从所述映射关系的集合中确定出目标映射关系，所述目标映射关系中的所述当前地域信息对应的方言语音的内容与所述用户输入的即时方言语音的内容相同；

所述电子设备从所述目标映射关系中获取与所述用户输入的即时方言语音相互映射的标准普通话语音；

所述电子设备将所述与所述用户输入的即时方言语音相互映射的标准普通话语音转换为文本信息，并输出所述文本信息。

作为一种可选的实施方式，在本发明实施例第一方面中，所述预设的绑定所述当前地域信息的目标语音模型是根据所述电子设备采集的不同地域的用户的语音数据样本的发音特征对所述语音数据样本进行分类，并确定出分类后的语音数据样本对应的地域信息样本，以及以所述地域信息样本和所述语音数据样本的发音特征对训练模型进行训练得到的；其中，所述目标语音模型包括根据所述语音数据样本与标准普通话语音数据样本建立的映射关系的合集。

作为一种可选的实施方式，在本发明实施例第一方面中，在所述电子设备输出所述文本信息之后，所述方法还包括：

所述电子设备提取所述文本信息的关键字段，并根据所述关键字段查找将所述关键字段作为标签的学习内容；

所述电子设备根据所述文本信息识别所述即时方言语音指示的用户意图；

所述电子设备基于所述即时方言语音指示的用户意图从所述将所述关键字段作为标签的学习内容中筛选出目标学习内容，并输出所述目标学习内容。

作为一种可选的实施方式，在本发明实施例第一方面中，所述电子设备输出所述目标学习内容之后，所述方法还包括：

所述电子设备检测用户的学习时长是否大于预设时长；

在所述用户的学习时长大于预设时长时，所述电子设备播放语音提示信息，所述语音提示信息为与所述用户输入的即时方言语音相匹配的方言语音信息，所述语音提示信息用于询问用户是否理解所述目标学习内容；

所述电子设备接收用户根据所述提示信息输入的语音答复信息，并识别所述语音答复信息；

当识别出所述语音答复信息指示用户不理解所述目标学习内容时，所述电子设备播放语音解读信息，以供用户理解所述目标学习内容，所述语音解读信息为标准普通话语音信息或者方言语音信息。

作为一种可选的实施方式，在本发明实施例第一方面中，所述方法还包括：

所述电子设备检测所述目标映射关系中的所述当前地域信息对应的方言语音的内容是否与所述用户输入的即时方言语音的内容匹配；

如果不匹配，所述电子设备识别所述即时方言语音对应的地域信息，根据所述即时方言语音对应的地域信息和所述目标语音模型确定出所述即时方言语音与标准普通话语音的映射关系，并从所述即时方言语音与标准普通话语音的映射关系中提取与所述即时方言语音相互映射的标准普通话语音，执行所述将所述与所述用户输入的即时方言语音相互映射的标准普通话语音转换为文本信息，并输出所述文本信息的操作。

本发明实施例第二方面公开一种电子设备，所述电子设备包括：

第一确定单元，用于获取用户的当前位置信息，并根据所述当前位置信息确定所述用户所处的当前地域信息；

第一查找单元，用于查找预设的绑定所述当前地域信息的目标语音模型；其中，所述目标语音模型包括所述当前地域信息对应的方言语音与标准普通话语音的映射关系的集合；

第二确定单元，用于从所述映射关系的集合中确定出目标映射关系，所述目标映射关系中的所述当前地域信息对应的方言语音的内容与所述用户输入的即时方言语音的内容相同；

获取单元，用于从所述目标映射关系中获取与所述用户输入的即时方言语音相互映射的标准普通话语音；

第一输出单元，用于将所述与所述用户输入的即时方言语音相互映射的标准普通话语音转换为文本信息，并输出所述文本信息。

作为一种可选的实施方式，在本发明实施例第二方面中，所述第一查找单元查找到的所述预设的绑定所述当前地域信息的目标语音模型是根据所述电子设备采集的不同地域的用户的语音数据样本的发音特征对所述语音数据样本进行分类，并确定出分类后的语音数据样本对应的地域信息样本，以及以所述地域信息样本和所述语音数据样本的发音特征对训练模型进行训练得到的；其中，所述目标语音模型包括根据所述语音数据样本与标准普通话语音数据样本建立的映射关系的合集。

作为一种可选的实施方式，在本发明实施例第二方面中，所述电子设备还包括：

第二查找单元，用于在所述第一输出单元输出所述文本信息之后，提取所述文本信息的关键字段，并根据所述关键字段查找将所述关键字段作为标签的学习内容；

第一识别单元，用于根据所述文本信息识别所述即时方言语音指示的用户意图；

第二输出单元，用于基于所述即时方言语音指示的用户意图从所述将所述关键字段作为标签的学习内容中筛选出目标学习内容，并输出所述目标学习内容。

第一检测单元，用于在所述第二输出单元输出所述目标学习内容之后，检测用户的学习时长是否大于预设时长；

提示单元，用于在所述第一检测单元检测出所述用户的学习时长大于预设时长时，播放语音提示信息，所述语音提示信息为与所述用户输入的即时方言语音相匹配的方言语音信息，所述语音提示信息用于询问用户是否理解所述目标学习内容；

第二识别单元，用于接收用户根据所述提示信息输入的语音答复信息，并识别所述语音答复信息；

播放单元，用于在所述第二识别单元识别出所述语音答复信息指示用户不理解所述目标学习内容时，播放语音解读信息，以供用户理解所述目标学习内容，所述语音解读信息为标准普通话语音信息或者方言语音信息。

第二检测单元，用于检测所述目标映射关系中的所述当前地域信息对应的方言语音的内容是否与所述用户输入的即时方言语音的内容匹配；

第三确定单元，用于在所述第二检测单元检测出所述目标映射关系中的所述当前地域信息对应的方言语音的内容与所述用户输入的即时方言语音的内容不匹配时，识别所述即时方言语音对应的地域信息，根据所述即时方言语音对应的地域信息和所述目标语音模型确定出所述即时方言语音与标准普通话语音的映射关系，并从所述即时方言语音与标准普通话语音的映射关系中提取与所述即时方言语音相互映射的标准普通话语音，执行所述将所述与所述用户输入的即时方言语音相互映射的标准普通话语音转换为文本信息，并输出所述文本信息的操作。

本发明实施例第三方面公开一种电子设备，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明实施例第一方面公开的一种方言语音的识别方法。

本发明实施例第四方面公开一种计算机可读存储介质，其存储计算机程序，其中，所述计算机程序使得计算机执行本发明实施例第一方面公开的一种方言语音的识别方法。

本发明实施例第五方面公开一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。

本发明实施例第六方面公开一种应用发布平台，所述应用发布平台用于发布计算机程序产品，其中，当所述计算机程序产品在计算机上运行时，使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，通过用户当前所处的位置确定用户的当前地域信息，并查找预设的绑定当前地域信息的目标语音模型，从而可以从目标语音模型中当前地域信息对应的方言语音与标准普通话语音的映射关系的集合中确定出目标映射关系，然后从目标映射关系中获取与用户输入的即时方言语音相互映射的标准普通话语音，将标准普通话语音转换成文本信息并输出。实施本发明实施例，能够识别方言语音，得到正确语音，提高语音识别的正确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种方言语音的识别方法的流程示意图；

图2是本发明实施例公开的另一种方言语音的识别方法的流程示意图；

图3是本发明实施例公开的另一种方言语音的识别方法的流程示意图；

图4是本发明实施例公开的一种电子设备的结构示意图；

图5是本发明实施例公开的另一种电子设备的结构示意图；

图6是本发明实施例公开的另一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”等是用于区别不同的对象，而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例公开了一种方言语音的识别方法及电子设备，能够正确识别方言语音，提高语音识别的正确率。以下结合附图，从电子设备角度出发进行详细描述。

实施例一

请参阅图1，图1是本发明实施例公开的一种方言语音的识别方法的流程示意图。如图1所示，该方言语音的识别方法可以包括以下步骤。

101、电子设备获取用户的当前位置信息，并根据当前位置信息确定用户所处的当前地域信息。

本发明实施例中，电子设备可以是提供给用户进行学习的家教机、移动手机、移动平板、个人数字助理(PersonalDigital Assistant,PDA)、移动互联网设备(MobileInternet Device，MID)等各种设备。

本发明实施例中，电子设备可以内置有全球定位系统(Global PositioningSystem，GPS)模块，相应地电子设备可以通过其内置的GPS模块来检测其当前位置信息。电子设备也可以通过互联网向位置服务器发送位置获取请求，该位置获取请求携带有智能设备的电话号码，进而获得当前位置信息。

102、电子设备查找预设的绑定当前地域信息的目标语音模型，该目标语音模型包括当前地域信息对应的方言语音与标准普通话语音的映射关系的集合。

本发明实施例中，目标语音模型是根据电子设备采集的不同地域的用户的语音数据样本的发音特征对语音数据样本进行分类，并确定出分类后的语音数据样本对应的地域信息样本，以及以地域信息样本和语音数据样本的发音特征对训练模型进行训练得到的；其中，目标语音模型包括根据语音数据样本与标准普通话语音数据样本建立的映射关系的合集。所以，目标语音模型存在当前地域信息的标签，电子设备可以根据在目标语音模型中根据当前地域信息的标签查找到当前地域信息对应的方言语音与标准普通话语音的映射关系的集合。

103、电子设备从映射关系的集合中确定出目标映射关系，目标映射关系中的当前地域信息对应的方言语音的内容与用户输入的即时方言语音的内容相同。

本发明实施例中，目标映射关系是指在当前地域信息对应的方言语音与标准普通话语音的映射关系的集合中，当前地域信息对应的方言语音的内容与用户输入的即时方言语音的内容存在一一对应的关系，即用户输入的即时方言语音的内容对应的当前地域信息对应的方言语音的内容相同。

104、电子设备从目标映射关系中获取与用户输入的即时方言语音相互映射的标准普通话语音。

本发明实施例中，电子设备在目标映射关系中对用户输入的即时方言语音逐字或逐段提取相互映射的标准普通话字段，进而获得与用户输入的即时方言语音相互映射的标准普通话语音。

举例来说，在湖南省，“N”会被读成“L”，用户在进行语音问答时，可能会输入带有湖南方言的即时语音，比如“这道题目太兰了”，电子设备会在湖南省方言的映射关系中获取与湖南方言的即时语音对应的标准普通话语音，即获取“这道题目太难了”的标准普通话语音。

作为一种可选的实施方式，执行步骤104时，包括以下步骤：

电子设备检测当前语音问答场景，预测用户输入的即时方言语音指示的用户意图；

电子设备根据用户意图从目标映射关系中获取与用户输入的即时方言语音相互映射的标准普通话语音。

实施上述方法，可以结合语音问答场景去获取即时方言语音对应的标准普通话语音，能够提高方言语音识别的正确率。

105、电子设备将与用户输入的即时方言语音相互映射的标准普通话语音转换为文本信息，并输出文本信息。

本发明实施例中，电子设备可以识别标准普通话语音，结合语境分析，将标准普通话语音转换成文本信息，并在当前语音交互界面输出文本信息。

作为一种可选的实施方式，在执行步骤105之后，还可以包括以下步骤：

电子设备输出语音选择提示信息，语音选择提示信息提示用户是否选择即时方言语音对应的语音作为电子设备的播放语音；

电子设备检测到用户选择即时方言语音对应的语音作为电子设备的播放语音时，在语音交互时根据即时方言语音对应的语音与用户进行对话。

实施该实施方式，能够使用方言语音进行语音交互，更好地帮助用户理解学习内容，提高用户体验感。

可见，实施图1所描述的方言语音的识别方法，可以通过用户当前所处的位置确定用户的当前地域信息，并查找预设的绑定当前地域信息的目标语音模型，从而可以从目标语音模型中当前地域信息对应的方言语音与标准普通话语音的映射关系的集合中确定出目标映射关系，然后从目标映射关系中获取与用户输入的即时方言语音相互映射的标准普通话语音，将标准普通话语音转换成文本信息并输出。实施本发明实施例，能够识别方言语音，得到正确语音，提高语音识别的正确率。

实施例二

请参阅图2，图2是本发明实施例公开的另一种方言语音的识别方法的流程示意图。如图2所示，该方言语音的识别方法可以包括以下步骤。

201、电子设备获取用户的当前位置信息，并根据当前位置信息确定用户所处的当前地域信息。

202、电子设备查找预设的绑定当前地域信息的目标语音模型，该目标语音模型包括当前地域信息对应的方言语音与标准普通话语音的映射关系的集合。

203、电子设备从映射关系的集合中确定出目标映射关系，目标映射关系中的当前地域信息对应的方言语音的内容与用户输入的即时方言语音的内容相同。

204、电子设备从目标映射关系中获取与用户输入的即时方言语音相互映射的标准普通话语音。

205、电子设备将与用户输入的即时方言语音相互映射的标准普通话语音转换为文本信息，并输出文本信息。

206、电子设备提取文本信息的关键字段，并根据关键字段查找将关键字段作为标签的学习内容。

本发明实施例中，文本信息的关键字段是与学习内容相关联的字段，可能涉及到不同科目和不同科目下不同模块的内容，电子设备可以识别文本信息中作为标签的关键字段，然后根据该关键字段在储存学习内容的云存储模块查找出对应的学习内容。

举例来说，文本信息可以是“我想学习勾股定理”，电子设备可以提取到文本信息的关键字段“勾股定理”，然后根据关键字段“勾股定理”查找将“勾股定理”作为标签的学习内容。

207、电子设备根据文本信息识别即时方言语音指示的用户意图。

208、电子设备基于即时方言语音指示的用户意图从将关键字段作为标签的学习内容中筛选出目标学习内容，并输出目标学习内容。

本发明实施例中，即时方言语音指示的用户意图可以是做题、背诵、听写、复习等，电子设备可以根据用户意图从将关键字段作为标签的学习内容中筛选出目标学习内容，以执行用户意图指示的步骤。

作为一种可选的实施方式，在步骤208中，电子设备可以提取即时方言语音的声纹特征，并根据声纹特征识别用户年龄；

电子设备根据用户年龄从目标学习内容中选择适合用户年龄的学习内容并推送给用户。

实施该实施方式，能够根据用户年龄筛选出合适的学习内容，避免由于学习内容难度过大导致用户难以理解，提高用户的学习效率。

209、电子设备检测用户的学习时长是否大于预设时长。

210、在用户的学习时长大于预设时长时，电子设备播放语音提示信息，语音提示信息为与用户输入的即时方言语音相匹配的方言语音信息，语音提示信息用于询问用户是否理解目标学习内容。

本发明实施例中，电子设备可以根据不同的学习内容设置不同的预设时长，在超过预设时长时，可以通过播放语音提示信息来询问用户是否理解学习内容。此外，可以播放与用户输入的即时方言语音相匹配的语音提示信息，以提高语音交互的体验感。

211、电子设备接收用户根据提示信息输入的语音答复信息，并识别语音答复信息。

212、当识别出语音答复信息指示用户不理解目标学习内容时，电子设备播放语音解读信息，以供用户理解目标学习内容，语音解读信息为标准普通话语音信息或者方言语音信息。

本发明实施例中，语音解读信息是对目标学习内容的详细解析，可以在用户对目标学习内容的理解的基础上，对目标学习内容进一步的解析，使得用户能够充分理解目标学习内容。可以理解的是，语音解读信息对应的语音可以是标准普通话语音，也可以是方言语音。

作为一种可选的实施方式，在执行步骤212之后，还可以包括以下步骤：

电子设备在重启之后为用户推送目标学习内容，输出提示信息，提示信息用于提示用户对目标学习内容进行解读；

电子设备接收用户输入的解读信息，根据目标学习内容的正确解答信息检验用户输入的解读信息，获取检验结果。

实施上述方法，能够使用户对目标学习内容进行复习，并检验用户的理解成果，提高用户的学习效率。

可见，实施图2所描述的方言语音的识别方法，可以根据当前地域信息从预设的绑定当前地域信息的目标语音模型确定出目标映射关系，并获取到与用户输入的即时方言语音相互映射的标准普通话语音，将标准普通话语音转换成文本信息，能够识别方言语音，得到正确语音，提高语音识别的正确率。此外，还可以根据即时方言语音指示的用户意图输出目标学习内容供用户学习，并在用户不理解时，输出语音解读信息，帮助用户理解；其中，语音解读信息可以是标准普通话语音，也可以是方言语音，能够提高用户体验感。

实施例三

请参阅图3，图3是本发明实施例公开的另一种方言语音的识别方法的流程示意图。如图3所示，该方言语音的识别方法可以包括以下步骤。

301、电子设备获取用户的当前位置信息，并根据当前位置信息确定用户所处的当前地域信息。

302、电子设备查找预设的绑定当前地域信息的目标语音模型，该目标语音模型包括当前地域信息对应的方言语音与标准普通话语音的映射关系的集合。

303、电子设备从映射关系的集合中确定出目标映射关系，并检测目标映射关系中的当前地域信息对应的方言语音的内容是否与用户输入的即时方言语音的内容匹配。

304、在目标映射关系中的当前地域信息对应的方言语音的内容与用户输入的即时方言语音的内容不匹配时，电子设备识别即时方言语音对应的地域信息，根据即时方言语音对应的地域信息和目标语音模型确定出即时方言语音与标准普通话语音的映射关系。

305、电子设备从即时方言语音与标准普通话语音的映射关系中提取与即时方言语音相互映射的标准普通话语音。

306、电子设备将与用户输入的即时方言语音相互映射的标准普通话语音转换为文本信息，并输出文本信息。

307-313；其中，步骤307-步骤313与实施例二中的步骤206-步骤212相同，在此不再赘述。

可见，实施图3所描述的方言语音的识别方法，可以根据当前地域信息从预设的绑定当前地域信息的目标语音模型确定出目标映射关系，并检测目标映射关系中的当前地域信息对应的方言语音的内容是否与用户输入的即时方言语音的内容匹配，在不匹配时，根据即时方言语音重新确定出即时方言语音与标准普通话语音的映射关系，获取到与用户输入的即时方言语音相互映射的标准普通话语音，将标准普通话语音转换成文本信息，能够识别方言语音，得到正确语音，提高语音识别的正确率。此外，还可以根据即时方言语音指示的用户意图输出目标学习内容供用户学习，并在用户不理解时，输出语音解读信息，帮助用户理解；其中，语音解读信息可以是标准普通话语音，也可以是方言语音，能够提高用户体验感。

实施例四

图4是本发明实施例公开的一种电子设备的结构示意图。如图4所示，该电子设备可以包括：

第一确定单元401，用于获取用户的当前位置信息，并根据当前位置信息确定用户所处的当前地域信息。

第一查找单元402，用于查找预设的绑定当前地域信息的目标语音模型。

其中，目标语音模型包括当前地域信息对应的方言语音与标准普通话语音的映射关系的集合。

本发明实施例中，目标语音模型存在当前地域信息的标签，电子设备可以根据在目标语音模型中根据当前地域信息的标签查找到当前地域信息对应的方言语音与标准普通话语音的映射关系的集合。

第二确定单元403，用于从映射关系的集合中确定出目标映射关系，目标映射关系中的当前地域信息对应的方言语音的内容与用户输入的即时方言语音的内容相同。

获取单元404，用于从目标映射关系中获取与用户输入的即时方言语音相互映射的标准普通话语音。

作为一种可选的实施方式，上述获取单元404，还用于检测当前语音问答场景，预测用户输入的即时方言语音指示的用户意图；根据用户意图从目标映射关系中获取与用户输入的即时方言语音相互映射的标准普通话语音。

第一输出单元405，用于将与用户输入的即时方言语音相互映射的标准普通话语音转换为文本信息，并输出文本信息。

作为一种可选的实施方式，上述第一输出单元405，还用于输出语音选择提示信息，语音选择提示信息提示用户是否选择即时方言语音对应的语音作为电子设备的播放语音；检测到用户选择即时方言语音对应的语音作为电子设备的播放语音时，在语音交互时根据即时方言语音对应的语音与用户进行对话。

可见，实施图4所描述的电子设备，可以通过用户当前所处的位置确定用户的当前地域信息，并查找预设的绑定当前地域信息的目标语音模型，从而可以从目标语音模型中当前地域信息对应的方言语音与标准普通话语音的映射关系的集合中确定出目标映射关系，然后从目标映射关系中获取与用户输入的即时方言语音相互映射的标准普通话语音，将标准普通话语音转换成文本信息并输出。实施本发明实施例，能够识别方言语音，得到正确语音，提高语音识别的正确率。

实施例五

图5是本发明实施例公开的另一种电子设备的结构示意图。如图5所示，其中，图5所示的电子设备是由图4所示的电子设备进行优化得到的。与图4所示的电子设备相比较，图5所示的电子设备还可以包括：

上述第一查找单元402查找到的预设的绑定当前地域信息的目标语音模型是根据电子设备采集的不同地域的用户的语音数据样本的发音特征对语音数据样本进行分类，并确定出分类后的语音数据样本对应的地域信息样本，以及以地域信息样本和语音数据样本的发音特征对训练模型进行训练得到的；其中，目标语音模型包括根据语音数据样本与标准普通话语音数据样本建立的映射关系的合集。

第二查找单元406，用于在第一输出单元405输出文本信息之后，提取文本信息的关键字段，并根据关键字段查找将关键字段作为标签的学习内容。

第一识别单元407，用于根据文本信息识别即时方言语音指示的用户意图；

第二输出单元408，用于基于即时方言语音指示的用户意图从将关键字段作为标签的学习内容中筛选出目标学习内容，并输出目标学习内容。

作为一种可选的实施方式，上述第二输出单元408，还用于提取即时方言语音的声纹特征，并根据声纹特征识别用户年龄；根据用户年龄从目标学习内容中选择适合用户年龄的学习内容并推送给用户。

第一检测单元409，用于在第二输出单元408输出目标学习内容之后，检测用户的学习时长是否大于预设时长；

提示单元410，用于在第一检测单元409检测出用户的学习时长大于预设时长时，播放语音提示信息，语音提示信息为与用户输入的即时方言语音相匹配的方言语音信息，语音提示信息用于询问用户是否理解目标学习内容。

第二识别单元411，用于接收用户根据提示信息输入的语音答复信息，并识别语音答复信息；

播放单元412，用于在第二识别单元411识别出语音答复信息指示用户不理解目标学习内容时，播放语音解读信息，以供用户理解目标学习内容，语音解读信息为标准普通话语音信息或者方言语音信息。

作为一种可选的实施方式，上述播放单元412，还用于在重启之后为用户推送目标学习内容，输出提示信息，提示信息用于提示用户对目标学习内容进行解读；接收用户输入的解读信息，根据目标学习内容的正确解答信息检验用户输入的解读信息，获取检验结果。

第二检测单元413，用于检测目标映射关系中的当前地域信息对应的方言语音的内容是否与用户输入的即时方言语音的内容匹配；

第三确定单元414，用于在第二检测单元413检测出目标映射关系中的当前地域信息对应的方言语音的内容与用户输入的即时方言语音的内容不匹配时，识别即时方言语音对应的地域信息，根据即时方言语音对应的地域信息和目标语音模型确定出即时方言语音与标准普通话语音的映射关系，并从即时方言语音与标准普通话语音的映射关系中提取与即时方言语音相互映射的标准普通话语音，执行将与用户输入的即时方言语音相互映射的标准普通话语音转换为文本信息，并输出文本信息的操作。

可见，实施图5所描述的电子设备，可以根据当前地域信息从预设的绑定当前地域信息的目标语音模型确定出目标映射关系，并检测目标映射关系中的当前地域信息对应的方言语音的内容是否与用户输入的即时方言语音的内容匹配，在匹配时，获取到与用户输入的即时方言语音相互映射的标准普通话语音；在不匹配时，根据即时方言语音重新确定出即时方言语音与标准普通话语音的映射关系，获取到与用户输入的即时方言语音相互映射的标准普通话语音；将通过两种方式获取到的标准普通话语音转换成文本信息，能够识别方言语音，得到正确语音，提高语音识别的正确率。此外，还可以根据即时方言语音指示的用户意图输出目标学习内容供用户学习，并在用户不理解时，输出语音解读信息，帮助用户理解；其中，语音解读信息可以是标准普通话语音，也可以是方言语音，能够提高用户体验感。

实施例六

请参阅图6，图6是本发明实施例公开的另一种电子设备的结构示意图。如图6所示，该电子设备可以包括：

存储有可执行程序代码的存储器601；

与存储器601耦合的处理器602；

其中，处理器602调用存储器601中存储的可执行程序代码，执行图1～图3任意一种方言语音的识别方法。

本发明实施例公开一种计算机可读存储介质，其存储计算机程序，其中，该计算机程序使得计算机执行图1～图3任意一种方言语音的识别方法。

本发明实施例还公开一种计算机程序产品，其中，当计算机程序产品在计算机上运行时，使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本发明实施例公开的一种方言语音的识别方法及电子设备进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种方言语音的识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述预设的绑定所述当前地域信息的目标语音模型是根据所述电子设备采集的不同地域的用户的语音数据样本的发音特征对所述语音数据样本进行分类，并确定出分类后的语音数据样本对应的地域信息样本，以及以所述地域信息样本和所述语音数据样本的发音特征对训练模型进行训练得到的；其中，所述目标语音模型包括根据所述语音数据样本与标准普通话语音数据样本建立的映射关系的合集。

3.根据权利要求2所述的方法，其特征在于，在所述电子设备输出所述文本信息之后，所述方法还包括：

4.根据权利要求1～3任一项所述的方法，其特征在于，所述电子设备输出所述目标学习内容之后，所述方法还包括：

所述电子设备检测用户的学习时长是否大于预设时长；

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

6.一种电子设备，其特征在于，所述电子设备包括：

7.根据权利要求6所述的电子设备，其特征在于，所述第一查找单元查找到的所述预设的绑定所述当前地域信息的目标语音模型是根据所述电子设备采集的不同地域的用户的语音数据样本的发音特征对所述语音数据样本进行分类，并确定出分类后的语音数据样本对应的地域信息样本，以及以所述地域信息样本和所述语音数据样本的发音特征对训练模型进行训练得到的；其中，所述目标语音模型包括根据所述语音数据样本与标准普通话语音数据样本建立的映射关系的合集。

8.根据权利要求7所述的电子设备，其特征在于，所述电子设备还包括：

9.根据权利要求6～8任一项所述的电子设备，其特征在于，所述电子设备还包括：

10.根据权利要求9所述的电子设备，其特征在于，所述电子设备还包括：