CN109410664B - 一种发音纠正方法及电子设备 - Google Patents

一种发音纠正方法及电子设备 Download PDF

Info

Publication number
CN109410664B
CN109410664B CN201811514834.9A CN201811514834A CN109410664B CN 109410664 B CN109410664 B CN 109410664B CN 201811514834 A CN201811514834 A CN 201811514834A CN 109410664 B CN109410664 B CN 109410664B
Authority
CN
China
Prior art keywords
pronunciation
reading
voice
user
electronic equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811514834.9A
Other languages
English (en)
Other versions
CN109410664A (zh
Inventor
崔颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201811514834.9A priority Critical patent/CN109410664B/zh
Publication of CN109410664A publication Critical patent/CN109410664A/zh
Application granted granted Critical
Publication of CN109410664B publication Critical patent/CN109410664B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/065Combinations of audio and video presentations, e.g. videotapes, videodiscs, television systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明实施例涉及电子设备技术领域,公开了一种发音纠正方法及电子设备,该方法包括:获取用户朗读文本时输入的朗读语音,提取朗读语音的发音特征;根据目标语音模型和朗读语音的发音特征,得到朗读语音的发音特征对应的目标地域信息;在地域语言映射关系中查找与目标地域信息对应的目标地域语言,获取目标地域语言对应的发音问题集合;根据发音问题集合识别朗读语音的发音问题;在屏幕上输出朗读语音的发音问题,并播放文本的标准朗读发音,以引导用户对发音问题进行纠正。实施本发明实施例,能够检测出用户发音存在的问题,对用户发音进行纠正,引导用户进行标准发音。

Description

一种发音纠正方法及电子设备
技术领域
本发明涉及电子设备技术领域,尤其涉及一种发音纠正方法及电子设备。
背景技术
随着科学技术的发展,学生使用电子设备(如家教机)进行学习已经越来越普遍,学生可以使用电子设备进行文本的朗读训练。学生在朗读文本的过程中往往需要注重发音标准,但是,目前电子设备的朗读功能只能为学生提供背景音乐和示范朗读,起到营造朗读氛围和示范跟读的作用,对学生朗读时的发音是否正确、发音是否标准以及是否存在口音的问题并未明确指出,导致学生无法获得即时有效的朗读发音反馈,无法解决学生朗读时存在的发音问题。
发明内容
本发明实施例公开了一种发音纠正方法及电子设备,能够检测出用户发音存在的问题,对用户发音进行纠正,引导用户进行标准发音。
本发明实施例第一方面公开一种发音纠正方法,所述方法包括:
电子设备获取用户朗读文本时输入的朗读语音,提取所述朗读语音的发音特征;
所述电子设备根据目标语音模型和所述朗读语音的发音特征,得到所述朗读语音的发音特征对应的目标地域信息;
所述电子设备在地域语言映射关系中查找与所述目标地域信息对应的目标地域语言,获取所述目标地域语言对应的发音问题集合;
所述电子设备根据所述发音问题集合识别所述朗读语音的发音问题;
所述电子设备在屏幕上输出所述朗读语音的发音问题,并播放所述文本的标准朗读发音,以引导用户对所述发音问题进行纠正。
作为一种可选的实施方式,在本发明实施例第一方面中,在所述电子设备获取用户朗读文本时输入的朗读语音,提取所述朗读语音的发音特征之前,所述方法还包括:
所述电子设备采集不同地域的用户的语音数据样本,将所述语音数据样本传送至服务器,以供所述服务器根据所述语音数据样本的发音特征和从所述语音数据样本提取的发音问题对所述语音数据样本进行分类,并确定出分类后的语音数据样本对应的地域信息样本,以所述语音数据样本的发音特征作为训练模型的输入及将所述地域信息样本作为所述训练模型的输出,对所述训练模型进行训练以获得所述目标语音模型,以及根据所述地域信息样本与从所述语音数据样本提取的发音问题建立所述地域语言映射关系;
所述电子设备从所述服务器中导出所述目标语音模型和所述地域语言映射关系。
作为一种可选的实施方式,在本发明实施例第一方面中,所述电子设备根据目标语音模型和所述朗读语音的发音特征,得到所述朗读语音的发音特征对应的目标地域信息,包括:
所述电子设备将所述朗读语音的发音特征输入至所述目标语音模型;
所述电子设备获取所述目标语音模型根据所述朗读语音的发音特征分析得到的所述目标地域信息。
作为一种可选的实施方式,在本发明实施例第一方面中,在所述电子设备根据所述发音问题集合识别所述朗读语音的发音问题之后,所述方法还包括:
所述电子设备获取所述电子设备存储的所述用户的历史朗读语音记录中的历史发音问题;
所述电子设备对重合发音问题进行标记,以获得标记发音问题,所述重合发音问题为所述历史发音问题与所述朗读语音的发音问题中存在重合的发音问题;
所述电子设备将所述重合发音问题发送给管控终端,以使所述管控终端管控所述用户纠正所述重合发音问题;以及,设置复习周期,并基于所述复习周期向所述用户推送所述重合发音问题以引导所述用户对所述重合发音问题进行纠正。
作为一种可选的实施方式,在本发明实施例第一方面中,所述电子设备在屏幕上输出所述朗读语音的发音问题,并播放所述文本的标准朗读发音,以引导用户对所述发音问题进行纠正,包括:
所述电子设备在屏幕上输出所述朗读语音的发音问题以及输出第一提示信息,所述第一提示信息用于提示用户根据所述标准朗读发音进行朗读;
所述电子设备播放所述标准朗读发音,并检测所述用户的复读语音,判断所述复读语音是否与所述标准朗读发音匹配;
如果所述复读语音与所述标准朗读发音不匹配,执行所述播放所述标准朗读发音,并检测所述用户的复读语音,判断所述用户的复读语音是否与所述标准朗读发音匹配的步骤;
所述电子设备当检测到所述用户的复读语音与所述标准朗读发音的匹配度达到预设阈值时输出第二提示信息,或者在检测到所述用户输入的结束请求时输出所述第二提示信息,所述第二提示信息用于提示所述用户结束对所述文本的朗读纠正流程。
本发明实施例第二方面公开一种电子设备,所述电子设备包括:
提取单元,用于获取用户朗读文本时输入的朗读语音,提取所述朗读语音的发音特征;
第一获取单元,用于根据目标语音模型和所述朗读语音的发音特征,得到所述朗读语音的发音特征对应的目标地域信息;
查找单元,用于在地域语言映射关系中查找与所述目标地域信息对应的目标地域语言,获取所述目标地域语言对应的发音问题集合;
识别单元,用于根据所述发音问题集合识别所述朗读语音的发音问题;
纠正单元,用于在屏幕上输出所述朗读语音的发音问题,并播放所述文本的标准朗读发音,以引导用户对所述发音问题进行纠正。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
采集单元,用于在所述提取单元获取用户朗读文本时输入的朗读语音,提取所述朗读语音的发音特征之前,采集不同地域的用户的语音数据样本,将所述语音数据样本传送至服务器,以供所述服务器根据所述语音数据样本的发音特征和从所述语音数据样本提取的发音问题对所述语音数据样本进行分类,并确定出分类后的语音数据样本对应的地域信息样本,以所述语音数据样本的发音特征作为训练模型的输入及将所述地域信息样本作为所述训练模型的输出,对所述训练模型进行训练以获得所述目标语音模型,以及根据所述地域信息样本与从所述语音数据样本提取的发音问题建立所述地域语言映射关系;
导出单元,用于从所述服务器中导出所述目标语音模型和所述地域语言映射关系。
作为一种可选的实施方式,在本发明实施例第二方面中,所述第一获取单元包括:
输入子单元,用于将所述朗读语音的发音特征输入至所述目标语音模型;
获取子单元,用于获取所述目标语音模型根据所述朗读语音的发音特征分析得到的所述目标地域信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
第二获取单元,用于在所述识别单元根据所述发音问题集合识别所述朗读语音的发音问题之后,获取所述电子设备存储的所述用户的历史朗读语音记录中的历史发音问题;
标记单元,用于对重合发音问题进行标记,以获得标记发音问题,所述重合发音问题为所述历史发音问题与所述朗读语音的发音问题中存在重合的发音问题;
管控单元,用于将所述重合发音问题发送给管控终端,以使所述管控终端管控所述用户纠正所述重合发音问题;以及,设置复习周期,并基于所述复习周期向所述用户推送所述重合发音问题以引导所述用户对所述重合发音问题进行纠正。
作为一种可选的实施方式,在本发明实施例第二方面中,所述纠正单元包括:
第一输出子单元,用于在屏幕上输出所述朗读语音的发音问题以及输出第一提示信息,所述第一提示信息用于提示用户根据所述标准朗读发音进行朗读;
检测子单元,用于播放所述标准朗读发音,并检测所述用户的复读语音,判断所述复读语音是否与所述标准朗读发音匹配;
所述检测子单元,还用于在判断出所述复读语音与所述标准朗读发音不匹配时,播放所述标准朗读发音,并检测所述用户的复读语音,判断所述复读语音是否与所述标准朗读发音匹配;
第二输出子单元,用于当检测到所述用户的复读语音与所述标准朗读发音的匹配度达到预设阈值时输出第二提示信息,或者在检测到所述用户输入的结束请求时输出所述第二提示信息,所述第二提示信息用于提示所述用户结束对所述文本的朗读纠正流程。
本发明实施例第三方面公开一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的一种发音纠正方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种发音纠正方法。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,获取用户朗读文本时输入的朗读语音,提取朗读语音的发音特征,利用训练好的目标语音模型根据朗读语音的发音特征确定出朗读语音的发音特征对应的目标地域信息;然后在地域语言映射关系中查找出目标地域信息对应的目标地域语言,获取目标地域语言对应的发音问题集合,从而可以根据发音问题集合识别所述朗读语音的发音问题,之后,播放文本朗读的标准朗读发音,以引导用户对发音问题进行纠正。实施本发明实施例,能够检测出用户发音存在的问题,对用户发音进行纠正,引导用户进行标准发音。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种发音纠正方法的流程示意图;
图2是本发明实施例公开的另一种发音纠正方法的流程示意图;
图3是本发明实施例公开的一种电子设备的结构示意图;
图4是本发明实施例公开的另一种电子设备的结构示意图;
图5是本发明实施例公开的另一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种发音纠正方法及电子设备,能够检测出用户发音存在的问题,对用户发音进行纠正,引导用户进行标准发音。以下结合附图,从电子设备角度出发进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种发音纠正方法的流程示意图。如图1所示,该发音纠正方法可以包括以下步骤。
101、电子设备获取用户朗读文本时输入的朗读语音,提取朗读语音的发音特征。
本发明实施例中,电子设备可以是提供给用户进行学习的家教机、移动手机、移动平板、个人数字助理(Personal Digital Assistant,PDA)、移动互联网设备(MobileInternet Device,MID)等各种设备。
本发明实施例中,发音特征主要是指说话时的口音和声调,用于反映不同地域的发音特点,可以通过发音特征识别地方语言,从而可以根据地方语言读取方言语音表达的意思。
本发明实施例中,电子设备通过声音采集设备获取用户朗读文本时输入的朗读语音,用户朗读的文本可以是电子设备输出的一段文本,也可以是课文中的一段文本,本发明实施例不作限定;当用户朗读的文本是课文中的一段文本时,电子设备可以通过摄像头拍摄该段文本,并对该段文本进行识别。然后,电子设备对朗读语音进行预处理,获得朗读语音的发音特征数据。
102、电子设备根据目标语音模型和朗读语音的发音特征,得到朗读语音的发音特征对应的目标地域信息。
本发明实施例中,电子设备将朗读语音的发音特征数据输入至目标语音模型,然后,目标语音模型根据发音特征数据计算得到不同地域信息对应的概率,并从中获取最大概率对应的地域信息作为目标地域信息,将目标地域信息输送给电子设备,从而使得电子设备获得朗读语音的发音特征对应的目标地域信息。
其中,不同地域对应着不同发音特征,举例来说,湖南地区主要是讲湘方言,湘方言中的发音特征有:“H”常常被读作“F”,比如“湖”读成“福”,“N”都是读作“L”,比如“南”读成“兰”,同时,后鼻音读成前鼻音,比如“eng”读成“en”、“ing”读成“in”等,因此,根据这些发音特征可以确定出是湘方言,从而确定地域是湖南。
作为一种可选的实施方式,在执行步骤102之后,还可以包括以下步骤:
电子设备获取当前地域信息,并判断当前地域信息与朗读语音的发音特征对应的目标地域信息是否匹配;
如果匹配,则执行步骤103;如果不匹配,输出询问信息,询问信息用于向用户询问朗读语音是属于当前地域信息对应的方言语音或者目标地域信息对应的方言语音。
实施上述方法,可以进一步确定朗读语音对应的方言语音,使得朗读语音的发音问题的识别更加精准。
103、电子设备在地域语言映射关系中查找与目标地域信息对应的目标地域语言,获取目标地域语言对应的发音问题集合。
104、电子设备根据发音问题集合识别朗读语音的发音问题。
本发明实施例中,电子设备根据发音问题集合检测朗读语音中存在与发音问题集合中的发音问题匹配的发音问题,并提取该发音问题。
105、电子设备在屏幕上输出朗读语音的发音问题,并播放文本的标准朗读发音,以引导用户对发音问题进行纠正。
本发明实施例中,电子设备可以在屏幕上输出朗读语音存在发音问题所对应的文字或字段,同时在文字或字段的上方输出文字或字段对应的拼音,并播放文本的标准朗读发音,以引导用户根据拼音和标准朗读发音进行跟读,对发音问题进行纠正。
作为一种可选的实施方式,在执行步骤105之后,还可以包括以下步骤:
电子设备提取所有朗读语音的发音问题对应的目标文字,根据目标文字生成新的文本供用户进行朗读;
电子设备获取用户朗读新的文本时输入的新的朗读发音,根据发音问题集合检测新的朗读发音是否存在发音问题,如果是,则重新执行步骤105;如果否,则结束引导用户对发音问题进行纠正的流程。
实施该实施方式,可以获取新的关联文本检验用户对发音问题的纠正效果,提高发音问题纠正的效率以及用户体验感。
可见,实施图1所描述的发音纠正方法,可以获取用户朗读文本时输入的朗读语音,提取朗读语音的发音特征,利用训练好的目标语音模型根据朗读语音的发音特征确定出朗读语音的发音特征对应的目标地域信息;然后在地域语言映射关系中查找出目标地域信息对应的目标地域语言,获取目标地域语言对应的发音问题集合,从而可以根据发音问题集合识别所述朗读语音的发音问题,之后,播放文本朗读的标准朗读发音,以引导用户对发音问题进行纠正。实施本发明实施例,能够检测出用户发音存在的问题,对用户发音进行纠正,引导用户进行标准发音。
实施例二
请参阅图2,图2是本发明实施例公开的另一种发音纠正方法的流程示意图。如图2所示,该发音纠正方法可以包括以下步骤。
201、电子设备获取用户朗读文本时输入的朗读语音,提取朗读语音的发音特征。
202、电子设备根据目标语音模型和朗读语音的发音特征,得到朗读语音的发音特征对应的目标地域信息。
本发明实施例中,电子设备可以采集不同地域的用户的语音数据样本,将语音数据样本传送至服务器,以供服务器根据语音数据样本的发音特征和从语音数据样本提取的发音问题对语音数据样本进行分类,并确定出分类后的语音数据样本对应的地域信息样本,以语音数据样本的发音特征作为训练模型的输入及将地域信息样本作为训练模型的输出,对训练模型进行训练以获得目标语音模型,以及根据地域信息样本与从语音数据样本提取的发音问题建立地域语言映射关系;以及从服务器中导出目标语音模型和地域语言映射关系。
203、电子设备在地域语言映射关系中查找与目标地域信息对应的目标地域语言,获取目标地域语言对应的发音问题集合。
204、电子设备根据发音问题集合识别朗读语音的发音问题。
205、电子设备获取电子设备存储的用户的历史朗读语音记录中的历史发音问题。
本发明实施例中,电子设备根据朗读语音的声线特征从存储模块获取当前用户的历史朗读语音记录,并筛选出历史朗读语音记录中的历史发音问题,其中,存储模块可以是电子设备的存储模块,也可以是云服务器的存储模块,本发明实施例不作限定。
206、电子设备对重合发音问题进行标记,以获得标记发音问题,重合发音问题为历史发音问题与朗读语音的发音问题中存在重合的发音问题。
本发明实施例中,电子设备将历史发音问题与当前朗读语音的发音问题进行比对,找出重合发音问题,在输出发音问题时对重合发音问题进行标记,所以在输出界面显示带有标记的发音问题和不带标记的发音问题,以对重合发音问题突出显示;标记可以是加粗显示、下划线显示、不同颜色背景显示等,本发明实施例不作限定。
207、电子设备将重合发音问题发送给管控终端,以使管控终端管控用户纠正重合发音问题;以及,设置复习周期,并基于复习周期向用户推送重合发音问题以引导用户对重合发音问题进行纠正。
本发明实施例中,管控终端可以是与电子设备绑定的用户监护人的终端设备,终端设备获取电子设备发送的重合发音问题之后,用户监护人可以不定时检查用户的重合发音问题纠正成果,起到监督管控的作用,可以提高发音问题的纠正效率。此外,可以在电子设备设置复习周期,复习周期的时间可以是2天、3天、4天等,本发明实施例不作限定;然后,根据复习周期引导用户纠正重合发音问题,以提高纠正效率。
208、电子设备在屏幕上输出朗读语音的发音问题以及输出第一提示信息,第一提示信息用于提示用户根据标准朗读发音进行朗读。
209、电子设备播放标准朗读发音,并检测用户的复读语音,判断复读语音是否与标准朗读发音匹配;如果是,执行步骤211;如果否,执行步骤210。
210、电子设备执行播放标准朗读发音,并检测用户的复读语音,判断用户的复读语音是否与标准朗读发音匹配的步骤。
211、电子设备当检测到用户的复读语音与标准朗读发音的匹配度达到预设阈值时输出第二提示信息,或者在检测到用户输入的结束请求时输出第二提示信息,第二提示信息用于提示用户结束对文本的朗读纠正流程。
作为一种可选的实施方式,在执行步骤211之后,还可以包括以下步骤:
电子设备在重新开启之后,获取用户存在发音问题的朗读文本,并将朗读文本推送给用户进行朗读;
电子设备获取用户该次朗读文本时的朗读语音,检测该次朗读文本时的朗读语音是否存在上述发音问题,如果是,则继续对用户的发音问题及进行纠正;如果否,获取用户的学习意图,执行用户的学习意图所指示的操作。
实施上述方法,能够检验用户发音问题的纠正成果,避免因时间因素遗忘对发音问题的纠正,提高对发音问题的纠正效率。
可见,实施图2所描述的发音纠正方法,可以获取用户朗读文本时输入的朗读语音,提取朗读语音的发音特征,利用训练好的目标语音模型根据朗读语音的发音特征确定出朗读语音的发音特征对应的目标地域信息;然后在地域语言映射关系中查找出目标地域信息对应的目标地域语言,获取目标地域语言对应的发音问题集合,从而可以根据发音问题集合识别所述朗读语音的发音问题,之后,播放文本朗读的标准朗读发音,以引导用户对发音问题进行纠正。实施本发明实施例,能够检测出用户发音存在的问题,对用户发音进行纠正,引导用户进行标准发音。此外,还可以标记重合发音问题,并基于复习周期向用户推送重合发音问题以引导用户对重合发音问题进行纠正,以及检测用户的复读语音,在复读语音与标准朗读发音不匹配时,继续对发音问题进行纠正,在复读语音与标准朗读发音匹配时,结束发音纠正过程,能够提高发音纠正的效率。
举例来说,用户朗读的文本可以是“春风又绿江南岸,明月何时照我还”,提取朗读语音的发音特征,比如将“南”字念成“兰”的读音,从而可以确定用户所在地域是湖南,进一步获取湖南方言的发音问题集合,识别朗读语音的发音问题,然后播放标准朗读发音以引导用户对发音问题进行纠正。
实施例三
图3是本发明实施例公开的一种电子设备的结构示意图。如图3所示,该电子设备可以包括:
提取单元301,用于获取用户朗读文本时输入的朗读语音,提取朗读语音的发音特征。
本发明实施例中,发音特征主要是指说话时的口音和声调,用于反映不同地域的发音特点,可以通过发音特征识别地方语言,从而可以根据地方语言读取方言语音表达的意思。
本发明实施例中,提取单元301通过声音采集设备获取用户朗读文本时输入的朗读语音,用户朗读的文本可以是电子设备输出的一段文本,也可以是课文中的一段文本,本发明实施例不作限定;当用户朗读的文本是课文中的一段文本时,提取单元301可以通过摄像头拍摄该段文本,并对该段文本进行识别,对朗读语音进行预处理,获得朗读语音的发音特征数据。
第一获取单元302,用于根据目标语音模型和朗读语音的发音特征,得到朗读语音的发音特征对应的目标地域信息。
本发明实施例中,第一获取单元302将朗读语音的发音特征数据输入至目标语音模型,然后,目标语音模型根据发音特征数据计算得到不同地域信息对应的概率,并从中获取最大概率对应的地域信息作为目标地域信息,将目标地域信息输送给电子设备,从而可以获得朗读语音的发音特征对应的目标地域信息。
其中,不同地域对应着不同发音特征,举例来说,湖南地区主要是讲湘方言,湘方言中的发音特征有:“H”常常被读作“F”,比如“湖”读成“福”,“N”都是读作“L”,比如“南”读成“兰”,同时,后鼻音读成前鼻音,比如“eng”读成“en”、“ing”读成“in”等,因此,根据这些发音特征可以确定出是湘方言,从而确定地域是湖南。
作为一种可选的实施方式,第一获取单元302,还用于获取当前地域信息,并判断当前地域信息与朗读语音的发音特征对应的目标地域信息是否匹配;
如果匹配,查找单元303用于在地域语言映射关系中查找与目标地域信息对应的目标地域语言,获取目标地域语言对应的发音问题集合;如果不匹配,输出询问信息,询问信息用于向用户询问朗读语音是属于当前地域信息对应的方言语音或者目标地域信息对应的方言语音。
实施上述方法,可以进一步确定朗读语音对应的方言语音,使得朗读语音的发音问题的识别更加精准。
查找单元303,用于在地域语言映射关系中查找与目标地域信息对应的目标地域语言,获取目标地域语言对应的发音问题集合;
识别单元304,用于根据发音问题集合识别朗读语音的发音问题。
本发明实施例中,识别单元304根据发音问题集合检测朗读语音中存在与发音问题集合中的发音问题匹配的发音问题,并提取该发音问题。
纠正单元305,用于在屏幕上输出朗读语音的发音问题,并播放文本的标准朗读发音,以引导用户对发音问题进行纠正。
本发明实施例中,纠正单元305可以在屏幕上输出朗读语音存在发音问题所对应的文字或字段,同时在文字或字段的上方输出文字或字段对应的拼音,并播放文本的标准朗读发音,以引导用户根据拼音和标准朗读发音进行跟读,对发音问题进行纠正。
作为一种可选的实施方式,纠正单元305还用于提取所有朗读语音的发音问题对应的目标文字,根据目标文字生成新的文本供用户进行朗读;获取用户朗读新的文本时输入的新的朗读发音,根据发音问题集合检测新的朗读发音是否存在发音问题,如果是,则重新在屏幕上输出朗读语音的发音问题,并播放文本的标准朗读发音,以引导用户对发音问题进行纠正;如果否,则结束引导用户对发音问题进行纠正的流程。
实施该实施方式,可以获取新的关联文本检验用户对发音问题的纠正效果,提高发音问题纠正的效率以及用户体验感。
可见,实施图3所描述的电子设备,可以获取用户朗读文本时输入的朗读语音,提取朗读语音的发音特征,利用训练好的目标语音模型根据朗读语音的发音特征确定出朗读语音的发音特征对应的目标地域信息;然后在地域语言映射关系中查找出目标地域信息对应的目标地域语言,获取目标地域语言对应的发音问题集合,从而可以根据发音问题集合识别所述朗读语音的发音问题,之后,播放文本朗读的标准朗读发音,以引导用户对发音问题进行纠正。实施本发明实施例,能够检测出用户发音存在的问题,对用户发音进行纠正,引导用户进行标准发音。
实施例四
图4是本发明实施例公开的另一种电子设备的结构示意图。如图4所示,其中,图4所示的电子设备是由图3所示的电子设备进行优化得到的。与图3所示的电子设备相比较,图4所示的电子设备还可以包括:
采集单元306,用于在上述提取单元301获取用户朗读文本时输入的朗读语音,提取朗读语音的发音特征之前,采集不同地域的用户的语音数据样本,将语音数据样本传送至服务器,以供服务器根据语音数据样本的发音特征和从语音数据样本提取的发音问题对语音数据样本进行分类,并确定出分类后的语音数据样本对应的地域信息样本,以语音数据样本的发音特征作为训练模型的输入及将地域信息样本作为训练模型的输出,对训练模型进行训练以获得目标语音模型,以及根据地域信息样本与从语音数据样本提取的发音问题建立地域语言映射关系;
导出单元307,用于从服务器中导出目标语音模型和地域语言映射关系。
作为一种可选的实施方式,上述第一获取单元302包括:
输入子单元308,用于将朗读语音的发音特征输入至目标语音模型;
获取子单元309,用于获取目标语音模型根据朗读语音的发音特征分析得到的目标地域信息。
第二获取单元310,用于在上述识别单元304根据发音问题集合识别朗读语音的发音问题之后,获取电子设备存储的用户的历史朗读语音记录中的历史发音问题。
本发明实施例中,第二获取单元310根据朗读语音的声线特征从存储模块获取当前用户的历史朗读语音记录,并筛选出历史朗读语音记录中的历史发音问题,其中,存储模块可以是电子设备的存储模块,也可以是云服务器的存储模块,本发明实施例不作限定。
标记单元311,用于对重合发音问题进行标记,以获得标记发音问题,重合发音问题为历史发音问题与朗读语音的发音问题中存在重合的发音问题。
本发明实施例中,标记单元311将历史发音问题与当前朗读语音的发音问题进行比对,找出重合发音问题,在输出发音问题时对重合发音问题进行标记,所以在输出界面显示带有标记的发音问题和不带标记的发音问题,以对重合发音问题突出显示;标记可以是加粗显示、下划线显示、不同颜色背景显示等,本发明实施例不作限定。
管控单元312,用于将重合发音问题发送给管控终端,以使管控终端管控用户纠正重合发音问题;以及,设置复习周期,并基于复习周期向用户推送重合发音问题以引导用户对重合发音问题进行纠正。
本发明实施例中,管控终端可以是与电子设备绑定的用户监护人的终端设备,终端设备获取管控单元312发送的重合发音问题之后,用户监护人可以不定时检查用户的重合发音问题纠正成果,起到监督管控的作用,可以提高发音问题的纠正效率。此外,管控单元312可以设置复习周期,复习周期的时间可以是2天、3天、4天等,本发明实施例不作限定;然后,根据复习周期引导用户纠正重合发音问题,以提高纠正效率。
作为一种可选的实施方式,上述纠正单元305包括:
第一输出子单元313,用于在屏幕上输出朗读语音的发音问题以及输出第一提示信息,第一提示信息用于提示用户根据标准朗读发音进行朗读;
检测子单元314,用于播放标准朗读发音,并检测用户的复读语音,判断复读语音是否与标准朗读发音匹配;
上述检测子单元314,还用于在判断出复读语音与标准朗读发音不匹配时,播放标准朗读发音,并检测用户的复读语音,判断复读语音是否与标准朗读发音匹配;
第二输出子单元315,用于当检测到用户的复读语音与标准朗读发音的匹配度达到预设阈值时输出第二提示信息,或者在检测到用户输入的结束请求时输出第二提示信息,第二提示信息用于提示用户结束对文本的朗读纠正流程。
作为一种可选的实施方式,纠正单元305还用于在重新开启之后,获取用户存在发音问题的朗读文本,并将朗读文本推送给用户进行朗读;获取用户该次朗读文本时的朗读语音,检测该次朗读文本时的朗读语音是否存在上述发音问题,如果是,则继续对用户的发音问题及进行纠正;如果否,获取用户的学习意图,执行用户的学习意图所指示的操作。
实施上述方法,能够检验用户发音问题的纠正成果,避免因时间因素遗忘对发音问题的纠正,提高对发音问题的纠正效率。
可见,实施图4所描述的电子设备,可以获取用户朗读文本时输入的朗读语音,提取朗读语音的发音特征,利用训练好的目标语音模型根据朗读语音的发音特征确定出朗读语音的发音特征对应的目标地域信息;然后在地域语言映射关系中查找出目标地域信息对应的目标地域语言,获取目标地域语言对应的发音问题集合,从而可以根据发音问题集合识别所述朗读语音的发音问题,之后,播放文本朗读的标准朗读发音,以引导用户对发音问题进行纠正。实施本发明实施例,能够检测出用户发音存在的问题,对用户发音进行纠正,引导用户进行标准发音。此外,还可以标记重合发音问题,并基于复习周期向用户推送重合发音问题以引导用户对重合发音问题进行纠正,以及检测用户的复读语音,在复读语音与标准朗读发音不匹配时,继续对发音问题进行纠正,在复读语音与标准朗读发音匹配时,结束发音纠正过程,能够提高发音纠正的效率。
举例来说,用户朗读的文本可以是“春风又绿江南岸,明月何时照我还”,提取朗读语音的发音特征,比如将“南”字念成“兰”的读音,从而可以确定用户所在地域是湖南,进一步获取湖南方言的发音问题集合,识别朗读语音的发音问题,然后播放标准朗读发音以引导用户对发音问题进行纠正。
实施例五
请参阅图5,图5是本发明实施例公开的另一种电子设备的结构示意图。如图5所示,该电子设备可以包括:
存储有可执行程序代码的存储器501;
与存储器501耦合的处理器502;
其中,处理器502调用存储器501中存储的可执行程序代码,执行图1~图2任意一种发音纠正方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1~图2任意一种发音纠正方法。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种发音纠正方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种发音纠正方法,其特征在于,所述方法包括:
电子设备获取用户朗读文本时输入的朗读语音,提取所述朗读语音的发音特征;
所述电子设备根据目标语音模型和所述朗读语音的发音特征,得到所述朗读语音的发音特征对应的目标地域信息;
所述电子设备在地域语言映射关系中查找与所述目标地域信息对应的目标地域语言,获取所述目标地域语言对应的发音问题集合;
所述电子设备根据所述发音问题集合识别所述朗读语音的发音问题;
所述电子设备在屏幕上输出所述朗读语音的发音问题,并播放所述文本的标准朗读发音,以引导用户对所述发音问题进行纠正;
在所述电子设备获取用户朗读文本时输入的朗读语音,提取所述朗读语音的发音特征之前,所述方法还包括:
所述电子设备采集不同地域的用户的语音数据样本,将所述语音数据样本传送至服务器,以供所述服务器根据所述语音数据样本的发音特征和从所述语音数据样本提取的发音问题对所述语音数据样本进行分类,并确定出分类后的语音数据样本对应的地域信息样本,以所述语音数据样本的发音特征作为训练模型的输入及将所述地域信息样本作为所述训练模型的输出,对所述训练模型进行训练以获得所述目标语音模型,以及根据所述地域信息样本与从所述语音数据样本提取的发音问题建立所述地域语言映射关系;
所述电子设备从所述服务器中导出所述目标语音模型和所述地域语言映射关系。
2.根据权利要求1所述的方法,其特征在于,所述电子设备根据目标语音模型和所述朗读语音的发音特征,得到所述朗读语音的发音特征对应的目标地域信息,包括:
所述电子设备将所述朗读语音的发音特征输入至所述目标语音模型;
所述电子设备获取所述目标语音模型根据所述朗读语音的发音特征分析得到的所述目标地域信息。
3.根据权利要求1所述的方法,其特征在于,在所述电子设备根据所述发音问题集合识别所述朗读语音的发音问题之后,所述方法还包括:
所述电子设备获取所述电子设备存储的所述用户的历史朗读语音记录中的历史发音问题;
所述电子设备对重合发音问题进行标记,以获得标记发音问题,所述重合发音问题为所述历史发音问题与所述朗读语音的发音问题中存在重合的发音问题;
所述电子设备将所述重合发音问题发送给管控终端,以使所述管控终端管控所述用户纠正所述重合发音问题;以及,设置复习周期,并基于所述复习周期向所述用户推送所述重合发音问题以引导所述用户对所述重合发音问题进行纠正。
4.根据权利要求3所述的方法,其特征在于,所述电子设备在屏幕上输出所述朗读语音的发音问题,并播放所述文本的标准朗读发音,以引导用户对所述发音问题进行纠正,包括:
所述电子设备在屏幕上输出所述朗读语音的发音问题以及输出第一提示信息,所述第一提示信息用于提示用户根据所述标准朗读发音进行朗读;
所述电子设备播放所述标准朗读发音,并检测所述用户的复读语音,判断所述复读语音是否与所述标准朗读发音匹配;
如果所述复读语音与所述标准朗读发音不匹配,执行所述播放所述标准朗读发音,并检测所述用户的复读语音,判断所述用户的复读语音是否与所述标准朗读发音匹配的步骤;
所述电子设备当检测到所述用户的复读语音与所述标准朗读发音的匹配度达到预设阈值时输出第二提示信息,或者在检测到所述用户输入的结束请求时输出所述第二提示信息,所述第二提示信息用于提示所述用户结束对所述文本的朗读纠正流程。
5.一种电子设备,其特征在于,所述电子设备包括:
提取单元,用于获取用户朗读文本时输入的朗读语音,提取所述朗读语音的发音特征;
第一获取单元,用于根据目标语音模型和所述朗读语音的发音特征,得到所述朗读语音的发音特征对应的目标地域信息;
查找单元,用于在地域语言映射关系中查找与所述目标地域信息对应的目标地域语言,获取所述目标地域语言对应的发音问题集合;
识别单元,用于根据所述发音问题集合识别所述朗读语音的发音问题;
纠正单元,用于在屏幕上输出所述朗读语音的发音问题,并播放所述文本的标准朗读发音,以引导用户对所述发音问题进行纠正;
所述电子设备还包括:
采集单元,用于在所述提取单元获取用户朗读文本时输入的朗读语音,提取所述朗读语音的发音特征之前,采集不同地域的用户的语音数据样本,将所述语音数据样本传送至服务器,以供所述服务器根据所述语音数据样本的发音特征和从所述语音数据样本提取的发音问题对所述语音数据样本进行分类,并确定出分类后的语音数据样本对应的地域信息样本,以所述语音数据样本的发音特征作为训练模型的输入及将所述地域信息样本作为所述训练模型的输出,对所述训练模型进行训练以获得所述目标语音模型,以及根据所述地域信息样本与从所述语音数据样本提取的发音问题建立所述地域语言映射关系;
导出单元,用于从所述服务器中导出所述目标语音模型和所述地域语言映射关系。
6.根据权利要求5所述的电子设备,其特征在于,所述第一获取单元包括:
输入子单元,用于将所述朗读语音的发音特征输入至所述目标语音模型;
获取子单元,用于获取所述目标语音模型根据所述朗读语音的发音特征分析得到的所述目标地域信息。
7.根据权利要求5所述的电子设备,其特征在于,所述电子设备还包括:
第二获取单元,用于在所述识别单元根据所述发音问题集合识别所述朗读语音的发音问题之后,获取所述电子设备存储的所述用户的历史朗读语音记录中的历史发音问题;
标记单元,用于对重合发音问题进行标记,以获得标记发音问题,所述重合发音问题为所述历史发音问题与所述朗读语音的发音问题中存在重合的发音问题;
管控单元,用于将所述重合发音问题发送给管控终端,以使所述管控终端管控所述用户纠正所述重合发音问题;以及,设置复习周期,并基于所述复习周期向所述用户推送所述重合发音问题以引导所述用户对所述重合发音问题进行纠正。
8.根据权利要求7所述的电子设备,其特征在于,所述纠正单元包括:
第一输出子单元,用于在屏幕上输出所述朗读语音的发音问题以及输出第一提示信息,所述第一提示信息用于提示用户根据所述标准朗读发音进行朗读;
检测子单元,用于播放所述标准朗读发音,并检测所述用户的复读语音,判断所述复读语音是否与所述标准朗读发音匹配;
所述检测子单元,还用于在判断出所述复读语音与所述标准朗读发音不匹配时,播放所述标准朗读发音,并检测所述用户的复读语音,判断所述复读语音是否与所述标准朗读发音匹配;
第二输出子单元,用于当检测到所述用户的复读语音与所述标准朗读发音的匹配度达到预设阈值时输出第二提示信息,或者在检测到所述用户输入的结束请求时输出所述第二提示信息,所述第二提示信息用于提示所述用户结束对所述文本的朗读纠正流程。
CN201811514834.9A 2018-12-12 2018-12-12 一种发音纠正方法及电子设备 Active CN109410664B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811514834.9A CN109410664B (zh) 2018-12-12 2018-12-12 一种发音纠正方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811514834.9A CN109410664B (zh) 2018-12-12 2018-12-12 一种发音纠正方法及电子设备

Publications (2)

Publication Number Publication Date
CN109410664A CN109410664A (zh) 2019-03-01
CN109410664B true CN109410664B (zh) 2021-01-26

Family

ID=65458630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811514834.9A Active CN109410664B (zh) 2018-12-12 2018-12-12 一种发音纠正方法及电子设备

Country Status (1)

Country Link
CN (1) CN109410664B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109817201B (zh) * 2019-03-29 2021-03-26 北京金山安全软件有限公司 一种语言学习方法、装置、电子设备及可读存储介质
CN110148418B (zh) * 2019-06-14 2024-05-03 安徽咪鼠科技有限公司 一种场景记录分析系统、方法及其装置
CN112116832A (zh) * 2019-06-19 2020-12-22 广东小天才科技有限公司 一种口语练习方法及装置
CN110415679B (zh) 2019-07-25 2021-12-17 北京百度网讯科技有限公司 语音纠错方法、装置、设备和存储介质
CN111459449A (zh) * 2020-01-19 2020-07-28 托普朗宁(北京)教育科技有限公司 一种辅助阅读的方法、装置、存储介质及电子设备
CN111639224A (zh) * 2020-05-28 2020-09-08 广东小天才科技有限公司 一种口语练习内容的获取方法及电子设备
CN113920803B (zh) * 2020-07-10 2024-05-10 上海流利说信息技术有限公司 一种错误反馈方法、装置、设备及可读存储介质
CN111737499B (zh) * 2020-07-27 2020-11-27 平安国际智慧城市科技股份有限公司 基于自然语言处理的数据搜索方法及相关设备
CN112786151B (zh) * 2020-12-28 2021-09-07 深圳市艾利特医疗科技有限公司 一种语言功能训练系统以及方法
CN113409763B (zh) * 2021-07-20 2022-10-25 北京声智科技有限公司 语音纠正方法、装置及电子设备
CN116416635B (zh) * 2023-06-08 2023-09-01 深圳市小彼恩文教科技有限公司 一种基于点读笔的辅助阅读方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150024180A (ko) * 2013-08-26 2015-03-06 주식회사 셀리이노베이션스 발음 교정 장치 및 방법
CN105070118B (zh) * 2015-07-30 2019-01-11 广东小天才科技有限公司 一种针对语言类学习的纠正发音的方法及装置
CN107767710A (zh) * 2016-08-19 2018-03-06 北京快乐智慧科技有限责任公司 一种智能交互机器人训练发音的方法和系统
CN106531182A (zh) * 2016-12-16 2017-03-22 上海斐讯数据通信技术有限公司 一种语言学习系统
CN108053823A (zh) * 2017-11-28 2018-05-18 广西职业技术学院 一种语音识别系统及方法
CN108961856A (zh) * 2018-07-19 2018-12-07 深圳乐几科技有限公司 口语学习方法和装置

Also Published As

Publication number Publication date
CN109410664A (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
CN109410664B (zh) 一种发音纠正方法及电子设备
CN109346059B (zh) 一种方言语音的识别方法及电子设备
JP6394709B2 (ja) 話者識別装置および話者識別用の登録音声の特徴量登録方法
CN110782921B (zh) 语音测评方法和装置、存储介质及电子装置
JP6251958B2 (ja) 発話解析装置、音声対話制御装置、方法、及びプログラム
CN105895103A (zh) 一种语音识别方法及装置
CN108305618B (zh) 语音获取及搜索方法、智能笔、搜索终端及存储介质
CN111292751B (zh) 语义解析方法及装置、语音交互方法及装置、电子设备
CN111081080B (zh) 一种语音检测方法及学习设备
CN110010121B (zh) 验证应答话术的方法、装置、计算机设备和存储介质
CN110111778B (zh) 一种语音处理方法、装置、存储介质及电子设备
KR102199246B1 (ko) 신뢰도 측점 점수를 고려한 음향 모델 학습 방법 및 장치
CN111986675A (zh) 语音对话方法、设备及计算机可读存储介质
CN110349567B (zh) 语音信号的识别方法和装置、存储介质及电子装置
CN110503941B (zh) 语言能力评测方法、装置、系统、计算机设备及存储介质
US10971148B2 (en) Information providing device, information providing method, and recording medium for presenting words extracted from different word groups
CN111081092B (zh) 一种学习内容输出方法及学习设备
CN112820281B (zh) 一种语音识别方法、装置及设备
CN111161718A (zh) 语音识别方法、装置、设备、存储介质及空调
CN109582971B (zh) 一种基于句法分析的批改方法及批改系统
CN113409774A (zh) 语音识别方法、装置及电子设备
CN109035896B (zh) 一种口语训练方法及学习设备
CN110895938B (zh) 语音校正系统及语音校正方法
CN114078470A (zh) 模型处理方法及装置、语音识别方法及装置
CN113255361B (zh) 语音内容的自动检测方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant