CN104464757A - 语音评测方法和语音评测装置 - Google Patents

语音评测方法和语音评测装置 Download PDF

Info

Publication number
CN104464757A
CN104464757A CN201410587120.6A CN201410587120A CN104464757A CN 104464757 A CN104464757 A CN 104464757A CN 201410587120 A CN201410587120 A CN 201410587120A CN 104464757 A CN104464757 A CN 104464757A
Authority
CN
China
Prior art keywords
assessment score
score
speech
threshold value
mapping model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410587120.6A
Other languages
English (en)
Other versions
CN104464757B (zh
Inventor
朱群
何春江
胡阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201410587120.6A priority Critical patent/CN104464757B/zh
Publication of CN104464757A publication Critical patent/CN104464757A/zh
Application granted granted Critical
Publication of CN104464757B publication Critical patent/CN104464757B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种语音评测方法,包括:获取语音数据,并对语音数据进行解码以获取语音解码数据;对语音解码数据进行分析以生成评估参数;通过多个映射模型分别对评估参数进行评估以生成多个评估得分;以及根据多个评估得分生成最终评估得分。本发明实施例的方法通过多种不同类型的映射模型综合评估用户的发音好坏,克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。本发明还公开了一种语音评测装置。

Description

语音评测方法和语音评测装置
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音评测方法和语音评测装置。
背景技术
随着语音识别技术的不断成熟,涉及到信号处理、自然语音理解、人工智能、数据挖掘和机器学习等多个学科的智能语音评测技术也得到了越来越广泛的应用。例如,智能辅助教学系统班班通项目在各中小学的推广,普通话口语考试系统在全国的普及等。其中,智能语音评测就是利用计算机自动地或半自动地对人的语音进行标准程度的评估和发音缺陷的检测。如何提高系统的稳定性、评测打分的准确性是智能语音评测的关键,也受到了越来越多的关注。
目前,语音评测方法是基于传统的映射模型以确定用户输入的语音内容,并依据此内容计算声学、语言学特征;然后,系统基于某一通用打分模型,运用上述信息和特征计算最终评测结果。其具体流程如图1所示:步一:输入评测试卷和用户朗读的语音数据;步二:使用声学模型和语言模型进行语音解码,如通过受限语法网络的切分识别,或者通过大词汇量的语音识别;步三:根据识别结果、声学信息,进行发音好坏、语法、语音的正确度的评估分析;步四:系统使用预先训练好的专家知识或打分模型,与步三的发音质量、语法、语义等特征相运算,通过某种线性或非线性的映射模型映射出对应的分数。
目前,传统的语音评测方法主要存在以下几个缺点:
1)由于任何一种映射模型只能做到全局最优,而非局部最优,所以在评分时仅采用单一的映射模型评测方法,无法拟合覆盖到所有的数据,从而对系统的稳定性造成很大的影响;
2)在实际的应用和正规的口语考试中,一定会存在一些系统无法正确评测的数据。然而,如何准确的定位并找出这些异常数据并提交人工复审是非常重要的事情,这对于传统的单映射模型评测方法来说,较难实现。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的一个目的在于提出一种语音评测方法。该方法克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。
本发明的另一个目的在于提出一种语音评测装置。
为了实现上述目的,本发明一方面实施例的语音评测方法,包括:获取语音数据,并对所述语音数据进行解码以获取语音解码数据;对所述语音解码数据进行分析以生成评估参数;通过多个映射模型分别对所述评估参数进行评估以生成多个评估得分;以及根据所述多个评估得分生成最终评估得分。
根据本发明实施例的语音评测方法,可先对获取到的语音数据进行解码以获取语音解码数据,之后可对语音解码数据进行分析以生成评估参数,并通过多个映射模型分别对评估参数进行评估以生成多个评估得分,以及根据多个评估得分生成最终评估得分,即通过多种不同类型的映射模型综合评估用户的发音好坏,克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。
为了实现上述目的,本发明另一方面实施例的语音评测装置,包括:第一获取模块,用于获取语音数据,并对所述语音数据进行解码以获取语音解码数据;第一生成模块,用于对所述语音解码数据进行分析以生成评估参数;第二生成模块,用于通过多个映射模型分别对所述评估参数进行评估以生成多个评估得分;以及第三生成模块,用于根据所述多个评估得分生成最终评估得分。
根据本发明实施例的语音评测装置,可通过第一获取模块获取语音数据,并对语音数据进行解码以获取语音解码数据,第一生成模块对语音解码数据进行分析以生成评估参数,第二生成模块通过多个映射模型分别对评估参数进行评估以生成多个评估得分,第三生成模块根据多个评估得分生成最终评估得分,即通过多种不同类型的映射模型综合评估用户的发音好坏,克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是传统的语音评测方法的流程图;
图2是根据本发明一个实施例的语音评测方法的流程图;
图3是根据本发明一个实施例的语音评测方法的流程图;
图4是根据本发明一个实施例的语音评测装置的结构示意图;
图5是根据本发明另一个实施例的语音评测装置的结构示意图;
图6是根据本发明又一个实施例的语音评测装置的结构示意图;以及
图7是根据本发明再一个实施例的语音评测装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述根据本发明实施例的语音评测方法和语音评测装置。
图2是根据本发明一个实施例的语音评测方法的流程图。如图2所示,该语音评测方法可以包括:
S201,获取语音数据,并对语音数据进行解码以获取语音解码数据。
其中,在本发明的实施例中,语音解码数据可包括声学特征信息和语言学特征信息。声学特征信息可包括音高、音长、音强和音色;语音学特征信息可包括但不限于语音、语法、词汇、语义等。
例如,可先获取用户根据评测试卷进行朗读时的语音数据,之后可通过现有技术中的声学模型和语言模型分别对该语音数据进行语音解码以获取对应的声学特征和语言学特征,如受限语法网络的切分识别,或者大词汇量的语音识别等。其中,在本发明的实施例中,声学模型可为语音识别系统中最为重要部分之一,如隐马尔科夫模型;语言模型是根据语言客观事实而进行的语言抽象数学建模,是一种对应关系,语言模型与语言客观事实之间的关系,如同数学上的抽象直线与具体直线之间的关系。
S202,对语音解码数据进行分析以生成评估参数。
具体地,对语音解码数据进行发音好坏、语法、语音的正确度等方面的评估分析,之后可将分析结果作为评估参数,如发音质量、语法正确率、语义正确率等。
S203,通过多个映射模型分别对评估参数进行评估以生成多个评估得分。
其中,在本发明的实施例中,多个映射模型可包括线性的Linear Regression映射模型、非线性的支持向量机SVM映射模型和Cart回归树映射模型等中的两种或多种。
需要说明的是,在本发明的实施例中,针对同一批评估参数(用于评估和描述用户发音、语法、语义正确性的参数),可使用多个不同类型的映射模型分别对其进行评估。此过程类似于考试现场,针对一个考生的语音数据由多个专家分别进行评分,考生的最终得分通过综合考虑多个专家的得分确定,此过程可以避免出现打分过低、过高等打分不稳定的现象。因此,此过程专家的数量越多,考生最终的得分越可靠,数量一般在3个以上。由此,可通过多映射模型的方法,提高了映射模型的正确性和稳定性。
S204,根据多个评估得分生成最终评估得分。
具体而言,在本发明的实施例中,通过预设得分策略根据多个评估得分生成最终评估得分。其中,在本发明的实施例中,预设得分策略可为对多个评估得分求平均分、或对多个评估得分求最高分、或对多个评估得分求中间分数的平均值等,预设得分策略还可为将采用线性的映射模型来生成的评估得分作为最终评估得分。
根据本发明实施例的语音评测方法,可先对获取到的语音数据进行解码以获取语音解码数据,之后可对语音解码数据进行分析以生成评估参数,并通过多个映射模型分别对评估参数进行评估以生成多个评估得分,以及根据多个评估得分生成最终评估得分,即通过多种不同类型的映射模型综合评估用户的发音好坏,克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。
图3是根据本发明一个实施例的语音评测方法的流程图。
需要说明的是,由于每种映射模型在拟合数据时均只能做到全局最优,无法兼顾到所有的数据,所以当具有这些模型未考虑到的数据在有些应用场景下(如正规的口语考试等)得到异常评估得分时,需要检测出该异常数据并将其提交人工复审。此类异常数据的多少直接决定了一个评测系统的评分性能的好坏。为此,为了提高评测系统的评分性能,在本发明的实施例中,可对该异常评估得分进行筛选。具体地,如图3所示,该语音评测方法可以包括:
S301,获取语音数据,并对语音数据进行解码以获取语音解码数据。
其中,在本发明的实施例中,语音解码数据可包括声学特征信息和语言学特征信息。声学特征信息可包括音高、音长、音强和音色;语音学特征信息可包括但不限于语音、语法、词汇、语义等。
例如,可先获取用户根据评测试卷进行朗读时的语音数据,之后可通过现有技术中的声学模型和语言模型分别对该语音数据进行语音解码以获取对应的声学特征和语言学特征,如受限语法网络的切分识别,或者大词汇量的语音识别等。其中,在本发明的实施例中,声学模型可为语音识别系统中最为重要部分之一,如隐马尔科夫模型;语言模型是根据语言客观事实而进行的语言抽象数学建模,是一种对应关系,语言模型与语言客观事实之间的关系,如同数学上的抽象直线与具体直线之间的关系。
S302,对语音解码数据进行分析以生成评估参数。
具体地,对语音解码数据进行发音好坏、语法、语音的正确度等方面的评估分析,之后可将分析结果作为评估参数,如发音质量、语法正确率、语义正确率等。
S303,通过多个映射模型分别对评估参数进行评估以生成多个评估得分。
其中,在本发明的实施例中,多个映射模型可包括线性的Linear Regression映射模型、非线性的支持向量机SVM映射模型和Cart回归树映射模型等中的两种或多种
需要说明的是,在本发明的实施例中,针对同一批评估参数(用于评估和描述用户发音、语法、语义正确性的参数),可使用多个不同类型的映射模型分别对其进行评估。此过程类似于考试现场,针对一个考生的语音数据由多个专家分别进行评分,考生的最终得分通过综合考虑多个专家的得分确定,此过程可以避免出现打分过低、过高等打分不稳定的现象。因此,此过程专家的数量越多,考生最终的得分越可靠,数量一般在3个以上。由此,可通过多映射模型的方法,提高了映射模型的正确性和稳定性。
S304,获取多个评估得分中的异常评估得分。
具体地,在通过多个映射模型分别对评估参数进行评估以生成多个评估得分之后,可根据预设规则获取该多个评估得分中的异常评估得分。应当理解,预设规则可根据具体的实际应用场景确定。下面可通过两个实施例对根据预设规则获取该多个评估得分中的异常评估得分进行进一步描述。
在本发明的一个实施例中,获取多个评估得分中的异常评估得分具体包括:判断多个评估得分中是否存在两两差值大于第一预设阈值的评估得分;如果存在两两差值大于第一预设阈值的评估得分,则将存在两两差值大于第一预设阈值的评估得分作为异常评估得分。例如,同一份语音数据在通过不同映射模型进行评估时来得到的多个评估得分,该多个评估得分中存在两两差值大于第一预设阀值时,可确定该语音数据为异常数据,并可将存在两两差值大于第一预设阀值的那两个评估得分作为异常评估得分。又如,若有一种映射模型对某个语音数据进行评估后得到的评估得分与其他各映射模型对该某个语音数据进行评估后得到的评估得分分差较大,则可认为该映射模型得到的评估得分为异常评估得分,该某个语音数据为异常数据。
在本发明的另一个实施例中,根据多个评估得分生成基准评估得分;判断多个评估得分中是否存在与基准评估得分的差值大于第二预设阈值的评估得分;以及如果存在与基准评估得分的差值大于第二预设阈值的评估得分,则将与基准评估得分的差值大于第二预设阈值的评估得分作为异常评估得分。具体地,可对多个评估得分求平均,之后可将得到的平均值作为基准评估得分。之后,可判断多个评估得分中是否存在与基准评估得分的差值大于第二预设阀值的评估得分。若某一种映射模型的评估得分与基准评估得分的差值大于第二预设阀值(如差值大于百分制的30分),则可将该映射模型的评估得分作为异常评估得分。
S305,对异常评估得分进行筛选。
例如,可将异常评估得分从多个评估得分中筛选出来,之后可提取出该异常评估得分对应的语音数据以进行人工校验。
S306,根据多个评估得分生成最终评估得分。
具体而言,在本发明的实施例中,通过预设得分策略根据多个评估得分生成最终评估得分。其中,在本发明的实施例中,预设得分策略可为对多个评估得分求平均分、或对多个评估得分求最高分、或对多个评估得分求中间分数的平均值等,预设得分策略还可为将采用线性的映射模型来生成的评估得分作为最终评估得分。
根据本发明实施例的语音评测方法,在通过多个映射模型分别对评估参数进行评估以生成多个评估得分之后,可根据预设规则获取该多个评估得分中的异常评估得分,并对异常评估得分进行筛选,之后可提取出该异常评估得分对应的语音数据以进行人工校验,通过预设规则可有效地检测出评分异常的数据。
此外,本发明还提出一种语音评测装置。
图4是根据本发明一个实施例的语音评测装置的结构示意图。如图4所示,该语音评测装置可以包括:第一获取模块10、第一生成模块20、第二生成模块30和第三生成模块40。
具体地,第一获取模块10可用于获取语音数据,并对语音数据进行解码以获取语音解码数据。其中,在本发明的实施例中,语音解码数据可包括声学特征信息和语言学特征信息。声学特征信息可包括音高、音长、音强和音色;语音学特征信息可包括但不限于语音、语法、词汇、语义等。
例如,第一获取模块10可先获取用户根据评测试卷进行朗读时的语音数据,之后可通过现有技术中的声学模型和语言模型分别对该语音数据进行语音解码以获取对应的声学特征和语言学特征,如受限语法网络的切分识别,或者大词汇量的语音识别等。其中,在本发明的实施例中,声学模型可为语音识别系统中最为重要部分之一,如隐马尔科夫模型;语言模型是根据语言客观事实而进行的语言抽象数学建模,是一种对应关系,语言模型与语言客观事实之间的关系,如同数学上的抽象直线与具体直线之间的关系。
第一生成模块20可用于对语音解码数据进行分析以生成评估参数。更具体地,第一生成模块20对语音解码数据进行发音好坏、语法、语音的正确度等方面的评估分析,之后可将分析结果作为评估参数,如发音质量、语法正确率、语义正确率等。
第二生成模块30可用于通过多个映射模型分别对评估参数进行评估以生成多个评估得分。其中,在本发明的实施例中,多个映射模型可包括线性的Linear Regression映射模型、非线性的支持向量机SVM映射模型和Cart回归树映射模型等中的两种或多种。
需要说明的是,在本发明的实施例中,针对同一批评估参数(用于评估和描述用户发音、语法、语义正确性的参数),可使用多个不同类型的映射模型分别对其进行评估。此过程类似于考试现场,针对一个考生的语音数据由多个专家分别进行评分,考生的最终得分通过综合考虑多个专家的得分确定,此过程可以避免出现打分过低、过高等打分不稳定的现象。因此,此过程专家的数量越多,考生最终的得分越可靠,数量一般在3个以上。由此,可通过多映射模型的方法,提高了映射模型的正确性和稳定性。
第三生成模块40可用于根据多个评估得分生成最终评估得分。具体而言,在本发明的实施例中,第三生成模块40可通过预设得分策略根据多个评估得分生成最终评估得分。其中,在本发明的实施例中,预设得分策略可为对多个评估得分求平均分、或对多个评估得分求最高分、或对多个评估得分求中间分数的平均值等,预设得分策略还可为将采用线性的映射模型来生成的评估得分作为最终评估得分。
进一步的,在本发明的一个实施例中,如图5所示,该语音评测装置还可包括第二获取模块50和筛选模块60。第二获取模块50可用于获取多个评估得分中的异常评估得分。具体地,在第三生成模块40通过多个映射模型分别对评估参数进行评估以生成多个评估得分之后,第二获取模块50可根据预设规则获取该多个评估得分中的异常评估得分。应当理解,预设规则可根据具体的实际应用场景确定。下面可通过两个实施例对根据预设规则获取该多个评估得分中的异常评估得分进行进一步描述。
在本发明的一个实施例中,如图6所示,该第二获取模块50可包括第一判断单元51和第一获取单元52。第一判断单元51可用于判断多个评估得分中是否存在两两差值大于第一预设阀值的评估得分。第一获取单元52可用于在存在两两差值大于第一预设阀值的评估得分时,将存在两两差值大于第一预设阀值的评估得分作为异常评估得分。例如,同一份语音数据在通过不同映射模型进行评估时来得到的多个评估得分,在第一判断单元51判断该多个评估得分中存在两两差值大于第一预设阀值时,第一获取单元52可确定该语音数据为异常数据,并可将存在两两差值大于第一预设阀值的那两个评估得分作为异常评估得分。又如,若有一种映射模型对某个语音数据进行评估后得到的评估得分与其他各映射模型对该某个语音数据进行评估后得到的评估得分分差较大,则第一获取单元52可认为该映射模型得到的评估得分为异常评估得分,该某个语音数据为异常数据。
在本发明的另一个实施例中,如图7所示,该第二获取模块50可包括生成单元53、第二判断单元54和第二获取单元55。
具体地,生成单元53可用于根据多个评估得分生成基准评估得分。更具体地,生成单元53可对多个评估得分求平均,之后可将得到的平均值作为基准评估得分。
第二判断单元54可用于判断多个评估得分中是否存在与基准评估得分的差值大于第二预设阀值的评估得分。第二获取单元55可用于在存在与基准评估得分的差值大于第二预设阀值的评估得分时,将与基准评估得分的差值大于第二预设阀值的评估得分作为异常评估得分。例如,若某一种映射模型的评估得分与基准评估得分的差值大于第二预设阀值(如差值大于百分制的30分),则第二获取单元55可将该映射模型的评估得分作为异常评估得分。
筛选模块60可用于对异常评估得分进行筛选。例如,筛选模块60可将异常评估得分从多个评估得分中筛选出来,之后可提取出该异常评估得分对应的语音数据以进行人工校验。由此,通过预设规则可有效地检测出评分异常的数据。
根据本发明实施例的语音评测装置,可通过第一获取模块获取语音数据,并对语音数据进行解码以获取语音解码数据,第一生成模块对语音解码数据进行分析以生成评估参数,第二生成模块通过多个映射模型分别对评估参数进行评估以生成多个评估得分,第三生成模块根据多个评估得分生成最终评估得分,即通过多种不同类型的映射模型综合评估用户的发音好坏,克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种语音评测方法,其特征在于,包括以下步骤:
获取语音数据,并对所述语音数据进行解码以获取语音解码数据;
对所述语音解码数据进行分析以生成评估参数;
通过多个映射模型分别对所述评估参数进行评估以生成多个评估得分;以及
根据所述多个评估得分生成最终评估得分。
2.如权利要求1所述的语音评测方法,其特征在于,在所述通过多个映射模型分别对所述评估参数进行评估以生成多个评估得分之后,还包括:
获取所述多个评估得分中的异常评估得分;以及
对所述异常评估得分进行筛选。
3.如权利要求2所述的语音评测方法,其特征在于,所述获取所述多个评估得分中的异常评估得分具体包括:
判断所述多个评估得分中是否存在两两差值大于第一预设阈值的评估得分;
如果存在两两差值所述大于第一预设阈值的评估得分,则将所述存在两两差值大于所述第一预设阈值的评估得分作为异常评估得分。
4.如权利要求2所述的语音评测方法,其特征在于,所述获取所述多个评估得分中的异常评估得分具体包括:
根据所述多个评估得分生成基准评估得分;
判断所述多个评估得分中是否存在与所述基准评估得分的差值大于第二预设阈值的评估得分;以及
如果存在与所述基准评估得分的差值大于所述第二预设阈值的评估得分,则将所述与所述基准评估得分的差值大于所述第二预设阈值的评估得分作为异常评估得分。
5.如权利要求1所述的语音评测方法,其特征在于,所述根据所述多个评估得分生成最终评估得分具体包括:
通过预设得分策略根据所述多个评估得分生成最终评估得分。
6.如权利要求1所述的语音评测方法,其特征在于,所述多个映射模型包括LinearRegression映射模型、支持向量机SVM映射模型和Cart回归树映射模型中的至少两种。
7.一种语音评测装置,其特征在于,包括:
第一获取模块,用于获取语音数据,并对所述语音数据进行解码以获取语音解码数据;
第一生成模块,用于对所述语音解码数据进行分析以生成评估参数;
第二生成模块,用于通过多个映射模型分别对所述评估参数进行评估以生成多个评估得分;以及
第三生成模块,用于根据所述多个评估得分生成最终评估得分。
8.如权利要求7所述的语音评测装置,其特征在于,还包括:
第二获取模块,用于获取所述多个评估得分中的异常评估得分;以及
筛选模块,用于对所述异常评估得分进行筛选。
9.如权利要求8所述的语音评测装置,其特征在于,所述第二获取模块包括:
第一判断单元,用于判断所述多个评估得分中是否存在两两差值大于第一预设阀值的评估得分;
第一获取单元,用于在存在两两差值所述大于第一预设阀值的评估得分时,将所述存在两两差值大于所述第一预设阀值的评估得分作为异常评估得分。
10.如权利要求8所述的语音评测装置,其特征在于,所述第二获取模块包括:
生成单元,用于根据所述多个评估得分生成基准评估得分;
第二判断单元,用于判断所述多个评估得分中是否存在与所述基准评估得分的差值大于第二预设阀值的评估得分;以及
第二获取单元,用于在存在与所述基准评估得分的差值大于所述第二预设阀值的评估得分时,将所述与所述基准评估得分的差值大于所述第二预设阀值的评估得分作为异常评估得分。
11.如权利要求7所述的语音评测装置,其特征在于,所述第三生成模块具体用于:
通过预设得分策略根据所述多个评估得分生成最终评估得分。
12.如权利要求7所述的语音评测装置,其特征在于,所述多个映射模块包括LinearRegression映射模型、支持向量机SVM映射模型和Cart回归树映射模型中的至少两种。
CN201410587120.6A 2014-10-28 2014-10-28 语音评测方法和语音评测装置 Active CN104464757B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410587120.6A CN104464757B (zh) 2014-10-28 2014-10-28 语音评测方法和语音评测装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410587120.6A CN104464757B (zh) 2014-10-28 2014-10-28 语音评测方法和语音评测装置

Publications (2)

Publication Number Publication Date
CN104464757A true CN104464757A (zh) 2015-03-25
CN104464757B CN104464757B (zh) 2019-01-18

Family

ID=52910701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410587120.6A Active CN104464757B (zh) 2014-10-28 2014-10-28 语音评测方法和语音评测装置

Country Status (1)

Country Link
CN (1) CN104464757B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104810017A (zh) * 2015-04-08 2015-07-29 广东外语外贸大学 基于语义分析的口语评测方法和系统
CN108763329A (zh) * 2018-05-08 2018-11-06 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 语音交互系统智商水平的评测方法、装置以及计算机设备
WO2019023893A1 (en) * 2017-07-31 2019-02-07 Beijing Didi Infinity Technology And Development Co., Ltd. SYSTEM AND METHOD FOR SEGMENTING A PHRASE
CN109410915A (zh) * 2017-08-15 2019-03-01 中国移动通信集团终端有限公司 语音质量的评估方法和装置、计算机可读存储介质
CN110164422A (zh) * 2019-04-03 2019-08-23 苏州驰声信息科技有限公司 一种口语考试的多维度评估方法及装置
CN110322895A (zh) * 2018-03-27 2019-10-11 亿度慧达教育科技(北京)有限公司 语音评测方法及计算机存储介质
CN111128238A (zh) * 2019-12-31 2020-05-08 云知声智能科技股份有限公司 普通话评测方法及装置
CN111986650A (zh) * 2020-08-07 2020-11-24 云知声智能科技股份有限公司 借助语种识别辅助语音评测的方法及系统
WO2021012495A1 (zh) * 2019-07-23 2021-01-28 平安科技(深圳)有限公司 语音识别结果测试方法、装置、计算机设备和介质
CN112687291A (zh) * 2020-12-21 2021-04-20 科大讯飞股份有限公司 一种发音缺陷识别模型训练方法以及发音缺陷识别方法
CN112908359A (zh) * 2021-01-31 2021-06-04 云知声智能科技股份有限公司 语音测评方法、装置、电子设备及计算机可读介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092488A (ja) * 1999-09-17 2001-04-06 Atr Interpreting Telecommunications Res Lab 統計的言語モデル生成装置及び音声認識装置
US6427133B1 (en) * 1996-08-02 2002-07-30 Ascom Infrasys Ag Process and device for evaluating the quality of a transmitted voice signal
CN101727903A (zh) * 2008-10-29 2010-06-09 中国科学院自动化研究所 基于多特征和多系统融合的发音质量评估和错误检测方法
CN101739868A (zh) * 2008-11-19 2010-06-16 中国科学院自动化研究所 一种用于口语测试的文本朗读水平自动评估诊断方法
CN101740024A (zh) * 2008-11-19 2010-06-16 中国科学院自动化研究所 基于广义流利的口语流利度自动评估方法
CN101826263A (zh) * 2009-03-04 2010-09-08 中国科学院自动化研究所 基于客观标准的自动化口语评估系统
CN102376182A (zh) * 2010-08-26 2012-03-14 财团法人工业技术研究院 语言学习系统、语言学习方法及其程序产品
CN103177733A (zh) * 2013-03-11 2013-06-26 哈尔滨师范大学 汉语普通话儿化音发音质量评测方法与系统
CN103559894A (zh) * 2013-11-08 2014-02-05 安徽科大讯飞信息科技股份有限公司 口语评测方法及系统
CN103594087A (zh) * 2013-11-08 2014-02-19 安徽科大讯飞信息科技股份有限公司 提高口语评测性能的方法及系统
CN103956162A (zh) * 2014-04-04 2014-07-30 上海元趣信息技术有限公司 针对儿童的语音识别方法及装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6427133B1 (en) * 1996-08-02 2002-07-30 Ascom Infrasys Ag Process and device for evaluating the quality of a transmitted voice signal
JP2001092488A (ja) * 1999-09-17 2001-04-06 Atr Interpreting Telecommunications Res Lab 統計的言語モデル生成装置及び音声認識装置
CN101727903A (zh) * 2008-10-29 2010-06-09 中国科学院自动化研究所 基于多特征和多系统融合的发音质量评估和错误检测方法
CN101739868A (zh) * 2008-11-19 2010-06-16 中国科学院自动化研究所 一种用于口语测试的文本朗读水平自动评估诊断方法
CN101740024A (zh) * 2008-11-19 2010-06-16 中国科学院自动化研究所 基于广义流利的口语流利度自动评估方法
CN101826263A (zh) * 2009-03-04 2010-09-08 中国科学院自动化研究所 基于客观标准的自动化口语评估系统
CN102376182A (zh) * 2010-08-26 2012-03-14 财团法人工业技术研究院 语言学习系统、语言学习方法及其程序产品
CN103177733A (zh) * 2013-03-11 2013-06-26 哈尔滨师范大学 汉语普通话儿化音发音质量评测方法与系统
CN103559894A (zh) * 2013-11-08 2014-02-05 安徽科大讯飞信息科技股份有限公司 口语评测方法及系统
CN103594087A (zh) * 2013-11-08 2014-02-19 安徽科大讯飞信息科技股份有限公司 提高口语评测性能的方法及系统
CN103956162A (zh) * 2014-04-04 2014-07-30 上海元趣信息技术有限公司 针对儿童的语音识别方法及装置

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
严可等: "《基于sigmoid函数的评分特征规整在计算机辅助学习中的应用》", 《成都纺织高等专科学校学报》 *
张珑等: "《汉语普通话水平测试中儿化音的自动检测与评价》", 《声学学报》 *
罗丹: "《多面RASCH模型在HSK(中级)口语评分检验中的应用》", 《中国优秀硕士学位论文全文数据库 哲学与人文科学辑》 *
钱揖丽等: "《基于分类回归树CART的汉语韵律短语边界识别》", 《计算机工程与应用》 *
魏思等: "《普通话水平测试电子化系统》", 《中文信息学报》 *
黄锋等: "《一种改进的基于GMM模型的语音序列评分和分类方法》", 《湖南大学学报(自然科学版)》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104810017B (zh) * 2015-04-08 2018-07-17 广东外语外贸大学 基于语义分析的口语评测方法和系统
CN104810017A (zh) * 2015-04-08 2015-07-29 广东外语外贸大学 基于语义分析的口语评测方法和系统
TWI676167B (zh) * 2017-07-31 2019-11-01 大陸商北京嘀嘀無限科技發展有限公司 用於分割句子的系統和方法及相關的非暫時性電腦可讀取媒體
CN110945514B (zh) * 2017-07-31 2023-08-25 北京嘀嘀无限科技发展有限公司 用于分割句子的系统和方法
WO2019023893A1 (en) * 2017-07-31 2019-02-07 Beijing Didi Infinity Technology And Development Co., Ltd. SYSTEM AND METHOD FOR SEGMENTING A PHRASE
US11132506B2 (en) * 2017-07-31 2021-09-28 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for segmenting a sentence
CN110945514A (zh) * 2017-07-31 2020-03-31 北京嘀嘀无限科技发展有限公司 用于分割句子的系统和方法
CN109410915A (zh) * 2017-08-15 2019-03-01 中国移动通信集团终端有限公司 语音质量的评估方法和装置、计算机可读存储介质
CN109410915B (zh) * 2017-08-15 2022-03-04 中国移动通信集团终端有限公司 语音质量的评估方法和装置、计算机可读存储介质
CN110322895A (zh) * 2018-03-27 2019-10-11 亿度慧达教育科技(北京)有限公司 语音评测方法及计算机存储介质
CN108763329A (zh) * 2018-05-08 2018-11-06 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 语音交互系统智商水平的评测方法、装置以及计算机设备
CN110164422A (zh) * 2019-04-03 2019-08-23 苏州驰声信息科技有限公司 一种口语考试的多维度评估方法及装置
WO2021012495A1 (zh) * 2019-07-23 2021-01-28 平安科技(深圳)有限公司 语音识别结果测试方法、装置、计算机设备和介质
CN111128238A (zh) * 2019-12-31 2020-05-08 云知声智能科技股份有限公司 普通话评测方法及装置
CN111986650A (zh) * 2020-08-07 2020-11-24 云知声智能科技股份有限公司 借助语种识别辅助语音评测的方法及系统
CN111986650B (zh) * 2020-08-07 2024-02-27 云知声智能科技股份有限公司 借助语种识别辅助语音评测的方法及系统
CN112687291A (zh) * 2020-12-21 2021-04-20 科大讯飞股份有限公司 一种发音缺陷识别模型训练方法以及发音缺陷识别方法
CN112687291B (zh) * 2020-12-21 2023-12-01 科大讯飞股份有限公司 一种发音缺陷识别模型训练方法以及发音缺陷识别方法
CN112908359A (zh) * 2021-01-31 2021-06-04 云知声智能科技股份有限公司 语音测评方法、装置、电子设备及计算机可读介质

Also Published As

Publication number Publication date
CN104464757B (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
CN104464757A (zh) 语音评测方法和语音评测装置
US8818813B2 (en) Methods and system for grammar fitness evaluation as speech recognition error predictor
US8990082B2 (en) Non-scorable response filters for speech scoring systems
CN102568475B (zh) 用于普通话水平测评的系统和方法
US9613638B2 (en) Computer-implemented systems and methods for determining an intelligibility score for speech
CN104464755A (zh) 语音评测方法和装置
CN104464751B (zh) 发音韵律问题的检测方法及装置
CN102376182B (zh) 语言学习系统、语言学习方法及其程序产品
JP2004246184A (ja) 視覚化された発音の提案を備えた言語学習システム及び方法
CN102184654B (zh) 诵读监督方法及装置
CN104299612A (zh) 模仿音相似度的检测方法和装置
CN109697988B (zh) 一种语音评价方法及装置
CN103810996A (zh) 待测试语音的处理方法、装置及系统
CN111861161B (zh) 基于标准化病人的问诊训练考评方法和装置
Cucchiarini et al. Second language learners' spoken discourse: Practice and corrective feedback through automatic speech recognition
CN111739556A (zh) 一种语音分析的系统和方法
CN108597538A (zh) 语音合成系统的评测方法和系统
US10984672B2 (en) Tutoring agent improvement recommendation
CN104700831B (zh) 分析音频文件的语音特征的方法和装置
CN110085260A (zh) 一种单词音节重音识别校正方法、装置、设备以及介质
CN115964622A (zh) 用于机器学习模型的评测方法、装置及计算机存储介质
CN111128181B (zh) 背诵题评测方法、装置以及设备
CN108182946B (zh) 一种基于声纹识别的声乐模式选择方法及装置
Cleuren et al. Children’s oral reading corpus (CHOREC): description and assessment of annotator agreement
RU2589851C2 (ru) Система и способ перевода речевого сигнала в транскрипционное представление с метаданными

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant