CN103065626A - 英语口语考试系统中的朗读题自动评分方法和设备 - Google Patents
英语口语考试系统中的朗读题自动评分方法和设备 Download PDFInfo
- Publication number
- CN103065626A CN103065626A CN2012105573636A CN201210557363A CN103065626A CN 103065626 A CN103065626 A CN 103065626A CN 2012105573636 A CN2012105573636 A CN 2012105573636A CN 201210557363 A CN201210557363 A CN 201210557363A CN 103065626 A CN103065626 A CN 103065626A
- Authority
- CN
- China
- Prior art keywords
- phoneme
- feature
- scoring
- posterior probability
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012360 testing method Methods 0.000 title abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 12
- 239000000284 extract Substances 0.000 claims description 31
- 230000011218 segmentation Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 20
- 238000013077 scoring method Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 230000007613 environmental effect Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004088 simulation Methods 0.000 abstract description 2
- 238000007781 pre-processing Methods 0.000 abstract 2
- 238000009432 framing Methods 0.000 abstract 1
- 238000003754 machining Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 210000002105 tongue Anatomy 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明提供一种英语口语朗读自动评分的方法和设备。该方法包括:对输入语音进行预处理,该预处理中包括分帧处理;从预处理的语音中提取语音特征;利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息;按照各音素分割点信息,计算每个音素的后验概率;基于音素的后验概率,提取多维评分特征;根据评分特征和人工评分信息,使用支持向量回归法训练非线性回归模型,以便利用该非线性回归模型对英语口语朗读进行评分。使用专家打分数据训练评分模型,从统计上保证了机器评分的结果不会偏离人工评分,从而达到计算机对专家评分的高度模拟。
Description
技术领域
本发明属于语言考试自动评分技术领域,具体地说,本发明涉及一种用于非英语母语考生参加的英语口语考试中的朗读题自动评测方法。
背景技术
随着人们对英语口语的重视逐渐加强,目前,口语测试己经成为大多数英语水平考试的重要组成部分。口语考试规模的日益增大使大量考生的口语数据需要进行评分,这需要大量的人力资源。人工评分是传统的评分方法,但有很多不易解决的问题,如评分员资源短缺、人工评测成本高、评分较主观,即使是同一个评分者对相同的样本,在不同的时间受各种条件的影响也可能评出不同的分数。尤其是对超大规模的评测,人工评测已难以满足其需求。因此,一种能够客观地、可批量化处理的机器评分方法是目前所急需的。
英语口语考试中的一个常见的题型是段落朗读。在此题型中,考生被要求大声朗读一段语段,语段的长度通常不少于100个单词。该题型由于朗读的文本固定,因此相对于其他题型,更适于使用机器进行自动批量评分。
正是关于这些及其他考虑才作出了本发明。
发明内容
本发明的目的是对非英语母语考生参加英语口语考试的朗读题录音样本,提供一种机器自动评分的方法,该方法是一种通过从基于隐马尔科夫模型的强制对齐结果中提取评分特征,使用训练数据训练评分模型,使用评分模型进行评分的统计性方法。
为实现上述发明目的,本发明在第一方面提供一种英语口语朗读自动评分方法,其特征在于,包括如下步骤:
对输入语音进行预处理,该预处理中包括分帧处理;
从预处理的语音中提取语音特征;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息;
按照各音素分割点信息,计算每个音素的后验概率;
基于音素的后验概率,提取多维评分特征;
根据评分特征和人工评分信息,训练非线性回归模型,以便利用该非线性回归模型对英语口语朗读进行评分。
优选地,所述预处理包括预加重和/加窗处理。
优选地,所述提取语音特征包括计算每帧语音的感知加权线性预测参数或者美尔域倒谱参数系数;计算每帧语音的能量特征;计算能量特征和倒谱特征的差分;对于每一帧语音,生成语音特征的特征向量。
优选地,所述利用线性语法网络和声学模型,对语音特征向量序列进行强制对齐的步骤包括利用朗读文本搭建单词串联网络,把单词网络展开成音素网络;以便利用该音素网络对语音特征向量序列强制对齐。
优选地,所述根据强制对齐结果,提取多维评分特征包括用单位时间的音素通过率作为一个评分特征。
优选地,所述基于每个音素的后验概率,提取多维评分特征包括用音素后验概率均值作为评分特征。
优选地,所述基于每个音素的后验概率,提取多维评分特征包括:对带环境信息的三音子按照良好发音数据的后验概率均值聚成多个类别,得到三音子聚类表;利用根据三音子聚类表,对输入语音数据中的多个类别的音素的后验概率分别求平均值,得到多维评分特征。
在第二方面,本发明提供一种英语口语朗读自动评分方法,其特征在于,包括如下步骤:
对输入语音进行预处理,该预处理中包括分帧处理;
从输入语音中提取语音特征;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息;
按照各音素分割点信息,计算每个音素的后验概率;
基于音素的后验概率,提取多维评分特征;
利用训练过的非线性回归模型根据评分特征进行评分。
优选地,所述提取语音特征包括计算每帧语音的感知加权线性预测参数或者美尔域倒谱参数系数;计算每帧语音的能量特征;计算能量特征的差分和倒谱特征的差分;对于每一帧语音,生成语音特征的特征向量。
优选地,所述利用线性语法网络和声学模型,对语音特征向量序列进行强制对齐的步骤包括利用朗读文本搭建单词串联网络,把单词网络展开成音素网络,再扩展为状态网络;以便利用该状态网络对语音特征向量序列强制对齐。
优选地,所述根据强制对齐结果,提取多维评分特征包括用单位时间的音素通过率作为一个评分特征。
优选地,所述基于音素的后验概率,提取多维评分特征包括用基于聚类表的音素后验概率均值作为评分特征。
优选地,所述基于音素的后验概率,提取多维评分特征包括:对带环境信息的三音子按照良好发音数据的后验概率均值聚成M个类别,得到三音子聚类表;利用根据三音子聚类表,对考生数据中的M个类别的音素的后验概率分别求平均值,得到多维评分特征。
在第三方面,本发明提供一种英语口语朗读自动评分设备,其特征在于,包括:
对输入语音进行预处理的模块,该预处理中包括分帧处理;
从预处理的语音中提取语音特征的模块;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息的模块;
按照各音素分割点信息,计算每个音素的后验概率的模块;
基于音素的后验概率,提取多维评分特征的模块;
对训练数据,根据评分特征和人工评分信息,训练非线性回归模型,以便利用该非线性回归模型对英语口语朗读进行评分的模块。
在第四方面,本发明提供一种英语口语朗读自动评分设备,其特征在于,包括:
对输入语音进行预处理的模块,该预处理中包括分帧处理;
从预处理的语音中提取语音特征的模块;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息的模块;
按照各音素分割点信息,计算每个音素的后验概率的模块;
基于音素的后验概率,提取多维评分特征的模块;
利用该非线性回归模型根据评分特征对英语口语朗读进行评分的模块。
本发明的优点是,使用专家打分数据训练评分模型,从统计上保证了机器评分的结果不会偏离人工评分,从而达到计算机对专家评分的高度模拟,并且由于计算机相对于人类的不受干扰的优势,机器评分有可能比专家打分更加稳定。
附图说明
图1是本发明第一实施例的评分模型获取方法的流程图;
图2是本发明第二实施例的对考生数据进行评分的流程图;
图3是朗读题自动评分所用状态图的搭建示意图。
具体实施方式
下面结合附图及具体实施例对本发明的朗读评分方法做进一步地描述。
图1是本发明第一实施例的朗读评分方法的流程图。如图1所示,按照该朗读题自动评分方法,在步骤102,将待识别语音输入语音识别系统中。
在步骤104,对输入语音进行预处理,主要是进行分帧处理。
在一个例子中,预处理可以采用如下流程:
2-1)首先,将语音信号按照16K(或8K)采样率进行数字化;
2-2)然后,通过预加重进行高频提升。一个预加重滤波器的例子是:H(z)=1-αz-1,其中α=0.98;
2-3)接着,将数据进行分帧处理:取帧长25ms、帧间重叠15ms,可根据需要适当调整;
2-4)最后,加窗处理。窗函数采用常用的hamming窗函数:
需要说明,上述流程仅属举例,本发明还可以采用其它形式的预处理。比如仅仅进行预加重或者加窗处理。
在步骤106,提取语音特征。可采用PLP(Perceptual LinearPredictive,感知加权线性预测)或者MFCC(mel-frequency cepstralcoefficient,美尔域倒谱系数)参数特征提取方法。
在一个例子中,一个提取语音特征的具体流程如下:
3-1)首先,计算每帧语音的PLP或MFCC参数系数c(m),1≤m≤Nc,其中Nc为倒谱系数的个数,Nc=12。
3-2)计算每帧语音的能量特征;
3-3)计算能量特征和倒谱特征的一阶和二阶差分。采用如下的回归公式计算差分倒谱系数:
其中μ是归一化因子,τ为整数,2T+1为用于计算差分倒谱系数的语音帧数,其中:T=2,μ=0.375;
3-4)对于每一帧语音,生成39维的特征向量。
在步骤110,利用线性语法网络和声学模型,对特征向量序列进行强制对齐,得到各音素分割点信息。
在步骤120,按照步骤110中得到的音素分割点,计算每个音素的后验概率:
其中,pi为当前音素,xi为从强制对齐结果中获得的对应于音素pi的语音段,D为全部音素的集合。
对各类的音素分别计算后验概率均值,作为M维评分特征。在一个优选的例子中,利用三音子聚类表,对各类的音素分别计算后验概率均值,作为M维评分特征。为此,与步骤120的同时或者预先地,在步骤124,选择发音良好的数据,按照步骤120描述的方法,计算所有三音子的后验概率,并分别求出平均值;定义任意两个三音子x、y的距离为:
D(x,y)=|p(x)-p(y)|
其中,D(x,y)为定义的x、y的距离,p(x)、p(y)为x、y的后验概率;
使用通用的K均值聚类方法,按照最小距离的准则,将发音良好的数据中的所有三音子聚成M类,得到三音子聚类表。
对每个训练数据样本,按照步骤7)得到的三音子聚类表,对各类的音素分别计算后验概率均值,作为M维评分特征。用音素后验概率均值作为发音准确度特征。在另一个例子中,特别地,可设定M=1,即不聚类,直接计算所有音素的后验概率平均值作为发音准确度特征。
优选地,与此同时或者预先地,统计单位时间内通过的音素个数,作为另一维评分特征。用单位时间的音素通过率作为流利度信息。
在本发明实施例中提取的评分特征,同时包括了发音准确度特征和发音流利度特征,从而对考生的发音质量有了较全面的评价;对发音准确度特征,对不同类别的三音子区别对待,提取多维评分特征,避免了对后验概率理想值不同的三音子直接求平均而带来的性能损失,从而提高了发音准确度特征的区分度。
在步骤126,使用前述步骤中得到的评分特征,以及专家对训练样本的评分,使用支持向量回归训练方法训练,得到评分模型。
最后,按照评分模型进行评分。
图2是本发明第二实施例的朗读评分方法的流程图。对比图1和图2可见,图1侧重在评分模型的获取流程,图2则侧重在评分流程。获取评分模型获取流程和对考生录音的评分流程十分近似,仅在流程后端有所不同。对图2所示的评分流程,仅将图1的使用人工评分训练评分模型,替换成使用评分模型对考生的录音评分即可。因此,对图2的说明将予以省略。
图3是本发明的强制对齐过程中的状态图的搭建示意图。如图3所示,首先根据朗读文本搭建起一个线性的单词串联网络。借助识别系统中字典的信息,把单词的网络展开成一个最小单位是音素的音素网络。每个节点由单词变为音素,然后每个音素再被声学模型中相对应的隐马尔科夫模型(HMM)所取代,每个马尔科夫模型(HMM)由若干个状态组成,其中每个状态都是可重入的。这样,最终的搜索空间就变成了一个状态图,状态图中的任意一条路径代表一个状态序列候选,通过比较不同路径上的累积概率值(似然概率与转移概率)来获得最优路径作为识别结果。本实施例中,在解码过程中采用了传统的维特比搜索策略;
在第三实施例中,本发明提供一种英语口语朗读自动评分方法,其特征在于,包括如下步骤:
对输入语音进行预处理,该预处理中包括分帧处理;
从输入语音中提取语音特征;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息;
按照各音素分割点信息,计算每个音素的后验概率;
基于音素的后验概率,提取多维评分特征;
利用训练过的非线性回归模型根据评分特征进行评分。
优选地,所述提取语音特征包括计算每帧语音的感知加权线性预测参数或者美尔域倒谱参数系数;计算每帧语音的能量特征;计算能量特征的差分和倒谱特征的差分;对于每一帧语音,生成语音特征的特征向量。
优选地,所述利用线性语法网络和声学模型,对语音特征向量序列进行强制对齐的步骤包括利用朗读文本搭建单词串联网络,把单词网络展开成音素网络再扩展为状态网络;以便利用该状态网络对语音特征向量序列强制对齐。
优选地,所述根据强制对齐结果,提取多维评分特征包括用单位时间的音素通过率作为一个评分特征。
优选地,所述基于音素的后验概率,提取多维评分特征包括用音素后验概率均值作为评分特征。
优选地,所述基于音素的后验概率,提取多维评分特征包括:对带环境信息的三音子按照良好发音数据的后验概率均值聚成M个类别,得到三音子聚类表;利用根据三音子聚类表,对考生数据中的M个类别的音素的后验概率分别求平均值,得到多维评分特征。
在第四实施例,本发明提供一种英语口语朗读自动评分设备,其特征在于,包括:
对输入语音进行预处理的模块,该预处理中包括分帧处理;
提取语音特征的模块;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息的模块;
按照各音素分割点信息,计算每个音素的后验概率的模块;
基于音素的后验概率,提取多维评分特征的模块;
根据评分特征和人工评分信息,使用支持向量回归法训练非线性回归模型,以便利用该非线性回归模型对英语口语朗读进行评分的模块。
在第五实施例,本发明提供一种英语口语朗读自动评分设备,其特征在于,包括:
对输入语音进行预处理的模块,该预处理中包括分帧处理;
提取方法提取语音特征的模块;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息的模块;
按照各音素分割点信息,计算每个音素的后验概率的模块;
基于音素的后验概率,提取多维评分特征的模块;
利用该非线性回归模型根据评分特征对英语口语朗读进行评分的模块。
第三、第四和第五实施例的各方面细节可以参考前文结合图1所做的描述。这里不复赘述。
测试试验:
为测试本发明的效果,录制了7000个母语为汉语普通话的中学学生的英语篇章朗读数据,学生中男女比例为1:1。每个学生被要求朗读一段长约100个单词的英文语料,语料来自于中学英文课本。聘请了教学一线的英语教师对这些录制的语音评分。这7000个学生的数据中的4000个用于训练,另外3000个学生的数据用于测试。通过整理数据,使训练集和测试集的人工分数的分布情况和朗读者性别比例一致。我们的目标是提高评分正确率,即尽可能使机器评估的准确性接近或超过专家评估的准确性。
使用平均分差和相关系数两个指标来评价评分的准确性。
平均分差为各样本的待测分与最终分分差的绝对值平均:
其中,N为样本个数,sci为第i个样本的待测分数,shi为第i个样本的最终分数。
相关系数指样本的待测分和最终分的相关系数,使用下述公式计算两个序列X和Y的相关系数:
为了和机器评分的准确性进行对比,测试了人工评分的准确性,作为测试机器评分准确性的参照。测试试验中使用了四位评分教师作评分,任取其中的三位教师的评分确定最终分,确定方法是,对每个样本,如果有两位老师或超过两位老师给出相同的分数,则以此分数作为该样本的最终分数;如果三位老师给出的分数各不相同,则取中间的分数作为最终分数。用其余一位教师评分和最终分比较,计算该教师的评分准确性。本文轮流选择一位教师的评分作测试,另三位教师的综合评分做最终分,测试四次取平均值,四次测试的平均结果如表1所示。
表1:
表2给出了机器评分的测试结果,从表中可见,机器评分在分差和相关系数上的表现好过人工评分。
表2:
表3给出了使用音素和不使用音素聚类(即聚类类别数为1)的测试结果对比,从表中可见,音素聚类后,系统的评分性能被明显地改进了。
表3:
本领域技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。另外,软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (15)
1.一种英语口语朗读自动评分方法,其特征在于,包括如下步骤:
对输入语音进行预处理,该预处理中包括分帧处理;
从预处理的语音中提取语音特征;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息;
按照各音素分割点信息,计算每个音素的后验概率;
基于音素的后验概率,提取多维评分特征;
根据评分特征和人工评分信息,使用支持向量回归法训练非线性回归模型,以便利用该非线性回归模型对英语口语朗读进行评分。
2.根据权利要求1所述的自动评分方法,其特征在于,所述预处理包括预加重和/加窗处理。
3.根据权利要求1所述的自动评分方法,其特征在于,所述提取语音特征包括计算每帧语音的感知加权线性预测参数或者美尔域倒谱参数系数;计算每帧语音的能量特征;计算能量特征的差分和倒谱特征的差分;对于每一帧语音,生成语音特征的特征向量。
4.根据权利要求1所述的自动评分方法,其特征在于,所述利用线性语法网络和声学模型,对语音特征向量序列进行强制对齐的步骤包括利用朗读文本搭建单词串联网络,把单词网络展开成音素网络,再扩展为状态网络;以便利用该状态网络对语音特征向量序列强制对齐。
5.根据权利要求1所述的自动评分方法,其特征在于,所述根据强制对齐结果,提取多维评分特征包括用单位时间的音素通过率作为一个评分特征。
6.根据权利要求1所述的自动评分方法,其特征在于,所述基于音素的后验概率,提取多维评分特征包括用基于聚类表的音素后验概率均值作为评分特征。
7.根据权利要求6所述的自动评分方法,其特征在于,所述基于音素的后验概率,提取多维评分特征包括:对带环境信息的三音子按照良好发音数据的后验概率均值聚成多个类别,得到三音子聚类表;利用根据三音子聚类表,对输入语音数据中的多个类别的音素的后验概率分别求平均值,得到多维评分特征。
8.一种英语口语朗读自动评分方法,其特征在于,包括如下步骤:
对输入语音进行预处理,该预处理中包括分帧处理;
从输入语音中提取语音特征;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息;
按照各音素分割点信息,计算每个音素的后验概率;
基于音素的后验概率,提取多维评分特征;
利用训练过的非线性回归模型根据评分特征进行评分。
9.根据权利要求8所述的自动评分方法,其特征在于,所述提取语音特征包括计算每帧语音的感知加权线性预测参数或者美尔域倒谱参数系数;计算每帧语音的能量特征;计算能量特征和倒谱特征的差分;对于每一帧语音,生成语音特征的特征向量。
10.根据权利要求8所述的自动评分方法,其特征在于,所述利用线性语法网络和声学模型,对语音特征向量序列进行强制对齐的步骤包括利用朗读文本搭建单词串联网络,把单词网络展开成音素网络,再将音素网络展开成状态网络;以便利用该状态网络对语音特征向量序列强制对齐。
11.根据权利要求8所述的自动评分方法,其特征在于,所述根据强制对齐结果,提取多维评分特征包括用单位时间的音素通过率作为一个评分特征。
12.根据权利要求8所述的自动评分方法,其特征在于,所述基于音素的后验概率,提取多维评分特征包括用音素后验概率均值作为评分特征。
13.根据权利要求12所述的自动评分方法,其特征在于,所述基于音素的后验概率,提取多维评分特征包括:对带环境信息的三音子按照良好发音数据的后验概率均值聚成M个类别,得到三音子聚类表;利用根据三音子聚类表,对考生数据中的M个类别的音素的后验概率分别求平均值,得到多维评分特征。
14.一种英语口语朗读自动评分设备,其特征在于,包括:
对输入语音进行预处理的模块,该预处理中包括分帧处理;
提取语音特征的模块;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息的模块;
按照各音素分割点信息,计算每个音素的后验概率的模块;
基于音素的后验概率,提取多维评分特征的模块;
对训练数据,根据评分特征和人工评分信息,使用支持向量回归法训练非线性回归模型,以便利用该非线性回归模型对英语口语朗读进行评分的模块。
15.一种英语口语朗读自动评分设备,其特征在于,包括:
对输入语音进行预处理的模块,该预处理中包括分帧处理;
从预处理的语音中提取语音特征的模块;
利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息的模块;
按照各音素分割点信息,计算音素的后验概率的模块;
基于音素的后验概率,提取多维评分特征的模块;
利用该非线性回归模型根据评分特征对英语口语朗读进行评分的模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210557363.6A CN103065626B (zh) | 2012-12-20 | 2012-12-20 | 英语口语考试系统中的朗读题自动评分方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210557363.6A CN103065626B (zh) | 2012-12-20 | 2012-12-20 | 英语口语考试系统中的朗读题自动评分方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103065626A true CN103065626A (zh) | 2013-04-24 |
CN103065626B CN103065626B (zh) | 2015-03-11 |
Family
ID=48108226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210557363.6A Expired - Fee Related CN103065626B (zh) | 2012-12-20 | 2012-12-20 | 英语口语考试系统中的朗读题自动评分方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103065626B (zh) |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103594087A (zh) * | 2013-11-08 | 2014-02-19 | 安徽科大讯飞信息科技股份有限公司 | 提高口语评测性能的方法及系统 |
CN103985392A (zh) * | 2014-04-16 | 2014-08-13 | 柳超 | 音素级的低功耗的口语评价与缺陷诊断方法 |
CN104318921A (zh) * | 2014-11-06 | 2015-01-28 | 科大讯飞股份有限公司 | 音段切分检测方法及系统、口语评测方法及系统 |
CN104347071A (zh) * | 2013-08-02 | 2015-02-11 | 安徽科大讯飞信息科技股份有限公司 | 生成口语考试参考答案的方法及系统 |
CN104505089A (zh) * | 2014-12-17 | 2015-04-08 | 福建网龙计算机网络信息技术有限公司 | 口语纠错方法及设备 |
WO2015062465A1 (zh) * | 2013-10-30 | 2015-05-07 | 上海流利说信息技术有限公司 | 移动设备上的实时口语评价系统及方法 |
CN105609114A (zh) * | 2014-11-25 | 2016-05-25 | 科大讯飞股份有限公司 | 一种发音检测方法及装置 |
CN105825852A (zh) * | 2016-05-23 | 2016-08-03 | 渤海大学 | 一种英语口语朗读考试评分方法 |
CN106057196A (zh) * | 2016-07-08 | 2016-10-26 | 成都之达科技有限公司 | 车载语音数据解析识别方法 |
CN106558252A (zh) * | 2015-09-28 | 2017-04-05 | 百度在线网络技术(北京)有限公司 | 由计算机实现的口语练习方法及装置 |
CN106653055A (zh) * | 2016-10-20 | 2017-05-10 | 北京创新伙伴教育科技有限公司 | 在线英语口语评估系统 |
CN106653029A (zh) * | 2016-12-02 | 2017-05-10 | 广东小天才科技有限公司 | 一种音频批量分割方法及装置 |
CN106897384A (zh) * | 2017-01-23 | 2017-06-27 | 科大讯飞股份有限公司 | 一种要点题自动评价方法及装置 |
WO2017166625A1 (zh) * | 2016-03-30 | 2017-10-05 | 乐视控股(北京)有限公司 | 用于语音识别的声学模型训练方法、装置和电子设备 |
CN107316255A (zh) * | 2017-04-07 | 2017-11-03 | 苏州清睿教育科技股份有限公司 | 一种高效率的穿梭在线比赛的比赛方法 |
CN107886968A (zh) * | 2017-12-28 | 2018-04-06 | 广州讯飞易听说网络科技有限公司 | 语音评测方法及系统 |
CN107958673A (zh) * | 2017-11-28 | 2018-04-24 | 北京先声教育科技有限公司 | 一种口语评分方法及装置 |
CN108496219A (zh) * | 2015-11-04 | 2018-09-04 | 剑桥大学的校长、教师和学者 | 语音处理系统和方法 |
CN109256152A (zh) * | 2018-11-08 | 2019-01-22 | 上海起作业信息科技有限公司 | 语音评分方法及装置、电子设备、存储介质 |
CN109658921A (zh) * | 2019-01-04 | 2019-04-19 | 平安科技(深圳)有限公司 | 一种语音信号处理方法、设备及计算机可读存储介质 |
CN110136697A (zh) * | 2019-06-06 | 2019-08-16 | 深圳市数字星河科技有限公司 | 一种基于多进程线程并行运算的英语朗读练习系统 |
CN110164422A (zh) * | 2019-04-03 | 2019-08-23 | 苏州驰声信息科技有限公司 | 一种口语考试的多维度评估方法及装置 |
CN110390948A (zh) * | 2019-07-24 | 2019-10-29 | 厦门快商通科技股份有限公司 | 一种快速语音识别的方法及系统 |
CN111105813A (zh) * | 2019-12-31 | 2020-05-05 | 科大讯飞股份有限公司 | 朗读评分方法、装置、设备及可读存储介质 |
CN111489736A (zh) * | 2020-04-10 | 2020-08-04 | 复旦大学 | 座席话术自动评分装置及方法 |
CN111653292A (zh) * | 2020-06-22 | 2020-09-11 | 桂林电子科技大学 | 一种中国学生英语朗读质量分析方法 |
CN112927696A (zh) * | 2019-12-05 | 2021-06-08 | 中国科学院深圳先进技术研究院 | 一种基于语音识别的构音障碍自动评估系统和方法 |
CN113035236A (zh) * | 2021-05-24 | 2021-06-25 | 北京爱数智慧科技有限公司 | 语音合成数据的质检方法以及装置 |
CN113053414A (zh) * | 2019-12-26 | 2021-06-29 | 航天信息股份有限公司 | 一种发音评测方法及装置 |
CN113436487A (zh) * | 2021-07-08 | 2021-09-24 | 上海松鼠课堂人工智能科技有限公司 | 基于虚拟现实场景的中文朗诵技能训练方法与系统 |
CN113516879A (zh) * | 2020-04-09 | 2021-10-19 | 北京一起教育信息咨询有限责任公司 | 小学生识字量测验方法及装置 |
CN115497455A (zh) * | 2022-11-21 | 2022-12-20 | 山东山大鸥玛软件股份有限公司 | 一种英语口语考试语音智能评测方法、系统及装置 |
CN115798519A (zh) * | 2023-02-10 | 2023-03-14 | 山东山大鸥玛软件股份有限公司 | 一种英语多题型口语发音评估方法及系统 |
CN109658921B (zh) * | 2019-01-04 | 2024-05-28 | 平安科技(深圳)有限公司 | 一种语音信号处理方法、设备及计算机可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739868A (zh) * | 2008-11-19 | 2010-06-16 | 中国科学院自动化研究所 | 一种用于口语测试的文本朗读水平自动评估诊断方法 |
CN101826263A (zh) * | 2009-03-04 | 2010-09-08 | 中国科学院自动化研究所 | 基于客观标准的自动化口语评估系统 |
-
2012
- 2012-12-20 CN CN201210557363.6A patent/CN103065626B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739868A (zh) * | 2008-11-19 | 2010-06-16 | 中国科学院自动化研究所 | 一种用于口语测试的文本朗读水平自动评估诊断方法 |
CN101826263A (zh) * | 2009-03-04 | 2010-09-08 | 中国科学院自动化研究所 | 基于客观标准的自动化口语评估系统 |
Non-Patent Citations (3)
Title |
---|
万林峰: "数字语音评价系统研究与应用", 《中国优秀博硕士学位论文全文数据库 (硕士) 信息科技辑》, 15 November 2006 (2006-11-15) * |
安丽丽,吴延年,刘志,刘润生: "一种基于检错音网络的发音错误检测新算法", 《电子与信息学报》, vol. 34, no. 9, 30 September 2012 (2012-09-30) * |
李超雷: "交互式语言学习系统中的发音质量客观评价方法研", 《中国博士学位论文全文数据库信息科技辑》, 15 October 2008 (2008-10-15) * |
Cited By (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104347071A (zh) * | 2013-08-02 | 2015-02-11 | 安徽科大讯飞信息科技股份有限公司 | 生成口语考试参考答案的方法及系统 |
WO2015062465A1 (zh) * | 2013-10-30 | 2015-05-07 | 上海流利说信息技术有限公司 | 移动设备上的实时口语评价系统及方法 |
CN103594087A (zh) * | 2013-11-08 | 2014-02-19 | 安徽科大讯飞信息科技股份有限公司 | 提高口语评测性能的方法及系统 |
CN103594087B (zh) * | 2013-11-08 | 2016-10-12 | 科大讯飞股份有限公司 | 提高口语评测性能的方法及系统 |
CN103985392A (zh) * | 2014-04-16 | 2014-08-13 | 柳超 | 音素级的低功耗的口语评价与缺陷诊断方法 |
CN104318921B (zh) * | 2014-11-06 | 2017-08-25 | 科大讯飞股份有限公司 | 音段切分检测方法及系统、口语评测方法及系统 |
CN104318921A (zh) * | 2014-11-06 | 2015-01-28 | 科大讯飞股份有限公司 | 音段切分检测方法及系统、口语评测方法及系统 |
CN105609114B (zh) * | 2014-11-25 | 2019-11-15 | 科大讯飞股份有限公司 | 一种发音检测方法及装置 |
CN105609114A (zh) * | 2014-11-25 | 2016-05-25 | 科大讯飞股份有限公司 | 一种发音检测方法及装置 |
CN104505089B (zh) * | 2014-12-17 | 2018-05-18 | 福建网龙计算机网络信息技术有限公司 | 口语纠错方法及设备 |
CN104505089A (zh) * | 2014-12-17 | 2015-04-08 | 福建网龙计算机网络信息技术有限公司 | 口语纠错方法及设备 |
CN106558252A (zh) * | 2015-09-28 | 2017-04-05 | 百度在线网络技术(北京)有限公司 | 由计算机实现的口语练习方法及装置 |
CN106558252B (zh) * | 2015-09-28 | 2020-08-21 | 百度在线网络技术(北京)有限公司 | 由计算机实现的口语练习方法及装置 |
CN108496219B (zh) * | 2015-11-04 | 2022-12-30 | 剑桥大学的校长、教师和学者 | 语音处理系统和方法 |
CN108496219A (zh) * | 2015-11-04 | 2018-09-04 | 剑桥大学的校长、教师和学者 | 语音处理系统和方法 |
WO2017166625A1 (zh) * | 2016-03-30 | 2017-10-05 | 乐视控股(北京)有限公司 | 用于语音识别的声学模型训练方法、装置和电子设备 |
CN105825852A (zh) * | 2016-05-23 | 2016-08-03 | 渤海大学 | 一种英语口语朗读考试评分方法 |
CN106057196B (zh) * | 2016-07-08 | 2019-06-11 | 成都之达科技有限公司 | 车载语音数据解析识别方法 |
CN106057196A (zh) * | 2016-07-08 | 2016-10-26 | 成都之达科技有限公司 | 车载语音数据解析识别方法 |
CN106653055A (zh) * | 2016-10-20 | 2017-05-10 | 北京创新伙伴教育科技有限公司 | 在线英语口语评估系统 |
CN106653029A (zh) * | 2016-12-02 | 2017-05-10 | 广东小天才科技有限公司 | 一种音频批量分割方法及装置 |
CN106897384A (zh) * | 2017-01-23 | 2017-06-27 | 科大讯飞股份有限公司 | 一种要点题自动评价方法及装置 |
CN107316255A (zh) * | 2017-04-07 | 2017-11-03 | 苏州清睿教育科技股份有限公司 | 一种高效率的穿梭在线比赛的比赛方法 |
CN107958673A (zh) * | 2017-11-28 | 2018-04-24 | 北京先声教育科技有限公司 | 一种口语评分方法及装置 |
CN107886968A (zh) * | 2017-12-28 | 2018-04-06 | 广州讯飞易听说网络科技有限公司 | 语音评测方法及系统 |
CN109256152A (zh) * | 2018-11-08 | 2019-01-22 | 上海起作业信息科技有限公司 | 语音评分方法及装置、电子设备、存储介质 |
CN109658921A (zh) * | 2019-01-04 | 2019-04-19 | 平安科技(深圳)有限公司 | 一种语音信号处理方法、设备及计算机可读存储介质 |
CN109658921B (zh) * | 2019-01-04 | 2024-05-28 | 平安科技(深圳)有限公司 | 一种语音信号处理方法、设备及计算机可读存储介质 |
WO2020140607A1 (zh) * | 2019-01-04 | 2020-07-09 | 平安科技(深圳)有限公司 | 一种语音信号处理方法、设备及计算机可读存储介质 |
CN110164422A (zh) * | 2019-04-03 | 2019-08-23 | 苏州驰声信息科技有限公司 | 一种口语考试的多维度评估方法及装置 |
CN110136697A (zh) * | 2019-06-06 | 2019-08-16 | 深圳市数字星河科技有限公司 | 一种基于多进程线程并行运算的英语朗读练习系统 |
CN110390948B (zh) * | 2019-07-24 | 2022-04-19 | 厦门快商通科技股份有限公司 | 一种快速语音识别的方法及系统 |
CN110390948A (zh) * | 2019-07-24 | 2019-10-29 | 厦门快商通科技股份有限公司 | 一种快速语音识别的方法及系统 |
CN112927696A (zh) * | 2019-12-05 | 2021-06-08 | 中国科学院深圳先进技术研究院 | 一种基于语音识别的构音障碍自动评估系统和方法 |
CN113053414A (zh) * | 2019-12-26 | 2021-06-29 | 航天信息股份有限公司 | 一种发音评测方法及装置 |
CN113053414B (zh) * | 2019-12-26 | 2024-05-28 | 航天信息股份有限公司 | 一种发音评测方法及装置 |
CN111105813B (zh) * | 2019-12-31 | 2022-09-02 | 科大讯飞股份有限公司 | 朗读评分方法、装置、设备及可读存储介质 |
CN111105813A (zh) * | 2019-12-31 | 2020-05-05 | 科大讯飞股份有限公司 | 朗读评分方法、装置、设备及可读存储介质 |
CN113516879A (zh) * | 2020-04-09 | 2021-10-19 | 北京一起教育信息咨询有限责任公司 | 小学生识字量测验方法及装置 |
CN111489736B (zh) * | 2020-04-10 | 2023-06-23 | 复旦大学 | 座席话术自动评分装置及方法 |
CN111489736A (zh) * | 2020-04-10 | 2020-08-04 | 复旦大学 | 座席话术自动评分装置及方法 |
CN111653292A (zh) * | 2020-06-22 | 2020-09-11 | 桂林电子科技大学 | 一种中国学生英语朗读质量分析方法 |
CN113035236B (zh) * | 2021-05-24 | 2021-08-27 | 北京爱数智慧科技有限公司 | 语音合成数据的质检方法以及装置 |
CN113035236A (zh) * | 2021-05-24 | 2021-06-25 | 北京爱数智慧科技有限公司 | 语音合成数据的质检方法以及装置 |
CN113436487A (zh) * | 2021-07-08 | 2021-09-24 | 上海松鼠课堂人工智能科技有限公司 | 基于虚拟现实场景的中文朗诵技能训练方法与系统 |
CN115497455A (zh) * | 2022-11-21 | 2022-12-20 | 山东山大鸥玛软件股份有限公司 | 一种英语口语考试语音智能评测方法、系统及装置 |
CN115497455B (zh) * | 2022-11-21 | 2023-05-05 | 山东山大鸥玛软件股份有限公司 | 一种英语口语考试语音智能评测方法、系统及装置 |
CN115798519B (zh) * | 2023-02-10 | 2023-05-05 | 山东山大鸥玛软件股份有限公司 | 一种英语多题型口语发音评估方法及系统 |
CN115798519A (zh) * | 2023-02-10 | 2023-03-14 | 山东山大鸥玛软件股份有限公司 | 一种英语多题型口语发音评估方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103065626B (zh) | 2015-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103065626B (zh) | 英语口语考试系统中的朗读题自动评分方法和设备 | |
CN101740024B (zh) | 基于广义流利的口语流利度自动评估方法 | |
CN101751919B (zh) | 一种汉语口语重音自动检测方法 | |
RANG et al. | Functional loads of pronunciation features in nonnative speakers' oral assessment | |
CN105845134A (zh) | 自由朗读题型的口语评测方法及系统 | |
CN101826263A (zh) | 基于客观标准的自动化口语评估系统 | |
Bolanos et al. | Automatic assessment of expressive oral reading | |
CN103559894A (zh) | 口语评测方法及系统 | |
CN103559892A (zh) | 口语评测方法及系统 | |
CN108648527B (zh) | 一种英语发音匹配纠正方法 | |
CN103366759A (zh) | 语音数据的测评方法和装置 | |
CN102723077B (zh) | 汉语教学语音合成方法及装置 | |
CN106856095A (zh) | 一种拼音拼读的发音质量评测系统 | |
CN108470476B (zh) | 一种英语发音匹配纠正系统 | |
Lai et al. | A multimedia learning system using hmms to improve phonemic awareness for english pronunciation | |
Benway et al. | Differences between school-age children with apraxia of speech and other speech sound disorders on multisyllable repetition | |
Hsieh et al. | Features measuring fluency and pronunciation | |
CN202758611U (zh) | 语音数据的测评装置 | |
Bhat et al. | Automatic fluency assessment by signal-level measurement of spontaneous speech | |
Luo et al. | Investigation of the effects of automatic scoring technology on human raters' performances in L2 speech proficiency assessment | |
Luo et al. | Analysis and comparison of automatic language proficiency assessment between shadowed sentences and read sentences. | |
Li et al. | English sentence pronunciation evaluation using rhythm and intonation | |
Li | General Design of Automatic Correction System for English Pronunciation Errors Based on DTW Algorithm | |
Luo et al. | Speech analysis for automatic evaluation of shadowing | |
CN103021226B (zh) | 一种基于发音节奏的语音评测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150311 |
|
CF01 | Termination of patent right due to non-payment of annual fee |