CN111128238B - 普通话评测方法及装置 - Google Patents

普通话评测方法及装置 Download PDF

Info

Publication number
CN111128238B
CN111128238B CN201911406413.9A CN201911406413A CN111128238B CN 111128238 B CN111128238 B CN 111128238B CN 201911406413 A CN201911406413 A CN 201911406413A CN 111128238 B CN111128238 B CN 111128238B
Authority
CN
China
Prior art keywords
evaluation
evaluation result
pronunciation
mandarin
tested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911406413.9A
Other languages
English (en)
Other versions
CN111128238A (zh
Inventor
牛传迎
郭伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN201911406413.9A priority Critical patent/CN111128238B/zh
Publication of CN111128238A publication Critical patent/CN111128238A/zh
Application granted granted Critical
Publication of CN111128238B publication Critical patent/CN111128238B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

本发明是关于普通话评测方法及装置。该方法包括:接收待测试发音;基于发音空间的第一混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第一评测结果;基于发音空间的第二混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第二评测结果;根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。通过本发明的技术方案,可综合第一评测结果和第二评测结果对待测试发音进行最终评估,以确定最终普通话评测结果,从而通过多次评估提高普通话测试的准确率。

Description

普通话评测方法及装置
技术领域
本发明涉及终端技术领域,尤其涉及普通话评测方法及装置。
背景技术
目前,在对普通话进行评测时,除了对学习者的整体普通话情况(例如篇章、段落、句子、词语、单字等)给出分数评测,还需要指出学习者的具体发音错误,给学习者反馈信息,这样才能帮助他们提高口语水平。而现有技术通常会受方言、口齿不清、拖音等因素影响而造成普通话评测不准。
发明内容
本发明实施例提供了普通话评测方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供一种普通话评测方法,包括:
接收待测试发音;
基于发音空间的第一混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第一评测结果;
基于发音空间的第二混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第二评测结果;
根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。
在一个实施例中,所述根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果,包括:
获取第一评测阈值和第二评测阈值;
根据所述第一评测阈值、所述第一评测结果、所述第二评测阈值和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。
在一个实施例中,所述根据所述第一评测阈值、所述第一评测结果、所述第二评测阈值和所述第二评测结果,确定所述待测试发音的最终普通话评测结果,包括:
将所述第一评测结果与所述第一评测阈值进行比较;
当所述第一评测结果大于所述第一评测阈值且所述第二评测结果小于所述第二评测阈值时,将所述第一评测结果确定为所述最终普通话评测结果,否则,将所述第二评测结果确定为所述最终普通话评测结果,其中,所述第一评测阈值大于所述第二评测阈值。
在一个实施例中,所述根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果,包括:
对所述第一评测结果和所述第二评测结果进行线性加权,以获得所述最终普通话评测结果。
在一个实施例中,所述发音空间的第一混淆网络解码图为基于扩展声调发音空间的混淆网络解码图;
所述发音空间的第二混淆网络解码图为基于全扩展声韵母、声调发音空间的混淆网络解码图。
根据本发明实施例的第二方面,提供一种普通话评测装置,包括:
接收模块,用于接收待测试发音;
第一评测模块,用于基于发音空间的第一混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第一评测结果;
第二评测模块,用于基于发音空间的第二混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第二评测结果;
确定模块,用于根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。
在一个实施例中,所述确定模块包括:
获取子模块,用于获取第一评测阈值和第二评测阈值;
确定子模块,用于根据所述第一评测阈值、所述第一评测结果、所述第二评测阈值和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。
在一个实施例中,所述确定子模块还用于:
将所述第一评测结果与所述第一评测阈值进行比较;
当所述第一评测结果大于所述第一评测阈值且所述第二评测结果小于所述第二评测阈值时,将所述第一评测结果确定为所述最终普通话评测结果,否则,将所述第二评测结果确定为所述最终普通话评测结果,其中,所述第一评测阈值大于所述第二评测阈值。
在一个实施例中,所述确定模块包括:
加权子模块,用于对所述第一评测结果和所述第二评测结果进行线性加权,以获得所述最终普通话评测结果。
在一个实施例中,所述发音空间的第一混淆网络解码图为基于扩展声调发音空间的混淆网络解码图;
所述发音空间的第二混淆网络解码图为基于全扩展声韵母、声调发音空间的混淆网络解码图。
本发明的实施例提供的技术方案可以包括以下有益效果:
在接收到待测试发音时,可基于上述第一混淆网络解码图对待测试发音初次进行普通话测试,以获得第一评测结果,并基于上述第二混淆网络解码图对待测试发音再次进行普通话测试,从而综合第一评测结果和第二评测结果对待测试发音进行最终评估,以确定最终普通话评测结果,从而通过多次评估提高普通话测试的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种普通话评测方法的流程图。
图2是根据一示例性实施例示出的一种普通话评测装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
为了解决上述技术问题,本发明实施例提供了一种普通话评测方法,该方法可用于普通话评测程序、系统或装置中,且该方法对应的执行主体可以是终端或服务器,如图1所示,该方法包括步骤S101至步骤S104:
在步骤S101中,接收待测试发音;
在步骤S102中,基于发音空间的第一混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第一评测结果;
在步骤S103中,基于发音空间的第二混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第二评测结果;
在步骤S104中,根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。
在接收到待测试发音时,可基于上述第一混淆网络解码图对待测试发音初次进行普通话测试,以获得第一评测结果,并基于上述第二混淆网络解码图对待测试发音再次进行普通话测试,从而综合第一评测结果和第二评测结果对待测试发音进行最终评估,以确定最终普通话评测结果,从而通过多次评估提高普通话测试的准确率。
另外,混淆网络解码图由海量的声母、韵母以及音调(汉语的第一声至第四声)组成,因而,通过使用第一混淆网络解码图和第二混淆网络解码图对待测试发音进行普通话评测,可进一步提高普通话测试准确率,避免普通话测试由于受地方发音或者口齿不清等方面的问题而导致测试不准。
在一个实施例中,所述根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果,包括:
获取第一评测阈值和第二评测阈值;
根据所述第一评测阈值、所述第一评测结果、所述第二评测阈值和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。
在确定第一评测阈值和第二评测阈值后,可根据第一评测阈值、第一评测结果、所述第二评测阈值和所述第二评测结果,自动确定所述待测试发音的最终普通话评测结果,以提高普通话测试准确率。
在一个实施例中,所述根据所述第一评测阈值、所述第一评测结果、所述第二评测阈值和所述第二评测结果,确定所述待测试发音的最终普通话评测结果,包括:
将所述第一评测结果与所述第一评测阈值进行比较;
当所述第一评测结果大于所述第一评测阈值且所述第二评测结果小于所述第二评测阈值时,将所述第一评测结果确定为所述最终普通话评测结果,否则,将所述第二评测结果确定为所述最终普通话评测结果,其中,所述第一评测阈值大于所述第二评测阈值。当第一评测结果大于所述第一评测阈值且第二评测结果小于所述第二评测阈值时,说明第一评测结果打分较高且第二评测结果打分较低,在这种情况下以较高的可信度认为第一评测结果较准确,因而将第一评测结果自动确定为所述最终普通话评测结果;其余情况则认为第二评测结果较准确,将第二评测结果确定为最终普通话评测结果。需要说明的是,这里第一评测阈值大于第二评测阈值。
在一个实施例中,所述根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果,包括:
对所述第一评测结果和所述第二评测结果进行线性加权,以获得所述最终普通话评测结果。
当然,在获得最终普通话评测结果时,还可利用第一评测结果和第二评测结果进行线性加权。
在一个实施例中,所述发音空间的第一混淆网络解码图为基于扩展声调发音空间的混淆网络解码图;
所述发音空间的第二混淆网络解码图为基于全扩展声韵母、声调发音空间的混淆网络解码图。
基于扩展声调发音空间的混淆网络解码图将发音词典中记录的评测汉字的发音扩展为韵母相同但声调不同的发音,例如将zh ong1扩展为zh ong0、zh ong1、zh ong2、zhong3、zh ong4。
基于全扩展声韵母、声调发音空间的混淆网络解码图将发音词典中记录的评测汉字的声母扩展为汉语的所有声母,并将评测汉字发音韵母扩展为汉语的所有韵母,同时将评测汉字的声调(即第一声、第二声、第三声、第四声)扩展为汉语的所有声调。
而待测试发音即评测汉字的发音。
最后,需要明确的是:本领域技术人员可根据实际需求,将上述多个实施例进行自由组合。
对应本发明实施例提供的上述普通话评测方法,本发明实施例还提供一种普通话评测装置,如图2所示,该装置包括:
接收模块201,用于接收待测试发音;
第一评测模块202,用于基于发音空间的第一混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第一评测结果;
第二评测模块203,用于基于发音空间的第二混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第二评测结果;
确定模块204,用于根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。
在一个实施例中,所述确定模块包括:
获取子模块,用于获取第一评测阈值和第二评测阈值;
确定子模块,用于根据所述第一评测阈值、所述第一评测结果、所述第二评测阈值和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。
在一个实施例中,所述确定子模块还用于:
将所述第一评测结果与所述第一评测阈值进行比较;
当所述第一评测结果大于所述第一评测阈值且所述第二评测结果小于所述第二评测阈值时,将所述第一评测结果确定为所述最终普通话评测结果,否则,将所述第二评测结果确定为所述最终普通话评测结果,其中,所述第一评测阈值大于所述第二评测阈值。
在一个实施例中,所述确定模块包括:
加权子模块,用于对所述第一评测结果和所述第二评测结果进行线性加权,以获得所述最终普通话评测结果。
在一个实施例中,所述发音空间的第一混淆网络解码图为基于扩展声调发音空间的混淆网络解码图;
所述发音空间的第二混淆网络解码图为基于全扩展声韵母、声调发音空间的混淆网络解码图。
本领域技术人员在考虑说明书及实践这里发明的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (8)

1.一种普通话评测方法,其特征在于,包括:
接收待测试发音;
基于发音空间的第一混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第一评测结果;
基于发音空间的第二混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第二评测结果;
根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果;
所述发音空间的第一混淆网络解码图为基于扩展声调发音空间的混淆网络解码图;
所述发音空间的第二混淆网络解码图为基于全扩展声韵母、声调发音空间的混淆网络解码图。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果,包括:
获取第一评测阈值和第二评测阈值;
根据所述第一评测阈值、所述第一评测结果、所述第二评测阈值和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。
3.根据权利要求2所述的方法,其特征在于,
所述根据所述第一评测阈值、所述第一评测结果、所述第二评测阈值和所述第二评测结果,确定所述待测试发音的最终普通话评测结果,包括:
将所述第一评测结果与所述第一评测阈值进行比较;
当所述第一评测结果大于所述第一评测阈值且所述第二评测结果小于所述第二评测阈值时,将所述第一评测结果确定为所述最终普通话评测结果,否则,将所述第二评测结果确定为所述最终普通话评测结果,其中,所述第一评测阈值大于所述第二评测阈值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果,包括:
对所述第一评测结果和所述第二评测结果进行线性加权,以获得所述最终普通话评测结果。
5.一种普通话评测装置,其特征在于,包括:
接收模块,用于接收待测试发音;
第一评测模块,用于基于发音空间的第一混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第一评测结果;
第二评测模块,用于基于发音空间的第二混淆网络解码图,对所述待测试发音进行普通话评测,获得所述待测试发音的第二评测结果;
确定模块,用于根据所述第一评测结果和所述第二评测结果,确定所述待测试发音的最终普通话评测结果;
所述发音空间的第一混淆网络解码图为基于扩展声调发音空间的混淆网络解码图;
所述发音空间的第二混淆网络解码图为基于全扩展声韵母、声调发音空间的混淆网络解码图。
6.根据权利要求5所述的装置,其特征在于,所述确定模块包括:
获取子模块,用于获取第一评测阈值和第二评测阈值;
确定子模块,用于根据所述第一评测阈值、所述第一评测结果、所述第二评测阈值和所述第二评测结果,确定所述待测试发音的最终普通话评测结果。
7.根据权利要求6所述的装置,其特征在于,
所述确定子模块还用于:
将所述第一评测结果与所述第一评测阈值进行比较;
当所述第一评测结果大于所述第一评测阈值且所述第二评测结果小于所述第二评测阈值时,将所述第一评测结果确定为所述最终普通话评测结果,否则,将所述第二评测结果确定为所述最终普通话评测结果,其中,所述第一评测阈值大于所述第二评测阈值。
8.根据权利要求5所述的装置,其特征在于,所述确定模块包括:
加权子模块,用于对所述第一评测结果和所述第二评测结果进行线性加权,以获得所述最终普通话评测结果。
CN201911406413.9A 2019-12-31 2019-12-31 普通话评测方法及装置 Active CN111128238B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911406413.9A CN111128238B (zh) 2019-12-31 2019-12-31 普通话评测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911406413.9A CN111128238B (zh) 2019-12-31 2019-12-31 普通话评测方法及装置

Publications (2)

Publication Number Publication Date
CN111128238A CN111128238A (zh) 2020-05-08
CN111128238B true CN111128238B (zh) 2022-06-24

Family

ID=70506066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911406413.9A Active CN111128238B (zh) 2019-12-31 2019-12-31 普通话评测方法及装置

Country Status (1)

Country Link
CN (1) CN111128238B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105632515A (zh) * 2014-10-31 2016-06-01 科大讯飞股份有限公司 一种发音检错方法及装置
CN105654949A (zh) * 2016-01-07 2016-06-08 北京云知声信息技术有限公司 一种语音唤醒方法及装置
CN110570838A (zh) * 2019-08-02 2019-12-13 北京葡萄智学科技有限公司 语音流处理方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9653066B2 (en) * 2009-10-23 2017-05-16 Nuance Communications, Inc. System and method for estimating the reliability of alternate speech recognition hypotheses in real time
CN101887725A (zh) * 2010-04-30 2010-11-17 中国科学院声学研究所 一种基于音素混淆网络的音素后验概率计算方法
CN101840699B (zh) * 2010-04-30 2012-08-15 中国科学院声学研究所 一种基于发音模型的语音质量评测方法
US8560318B2 (en) * 2010-05-14 2013-10-15 Sony Computer Entertainment Inc. Methods and system for evaluating potential confusion within grammar structure for set of statements to be used in speech recognition during computing event
KR20130124704A (ko) * 2012-05-07 2013-11-15 한국전자통신연구원 분산환경 리스코어링 방법 및 장치
CN103177733B (zh) * 2013-03-11 2015-09-09 哈尔滨师范大学 汉语普通话儿化音发音质量评测方法与系统
CN103559892B (zh) * 2013-11-08 2016-02-17 科大讯飞股份有限公司 口语评测方法及系统
CN104978971B (zh) * 2014-04-08 2019-04-05 科大讯飞股份有限公司 一种口语评测方法及系统
CN104464757B (zh) * 2014-10-28 2019-01-18 科大讯飞股份有限公司 语音评测方法和语音评测装置
CN108766415B (zh) * 2018-05-22 2020-11-24 清华大学 一种语音测评方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105632515A (zh) * 2014-10-31 2016-06-01 科大讯飞股份有限公司 一种发音检错方法及装置
CN105654949A (zh) * 2016-01-07 2016-06-08 北京云知声信息技术有限公司 一种语音唤醒方法及装置
CN110570838A (zh) * 2019-08-02 2019-12-13 北京葡萄智学科技有限公司 语音流处理方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Identification of Articulation Error Patterns Using a Novel Dependence Network;Chen, YJ;《IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING》;20111130;3061-3068 *
文本无关发音质量评估系统中声学模型的若干研究和改进;蒋同海;《网络新媒体技术》;20120315;47-53 *
汉语发音质量评估的实验研究;葛凤培;《声学学报》;20100228;261-266 *

Also Published As

Publication number Publication date
CN111128238A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
US9196240B2 (en) Automated text to speech voice development
US8370149B2 (en) Speech synthesis system, speech synthesis program product, and speech synthesis method
US7062441B1 (en) Automated language assessment using speech recognition modeling
US9177558B2 (en) Systems and methods for assessment of non-native spontaneous speech
CN107086040B (zh) 语音识别能力测试方法和装置
CN111402862B (zh) 语音识别方法、装置、存储介质及设备
US9489864B2 (en) Systems and methods for an automated pronunciation assessment system for similar vowel pairs
CN103559892A (zh) 口语评测方法及系统
CN104217716A (zh) 语音处理器及语音处理方法
Chou et al. A set of corpus-based text-to-speech synthesis technologies for Mandarin Chinese
CN109166569B (zh) 音素误标注的检测方法和装置
Middag et al. Robust automatic intelligibility assessment techniques evaluated on speakers treated for head and neck cancer
KR20150001189A (ko) 음성인식을 이용한 외국어 말하기 능력의 훈련 및 평가 방법과 그 장치
Cole et al. Corpus phonology with speech resources
Pucher et al. Phonetic distance measures for speech recognition vocabulary and grammar optimization
CN111128238B (zh) 普通话评测方法及装置
CN112397048B (zh) 语音合成的发音稳定性评价方法、装置和系统及存储介质
Shea L2 proficiency and L2 dialect processing during study abroad
JP6468584B2 (ja) 外国語の難易度判定装置
Hinterleitner et al. Comparison of approaches for instrumentally predicting the quality of text-to-speech systems: Data from Blizzard Challenges 2008 and 2009
CN113035236A (zh) 语音合成数据的质检方法以及装置
KR20210128255A (ko) 음소의 특성에 관한 통계적 분석에 기초하여 자동적으로 음성 합성 데이터를 평가하는 방법 및 장치
CN117393002B (zh) 基于人工智能的朗读质量测评方法及相关装置
Möller et al. Quality prediction for synthesized speech: Comparison of approaches
CN112992184B (zh) 一种发音评测方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant