CN101339705A - 一种智能发音训练学习系统的构建方法 - Google Patents

一种智能发音训练学习系统的构建方法 Download PDF

Info

Publication number
CN101339705A
CN101339705A CNA2008101410366A CN200810141036A CN101339705A CN 101339705 A CN101339705 A CN 101339705A CN A2008101410366 A CNA2008101410366 A CN A2008101410366A CN 200810141036 A CN200810141036 A CN 200810141036A CN 101339705 A CN101339705 A CN 101339705A
Authority
CN
China
Prior art keywords
pronunciation
learning system
construction method
learner
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008101410366A
Other languages
English (en)
Inventor
赵乾
易中华
胡修文
潘颂声
钟锟
吴玲
严峻
吴晓如
刘庆峰
王仁华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CNA2008101410366A priority Critical patent/CN101339705A/zh
Publication of CN101339705A publication Critical patent/CN101339705A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明涉及一种智能发音训练学习系统的构建方法,包括以下步骤:构建语音带读功能模块;采集发音数据,用统计建模技术构建标准声学模型;采集真实考试题目数据,采用统计学习技术构建发音检错模型和发音诊断模型;使用标准声学模型计算最大概率朗读内容的可能序列,得到识别出的发音单元;对于识别出的发音单元,根据发音检错模型和发音诊断模型,对学习者的发音情况进行判断。本发明针对现有技术的不足,设计并构建了一种基于语音识别技术的智能化高,互动性强,训练学习功能更强的发音训练学习系统。

Description

一种智能发音训练学习系统的构建方法
技术领域
本发明涉及一种口语发音学习系统的构建方法,具体涉及一种智能口语发音训练及学习系统的构建方法。
背景技术
在国内,随着对普通话推广力度的加大,国家已有相关法规规定,以普通话作为工作语言的播音员、节目主持人和影视话剧演员、教师、国家机关工作人员必须参加普通话水平测试并达到国家规定的等级标准。在国际上,中国的改革开放的不断深入和与其他国家交流的日益频繁,外国人对中文普通话的学习需求也越来越强烈。目前进行的普通话水平学习主要以下方式:自学、老师面授、计算机辅助学习。自学方式的效果因人而异,往往效率低下,费时费力。而老师面授的方式由于师资力量有限,很难做到随时随地对学习者一对一的指导学习。指导老师的水平的高低,对普通话学习也有很大的影响。因此,将先进的信息技术应用于普通话学习,部分或全部替代普通话老师,从而弥补传统的普通话水平学习方法的不足,对于节省人力物力等成本和提高学习的效果、效率方面都具有重大的意义。
目前国际上针对语言学习的系统大都是基于计算机辅助语言学习(CALL)的评测学习系统,也有在中文评测和学习方面的应用。但此类的评测学习系统,多数是采用系统化的学习内容和较为固定的学习进程,没有智能化的技术手段,缺乏针对性和灵活性。有的系统做到了一定程度的智能化,例如:有的可以根据考生的发音特点进行相应的学习内容安排,具有一定的针对性,但是其系统对考生的水平的掌握还缺乏较为智能的手段,有赖于外部的人工干预。总体来看,现有的系统由于没有同时结合语音识别和诊断技术、专家知识和智能搜索技术,导致系统互动性和灵活性不够,智能化程度较低。
发明内容
本发明针对现有技术的不足,设计并构建了一种基于语音识别技术的智能化高,互动性强,训练学习功能更强的发音训练学习系统。
本发明是通过以下技术方案实现的:
1、一种智能发音训练学习系统的构建方法包括:
(1)构建可提供语言学习的文本及相应的标准语音,并可带领语言学习者朗读学习的语音带读模块;
(2)构建可对学习者的学习过程进行评价,给出学习者的发音问题和发音水平的发音诊断模块;
(3)构建可提供针对性的学习语料,供学习者针对自己的问题和不足进行改进和练习的语料生成模块;上述模块互为补充和衔接。
一种智能发音训练学习系统的构建方法,所述语音带读模块中,语音通过语音合成系统自动生成,或通过人工录音的方式提供。
一种智能发音训练学习系统的构建方法,所述发音诊断模块中:通过采集多位标准发音人的发音数据并获取其声学特征,用统计建模技术构建标准声学模型;通过采集适量份数考试题目数据,并对适量份数考试题目数据进行发音问题标注,采用统计学习技术构建发音检错模型和发音诊断模型。
一种智能发音训练学习系统的构建方法,在语料生成模块中,针对应用的需要构建基础语料库,并结合专家知识构建发音混淆知识库,基于此构建语料库搜索功能模块。
一种智能发音训练学习系统的构建方法,还包括在语音带读模块和发音诊断模块中,根据语音专家提供的发音方法,制作准确的发音示范动画,向学习者提供更形象的发音指导。
一种智能发音训练学习系统的构建方法,其基础语料库的构建过程是:首先搜集大量原始语料,并按照信息熵最大原则进行分类、对比和筛选,再进行音标和语法边界标注,最终以音标或拼音、音标串或拼音串、字、词为关键字建立分级索引。
利用本发明所述的构建方法构建的发音训练学习系统,可将学习效果和效率的有效提升。学习者可以通过系统提供的标准发音,明确发音的目标和标准。系统的智能纠错功能,能够在最早的时间内纠正学习者的发音问题。系统的发音诊断功能,能够使考生全面了解自己的发音问题和水平。语料生成功能针对学习者自身的发音缺陷生成最优的训练方案,学习更有针对性。这些功能的结合运用,使得学习的效果和效率有了明显的提升,学习系统的普适性增强。由于引入了专家系统,可针对不同的学习类型进行定制,对于不同用户群体提供不同的学习功能和诊断标准;同时,本发明框架可针对不同语种构建相应的学习语料库和语料生成系统,可以迅速的进行不同语种的切换,从而使得系统的普适性增强。本发明具有对学习者的发音进行纠错,根据总体发音情况给出发音诊断结果,根据发音诊断结果自动生成针对性的训练语料,考生可以使用训练语料进行跟读和发音训练等多项功能,弥补现有发音学习系统功能单一的缺陷,同时也增强了学生与该发音训练学习系统之间的互动性,能有效的提升学生学习的质量。
附图说明
附图为智能发音训练学习系统的结构框图。
具体实施方式
参见附图所示。
智能发音训练学习系统构建的具体方法如下:
1.发音带读子系统构建:
1)采用语音合成技术,构建语音合成的功能模块;
2)合成语音的语速,根据学习者的水平会有所区别,以更好的适应学习的需要。当系统不能获知学习者的发音水平,语速有相应的默认值;
3)实时识别发音的功能,由发音诊断子系统来提供相应的支持;
4)也可采用人工录音和人工语音编辑的方式提供标准带读语音。
2.发音诊断子系统构建:
1)诊断知识库的获取和表示:
a)标准声学模型:
采集近50位一级甲等播音员近250小时的发音数据,采用语音信号处理技术获取其声学特征,再统计建模技术以数学模型的方式,表示这些标准发音的发音特点。
b)发音检错模型和发音诊断模型:
采集数千份PSC考试现场数据,并由多位国家级测试员对这些数据进行发音问题标注。使用标注结果,采用统计学习技术构建发音检错模型和发音诊断模型。
c)发音原理动画库:
根据语音学专家提供的发音方法,制作一套完整的发音示范动画,动画的内容突出表现发音部位和发音要领。
2)诊断模块的构建:
a)实时识别算法实现:
为保证实时识别学习者的录音,系统采用帧同步方式实现识别算法,使用声学模型实时计算最大概率的朗读内容的可能序列,当最大概率路径达到一定要求,就可以得到可信的识别结果。
b)检错和诊断算法实现:
对于识别出的发音单元,系统根据发音检错模型和发音诊断模型,系统采取相应的算法,对学习者的发音情况进行判断。
3.语料生成子系统构建:
1)基础语料库构建:
根据学习的需要,构建两种分类方式的语料库。
a)根据语料中生僻内容出现的频度分为低、中、高三个等级,等级越高,生僻字越多。
b)根据不同学习需要构建不同内容的语料数据库,如PSC,HSK等。
2)发音混淆知识库构建:
a)专家知识获取和表示:从专业著作和相关资料中得到语音教学所需专业知识,并同长期从事语音教学的专家进行沟通,并从专家们以往处理问题的数据中提取专家知识,并选择合适的形式整理纳入知识库中。
b)知识库组织:知识库采用多库结构组织,把知识库的内容进行分层,并建立层间索引。这样知识库具有较高的工作效率,和较低的数据冗余,同时还具有较好的灵活性,易于更改和扩充。
3)语料库搜索模块构建:
根据发音诊断模块的输出所对应的搜索条件,从语料库中搜索、重组,从而生成合适的语料。
用户可按照以下步骤使用该系统:
1)学习者进入系统的带读训练界面,根据自己学习的需要选择适当的语料;
2)系统根据学习者选择的语料,生成对应的标准发音;
3)学习者使用系统的带读功能进行朗读,同时,系统实时评测学习者的发音情况,并对学习者的发音错误进行提醒,学习者可以有选择性地对自己有问题的发音进行纠正和训练;
4)系统根据学习者当前的发音情况,给出整体诊断结果,包括主要问题和改进建议;
5)学习者可以选择针对性语料生成功能,使用步骤(4)中的发音诊断结果作为输入;
6)系统生成更有利于学习者提高发音水平的针对性学习语料,学习者可以再次进入步骤(1),使用针对性学习语料作为输入。
7)学习者可以根据自己的需要或计划重复步骤(1)~6)中的全部或部分步骤,不断地学习和提高自己的发音水平。

Claims (7)

1、一种智能发音训练学习系统的构建方法,其特征在于包括:
(1)构建可提供语言学习的文本及相应的标准语音,并可带领语言学习者朗读学习的语音带读模块;
(2)构建可对学习者的学习过程进行评价,给出学习者的发音问题和发音水平的发音诊断模块;
(3)构建可提供针对性的学习语料,供学习者针对自己的问题和不足进行改进和练习的语料生成模块;上述模块互为补充和衔接。
2、根据权利要求1所述的一种智能发音训练学习系统的构建方法,其特征在于在所述语音带读模块中,语音通过语音合成系统自动生成,或通过人工录音的方式提供。
3、根据权利要求1所述的一种智能发音训练学习系统的构建方法,其特征在于在所述发音诊断模块中:通过采集多位标准发音人的发音数据并获取其声学特征,用统计建模技术构建标准声学模型;通过采集适量份数考试题目数据,并对适量份数考试题目数据进行发音问题标注,采用统计学习技术构建发音检错模型和发音诊断模型。
4、根据权利要求1所述的一种智能发音训练学习系统的构建方法,其特征在于在语料生成模块中,针对应用的需要构建基础语料库,并结合专家知识构建发音混淆知识库,基于此构建语料库搜索功能模块。
5、根据权利要求1所述的一种智能发音训练学习系统的构建方法,其特征在于还包括,在语音带读模块和发音诊断模块中,根据语音专家提供的发音方法,制作准确的发音示范动画,向学习者提供更形象的发音指导。
6、根据权利要求4所述的一种智能发音训练学习系统的构建方法,其特征在于其基础语料库的构建过程是:首先搜集大量原始语料,并按照信息熵最大原则进行分类、对比和筛选,再进行音标和语法边界标注,最终以音标或拼音、音标串或拼音串、字、词为关键字建立分级索引。
7、根据权利要求4所述的一种智能发音训练学习系统的构建方法,其特征在于其发音混淆知识库的构建过程是:对多位语音学专家的教学经验进行总结,并对大量的发音样本进行统计发音混淆规律,上述二者结合得到最终的发音混淆知识库。
CNA2008101410366A 2008-08-13 2008-08-13 一种智能发音训练学习系统的构建方法 Pending CN101339705A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2008101410366A CN101339705A (zh) 2008-08-13 2008-08-13 一种智能发音训练学习系统的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2008101410366A CN101339705A (zh) 2008-08-13 2008-08-13 一种智能发音训练学习系统的构建方法

Publications (1)

Publication Number Publication Date
CN101339705A true CN101339705A (zh) 2009-01-07

Family

ID=40213764

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008101410366A Pending CN101339705A (zh) 2008-08-13 2008-08-13 一种智能发音训练学习系统的构建方法

Country Status (1)

Country Link
CN (1) CN101339705A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682768A (zh) * 2012-04-23 2012-09-19 天津大学 基于语音识别技术的汉语学习系统
CN105103221A (zh) * 2013-03-05 2015-11-25 微软技术许可有限责任公司 对文本到语音发音问题检测的语音识别辅助评估
CN105118354A (zh) * 2015-09-14 2015-12-02 百度在线网络技术(北京)有限公司 用于语言学习的数据处理方法和装置
CN106205239A (zh) * 2016-09-18 2016-12-07 三峡大学 一种基于3d立体成像的电子词典系统
CN107067833A (zh) * 2017-02-15 2017-08-18 山东顺势教育科技有限公司 一种语音识别及测评系统
CN107680419A (zh) * 2017-10-09 2018-02-09 吉林工程技术师范学院 一种普通话训练智能装置
CN109102824A (zh) * 2018-07-06 2018-12-28 北京比特智学科技有限公司 基于人机交互的语音纠错方法和装置
CN110910687A (zh) * 2019-12-04 2020-03-24 深圳追一科技有限公司 基于语音信息的教学方法、装置、电子设备及存储介质
CN111261193A (zh) * 2020-03-20 2020-06-09 上海乂学教育科技有限公司 发音训练与教学系统
CN112863278A (zh) * 2021-02-09 2021-05-28 柳州智视科技有限公司 一种题目条件替换后的解题方法
CN115358369A (zh) * 2022-08-15 2022-11-18 云南电网有限责任公司玉溪供电局 基于卷积神经网络模型的监控告警事件识别方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682768A (zh) * 2012-04-23 2012-09-19 天津大学 基于语音识别技术的汉语学习系统
CN105103221B (zh) * 2013-03-05 2019-01-29 微软技术许可有限责任公司 对文本到语音发音问题检测的语音识别辅助评估
CN105103221A (zh) * 2013-03-05 2015-11-25 微软技术许可有限责任公司 对文本到语音发音问题检测的语音识别辅助评估
CN105118354A (zh) * 2015-09-14 2015-12-02 百度在线网络技术(北京)有限公司 用于语言学习的数据处理方法和装置
CN106205239A (zh) * 2016-09-18 2016-12-07 三峡大学 一种基于3d立体成像的电子词典系统
CN107067833A (zh) * 2017-02-15 2017-08-18 山东顺势教育科技有限公司 一种语音识别及测评系统
CN107680419A (zh) * 2017-10-09 2018-02-09 吉林工程技术师范学院 一种普通话训练智能装置
CN109102824A (zh) * 2018-07-06 2018-12-28 北京比特智学科技有限公司 基于人机交互的语音纠错方法和装置
CN109102824B (zh) * 2018-07-06 2021-04-09 北京比特智学科技有限公司 基于人机交互的语音纠错方法和装置
CN110910687A (zh) * 2019-12-04 2020-03-24 深圳追一科技有限公司 基于语音信息的教学方法、装置、电子设备及存储介质
CN111261193A (zh) * 2020-03-20 2020-06-09 上海乂学教育科技有限公司 发音训练与教学系统
CN111261193B (zh) * 2020-03-20 2023-03-10 上海松鼠课堂人工智能科技有限公司 发音训练与教学系统
CN112863278A (zh) * 2021-02-09 2021-05-28 柳州智视科技有限公司 一种题目条件替换后的解题方法
CN112863278B (zh) * 2021-02-09 2022-07-01 柳州智视科技有限公司 一种题目条件替换后的解题方法
CN115358369A (zh) * 2022-08-15 2022-11-18 云南电网有限责任公司玉溪供电局 基于卷积神经网络模型的监控告警事件识别方法

Similar Documents

Publication Publication Date Title
CN101339705A (zh) 一种智能发音训练学习系统的构建方法
CN110991381B (zh) 一种基于行为和语音智能识别的实时课堂学生状态分析与指示提醒系统和方法
US8506304B2 (en) Method for recommending a teaching plan in literacy education
CN105488142B (zh) 成绩信息录入方法及系统
CN105551328A (zh) 基于移动交互和大数据分析的语言教学辅研同步集成系统
Harsch et al. Designing and scaling level-specific writing tasks in alignment with the CEFR: A test-centered approach
Passos A comparative analysis of teacher competence and its effect on pupil performance in upper primary schools in Mozambique and other SACMEQ countries
CN109841122A (zh) 一种智能机器人教学系统及学生学习方法
CN101197084A (zh) 自动化英语口语评测学习系统
CN107918821A (zh) 基于人工智能技术的教师课堂教学过程分析方法和系统
KR101635144B1 (ko) 텍스트 시각화와 학습자 말뭉치를 이용한 언어학습 시스템
CN109949637B (zh) 一种客观题目的自动解答方法和装置
CN110929875A (zh) 基于机器学习的智能语言学习方法、系统、装置及介质
CN110532387A (zh) 一种基于开放性问答文本的抑郁症辅助检测方法
CN113205717A (zh) 基于深度学习的英语口语训练方法
KR20190143057A (ko) 한자와 중국어의 병행 학습이 가능한 온라인 학습 시스템 및 방법
CN110390032B (zh) 一种手写作文的批阅方法及系统
CN111681470A (zh) 一种人工智能英语教学系统
Bindra et al. Outcome based predictive analysis of automatic question paper using data mining
CN116306592A (zh) 一种基于阅读理解的老年痴呆量表纠错方法、系统及介质
CN114708125A (zh) 一种基于人工智能的智慧教学辅助系统
Wang et al. Working towards a proficiency scale of business English writing: A mixed-methods approach
Kansızoğlu et al. Süreç odaklı yazma yaklaşımlarının yazma başarısına etkisi: bir meta analiz
Nakatsuhara et al. Use of innovative technology in oral language assessment
Li General Design of Automatic Correction System for English Pronunciation Errors Based on DTW Algorithm

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20090107