CN105679120A - 基于tts技术制作标准普通话语音微课件的方法 - Google Patents

基于tts技术制作标准普通话语音微课件的方法 Download PDF

Info

Publication number
CN105679120A
CN105679120A CN201610065092.0A CN201610065092A CN105679120A CN 105679120 A CN105679120 A CN 105679120A CN 201610065092 A CN201610065092 A CN 201610065092A CN 105679120 A CN105679120 A CN 105679120A
Authority
CN
China
Prior art keywords
micro
ppt
courseware
standard mandarin
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610065092.0A
Other languages
English (en)
Other versions
CN105679120B (zh
Inventor
王太重
罗艳红
邹佳峻
曾珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YOUJIANG NATIONAL MEDICAL COLLEGE
Original Assignee
YOUJIANG NATIONAL MEDICAL COLLEGE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YOUJIANG NATIONAL MEDICAL COLLEGE filed Critical YOUJIANG NATIONAL MEDICAL COLLEGE
Priority to CN201610065092.0A priority Critical patent/CN105679120B/zh
Publication of CN105679120A publication Critical patent/CN105679120A/zh
Application granted granted Critical
Publication of CN105679120B publication Critical patent/CN105679120B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/067Combinations of audio and projected visual presentation, e.g. film, slides

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Studio Circuits (AREA)

Abstract

本发明公开了一种基于TTS技术制作标准普通话语音微课件的方法,采用标准普通话-Camtasia?Studio-PPT录屏模型即MCP模型,模型构建包括如下步骤:①以PPT格式制作微课脚本;②标准普通话音频的产生与同步训练:使用TTS把讲解文本转换为标准普通话音频;对讲解文本进行调整,获得正确的发音效果;③Camtasia?studio同步录制视频与音频,生成视音频记录文件;④后期编辑:采用Camtasia?studio编辑微课件。本发明方法实现PPT+讲解词直接录制微课脚本,所见即所得;TTS自动标准普通话配音;微课件自动录制;音频无噪音;音频和视频同步;提高微课群制作效率和教学质量。

Description

基于TTS技术制作标准普通话语音微课件的方法
技术领域
本发明涉及一种课件制作方法,尤其涉及基于TTS技术制作标准普通话语音微课件的方法。
背景技术
微课群是由一组涵盖某一学科全部知识点的微课件的集合,微课件是微课的载体,其本质是一段微视频,包括三个要素:知识点、视频和音频。微课起源于2009年,美国可汗学院的Salmankhan将制作的用于数学教学的小视频上传至YouTubeEDU频道,此即最早的微课,此后迅速扩展至全球的教育界。微课的制作分为两个阶段,一是教学设计,包括确定微课的教学主题、选择微课知识点和制作微课的教学课件;二是微课件的制作,包括视音频录制和后期剪辑。微课件的制作有视频拍摄式、屏幕内录式和软件合成式,其中PPT录屏方式因方法简单,成本低,应用最为广泛,而软件合成方式应用最少。但上述三种方式,均使用讲解人的原始语音,往往会因不同作者的口语标准和发音方式而存在差异,从而导致不同微课件的音频质量不同,风格迥异,最终影响微课群的质量。
传统的微课脚本是Word格式的,即在Word文本中构思PPT课件及其讲解词,微课脚本完成后,再依照脚本制作PPT课件,然后人工配音,制作微课件。这对于完成一门课程所有知识点的大型的微课群,工作量极大,效率很低。
语音合成技术(TextToSpeech),简称TTS技术,TTS技术最早起源于英文的文语转换系统的研究,现在已经发展到几乎每一种语言的文语转换。中文文语转换技术研究起源于1958年,现在较为成熟的有科大讯飞、捷通华声、IBM、Microsoft的中文TTS系统。中文文语转换系统已经广泛应用于交互式语音应答、盲人阅读和自动交通指挥,其中大部分都能同时进行中文和英文的语音合成,但至今,关于如何结合TTS技术和PPT录屏技术制作标准化语音的微课件,至今也未见报道。
发明内容
本发明要解决的技术问题是提供一种基于TTS技术制作标准普通话语音微课件的方法,实现PPT+讲解词直接录制微课脚本,所见即所得;TTS自动标准普通话语音配音;微课件自动录制;音频无噪音;音频和视频同步;提高微课群制作效率和教学质量。
为解决上述技术问题,本发明采用了如下技术方案:
基于TTS技术制作标准普通话语音微课件的方法,该方法采用标准普通话-CamtasiaStudio-PPT录屏模型即MCP模型,该模型的构建包括如下步骤:
①制作微课脚本:以PPT格式制作微课脚本,与PPT页对应的讲解文本输入到该PPT页的备注页或文本框中;
②标准普通话音频的产生与同步训练:采用Windows消息处理机制的HOOK监视PPT事件,当捕获到步骤①微课脚本的PPT事件时,解析并读取讲解文本;然后使用InterphonicTTSSPI接口函数把上述讲解文本转换为标准普通话音频;所述同步训练为根据上述音频的播放效果对讲解文本进行调整,获得正确的发音效果;
③Camtasiastudio同步录制视频与音频:打开微课脚本,播放步骤②制作好的音频,同时采用Camtasiastudio软件的PPT录屏功能同步录制视频和音频,生成视音频记录文件;
④后期编辑:采用Camtasiastudio软件编辑步骤③制作好的视音频记录文件。
所述步骤①以PPT格式制作微课脚本时,在第一页PPT前插入一页PPT作为引子页,在步骤④后期编辑时,再剪切掉该引子页。
所述InterphonicTTSSPI接口函数为中文TTS系统InterPhonicSDK提供的接口函数。
所述步骤③Camtasiastudio同步录制视频与音频时选择录制系统声音。
实现基于TTS技术制作标准普通话语音微课件的方法的PPT语音软件工具,通过HOOK监视PPT事件,当捕获到PPT事件时,解析并读取讲解文本;然后使用InterphonicTTSSPI接口函数把上述讲解文本转换为标准普通话音频;
包括挂接PPT按钮、脚本编辑框、保存按钮和朗读按钮;
所述挂接PPT按钮用以挂接钩子函数到微课脚本;
所述脚本编辑框用以显示或编辑微课脚本的讲解文本;
所述保存按钮用以保存脚本编辑框的文本到微课脚本的备注页;
所述朗读按钮用把以微课脚本当前页的讲解文本转换为音频并播放。
还包括ToWave按钮,用以把微课脚本的讲解文本转换为音频并保存为声音文件。
本发明的有益效果:
①改变了微课脚本的制作方法,提高了工作效率:在MCP模型中,微课脚本是PPT格式的,脚本本身就是PPT课件,PPT讲解词被录入到对应的PPT幻灯片的备注页或文本框中。这种新的微课脚本制作模式,节省了时间,提高了效率。
②使用TTS技术,产生标准普通话音频:在传统的微课件构建模型中,PPT讲解词由人配音,由于不同作者的普通话水平存在差异,在制作大规模微课件群时,不同作者制作的微课件之间,音频的质量会不统一,进而影响微课群的质量。本发明MCP模型使用TTS技术,自动用标准普通话朗读PPT讲解词,克服了传统模型的音频缺陷,尤其在大规模微课件群建设时,所有微课件的音频均是标准的普通话,优势明显。
③传统微课件的视音频录制需要人工伺服,本发明方法能实现自动录制,提高效率。
④传统微课件的音频质量有噪音,本发明方法由于采用TTS进行系统录音,无噪音。
⑤本发明方法实现视频与音频自动同步,提高微课件的制作效率。
⑥本发明方法及PPT语音软件工具设计及操作简单,成本低。
附图说明
图1是采用本发明PPT语音软件工具的主界面示意图。
图中,1:挂接PPT按钮,2、脚本编辑框,3、保存按钮,4、朗读按钮,5、ToWave按钮。
具体实施方式
以下结合实施例及其附图对本发明技术方案作进一步非限制性的详细说明。
基于TTS技术制作标准普通话语音微课件的方法,该方法采用标准普通话-CamtasiaStudio-PPT录屏模型(Mandarin-Camtasiastudio-PPTscreencapture)即MCP模型,该模型的构建包括如下步骤:
①制作微课脚本:以PPT格式制作微课脚本,与PPT页对应的讲解文本输入到该PPT页的备注页中;
②标准普通话音频的产生与同步训练:采用Windows消息处理机制的HOOK监视PPT事件,当捕获到步骤①微课脚本的PPT事件时,解析并读取讲解文本;然后使用InterphonicTTSSPI接口函数把上述讲解文本转换为标准普通话音频;所述同步训练为根据上述音频的播放效果对讲解文本进行调整,获得正确的发音效果。如讲解文本为“WS/T124-1999”,发音效果是“WST,一百二十四减一千玖百玖拾玖”,不符合习惯用语,在微课脚本中将“WS/T124-1999”替换为同音汉字“WST腰二四,一九九九”,则能得到正确的发音效果;此外,还包括语调、插入停顿、语速的调整等,以达到预期的语音效果。
③Camtasiastudio同步录制视频与音频:打开微课脚本,播放步骤②制作好的音频,同时采用Camtasiastudio软件的PPT录屏功能同步录制视频和音频,生成视音频记录文件;
④后期编辑:采用Camtasiastudio软件编辑步骤③制作好的视音频记录文件。
为了使PPT播放的视频与音频同步,以PPT格式制作微课脚本时,在第一页PPT前插入一页PPT作为引子页,这样在播放PPT时可以有足够的时间启动音频播放以及Camtasiastudio录屏,在后期编辑时,再剪切掉该引子页即可。
所述InterphonicTTSSPI接口函数为中文TTS系统InterPhonicSDK提供的接口函数。
所述步骤③Camtasiastudio同步录制视频与音频时选择录制系统声音,不选择录制麦克风的声音,以免环境噪音影响音频效果。
为了实现基于TTS技术制作标准普通话语音微课件的方法,如图1所示,本发明设计了PPT语音软件工具,包括挂接PPT按钮1、脚本编辑框2、保存按钮3、朗读按钮4、ToWave按钮5。
挂接PPT按钮1用以挂接钩子函数到微课脚本;脚本编辑框2用以显示或编辑微课脚本的讲解文本;保存按钮3用以保存脚本编辑框2中的文本到微课脚本的备注页;朗读按钮4用于把微课脚本当前页的讲解文本转换为音频并播放;ToWave按钮5,用以把微课脚本的讲解文本转换为音频并保存为声音文件。为了方便操作,还可以设置最小化按钮、翻页按钮以及参数设置按钮等。
录制微课件时,依次打开CamtasiaStudio、微课脚本和本PPT语音软件工具,然后挂接PPT语音工具到微课脚本。开启CamtasiaStudio的PPT录屏。微课件脚本开始播放引子页后,启动语音合成功能,每一页幻灯片被播放时,本PPT语音工具在后台用标准普通话自动朗读该页的讲解词。幻灯片录制完毕,保存为camrec格式媒体文件。后期编辑时,在CamtasiaStudio中,导入上述camrec格式媒体文件,在编辑窗剪切引子页及尾页之后的视频和音频,输出MP4格式微课件。
本实施例PPT语音软件工具的开发工具为:MicrosoftPowerpoint2010,MicrosoftVisualC++2010,MicrosoftspeechSDK5.0,均为美国微软公司产品;InterPhonic5.0,InterphonicTTSSDK1.1,安徽科大讯飞公司产品。
本发明的方法,不止于中文—普通话的微课件制作,对其他语种,选择合适的语音库,同样可以实现其他语种的文本语音合成,制作标准语音微课件。

Claims (6)

1.基于TTS技术制作标准普通话语音微课件的方法,其特征在于,该方法采用标准普通话-CamtasiaStudio-PPT录屏模型即MCP模型,该模型的构建包括如下步骤:
①制作微课脚本:以PPT格式制作微课脚本,与PPT页对应的讲解文本输入到该PPT页的备注页或文本框中;
②标准普通话音频的产生与同步训练:采用Windows消息处理机制的HOOK监视PPT事件,当捕获到步骤①微课脚本的PPT事件时,解析并读取讲解文本;然后使用InterphonicTTSSPI接口函数把上述讲解文本转换为标准普通话音频;所述同步训练为根据上述音频的播放效果对讲解文本进行调整,获得正确的发音效果;
③Camtasiastudio同步录制视频与音频:打开微课脚本,播放步骤②制作好的音频,同时采用Camtasiastudio软件的PPT录屏功能同步录制视频和音频,生成视音频记录文件;
④后期编辑:采用Camtasiastudio软件编辑步骤③制作好的视音频记录文件。
2.如权利要求1所述的基于TTS技术制作标准普通话语音微课件的方法,其特征在于,所述步骤①以PPT格式制作微课脚本时,在第一页PPT前插入一页PPT作为引子页,在步骤④后期编辑时,再剪切掉该引子页。
3.如权利要求1所述的基于TTS技术制作标准普通话语音微课件的方法,其特征在于,所述InterphonicTTSSPI接口函数为中文TTS系统InterPhonicSDK提供的接口函数。
4.如权利要求1所述的基于TTS技术制作标准普通话语音微课件的方法,其特征在于,所述步骤③Camtasiastudio同步录制视频与音频时选择录制系统声音。
5.实现如权利要求1-3之一所述的基于TTS技术制作标准普通话语音微课件的方法的PPT语音软件工具,其特征在于,通过HOOK监视PPT事件,当捕获到PPT事件时,解析并读取讲解文本;然后使用InterphonicTTSSPI接口函数把上述讲解文本转换为标准普通话音频;
包括挂接PPT按钮、脚本编辑框、保存按钮和朗读按钮;
所述挂接PPT按钮用以挂接钩子函数到微课脚本;
所述脚本编辑框用以显示或编辑微课脚本的讲解文本;
所述保存按钮用以保存脚本编辑框的文本到微课脚本的备注页;
所述朗读按钮用以把微课脚本当前页的讲解文本转换为音频并播放。
6.如权利要求5所述的基于TTS技术制作标准普通话语音微课件的方法的PPT语音软件工具,其特征在于,还包括ToWave按钮,用以把微课脚本的讲解文本转换为音频并保存为声音文件。
CN201610065092.0A 2016-01-29 2016-01-29 基于tts技术制作标准普通话语音微课件的方法 Active CN105679120B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610065092.0A CN105679120B (zh) 2016-01-29 2016-01-29 基于tts技术制作标准普通话语音微课件的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610065092.0A CN105679120B (zh) 2016-01-29 2016-01-29 基于tts技术制作标准普通话语音微课件的方法

Publications (2)

Publication Number Publication Date
CN105679120A true CN105679120A (zh) 2016-06-15
CN105679120B CN105679120B (zh) 2018-05-29

Family

ID=56304379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610065092.0A Active CN105679120B (zh) 2016-01-29 2016-01-29 基于tts技术制作标准普通话语音微课件的方法

Country Status (1)

Country Link
CN (1) CN105679120B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106535008A (zh) * 2016-11-04 2017-03-22 浙江新盛蓝科技有限公司 一种ebh文件格式和ebh文件读取方法
CN109274900A (zh) * 2018-09-05 2019-01-25 浙江工业大学 一种视频配音方法
CN109584652A (zh) * 2018-12-29 2019-04-05 武汉易测云网络科技有限公司 一种建筑从业人员在线学习系统
CN109600566A (zh) * 2018-12-03 2019-04-09 浙江工业大学 一种视频配音方法
CN111028559A (zh) * 2019-12-19 2020-04-17 上海财经大学 一种还原人工授课场景的自动教学软件
CN111309941A (zh) * 2020-01-22 2020-06-19 福建天泉教育科技有限公司 一种控制pptx文件演示的方法及终端
CN112019786A (zh) * 2020-08-24 2020-12-01 上海松鼠课堂人工智能科技有限公司 智能教学录屏方法和系统
CN113177127A (zh) * 2021-04-30 2021-07-27 象玺(嘉兴)教育科技有限公司 一种互动性教育录播课件的制作方法
CN113626013A (zh) * 2021-08-04 2021-11-09 中国人民解放军战略支援部队航天工程大学 一种幻灯片的自动讲解方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021507A (zh) * 2014-05-20 2014-09-03 武汉红树林科技有限公司 基于电子白板,屏幕录制编辑,手写板的微课制作方法及装置
CN104581346A (zh) * 2015-01-14 2015-04-29 华东师范大学 一种微视频课程制作系统及其制作方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021507A (zh) * 2014-05-20 2014-09-03 武汉红树林科技有限公司 基于电子白板,屏幕录制编辑,手写板的微课制作方法及装置
CN104581346A (zh) * 2015-01-14 2015-04-29 华东师范大学 一种微视频课程制作系统及其制作方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
孙妮燕 等: "TTS全程化语音技术在CAI英语多媒体课件制作中的应用", 《中国电化教育》 *
徐凌云: "如何创作微课脚本___以文学微课为例", 《浙江教育技术》 *
王大慧: "Camtasia Studio在微课制作中的应用", 《南昌师范学院学报(综合)》 *
童强 等: "一种基于TTS的语音朗读技术及其教育应用", 《中国电化教育》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106535008A (zh) * 2016-11-04 2017-03-22 浙江新盛蓝科技有限公司 一种ebh文件格式和ebh文件读取方法
CN109274900A (zh) * 2018-09-05 2019-01-25 浙江工业大学 一种视频配音方法
CN109600566A (zh) * 2018-12-03 2019-04-09 浙江工业大学 一种视频配音方法
CN109584652A (zh) * 2018-12-29 2019-04-05 武汉易测云网络科技有限公司 一种建筑从业人员在线学习系统
CN111028559A (zh) * 2019-12-19 2020-04-17 上海财经大学 一种还原人工授课场景的自动教学软件
CN111309941A (zh) * 2020-01-22 2020-06-19 福建天泉教育科技有限公司 一种控制pptx文件演示的方法及终端
CN112019786A (zh) * 2020-08-24 2020-12-01 上海松鼠课堂人工智能科技有限公司 智能教学录屏方法和系统
CN112019786B (zh) * 2020-08-24 2021-05-25 上海松鼠课堂人工智能科技有限公司 智能教学录屏方法和系统
CN113177127A (zh) * 2021-04-30 2021-07-27 象玺(嘉兴)教育科技有限公司 一种互动性教育录播课件的制作方法
CN113626013A (zh) * 2021-08-04 2021-11-09 中国人民解放军战略支援部队航天工程大学 一种幻灯片的自动讲解方法及装置

Also Published As

Publication number Publication date
CN105679120B (zh) 2018-05-29

Similar Documents

Publication Publication Date Title
CN105679120B (zh) 基于tts技术制作标准普通话语音微课件的方法
CN105245917B (zh) 一种多媒体语音字幕生成的系统和方法
EP1425736B1 (en) Method for processing audiovisual data using speech recognition
US6560574B2 (en) Speech recognition enrollment for non-readers and displayless devices
US11942093B2 (en) System and method for simultaneous multilingual dubbing of video-audio programs
CN108133632B (zh) 英语听力的训练方法及系统
CN101189657A (zh) 一种用于对多媒体信号执行自动配音的方法和设备
CN106328146A (zh) 一种视频的字幕生成方法及装置
Rose Crosslinguistic corpus of hesitation phenomena: a corpus for investigating first and second language speech performance.
Matoušek et al. Building of a speech corpus optimised for unit selection TTS synthesis
Sainz et al. Versatile Speech Databases for High Quality Synthesis for Basque.
WO2023276539A1 (ja) 音声変換装置、音声変換方法、プログラム、および記録媒体
Grønnum DanPASS-A Danish Phonetically Annotated Spontaneous Speech Corpus.
Sherwood Computers: The computer speaks: Rapid speech synthesis from printed text input could accommodate an unlimited vocabulary
EP2261900A1 (en) Method and apparatus for modifying the playback rate of audio-video signals
JP2000250401A (ja) 言語学習方法、言語学習装置およびプログラムを記録した媒体
CN113724684A (zh) 一种空中交通管制指令的语音合成方法及系统
Scott Time adjustment in speech synthesis
JP4654889B2 (ja) 再生装置
JP2010107926A (ja) 語学ヒアリング能力およびシャドーイング能力を向上させる学習教材及びその作成方法
US20240155205A1 (en) Method for generating captions, subtitles and dubbing for audiovisual media
KR102463283B1 (ko) 청각 장애인 및 비장애인 겸용 영상 콘텐츠 자동 번역 시스템
Yang et al. A speaking rate adjustable digital speech repeater for listening comprehension in second-language learning
JPH0822238A (ja) 英語の4拍子性を活用した語学訓練システム
JP4678672B2 (ja) 発音学習装置及び発音学習プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant