CN105679120A

CN105679120A - 基于tts技术制作标准普通话语音微课件的方法

Info

Publication number: CN105679120A
Application number: CN201610065092.0A
Authority: CN
Inventors: 王太重; 罗艳红; 邹佳峻; 曾珊
Original assignee: YOUJIANG NATIONAL MEDICAL COLLEGE
Current assignee: YOUJIANG NATIONAL MEDICAL COLLEGE
Priority date: 2016-01-29
Filing date: 2016-01-29
Publication date: 2016-06-15
Anticipated expiration: 2036-01-29
Also published as: CN105679120B

Abstract

本发明公开了一种基于TTS技术制作标准普通话语音微课件的方法，采用标准普通话-Camtasia？Studio-PPT录屏模型即MCP模型,模型构建包括如下步骤：①以PPT格式制作微课脚本；②标准普通话音频的产生与同步训练：使用TTS把讲解文本转换为标准普通话音频；对讲解文本进行调整，获得正确的发音效果；③Camtasia？studio同步录制视频与音频，生成视音频记录文件；④后期编辑：采用Camtasia？studio编辑微课件。本发明方法实现PPT+讲解词直接录制微课脚本，所见即所得；TTS自动标准普通话配音；微课件自动录制；音频无噪音；音频和视频同步；提高微课群制作效率和教学质量。

Description

基于TTS技术制作标准普通话语音微课件的方法

技术领域

本发明涉及一种课件制作方法，尤其涉及基于TTS技术制作标准普通话语音微课件的方法。

背景技术

微课群是由一组涵盖某一学科全部知识点的微课件的集合，微课件是微课的载体，其本质是一段微视频，包括三个要素：知识点、视频和音频。微课起源于2009年，美国可汗学院的Salmankhan将制作的用于数学教学的小视频上传至YouTubeEDU频道，此即最早的微课，此后迅速扩展至全球的教育界。微课的制作分为两个阶段，一是教学设计，包括确定微课的教学主题、选择微课知识点和制作微课的教学课件；二是微课件的制作，包括视音频录制和后期剪辑。微课件的制作有视频拍摄式、屏幕内录式和软件合成式，其中PPT录屏方式因方法简单，成本低，应用最为广泛，而软件合成方式应用最少。但上述三种方式，均使用讲解人的原始语音，往往会因不同作者的口语标准和发音方式而存在差异，从而导致不同微课件的音频质量不同，风格迥异，最终影响微课群的质量。

传统的微课脚本是Word格式的，即在Word文本中构思PPT课件及其讲解词，微课脚本完成后，再依照脚本制作PPT课件，然后人工配音，制作微课件。这对于完成一门课程所有知识点的大型的微课群，工作量极大，效率很低。

语音合成技术(TextToSpeech)，简称TTS技术，TTS技术最早起源于英文的文语转换系统的研究，现在已经发展到几乎每一种语言的文语转换。中文文语转换技术研究起源于1958年，现在较为成熟的有科大讯飞、捷通华声、IBM、Microsoft的中文TTS系统。中文文语转换系统已经广泛应用于交互式语音应答、盲人阅读和自动交通指挥，其中大部分都能同时进行中文和英文的语音合成，但至今，关于如何结合TTS技术和PPT录屏技术制作标准化语音的微课件，至今也未见报道。

发明内容

本发明要解决的技术问题是提供一种基于TTS技术制作标准普通话语音微课件的方法，实现PPT+讲解词直接录制微课脚本，所见即所得；TTS自动标准普通话语音配音；微课件自动录制；音频无噪音；音频和视频同步；提高微课群制作效率和教学质量。

为解决上述技术问题，本发明采用了如下技术方案：

基于TTS技术制作标准普通话语音微课件的方法，该方法采用标准普通话-CamtasiaStudio-PPT录屏模型即MCP模型,该模型的构建包括如下步骤：

①制作微课脚本：以PPT格式制作微课脚本，与PPT页对应的讲解文本输入到该PPT页的备注页或文本框中；

②标准普通话音频的产生与同步训练：采用Windows消息处理机制的HOOK监视PPT事件，当捕获到步骤①微课脚本的PPT事件时，解析并读取讲解文本；然后使用InterphonicTTSSPI接口函数把上述讲解文本转换为标准普通话音频；所述同步训练为根据上述音频的播放效果对讲解文本进行调整，获得正确的发音效果；

③Camtasiastudio同步录制视频与音频：打开微课脚本，播放步骤②制作好的音频，同时采用Camtasiastudio软件的PPT录屏功能同步录制视频和音频，生成视音频记录文件；

④后期编辑：采用Camtasiastudio软件编辑步骤③制作好的视音频记录文件。

所述步骤①以PPT格式制作微课脚本时，在第一页PPT前插入一页PPT作为引子页，在步骤④后期编辑时，再剪切掉该引子页。

所述InterphonicTTSSPI接口函数为中文TTS系统InterPhonicSDK提供的接口函数。

所述步骤③Camtasiastudio同步录制视频与音频时选择录制系统声音。

实现基于TTS技术制作标准普通话语音微课件的方法的PPT语音软件工具，通过HOOK监视PPT事件，当捕获到PPT事件时，解析并读取讲解文本；然后使用InterphonicTTSSPI接口函数把上述讲解文本转换为标准普通话音频；

包括挂接PPT按钮、脚本编辑框、保存按钮和朗读按钮；

所述挂接PPT按钮用以挂接钩子函数到微课脚本；

所述脚本编辑框用以显示或编辑微课脚本的讲解文本；

所述保存按钮用以保存脚本编辑框的文本到微课脚本的备注页；

所述朗读按钮用把以微课脚本当前页的讲解文本转换为音频并播放。

还包括ToWave按钮，用以把微课脚本的讲解文本转换为音频并保存为声音文件。

本发明的有益效果：

①改变了微课脚本的制作方法，提高了工作效率：在MCP模型中，微课脚本是PPT格式的，脚本本身就是PPT课件，PPT讲解词被录入到对应的PPT幻灯片的备注页或文本框中。这种新的微课脚本制作模式，节省了时间，提高了效率。

②使用TTS技术，产生标准普通话音频：在传统的微课件构建模型中，PPT讲解词由人配音，由于不同作者的普通话水平存在差异，在制作大规模微课件群时，不同作者制作的微课件之间，音频的质量会不统一，进而影响微课群的质量。本发明MCP模型使用TTS技术，自动用标准普通话朗读PPT讲解词，克服了传统模型的音频缺陷，尤其在大规模微课件群建设时，所有微课件的音频均是标准的普通话，优势明显。

③传统微课件的视音频录制需要人工伺服，本发明方法能实现自动录制，提高效率。

④传统微课件的音频质量有噪音，本发明方法由于采用TTS进行系统录音，无噪音。

⑤本发明方法实现视频与音频自动同步，提高微课件的制作效率。

⑥本发明方法及PPT语音软件工具设计及操作简单，成本低。

附图说明

图1是采用本发明PPT语音软件工具的主界面示意图。

图中，1：挂接PPT按钮，2、脚本编辑框，3、保存按钮，4、朗读按钮，5、ToWave按钮。

具体实施方式

以下结合实施例及其附图对本发明技术方案作进一步非限制性的详细说明。

基于TTS技术制作标准普通话语音微课件的方法，该方法采用标准普通话-CamtasiaStudio-PPT录屏模型(Mandarin-Camtasiastudio-PPTscreencapture)即MCP模型，该模型的构建包括如下步骤：

①制作微课脚本：以PPT格式制作微课脚本，与PPT页对应的讲解文本输入到该PPT页的备注页中；

②标准普通话音频的产生与同步训练：采用Windows消息处理机制的HOOK监视PPT事件，当捕获到步骤①微课脚本的PPT事件时，解析并读取讲解文本；然后使用InterphonicTTSSPI接口函数把上述讲解文本转换为标准普通话音频；所述同步训练为根据上述音频的播放效果对讲解文本进行调整，获得正确的发音效果。如讲解文本为“WS/T124-1999”，发音效果是“WST,一百二十四减一千玖百玖拾玖”，不符合习惯用语，在微课脚本中将“WS/T124-1999”替换为同音汉字“WST腰二四，一九九九”，则能得到正确的发音效果；此外，还包括语调、插入停顿、语速的调整等，以达到预期的语音效果。

为了使PPT播放的视频与音频同步，以PPT格式制作微课脚本时，在第一页PPT前插入一页PPT作为引子页，这样在播放PPT时可以有足够的时间启动音频播放以及Camtasiastudio录屏，在后期编辑时，再剪切掉该引子页即可。

所述步骤③Camtasiastudio同步录制视频与音频时选择录制系统声音，不选择录制麦克风的声音，以免环境噪音影响音频效果。

为了实现基于TTS技术制作标准普通话语音微课件的方法，如图1所示，本发明设计了PPT语音软件工具，包括挂接PPT按钮1、脚本编辑框2、保存按钮3、朗读按钮4、ToWave按钮5。

挂接PPT按钮1用以挂接钩子函数到微课脚本；脚本编辑框2用以显示或编辑微课脚本的讲解文本；保存按钮3用以保存脚本编辑框2中的文本到微课脚本的备注页；朗读按钮4用于把微课脚本当前页的讲解文本转换为音频并播放；ToWave按钮5，用以把微课脚本的讲解文本转换为音频并保存为声音文件。为了方便操作，还可以设置最小化按钮、翻页按钮以及参数设置按钮等。

录制微课件时，依次打开CamtasiaStudio、微课脚本和本PPT语音软件工具，然后挂接PPT语音工具到微课脚本。开启CamtasiaStudio的PPT录屏。微课件脚本开始播放引子页后，启动语音合成功能，每一页幻灯片被播放时，本PPT语音工具在后台用标准普通话自动朗读该页的讲解词。幻灯片录制完毕，保存为camrec格式媒体文件。后期编辑时，在CamtasiaStudio中，导入上述camrec格式媒体文件，在编辑窗剪切引子页及尾页之后的视频和音频，输出MP4格式微课件。

本实施例PPT语音软件工具的开发工具为：MicrosoftPowerpoint2010,MicrosoftVisualC++2010,MicrosoftspeechSDK5.0，均为美国微软公司产品；InterPhonic5.0，InterphonicTTSSDK1.1，安徽科大讯飞公司产品。

本发明的方法，不止于中文—普通话的微课件制作，对其他语种，选择合适的语音库，同样可以实现其他语种的文本语音合成，制作标准语音微课件。

Claims

1.基于TTS技术制作标准普通话语音微课件的方法，其特征在于，该方法采用标准普通话-CamtasiaStudio-PPT录屏模型即MCP模型,该模型的构建包括如下步骤：

2.如权利要求1所述的基于TTS技术制作标准普通话语音微课件的方法，其特征在于，所述步骤①以PPT格式制作微课脚本时，在第一页PPT前插入一页PPT作为引子页，在步骤④后期编辑时，再剪切掉该引子页。

3.如权利要求1所述的基于TTS技术制作标准普通话语音微课件的方法，其特征在于，所述InterphonicTTSSPI接口函数为中文TTS系统InterPhonicSDK提供的接口函数。

4.如权利要求1所述的基于TTS技术制作标准普通话语音微课件的方法，其特征在于，所述步骤③Camtasiastudio同步录制视频与音频时选择录制系统声音。

5.实现如权利要求1-3之一所述的基于TTS技术制作标准普通话语音微课件的方法的PPT语音软件工具，其特征在于，通过HOOK监视PPT事件，当捕获到PPT事件时，解析并读取讲解文本；然后使用InterphonicTTSSPI接口函数把上述讲解文本转换为标准普通话音频；

包括挂接PPT按钮、脚本编辑框、保存按钮和朗读按钮；

所述挂接PPT按钮用以挂接钩子函数到微课脚本；

所述脚本编辑框用以显示或编辑微课脚本的讲解文本；

所述朗读按钮用以把微课脚本当前页的讲解文本转换为音频并播放。

6.如权利要求5所述的基于TTS技术制作标准普通话语音微课件的方法的PPT语音软件工具，其特征在于，还包括ToWave按钮，用以把微课脚本的讲解文本转换为音频并保存为声音文件。