CN105679120B - 基于tts技术制作标准普通话语音微课件的方法 - Google Patents
基于tts技术制作标准普通话语音微课件的方法 Download PDFInfo
- Publication number
- CN105679120B CN105679120B CN201610065092.0A CN201610065092A CN105679120B CN 105679120 B CN105679120 B CN 105679120B CN 201610065092 A CN201610065092 A CN 201610065092A CN 105679120 B CN105679120 B CN 105679120B
- Authority
- CN
- China
- Prior art keywords
- micro
- ppt
- audio
- tts
- courseware
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/06—Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
- G09B5/067—Combinations of audio and projected visual presentation, e.g. film, slides
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Electrically Operated Instructional Devices (AREA)
- Studio Circuits (AREA)
Abstract
本发明公开了一种基于TTS技术制作标准普通话语音微课件的方法,采用标准普通话‑Camtasia Studio‑PPT录屏模型即MCP模型,模型构建包括如下步骤:①以PPT格式制作微课脚本;②标准普通话音频的产生与同步训练:使用TTS把讲解文本转换为标准普通话音频;对讲解文本进行调整,获得正确的发音效果;③Camtasia studio同步录制视频与音频,生成视音频记录文件;④后期编辑:采用Camtasia studio编辑微课件。本发明方法实现PPT+讲解词直接录制微课脚本,所见即所得;TTS自动标准普通话配音;微课件自动录制;音频无噪音;音频和视频同步;提高微课群制作效率和教学质量。
Description
技术领域
本发明涉及一种课件制作方法,尤其涉及基于TTS技术制作标准普通话语音微课件的方法。
背景技术
微课群是由一组涵盖某一学科全部知识点的微课件的集合,微课件是微课的载体,其本质是一段微视频,包括三个要素:知识点、视频和音频。微课起源于2009年,美国可汗学院的Salman khan将制作的用于数学教学的小视频上传至YouTube EDU频道,此即最早的微课,此后迅速扩展至全球的教育界。微课的制作分为两个阶段,一是教学设计,包括确定微课的教学主题、选择微课知识点和制作微课的教学课件;二是微课件的制作,包括视音频录制和后期剪辑。微课件的制作有视频拍摄式、屏幕内录式和软件合成式,其中PPT录屏方式因方法简单,成本低,应用最为广泛,而软件合成方式应用最少。但上述三种方式,均使用讲解人的原始语音,往往会因不同作者的口语标准和发音方式而存在差异,从而导致不同微课件的音频质量不同,风格迥异,最终影响微课群的质量。
传统的微课脚本是Word格式的,即在Word文本中构思PPT课件及其讲解词,微课脚本完成后,再依照脚本制作PPT课件,然后人工配音,制作微课件。这对于完成一门课程所有知识点的大型的微课群,工作量极大,效率很低。
语音合成技术(Text To Speech),简称TTS技术,TTS技术最早起源于英文的文语转换系统的研究,现在已经发展到几乎每一种语言的文语转换。中文文语转换技术研究起源于1958年,现在较为成熟的有科大讯飞、捷通华声、IBM、Microsoft的中文TTS系统。中文文语转换系统已经广泛应用于交互式语音应答、盲人阅读和自动交通指挥,其中大部分都能同时进行中文和英文的语音合成,但至今,关于如何结合TTS技术和PPT录屏技术制作标准化语音的微课件,至今也未见报道。
发明内容
本发明要解决的技术问题是提供一种基于TTS技术制作标准普通话语音微课件的方法,实现PPT+讲解词直接录制微课脚本,所见即所得;TTS自动标准普通话语音配音;微课件自动录制;音频无噪音;音频和视频同步;提高微课群制作效率和教学质量。
为解决上述技术问题,本发明采用了如下技术方案:
基于TTS技术制作标准普通话语音微课件的方法,该方法采用标准普通话-Camtasia Studio-PPT录屏模型即MCP模型,该模型的构建包括如下步骤:
①制作微课脚本:以PPT格式制作微课脚本,与PPT页对应的讲解文本输入到该PPT页的备注页或文本框中;
②标准普通话音频的产生与同步训练:采用Windows消息处理机制的HOOK监视PPT事件,当捕获到步骤①微课脚本的PPT事件时,解析并读取讲解文本;然后使用InterphonicTTS SPI接口函数把上述讲解文本转换为标准普通话音频;所述同步训练为根据上述音频的播放效果对讲解文本进行调整,获得正确的发音效果;
③Camtasia studio同步录制视频与音频:打开微课脚本,播放步骤②制作好的音频,同时采用Camtasia studio软件的PPT录屏功能同步录制视频和音频,生成视音频记录文件;
④后期编辑:采用Camtasia studio软件编辑步骤③制作好的视音频记录文件。
所述步骤①以PPT格式制作微课脚本时,在第一页PPT前插入一页PPT作为引子页,在步骤④后期编辑时,再剪切掉该引子页。
所述Interphonic TTS SPI接口函数为中文TTS系统InterPhonic SDK提供的接口函数。
所述步骤③Camtasia studio同步录制视频与音频时选择录制系统声音。
实现基于TTS技术制作标准普通话语音微课件的方法的PPT语音软件工具,通过HOOK监视PPT事件,当捕获到PPT事件时,解析并读取讲解文本;然后使用Interphonic TTSSPI接口函数把上述讲解文本转换为标准普通话音频;
包括挂接PPT按钮、脚本编辑框、保存按钮和朗读按钮;
所述挂接PPT按钮用以挂接钩子函数到微课脚本;
所述脚本编辑框用以显示或编辑微课脚本的讲解文本;
所述保存按钮用以保存脚本编辑框的文本到微课脚本的备注页;
所述朗读按钮用把以微课脚本当前页的讲解文本转换为音频并播放。
还包括ToWave按钮,用以把微课脚本的讲解文本转换为音频并保存为声音文件。
本发明的有益效果:
①改变了微课脚本的制作方法,提高了工作效率:在MCP模型中,微课脚本是PPT格式的,脚本本身就是PPT课件,PPT讲解词被录入到对应的PPT幻灯片的备注页或文本框中。这种新的微课脚本制作模式,节省了时间,提高了效率。
②使用TTS技术,产生标准普通话音频:在传统的微课件构建模型中,PPT讲解词由人配音,由于不同作者的普通话水平存在差异,在制作大规模微课件群时,不同作者制作的微课件之间,音频的质量会不统一,进而影响微课群的质量。本发明MCP模型使用TTS技术,自动用标准普通话朗读PPT讲解词,克服了传统模型的音频缺陷,尤其在大规模微课件群建设时,所有微课件的音频均是标准的普通话,优势明显。
③传统微课件的视音频录制需要人工伺服,本发明方法能实现自动录制,提高效率。
④传统微课件的音频质量有噪音,本发明方法由于采用TTS进行系统录音,无噪音。
⑤本发明方法实现视频与音频自动同步,提高微课件的制作效率。
⑥本发明方法及PPT语音软件工具设计及操作简单,成本低。
附图说明
图1是采用本发明PPT语音软件工具的主界面示意图。
图中,1:挂接PPT按钮,2、脚本编辑框,3、保存按钮,4、朗读按钮,5、ToWave按钮。
具体实施方式
以下结合实施例及其附图对本发明技术方案作进一步非限制性的详细说明。
基于TTS技术制作标准普通话语音微课件的方法,该方法采用标准普通话-Camtasia Studio-PPT录屏模型(Mandarin-Camtasia studio-PPT screen capture)即MCP模型,该模型的构建包括如下步骤:
①制作微课脚本:以PPT格式制作微课脚本,与PPT页对应的讲解文本输入到该PPT页的备注页中;
②标准普通话音频的产生与同步训练:采用Windows消息处理机制的HOOK监视PPT事件,当捕获到步骤①微课脚本的PPT事件时,解析并读取讲解文本;然后使用InterphonicTTS SPI接口函数把上述讲解文本转换为标准普通话音频;所述同步训练为根据上述音频的播放效果对讲解文本进行调整,获得正确的发音效果。如讲解文本为“WS/T 124-1999”,发音效果是“WST, 一百二十四减一千玖百玖拾玖”,不符合习惯用语,在微课脚本中将“WS/T 124-1999”替换为同音汉字“WST 一二四,一九九九”,则能得到正确的发音效果;此外,还包括语调、插入停顿、语速的调整等,以达到预期的语音效果。
③Camtasia studio同步录制视频与音频:打开微课脚本,播放步骤②制作好的音频,同时采用Camtasia studio软件的PPT录屏功能同步录制视频和音频,生成视音频记录文件;
④后期编辑:采用Camtasia studio软件编辑步骤③制作好的视音频记录文件。
为了使PPT播放的视频与音频同步,以PPT格式制作微课脚本时,在第一页PPT前插入一页PPT作为引子页,这样在播放PPT时可以有足够的时间启动音频播放以及Camtasiastudio录屏,在后期编辑时,再剪切掉该引子页即可。
所述Interphonic TTS SPI接口函数为中文TTS系统InterPhonic SDK提供的接口函数。
所述步骤③Camtasia studio同步录制视频与音频时选择录制系统声音,不选择录制麦克风的声音,以免环境噪音影响音频效果。
为了实现基于TTS技术制作标准普通话语音微课件的方法,如图1所示,本发明设计了PPT语音软件工具,包括挂接PPT按钮1、脚本编辑框2、保存按钮3、朗读按钮4、ToWave按钮5。
挂接PPT按钮1用以挂接钩子函数到微课脚本;脚本编辑框2用以显示或编辑微课脚本的讲解文本;保存按钮3用以保存脚本编辑框2中的文本到微课脚本的备注页;朗读按钮4用于把微课脚本当前页的讲解文本转换为音频并播放;ToWave按钮5,用以把微课脚本的讲解文本转换为音频并保存为声音文件。为了方便操作,还可以设置最小化按钮、翻页按钮以及参数设置按钮等。
录制微课件时,依次打开Camtasia Studio 、微课脚本和本PPT语音软件工具,然后挂接PPT语音工具到微课脚本。开启Camtasia Studio 的PPT录屏。微课件脚本开始播放引子页后,启动语音合成功能,每一页幻灯片被播放时,本PPT语音工具在后台用标准普通话自动朗读该页的讲解词。幻灯片录制完毕,保存为camrec格式媒体文件。后期编辑时,在Camtasia Studio中,导入上述camrec格式媒体文件,在编辑窗剪切引子页及尾页之后的视频和音频,输出MP4格式微课件。
本实施例PPT语音软件工具的开发工具为: Microsoft Powerpoint 2010,Microsoft Visual C++ 2010,Microsoft speech SDK 5.0,均为美国微软公司产品;InterPhonic5.0,Interphonic TTS SDK 1.1,安徽科大讯飞公司产品。
本发明的方法,不止于中文—普通话的微课件制作,对其他语种,选择合适的语音库,同样可以实现其他语种的文本语音合成,制作标准语音微课件。
Claims (4)
1.基于TTS技术制作标准普通话语音微课件的方法,其特征在于,该方法采用标准普通话-Camtasia Studio-PPT录屏模型即MCP模型,该模型的构建包括如下步骤:
①制作微课脚本:以PPT格式制作微课脚本,与PPT页对应的讲解文本输入到该PPT页的备注页或文本框中;
②标准普通话音频的产生与同步训练:采用Windows消息处理机制的HOOK监视PPT事件,当捕获到步骤①微课脚本的PPT事件时,解析并读取讲解文本;然后使用InterphonicTTS SPI接口函数把上述讲解文本转换为标准普通话音频;所述同步训练为根据上述音频的播放效果对讲解文本进行调整,获得正确的发音效果;
③Camtasia studio同步录制视频与音频:打开微课脚本,播放步骤②制作好的音频,同时采用Camtasia studio软件的PPT录屏功能同步录制视频和音频,生成视音频记录文件;
④后期编辑:采用Camtasia studio软件编辑步骤③制作好的视音频记录文件。
2.如权利要求1所述的基于TTS技术制作标准普通话语音微课件的方法,其特征在于,所述步骤①以PPT格式制作微课脚本时,在第一页PPT前插入一页PPT作为引子页,在步骤④后期编辑时,再剪切掉该引子页。
3.如权利要求1所述的基于TTS技术制作标准普通话语音微课件的方法,其特征在于,所述Interphonic TTS SPI接口函数为中文TTS系统InterPhonic SDK提供的接口函数。
4.如权利要求1所述的基于TTS技术制作标准普通话语音微课件的方法,其特征在于,所述步骤③Camtasia studio同步录制视频与音频时选择录制系统声音。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610065092.0A CN105679120B (zh) | 2016-01-29 | 2016-01-29 | 基于tts技术制作标准普通话语音微课件的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610065092.0A CN105679120B (zh) | 2016-01-29 | 2016-01-29 | 基于tts技术制作标准普通话语音微课件的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105679120A CN105679120A (zh) | 2016-06-15 |
CN105679120B true CN105679120B (zh) | 2018-05-29 |
Family
ID=56304379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610065092.0A Active CN105679120B (zh) | 2016-01-29 | 2016-01-29 | 基于tts技术制作标准普通话语音微课件的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105679120B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106535008A (zh) * | 2016-11-04 | 2017-03-22 | 浙江新盛蓝科技有限公司 | 一种ebh文件格式和ebh文件读取方法 |
CN109274900A (zh) * | 2018-09-05 | 2019-01-25 | 浙江工业大学 | 一种视频配音方法 |
CN109600566A (zh) * | 2018-12-03 | 2019-04-09 | 浙江工业大学 | 一种视频配音方法 |
CN109584652A (zh) * | 2018-12-29 | 2019-04-05 | 武汉易测云网络科技有限公司 | 一种建筑从业人员在线学习系统 |
CN111028559A (zh) * | 2019-12-19 | 2020-04-17 | 上海财经大学 | 一种还原人工授课场景的自动教学软件 |
CN111309941A (zh) * | 2020-01-22 | 2020-06-19 | 福建天泉教育科技有限公司 | 一种控制pptx文件演示的方法及终端 |
CN112019786B (zh) * | 2020-08-24 | 2021-05-25 | 上海松鼠课堂人工智能科技有限公司 | 智能教学录屏方法和系统 |
CN113177127B (zh) * | 2021-04-30 | 2023-05-05 | 象玺(嘉兴)教育科技有限公司 | 一种互动性教育录播课件的制作方法 |
CN113626013A (zh) * | 2021-08-04 | 2021-11-09 | 中国人民解放军战略支援部队航天工程大学 | 一种幻灯片的自动讲解方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021507A (zh) * | 2014-05-20 | 2014-09-03 | 武汉红树林科技有限公司 | 基于电子白板,屏幕录制编辑,手写板的微课制作方法及装置 |
CN104581346A (zh) * | 2015-01-14 | 2015-04-29 | 华东师范大学 | 一种微视频课程制作系统及其制作方法 |
-
2016
- 2016-01-29 CN CN201610065092.0A patent/CN105679120B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021507A (zh) * | 2014-05-20 | 2014-09-03 | 武汉红树林科技有限公司 | 基于电子白板,屏幕录制编辑,手写板的微课制作方法及装置 |
CN104581346A (zh) * | 2015-01-14 | 2015-04-29 | 华东师范大学 | 一种微视频课程制作系统及其制作方法 |
Non-Patent Citations (4)
Title |
---|
Camtasia Studio在微课制作中的应用;王大慧;《南昌师范学院学报(综合)》;20140630;第35卷(第3期);第31-33页 * |
TTS全程化语音技术在CAI英语多媒体课件制作中的应用;孙妮燕 等;《中国电化教育》;20010430(第171期);第45-47页 * |
一种基于TTS的语音朗读技术及其教育应用;童强 等;《中国电化教育》;20070331(第242期);第108-110页 * |
如何创作微课脚本___以文学微课为例;徐凌云;《浙江教育技术》;20141231(第6期);第45-49页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105679120A (zh) | 2016-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105679120B (zh) | 基于tts技术制作标准普通话语音微课件的方法 | |
CN105245917B (zh) | 一种多媒体语音字幕生成的系统和方法 | |
EP1425736B1 (en) | Method for processing audiovisual data using speech recognition | |
US11942093B2 (en) | System and method for simultaneous multilingual dubbing of video-audio programs | |
JP2008546016A (ja) | マルチメディア信号で自動的なダビングを実行する方法及び装置 | |
WO2014141054A1 (en) | Method, apparatus and system for regenerating voice intonation in automatically dubbed videos | |
CN111538851A (zh) | 自动生成演示视频的方法、系统、设备及存储介质 | |
CA3065364C (en) | System and method for providing descriptive video | |
WO2020124754A1 (zh) | 多媒体文件的翻译方法、装置及翻译播放设备 | |
JP4594908B2 (ja) | 解説付加音声生成装置及び解説付加音声生成プログラム | |
JP6268131B2 (ja) | 字幕制作装置および字幕制作方法 | |
EP2377122A1 (en) | Method and apparatus for synthesizing speech | |
JP6485977B2 (ja) | 字幕制作装置および字幕制作方法 | |
KR100710600B1 (ko) | 음성합성기를 이용한 영상, 텍스트, 입술 모양의 자동동기 생성/재생 방법 및 그 장치 | |
Ranzato et al. | The portrayal of real-life people in audiovisual translation | |
CN117596433A (zh) | 一种基于时间轴微调的国际中文教学视听课件编辑系统 | |
JP2003223199A (ja) | 字幕用書き起こしテキストの作成支援システム及び半自動型字幕番組制作システム | |
JP4654889B2 (ja) | 再生装置 | |
KR102463283B1 (ko) | 청각 장애인 및 비장애인 겸용 영상 콘텐츠 자동 번역 시스템 | |
US20240155205A1 (en) | Method for generating captions, subtitles and dubbing for audiovisual media | |
TWI790705B (zh) | 語速調整方法及其系統 | |
JP2011232775A (ja) | 発音学習装置及び発音学習プログラム | |
JP4678672B2 (ja) | 発音学習装置及び発音学習プログラム | |
Pamisetty et al. | Subtitle Synthesis using Inter and Intra utterance Prosodic Alignment for Automatic Dubbing | |
CN109346058B (zh) | 一种语音声学特征扩大系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |