CN110797003A - 一种文本转语音显示字幕信息的方法 - Google Patents

一种文本转语音显示字幕信息的方法 Download PDF

Info

Publication number
CN110797003A
CN110797003A CN201911042371.5A CN201911042371A CN110797003A CN 110797003 A CN110797003 A CN 110797003A CN 201911042371 A CN201911042371 A CN 201911042371A CN 110797003 A CN110797003 A CN 110797003A
Authority
CN
China
Prior art keywords
text
font
mark
displaying
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911042371.5A
Other languages
English (en)
Inventor
陈阳
鲁永春
王周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Mingyang Information Technology Co Ltd
Original Assignee
Hefei Mingyang Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Mingyang Information Technology Co Ltd filed Critical Hefei Mingyang Information Technology Co Ltd
Priority to CN201911042371.5A priority Critical patent/CN110797003A/zh
Publication of CN110797003A publication Critical patent/CN110797003A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. SMS or e-mail
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/39Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis

Abstract

本发明公开了一种文本转语音显示字幕信息的方法,属于字幕显示控制技术领域,包括以下步骤:S1:使用设置在手机端的文本编辑器编辑文本,设置文本中每个单句的停顿标记、延时标记和循环标记,停顿标记和延时标记设置时长,循环标记设置循环位置;S2:文字转语音系统将文字合成语音文件;S3:播放语音文件同时在显示屏幕上显示字幕;使用文字转语音系统播放语音文件,使手机屏幕同步显示字幕,并且可以设置字幕的字体大小、颜色以及字体背景颜色,已达到突出显示的作用。

Description

一种文本转语音显示字幕信息的方法
技术领域
本发明涉及字幕显示控制技术领域,更具体地说,涉及一种文本转语音显示字幕信息的方法。
背景技术
目前智能手机上都有文字转语音的软件,使用文本编辑器编辑文本,然后将文本通过文字转语音系统合成语音文件,最后手机播放该语音文件。在使用的过程中,手机播放语音文件时使用者往往需要看到同步显示的字幕,文本文件是由许多单句组成,需要经过处理才能准确的与播放的语音文件同步。在文字转语音的过程中,对本文设置停顿、延时和循环,文字转语音的过程中,也对语音作了相应的停顿处理、延时处理和循环处理,手机在播放语音文件时,需要手机屏幕同步显示字幕。并且可以设置字幕的字体大小、颜色以及字体背景颜色,已达到突出显示的作用。
发明内容
针对现有技术的不足,本发明的目的在于提供一种文本转语音显示字幕信息的方法,使用文字转语音系统播放语音文件,使手机屏幕同步显示字幕,并且可以设置字幕的字体大小、颜色以及字体背景颜色,已达到突出显示的作用。
本发明的目的可以通过以下技术方案实现:
一种文本转语音显示字幕信息的方法,包括以下步骤:
S1:使用设置在手机端的文本编辑器编辑文本,设置文本中每个单句的停顿标记、延时标记和循环标记,停顿标记和延时标记设置时长,循环标记设置循环位置;
S2:文字转语音系统将文字合成语音文件;
S3:播放语音文件同时在显示屏幕上显示字幕;
其中,步骤S3在显示屏幕显示字幕的方法包括以下步骤:
S301:检索出所有标点符号,将文本切换成多行单句,计算出每个单句的时长,计算方式如下:
RowTime=RowLen/TotalLen*TotalTime
其中,rowTime是一行字幕显示时长,rowLen是字幕文本长度,TotalLen是字幕总长度,TotalTime是语音播放总时长;
S302:检索出每行中的停顿标记,记录停顿时间;
S303:计算出每行显示时长;
S304:是否延时播放,是则执行步骤S5否则执行步骤S7;
S305:每行顺延延时播放时间;
S306:是否循环播放,是则执行步骤S6否则;
S307:字幕循环显示,重新计算出每行显示时间。
作为本发明的一种优选方案,文字转语音系统设置语音的音色。
作为本发明的一种优选方案,步骤S3还包括设置字体大小、字体颜色和字体背景颜色的指示。
作为本发明的一种优选方案,步骤S3还包括修改字体的大小,在显示字幕前,判断是否指示修改字体大小,是则修改字幕的大小,否则执行下一步骤。
作为本发明的一种优选方案,步骤S3还包括修改字体颜色,在显示字幕前,判断是否指示修改字体颜色,是则修改字体的颜色,否则执行下一步骤。
作为本发明的一种优选方案,步骤S3还包括是否指示修改字体背景颜色,判断是否指示修改字体背景颜色,是则修改字体背景颜色,否则执行下一步骤。
作为本发明的一种优选方案,所述文本的格式包括TXT、DOC、DOCX和WPS。
作为本发明的一种优选方案,所述语音文件的格式包括MP3、WAV、WMA和APE。
本发明的有益效果:
本发明解决了在文字转语音的过程中,对本文设置停顿、延时和循环,文字转语音的过程中,也对语音作了相应的停顿处理、延时处理和循环处理,手机在播放语音文件时,手机屏幕同步显示字幕。并且可以设置字幕的字体大小、颜色以及字体背景颜色,已达到突出显示的作用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的屏幕上显示字幕的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所述,一种文本转语音显示字幕信息的方法,包括以下步骤:
S1:使用设置在手机端的文本编辑器编辑文本,设置文本中每个单句的停顿标记、延时标记和循环标记,停顿标记和延时标记设置时长,循环标记设置循环位置;
S2:文字转语音系统将文字合成语音文件;
S3:播放语音文件同时在显示屏幕上显示字幕;
其中,步骤S3在显示屏幕显示字幕的方法包括以下步骤:
S301:检索出所有标点符号,将文本切换成多行单句,计算出每个单句的时长,计算方式如下:
RowTime=RowLen/TotalLen*TotalTime
其中,rowTime是一行字幕显示时长,rowLen是字幕文本长度,TotalLen是字幕总长度,TotalTime是语音播放总时长;
S302:检索出每行中的停顿标记,记录停顿时间;
S303:计算出每行显示时长;
S304:是否延时播放,是则执行步骤S5否则执行步骤S7;
S305:每行顺延延时播放时间;
S306:是否循环播放,是则执行步骤S6否则;
S307:字幕循环显示,重新计算出每行显示时间。
文字转语音系统设置语音的音色,文字转语音系统在转换的过程中改变语音文件的音色,是语音达到用户的需求。
步骤S3还包括设置字体大小、字体颜色和字体背景颜色的指示。步骤S3还包括修改字体的大小,在显示字幕前,判断是否指示修改字体大小,是则修改字幕的大小,否则执行下一步骤。步骤S3还包括修改字体颜色,在显示字幕前,判断是否指示修改字体颜色,是则修改字体的颜色,否则执行下一步骤。步骤S3还包括是否指示修改字体背景颜色,判断是否指示修改字体背景颜色,是则修改字体背景颜色,否则执行下一步骤。手机屏幕显示字幕时,可一根据用户的需求定制字幕字体的大小、颜色以及背景颜色,以便强调不同的内容。
文本的格式包括TXT、DOC、DOCX和WPS。语音文件的格式包括MP3、WAV、WMA和APE。用户可以根据需要使用相应的文件格式。
用户在手机端的文本编辑器编辑文本设置延时播放,整个字幕都要做相应的延时,比如延时5秒,那么第一行字幕的显示时间由原来的10秒变成15秒,第二行原来的n秒变成n+5秒。
用户在手机端的文本编辑器编辑文本设置循环播放,比如循环播放10次,那么将文本循环10次,并且第二次的循环字幕时间依次加上1次文本的总时长,比如依次字幕显示总时长是100秒,那么第二次循环的第一句就是100秒开始,依次类推,当然假如用户还设置了循环时间间隔10秒,那么第二次循环的第一句就是110秒开始,第二句开始显示的时间有原来的n秒变成110+n秒了,依次类推。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

Claims (8)

1.一种文本转语音显示字幕信息的方法,其特征在于,包括以下步骤:
S1:使用设置在手机端的文本编辑器编辑文本,设置文本中每个单句的停顿标记、延时标记和循环标记,停顿标记和延时标记设置时长,循环标记设置循环位置;
S2:文字转语音系统将文字合成语音文件;
S3:播放语音文件同时在显示屏幕上显示字幕;
其中,步骤S3在显示屏幕显示字幕的方法包括以下步骤:
S301:检索出所有标点符号,将文本切换成多行单句,计算出每个单句的时长,计算方式如下:
RowTime=RowLen/TotalLen*TotalTime
其中,rowTime是一行字幕显示时长,rowLen是字幕文本长度,TotalLen是字幕总长度,TotalTime是语音播放总时长;
S302:检索出每行中的停顿标记,记录停顿时间;
S303:计算出每行显示时长;
S304:是否延时播放,是则执行步骤S5否则执行步骤S7;
S305:每行顺延延时播放时间;
S306:是否循环播放,是则执行步骤S6否则;
S307:字幕循环显示,重新计算出每行显示时间。
2.根据权利要求1所述的一种文本转语音生成字幕信息的方法,其特征在于,文字转语音系统设置语音的音色。
3.根据权利要求1所述的一种文本转语音生成字幕信息的方法,其特征在于,步骤S3还包括设置字体大小、字体颜色和字体背景颜色的指示。
4.根据权利要求3所述的一种文本转语音生成字幕信息的方法,其特征在于,步骤S3还包括修改字体的大小,在显示字幕前,判断是否指示修改字体大小,是则修改字幕的大小,否则执行下一步骤。
5.根据权利要求3所述的一种文本转语音生成字幕信息的方法,其特征在于,步骤S3还包括修改字体颜色,在显示字幕前,判断是否指示修改字体颜色,是则修改字体的颜色,否则执行下一步骤。
6.根据权利要求3所述的一种文本转语音生成字幕信息的方法,其特征在于,步骤S3还包括是否指示修改字体背景颜色,判断是否指示修改字体背景颜色,是则修改字体背景颜色,否则执行下一步骤。
7.根据权利要求1所述的一种文本转语音生成字幕信息的方法,其特征在于,所述文本的格式包括TXT、DOC、DOCX和WPS。
8.根据权利要求1所述的一种文本转语音生成字幕信息的方法,其特征在于,所述语音文件的格式包括MP3、WAV、WMA和APE。
CN201911042371.5A 2019-10-30 2019-10-30 一种文本转语音显示字幕信息的方法 Pending CN110797003A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911042371.5A CN110797003A (zh) 2019-10-30 2019-10-30 一种文本转语音显示字幕信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911042371.5A CN110797003A (zh) 2019-10-30 2019-10-30 一种文本转语音显示字幕信息的方法

Publications (1)

Publication Number Publication Date
CN110797003A true CN110797003A (zh) 2020-02-14

Family

ID=69441974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911042371.5A Pending CN110797003A (zh) 2019-10-30 2019-10-30 一种文本转语音显示字幕信息的方法

Country Status (1)

Country Link
CN (1) CN110797003A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112995736A (zh) * 2021-04-22 2021-06-18 南京亿铭科技有限公司 语音字幕合成方法、装置、计算机设备及存储介质
CN115394282A (zh) * 2022-06-01 2022-11-25 北京网梯科技发展有限公司 信息交互方法及装置、教学平台、电子设备和存储介质
CN115580742A (zh) * 2022-10-12 2023-01-06 广州市保伦电子有限公司 一种声文同步的广播方法及广播系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7174295B1 (en) * 1999-09-06 2007-02-06 Nokia Corporation User interface for text to speech conversion
CN1953053A (zh) * 2005-10-21 2007-04-25 华为技术有限公司 一种实现文语转换功能的方法
KR100904300B1 (ko) * 2008-12-12 2009-06-25 씨아이씨라이프(주) 음성합성엔진(tts)을 이용한 자동 안내 방송 장치 및 자동 안내 방송 방법
WO2015131028A1 (en) * 2014-02-28 2015-09-03 Ultratec,Inc. Semiautomated relay method and apparatus
CN106856091A (zh) * 2016-12-21 2017-06-16 北京智能管家科技有限公司 一种多语言文本的自动播报方法及系统
CN107770382A (zh) * 2017-10-30 2018-03-06 江西博瑞彤芸科技有限公司 播放文字信息的方法
CN108305611A (zh) * 2017-06-27 2018-07-20 腾讯科技(深圳)有限公司 文本转语音的方法、装置、存储介质和计算机设备
CN108694862A (zh) * 2018-07-19 2018-10-23 王立泽 空管信息自动化系统紧急告警语音通知的方法和系统
CN109274900A (zh) * 2018-09-05 2019-01-25 浙江工业大学 一种视频配音方法
US20190250803A1 (en) * 2018-02-09 2019-08-15 Nedelco, Inc. Caption rate control

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7174295B1 (en) * 1999-09-06 2007-02-06 Nokia Corporation User interface for text to speech conversion
CN1953053A (zh) * 2005-10-21 2007-04-25 华为技术有限公司 一种实现文语转换功能的方法
KR100904300B1 (ko) * 2008-12-12 2009-06-25 씨아이씨라이프(주) 음성합성엔진(tts)을 이용한 자동 안내 방송 장치 및 자동 안내 방송 방법
WO2015131028A1 (en) * 2014-02-28 2015-09-03 Ultratec,Inc. Semiautomated relay method and apparatus
CN106856091A (zh) * 2016-12-21 2017-06-16 北京智能管家科技有限公司 一种多语言文本的自动播报方法及系统
CN108305611A (zh) * 2017-06-27 2018-07-20 腾讯科技(深圳)有限公司 文本转语音的方法、装置、存储介质和计算机设备
CN107770382A (zh) * 2017-10-30 2018-03-06 江西博瑞彤芸科技有限公司 播放文字信息的方法
US20190250803A1 (en) * 2018-02-09 2019-08-15 Nedelco, Inc. Caption rate control
CN108694862A (zh) * 2018-07-19 2018-10-23 王立泽 空管信息自动化系统紧急告警语音通知的方法和系统
CN109274900A (zh) * 2018-09-05 2019-01-25 浙江工业大学 一种视频配音方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李中才 等: "《快易通中文速录键盘教程》", 31 March 2011, 西南交通大学出版社 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112995736A (zh) * 2021-04-22 2021-06-18 南京亿铭科技有限公司 语音字幕合成方法、装置、计算机设备及存储介质
CN115394282A (zh) * 2022-06-01 2022-11-25 北京网梯科技发展有限公司 信息交互方法及装置、教学平台、电子设备和存储介质
CN115580742A (zh) * 2022-10-12 2023-01-06 广州市保伦电子有限公司 一种声文同步的广播方法及广播系统
CN115580742B (zh) * 2022-10-12 2023-05-16 广东保伦电子股份有限公司 一种声文同步的广播方法及广播系统

Similar Documents

Publication Publication Date Title
CA2833656C (en) System and method for enhancing comprehension and readability of text
CN110797003A (zh) 一种文本转语音显示字幕信息的方法
US20080005656A1 (en) Apparatus, method, and file format for text with synchronized audio
CN107369462B (zh) 电子书语音播放方法、装置及终端设备
US6185538B1 (en) System for editing digital video and audio information
AU2016202974A1 (en) Automatically creating a mapping between text data and audio data
CN103544140A (zh) 一种数据处理方法、展示方法和相应的装置
CN102324191B (zh) 一种有声读物逐字同步显示方法及系统
CN105446960B (zh) 语音翻译装置、方法及程序
CN114157920B (zh) 一种展示手语的播放方法、装置、智能电视及存储介质
CN105681890A (zh) 一种视频播放终端的字幕显示方法及装置
CN110740275A (zh) 一种非线性编辑系统
CN110781649A (zh) 一种字幕编辑方法、装置及计算机存储介质、电子设备
CN110750996A (zh) 多媒体信息的生成方法、装置及可读存储介质
JP2013025299A (ja) 書き起こし支援システムおよび書き起こし支援方法
CN100354930C (zh) 语音显示系统及方法
CN107886975B (zh) 音频的处理方法、装置、存储介质及电子设备
JP4210723B2 (ja) 自動字幕番組制作システム
JP2002344805A (ja) オープンキャプションに対する字幕表示制御方法
US20070087312A1 (en) Method for separating sentences in audio-video display system
CN201585019U (zh) 具有语音转换功能的移动终端
US8942980B2 (en) Method of navigating in a sound content
JP2018146961A (ja) 音声再生装置及び音楽再生プログラム
JP2005326811A (ja) 音声合成装置および音声合成方法
JP3969570B2 (ja) 逐次自動字幕制作処理システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination