CN111429880A - 一种切割段落音频的方法、系统、装置、介质 - Google Patents
一种切割段落音频的方法、系统、装置、介质 Download PDFInfo
- Publication number
- CN111429880A CN111429880A CN202010143849.XA CN202010143849A CN111429880A CN 111429880 A CN111429880 A CN 111429880A CN 202010143849 A CN202010143849 A CN 202010143849A CN 111429880 A CN111429880 A CN 111429880A
- Authority
- CN
- China
- Prior art keywords
- audio
- paragraph
- sentence
- cutting
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005520 cutting process Methods 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 7
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 7
- 238000004806 packaging method and process Methods 0.000 claims abstract description 4
- 238000003860 storage Methods 0.000 claims description 9
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明提供了一种切割段落音频的方法、系统、装置、介质,能够支持内容提供方在录入段落后,立刻生成支持段落逐句跟读练习的内容资源,方便用户进行口语学习,方法包括以下步骤:录入段落文本和音频;判断是否存在音频,若存在音频,则将段落文本和音频上传,若不存在音频,则将段落文本进行语音合成;将对应的段落文本和音频作为一个任务包打包后进行段落切割;对任务包中的音频,对应段落文本内容,进行段落切割,返回切割结果,切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息;根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间,逐句储存段落文本和音频。
Description
技术领域
本发明涉及口语教学和语音评价技术领域,特别是涉及一种切割段落音频的方法、系统、装置、介质。
背景技术
逐句跟读,指的是跟读者滞后一小段时间,在源语后面进行复述。逐句跟读在一定程度上可以提高口语能力,还能够让人跟上并听懂语速较快的英文,并培养语感,培养听力所需要的反应能力及写作所需的输出能力。
现有的学习软件中虽然有逐句跟读的功能,但是缺乏可以直接通过输入文本实现可以逐句跟读的音频的手段。
发明内容
针对上述问题,本发明提供了一种切割段落音频的方法、系统、装置、介质,能够支持内容提供方在录入段落后,立刻生成支持段落逐句跟读练习的内容资源,方便用户进行口语学习。
其技术方案是这样的:一种切割段落音频的方法,其特征在于,包括以下步骤:
判断是否存在音频,若存在音频,则将段落文本和音频上传,若不存在音频,则将段落文本进行语音合成;判断音频是否合成成功,若成功则将段落文本和音频上传,否则继续合成音频直至音频合成成功;
将对应的段落文本和音频作为一个任务包打包后进行段落切割;
对任务包中的音频,对应段落文本内容,进行段落切割,返回切割结果,切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息;
根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间,逐句储存段落文本和音频。
进一步的,录入音频的方式包括根据录入段落文本,在线录制音频或本地上传音频。
进一步的,所述切割结果是对应段落文本中的句末标点,对句子内容的句首和句尾时间进行标记,得到各个句子在音频中的开始时间和结束时间的时间戳信息。
一种切割段落音频的系统,其特征在于,包括通讯连接的:内容管理模块、任务处理模块、段落切割模块;
在内容管理模块中录入段落文本和音频;
判断是否存在音频,若存在音频,则将段落文本和音频上传到任务处理模块,若不存在音频,则将段落文本输入语音合成模块,合成音频,判断音频是否合成成功,若成功则将段落文本和音频上传到任务处理模块,否则继续合成音频直至音频合成成功;
任务处理模块将对应的段落文本和音频作为一个任务包发送给段落切割模块;
段落切割模块对任务包中的音频,对应段落文本内容,进行段落切割,向任务处理模块返回切割结果,切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息;
任务处理模块向切割结果回调给内容管理模块,内容管理模块根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间,逐句储存段落文本和音频,内容管理模块能够按照段落文本中的句子,逐句跟读播放音频。
进一步的,在内容管理模块中录入音频的方式包括根据录入段落文本,在线录制音频或本地上传音频。
进一步的,所述段落切割模块能够对应段落文本中的句末标点,对句子内容的句首和句尾时间进行标记,得到各个句子在音频中的开始时间和结束时间的时间戳信息。
一种切割段落音频的装置,其特征在于,其包括:包括处理器、存储器以及程序;
所述程序存储在所述存储器中,所述处理器调用存储器存储的程序,以执行上述的切割段落音频的方法。
一种计算机可读存储介质,其特征在于:所述计算机可读存储介质被配置成存储程序,所述程序被配置成执行上述的切割段落音频的方法。
本发明具有以下优点:用户在添加一个段落文本之后,对于有音频的内容,能够自动通过句末标点,对音频进行标注处理,对于没有添加音频的内容,能够自动合成音频后再进行标注,得到切割结果,切割结果包含了对句子内容的句首和句尾时间的记录,根据切割结果对标注后的音频进行逐句保存,从而实现切割段落音频的效果,能够支持内容提供方在录入段落文本后,生成支持段落逐句跟读练习的内容资源,同时也支持段落朗读,反馈发音、流利度等问题,方便用户进行口语学习,提高口语水平。
附图说明
图1为本发明的一种切割段落音频的系统实现的流程框图;
图2为本发明的一种切割段落音频的系统的组成框图;
图3为实施例中在切割段落音频的系统中添加段落文本和音频的示意图;
图4为切割段落音频的系统中段落跟读正在进行逐句跟读的示意图;
图5为切割段落音频的系统中段落跟读完成的示意图;
图6为切割段落音频的系统中段落跟读的反馈示意图。
具体实施方式
见图1,本发明的一种切割段落音频的方法,包括以下步骤:
录入段落文本和音频;
判断是否存在音频,若存在音频,则将段落文本和音频上传,若不存在音频,则将段落文本进行语音合成;判断音频是否合成成功,若成功则将段落文本和音频上传,否则继续合成音频直至音频合成成功;
将对应的段落文本和音频作为一个任务包打包后进行段落切割;
对任务包中的音频,对应段落文本内容,进行段落切割,返回切割结果,切割结果是对应段落文本中的句末标点,对句子内容的句首和句尾时间进行标记,得到各个句子在音频中的开始时间和结束时间的时间戳信息;
根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间,逐句储存段落文本和音频。
具体在本实施例中,录入音频的方式包括根据录入段落文本,在线录制音频或本地上传音频,其中,本地上传音频,要求音频清晰标准,且格式符合MP3格式,并对大小限制;在线录制音频,用户点击后可以直接使用设备进行录音操作,完成标准音的录制,要求声音必须清晰完整,且和录入文本完全对应。
见图2,在本发明的实施例中,还提供了一种切割段落音频的系统,包括通讯连接的:内容管理模块1、任务处理模块2、段落切割模块3;
在内容管理模块1中录入段落文本和音频,其中,在内容管理模块中录入音频的方式包括根据录入段落文本,在线录制音频或本地上传音频,图3为实施例中在切割段落音频的系统中添加段落文本和音频的示意;
判断是否存在音频,若存在音频,则将段落文本和音频上传到任务处理模块2,若不存在音频,则将段落文本输入语音合成模块,合成音频,判断音频是否合成成功,若成功则将段落文本和音频上传到任务处理模块2,否则继续合成音频直至音频合成成功;
任务处理模块2将对应的段落文本和音频作为一个任务包发送给段落切割模块3;
段落切割模块3对任务包中的音频,对应段落文本内容,进行段落切割,向任务处理模块2返回切割结果,切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息,段落切割模块3能够对应段落文本中的句末标点,对句子内容的句首和句尾时间进行标记,得到各个句子在音频中的开始时间和结束时间的时间戳信息;
任务处理模块2向切割结果回调给内容管理模块1,内容管理模块1根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间,逐句储存段落文本和音频,内容管理模块1能够按照段落文本中的句子,逐句跟读播放音频,图4为段落跟读正在进行逐句跟读的示意图,图5为段落跟读完成的示意图,图6展示了段落跟读的反馈。
本发明的切割段落音频的系统,用户在系统中添加一个段落文本之后,对于有音频的内容,系统能够自动通过句末标点,对音频进行标注处理,对于没有添加音频的内容,系统能够自动合成音频后再进行标注,得到切割结果,切割结果包含了对句子内容的句首和句尾时间的记录,根据切割结果对标注后的音频进行逐句保存,从而实现切割段落音频的效果,能够支持内容提供方在录入段落文本后,生成支持段落逐句跟读练习的内容资源,同时也支持段落朗读,反馈发音、流利度等问题,方便用户进行口语学习,提高口语水平。
在本发明的实施例中,还提供了一种切割段落音频的装置,其包括:包括处理器、存储器以及程序;
程序存储在存储器中,处理器调用存储器存储的程序,以执行上述的切割段落音频的方法。
在上述切割段落音频的装置的实现中,存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接,如可以通过总线连接。存储器中存储有实现数据访问控制方法的计算机执行指令,包括至少一个可以软件或固件的形式存储于存储器中的软件功能模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理。
存储器可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(Programmable Read-OnlyMemory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。
处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、网络处理器(NetworkProcessor,简称:NP)等。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的实施例中,还提供了一种计算机可读存储介质,计算机可读存储介质被配置成存储程序,程序被配置成执行上述的切割段落音频的方法。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图中指定的功能的步骤。
以上对本发明所提供的切割段落音频的方法、切割段落音频的系统、切割段落音频的装置和一种计算机可读存储介质的应用进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种切割段落音频的方法,其特征在于,包括以下步骤:
录入段落文本和音频;
判断是否存在音频,若存在音频,则将段落文本和音频上传,若不存在音频,则将段落文本进行语音合成;判断音频是否合成成功,若成功则将段落文本和音频上传,否则继续合成音频直至音频合成成功;
将对应的段落文本和音频作为一个任务包打包后进行段落切割;
对任务包中的音频,对应段落文本内容,进行段落切割,返回切割结果,切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息;
根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间,逐句储存段落文本和音频。
2.根据权利要求1所述的一种切割段落音频的方法,其特征在于:录入音频的方式包括根据录入段落文本,在线录制音频或本地上传音频。
3.根据权利要求1所述的一种切割段落音频的方法,其特征在于:所述切割结果是对应段落文本中的句末标点,对句子内容的句首和句尾时间进行标记,得到各个句子在音频中的开始时间和结束时间的时间戳信息。
4.一种切割段落音频的系统,其特征在于,包括通讯连接的:内容管理模块、任务处理模块、段落切割模块;
在内容管理模块中录入段落文本和音频;
判断是否存在音频,若存在音频,则将段落文本和音频上传到任务处理模块,若不存在音频,则将段落文本输入语音合成模块,合成音频,判断音频是否合成成功,若成功则将段落文本和音频上传到任务处理模块,否则继续合成音频直至音频合成成功;
任务处理模块将对应的段落文本和音频作为一个任务包发送给段落切割模块;
段落切割模块对任务包中的音频,对应段落文本内容,进行段落切割,向任务处理模块返回切割结果,切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息;
任务处理模块向切割结果回调给内容管理模块,内容管理模块根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间,逐句储存段落文本和音频,内容管理模块能够按照段落文本中的句子,逐句跟读播放音频。
5.根据权利要求4所述的一种切割段落音频的系统,其特征在于:在内容管理模块中录入音频的方式包括根据录入段落文本,在线录制音频或本地上传音频。
6.根据权利要求4所述的一种切割段落音频的系统,其特征在于:所述段落切割模块能够对应段落文本中的句末标点,对句子内容的句首和句尾时间进行标记,得到各个句子在音频中的开始时间和结束时间。
7.一种切割段落音频的装置,其特征在于,其包括:包括处理器、存储器以及程序;
所述程序存储在所述存储器中,所述处理器调用存储器存储的程序,以执行权利要求1所述的切割段落音频的方法。
8.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质被配置成存储程序,所述程序被配置成执行权利要求1所述的切割段落音频的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010143849.XA CN111429880A (zh) | 2020-03-04 | 2020-03-04 | 一种切割段落音频的方法、系统、装置、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010143849.XA CN111429880A (zh) | 2020-03-04 | 2020-03-04 | 一种切割段落音频的方法、系统、装置、介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111429880A true CN111429880A (zh) | 2020-07-17 |
Family
ID=71546129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010143849.XA Pending CN111429880A (zh) | 2020-03-04 | 2020-03-04 | 一种切割段落音频的方法、系统、装置、介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111429880A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112684999A (zh) * | 2020-12-23 | 2021-04-20 | 中国人民解放军战略支援部队信息工程大学 | 一种跟读模式语音采集方法、系统、设备和存储介质 |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1937032A (zh) * | 2005-09-22 | 2007-03-28 | 财团法人工业技术研究院 | 切割语音数据序列的方法 |
AU2007203103A1 (en) * | 1998-02-02 | 2007-07-19 | Walker Reading Technologies, Inc. | Reading Product Fabrication Methodology |
JP2008064972A (ja) * | 2006-09-06 | 2008-03-21 | Nissan Motor Co Ltd | 音声合成装置、音声合成方法及び音声合成用プログラム |
JP2011242727A (ja) * | 2010-05-21 | 2011-12-01 | Panasonic Corp | 音声読上装置 |
CN105224073A (zh) * | 2015-08-27 | 2016-01-06 | 华南理工大学 | 一种基于语音控制的点读手表及其点读方法 |
CN105956588A (zh) * | 2016-04-21 | 2016-09-21 | 深圳前海勇艺达机器人有限公司 | 智能扫描及朗读文字的方法及其机器人装置 |
CN106653037A (zh) * | 2015-11-03 | 2017-05-10 | 广州酷狗计算机科技有限公司 | 音频数据处理方法和装置 |
US20170221471A1 (en) * | 2016-01-28 | 2017-08-03 | Google Inc. | Adaptive text-to-speech outputs |
CN107230397A (zh) * | 2017-07-26 | 2017-10-03 | 绮语(北京)文化传媒有限公司 | 一种亲子幼教用音频生成与处理方法与装置 |
CN107403631A (zh) * | 2017-07-25 | 2017-11-28 | 王�华 | 一种教学用音频文件及其制作方法 |
CN107516518A (zh) * | 2016-06-17 | 2017-12-26 | 青海汉拉信息科技股份有限公司 | 汉语语音自适应集群遥控的全自动执行系统 |
CN107578004A (zh) * | 2017-08-30 | 2018-01-12 | 苏州清睿教育科技股份有限公司 | 基于图像识别和语音交互的学习方法及系统 |
CN107798931A (zh) * | 2017-12-05 | 2018-03-13 | 上海电机学院 | 一种智能幼教学习系统及方法 |
CN108090038A (zh) * | 2016-11-11 | 2018-05-29 | 科大讯飞股份有限公司 | 文本断句方法及系统 |
CN108766437A (zh) * | 2018-05-31 | 2018-11-06 | 平安科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN109065031A (zh) * | 2018-08-02 | 2018-12-21 | 阿里巴巴集团控股有限公司 | 语音标注方法、装置及设备 |
CN110148427A (zh) * | 2018-08-22 | 2019-08-20 | 腾讯数码(天津)有限公司 | 音频处理方法、装置、系统、存储介质、终端及服务器 |
CN110322870A (zh) * | 2019-06-19 | 2019-10-11 | 北京信息职业技术学院 | 一种汉语语音信号切分方法和装置 |
CN110767217A (zh) * | 2019-10-30 | 2020-02-07 | 爱驰汽车有限公司 | 音频分割方法、系统、电子设备和存储介质 |
-
2020
- 2020-03-04 CN CN202010143849.XA patent/CN111429880A/zh active Pending
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2007203103A1 (en) * | 1998-02-02 | 2007-07-19 | Walker Reading Technologies, Inc. | Reading Product Fabrication Methodology |
CN1937032A (zh) * | 2005-09-22 | 2007-03-28 | 财团法人工业技术研究院 | 切割语音数据序列的方法 |
JP2008064972A (ja) * | 2006-09-06 | 2008-03-21 | Nissan Motor Co Ltd | 音声合成装置、音声合成方法及び音声合成用プログラム |
JP2011242727A (ja) * | 2010-05-21 | 2011-12-01 | Panasonic Corp | 音声読上装置 |
CN105224073A (zh) * | 2015-08-27 | 2016-01-06 | 华南理工大学 | 一种基于语音控制的点读手表及其点读方法 |
CN106653037A (zh) * | 2015-11-03 | 2017-05-10 | 广州酷狗计算机科技有限公司 | 音频数据处理方法和装置 |
US20170221471A1 (en) * | 2016-01-28 | 2017-08-03 | Google Inc. | Adaptive text-to-speech outputs |
CN105956588A (zh) * | 2016-04-21 | 2016-09-21 | 深圳前海勇艺达机器人有限公司 | 智能扫描及朗读文字的方法及其机器人装置 |
CN107516518A (zh) * | 2016-06-17 | 2017-12-26 | 青海汉拉信息科技股份有限公司 | 汉语语音自适应集群遥控的全自动执行系统 |
CN108090038A (zh) * | 2016-11-11 | 2018-05-29 | 科大讯飞股份有限公司 | 文本断句方法及系统 |
CN107403631A (zh) * | 2017-07-25 | 2017-11-28 | 王�华 | 一种教学用音频文件及其制作方法 |
CN107230397A (zh) * | 2017-07-26 | 2017-10-03 | 绮语(北京)文化传媒有限公司 | 一种亲子幼教用音频生成与处理方法与装置 |
CN107578004A (zh) * | 2017-08-30 | 2018-01-12 | 苏州清睿教育科技股份有限公司 | 基于图像识别和语音交互的学习方法及系统 |
CN107798931A (zh) * | 2017-12-05 | 2018-03-13 | 上海电机学院 | 一种智能幼教学习系统及方法 |
CN108766437A (zh) * | 2018-05-31 | 2018-11-06 | 平安科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN109065031A (zh) * | 2018-08-02 | 2018-12-21 | 阿里巴巴集团控股有限公司 | 语音标注方法、装置及设备 |
CN110148427A (zh) * | 2018-08-22 | 2019-08-20 | 腾讯数码(天津)有限公司 | 音频处理方法、装置、系统、存储介质、终端及服务器 |
CN110322870A (zh) * | 2019-06-19 | 2019-10-11 | 北京信息职业技术学院 | 一种汉语语音信号切分方法和装置 |
CN110767217A (zh) * | 2019-10-30 | 2020-02-07 | 爱驰汽车有限公司 | 音频分割方法、系统、电子设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112684999A (zh) * | 2020-12-23 | 2021-04-20 | 中国人民解放军战略支援部队信息工程大学 | 一种跟读模式语音采集方法、系统、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109389968B (zh) | 基于双音节混搭的波形拼接方法、装置、设备及存储介质 | |
CN109686361B (zh) | 一种语音合成的方法、装置、计算设备及计算机存储介质 | |
CN109285537B (zh) | 声学模型建立、语音合成方法、装置、设备及存储介质 | |
US9588967B2 (en) | Interpretation apparatus and method | |
CN106126157B (zh) | 基于医院信息系统的语音输入方法及装置 | |
JP2007206317A (ja) | オーサリング方法、オーサリング装置およびプログラム | |
US9196251B2 (en) | Contextual conversion platform for generating prioritized replacement text for spoken content output | |
US20170091177A1 (en) | Machine translation apparatus, machine translation method and computer program product | |
US20090222269A1 (en) | Sentence reading aloud apparatus, control method for controlling the same, and control program for controlling the same | |
JP6806662B2 (ja) | 音声合成システム、統計モデル生成装置、音声合成装置、音声合成方法 | |
CN110740275A (zh) | 一种非线性编辑系统 | |
CN105244027A (zh) | 生成谐音文本的方法和系统 | |
JP2020027132A (ja) | 情報処理装置およびプログラム | |
CN111429880A (zh) | 一种切割段落音频的方法、系统、装置、介质 | |
Littell et al. | Readalong studio: Practical zero-shot text-speech alignment for indigenous language audiobooks | |
CN109213970B (zh) | 笔录生成方法及装置 | |
JP2006236037A (ja) | 音声対話コンテンツ作成方法、装置、プログラム、記録媒体 | |
KR20040094634A (ko) | 일본어 및 중국어 음성 인식 훈련을 위한 동적 발음 지원 | |
CN114999464A (zh) | 语音数据处理方法及装置 | |
CN110428668B (zh) | 一种数据提取方法、装置、计算机系统及可读存储介质 | |
CN114125184A (zh) | 一种提词方法、装置、终端及存储介质 | |
CN112242132A (zh) | 语音合成中的数据标注方法、装置和系统 | |
CN113409761A (zh) | 语音合成方法、装置、电子设备以及计算机可读存储介质 | |
JP6342792B2 (ja) | 音声認識方法、音声認識装置及び音声認識プログラム | |
CN115188365B (zh) | 一种停顿预测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200717 |