CN111429880A

CN111429880A - 一种切割段落音频的方法、系统、装置、介质

Info

Publication number: CN111429880A
Application number: CN202010143849.XA
Authority: CN
Inventors: 丁俊华; 高淑君; 王彦燕; 李冬菊; 刘�文
Original assignee: Suzhou Chivox Information Technology Co ltd
Current assignee: Suzhou Chivox Information Technology Co ltd
Priority date: 2020-03-04
Filing date: 2020-03-04
Publication date: 2020-07-17

Abstract

本发明提供了一种切割段落音频的方法、系统、装置、介质，能够支持内容提供方在录入段落后，立刻生成支持段落逐句跟读练习的内容资源，方便用户进行口语学习，方法包括以下步骤：录入段落文本和音频；判断是否存在音频，若存在音频，则将段落文本和音频上传，若不存在音频，则将段落文本进行语音合成；将对应的段落文本和音频作为一个任务包打包后进行段落切割；对任务包中的音频，对应段落文本内容，进行段落切割，返回切割结果，切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息；根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间，逐句储存段落文本和音频。

Description

一种切割段落音频的方法、系统、装置、介质

技术领域

本发明涉及口语教学和语音评价技术领域，特别是涉及一种切割段落音频的方法、系统、装置、介质。

背景技术

逐句跟读，指的是跟读者滞后一小段时间，在源语后面进行复述。逐句跟读在一定程度上可以提高口语能力，还能够让人跟上并听懂语速较快的英文，并培养语感，培养听力所需要的反应能力及写作所需的输出能力。

现有的学习软件中虽然有逐句跟读的功能，但是缺乏可以直接通过输入文本实现可以逐句跟读的音频的手段。

发明内容

针对上述问题，本发明提供了一种切割段落音频的方法、系统、装置、介质，能够支持内容提供方在录入段落后，立刻生成支持段落逐句跟读练习的内容资源，方便用户进行口语学习。

其技术方案是这样的：一种切割段落音频的方法，其特征在于，包括以下步骤：

判断是否存在音频，若存在音频，则将段落文本和音频上传，若不存在音频，则将段落文本进行语音合成；判断音频是否合成成功，若成功则将段落文本和音频上传，否则继续合成音频直至音频合成成功；

将对应的段落文本和音频作为一个任务包打包后进行段落切割；

对任务包中的音频，对应段落文本内容，进行段落切割，返回切割结果，切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息；

根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间，逐句储存段落文本和音频。

进一步的，录入音频的方式包括根据录入段落文本，在线录制音频或本地上传音频。

进一步的，所述切割结果是对应段落文本中的句末标点，对句子内容的句首和句尾时间进行标记，得到各个句子在音频中的开始时间和结束时间的时间戳信息。

一种切割段落音频的系统，其特征在于，包括通讯连接的：内容管理模块、任务处理模块、段落切割模块；

在内容管理模块中录入段落文本和音频；

判断是否存在音频，若存在音频，则将段落文本和音频上传到任务处理模块，若不存在音频，则将段落文本输入语音合成模块，合成音频，判断音频是否合成成功，若成功则将段落文本和音频上传到任务处理模块，否则继续合成音频直至音频合成成功；

任务处理模块将对应的段落文本和音频作为一个任务包发送给段落切割模块；

段落切割模块对任务包中的音频，对应段落文本内容，进行段落切割，向任务处理模块返回切割结果，切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息；

任务处理模块向切割结果回调给内容管理模块，内容管理模块根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间，逐句储存段落文本和音频，内容管理模块能够按照段落文本中的句子，逐句跟读播放音频。

进一步的，在内容管理模块中录入音频的方式包括根据录入段落文本，在线录制音频或本地上传音频。

进一步的，所述段落切割模块能够对应段落文本中的句末标点，对句子内容的句首和句尾时间进行标记，得到各个句子在音频中的开始时间和结束时间的时间戳信息。

一种切割段落音频的装置，其特征在于，其包括：包括处理器、存储器以及程序；

所述程序存储在所述存储器中，所述处理器调用存储器存储的程序，以执行上述的切割段落音频的方法。

一种计算机可读存储介质，其特征在于：所述计算机可读存储介质被配置成存储程序，所述程序被配置成执行上述的切割段落音频的方法。

本发明具有以下优点：用户在添加一个段落文本之后，对于有音频的内容，能够自动通过句末标点，对音频进行标注处理，对于没有添加音频的内容，能够自动合成音频后再进行标注，得到切割结果，切割结果包含了对句子内容的句首和句尾时间的记录，根据切割结果对标注后的音频进行逐句保存，从而实现切割段落音频的效果，能够支持内容提供方在录入段落文本后，生成支持段落逐句跟读练习的内容资源，同时也支持段落朗读，反馈发音、流利度等问题，方便用户进行口语学习，提高口语水平。

附图说明

图1为本发明的一种切割段落音频的系统实现的流程框图；

图2为本发明的一种切割段落音频的系统的组成框图；

图3为实施例中在切割段落音频的系统中添加段落文本和音频的示意图；

图4为切割段落音频的系统中段落跟读正在进行逐句跟读的示意图；

图5为切割段落音频的系统中段落跟读完成的示意图；

图6为切割段落音频的系统中段落跟读的反馈示意图。

具体实施方式

见图1，本发明的一种切割段落音频的方法，包括以下步骤：

录入段落文本和音频；

对任务包中的音频，对应段落文本内容，进行段落切割，返回切割结果，切割结果是对应段落文本中的句末标点，对句子内容的句首和句尾时间进行标记，得到各个句子在音频中的开始时间和结束时间的时间戳信息；

具体在本实施例中，录入音频的方式包括根据录入段落文本，在线录制音频或本地上传音频，其中，本地上传音频，要求音频清晰标准，且格式符合MP3格式，并对大小限制；在线录制音频，用户点击后可以直接使用设备进行录音操作，完成标准音的录制，要求声音必须清晰完整，且和录入文本完全对应。

见图2，在本发明的实施例中，还提供了一种切割段落音频的系统，包括通讯连接的：内容管理模块1、任务处理模块2、段落切割模块3；

在内容管理模块1中录入段落文本和音频，其中，在内容管理模块中录入音频的方式包括根据录入段落文本，在线录制音频或本地上传音频，图3为实施例中在切割段落音频的系统中添加段落文本和音频的示意；

判断是否存在音频，若存在音频，则将段落文本和音频上传到任务处理模块2，若不存在音频，则将段落文本输入语音合成模块，合成音频，判断音频是否合成成功，若成功则将段落文本和音频上传到任务处理模块2，否则继续合成音频直至音频合成成功；

任务处理模块2将对应的段落文本和音频作为一个任务包发送给段落切割模块3；

段落切割模块3对任务包中的音频，对应段落文本内容，进行段落切割，向任务处理模块2返回切割结果，切割结果包含段落中各个句子在音频中的开始时间和结束时间的时间戳信息，段落切割模块3能够对应段落文本中的句末标点，对句子内容的句首和句尾时间进行标记，得到各个句子在音频中的开始时间和结束时间的时间戳信息；

任务处理模块2向切割结果回调给内容管理模块1，内容管理模块1根据切割结果中包含的段落中各个句子在音频中的开始时间和结束时间，逐句储存段落文本和音频，内容管理模块1能够按照段落文本中的句子，逐句跟读播放音频，图4为段落跟读正在进行逐句跟读的示意图，图5为段落跟读完成的示意图，图6展示了段落跟读的反馈。

本发明的切割段落音频的系统，用户在系统中添加一个段落文本之后，对于有音频的内容，系统能够自动通过句末标点，对音频进行标注处理，对于没有添加音频的内容，系统能够自动合成音频后再进行标注，得到切割结果，切割结果包含了对句子内容的句首和句尾时间的记录，根据切割结果对标注后的音频进行逐句保存，从而实现切割段落音频的效果，能够支持内容提供方在录入段落文本后，生成支持段落逐句跟读练习的内容资源，同时也支持段落朗读，反馈发音、流利度等问题，方便用户进行口语学习，提高口语水平。

在本发明的实施例中，还提供了一种切割段落音频的装置，其包括：包括处理器、存储器以及程序；

程序存储在存储器中，处理器调用存储器存储的程序，以执行上述的切割段落音频的方法。

在上述切割段落音频的装置的实现中，存储器和处理器之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接，如可以通过总线连接。存储器中存储有实现数据访问控制方法的计算机执行指令，包括至少一个可以软件或固件的形式存储于存储器中的软件功能模块，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理。

存储器可以是，但不限于，随机存取存储器(Random Access Memory，简称：RAM)，只读存储器(Read Only Memory，简称：ROM)，可编程只读存储器(Programmable Read-OnlyMemory，简称：PROM)，可擦除只读存储器(Erasable Programmable Read-Only Memory，简称：EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，简称：EEPROM)等。其中，存储器用于存储程序，处理器在接收到执行指令后，执行程序。

处理器可以是一种集成电路芯片，具有信号的处理能力。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称：CPU)、网络处理器(NetworkProcessor，简称：NP)等。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

在本发明的实施例中，还提供了一种计算机可读存储介质，计算机可读存储介质被配置成存储程序，程序被配置成执行上述的切割段落音频的方法。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图中指定的功能的步骤。

以上对本发明所提供的切割段落音频的方法、切割段落音频的系统、切割段落音频的装置和一种计算机可读存储介质的应用进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种切割段落音频的方法，其特征在于，包括以下步骤：

录入段落文本和音频；

2.根据权利要求1所述的一种切割段落音频的方法，其特征在于：录入音频的方式包括根据录入段落文本，在线录制音频或本地上传音频。

3.根据权利要求1所述的一种切割段落音频的方法，其特征在于：所述切割结果是对应段落文本中的句末标点，对句子内容的句首和句尾时间进行标记，得到各个句子在音频中的开始时间和结束时间的时间戳信息。

4.一种切割段落音频的系统，其特征在于，包括通讯连接的：内容管理模块、任务处理模块、段落切割模块；

在内容管理模块中录入段落文本和音频；

5.根据权利要求4所述的一种切割段落音频的系统，其特征在于：在内容管理模块中录入音频的方式包括根据录入段落文本，在线录制音频或本地上传音频。

6.根据权利要求4所述的一种切割段落音频的系统，其特征在于：所述段落切割模块能够对应段落文本中的句末标点，对句子内容的句首和句尾时间进行标记，得到各个句子在音频中的开始时间和结束时间。

7.一种切割段落音频的装置，其特征在于，其包括：包括处理器、存储器以及程序；

所述程序存储在所述存储器中，所述处理器调用存储器存储的程序，以执行权利要求1所述的切割段落音频的方法。

8.一种计算机可读存储介质，其特征在于：所述计算机可读存储介质被配置成存储程序，所述程序被配置成执行权利要求1所述的切割段落音频的方法。