CN108630224B

CN108630224B - 控制语速的方法及装置

Info

Publication number: CN108630224B
Application number: CN201810242194.4A
Authority: CN
Inventors: 周海
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2018-03-22
Filing date: 2018-03-22
Publication date: 2020-06-09
Anticipated expiration: 2038-03-22
Also published as: CN108630224A

Abstract

本发明提供了一种控制语速的方法，包括：获取需要跟读的内容的预设文本信息；确定当前跟读轮数，并根据当前跟读轮数确定相对应的当前播放语速，根据当前播放语速将预设文本信息转换为演示语音，接收交互对象基于演示语音输入的当前跟读语音，将当前跟读语音转换为当前跟读文本信息，在当前跟读文本信息与预设文本信息一致时，当前跟读轮数加一，并重复执行上述步骤，直至当前跟读文本信息与预设文本信息不一致。本控制语速的方法，随着跟读轮数的增加，逐渐加快演示语音的播放速度，通过加快演示语音的播放速度，使儿童带着与演示语音比拼的竞赛感，更好的激活儿童的积极性，使其更好的锻炼语言能力。

Description

控制语速的方法及装置

技术领域

本发明涉及语音识别技术领域，特别涉及一种控制语速的方法及装置。

背景技术

目前，在儿童智能产品中，跟读是一个重要的锻炼语言的功能，但只进行跟读，无法激活儿童的积极性，增加更丰富的跟读体验才能使锻炼跟读的效果更好。

发明内容

本发明提供一种控制语速的方法，用于解决现有方式只能简单跟读导致跟读学习效果差的问题。

本发明实施例提供的一种控制语速的方法，包括：

步骤1：获取需要跟读的内容的预设文本信息；

步骤2：确定当前跟读轮数，并根据所述当前跟读轮数确定相对应的当前播放语速，所述当前跟读轮数与所述当前播放语速为正相关关系；

步骤3：根据所述当前播放语速将所述预设文本信息转换为演示语音，并以所述当前播放语速播放所述演示语音；

步骤4：接收交互对象基于所述演示语音输入的当前跟读语音，将所述当前跟读语音转换为当前跟读文本信息，并判断所述当前跟读文本信息与所述预设文本信息是否一致；

步骤5：在所述当前跟读文本信息与所述预设文本信息一致时，所述当前跟读轮数加一，并重复执行步骤4，直至所述当前跟读文本信息与所述预设文本信息不一致。

在一个实施例中，在所述当前跟读文本信息与所述预设文本信息不一致之后，还包括：

确定所述预设文本信息中与所述当前跟读文本信息不一致的文本位置，将所述文本位置处对应的预设文本信息转换为自然语音，并播放所述自然语音。

在一个实施例中，将所述当前跟读语音转换为当前跟读文本信息包括：

判断输入本轮的所述当前跟读语音的交互对象与输入上一轮的当前跟读语音的交互对象是否相同；

在两轮的交互对象相同时，将所述本轮的当前跟读语音转换为当前跟读文本信息；

在两轮的交互对象不同时，初始化所述当前跟读轮数，并将所述本轮的当前跟读语音转换为当前跟读文本信息。

在一个实施例中，在所述当前跟读文本信息与所述预设文本信息一致时，所述当前跟读轮数加一，包括：

在所述当前跟读文本信息与所述预设文本信息一致时，获取进入下一轮跟读的指令，根据所述指令对所述当前跟读轮数进行加一处理，并进入下一轮跟读；或

在确定所述当前跟读文本信息与所述预设文本信息一致时开始计时，当计时达到预设时间时，对所述当前跟读轮数进行加一处理，并进入下一轮跟读。

在一个实施例中，当前跟读文本信息与所述预设文本信息不一致之后，还包括：

根据交互对象每一轮输入的当前跟读语音确定所述交互对象的跟读信息，并根据所述跟读信息确定所述交互对象的评价系数，所述跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。

本发明实施例还提供一种控制语速的装置，包括：

获取模块，用于获取需要跟读的内容的预设文本信息；

语速确定模块，用于确定当前跟读轮数，并根据所述当前跟读轮数确定相对应的当前播放语速，所述当前跟读轮数与所述当前播放语速为正相关关系；

语音播放模块，用于根据所述当前播放语速将所述预设文本信息转换为演示语音，并以所述当前播放语速播放所述演示语音；

语音接收比对模块，接收交互对象基于所述演示语音输入的当前跟读语音，将所述当前跟读语音转换为当前跟读文本信息，并判断所述当前跟读文本信息与所述预设文本信息是否一致；

语音执行控制模块，在所述当前跟读文本信息与所述预设文本信息一致时，所述当前跟读轮数加一，并重复执行所述语音接收比对模块的判断过程，直至所述当前跟读文本信息与所述预设文本信息不一致。

在一个实施例中，控制语速的装置还包括：

纠错模块，用于确定所述预设文本信息中与所述当前跟读文本信息不一致的文本位置，将所述文本位置处对应的预设文本信息转换为自然语音，并播放所述自然语音。

在一个实施例中，语音接收比对模块包括：

交互对象确认模块，用于判断输入本轮的所述当前跟读语音的交互对象与输入上一轮的当前跟读语音的交互对象是否相同；

第一执行模块，用于在两轮的交互对象相同时，将所述本轮的当前跟读语音转换为当前跟读文本信息；

第二执行模块，用于在两轮的交互对象不同时，初始化所述本轮的当前跟读轮数，并将所述当前跟读语音转换为当前跟读文本信息。

在一个实施例中，语音执行控制模块用于：在所述当前跟读文本信息与所述预设文本信息一致时，获取进入下一轮跟读的指令，根据所述指令对所述当前跟读轮数进行加一处理，并进入下一轮跟读；或

在一个实施例中，控制语速的装置还包括：评价模块，用于根据交互对象每一轮输入的当前跟读语音确定所述交互对象的跟读信息，并根据所述跟读信息确定所述交互对象的评价系数，所述跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。

本控制语速的方法及装置用于解决现有方式只能简单跟读导致跟读学习效果差的问题。具体表现在不仅可以让儿童跟读，并且可以控制跟读语音的语速，通过改变跟读语音的语速，使儿童产生与演示语音竞争的感觉；并且对儿童的跟读结果进行评价，使儿童对自己的跟读结果有直观的了解，使儿童想要超越自己，获得比先前的跟读评价更好的跟读评价，更好的激活儿童的积极性，使其更好的锻炼语言能力。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中一种控制语速的方法的示意图；

图2为本发明实施例中一种控制语速的装置的示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

本发明实施例提供了一种控制语速的方法，如图1所示，包括：

S1：获取需要跟读的内容的预设文本信息；

S2：确定当前跟读轮数，并根据当前跟读轮数确定相对应的当前播放语速，当前跟读轮数与当前播放语速为正相关关系；

S3：根据当前播放语速将预设文本信息转换为演示语音，并以当前播放语速播放演示语音；

S4：接收交互对象基于演示语音输入的当前跟读语音，将当前跟读语音转换为当前跟读文本信息，并判断当前跟读文本信息与预设文本信息是否一致；

S5：在当前跟读文本信息与预设文本信息一致时，当前跟读轮数加一，并重复执行步骤S4，直至当前跟读文本信息与预设文本信息不一致。

例如：获取需要跟读的内容的预设文本信息；确定当前跟读轮数和当前播放语速；初始跟读轮数为1，当前播放语速为2+(当前跟读轮数-1)*0.5个字每秒，在第1轮，初始播放语速为每秒钟2个字；根据当前播放语速将预设文本信息转换为演示语音，并以当前播放语速播放演示语音；接收交互对象基于演示语音输入的当前跟读语音，交互对象可以是儿童；将当前跟读语音转换为当前跟读文本信息，并判断当前跟读文本信息与预设文本信息是否一致；在当前跟读文本信息与预设文本信息一致时，说明交互对象本轮跟读完成，为提高播放语速进入下一轮跟读，当前跟读轮数加一为下一轮跟读轮数，即进入第2轮跟读，获取需要跟读的内容的预设文本信息；确定当前跟读轮数和当前播放语速；在第2轮，播放语速为每秒钟2.5个字；根据当前播放语速将预设文本信息转换为演示语音，并以当前播放语速播放演示语音；接收交互对象基于演示语音输入的当前跟读语音，将当前跟读语音转换为当前跟读文本信息，并判断当前跟读文本信息与预设文本信息是否一致；在当前跟读文本信息与预设文本信息一致时，进入第3轮跟读。随着跟读轮数的增加，逐渐加快演示语音的播放速度；在当前跟读文本信息与预设文本信息不一致，即跟读语音出错后停止本次跟读。

上述控制语速的方法，随着跟读轮数的增加，逐渐加快演示语音的播放速度，不仅提高了跟读播放的多样性，而且逐渐提高了跟读的复杂性和难度；通过加快演示语音的播放速度，使儿童带着与演示语音比拼的竞赛感，更好的激活儿童的积极性，使其更好的锻炼语言能力。

为实现对用户跟读出错位置的纠正，在一个实施例中，在当前跟读文本信息与预设文本信息不一致之后，还包括：

确定预设文本信息中与当前跟读文本信息不一致的文本位置，将文本位置处对应的预设文本信息转换为自然语音，并播放自然语音。

通过上述步骤对出错位置进行指出并播放出错位置正确的自然语音，让用户(比如儿童)能够纠正跟读出错的位置。

为了确保在本次跟读中交互对象是同一个；在一个实施例中，将当前跟读语音转换为当前跟读文本信息包括：

判断输入本轮的当前跟读语音的交互对象与输入上一轮的当前跟读语音的交互对象是否相同；可以采用声纹识别的方式来判断本轮的当前跟读语音的交互对象与上一轮跟读语音的交互对象是否是同一个。

在两轮的交互对象相同时，将本轮的当前跟读语音转换为当前跟读文本信息；即当没有改变跟读的交互对象时，继续本次跟读。

在两轮的交互对象不同时，初始化当前跟读轮数，并将本轮的当前跟读语音转换为当前跟读文本信息。即当本轮跟读的交互对象改变时，将当前跟读轮数重置为初始跟读轮数，重新开始跟读。

为了保证跟读质量，在一个实施例中，在当前跟读文本信息与预设文本信息一致时，当前跟读轮数加一，包括：

在当前跟读文本信息与预设文本信息一致时，获取进入下一轮跟读的指令，根据指令对当前跟读轮数进行加一处理，并进入下一轮跟读；或

在确定当前跟读文本信息与预设文本信息一致时开始计时，当计时达到预设时间时，对当前跟读轮数进行加一处理，并进入下一轮跟读。当本轮跟读结束后，通过在每轮跟读之间设置一定的时间间隔，给交互对象一点准备或休息时间，保证交互对象的跟读的质量。

为了实现对交互对象的跟读进行评价，在一个实施例中，当前跟读文本信息与预设文本信息不一致之后，还包括：

根据交互对象每一轮输入的当前跟读语音确定交互对象的跟读信息，并根据跟读信息确定交互对象的评价系数，跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。在本次跟读完成后对交互对象的跟读进行评价。对儿童的跟读结果进行评价，使儿童对自己的跟读结果有直观的了解，使儿童想要超越自己，获得比先前的跟读评价更好的跟读评价，更好的激活儿童的积极性，使其更好的锻炼语言能力。

本发明实施例还提供一种控制语速的装置，如图2所示，包括：

获取模块21，用于获取需要跟读的内容的预设文本信息；

语速确定模块22，用于确定当前跟读轮数，并根据当前跟读轮数确定相对应的当前播放语速，当前跟读轮数与当前播放语速为正相关关系；

语音播放模块23，用于根据当前播放语速将预设文本信息转换为演示语音，并以当前播放语速播放演示语音；

语音接收比对模块24，接收交互对象基于演示语音输入的当前跟读语音，将当前跟读语音转换为当前跟读文本信息，并判断当前跟读文本信息与预设文本信息是否一致；

语音执行控制模块25，在当前跟读文本信息与预设文本信息一致时，当前跟读轮数加一，并重复执行所述语音接收比对模块的判断过程，直至当前跟读文本信息与预设文本信息不一致。

例如：获取模块获取需要跟读的内容的预设文本信息；语速确定模块确定当前跟读轮数和当前播放语速；初始跟读轮数为1，当前播放语速为2+(当前跟读轮数-1)*0.5个字每秒，初始播放语速为每秒钟2个字；语音播放模块根据当前播放语速将预设文本信息转换为演示语音，并以当前播放语速播放演示语音；语音接收比对模块接收交互对象基于演示语音输入的当前跟读语音，将当前跟读语音转换为当前跟读文本信息，并判断当前跟读文本信息与预设文本信息是否一致；语音执行控制模块在当前跟读文本信息与预设文本信息一致时，当前跟读轮数加一，并重复执行上述步骤，直至当前跟读文本信息与预设文本信息不一致，即跟读语音出错后停止本次跟读。

上述控制语速的装置，随着跟读轮数的增加，逐渐加快演示语音的播放速度，不仅提高了跟读播放的多样性，而且逐渐提高了跟读的复杂性和难度；通过加快演示语音的播放速度，使儿童带着与演示语音比拼的竞赛感，更好的激活儿童的积极性，使其更好的锻炼语言能力。

为实现对用户跟读出错位置的纠正，在一个实施例中，控制语速的装置还包括：

纠错模块，用于确定预设文本信息中与当前跟读文本信息不一致的文本位置，将文本位置处对应的预设文本信息转换为自然语音，并播放自然语音。通过纠错模块对出错位置进行指出并播放出错位置正确的自然语音，让用户能够纠正跟读出错的位置。

为了确保在本次跟读中，交互对象是同一个；在一个实施例中，语音接收比对模块包括：

交互对象确认单元，用于判断输入本轮的当前跟读语音的交互对象与输入上一轮的当前跟读语音的交互对象是否相同；采用声纹识别的方式来判断当前跟读语音的交互对象与上一轮跟读语音的交互对象是否是同一个。

第一执行单元，用于在两轮的交互对象相同时，将本轮的当前跟读语音转换为当前跟读文本信息；即当没有改变跟读的交互对象时，继续本次跟读。

第二执行单元，用于在两轮的交互对象不同时，初始化当前跟读轮数，并将本轮的当前跟读语音转换为当前跟读文本信息。即当本轮跟读的交互对象改变时，重新开始本次跟读。

为了使每轮跟读之间有一定的时间间隔，在一个实施例中，语音执行控制模块用于：在当前跟读文本信息与预设文本信息一致时，获取进入下一轮跟读的指令，根据指令对当前跟读轮数进行加一处理，并进入下一轮跟读；或

在确定当前跟读文本信息与预设文本信息一致时开始计时，当计时达到预设时间时，对当前跟读轮数进行加一处理，并进入下一轮跟读。当本轮跟读结束后，给交互对象一点准备或休息时间，保证交互对象的跟读的质量。

为了实现对交互对象的跟读进行评价，在一个实施例中，控制语速的装置还包括：评价模块，用于根据交互对象每一轮输入的当前跟读语音确定交互对象的跟读信息，并根据跟读信息确定交互对象的评价系数，跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。在本次跟读完成后对交互对象的跟读进行评价。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种控制语速的方法，其特征在于，包括：

步骤1:获取需要跟读的内容的预设文本信息；

步骤2:确定当前跟读轮数，并根据所述当前跟读轮数确定相对应的当前播放语速，所述当前跟读轮数与所述当前播放语速为正相关关系；

2.如权利要求1所述的方法，其特征在于，在所述当前跟读文本信息与所述预设文本信息不一致之后，还包括：

3.如权利要求1所述的方法，其特征在于，所述将所述当前跟读语音转换为当前跟读文本信息包括：

4.如权利要求1所述的方法，其特征在于，所述在所述当前跟读文本信息与所述预设文本信息一致时，所述当前跟读轮数加一，包括：

5.如权利要求1所述的方法，其特征在于，在所述当前跟读文本信息与所述预设文本信息不一致之后，还包括：

6.一种控制语速的装置，其特征在于，包括：

获取模块，用于获取需要跟读的内容的预设文本信息；

7.如权利要求6所述的装置，其特征在于，还包括：

8.如权利要求6所述的装置，其特征在于，所述语音接收比对模块包括：

第二执行模块，用于在两轮的交互对象不同时，初始化所述当前跟读轮数，并将所述本轮的当前跟读语音转换为当前跟读文本信息。

9.如权利要求6所述的装置，其特征在于，所述语音执行控制模块用于：在所述当前跟读文本信息与所述预设文本信息一致时，获取进入下一轮跟读的指令，根据所述指令对所述当前跟读轮数进行加一处理，并进入下一轮跟读；或

10.如权利要求6所述的装置，其特征在于，还包括：评价模块，用于根据交互对象每一轮输入的当前跟读语音确定所述交互对象的跟读信息，并根据所述跟读信息确定所述交互对象的评价系数，所述跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。