CN106710597A

CN106710597A - 语音数据的录音方法及装置

Info

Publication number: CN106710597A
Application number: CN201710007151.3A
Authority: CN
Inventors: 禹晓
Original assignee: Guangdong Genius Technology Co Ltd
Current assignee: Guangdong Genius Technology Co Ltd
Priority date: 2017-01-04
Filing date: 2017-01-04
Publication date: 2017-05-24
Anticipated expiration: 2037-01-04
Also published as: CN106710597B

Abstract

本发明适用于终端领域，提供了一种语音数据的录音方法及装置。所述方法包括：录制录音人员根据第一文本得到的第一语音数据；识别所述第一语音数据，得到第二文本；将所述第一文本和所述第二文本比较，并标识所述第一文本和所述第二文本不同的文本信息；录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据；将所述第二语音数据替换所述第一语音数据中对应的语音数据，得到最终的语音数据。通过上述方法，提高了录音效率。

Description

语音数据的录音方法及装置

技术领域

本发明实施例属于终端领域，尤其涉及一种语音数据的录音方法及装置。

背景技术

目前，学生手机、点读机、家教机等终端制作的语音数据都需要特定录音人员根据所给出的稿件(即文本)进行语音录制，录制好的语音数据再传回公司进行人工听音、修音、测试，以查找录制的语音数据是否存在错误，若存在错误，公司再安排录音人员重新录音。

故，有必要提出一种新的方法，以解决上述技术问题。

发明内容

本发明实施例提供了一种语音数据的录音方法及装置，旨在解决现有的方法中，需要人工听音、修音、测试，以查找录制的语音数据是否存在错误，从而导致录音效率过低的问题。

本发明实施例的第一方面，提供了一种语音数据的录音方法，所述方法包括：

录制录音人员根据第一文本得到的第一语音数据；

识别所述第一语音数据，得到第二文本；

将所述第一文本和所述第二文本比较，并标识所述第一文本和所述第二文本不同的文本信息；

录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据；

将所述第二语音数据替换所述第一语音数据中对应的语音数据，得到最终的语音数据。

本发明实施例的第二方面，提供了一种语音数据的录音装置，所述装置包括：

第一语音数据录制单元，用于录制录音人员根据第一文本得到的第一语音数据；

第一语音数据识别单元，用于识别所述第一语音数据，得到第二文本；

文本比较单元，用于将所述第一文本和所述第二文本比较，并标识所述第一文本和所述第二文本不同的文本信息；

第二语音数据录制单元，用于录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据；

语音数据替换单元，用于将所述第二语音数据替换所述第一语音数据中对应的语音数据，得到最终的语音数据。

在本发明实施例中，由于无需通过人工听音、修音、测试来查找录制的语音数据是否存在错误，因此，简化了操作步骤，提高了录音效率。

附图说明

图1是本发明第一实施例提供的一种语音数据的录音方法的流程图；

图2是本发明第二实施例提供的一种语音数据的录音装置的结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明第一实施例中，录制录音人员根据第一文本得到的第一语音数据，识别所述第一语音数据，得到第二文本，将所述第一文本和所述第二文本比较，并标识所述第一文本和所述第二文本不同的文本信息，录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据，将所述第二语音数据替换所述第一语音数据中对应的语音数据，得到最终的语音数据。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。

实施例一：

图1示出了本发明第一实施例提供的一种语音数据的录音方法的流程图，详述如下：

步骤S11，录制录音人员根据第一文本得到的第一语音数据。

具体地，录音人员根据第一文本的内容发出对应的语音，终端录制该语音，得到对应的第一语音数据。

步骤S12，识别所述第一语音数据，得到第二文本。

虽然第一语音数据是录音人员对照给出的第一文本进行录制，但是仍不能保证录制的第一语音数据是百分之百与第一文本匹配的，因此，需要再通过语音识别算法识别第一语音数据，得到第二文本。

步骤S13，将所述第一文本和所述第二文本比较，并标识所述第一文本和所述第二文本不同的文本信息。

可选地，为了便于用户快速查看到两个文本不同的文本信息，所述步骤S13包括：

A1、将所述第一文本和所述第二文本比较，确定所述第一文本和所述第二文本不同的文本信息。

A2、在所述第一文本上以鲜艳颜色标识确定的文本信息和/或在所述第二文本上以鲜艳颜色标识确定的文本信息。

上述鲜艳颜色是指，与显示第一文本(或第二文本)的文本信息的颜色不同且鲜艳的颜色，例如，假设显示第一文本的文本信息的颜色为黑色，若在第一文本上以鲜艳颜色标识确定的文本信息，则以红色或黄色或蓝色等鲜艳颜色显示确定的所述第一文本和所述第二文本不同的文本信息。

B1、将所述第一文本和所述第二文本比较，确定所述第一文本和所述第二文本不同的文本信息。

B2、在所述第一文本上以指定符号或指定字体标识确定的文本信息和/或在所述第二文本上以指定符号或指定字体标识确定的文本信息。

其中，指定符号包括星号(如“※”)，三角形、矩形等符号。在指定符号为星号时，在确定的所述第一文本和所述第二文本不同的文本信息的同一行批注“※”，以标识所述第一文本和所述第二文本不同的文本信息。

其中，指定字体包括宋体、楷体等。为了便于标识，显示所述第一文本和所述第二文本不同的文本信息的字体与显示所述第一文本和所述第二文本相同的文本信息的字体不同。为了进一步区分，显示所述第一文本和所述第二文本不同的文本信息的字号也与显示所述第一文本和所述第二文本相同的文本信息的字号不同。

步骤S14，录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据。

可选地，为了保证同一句语音数据的声音信息(如语速、语调等)相同，则所述步骤S14具体包括：

C1、判断所述第一文本和所述第二文本不同的文本信息是否为整句的文本信息。具体地，判断所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息，且与包括的该其他文本信息之间是否包括标点符号，若包括标点符号，则判定为非整句的文本信息，否则，判定为整句的文本信息。或者，通过判断所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息，且与包括的该其他文本信息的语义是否相同，若相同，判定为整句的文本信息，否则，判定为非整句的文本信息。

C2、在所述第一文本和所述第二文本不同的文本信息为整句的文本信息，录制所述第一文本和所述第二文本不同的文本信息的第二语音数据。

C3、在所述第一文本和所述第二文本不同的文本信息不为整句的文本信息，录制包括所述第一文本和所述第二文本不同的文本信息所在的整句的文本信息的第二语音数据。

上述C1～C3中，由于录制的第二语音数据为整句的文本信息，因此，使得整句的文本信息对应的第二语音数据在语速、语调上保持一致，便于提高用户的满意度。

可选地，在录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据后，确定该第二语音数据的声音信息(如语速、语调、声音频率等)，获取第一语音数据的声音信息，再将第二语音数据的声音信息与第一语音数据的声音信息比较，并在第二语音数据的声音信息与第一语音数据的声音信息的差大于预设的阈值时，发出重录制第二语音数据的提示。

步骤S15，将所述第二语音数据替换所述第一语音数据中对应的语音数据，得到最终的语音数据。

可选地，为了能够准确替换第一语音数据中对应的语音数据，则在执行所述步骤S13时，包括：

确定包括标识的文本信息对应的时间轴信息。其中，时间轴信息包括标识的文本信息的开始和结束的时间信息。需要指出的是，所述包括标识的文本信息对应的时间轴信息包括2种情况，1种是只为标识的文本信息的开始和结束的时间信息，另1种是标识的文本信息所在的整句的开始和结束的时间信息。

对应地，所述步骤S15具体包括：

将所述第二语音数据替换所述第一语音数据中与所述时间轴信息对应的语音数据，得到最终的语音数据。

本发明第一实施例中，录制录音人员根据第一文本得到的第一语音数据，识别所述第一语音数据，得到第二文本，将所述第一文本和所述第二文本比较，并标识所述第一文本和所述第二文本不同的文本信息，录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据，将所述第二语音数据替换所述第一语音数据中对应的语音数据，得到最终的语音数据。由于无需通过人工听音、修音、测试来查找录制的语音数据是否存在错误，因此，简化了操作步骤，提高了录音效率。

应理解，在本发明实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

实施例二：

图2示出了本发明第二实施例提供的一种语音数据的录音装置的结构图，该语音数据的录音装置可应用于各种终端中，该终端可以包括经无线接入网RAN与一个或多个核心网进行通信的用户设备，该用户设备可以是移动电话(或称为“蜂窝”电话)、具有移动设备的计算机等，例如，用户设备还可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置，它们与无线接入网交换语音和/或数据。又例如，该移动设备可以包括智能手机、平板电脑、个人数字助理PDA、销售终端POS或车载电脑等。为了便于说明，仅示出了与本发明实施例相关的部分。

该语音数据的录音装置包括：第一语音数据录制单元21、第一语音数据识别单元22、文本比较单元23、第二语音数据录制单元24、语音数据替换单元25。其中：

第一语音数据录制单元21，用于录制录音人员根据第一文本得到的第一语音数据。

第一语音数据识别单元22，用于识别所述第一语音数据，得到第二文本。

文本比较单元23，用于将所述第一文本和所述第二文本比较，并标识所述第一文本和所述第二文本不同的文本信息。

可选地，为了便于用户快速查看到两个文本不同的文本信息，所述文本比较单元23包括：

第一不同的文本信息确定模块，用于将所述第一文本和所述第二文本比较，确定所述第一文本和所述第二文本不同的文本信息。

颜色标识模块，用于在所述第一文本上以鲜艳颜色标识确定的文本信息和/或在所述第二文本上以鲜艳颜色标识确定的文本信息。上述鲜艳颜色是指，与显示第一文本(或第二文本)的文本信息的颜色不同且鲜艳的颜色。

第二不同的文本信息确定模块，用于将所述第一文本和所述第二文本比较，确定所述第一文本和所述第二文本不同的文本信息。

指定符号标识模块，用于在所述第一文本上以指定符号或指定字体标识确定的文本信息和/或在所述第二文本上以指定符号或指定字体标识确定的文本信息。其中，指定符号包括星号(如“※”)，三角形、矩形等符号。在指定符号为星号时，在确定的所述第一文本和所述第二文本不同的文本信息的同一行批注“※”，以标识所述第一文本和所述第二文本不同的文本信息。

第二语音数据录制单元24，用于录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据。

可选地，为了保证同一句语音数据的声音信息(如语速、语调等)相同，所述第二语音数据录制单元24包括：

整句的文本信息判断模块，用于判断所述第一文本和所述第二文本不同的文本信息是否为整句的文本信息。具体地，判断所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息，且与包括的该其他文本信息之间是否包括标点符号，若包括标点符号，则判定为非整句的文本信息，否则，判定为整句的文本信息。或者，通过判断所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息，且与包括的该其他文本信息的语义是否相同，若相同，判定为整句的文本信息，否则，判定为非整句的文本信息。

整句的文本信息处理模块，用于在所述第一文本和所述第二文本不同的文本信息为整句的文本信息，录制所述第一文本和所述第二文本不同的文本信息的第二语音数据。

非整句的文本信息处理模块，用于在所述第一文本和所述第二文本不同的文本信息不为整句的文本信息，录制包括所述第一文本和所述第二文本不同的文本信息所在的整句的文本信息的第二语音数据。

可选地，该语音数据的录音装置包括：

提示单元，用于确定第二语音数据的声音信息(如语速、语调、声音频率等)，获取第一语音数据的声音信息，再将第二语音数据的声音信息与第一语音数据的声音信息比较，并在第二语音数据的声音信息与第一语音数据的声音信息的差大于预设的阈值时，发出重录制第二语音数据的提示。

语音数据替换单元25，用于将所述第二语音数据替换所述第一语音数据中对应的语音数据，得到最终的语音数据。

可选地，为了能够准确替换第一语音数据中对应的语音数据，该语音数据的录音装置包括：

时间轴信息确定单元，用于确定包括标识的文本信息对应的时间轴信息。其中，时间轴信息包括标识的文本信息的开始和结束的时间信息。需要指出的是，所述包括标识的文本信息对应的时间轴信息包括2种情况，1种是只为标识的文本信息的开始和结束的时间信息，另1种是标识的文本信息所在的整句的开始和结束的时间信息。

对应地，所述语音数据替换单元具体包括：

本发明第二实施例中，由于无需通过人工听音、修音、测试来查找录制的语音数据是否存在错误，因此，简化了操作步骤，提高了录音效率。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种语音数据的录音方法，其特征在于，所述方法包括：

录制录音人员根据第一文本得到的第一语音数据；

识别所述第一语音数据，得到第二文本；

2.根据权利要求1所述的方法，其特征在于，所述将所述第一文本和所述第二文本比较，并标识所述第一文本和所述第二文本不同的文本信息，具体包括：

将所述第一文本和所述第二文本比较，确定所述第一文本和所述第二文本不同的文本信息；

在所述第一文本上以鲜艳颜色标识确定的文本信息和/或在所述第二文本上以鲜艳颜色标识确定的文本信息。

3.根据权利要求1所述的方法，其特征在于，所述将所述第一文本和所述第二文本比较，并标识所述第一文本和所述第二文本不同的文本信息，具体包括：

在所述第一文本上以指定符号或指定字体标识确定的文本信息和/或在所述第二文本上以指定符号或指定字体标识确定的文本信息。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据，具体包括：

判断所述第一文本和所述第二文本不同的文本信息是否为整句的文本信息；

在所述第一文本和所述第二文本不同的文本信息为整句的文本信息，录制所述第一文本和所述第二文本不同的文本信息的第二语音数据；

在所述第一文本和所述第二文本不同的文本信息不为整句的文本信息，录制包括所述第一文本和所述第二文本不同的文本信息所在的整句的文本信息的第二语音数据。

5.根据权利要求4所述的方法，其特征在于，在所述将所述第一文本和所述第二文本比较，并标识所述第一文本和所述第二文本不同的文本信息时，包括：

确定包括标识的文本信息对应的时间轴信息；

对应地，所述将所述第二语音数据替换所述第一语音数据中对应的语音数据，得到最终的语音数据，具体包括：

6.一种语音数据的录音装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述文本比较单元包括：

第一不同的文本信息确定模块，用于将所述第一文本和所述第二文本比较，确定所述第一文本和所述第二文本不同的文本信息；

颜色标识模块，用于在所述第一文本上以鲜艳颜色标识确定的文本信息和/或在所述第二文本上以鲜艳颜色标识确定的文本信息。

8.根据权利要求6所述的装置，其特征在于，所述文本比较单元包括：

第二不同的文本信息确定模块，用于将所述第一文本和所述第二文本比较，确定所述第一文本和所述第二文本不同的文本信息；

指定符号标识模块，用于在所述第一文本上以指定符号或指定字体标识确定的文本信息和/或在所述第二文本上以指定符号或指定字体标识确定的文本信息。

9.根据权利要求6至8任一项所述的装置，其特征在于，所述第二语音数据录制单元包括：

整句的文本信息判断模块，用于判断所述第一文本和所述第二文本不同的文本信息是否为整句的文本信息；

整句的文本信息处理模块，用于在所述第一文本和所述第二文本不同的文本信息为整句的文本信息，录制所述第一文本和所述第二文本不同的文本信息的第二语音数据；

10.根据权利要求9所述的装置，其特征在于，所述装置包括：

时间轴信息确定单元，用于确定包括标识的文本信息对应的时间轴信息；

对应地，所述语音数据替换单元具体包括：