CN102568524A

CN102568524A - 一种音频信息的输出方法及系统

Info

Publication number: CN102568524A
Application number: CN2010106184443A
Authority: CN
Inventors: 不公告发明人
Original assignee: Shanghai Liangming Technology Development Co Ltd
Current assignee: Shanghai Liangming Technology Development Co Ltd
Priority date: 2010-12-30
Filing date: 2010-12-30
Publication date: 2012-07-11
Anticipated expiration: 2030-12-30
Also published as: CN102568524B

Abstract

本发明的目的是提供一种音频信息的输出方法及系统，属于计算机、软件技术领域。所述的方法包括有如下步骤：步骤1，采集音频信息；步骤2，将音频信息按照比例关系进行分割；步骤3，将分割后的两份及两份以上的音频信息混合着输出。在本发明中，提供一种新型的音频信息的处理方式，可应用于各种具有音频成分的数据内容。在使用中，除了应用于语音学习之外，也应用于包含有声音信息的其它各种场景。利用本发明，能够获得具有混合效果的、效率更高的音频信息的输出方式。

Description

一种音频信息的输出方法及系统

技术领域

本发明属于计算机、软件技术领域。

技术背景

在目前的文化交流和经济交流中，人们经常会学习多种语言，学习语言的方式，有各种各样的途径。其中，对语音信息的理解与分析能力，在人们的交流中地位重要。如何向人们提供良好的语音学习方式，一直是人们所探讨的重要问题。

在本发明中，我们提供一种新型的音频信息的处理方式。除了应用于语音学习之外，也应用于声音的其它场景。

发明内容

本发明的目的，是提供一种音频信息的输出方法，以及配套的系统，利用本发明，能够获得具有混合效果的、效率更高的音频信息的输出方式。

一种音频信息的输出方法，该方法包括有如下步骤：

步骤1，采集音频信息；

步骤2，将音频信息按照比例关系进行分割；

步骤3，将分割后的两份及两份以上的音频信息混合着输出。

进一步，长度不一样的音频信息同时播放时，长度短的音频信息可循环着进行信息播放。

进一步，所述的音频信息的分割方式，是以分割比例为整数的方式进行分割，该整数是大于或等于2的整数形式。

进一步，所述的音频信息的分割方式，是以音频的时间总长度为参考量进行分割。

进一步，所述的音频信息的分割方式，对于字符内容来说，以独立的字符作为分割的信息单位。

进一步，所述的音频信息的分割方式中，进行音频分割的比例是分数。

进一步，所述的音频信息的分割方式中，对于人类语言内容来说，以声音来源的方式，来进行音频数据的分割。

进一步，在混合多种音频信息进行输出的时候，对混合的音频信息之间作时间间隔。

进一步，在混合多种音频信息进行输出的时候，将分段后的音频信息，采用随机的方式进行混合输出。

进一步，在混合多种音频信息进行输出的时候，进行分段之后，采用多音频效果的方式进行音频源转变，再进行音频数据的混合输出。

本发明还提供一种音频信息的输出系统，该系统包括：

音频信息采集模块，用以采集音频信息；

音频信息分割模块，用以将音频信息按照比例关系进行分割；

分割信息输出模块，将分割后的两份及两份以上的音频信息混合着输出。

附图说明

图1是本发明中，一段音频信息的示意图。

图2是本发明中，一段音频信息被非均匀分割为5段的示意图。

图3是本发明中，5段音频信息被同时播放的示意图，与图1、图2所示的实施例相对应。

图4是本发明所述方法的流程图。

图5是本发明所述系统的结构框图。

具体实施例

为了对本发明更好地进行说明，作为举例而非限定，将本发明的思想描述如下：

在生活中，声音信息经常是混合着输出的，比如，我们可以同时听到多人的谈话。因此，可以通过将音频信息进行分段处理，然后混合着进行输出，来同时输出多段的声音信息，从而提高用户获得音频内容的效率，或用以营造相应的声音环境。

下面结合着附图，对本发明进行详细描述。

本发明所描述的方法，包括有如下步骤：

步骤1，采集音频信息。

在该步骤中，主要是采集音频信息内容，作为进行本发明所描述的音频处理方式的基础数据。

需要指出的是，音频信息的载体形式，是多种多样的。可以仅仅是音频信息，也可以是多媒体信息，或者是和特定程序相关联或者和特定文档相关联的语音信息内容，等等。另外，音频信息的格式，也是不做任何限定的。这些包括有音频信息形式的数据内容，都可以应用于本发明。

采集音频信息的方式，除了直接载入音频信息的内容之外，另外，在本发明中，还可以直接通过包括麦克风在内的音频信息采集工具，通过录制声音信息的方式来采集。

所获得的音频信息内容，供接下来的数据处理之用。

步骤2，将音频信息按照比例关系进行分割。

在该步骤中，我们需要对上一步骤所采集获得的音频信息，按照预设的比例方式，对其进行分割处理，从而形成不同的音频信息段。

下面对能够应用于本发明的音频信息的多种分割方式，进行描述：

方式2-1：分割比例为整数的方式进行分割。

对这种方式进行举例说明：

比如说，一段长度为10分钟的音频信息，我们可以以时间的总量来作为待分隔的音频信息的数据总量，然后，我们设定分割比例为五等分，于是，该10分钟的音频信息，就被分成了五等份，每份包括有长度为2分钟的音频信息内容。

在该类实施例中，所述的整数，应当是大于或等于2的整数形式。具体实施时，如果混合输出的音频信息种类过多的话，也不利于用户对音频信息的有效接收。作为举例而非限定，在常规的应用中，我们可将该整数的上限设定为100，也就是说，可以将音频信息的数据总量，比如时间长度总量，分割为100份，或者分割为100份之内。

方式2-2：分割时，以音频的时间总长度为参考量进行分割。

前面所描述的方式2-1，所进行分割的参考量，就是以时间总长度为基础进行分割的。这是一种便于实施的方式，但并不是唯一的方式。下面会有其它方式的描述。

方式2-3：对于字符内容来说，以独立的字符作为分割的信息单位。

声音信息具有各种各样的信息形式，比如音乐演奏信息、大自然发出的各种声音、机器发出的声音，等等。

但在用户的特定用途中，比如语言的学习中，其声音信息一般和字符内容直接相对应，语音就是基于相应的字符产生的。

于是，对于字符类型的语音信息来说，还可以有专门的基于字符来实现的音频数据的分割方式。

该方式的核心在于：以“字符”而基本单位，来进行字符所对应的音频内容的分割。

在具体实施时，对于音频源包括有对应已存在字符的信息来说，直接采集其对应的字符信息，以及字符信息所对应的音频信息。进而，通过字符与相应声音进行配套的方式，来进行分割。

这种情况下，需要以独立的单个字符为基本的信息单位，来完成信息的分割处理。

原因在于：每个字符的发音长度，都可能会有区别。也就是说，我们任意选择一百个各不相同的字符，它们对应的发音长度也可能会各不相同。于是，可以将每个字符视作为一个独立的字符单元，然后，找出与其对应的音频信息就可以了。

处理的方式，可以基于独立的字符进行独立发音，也可以将每个字符所对应的音频信息，从总的音频数据中进行分割。

具体实现方式是不限定的。比如，可以通过字符发音强度变化的方式进行分割，也可以通过内容智能识别的方式进行分割，等等。

将独立的字符和独立的音频信息进行对应之后，就相当于对每个字符进行了音频信息分段，然后，就可以在此基础上，进行任意字符所对应的音频信息的混合输出了。

比如说，100个字符共对应有100个独立的音频信息段，每个字符即是一个音频信息段。于是，我们可以分成五等份，每个等份共包括有20个字符。

当输出的音频信息，开始输出第一等份的第一个字符时，第二等份、第三等份、第四等份、第五等份中的第一个字符的音频信息，就可以混合着进行输出了，这种情况下，就同步输出了5个字符的音频信息；进一步，当第一等份的第二个字符进行音频信息的输出时，第二等份、第三等份、第四等份、第五等份中的第二个字符的音频信息，也都可以混合着进行输出；以此类推，可以将进行分割后的字符所对应的声音，均混合着进行输出。

当然，具体的排序方式是并不限定的。

方式2-4：进行音频分割的比例，也可以是分数。

这种情况下，可能会造成分割后的音频信息，其播放的时间长度不均衡，这可以通过将长度短的信息加速播放的方式，来解决。

比如：有一段30分钟的音频信息，按照2/3的比例进行分割，于是，前一部分音频信息的时间长度为20分钟，后一部分音频信息的时间长度为10分钟，两者可以同步播放，只是后一部分的信息，循环着进行信息播放就可以了。

也就是说，对于音频长度短的信息内容，可以在一遍播放之后，再进行第二遍的播放，根据需要，还可以包括有第三遍，以及更多的遍数，直到前一部分的播放时间结束。当然，长度短的音频信息，并不需要进行全部播放完，可以播放了什么地方，就在什么地方停止。

方式2-5：对于人类语言内容来说，可以以声音来源的方式，来进行音频数据的分割。

这种情况下，就需要识别声音数据的来源，来进行有效分割。

作为举例而非限定，进行的步骤为：

步骤A1，采集音频信息；

步骤A2，识别所对应的音频源；

步骤A3，将不同的音频源下所对应的音频信息，作为独立的分割后的音频信息。

利用这种方式，来处理语音内容尤其有用。

这种方式，主要是分辨出不同声音源，然后，将各个独立声音源所发出的声音，来作为独立的分段信息。

比如说，共有五个人发出声音信息，那么，就可以将这五个人发出的

步骤3，将分割后的两份及两份以上的音频信息混合着输出。在该步骤中，根据用户的需要，或者用户的设定情况，或者服务提供商设定的情况，来将两份以及两份以上的音频信息混合着进行输出。前面已经描述了与本步骤相对应的实施例。下面，做进一步的描述。方式3-1：在混合多种音频信息的时候，可以对混合的音频信息作时间间隔。

比如说，设置有五等份的音频信息，它们的音频时间长度相同，各有10分钟。于是，就可以在刚开始的时候，输出第一等份的音频信息；过了10秒之后，混合着输出第二等份的音频信息；再过上10秒之后，输出第三等份的音频信息，依此类推，直到输出全部的音频信息。

方式3-2：可以将分段后的音频信息，采用随机的方式进行混合输出。

比如说，以字符为单位进行分割的音频信息，假如共包括100个字符的话，那么，就对应着100段的音频信息。于是，就可以将这100段的音频信息，每次混合着输出5个段，这5段音频信息的选择方式，可以按照预设的方式进行，也可以按照随机的方式进行。作为应用上的举例，这种形式，对于学习语言字符，比如英文单词，是很有用的。

比如，共有100个字符，代表着用户需要学习的100个英文单词。按照常规的方式，一次输出1个英文单词的音频信息的话，那么，用户一次只可以听到一个英文单词。实际上，在用户进行复习单词的时候，完全可以同步听多个单词，于是，就可以以同步或者接近同步的方式，同时输出5个英文单词的发音。

于是，前述的100个英文单词，也仅仅需要20次的音频输出，就可以全部输出一遍了。利用本发明，用户仅仅用了原来时间的百分之二十，就可以完成整体语音内容的复习工作了。这种方式，大幅度地提高了用户的效率。

当然，用户通过该方式，还可以将一整篇需要学习的英语文章，分割成多段，直接混合着进行输出，形成一个具有音频源混合效果的语言环境，有利于用户对语感的培养及学习。

方式3-3：进行分段之后，采用多音频效果的方式进行音频源转变，再进行音频数据的混合输出。

比如，一段音频数据被分成五段，然后，每段采用一位不同的人员进行朗读，或者，同一人员采用不同语调朗读，或者，分别设置不同的背景声音。进而，以这些具有变化形式的音频数据为基础，进行音频数据的混合输出。

再结合附图，进行说明。

参图1所示，这儿展示了一段音频信息100。参图2所示，在该实施例中，前述的一段音频信息100被非均匀分割为5段，有的音频段长一些，有的音频段短一些。参图3所示，这儿展示的是5段音频信息被同时播放的示意图。该图中所示的实施例中，音频信息的长度长的话，会较晚结束播放，音频信息短的话，会较早结束播放。

参图5所述，本发明还提供了一种与前述方法想对应的系统，该系统包括：

音频信息采集模块200，用以采集音频信息；

音频信息分割模块210，用以将音频信息按照比例关系进行分割；

分割信息输出模块220，将分割后的两份及两份以上的音频信息混合着输出。

该系统中的各个技术细节，与前述的方法相一致。

以上是对本发明的描述而非限定，基于本发明思想的其它实施例，亦均在本发明的保护范围之中。

Claims

1.一种音频信息的输出方法，其特征在于该方法包括有如下步骤：

步骤1，采集音频信息；

步骤2，将音频信息按照比例关系进行分割；

步骤3，将分割后的两份及两份以上的音频信息混合着输出。

2.根据权利要求1所述的一种音频信息的输出方法，其特征在于：长度不一样的音频信息同时播放时，长度短的音频信息可循环着进行信息播放。

3.根据权利要求1所述的一种音频信息的输出方法，其特征在于：所述的音频信息的分割方式，是以分割比例为整数的方式进行分割，该整数是大于或等于2的整数形式。

4.根据权利要求1所述的一种音频信息的输出方法，其特征在于：所述的音频信息的分割方式，是以音频的时间总长度为参考量进行分割。

5.根据权利要求1所述的一种音频信息的输出方法，其特征在于：所述的音频信息的分割方式，对于字符内容来说，以独立的字符作为分割的信息单位。

6.根据权利要求1所述的一种音频信息的输出方法，其特征在于：所述的音频信息的分割方式中，进行音频分割的比例是分数。

7.根据权利要求1所述的一种音频信息的输出方法，其特征在于：所述的音频信息的分割方式中，对于人类语言内容来说，以声音来源的方式，来进行音频数据的分割。

8.根据权利要求1所述的一种音频信息的输出方法，其特征在于：在混合多种音频信息进行输出的时候，对混合的音频信息之间作时间间隔。

9.根据权利要求1所述的一种音频信息的输出方法，其特征在于：在混合多种音频信息进行输出的时候，将分段后的音频信息，采用随机的方式进行混合输出。

10.根据权利要求1所述的一种音频信息的输出方法，其特征在于：在混合多种音频信息进行输出的时候，进行分段之后，采用多音频效果的方式进行音频源转变，再进行音频数据的混合输出。

11.一种音频信息的输出系统，其特征在于该系统包括：

音频信息采集模块，用以采集音频信息；