WO2014101169A1

WO2014101169A1 - 提供增强音频数据流的方法及装置

Info

Publication number: WO2014101169A1
Application number: PCT/CN2012/088005
Authority: WO
Inventors: 孟剑强; 刘明刚; 张江红
Original assignee: 北京印声科技有限公司
Priority date: 2012-12-31
Filing date: 2012-12-31
Publication date: 2014-07-03
Also published as: CN104871243A; HK1214025A1

Abstract

一种提供增强音频数据流的方法及其装置。该方法包括：获取原始音频数据流（S110），生成与所述原始音频数据流相关的高频数字信号（S120），并合成所述高频数字信号与所述原始音频数据流（S130），以获得所述增强音频数据流。

Description

提供增强音频数据流的方法及装置技术领域

本发明涉及音频技术，更具体地，涉及提供增强音频数据流的方法及装置。背景技术

人耳可以听到的声音的频率范围是 20赫兹（Hz )到 20000赫兹，其中，频率范围 2500Hz到 20kHz是高音频段。随着年龄的增加，人耳可以听到高音频段的声音的能力逐渐减弱甚至丧失。成年人一般能听到的声音的上限大约为 16kHz。

频率超过 20kHz的声音被称为超声波。超声波在空气中传输的特点是衰减大、在封闭空间中的多途效应明显。处于低频段的超声波的反射能力较强，而透射能力较弱。

通常，用于播放的音频数据，例如广告、电影、电视、节目、音乐中的音频数据等，其频率并不超过 16kHz, 以方便用户收听。

随着技术的发展，大多数可用于播放音频数据的设备都能够播放频率接近或超过 20kHz的高音频段的声音或超声波。此外，也出现了能够接收高音频段的声音或超声波的接收装置，例如基于声学微机电技术的硅晶麦克风。目前，大多数终端设备都采用这种接收装置，从而大大提高终端设备的声音感知能力。

如前所述，音频数据通常仅包含在人耳可听见的频率范围中的音频数据。如果接收音频数据的用户想要进一步知道与所播放的音频数据有关的信息，则只能通过其它途径获取，而不能实时地获取。对于提供音频数据的提供商来说，也无法知道用户的需求。发明内容

本发明正是鉴于上述的技术问题而提出的，其目的在于提供一种提供增强音频数据流的方法及装置，其能够使用户实时地获取与原始音频数据流相关的信息。

根据本发明的一个方面，提供了一种提供增强音频数据流的方法，其包括：获取原始音频数据流；生成与所述原始音频数据流相关的高频数字信号；以及合成所述高频数字信号与所述原始音频数据流，以获得所述增强音频数据流。

在一个实施例中，生成与原始音频数据流相关的高频数字信号可包括: 确定与原始音频数据流的内容相关的补充内容；生成与补充内关的信息；将所述信息编码成数字信号；以及在高频段中调制数字信号，以获得高频数字信号。

在一个实施例中，合成高频数字信号与原始音频数据流可包括：选择原始音频数据流的至少一个部分；以及按照所述至少一个部分的长度，将一个或多个高频数字信号与所述至少一个部分进行合成。

根据本发明的另一个方面，提供了一种提供增强音频数据流的装置，其包括：获取模块，其被配置为获取原始音频数据流；生成模块，其被配置为生成与所述原始音频数据流相关的高频数字信号；以及合成模块，其被配置为合成所述高频数字信号与所述原始音频数据流，以获得所述增强音频数据流。附图说明

图 1是根据本发明的一个实施例的提供增强音频数据流的方法的流程图；

图 2是图 1的实施例中生成高频数字信号的示意性¾½图；

图 3是示例性的说明高频数字信号的格式的示意图；

图 4是根据本发明的一个实施例的提供增强音频数据流的装置的示意性方框图。具体实施方式相信通过以下结合附图对本发明的具体实施方式的详细描述，本发明的上述和其它目的、特征和优点将更加清楚。

图 1示出了根据本发明的一个实施例的提供增强音频数据流的方法的流程图。下面结合附图，对本实施例进行详细描述。

如图 1所示，在步骤 S110, 获取原始音频数据流。在本实施例中，原始音频数据流是包含将要播放的内容的音频数据，其频率通常在人耳可听见的声音的频率范围内。原始音频数据流可由音频内容的内供商提供。在某些实施例中，原始音频数据流可以是广告的音频数据、音乐的音频数据等。

接着，在步骤 S120, 生成与所获取的原始音频数据目关的高频数字信号。在本实施例中，高频数字信号是指频率在高频段内的数字信号。图 2示出了生成高频数字信号的示意性流程图。

如图 2所示，首先，在步骤 S210, 确定与原始音频数据流的内容相关的补充内容。例如，如果原始音频数据流是关于某个广告的音频数据，则补充内容可以是与该广告相关的信息，例如该广告所针对的产品的优惠信息、购买信息等。如果原始音频数据流是关于某个歌曲或乐曲的音频数据，则补充内容可以是与歌曲或乐曲相关的信息，例如歌曲或乐曲的演唱者或演奏者、专辑名称、歌词等。

然后，在步骤 S220, 基于所确定的补充内容，生成相关的信息。在本实施例中，相关的信息可以包括存储有补充内容的网络地址和 /或与补充内容有关的文本信息。网络地址例如是指示补充内容的位置的统一资源定位符（URL ) 。文本信息例如是简要描述补充内容的文本。当然，本领域的普通技术人员能够理解，相关的信息还可以包括其它信息，例如补充内容涉及的品牌、播放地区、播放类型等。

在步骤 S230, 将在步骤 S220中生成的信息编码成数字信号。在一个实施例中，数字信号可包括 "总帧数" 字段、 "帧序列号" 字段、 "播放地区" 字段、 "品牌" 字段、 "分类" 字段、 "播放类型" 字段、 "网络地址" 字段、 "有效期" 字段、 "编码方式" 字段、 "简要信息" 字段和 "校臉" 字段。在该数字信号中， "总帧数" 字段可表明构成数字信号的帧的总个数； "帧序列号" 字段可表明帧在数字信号中的位置； "播放地区" 字段可定义补充内容可被播放的地理区域； "品牌" 字段可定义补充内容所涉及的产品的品牌； "分类" 字段可定义补充内容的分类； "播放类型" 字段可定义补充内容被播放的类型，例如影院播放、电视播放、因特网播放等； "网络地址" 字段可定义补充内容的网络地址； "有效期" 字段可定义补充内容的播放有效期； "编码方式" 字段可定义数字信号的编码格式和内容； "简^ ft息" 字段可定义补充内容的简要描述； "校验" 字段可指示校臉的类型，例如循环冗余检验 ( CRC ) 。

对于本领域的普通技术人员来说，容易知道数字信号除了包括上述的字段外，还可以包括其它字段。

图 3示出了数字信号的格式的一个实例。在该例子中，数字信号使用了两个 128位的帧。第一帧的格式如图 3 ( a )所示，其中， "总帧数" 字段是 3位的字段， "帧序列号" 字段是 3位的字段， "播放地区" 字段是 18位的字段， "品牌"字段是 16位的字段， "分类"字段是 12位的字段， "播放类型" 字段是 8位的字段， "网络地址" 字段是 22位的字段， "有效期" 字段是 16位的字段， "编码方式" 字段是 4位的字段， "校验" 字段是 26位的字段。第二帧的格式如图 3 ( b )所示，其中， "总帧数" 字段和 "帧序列号"字段分别是 3位的字段， "简要信息"字段是 96位的字段， "校验" 字段是 26位的字段。

在一个实施方式中，数字信号可以仅包括第一帧。在这种情况下，第一帧中的 "总帧数" 字段的值为 1 , "帧序列号" 字段的值为 0。

在另一个实施方式中，数字信号可以包括第一帧和至少一个第二帧。在这种情况下，第一帧和每个第二帧中的 "总帧数" 字段的值为第一帧和第二帧的个数之和。

虽然以上给出了数字信号的格式的一个例子，但本领域的普通技术人员能够知道，数字信号也可以使用其它格式。

返回到图 2, 在步骤 S240, 在高频段中调制在步驟 S230中获得的数字信号，以获得高频数字信号。在本实施例中，高频段可以是高音频段或超声波频段。优选地，高频段是 18kHz到 22kHz的频率范围。

一般地，信号的调制可包括信号的幅度调制（ ASK )、频率调制（ FSK ) 和相位调制（PSK )等。在本实施例中，可使用频率调制或相位调制。

在使用频率调制的情况下，可在高频段中选择两个频率点以分别代表 0和 1，从而进行数字信号的频率调制。

在使用相位调制的情况下，可在高频段中选择一个频率点，通 it^反的两个载波相位代表 0和 1，从而进行数字信号的相位调制。

返回到图 1，在生成了高频数字信号后，在步骤 S130, 合成所生成的高频数字信号与原始音频数据流，以获得增强音频数据流。

在本实施例中，通过线性叠加来合成高频数字信号和原始音频数据流。通常，原始音频数据流采用 16位脉冲编码调制（PCM )进行编码。在进行合成时，为了不引入新的噪声，合成后的增强音频数据流的幅度不超过 16位 PCM编码的范围。

在该步骤中，首先，选择原始音频数据流的至少一个部分。所选择的部分可以是原始音频数据流的一部分或者多个部分或者全部。然后，按照所选择的至少一个部分的每一个的长度，将一个或多个高频数字信号与该部分的音频数据流进行合成。具体地，根据所选择的每个部分的音频数据流的长度以及高频数字信号的长度，确定可与该部分的音频数据流合成的高频数字信号的个数，然后将这些个数的高频数字信号与该部分的音频数据流进行合成。

所合成的增强音频数据流可被播放，并可被终端设备的麦克风接收。终端设备通过对所接收的增强音频数据流进行信号采样、检测和估计，恢复高频数字信号，然后对其进行解码以获得补充内容的网络地址和 /或文本信息等，从而能够访问补充内容的网络地址以获得补充内容，或者在终端设备上显示文本信息。

通过以上描述可以看出，本实施例的提供增强音频数据流的方法通过高频数字信号，能够使接收原始音频数据流的用户实时地获取相关的信息。本实施例的方法可用于例如广告、电影、电视等中的音频数据流的提供。

在同一个发明构思下，图 4示出了根据本发明的一个实施例的提供增强音频数据流的装置 400的示意性方框图。以下结合附图，对本实施例进行详细说明，其中对于与前面实施例相同的部分，适当省略其说明。

如图 4所示，本实施例的装置 400包括：获^ ^块 401 , 其获取原始音频数据流；信号生成模块 402, 其生成与所获取的原始音频数据目关的高频数字信号；以及合成模块 403, 其合成所生成的高频数字信号与原始音频数据流，以获得增强音频数据流。

在本实施例的装置 400中，在获取模块 401获取了原始音频数据流之后，在信号生成模块 402中，确定单元 4021确定与原始音频数据流中的内容相关的补充内容。如前所述，当原始音频数据流中的内容是广告时，则补充内容可以是该广告所涉及的产品的优惠信息等。接着，信息生成单元 4022生成与补充内^"关的信息，例如，指示补充内容的存储位置的网络地址、简要描述补充内容的文本信息等。编码单元 4023将所生成的信息编码成数字信号。在一个实施例中，数字信号可以包含如前所述的字段，并可使用如图 3所示的格式。在编码单元 4023编码生成数字信号后，调制单元 4024在高频段中调制该数字信号，以获得高频数字信号。优选地，高频段可以是 18kHz到 22kHZ的频率范围。调制单元 4024可以使用频率调制或相位调制来对数字信号进行调制。

然后，高频数字信号被提供给合成模块 403。在合成模块 403中，选择单元 4031选择原始音频数据流的至少一个部分。具体地，选择单元 4031 可以选择原始音频数据流的一部分或多个部分或全部，作为将被合成的部分。接着，合成单元 4032按照所选择的至少一个部分的每一个的长度，将一个或多个高频数字信号与该部分进行合成。在合成单元 4032中，对于所选择的每一个部分的音频数据流，根据该部分的音频数据流的长度和高频数字信号的长度，确定可与该部分的音频数据流合成的高频数字信号的个数，然后将这些个数的高频数字信号与该部分的音频数据流进行合成。合成单元 4032可通过线性叠加来合成高频数字信号和原始音频数据流。

应当指出，本实施例的提供增强音频数据流的装置 400在操作上能够实现图 1所示的实施例的提供增强音频数据流的方法。本实施例的装置 400 可用于例如广告、电影等中的音频数据流的提供。

以上所公开的实施例的方法可以在软件、硬件、或软件和硬件的结合中实现。硬件部分可以利用专用逻辑来实现。例如，上述实施例中的提供增强音频数据流的装置及其各个组成部分可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合实现。软件部分可以存储在存储器中，由适当的指令执行系统，例如微处理器、个人计算机 ( PC )或大型机来执行。

以上虽然通过示例性的实施例详细描述了本发明的提供增强音频数据流的方法及装置，但是以上这些实施例并不是穷举的，本领域技术人员可以在本发明的精神和范围内实现各种变化和修改。因此，本发明并不限于这些实施例，本发明的范围仅由所附的权利要求限定。

Claims

权利要求

1. 一种提供增强音频数据流的方法，包括：

获取原始音频数据流；

生成与所述原始音频数据流相关的高频数字信号；以及

合成所述高频数字信号与所述原始音频数据流，以获得所述增强音频数据流。

2.根据权利要求 1所述的方法，其中，生成与所述原始音频数据流相关的高频数字信号包括：

确定与所述原始音频数据流的内^目关的补充内容；

生成与所述补充内^ ^关的信息；

将所述信息编码成数字信号；以及

在高频段中调制所述数字信号，以获得所述高频数字信号。

3.根据权利要求 2所述的方法，其中，所述信息包括存储有所述补充内容的网络地址以及与所述补充内关的文本信息中的至少一个。

4.根据权利要求 2所述的方法，其中，所述高频段是从 18kHz到 22kHz 的频率范围。

5.根据权利要求 1所述的方法，其中，合成所述高频数字信号与所述原始音频数据流包括：

选择所述原始音频数据流的至少一个部分；以及

按照所述至少一个部分的长度，将一个或多个所述高频数字信号与所述至少一个部分进行合成。

6. 一种提供增强音频数据流的装置，包括：

获取模块，其被配置为获取原始音频数据流；

信号生成模块，其被配置为生成与所述原始音频数据目关的高频数字信号；以及

合成模块，其被配置为合成所述高频数字信号与所述原始音频数据流，以获得所述增强音频数据流。

7.根据权利要求 6所述的装置，其中，所述信号生成模块包括：确定单元，其被配置为确定与所述原始音频数据流的内容相关的补充内容；

信息生成单元，其被配置为生成与所述补充内容有关的信息；编码单元，其被配置为将所述信息编码成数字信号；以及

调制单元，其被配置为在高频段中调制所述数字信号，以获得所述高频数字信号。

8.根据权利要求 7所述的装置，其中，所述信息包括存储所述补充内容的网络地址以及与所述补充内^ "关的文本信息中的至少一个。

9.根据权利要求 7所述的装置，其中，所述高频段是从 18kHz到 22kHz 的频率范围。

10.根据权利要求 6所述的装置，其中，所述合成模块包括：

选择单元，其被配置为选择所述原始音频数据流的至少一个部分；以及

合成单元，其被配置为按照所述至少一个部分的长度，将一个或多个所述高频数字信号与所述至少一个部分进行合成。