CN104871243A - 提供增强音频数据流的方法及装置 - Google Patents

提供增强音频数据流的方法及装置 Download PDF

Info

Publication number
CN104871243A
CN104871243A CN201280077909.6A CN201280077909A CN104871243A CN 104871243 A CN104871243 A CN 104871243A CN 201280077909 A CN201280077909 A CN 201280077909A CN 104871243 A CN104871243 A CN 104871243A
Authority
CN
China
Prior art keywords
data stream
audio data
original audio
frequency digital
digital signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280077909.6A
Other languages
English (en)
Inventor
孟剑强
刘明刚
张江红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN104871243A publication Critical patent/CN104871243A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种提供增强音频数据流的方法及相应的装置。在该方法中,获取原始音频数据流,生成与所述原始音频数据流相关的高频数字信号,并合成所述高频数字信号与所述原始音频数据流,以获得所述增强音频数据流。

Description

提供增强音频数据流的方法及装置 技术领域
本发明涉及音频技术, 更具体地, 涉及提供增强音频数据流的方法及 装置。 背景技术
人耳可以听到的声音的频率范围是 20赫兹(Hz )到 20000赫兹, 其 中, 频率范围 2500Hz到 20kHz是高音频段。 随着年龄的增加, 人耳可以 听到高音频段的声音的能力逐渐减弱甚至丧失。 成年人一般能听到的声音 的上限大约为 16kHz。
频率超过 20kHz的声音被称为超声波。超声波在空气中传输的特点是 衰减大、 在封闭空间中的多途效应明显。 处于低频段的超声波的反射能力 较强, 而透射能力较弱。
通常, 用于播放的音频数据, 例如广告、 电影、 电视、 节目、 音乐中 的音频数据等, 其频率并不超过 16kHz, 以方便用户收听。
随着技术的发展, 大多数可用于播放音频数据的设备都能够播放频率 接近或超过 20kHz的高音频段的声音或超声波。 此外, 也出现了能够接收 高音频段的声音或超声波的接收装置, 例如基于声学微机电技术的硅晶麦 克风。 目前, 大多数终端设备都采用这种接收装置, 从而大大提高终端设 备的声音感知能力。
如前所述, 音频数据通常仅包含在人耳可听见的频率范围中的音频数 据。 如果接收音频数据的用户想要进一步知道与所播放的音频数据有关的 信息, 则只能通过其它途径获取, 而不能实时地获取。 对于提供音频数据 的提供商来说, 也无法知道用户的需求。 发明内容
本发明正是鉴于上述的技术问题而提出的, 其目的在于提供一种提供 增强音频数据流的方法及装置, 其能够使用户实时地获取与原始音频数据 流相关的信息。
根据本发明的一个方面, 提供了一种提供增强音频数据流的方法, 其 包括: 获取原始音频数据流; 生成与所述原始音频数据流相关的高频数字 信号; 以及合成所述高频数字信号与所述原始音频数据流, 以获得所述增 强音频数据流。
在一个实施例中,生成与原始音频数据流相关的高频数字信号可包括: 确定与原始音频数据流的内容相关的补充内容; 生成与补充内 关的信 息; 将所述信息编码成数字信号; 以及在高频段中调制数字信号, 以获得 高频数字信号。
在一个实施例中, 合成高频数字信号与原始音频数据流可包括: 选择 原始音频数据流的至少一个部分; 以及按照所述至少一个部分的长度, 将 一个或多个高频数字信号与所述至少一个部分进行合成。
根据本发明的另一个方面, 提供了一种提供增强音频数据流的装置, 其包括: 获取模块, 其被配置为获取原始音频数据流; 生成模块, 其被配 置为生成与所述原始音频数据流相关的高频数字信号; 以及合成模块, 其 被配置为合成所述高频数字信号与所述原始音频数据流, 以获得所述增强 音频数据流。 附图说明
图 1是根据本发明的一个实施例的提供增强音频数据流的方法的流程 图;
图 2是图 1的实施例中生成高频数字信号的示意性¾½图;
图 3是示例性的说明高频数字信号的格式的示意图;
图 4是根据本发明的一个实施例的提供增强音频数据流的装置的示意 性方框图。 具体实施方式 相信通过以下结合附图对本发明的具体实施方式的详细描述, 本发明 的上述和其它目的、 特征和优点将更加清楚。
图 1示出了根据本发明的一个实施例的提供增强音频数据流的方法的 流程图。 下面结合附图, 对本实施例进行详细描述。
如图 1所示, 在步骤 S110, 获取原始音频数据流。 在本实施例中, 原 始音频数据流是包含将要播放的内容的音频数据, 其频率通常在人耳可听 见的声音的频率范围内。原始音频数据流可由音频内容的内 供商提供。 在某些实施例中, 原始音频数据流可以是广告的音频数据、 音乐的音频数 据等。
接着, 在步骤 S120, 生成与所获取的原始音频数据 目关的高频数字 信号。 在本实施例中, 高频数字信号是指频率在高频段内的数字信号。 图 2示出了生成高频数字信号的示意性流程图。
如图 2所示, 首先, 在步骤 S210, 确定与原始音频数据流的内容相关 的补充内容。 例如, 如果原始音频数据流是关于某个广告的音频数据, 则 补充内容可以是与该广告相关的信息, 例如该广告所针对的产品的优惠信 息、购买信息等。如果原始音频数据流是关于某个歌曲或乐曲的音频数据, 则补充内容可以是与歌曲或乐曲相关的信息, 例如歌曲或乐曲的演唱者或 演奏者、 专辑名称、 歌词等。
然后, 在步骤 S220, 基于所确定的补充内容, 生成相关的信息。 在本 实施例中,相关的信息可以包括存储有补充内容的网络地址和 /或与补充内 容有关的文本信息。 网络地址例如是指示补充内容的位置的统一资源定位 符(URL ) 。 文本信息例如是简要描述补充内容的文本。 当然, 本领域的 普通技术人员能够理解, 相关的信息还可以包括其它信息, 例如补充内容 涉及的品牌、 播放地区、 播放类型等。
在步骤 S230, 将在步骤 S220中生成的信息编码成数字信号。 在一个 实施例中, 数字信号可包括 "总帧数" 字段、 "帧序列号" 字段、 "播放 地区" 字段、 "品牌" 字段、 "分类" 字段、 "播放类型" 字段、 "网络 地址" 字段、 "有效期" 字段、 "编码方式" 字段、 "简要信息" 字段和 "校臉" 字段。 在该数字信号中, "总帧数" 字段可表明构成数字信号的 帧的总个数; "帧序列号" 字段可表明帧在数字信号中的位置; "播放地 区" 字段可定义补充内容可被播放的地理区域; "品牌" 字段可定义补充 内容所涉及的产品的品牌; "分类" 字段可定义补充内容的分类; "播放 类型" 字段可定义补充内容被播放的类型, 例如影院播放、 电视播放、 因 特网播放等; "网络地址" 字段可定义补充内容的网络地址; "有效期" 字段可定义补充内容的播放有效期; "编码方式" 字段可定义数字信号的 编码格式和内容; "简^ ft息" 字段可定义补充内容的简要描述; "校验" 字段可指示校臉的类型, 例如循环冗余检验 ( CRC ) 。
对于本领域的普通技术人员来说, 容易知道数字信号除了包括上述的 字段外, 还可以包括其它字段。
图 3示出了数字信号的格式的一个实例。 在该例子中, 数字信号使用 了两个 128位的帧。 第一帧的格式如图 3 ( a )所示, 其中, "总帧数" 字 段是 3位的字段, "帧序列号" 字段是 3位的字段, "播放地区" 字段是 18位的字段, "品牌"字段是 16位的字段, "分类"字段是 12位的字段, "播放类型" 字段是 8位的字段, "网络地址" 字段是 22位的字段, "有 效期" 字段是 16位的字段, "编码方式" 字段是 4位的字段, "校验" 字 段是 26位的字段。 第二帧的格式如图 3 ( b )所示, 其中, "总帧数" 字 段和 "帧序列号"字段分别是 3位的字段, "简要信息"字段是 96位的字 段, "校验" 字段是 26位的字段。
在一个实施方式中, 数字信号可以仅包括第一帧。 在这种情况下, 第 一帧中的 "总帧数" 字段的值为 1 , "帧序列号" 字段的值为 0。
在另一个实施方式中, 数字信号可以包括第一帧和至少一个第二帧。 在这种情况下, 第一帧和每个第二帧中的 "总帧数" 字段的值为第一帧和 第二帧的个数之和。
虽然以上给出了数字信号的格式的一个例子, 但本领域的普通技术人 员能够知道, 数字信号也可以使用其它格式。
返回到图 2, 在步骤 S240, 在高频段中调制在步驟 S230中获得的数 字信号, 以获得高频数字信号。 在本实施例中, 高频段可以是高音频段或 超声波频段。 优选地, 高频段是 18kHz到 22kHz的频率范围。
一般地,信号的调制可包括信号的幅度调制( ASK )、频率调制( FSK ) 和相位调制 (PSK )等。 在本实施例中, 可使用频率调制或相位调制。
在使用频率调制的情况下, 可在高频段中选择两个频率点以分别代表 0和 1, 从而进行数字信号的频率调制。
在使用相位调制的情况下, 可在高频段中选择一个频率点, 通 it^反 的两个载波相位代表 0和 1, 从而进行数字信号的相位调制。
返回到图 1, 在生成了高频数字信号后, 在步骤 S130, 合成所生成的 高频数字信号与原始音频数据流, 以获得增强音频数据流。
在本实施例中,通过线性叠加来合成高频数字信号和原始音频数据流。 通常, 原始音频数据流采用 16位脉冲编码调制 (PCM )进行编码。 在进 行合成时, 为了不引入新的噪声, 合成后的增强音频数据流的幅度不超过 16位 PCM编码的范围。
在该步骤中, 首先, 选择原始音频数据流的至少一个部分。 所选择的 部分可以是原始音频数据流的一部分或者多个部分或者全部。 然后, 按照 所选择的至少一个部分的每一个的长度, 将一个或多个高频数字信号与该 部分的音频数据流进行合成。 具体地, 根据所选择的每个部分的音频数据 流的长度以及高频数字信号的长度, 确定可与该部分的音频数据流合成的 高频数字信号的个数, 然后将这些个数的高频数字信号与该部分的音频数 据流进行合成。
所合成的增强音频数据流可被播放, 并可被终端设备的麦克风接收。 终端设备通过对所接收的增强音频数据流进行信号采样、 检测和估计, 恢 复高频数字信号, 然后对其进行解码以获得补充内容的网络地址和 /或文本 信息等, 从而能够访问补充内容的网络地址以获得补充内容, 或者在终端 设备上显示文本信息。
通过以上描述可以看出, 本实施例的提供增强音频数据流的方法通过 高频数字信号,能够使接收原始音频数据流的用户实时地获取相关的信息。 本实施例的方法可用于例如广告、 电影、 电视等中的音频数据流的提供。
在同一个发明构思下, 图 4示出了根据本发明的一个实施例的提供增 强音频数据流的装置 400的示意性方框图。 以下结合附图, 对本实施例进 行详细说明, 其中对于与前面实施例相同的部分, 适当省略其说明。
如图 4所示, 本实施例的装置 400包括: 获^ ^块 401 , 其获取原始 音频数据流; 信号生成模块 402, 其生成与所获取的原始音频数据 目关 的高频数字信号; 以及合成模块 403, 其合成所生成的高频数字信号与原 始音频数据流, 以获得增强音频数据流。
在本实施例的装置 400中, 在获取模块 401获取了原始音频数据流之 后,在信号生成模块 402中,确定单元 4021确定与原始音频数据流中的内 容相关的补充内容。 如前所述, 当原始音频数据流中的内容是广告时, 则 补充内容可以是该广告所涉及的产品的优惠信息等。 接着, 信息生成单元 4022生成与补充内^"关的信息, 例如, 指示补充内容的存储位置的网络 地址、简要描述补充内容的文本信息等。编码单元 4023将所生成的信息编 码成数字信号。 在一个实施例中, 数字信号可以包含如前所述的字段, 并 可使用如图 3所示的格式。在编码单元 4023编码生成数字信号后,调制单 元 4024在高频段中调制该数字信号, 以获得高频数字信号。优选地, 高频 段可以是 18kHz到 22kHZ的频率范围。调制单元 4024可以使用频率调制 或相位调制来对数字信号进行调制。
然后, 高频数字信号被提供给合成模块 403。 在合成模块 403中, 选 择单元 4031选择原始音频数据流的至少一个部分。具体地,选择单元 4031 可以选择原始音频数据流的一部分或多个部分或全部, 作为将被合成的部 分。接着, 合成单元 4032按照所选择的至少一个部分的每一个的长度, 将 一个或多个高频数字信号与该部分进行合成。在合成单元 4032中,对于所 选择的每一个部分的音频数据流, 根据该部分的音频数据流的长度和高频 数字信号的长度, 确定可与该部分的音频数据流合成的高频数字信号的个 数, 然后将这些个数的高频数字信号与该部分的音频数据流进行合成。 合 成单元 4032可通过线性叠加来合成高频数字信号和原始音频数据流。
应当指出, 本实施例的提供增强音频数据流的装置 400在操作上能够 实现图 1所示的实施例的提供增强音频数据流的方法。本实施例的装置 400 可用于例如广告、 电影等中的音频数据流的提供。
以上所公开的实施例的方法可以在软件、 硬件、 或软件和硬件的结合 中实现。 硬件部分可以利用专用逻辑来实现。 例如, 上述实施例中的提供 增强音频数据流的装置及其各个组成部分可以由诸如超大规模集成电路或 门阵列、诸如逻辑芯片、 晶体管等的半导体、或者诸如现场可编程门阵列、 可编程逻辑设备等的可编程硬件设备的硬件电路实现, 也可以用由各种类 型的处理器执行的软件实现, 也可以由上述硬件电路和软件的结合实现。 软件部分可以存储在存储器中, 由适当的指令执行系统, 例如微处理器、 个人计算机 ( PC )或大型机来执行。
以上虽然通过示例性的实施例详细描述了本发明的提供增强音频数据 流的方法及装置, 但是以上这些实施例并不是穷举的, 本领域技术人员可 以在本发明的精神和范围内实现各种变化和修改。 因此, 本发明并不限于 这些实施例, 本发明的范围仅由所附的权利要求限定。

Claims (1)

  1. 权利要求
    1. 一种提供增强音频数据流的方法, 包括:
    获取原始音频数据流;
    生成与所述原始音频数据流相关的高频数字信号; 以及
    合成所述高频数字信号与所述原始音频数据流, 以获得所述增强音频 数据流。
    2.根据权利要求 1所述的方法, 其中, 生成与所述原始音频数据流相 关的高频数字信号包括:
    确定与所述原始音频数据流的内^目关的补充内容;
    生成与所述补充内^ ^关的信息;
    将所述信息编码成数字信号; 以及
    在高频段中调制所述数字信号, 以获得所述高频数字信号。
    3.根据权利要求 2所述的方法, 其中, 所述信息包括存储有所述补充 内容的网络地址以及与所述补充内 关的文本信息中的至少一个。
    4.根据权利要求 2所述的方法,其中,所述高频段是从 18kHz到 22kHz 的频率范围。
    5.根据权利要求 1所述的方法, 其中, 合成所述高频数字信号与所述 原始音频数据流包括:
    选择所述原始音频数据流的至少一个部分; 以及
    按照所述至少一个部分的长度, 将一个或多个所述高频数字信号与所 述至少一个部分进行合成。
    6. 一种提供增强音频数据流的装置, 包括:
    获取模块, 其被配置为获取原始音频数据流;
    信号生成模块, 其被配置为生成与所述原始音频数据 目关的高频数 字信号; 以及
    合成模块,其被配置为合成所述高频数字信号与所述原始音频数据流, 以获得所述增强音频数据流。
    7.根据权利要求 6所述的装置, 其中, 所述信号生成模块包括: 确定单元, 其被配置为确定与所述原始音频数据流的内容相关的补充 内容;
    信息生成单元, 其被配置为生成与所述补充内容有关的信息; 编码单元, 其被配置为将所述信息编码成数字信号; 以及
    调制单元, 其被配置为在高频段中调制所述数字信号, 以获得所述高 频数字信号。
    8.根据权利要求 7所述的装置, 其中, 所述信息包括存储所述补充内 容的网络地址以及与所述补充内^ "关的文本信息中的至少一个。
    9.根据权利要求 7所述的装置,其中,所述高频段是从 18kHz到 22kHz 的频率范围。
    10.根据权利要求 6所述的装置, 其中, 所述合成模块包括:
    选择单元, 其被配置为选择所述原始音频数据流的至少一个部分; 以 及
    合成单元, 其被配置为按照所述至少一个部分的长度, 将一个或多个 所述高频数字信号与所述至少一个部分进行合成。
CN201280077909.6A 2012-12-31 2012-12-31 提供增强音频数据流的方法及装置 Pending CN104871243A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/088005 WO2014101169A1 (zh) 2012-12-31 2012-12-31 提供增强音频数据流的方法及装置

Publications (1)

Publication Number Publication Date
CN104871243A true CN104871243A (zh) 2015-08-26

Family

ID=51019776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280077909.6A Pending CN104871243A (zh) 2012-12-31 2012-12-31 提供增强音频数据流的方法及装置

Country Status (3)

Country Link
CN (1) CN104871243A (zh)
HK (1) HK1214025A1 (zh)
WO (1) WO2014101169A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006098717A (ja) * 2004-09-29 2006-04-13 Denon Ltd デジタル信号処理装置
JP2006243398A (ja) * 2005-03-03 2006-09-14 Dainippon Printing Co Ltd 音響信号の合成装置および検索装置
CN101682756A (zh) * 2007-06-18 2010-03-24 高通股份有限公司 用于增强无线电节目的装置和方法
CN101983403A (zh) * 2008-07-29 2011-03-02 雅马哈株式会社 演奏相关信息输出装置、具有演奏相关信息输出装置的系统、以及电子乐器
CN102208203A (zh) * 2010-03-31 2011-10-05 雅马哈株式会社 内容数据再现设备、内容数据再现方法和声音处理系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4304870B2 (ja) * 1996-07-02 2009-07-29 ヤマハ株式会社 電子情報処理方法及び装置並びに記録媒体
KR100341197B1 (ko) * 1998-09-29 2002-06-20 포만 제프리 엘 오디오 데이터로 부가 정보를 매립하는 방법 및 시스템
EP2084703B1 (en) * 2006-09-29 2019-05-01 LG Electronics Inc. Apparatus for processing mix signal and method thereof
JP2008225232A (ja) * 2007-03-14 2008-09-25 Crimson Technology Inc 信号処理方法および音声コンテンツ配信方法
CN103137134B (zh) * 2011-11-28 2015-03-11 鸿富锦精密工业(深圳)有限公司 音频设备及音频信号的水印信息加载方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006098717A (ja) * 2004-09-29 2006-04-13 Denon Ltd デジタル信号処理装置
JP2006243398A (ja) * 2005-03-03 2006-09-14 Dainippon Printing Co Ltd 音響信号の合成装置および検索装置
CN101682756A (zh) * 2007-06-18 2010-03-24 高通股份有限公司 用于增强无线电节目的装置和方法
CN101983403A (zh) * 2008-07-29 2011-03-02 雅马哈株式会社 演奏相关信息输出装置、具有演奏相关信息输出装置的系统、以及电子乐器
CN102208203A (zh) * 2010-03-31 2011-10-05 雅马哈株式会社 内容数据再现设备、内容数据再现方法和声音处理系统

Also Published As

Publication number Publication date
HK1214025A1 (zh) 2016-07-15
WO2014101169A1 (zh) 2014-07-03

Similar Documents

Publication Publication Date Title
JP4528365B1 (ja) 発信装置
JP3822224B1 (ja) 情報提供システム
US9254787B2 (en) Method and system for utilizing spread spectrum techniques for in car applications
US9344802B2 (en) Information providing system
CN101563938B (zh) 处理音频数据的设备和方法
TW200921642A (en) Methods and apparatuses for encoding and decoding object-based audio signals
JP3834579B1 (ja) 情報提供システム
JPWO2018038235A1 (ja) 聴覚トレーニング装置、聴覚トレーニング方法、およびプログラム
JP4867765B2 (ja) 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
CN104038772B (zh) 生成铃声文件的方法及装置
WO2002058053A1 (en) Encoding method and decoding method for digital voice data
CN104871243A (zh) 提供增强音频数据流的方法及装置
JP4545234B1 (ja) 発信装置
CN114842859A (zh) 一种基于in和mi的语音转换方法、系统、终端及存储介质
JP4910920B2 (ja) 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
JP5569033B2 (ja) 音響信号に対する情報の埋め込み装置
JP6353402B2 (ja) 音響電子透かしシステム、電子透かし埋め込み装置、電子透かし読み取り装置、その方法及びプログラム
JP2014029406A (ja) 情報送信装置、情報送信プログラム、情報受信装置、情報受信プログラム、及び情報通信方法
JP5310498B2 (ja) 音響信号に対する情報の埋め込み装置
JP4876978B2 (ja) 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
JP4877007B2 (ja) 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
CN105335381B (zh) 一种信息处理方法及电子设备
JP2008129198A (ja) 音響信号に対する情報の埋め込み装置、音響信号からの情報の抽出装置
JP2009025400A (ja) 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置

Legal Events

Date Code Title Description
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1214025

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150826

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1214025

Country of ref document: HK