CN103917886A - 使用附水印音频信号和麦克风阵列的到达方向估计 - Google Patents

使用附水印音频信号和麦克风阵列的到达方向估计 Download PDF

Info

Publication number
CN103917886A
CN103917886A CN201280052151.0A CN201280052151A CN103917886A CN 103917886 A CN103917886 A CN 103917886A CN 201280052151 A CN201280052151 A CN 201280052151A CN 103917886 A CN103917886 A CN 103917886A
Authority
CN
China
Prior art keywords
watermark
signal
audio signal
receiver
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280052151.0A
Other languages
English (en)
Other versions
CN103917886B (zh
Inventor
奥利弗·蒂尔加特
吉奥范尼·德加尔多
弗洛里安·科尔贝克
亚历山德拉·克勒琼
斯特凡·克雷格洛
朱利安娜·博苏姆
托比亚斯·布利姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN103917886A publication Critical patent/CN103917886A/zh
Application granted granted Critical
Publication of CN103917886B publication Critical patent/CN103917886B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/20Position of source determined by a plurality of spaced direction-finders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/403Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明提供一种用于基于具有嵌入式水印的再现音频信号提供方向信息的设备(100)。该设备(100)包括信号处理器(110),其适于对由在不同的空间位置的至少两个音频接收器记录的至少两个所接收的附水印音频信号进行处理。该信号处理器(110)适于处理所接收的附水印音频信号以获得针对每个所接收的附水印音频信号的接收器特定信息。该接收器特定信息取决于嵌入所接收的附水印音频信号内的嵌入式水印。此外,该设备包括方向信息提供器(120),其用于基于针对每个所接收的附水印音频信号的接收器特定信息而提供方向信息。

Description

使用附水印音频信号和麦克风阵列的到达方向估计
技术领域
本发明涉及确定诸如扬声器的声源的到达方向以及用于空间位置估计的设备和方法。
背景技术
检索声音场景的几何信息(诸如定位估计和输入信号的到达方向的估计)变得越来越重要,原因在于该信息在各种应用中是有价值的,诸如回声控制、场景分析、波束成形和用于分布式声传感器的信号处理。
例如,如果单一扬声器再现音频项目且麦克风阵列可用于进行记录,则存在分析未嵌入有水印信号的所记录的音频信号的方法。如果不存在其它声音源,例如讲话者或其它干扰器,则例如通过定向音频编码,可以估计到达方向。参考文献Jukka Ahonen,Giovanni Del Galdo,MarkusKallinger,Fabian Küch,Ville Pulkki,and Richard Schultz-Amling,“Planar microphone array processing for the analysis and reproduction ofspatial audio using directional audio coding”,in Audio EngineeringSociety Convention124,5,2008。一旦另一个来源同时发出到达方向不是期望的声音,则正确入射角的确定就受到妨碍。如果当前信号源自于不同空间位置,则将获得到达方向的两个不同估计。在这种情况下,需要更多关于偏好的声音信号的信息。
在具有多于一个扬声器的一种再现系统的情况下,如果再现信号不同,则可以使用先前说明的方法来估计到达方向。然而,如果回放相似的音频项目,即在立体声装置中回放,则出现众所周知的现象,即幻像声像源(phantom image source)。这意味着声音被觉察彷佛由位于各扬声器之间的虚拟源播放。在这种情况下,无法估计入射角。
针对涉及再现系统的校准的特定应用,存在其它众所周知的用于确定回放的声音的入射角的方法,例如,播放MLS信号或扫描信号。参考Giovanni Del Galdo,Matthias Lang,Jose Angel Pineda Pardo,AndreasSilzle,and Oliver Thiergart,“Acoustic measurement system for3-Dloudspeaker set-ups”,in Audio Engineering Society Conference:SpatialAudio:Sense the Sound of Space,102010。然而,这些信号是可见的且经常令人烦恼。此外,在可以使用再现系统之前需要进行校准。因此,附水印音频信号的使用是优选的,记住可以在系统操作期间进行校准。
用于确定传感器的方向或位置的常用技术采用射频信号以及各种传感器。基于该技术的方法提供了良好估计,但不适用于射频信号被禁止使用或难以使用的区域。此外,在这种情况下,必须安装射频传感器。
在Ryuki Tachibana,Shuichi Shimizu,Seiji Kobayashi,and TaigaNakamura,“An audio watermarking method using a two-dimensionalpseudo-random array”,Signal Process.,vol.82,pp.1455-1469,October2002中提出了也利用水印信号的另一种方法。这里,通过仅使用一个麦克风并且测量若干所发出的附水印音频信号的到达时间延迟来估计记录位置。在这种情况下,并无可用的方向信息,并且系统限于使用最少数量的扬声器。
如前文已述,现有技术具有若干问题。根据一些现有技术方法,可定位与该期望的扬声器不对应的幻像声源。其它现有技术方法具有下述问题,这些方法将定位室内的其它源或者需要特殊的测量信号,而这些测量信号在实际使用扬声器的直播情况下无法再现。本发明的目的是提供用于确定传输信号的到达方向的改进构思。根据本发明的另一方面,提供了用于空间位置估计的改进构思。本发明的目的是通过根据权利要求1的用于提供方向信息的设备、根据权利要求14的用于提供方向信息的方法、根据权利要求15的用于提供方向信息的计算机程序、根据权利要求16的用于空间位置估计的设备、根据权利要求17的用于空间位置估计的方法以及根据权利要求18的用于空间位置估计的计算机程序来解决的。
发明内容
提供了一种用于基于具有嵌入式水印的再现音频信号提供方向信息的设备。该设备系包括信号处理器,该系统处理器适于对由在不同空间位置的至少两个音频接收器记录的至少两个所接收的附水印音频信号进行处理。这些音频接收器适于记录再现音频信号的声波以获得所接收的附水印音频信号。每个所接收的附水印音频信号包括嵌入式水印。该信号处理器适于处理所接收的附水印音频信号以获得针对每个所接收的附水印音频信号的接收器特定信息。此外,该接收器特定信息取决于嵌入所接收的附水印音频信号中的嵌入式水印。此外,该设备包括方向信息提供器,该方向信息提供器用于基于针对每个所接收的附水印音频信号的接收器特定信息而提供方向信息。
一个实施例描述了一种用于确定方向信息(例如,由扬声器再现的音频信号的到达方向(DoA))的方法。该信号作为在时频域内生成的听不见的水印信号的载波。其通过包括至少两个麦克风的麦克风阵列来记录。随后,以检测嵌入式水印信号为目的而进一步处理记录。一旦恢复水印,其可用来估计声源相对于阵列方位的方向。根据应用,该构思可进一步修改并应用于包括任意数量的扬声器的装置。
在一个实施例中,该信号处理器包括分析模块,该分析模块用于将所接收的附水印音频信号从时域变换成时频域以获得包括多个子带信号的时频域传输信号。在一个实施例中,该信号处理器可适于将复数确定为接收器特定信息。例如,该复数可表示由一个音频接收器记录的附水印音频信号的复合系数或平均复合系数的值。在又一个实施例中,该信号处理器可适于将相位信息确定为接收器特定信息。例如,该相位信息可以是由一个音频接收器记录的附水印音频信号的相位值或平均相位值。在又一个实施例中,该信号处理器可适于将由一个音频接收器记录的附水印音频信号的幅值或平均幅值确定为接收器特定信息。
根据实施例,该信号处理器适于基于所确定的平均复合系数而将平均相位值确定为相位信息。该信号处理器可适于通过确定包括子带信号的已处理的复合系数的平均周期块而生成平均复合系数。
在一个实施例中,该信号处理器适于通过组合子带信号的至少两个已处理的复合系数而确定平均复合系数,其中已处理的复合系数具有相等的相位值或相差不超过0.5弧度的相位值。此外,该信号处理器可适于通过以预定数改变复合系数的相位值(例如,当使用正相反的二进制相移键控(BPSK)作为调制方案时以180°改变复合系数的相位值,或者以取决于所使用的调制方案和已知的嵌入式序列的适当相位值改变复合系数的相位值)来生成已处理的复合系数。
根据实施例,该信号处理器适于确定同步命中(hit)位置,该同步命中位置表示对水印签名的第一位进行编码的复合系数的位置。
该方向信息提供器可适于采用相位值来确定并提供方向信息。此外,该方向信息提供器可适于提供到达方向向量作为方向信息。
此外,提供了一种用于提供方向信息的方法。该方法包括以下步骤:接收附水印音频信号,每个所接收的附水印音频信号包括嵌入式水印;对由在不同空间位置的至少两个音频接收器记录的至少两个所接收的附水印音频信号进行处理以确定针对每个所接收的附水印音频信号的接收器特定信息,其中该接收器特定信息取决于嵌入所接收的附水印音频信号中的嵌入式水印;以及基于针对每个所接收的附水印音频信号的接收器特定信息而提供方向信息。
此外,提供了一种用于空间位置估计的设备。该设备包括根据实施例的用于提供方向信息的设备以及用于估计用于空间位置估计的设备的位置的位置估计器,其中该位置估计器适于基于由用于提供方向信息的设备提供的方向信息而估计用于空间位置估计的设备的位置。
假定可利用足够数量的扬声器并且其空间位置是已知的,则空间位置估计的构思基于确定麦克风阵列的空间记录位置。例如,可采用三个扬声器来确定麦克风阵列在共同平面内的位置。应该提及的是,所提出的构思不限于方位角的确定。除此之外,可根据所使用的方向估计方法来估计仰角(elevation)。
此外,提供一种用于空间位置估计的方法。该方法包括:通过采用至少两个音频接收器的阵列来接收附水印音频信号,每个所接收的附水印音频信号包括嵌入式水印;对由在不同空间位置的至少两个音频接收器记录的至少两个所接收的附水印音频信号进行处理以确定针对每个所接收的附水印音频信号的接收器特定信息,其中该接收器特定信息取决于嵌入所接收的附水印音频信号中的嵌入式水印;基于针对每个所接收的附水印音频信号的接收器特定信息而提供方向信息;以及估计至少两个音频接收器的阵列的位置,其中该位置是基于方向信息而确定的。
可能的应用的示例例如为玩具,其可对某个音频信号的回放作出反应,例如当播放某些电视连续剧时,动作玩偶可以将头朝向电视机移动。
又一个应用示例为再现系统校准:本发明可用于在电话会议正在进行或者播放音频项目时,自动地校准再现系统,例如,用于电话会议或家庭剧院系统的装置。在这种情况下,无需进行事先校准。
此外,可以操控音频信号的通道以根据所提供的方向信息调高或调低在某些位置的某些扬声器的声音。此外,可通过系统指示使用者如何根据所提供的方向信息而最佳地放置声音系统的扬声器。
又一个应用示例为上述的用于空间位置估计的设备。
附图说明
将参照附图说明优选实施例,在附图中:
图1示出根据实施例的用于提供方向信息的设备的示意框图,
图2示出根据实施例的在应用情况下的用于提供方向信息的设备,
图3A-3C示出频率扩展和时间扩展的水印,
图4示出用于生成水印信号的调制器,
图5描绘用于生成水印信号的设备,
图6A-6B示出根据实施例的在另外的应用情况下的用于提供方向信息的设备,
图7示出根据实施例的用于提供方向信息的设备的部件,
图8A提供了根据实施例的当采用过采样时在时频平面上系数的位置的示例性概况,
图8B示出包括嵌入式水印的时频域子带信号,
图9A-9D描绘根据实施例的水印签名、同步块、周期块和平均同步块,
图10示出根据实施例的复用水印,
图11A-11B示出同步支持单元的实现替选的示意框图,
图11C示出同步签字相关器的示意框图,
图12A示出找出水印的时间对准的问题的图形表示,
图12B示出识别消息开头的问题的图形表示,
图12C示出用于同步的数据的图形表示,
图12D示出识别同步命中的构思的图形表示,
图13A示出时间解扩的示例的图形表示,
图13B示出在位与扩展序列之间的按元素乘法的示例的图形表示,
图13C示出在进行时间平均后同步签名相关器的输出的图形表示,
图13D示出利用同步签名的自相关函数进行滤波的同步签名相关器的输出的图形表示,
图14示出包括差分解码位的周期块和包括复合系数的周期块的关系,
图15A描绘音频信号部分的和水印信号部分的复合向量,
图15B描绘音频信号部分的平均复合向量和水印信号部分的平均复合向量,
图15C示出在不同阶段的样本积分,
图15D示出不同子带的两个积分复合系数向量,
图16示出沿笛卡尔坐标系的轴所布置的六个麦克风,
图17示出根据实施例的在xy平面内的方位角确定,
图18A-18D描绘根据实施例所确定的到达方向向量,
图19示出根据实施例的位置估计,
图20A-20B描绘位置估计挑战和解决方案,
图21示出根据实施例的用于位置估计的设备,以及
图22示出根据实施例的用于空间位置估计的设备。
具体实施方式
1.根据图1的用于提供方向信息的设备
图1示出根据实施例的用于基于具有嵌入式水印的再现音频信号来提供方向信息的设备100。该设备100包括信号处理器110。该信号处理器110适于处理由在不同空间位置的至少两个音频接收器记录的至少两个所接收的附水印音频信号rx1、rx2。至少两个音频接收器适于记录再现音频信号的声波以获得至少两个所接收的附水印音频信号。每个所接收的附水印音频信号rx1、rx2包括嵌入式水印。此外,信号处理器110适于处理所接收的附水印音频信号以获得针对每个所接收的音频信号rx1、rx2的接收器特定信息rsi1、rsi2。接收器特定信息rsi1、rsi2取决于嵌入所接收的附水印音频信号rx1、rx2中的水印。此外,用于提供方向信息的设备100包括方向信息提供器120。该方向信息提供器适于基于针对每个所接收的音频信号rx1、rx2的接收器特定信息rsi1、rsi2而提供方向信息di。
2.根据图2的应用情况:
图2示出一种情况,其中用于提供方向信息的设备100从两个音频接收器221、222接收两个附水印音频信号rx1、rx2。在图2中,包括水印的音频信号awm通过麦克风210再现为声波sw。声波sw由至少两个音频接收器221、222(例如,两个麦克风)记录以获得至少两个所接收的音频信号rx1、rx2。每个所接收的音频信号rx1、rx2均包括嵌入式水印。
然后,所接收的附水印音频信号rx1、rx2被输入到用于提供方向信息的设备100的信号处理器110。信号处理器110适用于处理所接收的附水印音频信号rx1、rx2以获得针对每个所接收的附水印音频信号rx1、rx2的接收器特定信息rsi1、rsi2。根据所接收的附水印音频信号中所包括的水印,接收器特定信息可以是相位信息。此外,该相位信息取决于音频接收器的空间位置。例如,包括水印的再现音频信号的声波可到达第一音频接收器221比到达第二音频接收器222略早。因此,相比于第二接收信号rx2,第一接收信号rx1中的水印略早地被接收。一般而言,两个接收信号rx1、rx2都相当类似。然而,由于两个信号在时间上相对于彼此略为偏移,因此将两个接收信号rx1、rx2从时域变换成时频域通常导致两个频域信号的相位值关于相同频率子带和时间指数是不同的。
信号处理器110将接收器特定信息rsi1、rsi2馈送至方向信息提供器120。该方向信息提供器120适于基于针对每个所接收的音频信号rx1、rx2的接收器特定信息rsi1、rsi2而提供方向信息di。例如,可基于相位信息提供方向信息di。第一接收信号rx1的第一相位值和第二接收信号rx2的第二相位值可例如通过计算相位差来处理。基于所算出的相位差,方向信息提供器120可确定方向信息di。例如,可确定再现音频信号的声波可能源自的可能方向。
3.水印生成:
在下文中,为了提供与水印有关的背景信息,参照图3A至图5所描绘的图来说明编码器中的水印生成。在时频域内生成水印的水印技术在申请号为10154953.3、10154960.8、10154964.0、10154948.3、10154956.6和10154951.7的欧洲专利申请中被提出,这些申请通过引用并入本文中。
基本上,水印是隐藏在另一信号(例如,音频信号)中的编码位签名。可采用多个频带(子带)对该位签名进行编码。
图3A至图3C示出在不同频带内要编码的水印签名的二进制值。虽然水印可用来传送信息,但在下文中,将聚焦在使用水印来传送水印签名的方面。
一般而言,水印签名可以为任意位序列,例如位序列:[1,1,-1,1,-1,-1]。图3A示出了对应的水印签名310。
通过使用扩展序列来对水印位序列进行扩频。例如,为了将水印签名扩展至m个频带,可采用包括m个值的扩展向量。在最简单的情况下,扩展向量仅包括1,例如,可采用[1,1,1],这导致针对各相应频带复制水印签名。在更复杂的实施例中,扩展向量也可包括-1,例如[1,-1,1],这导致针对各个-1位,水印签名在被复制以在相应频带中编码之前被反转。图3B示出了前述水印签名,其是通过采用扩展向量[1,-1,1,-1]来获得扩频水印320而被扩频的。
也可通过采用扩展向量来在时域内扩展扩频水印。例如,通过采用向量[1,-1]来进行时间扩展,扩频水印签名中的每一个均可首先以其原始形式被编码,然后可被反转以对其进行编码。图3C示出了扩频且扩时的水印签名330,其中已通过采用扩展向量[1,-1]来进行时间扩展。
在频率上以及可能在时间上进行扩展后,可重复对水印签名进行编码。
可对不同的位序列进行差分编码。差分编码器可执行对位的差分编码。该步骤给予了系统对由于移动或本地振荡器不匹配而引起的相移的额外稳健性。如果b(i;j)为第i个频带及第j个时间区块(time block)的位,则输出位bdiff(i;j)为
bdiff(i,j)=hdiff(i,j-1)·b(i,j).
在流的开头,即,对于j=0,bdiff(i;j-1)被设定为1。
调制器307执行实际调制,即,根据在其输入所给定的二进制信息来生成水印信号波形。在图4中给出对应调制器的更详细示意图。Nf个并行输入401至40Nf包含针对不同子带的位流。位成形块(411至41Nf)对每个子带流的每位进行处理。位成形块的输出为时域内的波形。基于输入位bdiff(i;j),如下计算由si;j(t)表示的、针对第j时间区块及第i子带所生成的波形:
si,j(t)=bdiff(i,j)γ(i,j)·yi(t-j·Tb),
其中,γ(i;j)为由心理声学处理单元提供的加权因子,Tb为位时间间隔,以及gi(t)为第i个子带的位形成函数。位形成函数是根据以余弦调频的基带函数获得的:
g i ( t ) = g i T ( t ) · cos ( 2 π f i t )
其中,fi为第i个子带的中心频率,以及上标T代表发射器。对于每个子带,基带函数可以不同。如果选为相同的,则可能在解码器处进行更有效的实现。
上述嵌入处理是指正相反的BPSK调制方案,即,其中编码信息位置仅仅改变位形成函数的符号。替选地,可对两个或更多位进行分组,并且可以使用更高阶调制星座(诸如QAM或M-PSK)。例如,如常做的那样,仍可在差分编码QPSK中应用差分编码。
在由心理声学处理模块102控制的迭代过程中重复对各位的位成形。可能需要迭代来对权重γ(i,j)进行微调以将尽可能多的能量分配给水印、同时维持其听不见。
在第i个位成形滤波器41i的输出的完整波形为:
s i ( t ) = Σ j s i , j ( t ) .
位形成基带函数通常在远大于Tb的时间间隔内为非零,但主要能量集中在位间隔内。在图9A中可看到一个示例,其中,针对两个相邻位描绘相同的位形成基带函数。在图9A中,使Tb=40ms。Tb的选择以及函数形状显著影响系统。实际上,较长的符号提供了较窄的频率响应。这在混响环境中特别有利。事实上,在这种情况下,附水印的信号经由若干传播路径到达麦克风,每个传播路径以不同的传播时间为特征。所得到的通道具有很强的频率选择性。以时域解释,由于具有与位间隔相当的延迟的回波产生相长干涉,因此较长的符码是有利的,意味着其增加了接收信号能量。然而,较长的符号也带来几个缺点;较大的重叠可能导致符号间干扰(ISI),并且确实更难以隐藏在音频信号内,使得心理声学处理模块将允许比较短符号的能量更少的能量。
水印信号是通过对位成形滤波器的全部输出进行相加而获得的:
Σ i s i ( t ) .
图5示出水印插入器500的示意框图。在编码器侧,在处理块501(又称为水印生成器)中根据二进制数据501a且基于与心理声学处理模块502交换的信息504、505来生成水印信号501b。从块502提供的信息通常确保该水印是听不见的。由水印生成器501生成的水印与音频信号506相加。
如前文已述,需要加权因子γ(i,j)以针对每个子带计算波形si;j(t)。加权因子γ(i,j)的目的是为了将听不见的水印隐藏在所得到的附水印信号507中。加权因子γ(i,j)由包括3个部分的心理声学处理模块502提供。第一部分为分析模块,其将时间音频信号变换成时域/频域。该分析模块可以不同的时间/频率分辨率执行并行分析。在分析模块之后,时间/频率数据被传送至心理声学模型(PAM),其中根据心理声学考虑因素来计算水印信号的掩蔽阈值。掩蔽阈值表示针对每个子带和时间区块可隐藏在音频信号中的能量。心理声学处理模块502的最后块为幅值计算模块。该模块确定在生成水印信号时使用的幅值增益,使得满足掩蔽阈值,即,嵌入式能量小于或等于由掩蔽阈值定义的能量。
在图6A中,单个扬声器610用于再现附水印音频信号awm。作为第一步骤,组合单元605将水印信号wm与音频信号a组合以获得附水印音频信号awm。如参照图3A-4所述的那样,可能已产生水印信号wm。已如参照图5所述的那样,水印生成器可能已生成附水印信号awm。例如,水印信号wm可能已与音频信号a相加。
从组合单元605进行的组合所得到的附水印音频信号awm然后通过扬声器610再现并且通过传感器621、622、...、62N(例如,麦克风阵列的N个麦克风)记录,以使得获得N个信号s1、s2、...、sN。所记录的信号s1、s2、...、sN不仅包括附水印扬声器信号,而且包括干扰噪声,例如室内有人讲话以及混响引起的效果。然后,所记录的信号s1、s2、...、sN被输入到根据实施例的用于提供方向信息的设备100。该设备100确定并输出方向信息,例如,可确定并输出到达方向(DoA)。
然而,在其它配置中,多个扬声器611、612、...、61N可适于输出多个附水印信号awm1、awm2、...、awmM。这在图6B中示出。不同水印信号wm1、wm2、...、wmM与音频信号a1、a2、...、aM相加,例如用于家庭剧院再现的音频项目的摇摆通道(panned channel)。针对本情况的处理类似于仅一个扬声器正在再现附水印信号的状况。
4.根据图7的用于提供方向信息的设备:
图7示出根据实施例的用于提供方向信息的设备100。示出了多个所接收的附水印音频信号s1、s2、...、sN,例如可能已由图6所示的麦克风621、622、...、62N记录的信号。在时域内表示的所接收的附水印信号s1、s2、...、sN被馈送到分析模块711、712、...71N以将其变换成时频域并且以进行归一化。
4.1分析模块711、712、...71N:
为了说明分析模块711、712、...71N,考虑所接收的附水印音频信号之一。通过采用分析滤波器组,一个分析模块将附水印音频信号从时域变换成时频域。滤波器组的输入为相应的附水印音频信号。其输出为在时刻j针对第i个分支或子带的复合系数这些值包含与在中心频率fi和时间j·Tb的信号的幅值和相位有关的信息。
滤波器组包括Nf个分支,一个分支用于每个频谱子带i。每个分支分裂成用于同相分量的上子分支以及用于子带i的正交分量的下子分支。虽然水印生成器的调制以及因而附水印音频信号完全取实数值,但需要在接收器处对信号进行复值分析,原因在于在接收器处不知道由通道以及由于同步未对准引起的调制星座的旋转。以下,我们考虑滤波器组的第i个分支。通过组合同相分支和正交分支,我们可以定义复值基带信号
b i AFB ( t ) = r ( t ) · e - j 2 π f i t * g i R ( t )
其中,*表示卷积以及为子带i的接收器低通滤波器的脉冲响应。通常等于调制器中子带i的基带位形成函数以满足匹配的滤波器条件,但其它脉冲响应也是可能的。
为了获得具有速率l=Tb的系数必须对连续输出进行采样。如果接收器已知位的正确定时,则以速率l=Tb进行采样就足矣。然而,由于尚不知道位同步,因此以速率Nos/Tb进行采样,其中Nos为分析滤波器组过采样因子。通过选择足够大的Nos(例如,Nos=4),可以假定至少一个采样周期足够接近理想位同步。在同步过程期间做出对最佳过采样层的判定,因此保持全部过采样数据直至那时为止。
在第i个分支的输出,具有系数其中j表示位数或时刻,以及k表示在该单一位内的过采样位置,其中k=1、2、...、Nos
图8A给出在时频平面上系数的位置的示例性概况。在图8A中,过采样因子为Nos=2。矩形的高度和宽度分别表示由对应的系数表示的信号的部分的带宽和时间间隔。
如果选择子带频率fi作为某个间隔Δf的倍数,则可以使用快速傅利叶变换(FFT)来有效地实现分析滤波器组。
可如下对针对每个频带所获得的复合系数进行归一化:在不丧失普遍性的情况下并且为了简化描述,以下假设位同步是已知的以及Nos=1。在归一化之前,具有复合系数由于并无通道状态信息可利用(即,传播通道是未知的),因此使用等增益合并(EGC)方案。由于时间和频率分散通道,发送的位的能量bi(j)不仅围绕中心频率fi及时刻j被发现,而且也在相邻频率及时刻处。因此,为了进行更精确的加权,计算在频率fi±nΔf处的附加系数并且将其用于对系数的归一化。如果n=1,则例如使得
b i norm ( j ) = b i AFB ( j ) 1 / 3 · ( | b i AFB ( j ) | 2 + | b i - Δf AFB ( j ) | 2 + | b i + Δf AFB | 2 )
针对n>1的归一化为上式的简单展开。针对每个子带i和每个时刻j进行归一化。
此外,在到达方向估计还使用接收器特定信息的幅值的情况下,可仅针对一个麦克风来计算归一化因子,然后将其应用于全部麦克风。
图8B示出子带信号,其中两个水印信号部分WM1及WM2被时间复用。子带信号包括来自第一扬声器的第一音频源LS1的声音部分以及来自第二扬声器的第二音频源LS2的声音部分。此外,子带信号也包括来自第一扬声器的水印信号部分WM1或者第二扬声器的水印信号部分WM2。
4.2选择模块720:
返回到图7,在变换成时频域并进行归一化后,时频域信号S1、S2、...、SN被馈送到选择模块720。选择模块720确定可用信号S1、S2、...、SN中的哪一个应该用来执行随后的同步化。针对选择模块720存在若干可能性来在信号之间进行选择。在实施例中,选择模块720适于随机地选择输入信号S1、S2、...、SN之一。例如,选择模块可选择时频域信号S1。在替选实施例中,选择模块720适于对信号S1、S2、...、SN进行平均并且使用平均信号。
4.3差分解码器730:
然后,选择模块720将所得到的信号馈送到差分解码器730。在差分解码器730的输入处,具有幅值归一化的复合系数其包含与在频率fi和时刻j的信号分量的相位有关的信息。由于在发送器对各位进行差分编码,因此这里必须执行逆操作。通过首先计算两个连续系数的相位差、然后取实数部分,获得软位
这必须针对每个子带来分别执行,原因在于通道通常将不同相位旋转引入每个子带中。
差分解码器730对输入信号进行差分解码以通过首先计算两个连续系数的相位差、然后取相位的实数部分来获得所谓的软位。应该注意,所得到的软位可以取任何实数值,并且尚未对位作出任何硬判决。由于软位可取任何实数值,因此它们不一定必须为-1或1,而替代地可具有与-1或1不同的实数值,诸如,例如0.92、-0.88、0.97等。
此外,当输入至差分解码器时,可对子带信号进行过采样。差分解码器当对子带信号进行差分解码时考虑过采样。例如,考虑已利用过采样因子q对子带信号进行过采样的情况。例如,对于第i个子带,系数为其中j表示位数或时刻,以及q表示在该单个位内的过采样位置,其中q=1、2、...、Nos。然后,利用过采样因子q,通过应用下式来计算q个软位:
b ^ i ( j , q ) = Re { b i norm ( j , q ) · b i norm * ( j - 1 , q ) }
然后,差分解码器730将软位流馈送到积分模块740,该积分模块740在跨越若干同步签名的时间内对软位流进行积分以进一步改进同步的准确性。
4.4积分模块740:
现在将更详细地说明积分模块740。当采用通过单个扬声器产生的仅一个水印签名wm1时,重复传送水印签名wm1,以使得当传送水印签名wm1的最末位时,接下来跟着的是水印签名wm1的第一位等。图9A描绘对应序列。如果唯一采用的(例如,时间扩展的)水印签名wm1包括N位,则在N位后重复位序列,然后,唯一水印签名形成长度为N位的同步块sync。
然而,如前文已经说明,系统可包括多于一个扬声器。为了获得每个扬声器的到达方向的估计,需要确定所记录的信号的哪个部分是由某个扬声器发出的。因此,必须对水印信号进行复用。存在通信中众所周知的不同的可行方法,即码分多址(CDMA)、频分多址(FDMA)和时分多址(TDMA)。在实施例中,采用时分多址。为了确定所记录的信号的哪些部分属于某个扬声器,将不同的水印签名嵌入不同的扬声器信号中。图10示出使用两个扬声器以及包括六个序列的同步签名的时间复用。
因而,不同的扬声器可传送不同的水印,例如两个水印wm1、wm2,其可经时间复用。假设两个(例如,时间扩展的)水印的位数为N。首先,传送第一水印签名wm1。其后,传送第二水印签名。然后,再次传送第一水印签名wm1,接着是第二水印签名wm2等。然后,同步块sync包括水印wm1、wm2并且具2?N位。图9B描绘了所述的具有两个复用水印签名的情况。
重复地传送每个同步块。假设同步序列具有Nsync位,则位1等于位Nsync+1,并且等于位2·Nsync+1等。位2等于位Nsync+2,并且等于位2·Nsync+2等。针对考虑的子带i所得到的公式为:
b ^ i ( j ) = b ^ i ( j + N sync ) = b ^ i ( j + 2 * N sync ) = . . . = b ^ i ( j + K * N sync ) , 对于j=0,...,Nsync-1。
假如已通过分析模块711、712、...71N进行过采样,例如利用过采样因子Nos,则已针对关注子带i的每个单一位创建Nos个差分解码后的位值候选结果获得下式:
b ^ i ( j , q ) = b ^ i ( j + N sync , q ) = b ^ i ( j + 2 · N sync , q ) = . . . = b ^ i ( j + K · N sync , q ) , 对于j=0,...,Nsync-1.
其中,q=1、2、...Nos表示在考虑的位内的过采样位置。
积分模块适于对软位进行积分,以使得不同的同步块的多个软位相加以改进水印解码处理的稳健性。
首先,包括差分解码位的位流被划分成具有Nsync个位的后续周期块p1、p2、p3。此时,积分模块740不知到同步块从何处开始。然而,这并不是必须的,原因在于差分解码后的位流的周期性并不取决于同步块的起始点,而是取决于同步块的长度。为此,同步块的第一位可位于周期块内的某处。图9C示出该情况。
为了形成平均同步签名块p0,将不同周期块的对应位相加。例如,将第一、第二和第三水印周期的第一位相加,将第一、第二和第三水印周期的第二位相加等等,直至第一、第二和第三水印周期的Nsync位。可将每个所得到的位除以平均化的周期块的数量。结果得到了下式:
b i avg ( j ) = 1 K Σ k = 0 K - 1 b ^ ( j + k · N sync ) , 其中j=0,1,2,...,Nsync-1
在该公式中,i为考虑的子带,K表示平均化的同步块的数量,k表示考虑的实际同步块,而j为在周期块内所考虑的位位置。平均同步块具有Nsync个位: b i avg ( 0 ) , b i avg ( 1 ) , b i avg ( 2 ) , . . . , b i avg ( N sync - 1 ) .
第一水印签名的第一位可位于平均同步块p0的某处。图9D示出了示出平均同步块p0的情况。
如果已利用过采样因子Nos进行了在分析模块711、712、...71N中的分析,则也考虑过采样。在这种情况下,对于周期块的每个位,针对全部Nos个差分解码后的位值候选来生成平均值。结果得到了下式:
b i avg ( j , q ) = 1 K Σ k = 0 K - 1 b ^ ( j + k · N s , q ) , 其中j=0,1,2,...,Nsync-1
其中,q=1,2,...,Nos表示在考虑的位内的过采样位置。
由积分模块740进行的积分产生平均软位,或者在过采样的情况下,针对平均同步块p0的位中的每一个而产生Nos个软位值候选中的多个。
在语音信号用作为水印载体的另一实施例中,积分特别重要,原因在于这些语音信号通常包含无水印信号的间隙。由此,当进行时间上的积分时,存在于软位流中的误差通常将减少。
4.5同步模块750:
在已对位序列在时间上进行积分后,积分模块740将积分后的软位流馈送到同步模块750,其执行稳健同步化。更具体地,同步模块750执行与嵌入式同步签名的关联。由此得到同步命中位置。现在将更详细地说明同步模块750中的同步化。
同步模块750的任务是找出平均同步块内一个或多个水印的时间对准。
对解码器与编码数据进行同步的问题是双重的。在第一步骤中,分析滤波器组必须与编码数据对准,即,用在调制器的合成中的位成形函数必须与用于进行分析的滤波器对准。该问题在图12A中示出,其中分析滤波器与合成滤波器相同。在上面,可看到三个位。为了简明,全部三个位的波形皆未按比例绘制。不同位之间的时间偏移为Tb。底部示出在解码器处的同步问题:可在不同时刻应用滤波器,然而,仅曲线1299a是正确的,并且允许提取具有最佳信噪比SNR和信号干扰比SIR的第一位。实际上,不正确的对准会导致SNR和SIR二者都降低。将该第一对准问题称为“位同步”。一旦已实现位同步,则可最佳地提取位。然而,也还需要知道水印签名从何处开始。该问题在图12B中示出并且被称为消息同步。在解码后的位流中,仅以粗体箭头1299b标记的起始位置为正确的并且允许对第k个消息进行解码。
为了说明基本同步构思,我们首先提及仅一个扬声器输出单一水印签名的系统。因此,平均同步块仅包括该单一水印签名的位。还可将水印签名称为同步签名。
此外,我们将提及项目同步序列。同步签名可包括多个同步序列。在最简单的情况下,同步序列可仅包括单一位。然后,同步签名也可以包括多个位。
我们首先解决消息同步。假设同步签名由Ns个同步序列按预定顺序组成,这些同步序列连续地且周期性地嵌入附水印音频信号中。同步模块750能够恢复同步序列的时间对准。
同步模块可通过找出同步序列的时间对准来识别每个同步签名的开头。我们提及作为同步命中的、新同步签名开始的时间位置。
在图11A和11B中描绘了同步模块的处理块。同步支持单元通过分析同步签名相关器1201的输出来同时执行位同步和消息同步。时/频域内的数据204由分析模块提供。由于尚未利用位同步,因此分析模块以因子Nos对数据进行过采样。
图12C中给出了输入数据的例示。对于该示例,取Nos=4,Nt=2,以及Ns=3。此外,Nos表示过采样因子,Nt表示时间扩展因子,以及Ns表示同步序列数量。因而,换言之,同步签名包括3个序列(以a、b和c标示)。在扩展序列为ct=[11]T的这种情况下,时间扩展仅仅在时域内重复每个位两次。
精确的同步命中以箭头标示且对应于每个同步签名的开头。同步签名的周期为Nt·Nos·Ns=Nsbl,其为2·4·3=24。
由于平均同步块的周期性,只考虑如由积分模块740输出的平均同步块就足矣。如图12D所示,同步块必须包含(或通常包含)一个同步命中。平均同步块的各个位均为候选同步命中。仅仅为了例示目的,在图12D中,平均同步块在图中以双重形式示出。块1201的任务是针对同步块的每个候选位计算似然度量。然后,将该信息传递至块1204,其计算同步命中。
针对Nsbl个候选同步位置中的每一个,同步签名相关器计算似然度量,后者愈大,则愈可能发现了时间对准(位和部分或全部消息同步化二者)。图11C中示出了处理步骤。
因此,可获得与不同位置选择相关联的似然值序列1201a。块1301进行时间解扩,换言之,将每Nt个位乘以时间扩展序列ct、然后对其进行求和。这针对Nf频率子带中的每一个来执行。
图13A示出一个示例。取前一节中所描述的相同参数,即Nos=4,Nt=2,以及Ns=3。标记候选同步位置。从该位开始,以Nos为偏移,块1301取Nt·Ns,并且以序列ct进行解扩,使得留下Ns位。
在块1302中,按元素(element-wise)将位与Ns个扩展序列相乘(参考图13B)。
在块1303中,执行频率扩展,换言之,将每位与扩展序列cf相乘、然后沿频率进行求和。
此时,如果同步位置是正确的,则将具有Ns个解码位。由于各位并不为接收器所已知,因此块1304通过取Ns个值的绝对值来计算似然度量并进行求和。
块1304的输出原则上是非相干相关器,其寻找同步签名。实际上,当选择小的Ns时,即部分消息同步模式,可以使用彼此正交的同步序列(例如a、b、c)。在这样做时,当相关器并未与签名正确地对准时,其输出将非常小,理想地为零。当使用完整消息同步模式时,建议使用尽可能多的正交同步序列,然后,通过谨慎地选择使用它们的顺序来创建签名。在这种情况下,可应用与在寻找具有良好自相关函数的扩展序列时的理论相同的理论。当相关器仅仅稍微不对准时,则相关器的输出将不为零,即便在理想情况下亦是如此,但总而言之,将相比于刚好对准而言更小,原因在于分析滤波器无法最理想地捕获信号能量。
该同步命中计算块分析同步签名相关器的输出以确定同步位置在何处。由于系统对高达Tb/4的不对准相当稳健并且Tb通常占约40ms,因此可以关于时间对1201的输出进行积分以实现更稳定的同步。对此的一种可能实现通过沿时间所应用的具有指数衰减脉冲响应的IIR滤波器来给出。替选地,可以应用传统的FIR移动平均滤波器。一旦已进行平均,就进行沿不同Nt·Ns的第二相关(“不同位置选择”)。实际上,我们想要利用同步功能的自相关函数为已知的信息。这对应于最大似然估计器。在图13C中示出了该构思。曲线示出了在时间积分之后块1201的输出。确定同步命中的一个可能性仅仅在于找出该函数的最大值。在图13D中,我们看到以同步签名的自相关函数滤波的相同函数(以黑色)。所得到的函数以更粗的线表示。在这种情况下,最大值更显著,并且向我们给出同步命中的位置。这两种方法对于高SNR而言都相当类似,但第二种方法在较低SNR状况下更好实行。一旦找出同步命中,就将其传递至水印提取器202,该水印提取器202对该数据进行解码。
多于一个水印签名:
系统也可采用由不同扬声器输出的两个或更多个水印签名,其中这些水印签名被时间复用。图10示出这样的时间复用后的水印签名。在这种情况下,同步模块750分别搜索嵌入式水印签名中的每一个。因此,检测与扬声器一样多的同步命中位置,并且使用不同水印信号且将这些同步命中位置递送至方向估计器760。
据此,针对每个水印系重复地应用找出同步签名的同步命中位置的前述构思。因而,针对每个水印,确定平均同步块内的同步命中位置。如参照图11A-13D所说明的,针对每一个水印,重复进行每个水印的同步命中位置的确定,其中所考虑的水印的水印签名被用作同步签名。
然后,将所记录的信号划分为M段(segment),每个段M属于某个扬声器的某个水印。然后,针对每个段执行到达方向的估计。结果,方向估计器760将具有M个输出,每一个均表示由某个扬声器发出的声音的到达方向。
同步模块750提供在平均同步块内的一个或多个同步命中位置,并且将同步命中位置递送至方向估计器760。
在其它实施例中,如果连续地嵌入水印并且仅使用一个扬声器,则无需计算同步命中。如果非如此,则必须进行同步以找出方向估计的起点。4.6积分模块741、742、...、74N:
返回图7,分析模块711、712、...71N不仅将时频域信号S1、S2、...、SN提供给选择模块720,而且也将信号S1、S2、...、SN提供给积分模块741、742、...、74N。递送至积分模块741、742、...、74N的实际上为(过采样后的)归一化复合系数其是与提供给选择模块720的系数相同的系数。
然而,在过采样后的归一化复合系数被馈送到积分模块741、742、...、74N之前未进行差分解码,原因在于需要复合系数中所包括的相位信息,该信息在差分解码之后会丢失。取而代之,必须保持信号的相位信息。通过应用差分解码,将丢弃该信息。
在积分模块741、742、...、74N中的每一个中以及针对每个子带i,首先,包括过采样后的归一化复合系数的流被划分成后续的周期块p11、p12、p13。以与已将差分解码后的位流分离成周期块p1、p2、p3相同的方式将复合系数流划分成块。具有对应的时间指数和(过采样位置)的位和样本包括在对应的周期块中。
参照图7和图14对此进行说明。在图7中,信号s1可被提供给分析模块711。分析模块711生成包括多个子带信号的时频域信号S1,每一个子带信号均被表示为复合系数流。在实施例中,选择模块720可选择S1,以使得基于时频域信号S1进行随后的同步。
在图14中,考虑时频域信号S1的特定子带。该子带可包括复合系数c(i,j),其中i表示子带以及j表示时间指数。例如,考虑该子带的复合系数c(i,1)、c(i,2)、c(i,3)、c(i,4)、c(i,5)和c(i,6)。差分解码器基于这些值进行的差分解码提供了六个软位,即,基于c(i,1)和前一子带样本的d(i,1)、基于c(i,2)和在前的c(i,1)的d(i,2)、基于c(i,3)和在前的c(i,2)的d(i,3)、基于c(i,4)和在前的c(i,3)的d(i,4)、基于c(i,5)和在前的c(i,4)的d(i,5)以及基于c(i,6)和在前的c(i,5)的d(i,6)。在d(i,j)中,i表示子带以及j表示时间指数。
频带i的复合系数也被馈送到图7的积分模块741。如果积分模块740现在将包括软位d(i,1)、d(i,2)、d(i,3)、d(i,4)、d(i,5)、d(i,6)的差分解码后的位流划分成包括d(i,1)、d(i,2)和d(i,3)的第一周期块p1以及包括d(i,4)、d(i,5)和d(i,6)的第二周期块p2,则复合系数c(i,1)、c(i,2)、c(i,3)、c(i,4)、c(i,5)和c(i,6)也被划分成两个块,即包括复合系数c(i,1)、c(i,2)和c(i,3)的第一块以及包括复合系数c(i,4)、c(i,5)和c(i,6)的第二块(参见图14)。
同样适用于其它分析模块71N生成的其它时频域信号SN,即使这些信号尚未用于通过差分解码器执行的差分解码也是如此。
如果考虑了过采样,则前述构思也同等适用。如果过采样后的软位b(i,j,q)被划分成第一周期块p1和第二周期块p2,则复合系数c(i,j,q)也被划分成两个块p11和p12。(这里,i表示子带,j表示时间指数,以及q表示过采样位置)。如果第一周期块p1包括软位b(i,j,q),则第一块p11包括具有相同指数j、q的复合系数c(i,j,q)。如果第二周期块p2包括软位b(i,j,q),则第二块p12也包括具有相同指数j、q的复合系数c(i,j,q)。
因而,由积分模块741、742、...、74N生成的周期块p11、p12、p13中的每一个的长度对应于积分模块740生成的周期块p1、p2、p3的长度。
为了针对每个子带i而形成平均周期块,对对应复合系数进行平均。例如,将不同周期块的对应复合系数相加。例如,将第一、第二和第三同步周期的第一复合系数相加,将第一、第二和第三水印周期的第二复合系数相加等。将每个所得到的复合系数除以平均化后的周期块的数量。结果得到下式:
b i avg ( j ) = 1 K Σ k = 0 K - 1 b i norm ( j + k · N s ) , 其中j=0,1,2,...,Nsync-1
本式中,K表示平均化的所考虑子带i的周期块的数量,k表示所考虑的实际周期块,而j为在周期块内的复合系数的位置。
将利用过采样因子Nos的过采样纳入考虑,这产生了下式:
b i avg ( j , q ) = 1 K Σ k = 0 K - 1 b i norm ( j + k · N s , q ) , 其中j=0,1,2,...,Nsync-1
其中q=1,2,...,Nos表示考虑的复合系数内的过采样位置。
针对每个频带和每个信号来确定平均周期块。
参照图15A和图15B来说明形成平均周期块的该效果。图15A和图15B示出积分如何有助于获取水印信号的期望相位信息。
当使用若干个扬声器时,出现众所周知的现象,即幻像声像源。在这种情况下,发出的声音被察觉彷佛由位在各扬声器之间的一个源播放一样。这也是估计到达方向的情况,原因在于所记录的水印信号的音频部分与水印部分成比例地加倍。对该问题的解决方案是使用积分模块441、442、...、44N,现在更详细进行说明。
通过假设理想通道,针对某个频率子带l和不同时隙i,图15A示出记录和分析的信号Sn的音频部分的复合向量和水印信号部分的复合向量。这里,Amn表示扬声器m所发出且在麦克风n处所接收的音频部分。应该注意,在TDMA示例中,当观察给定时隙时,所记录的信号包括所发出的全部音频信号与仅一个水印信号的重叠。K表示要积分的同步块的数量。Nsynch表示针对一个完整同步块的时隙的数量。其包括针对全部扬声器的不同的同步签名:
Nsynch=M·Nseq,
其中,M为扬声器数量以及Nseq为一个同步签名的序列数量。音频部分的复合向量从一个时隙旋转至另一个时隙。然而,相反地,水印信号的相位几乎维持相同。
在图15B中,示出在执行了积分之后的情况。所得到的音频信号的复合向量几乎消失,而所得到的水印的向量保持不变。因此,通过使用所记录的输入信号的相位信息来实现入射角的估计的方法接收有用数据以获得对于每个扬声器的到达方向的可行估计。
在进行位积分之后,可得到针对不同麦克风611、612、...、61N的每个接收信号S1、S2、...、SN以及针对每个频带i的积分复合系数。
目前,将不考虑过采样,并且说明本发明所基于的一些原理。在本实施例的上下文中所采用的相位调制基于一些基本构想:假设每个采样的复合系数对应于编码位位置,将实际样本的相位值与前一样本的相位值进行比较。例如考虑二进制相移键控(BPSK)。如果两个样本的相位值相同,则这对应于第一编码位值,例如编码位值为1。然而,如果两个相位值相差例如180度(或±π),则这对应于第二编码位值,例如编码位值为-1。因而,为了进行例如采用二进制相移键控的相位调制,重要的是后续的位位置的样本具有相同的相位值或者相差180度(或±π)的相位值。因此,当对相位调制后的值进行编码时,采用调制,以使得根据编码位值,对应于后续的位位置的样本的相位值相等或者相差180度。
关于某个水印签名和某个频带,扬声器传送通过相位调制而编码的位序列。全部音频接收器(例如,麦克风)接收相位调制后的位序列。对于不同麦克风的全部信号,与所接收到的音频信号S1、S2、...、SN的随后的位位置相对应的样本的相位差应该(几乎)相同。如果两个麦克风同时接收音频信号的相同部分,则绝对相位值也应该相同。然而,由于麦克风间隔开(但它们可仅稍微间隔开),因此第一麦克风可比第二麦克风略早接收音频信号的相同部分,例如在第一麦克风比第二麦克风更靠近扬声器情况下。这样的两个接收时域信号的时间差导致两个所接收的频域信号(例如时频域信号)的相位差。因此,由两个麦克风接收到的两个附水印信号的相位差包括与发出了该附水印信号的扬声器相对于两个麦克风的位置的位置有关的信息。
4.7方向估计器760:
积分模块741、742、...、74N将针对每个频带和每个信号所确定的平均周期块馈送到方向估计器760,该方向估计器760已接收同步命中位置。然后,方向估计器760对由针对每个平均周期块的同步命中位置指向的输入数据的部分执行到达方向的估计。
以下,将关注于系统仅包括传送单一水印的一个扬声器的情况。然而,在发出多于一个水印的情况下,本发明同等适用。在该情况下,针对每个所传送的水印来提供一个同步命中位置,然后基于该同步命中位置以及基于水印的长度而将该平均周期块划分成不同段。然后,以下构思适用于每个水印签名及其平均周期块的段。
4.7.1丢弃在不正确的过采样位置处的样本:
在第一步骤中,方向估计器基于平均周期块来执行样本积分。针对每位,仅考虑由同步命中位置表示为正确过采样位置的过采样位置。在样本积分中丢弃且不考虑全部其它过采样位置。
4.7.2反相-1位:
然后,以第一水印签名的第一位开始逐位地考虑水印签名。在平均周期块内的对应样本值的位置由同步命中位置表示。考虑水印签名的全部位及其对应样本值。在使用BPSK作为调制方案的实施例中,位值1由实际样本和先前样本的相等相位值表示,而位值-1由实际样本和先前样本的180°的相位差表示。这在图15C中示出。复合系数的样本值序列以1510标示。假设采用差分编码,则位序列1515表示编码位。同步模块现在生成处理后的平均复合系数的序列1520,以使通过留下复合系数不变或者通过将相位值改变180°,全部复合系数大概具有相同的相位值。进行基于评估水印的编码位序列来确定复合系数的相位值是否改变了180°的判定。
例如,基于水印签名,一种设备可计算是否已通过使用具有期望的第一相位值的复合系数来对位值进行编码,或者计算是否已通过使用具有非期望的第二相位值的复合系数来对位值进行编码。如果对应的样本值已被确定为具有非期望的第二相位值,则该复合系数的相位值改变了180°。
由此,虽然在处理之前,频带的复合系数具有第一绝对相位值或具有与第一相位值相差约180°的第二绝对相位值,但对于与某个麦克风的某个频域信号有关的所有复合系数,处理后的平均复合系数序列对于某个频带的复合系数的绝对相位值现在几乎相同。
4.7.3样本积分
在调整样本的相位后,全部复合系数的相位值具有大致相等的值。同步模块750现在以样本为基础进行积分。对与所考虑的水印签名的全部其余样本值(具有正确过采样位置的采样值)进行积分,亦即进行平均,例如相加并除以相加的样本的数量以获得平均复合系数1530。
获得了两个效果:作为第一效果,获得更稳定的绝对相位值。不同的样本可暴露于通道内的波动,以使得不同相位值具有大致相同的绝对相位值,但并非正好相同的相位值。作为第二效果,在平均样本内的音频信号的影响被最小化,同时强调了水印签名的效果。
因而,可针对不同麦克风611、612、...、61N以及针对每个频带i确定平均复合系数中的每一个的(绝对)相位值。该相位值为平均相位值。由于复合系数为复数,因此复合系数的绝对相位值可通过确定复合系数的相位值(自变量)来确定。
然而,应该注意,不同频带的复合系数可具有不同的相位值,如图15D所示。
4.7.4方向确定:
基于所确定的相位信息,可以替选的确定构思为基础而确定各种类型的方向信息。通过使用取决于麦克风阵列的配置和输入信号之间的相位差的使用的方法(例如,定向音频编码(DirAC)或者经由旋转不变信号参数估计技术(ESPRIT)),获得到达方向的估计。
在DirAC中,通过使用B格式麦克风信号来分析声场,其中B格式麦克风信号包括全向信号w(t)和对应于笛卡尔坐标系的x轴、y轴和z轴的三个偶极信号x(t)、y(t)、z(t)。
图16示出六个麦克风的使其形成三个麦克风对的麦克风布置。假设第一麦克风对mx1、mx2位于笛卡尔坐标系的x轴。第二麦克风对my1、my2被布置成假设其位于笛卡尔坐标系的y轴。此外,第三麦克风对mz1、mz2被布置成假设其位于笛卡尔坐标系的z轴。
考虑某个频带i,关于针对所考虑频带i的所考虑水印签名而确定的绝对相位值针对麦克风mx1被称为vx1,针对麦克风mx2被称为vx2,针对麦克风my1被称为vy1,针对麦克风my2被称为vy2,针对麦克风mz1被称为vz1,以及针对麦克风mz2被称为vz2。然后,可如下计算相位差Δvx、Δvy和Δvz:
Δνx=νx1-νx2;
Δνy=νy1-νy2;
Δνz=νz1-νz2;
方位角的确定:
在实施例中,可基于算出的相位值计算方位角。例如,考虑如图17所示的xy平面内的麦克风mx1和mx2的位置。表示两个麦克风之间的距离d。要相对于xy平面来指定规定输出水印签名的声源的方向的角度对应于波同时命中麦克风。即,于是,假设声源与mx1同与mx2一样等距离间隔开。采用下式:
在本等式中,λ为波长且被定义为λ=c/fi,其中c为声速,以及其中,fi为所考虑子带的中心频率。fi可对应于针对如上所述的所考虑子带的位形成函数中的fi。d为两个麦克风mx1与mxh2之间的距离,以及φ是表示要确定的相对于xy平面的到达方向的角度。
此外,为:
从而,可确定值
假设在范围]-π,π]内。如果为-1或1,则可以明确地确定然而,如果不为-1或1,则可以为两个不同值之一。例如,如果=0,则φ为0或π。
为了解析该不定性,可采用来自另外的麦克风的信息。考虑如图17所示的xy平面内的麦克风my1和my2的位置。此外,表示两个麦克风之间的距离d。该距离可与麦克风mx1和mx2的距离相同或者可以不同。指定输出水印签名的声源的方向的角度β要相对于xy平面指定。β=0对应于波同时击中麦克风。即,假设声源与mx1同与mx2一样间隔开相等距离。采用下式:
Δνy=(-2·π/λ)·d·sin(β)
这产生了下式:
sin(β)=-Δνy·λ/(2·π·d)
在图17所示的实施例中,(在其它实施例中,β可以为因此,
并且从而:
此外,如果不为-1或1,则α可以为两个值之一。
通过根据公式(I)计算以及通过根据公式(II)计算以及基于确定,可以明确地确定的值。
由此,相对于xy平面和某个频带i,可以确定指定包括水印签名的声波的到达方向的角度
可以针对多个不同频带i中的每一个来重复确定角度针对每个频带,获得角度其对于每个频带而言应该几乎相同。然而,与某些频带有关的干扰可能影响基于这些频带而确定的角度的确定值的正确度。在实施例中,计算角度的确定值的平均值。例如,所算出的角度值可相加且除以相加的数量以获得角度的值作为平均值。
根据方位角确定到达方向向量:可将到达方向向量计算为
到达方向向量的替选确定:
在实施例中,如下基于所算出的相位值来确定到达向量的方向:
返回到图17,如上所说明,通过应用Δvx=vx1-vx2、Δvy=vy1-vy2以及Δvz=vz1-vz2,可以计算绝对相位值的相位差Δvx、Δvy和Δvz。
在实施例中,假设麦克风mx1与mx2之间的距离dx、麦克风my1与my2之间的距离dy以及麦克风mz1与mz2之间的距离dz相等。
然后,当在范围]-π;π]内表示Δvx、Δvy和Δvz时,Δvx、Δvy和Δvz构成到达方向向量a的分量。
a=(Δνx,Δνy,Δνz)
其指向声源方向。
在又一个实施例中,麦克风mx1与mx2之间的距离dx、麦克风my1与my2之间的距离dy以及麦克风mz1与mz2之间的距离dz不相等。在这样的实施例中,必须调整修正后的相位差以考虑不同距离,例如通过应用校正因子。例如,可根据下式确定分量ax、ay和az:
ax=(1/dx)·Δνx;ay=(1/dy)·Δνy;az=(1/dz)·Δνz
以使得到达方向向量结果是a=(ax,ay,az)。
在另外的实施例中,例如可通过将向量a的分量乘以因子k来对该向量a进行归一化,例如,
k = Δ vx 2 + Δ vy 2 + Δ vz 2
参照图18A至图18D来说明到达方向向量。为了更好的举例说明,说明在二维xy平面内的状况。假设麦克风mx1与mx2之间的距离dx和麦克风my1与my2之间的距离dy相等。然而,所给定的说明也适用于三维情况,以及适用于麦克风距离不相等但已例如通过应用距离因子来调整相位差Δvx及Δvy的状况。
考虑到达方向向量a=(Δvx,Δvy,Δvz)。其分量Δvx、Δvy、Δvz是通过前述实施例所获得的相位差。为了举例说明目的,仅考虑向量a’=(Δvx,Δvy)的x分量和y分量。
在图18A中,考虑二分量到达方向向量a’=(0,1)。
向量Δvx的x分量为0,即,相对于由两个麦克风mx1和mx2都接收到的信号的绝对相位值的相位差并不存在。因而,对应的音频波同时击中两个麦克风mx1和mx2,并且假设声源与两个麦克风mx1和mx2的间隔相等。结果,到达方向向量a’既非负也非正。
向量Δvy的y分量为1。当Δvy=vy1-vy2时,这表明绝对相位值vy1大于绝对相位值vy2,因而,相应的音频波到达麦克风my1比到达麦克风my2更早。因而,到达方向向量a’指向y轴的正向。
在图18B中,考虑二分量到达方向向量a’=(-1,0)。
向量Δvy的y分量为0,即,关于由两个麦克风my1和my2都接收到的信号的绝对相位值的相位差并不存在。因而,对应的音频波同时击中两个麦克风my1和my2,以及假设声源与两个麦克风my1和my2的间隔相等。结果,到达方向向量a’既非负也非正。
向量Δvx的x分量为-1。当Δvx=vx1-vx2时,这表明绝对相位值vx2大于绝对相位值vx1,因而,相应的音频波到达麦克风mx2比到达麦克风mx1更早。因此,到达方向向量a’指向y轴的负向。
在图18C中,考虑二分量到达方向向量a’=(1,1)。
向量Δvx的x分量为1。由于Δvx=vx1-vx2,因此这表明绝对相位值vx1大于绝对相位值vx2,因而,相应的音频波到达麦克风mx1比到达麦克风mx2更早。因此,到达方向向量a’指向x轴的正向。
向量Δvy的y分量为1。由于Δvy=vy1-vy2,因此这表明绝对相位值vy1大于绝对相位值vy2,因而,相应的音频波到达麦克风my1比到达麦克风my2更早。因此,到达方向向量a’指向y轴的正向。
由于相位差Δvx与Δvy相等,并且由于可以假设对应的音频波在x方向上与在y方向上一样同等快速地传播,因此到达方向向量的x分量与y分量具有相等的值。
在图18D中,考虑二分量到达方向向量a’=(2,1)。
向量Δvx的y分量为2。由于Δvx=vx1-vx2,因此这表明绝对相位值vx1大于绝对相位值vx2,因而,相应的音频波到达麦克风mx1比到达麦克风mx2更早。因此,到达方向向量a’指向x轴的正向。
向量Δvy的y分量为1。由于Δvy=vy1-vy2,因此,这表明绝对相位值vy1大于绝对相位值vy2,因而,相应的音频波到达麦克风my1比到达麦克风my2更早。因此,到达方向向量a’指向y轴的正向。
由于相位差Δvx与Δvy相等,并且由于可以假设对应的音频波在x方向上比在y方向上更快速地传播且在x方向上的速度为在y方向上的速度的两倍,因此到达方向向量的x分量为y分量的大小的两倍。基于多个频带确定到达方向向量:
如以上已说明的,基于某个频带的相位值来确定到达方向向量。在实施例中,针对多个频带来计算到达方向向量以获得多个到达方向向量。然后,对多个频带向量进行归一化,例如通过将其分量乘以向量特定归一化因子以获得归一化后的到达方向向量。例如,针对每个频带,例如根据下式可确定向量特定归一化因子n:
其中fi为第i个子带的中心频率。
然后,可确定平均到达方向向量。求平均例如可通过将多个到达方向向量相加并且通过将所获得的向量的分量除以所平均的归一化后的到达方向向量的数量来实现。
在实施例中,可使用在定向音频编码(DirAC)的背景下所采用的方法、基于所确定的到达方向向量来计算方位角和仰角。
使用复合接收器特定信息对到达方向向量的替选估计:
在又一个实施例中,与针对所考虑频带i的所考虑水印签名有关的复合值可用来使用定向音频编码(DirAC)技术来估计到达方向。
假设Δpx表示从来自图16的麦克风mx1和mx2获得的复合值之差。类似地,针对y轴和z轴获得Δpy和Δpz。假设p0为在全部麦克风处所获得的复合值的平均。
到达方向向量a是根据有效的强度向量Ia=(Iax,Iay,Iaz)而算出的,该向量被定义为
Iax=.5Real(p0·conj(Δpx))
Iay=.5Real(p0·conj(Δpy))
Iaz=.5Real(p0·conj(Δpz)),
其中Real()提取实部,以及conj表示复共轭,其中.5表示0.5。
到达方向向量为
a=-Ia/norm(Ia),
其中,norm()计算自变量的L2范数。利用下式容易计算方位角和仰角
azimuth=atan(Iay/Iax)
elevation=atan(norm(Ia),sqrt(Iax^2+Iay^2)),
其中,sqrt为平方根,其中Iax^2表示Iax2,并且其中,Iay^2表示Iay2
记录单元的位置估计
图19示出在二维情况下的位置估计。我们假设扬声器位置是已知的。我们进一步假设扬声器和记录麦克风的阵列位于同一平面内。
根据前述实施例之一,针对扬声器中的每一个来确定到达方向向量。第一扬声器的到达方向向量指向第一扬声器。第二扬声器的到达方向向量指向第二扬声器。
基本上,到达方向向量指向来自扬声器的声波的到达方向,其中该向量的分量可参考笛卡尔坐标系来表达。然而,在实施例中,坐标系的轴是根据麦克风的位置来定义的:mx1和mx2的位置定义该到达方向向量参考的坐标系的x轴,以及my1和my2位置定义该坐标系的y轴。
如果麦克风阵列的方位是已知的,以及如果两个扬声器的(绝对)位置是已知的,则两个到达方向向量在二维情况下足以定义麦克风阵列的位置。这在图19中示出。
在这样的实施例中,一种用于位置估计的设备适于针对输出包括水印签名的声波的每个扬声器计算到达方向向量。计算二维平面内的第一线,该第一线平行于第一扬声器的到达方向向量且与第一扬声器的位置交叉。此外,计算二维平面内的第二线,该第二线平行于第二扬声器的到达方向向量且与第二扬声器的位置交叉。计算该二维平面内的第一线与第二线的交叉点,其中该交叉点确定麦克风阵列的位置。
在又一个实施例中,所描述的构思适用于麦克风阵列和扬声器不位于二维平面内的环境中,从而应用到达方向向量的三维方向(具有三个分量的到达方向向量)。这里,假设扬声器位置是已知的。设备计算平行于所确定的到达方向向量的线,其中所算出的线与其到达方向向量的扬声器的扬声器位置交叉。所有算出的线彼此交叉的点是所确定的麦克风阵列的位置。
为了例示目的,返回到二维情况。如果麦克风阵列的方向不是已知的,则两个扬声器的到达方向向量并不足以确定麦克风阵列的位置。在这样的情况下,可计算第一到达方向向量与第二到达方向向量之间的角度α,但由于麦克风阵列的方位以及因而由该麦克风阵列定义的坐标系的方位不会是已知的,因此即使扬声器的位置(例如,参考第二坐标系所表达)是已知的,也无法明确地定义麦克风阵列的位置。这在图20A中示出。
然而,通过采用输出包括水印签名的第三音频波的第三扬声器,可以解决不定性。参考图20B来对此进行说明。如果估计至少三个扬声器(M≥3)的到达方向,则也可以确定麦克风阵列的空间位置。图21示出对应的位置估计器。当使用三个扬声器时,假设扬声器和记录单元在共同平面内。然而,在接收器处必须已知扬声器的空间位置。依赖于该信息,可以通过在位置估计器800中对非线性方程组进行求解而获得记录位置。
在图20B的实施例中,用于位置估计的设备计算第一扬声器的第一到达方向向量、第二扬声器的第二到达方向向量以及第三扬声器的第三到达方向向量。然后,可计算第一到达方向向量与第二到达方向向量之间的第一角度α以及第二到达方向向量与第三到达方向向量之间的第二角度δ。然后,用于判决估计的设备确定二维平面内的点,以使得每一条均与扬声器位置和确定点交叉的三条线相对于彼此具有确定的角度关系。换言之,与第一扬声器位置交叉的第一线和与第二扬声器位置交叉的第二线彼此交叉于确定点,以使得其交叉角等于第一角度。与第二扬声器位置交叉的第二线和与第三扬声器位置交叉的第三线彼此交叉于确定点,以使得其交叉角等于第二角。确定点为麦克风阵列的位置。
在另一实施例中,位置估计器确定麦克风阵列的位置,麦克风阵列的方位对于三维情况(即,对于扬声器和麦克风阵列并未都位于二维平面内的配置)而言不是已知的。通过采用三维到达方向向量(即,具有三个分量的到达方向向量),基于上述构思来实现确定。
图22示出根据实施例的用于空间位置估计的设备。用于空间位置估计的设备包括根据前述实施例之一的用于提供方向信息的设备100,该设备100处理所接收的附水印音频信号rx1、rx2。此外,用于空间位置估计的设备包括位置估计器300,该位置估计器300用于估计用于空间位置估计的设备的位置。位置估计器适于基于由用于提供方向信息的设备提供的方向信息而估计用于空间位置估计的设备的位置。
虽然已在设备的背景下描述了一些方面,但是显而易见的是,这些方面也代表对应方法的描述,其中块或装置对应于方法步骤或方法步骤的特征。类似地,在方法步骤的背景下所描述的方面也代表对应块的描述或者对应设备的项目或特征。
本发明的分解信号可以存储在数字存储介质上,或者可以传送至传输介质,诸如无线传输介质或有线传输介质(诸如因特网)。
根据某些实现要求,本发明的实施例可以以硬件或软件来实现。该实现可以使用存储有电子可读取的控制信号的数字存储介质(例如,软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或闪存)来执行,该数字存储介质与可编程计算机系统协作(或者能够协作)以使得执行相应方法。
根据本发明的一些实施例包括具有可电子读取的控制信号的非暂态数据载体,其能够与可编程计算机系统进行协作,以使得执行本文中所述的方法之一。
通常,本发明的实施例可实现为具有程序代码的计算机程序产品,当该计算机程序产品在计算机上运行时,该程序代码可操作用于执行这些方法之一。该程序代码例如可存储在机器可读载体上。
其它实施例包括存储在机器可读载体上的用于执行本文中所述的方法之一的计算机程序。
]换言之,因此,本发明方法的实施例为具有用于当计算机程序产品在计算机上运行时执行本文中所述的方法之一的程序代码的计算机程序。
因此,本发明的又一实施例为一种数据载体(或数字存储介质或计算机可读介质)包括记录在其上的用于执行本文中所述的方法之一的计算机程序。
因此,本发明的又一实施例为表示用于执行本文中所述的方法之一的计算机程序的数据流或信号序列。数据流或信号序列例如可以被配置为经由数据通信连接(例如,经由因特网)来传输。
又一实施例包括一种处理装置,例如计算机或可编程逻辑装置,其被配置为或适于执行本文中所述的方法之一。
又一实施例包括一种其上安装有用于执行本文中所述的方法之一的计算机程序的计算机。
在一些实施例中,一种可编程逻辑装置(例如,可现场编程门阵列)可用于执行本文中所述的方法之一的部分或全部功能。在一些实施例中,可现场编程门阵列可与微处理器协作以执行本文中所述的方法之一。通常,这些方法优选地由任一硬件设备执行。
上述实施例仅供说明本发明的原理。应理解,本文中所述的配置和细节的修改和变化对于本领域的技术人员将是显而易见的。因此,这是意图仅受所附专利权利要求的范围限制而并不受通过本文中的实施例的描述和说明所呈现的具体细节限制。

Claims (18)

1.一种用于基于具有嵌入式水印的再现音频信号(awm)提供方向信息的设备(100),包括:
信号处理器(110),适于对由在不同空间位置的至少两个音频接收器(221,222)记录的至少两个所接收的附水印音频信号(rx1,rx2)进行处理,其中所述音频接收器(221,222)适于记录所述再现音频信号(awm)的声波以获得所述所接收的附水印音频信号(rx1,rx2),每个所接收的附水印音频信号(rx1,rx2)包括所述嵌入式水印,其中所述信号处理器(110)适于处理所述所接收的附水印音频信号(rx1,rx2)以获得针对每个所接收的附水印音频信号(rx1,rx2)的接收器特定信息,所述接收器特定信息取决于嵌入所述所接收的附水印音频信号(rx1,rx2)内的嵌入式水印,以及
方向信息提供器(120),用于基于针对每个所接收的附水印音频信号(rx1,rx2)的接收器特定信息而提供方向信息。
2.根据权利要求1所述的设备(100),其中所述信号处理器(110)包括分析模块(711,712,71N),所述分析模块用于将所述所接收的附水印音频信号(rx1,rx2)从时域转换为时频域以获得包括多个子带信号的时频域传输信号。
3.根据权利要求1或2所述的设备(100),其中所述信号处理器(110)适于将复数确定为所述接收器特定信息。
4.根据前述权利要求中的一项所述的设备(100),其中所述信号处理器(110)适于将相位信息确定为所述接收器特定信息。
5.根据权利要求4所述的设备(100),其中所述信号处理器(110)适于基于所确定的平均复合系数而将平均相位值确定为所述相位信息。
6.根据权利要求5所述的设备(100),其中所述信号处理器(110)适于通过确定包括子带信号的已处理的复合系数的平均周期块来生成所述平均复合系数。
7.根据权利要求2所述的设备(100),其中所述信号处理器(110)适于将相位信息确定为所述接收器特定信息,其中所述信号处理器(110)适于基于所确定的平均复合系数而将平均相位值确定为所述相位信息,并且其中所述信号处理器(110)适于通过确定包括所述多个子带信号之一的已处理的复合系数的平均周期块来生成所述平均复合系数。
8.根据权利要求6或7所述的设备(100),其中所述信号处理器(110)适于通过组合所述子带信号的已处理的复合系数中的至少两个来确定所述平均复合系数,其中所述已处理的复合系数具有相等的相位值或在弧度上相差不超过0.5的相位值。
9.根据权利要求6至8中的一项所述的设备(100),其中所述信号处理器(110)适于通过以预定数改变所述复合系数中的至少一个的相位值来生成所述已处理的复合系数。
10.根据前述权利要求中的一项所述的设备(100),其中所述信号处理器(110)适于确定同步命中位置,所述同步命中位置表示对水印签名的第一位进行编码的复合系数的位置。
11.根据权利要求6至9中的一项所述的设备(100),其中所述信号处理器(110)适于确定同步命中位置,所述同步命中位置表示对嵌入所述所接收的附水印音频信号(rx1,rx2)内的嵌入式水印的水印签名的第一位进行编码的所述已处理的复合系数中的至少一个的位置。
12.根据前述权利要求中的一项所述的设备(100),其中所述方向信息提供器(120)适于采用复数来确定并提供方向信息。
13.根据前述权利要求中的一项所述的设备(100),其中所述方向信息提供器(120)适于提供到达方向向量作为方向信息。
14.一种用于提供方向信息的方法,包括:
接收附水印音频信号,每个所接收的附水印音频信号(rx1,rx2)包括嵌入式水印,
对由在不同空间位置的至少两个音频接收器记录的至少两个所接收的附水印音频信号(rx1,rx2)进行处理以确定针对每个所接收的附水印音频信号(rx1,rx2)的接收器特定信息,其中所述接收器特定信息取决于嵌入所述所接收的附水印音频信号(rx1,rx2)内的嵌入式水印,以及
基于针对每个所接收的附水印音频信号(rx1,rx2)的接收器特定信息而提供方向信息。
15.一种计算机程序,用于当所述计算机程序由计算机或处理器执行时执行根据权利要求14所述的方法。
16.一种用于空间位置估计的设备,包括:
根据权利要求1至13中的一项所述的用于提供方向信息的设备(100),以及
位置估计器(300),用于估计所述用于空间位置估计的设备的位置,其中所述位置估计器(300)适于基于由所述用于提供方向信息的设备提供的方向信息而估计所述用于空间位置估计的设备的位置。
17.一种用于空间位置估计的方法,包括:
通过采用至少两个音频接收器的阵列来接收附水印音频信号,每个所接收的附水印音频信号(rx1,rx2)包括嵌入式水印,
对由在不同空间位置的至少两个音频接收器记录的至少两个所接收的附水印音频信号(rx1,rx2)进行处理以确定针对每个所接收的附水印音频信号(rx1,rx2)的接收器特定信息,其中所述接收器特定信息取决于嵌入所述所接收的附水印音频信号(rx1,rx2)内的嵌入式水印,
基于针对每个所接收的附水印音频信号(rx1,rx2)的接收器特定信息而提供方向信息,以及
估计所述至少两个音频接收器的阵列的位置,其中所述位置是基于所述方向信息而确定的。
18.一种计算机程序,用于当所述计算机程序由计算机或处理器执行时执行根据权利要求17所述的方法。
CN201280052151.0A 2011-08-31 2012-08-31 使用附水印音频信号和麦克风阵列的到达方向估计 Active CN103917886B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11179591.0 2011-08-31
EP11179591A EP2565667A1 (en) 2011-08-31 2011-08-31 Direction of arrival estimation using watermarked audio signals and microphone arrays
PCT/EP2012/066964 WO2013030339A1 (en) 2011-08-31 2012-08-31 Direction of arrival estimation using watermarked audio signals and microphone arrays

Publications (2)

Publication Number Publication Date
CN103917886A true CN103917886A (zh) 2014-07-09
CN103917886B CN103917886B (zh) 2016-03-09

Family

ID=46826474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280052151.0A Active CN103917886B (zh) 2011-08-31 2012-08-31 使用附水印音频信号和麦克风阵列的到达方向估计

Country Status (14)

Country Link
US (1) US11176952B2 (zh)
EP (2) EP2565667A1 (zh)
JP (1) JP5941545B2 (zh)
KR (1) KR101719194B1 (zh)
CN (1) CN103917886B (zh)
AR (1) AR087763A1 (zh)
AU (1) AU2012300806B2 (zh)
BR (1) BR112014004778B1 (zh)
CA (1) CA2846080C (zh)
ES (1) ES2558167T3 (zh)
HK (1) HK1198718A1 (zh)
MX (1) MX2014002428A (zh)
TW (1) TWI480858B (zh)
WO (1) WO2013030339A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107182009A (zh) * 2016-03-10 2017-09-19 联发科技股份有限公司 音频同步方法及相关电子设备
CN107430864A (zh) * 2015-03-31 2017-12-01 高通技术国际有限公司 在音频信号中嵌入代码
CN107430865A (zh) * 2015-03-24 2017-12-01 汤姆逊许可公司 用于在声场的高保真度立体声响复制表示中嵌入和恢复水印的方法和装置
CN108702558A (zh) * 2018-03-22 2018-10-23 歌尔股份有限公司 用于估计到达方向的方法和装置及电子设备
CN109313909A (zh) * 2018-08-22 2019-02-05 深圳市汇顶科技股份有限公司 评估麦克风阵列一致性的方法、设备、装置和系统
CN110603863A (zh) * 2017-05-02 2019-12-20 株式会社Ntt都科摩 基站装置、用户装置和通信方法
CN113009411A (zh) * 2021-02-25 2021-06-22 浙江德清知路导航研究院有限公司 一种具有定位功能的音频编解码芯片、定位方法及应用
CN113196393A (zh) * 2018-12-21 2021-07-30 尼尔森(美国)有限公司 使用起始相位调制进行加水印的设备和方法
CN113223544A (zh) * 2020-01-21 2021-08-06 珠海市煊扬科技有限公司 音频的方向定位侦测装置及方法以及音频处理系统

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10149048B1 (en) 2012-09-26 2018-12-04 Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems
US9955277B1 (en) 2012-09-26 2018-04-24 Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) Spatial sound characterization apparatuses, methods and systems
US20160210957A1 (en) 2015-01-16 2016-07-21 Foundation For Research And Technology - Hellas (Forth) Foreground Signal Suppression Apparatuses, Methods, and Systems
US10175335B1 (en) 2012-09-26 2019-01-08 Foundation For Research And Technology-Hellas (Forth) Direction of arrival (DOA) estimation apparatuses, methods, and systems
US9554203B1 (en) 2012-09-26 2017-01-24 Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) Sound source characterization apparatuses, methods and systems
US10136239B1 (en) 2012-09-26 2018-11-20 Foundation For Research And Technology—Hellas (F.O.R.T.H.) Capturing and reproducing spatial sound apparatuses, methods, and systems
US9549253B2 (en) * 2012-09-26 2017-01-17 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Sound source localization and isolation apparatuses, methods and systems
CN103308889B (zh) * 2013-05-13 2014-07-02 辽宁工业大学 复杂环境下被动声源二维doa估计方法
US9679053B2 (en) 2013-05-20 2017-06-13 The Nielsen Company (Us), Llc Detecting media watermarks in magnetic field data
EP2899997A1 (en) * 2014-01-22 2015-07-29 Thomson Licensing Sound system calibration
EP2930923A1 (en) * 2014-04-07 2015-10-14 Thomson Licensing A method and a device for reacting to watermarks in digital content
US10410643B2 (en) 2014-07-15 2019-09-10 The Nielson Company (Us), Llc Audio watermarking for people monitoring
WO2016179211A1 (en) 2015-05-04 2016-11-10 Rensselaer Polytechnic Institute Coprime microphone array system
US10425835B2 (en) * 2015-12-04 2019-09-24 Industrial Technology Research Institute Post network entry connection method in millimeter wave communication system and related apparatuses using the same
US11080591B2 (en) 2016-09-06 2021-08-03 Deepmind Technologies Limited Processing sequences using convolutional neural networks
EP3497629B1 (en) 2016-09-06 2020-11-04 Deepmind Technologies Limited Generating audio using neural networks
US10419511B1 (en) * 2016-10-04 2019-09-17 Zoom Video Communications, Inc. Unique watermark generation and detection during a conference
CN110023963B (zh) * 2016-10-26 2023-05-30 渊慧科技有限公司 使用神经网络处理文本序列
GB2563670A (en) * 2017-06-23 2018-12-26 Nokia Technologies Oy Sound source distance estimation
CN110133595B (zh) * 2018-02-09 2023-05-23 北京搜狗科技发展有限公司 一种声源测向方法、装置和用于声源测向的装置
WO2019227353A1 (en) * 2018-05-30 2019-12-05 Goertek Inc. Method and device for estimating a direction of arrival
US10652654B1 (en) * 2019-04-04 2020-05-12 Microsoft Technology Licensing, Llc Dynamic device speaker tuning for echo control
US11968268B2 (en) 2019-07-30 2024-04-23 Dolby Laboratories Licensing Corporation Coordination of audio devices
EP4005233A1 (en) 2019-07-30 2022-06-01 Dolby Laboratories Licensing Corporation Adaptable spatial audio playback
NL2024416B1 (en) * 2019-12-10 2021-08-31 Foccaert Y Bvba Location determination system, method for determining a location and device for determining its location
TWI790694B (zh) * 2021-07-27 2023-01-21 宏碁股份有限公司 聲音浮水印的處理方法及聲音浮水印產生裝置
TWI806299B (zh) 2021-12-21 2023-06-21 宏碁股份有限公司 聲音浮水印的處理方法及聲音浮水印產生裝置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080247274A1 (en) * 2007-04-06 2008-10-09 Microsoft Corporation Sensor array post-filter for tracking spatial distributions of signals and noise
US20100286949A1 (en) * 2007-12-28 2010-11-11 Junichi Miyamoto Position determination system, transmission device and reception device, and position determination method

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU733898B2 (en) 1997-03-05 2001-05-31 Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The Immunotoxins and methods of inducing immune tolerance
AUPO930697A0 (en) 1997-09-19 1997-10-09 Walter And Eliza Hall Institute Of Medical Research, The Catalytic antibodies and a method of producing same
GB9720054D0 (en) 1997-09-19 1997-11-19 Celltech Therapeutics Ltd Biological products
EP1103026A1 (en) * 1998-06-01 2001-05-30 Datamark Technologies PTE Ltd Methods for embedding image, audio and video watermarks in digital data
JP4026933B2 (ja) * 1998-06-24 2007-12-26 キヤノン株式会社 情報処理装置及び方法並びに記録媒体
KR100341197B1 (ko) * 1998-09-29 2002-06-20 포만 제프리 엘 오디오 데이터로 부가 정보를 매립하는 방법 및 시스템
CN1129114C (zh) * 1999-03-19 2003-11-26 索尼公司 附加信息嵌入方法和设备,以及附加信息解调方法和设备
US6508709B1 (en) * 1999-06-18 2003-01-21 Jayant S. Karmarkar Virtual distributed multimedia gaming method and system based on actual regulated casino games
US7020285B1 (en) * 1999-07-13 2006-03-28 Microsoft Corporation Stealthy audio watermarking
US7770016B2 (en) * 1999-07-29 2010-08-03 Intertrust Technologies Corporation Systems and methods for watermarking software and other media
US6737957B1 (en) * 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
US6892175B1 (en) * 2000-11-02 2005-05-10 International Business Machines Corporation Spread spectrum signaling for speech watermarking
US8301453B2 (en) * 2000-12-21 2012-10-30 Digimarc Corporation Watermark synchronization signals conveying payload data
US7072487B2 (en) * 2001-01-26 2006-07-04 Digimarc Corporation Watermark detection using adaptive color projections
US6865273B2 (en) * 2002-06-05 2005-03-08 Sony Corporation Method and apparatus to detect watermark that are resistant to resizing, rotation and translation
JP3576993B2 (ja) * 2001-04-24 2004-10-13 株式会社東芝 電子透かし埋め込み方法及び装置
US7131007B1 (en) * 2001-06-04 2006-10-31 At & T Corp. System and method of retrieving a watermark within a signal
US7317811B2 (en) * 2001-11-28 2008-01-08 Sony Electronics Inc. Method to decode temporal watermarks in compressed video
US7433489B2 (en) * 2001-11-28 2008-10-07 Sony Electronics Inc. Method to ensure temporal synchronization and reduce complexity in the detection of temporal watermarks
US7606388B2 (en) * 2002-05-14 2009-10-20 International Business Machines Corporation Contents border detection apparatus, monitoring method, and contents location detection method and program and storage medium therefor
US20050240768A1 (en) * 2002-06-03 2005-10-27 Koninklijke Philips Electronics N.V. Re-embedding of watermarks in multimedia signals
ATE341043T1 (de) 2002-07-22 2006-10-15 Koninkl Philips Electronics Nv Wasserzeichenerkennung
US20060239501A1 (en) * 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
US7480393B2 (en) 2003-11-19 2009-01-20 Digimarc Corporation Optimized digital watermarking functions for streaming data
EP1542226A1 (en) * 2003-12-11 2005-06-15 Deutsche Thomson-Brandt Gmbh Method and apparatus for transmitting watermark data bits using a spread spectrum, and for regaining watermark data bits embedded in a spread spectrum
GB0403331D0 (en) * 2004-02-14 2004-03-17 Koninkl Philips Electronics Nv Watermark detection
GB0403327D0 (en) * 2004-02-14 2004-03-17 Koninkl Philips Electronics Nv Watermark detection
GB0403330D0 (en) * 2004-02-14 2004-03-17 Koninkl Philips Electronics Nv Watermark detection
DE102004021404B4 (de) 2004-04-30 2007-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wasserzeicheneinbettung
JP5017121B2 (ja) 2004-11-30 2012-09-05 アギア システムズ インコーポレーテッド 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
TWI273845B (en) * 2004-12-09 2007-02-11 Nat Univ Chung Cheng Voice watermarking system
JP4519678B2 (ja) * 2005-02-21 2010-08-04 株式会社東芝 電子透かし検出方法及び装置、電子透かし埋め込み方法及び装置
KR100901142B1 (ko) * 2005-08-04 2009-06-04 니폰 덴신 덴와 가부시끼가이샤 전자 워터마크 검출방법, 전자 워터마크 검출장치, 및 프로그램
JP2008064568A (ja) * 2006-09-06 2008-03-21 Osaka Univ 音取得位置特定方法、音取得位置特定システム、特定装置及びコンピュータプログラム
US8116514B2 (en) * 2007-04-17 2012-02-14 Alex Radzishevsky Water mark embedding and extraction
TWI335522B (en) * 2007-06-12 2011-01-01 Univ Nat Changhua Education Method for embedding watermark
GB2452021B (en) * 2007-07-19 2012-03-14 Vodafone Plc identifying callers in telecommunication networks
US8725520B2 (en) * 2007-09-07 2014-05-13 Qualcomm Incorporated Power efficient batch-frame audio decoding apparatus, system and method
JP2009080309A (ja) * 2007-09-26 2009-04-16 Toshiba Corp 音声認識装置、音声認識方法、音声認識プログラム、及び音声認識プログラムを記録した記録媒体
US8108681B2 (en) * 2007-12-03 2012-01-31 International Business Machines Corporation Selecting bit positions for storing a digital watermark
US8099285B2 (en) * 2007-12-13 2012-01-17 Dts, Inc. Temporally accurate watermarking system and method of operation
WO2009077930A1 (en) * 2007-12-17 2009-06-25 Koninklijke Philips Electronics N.V. Resolution-independent watermark detection
WO2010013946A2 (en) 2008-07-29 2010-02-04 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US9117268B2 (en) * 2008-12-17 2015-08-25 Digimarc Corporation Out of phase digital watermarking in two chrominance directions
JP5332602B2 (ja) * 2008-12-26 2013-11-06 ヤマハ株式会社 サービス提供装置
JP5157931B2 (ja) * 2009-01-20 2013-03-06 大日本印刷株式会社 音響信号に対する情報の埋め込み装置および音響信号を利用した位置検出装置
US8351589B2 (en) * 2009-06-16 2013-01-08 Microsoft Corporation Spatial audio for audio conferencing
US9151821B2 (en) * 2009-07-24 2015-10-06 Qualcomm Incorporated Watermarking antenna beams for position determination
WO2011052992A2 (ko) * 2009-10-29 2011-05-05 엘지전자 주식회사 컨텐트에 워터마크를 삽입하고 삽입된 워터마크를 검출하는 방법 및 장치
JP5493850B2 (ja) * 2009-12-28 2014-05-14 富士通株式会社 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
EP2362385A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark signal provision and watermark embedding
EP2362387A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a differential encoding
EP2362384A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermark signal, method for providing binary message data in dependence on a watermarked signal and a computer program using improved synchronization concept
EP2362386A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a two-dimensional bit spreading
EP2362383A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark decoder and method for providing binary message data
CN103190078B (zh) * 2010-09-03 2017-12-08 数字标记公司 用于估计信号间的变换的信号处理器及方法
US8660581B2 (en) * 2011-02-23 2014-02-25 Digimarc Corporation Mobile device indoor navigation
US9270807B2 (en) * 2011-02-23 2016-02-23 Digimarc Corporation Audio localization using audio signal encoding and recognition
WO2013035537A1 (ja) * 2011-09-08 2013-03-14 国立大学法人北陸先端科学技術大学院大学 電子透かし検出装置及び電子透かし検出方法、並びに電子透かしを用いた改ざん検出装置及び改ざん検出方法
US9305559B2 (en) * 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US9384754B2 (en) * 2013-03-12 2016-07-05 Comcast Cable Communications, Llc Removal of audio noise
US9679053B2 (en) * 2013-05-20 2017-06-13 The Nielsen Company (Us), Llc Detecting media watermarks in magnetic field data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080247274A1 (en) * 2007-04-06 2008-10-09 Microsoft Corporation Sensor array post-filter for tracking spatial distributions of signals and noise
US20100286949A1 (en) * 2007-12-28 2010-11-11 Junichi Miyamoto Position determination system, transmission device and reception device, and position determination method

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LAURENCE BONEY等: "Digital Watermarks for Audio Signals", 《PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON MULTIMEDIACOMPUTING AND SYSTEM》 *
PEDRO CANO等: "A Review of Audio Fingerprinting", 《THE JOURNAL OF VLSI SIGNAL PROCEEDING》 *
RYOSUKE KANETO等: "Real-time User Position Estimation in Indoor Environments Using Digital Watermarking for Audio Signals", 《20010 INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107430865A (zh) * 2015-03-24 2017-12-01 汤姆逊许可公司 用于在声场的高保真度立体声响复制表示中嵌入和恢复水印的方法和装置
CN107430864A (zh) * 2015-03-31 2017-12-01 高通技术国际有限公司 在音频信号中嵌入代码
CN107182009A (zh) * 2016-03-10 2017-09-19 联发科技股份有限公司 音频同步方法及相关电子设备
CN110603863A (zh) * 2017-05-02 2019-12-20 株式会社Ntt都科摩 基站装置、用户装置和通信方法
CN110603863B (zh) * 2017-05-02 2023-03-21 株式会社Ntt都科摩 终端、基站装置和通信方法
CN108702558B (zh) * 2018-03-22 2020-04-17 歌尔股份有限公司 用于估计到达方向的方法和装置及电子设备
CN108702558A (zh) * 2018-03-22 2018-10-23 歌尔股份有限公司 用于估计到达方向的方法和装置及电子设备
CN109313909A (zh) * 2018-08-22 2019-02-05 深圳市汇顶科技股份有限公司 评估麦克风阵列一致性的方法、设备、装置和系统
CN113196393A (zh) * 2018-12-21 2021-07-30 尼尔森(美国)有限公司 使用起始相位调制进行加水印的设备和方法
US11375224B2 (en) 2018-12-21 2022-06-28 The Nielsen Company (Us), Llc Apparatus and methods for watermarking using starting phase modulation
CN113223544A (zh) * 2020-01-21 2021-08-06 珠海市煊扬科技有限公司 音频的方向定位侦测装置及方法以及音频处理系统
CN113223544B (zh) * 2020-01-21 2024-04-02 珠海市煊扬科技有限公司 音频的方向定位侦测装置及方法以及音频处理系统
CN113009411A (zh) * 2021-02-25 2021-06-22 浙江德清知路导航研究院有限公司 一种具有定位功能的音频编解码芯片、定位方法及应用

Also Published As

Publication number Publication date
WO2013030339A1 (en) 2013-03-07
AR087763A1 (es) 2014-04-16
EP2751587B1 (en) 2015-10-21
ES2558167T3 (es) 2016-02-02
AU2012300806B2 (en) 2015-04-23
EP2565667A1 (en) 2013-03-06
RU2014111824A (ru) 2015-10-10
AU2012300806A1 (en) 2014-04-10
EP2751587A1 (en) 2014-07-09
CA2846080C (en) 2020-03-10
KR101719194B1 (ko) 2017-04-04
TWI480858B (zh) 2015-04-11
JP5941545B2 (ja) 2016-06-29
US11176952B2 (en) 2021-11-16
KR20140056368A (ko) 2014-05-09
BR112014004778B1 (pt) 2023-12-05
CN103917886B (zh) 2016-03-09
BR112014004778A2 (pt) 2017-06-13
TW201312550A (zh) 2013-03-16
US20140172435A1 (en) 2014-06-19
MX2014002428A (es) 2014-05-27
JP2014527649A (ja) 2014-10-16
HK1198718A1 (zh) 2015-05-29
CA2846080A1 (en) 2013-03-07

Similar Documents

Publication Publication Date Title
CN103917886B (zh) 使用附水印音频信号和麦克风阵列的到达方向估计
US9270807B2 (en) Audio localization using audio signal encoding and recognition
JP6063924B2 (ja) 位置測定システム
JP4783481B1 (ja) 超音波測定方法および超音波測定装置
CN1581765B (zh) 用于处理ofdm信号的方法
Lindo et al. Multiband waveform design for an ultrasonic indoor positioning system
US9769565B2 (en) Method for processing data for the estimation of mixing parameters of audio signals, mixing method, devices, and associated computers programs
Getreuer et al. Ultrasonic communication using consumer hardware
Marchetti et al. An efficient receiver structure for sweep-spread-carrier underwater acoustic links
Ma et al. A combined doppler scale estimation scheme for underwater acoustic OFDM system
CN102255671B (zh) 一种单矢量传感器水声多址通信方法
US9319096B1 (en) Ultrasonic communication between devices
Reddy et al. TDOA computation using multicarrier modulation for sensor networks
Zhu et al. Doppler-resistant orthogonal chirp division multiplexing with multiplex resampling for mobile underwater acoustic communication
Bozzi et al. Acoustic vector sensor underwater communications in the Makai experiment
CN112290975B (zh) 一种用于音频信息隐藏系统的噪声估计接收方法和装置
Dymarski et al. Time and sampling frequency offset correction in audio watermarking
RU2575535C2 (ru) Оценка направления прихода сигнала с использованием аудиосигналов с водяными знаками и массива микрофонов
Zhang et al. Experimental studies of underwater acoustic communications over multipath channels
CN108270492B (zh) 一种伪装声通信的调制与解调方法
Moutinho et al. Indoor global localisation in anchor-based systems using audio signals
Paulo Indoor Location based on Audio Signals
Pinho et al. On Generating Monte Carlo Simulations of Underwater Acoustic Communication Systems with Application to Transmit Beamforming
KR101490046B1 (ko) 단일 반송파 기반 시스템에서의 동기화 방법 및 그 장치
Ravi kumar et al. Bandwidth efficient source localization for sensor networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Munich, Germany

Patentee after: Fraunhofer Application and Research Promotion Association

Address before: Munich, Germany

Patentee before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.