CN107113065B - 通过可听见的声音在设备之间的数据传输的方法和系统 - Google Patents

通过可听见的声音在设备之间的数据传输的方法和系统 Download PDF

Info

Publication number
CN107113065B
CN107113065B CN201580071922.4A CN201580071922A CN107113065B CN 107113065 B CN107113065 B CN 107113065B CN 201580071922 A CN201580071922 A CN 201580071922A CN 107113065 B CN107113065 B CN 107113065B
Authority
CN
China
Prior art keywords
symbol
frequencies
frequency
combination
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580071922.4A
Other languages
English (en)
Other versions
CN107113065A (zh
Inventor
帕斯卡尔·汤姆·格特鲁尔
理查德·弗朗西斯·莱恩
扬·里卡德·马尔登
瑞安·迈克尔·里夫金
墨菲·马丁·斯泰因
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN107113065A publication Critical patent/CN107113065A/zh
Application granted granted Critical
Publication of CN107113065B publication Critical patent/CN107113065B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B11/00Transmission systems employing sonic, ultrasonic or infrasonic waves

Abstract

实施方式总体上涉及通过可听见的声音提供在设备之间的数据传输。在一些实施方式中,一种方法包括将每个数据符号映射到频率组合,其中每个频率组合包括一个或多个频率。该方法还包括生成每个频率的正弦波。该方法还包括添加给定符号的正弦波以获得产生的正弦波。该方法还包括将窗口函数应用于产生的正弦波以获得数据信号。

Description

通过可听见的声音在设备之间的数据传输的方法和系统
相关申请的交叉引用
本申请要求于2015年1月2日提交的题为DATA TRANSMISSION BETWEEN DEVICESOVER AUDIBLE SOUND(通过可听见的声音在设备之间的数据传输)的美国非临时专利申请No.14/588,882的优先权,其全部内容通过引用并入本文。
背景技术
一些移动应用使得用户能够参与社交活动,其中用户的设备可以与物理上靠近的其他设备进行通信。例如,用户可能希望定位在相应物理位置的其他用户。在另一个示例中,用户可能已经拍摄了彼此的一些照片,并且可能希望彼此分享他们的照片。
发明内容
实现总体上涉及通过可听见的声音提供在设备之间的数据传输。在一些实施方式中,一种方法包括将每个数据符号映射到频率组合,其中每个频率组合包括一个或多个频率。该方法还包括生成每个频率的正弦波。该方法还包括添加给定符号的正弦波以获得产生的正弦波。该方法还包括将窗口函数应用于该产生的正弦波以获得数据信号。
关于该方法,在一些实施方式中,数据信号是可听见的。在一些实施方式中,每个符号与频率的唯一组合相关联。在一些实施方式中,数据的每个符号到频率组合的映射基于预定的选择约束。在一些实施方式中,数据的每个符号到频率组合的映射基于预定的选择约束,其中一个或多个预定选择约束包含音乐约束。在一些实施方式中,数据的每个符号到频率组合的映射基于预定的选择约束,其中一个或多个预定选择约束包括选择向数据传输提供乐音的频率。在一些实施方式中,该方法还包括在没有任何间隙的情况下串接符号波形。在一些实施方式中,该方法还包括在有间隙的情况下串接符号波形。
在一些实施方式中,一种系统包括:一个或多个处理器;以及逻辑,该逻辑被编码在一个或多个有形介质中以用于由一个或多个处理器执行。当被执行时,该逻辑可操作以执行操作,该操作包括:将每个数据符号映射到频率组合,其中每个频率组合包括一个或多个频率;生成每个频率的正弦波;添加给定符号的正弦波以获得产生的正弦波;并且将窗口函数应用于该产生的正弦波以获得数据信号。
进一步关于该系统,在一些实施方式中,该数据信号是可听见的。在一些实施方式中,每个符号与频率的唯一组合相关联。在一些实施方式中,数据的每个符号到频率组合的映射基于预定的选择约束。在一些实施方式中,数据的每个符号到频率组合的映射基于预定的选择约束,其中一个或多个预定选择约束包含音乐约束。在一些实施方式中,数据的每个符号到频率组合的映射基于预定的选择约束,其中一个或多个预定选择约束包括选择向数据传输提供乐音的频率。在一些实施方式中,该逻辑在被执行时还可操作以执行包括在没有任何间隙的情况下串接符号波形的操作。在一些实施方式中,该逻辑在被执行时还可操作以执行包括在有间隙的情况下串接符号波形的操作。
在一些实施方式中,一种方法包括检测数据信号中的音调。该方法还包括根据该音调来确定频率。该方法还包括将每个频率组合映射到数据符号,其中每个频率组合包括一个或多个频率。
进一步考虑该方法,在一些实施方式中,该数据信号是可听见的。在一些实施方式中,该方法还包括估计符号相位。在一些实施方式中,该方法还包括根据每个符号来确定数据。
附图说明
图1示出了用于编码数据的示例编码器的框图,该示例编码器可以用于实现本文所述的实施方式。
图2示出了根据一些实施方式的用于编码数据的示例简化流程图。
图3A示出了根据一些实施方式的示例正弦窗口。
图3B示出了根据一些实施方式的示例傅立叶变换。
图4示出了根据一些实施方式的用于解码数据的示例解码器的框图。
图5示出了根据一些实施方式的示例音调检测器的框图。
图6示出了根据一些实施方式的用于解码数据的示例简化流程图。
图7A示出了根据一些实施方式的示例音调。
图7B示出了根据一些实施方式的示例峰。
图8A示出了根据一些实施方式的示例音调窗口。
图8B示出了根据一些实施方式的贡献权重的示例图。
图9示出了可以用于实现本文描述的实施方式的示例服务器设备的框图。
具体实施方式
本文所述的实施方式通过可听见的声音提供设备之间的数据传输。实施方式使用可听见的声音在移动设备之间提供数据传输。在各个实施方式中,系统使用双音多频(DTMF)调制。使用DTMF的实施方式为通过可听见的声音进行数据传输提供了令人愉快的发声协议。
在各个实施方式中,编码器将每个数据符号映射到频率组合,其中每个频率组合包括一个或多个频率。然后,编码器生成每个频率的正弦波。然后,编码器添加给定符号的正弦波以获得产生的正弦波。然后,编码器对该产生的正弦波应用窗口函数以获得数据信号,并且然后传送该数据信号。在各个实施方式中,该数据信号是可听见的。
在各个实施方式中,每个符号与频率的唯一组合相关联。在各个实施方式中,将数据的每个符号映射到频率组合基于预定的选择约束。例如,在一些实施方式中,一个或多个预定选择约束包含音乐约束。在一些实施方式中,一个或多个预定的选择约束包括选择向数据传输提供乐音(musical sound)的频率。
在一些实施方式中,解码器接收数据信号。然后,解码器检测数据信号中的音调(tone)。然后,解码器根据该音调来确定频率。然后,解码器将每个频率组合映射到数据符号,其中每个频率组合包括频率中的一个或多个频率。然后,解码器根据每个符号来确定数据。
本文所描述的实施方式使DTMF的使用适应于通过空气的传输而存活的鲁棒性,该通过空气的传输是比电话语音信道更困难的环境。实施方式提供音调的鲁棒的噪声和运动检测。本文描述的实施方式利用了具有播放和记录声音的能力的智能电话——用于数据通信的潜在的便携式介质。
实施方式解决与声音的数据传输相关联的挑战。这样的挑战可能涉及声音信号被多个传播路径(具有回波)、背景噪声、和多普勒(Doppler)效应劣化(degrade)。实施方式限制计算和电池消耗。实施方式通过声音来传送数据以使得该数据在音频压缩中存活,例如用于在电话会议中使用声音进行传输,这需要使用在可听范围内的音频。实施方式也提供了以这样的方式的通过声音的数据传输,使得传输的声音供人们听起来不会令人不快或痛苦。
图1图示了用于编码数据的示例编码器100的框图,该编码器可以用于实现本文描述的实施方式。如图所示,编码器100包括映射表102、正弦波生成器104和106、加法器108、窗口函数110、和扬声器112。下面结合图2更详细地描述针对编码器100的实施方式。
为了便于图示,图1示出了映射表102、正弦波生成器104和106、加法器108、窗口函数110、和扬声器112中的每一个的一个框。框102、104、106、108、110、和112中的每一个可以表示多个映射表、正弦波生成器、加法器、窗口函数、和扬声器。
图2示出了根据一些实施方式的、用于编码数据的示例简化流程图。参考图1和图2二者,方法在框202中起始,其中编码器100接收数据。然后,编码器100根据接收的数据来确定符号。
在框204中,编码器100将每个数据符号映射到频率组合。在各个实施方式中,每个频率组合包括一个或多个频率。在各个实施方式中,编码器100将每个符号与频率的唯一组合相关联。例如,编码器100可以将不同的符号表示为从N个频率的表中选择的K个频率的组合。为了便于图示,图1示出了K个频率,其中K=2。在各个实施方式中,取决于特定实施方式,K可以是大于2的任何数目。
本文描述的各个实施方式将K>2的泛化称为DTMF以便熟悉。在各个实施方式中,更准确的名称可以是多音多频。在各个实施方式中,对于可能的字母表大小
Figure GDA0002629070330000051
符号是从N个频率的集合中选择的K个音调的组合。在各个实施方式中,编码器100在符号之间不使用间隙。
在各个实施方式中,编码器100选择对于解码器更容易区分的频率组合。这样,如果在解码器处检测到特定频率,则解码器将能够确定相应的符号。
在各个实施方式中,将每个数据符号映射到频率组合是基于预定的选择约束。换言之,当为每个符号选择频率组合时,编码器100应用一个或多个预定的选择约束。编码器100在选择频率组合而不是从不连贯的群组中选择频率时实现各个约束。例如,在一些实施方式中,一个约束可以是编码器100从一组频率中选择K个频率而不进行替换。在一些实施方式中,另一约束可能是编码器100选择彼此之间分开至少2个索引的频率。在一些实施方式中,作为规避符号间干扰的手段,另一约束可以是编码器100要求当前符号与之前符号没有共同的选定频率。
在各个实施方式中,一个或多个预定选择约束包含音乐约束。例如,在各个实施方式中,预定选择约束可以包括编码器100选择向数据传输提供乐音的频率。在一些实施方式中,编码器100选择与预定音阶的音乐音调相对应的频率。例如,在一些实施方式中,编码器100可以选择F#大调五声音阶的八度音程(octave)的音调的频率。相对于给定的基频,具有纯音律(just temperament)的F#五声音阶的一个八度音程具有比例1、9/8、5/5、3/3、2、5/3。在一些实施方式中,编码器100可以向音调频率添加泛音。这样的泛音可以致使所传送的声音类似于特定的乐器(例如,大号),以便实现声音的个性化。
仍然参考图2,在框206中,编码器100生成每个频率的正弦波。与按键式接收器(touch-tone receiver)不同,在空气中广播的信号可能受到由于运动引起的多普勒频移的影响,并且更容易受到背景噪声的影响。在各个实施方式中,编码器100可以包括耐噪声和多普勒(noise and Doppler-tolerant)音调检测器。
图3A图示了根据一些实施方式的示例正弦窗口300。在各个实施方式中,编码器100将音调合成为窗口化的正弦曲线,
Figure GDA0002629070330000075
其中
Figure GDA0002629070330000076
是音调频率。函数w(t)是正弦窗口(也称为余弦窗口),
Figure GDA0002629070330000071
其中T是窗口的大小(例如,对于20个音调/秒而言的50毫秒)。加窗(windowing)在频域中扩散音调能量,因为时域中的乘法在频域中是卷积。
图3B图示了根据一些实施方式的图3A的正弦窗口300的示例傅里叶(Fourier)变换310。在一些实施方式中,正弦窗口w(t)的傅里叶变换是
Figure GDA0002629070330000072
其在|f|=1/(2T)处具有可去除的奇点(singularity)(此点处的表达式变为0/0,但存在极限且极限为Cπ/4)。主瓣在|f|<3/(2T)中。
如上所述,在各个实施方式中,编码器100使用不同频率的K个音调的组合来对符号进行编码。给定N个可能的频率,有
Figure GDA0002629070330000073
个不同符号的字母表。对于字母表中的每个符号,S可以是K指派K个音调频率的不同组合的映射。通过查找符号s的音调频率组合然后对这些音调进行合成和求和来对符号s进行编码,
Figure GDA0002629070330000074
在框208中,编码器100添加给定符号的正弦波。
在框210中,编码器100对所产生的正弦波应用窗口函数以获得数据信号,其中该数据信号包含音调。在各个实施方式中,编码器100通过在没有任何间隙的情况下串接(concatenate)符号波形来对符号序列进行编码。在一些实施方式中,编码器100可以通过在有间隙的情况串接符号波形来对符号序列进行编码。为了传送小的固定长度的数据量,编码器100可以在字母表中保留一个符号值作为特殊的间隔子(spacer)值以标记令牌的开始。这使得接收器能够开始收听中间广播并使用该间隔子来对序列内的符号的相位进行消歧。
在各个实施方式中,编码器100将所产生的正弦波与窗口函数相乘,使得该正弦波具有预定的形状(例如,如图1所示)。如这里更详细地描述的,在各个实施方式中,数据信号是可听见的,并且包含可听音调。
在框212中,编码器100然后传送数据信号。
图4图示了根据一些实施方式的用于解码数据的示例解码器400的框图。如图所示,解码器400包括音调检测器402、麦克风404、音调选择器406、和符号相位估计器408。在各个实施方式中,音调检测器402可以是音调检测器的滤波器库。
为了便于图示,图4对于音调检测器402、麦克风404、音调选择器406、和符号相位估计器408中的每一个示出了一个框。框402、404、406、和408中的每一个可以表示多个音调检测器、麦克风、音调选择器、和符号相位估计器。例如,如上所述,框402可以表示多个音调检测器。
图5示出了根据一些实施方式的、可用于实现图4的音调检测器402的示例音调检测器502、504、506、和508的框图。在各个实施方式中,每个音调检测器502、504、506、和508被调谐到N个频率中的一个频率,并且输出指示该频率的功率的信号。
图6示出了根据一些实现的用于解码数据的示例简化流程图。参考图4和图6,在框602中开始一种方法,其中解码器400接收数据信号。解码器400通过音调检测器402接收数据信号。
在框604中,解码器400检测数据信号中的音调。
如上所述,每个音调检测器502、504、506和508被调谐到N个频率中的一个,并且输出指示该频率的功率的信号。对于每个固定时间,解码器400确定用以构建最大音调信号的最大音调功率。
图7A图示了根据一些实施方式的示例音调702、704、706、和708。
在框606中,解码器400选择音调以确定那些音调的频率。在一些实施方式中,解码器400选择最大的音调以确定频率。例如,解码器400可以选择具有最大功率的两个音调。如下面更详细地描述的,解码器400然后可以使用该最大音调来确定频率组合。
在框608中,解码器400估计符号相位。
图7B图示了根据一些实施方式的示例峰710、712、和714。解码器400识别数据信号的峰(例如,峰710、712和714),以使数据信号内的DTMF符号的符号相位同步。
在各个实施方式中,为了使符号帧同步,解码器400将信号划分成长度为T的帧,每个帧编码一个符号。解码器400使帧的相位同步,以确定什么时间间隔与帧相对应。
为了估计帧相位,解码器400计算
Figure GDA0002629070330000101
然后将帧相位估计为τ=arg maxτamax(τ)modulo T.。这允许在时间偏移τn=τ+Tn.处引用第n帧中的相关。
在框610中,解码器400然后将每个频率组合映射到符号,以便根据该频率组合来确定符号。如上所述,每个频率组合包括频率中的一个或多个频率。
在框612中,解码器400然后根据符号来确定数据。然后,在固定时间出现干净地接收的广播来作为来自音调检测器中的K个音调检测器的大的输出和来自音调检测器中的其他音调检测器的小输出。在一些实施方式中,解码器400然后使用逆映射S-1来确定由K个大音调频率的该组合表示的符号。
取决于诸如计算效率、噪声鲁棒性、和对运动(多普勒频移)的鲁棒性的目标的重要性,存在可以实现音调检测器的几种方式。下面更详细地描述这样的检测器的示例实施方式。
在一些实施方式中,解码器400可以使用简单的音调检测器。例如,音调检测器402可以是简单的音调检测器。在各个实施方式中,在相位上不相关的简单音调检测器。对于用于检测频率
Figure GDA0002629070330000102
的音调的简单音调检测器,检测器400可以计算:
Figure GDA0002629070330000103
Figure GDA0002629070330000104
第一行下转换为复基带,并且第二行估计本地信号功率,其中h(t)是以下形式的二阶伽玛(Gamma)平滑滤波器:
Figure GDA0002629070330000105
其中τ是控制滤波器带宽的时间常数。
如前所述,音调的能量通过音调窗口在傅立叶域中扩散。应选择检测器滤波器h(t)的带宽,使得其捕获大部分音调的能量。在各个实施方式中,带宽足够宽以容忍多普勒频移。如果最大可能速度为vmax,则观察到的音调频率满足:
Figure GDA0002629070330000111
其中c是声速(在海平面附近为340m/s)。
相应地,傅立叶域中的较宽带宽意味着脉冲响应h(t)应当比窗口w(t)更集中在时域中。为了实现更多的噪声降低,解码器400可以应用第二平滑滤波器g(t),使得检测器的整体效果在整个窗口长度上聚集,
Figure GDA0002629070330000112
虽然简单的音调检测器在音调相位上不相关,但是该公式是实用且可靠的音调检测器。简单的音调检测器可能不能充分利用b(t)的复相,因为在将最终分值与g(t)聚合之前已经通过平方幅值(square magnitude)运算去除了它。
在一些实施方式中,解码器400可以使用相关音调检测器,以充分利用b(t)的复相。例如,音调检测器402可以是相关音调检测器。在各个实施方式中,相关音调检测器是相位上相关的更复杂的音调检测器,其相对于简单检测器提高了噪声鲁棒性。
相关音调检测器以类似的方式开始,首先调制以下移到复基带
Figure GDA0002629070330000113
然后进行抽取(decimation)。由于多普勒频移,信号上存在频率的残余调制
Figure GDA0002629070330000114
基带信号在0Hz附近仅占用小带宽,因此抽取可能相当激进。解码器400通过单元取平均来执行该抽取。然后,解码器400利用伽马滤波器进行平滑,并且然后对结果进行下采样。
以下步骤是相关音调检测器与简单音调检测器不同的地方。给定时间偏移τ和多普勒频移δ,抽取的基带信号与DTMF音调窗口相关,
Figure GDA0002629070330000115
图8A图示了根据一些实现的示例音调窗口800。如图所示,解码器400使用M=10个块来对音调窗口w(t)执行块贡献权重的最小二乘拟合。
图8B图示了根据一些实施方式的贡献权重810的示例图。示出的是每个块的单独贡献权重。
在各个实施方式中,当(τ,δ)匹配信号的真实时间和频率偏移时,该值是最大的。在一些实施方式中,解码器400在网格上采样(τ,δ)以执行强力搜索(brute forcesearch)。
为了有效率地计算相关,解码器400将积分区间[0,T]近似为M个段,并将调制近似为在每个段上具有恒定相位,
Figure GDA0002629070330000121
其中M是块的数目。
以下示出了解码器400如何通过另一近似来得到进一步的效率。块相关
Figure GDA0002629070330000122
与窗口的块相对,其是平滑函数。解码器400可以考虑下面形式的近似
Figure GDA0002629070330000123
其中wm是与w(t)的块相对应的滤波器。这些滤波器的这些脉冲响应被允许具有一些重叠,并且最小二乘法拟合其被使用以使得它们的组合近似于w(t)。
在一些实施方式中,解码器400使音调相关准则化,使得系统不变地将输入乘以恒定比例因子。在一些实施方式中,解码器400还对音调相关进行准则化以使得噪声被准则化。以允许将产生的分值与固定的常数阈值进行比较的方式对噪声进行准则化以确定信号质量。
音调相关是功率信号,因为它们是平方的幅度。如果基带信号是白高斯噪声,则音调相关与x2(2)成正比地分布,x2(2)具有与基带噪声方差成比例的平均值。在一些实施方式中,为了有效的准则化,解码器400可以将音调相关除以噪声平均值的局部估计。
对于每个时间τ,解码器400可以执行以下操作。在一些实施方式中,解码器400对于在δ上的最大化的每个音调频率
Figure GDA0002629070330000131
建立音调相关的列表:
Figure GDA0002629070330000132
在一些实施方式中,解码器400然后对列表进行排序。假定信噪比(SNR)足够大,则最大的K个相关对应于DTMF音调,而较低的(N-K)个值对应于噪声。令Φnoise是与较低(N-K)值相对应的频率集合。(找到第K个最大值就足够了,因为列表不需要完全排序)。
在一些实施方式中,解码器400然后将在δ和在Φnoise中的频率上对音调相关求和:
Figure GDA0002629070330000133
在一些实施方式中,解码器400应用平滑滤波器g来在时间上平滑噪声相关平均值
Figure GDA0002629070330000134
然后,量μnoise(t)近似地与基带噪声方差成比例。音调相关通过逐点除以
Figure GDA0002629070330000135
而准则化,
Figure GDA0002629070330000136
随后仅使用具有最佳匹配多普勒频移的相关,因此它可以在δ上最大化,
Figure GDA0002629070330000137
在各个实施方式中,当解码器400对符号进行解码时,干净地接收的DTMF符号应当产生K个大音调相关和(N-K)个小的音调相关。在各个实施方式中,解码器400可以应用以下预定规则中的一个或多个以用于广播检测和避免由于干扰所引起的错误。下面更详细地描述这样的预定规则。
在一些实施方式中,少于K个的大的相关可以表明没有DTMF广播是活动的,并且所听到的任何音调都是背景噪声。在一些实施方式中,多于K个的大音调表明存在对DTMF广播的强烈干扰,并且如果第K个最大相关与第(K+1)个最大相关没有很好地分离,则无法进行无歧义的解码。按照这些规则,解码器可以识别似乎存在有效DTMF符号的帧,并且在解码中仅包括这些帧。
本文描述的实施方式提供了各种益处。例如,实施方式解决与声音的数据传输相关联的挑战。这样的挑战可能包含声音信号由于多个传播路径(具有回波)、背景噪声、和多普勒效应劣化。实施方式限制计算和电池消耗。实施方式通过声音来传送数据以使得该数据在音频压缩中存活,例如用于在电话会议中使用声音进行传输,这需要使用在可听范围内的音频。实施方式也提供了以这样的方式的通过声音的数据传输,使得传输的声音供人们听起来不会令人不快或痛苦。
尽管可以以特定顺序呈现步骤、操作、或计算,但是可以在特定实施方式中改变该顺序。取决于具体的实施方式,步骤的其他排序是可能的。在一些特定实施方式中,可以同时执行在本说明书中依序示出的多个步骤。而且,一些实施方式可能不具有所示的所有步骤和/或可以具有替代本文所示的步骤或者除其以外的其它步骤。
虽然系统102被描述为执行在本文的实施方式中描述的步骤,但是系统102的任何合适的组件或组件的组合或与系统102相关联的任何合适的一个或多个处理器可以执行所描述的步骤。
图9图示了可用于实现本文所述的实施方式的示例服务器设备900的框图。在一些实施方式中,服务器设备900包括处理器902、操作系统904、存储器906、和输入/输出(I/O)接口908。服务器设备900还包括社交网络引擎910和媒体应用912,其可以存储在存储器906中或者存储在任何其它合适的存储位置或计算机可读介质上。媒体应用912提供使得处理器902能够执行本文描述的功能和其他功能的指令。
为了便于图示,图9对于处理器902、操作系统904、存储器906、I/O接口908、社交网络引擎910、和媒体应用912中的每一个示出了一个框。这些框902、904、906、908、910、和912可以表示多个处理器、操作系统、存储器、I/O接口、网络引擎、和应用程序。在其他实施方式中,服务器设备900可以不具有所示的所有组件和/或可以具有包括替代本文所示的元件或除其以外的其他类型的元件的其他元件。
虽然已经关于其特定实施例描述了说明书,但是这些特定实施例仅仅是说明性的而不是限制性的。示例中说明的概念可以应用于其他示例和实施方式。例如,本文在社交网络系统的场境(context)下描述了一些实施方式。然而,本文描述的实施方式可以应用于除了社交网络之外的场境中。
注意,本公开中描述的功能块、方法、设备、和系统可以被整合或划分成本领域技术人员已知的系统、设备、和功能块的不同组合。
可以使用任何合适的编程语言和编程技术来实现特定实施例的例程。可以采用不同的编程技术,诸如面向过程或面向对象的编程技术。例程可以在单个处理设备或多个处理器上执行。尽管步骤、操作、或计算可以以特定顺序呈现,但是在不同的特定实施例中可以改变顺序。在一些特定实施例中,可以同时执行在本说明书中依序示出的多个步骤。
“处理器”包括处理数据、信号或其他信息的任何合适的硬件和/或软件系统、机构或组件。处理器可以包括具有通用中央处理单元、多个处理单元、用于实现功能的专用电路的系统,或其他系统。处理不必限于地理位置,或者具有时间限制。例如,处理器可以“实时”、“离线”、以“批量模式”等来执行其功能。可以通过不同的(或相同的)处理系统在不同的时间和不同的位置执行处理的部分。计算机可以是与存储器通信的任何处理器。存储器可以是任何合适的数据存储、存储器和/或非暂时性计算机可读存储介质,包括电子存储设备,诸如随机存取存储器(RAM)、只读存储器(ROM)、磁存储设备(硬盘驱动器等)、闪存、光学存储设备(CD或DVD等)、磁盘或光盘、或适于存储用于由处理器执行的指令(例如,程序或软件指令)的其他有形介质。例如,可以使用诸如硬件存储设备的有形介质来存储可包括可执行指令的控制逻辑。指令也可以包含在并且被提供为电子信号,该电子信号例如处于从服务器(例如,分布式系统和/或云计算系统)递送的软件即服务(SaaS))的软件的形式。

Claims (17)

1.一种用于数据传输的计算机实现的方法,所述方法包括:
对于一个或多个数据的符号中的每个符号,将所述符号映射到频率组合,其中,所述频率组合包括一个或多个频率和一个或多个泛音;
生成所述频率组合中的每个频率的正弦波;
添加所述频率组合中的相应频率的所述正弦波以获得产生的正弦波;
对所述产生的正弦波应用窗口函数以获得可听见的数据信号;以及
由扬声器传输所述可听见的数据信号,其中,所述可听见的数据信号基于所述一个或多个泛音来类似于由特定乐器产生的声音。
2.根据权利要求1所述的方法,其中,每个符号与频率的唯一组合相关联。
3.根据权利要求1所述的方法,其中,将所述符号映射到所述频率组合是基于一个或多个预定选择约束。
4.根据权利要求3所述的方法,其中,所述一个或多个预定选择约束中的至少一个预定选择约束包含音乐约束。
5.根据权利要求3所述的方法,其中,所述一个或多个预定选择约束包括通过乐音的数据传输。
6.根据权利要求1所述的方法,其中,添加所述正弦波包括:在没有任何间隙的情况下串接符号波形。
7.根据权利要求1所述的方法,其中,添加所述正弦波包括:在有间隙的情况下串接符号波形。
8.一种用于数据传输的系统,所述系统包括:
一个或多个处理器;以及
存储器,所述存储器具有存储于其上的指令,所述指令在由所述一个或多个处理器执行时致使所述一个或多个处理器执行操作,所述操作包括:
对于一个或多个数据的符号中的每个符号,将所述符号映射到频率组合,其中,所述频率组合包括一个或多个频率和一个或多个泛音;
生成所述频率组合中的每个频率的正弦波;
添加所述频率组合中的相应频率的所述正弦波以获得产生的正弦波;
对所述产生的正弦波应用窗口函数以获得可听见的数据信号;以及
经由扬声器传输所述可听见的数据信号,其中,所述可听见的数据信号基于所述一个或多个泛音来类似于由特定乐器产生的声音。
9.根据权利要求8所述的系统,其中,每个符号与频率的唯一组合相关联。
10.根据权利要求8所述的系统,其中,将所述符号映射到所述频率组合是基于一个或多个预定选择约束。
11.根据权利要求10所述的系统,其中,所述一个或多个预定选择约束中的至少一个预定选择约束包含音乐约束。
12.根据权利要求10所述的系统,其中,所述一个或多个预定选择约束包括通过乐音的数据传输。
13.根据权利要求8所述的系统,其中,添加所述正弦波包括:在没有任何间隙的情况下串接符号波形。
14.根据权利要求8所述的系统,其中,添加所述正弦波包括:在有间隙的情况下串接符号波形。
15.一种用于数据传输的计算机实现的方法,所述方法包括:
检测可听见的数据信号中的音调,所述可听见的数据信号基于一个或多个泛音来类似于由特定乐器产生的声音;
根据所述音调来确定频率;以及
对于所确定的频率中的一个或多个频率和所述一个或多个泛音的每个特定频率组合,基于所述特定频率组合被映射到在映射表中的特定数据符号而识别所述特定数据符号。
16.根据权利要求15所述的方法,还包括:估计符号相位。
17.根据权利要求15所述的方法,根据每个符号来确定数据。
CN201580071922.4A 2015-01-02 2015-12-29 通过可听见的声音在设备之间的数据传输的方法和系统 Active CN107113065B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/588,882 2015-01-02
US14/588,882 US9941977B2 (en) 2015-01-02 2015-01-02 Data transmission between devices over audible sound
PCT/US2015/067862 WO2016109536A1 (en) 2015-01-02 2015-12-29 Data transmission between devices over audible sound

Publications (2)

Publication Number Publication Date
CN107113065A CN107113065A (zh) 2017-08-29
CN107113065B true CN107113065B (zh) 2021-01-15

Family

ID=55487023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580071922.4A Active CN107113065B (zh) 2015-01-02 2015-12-29 通过可听见的声音在设备之间的数据传输的方法和系统

Country Status (4)

Country Link
US (1) US9941977B2 (zh)
EP (1) EP3241292B1 (zh)
CN (1) CN107113065B (zh)
WO (1) WO2016109536A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107645343B (zh) 2016-07-20 2021-10-22 阿里巴巴集团控股有限公司 基于声波的数据发送/接收方法及数据传输系统
US20210105167A1 (en) * 2017-12-06 2021-04-08 Xinow Ltd. Audio transmission and reception
US11146836B1 (en) * 2020-05-20 2021-10-12 Lisnr Detection and synchronization of audio transmissions using complex audio signals

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6433673B1 (en) * 1998-09-25 2002-08-13 Conexant Systems, Inc. Digital enunciator, process and communication system employing same
US7269557B1 (en) * 2000-08-11 2007-09-11 Tellme Networks, Inc. Coarticulated concatenated speech
US20030212549A1 (en) 2002-05-10 2003-11-13 Jack Steentra Wireless communication using sound
US20030220801A1 (en) * 2002-05-22 2003-11-27 Spurrier Thomas E. Audio compression method and apparatus
US7349481B2 (en) 2002-07-01 2008-03-25 Qualcomm Incorporated Communication using audible tones
GB0516794D0 (en) 2005-08-16 2005-09-21 Vodafone Plc Data transmission
US8667688B2 (en) 2006-07-05 2014-03-11 United Technologies Corporation Method of assembly for gas turbine fan drive gear system
US8276025B2 (en) * 2008-06-06 2012-09-25 Maxim Integrated Products, Inc. Block interleaving scheme with configurable size to achieve time and frequency diversity
US8638761B2 (en) * 2010-10-06 2014-01-28 Qualcomm Incorporated Low-latency interleaving for low-density parity-check (LDPC) coding

Also Published As

Publication number Publication date
US20160197682A1 (en) 2016-07-07
CN107113065A (zh) 2017-08-29
EP3241292B1 (en) 2020-08-05
WO2016109536A1 (en) 2016-07-07
EP3241292A1 (en) 2017-11-08
US9941977B2 (en) 2018-04-10

Similar Documents

Publication Publication Date Title
US11176952B2 (en) Direction of arrival estimation using watermarked audio signals and microphone arrays
Yerramalli et al. Optimal resampling of OFDM signals for multiscale–multilag underwater acoustic channels
CN109597022A (zh) 声源方位角运算、定位目标音频的方法、装置和设备
KR20190032368A (ko) 음파를 통한 데이터 전송/수신 방법 및 데이터 송신 시스템
ElMoslimany et al. An underwater acoustic communication scheme exploiting biological sounds
CN107113065B (zh) 通过可听见的声音在设备之间的数据传输的方法和系统
JP5567150B2 (ja) 差分符号化を用いたウォーターマーク生成器、ウォーターマーク復号器、バイナリーメッセージデータに基づいてウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム
US8615394B1 (en) Restoration of noise-reduced speech
Han et al. Experimental demonstration of underwater acoustic communication using bionic signals
Sabra et al. Ray-based blind deconvolution in ocean sound channels
WO2015135295A1 (zh) 一种干扰环境下随机接入信号的检测方法、装置和系统
Berger et al. A simple and effective noise whitening method for underwater acoustic orthogonal frequency division multiplexing
Wan et al. Fine Doppler scale estimations for an underwater acoustic CP-OFDM system
CN109920444B (zh) 回声时延的检测方法、装置以及计算机可读存储介质
US9319096B1 (en) Ultrasonic communication between devices
CN109495418B (zh) Ofdm信号同步方法、装置和计算机可读存储介质
US20190324117A1 (en) Content aware audio source localization
Socheleau Cyclostationarity of communication signals in underwater acoustic channels
Cho et al. Quality enhancement of audio watermarking for data transmission in aerial space based on segmental SNR adjustment
CN108270492B (zh) 一种伪装声通信的调制与解调方法
Jiang et al. Doppler scale estimation for underwater acoustic communications using Zadoff-Chu sequences
Ferrao Underwater masked carrier acoustic communication: modeling and analysis
US20170169830A1 (en) Method and apparatus for inserting data to audio signal or extracting data from audio signal based on time domain
Choi et al. Reverberation-robust acoustic indoor localization.
JP2018170640A (ja) マルチトーン信号検出装置、マルチトーン信号検出方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

GR01 Patent grant
GR01 Patent grant