CN104126279B

CN104126279B - 调制设备、解调设备、音频传输系统和解调方法

Info

Publication number: CN104126279B
Application number: CN201480000472.5A
Authority: CN
Inventors: 森口翔太
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2013-02-21
Filing date: 2014-02-13
Publication date: 2018-02-02
Anticipated expiration: 2034-02-13
Also published as: JP6255946B2; KR20140128942A; TWI555007B; CN104126279A; US9473252B2; US20150036464A1; EP2849365B1; KR101572552B1; EP2849365A4; WO2014129370A1; EP2849365A1; JP2014187686A; TW201440038A

Abstract

一个问题是增加在使用声音作为传输介质来传输数据的系统中从声音中提取数据的可能性。在使传输定时在多个频带当中偏移的同时传输帧，由此与仅使用一个频带来传输一帧的情况相比，获得对于多径衰落、噪声混合等的容限并可以预期实质传输率的改进。当选择构成帧的块时，由于在采集叠加有要选择的块的声音所需的时间段变得更短，因此即使发生了实质数据传输率减小的现象，也可以抑制速率的减小。

Description

调制设备、解调设备、音频传输系统和解调方法

技术领域

本发明涉及使用声音(声波)作为传输介质来传输数据的技术。

背景技术

作为使用音频信号或声音(声波)作为传输介质来传输数据的技术，已知了专利文献1和2中所描述的技术。在专利文献1中所描述的技术中，在发声侧的调制设备利用数据码对扩频码进行调制，对调制后的扩频码进行差分编码，乘以载波信号，进行频移并且输出差分码作为调制信号。在声音采集侧的解调设备对关于一段差分码具有一定延迟时间的输入调制信号施加延迟检测，检测延迟检测信号波形与扩频码之间的同步，并且基于所检测到的同步点的峰极性(peak polarity)来对数据码进行解调。在专利文献2中所描述的技术中，借助于振幅调制将电子水印嵌入音频信号中，并且基于振幅波动的时间特征和强度特征来从音频信号中提取电子水印。

引用列表

专利文献

专利文献1：JP-A-2010-288246

专利文献2：JP-A-2006-251676

发明内容

技术问题

另一方面，当使用声音来传输数据时，已知一种将数据叠加在特定频带内的声音上的系统。在该系统中，考虑了以下问题。例如，当数据传输的环境是具有大量混响声(反射声)的空间时或者当作为发声装置的扬声器和作为接收装置的麦克风没有直接面向彼此时，反射声的影响(所谓的多径衰落)发生，用于数据传输的频带内的声音减少或者音量级降低，并且可能无法提取叠加数据。此外，当从外部混合了具有符合用于数据传输的频带的频率的噪声(例如，车辆的刹车声、设备的噪声等)时，可能无法提取叠加数据。在将数据叠加在属于特定频带的声音上的系统中，会发生诸如多径衰落或噪声混合之类的现象，并且可能无法从声音中提取数据。

因此，本发明的目的在于增加在使用声音作为传输介质来传输数据的系统中从声音中提取数据的可能性。

解决问题的方案

为了解决如上所述的问题，根据本发明的一方面的调制设备包括：延迟单元，其被配置为将与一个单位传输数据对应的帧的传输开始定时延迟预定时间段；以及调制信号生成单元，其被配置为通过使用传输开始定时经延迟单元延迟的帧来对取决于传输开始定时而不同的频带内的载波进行调制，从而生成调制信号。

调制设备可通过进一步包括声音发出单元来构成，该声音发出单元被配置为根据调制信号生成单元生成的调制信号来发出声音。

此外，根据本发明的一方面的解调设备包括：分离单元，其被配置为使用与一个单位传输数据对应且具有延迟了预定时间段的传输开始时间的帧来将根据调制信号所发出的声音的音频信号分离成属于各个频带的信号分量，其中该调制信号是通过对取决于传输开始定时而不同的频带内的载波进行调制而生成的；以及帧生成单元，其被配置为基于分离单元所分离的每个信号分量来对每个预定时间段内与帧的一部分对应的块进行解调，并且对根据指定的选择方法从所解调的块组中选择的块进行连接以生成帧。

该解调设备可被配置成使得由调制信号生成单元调制的载波的频带是n个频带，其中n表示正整数，并且帧生成单元针对将一帧叠加在n个频带中的任一个中的时间段的每个1/n的时间段来基于每个信号分量对块进行解调。

该解调设备可被配置成使得每个频带均包括带宽窄于对应的频带的多个窄带频率，调制信号生成单元通过使得属于与帧对应的两个窄带频率的信号的输出根据帧的每位的值在信号之间反转，分离单元将音频信号分离为属于在每个频带内所包括的两个窄带频率的信号，并且帧生成单元将属于两个窄带频率的信号之差与阈值进行比较并且对所述位的每个值进行解码以对块进行解调。

该解调设备可被配置成使得帧生成单元计算由分离单元分离的每个信号分量的上包络和下包络，并且使用所算出的上包络和下包络之间的时变值作为阈值。

此外，根据本发明的一方面的音频通信系统包括：发送设备，其用于发出作为声音的音频信号，所述音频信号上叠加有要被发送的传输数据；以及接收设备用于从发送设备所发出的声音中提取出传输数据，其中，该发送设备包括：延迟单元，其被配置为将与一个单位的传输数据对应的帧的传输开始定时延迟预定时间段；调制信号生成单元，其被配置为通过使用传输开始定时经延迟单元延迟的帧来对取决于传输开始定时而不同的频带内的载波进行调制，从而生成调制信号；以及声音发出单元，其被配置为根据调制信号生成单元生成的调制信号来发出声音，并且接收设备包括：声音采集单元，其被配置为采集从声音发出单元发出的声音并输出音频信号；分离单元，其被配置为将声音采集单元所输出的音频信号分离为属于各个频带的信号分量；以及帧生成单元，其被配置为基于分离单元所分离的每个信号分量来对每个预定时间段内与帧的一部分对应的块进行解调，并且对根据指定的选择方法从所解调的块组中选择的块进行连接以生成帧。

此外，根据本发明的一方面的程序是一种使得计算机执行如下步骤的程序：分离步骤，使用与一个单位传输数据对应且具有延迟了预定时间段的传输开始时间的帧来将根据调制信号所发出的声音的音频信号分离成属于各个频带的信号分量，该调制信号是通过对取决于传输开始定时而不同的频带内的载波进行调制而生成的；以及帧生成步骤，基于通过分离步骤分离的每个信号分量来对每个预定时间段内与帧的一部分对应的块进行解调，并且对根据指定的选择方法从所解调的块组中选择的块进行连接以生成帧。

根据本发明的一方面的一种解调方法包括：分离步骤，使用与一个单位传输数据对应且具有延迟了预定时间段的传输开始定时的帧来将根据调制信号所发出的声音的音频信号分离成属于各个频带的信号分量，该调制信号是通过对取决于传输开始定时而不同的频带内的载波进行调制而生成的；以及帧生成步骤，基于通过分离步骤分离的每个信号分量来对每个预定时间段内与帧的一部分对应的块进行解调，并且对根据指定的选择方法从所解调的块组中选择的块进行连接以生成帧。

发明的有益效果

根据本发明，可以增加在使用声音作为传输介质来传输数据的系统中从声音中提取数据的可能性。

附图说明

图1是示出根据本发明的实施例的音频传输系统的配置示例的框图。

图2是示出发送设备的调制单元的配置示例的框图。

在图3中，(a)是示出数据的帧结构的示例的图，(b)是概念性地示出帧与块之间的关系的图。

图4是示出帧的传输定时的概念图。

图5是示出差分信号的概念图。

图6是示出接收设备的解调单元的配置示例的框图。

图7是示出包络处理的过程示例的流程图。

图8是示出包络处理的结果的曲线图。

图9是示出数据检测触发发生单元的配置示例的框图。

图10是示出数据检测处理的过程示例的流程图。

图11是示出同步符号的检测过程的概念图。

图12是示出当提取块以构成帧时的规则的概念图。

图13是示出发送设备的调制单元的另一配置示例的框图。

图14是示出接收设备的解调单元的另一配置示例的框图。

图15是示出发送设备的调制单元或接收设备的解调单元的配置示例的框图。

具体实施方式

[1.音频传输系统的概述]

根据本发明的实施例的音频传输系统是一种在将声音(声波) 作为传输介质的情况下发送和接收要传输的信息的系统。该音频传输系统至少包括在将信息叠加在音频信号时发出声音的发送设备以及采集声音并提取信息的接收设备。由于发出叠加有信息的声音对应于信息的发送，因此在下文中，按照需要描述为发送设备发送信息。此外，由于采集叠加有信息的声音对应于信息的接收，因此下文中，按照需要描述为接收设备接收信息。

虽然在例如以下情形(1)至(3)中使用音频传输系统，但是本发明不一定限于这些示例。

(1)用于为商品或服务做广告的信息叠加在声音上并从设在有多个用户在场的位置(诸如，道路或商店)处的发送设备传输到每个用户携带的接收设备(诸如，智能电话)。

(2)室内的电视设备用作发送设备，例如与电视节目相关的信息叠加在声音上并从该电视设备传输到用户使用的接收设备(诸如，智能电话或个人计算机)。

(3)多个用户携带的移动装置(诸如，智能电话)中的一个用作发送设备，其他移动装置用作接收设备，并且诸如用户的联系人信息之类的个人信息叠加在声音上并从发送设备传输到接收设备。

在本实施例中，时序上重复地传输要传输的信息。例如，在(1) 的示例中，将用于为商品或服务做广告的同一信息从发送设备重复传输到接收设备。接收设备在可以正常接收信息时执行诸如信息显示之类的处理。当然，要传输的信息可被传输一次，而不是重复传输。

在(1)至(3)的情形下，要传输的信息可叠加在听不见的区域内的声音上或者叠加在听不见的区域内的声音上的信息可进一步叠加在属于可听见区域的音乐或语音(诸如，背景音乐)上。替选地，要传输的信息可叠加在听不见的区域内的声音上，而没有可听见区域内的音乐或语音。

[2.音频传输系统的整体配置]

图1是示出音频传输系统的配置示例的框图。这里，虽然为了简化描述而示出包括发送设备1和接收设备2在内的最小配置，但是发送设备1和接收设备2中的每一个均可包括除了图中所示的配置外的配置。

发送设备1包括调制单元10、输出单元11和扬声器12。调制单元10是根据本发明的调制设备的示例，并且是用于通过要传输的传输数据D对属于高频带的载波进行调制并叠加在音频数据S上的装置。本文中所使用的术语“高频带”是比人类可听见的声音的频带的上限值(从十几kHz到约20kHz)高的频带。例如，在(1)的示例中，音频数据S是诸如背景音乐之类的音乐或者道路上或商店里的语音，以及传输数据D是用于为商品或服务做广告的信息。音频数据S 和传输数据D可存储在例如发送设备1的存储介质中或者可从发送设备1的外部提供给发送设备1。输出单元11包括D/A转换器和放大器，D/A转换器将从调制单元10输出的数字信号转换为模拟信号，放大器对从D/A转换器输出的模拟信号进行放大并将放大后的模拟信号提供给扬声器12。扬声器12是用于根据从输出单元11输入的模拟信号发出声音的发声单元。所发出的声音通过空间(空气)传播并且由接收设备2的麦克风20采集。

接收设备2包括麦克风20、输入单元21和解调单元22。麦克风20是用于采集从扬声器12发出的声音并根据该声音输出音频信号的声音采集单元。输入单元21包括放大器和A/D转换器，放大器对从麦克风20输出的音频信号进行放大，A/D转换器将从放大器输出的模拟音频信号转换为数字信号。解调单元22是根据本发明的解调设备的示例，并且从A/D转换器输出的数字信号中解调出传输数据D。传输数据D是具有“1”和“0”的位流，并且用于预定目的，例如，被提供给连接至接收设备2的显示设备(未示出)并在显示设备上显示为信息，或者被提供给连接至接收设备2的通信设备(未示出)并从通信设备传输到外部。

发送设备1的调制单元10和接收设备2的解调单元22中的每一个的配置可由硬件实现或者可通过硬件与软件的协作来实现。例如，如图15所示，当调制单元10的配置通过硬件与软件的协作来实现时调制单元10的硬件被配置为计算机。在这种情况下，如图15 所示，调制单元10至少包括具有微处理器、RAM等的控制单元1000 以及作为大容量存储装置的存储单元1001(诸如硬盘)。控制单元 1000的微处理器将存储在存储单元1001中的程序读取在RAM上，并执行所读取的程序，由此实现调制单元10的各配置(以下描述的延迟装置、LPF、VCO、加法器等)。此外，当解调单元22的配置通过硬件与软件的协作来实现时，解调单元22的硬件是图15中所示的配置。在这种情况下，控制单元1000的微处理器将存储在存储单元1001 中的程序读取在RAM上，并执行所读取的程序，由此实现解调单元 22的各配置(下文描述的HPF、STFT单元、减法器、LPF、DC截止单元、二值化单元、数据检测单元、数据检测触发发生单元等)。调制单元10和解调单元22可包括除了图15所示的配置外的配置(例如，操作单元、显示单元、通信单元等)。

[3.发送设备中的调制单元的配置]

图2是示出发送设备1的调制单元10的配置示例的图。调制单元10包括作为音频数据S的处理系统的LPF101，并且包括作为传输数据D的处理系统的LPF1021至1023、VCO(压控振荡器)1031 至1033、延迟装置1041和1042、以及加法器105。LPF101连接至加法器105。LPF1021至1023分别通过VCO1031至1033连接至加法器105。LPF1021和LPF1022通过延迟装置1041连接在一起，并且LPF1022和LPF1023通过延迟装置1042连接在一起。以下将描述各个单元的详情。

[3-1.传输数据的结构]

在描述发送设备1的各个单元的具体处理内容之前，首先，将描述发送设备1传输的传输数据的结构。如上所述，时序上重复地从发送设备1传输要传输的传输数据。重复传输的一个单位被称为帧。图3的(a)是示出帧的结构的示例的图。一帧F从帧的头部起依次具有用于寻找帧的头部的同步符号、包括有与帧的属性相关的信息 (诸如帧长)的帧头(header)、包括有实际数据的有效载荷、以及与帧的后部相对应的帧尾(footer)。同步符号的数据长度和帧头的数据长度中的每一个均是预定的位数，例如约若干位。

在接收设备2中，一帧被分成n(其中，n为正整数，并且在本实施例中，例如，n＝3)个单元，并且以所分割的单元进行解调。一个分割单元被称为一个块。图3的(b)是概念地示出帧与块之间的关系的图。一帧具有数据长度相同的三个块a、b和c。在作为帧的头部的块a中，一定包括同步符号和帧头。在作为帧的尾部的块c 中，一定包括帧尾。即，同步符号和帧头的数据长度以及帧尾的数据长度中的每一个都比一个块的数据长度短。

[3-2.帧传输时使用的频带和传输定时]

发送设备1使用不同频带并在各个频带内重复传输一帧。此时，发送设备1进行控制以使每个频带内的每个帧的传输开始定时延迟以下描述的预定时间段，使得传输开始定时在各帧之间不同。图4 是示出帧的传输开始定时的概念图。在该图中，符号“a”是指块a，符号“b”是指块b，以及符号“c”是指块c。F1、F2和F3是指传输数据的载波的各频带。

如图4所示，发送设备1开始在延迟预定时间段的同时传输不同频带F1、F2和F3的每一个内的每一帧，所述预定时间段即是与传输一帧所需的时间段(或者，将一帧叠加在特定频带内的时间段)的 1/n(在本实施例中，1/3)相对应的时间段。例如，在频带F3内帧的头部处的块a的传输始于时间t1，在频带F2内块a的传输始于时间t2，以及在频带F1内块a的传输始于时间t3。相应地，紧接上述帧的帧的传输开始时间恒定地延迟了与一帧的传输时段的1/3对应的时间段，以使得在频带F3内紧接上述帧的帧的传输开始定时被设为时间t4、在频带F2内被设为时间t5以及在频带F1内被设为时间 t6。因此，上述的“传输一帧所需的时间段的1/3”对应于传输一个块所需的时间段的长度。

[3-3.用于传输数据的处理系统]

返回到图2，将描述调制单元10的用于传输数据D的处理系统。 LPF1021至1023是去除对应于高频带的频率分量以限制基带信号的频带的滤波器，并且被称为奈奎斯特(Nyquist)滤波器。奈奎斯特滤波器一般由被称为余弦滚降滤波器的FIR滤波器配置，并且滤波器的阶数、滚降率(roll-off rate)等是根据应用条件来确定的。在接收设备2中，由于LPF针对接收信号执行滤波，因此LPF1021至 1023以及接收设备2的LPF2241至2243(参见以下描述的图6)中的每一个均由根升余弦滚降滤波器配置以使得实现完美的奈奎斯特滤波器。

传输数据D经LPF1021滤波并接着输入至VCO1031。VCO1031 至1033是频率根据控制信号(这里，输入至VCO的传输数据的位值) 而改变的发送器。VCO1031在传输数据的位值为1时将频带f3内的信号输出到加法器105，并且在传输数据的位值为0时将频带f3’内的信号输出到加法器105。因此，频带f3和频带f3’被成对地使用。在本实施例中，属于一对中的两个频带的信号值之差被称为差分信号。

图5是示出差分信号的概念图。如上所述，当传输数据的位值为1时输出频带f3内的信号，而当位值为0时输出频带f3’内的信号。因此，当传输数据的位值为1时，如图5(a)所示，输出频带 f3内的信号作为预定值(由实线表示)，而不输出频带f3’内的信号(由虚线表示)。另一方面，当传输数据的位值为0时，如图5(b) 所示，不输出频带f3内的信号(由虚线表示)，而输出频带f3’内的信号作为预定值(由实线表示)。这样，频带f3内的信号和频带f3’内的信号具有信号值之间反转的幅值关系，即取决于位值的它们之间的反转关系输出。

当f3内的信号与f3’内的信号之差(f3-f3’)超过阈值时确定位值为1，而当f3内的信号与f3’内的信号之差(f3-f3’)等于或小于阈值时确定位值为0。尽管在对接收设备2的描述中将详细描述确定阈值的方法，但是阈值根据多径衰落等的影响动态地变化，而不是规定的固定值。参照图4所描述的频带F1是指组合了频带f1 和f1’的频带，频带F2是指组合了频带f2和f2’的频带，以及频带F3是指组合了频带f3和f3’的频带。即，频带F1包括具有较窄带宽的频带f1和f1’，频带F2包括具有较窄带宽的频带f2和f2’，以及频带F3包括具有较窄带宽的频带f3和f3’。在本发明中，由于频带f1、f1’、f2、f2’、f3和f3’具有比频带F1、F2和F3更窄的带宽，因此这些被称为窄带频率。在本实施例中，例如，接近的频带成对，诸如，频带f1＝18000Hz，f1’＝18400Hz，f2＝18800Hz， f2’＝19200Hz，f3＝19600Hz以及f3’＝20000Hz。在这些对中，属于较低频带f1、f2和f3的信号分量的时变波形被称为正常信号，以及属于较高频带f1’、f2’和f3’的信号分量的时变波形被称为反转信号。

返回到图2，如果输入一帧的传输数据(下文中，称为帧数据)，则延迟装置1041和1042中的每一个均输出传输数据、同时将传输数据延迟了与一帧的传输时段的1/3对应的时间段，该时间段即为传输一个块所需的时间段(下文中，称为1/3帧传输时段)。相应地，延迟装置1041将相对于帧数据输入至LPF1021时的定时延迟了1/3 帧传输时段的帧数据输出到LPF1022。VCO1032在从LPF1022输出的帧数据的位值为1时将频带f2内的信号输出到加法器105，而在帧数据的位值为0时将频带f2’内的信号输出到加法器105。类似地，延迟装置1042将相对于帧数据输入到LPF1022的定时延迟了1/3 帧传输时段的帧数据输出到LPF1023。VCO1033在从LPF1023输出的帧数据的位值为1时将频带f1内的信号输出到加法器105，而在帧数据的位值为0时将频带f1’内的信号输出到加法器105。

[3-4.用于音频数据的处理系统]

接下来，将描述调制单元10的用于音频数据S的处理系统。LPF 101从音频数据S中去除高频带内的频率分量。LPF101的截止频率例如被设置为大约可听见频带的上限值(从十几kHz到约20kHz)，以使得可以确保听众听到音频数据S的听觉质量并且可以确保用在调制中的频带(调制频带)。截止频率变为调制频带的下限频率。这是因为如果LPF101的截止频率太低，则在发出音频数据S时的质量劣化，而如果依照低截止频率而降低调制频带的频率，则听众的耳朵可辨识在发出属于调制频带的调制信号时的声音。相反，如果LPF101 的截止频率太高，则不能扩宽调制频带，并且传输数据的传输率减小。从LPF101输出的信号输入到加法器105。

在加法器105中，将基于传输数据D的调制信号添加至基于音频数据S的音频信号。添加有调制信号的音频信号被提供到输出单元 11，并且从扬声器12发出基于调制信号和音频信号的声音。此外，考虑了基于音频数据S的音频信号没有被提供到加法器105的情况。在这种情况下，仅调制信号被提供到输出单元11，并且从扬声器12 发出仅基于调制信号的声音(音频信号)。

在调制单元10的上述配置中，延迟装置1041和1042用作用于使与传输数据的一个单位对应的帧的传输开始时间延迟预定时间段的延迟单元。LPF1021至1023、VCO1031至1033以及加法器105 用作调制信号生成单元，该调制信号生成单元用于通过使用传输开始定时被延迟了的帧对载波进行调制来生成调制信号，载波所在的频带取决于传输开始定时而不同。

[4.接收设备中的解调单元的配置]

图6是示出接收设备2的解调单元22的配置实例的框图。解调单元22包括位解码单元220、数据检测单元230和数据检测触发发生单元240。麦克风20采集的且经过输入单元21的A/D转换的音频信号被输入到位解码单元220。在这种情况下，由于要输入的音频信号包括经发送设备1调制的与传输数据D对应的音频信号，因此输入至位解码单元220的音频信号被称为调制音频信号A。位解码单元220 将输入的调制音频信号A中的对应于传输数据D的音频信号转换为二进制数据“1”或“0”以对位值进行解码，并且将二进制数据输出到数据检测单元230。数据检测单元230在从数据检测触发发生单元240 提供触发信号的定时开始从自位解码单元220输出的二进制数据中提取传输数据D。下文中，将描述各个单元的详情。

[4-1.位解码单元]

位解码单元220包括HPF221、STFT单元222、减法器2231至 2233、DC截止单元2251至2253、以及二值化单元2261至2263。

[4-1-1.HPF]

HPF221从输入的调制音频信号A中去除对应于音频数据S的低频带内的信号分量，并且提取对应于传输数据D的高频带内的信号分量。即，HPF221的截止频率被设置为调制频带的下限频率。

[4-1-2.STFT单元]

STFT单元222是用于将从HPF221输出的信号分离成属于在传输时所使用的频带f1、f1’、f2、f2’、f3和f3’的信号分量的分离单元。具体地，STFT单元222对从HPF221输出的信号执行短时傅里叶变换(STFT)，将该信号分离成属于上述频带f1、f1’、f2、 f2’、f3和f3’的信号分量，并输出各个信号分量的时变波形。在此时的短时傅立叶变换中，重叠比为50％，即，STFT单元222通过半重叠来执行STFT。例如，FFT长度为1024个样本，以及一个符号样本长度为1536个样本，以及STFT之后的采样频率为86.1328125Hz。尽管一个符号样本长度例如为FFT长度的1倍、1.5倍、2倍等，在本实施例中，一个符号样本长度为FFT长度的1.5倍。根据FFT长度和重叠比来计算STFT之后的采样频率。

[4-1-3.减法器]

减法器2231至2233是对应于频带对f1、f1’、f2、f2’、f3 和f3’来设置的，并且每个均计算对应频带内的正常信号与反转信号之差。例如，减法器2231从属于频带f1的正常信号的信号值ch1 中减去属于频带f1’的反转信号的信号值ch1’，减法器2232从属于频带f2的正常信号的信号值ch2中减去属于频带f2’的反转信号的信号值ch2’，以及减法器2233从属于频带f3的正常信号的信号值ch3中减去属于频带f3’的反转信号的信号值ch3’。因此，获得了与各个频带对f1、f1’、f2、f2’、f3和f3’相对应的差分信号 ch1-ch1’、ch2-ch2’以及ch3-ch3’。

[4-1-4.LPF]

LPF2241至2243是对应于各个频带对f1、f1’、f2、f2’、f3和f3’来设置的，并且从自减法器2231至2233输入的差分信号中去除高频带内的信号分量，并且提取基带信号所属的频带内的信号分量。如上所述，发送设备1的LPF1021至1023以及接收设备2 的LPF2241至2243被配置成使得实现完美的奈奎斯特滤波器。

[4-1-5.DC截止单元]

DC截止单元2251至2253是对应于各个频带对f1、f1’、f2、 f2’、f3和f3’来设置的，并且从自LPF2241至2243输出的信号中提取基带信号。具体地，DC截止单元2251至2253执行用于对从 LPF2241至2243输出的信号的包络进行校正的处理(包络处理)，并且去除DC偏移以提取基带信号。

图7是示出包络处理的过程的流程图。在图7中，术语的意思如下：

In：从LPF2241输入至DC截止单元2251的输入信号，

Out：从DC截止单元2251输出的输出信号，

Kp：包络处理中的P控制系数(例如，0.1)，

Td：包络处理中的D控制系数(例如，1.0)，以及

Out’,Ed’：先前处理中的值(初始值为0.0)。

首先，DC截止单元2251根据计算公式获得Ep、高侧(Hi Side)、低侧(Low Side)、Out(步骤S10)。

Ep＝In-Out’，

基带信号上包络Hi Side＝-abs(Ep-Ed’)，

基带信号的下包络Low Side＝abs(Ep-Ed’)，以及

Out＝Out’+Kp(Ep+Td×Ed)

接下来，如果在基带信号的上包络高侧In>Out并且在基带信号的下包络低侧Out>In(步骤S20：是)，则DC截止单元2251 设置Out＝In以及Ed＝0(步骤S30)。如果上述的判定是否定的(步骤S20：否)，则DC截止单元2251设置Ed＝Ep(步骤S40)。

在这种情况下，在高侧，DC截止单元2251在输入信号In的上升沿设置跟随输入信号的包络并且在输入信号In的下降沿使包络在负方向上衰减。执行该处理，从而改善对采集的音频或突发噪声的音量级的改变的跟随性(followability)。在低侧，DC截止单元2251执行与上述处理相反的处理，即，在输入信号In的下降沿设置跟随输入信号In的包络并在上升沿使包络在正方向上衰减。DC截止单元 2252和2253根据如上所述的相同过程、使用从LPF2242和2243输入的输入信号来执行包络处理。

图8是示出从DC截止单元2251输出的信号(基带信号)的波形Out(实线)、上包络env_p(单点划线)、下包络env_m(虚线)以及当基于差分信号执行二值化时使用的阈值th(双点划线)之间的关系的示例的曲线图。尽管阈值th是上包络env_p与下包络env_m之间的值，通常，使用上包络env_p与下包络env_m之间的中间值。因此，阈值th是随着上包络env_p和下包络env_m的时间变化而在上包络env_p与下包络env_m之间在时间上变化的值。

[4-1-6.二值化单元]

如上所述，二值化单元2261至2263中的每一个使用时变阈值 th来对基带信号(这里是，上述差分信号)进行二值化，对位值进行解码，并将位值输出到数据检测单元230。具体地，二值化单元2261 至2263中的每一个均在差分信号的信号值此时大于阈值th时输出位值“1”，而在差分信号的信号值此时等于或小于阈值th时输出位值“0”。如上所述，阈值th随着上包络env_p和下包络env_m的时间变化而变化。例如，当频带f1和f1’之一的信号接收强度由于多径衰减、噪声混合等的影响而降低时，上包络env_p和下包络env_m之一波动，并且两个包络之差减小。因此，当阈值固定于指定值时，由于上包络env_p和下包络env_m之差减小并且差分信号向上包络或下包络倾斜且变得接近平坦波形，所以在位确定中很可能发生错误。相反，在该实施例中，即使当上包络env_p与下包络env_m之差减小并且使用阈值的位确定要求高精度时，由于阈值th作为上包络和下包络之间的中间值随着时间而调整，因此在位确定中不可能发生错误。这样，改善了多径衰落或噪声混合的容限(tolerance)，并且位确定的精度增大。

[4-2.数据检测触发发生单元]

如上所述，虽然传输数据D叠加在音频数据S上，例如当临时或间断地对传输数据D进行传输时，有时没有将传输数据D叠加在音频数据S上。在这种情况下，数据检测单元230仅在传输数据D叠加在音频数据S上的时间段内执行数据检测是有效的。相应地，数据检测触发发生单元240向数据检测单元230给出关于数据检测开始的定时的通知。图9是示出数据检测触发发生单元240的配置的框图。数据检测触发发生单元240包括FFT单元2411至2413、归一化单元2421 至2423、乘法器243以及信号电平计算单元244。

FFT单元2411至2413是对应于各个频带对f1、f1’、f2、f2’、 f3和f3’来设置的，对从减法器2231至2233输入的差分信号ch1- ch1',ch2-ch2’和ch3-ch3'执行FFT(快速傅里叶变换)，并且输出所得到的频谱。此时FFT的重叠比例如是25％、50％、75％之一，或者没有重叠。因此，如果FFT长度例如为512个样本并且重叠比为 25％，则以128个样本为间隔执行FFT。

接下来，归一化单元2421至2423对从FFT单元2411至2413 输出的频谱进行归一化。乘法器243计算从归一化单元2421至2423 获得的频谱的元素的乘积。这样，获得了所谓的移动谱(running spectrum)。

在传输数据D叠加在音频数据S上的时间段内，从减法器2231 至2233输入的差分信号ch1-ch1',ch2-ch2和ch3-ch3'对应于基带信号。例如，在FFT长度为512个样本的FFT中，在最大频率为大约29.06Hz(FFT：快速傅里叶变换中的阶数N＝43)时，解调的基带信号变为接近于方波并因而对应于谐波，而如果将此纳入考虑，则用实验方法了解到最大频率为约33.64Hz(N≌50)。相反，在传输数据D没有叠加在音频数据S上的时间段内，由于从减法器2231 至2233中的每一个输入的信号对应于噪声，因此相比于传输数据D 叠加在音频数据S上的情况，频谱分布在更宽的频带内。

因此，信号电平计算单元244可以通过计算等于或小于N＝50的频率分量(假设其包括近于方波的基带信号)在整个频谱内的比率来估计信号电平。即，由于等于或小于N＝50的频率分量在整个频谱内的比率大，因此传输数据D很可能叠加在音频上，即，信号电平大。信号电平计算单元244在估计值超过阈值时输出触发信号以使得数据检测单元230开始数据检测。这样，信号电平计算单元244通过在执行LPF2241至2243之前测量频带f1、f1’、f2、f2’、f3和f3’的差分信号的移动谱来确定传输数据D是否叠加在音频数据S上，并且仅当确定有叠加时执行数据检测。

[4-3.数据检测单元]

数据检测单元230从二值化单元2261至2263所输出的位数据中提取传输数据。图10是示出数据检测单元230的操作的流程图。在图10中，首先，数据检测单元230获取从二值化单元2261至2263 输出的位数据(步骤S21)。

接下来，数据检测单元230搜索同步符号(步骤S22)。在该步骤中，例如，数据检测单元230在将频带F1内的CH1位数据中的初始位作为起始位置(下文中，称为搜索起始位)的情况下每隔两位地获取位流(参见图11(a))。如上所述，由于SFTF单元222利用半重叠执行STFT，并且一个符号样本长度(1536个样本)是FFT长度(1024个样本)的1.5倍，因此基带信号扩展了三倍。为此，数据检测单元230每隔两位地获取位流。

如上所述，由于同步符号的数据长度是预定位数，因此当从搜索起始位获取具有预定位数的位流时，数据检测单元230执行关于位流是否与同步符号的指定位流一致的判定。如果所获取的位流与同步符号一致，则数据检测单元230进行到随后的处理。当所获取的位流与同步符号不一致时，数据检测单元230执行关于具有从搜索起始位起的预定位数的位流是否与不同于之前的频带F2内的CH2位数据的同步符号的位流(参见图11(b))一致的判定。然后，当在CH1位数据、CH2位数据或CH3位数据中均未发现同步符号时，数据检测单元230返回到初始频带(F1)内的CH1位数据，使搜索起始位的位置从上次的位置移动一位，并且执行关于具有从搜索起始位起的预定位数的位流是否与同步符号的位流一致的判定以对同步符号进行重新搜索(参见图11(c))。数据检测单元230重复该处理直到发现同步符号为止。

如果发现了同步符号，则数据检测单元230进一步从与发现了同步符号的位数据中的同步符号的后端对应的位的位置起每隔两位地获取具有预定位数的位流。该位流对应于帧的帧头。由于在帧头中描述了帧长，因此数据检测单元230仅针对帧头执行解码和错误检测并检测帧长(步骤S23)。

接下来，数据检测单元230根据块数(在该情况下，为三个) 来划分帧长，从而获得一个块的数据长度。然后，数据检测单元230 在以下条件下从二值化单元2261至2263所输出的位数据中提取块 a、b和c，并且连接这些块以生成帧(步骤S24)。

图12是示出当提取块以生成帧时的条件的概念图。在图12中， a1、b1、b2、c1和c2是与以相同字母符号表示的a、b和c相同的块，但为了便于理解对要选择的块的描述，附上编号1或2以进行区分。时间t1至t7之间的间隔是接收一个块所需的时间段(上述的传输一帧所需的时间段的1/3，并且下文中，称为单块传输时段)。假设当前时间为t7，以及接收设备2于时间t7接收到的各个频带F1、 F2和F3内的块存储在接收设备2(解调单元22)的存储单元(未示出)中。

数据检测单元230在将在时间t7接收到的块(即，在一帧的头部处的块(在图中为块a))作为起始点的情况下根据指定的选择方法来选择形成帧所需的剩余块b和c。指定的选择方法包括以下四个过程。数据检测单元230按从过程1至过程4的顺序尝试帧解码和错误检测，并且当可以在某一过程内正确地对一帧的传输数据进行解调时，不执行任何后续过程。

过程1：在接收到块a1的当前时间t7处，选择不同于a1的、在频带F2和F3内接收到的块b1和块c1(在图中由实线圈出的块a1、块b1和块c1)。即，在过程1中，在11个块传输时段内从所有频带中分别选择块。相应地，在接收设备2采集叠加有一帧的传输数据的声音以前所需的时间段是一个块的传输时段。

过程2：选择在接收到块a1的当前时间t7处在不同于块a1的频带F2内接收的块b1以及在比当前时间t7前一个块的时间t6处在与块a1相同的频带F1内接收的块c2。即，在过程2中，在比一个块的传输时段长且比传输一帧所需的时间段短的时间段内以任意组合从多个频带中选择块。

过程3：选择在比当前时间t7前两个块的时间t5处在与块a1 相同的频带F1内接收的块b2和在比当前时间t7前一个块的时间t6 处在与块a1相同的频带F3内接收的块c2(图中由虚线圈出的块a1、块b2和块c2)。即，在过程3中，在传输一帧所需的时间段内从一个频带中选择块。

过程4：选择在比当前时间t7前两个块的时间t5处在与块a1 相同的频带F1内接收的块b2和在接收到块a1的当前时间t7处在与块a1不同的频带F3内接收的块c1。即，在过程4中，在传输一帧所需的时间段内以任意组合从多个频带中分别选择块。与过程3相比，当多径衰落、噪声混合对任何频带有大影响时使用过程4。

如果在数据检测开始之后在当前时间t7处收集所有块a、b和c，则在过程1中数据检测所需的实质时间是t7-t6(即，传输一帧所需的时间段的1/3)。因此，在过程1至4中的过程1中，当成功检测到构成一帧的所有块时，实质传输率最高。即，在麦克风20采集叠加有这些块的音频以前所需的时间段最短。

因此，当在过程2中成功执行数据检测时，数据检测所需的实质时间为t7-t5(即，传输一帧所需的时间段的2/3)。因此，过程 2具有在过程1之后第二最高的实质传输率。

当在过程3和过程4中成功执行数据检测时，数据检测所需的实质时间是t7-t4(即，与传输一帧所需的时间段相同的时段)。因此，当在过程3和过程4中成功执行数据检测时，实质传输率最低。即，在麦克风20采集叠加有这些块的音频以前所需的时间段最长。在过程3和过程4中，尽管可以抑制多径衰减、噪声混合等影响，但与使用单个频带的情况相比传输率没有改变。

因此，如果不存在不利地影响传输质量的多径衰落等，则在本实施例中，传输一帧所需的时间段最短耗费在不划分频带的情况下传输一帧所需的时间段的1/3。即使当不利影响导致传输质量下降时，在本实施例中，如果最长耗费在不划分频带的情况下传输一帧所需的时间段，则可以传输一帧的可能性高。

总之，当按从过程1到过程4的顺序选择块并且尝试帧解码和错误检测时，这意味着优先减小在麦克风20采集叠加有要选择的块的声音以前所需的时间段。即，数据检测单元230根据采集叠加有所选择的块的声音所需的时间段变短的算法来选择块。

数据检测单元230输出通过解码和错误检测所生成的帧作为传输数据(步骤S25)。当在上述处理期间发生错误时，数据检测单元 230返回步骤S21的初始处理并再次从下一位开始尝试数据检测。

在上述解调单元22的配置中，STFT单元222用作分离单元，该分离单元用于将从麦克风20输出的音频信号分离为属于各个频带的信号分量。减法器2231至2233、DC截止单元2251至2253、二值化单元2261和数据检测单元230用作帧生成单元，该帧生成单元用于基于STFT单元222分离的每个信号分量针对每个预定时间段对与帧的一部分对应的块进行解调并连接从解调的块组中选择的块以生成帧。帧生成单元根据指定的选择方法(例如，在麦克风20采集叠加有所选择的块的声音以前所需的时间段变得更短的选择方法)来选择块。数据检测触发发生单元240用作判定单元，该判定单元用于执行关于传输数据D是否叠加在麦克风20采集的声音上的判定。

根据上述实施例，使用了使用不同频带的差分信号，从而与未使用差分信号的情况相比提高了SN比。根据属于这些频带的声音的采集状况来动态地控制当基于差分信号对基带信号进行二值化时的阈值，从而提高位确定的精度。在使多个频带内的传输定时偏移的同时传输帧，从而获得对多径衰落或噪声混合的容限。虽然受诸如多径衰落或噪声混合之类的现象影响的频带在时间上波动，但是根据上述实施例，由于在使多个频带内的传输定时偏移时传输帧，因此可以在选择构成帧的块时增加选项并且可以从较少受上述现象影响的频带内的声音中提取数据。由于与仅使用一个频带传输一帧的情况相比，当选择构成帧的块时存在许多可供选择的块，因此如果根据指定的选择方法选择块，则可以缩短采集叠加有所选择的块的声音所需的时间段。因此，与仅使用一个频带传输一帧的情况相比可以预期实质传输率的提高，并且例如，即使其中数据传输率减小的诸如多径衰落或噪声混合之类的现象发生，也可以抑制实质传输率的减小。

[变型示例]

[变型示例1：调制单元的配置示例]

图2所示的调制单元10可具有图13所示的配置。根据变型示例1的调制单元10a包括与如图2所示的LPF相同的LPF101作为用于音频数据S的处理系统，并且包括与图2所示的延迟装置相同的延迟装置1041和1042、六个发送器1061至1063和1061’至1063’、可变电阻器1071至1073、以及加法器108，作为用于传输数据D的处理系统。即，该变型示例与上述实施例的不同之处在于，调制单元 10a包括发送器1061至1063和1061’至1063’、可变电阻器1071 中1073以及加法器108。在可变电阻器107中，一端连接至发送器1061，另一端连接至发送器1061’，以及作为在两端处的端子之间移动的输出端子的可移动端子连接至加法器108。在可变电阻器1072 中，一端连接至发送器1062，另一端连接至发送器1062’，以及作为在两端处的端子之间移动的输出端子的可移动端子连接至加法器 108。在可变电阻器1073中，一端连接至发送器1063，另一端连接至发送器1063’，以及作为在两端处的端子之间移动的输出端子的可移动端子连接至加法器108。在该变型示例中，发送器1061至1063 和1061’至1063’、可变电阻器1071至1073以及加法器108用作调制信号生成单元。调制单元10a的每个配置可通过硬件来实现或者可通过硬件与软件的协作来实现。

发送器1061输出频带f3内的信号，以及发送器1061’输出频带f3’内的信号。发送器1062输出频带f2内的信号，以及发送器 1062’输出频带f2’内的信号。发送器1063输出频带f1内的信号，以及发送器1063’输出频带f1’内的信号。如果传输数据被输入至可变电阻器1071，则当传输数据的位置为“1”时，可变电阻器1071 移动可移动端子以使得从发送器1061到加法器108的电阻值减小并且从发送器1061’到加法器108的电阻值增大。随着可移动端子的移动，从发送器1061输出的频带f3内的信号的强度逐渐增大，并且从发送器1061’输出的频带f3’内的信号的强度逐渐减小。当传输数据的位值为“0”时，可变电阻器1071移动可移动端子以使得从发送器1061’到加法器108的电阻值减小以及从发送器1061到加法器 108的电阻值增大。随着可移动端子的移动，从发送器1061’输出的频带f3’内的信号的强度逐渐增大，并且从发送器1061输出的频带 f3内的信号的强度逐渐减小。

类似地，当传输数据的位值为“1”时，可变电阻器1072移动可移动端子以使得从发送器1062到加法器108的电阻值减小并且从发送器1062’到加法器108的电阻值增大，而当传输数据的位值为“0”时，可变电阻器1072移动可移动端子以使得从发送器1062’到加法器108的电阻值减小以及从发送器1062到加法器108的电阻值增大。当传输数据的位值为“1”时，可变电阻器1073移动可移动端子以使得从发送器1063到加法器108的电阻值减小以及从发送器 1063’到加法器108的电阻值增大，而当传输数据的位值为“0”时，可变电阻器1073移动可移动端子以使得从发送器1063’到加法器 108的电阻值减小以及从发送器1063到加法器108的电阻值增大。

在实施例中，例如，当将差分信号从频带f1切换至频带f1’时，基本上在频带f1内的信号瞬间消失的同时，频带f1’内的信号瞬间生成。相反，在变型示例中，当将差分信号从频带f1切换至频带f1’时，在比实施例中瞬时从频带f1切换至频带f1’所需的时间段长的时间段内，频带f1内的信号的强度逐渐减小，并且频带f1’内的信号的强度逐渐增大。即，当使得属于这些窄带频率的信号分量的输出在它们之间反转时，在上述相对长的时段内逐渐进行反转。如在实施例中，例如，如果差分信号瞬时从频带f1切换至频带f1’，则由于要发出的音频的频谱快速地改变，因此听众可能在听觉上感受到不适感。相应地，如在变型示例中，如果逐渐地从频带f1切换到频带f1’，则可以进行控制以使得不适感减少。上述的可变电阻器1071至1073 可通过机械配置来实现或者可通过电气配置来实现。

[变型示例2：当解调单元中的阈值固定时]

在实施例中，虽然用于二值化的阈值动态地变化，但是为了进一步改善位确定的精度，接收设备2中的解调单元22可具有图14 所示的配置，并且可结合使用固定阈值。根据变型示例2的解调单元 22a与图6所示的解调单元22的不同之处在于，设置了二值化单元2261-1至2263-1，来自LPF2241至2243的输出在不通过DC截止单元2251至2253的情况下直接输入至二值化单元2261-1至2263-1。在该变型示例中，减法器2231至2233、DC截止单元2251至2253、二值化单元2261、二值化单元2261-1至2263-1以及数据检测单元 230用作帧生成单元。解调单元22a的每种配置可通过硬件来实现或者可通过硬件与软件的协作来实现。

图6所示的经过DC截止单元2251至2253的位数据(CH1位数据d、CH2位数据d和CH3位数据d)输入至数据检测单元230，并且未经过DC截止单元2251至2253的位数据(CH1位数据z、CH2位数据z和CH3位数据z)输入至数据检测单元230。数据检测单元230 对CH1位数据d、CH2位数据d和CH3位数据d进行二值化、同时如在实施例中一样动态地改变阈值th，并且使用固定阈值(在该情况下为0)对CH1位数据z、CH2位数据z和CH3位数据z执行二值化。数据检测单元230使用在使用两种阈值解调的块中表现出满意结果 (在解调期间未发生错误的结果)的块来生成帧。

[变型示例3：省略各种滤波器]

虽然图6或图14所示的解调单元22或22a的配置使用HPF221，但是当属于除了调制频带外的频带的信号未过多地包括在调制音频信号A中时，或者当该信号的影响可忽略时，不一定进行HPF的滤波。类似地，当不存在LPF时的影响可忽略时不需要调制单元10或解调单元22中的LPF。

[变型示例4：块的数量和频带的数量]

在实施例中，虽然构成帧的块的数量为三，但是本发明不一定限于此。虽然在调制时使用的频带F1、F2、和F3的数量为三，但是本发明不一定限于此。

当块的数量大于频带的数量时，传输数据的实质传输率减小。另一方面，当频带的数量大于块的数量时，频带太多并且产生冗余配置。在允许传输率的减小或冗余配置的范围内，块的数量可不同于频带的数量。例如，构成一帧的块的数量可以是六个，以及调制中使用的频带的数量可以为三个。决定构成一帧的块的数量和用调制中使用的频带的数量的方式是任意的。

当构成一帧的块的数量和调制中使用的频带的数量同样是n以使得构成一帧的块的数量为n(其中，n为正整数，该条件同样适用于以下描述)并且调制中使用的频带F1、F2和F3的数量为n时，解调单元22将从麦克风20输出的音频信号分离成属于n个频带的信号分量，并且针对采集叠加有一帧且属于n个频带之一的声音所需的时间段的每个1/n的时间段，基于每个信号分量对块进行解调。在这种情况下，在连接从所解调的块组中选择的块以生成帧时，解调单元 22选择这些块以使得采集叠加有所选择的块的声音所需的时间段接近于采集叠加有一帧的声音所需的时间段的1/n的时间段。以该方式，当构成一帧的块的数量和调制中使用的频带的数量相同时，可以有效地使用频带。

在本实施例中，发送设备1以帧为单位重复进行传输而不划分成块的单位，并且接收设备2以块为单位切割所接收到的调制音频信号并连接这些块以生成帧，不一定要如此，发送设备1可传输对应于帧的数据、同时将帧划分成块的单位，并且接收设备2可连接块以生成帧。在该情况下，由于帧头等可以附于每个要传输的块并且在帧头中可以描述每个块的标识符，因此接收设备2参考标识符来容易地识别每个块。

[变型示例5：数据检测的过程]

在实施例中，虽然假设了包括过程1至过程4这四种过程的指定的块选择方法，但是如果满足了选择块以使得采集叠加有所选择的块的声音所需的时间段变得更短的条件，则可考虑除了上述四种过程外的块选择方法。例如，在调制时使用的每个频带内都存在多径衰落并且噪声很可能包括在信号中的环境下，当传输一帧时，可能耗费比传输一帧所需的时间段更长的时间段。使用包括四种过程的块选择方法的原因在于认为在与成功地提取了同步符号的特定块(对应于图 12的块a1)同时或相同的频带内的传输质量高，而如果块选择方法太多，则数据检测单元230的计算负荷增大或者错误检测增加。

[变型示例6：成对的频带]

在本实施例中，虽然接近的频率成对，诸如频带f1＝18000Hz，f1’＝18400Hz，f2＝18800Hz，f2’＝19200Hz，f3＝19600Hz以及 f3’＝20000Hz，但是例如不同的频带可成对，诸如频带f1＝18000Hz， f2＝18400Hz，f3＝18800Hz，f1’＝19200Hz，f2’＝19600Hz以及 f3’＝20000Hz。例如，当在特定频带内发生诸如多径衰落或噪声混合之类的现象时，相对接近频率的频带也受到影响。因此，如在该变型示例中，如果不同的频率成对，则可以预期对于上述现象的容限的改善。

在实施例中，使用了两个窄带频带，例如，当传输位“1”时，以预定值输出属于频带f1的信号并且未输出属于频带f1’的信号，而当传输位“0”时，没有输出属于频带f1的信号而以预定值输出属于频带f1’的信号。为了两次实现传输率，准备了属于频带F1的四个窄带频率(频带f1、f1’、f01和f01’)。例如，当传输位“1,0”时，以预定值输出属于频带f1的信号而不输出属于频带f1’的信号。未输出属于频带f01的信号而以预定值输出属于频带f01’的信号。例如，当传输位“0,1”时，未输出属于频带f1的信号而以预定值输出属于频率f1’的信号。以预定值输出属于频带f01的信号而未输出属于频带f01’的信号。然而，在这些情况下，当仅关注频带f1 和f1’时，根据构成帧的每位的值来反转属于与该帧对应的两个窄带频率的信号的输出，从而生成调制信号。

在实施例中，虽然要调制的载波的频带是比人类可听见的频带高的频带，但是本发明不一定限于此。

[变型示例7：声音的传播介质]

在上述实施例中，虽然假设空气是声音通过其传播的介质，但是除了不同于空气的气体外，还可使用诸如建筑物、结构或家具之类的固体或者诸如水之类的液体。当声音通过其传播的介质是固体时，发送设备1包括用于根据从输出单元11输出的信号产生振动的振动单元来替代扬声器12，并且接收设备2包括诸如加速度传感器之类的用于检测固体的振动的振动检测单元来替代麦克风20。当从由于发送设备1的振动单元而振动的固体发出声音时，接收设备2可包括如在实施例中的麦克风20。

[变型示例8：传输开始定时]

除了将叠加有传输数据的音频信号从输出单元11提供到扬声器 12并且开始发出声音的定时外，根据本发明的术语“传输开始定时”实质上还包括被认为是帧传输开始的定时(诸如，用于将音频数据提供到调制单元10以进行发声的处理开始的定时)或者用于在调制单元10中将传输数据叠加在音频数据上的处理开始的定时。

[变型示例9：位确定中使用的阈值]

当基于差分信号执行位确定时的阈值可以是固定阈值，而不是如在实施例中的随着时间变化的阈值。

[变型示例10：程序]

可以将本发明指定为用于使得计算机实现与发送设备1或接收设备2相同的功能的程序或者存储有该程序的记录介质(诸如，光谱)。根据本发明的程序可以通过诸如互联网之类的网络下载到计算机的形式来设置、安装并且可利用。

本申请基于2013年2月21日提交的第2013-032506号日本专利申请和2013年11月28日提交的第2013-246685号日本专利申请，其内容通过引用结合于此。

工业应用性

本发明有用之处在于可以在使用声音作为传输介质来传输数据的系统中增加从声音中提取数据的可能性。

附图标记列表

1：发送设备，2:接收设备，10,10a：调制单元，11：输出单元， 12：扬声器，20：麦克风，21：输入单元，22、22a、22b、22c、22d：解调单元，101、1021至1023、2241至2243：LPF,1031至1033：VCO，1041、1042：延迟装置，105、2231至2233：加法器，220：位解码单元，221：HPF，222：STFT单元，2251至2253：DC截止单元，2261 至2263、2261-1至2263-1：二值化单元，230：数据检测单元，240：数据检测触发发生单元，2411至2413：FFT单元，2421至2423：归一化单元，243：乘法器，244：信号电平计算单元。

Claims

1.一种音频信号调制设备，包括：

延迟单元，其被配置为将与一个单位传输数据对应的帧的传输开始定时延迟预定时间段；以及

调制音频信号生成单元，其被配置为通过使用传输开始定时经所述延迟单元延迟的帧来对取决于所述传输开始定时而不同的频带内的载波进行调制，从而生成调制音频信号，

其中，每个帧包括多个块，并且所述预定时间段是与传输一帧中的一个块所需的时间段相对应的时间段。

2.根据权利要求1所述的音频信号调制设备，还包括：

声音发出单元，其被配置为根据所述调制音频信号生成单元生成的调制音频信号来发出声音。

3.一种解调设备，包括：

分离单元，其被配置为使用与一个单位传输数据对应且具有延迟了预定时间段的传输开始定时的帧来将根据调制信号所发出的声音的音频信号分离成属于各个频带的信号分量，所述调制信号是由调制信号生成单元通过对取决于所述传输开始定时而不同的频带内的载波进行调制而生成的；以及

帧生成单元，其被配置为基于由所述分离单元分离的信号分量的一部分来对形成所述帧的一部分的块进行解调，根据指定的选择方法对形成所述帧的剩余部分的块进行选择和解调，并且对所解调的块进行连接以生成所述帧，

其中，所述指定的选择方法包括与块选择相关的多个不同程序，

并且所述多个不同程序包括这样的程序，在其中形成所述帧的要解调的块是从由所述分离单元分离的多个频带的信号分量中选择的。

4.根据权利要求3所述的解调设备，其中，

由所述调制信号生成单元调制的载波的频带是n个频带，其中n表示正整数，并且

所述帧生成单元针对将一帧叠加在所述n个频带中的任一个中的时间段的每个1/n的时间段,来基于每个信号分量对所述块进行解调。

5.根据权利要求3或4所述的解调设备，其中，

每个所述频带均包括带宽窄于对应的频带的多个窄带频率，

所述调制信号生成单元通过使得属于与所述帧对应的两个窄带频率的信号的输出根据所述帧的每位的值在所述信号之间反转，

所述分离单元将所述音频信号分离为属于在每个所述频带内所包括的所述两个窄带频率的信号，并且

所述帧生成单元将属于所述两个窄带频率的信号之差与阈值进行比较并且对所述位的每个值进行解码以对所述块进行解调。

6.根据权利要求5所述的解调设备，其中，

所述帧生成单元计算由所述分离单元分离的每个信号分量的上包络和下包络，并且使用所算出的上包络和下包络之间的时变值作为所述阈值。

7.根据权利要求3所述解调设备,其中

在所述帧生成单元在所述多个不同程序的某个程序中完成了对形成所述帧的剩余部分的块的解调并且正确地解调出了所述帧的整体的情况下,所述帧生成单元不执行所述多个不同程序中的任何后续程序。

8.根据权利要求3所述的解调设备，其中

所述指定的选择方法包括从另一信号分量中选择形成所述帧的剩余部分的每个块的程序，所述另一信号分量不同于用来解调所述帧的所述一部分的信号分量。

9.根据权利要求3所述的解调设备，其中

所述指定的选择方法包括从用来解调所述帧的所述一部分的信号分量的一个相同的信号分量中选择形成所述帧的剩余部分的每个块的程序。

10.根据权利要求3所述的解调设备，其中

在所述块选择的所需时间内，所述多个不同程序中的至少一个程序不同于其它程序。

11.一种音频通信系统，包括：

发送设备，其用于发出作为声音的音频信号，所述音频信号上叠加有要发送的传输数据；以及

接收设备，其用于从所述发送设备所发出的声音中提取出所述传输数据，其中，

所述发送设备包括：

延迟单元，其被配置为将与一个单位的所述传输数据对应的帧的传输开始定时延迟预定时间段；

调制信号生成单元，其被配置为通过使用所述传输开始定时经所述延迟单元延迟的帧来对根据取决于所述传输开始定时而不同的频带内的载波进行调制，从而生成调制信号；以及

声音发出单元，其被配置为根据所述调制信号生成单元生成的调制信号来发出所述声音，并且

所述接收设备包括：

声音采集单元，其被配置为采集从所述声音发出单元发出的声音并输出音频信号；

分离单元，其被配置为将所述声音采集单元所输出的音频信号分离成属于各个频带的信号分量；以及

帧生成单元，其被配置为基于所述分离单元所分离的信号分量的一部分来对形成所述帧的一部分的块进行解调，根据指定的选择方法对形成所述帧的剩余部分的块进行选择和解调，并且对所解调的块进行连接以生成所述帧，

12.一种解调方法，包括：

分离步骤，使用与一个单位传输数据对应且具有延迟了预定时间段的传输开始定时的帧来将根据调制信号所发出的声音的音频信号分离成属于各个频带的信号分量，所述调制信号是通过对取决于所述传输开始定时而不同的频带内的载波进行调制而生成的；以及

帧生成步骤，基于通过所述分离步骤分离的信号分量的一部分来对形成所述帧的一部分的块进行解调，根据指定的选择方法对形成所述帧的剩余部分的块进行选择和解调，并且对所解调的块进行连接以生成所述帧，