CN104916291A - 掩蔽声数据产生装置及系统和用于产生掩蔽声数据的方法 - Google Patents

掩蔽声数据产生装置及系统和用于产生掩蔽声数据的方法 Download PDF

Info

Publication number
CN104916291A
CN104916291A CN201510105145.2A CN201510105145A CN104916291A CN 104916291 A CN104916291 A CN 104916291A CN 201510105145 A CN201510105145 A CN 201510105145A CN 104916291 A CN104916291 A CN 104916291A
Authority
CN
China
Prior art keywords
sound data
level
frequency band
masking
masking sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510105145.2A
Other languages
English (en)
Inventor
山川高史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Publication of CN104916291A publication Critical patent/CN104916291A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/002Damping circuit arrangements for transducers, e.g. motional feedback circuits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/1752Masking
    • G10K11/1754Speech masking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/40Jamming having variable characteristics
    • H04K3/42Jamming having variable characteristics characterized by the control of the jamming frequency or wavelength
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/40Jamming having variable characteristics
    • H04K3/43Jamming having variable characteristics characterized by the control of the jamming power, signal-to-noise ratio or geographic coverage area
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/40Jamming having variable characteristics
    • H04K3/45Jamming having variable characteristics characterized by including monitoring of the target or target signal, e.g. in reactive jammers or follower jammers for example by means of an alternation of jamming phases and monitoring phases, called "look-through mode"
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/80Jamming or countermeasure characterized by its function
    • H04K3/82Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection
    • H04K3/825Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection by jamming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K2203/00Jamming of communication; Countermeasures
    • H04K2203/10Jamming or countermeasure used for a particular application
    • H04K2203/12Jamming or countermeasure used for a particular application for acoustic communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供了一种掩蔽声数据产生装置及系统、和用于产生掩蔽声数据的方法,该装置包括:源声数据获得部分,其获得表示在掩蔽声数据的产生中使用的声音的源声数据;话语者声数据获得部分,其获得表示话语者的语音的话语者声数据;频带水平指定部分,其指定话语者声数据中的两个或更多个频带的各个水平;以及频带水平设置部分,其基于指定的话语者声数据中的各频带的各个水平根据预定规则来设置源声数据中的两个或更多个频带的各个水平,以产生表示掩蔽声的掩蔽声数据。各预定规则彼此不同。

Description

掩蔽声数据产生装置及系统和用于产生掩蔽声数据的方法
技术领域
本发明涉及声音掩蔽技术。
背景技术
存在一种通过发射声音(掩蔽声)以阻碍通过声音(例如,语音)传输信息来防止会话被偷听的声音掩蔽技术。
JP-A-2006-267174、JP-A-2010-217883和JP-A-06-186986作为涉及掩蔽声的产生的文献的示例。在JP-A-2006-267174中,提出了一种技术,该技术通过对掩蔽声执行频率滤波处理以使得掩蔽声和背景噪声的频谱与话语者(对话者)的语音的频谱相同来产生几乎不使第三者感觉到不愉快的掩蔽声。在JP-A-2010-217883中,提出了一种技术,该技术通过将表示从房间接收的各个频带的目标声音信号的包络的包络信号划分为多帧以及将噪声乘以通过随机地改变其中信号的振幅大于或等于下限阈值且小于或等于上限阈值的帧的排列顺序所获得的包络信号来产生不导致吵闹和不自然的掩蔽声。在JP-A-06-186986中,提出了一种技术,该技术产生不用于声音掩蔽的声音而是产生作为降低阻碍通过扩音器再现电有效信号的车辆的运转噪声的影响的声音、其中根据车辆的瞬时速度单独地调整各个频带的水平的声音。
在作为现有技术的JP-A-2006-267174、JP-A-2010-217883和JP-A-06-186986示出的技术中,根据掩蔽声的产生的相同规则针对所有频带执行处理。然而,并非语音的所有频带都对通过语音的信息传输起到等同的作用。另外,并非掩蔽声的所有频带都等同地向收听者提供不愉快和不和谐的感觉。
本发明的目的是提供一种技术,与不考虑掩蔽声的各个频带对信息传输或对向收听者提供的不愉快和不和谐的感觉的作用而产生的掩蔽声相比,该技术产生具有高掩蔽效率的掩蔽声或具有较少不愉快和不和谐的掩蔽声。
发明内容
为了实现以上目的,根据本发明,提供了一种掩蔽声数据产生装置,该装置包括:
源声数据获得部分,其获得表示在掩蔽声数据的产生中使用的声音的源声数据;
话语者声数据获得部分,其获得表示作为掩蔽目标的话语者语音的话语者声数据;
频带水平指定部分,其指定话语者声数据中的两个或更多个频带的各个水平;以及
频带水平设置部分,其基于由频带水平指定部分指定的话语者声数据中的各频带的各个水平根据各预定规则来设置与话语者声数据中的两个或更多个频带相对应的在源声数据中的两个或更多个频带的各个水平,并且产生表示掩蔽声的掩蔽声数据,
其中,频带水平设置部分根据彼此不同的各预定规则来设置源声数据中的两个或更多个频带中的至少两个频带的各个水平。
根据本发明,还提供了一种用于产生掩蔽声数据的方法,该方法包括以下步骤:
获得表示在掩蔽声数据的产生中使用的声音的源声数据;
获得表示作为掩蔽目标的话语者的语音的话语者声数据;
指定话语者声数据中的两个或更多个频带的各个水平;以及
基于通过指定步骤指定的话语者声数据中的各频带的各个水平根据各预定规则来设置与话语者声数据中的两个或更多个频带相对应的在源声数据中的两个或更多个频带的各个水平,以产生表示掩蔽声的掩蔽声数据,
其中,在设置步骤中,根据彼此不同的各预定规则来设置源声数据中的两个或更多个频带中的至少两个频带的各个水平。
根据本发明,还提供了一种掩蔽声产生系统,该系统包括:
声接收装置,其通过接收作为掩蔽目标的话语者语音来产生话语者声数据并输出话语者声数据;
掩蔽声数据产生装置,其产生表示掩蔽声的掩蔽声数据;以及
发声装置,其发出通过掩蔽声数据产生装置产生的掩蔽声数据作为掩蔽声,
其中掩蔽声数据产生装置包括:
源声数据获得部分,其获得表示在掩蔽声数据的产生中使用的声音的源声数据;
话语者声数据获得部分,其获得从声接收装置输出的话语者声数据;
频带水平指定部分,其指定话语者声数据中的两个或更多个频带的各个水平;
频带水平设置部分,其基于由频带水平指定部分指定的话语者声数据中的各频带的各个水平根据各预定规则来设置与话语者声数据中的两个或更多个频带相对应的在源声数据中的两个或更多个频带的各个水平,并且产生表示掩蔽声的掩蔽声数据;以及
输出部分,其将通过频带水平设置部分产生的掩蔽声数据输出至发声装置;并且
其中,频带水平设置部分根据彼此不同的各预定规则来设置源声数据中的两个或更多个频带中的至少两个频带的各个水平。
根据本发明,根据掩蔽声的各个频带对信息的传输或对给收听者带来不愉快和不和谐的感觉的作用,产生了这样一种掩蔽声,其中根据针对各个频带的不同规则调整了各频带的水平。这导致具有高掩蔽效率的掩蔽声或具有较少不愉快和不和谐的掩蔽声的产生。
附图说明
图1是示出根据实施例的掩蔽声产生系统的构造的框图。
图2是示出根据实施例的掩蔽声数据产生装置使用的参数的图。
图3是示出根据实施例的掩蔽声数据产生装置使用的参数的图。
图4是示出根据实施例的掩蔽声数据产生装置使用的参数的图。
图5是示出根据第一修改示例的掩蔽声产生系统的构造的框图。
图6是示出根据第二修改示例的掩蔽声产生系统的构造的框图。
图7是示出根据第三修改示例的掩蔽声产生系统的构造的框图。
图8是示出根据第四修改示例的掩蔽声产生系统的构造的框图。
图9是示出根据第五修改示例的掩蔽声产生系统的构造的框图。
图10是示出根据第六修改示例的掩蔽声产生系统的构造的框图。
图11是示出根据第七修改示例的掩蔽声产生系统的构造的框图。
图12是示出根据第八修改示例的掩蔽声产生系统的构造的框图。
图13是示出掩蔽声数据产生装置使用的参数的图。
图14是示出掩蔽声数据产生装置使用的参数的图。
图15是示出掩蔽声数据产生装置使用的参数的图。
图16是示出掩蔽声数据产生装置使用的参数的图。
图17是示出掩蔽声数据产生装置的操作的概要的流程图。
具体实施方式
[1、实施例]
下文中,将对根据本发明的实施例的掩蔽声产生系统1的构造和操作进行描述。图1是示出掩蔽声产生系统1的构造的框图。掩蔽声产生系统1包括掩蔽声数据产生装置11、麦克风12、存储装置13和扩音器14。掩蔽声数据产生装置11产生表示掩蔽声的声数据(下文中称作“掩蔽声数据”)。麦克风12是通过接收话语者A的语音(掩蔽目标的语音)的声音来产生声数据(下文中称作“话语者声数据”)的声接收装置。存储装置13存储表示用作用于产生掩蔽声数据的源的声音的声数据(下文中称作“源声数据”)。扩音器14是发声装置,其向收听者B(作为阻碍话语者A的语音内容的传输的目标的对立方)所在的空间发出通过由掩蔽声数据产生装置11产生的掩蔽声数据表示的声音作为掩蔽声。
存储在存储装置13中的源声数据是通过对表示具有各种属性的人(诸如具有低音调的人和具有高音调的人、男人和女人以及成人和儿童)阅读包括几乎相同的元音声和辅音声的标准日文文本的语音的声数据执行使语音模糊的处理(例如,使沿着时间轴的方向以恒定时间长度划分的块中的数据逆转或使块的顺序交换的处理)所产生的数据。
掩蔽声数据产生装置11包括输入接口(IF)111、BPF 112-1至112-m和LD 113-1至113-m。输入IF 111接收通过麦克风12产生的话语者声数据的输入。BPF 112-1至112-m(下文中统称为“BPF112”)是将从输入IF 111输入的话语者声数据划分为m(其中m≥2)个频带并且针对各个频带产生声数据(下文中称作“频带话语者声数据”)的一组带通滤波器。LD 113-1至113-m(下文中统称为“LD 113”)是指定通过BPF 112产生的频带话语者声数据的各个水平的水平检测器。输入IF 111构成话语者声数据获得部分。BPF 112和LD 113构成频带水平指定部分。
掩蔽声数据产生装置11还包括输入IF 114、再现器115、BPF116-1至116-m和LC 117-1至117-m。输入IF 114接收存储在存储装置13中的源声数据的输入。再现器115按顺序读取和输出输入至输入IF 114中的源声数据。BPF 116-1至116-m(下文中统称为“BPF116”)是将从再现器115输出的源声数据划分为m个频带并针对各个频带产生声数据(下文中称作“频带源声数据”)的一组带通滤波器。LC 117-1至117-m(下文中统称为“LC 117”)是这样的电路(水平控制器),其基于由LD 113-1至113-m中的具有与LC 117对应的分支编号的LD 113指定的频带话语者声数据的水平来改变通过BPF116-1至116-m中的具有与LC 117对应的分支编号的BPF 116产生的频带源声数据的水平。输入IF 114构成源声数据获得部分。
掩蔽声数据产生装置11还包括加法器118和输出IF 119。加法器118通过将其水平被LC 117改变的多个频带源声数据相加来产生表示掩蔽声的声数据(下文中称作“掩蔽声数据”)。输出IF 119将由加法器118产生的掩蔽声数据输出至扩音器14。加法器118与BPF 116和LC 117一起构成频带水平设置部分。
每个频带的BPF 112、LD 113、BPF 116和LC 117彼此一一对应。具体地说,假设k是1≤k≤m中的任意自然数,LD 113-k从BPF112-k获得频带话语者声数据并指定该频带话语者声数据的水平。LC117-k基于由LD 113-k指定的频带话语者声数据的水平从BPF 116-k获得频带源声数据并改变该频带源声数据的水平。
LC 117-1至117-m中的每一个具有存储器。存储器存储在LC117-1至117-m中的每一个中设置的水平改变参数。对应于LC 117-1至117-m中的每一个的水平改变参数包括增益指定函数GR-1至GR-m(下文中统称为“增益指定函数GR”)和时间常数TC-1至TC-m(下文中统称为“时间常数TC”)。
增益指定函数GR-1至GR-m是表示由LD 113-1至113-m中的每一个指定的频带话语者声数据的水平(下文中称作“参考信号电平”)与在LC 117-1至117-m改变由BPF 116-1至116-m中的每一个获得的频带源声数据的水平的情况下的增益的收敛值(下文中称作“目标增益”)之间的对应关系的函数。时间常数TC-1至TC-m是表示在收敛至通过增益指定函数GR-1至GR-m确定的目标增益之前通过LC117-1至117-m改变水平的过程中增益的响应速度的数值。LC 117-1至117-m中的每一个控制频带源声数据在各个频带中的水平,以使得该水平以由时间常数TC表示的响应速度收敛至对应于由增益指定函数GR表示的参考信号电平的目标增益。增益指定函数GR-1至GR-m中的至少两个彼此不同,以获得期望的掩蔽声数据。另外,关于时间常数TC-1至TC-m,时间常数TC-1至TC-m中的至少两个彼此不同,以获得期望的掩蔽声数据。
图2通过各个曲线图示出了增益指定函数GR的三个示例((a)至(c))。图2中的曲线图(a)具有目标增益的下限。当参考信号电平小于或等于I2时,将恒定值g1作为目标增益输出,而不管参考信号电平的幅度如何。曲线图(b)也具有目标增益的下限。当参考信号电平小于或等于I1(I1<I2)时,将恒定值g1作为目标增益输出,而不管参考信号电平的幅度如何。曲线图(c)具有目标增益的上限。当参考信号电平大于或等于I3(I2<I3)时,将恒定值g2(g1<g2)作为目标增益输出,而不管参考信号电平的幅度如何。
在图2中的曲线(a)至(c)示出的增益指定函数GR的三个示例之间的比较中,相对于参考信号电平的整个区中的参考信号电平的相同输入,与曲线图(a)相比,曲线图(b)输出相同或更大的目标增益,并且与曲线图(b)相比,曲线图(c)输出相同或更大的目标增益。因此,在声音掩蔽中,在针对将被阻碍传输的语音中较不重要的信息的频带的LC 117中,例如将曲线图(a)的增益指定函数GR设为水平改变参数。在针对将被阻碍传输的语音中较重要的信息的频带的LC 117中,例如将曲线图(c)的增益指定函数GR设为水平改变参数。
将包括待掩蔽的语音中的大量的共振峰或辅音频率成分的频带作为针对语音中较重要的信息的频带的示例。
图3利用各个曲线图示出了增益指定函数GR的另三个示例((a)至(c))。图3中的所有曲线(a)至(c)具有目标增益的下限和上限。也就是说,当参考信号电平小于或等于I1时,曲线(a)至(c)全部将恒定值g1作为目标增益输出,而不管参考信号电平的幅度如何。另外,当参考信号电平大于或等于I2(I1<I2)时,曲线(a)至(c)全部将恒定值作为目标增益输出,而不管参考信号电平的幅度如何。然而,当参考信号电平大于或等于I2(I1<I2)时,通过曲线(a)至(c)中的每一个输出的目标增益的值不同。曲线(a)、(b)和(c)分别输出恒定值g2、恒定值g3和恒定值g4(g1<g2<g3<g4)。
在利用图3中的曲线(a)至(c)示出的增益指定函数GR的三个示例之间的比较中,当参考信号电平大于或等于I1时,相对于参考信号电平的相同输入,与曲线图(a)相比,曲线图(b)的增益指定函数GR输出更大的目标增益,并且与曲线图(b)相比,曲线图(c)的增益指定函数GR输出更大的目标增益。随着待掩蔽的语音的水平更大,收听者偷听语音的内容的可能性也增大。因此,防止通过这种高水平的语音的信息传输是更重要的。因此,在利用增益指定函数GR的这三个示例的情况下,例如将在参考信号电平大的区中输出小目标增益的曲线图(a)的增益指定函数GR设为较不重要的频带的LC 117中的水平改变参数。将在参考信号电平大的区中输出大目标增益的曲线图(c)的增益指定函数GR设为较重要的频带的LC 117中的水平改变参数。
按照这种方式,在声音掩蔽中,针对各个频带根据将被阻碍传输的语音中的信息的重要性来设置最佳增益指定函数GR。该处理可增大掩蔽声数据产生装置11产生的掩蔽声数据的掩蔽效率。
在掩蔽声数据产生装置11从麦克风12接收话语者声数据之后,根据用于各个频带的话语者声数据的水平而产生的掩蔽声花费少量处理时间输出至扩音器14。因此,在掩蔽声数据产生装置11获得话语者声数据时用于各个频带的参考信号电平与在发出掩蔽声时用于各个频带的被掩蔽的语音的水平之间存在微小差异。然而,显然,当在掩蔽声数据产生装置11中处理时间等足够短时,在掩蔽声数据产生装置11获得话语者声数据时用于各个频带的参考信号电平近似表示在发出掩蔽声时用于各个频带的被掩蔽的语音的水平。
增益指定函数GR不限于如图2和图3所示的线性变化的那些。例如,增益指定函数GR可为如图4所示的非线性的。
例如,存储在LC 117的存储器中并表示增益指定函数GR的数据可具有任何格式的表示函数方程的数据、表示参考信号电平与目标增益之间的对应表的数据等。LC 117可被构造为相对于参考信号电平的输入输出由增益指定函数GR表示的目标增益的模拟电路或数字电路。
作为另一水平改变参数并且在LC 117中设置的时间常数TC表示根据输入参考信号电平在达到根据增益指定函数GR而输出的目标增益之前增益的响应速度。因此,即使参考信号电平快速变化,设有大时间常数TC的LC 117也缓慢地跟随输入参考信号电平,并且在通过LC 117改变频带源声数据的水平的过程中增益平滑地变化。同时,当参考信号电平快速变化时,设有小时间常数TC的LC 117快速地跟随输入参考信号电平,并且在通过LC 117改变频带源声数据的水平的过程中增益快速变化。
例如,关于包括大量辅音的频率成分的频带,就掩蔽效果而言,期望掩蔽声的水平根据参考信号电平快速变化,以掩蔽其水平快速变化的辅音。因此,包括大量辅音的频率成分的频带的LC 117设有小时间常数TC。该处理可提高掩蔽声数据产生装置11产生的掩蔽声数据的掩蔽效果。
例如,当收听其大约30Hz至200Hz的频带的水平不平稳地变化的声音时,收听者会感觉到与晕动病相似的不和谐和不愉快。因此,关于大约30Hz至200Hz的频带,就减小收听者的不和谐和不愉快的感觉而言,期望掩蔽声的水平与参考信号电平的变化相比平滑地改变。因此,大约30Hz至200Hz的频带的LC 117设有大时间常数TC。该处理可由于掩蔽声数据产生装置11产生的掩蔽声数据而减小带给收听者的不和谐和不愉快的感觉。
掩蔽声产生系统1的操作如下。首先,BPF 112-1至112-m中的每一个通过输入IF 111连续地从麦克风12接收表示话语者A的语音的话语者声数据。BPF 112-1至112-m通过对从麦克风12接收到的话语者声数据执行滤波处理来产生频带话语者声数据,并将该频带话语者声数据传递至LD 113-1至113-m。LD 113-1至113-m中的每一个获得由从BPF 112-1至112-m中的每一个接收的频带话语者声数据表示的声音的频谱的包络,并指定该包络的水平。LD 113-1至113-m中的每一个将该指定的水平作为参考信号电平传递至LC 117-1至117-m中的每一个。
与以上输入IF 111、BPF 112和LD 113的处理同时地,再现器115通过输入IF 114按次序从存储装置13读取源声数据并将该源声数据传递至BPF 116-1至116-m。BPF 116-1至116-m通过对接收到的源声数据执行滤波处理产生频带源声数据,并将该频带源声数据分别传递至LC 117-1至117-m。
LC 117-1至117-m中的每一个接收从LD 113-1至113-m中的每一个按次序传递的参考信号电平,以及接收从BPF 116-1至116-m中的每一个按次序传递的频带源声数据。LC 117-1至117-m中的每一个基于增益指定函数GR-1至GR-m中的每一个根据接收到的参考信号电平指定目标增益,并分别确定当前增益,以使得增益以分别由时间常数TC-1至TC-m代表的响应速度达到指定目标增益。LC 117使从BPF 116-1至116-m接收到的频带源声数据的水平改变以获得确定的增益,并将其水平改变的频带源声数据传递至加法器118。
加法器118通过将从LC 117-1至117-m中的每一个接收到的多个频带源声数据相加产生掩蔽声数据。加法器118通过输出IF 119将产生的掩蔽声数据输出至扩音器14。扩音器14根据从掩蔽声数据产生装置11输入的掩蔽声数据将掩蔽声发射至收听者B所在的空间。这个处理防止了话语者A的语音内容被收听者B偷听。
因此,如上所述,掩蔽声产生系统1根据针对各个频带设置的增益指定函数GR和时间常数TC产生其水平针对各个频带根据话语者声数据的水平而调整的掩蔽声数据。因此,通过针对各个频带合适地设置增益指定函数GR和时间常数TC来发射具有高掩蔽效果的掩蔽声或者带给收听者较少的不愉快和不和谐的感觉的掩蔽声。
[2、修改示例]
下面将提供上述实施例的修改示例的描述。在下面的描述中,与在以上的掩蔽声产生系统1中设置的构造单元相同的单元将使用相同参考标号。另外,将主要描述掩蔽声产生系统1与根据修改示例的掩蔽声产生系统之间的不同,并且将合适地省略共同点的描述。
[2.1、第一修改示例]
图5是示出根据第一修改示例的掩蔽声产生系统2的构造的框图。掩蔽声产生系统2包括替代设置在掩蔽声产生系统1中的存储装置13的存储装置23。存储装置23存储表示预先划分的多个频带中的多个源声的频带源声数据。另外,掩蔽声产生系统2包括替代设置在掩蔽声产生系统1中的掩蔽声数据产生装置11的掩蔽声数据产生装置21。掩蔽声数据产生装置21不包括设置在掩蔽声数据产生装置11中的BPF 116-1至116-m。掩蔽声数据产生装置21将频带源声数据分别直接传递至对应的LC 117-1至117-m,由再现器115通过输入IF 114从存储装置23读取该频带源声数据。
因此,在具有以上构造的掩蔽声产生系统2中,掩蔽声数据产生装置21不需要执行将源声数据划分为多个频带的处理,因此减少了用于划分源声数据的频带的处理负荷。掩蔽声产生系统1使用通过BPF 116划分一个源声数据的频带获得的多个频带源声数据。因此,作为所述多个频带源声数据的原始数据的源声数据不能对于各个频带而不同。相反,掩蔽声产生系统2可使用通过针对各个频带划分不同的源声数据的频带而获得的频带源声数据。因此,掩蔽声产生系统2利用通过针对各个频带划分最佳源声数据的频带而获得的频带源声数据来发射更理想的掩蔽声。
[2.2、第二修改示例]
图6是示出根据第二修改示例的掩蔽声产生系统3的构造的框图。掩蔽声产生系统3包括替代设置在掩蔽声产生系统1中的掩蔽声数据产生装置11的掩蔽声数据产生装置31。掩蔽声数据产生装置31包括替代设置在掩蔽声数据产生装置11中的再现器115的模糊处理单元315。模糊处理单元315是对通过输入IF 111从麦克风12输入的话语者声数据执行使话语者声数据的语音或语言含义模糊的处理的处理单元。也就是说,掩蔽声产生系统3使用表示话语者A的语音并通过麦克风12实时地接收的话语者声数据的模糊了的版本而非预先预备的源声数据来作为源声数据。因此,掩蔽声产生系统3不包括用于存储预先预备的源声数据的存储装置13。
当通过输入IF 111实时地按次序从麦克风12获得话语者声数据时,模糊处理单元315将获得的话语者声数据暂时地存储在缓冲器中(临时存储),以恒定时间长度将话语者声数据划分为多块,并沿着时间轴的方向使划分的块中的数据反转。然后,例如,模糊处理单元315通过随意交换(改变)这些块的次序来产生源声数据。通过模糊处理单元315执行的模糊处理不限于该处理。模糊处理单元315可采用各种已知的模糊处理。模糊处理单元315将产生的源声数据传递至BPF 116-1至116-m中的每一个。BPF 116构成源声数据获得部分。
一般来说,与待掩蔽的语音具有较高相似度的声学特性的掩蔽声具有高掩蔽效果。因此,当掩蔽声模糊时,优选地使用基于与话语者的待掩蔽的语音具有高相似度的声学特性的相同话语者的语音产生的掩蔽声作为掩蔽声。设有以上构造的掩蔽声产生系统3基于表示话语者A的语音的话语者声数据产生源声数据,并在产生掩蔽声数据的过程中使用该源声数据。因此,掩蔽声产生系统3与掩蔽声产生系统1相比发出具有高掩蔽效果的掩蔽声。
实时地接收的话语者A的语音在掩蔽声产生系统3中被用作源声。因此,在通过LC 117的水平调整之前的频带源声数据的水平与话语者A的待掩蔽的语音的水平相关地改变。
一般来说,待掩蔽的语音的水平越大时,在掩蔽中需要的掩蔽声的水平增大。因此,期望掩蔽声的水平与待掩蔽的语音的水平相关地改变。然而,参考信号电平越高时,通过LC 117根据增益指定函数GR指定的目标增益增大。因此,当时间常数TC小,并且话语者A的语音的水平高时,LC 117还会响应于话语者A的语音的水平增大而使其水平在先前就高的频带源声数据的水平增大。这样会导致产生具有不必要的高音量的掩蔽声数据。
为了避免该问题,例如,掩蔽声数据产生装置21可被构造为包括水平限制单元,其将在通过模糊处理单元315的模糊处理中的话语者声数据的水平或在通过BPF 116的频带划分之后的频带源声数据的水平限制为预定值或更小。
[2.3、第三修改示例]
图7是示出根据第三修改示例的掩蔽声产生系统4的构造的框图。掩蔽声产生系统4包括替代设置在掩蔽声产生系统1中的掩蔽声数据产生装置11的掩蔽声数据产生装置41。掩蔽声数据产生装置41包括重要频带指定单元401和参数设置单元402。参数设置单元402与BPF 116、LC 117和加法器118一起构成频带水平设置部分。
重要频带指定单元401分析通过输入IF 111从麦克风12输入的话语者声数据。关于由该话语者声数据表示的话语者A的语音,重要频带指定单元401在执行声音掩蔽之后以预定时间间隔(例如,以100至500ms)指定特定重要频带(例如,包括其水平大于或等于预定阈值的第一共振峰或第一辅音成分的频带(下文中称作“重要频带”))。然后,重要频带指定单元401将用于识别指定的重要频带的重要频带识别数据传递至参数设置单元402。
每当参数设置单元402获得重要频带识别数据时,参数设置单元402在通过重要频带识别数据识别的频带的LC 117中设置增益指定函数GR(例如,由图2中的曲线图(c)或图3中的曲线图(c)表示的增益指定函数GR)和时间常数TC(例如,就包括大量辅音的频率成分的重要频带而言,为小时间常数TC)。当被指定为重要频带的频带不再是重要频带时,参数设置单元402在该频带的LC 117中设置默认增益指定函数GR和默认时间常数TC。因此,根据对应的频带是否是重要频带,LC 117根据不同的水平改变参数改变频带源声数据的水平。
具有以上构造的掩蔽声产生系统4指定当前话语者的语音中的重要频带,并针对与被指定为重要频带的频带相对应的LC 117中的重要频带来设置合适的水平改变参数。因此,即使语音中的重要频带根据话语者而不同,掩蔽声产生系统4也能发出具有高掩蔽效果的掩蔽声,而不管话语者是否改变。
除实时地分析话语者声数据和指定重要频带的以上方法之外,重要频带指定单元401可利用以下方法指定重要频带。
例如,当重要频带预先固定地确定时,重要频带指定单元401可存储用于识别重要频带的重要频带识别数据,并且可将该重要频带识别数据传递至参数设置单元402。作为另外一种选择,参数设置单元402可存储用于识别重要频带的重要频带识别数据。在这种情况下,参数设置单元402还执行重要频带指定单元401的功能。
除第一共振峰和第一辅音之外,重要频带指定单元401还基于诸如话语者的性别和年龄、话语者的语音的语言、话语者的语音的语速、话语者的语音的音高和话语者的语音的音量之类的话语者的特征或话语者的语音的特征来指定重要频带。例如,针对诸如话语者的性别和年龄、话语者的语音的语言、话语者的语音的语速、话语者的语音的音高和话语者的语音的音量之类的话语者或话语者的语音的各个特征预先确定重要频带。重要频带指定单元401针对话语者或话语者的语音的特征中的每一个存储用于识别对应的重要频带的重要频带识别数据。然后,当掩蔽声产生系统4的用户(例如,话语者)将话语者或话语者的语音的特征输入至掩蔽声产生系统4中时,重要频带指定单元401将对应于输入特征的重要频带识别数据传递至参数设置单元402。重要频带指定单元401可独立于话语者或话语者的语音的特征的输入通过分析话语者声数据来指定诸如话语者的性别和年龄、话语者的语音的语言、话语者的语音的语速、话语者的语音的音高和话语者的语音的音量之类的话语者或话语者的语音的特征。
[2.4、第四修改示例]
图8是示出根据第四修改示例的掩蔽声产生系统5的构造的框图。除接收话语者A的语音的麦克风12之外,掩蔽声产生系统5还包括麦克风52。麦克风52接收话语者A所在的空间(或收听者B所在的空间)中的背景噪声并产生声数据(下文中称作“背景噪声数据”)。
掩蔽声产生系统5包括替代设置在掩蔽声产生系统1中的掩蔽声数据产生装置11的掩蔽声数据产生装置51。掩蔽声数据产生装置51包括输入IF 501、BPF 502-1至502-n和LD 503-1至503-n。输入IF 501接收由麦克风52产生的背景噪声数据的输入。BPF 502-1至502-m(下文中统称为“BPF 502”)是将从输入IF 501输入的背景噪声数据划分为n(n是从1至m的因数)个频带并针对各个频带产生声数据(下文中称作“频带背景噪声数据”)的一组带通滤波器。LD 503-1至503-m(下文中统称为“LD 503”)是指定由BPF 502产生的频带背景噪声数据的各个水平的水平检测器。输入IF 501构成背景噪声数据获得部分。BPF 502和LD 503与BPF 112和LD 113一起构成频带水平指定部分。
掩蔽声数据产生装置51还包括加法器504-1至504-n和LC505-1至505-n。针对通过将相邻的LC 117-1至117-m以(m/n)分组获得的n组中的每一组来设置加法器504-1至504-n(下文中统称为“加法器504”)。加法器504-1至504-n将其水平被一组中的(m/n)个LC 117改变的多个频带源声数据相加并输出。LC 505-1至505-n(下文中统称为“LC 505”)针对加法器504-1至504-n中的每一个而设置,并基于由LD 503-1至503-n指定的频带背景噪声数据的水平来改变从加法器504输出的相加的频带源声数据的水平。
掩蔽声数据产生装置51还包括替代设置在掩蔽声数据产生装置11中的加法器118的加法器518。加法器518通过将通过加法器504-1至504-n的加法得到的其水平通过LC 505-1至505-n改变的n个频带源声数据相加来产生掩蔽声数据,并通过输出IF 119将相加的频带源声数据输出至扩音器14。加法器518与BPF 116、LC 117、加法器504和LC 505一起构成频带水平设置部分。
与BPF 502-1至502-n中的每一个对应的n个频带与通过以(m/n)将与BPF 116-1至116-m中的每一个对应的连续的m个频带进行分组和组合而获得的n个频带匹配。也就是说,例如,当m=12并且n=4时,BPF 502-1的频带与对应于BPF 116-1至116-3的三个连续频带匹配。BPF 502-2的频带与对应于BPF 116-4至116-6的三个连续频带匹配。BPF 502-3的频带与对应于BPF 116-7至116-9的三个连续频带匹配。BPF 502-4的频带与对应于BPF 116-10至116-12的三个连续频带匹配。
LC 505-1至505-n中的每一个包括存储器。该存储器将在LC505-1至505-n中的每一个中设置的增益指定函数GR和时间常数TC作为水平改变参数来存储。LC 505-1至505-n中的每一个接收由LD503-1至503-n中的与LC 505具有对应的分支编号的LD 503指定的水平作为参考信号电平,并控制通过加法器504-1至504-n中的与LC 505具有对应的分支编号的加法器504混合的频带源声数据的水平,以使得该水平以由预设时间常数TC表示的响应速度收敛至对应于由预设的增益指定函数GR表示的参考信号电平的目标增益。
具有以上构造的掩蔽声产生系统5根据用于各个频带的背景噪声的水平针对各个频带调整掩蔽声数据的水平。例如,关于具有高水平的背景噪声的频带,收听者对具有相对高水平的掩蔽声几乎感觉不到刺耳。因此,掩蔽声产生系统5在LC 505-1至505-n中设置诸如在图2中的曲线图(c)和图3中的曲线图(c)中示出的那些的增益指定函数GR。因此,能发出具有高掩蔽效果的掩蔽声,而不增加收听者的不愉快的感觉。
掩蔽声产生系统5被构造为根据表示背景噪声的背景噪声数据在源声数据的水平的调整中具有n个频带,并且根据表示话语者A的语音的话语者声数据,在源声数据的水平调整中,频带的数量n小于频带的数量m。其原因在于,由于背景噪声将不被掩蔽,因此当与待掩蔽的话语者A的语音比较时不必精细地控制背景噪声的各个频带。按照这种方式,当与n等于m的情况相比时,通过将n设为小于m,BPF 502、LD 503和LC 505的数量可减小。该处理可简化掩蔽声数据产生装置51的构造并且可降低处理负荷。然而,当掩蔽声数据产生装置51的处理性能足够时,n和m可相等。在这种情况下,不需要加法器504。
将在LC 505中设置的时间常数TC设为比在LC 117中设置的时间常数TC的值更大的值。其原因在于,背景噪声可包括不需要被掩蔽的脉冲声,并且发出其水平跟随脉冲声迅速改变的掩蔽声不必要地增加了收听者的不愉快的感觉,因此为不期望的。具体地说,当与具有低频带的LC 505相比,具有高频带的LC 505设有较大值的时间常数TC时,该处理可减小包括在背景噪声中的脉冲声对掩蔽声的影响,因此期望地减小了收听者的不愉快感觉。因此,掩蔽声产生系统5发出其水平针对各个频带迅速地跟随话语者的语音并且逐渐地跟随背景噪声的掩蔽声。
[2.5、第五修改示例]
图9是示出根据第五修改示例的掩蔽声产生系统6的构造的框图。掩蔽声产生系统6包括替代设置在掩蔽声产生系统1中的存储装置13的存储装置63。存储装置63存储两个不同的源声数据(第一源声数据和第二源声数据)。存储在存储装置63中的第一源声数据是与存储在存储装置13中的源声数据相似并且通过对语音数据执行模糊处理获得的声数据。同时,第二源声数据是表示诸如细浪声和鸟鸣之类在自然中或在环境中发现的声音(下文中称作“环境声”)的声数据,该环境声不会引起过度的注意并且不会带来不愉快的感觉。在产生掩蔽声数据时增加第二源声数据,以不掩蔽话语者的语音,并且还减小由掩蔽声导致的不愉快。
掩蔽声产生系统6包括替代设置在掩蔽声产生系统1中的掩蔽声数据产生装置11的掩蔽声数据产生装置61。除接收存储在存储装置63中的第一源声数据的输入的输入IF 114以外,掩蔽声数据产生装置61还包括输入IF 600。该输入IF 600接收存储在存储装置63中的第二源声数据的输入。另外,掩蔽声数据产生装置61包括再现器601。再现器601按顺序读取和输出输入至输入IF 600中的第二源声数据。
掩蔽声数据产生装置61还包括BPF 602-1至602-m和LC 603-1至603-m。BPF 602-1至602-m(下文中统称为“BPF 602”)是将从再现器601输出的第二源声数据划分为m个频带并产生用于各个频带的声数据(下文中称作“频带第二源声数据”)的一组带通滤波器。LC 603-1至603-m(下文中统称为“LC 603”)是基于由LD 113-1至113-m中的与LC 603具有对应分支编号的LD 113指定的频带话语者声数据的水平改变由BPF 602-1至602-m中的与LC 603具有对应分支编号的BPF 602产生的频带第二源声数据的水平的电路。
掩蔽声数据产生装置61还包括加法器604和加法器605。加法器604通过将其水平被LC 603改变的多个频带第二源声数据相加来产生表示加至掩蔽声的环境声的环境声数据。加法器605通过将由加法器118产生的掩蔽声数据和由加法器604产生的环境声数据相加来产生表示带来较少不愉快的掩蔽声的掩蔽声数据。加法器605通过输出IF 119将产生的掩蔽声数据输出至扩音器14。加法器604和加法器605与BPF 116、LC 117、加法器118、BPF 602和LC 603一起构成频带水平设置部分。
LC 603-1至603-m中的每一个包括存储器。该存储器存储在LC603-1至603-m中的每一个中设置的增益指定函数GR和时间常数TC作为水平改变参数。LC 603-1至603-m中的每一个接收由LD 113-1至113-m中的与LC 603具有对应分支编号的LD 113指定的水平作为参考信号电平,并控制从BPF 602-1至602-m中的与LC 603具有对应分支编号的BPF 602传递的频带第二源声数据的水平,以使得所述水平以由预设时间常数TC表示的响应速度收敛至对应于由预设增益指定函数GR表示的参考信号电平的目标增益。
将在LC 603中设置的时间常数TC的值设为比在LC 117中设置的时间常数TC的值更大。由于环境声在待掩蔽的空间中产生背景噪声,因此当与具有作为其源的模糊的语音的掩蔽声相比时没必要迅速跟随待掩蔽的语音的水平变化而改变环境声的水平。当环境声的水平迅速跟随待掩蔽的语音的水平的变化而一次改变一点时,不必要地增加了收听者的不愉快感觉,因此这是不期望的。
具有以上构造的掩蔽声产生系统6发出向其添加了环境声的模糊的语音和掩蔽声。此时,模糊的语音和环境声的水平根据不同参数(时间常数TC)针对各个频带根据话语者A的语音的水平而改变。因此,掩蔽声产生系统6发出具有高掩蔽效率和给收听者带来较少不愉快的掩蔽声。
[2.6、第六修改示例]
图10是示出根据第六修改示例的掩蔽声产生系统7的构造的框图。通过将先前在以上描述的第四修改示例中的掩蔽声产生系统5的构造(图8)与第五修改示例中的掩蔽声产生系统6的构造(图9)组合来构造掩蔽声产生系统7。因此,在图10中,为与掩蔽声产生系统5或掩蔽声产生系统6的构造单元相同的单元赋予相同参考标号。
按照与掩蔽声产生系统5相同的方式,掩蔽声产生系统7包括接收话语者A(或收听者B)所在的空间中的背景噪声的麦克风52。另外,掩蔽声产生系统7包括替代设置在掩蔽声产生系统1中的掩蔽声数据产生装置11的掩蔽声数据产生装置71。与掩蔽声数据产生装置51相似,掩蔽声数据产生装置71包括:输入IF 501,其从麦克风52接收背景噪声数据的输入;BPF 502-1至502-n,其将通过输入IF 501从麦克风52输入的背景噪声数据划分为n个频带背景噪声数据;以及LD 503-1至503-n,其对应于BPF 502-1至502-n中的每一个,并指定频带背景噪声数据的水平。
按照与掩蔽声产生系统6相同的方式,掩蔽声产生系统7还包括存储表示对其执行模糊处理的语音的第一源声数据和表示环境声的第二源声数据的存储装置63。另外,按照与掩蔽声数据产生装置61相同的方式,掩蔽声数据产生装置71包括:输入IF 600,其接收存储在存储装置63中的第二源声数据的输入;再现器601,其再现第二源声数据;多个BPF 602,其将第二源声数据划分为多个频带第二源声数据;以及多个LC 603,其对应于所述多个BPF 602并且调整频带第二源声数据的水平。在掩蔽声数据产生装置71中设置的BPF602和LC 603的个数为n,并且其与掩蔽声数据产生装置61中设置的不同。
掩蔽声数据产生装置71的LC 603-1至603-n中的每一个接收由LD 503-1至503-n中的与LC 603具有对应分支编号的LD 503指定的水平作为参考信号电平。也就是说,LC 603-1至603-n接收频带背景噪声数据的水平作为参考信号电平,并针对各个频带改变表示环境声的第二源声数据的水平。
与掩蔽声数据产生装置61相似,掩蔽声数据产生装置71还包括:加法器604,其通过将其水平被LC 603-1至603-n改变的多个频带第二源声数据相加来产生环境声数据;和加法器605,其通过将由加法器118产生的掩蔽声数据和由加法器604产生的环境声数据相加来产生表示带来较少不愉快的掩蔽声的掩蔽声数据。加法器605将产生的掩蔽声数据通过输出IF 119输出至扩音器14。
因此,具有以上构造的掩蔽声产生系统7发出向其添加了环境声的模糊的语音和具有较少不愉快的掩蔽声。此时,根据话语者A的语音的水平调整用于各个频带的模糊的语音,并且独立于根据话语者A的语音的水平的调整而根据背景噪声的水平针对各个频带调整环境声。因此,通过发出其水平跟随待掩蔽的语音的水平改变的模糊的语音而获得高掩蔽效率,并且通过发出其水平跟随背景噪声的水平改变的环境声来自然地混合背景噪声和环境声。因此,在对收听者带来较少不愉快的情况下执行声音掩蔽。
[2.7、第七修改示例]
图11是示出根据第七修改示例的掩蔽声产生系统8的构造的框图。掩蔽声产生系统8的构造与掩蔽声产生系统7的构造(图10)相似,并且是先前在上面描述的第四修改示例中的掩蔽声产生系统5的构造(图8)和第五修改示例中的掩蔽声产生系统6的构造(图9)的组合。因此,在图11中,按照与图10相同的方式,为与掩蔽声产生系统5或掩蔽声产生系统6的构造单元相同的单元赋予相同的参考标号。
掩蔽声产生系统8通过针对各个频带根据从用于各个频带的话语者A的语音与背景噪声的相加获得的声音的水平而改变模糊的语音(第一源声数据)和环境声(第二源声数据)中的每一个的水平并且通过将其水平被改变的模糊的语音与环境声相加,来产生掩蔽声。针对改变模糊的语音的水平的用途和改变环境声的水平的用途单独地设置在将话语者A的语音与背景噪声相加中的水平的比率。
为了实现以上功能,按照与掩蔽声产生系统7相同的方式,掩蔽声产生系统8包括:麦克风52,其接收背景噪声;以及存储装置63,其存储第一源声数据和第二源声数据。另外,掩蔽声产生系统8包括替代设置在掩蔽声产生系统1中的掩蔽声数据产生装置11的掩蔽声数据产生装置81。按照与掩蔽声数据产生装置71相同的方式,掩蔽声数据产生装置81包括用于处理由麦克风52产生的背景噪声数据的输入IF 501和多个BPF 502。设置在掩蔽声数据产生装置81中的BPF 502的数量为m。
掩蔽声数据产生装置81包括加法器801-1至801-m和加法器802-1至802-m,其针对各个相同的频带将由BPF 112-1至112-m产生的频带话语者声数据和由BPF 502-1至502-m产生的频带背景噪声数据相加。也就是说,加法器801-1至801-m中的每一个将由BPF112-1至112-m中的与加法器801-1至801-m中的每一个具有对应分支编号的BPF 112产生的频带话语者声数据与由BPF 502-1至502-m中的与加法器801-1至801-m中的每一个具有对应编号的BPF 502产生的频带背景噪声数据相加。按照相同的方式,加法器802-1至802-m中的每一个将由BPF 112-1至112-m中的与加法器801-1至801-m中的每一个具有对应分支编号的BPF 112产生的频带话语者声数据与由BPF 502-1至502-m中的与加法器801-1至801-m中的每一个具有对应分支编号的BPF 502产生的频带背景噪声数据相加。在加法器801-1至801-m的每一个中单独地设置在将频带话语者声数据与频带背景噪声数据相加中的水平的比率。按照相同的方式,在加法器802-1至802-m的每一个中单独地设置在将频带话语者声数据与频带背景噪声数据相加中的水平的比率。
掩蔽声数据产生装置81包括替代设置在掩蔽声数据产生装置11中的LD 113-1至113-m的LD 803-1至803-m。LD 803-1至803-m指定从通过加法器801-1至801-m的加法获得的声数据的水平。将由LD 803-1至803-m指定的水平作为参考信号电平传递至LC 117-1至117-m,并且将其用于改变从第一源声数据(表示模糊的语音的声数据)划分出的频带源声数据的水平的过程中。
掩蔽声数据产生装置81还包括指定从通过加法器802-1至802-m的加法产生的声数据的水平的LD 804-1至804-m。将由LD804-1至804-m指定的水平作为参考信号电平传递至LC 603-1至603-m,并且将其用于改变从第二源声数据(表示环境声的声数据)划分出的频带第二源声数据的水平的过程中。
通过加法器118将其水平被LC 117-1至117-m改变的多个频带源声数据相加,并且使其变成掩蔽声数据。通过加法器604将其水平被LC 603-1至603-m改变的多个频带第二源声数据相加,并使其变成环境声数据。通过加法器605将通过加法器118产生的掩蔽声数据和通过加法器604产生的环境声数据相加,并通过输出IF 119将其输出至扩音器14。
具有以上构造的掩蔽声数据产生装置81将通过麦克风12产生的话语者声数据和通过麦克风52产生的背景噪声数据的频带进行划分,并针对各个频带将划分的各个数据相加。作为替代,掩蔽声数据产生装置81可被构造为在频带划分之前首先将话语者声数据与背景噪声数据相加,并且随后划分其频带。在这种情况下,在相加时不能针对各个频带单独地设置水平的比率,但是当与图11所示的构造相比时加法器的数量可减少。该处理还可简化掩蔽声数据产生装置81的构造并降低处理负荷。
具有以上构造的掩蔽声产生系统8发出向其添加了环境声的模糊的语音和掩蔽声。此时,从话语者A的语音与背景噪声的相加获得的声音中的话语者A的语音和背景噪声的水平的比率(在模糊的语音的水平改变中参照该比率)与针对各个频带单独地设置的水平的比率一致。因此,调整这些水平比率的设置可调整包括在根据话语者A的语音的水平而改变的掩蔽声中的模糊的语音的水平的程度与其根据用于各个频带的背景噪声的水平而改变的程度之间的平衡。另外,从话语者A的语音与背景噪声的相加获得的声音中的话语者A的语音与背景噪声的水平的比率(在环境声的水平改变中参照该比率)也与针对各个频带单独设置的水平的比率一致。因此,调整这些水平比率的设置可调整包括在根据话语者A的语音的水平而改变的掩蔽声中的环境声的水平的程度与其根据用于各个频带的背景噪声的水平而改变的程度之间的平衡。因此,掩蔽声产生系统8可发出在掩蔽效率与降低对收听者带来的不愉快这两点之间具有平衡的掩蔽声。
[2.8、第八修改示例]
在第八修改示例中,计算机根据程序执行处理,以像具有图1所示的构造的掩蔽声数据产生装置11那样操作。图12是示出根据第八修改示例的掩蔽声产生系统9的构造的框图。
掩蔽声产生系统9包括替代设置在掩蔽声产生系统1中的掩蔽声数据产生装置11的计算机10。计算机10是通用计算机,并包括CPU 101、存储器102和输入-输出IF 103。CPU 101根据BIOS、OS、应用程序等执行各种操作,并控制其它构造单元。存储器102包括存储诸如BIOS、OS、应用程序和用户数据之类的各种数据的ROM、RAM、硬盘、SSD等。输入-输出IF 103将数据输入和输出至外部装置。CPU101、存储器102和输入-输出IF 103通过总线109彼此连接。麦克风12、存储装置13、扩音器14和读取装置15作为外部装置连接至输入-输出IF 103。
读取装置15是从其上记录有应用程序的记录介质16读取根据当前修改示例的应用程序(下文中简单地称作“应用程序”)的装置。记录介质16是其上可通过读取装置15通过计算机10记录数据的非易失性记录介质,并且例如可为CD-ROM、DVD-ROM、闪速存储器等中的任一个。
根据存储在存储器102中的程序,CPU 101响应于用户利用例如连接至输入-输出IF 103的键盘等(未示出)的操作来指示读取装置15从安装在读取装置15中的记录介质16中读取应用程序。将通过读取装置15根据该指令从记录介质16中读取的应用程序通过输入-输出IF 103传递至存储器102,并将其存储在存储器102中。
然后,CPU 101根据存储在存储器102中的应用程序对各种数据进行处理。因此,计算机10用作具有图1所示的构造的掩蔽声数据产生装置11。也就是说,存储在记录介质16中并且被读取以通过计算机10使用的应用程序是计算机执行设置在掩蔽声数据产生装置11中的各构造单元中的每一个的处理需要的程序。
CPU 101可被构造为根据对应于第一修改示例至第七修改示例的任一个应用程序执行处理,以使得计算机10用作图5至图11所示的掩蔽声数据产生装置21至掩蔽声数据产生装置81中的任一个。在当前修改形式中的以上构造中,当执行根据应用程序的处理时,CPU101从存储器102读取应用程序,该应用程序被从记录介质16复制至存储器102。作为替代,CPU 101可被构造为当执行根据应用程序的处理时通过读取装置15读取记录在记录介质16上的应用程序。另外,作为通过读取装置15从记录介质16读取应用程序的替代,计算机10可被构造为通过网络从存储应用程序的装置接收应用程序,将应用程序存储在存储器102上,并且使用应用程序。
[2.9、其它修改示例]
还可对上述实施例或修改示例执行修改。
(1)根据实施例的掩蔽声数据产生装置11通过将从源声数据的频带的划分获得的m个频带源声数据的水平设为分别对应于从话语者声数据的频带的划分获得的m个频带话语者声数据的水平以及将源声数据与话语者声数据相加来产生掩蔽声数据。用于通过掩蔽声数据产生装置11产生掩蔽声数据中的频带源声数据的数量可为大于或等于2的任何数。另外,用于通过掩蔽声数据产生装置11产生掩蔽声数据中的两个或更多个不同频带的频带源声数据不需要是无间隙连续的。在它们之间可存在间隙或重叠部分。对于在第一修改示例至第七修改示例中的频带源声数据和频带话语者声数据以及第四修改示例、第六修改示例或第七修改示例中的频带背景噪声数据的情况,频带的数量和布置方式也是不受限的,只要这些数据是具有两个或更多个不同的频带的声数据即可。
(2)根据实施例的掩蔽声数据产生装置11和根据第一修改示例至第四修改示例的掩蔽声数据产生装置21至掩蔽声数据产生装置51通过不同地改变在设置在其中的水平控制器(LC 117和LC 505)中设置的参数(增益指定函数GR和时间常数TC)来产生具有不同特征的掩蔽声数据。另外,根据第五修改示例至第七修改示例的掩蔽声数据产生装置61至掩蔽声数据产生装置81通过不同地改变在水平控制器(LC 117和LC 603)中设置的参数(增益指定函数GR和时间常数TC)和在设置在其中的加法器中设置的参数(在加法中的水平的比率)来产生具有不同特征的掩蔽声数据。
掩蔽声数据产生装置11至掩蔽声数据产生装置81(下文中统称为“掩蔽声数据产生装置”)可被构造为通过将参数的多种组合预先制备为模板、将该模板存储在例如存储装置13、存储装置23或存储装置63上、允许用户选择用户就例如可听度和掩蔽效率而言认为是期望的模板以及根据用户选择的模板设置参数来产生掩蔽声数据。
(3)麦克风12旨在接收话语者A的语音,还同时接收话语者A所在的空间中的背景噪声。因此,例如,当在话语者A附近发出大噪声时,通过掩蔽声数据产生装置产生的掩蔽声数据的水平受到噪声的水平的影响。在针对其设置了小时间常数TC的频带中,影响尤其大。当将除语音之外的噪声等的水平作为参考信号电平输入设有参数的水平控制器中以通过作为参考信号电平的语音的水平来改变水平时,从中导致的掩蔽声数据可表示不期望的掩蔽声。为了避免这种问题,例如,掩蔽声数据产生装置可包括滤波器(诸如均衡器的频率特征调整部分),其对通过输入IF 111从麦克风12输入的话语者声数据或对在通过BPF 112划分话语者声数据的频带之后获得的多个频带话语者声数据中的每一个执行信号处理,以减少包括在由话语者声数据或频带话语者声数据表示的声音中的声音的非语音成分。
(4)在上述实施例和修改示例中,麦克风12(和麦克风52)、存储装置13(或存储装置23或存储装置63)和扩音器14作为外部装置连接至掩蔽声数据产生装置。然而,这些装置中的至少一个可并入掩蔽声数据产生装置中。另外,麦克风12(和麦克风52)、存储装置13(或存储装置23或存储装置63)和扩音器14可按照有线或无线方式连接至掩蔽声数据产生装置,并且可直接或通过网络与其连接。
(5)设置在根据上述实施例或修改示例的掩蔽声数据产生装置中的两个或更多个构造单元可被构造为一个组合的构造单元。例如,虽然将设置在掩蔽声数据产生装置11中的LD 113-1至113-m和LC117-1至117-m描述为单独的装置,但是LD 113-1至113-m中的每一个和LC 117-1至117-m中的具有对应分支编号的LC 117可被构造为一个组合的电路。另外,设置在根据上述实施例或修改示例的掩蔽声数据产生装置中的一个构造单元可被构造为聚集彼此协作的两个或更多个构造单元。
(6)在上述实施例或修改示例中,并入掩蔽声数据产生装置中的构造单元的一部分可被构造为在外部连接至掩蔽声数据产生装置的装置。例如,设置在掩蔽声数据产生装置11中的再现器115可作为外部装置连接至掩蔽声数据产生装置11。
(7)根据上述实施例或修改示例的掩蔽声数据产生装置使用频带话语者声数据或频带背景噪声数据的包络的水平作为输入至水平控制器的参考信号电平。然而,可将诸如功率谱的平均值之类的任何指数用作参考信号电平,只要该指数指示频带话语者声数据或频带背景噪声数据的水平的幅度即可。
(8)设置在根据上述实施例或修改示例的掩蔽声产生系统1至9中的构造单元的数量和通过这些构造单元处理的数据的数量可任意改变。例如,麦克风12和麦克风52的数量可被构造为大于或等于2,以对通过各个麦克风接收的声音执行各种处理。作为另外一种选择,存储装置13可被构造为存储多个源声数据,存储装置23存储多组频带源声数据,或者存储装置63存储多个第一源声数据和多个第二源声数据,以单独地针对这些数据执行各种处理。
(9)在上述实施例或修改示例中采用的数据处理的次序的一部分可由获得相同或相似结果的另一次序替代。例如,可采用在执行频带划分之后添加声数据以及在频带划分之前添加了声数据之后执行频带划分的任何方法,只要通过这些方法获得的多个数据彼此相同或相似即可。
(10)在上述第四修改示例、第六修改示例和第七修改示例中,包括在通过麦克风12接收的声音(主要包括话语者A的语音)中的背景噪声可被构造为在通过例如已知的滤波处理提取之后被使用,而不使用利用麦克风52接收的背景噪声。
(11)不限制掩蔽声数据产生装置和存储装置13(或者存储装置23或存储装置63)的布置位置。例如,掩蔽声数据产生装置可布置在话语者A所在的空间(或者收听者B所在的空间)中,并且存储装置13(或者存储装置23或存储装置63)可通过网络布置在在地理上与话语者A所在的空间或收听者B所在的空间分离的位置。在这种情况下,掩蔽声数据产生装置可通过在掩蔽声数据的产生开始之前将数据完全下载至例如存储器102来使用存储在存储装置13中的源声数据(或者存储在存储装置23中的频带源声数据,或者存储在存储装置63中的第一源声数据和第二源声数据),或者可通过与掩蔽声数据的产生同步地从存储装置13(或存储装置23或存储装置63)按次序接收其必要部分来使用源声数据。
除存储装置13(或者存储装置23或存储装置63)之外,例如,掩蔽声数据产生装置还可通过网络布置在在地理上与话语者A所在的空间和收听者B所在的空间分离的位置。在这种情况下,将通过麦克风12产生的话语者声数据(和通过麦克风52产生的背景噪声数据)通过网络发送至掩蔽声数据产生装置,并且将其用于掩蔽声数据的产生中。另外,将通过掩蔽声数据产生装置产生的掩蔽声数据通过网络发送至扩音器14,并且将其用于掩蔽声的发射中。
(12)在上述实施例或修改示例中,增益指定函数GR和时间常数TC在水平控制器(LC 117、LC 505和LC 603)中的每一个中作为用于指定用于改变频带源声数据(或频带第二源声数据)的水平的规则的参数而设置。水平控制器中的每一个改变水平,以按照由时间常数TC表示的响应速度根据通过水平检测器电路(LD 113、LD 503、LD 803和LD 804)指定的频带话语者声数据或频带背景噪声数据的水平来获得根据增益指定函数GR指定的目标增益。通过水平控制器改变频带源声数据(或频带第二源声数据)的水平的规则不限于此。可采用其它各种规则,只要该规则基于由水平检测器电路指定的水平在其改变之后指定源数据(或频带第二源声数据)的水平即可。
例如,水平控制器中的每一个可被构造为通过仅将增益指定函数GR单独地设为参数来改变水平,以针对所有水平控制器以相同响应速度获得目标增益。另外,水平控制器中的每一个可被构造为通过仅将时间常数TC单独地设为参数来改变水平,以针对所有水平控制器以由单独设置的时间常数TC表示的响应速度获得根据相同增益指定函数GR指定的目标增益。
例如,替代增益指定函数GR,水平控制器中的每一个可被构造为通过将表示对应于频带话语者声数据(或频带背景噪声数据)的频带源声数据(或频带第二源声数据)的增益(或水平的增量等)的函数或对应表设为参数来改变频带源声数据(或频带第二源声数据)的水平,以按照由时间常数TC表示的响应速度(或者由用于所有水平控制器的相同时间常数表示的响应速度)获得根据所述函数或对应表指定的增益(或水平的增量等)。
(13)增益指定函数GR明显不限于图2至图4所示的那些。为了确定这一点,在图13至图16中示出了增益指定函数GR的其它变型形式。
图13中的曲线(a)至(c)具有目标增益的下限和上限。当参考信号电平小于或等于I1时,曲线(a)至(c)输出恒定值g1作为目标增益,而不管参考信号电平的幅度如何,并且当参考信号电平大于或等于I2(I1<I2)时,曲线(a)至(c)输出恒定值g2作为目标增益,而不管参考信号电平的幅度如何。然而,当参考信号电平在I1与I2之间时,曲线(a)至(c)的目标增益的增量相对于参考信号电平的增量的倾度不同,以使得曲线图(a)的倾度<曲线图(b)的倾度<曲线图(c)的倾度。因此,通过曲线(a)至(c)中的每一个输出不同值的目标增益。
图14中的曲线图(a)具有目标增益的下限。当参考信号电平小于或等于I3时,输出恒定值g1作为目标增益而不管参考信号电平的幅度如何。曲线图(b)也具有目标增益的下限。当参考信号电平小于或等于I2(I2<I3)时,输出恒定值g1作为目标增益而不管参考信号电平的幅度如何。曲线图(c)也具有目标增益的下限。当参考信号电平小于或等于I1(I1<I2)时,输出恒定值g1作为目标增益而不管参考信号电平的幅度如何。另外,曲线(a)至(c)具有目标增益的上限。当参考信号电平大于或等于I4(I3<I4)时,输出恒定值g2作为目标增益而不管参考信号电平的幅度如何。然而,当参考信号电平在I1与I4之间时,曲线(a)至(c)的目标增益的增量相对于参考信号电平的增量的倾度不同,从而曲线图(a)的倾度>曲线图(b)的倾度>曲线图(c)的倾度。因此,通过曲线(a)至(c)中的每一个输出不同值的目标增益。
图15中的曲线(a)、(b)和(c)具有目标增益的下限和上限。当参考信号电平小于或等于I1时,曲线(a)、(b)和(c)分别输出恒定值g11、g12和g13(g11<g12<g13)作为目标增益而不管参考信号电平的幅度如何,并且当参考信号电平大于或等于I2(I1<I2)时,曲线(a)、(b)和(c)分别输出恒定值g2、g3和g4(g13<g2<g3<g4)作为目标增益而不管参考信号电平的幅度如何。当参考信号电平在I1与I2之间时,曲线(a)、(b)和(c)的目标增益的增量相对于参考信号电平的增量相同。
图16中的曲线(a)、(b)和(c)具有目标增益的下限和上限。当参考信号电平小于或等于I1时,曲线(a)、(b)和(c)分别输出恒定值g11、g12和g13(g11<g12<g13)作为目标增益而不管参考信号电平的幅度如何,并且当参考信号电平大于或等于I2(I1<I2)时,曲线(a)、(b)和(c)输出恒定值g4(g13<g4)作为目标增益而不管参考信号电平的幅度如何。当参考信号电平在I1与I2之间时,曲线(a)至(c)的目标增益的增量相对于参考信号电平的增量的倾度不同,以使得曲线图(a)的倾度>曲线图(b)的倾度>曲线图(c)的倾度。因此,通过曲线(a)至(c)中的每一个输出不同值的目标增益。
明显的是,可将在图2至图4和图13至图16中的每一个中示出的任一个增益指定函数GR组合。例如,将图2中的曲线图(a)的增益指定函数GR设为用于其传输将被阻碍的语音中的较不重要的信息的频带的LC 117中的水平改变参数,并且将图3中的曲线图(c)的增益指定函数GR设为用于其传输将被阻碍的语音中的较重要的信息的频带的LC 117中的水平改变参数。另外,掩蔽声数据产生装置11至81可根据话语者或话语者的语音的特征合适地选择上述增益指定函数GR。此时使用的话语者或话语者的语音的特征可为诸如话语者的性别和年龄、话语者的语音的语言、话语者的语音的语速、话语者的语音的音高和话语者的语音的音量之类的任何特征。
掩蔽声数据产生装置11至81可从在图2至图4和图13至图16中的每一个中示出的增益指定函数GR中具有共同特征(例如,图2中的曲线(a)至(c)具有诸如参考信号电平和目标增益具有比例关系的区域之类的共同特征)的增益指定函数GR中选择任何增益指定函数GR,并且将选择的增益指定函数GR设为水平改变参数。另外,掩蔽声数据产生装置11至81可从具有少量共同特征(也就是说,来自在图2至图4和图13至图16中的每一个中的任何增益指定函数GR)的增益指定函数GR中选择任何增益指定函数GR,并且将选择的增益指定函数GR设为水平改变参数。
如上所述,在本发明中,频带水平设置部分基于话语者声数据的两个或更多个频带的水平根据预定规则设置用于这些频带中的每一个的源声数据的频带的水平,并且产生表示掩蔽声的掩蔽声数据。这里,预定规则包括如上述的用于将具有各种特征的任何增益指定函数GR设置为水平改变参数的规则。
(14)在本发明中,频带水平设置部分设置源声数据的至少两个频带的水平,以使得在达到对应于话语者声数据的至少两个频带的各个水平的收敛值之前,预定规则针对两个或更多个频带中的至少两个频带具有不同的响应速度。上述时间常数TC-1至TC-m(也就是说,在收敛至由增益指定函数GR-1至GR-m确定的目标增益之前通过LC117-1至117-m而改变水平的过程中表示增益的响应速度的数值)被用作“针对在达到收敛值之前的话语者声数据的至少两个频带的各个水平具有不同响应速度的预定规则”。
可使用从话语者声数据输入至水平控制器(LC 117、LC 505和LC 603)中开始直至从水平控制器(LC 117、LC 505和LC 603)输出源声数据的延迟时间(延迟量)来替代时间常数TC-1至TC-m。例如,除上述增益指定函数GR-1至GR-m之外,图1中的LC 117-1至117-m中的每一个将延迟时间DL-1至DL-m存储在存储器上作为在LC117-1至117-m中的每一个中设置的水平改变参数。当从水平控制器(LC 117、LC 505和LC 603)输出源声数据时,LC 117-1至117-m中的每一个在通过在LC 117-1至117-m中的每一个中设置的延迟时间DL-1至DL-m之后的时间点将源声数据输出至加法器118。也就是说,延迟时间DL-1至DL-m意指在输出对应于通过增益指定函数GR-1至GR-m确定的目标增益的频带源声数据之前花费的时间,也就是说,在达到根据输入参考信号电平根据增益指定函数GR输出的目标增益之前的增益的响应速度。存储在LC 117-1至117-m中的每一个中的延迟时间DL-1至DL-m中的至少两个彼此不同,以获得期望的掩蔽声数据。例如,延迟时间DL-1至DL-m为日语的大约半个音素(通常为50毫秒至200毫秒)的时间。当针对话语者声数据的各个频带优化延迟时间时,可以期望话语者的声音的口音在时间上被平滑处理和均衡处理。可仅针对上述重要频带执行这种延迟。
(15)利用图17将掩蔽声数据产生装置51的操作描述为掩蔽声数据产生装置11至81的操作的概要的示例。在图17中,步骤S1与S3之间的次序不限于图17所示的次序,而是可为任意次序。另外,可同时执行这些步骤中的至少两个步骤。在步骤S1中,掩蔽声数据产生装置51获得表示在产生掩蔽声数据中使用的声音的源声数据(源声数据获得步骤)。在步骤S2,掩蔽声数据产生装置51获得表示作为掩蔽目标的话语者的语音的话语者声数据(话语者声数据获得步骤)。在步骤S3中,掩蔽声数据产生装置51获得表示背景噪声的背景噪声数据(背景噪声数据获得步骤)。在步骤S4中,掩蔽声数据产生装置51指定话语者声数据中的两个或更多个频带中的每一个的水平(频带水平指定步骤)。在步骤S5中,掩蔽声数据产生装置51基于由频带水平指定部分指定的话语者声数据的频带的水平通过针对两个或更多个频带中的每一个根据预定规则设置源声数据的频带的水平来产生表示掩蔽声的掩蔽声数据(频带水平设置步骤)。在步骤S5中,掩蔽声数据产生装置51根据不同预定规则设置源声数据中的两个或更多个频带中的至少两个频带中的每一个的水平。
除步骤S3的背景噪声数据获得步骤以外,除掩蔽声数据产生装置51以外的掩蔽声数据产生装置11至41和61至81的操作的概要与图17所示的相同。
可通过上述这些方法实现本发明。
[新特点]
这里,以上实施例的细节总结如下。
(1)提供了一种掩蔽声数据产生装置,包括:
源声数据获得部分,其获得表示在掩蔽声数据的产生中使用的声音的源声数据;
话语者声数据获得部分,其获得表示作为掩蔽目标的话语者语音的话语者声数据;
频带水平指定部分,其指定话语者声数据中的两个或更多个频带的各个水平;以及
频带水平设置部分,其基于由频带水平指定部分指定的话语者声数据中的各频带的各个水平根据各预定规则来设置与话语者声数据中的两个或更多个频带相对应的在源声数据中的两个或更多个频带的各个水平,并且产生表示掩蔽声的掩蔽声数据,
其中,频带水平设置部分根据彼此不同的各预定规则来设置源声数据中的两个或更多个频带中的至少两个频带的各个水平。
(2)例如,频带水平设置部分根据由频带水平指定部分指定的话语者声数据中的至少两个频带的各个水平与关于源声数据的各水平的增益之间具有不同关系的预定规则来设置源声数据中的所述两个或更多各频带中的至少两个频带的各个水平,并且关于源声数据的各水平的增益是源声数据中的至少两个频带的各个水平在设置为其各个水平之后与在该设置之前的比率。
(3)例如,频带水平设置部分根据具有不同响应速度的各预定规则来设置源声数据中的两个或更多个频带中的至少两个频带的各个水平,直到达到与由频带水平指定部分指定的话语者声数据中的至少两个频带的各个水平相对应的收敛值。
(4)例如,掩蔽声数据产生装置还包括:
背景噪声数据获得部分,其获得表示背景噪声的背景噪声数据,
其中,频带水平指定部分指定背景噪声数据中的两个或更多个频带的各个水平;并且
其中,频带水平设置部分基于在产生掩蔽声数据中由频带水平指定部分指定的背景噪声数据中的各频带的各个水平根据预定规则来设置与背景噪声数据中的两个或更多个频带相对应的在源声数据中的两个或更多个频带的各个水平。
(5)提供了一种用于产生掩蔽声数据的方法,包括以下步骤:
获得表示在掩蔽声数据的产生中使用的声音的源声数据;
获得表示作为掩蔽目标的话语者的语音的话语者声数据;
指定话语者声数据中的两个或更多个频带的各个水平;以及
基于通过指定步骤指定的话语者声数据中的各频带的各个水平根据各预定规则来设置与话语者声数据中的两个或更多个频带相对应的在源声数据中的两个或更多个频带的各个水平,以产生表示掩蔽声的掩蔽声数据,
其中,在设置步骤中,根据彼此不同的各预定规则来设置源声数据中的两个或更多个频带中的至少两个频带的各个水平。
(6)例如,在设置步骤中,根据在由指定步骤指定的话语者声数据中的至少两个频带的各个水平与关于源声数据的各水平的增益之间具有不同关系的各预定规则来设置源声数据中的至少两个频带的各个水平,并且关于源声数据的各水平的增益是源声数据中的至少两个频带的各个水平在设置为其各个水平之后与在该设置之前的比率。
(7)例如,在设置步骤中,根据具有不同响应速度的各预定规则来设置源声数据中的两个或更多个频带中的至少两个频带的各个水平,直到达到与由指定的步骤指定的话语者声数据中的至少两个频带的各个水平相对应的收敛值。
(8)例如,掩蔽声数据产生方法还包括以下步骤:
获得表示背景噪声的背景噪声数据;以及
指定背景噪声数据中的两个或更多个频带的各个水平,
其中,在设置步骤中,基于在产生掩蔽声数据中所指定的背景噪声数据中的各频带的各个水平根据预定规则来设置与背景噪声数据中的两个或更多个频带相对应的在源声数据中的两个或更多个频带的各个水平。
(9)提供了一种掩蔽声产生系统,包括:
声接收装置,其通过接收作为掩蔽目标的话语者语音产生话语者声数据并输出话语者声数据;
掩蔽声数据产生装置,其产生表示掩蔽声的掩蔽声数据;以及
发声装置,其发出通过掩蔽声数据产生装置产生的掩蔽声数据作为掩蔽声,
其中掩蔽声数据产生装置包括:
源声数据获得部分,其获得表示在掩蔽声数据的产生中使用的声音的源声数据;
话语者声数据获得部分,其获得从声接收装置输出的话语者声数据;
频带水平指定部分,其指定话语者声数据中的两个或更多个频带的各个水平;
频带水平设置部分,其基于由频带水平指定部分指定的话语者声数据中的各频带的各个水平根据各预定规则来设置与话语者声数据中的两个或更多个频带相对应的在源声数据中的两个或更多个频带的各个水平,并且产生表示掩蔽声的掩蔽声数据;以及
输出部分,其将通过频带水平设置部分产生的掩蔽声数据输出至发声装置;并且
其中,频带水平设置部分根据彼此不同的各预定规则来设置源声数据中的两个或更多个频带中的至少两个频带的各个水平。
虽然已针对特定优选实施例示出和描述了本发明,但是本领域技术人员应该清楚,基于本发明的教导可作出各种修改和改变。应该清楚,这种修改和改变在由权利要求限定的本发明的精神、范围和意图的范围内。
本申请基于2014年3月10日提交的日本专利申请No.2014-046805,并且其内容以引用方式并入本文中。

Claims (9)

1.一种掩蔽声数据产生装置,包括:
源声数据获得部分,其获得表示在掩蔽声数据的产生中使用的声音的源声数据;
话语者声数据获得部分,其获得表示作为掩蔽目标的话语者语音的话语者声数据;
频带水平指定部分,其指定所述话语者声数据中的两个或更多个频带的各个水平;以及
频带水平设置部分,其基于由所述频带水平指定部分指定的话语者声数据中的各频带的各个水平根据各预定规则来设置与话语者声数据中的两个或更多个频带相对应的在所述源声数据中的两个或更多个频带的各个水平,并且产生表示掩蔽声的掩蔽声数据,
其中,所述频带水平设置部分根据彼此不同的各预定规则来设置所述源声数据中的所述两个或更多个频带中的至少两个频带的各个水平。
2.根据权利要求1所述的掩蔽声数据产生装置,其中,所述频带水平设置部分根据在由所述频带水平指定部分指定的话语者声数据中的所述至少两个频带的各个水平与关于源声数据的各水平的增益之间具有不同关系的预定规则来设置所述源声数据中的所述两个或更多个频带中的所述至少两个频带的各个水平;并且
其中,关于源声数据的各水平的所述增益是所述源声数据中的所述至少两个频带的各个水平在设置为其各个水平之后与在该设置之前的比率。
3.根据权利要求1或2所述的掩蔽声数据产生装置,
其中,所述频带水平设置部分根据具有不同响应速度的各预定规则来设置所述源声数据中的所述两个或更多个频带中的所述至少两个频带的各个水平,直到达到与由所述频带水平指定部分指定的话语者声数据中的所述至少两个频带的各个水平相对应的收敛值。
4.根据权利要求1或2所述的掩蔽声数据产生装置,还包括:
背景噪声数据获得部分,其获得表示背景噪声的背景噪声数据,
其中,所述频带水平指定部分指定所述背景噪声数据中的两个或更多个频带的各个水平;并且
其中,所述频带水平设置部分基于在所述掩蔽声数据的产生中由所述频带水平指定部分指定的背景噪声数据中的各频带的各个水平根据预定规则来设置与所述背景噪声数据中的所述两个或更多个频带相对应的在所述源声数据中的两个或更多个频带的各个水平。
5.一种用于产生掩蔽声数据的方法,包括以下步骤:
获得表示在掩蔽声数据的产生中使用的声音的源声数据;
获得表示作为掩蔽目标的话语者的语音的话语者声数据;
指定所述话语者声数据中的两个或更多个频带的各个水平;以及
基于通过指定步骤指定的所述话语者声数据中的各频带的各个水平根据各预定规则,来设置与所述话语者声数据中的两个或更多个频带相对应的在所述源声数据中的两个或更多个频带的各个水平,以产生表示掩蔽声的掩蔽声数据,
其中,在设置步骤中,根据彼此不同的各预定规则来设置所述源声数据中的所述两个或更多个频带中的至少两个频带的各个水平。
6.根据权利要求5所述的方法,其中,在所述设置步骤中,根据在由所述指定步骤指定的所述话语者声数据中的所述至少两个频带的各个水平与关于源声数据的各水平的增益之间具有不同关系的各预定规则,来设置所述源声数据中的所述至少两个频带的各个水平;并且
其中,关于源声数据的各水平的所述增益是所述源声数据中的所述至少两个频带的各个水平在设置为其各个水平之后与在该设置之前的比率。
7.根据权利要求5或6所述的方法,
其中,在所述设置步骤中,根据具有不同响应速度的各预定规则来设置所述源声数据中的所述两个或更多个频带中的所述至少两个频带的各个水平,直到达到与由所述指定步骤指定的话语者声数据中的所述至少两个频带的各个水平相对应的收敛值。
8.根据权利要求5或6所述的方法,还包括以下步骤:
获得表示背景噪声的背景噪声数据;以及
指定所述背景噪声数据中的两个或更多个频带的各个水平,
其中,在所述设置步骤中,基于在掩蔽声数据的产生中所指定的背景噪声数据中的各频带的各个水平根据预定规则来设置与所述背景噪声数据中的所述两个或更多个频带相对应的在所述源声数据中的两个或更多个频带的各个水平。
9.一种掩蔽声产生系统,包括:
声接收装置,其通过接收作为掩蔽目标的话语者语音来产生话语者声数据并输出所述话语者声数据;
掩蔽声数据产生装置,其产生表示掩蔽声的掩蔽声数据;以及
发声装置,其发出通过所述掩蔽声数据产生装置产生的所述掩蔽声数据作为掩蔽声,
其中,所述掩蔽声数据产生装置包括:
源声数据获得部分,其获得表示在所述掩蔽声数据的产生中使用的声音的源声数据;
话语者声数据获得部分,其获得从所述声接收装置输出的所述话语者声数据;
频带水平指定部分,其指定所述话语者声数据中的两个或更多个频带的各个水平;
频带水平设置部分,其基于由所述频带水平指定部分指定的话语者声数据中的各频带的各个水平根据各预定规则来设置与所述话语者声数据中的所述两个或更多个频带相对应的在所述源声数据中的两个或更多个频带的各个水平,并且产生表示掩蔽声的掩蔽声数据;以及
输出部分,其将通过所述频带水平设置部分产生的所述掩蔽声数据输出至所述发声装置;并且
其中,所述频带水平设置部分根据彼此不同的各预定规则来设置所述源声数据中的所述两个或更多个频带中的至少两个频带的各个水平。
CN201510105145.2A 2014-03-10 2015-03-10 掩蔽声数据产生装置及系统和用于产生掩蔽声数据的方法 Pending CN104916291A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014046805 2014-03-10
JP2014-046805 2014-03-10

Publications (1)

Publication Number Publication Date
CN104916291A true CN104916291A (zh) 2015-09-16

Family

ID=52946264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510105145.2A Pending CN104916291A (zh) 2014-03-10 2015-03-10 掩蔽声数据产生装置及系统和用于产生掩蔽声数据的方法

Country Status (4)

Country Link
US (1) US20150256930A1 (zh)
EP (1) EP2919229A1 (zh)
JP (1) JP6098654B2 (zh)
CN (1) CN104916291A (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5991115B2 (ja) * 2012-09-25 2016-09-14 ヤマハ株式会社 音声マスキングのための方法、装置およびプログラム
WO2014191798A1 (en) * 2013-05-31 2014-12-04 Nokia Corporation An audio scene apparatus
US10121488B1 (en) * 2015-02-23 2018-11-06 Sprint Communications Company L.P. Optimizing call quality using vocal frequency fingerprints to filter voice calls
WO2016185668A1 (ja) * 2015-05-18 2016-11-24 パナソニックIpマネジメント株式会社 指向性制御システム及び音声出力制御方法
EP3459075A4 (en) 2016-05-20 2019-08-28 Cambridge Sound Management, Inc. SELF-DRIVEN LOUDSPEAKER FOR SOUND MASKING
WO2018167960A1 (ja) * 2017-03-17 2018-09-20 ヤマハ株式会社 音声処理装置、音声処理システム、音声処理方法、および音声処理プログラム
KR20190123362A (ko) * 2018-04-06 2019-11-01 삼성전자주식회사 인공지능을 이용한 음성 대화 분석 방법 및 장치
KR102526081B1 (ko) 2018-07-26 2023-04-27 현대자동차주식회사 차량 및 그 제어방법
JP2022030448A (ja) 2020-08-07 2022-02-18 ヤマハ株式会社 マスカ音調整方法およびマスカ音調整装置
US20220415299A1 (en) * 2021-06-25 2022-12-29 Nureva, Inc. System for dynamically adjusting a soundmask signal based on realtime ambient noise parameters while maintaining echo canceller calibration performance
EP4365890A1 (de) * 2022-11-07 2024-05-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur adaptiven, harmonischen sprachmaskierschallerzeugung

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4438526A (en) * 1982-04-26 1984-03-20 Conwed Corporation Automatic volume and frequency controlled sound masking system
JP2010217883A (ja) * 2009-02-19 2010-09-30 Yamaha Corp マスキング音生成装置、マスキングシステム、マスキング音生成方法、およびプログラム
JP2012008393A (ja) * 2010-06-25 2012-01-12 Nippon Sheet Glass Environment Amenity Co Ltd 音声変更装置、音声変更方法および音声情報秘話システム
US20120316869A1 (en) * 2011-06-07 2012-12-13 Qualcomm Incoporated Generating a masking signal on an electronic device
US20130259254A1 (en) * 2012-03-28 2013-10-03 Qualcomm Incorporated Systems, methods, and apparatus for producing a directional sound field
WO2014016723A2 (en) * 2012-07-24 2014-01-30 Koninklijke Philips N.V. Directional sound masking

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4221998A1 (de) 1992-07-04 1994-01-05 Blaupunkt Werke Gmbh Verfahren zur Verdeckung des Fahrgeräusches
WO1999046958A1 (en) * 1998-03-11 1999-09-16 Acentech, Inc. Personal sound masking system
US8477958B2 (en) * 2001-02-26 2013-07-02 777388 Ontario Limited Networked sound masking system
US7548854B2 (en) * 2002-01-31 2009-06-16 Awi Licensing Company Architectural sound enhancement with pre-filtered masking sound
US20030144847A1 (en) * 2002-01-31 2003-07-31 Roy Kenneth P. Architectural sound enhancement with radiator response matching EQ
JP4761506B2 (ja) * 2005-03-01 2011-08-31 国立大学法人北陸先端科学技術大学院大学 音声処理方法と装置及びプログラム並びに音声システム
JP4734627B2 (ja) 2005-03-22 2011-07-27 国立大学法人山口大学 スピーチプライバシー保護装置
US8107639B2 (en) * 2006-06-29 2012-01-31 777388 Ontario Limited System and method for a sound masking system for networked workstations or offices
US8229130B2 (en) * 2006-10-17 2012-07-24 Massachusetts Institute Of Technology Distributed acoustic conversation shielding system
US8194871B2 (en) * 2007-08-31 2012-06-05 Centurylink Intellectual Property Llc System and method for call privacy
KR100901772B1 (ko) * 2007-10-08 2009-06-11 한국전자통신연구원 스피커를 통한 도청을 방지하기 위한 장치
US20090171670A1 (en) * 2007-12-31 2009-07-02 Apple Inc. Systems and methods for altering speech during cellular phone use
US8554551B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
JP5991115B2 (ja) * 2012-09-25 2016-09-14 ヤマハ株式会社 音声マスキングのための方法、装置およびプログラム
US9361903B2 (en) * 2013-08-22 2016-06-07 Microsoft Technology Licensing, Llc Preserving privacy of a conversation from surrounding environment using a counter signal

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4438526A (en) * 1982-04-26 1984-03-20 Conwed Corporation Automatic volume and frequency controlled sound masking system
JP2010217883A (ja) * 2009-02-19 2010-09-30 Yamaha Corp マスキング音生成装置、マスキングシステム、マスキング音生成方法、およびプログラム
JP2012008393A (ja) * 2010-06-25 2012-01-12 Nippon Sheet Glass Environment Amenity Co Ltd 音声変更装置、音声変更方法および音声情報秘話システム
US20120316869A1 (en) * 2011-06-07 2012-12-13 Qualcomm Incoporated Generating a masking signal on an electronic device
US20130259254A1 (en) * 2012-03-28 2013-10-03 Qualcomm Incorporated Systems, methods, and apparatus for producing a directional sound field
WO2014016723A2 (en) * 2012-07-24 2014-01-30 Koninklijke Philips N.V. Directional sound masking

Also Published As

Publication number Publication date
EP2919229A1 (en) 2015-09-16
JP6098654B2 (ja) 2017-03-22
JP2015187714A (ja) 2015-10-29
US20150256930A1 (en) 2015-09-10

Similar Documents

Publication Publication Date Title
CN104916291A (zh) 掩蔽声数据产生装置及系统和用于产生掩蔽声数据的方法
JP5103974B2 (ja) マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム
CN101904151A (zh) 控制在通信系统的至少两个用户之间通信的方法
CN112750462B (zh) 一种音频处理方法、装置及设备
CN111785246A (zh) 虚拟角色语音处理方法、装置及计算机设备
CN102227770A (zh) 音质变换装置、音高变换装置及音质变换方法
Varni et al. Interactive sonification of synchronisation of motoric behaviour in social active listening to music with mobile devices
CN102881283A (zh) 用于语音处理的方法与系统
US11575998B2 (en) Method and system for customized amplification of auditory signals based on switching of tuning profiles
CN109416911A (zh) 声音合成装置及声音合成方法
JPWO2004049304A1 (ja) 音声合成方法および音声合成装置
JP2019101094A5 (ja) 音声合成方法、音声合成システムおよびプログラム
CN109511041A (zh) 一种耳机的开机设定的方法、装置以及耳机
CN105912296A (zh) 语音控制方法及系统
JP2016062077A (ja) 対話装置、対話システム、対話プログラム、サーバ、サーバの制御方法およびサーバ制御プログラム
US11842719B2 (en) Sound processing method, sound processing apparatus, and recording medium
CN104685560A (zh) 用于声掩蔽的方法、设备和计算机程序
CN105321526A (zh) 音频处理方法和电子设备
CN109731344A (zh) 一种在养成游戏中兑换宠物的方法和装置
WO2022111381A1 (zh) 音频处理方法、电子设备和可读存储介质
CN114049871A (zh) 基于虚拟空间的音频处理方法、装置和计算机设备
CN113611296A (zh) 语音识别装置和拾音设备
CN113545781A (zh) 虚拟现实促眠的方法及装置
CN111552836A (zh) 歌词显示方法、装置及存储介质
KR20240099500A (ko) 반주 생성 방법, 장치 및 저장 매체

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150916

WD01 Invention patent application deemed withdrawn after publication