CN101515197B - 音响指示设备、音源位置的指示方法和计算机系统 - Google Patents

音响指示设备、音源位置的指示方法和计算机系统 Download PDF

Info

Publication number
CN101515197B
CN101515197B CN2008101761767A CN200810176176A CN101515197B CN 101515197 B CN101515197 B CN 101515197B CN 2008101761767 A CN2008101761767 A CN 2008101761767A CN 200810176176 A CN200810176176 A CN 200810176176A CN 101515197 B CN101515197 B CN 101515197B
Authority
CN
China
Prior art keywords
mentioned
sound source
sound
source position
integration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101761767A
Other languages
English (en)
Other versions
CN101515197A (zh
Inventor
户上真人
住吉贵志
大渊康成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN101515197A publication Critical patent/CN101515197A/zh
Application granted granted Critical
Publication of CN101515197B publication Critical patent/CN101515197B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/041Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
    • G06F3/043Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means using propagating acoustic waves
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/041Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
    • G06F3/0416Control or interface arrangements specially adapted for digitisers

Abstract

本发明提供一种完全不将附属设备设置在桌子上就能够进行指示操作的音响指示设备。具备:具有2个以上麦克风元件的麦克风阵列(101);将模拟音压数据变换为数字音压数据的A/D变换部件(102);存储数字音压数据的缓存部件(201);从数字音压数据,根据麦克风元件之间的声音的相关性,推测突发性音的音源方向的方向推测部件(203);推测数字音压数据中的噪声水平的噪声推测部件(204);根据噪声水平和数字音压数据,推测信号成分的比例的SNR推测部件(205);根据信号成分的比例计算出输出信号并输出的功率计算部件(209);对音源方向和输出信号进行统合,确定音源位置的统合部件(211);根据画面变换DB(213)的数据,将所确定的音源位置变换为显示装置的画面上的点的控制部件(212)。

Description

音响指示设备、音源位置的指示方法和计算机系统
技术领域
本发明涉及用于由用户指定计算机中的显示装置的画面上的1点的指示设备(pointing device),特别涉及使用了音响信息的指示设备的技术。
背景技术
在计算机的操作中大多使用一般利用了鼠标的指示设备。这时,鼠标的操作与计算机中的显示装置的画面上的光标联合地动作,通过使光标移动到该点上,并在该点上进行点击(click),能够选择希望在画面上选择的点。
另外,对于使用了触摸屏的指示设备,也已经作为民用品被广为使用。在触摸屏中,安装了用于检测由用户在显示器上的各点上按压画面的压力的元件,对每个点判定是否进行了按压。
作为使用了音响信息的指示设备,存在以下这样的设备,即使用了在按压了画面时发出超声波的特殊的笔的设备(例如参照专利文献1)。
另外,存在以下这样的装置,即与超声波一起还产生光,根据直到超声波和光到达收音/受光元件为止的时间差,检测出指示位置的装置(例如参考专利文献2)。
另外,在显示器上设置振动检测元件,在指尖触摸了显示器时,检测出所产生的振动的方向,根据它检测出点位置的装置(例如参考专利文献3)。
专利文献1:特开2002-351605号公报
专利文献2:特开2002-132436号公报
专利文献3:特开2002-351614号公报
但是,在计算机的操作中使用了鼠标的指示设备中,必须将鼠标放置在桌子上,使用并不方便。另外,触摸屏虽然没有附属设备,但需要特殊的显示器,另外必须将按下压力检测装置附加在显示器上的各元件上,需要靠近显示器地进行指示(pointing)。
另外,在专利文献1、2所记载的技术中,用户必须使用特殊笔、座标输入装置。另外,在专利文献3所记载的技术中,必须接触显示面而产生振动并检测出振动。
发明内容
鉴于以上问题点,本发明的课题就是:提供一种在计算机的操作时,完全不需要将附属设备放置在桌子上,即使在脱离以后,也能够使用声音的信息进行指示操作的音响指示设备、音源位置的指示方法和使用了上述音响指示设备的计算机系统。
为了解决上述课题,本发明的音响指示设备是一种检测出要检测的音源位置,将上述音源位置变换为显示装置的画面上的1点的音响指示设备,具备:保持多个麦克风元件的麦克风阵列;将通过上述麦克风阵列得到的模拟音压数据变换为数字音压数据的A/D变换部件;根据上述麦克风元件之间的上述声音的相关性,从上述数字音压数据推测上述要检测的声音的音源方向的方向推测部件;从上述数字音压数据推测噪声水平,根据上述噪声水平和上述数字音压数据,计算出上述声音的信号成分,并作为输出信号输出的输出信号计算部件;将上述音源方向和上述输出信号统合起来,确定上述音源位置的统合部件;将所确定的上述音源位置变换为上述显示装置的上述画面上的一点的控制部件。
进而,在本发明的音响指示装置中,上述麦克风阵列由多个子麦克风阵列构成,上述音响指示装置还包括:通过对每个上述子麦克风阵列根据三角测量将由上述方向推测部件推测出的上述音源方向统合起来,来计算出上述音源方向和距上述音源位置的距离的三角测量部件;判断上述音源方向和上述距离是否在预先定义的区域内的定位判断部件,其中,上述统合部件将上述输出信号与上述区域内的上述音源方向和上述距离统合起来,确定上述音源位置,上述控制部件将所确定的上述音源位置变换为上述显示装置的上述画面上的一点。
进而,在本发明的音响指示装置中,上述麦克风阵列由多个子麦克风阵列构成,上述音响指示装置还包括:将上述数字音压数据变换为由时间-频带构成的信号的变换部件;通过对每个上述子麦克风阵列根据三角测量将由上述方向推测部件使用上述信号推测出的上述音源方向统合起来,来计算出上述音源方向和距上述音源位置的距离的三角测量部件;判断上述音源方向和上述距离是否在预先定义的区域内的定位判断部件,其中,上述统合部件将上述输出信号与上述区域内的上述音源方向和上述距离统合起来,确定上述音源位置,上述控制部件将所确定的上述音源位置变换为上述显示装置的上述画面上的一点。
进而,在本发明的音响指示装置中,上述麦克风阵列由多个子麦克风阵列构成,上述音响指示装置还包括:将上述数字音压数据变换为由时间-频带构成的信号的变换部件;通过对每个上述子麦克风阵列根据三角测量将由上述方向推测部件使用上述信号推测出的上述音源方向统合起来,来计算出上述音源方向和距上述音源位置的距离的三角测量部件;判断上述音源方向和上述距离是否在预先定义的区域内的定位判断部件;判断由上述输出信号计算部件输出的上述输出信号在预先确定的阈值以上的输出信号判断部件;预先存储了上述要检测的声音的频率特性的音源频率数据库;存储能够根据上述音源位置确定上述画面上的上述一点的变换表的画面变换数据库,其中,上述统合部件根据上述频率特性对上述阈值以上的上述输出信号进行加权,而与上述区域内的上述音源方向和上述距离统合,确定上述音源位置,上述控制部件使用上述画面变换数据库的信息,将所确定的上述音源位置变换为上述画面上的一点。
进而,在本发明中,提供一种在上述音响指示设备中使用的音源位置的指示方法、以及具备上述音响指示设备的计算机系统。
根据本发明,能够提供一种在计算机的操作时,完全不需要将附属设备放置在桌子上,即使在脱离以后,也能够使用声音的信息进行指示操作的音响指示设备。
进而,能够提供一种在上述音响指示设备中使用的音源位置的指示方法。
进而,能够提供一种使用了上述音响指示设备的计算机系统。
附图说明
图1是表示本发明的实施例的一个例子的音响指示设备的概要结构图。
图2是只使用时间域的信号的上述音响指示设备的概要结构图。
图3是上述音响指示设备和具备它的计算机系统的硬件结构图。
图4是表示在上述音响指示设备中使用的子麦克风阵列的直线配置的图。
图5是表示上述音响指示设备中的桌子上的用户敲击位置的设定例子的图。
图6是表示上述音响指示设备中的敲击位置的检测流程的图。
图7是表示上述音响指示设备中的判断和统合的处理流程的图。
图8是表示上述音响指示设备中的敲击声音的时间波形的图。
图9是上述音响指示设备中的每个时间-频率成分的格子的模式图。
图10是表示上述音响指示设备中的每个音源方向的功率(power)的图。
图11是表示上述音响指示设备中的在高度方向上设定敲击区域的例子的图。
图12是表示上述音响指示设备中的子麦克风阵列的配置的图。
图13是表示将上述音源指示设备应用于敲击音检测装置的应用例子的图。
图14是表示将上述音源指示设备应用于敲击音检测装置的其他应用例子的图。
图15是表示将上述音源指示设备应用于敲击音检测装置的其他应用例子的图。
图16是表示将上述音源指示设备应用于敲击音检测装置的其他应用例子的图。
图17是表示将上述音源指示设备应用于敲击音检测装置的其他应用例子的图。
图18是表示将上述音源指示设备应用于敲击音检测装置的其他应用例子的图。
101:麦克风阵列;102:A/D变换部件;103:中央计算装置;104:易失性存储器;105:存储介质;106:显示装置;201:缓存部件;202:STFT部件;203:方向推测部件;204:噪声推测部件;205:SNR推测部件;206:三角测量部件;207:定位判定部件;208:SNR判断部件;209:功率计算部件;210:功率判断部件;211:统合部件;212:控制部件;213:画面变换DB;214:音源频率DB;301:桌子;302:显示器;303、304、305:子麦克风阵列
具体实施方式
以下,参考附图,详细说明本发明的实施例。
图1是表示本发明的实施例的一个例子的音响指示设备的概要结构图。音响指示设备例如是代替个人计算机(以下称为“PC”)的鼠标装置而使用的指示设备,是通过由用户敲击桌子而能够指定在显示部件上表示的特定位置的指示设备。另外,将通过敲击桌子的声音等而要检测为音响指示设备的音源的声音称为“突发性音”。图1所示的音响指示设备具备:至少由2个以上的麦克风元件(以下也称为“麦克风”)构成的麦克风阵列101;将由麦克风阵列101得到的各麦克风元件的多信道突发性音的模拟音压数据变换为数字音压数据的A/DAnalogue to Digital)变换部件102;存储特定量的数字音压数据的缓存部件201;将数字音压数据变换为时间-频率域的信号的STFT(Short Term Fourier Transform)部件202;将麦克风阵列分割为多个子麦克风阵列(以下也称为“子阵列”),根据方位角和仰角,推测出基于同一子麦克风阵列内的麦克风元件之间的声音的相关性计算出的突发性音的方向的方向推测部件203;对针对每个子麦克风阵列求出的音源方向进行统合,测量音源的方位角、仰角和距离的三角测量部件206;判断由三角测量部件206求出的音源的位置是否在预定的范围内的定位判断部件207;从数字音压数据推测背景的噪声功率的噪声推测部件204;从数字音压数据和噪声功率推测SNR(Signal toNoise Ratio)的SNR推测部件205;输出SNR推测部件205所输出的SNR推测值为预定的阈值以上的SNR的SNR判断部件208;从数字音压数据和SNR计算信号功率的功率计算部件209;输出信号功率为预定的阈值以上的信号功率的功率判断部件210;将SNR判断部件和功率判断部件同时确定了的时间-频率成分作为定位判断部件预先定义了的区域内的音源位置座标而输出的统合部件211;将该音源位置座标变换为显示画面上的特定的点的控制部件212。
进而,还具备:预先存储作为对象的声音的频率特性的音源频率数据库(以下称为“DB”)208;使音源座标与显示画面上的特定的点对应的画面变换DB213。
另外,在将上述数字音压数据只用作由时间域构成的信号的情况下,也可以省略STFT部件202、功率判断部件210、SNR判断部件和音源频率DB208而确定音源位置。在图2中,表示只使用时间域的信号的上述音响指示设备的概要结构图。图2表示了用于确定音源位置的最小限的结构。在此,输出信号计算部件是指噪声推测部件204、SNR推测部件205和功率计算部件209。进而,为了更正确地确定音源位置,还需要包含三角测量部件206和定位判断部件207。
图3是上述音响指示设备和具备它的计算机系统的硬件结构图。图3(a)表示上述音响指示设备的硬件的结构图,具备:上述的麦克风阵列101;将上述模拟音压数据变换为数字音压数据的A/D变换部件102;进行与上述音响指示设备有关的处理的中央计算装置103;存储器104;存储与上述音响指示设备相关的程序、麦克风阵列的各麦克风元件的物理座标的存储介质105。在中央计算装置103上,一边使用易失性存储器104,一边执行上述程序,由此来实现图1所示的上述音响指示设备中的除了麦克风阵列101和A/D变换部件102以外的各结构部件。
图3(b)是具备上述音响指示设备的计算机系统的硬件结构图。上述计算机系统具备:音响指示设备10;对使用与音响指示设备10的音源位置有关的信息的程序进行处理的中央计算装置20;在上述程序和计算处理时使用的存储装置30;用于将音源位置显示在画面上的显示装置。
接着,更详细地说明图1所示的各结构部件。
另外,还具备用于将音源位置显示为画面上的点的显示装置106。
对每个信道,将特定量的由A/D变换部件102进行了变换的多信道的数字音压数据储存在缓存部件201中。时间-频率域中的处理并不是在每次得到1个采样就进行处理,而是在取得了多个采样后,统一地进行处理。直到储存了特定量的音压数据为止完全不进行处理,而是在储存了特定量的数字音压数据后,才开始进行处理。
缓存部件201具有储存该特定量的数字音压数据的功能。根据从0开始的索引i,对每个麦克风元件区别地对由各麦克风元件得到的数字音压数据进行处理。设n为整数,将开始数字变换后第n次采样的第i个麦克风元件的数字音压数据标记为xi(n)。
在STFT(Short Term Fourier Transform)部件202中,依照以下的公式(1),将每个麦克风元件的数字音压数据变换为时间-频率域的信号。
公式(1)
X i ( f , τ ) = Σ n = 0 N - 1 w ( n ) x i ( sτ + n ) e - j 2 πf N n
在此,用公式(2)定义j。
公式(2)
j = - 1
另外,Xi(f,τ)为第i个元件的第f个频率成分。f从0开始,到N/2结束。N为变换为时间-频率域的信号的数字音压数据的数据长度。通常称为帧大小。S通常被称为帧偏移(frame shift),是变换为时间-频率域的信号时的数字音压数据的错开量。缓存部件201针对每个麦克风元件,直到取得新的S采样为止,持续地储存数字音压数据,在取得了S采样后,由STFT部件202变换为时间-频率域的信号。
τ被称为帧索引,相当于变换为时间-频率域的信号的次数。τ从0开始。w(n)被称为窗口函数,通常使用blackman窗口、hanning窗口、hamming窗口这样的函数。通过使用窗口函数,能够进行高精度的时间-频率分解。
变换为时间-频率域的信号的数字音压数据被发送到方向推测部件203。
在方向推测部件203中,首先将形成麦克风阵列的麦克风元件分割为多个子麦克风阵列。然后,针对每个子麦克风阵列,在各个座标系中推测音源方向。在分割为子麦克风阵列时,例如在分割为R个子麦克风阵列的情况下,形成麦克风阵列的M个麦克风元件被分配到R个子麦克风阵列的任意至少一个。也可以分配到2个以上的子麦克风阵列,在该情况下,多个子麦克风阵列具有同一麦克风元件。
图4是表示子麦克风阵列的图。图4(a)是表示子麦克风阵列的直线配置的图。在直线配置的情况下,将与麦克风元件排列的阵列方向垂直的方向确定为角度0度,可以只推测将音源和子麦克风阵列连接起来的直线、从该方向旋转半时针与上述直线所成的角度θ。另外,d表示麦克风间隔。图4(b)是表示将上述M个麦克风元件分配到R个子麦克风阵列的状态的图,构成为向1个子麦克风阵列分配3个麦克风元件。
在将子麦克风阵列的2个麦克风元件平行地配置在桌子上面时,将上述角度θ推测为水平方向的方位角。另一方面,在将上述2个麦克风元件垂直地配置在桌子上面时,将上述角度θ推测为垂直方向的仰角。这样,推测方位角和仰角。
假设子麦克风阵列具有至少2个麦克风元件,在所具有的麦克风元件有2个的情况下,根据公式(3)推测θ。
公式(3)
θ ( f , τ ) = arcsin ρ ( f , τ ) 2 πFd c - 1
在此,ρ为2个麦克风元件的输入信号的帧τ、频率索引f的相位差。F为频率索引f的频率(Hz)。F为(f+0.5)/N×Fs/2。Fs是A/D变换部件102的采样速率。d为2个麦克风元件的物理间隔(m)。c为音速(m/s)。严谨地说音速依存于温度、介质的密度而变化,但通常固定为340m/s等的一个值而使用。
方向推测部件203的内部的处理由于是对每个时间-频率都一样的处理,所以以后省略时间-频率的索引(f,τ)而表示。方向推测部件203的处理对每个时间-频率进行同样的处理。在子麦克风阵列使用3个以上的麦克风元件,并且将它们配置在直线上的情况下,根据直线配置的SPIRE算法,能够高精度地计算出其方向。在M.Togami,T.Sumiyoshi,and A.Amamo,“Stepwise phase differencerestoration method for sound source localization using multiplemicrophone pairs”,ICASSP2007,vol.I,pp.117~120,2007中,记载了SPIRE算法的详细。
在SPIRE算法中,使用相邻的麦克风元件的间隔(以下成为“麦克风间隔”)不同的多个麦克风对,因此理想的是将构成子麦克风阵列的麦克风元件配置为各个麦克风间隔不同。按照麦克风间隔从小到大的顺序,对各麦克风对进行排序。按照用于确定一个麦克风对的标记对p进行索引,p=1为麦克风间隔最短的麦克风对,p=P为麦克风间隔最长的麦克风对。从p=1到p=P,顺序地执行以下的处理。首先,找到满足下式(4)的整数np。
公式(4)
ρ ^ p - 1 d p d p - 1 - π ≤ ρ p + 2 πn p ≤ ρ ^ p - 1 d p d p - 1 + π
由于不等式所概括的范围相当于2π,所以一定只找到一个解。然后,执行下式(5)。
公式(5)
ρ ^ p - 1 = ρ p + 2 πn p
另外,在对p=1进行上述处理之前,作为初始值,设定下述的公式(6)。
公式(6)
ρ ^ 0 = 0
另外,dp为第p个麦克风对的麦克风元件之间的间隔。在直到p=P为止执行了上述处理之后,用公式(7)推测音源方向。
公式(7)
θ ( f , τ ) = arcsin ρ ^ p ( f , τ ) 2 πF d p c - 1
对于音源方向推测的推测精度,已知麦克风间隔长度越长则越高,但已知如果麦克风间隔的长度为推测方向的信号的半波长以上,则无法从麦克风之间的相位差确定一个方向,而存在具有相同相位差的2个以上的方向(空间分区)。在SPIRE算法中,具备以下这样的机构:在按照长的麦克风间隔产生的2个以上推测方向中,选择与根据短麦克风间隔求出的音源方向接近的方向。因此,具有根据产生空间分区那样的长的麦克风间隔也能够高精度地推测音源方向的优点。在麦克风对是非直线配置的情况下,根据非直线配置用的SPIRE算法,根据方位角和情况,也能够对仰角进行计算。
另外,在上述数字音压数据不是时间-频率域的信号的情况下,即在只是时间域的情况下,无法使用上述SPIRE算法。在只是时间域的情况下,可以使用GCC-PHAT(Generalized Cross CorrelationPHAse Transform)法,来推测方向。
在噪声推测部件204中,根据STFT部件202的输出信号,推测背景的噪声水平。在推测噪声水平时,使用MCRA(MinimaControlled Recursive Averaging)等。MCRA的噪声推测处理以minimum statistics法为基础。minimum statistics法针对每个频率,将数帧之间最小的功率作为噪声功率的推测值。一般,声音和桌子的敲击音对于每个频率大多突发地具有大的功率,保持长时间的大功率的情况少。因此,在数帧之间取最小功率的成分可以近似为只包含噪声的成分,即使在声音发出区间,也可以高精度地推测噪声功率。将推测出的每个麦克风元件/频率的噪声功率表示为Ni(f,τ)。i是麦克风元件的索引,对每个麦克风元件推测噪声功率。另外,噪声功率由于对每个帧都更新,所以为依存于τ的值。噪声推测部件204输出推测出的每个麦克风元件/频率的噪声功率Ni(f,τ)。
在只是时间域的情况下,噪声具有以下特征:与突发性音相比,功率的输出小,但持续时间长,因此能够推测噪声功率。
SNR推测部件205根据推测出的噪声功率和麦克风阵列的输入信号Xi(f,τ),按照以下的公式(8)推测SNR(Signal To Noise Ratio)。
公式(8)
SNR i ( f , τ ) = 10 lo g 10 | X i ( f , τ ) | 2 N i ( f , τ ) - 1
SNRi(f,τ)是麦克风索引i的帧τ、频率索引f的SNR。SNR推测部件205输出推测出的SNR。SNR推测部件205也可以在时间方向上对输入功率进行平滑化等。通过进行平滑化,能够推测出对噪声具有强稳定性的SNR。
三角测量部件206将对每个子麦克风阵列求出的音源方向进行统合,测量方位角、仰角以及到音源位置的距离。针对对各子麦克风阵列在各个座标系中求出的音源方向,用以下的公式(9)表示对第i个子麦克风阵列求出的音源方向。
公式(9)
θi(f,τ)
例如,如图4所示那样,将与阵列方向垂直的方向确定为角度0度,将从与阵列方向垂直的方向旋转半时针定义为音源方向。在此,一般音源方向由方位角和仰角的2个要素构成,但在子麦克风阵列是直线配置的情况等下,在只能推测出任意一方的情况下,也可以只用该一方要素构成。在该情况下,将在要素数为1的第i个子麦克风阵列的座标系统中求出的音源方向变换为绝对座标系中的音源方向。设变换后的绝对座标系中的音源方向为Pi。根据第i个子麦克风阵列的结果,可以将音源推测为存在于音源方向Pi上。由此,可以认为推测为在全部子麦克风阵列中求出的音源方向Pi的交点是音源位置是妥当的。由此,在三角测量部件206中,将音源方向Pi的交点输出为音源位置。
一般,有无法将音源方向Pi的交点确定为一个的情况。在这样的情况下,对于全部子麦克风阵列的组,求出2个音源方向的交点,将这些交点的平均值输出为音源位置。通过平均化,对交点位置的离散增加抵抗性。
根据情况,有2个音源方向不具有交点的情况。在该情况下,在相应的时间-频率域的音源位置推测时不使用在不具有该交点的子麦克风阵列的组中求出的解,或者在相应的时间-频率域中,不进行音源位置推测。不具有交点时可以考虑为存在观测对象的音源以外的音源等,而相位差的信息包含噪声的情况。因此,通过不使用在这样的时间-频率域中推测出的音源位置,能够更高精度地推测音源位置。
另外,在子麦克风阵列是直线配置的情况下,无法推测方位角和仰角的双方,只能够推测子麦克风阵列的阵列方向与音源所成的角。在该情况下,音源存在于子麦克风阵列的阵列方向与音源所成的角成为推测出的值那样的平面上。将在各子麦克风阵列中求出的这样的平面的交点输出为音源位置或音源方向。在全部的子麦克风阵列是直线配置的情况下,将对全部子麦克风阵列的组合求出的平面的交点的平均值输出为音源位置。通过平均化,对许多交点位置的离散增加抵抗性。
另外,在一部分子麦克风阵列是直线配置,其他子麦克风阵列是非直线配置的情况下,通过将直线配置的子麦克风阵列的1个和非直线配置的子麦克风阵列的1个组合起来,能够得到一个音源位置的推测值。在组合直线配置和非直线配置而使用的情况下,将交点被确定为一个那样的子麦克风阵列的最小数作为1个单位,将按照全部子麦克风阵列的组合而求出的交点的平均值作为最终的音源位置的推测值输出。
定位判断部件207判断由三角测量部件206求出的音源位置是否在桌子上,或者该音源位置是否在预定的敲击区域内。在同时满足根据由三角测量部件206求出的音源位置的信息计算的音源相对于桌子的高度的绝对值是否为预定的阈值以下、以及根据音源位置的信息计算的音源在桌子上的平面座标是否位于敲击区域内的2个观点的情况下,从定位判断部件207输出音源方向和相对于音源的距离作为音源位置的信息而输出。另外,也可以将音源方向和相对于音源的距离作为方位角和仰角输出。另外,在定位判断部件中,也可以在同时满足上述2个观点的情况下,输出正的判断结果,在不同时满足的情况下,输出负的判断结果,在后述的统合部件211中,将正的判断结果与从三角测量部件输出的音源方向和距离统合。将在后面说明敲击区域的定义。
SNR判断部件208输出由SNR推测部件205输出的每个时间-频率的SNR的推测值为预定的阈值以上的时间-频率成分。功率计算部件209根据由SNR推测部件205输出的每个时间-频率的SNR,用以下的公式(10)计算信号功率Ps。
公式(10)
Ps = SNR SNR + 1 Px
在此,Px为输入信号的功率。
在功率判断部件210中,输出由功率计算部件209输出的每个时间-频率的信号功率为预定的阈值以上的时间-频率成分。在统合部件211中,针对由功率判断部件210和SNR判断部件208同时确定了的时间-频率成分,用保存在音源频率DB208中的每个频率的加权对由相应成分的功率计算部件209输出的功率进行加权。即,在能够预先测量敲击桌子的声音等作为对象的声音的频率特性的情况下,将该频率特性存储在音源频率DB208中。然后,通过用存储在音源频率DB208中的功率进行加权,而能够更高精度地进行位置推测。
对于没有由功率判断部件210和SNR判断部件208同时确定的时间-频率成分,将加权设为0。另外,对于由定位判断部件207判断为没有在敲击区域内的时间-频率成分,也将加权设为0。
另外,在本实施例中,输出信号判断部件指的是SNR判断部件208和功率判断部件210。
将敲击区域切割为一边为数cm左右的格子状,在对于每个时间-频率,在第i个格子内包含相应成分的音源位置的推测结果的情况下,将附加了相应的加权的功率加到该格子的功率Pi上。对全部的每个时间-频率,这样进行格子的功率的加法处理。将进行了加法处理后的功率为最大的格子作为最终的音源位置而输出。预先定义格子的大小和数目。
另外,也可以构成为也对进行格子的功率的加法处理的时间长度预先进行定义,或者使用VAD(Voice Activity Detection),只对判断为声音区间的时间段进行上述加法处理。通过缩短进行加法处理的时间,在响起敲击音后,能够进一步缩短直到判断该音源位置为止的反应时间。但是,如果进行缩短,则有对噪声抗力变弱的缺点。
另外,通过延长进行加法处理的时间,具有以下的优点:在产生了敲击音后,直到判断该音源位置为止的反应时间变长,但对噪声的抗力强。需要考虑到这样的折中的关系,来决定进行加法处理的时间,但一般敲击音在100ms左右的短时间内发音停止,因此理想的是也将进行加法处理的时间设定为该程度的时间。另外,在格子的最大功率比预定的阈值小的情况下,作为没有敲击音而将结果废弃。另一方面,在格子的最大功率大于预定的阈值的情况下,输出该音源位置,结束统合部件211的处理。
在控制部件212中,根据画面变换DB213的信息,将由统合部件211输出的敲击音的音源位置的座标变换为画面上的特定的点。
画面变换DB213将音源位置的座标作为输入,保存用于对画面上的特定的点进行变换的表。在变换时,也可以是2行2列的矩阵的线性变换等,能够根据敲击音的音源位置确定画面上1个点的变换的任意一个。例如无视在音源位置推测时得到的与音源的高度有关的信息,对PC进行控制,使得将音源的水平面上的位置信息和画面上的1个点对应起来,恰好用鼠标点击变换后的画面上的1点、或者拖动。另外,也可以利用高度信息,例如在从某一定以上的高度发出了声音的情况下,看作是双击了画面上的1点,另外在从某一定以下的高度发出了声音的情况下,看作是单击了画面上的1点等,与高度信息对应地改变解释。这样,能够进行更多样的用户操作。
图5是表示桌子上的用户的敲击位置的设定例子的图。在被敲击对象的桌子301上,事前指定桌子上的某平面作为敲击区域。在推测出的敲击音的音源位置在该敲击区域内的情况下,接受该声音。麦克风阵列可以如子麦克风阵列303~305那样设置在显示器302上,也可以另外设置在桌子上。在此,子麦克风阵列303推测仰角,子麦克风阵列304、305推测方位角。通过将子麦克风阵列设置在显示器上,能够使麦克风阵列的座标轴的中心与显示器的中心对齐,能够更直观地指定显示器的假想空间上的一点。
图6是表示利用上述桌子的敲击位置检测来判别用户按下了的画面上的按键的装置的处理流程的图。
在系统启动后,在结束判断501中,判断计算机关机(shutdown)了的情况,或判断是否通过用户按下桌子的敲击位置检测程序的结束按键等的任意方法,应该结束程序。
在结束判断501中判断为结束的情况下,进行结束,而处理结束。在没有判断为结束的情况下,处理转移到数字变换502,将通过麦克风阵列取得的模拟音压数据变换为数字音压数据。由A/D变换部件进行变换。将变换后的数字化了的数字音压数据取入到计算机上。数字变换可以对每1个采样进行,也可以与桌子敲击音的最小处理长度一致等地,同时将多个采样取入到计算机。在时间-频率变换503中,利用短时间傅立叶变换,将取得的数字数据分解为每个时间-频率的成分。通过使用短时间傅立叶变换,能够对每个频率成分推测声音的到来方向。
在使用桌子敲击音程序的环境中,除了桌子敲击音以外,作为噪声还存在人的声音的情况很多。已知人的声音在时间-频率域中是稀疏的信号,成分偏于一部分频带中。因此,通过这样在时间-频率域中推测音源方向,能够容易地废弃人声所偏在的频率成分,提高敲击音检测精度。
在检测结果废弃判断505中,判断检测出的敲击音是否确实是桌子上的敲击区域内的敲击音。在判断为不是敲击音的情况下,处理转移到结束判断501。在判断为是敲击音的情况下,预先定义敲击区域的各点与画面上的1点的映射,通过判别按下了敲击位置的按下位置判别506,依照该映射。根据敲击位置的信息,确定画面上的1点。通过按键存在判断507来判断在敲击区域的位置是否存在按键,在判断为不存在的情况下,处理返回到结束判断501。在判断为存在按键的情况下,作为按键动作508,执行与在画面上使用鼠标等其他指示设备点击该按键的情况一样的处理。
图7表示定位判断部件、功率判断部件、SNR判断部件和统合部件的具体处理流程。在定位判断部件207中,对每个时间-频率成分,根据使用多个子麦克风阵列由三角测量部件计算出的音源方向和距离,即方位角和仰角的信息,判断上述方位角和仰角是否在预先定义的敲击区域内(定位判断601)。预先定义的敲击区域可以如图5记载的敲击区域那样是桌子上的长方形的区域,也可以在空间上具有厚度。也可以是能够根据仰角和方位角的信息判断是否在敲击区域中的空间。
功率判断部件210判断敲击音的大小是否比利用上述MCRA法那样的方式推测出的噪声功率大(噪声功率比较602)。MCRA法是从声音和背景噪声混杂的声音中,推测背景噪声的功率的方式。MCRA法是基于最小统计量的方法。最小统计量是指在将声音假设为突发地具有大音量的前提下,将在过去数帧内最小的功率看作为背景噪声的功率的方法。但是,根据最小统计量推测出的背景噪声功率具有比实际的背景噪声的功率小的倾向。MCRA法是对根据最小统计量推测出的背景噪声功率在时间方向上进行平滑化等而进行修正,计算出接近实际的背景噪声的功率的值的方法。敲击音不是声音,但在突发地取大功率的观点上,显示出与声音一样的统计上的性质,因此能够适用MCRA法等背景噪声功率的推测法。
在敲击音的功率比噪声功率大的情况下,接着,计算背景噪声与敲击音的功率的SNR。SNR判断部件208判断敲击音的功率是否比计算出的SNR大(SNR判断603),在大的情况下,将该时间-频率成分判断为敲击音成分。
在统合部件211中,预先将敲击区域分割为格子状。根据该成分的方位角和仰角的推测值,将被判断为敲击音成分的时间-频率成分分配到相应的格子内。在分配时,在相应的格子中,将施加了依存于频率的加权的值与该敲击音成分的功率相加。只在预先定义的频带和预先定义的时间长度内,进行这样的处理。然后,检测出功率最大的格子(格子检测604),将该格子的方位角和仰角作为敲击音的方位角和仰角输出,确定音源位置。在此,在功率最大的格子的功率小于预先定义的阈值的情况下,判断为不存在敲击音。
另外,定位判断部件207、功率判断部件210和SNR判断部件208各自的处理顺序并不限于图7所示的顺序。也可以在统合部件211的处理之前,结束定位判断部件207、功率判断部件210和SNR判断部件208各自的处理。
图8是表示典型的敲击音的时间波形的图。敲击音突发地取大的值(敲击音的直接音)。然后,敲击音的回音、混响成分到来。该回音、混响成分可以看作是从各种方向到来的声音。因此,难以将回音、混响成分与直接音比较而推测方向,因此在敲击音的方向推测中使用并不理想。回音、混响成分一般比直接音的功率小,因此可以用对于突发的大声音之后的功率比该突发的大声音小的成分不看作是敲击音的方法进行判别。根据这样的观点,在由频率判断部件将每个时间-频率的敲击音成分分配到各格子中时,也可以与前一帧相比添加以下这样的处理,即不将功率小的成分分配到格子中。通过添加,能够对回音、混响抗力强地检测敲击音。
图9是与将每个时间-频率成分分配到格子的情况有关的模式图。设想了敲击音检测装置被作为鼠标等PC操作设备的代替品而使用的情况。为此,设想了在使用敲击音检测装置的环境中,存在人的说话声音等许多声音音源的情况。因此,需要一种即使在存在声音音源的环境中,也强有力地动作的敲击音检测装置。一般,可以认为声音在时间-频率域中是稀疏的信号。即,声音在时间-频率域中,其功率偏在于一部分成分中。因此,通过除去该偏在的一部分成分,即使在存在声音音源的环境中,也能够使敲击音检测装置强有力地动作。
在统合部件211中,判断仰角和方位角是否在敲击区域内,只在位于敲击区域内的情况下,看作是敲击音。通过进行这样的判断,能够废弃声音成分偏在的一部分时间-频率域。
也可以在统合部件211中,进行动作使得输出功率最大的格子,但在对各个子麦克风阵列求出了功率最大的方向后,对该最大方向进行统合,通过三角测量而推测敲击音的音源方向。
图10是表示子麦克风阵列中的每个方向的频度的例子的图。例如,如图10所示那样,对每个子麦克风阵列,将从各个子麦克风阵列看到的每个方向的功率相加。在将时间-频率成分分配到2维平面或3维空间上这样的方式下,每个格子的被分配数极少的情况也很多。在这样的情况下,对每个子麦克风阵列分别计算直方图,在分别计算出产生各个直方图的最大值的方向后,通过三角测量统合,能够进行强有力的推测。
图11是使敲击区域在高度方向上具有厚度而设定的例子。如该例子那样,通过使敲击区域在高度方向上具有厚度,除了对一些仰角方向的推测误差成为强有力以外,还能够检测出手指在空中发音等产生的声音。
图12是表示子麦克风阵列的配置的一个例子的图。是配置多个子麦克风阵列1101~1104使得围住敲击区域的例子。如图12所示那样,通过配置为围住敲击区域,与图5、图11所示的子麦克风阵列303~305的配置相比,能够更高精度地检测出敲击音位置。
图13是将上述音源指示设备应用于敲击音检测装置中的应用例子的图。将显示器1204配置在桌子上,使得显示面与桌子面平行,在该显示器上配置多个麦克风阵列1201~1203。敲击音区域为显示器画面全体。通过这样的设定,在用户敲击了显示器上的显示面的一点的情况下,能够知道该敲击点在哪里。即,可以使用图13所示那样的敲击检测装置代替触摸屏。另外,在触摸屏中,如其名字所示那样,只能够检测出“是否触摸了”,但如果使用本发明的敲击音检测装置,则通过使敲击区域在高度方向上具有厚度,在空间上用手指发声的情况下,也能够进行检测。
图14是将敲击音检测装置应用于棒球的“击打判断装置”的应用例子。在所谓的击打判断装置中,从投球区域1301向图14所示那样的靶子1305投球。然后,判断判断击中了靶子1305上的从1到9的块中的哪个块。球击中了靶子时产生的音是突发地具有大功率的突发性音,因此能够由本发明的敲击音检测装置检测。在该靶子上配置图14所示那样的多个子麦克风阵列1302~1304,并适用敲击音检测装置,由此在球击中靶子时,能够判断击中了1~9的哪个块、或者是否击中了框。由于球击中了框时的金属音和球击中了块时的音的频率特性不同,所以通过参照被判断为敲击音的频率成分的特性,能够区别球击中了框的情况和球击中了块的情况。
图15是将敲击音检测装置应用于足球的“射门位置判断装置”的应用例子。作为结构,与图14的击打判断装置是相同的结构。由使用了子麦克风阵列1402~1404的敲击音检测装置判断从踢球区域1401踢出的球击中了靶子1405内的1到9的块中的哪个块。
图16是将敲击音检测装置应用于乒乓球的“弹落位置判断装置”的应用例子。能够知道乒乓球的球弹落了的位置。作为结构,与击打判断装置和射门位置判断装置一样。由使用了子麦克风阵列1502~1507的敲击音检测装置判断球弹落在球台1501上的位置。由于乒乓球的球弹落在球台1501上时的声音是突发的音,所以能够由本敲击音检测装置进行判断。由此,在乒乓球的实况转播等中,能够得到视听者以前无法得到的球的轨迹相关的信息。
图17是将敲击音检测装置应用于“网球的壁打”,检测出击中墙壁的球的位置的应用例子。在经常用网球进行的壁打练习中,以前没有能够知道击中了墙壁的哪里的装置,因此无法判断击中的方向是好还是坏。通过使用了配置在墙壁1601上的多个子麦克风阵列1602~1606的敲击音检测装置,能够检测出球的击中位置。例如,通过预先存储球的击中位置,以后显示在计算机的显示器上,能够看到击中位置的离散是否大等这样的结果。
图18是表示将上述音源指示设备应用于敲击音检测装置中的其他应用例子的图。是表示用户使手指出声等在空中产生敲击桌子以外的突发音的情况下的使用例子的图。通过在高度方向上具有厚度地设定敲击区域,也能够检测出在空中鸣响的突发音。

Claims (10)

1.一种音响指示装置,检测要检测的声音的音源位置,将上述音源位置变换为显示装置的画面上的一点,该音响指示装置的特征在于包括:
保持多个麦克风元件的麦克风阵列;
将通过上述麦克风阵列得到的模拟音压数据变换为数字音压数据的A/D变换部件;
根据上述麦克风元件之间的上述声音的相关性,从上述数字音压数据推测上述要检测的声音的音源方向的方向推测部件;
从上述数字音压数据推测噪声水平,根据上述噪声水平和上述数字音压数据,计算出上述声音的信号成分,并作为输出信号输出的输出信号计算部件;
将上述音源方向和上述输出信号统合起来,确定上述音源位置的统合部件;
将所确定的上述音源位置变换为上述显示装置的上述画面上的一点的控制部件。
2.根据权利要求1所述的音响指示装置,其特征在于:
上述麦克风阵列由多个子麦克风阵列构成,
上述音响指示装置还包括:
通过对每个上述子麦克风阵列根据三角测量将由上述方向推测部件推测出的上述音源方向统合起来,来计算出上述音源方向和距上述音源位置的距离的三角测量部件;
判断上述音源方向和上述距离是否在预先定义的区域内的定位判断部件,其中
上述统合部件将上述输出信号与上述区域内的上述音源方向和上述距离统合起来,确定上述音源位置,
上述控制部件将所确定的上述音源位置变换为上述显示装置的上述画面上的一点。
3.根据权利要求1所述的音响指示装置,其特征在于:
上述麦克风阵列由多个子麦克风阵列构成,
上述音响指示装置还包括:
将上述数字音压数据变换为由时间-频带构成的信号的变换部件;
通过对每个上述子麦克风阵列根据三角测量将由上述方向推测部件使用上述由时间-频带构成的信号推测出的上述音源方向统合起来,来计算出上述音源方向和距上述音源位置的距离的三角测量部件;
判断上述音源方向和上述距离是否在预先定义的区域内的定位判断部件,其中
上述统合部件将上述输出信号与上述区域内的上述音源方向和上述距离统合起来,确定上述音源位置,
上述控制部件将所确定的上述音源位置变换为上述显示装置的上述画面上的一点。
4.根据权利要求1所述的音响指示装置,其特征在于:
上述麦克风阵列由多个子麦克风阵列构成,
上述音响指示装置还包括:
将上述数字音压数据变换为由时间-频带构成的信号的变换部件;
通过对每个上述子麦克风阵列根据三角测量将由上述方向推测部件使用上述由时间-频带构成的信号推测出的上述音源方向统合起来,来计算出上述音源方向和距上述音源位置的距离的三角测量部件;
判断上述音源方向和上述距离是否在预先定义的区域内的定位判断部件;
判断由上述输出信号计算部件输出的上述输出信号在预先确定的阈值以上的输出信号判断部件;
预先存储了上述要检测的声音的频率特性的音源频率数据库;
存储能够根据上述音源位置确定上述画面上的上述一点的变换表的画面变换数据库,其中
上述统合部件根据上述频率特性对上述阈值以上的上述输出信号进行加权,而与上述区域内的上述音源方向和上述距离统合,确定上述音源位置,
上述控制部件使用上述画面变换数据库的信息,将所确定的上述音源位置变换为上述画面上的一点。
5.一种音源位置的指示方法,通过处理装置检测要检测的声音的音源位置,将上述音源位置变换为显示装置的画面上的-点,该音源位置的指示方法的特征在于:
在上述处理装置中,
将通过保持多个麦克风元件的麦克风阵列得到的模拟音压数据变换为数字音压数据;
根据上述数字音压数据,进行基于上述麦克风元件之间的上述声音的相关性的上述声音的音源方向的推测;
从上述数字音压数据中推测噪声水平,根据上述噪声水平和上述数字音压数据,计算出上述声音的信号成分,并作为输出信号输出;
通过将上述音源方向和上述输出信号统合起来,而将上述声音的上述音源位置变换为上述显示装置的上述画面上的点。
6.根据权利要求5所述的音源位置的指示方法,其特征在于:
进而,在上述处理装置中,
上述麦克风阵列由多个子麦克风阵列构成,并且
通过对每个上述子麦克风阵列推测上述音源方向并根据三角测量进行统合,来计算出上述音源方向和距上述音源位置的距离,
通过将上述音源方向与上述输出信号统合起来,将上述声音的音源位置变换为上述显示装置的上述画面上的点。
7.根据权利要求5所述的音源位置的指示方法,其特征在于:
进而,在上述处理装置中,
上述麦克风阵列由多个子麦克风阵列构成,并且
抽出上述存储的数字音压数据并变换为由时间-频带构成的信号,
对每个上述子麦克风阵列使用上述由时间-频带构成的信号推测上述音源方向并根据三角测量进行统合,来计算出上述音源方向和距上述音源位置的距离,
判断上述音源方向和上述距离是否在预先定义的区域内,
将上述输出信号与上述区域内的上述音源方向和上述距离统合起来,确定上述音源位置,
将所确定的上述音源位置变换为上述显示装置的上述画面上的一点。
8.根据权利要求5所述的音源位置的指示方法,其特征在于:
进而,在上述处理装置中,
上述麦克风阵列由多个子麦克风阵列构成,并且
抽出上述存储的数字音压数据并变换为由时间-频带构成的信号,
通过对每个上述子麦克风阵列使用上述由时间-频带构成的信号推测上述音源方向并根据三角测量进行统合,来计算出上述音源方向和距上述音源位置的距离,
判断上述音源方向和上述距离是否在预先定义的区域内,
判断根据上述由时间-频带构成的信号和上述由时间-频带构成的信号的噪声水平计算出的输出信号的输出在预先确定的阈值以上,
将上述阈值以上的输出信号与上述区域内的上述音源方向和上述距离统合起来,确定上述音源位置并变换为上述画面上的一点。
9.一种计算机系统,至少具备:用于将要检测的声音的音源位置显示在画面上的显示装置;检测上述音源位置,将上述音源位置变换为上述显示装置的画面上的一点的音响指示装置;对使用与上述音响指示装置的上述音源位置有关的信息的程序进行处理的中央计算装置;存储上述程序的存储装置,该计算机系统的特征在于:
上述音响指示装置具备:
保持多个麦克风元件的麦克风阵列;
将通过上述麦克风阵列得到的模拟音压数据变换为数字音压数据的A/D变换部件;
从上述数字音压数据,基于上述麦克风元件之间的上述声音的相关性,推测上述要检测的声音的音源方向的方向推测部件;
从上述数字音压数据中推测噪声水平,根据上述噪声水平和上述数字音压数据,计算出上述声音的信号成分,并作为输出信号输出的输出信号计算部件;
将上述音源方向和上述输出信号统合起来,确定上述音源位置的统合部件;
将所确定的上述音源位置变换为上述显示装置的上述画面上的一点的控制部件。
10.根据权利要求9所述的计算机系统,其特征在于:
进而,在上述音响指示装置中,上述麦克风阵列由多个子麦克风阵列构成,
上述音响指示装置还包括:
将上述数字音压数据变换为由时间-频带构成的信号的变换部件;
通过对每个上述子麦克风阵列根据三角测量将由上述方向推测部件使用上述由时间-频带构成的信号推测出的上述音源方向统合起来,来计算出上述音源方向和距上述音源位置的距离的三角测量部件;
判断上述音源方向和上述距离是否在预先定义的区域内的定位判断部件;
判断由上述输出信号计算部件输出的输出信号在预先确定的阈值以上的输出信号判断部件;
预先存储了上述要检测的声音的频率特性的音源频率数据库;
存储能够根据上述音源位置确定上述画面上的上述一点的变换表的画面变换数据库,其中
上述统合部件根据上述频率特性对上述阈值以上的上述输出信号进行加权,而与上述区域内的上述音源方向和上述距离统合,确定上述音源位置,
上述控制部件使用上述画面变换数据库的信息,将所确定的上述音源位置变换为上述画面上的一点。
CN2008101761767A 2008-02-19 2008-11-14 音响指示设备、音源位置的指示方法和计算机系统 Expired - Fee Related CN101515197B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008037534 2008-02-19
JP2008037534A JP4926091B2 (ja) 2008-02-19 2008-02-19 音響ポインティングデバイス、音源位置のポインティング方法及びコンピュータシステム
JP2008-037534 2008-02-19

Publications (2)

Publication Number Publication Date
CN101515197A CN101515197A (zh) 2009-08-26
CN101515197B true CN101515197B (zh) 2011-03-23

Family

ID=40954681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101761767A Expired - Fee Related CN101515197B (zh) 2008-02-19 2008-11-14 音响指示设备、音源位置的指示方法和计算机系统

Country Status (3)

Country Link
US (1) US20090207131A1 (zh)
JP (1) JP4926091B2 (zh)
CN (1) CN101515197B (zh)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5452158B2 (ja) 2009-10-07 2014-03-26 株式会社日立製作所 音響監視システム、及び音声集音システム
US8488413B2 (en) * 2009-10-16 2013-07-16 Casio Computer Co., Ltd. Indicated position detecting apparatus and indicated position detecting method
JP5408621B2 (ja) * 2010-01-13 2014-02-05 株式会社日立製作所 音源探索装置及び音源探索方法
JP2011212433A (ja) 2010-03-19 2011-10-27 Nike Internatl Ltd マイクロホンアレイ及びその使用方法
US10158958B2 (en) 2010-03-23 2018-12-18 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
KR101490725B1 (ko) * 2010-03-23 2015-02-06 돌비 레버러토리즈 라이쎈싱 코오포레이션 비디오 디스플레이 장치, 오디오-비디오 시스템, 음향 재생을 위한 방법 및 로컬라이즈된 지각적 오디오를 위한 음향 재생 시스템
US8935103B2 (en) 2010-07-15 2015-01-13 Nike, Inc. Method and system for golf ball fitting analysis
GB2507243B (en) * 2012-05-02 2019-10-30 Inputdynamics Ltd Acoustically detecting a tap on an object using an adaptive classifier
US9459733B2 (en) * 2010-08-27 2016-10-04 Inputdynamics Limited Signal processing systems
US9226069B2 (en) 2010-10-29 2015-12-29 Qualcomm Incorporated Transitioning multiple microphones from a first mode to a second mode
JP5702160B2 (ja) * 2011-01-20 2015-04-15 中部電力株式会社 音源推定方法及び音源推定装置
JP5516455B2 (ja) * 2011-02-23 2014-06-11 トヨタ自動車株式会社 接近車両検出装置及び接近車両検出方法
KR101272158B1 (ko) * 2011-05-02 2013-06-05 심플렉스 인터넷 주식회사 휴대용 기기 및 이를 이용한 문자 입력 방법
US9030520B2 (en) 2011-06-20 2015-05-12 Polycom, Inc. Automatic camera selection for videoconferencing
US9319821B2 (en) 2012-03-29 2016-04-19 Nokia Technologies Oy Method, an apparatus and a computer program for modification of a composite audio signal
JP2013213739A (ja) * 2012-04-02 2013-10-17 Nippon Telegr & Teleph Corp <Ntt> 音源位置推定装置、音源位置推定方法及びそのプログラム
KR20130120708A (ko) * 2012-04-26 2013-11-05 삼성전자주식회사 다중 디스플레이 패널을 사용하는 디스플레이 장치 및 방법
CN102866385B (zh) * 2012-09-10 2014-06-11 上海大学 一种基于球麦克风阵列的多声源定位方法
KR101339744B1 (ko) 2012-10-23 2013-12-11 한국과학기술원 소음 관측 장치
US10222911B2 (en) * 2013-04-12 2019-03-05 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and driving method of the same
ES2613138T3 (es) * 2013-08-23 2017-05-22 Lg Electronics Inc. Robot limpiador y método para controlar el mismo
CN103593047B (zh) * 2013-10-11 2017-12-08 北京三星通信技术研究有限公司 移动终端及其操控方法
US9426568B2 (en) * 2014-04-15 2016-08-23 Harman International Industries, LLC Apparatus and method for enhancing an audio output from a target source
WO2015167511A2 (en) * 2014-04-30 2015-11-05 Empire Technology Development Llc Adjusting tap position on touch screen
US10318016B2 (en) * 2014-06-03 2019-06-11 Harman International Industries, Incorporated Hands free device with directional interface
US20170032367A1 (en) * 2014-07-06 2017-02-02 Joost van Beek Ultra-sound communication system
US10078399B2 (en) * 2015-09-21 2018-09-18 International Business Machines Corporation Computer device implemented audio triangulation
JP2017102085A (ja) * 2015-12-04 2017-06-08 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
CN105771221A (zh) * 2016-02-16 2016-07-20 深圳市衡泰信科技有限公司 足球模拟系统
CN105759246B (zh) * 2016-04-14 2018-01-02 中国计量学院 具有自校准功能的精度可调式网球击球点定位装置
CN107704180A (zh) * 2016-08-08 2018-02-16 中兴通讯股份有限公司 一种投影装置操作的方法和投影装置
CN106405499A (zh) * 2016-09-08 2017-02-15 南京阿凡达机器人科技有限公司 一种机器人定位声源的方法
CN110249297B (zh) 2017-02-09 2023-07-21 索尼公司 信息处理设备和信息处理方法
CN107063437A (zh) * 2017-04-12 2017-08-18 中广核研究院有限公司北京分公司 基于麦克风阵列的核电站噪声测试装置
GB201708100D0 (en) 2017-05-19 2017-07-05 Sintef Input device
GB201710085D0 (en) 2017-06-23 2017-08-09 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB201710093D0 (en) 2017-06-23 2017-08-09 Nokia Technologies Oy Audio distance estimation for spatial audio processing
CN111034222A (zh) * 2017-08-30 2020-04-17 松下知识产权经营株式会社 拾音装置、拾音方法以及程序
CN110133595B (zh) * 2018-02-09 2023-05-23 北京搜狗科技发展有限公司 一种声源测向方法、装置和用于声源测向的装置
CN110782911A (zh) * 2018-07-30 2020-02-11 阿里巴巴集团控股有限公司 音频信号处理方法、装置、设备和存储介质
US10206036B1 (en) * 2018-08-06 2019-02-12 Alibaba Group Holding Limited Method and apparatus for sound source location detection
US10834501B2 (en) 2018-08-28 2020-11-10 Panasonic Intellectual Property Corporation Of America Information processing method, information processing device, and recording medium
CN109471145B (zh) * 2018-10-17 2022-12-06 中北大学 一种基于四元声阵列平台的双声定位定姿法
CN111580050A (zh) * 2020-05-28 2020-08-25 国网上海市电力公司 一种用于识别gis设备异响声源位置的装置及方法
CN113470683A (zh) * 2021-06-25 2021-10-01 深圳市联洲国际技术有限公司 一种麦克风阵列的信号输出方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1109374A (zh) * 1993-03-31 1995-10-04 株式会社榆树 物体碰撞位置检测装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5768474A (en) * 1995-12-29 1998-06-16 International Business Machines Corporation Method and system for noise-robust speech processing with cochlea filters in an auditory model
JP4195267B2 (ja) * 2002-03-14 2008-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識装置、その音声認識方法及びプログラム
US7158126B2 (en) * 2002-04-08 2007-01-02 Koninklijke Philips Electronics N.V. Acoustic based pointing device
FR2841022B1 (fr) * 2002-06-12 2004-08-27 Centre Nat Rech Scient Procede pour localiser un impact sur une surface et dispositif pour la mise en oeuvre de ce procede
US7627139B2 (en) * 2002-07-27 2009-12-01 Sony Computer Entertainment Inc. Computer image and audio processing of intensity and input devices for interfacing with a computer program
JP4101791B2 (ja) * 2004-09-17 2008-06-18 シャープ株式会社 座標値入力システム、座標値入力方法、座標値入力プログラム、コンピュータ読み取り可能な記録媒体
US20060192763A1 (en) * 2005-02-25 2006-08-31 Ziemkowski Theodore B Sound-based virtual keyboard, device and method
US8073198B2 (en) * 2007-10-26 2011-12-06 Samsung Electronics Co., Ltd. System and method for selection of an object of interest during physical browsing by finger framing
US8121311B2 (en) * 2007-11-05 2012-02-21 Qnx Software Systems Co. Mixer with adaptive post-filtering
US8175728B2 (en) * 2007-12-13 2012-05-08 Georgia Tech Research Corporation Detecting user gestures with a personal mobile communication device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1109374A (zh) * 1993-03-31 1995-10-04 株式会社榆树 物体碰撞位置检测装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP特开2005-122534A 2005.05.12

Also Published As

Publication number Publication date
JP2009199158A (ja) 2009-09-03
JP4926091B2 (ja) 2012-05-09
CN101515197A (zh) 2009-08-26
US20090207131A1 (en) 2009-08-20

Similar Documents

Publication Publication Date Title
CN101515197B (zh) 音响指示设备、音源位置的指示方法和计算机系统
US11715446B2 (en) Music classification method and beat point detection method, storage device and computer device
Lu et al. Bidirectional GRU for sound event detection
CN109283492B (zh) 多目标方位估计方法及水声垂直矢量阵列系统
KR101925887B1 (ko) 상관된 소스들의 블라인드 측위를 위한 시스템들 및 방법들
Lemaitre et al. Auditory perception of material is fragile while action is strikingly robust
WO2018019181A1 (zh) 确定音频延迟的方法及设备
WO2013154792A1 (en) Systems, methods, and apparatus for spatially directive filtering
WO2015127858A1 (zh) 室内定位方法和装置
CN103019446B (zh) 基于波传播时间及能量函数的触击位置和能量测量方法
CN110432926B (zh) 弹性测量检测方法及系统
CN105607042A (zh) 用麦克风阵列时延估计定位声源的方法
Dahl Triggering sounds from discrete air gestures: What movement feature has the best timing?
CN111487678A (zh) 一种确定高分辨率小多道地震最小偏移距和系统延迟的分析方法
Dang et al. A feature-based data association method for multiple acoustic source localization in a distributed microphone array
CN110244260B (zh) 基于声能流矢量补偿的水下目标高精度doa估计方法
Baggenstoss Processing advances for localization of beaked whales using time difference of arrival
GB2385125A (en) Using vibrations generated by movement along a surface to determine position
US9470775B1 (en) Localization of short duration periodic signals
CN108593769A (zh) 利用多通道控制弹性波的归一化信号激振无损检测方法
Cicconet et al. Visual cues-based anticipation for percussionist-robot interaction
CN110361696A (zh) 基于时间反转技术的封闭空间声源定位方法
CN105204018B (zh) 一种利用多帧信息的二维doa跟踪方法
Habib et al. Auditory inspired methods for localization of multiple concurrent speakers
JP4822458B2 (ja) インターフェイス装置とインターフェイス方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110323

Termination date: 20191114