CN101213589A - 对象声音分析装置、对象声音分析方法及对象声音分析程序 - Google Patents

对象声音分析装置、对象声音分析方法及对象声音分析程序 Download PDF

Info

Publication number
CN101213589A
CN101213589A CNA200680023615XA CN200680023615A CN101213589A CN 101213589 A CN101213589 A CN 101213589A CN A200680023615X A CNA200680023615X A CN A200680023615XA CN 200680023615 A CN200680023615 A CN 200680023615A CN 101213589 A CN101213589 A CN 101213589A
Authority
CN
China
Prior art keywords
sound
object sound
mentioned
frequency
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200680023615XA
Other languages
English (en)
Other versions
CN101213589B (zh
Inventor
芳泽伸一
中藤良久
铃木哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101213589A publication Critical patent/CN101213589A/zh
Application granted granted Critical
Publication of CN101213589B publication Critical patent/CN101213589B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/017Detecting movement of traffic to be counted or controlled identifying vehicles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

一种对象声音分析装置,对具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分,能够分析包含在评价声音中的对象声音,该对象声音分析装置分析在评价声音(S100)中是否包含对象声音(S101),具备:对象声音准备部(102),准备为了分析基本周期而使用的分析波形、即对象声音(S101);评价声音准备部(102),准备被分析基本周期的被分析波形、即评价声音(S100);分析部(104),将上述对象声音(S101)相对于上述评价声音(S100)进行时移的同时,依次计算对应的时刻的上述评价声音(S100)和上述对象声音(S101)的差分值,计算该差分值成为预定阈值(S104)以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音(S101)的基本周期,判断在上述评价声音(S100)中是否存在上述对象声音(S101)。

Description

对象声音分析装置、对象声音分析方法及对象声音分析程序
技术领域
本发明涉及对具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分来分析在评价声音中是否包含对象声音的装置、方法及程序。特别涉及通过确定评价声音中的对象声音的基本周期存在的时间或频带来分析在评价声音中是否包含对象声音的装置、方法及程序。
背景技术
分析基本周期的技术在混合声音分离、声音识别、声音合成等的广泛的领域中利用,承担重要的作用。例如,在混合声音分离中,有利用声音的基本周期即音高(pitch)从包含非周期性的噪声的混合声音中提取声音的技术。另外,有利用音乐声的基本周期按乐器分离管弦乐演奏的技术。并且,在声音合成中,有将声音的基本周期即音高作为一个参数提取出来做成合成声音的技术。
在分析基本周期的第一种现有技术中,利用通过听觉滤波器或傅立叶变换做成的时间-频率结构(频谱)计算自相关,从而提取基本周期(例如参照非专利文献1)。
在第一种现有技术中,对以预定的时间间隔输入的信号进行傅立叶变换,计算时间频率结构(频谱)。并且,在预定的频率中,沿时间轴方向计算功率谱的自相关来提取基本周期。
图35A和图35B是说明利用时间-频率结构求出基本周期的方法的图。
图35A表示某个频率的功率谱。纵轴表示功率谱的大小,横轴表示采样号。图35B表示图35A所示的功率谱的自相关。纵轴表示自相关,横轴表示基本周期的候补。
在此,说明求出自相关的方法和求出基本周期的方法。
若将某个频率的某时刻(采样号)
(数学式1)
n
的功率谱设为
(数学式2)
X(n)
,则自相关
(数学式3)
R(τ)
通过数学式4来计算。
(数学式4)
R ( τ ) = Σ n = τ τ + N ( X ( n ) × X ( n - τ ) )
并且,在数学式4中,
(数学式5)
τ
是基本周期的候补,
(数学式6)
N
是分析区域内的采样数量。
基本频率
(数学式7)
tp
如数学式8所示,作为具有最大的自相关(数学式3)的基本周期的候补求出。
(数学式8)
tp=argτ maxR(τ)
在图35B的例子中,基本周期为110采样(与其对应的时间)。
在分析基本周期的第二种现有技术中,利用通过小波变换而做成的某个频率的功率谱的时间结构,通过求出功率谱的大小为预定阈值以上的时间间隔来提取基本周期(例如参照专利文献1).
在第二种现有技术中,对以某个时间间隔输入的信号进行小波变换而做成功率谱(power spectrum)的时间结构。例如,输入的信号
(数学式9)
x(t)
的二进制小波变换值
(数学式10)
DyWT
,利用以二进制数列进行量子化的音阶(scale)参数
(数学式11)
a=2j
及移位参数
(数学式12)
b
,通过数学式13来计算。
(数学式13)
D y W T x ( b , 2 j ) = 1 2 j ∫ - ∞ ∞ x ( t ) g * ( t - b 2 j ) dt
在此,分析的频带由音阶参数(数学式11)确定。并且,移位参数(数学式12)对应于采样号。
并且,在数学式13中,
(数学式14)
g(x)
是小波函数,
(数学式15)
g*(x)
是小波函数(数学式14)的复数共轭。
图36表示以与音阶参数
(数学式16)
a=24
对应的频率对声音信号进行小波变换时的功率谱的时间结构。纵轴表示功率谱(数学式13),横轴表示采样号(数学式12)。
如图36所示,若对声音信号进行小波变换,则功率谱的时间结构为在某个采样号中具有较大的值的形状。在该现有技术中,设定有用于检测功率谱的峰值的阈值
(数学式17)
AO
,比较功率谱的大小和阈值(数学式17)来确定阈值以上的峰值。并且,将超过阈值的峰值的时间间隔设为基本周期
(数学式18)
tp
。在图36的例子中基本周期为110采样(与其对应的时间)。
在分析基本周期的第三种现有技术中,在设定为声道调音等价滤波器的反滤波特性的滤波器中,利用通过原声音而得到的残差波形图形求出基本周期(音高)。这时,求出在某个时间间隔残差波形图形和在有声音的合成时使用的1音高波形图形(基本波形图形)间的互相关,将互相关的峰值的时间间隔设为基本周期(音高)(例如参照专利文献2)。
图37A~图37C表示残差波形图形和互相关的关系。
提取出通过反滤波示于图37的残差波形图形。接着,求出示于图37B的有声音的合成时使用的1音高波形图形和残差波形图形间的互相关。在图37中,示出残差波形图形和1音高波形图形间的互相关的时间结构。该时间结构将1音高波形图形以某个时间间隔相对于残差波形图形进行时移求出互相关,对每个时间沿横轴排列了该互相关。在图37的例子中,基本周期为2ms。
非专利文献1:Malcolm Slaney,外1名,“A Perceptual PitchDetector”,1990年,ICASSP(International Conference on Acoustics,Speech,and Signal Processing),IEEE(第3章)。
专利文献1:(日本)特开2004-126855号公报(第1项、第3图、第4图)。
专利文献2:(日本)特开昭63-5398号公报(第1项、第3图)
但是,在第一种现有技术中,对于具有与对象声音相同的基本周期且不同于对象声音的声音,也输出与对象声音相同的基本周期的值,所以存在难以对具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分来分析基本周期的问题。例如,难以区分基本周期(音高)类似的2名男性的声音来分析基本周期。因此,难以分析在评价声音中是否包含对象声音。
并且,在第二种现有技术中,对于具有与对象声音相同的基本周期且不同于对象声音的声音,也输出与对象声音相同的基本周期的值,所以存在难以对具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分来分析基本周期的问题。因此,难以分析在评价声音中是否包含对象声音。例如,在区分基本周期类似的2名男性的声音来分析基本周期时,功率谱的最大值因声音的大小而变动,所以在不作为对象的人的功率谱的最大值大于作为对象的人的功率谱的最大值时,难以设定阈值。
并且,在第三种现有技术中,对于具有与对象声音相同的基本周期且不同于对象声音的声音,也输出与对象声音相同的基本周期的值,所以很难对具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分来分析基本周期。因此,难以分析在评价声音中是否包含对象声音。
发明内容
本发明是鉴于这种问题点而做出的,其目的在于提供一种对象声音分析装置,区分“对象声音”和“具有与对象声音相同的基本周期且不同于对象声音的声音”,可以分析在评价声音中是否包含对象声音。特别是,其目的在于提供一种确定评价声音中的对象声音的基本周期存在的时间或频带的对象声音分析装置。
为了实现上述目的,本发明的对象声音分析装置,分析在评价声音中是否包含对象声音,具备:对象声音准备单元,准备为了分析基本周期而使用的分析波形、即对象声音;评价声音准备单元,准备被分析基本周期的被分析波形、即评价声音;分析单元,使上述对象声音相对于上述评价声音进行时移,依次计算对应的时刻的上述评价声音和上述对象声音的差分值,计算该差分值为预定阈值以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音的基本周期,来判断在上述评价声音中是否存在上述对象声音。
由此,计算评价声音和对象声音的差分值,基于在预定阈值以下的差分值的重复间隔的周期和对象声音的基本周期,判断在评价声音中是否存在对象声音,所以能够将具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分来分析有无对象声音。这是因为,在评价声音是对象声时是,差分值的最小值近似地为零,在评价声音具有与对象声音相同的基本周期且不同于对象声音的声音时,差分值的最小值为离开零的较大的值。
优选,上述对象声音准备单元准备通过对上述对象声音进行频率分析而得到的对象声音频率图形;上述评价声音准备单元准备通过对上述评价声音进行频率分析而得到的评价声音频率图形;上述分析单元一边将上述对象声音频率图形相对于上述评价声音频率图形进行时移,一边依次计算对应的时刻的上述评价声音频率图形和上述对象声音频率图形的差分值,计算上述差分值为预定阈值以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音的基本周期,来判断在上述评价声音中是否存在上述对象声音。
由此,计算评价声音频率图形和对象声音频率图形的差分值,基于为预定阈值以下的差分值的重复间隔的周期和上述对象声音的基本周期,判断在上述评价声音中是否存在上述对象声音,所以能够将具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分,来分析对象声音的有无。在此,利用对评价声音进行了频率分析的评价声音频率图形和对对象声音进行了频率分析的对象声音频率图形,所以能够对每个频带分析有无对象声音。例如,在分析对象声音和噪声混合的评价声音时,可以选择没有噪声的频带来分析有无对象声音。
更好是,上述对象声音分析装置还具备设定与上述对象声音关联的声音信息的声音信息设定单元;上述对象声音准备单元基于设定的上述声音信息准备上述对象声音或上述对象声音频率图形。
由此,对象声音准备单元基于声音信息设定单元设定的声音信息准备对象声音,所以能够控制对象声音准备单元准备的对象声音。并且,对象声音准备单元基于与声音信息设定单元设定的对象声音有关的声音信息来准备对象声音频率图形,所以能够控制对象声音准备单元准备的对象声音频率图形。由此,使用者能够使用声音信息设定单元设定对象声音。
更好是,上述声音信息设定单元接收对象声音的输入,将所输入的上述对象声音作为上述声音信息;上述对象声音准备单元将所输入的上述对象声音作为准备的上述对象声音,或者,通过进一步对该对象声音进行频率分析来准备上述对象声音频率图形。
由此,对象声音准备单元将声音信息设定单元输入的对象声音作为准备的对象声音,所以对象声音准备单元不需要事先存储成为对象声音的候补的多个声音,能够减小存储容量。并且,对象声音准备单元利用声音信息设定单元输入的对象声音做成对象声音频率图形,所以对象声音准备单元不需要存储与对象声音的候补对应的多个对象声音频率图形,能够减小存储容量。
更好是,上述对象声音准备单元存储有多个对象声音的候补或上述多个对象声音频率图形的候补;上述声音信息设定单元接收选择信号,该选择信号用于选择上述多个对象声音的候补及上述多个对象声音频率图形的某一个;上述对象声音准备单元将根据上述选择信号选择的对象声音的候补或对象声音频率图形的候补,作为准备的上述对象声音或准备的上述对象声音频率图形。
由此,由于能够利用对象声音准备单元存储的对象声音的候补来准备对象声音,所以不需要输入对象声音。由此,在不能输入对象声音的情况下,也可以分析有无对象声音。例如,在分析噪声下有无男性的声音时,在噪声下不能接收到安静的环境下的男性的声音,但是,利用对象声音准备单元存储的安静的环镜下的男性的声音,能够分析有无男性的声音。并且,能够省略输入对象声音的时间,所以可以进行实时处理。
并且,由于能够利用对象声音准备单元存储的对象声音频率图形的候补来准备对象声音频率图形,所以不需要输入对象声音并进行频率分析而做成对象声音频率图形。由此,在不能输入对象声音的情况下,也可以分析对象声音。例如,在分析噪声下有无男性的声音时,在噪声下不能接收到安静的环境下的男性的声音,但是,利用对对象声音准备单元存储的安静的环镜下的男性的声音进行频率分析而做成的对象声音频率图形,能够分析有无男性的声音。并且,能够省略输入对象声音的时间和对输入的对象声音进行频率分析的时间,所以可以进行实时处理。
更好是,上述对象声音分析装置还具备阈值设定单元,该阈值设定单元将上述对象声音相对于多个评价声音的每一个进行时移的同时,依次计算对应的时刻的上述评价声音和上述对象声音的差分值,来计算上述差分值的最小值,并基于与上述多个评价声音对应的多个上述最小值中的最大值,设定上述预定阈值。
由此,能够设定多个评价声音共同的阈值。例如,即使是相同的摩托车(或自行车)声音,将在噪声下收集的摩托车声音和不是噪声的环境下收集的摩托车声音分别作为评价声音时,能够设定两种摩托车声音共同的阈值。因此,可以对多个对象声音设定适当的阈值,能够对多个对象声音分析有无对象声音。并且,通过适当地控制阈值,能够减少有无对象声音的分析错误。
更好是,上述对象声音准备单元准备对象声音频率图形,该对象声音频率图形通过上述对象声音和由预定的频率成分构成的非周期性分析波形间的互相关来计算、且包含振幅谱及相位谱中的至少一个;上述评价声音准备单元准备评价声音频率图形,该评价声音频率图形通过评价声音和上述分析波形间的互相关来计算、且包含振幅谱及相位谱的至少一个。
由此,分析使用非周期性分析波形做成的对象声音频率图形及评价声音频率图形来分析对象声音的基本周期,所以,显现出对象声音及评价声音的周期性的特征。因此,能够分析有无对象声音。例如,在比对象声音的基本周期还高的频带的对象声音频率图形中也出现对象声音的基本周期,所以即使在与对象声音的基本周期相对应的频带中附加噪声,也能够分析有无对象声音。并且,在所有频带中,在对象声音频率图形中出现对象声音的基本周期,所以能够对每个频带分析基本周期,用于对象声音提取。
更好是,上述对象声音准备单元准备对象声音频率图形,该对象声音频率图形通过上述对象声音和构成由预定的频率成分构成的分析波形的一部分并具有预定的时间分辨率的多个局部分析波形间的各个互相关来计算、且包含振幅谱及相位谱的至少一个;上述评价声音准备单元准备评价声音频率图形,该评价声音频率图形通过上述评价声音和上述多个局部分析波形间的各个互相关来计算、且包含振幅谱及相位谱的至少一个;上述分析单元将使用上述多个局部分析波形准备的上述对象声音频率图形和使用上述多个局部分析波形准备的上述评价声音频率图形,各作为一组数据使用,来分析上述对象声音的基本周期。
由此,将使用多个局部分析波形准备的对象频率图形和使用多个局部分析波形准备的评价声音频率图形,各作为一组数据是用,来分析基本周期,所以使用分析波形中的频率分辨率的时间性频率结构的变化,能够正好细化频率分辨率来分析基本周期。例如,可以使用在混合声音中噪声少的狭窄的频带来分析基本周期。由此,能够通过混合声音(评价声音)中的对象声音的有无来准确地判断。
更好是,上述对象声音分析装置还具备频率设定单元,该频率设定单元设定在上述分析单元中使用的对象声音频率图形及评价声音频率图形的频带;上述分析单元使用由上述频率设定单元设定的上述频带的上述对象声音频率图形及上述评价声音频率图形,分析上述对象声音的基本周期。
由此,可以利用频率设定单元来控制分析单元中使用的对象声音频率图形及评价声音频率图形的频带。由此,能够变更分析的频带或变更分析的频带的带宽。例如,从混合了对象声音和噪声的评价声音中分析有无对象声音时,能够选择没有噪声的频带来分析基本周期。
并且,本发明不仅可以作为具有这种特征性的单元的对象声音分析装置实现,还可以作为将包含在对象声音分析装置中的特征性的单元作为步骤的对象声音分析方法实现,还可以作为使计算机具有包含在对象声音分析装置中的特征性的单元的程序实现。并且,这种程序当然可以通过CD-ROM(Compact Disc-Read Only Memory)等记录介质或因特网等通信网络流通。
本发明的效果如下:
如上所述,将对象声音相对于评价声音进行时移的同时,计算评价声音和对象声音的差分值时,基于为预定阈值以下的重复时间间隔的周期和对象声音的基本周期,判断在评价声音中是否存在对象声音,从而能够区分“对象声音”和“具有与对象声音相同的基本周期且不同于对象声音的声音”,分析在评价声音中是否包含对象声音。并且,突发性地在评价声音中存在波形图形类似于对象声音的噪声时,也能够准确地分析是突发性的噪声等还是对象声音。
附图说明
图1A是表示本发明的对象声音分析方法的概念图。
图1B是表示本发明的对象声音分析方法的概念图。
图1C是表示本发明的对象声音分析方法的概念图。
图1D是表示本发明的对象声音分析方法的概念图。
图1E是表示本发明的对象声音分析方法的概念图。
图1F是表示本发明的对象声音分析方法的概念图。
图1G是表示本发明的对象声音分析方法的概念图。
图2是表示第一实施方式的对象声音分析装置的整体结构的框图。
图3是表示车辆检测系统的动作顺序的流程图。
图4是表示摩托车声音的一例的图。
图5A是表示摩托车声音中的对象声音的一例的图。
图5B是表示摩托车声音中的对象声音的一例的图。
图5C是表示摩托车声音中的对象声音的一例的图。
图6A是表示利用评价声音和对象声音来计算差分值的方法的一例的图。
图6B是表示利用评价声音和对象声音来计算差分值的方法的一例的图。
图6C是表示利用评价声音和对象声音来计算差分值的方法的一例的图。
图7A是表示利用评价声音和对象声音来计算差分值的方法的其它一例的图。
图7B是表示利用评价声音和对象声音来计算差分值的方法的其它一例的图。
图7C是表示利用评价声音和对象声音来计算差分值的方法的其它一例的图。
图8A是表示基于与对象声音间的图形匹配的方法的一例的图。
图8B是表示基于与对象声音间的图形匹配的方法的一例的图。
图8C是表示基于与对象声音间的图形匹配的方法的一例的图。
图9是表示第一实施方式的第一变形例的对象声音分析装置的整体结构的框图。
图10是表示车辆检测系统的其它动作顺序的流程图。
图11是表示汽车的发动机声音的一例的图。
图12是表示警报器声音的一例的图。
图13是表示对象声音准备部的一例的图。
图14A是利用触摸屏选择对象声音的一例的图。
图14B是利用触摸屏选择对象声音的一例的图。
图15是表示第一实施方式的第二变形例的对象声音分析装置的整体结构的框图。
图16A是表示阈值的设定方法的一例的图。
图16B是表示阈值的设定方法的一例的图。
图16C是表示阈值的设定方法的一例的图。
图16D是表示阈值的设定方法的一例的图。
图16E是表示阈值的设定方法的一例的图。
图17是表示车辆检测系统的再一其它动作顺序的流程图。
图18A是表示阈值的输入方法的一例的图。
图18B是表示阈值的输入方法的一例的图。
图19A是分析基本周期的方法的一例的图。
图19B是分析基本周期的方法的一例的图。
图19C是分析基本周期的方法的一例的图。
图20是表示第二实施方式的对象声音分析装置的整体结构的框图。
图21A是表示A君的声音的一例的图。
图21B是表示包括A君的3人的声音的混合声音的一例的图。
图22是表示助听系统的动作顺序的流程图。
图23是表示做成频率图形的方法的一例的图。
图24A是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的一例的图。
图24B是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的一例的图。
图24C是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的一例的图。
图25A是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的其它一例的图。
图25B是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的其它一例的图。
图25C是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的其它一例的图。
图26是表示第二实施方式的变形例的对象分析装置的整体结构的框图。
图27是表示助听系统的其它动作顺序的流程图。
图28是表示非周期性的分析波形图形的一例的图。
图29是表示分析波形图形和局部分析波形图形的关系的图。
图30是表示分析波形图形和局部分析波形图形的其它关系的图。
图31是表示评价声频率图形和对象声音的频率图形的一例的图。
图32是表示分析波形图形和局部分析波形图形的再一其它关系的图。
图33是表示第三实施方式的对象声音分析装置的整体结构的框图。
图34是表示车辆检测系统的动作顺序的流程图。
图35A是说明现有技术的利用时间-频率结构并利用自相关来分析基本周期的方法的图。
图35B是说明现有技术的利用时间-频率结构并利用自相关来分析基本周期的方法的图。
图36是说明利用现有技术的时间-频率结构的振幅值成为预定阈值以上的峰值的时间间隔来分析基本周期的方法的图。
图37A是说明利用现有技术的与残差波形图形有关的互相关来分析基本周期的方法的图。
图37B是说明利用现有技术的与残差波形图形有关的互相关来分析基本周期的方法的图。
图37C是说明利用现有技术的与残差波形图形有关的互相关来分析基本周期的方法的图。
符号说明
100、3002车辆检测系统;101、1701基本周期分析部;102、701、1702、2301对象声音准备部;103、1703评价声音准备部;104、1704、3001分析部;105警告声音输出部;700、2300声音信息设定部;1100阈值设定部;1700助听系统;1705声音提取部;3000频率设定部;S100、S1700评价声音;S101对象声音S102检测信号;S103警告声音;S104、S1705  阈值;S105、S1706基本周期;S700、S2300声音信息;S1100A选择信号;S1100B阈值信息;S1100C声音信息;S1701评价声音频率图形;S1702对象声音频率图形;S1703区域信息;S1704提取声音;S3000频带信息S3001A频带信息A;S3001B频带信息B;S3001C频带信息C
具体实施方式
首先,说明本发明的对象声音分析方法的概念。
图1A~图1G表示本发明的对象声音分析方法的示意图。
首先,说明评价声音是对象声音的情况。将图1C所示的对象声音(这里使用了基本波形图形)相对于图1A所示的评价声音A(图1C所示的对象声音的3个周期的波形图形)进行时移的同时,并依次计算对应的时刻的评价声音A和对象声音的差分值。图1D表示计算出差分值的结果。评价声音A与对象声音相同,因此存在差分值的最小值成为零的部分。并且,差分值成为零的时间间隔与对象声音的基本周期一致。因此,在评价声音中存在对象声音的情况下,可知差分值成为零的时间间隔的周期与对象声音的基本周期一致。并且,假设重复时间间隔为预定阈值以下的差分值的重复时间间隔。在该例子中,阈值设为稍大于零的值。如图1D所示,稍大于零的阈值以下的差分值的重复间隔与差分值成为零的时间间隔相同。
接着,说明评价声音是具有相同的基本周期且不同于对象声音的声音的情况。将图1C所示的对象声音相对于图1B所示的评价声音B(具有与图1C所示的对象声音相同的基本周期且不同于对象声音的声音的3个周期的波形图形)进行时移的同时,依次计算对应的时刻的评价声音B和对象声音的差分值。图1E表示计算出差分值的结果。包含在评价声音B中的声音的基本周期与对象声音的基本周期相同,但是波形图形与对象声音的波形图形不同,所以差分值的最小值不成为零而具有较大的值。这时,评价声音B是具有与对象声音相同的基本周期的波形图形,所以差分值的最小值的时间间隔与对象声音的基本周期相同。因此,导入阈值并基于在预定阈值以下的差分值的重复时间间隔来分析在评价声音中是否存在对象声音。该阈值是与图1D所示的阈值相同的值(稍大于零的值)。如图1E所示,由于在评价声音中不存在与对象声音相同的波形图形,所以差分值不成为零,不存在阈值以下的差分值的重复。因此,采用本方法,可以判断评价声音B不同于对象声音。
如以上说明,计算评价声音和对象声音的差分值,基于在预定阈值以下的差分值的重复间隔来分析在评价声音中是否存在对象声音。即,重复时间间隔的周期与对象声音的基本周期大致相等的情况下,判断为在评价声音中存在对象声音,在重复时间间隔的周期与对象声音的基本周期大致不相等的情况下,分析为在评价声音中不存在对象声音。通过该构成,能够将具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分,分析在评价声音中是否存在对象声音。
此外,基于重复间隔分析在评价声音中是否存在对象声音,从而即使突发性地在评价声音中有类似于对象声音的波形图形的杂音等,也能够准确地分析是突发性的杂音还是对象声音(详细情况在第一实施方式中后述)。
若对象声音的基本波形图形没有摇摆,本发明中导入的阈值可设定为稍大于零的值。并且,当在对象声音的基本波形图形中存在摇摆的情况下,考虑对象声音的基本波形图形的摇摆宽度的同时,设定为比由差分值的最小值的摇摆引起的变动的最大值稍大的值。并且,可以通过反馈分析错误的结果来调节。并且,处理多个对象声音的情况下,可以对每个对象声音设定值。
在此,为了与本发明比较,图1F及图1G示意地表示第三现有技术的情况的结果。在图3的现有技术中,根据在设定为声道调音等价滤波器的反滤波特性的滤波器中通过原声音而得到的残差波形图形(对应于评价声音)、和在有声音的合成中使用的1音高波形图形(对应于对象声音)间的互相关的时间间隔,来确定基本周期。图1F表示将图1C所示的对象声音相对于图1A所示的评价声音A进行时移的同时,依次计算对应的时刻的评价声音A和对象声音间的互相关的结果的一例。图1G表示将图1C所示的对象声音相对于图1B所示的评价声音B进行时移的同时,计算对应的时刻的评价声音A和对象声音间的互相关的结果的一例。在第三现有技术中,不同于本发明的差分值而利用互相关,所以有时对于与对象声音不同的声音也取较大的值。因此,难以导入阈值。这是因为,与差分值不同,相关值是判断符号是否一致的值,在计算相关值的2个波形图形的符号一致的部分的波形图形的值较大的情况下,不管2个波形图形是否相同而取较大值。这样,在利用相关值的现有技术中难以导入阈值。并且,本发明人知道考虑了在将用对象声音(对象声音频率图形)及对应的评价声音(评价声音频率图形)的大小对互相关进行归一化的归一化互相关导入之后利用阈值的技术,但是由于欠缺声音(频率图形)的大小的信息,所以对于比对象声音(对象声音频率图形)大很多或小很多的对象声音以外的声音(频率图形),若形状相似就会错误判断为对象声音,故难以利用。特别是,在对象声音(对象声音频率图形)如正弦波那样是单纯的形状,分析振幅非常小的杂音区间的评价声音(评价声音频率图形)时,还增加量子化错误的影响并增加分析错误。并且,按频带来分割对象声音并进行分析时,频带之间的对象声音频率图形的大小关系(对象声音的频谱结构)变得重要,所以需要频率图形的大小的信息。与此相比,本发明的差分值能够利用声音大小的信息,所以能够解决上述课题。
以下参照附图说明本发明的实施方式。
(第一实施方式)
图2表示本发明的第一实施方式的对象声音分析装置的整体结构的框图。在此,示出本发明的对象声音分析装置组装到车辆检测系统的一例。在本实施方式中,将通过分析摩托车声音的基本周期判断在使用者的周边存在摩托车声音来对使用者通知摩托车接近的情况为例进行说明。
车辆检测系统100是检测评价声音S100是否是摩托车声音并在摩托车声音的情况下输出警告声音S103的系统,具备基本周期分析部101和警告声音输出部105。
基本周期分析部101是分析评价声音S100的基本周期的处理部,具备对象声音准备部102、评价声音准备部103、和分析部104。
在对象声音准备部102中存储有对象声音S101和对象声音S101的基本周期S105。在分析部104中存储有阈值S104。对象声音准备部102向分析部104输出对象声音S101和基本周期S105。评价声音准备部103输入评价声音S100而向分析部104输出。分析部104将对象声音S101相对于评价声音S100进行时移的同时,依次计算对应的时刻的评价声音S100和对象声音S101的差分值,基于在阈值S104以下的差分值的重复时间间隔的周期和对象声音S101的基本周期S105,分析在评价声音S100中是否存在对象声音S101,利用基本周期S105在评价声音S100中存在对象声音S101的情况下向警告声音输出部105输出检测信号S102。
对象声音准备部102是准备为了分析基本周期而使用的分析波形图形、即对象声音的对象声音准备单元的一例。
评价声音备部103是准备被分析基本周期的被分析波形图形、即评价声音的评价声音准备单元的一例。
分析部104是如下分析单元的一例:使上述对象声音相对于上述评价声音进行时移的同时,依次计算对应的时刻的上述评价声音和上述对象声音的差分值,计算上述差分值成为预定阈值以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音的基本周期,来判断在上述评价声音中是否存在上述对象声音。
在输入了检测信号S102时,警告声音输出部105向使用者提示警告声音S103。
接着,说明如上那样构成的车辆检测系统100的动作。
图3是表示车辆检测系统100的动作顺序的流程图。
在该例子中,车辆检测系统100出厂之前,在对象声音准备部102中存储有摩托车声音作为对象声音S101(步骤200),进而存储有作为对象声音S101的摩托车声音的基本周期S105。并且,在分析部104中存储有阈值S104。
图4表示摩托车声音的一个例子。由此,可知摩托车声音是周期性的声音。并且,图5A~图5C表示对象声音S102的一例。对象声音可以是图5A所示的1个周期的摩托车声音,也可以是图5B所示的1个周期的摩托车声音,也可以是图5C所示的3个周期的摩托车声音,对于对象声音的时间长度没有限制。在该例子中,设定图5A所示的一个周期的摩托车声音为对象声音S101。此外,对象声音S101的基本周期S105是2.9ms~3.2ms。
首先,通过启动车辆检测系统100,评价声音准备部103利用麦克风开始取入评价声音S100、即使用者的周边的声音(步骤201)。在该例子中,从使用者的周边的声音取入包含多个摩托车声音的基本周期的9ms间隔的评价声音。即,每9ms区分使用者的周边的声音并输入,分析摩托车声音的基本周期。
接着,在由使用者的周边的声音构成的评价声音S100中,分析在是否包含有对象声音准备部102中存储的对象声音S101、即摩托车声音的基本周期(步骤202)。具体地,在分析部104中,将对象声音S101相对于评价声音S100进行时移的同时,依次计算对应的时刻的评价声音S100和对象声音S101的差分值,基于在阈值S104以下的差分值的重复时间间隔来分析对象声音S101的基本周期。并且,利用基本周期S105,在评价声音S100中存在对象声音S101时向警告声音输出部105输出检测信号S102。
图6A~图6C表示分析部104中的分析对象声音的基本周期的方法的一例。在该例子中,示出评价声音是对象声音的情况。
图6A示出评价声音的一例。在该例子中,从当前时刻追溯来截取9ms的使用者的周边的声音来作为评价声音。在该例子中,评价声音由3个周期的对象声音、即摩托车声音构成。在此,将评价声音S100表现为
(数学式19)
BH(n)(n=0,1,...L)
其中,n是将时间离散化的值,在该例子中,L是对应于9ms的值。
图6B表示对象声音的一例。在该例子中将1个周期的摩托车声音作为对象声音。其中,将对象声音S101表现为
(数学式20)
BT(n)(n=0,1,...W)
其中,n是将时间离散化的值,在该例子中,W是对应于对象声音S101的基本周期、即3ms的值。
图6C中示出将对象声音S101相对于评价声音S100进行时移时的差分值。在该例子中,利用欧几里德距离。其中,将差分值表现为
(数学式21)
E ( m ) = Σ n = 0 n = W ( BH ( m + n ) - BT ( n ) ) 2 (m=0,1,...L-W)
其中,m是将时间离散化的值,对应于求出差分值的评价声音S100的开端的时刻。该差分值是对时间宽度W中的评价声音和对象声音的差分进行总计的值。在该例子中,评价声音是对象声音,所以差分值的重复时间间隔成为3ms,与对象声音的基本周期S105一致。
其中,导入阈值S104。将该阈值S104表现为Θ。在该例子中,阈值S104在车辆检测系统100出厂之前存储在分析部104中,考虑对象声音的基本波形图形的摇摆宽度而设定为比由差分值的最小值的摇摆引起的变动的最大值稍大的值。
图6C示出对象声音的基本周期的分析方法的一例。其中,求出在阈值Θ以下的数学式21中表示的差分值的重复时间间隔。在该例子中,由于评价声音是对象声音,所以差分值的最小值成为非常接近零的值。因此,在阈值Θ以下的差分值的重复时间间隔与不考虑阈值的差分值的重复时间间隔一致。在该例子中,评价声音S100的基本周期成为3ms。
接着,评价声音的基本周期是3ms,在作为对象声音的基本周期S105的2.9ms~3.2ms的范围内,所以分析部104判断为在评价声音S100中存在对象声音S101,向警告声音输出部105输出检测信号S102(步骤203)。并且,在输入了检测信号S102的定时,警告声音输出部105向使用者提示警告声音S103。
此外,图7A~图7C表示在分析部104中评价声音S100是具有与对象声音S101相同的基本周期且不同于对象声音S101的声音的情况的一例。
图7A表示不同于摩托车声音的评价声音S100的一例。在该例子中,从当前时刻追溯来截取9ms的使用者的周边的声音来作为评价声音S100。在该例子中,评价声音S100由3个周期的不同于对象声音的声音构成,并且基本周期与对象声音S101相同为W=3ms。
图7B表示对象声音S101的一例。在该例子中,与图6B同样地将1个周期的摩托车声音作为对象声音S101,基本周期是3ms。
图7C中,示出将对象声音S101相对于评价声音S100进行时移时的差分值。在该例子中,与图6C同样地利用欧几里德距离作为差分值。在该例子中,评价声音S100是具有与对象声音S101相同的基本周期的声音,所以差分值的重复时间间隔与对象声音S101的基本周期一致而成为3ms。
在此,导入阈值S104。在该例子中,阈值S104在车辆检测系统100出厂之前存储在分析部104中,考虑对象声音的基本波形图形的摇摆宽度而设定为比由差分值的最小值的摇摆引起的变动的最大值稍大的值。该值与图6A~图6C的例子相同。在此,求出在阈值Θ以下的数学式21所示的差分值的重复时间间隔。在该例子中,评价声音是与对象声音不同的声音,所以差分值的最小值离开零而成为较大的值。因此,不存在阈值Θ以下的差分值的重复时间间隔。
在该情况下,由于不存在评价声音S100的基本周期、或者即使存在评价声音S100的基本周期也不在对象声音S101的基本周期S105的2.9ms~3.2ms的范围内,所以分析部104判断为在评价声音S100中不存在对象声音S101,不向警告声音输出部105输出检测信号S102(步骤S203)。因此,不输入检测信号S102,所以警告声音输出部105不向使用者提示警告声音。
并且,在评价声音S100是基本周期不同于对象声音S101的声音的情况下,在分析部104中,在评价声音S100的基本周期上不出现对象声音S101的基本周期S105,所以判断为在评价声音S100中不存在对象声音S101,警告声音S103不提示给使用者。
最后,到车辆检测系统100停止为止,重复这些从步骤201到步骤203的动作(步骤204)。
如上说明,根据本发明的第一实施方式,计算评价声音和对象声音的差分值,基于在预定阈值以下的差分值的重复间隔的周期和对象声音的基本周期,分析在评价声音中是否存在对象声音。因此,能够区分“具有与对象声音相同的基本周期且不同于对象声音的声音”和“对象声音”,分析在评价声音中是否包含对象声音。
并且,试着考虑不分析重复时间间隔的周期而仅用评价声音和对象声音的差分值来判断对象声音的存在的情况,来取代分析部104。即,差分值为零或接近于零时,判断为存在对象声音。图8A~图8C表示仅用差分值判断对象声音的存在的方法。图8A是评价声音,图8B是对象声音。在图8A的评价声音中,在时间的前半部分存在类似于对象声音的波形图形,在时间的后半部分存在具有与对象声音相同的基本周期3ms的杂音。并且,在评价声音中实际上不含有对象声音。在图8C中表示与第一实施方式同样地求出的差分值。时间的后半部分如上述实施方式中说明那样,不存在阈值以下的部分。即,可知在时间的后半部分不存在对象声音。另一方面,在时间的前半部分的评价声音中存在类似于对象声音的波形图形,所以存在差分值接近于零的部分。即,存在阈值以下的部分。在评价声音的波形图形和对象声音的波形图形的差分值是阈值以下的情况下认为在评价声音中存在对象声音的方法中,有可能错误地判断为在这次的评价声音中存在对象声音。另一方面,在第一实施方式中,不仅在评价声音的波形图形和对象声音的波形图形的差分值成为阈值以下的情况下,判断在阈值以下的差分值的时间间隔的周期是否与对象声音的基本周期大致相等,所以在图8C的情况下也可以判断为不存在对象声音。因此,通过判断在阈值以下的差分值的时间间隔的周期是否与对象声音的基本周期大致相等,从而即使在评价声音中存在与对象声音的波形图形类似的突发性的杂音等,也不会错误判断有无对象声音而能够准确地分析,在杂音下也能够检测有无对象声音。
(第一实施方式的第一变形例)
说明第一实施方式的第一变形例。图9是表示本发明的第一实施方式的第一变形例的对象声音分析装置的整体结构的框图。在此,除了图2所示的车辆检测系统100以外,追加了声音信息设定部700。在该变形例子中,使用者能够设定对象声音S101。
车辆检测系统200具备基本周期分析部201和警告声音输出部105。基本周期分析部201具备声音信息设定部700、对象声音准备部701、评价声音准备部103和分析部104。
在分析部104中存储有阈值S104。声音信息设定部700设定与对象声音有关的声音信息S700而向对象声音准备部701输出。对象声音准备部701基于声音信息S700准备对象声音S101,并且准备对象声音S101的基本周期S105,向分析部104输出对象声音S101和基本周期S105。评价声音准备部103输入评价声音S100而向分析部104输出。分析部104将对象声音S101相对于评价声音S100进行时移的同时,依次计算对应的时刻的评价声音S100和对象声音S101的差分值。分析部104基于在阈值S104以下的差分值的重复时间间隔的周期和对象声音S101的基本周期S105,分析在评价声音S100中是否存在对象声音S101。在评价声音S100中存在对象声音S101时,分析部104向警告声音输出部105输出检测信号S102。在输入了检测信号S102时,警告声音输出部105向使用者提示警告声音S103。
接着,说明如上那样构成的车辆检测系统200的动作。
图10是表示车辆检测系统200的动作顺序的其它流程图。
在该例子中,在车辆检测系统200出厂之前分析部104中存储有阈值S104。在该例子中,阈值S104设定为稍大于零的值、即0.2。
首先,声音信息设定部700利用麦克风取得声音信息S700、即摩托车声音并向对象声音准备部701输出(步骤800)。
接着,对象声音准备部701通过截取作为声音信息S700的摩托车声音的一部分来准备对象声音S101(步骤801)。并且,求出摩托车声音的基本周期作为基本周期S105。在该例子中,由于成为对象的声音仅是摩托车声音,具有与摩托车声音相同的基本周期且不包含其它声音,所以求出摩托车声音的基本周期的方法利用第一现有技术的方法。
接着,通过启动车辆检测系统200,评价声音准备部103利用麦克风,开始取得作为评价声音S100的使用者的周边的声音(步骤201)。
接着,分析在由使用者的周边的声音构成的评价声音S100中,是否包含有对象声音准备部102准备的对象声音S101、即摩托车声音的基本周期(步骤202)。
接着,判断是否提示警告声音,在存在对象声音时输出警告声音(步骤203)。
这里的步骤201、步骤202、步骤203与第一实施方式相同,所以省略说明。
最后,到车辆检测系统200停止为止,重复这些从步骤201到步骤203的动作(步骤204)。
如上说明,对象声音准备部701将声音信息设定单元输入的对象声音作为准备的对象声音,所以不需要事先存储成为对象声音的候补的多个声音,可减小存储容量。
并且,也可以在步骤800中输入包含摩托车声音的评价声音S100作为声音信息S700,在步骤801中从声音信息S700中截取摩托车声音的部分来准备对象声音S101。这时,即使在存在对象声音以外的声音的情况下,也可以准备对象声音S101。
(其它例子)
说明声音信息设定部700和对象声音准备部701的其它例子。
图10是表示车辆检测系统200的动作顺序的其它流程图。
在该例子中,在车辆检测系统200出厂之前,在对象声音准备部701中作为对象声音的候补而存储有摩托车声音、汽车的发动机声音和警报声音。并且,在对象声音准备部701中存储有与每个对象声音的候补对应的基本周期。并且,在分析部104中存储有阈值S104。
图11表示汽车的发动机声音的一例。并且,图12表示紧急车辆的警报声音的一例。由此可知汽车的发动机声音和警报声音是周期性的声音。
图13表示对象声音的候补的一例。在该例子中,对象声音准备部701作为对象声音的候补而存储有“摩托车声音”、“汽车的发动机声音”、“警报声音”这3种对象声音。并且,存储有与每个对象声音的候补对应的基本周期。
首先,声音信息设定部700向使用者提示对象声音的候补。图14A及图14B中示出提示对象声音的候补的方法的一例。在该例子中,在图14A所示的触摸屏上显示对象声音的名称(摩托车、汽车、警报器)和对象声音的波形图形。使用者使用触摸屏来选择对象声音,从而做成声音信息S700、即选择信号。在该例子中,如图14B所示,摩托车声音被选择而在显示器上“摩托车”的周围的颜色反转。这时,从扬声器输出选择的摩托车声音的声音。由此,使用者可以确认选择的对象声音(步骤800)。
接着,对象声音准备部701将与作为声音信息S700的选择信号对应的对象声音作为对象声音S101(步骤801)。此外,将对应于选择信号的对象声音S101的基本周期作为基本周期S105。在该例子中,对象声音S101是摩托车声音,基本周期S105是作为摩托车声音的基本周期的2.9ms~3.2ms。
接着,通过启动车辆检测系统100,评价声音准备部103利用麦克风开始取得作为评价声音S100的使用者的周边的声音(步骤S102)。
接着,分析在由使用者的周边的声音构成的评价声音S100中是否存在对象声音准备部102准备的对象声音S101、即摩托车声音的基本周期(步骤202)。
接着,判断是否提示警告声音,当存在对象声音时输出警告声音(步骤203)。
这里的步骤201、步骤202、步骤203与第一实施方式相同,所以省略说明。
最后,到车辆检测系统200停止为止,重复这些从步骤201到步骤203的动作(步骤204)。
如以上说明,可以利用对象声音准备部701存储的对象声音的候补来准备对象声音,所以不需要输入对象声音。由此,即使在不能输入对象声音的情况下,也能够分析对象声音。例如,在噪声下分析是否存在摩托车声音的情况下,在噪声下不能收集安静的环境下的摩托车声音,但是,通过使用对象声音准备部701存储的安静的环境下的摩托车声音,从而能够分析是否存在摩托车声音。并且,能够省略输入对象声音的时间,所以能够进行实时处理。
如上说明,根据本发明第一实施方式的第一变形例,对象声音准备部701基于声音信息设定部700设定的声音信息,准备对象声音,所以能够控制对象声音准备部701准备的对象声音。由此,使用者能够利用声音信息设定部700设定对象声音。
(第一实施方式的第二变形例)
对第一实施方式的第二变形例进行说明。图15是表示本发明的第一实施方式的第二变形例的对象声音分析装置的整体结构的框图。在此,除了图9所示的车辆检测系统200以外,追加了阈值设定部1100。阈值设定部1100是如下的阈值设定单元的一个例子:将对象声音相对于多个评价声音的每一个进行时移的同时,依次计算对应的时刻的评价声音和对象声音的差分值,计算上述差分值的最小值,基于与上述多个评价声音对应的多个上述最小值中的最大值,设定预定阈值。
车辆检测系统300具备基本周期分析部301、警告声音输出部105。
基本周期分析部301具备阈值设定部1100、声音信息设定部700、对象声音准备部701、评价声音准备部103和分析部104。
对阈值设定部1100基于对象声音准备部701准备的对象声音来设定阈值的方法进行说明。在该例子中,阈值设定部1100利用图15中的“选择信号S1100A”设定阈值S104。并且,不使用图15中的“阈值信息S1100B”和“声音信息S1100C”。
在该例子中,车辆检测系统出厂之前,在对象声音准备部701中作为对象声音的候补而存储有“摩托车声音”、“汽车的发动机声音”和“警报声音”。此外,在对象声音准备部701中存储有与每个对象声音的候补对应的基本周期。此外,在阈值设定部1100中存储有与对象声音准备部701存储的每个对象声音的候补对应的阈值。在此,存储有“摩托车声音的阈值”、“汽车的发动机声音的阈值”和“警报声音的阈值”。这些阈值对于每个对象声音的候补考虑这些基本波形图形的摇摆宽度而设定为比由差分值的最小值的摇摆引起的变动的最大值稍大的值。
图16A~图16E中表示阈值的设定方法。图16A中示出3个周期的摩托车声音A的基本波形图形。此外,图16B中示出摩托车声音B的基本波形图形。此外,图16C中示出摩托车声音C的基本波形图形。摩托车声音A、摩托车声音B、摩托车声音C的基本波形图形由于运行状态的影响而产生摇摆。图16D中示出与第一实施方式同样地求出的摩托车声音A(对应于评价声音)和摩托车声音B(对应于对象声音)的差分值。此外,在图16E中示出与第一实施方式同样地求出的摩托车声音A(对应于评价声音)和摩托车声音C(对应于对象声音)的差分值。根据图16D及图16E,由于摩托车声音A、摩托车声音B及摩托车声音C的波形图形稍微不同,所以差分值的最小值成为稍大于零的值。在此,摩托车声音B和摩托车声音C都是作为对象声音的摩托车声音,所以将比对摩托车声音A和摩托车声音B的差分值的最小值与摩托车声音A和摩托车声音C的差分值进行比较时的较大的值稍大的值设为阈值Θ。在该例子中,摩托车声音A和摩托车声音C的差分值的最小值比摩托车声音A和摩托车声音B的差分值的最小值大,所以将阈值设定为比摩托车声音A和摩托车声音C的差分值的最小值稍大的值。
声音信息设定部700设定与对象声音有关的声音信息S700向对象声音准备部701输出。对象声音准备部701基于声音信息S700准备对象声音S101,并且准备对象声音S101的基本周期S105,向分析部104输出对象声音S101和基本周期S105。阈值设定部1100基于对象声音准备部701准备的对象声音S101设定阈值S104。评价声音准备部103输入评价声音S100而向分析部104输出。分析部104将对象声音S101相对于评价声音S100进行时移的同时,依次计算对应的时刻的评价声音S100和对象声音S101的差分值。分析部104基于在阈值以下的差分值的重复时间间隔的周期和对象声音S101的基本周期S105,分析在评价声音S100中是否存在对象声音S101。在评价声音S100中存在对象声音S101的情况下,分析部104向警告声音输出部105输出检测信号S102。在输入了检测信号S102时,警告声音输出部105向使用者提示警告声音S103。
接着,对如上那样构成的车辆检测系统300的动作进行说明。
图17是表示车辆检测系统300的动作顺序的流程图。
在该例子中,声音信息设定部700提示对象声音的候补而使使用者选择对象声音,做成选择信号(步骤800)。在该例子中选择摩托车声音。
接着,对象声音准备部701将与作为声音信息S700的选择信号S1100A对应的对象声音作为对象声音S101(步骤801)。在该例子中摩托车声音成为对象声音S101。并且,将对应于选择信号S1100A的对象声音S101的基本周期作为基本周期S105。在该例子中,基本周期S105是作为摩托车声音的基本周期的2.9ms~3.2ms。
这里的步骤800、步骤801与第一实施方式的第一变形例的其它例子相同,所以省略说明。
接着,阈值设定部1100根据阈值设定部1100存储的阈值,将与对象声音准备部701准备的对象声音S101对应的阈值设定为阈值S104。在该例子中,摩托车声音被选择为对象声音,所以对应于摩托车声音的阈值成为阈值S104(步骤1200)。
接着,通过启动车辆检测系统300,评价声音准备部103利用麦克风开始取得作为评价声音S100的使用者的周边的声音(步骤201)。
接着,分析在由使用者的周边的声音构成的评价声音S100中是否包含有对象声音准备部102准备的对象声音S101、即摩托车声音的基本周期(步骤202)。
接着,判断是否提示警告声音,在存在对象声音时输出警告声音(步骤203)。
这里的步骤201、步骤202、步骤203与第一实施方式相同,所以省略说明。
最后,到车辆检测系统300停止为止,重复这些从步骤201到步骤203的动作(步骤204)。
如上说明那样,分析部104能够利用对应于对象声音的阈值来分析基本周期,所以能够切换用于判断是否存在的对象声音。
(另一其它例子)
对使用者利用阈值设定部1100设定阈值的方法进行说明。在该例子中,阈值设定部1100利用图15中的“阈值信息S1100B”来设定阈值S104。并且,不使用图15中的“选择信号S1100A”和“声音信息S1100C”。
在该例子中,车辆检测系统300出厂之前,在对象声音准备部701中作为对象声音的候补而存储有“摩托车声音”、“汽车的发动机声音”和“警报声音”。此外,在对象声音准备部701中存储有与每个对象声音的候补对应的基本周期。此外,在分析部104中存储有阈值S104。考虑该对象声音的候补的所有声音的基本波形图形的摇摆宽度而设定为比由差分值的最小值的摇摆引起的变动的最大值稍大的值。
声音信息设定部700设定与对象声音有关的声音信息S700向对象声音准备部701输出。对象声音准备部701基于声音信息S700准备对象声音S101,并且准备对象声音S101的基本周期S105,向分析部104输出对象声音S101和基本周期S105。阈值设定部1100基于使用者输入的阈值信息S1100B设定阈值S104。评价声音准备部103输入评价声音S100而向分析部104输出。分析部104将对象声音S101相对于评价声音S100进行时移的同时,依次计算对应的时刻的评价声音S100和对象声音S101的差分值。分析部104基于在阈值S104以下的差分值的重复时间间隔的周期和对象声音S101的基本周期,判断在评价声音S100中是否存在对象声音S101。在判断为存在对象声音S101的情况下,分析部104向警告声音输出部105输出检测信号S102。在输入了检测信号S102时,警告声音输出部105向使用者提示警告声音S103。
接着,对如上那样构成的车辆检测系统300的动作进行说明。
图17是表示车辆检测系统300的动作顺序的流程图。
首先,声音信息设定部700提示对象声音的候补而使使用者选择对象声音,做成选择信号(步骤800)。在该例子中选择摩托车声音。
接着,对象声音准备部701将与作为声音信息S700的选择信号对应的对象声音作为对象声音S101(步骤801)。在该例子中摩托车声音成为对象声音S101。
这里的步骤800、步骤801与第一实施方式的第一变形例的其它例子相同,所以省略说明。
接着,阈值设定部1100将使用者输入的阈值信息S1100B、即阈值的值作为阈值S104(步骤1200)。并且,作为其它方法,也可以根据作为使用者输入的阈值信息S1100B的阈值的增减量来调节分析部104存储的阈值而作为阈值S104。
图18A及图18B表示使用者输入阈值信息的方法的一例。图18A示出使用者输入阈值的值的方法。使用者通过“钮”来输入阈值的值。这时,在显示器上显示代表性的对象声音彼此的差分值和设定中的阈值。即,通过将钮向左右移动,设定中的阈值变化的同时,画面上的阈值线也上下移动。由此,使用者可以直观地容易设定阈值的值。图18B中示出输入与存储着的阈值间的阈值的增减量的方法。使用者通过钮输入阈值的增减量。这时,若存储的阈值是Θ0,阈值的增减量是ΔΘ,则阈值S104成为Θ0+ΔΘ。并且,能够根据显示于显示器上的值确认阈值的增减量和阈值的值。
接着,通过启动车辆检测系统300,评价声音准备部103利用麦克风开始取得作为评价声音S100的使用者的周边的声音(步骤201)。
接着,分析在由使用者的周边的声音构成的评价声音S100中是否包含有对象声音准备部102准备的对象声音S101、即摩托车声音(步骤202)。
接着,判断是否提示警告声音,在存在对象声音时输出警告声音(步骤203)。
这里的步骤201、步骤202、步骤203与第一实施方式相同,所以省略说明。
最后,到车辆检测系统300停止为止,重复这些从步骤201到步骤203的动作(步骤204)。
如上说明,使用者能够利用阈值设定部1100对对象声音设定适当的阈值。由此,能够减少分析错误。
(再一其它例子)
对阈值设定部1100基于对象声音准备部701准备的对象声音S101的基本波形图形的摇摆宽度来设定阈值的方法进行说明。在该例子中,阈值设定部1100利用图15中的“阈值信息S1100C”来设定阈值S104。并且,不使用图15中的“选择信号S1100A”和“阈值信息S1100B”。
声音信息设定部700将包含与对象声音有关的声音信息S700、即对象声音的声音,向对象声音准备部701输出。对象声音准备部701基于声音信息S700准备对象声音S101,并且准备对象声音S101的基本周期S105,向分析部104输出对象声音S101和基本周期S105。阈值设定部1100基于对象声音准备部701准备的对象声音S101的基本波形图形的摇摆宽度来设定阈值。评价声音准备部103输入评价声音S100而向分析部104输出。分析部104将对象声音S101相对于评价声音S100进行时移的同时,依次计算对应的时刻的评价声音S100和对象声音S101的差分值。分析部104基于在阈值S104以下的差分值的重复时间间隔的周期和对象声音S101的基本周期S105,分析在评价声音S100中是否存在对象声音S101。在评价声音S100中存在对象声音S101的情况下,分析部104向警告声音输出部105输出检测信号S102。在输入了检测信号S102时,警告声音输出部105向使用者提示警告声音S103。
接着,对如上那样构成的车辆检测系统300的动作进行说明。
图17是表示车辆检测系统300的动作顺序的流程图。
首先,声音信息设定部700利用麦克风取得作为声音信息S700的摩托车声音,向对象声音准备部701输出(步骤800)。
接着,对象声音准备部701通过截取作为声音信息S700的摩托车声音的一部分,准备对象声音S101(步骤801)。并且,求出摩托车声音的基本周期作为基本周期S105。在该例子中,由于作为对象的声音仅是摩托车声音且不包含具有与摩托车声音相同的基本周期的其它声音,所以求出摩托车声音的基本周期的方法利用第一现有技术的方法。
这里的步骤800、步骤801与第一实施方式的第一变形例的其它例子相同,所以省略说明。
接着,阈值设定部1100作为对象声音S1100C,将声音信息S700、即摩托车声音输入为声音信息S1100C,考虑摩托车声音的基本波形图形的摇摆宽度,将阈值S104设定为比由差分值的最小值的摇摆引起的变动的最大值稍大的值(步骤1200)。即,考虑对象声音S101的基本波形图形的摇摆宽度而设定阈值S104。在该例子中,用与图16A~图16E所示的方法相同的方法设定阈值S104。
接着,通过启动车辆检测系统300,评价声音准备部103利用麦克风开始取得作为评价声音S100的使用者的周边的声音(步骤201)。
接着,分析在由使用者的周边的声音构成的评价声音S100中是否包含有对象声音准备部102中存储的对象声音S101、即摩托车声音的基本周期(步骤202)。
接着,判断是否提示警告声音,在存在对象声音时输出警告声音(步骤203)。
这里的步骤201、步骤202、步骤203与第一实施方式相同,所以省略说明。
最后,到车辆检测系统300停止为止,重复这些从步骤201到步骤203的动作(步骤204)。
如以上说明那样,阈值设定部1100能够自动地求出适合对象声音的阈值,所以不需要事先准备阈值。由此,在追加了分析的对象声音时,利用不需要对追加的对象声音设定阈值,所以使用方便性较好。
如上说明那样,根据本发明的第一实施方式的第二变形例,能够利用阈值设定部1100控制分析部104使用的阈值,所以能够对多个对象声音设定适当的阈值,可对多个对象声音的每一个分析是否存在该对象声音。并且,通过适当地控制阈值,能够减少是否存在对象声音的分析错误。
在此,对通过分析部分析是否存在对象声音的其它方法进行补充。在该例子中描述,截取评价声音的一部分作为对象声音,并通过求出评价声音的基本周期来分析是否存在对象声音的方法。在该例子中,对象声音的基本周期未存储在基本周期分析部中。
图19A~图19C中示出该例子的基本周期的分析方法。图19A中示出评价声音,基本周期由相同的2种声音构成。图19B中示出从评价声音中截取的对象声音的一例。图19B(a)是截取图19A的A部分做成的对象声音A,图19B(b)是截取图19A的B部分做成的对象声音B。它们是不同种类的声音的1个周期的波形图形。
在此,与第一实施方式同样地求出评价声音和对象声音A的差分值。并且,与第一实施方式同样地求出评价声音和对象声音B的差分值。将求出的差分值示于图19C。图19C(a)是使用对象声音A时的差分值。并且,图19C(b)是使用对象声音B时的差分值。根据图19C(a),由于仅在包含有对象声音A的时间出现基本周期,所以能够分析为在该时间存在对象声音A而对象声音A的基本周期是W。同时,通过图19C(b),由于仅在包含有对象声音B的时间出现基本周期,所以能够分析为在该时间存在对象声音B而对象声音B的基本周期是W。若合成这2个结果,可知在评价声音中包含2种声音且它们的基本周期是W。并且,还可以得知2种声音切换的时刻。
(第二实施方式)
图20是表示本发明的第二实施方式的对象声音分析装置的整体结构的框图。在此,示出本发明的对象声音分析装置组装在助听系统中的一例。在本实施方式中,通过分析声音的基本周期,以3名说话人同时发出声音的混合声音中提取特定的说话人的声音的情况为例进行说明。在该例子中,说明对每个频带分析对象声音的基本周期并判断存在对象声音的方法。
图21A及图21B中分别示出A君的声音的波形图形及混合了包括A君的3人的声音的混合声音的波形图形。根据图21A可知A君的声音是周期性的声音。并且,A君以外的人的声音也是周期性的声音。在该例子中,说明从图21B所示的混合了3人的声音的混合声音中提取图21A所示的A君的声音并向使用者仅提供A君的声音的情况。
助听系统1700具备基本周期分析部1701和声音提取部1705。基本周期分析部具备对象声音准备部1702、评价声音准备部1703及分析部1704。
在对象声音准备部1702中存储有对对象声音进行频率分析得到的每个频带的对象声音频率图形S1702和对象声音的基本周期S1706。在分析部1704中存储有阈值S1705。对象声音准备部1702向分析部1704输出对象声音频率图形S1702和基本周期S1706。评价声音准备部1703输入评价声音S1700,对评价声音S1700进行频率分析,将每个频带的评价声音频率图形S1701输出到分析部1704。分析部1704对每个频带,将对象声音频率图形S1702相对于评价声音频率图形S1701进行时移的同时,依次计算对应的时刻的评价声音频率图形S1701和对象声音频率图形S1702的差分值。分析部1704基于在阈值S1705以下的差分值的重复时间间隔的周期和对象声音的基本周期S1706,向声音提取部1705输出与在评价声音1700中存在对象声音的时间-频率区域有关的信息、即区域信息S1703。声音提取部1705利用区域信息S1703和评价声音频率图形S1701提取对象声音向使用者提示。
对象声音准备部1702是准备通过对对象声音进行频率分析而得到的对象声音频率图形的对象声音准备单元的一例。
评价声音备部1703是准备通过对评价声音进行频率分析而得到的评价声音频率图形的评价声音准备单元的一例。
分析部1704是如下分析单元的一例:将上述对象声音频率图形相对于上述评价声音频率图形进行时移的同时,依次计算对应的时刻的上述评价声音频率图形和上述对象声音频率图形的差分值,计算上述差分值成为预定阈值以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音的基本周期,来判断在上述评价声音中是否存在上述对象声音。
接着,说明如上那样构成的助听系统1700的动作。
图22是表示助听系统1700的动作顺序的流程图。
在该例子中,在助听系统出厂之前,在对象声音准备部1702中存储有对A君的声音进行频率分析而得到的每个频带的频率图形作为对象声音频率图形S1702(步骤1800),进而存储有作为对象声音的A君的声音的基本周期S1706。并且,在分析部1704中对每个频带存储有阈值S1705。在该例子中,作为对象声音的A君的声音的基本周期S1706是3ms~12ms。并且,这里的对象声音频率图形通过对第一实施方式的对象声音进行离散傅立叶变换来得到。但是,在该例子中,对象声音不是摩托车声音,而是A君的声音。
图23表示求出对象声音频率图形S1702的方法的概念图。将某个时刻的对象声音频率图形S1702表现为
(数学式22)
XT k = Σ n = 1 N BT ( t + n ) × e - j 2 πkn N (k=1,2,...N)
其中,N是傅立叶变换的窗口长度,设为比对象声音的长度W短。其中,k是分析的频带的索引。并且,
(数学式23)
BT(n)(n=1,2,...N)
是对象声音,
(数学式24)
e - j 2 πkn N = cos ( 2 πkn N ) - j sin ( 2 πkn N )
是分析波形图形。
因此,对象声音频率图形S1702可表现为
(数学式25)
XT k ( t ) = Σ n = 1 N BT ( t + n ) × e - j 2 πkn N (k=1,2,...N)  (t=0,1,...W-N)
其中t是分析的对象声音的开端的时刻。对象声音频率图形表现对象声音的频率的时间结构。在该例子中,将t错开1个点(point)的同时计算对象声音频率图形。
首先,通过启动助听系统1700,评价声音准备部1703利用麦克风开始取入作为评价声音S1700的使用者的周边的声音、即3人的声音的混合声音。在该例子中,以包含多个A君的声音的基本周期的30ms的间隔取入评价声音。即,每30ms区分混合声音的同时输入,分析A君的基本周期。并且,对评价声音S1700进行频率分析,做成每个频带的评价声音频率图形S1701(步骤1801)。做成评价声音频率图形的方法与做成对象声音频率图形的方法相同,将对象声音置换为评价声音S1700进行计算。将某个时刻的评价声音频率图形表示为
(数学式26)
XH k = Σ n = 1 N BH ( t + n ) × e - j 2 πkn N (k=1,2,...N)
其中,N是傅立叶变换的窗口长度,设为比评价声音S1700的长度L短。其中,k是分析的频带的索引。并且,
(数学式27)
BH(n)(n=1,2,...N)
是评价声音。
并且,评价声音频率图形S1701可表现为
(数学式28)
XH k ( t ) = Σ n = 1 N BH ( t + n ) × e - j 2 πkn N (k=1,2,...N)(t=0,1,...L-N)
接着,分析在由3人的声音的混合声音构成的评价声音S1700中,是否包含有对象声音准备部1702中存储的对象声音、即A君的声音的基本周期(步骤1802)。具体地,在分析部1704中,对每个频带将对象声音频率图形S1702相对于评价声音频率图形S1701进行时移的同时,依次计算对应的时刻的评价声音频率图形S1701和对象声音频率图形S1702的差分值。分析部1704基于在阈值S1705以下的差分值的重复时间间隔来分析对象声音的基本周期。并且,分析部1704利用基本周期S1706向声音提取部1705输出在评价声音S1700中对象声音存在时间-频率区域有关的信息、即区域信息S1703。
图24A~图24C表示分析部1704中的分析对象声音的基本周期的方法的一例。在该例子中,示出频带k的评价声音频率图形是对象声音(对象声音频率图形)的情况。在该例子中,对每个频带求出差分值。
图24A中示出频带k的评价声音频率图形的一例。在该例子中从当前时刻追溯而截取30ms的混合声音的频率图形来作为评价声音频率图形XHk(t)。在该例子中,评价声音频率图形由5个周期的对象声音的A君的声音构成。
图24B示出频带k的对象声音频率图形的一例。在该例子中,将2个周期的A君的声音的频率图形作为对象声音频率图形XTk(t)。
图24C是示出在频带k中,将对象声音频率图形S1702相对于评价声音频率图形S1701进行时移时的差分值。在该例子中,使用欧几里德距离作为差分值。其中,将差分值表现为
(数学式29)
E k ( m ) = Σ t = 0 t = W - N ( XH k ( m + t ) - XT k ( t ) ) 2 (k=1,2,...N)  (m=0,1,...L-W-N)
其中,m是将时间离散化的值,对应于求出差分值的评价声音频率图形S1701的开端的时刻。该差分值是将时间宽度(W-N)中的评价声音频率图形和对象声音频率图形的差分进行总计的值。在该例子中,评价声音频率图形是对象声音频率图形,所以差分值的重复时间间隔与对象声音的基本周期S1706(3ms~12ms)一致。在该例子中是6ms。
在此,导入阈值S1705。在此,将频带k中的阈值S1705表示为Θk。在该例子中,阈值S1705在助听系统出厂之前存储在分析部1704中,考虑对象声音频率图形的基本波形图形的摇摆宽度而设定为比由差分值的最小值的摇摆引起的变动的最大值稍大的值。
在图24C中示出频带k中的对象声音的基本周期的分析方法。在该例子中求出在阈值Θ k以下的数学式29所示的差分值的重复时间间隔。在该例子中,评价声音频率图形是对象声音频率图形,所以差分值的最小值成为非常接近零的值。因此,在阈值Θk以下的差分值的重复时间间隔与不考虑阈值的差分值的重复时间间隔一致。由此,评价声音频率图形S1701的基本周期成为6ms。
接着,评价声音频率图形的基本周期是6ms,是作为对象声音的基本周期S1706的3ms~12ms的范围内,所以判断为在评价声音频率图形S1701中存在对象声音,做成称为“在频带k中存在对象声音”的区域信息S1703。
此外,在图25A~图25C中表示,在分析部1704中,评价声音频率图形不同于对象声音(对象声音频率图形)且具有与对象声音相同的基本周期的声音的频率图形的情况的一例。
在图25A中示出频带k的评价声音频率图形的一例。在该例子中,从当前时刻追溯而截取30ms的混合声音的频率图形而作为评价声音频率图形XHk(t)。在该例子中,评价声音频率图形由5个周期的不同于对象声音的B君的声音构成,基本周期与对象声音相同,是6ms。
图25B中示出频带k的对象声音频率图形的一例。在该例子中,与图24B同样地将2个周期的A君的声音的频率图形作为对象声音频率图形XTk(t),基本周期是6ms。
在图25C中示出将对象声音频率图形S1702相对于频带k的评价声音频率图形S1701进行时移时的差分值。在该例子中,与图24C同样地,使用欧几里德距离作为差分值。在该例子中,评价声音频率图形是具有与对象声音(对象声音频率图形)相同的基本周期的声音,所以差分值的重复时间间隔与对象声音的基本周期一致而成为6ms。
在此,导入阈值S1705。在该例子中,阈值S1705在助听系统出厂之前存储在分析部1704中,考虑对象声音频率图形的基本波形图形的摇摆宽度而设定为比由差分值的最小值的摇摆引起的变动的最大值稍大的值。该值与图24C的例子相同。
在图25C中示出频带k中的、对象声音的基本周期的分析方法。在该例子中,求出在阈值Θk以下的数学式29所示的差分值的重复时间间隔。在该例子中,评价声音频率图形是不同于对象声音(对象声音频率图形)的声音,所以差分值的最小值离开零而成为较大的值。因此,不存在阈值Θk以下的差分值的重复时间间隔。
接着,评价声音频率图形的基本周期不存在,不是作为对象声音的基本周期S1706的3ms~12ms的范围内,所以判断为在评价声音频率图形S1701中不存在对象声音,做成称为“在频带k中不存在对象声音”的区域信息S1703。
并且,频带k的评价声音频率图形是基本周期不同于对象声音的声音的情况下,在分析部1704中,频带k的评价声音频率图形S1701的基本周期中不出现对象声音的基本周期S1706,所以判断为在评价声音频率图形S1701中不存在对象声音而做成“在频带k中不存在对象声音”那样的区域信息S1703。
对所有频带k(k=1,2,…,N)进行这些处理,做成最终的区域信息S1703。
接着,声音提取部1705利用区域信息S1703和评价声音频率图形1701,提取对象声音而向使用者提示(步骤1803)。
在该例子中,在评价声音频率图形S1701中,将区域信息S1703中记载为“频带k中不存在对象声音”的时间-频率区域的频率图形置换为零的值,记载为“在频带k中存在对象声音”的时间-频率区域的频率图形使用评价声音频率图形S1701,做成提取声音频率图形。并且,通过对提取声音的频率图形进行逆傅立叶变换,从而做成提取声音S1704,利用扬声器向使用者提示。
最后,到助听系统1700停止为止,重复这些从步骤1801到步骤1803的动作(步骤1804)。
如以上说明那样,根据本发明的第二实施方式,计算评价声音频率图形和对象声音频率图形的差分值,基于在预定阈值以下的差分值的重复间隔来分析基本周期,所以能够将不同于对象声音且具有与对象声音相同的基本周期的声音和对象声音进行区分来分析基本周期。在此,使用对评价声音和对象声音进行频率分析的评价声音频率图形和对象声音频率图形,所以能够对每个频带分析基本周期。例如,对每个频带,从混合声音的频率图形中提取对象声音的频率图形,从而能够实现混合声音分离。由此,能够判断在评价声音中是否包含有对象声音。
(第二实施方式的变形例)
对第二实施方式的变形例进行说明。图26是表示本发明的第二实施方式的变形例的对象声音分析装置的整体结构的框图。在此,除了图20所示的助听系统1700以外,追加了声音信息设定部2300.
助听系统1800具备基本周期分析部1801和声音提取部1705。基本周期分析部1801具备声音信息设定部2300、对象声音准备部2301、评价声音准备部1703和分析部1704。
在分析部1704中存储有阈值S1705。声音信息设定部2300设定与对象声音有关的声音信息S2300而向对象声音准备部2301输出。对象声音准备部2301基于声音信息S2300准备对象声音频率图形S1702,并且准备对象声音的基本周期S1706,向分析部1704输出对象声音频率图形S1702和基本周期S1706。评价声音准备部1703输入评价声音S1700,对评价声音S1700进行频率分析,向分析部1704输出每个频带的评价声音频率图形S1701。分析部1704对于每个频带将对象声音频率图形S1702相对于评价声音频率图形S1701进行时移,依次计算对应的时刻的评价声音频率图形S1701和对象声音频率图形S1702的差分值。分析部1704基于在阈值S1705以下的差分值的重复时间间隔的周期和对象声音的基本周期S1706,将在评价声音S1700中对象声音存在的时间-频率区域有关的信息、即区域信息S1703向声音提取部1705输出。声音提取部1705利用区域信息S1703和评价声音频率图形S1701提取对象声音向使用者提示。
接着,说明如上那样构成的助听系统1800的动作。
图27是表示助听系统1800的动作顺序的其它流程图。
在该例子中,在助听系统1800出厂之前,在分析部1704中存储有阈值S1705。在该例子中,阈值S1705设定为稍大于零的值、即0.5。
首先,声音信息设定部2300利用麦克风取得声音信息S2300、即A君的声音并向对象声音准备部2301输出(步骤2400)。
接着,对象声音准备部2301通过截取作为声音信息S2300的A君的声音的一部分并进行频率分析,准备对象声音频率图形S1702(步骤2401)。在该例子中,与第二实施方式同样地进行逆傅立叶变换而做成对象声音频率图形。并且,求出A君的声音的基本周期作为基本周期S1706。在该例子中,由于成为对象的声音仅是A君的声音,不含基本周期与A君的声音相同的其它声音,所以求出A君的声音的基本周期的方法利用第一现有技术。
接着,通过启动助听系统1800,评价声音准备部1703利用麦克风,开始取得作为评价声音S1700的使用者的周边的声音、即3人的声音的混合声音。并且,对评价声音S1700进行频率分析,做成每个频带的评价声音频率图形S1701(步骤1801)。
接着,分析在由3人的声音的混合声音构成的评价声音频率图形S1701中,是否包含有对象声音准备部2301准备的对象声音频率图形S1702、即A君的声音的基本周期,做成区域信息1703(步骤1802)。
接着,声音提取部1705利用区域信息S1703和评价声音频率图形S1701提取对象声音,向使用者提示(步骤1803)。
这里的步骤1801、步骤1802、步骤1803与第二实施方式相同,所以省略说明。
最后,到助听系统1800停止为止,重复这些从步骤1801到步骤1803的动作(步骤1804)。
如上说明,对象声音准备部2301将声音信息设定部2300输入的对象声音作为准备的对象声音,所以对象声音准备部2301不需要事先存储成为对象声音的候补的多个声音,可减小存储容量。
(其它例子)
说明声音信息设定部2300和对象声音准备部2301的其它例子。
图27是表示助听系统1800的动作顺序的其它流程图。
在该例子中,在助听系统1800出厂之前,在对象声音准备部2301中作为对象声音频率图形的候补而存储有A君的声音的频率图形、B君的声音的频率图形和C君的声音的频率图形。并且,在对象声音准备部2301中存储有与每个对象声音(对象声音频率图形)的候补对应的基本周期。并且,在分析部1704中存储有阈值S1705。
首先,声音信息设定部2300向使用者提示对象声音的候补。在此,选择A君的声音而做成称为“A君的声音”的选择信号(步骤2400)。
接着,对象声音准备部2301将与作为声音信息S2300的选择信号对应的对象声音频率图形作为对象声音频率图形S1702(步骤2401)。在该例子中,A君的声音的频率图形是对象声音频率图形S1702,并且,将对应于选择信号的对象声音的基本周期作为基本周期S1706。在该例子中,基本周期S1706是A君的声音的基本周期、即3ms~12ms。
接着,通过启动助听系统1800,评价声音准备部1703利用麦克风,开始取得作为评价声音S1700的使用者的周边的声音、即3人的声音的混合声音。并且,对评价声音S1700进行频率分析,做成每个频带的评价声音频率图形S1701(步骤1801)。
接着,分析在由3人的声音的混合声音构成的评价声音频率图形S1701中,是否包含有对象声音准备部2301准备的对象声音频率图形S1702、即A君的声音的基本周期,做成区域信息1703(步骤1802)。
接着,声音提取部1705利用区域信息S1703和评价声音频率图形S1701提取对象声音,向使用者提示(步骤1803)。
这里的步骤1801、步骤1802、步骤1803与第二实施方式相同,所以省略说明。
最后,到助听系统1800停止为止,重复这些从步骤1801到步骤1803的动作(步骤1804)。
如上说明,能够利用对象声音准备部2301存储的对象声音频率图形的候补来准备对象声音频率图形,所以不需输入对象声音并进行频率分析而做成对象声音频率图形。由此,在不能输入对象声音的情况下,也能够分析对象声音的有无。例如,在分析噪声下的A君的声音的基本周期的情况下,在噪声下不能收集安静的环镜下的A君的声音,所以利用对对象声音准备部2301存储的安静的环镜下的A君的声音进行频率分析而做成的对象声音频率图形,从而可以分析有无A君的声音。并且,能够省略输入对象声音的时间或对输入的对象声音进行频率分析的时间,所以能够进行实时处理。
并且,与第一实施方式的第二变形例同样,也可以追加阈值设定部而控制分析部1704使用的阈值。由此,能够对多个对象声音设定适当的阈值,能够相对于多个对象声音分析基本周期。并且,通过适当地控制阈值,能够减少基本周期的分析错误。并且,在第一实施方式的第二变形例中,对每个对象声音设定了阈值,但也可以进一步对每个频带设定阈值。由此,能够进一步减少分析错误。
(另一其它例子)
更好是,对象声音准备部2301准备对象声音频率图形,该对象声音频率图形包含通过对象声音和由预定的频率成分构成的非周期性的分析波形图形间的互相关计算出的振幅频谱及相位频谱的至少一个,评价声音准备部1703准备包含通过评价声音和上述分析波形图形间的互相关而计算出的振幅频谱及相位频谱的至少一个的评价声音频率图形。
图28表示非周期性的分析波形图形的一例。在该例子中,将1.5个周期的余弦波形的图形和正弦波形的图形作为分析波形图形。具体地,将第二实施方式中的取数学式22和数学式26的右边的总和的n范围,按每个分析的频带k设定为数学式24的余弦波形图形和正弦波形图形成为1.5个周期,求出频率图形。具体地,将数学式25和数学式28的右边的总和的N的值对每个频带k调节为1.5个周期,求出频率图形。
由此,利用由非周期性分析波形图形做成的对象声音频率图形及评价声音频率图形来分析对象声音的基本周期,所以出现对象声音及评价声音的周期性的特征,所以能够分析对象声音的基本周期。例如,在比对象声音的基本周期还要高的频带的对象声音频率图形中,也出现对象声音的基本周期,所以即使在与对象声音的基本周期对应的频带上附加杂音,也能够分析基本周期。并且,在所有频带中,在对象声音频率图形中出现对象声音的基本周期,所以能够对每个频带分析基本周期。由此,能够判断在评价声音中是否包含有对象声音。
(再一其它例子)
更好是,对象声音准备部2301准备对象声音频率图形,该对象声音频率图形包含通过对象声音和构成由预定的频率成分构成的分析波形图形的一部分并具有预定的时间分辨率的多个局部分析波形图形的各个互相关而计算出的振幅频谱及相位频谱的至少一个。评价声音准备部1701准备评价声音频率图形,该评价声音频率图形包含通过评价声音和上述多个局部分析波形图形的各个互相关而计算出的振幅频谱及相位频谱的至少一个。分析部1704将使用上述多个局部分析波形图形准备的对象声音频率图形和使用上述多个局部分析波形图形准备的评价声音频率图形,各作为一组数据来使用,分析对象声音的基本周期,判断有无对象声音。
图29表示对象声音频率图形及评价声音频率图形的做成方法的一例。
图29(a)中示出由3个周期的余弦波形图形构成的分析波形图形。将该分析波形图形重叠在评价声音或对象声音上做成了频率图形时,用3个周期的余弦波形图形求出1个值,所以时间分辨率成为3个周期的余弦波形图形的长度。
另一方面,如图29(b)所示,准备构成分析波形图形的一部分并具有预定的时间分辨率的多个局部分析波形图形,对每个局部波形图形求出1个值时,时间分辨率减小。在该例子中,成为0.5个周期的余弦波形图形的长度。由此,通过细化时间分辨率,出现时间性的频率结构的变化,基本周期的形状变得明确。
在此,描述将利用多个局部分析波形图形准备的频率图形作为一组数据使用、而对用3个周期的余弦波形图形求出的频率图形具有的频率信息进行处理的技术。
在该例子中,利用离散余弦变换做成频率图形。
将由3个周期的余弦波形图形构成的分析波形图形中的频率图形表现为
(数学式30)
Figure S200680023615XD00461
,将局部分析波形图形中的频率图形表现为
(数学式31)
Figure S200680023615XD00462
(数学式32)
Figure S200680023615XD00463
(数学式33)
Figure S200680023615XD00464
(数学式34)
Figure S200680023615XD00471
(数学式35)
Figure S200680023615XD00472
(数学式36)
Figure S200680023615XD00473
,但是,(数学式37)为
ck=1(k=0)、ck=  (k=2,...N)
,N是离散余弦变换的窗口长度的采样数。并且,将评价声音或对象声音设为
(数学式38)
Xn
在此,分析波形图形中的频率图形和局部分析波形图形中的频率图形的关系表现为
(数学式39)
X f = X f 1 + X f 2 + X f 3 + X f 4 + X f 5 + X f 6
由此,能够通过将利用6个局部分析波形图形准备的频率图形作为一组数据使用,从而可以做成分析波形图形中的频率图形,所以通过将局部分析波形图形中的频率图形作为一组数据使用,可以与分析波形图形中的频率图形同等地处理。
这样,可知将6个局部分析波形图形中的频率图形作为1组数据处理,是在分析波形图形中的频率图形具有的频率信息上还附加了与时间性的频率结构的变化有关的信息。
图30示出频率图形的其它做成方法的一例。
图30(a)中示出由与图29(a)相同的3个周期的余弦波形图形构成的分析波形图形。将该分析波形图形重叠在评价声音或对象声音上做成了频率图形时,由3个周期的余弦波形图形求出1个值,所以时间分辨率成为3个周期的余弦波形图形的长度。
另一方面,如图30(b)所示,准备构成分析波形图形的一部分并具有预定的时间分辨率的多个局部分析波形图形,对每个局部波形图形求出1个值,则时间分辨率细化。在该例子中,成为1个周期的余弦波形图形的长度。
在该例子中,分析波形图形的频率图形可以用3个频率图形的和来表现,所以,将利用3个局部分析波形图形准备的频率图形作为一组数据使用,从而能够与通过3个周期的余弦波形图形求出的频率图形同等地处理。
图31(a)表示利用图30的局部分析波形图形分析的3人的声音的混合声音的、2KHz上的频率图形。图31(b)表示利用图30的局部分析波形图形分析的A君的声音的、2KHz上的频率图形。在该列子中,可知在混合声音的频率图形中明确地出现了A君的声音的频率图形的基本周期。
在图32中示出图30的例子中的分析波形图形中的频率图形和局部分析波形图形中的频率图形的关系。在该例子中,将对象声音表现为BT(n),将评价声音表现为BH(n)。将这时的对象声音的分析波形图形中的频率图形表现为
(数学式40)
Figure S200680023615XD00481
(t=0,1,...W-N)
,将对象声音的局部分析波形图形中的频率图形表现为
(数学式41)
Figure S200680023615XD00491
(t=0,1,...W-N)
(数学式42)
Figure S200680023615XD00492
(t=0,1,...W-N)
(数学式43)
Figure S200680023615XD00493
(t=0,1,...W-N)
。其中,W与第二实施方式相同,N是离散余弦变换的窗口长度的采样数,Ck是数37。并且,将评价声音中的分析波形图形中的频率图形表现为
(数学式44)
(t=0,1,...L-N)
,将对象声音的局部分析波形图形中的频率图形表现为
(数学式45)
Figure S200680023615XD00495
(t=0,1,...L-N)
(数学式46)
Figure S200680023615XD00496
(t=0,1,...L-N)
(数学式47)
Figure S200680023615XD00497
(t=0,1,...L-N)
。其中,W与第二实施方式相同,N是离散余弦变换的窗口长度的采样数,Ck是数37。
在该例子中,在频带f中,将对象声音频率图形相对于评价声音频率图形进行时移时的差分值,用欧几里德距离表现。这时,分析波形图形中的频率图形上的差分值可以表现为
(数学式48)
E f ( m ) = Σ t = 0 t = W - N ( XH f ( m + t ) - XT f ( t ) ) 2 (m=0,1,...L-W-N)
。在此,将局部分析波形图形中的频率图形的差分值表现为
(数学式49)
ES f ( m ) = Σ t = 0 t = W - N Σ l = 1 l = 3 ( X H f l ( m + t ) - X T f l ( t ) ) 2 (m=0,1,...L-W-N)
在此,若利用图32考虑频率图形XH和频率图形XT的距离,则分析波形图形中的频率图形的距离是平面XH的切片XHf和平面XT的切片XTf的距离,相对于此,局部分析波形图形中的频率图形的距离还考虑2个平面XH和平面XT的平面上的坐标的距离。即,考虑频率图形微小的时间图形。
由此,将利用多个局部分析波形图形准备的对象声音频率图形和利用多个局部分析波形图形准备的评价声音频率图形,分别用作一组数据而分析基本周期,所以处理分析波形图形中的频率分辨率的频率信息的时间性的频率结构的变化,犹如细化频率分辨率,可以分析基本周期。
(第三实施方式)
图33是表示本发明的第三实施方式的对象声音分析装置的整体结构的框图。在此,示出本发明的对象声音分析装置组装在车辆检测系统中的一例。在本实施方式中,将通过分析摩托车声音的基本周期来判断在使用者的周边存在摩托车声音而向使用者通知摩托车接近的情况为例进行说明。在该例子中,取代图2所示的基本周期分析部101而使用基本周期分析部3003。基本周期分析部3003除了图20的基本周期分析部1701的结构以外追加了频率设定部3000。频率设定部3000是对分析单元中使用的对象声音频率图形及评价声音频率图形的频带进行设定的频率设定单元的一例。
车辆检测系统3002具备基本周期分析部3003和警告声音输出部105。基本周期分析部3003具备对象声音准备部1702、评价声音准备部1703、频率设定部3000和分析部3001。
在该例子中,频率设定部3000利用图33中的“频带信息AS3001A”设定频带信息S3000。并且,不使用图33中的“频带信息BS3001B”和“频带信息CS3001C”。
在对象声音准备部1702中存储有对对象声音进行频率分析而得到的每个频带的对象声音频率图形S1702和对象声音的基本周期S1706。在分析部3001中存储有阈值S1705。对象声音准备部1702向分析部3001输出对象声音频率图形S1702和基本周期S1706。评价声音准备部1703输入评价声音S100而对评价声音S100进行频率分析,向分析部3001输出每个频带的评价声音频率图形S1701。频率设定部3000输入频带信息AS3001A做成频带信息S3000而向分析部3001输出。分析部3001在基于频带信息S3000的频带中,将对象声音频率图形S1702相对于评价声音频率图形S1701进行时移的同时,依次计算对应的时刻的评价声音频率图形S1701和对象声音频率图形S1702的差分值。分析部3001基于在阈值S1705以下的差分值的重复时间间隔的周期和对象声音的基本周期S1706,判断评价声音S100中有无对象声音,在存在对象声音时向警告声音输出部105输出检测信号S102。在输入了检测信号S102时,警告声音输出部105向使用者提示警告声音S103。
接着,说明如上那样构成的车辆检测系统3002的动作。
图34是表示车辆检测系统3002的动作顺序的流程图。
在该例子中,车辆检测系统出厂之前,在对象声音准备部102中存储有对摩托车声音进行频率分析而得到的每个频带的频率图形作为对象声音频率图形S1702(步骤1800),进而存储有作为对象声音的摩托车声音的基本周期S1706。并且,在分析部3001中,对每个频带存储有阈值S1705。
首先,通过启动车辆检测系统3002,评价声音准备部1703利用麦克风开始取入作为评价声音S100的使用者的周边的声音。并且,对评价声音S100进行频率分析,做成每个频带的评价声音频率图形S1701(步骤1801)。
接着,使用者利用频率设定部3000输入分析基本周期的频带。在该例子中,输入作为对象声音的摩托车声音的功率大的200Hz和500Hz的频带。并且,向分析部3001输出作为频带信息S3000的“200Hz、500Hz”(步骤3100)。并且,考虑包含在评价声音S100中的杂音而在200Hz中附加了杂音的情况下,仅将500Hz设定为分析基本频率的频带。
接着,分析在评价声音S100中是否包含有存储在对象声音准备部1702中的对象声音、即摩托车声音的基本周期(步骤3101)。在该例子中,频带信息S3000是“200Hz和500Hz”,所以在200Hz中的频率图形和500Hz的频率图形中,与第二实施方式同样地分析对象声音的基本周期。接着,在200Hz及500Hz的分析结果中,任一个被判断为存在对象声音时,向警告声音输出部105输出所谓“存在对象声音”的检测信号S102。并且,在判断为任一个频带中都不存在对象声音时,不向警告声音输出部105输出检测信号S102。
接着,在输入了检测信号S102时,警告声音输出部105向使用者提示警告声音S103(步骤203)。
这里的步骤1800、步骤1801、步骤203与第一实施方式和第二实施方式相同,所以省略说明。
最后,到车辆检测系统3002停止为止,重复这些步骤1801、步骤3100、步骤3101、步骤203的动作。
如以上说明那样,可以利用频率设定部3000来控制分析部3001中使用的对象声音频率图形及评价声音频率图形的频带。由此,能够变更分析的频带或者变更分析的频带的带宽。例如,在分析混合了对象声音和杂音的评价声音时,能够选择没有杂音的频带而分析评价声音的基本周期,由此能够判断有无对象声音。
(其它例子)
说明频率设定部的其它例子。
在该例子中,频率设定部3000利用图33中的“频带信息BS3001B”和“频带信息CS3001C”来设定频带信息S3000。并且,不使用图33中的“频带信息AS3001A”。
在对象声音准备部1702中存储有对对象声音进行频率分析而得到的每个频带的对象声音频率图形S1702和对象声音的基本周期S1706。在分析部3001中存储有阈值S1705。对象声音准备部1702向分析部3001输出对象声音频率图形S1702和基本周期S1706。评价声音准备部1703输入评价声音S100而对评价声音S100进行频率分析,向分析部3001输出每个频带的评价声音频率图形S1701。频率设定部3000输入作为评价声音S100的频带信息CS3001C并从对象声音准备部S1702输入频带信息BS3001B来做成频带信息S3000而向分析部3001输出。分析部3001在基于频带信息S3000的频带中,将对象声音频率图形S1702相对于评价声音频率图形S1701进行时移的同时,依次计算对应的时刻的评价声音频率图形S1701和对象声音频率图形S1702的差分值。分析部3001基于在阈值S1705以下的差分值的重复时间间隔的周期和对象声音的基本周期S1706,判断评价声音S100中是否存在对象声音。分析部3001在存在对象声音时向警告声音输出部105输出检测信号S102。在输入了检测信号S102时,警告声音输出部105向使用者提示警告声音S103。
接着,说明如上那样构成的车辆检测系统3002的动作。
图34是表示车辆检测系统3002的动作顺序的流程图。
在该例子中,车辆检测系统出厂之前,在对象声音准备部1702中存储有对摩托车声音进行频率分析而得到的每个频带的频率图形作为对象声音频率图形S1702(步骤1800),进而存储有作为对象声音的摩托车声音的基本周期S1706。并且,在分析部3001中,对每个频带存储有阈值S1705。
首先,通过启动车辆检测系统3002,评价声音准备部1703利用麦克风开始取入作为评价声音S100的使用者的周边的声音。并且,对评价声音S100进行频率分析,做成每个频带的评价声音频率图形S1701(步骤1801)。
接着,频率设定部3000从作为频带信息BS3001B的对象声音中选择对象声音的功率大的频带。在此,选择200Hz和500Hz。并且,从作为频带信息CS3001C的评价声音S100中选择包含在评价声音的杂音的功率大的频带。在此,选择200Hz。并且,根据这些,将对象声音的功率大且不包含杂音的频带设定为频带信息S3000。在该例子中,频带信息S3000成为“500Hz”。
接着,分析在评价声音S100中是否包含有存储在对象声音准备部1702中的对象声音、即摩托车声音的基本周期(步骤3101)。在该例子中,频带信息S3000是“500Hz”,所以在500Hz的频率图形中,与第二实施方式同样地分析对象声音的基本周期。接着,在500Hz的分析结果中,判断为存在对象声音时,向警告声音输出部105输出所谓“存在对象声音”的检测信号S102。
接着,在输入了检测信号S102时,警告声音输出部105向使用者提示警告声音S103(步骤203)。
这里的步骤1800、步骤1801、步骤203与第一实施方式和第二实施方式相同,所以省略说明。
如以上说明那样,频率设定部3000能够自动地求出适合于对象声音的频带,所以使用者不需要设定频带,使用方便性较好。
工业可利用性
本发明的对象声音分析装置可以在装有混合声音分离、声音识别、声音合成的功能的车辆检测系统、助听器、便携式电话、电视会议系统等范围较广的产品上展开,实用性价值极高。

Claims (12)

1.一种对象声音分析装置,分析在评价声音中是否包含对象声音,其特征在于,具备:
对象声音准备单元,准备为了分析基本周期而使用的分析波形、即对象声音;
评价声音准备单元,准备被分析基本周期的被分析波形、即评价声音;
分析单元,使上述对象声音相对于上述评价声音进行时移,依次计算对应的时刻的上述评价声音和上述对象声音的差分值,计算该差分值为预定阈值以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音的基本周期,来判断在上述评价声音中是否存在上述对象声音。
2.如权利要求1所述的对象声音分析装置,其特征在于,
上述对象声音准备单元准备通过对上述对象声音进行频率分析而得到的对象声音频率图形;
上述评价声音准备单元准备通过对上述评价声音进行频率分析而得到的评价声音频率图形;
上述分析单元使上述对象声音频率图形相对于上述评价声音频率图形进行时移的同时,依次计算对应的时刻的上述评价声音频率图形和上述对象声音频率图形的差分值,计算上述差分值为预定阈值以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音的基本周期,来判断在上述评价声音中是否存在上述对象声音。
3.如权利要求2所述的对象声音分析装置,其特征在于,
上述对象声音准备单元准备对象声音频率图形,该对象声音频率图形通过上述对象声音和由预定的频率成分构成的非周期性分析波形间的互相关来计算、且包含振幅谱及相位谱中的至少一个;
上述评价声音准备单元准备评价声音频率图形,该评价声音频率图形通过评价声音和上述分析波形间的互相关来计算、且包含振幅谱及相位谱的至少一个。
4.如权利要求2所述的对象声音分析装置,其特征在于,
上述对象声音准备单元准备对象声音频率图形,该对象声音频率图形通过上述对象声音和构成由预定的频率成分构成的分析波形的一部分并具有预定的时间分辨率的多个局部分析波形间的各个互相关来计算、且包含振幅谱及相位谱的至少一个;
上述评价声音准备单元准备评价声音频率图形,该评价声音频率图形通过上述评价声音和上述多个局部分析波形间的各个互相关来计算、且包含振幅谱及相位谱的至少一个;
上述分析单元将使用上述多个局部分析波形准备的上述对象声音频率图形和使用上述多个局部分析波形准备的上述评价声音频率图形,各作为一组数据使用,来分析上述对象声音的基本周期。
5.如权利要求2所述的对象声音分析装置,其特征在于,
上述对象声音分析装置还具备频率设定单元,该频率设定单元设定在上述分析单元中使用的对象声音频率图形及评价声音频率图形的频带;
上述分析单元使用由上述频率设定单元设定的上述频带的上述对象声音频率图形及上述评价声音频率图形,分析上述对象声音的基本周期。
6.如权利要求1所述的对象声音分析装置,其特征在于,
在上述重复间隔的周期与上述对象声音的基本周期大致相等时,上述分析单元判断为在上述评价声音中存在上述对象声音,在上述重复间隔的周期与上述对象声音的基本周期大致不相等时,上述分析单元判断为在上述评价声音中不存在上述对象声音。
7.如权利要求6所述的对象声音分析装置,其特征在于,
上述对象声音准备单元存储有上述多个对象声音的候补或上述多个对象声音频率图形的候补;
上述声音信息设定单元接收选择信号,该选择信号用于选择上述多个对象声音的候补及上述多个对象声音频率图形的某一个;
上述对象声音准备单元将根据上述选择信号选择的对象声音的候补或对象声音频率图形的候补,作为准备的上述对象声音或准备的上述对象声音频率图形。
8.如权利要求1所述的对象声音分析装置,其特征在于,
上述对象声音分析装置还具备设定与上述对象声音关联的声音信息的声音信息设定单元;
上述对象声音准备单元基于设定的上述声音信息准备上述对象声音或上述对象声音频率图形。
9.如权利要求8所述的对象声音分析装置,其特征在于,
上述声音信息设定单元接收对象声音的输入,将所输入的上述对象声音作为上述声音信息;
上述对象声音准备单元将所输入的上述对象声音作为准备的上述对象声音,或者,通过进一步对该对象声音进行频率分析来准备上述对象声音频率图形。
10.如权利要求1所述的对象声音分析装置,其特征在于,
上述对象声音分析装置还具备阈值设定单元,该阈值设定单元将上述对象声音相对于多个评价声音的每一个进行时移的同时,依次计算对应的时刻的上述评价声音和上述对象声音的差分值,来计算上述差分值的最小值,并基于与上述多个评价声音对应的多个上述最小值中的最大值,设定上述预定阈值。
11.一种对象声音分析方法,分析在评价声音中是否包含对象声音,其特征在于,包括:
准备为了分析基本周期而使用的分析波形、即对象声音的步骤;
准备被分析基本周期的被分析波形、即评价声音的步骤;
使上述对象声音相对于上述评价声音进行时移,依次计算对应的时刻的上述评价声音和上述对象声音的差分值,基于上述差分值成为预定阈值以下的时刻的重复间隔的周期和上述对象声音的基本周期,判断在上述评价声音中是否存在上述对象声音。
12.一种对象声音分析程序,分析在评价声音中是否包含对象声音,其特征在于,使计算机执行如下步骤:
准备为了分析基本周期而使用的分析波形、即对象声音的步骤;
准备被分析基本周期的被分析波形、即评价声音的步骤;
使上述对象声音相对于上述评价声音进行时移,依次计算对应的时刻的上述评价声音和上述对象声音的差分值,计算上述差分值成为预定阈值以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音的基本周期,来判断在上述评价声音中是否存在上述对象声音。
CN200680023615XA 2006-01-12 2006-12-21 对象声音分析装置和对象声音分析方法 Expired - Fee Related CN101213589B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP005178/2006 2006-01-12
JP2006005178 2006-01-12
PCT/JP2006/325548 WO2007080764A1 (ja) 2006-01-12 2006-12-21 対象音分析装置、対象音分析方法および対象音分析プログラム

Publications (2)

Publication Number Publication Date
CN101213589A true CN101213589A (zh) 2008-07-02
CN101213589B CN101213589B (zh) 2011-04-27

Family

ID=38256175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680023615XA Expired - Fee Related CN101213589B (zh) 2006-01-12 2006-12-21 对象声音分析装置和对象声音分析方法

Country Status (4)

Country Link
US (1) US8223978B2 (zh)
JP (1) JP4065314B2 (zh)
CN (1) CN101213589B (zh)
WO (1) WO2007080764A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103558029A (zh) * 2013-10-22 2014-02-05 重庆建设摩托车股份有限公司 一种发动机异响故障在线诊断系统和诊断方法
CN104332162A (zh) * 2014-11-25 2015-02-04 武汉大学 一种音频信号车辆识别系统
CN105788591A (zh) * 2014-10-15 2016-07-20 现代自动车株式会社 使用声音信号处理器来识别喇叭声的装置和方法
CN108269249A (zh) * 2017-12-11 2018-07-10 深圳市智能机器人研究院 一种螺栓检测系统及其实现方法
CN108697352A (zh) * 2017-06-29 2018-10-23 深圳和而泰智能控制股份有限公司 生理信息测量方法及生理信息监测装置、设备
CN113559504A (zh) * 2021-04-28 2021-10-29 网易(杭州)网络有限公司 信息处理方法、装置、存储介质及电子设备
US20240144792A1 (en) * 2022-10-26 2024-05-02 Sherry Green Mullins Decibel alarm system
US12125354B2 (en) * 2022-10-26 2024-10-22 Sherry Green Mullins Decibel alarm system

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7974420B2 (en) * 2005-05-13 2011-07-05 Panasonic Corporation Mixed audio separation apparatus
JP4601643B2 (ja) * 2007-06-06 2010-12-22 日本電信電話株式会社 信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体
WO2009047858A1 (ja) * 2007-10-12 2009-04-16 Fujitsu Limited エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置、音出力装置、オーディオシステム、ナビゲーションシステム及び移動体
US8270621B2 (en) * 2009-02-11 2012-09-18 International Business Machines Corporation Automatic generation of audible alert according to ambient sound
JP5454161B2 (ja) * 2010-01-19 2014-03-26 大日本印刷株式会社 音響データの関連情報登録装置および音響データの関連情報検索装置
US20150149167A1 (en) * 2011-03-31 2015-05-28 Google Inc. Dynamic selection among acoustic transforms
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
JP6645063B2 (ja) * 2014-07-29 2020-02-12 ヤマハ株式会社 ターゲット文字列の推定
WO2016111330A1 (ja) * 2015-01-09 2016-07-14 節雄 阿仁屋 オーディオ装置の評価方法及びその装置並びにオーディオ装置及びスピーカー装置
JP6759545B2 (ja) * 2015-09-15 2020-09-23 ヤマハ株式会社 評価装置およびプログラム
US9756281B2 (en) 2016-02-05 2017-09-05 Gopro, Inc. Apparatus and method for audio based video synchronization
US9697849B1 (en) 2016-07-25 2017-07-04 Gopro, Inc. Systems and methods for audio based synchronization using energy vectors
US9640159B1 (en) 2016-08-25 2017-05-02 Gopro, Inc. Systems and methods for audio based synchronization using sound harmonics
US9653095B1 (en) * 2016-08-30 2017-05-16 Gopro, Inc. Systems and methods for determining a repeatogram in a music composition using audio features
US9916822B1 (en) 2016-10-07 2018-03-13 Gopro, Inc. Systems and methods for audio remixing using repeated segments
JP2019200387A (ja) * 2018-05-18 2019-11-21 日本電信電話株式会社 検知装置、その方法、およびプログラム
JP7017488B2 (ja) * 2018-09-14 2022-02-08 株式会社日立製作所 音点検システムおよび音点検方法
JP7266390B2 (ja) 2018-11-20 2023-04-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 行動識別方法、行動識別装置、行動識別プログラム、機械学習方法、機械学習装置及び機械学習プログラム
CN112750458B (zh) * 2019-10-30 2022-11-25 北京爱数智慧科技有限公司 一种触屏声音检测方法和装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0679238B2 (ja) * 1984-11-27 1994-10-05 日本電気株式会社 ピツチ抽出装置
JPH0690638B2 (ja) 1986-06-25 1994-11-14 松下電工株式会社 音声分析方式
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
JPH09258762A (ja) * 1996-03-25 1997-10-03 Casio Comput Co Ltd ピッチ抽出装置
JP3266124B2 (ja) * 1999-01-07 2002-03-18 ヤマハ株式会社 アナログ信号中の類似波形検出装置及び同信号の時間軸伸長圧縮装置
JP2001126074A (ja) * 1999-08-17 2001-05-11 Atl Systems:Kk パターンマッチングによるデータ検索方法及びそのプログラムを記録した記録媒体
WO2001016935A1 (fr) * 1999-08-26 2001-03-08 Sony Corporation Procede et dispositif d'extraction/traitement d'informations, et procede et dispositif de stockage
US6990453B2 (en) * 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
JP2003317368A (ja) * 2002-04-25 2003-11-07 Digion Inc パルス性ノイズのデジタル信号処理による検出および除去方法
US8073157B2 (en) * 2003-08-27 2011-12-06 Sony Computer Entertainment Inc. Methods and apparatus for targeted sound detection and characterization
JP3895657B2 (ja) * 2002-10-01 2007-03-22 三菱電機エンジニアリング株式会社 事故音検出回路
US8073684B2 (en) * 2003-04-25 2011-12-06 Texas Instruments Incorporated Apparatus and method for automatic classification/identification of similar compressed audio files
JP4376035B2 (ja) * 2003-11-19 2009-12-02 パイオニア株式会社 音響特性測定装置及び自動音場補正装置並びに音響特性測定方法及び自動音場補正方法
CN1954361B (zh) * 2004-05-11 2010-11-03 松下电器产业株式会社 声音合成装置和方法
US7974420B2 (en) * 2005-05-13 2011-07-05 Panasonic Corporation Mixed audio separation apparatus
JP5678445B2 (ja) * 2010-03-16 2015-03-04 ソニー株式会社 音声処理装置、音声処理方法およびプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103558029A (zh) * 2013-10-22 2014-02-05 重庆建设摩托车股份有限公司 一种发动机异响故障在线诊断系统和诊断方法
CN103558029B (zh) * 2013-10-22 2016-06-22 重庆建设机电有限责任公司 一种发动机异响故障在线诊断系统和诊断方法
CN105788591A (zh) * 2014-10-15 2016-07-20 现代自动车株式会社 使用声音信号处理器来识别喇叭声的装置和方法
CN104332162A (zh) * 2014-11-25 2015-02-04 武汉大学 一种音频信号车辆识别系统
CN108697352A (zh) * 2017-06-29 2018-10-23 深圳和而泰智能控制股份有限公司 生理信息测量方法及生理信息监测装置、设备
CN108697352B (zh) * 2017-06-29 2021-04-20 深圳和而泰智能控制股份有限公司 生理信息测量方法及生理信息监测装置、设备
CN108269249A (zh) * 2017-12-11 2018-07-10 深圳市智能机器人研究院 一种螺栓检测系统及其实现方法
CN113559504A (zh) * 2021-04-28 2021-10-29 网易(杭州)网络有限公司 信息处理方法、装置、存储介质及电子设备
CN113559504B (zh) * 2021-04-28 2024-04-16 网易(杭州)网络有限公司 信息处理方法、装置、存储介质及电子设备
US20240144792A1 (en) * 2022-10-26 2024-05-02 Sherry Green Mullins Decibel alarm system
US12125354B2 (en) * 2022-10-26 2024-10-22 Sherry Green Mullins Decibel alarm system

Also Published As

Publication number Publication date
JP4065314B2 (ja) 2008-03-26
US8223978B2 (en) 2012-07-17
WO2007080764A1 (ja) 2007-07-19
CN101213589B (zh) 2011-04-27
JPWO2007080764A1 (ja) 2009-06-11
US20080304672A1 (en) 2008-12-11

Similar Documents

Publication Publication Date Title
CN101213589B (zh) 对象声音分析装置和对象声音分析方法
Muckenhirn et al. End-to-end convolutional neural network-based voice presentation attack detection
Venter et al. Automatic detection of African elephant (Loxodonta africana) infrasonic vocalisations from recordings
Jelil et al. Exploration of compressed ILPR features for replay attack detection
US10665248B2 (en) Device and method for classifying an acoustic environment
CN109859749A (zh) 一种语音信号识别方法和装置
Duan et al. Timed probabilistic automaton: a bridge between raven and song scope for automatic species recognition
US20230317095A1 (en) Systems and methods for pre-filtering audio content based on prominence of frequency content
Jaafar et al. Automatic syllables segmentation for frog identification system
CN105283916A (zh) 电子水印嵌入装置、电子水印嵌入方法及电子水印嵌入程序
KR101082839B1 (ko) 다채널 잡음처리 장치 및 방법
CN115909675A (zh) 一种分布式边缘计算的电力设备声音监测方法
US20230116052A1 (en) Array geometry agnostic multi-channel personalized speech enhancement
CN111508530A (zh) 语音情感识别方法、装置及存储介质
Neelima et al. Mimicry voice detection using convolutional neural networks
KR20160047822A (ko) 화자 유형 정의 방법 및 장치
CN115662441B (zh) 一种基于自监督学习的语音鉴伪方法、装置及存储介质
Xie et al. Acoustic feature extraction using perceptual wavelet packet decomposition for frog call classification
KR20170124854A (ko) 음성/비음성 구간 검출 장치 및 방법
Vyas et al. Automatic mood detection of indian music using MFCCs and K-means algorithm
JP5772957B2 (ja) 音響処理装置、音響処理システム、ビデオ処理システム、制御方法および制御プログラム
KR20150144640A (ko) 이상음원 판단장치 및 방법
JP6589040B1 (ja) 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム
CN114333844A (zh) 声纹识别方法、装置、介质及设备
Ciira Cost effective acoustic monitoring of bird species

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110427

Termination date: 20211221

CF01 Termination of patent right due to non-payment of annual fee