JP2013222113A5 - - Google Patents

Download PDF

Info

Publication number
JP2013222113A5
JP2013222113A5 JP2012094395A JP2012094395A JP2013222113A5 JP 2013222113 A5 JP2013222113 A5 JP 2013222113A5 JP 2012094395 A JP2012094395 A JP 2012094395A JP 2012094395 A JP2012094395 A JP 2012094395A JP 2013222113 A5 JP2013222113 A5 JP 2013222113A5
Authority
JP
Japan
Prior art keywords
time
frequency
distribution
unit
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012094395A
Other languages
English (en)
Other versions
JP5998603B2 (ja
JP2013222113A (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from JP2012094395A external-priority patent/JP5998603B2/ja
Priority to JP2012094395A priority Critical patent/JP5998603B2/ja
Priority to IN8472DEN2014 priority patent/IN2014DN08472A/en
Priority to PCT/JP2013/002581 priority patent/WO2013157254A1/en
Priority to US14/385,856 priority patent/US20150043737A1/en
Priority to CN201380019489.0A priority patent/CN104221018A/zh
Publication of JP2013222113A publication Critical patent/JP2013222113A/ja
Publication of JP2013222113A5 publication Critical patent/JP2013222113A5/ja
Publication of JP5998603B2 publication Critical patent/JP5998603B2/ja
Application granted granted Critical
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (18)

  1. 入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出部と、
    所定数の被検出音の特徴量列を保持する特徴量保持部と、
    上記特徴量抽出部で新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、上記保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較部とを備え、
    上記特徴量抽出部は、
    上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
    上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出部とを有し、
    上記求められた尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
    音検出装置。
  2. 上記尤度分布検出部は、
    上記時間周波数分布の各時間フレームにおいて周波数方向のピークを検出するピーク検出部と、
    上記検出された各ピークにおいてトーンモデルをフィッティングするフィッティング部と、
    上記フィッティング結果に基づき、上記検出された各ピークのトーン成分らしさを示すスコアを得るスコア化部とを備える
    請求項1に記載の音検出装置。
  3. 上記特徴量抽出部は、
    上記平滑化された尤度分布を周波数方向および/または時間方向に間引く間引き部をさらに備える
    請求項1または請求項2に記載の音検出装置。
  4. 上記特徴量抽出部は、
    上記平滑化された尤度分布を量子化する量子化部をさらに備える
    請求項1または請求項2に記載の音検出装置。
  5. 上記比較部は、
    上記所定数の被検出音のそれぞれについて、上記保持されている被検出音の特徴量列と上記特徴量抽出部で抽出された特徴量列との間の対応する特徴量間の相関演算で類似度を求め、該求められた類似度に基づいて上記被検出音の検出結果を得る
    請求項1から請求項4のいずれかに記載の音検出装置。
  6. 上記所定数の被検出音の検出結果を時刻情報と共に記録媒体に記録する記録制御部をさらに備える
    請求項1から請求項5のいずれかに記載の音検出装置。
  7. 入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出ステップと、
    上記特徴量抽出ステップで新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較ステップとを備え、
    上記特徴量抽出ステップでは、
    上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得、該時間周波数分布よりトーンらしさの尤度分布を求め、該尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
    音検出方法。
  8. コンピュータに、
    入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出ステップと、
    上記特徴量抽出ステップで新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較ステップとを備え、
    上記特徴量抽出ステップでは、
    上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得、該時間周波数分布よりトーンらしさの尤度分布を求め、該尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
    音検出方法を実行させるためのプログラム。
  9. 入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
    上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出部と、
    上記尤度分布を周波数方向および時間方向に平滑化して所定時間毎の特徴量を抽出する特徴量抽出部とを備える
    音特徴量抽出装置。
  10. 上記尤度分布検出部は、
    上記時間周波数分布の各時間フレームにおいて周波数方向のピークを検出するピーク検出部と、
    上記検出された各ピークにおいてトーンモデルをフィッティングするフィッティング部と、
    上記フィッティング結果に基づき、上記検出された各ピークのトーン成分らしさを示すスコアを得るスコア化部とを備える
    請求項9に記載の音特徴量抽出装置。
  11. 上記平滑化された尤度分布を周波数方向および/または時間方向に間引く間引き部をさらに備える
    請求項9または請求項10に記載の音特徴量抽出装置。
  12. 上記平滑化された尤度分布を量子化する量子化部をさらに備える
    請求項9または請求項10に記載の音特徴量抽出装置。
  13. 上記入力時間信号に基づいて音区間を検出する音区間検出部をさらに備え、
    上記尤度分布検出部は、
    上記検出された音区間の範囲で上記時間周波数分布よりトーンらしさの尤度分布を求める
    請求項9から請求項12のいずれかに記載の音特徴量抽出装置。
  14. 上記音区間検出部は、
    上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
    上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する特徴量抽出部と、
    上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化部と、
    上記得られた時間フレーム毎のスコアを時間方向に平滑化する時間平滑化部と、
    上記平滑化された時間フレーム毎のスコアを閾値判定して音区間情報を得る閾値判定部とを有する
    請求項13に記載の音特徴量抽出装置。
  15. 入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換ステップと、
    上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出ステップと、
    上記尤度分布を周波数方向および時間方向に平滑化する平滑化ステップとを備える
    音特徴量抽出方法。
  16. 入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
    上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する特徴量抽出部と、
    上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化部とを備える
    音区間検出装置。
  17. 上記得られた時間フレーム毎のスコアを時間方向に平滑化する時間平滑化部と、
    上記平滑化された時間フレーム毎のスコアを閾値判定して音区間情報を得る閾値判定部とをさらに備える
    請求項16に記載の音区間検出装置。
  18. 入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換ステップと、
    上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する特徴量抽出ステップと、
    上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化ステップとを備える
    音区間検出方法。
JP2012094395A 2012-04-18 2012-04-18 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム Active JP5998603B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2012094395A JP5998603B2 (ja) 2012-04-18 2012-04-18 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
CN201380019489.0A CN104221018A (zh) 2012-04-18 2013-04-16 声音检测装置、声音检测方法、声音特征值检测装置、声音特征值检测方法、声音区间检测装置、声音区间检测方法及程序
PCT/JP2013/002581 WO2013157254A1 (en) 2012-04-18 2013-04-16 Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program
US14/385,856 US20150043737A1 (en) 2012-04-18 2013-04-16 Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program
IN8472DEN2014 IN2014DN08472A (ja) 2012-04-18 2013-04-16

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012094395A JP5998603B2 (ja) 2012-04-18 2012-04-18 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム

Publications (3)

Publication Number Publication Date
JP2013222113A JP2013222113A (ja) 2013-10-28
JP2013222113A5 true JP2013222113A5 (ja) 2015-02-26
JP5998603B2 JP5998603B2 (ja) 2016-09-28

Family

ID=48652284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012094395A Active JP5998603B2 (ja) 2012-04-18 2012-04-18 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム

Country Status (5)

Country Link
US (1) US20150043737A1 (ja)
JP (1) JP5998603B2 (ja)
CN (1) CN104221018A (ja)
IN (1) IN2014DN08472A (ja)
WO (1) WO2013157254A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150179167A1 (en) * 2013-12-19 2015-06-25 Kirill Chekhter Phoneme signature candidates for speech recognition
CN103793190A (zh) * 2014-02-07 2014-05-14 北京京东方视讯科技有限公司 一种信息显示方法、信息显示装置及显示设备
JP6362358B2 (ja) * 2014-03-05 2018-07-25 大阪瓦斯株式会社 作業完了報知装置
CN104217722B (zh) * 2014-08-22 2017-07-11 哈尔滨工程大学 一种海豚哨声信号时频谱轮廓提取方法
CN104810025B (zh) * 2015-03-31 2018-04-20 天翼爱音乐文化科技有限公司 音频相似度检测方法及装置
US10079012B2 (en) 2015-04-21 2018-09-18 Google Llc Customizing speech-recognition dictionaries in a smart-home environment
US10178474B2 (en) * 2015-04-21 2019-01-08 Google Llc Sound signature database for initialization of noise reduction in recordings
JP6524814B2 (ja) * 2015-06-18 2019-06-05 Tdk株式会社 会話検出装置及び会話検出方法
JP6448477B2 (ja) * 2015-06-19 2019-01-09 株式会社東芝 行動判定装置及び行動判定方法
CN105391501B (zh) * 2015-10-13 2017-11-21 哈尔滨工程大学 一种基于时频谱平移的仿海豚哨声水声通信方法
WO2017098601A1 (ja) * 2015-12-09 2017-06-15 三菱電機株式会社 劣化個所推定装置、劣化個所推定方法および移動体の診断システム
CN105871475B (zh) * 2016-05-25 2018-05-18 哈尔滨工程大学 一种基于自适应干扰抵消的仿鲸鱼叫声隐蔽水声通信方法
CN106251860B (zh) * 2016-08-09 2020-02-11 张爱英 面向安防领域的无监督的新颖性音频事件检测方法及系统
US9870719B1 (en) 2017-04-17 2018-01-16 Hz Innovations Inc. Apparatus and method for wireless sound recognition to notify users of detected sounds
JP7017488B2 (ja) * 2018-09-14 2022-02-08 株式会社日立製作所 音点検システムおよび音点検方法
JP7266390B2 (ja) * 2018-11-20 2023-04-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 行動識別方法、行動識別装置、行動識別プログラム、機械学習方法、機械学習装置及び機械学習プログラム
KR102240455B1 (ko) * 2019-06-11 2021-04-14 네이버 주식회사 동적 노트 매칭을 위한 전자 장치 및 그의 동작 방법
JP6759479B1 (ja) * 2020-03-24 2020-09-23 株式会社 日立産業制御ソリューションズ 音響分析支援システム、及び音響分析支援方法
US11410676B2 (en) * 2020-11-18 2022-08-09 Haier Us Appliance Solutions, Inc. Sound monitoring and user assistance methods for a microwave oven
CN112885374A (zh) * 2021-01-27 2021-06-01 吴怡然 一种基于频谱分析的声音音准判断方法及系统
CN113724734B (zh) * 2021-08-31 2023-07-25 上海师范大学 声音事件的检测方法、装置、存储介质及电子装置
CN115931358B (zh) * 2023-02-24 2023-09-12 沈阳工业大学 一种低信噪比的轴承故障声发射信号诊断方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JPH0926354A (ja) * 1995-07-13 1997-01-28 Sharp Corp 音響・映像装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
MX2007012185A (es) * 2005-04-01 2007-12-11 Qualcomm Inc Metodo y aparato para cuantificacion de vector de una representacion de envoltura espectral.
CN101199004B (zh) * 2005-04-22 2011-11-09 高通股份有限公司 用于增益因数平滑的系统、方法及设备
CN101336451B (zh) * 2006-01-31 2012-09-05 西门子企业通讯有限责任两合公司 音频信号编码的方法和装置
US20100332222A1 (en) * 2006-09-29 2010-12-30 National Chiao Tung University Intelligent classification method of vocal signal
US20080300702A1 (en) * 2007-05-29 2008-12-04 Universitat Pompeu Fabra Music similarity systems and methods using descriptors
JP2009008823A (ja) * 2007-06-27 2009-01-15 Fujitsu Ltd 音響認識装置、音響認識方法、及び、音響認識プログラム
US20090198500A1 (en) * 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
JP4788810B2 (ja) 2009-08-17 2011-10-05 ソニー株式会社 楽曲同定装置及び方法、楽曲同定配信装置及び方法

Similar Documents

Publication Publication Date Title
JP2013222113A5 (ja)
MY194965A (en) Song determining method and device, and storage medium
WO2016026325A1 (zh) 基于声纹特征进行认证的方法、终端及计算机存储介质
JP2012226080A5 (ja)
SG11201810131VA (en) Identity authentication method and apparatus
CN106294331B (zh) 音频信息检索方法及装置
SG10201903085YA (en) Voiceprint information management method and apparatus, and identity authentication method and system
JP2015197436A5 (ja) 周期定常背景雑音を受ける信号内にイベントを検出する方法およびシステム
US9997168B2 (en) Method and apparatus for signal extraction of audio signal
KR101666521B1 (ko) 입력 신호의 피치 주기 검출 방법 및 그 장치
WO2010077997A3 (en) Method and apparatus for determining heart rate variability using wavelet transformation
JP2016522910A5 (ja)
JP2016513843A5 (ja)
JP2018159788A5 (ja) 情報処理装置、感情認識方法、及び、プログラム
Zeppelzauer et al. Acoustic detection of elephant presence in noisy environments
Bayer et al. A multi modal approach to gesture recognition from audio and video data
EP2908269A3 (en) Method and apparatus for managing audio visual, audio or visual content
CN107408207A8 (zh) 指纹局部化
JP2015097355A5 (ja)
JP2016047207A5 (ja)
JP2008015002A5 (ja)
JP2009294537A5 (ja)
Xie et al. Detection of anuran calling activity in long field recordings for bio-acoustic monitoring
JP2007304869A5 (ja)
Sahidullah Enhancement of speaker recognition performance using block level, relative and temporal information of subband energies