JP2013222113A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2013222113A5 JP2013222113A5 JP2012094395A JP2012094395A JP2013222113A5 JP 2013222113 A5 JP2013222113 A5 JP 2013222113A5 JP 2012094395 A JP2012094395 A JP 2012094395A JP 2012094395 A JP2012094395 A JP 2012094395A JP 2013222113 A5 JP2013222113 A5 JP 2013222113A5
- Authority
- JP
- Japan
- Prior art keywords
- time
- frequency
- distribution
- unit
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 claims 25
- 238000001514 detection method Methods 0.000 claims 19
- 238000006243 chemical reaction Methods 0.000 claims 12
- 239000000284 extract Substances 0.000 claims 6
- 238000009499 grossing Methods 0.000 claims 4
- 230000003595 spectral Effects 0.000 claims 3
- 230000000875 corresponding Effects 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 claims 1
Claims (18)
- 入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出部と、
所定数の被検出音の特徴量列を保持する特徴量保持部と、
上記特徴量抽出部で新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、上記保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較部とを備え、
上記特徴量抽出部は、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出部とを有し、
上記求められた尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
音検出装置。 - 上記尤度分布検出部は、
上記時間周波数分布の各時間フレームにおいて周波数方向のピークを検出するピーク検出部と、
上記検出された各ピークにおいてトーンモデルをフィッティングするフィッティング部と、
上記フィッティング結果に基づき、上記検出された各ピークのトーン成分らしさを示すスコアを得るスコア化部とを備える
請求項1に記載の音検出装置。 - 上記特徴量抽出部は、
上記平滑化された尤度分布を周波数方向および/または時間方向に間引く間引き部をさらに備える
請求項1または請求項2に記載の音検出装置。 - 上記特徴量抽出部は、
上記平滑化された尤度分布を量子化する量子化部をさらに備える
請求項1または請求項2に記載の音検出装置。 - 上記比較部は、
上記所定数の被検出音のそれぞれについて、上記保持されている被検出音の特徴量列と上記特徴量抽出部で抽出された特徴量列との間の対応する特徴量間の相関演算で類似度を求め、該求められた類似度に基づいて上記被検出音の検出結果を得る
請求項1から請求項4のいずれかに記載の音検出装置。 - 上記所定数の被検出音の検出結果を時刻情報と共に記録媒体に記録する記録制御部をさらに備える
請求項1から請求項5のいずれかに記載の音検出装置。 - 入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出ステップと、
上記特徴量抽出ステップで新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較ステップとを備え、
上記特徴量抽出ステップでは、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得、該時間周波数分布よりトーンらしさの尤度分布を求め、該尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
音検出方法。 - コンピュータに、
入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出ステップと、
上記特徴量抽出ステップで新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較ステップとを備え、
上記特徴量抽出ステップでは、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得、該時間周波数分布よりトーンらしさの尤度分布を求め、該尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
音検出方法を実行させるためのプログラム。 - 入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出部と、
上記尤度分布を周波数方向および時間方向に平滑化して所定時間毎の特徴量を抽出する特徴量抽出部とを備える
音特徴量抽出装置。 - 上記尤度分布検出部は、
上記時間周波数分布の各時間フレームにおいて周波数方向のピークを検出するピーク検出部と、
上記検出された各ピークにおいてトーンモデルをフィッティングするフィッティング部と、
上記フィッティング結果に基づき、上記検出された各ピークのトーン成分らしさを示すスコアを得るスコア化部とを備える
請求項9に記載の音特徴量抽出装置。 - 上記平滑化された尤度分布を周波数方向および/または時間方向に間引く間引き部をさらに備える
請求項9または請求項10に記載の音特徴量抽出装置。 - 上記平滑化された尤度分布を量子化する量子化部をさらに備える
請求項9または請求項10に記載の音特徴量抽出装置。 - 上記入力時間信号に基づいて音区間を検出する音区間検出部をさらに備え、
上記尤度分布検出部は、
上記検出された音区間の範囲で上記時間周波数分布よりトーンらしさの尤度分布を求める
請求項9から請求項12のいずれかに記載の音特徴量抽出装置。 - 上記音区間検出部は、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する特徴量抽出部と、
上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化部と、
上記得られた時間フレーム毎のスコアを時間方向に平滑化する時間平滑化部と、
上記平滑化された時間フレーム毎のスコアを閾値判定して音区間情報を得る閾値判定部とを有する
請求項13に記載の音特徴量抽出装置。 - 入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換ステップと、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出ステップと、
上記尤度分布を周波数方向および時間方向に平滑化する平滑化ステップとを備える
音特徴量抽出方法。 - 入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する特徴量抽出部と、
上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化部とを備える
音区間検出装置。 - 上記得られた時間フレーム毎のスコアを時間方向に平滑化する時間平滑化部と、
上記平滑化された時間フレーム毎のスコアを閾値判定して音区間情報を得る閾値判定部とをさらに備える
請求項16に記載の音区間検出装置。 - 入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換ステップと、
上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する特徴量抽出ステップと、
上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化ステップとを備える
音区間検出方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012094395A JP5998603B2 (ja) | 2012-04-18 | 2012-04-18 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
CN201380019489.0A CN104221018A (zh) | 2012-04-18 | 2013-04-16 | 声音检测装置、声音检测方法、声音特征值检测装置、声音特征值检测方法、声音区间检测装置、声音区间检测方法及程序 |
PCT/JP2013/002581 WO2013157254A1 (en) | 2012-04-18 | 2013-04-16 | Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program |
US14/385,856 US20150043737A1 (en) | 2012-04-18 | 2013-04-16 | Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program |
IN8472DEN2014 IN2014DN08472A (ja) | 2012-04-18 | 2013-04-16 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012094395A JP5998603B2 (ja) | 2012-04-18 | 2012-04-18 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013222113A JP2013222113A (ja) | 2013-10-28 |
JP2013222113A5 true JP2013222113A5 (ja) | 2015-02-26 |
JP5998603B2 JP5998603B2 (ja) | 2016-09-28 |
Family
ID=48652284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012094395A Active JP5998603B2 (ja) | 2012-04-18 | 2012-04-18 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150043737A1 (ja) |
JP (1) | JP5998603B2 (ja) |
CN (1) | CN104221018A (ja) |
IN (1) | IN2014DN08472A (ja) |
WO (1) | WO2013157254A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150179167A1 (en) * | 2013-12-19 | 2015-06-25 | Kirill Chekhter | Phoneme signature candidates for speech recognition |
CN103793190A (zh) * | 2014-02-07 | 2014-05-14 | 北京京东方视讯科技有限公司 | 一种信息显示方法、信息显示装置及显示设备 |
JP6362358B2 (ja) * | 2014-03-05 | 2018-07-25 | 大阪瓦斯株式会社 | 作業完了報知装置 |
CN104217722B (zh) * | 2014-08-22 | 2017-07-11 | 哈尔滨工程大学 | 一种海豚哨声信号时频谱轮廓提取方法 |
CN104810025B (zh) * | 2015-03-31 | 2018-04-20 | 天翼爱音乐文化科技有限公司 | 音频相似度检测方法及装置 |
US10079012B2 (en) | 2015-04-21 | 2018-09-18 | Google Llc | Customizing speech-recognition dictionaries in a smart-home environment |
US10178474B2 (en) * | 2015-04-21 | 2019-01-08 | Google Llc | Sound signature database for initialization of noise reduction in recordings |
JP6524814B2 (ja) * | 2015-06-18 | 2019-06-05 | Tdk株式会社 | 会話検出装置及び会話検出方法 |
JP6448477B2 (ja) * | 2015-06-19 | 2019-01-09 | 株式会社東芝 | 行動判定装置及び行動判定方法 |
CN105391501B (zh) * | 2015-10-13 | 2017-11-21 | 哈尔滨工程大学 | 一种基于时频谱平移的仿海豚哨声水声通信方法 |
WO2017098601A1 (ja) * | 2015-12-09 | 2017-06-15 | 三菱電機株式会社 | 劣化個所推定装置、劣化個所推定方法および移動体の診断システム |
CN105871475B (zh) * | 2016-05-25 | 2018-05-18 | 哈尔滨工程大学 | 一种基于自适应干扰抵消的仿鲸鱼叫声隐蔽水声通信方法 |
CN106251860B (zh) * | 2016-08-09 | 2020-02-11 | 张爱英 | 面向安防领域的无监督的新颖性音频事件检测方法及系统 |
US9870719B1 (en) | 2017-04-17 | 2018-01-16 | Hz Innovations Inc. | Apparatus and method for wireless sound recognition to notify users of detected sounds |
JP7017488B2 (ja) * | 2018-09-14 | 2022-02-08 | 株式会社日立製作所 | 音点検システムおよび音点検方法 |
JP7266390B2 (ja) * | 2018-11-20 | 2023-04-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 行動識別方法、行動識別装置、行動識別プログラム、機械学習方法、機械学習装置及び機械学習プログラム |
KR102240455B1 (ko) * | 2019-06-11 | 2021-04-14 | 네이버 주식회사 | 동적 노트 매칭을 위한 전자 장치 및 그의 동작 방법 |
JP6759479B1 (ja) * | 2020-03-24 | 2020-09-23 | 株式会社 日立産業制御ソリューションズ | 音響分析支援システム、及び音響分析支援方法 |
US11410676B2 (en) * | 2020-11-18 | 2022-08-09 | Haier Us Appliance Solutions, Inc. | Sound monitoring and user assistance methods for a microwave oven |
CN112885374A (zh) * | 2021-01-27 | 2021-06-01 | 吴怡然 | 一种基于频谱分析的声音音准判断方法及系统 |
CN113724734B (zh) * | 2021-08-31 | 2023-07-25 | 上海师范大学 | 声音事件的检测方法、装置、存储介质及电子装置 |
CN115931358B (zh) * | 2023-02-24 | 2023-09-12 | 沈阳工业大学 | 一种低信噪比的轴承故障声发射信号诊断方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
JPH0926354A (ja) * | 1995-07-13 | 1997-01-28 | Sharp Corp | 音響・映像装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
MX2007012185A (es) * | 2005-04-01 | 2007-12-11 | Qualcomm Inc | Metodo y aparato para cuantificacion de vector de una representacion de envoltura espectral. |
CN101199004B (zh) * | 2005-04-22 | 2011-11-09 | 高通股份有限公司 | 用于增益因数平滑的系统、方法及设备 |
CN101336451B (zh) * | 2006-01-31 | 2012-09-05 | 西门子企业通讯有限责任两合公司 | 音频信号编码的方法和装置 |
US20100332222A1 (en) * | 2006-09-29 | 2010-12-30 | National Chiao Tung University | Intelligent classification method of vocal signal |
US20080300702A1 (en) * | 2007-05-29 | 2008-12-04 | Universitat Pompeu Fabra | Music similarity systems and methods using descriptors |
JP2009008823A (ja) * | 2007-06-27 | 2009-01-15 | Fujitsu Ltd | 音響認識装置、音響認識方法、及び、音響認識プログラム |
US20090198500A1 (en) * | 2007-08-24 | 2009-08-06 | Qualcomm Incorporated | Temporal masking in audio coding based on spectral dynamics in frequency sub-bands |
JP4788810B2 (ja) | 2009-08-17 | 2011-10-05 | ソニー株式会社 | 楽曲同定装置及び方法、楽曲同定配信装置及び方法 |
-
2012
- 2012-04-18 JP JP2012094395A patent/JP5998603B2/ja active Active
-
2013
- 2013-04-16 IN IN8472DEN2014 patent/IN2014DN08472A/en unknown
- 2013-04-16 CN CN201380019489.0A patent/CN104221018A/zh active Pending
- 2013-04-16 WO PCT/JP2013/002581 patent/WO2013157254A1/en active Application Filing
- 2013-04-16 US US14/385,856 patent/US20150043737A1/en not_active Abandoned
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2013222113A5 (ja) | ||
MY194965A (en) | Song determining method and device, and storage medium | |
WO2016026325A1 (zh) | 基于声纹特征进行认证的方法、终端及计算机存储介质 | |
JP2012226080A5 (ja) | ||
SG11201810131VA (en) | Identity authentication method and apparatus | |
CN106294331B (zh) | 音频信息检索方法及装置 | |
SG10201903085YA (en) | Voiceprint information management method and apparatus, and identity authentication method and system | |
JP2015197436A5 (ja) | 周期定常背景雑音を受ける信号内にイベントを検出する方法およびシステム | |
US9997168B2 (en) | Method and apparatus for signal extraction of audio signal | |
KR101666521B1 (ko) | 입력 신호의 피치 주기 검출 방법 및 그 장치 | |
WO2010077997A3 (en) | Method and apparatus for determining heart rate variability using wavelet transformation | |
JP2016522910A5 (ja) | ||
JP2016513843A5 (ja) | ||
JP2018159788A5 (ja) | 情報処理装置、感情認識方法、及び、プログラム | |
Zeppelzauer et al. | Acoustic detection of elephant presence in noisy environments | |
Bayer et al. | A multi modal approach to gesture recognition from audio and video data | |
EP2908269A3 (en) | Method and apparatus for managing audio visual, audio or visual content | |
CN107408207A8 (zh) | 指纹局部化 | |
JP2015097355A5 (ja) | ||
JP2016047207A5 (ja) | ||
JP2008015002A5 (ja) | ||
JP2009294537A5 (ja) | ||
Xie et al. | Detection of anuran calling activity in long field recordings for bio-acoustic monitoring | |
JP2007304869A5 (ja) | ||
Sahidullah | Enhancement of speaker recognition performance using block level, relative and temporal information of subband energies |