JP5998603B2 - 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム - Google Patents
音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム Download PDFInfo
- Publication number
- JP5998603B2 JP5998603B2 JP2012094395A JP2012094395A JP5998603B2 JP 5998603 B2 JP5998603 B2 JP 5998603B2 JP 2012094395 A JP2012094395 A JP 2012094395A JP 2012094395 A JP2012094395 A JP 2012094395A JP 5998603 B2 JP5998603 B2 JP 5998603B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- sound
- unit
- frequency
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/686—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Description
(2)再生デバイスの質が悪いため、音が割れていたり、共振が発生して周波数特性が極端に歪んでいたりすることがある。
(3)空間伝播により、家庭電化製品自体が発した音と比べて振幅・位相周波数特性が歪むことがある。例えば、図17(a)は、家庭電化製品に近い位置で録音した動作状況音の波形例を示している。これに対して、図17(b)は、家庭電化製品から遠い位置で録音した動作状況音の波形例を示しているが、歪んだものとなっている。
(5)家庭電化製品毎の音の大きさやマイクロフォンまでの距離がそれぞれの家電に依存するため、録音される音の音量がまちまちになる。
入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出部と、
所定数の被検出音の特徴量列を保持する特徴量保持部と、
上記特徴量抽出部で新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、上記保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較部とを備え、
上記特徴量抽出部は、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出部と、
上記尤度分布を周波数方向および時間方向に平滑化する平滑化部とを有し、
上記平滑化された尤度分布から上記所定時間毎の特徴量を抽出する
音検出装置にある。
入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出部と、
上記尤度分布を周波数方向および時間方向に平滑化して所定時間毎の特徴量を抽出する特徴量抽出部とを備える
音特徴量抽出装置にある。
入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する特徴量抽出部と、
上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化部とを備える
音区間検出装置にある。
1.実施の形態
2.変形例
[音検出装置]
図1は、実施の形態としての音検出装置100の構成例を示している。この音検出部100は、マイクロフォン101と、音検出部102と、特徴量データベース103と、記録・表示部104を有している。
図2は、特徴量データベース103に、被検出音の特徴量列を登録する特徴量登録装置200の構成例を示している。この特徴量登録装置200は、マイクロフォン201と、音区間検出部202と、特徴量抽出部203と、特徴量登録部204を有している。
図4は、音区間検出部202の構成例を示している。この音区間検出部202の入力は、登録すべき被検出音(家電で発せられる動作状況音)をマイクロフォン201で録音して得られる時間信号f(t)であり、図3示すように、前後にノイズ区間も含まれる。また、この音区間検出部202の出力は、実際に登録すべき有意な音(被検出音)のある音区間を示す音区間情報である。
図12は、特徴量抽出部203の構成例を示している。この特徴量抽出部203の入力は、登録すべき被検出音(家電で発せられる動作状況音)をマイクロフォン201で録音して得られる時間信号f(t)であり、図3示すように、前後にノイズ区間も含まれる。また、この特徴量抽出部203の出力は、登録すべき被検出音の区間で所定時間毎に抽出された特徴量の列である。
図13は、音検出部102の構成例を示している。この音検出部102は、信号バッファ部121と、特徴量抽出部122と、特徴量バッファ部123と、比較部124を有している。信号バッファ部121は、マイクロフォン101で集音されて得られる時間信号f(t)の信号サンプルを所定数バッファリングする。所定数とは、特徴量抽出部122が新たに1フレーム分の特徴量列を計算できるだけのサンプル数である。
なお、上述実施の形態においては、家庭内において、家電から発せられる動作状況音(操作音、通知音、動作音、警報音など)を検出する例を示した。しかし、本技術は、家庭内の用途に限らず、生産工場などで製造された製品の音機能に関する検査の自動化にも用いることができる。また、動作状況音の検出だけに限られるものではなく、特定の人や動物の音声、さらにはその他の環境音の検出にも、本技術を適用できることは勿論である。
(1)入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出部と、
所定数の被検出音の特徴量列を保持する特徴量保持部と、
上記特徴量抽出部で新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、上記保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較部とを備え、
上記特徴量抽出部は、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出部とを有し、
上記求められた尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
音検出装置。
(2)上記尤度分布検出部は、
上記時間周波数分布の各時間フレームにおいて周波数方向のピークを検出するピーク検出部と、
上記検出された各ピークにおいてトーンモデルをフィッティングするフィッティング部と、
上記フィッティング結果に基づき、上記検出された各ピークのトーン成分らしさを示すスコアを得るスコア化部とを備える
前記(1)に記載の音検出装置。
(3)上記特徴量抽出部は、
上記平滑化された尤度分布を周波数方向および/または時間方向に間引く間引き部をさらに備える
前記(1)または(2)に記載の音検出装置。
(4)上記特徴量抽出部は、
上記平滑化された尤度分布を量子化する量子化部をさらに備える
前記(1)または(2)に記載の音検出装置。
(5)上記比較部は、
上記所定数の被検出音のそれぞれについて、上記保持されている被検出音の特徴量列と上記特徴量抽出部で抽出された特徴量列との間の対応する特徴量間の相関演算で類似度を求め、該求められた類似度に基づいて上記被検出音の検出結果を得る
前記(1)から(4)のいずれかに記載の音検出装置。
(6)上記所定数の被検出音の検出結果を時刻情報と共に記録媒体に記録する記録制御部をさらに備える
前記(1)から(5)のいずれかに記載の音検出装置。
(7)入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出ステップと、
上記特徴量抽出ステップで新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較ステップとを備え、
上記特徴量抽出ステップでは、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得、該時間周波数分布よりトーンらしさの尤度分布を求め、該尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
音検出方法。
(8)コンピュータに、
入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出ステップと、
上記特徴量抽出ステップで新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較ステップとを備え、
上記特徴量抽出ステップでは、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得、該時間周波数分布よりトーンらしさの尤度分布を求め、該尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
音検出方法を実行させるためのプログラム。
(9)入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出部と、
上記尤度分布を周波数方向および時間方向に平滑化して所定時間毎の特徴量を抽出する特徴量抽出部とを備える
音特徴量抽出装置。
(10)上記尤度分布検出部は、
上記時間周波数分布の各時間フレームにおいて周波数方向のピークを検出するピーク検出部と、
上記検出された各ピークにおいてトーンモデルをフィッティングするフィッティング部と、
上記フィッティング結果に基づき、上記検出された各ピークのトーン成分らしさを示すスコアを得るスコア化部とを備える
前記(9)に記載の音特徴量抽出装置。
(11)上記平滑化された尤度分布を周波数方向および/または時間方向に間引く間引き部をさらに備える
前記(9)または(10)に記載の音特徴量抽出装置。
(12)上記平滑化された尤度分布を量子化する量子化部をさらに備える
前記(9)または(10)に記載の音特徴量抽出装置。
(13)上記入力時間信号に基づいて音区間を検出する音区間検出部をさらに備え、
上記尤度分布検出部は、
上記検出された音区間の範囲で上記時間周波数分布よりトーンらしさの尤度分布を求める
前記(9)から(12)のいずれかに記載の音特徴量抽出装置。
(14)上記音区間検出部は、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する特徴量抽出部と、
上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化部と、
上記得られた時間フレーム毎のスコアを時間方向に平滑化する時間平滑化部と、
上記平滑化された時間フレーム毎のスコアを閾値判定して音区間情報を得る閾値判定部とを有する
前記(13)に記載の音特徴量抽出装置。
(15)入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換ステップと、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出ステップと、
上記尤度分布を周波数方向および時間方向に平滑化する平滑化ステップとを備える
音特徴量抽出方法。
(16)入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する特徴量抽出部と、
上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化部とを備える
音区間検出装置。
(17)上記得られた時間フレーム毎のスコアを時間方向に平滑化する時間平滑化部と、
上記平滑化された時間フレーム毎のスコアを閾値判定して音区間情報を得る閾値判定部とをさらに備える
前記(16)に記載の音区間検出装置。
(18)入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換ステップと、
上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する特徴量抽出ステップと、
上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化ステップとを備える
音区間検出方法。
101・・・マイクロフォン
102・・・音検出部
103・・・特徴量データベース
104・・・記録・表示部
121・・・信号バッファ部
122・・・特徴量抽出部
123・・・特徴量バッファ部
124・・・比較部
200・・・特徴量登録装置
201・・・マイクロフォン
202・・・音区間検出部
203・・・特徴量抽出部
204・・・特徴量登録部
221・・・時間周波数変換部
222・・・振幅特徴量計算部
223・・・トーン強度特徴量計算部
224・・・スペクトル概形特徴量計算部
225・・・スコア計算部
226・・・時間平滑化部
227・・・閾値判定部
230・・・トーン尤度分布検出部
231・・・ピーク検出部
232・・・フィッティング部
233・・・特徴量抽出部
234・・・スコア化部
241・・・時間周波数変換部
242・・・トーン尤度分布検出部
243・・・時間周波数変換部
244・・・真引き・量子化部
Claims (15)
- 入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出部と、
所定数の被検出音の特徴量列を保持する特徴量保持部と、
上記特徴量抽出部で新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、上記保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較部とを備え、
上記特徴量抽出部は、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換部と、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出部とを有し、
上記求められた尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
音検出装置。 - 上記尤度分布検出部は、
上記時間周波数分布の各時間フレームにおいて周波数方向のピークを検出するピーク検出部と、
上記検出された各ピークにおいてトーンモデルをフィッティングするフィッティング部と、
上記フィッティング結果に基づき、上記検出された各ピークのトーン成分らしさを示すスコアを得るスコア化部とを備える
請求項1に記載の音検出装置。 - 上記特徴量抽出部は、
上記平滑化された尤度分布を周波数方向および/または時間方向に間引く間引き部をさらに備える
請求項1または請求項2に記載の音検出装置。 - 上記特徴量抽出部は、
上記平滑化された尤度分布を量子化する量子化部をさらに備える
請求項1または請求項2に記載の音検出装置。 - 上記比較部は、
上記所定数の被検出音のそれぞれについて、上記保持されている被検出音の特徴量列と上記特徴量抽出部で抽出された特徴量列との間の対応する特徴量間の相関演算で類似度を求め、該求められた類似度に基づいて上記被検出音の検出結果を得る
請求項1から請求項4のいずれかに記載の音検出装置。 - 上記所定数の被検出音の検出結果を時刻情報と共に記録媒体に記録する記録制御部をさらに備える
請求項1から請求項5のいずれかに記載の音検出装置。 - 入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出ステップと、
上記特徴量抽出ステップで新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較ステップとを備え、
上記特徴量抽出ステップでは、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得、該時間周波数分布よりトーンらしさの尤度分布を求め、該尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
音検出方法。 - コンピュータに、
入力時間信号から所定時間毎の特徴量を抽出する特徴量抽出ステップと、
上記特徴量抽出ステップで新たに特徴量が抽出される毎に、該特徴量抽出部で抽出された特徴量の列を、保持されている所定数の被検出音の特徴量列とそれぞれ比較して、上記所定数の被検出音の検出結果を得る比較ステップとを備え、
上記特徴量抽出ステップでは、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得、該時間周波数分布よりトーンらしさの尤度分布を求め、該尤度分布を周波数方向および時間方向に平滑化して上記所定時間毎の特徴量を抽出する
音検出方法を実行させるためのプログラム。 - 入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る第1の時間周波数変換部と、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出部と、
上記尤度分布を周波数方向および時間方向に平滑化して所定時間毎の特徴量を抽出する第1の特徴量抽出部とを備える
音特徴量抽出装置。 - 上記尤度分布検出部は、
上記時間周波数分布の各時間フレームにおいて周波数方向のピークを検出するピーク検出部と、
上記検出された各ピークにおいてトーンモデルをフィッティングするフィッティング部と、
上記フィッティング結果に基づき、上記検出された各ピークのトーン成分らしさを示すスコアを得るスコア化部とを備える
請求項9に記載の音特徴量抽出装置。 - 上記平滑化された尤度分布を周波数方向および/または時間方向に間引く間引き部をさらに備える
請求項9または請求項10に記載の音特徴量抽出装置。 - 上記平滑化された尤度分布を量子化する量子化部をさらに備える
請求項9または請求項10に記載の音特徴量抽出装置。 - 上記入力時間信号に基づいて音区間を検出する音区間検出部をさらに備え、
上記尤度分布検出部は、
上記検出された音区間の範囲で上記時間周波数分布よりトーンらしさの尤度分布を求める
請求項9から請求項12のいずれかに記載の音特徴量抽出装置。 - 上記音区間検出部は、
上記入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る第2の時間周波数変換部と、
上記時間周波数分布に基づいて、時間フレーム毎の、振幅、トーン成分強度およびスペクトル概形の特徴量を抽出する第2の特徴量抽出部と、
上記抽出された特徴量に基づいて、時間フレーム毎の、音区間らしさを示すスコアを得るスコア化部と、
上記得られた時間フレーム毎のスコアを時間方向に平滑化する時間平滑化部と、
上記平滑化された時間フレーム毎のスコアを閾値判定して音区間情報を得る閾値判定部とを有する
請求項13に記載の音特徴量抽出装置。 - 入力時間信号を時間フレーム毎に時間周波数変換して時間周波数分布を得る時間周波数変換ステップと、
上記時間周波数分布よりトーンらしさの尤度分布を求める尤度分布検出ステップと、
上記尤度分布を周波数方向および時間方向に平滑化する平滑化ステップとを備える
音特徴量抽出方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012094395A JP5998603B2 (ja) | 2012-04-18 | 2012-04-18 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
IN8472DEN2014 IN2014DN08472A (ja) | 2012-04-18 | 2013-04-16 | |
PCT/JP2013/002581 WO2013157254A1 (en) | 2012-04-18 | 2013-04-16 | Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program |
US14/385,856 US20150043737A1 (en) | 2012-04-18 | 2013-04-16 | Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program |
CN201380019489.0A CN104221018A (zh) | 2012-04-18 | 2013-04-16 | 声音检测装置、声音检测方法、声音特征值检测装置、声音特征值检测方法、声音区间检测装置、声音区间检测方法及程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012094395A JP5998603B2 (ja) | 2012-04-18 | 2012-04-18 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013222113A JP2013222113A (ja) | 2013-10-28 |
JP2013222113A5 JP2013222113A5 (ja) | 2015-02-26 |
JP5998603B2 true JP5998603B2 (ja) | 2016-09-28 |
Family
ID=48652284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012094395A Active JP5998603B2 (ja) | 2012-04-18 | 2012-04-18 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150043737A1 (ja) |
JP (1) | JP5998603B2 (ja) |
CN (1) | CN104221018A (ja) |
IN (1) | IN2014DN08472A (ja) |
WO (1) | WO2013157254A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150179167A1 (en) * | 2013-12-19 | 2015-06-25 | Kirill Chekhter | Phoneme signature candidates for speech recognition |
CN103793190A (zh) * | 2014-02-07 | 2014-05-14 | 北京京东方视讯科技有限公司 | 一种信息显示方法、信息显示装置及显示设备 |
JP6362358B2 (ja) * | 2014-03-05 | 2018-07-25 | 大阪瓦斯株式会社 | 作業完了報知装置 |
CN104217722B (zh) * | 2014-08-22 | 2017-07-11 | 哈尔滨工程大学 | 一种海豚哨声信号时频谱轮廓提取方法 |
CN104810025B (zh) * | 2015-03-31 | 2018-04-20 | 天翼爱音乐文化科技有限公司 | 音频相似度检测方法及装置 |
US10079012B2 (en) | 2015-04-21 | 2018-09-18 | Google Llc | Customizing speech-recognition dictionaries in a smart-home environment |
US10178474B2 (en) * | 2015-04-21 | 2019-01-08 | Google Llc | Sound signature database for initialization of noise reduction in recordings |
JP6524814B2 (ja) * | 2015-06-18 | 2019-06-05 | Tdk株式会社 | 会話検出装置及び会話検出方法 |
JP6448477B2 (ja) * | 2015-06-19 | 2019-01-09 | 株式会社東芝 | 行動判定装置及び行動判定方法 |
CN105391501B (zh) * | 2015-10-13 | 2017-11-21 | 哈尔滨工程大学 | 一种基于时频谱平移的仿海豚哨声水声通信方法 |
CN108291837B (zh) * | 2015-12-09 | 2020-02-14 | 三菱电机株式会社 | 劣化部位估计装置、劣化部位估计方法以及移动体的诊断系统 |
CN105871475B (zh) * | 2016-05-25 | 2018-05-18 | 哈尔滨工程大学 | 一种基于自适应干扰抵消的仿鲸鱼叫声隐蔽水声通信方法 |
CN106251860B (zh) * | 2016-08-09 | 2020-02-11 | 张爱英 | 面向安防领域的无监督的新颖性音频事件检测方法及系统 |
US9870719B1 (en) * | 2017-04-17 | 2018-01-16 | Hz Innovations Inc. | Apparatus and method for wireless sound recognition to notify users of detected sounds |
JP7017488B2 (ja) * | 2018-09-14 | 2022-02-08 | 株式会社日立製作所 | 音点検システムおよび音点検方法 |
JP7266390B2 (ja) * | 2018-11-20 | 2023-04-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 行動識別方法、行動識別装置、行動識別プログラム、機械学習方法、機械学習装置及び機械学習プログラム |
KR102240455B1 (ko) * | 2019-06-11 | 2021-04-14 | 네이버 주식회사 | 동적 노트 매칭을 위한 전자 장치 및 그의 동작 방법 |
JP6759479B1 (ja) * | 2020-03-24 | 2020-09-23 | 株式会社 日立産業制御ソリューションズ | 音響分析支援システム、及び音響分析支援方法 |
US11410676B2 (en) * | 2020-11-18 | 2022-08-09 | Haier Us Appliance Solutions, Inc. | Sound monitoring and user assistance methods for a microwave oven |
CN112885374A (zh) * | 2021-01-27 | 2021-06-01 | 吴怡然 | 一种基于频谱分析的声音音准判断方法及系统 |
CN113724734B (zh) * | 2021-08-31 | 2023-07-25 | 上海师范大学 | 声音事件的检测方法、装置、存储介质及电子装置 |
CN115931358B (zh) * | 2023-02-24 | 2023-09-12 | 沈阳工业大学 | 一种低信噪比的轴承故障声发射信号诊断方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
JPH0926354A (ja) * | 1995-07-13 | 1997-01-28 | Sharp Corp | 音響・映像装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
WO2006107833A1 (en) * | 2005-04-01 | 2006-10-12 | Qualcomm Incorporated | Method and apparatus for vector quantizing of a spectral envelope representation |
US9043214B2 (en) * | 2005-04-22 | 2015-05-26 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor attenuation |
EP1979901B1 (de) * | 2006-01-31 | 2015-10-14 | Unify GmbH & Co. KG | Verfahren und anordnungen zur audiosignalkodierung |
US20100332222A1 (en) * | 2006-09-29 | 2010-12-30 | National Chiao Tung University | Intelligent classification method of vocal signal |
US20080300702A1 (en) * | 2007-05-29 | 2008-12-04 | Universitat Pompeu Fabra | Music similarity systems and methods using descriptors |
JP2009008823A (ja) * | 2007-06-27 | 2009-01-15 | Fujitsu Ltd | 音響認識装置、音響認識方法、及び、音響認識プログラム |
US20090198500A1 (en) * | 2007-08-24 | 2009-08-06 | Qualcomm Incorporated | Temporal masking in audio coding based on spectral dynamics in frequency sub-bands |
JP4788810B2 (ja) | 2009-08-17 | 2011-10-05 | ソニー株式会社 | 楽曲同定装置及び方法、楽曲同定配信装置及び方法 |
-
2012
- 2012-04-18 JP JP2012094395A patent/JP5998603B2/ja active Active
-
2013
- 2013-04-16 CN CN201380019489.0A patent/CN104221018A/zh active Pending
- 2013-04-16 WO PCT/JP2013/002581 patent/WO2013157254A1/en active Application Filing
- 2013-04-16 US US14/385,856 patent/US20150043737A1/en not_active Abandoned
- 2013-04-16 IN IN8472DEN2014 patent/IN2014DN08472A/en unknown
Also Published As
Publication number | Publication date |
---|---|
CN104221018A (zh) | 2014-12-17 |
WO2013157254A1 (en) | 2013-10-24 |
JP2013222113A (ja) | 2013-10-28 |
IN2014DN08472A (ja) | 2015-05-08 |
US20150043737A1 (en) | 2015-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5998603B2 (ja) | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム | |
US10504539B2 (en) | Voice activity detection systems and methods | |
KR101266894B1 (ko) | 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법 | |
JP5749346B2 (ja) | マルチチャネルオーディオ信号を分解するための方法、装置およびコンピュータ可読記憶媒体 | |
US8775173B2 (en) | Erroneous detection determination device, erroneous detection determination method, and storage medium storing erroneous detection determination program | |
JP6454916B2 (ja) | 音声処理装置、音声処理方法及びプログラム | |
KR20060044629A (ko) | 신경 회로망을 이용한 음성 신호 분리 시스템 및 방법과음성 신호 강화 시스템 | |
JP4572218B2 (ja) | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 | |
WO2013022930A1 (en) | System and method of processing a sound signal including transforming the sound signal into a frequency-chirp domain | |
JP2014512022A (ja) | スペクトル挙動の変換を実行する音響信号処理システム及び方法 | |
CN108305639B (zh) | 语音情感识别方法、计算机可读存储介质、终端 | |
JP2011033717A (ja) | 雑音抑圧装置 | |
CN108682432B (zh) | 语音情感识别装置 | |
CN107533848B (zh) | 用于话音恢复的系统和方法 | |
JP4607908B2 (ja) | 音声区間検出装置および音声区間検出方法 | |
US8532986B2 (en) | Speech signal evaluation apparatus, storage medium storing speech signal evaluation program, and speech signal evaluation method | |
JP2015069063A (ja) | 音声認識システム、音声認識方法、及び音声認識プログラム | |
JP2021536596A (ja) | 正規化を介して音響信号をフィンガープリンティングするための方法及び装置 | |
CN107210029B (zh) | 用于处理一连串信号以进行复调音符辨识的方法和装置 | |
JP6724290B2 (ja) | 音響処理装置、音響処理方法、及び、プログラム | |
JPH0675562A (ja) | 自動採譜装置 | |
CN113593604A (zh) | 检测音频质量方法、装置及存储介质 | |
US11004463B2 (en) | Speech processing method, apparatus, and non-transitory computer-readable storage medium for storing a computer program for pitch frequency detection based upon a learned value | |
JP6633579B2 (ja) | 音響信号処理装置、方法及びプログラム | |
JP6653687B2 (ja) | 音響信号処理装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150106 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151222 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160815 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5998603 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |