JP6531412B2 - 目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム - Google Patents
目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム Download PDFInfo
- Publication number
- JP6531412B2 JP6531412B2 JP2015023518A JP2015023518A JP6531412B2 JP 6531412 B2 JP6531412 B2 JP 6531412B2 JP 2015023518 A JP2015023518 A JP 2015023518A JP 2015023518 A JP2015023518 A JP 2015023518A JP 6531412 B2 JP6531412 B2 JP 6531412B2
- Authority
- JP
- Japan
- Prior art keywords
- target sound
- smoothing
- power
- threshold
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 411
- 238000009499 grossing Methods 0.000 claims description 238
- 238000004364 calculation method Methods 0.000 claims description 76
- 230000006870 function Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000010354 integration Effects 0.000 claims 1
- 206010019133 Hangover Diseases 0.000 description 56
- 230000000694 effects Effects 0.000 description 54
- 238000010586 diagram Methods 0.000 description 22
- 238000000034 method Methods 0.000 description 19
- 238000005516 engineering process Methods 0.000 description 13
- 238000005070 sampling Methods 0.000 description 2
- 101001128814 Pandinus imperator Pandinin-1 Proteins 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Quality & Reliability (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
以下、本発明による目的音区間検出装置及びプログラム、並びに、雑音推定装置及びプログラムの第1の実施形態を、図面を参照しながら説明する。
図1は、第1の実施形態の音声区間検出装置の構成を示すブロック図である。
次に、上述した構成を有する第1の実施形態の音声区間検出装置100の動作を説明する。まず、第1の実施形態の音声区間検出装置100の全体動作を説明した後、第1の音声区間検出部102及び第2の音声区間検出部103の動作を順に説明し、さらに、ハングオーバー動作についても説明する。
次に、第1の実施形態の音声区間検出装置100の構成に至った考え方(後述する実施形態も同様である)を説明する。
第1の実施形態によれば、第1の音声区間検出部及び第2の音声区間検出部が互いのパラメータ(音声パワーの平均的な値の推定値(平滑化パワーP1)及び音声区間の検出結果、並びに、雑音パワーの平均的な値の推定値(平滑化パワーP2)及び音声区間の検出結果)の更新を補い合うことで、パラメータを安定に更新させることができ、精度の高い音声区間の検出結果を得ることができる。
上述した第1の実施形態の説明では、第2の音声区間検出部103(言い換えると第2の音声区間判定部303)がハングオーバー動作をしても良く、また、ハングオーバー動作をしなくても良い旨を説明した。ハングオーバー動作を行う場合であれば、第1の音声区間検出部102にフィードバックされる音声区間真偽値も次段の装置に出力される音声区間真偽値もハングオーバー動作されたものとなり、ハングオーバー動作を行なわない場合であれば、第1の音声区間検出部102にフィードバックされる音声区間真偽値も次段の装置に出力される音声区間真偽値もハングオーバー動作がなされていないものとなる。
次に、本発明による目的音区間検出装置及びプログラムの第2の実施形態を、図面を参照しながら説明する。
第2の実施形態の音声区間検出装置(以下、符号「100B」を用いる)の全体構成も、上述した図1で表すことができる。但し、第1の音声区間検出部(以下、符号「102B」を用いる)及び第2の音声区間検出部(以下、符号「103B」を用いる)の詳細な構成が第1の実施形態と異なっている。そのため、以下では、主として、第1の音声区間検出部102B及び第2の音声区間検出部103Bの詳細構成を説明する。
次に、第2の実施形態の音声区間検出装置100Bの動作を説明する。第2の実施形態の音声区間検出装置100Bの全体動作も第1の実施形態の音声区間検出装置100の全体動作と同様であるので全体動作の説明は省略し、以下では、第2の実施形態における第1の音声区間検出部102B及び第2の音声区間検出部103Bの動作を順に説明する。
第2の実施形態によっても、第1の音声区間検出部及び第2の音声区間検出部が互いのパラメータ(音声パワーの平均的な値の推定値(平滑化パワーP1)と雑音パワーの平均的な値の推定値(平滑化パワーP2))の更新を補い合うことで、パラメータを安定に更新させることができ、精度の高い音声区間の検出結果を得ることができる。
次に、本発明による目的音区間検出装置及びプログラムの第3の実施形態を、図面を参照しながら説明する。
第3の実施形態の音声区間検出装置(以下、符号「100C」を用いる)の全体構成も、上述した図1で表すことができる。但し、第1の音声区間検出部(以下、符号「102C」を用いる)及び第2の音声区間検出部(以下、符号「103C」を用いる)の詳細な構成などが第1の実施形態と異なっている。そのため、以下では、主として、第1の音声区間検出部102C及び第2の音声区間検出部103Cの詳細構成を説明する。
次に、第3の実施形態の音声区間検出装置100Cの動作を説明する。第3の実施形態の音声区間検出装置100Cの全体動作も第1の実施形態の音声区間検出装置100の全体動作と同様であるので全体動作の説明は省略する。また、第3の実施形態における第1の音声区間検出部102Cの動作も第1の実施形態における音声区間検出部102の動作と同様であるのでその動作説明は省略する。但し、第3の実施形態における第1の音声区間検出部102Cから、第1の平滑化パワーP1及び第1の音声区間真偽値V1を含む第1のパラメータF1が出力されるようになされている。以下では、第3の実施形態における第2の音声区間検出部103Cの動作を説明する。
第3の実施形態によれば、第1の音声区間検出部及び第2の音声区間検出部が、入力信号のパワーに基づく推定及び判定と、入力信号におけるSNRに基づく推定及び判定の、それぞれのパラメータと判定結果を使って互いに推定及び判定を行うので、精度の高い音声区間の検出結果を得ることができる。
上記では、第1の音声区間検出部が入力パワーに基づいて音声区間を検出し、第2の音声区間検出部がSNRに基づいて音声区間を検出するものを説明したが、第1の音声区間検出部がSNRに基づいて音声区間を検出し、第2の音声区間検出部が入力パワーに基づいて音声区間を検出するものであっても良く、また、第1の音声区間検出部も第2の音声区間検出部もSNRに基づいて音声区間を検出するものであっても良い。
上記各実施形態の説明においても種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
Claims (13)
- 入力信号における目的音区間を検出する目的音区間検出装置において、
上記入力信号について算出された第1の入力パワーに基づいた第1の特徴量と、内部で生成した第1の閾値とを比較して、上記入力信号における目的音区間を検出する第1の目的音区間検出手段と、
上記入力信号について算出された第2の入力パワーに基づいた第2の特徴量と、内部で生成した第2の閾値とを比較して、上記入力信号における目的音区間を検出する第2の目的音区間検出手段とを備え、
上記第1の目的音区間検出手段は、上記第2の目的音区間検出手段が所定の単位時間前に出力した、第2の目的音区間の検出結果を少なくとも含む第2のパラメータを用いて上記第1の閾値を生成し、
上記第2の目的音区間検出手段は、上記第1の目的音区間検出手段が同一の単位時間で出力した、第1の目的音区間の検出結果を少なくとも含む第1のパラメータを用いて上記第2の閾値を生成する
ことを特徴とする目的音区間検出装置。 - 上記第1の目的音区間検出手段は、
所定の単位時間前の上記第2の目的音区間の検出結果に基づいて平滑化の実行、停止を制御しながら、上記第1の入力パワーを平滑化して第1の平滑化パワーを算出する第1の平滑化部と、
上記第1の平滑化パワーを少なくとも適用して、上記第1の閾値を算出する第1の閾値算出部と、
上記第1の入力パワーを上記第1の特徴量として上記第1の閾値と比較して目的音区間か否かを判定し、上記第1の目的音区間の検出結果を得る第1の目的音区間判定部とを有し、
上記第2の目的音区間検出手段は、
同一の単位時間の上記第1の目的音区間の検出結果に基づいて平滑化の実行、停止を制御しながら、上記第2の入力パワーを平滑化して第2の平滑化パワーを算出する第2の平滑化部と、
上記第2の平滑化パワーを少なくとも適用して、上記第2の閾値を算出する第2の閾値算出部と、
上記第2の入力パワーを上記第2の特徴量として上記第2の閾値と比較して目的音区間か否かを判定し、上記第2の目的音区間の検出結果を得る第2の目的音区間判定部とを有する
ことを特徴とする請求項1に記載の目的音区間検出装置。 - 上記第1の平滑化部は、所定の単位時間前の上記第2の目的音区間の検出結果が目的音区間でない場合に上記第1の入力パワーの平滑化を実行し、所定の単位時間前の上記第2の目的音区間の検出結果が目的音区間の場合に上記第1の入力パワーの平滑化を停止して上記第1の平滑化パワーを維持させ、
上記第2の平滑化部は、同一の単位時間の上記第1の目的音区間の検出結果が目的音区間の場合に上記第2の入力パワーの平滑化を実行し、同一の単位時間の上記第1の目的音区間の検出結果が目的音区間でない場合に上記第2の入力パワーの平滑化を停止して上記第2の平滑化パワーを維持させる
ことを特徴とする請求項2に記載の目的音区間検出装置。 - 上記第1の平滑化部及び上記第2の平滑化部は、一方が、自己に入力された目的音区間の検出結果が目的音区間である場合に平滑化を実行し、他方が、自己に入力された目的音区間の検出結果が目的音区間でない場合に平滑化を実行するものであり、
上記第1の閾値算出部は、上記第1の平滑化パワーと所定の単位時間前の上記第2の平滑化パワーを適用して、上記第1の閾値を算出し、
上記第2の閾値算出部は、同一単位時間の上記第1の平滑化パワー及び上記第2の平滑化パワーを適用して、上記第2の閾値を算出する
ことを特徴とする請求項2に記載の目的音区間検出装置。 - 上記第1の閾値算出部は、上記第1の平滑化パワーと所定の単位時間前の上記第2の平滑化パワーとの相加平均若しくは相乗平均を上記第1の閾値として算出することを特徴とする請求項4に記載の目的音区間検出装置。
- 上記第2の閾値算出部は、同一の単位時間の上記第1の平滑化パワーと上記第2の平滑化パワーとの相加平均若しくは相乗平均を上記第2の閾値として算出することを特徴とする請求項4又は5に記載の目的音区間検出装置。
- 上記第1の目的音区間検出手段は、
所定の単位時間前の上記第2の目的音区間の検出結果に基づいて平滑化の実行、停止を制御しながら、上記第1の入力パワーを平滑化して第1の平滑化パワーを算出する第1の平滑化部と、
上記第1の平滑化パワーを少なくとも適用して、上記第1の閾値を算出する第1の閾値算出部と、
上記第1の入力パワーを上記第1の特徴量として上記第1の閾値と比較して目的音区間か否かを判定し、上記第1の目的音区間の検出結果を得る第1の目的音区間判定部とを有し、
上記第2の目的音区間検出手段は、
同一の単位時間の上記第2の入力パワー及び上記第1の平滑化パワーに基づいてSNRの推定値を算出するSNR算出部と、
同一の単位時間の上記第1の目的音区間の検出結果に基づいて、平滑化の実行、停止を制御しながら、上記SNR推定値を平滑化してSNRの平滑値を算出する第2の平滑化部と、
上記SNR平滑値を少なくとも適用して、上記第2の閾値を算出する第2の閾値算出部と、
上記SNR推定値を上記第2の特徴量として上記第2の閾値と比較して目的音区間か否かを判定し、上記第2の目的音区間の検出結果を得る第2の目的音区間判定部とを有する
ことを特徴とする請求項1に記載の目的音区間検出装置。 - 入力信号における目的音区間を検出する目的音区間検出装置において、
上記入力信号に対して周波数解析する周波数解析部と、
周波数解析で得られた複数の周波数帯域の信号のそれぞれにおける、目的音区間を検出する複数の帯域別目的音区間検出手段と、
上記各帯域別目的音区間検出手段における目的音区間の検出結果を統合する帯域別結果統合部とを有し、
上記各帯域別目的音区間検出手段として、それぞれ、請求項1に記載の目的音区間検出装置の構成を適用している
ことを特徴とする目的音区間検出装置。 - 入力信号における雑音パワーを推定する雑音推定装置において、
上記入力信号について算出された第1の入力パワーに基づいた第1の特徴量と、内部で生成した第1の閾値とを比較して、上記入力信号における目的音区間を検出する第1の目的音区間検出手段と、
上記入力信号について算出された第2の入力パワーに基づいた第2の特徴量と、内部で生成した第2の閾値とを比較して、上記入力信号における目的音区間を検出する第2の目的音区間検出手段とを備え、
上記第1の目的音区間検出手段は、
所定の単位時間前の上記第2の目的音区間の検出結果に基づいて平滑化の実行、停止を制御しながら、上記第1の入力パワーを平滑化して第1の平滑化パワーを算出する第1の平滑化部と、
上記第1の平滑化パワーを少なくとも適用して、上記第1の閾値を算出する第1の閾値算出部と、
上記第1の入力パワーを上記第1の特徴量として上記第1の閾値と比較して目的音区間か否かを判定し、上記第1の目的音区間の検出結果を得る第1の目的音区間判定部とを有し、
上記第2の目的音区間検出手段は、
同一の単位時間の上記第1の目的音区間の検出結果に基づいて平滑化の実行、停止を制御しながら、上記第2の入力パワーを平滑化して第2の平滑化パワーを算出する第2の平滑化部と、
上記第2の平滑化パワーを少なくとも適用して、上記第2の閾値を算出する第2の閾値算出部と、
上記第2の入力パワーを上記第2の特徴量として上記第2の閾値と比較して目的音区間か否かを判定し、上記第2の目的音区間の検出結果を得る第2の目的音区間判定部とを有し、
上記第1の平滑化部又は上記第2の平滑化部は、所定の単位時間前の上記第2の目的音区間の検出結果又は同一の単位時間の上記第1の目的音区間の検出結果が目的音区間でない場合に平滑化し、目的音区間である場合に平滑化を停止し、上記第1の平滑化パワー又は上記第2の平滑化パワーとして雑音パワーの推定値を得る
ことを特徴とする雑音推定装置。 - 入力信号におけるSNRを推定するSNR推定装置において、
上記入力信号について算出された第1の入力パワーに基づいた第1の特徴量と、内部で生成した第1の閾値とを比較して、上記入力信号における目的音区間を検出する第1の目的音区間検出手段と、
上記入力信号について算出された第2の入力パワーに基づいた第2の特徴量と、内部で生成した第2の閾値とを比較して、上記入力信号における目的音区間を検出する第2の目的音区間検出手段とを備え、
上記第1の目的音区間検出手段は、
所定の単位時間前の上記第2の目的音区間の検出結果に基づいて平滑化の実行、停止を制御しながら、上記第1の入力パワーを平滑化して第1の平滑化パワーを算出する第1の平滑化部と、
上記第1の平滑化パワーを少なくとも適用して、上記第1の閾値を算出する第1の閾値算出部と、
上記第1の入力パワーを上記第1の特徴量として上記第1の閾値と比較して目的音区間か否かを判定し、上記第1の目的音区間の検出結果を得る第1の目的音区間判定部とを有し、
上記第2の目的音区間検出手段は、
同一の単位時間の上記第2の入力パワー及び上記第1の平滑化パワーに基づいてSNRの推定値を算出するSNR算出部と、
同一の単位時間の上記第1の目的音区間の検出結果に基づいて、平滑化の実行、停止を制御しながら、上記SNR推定値を平滑化してSNRの平滑値を算出する第2の平滑化部と、
上記SNR平滑値を少なくとも適用して、上記第2の閾値を算出する第2の閾値算出部と、
上記SNR推定値を上記第2の特徴量として上記第2の閾値と比較して目的音区間か否かを判定し、上記第2の目的音区間の検出結果を得る第2の目的音区間判定部とを有し、
上記SNR算出部からの上記SNR推定値を上記入力信号におけるSNR推定値として得ることを特徴とするSNR推定装置。 - 入力信号における目的音区間を検出する目的音区間検出プログラムであって、
コンピュータを、
上記入力信号について算出された第1の入力パワーに基づいた第1の特徴量と、内部で生成した第1の閾値とを比較して、上記入力信号における目的音区間を検出する第1の目的音区間検出手段と、
上記入力信号について算出された第2の入力パワーに基づいた第2の特徴量と、内部で生成した第2の閾値とを比較して、上記入力信号における目的音区間を検出する第2の目的音区間検出手段として機能させるものであり、
上記第1の目的音区間検出手段は、上記第2の目的音区間検出手段が所定の単位時間前に出力した、第2の目的音区間の検出結果を少なくとも含む第2のパラメータを用いて上記第1の閾値を生成し、
上記第2の目的音区間検出手段は、上記第1の目的音区間検出手段が同一の単位時間で出力した、第1の目的音区間の検出結果を少なくとも含む第1のパラメータを用いて上記第2の閾値を生成する
ことを特徴とする目的音区間検出プログラム。 - 入力信号における雑音パワーを推定する雑音推定プログラムであって、
コンピュータを、
上記入力信号について算出された第1の入力パワーに基づいた第1の特徴量と、内部で生成した第1の閾値とを比較して、上記入力信号における目的音区間を検出する第1の目的音区間検出手段と、
上記入力信号について算出された第2の入力パワーに基づいた第2の特徴量と、内部で生成した第2の閾値とを比較して、上記入力信号における目的音区間を検出する第2の目的音区間検出手段として機能させるものであり、
上記第1の目的音区間検出手段は、
所定の単位時間前の上記第2の目的音区間の検出結果に基づいて平滑化の実行、停止を制御しながら、上記第1の入力パワーを平滑化して第1の平滑化パワーを算出する第1の平滑化部と、
上記第1の平滑化パワーを少なくとも適用して、上記第1の閾値を算出する第1の閾値算出部と、
上記第1の入力パワーを上記第1の特徴量として上記第1の閾値と比較して目的音区間か否かを判定し、上記第1の目的音区間の検出結果を得る第1の目的音区間判定部とを有し、
上記第2の目的音区間検出手段は、
同一の単位時間の上記第1の目的音区間の検出結果に基づいて平滑化の実行、停止を制御しながら、上記第2の入力パワーを平滑化して第2の平滑化パワーを算出する第2の平滑化部と、
上記第2の平滑化パワーを少なくとも適用して、上記第2の閾値を算出する第2の閾値算出部と、
上記第2の入力パワーを上記第2の特徴量として上記第2の閾値と比較して目的音区間か否かを判定し、上記第2の目的音区間の検出結果を得る第2の目的音区間判定部とを有し、
上記第1の平滑化部又は上記第2の平滑化部は、所定の単位時間前の上記第2の目的音区間の検出結果又は同一の単位時間の上記第1の目的音区間の検出結果が目的音区間でない場合に平滑化し、目的音区間である場合に平滑化を停止し、上記第1の平滑化パワー又は上記第2の平滑化パワーとして雑音パワーの推定値を得る
ことを特徴とする雑音推定プログラム。 - 入力信号におけるSNRを推定するSNR推定プログラムであって、
コンピュータを、
上記入力信号について算出された第1の入力パワーに基づいた第1の特徴量と、内部で生成した第1の閾値とを比較して、上記入力信号における目的音区間を検出する第1の目的音区間検出手段と、
上記入力信号について算出された第2の入力パワーに基づいた第2の特徴量と、内部で生成した第2の閾値とを比較して、上記入力信号における目的音区間を検出する第2の目的音区間検出手段として機能させ、
上記第1の目的音区間検出手段は、
所定の単位時間前の上記第2の目的音区間の検出結果に基づいて平滑化の実行、停止を制御しながら、上記第1の入力パワーを平滑化して第1の平滑化パワーを算出する第1の平滑化部と、
上記第1の平滑化パワーを少なくとも適用して、上記第1の閾値を算出する第1の閾値算出部と、
上記第1の入力パワーを上記第1の特徴量として上記第1の閾値と比較して目的音区間か否かを判定し、上記第1の目的音区間の検出結果を得る第1の目的音区間判定部とを有し、
上記第2の目的音区間検出手段は、
同一の単位時間の上記第2の入力パワー及び上記第1の平滑化パワーに基づいてSNRの推定値を算出するSNR算出部と、
同一の単位時間の上記第1の目的音区間の検出結果に基づいて、平滑化の実行、停止を制御しながら、上記SNR推定値を平滑化してSNRの平滑値を算出する第2の平滑化部と、
上記SNR平滑値を少なくとも適用して、上記第2の閾値を算出する第2の閾値算出部と、
上記SNR推定値を上記第2の特徴量として上記第2の閾値と比較して目的音区間か否かを判定し、上記第2の目的音区間の検出結果を得る第2の目的音区間判定部とを有し、
上記SNR算出部からの上記SNR推定値を上記入力信号におけるSNR推定値として得ることを特徴とするSNR推定プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015023518A JP6531412B2 (ja) | 2015-02-09 | 2015-02-09 | 目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム |
US15/011,465 US9779762B2 (en) | 2015-02-09 | 2016-01-29 | Object sound period detection apparatus, noise estimating apparatus and SNR estimation apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015023518A JP6531412B2 (ja) | 2015-02-09 | 2015-02-09 | 目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016145940A JP2016145940A (ja) | 2016-08-12 |
JP6531412B2 true JP6531412B2 (ja) | 2019-06-19 |
Family
ID=56565273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015023518A Active JP6531412B2 (ja) | 2015-02-09 | 2015-02-09 | 目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9779762B2 (ja) |
JP (1) | JP6531412B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110534099B (zh) * | 2019-09-03 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 语音唤醒处理方法、装置、存储介质及电子设备 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0424692A (ja) * | 1990-05-18 | 1992-01-28 | Ricoh Co Ltd | 音声区間検出方式 |
JP3255584B2 (ja) * | 1997-01-20 | 2002-02-12 | ロジック株式会社 | 有音検知装置および方法 |
JP3759685B2 (ja) * | 1999-05-18 | 2006-03-29 | 三菱電機株式会社 | 雑音区間判定装置,雑音抑圧装置及び推定雑音情報更新方法 |
JP3588030B2 (ja) * | 2000-03-16 | 2004-11-10 | 三菱電機株式会社 | 音声区間判定装置及び音声区間判定方法 |
JP4221537B2 (ja) * | 2000-06-02 | 2009-02-12 | 日本電気株式会社 | 音声検出方法及び装置とその記録媒体 |
JP4521673B2 (ja) * | 2003-06-19 | 2010-08-11 | 株式会社国際電気通信基礎技術研究所 | 発話区間検出装置、コンピュータプログラム及びコンピュータ |
US8938389B2 (en) * | 2008-12-17 | 2015-01-20 | Nec Corporation | Voice activity detector, voice activity detection program, and parameter adjusting method |
JP5725028B2 (ja) * | 2010-08-10 | 2015-05-27 | 日本電気株式会社 | 音声区間判定装置、音声区間判定方法および音声区間判定プログラム |
WO2012083552A1 (en) * | 2010-12-24 | 2012-06-28 | Huawei Technologies Co., Ltd. | Method and apparatus for voice activity detection |
US8990079B1 (en) * | 2013-12-15 | 2015-03-24 | Zanavox | Automatic calibration of command-detection thresholds |
-
2015
- 2015-02-09 JP JP2015023518A patent/JP6531412B2/ja active Active
-
2016
- 2016-01-29 US US15/011,465 patent/US9779762B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20160232916A1 (en) | 2016-08-11 |
JP2016145940A (ja) | 2016-08-12 |
US9779762B2 (en) | 2017-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101910679B1 (ko) | 마이크로폰 어레이를 위한 잡음 적응형 빔 형성 기법 | |
EP3511937B1 (en) | Device and method for sound source separation, and program | |
JP4886715B2 (ja) | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 | |
RU2008146747A (ru) | Регулировка усиления звука с использованием основанного на конкретной громкости обнаружения акустических событий | |
KR101670313B1 (ko) | 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법 | |
JP6260504B2 (ja) | オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム | |
US11869519B2 (en) | Apparatus and method for decomposing an audio signal using a variable threshold | |
TR201821299T4 (tr) | Kazanç faktörü yumuşatma için sistemler, yöntemler ve aparat. | |
JP4454591B2 (ja) | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 | |
US11183199B2 (en) | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic | |
US9002030B2 (en) | System and method for performing voice activity detection | |
JP6531412B2 (ja) | 目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム | |
JP6596833B2 (ja) | 雑音抑圧装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム | |
JP6064370B2 (ja) | 雑音抑圧装置、方法及びプログラム | |
JP6844149B2 (ja) | 利得調整装置および利得調整プログラム | |
JP5772562B2 (ja) | 目的音抽出装置及び目的音抽出プログラム | |
Lim et al. | Acoustic blur kernel with sliding window for blind estimation of reverberation time | |
KR100920625B1 (ko) | 피치 신호의 트래킹 방법, 피치 신호의 트래킹 시스템 및 컴퓨터 판독 가능 기록매체 | |
JP6729187B2 (ja) | 音声処理プログラム、音声処理方法及び音声処理装置 | |
JP6447357B2 (ja) | オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム | |
JP2017041752A (ja) | 車両用音響装置 | |
Apel | Sinusoidality analysis and noise synthesis in phase vocoder based timestretching | |
JP2017138409A (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
JP6554853B2 (ja) | 雑音抑圧装置及びプログラム | |
KR20130037910A (ko) | OpenVG 기반 다중 레이어 중첩부분의 위치좌표 결정 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190506 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6531412 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |