JP6028502B2 - 音声信号処理装置、方法及びプログラム - Google Patents
音声信号処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6028502B2 JP6028502B2 JP2012221537A JP2012221537A JP6028502B2 JP 6028502 B2 JP6028502 B2 JP 6028502B2 JP 2012221537 A JP2012221537 A JP 2012221537A JP 2012221537 A JP2012221537 A JP 2012221537A JP 6028502 B2 JP6028502 B2 JP 6028502B2
- Authority
- JP
- Japan
- Prior art keywords
- coherence
- speech
- section
- disturbing
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 68
- 230000005236 sound signal Effects 0.000 title claims description 59
- 238000000034 method Methods 0.000 title claims description 55
- 238000001514 detection method Methods 0.000 claims description 45
- 230000008569 process Effects 0.000 claims description 31
- 230000002452 interceptive effect Effects 0.000 claims description 20
- 238000012935 Averaging Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 4
- 238000003672 processing method Methods 0.000 claims description 2
- 230000007774 longterm Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 34
- 238000004458 analytical method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Otolaryngology (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
…(2)
第1の指向性形成部11では、周波数領域信号X1(f,K)及びX2(f,K)から特定方向に指向性が強い信号B1(f,K)を形成し、第2の指向性形成部12では、周波数領域信号X1(f,K)及びX2(f,K)から特定方向(上述の特定方向とは異なる)に指向性が強い信号B2(f,K)を形成する。特定方向に指向性が強い信号B1(f,K)、B2(f,K)の形成方法としては既存の方法を適用でき、例えば、(3)式を適用して右方向に指向性が強いB1(f,K)や(4)式を適用して左方向に指向性が強いB2(f,K)が形成できる。(3)式及び(4)式では、フレームインデックスKは演算に関与しないので省略している。
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(t)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm_1及びm_2は図14(B)のような指向特性を持つようになる。
以下、本発明による音声信号処理装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。第1の実施形態は、コヒーレンスCOHに基づき、妨害音声の到来方位に応じて適切な目的音声区間の判定閾値Θを設定できるようにしたものである。
図1は、第1の実施形態に係る音声信号処理装置の構成を示すブロック図であり、上述した図13との同一、対応部分には同一符号を付して示している。ここで、一対のマイクm_1及びm_2を除いた部分は、CPUが実行するソフトウェア(音声信号処理プログラム)として実現することも可能であるが、機能的には、図1で表すことができる。
+(1−δ)×AVE_COH(K−1) …(8)
(8)式は、平均値として、現フレーム区間(動作開始時点から数えてK番目の分析フレーム)の入力音声に対するコヒーレンスCOH(K)と1つ前のフレーム区間で得られた平均値AVE_COH(K−1)との重み付け加算を計算しており、δの値の大小で、コヒーレンスCOH(K)の瞬時値の平均値への寄与度を調整することができる。仮に、δを0に近い小さい値に設定した場合には、瞬時値の平均値への寄与度が小さくなるので、瞬時値による変動を抑制できる。また、δが1に近い値であれば、瞬時値の寄与度が高まるので、平均値の効果を弱めることができる。このような観点に従い、δを適宜選定すれば良い。
妨害音声区間検出部25は、値DIFF(K)を妨害音声区間判定閾値Φと比較し、値DIFF(K)が妨害音声区間判定閾値Φ以上であれば妨害音声区間と判定し、それ以外では、妨害音声区間以外の区間(背景雑音区間)と判定する。この判定方法は、妨害音声区間では、コヒーレンスの値(瞬時値)が背景雑音区間より大きいため、平均値との差も大きくなるという性質を用いたものである。
+(1−ζ)×DIST_COH(K−1) …(10)
記憶部28は、妨害音声区間におけるコヒーレンスの平均値DIST_COHの範囲と、目的音声判定閾値Θとの対応情報を記憶しているものである。例えば、図3に示すように、変換テーブル形式で記憶部28を構成することができる。図3の例は、妨害音声区間におけるコヒーレンスの平均値DIST_COHが範囲A<DIST_COH≦Bのときに目的音声判定閾値Θとして値Θ1が対応し、妨害音声区間におけるコヒーレンスの平均値DIST_COHが範囲B<AVE_COH≦Cのときに目的音声判定閾値Θとして値Θ2が対応し、妨害音声区間におけるコヒーレンスの平均値DIST_COHが範囲C<DIST_COH≦Dのときに目的音声判定閾値Θとして値Θ3が対応することを規定している。ここで、Θ1<Θ2<Θ3の関係がある。
次に、第1の実施形態の音声信号処理装置1の動作を、図面を参照しながら、全体動作、目的音声区間判定閾値制御部20における詳細動作の順に説明する。
第1の実施形態によれば、非目的音声(特に妨害音声)の到来方位に応じて、目的音声区間判定閾値Θを制御するようにしたので、目的音声区間及び非目的音声区間の判定精度を向上させ、所望外の区間でボイススイッチ処理を誤って稼動して音質を低下させるようなことを防止することができる。
次に、本発明による音声信号処理装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
次に、本発明による音声信号処理装置、方法及びプログラムの第3の実施形態を、図面を参照しながら説明する。
第3の実施形態に係る音声信号処理装置1Bも、その全体構成は、第1の実施形態の説明で用いた図1で表すことができる。
次に、第3の実施形態の音声信号処理装置1Bの目的音声区間判定閾値制御部20Bにおける詳細動作を、図面を参照しながら説明する。なお、第3の実施形態の音声信号処理装置1Bの全体動作は、第1の実施形態の音声信号処理装置1の全体動作と同様であり、その説明は省略する。
第3の実施形態によれば、背景雑音区間から妨害音声区間に切り替わったことを検出し、切り替わったときに、妨害音声区間のコヒーレンス平均の算出式におけるパラメータを制御するようにしたので、コヒーレンス平均の追従遅れを最低限に抑えることができ、目的音声区間判定閾値をより適切に設定できるようになる。
上記各実施形態の説明においても種々変形実施形態について言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
+(1−ζ)× DIST_COH(K−1) …(11)
上記各実施形態では、妨害音声区間のコヒーレンス平均値に基づいて、目的音声区間検出部が利用する閾値を定めるものを示したが、閾値の決定に用いるパラメータは、コヒーレンス平均値に限定されるものではない。パラメータは、ある程度の直前期間のコヒーレンスの傾向を反映できているものであれば良く、例えば、公知のピークホールド手法を適用して得たコヒーレンスのピークに基づいて閾値を設定するようにしても良い。また、コヒーレンスの分散、標準偏差などの統計量に基づいて閾値を設定するようにしても良い。
D(f,K)=X1(f,K)−B3(f,K) …(13)
図10は、コヒーレンスフィルターと第1の実施形態とを併用した変形実施形態の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図11は、ウィーナーフィルターと第1の実施形態とを併用した変形実施形態の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
以上では、周波数減算処理、コヒーレンスフィルター処理若しくはウィーナーフィルター処理を施した後に、ボイススイッチ処理を施すものを示したが、この処理順序は逆であっても良い。
Claims (10)
- 入力音声信号から雑音成分を抑制する音声信号処理装置において、
入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
入力音声信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
上記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
上記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定する目的音声区間検出部と、
上記コヒーレンスに基づいて、妨害音声区間と背景雑音区間の双方を含む非目的音声区間中の上記妨害音声区間を検出し、当該妨害音声区間におけるコヒーレンス平均値である妨害音声コヒーレンス平均値を得て、妨害音声コヒーレンス平均値に基づいて、上記第1の判定閾値を制御する目的音声区間判定閾値制御部と、
上記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定するゲイン制御部と、
上記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算するボイススイッチゲイン乗算部と
を有することを特徴とする音声信号処理装置。 - 上記目的音声区間判定閾値制御部は、
上記コヒーレンスと固定値でなる第2の判定閾値とを比較して非目的音声区間を検出し、非目的音声区間における上記コヒーレンスの長期間の変化度合いを表した情報を得た後、コヒーレンスの瞬時値との比較により妨害音声区間を検出し、妨害音声区間であることを少なくとも含む更新条件の成立時に妨害音声コヒーレンス平均値を更新すると共に、上記更新条件の不成立時に妨害音声コヒーレンス平均値を維持する妨害音声コヒーレンス平均取得部と、
妨害音声コヒーレンス平均値と上記第1の判定閾値との対応関係情報を保持している対応関係保持部と、
上記対応関係保持部から、上記妨害音声コヒーレンス平均取得部が得た現在の妨害音声コヒーレンス平均値に対応した上記第1の判定閾値を得る目的音声区間判定閾値取得部とを有する
ことを特徴とする請求項1に記載の音声信号処理装置。 - 上記妨害音声コヒーレンス平均取得部は、非目的音声区間における上記コヒーレンスの平均値である非目的音声区間コヒーレンス平均値を算出した後、コヒーレンスの瞬時値と非目的音声区間コヒーレンス平均値との差の絶対値を第3の判定閾値と比較することで妨害音声区間を検出するものであることを特徴とする請求項2に記載の音声信号処理装置。
- 上記妨害音声コヒーレンス平均取得部における更新条件が、妨害音声区間であり、かつ、コヒーレンスの瞬時値が非目的音声区間コヒーレンス平均値より大きい、という条件であることを特徴とする請求項3に記載の音声信号処理装置。
- 上記妨害音声コヒーレンス平均取得部は、妨害音声区間か否かの過去の検出結果を保持する保持部を有し、妨害音声区間以外の区間から妨害音声区間へ変化したときは、その変化から所定期間だけ、コヒーレンスの瞬時値を上記妨害音声コヒーレンス平均値へ反映させる度合いを高めることを特徴とする請求項3又は4に記載の音声信号処理装置。
- 自己への入力信号から非目的音声信号成分を減算することで雑音抑制を行う周波数減算部を、上記ボイススイッチゲイン乗算部の入力段若しくは出力段側に有することを特徴とする請求項1〜5のいずれかに記載の音声信号処理装置。
- 複数の係数の平均処理によりコヒーレンスを求める際の要素である周波数ごとの上記各係数を、周波数ごとに、自己への入力信号に乗算することで到来方向に偏りを有する信号成分を抑制するコヒーレンスフィルター演算部を、上記ボイススイッチゲイン乗算部の入力段若しくは出力段側に有することを特徴とする請求項1〜6のいずれかに記載の音声信号処理装置。
- 雑音区間の信号から周波数ごとに雑音特性を推定して得た係数を、自己への入力信号に乗算することで雑音を除去するウィーナーフィルター演算部を、上記ボイススイッチゲイン乗算部の入力段若しくは出力段側に有することを特徴とする請求項1〜7のいずれかに記載の音声信号処理装置。
- 入力音声信号から雑音成分を抑制する音声信号処理方法において、
第1の指向性形成部は、入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、
第2の指向性形成部は、入力音声信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、
コヒーレンス計算部は、上記第1及び第2の指向性信号を用いてコヒーレンスを計算し、
目的音声区間検出部は、上記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定し、
目的音声区間判定閾値制御部は、上記コヒーレンスに基づいて、妨害音声区間と背景雑音区間の双方を含む非目的音声区間中の上記妨害音声区間を検出し、当該妨害音声区間におけるコヒーレンス平均値である妨害音声コヒーレンス平均値を得て、妨害音声コヒーレンス平均値に基づいて、上記第1の判定閾値を制御し、
ゲイン制御部は、上記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定し、
ボイススイッチゲイン乗算部は、上記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算する
ことを特徴とする音声信号処理方法。 - コンピュータを、
入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
入力音声信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
上記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
上記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定する目的音声区間検出部と、
上記コヒーレンスに基づいて、妨害音声区間と背景雑音区間の双方を含む非目的音声区間中の上記妨害音声区間を検出し、当該妨害音声区間におけるコヒーレンス平均値である妨害音声コヒーレンス平均値を得て、妨害音声コヒーレンス平均値に基づいて、上記第1の判定閾値を制御する目的音声区間判定閾値制御部と、
上記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定するゲイン制御部と、
上記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算するボイススイッチゲイン乗算部と
して機能させることを特徴とする音声信号処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012221537A JP6028502B2 (ja) | 2012-10-03 | 2012-10-03 | 音声信号処理装置、方法及びプログラム |
US14/432,480 US9418676B2 (en) | 2012-10-03 | 2013-06-13 | Audio signal processor, method, and program for suppressing noise components from input audio signals |
PCT/JP2013/066401 WO2014054314A1 (ja) | 2012-10-03 | 2013-06-13 | 音声信号処理装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012221537A JP6028502B2 (ja) | 2012-10-03 | 2012-10-03 | 音声信号処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014075674A JP2014075674A (ja) | 2014-04-24 |
JP6028502B2 true JP6028502B2 (ja) | 2016-11-16 |
Family
ID=50434650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012221537A Active JP6028502B2 (ja) | 2012-10-03 | 2012-10-03 | 音声信号処理装置、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9418676B2 (ja) |
JP (1) | JP6028502B2 (ja) |
WO (1) | WO2014054314A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10306389B2 (en) | 2013-03-13 | 2019-05-28 | Kopin Corporation | Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods |
US9312826B2 (en) | 2013-03-13 | 2016-04-12 | Kopin Corporation | Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction |
CN105632503B (zh) * | 2014-10-28 | 2019-09-03 | 南宁富桂精密工业有限公司 | 信息隐藏方法及系统 |
JP5863928B1 (ja) * | 2014-10-29 | 2016-02-17 | シャープ株式会社 | 音声調整装置 |
JP6065029B2 (ja) * | 2015-01-05 | 2017-01-25 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
JP6065030B2 (ja) * | 2015-01-05 | 2017-01-25 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
US9489963B2 (en) * | 2015-03-16 | 2016-11-08 | Qualcomm Technologies International, Ltd. | Correlation-based two microphone algorithm for noise reduction in reverberation |
JP6638248B2 (ja) * | 2015-08-19 | 2020-01-29 | 沖電気工業株式会社 | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 |
JP6536320B2 (ja) | 2015-09-28 | 2019-07-03 | 富士通株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
US11631421B2 (en) * | 2015-10-18 | 2023-04-18 | Solos Technology Limited | Apparatuses and methods for enhanced speech recognition in variable environments |
EP3606092A4 (en) | 2017-03-24 | 2020-12-23 | Yamaha Corporation | SOUND DETECTION DEVICE AND SOUND DETECTION METHOD |
WO2018173267A1 (ja) * | 2017-03-24 | 2018-09-27 | ヤマハ株式会社 | 収音装置および収音方法 |
JP6531776B2 (ja) | 2017-04-25 | 2019-06-19 | トヨタ自動車株式会社 | 音声対話システムおよび音声対話方法 |
DK179837B1 (en) | 2017-12-30 | 2019-07-29 | Gn Audio A/S | MICROPHONE APPARATUS AND HEADSET |
CN110675889A (zh) * | 2018-07-03 | 2020-01-10 | 阿里巴巴集团控股有限公司 | 音频信号处理方法、客户端和电子设备 |
US11197090B2 (en) * | 2019-09-16 | 2021-12-07 | Gopro, Inc. | Dynamic wind noise compression tuning |
CN110556128B (zh) * | 2019-10-15 | 2021-02-09 | 出门问问信息科技有限公司 | 一种语音活动性检测方法、设备及计算机可读存储介质 |
US11570307B2 (en) * | 2020-08-03 | 2023-01-31 | Microsoft Technology Licensing, Llc | Automatic reaction-triggering for live presentations |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH071958B2 (ja) * | 1986-06-20 | 1995-01-11 | 松下電器産業株式会社 | 収音装置 |
JPH06303691A (ja) * | 1993-04-13 | 1994-10-28 | Matsushita Electric Ind Co Ltd | ステレオマイクロホン |
US6453289B1 (en) * | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
JP4256363B2 (ja) | 2005-05-27 | 2009-04-22 | 株式会社東芝 | ボイススイッチ |
US8744844B2 (en) | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US8954324B2 (en) | 2007-09-28 | 2015-02-10 | Qualcomm Incorporated | Multiple microphone voice activity detector |
US8812309B2 (en) * | 2008-03-18 | 2014-08-19 | Qualcomm Incorporated | Methods and apparatus for suppressing ambient noise using multiple audio signals |
US8724829B2 (en) * | 2008-10-24 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coherence detection |
JP5197458B2 (ja) * | 2009-03-25 | 2013-05-15 | 株式会社東芝 | 受音信号処理装置、方法およびプログラム |
US8620672B2 (en) | 2009-06-09 | 2013-12-31 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal |
US9271077B2 (en) * | 2013-12-17 | 2016-02-23 | Personics Holdings, Llc | Method and system for directional enhancement of sound using small microphone arrays |
-
2012
- 2012-10-03 JP JP2012221537A patent/JP6028502B2/ja active Active
-
2013
- 2013-06-13 WO PCT/JP2013/066401 patent/WO2014054314A1/ja active Application Filing
- 2013-06-13 US US14/432,480 patent/US9418676B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20150294674A1 (en) | 2015-10-15 |
US9418676B2 (en) | 2016-08-16 |
JP2014075674A (ja) | 2014-04-24 |
WO2014054314A1 (ja) | 2014-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6028502B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP5838861B2 (ja) | 音声信号処理装置、方法及びプログラム | |
US9426566B2 (en) | Apparatus and method for suppressing noise from voice signal by adaptively updating Wiener filter coefficient by means of coherence | |
US7970609B2 (en) | Method of estimating sound arrival direction, sound arrival direction estimating apparatus, and computer program product | |
US9449594B2 (en) | Adaptive phase difference based noise reduction for automatic speech recognition (ASR) | |
JP5672770B2 (ja) | マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム | |
JP2012150237A (ja) | 音信号処理装置、および音信号処理方法、並びにプログラム | |
US9773510B1 (en) | Correcting clock drift via embedded sine waves | |
WO2019112467A1 (en) | Method and apparatus for acoustic echo cancellation | |
JP5927887B2 (ja) | 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム | |
JP6190373B2 (ja) | オーディオ信号ノイズ減衰 | |
WO2012176932A1 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP5772562B2 (ja) | 目的音抽出装置及び目的音抽出プログラム | |
JP2015125184A (ja) | 音声信号処理装置及びプログラム | |
JP5970985B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP6221258B2 (ja) | 信号処理装置、方法及びプログラム | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JP5971047B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP6763319B2 (ja) | 非目的音判定装置、プログラム及び方法 | |
JP6102144B2 (ja) | 音響信号処理装置、方法及びプログラム | |
CN112530450A (zh) | 频域中的样本精度延迟识别 | |
JP6295650B2 (ja) | 音声信号処理装置及びプログラム | |
JP6361360B2 (ja) | 残響判定装置及びプログラム | |
JP6903947B2 (ja) | 非目的音抑圧装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160705 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160829 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6028502 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |