JP6337519B2 - 音声処理装置、雑音抑圧方法、およびプログラム - Google Patents
音声処理装置、雑音抑圧方法、およびプログラム Download PDFInfo
- Publication number
- JP6337519B2 JP6337519B2 JP2014040649A JP2014040649A JP6337519B2 JP 6337519 B2 JP6337519 B2 JP 6337519B2 JP 2014040649 A JP2014040649 A JP 2014040649A JP 2014040649 A JP2014040649 A JP 2014040649A JP 6337519 B2 JP6337519 B2 JP 6337519B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- frequency
- coefficient
- value
- suppression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001629 suppression Effects 0.000 title claims description 265
- 238000012545 processing Methods 0.000 title claims description 127
- 238000000034 method Methods 0.000 title claims description 55
- 238000001228 spectrum Methods 0.000 claims description 122
- 238000004364 calculation method Methods 0.000 claims description 83
- 230000005236 sound signal Effects 0.000 claims description 60
- 238000006243 chemical reaction Methods 0.000 claims description 51
- 230000007423 decrease Effects 0.000 claims description 22
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 20
- 230000008859 change Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 19
- 230000000694 effects Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
以下、図面を参照しながら、第1の実施の形態による音声処理装置1について説明する。音声処理装置1は、入力された音声信号に対して雑音抑圧処理を行った音声を出力する装置である。音声処理装置1は、例えば、多機能携帯電話機の受信音または送信音、スピーカやイヤホン等音声出力装置の出力音、音声認識等のための入力音の前処理のために用いることが可能である。音声処理装置1は、例えば、多機能携帯電話機、車載通信装置、音声出力装置、音声認識装置などに備えられる。
抑圧係数=定数C×雑音由来係数y(定常)・・・(式1)
抑圧係数=1(非定常) ・・・(式2)
抑圧係数を「1」とするとは、積極的に抑圧をしないという意味であり、厳密に「1」でなければならないということを意味しない。
y=1.0−0.00002x・・・(式3)
以下、第2の実施の形態による音声処理装置130について図面を参照しながら説明する。第2の実施の形態による音声処理装置130において、第1の実施の形態による音声処理装置1と同様の構成および動作については、同一番号を付し、重複説明を省略する。
抑圧係数=係数K(f)×定数C×雑音由来係数y・・・(式4)
なお、係数K(f)は、定常雑音モデルの値の当該周波数成分に対する割合を表す係数であり、当該周波数成分を定常雑音モデルまで抑圧した場合の係数である。係数K(f)は、定常雑音推定部7で推定された目標値と、変換部5で変換された各周波数成分に基づき下記式5のように算出される。
係数K(f)=各周波数の目標値(定常雑音モデルの値)/各周波数成分の振幅値・・・(式5)
以下、第3の実施の形態による音声処理装置200について図面を参照しながら説明する。第3の実施の形態による音声処理装置200において、第1または第2の実施の形態による音声処理装置1、音声処理装置130と同様の構成および動作については、同一番号を付し、重複説明を省略する。
目的音率=1フレーム内で目的音であると判定された周波数の数/FFT長
・・・(式6)
目的音率高: 抑圧係数 = 係数K(f)×定数C×雑音由来係数y
・・・(式4)
目的音率中: 抑圧係数 = 係数K(f)×定数C・・・(式7)
目的音率低: 抑圧係数 = 係数K(f)・・・(式8)
なお、第1の所定値Th1、第2の所定値Th2は、例えば、予め雑音が少ない状態で取得された、いくつかの音声信号について目的音率を算出し、算出された目的音率の分布の度合いに基づき決定するようにしてもよい。
以下、第4の実施の形態による音声処理装置300について図面を参照しながら説明する。第4の実施の形態による音声処理装置300において、第1から第3の実施の形態と同様の構成および動作については、同一番号を付し、重複説明を省略する。
Ra=(ds/(ds+d×cosθ)) (0≦θ≦180)・・・(式9)
Rmin≦R≦Rmax
Rmin=ds/(ds+d×cosθmin)
Rmax=ds/(ds+d×cosθmax)
・・・(式10)
式10を満たす振幅スペクトル比を有する場合、目的音判定部307は、当該周波数成分を目的音と判定する。
以下、雑音由来係数の変形例について説明する。図23、図24は、雑音由来係数の定常雑音モデルの値xに対する関係の例を示す図である。図23、図24において、横軸は定常雑音モデルの値xであり、縦軸は、雑音由来係数yである。なお、定常雑音モデルの値xは、振幅の最大値=32768、とした場合の例である。雑音モデル係数yは、最大値のときに抑圧量が約6dB増すように調整したものである。定常雑音モデルの値x、雑音由来係数yの値は一例であり、これに限定されない。
y=1.0−ax (a=1.53×10−5)・・・(式11)
y=1.0−bx2 (b=4.66×10−10)・・・(式11)
(付記1)
所定時間分の音声信号を時間周波数変換した周波数スペクトルの振幅値に基づき算出される周波数毎の定常雑音の目標値が上昇するに従ってなだらかに減少する雑音由来係数を算出する雑音由来係数算出部と、
前記振幅値に基づき前記周波数スペクトルが定常であると判定された場合、前記雑音由来係数に基づく抑圧係数を前記振幅値に乗じることで、周波数時間変換して出力される抑圧信号を生成する抑圧信号生成部と、
を有することを特徴とする音声処理装置。
(付記2)
前記振幅値に基づき、前記周波数スペクトルの周波数毎の成分が非定常であると判定された場合に前記周波数毎の成分が目的音であるか否かを判定する目的音判定部、
をさらに有し、
前記抑圧信号生成部は、前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を前記振幅値と前記目標値とに応じた定常雑音係数と、前記雑音由来係数とを乗じた値に基づく係数とする
ことを特徴とする付記1に記載の音声処理装置。
(付記3)
前記目的音判定部は、前記周波数毎の振幅変動量、前記目標値と前記振幅値との比、および前記目標値と前記振幅値との差のうちの少なくとも一つに基づき、前記所定周波数の成分が目的音であるか否かを判定する、
ことを特徴とする付記2に記載の音声処理装置。
(付記4)
前記周波数スペクトルと、前記周波数スペクトルと対応する前記音声信号が取得された第1の空間的位置と異なる第2の空間的位置で取得された同一の音声の音声信号を時間周波数変換した周波数スペクトルとの周波数毎の振幅差、振幅比、および位相差のうちのいずれか少なくとも一つに基づき、前記周波数毎の成分が目的音であるか否かを判定する目的音判定部、
をさらに有し、
前記抑圧信号生成部は、前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を前記振幅値と前記目標値とに応じた定常雑音係数と、前記雑音由来係数とを乗じた値に基づく係数とする
ことを特徴とする付記1に記載の音声処理装置。
(付記5)
前記周波数スペクトルにおける前記目的音の割合を示す目的音率を算出する目的音率算出部、
をさらに有し、
前記抑圧信号生成部は、前記周波数スペクトルにおいて前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を前記目的音率に応じて算出された値とすることを特徴とする付記2から付記4のいずれかに記載の音声処理装置。
(付記6)
前記抑圧信号生成部は、前記目的音率が第1の所定値以上の場合に、前記抑圧係数を、前記雑音由来係数および前記定常雑音係数を乗じた値に基づく係数とすることを特徴とする付記5に記載の音声処理装置。
(付記7)
前記抑圧信号生成部は、前記目的音率が前記第1の所定値未満であって、前記第1の所定値よりも小さい第2の所定値以上の場合に、前記抑圧係数を前記定常雑音係数に基づく値とすることを特徴とする付記6に記載の音声処理装置。
(付記8)
前記抑圧信号生成部は、前記目的音率が前記第2の所定値未満の場合に、前記抑圧係数を前記定常雑音係数とすることを特徴とする付記7に記載の音声処理装置。
(付記9)
前記振幅値に基づき、前記周波数スペクトル、または前記周波数スペクトルのいずれかの周波数毎の成分が非定常であると判定された場合に前記周波数スペクトルが目的音であるか否かを判定する目的音判定部、
をさらに有し、
前記目的音判定部は、前記周波数スペクトルが非定常であると判定された場合に、前記所定時間に対応する前記周波数スペクトルと、前記所定時間の一つ前の所定時間に対応する周波数スペクトルとの相関値が一定値より高い場合に、前記所定時間に対応する前記周波数スペクトルを目的音であると判定し、
前記抑圧信号生成部は、前記周波数スペクトルが目的音でないと判定された場合は、前記抑圧係数を前記振幅値と前記目標値とに応じた定常雑音係数と、前記雑音由来係数とを乗じた値とする
ことを特徴とする付記1に記載の音声処理装置。
(付記10)
前記所定時間内の前記目標値の最大値に基づき前記最大値から前記雑音由来係数を算出するための正の係数をa、前記目標値をx、前記雑音由来係数をyとすると、
y=1−ax
であることを特徴とする付記1から付記9のいずれかに記載の音声処理装置。
(付記11)
前記所定時間内の前記目標値の最大値に基づき前記最大値から前記雑音由来係数を算出するための正の係数をb、前記目標値をx、前記雑音由来係数をyとすると、
y=1−bx2
であることを特徴とする付記1から付記9のいずれかに記載の音声処理装置。
(付記12)
コンピュータによる雑音抑圧方法であって、
所定時間分の音声信号を時間周波数変換した周波数スペクトルの振幅値に基づき算出される周波数毎の定常雑音の目標値が上昇するに従ってなだらかに減少する雑音由来係数を算出し、
前記振幅値に基づき前記周波数スペクトルが定常であると判定された場合、前記雑音由来係数に基づく抑圧係数を前記振幅値に乗じることで、周波数時間変換して出力される抑圧信号を生成する、
ことを特徴とする雑音抑圧方法。
(付記13)
さらに、前記振幅値に基づき、前記周波数スペクトルの周波数毎の成分が非定常であると判定された場合に、前記周波数毎の成分が目的音であるか否かを判定し、
前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を前記振幅値と前記目標値とに応じた定常雑音係数と、前記雑音由来係数とを乗じた値に基づく係数とする
ことを特徴とする付記12に記載の雑音抑圧方法。
(付記14)
さらに、前記周波数スペクトルにおける前記目的音の割合を示す目的音率を算出し、
前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を前記目的音率に応じて算出された値とする
ことを特徴とする付記13に記載の雑音抑圧方法。
(付記15)
所定時間分の音声信号を時間周波数変換した周波数スペクトルの振幅値に基づき算出される周波数毎の定常雑音の目標値が上昇するに従ってなだらかに減少する雑音由来係数を算出し、
前記振幅値に基づき前記周波数スペクトルが定常であると判定された場合、前記雑音由来係数に基づく抑圧係数を前記振幅値に乗じることで、周波数時間変換して出力される抑圧信号を生成する
処理をコンピュータに実行させるプログラム。
5 変換部
7 定常雑音推定部
9 定常判定部
11 雑音由来係数算出部
13 抑圧係数算出部
15 抑圧信号生成部
17 逆変換部
19 記憶部
20 振幅スペクトル
22 目標値
30 雑音由来係数
32 係数算出テーブル
33、34、36 雑音由来係数
38 不整合箇所
40 定常雑音例
42、44 振幅スペクトル
50 音声信号
52、54 時間帯
60、62、70、72 抑圧音声信号
74、76 振幅
80 振幅スペクトル
82 抑圧信号
86、88 抑圧音声信号
Claims (12)
- 所定時間分の音声信号を時間周波数変換した周波数スペクトルの振幅値に基づき算出される周波数毎の定常雑音の目標値が上昇するに従って連続して単調減少する雑音由来係数を算出する雑音由来係数算出部と、
前記振幅値に基づき前記周波数スペクトルの周波数毎の成分が非定常であると判定された場合に、前記周波数毎の成分が目的音であるか否かを判定する目的音判定部と、
前記周波数スペクトルにおける前記目的音の割合を示す目的音率を算出する目的音率算出部と、
前記振幅値に基づき前記周波数スペクトルが定常であると判定された場合、前記雑音由来係数に基づく抑圧係数を前記振幅値に乗じることで、周波数時間変換して出力される抑圧信号を生成する抑圧信号生成部と、
を有し、
前記抑圧信号生成部は、前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を、前記振幅値と前記目標値とに応じた定常雑音係数と、前記雑音由来係数とを乗じた値に基づく係数であって、前記目的音率に応じて算出された値とする、
ことを特徴とする音声処理装置。 - 前記目的音判定部は、前記周波数毎の振幅変動量、前記目標値と前記振幅値との比、および前記目標値と前記振幅値との差のうちの少なくとも一つに基づき、前記周波数毎の成分が目的音であるか否かを判定する、
ことを特徴とする請求項1に記載の音声処理装置。 - 所定時間分の音声信号を時間周波数変換した周波数スペクトルの振幅値に基づき算出される周波数毎の定常雑音の目標値が上昇するに従って連続して単調減少する雑音由来係数を算出する雑音由来係数算出部と、
前記周波数スペクトルと、前記周波数スペクトルと対応する前記音声信号が取得された第1の空間的位置と異なる第2の空間的位置で取得された同一の音声の音声信号を時間周波数変換した周波数スペクトルとの周波数毎の振幅差、振幅比、および位相差のうちのいずれか少なくとも一つに基づき、前記周波数毎の成分が目的音であるか否かを判定する目的音判定部と、
前記周波数スペクトルにおける前記目的音の割合を示す目的音率を算出する目的音率算出部と、
前記振幅値に基づき前記周波数スペクトルが定常であると判定された場合、前記雑音由来係数に基づく抑圧係数を前記振幅値に乗じることで、周波数時間変換して出力される抑圧信号を生成する抑圧信号生成部と、
を有し、
前記抑圧信号生成部は、前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を、前記振幅値と前記目標値とに応じた定常雑音係数と、前記雑音由来係数とを乗じた値に基づく係数であって、前記目的音率に応じて算出された値とする
ことを特徴とする音声処理装置。 - 前記抑圧信号生成部は、前記目的音率が第1の所定値以上の場合は、前記抑圧係数を、前記雑音由来係数および前記定常雑音係数を乗じた値に基づく係数とすることを特徴とする請求項1から請求項3のいずれかに記載の音声処理装置。
- 前記抑圧信号生成部は、前記目的音率が前記第1の所定値未満であって、前記第1の所定値よりも小さい第2の所定値以上の場合は、前記抑圧係数を前記定常雑音係数に基づく値とすることを特徴とする請求項4に記載の音声処理装置。
- 前記抑圧信号生成部は、前記目的音率が前記第2の所定値未満の場合は、前記抑圧係数を前記定常雑音係数とすることを特徴とする請求項5に記載の音声処理装置。
- 前記所定時間内の前記目標値の最大値に基づき前記最大値から前記雑音由来係数を算出するための正の係数をa、前記目標値をx、前記雑音由来係数をyとすると、
y=1−ax
であることを特徴とする請求項1から請求項6のいずれかに記載の音声処理装置。 - 前記所定時間内の前記目標値の最大値に基づき前記最大値から前記雑音由来係数を算出するための正の係数をb、前記目標値をx、前記雑音由来係数をyとすると、
y=1−bx2
であることを特徴とする請求項1から請求項6のいずれかに記載の音声処理装置。 - コンピュータによる雑音抑圧方法であって、
所定時間分の音声信号を時間周波数変換した周波数スペクトルの振幅値に基づき算出される周波数毎の定常雑音の目標値が上昇するに従って連続して単調減少する雑音由来係数を算出し、
前記振幅値に基づき前記周波数スペクトルの周波数毎の成分が非定常であると判定された場合に、前記周波数毎の成分が目的音であるか否かを判定し、
前記周波数スペクトルにおける前記目的音の割合を示す目的音率を算出し、
前記振幅値に基づき前記周波数スペクトルが定常であると判定された場合、前記雑音由来係数に基づく抑圧係数を前記振幅値に乗じることで、周波数時間変換して出力される抑圧信号を生成し、
前記抑圧信号の生成において、前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を、前記振幅値と前記目標値とに応じた定常雑音係数と、前記雑音由来係数とを乗じた値に基づく係数であって、前記目的音率に応じて算出された値とする、
ことを特徴とする雑音抑圧方法。 - コンピュータによる雑音抑圧方法であって、
所定時間分の音声信号を時間周波数変換した周波数スペクトルの振幅値に基づき算出される周波数毎の定常雑音の目標値が上昇するに従って連続して単調減少する雑音由来係数を算出し、
前記周波数スペクトルと、前記周波数スペクトルと対応する前記音声信号が取得された第1の空間的位置と異なる第2の空間的位置で取得された同一の音声の音声信号を時間周波数変換した周波数スペクトルとの周波数毎の振幅差、振幅比、および位相差のうちのいずれか少なくとも一つに基づき、前記周波数毎の成分が目的音であるか否かを判定し、
前記周波数スペクトルにおける前記目的音の割合を示す目的音率を算出し、
前記振幅値に基づき前記周波数スペクトルが定常であると判定された場合、前記雑音由来係数に基づく抑圧係数を前記振幅値に乗じることで、周波数時間変換して出力される抑圧信号を生成し、
前記抑圧信号の生成において、前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を、前記振幅値と前記目標値とに応じた定常雑音係数と、前記雑音由来係数とを乗じた値に基づく係数であって、前記目的音率に応じて算出された値とする
ことを特徴とする雑音抑圧方法。 - 所定時間分の音声信号を時間周波数変換した周波数スペクトルの振幅値に基づき算出される周波数毎の定常雑音の目標値が上昇するに従って連続して単調減少する雑音由来係数を算出し、
前記振幅値に基づき前記周波数スペクトルの周波数毎の成分が非定常であると判定された場合に、前記周波数毎の成分が目的音であるか否かを判定し、
前記周波数スペクトルにおける前記目的音の割合を示す目的音率を算出し、
前記振幅値に基づき前記周波数スペクトルが定常であると判定された場合、前記雑音由来係数に基づく抑圧係数を前記振幅値に乗じることで、周波数時間変換して出力される抑圧信号を生成する
処理をコンピュータに実行させ、
前記抑圧信号の生成において、前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を、前記振幅値と前記目標値とに応じた定常雑音係数と、前記雑音由来係数とを乗じた値に基づく係数であって、前記目的音率に応じて算出された値とする、
プログラム。 - 所定時間分の音声信号を時間周波数変換した周波数スペクトルの振幅値に基づき算出される周波数毎の定常雑音の目標値が上昇するに従って連続して単調減少する雑音由来係数を算出し、
前記周波数スペクトルと、前記周波数スペクトルと対応する前記音声信号が取得された第1の空間的位置と異なる第2の空間的位置で取得された同一の音声の音声信号を時間周波数変換した周波数スペクトルとの周波数毎の振幅差、振幅比、および位相差のうちのいずれか少なくとも一つに基づき、前記周波数毎の成分が目的音であるか否かを判定し、
前記周波数スペクトルにおける前記目的音の割合を示す目的音率を算出し、
前記振幅値に基づき前記周波数スペクトルが定常であると判定された場合、前記雑音由来係数に基づく抑圧係数を前記振幅値に乗じることで、周波数時間変換して出力される抑圧信号を生成する
処理をコンピュータに実行させ、
前記抑圧信号の生成において、前記周波数毎の成分が目的音でないと判定された場合は、前記抑圧係数を、前記振幅値と前記目標値とに応じた定常雑音係数と、前記雑音由来係数とを乗じた値に基づく係数であって、前記目的音率に応じて算出された値とする
プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014040649A JP6337519B2 (ja) | 2014-03-03 | 2014-03-03 | 音声処理装置、雑音抑圧方法、およびプログラム |
US14/628,416 US9761244B2 (en) | 2014-03-03 | 2015-02-23 | Voice processing device, noise suppression method, and computer-readable recording medium storing voice processing program |
EP15156291.5A EP2916322A1 (en) | 2014-03-03 | 2015-02-24 | Voice processing device, noise suppression method, and computer-readable recording medium storing voice processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014040649A JP6337519B2 (ja) | 2014-03-03 | 2014-03-03 | 音声処理装置、雑音抑圧方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015166764A JP2015166764A (ja) | 2015-09-24 |
JP6337519B2 true JP6337519B2 (ja) | 2018-06-06 |
Family
ID=52544402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014040649A Active JP6337519B2 (ja) | 2014-03-03 | 2014-03-03 | 音声処理装置、雑音抑圧方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9761244B2 (ja) |
EP (1) | EP2916322A1 (ja) |
JP (1) | JP6337519B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170051856A (ko) * | 2015-11-02 | 2017-05-12 | 주식회사 아이티매직 | 사운드 신호에서 진단 신호를 추출하는 방법 및 진단 장치 |
CN105448304B (zh) * | 2015-12-01 | 2019-01-15 | 珠海市杰理科技股份有限公司 | 语音信号噪声频谱估计方法、装置及降噪处理方法 |
JP6729187B2 (ja) | 2016-08-30 | 2020-07-22 | 富士通株式会社 | 音声処理プログラム、音声処理方法及び音声処理装置 |
JP6652119B2 (ja) | 2017-08-03 | 2020-02-19 | セイコーエプソン株式会社 | 波長変換素子、波長変換素子の製造方法、光源装置及びプロジェクター |
CN107833579B (zh) * | 2017-10-30 | 2021-06-11 | 广州酷狗计算机科技有限公司 | 噪声消除方法、装置及计算机可读存储介质 |
WO2020250797A1 (ja) * | 2019-06-14 | 2020-12-17 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US11646009B1 (en) * | 2020-06-16 | 2023-05-09 | Amazon Technologies, Inc. | Autonomously motile device with noise suppression |
US11900961B2 (en) * | 2022-05-31 | 2024-02-13 | Microsoft Technology Licensing, Llc | Multichannel audio speech classification |
CN117037834B (zh) * | 2023-10-08 | 2023-12-19 | 广州市艾索技术有限公司 | 一种会议语音数据智能采集方法及系统 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3269969B2 (ja) * | 1996-05-21 | 2002-04-02 | 沖電気工業株式会社 | 背景雑音消去装置 |
JP3264831B2 (ja) * | 1996-06-14 | 2002-03-11 | 沖電気工業株式会社 | 背景雑音消去装置 |
US6175602B1 (en) * | 1998-05-27 | 2001-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by spectral subtraction using linear convolution and casual filtering |
JP2001267973A (ja) | 2000-03-17 | 2001-09-28 | Matsushita Electric Ind Co Ltd | 騒音抑制装置および騒音抑制方法 |
JP4520732B2 (ja) * | 2003-12-03 | 2010-08-11 | 富士通株式会社 | 雑音低減装置、および低減方法 |
WO2006123721A1 (ja) * | 2005-05-17 | 2006-11-23 | Yamaha Corporation | 雑音抑圧方法およびその装置 |
JP4863713B2 (ja) | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
US9159335B2 (en) * | 2008-10-10 | 2015-10-13 | Samsung Electronics Co., Ltd. | Apparatus and method for noise estimation, and noise reduction apparatus employing the same |
JP5413575B2 (ja) | 2009-03-03 | 2014-02-12 | 日本電気株式会社 | 雑音抑圧の方法、装置、及びプログラム |
JP5293329B2 (ja) | 2009-03-26 | 2013-09-18 | 富士通株式会社 | 音声信号評価プログラム、音声信号評価装置、音声信号評価方法 |
JP5207479B2 (ja) * | 2009-05-19 | 2013-06-12 | 国立大学法人 奈良先端科学技術大学院大学 | 雑音抑圧装置およびプログラム |
US8571231B2 (en) * | 2009-10-01 | 2013-10-29 | Qualcomm Incorporated | Suppressing noise in an audio signal |
US8473287B2 (en) * | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
CN103238183B (zh) | 2011-01-19 | 2014-06-04 | 三菱电机株式会社 | 噪音抑制装置 |
JP2013148724A (ja) | 2012-01-19 | 2013-08-01 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
JP6169849B2 (ja) * | 2013-01-15 | 2017-07-26 | 本田技研工業株式会社 | 音響処理装置 |
JP6020258B2 (ja) * | 2013-02-28 | 2016-11-02 | 富士通株式会社 | マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置 |
-
2014
- 2014-03-03 JP JP2014040649A patent/JP6337519B2/ja active Active
-
2015
- 2015-02-23 US US14/628,416 patent/US9761244B2/en active Active
- 2015-02-24 EP EP15156291.5A patent/EP2916322A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JP2015166764A (ja) | 2015-09-24 |
EP2916322A1 (en) | 2015-09-09 |
US9761244B2 (en) | 2017-09-12 |
US20150248895A1 (en) | 2015-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6337519B2 (ja) | 音声処理装置、雑音抑圧方法、およびプログラム | |
JP5875609B2 (ja) | 雑音抑圧装置 | |
JP5265056B2 (ja) | 雑音抑圧装置 | |
JP5870476B2 (ja) | 雑音推定装置、雑音推定方法および雑音推定プログラム | |
JP5387459B2 (ja) | 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム | |
JP6107151B2 (ja) | 雑音抑圧装置、方法、及びプログラム | |
US9552828B2 (en) | Audio signal processing device | |
JP6668995B2 (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
CN104637491A (zh) | 用于内部mmse计算的基于外部估计的snr的修改器 | |
JP6339896B2 (ja) | 雑音抑圧装置および雑音抑圧方法 | |
CN104867499A (zh) | 一种用于助听器的分频段维纳滤波去噪方法和系统 | |
JP6371167B2 (ja) | 残響抑制装置 | |
CN111951818B (zh) | 一种基于改进功率差噪声估计算法的双麦克风语音增强方法 | |
JP2000330597A (ja) | 雑音抑圧装置 | |
JP2023536104A (ja) | 機械学習を用いたノイズ削減 | |
US9697848B2 (en) | Noise suppression device and method of noise suppression | |
JP7013789B2 (ja) | 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法 | |
JP6729186B2 (ja) | 音声処理プログラム、音声処理方法及び音声処理装置 | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JP6059130B2 (ja) | 雑音抑圧方法とその装置とプログラム | |
WO2019009204A1 (ja) | 信号処理装置、制御方法、プログラム及び記憶媒体 | |
JP2018063400A (ja) | 音声処理装置及び音声処理プログラム | |
JP2011035573A (ja) | 音信号処理装置および音信号処理方法 | |
JP7226107B2 (ja) | 話者方向判定プログラム、話者方向判定方法、及び、話者方向判定装置 | |
JP6314803B2 (ja) | 信号処理装置、信号処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161102 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171031 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180410 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180423 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6337519 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |