JP6729187B2 - 音声処理プログラム、音声処理方法及び音声処理装置 - Google Patents
音声処理プログラム、音声処理方法及び音声処理装置 Download PDFInfo
- Publication number
- JP6729187B2 JP6729187B2 JP2016168628A JP2016168628A JP6729187B2 JP 6729187 B2 JP6729187 B2 JP 6729187B2 JP 2016168628 A JP2016168628 A JP 2016168628A JP 2016168628 A JP2016168628 A JP 2016168628A JP 6729187 B2 JP6729187 B2 JP 6729187B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- amplitude
- spectrum
- spectra
- frequency component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000001228 spectrum Methods 0.000 claims description 236
- 238000004364 calculation method Methods 0.000 claims description 136
- 230000005236 sound signal Effects 0.000 claims description 58
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 238000009499 grossing Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims 3
- 230000001629 suppression Effects 0.000 description 83
- 238000004458 analytical method Methods 0.000 description 41
- 230000007774 longterm Effects 0.000 description 37
- 238000000034 method Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 9
- 230000007423 decrease Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 101150084711 CTH1 gene Proteins 0.000 description 3
- 101100222207 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) TIS11 gene Proteins 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000011410 subtraction method Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 2
- 101100102849 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) VTH1 gene Proteins 0.000 description 1
- 101150088150 VTH2 gene Proteins 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
Description
変換部106は、制御部105で抑圧制御を行った周波数スペクトル(推定スペクトル)を短時間離散フーリエ逆変換し、逆変換して得られた音声信号を出力する。(以降、推定スペクトルを短時間離散フーリエ逆変換した音声信号を推定音声信号と称する。)
出力部107は、変換部106で変換された音声信号の出力を行う。
(数1)
Xn(l,f)−Nn(l,f)>SNTH
音声処置端末100の対象周波数算出部104aは、(数1)に示すように、周波数スペクトルと雑音スペクトルの振幅の差がSNTHよりも大きい場合に、対象周波数であると判定する。有音判定閾値は、予めユーザからの設定を受け付けておいても良く、周波数スペクトルと雑音スペクトルの差に基づき算出しても良い。算出の方法としては、例えば、フレームにおける周波数スペクトルと雑音スペクトルの差分の平均値をSNTHと設定する。
(数2)
(数3)
shn(l)=bn(l)/M
音声処理装置100の抑圧量算出部104dは、占有率算出部104cで占有率shn(l)の算出を行った後、抑圧量Gn(l,f)を算出する(ステップS207)。抑圧量Gn(l,f)を算出する際の式を(数4)に、抑圧量算出関数のグラフを図3に示す。
(数4)
(数5)
Sn(l,f)=Gn(l,f)×Xn(l,f)
音声処理装置100の変換部106は、抑圧を行った推定スペクトルSn(l,f)に対し、短時間離散フーリエ逆変換を行い、推定音声信号sn(t)を算出し(ステップS209)、出力部107から出力する(ステップS210)。
以上のように、各周波数スペクトルの占有率に応じて抑圧を行うことで、非目的音が一時的に大きくなった場合にも、精度良く音声を分析することができる。
(数6)
X’n(l,f)=(1−a)×X’n(l−1,f)+a×Xn(l,f)
ただし、第1のフレームにおいては、一つ前のフレームが存在しないため、周波数スペクトルX1(l,f)を平滑化スペクトルX’1(l,f)とする。
(数7)
(数8)
sh’n(l)=b’n(l)/M
音声処理装置100の抑圧量算出部405dは、雑音推定部403で算出した雑音スペクトルNn(l,f)と、平滑化部404で算出した平滑化スペクトルX’n(l,f)と、占有率算出部405cで算出した占有率sh’n(l)と、第1の状態判定閾値TH1と、第2の状態判定閾値TH2(TH2<TH1)とに基づき、周波数スペクトルに対する抑圧量G’n(l,f)の算出を行う(ステップS508)。抑圧量G’n(l,f)を算出する際の式を(数9)に示す。
(数9)
(数10)
S’n(l,f)=G’n(l,f)×Xn(l,f)
音声処理装置100は、制御部406で音声信号の抑圧を行い、推定スペクトルS’n(l,f)を算出し、変換部407で推定スペクトルS’n(l,f)を音声信号s’n(t)に逆変換し(ステップS510)、逆変換後の信号を出力部408から出力する(ステップS511)。
(数11)
lshn(l)=(1−β)×lshn(l−1)+β×shn(l)
ただし、第1のフレームにおいては、一つ前のフレームが存在しないため、占有率lshn(1)を長期占有率lshn(l)とする。βは重み係数を表す。βの値は例えばユーザが予め設定しておき(例えばβ=0.6)、下記に示す条件に該当する場合に値の調整を行うようにしても良い。
(数12)
(数13)
TH3=TH3−(0.5−C)
TH4=TH4−(0.5−C)
Cは所定フレームにおける長期占有率lshn(l)の平均値を示す。音声処理装置100の状態判定閾値算出部603fは、長期占有率の値が小さい(他の入力装置に入力される雑音の影響で占有率が小さくなる)場合には、入力装置に入力される音声信号の占有率が少なくても音声が目的音であるかどうかを正確に判定する必要があるため、状態判定閾値を小さくする。一方、長期占有率の値が大きい(該当する入力装置に他の入力装置に比べ大きい雑音が入力される影響で占有率が大きくなる)場合には、入力装置に入力される音声信号の占有率が非目的音のみの場合の占有率より大きい場合に目的音であると判定する必要があるため、入力された音声が目的音かどうかを判定する閾値を大きくする。音声処理装置100は、算出の対象としているフレームが装置を稼働して所定のフレーム以内でない場合には(ステップS709:No)、抑圧量算出部603eで算出した抑圧量G’ ’n(l,f)と周波数スペクトルXn(l,f)に基づき制御部604で音声信号の抑圧を行い推定スペクトルS’ ’n(l,f)を算出する(ステップS711)。推定スペクトルS’ ’n(l,f)を算出する際の式を(数14)に示す。
(数14)
S’ ’n(l,f)=G’ ’n(l,f)×Xn(l,f)
音声処理装置100の変換部605は、制御部604で音声信号の抑圧を行った後、推定スペクトルS’ ’n(l,f)を逆変換し(ステップS712)、推定音声信号s’ ’n(t)を算出し、出力部606から出力する(ステップS713)。以上のように、占有率を調整することにより、話者が変わった際にも精度良く音声の分析を行うことができる。
図8に示すように、第4の実施形態に係る音声処理装置100は入力部801、周波数解析部802、算出部803、制御部804、変換部805、出力部806、記憶部807を有する。算出部803は占有時間算出部803a、占有率算出部803b、長期占有率算出部803c、抑圧量算出部803dを有する。入力部801、周波数解析部802、制御部804、変換部805、出力部806、記憶部807は第1の実施形態に係る音声処理装置100の各機能部と同様の処理を行う。
(数15)
(数16)
sh’ ’ ’n(l)=b’ ’ ’n(l)/Tl
長期占有率算出部803cは過去の所定時間T2(T2≧T1)内の占有率sh’ ’ ’n(l)の最頻値を長期占有率lsh’ ’ ’n(l)として算出する(ステップS905)。但し、長期占有率lsh’ ’ ’n(l)の算出方法は最頻値に限定されず、例えば、中央値や平均値を長期占有率として算出しても良い。
(数17)
(数18)
S’ ’ ’n(l,f)=G’ ’ ’n(l,f)×Xn(l,f)
音声処理装置100の変換部805は、制御部804で算出した推定スペクトルS’ ’ ’n(l,f)を逆変換し入力スペクトルに対応する推定音声信号s’ ’ ’n(l,f)を算出し(ステップS908)、出力部806から出力する(ステップS909)。
図10に示すように、音声処理装置100は、CPU(Central Processing Unit)1001、メモリ(主記憶装置)1002、補助記憶装置1003、I/O装置1004、ネットワークインタフェース1005がバス1006を介して接続されている。
102、402、602、802 周波数解析部
103、403 雑音推定部
104、405、603、803 算出部
104a、405a、603a 対象周波数算出部
104b、405b、603b 占有周波数算出部
104c、405c、603c、803b 占有率算出部
104d、405d、603e、803d 抑圧量算出部
105、406、604、804 制御部
106、407、605、805 変換部
107、408、606、806 出力部
108、409、607、807 記憶部
404 平滑化部
603d、803c 長期占有率算出部
603f 状態判定閾値算出部
803a 占有時間算出部
1001 CPU
1002 メモリ(主記憶装置)
1003 補助記憶装置
1004 I/O装置
1005 ネットワークインタフェース
1006 バス
Claims (9)
- 複数の入力装置のそれぞれから入力される音声信号を変換して複数の周波数スペクトルを生成し、
前記複数の周波数スペクトルに含まれるそれぞれの雑音スペクトルを特定し、
前記複数の周波数スペクトルと前記それぞれの雑音スペクトルにおける周波数成分毎の振幅とに基づき、前記複数の周波数スペクトルの中から第一の周波数成分を抽出し、
抽出した前記第一の周波数成分に対応する周波数スペクトルのうち、特定の周波数スペクトルの各周波数成分の振幅と、前記複数の周波数スペクトルに含まれる前記特定の周波数スペクトルとは異なる1または複数の他の周波数スペクトルの各周波数成分の振幅とを、周波数成分毎に比較し、
前記特定の周波数スペクトルの振幅が前記1または複数の他の周波数スペクトルの振幅より大きい周波数成分を抽出し、
抽出した前記周波数成分が、振幅の大きさの比較を行った周波数成分に対して占める割合に応じて、前記複数の入力装置のそれぞれから入力される音声信号に対応する出力を制御する
処理をコンピュータに実行させることを特徴とする音声処理プログラム。 - 複数の入力装置のそれぞれから入力される音声信号を変換して複数の周波数スペクトルを生成し、
前記複数の周波数スペクトルのうち、所定の期間における特定の周波数スペクトルと、前記所定の期間における特定の周波数スペクトルと連続した所定の期間における前記特定の周波数スペクトルとを、時間方向に平滑化した周波数スペクトルを特定し、
前記複数の周波数スペクトルのうち、前記平滑化した周波数スペクトルの各周波数成分の振幅と、前記複数の周波数スペクトルに含まれる前記平滑化した周波数スペクトルとは異なる1または複数の他の平滑化した周波数スペクトルの各周波数成分の振幅とを、周波数成分毎に比較し、
前記平滑化した周波数スペクトルの振幅が前記1または複数の他の平滑化した周波数スペクトルの振幅より大きい周波数成分を抽出し、
抽出した前記周波数成分が、振幅の大きさの比較を行った周波数成分に対して占める割合に応じて、前記複数の入力装置のそれぞれから入力される音声信号に対応する出力を制御する
処理をコンピュータに実行させることを特徴とする音声処理プログラム。 - 複数の入力装置のそれぞれから入力される音声信号を変換して複数の周波数スペクトルを生成し、
前記複数の周波数スペクトルのうち、特定の周波数スペクトルの各周波数成分の振幅と、前記複数の周波数スペクトルに含まれる前記特定の周波数スペクトルとは異なる1または複数の他の周波数スペクトルの各周波数成分の振幅とを、周波数成分毎に比較し、
前記特定の周波数スペクトルの振幅が前記1または複数の他の周波数スペクトルの振幅より大きい周波数成分を抽出し、
抽出した前記周波数成分が、振幅の大きさの比較を行った周波数成分に対して占める割合を算出し、
算出した前記周波数成分に対して占める割合に基づき、前記所定の期間における前記割合と、前記所定の期間における割合と連続した所定の期間における割合とを時間方向に平滑化した割合を特定し、
特定した前記平滑化した割合に基づき、前記複数の入力装置のそれぞれから入力される音声信号に対応する出力を制御する
処理をコンピュータに実行させることを特徴とする音声処理プログラム。 - 複数の入力装置のそれぞれから入力される音声信号を変換して複数の周波数スペクトルを生成し、
前記複数の周波数スペクトルに含まれるそれぞれの雑音スペクトルを特定し、
前記複数の周波数スペクトルと前記それぞれの雑音スペクトルにおける周波数成分毎の振幅とに基づき、前記複数の周波数スペクトルの中から第一の周波数成分を抽出し、
抽出した前記第一の周波数成分に対応する周波数スペクトルのうち、特定の周波数スペクトルの各周波数成分の振幅と、前記複数の周波数スペクトルに含まれる前記特定の周波数スペクトルとは異なる1または複数の他の周波数スペクトルの各周波数成分の振幅とを、周波数成分毎に比較し、
前記特定の周波数スペクトルの振幅が前記1または複数の他の周波数スペクトルの振幅より大きい周波数成分を抽出し、
抽出した前記周波数成分が、振幅の大きさの比較を行った周波数成分に対して占める割合に応じて、前記複数の入力装置のそれぞれから入力される音声信号に対応する出力を制御する
処理をコンピュータが実行することを特徴とする音声処理方法。 - 複数の入力装置のそれぞれから入力される音声信号を変換して複数の周波数スペクトルを生成し、
前記複数の周波数スペクトルのうち、所定の期間における特定の周波数スペクトルと、前記所定の期間における特定の周波数スペクトルと連続した所定の期間における前記特定の周波数スペクトルとを、時間方向に平滑化した周波数スペクトルを特定し、
前記複数の周波数スペクトルのうち、前記平滑化した周波数スペクトルの各周波数成分の振幅と、前記複数の周波数スペクトルに含まれる前記平滑化した周波数スペクトルとは異なる1または複数の他の平滑化した周波数スペクトルの各周波数成分の振幅とを、周波数成分毎に比較し、
前記平滑化した周波数スペクトルの振幅が前記1または複数の他の平滑化した周波数スペクトルの振幅より大きい周波数成分を抽出し、
抽出した前記周波数成分が、振幅の大きさの比較を行った周波数成分に対して占める割合に応じて、前記複数の入力装置のそれぞれから入力される音声信号に対応する出力を制御する
処理をコンピュータが実行することを特徴とする音声処理方法。 - 複数の入力装置のそれぞれから入力される音声信号を変換して複数の周波数スペクトルを生成し、
前記複数の周波数スペクトルのうち、特定の周波数スペクトルの各周波数成分の振幅と、前記複数の周波数スペクトルに含まれる前記特定の周波数スペクトルとは異なる1または複数の他の周波数スペクトルの各周波数成分の振幅とを、周波数成分毎に比較し、
前記特定の周波数スペクトルの振幅が前記1または複数の他の周波数スペクトルの振幅より大きい周波数成分を抽出し、
抽出した前記周波数成分が、振幅の大きさの比較を行った周波数成分に対して占める割合を算出し、
算出した前記周波数成分に対して占める割合に基づき、前記所定の期間における前記割合と、前記所定の期間における割合と連続した所定の期間における割合とを時間方向に平滑化した割合を特定し、
特定した前記平滑化した割合に基づき、前記複数の入力装置のそれぞれから入力される音声信号に対応する出力を制御する
処理をコンピュータが実行することを特徴とする音声処理方法。 - 複数の入力装置のそれぞれから入力される音声信号を変換して複数の周波数スペクトルを生成する周波数変換部と、
前記複数の周波数スペクトルに含まれるそれぞれの雑音スペクトルを特定する雑音推定部と、
前記複数の周波数スペクトルと前記それぞれの雑音スペクトルにおける周波数成分毎の振幅とに基づき、前記複数の周波数スペクトルの中から第一の周波数成分を抽出し、抽出した前記第一の周波数成分に対応する周波数スペクトルのうち、特定の周波数スペクトルの各周波数成分の振幅と、前記複数の周波数スペクトルに含まれる前記特定の周波数スペクトルとは異なる1または複数の他の周波数スペクトルの各周波数成分の振幅とを、周波数成分毎に比較し、前記特定の周波数スペクトルの振幅が前記1または複数の他の周波数スペクトルの振幅より大きい周波数成分を抽出する算出部と、
抽出した前記周波数成分が、振幅の大きさの比較を行った周波数成分に対して占める割合に応じて、前記複数の入力装置のそれぞれから入力される音声信号に対応する出力を制御する制御部と、
を有することを特徴とする音声処理装置。 - 複数の入力装置のそれぞれから入力される音声信号を変換して複数の周波数スペクトルを生成する周波数変換部と、
前記複数の周波数スペクトルのうち、所定の期間における特定の周波数スペクトルと、前記所定の期間における特定の周波数スペクトルと連続した所定の期間における前記特定の周波数スペクトルとを、時間方向に平滑化した周波数スペクトルを特定する平滑化部と、
前記複数の周波数スペクトルのうち、前記平滑化した周波数スペクトルの各周波数成分の振幅と、前記複数の周波数スペクトルに含まれる前記平滑化した周波数スペクトルとは異なる1または複数の他の平滑化した周波数スペクトルの各周波数成分の振幅とを、周波数成分毎に比較し、前記平滑化した周波数スペクトルの振幅が前記1または複数の他の平滑化した周波数スペクトルの振幅より大きい周波数成分を抽出する算出部と、
抽出した前記周波数成分が、振幅の大きさの比較を行った周波数成分に対して占める割合に応じて、前記複数の入力装置のそれぞれから入力される音声信号に対応する出力を制御する制御部と、
を有することを特徴とする音声処理装置。 - 複数の入力装置のそれぞれから入力される音声信号を変換して複数の周波数スペクトルを生成する周波数変換部と、
前記複数の周波数スペクトルのうち、特定の周波数スペクトルの各周波数成分の振幅と、前記複数の周波数スペクトルに含まれる前記特定の周波数スペクトルとは異なる1または複数の他の周波数スペクトルの各周波数成分の振幅とを、周波数成分毎に比較し、前記特定の周波数スペクトルの振幅が前記1または複数の他の周波数スペクトルの振幅より大きい周波数成分を抽出する算出部と、
抽出した前記周波数成分が、振幅の大きさの比較を行った周波数成分に対して占める割合を算出し、算出した前記周波数成分に対して占める割合に基づき、前記所定の期間における前記割合と、前記所定の期間における割合と連続した所定の期間における割合とを時間方向に平滑化した割合を特定し、特定した前記平滑化した割合に基づき、前記複数の入力装置のそれぞれから入力される音声信号に対応する出力を制御する制御部と、
を有することを特徴とする音声処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016168628A JP6729187B2 (ja) | 2016-08-30 | 2016-08-30 | 音声処理プログラム、音声処理方法及び音声処理装置 |
US15/687,748 US10607628B2 (en) | 2016-08-30 | 2017-08-28 | Audio processing method, audio processing device, and computer readable storage medium |
EP17188203.8A EP3291228B1 (en) | 2016-08-30 | 2017-08-28 | Audio processing method, audio processing device, and audio processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016168628A JP6729187B2 (ja) | 2016-08-30 | 2016-08-30 | 音声処理プログラム、音声処理方法及び音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018036442A JP2018036442A (ja) | 2018-03-08 |
JP6729187B2 true JP6729187B2 (ja) | 2020-07-22 |
Family
ID=59713947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016168628A Active JP6729187B2 (ja) | 2016-08-30 | 2016-08-30 | 音声処理プログラム、音声処理方法及び音声処理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10607628B2 (ja) |
EP (1) | EP3291228B1 (ja) |
JP (1) | JP6729187B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113747128B (zh) * | 2020-05-27 | 2023-11-14 | 明基智能科技(上海)有限公司 | 噪音判断方法及噪音判断装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0741277Y2 (ja) * | 1989-11-07 | 1995-09-20 | 三洋電機株式会社 | 風雑音除去装置 |
US6301357B1 (en) * | 1996-12-31 | 2001-10-09 | Ericsson Inc. | AC-center clipper for noise and echo suppression in a communications system |
JP4873913B2 (ja) * | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
US7957964B2 (en) | 2004-12-28 | 2011-06-07 | Pioneer Corporation | Apparatus and methods for noise suppression in sound signals |
US8345890B2 (en) * | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
JP2008135933A (ja) * | 2006-11-28 | 2008-06-12 | Tohoku Univ | 音声強調処理システム |
JP4519901B2 (ja) | 2007-04-26 | 2010-08-04 | 株式会社神戸製鋼所 | 目的音抽出装置,目的音抽出プログラム,目的音抽出方法 |
JP5034734B2 (ja) * | 2007-07-13 | 2012-09-26 | ヤマハ株式会社 | 音処理装置およびプログラム |
JP4957810B2 (ja) * | 2008-02-20 | 2012-06-20 | 富士通株式会社 | 音処理装置、音処理方法及び音処理プログラム |
JP5920311B2 (ja) * | 2013-10-24 | 2016-05-18 | トヨタ自動車株式会社 | 風検出装置 |
JP6337519B2 (ja) * | 2014-03-03 | 2018-06-06 | 富士通株式会社 | 音声処理装置、雑音抑圧方法、およびプログラム |
-
2016
- 2016-08-30 JP JP2016168628A patent/JP6729187B2/ja active Active
-
2017
- 2017-08-28 US US15/687,748 patent/US10607628B2/en active Active
- 2017-08-28 EP EP17188203.8A patent/EP3291228B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20180061436A1 (en) | 2018-03-01 |
EP3291228A1 (en) | 2018-03-07 |
JP2018036442A (ja) | 2018-03-08 |
US10607628B2 (en) | 2020-03-31 |
EP3291228B1 (en) | 2020-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021036297A (ja) | 信号処理装置、信号処理方法、及びプログラム | |
JP5662276B2 (ja) | 音響信号処理装置および音響信号処理方法 | |
JP4886715B2 (ja) | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 | |
CN103650040B (zh) | 使用多特征建模分析语音/噪声可能性的噪声抑制方法和装置 | |
JP6169849B2 (ja) | 音響処理装置 | |
JP6789455B2 (ja) | 音声分離装置、音声分離方法、音声分離プログラム、及び音声分離システム | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
JP2017503388A5 (ja) | ||
US20140177853A1 (en) | Sound processing device, sound processing method, and program | |
JP6182895B2 (ja) | 処理装置、処理方法、プログラム及び処理システム | |
JP2014145838A (ja) | 音響処理装置及び音響処理方法 | |
JP5277887B2 (ja) | 信号処理装置およびプログラム | |
CN107393549A (zh) | 时延估计方法及装置 | |
JP6729187B2 (ja) | 音声処理プログラム、音声処理方法及び音声処理装置 | |
EP3288030B1 (en) | Gain adjustment apparatus and gain adjustment method | |
JP5815435B2 (ja) | 音源位置判定装置、音源位置判定方法、プログラム | |
WO2016173675A1 (en) | Suitability score based on attribute scores | |
CN111508512A (zh) | 语音信号中的摩擦音检测 | |
JP6729186B2 (ja) | 音声処理プログラム、音声処理方法及び音声処理装置 | |
US20230360662A1 (en) | Method and device for processing a binaural recording | |
JP6747236B2 (ja) | 音響解析方法および音響解析装置 | |
JP6447357B2 (ja) | オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム | |
CN112614512B (zh) | 噪声检测的方法和装置 | |
JPWO2016092837A1 (ja) | 音声処理装置、雑音抑圧装置、音声処理方法およびプログラム | |
JP2023542927A (ja) | 適応ノイズ推定 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20180528 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200615 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6729187 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |