WO2017141317A1 - 音響信号強調装置 - Google Patents
音響信号強調装置 Download PDFInfo
- Publication number
- WO2017141317A1 WO2017141317A1 PCT/JP2016/054297 JP2016054297W WO2017141317A1 WO 2017141317 A1 WO2017141317 A1 WO 2017141317A1 JP 2016054297 W JP2016054297 W JP 2016054297W WO 2017141317 A1 WO2017141317 A1 WO 2017141317A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- signal
- unit
- weighting
- neural network
- output
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
Abstract
Description
これらの機能を実現する装置は屋外や工場などの騒音環境下、あるいはスピーカ等で発生される音響信号がマイクロホンに多く回り込む高エコー環境で用いられることが多いため、マイクロホンや振動センサなどに代表される音響トランスデューサに対し、目的信号と共に背景騒音や音響エコー信号など不要な信号も入力されてしまい、通話音声の劣化及び音声認識率、異常音検出率の低下などを招く。そのため、快適な音声通話及び高精度の音声認識や異常音検出を実現するには、入力信号に混入した目的信号外の不要な信号(以下、この不要な信号を「雑音」と称する)を抑圧し、目的信号のみを強調する音響信号強調装置が必要である。
実施の形態1.
図1は、本発明に係る実施の形態1の音響信号強調装置の概略構成を示すブロック図である。図1に示す音響信号強調装置は、信号入力部1と、第1の信号重み付け部2と、第1のフーリエ変換部3と、ニューラルネットワーク演算部4と、逆フーリエ変換部5と、逆フィルタ部6と、信号出力部7と、教師信号出力部8と、第2の信号重み付け部9と、第2のフーリエ変換部10と、誤差評価部11とを備える。
信号入力部1は、上述のような音響信号を所定のフレーム間隔で取り込み、時間領域の信号である入力信号xn(t)として第1の信号重み付け部2へ出力する。ここで、nは入力信号をフレーム分割したときのフレーム番号、tはサンプリングにおける離散時間番号を表す。
フォルマント強調の方法としては、例えば、ハニング窓掛けした音声信号から自己相関係数を求め、帯域伸長処理を施したのち、レビンソン―ダービン(Levinson-Durbin)法により12次の線形予測係数を求め、この線形予測係数からフォルマント強調係数を求める。そして、得られたフォルマント強調係数を用いたARMA(Auto Regressive Moving Average;自己回帰移動平均)型の合成フィルタを通過させることにより行うことができる。フォルマント強調の方法としては上記の方法に限らず、他の公知の手法を用いることができる。
また、上記重み付けに用いた重み係数wn(j)を、後述する逆フィルタ部6へ出力する。ここでjは重み係数の次数であり、フォルマント強調用フィルタのフィルタ次数に相当する。
ここで、kはパワースペクトルの周波数帯域の周波数成分を指定する番号(以下、スペクトル番号と称する)、FFT[・]は高速フーリエ変換処理を表す。
ここで、Re{Xn(k)}及びIm{Xn(k)}は、それぞれフーリエ変換後の入力信号スペクトルの実数部及び虚数部を表す。また、M=128である。
信号出力部7は、上記の方法により強調された強調信号sn(t)を外部へ出力する。
この学習誤差Eを評価関数として、例えば、バックプロパゲーション法により結合係数の変更量が計算される。この学習誤差Eが十分小さくなるまで、ニューラルネットワーク内部の各結合係数の更新が行われる。
信号入力部1は、音響信号を所定のフレーム間隔で取りこみ(ステップST1A)、時間領域の信号である入力信号xn(t)として第1の信号重み付け部2へ出力する。サンプル番号tが所定の値Tより小さい場合(ステップST1BのYES)、ステップST1Aの処理をT=80になるまで繰り返す。
フォルマント強調は以下の処理を順次行う。まず、入力信号xn(t)のハニング窓掛けを行う(ステップST2A)。ハニング窓掛けされた入力信号の自己相関係数を求め(ステップST2B)、帯域伸長(Band Expansion)処理を行う(ステップST2C)。次に、レビンソン―ダービン(Levinson-Durbin)法により12次の線形予測係数を求め(ステップST2D)、この線形予測係数からフォルマント強調係数を求める(ステップST2E)。得られたフォルマント強調係数を用いたARMA型の合成フィルタを用いてフィルタ処理を行う(ステップST2F)。
メモリ203は、本実施の形態の音響信号強調処理を実現するための各種プログラムを記憶するプログラムメモリ、プロセッサがデータ処理を行う際に使用するワークメモリ、及び信号データを展開するメモリ等として使用するROM及びRAM等の記憶手段である。
実施の形態1では、入力信号の重み付け処理を時間波形領域で実施する場合を説明したが、入力信号の重み付け処理を周波数領域で行うことも可能であり、これを実施の形態2として説明する。
誤差評価部11は、ニューラルネットワーク演算部4が出力する、強調されたパワースペクトルSn(k)と、第2の信号重み付け部14が出力する重み付けされた教師信号のパワースペクトルDw_n(k)とを用い、実施の形態1と同様に、学習誤差Eが所定の閾値Eth以下となるまで学習誤差Eの計算と結合係数の再計算を行う。
上述の実施の形態1及び実施の形態2では、周波数領域の信号であるパワースペクトルをニューラルネットワーク演算部4の入出力としていたが、時間波形信号を入力することも可能であり、これを実施の形態3として説明する。
ここで、Tは時間フレーム内のサンプル個数であり、T=80である。
これ以外の動作については実施の形態1と同様であるため、ここでの説明は省略する。
Claims (4)
- 目的信号と雑音が混入した入力信号に対して、前記目的信号または前記雑音の特徴を重み付けした信号を出力する第1の信号重み付け部と、
前記第1の信号重み付け部で重み付けされた信号に対し、結合係数を用いて前記目的信号の強調を行った強調信号を出力するニューラルネットワーク演算部と、
前記強調信号から前記目的信号または前記雑音の特徴の重み付けを解除する逆フィルタ部と、
ニューラルネットワークの学習を行うための教師信号に対して目的信号または雑音の特徴を重み付けした信号を出力する第2の信号重み付け部と、
前記第2の信号重み付け部で重み付けされた信号と、前記ニューラルネットワーク演算部の出力信号との学習誤差が設定値以下の値となる結合係数を前記結合係数として出力する誤差評価部とを備えたことを特徴とする音響信号強調装置。 - 目的信号と雑音が混入した入力信号から、前記目的信号または前記雑音の特徴を重み付けした信号を出力する第1の信号重み付け部と、
前記第1の信号重み付け部で重み付けされた信号をスペクトルに変換する第1のフーリエ変換部と、
前記スペクトルに対し、結合係数を用いて前記目的信号の強調を行った強調信号を出力するニューラルネットワーク演算部と、
前記ニューラルネットワーク演算部から出力された強調信号を時間領域の強調信号に変換する逆フーリエ変換部と、
前記逆フーリエ変換部から出力された強調信号から前記目的信号または前記雑音の特徴の重み付けを解除する逆フィルタ部と、
ニューラルネットワークの学習を行うための教師信号に対して目的信号または雑音の特徴を重み付けした信号を出力する第2の信号重み付け部と、
前記第2の信号重み付け部で重み付けされた信号をスペクトルに変換する第2のフーリエ変換部と、
前記第2のフーリエ変換部の出力信号と、前記ニューラルネットワーク演算部の出力信号との学習誤差が設定値以下の値となる結合係数を前記結合係数として出力する誤差評価部とを備えたことを特徴とする音響信号強調装置。 - 目的信号と雑音が混入した入力信号をスペクトルに変換する第1のフーリエ変換部と、
前記スペクトルに対して前記目的信号または前記雑音の特徴を周波数領域で重み付けした信号を出力する第1の信号重み付け部と、
前記第1の信号重み付け部の出力信号に対し、結合係数を用いて前記目的信号の強調を行った強調信号を出力するニューラルネットワーク演算部と、
前記強調信号から前記目的信号または前記雑音の特徴の重み付けを解除する逆フィルタ部と、
前記逆フィルタ部の出力信号を時間領域の強調信号に変換する逆フーリエ変換部と、
ニューラルネットワークの学習を行うための教師信号をスペクトルに変換する第2のフーリエ変換部と、
前記第2のフーリエ変換部の出力信号に対して目的信号または雑音の特徴を重み付けした信号を出力する第2の信号重み付け部と、
前記第2の信号重み付け部の出力信号と、前記ニューラルネットワーク演算部の出力信号との学習誤差が設定値以下の値となる結合係数を前記結合係数として出力する誤差評価部とを備えたことを特徴とする音響信号強調装置。 - 前記入力信号及び前記教師信号は時間波形信号であることを特徴とする請求項1記載の音響信号強調装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/054297 WO2017141317A1 (ja) | 2016-02-15 | 2016-02-15 | 音響信号強調装置 |
JP2017557472A JP6279181B2 (ja) | 2016-02-15 | 2016-02-15 | 音響信号強調装置 |
US16/064,323 US10741195B2 (en) | 2016-02-15 | 2016-02-15 | Sound signal enhancement device |
CN201680081212.4A CN108604452B (zh) | 2016-02-15 | 2016-02-15 | 声音信号增强装置 |
DE112016006218.4T DE112016006218B4 (de) | 2016-02-15 | 2016-02-15 | Schallsignal-Verbesserungsvorrichtung |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/054297 WO2017141317A1 (ja) | 2016-02-15 | 2016-02-15 | 音響信号強調装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2017141317A1 true WO2017141317A1 (ja) | 2017-08-24 |
Family
ID=59625729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2016/054297 WO2017141317A1 (ja) | 2016-02-15 | 2016-02-15 | 音響信号強調装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10741195B2 (ja) |
JP (1) | JP6279181B2 (ja) |
CN (1) | CN108604452B (ja) |
DE (1) | DE112016006218B4 (ja) |
WO (1) | WO2017141317A1 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019063547A1 (en) * | 2017-09-26 | 2019-04-04 | Sony Europe Limited | METHOD AND ELECTRONIC DEVICE FOR ATTENUATION / AMPLIFICATION OF FORMER |
JP2019090930A (ja) * | 2017-11-15 | 2019-06-13 | 日本電信電話株式会社 | 音源強調装置、音源強調学習装置、音源強調方法、プログラム |
WO2020002914A1 (en) | 2018-06-29 | 2020-01-02 | Smartkem Limited | Sputter protective layer for organic electronic devices |
GB201919031D0 (en) | 2019-12-20 | 2020-02-05 | Smartkem Ltd | Sputter protective layer for organic electronic devices |
JP2020194558A (ja) * | 2018-08-10 | 2020-12-03 | ヤマハ株式会社 | 情報処理方法 |
US11298101B2 (en) | 2018-08-31 | 2022-04-12 | The Trustees Of Dartmouth College | Device embedded in, or attached to, a pillow configured for in-bed monitoring of respiration |
WO2022101644A1 (en) | 2020-11-16 | 2022-05-19 | Smartkem Limited | Organic thin film transistor |
WO2023247927A1 (en) | 2022-06-20 | 2023-12-28 | Smartkem Limited | An integrated circuit for a flat-panel display |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107068161B (zh) * | 2017-04-14 | 2020-07-28 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音降噪方法、装置和计算机设备 |
US10726858B2 (en) | 2018-06-22 | 2020-07-28 | Intel Corporation | Neural network for speech denoising trained with deep feature losses |
CN111261179A (zh) * | 2018-11-30 | 2020-06-09 | 阿里巴巴集团控股有限公司 | 回声消除方法及装置和智能设备 |
CN110491407B (zh) * | 2019-08-15 | 2021-09-21 | 广州方硅信息技术有限公司 | 语音降噪的方法、装置、电子设备及存储介质 |
JP2021177598A (ja) * | 2020-05-08 | 2021-11-11 | シャープ株式会社 | 音声処理システム、音声処理方法、及び音声処理プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0566795A (ja) * | 1991-09-06 | 1993-03-19 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | 雑音抑圧装置とその調整装置 |
JP2011530091A (ja) * | 2008-08-05 | 2011-12-15 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5812886B2 (ja) | 1975-09-10 | 1983-03-10 | 日石三菱株式会社 | ポリオレフインノセイゾウホウホウ |
JPH05232986A (ja) | 1992-02-21 | 1993-09-10 | Hitachi Ltd | 音声信号用前処理方法 |
US5432883A (en) * | 1992-04-24 | 1995-07-11 | Olympus Optical Co., Ltd. | Voice coding apparatus with synthesized speech LPC code book |
JPH0776880B2 (ja) * | 1993-01-13 | 1995-08-16 | 日本電気株式会社 | パターン認識方法および装置 |
JP2993396B2 (ja) * | 1995-05-12 | 1999-12-20 | 三菱電機株式会社 | 音声加工フィルタ及び音声合成装置 |
JP3591068B2 (ja) * | 1995-06-30 | 2004-11-17 | ソニー株式会社 | 音声信号の雑音低減方法 |
DE19524847C1 (de) * | 1995-07-07 | 1997-02-13 | Siemens Ag | Vorrichtung zur Verbesserung gestörter Sprachsignale |
US7076168B1 (en) * | 1998-02-12 | 2006-07-11 | Aquity, Llc | Method and apparatus for using multicarrier interferometry to enhance optical fiber communications |
JPH11259445A (ja) | 1998-03-13 | 1999-09-24 | Matsushita Electric Ind Co Ltd | 学習装置 |
US6862558B2 (en) * | 2001-02-14 | 2005-03-01 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Empirical mode decomposition for analyzing acoustical signals |
US6941263B2 (en) * | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
AU2003274864A1 (en) * | 2003-10-24 | 2005-05-11 | Nokia Corpration | Noise-dependent postfiltering |
US7620546B2 (en) * | 2004-03-23 | 2009-11-17 | Qnx Software Systems (Wavemakers), Inc. | Isolating speech signals utilizing neural networks |
JP2008052117A (ja) * | 2006-08-25 | 2008-03-06 | Oki Electric Ind Co Ltd | 雑音除去装置、方法及びプログラム |
JP4455614B2 (ja) * | 2007-06-13 | 2010-04-21 | 株式会社東芝 | 音響信号処理方法及び装置 |
US8639502B1 (en) * | 2009-02-16 | 2014-01-28 | Arrowhead Center, Inc. | Speaker model-based speech enhancement system |
CN101599274B (zh) * | 2009-06-26 | 2012-03-28 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
CN102770912B (zh) * | 2010-01-13 | 2015-06-10 | 沃伊斯亚吉公司 | 使用线性预测滤波的前向时域混叠消除 |
DE112010005895B4 (de) * | 2010-09-21 | 2016-12-15 | Mitsubishi Electric Corporation | Störungsunterdrückungsvorrichtung |
CN103270772B (zh) * | 2010-11-25 | 2017-06-06 | 日本电气株式会社 | 信号处理设备、信号处理方法 |
US8548803B2 (en) * | 2011-08-08 | 2013-10-01 | The Intellisis Corporation | System and method of processing a sound signal including transforming the sound signal into a frequency-chirp domain |
US20140136451A1 (en) * | 2012-11-09 | 2014-05-15 | Apple Inc. | Determining Preferential Device Behavior |
US9131308B2 (en) * | 2014-01-21 | 2015-09-08 | Dopler Labs, Inc. | Passive audio ear filters with multiple filter elements |
US20170011753A1 (en) * | 2014-02-27 | 2017-01-12 | Nuance Communications, Inc. | Methods And Apparatus For Adaptive Gain Control In A Communication System |
US20160019890A1 (en) * | 2014-07-17 | 2016-01-21 | Ford Global Technologies, Llc | Vehicle State-Based Hands-Free Phone Noise Reduction With Learning Capability |
US9536537B2 (en) * | 2015-02-27 | 2017-01-03 | Qualcomm Incorporated | Systems and methods for speech restoration |
WO2017017569A1 (en) * | 2015-07-26 | 2017-02-02 | Vocalzoom Systems Ltd. | Enhanced automatic speech recognition |
US10307108B2 (en) * | 2015-10-13 | 2019-06-04 | Elekta, Inc. | Pseudo-CT generation from MR data using a feature regression model |
-
2016
- 2016-02-15 US US16/064,323 patent/US10741195B2/en active Active
- 2016-02-15 JP JP2017557472A patent/JP6279181B2/ja active Active
- 2016-02-15 CN CN201680081212.4A patent/CN108604452B/zh active Active
- 2016-02-15 DE DE112016006218.4T patent/DE112016006218B4/de active Active
- 2016-02-15 WO PCT/JP2016/054297 patent/WO2017141317A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0566795A (ja) * | 1991-09-06 | 1993-03-19 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | 雑音抑圧装置とその調整装置 |
JP2011530091A (ja) * | 2008-08-05 | 2011-12-15 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019063547A1 (en) * | 2017-09-26 | 2019-04-04 | Sony Europe Limited | METHOD AND ELECTRONIC DEVICE FOR ATTENUATION / AMPLIFICATION OF FORMER |
US11594241B2 (en) | 2017-09-26 | 2023-02-28 | Sony Europe B.V. | Method and electronic device for formant attenuation/amplification |
JP2019090930A (ja) * | 2017-11-15 | 2019-06-13 | 日本電信電話株式会社 | 音源強調装置、音源強調学習装置、音源強調方法、プログラム |
WO2020002914A1 (en) | 2018-06-29 | 2020-01-02 | Smartkem Limited | Sputter protective layer for organic electronic devices |
JP2020194558A (ja) * | 2018-08-10 | 2020-12-03 | ヤマハ株式会社 | 情報処理方法 |
JP7103390B2 (ja) | 2018-08-10 | 2022-07-20 | ヤマハ株式会社 | 音響信号生成方法、音響信号生成装置およびプログラム |
US11298101B2 (en) | 2018-08-31 | 2022-04-12 | The Trustees Of Dartmouth College | Device embedded in, or attached to, a pillow configured for in-bed monitoring of respiration |
GB201919031D0 (en) | 2019-12-20 | 2020-02-05 | Smartkem Ltd | Sputter protective layer for organic electronic devices |
WO2022101644A1 (en) | 2020-11-16 | 2022-05-19 | Smartkem Limited | Organic thin film transistor |
WO2023247927A1 (en) | 2022-06-20 | 2023-12-28 | Smartkem Limited | An integrated circuit for a flat-panel display |
Also Published As
Publication number | Publication date |
---|---|
US20180374497A1 (en) | 2018-12-27 |
JP6279181B2 (ja) | 2018-02-14 |
CN108604452B (zh) | 2022-08-02 |
DE112016006218B4 (de) | 2022-02-10 |
US10741195B2 (en) | 2020-08-11 |
CN108604452A (zh) | 2018-09-28 |
JPWO2017141317A1 (ja) | 2018-02-22 |
DE112016006218T5 (de) | 2018-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6279181B2 (ja) | 音響信号強調装置 | |
CN109065067B (zh) | 一种基于神经网络模型的会议终端语音降噪方法 | |
EP3189521B1 (en) | Method and apparatus for enhancing sound sources | |
US20110178800A1 (en) | Distortion Measurement for Noise Suppression System | |
JP2021503633A (ja) | 音声ノイズ軽減方法、装置、サーバー及び記憶媒体 | |
KR102191736B1 (ko) | 인공신경망을 이용한 음성향상방법 및 장치 | |
EP3005344A1 (en) | An audio scene apparatus | |
US20180190311A1 (en) | Signal processing apparatus, signal processing method, and signal processing program | |
US20200045166A1 (en) | Acoustic signal processing device, acoustic signal processing method, and hands-free communication device | |
TW202117706A (zh) | 具多麥克風之語音增強裝置及方法 | |
EP1913591B1 (en) | Enhancement of speech intelligibility in a mobile communication device by controlling the operation of a vibrator in dependance of the background noise | |
JP2021511755A (ja) | 音声認識オーディオシステムおよび方法 | |
CN112053702B (zh) | 一种语音处理的方法、装置及电子设备 | |
WO2012015569A1 (en) | Formant aided noise cancellation using multiple microphones | |
Morita et al. | Robust voice activity detection based on concept of modulation transfer function in noisy reverberant environments | |
KR101850693B1 (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
JP6840302B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
US20180158447A1 (en) | Acoustic environment understanding in machine-human speech communication | |
Close et al. | PAMGAN+/-: Improving Phase-Aware Speech Enhancement Performance via Expanded Discriminator Training | |
JP5251473B2 (ja) | 音声処理装置、及び、音声処理方法 | |
Prasad et al. | Two microphone technique to improve the speech intelligibility under noisy environment | |
US20240161762A1 (en) | Full-band audio signal reconstruction enabled by output from a machine learning model | |
CN111226278A (zh) | 低复杂度的浊音语音检测和基音估计 | |
WO2024102983A1 (en) | Full-band audio signal reconstruction enabled by output from a machine learning model | |
US20130226568A1 (en) | Audio signals by estimations and use of human voice attributes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 16890460 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2017557472 Country of ref document: JP Kind code of ref document: A |
|
WWE | Wipo information: entry into national phase |
Ref document number: 112016006218 Country of ref document: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 16890460 Country of ref document: EP Kind code of ref document: A1 |