JP7324753B2 - 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調 - Google Patents
修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調 Download PDFInfo
- Publication number
- JP7324753B2 JP7324753B2 JP2020528911A JP2020528911A JP7324753B2 JP 7324753 B2 JP7324753 B2 JP 7324753B2 JP 2020528911 A JP2020528911 A JP 2020528911A JP 2020528911 A JP2020528911 A JP 2020528911A JP 7324753 B2 JP7324753 B2 JP 7324753B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- target
- spectral density
- power spectral
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 76
- 238000012545 processing Methods 0.000 claims description 62
- 238000000034 method Methods 0.000 claims description 61
- 239000011159 matrix material Substances 0.000 claims description 57
- 230000000694 effects Effects 0.000 claims description 33
- 239000013598 vector Substances 0.000 claims description 25
- 230000003595 spectral effect Effects 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 10
- 230000002708 enhancing effect Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 29
- 238000004891 communication Methods 0.000 description 16
- 239000003623 enhancer Substances 0.000 description 10
- 238000010606 normalization Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/001—Adaptation of signal processing in PA systems in dependence of presence of noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/003—Digital PA systems using, e.g. LAN or internet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/005—Audio distribution systems for home, i.e. multi-room use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/009—Signal processing in [PA] systems to enhance the speech intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/02—Spatial or constructional arrangements of loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
表記及び仮定
の固有ベクトルであり、そのため以下の式が推論され得ることが認められる。
正規化行列の逆追跡
主固有ベクトルの追跡
ブラインド初期化についてのロバスト性
アルゴリズム
Px=αPx+(1-α)xxH
Claims (19)
- 音声信号を処理するための方法であって、
複数の音声入力コンポーネントによって検出された音声入力に基づいてマルチチャンネル音声信号を受信し、
前記マルチチャンネル音声信号を複数の周波数サブバンドによって複数のサブバンドフレームに変換し、
前記複数のサブバンドフレームのそれぞれが音源に関連するターゲット音声を含むかを決定し、
前記複数のサブバンドフレームのうちの前記ターゲット音声が存在するものに基づいて、前記音声入力の中の前記ターゲット音声の特徴を示す、ターゲット音声のパワースペクトル密度行列を生成し、
前記複数のサブバンドフレームのうちの前記ターゲット音声が存在しないものに基づいて、前記音声入力の中のノイズの特徴を示す、ノイズのパワースペクトル密度行列の逆行列を生成し、
前記ターゲット音声のパワースペクトル密度行列と前記ノイズのパワースペクトル密度行列の前記逆行列とに基づいて、下記式:
前記マルチチャンネル音声信号を処理して、前記ステアリングベクトルに基づく最小分散無歪応答(MVDR)ビームフォーミングによって前記マルチチャンネル音声信号の中の前記ターゲット音声を強調することにより音声出力信号を生成する、
ことを含む方法。
ただし、hは前記ステアリングベクトルであり、Pxは前記ターゲット音声のパワースペクトル密度行列であり、f GEV はPn -1 Pxの固有ベクトルであり、Pn -1 は前記ノイズのパワースペクトル密度行列の前記逆行列である。 - 前記ターゲット音声のパワースペクトル密度行列と前記ノイズのパワースペクトル密度行列の前記逆行列とに基づいて前記固有ベクトルを計算することを更に含む、
請求項1の方法。 - 前記ノイズのパワースペクトル密度の前記逆行列を生成することが、前記ノイズのパワースペクトル密度をメモリに記憶せずに前記マルチチャンネル音声信号に基づき前記ノイズのパワースペクトル密度の前記逆行列を直接更新することを含む、
請求項1の方法。 - 前記固有ベクトルを計算することが、反復抽出アルゴリズムを用いて前記固有ベクトルを計算することを含む、
請求項2の方法。 - 前記複数の音声入力コンポーネントが、マイクロフォンのアレーを備える、
請求項1の方法。 - 前記音声出力信号を出力することを更に含む、
請求項5の方法。 - 前記音声出力信号が、ネットワークを介して外部デバイスに出力される、
請求項6の方法。 - 前記音声出力信号に基づいてコマンドを決定し、
外部デバイスに前記コマンドを伝達する、
ことを更に含む、請求項5の方法。 - 伝達された前記コマンドに基づいて、前記外部デバイスからデータを受信し、
前記外部デバイスから前記データを受信したことに応じて、受信した前記データに基づいて1以上のスピーカーから出力を供給する、
ことを更に含む、請求項8の方法。 - 音声入力を検出し、検出された前記音声入力に基づいてマルチチャンネル音声信号を生成するように構成された複数の音声入力コンポーネントと、
前記マルチチャンネル音声信号を、複数の周波数サブバンドによって複数のサブバンドフレームに変換するように構成されたサブバンド周波数アナライザと、
前記複数のサブバンドフレームのそれぞれが音源に関連するターゲット音声を含むかを決定するように構成されたアクティビティ検出部と、
前記複数のサブバンドフレームのうちの前記ターゲット音声が存在するものに基づいて、前記音声入力の中の前記ターゲット音声の特徴を示す、ターゲット音声のパワースペクトル密度行列を生成し、
前記複数のサブバンドフレームのうちの前記ターゲット音声が存在しないものに基づいて、前記音声入力の中のノイズの特徴を示す、ノイズのパワースペクトル密度行列の逆行列を生成し、
前記ターゲット音声のパワースペクトル密度行列と前記ノイズのパワースペクトル密度行列の前記逆行列とに基づいて、下記式:
前記マルチチャンネル音声信号を処理して、前記ステアリングベクトルに基づく最小分散無歪応答(MVDR)ビームフォーミングによって前記マルチチャンネル音声信号の中の前記ターゲット音声を強調することにより音声出力信号を生成するように構成された音声信号プロセッサと、
を備える、音声処理デバイス。
ただし、hは前記ステアリングベクトルであり、Pxは前記ターゲット音声のパワースペクトル密度行列であり、f GEV はPn -1 Pxの固有ベクトルであり、Pn -1 は前記ノイズのパワースペクトル密度行列の前記逆行列である。 - 前記ターゲット音源RTF推定部が、前記ターゲット音声のパワースペクトル密度行列と前記ノイズのパワースペクトル密度行列の前記逆行列とに基づいて前記固有ベクトルを計算するように構成されている、
請求項10の音声処理デバイス。 - 前記ノイズのパワースペクトル密度の前記逆行列を生成することが、前記ノイズのパワースペクトル密度をメモリに記憶せずに前記マルチチャンネル音声信号に基づき前記ノイズのパワースペクトル密度の前記逆行列を直接更新することを含む、
請求項10の音声処理デバイス。 - 前記固有ベクトルが、反復抽出アルゴリズムを用いて計算される、
請求項11の音声処理デバイス。 - 前記複数の音声入力コンポーネントが、マイクロフォンのアレーを備える、
請求項10の音声処理デバイス。 - 前記音声出力信号を出力するように構成された1以上のスピーカーを更に備える、
請求項10の音声処理デバイス。 - 前記音声出力信号を外部デバイスに伝達するように構成されたネットワークインターフェースを更に備える、
請求項10の音声処理デバイス。 - 前記音声出力信号に基づいて、1以上の単語を決定するように構成された発話認識エンジンを更に備える、
請求項10の音声処理デバイス。 - 前記発話認識エンジンが、前記1以上の単語をコマンドに割当てるように更に構成されている、
請求項17の音声処理デバイス。 - 前記ターゲット音声が、ボイス信号を含み、前記アクティビティ検出部が、ボイスアクティビティ検出部である、
請求項11の音声処理デバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/833,977 US10679617B2 (en) | 2017-12-06 | 2017-12-06 | Voice enhancement in audio signals through modified generalized eigenvalue beamformer |
US15/833,977 | 2017-12-06 | ||
PCT/US2018/064133 WO2019113253A1 (en) | 2017-12-06 | 2018-12-05 | Voice enhancement in audio signals through modified generalized eigenvalue beamformer |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021505933A JP2021505933A (ja) | 2021-02-18 |
JP7324753B2 true JP7324753B2 (ja) | 2023-08-10 |
Family
ID=66659350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020528911A Active JP7324753B2 (ja) | 2017-12-06 | 2018-12-05 | 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10679617B2 (ja) |
JP (1) | JP7324753B2 (ja) |
CN (1) | CN111418012B (ja) |
WO (1) | WO2019113253A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11172293B2 (en) * | 2018-07-11 | 2021-11-09 | Ambiq Micro, Inc. | Power efficient context-based audio processing |
JP7407580B2 (ja) | 2018-12-06 | 2024-01-04 | シナプティクス インコーポレイテッド | システム、及び、方法 |
US10728656B1 (en) * | 2019-01-07 | 2020-07-28 | Kikago Limited | Audio device and audio processing method |
KR20200132613A (ko) * | 2019-05-16 | 2020-11-25 | 삼성전자주식회사 | 웨이크 언 보이스(Wake on Voice, WoV) 기술을 이용한 음성 인식 수행 방법 및 장치 |
US10735887B1 (en) * | 2019-09-19 | 2020-08-04 | Wave Sciences, LLC | Spatial audio array processing system and method |
US11997474B2 (en) | 2019-09-19 | 2024-05-28 | Wave Sciences, LLC | Spatial audio array processing system and method |
US11064294B1 (en) | 2020-01-10 | 2021-07-13 | Synaptics Incorporated | Multiple-source tracking and voice activity detections for planar microphone arrays |
CN111312275B (zh) * | 2020-02-13 | 2023-04-25 | 大连理工大学 | 一种基于子带分解的在线声源分离增强系统 |
EP4292087A1 (en) * | 2021-02-11 | 2023-12-20 | Nuance Communications, Inc. | First and second embedding of acoustic relative transfer functions |
US11823707B2 (en) | 2022-01-10 | 2023-11-21 | Synaptics Incorporated | Sensitivity mode for an audio spotting system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001100800A (ja) | 1999-09-27 | 2001-04-13 | Toshiba Corp | 雑音成分抑圧処理装置および雑音成分抑圧処理方法 |
JP2007047427A (ja) | 2005-08-10 | 2007-02-22 | Hitachi Ltd | 音声処理装置 |
JP2016080750A (ja) | 2014-10-10 | 2016-05-16 | 株式会社Nttドコモ | 音声認識装置、音声認識方法、及び音声認識プログラム |
JP2018141922A (ja) | 2017-02-28 | 2018-09-13 | 日本電信電話株式会社 | ステアリングベクトル推定装置、ステアリングベクトル推定方法およびステアリングベクトル推定プログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7088831B2 (en) * | 2001-12-06 | 2006-08-08 | Siemens Corporate Research, Inc. | Real-time audio source separation by delay and attenuation compensation in the time domain |
US8098842B2 (en) * | 2007-03-29 | 2012-01-17 | Microsoft Corp. | Enhanced beamforming for arrays of directional microphones |
US8005237B2 (en) | 2007-05-17 | 2011-08-23 | Microsoft Corp. | Sensor array beamformer post-processor |
DE602008002695D1 (de) | 2008-01-17 | 2010-11-04 | Harman Becker Automotive Sys | Postfilter für einen Strahlformer in der Sprachverarbeitung |
EP2146519B1 (en) | 2008-07-16 | 2012-06-06 | Nuance Communications, Inc. | Beamforming pre-processing for speaker localization |
US9202456B2 (en) | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
US9768829B2 (en) | 2012-05-11 | 2017-09-19 | Intel Deutschland Gmbh | Methods for processing audio signals and circuit arrangements therefor |
EP3462452A1 (en) * | 2012-08-24 | 2019-04-03 | Oticon A/s | Noise estimation for use with noise reduction and echo cancellation in personal communication |
EP2747451A1 (en) | 2012-12-21 | 2014-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrivial estimates |
EP2884489B1 (en) * | 2013-12-16 | 2020-02-05 | Harman Becker Automotive Systems GmbH | Sound system including an engine sound synthesizer |
EP2916321B1 (en) * | 2014-03-07 | 2017-10-25 | Oticon A/s | Processing of a noisy audio signal to estimate target and noise spectral variances |
US9432769B1 (en) | 2014-07-30 | 2016-08-30 | Amazon Technologies, Inc. | Method and system for beam selection in microphone array beamformers |
US10049678B2 (en) * | 2014-10-06 | 2018-08-14 | Synaptics Incorporated | System and method for suppressing transient noise in a multichannel system |
US20180039478A1 (en) * | 2016-08-02 | 2018-02-08 | Google Inc. | Voice interaction services |
US10170134B2 (en) * | 2017-02-21 | 2019-01-01 | Intel IP Corporation | Method and system of acoustic dereverberation factoring the actual non-ideal acoustic environment |
US10269369B2 (en) * | 2017-05-31 | 2019-04-23 | Apple Inc. | System and method of noise reduction for a mobile device |
US10096328B1 (en) * | 2017-10-06 | 2018-10-09 | Intel Corporation | Beamformer system for tracking of speech and noise in a dynamic environment |
US10090000B1 (en) * | 2017-11-01 | 2018-10-02 | GM Global Technology Operations LLC | Efficient echo cancellation using transfer function estimation |
-
2017
- 2017-12-06 US US15/833,977 patent/US10679617B2/en active Active
-
2018
- 2018-12-05 WO PCT/US2018/064133 patent/WO2019113253A1/en active Application Filing
- 2018-12-05 JP JP2020528911A patent/JP7324753B2/ja active Active
- 2018-12-05 CN CN201880078921.6A patent/CN111418012B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001100800A (ja) | 1999-09-27 | 2001-04-13 | Toshiba Corp | 雑音成分抑圧処理装置および雑音成分抑圧処理方法 |
JP2007047427A (ja) | 2005-08-10 | 2007-02-22 | Hitachi Ltd | 音声処理装置 |
JP2016080750A (ja) | 2014-10-10 | 2016-05-16 | 株式会社Nttドコモ | 音声認識装置、音声認識方法、及び音声認識プログラム |
JP2018141922A (ja) | 2017-02-28 | 2018-09-13 | 日本電信電話株式会社 | ステアリングベクトル推定装置、ステアリングベクトル推定方法およびステアリングベクトル推定プログラム |
Non-Patent Citations (1)
Title |
---|
伊藤信貴 他,"統計的空間辞書に基づくオンライン話者識別と適応ビームフォーミングによる複数人会話音声認識のための音声強調",日本音響学会2017年秋季研究発表会講演論文集CD-ROM,2017年09月11日,pp.507-508 |
Also Published As
Publication number | Publication date |
---|---|
WO2019113253A1 (en) | 2019-06-13 |
JP2021505933A (ja) | 2021-02-18 |
US10679617B2 (en) | 2020-06-09 |
CN111418012B (zh) | 2024-03-15 |
US20190172450A1 (en) | 2019-06-06 |
CN111418012A (zh) | 2020-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7324753B2 (ja) | 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調 | |
CN110100457B (zh) | 基于噪声时变环境的加权预测误差的在线去混响算法 | |
US10490204B2 (en) | Method and system of acoustic dereverberation factoring the actual non-ideal acoustic environment | |
US11694710B2 (en) | Multi-stream target-speech detection and channel fusion | |
US10522167B1 (en) | Multichannel noise cancellation using deep neural network masking | |
US10930298B2 (en) | Multiple input multiple output (MIMO) audio signal processing for speech de-reverberation | |
US9721583B2 (en) | Integrated sensor-array processor | |
JP7498560B2 (ja) | システム及び方法 | |
US10403300B2 (en) | Spectral estimation of room acoustic parameters | |
KR100486736B1 (ko) | 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치 | |
WO2017029044A1 (en) | Microphone array signal processing system | |
US10049685B2 (en) | Integrated sensor-array processor | |
TW202147862A (zh) | 強烈雜訊干擾存在下穩健的揚聲器定位系統與方法 | |
JP6265903B2 (ja) | 信号雑音減衰 | |
Delcroix et al. | Multichannel speech enhancement approaches to DNN-based far-field speech recognition | |
US10204638B2 (en) | Integrated sensor-array processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230406 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230712 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230731 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7324753 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |