JP2008275881A - 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム - Google Patents
雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム Download PDFInfo
- Publication number
- JP2008275881A JP2008275881A JP2007119194A JP2007119194A JP2008275881A JP 2008275881 A JP2008275881 A JP 2008275881A JP 2007119194 A JP2007119194 A JP 2007119194A JP 2007119194 A JP2007119194 A JP 2007119194A JP 2008275881 A JP2008275881 A JP 2008275881A
- Authority
- JP
- Japan
- Prior art keywords
- power spectrum
- input
- voice
- gain adjustment
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007781 pre-processing Methods 0.000 title claims description 15
- 238000000605 extraction Methods 0.000 title abstract 2
- 238000012545 processing Methods 0.000 claims abstract description 68
- 238000001228 spectrum Methods 0.000 claims abstract description 58
- 238000009408 flooring Methods 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims description 81
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000012880 independent component analysis Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000037237 body shape Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】 マイクロホン等から得られる2チャンネルの入力音声についての処理として、スペクトラム・サブトラクション (SS:Spectrum Subtraction)処理とフロアリング(Flooring)処理との間で利得調整を行うことだけによって、実用的な音声認識性能を実現する。利得調整としては、CSP (Cross-power Spectrum Phase:クロス・パワー・スペクトラム・フェーズ) 係数という2チャンネル信号間の相互相関関係を利用できる。オーディオ背景音などが存在する車の室内環境において、カーナビゲーションシステムにおける音声コマンドの認識率を向上させ、ドライバーなど発話者のユーザビリティを向上させる。
【選択図】図3
Description
「相関係数に基づいた音声検出と音声強調に関する検討」永田仁史,藤岡豊太,安倍正人(岩手大学工学部情報システム工学科),電子情報通信学会技術研究報告,音声研究会,SP2002-165,pp.25-31 (2003-01) 「Weighted CSP 法と零交差検出法に基づくハンズフリー発話区間検出の検討」田中貴雅,傳田遊亀,中山雅人,西浦敬信(立命館大),日本音響学会講演論文集,1-2-13,pp25-26 (2006-09) 「マイクロフォンアレイとカルマンフィルタによる実環境下でのハンズフリー音声認識 − 対話型テレビのフロントエンドシステムの構築 −」藤本 雅清 有木 康雄(龍谷大学大学院 理工学研究科)、第4回DSPS教育者会議,pp.55-58 (2002-08) 「帯域分割型CSP法に基づく話者位置推定法の検討」傳田 遊亀 西浦 敬信 河原 英紀 入野 俊夫(和歌山大学大学院 システム工学研究科 立命館大学 情報理工学部), 電子情報通信学会技術研究報告,音声研究会,NLC2004-69,pp.79-84 SP2004-109 (2004-12)
車内の室内空間でのカーナビゲーションシステムの使用を想定して、本発明について、音声コマンドの音声認識についての単語誤り率を測定する実験を行った。実験条件は、表1の通りである。
停車中(アイドリング状態で、エアコンをオンにした状態)の車内において、DVD 5.1chオーディオが背景音として流れている状態を想定して、4名の話者によりカーナビゲーションシステムを操作するための50種類の音声コマンドを発話収録し、音声認識させる実験を行った。実験結果(コマンド認識率)を表3に示す。表中の「SSのみ」という項目は、2つのマイクロホンによる発話区間処理および利得調整は行わずに、従来のスペクトルサブトラクション(SS)法により雑音除去処理を行った場合のコマンド認識率の結果である。ここでも本発明の実用的に高い効果を伺うことができる。
本発明では、SS処理 → CSPによる利得調整 → Flooring処理の順で処理を行うことが重要なポイントであることを説明した。ここでは、処理順番の違いによる性能の差を比較するため、表4のように、SS処理 → Flooring処理 → CSPによる利得調整、および CSPによる利得調整→ SS処理 → Flooring処理としたときの実験を行った。表4に実験結果(コマンド認識率)を示す。表からわかるように、SS処理 → CSPによる利得調整 → Flooring処理の順で処理したときに飛びぬけて高い性能を示し、この順番に処理するという手順が重要であることがわかる。
100 前処理部
110 CSP係数算出
CSP係数算出部
120 遅延和アレイ処理
遅延和アレイ処理部
130 雑音推定
雑音推定部
140 SS(スペクトルサブトラクション)処理
SS処理部
150 利得調整(音声強調)
利得調整部
160 Flooring処理
Flooring処理部
200 認識部
Claims (15)
- 空間中の少なくとも2つの異なる箇所に設置された音声入力器(1,2)によって得られる2つの入力音声から、目的音声を抽出する方法であって、
前記2つの入力音声の何れか一方またはそれらの両方に基いて(Xω(T))推定される雑音のパワースペクトル(Uω)と任意の減算定数(α)とを用いた、SS(スペクトラム・サブトラクション)処理を適用して、減算後パワースペクトル(Yω(T))を得るステップと、
得られたこの減算後パワースペクトルについて、前記2つの入力音声に基いた利得調整を適用して、利得調整後のパワースペクトル(Dω(T))を得るステップと、
得られたこの利得調整後のパワースペクトルについて、任意のフロアリング係数(β)を用いたフロアリング(Flooring)処理を適用して、認識用パワースペクトル(Zω(T))を得るステップとを有する、
方法。 - 前記利得調整は、前記2つの入力音声の相互相関関係を利用したCSP(クロス・パワー・スペクトラム・フェーズ)係数を用いた利得調整である
請求項1記載の方法。 - 前記減算後パワースペクトルを得るステップの前に、さらに、
目的話者からの音声を強調するために、前記2つの入力音声に基いて、アレイ処理をするステップを有する
請求項1記載の方法。 - 前記アレイ処理が、前記2つの入力音声を用いた遅延和アレイ処理である、
請求項3記載の方法。 - 前記アレイ処理が、前記2つの入力音声を用いた適応型アレイ処理である、
請求項3記載の方法。 - 前記空間が車室内であって、前記音声入力器によって得られる2つの入力音声には、車室内における雑音としてオーディオ音声、及び/または、妨害話者による発話を含む、
請求項1記載の方法。 - 前記音声入力器が、無指向性マイクロホンである、
請求項2記載の方法。 - 前記音声入力器が、指向性マイクロホンである、
請求項2記載の方法。 - 空間中の2つの異なる箇所に設置された音声入力器は、目的話者との位置関係から、車内において指向性が形成されている
請求項1記載の方法。 - 請求項1記載の方法を目的音声を抽出する前処理の方法として用いて、
得られた認識用パワースペクトルを入力にして音声認識結果を出力する、
音声認識方法。 - 空間中の少なくとも2つの異なる箇所に設置された音声入力器(1,2)によって得られる2つの入力音声から、目的音声を認識するにあたっての前処理を行う前処理部(100)であって、
前記音声入力器(1,2)に接続され、前記2つの入力音声の何れか一方またはそれらの両方に基いて(Xω(T))推定される雑音のパワースペクトル(Uω)と任意の減算定数(α)とを用いた、SS(スペクトラム・サブトラクション)処理を適用して、減算後パワースペクトル(Yω(T))を得る、SS処理部(140)と、
前記SS処理部(140)に接続され、得られたこの減算後パワースペクトルについて、前記2つの入力音声に基いた利得調整を適用して、利得調整後のパワースペクトル(Dω(T))を得る、利得調整部(150)と、
前記利得調整部(150)に接続され、得られたこの利得調整後のパワースペクトルについて、任意のフロアリング係数(β)を用いたフロアリング(Flooring)処理を適用して、認識用パワースペクトル(Zω(T))を得る、Flooring処理部(160)とを有する、
前処理部(100)。 - 請求項11記載の前処理部と、
当該前処理部に結合された認識部(200)とを有し、
認識用パワースペクトルを入力して音声認識を行って音声認識結果を出力する、
音声認識システム(10)。 - 空間中の少なくとも2つの異なる箇所に設置された音声入力器によって得られる2つの入力音声から、目的音声を抽出するために、以下の各ステップをコンピュータシステムに実行させるプログラムであって、
前記2つの入力音声の何れか一方またはそれらの両方に基いて(Xω(T))推定される雑音のパワースペクトル(Uω)と任意の減算定数(α)とを用いた、SS(スペクトラム・サブトラクション)処理を適用して、減算後パワースペクトル(Yω(T))を得るステップと、
得られたこの減算後パワースペクトルについて、前記2つの入力音声に基いた利得調整を適用して、利得調整後のパワースペクトル(Dω(T))を得るステップと、
得られたこの利得調整後のパワースペクトルについて、任意のフロアリング係数(β)を用いたフロアリング(Flooring)処理を適用して、認識用パワースペクトル(Zω(T))を得るステップとを有する、
プログラム。 - 前記利得調整は、前記2つの入力音声の相互相関関係を利用したCSP(クロス・パワー・スペクトラム・フェーズ)係数を用いた利得調整である
請求項13記載のプログラム。 - 請求項13記載のプログラムを目的音声を抽出する前処理のプログラムとして用いて、コンピュータシステムに、
得られた認識用パワースペクトルを入力にして音声認識結果を出力させる、
音声認識プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007119194A JP5156260B2 (ja) | 2007-04-27 | 2007-04-27 | 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム |
US12/105,621 US8712770B2 (en) | 2007-04-27 | 2008-04-18 | Method, preprocessor, speech recognition system, and program product for extracting target speech by removing noise |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007119194A JP5156260B2 (ja) | 2007-04-27 | 2007-04-27 | 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008275881A true JP2008275881A (ja) | 2008-11-13 |
JP5156260B2 JP5156260B2 (ja) | 2013-03-06 |
Family
ID=39888053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007119194A Expired - Fee Related JP5156260B2 (ja) | 2007-04-27 | 2007-04-27 | 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8712770B2 (ja) |
JP (1) | JP5156260B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010026361A (ja) * | 2008-07-23 | 2010-02-04 | Internatl Business Mach Corp <Ibm> | 音声収集方法、システム及びプログラム |
JP2011113044A (ja) * | 2009-11-30 | 2011-06-09 | Internatl Business Mach Corp <Ibm> | 目的音声抽出方法、目的音声抽出装置、及び目的音声抽出プログラム |
JP2011259195A (ja) * | 2010-06-09 | 2011-12-22 | Yamaha Corp | 音響処理装置 |
JP2012149906A (ja) * | 2011-01-17 | 2012-08-09 | Mitsubishi Electric Corp | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
JP2013533685A (ja) * | 2010-07-15 | 2013-08-22 | ヴェーデクス・アクティーセルスカプ | 補聴器システムにおける信号処理方法および補聴器システム |
JP2015127768A (ja) * | 2013-12-27 | 2015-07-09 | 富士ゼロックス株式会社 | 信号解析装置、信号解析システムおよびプログラム |
US9264797B2 (en) | 2012-12-21 | 2016-02-16 | Panasonic Intellectual Property Management Co., Ltd. | Directional microphone device, acoustic signal processing method, and program |
US9530406B2 (en) | 2013-11-25 | 2016-12-27 | Hyundai Motor Company | Apparatus and method for recognizing voice |
JP2017054015A (ja) * | 2015-09-10 | 2017-03-16 | 新日本無線株式会社 | 目的音抽出装置及び目的音抽出方法 |
JP2019008274A (ja) * | 2017-06-26 | 2019-01-17 | フェアリーデバイセズ株式会社 | 音声情報処理システム、音声情報処理システムの制御方法、音声情報処理システムのプログラム及び記録媒体 |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2249333B1 (en) * | 2009-05-06 | 2014-08-27 | Nuance Communications, Inc. | Method and apparatus for estimating a fundamental frequency of a speech signal |
DE102009051508B4 (de) * | 2009-10-30 | 2020-12-03 | Continental Automotive Gmbh | Vorrichtung, System und Verfahren zur Sprachdialogaktivierung und -führung |
JP5594133B2 (ja) * | 2010-12-28 | 2014-09-24 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
US9286907B2 (en) * | 2011-11-23 | 2016-03-15 | Creative Technology Ltd | Smart rejecter for keyboard click noise |
ES2970727T3 (es) * | 2013-02-19 | 2024-05-30 | Univ California | Métodos para decodificar el habla desde el cerebro y sistemas para llevarlos a la práctica |
US10102850B1 (en) * | 2013-02-25 | 2018-10-16 | Amazon Technologies, Inc. | Direction based end-pointing for speech recognition |
KR102282366B1 (ko) | 2013-06-03 | 2021-07-27 | 삼성전자주식회사 | 음성 향상 방법 및 그 장치 |
US9286897B2 (en) * | 2013-09-27 | 2016-03-15 | Amazon Technologies, Inc. | Speech recognizer with multi-directional decoding |
CN103971681A (zh) * | 2014-04-24 | 2014-08-06 | 百度在线网络技术(北京)有限公司 | 一种语音识别方法及系统 |
CN105336338B (zh) | 2014-06-24 | 2017-04-12 | 华为技术有限公司 | 音频编码方法和装置 |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9881631B2 (en) | 2014-10-21 | 2018-01-30 | Mitsubishi Electric Research Laboratories, Inc. | Method for enhancing audio signal using phase information |
US9691413B2 (en) | 2015-10-06 | 2017-06-27 | Microsoft Technology Licensing, Llc | Identifying sound from a source of interest based on multiple audio feeds |
US9479627B1 (en) * | 2015-12-29 | 2016-10-25 | Gn Audio A/S | Desktop speakerphone |
US9640197B1 (en) | 2016-03-22 | 2017-05-02 | International Business Machines Corporation | Extraction of target speeches |
JP6391895B2 (ja) * | 2016-05-20 | 2018-09-19 | 三菱電機株式会社 | 音響モデル学習装置、音響モデル学習方法、音声認識装置、および音声認識方法 |
JP6904361B2 (ja) * | 2016-09-23 | 2021-07-14 | ソニーグループ株式会社 | 情報処理装置、及び情報処理方法 |
US20180190282A1 (en) * | 2016-12-30 | 2018-07-05 | Qualcomm Incorporated | In-vehicle voice command control |
CN110033773B (zh) * | 2018-12-13 | 2021-09-14 | 蔚来(安徽)控股有限公司 | 用于车辆的语音识别方法、装置、系统、设备以及车辆 |
TWI719385B (zh) * | 2019-01-11 | 2021-02-21 | 緯創資通股份有限公司 | 電子裝置及其語音指令辨識方法 |
US11190155B2 (en) * | 2019-09-03 | 2021-11-30 | Toyota Motor North America, Inc. | Learning auxiliary feature preferences and controlling the auxiliary devices based thereon |
US11259127B2 (en) * | 2020-03-20 | 2022-02-22 | Oticon A/S | Hearing device adapted to provide an estimate of a user's own voice |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134287A (ja) * | 1999-11-10 | 2001-05-18 | Mitsubishi Electric Corp | 雑音抑圧装置 |
JP2006349723A (ja) * | 2005-06-13 | 2006-12-28 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル作成装置、音声認識装置、音響モデル作成方法、音声認識方法、音響モデル作成プログラム、音声認識プログラムおよび記録媒体 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
US7617099B2 (en) * | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
JP4195267B2 (ja) * | 2002-03-14 | 2008-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、その音声認識方法及びプログラム |
US7218741B2 (en) * | 2002-06-05 | 2007-05-15 | Siemens Medical Solutions Usa, Inc | System and method for adaptive multi-sensor arrays |
CN100477705C (zh) * | 2002-07-01 | 2009-04-08 | 皇家飞利浦电子股份有限公司 | 音频增强系统、配有该系统的系统、失真信号增强方法 |
US7039199B2 (en) * | 2002-08-26 | 2006-05-02 | Microsoft Corporation | System and process for locating a speaker using 360 degree sound source localization |
US7359504B1 (en) * | 2002-12-03 | 2008-04-15 | Plantronics, Inc. | Method and apparatus for reducing echo and noise |
US7099821B2 (en) * | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
US20050288923A1 (en) * | 2004-06-25 | 2005-12-29 | The Hong Kong University Of Science And Technology | Speech enhancement by noise masking |
US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
EP1850640B1 (en) * | 2006-04-25 | 2009-06-17 | Harman/Becker Automotive Systems GmbH | Vehicle communication system |
US8214219B2 (en) * | 2006-09-15 | 2012-07-03 | Volkswagen Of America, Inc. | Speech communications system for a vehicle and method of operating a speech communications system for a vehicle |
-
2007
- 2007-04-27 JP JP2007119194A patent/JP5156260B2/ja not_active Expired - Fee Related
-
2008
- 2008-04-18 US US12/105,621 patent/US8712770B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134287A (ja) * | 1999-11-10 | 2001-05-18 | Mitsubishi Electric Corp | 雑音抑圧装置 |
JP2006349723A (ja) * | 2005-06-13 | 2006-12-28 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル作成装置、音声認識装置、音響モデル作成方法、音声認識方法、音響モデル作成プログラム、音声認識プログラムおよび記録媒体 |
Non-Patent Citations (2)
Title |
---|
CSNG200001041001; 水町 光徳 Mitsunori MIZUMACHI: 'マイクロホン対を用いたスペクトルサブトラクションによる雑音除去法 Noise Reduction by Paired-Micropho' 電子情報通信学会論文誌 (J82-A) 第4号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS,INF 第J82-A巻, 19990425, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
JPN6012002603; 水町 光徳 Mitsunori MIZUMACHI: 'マイクロホン対を用いたスペクトルサブトラクションによる雑音除去法 Noise Reduction by Paired-Micropho' 電子情報通信学会論文誌 (J82-A) 第4号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS,INF 第J82-A巻, 19990425, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010026361A (ja) * | 2008-07-23 | 2010-02-04 | Internatl Business Mach Corp <Ibm> | 音声収集方法、システム及びプログラム |
JP2011113044A (ja) * | 2009-11-30 | 2011-06-09 | Internatl Business Mach Corp <Ibm> | 目的音声抽出方法、目的音声抽出装置、及び目的音声抽出プログラム |
US8762137B2 (en) | 2009-11-30 | 2014-06-24 | International Business Machines Corporation | Target voice extraction method, apparatus and program product |
JP2011259195A (ja) * | 2010-06-09 | 2011-12-22 | Yamaha Corp | 音響処理装置 |
JP2013533685A (ja) * | 2010-07-15 | 2013-08-22 | ヴェーデクス・アクティーセルスカプ | 補聴器システムにおける信号処理方法および補聴器システム |
JP2012149906A (ja) * | 2011-01-17 | 2012-08-09 | Mitsubishi Electric Corp | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
US9264797B2 (en) | 2012-12-21 | 2016-02-16 | Panasonic Intellectual Property Management Co., Ltd. | Directional microphone device, acoustic signal processing method, and program |
US9530406B2 (en) | 2013-11-25 | 2016-12-27 | Hyundai Motor Company | Apparatus and method for recognizing voice |
JP2015127768A (ja) * | 2013-12-27 | 2015-07-09 | 富士ゼロックス株式会社 | 信号解析装置、信号解析システムおよびプログラム |
JP2017054015A (ja) * | 2015-09-10 | 2017-03-16 | 新日本無線株式会社 | 目的音抽出装置及び目的音抽出方法 |
JP2019008274A (ja) * | 2017-06-26 | 2019-01-17 | フェアリーデバイセズ株式会社 | 音声情報処理システム、音声情報処理システムの制御方法、音声情報処理システムのプログラム及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US20080270131A1 (en) | 2008-10-30 |
JP5156260B2 (ja) | 2013-03-06 |
US8712770B2 (en) | 2014-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5156260B2 (ja) | 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム | |
JP6644197B2 (ja) | 雑音除去装置および雑音除去方法 | |
CN108275159B (zh) | 语音界面和声乐娱乐系统 | |
JP3910898B2 (ja) | 指向性設定装置、指向性設定方法及び指向性設定プログラム | |
US8577678B2 (en) | Speech recognition system and speech recognizing method | |
Yamamoto et al. | Enhanced robot speech recognition based on microphone array source separation and missing feature theory | |
US11089404B2 (en) | Sound processing apparatus and sound processing method | |
EP3441969A1 (en) | Synthetic speech for in vehicle communication | |
WO2015086895A1 (en) | Spatial audio processing apparatus | |
JP2023159381A (ja) | 音声認識オーディオシステムおよび方法 | |
Yamamoto et al. | Making a robot recognize three simultaneous sentences in real-time | |
EP3847645B1 (en) | Determining a room response of a desired source in a reverberant environment | |
JP2022544065A (ja) | 信号認識または修正のために音声データから抽出した特徴を正規化するための方法および装置 | |
Kim et al. | Hybrid probabilistic adaptation mode controller for generalized sidelobe cancellers applied to multi-microphone speech enhancement | |
JP2010161735A (ja) | 音再生装置および音再生方法 | |
Gul et al. | Preserving the beamforming effect for spatial cue-based pseudo-binaural dereverberation of a single source | |
Even et al. | Blind signal extraction based joint suppression of diffuse background noise and late reverberation | |
JP2001337694A (ja) | 音源位置推定方法、音声認識方法および音声強調方法 | |
Takada et al. | Sound source separation using null-beamforming and spectral subtraction for mobile devices | |
KR20200129219A (ko) | 음성인식 장치 및 음성인식 장치의 동작방법 | |
Meutzner et al. | Binaural signal processing for enhanced speech recognition robustness in complex listening environments | |
Wang et al. | Speech recognition using blind source separation and dereverberation method for mixed sound of speech and music | |
CN112530452B (zh) | 一种后置滤波补偿方法、装置和系统 | |
Ichikawa et al. | Effective speech suppression using a two-channel microphone array for privacy protection in face-to-face sales monitoring | |
Aprilyanti et al. | Optimized joint noise suppression and dereverberation based on blind signal extraction for hands-free speech recognition system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20090930 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121023 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20121023 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121210 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5156260 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |