JP2007279444A - 特徴量補正装置、特徴量補正方法および特徴量補正プログラム - Google Patents
特徴量補正装置、特徴量補正方法および特徴量補正プログラム Download PDFInfo
- Publication number
- JP2007279444A JP2007279444A JP2006106594A JP2006106594A JP2007279444A JP 2007279444 A JP2007279444 A JP 2007279444A JP 2006106594 A JP2006106594 A JP 2006106594A JP 2006106594 A JP2006106594 A JP 2006106594A JP 2007279444 A JP2007279444 A JP 2007279444A
- Authority
- JP
- Japan
- Prior art keywords
- noise environment
- feature amount
- feature
- correction
- amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 29
- 238000000605 extraction Methods 0.000 claims abstract description 28
- 238000004364 calculation method Methods 0.000 claims abstract description 23
- 238000012937 correction Methods 0.000 claims description 158
- 230000007704 transition Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 3
- 238000007562 laser obscuration time method Methods 0.000 claims 1
- 239000013598 vector Substances 0.000 abstract description 125
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Abstract
【解決手段】入力された音声を所定時間ごとに分割した複数のフレームの各フレームにおける音声の特徴ベクトルを抽出する特徴抽出部102と、抽出された各フレームについての複数の特徴ベクトルである特徴ベクトル系列と、現在のフレームと現在のフレームに対して少なくとも直前のフレームまたは直後のフレームとにおける特徴ベクトルが雑音環境で発生したことの確からしさを示す雑音環境のそれぞれについての帰属度に基づいて各特徴ベクトルを発生させる複数の雑音環境の系列である雑音環境系列を推定する雑音環境系列推定部103と、推定された雑音環境系列の各雑音環境に対応する補正ベクトルを求める補正ベクトル計算部104と、補正ベクトルに基づいて特徴ベクトルを補正する特徴ベクトル補正部105とを備えた。
【選択図】 図1
Description
図1は、第1の実施の形態にかかる特徴量補正装置100の構成を示すブロック図である。同図に示すように、特徴量補正装置100は、雑音環境記憶部120と、入力受付部101と、特徴抽出部102と、雑音環境系列推定部103と、補正ベクトル計算部104と、特徴ベクトル補正部105と、雑音環境HMM記憶部130とを備えている。
認識時の雑音環境が設計時の雑音環境と一致していない場合であっても高精度の特徴ベクトルを算出することができ、高い音声認識性能を得ることが可能となる。
第1の実施の形態にかかる特徴量補正装置では、推定した雑音環境系列の各雑音環境に対応する補正ベクトルを雑音環境記憶部120から取得して特徴ベクトルを補正していたが、この第2の実施の形態にかかる特徴量補正装置では、複数の雑音環境の補正ベクトルを重み付き加算して補正ベクトルを算出している。
第1の実施の形態にかかる特徴量補正装置では、入力された音声に対し複数フレーム毎に雑音環境系列を推定していたが、この第3の実施の形態にかかる特徴量補正装置では、1フレームごとに逐次的に雑音環境系列を推定するものである。
52 ROM
53 RAM
54 通信I/F
61 バス
100 特徴量補正装置
102 特徴抽出部
103 雑音環境系列推定部
104 補正ベクトル計算部
105 特徴ベクトル補正部
120 雑音環境記憶部
121、122、123 パラメータ
130 雑億環境HMM記憶部
Claims (11)
- 音声処理で用いる音声の特徴量を補正する特徴量補正装置であって、
複数の雑音環境のそれぞれについて、前記特徴量を補正するための補正量を記憶する雑音環境記憶手段と、
入力された音声を所定時間ごとに分割した複数のフレームの各フレームにおける音声の特徴量を抽出する特徴抽出手段と、
前記特徴抽出手段によって抽出された各フレームについての複数の前記特徴量の系列を示す特徴量系列と、現在のフレームと現在のフレームに対して少なくとも直前のフレームまたは直後のフレームとにおける前記特徴量が前記雑音環境で発生したことの確からしさを示す前記雑音環境のそれぞれについての帰属度に基づいて、前記特徴量系列の各特徴量を発生させる複数の前記雑音環境の系列を示す雑音環境系列を推定する雑音環境系列推定手段と、
前記雑音環境系列推定手段によって推定された前記雑音環境系列の各雑音環境に対応する前記補正量を、前記雑音環境記憶手段に記憶された前記補正量に基づいて求める補正量計算手段と、
前記補正量計算手段によって求めた前記補正量に基づいて、前記特徴抽出手段が抽出した前記特徴量を補正する特徴量補正手段と、
を備えたことを特徴とする特徴量補正装置。 - 前記雑音環境のそれぞれを状態として保持するとともに、前記雑音環境のそれぞれにおける前記特徴量の確率モデルであるガウス混合モデルのパラメータと各状態間を遷移する際の状態遷移確率とをモデル化した雑音環境隠れマルコフモデルを記憶する雑音環境HMM記憶手段を更に備え、
前記雑音環境系列推定手段は、前記特徴量系列と前記雑音環境隠れマルコフモデルとに基づいて、前記雑音環境系列を推定することを特徴とする請求項1に記載の特徴量補正装置。 - 前記補正量計算手段は、前記雑音環境系列推定手段によって推定された前記雑音環境系列の各雑音環境に対応する前記補正量を、前記雑音環境記憶手段から取得することにより求め、
前記特徴量補正手段は、前記補正量計算手段によって取得した前記補正量に基づいて、前記特徴抽出手段が抽出した前記特徴量を補正することを特徴とする請求項1に記載の特徴量補正装置。 - 前記特徴抽出手段は、入力された音声を複数のフレームに分割し、分割された各フレームにおける音声の特徴量を抽出し、
前記雑音環境系列推定手段は、分割された複数のフレームについての前記特徴量系列と、分割された複数のフレームにおける前記特徴量についての前記帰属度に基づいて、前記雑音環境系列を推定することを特徴とする請求項1に記載の特徴量補正装置。 - 前記補正量計算手段は、前記雑音環境記憶手段に記憶された前記補正量の中から第1の補正量を取得し、取得した前記第1の補正量に対して前記雑音環境隠れマルコフモデルから求めた各状態の滞留確率を重み付け係数として重み付け加算した第2の補正量を計算し、
前記特徴量補正手段は、前記補正量計算手段によって計算された前記第2の補正量に基づいて、前記特徴抽出手段が抽出した前記特徴量を補正することを特徴とする請求項2に記載の特徴量補正装置。 - 前記雑音環境系列推定手段は、所定のフレームから現在のフレームまでの複数のフレームについての前記特徴量系列と、所定のフレームから現在のフレームまでの複数のフレームにおける前記特徴量についての前記帰属度に基づいて、逐次的に前記雑音環境系列を推定することを特徴とする請求項1に記載の特徴量補正装置。
- 前記特徴量補正手段は、前記特徴量と前記補正量とを加算することにより前記特徴量を補正することを特徴とする請求項1に記載の特徴量補正装置。
- 前記雑音環境記憶手段は、前記雑音環境のそれぞれについて、前記雑音環境下の音声である雑音音声と、雑音が存在しない環境下の音声であるクリーン音声とから算出された前記補正量を記憶することを特徴とする請求項1に記載の特徴量補正装置。
- 前記特徴抽出手段は、入力された音声のMFCC(メル周波数ケプストラム係数)を前記特徴量として抽出することを特徴とする請求項1に記載の特徴量補正装置。
- 音声処理で用いる音声の特徴量を補正する特徴量補正方法であって、
入力された音声を所定時間ごとに分割した複数のフレームの各フレームにおける音声の特徴量を抽出する特徴抽出ステップと、
前記特徴抽出ステップによって抽出された各フレームについての複数の前記特徴量の系列を示す特徴量系列と、現在のフレームと現在のフレームに対して少なくとも直前のフレームまたは直後のフレームとにおける前記特徴量が前記雑音環境で発生したことの確からしさを示す前記雑音環境のそれぞれについての帰属度に基づいて、前記特徴量系列の各特徴量を発生させる複数の前記雑音環境の系列を示す雑音環境系列を推定する雑音環境系列推定ステップと、
前記雑音環境系列推定ステップによって推定された前記雑音環境系列の各雑音環境に対応する前記補正量を、複数の雑音環境のそれぞれについて前記特徴量を補正するための補正量を記憶する雑音環境記憶手段に記憶された前記補正量に基づいて求める補正量計算ステップと、
前記補正量計算ステップによって求めた前記補正量に基づいて、前記特徴抽出ステップが抽出した前記特徴量を補正する特徴量補正ステップと、
を含むことを特徴とする特徴量補正方法。 - 音声処理で用いる音声の特徴量を補正する特徴量補正プログラムであって、
入力された音声を所定時間ごとに分割した複数のフレームの各フレームにおける音声の特徴量を抽出する特徴抽出ステップと、
前記特徴抽出ステップによって抽出された各フレームについての複数の前記特徴量の系列を示す特徴量系列と、現在のフレームと現在のフレームに対して少なくとも直前のフレームまたは直後のフレームとにおける前記特徴量が前記雑音環境で発生したことの確からしさを示す前記雑音環境のそれぞれについての帰属度に基づいて、前記特徴量系列の各特徴量を発生させる複数の前記雑音環境の系列を示す雑音環境系列を推定する雑音環境系列推定ステップと、
前記雑音環境系列推定ステップによって推定された前記雑音環境系列の各雑音環境に対応する前記補正量を、複数の雑音環境のそれぞれについて前記特徴量を補正するための補正量を記憶する雑音環境記憶手段に記憶された前記補正量に基づいて求める補正量計算ステップと、
前記補正量計算ステップによって求めた前記補正量に基づいて、前記特徴抽出ステップが抽出した前記特徴量を補正する特徴量補正ステップと、
をコンピュータに実行させる特徴量補正プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006106594A JP4316583B2 (ja) | 2006-04-07 | 2006-04-07 | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム |
US11/723,410 US8370139B2 (en) | 2006-04-07 | 2007-03-19 | Feature-vector compensating apparatus, feature-vector compensating method, and computer program product |
CNA2007100914737A CN101051462A (zh) | 2006-04-07 | 2007-03-30 | 特征矢量补偿设备和特征矢量补偿方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006106594A JP4316583B2 (ja) | 2006-04-07 | 2006-04-07 | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007279444A true JP2007279444A (ja) | 2007-10-25 |
JP4316583B2 JP4316583B2 (ja) | 2009-08-19 |
Family
ID=38662199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006106594A Expired - Fee Related JP4316583B2 (ja) | 2006-04-07 | 2006-04-07 | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8370139B2 (ja) |
JP (1) | JP4316583B2 (ja) |
CN (1) | CN101051462A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010109725A1 (ja) * | 2009-03-26 | 2010-09-30 | 株式会社東芝 | 音声処理装置、音声処理方法、及び、音声処理プログラム |
WO2011024572A1 (ja) * | 2009-08-28 | 2011-03-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声特徴量抽出装置、音声特徴量抽出方法、及び音声特徴量抽出プログラム |
JP2011048008A (ja) * | 2009-08-25 | 2011-03-10 | Kddi Corp | 音声認識装置およびその特徴量正規化方法 |
JP2016038409A (ja) * | 2014-08-05 | 2016-03-22 | 沖電気工業株式会社 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム |
JP2016180839A (ja) * | 2015-03-24 | 2016-10-13 | 日本放送協会 | 雑音抑圧音声認識装置およびそのプログラム |
JP2021039216A (ja) * | 2019-09-02 | 2021-03-11 | 日本電信電話株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8279912B2 (en) | 2006-03-13 | 2012-10-02 | Plx Technology, Inc. | Tranceiver non-linearity cancellation |
JP4245617B2 (ja) * | 2006-04-06 | 2009-03-25 | 株式会社東芝 | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム |
US8416719B2 (en) * | 2008-03-20 | 2013-04-09 | Aquantia Corporation | Generating an estimated non-linear echo signal |
US8639502B1 (en) | 2009-02-16 | 2014-01-28 | Arrowhead Center, Inc. | Speaker model-based speech enhancement system |
JP2011243088A (ja) * | 2010-05-20 | 2011-12-01 | Sony Corp | データ処理装置、データ処理方法、及び、プログラム |
WO2011148860A1 (ja) * | 2010-05-24 | 2011-12-01 | 日本電気株式会社 | 信号処理方法、情報処理装置、及び信号処理プログラム |
KR102167719B1 (ko) * | 2014-12-08 | 2020-10-19 | 삼성전자주식회사 | 언어 모델 학습 방법 및 장치, 음성 인식 방법 및 장치 |
CN104952449A (zh) * | 2015-01-09 | 2015-09-30 | 珠海高凌技术有限公司 | 环境噪声声源识别方法及装置 |
KR102371770B1 (ko) * | 2015-01-19 | 2022-03-07 | 삼성전자주식회사 | 음성 인식 장지 및 방법 |
US9437193B2 (en) * | 2015-01-21 | 2016-09-06 | Microsoft Technology Licensing, Llc | Environment adjusted speaker identification |
KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
CN106601229A (zh) * | 2016-11-15 | 2017-04-26 | 华南理工大学 | 一种基于soc芯片的语音唤醒方法 |
CN108039176B (zh) * | 2018-01-11 | 2021-06-18 | 广州势必可赢网络科技有限公司 | 一种防录音攻击的声纹认证方法、装置及门禁系统 |
CN111863015B (zh) * | 2019-04-26 | 2024-07-09 | 北京嘀嘀无限科技发展有限公司 | 一种音频处理方法、装置、电子设备和可读存储介质 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6230128B1 (en) * | 1993-03-31 | 2001-05-08 | British Telecommunications Public Limited Company | Path link passing speech recognition with vocabulary node being capable of simultaneously processing plural path links |
US5627939A (en) * | 1993-09-03 | 1997-05-06 | Microsoft Corporation | Speech recognition system and method employing data compression |
JP2780676B2 (ja) * | 1995-06-23 | 1998-07-30 | 日本電気株式会社 | 音声認識装置及び音声認識方法 |
JP3452443B2 (ja) * | 1996-03-25 | 2003-09-29 | 三菱電機株式会社 | 騒音下音声認識装置及び騒音下音声認識方法 |
JPH09258783A (ja) | 1996-03-26 | 1997-10-03 | Mitsubishi Electric Corp | 音声認識装置 |
US5924065A (en) | 1997-06-16 | 1999-07-13 | Digital Equipment Corporation | Environmently compensated speech processing |
US6006186A (en) * | 1997-10-16 | 1999-12-21 | Sony Corporation | Method and apparatus for a parameter sharing speech recognition system |
US5970446A (en) * | 1997-11-25 | 1999-10-19 | At&T Corp | Selective noise/channel/coding models and recognizers for automatic speech recognition |
JPH11296192A (ja) | 1998-04-10 | 1999-10-29 | Pioneer Electron Corp | 音声認識における音声特徴量の補正方法、音声認識方法、音声認識装置及び音声認識プログラムを記録した記録媒体 |
JP2000181934A (ja) | 1998-12-21 | 2000-06-30 | Telecommunication Advancement Organization Of Japan | 部分一致検索方法,その装置,及び部分一致検索プログラムを記録した記録媒体 |
JP2000194392A (ja) | 1998-12-25 | 2000-07-14 | Sharp Corp | 騒音適応型音声認識装置及び騒音適応型音声認識プログラムを記録した記録媒体 |
US6418411B1 (en) * | 1999-03-12 | 2002-07-09 | Texas Instruments Incorporated | Method and system for adaptive speech recognition in a noisy environment |
JP3759685B2 (ja) | 1999-05-18 | 2006-03-29 | 三菱電機株式会社 | 雑音区間判定装置,雑音抑圧装置及び推定雑音情報更新方法 |
JP2002073072A (ja) * | 2000-08-31 | 2002-03-12 | Sony Corp | モデル適応装置およびモデル適応方法、記録媒体、並びにパターン認識装置 |
DE10043946C2 (de) * | 2000-09-06 | 2002-12-12 | Siemens Ag | Komprimieren von HMM-Prototypen |
US6934678B1 (en) * | 2000-09-25 | 2005-08-23 | Koninklijke Philips Electronics N.V. | Device and method for coding speech to be recognized (STBR) at a near end |
US7216077B1 (en) * | 2000-09-26 | 2007-05-08 | International Business Machines Corporation | Lattice-based unsupervised maximum likelihood linear regression for speaker adaptation |
JP4169921B2 (ja) * | 2000-09-29 | 2008-10-22 | パイオニア株式会社 | 音声認識システム |
US6876966B1 (en) | 2000-10-16 | 2005-04-05 | Microsoft Corporation | Pattern recognition training method and apparatus using inserted noise followed by noise reduction |
JP4244514B2 (ja) * | 2000-10-23 | 2009-03-25 | セイコーエプソン株式会社 | 音声認識方法および音声認識装置 |
US6999926B2 (en) * | 2000-11-16 | 2006-02-14 | International Business Machines Corporation | Unsupervised incremental adaptation using maximum likelihood spectral transformation |
JP4603727B2 (ja) | 2001-06-15 | 2010-12-22 | セコム株式会社 | 音響信号分析方法及び装置 |
US6950796B2 (en) * | 2001-11-05 | 2005-09-27 | Motorola, Inc. | Speech recognition by dynamical noise model adaptation |
JP4061094B2 (ja) * | 2002-03-15 | 2008-03-12 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、その音声認識方法及びプログラム |
US7139703B2 (en) * | 2002-04-05 | 2006-11-21 | Microsoft Corporation | Method of iterative noise estimation in a recursive framework |
JP4058987B2 (ja) | 2002-04-15 | 2008-03-12 | 三菱電機株式会社 | 雑音除去装置及び雑音除去方法 |
US7103540B2 (en) * | 2002-05-20 | 2006-09-05 | Microsoft Corporation | Method of pattern recognition using noise reduction uncertainty |
JP3885002B2 (ja) * | 2002-06-28 | 2007-02-21 | キヤノン株式会社 | 情報処理装置およびその方法 |
US7516071B2 (en) * | 2003-06-30 | 2009-04-07 | International Business Machines Corporation | Method of modeling single-enrollment classes in verification and identification tasks |
US7447630B2 (en) | 2003-11-26 | 2008-11-04 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement |
DE102004008225B4 (de) * | 2004-02-19 | 2006-02-16 | Infineon Technologies Ag | Verfahren und Einrichtung zum Ermitteln von Merkmalsvektoren aus einem Signal zur Mustererkennung, Verfahren und Einrichtung zur Mustererkennung sowie computerlesbare Speichermedien |
DK1760696T3 (en) * | 2005-09-03 | 2016-05-02 | Gn Resound As | Method and apparatus for improved estimation of non-stationary noise to highlight speech |
JP4245617B2 (ja) * | 2006-04-06 | 2009-03-25 | 株式会社東芝 | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム |
-
2006
- 2006-04-07 JP JP2006106594A patent/JP4316583B2/ja not_active Expired - Fee Related
-
2007
- 2007-03-19 US US11/723,410 patent/US8370139B2/en not_active Expired - Fee Related
- 2007-03-30 CN CNA2007100914737A patent/CN101051462A/zh active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010109725A1 (ja) * | 2009-03-26 | 2010-09-30 | 株式会社東芝 | 音声処理装置、音声処理方法、及び、音声処理プログラム |
JP2011048008A (ja) * | 2009-08-25 | 2011-03-10 | Kddi Corp | 音声認識装置およびその特徴量正規化方法 |
GB2485926B (en) * | 2009-08-28 | 2013-06-05 | Ibm | Speech feature extracting apparatus, speech feature extracting method, and speech feature extracting program |
GB2485926A (en) * | 2009-08-28 | 2012-05-30 | Ibm | Audio feature extracting apparatus, audio feature extracting method, and audio feature extracting program |
CN102483916A (zh) * | 2009-08-28 | 2012-05-30 | 国际商业机器公司 | 声音特征量提取装置、声音特征量提取方法及声音特征量提取程序 |
DE112010003461T5 (de) | 2009-08-28 | 2012-07-26 | International Business Machines Corp. | Vorrichtung zur extraktion von sprachmerkmalen,verfahren zur extraktion von sprachmerkmalen und programm zurextraktion von sprachmerkmalen |
WO2011024572A1 (ja) * | 2009-08-28 | 2011-03-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声特徴量抽出装置、音声特徴量抽出方法、及び音声特徴量抽出プログラム |
US8468016B2 (en) | 2009-08-28 | 2013-06-18 | International Business Machines Corporation | Speech feature extraction apparatus, speech feature extraction method, and speech feature extraction program |
JP2013178575A (ja) * | 2009-08-28 | 2013-09-09 | Internatl Business Mach Corp <Ibm> | 音声特徴量抽出装置、音声特徴量抽出方法、及び音声特徴量抽出プログラム |
JP5315414B2 (ja) * | 2009-08-28 | 2013-10-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声特徴量抽出装置、音声特徴量抽出方法、及び音声特徴量抽出プログラム |
US8930185B2 (en) | 2009-08-28 | 2015-01-06 | International Business Machines Corporation | Speech feature extraction apparatus, speech feature extraction method, and speech feature extraction program |
DE112010003461B4 (de) | 2009-08-28 | 2019-09-05 | International Business Machines Corporation | Vorrichtung zur Extraktion von Sprachmerkmalen, Verfahren zur Extraktion von Sprachmerkmalen und Programm zur Extraktion von Sprachmerkmalen |
JP2016038409A (ja) * | 2014-08-05 | 2016-03-22 | 沖電気工業株式会社 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム |
JP2016180839A (ja) * | 2015-03-24 | 2016-10-13 | 日本放送協会 | 雑音抑圧音声認識装置およびそのプログラム |
JP2021039216A (ja) * | 2019-09-02 | 2021-03-11 | 日本電信電話株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
Also Published As
Publication number | Publication date |
---|---|
US8370139B2 (en) | 2013-02-05 |
CN101051462A (zh) | 2007-10-10 |
JP4316583B2 (ja) | 2009-08-19 |
US20070260455A1 (en) | 2007-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4316583B2 (ja) | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム | |
JP4245617B2 (ja) | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム | |
JP5418223B2 (ja) | 音声分類装置、音声分類方法、および音声分類用プログラム | |
JP6234060B2 (ja) | ターゲットドメインの学習用音声データの生成方法、生成装置、および生成プログラム | |
JP5229478B2 (ja) | 統計モデル学習装置、統計モデル学習方法、およびプログラム | |
JP5949550B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
KR101217525B1 (ko) | 비터비 디코더와 이를 이용한 음성 인식 방법 | |
JPWO2009133719A1 (ja) | 音響モデル学習装置および音声認識装置 | |
JP2004310098A (ja) | スイッチング状態空間型モデルによる変分推論を用いた音声認識の方法 | |
JP2013007975A (ja) | 雑音抑圧装置、方法及びプログラム | |
JP2019035862A (ja) | 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム | |
JP6420198B2 (ja) | 閾値推定装置、音声合成装置、その方法及びプログラム | |
JP5914119B2 (ja) | 音響モデル性能評価装置とその方法とプログラム | |
JP4729534B2 (ja) | 残響除去装置、残響除去方法、残響除去プログラム、および、その記録媒体 | |
JP4901657B2 (ja) | 音声認識装置、その方法、そのプログラム、その記録媒体 | |
JP2008064849A (ja) | 音響モデル作成装置、その装置を用いた音声認識装置、これらの方法、これらのプログラム、およびこれらの記録媒体 | |
JP3912089B2 (ja) | 音声認識方法および音声認識装置 | |
KR101862352B1 (ko) | 음성 인식을 위한 전처리 장치, 및 이를 이용한 음성 인식 장치 및 방법 | |
JP6673861B2 (ja) | 信号処理装置、信号処理方法及び信号処理プログラム | |
JPWO2015093025A1 (ja) | 音声処理装置、音声処理方法、及び、音声処理プログラム | |
Han et al. | Switching linear dynamic transducer for stereo data based speech feature mapping | |
JP4242320B2 (ja) | 音声認識方法、その装置およびプログラム、その記録媒体 | |
JP3091648B2 (ja) | 隠れマルコフモデルの学習方法 | |
WO2016092837A1 (ja) | 音声処理装置、雑音抑圧装置、音声処理方法および記録媒体 | |
WO2023013081A1 (ja) | 学習装置、推定装置、学習方法及び学習プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080327 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081007 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090428 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090520 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4316583 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130529 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130529 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140529 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |