JP2006099124A - デジタル無線チャネル上の自動音声/話者認識 - Google Patents
デジタル無線チャネル上の自動音声/話者認識 Download PDFInfo
- Publication number
- JP2006099124A JP2006099124A JP2005305803A JP2005305803A JP2006099124A JP 2006099124 A JP2006099124 A JP 2006099124A JP 2005305803 A JP2005305803 A JP 2005305803A JP 2005305803 A JP2005305803 A JP 2005305803A JP 2006099124 A JP2006099124 A JP 2006099124A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- received
- parameters
- coded speech
- received coded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000006243 chemical reaction Methods 0.000 claims abstract description 15
- 230000005540 biological transmission Effects 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 13
- 230000005236 sound signal Effects 0.000 claims description 10
- 230000003595 spectral effect Effects 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims 1
- 239000013598 vector Substances 0.000 abstract description 23
- 238000004891 communication Methods 0.000 abstract description 15
- 238000012545 processing Methods 0.000 abstract description 7
- 238000012937 correction Methods 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 11
- 230000009466 transformation Effects 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005562 fading Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/24—Radio transmission systems, i.e. using radiation field for communication between two or more posts
- H04B7/26—Radio transmission systems, i.e. using radiation field for communication between two or more posts at least one of which is mobile
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】自動音声認識(ASR)が無線通信システムで達成されるが、そこでは信頼性の高いASR特徴ベクトル・シーケンスが、発呼ハンドセットでの追加処理または信号修正を必要とせず、デジタル伝送された音声コーダ・パラメータから直接基地局で導出される。ASR特徴ベクトルの伝送のため2次チャネルを提供する必要はない。音声信号への変換の前に受信音声コーダ・パラメータ上で動作する際、本システムおよび方法は損失の多い変換処理と関連する音声歪みを回避する。受信音声パラメータは伝送中誤り保護されているので、それらは非常に正確に受信される。
【選択図】図2
Description
2.ハンドセットから基地局にASR特徴ベクトルを伝送する追加帯域幅。音声を伝送するための1次デジタル・チャネルと抽出されたASR特徴ベクトルを伝送するための2次デジタル・チャネルを同期させることも重大な問題となる。
3.現行ハンドセットの大幅な変更。
4.二重チャネル・ソリューションの多様性。すなわち、現在の特定の無線標準またはフォーマット(CDMA、TDMA、GSM、IS−94、IS−134等)と関連する信号方式および変調スキームに依存しているため、すべての利用可能な標準に対する汎用ソリューションは非現実的である。
5.この技術に基づくサービスを導入するための高価な初期投資。
本節は、(図2の235のような)特徴抽出器で受信された音声コーダ・パラメータを、(図2の240および図4のような)ASRシステムに入力する特徴ベクトルを構成するために有益な相関係数に変換する、疑似コード・リストを含む処理の例を提示する。
/*LPCの入力配列を処理用一時配列にコピーする*/
for(i=1;i<LPC_ORDER;i=i+1)
{
aa[i]=lpc[i];
}
/*LPCをRCに変換する*/
for(i=LPC_ORDER;i>0;i=i−1;)
{
tmp=1.0−aa[i]*aa[i];
for(j=0;j<i;j=j+1)
{
temp[j]=aa[i−j];
}
for(j=0;j<i;j=j+1)
{
aa[j]=(aa[j]−aa[I]*temp[j]/temp;
rc[i−1]=aa[i];
}
}
/*LPCのダミー配列を作成する*/
dummy[0]=1.0;
for(i=1;i<=LPC_ORDER;i=i+1)
dummy[i]=lpc[i−1];
/*変換再帰を行う*/
dummy「1」=rc[0]
cc[0]=1.0;
cc[1]=−rc[0];
for(i=1;i<=LPC_ORDER−1;i=i+1)
{
dummy[i+1]=rc[i];
for(j=0;j<i/2;j=j+1)
{
tmp=dummy[j+1];
dummy[j+1]=dummy[j+1]+rc[i]*dummy[i−j];
dummy[i−j]=dummy[i−j]+rc[i]*tmp;
}
if(i modulo 2==1)/*iが奇数ならば*/
dummy[j+1]=dummy[j+1]+rc[i]*dummy「j+1」;
cc[i+1]=−rc[i];
for(j=0;j<=i−1;j=j+1)
cc[i+1]=cc[i+1]−dummy[j+1]*cc[i−j];
}
Claims (22)
- 無線伝送チャネルから受信された信号の第1集合中のコード化音声信号として受信された音声を自動的に認識する方法であって、
前記受信されたコード化音声信号のオーディオ音声信号へのいかなる変換処理からも独立して、前記受信されたコード化音声信号から複数の音声特徴信号を抽出するステップと、
前記複数の音声特徴信号を音声認識システムに適用するステップとを含む方法。 - 請求項1に記載の方法において、前記受信された信号の前記第1集合がさらに、前記受信されたコード化音声信号の信頼性を改善する誤り保護信号を含む方法。
- 請求項1に記載の方法において、前記受信されたコード化音声信号が複数の受信されたコード化音声パラメータを含み、前記抽出するステップが、
前記受信されたコード化音声パラメータの部分集合を選択するステップと、
前記受信されたコード化音声パラメータの前記部分集合を前記複数の音声特徴信号に変換するステップとを含む方法。 - 請求項3に記載の方法において、前記受信されたコード化音声パラメータが前記音声に関する複数の受信されたコード化音声スペクトル・エンベロープ・パラメータを含み、前記受信されたコード化音声パラメータの部分集合を選択する前記ステップが、前記受信されたコード化音声スペクトル・エンベロープ・パラメータの部分集合を選択するステップを含む方法。
- 請求項4に記載の方法において、受信されたコード化音声スペクトル・エンベロープ・パラメータの前記部分集合が複数の反射係数を含む方法。
- 請求項4に記載の方法において、受信されたコード化音声スペクトル・エンベロープ・パラメータの前記部分集合が複数の線スペクトル対(LSP)を含む方法。
- 請求項4に記載の方法において、受信されたコード化音声スペクトル・エンベロープ・パラメータの前記部分集合が複数の線スペクトル周波数(LSF)を含む方法。
- 請求項4に記載の方法において、前記変換するステップがさらに、受信されたコード化音声スペクトル・エンベロープ・パラメータの前記部分集合から線形予測コード化(LPC)パラメータの集合を生成するステップを含む方法。
- 請求項8に記載の方法において、前記変換するステップが、さらに、LPCパラメータの前記集合をLPCケプストラム係数の対応する集合に変換するステップを含む方法。
- 請求項9に記載の方法において、前記変換するステップが、さらに、
重み付きLPCケプストラム係数の集合を生成するためにLPCケプストラム係数の前記集合に重み付けするステップと、
前記重み付きLPCケプストラム係数から前記複数の音声特徴信号を導出するステップとを含む方法。 - 請求項1に記載の方法において、前記抽出ステップおよび前記適用するステップが基地局で行われる方法。
- 信号の前記第1集合が基地局において受信され、前記抽出および適用のため第2ロケーションに転送される、請求項1に記載の方法。
- 無線伝送チャネルから受信された信号の第1集合中のコード化音声信号として受信された音声を自動的に認識するシステムであって、
前記受信されたコード化音声信号のオーディオ音声信号へのいかなる変換処理からも独立して、前記受信されたコード化音声信号から複数の音声特徴信号を抽出する手段と、
前記複数の音声特徴信号を音声認識システムに適用する手段とを備えるシステム。 - 請求項13に記載のシステムにおいて、さらに、
前記受信されたコード化音声信号をオーディオ音声信号に変換する手段と、
前記オーディオ音声信号をネットワークに接続する手段とを備えるシステム。 - 請求項13に記載のシステムにおいて、前記受信されたコード化音声信号が複数の受信されたコード化音声パラメータを含み、前記抽出する手段が、
前記受信されたコード化音声パラメータの部分集合を選択する手段と、
前記受信されたコード化音声パラメータの前記部分集合を前記複数の音声特徴信号に変換する手段とを備えるシステム。 - 請求項15に記載のシステムにおいて、前記受信されたコード化音声パラメータが前記音声に関する複数の受信されたコード化音声スペクトル・エンベロープ・パラメータを含み、前記受信されたコード化音声パラメータの部分集合を選択する前記手段が、前記受信されたコード化音声スペクトル・エンベロープ・パラメータの部分集合を選択する手段を備えるシステム。
- 請求項16に記載のシステムにおいて、前記受信されたコード化音声スペクトル・エンベロープ・パラメータの前記部分集合が、前記受信の前に誤り保護手段によって高度に保護されているために、高度な信頼性を有するパラメータであるシステム。
- 請求項13に記載のシステムにおいて、信号の前記第1集合が基地局において受信され、前記抽出する手段および前記適用する手段が前記基地局に位置するシステム。
- 請求項13に記載のシステムにおいて、信号の前記第1集合が基地局において受信され、前記システムがさらに信号の前記第1集合を前記抽出および適用のために第2ロケーションに転送する手段を備えるシステム。
- 無線伝送チャネルから信号の第1集合中のコード化音声信号として受信された音声の話者を自動的に認識するシステムであって、
前記受信されたコード化音声信号のオーディオ音声信号へのいかなる変換処理からも独立して、前記受信されたコード化音声信号から複数の音声特徴信号を抽出する手段と、
複数の話者に関する基準音声特徴信号を受信する手段と、
前記複数の音声特徴信号と前記基準音声特徴信号を話者認識システムに適用する手段とを備えるシステム。 - 請求項20に記載のシステムにおいて、前記第1信号が基地局において受信され、前記抽出する手段および前記適用する手段が前記基地局に位置するシステム。
- 請求項20に記載のシステムにおいて、信号の前記第1集合が基地局において受信され、前記システムが、さらに、信号の前記第1集合を前記抽出および適用のため第2ロケーションに転送する手段を備えるシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/201,082 US6336090B1 (en) | 1998-11-30 | 1998-11-30 | Automatic speech/speaker recognition over digital wireless channels |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11338928A Division JP2000187496A (ja) | 1998-11-30 | 1999-11-30 | デジタル無線チャネル上の自動音声/話者認識 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006099124A true JP2006099124A (ja) | 2006-04-13 |
Family
ID=22744423
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11338928A Withdrawn JP2000187496A (ja) | 1998-11-30 | 1999-11-30 | デジタル無線チャネル上の自動音声/話者認識 |
JP2005305803A Pending JP2006099124A (ja) | 1998-11-30 | 2005-10-20 | デジタル無線チャネル上の自動音声/話者認識 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11338928A Withdrawn JP2000187496A (ja) | 1998-11-30 | 1999-11-30 | デジタル無線チャネル上の自動音声/話者認識 |
Country Status (7)
Country | Link |
---|---|
US (1) | US6336090B1 (ja) |
EP (1) | EP1006509B1 (ja) |
JP (2) | JP2000187496A (ja) |
KR (1) | KR100594670B1 (ja) |
AU (1) | AU5958599A (ja) |
CA (1) | CA2287025A1 (ja) |
DE (1) | DE69911723T2 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2357231B (en) | 1999-10-01 | 2004-06-09 | Ibm | Method and system for encoding and decoding speech signals |
US7330815B1 (en) | 1999-10-04 | 2008-02-12 | Globalenglish Corporation | Method and system for network-based speech recognition |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US6633846B1 (en) * | 1999-11-12 | 2003-10-14 | Phoenix Solutions, Inc. | Distributed realtime speech recognition system |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US7050977B1 (en) * | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US7392185B2 (en) * | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US6804640B1 (en) * | 2000-02-29 | 2004-10-12 | Nuance Communications | Signal noise reduction using magnitude-domain spectral subtraction |
US6901362B1 (en) * | 2000-04-19 | 2005-05-31 | Microsoft Corporation | Audio segmentation and classification |
DE60030702T2 (de) * | 2000-06-30 | 2007-01-11 | Alcatel | Steuerung der Kapazität eines verteilten Spracherkennungssystems |
US20020077814A1 (en) * | 2000-12-18 | 2002-06-20 | Harinath Garudadri | Voice recognition system method and apparatus |
US6487494B2 (en) * | 2001-03-29 | 2002-11-26 | Wingcast, Llc | System and method for reducing the amount of repetitive data sent by a server to a client for vehicle navigation |
USRE46109E1 (en) | 2001-03-29 | 2016-08-16 | Lg Electronics Inc. | Vehicle navigation system and method |
US6885735B2 (en) * | 2001-03-29 | 2005-04-26 | Intellisist, Llc | System and method for transmitting voice input from a remote location over a wireless data channel |
US20020143611A1 (en) * | 2001-03-29 | 2002-10-03 | Gilad Odinak | Vehicle parking validation system and method |
US7236777B2 (en) | 2002-05-16 | 2007-06-26 | Intellisist, Inc. | System and method for dynamically configuring wireless network geographic coverage or service levels |
US8175886B2 (en) | 2001-03-29 | 2012-05-08 | Intellisist, Inc. | Determination of signal-processing approach based on signal destination characteristics |
US20050065779A1 (en) * | 2001-03-29 | 2005-03-24 | Gilad Odinak | Comprehensive multiple feature telematics system |
US6587685B2 (en) * | 2001-04-27 | 2003-07-01 | Nokia Corporation | Apparatus, and an associated method, by which to provide operation parameters to a mobile station |
JP3885523B2 (ja) * | 2001-06-20 | 2007-02-21 | 日本電気株式会社 | サーバ・クライアント型音声認識装置及び方法 |
US8352248B2 (en) | 2003-01-03 | 2013-01-08 | Marvell International Ltd. | Speech compression method and apparatus |
FR2853127A1 (fr) * | 2003-03-25 | 2004-10-01 | France Telecom | Systeme de reconnaissance de parole distribuee |
US7386443B1 (en) * | 2004-01-09 | 2008-06-10 | At&T Corp. | System and method for mobile automatic speech recognition |
US8064580B1 (en) | 2004-09-03 | 2011-11-22 | Confinement Telephony Technology, Llc | Telephony system and method with improved fraud control |
US20070112571A1 (en) * | 2005-11-11 | 2007-05-17 | Murugappan Thirugnana | Speech recognition at a mobile terminal |
EP1860647B1 (en) * | 2006-05-24 | 2009-12-23 | Voice.Trust Ag | Robust speaker recognition |
JP2009146263A (ja) * | 2007-12-17 | 2009-07-02 | Panasonic Corp | 本人認証システム |
CN103037117B (zh) * | 2011-09-29 | 2016-08-03 | 中国电信股份有限公司 | 语音识别方法、系统和语音接入平台 |
CN103442119A (zh) * | 2013-08-16 | 2013-12-11 | 上海闻泰电子科技有限公司 | 在通话过程中自动提取信息的系统及方法 |
US9672831B2 (en) | 2015-02-25 | 2017-06-06 | International Business Machines Corporation | Quality of experience for communication sessions |
US11138334B1 (en) | 2018-10-17 | 2021-10-05 | Medallia, Inc. | Use of ASR confidence to improve reliability of automatic audio redaction |
US11398239B1 (en) | 2019-03-31 | 2022-07-26 | Medallia, Inc. | ASR-enhanced speech compression |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05241590A (ja) * | 1991-08-14 | 1993-09-21 | Philips Gloeilampenfab:Nv | 音声送信用装置 |
JPH06204983A (ja) * | 1993-01-07 | 1994-07-22 | Toshiba Corp | 音声符号化の誤り制御方法 |
JPH0713593A (ja) * | 1993-06-22 | 1995-01-17 | Hitachi Ltd | 音声処理システム |
WO1997007498A1 (fr) * | 1995-08-11 | 1997-02-27 | Fujitsu Limited | Unite de traitement des signaux vocaux |
JPH10145249A (ja) * | 1996-11-12 | 1998-05-29 | Kokusai Electric Co Ltd | 音声復号方式 |
JPH10282990A (ja) * | 1997-04-04 | 1998-10-23 | Sony Corp | テキスト入力方法及び装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ZA948426B (en) | 1993-12-22 | 1995-06-30 | Qualcomm Inc | Distributed voice recognition system |
US6092039A (en) * | 1997-10-31 | 2000-07-18 | International Business Machines Corporation | Symbiotic automatic speech recognition and vocoder |
-
1998
- 1998-11-30 US US09/201,082 patent/US6336090B1/en not_active Expired - Lifetime
-
1999
- 1999-10-20 CA CA002287025A patent/CA2287025A1/en not_active Abandoned
- 1999-11-22 AU AU59585/99A patent/AU5958599A/en not_active Abandoned
- 1999-11-23 EP EP99309326A patent/EP1006509B1/en not_active Expired - Lifetime
- 1999-11-23 DE DE69911723T patent/DE69911723T2/de not_active Expired - Lifetime
- 1999-11-30 JP JP11338928A patent/JP2000187496A/ja not_active Withdrawn
- 1999-11-30 KR KR1019990053725A patent/KR100594670B1/ko not_active IP Right Cessation
-
2005
- 2005-10-20 JP JP2005305803A patent/JP2006099124A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05241590A (ja) * | 1991-08-14 | 1993-09-21 | Philips Gloeilampenfab:Nv | 音声送信用装置 |
JPH06204983A (ja) * | 1993-01-07 | 1994-07-22 | Toshiba Corp | 音声符号化の誤り制御方法 |
JPH0713593A (ja) * | 1993-06-22 | 1995-01-17 | Hitachi Ltd | 音声処理システム |
WO1997007498A1 (fr) * | 1995-08-11 | 1997-02-27 | Fujitsu Limited | Unite de traitement des signaux vocaux |
JPH10145249A (ja) * | 1996-11-12 | 1998-05-29 | Kokusai Electric Co Ltd | 音声復号方式 |
JPH10282990A (ja) * | 1997-04-04 | 1998-10-23 | Sony Corp | テキスト入力方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
EP1006509A1 (en) | 2000-06-07 |
DE69911723T2 (de) | 2004-08-12 |
KR20000062175A (ko) | 2000-10-25 |
AU5958599A (en) | 2000-06-01 |
EP1006509B1 (en) | 2003-10-01 |
US6336090B1 (en) | 2002-01-01 |
JP2000187496A (ja) | 2000-07-04 |
KR100594670B1 (ko) | 2006-07-03 |
DE69911723D1 (de) | 2003-11-06 |
CA2287025A1 (en) | 2000-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100594670B1 (ko) | 자동 음성 인식 시스템 및 방법과, 자동 화자 인식 시스템 | |
US5995923A (en) | Method and apparatus for improving the voice quality of tandemed vocoders | |
JP4927257B2 (ja) | 可変レートスピーチ符号化 | |
KR100574031B1 (ko) | 음성합성방법및장치그리고음성대역확장방법및장치 | |
JP4302978B2 (ja) | 音声コーデックにおける擬似高帯域信号の推定システム | |
JPH07311598A (ja) | 線形予測係数信号生成方法 | |
JPH07311596A (ja) | 線形予測係数信号生成方法 | |
KR20040101575A (ko) | 다중스트림 특징 프로세싱을 이용하는 분산형 음성인식시스템 | |
JP2004501391A (ja) | 可変レート音声符号器におけるフレーム消去補償方法 | |
JPH10187197A (ja) | 音声符号化方法及び該方法を実施する装置 | |
KR100351484B1 (ko) | 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법 및 기록 매체 | |
JP2009541797A (ja) | 種々の音声フレーム・レートの混合励振線形予測(melp)ボコーダ間でトランスコーディングするボコーダ及び関連した方法 | |
EP1362345B1 (en) | Method and apparatus for reducing undesired packet generation | |
US7142559B2 (en) | Packet converting apparatus and method therefor | |
JPH07325594A (ja) | 復号器において使用されるパラメータ信号アダプタの動作方法 | |
JPH11259100A (ja) | 励起ベクトルの符号化方法 | |
JPH1097295A (ja) | 音響信号符号化方法及び復号化方法 | |
EP1020848A2 (en) | Method for transmitting auxiliary information in a vocoder stream | |
EP1159738B1 (en) | Speech synthesizer based on variable rate speech coding | |
JP2003157100A (ja) | 音声通信方法及び装置、並びに音声通信プログラム | |
JPH09120300A (ja) | ベクトル量子化装置 | |
JP4230550B2 (ja) | 音声符号化方法及び装置、並びに音声復号化方法及び装置 | |
WO2001009880A1 (en) | Multimode vselp speech coder | |
JPH11136133A (ja) | ベクトル量子化法 | |
GB2365297A (en) | Data modem compatible with speech codecs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091104 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100204 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100209 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100705 |