JP4444749B2 - 減少レート、可変レートの音声分析合成を実行する方法及び装置 - Google Patents
減少レート、可変レートの音声分析合成を実行する方法及び装置 Download PDFInfo
- Publication number
- JP4444749B2 JP4444749B2 JP2004219254A JP2004219254A JP4444749B2 JP 4444749 B2 JP4444749 B2 JP 4444749B2 JP 2004219254 A JP2004219254 A JP 2004219254A JP 2004219254 A JP2004219254 A JP 2004219254A JP 4444749 B2 JP4444749 B2 JP 4444749B2
- Authority
- JP
- Japan
- Prior art keywords
- rate
- speech
- frame
- celp
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004458 analytical method Methods 0.000 title description 19
- 230000015572 biosynthetic process Effects 0.000 title description 14
- 238000003786 synthesis reaction Methods 0.000 title description 14
- 238000005259 measurement Methods 0.000 claims description 32
- 230000005540 biological transmission Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 5
- 101150049692 THR4 gene Proteins 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 101000712600 Homo sapiens Thyroid hormone receptor beta Proteins 0.000 description 4
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 102100041002 Forkhead box protein H1 Human genes 0.000 description 1
- 101710087994 Forkhead box protein H1 Proteins 0.000 description 1
- 206010019133 Hangover Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
一度、これらの冗長性が取り除かれると、結果残余信号は白色ガウス雑音のようにモデル化され、また、符号化されなければならない。この技術の基礎は、人間の音声管モデルを使用した音声波形の短期間の予測を行なうLPCフィルタと呼ばれるフィルタのパラメータを計算することにある。
最後に、これらのフィルタは駆動される。この駆動は、波形が前に述べた2つのフィルタを駆動した時に、本来の音声に最も近いコードブックの結果における雑音駆動波形のうちの1つを決定することにより行なわれる。
音声分析合成技術のさらなる目的は、再構築される音声の品質を保ちながらチャネルを通じて送られてくる情報量を低減することを試みることにあるが、さらに低減を達成するためには他の技術が必要とされる。
多くのケースでは、単語の最初の部分の振幅制限によって、音声品質が低減される。非活性の間にチャネルをOFFにするゲート動作の他の問題は、システムのユーザが、通常、音声に付随する背景雑音及びチャネルの品質レートが普通の電話呼び出しに比べて低くなってしまうことを感知してしまうことである。ゲート動作のさらなる問題は、背景において、時々発生する雑音が、音声が発生されていない時に送信器を作動してしまう場合があり、その結果、受信器において厄介な雑音のバーストとなる。
データ伝送における完全な停止とは対象的に、沈黙期間のデータレートにおける低減は、伝送された情報の低減を促進している間に音声活性ゲート動作に関連する問題を改善する。
受信器側においては、この期間は合成された“快適雑音”で満たされている。反対に、可変レートボコーダは、連続的にデータを送信しており、係属している出願の例示的な実施の形態における可変レートボコーダのレートの範囲は、ほぼ8kbpsと1kbpsとの間である。データの連続伝送を行なうボコーダは、合成された“快適な雑音”の必要性を背景雑音の符号化とともに除去し、より自然な品質を合成された音声に提供する。従って、前に述べた特許出願の発明は、合成された音声品質における効果的な改良を提供し、これは、音声と背景との間の円滑な遷移を可能にすることによる音声活性ゲート動作である。
受話者に聞える話をしている間の背景は、音声活性ゲート動作システムにおける休止の間の合成された快適な雑音への突然の変化ではない。背景雑音は、伝送のために常に音声分析合成されているので、背景における興味ある出来事が全く明瞭に送信される。確かなケースにおいては、興味ある背景雑音までも高いレートで符号化される。
しかしながら、一定の或いはゆっくりした変化の背景雑音は、遅いレートで符号化される。
その結果、音声品質は、データ転送の平均レートをさらに低減するために混ぜ合わされる。最初の実験は、フルレート及び2分の1のレートで音声分析合成された音声の混合を示しており、たとえば、最大可能データレートは、8kbpsと4kbpsとの間を基礎としたフレームによって変化させられ、この結果の音声の品質は、2分の1の可変レート、最大4kbpsのものよりも良く、全可変レート、最大8kbpsのものよりは良くない。
このような方法によって、活性音声フレームのための符号化レートを低減するときの問題は、制限が入力音声のどの特徴にも一致せず、そして音声圧縮の品質が最適化されないということである。
入力音声の音声活性に完全に基づいて符号化レートを変化する可変レートボコーダは、活性音声の間中、動的に変化する複雑性或いは情報内容に基づく符号化レートを変化する可変レート符号器の圧縮効率を認識することができない。
本発明は、所定の最大レートと所定の最小レートとの間のレートで符号化された音声フレームにより低減されたデータレートによって、活性音声フレームを符号化する新規かつ改良された方法及び装置である。
本発明は、活性音声動作モードの組を示す。本発明の例示的な実施の形態においては、4つの活性音声動作モード、フルレート音声、2分の1レート音声、無声音4分の1レート及び有声音4分の1レートがある。
本発明の第2の目的は、この動作モード選択に適した理想的なパラメータの組(即ち、パラメータのグループ)を認識し、このパラメータの組を生成する手段を提供することにある。本発明の第3の目的は、品質に関して最小限の犠牲の低レート符号化を可能にする2つの別々の状態の認識を提供することにある。この2つの状態は、無声音の存在及び時間的にマスクされた音声の存在である。本発明の第4の目的は、音声品質については、最小限の影響で音声符号器の平均出力データレートの動的調整を行うための方法を提供することにある。
フルレートは、14.4Kbpsレートの出力データに対応する。2分の1レートは、7.2Kbpsレートの出力データに対応する。4分の1レートは、3.6Kbpsレートの出力データに対応する。8分の1レートは、1.8Kbpsレートの出力データに対応し、沈黙の期間の間の伝送のために確保されている。
音声の現状を検出する方法については、前に述べた米国特許出願第08/004,484号(米国特許第5,414,796号)及び第07/984,602号(米国特許第5,341,456号)明細書に詳しく述べられている。
例示的な実施の形態においては、モード測定要素12は5つのパラメータを決定し、この5つのパラメータをレート決定論理14に供給する。
レート決定論理14は、生成された5つのパラメータに従って、4つの符号化モードのうち、1つを選択する。この4つの符号化モードは、フルレートモード、2分の1レートモード、4分の1の無声音レートモード及び4分の1の有声音レートモードを含んでいる。
2分の1レートモードは、定常的、周期的に十分にモデル化された音声を符号化するのに使用される。4分の1の無声音レート、4分の1の有声音レートの双方及び2分の1レートモードは、高い精度が要求されない音声の部分におけるフレームの符号化に利用される。
殆どのCELP音声符号器は、同時マスキングを利用しており、この同時マスキングにおいては、ある周波数の音声エネルギーが、同一の周波数及び聞き取れないような雑音の時間において外の雑音エネルギーをマスクしている。
何故ならば、人間の耳は、種々の周波数帯域のエネルギーを時の経過とともに取り込み、低エネルギーのフレームは、低エネルギーのフレームの符号化の必要性を下げるために時間平均がとられるからである。
この精神聴覚学的現象は、E.Zwicker及びH.Fast1による精神聴覚学のpp.56−101.に詳しく述べられている。
例示的な実施の形態においては、この音声サンプルは、160の音声サンプルを有するフレームから供給される。
モード測定要素12が受信する2つめの信号は、合成音声信号S’(n)であって、この合成音声信号S’(n)は、可変レートCELP符号器の符号器の復号器からの解読された音声である。
このような復号器の設計は、良く知られている技術であり、前に述べた米国特許出願第08/004,484号(米国特許第5,414,796号)明細書に詳しく述べられている。
LPCフィルタの設計及びこのようなフィルタによる信号のフィルタリングは、良く知られた技術であり、前に述べた米国特許出願第08/004,484号(米国特許第5,414,796号)明細書に詳しく述べられている。
このタップ値の生成、及び聴感重み付けフィルタのフィルタリング動作は、良く知られた技術であり、前に述べた米国特許出願第08/004,484号(米国特許第5,414,796号)明細書に詳しく述べられている。
ターゲットマッチングSNR演算要素2は、TMSNRで示されるパラメータを供給し、このTMSNRはどのようにしたらよく音声モデルが入力音声をトラッキングするかを示している。
ここで、注意すべきことは、この測定は、NACF,PGD,ED,ZCが現在の音声のフレームにおいて計算されている間に、前の音声のフレームのために計算されることである。
この聴感重み付けフィルタの設計及び実現は、良く知られた技術であり、前に述べた米国特許出願第08/004,484号(米国特許第5,414,796号)明細書に詳しく述べられている。また、この聴感重み付けは、音声フレームの聴感的に重要な特徴の重み付けに適していることに注目すべきである。しかしながら、この測定は、信号の聴感的重み付けをすること無しに、測定が行なわれることをイメージしている。
正規化自己相関演算要素4は、下記の(2)式に従ってNACFで示されるパラメータを生成する。
このことは、現在のフレームの周期だけではなく、前のフレームとともに現在のフレームの周期のテストを行なうことを可能にする。
ここで、注意すべきことは、例示的実施例における遅れTの値は、毎秒8000サンプルのサンプリング周波数のための66Hzと400Hzとの間の周波数のピッチに対応する。
fpitch=fs/T (3)
(但し、fs、はサンプリング周波数)
ここで、注意すべきことは、周波数範囲は、1組の異なる遅れ値を単に選択することによって、拡大あるいは縮小される。
零交差カウンター6は、音声サンプルS(n)を受信し、音声サンプルの符号の変化の回数をカウントする。これは、音声信号における高周波部分を費用をかけずに計算する方法である。このカウンターは、以下の形のソフトウエアによるループで実現される。
for n=0,158 (5)
if(S(n)・S(n+1)<0)cnt++ (6)
式4−6のループは連続する音声サンプル同士を掛合わせ、その積が2つの連続したサンプル同士の符号が異なることを示す零以下であるかどうかをテストする。このことによって、音声信号にDC成分がないと推測する。信号からのDC成分をどのように除去するかは良く知られている技術である。
予測利得差分要素8は、下記の式(7)に従って、予測利得、Pg、を生成する。
PGD=10・log((Pg(i))/(Pg(i−1))), (8)
(但し、iはフレーム番号を示す。)
最適な実施の形態においては、予測利得差分要素8は予測利得値Pg、を生成しない。ダービンの副産物であるLPC係数の生成は、予測利得Pgであり、反復演算を必要としないものである。
Eave=α・Eave+(1−α)・Ei, (10)
(但し、0<α<1)
係数αは、フレームの範囲を決定し、この係数αは、計算に関連するものである。例示的な実施の形態において、このαは、8フレームの時間定数を提供する0.8825がセットされる。フレームエネルギー差動要素10は、下記の式(11)に従って、パラメータEDを生成する。
この5つのパラメータ、TMSNR,NACF,ZC,PGD及びEDは、レート決定論理14に供給される。レート決定論理14は、パラメータ及び予め設定されている選択規則に従って、次のフレームのサンプルのための符号化レートを選択する。今、図2を参照すると、レート決定論理要素14のレート選択手順を示す流れ図が示されている。
予め設定された閾値よりも小さいNACFは、音声における周期性の欠如を示しており、予め設定された閾値よりも大きいZCは、音声における高周波部分を示すものである。
もし、現在のフレームの間のエネルギーの差が閾値量よりも大きく平均よりも小さい場合には、時間的にマスクされた音声の状態が示される。例示的な実施の形態においては、THR3は−14dBである。もし、EDがTHR3に到達しない場合には、流れはブロック28に進む。
TMSNRがその閾値を上回ることは、モデル及びモデル化されたその音声が前のフレームにおいてマッチングしていたことを示している。パラメータPGDがその予め定められた閾値よりも小さいことは、LPCモデルがその予測効果を保ち続けていることを示している。パラメータNACFがその予め定められた閾値を超えることは、フレームが前の音声フレームに対して周期的である周期的音声を含むことを示している。
Rhは、2分の1のレートで符号化されたフレームのデータレート、
Rqは、4分の1のレートで符号化されたフレームのデータレート、
W=#Rfフレーム+#Rhフレーム+#Rqフレーム。
2分の1レートフレームからフルレートフレームヘの変化するフレームの数を決定する方程式は、次の式によって決定される。
W=#Rfフレーム+#Rhフレーム+#Rq フレーム
TMSNRNEW=TMSNROLD+(上述の(13)式で定義されるTMSNROLDからΔフレームに到達するまでのdB数の差)
ここで、注意すべきことは、TMSNRの初期値は、目標の関数であることが望ましい。Rf=14.4kbps,Rf=7.2kbps,Rf=3.6kbpsのシステムにおける目標レート8.7Kbpsの例示的な実施の形態においては、TMSNRの初期値は10dBである。
目標レートのどちらか一方が、レート決定論理要素14のメモリ要素に格納されていることを想定しており、このようなケースにおいては、目標レートは、どちらかの動的に決定されるであろうTHR4値に従って静的値となるであろう。加えて、この初期目標値では、通信システムがレート命令信号を、システムの現在の記憶容量に基づいて、符号化レート選択装置に送信することを想定している。
もし、システムが目標レートを指定するものである場合には、このレートは、(12)及び(13)式にしたがってTHR4値を決定するために使用される。もし、このシステムが、ユーザが高い或いは低い転送レートの転送を行うべきことのみを指定している場合には、レート決定論理要素14は、予め定められた増分によって変化するTHR4値によって変化され、或いはレートにおいて予め定められた増分増加或いは減少に従って増分変化を計算する。
この無声音は、摩擦音の形をとる音声及び“f”、“s”、“sh”、“t”及び“z”のような一定の音である。
4つのサブフレームのそれぞれによって送信されるものは全て利得値G及びLPCフィルタ係数A(Z)である。例示的な実施の形態においては、それぞれのサブフレームの利得を表現するために5ビットが転送される。復号器において、それぞれのサブフレームのためのコードブックの索引はランダムに選択される。このランダムに選択されたコードブックのベクトルは、転送された利得値によって掛け合わされ、そして、合成された無声音を生成するために、LPCフィルタA(Z)を通過する。
前に述べた最適な実施の形態の説明は、この分野における当業者に本発明を完成し、或いは使用することを可能にする。これらの実施の形態を種々に改良することは、この分野における当業者にとっては容易であり、この中に定義されている一般的な原理が発明的才能を使用することなく他の実施の形態に適用される。
Claims (9)
- フルレート、2分の1レート、無声音4分の1レート及び有声音4分の1レートを有する所定の符号化レートの組から符号化レートを選択し、そして複数の音声サンプルを含む音声フレームをCELP符号器を用いて符号化する装置であって、
前記音声フレームの特徴を示すCELP符号器パラメータのグループを生成するために、前記音声サンプルおよび前記音声サンプルから得られた信号に応答する手段と、
前記パラメータのグループを受信し、そして前記CELP符号器パラメータのグループのパラメータをしきい値と比較することにより所定のレート選択規則を用いて前記所定の符号化レートの組から符号化レートを選択する手段と、
を含む装置。 - フルレート、2分の1レート、無声音4分の1レート及び有声音4分の1レートを有する所定の符号化レートの組から符号化レートを選択し、そして複数の音声サンプルを含む音声フレームをCELP符号器を用いて符号化する装置であって、
前記音声サンプルおよび前記音声サンプルから得られた信号に対応する前記音声のフレームの特徴を示すCELP符号器パラメータのグループを生成するモード測定計算器と、
前記CELP符号器パラメータのグループを受信し、そして前記CELP符号器パラメータのグループのパラメータをしきい値と比較することにより前記所定の符号化レートの組から符号化レートを選択するレート決定論理と、
を含む装置。 - 遠隔局が中央通信局と通信を行う通信システムにおいて、前記遠隔局から伝送されるCELP符号器音声フレームの伝送レートを動的に変化させるサブシステムであって、
前記音声フレームの特徴を示すCELP符号器パラメータのグループを生成するために、前記音声フレームおよび前記音声フレームから得られた信号に応答する手段と、
前記パラメータの組を受信し、レート命令信号に対応する閾値を生成するためにレート命令信号を受信し、前記CELP符号器パラメータのグループのパラメータを前記閾値と比較し、そして前記比較に応じてフルレート、2分の1レート、無声音4分の1レート及び有声音4分の1レートを有する所定の符号化レートの組から符号化レートを選択する手段と、
を含むサブシステム。 - 遠隔局が中央通信局と通信を行う通信システムにおいて、前記遠隔局から伝送されるCELP符号器音声のフレームの伝送レートを動的に変化させるサブシステムであって、
前記音声サンプルおよび前記音声サンプルから得られた信号に対応する前記音声フレームの特徴を示すCELP符号器パラメータのグループを生成するモード測定計算器と、そして
前記CELP符号器パラメータのグループを受信し、レート命令信号に対応する閾値を生成するためにレート命令信号を受信し、前記CELP符号器パラメータのグループのパラメータを前記閾値と比較し、そして前記比較に応じてフルレート、2分の1レート、無声音4分の1レート及び有声音4分の1レートを有する所定の符号化レートの組から符号化レートを選択するレート決定論理と、
を含むサブシステム。 - 複数の音声サンプルを含む音声フレームをCELP符号器を用いて符号化するためにフルレート、2分の1レート、無声音4分の1レート及び有声音4分の1レートを有する所定の符号化レートの組から符号化レートを選択する方法であって、
前記音声サンプルおよび前記音声サンプルから得られた信号に対応する前記音声フレームの特徴を示すCELP符号器パラメータのグループを生成し、そして
前記CELP符号器パラメータのグループのパラメータをしきい値と比較することにより前記CELP符号器パラメータのグループに対応する前記所定の符号化レートの組から符号化レートを選択する
方法。 - フルレートフレーム、2分の1レートフレーム、無声音4分の1レートフレーム及び有声音4分の1レートフレームを具備する所定の組の符号化フレームを有するボコーダについて音声フレームをCELP符号化する方法であって、
前記音声フレームにおける周期性を示す正規化自己相関測定と前記音声フレームの高周波部分の存在を示す零交差数とを決定するために前記音声フレームを評価するステップと、
前記正規化自己相関測定が第1の閾値未満であり、かつ前記零交差数が第2の閾値を超えている場合は、無声音4分の1レートのフレームを用いて前記音声フレームをCELP符号化するステップと、
を具備する音声フレームをCELP符号化する方法。 - 前記音声フレームが4分の1レートの無声音として符号化されていない場合、前記音声フレームのエネルギーとフレームの平均エネルギーとの間のエネルギーの変化を示すフレームエネルギー差分測定を決定するために前記音声フレームを評価するステップと、
前記フレームエネルギー差分測定が第3の閾値未満である場合、4分の1レートの有声音のための所定のCELP形式を用いて前記音声フレームを符号化するステップと、
をさらに具備する請求の範囲第6項記載の方法。 - 前記音声フレームが4分の1レートの有声音として符号化されていない場合、先の音声フレームとその音声フレームから得られた合成音声の整合度を示す目標整合信号対雑音比測定とホルマントのフレームからフレームヘの安定性を示す予測利得差分測定とを決定するために、前記音声フレームを評価するステップと、
前記目標整合信号対雑音比測定が第4のしきい値を超えており、かつ前記予測利得差分測定が所定の第5の閾値未満であり、かつ前記自己相関測定が所定の第6の閾値である場合、2分の1レートのための所定のCELP形式を用いて前記音声フレームを符号化するステップと、
をさらに具備する請求の範囲第7項記載の方法。 - 前記音声フレームが2分の1レート音声として符号化されていない場合、フルレートのための形式を用いて前記音声フレームを符号化するステップをさらに具備する請求の範囲第8項記載の方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US28684294A | 1994-08-05 | 1994-08-05 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50672896A Division JP3611858B2 (ja) | 1994-08-05 | 1995-08-01 | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008033680A Division JP4778010B2 (ja) | 1994-08-05 | 2008-02-14 | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
JP2009262773A Division JP4851578B2 (ja) | 1994-08-05 | 2009-11-18 | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004361970A JP2004361970A (ja) | 2004-12-24 |
JP4444749B2 true JP4444749B2 (ja) | 2010-03-31 |
Family
ID=23100400
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50672896A Expired - Lifetime JP3611858B2 (ja) | 1994-08-05 | 1995-08-01 | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
JP2004219254A Expired - Lifetime JP4444749B2 (ja) | 1994-08-05 | 2004-07-27 | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
JP2008033680A Expired - Lifetime JP4778010B2 (ja) | 1994-08-05 | 2008-02-14 | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
JP2009262773A Expired - Lifetime JP4851578B2 (ja) | 1994-08-05 | 2009-11-18 | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50672896A Expired - Lifetime JP3611858B2 (ja) | 1994-08-05 | 1995-08-01 | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008033680A Expired - Lifetime JP4778010B2 (ja) | 1994-08-05 | 2008-02-14 | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
JP2009262773A Expired - Lifetime JP4851578B2 (ja) | 1994-08-05 | 2009-11-18 | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
Country Status (19)
Country | Link |
---|---|
US (3) | US5911128A (ja) |
EP (2) | EP1339044B1 (ja) |
JP (4) | JP3611858B2 (ja) |
KR (1) | KR100399648B1 (ja) |
CN (1) | CN1144180C (ja) |
AT (2) | ATE470932T1 (ja) |
AU (1) | AU689628B2 (ja) |
BR (1) | BR9506307B1 (ja) |
CA (1) | CA2172062C (ja) |
DE (2) | DE69535723T2 (ja) |
ES (2) | ES2299175T3 (ja) |
FI (2) | FI120327B (ja) |
HK (1) | HK1015184A1 (ja) |
IL (1) | IL114819A (ja) |
MY (3) | MY129887A (ja) |
RU (1) | RU2146394C1 (ja) |
TW (1) | TW271524B (ja) |
WO (1) | WO1996004646A1 (ja) |
ZA (1) | ZA956078B (ja) |
Families Citing this family (152)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW271524B (ja) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
CN1135786C (zh) * | 1996-03-27 | 2004-01-21 | 摩托罗拉公司 | 在无线通信系统中用来提供多方话音连接的方法和装置 |
US6765904B1 (en) | 1999-08-10 | 2004-07-20 | Texas Instruments Incorporated | Packet networks |
US7024355B2 (en) * | 1997-01-27 | 2006-04-04 | Nec Corporation | Speech coder/decoder |
US6104993A (en) * | 1997-02-26 | 2000-08-15 | Motorola, Inc. | Apparatus and method for rate determination in a communication system |
US6167375A (en) * | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
DE69831991T2 (de) * | 1997-03-25 | 2006-07-27 | Koninklijke Philips Electronics N.V. | Verfahren und Vorrichtung zur Sprachdetektion |
US6466912B1 (en) * | 1997-09-25 | 2002-10-15 | At&T Corp. | Perceptual coding of audio signals employing envelope uncertainty |
US6366704B1 (en) * | 1997-12-01 | 2002-04-02 | Sharp Laboratories Of America, Inc. | Method and apparatus for a delay-adaptive rate control scheme for the frame layer |
KR100269216B1 (ko) * | 1998-04-16 | 2000-10-16 | 윤종용 | 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법 |
US7065050B1 (en) * | 1998-07-08 | 2006-06-20 | Broadcom Corporation | Apparatus and method for controlling data flow in a network switch |
US6226618B1 (en) * | 1998-08-13 | 2001-05-01 | International Business Machines Corporation | Electronic content delivery system |
JP3893763B2 (ja) * | 1998-08-17 | 2007-03-14 | 富士ゼロックス株式会社 | 音声検出装置 |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6711540B1 (en) * | 1998-09-25 | 2004-03-23 | Legerity, Inc. | Tone detector with noise detection and dynamic thresholding for robust performance |
US6574334B1 (en) | 1998-09-25 | 2003-06-03 | Legerity, Inc. | Efficient dynamic energy thresholding in multiple-tone multiple frequency detectors |
JP3152217B2 (ja) * | 1998-10-09 | 2001-04-03 | 日本電気株式会社 | 有線伝送装置及び有線伝送方法 |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
CA2356869C (en) * | 1998-12-28 | 2004-11-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and devices for coding or decoding an audio signal or bit stream |
AU3589100A (en) * | 1999-02-08 | 2000-08-25 | Qualcomm Incorporated | Speech synthesizer based on variable rate speech coding |
US6226607B1 (en) * | 1999-02-08 | 2001-05-01 | Qualcomm Incorporated | Method and apparatus for eighth-rate random number generation for speech coders |
US6519259B1 (en) * | 1999-02-18 | 2003-02-11 | Avaya Technology Corp. | Methods and apparatus for improved transmission of voice information in packet-based communication systems |
US6260017B1 (en) * | 1999-05-07 | 2001-07-10 | Qualcomm Inc. | Multipulse interpolative coding of transition speech frames |
US6954727B1 (en) * | 1999-05-28 | 2005-10-11 | Koninklijke Philips Electronics N.V. | Reducing artifact generation in a vocoder |
US6766291B2 (en) * | 1999-06-18 | 2004-07-20 | Nortel Networks Limited | Method and apparatus for controlling the transition of an audio signal converter between two operative modes based on a certain characteristic of the audio input signal |
JP4438127B2 (ja) * | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
ATE257314T1 (de) * | 1999-07-05 | 2004-01-15 | Nokia Corp | Verfahren zur auswahl eines kodierungsverfahrens |
IL141636A0 (en) * | 1999-07-08 | 2002-03-10 | Samsung Electronics Co Ltd | Data rate detection device and method for a mobile communication system |
US6397175B1 (en) | 1999-07-19 | 2002-05-28 | Qualcomm Incorporated | Method and apparatus for subsampling phase spectrum information |
US6330532B1 (en) | 1999-07-19 | 2001-12-11 | Qualcomm Incorporated | Method and apparatus for maintaining a target bit rate in a speech coder |
US6393394B1 (en) | 1999-07-19 | 2002-05-21 | Qualcomm Incorporated | Method and apparatus for interleaving line spectral information quantization methods in a speech coder |
US6324503B1 (en) | 1999-07-19 | 2001-11-27 | Qualcomm Incorporated | Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions |
US6804244B1 (en) | 1999-08-10 | 2004-10-12 | Texas Instruments Incorporated | Integrated circuits for packet communications |
US6678267B1 (en) | 1999-08-10 | 2004-01-13 | Texas Instruments Incorporated | Wireless telephone with excitation reconstruction of lost packet |
US6801532B1 (en) | 1999-08-10 | 2004-10-05 | Texas Instruments Incorporated | Packet reconstruction processes for packet communications |
US6801499B1 (en) | 1999-08-10 | 2004-10-05 | Texas Instruments Incorporated | Diversity schemes for packet communications |
US6744757B1 (en) | 1999-08-10 | 2004-06-01 | Texas Instruments Incorporated | Private branch exchange systems for packet communications |
US6757256B1 (en) | 1999-08-10 | 2004-06-29 | Texas Instruments Incorporated | Process of sending packets of real-time information |
US6505152B1 (en) | 1999-09-03 | 2003-01-07 | Microsoft Corporation | Method and apparatus for using formant models in speech systems |
US6574593B1 (en) | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
US6581032B1 (en) | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
AU2003262451B2 (en) * | 1999-09-22 | 2006-01-19 | Macom Technology Solutions Holdings, Inc. | Multimode speech encoder |
US7315815B1 (en) | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
US6959274B1 (en) | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US6604070B1 (en) | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6772126B1 (en) * | 1999-09-30 | 2004-08-03 | Motorola, Inc. | Method and apparatus for transferring low bit rate digital voice messages using incremental messages |
US6438518B1 (en) * | 1999-10-28 | 2002-08-20 | Qualcomm Incorporated | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions |
US7574351B2 (en) * | 1999-12-14 | 2009-08-11 | Texas Instruments Incorporated | Arranging CELP information of one frame in a second packet |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US7127390B1 (en) * | 2000-02-08 | 2006-10-24 | Mindspeed Technologies, Inc. | Rate determination coding |
US6757301B1 (en) * | 2000-03-14 | 2004-06-29 | Cisco Technology, Inc. | Detection of ending of fax/modem communication between a telephone line and a network for switching router to compressed mode |
US6901362B1 (en) * | 2000-04-19 | 2005-05-31 | Microsoft Corporation | Audio segmentation and classification |
US6584438B1 (en) | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
ES2287122T3 (es) | 2000-04-24 | 2007-12-16 | Qualcomm Incorporated | Procedimiento y aparato para cuantificar de manera predictiva habla sonora. |
JP4221537B2 (ja) * | 2000-06-02 | 2009-02-12 | 日本電気株式会社 | 音声検出方法及び装置とその記録媒体 |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
US6477502B1 (en) | 2000-08-22 | 2002-11-05 | Qualcomm Incorporated | Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system |
US6640208B1 (en) * | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
EP1206104B1 (en) * | 2000-11-09 | 2006-07-19 | Koninklijke KPN N.V. | Measuring a talking quality of a telephone link in a telecommunications network |
US7472059B2 (en) * | 2000-12-08 | 2008-12-30 | Qualcomm Incorporated | Method and apparatus for robust speech classification |
US7505594B2 (en) * | 2000-12-19 | 2009-03-17 | Qualcomm Incorporated | Discontinuous transmission (DTX) controller system and method |
US6996523B1 (en) * | 2001-02-13 | 2006-02-07 | Hughes Electronics Corporation | Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system |
US7013269B1 (en) * | 2001-02-13 | 2006-03-14 | Hughes Electronics Corporation | Voicing measure for a speech CODEC system |
US7072908B2 (en) * | 2001-03-26 | 2006-07-04 | Microsoft Corporation | Methods and systems for synchronizing visualizations with audio streams |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
WO2003021573A1 (fr) * | 2001-08-31 | 2003-03-13 | Fujitsu Limited | Codec |
JPWO2003042648A1 (ja) * | 2001-11-16 | 2005-03-10 | 松下電器産業株式会社 | 音声符号化装置、音声復号化装置、音声符号化方法および音声復号化方法 |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US6647366B2 (en) * | 2001-12-28 | 2003-11-11 | Microsoft Corporation | Rate control strategies for speech and music coding |
US7321559B2 (en) * | 2002-06-28 | 2008-01-22 | Lucent Technologies Inc | System and method of noise reduction in receiving wireless transmission of packetized audio signals |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
WO2004034379A2 (en) * | 2002-10-11 | 2004-04-22 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7657427B2 (en) | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
FI20021936A (fi) * | 2002-10-31 | 2004-05-01 | Nokia Corp | Vaihtuvanopeuksinen puhekoodekki |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
GB0321093D0 (en) * | 2003-09-09 | 2003-10-08 | Nokia Corp | Multi-rate coding |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
US20050091041A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US7277031B1 (en) * | 2003-12-15 | 2007-10-02 | Marvell International Ltd. | 100Base-FX serializer/deserializer using 10000Base-X serializer/deserializer |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US7412378B2 (en) * | 2004-04-01 | 2008-08-12 | International Business Machines Corporation | Method and system of dynamically adjusting a speech output rate to match a speech input rate |
EP1775718A4 (en) * | 2004-07-22 | 2008-05-07 | Fujitsu Ltd | AUDIOCODING DEVICE AND AUDIOCODING METHOD |
GB0416720D0 (en) * | 2004-07-27 | 2004-09-01 | British Telecomm | Method and system for voice over IP streaming optimisation |
BRPI0518133A (pt) * | 2004-10-13 | 2008-10-28 | Matsushita Electric Ind Co Ltd | codificador escalável, decodificador escalável, e método de codificação escalável |
US8102872B2 (en) * | 2005-02-01 | 2012-01-24 | Qualcomm Incorporated | Method for discontinuous transmission and accurate reproduction of background noise information |
US20060200368A1 (en) * | 2005-03-04 | 2006-09-07 | Health Capital Management, Inc. | Healthcare Coordination, Mentoring, and Coaching Services |
US20070160154A1 (en) * | 2005-03-28 | 2007-07-12 | Sukkar Rafid A | Method and apparatus for injecting comfort noise in a communications signal |
TWI279774B (en) * | 2005-04-14 | 2007-04-21 | Ind Tech Res Inst | Adaptive pulse allocation mechanism for multi-pulse CELP coder |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US8594252B2 (en) * | 2005-08-22 | 2013-11-26 | Qualcomm Incorporated | Interference cancellation for wireless communications |
US8630602B2 (en) * | 2005-08-22 | 2014-01-14 | Qualcomm Incorporated | Pilot interference cancellation |
US8743909B2 (en) * | 2008-02-20 | 2014-06-03 | Qualcomm Incorporated | Frame termination |
US9071344B2 (en) * | 2005-08-22 | 2015-06-30 | Qualcomm Incorporated | Reverse link interference cancellation |
US8611305B2 (en) | 2005-08-22 | 2013-12-17 | Qualcomm Incorporated | Interference cancellation for wireless communications |
TWI358056B (en) | 2005-12-02 | 2012-02-11 | Qualcomm Inc | Systems, methods, and apparatus for frequency-doma |
JP4971351B2 (ja) * | 2005-12-05 | 2012-07-11 | クゥアルコム・インコーポレイテッド | トーンコンポーネントの検出のためのシステム、方法および装置 |
US8090573B2 (en) * | 2006-01-20 | 2012-01-03 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision |
US8032369B2 (en) * | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US8346544B2 (en) * | 2006-01-20 | 2013-01-01 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision |
KR100770895B1 (ko) * | 2006-03-18 | 2007-10-26 | 삼성전자주식회사 | 음성 신호 분리 시스템 및 그 방법 |
US8920343B2 (en) | 2006-03-23 | 2014-12-30 | Michael Edward Sabatino | Apparatus for acquiring and processing of physiological auditory signals |
CA2663904C (en) * | 2006-10-10 | 2014-05-27 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
DE602006015328D1 (de) * | 2006-11-03 | 2010-08-19 | Psytechnics Ltd | Abtastfehlerkompensation |
US20080120098A1 (en) * | 2006-11-21 | 2008-05-22 | Nokia Corporation | Complexity Adjustment for a Signal Encoder |
CA2672165C (en) * | 2006-12-12 | 2014-07-29 | Ralf Geiger | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
KR100964402B1 (ko) * | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
KR100883656B1 (ko) * | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
CN101217037B (zh) * | 2007-01-05 | 2011-09-14 | 华为技术有限公司 | 对音频信号的编码速率进行源控的方法和系统 |
US8553757B2 (en) * | 2007-02-14 | 2013-10-08 | Microsoft Corporation | Forward error correction for media transmission |
JP2008263543A (ja) * | 2007-04-13 | 2008-10-30 | Funai Electric Co Ltd | 記録再生装置 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
US8321222B2 (en) * | 2007-08-14 | 2012-11-27 | Nuance Communications, Inc. | Synthesis by generation and concatenation of multi-form segments |
US8566107B2 (en) | 2007-10-15 | 2013-10-22 | Lg Electronics Inc. | Multi-mode method and an apparatus for processing a signal |
US8606566B2 (en) * | 2007-10-24 | 2013-12-10 | Qnx Software Systems Limited | Speech enhancement through partial speech reconstruction |
US8015002B2 (en) | 2007-10-24 | 2011-09-06 | Qnx Software Systems Co. | Dynamic noise reduction using linear model fitting |
US8326617B2 (en) | 2007-10-24 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement with minimum gating |
US9408165B2 (en) * | 2008-06-09 | 2016-08-02 | Qualcomm Incorporated | Increasing capacity in wireless communications |
US9277487B2 (en) | 2008-08-01 | 2016-03-01 | Qualcomm Incorporated | Cell detection with interference cancellation |
US9237515B2 (en) | 2008-08-01 | 2016-01-12 | Qualcomm Incorporated | Successive detection and cancellation for cell pilot detection |
KR101797033B1 (ko) | 2008-12-05 | 2017-11-14 | 삼성전자주식회사 | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 |
EP2237269B1 (en) | 2009-04-01 | 2013-02-20 | Motorola Mobility LLC | Apparatus and method for processing an encoded audio data signal |
US9160577B2 (en) * | 2009-04-30 | 2015-10-13 | Qualcomm Incorporated | Hybrid SAIC receiver |
CN101615910B (zh) * | 2009-05-31 | 2010-12-22 | 华为技术有限公司 | 压缩编码的方法、装置和设备以及压缩解码方法 |
US8787509B2 (en) | 2009-06-04 | 2014-07-22 | Qualcomm Incorporated | Iterative interference cancellation receiver |
CN102483926B (zh) | 2009-07-27 | 2013-07-24 | Scti控股公司 | 在处理语音信号中通过把语音作为目标和忽略噪声以降噪的系统及方法 |
US8670990B2 (en) * | 2009-08-03 | 2014-03-11 | Broadcom Corporation | Dynamic time scale modification for reduced bit rate audio coding |
US8831149B2 (en) | 2009-09-03 | 2014-09-09 | Qualcomm Incorporated | Symbol estimation methods and apparatuses |
BR112012012632B1 (pt) | 2009-11-27 | 2020-12-15 | Qualcomm Incorporated | Método e equipamento para aumentar a capacidade de transmissão em comunicações sem fio, e memória legível por computador |
CN102668612B (zh) | 2009-11-27 | 2016-03-02 | 高通股份有限公司 | 增加无线通信中的容量 |
US9236063B2 (en) * | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
TWI665659B (zh) * | 2010-12-03 | 2019-07-11 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
KR20120116137A (ko) * | 2011-04-12 | 2012-10-22 | 한국전자통신연구원 | 음성 통신 장치 및 그 방법 |
JP6189831B2 (ja) | 2011-05-13 | 2017-08-30 | サムスン エレクトロニクス カンパニー リミテッド | ビット割り当て方法及び記録媒体 |
US8990074B2 (en) * | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
CN103890843B (zh) * | 2011-10-19 | 2017-01-18 | 皇家飞利浦有限公司 | 信号噪声衰减 |
US9047863B2 (en) * | 2012-01-12 | 2015-06-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for criticality threshold control |
US9263054B2 (en) * | 2013-02-21 | 2016-02-16 | Qualcomm Incorporated | Systems and methods for controlling an average encoding rate for speech signal encoding |
US9570095B1 (en) * | 2014-01-17 | 2017-02-14 | Marvell International Ltd. | Systems and methods for instantaneous noise estimation |
US9793879B2 (en) * | 2014-09-17 | 2017-10-17 | Avnera Corporation | Rate convertor |
US10061554B2 (en) * | 2015-03-10 | 2018-08-28 | GM Global Technology Operations LLC | Adjusting audio sampling used with wideband audio |
JP2017009663A (ja) * | 2015-06-17 | 2017-01-12 | ソニー株式会社 | 録音装置、録音システム、および、録音方法 |
US10269375B2 (en) * | 2016-04-22 | 2019-04-23 | Conduent Business Services, Llc | Methods and systems for classifying audio segments of an audio signal |
CN113314133A (zh) * | 2020-02-11 | 2021-08-27 | 华为技术有限公司 | 音频传输方法及电子设备 |
CN112767953B (zh) * | 2020-06-24 | 2024-01-23 | 腾讯科技(深圳)有限公司 | 语音编码方法、装置、计算机设备和存储介质 |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US32580A (en) * | 1861-06-18 | Water-elevatok | ||
US3633107A (en) * | 1970-06-04 | 1972-01-04 | Bell Telephone Labor Inc | Adaptive signal processor for diversity radio receivers |
JPS5017711A (ja) * | 1973-06-15 | 1975-02-25 | ||
US4076958A (en) * | 1976-09-13 | 1978-02-28 | E-Systems, Inc. | Signal synthesizer spectrum contour scaler |
US4214125A (en) * | 1977-01-21 | 1980-07-22 | Forrest S. Mozer | Method and apparatus for speech synthesizing |
CA1123955A (en) * | 1978-03-30 | 1982-05-18 | Tetsu Taguchi | Speech analysis and synthesis apparatus |
DE3023375C1 (ja) * | 1980-06-23 | 1987-12-03 | Siemens Ag, 1000 Berlin Und 8000 Muenchen, De | |
US4379949A (en) * | 1981-08-10 | 1983-04-12 | Motorola, Inc. | Method of and means for variable-rate coding of LPC parameters |
EP0076233B1 (de) * | 1981-09-24 | 1985-09-11 | GRETAG Aktiengesellschaft | Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung |
USRE32580E (en) | 1981-12-01 | 1988-01-19 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder |
JPS6011360B2 (ja) * | 1981-12-15 | 1985-03-25 | ケイディディ株式会社 | 音声符号化方式 |
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
EP0111612B1 (fr) * | 1982-11-26 | 1987-06-24 | International Business Machines Corporation | Procédé et dispositif de codage d'un signal vocal |
DE3370423D1 (en) * | 1983-06-07 | 1987-04-23 | Ibm | Process for activity detection in a voice transmission system |
US4672670A (en) * | 1983-07-26 | 1987-06-09 | Advanced Micro Devices, Inc. | Apparatus and methods for coding, decoding, analyzing and synthesizing a signal |
EP0163829B1 (en) * | 1984-03-21 | 1989-08-23 | Nippon Telegraph And Telephone Corporation | Speech signal processing system |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4856068A (en) * | 1985-03-18 | 1989-08-08 | Massachusetts Institute Of Technology | Audio pre-processing methods and apparatus |
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
US4797929A (en) * | 1986-01-03 | 1989-01-10 | Motorola, Inc. | Word recognition in a speech recognition system using data reduced word templates |
CA1299750C (en) * | 1986-01-03 | 1992-04-28 | Ira Alan Gerson | Optimal method of data reduction in a speech recognition system |
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4797925A (en) * | 1986-09-26 | 1989-01-10 | Bell Communications Research, Inc. | Method for coding speech at low bit rates |
US4903301A (en) * | 1987-02-27 | 1990-02-20 | Hitachi, Ltd. | Method and system for transmitting variable rate speech signal |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
DE3871369D1 (de) * | 1988-03-08 | 1992-06-25 | Ibm | Verfahren und einrichtung zur sprachkodierung mit niedriger datenrate. |
EP0331858B1 (en) * | 1988-03-08 | 1993-08-25 | International Business Machines Corporation | Multi-rate voice encoding method and device |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
US4864561A (en) * | 1988-06-20 | 1989-09-05 | American Telephone And Telegraph Company | Technique for improved subjective performance in a communication system using attenuated noise-fill |
US5077798A (en) * | 1988-09-28 | 1991-12-31 | Hitachi, Ltd. | Method and system for voice coding based on vector quantization |
JP3033060B2 (ja) * | 1988-12-22 | 2000-04-17 | 国際電信電話株式会社 | 音声予測符号化・復号化方式 |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
DE68916944T2 (de) * | 1989-04-11 | 1995-03-16 | Ibm | Verfahren zur schnellen Bestimmung der Grundfrequenz in Sprachcodierern mit langfristiger Prädiktion. |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
GB2235354A (en) * | 1989-08-16 | 1991-02-27 | Philips Electronic Associated | Speech coding/encoding using celp |
JPH03181232A (ja) * | 1989-12-11 | 1991-08-07 | Toshiba Corp | 可変レート符号化方式 |
US5103459B1 (en) * | 1990-06-25 | 1999-07-06 | Qualcomm Inc | System and method for generating signal waveforms in a cdma cellular telephone system |
US5127053A (en) * | 1990-12-24 | 1992-06-30 | General Electric Company | Low-complexity method for improving the performance of autocorrelation-based pitch detectors |
US5680508A (en) * | 1991-05-03 | 1997-10-21 | Itt Corporation | Enhancement of speech coding in background noise for low-rate speech coder |
US5187745A (en) * | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
BR9206143A (pt) * | 1991-06-11 | 1995-01-03 | Qualcomm Inc | Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH0580799A (ja) * | 1991-09-19 | 1993-04-02 | Fujitsu Ltd | 可変レート音声符号化器 |
JP3327936B2 (ja) * | 1991-09-25 | 2002-09-24 | 日本放送協会 | 話速制御型補聴装置 |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5513297A (en) * | 1992-07-10 | 1996-04-30 | At&T Corp. | Selective application of speech coding techniques to input signal segments |
US5341456A (en) * | 1992-12-02 | 1994-08-23 | Qualcomm Incorporated | Method for determining speech encoding rate in a variable rate vocoder |
US5774496A (en) * | 1994-04-26 | 1998-06-30 | Qualcomm Incorporated | Method and apparatus for determining data rate of transmitted variable rate data in a communications receiver |
TW271524B (ja) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US6122384A (en) * | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
US5974079A (en) * | 1998-01-26 | 1999-10-26 | Motorola, Inc. | Method and apparatus for encoding rate determination in a communication system |
US6233549B1 (en) * | 1998-11-23 | 2001-05-15 | Qualcomm, Inc. | Low frequency spectral enhancement system and method |
-
1995
- 1995-07-08 TW TW084107077A patent/TW271524B/zh not_active IP Right Cessation
- 1995-07-20 ZA ZA956078A patent/ZA956078B/xx unknown
- 1995-07-31 MY MYPI20021851A patent/MY129887A/en unknown
- 1995-07-31 MY MYPI20070660A patent/MY137264A/en unknown
- 1995-07-31 MY MYPI95002226A patent/MY114777A/en unknown
- 1995-08-01 CN CNB951907239A patent/CN1144180C/zh not_active Expired - Lifetime
- 1995-08-01 DE DE69535723T patent/DE69535723T2/de not_active Expired - Lifetime
- 1995-08-01 WO PCT/US1995/009780 patent/WO1996004646A1/en active Application Filing
- 1995-08-01 ES ES95928266T patent/ES2299175T3/es not_active Expired - Lifetime
- 1995-08-01 EP EP03005273A patent/EP1339044B1/en not_active Expired - Lifetime
- 1995-08-01 AT AT03005273T patent/ATE470932T1/de not_active IP Right Cessation
- 1995-08-01 RU RU96110286A patent/RU2146394C1/ru active
- 1995-08-01 ES ES03005273T patent/ES2343948T3/es not_active Expired - Lifetime
- 1995-08-01 JP JP50672896A patent/JP3611858B2/ja not_active Expired - Lifetime
- 1995-08-01 BR BRPI9506307-2A patent/BR9506307B1/pt not_active IP Right Cessation
- 1995-08-01 EP EP95928266A patent/EP0722603B1/en not_active Expired - Lifetime
- 1995-08-01 AT AT95928266T patent/ATE388464T1/de not_active IP Right Cessation
- 1995-08-01 CA CA2172062A patent/CA2172062C/en not_active Expired - Lifetime
- 1995-08-01 DE DE69536082T patent/DE69536082D1/de not_active Expired - Lifetime
- 1995-08-01 AU AU32095/95A patent/AU689628B2/en not_active Expired
- 1995-08-01 KR KR1019960701753A patent/KR100399648B1/ko not_active IP Right Cessation
- 1995-08-03 IL IL11481995A patent/IL114819A/xx not_active IP Right Cessation
-
1996
- 1996-03-29 FI FI961445A patent/FI120327B/fi not_active IP Right Cessation
-
1997
- 1997-03-11 US US08/815,354 patent/US5911128A/en not_active Expired - Lifetime
-
1998
- 1998-12-28 HK HK98116180A patent/HK1015184A1/xx not_active IP Right Cessation
-
1999
- 1999-02-12 US US09/252,595 patent/US6240387B1/en not_active Expired - Lifetime
-
2001
- 2001-04-12 US US09/835,258 patent/US6484138B2/en not_active Expired - Lifetime
-
2004
- 2004-07-27 JP JP2004219254A patent/JP4444749B2/ja not_active Expired - Lifetime
-
2007
- 2007-08-24 FI FI20070642A patent/FI122726B/fi not_active IP Right Cessation
-
2008
- 2008-02-14 JP JP2008033680A patent/JP4778010B2/ja not_active Expired - Lifetime
-
2009
- 2009-11-18 JP JP2009262773A patent/JP4851578B2/ja not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4444749B2 (ja) | 減少レート、可変レートの音声分析合成を実行する方法及び装置 | |
EP1554718B1 (en) | Methods for interoperation between adaptive multi-rate wideband (amr-wb) and multi-mode variable bit-rate wideband (wmr-wb) speech codecs | |
US7657427B2 (en) | Methods and devices for source controlled variable bit-rate wideband speech coding | |
EP1340223B1 (en) | Method and apparatus for robust speech classification | |
JP5543405B2 (ja) | フレームエラーに対する感度を低減する符号化体系パターンを使用する予測音声コーダ | |
US20020035470A1 (en) | Speech coding system with time-domain noise attenuation | |
JP2007534020A (ja) | 信号符号化 | |
KR20020093940A (ko) | 가변율 음성 코더에서 프레임 삭제를 보상하는 방법 | |
KR20050046204A (ko) | 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법 | |
JP2002536694A (ja) | 音声コーダのための、1/8レート乱数発生のための方法と手段 | |
JP3451998B2 (ja) | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 | |
EP1808852A1 (en) | Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs | |
Chen | Adaptive variable bit-rate speech coder for wireless applications | |
Paksoy | Variable rate speech coding with phonetic classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051206 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060306 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20060313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070206 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070501 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070508 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070606 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070611 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070706 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070711 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080214 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080408 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20090123 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090610 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091118 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100114 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130122 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |