JP3235526B2 - 音声圧縮伸長方法及びその装置 - Google Patents

音声圧縮伸長方法及びその装置

Info

Publication number
JP3235526B2
JP3235526B2 JP22739597A JP22739597A JP3235526B2 JP 3235526 B2 JP3235526 B2 JP 3235526B2 JP 22739597 A JP22739597 A JP 22739597A JP 22739597 A JP22739597 A JP 22739597A JP 3235526 B2 JP3235526 B2 JP 3235526B2
Authority
JP
Japan
Prior art keywords
frame
audio
index
processing
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22739597A
Other languages
English (en)
Other versions
JPH1168578A (ja
Inventor
隆司 横溝
芹沢  昌宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP22739597A priority Critical patent/JP3235526B2/ja
Priority to US09/130,653 priority patent/US6098045A/en
Priority to EP98114897A priority patent/EP0896321B1/en
Priority to KR1019980032145A priority patent/KR100304137B1/ko
Priority to DE69827558T priority patent/DE69827558D1/de
Publication of JPH1168578A publication Critical patent/JPH1168578A/ja
Application granted granted Critical
Publication of JP3235526B2 publication Critical patent/JP3235526B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声圧縮伸長方法
及び装置に関し、特に、音声の圧縮伸長処理において無
音部の圧縮などの特殊状態の情報を伝送する方法及びそ
の装置の改良に関する。
【0002】
【従来の技術】従来、ある時間間隔を表すフレーム単位
で、音声の圧縮伸長を行う従来の装置としては、アイ・
イー・アイ・シー・イー・トランザクションズ・オン・
インフォメーション・アンド・システムズ、第E78−
D巻、第6号1995年6月掲載のMasahiro SERI
ZAWA氏とKazunori OZAWA氏によって著された
「4キロビット・パー・セコンド・インプルーブド・ピ
ッチ・プレディクション・セルプ・スピーチ・コーディ
ング・ウィズ・20ミリセコンド・フレーム」と題する
論文(IEICE TRANSACTIONS ON
INFORMATION AND SYSTEMS,V
OL.E78−D,NO.6,JUNE1995,“4
kbps Improved Pitch Predi
ction CELP Speech Coding
with 20msec Frame.”)に示されて
いるCELP(Code Excited Linea
rPrediction)方式に基づくものが知られて
いる。
【0003】この音声圧縮伸長装置において、特定のフ
レームで音声の種別により処理を切替えること、例えば
有声音と無声音を区別して圧縮伸長を行なうことによ
り、圧縮伸長後の音声の品質を向上させる等のような特
殊処理を行なうフレームを伝送する場合は、特殊処理が
なされることを示す特定のビットをビットストリーム内
に設け、残りのビットに特殊処理に必要な情報を含める
ことにより、実現していた。
【0004】従来の音声圧縮伸長装置について以下に図
面を参照して説明する。図16は、従来の音声圧縮伸長
装置の構成を示す図である。図17は、従来の装置にお
ける音声圧縮処理の処理フローを示すフローチャートで
ある。図18は、従来の装置における従来の音声伸長処
理の処理フローを示すフローチャートである。図19
は、従来の装置における1フレーム分のエンコードデー
タのビットストリームの概略を示す図である。
【0005】図16において、103は原音音声デー
タ、104は音声圧縮処理部にて生成されたエンコード
データ、105はエンコードデータを基に伸長した伸長
後音声データである。106はフレーム単位に処理を行
う音声圧縮処理部、107は原音音声データ読み込み手
段、108は有声、無声フレーム判定手段、109は特
殊処理識別ビット判定手段、110は有声フレーム圧縮
手段、111は無声フレーム圧縮手段、112はエンコ
ードデータ出力手段、113はフレーム単位に処理を行
う音声伸長処理部、114はエンコードデータ読み込み
手段、115は特殊処理識別ビット操作手段、116は
有声フレーム伸長手段、117は無声フレーム伸長手
段、118は伸長後音声データ出力手段である。
【0006】ここでは、特殊処理として、有声音と無声
音とを区別して圧縮伸長処理を行なう場合を例に説明す
るが、後に詳細に説明される本発明において特殊処理
は、これに限定されるものではない。例えば、有音部と
無音部とを区別することにより無音部での圧縮効率を向
上させるなどの用途も存在する。
【0007】図16に示した従来の音声圧縮伸長装置に
ついて、図17、及び図18のフローチャートを参照し
て以下に説明する。
【0008】まず、原音音声データ103を基に音声を
圧縮する場合について、図16及び図17を参照して説
明する。
【0009】音声圧縮処理部106の処理は、ステップ
S37にて、原音音声データ読み込み手段107を用い
て1フレーム分の原音音声データが入力されると、ステ
ップS38にて、有声、無声フレーム判定手段108を
用いて、当該フレームが無声フレームであるか有声フレ
ームであるかを判定する。ステップS38で、入力され
た原音音声データが有声フレームであった場合には、ス
テップS39へと移り、特殊処理識別ビット操作手段1
09を用いて、図19に示した特殊処理識別ビットの有
声フレームに対応するビット120をセットし、ステッ
プS40にて、有声フレーム圧縮手段110を用いて圧
縮処理を行ない、ステップS41にてエンコードデータ
出力手段112を用いて、エンコードデータを出力す
る。なお、図19は、エンコードデータの1フレーム分
のビットストリームを示したものである。
【0010】一方、ステップS38の判定処理におい
て、入力された原音音声データが無声フレームであった
場合には、ステップS42へと移り、特殊処理識別ビッ
ト操作手段109を用いて、図19に示した特殊処理識
別ビットに無声フレームに対応するビット119をセッ
トし、ステップS43にて無声フレーム圧縮手段111
を用いて圧縮処理を行ない、ステップS41にてエンコ
ードデータ104を出力する。
【0011】次に、従来の音声圧縮伸長装置において、
上記の圧縮処理において生成したエンコードデータ10
4を音声伸長処理部113によって伸長する場合につい
て、図16及び図18を参照して説明する。
【0012】ステップS44にて、エンコードデータ読
み込み手段114を用いてエンコードデータ104を読
み込み、ステップS45にて、特殊処理識別ビット判定
手段115を用いて、図19に示した特殊処理識別ビッ
トに有声フレームに対応するビット120がセットされ
ているか、無声フレームに対応するビット119がセッ
トされているかの判定を行なう。有声フレームに対応す
るビット120がセットされている場合には、ステップ
S46に進み、有声フレーム伸長手段116を用いて伸
長処理を行ない、ステップS47にて伸長後音声データ
出力手段118を用いて伸長後音声データを出力する。
【0013】一方、ステップS45の判定において、無
声フレームに対応するビット119がセットされている
場合には、ステップS48に進み、無声フレーム伸長手
段117を用いて伸長処理を行ない、ステップS47に
て、伸長後音声データを出力する。
【0014】
【発明が解決しようとする課題】しかしながら、図16
乃至図19を参照して説明した上記従来の音声圧縮伸長
装置は、下記記載の問題点を有している。
【0015】その第一の問題点は、特殊処理を実現する
為にビットレートが増加してしまい、特に、複数の特殊
処理を実装する際には、ビットレートが著しく増加して
しまうという、ことである。
【0016】その理由は、上記従来の音声圧縮伸長装置
においては、特殊処理1つを実装するにあたり、1ビッ
トの情報を追加しなければならいためである。
【0017】また第2の問題点として、処理系によって
は、例えば処理効率の都合上バイト単位にデータを操作
する必要があるなどの場合において、仮にフレームあた
り1ビットのビットレートの増加であっても、1バイト
の増加を行なわなければならない状況が存在し、このた
め、圧縮効率が著しく悪化するという、ことである。
【0018】したがって本発明は、上記問題点に鑑みて
なされたものであって、その目的は、圧縮効率の悪化さ
せずに特殊処理の実装を可能とする音声圧縮伸長装置及
び方法を提供することにある。
【0019】
【課題を解決するための手段】前記目的を達成するた
め、本発明の音声圧縮伸長装置は、フレーム単位に音声
の圧縮伸長を行う音声圧縮伸長装置において、特殊処理
を行うフレームでは、前記フレームで伝送するビットス
トリーム内のインデクスを特定の状態にすることによ
り、前記特殊処理を行なうフレームを伝送する音声圧縮
処理部と、前記ビットストリームに格納されたインデク
スの情報を参照することにより、特殊処理の実行を行な
う音声伸長処理部とを有する。
【0020】また、本発明は、フレーム単位に音声の圧
縮伸長を行う音声圧縮伸長装置において、特殊処理を行
うフレームでは、該フレームで伝送するビットストリー
ム内のインデクスを特定の状態とし、前記インデクス以
外のビットには前記特殊処理状態の実行に必要な情報を
格納して前記特殊処理を行なうフレームを伝送する音声
圧縮処理部と、前記ビットストリームに格納されたイン
デクスの情報を参照して該フレームが特殊処理であるこ
とを認識し、前記ビットストリームに格納されたインデ
クス以外の情報から、前記特殊処理状態の実行に必要な
情報を取り出し前記特殊処理の実行を行なう音声伸長処
理部と、を含むことを特徴とする。
【0021】また、本発明は、フレーム単位に音声の圧
縮伸長を行う音声圧縮伸長装置において、前記特殊処理
を行うフレームでは、前記フレームで伝送するビットス
トリーム内のインデクスを特定の状態として、インデク
スビットのみを伝送する音声圧縮処理部と、前記ビット
ストリームに格納されたインデクスの情報を参照して該
フレームが特殊処理であることを認識し前記特殊処理の
実行を行なう音声伸長処理部と、を含むことを特徴とす
る。
【0022】そして、本発明は、フレーム単位に音声の
圧縮伸長を行う音声圧縮伸長方法において、音声圧縮処
理では、特殊処理を行うフレームについて、該フレーム
で伝送するビットストリーム内のインデクスをある特定
の状態に設定することにより、前記特殊処理を行なうフ
レームを伝送し、音声伸張処理では、前記ビットストリ
ームに格納されたインデクスの情報を参照して前記特殊
処理の実行を行なう、ことを特徴とする。
【0023】
【発明の実施の形態】本発明の実施の形態について図面
を参照して以下に説明する。
【0024】[実施の形態1]図1は、本発明の第1の
実施の形態の構成を示す図である。図1を参照すると、
本発明の音声圧縮伸長装置は、その好ましい第1の実施
の形態において、音声圧縮処理部4と音声伸長処理部1
1を含み、音声圧縮処理部4は、原音音声データ読み込
み手段5、特殊処理状態判定手段6、インデクスビット
操作手段7、特殊処理フレーム圧縮手段8、音声圧縮手
段9、及び、エンコードデータ出力手段10を含んで構
成され、また音声伸長処理部11は、エンコードデータ
読み込み手段12、インデクスビット判定手段13、特
殊処理フレーム伸長手段15、音声伸長手段16、及
び、伸長後音声データ出力手段17を含んで構成されて
いる。
【0025】圧縮が行なわれる原音音声データ1は、原
音音声データ読み込み手段5によって音声圧縮処理部4
に入力され、特殊処理状態判定手段6に入力される。こ
の特殊処理状態判定手段6では、入力された原音音声デ
ータが音声圧縮処理部4において特殊処理を行なうもの
であるか否かを判定する。
【0026】特殊処理状態判定手段6において入力され
た原音音声データが特殊処理を行なうものであると判定
されたら、インデクスビット操作手段7においてインデ
クスビットの値を該当する特殊処理に割り当てられてい
る値にセットし、特殊処理フレーム圧縮手段8において
圧縮処理を行ない、生成したエンコードデータをエンコ
ードデータ出力手段10により出力する。ここで「イン
デクス」とは、例えばCELP方式におけるLSP(線
スペクトル対)の係数を表す値など、音声圧縮伸長に必
要な値を保持するビット列のことをいう。インデクスビ
ットの値が、限られた値や範囲をとる場合、この値を格
納する為に割り当てられているビット列で表現可能な値
の範囲でとり得ない値に対して、その値を特殊処理状態
を伝送する為に割り当てる。
【0027】一方、特殊処理状態判定手段6において入
力された原音音声データが特殊処理を行なうものではな
いと判定された場合には、音声圧縮手段9によって通常
の音声圧縮処理を行ない、生成したエンコードデータを
エンコードデータ出力手段10によって出力する。
【0028】生成したエンコードデータ2を伸長する場
合は、エンコードデータ読み込み手段12によりエンコ
ードデータを音声伸長処理部11に読み込み、インデク
スビット判定手段13により入力されたエンコードデー
タのインデクスビットが特殊処理に割り当てられた値で
あるか否かを判定する。インデクスビット判定手段13
で、特殊処理を行なう値であると判定された場合には、
特殊処理フレーム伸長手段15により特殊処理フレーム
の伸長を行ない、伸長後音声データ出力手段17により
伸長後音声データを出力する。
【0029】インデクスビット判定手段13で、入力さ
れたエンコードデータは特殊処理を行なうものではない
と判定された場合には、音声伸長手段16によって通常
の音声伸長処理を行ない伸長後音声データ出力手段17
により伸長後音声データを出力する。
【0030】このように、本発明の第1の実施の形態に
おいては、特殊処理を実装するにあたり、新たにビット
レートを追加すること無く、インデクスのレベルを特殊
処理に割り当てることにより、ビットレートの悪化を招
くこと無く、特殊処理の伝送を行なうことができる。
【0031】[実施例1]次に、上記した実施の形態に
ついて更に詳細に説明すべく、本発明の第1の実施例に
ついて図面を参照して説明する。図2は、本発明の第1
の実施例の構成を示す図である。図3は、本発明の第1
実施例における音声圧縮処理の処理フローを示すフロー
チャートである。また図4は、本発明の第1の実施例に
おける音声伸長処理の処理フローを示すフローチャート
である。図5は、本発明の第1の実施例における1フレ
ーム分のエンコードデータのビットストリームの概略を
示す図である。
【0032】本発明の第1の実施例の音声圧縮伸長装置
では、特殊処理状態として無音状態を想定している。図
5は、上記したように、1フレーム分のエンコードデー
タのビットストリームを示したものであるが、このう
ち、Nはインデクスを示すものであり、本発明の第1の
実施例においては、CELPにおけるLSP係数を保持
している7ビットのビット列であるものと仮定し、この
インデクスNの値のうち、通常の圧縮動作では取り得な
い‘1111111’を無声フレームとして割り当てて
あるものとする。
【0033】図2において、18は圧縮を行なう原音音
声データ、19は音声圧縮処理部にて圧縮されたエンコ
ードデータ、20は音声伸長処理部にて伸長された伸長
後音声データ、21は上記文献1に記載されたCELP
方式により音声を圧縮する音声圧縮処理部、22は原音
音声データ読み込み手段、23は有声、無声フレーム判
定手段、24はインデクスビット操作手段、25は無声
フレーム圧縮手段、26は有声フレーム圧縮手段、27
はエンコードデータ出力手段、28は上記文献1に記載
されたCELP方式により音声を伸長する音声伸長処理
部、29はエンコードデータ読み込み手段、30はイン
デクスビット判定手段、31は無声フレーム伸長手段、
32は有声フレーム伸長手段、33は伸長後音声データ
出力手段である。
【0034】図2及び図3を参照して、本発明の第1の
実施例における音声圧縮処理について説明する。
【0035】まずステップS1において、音声圧縮処理
部に入力された1フレーム分の原音音声データ18を、
原音音声データ読み込み手段22にて読み込む。
【0036】次にステップS2において、有声、無声フ
レーム判定手段23を用いて、入力された音声が有声フ
レームであるか又は無声フレームであるか判定する。こ
こで、入力された原音音声データが有声フレームである
とすると、ステップS3へ処理が移り、有声フレーム圧
縮処理手段26を用いて音声の圧縮を行ない、ステップ
S4にて、エンコードデータ出力手段27を用いてエン
コードデータを出力する。
【0037】一方、ステップS2において、入力された
原音音声データが無声フレームである場合には、ステッ
プS5に移り、インデクスビット操作手段24を用いて
インデクスビットNを無声フレームに割り当てられてい
る‘1111111’にセットし、ステップS6にて、
無声フレーム圧縮処理手段25を用いて、音声の圧縮を
行ない、ステップS4にてエンコードデータ出力手段2
7を用いてエンコードデータを出力する。
【0038】次に、上記のように圧縮処理を行なったエ
ンコードデータを伸長する場合について図2及び図4を
参照して説明する。
【0039】まずステップS7にて、エンコードデータ
読み込み手段29を用いてエンコードデータを読み込
み、ステップS8にて、インデクスビット判定手段30
を用いて、インデクスビットNが‘1111111’で
あるか否かを判定する。
【0040】ステップS8において、インデクスビット
Nが‘1111111’以外の値である場合は、当該フ
レームは有声フレームであるので、ステップS9にて、
有声フレーム伸長手段32を用いて伸長処理を行ない、
ステップS10にて、伸長後音声データを出力する。
【0041】一方、ステップS8にて判定したインデク
スビットNが‘1111111’である場合には、当該
フレームは無声フレームであるので、ステップS11に
おいて、無声フレーム伸長手段31を用いて伸長処理を
行ない、ステップS10にて伸長後音声データを出力す
る。
【0042】[実施の形態2]本発明の第2の実施の形
態について説明する。図6は、本発明の第2の実施の形
態の構成を示す図である。
【0043】図6を参照すると、圧縮を行なう原音音声
データ34は、前記第1の実施の形態と同様に、原音音
声データ読み込み手段38により音声圧縮処理部37に
入力され、特殊処理状態判定手段39において入力され
た原音音声データが特殊処理を行なうものであるか否か
の判定を行なう。特殊処理状態判定手段39で特殊処理
を行なうものであると判定されたら、インデクスビット
操作手段40においてインデクスビットの値を該当する
特殊処理に割り当てられている値にセットし、特殊処理
情報記録手段41においてビットストリームのインデク
ス以外のビットに特殊処理を行なう為に必要な情報を記
録した後、生成したエンコードデータをエンコードデー
タ出力手段43により出力する。
【0044】特殊処理状態判定手段39において、入力
された原音音声データが特殊処理を行なうものではない
と判定された場合は、音声圧縮手段42によって通常の
音声圧縮処理を行ない、生成したエンコードデータをエ
ンコードデータ出力手段43によって出力する。
【0045】生成したエンコードデータ35を伸長する
場合には、前記第1の実施の形態と同様に、エンコード
データ35をエンコードデータ読み込み手段45で読み
込み、インデクスビット判定手段45で、入力されたエ
ンコードデータのインデクスビットが特殊処理に割り当
てられた値であるか否かを判定する。
【0046】インデクスビット判定手段45において、
入力されたエンコードデータのインデクスビットが特殊
処理を行なう値である場合には、特殊処理情報読み込み
手段47によりエンコードデータのインデクス以外のビ
ットから特殊処理を行なう為の情報を取り出し、特殊処
理実行手段48によって特殊処理の実行を行なう。
【0047】インデクスビット判定手段45において、
入力されたエンコードデータは特殊処理を行なうもので
はないと判定された場合には、音声伸長手段49によっ
て通常の音声伸長処理を行ない、伸長後音声データ出力
手段50により伸長後音声データを出力する。
【0048】このように本発明の第2の実施の形態にお
いては、特殊処理を実装するにあたり、新たにビットレ
ートを追加する事無く、インデクスの特定の値を特殊処
理に割り当てる事により、ビットレートの悪化を招くこ
と無く、特殊処理の伝送を行なう事ができる。
【0049】また、ビットストリームのうちインデクス
を表した残りのビットに特殊処理実行の為の情報を格納
することが可能であり、様々な特殊処理の実装を行なう
事が可能となる。
【0050】[実施例2]次に、上記した第2の実施の
形態について更に詳細に説明すべく、本発明の第2の実
施例について図面を用いて説明する。
【0051】図7は、本発明の第2の実施例の構成を示
す図である。図8は、本発明の第2実施例における音声
圧縮処理の処理フローを示すフローチャートである。図
9は、本発明の第2の実施例における音声伸長処理の処
理フローを示すフローチャートである。図10は、本発
明の第2の実施例における1フレーム分のエンコードデ
ータのビットストリームの概略を示す図である。
【0052】図7において、51は圧縮を行なう原音音
声データ、52は音声圧縮処理部にて圧縮されたエンコ
ードデータ、53は音声伸長処理部にて伸長された伸長
後音声データ、54は音声圧縮処理部、55は原音音声
データ読み込み手段、56は無音状態判定手段、57は
インデクスビット操作手段、58は無音フレーム数記録
手段、59は前フレーム状態参照手段、60は前記第1
の実施の形態で説明したものと同様のCELP方式によ
る音声圧縮手段、61はエンコードデータ出力手段、6
2は音声伸長処理部、63はエンコードデータ読み込み
手段、64はインデクスビット判定手段、65は無音フ
レーム数読み込み手段、66は無音データ生成手段、6
7は前記第1の実施の形態で説明したものと同様のCE
LP方式による音声伸長手段、68は伸長後音声データ
出力手段、である。
【0053】本発明の第2の実施例における音声圧縮伸
長装置では、特殊処理状態として無音状態を想定してい
る。図10は、本発明の第1実施例における1フレーム
分のエンコードデータのビットストリームを示したもの
であるが、このうち、Nはインデクスを示すものであ
り、本発明の第2の実施例においては、このインデクス
Nの値のうち、通常の圧縮動作ではとり得ない‘101
1111’〜‘1111111’の範囲を特殊状態とし
て定義するものとし、また、これらのうち‘11111
11’を無音圧縮として割り当ててあるものとする。ま
た、ビットストリームのうち、インデクス以外のビット
Dには、無音フレーム数を格納するものとする。
【0054】本発明の第2の実施例の音声圧縮伸長装置
を用いて、音声の圧縮伸長を行なう場合の動作につい
て、図7、図8及び図9のフローチャートを参照して説
明する。
【0055】本発明の第2の実施例の動作を説明するに
あたり、入力される原音音声データは、第1フレームか
ら順に1フレーム中に音声のデータが存在している有音
フレーム→1フレーム中に音声のデータが存在していな
い無音フレーム→無音フレーム→有音フレーム→有音フ
レームの順に入力されるものとする。
【0056】まずステップS11において、1フレーム
分の原音音声データ51を、原音音声データ読み込み手
段55にて読み込む。次にステップS12において、無
音状態判定手段56を用いて、入力された音声が無音フ
レームであるか否かを判定する。無音状態判定手段56
では、入力された音声のパワーを用い、この音声のパラ
ーが予め定めた所定の値よりも大きな値であれば有音、
小さな値であれば無音と判定する。
【0057】この例では、第1フレーム目は、有音フレ
ームであるので、ステップS15へ処理は移り、前フレ
ーム状態判定手段59にて、1つ前のフレームのデータ
が無音フレームであったか否かを判定する。ここでは、
第1フレーム目の処理であるので、ステップS16へと
移り、音声圧縮手段60を用いて通常の圧縮動作を行な
い、ステップS17にてエンコードデータをエンコード
データ出力手段61を用いて出力する。
【0058】処理は、再びステップS11に戻り、第2
フレーム目の原音音声データを読み込む。ステップS1
2に処理は移り、有音フレームか無音フレームかの判定
を行なう。この例では、第2フレーム目は無音フレーム
であるので、ステップS13に処理は移り、図10に示
されるビットストリームのうち、インデクスを示すNビ
ットの情報を、インデクスビット操作手段57を用いて
無音圧縮として定義した‘1111111’にセットす
る。
【0059】次にステップS14に処理は移り、インデ
クスを除いた残りのビットDに無音フレーム数記録手段
58を用いて無音フレーム数である1を格納する。
【0060】再度、処理はステップS11に戻り、第3
フレーム目の原音音声データを取り込み、ステップS1
2にてそのフレームが無音フレームであるかのチェック
を行なう。この例では、第3フレーム目も無音フレーム
であるので、処理はステップS13へと移り、図10に
示されるビットストリームのうち、インデクスを示すN
ビットの情報を、無音圧縮として定義した‘11111
11’にセットする。次にステップS14に処理は移
り、インデクスを除いた残りのビットDに無音フレーム
数である1を加算する。
【0061】再びステップS11に戻り、第4フレーム
目の原音音声データを読み込む。次にステップS12へ
処理は移り、無音フレームか有音フレームかの判定を行
なう。この例では、第4フレーム目は有音フレームであ
るのでステップS15へと処理は移り、1つ前のフレー
ムが無音フレームであったか否かを判定する。この例で
は、第4フレーム目は無音フレームであったので、ステ
ップS18へと移り、生成していた無音フレームのエン
コードデータを出力し、ステップS16にて第5フレー
ム目のデータに対し通常の圧縮処理を行ない、ステップ
S17にてエンコードデータを出力する。
【0062】第5フレーム目についても、同様に、ステ
ップS11にて原音音声データを読み込み、ステップS
12にて有音フレームか無音フレームかを判定する。こ
の本例では、第5フレーム目は有音フレームであるので
ステップS15へと処理は移り、1つ前のフレームが無
音フレームであったか否かを判定する。この例では、第
4フレーム目は有音フレームであるので、処理はステッ
プS16へと移り、第5フレーム目のデータを通常の圧
縮処理を行ない、ステップS17にてエンコードデータ
を出力する。
【0063】次に、上記のように、有音フレーム→無音
フレーム→無音フレーム→有音フレーム→有音フレーム
の順で圧縮したエンコードデータを伸長する場合につい
て、図7及び図9を参照して説明する。
【0064】まず、ステップS19にて1フレーム目の
エンコードデータを、エンコードデータ読み込み手段6
3を用いて読み込み、ステップS20にてインデクスビ
ット判定手段64を用いて、Nビットが‘111111
1’であるか否かを判定する。この例の場合、第1フレ
ーム目は有音フレームであるので、処理はステップS2
2に進み、音声伸長手段67を用いて通常のデコード処
理を行ない、ステップS23にて、伸長後音声データ出
力手段68を用いて伸長した後、音声データを出力す
る。
【0065】処理はステップS19へ戻り、第2フレー
ム目のエンコードデータを読み込む。ステップS20に
て、エンコードデータのインデクスNビットが‘111
1111’であるか否かを判定する。この例の場合、第
2フレーム目は無音フレームでありNビットは‘111
1111’であるので、処理はステップS21に進み、
無音フレーム数読み込み手段65を用いてエンコードデ
ータのDビットに格納されている値を読み出し、無音デ
ータ生成手段66、伸長後音声データ出力手段68を用
いて、その値分の無音データを出力する。前述の圧縮処
理時に、第2フレーム目、第3フレーム目と連続した無
音フレームは、1つのエンコードデータにまとめて圧縮
されており、ここでは、Dには2が格納されているの
で、ステップS21の処理では、第2フレーム目および
第3フレーム目の2フレーム分の無音データを伸長後音
声データとして出力する。再びステップS19に移り、
第4フレーム目のエンコードデータを読み込む。この例
では、第4フレーム目は有音フレームであるので、ステ
ップS20の判定を行なった後、ステップS22へ進
み、通常の伸長処理を行なった後、ステップS23にて
伸長後音声データを出力する。最後の第5フレーム目も
有音データであるので、第4フレーム目と処理は同様で
ある。
【0066】[実施の形態3]本発明の第3の実施の形
態について説明する。図11は、本発明の第3の実施の
形態の構成を示す図である。
【0067】圧縮を行なう原音音声データ69は、原音
音声データ読み込み手段73によって音声圧縮処理部7
2に入力され、特殊処理状態判定手段74に入力され
る。特殊処理状態判定手段74では、入力された原音音
声データが音声圧縮処理部72において特殊処理を行な
うものであるか否かを判定する。ここで特殊処理を行な
うものであると判定されたら、インデクスビット操作手
段75においてインデクスビットの値を該当する特殊処
理に割り当てられている値にセットし、インデクスビッ
ト出力手段76によりインデクスビットのみを出力す
る。
【0068】特殊処理状態判定手段74の判定におい
て、入力された原音音声データが特殊処理を行なうもの
ではないと判定された場合には、音声圧縮手段77によ
って通常の音声圧縮処理を行ない、生成したエンコード
データ70をエンコードデータ出力手段78によって出
力する。
【0069】生成したエンコードデータ70を伸長する
場合、エンコードデータ読み込み手段80によりエンコ
ードデータ音声伸長処理部79に読み込み、インデクス
ビット判定手段81により入力されたエンコードデータ
のインデクスビットが特殊処理に割り当てられた値であ
るか否かを判定する。インデクスビット判定手段81
で、特殊処理を行なう値となっている場合には、特殊処
理実行手段82によって特殊処理を行ない、エンコード
データ読み込み開始アドレス操作手段85によって次フ
レームの読み込み開始アドレスをインデクスビット分だ
け進める。
【0070】インデクスビット判定手段81の判定で、
入力されたエンコードデータは特殊処理を行なうもので
はないと判定された場合には、音声伸長手段83によっ
て通常の音声伸長処理を行ない、伸長後音声データ出力
手段84により伸長後音声データを出力し、エンコード
データ読み込み開始アドレス操作手段85によって次フ
レームの読み込み開始アドレスを1フレームのエンコー
ドデータ分進める。
【0071】このように本発明の実施の形態では、特殊
処理伝送時にはビットレートを下げるという可変ビット
レートを実現でき、ビットレートの削減に寄与する。
【0072】[実施例3]次に、上記した第3の実施の
形態について更に詳細に説明すべく、本発明の第3の実
施例について説明する。図12は、本発明の第3の実施
例の構成を示す図である。図13は、本発明の第3の実
施例における音声圧縮処理の処理フローを示すフローチ
ャートである。図14は、本発明の第3の実施例におけ
る音声伸長処理の処理フローを示すフローチャートであ
る。図15は、本発明の第3の実施例における1フレー
ム分のエンコードデータのビットストリームの概略を示
す図であり、通常の有音フレームのものと無音フレーム
のものを表している。
【0073】図12において、86は圧縮を行なう原音
音声データ、87は音声圧縮処理部にて圧縮されたエン
コードデータ、88は音声伸長処理部にて伸長された伸
長後音声データ、89は音声圧縮処理部、90は原音音
声データ読み込み手段、91は無音状態判定手段、92
はインデクスビット操作手段、93はインデクスビット
出力手段、94は前記第1の実施の形態と同様のCEL
P方式による音声圧縮手段、95はエンコードデータ出
力手段、96は音声伸長処理部、97はエンコードデー
タ読み込み手段、98はインデクスビット判定手段、9
9は無音データ生成出力手段、100は前記第1の実施
の形態と同様のCELP方式による音声伸長手段、10
1は伸長後音声データ出力手段、102はエンコードデ
ータ読み込み開始アドレス操作手段である。
【0074】本発明の第3の実施例における音声圧縮伸
長処理では、特殊処理状態として無音状態を想定してお
り、本発明の第3の実施例の音声圧縮伸長装置を用い
て、無音状態の圧縮伸長を行なう場合を、図13、及び
図14を参照して説明する。図15は、本発明の第3の
実施例における1フレーム分のエンコードデータのビッ
トストリームを示したものであるが、このうち、Nはイ
ンデクスを示すものであり、本発明の第3の実施例にお
いては、このインデクスNの値のうち、通常の圧縮動作
ではとり得ない‘1111111’を無音圧縮として割
り当ててあるものとする。
【0075】本発明の第3の実施例の動作を説明するに
あたり、入力される音声データは、有音フレーム→無音
フレーム→有音フレームの順に入力されるものとする。
【0076】まずステップS24において、原音音声デ
ータ読み込み手段90を用いて音声圧縮処理部に入力さ
れた1フレーム分の原音音声データを読み込む。
【0077】次にステップS25において無音状態判定
手段91を用いて入力された1フレームが無音フレーム
であるか否かを判定する。この例では、第1フレーム目
は有音フレームであるので、ステップS28へ処理は移
り、音声圧縮手段94を用いて通常の圧縮動作を行な
い、ステップS29にてエンコードデータ出力手段95
を用いてエンコードデータを出力する。
【0078】処理は再びステップS24に移り、第2フ
レーム目の原音データを読み込む。ステップS25に処
理は移り、有音フレームか無音フレームかの判定を行な
う。この例では、第2フレーム目は無音フレームである
ので、ステップS28に処理は移り、図15に示される
ビットストリームのうち、インデクスを示すNビットの
情報を、無音圧縮として定義した‘1111111’
に、インデクスビット操作手段92を用いてセットす
る。
【0079】次にステップS27に処理は移り、インデ
クスビット出力手段93を用いて‘1111111’と
セットしたインデクス部分のみをエンコードデータとし
て出力する。
【0080】再度処理はステップS24に戻り、第3フ
レーム目の原音音声データを取り込み、ステップS25
にてそのフレームが無音状態であるか否かのチェックを
行なう。この例では第3フレーム目は有音フレームであ
るので、処理はステップS28へと移り、通常の圧縮処
理を行ない、ステップS29にてエンコードデータを出
力する。
【0081】次に、有音フレーム→無音フレーム→有音
フレームの順で圧縮したエンコードデータを伸長する場
合について、図14を参照して説明する。
【0082】まずステップS30にてエンコードデータ
読み込み手段97を用いて、1フレーム分のエンコード
データを読み込む。この際に読み込むエンコードデータ
のサイズは、有音フレームのエンコードデータサイズ、
つまり図15に示されるビットストリームのうち、Bで
表されている長さのデータである。
【0083】次にステップS31にて、インデクスビッ
ト判定手段98を用いてインデクスNビットの値の判定
を行なう。第1フレーム目は有音フレームであるので、
Nビットの値は‘1111111’ではないため、処理
はステップS34に移り、音声伸長手段100を用いて
通常の伸長処理を行ない、ステップS35にて伸長後音
声データ出力手段101を用いて音声データを出力し、
ステップS36にてエンコードデータ読み込み開始アド
レス操作手段102を用いて入力データポインタをBビ
ット分進める。
【0084】処理はステップS30に戻り、第2フレー
ム目のエンコードデータを読み込み、ステップS31に
処理は移る。この例では、第2フレーム目は無音フレー
ムであるのでNビットは‘1111111’であるた
め、処理はステップS32に移る。ステップS32で
は、無音データ生成出力手段99を用いて1フレーム分
の無音信号を伸長後音声データとして出力し、次のステ
ップS33にて、読み込み開始アドレス操作手段102
を用いて入力データのポインタをNビット分だけ進め
る。再度ステップS30に処理は移り、エンコードデー
タを読み込み、ステップS31へと進む。この例では、
第3フレーム目は有音フレームであるため、ステップS
34へ進み、通常のエンコード処理を行ない、ステップ
S35にて入力データポインタをBビット分進める。
【0085】以上説明した、本発明の第1乃至第3の実
施の形態では、CELP方式を例に説明したが、本発明
は、これに限定されるものではなく、フレーム単位に音
声の圧縮伸長を行なう音声圧縮伸長装置、例えば古井氏
によって著されている刊行物(「ディジタル音声処
理」、東海大学出版会)に示されているように、APC
(適応予測符号化)方式やATC(adaptive
trabnsform coding)方式などであれ
ば応用が可能である。また、インデクスとしてLSP係
数を用いているが、これも他のパラメータ、例えばGA
INパラメータやPOWERパラメータなどを用いるこ
とも可能である。
【0086】また、本発明の第2の実施例においては、
特殊処理情報として、無音フレーム数を例に説明した
が、この他にも、「日本音響学会平成6年度春季研究発
表会講演論文集1994年3月」において、大室氏、間
野氏、守谷氏によって著されている「PSI−CELP
に基づく可変ビットレート音声符号化」と題する論文に
示されているように、無音時に付加する背景雑音のコー
ドブックを切替える情報などを含めることも可能であ
り、複数の無音状態を伝送することも可能である。
【0087】
【発明の効果】以上説明したように、本発明の音声圧縮
伸長装置によれば、下記記載の効果を奏する。
【0088】本発明の第1の効果は、ビットレートを悪
化させること無く、特殊処理の伝送を可能とする、とい
うことである。
【0089】その理由は、特殊処理を伝送する場合、従
来、専用のビットを設けて伝送していたものを、本発明
においては、特定のビット列の設定値として伝送する
為、ビットレートを悪化させること無く、特殊処理の伝
送できるためである。
【0090】本発明の第2の効果は、伝送するビットレ
ートが一定の場合は、特殊処理に使用するパラメータの
伝送も同時に行なうことが可能となる、ということであ
る。
【0091】本発明の第3の効果は、特殊処理に使用す
るパラメータの伝送を行なわない音声圧縮伸長装置であ
れば、可変ビットレートのシステムの構築も可能とな
る、ということである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の構成を示す図であ
る。
【図2】本発明の第1の実施例の構成を示す図である。
【図3】本発明の第1の実施例における音声圧縮処理の
処理フローを示した流れ図である。
【図4】本発明の第1の実施例における音声伸長処理の
処理フローを示した流れ図である。
【図5】本発明の第1の実施例におけるエンコードデー
タのビットストリームを示した図である。
【図6】本発明の第2の実施の形態の構成を示す図であ
る。
【図7】本発明の第2の実施例の構成を示す図である。
【図8】本発明の第2の実施例における音声圧縮処理の
処理フローを示した流れ図である。
【図9】本発明の第2の実施例における音声伸長処理の
処理フローを示した流れ図である。
【図10】本発明の第2の実施例におけるエンコードデ
ータのビットストリームを示した図である。
【図11】本発明の第3の実施の形態の構成を示す図で
ある。
【図12】本発明の第3の実施例の構成を示す図であ
る。
【図13】本発明の第3の実施例における音声圧縮処理
の処理フローを示した流れ図である。
【図14】本発明の第3の実施例における音声伸長処理
の処理フローを示した流れ図である。
【図15】本発明の第3の実施例におけるエンコードデ
ータのビットストリームを示した図である。
【図16】従来の音声圧縮伸張装置の構成の一例を示す
図である。
【図17】従来の音声圧縮伸張装置における音声圧縮処
理の処理フローを示した流れ図である。
【図18】従来の音声圧縮伸張装置における音声伸張処
理の処理フローを示した流れ図である。
【図19】従来技術におけるエンコードデータのビット
ストリームを示した図である。
【符号の説明】
1、18、34、51、69、86、103 原音音声
データ 2、19、35、52、70、87、104 エンコー
ドデータ 3、20、36、53、71、88、105 伸張後音
声データ 4、21、37、54、72、89、106 音声圧縮
処理部 5、22、38、55、73、90、107 原音音声
データ読み込み手段 6、39、74 特殊処理状態判定手段 7、24、40、57、75、92 インデクスビット
操作手段 8 特殊処理フレーム圧縮手段 9、42、60、77、94 音声圧縮手段 10、27、43、61、78、95、112 エンコ
ードデータ出力手段 11、28、44、62、79、96 音声伸長処理部 12、29、45、63、80、97 エンコードデー
タ読み込み手段 13、30、46、64、81、98 インデクスビッ
ト判定手段 15 特殊処理フレーム伸長手段 16、49、67、83、100 音声伸長手段 17、33、50、68、84、101、118 伸長
後音声データ出力手段 23、108 有声、無声フレーム判定手段 25、111 無声フレーム圧縮手段 26、110 有声フレーム圧縮手段 31、116 無声フレーム伸張手段 32、117 有声フレーム伸張手段 41 特殊処理情報記録手段 47 特殊処理情報読み込み手段 48、82 特殊処理実行手段 56、91 無音状態判定手段 58 無音フレーム数記録手段 59 前フレーム状態参照手段 65 無音フレーム数読み込み手段 66 無音データ生成手段 76、93 インデクスビット出力手段 85、102 エンコードデータ読み込み開始アドレス
操作手段 99 無音データ生成出力手段 109 特殊処理識別ビット操作手段 115 特殊処理識別ビット判定手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭61−254999(JP,A) 特開 平2−282300(JP,A) 特開 平5−276049(JP,A) 特開 平5−235874(JP,A) 特開 平9−127991(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G10L 11/02 G10L 19/08

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】フレーム単位に音声の圧縮伸張を行う音声
    圧縮伸長装置において、 特殊処理を行うフレームでは、該フレームで伝送するビ
    ットストリーム内のインデクスの値を、通常の圧縮動作
    ではとり得ない特定の値に設定することにより、前記イ
    ンデクスを特定の状態に設定して前記特殊処理を行うフ
    レームを伝送する音声圧縮処理部と、 前記ビットストリームに格納されたインデクスの情報を
    参照して前記特殊処理の実行を行なう音声伸長処理部
    と、 を含むことを特徴とする音声圧縮伸長装置。
  2. 【請求項2】フレーム単位に音声の圧縮伸長を行う音声
    圧縮伸長装置において、 特殊処理を行うフレームでは、該フレームで伝送するビ
    ットストリーム内のインデクスの値を、通常の圧縮動作
    ではとり得ない特定の値に設定することにより、前記イ
    ンデクスを特定の状態とし、前記インデクス以外のビッ
    トには前記特殊処理状態の実行に必要な情報を格納して
    前記特殊処理を行なうフレームを伝送する音声圧縮処理
    部と、 前記ビットストリームに格納されたインデクスの情報を
    参照して該フレームが特殊処理であることを認識し、前
    記ビットストリームに格納されたインデクス以外の情報
    から、前記特殊処理状態の実行に必要な情報を取り出し
    前記特殊処理の実行を行なう音声伸長処理部と、 を含むことを特徴とする音声圧縮伸長装置。
  3. 【請求項3】フレーム単位に音声の圧縮伸長を行う音声
    圧縮伸長装置において、 前記特殊処理を行うフレームでは、前記フレームで伝送
    するビットストリーム内のインデクスの値を、通常の圧
    縮動作ではとり得ない特定の値に設定することにより、
    前記インデクスある特定の状態として、インデクスビ
    ットのみを伝送する音声圧縮処理部と、 前記ビットストリームに格納されたインデクスの情報を
    参照して該フレームが特殊処理であることを認識し前記
    特殊処理の実行を行なう音声伸長処理部と、を含むこと
    を特徴とする音声圧縮伸長装置。
  4. 【請求項4】フレーム単位に音声の圧縮伸長を行う音声
    圧縮伸長方法において、 音声圧縮処理では、特殊処理を行うフレームについて、
    該フレームで伝送するビットストリーム内のインデクス
    の値を、通常の圧縮動作ではとり得ない特定の値に設定
    することにより、前記インデクスをある特定の状態に設
    定することにより、前記特殊処理を行なうフレームを伝
    送し、 音声伸張処理では、前記ビットストリームに格納された
    インデクスの情報を参照して前記特殊処理の実行を行な
    う、ことを特徴とする音声圧縮伸長方法。
  5. 【請求項5】フレーム単位に音声の圧縮伸長を行う音声
    圧縮伸長方法において、 音声圧縮処理では、特殊処理を行うフレームについて、
    該フレームで伝送するビットストリーム内のインデクス
    の値を、通常の圧縮動作ではとり得ない特定の値に設定
    することにより、前記インデクスを特定の状態にし、イ
    ンデクス以外のビットには、前記特殊処理状態の実行
    必要な情報を格納して、前記特殊処理を行なうフレーム
    を伝送し、 音声伸張処理では、前記ビットストリームに格納された
    インデクスの情報を参照して該フレームが特殊処理であ
    ることを認識し、前記ビットストリームに格納されたイ
    ンデクス以外の情報から、前記特殊処理状態の実行に必
    要な情報を取り出し、前記特殊処理の実行を行なう、こ
    とを特徴とする音声圧縮伸長方法。
  6. 【請求項6】フレーム単位に音声の圧縮伸長を行う音声
    圧縮伸長方法において、 音声圧縮処理では、前記特殊処理を行うフレームについ
    て、前記フレームで伝送するビットストリーム内のイン
    デクスの値を、通常の圧縮動作ではとり得ない特定の値
    に設定することにより、前記インデクスを特定の状態と
    して、インデクスビットのみを伝送し、 音声伸張処理では、前記ビットストリームに格納された
    インデクスの情報を参照して該フレームが特殊処理であ
    ることを認識し前記特殊処理を実行する、ことを特徴と
    する音声圧縮伸長方法。
JP22739597A 1997-08-08 1997-08-08 音声圧縮伸長方法及びその装置 Expired - Fee Related JP3235526B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP22739597A JP3235526B2 (ja) 1997-08-08 1997-08-08 音声圧縮伸長方法及びその装置
US09/130,653 US6098045A (en) 1997-08-08 1998-08-07 Sound compression/decompression method and system
EP98114897A EP0896321B1 (en) 1997-08-08 1998-08-07 Sound compression/decompression method and system
KR1019980032145A KR100304137B1 (ko) 1997-08-08 1998-08-07 음성압축/신장방법및시스템
DE69827558T DE69827558D1 (de) 1997-08-08 1998-08-07 Verfahren und Vorrichtung zur Komprimierung und Dekomprimierung von Klang

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22739597A JP3235526B2 (ja) 1997-08-08 1997-08-08 音声圧縮伸長方法及びその装置

Publications (2)

Publication Number Publication Date
JPH1168578A JPH1168578A (ja) 1999-03-09
JP3235526B2 true JP3235526B2 (ja) 2001-12-04

Family

ID=16860159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22739597A Expired - Fee Related JP3235526B2 (ja) 1997-08-08 1997-08-08 音声圧縮伸長方法及びその装置

Country Status (5)

Country Link
US (1) US6098045A (ja)
EP (1) EP0896321B1 (ja)
JP (1) JP3235526B2 (ja)
KR (1) KR100304137B1 (ja)
DE (1) DE69827558D1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1696417B1 (en) * 1999-02-16 2017-07-26 Intel Corporation Audio synthesis using digital sampling of coded waveforms
US8412527B2 (en) * 2009-06-24 2013-04-02 At&T Intellectual Property I, L.P. Automatic disclosure detection
US10247228B2 (en) 2015-06-16 2019-04-02 Honda Motor Co., Ltd. Ball joint assembly having friction coated components and methods of assembling a ball joint assembly having defined gaps

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612098A (ja) * 1992-03-16 1994-01-21 Sanyo Electric Co Ltd 音声符号化装置
EP0737350B1 (en) * 1993-12-16 2002-06-26 Voice Compression Technologies Inc System and method for performing voice compression
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
TW321810B (ja) * 1995-10-26 1997-12-01 Sony Co Ltd
JP4132109B2 (ja) * 1995-10-26 2008-08-13 ソニー株式会社 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
WO1997016821A1 (en) * 1995-10-31 1997-05-09 Motorola Inc. Method and system for compressing a speech signal using nonlinear prediction
US5696875A (en) * 1995-10-31 1997-12-09 Motorola, Inc. Method and system for compressing a speech signal using nonlinear prediction

Also Published As

Publication number Publication date
US6098045A (en) 2000-08-01
KR100304137B1 (ko) 2001-09-24
JPH1168578A (ja) 1999-03-09
EP0896321A1 (en) 1999-02-10
KR19990023449A (ko) 1999-03-25
EP0896321B1 (en) 2004-11-17
DE69827558D1 (de) 2004-12-23

Similar Documents

Publication Publication Date Title
US8670990B2 (en) Dynamic time scale modification for reduced bit rate audio coding
US20070106513A1 (en) Method for facilitating text to speech synthesis using a differential vocoder
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
US5488704A (en) Speech codec
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
JPH08251030A (ja) 高速および低速再生能力を与えるためのシステム、記憶および検索システム、ならびに高速および低速再生能力を与えるための方法
JP3357795B2 (ja) 音声符号化方法および装置
EP0813183A2 (en) Speech reproducing system
JP3235526B2 (ja) 音声圧縮伸長方法及びその装置
US20060080090A1 (en) Reusing codebooks in parameter quantization
JPH04344699A (ja) 音声符号化・復号化方法
JP3199142B2 (ja) 音声の励振信号符号化方法および装置
JPH113099A (ja) 音声符号化復号化システム、音声符号化装置及び音声復号化装置
US6134519A (en) Voice encoder for generating natural background noise
JP2002268700A (ja) 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
US7092878B1 (en) Speech synthesis using multi-mode coding with a speech segment dictionary
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JP3099836B2 (ja) 音声の励振周期符号化方法
JP3332132B2 (ja) 音声符号化方法および装置
JP3092519B2 (ja) コード駆動線形予測音声符号化方式
JPH07334197A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010828

LAPS Cancellation because of no payment of annual fees