JPS62189833A - 音声符号化復号化装置 - Google Patents

音声符号化復号化装置

Info

Publication number
JPS62189833A
JPS62189833A JP3090986A JP3090986A JPS62189833A JP S62189833 A JPS62189833 A JP S62189833A JP 3090986 A JP3090986 A JP 3090986A JP 3090986 A JP3090986 A JP 3090986A JP S62189833 A JPS62189833 A JP S62189833A
Authority
JP
Japan
Prior art keywords
amplitude
section
residual
forecast residual
prediction residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3090986A
Other languages
English (en)
Inventor
Sumie Nakabayashi
澄江 中林
Ryujiro Muramatsu
村松 隆二郎
Yoshinori Miyamoto
宮本 宜則
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP3090986A priority Critical patent/JPS62189833A/ja
Publication of JPS62189833A publication Critical patent/JPS62189833A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は音声符号化復号化装置に係り、特に、音声を圧
縮伝送する音声符号化復号化装置に関する。
〔発明の背景〕
音声を符号化して伝送し、受信した信号を復号して音声
を再生ザる場合、従来の線形予測音声合成方法を採用す
る音声符号化復号化装置では、有声音区間ではピッチ周
期で分離されたインパルス列を、無声音区間では白色雑
音等を使用して音声合成器を励起している。しかし、こ
のように励起パルスを固定した場合1合成された音声の
品質には限界があり、この点を解決するために励起パル
スを複雑ピしなければならないという問題が生じてしま
う。
例えば特開昭59−178032号公報には、励起パル
スとして複数本のパルスを使用するマルチパルス方式が
記載されている。しかし、このマルチパルス方式では励
起パルスの数が多くなるため、伝送ビットレートが大き
くなってしまうという不利がある。また、予測残差パル
ス列を使用する残差駆動方式が、シー・ケー・ラン及び
ディー・ティー・マギルによる「ザ レジデユアルーエ
キサイティドリニア プレディクション ボコーダ ウ
ィズトランスミッション レート ビロー9.6 kb
its/BJアイ・イー・イー・イー トランサクショ
ンズアンドコミュニケーションズ、COM −23巻、
12号、1975年12月 (CK Un and D
T Magill。
“The Re5idual−Excited Lin
ear PradictionVocoder Wit
h transa+1tion rate belot
i 9.6 KBPS”、 I E E E  Tra
ns、 COM−23,1975)に記載されている。
この文献には、合成音の音質を保ったまま伝送ビットレ
ートを低減させるため、予測残差信号をダウンサンプリ
ングした後デルタ変調を行なう技術が開示さている。し
かし、斯かる技術は、ハード量を増大させ構成も複雑化
してしまうという欠点がある。
〔発明の目的〕
本発明の目的は、簡易な構成で伝送ビットレートを低減
させる音声符号化復号化装置を提供することある。
〔発明の概要〕 上記目的を達成するため、本発明では、音声の短時間フ
レーム毎に予測係数及び予測残差系列を用いて音声を符
号化伝送し、この予測係数及び予8′III残差系列を
復号化して音声を再生する音声符号化復号化装置におい
て、音声符号化器側に前記予測残差系列の振幅情報を対
数圧縮する圧縮部を設け、音声復号化器側に前記対数圧
縮された振幅情報を指数伸長する伸長部を設けることを
特徴とする。
〔発明の実施例〕
以下、本発明の一実施例を図面を参照して説明する。
第1図は本発明の第1実施例に係る音声符号化復号化装
置の構成図である。第1図において、音声符号化復号化
装置は、音声符号化器1と音声復号化器2とからなり、
音声符号化器1と音声復号化器2とは伝送、i!3を介
して接続されている。
音声符号化器1はAD変換部101.フレームバッファ
102.線形予測(以下、LPGという)分析部103
.予測残差抽出部104.対数圧縮部105゜送信部1
06からなり、音声復号化器2は、受信部121、指数
伸長部122、予測残差再生部123.LPC合成部1
24、DA変換部125より構成される。
斯かる構成でなる音声符号化復号化装置の音声符号化器
1にアナログ音声が入力すると、アナログ入力音声はま
ず、AD変換部101でAD変換され、フレームバッフ
ァ102に蓄えられる。フレームバッファ102に蓄え
られた音声は、LPG分析部103に送られ、LPG係
数111が抽出される。このLPG係数とフレームバッ
ファ102からの音声データが予測残差抽出部104に
入力すると、残差情報としての予測残差最大振幅112
.予測残差最大振幅112で正規化された予測残差正規
化振幅系列114.予測残差位置系列115が抽出され
る。さらに、予測残差最大振幅112は、対数圧縮部1
05で対数圧縮され、対数圧縮された予測残差最大振幅
113が出力される。LPG係数111.対数圧縮され
た予測残差最大振幅113.予測残差正規化振幅系列1
14、予測残差位置系列115は、送信部106より伝
送線3を介して音声復号化器2に送信される。
音声復号化器2では受信部121で受信された予測残差
最大振幅132が指数伸長部122で指数伸長され、予
測残差正規化振幅系列134、予測残差位置系列135
とともに、予測残差再生部123へ送られ予測残差が再
生される。再生された予測残差とLPG係数131は、
LPG合成部124に送られ、LPG合成により、音声
が再生される。再生された音声はDA変換部125でD
A変換され出力される。
本実施例によれば、音声符号化器1で予測残差最大振幅
を対数圧縮して伝送し、復号化器21で指数伸長するた
め、伝送ビットレートが低減する。
第2図は本発明の第2実施例に係る音声符号化復号化装
置の構成図である。尚、第1実施例と同一の構成要素に
は同一符号を付してその説明を省略し、異なる部分につ
いてのみ説明する。
本実施例における予測残差抽出部104′では、予測残
差振幅系列の正規化を行なわず、予測残差振幅系列11
2及び予測残差位置系列115のみを抽出し。
予測残差振幅系列を対数圧縮部105で対数圧縮する。
一方、受信部121で受信された予測残差最大振幅系列
132は、指数伸長部122で指数伸長され1、予測残
差位置系列135とともに予測残差再生部123に送ら
れ、予測残差が再生されるようになっている。
第3図は本発明の第3実施例に係る音声符号化復号化装
置の構成図である。本実施例における構成要素のうち第
1実施例と同一のものには同一符号を付してその説明を
省略し、異なる部分についてのみ説明する。本実施例で
は、予測残差抽出部104で抽出された予測残差をさら
に残差情報圧縮部107で圧縮している点が、第1実施
例と異なる。
つまり、残差圧縮部107で圧縮処理をほどこしたのち
の予測残差最大振幅113を対数圧縮部105で対数圧
縮し、正規化予測残差振幅系列114及び予測残差位置
系列115とともに送信部106から送信する。
予測残差を圧縮する方法はいろいろあげられるが。
たとえば予測残差を振幅の小さい順に間引いていく方法
がある。この方法については、武田、他゛′残差情報を
利用した音声合成法の検討″′、日本音響学会音声研究
会資料S 84−75に詳しく述べられている。
したがって1本実施例で明らかなように、対数圧縮の対
象となる予測残差の振幅情報は、あらかじめ、間引き等
の圧縮処理がほどこされていてもさしつかえない。
対数圧縮、指数伸長する方法は、いろいろと考えられる
が、たとえば、8ビツトのμ255の片側を使用し、振
幅レンジ13ビツトを7ビツトに圧縮、また、伸長する
ことが考えられる。
また、その実現手段としては、マイクロプロセッサやデ
ィジタル信号処理プロセッサで、変換値を計算する方法
、変換値をROMに記憶しておきテーブル参照により変
換する方法等がある。
次に、μ255の片側を使用し、マイクロプロセッサで
、変換値を計算する場合の手順を第4図乃至第9図を参
照して説明する。
第4図は音声符号化器の圧縮部でなされる手順のフロー
チャートであり、線形な振幅値を2進13ビツトで表わ
し、33を加えて第5図に示すようなデータを得た後、
μm1otsのセグメントを決定するために、先頭の1
のビット位置を求める。次に、3番目のブロックでセグ
メントを3ビツトの符号で表わすための変換を行なう。
そして最後に先頭の1に後続する4ビツトでセグメント
内の量子化レベルを決定し、合計7ビツトの圧縮された
第6図に示すデータを得る。
第7図は、音声復号化器における伸張部のフローチャー
トであり、圧縮された第8図に示す7ビツトを入力とし
、下位4ビツトを抽出し、1ビツト左シフトすることに
より2倍した後33を加える。
次にセグメントの情報である上位3ビツトを用いて、3
3加えた後のデータを左シフトして第9図のデータを得
、最後に33を引くことにより線形な2A進13ビツト
の振幅情報を得る。
このように、μ255で対数圧縮を行なった場合。
13ビツトの振幅レンジが7ビツトで表現できるので、
フレーム当り6ビツトのビットレートの低減が可能であ
る。これは、伝送速度8KBPS、フレーム長20m 
secの場合、4%程度のビットレートの低減に相当す
る。
音声の低ビットート化時には、LPG係数・残差情報等
の各種パラメータに割当てられるビット量が僅かとなる
ため、ビット割当の多・少で音質の良否が左右されるが
、本発明を適用して節約された情報ビットを他の重要な
パラメータの情報ビットに配布しなおすことが可能とな
り、優れた音質を得る効果を持ち、特に低ビツトレート
伝送に有益である。
〔発明の効果〕
本発明によれば、予測残差系列の振幅情報を対数圧縮し
て伝送するので、伝送ビットレートを低減することがで
きる。
【図面の簡単な説明】
第1図は本発明の第1実施例の構成図、第2図は本発明
の第2実施例の構成図、第3図は本発明の第3実施例の
構成図、第4図は対数圧縮手順フローチャート、第5図
は圧縮前データの説明図、第6図は圧縮後データの説明
図、第7図は伸長手順フローチャート、第8図は伸長前
データの説明図、第9図は伸長後データの説明図である
。 1・・・音声符号化器、2・・・音声復号化器、101
・・・AD変換部、102・・・フレームバッファ、1
03・・・LPG分析部、104・・・予測残差抽出部
、105・・・対数圧縮部、106・・・送信部、12
1・・・受信部、122・・・指数伸長部、123・・
・予測残差再生部、124・・・LPG合成部、125
・・・DA変換部。 代理人弁理士 秋  本  正  実 第1図 L−−−−−一−−−−一−−,−,,,,−一一−−
=−−=J第2図 L==−=、、−−=−−−−=====−J第3図 冒 第4図 第7図

Claims (1)

    【特許請求の範囲】
  1. 1、音声信号を一定時間長のフレームに分割し、各フレ
    ーム毎に、予測係数と予測残差系列の符号化を行う符号
    化手段と、該符号化出力データを入力として、音声信号
    を再生する復号化手段を有する音声符号化復号化装置に
    おいて、予測残差系列の振幅情報を対数圧縮して符号化
    する手段と、対数圧縮された振幅情報を指数伸長して復
    号化する手段とを設けたことを特徴とする音声符号化復
    号化装置
JP3090986A 1986-02-17 1986-02-17 音声符号化復号化装置 Pending JPS62189833A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3090986A JPS62189833A (ja) 1986-02-17 1986-02-17 音声符号化復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3090986A JPS62189833A (ja) 1986-02-17 1986-02-17 音声符号化復号化装置

Publications (1)

Publication Number Publication Date
JPS62189833A true JPS62189833A (ja) 1987-08-19

Family

ID=12316835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3090986A Pending JPS62189833A (ja) 1986-02-17 1986-02-17 音声符号化復号化装置

Country Status (1)

Country Link
JP (1) JPS62189833A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US7228272B2 (en) 2001-06-29 2007-06-05 Microsoft Corporation Continuous time warping for low bit-rate CELP coding

Similar Documents

Publication Publication Date Title
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
EP0785541B1 (en) Usage of voice activity detection for efficient coding of speech
US5251261A (en) Device for the digital recording and reproduction of speech signals
JP3446764B2 (ja) 音声合成システム及び音声合成サーバ
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
US7860711B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
JP2586043B2 (ja) マルチパルス符号化装置
JP2001242896A (ja) 音声符号化/復号装置およびその方法
US6792402B1 (en) Method and device for defining table of bit allocation in processing audio signals
JP3092653B2 (ja) 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
US8719012B2 (en) Methods and apparatus for coding digital audio signals using a filtered quantizing noise
JPS62189833A (ja) 音声符号化復号化装置
JP2797348B2 (ja) 音声符号化・復号化装置
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
US6134519A (en) Voice encoder for generating natural background noise
JP2004301954A (ja) 音響信号の階層符号化方法および階層復号化方法
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3149562B2 (ja) デジタル音声伝送装置
JPH07334197A (ja) 音声符号化装置
KR19990023449A (ko) 음성 압축/신장 방법 및 시스템
JP2853126B2 (ja) マルチパルス符号化装置
JPS60159800A (ja) 適応予測変換符号化方式