JP2914974B2 - 可変レート音声信号伝送方法および伝送システム - Google Patents

可変レート音声信号伝送方法および伝送システム

Info

Publication number
JP2914974B2
JP2914974B2 JP63023668A JP2366888A JP2914974B2 JP 2914974 B2 JP2914974 B2 JP 2914974B2 JP 63023668 A JP63023668 A JP 63023668A JP 2366888 A JP2366888 A JP 2366888A JP 2914974 B2 JP2914974 B2 JP 2914974B2
Authority
JP
Japan
Prior art keywords
data
bit
signal
input signal
sort
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63023668A
Other languages
English (en)
Other versions
JPS6453642A (en
Inventor
和弘 近藤
俊郎 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63023668A priority Critical patent/JP2914974B2/ja
Publication of JPS6453642A publication Critical patent/JPS6453642A/ja
Application granted granted Critical
Publication of JP2914974B2 publication Critical patent/JP2914974B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明の音声処理システムに関し、更に詳しくは、音
声信号の帯域を、要求される伝送伝送ビット・レートに
応じて可変にできる可変レート音声信号伝送方法および
システムに関する。
〔従来の技術〕
音声信号をディジタル通信システムを介して送信する
場合、伝送路の状態に応じて音声帯域を制御する可変レ
ート音声信号伝送技術が望まれる。
従来,音声の発生機構を考慮しない、波形符号化法に
よる可変レート音声符化化については、例えば、ザ・ベ
ル・システム・テクニカル・ジャーナル 第58巻 第3
号,1979年(The Bell System technical Journal Vol.5
8,No.3,March1979)の第577頁〜第600頁において論じら
れている。また、音声の発生機構をモデル化してデータ
圧縮を行なう生成源符号化法による可変レート音声符号
化については、例えば、電子通信学会技術研究報告SP86
−48(1986年)の第31頁〜第38頁に記載されている。
〔発明が解決しようとする課題〕
しかしながら、前者の波形符号化法による可変レート
音声符号化技術は、入力波形の各サンプルの量子化に用
いるビット数を伝送レートに応じて変えるようにしてい
るため、音声発生機構に起因する音声特有の冗長性を除
外することができず、例えば、32Kbps(bit per secon
d)以下の低いビット・レートの伝送システムでは、実
用的な圧縮音声信号を得ることが難かしい。一方、後者
の生成源符号化法による可変レート音声符号化技術は、
32Kbps以下で実用化に耐える圧縮音声信号を得ることが
できるが、上記文献に開示された符号化方式によれば、
例えば、ビット・レートが8Kbps以上ではAPC−MLQ方式
(Adaptive Predictive Coding with Muxium Likelihoo
d Quantization)を採用し、7.2Kbps以下では、APC−ML
Qアルゴリズムに基づいたベースバンド符号化方式と高
調波再生方式とを組み合せたハイブリッド符号化方式に
切換ている。即ち、ビット・レートに応じて圧縮処理の
アルゴリズムを切換えるようにしているため、符号器と
復号器の構成が複雑になるという問題があった。
本発明の目的は、符号化された音声信号を、データ圧
縮処理のアルゴリズムを変更することなく、可変の伝送
ビット・レートで送出できる音声信号伝送方法およびシ
ステムを提供することにある。
本発明の他の目的は、特に生成源符号法によりデータ
圧縮された音声信号を可変レートで送信するのに適した
音声信号伝送方法およびシステムを提供することにあ
る。
〔課題を解決するための手段〕
上記課題を解決するために、本発明による音声信号伝
送システムは、所定期間内に入力された音声信号を分析
して、入力音声の特徴を示す複数の符号化データに変換
する符号化手段と、上記符号化データを音声復号化にお
ける優先度の高い順に出力するための上記符号化手段に
結合されたデータ配列手段と、上記データ配列手段から
出力された符号化データの列を、その先頭から、指定さ
れた伝送ビット・レートに応じたデータ量だけ通過させ
る手段とからなることを特徴とする。
また、本発明による音声信号伝送方法は、所定期間内
に入力された音声信号を分析して、入力音声の特徴を示
す複数の符号化データに変換(第1ステップ)した後、
上記複数の符号データを音声の復号化における優先度の
高い順に配列し(第2ステップ)、上記配列された符号
化データを優先度の高いものから順に、伝送ビット・レ
ートに応じたデータ量だけ送出する(第3ステップ)よ
うにしたことを特徴とする。
上記符号化データの配列は、例えば、各符号化データ
をビット単位に分解し、優先度の高いビット順に再配列
する場合を含む。この場合、符号化データのビットの再
配列は、予め複数のソート・パターンを用意しておき、
入力音声信号に応じて選択した1つのソート・パターン
に基づいて行なうことができる。データビットの再配列
を複数種のソート・パターンで試み、得られたデータ列
のそれぞれについて、伝送レートに応じたビット・スチ
ールを行なった場合の復号化音声の劣化を予測し、最も
劣化の少ないビット配列のデータ列を採用するようにし
てもよい。
上記符号化データの配列は、特徴データ、あるいはパ
ラメータ単位に重要度の高いものから出力し、音質に与
える影響の小さいデータ、あるいはパラメータがビット
・スチールの対象となるようにしてもよい。例えば、或
る符号化アルゴリズムで入力音声を符号化して得られる
第1グループの符号化データからは、入力音声を完全に
は再生(合成)できず、誤差を生む場合、入力音声の符
号化の際に上記誤差を予め予測しておき、これを更に第
2グループの符号化データに変換して、第1グループの
符号化データと共に送信すれば、復号化音声の品質を一
層向上できる。この場合、音声の復号処理上の優先度は
第1グループの符号化データにあるから、これらを先に
出力し、第2グループの符号化データを後から出力する
ようにデータ配列すれば、伝送ビット・レートが制限さ
れたとき、第2グループの優先度の低い符号化データか
ら順にビット・スチールされる。
〔作用〕
上記符号化手段は、A/D変換器から所定のサンプリン
グ周期で入力されるディジタル音声信号をストアし、1
フレーム期間内に入力された複数のサンプル信号から、
入力音声の特徴を分析する。
上記符号化手段としては、生成源符号化法による符号
器を利用することが好ましい。生成源符号化方式では、
各フレーム毎に、音声信号の周波数スペクトル、音声信
号のピッチ、各ピッチの特徴を示す音源情報などの特徴
パラメータを抽出する。生成源符号化システムの典形
は、パーコール(PARCOR:Partial Autcorrelation,偏相
関係数)方式として知られている。PARCOR方式では、各
フレーム毎に有声・無声の判定を行ない、音声合成時の
音源として、無声フレームでは白色雑音、有声フレーム
ではピッチ周期毎に単1のパルスを用いるようにしてお
り、音源を単純化しているためにデータ量を圧縮できる
反面、音質の劣化が大きいが、音質の劣化は、1ピッチ
周期当り複数本の音源パルスを用いる方式の符号器を採
用することにより改善できる。音源を示すパルス数を増
やすと、特徴パラメータの数が増えてデータ量が大とな
るが、本発明によれば、これらの特徴パラメータの優先
度に従って符号化データを配列することにより、ビット
・レートに応じた音声品質の改善を図れる。各符号化デ
ータをビット単位で分解して再配列することにより、高
優先度のパラメータには充分なビット長を与え、低優先
度のパラメータはビット・スチールにより数値を下げる
ようにすることもできる。
〔実施例〕
第1図は、本発明による音声符号/復号化システムの
全体構成を示すブロック図である。
音声信号S1は、所定の時間々隔ΔT(例えば、125μs
ec)でサンプリングされ、ディジタル信号SINとして符
号化ユニット1に入力される。符号化ユニット1は、後
述する生成源符号化方式による帯域圧縮コーダを有し、
所定期間T(例えば20msec)内に入力されるN(=16
0)サンプル分の入力信号SINから入力音声の特徴を抽出
し、複数のパラメータからなる符号化データに変換す
る。本発明では、上記符号化ユニット1において、上記
符号化データを構成するパラメータ、あるいは各パラメ
ータを構成するビットを、音質に与える影響の高い順に
配列したデータ列S2として出力させる。図示された例で
は、符号化ユニット1からは、優先度順に並べられたデ
ータ要素C1〜Cmからなる長さLのデータ列S2が出力さ
れ、これが伝送データ量制御用のビット・スチーラ2に
入力される。ビット・スチーラ2は、入力データ列S2
先頭から、ビット・レート制御信号BRで指示された長さ
L′のデータS3を伝送路3に送出し、L′を超える部分
は削除する。
一方、伝送路3を介して他の装置から受信された符号
化音声信号S3は、ビット・フィラー4に入力され、送信
時に削除されたデータ列S2の下位ビット部分に“0"を充
填した形のデータ列S4に変換された後、復号化ユニット
5に入力される。
復号化ユニット5は、データ列S4から音声信号の各パ
ラメータを抽出し、これらのパラメータに基づいて音声
を復号化する。復号化された音声信号S5は、ビット・ス
チールによる劣化を受けるが、ビット・スチールは音質
への影響の少ないパラメータ、あるいはビットから順に
行なわれているため、本発明によれば、ビット・レート
に応じた最適な再生音声を得ることができる。
符号化ユニット1は、例えば第2図に示す如く、残差
圧縮法によるコーダ11と、パラメータ変換器12と、ビッ
トソータ13とで構成できる。
残差圧縮法は、生成源符号化の1つであり、例えば20
msecの期間(フレーム)内の入力音声波形を分析して、
周波数スペクトル情報(スペクトル包絡特性)と、入力
音声信号から上記スペクトル包絡特性を取り除いて得ら
れるパルス列(残差信号)からなる音源情報とに分離
し、複数の残差パルスを選択的に抽出するようにしたも
のであり、この方式に基づくコーダ、デコーダについて
は、例えば、特開昭60−150110号公報に述べられてい
る。
第2図の残差圧縮コーダ11は、入力音声信号SINを、
音声スペクトル包絡特性を表わすスペクトル・パラメー
タ(k)と、残差信号(残差パルス)を圧縮して得られ
る励起残差信号(r)と、音声信号のピッチやパワーな
どを表わす補助情報(a)との3つのパラメータからな
る符号化データに変換する。スペクトル・パラメータ
(k)は、そのフレーム中に含まれる音韻を表わすもの
であり、この例では、第3A図に示す如く、それぞれ3ビ
ットからなる2つのパラメータk1,k2が選ばれる。励起
残差信号(r)は、声の「ざらつき」や「かすれ」のよ
うな個人的特徴を示すパラメータであり、例えば第3B図
の如く、それぞれ2ビットからなる3つのパラメータが
選ばれる。また、補助情報(a)は、第3C図に示す如
く、それぞれ4ビットからなる2つのパラメータが選ば
れる。実際の応用においては、パラメータkとrの個数
とビット数はもっと多いが、ここでは、説明の都合上、
少数に留めてある。
これらのパラメータからなる圧縮データは、パラメー
タ変換器に入力され、後段のビット・スチーラで下位ビ
ットを除去しても音質への影響が少なくなるデータ形式
k′,r′,a′に変換される。
例えば、スペクトル・パラメータkは、残差圧縮コー
ダ11では偏相関係数の形で求められるが、この偏相関係
数を線スペクトル(LSP:Line Spectrum Pair)で表わす
と、ビット数削減による音質劣化を少なくできることが
知られている。尚、偏相関係数、LSPに関しては、例え
ば、中田和男著、「音声情報処理の基礎」、オーム社
(1981年)に詳述されている。
また、励起残差信号rや補助情報aは、一般には「2
の補数」で表現されることが多いが、このように「2の
補数」表現された数値データの下位ビットを削除する
と、負方向の誤差を生じてしまうため、下位ビット削除
によりデータ圧縮したパラメータを用いて計算を行なう
と、負方向の誤差が累積されて誤差(音質の劣化)が拡
大する。これに対し、上記各パラメータr,aを符号ビッ
ト付きの絶対値表現式に直すと、下位ビットを削除して
も、絶対値が小さくなる方向に誤差が生ずるだけであ
り、例えば、量子化前に平均値が零のデータであれば、
下位ビットを削除後の平均値も零となり、「2の補数」
表現の場合のような誤差の累積を生じない。パラメータ
変換器には、残差圧縮コーダ11の出力パラメータk,r,a
を上述したビット・スチールによる影響の少ないデータ
表示形式のパラメータk′,r′,a′に変換する。
ビット・ソータ13は、パラメータk′,r′,a′をビッ
ト単位に分解し、音質に与える影響が少ないビットほど
下位に位置するような順序に並べ換える。この場合、各
パラメータが再生後の音質に与える影響の度合いは、当
該フレームに含まれる入力音声の種類によって異なる。
従って、ビット・ソータ13には、予め複数種類のソート
形式を用意しておき、フレーム毎に入力音声の種類に応
じたソート形式を選択して、上述したビット・ソート処
理を行なわせることが望ましい。
第4図は、ビット・ソート後のデータ列S2の1例であ
り、その先頭に位置するIDは、このデータ列に適用され
たソート形式を示すための識別子である。このデータ列
S2は、ビット・スチーラ2により下位ビット(この例で
は6ビット)が削除され、第5図に示す短縮されたデー
タ列S3として伝送路に送出される。第6図は、受信側に
おいて、ビット・フィラー4により、下位ビットに“0"
を充填した状態のデータ列S4を示す。
第7図は、第2図の構成をもつ符号化ユニット1と対
をなす復号化ユニット5の構成を示すブロック図であ
る。この復号化ユニット5は、データ列S4に含まれるソ
ート形式IDに基づいて、データ列S2の各ビットの順序を
並べ換え、第8A図〜第8C図に示す如く、各パラメータ
k1′〜a2′を再現する逆ビット・ソータ14と、上記逆ビ
ット・ソータ14から出力されるLSP表示形式のパラメー
タk1′,k2′、あるいは符号ビット付き絶対値表現形式
のパラメータr1′〜a2′を、それぞれ偏相関係数のパラ
メータk1″,k2″,あるいは「2の補数」表現形式のパ
ラメータr1″〜a2″に戻すためのパラメータ逆変換器15
と、これらの逆変換されたパラメータを用いて音声信号
を再生する残差圧縮デコーダ16とからなる。
上述した符号化ユニット1における残差圧縮コーダ11
とパラメータ変換器12,復号化ユニット5におけるパラ
メータ変換器15と残差圧縮デコーダ16には従来公知のも
のを適用できる。以下、本発明の主要部となるビット・
ソータ13と逆ビット・ソータ14の構成について述べる。
第9図と第10図はビット・ソータ13の構成の1例を示
すブロック図である。
ビット・ソータ13には、パラメータ変換器12からの各
パラメータk′,r′,a′の他に、125μsec毎にサンプリ
ングされた音声信号SINが入力される。SINは、第9図に
示す如く、2つのゲート21A、又は21Bを介して、メモリ
22Aまたは22Bに入力される。ゲート21A,21Bは、制御回
路30から出力される制御信号WEA,WEBにより、1フレー
ム期間T(例えば20msec)ずつ交互に開かれる。メモリ
22Aと22Bには、それぞれゲート21Aと21Bに同期して開か
れるゲート23A,23Bを介して、制御回路30から書込みア
ドレスWAとライト・イネーブル信号が与えられている。
また、これらのメモリには、ゲート24A,24Bを介して、
読出しアドレスRAと、出力イネーブル信号Rとが与えら
れている。書込みアドレスWAは、音声信号SINのサンプ
リング・クロックSCLに同期して再新され、この結果、
1フレーム期間中の160サンプルの音声信号が一方のメ
モリに順次に書込まれ、次のフレーム期間中の音声信号
が他方のメモリに順次に書込まれる。ゲート24Aと24B
は、制御信号WEA,WEBと逆位相の制御信号REA,REBにより
開かれる。従って、一方のメモリ、例えば、22Aで書込
みが行なわれている間に、他方のメモリ22Bから1フレ
ーム前の音声信号が読み出され、読み出された音声信号
はセレクタ25を介して、信号線29に出力される。読出し
アドレスWAの更新を、サンプリング・クロックSCLのn
倍の周期で行なうことにより、1フレーム分の音声信号
がメモリ22Aに入力されている間に、他方のメモリ22Bの
音声信号をn回繰り返して信号線29に読み出すことがで
きる。制御回路30は、上述した制御信号の他に、第10図
に示す回路の動作に必要な各種の制御信号を発生する。
パラメータ変換器12から出力されたパラメータk′,
r′,a′は、第10図に示す如く、パラメータ毎に用意さ
れたラッチ回路40に取り込まれる。この実施例では、ビ
ット・スチールにも音質劣化の少ない最適なビット・ソ
ート形式を見つけるために、先ず入力音声の種別を概略
的に判定し、判定結果に従って選択したソート形式で上
記パラメータをソートする。50は、音声種別の判定に用
いる代表的な複数種類の音声のテンプレート・データを
記憶しておくためのROMであり、このROMは、スペクトル
・パラメータ・テンプレートを記憶するためのROM:50K
と、励起残差テンプレートを記憶するためのROM:50R
と、補助情報テンプレートを記憶するためのROM:50Aと
からなる。各ROMからのデータの読出しは、制御回路30
からのリード信号TRとアドレス信号TAにより行なわれ
る。例えば、4種類の音声についてテンプレートが用意
されている場合、第1のテンプレートについて、〔k1,r
1,a1〕,〔k2,r2,a2〕,〔r3〕の順で各パラメータの値
を読み出し、音声種別判定回路51において、これらのパ
ラメータとラッチ回路40の入力音声パラメータとを比較
する。そして、上記第1のテンプレートの全パラメータ
と入力音声パラメータとの比較が終了すると、次のテン
プレートについての各パラメータの読み出しを行ない、
これを繰り返すことにより、入力音声に最も近い音声種
類を見つけ出す。
音声種別判定回路51は、パラメータ別の3つの距離計
算回路51K,51R,51Aを備する。距離計算回路51Kは、例え
ば第11図に示す如く、ラッチ回路40から入力されるパラ
メータの値と、ROM:50Kから読み出さたテンプレートの
パラメータの値との差を求める回路60と、2つのパラメ
ータk1′,k2′について求めた上記差の値を累計するた
めの加算回路61とラッチ回路62とからなる。距離計算回
路51A,51Rも上記51Kと同様の構成であり、それぞれ、パ
ラメータの数に応じた差分累計動作を行なう。尚、ラッ
チ回路62は、テンプレート切換えの都度、リセット信号
φR1によりリセットされ、差分累計動作の都度、クロッ
クφSLにより累計結果を取り込むよう動作する。
音声種類別判定回路51において、各距離計算回路51K
〜51Aの出力値は、パラメータ毎に重み付けされ、その
和が加算器52により求められる。上記加算器52の出力値
は、音声種別の判定データ52Sとしてソート・パターン
判定回路53に入力される。
判定回路53は、例えば第12図に示す如く、ラッチ回路
64と、判定データ52Sと上記ラッチ回路64の内容とを比
較する比較器63とを有し、ラッチ回路64には、フレーム
切替時に初期値発生回路65から最大値をもつ初期値がセ
ットされ、このラッチ回路64の値より小さい値をもつ判
定データが入力された時、比較器63が出力するラッチ指
示信号63Sによって上記判定データ52Sがラッチ回路64に
取り込まれるようになっている。上記判定回路53は、更
に、テンプレートの切替えの都度入力されるクロック信
号φIDをカウントするためのカウンタ66と、上記ラッチ
指示信号63Sに広答して上記カウンタ66の値を取り込む
第2のラッチ回路67とを備える。かかる構成により、第
2のラッチ回路67には、ROM50に用意された複数のテン
プレートのうち、入力音声と最も近いテンプレートの識
別番号ID1が記憶されることになる。
ROM54は、テンプレート識別番号ID1に対応させて、音
声データのビット配列順序を示す複数のソート・パター
ンを記憶している。この実施例では、1つのテンプレー
ト番号に対して、ROM54に複数種類のソート・パターン
が用意してあり、各ソート・パターンは20個のビット・
パターンからなる。各ビット・パターンは1つの“1"ビ
ットと、6つの“0"ビットからなる。ROM54からのビッ
トパターンの読み出しは、判定回路53から出力されるテ
ンプレート識別番号ID1を上位アドレス、カウンタ55の
出力を中位アドレス、カウンタ56の出力を下位アドレス
として行なわれる。カウンタ55は、メモリ22Aまたは22B
から1フレーム分の音声データの読出し終了の都度発す
るクロックCL1をカウントし,上記識別番号ID1に対応し
て用意された複数のソートパターンを順次にアドレスす
る。一方、カウンタ56はクロックCL2をカウントし、各
ソート・パターンを構成する20個の7ビットパターンを
順次にアドレスする。
上記ROM54から読み出されたビットパターンは、各ビ
ットと対応して設けられた7個のパラレル/シリア変換
器41にシフトクロックとして供給されると共に,ビット
ソータ42を構成する7個のスイッチに制御信号として供
給される。PS変換器41はクロックφP2に応答してラッチ
回路40の各パラメータを取り込み、ビットパターン中の
“1"のビットで指定された1つのパラメータを1ビット
だけシフトし、ビット・ソータ42に出力する。この時、
ビット・ソータ42は、シフトクロックを与えられたPS変
換器と対応するスイッチがオン状態となっているため、
PS変換器の出力ビットがビット・ソータ42の出力42Sと
なって、局部ビット・スチーラ43とソートデータメモリ
48に入力される。ROM54からはクロックCL2に同期して次
々とビット・パターンが読み出され、これによってPS変
換器41内のパラメータが1ビットずつ出力されて局部ビ
ット・スチーラ43に供給される。局部ビット・スチーラ
43は、クロックCL3がオン状態にある間、ビット・ソー
スの出力42Sを後段の局部デコーダ44に伝え、クロックC
L3がオフ状態になると、ビート・ソータ出力の通過を阻
止して“0"ビットを出力する。クロックCL3のオン期間
はビットレートに比例しているために、局部ビット・ス
チーラの出力43Sは第1図のデータ列S4のような形とな
る。
本実施例では、テンプレート識別番号ID1に対応させ
て予めROM54内に用意した複数のソート・パターンを適
用して、ラッチ回路40に保持されたパラメータに対する
種々のビット・ソートを試み、ビット・スチール後の音
質劣化が最小となるビット配列で圧縮データを出力させ
ることを意図している。局部ビット・スチーラ43の出力
を受ける局部デコーダ44は、第1図の復号化ユニット5
と同様の動作をして、各ソート・パターン毎の局部復号
音声信号44Sを出力する。上記局部復号音声信号44Sは、
メモリ22Aまたは22Bから読み出された当該フレームの原
音声信号と共にS/N計算回路46に入力され、得られたS/N
値は最大値検出回路47に入力される。最大値検出回路47
は既に記憶しているS/N値(初期値は零)と入力されたS
/N値とを比較し、入力値が大きい場合にこれを記憶する
と共に、ラッチ信号信号47Sをソート・データメモリ48
とソートIDメモリ49に与える。上記ソートデータメモリ
48は例えば、ビット・ソータ42から出力されるシリアル
データをクロックφSCMに同期して受け取るシフトレジ
スタと、ラッチ信号47Sに応答して上記シフトレジスタ
の内容を取り込むラッチ回路とから構成され、複数のソ
ート結果のうちで最良のS/Nが得られるビット配列をも
つ圧縮音声データを記憶する。一方、ソートIDメモリ49
にはカウンタ55の出力が入力されており、上記最良のS/
Nを与えるソートパターンの識別番号の下位アドレスID2
を記憶する。
第14図に上述したビット・ソータ動作に関係する主要
な信号のタイムチャートを示す。
φP1はラッチ回路40に与えるラッチ指示パルスであ
り、このパルスはフレーム期間Tに相当する時間間隔で
与えられる。φP2はPS変換器41に与えるラッチ指示パル
スであり、各フレーム毎にソート・パターンの読出し回
数に等しいn個のパルスが出力される。テンプレートを
用いた入力音声の識別判定はφP2が出力されてから1個
目のφP2が出力されるまでの期間内に実行される。クロ
ックCL1〜CL3は、φP2の出力間隔内で図の如く与えられ
る。Bk1〜Ba2はROM54から読み出されるビット・パター
ンを示す。
各フレームにおいて、ROM54からは互いに異なったビ
ット・パターンの組合せを持つn種のソート・パターン
が読み出されるため、ソートデータメモリ48には、n種
類のソート・データ42Sのうち、ビット・レートに応じ
た圧縮(ビット・スチール)を施しても音質劣化が最も
少ないビット配列をもつソート結果が保持されることに
なる。ソートデータメモリ48に保持されたソート・デー
タと、ソートIDメモリ49に保持されたID2と、判定回路5
3に保持されたIDは、上述したn種類のソート・パター
ンによる局所的なビット・ソート処理が終了した時点で
出力されるクロックφに応答して、シフトレジスタ54
に並列的に入力され、クロックφに従って順次に出力
されてデータ列S2となる。この場合、第4図に示したソ
ート形式識別子IDは、上記ID1を上位ビット、ID2を下位
ビットとして組み合せたものとなる。
第15図に、第7図で説明した逆ビット・ソータ14の具
体的な構成の1例を示す。図において、70K1〜70R3は、
それぞれパラメータk1,k2,a1,a2,r1,r2,r3に対応して用
意されたシフトレジスタ、71はソート形式識別子IDを保
持するためのシフトレジスタ、72は上記シフトレジスタ
70K1〜70R3を駆動するためのIDに応じた複数のビット・
パターンを予め記憶しているROMであり、31は、上位装
置(例えば、通信制御装置)からの起動信信FRと同期ク
ロックφに基づいて各種の制御信号を作り出す制御回
路である。
ビット・ファラー3から出力されたデータ列S4は、同
期クロックφに同期して、第16図に示す如く入力され
る。制御回路31は、起動信号FRを受けると、同期クロッ
クφに同期したラッチパルスSIDをシフトレジスタ71
に与える。ラッチパルスSIDの出力回数は、データ列S4
に含まれるソート形式識別子IDのビット数に合せてあ
り、この例では、IDはSID1〜SID3の3ビットからなって
いる。シフトレジスタ71は、上記ラッチパルスに応答し
て、データ列S4の上位3ビットを取り込み、これらのビ
ットを並列的に出力する。
制御回路31は、IDのビット数に等しいラッチパルスSI
Dの出力を終えると、同期クロックφに同期してクロ
ックφとアドレスADを出力する。上記アドレスADは、
シフトレジスタ71の出力ビットSID1〜SID3と共にROM72
にアドレス信号として与えられ、クロックφはROM72
に読出し信号として与えられる。ROMD72は、アドレスの
上位ビットSID1〜SID3の組み合せに対応する複数のソー
ト・パターンを有し、SID1〜SID3で特定された1つのソ
ート・パターンを構成する複数のビット・パターンがア
ドレスADに応じて順次に読出される。1つのビット・パ
ターンは7ビットからなり、それぞれの出力ビットがシ
フトレジスタ70K1〜70R3のラッチ信号Sk1〜Sr3となる。
各ビットパターンは、第10図のROM54と同様、1つの
“1"ビットと、6つの“0"ビットからなり、データ列S4
の入力に同期していずれか1つのシフトレジスタが入力
信号を取り込む。これらのビット・パターンにより、例
えば、第16図のID以降の入力データ列S4に対して、ラッ
チ信号sk1は第1、第8、第12ビット目でシフトレジス
タ70K1を動作させ、ラッチ信号Sk2は第2、第13ビット
目でシフトレジスタ70K2を動作させる。この結果、シフ
トレジスタ70K1にはパラメータk1′(k13′,k12′,
k11′)が順次に取り込まれ、シフトレジスタ70K2には
パラメータk2′(k23′,k22′,k21′)が順次に取り込
まれる。他のシフトレジスタ70A1〜70R3も同様に動作
し、それぞれに対応するパラメータa1′〜r3′を取り込
む。これらのシフトレジスタに取り込まれたパラメータ
の各ビットは並列的に出力され、第7図に示すパラメー
タk′,r′,a′としてパラメータ逆変数器15に入力され
る。
尚、以上の実施例の説明において、ビット・フィラー
4は、帯域圧縮のために削除された全てのビット位置に
“0"ビットを挿入していたが、これらのビット位置に結
果的に各パラメータの値を四捨五入したに等しくなるよ
うなビット情報を与えるようにしてもよい。
上記実施例は、本発明を残差圧縮法による音声符号化
に適用した例であるが、上述したビット・ソートによる
可変レート音声符号化は、残差圧縮以外の生成源符号化
システム、例えば、CK,Un and DT Megill,“The Residu
al Excited Linear Prediction Vocoder with transmis
sion rate below 9.6 KBPS"IEEE Trans.COM−23,1975 p
p1466−1473に記載されたRELP方式や、B.S.Atal et al,
“A New Model of LPC Excitaton for Producing Natur
al Sounding Speech at Low Bit Rates"Proceeding ICA
SSP 82,pp614−617(1982)に記載されたマルチ・パル
ス方式、あるいはM.Honda et al,“Bit Allocation in
Time and Frequency Domains for Predictive Coding o
f Speech"IEEE Transaction Acoustics Speech and Sig
nal Processing.Vol.ASSP−32,pp465−473,June 1984に
記載されたAPC−AB方式などによる音声符号化にも適用
できる。
また、波形符号化法による音声符号化においても、例
えば、1フレーム期間に得られた複数サンプルの音声デ
ータを1時的にストアしておき、全サンプルについて最
上位ビット、あるいは上位の数ビットを順次に出力し、
次いで、これに続く下位ビットを順次に出力し、最後に
最下位ビットを順次に送り出すことにより、ビット・ス
チーラで可変レートのデータ圧縮をかけることができ
る。
次に、本発明を適用した符号化ユニット1の第2の実
施例を第17図により説明する。この実施例は、ビット・
ソータを用いることなく、重要度の高いパラメータから
順次に出力できるようにした例である。
音声信号SINは遅延バッファ80と、PARCORコーダ81に
入力される。PARCORコーダ81は、1フレーム期間T内に
入力される複数サンプルの音声信号を分析し、該フレー
ムに含まれる音声の特徴を、例えば、PARCOR係数(P
C)、ピッチ周期(PP)、有声/無声フラグ(FLG)、残
差電力(RP)などのパラメータに変換することにより、
圧縮符号化するこれらのパラメータは、信号線81A〜81D
を介して、シフトレジスタ90と局部PARCORデコーダ82に
入力される。ピッチ周期PPは、回路85と86にも入力され
る。局部PARCORデコーダ82は、上記各パラメータに基づ
いて音声信号を再生する。再生された音声信号82Sは、
遅延バッファ80にストアされていた原音声信号と共に差
分抽出回路83に入力され、PARCOR符号化における誤差信
号83Sが求められる。
上記誤差信号83Sは、前述の残差信号に相当するもの
であり、第2の遅延バッファ84と残差パルス間引き回路
85に順次に入力される。残差パルス間引き回路85では、
例えば、前述の特開昭60−150110号公報に記載された方
法により、1つのピッチ周期内における大きな振幅をも
つ複数の代表残差パルスを抽出する。上記代表残差パル
スの抽出は、例えば、特願昭60−137721号明細書に記載
されているように、ピッチ周期内の振幅の大きい部分に
含まれる残差パルスを連続的に抽出するようにしてもよ
い。
このようにして求めた代表残差パルスを示す信号は、
信号線85に入力される。残差パルス補間回路86は、入力
された代表残差パルス信号と、予めPARCORコーダ81から
入力されているピッチ周期PPに基づいて、1フレーム期
間内の残差パルスを生成する。生成された残差パルス
は、遅延バッファ84にストアされていた誤差信号と共の
第2の差分抽出回路87に入力され、誤差信号87Sが求め
られる。
上記誤差信号87Sはベクトル量子化回路88に入力され
る。ベクトル量子化回路88は、コードメモリ89に予め用
意されているベクトルデータと入力信号とを比較し、最
も近いベクトルデータの指数を信号線88Sを介してシフ
トレジスタ90に出力する。尚、この種のベクトル量子化
回路88については、例えば、アイ・イー・イー・イー・
エス・ピー・マガジン 第1巻、第2号,1984年(IEEE
ASSP Magazine Voll,No.2,p4〜29)において論じられて
いる。
シフトレジスタ90は、上記各種のデータを優先度順の
配列で受け取り、制御回路91からのシフトクロックSCに
より、優先度の高いパラメータから順に第18図のフォー
マットでデータ列S2を出力する。尚、シフトレジスタ90
以外の各回路の動作も、上記制御装置91からの制御信号
91Sにより制御されている。上記データ列S2は、符号化
ユニットに接続されたビット・ステーラ2によって、ビ
ット・レートを超えたデータ部分が削除される。この場
合、ビットステーラ2には重要度の高い順に各種のパラ
メータが入力されているので、ビット・ステーラはビッ
ト・レートに応じた期間内の受信データのみを通過させ
るだけで可変レート音声圧縮をできる。
第19図は、第18図の符号器と対応する復号化ユニット
5の構成を示す。受信器側で、ビット・フィラー4を通
過した信号S4は、各パラメータに対応して設けられた複
数のシフトレジスタ100A〜102に入力される。これらシ
フトレジスタは、制御回路110から与えられるラッチ信
号LPにより、それぞれ所定のタイミングで入力信号S4を
取り込む。シフトレジスタ100A〜100Dは、それぞれPARC
OR係数、ピッチ周期、有声/無声フラグ、残差電力を示
すパラメータを受け取る。これらのパラメータは、所定
のタイミングでPARCORデコーダ104に入力され、復号化
される。シフトレジスタ101は、代表残差パルスを示す
パラメータを取り込み、これを残差パルス補間回路105
に渡す。同様に、シフトレジスタ102は、ベクトル指数
を取り込み、これをベクトル逆量子化器106に渡す。残
差パルス補間回路105は、PRACOR符号化による誤差を補
なう復号信号を出力し、ベクトル逆量子化器106は、コ
ードメモリ107から入力ベクトル指数と適応するベクト
ルデータを読み出して、これを出力する。これらの各復
号結果は、制御回路110からの同期クロックCSに同期し
て順次に出力され、加算器108で加算されて復号音声信
号Soutとなる。許容されるビット・レートが高く、入力
信号S4が全てのパラメータについて有効データを含む場
合、出力信号Soutは極めて誤差分の少ない高品質の音声
となる。ビット・レートが低くなるに従がい、先ずベク
トル逆量子化器106の出力、次いで残差パルス補間回路1
05の出力が無効となって徐々に音質が劣化するが、この
方式は、PARCOR方式による符号化ビット・レートを最小
値とする(例えば4.8Kbit/sec)可変レート・データ圧
縮に有効である。
〔発明の効果〕
以上の説明から明らかな如く、本発明によれば圧縮音
声データを音質に与える影響を考慮して配列し、伝送ビ
ットレートに応じた量だけ優先度の高いデータ(あるい
はビット)から順に送り出すようにしているため、圧縮
アルゴリズムを変更することなく可変レートで音声信号
を伝送することができる。
【図面の簡単な説明】
第1図は本発明による可変音声符号化/復号化システム
の全体構成と動作の概要を説明するための図、 第2図は、第1図における符号化ユニット1の1実施例
を示すブロック図、 第3A図〜第3C図は、それぞれ符号化データの構成を示す
図、 第4図は、ビット・ソータ13から出力されるデータ列S2
を示す図、 第5図は、ビット・スチールされたデータ列S3を示す
図、 第6図はビット・フィラー4から出力されるデータ列S4
を示す図、 第7図は、第1図における復号化ユニット5の1実施例
を示すブロック図、 第8A図〜第8C図は、それぞれ逆ビット・ソータ14により
再生された符号化データの構成を示す図、 第9図と第10図は、第2図のビット・ソータ13の具体的
な構成の一例を示すブロック図、 第11図は、第10図の距離計算回路51Kの構成図、 第12図は、第10図のソート・パターン判定回路の構成
図、 第13図は、第10図のソートデータメモリ48の構成図、 第14図は、第10図の回路動作を説明するための信号タイ
ムチャート、 第15図は、第7図の逆ビット・ソータ14の具体的な構成
の1例を示すブロック図、 第16図は、第15図の回路動作を説明するための信号タイ
ムチャート、 第17図は、符号化ユニット1の他の実施例を示すブロッ
ク図、 第18図は、上記第17図の符号化ユニットから出力される
符号化データS2のフォーマットを示す図、 第19図は、上記第17図の符号化ユニットと対をなす復号
化ユニットの1実施例を示すブロック図である。 符号の説明 1:符号化ユニット 2:ビット・スチーラ 3:伝送路 4:ビット・フィラー 5:復号化ユニット

Claims (11)

    (57)【特許請求の範囲】
  1. 【請求項1】所定期間内に入力された入力信号を分析し
    て、前記入力信号の特徴を示す第1グループの複数の符
    号化データに変換するステップと、 前記第1グループの複数の符号化データに基づいて再生
    される信号と入力信号との差に相当する誤差信号を求め
    るステップと、 前記誤差信号を第2グループの符号化データに変換する
    ステップと、 前記第1グループの複数の符号化データを高優先度、前
    記第2グループの符号化データを低優先度とするステッ
    プと、 前記符号化データを優先度の高いものから順に伝送レー
    トに応じたデータ量を送出するステップを有することを
    特徴とする可変レート信号伝送方法。
  2. 【請求項2】所定期間内に入力された入力信号を分析し
    て、前記入力信号の特徴を示す複数の符号化データに変
    換する第1ステップと、 前記複数の符号化データをビット単位に分解し、予め用
    意された複数のソート・パターンから前記入力信号に基
    づいて選ばれたソート・パターンに基づいて、優先度の
    高いビット順に並べ換えする第2ステップと、 前記並べ換えられた符号化データを順に伝送ビット・レ
    ートに応じたデータ量を送出する第3ステップを有する
    ことを特徴とする可変レート信号伝送方法。
  3. 【請求項3】前記並べ換えが施されたビットからなるデ
    ータ列が、前記並べ換えに適用されたソート・パターン
    の識別データに続く形で送出されることを特徴とする請
    求項2記載の可変レート信号伝送方法。
  4. 【請求項4】前記第2ステップは、前記符号化データの
    ビットを、予め用意された複数のソート・パターンを順
    次に適用して、ビット配列の異なる複数のデータ列を作
    るステップと、前記各データ列について、前記伝送ビッ
    ト・レートにより圧縮した場合の複合信号の劣化を評価
    し、ソート・パターンを選ぶステップを有し、 前記第3ステップは、前記選ばれたソート・パターンを
    適用して得られたデータ列に対して行われることを特徴
    とする請求項2記載の可変レート信号伝送方法。
  5. 【請求項5】前記選ばれたソート・パターンを適用して
    得られた伝送されるデータ列が、前記適用されたソート
    ・パターンの識別データに続く形で送出されることを特
    徴とする請求項4記載の可変レート信号伝送方法。
  6. 【請求項6】前記第2ステップが、前記入力信号の種別
    を判別するステップを有し、前記ビット配列の異なる複
    数のデータ列の作成が、前記判別結果に基づいて選択さ
    れた複数のソート・パターンに従って行われることを特
    徴とする請求項4記載の可変レート信号伝送方法。
  7. 【請求項7】入力信号を所定の符号化アルゴリズムで第
    1グループの複数の符号化データに変換する第1の符号
    手段と、前記第1グループの符号化データで再生される
    信号と前記入力信号との間に生ずる誤差信号を求める手
    段と、前記誤差信号を第2グループの符号化データに変
    換する第2の符号化手段とを有し、所定期間内に入力さ
    れた入力信号を分析して入力信号の特徴を示す複数の符
    号化データに変換する符号化手段と、 前記符号化手段に結合され、前記第1グループの符号化
    データを出力した後に、前記第2グループの符号化デー
    タを出力することで、優先度の高い順に符号化データを
    並べ換えるデータ配列手段と、 前記データ配列手段から出力された符号化データの列
    を、その先頭から、指定された伝送ビット・レートに応
    じたデータ量を通過させる手段を有する可変レート信号
    伝送システム。
  8. 【請求項8】所定期間内に入力された入力信号を分析し
    て、前記入力信号の特徴を示す複数の符号化データに変
    換する符号化手段と、 前記符号化手段に結合され、前記符号化データを優先度
    の高い順に出力するデータ配列手段と、 前記データ配列手段から出力された符号化データの列
    を、その先頭から、指定された伝送ビット・レートに応
    じたデータ量を通過させる手段とを有し、 ここで、前記データ配列手段が、予め用意された複数の
    ソート・パターンを記憶するためのメモリ手段と、前記
    複数の符号化データをビット単位に分解して、前記入力
    信号に応じて前記メモリ手段から読み出した1つのソー
    ト・パターンに従って、前記ビットの並べ換えをする並
    べ換え手段を有する可変レート信号伝送システム。
  9. 【請求項9】所定期間内に入力された入力信号を分析し
    て、前記入力信号の特徴を示す複数の符号化データに変
    換する符号化手段、 前記符号化手段に結合され、複数のソート・パターンを
    記憶するためのメモリ手段と、前記入力信号に応じて前
    記メモリ手段から選択的に読み出された複数のソート・
    パターンを適用して、前記複数の符号化データをビット
    単位に分解し並べ換え、ビット配列の異なる複数のデー
    タ列を出力する並べ換え手段と、および、前記ビット配
    列の異なる複数のデータ列の中から、前記指定のビット
    レートでデータ量を削減した場合に、最も信号劣化の少
    ないであろう1つのデータ列を選択する手段とを有する
    データ配列手段、 及び、 前記データ配列手段から出力された符号化データの列
    を、その先頭から、指定された伝送ビット・レートに応
    じたデータ量を通過させる手段を有する可変レート信号
    伝送システム。
  10. 【請求項10】前記データ配列手段が、前記選択された
    データ列と対応するソート・パターンの識別情報を該デ
    ータ列と共に出力する手段を有する請求項9記載の可変
    レート信号伝送システム。
  11. 【請求項11】前記データ配列手段が、入力信号を予め
    定められた複数の区分の1つに分類する分類手段を有
    し、前記メモリ手段が前記区分毎に複数のソート・パタ
    ーンを記憶し、前記並べ換え手段が、前記分類手段の分
    類結果に基づいて、データビット並べ換えのための前記
    複数のソート・パターンを前記メモリから読み出す請求
    項9記載の可変レート信号伝送システム。
JP63023668A 1987-02-27 1988-02-05 可変レート音声信号伝送方法および伝送システム Expired - Lifetime JP2914974B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63023668A JP2914974B2 (ja) 1987-02-27 1988-02-05 可変レート音声信号伝送方法および伝送システム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4255487 1987-02-27
JP62-42554 1987-02-27
JP63023668A JP2914974B2 (ja) 1987-02-27 1988-02-05 可変レート音声信号伝送方法および伝送システム

Publications (2)

Publication Number Publication Date
JPS6453642A JPS6453642A (en) 1989-03-01
JP2914974B2 true JP2914974B2 (ja) 1999-07-05

Family

ID=26361074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63023668A Expired - Lifetime JP2914974B2 (ja) 1987-02-27 1988-02-05 可変レート音声信号伝送方法および伝送システム

Country Status (1)

Country Link
JP (1) JP2914974B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10230809B4 (de) * 2002-07-08 2008-09-11 T-Mobile Deutschland Gmbh Verfahren zur Übertragung von Audiosignalen nach dem Verfahren der priorisierenden Pixelübertragung
JP4009781B2 (ja) * 2003-10-27 2007-11-21 カシオ計算機株式会社 音声処理装置及び音声符号化方法
CN111951813A (zh) * 2020-07-20 2020-11-17 腾讯科技(深圳)有限公司 语音编码控制方法、装置及存储介质
WO2024034389A1 (ja) * 2022-08-09 2024-02-15 ソニーグループ株式会社 信号処理装置、信号処理方法、およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0691533B2 (ja) * 1986-06-10 1994-11-14 日本電気株式会社 音声/デ−タ総合ロ−カルエリアネツトワ−ク

Also Published As

Publication number Publication date
JPS6453642A (en) 1989-03-01

Similar Documents

Publication Publication Date Title
US4903301A (en) Method and system for transmitting variable rate speech signal
US4975957A (en) Character voice communication system
US4868867A (en) Vector excitation speech or audio coder for transmission or storage
US4852179A (en) Variable frame rate, fixed bit rate vocoding method
EP0379587B1 (en) Encoder/decoder apparatus
US4709390A (en) Speech message code modifying arrangement
JPH0650437B2 (ja) 音声処理装置
JPH0668680B2 (ja) 改善された多パルス線形予測符号化音声処理装置
US4945565A (en) Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
KR19980080463A (ko) 코드여기 선형예측 음성코더내에서의 벡터 양자화 방법
EP0232456A1 (en) Digital speech processor using arbitrary excitation coding
JPH11259100A (ja) 励起ベクトルの符号化方法
JP3266372B2 (ja) 音声情報符号化方法およびその装置
US6768978B2 (en) Speech coding/decoding method and apparatus
CA2218118C (en) Variable rate speech coding method and decoding method
JP2914974B2 (ja) 可変レート音声信号伝送方法および伝送システム
AU2541799A (en) Apparatus and method for hybrid excited linear prediction speech encoding
US4985923A (en) High efficiency voice coding system
JPH10282997A (ja) 音声符号化装置及び復号装置
JPH0764600A (ja) 音声のピッチ符号化装置
JPH06131000A (ja) 基本周期符号化装置
JP3462958B2 (ja) 音声符号化装置および記録媒体
JPH02146100A (ja) 音声符号化・復号化装置
JPH09297597A (ja) 高能率音声伝送方法及び高能率音声伝送装置
JP3092654B2 (ja) 信号符号化装置