JP2000047693A - 音声信号符号化制御装置 - Google Patents

音声信号符号化制御装置

Info

Publication number
JP2000047693A
JP2000047693A JP10215146A JP21514698A JP2000047693A JP 2000047693 A JP2000047693 A JP 2000047693A JP 10215146 A JP10215146 A JP 10215146A JP 21514698 A JP21514698 A JP 21514698A JP 2000047693 A JP2000047693 A JP 2000047693A
Authority
JP
Japan
Prior art keywords
encoding
bit rate
subjective quality
processing unit
physical quantity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10215146A
Other languages
English (en)
Inventor
Rei Takahashi
玲 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10215146A priority Critical patent/JP2000047693A/ja
Publication of JP2000047693A publication Critical patent/JP2000047693A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 目標とする主観品質を有しかつ、低いビット
レートを達成する。 【解決手段】 入力音声は物理量算出部2で音声区間と
非音声区間の識別子α、その両区間の平均パワー比β、
線形予測利得γが算出され、そのα,β,γをエントリ
として、テーブル3が参照され、テーブル3には、α,
β,γと、符号化装置A,B,Cの何れかと、ビットレ
ートと、主観品質との関係が記憶され、目標とする主観
品質を有し、最も低いビットレートの符号化装置を選択
し、その選択した符号化装置(A,B,Cの何れか)で
入力音声を符号化し、その符号化情報と、前記選択情報
を多重化して出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は音声チャネルへの
入力信号を符号化して伝送あるいは蓄積する際に、入力
信号の性質によって適応的に符号化装置を選択制御する
ことにより、低ビットレートで、特に良好な主観品質を
出力信号(符号化/復号化処理された信号)による音声
信号符号化制御装置に関する。
【0002】ここで「主観品質」とは、人が耳で空気振
動を聴いたときに感じる品質を意味する。
【0003】
【従来の技術】音声チャネルへの入力信号を低ビットレ
ート符号化する一つの方法として、複数の符号化装置を
用意しておき、入力信号の特徴物理量の測定結果に基づ
き、選択的にこれらの符号化装置の何れかを適用するこ
とがある。例えば、入力音声信号の特徴物理量として信
号レベル、信号のピッチ性等に着目して、音声区間と非
音声区間を区別し、音声区間用符号化装置と非音声区間
用符号化装置とを用意し、非音声区間(主に、発声者の
周囲の音が含まれる区間)に対しては音声区間より低い
ビットレートの非音声区間用符号化装置を選択すること
により、平均ビットレートを低減する技術(VAD/C
NG:Voice Activity Detector/Comfort Noise Genera
tor )がある。この技術を用いた音声符号化の例とし
て、ITU−Tの勧告G.729AnnexBや勧告
G.723.1AnnexAがある。
【0004】従来技術では、特徴物理量の測定結果か
ら、予め求めた規則に基づき符号化装置を選択する。し
かし、この選択規則をあらゆる入力信号に対して最適に
することは困難であり、従来法による符号化制御では、
例えば、非音声区間に含まれる周囲音の性質によって主
観品質が大きく劣化することがある。
【0005】
【発明が解決しようとする課題】この発明の目的は、従
来技術を用いたときに入力信号の性質に依存して生じる
主観品質の劣化を抑え、用意した一つまたは複数の符号
化装置を最大限利用して、なるべく低いビットレートで
目標とする主観品質を確保する。あるいはこれが不可能
な場合にもなるべく高い品質を確保する音声信号符号化
制御装置を提供することにある。
【0006】
【課題を解決するための手段】この発明の一つ実施例に
よれば、入力信号の特徴物理量の多くの組み合わせに対
応して、各符号化装置及び符号化パラメータ値の組み合
わせを用いたときのビットレートと主観品質を予め求め
ておき、入力音声信号の特徴物理量に応じて最も低いビ
ットレートで目標とする主観品質を確保する、あるいは
これが不可能な場合はなるべく高い主観品質を確保する
符号化装置及び符号化パラメータ値の組み合わせを選択
することを主要な特徴とする。従来の技術とは、入力信
号の特徴物理量とこの信号を符号化したときの主観品質
の対応関係を求めておき、これに基づいて符号化制御す
る点が異なる。
【0007】前記特徴物理量の例は、 1)音声区間と非音声区間を識別する識別子、 2)上記2区間に分類したときの、両区間の平均パワー
比、 3)周波数スペクトル概形の平坦性を表す線形予測利
得、 4)信号の周期性を表す自己相関関数のピーク値 であり、これ以外にもいろいろに設定することができ
る。
【0008】作用 この発明の実施例では、「入力信号の特徴物理量」と、
用意してある符号化装置及び符号化パラメータ値を用い
てこの入力信号を符号化したときの「ビットレート及び
主観品質」の対応関係に基づいて、符号化装置及び符号
化パラメータ値を決定するため、この関係が保たれてい
る限り、用意した符号化装置及び符号化パラメータ値の
選択利用という手法において、最も低いビットレートで
目標とする主観品質を確保する、あるいはこれが不可能
な場合はなるべく高い主観品質を確保することができ
る。
【0009】
【発明の実施の形態】実施例1 図1はこの発明の第1の実施例の機能構成を示す。入力
端子INよりの入力信号を符号化する手段として、3つ
の符号化装置A,B,Cから構成される符号化処理部1
を備える。入力端子INよりの入力信号の複数の特徴物
理量が特徴物理量算出部2で算出される。この算出物理
量については後述する。
【0010】特徴物理量算出部2において算出する特徴
物理量の多くの組み合わせについて、これらの値を持つ
入力信号を符号化処理部1に用意された符号化装置A,
B,Cでそれぞれ符号化したときのビットレートと主観
品質を保持する符号化装置性能テーブル3を備える。特
徴物理量算出部2における特徴物理量の算出結果に基づ
き、符号化装置性能テーブル3を参照して符号化装置
A,B,Cの何れかを選択する手段として符号化装置制
御部4を備える。
【0011】さらに符号化装置制御部4によって得られ
る制御情報と、これにより制御された符号化処理部1の
出力信号を多重化して伝送路あるいは記録媒体に出力す
る手段として多重化装置5を備える。 この実施例の特徴物理量算出部2において算出する特徴
物理量は 1)音声区間と非音声区間を識別する識別子α、 2)上記2区間に分類したときの、両区間の平均パワー
比β、 3)周波数スペクトル概形の平坦性を表す線形予測利得
γ、 の3つである。
【0012】次に、特徴物理量算出部2における特徴物
理量の算出結果に基づき、符号化装置性能テーブル3を
参照して符号化装置制御部4が符号化装置を選択する動
作を説明する。図2はこの実施例における符号化装置性
能テーブル3の構成を示す。このテーブル3は前記3つ
の特徴物理量α,β,γと、用いた符号化装置(A,
B,Cの何れか)と、ビットレートとその時の主観品質
との関係を予め実験により求めたものである。すなわ
ち、特徴物理量がそれぞれα1 ,β1 ,γ1 の時の符号
化装置XによるビットレートをBX (α1 ,β1
γ1 )、主観品質をSX (α1 ,β1 ,γ1 )で表す。
【0013】符号化装置制御部4は特徴物理量算出部2
から得られる結果、α,β,γから、この各値に最も近
い組み合わせを、符号化装置性能テーブル3(図2参
照)から探索する。そして、該当するエントリから目標
とする主観品質を実現し、かつ最も低いビットレートの
符号化装置を選択し、その符号化装置の情報を符号化装
置制御情報として出力する。よって符号化処理部1では
その制御情報により1つの符号化装置が選択されて、入
力信号が符号化される。テーブル3を探索時に、目標と
する主観品質がいずれの符号化装置によっても達成でき
ない場合には、最も高い主観品質を与える符号化装置を
選択する。
【0014】実施例2 図3はこの発明の第2の実施例の機能構成を示す。この
実施例では入力信号を符号化する手段として、一つの符
号化装置から構成される符号化処理部11を備える。こ
の符号化装置は符号化パラメータP及びQが可変であ
る。
【0015】入力信号の特徴物理量を算出する手段とし
て特徴物理量算出部12が備えられている。この実施例
の特徴物理量算出部12において用いる特徴物理量は
「音声区間と非音声区間を識別する識別子α」のみであ
る。入力信号である音声及び非音声信号を符号化処理部
11に用意された符号化装置のパラメータP,Qを様々
変化させて符号化したときのビットレートと主観品質を
保持する符号化装置性能テーブル13を備える。つま
り、このテーブル13は、図4に示すように、特徴物理
量αの様々な値のそれぞれについて、パラメータP,Q
を様々変化させて符号化したときの、各ビットレート
と、主観品質との関係を予め実験により求めたものであ
る。
【0016】特徴物理量算出部12における音声/非音
声識別子αに基づき、符号化装置性能テーブル13を参
照して符号化パラメータ値を決定する手段として符号化
装置制御部14を備える。この符号化装置制御部14に
よって得られる制御情報と、これにより制御された符号
化処理部11の出力信号を多重化して伝送路あるいは記
録媒体に出力する手段として多重化装置15を備える。
【0017】次に、特徴物理量算出部12における音声
/非音声識別結果αに基づき、符号化装置性能テーブル
13を参照して符号化装置制御部14が符号化パラメー
タ値P,Qを決定する動作を説明する。図4においてビ
ットレートと主観品質は予め実験により求めてある値で
ある。例えば特徴物理量αの値がα1 、符号化パラメー
タP,QがそれぞれP1 ,Q1の時のビットレートがB
(P1 ,Q1 )(α1 )、主観品質がS(P1 ,Q1
(α1 )で表す。
【0018】符号化装置制御部14は特徴物理量算出部
12から得られる結果から、αの値がこの値と一致する
エントリを符号化装置性能テーブル13(図4参照)か
ら探索する。そして、該当するエントリから目標とする
主観品質を実現し、かつ最も低いビットレートとなる符
号化パラメータP,Qの組み合わせを選択し、その組み
合わせ情報を制御情報として出力する。この制御情報に
より符号化処理部11の符号化パラメータP,Qを制御
して、入力信号を符号化する。目標とする主観品質がい
ずれのパラメータ値によっても達成できない場合には、
最も高い主観品質を与える符号化パラメータP,Qの組
み合わせを選択する。
【0019】なお符号化パラメータP,Qとしては例え
ば次のようなものを用いる。即ちCELP(Code Excit
ed Linear Prediction)符号化においては、いくつかの
コードブックをもち、各コードブックから該当音声セグ
メントの符号化に最適なコードを検索し、これらを出力
符号(コード)としている。従って例えば2つのコード
ブックをもつ符号化方式において、各コードブックのサ
イズ(コードの数)をP,Qとして用いる。このとき、
ビットレートは(log2P+log2Q)×N[bit/sec ]
(Nは1秒間に含まれる音声セグメント数)となる。1
つの符号化パラメータを制御する場合は最も単純な例と
してはPCM符号化における1サンプルあたりの量子化
ビット数をPとして用いることが考えられる。このと
き、ビットレートはP×f[bit/sec ](fは音声信号
のサンプリング周波数)となる。
【0020】実施例1において、符号化装置を選択する
特徴物理量としてはα,β,γの3つに限らず、1又は
4つ以上でもよい。実施例2において、符号化パラメー
タを選択する特徴物理量としてはα1個の場合に限ら
ず、複数個を用いてもよい。また選択する符号化パラメ
ータとしてはP,Qの2個に限らず、1個でもよく、あ
るいは3個以上でもよい。更に符号化装置を複数とし
て、符号化装置の選択とその符号化パラメータの選択と
を行うように、符号化装置性能テーブル13を構成して
もよい。
【0021】また符号化処理部11としては図1に示す
ものと、図3に示すものを組み合せてもよい。つまり符
号化処理部1には符号化パラメータが固定の少くとも1
個の符号化装置と、少くとも1個の符号化パラメータが
可変の少くとも1個の符号化装置とを備え、符号化装置
性能テーブルは、少くとも1つの特徴物理量をエントリ
として、符号化パラメータが固定の符号化装置に対して
は各装置ごとに符号化パラメータ可変の符号化装置に対
しては、各符号化装置のその各符号化パラメータ値との
組み合せごとにビットレートと主観品質がそれぞれ格納
されることになる。
【0022】
【発明の効果】以上説明したように、この発明により、
複数の符号化装置及び符号化パラメータの組み合わせの
中から目標とする主観品質を最も低いビットレートで達
成する、あるいは目標とする主観品質に最も近い品質を
達成することができるようになる。
【図面の簡単な説明】
【図1】この発明の第1の実施例の機能構成を示すブロ
ック図。
【図2】第1の実施例中の符号化装置性能テーブル3の
具体例を示す図。
【図3】この発明の第2の実施例の機能構成を示すブロ
ック図。
【図4】第2の実施例中の符号化装置性能テーブル13
の具体例を示す図。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 異なる符号化方式による複数の符号化装
    置を備えた符号化処理部と、 音声入力信号の特徴物理量を少なくとも1つ算出する特
    徴物理量算出部と、 ここで算出される特徴物理量をエントリとして、前記符
    号化処理部に用意した各符号化装置により符号化したと
    きのビットレートと主観品質を保持する符号化装置性能
    テーブルと、 前記算出された特徴物理量により前記テーブルを参照し
    て、ほぼ目標とする主観品質を有し、最もビットレート
    が低い符号化装置を選択する符号化装置制御部と、 前記符号化処理部中の前記選択された符号化装置で前記
    音声入力信号を符号化する手段と、 を備えたことを特徴とする音声信号符号化制御装置。
  2. 【請求項2】 符号化パラメータ値を変化させることの
    できる1個の符号化装置を含む符号化処理部と、 音声入力信号の特徴物理量の少なくとも1つを算出する
    特徴物理量算出部と、 特徴物理量算出部で算出される特徴物理量をエントリと
    して、前記符号化処理部に用意した符号化装置の少なく
    とも1つの符号化パラメータ値により符号化したときの
    ビットレートと主観品質を保持する符号化装置性能テー
    ブルと、 前記算出された特徴物理量により前記テーブルを参照し
    て、ほぼ目標とする主観品質を有し、最もビットレート
    が低い符号化パラメータ値を選択する符号化装置制御部
    と、 前記符号化処理部で前記選択された符号化パラメータ値
    により、前記音声入力信号を符号化する手段とを備える
    ことを特徴とする音声信号符号化制御装置。
  3. 【請求項3】 符号化パラメータ値を変化させることの
    できる複数の符号化装置を含む符号化処理部と、 音声入力信号の特徴物理量の少くとも1つを算出する特
    徴物理量算出部と、 特徴物理量算出部で算出される特徴物理量をエントリと
    して、前記符号化処理部に用意した符号化装置及びその
    少くとも1つの符号化パラメータ値により符号化したと
    きのビットレートと主観品質を保持する符号化装置性能
    テーブルと、 前記算出された特徴物理量により前記テーブルを参照し
    て、ほぼ目標とする主観品質を有し、最もビットレート
    が低い符号化装置及びその符号化パラメータ値を選択す
    る符号化装置制御部と、 前記符号化処理部中の前記選択された符号化装置及びそ
    の符号化パラメータ値により、前記音声入力信号を符号
    化する手段とを備えることを特徴とする音声信号符号化
    制御装置。
  4. 【請求項4】 符号化パラメータ値を変化させることの
    できる少くとも1つの符号化装置と符号化パラメータが
    固定とされた少くとも1つの符号化装置とを含む符号化
    処理部と、 音声入力信号の特徴物理量の少くとも1つを算出する特
    徴物理量算出部と、 特徴物理量算出部で算出される特徴物理量をエントリと
    して、前記符号化処理部に用意した符号化装置で、固定
    符号化パラメータの場合はその装置により、可変符号化
    パラメータの場合はその装置及びその少くとも1つの符
    号化パラメータ値によりそれぞれ符号化したときのビッ
    トレートと主観品質を保持する符号化装置性能テーブル
    と、 前記算出された特徴物理量により前記テーブルを参照し
    てほぼ目標とする主観品質を有し、最もビットレートが
    低い符号化装置又はその装置とその符号化パラメータ値
    を選択する符号化装置制御部と、 前記符号化処理部中の前記選択された符号化装置又はそ
    の装置とその符号化パラメータ値により前記音声入力信
    号を符号化する手段と、 を備えることを特徴とする音声信号符号化制御装置。
  5. 【請求項5】 前記特徴物理量は、 1)音声区間と非音声区間を識別する識別子、 2)上記2区間に分類したときの、両区間の平均パワー
    比、 3)周波数スペクトル概形の平坦性を表す線形予測利
    得、 4)信号の周期性を表す自己相関関数のピーク値 の一以上であることを特徴とする請求項1乃至4の何れ
    かに記載の音声信号符号化制御装置。
JP10215146A 1998-07-30 1998-07-30 音声信号符号化制御装置 Pending JP2000047693A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10215146A JP2000047693A (ja) 1998-07-30 1998-07-30 音声信号符号化制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10215146A JP2000047693A (ja) 1998-07-30 1998-07-30 音声信号符号化制御装置

Publications (1)

Publication Number Publication Date
JP2000047693A true JP2000047693A (ja) 2000-02-18

Family

ID=16667448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10215146A Pending JP2000047693A (ja) 1998-07-30 1998-07-30 音声信号符号化制御装置

Country Status (1)

Country Link
JP (1) JP2000047693A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149197A (ja) * 2000-09-07 2002-05-24 Lucent Technol Inc デジタルオーディオ圧縮アプリケーションにおいてオーディオ材料を事前に分類する方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149197A (ja) * 2000-09-07 2002-05-24 Lucent Technol Inc デジタルオーディオ圧縮アプリケーションにおいてオーディオ材料を事前に分類する方法および装置

Similar Documents

Publication Publication Date Title
JP3782103B2 (ja) アダプティブディザを減算し、埋没チャンネルビットを挿入し、フィルタリングすることによりマルチビット符号ディジタル音声を符号化する方法及び装置、及びこの方法のための符号化及び復号化装置。
KR100713677B1 (ko) 음성 디코딩 장치, 음성 디코딩 방법 및 음성 디코딩장치를 포함하는 전송 시스템
EP0734014B1 (en) Coding apparatus
US6704705B1 (en) Perceptual audio coding
RU2316059C2 (ru) Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
JP3849210B2 (ja) 音声符号化復号方式
KR100361236B1 (ko) 차분코딩원리를구현하는전송시스템
HU215861B (hu) Eljárások beszédjelek tömörítésére digitalizált minták változtatható sebességű kódolásával és dekódolásával, valamint eszközök ezen eljárások foganatosításához
KR100351484B1 (ko) 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법 및 기록 매체
JP2008102520A (ja) オーディオ信号の2重変換符号化
KR100614496B1 (ko) 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법
JP4789430B2 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
JP2005338200A (ja) 音声・楽音復号化装置および音声・楽音復号化方法
US7835915B2 (en) Scalable stereo audio coding/decoding method and apparatus
US6205423B1 (en) Method for coding speech containing noise-like speech periods and/or having background noise
EP0922278B1 (en) Variable bitrate speech transmission system
JP4558734B2 (ja) 信号復号化装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
JP2000047693A (ja) 音声信号符号化制御装置
JP3579276B2 (ja) 音声符号化/復号化方法
JPH10207496A (ja) 音声符号化装置及び音声復号装置
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JP2005049429A (ja) 符号化装置及びそれを用いた情報記録装置
JP3418803B2 (ja) 音声符号復号化装置