JPS62271000A - 音声の符号化方法 - Google Patents

音声の符号化方法

Info

Publication number
JPS62271000A
JPS62271000A JP61113625A JP11362586A JPS62271000A JP S62271000 A JPS62271000 A JP S62271000A JP 61113625 A JP61113625 A JP 61113625A JP 11362586 A JP11362586 A JP 11362586A JP S62271000 A JPS62271000 A JP S62271000A
Authority
JP
Japan
Prior art keywords
frequency
analysis
encoding
audio
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61113625A
Other languages
English (en)
Other versions
JPH0446439B2 (ja
Inventor
八木 真介
章 浦野
石津 達雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kokusai Electric Corp
Original Assignee
Kokusai Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Electric Corp filed Critical Kokusai Electric Corp
Priority to JP61113625A priority Critical patent/JPS62271000A/ja
Publication of JPS62271000A publication Critical patent/JPS62271000A/ja
Publication of JPH0446439B2 publication Critical patent/JPH0446439B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 (産業上の利用分野) 音声を低ビツトレートでディジタル符号化する方法とし
て公知のボコーダ方式がある。この方式では音声を5〜
20ffi3ごとに区切り、その各区間における波形を
特徴づけるパラメータを分析して伝送するもので、音声
が有声音か無声音かの判別結果と、有声音の場合にはピ
ッチ周波数およびスペクトラム情報の3種のパラメータ
で表し、これをディジタルコード化して伝送するのが一
般的である。本発明はスペクトラム情報をフィルタバン
クによって音声周波数帯域を分割し、各周波数成分ごと
のスペクトラム成分のレベルを測定してそのレベルによ
って表す符号化方式、いわゆるチャネルボコーダ(Ch
annel Vocoder)方式の符号化方法に関す
るものである。
(従来の技術) 第1図はチャネルボコーダ方式の符号化回路の原理図で
、この図はディジタル演算処理によって分析処理を行う
例を示している。図中の記号1は音声人カフをディジタ
ルコードに変換するA/D変換器、2はスペクトラム分
析回路、3は符号器で分析結果を伝送する情報の形にコ
ード化する。
4はピンチ周波数(周期)の検出および有声音か無声音
かの識別を行う検出回路、5は符号器で4の分析結果を
コード化する。6はマルチプレクサで2つの符号器3と
5の出力を多重化して伝送データ8とする。なおこのよ
うなチャネルボコーダの原理については多くの文献があ
る。
スペクトラム分析回路2は通常約300Hz〜約300
0Hzの音声帯域内に分析しようとする周波数成分ごと
にフィルタを並べて、そのフィルタ出力のレベルを検出
する方法、またはフーリエ変換によって音声を周波数ス
ペクトラムに分解し、分析フィルタの各帯域に対応する
周波数ごとにスペクトラム成分の和を求めてこれをフィ
ルタ出力とする方法によって実現される。
第2図は第1図中のスペクトラム情報の符号器3の構成
例図である。スペクトラム分析回路2からの各分析フィ
ルタ毎の出力(V+ −VN )16は並列に入力し符
号化処理も並列に行うようにした例であって、9〜11
は対数変換器(L OG)、12〜14は符号器、15
は並列、直列変換回路、17は符号化された出力である
。なお第3チヤネルから第(N−1)チャネルの部分は
図示省略しである。
さて各分析フィルタからの入力16は各フィルタで音声
を各周波数成分に分けてp波し包絡線検波された信号で
ある。音声のレベル変化およびスペクトラム分布は広い
ダイナミックレンジを持つので、各分析チャネルのレベ
ルを対数で表す方が量子化誤差を少なくスペクトルを表
すことができる。
対数変換器9〜11はそのため入力波の包絡線レベルを
対数値に変換するもので、たとえばROMテーブルを用
いて簡単に実現できる。
次に符号器C0D12〜14は各分析チャネル毎に割当
てられたビット数に対数変換出力を量子化するもので、
その出力は直列並列変換回路(P S C)15で多重
化され、直列の符号列に変換され出力17となる。符号
器12〜14において各分析チャネルに割当てる符号化
のビット数は分析の時間間隔2分析チャネル数、符号伝
送速度等によって決められる。たとえば伝送速度を48
00b/s 、分析の時間間隔を15 msとすると1
区間の分析データは72ビツト(=4.8b/ rns
 X 15)で表すことになる。このうち有声音と無声
音の識別およびピッチ周波数に8ビツトを割当てたとす
るとスペクトラム情報の分は64ビツトとなり、分析チ
ャネル数が16であれば1チヤネル当たり4ビツトで符
号化することになる。
一般に復元した音声の品質(明瞭度、自然性。
聞き易さなど)を良くするには分析チャネル数および各
分析チャネルに割当てる符号化ビット数を増やすことが
必要で、所要の伝送速度を保ちながら音声品質を最良に
するための分析チャネル数とチャネル当たりの符号化ビ
ット数とのトレードオフがチャネルボコーダの定数決定
における重要な課題になっている。音声のスペクトラム
は一般に周波数の低いところでの変化は比較的大きく、
周波数の高いところでは比較的変化は小さい。また人の
聴取能力については低い周波数成分(特に1kHz以下
)は明瞭度に大きく影響し、高い周波数成分の寄与は比
較的小さいことが知られているが、符号化の効率を上げ
るためにこのような特性が利用されている、すなわち分
析フィルタの帯域幅を周波数の低いところでは狭くし、
周波数の高いところでは広くする方法および各チャネル
に割当てる符号化ビット数を周波数の低いチャネルでは
多く、周波数の高いチャネルでは少なくする方法が使用
されている。
(発明の具体的な目的) 本発明は前記従来の符号化方法に対してその効率をさら
に高めるため分析チャネルを複数個組合わせてチャネル
間のレベル変化の形を符号化することである。
(発明の構成) 第3図は本発明を実施したスペクトラム情報の符号器の
構成例図である。この図は第2図と同様に並列処理を行
う場合であって、18〜23は対数変換器(L OG’
)、24〜26は符号器(COD)、27は並列直列変
換回路(P S C)である。LOG、PSCと人、出
力は第2図と同様であるが、C0D24〜26は第2図
のC0D12〜14の機能に加えて2つの分析チャネル
間のレベルの差を検出しレベル変化の形を符号化する機
能を具えている。
第4図は符号器C0D24〜26の構成側図で30゜3
1は第2図の12〜14と同じ符号器、32は2つの分
析チャネルのレベルを組合わせた形を符号化する符号器
である。
2つの隣接する分析チャネルの対数変換されたレベル3
3.34は符号器30.31で割当てられたビット数に
量子化され、両符号器の出力は符号器32で2つの分析
チャネルの符号化出力とレベル差を組合わせて別の符号
に変換する符号器でROM (メモリ)テーブル等を用
いて容易に実現できる。
なお受信側の音声合成では逆の変換処理により分析チャ
ネル別のレベルに戻して合成処理を行えばよい。
(発明の動作) 本発明の詳細な説明する。音声のスペクトラムの周波数
に対する変化は比較的ゆるやかであり、分析チャネル間
の相関が大きい。従って分析チャネル間のレベル差を符
号化するのに必要な量子化ビット数は各分析チャネルの
レベルを符号化するのに必要なビット数よりは少ない。
音声のスペクトラムの形はランダムではなく周波数によ
ってレベルの分布および変化の仕方の統計的性質に特徴
がある。このことを利用して分析チャネルの周波数によ
って符号化の方法を変え、さらに必要なビット数を減ら
すことができる。
第3図に示す2チヤネルずつを組合わせて符号化する例
について次に説明する。各分析チャネルのレベルを3ビ
ツトで表し、2チヤネルの組合わせを1ビツト少ないビ
ット数に符号化する、すなわち5ビツトに符号化する場
合の組合わせ方法の例は第1表のように示される。
第   1   表 第1表において○印で示した部分のみ符号化し、無印の
部分は発生頻度が少ないので縦方向に最も近い○印の符
号で表すことにする。表中の○印の数は32(2’)で
あるからその位置を符号化するには5ビツトあればよい
。このようにすれば2チヤネルを別々に符号化する場合
に比べて1ビツト少ないビット数で符号化できる。また
周波数によってはレベル変化のしかたに偏りがあり、た
とえばホルマント周波数は約500Hz以上にあるので
最も周波数の低いチャネルと次のチャネルではレベルが
増加する頻度が大きいが、このような場合にはさらにビ
ット数を減らすこができる。
以上は2チヤネルを組合わせて符号化する場合であるが
、3チヤネル以上を組合わせてさらに効率を上げること
ができることは明らがである。
このような符号化方法の欠点は符号化したデータの伝送
において回線で伝送誤りが発生すると1ビツトの誤りが
組合わせた分析チャネルのすべてに影響するため受信側
で復元した音声の品質への影響が大きいことである。そ
のため誤りの発生が予想される回線で伝送する場合には
組合わせるチャネル数はあまり多くできない。また誤り
の影響を少なくするには音質への影響の大きい周波数の
低い成分についてはチャネル別に符号化し、高い周波数
成分では組合わせるチャネル数を増やす方法等が実用的
である。
(発明の効果) 本発明により復元された音声の品質を低下させずに符号
化データの伝送速度を小さくすることができ、伝送に必
要な帯域幅を減らすことができる。
また逆に伝送速度を一定とすれば音声の品質を従来のも
のに比べて高めることができる。
【図面の簡単な説明】
第1図はチャネルボコーダ方式の符号化回路の原理図、
第2図は第1図中のスペクトラム情報の符号器の構成側
図、第3図は本発明を実施したスペクトラム情報の符号
器の構成側図、第4図は第3図中の符号器(COD)の
構成側図である。 1・・・A/D変換器、2・・・スペクトラム分析回路
、3.5・・・符号器、4・・・ピッチ周波数と有声音
。 無声音の検出回路、6・・・マルチプレクサ、9〜11
・・・対数変換器、12〜14・・・符号器、15、2
7・・・並列−直列変換器、18〜23・・・対数変換
器、24〜26・・・符号器、30.31・・・符号器
、32・・・符号器。 戸1閃 刑20

Claims (1)

    【特許請求の範囲】
  1. 音声周波数帯域を複数の周波数帯域(チャネル)に分割
    し、その各帯域の周波数成分ごとに音声のレベルを検出
    してディジタル符号化し、該音声の有声音か無声音かの
    判別結果及びピッチ周波数の検出結果と共に出力伝送す
    るチャネルボコーダ方式の音声符号化回路において、前
    記分割された周波数帯域の周波数成分ごとに検出された
    レベル値を複数の周波数帯域の周波数成分ごとに組合わ
    せて前記組合わせ周波数帯域の周波数成分のレベルごと
    にディジタル符号化したときのビット数の和より少ない
    ビット数にディジタル符号化することを特徴とする音声
    の符号化方法。
JP61113625A 1986-05-20 1986-05-20 音声の符号化方法 Granted JPS62271000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61113625A JPS62271000A (ja) 1986-05-20 1986-05-20 音声の符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61113625A JPS62271000A (ja) 1986-05-20 1986-05-20 音声の符号化方法

Publications (2)

Publication Number Publication Date
JPS62271000A true JPS62271000A (ja) 1987-11-25
JPH0446439B2 JPH0446439B2 (ja) 1992-07-29

Family

ID=14616961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61113625A Granted JPS62271000A (ja) 1986-05-20 1986-05-20 音声の符号化方法

Country Status (1)

Country Link
JP (1) JPS62271000A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0260231A (ja) * 1988-07-18 1990-02-28 Internatl Business Mach Corp <Ibm> コード化方法
WO1993019459A1 (en) * 1992-03-18 1993-09-30 Sony Corporation High-efficiency encoding method
WO1994024666A1 (en) * 1993-04-14 1994-10-27 Sony Corporation Method and apparatus for transforming signals, and recording medium

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5977498A (ja) * 1982-10-25 1984-05-02 富士通株式会社 音声特徴パラメータの圧縮装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5977498A (ja) * 1982-10-25 1984-05-02 富士通株式会社 音声特徴パラメータの圧縮装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0260231A (ja) * 1988-07-18 1990-02-28 Internatl Business Mach Corp <Ibm> コード化方法
WO1993019459A1 (en) * 1992-03-18 1993-09-30 Sony Corporation High-efficiency encoding method
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5878388A (en) * 1992-03-18 1999-03-02 Sony Corporation Voice analysis-synthesis method using noise having diffusion which varies with frequency band to modify predicted phases of transmitted pitch data blocks
US5960388A (en) * 1992-03-18 1999-09-28 Sony Corporation Voiced/unvoiced decision based on frequency band ratio
WO1994024666A1 (en) * 1993-04-14 1994-10-27 Sony Corporation Method and apparatus for transforming signals, and recording medium
US5737717A (en) * 1993-04-14 1998-04-07 Sony Corporation Method and apparatus for altering frequency components of a transformed signal, and a recording medium therefor

Also Published As

Publication number Publication date
JPH0446439B2 (ja) 1992-07-29

Similar Documents

Publication Publication Date Title
US7756699B2 (en) Sound encoder and sound encoding method with multiplexing order determination
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
US8606567B2 (en) Signal encoding apparatus, signal decoding apparatus, signal processing system, signal encoding process method, signal decoding process method, and program
KR19990024267A (ko) 포만트 유사도 측정에 의한 피솔라를 이용한 음성 파형 부호화방식
JPS63142399A (ja) 音声分析合成方法及び装置
US4991215A (en) Multi-pulse coding apparatus with a reduced bit rate
US5003604A (en) Voice coding apparatus
JP2001044845A (ja) サブバンド符号化方式
JP3158932B2 (ja) 信号符号化装置及び信号復号化装置
EP1364364A2 (en) Apparatus for coding scaling factors in an audio coder
JPS62271000A (ja) 音声の符号化方法
US20080161952A1 (en) Audio data processing apparatus
JPH0636159B2 (ja) ピツチ検出器
JP2820096B2 (ja) 符号化方式および復号方式
JPH0750589A (ja) サブバンド符号化装置
KR0175250B1 (ko) 보코더의 톤 검출회로 및 방법
JP2993324B2 (ja) 音声高能率符号化装置
JPS5866440A (ja) 波形符号化方式
JPH09232964A (ja) ブロック長可変型変換符号化装置および過渡状態検出装置
US20030040918A1 (en) Data compression method
JPS62285541A (ja) ボコ−ダ方式の音声デイジタル伝送における誤り制御方法
KR0155807B1 (ko) 저지연 가변 전송률 다중여기 음성 부호화장치
JP2002023798A (ja) 音声符号化方法
Zurcher et al. Speech digitalization with channel vocoders
JPH07154268A (ja) 帯域分割符号化装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees