JPH0746140A - 符号化装置及び復号化装置 - Google Patents

符号化装置及び復号化装置

Info

Publication number
JPH0746140A
JPH0746140A JP5190130A JP19013093A JPH0746140A JP H0746140 A JPH0746140 A JP H0746140A JP 5190130 A JP5190130 A JP 5190130A JP 19013093 A JP19013093 A JP 19013093A JP H0746140 A JPH0746140 A JP H0746140A
Authority
JP
Japan
Prior art keywords
frame
quantization level
quantization
decoding
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5190130A
Other languages
English (en)
Inventor
Masami Aizawa
雅己 相沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5190130A priority Critical patent/JPH0746140A/ja
Publication of JPH0746140A publication Critical patent/JPH0746140A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は、音声データの伝送等における遅延
を最小限とする符号化装置及び復号化装置を提供するこ
とを目的とする。 【構成】 本発明の符号化装置は、入力される信号のス
ペクトル分析をフレーム単位で行うスペクトル分析手段
と、前記入力された信号より量子化レベルを算出する量
子化レベル算出手段と、前記スペクトル分析により求め
られたサンプルデータを前記量子化レベル算出手段で算
出された量子化レベルで量子化する量子化手段と、この
量子化手段で量子化された量子化サンプルをフレームの
後半に、前記量子化レベル算出手段で算出された量子化
レベルをフレームの前半に配置し多重化する多重化手段
と、この多重化手段で多重化されたフレームを所定のビ
ットレートで出力する出力手段とを備えて構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、遅延時間が問題とされ
る放送、TV会議、電話、リアルタイムのモニタリング
等における高能率音声符号化伝送を行うための符号化装
置及び復号化装置に関するものである。
【0002】
【従来の技術】従来、利用されている音声圧縮は時間軸
上の相関を利用したADPCM(Adaptive D
ifferential Pulse Code Mo
dulation;適応差分パルス符号変調)や、準瞬
時圧縮などであり、圧縮に関する遅延時間は数msと実
用上は問題にならないほど小さいものであった。
【0003】一方、近年になって資源の有効利用のため
に高効率音声符号化方式が実現されている。この高効率
音声符号化方式は音響信号のスペクトル解析を行ない、
人の聴覚心理モデルに基づき、聞こえない成分について
の情報を削減することで大幅な圧縮を行なうものである
が、この圧縮の際に要する遅延時間は大きいものとなっ
ている。
【0004】次に、図4を参照して、この従来の高効率
音声符号化方式について説明する。入力される16ビッ
トPCM信号は、サブバンドフィルタなどのスペクトル
分析器111により周波数成分に分解され、量子化器1
13に出力される。
【0005】量子化レベル算出器115では入力16ビ
ットPCM信号を2フレーム分、1024サンプルをフ
ーリエ変換等の周波数解析を行ない、さらに聴覚心理に
基づくマスキング理論及び静寂時において知覚される最
小値である最小可聴限を考慮してスペクトルごとに量子
化レベルを算出し、量子化器113及びマルチプレクサ
117に送る。
【0006】量子化器113では、量子化レベル算出器
115から送られた量子化レベルに基づき、スペクトル
ごとに量子化を行ない、この量子化データをマルチプレ
クサ117に送る。マルチプレクサ117は量子化器1
13より送られた量子化データに、量子化レベルを多重
化して1フレーム分の圧縮データを出力バッファ119
に送る。出力バッファ119は所定のビットレートでビ
ットストリームを出力する。
【0007】次に、従来の高効率音声符号化方式に対応
する復号化装置について図5を参照して説明する。符号
化装置101で符号化され所定のビットレートで伝送さ
れるビットストリームは、一旦復号化装置103の入力
バッファ131に入力され、1フレーム分のデータが受
信されると、デ・フォーマット部133に転送する。こ
の入力バッファ131から転送され多重化されたビット
ストリームは、デ・フォーマット部133で量子化デー
タ、量子化レベルの情報、その他の情報に分割され、逆
量子化器135に送られる。
【0008】逆量子化器135はデ・フォーマットされ
た量子化データの、逆量子化を行い、スペクトル合成器
137に送る。スペクトル合成器137は逆量子化器1
35から送られた逆量子化されたデータの、スペクトル
合成を行いPCM音声信号を出力する。
【0009】次に、従来の高効率音声符号化方式の符号
化・復号化の作用をそれぞれ図6に示すタイムチャート
を参照して説明する。まず、符号化に際しては、1フレ
ーム、例えば512サンプルの符号化する音声信号は、
オーバーラップの処理のため、次フレームと合わせ、2
フレーム分のバッファリングD111が行われる。
【0010】2フレーム分のデータがバッファリングさ
れると、符号化処理D113が開始される。符号化の処
理は毎フレームパイプライン的に流れ作業の処理を行
い、1フレームの時間内に符号化処理D113を行う。
そしてこの符号化処理D113が終了すると、ビットス
トリーム出力D115が開始される。
【0011】一方、復号化に際しては、符号化装置10
1より送られたビットストリームは1フレーム分バッフ
ァされ、バッファリングD117が終了後、復号化処理
D119が開始される。復号化の処理は毎フレームパイ
プライン的に流れ作業の処理が行なわれ、1フレームの
時間内に復号化処理D119が行われ、音声出力D12
1が行われる。
【0012】以上の様に音声データが入力されてから、
符号化・復号化処理が行われ音声が出力されるまでに5
フレーム分の遅延が生じる。すなわち、一般に高能率符
号化処理及び復号化処理は、1フレームが512〜11
52サンプルと長いフレーム長を持つため、その遅延時
間は相当に大きくなり、例えば符号化及び復号化処理に
100ms程度の時間がかかり、この処理時間が遅延時
間となった。
【0013】
【発明が解決しようとする課題】上述してきたように、
高能率符号化処理は聴覚特性等を利用して大幅な圧縮を
行うものであるが、フレーム長が長いため符号化及び復
号化処理に長い遅延時間が生じる。そのためリアルタイ
ムでモニタリングを行う場合や、画面と音声を同時に伝
送する場合、通信などではこの遅延時間が問題となる。
【0014】本発明は、上記課題に鑑みてなされたもの
で、フレーム単体が長い音声データの伝送等における遅
延を最小限とする符号化装置及び復号化装置を提供する
ことを目的とする。
【0015】
【課題を解決するための手段】上記目的を達成するため
本願第1の発明は、入力される信号のスペクトル分析を
フレーム単位で行うスペクトル分析手段と、前記入力さ
れた信号より量子化レベルを算出する量子化レベル算出
手段と、前記スペクトル分析により求められたサンプル
データを前記量子化レベル算出手段で算出された量子化
レベルで量子化する量子化手段と、この量子化手段で量
子化された量子化サンプルをフレームの後半に、前記量
子化レベル算出手段で算出された量子化レベルをフレー
ムの前半に配置し多重化する多重化手段と、この多重化
手段で多重化されたフレームを所定のビットレートで出
力する出力手段とを有することを要旨とする。
【0016】また、本願第2の発明は、請求項1記載の
出力手段が量子化手段におけるサンプルデータの量子化
の終了前に、量子化レベルをフレームの前半に配置され
るように出力することを特徴とすることを要旨とする。
【0017】また、本願第3の発明は、量子化レベルを
フレームの前半に、量子化サンプルをフレームの後半に
多重化された信号を受信し入力する入力手段と、この入
力手段に入力された信号から量子化レベルと量子化サン
プルを分離するデコード手段と、このデコード手段で分
離された量子化レベルを基に量子化サンプルを逆量子化
する逆量子化手段と、この逆量子化手段の出力をスペク
トル合成して音声信号を出力するスペクトル合成手段と
を有し、前記デコード手段は入力手段が多重化されたフ
レームの後半に配置される量子化サンプルの受信の終了
前に、ビットストリームのデコード並びに量子化レベル
による量子化サンプルの復号化処理を開始することを要
旨とする。
【0018】
【作用】本願第1の発明の符号化装置は、スペクトル分
析手段で入力される信号のスペクトル分析がフレーム単
位で行われ、また量子化レベル算出手段で入力された信
号より量子化レベルが算出される。つぎにスペクトル分
析により求められたサンプルデータは量子化レベルで量
子化され、フレームの量子化レベルの後に配置され所定
のビットレートで出力される。
【0019】本願第2の発明の符号化装置は、請求項1
記載の出力手段が量子化手段におけるサンプルデータの
量子化の終了前に、量子化レベルをフレームの前半に配
置されるように出力する。
【0020】本願第3の発明の復号化装置は、入力手段
で量子化レベルをフレームの前半に、量子化サンプルを
フレームの後半に多重化された信号が受信され入力され
る。この入力手段に入力された信号は、量子化レベルと
量子化サンプルに分離され、この量子化レベルを基に量
子化サンプルが逆量子化される。このとき、入力手段が
多重化されたフレームの後半に配置される量子化サンプ
ルの受信の終了前に、ビットストリームのデコード並び
に量子化レベルによる量子化サンプルの復号化処理が開
始される。
【0021】
【実施例】以下、本発明に係る一実施例を図面を参照し
て説明する。本発明は符号化・復号化の両方で適用が可
能であり、それぞれ例をあげて説明する。図1は本発明
に係る符号化装置の一実施例を示すブロック図であり、
図2は本発明に係る復号化装置の一実施例を示すブロッ
ク図である。
【0022】まず図1を参照して符号化装置1の構成を
説明する。符号化装置1はスペクトル分析器11と量子
化レベル算出器15の入力側が接続され、入力された1
6ビットPCM信号がそれぞれに入力される。スペクト
ル分析器11の出力側は量子化器13を介してマルチプ
レクサ17に接続される。また、量子化レベル算出器1
5の出力側は量子化器13及びマルチプレクサ17に接
続される。マルチプレクサ17は出力バッファ19に接
続され、この出力バッファ19はマルチプレクサ17で
多重化され、パラレルに出力される圧縮データをビット
ストリームとして出力する。
【0023】次に、作用を処理手順に従って説明する。
まず、入力された16ビットPCM信号は2フレーム
分、1024サンプルをDCT(Discrete C
osine Transform;離散コサイン変換)
やサブバンドフィルタ等で構成されるスペクトル分析器
11により周波数成分に分解され、量子化器13に出力
される。
【0024】一方、量子化レベル算出器15では、入力
された16ビットPCM信号1を2フレーム分、102
4サンプルをフーリエ変換等の周波数解析を行ない、聴
覚上小さい音が大きな音に消されてしまうかのように感
じられる聴覚心理にもとずいた、マスキング理論(参考
文献 電子通信学会「聴覚と音声」p.111-114)や、また
静寂時において知覚される最小値である最小可聴限を考
慮してスペクトルごとに量子化レベルを算出し、量子化
器13及びマルチプレクサ17に出力する。
【0025】この量子化レベル算出器15から送られた
量子化レベルを入力した量子化器13では、該量子化レ
ベルによりサンプルデータをスペクトルごとに量子化を
行ない、この量子化で得られた量子化サンプルをマルチ
プレクサ17に送る。
【0026】マルチプレクサ17は量子化器13より送
られた量子化サンプルと、量子化レベルとを、量子化レ
ベルがフレームの前半に、量子化サンプルがフレームの
後半に配置されるように多重化して1フレーム分の圧縮
データを出力バッファ19に出力する。さらに出力バッ
ファ19は所定のビットレートでビットストリーム10
を出力する。
【0027】次に図2を参照して本発明に係る復号化装
置3の構成を説明する。復号化装置3に入力されたビッ
トストリームは入力バッファ31を介して接続されるデ
・フォーマット部33に入力される。このデ・フォーマ
ット部33は逆量子化器35に接続され、さらに逆量子
化器35はスペクトル合成器37に接続される。
【0028】次に、作用を処理手順に従って説明する。
まず、符号化装置1により符号化された所定のビットレ
ートで送られてくるビットストリームは一旦入力バッフ
ァ31に入力される。この入力バッファは、1フレーム
分のデータを受信すると、デ・フォーマット部33に転
送する。
【0029】入力バッファ31から転送された多重化さ
れたビットストリームはデ・フォーマット部33により
量子化サンプルや、量子化レベルの情報、などに分割さ
れ、逆量子化器35に送られる。
【0030】逆量子化器35はデ・フォーマットされた
量子化データの、逆量子化を行い、スペクトル合成器3
7に送る。
【0031】スペクトル合成器37は逆量子化器35か
ら送られた逆量子化されたサンプルの、スペクトル合成
を行いPCMの音声信号を出力する。
【0032】次に図3に示すタイムチャートを参照して
符号化・復号化処理について説明する。まず、符号化装
置1における符号化処理について説明する。1フレー
ム、例えば512サンプルの符号化対象の音声信号は、
オーバーラップの処理のため、次フレームと合わせ、2
フレーム分のバッファリングD11が行われる。
【0033】2フレーム分のデータがバッファリングD
11されると、符号化処理D13A,D13Bが開始さ
れる。符号化処理D13A,D13Bは毎フレーム、パ
イプライン的に流れ作業の処理が行われ、1フレームの
時間内に符号化処理D13A,D13Bが行われる。
【0034】ここで符号化処理D13Aはサブバンド分
解や、MDCT等の周波数解析の処理であり、符号化処
理D13Bはサンプルデータの量子化処理である。
【0035】バッファ出力D15Aは同期コードや、ス
ケールファクタ等の周波数サンプルの補助情報を伝送す
る。この処理は符号化処理D13Aが終了すれば開始で
きるもので符号化処理D13Bの終了を待たずして出力
される。バッファ出力D15Bは符号化処理D13B
(量子化)が終了するまで開始できないものであり、出
力されるビットストリームは周波数サンプルである。
【0036】バッファ出力は符号化処理D13Bの終了
時とバッファ出力D15Bの開始時が概ね一致するよう
に先行される。この符号化されたデータは復号化装置3
へと出力される。
【0037】つぎに、復号化装置3における復号化処理
について説明する。復号化装置3において、符号化の処
理は毎フレームパイプライン的に流れ作業の処理を行
い、1フレームの時間内に符号化処理を行う。
【0038】ビットストリームのバッファ入力D17A
は同期コード、周波数サンプルの補助情報、例えば量子
化レベル、すなわち量子化サンプルの指数部分であるス
ケールファクタのバッファである。バッファ入力D17
Bは周波数サンプルのバッファである。
【0039】復号化処理D19Aはバッファ入力D17
Aが終了すれば開始できるものであり、ビットストリー
ムのデコードや、逆量子化である。具体的には、例えば
補助情報に基づき(サンプルごとにビット数が異な
る)、量子化レベル、量子化サンプルを抽出する(ビッ
トストリームのデコード)。この量子化レベル(スケー
ルファクタ)の値により、逆スケーリングを行う。
【0040】続いて復号化処理D19Bを行う。この復
号化処理D19Bはバッファ入力D17Bが終了しない
と(全ての周波数データが揃わないと)開始できないも
のであり、サブバンド合成や、IMDCT等の周波数統
合を行う。具体的には、逆量子化されたサンプル(周波
数データ322 )のスペクトル合成、サブバンド合成
(IFFT、IDCT等を用いる)による周波数/時間
変換を行ない時間データ642 を得る。時間データ64
2 はバッファリングされる。バッファのサイズは102
2 で、FILO(ファーストインラストアウト)で古
いものから順に捨てられる。バッファの1024サンプ
ルからとびとびに512サンプルを取り出し、窓関数を
掛ける。この窓関数を掛けた512サンプルのデータは
32サンプルづつ分解し、16ブロックをオーバラップ
して32サンプルのデータを生成し、この32サンプル
をPCMデータとして出力する。
【0041】また、バッファ入力D17Bの終了時と復
号化処理D19Bの開始時が概ね一致するように符号化
処理D19A,D19Bを先行させる。復号化処理後、
音声信号はタイミングD21で出力される。
【0042】上述してきたように本実施例では音声を扱
っていることから、通常は量子化レベルは全てのデータ
が揃わないと復号化処理が開始出来ない。一方、量子化
サンプルについては全てのデータが揃う前に処理を開始
できるものがあり、この様な処理を先行させることで遅
延時間の短縮を計ることができる。
【0043】尚、一つの量子化レベルに対して量子化サ
ンプルは、1つとは限らず、複数の量子化サンプルブロ
ックが対応する場合もある。このような場合には、先行
処理による効果をさらに高めることも可能である。
【0044】
【発明の効果】以上説明したように本発明は、符号化処
理におけるビットストリーム出力、復号化処理の復号化
の両方で二段目の処理を先行させるので、遅延時間を減
少させることができる。
【図面の簡単な説明】
【図1】本発明に係る符号化装置の一実施例を示すブロ
ック図である。
【図2】本発明に係る復号化装置の一実施例を示すブロ
ック図である。
【図3】図1及び図2に示した符号化装置及び復号化装
置における動作を説明するためのタイムチャート図であ
る。
【図4】従来例の符号化装置の構成を示すブロック図で
ある。
【図5】従来例の復号化装置の構成を示すブロック図で
ある。
【図6】従来例における動作を説明するためのタイムチ
ャート図である。
【符号の説明】
1…符号化装置,3…復号化装置,11…スペクトル分
析器,13…量子化器,15…量子化レベル算出器,1
7…マルチプレクサ,19…出力バッファ,31…入力
バッファ,33…デ・フォーマット部,35…逆量子化
器,37…スペクトル合成器。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力される信号のスペクトル分析をフレ
    ーム単位で行うスペクトル分析手段と、 前記入力された信号より量子化レベルを算出する量子化
    レベル算出手段と、 前記スペクトル分析により求められたサンプルデータを
    前記量子化レベル算出手段で算出された量子化レベルで
    量子化する量子化手段と、 この量子化手段で量子化された量子化サンプルをフレー
    ムの後半に、前記量子化レベル算出手段で算出された量
    子化レベルをフレームの前半に配置し多重化する多重化
    手段と、 この多重化手段で多重化されたフレームを所定のビット
    レートで出力する出力手段とを有することを特徴とする
    符号化装置。
  2. 【請求項2】 前記出力手段は量子化手段におけるサン
    プルデータの量子化の終了前に、量子化レベルをフレー
    ムの前半に配置されるように出力することを特徴とする
    請求項1記載の符号化装置。
  3. 【請求項3】 量子化レベルをフレームの前半に、量子
    化サンプルをフレームの後半に多重化された信号を受信
    し入力する入力手段と、 この入力手段に入力された信号から量子化レベルと量子
    化サンプルを分離、デコードするデコード手段と、 このデコード手段で分離、デコードされた量子化レベル
    を基に量子化サンプルを逆量子化する逆量子化手段と、 この逆量子化手段の出力をスペクトル合成して音声信号
    を出力するスペクトル合成手段と を有し、前記デコード手段は入力手段が多重化されたフ
    レームの後半に配置される全ての量子化サンプルの受信
    の終了前に、ビットストリームのデコード並びに量子化
    レベルによる量子化サンプルの復号を開始することを特
    徴とする復号化装置。
JP5190130A 1993-07-30 1993-07-30 符号化装置及び復号化装置 Pending JPH0746140A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5190130A JPH0746140A (ja) 1993-07-30 1993-07-30 符号化装置及び復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5190130A JPH0746140A (ja) 1993-07-30 1993-07-30 符号化装置及び復号化装置

Publications (1)

Publication Number Publication Date
JPH0746140A true JPH0746140A (ja) 1995-02-14

Family

ID=16252898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5190130A Pending JPH0746140A (ja) 1993-07-30 1993-07-30 符号化装置及び復号化装置

Country Status (1)

Country Link
JP (1) JPH0746140A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106297810A (zh) * 2013-06-19 2017-01-04 杜比实验室特许公司 音频处理单元以及对编码音频比特流进行解码的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106297810A (zh) * 2013-06-19 2017-01-04 杜比实验室特许公司 音频处理单元以及对编码音频比特流进行解码的方法

Similar Documents

Publication Publication Date Title
JP3352406B2 (ja) オーディオ信号の符号化及び復号方法及び装置
KR101192241B1 (ko) 입력 데이터 스트림의 믹싱과 그로부터 출력 데이터 스트림의 생성
KR101756834B1 (ko) 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
KR100721537B1 (ko) 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
US8848926B2 (en) Apparatus and method for restoring multi-channel audio signal using HE-AAC decoder and MPEG surround decoder
KR101837083B1 (ko) 디코딩 방법 및 그에 따른 디코딩 장치
JP2015172779A (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
PL1825461T3 (pl) Sposób i urządzenie do sztucznego rozszerzania szerokości pasma sygnałów mowy
US6965859B2 (en) Method and apparatus for audio compression
KR20080025636A (ko) 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
EP2133872B1 (en) Encoding device and encoding method
GB2357231A (en) Encoding and decoding speech signals
JP3601473B2 (ja) ディジタルオーディオ圧縮回路および伸長回路
JP3144009B2 (ja) 音声符号復号化装置
JPH11177434A (ja) 音声符号化復号方式
JP2003523535A (ja) 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
JPH09252254A (ja) オーディオ復号装置
CN1901043B (zh) 立体声音频编码方法及装置,音频流解码方法及装置
JP3487250B2 (ja) 符号化音声信号形式変換装置
JPH0746140A (ja) 符号化装置及び復号化装置
KR0121164B1 (ko) 고음질 오디오 데이타의 압축/복원을 위한 실시간 시스템 및 그의 부호화/복호화 방법
JPH09146593A (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置及び音響信号復号化装置
JP2001094432A (ja) サブバンド符号化・復号方法
Cavagnolo et al. Introduction to Digital Audio Compression