JP2000261323A - 音声符号化ストリームの編集方法 - Google Patents

音声符号化ストリームの編集方法

Info

Publication number
JP2000261323A
JP2000261323A JP11064427A JP6442799A JP2000261323A JP 2000261323 A JP2000261323 A JP 2000261323A JP 11064427 A JP11064427 A JP 11064427A JP 6442799 A JP6442799 A JP 6442799A JP 2000261323 A JP2000261323 A JP 2000261323A
Authority
JP
Japan
Prior art keywords
bit
bit stream
bits
stream
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11064427A
Other languages
English (en)
Inventor
Sadahiro Yasura
定浩 安良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP11064427A priority Critical patent/JP2000261323A/ja
Publication of JP2000261323A publication Critical patent/JP2000261323A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 音声符号化方法において、フレーム単位で使
用されるビット数が可変の場合に、ビットストリームの
編集接続を行なうと、ビットリザーバに貯えられたビッ
ト数が接続前後で一致せず、デコード時にバッファのア
ンダー、オーバーフローが起こる。 【解決手段】 音声圧縮符号化ビットストリームを編集
接続する場合に、時間的に前の第1ビットストリームの
最終フレームを符号化し終えた時点でバッファに貯えら
れたビット数aと、時間的に後の第2ビットストリームの
先頭フレームを符号化の開始する時点で前記バッファに
貯えられていたビット数bを比較し、差分量( a−b )に
応じて前記第1ビットストリームの最終フレームを修正
し、バッファ蓄積量を一致させ、バッファのアンダー、
オーバーフローを防止する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を符号化
して得られた符号化ストリームを編集する際の符号化ス
トリームの編集方法に関する。
【0002】
【従来の技術】従来より、音声信号の符号化方法には、
時間周波数変換符号化が用いられており、例えば適応ス
ペクトル聴感制御エントロピー符号化法(ASPEC, Adapt
ive Spectral Perceptual Entropy Coding)、MPEG
1オーディオ・レイヤ3、MPEG2オーディオAAC
がある。これらは、音声信号を符号化する場合、フレー
ムと呼ばれる20ms程度の一定間隔の区間に分割して
信号処理を行ない、ビットストリームを構成するが、フ
レーム当たりのビット数が可変長になっている。
【0003】これを実現するため、ビットリザーバと呼
ばれる余分なビット数を貯えることが出来るバッファ装
置が用意される。ターゲットとなるビットレートで1フ
レームに使用できる平均ビット数に対して、そのフレー
ムで使用したビット数が少ない場合には、余ったビット
数をビットリザーバに保存する。また、このビットリザ
ーバにビット数が余っている場合には、平均ビット数と
ビットリザーバ分まで、そのフレームを符号化するのに
使用出来るようになっている。
【0004】しかし、このように、フレーム単位で使用
しているビット数が異なる場合、ビットストリームの編
集、接続は一般的に困難である。これはビットリザーバ
に貯えられたビット数が接続前後で一致しない問題があ
るためであり、そのまま編集、接続を行なうと、ビット
ストリームデコード時にバッファのアンダーフロー、オ
ーバーフローが発生してしまう。
【0005】
【発明が解決しようとする課題】そこで本発明は、上記
の問題に鑑み、バッファのアンダーフロー、オーバーフ
ローを発生しないようなビットストリームの編集方法を
提供することを目的とする。1つの方法として、ビット
ストリームの編集を行ない易くするために、符号化方法
を修正することがあるが、今回は、通常に符号化された
ビットストリームを接続することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
の手段として、各請求項により、バッファ(ビットリザ
ーバ)に貯えられたビット数を一致させるようにするこ
とにより、ビットストリームのデコード時のバッファの
アンダーフロー、オーバーフローを防止することが出来
るようにした。すなわち、請求項1の発明は、音声信号
を符号化したビットストリームを編集して接続する音声
符号化ストリームの編集方法において、圧縮符号化され
たビットストリームを編集して接続する場合に、時間的
に前の第1のビットストリームの最終フレームを符号化
し終えた時点でバッファに貯えられた第1のビット数a
と、時間的に後の第2のビットストリームの先頭フレー
ムを符号化を開始する時点で前記バッファに貯えられて
いた第2のビット数bとを比較し、前記第1ビット数か
ら第2のビット数を減算した差分量( a−b )に応じて前
記第1のビットストリームの最終フレームを修正して、
前記バッファの蓄積量を一致させることを特徴とする音
声符号化ストリームの編集方法を提供し、請求項2の発
明は、前記請求項1に記載の音声符号化ストリームの編
集方法において、前記差分量( a−b )がゼロよりも大き
い場合に、前記差分量分のビット数を前記第1のビット
ストリームの最終フレームで使用するように修正し、前
記差分量( a−b )がゼロよりも小さい場合には、不足し
た差分量分のビット数を前記第1のビットストリームの
最終フレームで作り出すように修正して、前記バッファ
の蓄積量を一致させることを特徴とする音声符号化スト
リームの編集方法を提供し、請求項3の発明は、前記請
求項2に記載の音声符号化ストリームの編集方法におい
て、前記差分量( a−b )がゼロよりも大きい場合に、前
記差分量分のビット数を前記第1のビットストリームの
最終フレームで使用するように読み捨てビット(スタッ
フィングビット)を用いるようにし、前記差分量( a−b
)がゼロよりも小さい場合には、不足した差分量分のビ
ット数を前記第1のビットストリームの最終フレームで
作り出すように前記最終フレームの音声信号の帯域幅を
狭めて符号化を行なうように修正して、前記バッファの
蓄積量を一致させることを特徴とする音声符号化ストリ
ームの編集方法を提供する。
【0007】
【発明の実施の形態】本発明の音声符号化ストリームの
編集方法の一実施例について、図と共に以下に説明す
る。本発明の一実施例として、MPEG2オーディオA
AC(以下、単にAACと呼ぶ。)の場合についての説
明を以下に行なう。図3に示したAACのビットストリ
ーム構成図から分かるように、ビットストリームの構成
は、転送フォーマットを特定する部分(転送フォーマッ
ト用ヘッダ)Aと、音声情報を特定する部分(オーディ
オブロック)Bとの2つの部分から成立している。
【0008】この転送フォーマットを特定する部分(転
送フォーマット用ヘッダ)Aでは、同期コードを有する
ビットストリーム編集を想定したものと、パソコン(P
C)等のストレージメディアに置かれ、編集を想定しな
いものとに分けることが出来る。
【0009】音声(オーディオ)情報を特定する部分
(オーディオブロック)Bでは、エレメント(Element)
と呼ばれる単位が集まった形で構成される。例えば、
5.1ch ( C, L, R, SL, SR, LFE)においては、Center用
のSCE(SingleChannel Element)B2、L, R用のCPE(Chan
nel Pair Element)B3、SL,SR用のCPE(B4)、LFE
用のSCE(B5)、チャンネル情報用のPCE(Program Con
fig Element)B1、固定レートに合わせるためのスタッ
フィングビット用のFIL(Fill Element)B6、及びフレ
ームの終わりを示すEND(Term Element)B7から構成さ
れている。
【0010】図3にこのAACのビットストリーム構成
の一実施例を示す。AACは、ビットバッファ(ビット
リザーバ)を有しており、音声信号の特性に応じてター
ゲットとなるビットレートに対して、瞬間のビットレー
トが超えてしまうことを許可している。
【0011】図4にAACのフレーム単位での使用ビッ
ト数の推移を示す。この図4の例では、最初のフレーム
(フレーム1)は、ビットリザーバに貯えられたビット数
はゼロであるために、使用可能なビット数enableはター
ゲットのビットレートから算出される平均ビット数 ave
までを使い符号化を行なう。
【0012】フレーム1の符号化が終了した時点で、実
際に使用したビット数usedとの差分値a = ( ave -used
)がビットリザーバに貯えられる。フレーム1では、使
用可能なビット数はビットリザーバの分を加えたenable
=( ave + a )となる。このように、フレーム単位で使用
されるビット数が夫々異なるため、ビットストリームを
接続する場合には問題が生じてくる。
【0013】図5、及び図6には、本発明のビットスト
リームを接続する場合の一実施例を挙げる。図5は、ビ
ットストリームAの接続時のビットリザーバに貯えられ
た最終フレームのビット数がビットストリームBの接続
時のビットリザーバに貯えられた先頭フレームのビット
数よりも多い一実施例を示す( bresA > bresB )。
【0014】図6は、反対に、ビットストリームAの接
続時のビットリザーバに貯えられた最終フレームのビッ
ト数が、ビットストリームBの接続時のビットリザーバ
に貯えられた先頭フレームのビット数よりも少ない一実
施例を示す(bresA < bresB )。もし、このような状態の
まま接続を行なうと、平均ビット数aveを上回る状態、
または平均ビット数aveを下回る状態でバッファが推移
し、オーバーフロー、アンダーフローを引き起こす。
【0015】本発明では、これを防止するために、図5
に示す実施例については、diff = (bresA- bresB )のビ
ット数分をビットストリームAの最終フレームで使用す
るように最終フレームを変更する。また、本発明では、
図6に示す実施例については、diff = ( bresB- bresA
)のビット数分をビットストリームAの最終フレームで
使用しないように最終フレームを変更する。
【0016】さらに、本発明についてのフローチャート
を示し、図1、及び図2と共に以下に説明する。まず、
接続するビットストリームA,Bのビットリザーバ量br
esA,bresBを算出する(ステップ2)。
【0017】このビットストリームA,Bのビットリザ
ーバ量bresA,bresBの算出方法を図2のフローチャート
に示す。それぞれのビットストリームを(ステップ20
3)でデマルチプレックスして、各フレームで使用され
たビット数usedを算出し、平均ビット数aveとの差分値
(used - ave )を(ステップ204)で求め、これを
(ステップ205)で加算していくことで先頭フレーム
において必要となるビットリザーバ量が求まる。図1で
求まったbresA,bresBから差分値diffを(ステップ4)
で算出し、時間的に前のビットストリームAのデマルチ
プレックスを(ステップ5)にて行なう。
【0018】もし、(ステップ3)においてbresA > br
esBの場合は、特定量のビット数を余分に消費する為に
使用するビットストリームを構成する要素である FILが
存在するかを(ステップ7)で判断し、もし存在するな
らばFILのデコードを行ない、diff分余計にスタッフィ
ング(読み捨て)するようなFILを作成し、ビットスト
リームの再構成を(ステップ8)により行なう。もし存
在しないならば、新たにFILを追加するようにして、ビ
ットストリームの再構成を(ステップ9)により行な
う。もし、(ステップ3,15)においてbresA < bres
Bである場合には、diff分をビットストリームAの最終フ
レームで使用しないようにする必要がある。
【0019】ここで、diff分をビットストリームAの最
終フレームで使用しないようにする方法について以下に
述べる。MPEG2オーディオAACは、時間周波数変
換符号化方式であり、MDCT(Modified Discrete Cosine
Transform)を用いて周波数軸に変換する。そして、それ
ぞれの周波数成分は聴覚特性に基づいてグループ化がな
され、その単位で処理が行なわれている。
【0020】その単位はスケールファクターバンド(sf
b)と呼ばれている。これに関連して、最大スケールファ
クターバンド(max sfb) というパラメータがあり、ビッ
トストリームで転送されるsfbの個数を表わしている。
通常は、サンプリング周波数の1/2の帯域までを表現
するのに必要なsfbの数がmax sfbで送られる。
【0021】本発明は、この最大スケールファクターバ
ンド(max sfb) の値に関連したパラメータを修正して周
波数帯域を制限することで、最終フレーム内で使用され
るビット数を削減している。max sfbを修正する順番と
しては、実際に聴いたときに影響の少ない順番が望まし
く、SCE(LFE)B5、SCE(Center)B5、CPE(Ls,Rs)B
4、CPE(L,R)B3の順に処理を行なう。
【0022】以上のことから1つのエレメント(例えばS
CE)を選択し、デマルチプレックスを行ない、max sfbの
値を取り出して、このmax sfbの値を減らしたことによ
り得られるビット数の削減量総和tl revを(ステップ2
1)で算出し、(ステップ22)で削減量総和tl revが
diff以上になるまで繰り返す(ステップ11,12,2
0〜22)。
【0023】最大スケールファクターバンド(max sfb)
については制限を行なう限界値(LIMIT)を夫々のエレ
メントに対して(ステップ12)に示すように設けてお
き、限界値まで達したら、(ステップ13)に示すよう
にそのエレメントにおけるビット数の削減を終了し、次
のエレメントの削減に入る。
【0024】もし、(ステップ22)で削減量総和tl r
evがdiff以上になる条件を満たしたならば、修正を加え
たエレメントを作成する。そしてFILのサーチを行な
い、存在するならばFILのデコードを行ない、(tl rev−
diff)分余計にスタッフィング(読み捨て)するようなF
ILを作成する(ステップ8)。もし、FILが存在しない
ならば新たにFILを追加する(ステップ9)。以上の処
理後、最終的なビットストリームの再構成を行なう。
【0025】
【発明の効果】本発明の音声符号化ストリームの編集方
法によれば、フレーム当たりの使用ビット数が可変であ
る符号化方式において、ビットストリームの編集、接続
を行なう場合に、ビットリザーバに貯えられたビット数
を一致させるように、時間的に前になるビットストリー
ムの最終フレームを修正することで、ビットストリーム
デコード時にバッファのアンダーフロー、オーバーフロ
ーを防止することが出来る。
【図面の簡単な説明】
【図1】本発明の音声符号化ストリームの編集方法の一
実施例のフローチャートである。
【図2】本発明の音声符号化ストリームの編集方法の一
実施例のフローチャートである。
【図3】本発明の一実施例のAACのビットストリーム
構成を示す図である。
【図4】本発明の一実施例のAACのフレーム単位での
使用ビット数の推移を示す図である。
【図5】本発明の一実施例のビットストリームを接続す
る際のバッファの状態を示す図である。
【図6】本発明の一実施例のビットストリームを接続す
る際のバッファの状態を示す図である。
【符号の説明】
FIL 特定量のビット数を余分に消費する為に使用する
ビットストリームを構成する要素 Fill Element LIMIT 限界値 a 時間的に前の第1のビットストリームの最終フレー
ムを符号化し終えた時点でバッファに貯えられたビット
数(第1のビット数) b 時間的に後の第2のビットストリームの先頭フレー
ムを符号化の開始する時点で前記バッファに貯えられて
いたビット数(第2のビット数) ave 平均ビット数 bres ビットリザーバ量 diff 差分値(bresAとbresBとの差) enable 使用可能なビット数 max sfb 最大スケールファクターバンド sfb スケールファクターバンド tl rev 削減量総和 used 実際に使用したビット数

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】音声信号を符号化したビットストリームを
    編集して接続する音声符号化ストリームの編集方法にお
    いて、 圧縮符号化されたビットストリームを編集して接続する
    場合に、時間的に前の第1のビットストリームの最終フ
    レームを符号化し終えた時点でバッファに貯えられた第
    1のビット数と、時間的に後の第2のビットストリーム
    の先頭フレームを符号化を開始する時点で前記バッファ
    に貯えられていた第2のビット数とを比較し、 前記第1ビット数から第2のビット数を減算した差分量
    に応じて前記第1のビットストリームの最終フレームを
    修正して、前記バッファの蓄積量を一致させることを特
    徴とする音声符号化ストリームの編集方法。
  2. 【請求項2】前記請求項1に記載の音声符号化ストリー
    ムの編集方法において、 前記差分量がゼロよりも大きい場合に、前記差分量分の
    ビット数を前記第1のビットストリームの最終フレーム
    で使用するように修正し、 前記差分量がゼロよりも小さい場合には、不足した差分
    量分のビット数を前記第1のビットストリームの最終フ
    レームで作り出すように修正して、 前記バッファの蓄積量を一致させることを特徴とする音
    声符号化ストリームの編集方法。
  3. 【請求項3】前記請求項2に記載の音声符号化ストリー
    ムの編集方法において、 前記差分量がゼロよりも大きい場合に、前記差分量分の
    ビット数を前記第1のビットストリームの最終フレーム
    で使用するように読み捨てビットを用いるようにし、 前記差分量がゼロよりも小さい場合には、不足した差分
    量分のビット数を前記第1のビットストリームの最終フ
    レームで作り出すように前記最終フレームの音声信号の
    帯域幅を狭めて符号化を行なうように修正して、 前記バッファの蓄積量を一致させることを特徴とする音
    声符号化ストリームの編集方法。
JP11064427A 1999-03-11 1999-03-11 音声符号化ストリームの編集方法 Pending JP2000261323A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11064427A JP2000261323A (ja) 1999-03-11 1999-03-11 音声符号化ストリームの編集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11064427A JP2000261323A (ja) 1999-03-11 1999-03-11 音声符号化ストリームの編集方法

Publications (1)

Publication Number Publication Date
JP2000261323A true JP2000261323A (ja) 2000-09-22

Family

ID=13257981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11064427A Pending JP2000261323A (ja) 1999-03-11 1999-03-11 音声符号化ストリームの編集方法

Country Status (1)

Country Link
JP (1) JP2000261323A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003001510A1 (fr) * 2001-06-21 2003-01-03 Sony Corporation Appareil et procede de traitement de signaux numeriques et systeme de reproduction/reception de signaux numeriques
JP2003337596A (ja) * 2002-05-20 2003-11-28 Teac Corp オ−ディオデータ処理方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003001510A1 (fr) * 2001-06-21 2003-01-03 Sony Corporation Appareil et procede de traitement de signaux numeriques et systeme de reproduction/reception de signaux numeriques
JP2003337596A (ja) * 2002-05-20 2003-11-28 Teac Corp オ−ディオデータ処理方法及び装置

Similar Documents

Publication Publication Date Title
JP4918841B2 (ja) 符号化システム
JP4146489B2 (ja) 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体
KR101091593B1 (ko) 음성 신호의 스펙트럼 재구성 방법 및 디바이스
US11170791B2 (en) Systems and methods for implementing efficient cross-fading between compressed audio streams
RU2527760C2 (ru) Декодер звукового сигнала, кодер звукового сигнала, представление кодированного многоканального звукового сигнала, способы и програмное обеспечение
JP5618826B2 (ja) Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
KR101221918B1 (ko) 신호 처리 방법 및 장치
KR101276849B1 (ko) 오디오 신호의 처리 방법 및 장치
JP5032314B2 (ja) オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
JP5894286B2 (ja) ジッタバッファの管理方法及びこれを利用するジッタバッファ
JP4588297B2 (ja) ディジタル情報信号のエンコーディング/デコーディング方法及び装置
JP2004523790A (ja) ビットセイビングバンク、エンコーダおよびスケーラブルエンコーダを備えたスケーラブルデータストリームを生成する方法と装置および復号化する方法と装置
JP6728154B2 (ja) オーディオ信号のエンコードおよびデコード
MX2013010879A (es) Aparato y metodo de codificacion, y programa.
CN100581267C (zh) 复用装置和复用方法
JP2007295578A (ja) 音声データのフレームを含む音声ストリームを通す複数の通信モジュールを含む通信システムのための方法
JP2006528368A (ja) オーディオファイルフォーマット変換
US20090043567A1 (en) Variable frame offset coding
KR101411197B1 (ko) 패킷 스트림 내의 지터 보상 방법
WO2012103686A1 (en) Method and apparatus for providing signal processing coefficients
JP2000261323A (ja) 音声符号化ストリームの編集方法
JPH10262015A (ja) 多重伝送方法およびシステム並びにそこで用いる音声ジッタ吸収方法
KR101377702B1 (ko) 가변 대역 코덱 및 그 제어 방법
JPH10174065A (ja) 画像音声多重化データ編集方法およびその装置
JP2000183751A (ja) 可変レート符号化・復号装置