JP2002351499A - 音声符号化データの編集方法、及び音声符号化信号編集装置 - Google Patents

音声符号化データの編集方法、及び音声符号化信号編集装置

Info

Publication number
JP2002351499A
JP2002351499A JP2001160216A JP2001160216A JP2002351499A JP 2002351499 A JP2002351499 A JP 2002351499A JP 2001160216 A JP2001160216 A JP 2001160216A JP 2001160216 A JP2001160216 A JP 2001160216A JP 2002351499 A JP2002351499 A JP 2002351499A
Authority
JP
Japan
Prior art keywords
bit stream
signal
edited
data
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001160216A
Other languages
English (en)
Inventor
Sadahiro Yasura
定浩 安良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2001160216A priority Critical patent/JP2002351499A/ja
Publication of JP2002351499A publication Critical patent/JP2002351499A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 符号化された音響信号のビットレート変
換、及びヘッダ情報等の編集の際に、量子化雑音による
音質劣化を少なくし、付随情報の消滅を無くす音声符号
化データの編集方法を実現することにある。 【解決手段】 圧縮オーディオ信号ビットストリームの
再符号化又は付随する情報の編集を行うに際し、そのビ
ットストリームの誤り検出符号で保護される部分のデー
タを検出してメモリ装置40に蓄積しておき、再符号化
されたビットストリーム又は編集データ生成手段22で
編集して得られたビットストリームにそのメモリ装置4
0に記憶した誤り検出符号を多重化して編集済み符号化
ビットストリームを生成するようにして、量子化雑音に
よる音質劣化の影響を受け難く、かつ付随情報の消滅を
無くした高品質な符号化オーディオ信号を得ることので
きる音声符号化データの編集方法を実現した。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、所定の転送レート
で符号化される音声符号化データの編集に係り、特に符
号化された音声信号を記録、伝送、または発音する装置
における編集を簡単な構成により行うことの出来る音声
符号化データの編集方法、及び音声符号化信号編集装置
に関する。
【0002】
【従来の技術】音声信号を高能率符号化する技術とし
て、国際標準としてMPEG(moving picture experts
group)により多くの国際標準が定められ、その国際標
準はISO/IEC(International Organization for
Standardization / International Electrotechnical
Commission)より発行されている。
【0003】その国際標準の1つとしてMPEG2−A
AC(Advanced-Audio-Coding)規格があり、この規格
に定められる符号化方式には、時間周波数変換符号化方
法が用いられている。
【0004】そのMPEG2−AAC方式は日本におけ
るデジタル放送を中心として採用が定められており、現
在は衛星デジタル放送の音声符号化方式として、そして
2003年から開始される地上波デジタル放送方式にも
採用がなされていくものである。
【0005】そのようにして、現在、及び将来開始され
るデジタル放送方式で、デジタル映像信号はMPEG−
2方式により、デジタル音声信号はMPEG2−AAC
方式による放送がなされ、家庭においてこれらの符号化
方式で符号化された映像、音声信号の視聴がなされる。
【0006】そして、視聴者はそのような放送された品
質の高いデジタル音響信号が付随されるデジタル映像信
号を、例えばデジタルVTRに高品質のまま記録し、タ
イムシフトを行って視聴するような応用もなされる。
【0007】そのときに記録されるデジタル音響信号が
付随されるデジタル映像信号の伝送ビットレートは、放
送される信号と同一であればデジタル放送信号をそのま
ま記録できるが、例えば記録メディアの容量が十分に取
れないときなどは信号のビットレートを低い値のビット
レートに変換してから記録することとなる。
【0008】また、放送などにより供給されたデジタル
音響信号は、許可される場合他のメディアへの記録など
2次使用が行われるものであるが、その2次使用に当り
ビットストリームを新しい目的に合わせたビットストリ
ームに編集する必要が生じることともなる。
【0009】
【発明が解決しようとする課題】ところで、そのような
ビットレートの変換、及び編集作業は、放送されるデジ
タル信号を一度復号し、次に目的とするビットレートに
より符号化する方法が考えられるが、その様な復号、及
び再符号化による方法では一般に画質、音質が劣化す
る、そして再符号化のための装置が大きくなり経済的で
ないなどの課題がある。
【0010】そのような再符号化に対する課題はMPE
G2−AACによる復号、再符号化においても同様であ
り、原音である元のオーディオ信号に対する例えば量子
化雑音が増加するため、再符号化された信号の音質は劣
化する傾向にある。また、1度復号するため、ビットス
トリーム中に付随されていた版権などの情報が消滅しや
すい。
【0011】そこで本発明は、特にMPEG2−AAC
方式で符号化されて供給されるデジタルオーディオ信号
のビットレートの変換、ないしは編集されたビットスト
リームの生成を、量子化雑音による音質劣化を少なく
し、かつ、付随情報の消滅を無くす音声符号化データの
編集方法、及び音声符号化信号編集装置の構成を提供す
ることを目的とする。
【0012】
【課題を解決するための手段】本発明は、上記課題を解
決するために以下の1)〜5)の手段より成るものであ
る。すなわち、
【0013】1) 圧縮符号化されたオーディオ信号に
係るビットストリームが供給され、そのビットストリー
ムの編集を行う音声符号化データの編集方法であって、
前記供給されるビットストリームに付加される誤り検出
処理に係る信号部分を検出してその信号部分を一時記憶
すると共に、前記供給されるビットストリームの所定部
分を編集して編集ビットストリームを得る第1のステッ
プ(12、11、40、22)と、その第1のステップ
で得られた編集ビットストリームに前記一時記憶した信
号部分を付加して編集済みビットストリームを生成する
第2のステップ(23、24)と、を少なくとも有する
ことを特徴とする音声符号化データの編集方法。
【0014】2) 前記第1のステップにおける編集ビ
ットストリームは、前記一時記憶した信号部分の情報を
基に算出した符号化パラメータにより再符号化して得ら
れるビットストリームであることを特徴とする1)項記
載の音声符号化データの編集方法。
【0015】3) 前記第1のステップにおける編集ビ
ットストリームは、前記供給されるビットストリームに
付随される付随情報を基にしてそのビットストリームの
生成に係る信号を得、その得られた信号を、一時記憶し
た信号部分の情報を基に算出した符号化パラメータによ
り再符号化して得られるビットストリームであることを
特徴とする1)項記載の音声符号化データの編集方法。
【0016】4) 前記第2のステップにおける信号部
分は、前記第1のステップにおける編集ビットストリー
ムの所定部分に対して誤り訂正符号の付加された信号部
分であることを特徴とする1)項記載の音声符号化デー
タの編集方法。
【0017】5) 圧縮符号化されたオーディオ信号に
係るビットストリームが供給され、そのビットストリー
ムの編集を行う音声符号化信号編集装置であって、前記
供給されるビットストリームに誤り検出符号の付加され
る保護ビットストリーム部分を検出し、その保護ビット
ストリーム部分を一時記憶する一時記憶手段(12、1
1、40)と、前記供給されるビットストリームの所定
部分を編集することにより生成した編集ビットストリー
ムを得る編集ビットストリーム生成手段(21、22)
と、前記編集ビットストリーム生成手段により得られた
編集ビットストリームに前記一時記憶した保護ビットス
トリーム部分を多重化して多重化ビットストリームを得
る多重化手段(24)と、を具備して構成することを特
徴とする音声符号化信号編集装置。
【0018】
【発明の実施の形態】以下、本発明の音声符号化データ
の編集方法、及び音声符号化信号編集装置の実施形態に
つき好ましい実施例により説明する。図1は、その音声
符号化データの編集方法を搭載した音声符号化信号編集
装置の構成であり、以下図と共に説明する。
【0019】同図に示す音声符号化信号編集装置1は、
CRCデータ取得手段11及びCRCデータ検出手段1
2よりなる復号化部10と、データ取得手段21、編集
データ生成手段22、CRCデータ生成手段23、及び
多重化手段24よりなる符号化部20と、制御部30
と、メモリ40とより構成される。
【0020】次に、そのように構成される音声符号化信
号編集装置1の動作について述べる。まず、MPEG
(moving picture experts group)により制定された、
例えばMPEG2−AAC(Advanced Audio Coding)
標準により圧縮符号化されたオーディオ信号のビットス
トリームはビットストリーム入力端子9よりCRCデー
タ取得手段11及びCRCデータ検出手段12に供給さ
れる。
【0021】そのCRCデータ検出手段12では、後述
の方法でビットストリームのCRC(Cyclic Redundanc
y Check)符号によりビットストリームデータの誤り検
出保護のされている区間の信号はヘッダ信号などを基に
して検出され、その検出したCRC区間信号はCRCデ
ータ取得手段11に供給される。
【0022】そのCRCデータ取得手段11では、供給
されたCRC区間信号を基にビットストリーム入力端子
より供給されるビットストリームの内、そのCRC演算
処理のなされている区間のビットストリームが取得さ
れ、その取得されたCRC演算区間のビットストリーム
情報(ここではCRCデータとも呼ぶ)及び、CRC符
号はメモリ40に供給されて一時記憶されると共に、供
給されるビットストリーム(ここではオーディオ信号と
も呼ぶ)はデータ取得手段21に供給される。
【0023】そのデータ取得手段21では、制御部30
より供給される制御信号を基に供給されるオーディオ信
号の内で編集の対象となるデータが取得され、編集の対
象とされないデータは多重化手段24に供給されると共
に、編集の対象とされるデータは編集データ生成手段2
2に供給される。
【0024】その編集データ生成手段22では、制御部
30より供給される制御信号とメモリ40に一時記憶さ
れたCRCデータを基に後述の新たな編集されたビット
ストリームデータが生成されて多重化手段24に供給さ
れると共に、編集により生成されたデータのうちCRC
により誤り検出保護の対象されるデータはCRCデータ
生成手段23に供給される。
【0025】そのCRCデータ生成手段23では、誤り
検出保護の対象とされるデータに関して所定の原始多項
式を用いてCRC符号を演算して生成するが、編集デー
タ生成手段より供給される誤り検出保護の対象となるデ
ータに変更が無い場合には、CRC符号は予めメモリ4
0に一時記憶されているものを使用することにして、そ
の符号が多重化手段24に供給される。
【0026】その多重化手段24では、データ取得手段
21、編集データ生成手段22、及びCRCデータ生成
手段より供給されるビットストリームは所定のシンタッ
クスに基づく順に配置されて編集されたビットストリー
ムとされてこの音声符号化信号編集装置1の出力信号と
して供給される。
【0027】このようにして、供給されるオーディオ信
号のビットストリームに係る所定部分のデータは編集さ
れたビットストリームとして供給され、その供給された
ビットストリームのデータで復号上重要であるデータ部
分は正規のCRC演算処理によるCRC符号が付加され
た、データ誤り耐性のあるビットストリームとなされて
いる。
【0028】そして、この音声符号化信号編集装置1で
は、CRCデータ取得手段11より供給されるオーディ
オ信号は直接データ取得手段に21に供給されるが、例
えばそのオーディオ信号はメモリ40に一時記憶され、
必要に応じて記憶された信号は読み出されながら編集作
業が行なわれるようにしてもよい。
【0029】次に、その編集作業の行われるMPEG2
−AAC標準に基づいて生成されるビットストリームに
ついて述べる。そのMPEG2−AAC標準に基づいて
生成されるビットストリームにはMain、LC(Low
Complexity)、及びSSR(Scalable Sampling Rate)
の3つのプロファイルが存在する。
【0030】そして、それらのプロファイルによるビッ
トストリームの中のLCプロファイルはBS(broadcas
ting satellite;放送衛星)による放送方式に採用され
たプロファイルであり、以下LCプロファイルを中心と
して述べる。
【0031】図2に、そのMPEG2−AACのLCプ
ロファイルによるビットストリームの構成を示す。同図
において、MPEG2−AACのLCプロファイル(以
下AACと略すこともある)によるビットストリームは
転送フォーマットを特定するヘッダ部と、オーディオ情
報を記述するオーディオブロックの2つよりなってい
る。
【0032】そしてその転送フォーマットとしては編集
用と蓄積用の2種類があり、ここではヘッダ中に同期コ
ード、及びフレーム長の情報が記述される編集用フォー
マットを中心にして述べる。
【0033】その編集用フォーマットでは、転送フォー
マットヘッダに続いてオーディオブロックのデータが転
送されるが、そのオーディオブロックはエレメントと称
される複数のデータ単位により構成される。
【0034】即ち、そのデータ単位は、例えば音声チャ
ンネル構成が5.1チャンネルオーディオであるとき、
そのチャンネル信号は前方の左側信号L、中央信号C、
右側信号R、サラウンド用信号で左側のSL、右側のS
R、そして重低音用信号LFEより構成される。
【0035】それらの信号の伝送方法は最初にチャンネ
ル情報がチャンネル情報用のPCE(Program Config El
ement)により、次に前方中央信号のCがSCE(Single
Channel Element)モードで、そして前方左側信号のL、
右側信号のR、サラウンド用信号の左側のSL、及び右
側のSRがCPE(Channel Pair Element)モードによ
り、更に重低音用信号のLFEはSCEモードでにより
伝送される様になされている。
【0036】そして、それらの信号が伝送される際にオ
ーディオブロックに空きが生じる場合はその空き領域に
ビットレートを調整するためのビット詰め信号FIL(F
illElement)が挿入されて伝送され、またそのブロック
の最後にはフレームの終わりを示すEND(Term Elemen
t)が伝送される。
【0037】このようにして、転送フォーマット用ヘッ
ダとそれに続くオーディオブロックデータが伝送される
が、それらの転送フォーマット用ヘッダ及びオーディオ
ブロック所定部分のデータには、誤りデータの誤り検出
保護を行うためのCRC(Cyclic Redundancy Check)符
号が付されている。
【0038】図3に、そのCRC符号の付されるデータ
部分を示す。同図において、図の下部に矢印によって示
す部分がCRC符号によりデータの誤り検出がなされる
部分を示したものである。
【0039】即ち、CRC符号によって誤りデータの検
出がなされる個所は、転送フォーマット用ヘッダの先頭
56ビット、チャンネル情報用のPCEの全ての情報、
SCE、CPEの先頭の192ビット、及びCPEの中
の2番目以降のICS(Individual-Channel-Stream)の
先頭128ビットなどが保護されることになっている。
【0040】そのようにして、ビットストリーム中でエ
ラー感度の高い部分のデータ、即ち復号化時エラーによ
って、ノイズが生じる、あるいは復号動作が破たんする
等影響の大きいデータ部分の保護がなされる。
【0041】その保護がなされるデータ部分は伝送され
るビットストリームを復号するためにも重要なデータ部
分であり、入力されるデータの編集を行う音声符号化信
号編集装置1より出力されるビットストリームの信号に
対しても同様なCRC符号が付加された信号として供給
される必要がある。
【0042】そこで、入力信号として供給されるビット
ストリームの内、CRCが付加されて保護される情報部
分をCRCデータと呼ぶこととするが、そのCRCデー
タについては情報量も所定量であり、大量ではないた
め、そのCRCデータ部分をメモリ40等に記憶するよ
うにする。
【0043】そのメモリ40に記憶されたCRCデータ
は、復号されたオーディオ信号と共に符号化部20に供
給されて編集がなされ、編集のなされた所望のビットス
トリームが符号化部20より供給される。
【0044】次に、その復号化部10、及び符号化部2
0でなされる信号処理について述べる。図4に、符号化
部でオーディオ信号の符号化を行うための量子化式、及
び復号化部で符号化された信号の復号を行うための逆量
子化式を示す。
【0045】即ち、MPEG2−AAC方式で音響信号
の符号化に用いられる非線形量子化器はX0.75の特性を
有しており、MDCT(Modified Discrete Cosine Tra
nsform)により余弦変換がなされて得られるmdct#line
(k)は量子化式に示される演算方法により演算がなされ
て量子化係数Xquant(k)が求められる。
【0046】そして、それらの量子化、及び逆量子化式
に示されるパラメータとして、global#gain、及びscale
factorがあり、これらのパラメータは符号化を行うため
の聴覚モデルに対して影響する度合いの大きなパラメー
タである。
【0047】また、scalefactorの値を変えることによ
り、例えばその値を大きくすると量子化歪を軽減でき
る、小さくするとビットストリームの符号量を小さくで
きるなどの処理が行われる。また、ビットストリーム中
のframe#lengthなる情報は、そのフレームで符号化に使
用したビット数を示している。
【0048】さらにまた、ビットストリームには、その
フレームにおいてMPEG2−AAC規格でオプション
とされている符号化モジュールを使用する、ないしは使
用しないに係る情報も含まれている。
【0049】そして、ビットストリーム中には、復号化
に影響しない情報として、例えばこのストリームに係る
制作者情報、著作権等の版権に係る情報等も含まれてい
る。
【0050】以上述べた様に、MPEG2−AACによ
り符号化されるビットストリームは、復号に直接係る情
報、及びビットストリームの権利に係る情報など多くの
種類の情報と共に符号化ビットストリームとして生成さ
れて供給され、復号はそれらの供給されたビットストリ
ームを基にして復号化部のパラメータが設定されて復号
動作が行われるものである。
【0051】次に、このようにして生成されて供給され
るビットストリームの編集に係り、その編集方法にはビ
ットストリームに付随される情報を変更する場合、符号
化パラメータを変更してビットストリームのデータレー
ト等を変更する場合などがあるが、それらについて順に
述べる。
【0052】まず、ビットストリームに付随される版権
などの情報を編集する場合、ないしはビットストリーム
中の音響信号に無関係な例えばoriginal/copy又はpriva
teとして記述される情報の編集を行う場合について述べ
る。即ち、それらの場合では復号化部10は供給される
ビットストリームよりCRCデータを取得すると共に供
給されたビットストリームはそのままデータ取得手段2
1に供給される。
【0053】そのデータ取得手段21には、制御部30
に接続される図示しないインタフェースが設けられてお
り、そのインタフェースがユーザにより操作されて編集
すべき情報部分に係る制御信号がそのデータ取得手段2
1に供給される。
【0054】そのデータ取得手段21では、供給された
制御信号を基にビットストリームの編集すべき部分のデ
ータが取得されて編集データ生成手段22に供給され、
そこで取得されたデータ部分に対する編集データが生成
され、生成された編集データはCRCデータ生成手段2
3に供給されると共にその生成されたデータはビットス
トリームの信号形式に変換されて多重化手段24に供給
される。
【0055】CRCデータ生成手段23では、編集デー
タ生成手段22より供給されたデータがCRCにより誤
り信号検出保護のされるデータであるときはその信号部
分のCRC符号が生成されて多重化手段24に供給され
る。
【0056】編集データ生成手段22より供給されたデ
ータがCRCデータ生成手段23によりCRC符号の生
成がなされる必要がない場合には、メモリ40に蓄積さ
れたCRC符号がCRCデータ生成手段23を介してそ
のまま多重化手段24に供給される。
【0057】このようにして、多重化手段24にデータ
取得手段21より供給されるビットストリーム信号は、
編集により置換されるべき編集データ部分、及びCRC
符号部分が置換されたビットストリーム信号2として供
給されるようになされている。
【0058】次に、符号化パラメータを変更してビット
ストリームのデータレート等を変更する場合について述
べる。そのビットストリームのデータレート変更は前述
の図4に示した逆量子化式を用いて符号化されたオーデ
ィオ信号を復号し、次に異なる伝送レートで再符号化す
る場合である。
【0059】その場合は、例えば前述の図1において復
号化部10でビットストリームを復号してオーディオ信
号を得、その得られたオーディオ信号を符号化部20に
供給して再符号化を行う場合であり、編集データ生成手
段22と多重化手段24の1部が再符号化部に相当す
る。
【0060】例えば、144kbpsで符号化された2
チャンネルオーディオ信号を2チャンネル128kbp
sの信号に変換する場合であり、MPEG2−AAC符
号器の構成と共に述べる。
【0061】図5に、再符号化部20aの主要部の構成
について示し、その構成により、供給される制御信号に
基づいてなされるオーディオ信号符号化の動作について
述べる。
【0062】同図に示す再符号化部20aは聴覚心理モ
デル221、フィルタバンク222、TNS(Temporal
Noise Shaping)223、インテンシティステレオ22
4、M/Sステレオ225、及びイタレーションループ
226より構成される編集データ生成手段22と、多重
化手段の1部である多重化手段24aとより構成され
る。
【0063】このように構成される再符号化部20aで
はデータ取得手段より供給されるオーディオ信号がフィ
ルタバンク222に供給され、そのフィルタバンク22
2では設定される所定のブロック長の信号に対してMD
CT演算がなされ、MDCT係数が求められる。
【0064】そのMDCT係数信号の一部はビットスト
リーム形式の信号とされて多重化手段24aに供給され
ると共に、MDCT係数信号の他の一部はTNS223
に供給され、その周波数軸の信号であるMDCT係数の
信号は時間軸の信号であるとみなされ、その時間軸上信
号の振幅の大きなところに雑音成分が集中されるような
ノイズシェイピング処理、即ちフィルタリング処理がな
される。
【0065】そして、そのフィルタリング処理のなされ
た信号の一部はビットストリーム形式の信号とされて多
重化手段24aに供給されると共に、他の一部の信号は
インテンシティステレオ224に供給される。
【0066】そのインテンシティステレオ224では、
オーディオ信号の高い周波数成分における到来方向感覚
は左又は右の音源として発音される音響エネルギの差に
より感じられるため、ステレオ音響信号は左右チャンネ
ルの和信号と左右チャンネル信号のエネルギ(パワー)
差とに分けられて符号化がなされる。
【0067】その様にして符号化された信号の一部はビ
ットストリーム形式の信号とされて多重化手段24aに
供給されると共に、他の一部の信号はM/S(Middle S
ide)ステレオ225に供給される。
【0068】そのM/Sステレオ225では、左及び右
チャンネルの信号は、それらの和信号(主信号:main)
と差信号(副信号:sub)として生成され、それらの
和、及び差信号に対して符号化が行なわれる方法で、左
右チャンネルの中央に定位する信号は差信号のレベルが
小さいため符号化効率を上げることができる符号化方法
である。
【0069】そのM/Sステレオで符号化された信号の
一部はビットストリーム形式の信号とされて多重化手段
24aに供給されると共に、他の一部の信号はイタレー
ションループ226に供給される。
【0070】そのイタレーションループ226では、符
号化されたオーディオ信号の量子化雑音レベルが聴覚心
理モデル221で求められた許容雑音レベル以下となる
様に、量子化されたデータが配列されるフレームで使用
可能なビット数が求められるようになされる。
【0071】そのビット数を求める動作にはインナーイ
タレーションループとアウターイタレーションループが
あり、インナーイタレーションループでは量子化に必要
なビット数が目標伝送レートに対して与えられる使用可
能なビット数以内に収まるように、量子化ステップ数が
可変制御される。
【0072】そして、アウターイタレーションループで
は、インナーイタレーションループで求められた量子化
ステップに基づく各々のスケールファクタバンドにおけ
る量子化雑音のレベルが聴覚心理モデル221で求めら
れた許容雑音レベルよりも大きくならないようにスケー
ルファクタの制御が行われる。
【0073】そのようにして設定された量子化ステッ
プ、及びスケールファクタに基づいて生成された音響信
号の符号化データはビットストリーム形式の信号とされ
て多重化手段24aに供給される。
【0074】その多重化手段24aでは、フィルタバン
ク222、TNS223、・・・、イタレーションルー
プ226より供給されるビットストリーム形式の信号を
所定のフォーマットの位置に配置するようにして多重化
の作業を行なう。また、多重化手段24では、多重化手
段24aの作業結果に、CRCデータ生成手段23から
供給されるCRC符号をさらに多重化することにより、
符号化ビットストリームが生成されて供給される。
【0075】以上述べたように、再符号化部20aに供
給されたオーディオ信号の一部は、聴覚心理モデル22
1にも供給されるが、その周波数分析を行うことにより
周波数毎に聴覚に雑音として知覚されないためのマスキ
ングレベルが求められ、その求められたマスキングレベ
ルを基に所定の伝送レートにより符号化された符号化ビ
ットストリームが生成され、出力されるものである。
【0076】そして、ここでは符号化ビットストリーム
を生成するための代表的な符号化機能ブロックについて
示したが、その機能ブロックは図5に示した以外にも存
在し、その機能ブロックを用いて更なる高圧縮の符号化
信号が生成される。
【0077】ここでは、MPEG2−AAC規格に制定
される機能ブロックの個々に関する説明は省くが、いず
れの機能ブロックを用いる場合の動作も同様であるの
で、その機能ブロックに対する一般的な動作について述
べる。
【0078】図6に、その一般的な機能ブロックの構成
を示す。同図において、その機能ブロックであるモジュ
ールXは入力A、内部処理B、ストリーム情報出力C、
及びデータ出力Dとよりなり、そのモジュールXには制
御ラインが接続される構成となっている。
【0079】このように構成されるモジュールXは、入
力Aとして供給されるオーディオ信号、又は符号化処理
途中のオーディオ信号が供給され、供給された入力信号
は制御ラインより供給される制御信号に基づいて内部処
理Bがなされ、内部処理Bのなされた信号は出力Dより
次のモジュール、ないしはCRCデータ生成手段23に
供給されると共にその出力信号はストリーム情報C即
ち、ビットストリーム形式の信号とされて多重化手段2
4aに供給される。
【0080】そして、この制御部30よりモジュールX
に供給される制御信号によって、メモリ40に一時記憶
されたCRCデータが用いられてオーディオ信号の編集
がなされるか否かの選択が行われる。
【0081】CRCデータを使用しない場合、モジュー
ルXにおける通常処理の場合では、供給される入力A信
号に対して、内部処理Bがなされ、ストリーム情報Cと
出力Dが出力される。
【0082】またCRCデータを使用する場合には、メ
モリ40に一時記憶されたCRCデータがストリーム情
報Cとして供給されるためには、どのような内部処理が
入力Aに適応されるべきかが算出され、その内部処理が
実行された結果として、出力Dが得られる。
【0083】このようにして、供給されるオーディオ信
号に対して、又はビットストリーム信号に対して制御部
30からの制御に基づいて編集されたビットストリーム
の信号が生成される。
【0084】次に、これらのモジュールを用いて行うビ
ットストリームの変換について述べる。図7は、符号化
オーディオ信号のビットレート変換に係るパラメータ変
更について示したものである。
【0085】同図に示すビットレートの変換は、伝送レ
ートが144kbpsである2チャンネルの信号を12
8kbpsの信号に変換する場合の主要な変数に係る情
報割り当てについて例示したものである。
【0086】その変数について述べるに、frame#length
はビットストリーム1におけるフレーム長であり、glob
al#gainは量子化器のステップサイズを変えることによ
りビットストリームの伝送レートを調整するためのパラ
メータであり、そしてscalefactorは量子化歪調整用の
パラメータである。
【0087】また、common#winodwは左及び右チャンネ
ルのオーディオ信号を符号化する際に使用するMDCT
演算の演算期間であるウインドウを共通のものを用いる
か否かを示す変数であり、そしてwindow#seqenceは適応
する窓関数がサイン(sin)であるかKBD(Kaiser-Be
ssel Derived)窓であるか等の窓関数の種類を示す変数
である。
【0088】これらの変数を用いて行うビットレートの
変換では、frame#lengthをビットレートの比に対応させ
て変えることにより符号化部、及び復号化部で扱われる
符号化ビットストリームは、一時記憶される図示しない
バッファ内における一時記憶量の時間毎の推移の様態が
変換前と後とで同様な動作がなされるようにするためで
ある。
【0089】また、global#gainに関しては、適応させ
た値を初期値として、使用ビット数制限に当てはまるよ
うにイタレーションループモジュール226で生成され
る符号化ビットレートを制御し、符号化ビットストリー
ムのデータ量が目標値より少ないときは、そのデータ不
足部分にFILエレメントを充当するようにしてビット
レートを所定値になるようにしている。
【0090】即ち、global#gainのパラメータを変更す
ることによりオーディオ信号の周波数スペクトル全体に
対するレベル調整がなされるが、そのパラメータの変更
により量子化値を大きくする、そして大きな量子化値に
より量子化係数がゼロになりやすくなるなどにより符号
を割り当てるためのビット数制御が行われるようになさ
れている。
【0091】 前述の図7において、144kbps、
2chの情報が、メモリ40に一時記憶されたCRCデ
ータであり、制御部30において、CRCデータの使用
を選択した場合に、情報の与え方の項に示したような変
更を加えることで、128kbps、2chに再符号化
を行なうパラメータとする。例えば、scalefactorは符
号化の結果として得られる変数であるから、前述の図6
におけるストリーム情報Cに相当している。CRCデー
タを使用した場合には、前述の様に、このscalefactor
を得るために必要な内部処理が再符号化時に行なわれ
る。
【0092】再符号化は、1度符号化及び復号化した信
号に対して、再度符号化を行なうため、1次符号化によ
る量子化雑音と、2次符号化による量子化雑音の両者を
含む符号化信号が生成されることになり、再符号化を繰
り返すことで、そのエラーが無相関で生じる場合の雑音
信号は3dBずつ増加していくことになる。
【0093】高品質な符号化信号を得るためにはこの様
な量子化雑音の累積は好ましくない。そこで、1次符号
化時に原音より得られたパラメータ、ここでは、メモリ
40に一時的に記憶されたCRCデータを使用すること
で、量子化雑音の累積を防ぐことが出来、1次符号化時
の品質を保ったまま、ビットレート変換が可能となる。
また、この音声符号化信号編集装置は、符号化されて供
給された音声信号の元である音声データを利用できると
き、例えば音源にCDが用いられており、その同一タイ
トルのCDが入手できるときは復号された音声信号の代
りにそのCDを用いるようにし、メモリ40に一時的に
記憶されたCRCデータを使用することで、1次符号化
での特徴、例えば、低域重視の符号化である等を生かし
た形で、ビットレート変換が可能となる。
【0094】そして、そのCDにウオーターマーク信号
が記録されているような場合は、そのウオーターマーク
信号を元に同じCDを得ることが容易であり、復号化し
たオーディオ信号の代りにオリジナルオーディオ信号を
使用することが可能となる。
【0095】この音声符号化信号編集装置が有するメモ
リ40には、そのようなオリジナル音響信号をも蓄積し
ておき、それを用いて高品質なオーディオ信号の符号化
を行なうこともできる機能を有している。
【0096】以上述べたように、ここに示した音声符号
化信号編集装置によれば、高品質な圧縮オーディオ信号
ビットストリームの復号化、及び再符号化の際に、ビッ
トストリーム中の誤り検出(CRC)符号で保護される
部分のデータを毎フレーム毎に蓄積しておき、その蓄積
されたCRCデータを再符号化時に使用し、再符号化に
よって得られたビットストリーム形式の信号より生成さ
れたCRC符号を用いて新たな符号化ビットストリーム
を生成することにより、パラメータ変更を伴うビットス
トリームの編集、またオリジナルに近い高品質なオーデ
ィオ信号を用いての符号化が可能とされるものである。
【0097】なお、以上述べた実施例では変換対象のビ
ットストリームの符号化方式はMPEG2−AACを中
心として述べたが、符号化方式はMPEG−2に限るこ
となく、例えばMPEG−1、MPEG−4などにより
符号化された所定量の符号化された音響信号データに係
り、ないしはヘッダー情報の所定部分に係り、データ誤
りの保護をMPEG2−AACと同様に行うようなデー
タ構造のビットストリームとして伝送、あるいは記録す
るような場合にも適用可能である。
【0098】そして、これらの編集前及び編集後のビッ
トストリームがそれぞれ、固定ビットレート、又は可変
ビットレートのいずれの場合であってもこの様な手法は
適用可能なものである。
【0099】
【発明の効果】請求項1記載の発明によれば、誤り訂正
符号の付加される音声符号化データの信号部分を検出し
てメモリに一時記憶すると共に、その音声符号化データ
の所定部分を編集して編集ビットストリームを生成し、
その生成された編集ビットストリームに一時記憶された
信号部分を多重化するようにして編集済みビットストリ
ームを生成するため、編集済みビットストリームに関し
てもそのビットストリームの復号上重要である信号部分
はそのまま付加されるため、編集済みビットストリーム
に付加される信号部分に係るデータ部分が消滅すること
は無く、信頼性の高い編集済みビットストリーム信号を
得ることが可能な音声符号化データの編集方法を提供す
ることが出来る効果がある。
【0100】また、請求項2記載の発明によれば、請求
項1記載の発明により得られる効果に加え、編集済みビ
ットストリームは一時記憶した信号部分の情報を基に算
出した符号化パラメータにより再符号化することで、復
号、及び再符号化による量子化雑音の増加を防いだ、高
音質で信頼性の高い編集済みビットストリーム信号を得
ることが可能な音声符号化データの編集方法を提供する
ことが出来る効果がある。
【0101】また、請求項3記載の発明によれば、請求
項1記載の発明により得られる効果に加え、編集済みビ
ットストリームはそのビットストリームと同一の音源を
用いて、さらに一時記憶した信号部分の情報を基に算出
した符号化パラメータにより再符号化することで、復
号、及び再符号化による量子化雑音の増加を防いだ、高
音質で信頼性の高い編集済みビットストリーム信号を得
ることが可能な音声符号化データの編集方法を提供する
ことが出来る効果がある。
【0102】また、請求項4記載の発明によれば、請求
項1記載の発明により得られる効果に加え、編集済みビ
ットストリームが誤り信号検出用符号の含まれるビット
ストリームであるときは、その部分のデータに新たに生
成した誤り検出信号のデータを置換するようにして編集
済みビットストリームを得ることができるため、信頼性
の高い音声符号化ビットストリーム信号を得ることが可
能な音声符号化データの編集方法を提供することが出来
る効果がある。
【0103】そして、請求項5記載の発明によれば、誤
り訂正符号の付加される音声符号化データの信号部分を
検出してメモリ手段に一時記憶し、また供給される音声
符号化信号の所定部分を編集して編集ビットストリーム
を生成し、その生成された編集ビットストリームに一時
記憶された信号部分を多重化するようにして編集済みビ
ットストリームを生成するようにしたため、編集済みビ
ットストリームに対してもそのビットストリームの復号
上重要である信号部分はそのまま付加され、編集済みビ
ットストリームに付加される信号部分に係るデータ部分
が消滅することは無く、信頼性の高い編集済みビットス
トリーム信号を得ることが可能な音声符号化信号編集装
置の構成を提供することが出来る効果がある。
【図面の簡単な説明】
【図1】本発明の実施例に係る音声符号化信号編集装置
の概略構成を示す図である。
【図2】MPEG2−AACのLCプロファイルによる
ビットストリームの構成を示す図である。
【図3】MPEG2−AACのLCプロファイルによる
ビットストリームにおけるCRC符号の付されるデータ
部分を示す図である。
【図4】オーディオ信号の符号化を行うための量子化式
と、復号を行うための逆量子化式を示す。
【図5】本発明の実施例に係るMPEG2−AAC方式
符号化主要部の構成を示す図である。
【図6】本発明の実施例に係るMPEG2−AAC方式
符号化用機能ブロックの構成を示す図である。
【図7】符号化オーディオ信号のビットレート変換に関
するパラメータ変更について示したものである。
【符号の説明】
1 音声符号化信号編集装置 10 復号化部 11 CRCデータ取得手段 12 CRCデータ検出手段 20 符号化部 20a 再符号化部 21 データ取得手段 22 編集データ生成手段 23 CRCデータ生成手段 24、24a 多重化手段 30 制御部 40 メモリ 221 聴覚心理モデル 222 フィルタバンク 223 TNS 224 インテンシティステレオ 225 M/Sステレオ 226 イタレーションループ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】圧縮符号化されたオーディオ信号に係るビ
    ットストリームが供給され、そのビットストリームの編
    集を行う音声符号化データの編集方法であって、 前記供給されるビットストリームに付加される誤り検出
    処理に係る信号部分を検出してその信号部分を一時記憶
    すると共に、前記供給されるビットストリームの所定部
    分を編集して編集ビットストリームを得る第1のステッ
    プと、 その第1のステップで得られた編集ビットストリームに
    前記一時記憶した信号部分を付加して編集済みビットス
    トリームを生成する第2のステップと、 を少なくとも有することを特徴とする音声符号化データ
    の編集方法。
  2. 【請求項2】前記第1のステップにおける編集ビットス
    トリームは、前記一時記憶した信号部分の情報を基に算
    出した符号化パラメータにより再符号化して得られるビ
    ットストリームであることを特徴とする請求項1記載の
    音声符号化データの編集方法。
  3. 【請求項3】前記第1のステップにおける編集ビットス
    トリームは、前記供給されるビットストリームに付随さ
    れる付随情報を基にしてそのビットストリームの生成に
    係る信号を得、その得られた信号を、一時記憶した信号
    部分の情報を基に算出した符号化パラメータにより再符
    号化して得られるビットストリームであることを特徴と
    する請求項1記載の音声符号化データの編集方法。
  4. 【請求項4】前記第2のステップにおける信号部分は、
    前記第1のステップにおける編集ビットストリームの所
    定部分に対して誤り訂正符号の付加された信号部分であ
    ることを特徴とする請求項1記載の音声符号化データの
    編集方法。
  5. 【請求項5】圧縮符号化されたオーディオ信号に係るビ
    ットストリームが供給され、そのビットストリームの編
    集を行う音声符号化信号編集装置であって、 前記供給されるビットストリームに誤り検出符号の付加
    される保護ビットストリーム部分を検出し、その保護ビ
    ットストリーム部分を一時記憶する一時記憶手段と、 前記供給されるビットストリームの所定部分を編集する
    ことにより生成した編集ビットストリームを得る編集ビ
    ットストリーム生成手段と、 前記編集ビットストリーム生成手段により得られた編集
    ビットストリームに前記一時記憶した保護ビットストリ
    ーム部分を多重化して多重化ビットストリームを得る多
    重化手段と、 を具備して構成することを特徴とする音声符号化信号編
    集装置。
JP2001160216A 2001-05-29 2001-05-29 音声符号化データの編集方法、及び音声符号化信号編集装置 Pending JP2002351499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001160216A JP2002351499A (ja) 2001-05-29 2001-05-29 音声符号化データの編集方法、及び音声符号化信号編集装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001160216A JP2002351499A (ja) 2001-05-29 2001-05-29 音声符号化データの編集方法、及び音声符号化信号編集装置

Publications (1)

Publication Number Publication Date
JP2002351499A true JP2002351499A (ja) 2002-12-06

Family

ID=19003665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001160216A Pending JP2002351499A (ja) 2001-05-29 2001-05-29 音声符号化データの編集方法、及び音声符号化信号編集装置

Country Status (1)

Country Link
JP (1) JP2002351499A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005283834A (ja) * 2004-03-29 2005-10-13 Nec Corp Adtsフレーム音声fs回路、aac再エンコーダ回路及び音声fs回路
WO2014065497A1 (ko) * 2012-10-23 2014-05-01 에스케이텔레콤 주식회사 양자키 분배 프로토콜에서 비트 오류 수정을 위한 치환 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005283834A (ja) * 2004-03-29 2005-10-13 Nec Corp Adtsフレーム音声fs回路、aac再エンコーダ回路及び音声fs回路
JP4511860B2 (ja) * 2004-03-29 2010-07-28 日本電気株式会社 Adtsフレーム音声fs回路、aac再エンコーダ回路及び音声fs回路
WO2014065497A1 (ko) * 2012-10-23 2014-05-01 에스케이텔레콤 주식회사 양자키 분배 프로토콜에서 비트 오류 수정을 위한 치환 방법
US10103881B2 (en) 2012-10-23 2018-10-16 Sk Telecom Co., Ltd. Permutation method for correcting bit error in quantum key distribution protocol

Similar Documents

Publication Publication Date Title
EP1455345B1 (en) Method and apparatus for encoding and/or decoding digital data using bandwidth extension technology
JP5032314B2 (ja) オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
US20080262853A1 (en) Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US8374858B2 (en) Scalable lossless audio codec and authoring tool
JP2006031012A (ja) マルチチャンネルオーディオデータ符号化方法、マルチチャンネルオーディオデータ復号化方法、マルチチャンネルオーディオデータ符号化装置、マルチチャンネルオーディオデータ復号化装置、マルチチャンネルオーディオデータを符号化するためのプログラムを記録した媒体及びマルチチャンネルオーディオデータを復号化するためのプログラムを記録した記録媒体
KR20160015245A (ko) 오디오 신호를 인코딩하기 위한 방법, 오디오 신호를 인코딩하기 위한 장치, 오디오 신호를 디코딩하기 위한 방법 및 오디오 신호를 디코딩하기 위한 장치
EP1446797B1 (en) Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth
KR101207110B1 (ko) 스케일러블 무손실 비트스트림의 인코딩 방법
JP2002014697A (ja) ディジタルオーディオ装置
JP6728154B2 (ja) オーディオ信号のエンコードおよびデコード
WO2014072260A2 (en) Reduced complexity converter snr calculation
CN101292428A (zh) 用于编码/解码的方法和装置
JP2004199075A (ja) ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置
US20110311063A1 (en) Embedding and extracting ancillary data
US20120035940A1 (en) Audio signal processing method, encoding apparatus therefor, and decoding apparatus therefor
US7647221B2 (en) Audio level control for compressed audio
JP2002351499A (ja) 音声符号化データの編集方法、及び音声符号化信号編集装置
JP4347634B2 (ja) 符号化装置及び符号化方法
JP4862136B2 (ja) 音声信号処理装置
JP2002156998A (ja) オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置
RU2404507C2 (ru) Способ и устройство для обработки звукового сигнала
JP2008033211A (ja) 付加信号生成装置、信号変換された信号の復元装置、付加信号生成方法、信号変換された信号の復元方法および付加信号生成プログラム
JP3692959B2 (ja) 電子透かし情報埋め込み装置
JP2021124719A (ja) 音声符号化装置および音声復号装置、ならびにプログラム
JP2003029797A (ja) 符号化装置、復号化装置および放送システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050726

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060627