JP4402834B2 - ガードバンドを用いるビデオ信号内へ圧縮されたデジタルオーディオ信号を埋め込む方法及び装置 - Google Patents

ガードバンドを用いるビデオ信号内へ圧縮されたデジタルオーディオ信号を埋め込む方法及び装置 Download PDF

Info

Publication number
JP4402834B2
JP4402834B2 JP2000536202A JP2000536202A JP4402834B2 JP 4402834 B2 JP4402834 B2 JP 4402834B2 JP 2000536202 A JP2000536202 A JP 2000536202A JP 2000536202 A JP2000536202 A JP 2000536202A JP 4402834 B2 JP4402834 B2 JP 4402834B2
Authority
JP
Japan
Prior art keywords
block
audio information
audio
encoded
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000536202A
Other languages
English (en)
Other versions
JP2002507101A (ja
JP2002507101A5 (ja
Inventor
トッド、クレイグ・キャンベル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2002507101A publication Critical patent/JP2002507101A/ja
Publication of JP2002507101A5 publication Critical patent/JP2002507101A5/ja
Application granted granted Critical
Publication of JP4402834B2 publication Critical patent/JP4402834B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23602Multiplexing isochronously with the video sync, e.g. according to bit-parallel or bit-serial interface formats, as SDI
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23614Multiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/242Synchronization processes, e.g. processing of PCR [Program Clock References]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4342Demultiplexing isochronously with video sync, e.g. according to bit-parallel or bit-serial interface formats, as SDI
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4348Demultiplexing of additional data and video streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Television Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

【0001】
【産業上の利用分野】
本発明は概してビデオ/オーディオアプリケーション(応用業務)におけるオーディオ信号処理に関する。特に、本発明は、信号処理遅延の通常変動がビデオ及びオーディオ情報の整列、即ち、整列状態を乱さないように、空隙又は保護周波数帯域(ガードバンド)で分離されたオーディオ情報のブロック系列を符号化するブロックコーデイング(符号化)方法に関する。
【0002】
【発明の背景】
デジタルオーディオ情報をビデオ情報のフレーム内に埋め込む各種の面を限定する、幾つかの国際標準が開発されてきている。例えば、映画・テレビエンジニア学会(SMPTE)によって発行された標準SMPTE259Mは、逐次デジタルインタフェース(SDI)を定めている。そこでは、4チャンネルまでのデジタルオーディオ信号が、成分及び合成逐次デジタルビデオ信号内に埋め込まれ得る。標準SMPTE272Mは、どのようにしてデジタルデジタルオーディオ信号がビデオ情報フレーム以内の補助的データ空間に埋め込まれるべきかの完全な定義を与える。
【0003】
デジタルオーディオ情報それ自体の逐次伝送、即ち、送信は各種の国際標準の主題である。例えば、オーディオエンジニアリングソサエティ(AES)によって発行された標準AES3(ANSI S4.40)は、線形パルスコード変調(PCM)の形で表わされる2チャンネルデジタルオーディオの逐次送信を定める。この標準によると、2チャンネル用PCMサンプルは飛越し走査されかつ対で伝えられる。
【0004】
殆どすべての記録及び放送応用業務(アプリケーション)における共通の活動は、埋め込まれたビデオ/オーディオ情報流れの編集、即ち、切断及び新しい単一流れを形成するために切取られた流れをスプライス(接合)することである。同様な活動では、多重情報流れを合体するか若しくは多重流れ間の切替えによって情報流れを発生させる。普通ではビデオ情報は、編集又は切断点がビデオフレームと正常に整列されるようにする基本的な同期基準である。
【0005】
AES11のような標準は、スタジオ業務(操作)でデジタルオーディオ設備を同期させる推奨実施手段を定める。AES11は、ジッタ又は処理遅延によって生じるタイミング不確実性を制御することに向けられると共にビデオフレーム情報をAES3デジタルオーディオ情報流れの2サンプルフレームと整列させることを考慮している。この標準を堅持する装置及び方法は、同期された信号が所与の時間に亘って同一数のフレームを有しかつ共通のタイミングを持つサンプルを含むことを保証し得る。不幸にして、ビデオ情報及びそれより大きい間隔をもつオーディオ情報との整列状態を定める標準又は実施手段は現存しない。その結果、異なった製造業者からの装置及び同一製造業者からの装置でさえ、オーディオ情報及びビデオ情報の相対的整列状態にかなりの大きさの不確実性がもたらされるような、タイミング及び処理遅延上の変動を有する。
【0006】
この整列上の不確実性は、AES3標準で定められるようなオーディオ情報の線形表示を用いる応用業務では殆ど問題にならない。各編集点がオーディオ情報の2サンプルフレーム間で起こるように限定されているので、ビデオ/オーディオ整列上のあらゆる不確実性がオーディオ情報の損失に帰着することはない。それは人に提供される音声画像との相対的タイミングに影響を与えるのみで、これが気づかれることはなさそうである
【0007】
しかし、より多くのオーディオチャンネルをビデオ/オーディオデータ流れ内に埋め込むビットレート低減符号化技術を用いる適用業務が増えている。これらの符号化技術は、符号化された情報のブロックを発生させるために128又はそれ以上のオーディオサンプルのサンプルブロックにしばしば用いられる。これらのサンプルブロックは典型的に3乃至12msの間隔に跨るオーディオ情報を表わす。これらの符号化処理で発生される符合化された情報の各ブロックは最小単位の情報を表わし、それから原オーディオ情報の1区分の適度に正確な複製(レプリカ)が回復され得る。スプリットバンド(分割帯域)コーディング技術は、オーディオ信号の周波数サブバンド表示に心理音響学に基づく符号化を用いることによってビットレートを低減させる。周波数サブバンド表示は、複数の帯域濾波フィルタを用いることによって又は1つ又はそれ以上の変換を用いることによって発生され得る。論議を容易にするために、これらのスプリットバンド符号化技術は、サブバンド信号を発生させるためにフィルタバンクを用いるとの観点から記載される。
【0008】
【発明が解決すべき課題】
上記整列上の不確実性はこれらのブロックコーディング適用業務では重要である。その理由は、編集点が符号化されたブロック境界以内にくることは、そのブロックの1部分と残りの信号とが切り離されるという結果になるからである。符号化されたブロックの部分的損失は、回復された信号中の、概して3ms又はそれ以上の持続期間に亘る損失によって明らかになるであろう。そのような損失は人の聴覚システムで識別されそうであろう。
【0009】
この問題は、処理後の処理を用いることによって避けられ得る。即ち、同処理では符号化されたオーディオに復号処理を用い、回復されたPCM表示を必要に応じて編集しかつ編集されたPCMオーディオ情報に符号化処理を用いて新しい符号化された表示を発生させることによって、原オーディオ信号のPCM表示が回復される。この解決は、追加のコスト及び復号/再符号化処理から結果的に生じるオーディオ品質の劣化のためにつまらない。さらに、以下に説明する論議を読んだ後でより良く理解される理由で、復号/再符号化処理がオーディオ情報流れに追加の遅延を導入するので後処理には興味がない。
【0010】
【課題を解決するための手段】
本発明の目的は、上記のような問題を回避すると同時に編集及び切替えのような作用を可能にする、埋め込まれたビデオ/オーディオ情報の処理に備えることである。
【0011】
本発明の1面の教示によると、本発明の方法は、オーディオ情報を伝える入力オーディオ信号を受信し、列をなすビデオフレームに対する時間基準を示すビデオフレーム基準を受信し、入力オーディオ信号にブロック符号化処理を用いて、ビットレートが低減された形のオーディオ情報から符号化されたオーディオ情報のブロックを発生させると共に符号化されたオーディオ情報ブロックを時間圧縮し、複数の列をなす時間圧縮されたブロックから成り、それぞれの列の開始ブロックと、先行する列の終端ブロックとが、それぞれのビデオフレーム基準との時間整列を行う空隙だけ離れているようなオーディオ流れにアセンブルすることから成る。
【0012】
本発明及びその望ましい実施形態の各種の特徴は、幾つかの図面では同一参照番号で同一要素が示される添付図と共に以下の論議を参照することによってよりよく理解されるであろう。以下の論議及び図面の内容は例としてのみ説明され、本発明の範囲を限定するものと理解すべきではない。
【0013】
【実施形態】
システム概観
図1は、多重ビデオ/オーディオデータ流れを記録かつ伝送するシステムの1実施形態を例示し、本発明の各面を有利に利用し得るシステムの1例を表す。明確化のために、他のすべての図と同様に本図は、装置を同期させるために用いられるマスタクロック信号を伝える信号経路(路)は示さない。本論議では、経路21、22、23及び24に沿って発生されるようなこれらの信号は標準SMPTE 259M及びSMPTE 272Mに準拠するが、本発明を実施するためには、特定の標準又は信号フォーマットは肝要ではない。例えば、同システムの代わりの実施形態では、各々がそれぞれのビデオ及びオーディオ情報を伝える別別の信号は、経路21乃至24に沿って発生され、ルータ(ルート設定手段)31はビデオ及びオーディオ情報を別々に伝送する回路要素を含む。そのような実施形態ではSDI逆(脱)埋め込み手段がSDI埋め込み手段12及びルータ31間に挿入される。この代わりの実施形態は、本発明を実施するために特定の信号フォーマットは肝要でないことを証明するために言及される。
【0014】
ビデオテープレコーダ(VTR)16は、経路1からビデオ情報を受信し、経路2からオーディオ情報を受信してこのビデオ/オーディオ情報をテープ上に記録する。次いで、VTR16は、テープ上に記録されたビデオ/オーディオ情報を読取り、埋め込まれたオーディオ情報を有するビデオ情報を伝える再生信号を経路21に沿って発生させる。同様に、VTR17は、経路3及び4からビデオ及びオーディオ情報をそれぞれ受信し、その後埋め込まれたオーディオ情報を有するビデオ情報を伝える再生信号を経路22に沿って発生させる。
【0015】
VTR16、VTR17及びVTR18は、再生中にオーディオ情報をビデオ情報内へ埋め込む逐次デジタルインタフエース(SDI)埋め込み手段のような回路要素を含む。
【0016】
SDI埋め込み手段11は、経路5及び6からビデオ及びオーディオ情報をそれぞれ受信し、埋め込まれたデジタルオーディオ情報を有するデジタルビデオ情報を伝える信号を経路14に沿って発生させる。SDI逆埋め込み手段のような回路要素を含むVTR18は、ビデオ/オーディオデータ信号からオーディオ情報を抽出し、テープ上に分離されたビデオ及びオーディオ情報を記録する。次いで、VTR18はテープからビデオ及びオーディオ情報を回復させ、ビデオ及び埋め込まれたオーディオ情報を伝える再生信号を経路23に沿って発生させるために、SDI埋め込み手段のような回路要素を用いる。しかし、デジタルデータレコーダがVTRの代わりに置き換えられるなら、ビデオ/オーディオデータ流れそれ自体が記録されかつ再生され得るので、埋め込み手段及び逆埋め込み手段は共に不要である。
【0017】
SDI埋め込み手段12は、経路7及び8からビデオ及びオーディオ情報を受信し、埋め込まれたデジタルオーディオ情報を有するデジタルビデオ情報を伝える信号を経路4に沿って発生させる。
【0018】
SDIルータ31は、経路21、22、23及び24からビデオ/オーディオ信号を受信し、これらの信号を経路34に沿って再生/記録装置41へ選択的に伝えるか又は切り替える。SDIルータ31によって受信される信号の数は重要ではない。再生/記録装置41は、経路34に沿って通される信号を用いる任意の装置を表す。例えば、それはVTRのような記録装置又はテレビセットのような再生装置でもよい。さらに、再生/記録装置41は、SDI逆埋め込み手段31に関して離れて配置され、その場合には経路34は通信又は放送チャンネルを表わす。
【0019】
ビデオ/オーディオ整列状態偏移
VTR16、17、18及びSDI埋め込み手段11、12の回路遅延は、ビデオ情報とオーディオ情報の相対的整列状態を変え得る。その結果、再生信号21のビデオ情報及びオーディオ情報の整列状態は、例えば、それぞれ経路1及び2から受信したビデオ情報とオーディオ情報と間の整列状態とは偏移していることがある。異なった製造業者からの装置間で変わる整列状態の変化量は、同一製造業者からの装置間で変わり、たとえ所与の1装置以内であっても、例えば、バッファの初期化状態の関数として変わり得る。
【0020】
図2Aを参照すると、信号111はビデオフレーム基準101及び102と特定の整列状態を有するオーディオ情報を表わす。これらのビデオフレーム基準の各々は、それぞれのビデオフレーム内の特定基準点を示す。例えば、NTSCビデオ情報のための共通基準点は、各フレーム内のライン10のためのビデオ情報と一致する。PALビデオ情報のための共通基準点は、各フレーム内のライン1と一致する。
【0021】
図2Bでは、信号121は信号111によって伝えられるものと同一のビデオ情報を表わすが、信号111より遅らされる。その結果、信号121ビデオフレーム基準との整列状態は、信号111との整列状態とは偏移する。図2Cでは、信号131は信号111によって伝えられるものと同一のビデオ情報を表わすが、信号111より進められる。それゆえに、信号131ビデオフレーム基準との整列状態は、信号121との整列状態偏移とは逆になるように変化する。
【0022】
図1を参照して、図2Aで表わされるオーディオ情報及びオーディオの整列状態が、図1における経路1/2、3/4、5/6及び7/8によって伝えられるとしたらどうだろう。図2A乃至2Cで例示されるような整列状態の異なった偏移が、経路21乃至24に沿って発生される信号内に存在しそうであろう。さらに、図2A乃至2Cで例示される整列状態が、それぞれ経路21乃至23に沿って発生される信号内に存在するとしたらどうだろう。SDIルータ31がこれら3つの経路から受信される信号間で切り替える場合には、経路34に沿って送られる信号に埋め込まれるオーディオ情報内には小さな不連続性が起こるであろう。もし、オーディオ情報が、PCMのような線形形式で表わされるなら、この不連続性は僅かなサンプルのみに関するので、多分不連続性は聴取者によって知覚され得ないであろう。異なったオーディオ内容を有する2信号間の不連続性を識別するのは特に困難であろう。
【0023】
符号化の効果
しかし、より大きな数のオーディオチャンネルをビデオ/オーディオデータ流れ内に埋め込む関心が増大している。これらのより大きな数のオーディオチャンネル内の情報容量がオーディオ情報のために利用可能なスペースの容量を越える場合には、幾つかの形式の帯域幅又はビットレート圧縮が用いられる。このような圧縮の一例が心理音響学原理に基づくオーディオ符号化である。
【0024】
これらの符号化技術は、符号化された情報のブロックを発生させるためにオーディオサンプルのブロックにしばしば用いられる。これらのサンプルブロックは、概して3乃至12msの間隔に跨るオーディオ情報を表わす。これらの符号化処理によって発生される符号化された情報の各ブロックは、最小単位の情報を表わし、同情報から原オーディオ情報の区分の適度に正確なレプリカが回復され得る。
【0025】
一続き、即ち、一系列の符号化された情報ブロック112は、パルスの列として図2Aに表わされる。これらのブロックによって伝えられる情報は、信号111内のオーディオ情報の符号化された表示である。パルスの形状及びサイズは重要ではない。パルス列は、互いに接するか又は、望ましくは互いに重複するオーディオサンプルのブロックに相当する符号化された情報を伝える一続きのブロックを示唆することのみが意図される。図2Aに示される例では、隣接ビデオフレーム基準間の間隔を跨ぐオーディオ情報は、符号化された情報の6つのブロックによって表わされる。ビデオ/オーディオ応用業務におけるオーディオコーデイングの品質を改良する各種の要件は、WO-A 99/21187に開示される。
【0026】
ブロック符号化技術が図1のシステムで用いられる場合、SDIルータ31が経路21乃至24を通して受信する信号は、ブロック内に符号化されオーディオ情報を含む。既に述べた通り、符号化された情報ブロック及びビデオフレーム基準間では整列状態の偏移が変化し得る。これは、ビデオフレーム基準101と、例えば、それぞれ図2A、2B及び2Cに示されるブロック112、122及び132との間の異なった整列状態によって例示される。上記のように、図2A乃至2Cに例示された整列状態がそれぞれ経路21乃至23に沿って発生される信号内に存在するとしたらどうだろう。SDIルータ31が、ビデオフレーム基準101において、経路22を介して受信する信号(図2Bに例示される)から、経路23を介して受信される信号(図2Cに例示される)へ切り替えるとき、スイッチ点におけるかなりの量のオーディオ情報は経路23に沿って送られる信号から回復され得ない。
【0027】
一方ではオーディオ情報を回復するためには全ブロックが必要とされるが、他方ではスイッチ点後当該ブロックの一部が失われるので、スイッチ点に先立つブロック123で伝えられるオーディオ情報は回復され得ない。同様に、スイッチ点後ブロック133で伝えられるオーディオ情報は、スイッチ点に先立つブロック133の一部が失われるので回復され得ない。
【0028】
この問題は図1に例示された型のシステムにとって独特ではない。例えば、単一VTRに関するテープ編集又はオーディオダビングでもまた問題はおこる。
【0029】
以下にさらに詳説されるように、本発明はオーディオ情報の損失なしにビデオ/オーディオ整列上のかなりの変動が許容されるように、符号化されるオーディオ流れに保護バンド又は空隙を形成することによってこの問題を克服する。
【0030】
符号化信号プロセッサ
図3は、図1に例示されたようなシステム内へ各種の方法で組入れられ得るビデオ/オーディオプロセッサを例示する。図示される実施形態では、埋め込まれたオーディオ情報を有するビデオ情報を伝える複数の信号が入力信号経路61−1、61−2及び61−3から受信される。図には3つの入力信号経路が示されるが、本発明の実施形態は本質的にあらゆる数の入力信号用の信号経路を備え得る。信号分配器62は、切替え、合体、編集、スプライシング及び記憶/検索等広範囲の信号分配処理を表わす。簡単のために、本明細書での例示及び論議は、信号分配器62は複数のビデオ/オーディオ信号を受信し、埋め込まれたオーディオ情報を有するビデオ情報を伝える単一信号を経路63に沿って発生させるためにこれらの信号を或る方法で処理、分配する。デフォーマッタ64は経路63からビデオ/オーディオ情報を受信し、埋め込まれたオーディオ情報を抽出してそれを経路65に沿って送る。ビデオ情報は経路69に沿って送られ得る。オーディオ信号プロセッサ66は、経路65からオーディオ情報を受信し、符号化された情報のブロックを経路67に沿って発生させるために、オーディオ情報にブロック符号化処理を用いる。フォーマッタ68は、経路67から符号化された情報のブロックを受信し、一系列内の開始ブロック及び先行系列内の終端ブロック間に空隙又はガード(保護)バンドを有する符号化された情報の複数のブロック系列から成る出力信号を経路70に沿って発生させる。マスタクロック信号のような基準信号を用いることで、空隙又はガードバンドがビデオ情報と時間整列される。
【0031】
上記のように、図は装置を同期するために用いられるマスタクロック信号を伝える信号経路は例示しない。望ましい実施形態では、オーディオ信号プロセッサ66はマスタクロック信号と整列されるオーディオサンプルブロックを形成する。この整列状態は図2Aに例示され、そこでは隣接サンプルブロック間の境界がビデオフレーム基準101及び102と一致するが、他の整列状態も用いられ得る。
【0032】
図5Aを参照すると、ブロック112−2の系列は信号区分111−2を表す符号化された情報を伝え、それはビデオフレーム基準101及び102間の一部信号の仮想的時間圧縮表示である。同様に、ブロック112−1系列は信号区分111−1を表す符号化された情報を伝えかつブロック112−3系列は信号区分111−3を表す符号化された情報を伝える。オーディオ信号プロセッサ66及びフォーマッタ68はオーディオ情報の符号化された表示を伝えるブロックの系列を発生させ、そこでは、例えば、ガードバンド又は空隙は系列112−1の終端ブロック及び系列112−2の開始ブロック間に形成されている。
【0033】
図2A乃至2Cに例示された整列の偏移もまた図5A乃至5Cに例示される。これらの図面では、系列122−1、122−2、122−3、132−1、132−2及び132−3は、それぞれ信号区分121−1、121−2、121−3、131−1、131−2及び131−3を表す符号化された情報を伝える。図5B及び5Cから分かるように、ビデオフレーム基準101及び102における潜在スイッチ点がガードバンド内で起こるので、整列状態の偏移の結果としてオーディオ情報の損失は起こらない。
【0034】
図3に示される信号プロセッサは、例えば、埋め込まれたAES3又はPCMオーディオ情報を含むビデオ信号を処理するためにSDIルータ内へ組み込まれ得る。信号分配器62を省略する実施形態が、VTR又はSDI埋め込み手段内へ組み込まれ得る。同様にデフォーマッタ64を省略する他の実施形態がVTR又はSDI埋め込み手段の入力回路内へ組み込まれ得る。
【0035】
図4は、図3に例示された実施形態内へ組み込むのに適すると共に以下に述べる別の効用を有する符号化オーディオ信号プロセッサの一実施形態を例示する。この実施形態によると、オーディオ信号プロセッサ66は複数のフィルタバンク71、72及び73を有する。フィルタバンク71は、経路65−1から受信した信号に応答して、経路75−1乃至75−3に沿って複数の周波数サブバンド信号を発生させる。フィルタバンク72は、経路65−2から受信した信号に応答して、経路76−1乃至76−3に沿って複数の周波数サブバンド信号を発生させる。フィルタバンク73は、経路65−3から受信した信号に応答して、経路77−1乃至77−3に沿って複数の周波数サブバンド信号を発生させる。フィルタバンク71、72及び73は、帯域濾波フィルタバンク、バンド分割フィルタの縦続接続セット及び1つ又はそれ以上の時間領域-周波数領域変換等の多くの方法で実施され得る。各フィルタバンクにつき3つのフィルタバンク及び3つのサブバンド信号のみが示されるが、実施形態は各々が24又はそれ以上のサブバンド信号発生させかつ各々が人の聴覚システムの臨界帯域幅と釣合うか若しくはそれ以下の帯域幅を有する周波数サブバンドを表すそれ以上の多くのフィルタバンクを含み得る。エンコーダ79はサブバンド信号にブロック符号化処理を加えて、経路65−1、65−2及び65−3を介して受信するオーディオ情報を符号化された形で表すブロック系列を経路67aに沿って発生させる。
【0036】
分割帯域符号化は本発明の実施上肝要ではない。ブロックコンパンド(ブロック圧縮伸長型)PCM又はデルタ変調のような符号化形式も用いられ得る。
【0037】
一実用的実施形態では符号化オーディオ信号プロセッサは、線形PCM又は、その代わりに、1つのAES3データ流れの形で8つのオーディオ情報を受信し、8つのフィルタバンク及び1つのエンコーダを用いる。同エンコーダは、2チャンネルのオーディオ情報を伝えるために要するものより大きくない空間又は帯域幅で伝えられ得るガードバンドを有する符号化された情報ブロックを発生させるためにブロック符号化処理を用いる。
【0038】
重複ブロック及びウインド関数
情報ブロックを表すために図で用いられるパルス列は、隣接ブロックは当接するが互いに重複しないことを示唆する。ブロックの特定の配列は本発明の実施上重大ではないが、望ましい実施形態では互いに重複するブロックが処理される。概してオーディオ情報の重複されたブロックは、隣接ブロックの重複されたサンプルの合計が定数と実質的に等しくなるようにウインド関数によって加重又は変調される。
【0039】
図6はブロックの系列を例示する。系列内の開始ブロック141は隣接ブロック142と重複する。系列内の全ブロックは、時間領域内の対応するオーディオ情報を加重するために用いられるウインド関数の形状を有する包絡線によって表される。系列内の終端ブロック146は、先行ブロック及び後続ブロック(図示せず)と重複する。重複の量及びウインド関数の選択は符号化性能に著しい影響を与え得るが、特定のウインド関数又は重複量は本発明にとって決定的ではない。望ましい実施形態では、重複の量はブロック長さの半分でありかつウインド関数はカイザベッセル(Kaiser-Bessel)関数から得られる。
【0040】
既に説明した通り、オーディオ信号プロセッサ86はビデオフレーム基準と整列されるオーディオ情報を発生させる。オーディオ情報のブロック系列を発生させる実施形態では、ビデオフレーム基準が任意の系列ブロック内の任意の点と本質的に一致するように整列され得る。図6に示される例では、開始ブロック141の始めはビデオフレーム基準100と一致する。
【0041】
ある応用業務では、同時発生(一致)の正確な点はビデオフレーム毎に変わり得る。例えば、デジタルオーディオ情報をNTSCビデオ情報と組み合わせる応用例では、オーディオサンプリングレートがビデオフレームレートの整数倍ではないので、連続するビデオフレームは異なった数のオーディオサンプルを持ち得る。
【0042】
ブロック長さ、ウインド関数及びビデオ/オーディオ配列に関する各種の用件は、既に言及してWO-A99/21187で論じられる。
【図面の簡単な説明】
【図1】 多重ビデオ/オーディオデータ流れを記録かつ伝送するシステムの機能構成図である。
【図2】 図2A乃至2Cは、ビデオフレーム基準と各種の整列形を有する仮想オーディオ信号の図式表現である。
【図3】 埋め込まれたオーディオ情報を有するビデオ信号処理装置の1実施形態の機能構成図である。
【図4】 本発明の各面による符号化オーディオ信号プロセッサの1実施形態の機能構成図である。
【図5】 図5A乃至5Cは、本発明により処理されかつビデオフレーム基準と各種の整列形を有する仮想オーディオ信号の図式表現である。
【図6】 ウインド関数によって加重された重複オーディオ情報の図式概略表現である。

Claims (10)

  1. オーディオ情報を処理する方法であって、
    前記オーディオ情報を伝える入力オーディオ信号を受信し、
    列をなすビデオフレームに対する時間基準を示すビデオフレーム基準を受信し、
    前記入力オーディオ信号にブロック符号化処理を用いて、ビットレートが低減された形で前記オーディオ情報から符号化されたオーディオ情報のブロックを発生させると共に、該符号化されたオーディオ情報のブロックを時間圧縮し
    前記時間圧縮されたブロックを、前記時間圧縮されたブロックの複数の列をなす符号化されたオーディオ流れにアセンブルし、それぞれの列の開始ブロックと先行する列の終端ブロックとが、それぞれのビデオフレーム基準との時間整列を行う空隙だけ離れるようにすることから成るオーディオ情報処理方法。
  2. 前記ブロック符号化処理では、前記オーディオ情報を、符号化前より冗長性が少なく知覚的無関係性の少ない形に符号化する、請求項1の方法。
  3. 前記ブロック符号化処理は、
    前記入力オーディオ信号の複数の周波数サブバンド表示を発生させるために、該入力オーディオ信号に帯域濾波フィルタバンク若しくは1つ又はそれ以上の変換を用い、
    心理音響学原理に従って前記周波数サブバンド表示にビットを適応的に割り当てることによって、符号化されたオーディオ情報の前記ブロックを発生させることを含む、請求項2の方法。
  4. 前記ビデオフレームの各々がフレーム間隔と等しい持続期間を有し、前記空隙の持続期間が前記フレームインターバルの約1%乃至約20%の範囲内にある、請求項1乃至3のいずれか1つの方法。
  5. 前記ブロック符号化処理を前記オーディオ情報の重複ブロックに用いる、請求項1乃至4のいずれか1つの方法。
  6. オーディオ情報を処理する装置であって、
    前記オーディオ情報を伝える入力オーディオ信号を受信する手段と、
    列をなすビデオフレームに対する時間基準を示すビデオフレーム基準を受信する手段と、
    前記入力オーディオ信号にブロック符号化処理を用いて、ビットレートが低減された形で前記オーディオ情報から符号化されたオーディオ情報のブロックを発生させると共に、該符号化されたオーディオ情報のブロックを時間圧縮する手段と、
    前記時間圧縮されたブロックを、前記時間圧縮されたブロックの複数の列をなす符号化されたオーディオ流れにアセンブルし、それぞれの列の開始ブロックと先行する列の終端ブロックとが、それぞれのビデオフレーム基準との時間整列を行う空隙だけ離れるようにする手段とから成るオーディオ情報処理装置。
  7. 前記ブロック符号化処理では、前記オーディオ情報を、符号化前より冗長性が少なく知覚的無関係性の少ない形に符号化する、請求項6の装置。
  8. 前記ブロック符号化処理は、
    前記入力オーディオ信号の複数の周波数サブバンド表示を発生させるために、該入力オーディオ信号に帯域濾波フィルタバンク若しくは1つ又はそれ以上の変換を用いる手段と、
    心理音響学原理に従って前記周波数サブバンド表示にビットを適応的に割り当てることによって、符号化されたオーディオ情報の前記ブロックを発生させる手段とを含む、請求項7の装置。
  9. 前記ビデオフレームの各々がフレーム間隔と等しい持続期間を有し、前記空隙の持続期間が前記フレーム間隔の約1%乃至約20%の範囲内にある、請求項6乃至8のいずれか1つの装置。
  10. 符号化されたオーディオ情報の前記ブロックを発生させる手段が、前記オーディオ情報の重複ブロックに前記ブロック符号化処理を用いる、請求項6乃至9のいずれか1つの装置。
JP2000536202A 1998-03-13 1999-03-11 ガードバンドを用いるビデオ信号内へ圧縮されたデジタルオーディオ信号を埋め込む方法及び装置 Expired - Lifetime JP4402834B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/042,367 1998-03-13
US09/042,367 US6085163A (en) 1998-03-13 1998-03-13 Using time-aligned blocks of encoded audio in video/audio applications to facilitate audio switching
PCT/US1999/005249 WO1999046938A1 (en) 1998-03-13 1999-03-11 Method of embedding compressed digital audio signals in a video signal using guard bands

Publications (3)

Publication Number Publication Date
JP2002507101A JP2002507101A (ja) 2002-03-05
JP2002507101A5 JP2002507101A5 (ja) 2009-11-05
JP4402834B2 true JP4402834B2 (ja) 2010-01-20

Family

ID=21921528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000536202A Expired - Lifetime JP4402834B2 (ja) 1998-03-13 1999-03-11 ガードバンドを用いるビデオ信号内へ圧縮されたデジタルオーディオ信号を埋め込む方法及び装置

Country Status (17)

Country Link
US (1) US6085163A (ja)
EP (1) EP1062816B1 (ja)
JP (1) JP4402834B2 (ja)
KR (1) KR100675562B1 (ja)
CN (1) CN1172536C (ja)
AR (2) AR014716A1 (ja)
AT (1) ATE247363T1 (ja)
AU (1) AU760400B2 (ja)
BR (1) BR9909247B1 (ja)
CA (1) CA2323564C (ja)
DE (1) DE69910360T2 (ja)
DK (1) DK1062816T3 (ja)
ES (1) ES2203101T3 (ja)
HK (1) HK1036721A1 (ja)
MY (1) MY125807A (ja)
TW (1) TW473702B (ja)
WO (1) WO1999046938A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6188987B1 (en) * 1998-11-17 2001-02-13 Dolby Laboratories Licensing Corporation Providing auxiliary information with frame-based encoded audio information
US6690428B1 (en) * 1999-09-13 2004-02-10 Nvision, Inc. Method and apparatus for embedding digital audio data in a serial digital video data stream
US8503650B2 (en) * 2001-02-27 2013-08-06 Verizon Data Services Llc Methods and systems for configuring and providing conference calls
US7277427B1 (en) * 2003-02-10 2007-10-02 Nvision, Inc. Spatially distributed routing switch
CN101036329B (zh) * 2004-10-07 2011-06-08 汤姆逊许可公司 音频/视频路由器
PL2052548T3 (pl) 2006-12-12 2012-08-31 Fraunhofer Ges Forschung Koder, dekoder oraz sposoby kodowania i dekodowania segmentów danych reprezentujących strumień danych w dziedzinie czasu
US8750295B2 (en) * 2006-12-20 2014-06-10 Gvbb Holdings S.A.R.L. Embedded audio routing switcher
EP2232843A4 (en) * 2007-12-19 2011-07-27 Colin Simon DIGITAL VIDEO AND AUDIO FLOW SYNCHRONIZATION DEVICE AND METHOD FOR MULTIMEDIA PRESENTATION DEVICES
WO2009088258A2 (ko) * 2008-01-09 2009-07-16 Lg Electronics Inc. 프레임 타입 식별 방법 및 장치
TWI643187B (zh) 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4532556A (en) * 1983-05-20 1985-07-30 Dolby Laboratories Licensing Corporation Time-base correction of audio signals in video tape recorders
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
JP3329076B2 (ja) * 1994-06-27 2002-09-30 ソニー株式会社 ディジタル信号伝送方法、ディジタル信号伝送装置、ディジタル信号受信方法及びディジタル信号受信装置
EP0734021A3 (en) * 1995-03-23 1999-05-26 SICAN, GESELLSCHAFT FÜR SILIZIUM-ANWENDUNGEN UND CAD/CAT NIEDERSACHSEN mbH Method and apparatus for decoding of digital audio data coded in layer 1 or 2 of MPEG format
US5819215A (en) * 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
US5946352A (en) * 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US5860060A (en) * 1997-05-02 1999-01-12 Texas Instruments Incorporated Method for left/right channel self-alignment

Also Published As

Publication number Publication date
ATE247363T1 (de) 2003-08-15
AU760400B2 (en) 2003-05-15
CA2323564C (en) 2008-05-13
AU3183099A (en) 1999-09-27
AR021444A2 (es) 2002-07-17
DE69910360D1 (de) 2003-09-18
HK1036721A1 (en) 2002-01-11
BR9909247B1 (pt) 2014-08-26
JP2002507101A (ja) 2002-03-05
EP1062816B1 (en) 2003-08-13
WO1999046938A1 (en) 1999-09-16
ES2203101T3 (es) 2004-04-01
TW473702B (en) 2002-01-21
MY125807A (en) 2006-08-30
CA2323564A1 (en) 1999-09-16
AR014716A1 (es) 2001-03-28
BR9909247A (pt) 2000-11-28
CN1292979A (zh) 2001-04-25
DE69910360T2 (de) 2004-06-24
CN1172536C (zh) 2004-10-20
KR100675562B1 (ko) 2007-01-29
EP1062816A1 (en) 2000-12-27
KR20010040826A (ko) 2001-05-15
DK1062816T3 (da) 2003-11-03
US6085163A (en) 2000-07-04

Similar Documents

Publication Publication Date Title
EP1142346B1 (en) Encoding auxiliary information with frame-based encoded audio information
US8285106B2 (en) Information processing apparatus
KR100933469B1 (ko) 오디오 코딩
JP3666625B2 (ja) データ記録方法およびデータ記録装置
JP4402834B2 (ja) ガードバンドを用いるビデオ信号内へ圧縮されたデジタルオーディオ信号を埋め込む方法及び装置
JP3763153B2 (ja) データ処理装置及びデータ処理方法
JP2892158B2 (ja) 複合プログラムデジタルビデオ記録再生システム及びその方法
EP0969470B1 (en) Data reproducing apparatus, data recording and reproducing apparatus, data reproducing method and data recording and reproducing method
EP0757491B1 (en) Data encoding and/or decoding apparatus and methods
EP0696114B1 (en) Multiplexing in a data compression and expansion system
US5889917A (en) Method and apparatus for editing an audio-visual signal having audio data that is in the form of block units which are not synchronous with the fields/frames of video data
MXPA00008964A (en) Method of embedding compressed digital audio signals in a video signal using guard bands
JP3185420B2 (ja) 多チャンネル多重装置
JPH08329605A (ja) デイジタルオーデイオ信号処理方法、デイジタルオーデイオ信号処理装置及び記録再生装置
JPH07255032A (ja) 時分割多重化方法
JP2002223415A (ja) Mpeg信号の記録再生装置
JP2004235748A (ja) データ圧縮装置、記録装置、再生装置、記録再生装置、データ圧縮方法、記録方法、再生方法、記録再生方法
JPH03250469A (ja) 音声帯域分割復号化装置
GB2282031A (en) Video and audio information signal processing
JPH0951500A (ja) データ符号化方法、データ復号化装置および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060309

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090811

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090911

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20090911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091020

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091030

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121106

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121106

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131106

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term