JP2020008864A - オーディオスプライシングのコンセプト - Google Patents
オーディオスプライシングのコンセプト Download PDFInfo
- Publication number
- JP2020008864A JP2020008864A JP2019149425A JP2019149425A JP2020008864A JP 2020008864 A JP2020008864 A JP 2020008864A JP 2019149425 A JP2019149425 A JP 2019149425A JP 2019149425 A JP2019149425 A JP 2019149425A JP 2020008864 A JP2020008864 A JP 2020008864A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- data stream
- access unit
- audio data
- packet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 52
- 230000005236 sound signal Effects 0.000 claims description 100
- 230000002123 temporal effect Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 11
- 238000003780 insertion Methods 0.000 claims description 11
- 230000037431 insertion Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 12
- 230000008859 change Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 239000008187 granular material Substances 0.000 description 9
- 230000005284 excitation Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 7
- 241000238876 Acari Species 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23424—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/10—Arrangements for replacing or switching information during the broadcast or the distribution
- H04H20/103—Transmitter-side switching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/34—Flow control; Congestion control ensuring sequence integrity, e.g. using sequence numbers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/70—Media network packetisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/4302—Content synchronisation processes, e.g. decoder synchronisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44004—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Computer Security & Cryptography (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Time-Division Multiplex Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
- Circuits Of Receivers In General (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
Description
本出願の発明は、オーディオスプライシングが、所定のアクセスユニットが関連付けられているオーディオフレームの末尾部分をプレイアウト中に破棄するように、オーディオデータストリームに挿入された1つまたは複数のトランケーションユニットパケットを使用して、オーディオデコーダに所定のアクセスユニットを示すことにより、より効果的にレンダーリングすることができる、という考え方によって示唆されている。
ここでも、復号化側でのオーディオフレーム14の再構成は、先行するフレームの符号化に依存してもよく、例えば、あるオーディオフレームから別のオーディオフレームへの時間的予測、または励振信号などを変換符号化するための変換ウインドウの重なりに依存してもよい。これは、以下の説明において役割を果たすため、状況は、ここで言及される。
例えば、タイムスタンプTframeは、新しいシーン、新しいプログラムなどの最初のピクチャのタイムスタンプであってもよく、したがって、オーディオ信号12は、その時点t=Tframeでカットされ、その時点から、例えば新しいシーンまたはプログラムのトーン信号を表す別のオーディオ信号12によって置き換えられることが望ましい。
例えば、図1は、オーディオデータストリーム10と同じように構成された、すなわち1つまたは複数のペイロードパケット16で構成されるアクセスユニット18を使用して構築された、既に存在するオーディオデータストリーム30を示す。そこでは、第1のオーディオフレーム14はその先端がタイムスタンプTframeと一致するように、すなわち、オーディオ信号32はタイムスタンプTframeのプレイアウトに登録されたフレーム14の先端でプレイアウトされるような方法で、オーディオフレーム14内のタイムスタンプTframeで開始するフレーム28の一連のピクチャを伴うか、または記述する。
しかしながら、フラグ50および52は、ちょうど概説したように、単にオプションである。例えば、TUパケット42自体は、トランケーションユニット42が属するアクセスユニットがスプライスアウトに適したアクセスユニットであることを、スプライサおよびデコーダをストリーミングする信号とすることができ、トランケーション長さ48をゼロに設定することは、トランケーションを行わず、スプライスアウトを行わないことをデコーダに指示することになる。
しかしながら、このとき、アクセスユニットAUi、すなわちアクセスユニットAUj+1は、その直前のアクセスユニットAUj-1とは独立した方法で、その関連するオーディオフレームjを符号化している。すなわち、先行アクセスユニットAUj-1に依存して予測参照または内部復号レジスタが設定されないという点で、または、オーバラップ−加算プロセスが、アクセスユニットAUj-1の再構築を、アクセスユニットAUjを正しく再構成およびプレイアウトするための要件を提供しないようにすることができる。即時のプレイアウトアクセスユニットであるアクセスユニットAUjと、上記のアクセスユニット相互依存性、例えば、AUiを有する他のアクセスユニットとを区別するために、アクセスユニットAUjがハッチングを用いて強調表示される。
これを説明するために、オーディオ符号化コア72が動作する固定フレームラスタ、すなわちオーディオ信号12が属するビデオの固定フレームラスタ82と共に80で動作する固定フレームラスタを示す図6を参照する。ビデオ86の内の部分84は、波括弧を用いて示されている。この部分84は、例えば、オペレータによって手動で決定されるか、シーンの検出によって完全にまたは部分的に自動的に決定される。第1および最終フレーム88および90は、フレームラスタ80のオーディオフレームiおよびj内にあるタイムスタンプTbおよびTeと関連している。したがって、これらのオーディオフレーム14、すなわちiおよびjには、オーディオフレームjに対応するアクセスユニットを生成するために、オーディオ符号化コア72が即時のプレイアウトモードを使用するTUパケットインサータ74によってTUパケットが提供される。
この手段によって、データストリーム40のスプライスアウトAUsでデータストリーム40にスプライスされると想定されるオーディオデータストリームを準備する他のエンコーダは、自身のAUs(以下では、アポストロフィによって元のものと時々区別されることがある)を受信開始時のデコーダの符号化されたオーディオバッファの充填レベルは、これらの他のエンコーダがそれに応じてレート制御をさらに発展させることができるように、所定の値にある。これまでの説明は、データストリーム40のスプライスアウトAUsに集中していたが、所定の推定/ログされた充填レベルへの順応は、スプライスインとスプライスアウトポイントとして、二重の役割を果たしていなくても、AUjのように、AUsにおけるスプライス(バック)のレート制御によって達成されてもよい。したがって、前記他のエンコーダは、同様に、推定または記録された充填レベルが、それらのデータストリームのAUシーケンスの末尾AUで所定の充填レベルをとるように、レート制御を制御することができる。スプライスアウトAUsに関してエンコーダ70について述べたのと同じであってもよい。そのような末尾のAUsは、AUjなどのデータストリーム40のスプライスインAUsとのスプライスポイントから想定されるスプライスバックAUsから想定される。したがって、エンコーダ70のレート制御が、推定/記録された充填レベルがAUjで(またはより良好に)所定の充填レベルをとるように符号化ビットレートをスケジューリングした場合、このビットレート制御は、データストリーム40を符号化して出力した後にスプライシングが実行された場合でも、有効なままである。ちょうど言及した所定の充填レベルは、デフォルトでエンコーダに知られることができ、すなわち、それらの間で合意される。あるいは、それぞれのAUは、それぞれのスプライスインAUまたはスプライスアウトAUの直後に想定されるように、推定/記録された充填レベルの明示的なシグナリングを提供することができる。例えば、その値は、それぞれのスプライスインまたはスプライスアウトAUのTUパケットで送信することができる。これは付加的な付加情報オーバヘッドを必要とするが、エンコーダのレート制御は、スプライスインまたはスプライスアウトAUにおける推定/記録された充填レベルをより自由に提供することができる。例えば、それぞれのスプライスインまたはスプライスアウトAUの後の推定/記録された充填レベルは、最大充填レベルの3/4、すなわちデコーダの符号化オーディオバッファの最大保証容量のようなある閾値を下回ることで十分である。
スプライスポイントセッター106によるこの設定134の後、スプライスマルチプレクサ108は、現在のスプライスインアクセスユニットAUiの後に、データストリーム110のアクセスユニットは、オーディオデータストリーム40の後続のアクセスユニットではなく、出力インタフェース116に接続されるように、他のデータストリーム、すなわちオーディオデータストリーム110に切り替える。
第1のアクセスユニットAU'1に関連する第1のオーディオフレームの始まりと共に、このオーディオ信号は登録され、すなわちすぐに開始され、ストリームスプライサ100は、オーディオデータストリーム110に含まれるタイムスタンプ情報を単に適合させるだけであり、その結果、例えば、第1のアクセスユニットAU'1に関連する先端フレームのタイムスタンプは、スプライスイン時刻と一致し、すなわち、AUiの時刻とAUiに関連付けられたオーディオフレームの時間的長さとステップ134で設定された後端部分の時間的長さを足したものに等しい。すなわち、マルチプレクサスイッチング136の後、アダプテーション138は、データストリーム110のアクセスユニットAU’に対して連続的に実行されるタスクである。しかしながら、この時間の間に、次に説明するスプライスアウトルーチンも実行される。
さらに、オーディオデータストリーム110は、スプライスインされるべきオーディオ信号の先端に登録された最初のオーディオフレームを有することに限定されない。むしろ、オーディオデータストリーム110自体は、オーディオデータストリーム40の基礎となるオーディオフレームクロックとは独立して動作するそれ自身のオーディオフレームクロックを有する何らかのソースから生じる可能性がある。その場合、オーディオデータストリーム40からオーディオデータストリーム110への切り替えは、図8に示すステップに加えて、ステップ148に対応する設定ステップ、すなわちオーディオデータストリーム110のTUパケットの設定も含む。
先行アクセスユニットAU'1のオーディオフレームの終端部分の長さは、ストリームスプライサ100によって、高い確実性で設定されているので、アクセスユニットAU'1のオーディオフレームの始まりは、アクセスユニットAUiのオーディオフレームの残りの後端に直ちに接する。すなわち、それらは、アクセスユニットAUiのオーディオフレームの中間のどこかの遷移時間T1に当接する。アクセスユニットAU'Kに遭遇すると、オーディオ復号化コア162は、ステップ176でこのアクセスユニットを復号して、このオーディオフレームを表示または再構成し、このオーディオフレームは、そのTUパケット114による後端部分の表示のために、その後端でトランケーションされる。したがって、後端部分までのアクセスユニットAU'Kのオーディオフレームの残りのみがプレイアウトされる。そして、アクセスユニットAUjは、IPFデコード174においてオーディオデコードコア162によって、すなわちアクセスユニットAU'Kとは独立して自己完結的にデコードされ、そこから得られたオーディオフレームは、その先端がトランケーションユニットパケット58としてトランケートされる先端部分を示す。アクセスユニットAU'KおよびAUjのオーディオフレームの残りの部分は、遷移時刻T2で互いに当接する。
IsActive:切り捨てメッセージがアクティブな場合、0の場合、デコーダはメッセージを無視する必要がある。
CanSplice:スプライスデバイスがスプライスを開始できることを伝える。
TruncRight:ここに続けなさい。 (注:これは基本的には広告開始フラグであるが、スプライシングデバイスはデコーダに情報を持たないため、0にリセットすることができる)。
NTruncSamples:AUの末尾からサンプルをトランケートする場合、1がAUの先端からサンプルを切り取る場合。
したがって、オーディオ符号化コア72は、同じオーディオフレームラスタを使用して、アクセスユニットAU6の現在のオーディオフレームを、より多くの符号化オーディオチャネルなどを含むオーディオ符号化モードなどの新しい構成を使用して符号化する。オーディオ符号化コア72は、IPF符号化モードを追加して新たな構成を使用して、オーディオフレームを他の時間に符号化する。これにより、アクセスユニットAU'1になり、アクセスユニットAU'1がアクセスユニットの順序にすぐに続く。両方のアクセスユニット、すなわちアクセスユニットAU6およびアクセスユニットAU'1には、TUパケットインサータ74によってTUパケットが提供され、前者は後端部分が払い出されるように示され、後者は先端部分が払い出されるように示されている。後者は、IPFアクセスユニットであるため、スプライスバックインポイントとしても機能する。
すなわち、プレイアウトされるべき直ぐ連続するAUの部分が互いに突き当たるタイムスタンプを囲んで横切る時間的な間隔内で、復号器によってスプライスされたオーディオデータストリームからプレイアウトされるように実際にプレイアウトされたオーディオ信号は、直ちに隣接する両方のAUのオーディオフレームの組み合わせによって形成することができ、後続のAUのオーディオフレームの組合せ寄与は、この時間間隔内で時間的に増加し、スプライスアウトAUのオーディオフレームの組合せ寄与は、時間間隔において時間的に減少する。
同様に、クロスフェードは、AUjなどのスプライスインAUSとその直前のAU(AU'Kなど)との間で実行できる。すなわち、その時点を取り囲んで横切る時間間隔内でスプライスインAUのーディオフレームと先行AUのオーディオフレームとの組み合わせによって、実際的なプレイアウトされたオーディオ信号を形成し、これでスプライスインAU'Sのオーディオフレームの先端部分と先行AU'Sのオーディオフレームの終端部分とが当接する。
A1. スプライス可能なオーディオデータストリーム40であって、前記スプライス可能なオーディオデータストリーム40は、一連のペイロードパケット16のシーケンスを含み、前記各ペイロードパケットは、前記スプライス可能なオーディオデータストリームが分割される前記一連のアクセスユニット18のそれぞれの1つに属し、各アクセスユニットは、オーディオフレームの単位で前記スプライス可能なオーディオデータストリームに符号化されるオーディオ信号12のオーディオフレーム14のそれぞれの1つの前記オーディオフレーム14に関連付けられ、そして、
前記スプライス可能なオーディオデータストリーム40は、所定のアクセスユニットのために、スプライス可能なオーディオデータストリームに挿入され、且つ、示すようにセット可能となっているトランケーションユニットパケット42;58と、プレイアウト中に破棄するように、前記所定のアクセスユニットが関連付けられているオーディオフレーム端部44;56とを、含む、スプライス可能なオーディオデータストリーム。
A2. 態様A1に従属するスプライス可能なオーディオデータストリームであって、オーディオフレームの端部が後端部分44である。
A3. 態様A1または態様A2に従属するスプライス可能なオーディオデータストリームであって、
前記スプライス可能なオーディオデータストリームは、前記スプライス可能なオーディオデータストリームに挿入され、更なる所定のアクセスユニットを示すようにセット可能な更なるトランケーションユニットパケット(58)と、プレイアウト中に破棄されるように、前記更なる所定のアクセスユニットが関連付けられている更なるオーディオフレームの端部44;56とを含む、スプライス可能なオーディオデータストリームである。
A4. 態様A3に従属するスプライス可能なオーディオデータストリームであって、さらなるオーディオフレームの端部は、先端部分56である。
A5. 態様A3または態様A4に従属するスプライス可能なオーディオデータストリームであって、前記トランケーションユニットパケット42およびさらなる前記トランケーションユニットパケット58は、スプライスアウト構文要素50を含み、前記スプライスアウト構文要素50は、それぞれ、前記トランケーションユニットパケットまたは前記さらなるトランケーションユニットパケットのそれぞれ1つが、スプライスアウトアクセスユニットに関連するかどうかを示す。
A6. 態様A3〜態様A5のいずれかに従属するスプライス可能なオーディオデータストリームであって、例えばAUiなどの前記所定のアクセスユニットは、復号化する側での再構成が前記所定のアクセスユニットの直前のアクセスユニットに依存するように、それぞれの関連するオーディオフレームをある方法で符号化し、大部分のアクセスユニットは、復号化する側での再構成がそれぞれの直前のアクセスユニットに依存するように、それぞれの関連するオーディオフレームをある方法で符号化し、前記更なる所定のアクセスユニットAUjは、復号化する側での再構成が前記さらなる所定のアクセスユニットの直前のアクセスユニットとは独立しているように、それぞれの関連するオーディオフレームをある方法で符号化し、それにより即時のプレイアウトを可能にする。
A7. 態様A6に従属するスプライス可能なオーディオデータストリームであって、前記トランケーションユニットパケット42および前記更なるトランケーションユニットパケット58は、それぞれ、前記トランケーションユニットパケットまたは前記更なるトランケーションユニットパケットのそれぞれの1つが、前記スプライスアウトアクセスユニットに関連するか否かを示す、スプライスアウト構文要素(50)を含み、前記トランケーションユニットパケットに含まれる前記スプライスアウト構文要素(50)は、前記トランケーションユニットパケットがスプライスアウトアクセスユニットに関連することを示し、前記更なるトランケーションユニットパケットに含まれる前記構文要素は、前記更なるトランケーションユニットパケットがスプライスアウトアクセスユニットに関係しないことを示す。
A8. 態様A6に従属するスプライス可能なオーディオデータストリームであって、前記トランケーションユニットパケット42および前記更なるトランケーションユニットパケット58は、それぞれ、前記トランケーションユニットパケットまたは前記更なるトランケーションユニットパケットのそれぞれの1つが、スプライスアウトアクセスユニットに関連するか否かを示す、スプライスアウト構文要素を含み、前記トランケーションユニットパケットに含まれる前記構文要素50は、前記トランケーションユニットパケットがスプライスアウトアクセスユニットに関連することを示し、前記更なるトランケーションユニットパケットに含まれる前記スプライスアウト構文要素は、前記更なるトランケーションユニットパケットがスプライスアウトアクセスユニットに関連することを示し、前記更なるトランケーションユニットパケットは、先端/後端のトランケーション構文要素54およびトランケーション長さ要素48を含み、先端/後端のトランケーション構文要素は、前記更なるオーディオフレームの端部が、後端部分44または先端部分56であるかどうか示すためのものであり、トランケーション長さ要素は、前記更なるオーディオフレームの端部の長さΔtを示すためのものである。
A9. 前記所定のアクセスユニットにおいて、所定の平均ビットレートからの統合されたビットレートの偏差が前提となるために、前記所定の平均ビットレートの周りで変化するようにレート制御される態様A1〜態様A8のいずれかに従属するスプライス可能なオーディオデータストリームであって、前記スプライス可能なオーディオデータストリームは、完全なスプライス可能なオーディオデータストリームにわたって変動する統合されたビットレート偏差の範囲よりも1/2幅未満の所定の間隔内の値をとるようにする。
A10. 前記所定のアクセスユニットにおいて、所定の平均ビットレートからの統合されたビットレートの偏差が前提となるために、前記所定の平均ビットレートの周りで変化するようにレート制御される態様A1〜態様A8のいずれかに従属するスプライス可能なオーディオデータストリームであって、前記スプライス可能なオーディオデータストリームは、前記所定のアクセスユニットにおいて、完全なスプライス可能なオーディオデータストリームにわたって変動する統合されたビットレート偏差の最大値の3/4より小さい固定値を有する。
A11. 前記所定のアクセスユニットにおいて、所定の平均ビットレートからの統合されたビットレートの偏差が前提となるために、前記所定の平均ビットレートの周りで変化するようにレート制御される態様A1〜態様A8のいずれかに従属するスプライス可能なオーディオデータストリームであって、前記スプライス可能なオーディオデータストリームは、前記所定のアクセスユニットと、トランケーションユニットパケットが前記スプライス可能なオーディオデータストリーム内に存在する他のアクセスユニットとの間で、所定の値を有する。
B1. スプライス可能なオーディオデータストリームであって、前記スプライス可能なオーディオデータストリームは、一連のペイロードパケット16を含み、前記各ペイロードパケットは、前記スプライス可能なオーディオデータストリームが分割される前記一連のアクセスユニット18のそれぞれの1つに属し、各アクセスユニットは、オーディオ信号12のオーディオフレーム14のそれぞれの1つの前記オーディオフレーム14に関連付けられ、
そして、前記スプライス可能なオーディオデータストリームは、前記スプライスされたオーディオデータストリームに挿入され、所定のアクセスユニットが関連付けられているオーディオフレームの内のプレイアウト中に破棄されるべきオーディオフレームの端部44,56を示すトランケーションユニットパケット42、58、114を含み、
前記一連のペイロードパケットの第1サブシーケンスのペイロードパケットにおいて、各ペイロードパケットは、前記第1のオーディオ信号のオーディオフレームの単位で第1オーディオ信号を符号化した第1のオーディオデータストリームのアクセスユニットAU#に属し、前記第1のオーディオデータストリームのアクセスユニットは、前記所定のアクセスユニットを含み、
前記一連のペイロードパケットの第2サブシーケンスのペイロードパケットにおいて、各ペイロードパケットは、前記第2のオーディオデータストリームのオーディオフレームの単位で第2のオーディオ信号を符号化した第2のオーディオデータストリームのアクセスユニットAU’#に属し、
ペイロードパケットの前記第1および前記第2のサブシーケンスは、互いに直ちに連続し、所定のアクセスユニットにおいて互いに当接し、前記端部は、前記第2のサブシーケンスに先行する前記第1のサブシーケンスの場合には後端部分44であり、前記第1のサブシーケンスに先行する前記第2のサブシーケンスの場合には先端部分56である。
B2. 態様B1に従属するスプライスされたオーディオデータストリームであって、前記第1のサブシーケンスが前記第2のサブシーケンスに先行し、前記端部が後端部分44として先行する。
B3. 態様B1または態様B2に従属するスプライスされたオーディオデータストリームであって、前記スプライスされたオーディオデータストリームは、前記スプライスされたオーディオデータストリームに挿入され、且つ、プレイアウト中に破棄するように、更なる所定のアクセスユニットが関連付けられている更なるオーディオフレームの先端部分58を示すさらなるトランケーションユニットパケット58をさらに含み、一連のペイロードパケットの第3のサブシーケンスのペイロードパケットにおいて、各ペイロードパケットは、第3のオーディオ信号が符号化された第3のオーディオデータストリームのアクセスユニットAU’’#、または前記第1のサブシーケンスのペイロードパケットが属する前記第1のオーディオデータストリームのアクセスユニットに続いて、前記第1のオーディオデータストリームのアクセスユニットAU#に属し、前記第3のオーディオデータストリームのアクセスユニットは、前記さらなる所定のアクセスユニットを含む。
B4. 態様3に従属するスプライスされたオーディオデータストリームであって、前記所定のアクセスユニットを含む前記スプライスされたオーディオデータストリームのアクセスユニットの大部分は、復号する側での再構成がそれぞれの直前のアクセスユニットに依存するように、それぞれの関連するオーディオフレームを符号化し、例えばAUi+1などの前記アクセスユニットは、所定のアクセスユニットの直後に位置し、その再構成が例えばAUiなどの所定のアクセスユニットから独立するように、それぞれの関連するオーディオフレームを符号化した前記第2のオーディオデータストリームのアクセスユニットのオンセットを形成し、それによって即時のプレイアウトが可能となり、そして、前記更なる所定のアクセスユニットAUjは、その再構成が別の所定のアクセスユニットの直前のアクセスユニットから独立するように、更なるオーディオフレームを符号化して、それによってそれぞれ即時のプレイアウトが可能となっている。
B5. 前記スプライスされたオーディオデータストリームは、前記スプライスされたオーディオデータストリームに挿入され、プレイアウトにおいて破棄されるように、たとえばAUjなどの前記更なる所定のアクセスユニットの直前のたとえばAU'Kなどの前記アクセスユニットを関連付ける別のオーディオフレームの後端部分44を示す更なるトランケーションユニットパケット114をさらに含み、
前記スプライスされたオーディオデータストリームは、前記スプライスされたオーディオデータストリームの各アクセスユニットに対して、それぞれのアクセスユニットが関連付けられているオーディオフレームがプレイアウトされるタイムスタンプを示すタイムスタンプ情報24を含み、
前記更なる所定のアクセスユニットのタイムスタンプは、前記更なる所定のアクセスユニットの直前のアクセスユニットのタイムスタンプに、前記更なる所定のアクセスユニットの直前のアクセスユニットが、更なるオーディオフレームの先端部分の時間的長さと更に別のオーディオフレームの後端部分の合計を差し引いて関連付けられる前記オーディオフレームの時間的長さを加えたものに等しいか、
または前記更なる所定のアクセスユニットの直前のアクセスユニットのタイムスタンプに、前記更なる所定のアクセスユニットの直前のアクセスユニットが関連する前記オーディオフレームの時間的長さを加えたものと等しく、さらに別のオーディオフレームの前記後端部分の前記時間的長さを差し引いたものである。
B6. 態様B2に従属するスプライシングされたオーディオデータストリームであって、前記スプライスされたオーディオデータストリームは、前記スプライスされたオーディオデータストリームに挿入され、AU'K等の前記所定のアクセスユニットの直後のAUj等の前記アクセスユニットが関連付けられてプレイアウト中に破棄される更なる別のオーディオフレームの先端部分56を示すさらに更なる別のトランケーションユニットパケット58をさらに含み、スプライスされたオーディオデータストリームは、それぞれのアクセスユニットが関連付けられているオーディオフレームがプレイアウトされるべき場所でスプライスされたオーディオデータストリームの各アクセスユニットに対して、それぞれのタイムスタンプを示すタイムスタンプ情報24を含み、
前記所定のアクセスユニットの直後のアクセスユニットのタイムスタンプは、前記所定のアクセスユニットの前記タイムスタンプに、前記所定のアクセスユニットが関連付けられている前記オーディオフレームの前記後端部分の時間的長さと、前記更なる別のアクセスユニットの前端部分との合計を差し引いた前記オーディオフレームの時間長さを加えたものに等しいか、または
前記所定のアクセスユニットの直後のアクセスユニットのタイムスタンプは、前記所定のアクセスユニットのタイムスタンプに、前記所定のアクセスユニットが関連付けられている前記オーディオフレームの前記後端部分の前記時間的長さを差し引いた前記所定のアクセスユニットが関連付けられている前記オーディオフレームの時間的長さを加えたものに等しい。
B7. 態様B6に従属するスプライスされたオーディオデータストリームであって、前記スプライスされたオーディオデータストリームのアクセスユニットの大部分は、復号側でのその再構成が直前の各アクセスユニットに依存可能な方法で、前記それぞれの関連するオーディオフレームを符号化し、前記所定のアクセスユニットの直後に位置し、前記第2のオーディオデータストリームの前記アクセスユニットのオンセットを形成することは、復号化側での前記再構成は所定のアクセスユニットから独立しており、それにより即時にプレイアウトが可能となる方法で、前記それぞれの関連するオーディオフレームを符号化する。
B8. 態様B7に従属するスプライシングされたオーディオデータストリームであって、前記第1および第2のオーディオデータストリームは、異なる符号化構成を使用して符号化され、前記アクセスユニットは、前記所定のアクセスユニットの直後に位置し、前記第2のオーディオデータストリームの前記アクセスユニットのオンセットを形成して、デコーダを新たに構成するための構成データcfgを符号化する。
B9. 態様B4に従属するスプライスされたオーディオデータストリームであって、前記スプライスされたオーディオデータストリームは、前記スプライスされたオーディオデータストリームに挿入され、前記所定のアクセスユニットの直後の前記アクセスユニットが関連付けられてプレイアウト中に破棄される更なる別のオーディオフレームの先端部分を示すさらに更なる別のトランケーションユニットパケット112をさらに含み、スプライスされたオーディオデータストリームは、それぞれのアクセスユニットが関連付けられているオーディオフレームがプレイアウトされるべき場所でスプライスされたオーディオデータストリームの各アクセスユニットに対して、それぞれのタイムスタンプを示すタイムスタンプ情報24を含み、
前記所定のアクセスユニットの直後の前記アクセスユニットのタイムスタンプは、前記所定のアクセスユニットの前記タイムスタンプに、前記更に別のオーディオフレームの前記先端部分の時間的長さと前記所定のアクセスユニットに関連する前記オーディオフレームの前記後端部分の時間的長さとの合計を差し引いた前記所定のアクセスユニットに関連付けられた前記オーディオフレームの時間長を足したものに等しいか、または
前記所定のアクセスユニットの前記タイムスタンプに、前記所定のアクセスユニットに関連付けられた前記オーディオフレームの時間的長さを加えたものから所定のアクセスユニットに関連するオーディオフレームの前記後端部分の時間的長さを差し引いた時間的長さに等しい。
B10. 態様B4、B5またはB9に従属するスプライシングされたオーディオデータストリームであって、前記所定のアクセスユニットの直後の前記アクセスユニットのタイムスタンプの時間は、前記所定のアクセスユニットのタイムスタンプに、前記所定のアクセスユニットが関連付けられている前記オーディオフレームの時間的長さを加えたものに等しく、前記所定のアクセスユニットが関連付けられた前記オーディオフレームの前記後端部の時間的長さを差し引いたものである。
C1. オーディオデータストリームをスプライシングするためのストリームスプライサであって、
第1のオーディオデータストリームが分割された一連のアクセスユニット18のそれぞれの1つに属し、前記第1のオーディオデータストリームの各アクセスユニットは、第1のオーディオ信号12のオーディオフレーム14の単位で前記第1のオーディオデータストリームに符号化される前記第1のオーディオ信号のオーディオフレームのそれぞれ1つに関連し、一連のペイロードパケット16を含む第1のオーディオデータストリーム40を受信するための第1のオーディオ入力インタフェース102、
第2のオーディオデータストリームが分割された一連のアクセスユニットのそれぞれの1つに属し、前記第2のオーディオデータストリームの各アクセスユニットは、第2のオーディオ信号のオーディオフレームの単位で前記第2のオーディオデータストリームに符号化される前記第2のオーディオ信号のオーディオフレームのそれぞれ1つに関連し、一連のペイロードパケットを含む第2のオーディオデータストリーム110を受信するための第2のオーディオ入力インタフェース104、
スプライスポイントセッター、および
スプライスマルチプレクサーを含み、
前記第1のオーディオデータストリームは、前記第1のオーディオデータストリームに挿入され、所定のアクセスユニットが関連付けられたオーディオフレームの端部44;56が、プレイアウト中に破棄することを所定のアクセスユニットに対して示すように設定可能なトランケーションユニットパケット42;58をさらに含み、
前記スプライスポイントセッター106は、所定のアクセスユニットが関連付けられており、プレイアウト中に破棄されるように、トランケーションユニットパケットがオーディオフレームの後端部分44;56を示すために、トランケーションユニットパケット42;58を設定するように構成され、あるいは、前記スプライスポイントセッター106は、トランケーションユニットパケット42;58を第1のオーディオデータストリームに挿入し、所定のアクセスユニットに対して示すために同じことを設定するように構成され、
所定のアクセスユニットが関連付けられているオーディオフレームの端部44;56は、プレイアウト中に廃棄されるように、前記トランケーションユニットパケット42;58を設定し、前記トランケーションユニットパケット42;58は、プレイアウト中に破棄されるように、前記所定のアクセスユニットが関連付けられたオーディオフレームの端部44;56を示しており、そして
前記スプライスマルチプレクサー108は、各ペイロードパケットが所定のアクセスユニットを含む第1のオーディオデータストリームのアクセスユニットのランのそれぞれのアクセスユニットに属する状態で第1のオーディオデータストリームのペイロードパケットのサブシーケンスを取得するように、前記所定のアクセスユニットにおいて前記第1のオーディオデータストリームをカットするように構成され、そして、
前記第1のオーディオデータストリームのペイロードパケットのサブシーケンスと前記第2のオーディオデータストリームの一連のペイロードパケットとを、互いに所定のアクセスユニットで互いに直に連続して当接するようにスプライスして、
前記所定のアクセスユニットが関連する前記オーディオフレームの前記端部は、前記第2のオーディオデータストリームの一連のペイロードパケットに先行する前記第1のオーディオデータストリームのペイロードパケットのサブシーケンスの場合には、後端部分44であり、第1のオーディオデータストリームのペイロードパケットのサブシーケンスの場合には、第2のオーディオデータストリームの一連のペイロードパケットに続く先端部分56である、ストリームスプライサ。
C2. 態様C1に従属するストリームスプライサであって、前記第1のオーディオデータストリームの前記ペイロードパケットのサブシーケンスは、前記第2のオーディオデータストリームの一連のペイロードパケットの第2のサブシーケンスと、前記所定のアクセスユニットが関連付けられて後端部分44となるオーディオフレームの端部とに、先行する。
C3. 態様C2に従属するストリームスプライサであって、前記ストリームスプライサは、前記トランケーションユニットパケットに含まれるスプライスアウト構文要素50を検査するように構成され、前記スプライスアウト構文要素50がスプライスアウトアクセスユニットに関連する前記トランケーションユニットパケットを示すかどうかの条件で切断およびスプライシングを実行することができる。
C4. 態様C1〜態様C3のいずれかに従属するストリームスプライサであって、前記スプライスポイント設定部は、外部クロックと一致するように、前記端部の時間的長さを設定する。
C5. 態様C4に従属するストリームスプライサであって、前記外部クロックは、ビデオフレームクロックである。
C6. 態様C2に従属するスプライスされたオーディオデータストリームであって、前記第2のオーディオデータストリームは、前記第2のオーディオデータストリーム110に挿入された更なるトランケーションユニットパケット114を挿入によって生じさせるか、またはスプライスポイントセッター106を有し、プレイアウトで廃棄されるように、第2のオーディオデータストリームのたとえばAU’Kなどの終端アクセスユニット110が関連付けられている更なるオーディオフレームの端部を示すために設定可能となって、そして、
前記第1のオーディオデータストリームは、プレイアウト中に破棄されるように関連付けられ、前記第1のオーディオデータストリームに挿入され、プレイアウト中に破棄されるように関連付けられ、たとえばAUjなどのさらに別の所定のアクセスユニットを有するさらに別のオーディオフレームの端部を示すように設定可能なさらに別のトランケーションユニットパケット58をさらに含み、
たとえばAUiなどの前記所定のアクセスユニットの前記オーディオフレームとたとえばAUjなどの前記更なる別の所定のアクセスユニットの前記更なる別のオーディオフレームとの間の時間的な距離は、たとえばAUiなどの前記所定のアクセスユニットとたとえばAU’Kなどの前記後端のアクセスユニットとのスプライシングの後に、たとえばAU’1などのその先端の/先導するアクセスユニットの間の前記第2のオーディオ信号の時間的な長さと一致し、
前記スプライスポイントセッター106は、プレイアウト中に破棄される前記更なるオーディオフレームの後端部分44を示すように、そして、前記更なるトランケーションユニットパケット58は、プレイアウト中に破棄されるべき前記更なる別のオーディオフレームの先端部分を示すように、前記更なるトランケーションユニットパケット114を設定するように構成され、
前記スプライスマルチプレクサー108は、前記第2のオーディオデータストリーム110に含まれるタイムスタンプ情報24に適応させ、各アクセスユニットに対して、前記それぞれのアクセスユニットが関連付けられ、プレイアウトとなる前記オーディオフレームのそれぞれのタイムスタンプを示すように構成され、
前記第2のオーディオデータストリーム110の先行するアクセスユニットが関連する先行するオーディオフレームのタイムスタンプは、前記所定のアクセスユニットが関連付けられたオーディオフレームのタイムスタンプと一致するようにし、さらに、前記所定のアクセスユニットが関連付けられている前記オーディオフレームの時間的長さから、前記所定のアクセスユニットが関連付けられている前記オーディオフレームの前記後端部分の時間的長さを差し引いたものであり、
前記更なる別のオーディオフレームのタイムスタンプは、前記更なるオーディオフレームのタイムスタンプに、前記更なるオーディオフレームの時間的長さを加えたものに等しく、前記更なるオーディオフレームの後端部分の時間的長さと前記更なる別のオーディオフレームの前端部分との合計を差し引いたもとなるように、前記スプライスポイントセッター106が、前記更なるトランケーションユニットパケット114および前記更なる別のトランケーションユニットパケット58を設定するために構成される。
C7. 態様C2に従属するスプライスされたオーディオデータストリームであって、前記第2のオーディオデータストリーム110は、前記第2のオーディオデータストリームに挿入された更なるトランケーションユニットパケット112を挿入によって生じさせるか、またはスプライスポイントセッター106を有し、プレイアウトで廃棄されるように、前記第2のオーディオデータストリームのたとえばAU’1などの先導するアクセスユニットが関連付けられる更なる別のオーディオフレームの端部を示すように設定可能となり、
前記スプライスポイントセッター(106)は、前記第2のオーディオデータストリームの先導するアクセスユニットが関連付けられる更なるオーディオフレームの端部を示すように設定可能な前記第2のオーディオデータストリームに挿入された更なるトランケーションユニットパケット(112)を挿入によって生じさせるか、またはプレイアウトで廃棄されるように、プレイアウト中に破棄される前記更なるオーディオフレームの先端部分を示すように、前記更なるトランケーションユニットパケット(112)を設定するように構成され、
タイムスタンプ情報24は、前記第1および第2のオーディオデータストリームに含まれ、各アクセスユニットについて、前記オーディオフレームがそれぞれのタイムスタンプを示し、前記第1および第2のオーディオデータストリームの前記それぞれのアクセスユニットが関連付けられ、プレイアウトされるべきであり、時間的に整列され、そして、スプライスポイントセッター106は、前記更なるオーディオフレームのタイムスタンプから、たとえばAUiなどの前記所定のアクセスユニットが関連付けられた前記オーディオフレームの時間的長さを引いた値になるように、前記更なるトランケーションユニットパケットを設定するように構成され、その上、前記先端部分の時間的長さは、前記所定のアクセスユニットが関連する前記オーディオフレームのタイムスタンプと、前記所定のアクセスユニットが関連付けられた前記オーディオフレームの時間的長さから前記後端部分の時間的長さを差し引いたものに等しい。
D1. 前記ペイロードパケットの各々は、前記オーディオデータストリームが分割される一連のアクセスユニット18のそれぞれの1つに属し、各アクセスユニットは、オーディオフレームのそれぞれの1つに関連付けられるように、オーディオデータストリーム120の一連のペイロードパケット16からオーディオ信号のオーディオフレーム14の単位でオーディオ信号12を再構成するように構成されたオーディオデコードコア162/オーディオ復号コア162、および
その終端部が前記トランケーションユニットパケットによってプレイアウト中に破棄されるように指示される前記オーディオ信号をプレイアウトする際に、前記オーディオデータストリームに挿入されたトランケーションユニットパケット42;58;114に応答して、所定のアクセスユニットに関連付けられたオーディオフレームをトランケートするように/切り捨てて破棄するように構成されたオーディオトランケーター164を含む、オーディオデコーダ。
D2. 態様D1に従属するオーディオコーダであって、端部は、後端部分44または先端部分56である。
D3. 態様D1または態様D2に従属するオーディオデコーダであって、前記オーディオデータストリームの前記アクセスユニットの大部分は、その再構成がそれぞれの直前のアクセスユニットに依存するような方法で、前記それぞれの関連するオーディオフレームを符号化しており、前記オーディオデコーディングコア162は、多数のアクセスユニットの各々が前記それぞれの直前のアクセスユニットに応じて関連付けられる前記オーディオフレームを再構成するように構成される。
D4. 態様D3に従属するオーディオデコーダであって、前記所定のアクセスユニットは、その再構成が前記所定のアクセスユニットの直前のアクセスユニットとは独立しているように、前記それぞれの関連するオーディオフレームを符号化し、前記オーディオ復号ユニット162は、前記所定のアクセスユニットの直前のアクセスユニットから独立して、前記所定のアクセスユニットが関連付けられる前記オーディオフレームを再構成するように構成される。
D5. 態様D3または態様D4に従属するオーディオデコーダであって、前記所定のアクセスユニットが構成データを符号化し、オーディオ復号化ユニット162が、構成データに従って構成オプションを構成するために構成データを使用するように構成され、前記所定のアクセスユニットと、前記所定のアクセスユニットの直後に位置するアクセスユニットのランとが関連付けられている前記オーディオフレームを再構成するための前記デコードオプションを適用する。
D6. 態様D1〜態様D5のいずれかに従属するオーディオデコーダであって、前記オーディオデータストリームは、前記オーディオデータストリームの各アクセスユニットに対して、前記それぞれのアクセスユニットが関連付けられている前記オーディオフレームでプレイアウトされる各タイムスタンプを示すタイムスタンプ情報24を含み、前記オーディオデコーダは、前記タイムスタンプ情報に従って前記オーディオフレームの先端部分を時間的に整列させ、前記所定のアクセスユニットが関連付けられた前記オーディオフレームの前記終端部分を放棄して、前記オーディオフレームをプレイアウトするように構成される。
D7. 態様D1〜態様D6のいずれかに従属するオーディオ復号器であって、前記オーディオフレームの前記終端部分と残りの部分との接合点でクロスフェードを実行するように構成されたオーディオデコーダ。
E1. 各ペイロードパケットは、オーディオデータストリーム40が分割されたアクセスユニット18のそれぞれの1つに属し、各アクセスユニットはオーディオフレームのそれぞれ1つに関連付けられるように、オーディオ信号のオーディオフレーム14の単位で、前記オーディオデータストリーム40のペイロードパケット16にオーディオ信号12を符号化するように構成されたオーディオ符号化コア72、および
所定のアクセスユニットが関連付けられ、プレイアウト中に破棄されるように、前記オーディオフレームの終端部を示すように設定可能なトランケーションユニットパケット44;58を前記オーディオデータストリームに挿入するトランケーションパケット挿入部74を含む、オーディオエンコーダ。
E2. 態様E1に従属するオーディオエンコーダであって、前記オーディオエンコーダは、態様A1〜態様9のいずれかに従属するスプライス可能なオーディオデータストリームを生成するように構成される。
E3. 態様E1または態様E2に従属するオーディオエンコーダであって、前記オーディオエンコーダは、外部クロックに応じて前記アクセスユニットの中から前記所定のアクセスユニットを選択するように構成される。
E4. 態様E3に従属するオーディオエンコーダであって、前記外部クロックは、ビデオフレームクロックである。
E5. 態様E1〜態様E5のいずれかに従属するオーディオエンコーダであって、前記所定のアクセスユニットにおいて、所定の平均ビットレートからの統合ビットレート偏差を仮定するために、オーディオデータストリームのビットレートが所定の平均ビットレートの周りで変化し、それに従うようにレート制御を実行するように構成され、これは、完全なスプライス可能なオーディオデータストリームにわたって変動する統合されたビットレート偏差の範囲よりも1/2幅未満の所定の間隔内の値をとる。
E6. 態様E1〜態様E5のいずれかに従属するオーディオエンコーダであって、前記所定のアクセスユニットにおいて、所定の平均ビットレートからの統合ビットレート偏差を仮定するために、オーディオデータストリームのビットレートが所定の平均ビットレートの周りで変化し、それに従うようにレート制御を実行するように構成され、これは、完全なスプライス可能なオーディオデータストリームにわたって変動する統合されたビットレート偏差の最大値の3/4より小さい固定値を有する。
E7. 態様E1〜態様E5のいずれかに従属するオーディオエンコーダであって、前記所定のアクセスユニットにおいて、所定の平均ビットレートからの統合ビットレート偏差を仮定するために、オーディオデータストリームのビットレートが所定の平均ビットレートの周りで変化し、それに従うようにレート制御を実行するように構成され、前記所定のアクセスユニットの他にトランケーションユニットパケットが前記オーディオデータストリームに挿入される他のアクセスユニットもまた、所定の値をとる。
E8. 態様E1〜態様E7のいずれかに従属するオーディオエンコーダであって、ログされたフィル(充填)状態が、前記所定のアクセスユニットにおいて所定の値をとるように符号化されたオーディオデコーダのバッファ充填状態をロギングすることによって、レート制御を実行するように構成される。
E9. 態様E8に従属するオーディオエンコーダであって、前記所定の値は、トランケーションユニットパケットが前記オーディオデータストリームに挿入されるアクセスユニット間で共通である。
E10. 態様E8に従属するオーディオエンコーダであって、前記オーディオデータストリーム内の前記所定の値をシグナリングするように構成される。
参照
[2]ISO/IEC 23008-3, Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio
[3]ISO/IEC DTR 14496-24: Information technology - Coding of audio-visual objects - Part 24: Audio and systems interaction
Claims (21)
- スプライス可能なオーディオデータストリーム(40)であって、
前記スプライス可能なオーディオデータストリーム(40)は、一連のペイロードパケット(16)を含み、前記各ペイロードパケットは、前記スプライス可能なオーディオデータストリームが分割される前記一連のアクセスユニット(18)のそれぞれの1つに属し、各アクセスユニットは、オーディオフレームの単位で前記スプライス可能なオーディオデータストリームに符号化されるオーディオ信号(12)のオーディオフレーム(14)のそれぞれの1つの前記オーディオフレーム(14)に関連付けられ、そして、
前記スプライス可能なオーディオデータストリーム(40)は、所定のアクセスユニットのために、スプライス可能なオーディオデータストリームに挿入され、且つ、示すようにセット可能となっているトランケーションユニットパケット(42;58)と、プレイアウト中に破棄するように、前記所定のアクセスユニットが関連付けられているオーディオフレームの端部(44;56)とを、含むことを特徴とする、スプライス可能なオーディオデータストリーム。 - 前記スプライス可能なオーディオデータストリームは、
前記スプライス可能なオーディオデータストリームに挿入され、更なる所定のアクセスユニットを示すようにセット可能な更なるトランケーションユニットパケット(58)と、
プレイアウト中に破棄されるように、前記更なる所定のアクセスユニットが関連付けられている更なるオーディオフレームの端部(44;56)とを含む、請求項1に記載のスプライス可能なオーディオデータストリーム。 - 前記所定のアクセスユニットは、復号化する側での再構成が前記所定のアクセスユニットの直前のアクセスユニットに依存するように、それぞれの関連するオーディオフレームをある方法で符号化し、
大部分のアクセスユニットは、復号化する側での再構成がそれぞれの直前のアクセスユニットに依存するように、それぞれの関連するオーディオフレームをある方法で符号化し、
他の所定のアクセスユニットは、復号化する側での再構成が別の所定のアクセスユニットの直前のアクセスユニットとは独立しているように、それぞれの関連するオーディオフレームをある方法で符号化し、それにより即時のプレイアウトを可能にする、請求項2に記載のスプライス可能なオーディオデータストリーム。 - 前記トランケーションユニットパケット(42)および更なるトランケーションユニットパケット(58)は、それぞれ、前記トランケーションユニットパケットまたは前記更なるトランケーションユニットパケットのそれぞれの1つが、前記スプライスアウトアクセスユニットに関連するか否かを示すスプライスアウト構文要素(50)を含み、
前記トランケーションユニットパケットに含まれる前記スプライスアウト構文要素(50)は、前記トランケーションユニットパケットがスプライスアウトアクセスユニットに関連することを示し、
前記更なるトランケーションユニットパケットに含まれる前記構文要素は、前記更なるトランケーションユニットパケットがスプライスアウトアクセスユニットに関係しないことを示す、請求項3に記載のスプライス可能なオーディオデータストリーム。 - 前記トランケーションユニットパケット(42)および前記更なるトランケーションユニットパケット(58)は、それぞれ、前記トランケーションユニットパケットまたは前記更なるトランケーションユニットパケットのそれぞれの1つが、スプライスアウトアクセスユニットに関連するか否かを示すスプライスアウト構文要素を含み、
前記トランケーションユニットパケットに含まれる前記構文要素(50)は、前記トランケーションユニットパケットがスプライスアウトアクセスユニットに関連することを示し、
前記更なるトランケーションユニットパケットに含まれる前記スプライスアウト構文要素は、前記更なるトランケーションユニットパケットがスプライスアウトアクセスユニットに関連することを示し、
前記更なるトランケーションユニットパケットは、先端/後端のトランケーション構文要素(54)およびトランケーション長さ要素(48)を含み、
前記先端/後端のトランケーション構文要素は、前記更なるオーディオフレームの端部が、後端部分(44)または先端部分(56)であるかどうか示すためのものであり、
前記トランケーション長さ要素は、前記更なるオーディオフレームの端部の長さ(Δt)を示すためのものである、請求項3に記載のスプライス可能なオーディオデータストリーム。 - スプライスされたオーディオデータストリームであって、
前記スプライスされたオーディオデータストリームは、一連のペイロードパケットのシーケンス(16)を含み、前記各ペイロードパケットは、前記スプライスされたオーディオデータストリームが分割される前記一連のアクセスユニット(18)のそれぞれの1つに属し、
各アクセスユニットは、オーディオフレーム(14)のそれぞれの1つの前記オーディオフレーム(14)に関連付けられ、そして、
前記スプライスされたオーディオデータストリームは、スプライス可能なオーディオデータストリームに挿入され、且つ、プレイアウト中に破棄するように、所定のアクセスユニットが関連付けられているオーディオフレームの端部(44;56)を示すトランケーションユニットパケット(44;58;114)を含み、
前記一連のペイロードパケットの第1のサブシーケンスのペイロードパケットにおいて、各ペイロードパケットは、前記第1のオーディオ信号のオーディオフレームの単位で第1のオーディオ信号を符号化した第1のオーディオデータストリームのアクセスユニット(AU#)に属し、前記第1のオーディオデータストリームのアクセスユニットは、前記所定のアクセスユニットを含み、
前記一連のペイロードパケットの第2のサブシーケンスのペイロードパケットにおいて、各ペイロードパケットは、前記第2のオーディオデータストリームのオーディオフレームの単位で第2のオーディオ信号を符号化した第2のオーディオデータストリームのアクセスユニット(AU’#)に属し、
ペイロードパケットの前記第1および前記第2のサブシーケンスは、互いに直ちに連続し、所定のアクセスユニットにおいて互いに当接し、前記端部は、前記第2のサブシーケンスに先行する前記第1のサブシーケンスの場合には後端部分(44)であり、前記第1のサブシーケンスに先行する前記第2のサブシーケンスの場合には先端部分(56)である、スプライスされたオーディオデータストリーム。 - 前記スプライスされたオーディオデータストリームは、前記スプライスされたオーディオデータストリームに挿入され、且つ、プレイアウト中に破棄するように、更なる所定のアクセスユニットが関連付けられている更なるオーディオフレームの先端部分(58)を示す更なるトランケーションユニットパケット(58)をさらに含み、
一連のペイロードパケットの第3のサブシーケンスのペイロードパケットにおいて、各ペイロードパケットは、第3のオーディオ信号が符号化された第3のオーディオデータストリームのアクセスユニット(AU’’#)、または
前記第1のサブシーケンスのペイロードパケットが属する前記第1のオーディオデータストリームのアクセスユニットに続いて、前記第1のオーディオデータストリームのアクセスユニット(AU#)に属し、
前記第2のオーディオデータストリームのアクセスユニットは、前記さらなる所定のアクセスユニットを含む、請求項6に記載のスプライスされたオーディオデータストリーム。 - 前記所定のアクセスユニットを含む前記スプライスされたオーディオデータストリームのアクセスユニットの大部分は、復号する側での再構成がそれぞれの直前のアクセスユニットに依存するように、それぞれの関連するオーディオフレームを符号化し、
前記アクセスユニットは、所定のアクセスユニットの直後に位置し、その再構成が所定のアクセスユニットから独立するように、それぞれの関連するオーディオフレームを符号化した前記第2のオーディオデータストリームのアクセスユニットのオンセットを形成し、それによって即時のプレイアウトが可能となり、そして
前記さらなる所定のアクセスユニットは、その再構成が別の所定のアクセスユニットの直前のアクセスユニットから独立するように、さらなるオーディオフレームを符号化して、それによってそれぞれ即時のプレイアウトが可能となっている、請求項7に記載のスプライスされたオーディオデータストリーム。 - 前記スプライスされたオーディオデータストリームは、前記スプライスされたオーディオデータストリームに挿入され、プレイアウトにおいて破棄されるように前記さらなる所定のアクセスユニットの直前のアクセスユニットを関連付ける別のオーディオフレームの後端部分(44)を示すさらなるトランケーションユニットパケット(114)をさらに含み、
前記スプライスされたオーディオデータストリームは、前記スプライスされたオーディオデータストリームの各アクセスユニットに対して、それぞれのアクセスユニットが関連付けられているオーディオフレームがプレイアウトされるタイムスタンプを示すタイムスタンプ情報(24)を含み、
前記更なる所定のアクセスユニットのタイムスタンプは、前記更なる所定のアクセスユニットの直前のアクセスユニットのタイムスタンプに、前記更なる所定のアクセスユニットの直前のアクセスユニットが、更なるオーディオフレームの先端部分の時間的長さと更に別のオーディオフレームの後端部分の合計を差し引いて関連付けられる前記オーディオフレームの時間的長さを加えたものに等しい、請求項7または請求項8に記載のスプライスされたオーディオデータストリーム。 - 前記所定のアクセスユニットの直ぐ後続のアクセスユニットの時間的タイムスタンプは、前記所定のアクセスユニットのタイムスタンプに前記オーディオフレームの時間的長さを加えたものに等しく、前記オーディオフレームの時間的長さは、前記所定のアクセスユニットが関連付けられ、前記所定のアクセスユニットが関連付けられる前記オーディオフレームの後端部分の時間的長さを差し引いた長さである、請求項8または請求項9に記載のスプライスされたオーディオデータストリーム。
- オーディオデータストリームをスプライシングするためのストリームスプライサであって、
第1のオーディオデータストリームが分割された一連のアクセスユニット(18)のそれぞれの1つに属し、前記第1のオーディオデータストリームの各アクセスユニットは、第1のオーディオ信号(12)のオーディオフレーム(14)の単位で前記第1のオーディオデータストリームに符号化される前記第1のオーディオ信号のオーディオフレームのそれぞれ1つに関連し、一連のペイロードパケット(16)を含む第1のオーディオデータストリーム(40)を受信するための第1のオーディオ入力インタフェース(102)、
第2のオーディオデータストリームが分割された一連のアクセスユニットのそれぞれの1つに属し、前記第2のオーディオデータストリームの各アクセスユニットは、第2のオーディオ信号のオーディオフレームの単位で前記第2のオーディオデータストリームに符号化される前記第2のオーディオ信号のオーディオフレームのそれぞれ1つに関連し、一連のペイロードパケットを含む第2のオーディオデータストリーム(110)を受信するための第2のオーディオ入力インタフェース(104)、
スプライスポイントセッター、および
スプライスマルチプレクサーを含み、
前記第1のオーディオデータストリームは、前記第1のオーディオデータストリームに挿入され、所定のアクセスユニットが関連付けられたオーディオフレームの端部(44;56)が、プレイアウト中に破棄することを所定のアクセスユニットに対して示すように設定可能なトランケーションユニットパケット(42;58)をさらに含み、
前記スプライスポイントセッター(106)は、所定のアクセスユニットが関連付けられており、プレイアウト中に破棄されるように、トランケーションユニットパケットがオーディオフレームの後端部分(44;56)を示すために、トランケーションユニットパケット(42;58)を設定するように構成され、あるいは、前記スプライスポイントセッター(106)は、トランケーションユニットパケット(42;58)を第1のオーディオデータストリームに挿入し、所定のアクセスユニットに対して示すために同じことを設定するように構成され、
所定のアクセスユニットが関連付けられているオーディオフレームの端部(44;56)は、プレイアウト中に廃棄されるように、前記トランケーションユニットパケット(42;58)を設定し、前記トランケーションユニットパケット(42;58)は、生中に破棄されるように、前記所定のアクセスユニットが関連付けられたオーディオフレームの端部(44;56)を示しており、そして
前記スプライスマルチプレクサー(108)は、各ペイロードパケットが所定のアクセスユニットを含む第1のオーディオデータストリームのアクセスユニットのランのそれぞれのアクセスユニットに属する状態で第1のオーディオデータストリームのペイロードパケットのサブシーケンスを取得するように、前記所定のアクセスユニットにおいて前記第1のオーディオデータストリームをカットするように構成され、そして、
前記第1のオーディオデータストリームのペイロードパケットのサブシーケンスと前記第2のオーディオデータストリームの一連のペイロードパケットとを、互いに所定のアクセスユニットで互いに直に連続して当接するようにスプライスして、
前記所定のアクセスユニットが関連する前記オーディオフレームの前記端部は、前記第2のオーディオデータストリームの一連のペイロードパケットに先行する前記第1のオーディオデータストリームのペイロードパケットのサブシーケンスの場合には、後端部分(44)であり、第1のオーディオデータストリームのペイロードパケットのサブシーケンスの場合には、第2のオーディオデータストリームの一連のペイロードパケットに続く先端部分(56)である、ストリームスプライサ。 - 前記第1のオーディオデータストリームの前記ペイロードパケットのサブシーケンスは、前記第2のオーディオデータストリームの一連のペイロードパケットの第2のサブシーケンスと、前記所定のアクセスユニットが関連付けられて後端部分(44)となるオーディオフレームとに先行する、請求項11に記載のストリームスプライサ。
- 前記スプライスポイントセッターは、外部クロックと一致するように前記端部の時間的長さを設定することを特徴とする、請求項11または請求項12に記載のストリームスプライサ。
- 前記第2のオーディオデータストリームは、前記第2のオーディオデータストリーム(110)に挿入された更なるトランケーションユニットパケット(114)を挿入によって生じさせるか、またはスプライスポイントセッター(106)を有し、プレイアウトで廃棄されるように、第2のオーディオデータストリームの終端アクセスユニット(110)が関連付けられている更なるオーディオフレームの端部を示すために設定可能となって、そして、
前記第1のオーディオデータストリームは、プレイアウト中に破棄されるように関連付けられ、前記第1のオーディオデータストリームに挿入され、プレイアウト中に破棄されるように関連付けられ、さらに別の所定のアクセスユニットを有するさらに別のオーディオフレームの端部を示すように設定可能なさらに別のトランケーションユニットパケット(58)をさらに含み、
前記所定のアクセスユニットの前記オーディオフレームと前記更なる別の所定のアクセスユニットの前記更なる別のオーディオフレームとの間の時間的な距離は、前記所定のアクセスユニットと前記後続のアクセスユニットとのスプライシングの後に、その先導するアクセスユニットの間の前記第2のオーディオ信号の時間的な長さと一致し、
前記スプライスポイントセッター(106)は、プレイアウト中に破棄される前記更なるオーディオフレームの後端部分(44)を示すように、そして、前記更なるトランケーションユニットパケット(58)は、プレイアウト中に破棄されるべき前記更なる別のオーディオフレームの先端部分を示すように、前記更なるトランケーションユニットパケット(114)を設定するように構成され、
前記スプライスマルチプレクサー(108)は、前記第2のオーディオデータストリーム(110)に含まれるタイムスタンプ情報(24)に適応させ、各アクセスユニットに対して、前記それぞれのアクセスユニットが関連付けられ、プレイアウトとなる前記オーディオフレームのそれぞれのタイムスタンプを示すように構成され、
前記第2のオーディオデータストリーム(110)の先行するアクセスユニットが関連する先行するオーディオフレームのタイムスタンプは、前記所定のアクセスユニットが関連付けられたオーディオフレームのタイムスタンプと一致するようにし、さらに、前記所定のアクセスユニットが関連付けられている前記オーディオフレームの時間的長さから、前記所定のアクセスユニットが関連付けられている前記オーディオフレームの前記後端部分の時間的長さを差し引いたものであり、
前記更なる別のオーディオフレームのタイムスタンプは、前記更なるオーディオフレームのタイムスタンプに、前記更なるオーディオフレームの時間的長さを加えたものに等しく、前記更なるオーディオフレームの後端部分の時間的長さと前記更なる別のオーディオフレームの先端部分との合計を差し引いたもとなるように、前記スプライスポイントセッター(106)が、前記更なるトランケーションユニットパケット(114)および前記更なる別のトランケーションユニットパケット(58)を設定するために構成される、請求項12に記載のスプライスされたオーディオデータストリーム。 - 前記第2のオーディオデータストリーム(110)は、前記第2のオーディオデータストリームに挿入された更なるトランケーションユニットパケット(112)を挿入によって生じさせるか、またはスプライスポイントセッター(106)を有し、プレイアウトで廃棄されるように、前記第2のオーディオデータストリームの先導するアクセスユニットが関連付けられる更なる別のオーディオフレームの端部を示すように設定可能となり、
前記スプライスポイントセッター(106)は、プレイアウト中に破棄される前記更なるオーディオフレームの先端部分を示すように、前記更なるトランケーションユニットパケット(112)を設定するように構成され、
タイムスタンプ情報(24)は、前記第1および第2のオーディオデータストリームに含まれ、各アクセスユニットについて、前記オーディオフレームがそれぞれのタイムスタンプを示し、前記第1および第2のオーディオデータストリームの前記それぞれのアクセスユニットが関連付けられ、プレイアウトされるべきであり、時間的に整列され、そして、スプライスポイントセッター(106)は、前記更なるオーディオフレームのタイムスタンプから、前記所定のアクセスユニットが関連付けられた前記オーディオフレームの時間的長さを引いた値になるように、前記更なるトランケーションユニットパケットを設定するように構成され、その上、前記先端部分の時間的長さは、前記所定のアクセスユニットが関連する前記オーディオフレームのタイムスタンプと、前記所定のアクセスユニットが関連付けられた前記オーディオフレームの時間的長さから前記後端部分の時間的長さを差し引いたものに等しい、請求項12に記載のスプライスされたオーディオデータストリーム。 - 前記ペイロードパケットの各々は、前記オーディオデータストリームが分割される一連のアクセスユニット(18)のそれぞれの1つに属し、各アクセスユニットは、オーディオフレームのそれぞれの1つに関連付けられるように、オーディオデータストリーム(120)の一連のペイロードパケット(16)からオーディオ信号のオーディオフレーム(14)の単位でオーディオ信号(12)を再構成するように構成されたオーディオ復号化コア(162)、および
その端部が前記トランケーションユニットパケットによってプレイアウト中に破棄されるように指示される前記オーディオ信号をプレイアウトする際に、前記オーディオデータストリームに挿入されたトランケーションユニットパケット(42;58;114)に応答して、所定のアクセスユニットに関連付けられたオーディオフレームをトランケートするように構成されたオーディオトランケーター(164)を含む、オーディオデコーダ。 - 各ペイロードパケットは、オーディオデータストリーム(40)が分割されたアクセスユニット(18)のそれぞれの1つに属し、各アクセスユニットはオーディオフレームのそれぞれ1つに関連付けられるように、オーディオ信号のオーディオフレーム(14)の単位で、前記オーディオデータストリーム(40)のペイロードパケット(16)にオーディオ信号(12)を符号化するように構成されたオーディオ符号化コア(72)、および
所定のアクセスユニットが関連付けられ、プレイアウト中に破棄されるように、前記オーディオフレームの端部を示すように設定可能なトランケーションユニットパケット(44;58)を前記オーディオデータストリームに挿入するトランケーションパケット挿入部(74)を含む、オーディオエンコーダ。 - オーディオデータストリームをスプライスする方法であって、前記方法は、第1のオーディオデータストリーム(40)を含み、前記第1のオーディオデータストリーム(40)は、一連のペイロードパケット(16)を含み、前記一連のペイロードパケット(16)は、前記第1のオーディオデータストリームが分割された一連のアクセスユニット(18)のそれぞれの1つに属し、前記第1のオーディオデータストリームの各アクセスユニットは、第1のオーディオ信号のオーディオフレームの単位で前記第1のオーディオデータストリームに符号化された第1のオーディオ信号(12)のオーディオフレーム(14)のそれぞれの1つに関連し、そして、各々が前記第2のオーディオデータストリームが分割された一連のアクセスユニットのそれぞれの1つに属する一連のペイロードパケットを含む第2のオーディオデータストリーム(110)であって、前記第2のオーディオデータストリームの各アクセスユニットは、第2のオーディオ信号のオーディオフレームの単位で前記第2のオーディオデータストリームに符号化された前記第2のオーディオ信号のオーディオフレームのそれぞれの1つに関連しており、
前記第1のオーディオデータストリームは、前記第1のオーディオデータストリームに挿入され、所定のアクセスユニットを示すように設定可能なトランケーションユニットパケット(42;58)をさらに含み、所定のアクセスユニットが関連付けられたオーディオフレームの端部(44;56)がプレイアウト中に破棄されるようにし、そして、前記方法は、前記トランケーションユニットパケット(42:58)を設定するステップを含み、前記トランケーションユニットパケットは、前記所定のアクセスユニットが関連付けられた前記オーディオフレームの端部(44;56)を示し、プレイアウト中に破棄することが可能となり、あるいは、
前記方法は、前記トランケーションユニットパケット(42;58)を前記第1のオーディオデータストリームに挿入するステップを含み、前記トランケーションユニットパケット(42;58)を所定のアクセスユニットを示すように設定し、前記所定のアクセスユニットが関連付けられた前記オーディオフレームの端部(44;56)は、プレイアウト中に破棄され、前記トランケーションユニットパケット(42;58)を設定するように、トランケーションユニットパケットは、所定のアクセスユニットが関連付けられたオーディオフレームの端部(44;56)を示し、プレイアウト中に破棄することが可能となり、そして、
前記方法は、
前記第1のオーディオデータストリームのペイロードパケットのサブシーケンスを取得するように、前記所定のアクセスユニットにおいて、各ペイロードパケットが、前記所定のアクセスユニットを含む前記第1のオーディオデータストリームのアクセスユニットのランのそれぞれのアクセスユニットに属する前記第1のオーディオデータストリームを切断するステップ、および
前記第1のオーディオデータストリームの前記ペイロードパケットのサブシーケンスと、前記第2のオーディオデータストリームの前記一連のペイロードパケットとを、互いに前記所定のアクセスユニットにおいて、互いに直に連続して当接するように、スプライシングするステップをさらに含み、
前記所定のアクセスユニットが関連する前記オーディオフレームの前記端部は、前記第2のオーディオデータストリームの一連のペイロードパケットに先行する前記第1のオーディオデータストリームのペイロードパケットのサブシーケンスの場合には、後端部分(44)であり、そして、前記第1のオーディオデータストリームのペイロードパケットのサブシーケンスの場合には、前記第2のオーディオデータストリームの前記一連のペイロードパケットに続く先端部分(56)である、オーディオデータストリームをスプライスする方法。 - オーディオデータストリーム(120)の一連のペイロードパケット(16)から、オーディオ信号のオーディオフレーム(14)の単位でオーディオ信号(12)を再構成するステップを含み、
前記ペイロードパケットの各々は、前記オーディオデータストリームが分割される一連のアクセスユニット(18)のそれぞれに属し、各アクセスユニットは、前記オーディオフレームのそれぞれの1つに関連付けられ、そして、
前記オーディオデータストリームに挿入されたトランケーションユニットパケット(42;58;114)に応答して、所定のアクセスユニットに関連するオーディオフレームをトランケーションして破棄することを含む、オーディオ復号方法。 - 各ペイロードパケットは、オーディオデータストリームが分割されたアクセスユニット(18)のそれぞれの1つに属し、各アクセスユニットは、オーディオフレームのそれぞれの1つに関連付けられるように、オーディオデータストリーム(40)のペイロードパケット(16)に、前記オーディオ信号のオーディオフレーム(14)の単位でオーディオ信号(12)を符号化するステップ、および
所定のアクセスユニットが関連付けられたオーディオフレームの端部を示すように設定可能なトランケーションユニットパケット(44;58)を前記オーディオデータストリームに挿入してプレイアウト中に破棄するステップを含む、オーディオ符号化方法。 - 請求項18〜請求項20のいずれかに記載の方法をコンピュータ上で実行するときに、プログラムコードを有するコンピュータプログラムを格納したコンピュータ可読デジタル記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14184141 | 2014-09-09 | ||
EP14184141.1 | 2014-09-09 | ||
EP15154752.8A EP2996269A1 (en) | 2014-09-09 | 2015-02-11 | Audio splicing concept |
EP15154752.8 | 2015-02-11 | ||
JP2017513465A JP6605025B2 (ja) | 2014-09-09 | 2015-09-08 | オーディオスプライシングのコンセプト |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017513465A Division JP6605025B2 (ja) | 2014-09-09 | 2015-09-08 | オーディオスプライシングのコンセプト |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020008864A true JP2020008864A (ja) | 2020-01-16 |
JP6920383B2 JP6920383B2 (ja) | 2021-08-18 |
Family
ID=51542159
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017513465A Active JP6605025B2 (ja) | 2014-09-09 | 2015-09-08 | オーディオスプライシングのコンセプト |
JP2019149425A Active JP6920383B2 (ja) | 2014-09-09 | 2019-08-16 | オーディオスプライシングのコンセプト |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017513465A Active JP6605025B2 (ja) | 2014-09-09 | 2015-09-08 | オーディオスプライシングのコンセプト |
Country Status (15)
Country | Link |
---|---|
US (5) | US10511865B2 (ja) |
EP (3) | EP2996269A1 (ja) |
JP (2) | JP6605025B2 (ja) |
KR (1) | KR101997058B1 (ja) |
CN (2) | CN107079174B (ja) |
AR (1) | AR101783A1 (ja) |
AU (1) | AU2015314286C1 (ja) |
CA (1) | CA2960114C (ja) |
ES (1) | ES2969748T3 (ja) |
MX (1) | MX366276B (ja) |
MY (1) | MY189151A (ja) |
RU (1) | RU2696602C2 (ja) |
SG (1) | SG11201701516TA (ja) |
TW (1) | TWI625963B (ja) |
WO (1) | WO2016038034A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2996269A1 (en) | 2014-09-09 | 2016-03-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio splicing concept |
CN111052752A (zh) * | 2017-08-28 | 2020-04-21 | 杜比实验室特许公司 | 媒体感知导航元数据 |
CN108053821B (zh) * | 2017-12-12 | 2022-09-06 | 腾讯科技(深圳)有限公司 | 生成音频数据的方法和装置 |
CN115691518A (zh) | 2018-02-22 | 2023-02-03 | 杜比国际公司 | 用于处理嵌入在mpeg-h 3d音频流中的辅媒体流的方法及设备 |
CN112740325B (zh) * | 2018-08-21 | 2024-04-16 | 杜比国际公司 | 即时播放帧(ipf)的生成、传输及处理的方法、设备及系统 |
CN109949792B (zh) * | 2019-03-28 | 2021-08-13 | 优信拍(北京)信息科技有限公司 | 多音频的合成方法及装置 |
CN112837709B (zh) * | 2021-02-24 | 2022-07-22 | 北京达佳互联信息技术有限公司 | 一种音频文件拼接的方法及装置 |
CN113516969B (zh) * | 2021-09-14 | 2021-12-14 | 北京远鉴信息技术有限公司 | 一种拼接语音的鉴别方法、装置、电子设备及存储介质 |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6806909B1 (en) * | 1997-03-03 | 2004-10-19 | Koninklijke Philips Electronics N.V. | Seamless splicing of MPEG-2 multimedia data streams |
US5899969A (en) * | 1997-10-17 | 1999-05-04 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with gain-control words |
JP3539615B2 (ja) | 1998-03-09 | 2004-07-07 | ソニー株式会社 | 符号化装置、編集装置及び符号化多重化装置並びにそれらの方法 |
JP2000206994A (ja) | 1999-01-20 | 2000-07-28 | Victor Co Of Japan Ltd | 音声符号化装置及び復号化装置 |
US20060093045A1 (en) * | 1999-06-29 | 2006-05-04 | Roger Anderson | Method and apparatus for splicing |
WO2001046957A1 (en) * | 1999-12-22 | 2001-06-28 | Sarnoff Corporation | Method and apparatus for smoothing spliced discontinuous audio streams |
US6792047B1 (en) * | 2000-01-04 | 2004-09-14 | Emc Corporation | Real time processing and streaming of spliced encoded MPEG video and associated audio |
US6678332B1 (en) | 2000-01-04 | 2004-01-13 | Emc Corporation | Seamless splicing of encoded MPEG video and audio |
US7096481B1 (en) * | 2000-01-04 | 2006-08-22 | Emc Corporation | Preparation of metadata for splicing of encoded MPEG video and audio |
US6907081B2 (en) * | 2001-03-30 | 2005-06-14 | Emc Corporation | MPEG encoder control protocol for on-line encoding and MPEG data storage |
JP4359499B2 (ja) * | 2001-06-08 | 2009-11-04 | アイピージー エレクトロニクス 503 リミテッド | オーディオ信号の編集 |
EP1449365A2 (en) * | 2001-07-09 | 2004-08-25 | Visible World, Inc. | System and method for seamless switching of compressed audio streams |
US7496283B2 (en) * | 2002-06-28 | 2009-02-24 | Microsoft Corporation | Methods and systems for processing digital data rate and directional playback changes |
JP2004272054A (ja) | 2003-03-11 | 2004-09-30 | Toshiba Corp | 圧縮音声データの編集方法、編集プログラム及び編集装置 |
US7400653B2 (en) * | 2004-06-18 | 2008-07-15 | Dolby Laboratories Licensing Corporation | Maintaining synchronization of streaming audio and video using internet protocol |
US7512705B2 (en) * | 2004-12-01 | 2009-03-31 | Hewlett-Packard Development Company, L.P. | Truncating data units |
JP4371127B2 (ja) | 2006-07-14 | 2009-11-25 | ソニー株式会社 | 再生装置、再生方法、プログラム |
US8538565B2 (en) | 2008-02-22 | 2013-09-17 | Panasonic Corporation | Music playing apparatus, music playing method, recording medium storing music playing program, and integrated circuit that implement gapless play |
ES2434828T3 (es) * | 2008-10-06 | 2013-12-17 | Telefonaktiebolaget L M Ericsson (Publ) | Método y aparato para el suministro de audio por multicanales alineados |
CN102177542B (zh) * | 2008-10-10 | 2013-01-09 | 艾利森电话股份有限公司 | 能量保留多通道音频编码 |
US8743906B2 (en) * | 2009-01-23 | 2014-06-03 | Akamai Technologies, Inc. | Scalable seamless digital video stream splicing |
WO2010125583A2 (en) * | 2009-04-28 | 2010-11-04 | Vubites India Private Limited | Method and apparatus for coordinated splicing of multiple streams |
US8589999B1 (en) * | 2009-08-11 | 2013-11-19 | Arris Solutions, Inc. | Methods and systems for splicing between media streams |
US9031850B2 (en) | 2009-08-20 | 2015-05-12 | Gvbb Holdings S.A.R.L. | Audio stream combining apparatus, method and program |
PL2491555T3 (pl) * | 2009-10-20 | 2014-08-29 | Fraunhofer Ges Forschung | Wielotrybowy kodek audio |
SG182466A1 (en) * | 2010-01-12 | 2012-08-30 | Fraunhofer Ges Forschung | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a modification of a number representation of a numeric previous context value |
JP5719922B2 (ja) * | 2010-04-13 | 2015-05-20 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | サンプルごとに正確なオーディオ信号表現のための方法、エンコーダ及びデコーダ |
US9094658B2 (en) | 2010-05-10 | 2015-07-28 | Mediatek Inc. | Method and apparatus of adaptive loop filtering |
US20110293021A1 (en) * | 2010-05-28 | 2011-12-01 | Jayant Kotalwar | Prevent audio loss in the spliced content generated by the packet level video splicer |
US9055305B2 (en) | 2011-01-09 | 2015-06-09 | Mediatek Inc. | Apparatus and method of sample adaptive offset for video coding |
US9008170B2 (en) | 2011-05-10 | 2015-04-14 | Qualcomm Incorporated | Offset type and coefficients signaling method for sample adaptive offset |
US9357235B2 (en) | 2011-10-13 | 2016-05-31 | Qualcomm Incorporated | Sample adaptive offset merged with adaptive loop filter in video coding |
WO2013074365A1 (en) | 2011-11-18 | 2013-05-23 | Dolby Laboratories Licensing Corporation | Subjective based post-filter optimization |
KR101638720B1 (ko) | 2012-05-29 | 2016-07-20 | 미디어텍 인크. | 샘플 어댑티브 오프셋 정보를 부호화하는 방법 및 장치 |
ES2781573T3 (es) | 2012-06-08 | 2020-09-03 | Sun Patent Trust | Procedimiento de codificación de imágenes, procedimiento de decodificación de imágenes, dispositivo de codificación de imágenes, dispositivo de decodificación de imágenes, y dispositivo de codificación y decodificación de imágenes |
EP3297283B1 (en) | 2012-06-11 | 2019-09-04 | Samsung Electronics Co., Ltd. | Encoding and decoding videos sharing sao parameters according to a color component |
US9596461B2 (en) | 2012-11-26 | 2017-03-14 | Qualcomm Incorporated | Loop filtering across constrained intra block boundaries in video coding |
KR20150009122A (ko) * | 2013-07-15 | 2015-01-26 | 주식회사 케이티 | 지역 광고를 합성하는 서버 및 장치, 그리고 영상 스트림을 합성하는 서버 |
EP2996269A1 (en) | 2014-09-09 | 2016-03-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio splicing concept |
US10057574B2 (en) | 2015-02-11 | 2018-08-21 | Qualcomm Incorporated | Coding tree unit (CTU) level adaptive loop filter (ALF) |
CN105989577B (zh) * | 2015-02-17 | 2020-12-29 | 中兴通讯股份有限公司 | 一种图像校正的方法和装置 |
CN107736027B (zh) | 2015-06-12 | 2021-06-01 | 松下知识产权经营株式会社 | 图像编码方法、图像解码方法、图像编码装置及图像解码装置 |
US10841581B2 (en) | 2016-07-14 | 2020-11-17 | Arris Enterprises Llc | Region specific encoding and SAO-sensitive-slice-width-adaptation for improved-quality HEVC encoding |
US10200687B2 (en) | 2017-06-02 | 2019-02-05 | Apple Inc. | Sample adaptive offset for high dynamic range (HDR) video compression |
CN107707915B (zh) | 2017-09-30 | 2019-11-12 | 上海兆芯集成电路有限公司 | 采样点自适应偏移滤波的控制方法及其影像处理系统 |
CN110740246A (zh) * | 2018-07-18 | 2020-01-31 | 阿里健康信息技术有限公司 | 一种图像矫正方法、移动设备和终端设备 |
CN111178278B (zh) * | 2019-12-30 | 2022-04-08 | 上海商汤临港智能科技有限公司 | 视线方向确定方法、装置、电子设备及存储介质 |
-
2015
- 2015-02-11 EP EP15154752.8A patent/EP2996269A1/en not_active Withdrawn
- 2015-09-04 TW TW104129409A patent/TWI625963B/zh active
- 2015-09-08 EP EP23212340.6A patent/EP4307686A3/en active Pending
- 2015-09-08 CN CN201580048451.5A patent/CN107079174B/zh active Active
- 2015-09-08 KR KR1020177009600A patent/KR101997058B1/ko active IP Right Grant
- 2015-09-08 CA CA2960114A patent/CA2960114C/en active Active
- 2015-09-08 ES ES15766082T patent/ES2969748T3/es active Active
- 2015-09-08 JP JP2017513465A patent/JP6605025B2/ja active Active
- 2015-09-08 CN CN202110114803.XA patent/CN113038172B/zh active Active
- 2015-09-08 AR ARP150102860A patent/AR101783A1/es active IP Right Grant
- 2015-09-08 WO PCT/EP2015/070493 patent/WO2016038034A1/en active Application Filing
- 2015-09-08 MX MX2017002815A patent/MX366276B/es active IP Right Grant
- 2015-09-08 RU RU2017111578A patent/RU2696602C2/ru active
- 2015-09-08 MY MYPI2017000274A patent/MY189151A/en unknown
- 2015-09-08 SG SG11201701516TA patent/SG11201701516TA/en unknown
- 2015-09-08 EP EP15766082.0A patent/EP3192195B1/en active Active
- 2015-09-08 AU AU2015314286A patent/AU2015314286C1/en active Active
-
2017
- 2017-03-07 US US15/452,190 patent/US10511865B2/en active Active
-
2019
- 2019-08-16 JP JP2019149425A patent/JP6920383B2/ja active Active
- 2019-12-13 US US16/712,990 patent/US11025968B2/en active Active
-
2021
- 2021-05-25 US US17/330,253 patent/US11477497B2/en active Active
-
2022
- 2022-09-08 US US17/940,849 patent/US11882323B2/en active Active
-
2023
- 2023-12-26 US US18/396,154 patent/US20240129560A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6920383B2 (ja) | オーディオスプライシングのコンセプト | |
US20230335146A1 (en) | Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder | |
US9883213B2 (en) | Embedding encoded audio into transport stream for perfect splicing | |
KR20210043679A (ko) | 즉시 재생 프레임(ipf)의 생성, 전송 및 처리를 위한 방법, 장치 및 시스템 | |
BR112017003288B1 (pt) | Conceito de combinação de áudio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210601 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210706 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210726 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6920383 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |