JP4157740B2 - Image transmission apparatus, image transmission method, and software program - Google Patents
Image transmission apparatus, image transmission method, and software program Download PDFInfo
- Publication number
- JP4157740B2 JP4157740B2 JP2002253145A JP2002253145A JP4157740B2 JP 4157740 B2 JP4157740 B2 JP 4157740B2 JP 2002253145 A JP2002253145 A JP 2002253145A JP 2002253145 A JP2002253145 A JP 2002253145A JP 4157740 B2 JP4157740 B2 JP 4157740B2
- Authority
- JP
- Japan
- Prior art keywords
- transmission
- data
- area
- enhancement layer
- moving image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は画像伝送装置、画像伝送方法及びソフトウェアプログラムに係り、特にインターネット等の通信網等を介して動画像等の画像情報を配信するための画像伝送装置、画像伝送方法及びソフトウェアプログラムに関する。
【0002】
【従来の技術】
インターネット等の所謂ベストエフォート型ネットワークのよる動画像の配信で問題となるのは、ネットワークの帯域の容量不足等によってパケットロス等が発生し、結果的に配信された情報による再生画質が著しく劣化する場合があることである。この問題を解決するため、実効帯域容量に動的に適応して配信を行う動画像配信技術がある。
【0003】
一例として、動画像コンテンツを複数種類のビットレートでエンコードした上でサーバに蓄積しておき、当該コンテンツ配信時に実効許容レートで伝送可能なビットレートのストリームを動的に選択して配信する技術がある。以下に図1と共に当該技術の概要について説明する。
【0004】
ここで、上記の複数種類のビットレートでエンコードするとは、動画像コンテンツを所定の送信手段によって送信する際のビットレートが所定の複数種類のレートとなるように、予め所定の複数種類のデータ変換率でデータ変換、例えば所定の複数種類の圧縮率でデータ圧縮を施すことを意味する。
【0005】
図中、サーバ・コンピュータ100の送出部110は、ネットワークNWの状況によってクライアント・コンピュータ200が受信可能な実効的な許容送信レートR_effectiveについて、所定の時間間隔毎、例えば10秒間隔で計測している。そして、この検出実効許容レートに従ってストリーム選択スイッチ120により、予めR_effectiveを超えないビットレートでエンコードされたストリームを選択し、これをネットワークNWを介してクライアント・コンピュータ200へと配信する。
【0006】
例えば、上記R_effective=600kbpsのときには、予め500kbpsでエンコードされたストリーム130が選択され、次の瞬間にR_effective=400kbpsに低下したことが検出された場合、これに応じて予め250kbpsでエンコードされたストリーム140が選択される。このようにして予め送信データ容量を制御してパケットロス等の発生を無くすることによって、配信された情報による再生画質の著しい劣化を抑える。
【0007】
【発明が解決しようとする課題】
このように、従来のネットワーク帯域適応配信システムでは、実効許容レートの低下を検出した場合の配信のために予め動画像コンテンツを複数種類のビットレートでエンコードした上で、サーバ・コンピュータに格納しておく。そして、上記の如く、ある時点での検出実効許容レートが600kbpsであり500kbpsでエンコードされたストリームが選択されていたときに、実効許容レートの低下が検出され400kbpsになったとする。このとき1つ下のビットレートでエンコードされたストリームが選択され、250kbpsで配信されることになる。
【0008】
この場合、実際には400kbps−250kbps=150kbps分の送信レート容量の余裕があるにもかかわらず、予めエンコードされたものから選択するため、250kbpsまで下げなければならないことになり、もって配信後の再生画質が、実際のネットワーク状況の悪化の程度以上に大きく劣化してしまうという問題があった。
【0009】
この問題を避けるため、予め400kbps等を含む多種類のビットレートでエンコードしておくことが考えられるが、これには処理能力の高いエンコーダが必要とされたり、或いはそのためにエンコード処理時間の増大を招くこととなってしまい、特に動画像配信においては好ましくない。
【0010】
このような複数種類のビットレートでの配信を効率的に行うための技術として、階層符号化方式が提案されている。この方式はスケーラビリティとも称され、単一の動画像等の情報を夫々単一のストリームにエンコード(符号化)する上記の如くの通常方式と異なり、複数層による階層構造とし、各層毎に独立したストリームとしてエンコードする方式である。ここでは、最も基本的な階層をベースレイヤ、上位の階層のストリームをエンハンスメントレイヤと称している。
【0011】
この階層符号化方式では、ベースレイヤのみでも再生が可能であるが、エンハンスメントレイヤを1層ずつ付加していくことにより、順次品質を向上させた動画像等の情報を提供することができる。この場合の具体的な例を以下の表1に示す。
【0012】
【表1】
この例では、ビットレートとしては先の例と同じ3種類を選択できるものとした。ここで、ベースレイヤとは、64kbpsのビットレートでエンコードしたストリームである。
【0013】
又、エンハンスメントレイヤ#1とは、同じ動画像コンテンツについて、250kbpsでエンコードして得られるストリームをデコード再生して得られる再生画像と、上記64kbpsでエンコードして得られるストリームをデコード再生して得られる再生画像との間の差データをエンコードして得られるストリームである。
【0014】
更に、エンハンスメントレイヤ#2とは、同じ動画像コンテンツについて、500kbpsでエンコードして得られるストリームをデコード再生して得られる再生画像と、上記250kbpsでエンコードして得られるストリームをデコード再生して得られる再生画像との間の差データについてエンコードして得られるストリームである。
【0015】
したがって、ベースレイヤ・ストリームのデコード再生画像データにエンハンスメント#1ストリームのデコード再生画像データを加算することによって、250kbpsでエンコードして得られるストリームのデコード再生画像と同画質の画像が得られる。同様に、ベースレイヤ・ストリームのデコード再生画像データにエンハンスメント#1ストリームのデコード再生画像データ及びエンハンスメント#2ストリームのデコード再生画像データを加算することによって500kbpsでエンコードして得られるストリームのデコード再生画像と同等の画質が得られることになる。
【0016】
この階層符号化方式によれば、上記ベースレイヤ、エンハンスメントレイヤ#1、#2の各ストリームのうち、ベースレイヤのストリームは図1の例の場合の64kbpsでエンコードされたストリームと同容量であるが、他のエンハンスメントレイヤ#1、#2の夫々のストリームについては上記の如く「差データ」であるため、夫々250kbpsでエンコードしたストリーム、500kbpsでエンコードしたストリームに比して、そのデータ容量を明らかに削減可能である。従って、この階層符号化方式によればサーバでのディスク容量削減や、同報配信時のネットワーク帯域利用効率の向上を図れる。しかしながら、選択可能なビットレートの種類を増やすためには上記エンハンスメントレイヤの種類を増やす必要があり、上記同様の問題が生ずることになる。
【0017】
又上記従来のネットワーク帯域適応配信システムでは、上述の如く、実効許容レートの低下を検出し、低いレートでの配信が選択された場合であっても画面が崩れる等の著しい劣化は防止可能である。しかしながら、この方式では、低レート配信の結果、モスキートノイズやブロック歪みといった符号化に起因する劣化が画面全体に均一生じるため、画面中の特にユーザにとって重要な部分の画質も他のあまり重要でない部分同様に劣化してしまう。その様な場合、結果的に当該ユーザの視聴に耐えないものとなってしまうおそれがある。
【0018】
このような問題の解決のため、重要と考えられる特定の領域のみ画質を維持し、その分、それ以外の領域の劣化を相対的に大きくする手法にて、トータル的に低いレートでエンコードをしておくことが考えられる。この点に関し、特開平7−288806号公報では、画像を圧縮して伝送するにあたり、許容伝送量に応じて画像各部の解像度を自動決定し、詳しく見たい部分の解像度を指定可能とした動画像通信システムが開示されている。
【0019】
当該公報開示技術では、同公報の図1、図2等に示されている如く、動画提供者と受信者との1対1のリアルタイム通信を想定しており、送信の際にカメラ等にてリアルタイムに画像を取り込み、受信者の指示に従って領域毎に異なった解像度で画像圧縮を行う構成である。しかしながらこのシステムでは、送信側通信部にて生成する画像データは1受信者専用のものであり、仮に同システムにて多数の受信者に対して同じ動画像を配信することを想定した場合、受信者毎に高解像度にしたい画像領域が異なるため、受信者毎に少なくとも送信側通信部を設ける必要があり、システム構成が複雑化してしまう。又、当該システムでは受信者からの指示を受信するまでは高解像度とすべき画像領域が確定出来ずに画像圧縮処理が実施不可の為、予め圧縮しておくことが出来ず、オン・デマンド配信には適さない。
【0020】
本発明は上記問題点に鑑み、比較的簡易な構成にてネットワークの実効伝送レートに応じた細かな画質調整が可能な画像伝送式を提供することを目的とする。
【0021】
【課題を解決するための手段】
上記目的達成のため、本発明では、所定の動画像データから得られる基本となるベースレイヤのデータストリームと、当該ベースレイヤの動画像データに対して付加することによって画質を向上し得るエンハンスメントレイヤのデータストリームとから所定の伝送路を介して配信すべき動画像データコンテンツを生成する際、当該動画像データを複数の領域に分割し、所定の単位時間毎に前記所定の伝送路の実効許容送信レートの範囲内で上記エンハンスメントレイヤのストリームを送信可能な上記複数の領域のうちの所定の領域についてエンハンスメントレイヤのストリームとベースレイヤとの両方のストリームを送信する構成とした。
【0022】
当該構成では、コンテンツは予めベースレイヤトエンハンスメントレイヤの最低2層分のデータストリームを作成しておき、コンテンツ配信時の実効許容送信レートの範囲内でエンハンスメントレイヤのデータストリームを伝送可能な領域の組み合わせについて、ベースレイヤのデータストリームに加えてエンハンスメントレイヤのデータストリームを送信する。
【0023】
【発明の実施の形態】
本発明の実施の形態では、予め画面内をいくつかの細かい領域に分割し、検出された伝送路の実効伝送レートで伝送可能な領域のみを選択することにより、1つのストリームにて、より細かく実効許容レートに適応可能とする。又、実施の形態のバリエーションとして、この領域選択をユーザが行うことが出来るようにすることにより、ユーザの嗜好に適した画質での伝送を可能とするものである。
【0024】
以下に図2と共に、本発明の実施例の概略の構成について説明する。
【0025】
本発明の実施例では、予めビデオテープレコーダやビデオカメラ等のビデオソース31から得られた動画像データを、エンコーダ32を用いて圧縮し、ビデオストリームを作成する。このとき作成されるビデオストリームについては、予め画面内に存在する物体等の領域に関する情報を利用して領域毎に分割して圧縮ストリームを構成する等の操作は特に必要としない。又、ビデオストリームの作成には上記階層符号化方式を用いるが、このとき、必ずしもエンハンスメントレイヤを多数層分作成する必要は無く、1階層分のみでよい。但し、本発明の各実施例では、エンハンスメントレイヤはフレーム内相関のみを利用してエンコードされたものとする。
【0026】
このビデオストリームをサーバSに登録する際、領域(分割)情報提供部35によって提供される領域(分割)情報を基に、エンハンスメントレイヤ・ストリームの連続送信可能な最低単位、即ちパケットに分割しながら行なう。領域分割情報提供部35による領域分割情報の提供方法としては、例えばビデオストリームの再生中にユーザによって再生画面上においてマウス等で領域を指示する手動入力方式、人の顔やキャプション等を画像処理により抽出する自動判定方式等が考えらる。
【0027】
又、上記パケット分割の具体的な方式は使用する圧縮方式によって異なるが基本的には図3に示す如く、各領域の境界が分割パケットの境界になるように行うものとする。即ち図3の例では、まず同図(a)に示す如く画面をA1,A2,A3の3つの領域に分割し、これら分割領域の境界が分割パケットの境界と重なるようにしてパケット分割を行なう。同図(b)はそのようにして得られた分割パケットの例である。同図では、上記領域A1はパケット2,4よりなり、領域A2はパケット6,8よりなり、領域A3はパケット1,1,3,3,5,5,5,7,7,9,9よりなる。よって、各領域間の境界はパケット間の境界と完全に重なっている。
【0028】
このようにパケット毎に分割されたストリームをサーバSに、通常ストリーム12,13として登録する。ここで、通常ストリーム12として登録されるストリームは上述のベースレイヤのデータであり、通常ストリーム13として登録されるストリームは同エンハンスメントレイヤ(この場合一層のみ)のデータである。更に、登録する際に、後述する、領域とパケットとの対応情報を持つ領域テーブル16、及び同じく後述する、領域と実効伝送レートとの対応情報を持つレートテーブル17を作成し、これらのテーブルも同時に登録する。
【0029】
他方、当該登録ストリームのクライアントCへの配信時には、送出部20はクライアントCからの受信実績による実効許容受信レートのフィードバックを受ける等の方法により、実効許容伝送レートR_Effectiveを検出する。又、領域決定部19は、上記レートテーブル17に基づき、送出部20で検出した実効許容レートR_Effectiveの伝送容量範囲内で配信可能な0個又は1個以上の領域を選ぶ。この場合に配信可能領域が0個となるのは、実効許容レートR_Effeectiveの容量範囲内で伝送可能な領域が存在しない場合である。
【0030】
又、パケット選択部18では領域テーブル16を用いて選ばれた領域を構成するパケットを判断する。ここで選ばれた領域を構成するパケットの各々について、パケット選択スイッチ15によって通常ストリーム13のパケットが送出部20に送られる。他方ここで選ばれなかった領域を構成するパケットについては、パケット選択スイッチ15によってダミーストリームのパケットが送出され、若しくはパケット無しとして、何も送出されない。
【0031】
ここでダミーストリームとは画面の情報を持たないストリームであり、情報量が極めて小さいものである。例えばMPEG−4方式であればすべてスキップマクロブロックで構成することにより実現され、ビデオパケットヘッダのみで構成出来るものである。このダミーストリームが選択された領域については、ベースレイヤ(通常ストリーム12)の画面がそのまま出力されることになる。又、シンタックス上、画面情報を送出しない場合にダミーを必要としない符号化方式の場合、上記選択されない領域については該当するパケットを送出しないということも出来る。これの場合は上記「パケット無し」が選択される。
【0032】
次に、図4に示す第2実施例では、領域選択に対してユーザである視聴者からのフィードバックを利用する構成を有する。この場合、予め複数種類の領域分割態様を用意しておき、視聴者の指示によって選択された領域分割態様と検出R_effectiveとから、パケット選択スイッチ15にて、配信するストリームを選択する。
【0033】
図5は、上記図4における、複数種類の領域分割態様を用意した場合のパケット分割の態様を示す。この場合、同図(a)の領域分割態様1では、領域A1とそれ以外の部分とに分割され、他方同図(b)の領域分割態様2では、領域A2とそれ以外の部分に分割されるものとする。ここで、これら2種類の領域分割態様を合成すると、同図(c)に示す如く、領域A1、A2と、それ以外の部分とに分割されることになる。同図に示す如く、合成した結果領域A1,A2に重なる部分がある場合、この重複部分にも対応するように、パケット分割が行なわれるものとする(図示の例の場合パケット7が該当するパケットである)。
【0034】
この図5(c)に示す合成領域分割態様における分割領域間の境界に従って上述の如くパケット分割を行なった結果、同図(d)に示す如くの分割パケットが得られる。この場合領域A1に対応するパケットはパケット2,4,7,8であり、領域A2に対応するパケットはパケット6,7,10,12となる。図5の例は領域分割態様が2種類の場合の例であったが、この例に限られず、3種類以上の分割であっても上記同様に分割領域の合成結果に対応するようにパケット分割が行なわれるものとする。
【0035】
このようにして1つのコンテンツに対して複数種類の領域分割態様を用意しておき、配信時には視聴者が選択した領域選択情報番号をクライアントからサーバに送り、選択された領域選択情報番号で指定される領域分割態様に対応して準備されたテーブル16,17の項目(エントリ)を用いて図2の実施例における説明と同様の方法にて配信を行う。
【0036】
以下に、更に詳細に本発明の各実施例について説明する。
【0037】
まず、上記領域とパケットとの対応情報を格納する領域テーブル16は。動画像のフレーム毎に領域番号とパケット番号pnoとを対応付ける構成とされる。即ち、あるフレームのパケット分割が例えば図3に示すようなものであった場合、当該テーブル16に格納される値は以下の表2に示す如くの値となる。
【0038】
【表2】
ここで領域の位置や分割態様は領域分割情報提供部35からの情報に応じてフレーム毎に逐次変化することが考えられ、もって、特に動画像における対象物(例えばサッカー中継画面における個々の選手の画像等)の動きが激しい場合等では、当該テーブル16にはフレーム毎に異なる値が格納される場合がある。
【0039】
上記ストリームのパケット分割に関して周知のMPEG4の技術を適用した場合を例にとって以下に説明する。MPEG4ではストリームにおいて各ピクチャの開始点にはユニークワード0x000001B6が挿入されているため、容易にピクチャ先頭を検出することができる。しかしマクロブロックの先頭にはこのようなユニークワードは無いため、ピクチャ先頭の情報から通常のビットストリーム解析を行う必要がある。そのためビットストリームシンタックスの解析を行い、一度1ピクチャ分の全マクロブロックにつき、それらの情報を一旦符号化モード、動きベクトル、量子化器、DCT係数の夫々の情報に戻す。MPEG4では連続送信可能な最低単位はビデオパケットと呼ばれる単位であるため、このデータによって例えば図3による分割態様に従ってビデオパケットのヘッダを挿入しながら各マクロブロックの情報を再度ビットストリームに変換することにより、所望のパケット分割が施されたストリームを得ることが出来る。
【0040】
又、所謂VBR(Variable Bit Rate)でエンコードされている場合、ビットレートは時刻と共に変化するため、レートテーブル17もフレーム毎に用意する必要がある。ここで、ある時刻に図3における各領域のみについて取り出したエンハンスメントレイヤのストリームのビットレートが下記のとおりであったとする。
【0041】
領域A1のビットレートR_A[1] = 128(kbps)
領域A2のビットレートR_A[2] = 64(kbps)
領域A3のビットレートR_A[3] = 64(kbps)
又、ベースレイヤのストリームのビットレートを64kbpsとする。
【0042】
このとき、当該時刻に該当するフレーム番号のレートテーブル(17)T_R(frameno,R_effective)は以下の表3に示す内容となる。
【0043】
【表3】
このテーブルは各領域の優先度がA1>A2>A3であることも示している。この優先度が異なる場合はレートテーブルの内容も異なることとなる。上記表3の内容は、上記各領域毎の所要ビットレートに応じて、以下のようにして決められる。
【0044】
インターネット等の伝送路の検出実効許容伝送レートからベースレイヤのストリーム分のビットレートである64kbpsを差し引いたR_effectiveが256kbps以上の場合、A1,A2,A3の全ての領域についてベースレイヤに加えてエンハンスメントレイヤのストリームも配信することが可能となる。これは、上記各領域A1、A2、A3のエンハンスメントレイヤの所要ビットレートの合計が256kbpsであり、上記検出許容ビットレート(256kbps以上)の範囲内に収まるからである。
【0045】
同様の理由から、同ベースレイヤ分を差し引いたR_effectiveが192乃至256kbpsの範囲であれば、A1,A2の領域についてはベースレイヤに加えてエンハンスメントレイヤのストリームも配信可能であるが、他方領域A3についてはベースレイヤのストリームのみ配信することが可能である。これは、上記各領域A1、A2のエンハンスメントレイヤの所要ビットレートの合計が192kbpsであり、上記検出許容ビットレート(192kbps以上)の範囲内に収まるからである。
【0046】
又、同ベースレイヤ分を差し引いたR_effectiveが128乃至192kbpsの範囲であれば、A1の領域についてのみベースレイヤに加えてエンハンスメントレイヤのストリームも配信可能であるが、他方領域A2,A3についてはベースレイヤのストリームのみ配信可能である。これは、上記各領域A1のエンハンスメントレイヤの所要ビットレートの合計が128kbpsであり、上記検出許容ビットレート(128kbps以上)の範囲内に収まるからである。
【0047】
更に同R_effectiveが128kbps未満の際は、全ての領域についてベースレイヤのストリームのみ配信可能である。これは、検出ビットレートが最も優先順位の高い領域A1のエンハンスメントレイヤの所要ビットレート128kbpsに満たないからである。
【0048】
以下、図6と共に、本発明の図2に示す第1実施例による画像伝送方式の処理手順について説明する。尚、同図ではエンハンスメントレイヤ・ストリームの送信手順について示しているが、ベースレイヤ・ストリームは全てパケットについて配信されるものとする。
【0049】
即ち、先ず配信すべき動画像の最初のフレームについて(ステップS1),ステップS2にて「領域リスト」を作成する。この領域リストは以下の通りに作成する。即ち、まず、現在の検出実効許容ビットレートから、当該フレームに関する表3の如くのレートテーブル17を参照し、当該検出実効許容レートの範囲内でエンハンスメントレイヤ・ストリームが配信可能な領域を決定する。次に、当該フレームに関する表2の如くの領域テーブル16を参照し、上記の如くに決定された、エンハンスメントレイヤ・ストリームが配信可能な領域T_Aを構成するパケット番号pnoを抽出し、当該抽出されたパケット番号のリストを「領域リストAL」とする。
【0050】
次に、当該フレームの最初のビデオパケットについて(ステップS3)、当該パケット番号が上記領域リストALに含まれているか否かを判定する(ステップS4)。その結果含まれていなければ、当該パケットとして上記ダミーパケットを送信するか或いは何も送信しない(ステップS6)。ステップS4の結果、領域リストALに含まれいれば(Yes)、当該パケットとして該当するエンハンスメントレイヤのデータを送信する(ステップS5)。
【0051】
同様の処理を当該フレームを構成する全てのパケットについて繰り返し(ステップS4乃至S8のループ)、それが終了すると(ステップS7のYes)、次のフレームの処理に移行し(ステップS9)、各フレーム毎に上記処理を繰り返す(ステップS2乃至S10)。
【0052】
次に、図4に示す、本発明の第2実施例について詳細に説明する。
【0053】
本実施例では、ユーザである視聴者からの指示に従って予め準備されている複数の領域分割態様から所定のものを選択し、その領域分割態様に従って配信を行う。この場合の領域、パケット分割例については図5と共に上述した通りである。又、この場合の、あるフレームにおける各領域当たりの所要のビットレート例を以下に示す。
【0054】
領域分割1の場合
領域A1のビットレート:64(kbps)
A1以外の領域のビットレート:192(kbps)
領域分割2の場合
領域A1のビットレート:128(kbps)
A1以外の領域のビットレート:128(kbps)
ここでは、本実施例により、視聴者の嗜好に応じて、同じ動画像について異なる表示方法を選択する場合の例について説明する。
【0055】
図4において、クライアント・コンピュータCでは、例えばサッカーなどの試合中継画面を例に取ると、予め視聴者に対して例えば図7に示す如くのメニューを提示することにより選択可能とする。当該メニュー内容はコンテンツ選択時にサーバ・コンピュータSからクライアント・コンピュータCに送信されるものとする。
【0056】
図7の場合、メニュー上の番号が上記領域分割情報番号に相当する。この例では、領域分割情報1を選択した場合、画面中のAチームの選手が映っている領域について特に高画質で表示する態様が設定され、他方領域分割情報2が選択された場合にはBチームの選手が映っている領域について特に高画質で表示する態様が設定される。
【0057】
配信に使用される領域テーブル16として、上記第1実施例の場合に比して、更に他のパラメタが追加される。ここでは、当該追加パラメタをT_A(divno,pno) とし、あるフレームについて、図5に対応して、例えば以下の表4の如くに構成するものとする。ここで上記divnoは領域分割情報番号を示す。
【0058】
【表4】
尚、表4において、「領域番号T_A」としては以下の値が設定される。
【0059】
領域分割1(divno=1)の場合
領域A1:1
A1以外の領域:2
領域分割2(divno=2)の場合
領域A2:1
A2以外:2
またレートテーブル17についても、パラメタとして上記領域分割情報番号divnoを追加してT_R(divno,frameno,R_effective)とし、同じく図5に対応して例えば以下の表5の如くに構成する。
【0060】
ここで、R_effectiveは、ベースレイヤのストリームのビットレートである64kbpsを、検出された実効許容伝送レートから差し引いたものとする。
【0061】
【表5】
尚、この例では領域領域分割番号として“1”が選ばれた場合にはR_effectiveが256〜64kbpsのときに、当該領域分割情報番号設定時の領域番号1すなわち図5のA1の部分のみ選択され、Aチームの選手の部分が鮮明に見えるようになる。他方、領域領域分割情報番号として“2”が選ばれた場合には、R_effectiveが256〜128kbpsのときに、当該領域分割情報番号設定時の領域番号1すなわち図5のA2の部分のみ選択され、Bチームの選手が鮮明に見えるようになる。
【0062】
以下、図8と共に、上記本発明の第2実施例による画像伝送方式の処理手順について説明する。尚、第2実施例同様、同図ではエンハンスメントレイヤ・ストリームの送信手順について示しているが、ベースレイヤについては全てパケットについてベースレイヤ・ストリームが配信されるものとする。
【0063】
即ち、先ず配信すべき動画像の最初のフレームについて(ステップS1),視聴者の選択による領域分割情報を受信する(ステップS11)。そして、ステップS2にて当該フレームに関する「領域リスト」を作成する。この領域リストは以下の通りに作成する。
【0064】
即ち、まず、現在の検出実効許容ビットレートから、当該フレームに関する表5の如くのレートテーブル17のうちの、上記ステップS11にて得られた領域分割情報の番号(divno)の範囲について参照し、当該検出実効許容レートの範囲内でエンハンスメントレイヤ・ストリームが配信可能な領域を決定する。次に、当該フレームに関する表4の如くの領域テーブル16のうちの、上記ステップS11にて得られた領域分割情報の番号(divno)の範囲について参照し、上記の如くに決定され、たエンハンスメントレイヤ・ストリームが配信可能な領域T_Aを構成するパケット番号pnoを抽出し、当該抽出されたパケット番号のリストを「領域リストAL」とする。
【0065】
次に、当該フレームの最初のビデオパケットについて(ステップS3)、当該パケット番号が上記領域リストALに含まれているか否かを判定する(ステップS4)。その結果含まれていなければ、当該パケットとして上記ダミーパケットを送信するか或いは何も送信しない(ステップS6)。ステップS4の結果、領域リストALに含まれいれば(Yes)、当該パケットとして該当するエンハンスメントレイヤのデータを送信する(ステップS5)。
【0066】
同様の処理を当該フレームを構成する全てのパケットについて繰り返し(ステップS4乃至S8のループ)、それが終了すると(ステップS7のYes)、次のフレームの処理に移行し(ステップS9)、各フレーム毎に上記処理を繰り返す(ステップS2乃至S10)。
【0067】
これら各実施例等で実現される本発明によれば、最低ベースレイヤとエンハンスメントレイヤの2階層のみで多数の中間の送信ビットレートの選択が可能となる。即ち、表3の例では4段階の送信ビットレートの選択が可能であり、表5の例では各領域分割態様のついて3段階の送信ビットレートの選択が可能となる。そのため、エンコード処理負荷を削減しながら実効許容ビットレートに即して細かく配信ビットレートを調整可能である。従って、常に現状の実効許容レートに即した、より最良に近い画質での配信が可能となる。
【0068】
又、1度のエンコードによって得られるパケットの組み合わせによって柔軟に配信ビットレートと特定の画像領域毎の画質との関係を制御可能であるため、再生画像に対するユーザの希望に即した態様での画像配信が可能となる。
【0069】
尚、本発明の実施例に適用可能な上記の「階層符号化技術(スケーラビリティ)」としては、例えばMPEG2に採用されたものとして、夫々公知の、▲1▼画面上の空間解像度に関する空間スケーラビリティ、▲2▼フレームレートに関する時間スケーラビリティ、▲3▼送信データを生成する際のデータ圧縮率に関するSNRスケーラビリティ等がある。このうち、上記各実施例の説明は、▲3▼SNRスケーラビヒティ技術を主に想定した説明となっている。この場合のデータ圧縮率は、例えば画像圧縮の過程で行なわれる量子化処理における量子化ステップサイズの大小によって決定され得る。
【0070】
本発明は以下の付記に記載の構成を含む。
【0071】
(付記1)
所定の動画像データから得られる基本となるベースレイヤのデータストリームと、当該ベースレイヤの動画像データに対して付加することによって画質を向上し得るエンハンスメントレイヤのデータストリームとから所定の伝送路を介して配信すべき動画像データコンテンツを生成するデータ伝送装置であって、
当該所定の動画像データを複数の領域に分割する分割手段と、
所定の単位時間毎に前記所定の伝送路の実効許容送信レートの範囲内で上記エンハンスメントレイヤのストリームを送信可能な上記複数の領域のうちの所定の領域についてエンハンスメントレイヤとベースレイヤとの両方のストリームを送信する送信レイヤ決定手段とよりなるデータ伝送装置。
【0072】
(付記2)
所定の動画像データから得られる基本となるベースレイヤのデータストリームと、当該ベースレイヤの動画像データに対して付加することによって画質を向上し得るエンハンスメントレイヤのデータストリームとから所定の伝送路を介して配信すべき動画像データコンテンツを生成するデータ伝送装置であって、
当該所定の動画像データを複数の領域に分割する分割手段と、
エンハンスメントレイヤのストリームについて、所定の単位時間毎に前記所定の伝送路の実効許容送信レートの範囲内で上記エンハンスメントレイヤのストリームを送信可能な上記複数の領域のうちの所定の領域についてエンハンスメントレイヤのストリームを送信し、他の領域についてはダミーデータを送信するか或いは配信を停止するエンハンスメントレイヤ決定手段とよりなるデータ伝送装置。
【0073】
(付記3)
前記複数の領域の各領域は所定の優先順位を有し、前記送信レイヤ決定手段は前記所定の単位時間毎に上記優先順位に従ってベースレイヤとエンハンスメントレイヤとの両方のストリームを送信する領域を選択する構成の付記1又は2に記載のデータ伝送装置。
【0074】
(付記4)
前記送信レイヤ決定手段は、予め前記複数の領域のうちから所定の順序で順次各領域を選択していった場合の夫々の場合のエンハンスメントレイヤのストリーム送信のための合計所要送信レートを算出しておき、前記複数の領域のうちから所定の順序で順次各領域を選択していった場合の夫々の場合のうち、前記所定の単位時間毎に前記所定の伝送路の実効許容送信レートの範囲内で最大合計所要送信レートとなる場合の選択領域の各々についてエンハンスメントレイヤのストリームを送信する付記1乃至3のうちのいずれかに記載のデータ伝送装置。
【0075】
(付記5)
前記分割手段は、所定の動画像データについて、選択可能に複数種類設けた領域分割態様の各々について複数の領域に分割する構成の付記1乃至4にうちのいずれかに記載のデータ伝送装置。
【0076】
(付記6)
前記分割手段による分割領域の各々に対応させてエンハンスメントレイヤのストリームの連続送信可能な最低データ単位の各々を設定する構成の付記1乃至5のうちのいずれかに記載のデータ伝送装置。
【0077】
(付記7)
所定の動画像データから得られる基本となるベースレイヤのデータストリームと、当該ベースレイヤの動画像データに対して付加することによって画質を向上し得るエンハンスメントレイヤのデータストリームとから所定の伝送路を介して配信すべき動画像データコンテンツを生成するためのデータ伝送方法であって、
当該所定の動画像データを複数の領域に分割する分割段階と、
所定の単位時間毎に前記所定の伝送路の実効許容送信レートの範囲内で上記エンハンスメントレイヤのストリームを送信可能な上記複数の領域のうちの所定の領域についてエンハンスメントレイヤとベースレイヤとの両方のストリームを送信する送信レイヤ決定段階とよりなるデータ伝送方法。
【0078】
(付記8)
所定の動画像データから得られる基本となるベースレイヤのデータストリームと、当該ベースレイヤの動画像データに対して付加することによって画質を向上し得るエンハンスメントレイヤのデータストリームとから所定の伝送路を介して配信すべき動画像データコンテンツを生成するためのデータ伝送方法であって、
当該所定の動画像データを複数の領域に分割する分割段階と、
エンハンスメントレイヤのストリームについて、所定の単位時間毎に前記所定の伝送路の実効許容送信レートの範囲内で上記エンハンスメントレイヤのストリームを送信可能な上記複数の領域のうちの所定の領域についてエンハンスメントレイヤのストリームを送信し、他の領域についてはダミーデータを送信するか或いは配信を停止するエンハンスメントレイヤ決定段階とよりなるデータ伝送方法。
【0079】
(付記9)
前記複数の領域の各領域は所定の優先順位を有し、前記送信レイヤ決定段階では前記所定の単位時間毎に上記優先順位に従ってベースレイヤとエンハンスメントレイヤとの両方のストリームを送信する領域を選択する構成の付記7又は8に記載のデータ伝送方法。
【0080】
(付記10)
前記送信レイヤ決定段階では、予め前記複数の領域のうちから所定の順序で順次各領域を選択していった場合の夫々の場合のエンハンスメントレイヤのストリーム送信のための合計所要送信レートを算出しておき、前記前記複数の領域のうちから所定の順序で順次各領域を選択していった場合の夫々の場合のうち、前記所定の単位時間毎に、前記所定の伝送路の実効許容送信レートの範囲内で最大合計所要送信レートとなる場合の選択領域の各々についてエンハンスメントレイヤのストリームを送信する付記7乃至9のうちのいずれかに記載のデータ伝送方法。
【0081】
(付記11)
前記分割段階では、所定の動画像データについて、選択可能に設けた複数種類の領域分割態様の各々について複数の領域に分割する構成の付記7乃至10にうちのいずれかに記載のデータ伝送方法。
【0082】
(付記12)
前記分割段階での分割領域の各々に対応させてエンハンスメントレイヤのストリームの連続送信可能な最低データ単位の各々を設定する構成の付記7乃至11のうちのいずれかに記載のデータ伝送方法。
【0083】
(付記13)
前記付記7乃至12のうちのいずれかに記載のデータ伝送方法をコンピュータに実行させるためのソフトウェアプログラム。
【0084】
【発明の効果】
本発明では、配信すべきコンテンツは予めベースレイヤトエンハンスメントレイヤの最低2層分のデータストリームを作成しておき、コンテンツ配信時の実効許容送信レートの範囲内でエンハンスメントレイヤのデータストリームを送信可能な最大限度の領域の組み合わせについてエンハンスメントレイヤのデータストリームをベースレイヤのデータストリームに加えて送信する。そのため、コンテンツ毎に準備すべき階層符号化方式による最低層数は2層であるにもかかわらず、配信時点の実効許容送信レートに応じて、エンハンスメントレイヤのストリームを送信する領域の選択によって様々な送信レートで当該コンテンツを配信可能である。したがって、配信時点の実効許容送信レートに応じ細かく対応して様々な態様の送信データの生成が可能である。もって、比較的簡易な構成にて、伝送路の状態に応じた配信内容の細かな動的適応が可能であり、且つ、階層符号化方式の適用によって伝送路の効率的利用が可能なデータ伝送方式を提供可能である。
【図面の簡単な説明】
【図1】従来の一例の動的帯域適応配信技術を説明するための図である。
【図2】本発明の第1実施例によるデータ伝送システムの概略ブロック図である。
【図3】本発明の第1実施例による領域分割とパケット割り当てについて説明するための図である。
【図4】本発明の第2実施例によるデータ伝送システムの概略ブロック図である。
【図5】本発明の第2実施例による領域分割とパケット割り当てについて説明するための図である。
【図6】本発明の第1実施例によるデータ伝送方法の概略動作フローチャートである。
【図7】本発明の第2実施例におけるクライアント・コンピュータに表示するメニュー画面の一例を説明するための図である。
【図8】本発明の第2実施例によるデータ伝送方法の概略動作フローチャートである。
【符号の説明】
31 ビデオリソース
33 エンハンスメントレイヤ・ストリーム格納部
34 ベースレイヤ・ストリーム格納部
11 ストリーム分解部
12 通常ストリーム(ベースレイヤ)送出部
13 通常ストリーム(エンハンスメントレイヤ)送出部
14 ダミーストリーム送出部
15 パケット選択スイッチ
16 領域テーブル格納部
17 レートテーブル格納部
18 パケット選択部
19 領域決定部
20 送信部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image transmission apparatus, an image transmission method, and a software program, and more particularly to an image transmission apparatus, an image transmission method, and a software program for distributing image information such as a moving image via a communication network such as the Internet.
[0002]
[Prior art]
The problem with the distribution of moving images over the so-called best-effort network such as the Internet is that a packet loss or the like occurs due to a lack of network bandwidth or the like, and as a result, the reproduction image quality due to the distributed information is remarkably deteriorated. There are cases. In order to solve this problem, there is a moving image distribution technique for performing distribution while dynamically adapting to the effective bandwidth capacity.
[0003]
As an example, there is a technology in which moving image content is encoded at a plurality of types of bit rates, stored in a server, and a bit rate stream that can be transmitted at an effective allowable rate at the time of content distribution is dynamically selected and distributed. is there. The outline of the technology will be described below with reference to FIG.
[0004]
Here, encoding at a plurality of types of bit rates described above means that a plurality of types of predetermined data conversion are performed so that the bit rate when moving image content is transmitted by a predetermined transmission means becomes a predetermined plurality of types of rates. This means that data conversion is performed at a rate, for example, data compression is performed at a plurality of predetermined compression rates.
[0005]
In the figure, the sending unit 110 of the server computer 100 measures the effective allowable transmission rate R_effective that can be received by the
[0006]
For example, when R_effective = 600 kbps, the
[0007]
[Problems to be solved by the invention]
As described above, in the conventional network bandwidth adaptive distribution system, the moving image content is encoded in advance at a plurality of types of bit rates and stored in the server computer for distribution when a decrease in the effective allowable rate is detected. deep. Then, as described above, it is assumed that the effective permissible rate detected at a certain time point is 600 kbps, and when a stream encoded at 500 kbps is selected, a decrease in the effective permissible rate is detected and becomes 400 kbps. At this time, a stream encoded at the next lower bit rate is selected and distributed at 250 kbps.
[0008]
In this case, although there is actually a transmission rate capacity of 400 kbps-250 kbps = 150 kbps, it is necessary to reduce the transmission rate to 250 kbps in order to select from pre-encoded ones. There has been a problem that the image quality is greatly deteriorated more than the degree of actual network situation deterioration.
[0009]
In order to avoid this problem, it is conceivable to encode in advance at various bit rates including 400 kbps, etc., but this requires an encoder with high processing capacity, or for this reason, the encoding processing time is increased. In particular, it is not preferable for moving image distribution.
[0010]
Hierarchical coding has been proposed as a technique for efficiently performing distribution at such multiple bit rates. This method is also referred to as scalability, and differs from the normal method as described above in which information such as a single moving image is encoded (encoded) into a single stream, and has a hierarchical structure with multiple layers, and is independent for each layer. This is a method of encoding as a stream. Here, the most basic layer is referred to as a base layer, and the higher layer stream is referred to as an enhancement layer.
[0011]
In this hierarchical coding method, reproduction is possible with only the base layer, but by adding enhancement layers one layer at a time, information such as moving images with sequentially improved quality can be provided. A specific example in this case is shown in Table 1 below.
[0012]
[Table 1]
In this example, the same three types of bit rates as in the previous example can be selected. Here, the base layer is a stream encoded at a bit rate of 64 kbps.
[0013]
The
[0014]
Further,
[0015]
Therefore, by adding the decoded reproduction image data of the
[0016]
According to this hierarchical encoding method, the base layer stream out of the base layer and
[0017]
In the conventional network band adaptive distribution system, as described above, it is possible to detect a decrease in effective allowable rate and prevent a significant deterioration such as a screen collapse even when distribution at a low rate is selected. . However, in this method, degradation due to encoding such as mosquito noise and block distortion occurs uniformly throughout the screen as a result of low-rate delivery, so the image quality of the portion that is particularly important for the user in the screen is also another less important portion. Similarly, it will deteriorate. In such a case, there is a possibility that the user may not endure viewing.
[0018]
To solve this problem, the image quality is maintained only in a specific area that is considered important, and encoding is performed at a lower overall rate by a method that relatively increases the degradation of the other areas. It is possible to keep it. In this regard, in Japanese Patent Laid-Open No. 7-288806, when compressing and transmitting an image, the resolution of each part of the image is automatically determined according to the allowable transmission amount, and the resolution of the part to be viewed in detail can be specified. A communication system is disclosed.
[0019]
In the technique disclosed in the publication, as shown in FIGS. 1 and 2 of the publication, one-to-one real-time communication between the video provider and the receiver is assumed. In this configuration, an image is captured in real time, and image compression is performed at different resolutions for each region in accordance with an instruction from the recipient. However, in this system, the image data generated by the transmission side communication unit is dedicated to one receiver, and if it is assumed that the same moving image is distributed to a large number of receivers in the same system, Since the image area desired to have a high resolution differs for each recipient, it is necessary to provide at least a transmission side communication unit for each recipient, resulting in a complicated system configuration. In addition, in this system, an image area that should be high resolution cannot be determined until an instruction from the recipient is received, and image compression processing cannot be performed. Not suitable for.
[0020]
In view of the above problems, an object of the present invention is to provide an image transmission system capable of fine image quality adjustment according to the effective transmission rate of a network with a relatively simple configuration.
[0021]
[Means for Solving the Problems]
In order to achieve the above object, in the present invention, a basic base layer data stream obtained from predetermined moving image data and an enhancement layer that can improve image quality by being added to the moving image data of the base layer. When generating moving image data content to be distributed from a data stream via a predetermined transmission path, the moving image data is divided into a plurality of regions, and effective transmission of the predetermined transmission path is performed every predetermined unit time. The enhancement layer stream and the base layer stream are transmitted for a predetermined region of the plurality of regions in which the enhancement layer stream can be transmitted within a rate range.
[0022]
In this configuration, the content is a combination of areas in which a data stream for at least two layers of the base layer enhancement layer is created in advance and the enhancement layer data stream can be transmitted within the range of the effective allowable transmission rate at the time of content distribution. In addition to the base layer data stream, the enhancement layer data stream is transmitted.
[0023]
DETAILED DESCRIPTION OF THE INVENTION
In the embodiment of the present invention, the screen is divided into several fine regions in advance, and only a region that can be transmitted at the effective transmission rate of the detected transmission path is selected, so that one stream can be more finely divided. Adaptable to the effective allowable rate. Further, as a variation of the embodiment, by allowing the user to select this area, it is possible to perform transmission with an image quality suitable for the user's preference.
[0024]
The schematic configuration of the embodiment of the present invention will be described below with reference to FIG.
[0025]
In the embodiment of the present invention, moving image data obtained in advance from a
[0026]
When this video stream is registered in the server S, it is divided into the minimum unit in which the enhancement layer stream can be continuously transmitted, that is, the packet based on the area (division) information provided by the area (division) information providing unit 35. Do. As a method of providing region division information by the region division information providing unit 35, for example, a manual input method in which a user designates an area with a mouse or the like on a reproduction screen during reproduction of a video stream, human face, caption, etc. by image processing An automatic determination method or the like for extraction can be considered.
[0027]
The specific method of packet division differs depending on the compression method used, but basically, as shown in FIG. 3, it is assumed that the boundary of each region is the boundary of the divided packet. That is, in the example of FIG. 3, the screen is first divided into three areas A1, A2, and A3 as shown in FIG. 3A, and packet division is performed so that the boundaries of these divided areas overlap the boundaries of the divided packets. . FIG. 2B shows an example of the divided packet obtained in this way. In the figure, the area A1 is composed of
[0028]
The streams divided for each packet in this way are registered in the server S as
[0029]
On the other hand, when the registered stream is distributed to the client C, the sending
[0030]
Further, the packet selection unit 18 uses the region table 16 to determine the packets constituting the selected region. The packet of the
[0031]
Here, the dummy stream is a stream that has no screen information, and has a very small amount of information. For example, in the case of the MPEG-4 system, it is realized by configuring with skip macroblocks, and can be configured with only a video packet header. For the area where the dummy stream is selected, the screen of the base layer (normal stream 12) is output as it is. In addition, in the syntax, in the case of an encoding method that does not require a dummy when screen information is not transmitted, it can be said that the corresponding packet is not transmitted for the non-selected region. In this case, “no packet” is selected.
[0032]
Next, the second embodiment shown in FIG. 4 has a configuration in which feedback from a viewer who is a user is used for region selection. In this case, a plurality of types of region division modes are prepared in advance, and a stream to be distributed is selected by the
[0033]
FIG. 5 shows a packet division mode when a plurality of types of region division modes in FIG. 4 are prepared. In this case, in the
[0034]
As a result of the packet division as described above according to the boundary between the divided areas in the composite area dividing mode shown in FIG. 5C, a divided packet as shown in FIG. 5D is obtained. In this case, the packets corresponding to the area A1 are the
[0035]
In this way, a plurality of types of area division modes are prepared for one content, and at the time of distribution, the area selection information number selected by the viewer is sent from the client to the server, and designated by the selected area selection information number. Distribution is performed in the same manner as described in the embodiment of FIG. 2 using the items (entries) of the tables 16 and 17 prepared corresponding to the area division mode.
[0036]
In the following, each embodiment of the present invention will be described in more detail.
[0037]
First, an area table 16 that stores correspondence information between the above-described areas and packets. An area number and a packet number pno are associated with each frame of a moving image. That is, when the packet division of a certain frame is as shown in FIG. 3, for example, the values stored in the table 16 are as shown in Table 2 below.
[0038]
[Table 2]
Here, it is conceivable that the position and division mode of the area change sequentially for each frame in accordance with information from the area division information providing unit 35, and in particular, an object in a moving image (for example, an individual player on a soccer relay screen) When the motion of the image or the like is intense, the table 16 may store a different value for each frame.
[0039]
A case where a well-known MPEG4 technique is applied to packet division of the stream will be described below as an example. In MPEG4, since the unique word 0x000001B6 is inserted at the start point of each picture in the stream, the head of the picture can be easily detected. However, since there is no such unique word at the beginning of the macroblock, it is necessary to perform normal bitstream analysis from the information at the beginning of the picture. Therefore, the bitstream syntax is analyzed, and once for all macroblocks for one picture, the information is once returned to the information of the encoding mode, motion vector, quantizer, and DCT coefficient. In MPEG4, since the minimum unit that can be transmitted continuously is a unit called a video packet, the information of each macroblock is converted into a bitstream again while inserting the header of the video packet according to the division mode shown in FIG. Thus, a stream subjected to desired packet division can be obtained.
[0040]
In addition, when the encoding is performed by so-called VBR (Variable Bit Rate), the bit rate changes with time, so it is necessary to prepare the rate table 17 for each frame. Here, it is assumed that the bit rate of the enhancement layer stream extracted for each region in FIG. 3 at a certain time is as follows.
[0041]
Bit rate R_A [1] of area A1 = 128 (kbps)
Bit rate R_A [2] of area A2 = 64 (kbps)
Bit rate R_A [3] of area A3 = 64 (kbps)
The bit rate of the base layer stream is 64 kbps.
[0042]
At this time, the rate table (17) T_R (frameno, R_effective) of the frame number corresponding to the time has the contents shown in Table 3 below.
[0043]
[Table 3]
This table also shows that the priority of each area is A1>A2> A3. When this priority is different, the contents of the rate table are also different. The contents of Table 3 are determined as follows according to the required bit rate for each area.
[0044]
When R_effective is equal to or higher than 256 kbps, which is a base layer stream bit rate of 64 kbps, from the detected effective allowable transmission rate of a transmission path such as the Internet, the enhancement layer in addition to the base layer for all areas A1, A2, and A3 This stream can also be distributed. This is because the total required bit rate of the enhancement layer in each of the areas A1, A2, and A3 is 256 kbps and falls within the range of the detection allowable bit rate (256 kbps or more).
[0045]
For the same reason, if the R_effective value obtained by subtracting the base layer is within a range of 192 to 256 kbps, the enhancement layer stream can be delivered in addition to the base layer in the areas A1 and A2, but the other area A3. Can only deliver base layer streams. This is because the total required bit rate of the enhancement layer in each of the areas A1 and A2 is 192 kbps and falls within the range of the detection allowable bit rate (192 kbps or more).
[0046]
If R_effective after subtracting the same base layer is in the range of 128 to 192 kbps, the enhancement layer stream can be distributed in addition to the base layer only for the area A1, while the base layer for the other areas A2 and A3. Only stream of can be delivered. This is because the total required bit rate of the enhancement layer in each area A1 is 128 kbps and falls within the range of the detection allowable bit rate (128 kbps or more).
[0047]
Furthermore, when the same R_effective is less than 128 kbps, only the base layer stream can be distributed for all areas. This is because the detected bit rate is less than the required bit rate of 128 kbps of the enhancement layer in the area A1 having the highest priority.
[0048]
The processing procedure of the image transmission method according to the first embodiment shown in FIG. 2 of the present invention will be described below with FIG. In the figure, the transmission procedure of the enhancement layer stream is shown, but it is assumed that the base layer stream is all delivered for the packet.
[0049]
That is, first, for the first frame of the moving image to be distributed (step S1), an “area list” is created in step S2. This area list is created as follows. That is, first, from the current detected effective permissible bit rate, a rate table 17 as shown in Table 3 relating to the frame is referred to, and an area where the enhancement layer stream can be distributed within the range of the permissible effective detection rate is determined. Next, referring to the area table 16 as shown in Table 2 regarding the frame, the packet number pno constituting the area T_A to which the enhancement layer stream can be distributed, which is determined as described above, is extracted, and the extracted The list of packet numbers is referred to as “area list AL”.
[0050]
Next, for the first video packet of the frame (step S3), it is determined whether the packet number is included in the area list AL (step S4). If it is not included as a result, the dummy packet is transmitted as the packet, or nothing is transmitted (step S6). If the result of step S4 is not included in the area list AL (Yes), the corresponding enhancement layer data is transmitted as the packet (step S5).
[0051]
The same processing is repeated for all the packets constituting the frame (the loop of steps S4 to S8). When the processing is completed (Yes in step S7), the process proceeds to the next frame (step S9). The above processing is repeated (steps S2 to S10).
[0052]
Next, the second embodiment of the present invention shown in FIG. 4 will be described in detail.
[0053]
In this embodiment, a predetermined one is selected from a plurality of area division modes prepared in advance according to an instruction from a viewer who is a user, and distribution is performed according to the area division mode. The area and packet division example in this case are as described above with reference to FIG. An example of a required bit rate per area in a certain frame in this case is shown below.
[0054]
For
Bit rate of area A1: 64 (kbps)
Bit rate of area other than A1: 192 (kbps)
For
Bit rate of area A1: 128 (kbps)
Bit rate of area other than A1: 128 (kbps)
Here, according to the present embodiment, an example in which different display methods are selected for the same moving image according to the viewer's preference will be described.
[0055]
In FIG. 4, for example, in the case of a game relay screen such as soccer, the client computer C can be selected by presenting a menu as shown in FIG. 7 to the viewer in advance. It is assumed that the menu contents are transmitted from the server computer S to the client computer C when selecting the content.
[0056]
In the case of FIG. 7, the number on the menu corresponds to the area division information number. In this example, when the
[0057]
As the area table 16 used for distribution, other parameters are further added as compared with the case of the first embodiment. Here, it is assumed that the additional parameter is T_A (divno, pno), and a certain frame is configured as shown in Table 4 below, for example, corresponding to FIG. Here, divno indicates a region division information number.
[0058]
[Table 4]
In Table 4, the following values are set as “area number T_A”.
[0059]
In the case of area division 1 (divno = 1)
Area A1: 1
Area other than A1: 2
In case of area division 2 (divno = 2)
Area A2: 1
Other than A2: 2
The rate table 17 is also configured as T_R (divno, frameno, R_effective) by adding the region division information number divno as a parameter, as shown in the following Table 5, for example, corresponding to FIG.
[0060]
Here, R_effective is obtained by subtracting 64 kbps, which is the bit rate of the base layer stream, from the detected effective allowable transmission rate.
[0061]
[Table 5]
In this example, when “1” is selected as the area division number, when R_effective is 256 to 64 kbps, only the
[0062]
The processing procedure of the image transmission system according to the second embodiment of the present invention will be described below with reference to FIG. As in the case of the second embodiment, the transmission procedure of the enhancement layer stream is shown in the figure, but the base layer stream is distributed for all the base layers.
[0063]
That is, for the first frame of the moving image to be distributed (step S1), the region division information by the viewer selection is received (step S11). In step S2, an “area list” for the frame is created. This area list is created as follows.
[0064]
That is, first, referring to the range of the region division information number (divno) obtained in step S11 in the rate table 17 as shown in Table 5 for the frame from the current detected effective allowable bit rate, An area in which the enhancement layer stream can be distributed within the range of the detected effective allowable rate is determined. Next, with reference to the range (divno) of the area division information obtained in step S11 in the area table 16 as shown in Table 4 regarding the frame, the enhancement layer determined as described above is used. The packet number pno constituting the area T_A in which the stream can be distributed is extracted, and the list of the extracted packet numbers is referred to as “area list AL”.
[0065]
Next, for the first video packet of the frame (step S3), it is determined whether the packet number is included in the area list AL (step S4). If it is not included as a result, the dummy packet is transmitted as the packet, or nothing is transmitted (step S6). If the result of step S4 is not included in the area list AL (Yes), the corresponding enhancement layer data is transmitted as the packet (step S5).
[0066]
The same processing is repeated for all the packets constituting the frame (the loop of steps S4 to S8). When the processing is completed (Yes in step S7), the process proceeds to the next frame (step S9). The above processing is repeated (steps S2 to S10).
[0067]
According to the present invention implemented in each of these embodiments, a number of intermediate transmission bit rates can be selected only in the two layers of the lowest base layer and the enhancement layer. That is, in the example of Table 3, four stages of transmission bit rates can be selected, and in the example of Table 5, three stages of transmission bit rates can be selected for each area division mode. Therefore, it is possible to finely adjust the distribution bit rate in accordance with the effective allowable bit rate while reducing the encoding processing load. Accordingly, it is possible to deliver images with near-best image quality consistent with the current effective permissible rate.
[0068]
In addition, it is possible to flexibly control the relationship between the distribution bit rate and the image quality for each specific image area by combining the packets obtained by one encoding, so that the image distribution in a manner that meets the user's desire for the reproduced image Is possible.
[0069]
As the above-mentioned “hierarchical encoding technique (scalability)” applicable to the embodiment of the present invention, for example, one that is adopted in MPEG2, known as (1) spatial scalability related to spatial resolution on the screen, (2) Time scalability related to the frame rate, and (3) SNR scalability related to the data compression rate when generating transmission data. Of these, the description of each of the above embodiments is mainly based on (3) SNR scalability technology. The data compression rate in this case can be determined by the size of the quantization step size in the quantization process performed in the image compression process, for example.
[0070]
The present invention includes configurations described in the following supplementary notes.
[0071]
(Appendix 1)
A basic base layer data stream obtained from predetermined moving image data and an enhancement layer data stream that can improve image quality by adding to the base layer moving image data via a predetermined transmission path. A data transmission device for generating moving image data content to be distributed,
Dividing means for dividing the predetermined moving image data into a plurality of regions;
Both enhancement layer and base layer streams for a predetermined region of the plurality of regions that can transmit the enhancement layer stream within a range of an effective allowable transmission rate of the predetermined transmission path every predetermined unit time A data transmission apparatus comprising transmission layer determination means for transmitting
[0072]
(Appendix 2)
A basic base layer data stream obtained from predetermined moving image data and an enhancement layer data stream that can improve image quality by adding to the base layer moving image data via a predetermined transmission path. A data transmission device for generating moving image data content to be distributed,
Dividing means for dividing the predetermined moving image data into a plurality of regions;
With regard to an enhancement layer stream, an enhancement layer stream for a predetermined region of the plurality of regions in which the enhancement layer stream can be transmitted within a range of an effective allowable transmission rate of the predetermined transmission path every predetermined unit time. A data transmission apparatus comprising enhancement layer determination means for transmitting dummy data for other areas or for stopping distribution.
[0073]
(Appendix 3)
Each region of the plurality of regions has a predetermined priority, and the transmission layer determining means selects a region for transmitting both base layer and enhancement layer streams according to the priority for each predetermined unit time. The data transmission apparatus according to
[0074]
(Appendix 4)
The transmission layer determining means calculates a total required transmission rate for enhancement layer stream transmission in each case where each region is sequentially selected in a predetermined order from the plurality of regions in advance. In each case where each region is sequentially selected from the plurality of regions in a predetermined order, the effective transmission rate within the predetermined transmission path is within the predetermined unit time. 4. The data transmission apparatus according to any one of
[0075]
(Appendix 5)
5. The data transmission apparatus according to any one of
[0076]
(Appendix 6)
6. The data transmission device according to any one of
[0077]
(Appendix 7)
A basic base layer data stream obtained from predetermined moving image data and an enhancement layer data stream that can improve image quality by adding to the base layer moving image data via a predetermined transmission path. A data transmission method for generating moving image data content to be distributed,
A division step of dividing the predetermined moving image data into a plurality of regions;
Both enhancement layer and base layer streams for a predetermined region of the plurality of regions that can transmit the enhancement layer stream within a range of an effective allowable transmission rate of the predetermined transmission path every predetermined unit time A data transmission method comprising: a transmission layer determining step for transmitting the data.
[0078]
(Appendix 8)
A basic base layer data stream obtained from predetermined moving image data and an enhancement layer data stream that can improve image quality by adding to the base layer moving image data via a predetermined transmission path. A data transmission method for generating moving image data content to be distributed,
A division step of dividing the predetermined moving image data into a plurality of regions;
With regard to an enhancement layer stream, an enhancement layer stream for a predetermined region of the plurality of regions in which the enhancement layer stream can be transmitted within a range of an effective allowable transmission rate of the predetermined transmission path every predetermined unit time. Is transmitted, and dummy data is transmitted for other areas, or the enhancement layer determining step of stopping distribution is performed.
[0079]
(Appendix 9)
Each region of the plurality of regions has a predetermined priority, and in the transmission layer determination step, a region for transmitting both base layer and enhancement layer streams is selected according to the priority for each predetermined unit time. The data transmission method according to
[0080]
(Appendix 10)
In the transmission layer determination step, a total required transmission rate for enhancement layer stream transmission in each case in which each region is sequentially selected in a predetermined order from the plurality of regions is calculated in advance. In each of the cases where each region is sequentially selected from the plurality of regions in a predetermined order, the effective transmission rate of the predetermined transmission path is determined for each predetermined unit time. 10. The data transmission method according to any one of
[0081]
(Appendix 11)
11. The data transmission method according to any one of
[0082]
(Appendix 12)
12. The data transmission method according to any one of
[0083]
(Appendix 13)
A software program for causing a computer to execute the data transmission method according to any one of
[0084]
【The invention's effect】
In the present invention, data to be distributed can be generated in advance by creating a data stream for at least two layers of the base layer enhancement layer, and the enhancement layer data stream can be transmitted within the range of the effective transmission rate at the time of content distribution The enhancement layer data stream is transmitted in addition to the base layer data stream for the maximum limit combination of regions. Therefore, although the minimum number of layers according to the hierarchical encoding method to be prepared for each content is two layers, it varies depending on the selection of the area for transmitting the enhancement layer stream according to the effective transmission rate at the time of distribution. The content can be distributed at a transmission rate. Therefore, it is possible to generate various types of transmission data corresponding to the effective allowable transmission rate at the time of distribution. Therefore, with a relatively simple configuration, it is possible to finely adapt the distribution contents according to the state of the transmission path, and data transmission that enables efficient use of the transmission path by applying a hierarchical coding scheme. A scheme can be provided.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining a conventional dynamic band adaptive distribution technique.
FIG. 2 is a schematic block diagram of a data transmission system according to a first embodiment of the present invention.
FIG. 3 is a diagram for explaining area division and packet allocation according to the first embodiment of the present invention;
FIG. 4 is a schematic block diagram of a data transmission system according to a second embodiment of the present invention.
FIG. 5 is a diagram for explaining region division and packet allocation according to a second embodiment of the present invention;
FIG. 6 is a schematic operation flowchart of a data transmission method according to the first embodiment of the present invention;
FIG. 7 is a diagram for explaining an example of a menu screen displayed on the client computer in the second embodiment of the present invention.
FIG. 8 is a schematic operation flowchart of a data transmission method according to a second embodiment of the present invention;
[Explanation of symbols]
31 Video resources
33 Enhancement layer stream storage
34 Base layer stream storage
11 Stream decomposition unit
12 Normal stream (base layer) sending part
13 Normal stream (enhancement layer) sending part
14 Dummy stream sending part
15 Packet selection switch
16 Area table storage
17 Rate table storage
18 Packet selector
19 Area determination part
20 Transmitter
Claims (5)
当該所定の動画像データを複数の領域に分割する分割手段と、
上記エンハンスメントレイヤのデータストリームを送信可能な上記複数の領域のうちの所定の領域についてエンハンスメントレイヤとベースレイヤとの両方のデータストリームを送信する送信レイヤ決定手段とを有し、
前記送信レイヤ決定手段は、
実効伝送レートと、エンハンスメントレイヤとベースレイヤとの両方のデータストリームの所要伝送レートが前記実効伝送レートの範囲内に収まる領域との対応情報を持つレートテーブル参照し、前記所定の伝送路の検出実効許容伝送レートの範囲内でエンハンスメントレイヤとベースレイヤとの両方のデータストリームを配信可能な領域を決定する手段と、
前記所定の動画像データの複数の領域と、各領域を構成するパケットとの対応情報を持つ領域テーブルを参照し、前記決定された配信可能な領域を構成するパケットを抽出する手段と、
前記抽出されたパケットについて前記エンハンスメントレイヤとベースレイヤとの両方のデータストリームを送信する手段とを有することを特徴とするデータ伝送装置。Predetermined transmission using a basic base layer data stream obtained from predetermined moving image data and an enhancement layer data stream that can be added to the base layer moving image data to improve image quality A data transmission device for generating moving image data content to be distributed via a road,
Dividing means for dividing the predetermined moving image data into a plurality of regions;
And a transmission layer determination means for transmitting the predetermined region of the upper Symbol said plurality of regions capable of transmitting data streams of enhancement layer both data streams of enhancement layer and the base layer,
The transmission layer determining means includes
Refer to a rate table having correspondence information between an effective transmission rate and a region in which required transmission rates of both enhancement layer and base layer data streams fall within the range of the effective transmission rate, and detect the effective transmission of the predetermined transmission path. Means for determining an area in which both enhancement layer and base layer data streams can be delivered within an allowable transmission rate;
Means for referring to an area table having correspondence information between a plurality of areas of the predetermined moving image data and a packet constituting each area, and extracting a packet constituting the determined distributable area;
A data transmission apparatus comprising: means for transmitting both the enhancement layer and base layer data streams for the extracted packet .
当該所定の動画像データを複数の領域に分割する分割段階と、
上記エンハンスメントレイヤのデータストリームを送信可能な上記複数の領域のうちの所定の領域についてエンハンスメントレイヤとベースレイヤとの両方のデータストリームを送信する送信レイヤ決定段階とを有し、
前記送信レイヤ決定段階は、
実効伝送レートと、エンハンスメントレイヤとベースレイヤとの両方のデータストリームの所要伝送レートが前記実効伝送レートの範囲内に収まる領域との対応情報を持つレートテーブルを参照し、前記所定の伝送路の検出実効許容伝送レートの範囲内でエンハンスメントレイヤとベースレイヤとの両方のデータストリームを配信可能な領域を決定する段階と、
前記所定の動画像データの複数の領域と、各領域を構成するパケットとの対応情報を持つ領域テーブルを参照し、前記決定された配信可能な領域を構成するパケットを抽出する段階と、
前記抽出されたパケットについて前記エンハンスメントレイヤとベースレイヤとの両方のデータストリームを送信する段階とを有することを特徴とするデータ伝送方法。Predetermined transmission using a basic base layer data stream obtained from predetermined moving image data and an enhancement layer data stream that can be added to the base layer moving image data to improve image quality A data transmission method for generating moving image data content to be distributed via a road,
A division step of dividing the predetermined moving image data into a plurality of regions;
And a transmission layer determination step of transmitting both data streams for a given area of the upper Symbol said plurality of regions capable of transmitting data streams of enhancement layer and enhancement layer and the base layer,
The transmission layer determination step includes:
Detecting the predetermined transmission path by referring to a rate table having correspondence information between an effective transmission rate and a region where the required transmission rates of both the enhancement layer and the base layer are within the range of the effective transmission rate Determining an area in which both the enhancement layer and base layer data streams can be delivered within the effective allowable transmission rate;
A step of referring to an area table having correspondence information between a plurality of areas of the predetermined moving image data and a packet constituting each area, and extracting a packet constituting the determined distributable area;
Transmitting both the enhancement layer and base layer data streams for the extracted packets .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002253145A JP4157740B2 (en) | 2002-08-30 | 2002-08-30 | Image transmission apparatus, image transmission method, and software program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002253145A JP4157740B2 (en) | 2002-08-30 | 2002-08-30 | Image transmission apparatus, image transmission method, and software program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004096309A JP2004096309A (en) | 2004-03-25 |
JP4157740B2 true JP4157740B2 (en) | 2008-10-01 |
Family
ID=32059232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002253145A Expired - Fee Related JP4157740B2 (en) | 2002-08-30 | 2002-08-30 | Image transmission apparatus, image transmission method, and software program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4157740B2 (en) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7860003B2 (en) | 2004-04-20 | 2010-12-28 | France Telecom | Communication session management system and a stream concentrator including such a system |
US8731069B2 (en) | 2005-08-25 | 2014-05-20 | Canon Kabushiki Kaisha | Remote display system and method |
US7672524B2 (en) * | 2006-03-02 | 2010-03-02 | Mitsubishi Electric Research Laboratories, Inc. | Quality control for image transcoding |
EP2101497A1 (en) * | 2008-03-12 | 2009-09-16 | Thomson Licensing | Method and apparatus for transmitting an image in a wireless network |
JP5339290B2 (en) * | 2009-11-12 | 2013-11-13 | 日本電信電話株式会社 | Video multiplexing apparatus, video multiplexing method, and program |
JP5473563B2 (en) * | 2009-11-27 | 2014-04-16 | キヤノン株式会社 | Display control apparatus and control method thereof |
JP5300760B2 (en) * | 2010-02-23 | 2013-09-25 | 日本電信電話株式会社 | Video transmission system, video transmission method and program |
JP5478346B2 (en) * | 2010-04-15 | 2014-04-23 | 日本電信電話株式会社 | Format conversion apparatus, video distribution apparatus, multiplexing apparatus, format conversion method, video distribution method, and program |
JP6305279B2 (en) * | 2014-08-26 | 2018-04-04 | 株式会社東芝 | Video compression device and video playback device |
US11582463B2 (en) * | 2019-12-30 | 2023-02-14 | Tencent America LLC | Method for alignment across layers in coded video stream |
-
2002
- 2002-08-30 JP JP2002253145A patent/JP4157740B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004096309A (en) | 2004-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2594118C (en) | Distributed statistical multiplexing of multi-media | |
US8135040B2 (en) | Accelerated channel change | |
US9826197B2 (en) | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device | |
US8510458B2 (en) | Method and device for sharing bandwidth of a communication network | |
US8238438B2 (en) | Image data transmitting apparatus and method and image data reproducing apparatus and method | |
US8789119B2 (en) | Statistical remultiplexer performance for video on demand applications by use of metadata | |
US20140181266A1 (en) | System, streaming media optimizer and methods for use therewith | |
US20130304934A1 (en) | Methods and systems for controlling quality of a media session | |
US20030174243A1 (en) | Network streaming system for providing a user with data defining imagecontent at a resolution that may be determined by the user | |
US20160037176A1 (en) | Automatic and adaptive selection of profiles for adaptive bit rate streaming | |
US6879634B1 (en) | Method and system for transmitting media streams over a variable bandwidth network | |
JP2004502356A (en) | Multicast transmission system including bandwidth scaler | |
CN105187850A (en) | Streaming Encoded Video Data | |
JP4157740B2 (en) | Image transmission apparatus, image transmission method, and software program | |
JP2015513717A (en) | Data, multimedia and video transmission update system | |
Dong et al. | Ultra-low latency, stable, and scalable video transmission for free-viewpoint video services | |
JP4586328B2 (en) | Information processing system, information processing apparatus and method, recording medium, and program | |
CN105306970B (en) | A kind of control method and device of live streaming media transmission speed | |
US8401086B1 (en) | System and method for increasing responsiveness to requests for streaming media | |
CN115883855B (en) | Playing data processing method, device, computer equipment and storage medium | |
JP2004056677A (en) | Device and method for encoding picture information | |
JPH10108200A (en) | Image coding method and its device | |
WO2001099430A2 (en) | Audio/video coding and transmission method and system | |
KR100606722B1 (en) | Method of providing video streamin service having higher times of rate | |
CN114885182A (en) | Video live broadcast management method and related equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050704 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080226 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080708 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080714 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110718 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |