JP6047835B2 - 符号化方法及び送信端末 - Google Patents

符号化方法及び送信端末 Download PDF

Info

Publication number
JP6047835B2
JP6047835B2 JP2014528684A JP2014528684A JP6047835B2 JP 6047835 B2 JP6047835 B2 JP 6047835B2 JP 2014528684 A JP2014528684 A JP 2014528684A JP 2014528684 A JP2014528684 A JP 2014528684A JP 6047835 B2 JP6047835 B2 JP 6047835B2
Authority
JP
Japan
Prior art keywords
distortion
error propagation
estimate
channels
video stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014528684A
Other languages
English (en)
Other versions
JP2014528201A5 (ja
JP2014528201A (ja
Inventor
ニルソン,マティアス
ヴァフィン,レナート
ヴァング アンデルセン,ソレン
ヴァング アンデルセン,ソレン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Skype Ltd Ireland
Original Assignee
Skype Ltd Ireland
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Skype Ltd Ireland filed Critical Skype Ltd Ireland
Publication of JP2014528201A publication Critical patent/JP2014528201A/ja
Publication of JP2014528201A5 publication Critical patent/JP2014528201A5/ja
Application granted granted Critical
Publication of JP6047835B2 publication Critical patent/JP6047835B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • H04N19/166Feedback from the receiver or from the transmission channel concerning the amount of transmission errors, e.g. bit error rate [BER]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ビデオ信号の部分を符号化する符号化モードを選択するときにビットレートと歪みのどちらを取るかのバランスを保つことに関する。本発明は、リアルタイムでビデオストリーム、すなわち、ビデオ電話のビデオストリームのようなライブビデオストリームを符号化するとき、特に(排他的にではなく)適用できることがあり、エンコーダは、カメラなどから受信されるときできるだけ早く、送信のためストリームを動的符号化する必要がある。
符号化されるビデオデータのストリームは、図1aに概略的に例示されている。ストリームは、1つずつが異なったそれぞれの時点でのビデオ画像を表現する複数のフレーム(F)を備える。当業者によく知られているように、符号化の目的のため、各フレーム(F)は、部分に分割され、各部分は、より小さい下位部分にさらに再分割されることがあり、各部分または下位部分は、複数の画素を備える。たとえば、ある用語によれば、符号化されるビデオストリームの各フレームは、マクロブロック(MB)に分割され、各マクロブロックは、ブロックまたはサブブロック(b)に再分割され、各ブロックまたはサブブロックは、複数の画素を備える。各フレームは、独立に復号化可能なスライス(S)に分割されることもあり、各スライスは、1つ以上のマクロブロックを備える。注意すべきことは、図1aに示された分割が例示の目的のための概略図に過ぎないことであり、これらの分割は、何らかの実際の符号化スキームに対応することが必ずしも意図されていないこと、たとえば、各フレームがより多数のマクロブロックを含んでいる可能性が高いことが認められるであろう。
ビデオ符号化が採用されることがある実例通信システムは、図2のブロック図に概略的に例示されている。通信システムは、第1の送信端末12と、第2の受信端末22とを備える。たとえば、各端末12、22は、携帯電話機もしくはスマートフォン、タブレット、ラップトップコンピュータ、デスクトップコンピュータ、または、テレビジョンセット、セット・トップ・ボックス、ステレオシステムなどのようなその他の家電製品を備えることがある。第1および第2の端末12、22は、それぞれが通信ネットワーク32に動作可能に結合し、第1の送信端末12は、それによって、第2の受信端末22によって受信されるものである信号を送信するように配置構成されている。当然ながら、送信端末12は、受信端末22から信号を受信する能力を備えることもあり、逆もまた同様であるが、説明の目的のため、送信は、本書では、第1の端末12の立場から表現され、受信は、第2の端末22の立場から表現されている。通信ネットワーク32は、たとえば、ワイド・エリア・インターネットおよび/またはローカル・エリア・ネットワーク、および/または、モバイル・セルラー・ネットワークのようなパケットベース・ネットワークを備えることがある。
第1の端末12は、フラッシュメモリもしくはその他の電子メモリ、磁気記憶デバイス、および/または、光学記憶デバイスのような記憶媒体14を備える。第1の端末12は、1個以上のコアを有するCPUの形式をした処理装置16と、少なくとも送信機18を有している有線または無線モデムのような送受信機と、端末12の残部と同じケーシングの内部に収容されること、または、収容されないことがあるビデオカメラ15とをさらに備える。記憶媒体14、ビデオカメラ15および送信機18は、それぞれが処理装置16に動作可能に結合され、送信機18は、有線または無線リンクを介してネットワーク32に動作可能に結合されている。同様に、第2の端末22は、電子、磁気、および/または、光学記憶デバイスのような記憶媒体24と、1個以上のコアを有するCPUの形式をした処理装置26とを備える。第2の端末は、少なくとも受信機28を有している有線または無線モデムのような送受信機と、端末22の残部と同じケーシングの内部に収容されること、または、収容されないことがある画面25とを備える。第2の端末の記憶媒体24、画面25および受信機26は、それぞれがそれぞれの処理装置26に動作可能に結合され、受信機28は、有線または無線リンクを介してネットワーク32に動作可能に結合されている。
第1の端末12上の記憶媒体14は、処理装置16上で実行されるように配置構成された少なくともビデオエンコーダを記憶する。実行されたとき、エンコーダは、ビデオカメラ15から「未加工」(非符号化)入力ビデオストリームを受信し、より低ビットレートのストリームに圧縮するためにビデオストリームを符号化し、送信機18および通信ネットワーク32を介する第2の端末22の受信機28への送信のため符号化ビデオストリームを出力する。第2の端末22上の記憶媒体は、これの独自の処理装置26上で実行されるように配置構成された少なくともビデオデコーダを記憶する。実行されたとき、デコーダは、受信機28から符号化ビデオストリームを受信し、画面25への出力のためこれを復号化する。エンコーダおよび/またはデコーダに言及するために使用されることがある総称は、コーデックである。
ビデオコーデックの目的は、考えられる最高品質を維持しながら、ビデオ信号を送信するために必要とされるビットレートを低減することである。この目的は、統計的冗長性(ビデオ信号の中の類似性)および(人の視覚系の感度に関連する)知覚的無関連性を利用することにより達成される。
現在のビデオコーデックの大多数は、他の画素ブロックからの画素ブロックの予測と、予測残差の変換と、変換係数の量子化と、量子化指数のエントロピー符号化とを含むアーキテクチャに基づいている。これらのステップは、冗長性および無関連性の低減に寄与する。
以下の文献:
[1]ITU−T,Recommendation H.264,「Advanced video coding for generic audiovisual services」,2007
[2]Zhang et al.,「Error resilience video coding in H.264 encoder with potential distortion tracking」,In Proc.IEEE International Conference on Image Processing,pp.163−166,2004
を参照する。
予測は、典型的に、現在フレーム以外のビデオフレームの中の画素(インター予測)から、および、同じフレームの中の画素(イントラ予測)から実行される可能性がある。すなわち、フレーム内符号化を使用して符号化される場合、ブロック、サブブロックまたはフレームのその他の部分(対象ブロックまたは部分)が同じフレームの中の別のブロック、サブブロックまたは画像部分(参照ブロックまたは部分)と相対的に符号化され、そして、フレーム間符号化を使用して符号化される場合、対象ブロックまたは部分が別のフレームの中の参照ブロックまたは部分と相対的に符号化される。このプロセスは、予測または予測符号化と広く呼ばれている。インターまたはイントラ予測モジュールがこのようにして、たとえば、フレーム内符号化の場合に近傍ブロックまたはサブブロック、および/または、フレーム間符号化の場合に動きベクトルの指示の形式で予測を発生させることになる。典型的に、エンコーダは、予測ブロックと実際のブロックと(または予測サブブロックと実際のサブブロックと、など)の間の「残りの」差を表現する残差信号をさらに発生させる。イントラ予測と関係がある残差、動きベクトル、および、何か所要のデータは、その後、典型的に、量子化器およびエントロピー・エンコーダのようなさらなる符号化ステージ又は符号化段を介して、符号化ビデオストリームに出力される。それ故に、ビデオの中の殆どのブロックは、ブロック間の差の観点から符号化される可能性があり、このことは、絶対画素値を符号化するより少数のビットしか符号化するために必要としないので、ビットレートを軽減する。イントラ予測符号化は、典型的に、インター予測より多数のビットを必要とするが、それでもなお絶対値を符号化することを超える節約を示す。ビデオのため適当なインター符号化技術およびイントラ符号化技術の詳細は、当業者によく知られているであろう。
最新のコーデックは、フレーム内部の種々の部分のため種々の予測符号化モードの使用を可能にする。種々の符号化選択肢を有する可能性は、ビデオコーデックのレート−歪み効率を増大させる。最適符号化表現があらゆるフレーム領域に対し見つけられるべきである。典型的に、このような領域は、たとえば、16×16画素からなるマクロブロックである。すなわち、その結果、イントラ予測またはインター予測モードが各マクロブロックに対して個別に選択されることが可能であるので、同じフレーム内部の異なるマクロブロックは、異なるモードで符号化される可能性がある。一部のコーデックでは、異なるレベルのマクロブロックの区分に基づいて、たとえば、別個の予測がマクロブロック内部の4×4のサブブロック毎に実行されるより高い複雑性モード、または、予測が僅かに8×8もしくは8×16ブロック、または、実にマクロブロック全体に基づいて実行されるより低い複雑性モードの間で選択を行うことにより、異なるモードを使用することも可能である。利用可能なモードは、予測を実行する種々の選択肢をさらに含むことがある。たとえば、図1bに概略的に例示されるように、1つのイントラモードでは、4×4型サブブロック(b)の画素は、直上にあるサブブロックからの近傍画素から下向きに外挿することにより、または、直ぐ左にあるサブブロックから横向きに外挿することにより決定されることがある。「スキップモード」と呼ばれる別の特別な予測モードがいくつかのコーデックにさらに設けられることがあり、代替的な形式のインターモードとしてみなされることがある。スキップモード(PSkip)では、対象の動きベクトルは、上の方かつ左の方の動きベクトルに基づいて推論され、残差係数の符号化は存在しない。動きベクトルが推論される方法は、動きベクトル予測と整合性が取れ、それ故に、動きベクトル差分は、零であるので、マクロブロックがスキップブロックであることをシグナル通知することのみが必要とされる。
図3は、送信端末12に実施されるかもしれないようなエンコーダを概略的に例示するハイレベル・ブロック図である。エンコーダは、離散コサイン変換(DCT)モジュール51と、量子化器53と、逆変換モジュール61と、逆量子化器63と、イントラ予測モジュール41と、インター予測モジュール43と、減算段(−)とを備える。エンコーダは、スイッチ47とモード選択モジュール49とをさらに備える。モジュールの1つずつは、好ましくは、送信端末の記憶媒体14に記憶され、処理装置16での実行のため配置構成されたコードの一部分として実施されるが、これらのモジュールの一部または全部が専用ハードウェア回路で完全にまたは部分的に実施される可能性は、排除されない。
スイッチ47およびモード選択モジュール49の1つずつは、複数のマクロブロックMBを備える入力ビデオストリームのインスタンスを受信するように配置構成されている。モード選択モジュール49は、各マクロブロックに対して符号モード「o」を選択するように配置構成され、マルチプレクサが選択されたモードに適切に逆量子化器63の出力をイントラ予測モジュール41またはインター予測モジュール43のいずれかの入力に渡すことを制御するためにマルチプレクサ47に動作可能に結合されている。モード選択モジュール49は、選択されたモード「o」を関連性のある予測モジュール41、43に指示するために(たとえば、4×4型区分モード、8×8型モード、スキップモードなどを指示するために)、そして、予測モジュール41、43からフィードバックされ、次のフレームに対するモードを選択するときに用いられる情報を受信するようにさらに配置構成されることがある。イントラ予測モジュール41またはインター予測モジュール43の出力は、その後、減算段又は減算ステージ(−)の入力に結合され、この減算段は、これのもう一方の入力で符号化されていない入力ビデオストリームを受信し、予測ブロックをこれらの符号化されていない対応部分から減算し、このようにして、残差信号を発生させるように配置構成されている。残差ブロックは、その後、それぞれの残差値が周波数ドメインに変換される変換(DCT)モジュール51を介して、変換された値が離散量子化指数に変換される量子化器53に渡される。変換され、量子化された信号は、逆量子化器63および逆変換モジュール51を通してフィードバックされ、(デコーダで見られるように)選択された予測モジュール41、43によって用いられる予測されたブロックまたはサブブロックを発生させる。予測モジュール41、43で使用された予測の指示と、インター予測モジュール43によって発生された動きベクトルと、変換モジュール51および量子化モジュール53によって発生されたような残差の変換、量子化された指数とは、全てが符号化ビデオストリームに組み込むため出力され、典型的には、予測値および量子化され、変換された指数が技術的に知られている無損失符号化技術を使用してさらに圧縮されることがあるエントロピーエンコーダ(図示せず)のようなさらなる無損失符号化ステージ又は無損失符号化段を経由する。
以上によれば、符号化表現は、このようにして、ブロック区分情報、予測モード、動きベクトル、量子化精度などを含むことがある。最適な符号化選択肢は、ビデオコンテンツ、ビットレート、先行の符号化決定などに依存する。変換係数の量子化の精度は、典型的に、ビットレート制約を満たすように選定される。さらに、歪みは、最小化されるべきである。
たとえば、H.264ビデオコーダは、予測モードの選定に大きな柔軟性を提供する[1]。輝度成分のインター予測に関して、16×16画素からなるマクロブロックは、16×16画素からなる1個のブロック、または16×8画素の2個のブロック、または8×8画素からなる4個のブロックとして表現される可能性がある。さらに、8×8型ブロックは、8×8画素からなる1個のブロック、または8×4画素からなる2個のサブブロック、または4×8画素からなる2個のサブブロック、または4×4画素からなる4個のサブブロックとして表現される可能性がある。インター予測は、マクロブロックの許容された区分毎に試行される。ブロックのインター予測は、参照フレーム(群)と、典型的に、サブ画素精度で推定される動きベクトル(群)(それぞれの参照フレームの中の参照ブロックからの空間シフト)とを指数化することにより表現される。輝度成分のイントラ予測に関して、16×16型ブロックのための4個の可能なモードと、4×4型サブブロックのための9個の可能なモードとが存在する。さらに、彩度成分のための4個の可能なモードが存在する。最良予測モードは、インター予測モードおよびイントラ予測モードの性能を比較することにより選定される。
H.264 AVC[1]のようなビデオコーデックのレート−歪み性能は、マクロブロックモード選択の性能oに大幅に依存する。すなわち、レートと歪みのどちらを取るかの点から、たとえば、イントラモードまたはインターモードを使用して、マクロブロックが最良に符号化されているか否かを決定する手続である。ロバスト性又は頑健性の観点から、イントラ符号化マクロブロックは、(制約付きのイントラ予測、すなわち、インター予測マクロブロックからのイントラ予測の使用が禁止されていると仮定すると)時間的誤り伝搬を停止するので有利である。しかし、イントラ符号化マクロブロックは、一般に、レートの点から、インター符号化マクロブロックより高コストであり、それ故に、ある種のビット配分およびチャネル条件を仮定すると、デコーダでの歪み(たとえば、平均歪み)が最小化されるようにイントラ符号化マクロブロックを系統的に導入することが重要である。Zhang et al.[2]は、デコーダでの期待平均差分二乗和(SSD)の最小化に基づいてイントラ符号化マクロブロックを導入するためにこのような系統的な枠組みを提案する。潜在的な歪みを追跡することにより、Zhang et al.は、エンコーダのレート−歪みループの内部のインターマクロブロックのコストを計算するとき、ソース符号化歪みに加算される(デコーダでの)期待誤り伝搬歪みに関連するバイアス項を計算することが可能である。
レート−歪み性能最適化問題は、ビットレート制約Rの下での歪みの最小化の点で定式化される可能性がある。ラグランジュ最適化の枠組みは、この問題を解決するためにしばしば使用され、この枠組みによれば、最適化規準は:
J=D(m,o)+λR(m,o) (1)
として定式化されることがあり、式中、Jは、ラグランジュ関数を表し、Dは、歪みの尺度(モードoとマクロブロックmまたはマクロブロック下位区分との関数)を表し、Rは、ビットレートであり、λは、歪みとレートのどちらを取るかについてのパラメータである。広く使用される歪み尺度は、原画素と再構成画素との間の差分二乗和(SSD)、または、原画素と予測画素との間の差分絶対和(SAD)である。
本願では、ラグランジュ最適化問題を解法することは、ラグランジュ関数Jを最小化する符号化モードoを見つけることを意味し、ここで、ラグランジュ関数Jは、歪みを表す項と、ビットレートを表す項と、両者の間でどちらを取るかを表す因子又は係数(「ラグランジュ乗数」))とを備える。符号化モードoがより完全なまたはより良い品質の符号化モードに向かって変化するにつれて、歪み項Dは、減少することになる。しかし、同時に、レート項Rは、増加することになり、λに依存する特定の点で、Rの増加は、Dの減少を上回ることがある。それ故に、式Jは、何らかの最小値を有することになり、これが起こる符号化モードoが最適符号化モードであると考えられる。
この意味で、ビットレートR、もっと正確にはλRは、この項が絶えず増加する品質から最適符号化モードを引き戻すので、最適化に制約を課す。この最適バランスが見つけられるモードは、λに依存することになり、それ故に、λは、ビットレートと歪みのどちらを取るかを表していると考えられることがある。
ラグランジュ最適化は、符号化決定を選定するプロセスで広く使用され、あらゆるフレーム領域(たとえば、16×16画素からなるあらゆるマクロブロック)に適用される。一般に、歪みは、全ての処理段階を明らかにするために評価されることがある。これらの処理段階は、予測、変換、および量子化を含む。さらに、再構成画素を計算するために、逆量子化、逆変換、および逆予測のステップが実行される必要がある。SSDは、SADと比べてより高い品質という結果をもたらすので、歪み規準として好ましい場合がよくある。一般に、レートは、予測を記述するパラメータと、量子化された変換係数を含む全ての必要とされたパラメータの符号化をさらに明らかにする[4]。
[2]Zhang et al.では、著者は、ソース符号化だけでなく、チャネル誤り、すなわち、信号がチャネルを介して送信されるときにデータの損失のために起こるものである見込み歪みにも起因するデコーダ内での潜在的な歪みを推定する。推定された見込み歪みは、その後、イントラ符号化の方へモード選択を偏らせるために間接的に使用される(チャネル誤りの可能性がある場合)。
Zhangの「終端間」歪み式は、差分二乗和(SSD)歪み尺度に基づき、損失マクロブロックにベルヌーイ分布を仮定する。最適マクロブロックモードooptは:
Figure 0006047835
によって与えられ、式中、D(m,o)は、マクロブロックmおよびマクロブロックモードoに対する原画素と再構成画素との間のSSD歪みを表し、Rは、総レートを表し、λは、歪みおよびレート項を関連付けるラグランジュ乗数を表す。Dep_ref(m,o)は、誤り伝搬に起因するデコーダにおける参照マクロブロック内部の期待歪みを表す。Dep_ref(m,o)は、このようにして、誤り伝搬歪みが大きくなり過ぎた場合、イントラ符号化の方へ最適化を偏らせるバイアス項をもたらす。Dep_ref(m,o)は、イントラ符号化マクロブロックモードに対して零である。式D(m,o)+Dep_ref(m,o)+λR(m,o)は、ラグランジュ関数Jの例であると考えられることがある。Argminは、値が最小である式Jに対する引数oの値を出力する。
[2]において、項Dep_ref(m,o)は、物体の動きに追随し、現在の動きベクトルを使用して総歪みマップから計算される。総期待誤り伝搬歪みマップDepは、誤り隠蔽の性能によって動かされ、各マクロブロックモード選択後に:
ep(m(k),n+1)=(1−p)Dep_ref(m(k),n,oopt)+p(Dec−rec(m(k),n,oopt)+Dec−ep(m(k),n)) (3)
として更新され、式中、nは、フレーム番号であり、m(k)は、マクロブロックmのk番目の下位区分(すなわち、ブロックまたはサブブロック)を表し、pは、パケット損失の確率を表し、Dec−recは、エンコーダにおける再構成画素と隠蔽画素との間のSSDを表し、Dec−epは、エンコーダおよびデコーダにおける誤り隠蔽画素の間の期待SSDを表す。
[2]では、Depは、フレームの各マクロブロックに亘って4×4型グリッドで、すなわち、マクロブロック1つ当たりにDepの16個の値で、従って、各マクロブロックの4×4型画素サブブロック1つ当たりにDepの1個の値で記憶される。図1cに示されるように、Dep_ref(m(k),o)、すなわち、時点nでのフレームのマクロブロックmの内部のサブブロックkに対する期待誤り伝搬参照歪みの計算は、その後、時点n−1からの先行フレームの4個のサブブロックからのDepの値の加重和として実行される。重みは、当該ブロックmに対する動きベクトルから決定される。すなわち:
Figure 0006047835
であり、式中、重みwは、オーバーラップのエリアに比例し、q(k)は、先行フレームn−1の中のマクロブロックqのサブブロックkを表す。
図1cは、典型的なサブブロックb1...b4に関連して(本例では、kは、b1に対応し、iは、b1からb4まで数える)、動きベクトルおよび期待誤り伝搬歪みマップからの期待誤り伝搬参照歪みの計算の説明図を提供する。
ITU−T,Recommendation H.264,「Advanced video coding for generic audiovisual services」,2007 Zhang et al.,「Error resilience video coding in H.264 encoder with potential distortion tracking」,In Proc.IEEE International Conference on Image Processing,pp.163−166,2004
Zhang[2]は、1台の送信機および1台の受信機の終端間レート−歪み性能を最適化する問題のみを扱う。すなわち、Zhang[2]は、個別の送信機−受信機ペアのための所定のビットレートに対して(平均二乗誤差の意味で)終端間歪みを最小化するシナリオのみを考慮する。
しかし、グルーブビデオ通話では、たとえば、図4aおよび4bに概略的に例示されているように、各送信機−受信機リンク(すなわち、チャネル)が何らかのそれぞれの損失確率(loss probability)pを有する1台の送信機と複数台の受信機とに対する終端間レート−歪み性能を最適化する問題に直面する。
1つの配置構成では、送信機は、図4aに概略的に表されているように、ストリームの異なるインスタンスを各受信機に送信することがある。アップリンクチャネルおよび送信機のCPUが共に十分な能力を有している場合、送信機は、数台のエンコーダを並列に動かし、送信機−受信機ペア毎に期待終端間レート歪み性能を最適化することがあり得る。すなわち、Zhang[2]がさらなる修正なしで複数台受信機配置構成にそのまま適用された場合、これは、個別の送信機−受信機ペア毎に所定のビットレートに対する終端間歪みを(平均二乗誤差の意味で)最小化することのみを可能にするであろう。
しかし、しばしばアップリンク帯域幅および送信機のCPUリソースが共にボトルネックを構成し、この場合、送信機は、図4bに概略的に示されるように、マルチキャストノードへ送出され、このマルチキャストノードからその後に引き続き全ての受信機に転送される1個のストリームを発生させるように制約されることがある。たとえば、これは、3台以上の端末がライブビデオ電話に参加しているグループビデオ通信のシナリオ(すなわち、端末間で送信されているライブビデオストリームのうちのいずれか1つの2人以上の受信者)で起こることがある。このようなシナリオでは、発明者は、多くの種々の最適化目的が考えられることを認識した。たとえば、ある種の場合には、全ての受信機に亘る平均終端間歪みが最小化されるように最適化することを望むことがあり、他の場合には、最大終端間歪みを最小化することが望ましい。
一般に、この場合に、個別の受信機毎に終端間レート歪み性能を最適化することは、実現可能ではない。その代わりに、異なるパケット損失確率と関係がある数台の受信機を有するとき、送信のための単一の符号化ストリームを発生させる事例を扱うために、発明者は、たとえば、Zhang et al.[2]の修正に基づいてパケット損失に対するストリーム頑健性と複数台の受信機のソース符号化歪みとの間でバランスを達成するシステムおよび方法を提供する。これは、単一の送信ストリームに影響を与える何らかの所望の対象目的関数を最適化するために種々のリンク(チャネル)上のリンク関連特性の集計を使用して達成されることがある。本発明は、このようにして、複数台の受信機を有するときに、符号化された単一のビデオストリームの頑健性のレベルを制御する。
送信機が複数台の受信機の1台ずつに対してストリームの別個のインスタンスを送信する図4aのシナリオのようなシナリオでも、各チャネルに関して完全な損失適応型レート−歪み最適化プロセスを実行するために送信機のCPUリソースに追加の負担をそれでもなお課すことがある。その結果、単一の符号化されたビデオストリームの複数のインスタンスを複数台の受信機に送信し、このようにして、アップリンク上でなくても、送信機での処理リソースを節約するためにレート−歪み最適化プロセスを集計することが依然として望ましいことがある。
それ故に、実施の形態の課題は、いずれのシナリオにおいても、複数台の受信機に送信されるべき単一の符号化ビデオストリームに対してビットレートと歪みのどちらを取るかを最適化するために、各チャネルのリンク関連歪み特性を集計することである。
一観点による方法は、
ビデオストリームを符号化する方法であって、
前記ビデオストリームのフレームの中で符号化される複数の対象画像部分の各々に対して、ソース符号化歪みと損失に起因する誤り伝搬歪みの推定値とに基づく前記対象画像部分の歪みの推定値と、前記対象画像部分を符号化するために必要なビットレートの尺度とを含む関数を最適化することにより、一群の符号化モードのうちの好ましいものを選択する処理を含むレート−歪み最適化プロセスを実行するステップと、
選択された前記符号化モードを使用して、前記対象画像部分を符号化されたビデオストリームに符号化するステップと
を有し、前記方法は、複数の受信端末の各々に同一のレート−歪み最適化プロセスを使用して、送信端末から前記複数の受信端末の各々に各自の損失性チャネルを介して同一の符号化された前記ビデオストリームを送信するステップをさらに有し、
前記同一のレート−歪み最適化プロセスを使用する際に、前記関数の同一の最適化に基づいて前記対象画像部分毎に同一の符号化モードを選択し、
前記誤り伝搬歪みの推定値は、複数のチャネルに関して見込まれる損失に起因して生じるおそれがある誤り伝搬歪みの集計推定値を有する、方法である。
ビデオストリームの概略図である。 いくつかのイントラ予測符号化モードの概略図である。 誤り伝搬歪みの計算の概略図である。 通信システムの概略ブロック図である。 エンコーダの概略ブロック図である。 1台の送信機および複数台の受信機の実例トポロジーを示す図である。 1台の送信機および複数台の受信機の実例トポロジーを示す図である。 デコーダからエンコーダへのフィードバックを利用するシステムの概略図である。
<実施の形態の概要>
第1の実施形態では、関数fは、受信機に対するパケット損失確率の組に適用される。すなわち、L台の受信機に対して:
p=f(p+p’−p’,p+p’−p’,...,p+p’−p’) (3a)
であり、ここで、図4bに示された構造体、すなわち、マルチキャストノードを介する送信機から受信機lまでの損失確率は:
1−(1−p)(1−p’)=p+p’−p’ (3b)
として表現される可能性がある。
集計されたパケット損失確率pは、その後、エンコーダの内部で式(3)において使用される可能性がある。実例関数は、最適化目的が何であるかに依存して最大値、中央値、または平均値である。たとえば、最大パケット損失に基づく最適化は、最悪のリンクに対して(平均で)最適終端間レート歪み性能を、その結果、その他のリンクに対して最適に満たない性能(必要とされることになるソース符号化歪みより高い歪み)を保証する。
第2の実施形態では、送信機は、L個の異なる誤り伝搬マップを追跡する。パケット損失確率に関して一意である送信機−受信機ペアのみが追跡される必要がある。たとえば、種々のリンクを少数の異なるクラス(たとえば、低パケット損失、中間パケット損失、および高パケット損失のクラス)に分類することによって、より少数の歪みマップを追跡することも可能である。さらに、第2の実施形態の特に有利な具現化では、どのパケット(またはフレームもしくはパケット)がデコーダで受信されたか、または、失われたかをシグナル通知する受信機のうちの全部(または一部)からのフィードバック情報が利用可能であるということがある。概して、種々のパケットは、マルチキャストノードから1台ずつの個別の受信機までの種々のリンク上で失われることがある。フィードバック情報は、種々の歪みマップをリセットし、再計算するために送信機のエンコーダで使用されることがある。
種々のリンクに対する種々の歪みマップを仮定すると、式(2)のモード選択において適用する(概念的には第1の実施形態に類似する)集計誤り伝搬参照歪み、たとえば:
ep−ref(m(k),o)=f(Dep−ref(m(k),o|link),...,Dep−rer(m(k),o|link)) (4a)
を作成することが可能であり、式中、fは、たとえば、上記と同様に、最大値、中央値、または平均値である可能性がある。
上記は、ある特別な典型的な実施形態の概要を説明するが、より一般的には、本発明は、以下に沿ったシステム、コンピュータ・プログラム・プロダクトおよび装置を提供する。
本発明の一態様によれば、ビデオストリームを符号化する方法が提供され、この方法は、ビデオストリームのフレームの中で符号化される複数の対象画像部分の1つずつに対して、ソース符号化歪みおよび損失に起因する誤り伝搬歪みの推定値に基づく対象画像部分の歪みの推定値と、対象画像部分を符号化するために必要とされるビットレートの尺度とを含む関数を最適化することにより符号化モードの組のうちの好ましい1つを選択することを含めて、レート−歪み最適化プロセスを実行することと、選択された符号化モードを使用して、対象画像部分を符号化されたビデオストリームに符号化することとを備え、この方法は、複数台の受信端末のうちの1台ずつに関して同一のレート−歪み最適化プロセスを使用して、送信端末から複数台の受信端末のうちの1台ずつにそれぞれの損失の多いチャネルを介して同一の符号化されたビデオストリームを送信することをさらに備え、ここで、同一のレート−歪み最適化プロセスの使用は、上記関数の同一の最適化に基づいて対象画像部分毎に同一の符号化モードを選択することを備え、誤り伝搬歪みの推定値は、複数のチャネルを介して見込まれる損失に起因して起こることになる誤り伝搬歪みの集計推定値を備える。
本発明の好ましい適用では、上記チャネルのうちの2つ以上は、共通のマルチキャスティング中継ノードを経由することがあり、そのために、送信端末は、符号化されたビデオストリームを第1の区間を介してマルチキャスティング中継ノードに送信することがあり、マルチキャスティング中継ノードは、符号化されたビデオストリームのそれぞれのインスタンスをそれぞれの2台以上の受信端末のうちの1台ずつにチャネルのそれぞれの第2の区間を介して転送することがある。
本発明の第1の実施形態では、この方法は、上記チャネルのうちの1つずつを介する損失の個別の確率を決定することと、個別の確率に基づいて集計確率を決定することとを備えることがあり、歪みの集計推定値は、集計確率に基づくことがある。
上記2つ以上のチャネルの1つずつに対する個別の確率は、これの区間の1つずつを介する損失の確率を組み合わせることにより決定されることがある。
中継ノードは、サーバとエンドユーザ端末とのうちの一方を備えることがある。
集計確率は、個別の確率の最大値、中央値および平均値のうちの1つを備えることがある。
本発明の第2の実施形態では、この方法は、上記チャネルの1つずつを介して見込まれる損失に起因して起こることになる誤り伝搬歪みの個別の推定値を決定することを備えることがあり、誤り伝搬歪みの集計推定値は、誤り伝搬歪みの個別の推定値を集計することにより決定されることがある。
この方法は、各符号化モード選択の後に誤り伝搬マップを更新することにより、上記チャネルの1つずつに対する個別の誤り伝搬歪みマップを維持することを備えることがあり、歪みの個別の推定値は、それぞれの歪みマップから決定されることがある。
歪みの個別の推定値の集計は、歪みの個別の推定値の最大値、中央値および平均値のうちの1つを備えることがある。
上記チャネルの1つ以上のうちの1つずつに対する誤り伝搬歪みの個別の推定値は、それぞれの受信端末からのフィードバックに基づくことがある。
上記フィードバックは、上記先行するフレームの少なくとも一部が受信されたという肯定応答と、上記先行するフレームの少なくとも一部が受信されなかったというレポートとのうちの一方を備えることがある。
フィードバックに基づく誤り伝搬歪みの個別の推定値は、上記フィードバックに依存して先行するフレームまたは先行するフレームの一部に対する歪みの推定値を調節することと、歪みの調節された推定値を現在フレームに関して用いるため前方に伝搬することとを備えることがある。
フィードバックに基づく誤り伝搬歪みの個別の推定値は、上記肯定応答および上記レポートのうちの少なくとも一方に依存して先行するフレームまたは先行するフレームの一部に対する歪みの推定値を調節することと、歪みの調節された推定値を現在フレームに関して用いるため前方に伝搬することとを備えることがある。
いずれの実施形態でも、第1および第2の実施形態は、独立に適用されても、組み合わせて適用されてもよい。
符号化モードは、(i)対象画像部分を同じフレーム内の参照画像部分と相対的に符号化するフレーム内モードと、(ii)対象画像部分を前の符号化フレーム内の参照画像部分と相対的に符号化するフレーム間符号化モードとを少なくとも備えることがある。
符号化モードの組は、スキップモードを備えることがある。
符号化モードの組は、フレーム内符号化およびフレーム間符号化のうちの少なくとも一方のため対象画像部分の種々の区分を使用するモードを備えることがある。
本発明の別の態様によれば、ビデオストリームを符号化する送信端末が提供され、この送信端末は、ビデオストリームのフレームの中で符号化される複数の対象画像部分の1つずつに対して、ソース符号化歪みおよび損失に起因する誤り伝搬歪みの推定値に基づく対象画像部分の歪みの推定値と、対象画像部分を符号化するために必要とされるビットレートの尺度とを含む関数を最適化することにより符号化モードの組のうちの好ましい1つを選択することを含めて、レート−歪み最適化プロセスを実行するように構成され、選択された符号化モードを使用して、対象画像部分を符号化されたビデオストリームに符号化するように配置構成されているエンコーダと、送信端末から複数台の受信端末のうちの1台ずつにそれぞれの損失の多いチャネルを介して同一の符号化されたビデオストリームを送信するように構成されている送信機とを備え、エンコーダは、複数台の受信端末のうちの1台ずつに関して同一のレート−歪み最適化プロセスを使用するように構成され、ここで、同一のレート−歪み最適化プロセスの使用は、上記関数の同一の最適化に基づいて対象画像部分毎に同一の符号化モードを選択することを備え、エンコーダは、誤り伝搬歪みの推定値が複数のチャネルを介して見込まれる損失に起因して起こることになる誤り伝搬歪みの集計推定値を備えるようにさらに構成されている。
実施形態では、送信機は、上記方法特徴のいずれかに従って動作するように構成されることがある。
本発明の別の態様によれば、ビデオストリームを符号化するコンピュータ・プログラム・プロダクトが提供され、このコンピュータ・プログラム・プロダクトは、コンピュータ読み取り可能な媒体上に具現化され、送信端末上で実行されたときに以下の動作、ビデオストリームのフレームの中で符号化される複数の対象画像部分の1つずつに対して、ビデオストリームのフレームの中で符号化される複数の対象画像部分の1つずつに対して、ソース符号化歪みおよび損失に起因する誤り伝搬歪みの推定値に基づく対象画像部分の歪みの推定値と、対象画像部分を符号化するために必要とされるビットレートの尺度とを含む関数を最適化することにより符号化モードの組のうちの好ましい1つを選択することを含めて、レート−歪み最適化プロセスを実行することと、選択された符号化モードを使用して、対象画像部分を符号化されたビデオストリームに符号化することとを実行するように構成されているコードを備え、このコードは、実行されたとき、複数台の受信端末のうちの1台ずつに関して同一のレート−歪み最適化プロセスを使用して、送信端末から複数台の受信端末のうちの1台ずつにそれぞれの損失の多いチャネルを介して同一の符号化されたビデオストリームを送信するようにさらに構成され、同一のレート−歪み最適化プロセスの使用は、上記関数の同一の最適化に基づいて対象画像部分毎に同一の符号化モードを選択することを備え、誤り伝搬歪みの推定値は、複数のチャネルを介して見込まれる損失に起因して起こることになる誤り伝搬歪みの集計推定値を備える。
実施形態では、コードは、実行されたとき、上記方法特徴のいずれかに記載された動作を実行するようにさらに構成されることがある。
本発明のより良い理解のため、かつ、本発明がどのように実施されるかを明らかにするために、一例として添付図面を参照する。
<実施の形態の詳細な説明>
以下は、複数台の受信機に送信される唯一の符号化ビデオストリームに対し、ビットレートと歪みのどちらを取るかを最適化するために各チャネルのリンク関連歪み特性を集計するエンコーダおよび符号化方法について説明する。集計(aggregation)は、統合、総合、総計、集約等と言及されてもよい。エンコーダは、図3に関連して説明されたエンコーダに類似するが、モード選択モジュール49が修正されている。これは、図1に例示された種類のビデオストリームを符号化するために使用され、図2の通信システムのような通信システムにおいて実施されることがある。
前述のとおり、モード選択は、ラグランジュ型関数:
J=D(m,o)+λR(m,o) (1)
を最適化(たとえば、最小化)することを含むことがあり、式中、Jは、ラグランジュ関数を表現し、Dは、歪みの尺度(モードoとマクロブロックmまたはマクロブロック下位区分との関数)を表現し、Rは、ビットレートであり、λは、歪みとレートのどちらを取るかについてのパラメータである。
従来の場合、歪み項Dは、ソース符号化歪みのみを考慮し、すなわち、量子化によって導入された歪みのようなエンコーダの中の不完全性に起因する。これは、チャネルを介するデータの損失に起因して、たとえば、パケットベース・ネットワーク32を介する送信中のパケット損失に起因して導入されることがある歪みを考慮しない。
他方では、本発明およびZhang[2]の技術のような損失適合技術は、ソース符号化およびチャネルを介するデータの損失に起因する歪みを共に考慮する「終端間」歪みの尺度を定義しようとする。所定の(対象)ブロック、マクロブロックまたはサブブロックに対する終端間歪みは:
D=(1−p)Darrival+pDloss (5)
として記述されることがあり、式中、Darraivalは、対象ブロックがデコーダに到着した場合に起こることになる歪みの推定値であり、Dlossは、対象ブロックがチャネルを介するパケット損失に起因して、たとえば、パケットベース・ネットワーク32を介するブロックを含むパケットの損失に起因してデコーダに到着しない場合に起こることがある歪みの推定値である。パラメータpは、当該ブロック画像部分が結果的に失われるチャネルを介して起こる損失事象の確率の推定値、たとえば、パケット損失の確率の推定値である。簡便さのため、用語「ブロック」は、フレーム区分の関連性のあるレベル(たとえば、H.264のようなある種の規格のブロックまたはサブブロック)に一般的に言及するためにここでは適当な位置で使用されることがある。
arraivalは、ソース符号化歪みだけではなく、ブロックの過去の歪みに起因して導入されることになる歪み、すなわち、対象ブロックが予測される原因である1つ以上の参照ブロックにおける歪みも表現する。その結果、Darrivalは、ソース符号化歪み項Dと、予測された対象ブロックの履歴の中の歪み(すなわち、対象ブロックへ繰り越す対象ブロックの参照ブロックの中の歪み)を表現する誤り伝搬歪み項Def_refとを共に含む:
arrival=D+Dep_ref (6)
lossは、隠蔽に起因する損失を含む。対象ブロックが受信されない場合、デコーダは、先に符号化されたブロックを凍結すること、または、(現在フレームおよび/または前のフレームのいずれかからの)1つ以上の復号化に成功したブロックからの内挿または外挿を含むことがあり得る隠蔽アルゴリズムを適用することになる。その結果、Dlossは、この隠蔽プロセスに起因する歪みとして識別される可能性がある:
loss=Dec (7)
従って、式(5)を調べると、項Dは、損失が全くない場合に起こることになる歪みの推定値を表現し、項Decは、対象ブロックが失われた場合に起こることになる歪みの推定値を表現し、項Dep_refは、対象ブロックが受信に成功し、しかし、この履歴の中の何かが失われた場合(対象ブロックの参照ブロックが失われた場合、または、参照ブロックの参照ブロックが失われた場合など)に起こることになる歪みの推定値を表現する。
およびDep_refは、符号化モード選択oの関数である。Decは、モード選択oの関数ではなく、従って、ラグランジュ式から落とされる(損失ブロックがどのように符号化されたかは問題ではない。それにもかかわらず失われている)。それ故に、最適化は:
Figure 0006047835
として記述することが可能である。
は、エンコーダで知ることができる情報に基づいているので、たとえば、未加工入力サンプル値sと再構成サンプル値s^との間の差分に基づいているので、決定論的である。エンコーダは、エンコーダ側でデコーダの並列インスタンス(または、これの近似)を動かす。図3のインター予測モジュール43を詳述する差し込み図を参照のこと。インター予測モジュール43は、動き補償予測(MCP)ブロック44と、予測サンプルs^predと再構成残差r^とを組み合わせることにより、すなわち、各サンプル指数iに対して、
s^i=r^i+s^pred
により再構成サンプルs^
を決定するように配置構成された加算ステージ又は加算段(+)とを備える。インター符号化の場合、エンコーダで、予測サンプルs^predは、参照ブロックs^refのサンプルと同じであることがある(参照フレームの中の参照ブロックは、対象フレームと相対的に動きベクトルのみによってオフセットされている。再び簡単に説明される図1cを参照のこと)。
それ故に、エンコーダは、エンコーダおよびデコーダ端で見られるような実際のサンプルsと再構成サンプルs^との間の差分を決定する可能性がある(これは、この段階では、デコーダで起こるさらなる歪みを導入することになる損失の可能性を無視する)。サンプルにおける差分は、たとえば、当該対象ブロックの全てのサンプル指数iに亘る差分二乗和(SSD)誤り:
Figure 0006047835
として計算されることがある。
しかし、Dep_refは、まだ推定されず、これは、符号化データが(たとえば、パケットベース・ネットワーク32を介して)送信されるべきチャネルに関するいくつかの推定を行うことに基づくことになる。
これを達成するために、エンコーダの中のモード選択モジュール49は、直前に符号化されたフレーム内部の各マクロブロックまたはマクロブロックの区分の歪みを記述する誤り伝搬歪みマップDepを維持するように構成されることがある。モード選択モジュール49は、対象ブロックが予測される原因である参照ブロックを収容するパケットがチャネルを介して失われることになる確率pを決定するように(そして、その結果、さらにパケットが到着する確率1−pを暗黙的または明示的に決定するように)さらに配置構成されている。確率pは、統計的モデリングに基づいて設計段階で予め決定されることがあり、この場合、モード選択モジュール49は、メモリ14から値を取り出すことによりpを決定する。もう1つは、モード選択モジュール49が受信機22からのフィードバックに基づいてpを決定することである。
誤り伝搬マップは:
ep=(1−p)Dep_arrival+pDloss (9)
として表現されることがある。
誤り伝搬マップDepは、直前に符号化されたフレーム内部のマクロブロックmに対する、または、より好ましくは、各下位区分(ブロックまたはサブブロック)m(k)に対する歪み推定値を備える。それ故に、誤り伝搬マップは、より明示的には:
ep(m(k))=(1−p)Dep_arrival(m(k))+pDloss(m(k)) (10)
として記述されることがあり、式中、m(k)は、マクロブロックmのk番目の下位区分(たとえば、サブブロック)を表し、pは、パケット損失の確率を表す。
lossは、前述のとおりDecに等しい。Dep_arraivalは、チャネルを介する差分、すなわち、エンコーダでの再構成サンプルとデコーダでの再構成されたものとの間の差分を表現する。たとえば、これは、差分二乗和(SSD)の観点から定量化されることがあり:
Figure 0006047835
式中、s~iは、ソース符号化歪みおよびチャネルに起因する歪みを共に考慮したデコーダで受信された(指数i)のサンプルである。すなわち、sは、未加工の符号化されていない入力サンプルであり、s^iは、(たとえば、量子化に起因する)ソース符号化歪みを考慮してエンコーダで再構成されたサンプルであり、s~iは、チャネルの損失の多い効果を含む総終端間歪みを考慮したサンプルであり;
Figure 0006047835
である。
ep_arraivalは:
Figure 0006047835
に拡張することが可能であり、式中、r^iは、再構成残差のサンプルである。その結果:
Figure 0006047835
である。
そこで、式(9)に代入すると、誤り伝搬マップは:
ep=(1−p)Dep_ref+pDec (14)
または;
ep(m(k))=(1−p)Dep_ref(m(k))+pDec(m(k)) (15)
として記述される可能性がある。
モード最適化問題を考慮すると、これは:
ep(m(k),n+1)=(1−p)Dep_ref(m(k),n,oopt)+pDec(m(k),n,oopt) (16)
と記述されることもあり、式中、nは、フレーム番号であり、すなわち、Dep(n+1)は、既存の決定ooptおよび先行時点nでのフレームに対する歪みDep(n)マップを仮定すると、時点n+1でフレームに対するモード選択を行うため使用される誤り伝搬マップである。
Zhang[2]の場合と同様に、Dec項は:
ep(m(k),n+1)=(1−p)Dep_ref(m(k),n,oopt)+p(Dec−rec(m(k),n,oopt)+Dec−ep(m(k),n)) (3)
に拡張されることもあり、式中、Dec−recは、エンコーダにおける再構成画素と隠蔽画素との間のSSDを表し、Dec−epは、エンコーダおよびデコーダにおける誤り隠蔽画素の間の期待SSDを表す。
式(3)を調べると、前述のとおり、項Dep_refは、対象ブロックは受信に成功しているが、これの履歴の中の何かが失われている場合に(対象ブロックの参照ブロックが失われているか、または、参照ブロックの参照ブロックが失われているなどの場合に)起こることになる歪みを表現する。さらに、Dec−recは、隠蔽アルゴリズム自体の性質に起因する歪み(予測に対して内在するソース符号化歪みDにやや類似する)の推定値を表現する。Dec−epは、このとき、対象ブロックが失われ(その結果、デコーダで隠蔽される必要がある)、かつ、隠蔽された対象ブロックの履歴の中の何かが失われている場合に(隠蔽が行われる原因であるブロックが失われる、または、ブロックが予測されるか、または、隠蔽される原因であるブロックが失われるなどの場合に)歪みの推定値を表現する。
従って、歪みマップDepは、新しい損失に起因し、Dec−recおよび部分的にDec−epの結果として生じる寄与度と、過去の損失に起因し、Dep−refおよび部分的にさらにDec−epの結果として生じる寄与度とを備える。
系列の中の1番目のフレームに対して、フレームは、イントラ符号化を用いて符号化されることになり、この場合、Dep−ref=0であり、従って、Dep=pDecである。
誤り隠蔽歪みDecは、モード選択モジュール49によって計算される。項Dec−recは、隠蔽アルゴリズムの知識に基づき、使用された特殊な誤り隠蔽アルゴリズムに依存することがある。Dec−epは、Dep−refに類似する方法で、たとえば、基本的な隠蔽アルゴリズムの場合に、同じ場所にあるブロックの歪みをコピーすることにより、または、より複雑な隠蔽が使用される場合に、動きを外挿しようとする複数の先に符号化されたブロックb1〜b4から歪みの加重和を計算することにより(類推によって、以下の図1cに関連した検討を参照のこと)、既存の(直前の)歪みマップに基づいて計算される。Decを計算する他の方法が使用されることもあり、これは、エンコーダの中の再構成サンプルとデコーダによって見られることになる誤り隠蔽サンプル(すなわち、損失フレームまたは領域を隠蔽するために、前に受信されたフレーム、または、同じフレームの受信された領域からコピー、内挿または外挿されたサンプル)との間の差分の何らかの推定ということもあり得る。
モード選択モジュール49は、その後、既存の誤りマップの知識からのDep_refの計算を含めて、各モード選択決定の後に誤り伝搬マップを更新することにより、1つずつの後に続くインター予測フレームに対する誤り伝搬マップを維持する。インター予測(動き推定)の場合、Zhang[2]によれば、これは、当該フレームに対する動きベクトルを使用して行われる。
これの一例は、図1cに例示されている。4つの実例ブロックb1、b2、b3およびb4が(時点n−1での)参照フレームFに示され、この参照フレームは、既に符号化されている。(後に続く時点nでの)対象フレームFのブロックは、参照フレームFn−1から予測される。たとえば、対象フレームFの中のブロックbを考慮する。このため、動き予測モジュール44は、参照ブロックが参照フレームFn−1の中のオフセット位置から対象フレームFの中の対象ブロックb’の位置に平行移動されたとき、対象ブロックbの最良推定値をもたらすように、対象フレームFの中の対象ブロックと参照フレームFn−1の中の(点線によって示された)参照ブロックとの間のオフセットを定義する動きベクトルを決定する。その結果、点線の参照ブロックは、必ずしも参照フレームFn−1の中のインデックスで指定可能なブロックではなく、すなわち、必ずしも参照フレームの所定の再分割ではなく、任意の量によってオフセットされることがあることに(そして、実際には、画素の何分かの1によってオフセットされることさえあることに)注意すべきである。それ故に、参照ブロックは、4つの実際のインデックス指数可能なブロックb1、b2、b3およびb4からの寄与度で構成される。
その結果、誤り伝搬マップDep(n+1)の更新で用いられるDep_refを決定するためにモード選択モジュール49によって実行される既存の計算は、既存のマップDep(n)においてブロックまたはサブブロックb1からb4に対して記録された歪みの加重和:
Figure 0006047835
を計算することを備える。
あるいは、より明示的に:
Figure 0006047835
であり、式中、wは、ブロックまたはサブブロックbからの寄与度を表現する重みであり、Dep(i)は、ブロックまたはサブブロックbに対する誤り伝搬マップエントリである。
上記は、初期誤り伝搬マップDepを決定し、後続の符号化のための最適符号化モード選択ooptを選択するために誤り伝搬マップを使用し、マップDepを更新するために符号化決定を使用し、その後、次の符号化決定において更新されたマップを使用し、以下同様に続き、ここで、誤り伝搬マップは、チャネルを介する損失の推定された効果を含む終端間歪みを表現することがある、既存のプロセスについて説明する。たとえば、Zhang[2]を再度参照する。これは、本書では、損失適応型レート−歪み最適化(LARDO)と呼ばれることがある。
しかし、Zhang et al.[2]のプロセスは、1台の送信機および1台の受信機の終端間レート−歪み性能を最適化する問題のみを扱う。
他方で、グルーブビデオ通話では、各送信機−受信機リンク(すなわち、チャネル)が何らかのそれぞれの損失確率pを有する1台の送信機と複数台の受信機とに対する終端間レート−歪み性能を最適化する問題に直面する。これの実施例は、図4aおよび4bに概略的に例示されている。
図4bは、本発明の好ましい適用による配置構成を例示する。この配置構成は、送信端末12と、マルチキャスティング中継ノード70と、複数台の受信端末22とを備える。3台の受信装置22a、22bおよび22cは、ここでは、例示の目的のため表されているが、2台以上のあらゆる台数が存在することがあり得る。送信機12は、図2に従って構成され、図3に関連して説明されたエンコーダのとおりのエンコーダを備えることがあるが、以下のとおりに構成されたモード選択モジュール49が修正されている。受信機22の1台ずつは、図2に従って構成され、図3のエンコーダを補完するように構成されたそれぞれのデコーダを備えることがある。中継ノードは、スキームを実現し易くすることに同意したユーザに属するラップトップまたはデスクトップコンピュータのような第3のエンドユーザ端末を備えることがあり、または代替的に、通信サービスプロバイダのサーバを備えることがある。中継器70がエンドユーザ端末である場合、第3のユーザは、通話の参加者であることも、参加者でないこともある(すなわち、第3のユーザの端末70での再生のためビデオストリームを符号化することも符号化しないこともあり、そうすることが許可されていることも許可されていないこともある)。
送信端末12は、インターネットのようなパケットベース・ネットワーク32を介してマルチキャスティング中継ノード70との接続を確立するように配置構成され、マルチキャスティング中継ノード70は、同様にインターネットのようなパケットベース・ネットワーク32を介して受信端末22の1台ずつとのそれぞれの接続を確立するように配置構成されている。送信端末22から1台ずつのそれぞれの受信端末22へのチャネル(すなわち、リンク)は、送信端末12と中継ノード70との間の接続の形をした第1の区間(すなわち、第1の段階)と、中継ノード70とそれぞれの第2の端末22との間の接続の形をしたそれぞれの第2の区間(第2の段階)とを備える。
第1の区間は、損失確率pが関連付けられている。第2の区間の1つずつは、それぞれのパケット損失確率p’、p’、p’を有している。概して、これらの確率は、同じではない。以下では、各チャネル、または、これの受容的な受信機は、番号付けl=1...Lを使って参照されることがあり、たとえば、例示された実施例では、L=3である。
図4bの配置構成によれば、送信端末12上のエンコーダは、複数台の受信端末22の1台ずつへの送信のための唯一の符号化されたビデオストリームのみを発生させ、この符号化されたビデオストリームを第1の区間を介して共通のマルチキャスティング中継ノード70(そして、図示されない他の受信者または中継器がより複雑な「ツリー」構造の一部として送信機12に接続されていない限り、この中継ノード70のみ)に送信するように構成されている。マルチキャスティング中継ノード70は、符号化されたビデオストリームのそれぞれのインスタンスをそれぞれのチャネルのそれぞれの第2の区間を介して受信端末22の1台ずつへ前方に転送するように構成されている。
前述のとおり、Zhang[2]がさらなる修正なしで複数台受信機配置構成にそのまま適用された場合、これは、個別の送信機−受信機ペア毎に所定のビットレートに対する終端間歪みを(平均二乗誤差の意味で)最小化することのみを可能にするであろう。
その結果、Zhang[2]は、図4bに関連して説明されているような配置構成を単独でサポートすることがない。
しかし、さらに検討されているように、しばしばアップリンク帯域幅および送信機のCPUリソースが共にボトルネックを構成し、この場合、送信機は、図4bの場合のように、マルチキャストノードを介して送出される唯一のストリームを発生させるように制約されることがある。たとえば、これは、3台以上の端末がライブビデオ電話に参加しているグループビデオ通信のシナリオで起こることがある。このようなシナリオでは、発明者は、多くの種々の最適化目的が考えられることを認識した。たとえば、ある種の場合に、全ての受信機に亘る平均終端間歪みが最小化されるように最適化することを望むことがあり、他の場合に、最大終端間歪みを最小化することが望ましい。
これを扱うために、以下に記載された改良型システムおよび方法は、単一の送信ストリームに影響を与える所望の対象目標関数を最適化するために種々のリンクまたはチャネル上のリンク関連特性の集計を使用する。符号化信号ビデオストリームの中の頑健性のレベルは、その後、複数台の受信機に対して最適化されることがある。
送信端末上のエンコーダは、送信用の唯一の符号化されたビデオストリームを発生させ、(中継器70を介して)複数台の受信端末22の1台ずつに送信し、そして、複数のそれぞれのチャネルに関連する集計推定値に基づいているので、受信端末12の1台ずつに送信された符号化ビデオストリームは、どんな所定のマクロブロックに対しても実行される同一のレート−歪み最適化計算に基づいて到達した、所定のマクロブロックに対する同一のモード選択を収容する。これは、アップリンク帯域幅および送信機でのCPUリソースを節約する。
第1の実施形態では、関数fは、受信機に対するパケット損失確率の組に適用される。すなわち、L台の受信機22に対して:
p=f(p+p’−p’,p+p’−p’,...,p+p’−p’) (3a)
であり、ここで、図4bに示された構造体、すなわち、マルチキャストノードを介する送信機12から受信機22までの数lの損失確率は:
1−(1−p)(1−p’)=p+p’−p’ (3b)
として表現される可能性がある。
集計されたパケット損失確率pは、その後、エンコーダの内部で式(3)において使用される可能性がある。実例関数は、最適化目的が何であるかに依存して最大値、中央値、または平均値である。たとえば、最大パケット損失に基づく最適化は、最悪のリンクに対して(平均で)最適終端間レート歪み性能を、その結果、その他のリンクに対して最適に満たない性能(必要とされることになるソース符号化歪みより高い歪み)を保証する。
第2の実施形態では、送信機12は、受信機22のそれぞれの1台へのチャネルのそれぞれの1つずつに対して、L個の異なる誤り伝搬マップを追跡する。これは、各受信機22と、これのそれぞれのチャネルとに対して式(3)を適用し、しかし、式(3)の中の一般的なパラメータpの代わりに各チャネルに対して式(3b)のそれぞれの損失確率を使用することにより達成されることがある。
パケット損失確率に関して一意である送信機−受信機ペアのみが追跡される必要がある。たとえば、種々のリンクを少数の異なるクラス(たとえば、低パケット損失、中間パケット損失、および高パケット損失のクラス)に分類することによって、より少数の歪みマップを追跡することも可能である。
種々のリンク(チャネル)に対する種々の歪みマップを仮定すると、式(2)のモード選択において適用する(概念的には第1の実施形態に類似する)集計誤り伝搬参照歪み、たとえば:
ep−ref(m(k),o)=f(Dep−ref(m(k),o|link),...,Dep−rer(m(k),o|link)) (4a)
を作成することが可能であり、式中、fは、たとえば、上記と同様に、最大値、中央値、または平均値である可能性がある。
第2の実施形態の選択自由であるが、特に有利な実現では、デコーダで受信されるか、または、失われたパケット(またはフレームもしくはスライス)をシグナル通知する、受信機の全部(または一部)からの利用可能なフィードバック情報が存在する。概して、種々のパケットは、マルチキャストノードから1台ずつの個別の受信機までの種々のリンク上で失われることがある。フィードバック情報は、種々の歪みマップをリセットし、再計算するために送信機のエンコーダで使用されることがある。個別の歪みマップは、種々のリンクが同一の損失確率を有するときであっても種々の受信機に対して追跡される。
図5は、フィードバックに基づいて歪みマップの更新を実施するために使用されることがあるエンコーダおよびデコーダのシステムを描く概略ブロック図である。好ましくは、エンコーダは、送信端末12の記憶装置14および処理装置16の中に明示され、デコーダは、受信端末22の記憶媒体24および処理装置26の中に明示される。送信端末12上のエンコーダは、符号化モジュールと、デコーダで実行されるような復号化をミラーリングまたは近似する復号化モジュールのエンコーダ側インスタンスとを備える。符号化モジュールは、順方向変換モジュール51および量子化器53を備え、もしかすると、エントロピー・エンコーダのような1つ以上の他の段階を備える。エンコーダ側復号化モジュールは、逆量子化器63および逆変換モジュール61と、もしかすると、エントロピー・デコーダのような1つ以上の他の段階を備える。エンコーダは、動き補償予測(MCP)モジュール44と、減算段(−)とをさらに備える。これらのエンコーダ要素の間の接続の説明のため、再び図3を参照する。
さらに、図3には示されないが、エンコーダは、エンコーダ側復号化モジュール61、63と動き補償予測モジュール44との間のパスに接続された復号ピクチャバッファ65をさらに備える。復号ピクチャバッファ65は、1つずつが短期間参照または長期間参照のいずれかを保持するものとして特徴付けられることがある複数の構成バッファ領域を備えることがある。図5では、復号ピクチャバッファ65は、1つ以上の短期間参照66、1つ以上の非肯定応答長期間参照67、および1つ以上の肯定応答長期間参照68を保持するものとして示される。「参照」はリファレンスと言及されてもよい。
各構成バッファ領域は、再構成された(すなわち、符号化され、その後、エンコーダで見えることになるようなフレームまたはスライスを表現するために復号化モジュール61、63のエンコーダ側インスタンスによって再び復号化された)、1つ以上の先に符号化されたフレームまたはスライスを記憶するために動作可能である。これらの再構成された、先に符号化されたフレームまたはスライスは、現在フレームまたはスライスのインター予測符号化において参照として用いるため、すなわち、符号化される対象ブロックがバッファの中の参照ブロックと相対的に符号化される可能性があるように提供される。
受信端末24上のデコーダは、動き補償予測モジュール44のデコーダ側インスタンス44’、61’、63’、65’、66’、67’および68’と、復号化モジュール61、63と、対応する短期間および長期間参照66、67および68を記憶するように配置構成されている復号ピクチャバッファ65とを備える。
受信端末24上のデコーダは、フィードバックチャネルを介して送信端末12上のエンコーダと通信するように構成されている。フィードバックは、好ましくは、同一のネットワーク32、たとえば、インターネットのような同一のパケットベース・ネットワークを経由し、このネットワーク32によってビデオストリームが受信端末22に送信されるが、代替的なフィードバックメカニズムの可能性は、排除されない。
図5の典型的な実施を参照すると、フィードバックは、デコーダでの復号ピクチャバッファ65’に関する情報を含んでいると考えられる。このフィードバックを仮定すると、エンコーダは、たとえば、デコーダ内のどのフレームまたはスライスが誤り伝搬歪みを全く含むことなく復号化されたかが分かる。図5では、復号ピクチャバッファ65内のエントリ68は、このような肯定応答された誤りのないフレームを参照する。復号ピクチャバッファ65内のエントリ67は、肯定応答されていないフレームを参照する。フィードバックメカニズムは、(どのフレームが失われたかに関する情報に加えて)デコーダで利用できる最後に肯定応答された長期間参照が何であるかをエンコーダに知らせるために使用される可能性がある。
本発明の第2の実施形態の選択自由のフィードバックベースの具現化において、パケットおよび/またはフレーム到着状態のような、受信端末22のうちの1台以上からエンコーダにフィードバックされた情報は、受信端末22のうちのそれぞれの1台以上に対するエンコーダにおける対応する歪みマップを調節し、それによって、Zhang et al.による方法と比べて全体的なレート−歪み性能を改善するために使用される。
各フレームまたはフレームのスライスに対する誤り伝搬歪みマップDepは、受信端末22のうちの1台ずつに関して、エンコーダの復号ピクチャバッファ65内にこのフレームまたはスライスと関連付けて記憶される。各フレームまたはスライスに対して、エンコーダでの復号ピクチャバッファ65は、対応する誤り隠蔽再構成歪みマップDec−recと、誤り隠蔽誤り伝搬マップDec−epと、対応するモード決定oと、動きベクトル情報とをさらに記憶する。フィードバック情報が受信端末のうちの1台以上のデコーダから受信された場合、このフィードバック情報は、その後、それぞれの1つ以上のチャネルに対する対応する決定マップ(群)を更新するためにエンコーダによって使用される可能性がある。フィードバックに基づいて更新される歪みマップはどれもが更新されない歪みマップと同じ方法で集計誤り伝搬歪みの式に入力される。式(3)および(4a)を再び参照する。フィードバック情報は、推定歪み追跡が精緻化されることを可能にして、より優れたレート−歪み性能をもたらす。
好ましくは、どのような所定の受信機22に対しても誤り歪みマップの更新は、以下のとおり達成される。エンコーダが特殊なフレームまたはスライスがデコーダに到達することに成功したことをシグナル通知するフィードバック情報を受信する場合、誤り隠蔽寄与度Dec−recおよびDec−epは、式(3)において誤り伝搬歪みマップDepから取り除かれる可能性がある。逆に、特殊なフレームまたはスライスがデコーダで失われたことをシグナル通知するフィードバック情報が受信された場合、関連した誤り伝搬歪みマップDepは、誤り隠蔽歪みからの寄与度、すなわち、式(3)の右辺の第2および第3項、すなわち、(事前損失確率推定値pによって正規化された)Dec−recおよびDec−epのみを組み入れるように再計算される。
その結果、ラウンド・トリップ・タイム(RTT)が復号ピクチャバッファ内の参照ピクチャの個数と比較して小さい場合、式(3)を再帰的に適用することにより、時点n−RTTでの調節された潜在的な誤り伝搬マップDepを時点n−1での誤り伝搬歪みマップに伝搬させることが可能である。時点n−1での更新された誤り伝搬歪みマップDepは、その結果、モード選択プロセス(2)において使用される時点nでのDep−refの計算の基礎となるであろう。これは、結果として、潜在的な歪みマップのより正確な追跡をもたらし、それ故に、システムの全体的なレート−歪み性能を改善する。
上記は、図4bの好ましい適用に関して説明されているが、図4aは、送信端末30が同一の符号化されたビデオストリームのそれぞれのインスタンスをインターネットのようなパケットベース・ネットワーク32を介するそれぞれの接続を経由して受信機22の1台ずつに送信する本発明の代替的な適用による配置構成を例示する。この場合、各チャネルは、送信機12とそれぞれの受信機22との間に確立されたそれぞれの接続を備える。このシナリオでも、各チャネルに関して完全な損失適応型レート−歪み最適化プロセスを実行するために送信機のCPUリソースに追加の負担をそれでもなお課すことがある。その結果、単一の符号化されたビデオストリームの複数のインスタンスを複数台の受信機に送信し、このようにして、アップリンク上でなくても、送信機での処理リソースを節約するためにレート−歪み最適化プロセスを集計することが依然として望ましいことがある。
発明の上記実施形態をこのシナリオに適用するため、式(3a)および(3b)においてi番目のチャネルに対するパケット損失の確率は、ちょうど送信機12とそれぞれの受信機22との間のそれぞれの接続を介する損失の確率pまで低減し、その結果、同一の技術を適用することが可能である。
図4aの送信機12上のエンコーダは、その結果、同一の符号化されたビデオストリームのそれぞれのインスタンスを受信端末12の1台ずつに送信することが可能であり、この場合も同一のレート−歪み最適化計算に基づいて到達した所与のマクロブロックに対して同一のモード選択を含んでいる。これは、送信機でのCPUリソースを節約する。
上記実施形態は、単なる一例として記載されていることが認められるであろう。
概して、上記は、スライス、マクロブロック、および、ブロックまたはサブブロックの観点から説明されているが、これらの用語は、必ずしも限定的であることが意図されず、本書に記載された考え方は、フレームを分割または再分割する何らかの特殊な方法に限定されるものではない。さらに、歪みマップは、フレーム全体またはフレーム内の領域を対象とすることがあり、符号化決定プロセスは、フレーム全体、または、フレーム内のある領域のみに適用されることがある。予測ブロック粒度は、(可能性は排除されないが)歪みマップ粒度と同じであること、または、歪みマップ粒度に関係させられることさえ必要でないことにも注意すべきである。
差分二乗和(SSD)は、差分絶対和(SAD)と比べると、結果としてより高い品質をもたらすので、多くの場合に差分の尺度として好ましいが、後者の可能性またはその他の可能性が排除されることはなく、概して、発明は、歪みを定量化する基礎としてサンプルの間の差分の何らかの尺度を使用して実施されることがあり得る。
広くは、レートの尺度は、予測を記述するパラメータおよび量子化された変換係数を含む全ての必要とされるパラメータの符号化をさらに明らかにする。この種の最適化は、本書では、完全なレート−歪み最適化(RDO)と呼ばれることがある。より複雑性の低い実施形態では、しかし、歪みおよび/またはレート項は、いくつかの、しかし、全部ではない処理段階の効果のみを考慮することにより、たとえば、予測の効果のみを考慮することにより近似されることがある。
さらに、本発明は、2つのフレームn−1およびn、または、nおよびn+1などの観点から説明されているが、発明のある種の実施形態では、これらは、(既存のコーデックの場合、そうであるかもしれないが)2個の隣接するフレームを参照する必要がない。いくつかの実施形態では、インター予測がさらに先行のフレームと相対的に実行されることがあり得るので、n−1およびn、または、nおよびn+1が先に符号化されたフレームまたは画像部分と、そこから予測される後に続くフレームまたは部分を参照するために本発明に関連して使用されることが可能である。
損失に起因する寄与度は、本願において言及されるか、または、データがチャネルなどを介して失われた「場合に」何が起こるかについて記載している何かであるが、このことは、デコーダに起こったかもしれないことに関して、エンコーダは、当然ながら何が起こるかを知らないが、エンコーダによって行われた確率的仮定(たとえば、p)のみに関係していることに留意を要する。確率的仮定は、統計的ネットワークモデリングに基づいて設計段階で予め決められることがあり、および/または、デコーダからのフィードバックに基づいて動的に決定されることさえあり得る。
その他の変形例は、本書における開示により、当業者に明らかになるであろう。発明の範囲は、記載された実施形態ではなく、特許請求の範囲のみによって限定される。

Claims (10)

  1. ビデオストリームを符号化する方法であって、
    送信端末から複数の受信端末への複数のチャネルをクラスに分類するステップであって、各々のクラスにおける前記チャネルは、前記送信端末と当該クラスの受信端末との間で類似するパケット損失確率を有し、各々のクラスは関連する誤り伝搬歪みマップを有する、ステップと、
    前記チャネルのクラスの各々について、誤り伝搬歪みの推定値を決定するステップであって、前記誤り伝搬歪みの推定値は、前記クラスの各々に関連する各自の誤り伝搬歪みマップから決定される、ステップと、
    前記ビデオストリームのフレームの中で符号化される複数の対象画像部分の各々に対して、前記対象画像部分の歪みの推定値と、前記対象画像部分を符号化するために必要なビットレートの尺度とを含む関数を最適化することにより、一群の符号化モードのうちの好ましいものを選択する処理を含むレート−歪み最適化プロセスを実行するステップであって、前記歪みの推定値はソース符号化歪みと損失に起因する誤り伝搬歪みの推定値とに基づいている、ステップと、
    選択された前記符号化モードを使用して、前記対象画像部分を符号化されたバージョンのビデオストリームに符号化するステップと
    を有し、前記方法は、複数の受信端末の各々に同一のレート−歪み最適化プロセスを使用して、送信端末から前記複数の受信端末の各々に各自の損失性チャネルを介して同一の符号化されたバージョンのビデオストリームを送信するステップをさらに有し、
    前記同一のレート−歪み最適化プロセスを使用することは、前記関数の同一の最適化に基づいて前記対象画像部分毎に同一の符号化モードを選択することを含み、
    前記誤り伝搬歪みの推定値は、複数のチャネルに関して見込まれる損失に起因して生じるおそれがある誤り伝搬歪みの集計推定値を有する、方法。
  2. 前記チャネルのうちの2つ以上は、共通のマルチキャスティング中継ノードを経由し、前記送信端末は、前記符号化されたバージョンのビデオストリームを第1の区間を介して前記マルチキャスティング中継ノードに送信し、前記マルチキャスティング中継ノードは、2つ以上の受信端末の各々に各自のチャネルの第2の区間を介して各自の符号化されたバージョンのビデオストリームのインスタンスを転送する、請求項1に記載の方法。
  3. 前記チャネルの各々を介する損失の個別の確率を決定するステップと、前記個別の確率に基づいて集計確率を決定するステップとを有し、前記歪みの集計推定値は、前記集計確率に基づいている、請求項1または2に記載の方法。
  4. 前記2つ以上のチャネルの各々に対する個別の確率は、区間各々を介する損失の確率を組み合わせることにより決定される、請求項3に記載の方法。
  5. 当該方法は、前記チャネルの各々に関して見込まれる損失に起因して生じるおそれがある誤り伝搬歪みの個別の推定値を決定するステップを有し、前記誤り伝搬歪みの集計推定値は、前記誤り伝搬歪みの個別の推定値を集計することにより決定される、請求項1−4のうち何れか1項に記載の方法。
  6. 当該方法は、符号化モードの選択各々の後に前記誤り伝搬マップを更新することにより、前記チャネルの各々に対する個別の誤り伝搬歪みマップを維持するステップを有し、前記歪みの個別の推定値は、前記歪みマップ各々から決定される、請求項5に記載の方法。
  7. 前記チャネル1つ以上のうちの各々に対する前記誤り伝搬歪みの個別の推定値は、前記受信端末各々からのフィードバックに基づいている、請求項5または6に記載の方法。
  8. 前記フィードバックは、先行するフレームの少なくとも一部が受信されたという肯定応答と、前記先行するフレームの少なくとも一部が受信されなかったというレポートとのうちの一方を含む、請求項7に記載の方法。
  9. ビデオストリームを符号化する送信端末であって、
    送信端末から複数の受信端末への複数のチャネルをクラスに分類することであって、各々のクラスにおける前記チャネルは、前記送信端末と当該クラスの受信端末との間で類似するパケット損失確率を有し、各々のクラスは関連する誤り伝搬歪みマップを有する、こと、
    前記チャネルのクラスの各々について、誤り伝搬歪みの推定値を決定することであって、前記誤り伝搬歪みの推定値は、前記クラスの各々に関連する各自の誤り伝搬歪みマップから決定される、こと、及び
    前記ビデオストリームのフレームの中で符号化される複数の対象画像部分の各々に対して、前記対象画像部分の歪みの推定値と、前記対象画像部分を符号化するために必要とされるビットレートの尺度とを含む関数を最適化することにより、一群の符号化モードのうちの好ましいものを選択する処理を含むレート−歪み最適化プロセスを実行することであって、前記選択された符号化モードを使用して、前記対象画像部分を符号化されたバージョンのビデオストリームに符号化することであって、前記歪みの推定値はソース符号化歪みと損失に起因する誤り伝搬歪みの推定値とに基づいている、こと、
    を行うように形成されるエンコーダと、
    前記送信端末から複数の受信端末の各々に各自の損失性チャネルを介して同一の符号化されたバージョンのビデオストリームを送信するように形成される送信機とを備え、
    前記エンコーダは、前記複数の受信端末の各々に同一のレート−歪み最適化プロセスを使用するように形成され、前記同一のレート−歪み最適化プロセスを使用することは、前記関数の同一の最適化に基づいて前記対象画像部分毎に同一の符号化モードを選択することを含み、
    前記エンコーダは、誤り伝搬歪みの前記推定値が、複数の前記チャネルに関して見込まれる損失に起因して生じるおそれがある誤り伝搬歪みの集計推定値を有するように形成される、送信端末。
  10. 請求項1−8のうち何れか1項に記載の方法を送信端末のコンピュータに実行させるコードを有する、ビデオストリームを符号化するためのコンピュータプログラム。
JP2014528684A 2011-09-02 2012-09-02 符号化方法及び送信端末 Active JP6047835B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB1115210.5A GB2495469B (en) 2011-09-02 2011-09-02 Video coding
GB1115210.5 2011-09-02
US13/274,865 2011-10-17
US13/274,865 US9854274B2 (en) 2011-09-02 2011-10-17 Video coding
PCT/US2012/053581 WO2013033677A1 (en) 2011-09-02 2012-09-02 Video encoding mode selection based on an aggregate estimate of error propagation distortion over multiple lossy channels

Publications (3)

Publication Number Publication Date
JP2014528201A JP2014528201A (ja) 2014-10-23
JP2014528201A5 JP2014528201A5 (ja) 2015-12-03
JP6047835B2 true JP6047835B2 (ja) 2016-12-27

Family

ID=44882144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014528684A Active JP6047835B2 (ja) 2011-09-02 2012-09-02 符号化方法及び送信端末

Country Status (6)

Country Link
US (1) US9854274B2 (ja)
EP (1) EP2737702B1 (ja)
JP (1) JP6047835B2 (ja)
KR (1) KR101999414B1 (ja)
GB (1) GB2495469B (ja)
WO (1) WO2013033677A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5373909B2 (ja) * 2008-08-19 2013-12-18 トムソン ライセンシング 圧縮ビデオにおける構文要素のcabac/avc準拠の透かし入れ
JP5639056B2 (ja) * 2008-08-19 2014-12-10 トムソン ライセンシングThomson Licensing 輝度評価
BRPI0916944B1 (pt) * 2008-08-19 2020-07-21 Contentarmor Método e aparelho para inserir marca dágua em vídeo codificado
WO2010021694A1 (en) * 2008-08-20 2010-02-25 Thomson Licensing Selection of watermarks for the watermarking of compressed video
EP2534638B1 (en) 2010-02-09 2019-01-16 ContentArmor Watermark detection using a propagation map
GB2492329B (en) 2011-06-24 2018-02-28 Skype Video coding
GB2492163B (en) 2011-06-24 2018-05-02 Skype Video coding
GB2492330B (en) 2011-06-24 2017-10-18 Skype Rate-Distortion Optimization with Encoding Mode Selection
GB2493777A (en) 2011-08-19 2013-02-20 Skype Image encoding mode selection based on error propagation distortion map
GB2495467B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495468B (en) 2011-09-02 2017-12-13 Skype Video coding
KR20160079205A (ko) * 2014-12-26 2016-07-06 전자부품연구원 비트율-왜곡비를 이용한 블록 부호화 시스템
US10595025B2 (en) 2015-09-08 2020-03-17 Microsoft Technology Licensing, Llc Video coding
US10313685B2 (en) * 2015-09-08 2019-06-04 Microsoft Technology Licensing, Llc Video coding
US10182244B2 (en) * 2016-03-02 2019-01-15 MatrixView, Inc. Fast encoding loss metric
KR102483269B1 (ko) * 2016-08-29 2023-01-02 삼성전자주식회사 서버 장치, 사용자 단말 장치, 그 제어 방법들 및 스트리밍 시스템
CN112655212B (zh) * 2018-11-28 2023-04-04 Oppo广东移动通信有限公司 视频编码优化方法、装置及计算机存储介质
US11172197B2 (en) * 2019-01-13 2021-11-09 Tencent America LLC Most probable mode list generation scheme
US11363306B2 (en) 2019-04-05 2022-06-14 Comcast Cable Communications, Llc Methods, systems, and apparatuses for processing video by adaptive rate distortion optimization
US11902570B2 (en) * 2020-02-26 2024-02-13 Intel Corporation Reduction of visual artifacts in parallel video coding
CN111314703B (zh) * 2020-03-31 2022-03-08 电子科技大学 一种基于失真类型传播分析的时域率失真优化方法

Family Cites Families (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0620303B2 (ja) 1984-11-08 1994-03-16 日本電信電話株式会社 フレ−ム間符号化方式におけるリフレッシュ処理方式
JP2661122B2 (ja) 1988-04-07 1997-10-08 日本電気株式会社 フレーム間予測符号化復号化装置
FR2700632B1 (fr) 1993-01-21 1995-03-24 France Telecom Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués.
JPH10145794A (ja) 1996-11-11 1998-05-29 Oki Electric Ind Co Ltd 画像符号化方法及び画像符号化装置
JPH11218673A (ja) 1998-01-30 1999-08-10 Olympus Optical Co Ltd カメラシステム
JPH11289542A (ja) 1998-02-09 1999-10-19 Matsushita Electric Ind Co Ltd 画像符号化装置、画像符号化方法、および画像符号化プログラムを記録した記録媒体
US6434196B1 (en) 1998-04-03 2002-08-13 Sarnoff Corporation Method and apparatus for encoding video information
US6421387B1 (en) * 1998-05-15 2002-07-16 North Carolina State University Methods and systems for forward error correction based loss recovery for interactive video transmission
JP3606306B2 (ja) 1998-10-08 2005-01-05 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
US6320919B1 (en) * 1998-11-30 2001-11-20 Ericsson Inc. Adaptive channel characterization using decoded symbols
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
US7093028B1 (en) * 1999-12-15 2006-08-15 Microsoft Corporation User and content aware object-based data stream transmission methods and arrangements
JP2003032287A (ja) * 2001-07-16 2003-01-31 Furukawa Electric Co Ltd:The ネットワーク間接続方法、その装置およびその装置を用いたシステム
DE60108387T2 (de) * 2001-09-12 2005-12-29 Alcatel Verfahren und Vorrichtung zur Dienstdifferenzierung in einem Datennetzwerk
US7317759B1 (en) 2002-02-28 2008-01-08 Carnegie Mellon University System and methods for video compression mode decisions
US7391807B2 (en) 2002-04-24 2008-06-24 Mitsubishi Electric Research Laboratories, Inc. Video transcoding of scalable multi-layer videos to single layer video
FR2840495B1 (fr) 2002-05-29 2004-07-30 Canon Kk Procede et dispositif de selection d'une methode de transcodage parmi un ensemble de methodes de transcodage
US7936818B2 (en) 2002-07-01 2011-05-03 Arris Group, Inc. Efficient compression and transport of video over a network
KR100935933B1 (ko) * 2002-10-15 2010-01-11 삼성전자주식회사 무선통신에서 무선단말 그룹화에 의한 신뢰성 있는멀티캐스트 데이터 재전송 방법 및 장치
FR2846835B1 (fr) 2002-11-05 2005-04-15 Canon Kk Codage de donnees numeriques combinant plusieurs modes de codage
EP1439712A1 (en) 2002-12-17 2004-07-21 Visiowave S.A. Method of selecting among "Spatial Video CODEC's" the optimum CODEC for a same input signal
CN100499788C (zh) 2003-01-09 2009-06-10 加利福尼亚大学董事会 视频编码设备
US8040949B2 (en) 2003-01-09 2011-10-18 The Regents Of The University Of California Video encoding methods and devices
US7672523B2 (en) 2003-03-03 2010-03-02 The Hong Kong University Of Science And Technology Efficient rate allocation for multi-resolution coding of data
US7280597B2 (en) * 2003-06-24 2007-10-09 Mitsubishi Electric Research Laboratories, Inc. System and method for determining coding modes, DCT types and quantizers for video coding
US7433661B2 (en) 2003-06-25 2008-10-07 Lucent Technologies Inc. Method for improved performance and reduced bandwidth channel state information feedback in communication systems
KR20050061762A (ko) 2003-12-18 2005-06-23 학교법인 대양학원 부호화 모드 결정방법, 움직임 추정방법 및 부호화 장치
US7349472B2 (en) 2004-02-11 2008-03-25 Mitsubishi Electric Research Laboratories, Inc. Rate-distortion models for error resilient video transcoding
JP4031455B2 (ja) 2004-03-29 2008-01-09 株式会社東芝 画像符号化装置
EP1603339A1 (en) 2004-06-01 2005-12-07 STMicroelectronics S.r.l. Method and system for communicating video data in a packet-switched network, related network and computer program product therefor
JP4680008B2 (ja) * 2004-08-31 2011-05-11 株式会社エヌ・ティ・ティ・ドコモ 通信システム、通信ノード及び通信方法
US8948266B2 (en) 2004-10-12 2015-02-03 Qualcomm Incorporated Adaptive intra-refresh for digital video encoding
US20060098573A1 (en) * 2004-11-08 2006-05-11 Beer John C System and method for the virtual aggregation of network links
US8634413B2 (en) 2004-12-30 2014-01-21 Microsoft Corporation Use of frame caching to improve packet loss recovery
EP1839445A2 (en) 2005-01-18 2007-10-03 Thomson Licensing Method and apparatus for estimating channel induced distortion
US9667999B2 (en) 2005-04-25 2017-05-30 Avago Technologies General Ip (Singapore) Pte. Ltd. Method and system for encoding video data
US20060268976A1 (en) 2005-05-03 2006-11-30 Motorola, Inc. Method and apparatus for determining channel quality and performing adaptive modulation coding within a multi carrier communication system
DE102005029127A1 (de) 2005-06-23 2007-04-19 On Demand Microelectronics Ag Verfahren und Vorrichtung zur optimierten prädiktiven Videocodierung
US20070030894A1 (en) 2005-08-03 2007-02-08 Nokia Corporation Method, device, and module for improved encoding mode control in video encoding
US9077964B2 (en) 2005-12-08 2015-07-07 Layered Media Systems and methods for error resilience and random access in video communication systems
WO2007070056A1 (en) * 2005-12-15 2007-06-21 Thomson Licensing An adaptive joint source and channel coding scheme for h.264 video multicasting over wireless networks
JP5415081B2 (ja) 2005-12-22 2014-02-12 トムソン ライセンシング フレキシブル・マクロブロック配列(fmo)ビデオ符号化のためにフレーム選択を最適化する方法及び装置
EP1977612A2 (en) 2006-01-09 2008-10-08 Nokia Corporation Error resilient mode decision in scalable video coding
WO2007084475A2 (en) 2006-01-17 2007-07-26 Thomson Licensing Methods and apparatus for low complexity error resilient motion estimation and coding mode selection
JP4845640B2 (ja) 2006-08-23 2011-12-28 富士通株式会社 無線通信システムおよび無線通信方法
CN102752597A (zh) 2006-08-28 2012-10-24 汤姆森许可贸易公司 用于确定解码视频块中的期望失真的方法及设备
US9872045B2 (en) * 2006-10-16 2018-01-16 Conversant Wireless Licensing S.A R.L. Method, electronic device, system, computer program product and circuit assembly for reducing error in video coding
US8467448B2 (en) 2006-11-15 2013-06-18 Motorola Mobility Llc Apparatus and method for fast intra/inter macro-block mode decision for video encoding
EP2105029A2 (en) 2006-12-15 2009-09-30 Thomson Licensing Distortion estimation
US8824567B2 (en) 2007-04-04 2014-09-02 Ittiam Systems (P) Ltd. Method and device for tracking error propagation and refreshing a video stream
KR100898176B1 (ko) 2007-06-12 2009-05-19 한국전자통신연구원 비디오 인코딩을 위한 인터 모드 결정 방법
US20080316364A1 (en) 2007-06-25 2008-12-25 The Hong Kong University Of Science And Technology Rate distortion optimization for video denoising
US8265144B2 (en) 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8982947B2 (en) 2007-07-20 2015-03-17 The Hong Kong University Of Science And Technology Rate control and video denoising for noisy video data
CN100566427C (zh) 2007-07-31 2009-12-02 北京大学 用于视频编码的帧内预测编码最佳模式的选取方法及装置
US20090067495A1 (en) * 2007-09-11 2009-03-12 The Hong Kong University Of Science And Technology Rate distortion optimization for inter mode generation for error resilient video coding
JP5427785B2 (ja) 2007-09-28 2014-02-26 ドルビー ラボラトリーズ ライセンシング コーポレイション ビデオ圧縮技法及びビデオ伝達技法
US20090103635A1 (en) * 2007-10-17 2009-04-23 Peshala Vishvajith Pahalawatta System and method of unequal error protection with hybrid arq/fec for video streaming over wireless local area networks
US20090110062A1 (en) 2007-10-30 2009-04-30 The Hong Kong University Of Science And Technology Optimal heegard-berger coding schemes
US20090135901A1 (en) 2007-11-28 2009-05-28 The Hong Kong University Of Science And Technology Complexity adaptive video encoding using multiple reference frames
FR2925819A1 (fr) 2007-12-21 2009-06-26 Thomson Licensing Sas Procede de codage double passe par macrobloc
US8238427B2 (en) 2008-01-17 2012-08-07 Texas Instruments Incorporated Rate distortion optimized adaptive intra refresh for video coding
US8265171B2 (en) 2008-02-26 2012-09-11 Richwave Technology Corp. Error resilient video transmission using instantaneous receiver feedback and channel quality adaptive packet retransmission
US8798137B2 (en) 2008-02-29 2014-08-05 City University Of Hong Kong Bit rate estimation in data or video compression
US8406296B2 (en) 2008-04-07 2013-03-26 Qualcomm Incorporated Video refresh adaptation algorithms responsive to error feedback
WO2010005691A1 (en) 2008-06-16 2010-01-14 Dolby Laboratories Licensing Corporation Rate control model adaptation based on slice dependencies for video coding
EP2139138B1 (en) 2008-06-24 2013-06-19 Alcatel Lucent Radio link adaption of a channel between a first network element and a second network element in a communication network
US20110182356A1 (en) 2008-07-25 2011-07-28 Satya Ghosh Ammu A method for the estimation of spatio-temporal homogeneity in video sequences
US9479786B2 (en) 2008-09-26 2016-10-25 Dolby Laboratories Licensing Corporation Complexity allocation for video and image coding applications
KR101619972B1 (ko) 2008-10-02 2016-05-11 한국전자통신연구원 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
KR101217525B1 (ko) * 2008-12-22 2013-01-18 한국전자통신연구원 비터비 디코더와 이를 이용한 음성 인식 방법
US8780821B2 (en) * 2009-02-20 2014-07-15 Qualcomm Incorporated Channel interleaver for transmission of multiple code blocks in a wireless communication system
US20100238997A1 (en) 2009-03-17 2010-09-23 Yang En-Hui Method and system for optimized video coding
EP2230849A1 (en) 2009-03-20 2010-09-22 Mitsubishi Electric R&D Centre Europe B.V. Encoding and decoding video data using motion vectors
US8031747B2 (en) * 2009-04-29 2011-10-04 Juniper Networks, Inc. Apparatus and method of compensating for clock frequency and phase variations by processing packet delay values
US8270473B2 (en) 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US8477846B2 (en) * 2009-10-07 2013-07-02 Ittiam Systems (P) Ltd. System and method for adaptive intra refresh rate setting in a video encoder
US8411750B2 (en) 2009-10-30 2013-04-02 Qualcomm Incorporated Global motion parameter estimation using block-based motion vectors
TWI390503B (zh) * 2009-11-19 2013-03-21 Gemtek Technolog Co Ltd Dual channel voice transmission system, broadcast scheduling design module, packet coding and missing sound quality damage estimation algorithm
GB2476271B (en) 2009-12-17 2015-09-02 Skype Coding data streams
US8553796B2 (en) 2009-12-23 2013-10-08 Intel Corporation Distortion-aware multiple input multiple output precoding
WO2011083439A1 (en) 2010-01-08 2011-07-14 Nokia Corporation An apparatus, a method and a computer program for video coding
US20110206118A1 (en) 2010-02-19 2011-08-25 Lazar Bivolarsky Data Compression for Video
US20130007831A1 (en) 2010-03-05 2013-01-03 Thomson Licensing Bit rate adjustment in an adaptive streaming system
US20110310976A1 (en) * 2010-06-17 2011-12-22 Qualcomm Incorporated Joint Coding of Partition Information in Video Coding
US20120069927A1 (en) 2010-09-17 2012-03-22 Intel Corporation CQI feedback mechanisms for distortion-aware link adaptation toward enhanced multimedia communications
CN103168469B (zh) 2010-10-20 2016-08-10 杜比实验室特许公司 用于图像和视频编码的错误恢复率失真优化
EP2721826A4 (en) 2011-06-14 2015-05-06 Zhou Wang METHOD AND SYSTEM FOR OPTIMIZATION OF FLOW-DISTORTION BASED ON STRUCTURAL SIMILARITY FOR PERCEPTUAL VIDEO CODING
GB2492330B (en) 2011-06-24 2017-10-18 Skype Rate-Distortion Optimization with Encoding Mode Selection
GB2492329B (en) 2011-06-24 2018-02-28 Skype Video coding
GB2492163B (en) 2011-06-24 2018-05-02 Skype Video coding
GB2493777A (en) 2011-08-19 2013-02-20 Skype Image encoding mode selection based on error propagation distortion map
GB2495468B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495467B (en) 2011-09-02 2017-12-13 Skype Video coding

Also Published As

Publication number Publication date
EP2737702A1 (en) 2014-06-04
EP2737702B1 (en) 2022-02-23
GB2495469A (en) 2013-04-17
JP2014528201A (ja) 2014-10-23
US9854274B2 (en) 2017-12-26
GB2495469B (en) 2017-12-13
WO2013033677A1 (en) 2013-03-07
GB201115210D0 (en) 2011-10-19
KR101999414B1 (ko) 2019-07-11
US20130058395A1 (en) 2013-03-07
KR20140057309A (ko) 2014-05-12

Similar Documents

Publication Publication Date Title
JP6047835B2 (ja) 符号化方法及び送信端末
JP6031106B2 (ja) エラーのない基準フレームを使用したビデオリフレッシュ
JP6175666B2 (ja) 誤り伝搬追跡および受信機からの誤りフィードバックを用いるビデオリフレッシュ
EP2712482B1 (en) Low complexity mode selection
EP2712481B1 (en) Mode decision with perceptual-based intra switching
EP2710802B1 (en) Rate-distortion optimization for video coding
EP2730086A1 (en) Rate -distortion optimized video encoding mode selection based on low complexity error propagation tracking
CN102946534A (zh) 视频编码
CN102946532A (zh) 视频编码

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150807

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161004

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20161101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20161101

R150 Certificate of patent or registration of utility model

Ref document number: 6047835

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250