JP2020500448A - 画像のブロックの動きベクトルに基づく当該ブロックの分散の決定 - Google Patents

画像のブロックの動きベクトルに基づく当該ブロックの分散の決定 Download PDF

Info

Publication number
JP2020500448A
JP2020500448A JP2019517385A JP2019517385A JP2020500448A JP 2020500448 A JP2020500448 A JP 2020500448A JP 2019517385 A JP2019517385 A JP 2019517385A JP 2019517385 A JP2019517385 A JP 2019517385A JP 2020500448 A JP2020500448 A JP 2020500448A
Authority
JP
Japan
Prior art keywords
pixel block
determining
cost
variance
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019517385A
Other languages
English (en)
Other versions
JP7150706B2 (ja
Inventor
サイーディ メーディ
サイーディ メーディ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATI Technologies ULC
Original Assignee
ATI Technologies ULC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATI Technologies ULC filed Critical ATI Technologies ULC
Publication of JP2020500448A publication Critical patent/JP2020500448A/ja
Application granted granted Critical
Publication of JP7150706B2 publication Critical patent/JP7150706B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

本開示は、例えば、画素ブロックの画素値に基づいて分散を直接計算するのではなく、ビデオの基準フレームの画素ブロックの分散に基づいてビデオのフレーム内の画素ブロックの分散を決定するための技術に関する。本技術は、現在のフレーム内の画素ブロックの動きベクトルを識別することを含み、当該動きベクトルは、基準フレーム内の画素ブロックを示している。また、本技術は、動きベクトルに関連するコストを決定することと、当該コストを第1閾値及び第2閾値と比較することと、を含む。本技術は、第1閾値及び第2閾値とのコストの比較と、基準フレームの画素ブロックの分散と、に基づいて、現在のフレームの画素ブロックの分散を決定することを含む。【選択図】図6

Description

(関連出願の相互参照)
本願は、2016年10月13日に出願された米国特許出願第15/292,757号の利益を主張し、この内容は、本明細書に十分に記載されているかのように、言及したことによって本明細書に組み込まれる。
分散マップ(画像の画素ブロックに対して決定された分散のマップ)は、画像及びビデオ処理において多くの用途がある。このような用途には、例えば、画像又はビデオサイズの変更、圧縮等が含まれる。しかしながら、分散を決定することは、通常、計算集約的な動作である。この事実は、分散の決定を必要とする分析が一般的に比較的遅いことを意味する。
添付の図面と共に例として与えられる以下の説明から、より詳細な理解が得られるであろう。
本開示の態様が実装される例示的なデバイスのブロック図である。 一例による、画像を示す図である。 一例による、ブロック内の画素を示す図である。 一例による、現在の画像フレームの1つ以上のブロックの分散を決定するためにビデオの画像に適用される動きベクトル技術を示す図である。 回帰分析の一例を示すグラフである。 一例による、「コスト」(基準フレームのブロックに対する類似度)に基づいて分散値を決定する方法のフロー図である。
本開示は、例えば、画素ブロックの画素値に基づいて分散を直接計算するのではなく、ビデオの基準フレームの画素ブロックの分散に基づいてビデオのフレーム内の画素ブロックの分散を決定するための技術に関する。本技術は、現在のフレーム内の画素ブロックの動きベクトルを識別することを含み、当該動きベクトルは、基準フレーム内の画素ブロックを示している。一例では、動きベクトルは、以前に使用された画像処理データ((例えば、画像圧縮、ビデオプロセッサ等のために)分散の決定以外の目的で決定された動きベクトルを既に含む)から識別される。別の例では、動きベクトルは、本明細書に記載の技術によって直接識別される。また、本技術は、動きベクトルに関連するコストを決定することと、当該コストを第1閾値及び第2閾値と比較することと、を含む。コストが第1閾値を下回る場合、現在のフレーム内の画素ブロックは、動きベクトルによって示された基準フレーム内の画素ブロックと十分に類似しているとみなされ、基準フレームの画素ブロックの分散(既に決定されたもの)は、現在のフレーム内の画素ブロックの分散として使用される。
コストが第1閾値と第2閾値との間にある場合には、相関関数によって変更された基準フレームの画素ブロックの分散が、現在のフレームの画素ブロックの分散として使用される。現在のフレームの画素ブロックのコストが第2閾値を上回る場合には、基準フレームの画素ブロックの分散を使用することが信頼できないとみなされ(「推定された分散」が信頼できないとみなされ)、現在のフレームの画素ブロックの分散が、(例えば、本明細書で提供される分散を計算する式によって)直接決定される。上記の技術は、現在のフレームの全ての画素ブロックに使用される。信頼できない推定された分散を有する現在のフレームの画素ブロックの数が第3閾値を上回る場合、(例えば、ビデオ内でシーン変化が発生したため)分散推定技術があまりにも信頼できないとみなされ、現在のフレームの画素ブロック毎の分散は、代わりに、現在のフレームの各画素ブロックの画素値から直接決定される。
図1は、本開示の態様が実装される例示的なデバイス100の例のブロック図である。デバイス100は、例えば、コンピュータ、ゲームデバイス、ハンドヘルドデバイス、セットトップボックス、テレビ、携帯電話又はタブレットコンピュータを含む。デバイス100は、プロセッサ102と、メモリ104と、ストレージデバイス106と、1つ以上の入力デバイス108と、1つ以上の出力デバイス110と、を含む。また、デバイス100は、入力ドライバ112及び出力ドライバ114をオプションで含むことができる。デバイス100は、図1に示されていない追加のコンポーネントを含んでもよいことを理解されたい。
プロセッサ102は、中央処理装置(CPU)、グラフィックス処理装置(GPU)、同じダイ上に配置されたCPU及びGPU、又は、1つ以上のプロセッサコア(各プロセッサコアは、CPU若しくはGPUであってもよい)のうち1つ以上を含む。メモリ104は、プロセッサ102と同じダイ上に配置されてもよいし、プロセッサ102から離れて配置されてもよい。メモリ104は、揮発性メモリ又は不揮発性メモリ(例えば、ランダムアクセスメモリ(RAM)、ダイナミックRAM若しくはキャッシュ等)を含む。
ストレージデバイス106は、固定ストレージ又はリムーバブルストレージ(例えば、ハードディスクドライブ、ソリッドステートドライブ、光ディスク若しくはフラッシュドライブ)を含む。入力デバイス108は、キーボード、キーパッド、タッチスクリーン、タッチパッド、検出器、マイクロフォン、加速度計、ジャイロスコープ、又は、バイオメトリックスキャナのうち1つ以上を含む。出力デバイス110は、ディスプレイ、スピーカ、プリンタ、触覚フィードバックデバイス、1つ以上のライト、又は、アンテナのうち1つ以上を含む。
入力ドライバ112は、プロセッサ102及び入力デバイス108と通信し、プロセッサ102が入力デバイス108から入力を受信することを可能にする。出力ドライバ114は、プロセッサ102及び出力デバイス110と通信し、プロセッサ102が出力デバイス110に出力を送信することを可能にする。
ネットワークインタフェースカード(NIC)118は、コンピュータネットワークを介した他のデバイスへのインタフェースを提供する。NIC118は、イーサネット(登録商標)、wi‐fi(登録商標)、InfiniBand又は他のプロトコル等のネットワークプロトコルを介して外部デバイスと通信するように構成されている。アクセラレータ116は、処理タスクを受け入れて実行するように構成された1つ以上のデバイスを含む。これらのデバイスは、グラフィックス処理装置(GPU)、フィールドプログラマブルゲートアレイ(FPGA)、PIM(processing-in-memory)チップ、特定用途向け集積回路(ASIC)又は他のデバイスのうち1つ以上を含む。
画像プロセッサ120は、2つの異なる形態で示されている。第1形態では、画像プロセッサ120は、図示するように、メモリ104に記憶され、プロセッサ102上で実行されるソフトウェアである。第2形態では、画像プロセッサは、出力ドライバ114内に存在するハードウェアグラフィックスエンジンの少なくとも一部である。他の形態では、画像プロセッサ120は、ソフトウェア要素及びハードウェア要素の組み合わせであり、ハードウェアは、例えば出力ドライバ114内に存在し、ソフトウェアは、例えばプロセッサ102上で実行される。
画像プロセッサ120は、分析用の入力画像を受信し、当該画像を分析し、出力画像を含み得る分析結果を生成する。画像プロセッサ120が実行するタスクでは、入力画像内の一連のブロックの各々の分散値を決定する。概念的には、分散は、ブロックの画素が互いにどの程度類似しているかを示す。単色の画素ブロックは非常に低い分散を有し、異なる画素色のモザイクは非常に高い分散を有する。分散値は、画像プロセッサ120又はデバイス100の別の部分によって実行されるいくつかの異なる画像処理技術において使用することができる。したがって、画像プロセッサ120は、分散を使用して1つ以上の画像処理技術を実行することができる。
図2は、一例による、画像200を示す図である。画像200は、分析用及び/又は(例えば、出力デバイス110に含まれてもよい)スクリーンでの表示用の画像データである。画像200は、画像200の分散を決定するために画像プロセッサ120によって処理される画像である。図2に示す画像200は、図示するように格子状に配置された一連の画素ブロック202を含む。各画素ブロック202は、同じサイズであり、同じ数の画素を含む。本明細書で説明する分散を決定する技術は、図2の画像200等の画像内の各ブロック202の分散値を決定する。
図3は、一例による、ブロック202内の画素302を示す図である。図3に示すブロック202は、幅Xの画素と、高さYの画素とを有し、したがって、N=X×Yの画素を有する。一例では、ブロック202の分散は、以下のように決定される。
Figure 2020500448
上記の式において、「μ」は、ブロック内の全ての画素の算術平均である。「pixel」は、画素毎の代表的な色値又は輝度値である。例えば、画素がYUV色空間で表される場合、使用される画素値はY(輝度)値である。画素がRGB色空間で表される場合、R(赤)、G(緑)、B(青)の何れかの成分を「pixel」として使用することができる。したがって、ブロックの分散は、各画素値と平均画素値との差の2乗の合計を、画素数(N)−1で除算したものに等しい。分散を直接決定することは、平方根演算及び除算を含むので、数学的に集中的(mathematically intensive)である。したがって、分散の直接計算を必要としない、フレームの1つ以上のブロック202の分散を決定する技術が本明細書で提供される。具体的には、これらの技術は、動きベクトル技術を使用して、「基準フレーム」(基準フレームは、例えば直前のフレーム等の他のフレームであってもよい)内のブロックの分散に基づいて、特定のフレーム内のブロック202の分散を推定する。
図4は、一例による、現在の画像フレームの1つ以上のブロック202の分散を決定するためにビデオの画像に適用される動きベクトル技術を示す図である。一例では、画像プロセッサ120は、この動きベクトル技術を使用して、分散を決定するための動きベクトルを決定する。或いは、画像プロセッサ120は、例えば画像圧縮、ビデオ分析等の異なる目的で既に決定された動きベクトルを取得する。
動きベクトル技術は、現在のフレーム(すなわち、分析中のフレーム)内のブロック202毎に「動きベクトル」407を決定することを含む。動きベクトル407は、特定の画素のブロック202がビデオの2つのフレーム間で移動した「距離」を表す。より具体的には、動きベクトル407は、現在のフレームにおいてブロックの画素が移動した基準フレーム内のブロックを示す。基準フレームは、現在のフレーム以外のフレームであり、例えば、直前のフレーム又は現在のフレームの前の他のフレームであってもよい。いくつかの例では、後のフレームが基準フレームとなる。
一例では、ブロックは、空と芝生との間のエッジ(an edge between a sky and a lawn)を示す画素を含む。前のフレーム(基準フレーム)では、エッジの画素は、座標7,9を有するブロックに存在していた。現在のフレームでは、エッジの画素は、座標8,10を有するブロックに存在する。現在のフレーム内の座標8,10を有するブロックに関する動きベクトルは−1,−1であり、この動きベクトルは、座標8,10を有するブロックから座標7,9を有するブロックを示している。動きベクトル技術は、通常、ブロックの分散の決定に直接関係しない目的に使用されるが、ブロックの分散を決定するために動きベクトル407を使用する新たな技術が本明細書で提案される。
図4には、現在のフレームと基準フレームとのオーバーレイ400が示される。オーバーレイ400は、2つのフレームのブロックがオーバーレイ400内に示されるという意味でオーバーレイである。これらの2つのフレームは、現在のフレーム及び基準フレームである。現在のフレームの唯一のブロックは、現在のブロック402である。他の全てのブロック202は、基準フレームのブロックである。
現在のブロック402に関する動きベクトル407の決定は、複数の動きベクトル候補406毎にコストを決定することを含む。現在のブロック402に関する動きベクトル407を決定することは、動きベクトル候補406毎のコストが決定されると、全ての決定されたコストのうち最低のコストを識別することを含む。全ての動きベクトル候補406のうち最低のコストを有する動きベクトル候補406は、現在のブロック402に関する動きベクトルとみなされる。換言すれば、動きベクトル候補406は、基準フレームと現在のフレームとの間での現在のブロック402の画素の移動距離を表すと考えられる。動きベクトルに関連するコストは、現在のブロック402に関するコストとみなされる。動きベクトル候補406等の動きベクトルは、(画素302単位ではなく)ブロック202単位で定義される。したがって、(1,1)として示される動きベクトルは、現在のブロック402の1つ上のブロック202であって1つ右のブロック202であるブロック202を指す。(正又は負等の符号と上又は下等の方向との相関は任意であり、任意の相関を使用することができる。)
図4のサーチエリア404内にいくつかの動きベクトル候補406が示されている。サーチエリア404は、画像プロセッサ120が、最低コストを有する動きベクトル候補406を検索する画像の一部である。「コスト」は、現在のブロック402と、特定の動きベクトル候補406によって示されるブロック202との間の「類似性」の尺度として考えることができる。画像プロセッサ120は、サーチエリア404内の異なるブロック202を示す動きベクトル候補406の各々に関するコストを決定し、最低コストを有する動きベクトル候補406を識別する。一例では、サーチエリア404は、垂直ブロック範囲及び水平ブロック範囲によって定義される。この例では、サーチエリア404は、現在のブロック402から水平ブロックに等しい水平距離内、及び、現在のブロック402から垂直ブロック範囲に等しい垂直距離内に全てのブロック202を含むように定義される。
図4には、2つの動きベクトル候補406しか示されていないが、これは明瞭にするためだけのものであることに留意されたい。動作中、画像プロセッサ120は、サーチエリア404及び基準フレーム内の全てのブロック202に関する動きベクトル候補406を識別し、かかる動きベクトル候補406の各々に関するコストを識別し、最低コストを有する基準フレーム内のブロック202を検出することによって、現在のブロック402に関する動きベクトル407を識別する。このブロック202を示す動きベクトル候補406は、現在のブロック402に関する動きベクトル407である。さらに、コスト(分析された全てのコストのうち「最低コスト」)は、現在のブロック402に割り当てられたコストとなる。現在のブロック402のこのコストは、現在のブロック402の画素が、サーチエリア404内の基準フレームの最も類似したブロック202の画素とどの程度類似しているかを示す。また、基準フレーム内であるが現在のブロック402と同じ位置のブロックを示す動きベクトル候補406は、現在のブロック402に関する動きベクトル407を決定する際に検索されることに留意されたい。かかる動きベクトル候補406は、基準フレームと現在のフレームとの間で現在のブロック402の画素の動きがないものと関連付けられる。
ブロック202のコストを決定するのに使用可能な多くの技術が存在する。1つの例は、平均絶対差(mean absolute difference)法である。平均絶対差法では、以下の式に従ってコストが決定される。
Figure 2020500448

式中、Cijは、ブロック内の位置i,jにおける現在のブロック402の画素であり、Rijは、コストが決定されるブロック202内の対応する画素である。
別の例は、平均二乗誤差(mean squared error)法である。平均二乗誤差法では、以下の式に従ってコストが決定される。
Figure 2020500448

式中、平均絶対差法と同様に、Cijは、ブロック内の位置i,jにおける現在のブロック402の画素であり、Rijは、コストが決定されるブロック202内の対応する画素である。直接的な分散の決定に関する「pixel」と同様に、Cij又はRijの値は、画素がYUV色空間で表される場合には輝度値であってもよいし、画素がRGB色空間で表される場合には赤、緑、青の何れかの成分であってもよい。ブロック202のコストを決定するために、他の技術的に実現可能な技術が代わりに使用されてもよい。
画像プロセッサ120は、現在のブロック402に関する動きベクトル407及びコストを決定した後に、これらのアイテムを処理して、現在のブロック402の分散を取得する。より具体的には、画像プロセッサ120は、コストを分析して、3つの動作のうち何れの動作が現在のブロック402の分散を取得するのに使用されるかを決定する。コストが第1閾値を下回る場合、第1動作が発生する。第1動作は、現在のブロック402に関する動きベクトル407によって示されるブロック202の分散を、現在のブロック402の分散として使用することである。概念的に、これは、次のように考えることができる。現在のブロック402のコストが十分に低い場合、動きベクトル407によって示されるブロック202は、現在のブロック402と非常に類似しているとみなされる。したがって、現在のブロック402の分散は、動きベクトル407によって示されるブロック202の分散と同じであると想定することができる。これが発生するときの1つの状況は、画像内に動きが全くない場合である。かかる状況では、現在のブロック402は、動きベクトルによって示されるブロック202の分散と同じであり、コストは0又は0に近い。
現在のブロック402のコストに基づいて分散を決定する第2動作は、コストが第1閾値を上回るが第2閾値を下回る場合に発生する。この場合、画像プロセッサ120は、分散を、動きベクトル407によって示されるブロック202の分散の倍数として決定する。倍数は、0〜1の範囲である。いくつかの例では、倍数は、相関関数によって決定されるように、コストと共に変動する。相関関数を決定する技術については、以下に説明する。
現在のブロック402のコストに基づいて分散を決定する第3動作は、コストが第2閾値を上回る場合に発生する。この場合、現在のブロック402と動きベクトル407によって示されるブロック202とはあまりにも類似していないとみなされ、現在のブロック402は、「信頼できない予測された分散」を有するとみなされる。この場合、画像プロセッサ120は、基準画像の別のブロック202に基づくのではなく、現在のブロック402の画素の値から直接、現在のブロック402の分散を決定する。一例では、画像プロセッサ120は、図3に関連して提供された式を使用して、分散を直接決定する。
Figure 2020500448
画像プロセッサ120は、上述した動きベクトル技術を使用して、現在のフレーム内のブロック毎の動きベクトル407及びコストを決定する。信頼できない予測された分散を有する現在のフレーム内のブロックの数が第3閾値を上回る場合、画像プロセッサ120は、シーン変化が生じたと判別する(換言すれば、現在のフレーム内のあまりに多くのブロックが基準フレームの他のブロック202とかなり類似していない場合、画像プロセッサ120は、シーン変化が生じたと判別する)。シーン変化が生じた場合、画像プロセッサ120は、現在のフレームの任意のブロックの分散を基準フレームのブロック202の分散に基づかせる代わりに、現在のフレームの全てのブロックの分散を直接計算する。画像プロセッサ120が現在のフレームの全てのブロックの分散を直接計算する理由は、シーン変化の境界に亘って分散の誤差が広がるのを回避するためである。
いくつかの例では、相関関数、第1閾値、第2閾値及び第3閾値は、校正データとして画像プロセッサ120にハードコーディングされる。別の例では、何れか又は全ての校正データは、校正手順において校正システムによって決定される。一例では、校正システムは、機械学習技術を用いて校正データを決定する。一例では、校正システムは、プロセッサと、プロセッサによって実行される命令を記憶するメモリと、を含むコンピュータ等の標準的なコンピュータで実行されるソフトウェアであり、命令は、校正システムの動作をプロセッサに実行させる。別の例では、校正システムは、特定用途集積回路として具体化され、又は、本明細書に記載された動作を実行するための他の技術的に実現可能なシステムとすることができる。
機械学習技術の一例は、回帰分析である。図5は、回帰分析の一例を示すグラフ500である。校正システムは、校正データの相関関数を検出するように回帰分析を適用するために、1つ以上のトレーニングビデオを入力データとして受信する。校正システムは、各トレーニングビデオの各フレーム内の全てのブロックの分散を、(例えば、図3に関連して説明した式に従って)直接決定する。また、校正システムは、各ビデオのフレーム毎に何れの基準フレームを使用するかを決定する(一例では、任意のフレームの基準フレームは、直前のフレームである)。校正システムは、各フレームのブロック毎のコストを決定する。上述したように、任意の特定のフレームの任意の特定のブロックのコストは、基準フレームに関連している。次に、校正システムは、ブロック毎に「分散乗数」のセットを生成し、コストに対する分散乗算をプロットする。x軸上にプロットされた分散乗数は、フレーム内のブロックの実際の分散と、コストが計算された基準フレーム内の対応するブロックの実際の分散と、の間の乗算関係である。グラフ500は、分散乗数対コストの例示的なプロットであり、各データ点は、単一のブロックに対応しており、単一のブロックに関する分散倍数及びコストによって定義される。
校正システムは、このデータがプロットされた後に、曲線をプロットデータに当てはめる。結果として得られる曲線は、相関関数として機能する。換言すれば、データに当てはめられた曲線は、画像プロセッサ120によって相関関数として使用される。曲線をプロットデータに当てはめるための技術的に実現可能な技術(例えば、曲線をデータに当てはめるための任意の非線形回帰技術)を使用することができる。分散乗数をコストに相関させるための他の技術的に実現可能な機械学習技術を使用することができる。
第1閾値502は、上述したように、分散乗数が1に等しく設定される閾値である。第2閾値504は、これを超えると、予測された分散が、信頼できない予測された分散であると画像プロセッサ120によって判別される閾値である。(これらの閾値は、上記の第1閾値及び第2閾値である)。これらの閾値の各々は、画像プロセッサ120の動作における誤差の量を制限するように設定することができる。より具体的には、校正システムは、相関関数が決定された後に、第1閾値502及び第2閾値504を任意の値に設定し、上述した分散計算技術をテストデータに適用して、予測された分散値を取得し、(例えば、図3に関連して説明した式と同様に直接的な計算によって決定された)予測された分散値と実際の分散値との間の誤差を決定する。この誤差が、望ましくないとみなされる誤差率を上回る場合、校正システムは、第1閾値502をより低く設定するか、第2閾値504をより高く設定するか、第1閾値502をより低く設定することと第2閾値504をより高く設定することとの両方を行う。校正システムは、誤差が所望の割合になるかこれを下回るまで、この処理を繰り返す。同様に、いくつかの例では、第3閾値は、上述した分散計算技術を1つ以上のビデオに適用し、誤差割合を検出し、満足な誤差割合が達成されるまで第3閾値を変更することによって決定される。
いくつかの例では、画像プロセッサ120は、校正データの複数のセットを記憶し、各セットは、異なる「タイプ」のビデオ用に記憶され、「タイプ」は、ビデオのコンテンツのタイプを指す。いくつかの例示的なビデオタイプは、ネイチャービデオ、アクションムービー、ニュースビデオ、トークショービデオ等を含む。いくつかの例では、各ビデオは、タイプ識別子でタグ付けされており、これにより、画像プロセッサ120は、何れの校正データのセットを使用するかを決定することができる。
いくつかの例では、相関関数が使用されない。代わりに、動きベクトルによって示されるブロック202の分散は、現在のブロック402のコストに基づいて使用されるか、使用されないかの何れかである。換言すれば、相関関数が使用されるコスト値の範囲が縮小されて存在しなくなるように、第1閾値は第2閾値と等しい。動きベクトルによって示されるブロック202の分散が使用される場合には、コストが第1閾値及び第2閾値の何れかを下回っており、又は、画像プロセッサ120が現在のブロック402の分散を直接決定する場合には、コストが第1閾値及び第2閾値を上回っている。
図6は、一例による、「コスト」(基準フレームのブロックに対する類似度)に基づいて分散値を決定する方法600のフロー図である。図1〜図5に関連して示され説明されたシステムに関して説明するが、任意の技術的に実現可能な順序で方法を実行するように構成された任意のシステムが本開示の範囲内に含まれることを理解されたい。
方法600はステップ602で開始し、画像プロセッサ120は、現在のブロックに関する動きベクトル及びコストを決定する。一例では、画像プロセッサ120は、例えば、上述した動きベクトル技術を使用することによって、動きベクトルを直接決定する。より具体的には、画像プロセッサ120は、サーチエリアを識別し、サーチエリア内の基準フレーム内の全てのブロックを識別し、サーチエリア内の基準フレーム内の全てのブロックのコストを決定し、決定されたコストのうち最低コストを識別することによって、現在のブロックに関する動きベクトル及びコストを直接決定する。最低コストは、現在のブロックのコストであり、最低コストに関連する動きベクトルは、現在のブロックの動きベクトルである。動きベクトルを決定する別の例では、画像プロセッサ120は、画像圧縮、ビデオ分析等の異なる目的のために既に決定された動きベクトルを取得する。
ステップ604において、画像プロセッサ120は、ブロックのコストが第1閾値を下回るかどうかを判別する。第1閾値は、動きベクトルに関連するブロックが現在のブロックと十分に類似していると判別され、当該ブロックの分散を現在のブロックの分散として使用することができると判別されるレベルを下回るレベルを表している。したがって、コストが第1閾値を下回る場合、方法600はステップ606に進み、画像プロセッサ120は、決定された動きベクトルに関連するブロックの分散を、現在のブロックの分散として使用する。方法600は、ステップ606の後にステップ608に進む。
ステップ604において、コストが第1閾値を上回ると画像プロセッサ120が判別した場合、方法600はステップ610に進む。ステップ610において、画像プロセッサ120は、コストが第1閾値を上回るが第2閾値を下回るかどうかを判別する。第2閾値は、これを超えると、予測された分散が信頼できないものとみなされるレベルである(コストがあまりに高いため、コストに関連するブロックが現在のブロックとあまりにも異なっていることを意味する)。コストが第1閾値を上回るが第2閾値を下回る場合、方法600はステップ612に進み、画像プロセッサ120は、上述した相関関数を、動きベクトルによって示されるブロックの分散に適用して、現在のブロックの分散を取得する。方法600は、ステップ612の後にステップ608に進む。
ステップ610において、コストが第1閾値を上回るが第2閾値を下回ると画像プロセッサ120が判別しない場合には、コストが第2閾値を上回っており、方法はステップ614に進む。ステップ614において、画像プロセッサ120は、現在のブロックの予測された分散が信頼できないと判別し、図3に関連して上述した式等を用いて、現在のブロックの分散を直接決定する。方法は、ステップ614の後にステップ608に進む。
ステップ608において、画像プロセッサ120は、現在のフレーム内に分析するための別のブロックが存在するかどうかを判別する。別のブロックが存在する場合、方法600はステップ602に戻り、別のブロックが存在しない場合、方法600はステップ616に進む。ステップ616において、現在のフレームの全てのブロックが分析され、方法600は、信頼できない予測された分散を有するブロックの数が第3閾値を上回るかどうかを判別する。信頼できない予測された分散を有するブロックの数が第3閾値を上回る場合、方法600はステップ620に進み、信頼できない予測された分散を有するブロックの数が第3閾値を下回る場合、方法600はステップ618に進み、方法600は終了する。ステップ620において、画像プロセッサ120は、ステップ606又はステップ612の何れかで決定された分散の代わりに、現在のフレームの全てのブロックに関して直接決定された分散を使用する。方法は、ステップ620の後にステップ618に進む。
決定されたブロックの分散について多くの用途が存在する。1つの例は、ビデオ安定化である。ビデオ安定化の目的は、ビデオ内の不要なカメラモーションを除去することである。ビデオスタビライザ(一例では、画像プロセッサ120の一部である)は、ビデオ内のブロック202の動きベクトルを識別することによって、ビデオ内の不要なモーションが発生する方法を識別する。より具体的には、ビデオ安定化が実行される任意のフレームに対して、画像プロセッサ120は、フレーム内の様々なブロックの動きベクトルを決定する。動きベクトルは、基準フレームに対するカメラの推定された動きを示す。次に、画像プロセッサ120は、基準フレームに対するカメラの推定された動きに基づいて現在のフレームを変更することによって、現在のフレームを修正することができる。画像プロセッサ120は、カメラの推定された動きを決定する際に特定の動きベクトルを使用するが、他の動きベクトルを避ける。より具体的には、低い分散を有するブロック202は、かかるブロックの変化が一般的にノイズに支配されるので、不正確な動きベクトルの影響を受ける。このため、画像プロセッサ120は、決定されたブロック202の分散を使用して、何れの動きベクトルを無視するかを決定する。画像プロセッサ120は、任意の技術的に実現可能な方法(例えば、手動)で設定可能な特定の閾値を下回る分散を有するブロック202の動きベクトルを無視する。
別の例は、ビデオ又は画像のサイズ変更である。画像サイズ変更に関する1つの技術は、シームカービングである。(例えば、「コンテンツを意識した画像サイズの変更に関するシームカービング(Seam Carving for Content-Aware Image Resizing)」を参照されたい。)シームカービングは、重要ではないとみなされた画像の一部を除去する。いくつかの例では、ブロックは、ブロックの分散に基づいて重要ではないと判別される。低い分散を有するブロックは、重要ではないとみなされる。分散を使用することができる方法のさらに別の例は、非可逆ビデオ圧縮である。非可逆ビデオ圧縮では、低い分散を有するブロックは、より高い程度で又は非可逆的な方法で圧縮することができ、高い分散を有するブロックは、より少ない程度で又は可逆的な方法で圧縮することができる。
画像のブロックの分散を決定するために本明細書で説明した動作の一部又は全てと、分散を使用することができる方法に関して説明した動作の一部又は全てとは、画像プロセッサ120によって実行される。
本明細書で説明した技術は、ビデオのフレームの分散を決定するための有利な技術を提供する。より具体的には、本技術は、動きベクトルによって示された基準フレーム内のブロックの分散、又は、当該分散の変更されたバージョンの何れかを使用して、動きベクトルに基づいて分散を決定する。既存の分散を使用すると、分散の決定に必要な計算量を少なくし、分散の決定に必要な時間を短縮することができる。
画素ブロックの分散を決定する例示的な方法が提供される。この方法は、画素ブロックに関する動きベクトルを識別することを含み、動きベクトルは、基準フレームの第2画素ブロックに関連付けられている。また、この方法は、画素ブロックのコストを決定することを含み、コストは、画素ブロックと第2画素ブロックとの間の類似度を示す。さらに、この方法は、コストに基づいて画素ブロックの分散を決定することを含む。
一例では、コストに基づいて画素ブロックの分散を決定することは、コストが第1閾値を下回ることを判別することと、コストが第1閾値を下回ることを判別したことに応じて、画素ブロックの分散が基準フレームの第2画素ブロックの分散と等しいと判別することと、を含む。一例では、コストに基づいて画素ブロックの分散を決定することは、コストが第1閾値を上回るが第2閾値を下回ることを判別することと、コストが第1閾値を上回るが第2閾値を下回ることを判別したことに応じて、画素ブロックの分散が、基準フレームの第2画素ブロックの分散に相関係数を乗じたものと等しいと判別することと、を含む。
一例では、相関係数は、ビデオトレーニングデータに基づく相関関数に基づいている。一例では、コストに基づいて画素ブロックの分散を決定することは、コストが第1閾値及び第2閾値を上回ることを判別することと、コストが第1閾値及び第2閾値の両方を上回ることを判別したことに応じて、画素ブロックの画素に基づいて画素ブロックの分散を直接決定することと、を含む。
一例では、分散を決定することは、画素ブロックが存在する現在のフレームの所定数のブロックの全てのコストが第1閾値及び第2閾値の両方を上回ることを判別することと、所定数のブロックのコストが第1閾値及び第2閾値を上回ることを判別したことに応じて、各画素ブロックの画素値に基づいて、現在のフレームの全ての画素ブロックの分散を直接決定することと、を含む。
一例では、画素ブロックに関する動きベクトルを識別することは、サーチエリア内の基準フレームの画素ブロックを示す動きベクトル候補のセットを識別することと、サーチエリア内の基準フレームの各画素ブロックのコストを決定することと、決定されたコストのうち最低のコストを識別することと、決定されたコストのうち最低のコストに関連する動きベクトル候補を、画素ブロックに関する動きベクトルとして識別することと、を含む。一例では、各画素ブロックのコストを決定することは、平均絶対差法又は平均二乗誤差法を画素ブロックの画素に適用することを含む。一例では、基準フレームは、画素ブロックが存在する現在のフレームの前又は後のフレームを含む。
画素ブロックの分散を決定する例示的なコンピュータシステムが提供される。コンピュータシステムは、プロセッサと、プロセッサによって実行されると、プロセッサにステップを実行させる命令を記憶するメモリと、を備える。ステップは、画素ブロックに関する動きベクトルを識別することを含み、動きベクトルは、基準フレームの第2画素ブロックに関連付けられている。また、ステップは、画素ブロックのコストを決定することを含み、コストは、画素ブロックと第2画素ブロックとの間の類似度を示す。さらに、ステップは、コストに基づいて画素ブロックの分散を決定することを含む。
一例では、コストに基づいて画素ブロックの分散を決定することは、コストが第1閾値を下回ることを判別することと、コストが第1閾値を下回ることを判別したことに応じて、画素ブロックの分散が基準フレームの第2画素ブロックの分散と等しいと判別することと、を含む。一例では、コストに基づいて画素ブロックの分散を決定することは、コストが第1閾値を上回るが第2閾値を下回ることを判別することと、コストが第1閾値を上回るが第2閾値を下回ることを判別したことに応じて、画素ブロックの分散が、基準フレームの第2画素ブロックの分散に相関係数を乗じたものと等しいと判別することと、を含む。
一例では、相関係数は、ビデオトレーニングデータに基づく相関関数に基づいている。一例では、コストに基づいて画素ブロックの分散を決定することは、コストが第1閾値及び第2閾値を上回ることを判別することと、コストが第1閾値及び第2閾値の両方を上回ることを判別したことに応じて、画素ブロックの画素に基づいて画素ブロックの分散を直接決定することと、を含む。
一例では、分散を決定することは、画素ブロックが存在する現在のフレームの所定数のブロックの全てのコストが第1閾値及び第2閾値の両方を上回ることを判別することと、所定数のブロックのコストが第1閾値及び第2閾値を上回ることを判別したことに応じて、各画素ブロックの画素値に基づいて、現在のフレームの全ての画素ブロックの分散を直接決定することと、を含む。
一例では、画素ブロックに関する動きベクトルを識別することは、サーチエリア内の基準フレームの画素ブロックを示す動きベクトル候補のセットを識別することと、サーチエリア内の基準フレームの各画素ブロックのコストを決定することと、決定されたコストのうち最低のコストを識別することと、決定されたコストのうち最低のコストに関連する動きベクトル候補を、画素ブロックに関する動きベクトルとして識別することと、を含む。一例では、各画素ブロックのコストを決定することは、平均絶対差法又は平均二乗誤差法を画素ブロックの画素に適用することを含む。一例では、基準フレームは、画素ブロックが存在する現在のフレームの前又は後のフレームを含む。
プロセッサによって実行されると、プロセッサに、画素ブロックの分散を決定する方法を実行させる命令を記憶する非一時的なコンピュータ可読記憶媒体が提供される。この方法は、画素ブロックに関する動きベクトルを識別することを含み、動きベクトルは、基準フレームの第2画素ブロックに関連付けられている。また、この方法は、画素ブロックのコストを決定することを含み、コストは、画素ブロックと第2画素ブロックとの間の類似度を示す。さらに、この方法は、コストに基づいて画素ブロックの分散を決定することを含む。
一例では、コストに基づいて画素ブロックの分散を決定することは、コストが第1閾値を下回ることを判別することと、コストが第1閾値を下回ることを判別したことに応じて、画素ブロックの分散が基準フレームの第2画素ブロックの分散と等しいと判別することと、を含む。一例では、コストに基づいて画素ブロックの分散を決定することは、コストが第1閾値を上回るが第2閾値を下回ることを判別することと、コストが第1閾値を上回るが第2閾値を下回ることを判別したことに応じて、画素ブロックの分散が、基準フレームの第2画素ブロックの分散に相関係数を乗じたものと等しいと判別することと、を含む。
一例では、相関係数は、ビデオトレーニングデータに基づく相関関数に基づいている。一例では、コストに基づいて画素ブロックの分散を決定することは、コストが第1閾値及び第2閾値を上回ることを判別することと、コストが第1閾値及び第2閾値の両方を上回ることを判別したことに応じて、画素ブロックの画素に基づいて画素ブロックの分散を直接決定することと、を含む。
一例では、分散を決定することは、画素ブロックが存在する現在のフレームの所定数のブロックの全てのコストが第1閾値及び第2閾値の両方を上回ることを判別することと、所定数のブロックのコストが第1閾値及び第2閾値を上回ること判別したことに応じて、各画素ブロックの画素値に基づいて、現在のフレームの全ての画素ブロックの分散を直接決定することと、を含む。
一例では、画素ブロックに関する動きベクトルを識別することは、サーチエリア内の基準フレームの画素ブロックを示す動きベクトル候補のセットを識別することと、サーチエリア内の基準フレームの各画素ブロックのコストを決定することと、決定されたコストのうち最低のコストを識別することと、決定されたコストのうち最低のコストに関連する動きベクトル候補を、画素ブロックに関する動きベクトルとして識別することと、を含む。一例では、各画素のコストを決定することは、平均絶対差法又は平均二乗誤差法を画素ブロックの画素に適用することを含む。一例では、基準フレームは、画素ブロックが存在する現在のフレームの前又は後のフレームを含む。
本明細書における開示に基づいて多くの変形が可能であることを理解されたい。上記では、特徴及び要素が特定の組み合わせで説明されているが、各特徴又は要素は、他の特徴及び要素無しに単独で使用されてもよいし、他の特徴及び要素を伴って又は伴わずに様々な組み合わせで使用されてもよい。
提供された方法は、汎用コンピュータ、プロセッサ又はプロセッサコアで実施されてもよい。適切なプロセッサには、例として、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ(DSP)、複数のマイクロプロセッサ、DSPコアに関連する1つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)回路、他のタイプの集積回路(IC)、及び/又は、ステートマシンが含まれる。このようなプロセッサは、処理されたハードウェア記述言語(HDL)命令(このような命令は、コンピュータ可読媒体に記憶することが可能である)の結果及びネットリストを含む他の中間データを用いて製造プロセスを構成することによって製造され得る。このようなプロセスの結果は、実施形態の形態を実施するプロセッサを製造するために半導体製造プロセスにおいて使用されるマスクワークであってもよい。
本明細書で提供された方法又はフローチャートは、汎用コンピュータ又はプロセッサによる実行のために非一時的なコンピュータ可読記憶媒体に組み込まれたコンピュータプログラム、ソフトウェア又はファームウェアで実施されてもよい。非一時的なコンピュータ可読記憶媒体の例には、例えば読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスク、リムーバブルディスク等の磁気媒体、光磁気記憶媒体、例えばCD−ROMディスク及びデジタル多用途ディスク(DVD)等の光学媒体が含まれる。

Claims (20)

  1. 画素ブロックの分散を決定する方法であって、
    前記画素ブロックに関する動きベクトルを識別することであって、前記動きベクトルは、基準フレームの第2画素ブロックに関連付けられている、ことと、
    前記画素ブロックのコストを決定することであって、前記コストは、前記画素ブロックと前記第2画素ブロックとの間の類似度を示す、ことと、
    前記コストに基づいて前記画素ブロックの分散を決定することと、を含む、
    方法。
  2. 前記コストに基づいて前記画素ブロックの分散を決定することは、
    前記コストが第1閾値を下回ることを判別することと、
    前記コストが前記第1閾値を下回ることを判別したことに応じて、前記画素ブロックの分散が前記基準フレームの前記第2画素ブロックの分散と等しいと判別することと、を含む、
    請求項1の方法。
  3. 前記コストに基づいて前記画素ブロックの分散を決定することは、
    前記コストが第1閾値を上回るが第2閾値を下回ることを判別することと、
    前記コストが前記第1閾値を上回るが前記第2閾値を下回ることを判別したことに応じて、前記画素ブロックの分散が、前記基準フレームの前記第2画素ブロックの分散に相関係数を乗じたものと等しいと判別することと、を含む、
    請求項1の方法。
  4. 前記相関係数は、ビデオトレーニングデータに基づく相関関数に基づいている、
    請求項3の方法。
  5. 前記コストに基づいて前記画素ブロックの分散を決定することは、
    前記コストが第1閾値及び第2閾値を上回ることを判別することと、
    前記コストが前記第1閾値及び前記第2閾値の両方を上回ることを判別したことに応じて、前記画素ブロックの画素に基づいて前記画素ブロックの分散を直接決定することと、を含む、
    請求項1の方法。
  6. 前記分散を決定することは、
    前記画素ブロックが存在する現在のフレームの所定数のブロックの全てのコストが第1閾値及び第2閾値の両方を上回ることを判別することと、
    前記所定数のブロックのコストが前記第1閾値及び前記第2閾値を上回ることを判別したことに応じて、各画素ブロックの画素値に基づいて、前記現在のフレームの全ての画素ブロックの分散を直接決定することと、を含む、
    請求項1の方法。
  7. 前記画素ブロックに関する前記動きベクトルを識別することは、
    サーチエリア内の前記基準フレームの画素ブロックを示す動きベクトル候補のセットを識別することと、
    前記サーチエリア内の前記基準フレームの各画素ブロックのコストを決定することと、
    決定されたコストのうち最低のコストを識別することと、
    前記決定されたコストのうち最低のコストに関連する前記動きベクトル候補を、前記画素ブロックに関する前記動きベクトルとして識別することと、を含む、
    請求項1の方法。
  8. 前記各画素ブロックのコストを決定することは、
    平均絶対差法又は平均二乗誤差法を前記画素ブロックの画素に適用することを含む、
    請求項7の方法。
  9. 前記基準フレームは、前記画素ブロックが存在する現在のフレームの前又は後のフレームを含む、
    請求項1の方法。
  10. 画素ブロックの分散を決定するコンピュータシステムであって、
    プロセッサと、
    前記プロセッサによって実行されると、前記プロセッサにステップを実行させる命令を記憶するメモリと、を備え、
    前記ステップは、
    前記画素ブロックに関する動きベクトルを識別することであって、前記動きベクトルは、基準フレームの第2画素ブロックに関連付けられている、ことと、
    前記画素ブロックのコストを決定することであって、前記コストは、前記画素ブロックと前記第2画素ブロックとの間の類似度を示す、ことと、
    前記コストに基づいて前記画素ブロックの分散を決定することと、を含む、
    コンピュータシステム。
  11. 前記コストに基づいて前記画素ブロックの分散を決定することは、
    前記コストが第1閾値を下回ることを判別することと、
    前記コストが前記第1閾値を下回ることを判別したことに応じて、前記画素ブロックの分散が前記基準フレームの前記第2画素ブロックの分散と等しいと判別することと、を含む、
    請求項10のコンピュータシステム。
  12. 前記コストに基づいて前記画素ブロックの分散を決定することは、
    前記コストが第1閾値を上回るが第2閾値を下回ると判別することと、
    前記コストが前記第1閾値を上回るが前記第2閾値を下回ることを判別したことに応じて、前記画素ブロックの分散が、前記基準フレームの前記第2画素ブロックの分散に相関係数を乗じたものと等しいと判別することと、を含む、
    請求項10のコンピュータシステム。
  13. 前記相関係数は、ビデオトレーニングデータに基づく相関関数に基づいている、
    請求項12のコンピュータシステム。
  14. 前記コストに基づいて前記画素ブロックの分散を決定することは、
    前記コストが第1閾値及び第2閾値を上回ることを判別することと、
    前記コストが前記第1閾値及び前記第2閾値の両方を上回ることを判別したことに応じて、前記画素ブロックの画素に基づいて前記画素ブロックの分散を直接決定することと、を含む、
    請求項10のコンピュータシステム。
  15. 前記分散を決定することは、
    前記画素ブロックが存在する現在のフレームの所定数のブロックの全てのコストが第1閾値及び第2閾値の両方を上回ることを判別することと、
    前記所定数のブロックのコストが前記第1閾値及び前記第2閾値を上回ることを判別したことに応じて、各画素ブロックの画素値に基づいて、前記現在のフレームの全ての画素ブロックの分散を直接決定することと、を含む、
    請求項10のコンピュータシステム。
  16. 前記画素ブロックに関する前記動きベクトルを識別することは、
    サーチエリア内の前記基準フレームの画素ブロックを示す動きベクトル候補のセットを識別することと、
    前記サーチエリア内の前記基準フレームの各画素ブロックのコストを決定することと、
    決定されたコストのうち最低のコストを識別することと、
    前記決定されたコストのうち最低のコストに関連する前記動きベクトル候補を、前記画素ブロックに関する前記動きベクトルとして識別することと、を含む、
    請求項10のコンピュータシステム。
  17. 前記各画素ブロックのコストを決定することは、
    平均絶対差法又は平均二乗誤差法を前記画素ブロックの画素に適用することを含む、
    請求項16のコンピュータシステム。
  18. 前記基準フレームは、前記画素ブロックが存在する現在のフレームの前又は後のフレームを含む、
    請求項10のコンピュータシステム。
  19. プロセッサによって実行されると、前記プロセッサに、画素ブロックの分散を決定する方法を実行させる命令を記憶するコンピュータ可読記憶媒体であって、
    前記方法は、
    前記画素ブロックに関する動きベクトルを識別することであって、前記動きベクトルは、基準フレームの第2画素ブロックに関連付けられている、ことと、
    前記画素ブロックのコストを決定することであって、前記コストは、前記画素ブロックと前記第2画素ブロックとの間の類似度を示す、ことと、
    前記コストに基づいて前記画素ブロックの分散を決定することと、を含む、
    コンピュータ可読記憶媒体。
  20. 前記コストに基づいて前記画素ブロックの分散を決定することは、
    前記コストが第1閾値を下回ることを判別することと、
    前記コストが前記第1閾値を下回ることを判別したことに応じて、前記画素ブロックの分散が前記基準フレームの前記第2画素ブロックの分散と等しいと判別することと、を含む、
    請求項19のコンピュータ可読記憶媒体。
JP2019517385A 2016-10-13 2017-09-19 画像のブロックの動きベクトルに基づく当該ブロックの分散の決定 Active JP7150706B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/292,757 US10291931B2 (en) 2016-10-13 2016-10-13 Determining variance of a block of an image based on a motion vector for the block
US15/292,757 2016-10-13
PCT/CA2017/051103 WO2018068129A1 (en) 2016-10-13 2017-09-19 Determining variance of a block of an image based on a motion vector for the block

Publications (2)

Publication Number Publication Date
JP2020500448A true JP2020500448A (ja) 2020-01-09
JP7150706B2 JP7150706B2 (ja) 2022-10-11

Family

ID=61904265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019517385A Active JP7150706B2 (ja) 2016-10-13 2017-09-19 画像のブロックの動きベクトルに基づく当該ブロックの分散の決定

Country Status (6)

Country Link
US (2) US10291931B2 (ja)
EP (1) EP3526767A4 (ja)
JP (1) JP7150706B2 (ja)
KR (1) KR102500265B1 (ja)
CN (1) CN109791695B (ja)
WO (1) WO2018068129A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10992938B2 (en) * 2018-09-28 2021-04-27 Ati Technologies Ulc Spatial block-level pixel activity extraction optimization leveraging motion vectors
US10924739B2 (en) 2018-10-31 2021-02-16 Ati Technologies Ulc Efficient quantization parameter prediction method for low latency video coding
US11368692B2 (en) 2018-10-31 2022-06-21 Ati Technologies Ulc Content adaptive quantization strength and bitrate modeling
US11234004B2 (en) 2018-12-03 2022-01-25 Ati Technologies Ulc Block type prediction leveraging block-based pixel activities
US10972752B2 (en) 2018-12-05 2021-04-06 Advanced Micro Devices, Inc. Stereoscopic interleaved compression
US10951892B2 (en) 2019-01-31 2021-03-16 Advanced Micro Devices, Inc. Block level rate control
US11100889B2 (en) 2019-02-28 2021-08-24 Ati Technologies Ulc Reducing 3D lookup table interpolation error while minimizing on-chip storage
US11106039B2 (en) 2019-08-26 2021-08-31 Ati Technologies Ulc Single-stream foveal display transport
US11307655B2 (en) 2019-09-19 2022-04-19 Ati Technologies Ulc Multi-stream foveal display transport
US11875516B2 (en) 2020-12-28 2024-01-16 Waymo Llc Systems, apparatus, and methods for retrieving image data of image frames
WO2024018166A1 (en) * 2022-07-22 2024-01-25 Blackbird Plc Computer-implemented methods of blurring a digital image; computer terminals and computer program products

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10191360A (ja) * 1996-08-22 1998-07-21 Cirrus Logic Inc 動き推定ベクトルを求める方法および動き推定ベクトルを用いて動画像データを圧縮する方法
JP2007228519A (ja) * 2006-02-27 2007-09-06 Renesas Technology Corp 画像符号化装置及び画像符号化方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI103003B1 (fi) * 1997-06-13 1999-03-31 Nokia Mobile Phones Ltd Suodatusmenetelmä, suodatin ja matkaviestinpääte
US6591015B1 (en) 1998-07-29 2003-07-08 Matsushita Electric Industrial Co., Ltd. Video coding method and apparatus with motion compensation and motion vector estimator
US6529634B1 (en) 1999-11-08 2003-03-04 Qualcomm, Inc. Contrast sensitive variance based adaptive block size DCT image compression
CN1181691C (zh) * 2003-01-24 2004-12-22 杭州国芯科技有限公司 视频运动估计方法
US20050047504A1 (en) * 2003-09-03 2005-03-03 Sung Chih-Ta Star Data stream encoding method and apparatus for digital video compression
KR100621005B1 (ko) * 2003-12-24 2006-09-08 엘지전자 주식회사 영상 오류 복구장치 및 방법
JP5045320B2 (ja) * 2007-09-05 2012-10-10 ソニー株式会社 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP5453304B2 (ja) * 2007-12-20 2014-03-26 クゥアルコム・インコーポレイテッド 適応探索範囲を用いた動き推定
JP5251637B2 (ja) * 2009-03-16 2013-07-31 株式会社リコー ノイズ低減装置、ノイズ低減方法、ノイズ低減プログラム、記録媒体
US8411750B2 (en) 2009-10-30 2013-04-02 Qualcomm Incorporated Global motion parameter estimation using block-based motion vectors
CN102215386B (zh) * 2010-04-09 2013-03-27 华为技术有限公司 视频图像块处理方法及装置
US20110289128A1 (en) * 2010-05-24 2011-11-24 Chih-Ta Star Sung Method of performing discrete cosine transform
SG10201506682SA (en) * 2010-09-30 2015-10-29 Mitsubishi Electric Corp Moving image encoding device, moving image decoding device, moving image coding method, and moving image decoding method
WO2014058796A1 (en) * 2012-10-08 2014-04-17 Google Inc Method and apparatus for video coding using reference motion vectors
US9426475B2 (en) * 2013-06-25 2016-08-23 VIXS Sytems Inc. Scene change detection using sum of variance and estimated picture encoding cost
CN105450973A (zh) * 2014-09-29 2016-03-30 华为技术有限公司 一种视频图像的获取方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10191360A (ja) * 1996-08-22 1998-07-21 Cirrus Logic Inc 動き推定ベクトルを求める方法および動き推定ベクトルを用いて動画像データを圧縮する方法
JP2007228519A (ja) * 2006-02-27 2007-09-06 Renesas Technology Corp 画像符号化装置及び画像符号化方法

Also Published As

Publication number Publication date
WO2018068129A1 (en) 2018-04-19
JP7150706B2 (ja) 2022-10-11
CN109791695A (zh) 2019-05-21
EP3526767A1 (en) 2019-08-21
EP3526767A4 (en) 2020-06-17
US10291931B2 (en) 2019-05-14
CN109791695B (zh) 2023-06-20
KR102500265B1 (ko) 2023-02-15
KR20190060774A (ko) 2019-06-03
US20180109804A1 (en) 2018-04-19
US11445214B2 (en) 2022-09-13
US20190238884A1 (en) 2019-08-01

Similar Documents

Publication Publication Date Title
JP7150706B2 (ja) 画像のブロックの動きベクトルに基づく当該ブロックの分散の決定
US10438361B2 (en) Image processing apparatus and image processing method for finding background regions in an image
US11113795B2 (en) Image edge processing method, electronic device, and computer readable storage medium
US9418319B2 (en) Object detection using cascaded convolutional neural networks
JP7078139B2 (ja) ビデオ安定化方法及び装置、並びに非一時的コンピュータ可読媒体
RU2603529C2 (ru) Уменьшение шума в последовательностях изображений
WO2018068300A1 (zh) 图像处理方法和装置
KR102274320B1 (ko) 영상 처리 방법 및 장치
US10122912B2 (en) Device and method for detecting regions in an image
KR20150043145A (ko) 피사체 추적 기법을 이용한 카메라와 피사체 사이의 거리 변화 측정방법 상기 방법을 기록한 컴퓨터 판독 가능 저장매체 및 거리 변화 측정 장치.
WO2015186347A1 (ja) 検出システム、検出方法及びプログラム記憶媒体
JP2020504383A (ja) 画像前景の検出装置、検出方法及び電子機器
KR101662407B1 (ko) 영상의 비네팅 보정 방법 및 장치
JP6771134B2 (ja) 画像補正方法及び画像補正装置
KR102413043B1 (ko) 영상 컨텐츠의 샷 분할 방법 및 장치
JP6388507B2 (ja) 画像処理装置
KR101592087B1 (ko) 배경 영상의 위치를 이용한 관심맵 생성 방법 및 이를 기록한 기록 매체
JP5983033B2 (ja) 位置関係判定プログラム、位置関係判定方法および位置関係判定装置
KR101878817B1 (ko) 영상 개선 방법 및 그 장치
KR101775272B1 (ko) 멀티 애퍼처 카메라에서 스파스 깊이 이미지들의 깊이 개선 방법 및 시스템
KR20190027435A (ko) 평면모델링을 통한 깊이 영상 부호화에서 움직임 추정 방법 및 장치와 비일시적 컴퓨터 판독가능 기록매체
CN104112266A (zh) 一种图像边缘虚化的检测方法和装置
KR101187481B1 (ko) 영상 인식 기반 인터페이스를 위한 손 색상 추출 방법 및 장치와 이를 이용한 영상 인식 기반 인터페이스 장치
JP6743633B2 (ja) コンピュータプログラム、動体検出方法及び動体検出装置
WO2015098527A1 (ja) 検出装置、検出対象物の検出方法及び制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200917

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220823

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220920

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220928

R150 Certificate of patent or registration of utility model

Ref document number: 7150706

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150