JP2020099042A - 複数のイメージフレームをイントラリフレッシュエンコーディングする方法 - Google Patents

複数のイメージフレームをイントラリフレッシュエンコーディングする方法 Download PDF

Info

Publication number
JP2020099042A
JP2020099042A JP2019205334A JP2019205334A JP2020099042A JP 2020099042 A JP2020099042 A JP 2020099042A JP 2019205334 A JP2019205334 A JP 2019205334A JP 2019205334 A JP2019205334 A JP 2019205334A JP 2020099042 A JP2020099042 A JP 2020099042A
Authority
JP
Japan
Prior art keywords
intra
encoding
image frame
level
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019205334A
Other languages
English (en)
Other versions
JP6900452B2 (ja
Inventor
ヴィクトル エドパルム,
Edpalm Viktor
ヴィクトル エドパルム,
マヤ シャー,
Shah Maya
マヤ シャー,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Axis AB
Original Assignee
Axis AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axis AB filed Critical Axis AB
Publication of JP2020099042A publication Critical patent/JP2020099042A/ja
Application granted granted Critical
Publication of JP6900452B2 publication Critical patent/JP6900452B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/583Motion compensation with overlapping blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】定期的なイントラリフレッシュを使用してのビデオエンコーディングにおいて、イメージフレーム間に、そのイメージフレーム内のモーションに基づいて、イントラエンコーディング領域のパディングを適応させる方法を提供する。【解決手段】方法は、現在のモーションレベルを受信しS02、イントラエンコーディング領域を判定しS04、現在のモーションレベルが閾値を超えているか判定しS06Yes、イントラエンコーディング領域を拡大するS08。現在のモーションレベルが閾値を超えていなければS10No、モーションベクトル検索範囲を調整しS12、イントラエンコーディング領域をイントラエンコーディングしS14、残りのイメージフレームをインターフレームエンコーディングするS16。【選択図】図6

Description

本発明は、定期的なイントラリフレッシュを使用してのビデオエンコーディング、及び、具体的には、イメージフレーム間に、そのイメージフレーム内のモーションに基づいて、イントラエンコーディング領域のパディングを適応させることができる方法及びエンコーダに関する。
H.264エンコーディング(及び、同様の標準類)に共通の問題は、Iフレームのビットレートスパイクである。この問題はしばしば、監視カメラに悪影響をおよぼす。なぜなら、非常に多くのカメラが同じネットワーク上に存在することがあり、通常の監視シーンは、IフレームとPフレームとの間に、非常に大きな(x10〜x100)サイズ比を有するためである。理想的には、このネットワークには、一定のビットレートが好ましい。
カメラに対するビットレートスパイクを減らす1つのソリューションは、複数のイメージフレーム全体にIフレームを広げること、及び、その代わりに、Iブロックとして、強制的にエンコードされる各イメージフレームの一部(イントラリフレッシュ領域)を有することである。イントラリフレッシュ領域は、一式のイメージフレーム全体の各イメージフレームにわたって動かされ、したがってイメージを「リフレッシング」する。この方法は、定期的なイントラリフレッシュ、又は単にイントラリフレッシュと呼ばれる。
しかし、この方法には、望ましくないビットレートペナルティが伴う。このため、イントラリフレッシュは、ブロックマッチングアルゴリズムが依然として良好に機能できるよう、例えば、撮像したシーン内のモーションに起因する、又は、シーンを撮像しているカメラのムーブメントによる、イメージフレームのイメージデータ内のムーブメントに適応される、イントラリフレッシュ領域のアップデートパターンを必要とする。これは同様に、多くの場合において、イメージフレームの不必要な一部が、Iブロックとして強制的にエンコードされることを意味する。
したがって、このコンテキストにおける改善の必要がある。
上記を鑑み、本発明の目的はしたがって、上記の問題の少なくともいくつかを克服する、又は、軽減することである。特に、本発明の目的は、イメージフレームに関連付けられたモーションのレベルに基づいて、イントラエンコードされるべきイメージフレームの領域のサイズを動的に選択する方法、デバイス、ソフトウェア、及びシステムを提供することである。
本発明の第1の態様によると、ビデオストリームの複数のイメージフレームをイントラリフレッシュエンコーディングする方法が提供される。ここでは、イントラリフレッシュエンコーディングは、イントラエンコードされるべき、イメージフレームの領域を定める、あらかじめ定められた定期的なイントラリフレッシュパターンに基づいている。この方法は、それらイメージフレームのそれぞれに対して、
・ このイメージフレームに関連付けられた、現在のモーションのレベルであって、ビデオストリームの、以前にエンコードされたイメージフレームのイメージデータに比較して、イメージフレームのイメージデータの一部がどれほど大きく変わったかを推定する、現在のモーションのレベルを受信することと、
・ イメージフレームのイントラエンコーディング領域を、あらかじめ定められた定期的なイントラリフレッシュパターンにしたがって判定することと、
を含む。
現在のモーションのレベルが、第1の閾値を超えていない場合、この方法は、
・ イメージフレームのイントラエンコーディング領域をイントラエンコーディングすることと、
・ 残りのイメージフレームをインターフレームエンコーディングすることと、
を含む。
現在のモーションのレベルが、第1の閾値を超えている場合、この方法は、
・ イメージフレームのイントラエンコーディング領域を拡大し、複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、判定した程度に重ね合わせることと、
・ イメージフレームの、拡大したイントラエンコーディング領域をイントラエンコーディングすることと、
・ 残りのイメージフレームをインターフレームエンコーディングすることと、
を含む。
「インターフレームエンコーディング」とは一般的に、残りのイメージフレーム、すなわち、強制的にイントラエンコードされず、Pフレーム又はBフレームとしてエンコードされる部分を意味する。これは同様に、残りのフレームのマクロブロックが、インターエンコードされるか、又はイントラエンコードされるかのいずれの、例えば、ブロックマッチングの結果、残りのもののサイズ、などに依存する、エンコーダ次第にて行う決定を意味する。
「定期的なイントラリフレッシュパターン」とは一般的に、強制的にイントラエンコードされるべき、すなわち、Iブロックとしてエンコードされるべきイメージフレームの領域/部位/マクロブロック(単一又は複数)を定める周期的なパターンを意味する。パターンが定期的/周期的であるとは、すべてのn数のイメージフレームに対して、そのパターンを繰り返すことを意味する。
現在のモーションのレベルが受信される。これは、ビデオストリームの、以前にエンコードされたイメージフレームのイメージデータに比較して、イメージフレームのイメージデータの一部がどれほど大きく変わったかを推定する。以前にエンコードされたイメージフレームは、ビデオストリームの、時間的に先行するイメージフレーム、又は、ビデオストリームの、時間的に後続のイメージフレーム(すなわち、Bフレームエンコーディングの場合)であってよい。モーションレベルは、本実施形態を実装するエンコーダに接続された別のユニットにより計算されてよく、又は、エンコーダにより計算されてよい。モーションレベルは、いずれの適切な方法にて、例えば、エンコードされるイメージフレームのイメージデータを、ビデオストリーム内の先行するフレームのイメージデータと比較することにより、判定されてよい。いくつかの実施形態では、モーションレベルは、以前にエンコードされたイメージフレームに対して判定される/計算される。そのモーションレベルは、現在のモーションのレベル、すなわち、エンコードされるイメージフレームに対するモーションのレベルの推定として使用される。好適には、これは、例えば、第2、第3、第5、などのすべてのイメージフレームに対するモーションレベルを判定することのみを可能にする。これは、計算の複雑さを軽減する。そのような実施形態はまた、ビデオストリームの複数のイメージフレームをエンコーディングする分散型アーキテクチャを促進する。なぜなら、モーションの検出が個別に、すなわち、別のプロセッサを使用して行われ得るからである。モーションのレベルが続いてエンコーダに送信され、エンコードされるイメージフレームに対する、モーションのレベルの推定として使用されてよい。したがって、エンコーディングの際に推定としてその後に使用されるモーションのレベルは、イメージフレームに対して判定される必要がないことに留意すべきである。いくつかの実施形態では、モーションのレベルは、例えば、エンコードされるフレームに先行するフレームに対して判定される。しかし、そのような方策は依然として、エンコードされるフレームの、モーションのレベルに対する、良好な推定(最良の予想)であり得る。
本発明は、イントラリフレッシュパディングに対するペナルティ(すなわち、ビデオストリーム内の連続するイメージフレームの間にイントラリフレッシュ領域を重ね合わせることに関連するビットレートペナルティ)が、画素のブロックをインターフレームエンコーディングするためのビットレートコストに比較しての、画素のブロック(Iブロック)をイントラエンコーディングするためのビットレートコストの比に関連することの認識に基づいている。これは同様に、モーションレベルに関連する。重ね合わせは、イメージ内のモーションの場合に、特定のイメージコンテントを有するインターブロックが、同じ又は同様のイメージコンテントを有する以前のイメージフレーム内のイントラブロックに参照され得る可能性を増すために必要であってよい。しかし、イントラブロックをエンコーディングするための、ビットレートでのコストは、インターブロックをエンコーディングするためのコストより高い。このことから、発明者達は、イントラリフレッシュパディングの最適なレベル(すなわち、ビデオストリーム内のイメージフレーム間の、イントラエンコーディング領域間の重ね合わせ)を動的に選択することにより、ビットレートペナルティが最小化され得ることを認識した。換言すると、イメージフレームのシーケンス内のイントラリフレッシュ領域の範囲は、例えば、描かれたシーン内のモーションのレベルにより、及び/又は、ビデオ撮像デバイスの視界の調整(ビデオ撮像デバイスのパン、及び/又は、チルト、及び/又は、ズーム調整)により、イメージデータ内のモーションのレベルに基づいて、動的に調整される。
その結果として、現在のモーションレベルが低い(すなわち、第1の閾値未満の)場合に、判定されたイントラエンコーディング領域(例えば、イメージフレームのスライス又はタイル、又は、イメージフレーム全体に広がる複数のマクロブロック、又は、いずれの他の適切な構成)はそのまま、すなわち、あらかじめ定められた定期的なイントラリフレッシュパターンに定められるように使用される。判定されたイントラエンコーディング領域のマクロブロックのエンコーディングは、強制的にIブロックとなる。イメージフレームの残りの部分は、上記に定められるようにインターフレームエンコードされる。現在のモーションのレベルが低いため、イメージフレームの残りの部分のマクロブロックの大半は、イメージフレーム間のイントラリフレッシュパディングが減らされた/移動されたとしても、インターブロックとしてエンコードされる。
しかし、現在のモーションのレベルが、モーションレベル閾値を超えている場合、イントラエンコーディング領域は、判定された(あらかじめ定められた)程度に拡大される。これは、現在のモーションレベルがそれほど高くなく、重ね合わせが生じない、又は、少量の重ね合せが生じる場合に比較して、イントラエンコーディング領域が、複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と重なり合う(又は、さらに重なり合う)ことを意味する。イメージフレームの残りの部分は、上記に定められるようにインターフレームエンコードされる。この場合にパディングが増えるため、イメージフレームの残りの部分のマクロブロックの大半が、インターブロックとしてエンコードされる。しかし、イントラエンコーディング領域が拡大するため、イントラリフレッシュ領域に対するビットレートコストが増える。
ビデオストリームの、以前にエンコードされたイメージフレームのイメージデータに比較して、イメージフレームのイメージデータの一部がどれほど大きく変わったかの推定として、現在のモーションレベルを定めることにより、この方策は、イントラリフレッシュパディングの程度を判定することに好適に使用され得る。なぜなら、この推定は、パディングが使用されなかった、又は少量のパディングが使用された場合に、イントラブロックとなるであろう、イメージフレームのインターフレームエンコードされた部分のマクロブロックがどれほどであるかを推定することに使用され得るからである。モーションによる、余剰イントラブロックに対する、推定したコストは、イメージフレームのより広い部分を、イントラリフレッシュ領域としてエンコーディングする、すなわち、パディングを増やす(すなわち、イントラリフレッシュ領域を拡大する)ためのコストに対して重み付けされ得る。
いくつかの実施形態によると、複数のイメージフレームについて、あらかじめ定められた定期的なイントラリフレッシュパターン内の領域は重ならない。その結果として、現在のモーションのレベルが、第1の閾値未満の場合、イメージフレームのイントラエンコーディング領域の間にパディングはなくなり、複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域が採用される。好適には、これは、イントラリフレッシュエンコーディングに対するビットレートペナルティを減らし得る。
いくつかの実施形態によると、イメージフレームのイントラエンコーディング領域を拡大するステップは、イメージフレームのイントラエンコーディング領域を拡大し、ビデオストリーム内の、直前に参照されたイメージフレームのイントラエンコーディング領域と重ね合わせることを含む。リファレンスイメージフレームとは、そのイメージデータが、現在エンコードされているイメージフレームの、インターエンコードされたマクロブロックのイメージデータを定めるために使用されるイメージフレームを意味する。その結果として、エンコーディング効率が向上し得る。他の実施形態では、時間的な方向の双方への複数のリファレンス、例えば、1つは以後のリファレンスフレーム、そしてもう1つは以前のリファレンスフレーム、又は、長期リファレンスフレーム及び直前のリファレンスフレームを伴うもの、若しくは、2つの先行するフレームを混合したいくつかを伴うもの、を可能にする写真グループ(group of pictures又はGOP)構造が採用される。これらの場合では、イメージフレームのイントラエンコーディング領域の拡大がしたがって行われるべきである。
いくつかの実施形態によると、この方法は、
現在のモーションのレベルが、第2の閾値であって、第1の閾値より大きい第2の閾値を超えている場合、イメージフレームのイントラエンコーディング領域を拡大し、複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、第1の程度に重ね合わせることと、
現在のモーションのレベルが、第2の閾値を超えていない場合、イメージフレームのイントラエンコーディング領域を拡大し、複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、第2の程度であって、第1の程度の方が大きい第2の程度に重ね合わせることと、
のステップをさらに含む。
この実施形態では、少なくとも3つのレベルのイントラリフレッシュパディングが使用される。いくつかの実施形態では、第1の程度は、最大のパディングを表す。これは、現在のモーションのレベルが大きくなっても、さらなるパディングが行われないことを意味する。3つのレベルのパディングを使用することは、エンコーディング方法の計算の複雑さと、イントラリフレッシュエンコーディングストラテジに対するビットレートペナルティの潜在的な削減と、の間の良好なバランスを表し得る。
いくつかの実施形態によると、イントラエンコーディング領域及び拡大したイントラエンコーディング領域のそれぞれは、1つ又はそれ以上のスライス又はタイルにより定められる。この実施形態は、定期的なイントラリフレッシュパターン及びそのイントラリフレッシュ領域を定める方法の複雑さが低いことを表し得る。H.264及びH.265などの高効率ビデオコーディング(high efficiency video coding又はHEVC)コーデックを使用することにより、スライス(H.264及びH.265)及び/又はタイル(H.265)は、エンコーディングの並列処理を促進し、効率を高め得る。換言すると、H.264、H.265、VP9、及びAV1などの、現代のブロックベースのビデオコーデックを使用することにより、スライス及び/又はタイルは、エンコーディングの並列処理を促進し、スループットを高め得る。さらに、スライス/タイルは、イントラリフレッシュ領域を定めるための構造の複雑さが低いことを表し得る。
いくつかの実施形態によると、あらかじめ定められた定期的なイントラリフレッシュパターンは、2つの連続するイメージフレームの間を、垂直方向又は水平方向にのみ変位しているイントラエンコーディング領域を定める。例えば、パターン内の第1のイントラリフレッシュ領域が、マクロブロックの最も左の列(単一又は複数)に対応する場合、パターン内の次のイントラリフレッシュ領域は、マクロブロックの最も右の列(単一又は複数)に対応する最後のイントラリフレッシュ領域までの、マクロブロックの隣接する列(単一又は複数)以降に対応してよい。続いてこのパターンは、最も左の列(単一又は複数)にて再度繰り返す。好適には、この実施形態は、定期的なイントラリフレッシュパターン及びその使用の複雑さを軽減する。
いくつかの実施形態によると、あらかじめ定められた定期的なイントラリフレッシュパターンは、垂直方向に変位しているイントラエンコーディング領域を定める。ここでは、イメージフレームのイントラエンコーディング領域を拡大することのステップは、イメージフレームのイントラエンコーディング領域の高さを上げることを含む。例えば、第1のイントラエンコーディング領域が、イメージフレームのイメージデータ内のマクロブロックの最初の3行を定め、第2のイントラエンコーディング領域が、イメージフレームのイメージデータ内のマクロブロックの4行目から6行目を定める場合、第2のイントラエンコーディング領域の拡大により、例えば、拡大したイントラエンコーディング領域が、イメージフレームのイメージデータ内のマクロブロックの3行目から6行目までを定める。同様に、いくつかの実施形態では、あらかじめ定められた定期的なイントラリフレッシュパターンは、水平方向に変位しているイントラエンコーディング領域を定める。ここでは、イメージフレームのイントラエンコーディング領域を拡大することのステップは、イメージフレームのイントラエンコーディング領域の幅を広げることを含む。
いくつかの実施形態によると、現在のモーションのレベルが、第1の閾値を超えていない場合、この方法は、残りのイメージフレームのインターフレームエンコーディングに対するモーションベクトル検索範囲を、現在の検索範囲から、あらかじめ定められた検索範囲に調整することを含む。エンコードされるイメージフレームのイメージデータ内に低モーションがあることがすでに推定されているため、この知識が、インターフレームエンコーディングに対するモーションベクトル検索範囲を減らすこと(調整すること)に好適に使用され得る。あらかじめ定められた検索範囲は、例えば、あらかじめ定められた定期的なイントラリフレッシュパターン内の領域が重ならない場合、ゼロに設定される。この場合、イントラリフレッシュパディングは採用されないため、ゼロを超えるモーションベクトル検索範囲は必ずしもいずれの利点とはならず、計算の複雑さのみを助長することとなり、役に立たないものとなる。あらかじめ定められた定期的なイントラリフレッシュパターン内の領域が、16、32、又は80画素など、ある程度重なり合う場合、あらかじめ定められた検索範囲は、これに応じて定められてよい、すなわち、16、32、又は80画素に設定されてよい。
いくつかの実施形態によると、この方法は、現在のモーションのレベルが、第2の閾値を超えている場合、残りのイメージフレームのインターフレームエンコーディングに対するモーションベクトル検索範囲を、第1の程度に対応して調整することと、現在のモーションのレベルが、第2の閾値超えていない場合、残りのイメージフレームのインターフレームエンコーディングに対するモーションベクトル検索範囲を、第2の程度に対応して調整することと、を含む。上記と同様に、第1の程度が、32画素(例えば、2つのマクロブロック)に対応し、第2の程度が、16画素に対応する場合、モーションベクトル検索範囲は、エンコードされるイメージフレームに対して推定した、現在のモーションのレベルに依存して、対応する値に設定されてよい。いくつかの実施形態によると、モーションベクトル検索範囲は、定期的なイントラリフレッシュパターン内のイントラエンコードされた領域の変位の方向に対応する方向にのみ限定される。例えば、あらかじめ定められた定期的なイントラリフレッシュパターンが、水平方向に変位しているイントラエンコーディング領域を定める場合、モーションベクトルは、上記にしたがって水平方向に限定される。
上記の実施形態では、モーションベクトル検索範囲は、複数のイメージフレームの中の、イントラエンコードされた領域間の、判定された重ね合わせを考慮して好適に調整される。これらの実施形態の技術的効果は、ビットレートの減少と、(例えば、低モーションレベルが判定された場合に、検索範囲を狭くすることにより)エンコーディングの計算の複雑を軽減することと、であってよい。これらの実施形態では、ビデオストリームの、以前のイメージフレームのイメージデータに比較して、イメージフレームのイメージデータの一部がどれほど大きく変わったかの推定として、現在のモーションレベルを定めることにより、この方策は、イントラリフレッシュパディングの程度を判定することに好適に使用され得る。なぜなら、この推定は、モーション検索が使用されなかった、又は、モーション検索が少しだけ使用された場合に、イントラブロックとなるであろう、イメージフレームのインターフレームエンコードされた部分のマクロブロックがどれほどであるかを推定することに使用され得るからである。モーション検索がないこと、又は、モーション検索が少ないことよる、余剰イントラブロックに対する、推定したコストは、イメージフレームのより広い部分を、イントラリフレッシュ領域としてエンコーディングする、すなわち、パディング及びモーション検索範囲を広げる(すなわち、イントラリフレッシュ領域を拡大する)ためのコストに対して重み付けされ得る。
本発明の第2の態様によると、シーンを描くビデオストリームの複数のイメージフレームをイントラリフレッシュエンコーディングするよう構成されたエンコーダにより、上記の目的が達成される。ここでは、イントラリフレッシュエンコーディングは、イントラエンコードされるべき、イメージフレームの領域を定める、あらかじめ定められた定期的なイントラリフレッシュパターンに基づいている。エンコーダは、
・ シーン内の現在のモーションのレベルであって、ビデオストリームの、以前にエンコードされたイメージフレームのイメージデータに比較して、イメージフレームのイメージデータの一部がどれほど大きく変わったかを推定する、現在のモーションのレベルを受信することと、
・ イメージフレームのイントラエンコーディング領域を、あらかじめ定められた定期的なイントラリフレッシュパターンにしたがって判定することと、
を行うよう構成されたプロセッサを含む。
現在のモーションのレベルが、第1の閾値を超えていない場合、プロセッサは、
・ イメージフレームのイントラエンコーディング領域をイントラエンコードすることと、
・ 残りのイメージフレームをインターフレームエンコードすることと、
を行うよう構成されている。
現在のモーションのレベルが、第1の閾値を超えている場合、プロセッサは、
・ イメージフレームのイントラエンコーディング領域を拡大し、複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、判定した程度に重ね合わせることと、
・ イメージフレームの、拡大したイントラエンコーディング領域をイントラエンコードし、残りのイメージフレームをインターフレームエンコードすることと、
を行うよう構成されている。
いくつかの実施形態によると、プロセッサは、現在のモーションのレベルが、第2の閾値であって、第1の閾値より大きい第2の閾値を超えている場合、
・ イメージフレームのイントラエンコーディング領域を拡大し、複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、第1の程度に重ね合わせることを行うようさらに構成されている。
現在のモーションのレベルが、第2の閾値を超えていない場合、プロセッサは、
・ イメージフレームのイントラエンコーディング領域を拡大し、複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、第2の程度であって、第1の程度の方が大きい第2の程度に重ね合わせることを行うよう構成されている。
いくつかの実施形態によると、プロセッサは、現在のモーションのレベルが、第1の閾値を超えていない場合、残りのイメージフレームのインターフレームエンコーディングに対するモーションベクトル検索範囲を、現在の検索範囲から、あらかじめ定められた検索範囲に調整することを行うようさらに構成されている。
本発明の第3の態様によると、ビデオ撮像デバイスと、モーションデテクタと、第2の態様に係るエンコーダと、を含むシステムにより、上記の目的が達成される。
ビデオ撮像デバイスは、シーンを描くビデオストリームであって、複数のイメージフレームを含むビデオストリームを撮像し、ビデオストリームのイメージフレームを、モーションデテクタ及びエンコーダに連続して送信するよう構成されている。
モーションデテクタは、受信したイメージフレーム内のイメージデータに基づく、撮像したイメージフレーム内の現在のモーションのレベルを連続して検出し、その現在のモーションのレベルをエンコーダに送信するよう構成されている。
本発明の第4の態様によると、処理機能を有するデバイスにより実行されると、第1の態様の方法を実施するよう構成されている命令を保存しているコンピュータ可読記憶媒体を含むコンピュータプログラム製品により、上記の目的が達成される。
第2、第3、及び第4の態様は一般的に、第1の態様と同じ特徴及び利点を有してよい。本発明は更に、特に明白に言及していない限り、すべての可能な特徴の組み合わせに関連することに留意されたい。
本発明の、上記及び更なる目的、特徴、並びに利点は、添付図面を参照しての、本発明の好適な実施形態の、以下に記載する例示的且つ非限定の詳細説明を通して良好に理解される。ここでは、同様のコンポーネントには同じ参照番号が用いられる。
本発明に使用されてよい、あらかじめ定められた定期的なイントラリフレッシュパターンの4つの異なる例を模式的に示す。 従来技術に係る、ビデオストリームの複数のイメージフレームをイントラリフレッシュエンコーディングする方法を示す。 第1の実施形態に係る、ビデオストリームの複数のイメージフレームをイントラリフレッシュエンコーディングする方法を示す。 第2の実施形態に係る、ビデオストリームの複数のイメージフレームをイントラリフレッシュエンコーディングする方法を示す。 図5aから図5cは、モーションのレベルと、イントラリフレッシュ領域の拡大と、の間のマッピングのそれぞれの実施形態を示す。 図5aから図5cは、モーションのレベルと、イントラリフレッシュ領域の拡大と、の間のマッピングのそれぞれの実施形態を示す。 図5aから図5cは、モーションのレベルと、イントラリフレッシュ領域の拡大と、の間のマッピングのそれぞれの実施形態を示す。 それらの実施形態に係る、ビデオストリームの複数のイメージフレームをイントラリフレッシュエンコーディングする方法のフローチャートを示す。
本発明を、添付図面を参照して以下に更に詳細に説明する。ここでは、本発明の実施形態を示す。以下に開示するシステム及びデバイスは、作動中のものとして説明される。
上述するように、定期的なイントラリフレッシュは、さもなくばGOP毎に一度、すなわち、イメージフレームが、イントラエンコーディングを使用してエンコードされる際に発生し得る、ビットレートにおけるスパイクを除去するための、定着している方法である。イントラリフレッシュストラテジでは、定期的なイントラリフレッシュパターンが使用され、イメージフレームのどの部分が「リフレッシュされる」(すなわち、いずれの他のイメージフレームへのリファレンスなくエンコードされる)、したがって、イントラコードされた領域として強制的にエンコードされるべきであるかが定められる。
そのようなパターンの例を図1に示す。各例は、リフレッシュされる総イメージフレームについて、3つのイメージフレームを含む。しかし、通常の場合、イントラリフレッシュパターンは、32又は64などの、多数の複数のイメージフレーム全体に循環することが理解されるべきである。
図1では(同様に図2〜図5では)、斜線のエリアがイントラリフレッシュ領域を表し、空白のエリアが、イメージフレームの残りの部分を表す。
図1の左上の例は、定期的なイントラリフレッシュパターン100aを示す。ここでは、そのイメージフレーム内のマクロブロックの完全な行が、イントラリフレッシュ領域を定める。いくつかの実施形態では、パターン100a内のイントラリフレッシュ領域は、1つ又はそれ以上のスライスにより定められてよい。いくつかの実施形態では、イントラリフレッシュ領域は、1行のマクロブロックを含む。これは、イントラリフレッシュパターンが、イメージフレーム内のマクロブロックの行数に等しいイメージフレーム数全体に循環することを意味する。図1aでは、定期的なイントラリフレッシュパターン100aは、2つの連続するイメージフレームの間を、水平方向に変位している(ずれている)イントラエンコーディング領域を定める。
図1の左下の例は、定期的なイントラリフレッシュパターン100bを示す。ここでは、そのイメージフレーム内のマクロブロックの完全な列(単一又は複数)が、イントラリフレッシュ領域を定める。いくつかの実施形態では、パターン100a内のイントラリフレッシュ領域は、1つ又はそれ以上のタイルにより定められてよい。いくつかの実施形態では、イントラリフレッシュ領域は、1列のマクロブロックを含む。これは、イントラリフレッシュパターンが、イメージフレーム内のマクロブロックの列数に等しいイメージフレーム数全体に循環することを意味する。図1bでは、定期的なイントラリフレッシュパターン100bは、2つの連続するイメージフレームの間を、垂直方向に変位している(ずれている)イントラエンコーディング領域を定める。
定期的なイントラリフレッシュパターンを定める他の方法も、等しく可能である。図1は、例として、そのようなパターンの、さらに2つの実施形態を示す。右上の例では、定期的なイントラリフレッシュパターン100cが、イメージフレームの1つの角から反対の角に移動する斜めの領域により定められている。右下の角では、よりランダムなアプローチによるイントラリフレッシュパターン100dが定められている。ここでは、個別のマクロブロックが、各イメージフレームに対するイントラリフレッシュ領域を定める。図1内の、イントラリフレッシュパターンの例のすべてでは、イメージフレームの画素の定められたマクロブロックのすべてが、パターン100a〜dのサイクル中に、すなわち、イントラリフレッシュパターンのサイクルが延長するn数のイメージフレーム(これらの例では、n=3)全体に、イントラリフレッシュされている。
図1の、あらかじめ定められた定期的なイントラリフレッシュパターンの例では、パターン内の領域は、連続するイメージフレームの間に重ならない。しかし、いくつかの実施形態によると、いくらかの重ね合わせがあってよい。
図2〜図4の例では、図1のイントラリフレッシュパターン100aの左上の例が、本発明の異なる実施形態を体現するために使用されている。図1のパターン100b〜dの例以外のいずれ、又は、図1に示さない、いずれの他の適切なイントラリフレッシュパターンが採用され得ることに留意すべきである。
イントラリフレッシュエンコーディングストラテジを使用する場合、イメージフレームのイントラリフレッシュ領域のイメージデータ(例えば、マクロブロック)がイントラエンコードされる。イメージフレームの残りのイメージデータは、インターフレームエンコードされる。これは、エンコードされたイメージフレームのこの部位のマクロブロックが、イントラエンコード又はインターエンコードされていることを意味する。イントラリフレッシュエンコーディングストラテジを使用して複数のイメージフレームをエンコーディングする際に、ビットレートを最小化するには、インターフレームエンコードされた領域内の、できるだけたくさんのマクロブロックが、予想されたマクロブロックとして、すなわち、インターエンコードされたマクロブロックとして、エンコードされることが好適である。マクロブロックを、インター又はイントラとしてエンコーディングするかの選択は、エンコーダにより行われ、これは、以前のイメージフレーム内にいずれのマクロブロックが見つかり、現在エンコードされているマクロブロックを効率のよい方法で予想するために使用され得るか否か、に基づいている。つまり、エンコーディング効率を上げるためには、イントラリフレッシュストラテジを使用して、エンコードされる複数のイメージフレーム内の、できるだけたくさんの新たなイメージコンテントが、イメージフレームのイントラリフレッシュ領域のイメージデータの一部となる必要がある。理解されるように、2つの連続するイメージフレームのイントラリフレッシュ領域間の境界領域内のイメージデータ(及び、新たなイメージデータ)のムーブメントにより、いくつかのイメージコンテントが、イントラリフレッシュ領域内に含まれないこととなり得る。
通常使用される1つのソリューションは、2つのイメージフレーム間のイントラリフレッシュ領域を常に、ある程度重ね合わせるようにすることである。これは、イントラリフレッシュパディングと呼ばれ得る。図2は、従来技術にて使用される実施形態を示す。図2は、第1、第2、及び第3のイメージフレーム102a〜cを示す。別々のイメージフレームのイントラリフレッシュ領域104a〜cは、あらかじめ定められた定期的なイントラリフレッシュパターンから判定されている。図2に示すように、第2のイメージフレーム102b及び第3のイメージフレーム102cに対するイントラリフレッシュ領域は、重ね合わせ202b及び202c(境界を有する斜線のエリアとして図2に示す)が、第1のイメージフレーム102aのイントラリフレッシュ領域104aと、第2のイメージフレーム102bのイントラリフレッシュ領域104bと、の間、及び、第2のイメージフレーム102bのイントラリフレッシュ領域104bと、第3のイメージフレーム102cのイントラリフレッシュ領域104cと、の間に形成されるように延長されている。このソリューションによると、イントラリフレッシュストラテジでは、複数のイメージフレーム102a〜cの中の、イメージデータのコンテントのムーブメントによる影響が少ない。しかし、図2のソリューションは、望ましくないビットレートペナルティ(通常は、20%〜30%を超える余剰)が伴う。なぜなら、第2及び第3のイメージフレーム102b〜cのイメージデータの大部分が、強制的にイントラエンコードされるからである。一例として、各イメージフレームが、高さにおいて68マクロブロックのサイズを、イントラブロックとインターブロック(低モーションシーンに共通)のコーディング間にx100のサイズ差を伴って有する高解像度(full high definition又はFHD)ビデオについて、ビデオストリームのイメージフレームのイントラエンコーディング領域間に2つのブロックパディングを適用することは、>100%のビットレートの増加をもたらすこととなる。
発明者達は、パディングのサイズが、ビデオストリームの以前のイメージフレームのイメージデータに比較して、イメージフレームのイメージデータの一部がどれほど大きく変わったか、に適応され得ることを認識した。なぜなら、低モーションシーンは、高モーションシーンほどたくさんのパディングを必要とせず、効率のよいエンコーディングを依然として達成するためである。
図3は、例として、イントラリフレッシュエンコーディング方法の一実施形態を示す。これは、図5a及び図6とあわせて説明する。図3は、第1、第2、及び第3のイメージフレーム102a〜cを示す。第1のイメージフレーム102aについては、イントラエンコーディング領域104aは、あらかじめ定められた定期的なイントラリフレッシュパターン(図1での左上)にしたがって判定されている。その結果として、イメージフレーム102aの上部(イントラエンコーディング領域104a)は、強制的にイントラエンコードされている。イメージフレーム102aの残りの部分については、イメージデータは、イントラフレームエンコードされている。
第2のイメージフレーム102bについては、現在のモーションのレベルが受信されるS02。この例では、図5aのマッピングスキーム502aが使用され、このイメージフレームに対してS04にて判定されたイントラエンコーディング領域104bの拡大が行われるべきか否かが判定される。第2のイメージフレーム102bについては、現在のモーションのレベルが、第1の閾値506を超えていないことが判定されるS06。図5aに見られるように、これは、イントラリフレッシュ領域104bの延長が行われるべきでないことを意味する。第2のイメージフレーム102bについては、これは、イントラエンコーディング領域104bが拡大されておらず、その領域内のイメージデータが強制的にイントラエンコードされるS14ことを意味する。残りのイメージフレームは、インターフレームエンコードされるS16。これは、第2のイメージフレーム102bの余剰部分が強制的にイントラエンコードされないことを意味する。これは、低モーションシーン(閾値未満の、現在のモーションのレベル)に対して、効率性の点において好適であり、例えば、イントラリフレッシュ領域間のパディング(拡大)が常に行われる、図2の実施形態に比較して、ビットレートを減らすこととなる。
第3のイメージフレーム102cについては、現在のモーションのレベルが受信されるS02。図5aのマッピングスキーム502aが使用され、このイメージフレーム102cに対してS04にて判定されたイントラエンコーディング領域104cの拡大が行われるべきか否かが判定される。第3のイメージフレーム102cについては、現在のモーションのレベルが、第1の閾値506を超えていることが判定されるS06。図5aに見られるように、これは、イントラリフレッシュ領域104bの延長が行われるべきであることを意味する。その結果として、第3のイメージフレーム102cのイントラエンコーディング領域104cが拡大されS08、(この実施形態では、第3のイメージフレームに対して時間的に先行する)以前にエンコードされたイメージフレーム102bのイントラエンコーディング領域104bと、判定した程度302cに重なり合う。重ね合わせの程度は、使用されるマッピングスキーム502aにより判定される。この重ね合わせの程度はこの場合、マッピングスキーム502a内に定められる最大拡大504に対応する。イントラエンコーディング領域104cの拡大は、イントラエンコーディング領域104cの高さを上げることにより行われる。これは、領域104cを拡大することの複雑さが低い方法である。これは、使用されるイントラリフレッシュパターンに依存する。もし、図1の左下の実施形態のイントラリフレッシュパターンがその代わりに使用された場合、拡大はその代わりに、イメージフレームのイントラエンコーディング領域の幅を広げることにより行われてよい。
イントラエンコーディング領域104cを拡大することにより、ブロックマッチングアルゴリズムは、イメージデータのムーブメントにかかわらず、依然として効率よく機能し得る。
図4は、例として、イントラリフレッシュエンコーディング方法の一実施形態を示す。これは、図5b及び図6とあわせて説明する。図4は、第1、第2、及び第3のイメージフレーム102a〜cを示す。第1のイメージフレーム102aについては、イントラエンコーディング領域104aは、あらかじめ定められた定期的なイントラリフレッシュパターン(図1での左上)にしたがって判定されている。その結果として、イメージフレーム102aの上部(イントラエンコーディング領域104a)は、強制的にイントラエンコードされている。イメージフレーム102aの残りの部分については、イメージデータは、イントラフレームエンコードされている。
第2のイメージフレーム102bについては、現在のモーションのレベルが受信されるS02。図5bのマッピングスキーム502bが使用され、このイメージフレーム102bに対してS04にて判定されたイントラエンコーディング領域104bの拡大が行われるべきか否かが判定される。第2のイメージフレーム102bについては、現在のモーションのレベルが、第1の閾値506を超えていることが判定されるS06。図5a内のマッピングスキーム502aとは異なり、図4の複数のイメージフレーム102a〜cに使用されるマッピングスキーム502bは、現在のモーションのレベルに依存して、イントラエンコーディング領域の拡大のレベルを、1つを超えて定める。この実施形態では、現在のモーションのレベルが、第1の閾値506を超えていることが判定されると、現在のモーションのレベルが、第2の閾値508と比較される。第2のイメージフレーム102bについては、現在のモーションのレベルは、第2の閾値508を超えない。その結果として、イントラエンコーディング領域104bが、マッピングスキーム502bにより定められる拡大のレベル510にしたがって、判定した程度402bに拡大されるS08。第2のイメージフレーム102bの別の領域が続いて、図3とあわせて先述するように、エンコードされるS14及びS16。
第3のイメージフレーム102cについては、現在のモーションのレベルが受信されるS02。図5bのマッピングスキーム502bが使用され、このイメージフレーム102cに対してS04にて判定されたイントラエンコーディング領域104cの拡大が行われるべきか否かが判定される。第3のイメージフレーム102cについては、現在のモーションのレベルが、第1の閾値506を超えていることが判定されるS06。上述するように、この実施形態では、現在のモーションのレベルが、第1の閾値506を超えていることがS06にて判定されると、現在のモーションのレベルが、第2の閾値508と比較される。第3のイメージフレーム102cについては、現在のモーションのレベルが、第2の閾値508を超えていることが判定されるS10。その結果として、イントラエンコーディング領域104cが、マッピングスキーム502bにより定められる拡大のレベル512にしたがって、判定した程度402cに拡大されるS08。第2のイメージフレーム102bの別の領域が続いて、図3とあわせて先述するように、エンコードされるS14及びS16。
図5bの3つのレベル拡大スキーム502bは、例として説明されており、これらは、4つ、6つ、10などのレベル拡大スキームに拡張され得ることに留意すべきである。このことを、図6に模式的に示す。ここでは、いくつかの実施形態によると、現在のモーションのレベルが、複数の閾値とS10にて比較され得、イントラリフレッシュ領域のさらなる拡大(単一又は複数)S08をもたらす。イントラリフレッシュ領域を拡大するこの方法は、例のみとして示している。いくつかの実施形態によると、現在のモーションのレベルは、特定の拡大のレベルに(すなわち、図5a〜cにて定められるように)直接マップされ、イントラリフレッシュ領域がしたがって拡大される。いくつかの実施形態によると、例えば、図5cに示すような、現在のモーションのレベルと、イントラリフレッシュ領域の拡大と、の間の半連続的マッピングが採用される。マッピングスキーム502cは、16x16画素などの、マクロブロックのサイズに依存して、イントラリフレッシュ領域の拡大を段階的に定める。
図4の実施形態では、現在のモーションのレベルが、第1の閾値506を超えていることにより、イントラエンコーディング領域の拡大が行われるべきであることが判定される場合、実際の拡大の程度は、現在のモーションのレベルに依存する。図4に示すように、第3のイメージフレーム102c内の重ね合わせの程度402cは、第2のイメージフレーム内の重ね合わせの程度402bより大きい。なぜなら、第3のイメージフレーム102cについての現在のモーションのレベルが、第2のイメージフレーム102bについての現在のモーションのレベルより大きいからである。好適には、図4の実施形態の、エンコードされたイメージフレームに対するビットレートは、図3の実施形態の、2つのレベルマッピングスキーム(拡大スキーム)に比較して、さらに最適化されてよい。
図3及び図4の実施形態では、イメージフレームのイントラエンコーディング領域が拡大されており、ビデオストリーム内の、直前のイメージフレームのイントラエンコーディング領域と重なり合う。例えば、ビデオストリーム内のすべての他のフレームが、空白のフレームに対応する場合の代わりに、使用されるエンコーディング方法に依存して、イメージフレームのイントラエンコーディング領域が拡大され、ビデオストリーム内の、直前に参照されたイメージフレームのイントラエンコーディング領域と重なり合う。他の実施形態ではまた、上述するように、時間的に後続のイメージフレーム及びそのイントラエンコーディング領域も、拡大を判定するためのリファレンスとして使用されてよい。
ビデオストリーム内のイントラリフレッシュ領域間の重ね合わせを定める上記の方法は、いくつかの実施形態によると、残りのイメージフレームのインターフレームエンコーディング(すなわち、イメージフレームのイントラエンコーディング領域でない部分のイメージデータのエンコーディング)に対するモーションベクトル検索範囲も定めるよう延長されてよい。上述するように、重ね合わせは、撮像したシーン内のコンテントが、イメージフレームを撮像する間に動いたとしても、参照されたイメージフレーム間のブロックマッチングが良好となる可能性を上げるよう定められる。その結果として、イントラエンコードされた領域の判定された重ね合わせは、エンコーダのモーションベクトル検索範囲を設定することにも好適に使用され得る。その結果として、いくつかの実施形態によると、図6の方法は、イントラリフレッシュ領域間の重ね合わせ(イントラリフレッシュパディング)に依存して、モーションベクトル検索範囲を調整(設定)することS12にも拡張され得る。いくつかの実施形態によると、現在のモーションのレベルが、第1の閾値506を超えていない場合、残りのイメージフレームのインターフレームエンコーディングに対するモーションベクトル検索範囲は、現在のモーションベクトル検索範囲から、ゼロ又は1つのマクロブロック検索範囲などの、あらかじめ定められた検索範囲に調整される(制限される)S12。図4の実施形態については、第1の閾値506を超えるモーションのレベルに依存して、判定した重ね合わせの程度は、モーションベクトル検索範囲を調整することに使用され得る。例えば、現在のモーションのレベルが、第2の閾値を超えている場合、残りのイメージフレームのインターフレームエンコーディングに対するモーションベクトル検索範囲は、第1の程度に対応して調整されるS12。第1の程度が、3つ又は2つのマクロブロックの重ね合わせを定める場合、モーションベクトル検索範囲は、3つ又は2つのマクロブロックに調整されてよいS12。同様に、現在のモーションのレベルが、第2の閾値を超えていない場合、残りのイメージフレームのインターフレームエンコーディングに対するモーションベクトル検索範囲は、第2の程度に対応して調整されてよいS12。第2の程度が、2つ又は1つのマクロブロックの重ね合わせを定める場合、モーションベクトル検索範囲は、2つ又は1つのマクロブロックに調整されてよいS12。
これら上記の方法は、この方法を行うよう構成された1つ又はそれ以上のプロセッサを含むエンコーダにより好適に実装される。
エンコーダは、モニタリングカメラなどのビデオ撮像デバイスと、モーションデテクタと、をさらに含むシステムの一部を形成してよい。モーションデテクタは、ビデオ撮像デバイス内又はエンコーダ内に実装されてよい。いくつかの実施形態では、モーションデテクタ及びエンコーダの双方は、ビデオ撮像デバイス内に実装される。
そのようなシステムでは、ビデオ撮像デバイスは、シーンを描くビデオストリームであって、複数のイメージフレームを含むビデオストリームを撮像し、ビデオストリームのイメージフレームを、モーションデテクタ及びエンコーダに連続して送信するよう構成されている。モーションデテクタは、受信したイメージフレーム内のイメージデータに基づく、撮像したイメージフレーム内の現在のモーションのレベルを連続して検出し、その現在のモーションのレベルをエンコーダに送信するよう構成されている。検出したモーションは、シーン内のモーション及び/又はビデオ撮像デバイスの視界での変化に依存してよい。モーションの検出は、先述するように、いくつかの実施形態によると、計算の複雑さを軽減するために、撮像したイメージフレームのいくつかにのみ行われてよい。
これら上記の方法はまた、コンピュータ可読記憶媒体上に保存されたソフトウェアにても実装されてよい。
これまで、本発明に関するコンセプトを、限られた数の例を参照して主に説明した。しかし、当業者にただちに明白であるように、上記に開示するものとは異なる他の実施例も、特許請求の範囲に規定されるように、本発明に関するコンセプトの範囲内にて等しく可能である。例えば、モーションベクトル検索範囲を調整する場合(図6でのS12)、いくつかの実施形態によると、ベクトル検索範囲は、現在のイメージフレームのイントラエンコーディング領域と、以前のイメージフレームのイントラエンコーディング領域と、の間の重ね合わせの程度に基づいて、水平又は垂直方向にのみ調整されるS12。ここでは、ベクトル検索範囲が設定される/制限される方向は、あらかじめ定められた定期的なイントラリフレッシュパターンに基づいている。例えば、モーションベクトル検索範囲は、定期的なイントラリフレッシュパターン内のイントラエンコードされた領域の変位の方向に対応する方向(例えば、水平又は垂直)に調整されてよいS12。

Claims (15)

  1. ビデオストリームの複数のイメージフレーム(102)をイントラリフレッシュエンコーディングする方法であって、前記イントラリフレッシュエンコーディングは、イントラエンコードされるべき、イメージフレーム(102a〜c)の領域(104a〜c)を定める、あらかじめ定められた定期的なイントラリフレッシュパターン(100a〜d)に基づいており、前記イメージフレームのそれぞれに対して、
    前記イメージフレームに関連付けられた現在のモーションのレベルを受信すること(S02)と、
    前記イメージフレームのイントラエンコーディング領域(104a〜c)を、前記あらかじめ定められた定期的なイントラリフレッシュパターンにしたがって判定すること(S04)と、
    前記現在のモーションのレベルが、第1の閾値(506)を超えていない場合、
    前記イメージフレームの前記イントラエンコーディング領域をイントラエンコーディングすること(S14)と、
    前記イントラエンコーディング領域とは異なる、前記イメージフレームの領域をインターフレームエンコーディングすること(S16)と、
    前記現在のモーションのレベルが、前記第1の閾値を超えている場合、
    前記イメージフレームの前記イントラエンコーディング領域を拡大し、前記複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、判定した程度(302c、402b、402c、504、510、512)に重ね合わせること(S08)と、
    前記イメージフレームの、前記拡大したイントラエンコーディング領域をイントラエンコーディングすること(S14)と、
    前記拡大したイントラエンコーディング領域とは異なる、前記イメージフレームの前記領域をインターフレームエンコーディングすること(S16)と、
    を含む方法。
  2. 前記複数のイメージフレームについて、前記あらかじめ定められた定期的なイントラリフレッシュパターン内の前記領域は重ならない、請求項1に記載の方法。
  3. 前記イメージフレームの前記イントラエンコーディング領域を前記拡大することは、
    前記イメージフレームの前記イントラエンコーディング領域を拡大し、前記ビデオストリーム内の、直前に参照されたイメージフレームのイントラエンコーディング領域と重ね合わせることを含む、請求項1又は2に記載の方法。
  4. 前記現在のモーションのレベルが、前記第1の閾値を超えている場合、
    前記現在のモーションのレベルが、第2の閾値(508)であって、前記第1の閾値より大きい前記第2の閾値を超えている場合、
    前記イメージフレームの前記イントラエンコーディング領域を拡大し、前記複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、第1の程度(402c、512)に重ね合わせることと、
    前記現在のモーションのレベルが、前記第2の閾値を超えていない場合、
    前記イメージフレームの前記イントラエンコーディング領域を拡大し、前記複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、第2の程度(402b、510)であって、前記第1の程度の方が大きい前記第2の程度に重ね合わせることと、
    をさらに含む、請求項1から3のいずれか一項に記載の方法。
  5. 前記イントラエンコーディング領域は、1つ又はそれ以上のスライス又はタイルにより定められており、前記拡大したイントラエンコーディング領域は、1つ又はそれ以上のスライス又はタイルにより定められている、請求項1から4のいずれか一項に記載の方法。
  6. 前記あらかじめ定められた定期的なイントラリフレッシュパターンは、2つの連続するイメージフレームの間を、垂直方向又は水平方向にのみ変位しているイントラエンコーディング領域を定める、請求項1〜5のいずれか一項に記載の方法。
  7. 前記あらかじめ定められた定期的なイントラリフレッシュパターンは、垂直方向に変位しているイントラエンコーディング領域を定め、
    前記イメージフレームの前記イントラエンコーディング領域を前記拡大することは、前記イメージフレームの前記イントラエンコーディング領域の高さを上げることを含む、
    請求項6に記載の方法。
  8. 前記あらかじめ定められた定期的なイントラリフレッシュパターンは、水平方向に変位しているイントラエンコーディング領域を定め、
    前記イメージフレームの前記イントラエンコーディング領域を前記拡大することは、前記イメージフレームの前記イントラエンコーディング領域の幅を広げることを含む、
    請求項6に記載の方法。
  9. 前記現在のモーションのレベルが、前記第1の閾値を超えていない場合、残りのイメージフレームのインターフレームエンコーディングに対するモーションベクトル検索範囲を、現在の検索範囲から、あらかじめ定められた検索範囲に調整すること(S12)をさらに含む、請求項1から8のいずれか一項に記載の方法。
  10. 前記現在のモーションのレベルが、前記第2の閾値を超えている場合、前記残りのイメージフレームの前記インターフレームエンコーディングに対する前記モーションベクトル検索範囲を、前記第1の程度に対応して調整すること(S12)と、
    前記現在のモーションのレベルが、前記第2の閾値を超えていない場合、前記残りのイメージフレームの前記インターフレームエンコーディングに対する前記モーションベクトル検索範囲を、前記第2の程度に対応して調整すること(S12)と、
    をさらに含む、請求項4に記載の方法、又は、請求項4に従属する場合、請求項5から9のいずれか一項に記載の方法。
  11. ビデオストリームの複数のイメージフレーム(102)をイントラリフレッシュエンコーディングするよう構成されたエンコーダであって、前記イントラリフレッシュエンコーディングは、イントラエンコードされるべき、イメージフレーム(102a〜c)の領域(104a〜c)を定める、あらかじめ定められた定期的なイントラリフレッシュパターン(100a〜d)に基づいており、
    シーン内の現在のモーションのレベルを受信すること(S02)と、
    前記イメージフレームのイントラエンコーディング領域(104a〜c)を、前記あらかじめ定められた定期的なイントラリフレッシュパターンにしたがって判定すること(s04)と、
    前記現在のモーションのレベルが、第1の閾値(506)を超えていない場合、
    前記イメージフレームの前記イントラエンコーディング領域をイントラエンコードすること(S14)と、
    前記イントラエンコーディング領域とは異なる、前記イメージフレームの領域をインターフレームエンコードすること(S16)と、
    前記現在のモーションのレベルが、前記第1の閾値を超えている場合、
    前記イメージフレームの前記イントラエンコーディング領域を拡大し、前記複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、判定した程度(302c、402b、402c)に重ね合わせること(S08)と、
    前記イメージフレームの、前記拡大したイントラエンコーディング領域をイントラエンコードすること(S14)と、
    前記拡大したイントラエンコーディング領域とは異なる、前記イメージフレームの領域をインターフレームエンコードすること(S16)と、
    を行うよう構成されたプロセッサを含む、エンコーダ。
  12. 前記プロセッサは、
    前記現在のモーションのレベルが、第2の閾値(508)であって、前記第1の閾値より大きい前記第2の閾値を超えている場合、
    前記イメージフレームの前記イントラエンコーディング領域を拡大し、前記複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、第1の程度(402b)に重ね合わせることと、
    前記現在のモーションのレベルが、前記第2の閾値を超えていない場合、
    前記イメージフレームの前記イントラエンコーディング領域を拡大し、前記複数のイメージフレームの中の、以前にエンコードされたイントラエンコーディング領域と、第2の程度(402c)であって、前記第1の程度の方が大きい前記第2の程度に重ね合わせることと、
    を行うようさらに構成されている、請求項11に記載のエンコーダ。
  13. 前記プロセッサは、前記現在のモーションのレベルが、前記第1の閾値を超えていない場合、残りのイメージフレームのインターフレームエンコーディングに対するモーションベクトル検索範囲を、現在の検索範囲から、あらかじめ定められた検索範囲に調整すること(S12)を行うようさらに構成されている、請求項11又は12に記載のエンコーダ。
  14. ビデオ撮像デバイスと、
    モーションデテクタと、
    請求項11から13のいずれか一項に記載のエンコーダと、
    を含み、
    前記ビデオ撮像デバイスは、シーンを描くビデオストリームであって、複数のイメージフレームを含むビデオストリームを撮像し、前記ビデオストリームの前記イメージフレームを、前記モーションデテクタ及び前記エンコーダに連続して送信するよう構成されており、
    前記モーションデテクタは、前記受信したイメージフレーム内のイメージデータに基づく、前記撮像したイメージフレーム内の現在のモーションのレベルを連続して検出し、前記現在のモーションのレベルを前記エンコーダに送信するよう構成されている
    システム。
  15. 処理機能を有するデバイスにより実行されると、請求項1から10のいずれか一項に記載の方法を実施するよう構成されている命令を保存しているコンピュータ可読記憶媒体を含む、コンピュータプログラム製品。
JP2019205334A 2018-11-22 2019-11-13 複数のイメージフレームをイントラリフレッシュエンコーディングする方法 Active JP6900452B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP18207682.8A EP3657799B1 (en) 2018-11-22 2018-11-22 Method for intra refresh encoding of a plurality of image frames
EP18207682.8 2018-11-22

Publications (2)

Publication Number Publication Date
JP2020099042A true JP2020099042A (ja) 2020-06-25
JP6900452B2 JP6900452B2 (ja) 2021-07-07

Family

ID=64456757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019205334A Active JP6900452B2 (ja) 2018-11-22 2019-11-13 複数のイメージフレームをイントラリフレッシュエンコーディングする方法

Country Status (6)

Country Link
US (1) US11025906B2 (ja)
EP (1) EP3657799B1 (ja)
JP (1) JP6900452B2 (ja)
KR (1) KR102154443B1 (ja)
CN (1) CN111212283B (ja)
TW (1) TWI801692B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3829169B1 (en) * 2019-11-29 2021-10-13 Axis AB Method for intra refresh encoding of a plurality of image frames using convex and concave distribution functions
CN112004089A (zh) * 2020-09-04 2020-11-27 白华 一种支持任意显示区域局部刷新的方法
CN114630113B (zh) * 2021-02-23 2023-04-28 杭州海康威视数字技术股份有限公司 基于自适应帧内刷新机制的解码、编码方法及相关设备
CN113709479B (zh) * 2021-03-19 2022-12-06 杭州海康威视数字技术股份有限公司 基于自适应帧内刷新机制的解码、编码方法及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05328324A (ja) * 1992-05-15 1993-12-10 Toshiba Corp 動き補償フレーム間予測符号化のリフレッシュ方式
JPH07322266A (ja) * 1994-05-25 1995-12-08 Canon Inc 符号化装置
JPH0837663A (ja) * 1994-07-22 1996-02-06 Canon Inc 符号化装置
JP2011055219A (ja) * 2009-09-01 2011-03-17 Sony Corp 画像送信装置、画像受信装置、画像送信方法及び画像受信方法
JP2013165340A (ja) * 2012-02-09 2013-08-22 Sony Corp 画像処理装置と画像処理方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3210082B2 (ja) * 1992-07-14 2001-09-17 キヤノン株式会社 符号化装置及びその方法
NO20062097L (no) * 2006-05-10 2007-11-12 Ntnu Technology Transfer As Method and device for video encoding and decoding
EP1921867B1 (en) * 2006-10-17 2016-05-25 Harman Becker Automotive Systems GmbH Sensor assisted video compression
JP4851911B2 (ja) * 2006-10-23 2012-01-11 富士通株式会社 符号化装置、符号化プログラムおよび符号化方法
US8218641B2 (en) 2006-10-31 2012-07-10 Sony Computer Entertainment Inc. Picture encoding using same-picture reference for pixel reconstruction
JP2011205465A (ja) * 2010-03-26 2011-10-13 Hitachi Consumer Electronics Co Ltd 画像符号化方法および画像符号化装置
US8711933B2 (en) 2010-08-09 2014-04-29 Sony Computer Entertainment Inc. Random access point (RAP) formation using intra refreshing technique in video coding
US9930360B2 (en) * 2011-11-08 2018-03-27 Texas Instruments Incorporated Method, system and apparatus for intra-refresh in video signal processing
US10085024B2 (en) * 2012-04-13 2018-09-25 Qualcomm Incorporated Lookup table for rate distortion optimized quantization
US9100636B2 (en) * 2012-09-07 2015-08-04 Intel Corporation Motion and quality adaptive rolling intra refresh
JP2015106747A (ja) * 2013-11-28 2015-06-08 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
US20170013274A1 (en) 2015-07-09 2017-01-12 Microsoft Technology Licensing, Llc Intra-refresh for video streaming
CN106488229B (zh) * 2015-09-01 2022-01-21 恩智浦美国有限公司 具有可调整帧内刷新率的视频编码器
EP3220642B1 (en) * 2016-03-15 2018-03-07 Axis AB Method, apparatus and system for encoding a video stream by defining areas within a second image frame with image data common to a first image frame
US10652572B2 (en) * 2016-04-29 2020-05-12 Ati Technologies Ulc Motion-adaptive intra-refresh for high-efficiency, low-delay video coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05328324A (ja) * 1992-05-15 1993-12-10 Toshiba Corp 動き補償フレーム間予測符号化のリフレッシュ方式
JPH07322266A (ja) * 1994-05-25 1995-12-08 Canon Inc 符号化装置
JPH0837663A (ja) * 1994-07-22 1996-02-06 Canon Inc 符号化装置
JP2011055219A (ja) * 2009-09-01 2011-03-17 Sony Corp 画像送信装置、画像受信装置、画像送信方法及び画像受信方法
JP2013165340A (ja) * 2012-02-09 2013-08-22 Sony Corp 画像処理装置と画像処理方法

Also Published As

Publication number Publication date
EP3657799A1 (en) 2020-05-27
TWI801692B (zh) 2023-05-11
KR102154443B1 (ko) 2020-09-09
EP3657799B1 (en) 2020-11-04
US11025906B2 (en) 2021-06-01
TW202038610A (zh) 2020-10-16
US20200169727A1 (en) 2020-05-28
CN111212283B (zh) 2021-03-26
KR20200060231A (ko) 2020-05-29
CN111212283A (zh) 2020-05-29
JP6900452B2 (ja) 2021-07-07

Similar Documents

Publication Publication Date Title
JP6900452B2 (ja) 複数のイメージフレームをイントラリフレッシュエンコーディングする方法
CN108737837B (zh) 形成视频流的方法及图像处理单元
US8817871B2 (en) Adaptive search range method for motion estimation and disparity estimation
JP6932096B2 (ja) ビデオストリームをエンコードするための方法、ビデオエンコーダ、及びビデオカメラ
JP2009182623A (ja) 画像符号化方法
JP2007067469A (ja) フレーム内予測符号化制御方法、フレーム内予測符号化制御装置、フレーム内予測符号化制御プログラムおよびそのプログラムを記録した記録媒体
KR20170107377A (ko) 비디오 스트림을 인코딩하는 방법 및 시스템
EP3131295A1 (en) Video encoding method and system
US8792562B2 (en) Moving image encoding apparatus and method for controlling the same
KR102446097B1 (ko) 비디오 시퀀스의 이미지를 인코딩하기 위한 방법 및 시스템
KR101242560B1 (ko) 탐색 영역 조정 장치 및 방법
EP3809700B1 (en) Periodic intra refresh pattern for video encoding
JP3661711B2 (ja) 画像符号化方法および装置
KR101215138B1 (ko) 매크로블록의 인터/인트라모드 고속 결정 방법
KR100242653B1 (ko) 프레임내 부호화방법 및 그 장치
CN114449281A (zh) 一种基于场景变动的智能码率控制优化方法
Beak et al. Content Awareness-Based Fast Block Motion Estimation Algorithm for H. 264/AVC Encoding System

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201023

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20201023

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210208

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210608

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210616

R150 Certificate of patent or registration of utility model

Ref document number: 6900452

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150