JP2022064307A - 画像処理デバイス、カメラ、およびビデオ画像のシーケンスをエンコードするための方法 - Google Patents

画像処理デバイス、カメラ、およびビデオ画像のシーケンスをエンコードするための方法 Download PDF

Info

Publication number
JP2022064307A
JP2022064307A JP2021165279A JP2021165279A JP2022064307A JP 2022064307 A JP2022064307 A JP 2022064307A JP 2021165279 A JP2021165279 A JP 2021165279A JP 2021165279 A JP2021165279 A JP 2021165279A JP 2022064307 A JP2022064307 A JP 2022064307A
Authority
JP
Japan
Prior art keywords
frames
base layer
frame
sequence
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021165279A
Other languages
English (en)
Other versions
JP7346518B2 (ja
JP2022064307A5 (ja
Inventor
フレードリク ピール,
Pihl Fredrik
マッツ ルンド,
Lund Mats
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Axis AB
Original Assignee
Axis AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axis AB filed Critical Axis AB
Publication of JP2022064307A publication Critical patent/JP2022064307A/ja
Publication of JP2022064307A5 publication Critical patent/JP2022064307A5/ja
Application granted granted Critical
Publication of JP7346518B2 publication Critical patent/JP7346518B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation
    • H04N5/9261Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction
    • H04N5/9262Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Figure 2022064307000001
【課題】動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームにエンコードする方法を提供する。
【解決手段】方法は、ビデオ画像のシーケンスを、ベース層解像度及びベース層圧縮レベルを使用して、単一ビデオストリームのベース層のフレームにエンコードし、イベントトリガーを検出する前の夫々の時間に対応するビデオ画像のシーケンスのビデオ画像を、単一ビデオストリームの拡張層のフレームの第1のセットにエンコードする。フレームの第1のセットのフレームは、ベース層の対応するフレームのエンコーディングによらず、空フレームである。方法はさらに、イベントトリガーを検出すると、検出後の夫々の時間に対応するビデオ画像のシーケンスのビデオ画像を、ベース層解像度より高い解像度又はベース層圧縮レベルより低い圧縮レベルを使用して、拡張層のフレームの第2のセットにエンコードする。
【選択図】図1

Description

本発明は、ビデオエンコーディングに関し、特に、動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームにエンコードすることに関する。
モニタリングまたは監視のために使用されるカメラの場合、エンコードされるビデオ画像のシーケンスのビットレートは、例えば、エンコードされるビデオ画像のシーケンスが送信および/または記憶されるときに、制限因子になる場合がある。同時に、エンコードされるビデオ画像のシーケンスは、後に、犯罪科学的証拠(forensic evidence)として使用することができ、したがって、できる限り多くの詳細が、エンコードされるビデオ画像のシーケンス内に維持されるべきである。
本発明の目的は、カメラによって生成されるビデオストリームについてビットレート節約を容易にすることである。
第1の態様によれば、動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームにエンコードする方法が提供される。方法において、ビデオ画像のシーケンスは、ベース層解像度およびベース層圧縮レベルを使用して、単一ビデオストリームのベース層のフレームにエンコードされる。イベントトリガーを検出する前のそれぞれの時間に対応するビデオ画像のシーケンスのビデオ画像は、単一ビデオストリームの拡張層のフレームの第1のセットにエンコードされる。フレームの第1のセットのフレームは、ベース層の対応するフレームのエンコーディングによらず、空フレームである。イベントトリガーが検出され、イベントトリガーを検出すると、イベントトリガーを検出した後のそれぞれの時間に対応するビデオ画像のシーケンスのビデオ画像は、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用して、拡張層のフレームの第2のセットにエンコードされる。
イベントトリガーによって、関心事になる場合があるイベントが、起きているかまたは起ころうとしていること、したがって、イベントトリガー後に取り込まれるビデオ画像のシーケンスが、イベントトリガーの前に取り込まれるビデオ画像のシーケンスより大きい関心事であることになる情報を含む場合があることを示すトリガーが意味される。
イベントトリガーを検出することによって、イベントトリガーの検出前の時間に関連するエンコードされるビデオ画像が低減されたビットレートを有し、イベントトリガーの検出後の時間に関連するエンコードされるビデオ画像がより高い解像度またはより低い圧縮レベルを有するように、ビデオ画像のシーケンスの画像のエンコーディングを適応させることが可能である。
空フレームは、ここでは、空フレームが依存するエンコード済みフレーム内に設けられる情報に対してほとんどまたは全く付加情報を含まないエンコード済みフレームを指すことを意図される。例えば、拡張層の空フレームは、ベース層の対応するエンコード済みフレーム内に設けられる情報に対してほとんどまたは全く付加情報を含まないエンコード済みフレームである。ベース層の対応するエンコード済みフレームに対して、ほとんど、または好ましくは全く付加情報を持たないことによって、拡張層の空フレームは、少ないまたは最小のビット数を必要とすることになる。
ベース層の対応するフレームのエンコーディングによらず、イベントトリガーを検出する前のそれぞれの時間に対応するビデオ画像のシーケンスの画像を、拡張層の空フレームにエンコードすることによって、ビットレートを低減することができる。ベース層の空でないフレームにエンコードされる画像の場合、ベース層の空でないフレームのエンコーディングによらず、画像を拡張層の空フレームにエンコードすることは、ベース層のフレームのエンコーディングが考慮されていたと思われる場合に必要とされたと思われるよりも少ないビットを必要とする。後者の場合、すなわち、ベース層のフレームのエンコーディングが考慮されていたと思われるとき、画像は、拡張層の空でないフレームにもエンコードされていたと思われ、それは、より多くのビットを必要にしたと思われる。
フレームの第1のセットの空フレームは、フレームのそれぞれの大多数のブロックについてスキップブロックを使用してエンコードされたフレームであるとすることができる。
フレームの第1のセットの空フレームは、フレームのそれぞれのブロックの全てについてスキップブロックを使用してエンコードされたフレームであるとすることができる。
スキップブロックは、それについての画像情報がデコーダーに送信されないブロックである;ブロックがスキップブロックであるという指示のみである。デコーダー側で、拡張層のフレームのスキップブロックは、識別され、ベース層の対応するフレームの対応するブロックに関して、付加情報がエンハンスメントのために提供されないことを示すことになる。ブロックは、使用されるエンコーディングフォーマットに応じて、ブロックまたはマクロブロックまたはコーディングツリーユニットを意味することもできるピクセルの群である。
拡張層のフレームの第2のセットのフレームは、ベース層の対応するフレームに依存する予測を使用してエンコードされるインターフレームである。
第2の態様によれば、動的ビットレートを用いてビデオ画像のシーケンスを送信する方法が提供される。第2の態様の方法において、ビデオ画像のシーケンスは、第1の態様の方法に従ってエンコードされる。単一ビデオストリームは、その後、送信され、フレームの第1のセットは送信されるのを阻止される。
第3の態様によれば、非一時的コンピュータ可読記憶媒体が提供される。非一時的コンピュータ可読記憶媒体は、処理能力を有するデバイス上で実行されると、第1の態様による方法または第2の態様による方法を実装するための命令を、非一時的コンピュータ可読記憶媒体上に記憶している。
第4の態様によれば、動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームにエンコードするための画像処理デバイスが提供される。画像処理デバイスは、ベース層エンコーディング関数および拡張層エンコーディング関数を実行するように構成されるエンコーダーを備える。ベース層エンコーディング関数は、ベース層解像度およびベース層圧縮レベルを使用して、ビデオ画像のシーケンスを単一ビデオストリームのベース層のフレームにエンコードするように構成される。拡張層エンコーディング関数は、ビデオ画像のシーケンスを、単一ビデオストリームの拡張層のフレームエンコードするように構成される。画像処理デバイスは、プレイベント指令関数、イベントトリガー検出関数、およびポストイベント指令関数を実行するように構成される回路をさらに備える。プレイベント指令関数は、イベントトリガーを検出する前のそれぞれの時間に対応するビデオ画像のシーケンスのビデオ画像を、単一ビデオストリームの拡張層のフレームの第1のセットにエンコードするようにエンコーダーに指令するように構成され、フレームの第1のセットのフレームは、ベース層の対応するフレームのエンコーディングによらず、空フレームである。イベントトリガー検出関数はイベントトリガーを検出するように構成される。ポストイベント指令関数は、イベントトリガーを検出すると、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用して、イベントトリガーを検出した後のそれぞれの時間に対応するビデオ画像のシーケンスのビデオ画像を、拡張層のフレームの第2のセットにエンコードするようにエンコーダーに指令するように構成される。
フレームの第1のセットの空フレームは、フレームのそれぞれの大多数のブロックについてスキップブロックを使用してエンコードされたフレームであるとすることができる。
フレームの第1のセットの空フレームは、フレームのそれぞれのブロックの全てについてスキップブロックを使用してエンコードされたフレームであるとすることができる。
拡張層のフレームの第2のセットのフレームは、ベース層の対応するフレームに依存する予測を使用してエンコードされたインターフレームである。
第5の態様によれば、第4の態様の画像処理デバイスを備えるカメラが提供される。
カメラは、単一ビデオストリームを送信するように構成される送信機をさらに備えることができる。画像処理デバイスの回路は、プレイベント送信阻止関数を実行するようにさらに構成することができる。プレイベント送信阻止関数は、送信機がフレームの第1のセットを送信するのを阻止するように構成される。
本発明の適用性のさらなる範囲は、以下で示す詳細な説明から明らかになるであろう。しかしながら、本発明の範囲内の種々の変更および修正が、この詳細な説明から当業者に明らかになるため、詳細な説明および特定の例が、本発明の好ましい実施形態を示しながら、例証としてのみ示されることが理解されるべきである。
したがって、本発明が、説明するデバイスの特定のコンポーネント部品または説明する方法の特定の行為に限定されず、なぜならば、そのようなデバイスおよび方法が変動する場合があるからであることが理解される。本明細書で使用される用語が特定の実施形態を述べるためのものに過ぎず、制限的であることを意図されないことも理解される。本明細書および添付特許請求の範囲で使用するとき、冠詞「1つの(a)」、「1つの(an)」、「その(the)」、および「前記(said)」が、別段に文脈が明確に指示しない限り、要素の1つまたは複数が存在することを意味することを意図されることが留意されなければならない。そのため、例えば、「1つのユニット(a unit)」または「そのユニット(the unit)」に対する参照は、幾つかのデバイスおよび同様なものを含むことができる。さらに、語「備えている(comprising)」、「含んでいる(including)」、「含んでいる(containing)」、および同様な語は、他の要素またはステップを排除しない。
本発明の上記のおよび他の態様は、ここで、添付図を参照してより詳細に説明される。図は、制限的であると考えられるべきであるのではなく、代わりに、説明し理解するために使用される。同様の参照符号は全体を通して同様の要素を指す。
動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームにエンコードする方法の実施形態のフローチャートである。 動的ビットレートを用いてビデオ画像のシーケンスを送信する方法の実施形態のフローチャートである。 動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームにエンコードするための方法の実施形態のフローチャートである。 エンコード済みビデオストリームの層状構造の概略ブロックダイアグラムである。 カメラに含まれる画像処理デバイスの概略ブロックダイアグラムである。
本発明は、ここで、現在のところ好ましい本発明の実施形態が示される添付図面を参照して以降でより完全に述べられるであろう。しかしながら、本発明は、多くの異なる形態で具現化することができ、本明細書で述べる実施形態に限定されるものと解釈されるべきでない。むしろ、これらの実施形態は、徹底さおよび完全さ(thoroughness and completeness)のために、また、本発明の範囲を当業者に完全に伝えるために提供される。
図1は、動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームにエンコードする方法100の実施形態のフローチャートである。方法において、ビデオ画像のシーケンスは、ベース層解像度およびベース層圧縮レベルを使用して、単一ビデオストリームのベース層のフレームにエンコードされるS110。イベントトリガーを検出する前のそれぞれの時間に対応するビデオ画像のシーケンスのビデオ画像は、単一ビデオストリームの拡張層のフレームの第1のセットにエンコードされるS120。フレームの第1のセットのフレームは、ベース層の対応するフレームのエンコーディングによらず、空フレームである。イベントトリガーが検出されS130、イベントトリガーを検出すると、イベントトリガーを検出した後のそれぞれの時間に対応するビデオ画像のシーケンスのビデオ画像は、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用して、拡張層のフレームの第2のセットにエンコードされるS140。
方法100は、スケーラブルコーディングを使用し、ベース層解像度およびベース層圧縮レベルを使用するベース層のエンコード済みフレームは、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用する拡張層のエンコード済みフレームで補完される。より高い解像度を使用することは、ベース層の対応するフレームと組合されて、ベース層のフレームのベース解像度より高い解像度を有する画像を、デコーダーにおいてデコードすることができるような情報を、拡張層のフレームが含むことを意味する。より低い圧縮レベルを使用することは、ベース層の対応するフレームと組合されて、ベース層のフレームのベース圧縮レベルより低い圧縮を有する画像を、デコーダーにおいてデコードすることができるような情報を、拡張層のフレームが含むことを意味する。圧縮レベルは、例えば、量子化パラメータに関して設定することができる。そのようなスケーラブルコーディングの例は、AV1およびビデオコーディング規格HEVC/H.265に対する拡張スケーラブル高効率ビデオコーディング(SHVC:Scalable High efficiency Video Coding)において等で知られている。本明細書で開示される方法の新規な態様は、イベントトリガーを検出した後のそれぞれの時間に関連するビデオ画像のシーケンスの画像を、ベース層の対応するフレームのエンコーディングによらず、拡張層内の空フレームにエンコードすることである。
拡張層の空フレームは、ベース層の対応するエンコード済みフレーム内に設けられる情報に対してほとんどまたは全く付加情報を含まないエンコード済みフレームである。ベース層の対応するエンコード済みフレームに対して、ほとんど、または好ましくは全く付加情報を持たないことによって、拡張層の空フレームは、少ないまたは最小のビット数を必要とすることになる。例えば、フレームの第1のセット等の拡張層の空フレームは、フレームのそれぞれの大多数のブロックについてスキップブロックを使用してエンコードされたフレームであるとすることができる。代替法として、フレームの第1のセット等の拡張層の空フレームは、フレームのそれぞれのブロックの全てについてスキップブロックを使用してエンコードされたフレームであるとすることができる。
スキップブロックは、それについての画像情報がデコーダーに送信されないブロックである;ブロックがスキップブロックであるという指示のみである。ブロックは、ここでは、エンコーディング中に共に処理されるピクセルの群を指すために使用される。ブロックは、使用されるエンコーディングフォーマットに応じて、マクロブロックまたはコーディングツリーユニットを意味することもできる。そのようなブロックについての用語は、エンコーディングフォーマット間で異なる場合もあり、幾つかのエンコーディングフォーマットにおいて、完全フレームは、画像情報を含まないことを示すことができる。例えば、完全フレームは、直前のフレームが反復されるべきであることを示す反復フレームとして示すことができる。図1の方法に関連して、反復フレームとしてエンコードされるフレームの第1のセットは、ベース層の対応するフレームに対してさらなる画像情報を含まないとしてデコーダーに示されることになる。フレームの第1のセットが反復フレームであるというデコーダーに対するそのような指示は、ヘッダー内で合図される、すなわち、必ずしも、その指示を含むフレームを送信することによって合図されるわけではない。そのような反復フレームは、例えば、AV1において使用され、その特徴は、「show_existing_frame」を意味する。
イベントトリガーは、関心事になる場合があるイベントが、起きているかまたは起ころうとしていること、したがって、イベントトリガー後に取り込まれるビデオ画像のシーケンスが、イベントトリガー前に取り込まれるビデオ画像のシーケンスより大きい関心事であることになる情報を含む場合があることを示す、幾つかの異なる事物であるとすることができる。例えば、イベントトリガーは、銃声、窓破り等を識別する音声分析に基づくことができる。イベントトリガーは、誰もいないと予想される建物内の音のような、音が予想されないときに識別される任意の音に単に関連することもできる。イベントトリガーは、誰もいないと予想される建物内の動きのような、動きが予想されないときの動きを識別する画像分析に基づくこともできる。そのような動きは、動きセンサによって検出することもできる。他のイベントトリガーは、ドアまたは窓の開放である場合がある。イベントトリガーは、エンコードされるビデオ画像を取り込む身体装着式カメラを人が使用する等、人による能動的指示である場合もある。例えば、身体装着式カメラを装着する人は、ボタンを押すかまたは任意の他の適切なインターフェースを使用することによって、イベントトリガーが検出されることを示すことができる。
拡張層の空フレームのエンコーディングは、時として、ベース層の対応するフレームのエンコーディングによって既知の方法でも起こる。例えば、ベース層のフレーム自身が空フレームとしてエンコードされる場合、拡張層の対応するフレームは、ベース層フレームをエンハンスすることができず、その結果、空フレームとしてエンコードされることになる。方法100によれば、イベントトリガーを検出する前のそれぞれの時間に対応するビデオ画像のシーケンスのビデオ画像は、拡張層のフレームの第1のセットにエンコードされS120、フレームの第1のセットのフレームは、ベース層の対応するフレームのエンコーディングによらず、空フレームである。したがって、ベース層の対応するフレームのエンコーディングによらず、フレームの第1のセットは空フレームとしてエンコードされる。特に、フレームの第1のセットは、ベース層の対応するフレームが空でないフレームとしてエンコードされても空フレームとしてエンコードされる。これは、フレームの第1のセットが、対応するベース層フレームに応じてエンコードされた場合に関連して、単一ビデオストリームのビットレートの低減をもたらすことになる。なぜならば、対応するベース層フレームが空でないフレームであった場合に、フレームの第1のセットが空でないフレームとしてエンコードされることになるからである。ビットレート低減は、ベース層の対応するフレームが空でないフレームとしてエンコードされるときに空フレームとしてエンコードされる拡張層の全てのフレームについて達成される。ビットレート低減は、ベース層の対応するフレームが空でないフレームとしてエンコードされるときに空フレームとしてエンコードされる拡張層のフレームの部分に応じて高くなることになる。したがって、イベントトリガーが検出される前の時間に対応する拡張層のフレームの一部が空でないフレームとしてエンコードされても、ベース層の対応するフレームが空でないフレームとしてエンコードされるときに、拡張層のフレームの一部が空フレームとしてエンコードされる限りビットレート低減が存在することになる。
方法100によれば、イベントトリガーを検出した後のそれぞれの時間に対応するビデオ画像のシーケンスのビデオ画像は、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用して、拡張層のフレームの第2のセットにエンコードされるS140。方法100は、イベントトリガーが検出される前にビットレートを低減することを主に対象とする。イベントトリガーが検出されたS130後、拡張層のフレームは、好ましくは、エンコードされるビデオストリームをエンハンスするために使用されるべきである。これは、関心事になる場合があるイベントが、起きているかまたは起ころうとしていること、イベントトリガー後に取り込まれるビデオ画像のシーケンスが、イベントトリガー前に取り込まれるビデオ画像のシーケンスより大きい関心事であることになる情報を含む場合があることを、イベントトリガーが示すからである。したがって、イベントトリガーが検出されたS130後、拡張層のフレームは、好ましくは、ベース層の対応するフレームが空フレームとしてエンコードされなければ、空フレームとしてエンコードされるべきでない。
方法は、プレバッファの使用と組み合わすことができる。プレバッファにおいて、所定の時間に対応するフレームは、先入れ先出し方式で一時的に記憶される。ここで、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用する拡張層のフレームを、イベントトリガーの検出前に同様にエンコードし、プレバッファに記憶することができる。これは、イベントトリガーの検出前に、ベース層の対応するフレームのエンコーディングによらず、拡張層のフレームを空フレームとしてエンコードすることと並列に行われる。プレバッファのフレームは、プレバッファのサイズに対応する所定の時間以内でイベントトリガーが検出されなければ、永続的な記憶または送信のために使用されない。したがって、フレームをエンコードし、それをプレバッファに記憶することから、プレバッファのサイズに対応する所定の時間以内でイベントトリガーが検出されない場合、そのフレームは廃棄されることになる。しかしながら、フレームをエンコードすることから、プレバッファのサイズに対応する所定の時間以内でイベントトリガーが検出される場合、フレームは、送信または永続的に記憶するために使用されることになる。これは、イベントトリガーを検出する前の所定の時間でエンコードされる、ベース層解像度より高い解像度またはより低い圧縮レベルを有するフレームの送信または永続的な記憶の包含を可能にする。したがって、イベントトリガーの検出において、現在、プリバッファ内にある全てのフレームまたはフレームの一部を、永続的な記憶または送信のために使用することができる。
エンコードされたフレームI、P1、P2、P3、P4を含むベース層BL及びエンコードされたフレームP0’、P1’、P2’、P3’、P4’を含む拡張層ELの形態の層を有するスケーラブルエンコーディング構造を示す図2を参照する。ベース層BLのエンコードされたフレームは、イントラフレームIおよび4つのインターフレームP1、P2、P3、P4を含む。拡張層ELのエンコードされたフレームは、5つのインターフレームP0’、P1’、P2’、P3’、P4’を含む。ベース層は、ベース層解像度およびベース層品質レベルを使用するフレームI、P1、P2、P3、P4を含む。拡張層ELフレームP0’、P1’、P2’、P3’、P4’は、ベース層BLのエンコードされたフレームI、P1、P2、P3、P4と共に、エンハンスされエンコードされたビデオストリームを形成し、エンハンスされエンコードされたビデオストリームを、デコーダー側で、エンハンスされデコードされたビデオストリームにデコードすることができる。拡張層ELのエンコードされたフレームP0’、P1’、P2’、P3’、P4’は、エンコードされたビデオストリームをエンハンスする異なる方法を使用する。拡張層ELのフレームP0’、P1’、P2’、P3’、P4’は、ベース層解像度より高い解像度を使用することができる、または、それらはより低い圧縮レベルを使用することができる。ベース層BLのエンコードされたフレームI、P1、P2、P3、P4は、拡張層ELのエンコードされたフレームP0’、P1’、P2’、P3’、P4’と独立である。デコーダー側で、ベース層BLフレームI、P1、P2、P3、P4は、拡張層のフレームP0’、P1’、P2’、P3’、P4’と別々に、デコードされたフレームにデコードすることができる。拡張層ELのエンコードされたフレームP0’、P1’、P2’、P3’、P4’は、ベース層BLのエンコードされたフレームI、P1、P2、P3、P4に依存する。
図1に関連して説明した方法によってエンコードされるビデオ画像のシーケンスに関連して、イベントトリガーETは、例えば、図2に示すように、拡張層EL内の3番目のエンコード済みフレームP2’と4番目のフレームP3’との間で検出されている場合がある。イベントトリガーETが検出される前の時間に関連する拡張層ELの最初の3つのエンコード済みフレームP0’、P1’、P2’は、その後、空フレームとしてエンコードされたと思われ、イベントトリガーETが検出された後の時間に関連する拡張層ELの最後の2つのエンコード済みフレームP3’、P4’は、その後、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用してエンコードされたと思われる。
図2に示すインターフレームの数は、単に例証のためのものである。インターフレーム間におけるエンコード済みフレームの数は、任意の適切な数に設定することができる。
拡張層ELのフレームがPフレームとしてエンコードされることに対する代替法において、拡張層ELのフレームを、Bフレームとしてエンコードすることもできる。
図2において、ベース層および拡張層の形態の2つの層が示されるが、例えば、第1の拡張層および第2の拡張層が存在するようにさらなる拡張層を付加すること等、1つまたは複数のさらなる層を付加することができる。例えば、エンコーディングは、イベント前に関してだけでなく、イベントの重要性に関しても適応することができる。イベントトリガーの任意の検出前に、画像は、第1の拡張層と第2の拡張層の両方において空フレームとしてエンコードされる。低い重要性のイベントに関連するイベントトリガーを検出した後、画像は、第2の拡張層において空フレームとして、および、第1の拡張層においてより高い解像度またはより低い圧縮レベルを有するフレームとしてエンコードされる。高い重要性のイベントに関連するイベントトリガーを検出した後、画像は、第1の拡張層と第2の拡張層の両方においてより高い解像度またはより低い圧縮レベルを有するフレームとしてエンコードされる。代替的に、3つ以上のさらなる拡張層の場合、ビットレートは、拡張層のより多くに空フレームを導入することによって、段階的に減少することができる。これは、エンコード済みビデオストリーム内の詳細についてのその時判定される必要性に基づいて行うことができる。
図3は、動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームに送信する方法300の実施形態のフローチャートである。ビデオ画像のシーケンスは、図1に関連して説明した方法100に従って最初に単一ビデオストリームにエンコードされた。単一ビデオストリームは、その後、送信されS310、イベントトリガーが検出される前のそれぞれの時間に対応する画像からエンコードされたフレームであるフレームの第1のセットは送信するのを阻止される。イベントトリガーを検出した後のそれぞれの時間に対応する画像からエンコードされたフレームであるフレームの第2のセットは、一方で通常送信される。ベース層のフレームも、通常送信される。
換言すれば、2つの異なる層が1つのビデオストリームにエンコードされても、エンコード済みビデオストリームが送信されるとき、2つの送信モードについての選択を行うことができる。第1の送信モードにおいて、拡張層のエンコード済みフレームは送信するのを阻止され、エンコード済みビデオストリームのベース層のエンコード済みフレームのみが送信され、第2の送信モードにおいて、エンコード済みビデオストリームのベース層のエンコード済みフレームおよび拡張層のエンコード済みフレームが共に送信される。そして、第1の送信モードは、イベントトリガーが検出される前に使用され、第2の送信モードは、イベントが検出された後に使用される。
図4は、動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームにエンコードする方法400の実施形態のフローチャートである。エンコーディング用の画像は、例えば、画像センサから画像を受信することによって得られるS410。得られたフレームは、その後、ベース層解像度およびベース層品質レベルを有するベース層のフレームにエンコードされるS420。C425イベントトリガーが検出されていない場合、得られた画像は、ベース層内のフレームのエンコーディングによらず、拡張層の空フレームにエンコードされS440、方法400は、エンコーディング用のさらなる画像を得るS410ことによって継続する。C425イベントトリガーが検出された場合、得られた画像は、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用して拡張層のフレームにエンコードされS430、方法400は、エンコーディング用のさらなる画像を得るS410ことによって継続する。イベントトリガーが検出されると、検出後に受信されたフレームは、条件がリセットされるまで、すなわち、イベントトリガーが検出される条件を真でなくするまで、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用して拡張層のフレームにエンコードされるS430ことになる。これは、所定の期間後に、あるいは、イベントの終了の検出または任意の他の適切な方法によって、手作業で行うことができる。目標は、条件のリセットまで、または、イベントが起こっている限り、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用して拡張層のフレームに画像をエンコードし続けることである。
図5は、画像データを取り込むように構成される画像センサ510を備えるカメラ505に関連して、本開示による画像処理デバイス500の実施形態を示す。カメラ505は、身体装着式カメラBWC(:body worn camera)または別の可動カメラであるとすることができる、または、カメラ505は、固定カメラ、例えば、モニタリングカメラまたは監視カメラであるとすることができる。カメラ505は、別個のユニットであるとすることができる、または、カメラ505は、ヘルメット、メガネ等内に等、別のユニットに統合することができる。カメラ505は、パトロールおよび出来事の間にビデオおよびおそらくは他のデータを取り込むために、例えば警察官が使用することができる、または、カメラ505は、或るエリアをモニターするために使用することができる。取り込まれたデータは、その後、例えば、犯罪を調査し、犯罪が疑われる犯人を訴追するときに、証拠として必要とされる場合がある。取り込まれたデータを保存するために、ビデオ管理システムまたは証拠管理システム等の、カメラ505から外部のデータ管理システムを使用することができる。そのようなデータ管理システムは、一般に、取り込まれたデータの記憶および同様に取り込まれたデータの閲覧を、リアルタイムにまたは記録データの再生として提供する。カメラ505は、例えば、データ管理システムに対する、または、ライブ映像が閲覧されるセントラル(central)に対する、データストレージの制限および/または無線接続のための帯域幅の制限によって、ビットレート制限を受ける場合がある。さらに、接続についての帯域幅の制限は経時的に変動する場合がり、それにより、ビットレートは、時として、さらに一層制限される。
画像処理デバイスはエンコーダー520および回路530を備える。画像センサ510は画像データを取り込むように構成される。画像データは、例えば、画像フレームのデータであるとすることができる。画像センサおよび画像データの取り込みは、当業者によく知られており、本開示においてより詳細に論じられない。
エンコーダー520は、例えば、カメラ505の画像センサ510によって取り込まれた画像データをビデオストリームにエンコードするように構成され、時として、エンコーダー520によって提供されるビデオストリームは、エンコード済みビデオストリームと呼ばれる。典型的には、ビデオエンコーダー520は、ビデオストリームの画像の一部をイントラフレームまたはキーフレームとして、また、ビデオストリームの画像の一部をインターフレームまたはデルタフレームとしてエンコードするように構成される。イントラフレームは、他のエンコード済みビデオフレームからの情報がデコードされることを必要としないエンコード済みビデオフレームである。したがって、イントラフレームは、イントラフレームがそれに対応するように設定されるビデオデータの画像フレームからの情報に基づいてエンコードされる。典型的には、画像フレーム内の類似性が、画像をイントラフレームにエンコードするために使用される。ビデオエンコーディングにおいて、イントラフレームは、しばしばIフレームと呼ばれる。2つのイントラフレーム間のビデオストリームの画像はインターフレームとしてエンコードされる。典型的には、インターフレームは、1つのフレームから次のフレームまでに起こる変化を含むだけである。したがって、インターフレームは、典型的には、イントラレームより少ないデータを含む。ビデオエンコーディングにおいて、インターフレームは、しばしばPフレームまたはBフレームと呼ばれる。Pフレームはデータ参照のための直前フレームを指す。したがって、直前フレームのコンテンツは、Pフレームをデコードするためにわかっていなければならない。Bフレームは、データ参照のための直前フレームと前方フレームの両方を指すことができる。したがって、直前フレームと前方フレームの両方のコンテンツは、Bフレームをデコードするためにわかっていなければならない。画像をインターフレームにエンコードするとき、画像はピクセルの複数の群に分割される。ピクセルの群は、例えば、ブロック、マクロブロック、またはコーディングツリーユニットと呼ぶことができる。画像は参照画像と比較される。例えば、Pフレームをエンコードするための参照画像は、直前の画像である。エンコードされる画像フレームと参照フレームとの間のピクセルの一致する群を識別するために照合アルゴリズム(matching algorithm)が使用され、ピクセルの或る群について一致が見出される場合、ピクセルのその群は、参照フレーム以来、ピクセルの群が画像フレーム内でどの程度移動したかを指定する動きベクトルとしてエンコードすることができる。動きベクトルを決定することは、時として、動き推定(motion estimation)と呼ばれる。カメラまたは取り込まれるシーン内のオブジェクトの速い運動によって動きが大きい場合、動き推定は、動きベクトルを推定することに失敗する場合がある。エンコードされる画像フレームについて識別される動きベクトルが少なければ少ないほど、結果として得られるエンコード済みインターフレームは、ビットサイズが大きくなることになり、したがって、エンコード済みビデオストリームのビットレートに対する寄与が大きいことになる。
エンコーダー520は、ベース層エンコーディング関数581および拡張層エンコーディング関数582を実行するように構成される。ベース層エンコーディング関数581は、ベース層解像度およびベース圧縮レベルを使用して、ビデオ画像のシーケンスを単一ビデオストリームのベース層のフレームにエンコードするように構成される。拡張層エンコーディング関数582は、ビデオ画像のシーケンスを、単一ビデオストリームの拡張層のフレームにエンコードするように構成される。
回路530は、画像処理デバイス500の関数を実施するように構成される。回路530は、中央処理ユニット(CPU)、マイクロコントローラー、またはマイクロプロセッサ等のプロセッサ532を含むことができる。プロセッサ532は、プログラムコードを実行するように構成される。プログラムコードは、例えば、ウェアラブルカメラ505の関数を実施するように構成することができる。
画像処理デバイス500はメモリ540をさらに備えることができる。メモリ540は、バッファ、フラッシュメモリ、ハードドライブ、取り外し可能媒体、揮発性メモリ、不揮発性メモリ、ランダムアクセスメモリ(RAM)、または別の適切なデバイスのうちの1つまたは複数であるとすることができる。典型的な配置構成において、メモリ540は、長期データ記憶のための不揮発性メモリ、および、回路530用のシステムメモリとして機能する揮発性メモリを含むことができる。メモリ540は、データバスを通じて回路530とデータを交換することができる。付随する制御ラインおよびメモリ540と回路530との間のアドレスバスが存在することもできる。
画像処理デバイス500の関数は、実行可能論理ルーチン(例えば、コード行(lines of code)、ソフトウェアプログラム等)の形態で具現化することができ、実行可能論理ルーチンは、カメラ505の非一時的コンピュータ可読媒体(例えば、メモリ540)上に記憶され、カメラ回路530によって(例えば、プロセッサ532を使用して)実行される。さらに、画像処理デバイス500の関数は、独立型ソフトウェアアプリケーションである、または、カメラ505に関連するさらなるタスクを実施するソフトウェアアプリケーションの一部を形成することができる。説明する関数は、回路530の処理ユニット、例えばプロセッサ532がそれを実行するように構成される方法と考えることができる。同様に、説明する関数はソフトウェアで実装することができるが、そのような機能は、専用ハードウェアまたはファームウェア、あるいは、ハードウェア、ファームウェア、および/またはソフトウェアの何らかの組み合わせによって実施することもできる。
回路530は、プレイベント指令関数583、イベントトリガー検出関数584、およびポストイベント指令関数585を実行するように構成される。プレイベント指令関数583は、イベントトリガーを検出する前のそれぞれの時間に対応するビデオ画像のシーケンスのビデオ画像を、単一ビデオストリームの拡張層のフレームの第1のセットにエンコードするようにエンコーダーに指令するように構成され、フレームの第1のセットのフレームは、ベース層の対応するフレームのエンコーディングによらず、空フレームである。イベントトリガー検出関数584は、イベントトリガーを検出するように構成される。ポストイベント指令関数585は、イベントトリガーを検出すると、ベース層解像度より高い解像度またはベース層圧縮レベルより低い圧縮レベルを使用して、イベントトリガーを検出した後のそれぞれの時間に対応するビデオ画像のシーケンスのビデオ画像を、拡張層のフレームの第2のセットにエンコードするようにエンコーダーに指令するように構成される。
カメラ505は、ローカルデータストレージ550をさらに備えることができる。ローカルデータストレージ550はビデオストリームを記憶するように構成することができる。ローカルデータストレージは、典型的には制限されたデータ記憶容量を有する。ローカルデータストレージ550は、ビデオストリームを記憶するのに適する任意のタイプのローカルデータストレージであるとすることができる。例えば、ローカルデータストレージ550は、SDカードリーダーおよびSDカードの形態であるとすることができる。ローカルデータストレージ540の別の例は、フラッシュメモリ、例えばNANDフラッシュの形態であるとすることができる。
カメラ505は送信機560をさらに備えることができる。送信機560は、ビデオストリームを、例えばデータ管理システムに、例えば無線送信するように構成することができる。送信機560は、取り込まれたビデオストリームをデータ管理システムに連続して伝送するように構成することができる。伝送は、典型的には、伝送のために利用可能な帯域幅によって制限される。伝送のために利用可能な帯域幅は、経時的に変動する場合もある。
回路530は、プレイベント送信阻止関数586を実行するようにさらに構成することができる。プレイベント送信阻止関数586は、送信機がフレームの第1のセットを送信するのを阻止するように構成される。
エンコーダー520および回路530によって実施される関数は、図1に関連して説明した方法100、図13に関連して説明した方法300、および図4に関連して説明した方法400の対応するステップとしてさらに適応することができる。
本発明が上記で説明した実施形態に限定されないことを当業者は認識する。逆に、多くの修正および変形が、添付特許請求項の範囲内で可能である。図面、本開示、および添付特許請求の範囲の調査によって、そのような修正および変形を、特許請求される本発明を実施するときに当業者が理解し実施することができる。

Claims (8)

  1. 動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームにエンコードする方法であって、
    ベース層解像度およびベース層圧縮レベルを使用して、ビデオ画像の前記シーケンスを前記単一ビデオストリームのベース層のフレームにエンコードすること、
    イベントトリガーを検出する前のそれぞれの時間に対応するビデオ画像の前記シーケンスのビデオ画像を、前記単一ビデオストリームの拡張層のフレームの第1のセットにエンコードすることであって、フレームの前記第1のセットは、前記ベース層の対応するフレームのエンコーディングによらず、空フレームであり、前記空フレームは、前記フレームのそれぞれの全てのブロックについてスキップブロックを使用してエンコードされたフレームであり、前記イベントトリガーは、関心事になる場合があるイベントが、起きているかまたは起ころうとしていること、および、前記イベントトリガー後のそれぞれの時間に対応するビデオ画像の前記シーケンスのビデオ画像が、前記イベントトリガーの前のそれぞれの時間に対応するビデオ画像の前記シーケンスの前記ビデオ画像より大きい関心事であることになる情報を含む場合があることを示す、ビデオ画像をエンコードすること、
    前記イベントトリガーを検出すること、および、
    前記イベントトリガーを検出すると、前記ベース層解像度より高い解像度または前記ベース層圧縮レベルより低い圧縮レベルを使用して、前記イベントトリガーを検出した後のそれぞれの時間に対応するビデオ画像の前記シーケンスの前記ビデオ画像を、前記単一ビデオストリームの前記拡張層のフレームの第2のセットにエンコードすること
    を含む、方法。
  2. 前記拡張層のフレームの前記第2のセットの前記フレームは、前記ベース層の対応するフレームに依存する予測を使用してエンコードされたインターフレームである、請求項1に記載の方法。
  3. 動的ビットレートを用いてビデオ画像のシーケンスを送信する方法であって、
    請求項1または2に記載の方法に従って、ビデオ画像の前記シーケンスをエンコードすること、
    前記ベース層の前記フレームおよび前記単一ビデオストリームの前記拡張層のフレームの前記第2のセットを送信することであって、フレームの前記第1のセットは送信されるのを阻止される、送信すること
    を含む、方法。
  4. 非一時的コンピュータ可読記憶媒体であって、処理能力を有するデバイス上で実行されると、請求項1から3のいずれか一項に記載の方法を実装するための命令を、非一時的コンピュータ可読記憶媒体上に記憶している、非一時的コンピュータ可読記憶媒体。
  5. 動的ビットレートを用いてビデオ画像のシーケンスを単一ビデオストリームにエンコードするための画像処理デバイスであって、
    エンコーダーであって、
    ベース層解像度およびベース層圧縮レベルを使用して、ビデオ画像の前記シーケンスを前記単一ビデオストリームのベース層のフレームにエンコードするように構成されるベース層エンコーディング関数、
    ビデオ画像の前記シーケンスを、前記単一ビデオストリームの拡張層のフレームにエンコードするように構成される拡張層エンコーディング関数
    を実行するように構成される、エンコーダーと、
    回路であって、
    イベントトリガーを検出する前のそれぞれの時間に対応するビデオ画像の前記シーケンスのビデオ画像を、前記単一ビデオストリームの前記拡張層のフレームの第1のセットにエンコードするように前記エンコーダーに指令するように構成されるプレイベント指令関数であって、フレームの前記第1のセットは、前記ベース層の対応するフレームの前記エンコーディングによらず、空フレームであり、前記空フレームは、前記フレームのそれぞれの全てのブロックについてスキップブロックを使用してエンコードされたフレームであり、前記イベントトリガーは、関心事になる場合があるイベントが、起きているかまたは起ころうとしていること、および、前記イベントトリガー後のそれぞれの時間に対応するビデオ画像の前記シーケンスのビデオ画像が、前記イベントトリガーの前のそれぞれの時間に対応するビデオ画像の前記シーケンスの前記ビデオ画像より大きい関心事であることになる情報を含む場合があることを示す、プレイベント指令関数、
    前記イベントトリガーを検出するように構成されるイベントトリガー検出関数、
    前記イベントトリガーを検出すると、前記ベース層解像度より高い解像度または前記ベース層圧縮レベルより低い圧縮レベルを使用して、前記イベントトリガーを検出した後のそれぞれの時間に対応するビデオ画像の前記シーケンスの前記ビデオ画像を、前記単一ビデオストリームの前記拡張層のフレームの第2のセットにエンコードするように前記エンコーダーに指令するように構成されるポストイベント指令関数
    を実行するように構成される回路、
    を備えた、画像処理デバイス。
  6. 前記拡張層のフレームの前記第2のセットの前記フレームは、前記ベース層の対応するフレームに依存する予測を使用してエンコードされたインターフレームである、請求項5に記載の画像処理デバイス。
  7. 請求項5または6に記載の前記画像処理デバイスを備えるカメラ。
  8. 前記ベース層の前記フレームおよび前記単一ビデオストリームの前記拡張層のフレームの前記第2のセットを送信するように構成される送信機をさらに備え、
    前記画像処理デバイスの前記回路は、
    前記送信機がフレームの前記第1のセットを送信するのを阻止するように構成されるプレイベント送信阻止関数
    を実行するようにさらに構成される、請求項7に記載のカメラ。
JP2021165279A 2020-10-13 2021-10-07 画像処理デバイス、カメラ、およびビデオ画像のシーケンスをエンコードするための方法 Active JP7346518B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP20201591 2020-10-13
EP20201591.3A EP3985974B1 (en) 2020-10-13 2020-10-13 An image processing device, a camera and a method for encoding a sequence of video images

Publications (3)

Publication Number Publication Date
JP2022064307A true JP2022064307A (ja) 2022-04-25
JP2022064307A5 JP2022064307A5 (ja) 2023-08-02
JP7346518B2 JP7346518B2 (ja) 2023-09-19

Family

ID=72852500

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021165279A Active JP7346518B2 (ja) 2020-10-13 2021-10-07 画像処理デバイス、カメラ、およびビデオ画像のシーケンスをエンコードするための方法

Country Status (6)

Country Link
US (1) US11477459B2 (ja)
EP (1) EP3985974B1 (ja)
JP (1) JP7346518B2 (ja)
KR (1) KR102489396B1 (ja)
CN (1) CN114422798B (ja)
TW (1) TWI838649B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3985976B1 (en) * 2020-10-16 2022-09-28 Axis AB Method of encoding an image including a privacy mask
EP4270939B1 (en) * 2022-04-25 2024-03-27 Axis AB System and method for adding one additional image frame or a sequence of additional image frames to a stream of encoded image frames

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005260912A (ja) * 2004-02-10 2005-09-22 Matsushita Electric Ind Co Ltd 映像通信装置および映像通信方法
WO2007076486A2 (en) * 2005-12-22 2007-07-05 Vidyo, Inc. System and method for videoconferencing using scalable video coding and compositing scalable video conferencing servers
US20070230575A1 (en) * 2006-04-04 2007-10-04 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding using extended macro-block skip mode
JP2009540629A (ja) * 2006-03-03 2009-11-19 ヴィドヨ,インコーポレーテッド スケーラブルビデオ通信でエラー耐性、ランダムアクセス、およびレート制御を提供するシステムおよび方法
US20100128786A1 (en) * 2007-04-23 2010-05-27 Yong Ying Gao Method and apparatus for encoding video data, method and apparatus for decoding encoded video data and encoded video signal

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020080878A1 (en) 2000-10-12 2002-06-27 Webcast Technologies, Inc. Video apparatus and method for digital video enhancement
US8879635B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Methods and device for data alignment with time domain boundary
US8619865B2 (en) * 2006-02-16 2013-12-31 Vidyo, Inc. System and method for thinning of scalable video coding bit-streams
CN101383962B (zh) * 2007-09-07 2010-12-01 武汉大学 基于感兴趣区域的低码率空域增强层编解码方法
KR20130037161A (ko) * 2011-10-05 2013-04-15 한국전자통신연구원 스케일러블 비디오 코딩을 위한 향상된 계층간 움직임 정보 예측 방법 및 그 장치
US9179155B1 (en) * 2012-06-14 2015-11-03 Google Inc. Skipped macroblock video encoding enhancements
CN104380740A (zh) * 2012-06-29 2015-02-25 索尼公司 编码装置、编码方法、解码装置和解码方法
GB2516826B (en) * 2013-07-23 2016-06-22 Canon Kk Method, device and computer program for encapsulating partitioned timed media data by creating tracks to be independently encapsulated in at least one media f
FR3026260B1 (fr) * 2014-09-22 2018-03-23 Airbus Ds Sas Procede de transmission d'images de surveillance video
MX2017008774A (es) * 2014-12-31 2018-02-13 Nokia Technologies Oy Prediccion inter-capa para codificacion y decodificacion de video escalable.
EP3151562B1 (en) 2015-09-29 2020-06-17 Dolby Laboratories Licensing Corporation Feature based bitrate allocation in non-backward compatible multi-layer codec via machine learning
US20170359596A1 (en) * 2016-06-09 2017-12-14 Apple Inc. Video coding techniques employing multiple resolution
GB2552376B (en) * 2016-07-22 2020-01-01 Canon Kk Method and device for efficiently generating, based on a video flow, a plurality of video streams required by modules of a video surveillance system
US20190191210A1 (en) * 2017-12-18 2019-06-20 Honeywell International Inc. Systems and methods for transmitting a high quality video image from a low power sensor
US11412303B2 (en) * 2018-08-28 2022-08-09 International Business Machines Corporation Filtering images of live stream content
US11055976B2 (en) * 2019-09-19 2021-07-06 Axis Ab Using a skip block mask to reduce bitrate from a monitoring camera

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005260912A (ja) * 2004-02-10 2005-09-22 Matsushita Electric Ind Co Ltd 映像通信装置および映像通信方法
WO2007076486A2 (en) * 2005-12-22 2007-07-05 Vidyo, Inc. System and method for videoconferencing using scalable video coding and compositing scalable video conferencing servers
JP2009540629A (ja) * 2006-03-03 2009-11-19 ヴィドヨ,インコーポレーテッド スケーラブルビデオ通信でエラー耐性、ランダムアクセス、およびレート制御を提供するシステムおよび方法
US20070230575A1 (en) * 2006-04-04 2007-10-04 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding using extended macro-block skip mode
JP2009532978A (ja) * 2006-04-04 2009-09-10 サムスン エレクトロニクス カンパニー リミテッド 拡張マクロブロックスキップモードを用いたエンコーディング/デコーディング方法および装置
US20100128786A1 (en) * 2007-04-23 2010-05-27 Yong Ying Gao Method and apparatus for encoding video data, method and apparatus for decoding encoded video data and encoded video signal
JP2010532936A (ja) * 2007-04-23 2010-10-14 トムソン ライセンシング ビデオ・データを符号化するための方法と装置、符号化されたビデオ・データを復号化するための方法と装置、および符号化されたビデオ信号

Also Published As

Publication number Publication date
KR102489396B1 (ko) 2023-01-17
JP7346518B2 (ja) 2023-09-19
US11477459B2 (en) 2022-10-18
US20220116625A1 (en) 2022-04-14
CN114422798B (zh) 2023-06-16
EP3985974B1 (en) 2023-05-10
TWI838649B (zh) 2024-04-11
TW202220445A (zh) 2022-05-16
KR20220048935A (ko) 2022-04-20
EP3985974A1 (en) 2022-04-20
CN114422798A (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
KR101928520B1 (ko) 이벤트 비디오 시퀀스를 생성하기 위한 방법 및 시스템과 이러한 시스템을 포함하는 카메라
JP7346518B2 (ja) 画像処理デバイス、カメラ、およびビデオ画像のシーケンスをエンコードするための方法
AU2005272046A1 (en) Method and apparatus for detecting motion in MPEG video streams
KR102113948B1 (ko) 비디오 스트림에서 프레임들의 시퀀스를 인코딩하기 위한 방법, 장치 및 시스템
US11750798B2 (en) Image processing device and a method for encoding images captured by a camera
US11716475B2 (en) Image processing device and method of pre-processing images of a video stream before encoding
KR102594565B1 (ko) 웨어러블 카메라 및 웨어러블 카메라에 의해 캡처된 비디오를 인코딩하는 방법
US20240163456A1 (en) Method and a device for managing encoded image frames in a data buffer
US20240196035A1 (en) Video failover recording
JP2023092501A (ja) ビデオをエンコードするための方法および画像処理デバイス

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221214

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230425

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20230725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230906

R150 Certificate of patent or registration of utility model

Ref document number: 7346518

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150