JP7012747B2 - ビデオフレーム符号化方法、端末、および記憶媒体 - Google Patents

ビデオフレーム符号化方法、端末、および記憶媒体 Download PDF

Info

Publication number
JP7012747B2
JP7012747B2 JP2019557357A JP2019557357A JP7012747B2 JP 7012747 B2 JP7012747 B2 JP 7012747B2 JP 2019557357 A JP2019557357 A JP 2019557357A JP 2019557357 A JP2019557357 A JP 2019557357A JP 7012747 B2 JP7012747 B2 JP 7012747B2
Authority
JP
Japan
Prior art keywords
video frame
quantization parameter
compensation
coding
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019557357A
Other languages
English (en)
Other versions
JP2020518174A (ja
Inventor
耀耀 郭
煦楠 毛
▲沈▼▲沈▼ 谷
欣▲ウェイ▼ 高
静 ▲呂▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2020518174A publication Critical patent/JP2020518174A/ja
Application granted granted Critical
Publication of JP7012747B2 publication Critical patent/JP7012747B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0135Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes
    • H04N7/0137Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes dependent on presence/absence of motion, e.g. of motion zones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本願は、2017年08月17日に中国特許庁に提出された、出願番号が201710707503.6であり、発明の名称が「ビデオフレーム符号化方法および端末」である中国特許出願の優先権を主張し、その全ての内容は、参照することにより本願に組み込まれる。
本願は、マルチメディア分野におけるビデオ処理技術に関し、特に、ビデオフレーム符号化方法、端末、および記憶媒体に関する。
科学技術の絶え間ない発展に伴って、電子技術も急速な発展を遂げ、電子製品の種類もますます多くなり、人々も科学技術の発展による様々な便利さを享受している。今日、人々は、様々な種類の電子機器や端末、端末に搭載されている各種機能のアプリケーションを通じて、科学技術の発展による快適な生活を楽しむことができる。例えば、端末上のソーシャルアプリケーションを利用して遠くの友達とビデオチャットをしたり、撮影アプリケーションを利用してビデオ撮影をしたりすることができる。
端末上のソーシャルアプリケーションなどでビデオチャットを使用する間、携帯電話の揺れや撮影シーンの移動、カメラを切り替えることで撮影を行うことなどの現象が時々発生することがある。このようにして、ビデオ符号化では、符号化された現在のフレームと前のフレームのコンテンツが大きく変化するという状況、すなわち、シーン切り替えが発生することがある。シーン切り替え時のビデオフレームの処理は、常に困難な問題であり、その撮影シーンやビデオシーンの変化により、ビデオ符号化プロセスに生成されるビットが多くなり、ネットワークに比較的大きな衝撃を与え、ビデオが一時停止してしまう原因になる。符号化パラメータを調整することにより、シーン切り替え時に現在のビデオフレームによって消費されるビット数を制御することができるが、シーン切り替え時に現在のビデオフレームによって消費されるビット数が少ないため、符号化品質は悪くなりがちであり、より顕著なブロック効果は、シーン切り替えの前後に依然として存在し、また、毎秒ピークビットレートが高すぎるという問題は、発生しやすくなってしまう。
本願の実施例は、端末に適用されるビデオフレーム符号化方法を提供している。該ビデオフレーム符号化方法であって、
画像グループのi(iは1以上かつN以下であり、Nは前記画像グループにおけるビデオフレームのフレーム総数である)番目のビデオフレームを取得し、第1の符号化規則を採用して前記i番目のビデオフレームに対してビデオ符号化を行い、符号化されたi番目のビデオフレームに対応する実際の消費ビット数を統計することと、
前記実際の消費ビット数と、画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出することと、
前記i番目のビデオフレームが前記シーン切り替え状態にある場合、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定することと、
補償長さを取得し、前記補償長さと補償モデルとに基づいて、第1の補償対象ビデオフレームと、前記第1の補償対象ビデオフレームのそれぞれに対応する第1の補償割り当てビット数とを決定することと、
前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属する場合、前記i+1番目のビデオフレームに対応する前記第1の補償割り当てビット数と、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量子化パラメータとに基づいて、前記第1の符号化規則を更新し、N番目のビデオフレームの符号化が完了するまで、前記i+1番目のビデオフレームのビデオ符号化プロセスに入ることと、
を含むことを特徴とするビデオフレーム符号化方法。
本願の実施例は、端末を提供している。該端末であって、
画像グループのi(iは1以上かつN以下であり、Nは前記画像グループにおけるビデオフレームのフレーム総数である)番目のビデオフレームを取得する取得手段と、
第1の符号化規則を採用して前記i番目のビデオフレームに対してビデオ符号化を行う符号化手段と、
符号化された前記i番目のビデオフレームに対応する実際の消費ビット数を統計する統計手段と、
前記実際の消費ビット数と、画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出する検出手段と、
前記i番目のビデオフレームが前記シーン切り替え状態にある場合、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定する決定手段と、
前記i+1番目のビデオフレームが第1の補償対象ビデオフレームに属する場合、前記i+1番目のビデオフレームに対応する第1の補償割り当てビット数と、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量子化パラメータとに基づいて、前記第1の符号化規則を更新する更新手段と、を含み、
前記取得手段は、さらに、補償長さを取得し、
前記決定手段は、さらに、前記補償長さと補償モデルとに基づいて、第1の補償対象ビデオフレームと、前記第1の補償対象ビデオフレームのそれぞれに対応する第1の補償割り当てビット数とを決定し、
前記符号化手段は、さらに、N番目のビデオフレームの符号化が完了するまで、前記i+1番目のビデオフレームのビデオ符号化プロセスに入る、
ことを特徴とする端末。
本願の実施例に係るビデオフレーム符号化システムにおける各ハードウェアエンティティの概略図である。 本願の実施例によって提供されるビデオフレーム符号化方法のフローチャート1である。 本願の実施例によって提供される例示的なIPPPフレーム構造の概略図1である。 本願の実施例によって提供される例示的なIPPPフレーム構造の概略図2である。 本願の実施例によって提供されるビデオフレーム符号化方法のフローチャート2である。 本願の実施例によって提供されるビデオフレーム符号化方法のフローチャート3である。 本願の実施例によって提供される端末構造の概略図1である。 本願の実施例によって提供される端末構造の概略図2である。
以下、本例の実施例における図面を参照しながら、本願の実施例における解決手段を明確かつ完全に説明する。
図1は、本願の実施例に係るビデオフレーム符号化システムにおける各ハードウェアエンティティの概略図であり、本願の実施例によって提供されるビデオフレーム符号化方法は、ビデオフレーム符号化システムに基づき実現されるものである。図1には、1つまたは複数のサーバ2と、端末1-1~1-5と、ネットワーク3とが含まれており、ネットワーク3には、ルータ、ゲートウェイなどのネットワークエンティティが含まれており、図中には図示されていない。端末1-1~1-5は、有線ネットワークまたは無線ネットワークを介してサーバと情報やりとりをすることで、端末1-1~1-5から身分識別結果を収集してサーバに伝送する。端末のタイプは、図1に示すように、携帯電話(端末1-3)、タブレットまたはパーソナルデジタルアシスタント(PDA:Personal Digital Assistant)(端末1-5)、デスクトップ(端末1-2)、PC(端末1-4)、一体型パソコン(端末1-1)などのタイプを含む。端末には、娯楽機能を備えたアプリケーション(ビデオアプリケーション、オーディオ再生アプリケーション、ゲームアプリケーション、ソーシャルアプリケーション、読書アプリケーション)や、サービス機能を備えたアプリケーション(地図ナビゲーションアプリケーション、グループ購入アプリケーション、撮影アプリケーション、財務管理アプリケーション、通信アプリケーションなど)のような、ユーザが必要とする各種なアプリケーションがインストールされている。
説明すべきところとして、端末にインストールされたアプリケーションへの使用は、サーバとデータやりとりを行うことによって実現される必要があり、本願の実施例によって提供されるビデオフレーム符号化方法は、端末がアプリケーションを使用する際にビデオ撮影やビデオ通信などを行うプロセスにおいて実現されるものである。
画像グループは、GOP(Group of Picture)であり、ビデオにおけるビデオフレーム画像グループである。
Iフレームは、イントラ(Intra)予測フレームであり、イントラ予測のみが使用されるものである。
Pフレームは、インター(Inter)予測フレームであり、インター予測のみが使用されるものである。
量子化パラメータは、QP(quantization parameters)であり、ビデオ空間の詳細の圧縮状況が反映されるものである。
IPPP(Intra picture and predicted picture)は、符号化構造であり、画像グループは、このようなフレーム構造に従って符号化され、現在のフレームは、前方のフレームのみを参照することができる。
毎秒ピークビットレートは、秒を単位として統計する場合に消費されたビットレートの最大値である。
図1に示すビデオフレーム符号化システムに基づいて、本願の実施例は、画像グループにおける各ビデオフレームについて、端末1によって実行されてもよいし、サーバによって実行されてもよい、ビデオフレーム符号化方法を提供している。図2に示すように、この方法は、以下のステップを含む。
S101で、画像グループのi(iは1以上かつN以下であり、Nは前記画像グループにおけるビデオフレームのフレーム総数である)番目のビデオフレームを取得し、第1の符号化規則を採用してi番目のビデオフレームに対してビデオ符号化を行い、符号化されたi番目のビデオフレームに対応する実際の消費ビット数を統計する。
本願の実施例によって提供されるビデオフレーム符号化方法は、端末がアプリケーションを用いてビデオ通信やビデオ撮影などのビデオ関連機能を行う場合にビデオフレームを符号化するシナリオ、例えば、ビデオ会議、ライブ放送、VOIP(Voice over Internet Protocol)ネットワーク電話などのシナリオ、に適用される。
説明すべきところとして、本願の実施例では、ビデオフレームは、画像グループ(GOP)から構成され、各画像グループにおけるビデオフレームの構造は、IPPPフレーム構造であり、図3に示すように、IPPPフレーム構造には、IフレームとPフレームとが含まれるようにしてよい。本願の実施例によって提供されるビデオフレーム符号化方法は、1つの画像グループにおけるビデオフレームに基づいて符号化を行うものであり、各画像グループは、いずれも、本願の実施例によって提供されるビデオフレーム符号化方法によって実現されてもよいし、本願の実施例は限定しない。
本願の実施例では、端末による画像グループにおけるビデオフレームへの符号化は、1フレームずつ順次に実行され、画像グループにおけるビデオフレームのフレーム総数は、N(Nは1より大きい正整数である)に設定され、このようにして、端末は、画像グループにおけるi(iは1以上かつN以下である)番目のビデオフレームを取得し、i番目のビデオフレームへの符号化を開始する。具体的には、端末は、第1の符号化規則を採用してi番目のビデオフレームに対してビデオ符号化を行い、また、符号化を行った後に、i番目のビデオフレームの符号化によって消費されたビット数を統計し、符号化されたi番目のビデオフレームに対応する実際の消費ビット数を得る。
説明すべきところとして、本願の実施例では、端末によって処理されるi番目のフレームは、補償を行う必要がないビデオフレームであってもよく、補償を行う必要があるビデオフレームであってもよいし、具体的には、i番目のフレームを補償する必要があるかどうかは、i番目のフレームの前のフレームの符号化処理プロセスによって決定されるものであり、そのため、ここで端末は、i番目のビデオフレームを取得する際に、第1の符号化規則を採用してこのi番目のビデオフレームを符号化し、具体的な処理プロセスが、後の実施例で詳細に説明される。
本願の実施例では、第1の符号化規則は、i番目のビデオフレームを符号化するための規則であり、具体的な実現について、詳細なプロセスが実施例2の中に説明される。この第1の符号化規則は、ユーザによって事前にカスタマイズされた符号化規則であってもよく、符号化プロセスにおいて端末によってリアルタイムに調整して取得された符号化規則であってもよいし、具体的な実現形式が、本願の実施例によって限定されない。
S102で、実際の消費ビット数と、画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づいて、i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出する。
端末は、i番目のビデオフレームが符号化された後の実際の消費ビット数を取得した後、この端末は、実際の消費ビット数と、画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づいて、i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出することができ、すなわち、端末は、実際の消費ビット数と、画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づき、i番目のフレームがシーン切り替えフレームであるかどうかを判断することができる。
本願の実施例では、画像グループの初期平均ビットレートは、符号化の開始時に設定された画像グループの初期平均ビットレートであってもよく、符号化の開始時にリアルタイムに取得された動的画像グループの初期平均ビットレートであってもよいし、具体的な実現形式が、本願の実施例によって限定されない。ビデオフレーム検出規則は、ユーザによって事前にカスタマイズされた検出規則であってもよく、符号化プロセスにおいて端末によってリアルタイムに調整して取得された検出規則であってもよいし、具体的な実現形式が、本願の実施例によって限定されない。
ここで、ビデオフレーム検出規則は、現在検出されているビデオフレーム(すなわち、i番目のビデオフレーム)がシーン切り替えフレームであるかどうか(シーン切り替え状態にあるかどうか)を判定するための判定条件である。
説明すべきところとして、本願の実施例では、i番目のビデオフレームのフレームタイプが異なるため、端末がi番目のビデオフレームがシーン切り替え状態にあるかどうかを検出する方式は、同じではない。
ここで、本願の実施例では、ビデオフレームのフレームタイプが異なるため、端末は、i番目のビデオフレームを検出する際に、Pフレームについて、第1のビデオフレーム検出規則を採用して処理を行い、Iフレームについて、第2のビデオフレーム検出規則を採用して処理を行う。つまり、ビデオフレーム検出規則は、第1のビデオフレーム検出規則と第2のビデオフレーム検出規則とを含み、このようにして、実際の消費ビット数と、画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づいて、i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出するプロセスは、S1021~S1023を含み、以下の通りである。
S1021で、i番目のビデオフレームの第1のフレームタイプを検出する。
S1022で、第1のフレームタイプがターゲットフレームタイプを満たす場合、画像グループの残りの平均ビットレートを取得し、実際の消費ビット数と、画像グループの初期平均ビットレートと、画像グループの残りの平均ビットレートと、第1のビデオフレーム検出規則とに基づいて、i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出する。
一部の実施例では、上記画像グループの残りの平均ビットレートは、上記i番目のビデオフレームに符号化する場合の、上記画像グループ内の残りのビット数と上記画像グループ内の残りのフレーム数の商である。具体的には、上記画像グループを符号化する前に、上記画像グループに対して一定数のビットを割り当ててから、上記画像グループにおけるビデオフレームの符号化を開始する。上記のi番目のビデオフレームに符号化する場合、画像グループの残りのビット数は、最初に割り当てられたビット数から、前のi-1番目のビデオフレームによって消費されたビット数を減算したものであり、画像グループの残りの平均ビットレートは、上記画像グループの残りのビット数をi番目のフレームを含む残りのフレーム数で割ったものである。
S1023で、第1のフレームタイプがターゲットフレームタイプを満たさない場合、実際の消費ビット数と、画像グループの初期平均ビットレートと、第2のビデオフレーム検出規則とに基づいて、i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出する。
本願の実施例では、ターゲットフレームタイプは、Pフレームである。第1のフレームタイプがターゲットフレームタイプを満たす場合、これは、i番目のビデオフレームがPフレームであるということを表し、第1のフレームタイプがターゲットフレームタイプを満たさない場合、これは、i番目のビデオフレームがIフレームであるということを表す。
本願の実施例では、第1のビデオフレーム検出規則は、フレームタイプがPフレームであるi番目のビデオフレームがシーン切り替え状態にあるかどうかを検出するための条件または規則であり、この第1のビデオフレーム検出規則は、以下のような不等式(1)および(2)のいずれかであってもよい。

Figure 0007012747000001

Figure 0007012747000002
ここで、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートであり、Rave_remainは、画像グループの残りの平均ビットレートである。Ractual>β×Rave_remainを例にして、第1のビデオフレーム検出規則の原理を説明する。Ractual>β×Rave_remainである場合、これは、i番目のビデオフレームによって実際に消費されたビット数Ractualが画像グループの残りの平均ビットレートの一定の割合βを超えたこと、すなわち、i番目のビデオフレームが過剰なビットレートを消費したことを示し、つまり、i番目のビデオフレームがシーン切り替え状態にあると判定でき、その後ろの補償ウィンドウ内のビデオフレームに対してビット補償を行う必要がある。
説明すべきところとして、上式のα、βとγは、経験値であり、一部の実施例では、実験中にそれぞれ1.5、1.7と2.1の値をとることができる。
本願の実施例では、第2のビデオフレーム検出規則は、フレームタイプがIフレームであるi番目のビデオフレームがシーン切り替え状態にあるかどうかを検出するための条件または規則であり、この第2のビデオフレーム検出規則は、以下のような不等式(3)、(4)、および(5)のいずれかであってもよい。

Figure 0007012747000003

Figure 0007012747000004

Figure 0007012747000005
ここで、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートである。
説明すべきところとして、一部の実施例では、上式のω1、ω2とω3は、それぞれ2、3、4の値をとることができる。
ここで、本願の実施例では、第1のフレームタイプがターゲットフレームタイプを満たす場合、端末が実際の消費ビット数、画像グループの初期平均ビットレート、および画像グループの残りの平均ビットレートが第1のビデオフレーム検出規則を満たすことを検出することは、i番目のビデオフレームがシーン切替状態にあることを示し、逆に、i番目のビデオフレームが非シーン切替状態にあることを示す。第1のフレームタイプがターゲットフレームタイプを満たさない場合、端末が実際の消費ビット数および画像グループの初期平均ビットレートが第2のビデオフレーム検出規則を満たすことを検出することは、i番目のビデオフレームがシーン切り替え状態にあることを示し、逆に、i番目のビデオフレームが非シーン切り替え状態にあることを示す。
説明すべきところとして、本願の実施例によって提供されるビデオフレーム符号化方法におけるS1022及びS1023は、S1021以降の2つのオプションのプロセスであり、本願の実施例における端末は、実際の動作状況に応じて、S1021~S1022またはS1021~S1023を実行することができ、本願の実施例は限定しない。
S103で、i番目のビデオフレームがシーン切り替え状態にある場合、実際の消費ビット数と、画像グループの初期平均ビットレートと、量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定する。
本願の実施例では、端末は、現在の画像グループのビデオフレームを符号化する場合、この端末は、この現在の画像グループの初期平均ビットレート、すなわち、画像グループの初期平均ビットレートを取得することができ、このようにして、端末は、i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出した後、i番目のビデオフレームがシーン切り替え状態にある場合、この端末は、実際の消費ビット数と、画像グループの初期平均ビットレートと、量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定することができる。
本願の実施例では、量子化モデルは、i番目のビデオフレームの量子化パラメータを算出するためのモデルであり、この量子化モデルは、ユーザによって事前にカスタマイズされた量子化のためのモデルであってもよく、符号化プロセスにおいて端末によってリアルタイムに調整して取得された量子化のためのモデルであってもよいし、具体的な実現形式が、本願の実施例によって限定されない。
説明すべきところとして、本願の実施例では、端末は、i番目のビデオフレームの符号化が完了した後、i番目のビデオフレームに対応する関連な符号化パラメータを用いて、i+1番目のビデオフレームの符号化に関連するパラメータを算出し、調整することができる。
本願の実施例では、端末によって処理される画像グループにおけるビデオフレームのタイプが、IフレームとPフレームに分けられるため、i番目のビデオフレームのタイプは、2つある可能性がある。端末が実際の消費ビット数と、画像グループの初期平均ビットレートと、量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定するプロセスは、i番目のビデオフレームのタイプに応じて、様々な実装によって行われる。
ここで、i番目のビデオフレームがPフレームである場合、端末は、画像グループの残りの平均ビットレートを取得することもでき、したがって、端末は、この画像グループの残りの平均ビットレートと、実際の消費ビット数の総数と、画像グループの初期平均ビットレートと、第1の量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定する。ここで、量子化モデルは、第1の量子化モデルと第2の量子化モデルとを含む。
本願の実施例では、第1の量子化モデルが、第1の初期量子化モデルと、第1の最大量子化モデルと、第1の最小量子化モデルとに分けられ、端末は、画像グループの残りの平均ビットレートと、実際の消費ビット数と、画像グループの初期平均ビットレートと、第1の初期量子化モデルとに基づいて、第1の初期量子化パラメータを決定することができ、端末は、画像グループの残りの平均ビットレートと、実際の消費ビット数と、画像グループの初期平均ビットレートと、第1の最大量子化モデルとに基づいて、第1の最大量子化パラメータを決定することができ、端末は、画像グループの残りの平均ビットレートと、実際の消費ビット数と、画像グループの初期平均ビットレートと、第1の最小量子化モデルとに基づいて、第1の最小量子化パラメータを決定することができる。
例示的には、第1の最大量子化モデルは、数式(6)に示す通りであり、数式(6)は、以下の通りである。

Figure 0007012747000006
ここで、QPmaxは、第1の最大量子化パラメータであり、QPavePは、所定の平均量子化パラメータであり、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートであり、Rave_remainは、画像グループの残りの平均ビットレートである。
説明すべきところとして、上式のα、βとγは、経験値であり、一部の実施例では、実験中にそれぞれ1.5、1.7と2.1の値をとることができ、上式のΔ1、Δ2、Δ3は、それぞれ、QPmaxの異なる段階関数でのQPのオフセット値であり、実験中にそれぞれ3、2、1と設定されている。実際の消費ビット数Ractualが所定の初期平均ビットレートRaveを超えるほど、オフセット値は大きくなる。
例示的には、第1の最小量子化モデルは、数式(7)に示す通りであり、数式(7)は、以下の通りである。

Figure 0007012747000007
ここで、QPminは、第1の最小量子化パラメータであり、QPavePは、所定の平均量子化パラメータであり、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートであり、Rave_remainは、画像グループの残りの平均ビットレートである。
説明すべきところとして、上式のα、βとγは、経験値であり、一部の実施例では、実験中にそれぞれ1.5、1.7と2.1の値をとることができ、上式のΔ4、Δ5、Δ6は、それぞれ、QPminの異なる段階関数でのQPのオフセット値であり、実験中にそれぞれ1、0、-1と設定されている。実際の消費ビット数Ractualが所定の初期平均ビットレートRaveを超えるほど、オフセット値は大きくなる。
例示的には、第1の初期量子化モデルは、数式(8)に示す通りであり、数式(8)は、以下の通りである。

Figure 0007012747000008
ここで、QPframeは、第1の初期量子化パラメータであり、QPavePは、所定の平均量子化パラメータであり、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートであり、Rave_remainは、画像グループの残りの平均ビットレートである。
説明すべきところとして、上式のα、βとγは、経験値であり、一部の実施例では、実験中にそれぞれ1.5、1.7と2.1の値をとることができ、上式のΔ7、Δ8、Δ9は、それぞれ、QPframeの異なる段階関数でのQPのオフセット値であり、実験中にそれぞれ2、1、0と設定されている。実際の消費ビット数Ractualが所定の初期平均ビットレートRaveを超えるほど、オフセット値は大きくなる。
さらに、本願の実施例では、端末は、第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを取得した後、実際の消費ビット数とターゲットビット数とが比率条件を満たす場合、量子化調整モデルに応じて、第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとに対して、パラメータ調整を行い、第1の調整初期量子化パラメータと、第1の調整最大量子化パラメータと、第1の調整最小量子化パラメータとを得る。ここで、ターゲットビット数とは、i番目のビデオフレームに対して予め割り当てられたビット数をいう。
本願の実施例では、量子化調整モデルは、i番目のビデオフレームによって算出された量子化パラメータを調整するためのモデルであり、この量子化調整モデルは、ユーザによって事前にカスタマイズされた量子化調整のためのモデルであってもよく、符号化プロセスにおいて端末によってリアルタイムに調整して取得された量子化調整のためのモデルであってもよいし、具体的な実現形式が、本願の実施例によって限定されない。
例示的に、量子化調整モデルは、数式(9-1)、数式(9-2)および数式(9-3)に示す通りであり、数式(9-1)、数式(9-2)および数式(9-3)は、具体的に以下の通りである。

Figure 0007012747000009

Figure 0007012747000010

Figure 0007012747000011
ここで、QPmax は、第1の調整最大量子化パラメータであり、QPmaxは、第1の最大量子化パラメータであり、QPmin は、第1の調整最小量子化パラメータであり、QPminは、第1の最小量子化パラメータであり、QPframe は、第1の調整初期量子化パラメータであり、QPframeは、第1の初期量子化パラメータであり、Rtargetは、i番目のフレームの所定のターゲットビット数であり、Ractualは、i番目のフレームの実際の消費ビット数である。
説明すべきところとして、上式のσ及びτは、実験中にそれぞれ1.7と2.5であり、上式のΔ QPIとΔ QPIは、それぞれ、異なる段階関数でのQPのオフセット値であり、一部の実施例では、実験中に1と2に設定されている。
具体的には、i番目のビデオフレームがIフレームである場合、端末は、実際の消費ビットの総数と、画像グループの初期平均ビットレートと、第2の量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定する。
本願の実施例では、第2の量子化モデルが、第2の初期量子化モデルと、第2の最大量子化モデルと、第2の最小量子化モデルとに分けられ、端末は、実際の消費ビット数と、画像グループの初期平均ビットレートと、第2の初期量子化モデルとに基づいて、第1の初期量子化パラメータを決定することができ、端末は、実際の消費ビット数と、画像グループの初期平均ビットレートと、第2の最大量子化モデルとに基づいて、第1の最大量子化パラメータを決定することができ、端末は、実際の消費ビット数と、画像グループの初期平均ビットレートと、第2の最小量子化モデルとに基づいて、第1の最小量子化パラメータを決定することができる。
例示的には、第2の最大量子化モデルは、数式(10)に示す通りであり、式(10)は、以下の通りである。

Figure 0007012747000012
ここで、QPmaxは、第1の最大量子化パラメータであり、QPavePは、所定の平均量子化パラメータであり、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートである。
説明すべきところとして、一部の実施例では、上式のω1、ω2とω3は、それぞれ2、3と4の値をとることができ、上式のΔ1、Δ2、Δ3は、それぞれ、QPmaxの異なる段階関数でのQPのオフセット値であり、実験中にそれぞれ3、5、7と設定されている。実際の消費ビット数Ractualが所定の初期平均ビットレートRaveを超えるほど、オフセット値は大きくなる。
例示的には、第2の最小量子化モデルは、数式(11)に示す通りであり、式(11)は、以下の通りである。

Figure 0007012747000013
ここで、QPminは、第1の最小量子化パラメータであり、QPavePは、所定の平均量子化パラメータであり、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートである。
説明すべきところとして、一部の実施例では、上式のω1、ω2とω3は、それぞれ2、3と4の値をとることができ、上式のΔ4、Δ5、Δ6は、それぞれ、QPminの異なる段階関数でのQPのオフセット値であり、実験中にそれぞれ1、3、5と設定されている。実際の消費ビット数Ractualが所定の初期平均ビットレートRaveを超えるほど、オフセット値は大きくなる。
例示的には、第2の初期量子化モデルは、数式(12)に示す通りであり、式(12)は、以下の通りである。

Figure 0007012747000014
ここで、QPframeは、第1の初期量子化パラメータであり、QPavePは、所定の平均量子化パラメータであり、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートである。
説明すべきところとして、一部の実施例では、上式のω1、ω2とω3は、それぞれ2、3と4の値をとることができ、上式のΔ7、Δ8、Δ9は、それぞれ、QPframeの異なる段階関数でのQPのオフセット値であり、実験中にそれぞれ2、4、6と設定されている。実際の消費ビット数Ractualが所定の初期平均ビットレートRaveを超えるほど、オフセット値は大きくなる。
S104で、補償長さを取得し、補償長さと補償モデルとに基づいて、第1の補償対象ビデオフレームと、第1の補償対象ビデオフレームのそれぞれに対応する第1の補償割り当てビット数とを決定する。
一部の実施例では、端末は、i番目のビデオフレームが位置するシーン状態を検出した後、i番目のビデオフレームがシーン切り替え状態にあることを検出する場合、この端末は、補償ウィンドウを確立し、補償長さを取得し、この補償長さに基づいて第1の補償対象ビデオフレームを決定し、そして、補償モデルに基づいて第1の補償対象ビデオフレームのそれぞれに対応する第1の補償割り当てビット数を決定する必要があり、前記第1の補償対象ビデオフレームの数が補償長さに等しい。
本願の実施例では、補償モデルは、切り替えシーンにあるi番目のビデオフレームが符号化された後に補償長さを計算するためのモデルであり、この補償モデルは、ユーザによって事前にカスタマイズされた補償のためのモデルであってもよく、符号化プロセスにおいて端末によってリアルタイムに調整して取得された補償のためのモデルであってもよいし、具体的な実現形式が、本願の実施例によって限定されない。
説明すべきところとして、本願の実施例では、符号化後に、現在のビデオフレーム(すなわち、i番目のビデオフレーム)を検出して、現在のビデオフレームがシーン切り替え時のビデオフレームであると判定された場合、現在のビデオフレームを符号化した後に補償ウィンドウを確立し、補償ウィンドウ内の対応ビデオフレームのターゲットビットを再割り当て、すなわち、現在のビデオフレームの後ろのビデオフレームの符号化に必要なビット数を調整し、または現在のビデオフレームの後ろのビデオフレームの符号化パラメータ(ビットレート制御パラメータ、量子化パラメータなど)を調整することにより、符号化プロセスにおいて現在のビデオフレームの後ろのビデオフレームによって消費されるビット数が制御され、これによって、ビデオフレーム全体の符号化のより良い効果が獲得される。
本願の実施例では、補償ウィンドウは、シーン切り替え状態にあるビデオフレームの後ろにビット補償を行う必要があるビデオフレームの長さであり、補償ウィンドウにあるビデオフレームが補償対象ビデオフレームと呼ばれてもよいし、ここでの補償ウィンドウの長さが補償長さと呼ばれてもよい。
本願の実施例では、端末がi番目のビデオフレームがシーン切り替え状態にあることを検出し、補償ウィンドウを確立し、補償長さを取得するプロセスは、同様に、i番目のビデオフレームのフレームタイプに関係するものである。端末は、i番目のビデオフレームがシーン切り替え状態にあるPフレームであることを検出した場合、この端末は、第1の補償長さモデルにより補償長さの取得を行うことができる一方、端末は、i番目のビデオフレームがシーン切り替え状態にあるIフレームであることを検出した場合、この端末は、第2の補償長さモデルにより補償長さの取得を行うことができる。
例示的には、端末がi番目のビデオフレームがシーン切り替え状態にあるPフレームであることを検出した場合、第1の補償長さモデルは、数式(13)および数式(14)に示す通りであり、数式(13)および数式(14)は、以下の通りである。

Figure 0007012747000015

Figure 0007012747000016
ここで、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートであり、Rave_remainは、画像グループの残りの平均ビットレートであり、Lは、中間補償長さであり、Lは、補償長さ(補償ウィンドウ長さ)であり、L1とL2は、所定の補償ウィンドウ長さである。Npは、画像グループにおける残りの符号化されていないPフレームの数を示す。
説明すべきところとして、上式のα、βとγは、経験値であり、一部の実施例では、実験中にそれぞれ1.5、1.7と2.1の値をとることができる。上記のL1とL2は、それぞれ、実験中に5と2をとる。
本願の実施例では、上式の物理的意味は、実際に消費されたビットRactualが画像グループの残りの平均ビットレートRave_remainの一定割合βを超えた後、i番目のビデオフレームの実際の消費ビット数Ractualに対する画像グループの初期平均ビットレートRaveの比率に基づいて補償ウィンドウLのサイズが決定され、比率が大きいほど、補償を行う必要があるビット数もより多いということを示し、そのため、より長い補償ウィンドウ、すなわち、より長い補償長さが必要になる、ことである。
本願の実施例では、数式(14)は、補償長さの最大値が、画像グループにおける残りの符号化されていないPフレームの数である、ということを示し、端末は、画像グループにおけるビデオフレームに対してビデオ符号化を行い、また、端末によって取得された補償長さも、その画像グループにおける符号化されていないビデオフレームの補償のために使用されるものであり、そのため、補償長さの最大値は、Npを超えてはいけない。
例示的には、端末がi番目のビデオフレームがシーン切り替え状態にあるIフレームであることを検出した場合、第2の補償長さモデルは、数式(15)、数式(16)および数式(17)に示す通りであり、数式(15)、数式(16)および数式(17)は、以下の通りである。

Figure 0007012747000017

Figure 0007012747000018

Figure 0007012747000019
ここで、Lは、補償長さ(補償ウィンドウ長さ)であり、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートであり、fpsは、フレームレートを表し、LGOP_Pは、画像グループにおけるPフレームの数を表し、ρ1とρ2は、それぞれ、補償ウィンドウ長さを決定する際の、フレームレートとPフレームの数のそれぞれの付加重みを表し、実験中にρ1とρ2の値が0.4と0.8とすることができる。LN_Iは、fpsとLGOP_Pとに基づいて予測された補償ウィンドウ長さであり、後続に補償ウィンドウのサイズを設定する際の参照とするものであり、補償ウィンドウの最大値が、ζと設定され、実験中に15の値を取る。ω1、ω2とω3は、それぞれ2、3と4であり、L1、L2とL3は、Lの異なる段階での最小値であり,実験中にそれぞれ1、2と5の値をとる。数式(15)は、実際の消費ビット数Ractualと平均ビット数Raveとに基づいて、補償ウィンドウをさらに調整するためのものである。
説明すべきところとして、本願の実施例では、シーン切替状態にあるi番目のビデオフレームがIフレームであるかPフレームであるかにかかわらず、端末が補償長さを取得した後、i番目のビデオフレームの後ろの連続L個のビデオフレームは、第1の補償対象ビデオフレームになり、また、端末は、補償長さを取得した後、補償長さと補償モデルとに基づいて、第1の補償対象ビデオフレームのそれぞれに対応する第1の補償割り当てビット数を決定する。
例示的には、図4に示すように、現在の画像グループにおけるビデオフレームは1000個のフレームがあると仮定し、端末は、201番目のビデオフレームの符号化を行う際に、201番目のビデオフレームがシーン切り替え状態にあることを検出し、すなわち、201番目のビデオフレームは、過剰なビットレートを消費する必要があるものであり、その後ろの補償ウィンドウ内のビデオフレームに対してビット補償は行われる必要がある。算出された補償長さが5であると仮定すると、すなわち、201番目のビデオフレームの後ろの補償ウィンドウの長さは5であり、201番目のビデオフレームがPフレームであることを例として説明すると、201番目のビデオフレームの後ろの連続5つのビデオフレーム(すなわち、202番目のビデオフレームから206番目のビデオフレーム)は、補償ウィンドウ内にある、ビット補償を行う必要がある第1の補償ビデオフレームになる。
ここで、端末は、補償長さと、実際の消費ビット数と、画像グループの初期平均ビットレートと、所定の補償基数モデルとに基づいて、第1の補償対象ビデオフレームのそれぞれに対応する第1の補償ビット基数を得てから、この第1の補償ビット基数と、画像グループの初期平均ビットレートと、画像グループの残りの平均ビットレートと、所定の補償割り当てビットモデルとに基づいて、第1の補償対象ビデオフレームのそれぞれに対応する第1の補償割り当てビット数を得、ここで、補償モデルは、所定の補償基数モデルと所定の補償割り当てビットモデルとを含むことができる。
例示的には、本願の実施例における所定の補償基数モデルは、数式(18)に示す通りであり、式(18)は、以下の通りである。

Figure 0007012747000020
ここで、Rcom_jは、i+j番目のビデオフレームに対応する第1の補償ビット基数であり、Ractualは、実際の消費ビット数であり、Raveは、画像グループの初期平均ビットレートであり、μjは、補償ウィンドウ内の各第1の補償対象ビデオフレームが占める重みである。
説明すべきところとして、本願の実施例では、μjの設定原則として、i番目のビデオフレームから近いほど、第1の補償ビデオフレームに対応する重みμjの値は大きくなる。
本願の実施例では、補償モデルは、シーン切り替え時のi番目のビデオフレームの実際の消費ビット数が画像グループの初期平均ビットレートを超えた差に基づいて、補償ウィンドウ内の各第1の補償対象ビデオフレームの補償が必要な重み付け平均ビット数Rcom_jを求めるということ、を表すためのものである。
例示的には、本願の実施例における所定の補償割り当てビットモデルは、数式(19)に示す通りであり、式(19)は、以下の通りである。

Figure 0007012747000021
ここで、RT_jは、i+j番目のビデオフレームに対応する第1の補償割り当てビット数であり、Rcom_jは、i+j番目のビデオフレームに対応する第1の補償ビット基数であり、Raveは、画像グループの初期平均ビットレートであり、Rave_remainは、画像グループの残りの平均ビットレートである。
説明すべきところとして、符号化を行う必要がある現在のビデオフレームが補償ウィンドウ内にある場合、端末によって割り当てられた所定の割り当てビット数は、画像グループの初期平均ビットレートRaveから、現在のビデオフレームに対応する第1の補償ビット基数に対応の重みを乗じたものを引いたものであり、すなわち、ターゲットビット数は、第1の補償割り当てビット数に基づいて算出されたものである。現在のビデオフレームが補償ウィンドウ内にない場合、端末によって割り当てられたターゲットビット数は、画像グループの残りのビットの平均ビットレートRave_remainである。
理解すべきところとして、本願の実施例では、i番目のビデオフレームがシーン切り替え状態にあるとき、端末は、i番目のビデオフレームの符号化で過剰に消費されたビット数を、後続のいくつかのフレーム(すなわち、第1の補償対象ビデオフレーム)に滑らかに割り当て、これによって、ビデオ全体の主観的な品質が低下しない前提で、できるだけビットレートを滑らかにする役割が達成される。
説明すべきところとして、本願の実施例では、S103及びS104は、いずれも、i番目のビデオフレームがシーン切替状態にある場合に端末が実行するプロセスであり、本願の実施例は、S102の後、S103及びS104の実行順序に限定しなく、すなわち、端末がS102-103-104を実行してもよく、S102-104-103を実行してもよい。
S105で、i+1番目のビデオフレームが第1の補償対象ビデオフレームに属する場合、i+1番目のビデオフレームに対応する第1の補償割り当てビット数と、第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとに基づいて、第1の符号化規則を更新し、N番目のビデオフレームの符号化が完了するまで、i+1番目のビデオフレームのビデオ符号化プロセスに入る。
一部の実施例では、端末は、第1の補償割り当てビット数と、第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを取得した後、この端末は、第1の補償割り当てビット数と、第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとに基づいて、i+1番目のビデオフレームを符号化し、すなわち、端末は、第1の補償割り当てビット数と、第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとに基づいて、第1の符号化規則を更新してから、N番目のビデオフレームの符号化が完了するまで、i+1番目のビデオフレームのビデオ符号化プロセスに入り、i+1番目のビデオフレームに対して符号化及び符号化後の処理を行う。
一部の実施例では、前記第1の符号化規則は、第1の補償割り当てビット数と、第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとによって決定されるものであり、取得された第1の補償割り当てビット数と、第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとに基づいて、第1の符号化規則が更新されることができる。
一部の実施例では、前記i+1番目のビデオフレームに対してビデオ符号化を行う前に、前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属するかどうかを決定する必要があり、前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属する場合、i+1番目のビデオフレームに対応する第1の補償割り当てビット数と、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量子化パラメータとに基づいて、前記第1の符号化規則を更新して、前記i+1番目のビデオフレームに対してビデオ符号化を行い、前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属さない場合、ターゲットビット数に基づいて前記i+1番目の第4の量子化パラメータを算出し、前記第4の量子化パラメータに基づいて、前記i+1番目のビデオフレームに対してビデオ符号化を行い、ここで、前記ターゲットビット数とは、前記i+1番目のビデオフレームに予め割り当てられたビット数を意味する。説明すべきところとして、ここで、前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属するかどうかを決定することは、後続のステップ202でi番目のフレームが第2の補償対象ビデオフレームであるかどうかを決定することに相当する。
本願の実施例では、端末がi+1番目のビデオフレームのビデオ符号化に入るプロセスは、端末がi+1を行った後、S101-105を繰り返し実行するプロセスであり、唯一の相違は、第1の符号化規則が更新されることだけであり、符号化を実現する技術的な方式は、不変である。
さらに、上記の説明では、端末が第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを得た後に、さらに調整を行う必要があるというプロセスは存在しているため、このような場合で、端末は、さらに、第1の補償割り当てビット数と、第1の調整初期量子化パラメータと、第1の調整最大量子化パラメータと、第1の調整最小量子化パラメータとに基づいて、第1の符号化規則を更新してから、N番目のビデオフレームの符号化が完了するまで、i+1番目のビデオフレームのビデオ符号化プロセスに入り、i+1番目のビデオフレームの符号化及び符号化後の処理を開始する必要がある。
説明すべきところとして、端末が第1の符号化規則を採用して現在のビデオフレームを符号化するプロセスは、後続の実施例で説明される。
さらに、S102の後に、図5に示すように、本願の実施例によって提供されるビデオフレーム符号化方法は、さらに、S106を含む。具体的には、以下の通りである。
S106で、i番目のビデオフレームが非シーン切替状態にある場合、N番目のビデオフレームの符号化が完了するまで、i+1番目のビデオフレームのビデオ符号化プロセスに入る。
端末は、実際の消費ビット数と、画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づいて、i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出した後、この端末は、i番目のビデオフレームが非シーン切替状態にあることも検出でき、そのため、i番目のビデオフレームが非シーン切替状態にあるとき、この端末は、i+1番目のビデオフレームのビデオ符号化プロセスに直接に入ることができ、i+1を行った後、N番目のビデオフレームの符号化が完了するまで、直接にS101~S105を繰り返し実行する。
理解すべきところとして、端末は、ビデオフレーム符号化を行う際に、現在のビデオフレームがシーン切り替え状態にある場合、実際の消費ビット数と、画像グループの初期平均ビットレートなどの要因により、後続のビデオフレームの補償長さ(すなわち補償ウィンドウの長さ)、第1の補償割り当てビット数を適応的に調整しつつ、次のフレームの後続符号化のための初期量子化パラメータと、最大量子化パラメータと、最小量子化パラメータとを決定することができ、このようにして、この端末は、次のフレームの初期量子化パラメータと、最大量子化パラメータと、最小量子化パラメータとに基づいて、次のフレームを符号化する時に、前のフレームによって過剰に消費されたビットを補償することができ、これによって、ビデオフレームの符号化品質を維持する前提で、毎秒ピークビットレートが低減され、毎秒ピークビットレートの安定が維持されるため、ビデオストリームがスムーズに伝送される。
一部の実施例では、本願の実施例によって提供されるビデオフレーム符号化方法において、S101での第1の符号化規則を採用してi番目のビデオフレームに対してビデオ符号化を行うプロセスは、S201~206を含む。図6に示すように、具体的には、以下の通りである。
S201で、i番目のビデオフレームが第2の補償対象ビデオフレームに属する場合、第2の補償対象ビデオフレームのそれぞれに対応する第2の補償割り当てビット数から、i番目のビデオフレームの第3の補償割り当てビット数を取得し、第2の補償対象ビデオフレームは、i番目のビデオフレームの前のビデオフレームの符号化の後に決定されたものである。
一部の実施例では、上記第2の補償対象ビデオフレームは、上記i番目のビデオフレームの前のシーン切替状態にあるビデオフレームの符号化の後に決定されたものである。上記i番目のビデオフレームの第3の補償割り当てビット数は、第2の補償対象ビデオフレームのそれぞれに対応する第2の補償割り当てビット数から取得された、i番目のビデオフレームに対応する第2の補償割り当てビット数である。
S202で、第3の補償割り当てビット数に基づいて、i番目のビデオフレームの第2の量子化パラメータを算出する。
一部の実施例では、前記i番目のビデオフレームに対応する第2の補償割り当てビット数に基づいて、前記i番目のビデオフレームの第2の量子化パラメータを算出する。
本願の実施例では、端末がi番目のビデオフレームを符号化する際に第1の符号化規則を採用する理由は、i番目のビデオフレームが、前の符号化フレームの補償ウィンドウ内にあってもよいし、補償を行う必要がなくてもよいことである。そのため、この2つの場合について、端末がi番目のビデオフレームを符号化する方式は、同じではない。
ここで、i番目のビデオフレームが第2の補償対象ビデオフレームに属する場合、これは、i番目のビデオフレームの前のビデオフレームの中にシーン切替状態にあるビデオフレームが存在しているということを表し、そのため、該ビデオフレームが、実施例における符号化プロセスに従って、自身に対応する第2の補償対象ビデオフレームと第2の補償対象ビデオフレームのそれぞれに対応する第2の補償割り当てビット数が既に決定されたものであり、このとき、この端末は、第2の補償割り当てビット数から、i番目のビデオフレームの第3の補償割り当てビット数を取得することができる。そして、端末は、第3の補償割り当てビット数に基づいて、i番目のビデオフレームに対してターゲットビット数を割り当ててから、ターゲットビット数に基づいて、i番目のビデオフレームの第2の量子化パラメータを算出することができる。
具体的には、端末は、符号化を行う際に、i番目のビデオフレームをM×M(Mは1より大きい正の整数である)の画素ブロックに分割することができる。端末は、ブロックごとに重み値を設定して、その重み値とターゲットビット数とに基づいて、各画素ブロックにそれぞれの第1のターゲットビット数を割り当てることができる。このようにして、端末は、第1のターゲットビット数に基づいて、画素ブロックごとに対応する第2の量子化パラメータを算出することができる。
S203で、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとを取得し、ここで、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとは、i-1番目のビデオフレームの符号化の後に決定されたものである。
S204で、第2の量子化パラメータと、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとに基づいて、i番目のビデオフレームを符号化する。
端末は、i番目のビデオフレームの第2の量子化パラメータを算出し処理した後、この端末は、i-1番目のビデオフレームのときに、既にi番目のビデオフレームに対応する第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとを算出したので、即ち、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとは、i-1番目のビデオフレームの符号化の後に決定されたものであるので、この端末は、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとを取得する。このようにして、端末は、第2の量子化パラメータと、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとに基づいて、i番目のビデオフレームを符号化することができる。
具体的には、i番目のビデオフレームにおける第1の画素ブロックに対して、端末は、第2の初期量子化パラメータを採用してビデオ符号化を行い、i番目のビデオフレームにおける第1の画素ブロック以外のほかの任意の画素ブロックに対して、端末は、それぞれに対応する第2の量子化パラメータを採用してビデオ符号化を行い、また、この第2の量子化パラメータが、第2の最大量子化パラメータと第2の最小量子化パラメータによる制限を受け、すなわち、第2の量子化パラメータの上限値が、第2の最大量子化パラメータであり、下限値が、第2の最小量子化パラメータである。第2の量子化パラメータが「第2の最小量子化パラメータ,第2の最大量子化パラメータ」という範囲内にある場合、その第2の量子化パラメータに対応する画素ブロックに対して、端末は、それぞれに対応する第2の量子化パラメータを採用してビデオ符号化を行いし、第2の量子化パラメータが第2の最大量子化パラメータを超える場合、この第2の量子化パラメータに対応する画素ブロックに対して、端末は、第2の最大量子化パラメータを採用してビデオ符号化を行いし、第2の量子化パラメータが第2の最小量子化パラメータより小さい場合、この第2の量子化パラメータに対応する画素ブロックに対して、端末は、第2の最小量子化パラメータを採用してビデオ符号化を行う。
理解すべきところとして、端末によるi番目のビデオフレームへの符号化が、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとによる制限を受けるため、i番目のビデオフレームを符号化する際の量子化パラメータは、高すぎたり低すぎたりすることがない。そのため、i-1番目のビデオフレームによって過剰に消費されたビットを補償するとともに、i番目のビデオフレームを符号化する際のビデオ品質を維持するということが保証される。
説明すべきところとして、i番目のビデオフレームの符号化が完了した後、端末は、S101~105を実行し、この端末がi+1番目のビデオフレームが第1の補償ビデオフレームに属すると判断した場合の符号化方式は、S201~S204と一致する。
例示的には、現在の画像グループのビデオフレームは1000個のフレームがあると仮定すると、端末は、200番目のビデオフレームの符号化を行う際に、200番目のビデオフレームの消費ビット数がビデオフレームの検出規則に適合し、シーンの切り替え状態にあることを検出した場合、この端末は、補償長さ(5と仮定する)や201番目のビデオフレームの第3の補償割り当てビット数、第2の初期量子化パラメータ、第2の最大量子化パラメータ、第2の最小量子化パラメータを算出することができ、このとき、201番目のフレームが補償ウィンドウ200+5内にあるため、端末は、第3の補償割り当てビット数と、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとを採用して201番目のビデオフレームを符号化し、符号化が完了した後、端末は、201番目のビデオフレームに対してS101~S105での実現プロセスを開始する。
S205で、i番目のビデオフレームが第2の補償対象ビデオフレームに属さない場合、ターゲットビット数に基づいて、i番目のビデオフレームの第3の量子化パラメータを算出する。
S206で、第3の量子化パラメータに基づいて、i番目のビデオフレームを符号化する。
本願の実施例では、端末がi番目のビデオフレームを符号化する際に第1の符号化規則を採用する理由は、i番目のビデオフレームが、前の符号化フレームの補償ウィンドウ内にあってもよいし、補償を行う必要がなくてもよいことである。そのため、この2つの場合について、端末がi番目のビデオフレームを符号化する方式は、同じではない。
ここで、i番目のビデオフレームが第2の補償対象ビデオフレームに属さない場合、端末は、ターゲットビット数に基づいてi番目のビデオフレームの第3の量子化パラメータを算出してから、第3の量子化パラメータに基づいてi番目のビデオフレームを符号化すればよい。
説明すべきところとして、本願の実施例によって提供されるビデオフレーム符号化方法におけるS201~S204とS205~S206は、S101における第1の符号化規則を採用してi番目のビデオフレームに対してビデオ符号化を行うプロセスを実現するための2つのオプションのプロセスであり、本願の実施例は、S201~S204とS205~S206の実行順序を限定しなく、端末は、実際の動作状況に応じて、相応なステップまたはプロセスを実行することができ、本願の実施例は限定しない。
本願の実施例によって提供されるビデオフレーム符号化方法に基づいて、本願の実施例は、端末1を提供している。図7に示すように、該端末1は、
画像グループのi(iは1以上かつN以下であり、Nは前記画像グループにおけるビデオフレームのフレーム総数である)番目のビデオフレームを取得する取得手段10と、
第1の符号化規則を採用して前記i番目のビデオフレームに対してビデオ符号化を行う符号化手段11と、
符号化された前記i番目のビデオフレームに対応する実際の消費ビット数を統計する統計手段12と、
前記実際の消費ビット数と、画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出する検出手段13と、
前記i番目のビデオフレームが前記シーン切り替え状態にある場合、前記実際の消費ビット数と、前記画像群の初期平均ビットレートと、量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定する決定手段14と、
前記i+1番目のビデオフレームが第1の補償対象ビデオフレームに属する場合、前記i+1番目のビデオフレームに対応する第1の補償割り当てビット数と、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量子化パラメータとにより、前記第1の符号化規則を更新する更新手段15と、を含み、
前記取得手段10は、さらに、補償長さを取得し、
前記決定手段14は、さらに、前記補償長さと補償モデルとに基づいて、前記第1の補償対象ビデオフレームと、前記第1の補償対象ビデオフレームのそれぞれに対応する前記第1の補償割り当てビット数とを決定し、
前記符号化手段11は、さらに、N番目のビデオフレームの符号化が完了するまで、前記i+1番目のビデオフレームのビデオ符号化プロセスに入る。
一部の実施例では、前記ビデオフレーム検出規則は、第1のビデオフレーム検出規則と第2のビデオフレーム検出規則とを含み、
前記検出手段13は、さらに、前記i番目のビデオフレームの第1のフレームタイプを検出し、
前記取得手段10は、さらに、前記第1のフレームタイプがターゲットフレームタイプを満たす場合に、画像グループの残りの平均ビットレートを取得し、
前記検出手段13は、さらに、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記画像グループの残りの平均ビットレートと、前記第1のビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出する。
一部の実施例では、前記検出手段13は、さらに、前記i番目のビデオフレームの第1のフレームタイプを検出した後、前記第1のフレームタイプが前記ターゲットフレームタイプを満たさない場合、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記第2のビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出する。
一部の実施例では、前記取得手段10は、さらに、前記i番目のビデオフレームが第2の補償対象ビデオフレームに属する場合、前記第2の補償対象ビデオフレームに対応する第2の補償割り当てビット数から、前記i番目のビデオフレームの第3の補償割り当てビット数を取得し、ここで、前記第2の補償対象ビデオフレームが、i番目のビデオフレームの前のビデオフレームの符号化の後に決定されたものであることと、前記第3の補償割り当てビット数に基づいて、前記i番目のビデオフレームの第2の量子化パラメータを算出することと、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとを取得し、ここで、前記第2の初期量子化パラメータと、前記第2の最大量子化パラメータと、前記第2の最小量子化パラメータとが、i-1番目のビデオフレームの符号化の後に決定されたものであることと、を行い、
前記符号化手段11は、さらに、前記第2の量子化パラメータと、前記第2の初期量子化パラメータと、前記第2の最大量子化パラメータと、前記第2の最小量子化パラメータとに基づいて、前記i番目のビデオフレームを符号化する。
一部の実施例では、前記取得手段10は、さらに、前記i番目のビデオフレームが第2の補償対象ビデオフレームに属さない場合、ターゲットビット数に基づいて、i番目のビデオフレームの第3の量子化パラメータを算出し、
前記符号化手段11は、さらに、前記第3の量子化パラメータに基づいて、i番目のビデオフレームを符号化する。
一部の実施例では、前記端末1は、調整手段16をさらに含み、
前記調整手段16は、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定した後、前記実際の消費ビット数とターゲットビット数とが比率条件を満たす場合、量子化調整モデルに従って、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量子化パラメータとに対して、パラメータ調整を行い、第1の調整初期量子化パラメータと、第1の調整最大量子化パラメータと、第1の調整最小量子化パラメータとを得る。
一部の実施例では、前記更新手段15は、さらに、前記第1の補正割り当てビット数と、前記第1の調整初期量子化パラメータと、前記第1の調整最大量子化パラメータと、前記第1の調整最小量子化パラメータとに基づいて、前記第1の符号化規則を更新する。
一部の実施例では、前記符号化手段11は、さらに、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切替状態にあるかどうかを検出した後、前記i番目のビデオフレームが非シーン切替状態にある場合、N番目のビデオフレームの符号化が完了するまで、i+1番目のビデオフレームのビデオ符号化プロセスに入る。
理解すべきところとして、端末は、ビデオフレーム符号化を行う際に、現在のビデオフレームがシーン切り替え状態にある場合、実際の消費ビット数と、画像グループの初期平均ビットレートなどの要因により、後続のビデオフレームの補償長さ(すなわち補償ウィンドウの長さ)、第1の補償割り当てビット数を適応的に調整しつつ、次のフレームの後続符号化のための初期量子化パラメータと、最大量子化パラメータと、最小量子化パラメータとを決定することができ、このようにして、この端末は、次のフレームの初期量子化パラメータと、最大量子化パラメータと、最小量子化パラメータとに基づいて、次のフレームを符号化する時に、前のフレームによって過剰に消費されたビットを補償することができ、これによって、ビデオフレームの符号化品質を維持する前提で、毎秒ピークビットレートが低減され、毎秒ピークビットレートの安定が維持されるため、ビデオストリームがスムーズに伝送される。
本願の実施例によって提供されるビデオフレーム符号化方法に基づいて、図8に示すように、本願の実施例は、端末を提供している。該端末は、プロセッサ17と、メモリ18と、通信バス19とを含み、前記メモリ18は、前記プロセッサ17と前記通信バス19を介して接続され、前記プロセッサ17は、前記メモリ18に記憶されているビデオフレーム符号化関連プログラムを呼び出して、次のステップを実行する。これらのステップは、
画像グループのi(iは1以上かつN以下であり、Nは前記画像グループにおけるビデオフレームのフレーム総数である)番目のビデオフレームを取得し、第1の符号化規則を採用して前記i番目のビデオフレームに対してビデオ符号化を行い、符号化された前記i番目のビデオフレームに対応する実際の消費ビット数を統計するステップと、前記実際の消費ビット数と、画像グループの初期平均符号化率と、ビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切替状態にあるかどうかを検出するステップと、前記i番目のビデオフレームが前記シーン切替状態にある場合、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定するステップと、補償長さを取得し、前記補償長さと補償モデルとに基づいて、第1の補償対象ビデオフレームと、前記第1の補償対象ビデオフレームのそれぞれに対応する第1の補償割り当てビット数とを決定するステップと、前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属する場合、前記i+1番目のビデオフレームに対応する第1の補償割り当てビット数と、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量子化パラメータとに基づいて、前記第1の符号化規則を更新し、N番目のビデオフレームの符号化が完了するまで、i+1番目のビデオフレームのビデオ符号化プロセスに入るステップと、を含む。
一部の実施例では、前記ビデオフレーム検出規則は、第1のビデオフレーム検出規則と第2のビデオフレーム検出規則とを含み、
前記プロセッサ17は、前記i番目のビデオフレームの第1のフレームタイプを検出し、
前記第1のフレームタイプがターゲットフレームタイプを満たす場合、画像グループの残りの平均ビットレートを取得し、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記画像グループの残りの平均ビットレートと、前記第1のビデオフレーム検出規則とに基づいて、i番目のビデオフレームが前記シーン切り替え状態にあるかどうかを検出する。
一部の実施例では、前記プロセッサ17は、前記i番目のビデオフレームの第1のフレームタイプを検出した後、前記第1のフレームタイプが前記ターゲットフレームタイプを満たさない場合、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記第2のビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームが前記シーン切り替え状態にあるかどうかを検出する。
一部の実施例では、前記プロセッサ17は、前記i番目のビデオフレームが第2の補償対象ビデオフレームに属する場合、前記第2の補償対象ビデオフレームに対応する第2の補償割り当てビット数から、前記i番目のビデオフレームの第3の補償割り当てビット数を取得し、ここで、前記第2の補償対象ビデオフレームが、前記i番目のビデオフレームの前のビデオフレームの符号化の後に決定されたものであることと、前記第3の補償割り当てビット数に基づいて、前記i番目のビデオフレームの第2の量子化パラメータを算出することと、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとを取得し、ここで、前記第2の初期量子化パラメータと、前記第2の最大量子化パラメータと、前記第2の最小量子化パラメータとが、i-1番目のビデオフレームの符号化の後に決定されたものであることと、前記第2の量子化パラメータと、前記第2の初期量子化パラメータと、前記第2の最大量子化パラメータと、前記第2の最小量子化パラメータとに基づいて、前記i番目のビデオフレームを符号化することと、を行う。
一部の実施例では、前記プロセッサ17は、前記i番目のビデオフレームが第2の補償対象ビデオフレームに属さない場合、ターゲットビット数に基づいて、前記i番目のビデオフレームの第3の量子化パラメータを算出することと、前記第3の量子化パラメータに基づいて前記i番目のビデオフレームを符号化することと、を行う。
一部の実施例では、前記プロセッサ17は、さらに、前記実際の消費ビット数と、画像グループの初期平均ビットレートと、量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定した後、前記実際の消費ビット数とターゲットビット数が比率条件を満たす場合、量子化調整モデルに従って、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量子化パラメータとに対して、パラメータ調整を行い、第1の調整初期量子化パラメータと、第1の調整最大量子化パラメータと、第1の調整最小量子化パラメータとを得る。
一部の実施例では、前記プロセッサ17は、さらに、前記第1の補正割り当てビット数と、前記第1の調整初期量子化パラメータと、前記第1の調整最大量子化パラメータと、前記第1の調整最小量子化パラメータとに基づいて、前記第1の符号化規則を更新する。
一部の実施例では、前記プロセッサ17は、さらに、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記ビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切替状態にあるかどうかを検出した後、前記i番目のビデオフレームが非シーン切替状態にある場合、N番目のビデオフレームが完了するまで、i+1番目のビデオフレームのビデオ符号化プロセスに入る。
一部の実施例では、前記プロセッサ17は、さらに、前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属するかどうかを決定し、前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属する場合、i+1番目のビデオフレームに対応する前記第1の補償割り当てビット数と、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量化パラメータとに基づいて、前記第1の符号化規則を更新し、前記i+1番目のビデオフレームに対してビデオ符号化を行い、
前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属さない場合、ターゲットビット数に基づいて前記i+1番目のビデオフレームの第4の量子化パラメータを算出し、前記第4の量化パラメータに基づいて、前記i+1番目のビデオフレームに対してビデオ符号化を行い、ここで、前記ターゲットビット数とは、前記i+1番目のビデオフレームに予め割り当てられたビット数を意味する。
説明すべきところとして、ここで、前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属するかどうかを決定することは、i番目のフレームが第2の補償対象ビデオフレームであるかどうかを決定することに相当する。理解すべきところとして、端末は、ビデオフレームに対して符号化を行う際に、現在のビデオフレームがシーン切り替え状態にある場合、実際の消費ビット数と、画像グループの初期平均ビットレートなどの要因により、後続のビデオフレームの補償長さ(すなわち補償ウィンドウの長さ)、第1の補償割り当てビット数を適応的に調整しつつ、次のフレームの後続符号化のための初期量子化パラメータと、最大量子化パラメータと、最小量子化パラメータとを決定することができ、このようにして、この端末は、次のフレームの初期量子化パラメータと、最大量子化パラメータと、最小量子化パラメータとに基づいて、次のフレームを符号化する時に、前のフレームによって過剰に消費されたビットを補償することができ、これによって、ビデオフレームの符号化品質を維持する前提で、毎秒ピークビットレートが低減され、毎秒ピークビットレートの安定が維持されるため、ビデオストリームがスムーズに伝送される。
実際の応用では、上述のメモリは、例えばランダムアクセスメモリ(RAM:Random-Access Memory)のような揮発性メモリ(volatile memory)であってもよく、例えばリードオンリーメモリ(ROM:Read-Only Memory)、フラッシュメモリ(flash memory)、ハードディスク(HDD:Hard Disk Drive)や固体ハードディスク(SSD:Solid-State Drive)などのような不揮発性メモリ(non-volatile memory)であってもよく、または上記の種類のメモリの組み合わせであってもよいし、また、プロセッサに命令とデータを提供している。
上記のプロセッサは、特定用途向け集積回路(ASIC:Appliation Specific Integrated Curcuit)、デジタル信号プロセッサ(DSP:Digital Signal Processor)、デジタル信号処理装置(DSPD:Digital Signal Processing Device)、プログラマブル論理デバイス(PLD:Programmable Logic Device)、フィールドプログラマブルゲートアレイ(FPGA:Field Programmable Gate Aray)、中央プロセッサ(CPU:Central Processing Unit)、コントローラ、マイクロコントローラ、マイクロプロセッサのうちの少なくとも1つであってもよい。理解すべきところとして、異なる装置については、上記プロセッサの機能を実現するための電子機器は他にもよいが、本願の実施例は特に限定しない。
また、本願の実施例は、端末に適用されるコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ読み取り可能な記憶媒体に1つまたは複数のビデオフレーム符号化プログラムが記憶され、前記1つまたは複数のビデオフレーム符号化プログラムは、1つまたは複数のプロセッサによって実行され、実施例1および実施例2の方法を実現することができる。
当業者であれば、本願の実施例は、方法、システム、またはコンピュータプログラム製品として提供されてもよいことを理解すべきである。したがって、本願は、ハードウェアの実施例、ソフトウェアの実施例、またはソフトウェアとハードウェアを組み合わせた実施例という形式を採用することができる。さらに、本願は、コンピュータ利用可能なプログラムコードを含む1つ以上のコンピュータ利用可能な記憶媒体(磁気ディスクメモリや光学メモリなどを含むが、これらに限定されない)上で実施されるコンピュータプログラム製品という形式を採用することができる。
本願は、本願の実施例による方法、装置(システム)、およびコンピュータプログラム製品のフローチャートおよび/またはブロック図を参照しながら説明するものである。フローチャートおよび/またはブロック図におけるそれぞれのプロセスおよび/またはブロック、ならびにフローチャートおよび/またはブロック図におけるプロセスおよび/またはブロックの組み合わせは、コンピュータプログラム命令によって実現され得ることが理解されるべきである。これらのコンピュータプログラム命令が、汎用コンピュータ、専用コンピュータ、埋め込みプロセッサ、または他のプログラマブルデータ処理装置のプロセッサに提供されることで、1つの機器が生成される。これによって、コンピュータまたは他のプログラマブルデータ処理装置のプロセッサによって実行される命令は、フローチャートの1つまたは複数のプロセスおよび/またはブロック図の1つまたは複数のブロックに指定された機能を実現するための装置を生成する。
これらのコンピュータプログラム命令が、特定の方法で動作するようにコンピュータまたは他のプログラマブルデータ処理装置を導くことができるコンピュータ読み取り可能なメモリに記憶されてもよいし、これによって、このコンピュータ読み取り可能なメモリに記憶されている命令は、命令デバイスを含む製造品を生成し、この命令装置は、フローチャートの1つまたは複数のプロセスおよび/またはブロック図の1つまたは複数のブロックに指定された機能を実現する。
これらのコンピュータプログラム命令が、コンピュータまたは他のプログラマブルデータ処理装置にロードされてもよいし、これによって、コンピュータまたは他のプログラマブルデバイス上で一連の動作ステップを実行することで、コンピュータによって実現される処理を生成し、それにより、コンピュータまたは他のプログラマブルデバイス上で実行される命令は、フローチャートの1つまたは複数のプロセスおよび/またはブロック図の1つまたはブロックに指定された機能を実現するためのステップを提供している。
上記は、本願の好ましい実施例にすぎず、本願の保護範囲を限定するものではない。
1 端末
3 ネットワーク
10 取得手段
11 符号化手段
12 統計手段
13 検出手段
14 決定手段
15 更新手段
17 プロセッサ
18 メモリ

Claims (17)

  1. 端末に適用されるビデオフレーム符号化方法であって、
    画像グループのi(iは1以上かつN以下であり、Nは前記画像グループにおけるビデオフレームのフレーム総数である)番目のビデオフレームを取得し、前記i番目のビデオフレームを符号化するための規則である第1の符号化規則を採用して前記i番目のビデオフレームに対してビデオ符号化を行い、符号化された前記i番目のビデオフレームに対応する実際の消費ビット数を統計することと、
    前記実際の消費ビット数と、画像グループの初期平均ビットレートと、現在検出されているビデオフレームである前記i番目のビデオフレームがシーン切り替えフレームであるかどうかを判定するための判定条件であるビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出することと、
    前記i番目のビデオフレームが前記シーン切り替え状態にある場合、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記i番目のビデオフレームの量子化パラメータを算出するためのモデルである量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定することと、
    前記i+1番目のビデオフレームにビット補償を行うために、補償長さを取得し、前記補償長さと補償モデルとに基づいて、第1の補償対象ビデオフレームと、前記第1の補償対象ビデオフレームのそれぞれに対応する第1の補償割り当てビット数とを決定することと、
    前記i+1番目のビデオフレームが前記第1の補償対象ビデオフレームに属する場合、前記i+1番目のビデオフレームに対応する前記第1の補償割り当てビット数と、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量子化パラメータとに基づいて、前記第1の符号化規則を更新し、N番目のビデオフレームの符号化が完了するまで、前記i+1番目のビデオフレームのビデオ符号化プロセスに入ることと、
    を含み、
    前記i+j番目のビデオフレームに対応する前記第1の補償割り当てビット数は、
    Figure 0007012747000022
    で示される前記補償モデルにおけるRT_jであり、Rcom_jは、前記i+j番目のビデオフレームに対応する第1の補償ビット基数であり、Raveは、画像グループの初期平均ビットレートであり、Rave_remainは、画像グループの残りの平均ビットレートであることを特徴とするビデオフレーム符号化方法。
  2. 前記ビデオフレーム検出規則は、第1のビデオフレーム検出規則を含み、前記実際の消費ビット数と、画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出することは、
    前記i番目のビデオフレームのフレームタイプを検出することと、
    前記フレームタイプがターゲットフレームタイプである場合、画像グループの残りの平均ビットレートを取得することと、
    前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記画像グループの残りの平均ビットレートと、前記第1のビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームが前記シーン切り替え状態にあるかどうかを検出することと、
    を含むことを特徴とする請求項1に記載の方法。
  3. 前記ビデオフレーム検出規則は、さらに、第2のビデオフレーム検出規則を含み、前記方法は、さらに、
    前記フレームタイプが前記ターゲットフレームタイプではない場合、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記第2のビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームが前記シーン切り替え状態にあるかどうかを検出すること、
    を含むことを特徴とする請求項2に記載の方法。
  4. 前記第1の符号化規則を採用して前記i番目のビデオフレームに対してビデオ符号化を行うことは、
    前記i番目のビデオフレームが第2の補償対象ビデオフレームに属する場合、前記第2の補償対象ビデオフレームのそれぞれに対応する第2の補償割り当てビット数から、前記i番目のビデオフレームに対応する第2の補償割り当てビット数を取得し、ここで、前記第2の補償対象ビデオフレームが、前記i番目のビデオフレームの前のビデオフレームの符号化の後に決定されたものであることと、
    前記i番目のビデオフレームに対応する前記第2の補償割り当てビット数に基づいて、前記i番目のビデオフレームの第2の量子化パラメータを算出することと、
    第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとを取得し、ここで、前記第2の初期量子化パラメータと、前記第2の最大量子化パラメータと、前記第2の最小量子化パラメータとが、i-1番目のビデオフレームの符号化の後に決定されたものであることと、
    前記第2の量子化パラメータと、前記第2の初期量子化パラメータと、前記第2の最大量子化パラメータと、前記第2の最小量子化パラメータとに基づいて、前記i番目のビデオフレームを符号化し、ここで、前記第2の量子化パラメータの上限値が前記第2の最大量子化パラメータであり、下限値が前記第2の最小量子化パラメータであることと、
    を含むことを特徴とする請求項1に記載の方法。
  5. 前記第1の符号化規則を採用して前記i番目のビデオフレームに対してビデオ符号化を行うことは、
    前記i番目のビデオフレームが第2の補償対象ビデオフレームに属さない場合、ターゲットビット数に基づいて、前記i番目のビデオフレームの第3の量子化パラメータを算出し、ここで、前記ターゲットビット数とは、前記i+1番目のビデオフレームに予め割り当てられたビット数を意味することと、
    前記第3の量子化パラメータに基づいて、前記i+1番目のビデオフレームに対してビデオ符号化を行うことと、
    を含むことを特徴とする請求項1に記載の方法。
  6. 前記実際の消費ビット数Ractualとターゲットビット数Rtargetとが満たす比率条件(i)Ractual>τ×Rtarget、(ii)σ×Rtarget<Ractual≦τ×Rtarget、(iii)その他に応じて、量子化調整モデルに従って、前記第1の初期量子化パラメータQPframeと、前記第1の最大量子化パラメータQPmaxと、前記第1の最小量子化パラメータQPminとに対して、パラメータ調整を行い、第1の調整初期量子化パラメータQPframe’と、第1の調整最大量子化パラメータQPmax’と、第1の調整最小量子化パラメータQPmin’とを得ること、
    をさらに含み、
    前記量子化調整モデルは、
    Figure 0007012747000023
    Figure 0007012747000024
    Figure 0007012747000025
    であり、Δ’QPI、Δ”QPIはQPのオフセット値であることを特徴とする請求項1に記載の方法。
  7. 前記第1の補償割り当てビット数と、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量子化パラメータとに基づいて、前記第1の符号化規則を更新することは、
    前記第1の補償割り当てビット数と、第1の調整初期量子化パラメータと、第1の調整最大量子化パラメータと、第1の調整最小量子化パラメータとに基づいて、前記第1の符号化規則を更新すること、
    を含むことを特徴とする請求項6に記載の方法。
  8. 前記i番目のビデオフレームが非シーン切替状態にある場合、N番目のビデオフレームの符号化が完了するまで、i+1番目のビデオフレームのビデオ符号化プロセスに入ること、
    をさらに含むことを特徴とする請求項1に記載の方法。
  9. 端末であって、
    画像グループのi(iは1以上かつN以下であり、Nは前記画像グループにおけるビデオフレームのフレーム総数である)番目のビデオフレームを取得する取得手段と、
    i番目のビデオフレームを符号化するための規則である第1の符号化規則を採用して前記i番目のビデオフレームに対してビデオ符号化を行う符号化手段と、
    符号化された前記i番目のビデオフレームに対応する実際の消費ビット数を統計する統計手段と、
    前記実際の消費ビット数と、画像グループの初期平均ビットレートと、現在検出されているビデオフレームである前記i番目のビデオフレームがシーン切り替えフレームであるかどうかを判定するための判定条件であるビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切り替え状態にあるかどうかを検出する検出手段と、
    前記i番目のビデオフレームが前記シーン切り替え状態にある場合、i+1番目のビデオフレームにビット補償を行うために、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記i番目のビデオフレームの量子化パラメータを算出するためのモデルである量子化モデルとに基づいて、前記i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定する決定手段と、
    前記i+1番目のビデオフレームが第1の補償対象ビデオフレームに属する場合、前記i+1番目のビデオフレームに対応する第1の補償割り当てビット数と、前記第1の初期量子化パラメータと、前記第1の最大量子化パラメータと、前記第1の最小量子化パラメータとに基づいて、前記第1の符号化規則を更新する更新手段と、を含み、
    前記取得手段は、さらに、補償長さを取得し、
    前記決定手段は、さらに、前記補償長さと補償モデルとに基づいて、前記第1の補償対象ビデオフレームと、前記第1の補償対象ビデオフレームのそれぞれに対応する前記第1の補償割り当てビット数とを決定し、
    前記符号化手段は、さらに、N番目のビデオフレームの符号化が完了するまで、前記i+1番目のビデオフレームのビデオ符号化プロセスに入り、
    前記i+j番目のビデオフレームに対応する前記第1の補償割り当てビット数は、
    Figure 0007012747000026
    で示される前記補償モデルにおけるRT_jであり、Rcom_jは、前記i+j番目のビデオフレームに対応する第1の補償ビット基数であり、Raveは、画像グループの初期平均ビットレートであり、Rave_remainは、画像グループの残りの平均ビットレートである
    ことを特徴とする端末。
  10. 前記ビデオフレーム検出規則は第1のビデオフレーム検出規則を含み、
    前記検出手段は、さらに、前記i番目のビデオフレームのフレームタイプを検出し、
    前記取得手段は、さらに、前記フレームタイプがターゲットフレームタイプである場合、画像グループの残りの平均ビットレートを取得し、
    前記検出手段は、さらに、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記画像グループの残りの平均ビットレートと、前記第1のビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームが前記シーン切り替え状態にあるかどうかを検出する、
    ことを特徴とする請求項9に記載の端末。
  11. 前記ビデオフレーム検出規則は、さらに、第2のビデオフレーム検出規則を含み、
    前記検出手段は、さらに、前記i番目のビデオフレームの第1のフレームタイプを検出した後、前記フレームタイプが前記ターゲットフレームタイプではない場合、前記実際の消費ビット数と、前記画像グループの初期平均ビットレートと、前記第2のビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームが前記シーン切り替え状態にあるかどうかを検出する、
    ことを特徴とする請求項10に記載の端末。
  12. 前記取得手段は、さらに、前記i番目のビデオフレームが第2の補償対象ビデオフレームに属する場合、前記第2の補償対象ビデオフレームに対応する第2の補償割り当てビット数から、前記i番目のビデオフレームに対応する第2の補償割り当てビット数を取得し、ここで、前記第2の補償対象ビデオフレームがi番目のビデオフレームの前のビデオフレームの符号化の後に決定されたものであることと、前記i番目のビデオフレームに対応する第2の補償割り当てビット数に基づいて、前記i番目のビデオフレームの第2の量子化パラメータを算出することと、第2の初期量子化パラメータと、第2の最大量子化パラメータと、第2の最小量子化パラメータとを取得し、ここで、前記第2の初期量子化パラメータと、前記第2の最大量子化パラメータと、前記第2の最小量子化パラメータとが、i-1番目のビデオフレームの符号化の後に決定されたものであることと、を行い、
    前記符号化手段は、前記第2の量子化パラメータと、前記第2の初期量子化パラメータと、前記第2の最大量子化パラメータと、前記第2の最小量子化パラメータとに基づいて、前記i番目のビデオフレームを符号化し、ここで、前記第2の量子化パラメータの上限値が前記第2の最大量子化パラメータであり、下限値が前記第2の最小量子化パラメータである、
    ことを特徴とする請求項9に記載の端末。
  13. 前記取得手段は、前記i番目のビデオフレームが第2の補償対象ビデオフレームに属さない場合、ターゲットビット数に基づいて、前記i番目のビデオフレームの第3の量子化パラメータを算出し、前記ターゲットビット数とは、前記i+1番目のビデオフレームに予め割り当てられたビット数を意味し、
    前記符号化手段は、前記第3の量子化パラメータに基づいて、前記i+1番目のビデオフレームに対してビデオ符号化を行う、
    ことを特徴とする請求項9に記載の端末。
  14. 前記端末は、調整手段をさらに含み、
    前記調整手段は、前記実際の消費ビット数と、画像グループの初期平均ビットレートと、量子化モデルとに基づいて、i+1番目のビデオフレームに対応する第1の初期量子化パラメータと、第1の最大量子化パラメータと、第1の最小量子化パラメータとを決定した後、前記実際の消費ビット数Ractualとターゲットビット数Rtargetとが満たす比率条件(i)Ractual>τ×Rtarget、(ii)σ×Rtarget<Ractual≦τ×Rtarget、(iii)その他に応じて、量子化調整モデルに従って、前記第1の初期量子化パラメータQPframeと、前記第1の最大量子化パラメータQPmaxと、前記第1の最小量子化パラメータQPminとに対して、パラメータ調整を行い、第1の調整初期量子化パラメータQPframe’と、第1の調整最大量子化パラメータQPmax’と、第1の調整最小量子化パラメータQPmin’とを得、
    前記量子化調整モデルは、
    Figure 0007012747000027
    Figure 0007012747000028
    Figure 0007012747000029
    であり、Δ’QPI、Δ”QPIはQPのオフセット値であり、
    前記符号化手段は、さらに、前記実際の消費ビット数と、画像グループの初期平均ビットレートと、ビデオフレーム検出規則とに基づいて、前記i番目のビデオフレームがシーン切替状態にあるかどうかを検出した後、前記i番目のビデオフレームが非シーン切替状態にある場合、N番目のビデオフレームの符号化が完了するまで、i+1番目のビデオフレームのビデオ符号化プロセスに入る、
    ことを特徴とする請求項9に記載の端末。
  15. 前記更新手段は、さらに、前記第1の補償割り当てビット数と、第1の調整初期量子化パラメータと、第1の調整最大量子化パラメータと、第1の調整最小量子化パラメータとに基づいて、前記第1の符号化規則を更新する、
    ことを特徴とする請求項14に記載の端末。
  16. 不揮発性のコンピュータ読み取り可能な記憶媒体であって、コンピュータ読み取り可能な命令が記憶され、少なくとも1つのプロセッサに、請求項1~8のいずれか一項に記載の方法を実行させることを特徴とするコンピュータ読み取り可能な記憶媒体。
  17. メモリと、プロセッサとを含む端末であって、
    前記メモリに、コンピュータ読み取り可能な命令が記憶され、請求項1~8のいずれか一項に記載の方法を実行するために、前記プロセッサが前記メモリにおけるコンピュータ読み取り可能な命令を実行することを特徴とする端末。
JP2019557357A 2017-08-17 2018-07-12 ビデオフレーム符号化方法、端末、および記憶媒体 Active JP7012747B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710707503.6 2017-08-17
CN201710707503.6A CN109413427B (zh) 2017-08-17 2017-08-17 一种视频帧编码方法及终端
PCT/CN2018/095378 WO2019033877A1 (zh) 2017-08-17 2018-07-12 一种视频帧编码方法、终端及存储介质

Publications (2)

Publication Number Publication Date
JP2020518174A JP2020518174A (ja) 2020-06-18
JP7012747B2 true JP7012747B2 (ja) 2022-01-28

Family

ID=65361809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019557357A Active JP7012747B2 (ja) 2017-08-17 2018-07-12 ビデオフレーム符号化方法、端末、および記憶媒体

Country Status (6)

Country Link
US (1) US11089305B2 (ja)
EP (1) EP3606050B1 (ja)
JP (1) JP7012747B2 (ja)
KR (1) KR102198020B1 (ja)
CN (1) CN109413427B (ja)
WO (1) WO2019033877A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112752106B (zh) * 2019-10-29 2022-02-18 北京新唐思创教育科技有限公司 视频图像帧的编码控制方法、装置及计算机存储介质
US12113968B2 (en) 2020-03-31 2024-10-08 Sony Interactive Entertainment Inc. Transmission device, transmission method, and program
CN111479113B (zh) * 2020-04-15 2021-04-09 腾讯科技(深圳)有限公司 码率控制方法和装置、存储介质和电子设备
CN111787322B (zh) * 2020-08-04 2022-05-13 北京百度网讯科技有限公司 视频编码的方法、装置、电子设备及计算机可读存储介质
CN114745590A (zh) * 2021-01-07 2022-07-12 阿里巴巴集团控股有限公司 视频帧编码方法、装置、电子设备及介质
US11798273B2 (en) * 2021-03-12 2023-10-24 Lawrence Livermore National Security, Llc Model-based image change quantification
US20220312018A1 (en) * 2021-03-23 2022-09-29 Samsung Electronics Co., Ltd. Electronic device to encode video with max quantum parameter control and the method thereof
CN114422783B (zh) * 2021-12-07 2024-04-12 网宿科技股份有限公司 视频编码方法、电子设备及存储介质
CN114513664B (zh) * 2022-04-18 2022-07-22 鹏城实验室 视频帧编码方法、装置、智能终端及计算机可读存储介质
CN117014622A (zh) * 2022-04-29 2023-11-07 华为技术有限公司 一种视频帧处理方法、设备、视频系统、介质及芯片
US20240089436A1 (en) * 2022-09-13 2024-03-14 Google Llc Dynamic Quantization Parameter for Encoding a Video Frame
CN116016924A (zh) * 2022-12-29 2023-04-25 杭州海康威视数字技术股份有限公司 一种视频数据的编码方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000078588A (ja) 1998-08-31 2000-03-14 Sharp Corp 動画像符号化装置
JP2004015351A (ja) 2002-06-05 2004-01-15 Sony Corp 符号化装置及び方法、プログラム、記録媒体
JP2005073245A (ja) 2003-08-14 2005-03-17 Intervideo Inc ビデオエンコーダにおけるマクロブロックのエンコードモードを選択する方法、マイクロブロックをエンコードするモードを選択するために設計されるビデオエンコーダ、マクロブロックをエンコードするモードを選択するための命令を有するモジュールから成る有形の媒体に搭載されるコンピュータプログラム、およびマクロブロックのエンコーディングのモードを選択するために設計される回路
JP2011061534A (ja) 2009-09-10 2011-03-24 Mitsubishi Electric Corp 動画像符号化装置及び動画像符号化方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08163554A (ja) * 1994-12-02 1996-06-21 Electron & Telecommun Res Inst ビデオビット率制御方法
JPH09322174A (ja) * 1996-05-30 1997-12-12 Hitachi Ltd 動画データの再生方法
US6192154B1 (en) * 1998-01-26 2001-02-20 International Business Machines Corporation Two-pass encoding method of digital motion video sequences for constant-or variable bit rate
JP3960451B2 (ja) * 2000-03-06 2007-08-15 Kddi株式会社 シーン特性検出型動画像符号化装置
EP1374429A4 (en) * 2001-03-05 2009-11-11 Intervideo Inc SYSTEMS AND METHOD FOR CODING AND DECODING REDUNDANT MOTION VECTORS IN COMPRESSED VIDEO BITSTRAMS
US20040252758A1 (en) * 2002-08-14 2004-12-16 Ioannis Katsavounidis Systems and methods for adaptively filtering discrete cosine transform (DCT) coefficients in a video encoder
US20040146108A1 (en) * 2003-01-23 2004-07-29 Shih-Chang Hsia MPEG-II video encoder chip design
CN100461862C (zh) * 2005-01-07 2009-02-11 广达电脑股份有限公司 视讯编码系统及其方法
US7403562B2 (en) * 2005-03-09 2008-07-22 Eg Technology, Inc. Model based rate control for predictive video encoder
US8165202B1 (en) * 2006-03-31 2012-04-24 Texas Instruments Incorporated Video compression rate
CN101072342B (zh) * 2006-07-01 2010-08-11 腾讯科技(深圳)有限公司 一种场景切换的检测方法及其检测系统
CN101188755B (zh) * 2007-12-14 2010-06-09 宁波中科集成电路设计中心有限公司 一种对实时视频信号在avs编码过程中vbr码率控制的方法
GB2459671A (en) * 2008-04-29 2009-11-04 Imagination Tech Ltd Scene Change Detection For Use With Bit-Rate Control Of A Video Compression System
CN101677398A (zh) * 2008-09-19 2010-03-24 三星电子株式会社 场景切换码率控制方法
US8879623B2 (en) * 2009-09-02 2014-11-04 Sony Computer Entertainment Inc. Picture-level rate control for video encoding a scene-change I picture
CN104782124B (zh) * 2012-12-17 2018-09-07 英特尔公司 利用编码器硬件对视频内容进行预处理
CN103826121B (zh) * 2013-12-20 2017-05-10 电子科技大学 低延迟视频编码基于场景切换检测的码率控制方法
CN103686172B (zh) * 2013-12-20 2016-08-17 电子科技大学 低延迟视频编码可变比特率码率控制方法
US10397574B2 (en) * 2014-05-12 2019-08-27 Intel Corporation Video coding quantization parameter determination suitable for video conferencing
CN104104951B (zh) * 2014-07-30 2017-05-03 北京邮电大学 Hevc中屏幕内容编码的码率控制方法
US10356406B2 (en) * 2016-01-19 2019-07-16 Google Llc Real-time video encoder rate control using dynamic resolution switching
CN105898329A (zh) * 2016-04-12 2016-08-24 乐视控股(北京)有限公司 一种用于视频编码的码率控制方法及装置
CN106231305B (zh) * 2016-07-26 2019-04-12 中国科学院自动化研究所 基于梯度的全i帧视频码率控制方法及控制系统
US10638127B2 (en) * 2017-05-15 2020-04-28 Qualcomm Incorporated Adaptive anchor frame and quantization parameter decision in video coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000078588A (ja) 1998-08-31 2000-03-14 Sharp Corp 動画像符号化装置
JP2004015351A (ja) 2002-06-05 2004-01-15 Sony Corp 符号化装置及び方法、プログラム、記録媒体
JP2005073245A (ja) 2003-08-14 2005-03-17 Intervideo Inc ビデオエンコーダにおけるマクロブロックのエンコードモードを選択する方法、マイクロブロックをエンコードするモードを選択するために設計されるビデオエンコーダ、マクロブロックをエンコードするモードを選択するための命令を有するモジュールから成る有形の媒体に搭載されるコンピュータプログラム、およびマクロブロックのエンコーディングのモードを選択するために設計される回路
JP2011061534A (ja) 2009-09-10 2011-03-24 Mitsubishi Electric Corp 動画像符号化装置及び動画像符号化方法

Also Published As

Publication number Publication date
WO2019033877A1 (zh) 2019-02-21
KR102198020B1 (ko) 2021-01-05
US11089305B2 (en) 2021-08-10
KR20190122830A (ko) 2019-10-30
CN109413427A (zh) 2019-03-01
EP3606050A4 (en) 2020-05-20
US20190281300A1 (en) 2019-09-12
EP3606050A1 (en) 2020-02-05
EP3606050B1 (en) 2024-04-03
CN109413427B (zh) 2022-04-08
JP2020518174A (ja) 2020-06-18

Similar Documents

Publication Publication Date Title
JP7012747B2 (ja) ビデオフレーム符号化方法、端末、および記憶媒体
CN109862359B (zh) 基于分层b帧的码率控制方法、装置和电子设备
US9241159B2 (en) Encoding apparatus, method of controlling thereof, and computer program
CN103402099B (zh) 视频编码的图片级速率控制的方法和系统
JP5351040B2 (ja) 映像符号化規格に対応した映像レート制御の改善
KR102263979B1 (ko) 비디오 인코딩 방법, 컴퓨터 장치 및 저장 매체
US10666939B2 (en) Method and apparatus for processing video bitrate, storage medium, and electronic device
CN111193924B (zh) 视频码率的确定方法、装置、计算机设备及存储介质
CN112165620B (zh) 视频的编码方法及装置、存储介质、电子设备
CN112272299A (zh) 一种视频编码的方法、装置、设备和存储介质
CN114245196B (zh) 一种录屏推流方法、装置、电子设备及存储介质
CN109218722B (zh) 一种视频编码方法、装置及设备
WO2020019354A1 (zh) 视频编码方法及装置、计算机可读存储介质
CN103237210B (zh) 一种视频编码中比特分配的方法及系统
Tang et al. A low delay rate control method for screen content coding
CN118055234B (zh) 视频帧编码方法、装置、设备、介质和计算机程序产品
Kobayashi et al. A real-time 4K HEVC multi-channel encoding system with content-aware bitrate control
CN118590722A (zh) 基于多连接的流媒体传输方法、装置及电子设备
CN116418986A (zh) 基于avs的可变码率控制方法及装置
US10602158B2 (en) Method for maximizing video slice size constraint
JP2010118912A (ja) 画像符号化装置、制御方法、及びプログラム
CN118590648A (zh) 视频压缩处理方法、装置、设备及存储介质
CN115914632A (zh) 视频编码方法、解码方法、视频编解码器及计算机介质
JP2005217499A (ja) 画像処理装置、画像処理プログラムおよび画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191021

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220118

R150 Certificate of patent or registration of utility model

Ref document number: 7012747

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150