JP2024511103A - 近似値に基づいて画像又はビデオの品質を評価する方法及び装置、第1のモデルの訓練方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム - Google Patents

近似値に基づいて画像又はビデオの品質を評価する方法及び装置、第1のモデルの訓練方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム Download PDF

Info

Publication number
JP2024511103A
JP2024511103A JP2023558311A JP2023558311A JP2024511103A JP 2024511103 A JP2024511103 A JP 2024511103A JP 2023558311 A JP2023558311 A JP 2023558311A JP 2023558311 A JP2023558311 A JP 2023558311A JP 2024511103 A JP2024511103 A JP 2024511103A
Authority
JP
Japan
Prior art keywords
model
evaluated
training samples
value
subjective
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023558311A
Other languages
English (en)
Inventor
ジン,フェイジェン
Original Assignee
テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド filed Critical テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Publication of JP2024511103A publication Critical patent/JP2024511103A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/16Indexing scheme for image data processing or generation, in general involving adaptation to the client's capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Image Analysis (AREA)

Abstract

本発明は、人工知能のコンピュータビジョン(画像)又は機械学習などの技術分野に関し、近似値に基づいて画像又はビデオの品質を評価する方法及び関連装置を提供する。該方法は、取得した評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて該評価すべきサンプルの主観真理値に近似する第1の近似値を計算し、該第1のモデルは、オフラインの第2のモデルに基づいて得られたモデルであり、該第2のモデルは、k個の訓練サンプル及び該k個の訓練サンプルの主観真理値を訓練セットとして得られたモデルであり、該第1のモデルは、該第2のモデルを用いて取得された該k個の訓練サンプルの近似値を参照として、該k個の訓練サンプルのパラメータをフィッティングして得られたモデルであり、kは正の整数であり、該第1の近似値に基づいて画像又はビデオの品質を評価する。サーバ側のハードウェアのコストを増加させることなく、且つ評価の正確度を確保すると共に、リアルタイムにフィードバックされた主観真理値に近似する近似値に基づいて画像又はビデオの品質を評価することができる。【選択図】図3

Description

本出願は、2021年4月13日に出願した出願番号が202110395015.2であり、発明の名称が「近似値に基づいて画像又はビデオの品質を評価する方法及び関連装置」である中国特許出願に基づく優先権を主張し、その全ての内容を参照により本発明に援用する。
本発明の実施例は、人工知能のコンピュータビジョン(画像)又は機械学習などの技術分野に関し、具体的には、近似値に基づいて画像又はビデオの品質を評価することに関する。
画像/ビデオの品質は、一般的にアルゴリズムモデルを用いてビデオ/画像の品質指標を計算することができる。
一般的に、ビデオの主観的な採点モデル及び計算値は、ビデオの主観的な品質状況をフィードバックできるが、計算複雑度及び正確性から言えば理想的ではない。例えば、単純にエンコーダの量子化パラメータ(QP)、ピーク信号対雑音比(Peak Signal-to-Noise Ratio:PSNR)、構造類似性(Structural SIMilarity:SSIM)を利用してゲームビデオの客観的な品質スコアをフィードバックすることができる。この方式は、複雑度が高くないが、主観的な品質評価との相関性が低く、一定の制限性があり、且つ一定の遅延影響を導入する。また、ビデオマルチメソッド評価融合(Video Multimethod Assessment Fusion:VAMF)などのモデルによりゲームビデオの客観的な品質スコアを取得することができる。この方式は、PSNRについて精度が高いが、計算の複雑度が非常に高く、高フレームレート、高解像度のビデオのリアルタイム計算を実現することができない。
また、クラウドゲームは多種多様であるため、大量のビデオデータからビデオの主観スコアをリアルタイムに取得する必要があるが、関連技術には、主観的な品質をリアルタイムにフィードバックするためのモデル及び関連スキームがない。
従って、本技術分野では、リアルタイムにフィードバックされた主観的な品質に基づいて画像又はビデオの品質を評価することができる方法が求められている。
本発明は、サーバ側のハードウェアのコストを増加させることなく、且つ評価の正確度を確保すると共に、リアルタイムにフィードバックされた主観真理値に近似する近似値に基づいて画像又はビデオの品質を評価することができる、近似値に基づいて画像又はビデオの品質を評価する方法及び関連装置を提供する。
本発明の1つの態様では、データ処理能力を有する電子機器が実行する、近似値に基づいて画像又はビデオの品質を評価する方法であって、評価すべきビデオ又は評価すべき画像を含む評価すべきサンプルを取得するステップと、前記評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて前記評価すべきサンプルの主観真理値に近似する第1の近似値を計算するステップであって、前記第1のモデルは、オフラインの第2のモデルに基づいて得られたモデルであり、前記第2のモデルは、k個の訓練サンプル及び前記k個の訓練サンプルの主観真理値を訓練セットとして得られたモデルであり、前記k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得され、前記第1のモデルは、前記第2のモデルを用いて取得された前記k個の訓練サンプルの近似値を参照として、前記k個の訓練サンプルのパラメータをフィッティングして得られたモデルであり、kは正の整数である、ステップと、前記第1の近似値に基づいて、前記評価すべきビデオ又は前記評価すべき画像の品質を評価するステップと、を含む、方法を提供する。
本発明のもう1つの態様では、データ処理能力を有する電子機器に配備される、近似値に基づいて画像又はビデオの品質を評価する装置であって、評価すべきビデオ又は評価すべき画像を含む評価すべきサンプルを取得する取得部と、前記評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて前記評価すべきサンプルの主観真理値に近似する第1の近似値を計算する計算部であって、前記第1のモデルは、オフラインの第2のモデルに基づいて得られたモデルであり、前記第2のモデルは、k個の訓練サンプル及び前記k個の訓練サンプルの主観真理値を訓練セットとして得られたモデルであり、前記k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得され、前記第1のモデルは、前記第2のモデルを用いて取得された前記k個の訓練サンプルの近似値を参照として、前記k個の訓練サンプルのパラメータをフィッティングして得られたモデルであり、kは正の整数である、計算部と、前記第1の近似値に基づいて、前記評価すべきビデオ又は前記評価すべき画像の品質を評価する評価部と、を含む、装置を提供する。
本発明のもう1つの態様では、データ処理能力を有する電子機器が実行する、第1のモデルの訓練方法であって、k個の訓練サンプルを取得するステップであって、前記k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得される、ステップと、前記k個の訓練サンプル及び前記k個の訓練サンプルの主観真理値を訓練セットとして、第2のモデルを取得するステップと、前記k個の訓練サンプルを入力として、前記第2のモデルを用いて前記k個の訓練サンプルの主観真理値に近似する近似値を取得するステップと、前記k個の訓練サンプルの近似値を参照として、前記k個の訓練サンプルのパラメータをフィッティングして前記第1のモデルを取得するステップと、を含む、方法を提供する。
本発明のもう1つの態様では、データ処理能力を有する電子機器に配備される、第1のモデルの訓練装置であって、k個の訓練サンプルを取得する第1の取得部であって、前記k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得される、第1の取得部と、前記k個の訓練サンプル及び前記k個の訓練サンプルの主観真理値を訓練セットとして、第2のモデルを取得する第1の訓練部と、前記k個の訓練サンプルを入力として、前記第2のモデルを用いて前記k個の訓練サンプルの主観真理値に近似する近似値を取得する第2の取得部と、前記k個の訓練サンプルの近似値を参照として、前記k個の訓練サンプルのパラメータをフィッティングして前記第1のモデルを取得する第2の訓練部と、を含む、装置を提供する。
本発明のもう1つの態様では、コンピュータプログラムを実行可能なプロセッサと、コンピュータプログラムが記憶されたコンピュータ読み取り可能な記憶媒体と、を含み、前記コンピュータプログラムは、前記プロセッサにより実行される際に、上記の近似値に基づいて画像又はビデオの品質を評価する方法又は上記の第1のモデルの訓練方法を実現する、電子機器を提供する。
本発明の実施例のもう1つの態様では、コンピュータプログラムを記憶するためのコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラムは、上記の近似値に基づいて画像又はビデオの品質を評価する方法又は上記の第1のモデルの訓練方法をコンピュータに実行させる、記憶媒体を提供する。
本発明の実施例のもう1つの態様では、コンピュータプログラム製品又はコンピュータプログラムを提供し、該コンピュータプログラム製品又はコンピュータプログラムは、コンピュータ読み取り可能な記憶媒体に記憶されたコンピュータ命令を含む。コンピュータ機器のプロセッサは、コンピュータ読み取り可能な記憶媒体からコンピュータ命令を読み取ってコンピュータ命令を実行することで、上記の近似値に基づいて画像又はビデオの品質を評価する方法又は上記の第1のモデルの訓練方法を該コンピュータ機器に実行させる。
本発明の実施例では、評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて該評価すべきサンプルの主観真理値に近似する第1の近似値を計算し、さらに、該第1の近似値に基づいて該評価すべきビデオ又は該評価すべき画像の品質を評価する。オンラインの第1のモデルによれば、該第1の近似値をリアルタイムに計算してフィードバックすることができるため、リアルタイムにフィードバックされた主観真理値に近似する近似値に基づいて画像又はビデオの品質を評価することができる。また、該第1のモデルは、オフラインの第2のモデルに基づいて得られたモデルであり、該第2のモデルは、k個の訓練サンプル及び該k個の訓練サンプルの主観真理値を訓練セットとして得られたモデルであり、該k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得され、該第1のモデルは、該第2のモデルを用いて取得された該k個の訓練サンプルの近似値を参照として、該k個の訓練サンプルのパラメータをフィッティングして得られたモデルであり、kは正の整数である。即ち、訓練により得られた第2のモデルを用いてフィッティングにより第1のモデルを取得することで、サーバ側のハードウェアのコストを増加させることなく、第1のモデルの評価の正確度を確保することができる。
以上のように、本発明に係る方法は、サーバ側のハードウェアのコストを増加させることなく、且つ評価の正確度を確保すると共に、リアルタイムにフィードバックされた主観真理値に近似する近似値に基づいて画像又はビデオの品質を評価することができる。
本発明の実施例に係る技術をより明確に説明するために、以下は、実施例の説明に必要な図面を簡単に紹介する。なお、以下の図面は、単に本発明の幾つかの態様であり、当業者は、創造的な作業を行うことなく、これらの図面に基づいて他の図面を得ることができる。
本発明の実施例に係る主観的な採点プラットフォームのインターフェースの概略図である。 本発明の実施例に係るランダムに選択されたサンプルに基づいて品質評価モデルを訓練する方法の概略的なフローチャートである。 本発明の実施例に係る近似値に基づいて画像又はビデオの品質を評価する方法の概略的なフローチャートである。 本発明の実施例に係る第1のモデルの動作原理の概略的なブロック図である。 本発明の実施例に係る第1のモデルの訓練原理及び評価原理の概略的なブロック図である。 本発明の実施例に係る第1のモデルの最適化原理の概略的なブロック図である。 本発明の実施例に係る第1のモデルを含むサービスシステムの概略的なブロック図である。 本発明の実施例に係る第1のモデルの訓練方法の概略的なフローチャートである。 本発明の実施例に係る近似値に基づいて画像又はビデオの品質を評価する装置の概略的なブロック図である。 本発明の実施例に係る第1のモデルの訓練装置の概略的なブロック図である。 本発明の実施例に係る電子機器の概略的なブロック図である。
以下は、本発明の実施例における図面を参照しながら本発明の実施例における技術を明確かつ完全に説明するが、説明される実施例は本発明の一部の実施形態に過ぎず、全ての実施例ではないことは明らかである。本発明の実施例に基づいて、当業者が創造的な労働を行わずに取得した他の全ての実施例は本発明の範囲内のものである。
本発明に係る技術は、人工知能技術に関するものであってもよい。
ここで、人工知能(Artificial Intelligence:AI)は、人間の知能をシミュレーションし、拡張し、環境を感知し、知識を取得し、知識を使用して最適な結果を得るために、デジタルコンピュータ又はデジタルコンピュータによって制御される機械を利用する理論、方法、技術及び応用システムである。言い換えれば、人工知能は、計算機科学の総合技術であり、知能の本質を理解し、人間の知能と同様の方法で反応する新しい知能機械を生産しようとする。人工知能は、各種の知能機械の設計原理と実現方法を研究し、機械に感知、推理と決定の機能を持たせる。
なお、人工知能技術は、1つの総合的な学科であり、領域が広く、ハードウェアレベルの技術もソフトウェアレベルの技術もある。人工知能基礎技術は一般的に例えばセンサー、専用人工知能チップ、クラウドコンピューティング、分散型ストレージ、ビッグデータ処理技術、操作/インタラクティブシステム、メカトロニクスなどの技術を含む。人工知能ソフトウェア技術は、主にコンピュータビジョン技術、音声処理技術、自然言語処理技術、及び機械学習/深層学習などの幾つかの方面を含む。
人工知能技術の研究と進歩に伴い、人工知能技術は多くの領域で研究と応用を展開し、例えば一般的なスマートホーム、スマートウエアデバイス、バーチャルアシスタント、スマートスピーカー、スマートマーケティング、無人運転、自動運転、ドローン、ロボット、知能医療、知能カスタマーサービスなど、技術の発展に伴い、人工知能技術は更に多くの領域で応用され、ますます重要な価値を発揮すると信じている。
本発明の実施例は、人工知能技術におけるコンピュータビジョン(Computer Vision:CV)技術に関するものであってもよい。コンピュータビジョンは、機械がどのように「見る」かを研究する科学であり、さらに言えば、カメラとコンピュータを人間の目の代わりにして目標に対する認識、追跡及び測定などの機械ビジョンを行い、さらに図形処理を行い、コンピュータ処理を人間の目の観察に更に適合させ、又は計器に検出画像を伝送することを意味する。科学的な分野として、コンピュータビジョンに関する理論や技術を研究し、画像や多次元データから情報を取得できる人工知能システムを構築しようとしている。コンピュータビジョン技術は、一般的に、画像処理、画像認識、画像意味理解、画像検索、OCR、ビデオ処理、ビデオ意味理解、ビデオ内容/行動認識、三次元物体再構成、3D技術、バーチャルリアリティ、拡張現実、同期定位及び地図構築などの技術を含み、一般的な顔認識、指紋認識などの生物特徴認識技術をさらに含む。
本発明の実施例は、人工知能技術における機械学習(Machine Learning:ML)に関するものであってもよい。MLは、1つの多分野の交差学科であり、確率論、統計学、近似論、凸分析、算法複雑度理論などの多学科に関わる。コンピュータがどのように人類の学習行為を模擬或いは実現するかを専念に研究し、新しい知識或いは技能を取得し、既存の知識構造を再組織し、絶えず自身の性能を改善させる。機械学習は、人工知能の核心であり、コンピュータに知能を持たせる根本的なルートであり、その応用は人工知能の各領域に及んでいる。機械学習とディープラーニングは、通常、人工ニューラルネットワーク、信頼ネットワーク、強化学習、遷移学習、帰納学習、デモンストレーション学習などの技術を含む。
本発明のスキームを容易にするために、以下は本発明に関連する用語を説明する。
(1)画像又はビデオの品質の評価:主観的又は客観的な方式で画像又はビデオフレームの歪みを感知、測定及び評価することを意味する。主観的な採点方式は、一般的に平均主観スコア(mean opinion score:MOS)又は平均主観スコア差(difference mean opinion score:DMOS)で表され、主観的な採点方式は、主観的なスコアリング方式とも称される。客観な採点方式は、一般的にアルゴリズムモデルを採用してビデオ/画像の品質指標を計算し、客観的な採点方式は、品質評価モデルを利用して品質スコアを出力する方式とも称される。
(2)主観的な採点プラットフォーム:画像及びビデオに対して主観的な採点を行うラベル付けプラットフォームであり、主観的な採点とは、評価者/ラベル付け者がある画像又はビデオの画質や美学などに対して採点を行うことである。
図1は、本発明の実施例に係る主観的な採点プラットフォームのインターフェースの概略図である。
図1に示すように、主観的な採点プラットフォームのインターフェースは、採点すべきビデオ及び採点の選択肢を含んでもよい。例えば、5ポイント制で採点する場合、採点の選択肢は、「非常に良い」、「良い」、「普通」、「悪い」、「非常に悪い」の5段階にそれぞれ対応する。1つの採点すべきビデオは、一般的に複数の評価者により採点され、評価者はある段階の採点を選択し、該採点すべきビデオの最終的な品質スコアは、全ての評価者の採点の平均値により取得される。また、他の主観的な採点方式、例えばペアリング比較を採用してもよく、即ち、評価者は2枚の画像又はビデオを見て、どちらが良いかを選択してもよい。
(3)能動学習(active learning):主観的な採点プラットフォームは、大量の画像ビデオライブラリから一部の訓練サンプルを選択し、主観的な採点のために評価者に提供する。評価者が訓練サンプルに対して主観的な採点を行う方式で主観的なスコアを取得することは、主観的な採点の方式で訓練サンプルの主観的なスコアを取得することと称され、主観的なスコアがラベル付けされているサンプルは、ラベル付きサンプルと称される。能動学習(active learning)は、現在のモデルが最も判別しにくい、或いは情報量が多い訓練サンプルを、特定の選択ポリシーにより能動的に選択して、採点のために評価者に提供することができる。これによって、モデルの性能を確保するとともに、ラベル付ける必要があるサンプル量を効率的に削減することができる。
(4)受動学習(passive learning):ランダムに選択されたサンプルを用いてモデルを訓練する。
図2は、本発明の実施例に係るランダムに選択されたサンプルに基づいて品質評価モデルを訓練する方法の概略的なフローチャートである。
図2に示すように、品質評価モデルの訓練プロセスは、「ウォーターフォール」式のアルゴリズム開発プロセスであり、大量のデータベースからランダムに幾つか(n個)の訓練サンプルを選択し、主観採点プラットフォームに提供して評価者(即ち、評価者1~評価者t)に採点させて、採点後に訓練してモデルを取得する。このような品質評価モデルの訓練方法では、サンプルをランダムに選択する方法が多くの価値のない訓練サンプルを容易に選択でき、特に大量の画像ビデオライブラリに多くの類似、冗長なデータがある。また、選択される訓練サンプル数を予め設定する必要があり、容易に制御できない。さらに、主観的な採点とモデル訓練とは完全に分離されているため、「ウォーターフォール」式の開発プロセスでは、主観的な採点後のデータセットの品質が高くない場合、再度採点が必要となり、時間と労力がかかり、エラートレラント率が低い。
(5)平均主観スコア(mean opinion score:MOS)は、上述した訓練サンプルの最終的な品質スコアであり、この値の具体的な値は、全ての評価者のスコアの平均に基づいて取得されてもよい。例えば、本発明に係る主観真理値は、MOSであってもよい。
(6)フィッティング:フィッティングは、平面上の一連の点を滑らかな曲線で連結することである。連結された曲線には無数の可能性があるため、様々なフィッティング方法がある。フィッティングされた曲線は、一般に関数で表すことができ、異なる関数に応じて異なるフィッティング名を持つ。一般的なフィッティング方法としては、最小二乗曲線フィッティング法などがある。決定すべき関数が線形である場合、線形フィッティング又は線形回帰(主に統計で)と称され、そうでない場合、非線形フィッティング又は非線形回帰と称される。表現式は、セグメント関数でもあってもよく、この場合にスプラインフィッティングと称される。例えば、本発明に係る第1のモデルは、フィッティングにより得られたモデルであってもよい。この第1のモデルの予測結果は、主観真理値に近似する近似値であってもよい。
(7)訓練:主観採点後の画像/ビデオのデータセットを入力とし、訓練により1つのモデルを取得することができる。例えば、本発明に係る第2のモデルは、訓練により得られたモデルであってもよい。この第2のモデルの予測結果は、主観真理値に近似する近似値であってもよい。
(8)画像品質評価(image quality assessment:IQA):画像処理における基本技術の1つであり、主に画像の特性解析により研究し、画像の優劣(画像の歪みレベル)を評価する。画像品質評価は、画像処理システムにおいて、アルゴリズム解析比較、システム性能評価などに重要な役割を果たす。近年、デジタル画像領域に対する広範な研究に従い、画像品質評価の研究もますます研究者の関心を受け、多くの画像品質評価の指標及び方法を提出し、改善した。
(9)ビデオ品質評価(video quality assessment:VQA):ビデオ処理における基本技術の一つであり、主にビデオに対して特性解析の研究を行い、ビデオの優劣(ビデオの客観的な品質)を評価する。
一般的に、ビデオの主観的な採点モデル及び計算値は、ビデオの主観的な品質状況をフィードバックできるが、計算複雑度及び正確性から言えば理想的ではない。例えば、単純にエンコーダの量子化パラメータ(QP)、ピーク信号対雑音比(Peak Signal-to-Noise Ratio:PSNR)、構造類似性(Structural SIMilarity:SSIM)を利用してゲームビデオの客観的な品質スコアをフィードバックすることができる。この方式は、複雑度が高くないが、主観的な品質評価との相関性が低く、一定の制限性があり、且つ一定の遅延影響を導入する。また、ビデオマルチメソッド評価融合(Video Multimethod Assessment Fusion:VAMF)などのモデルによりゲームビデオの客観的な品質スコアを取得することができる。この方式は、PSNRについて精度が高いが、計算の複雑度が非常に高く、高フレームレート、高解像度のビデオのリアルタイム計算を実現することができない。
また、クラウドゲームは多種多様であるため、大量のビデオデータからビデオの主観スコアをリアルタイムに取得する必要があるが、関連技術には、主観的な品質をリアルタイムにフィードバックするためのモデル及び関連スキームがない。
従って、本発明は、サーバ側のハードウェアのコストを増加させることなく、且つ評価の正確度を確保すると共に、リアルタイムにフィードバックされた主観真理値に近似する近似値に基づいて画像又はビデオの品質を評価することができる、近似値に基づいて画像又はビデオの品質を評価する方法を提供する。
図3は、本発明の実施例に係る近似値に基づいて画像又はビデオの品質を評価する方法100の概略的なフローチャートである。なお、本発明の実施例に係る技術は、データ処理能力を有する任意の電子機器により実行されてもよい。例えば、該電子機器は、サーバとして実施されてもよい。サーバは、独立した物理サーバであってもよいし、複数の物理サーバにより構成されるサーバクラスタ又は分散型システムであってもよいし、クラウドサービス、クラウドデータベース、クラウドコンピューティング、クラウド関数、クラウドストレージ、ネットワークサービス、クラウド通信、ミドルウェアサービス、ドメインネームサービス、セキュリティサービス、及びビッグデータと人工知能プラットフォームなどの基礎クラウドコンピューティングサービスを提供するクラウドサーバであってもよい。サーバは、有線又は無線の通信方式により直接又は間接的に接続されてもよく、本発明はこれらに限定されない。説明の便宜上、以下は、サービスシステムを一例にして説明する。
図3に示すように、該方法100は、以下のステップの一部又は全部を含んでもよい。
ステップS110:評価すべきビデオ又は評価すべき画像を含む評価すべきサンプルを取得する。
ステップS120:該評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて該評価すべきサンプルの主観真理値に近似する第1の近似値を計算する。
ここで、該第1のモデルは、オフラインの第2のモデルに基づいて得られたモデルであり、該第2のモデルは、k個の訓練サンプル及び該k個の訓練サンプルの主観真理値を訓練セットとして得られたモデルであり、該k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得され、該第1のモデルは、該第2のモデルを用いて取得された該k個の訓練サンプルの近似値を参照として、該k個の訓練サンプルのパラメータをフィッティングして得られたモデルであり、kは正の整数である。
ステップS130:該第1の近似値に基づいて、該評価すべきビデオ又は該評価すべき画像の品質を評価する。
クラウドゲーム実行モードでは、ゲームはサーバ側で実行され、その後に画面キャプチャーの方式でレンダリングされたゲームのビデオ画面を取得し、ビデオエンコーダで圧縮された後、ネットワークを介してユーザクライアントに転送する。これに基づいて、ユーザクライアントは、近似値に基づいて画像又はビデオの品質を評価する方法により、リアルタイムにフィードバックされた主観真理値に近似する近似値に基づいて、画像又はビデオの品質を評価することができる。
本発明の実施例では、評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて該評価すべきサンプルの主観真理値に近似する第1の近似値を計算し、さらに、該第1の近似値に基づいて該評価すべきビデオ又は該評価すべき画像の品質を評価する。オンラインの第1のモデルによれば、該第1の近似値をリアルタイムに計算してフィードバックすることができるため、リアルタイムにフィードバックされた主観真理値に近似する近似値に基づいて画像又はビデオの品質を評価することができる。また、該第1のモデルは、オフラインの第2のモデルに基づいて得られたモデルであり、該第2のモデルは、k個の訓練サンプル及び該k個の訓練サンプルの主観真理値を訓練セットとして得られたモデルであり、該k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得され、該第1のモデルは、該第2のモデルを用いて取得された該k個の訓練サンプルの近似値を参照として、該k個の訓練サンプルのパラメータをフィッティングして得られたモデルであり、kは正の整数である。即ち、訓練により得られた第2のモデルを用いてフィッティングにより第1のモデルを取得することで、サーバ側のハードウェアのコストを増加させることなく、第1のモデルの評価の正確度を確保することができる。
以上のように、本発明に係る方法は、サーバ側のハードウェアのコストを増加させることなく、且つ評価の正確度を確保すると共に、リアルタイムにフィードバックされた主観真理値に近似する近似値に基づいて画像又はビデオの品質を評価することができる。言い換えれば、評価すべきサンプルの主観真理値に近似する近似値を第1のモデルによりオンラインで計算し、該第1のモデルにより算出された近似値によりクラウドゲームのビデオ品質を評価することができる。即ち、オンラインゲームのプレイ中にビデオの主観品質をリアルタイムに評価することができる。例えば、オンラインでクラウドゲームの全体的な品質を監視することができる。
なお、本発明の実施例では、ユーザは、ユーザクライアントで応用シナリオに近いクラウドゲームのビデオ品質評価スキームのセットを使用して、主観的な採点の方式で主観真理値を、第2のモデルの訓練サンプルとして取得してもよい。例えば、図1に示すような主観的な採点プラットフォームのインターフェースを採用してもよいし、図2に示すようなフローを採用して、ランダムに選択されたサンプルに基づいて第2のモデルを訓練してもよいが、本発明はこれらに限定されない。
幾つかの態様では、該評価すべきサンプルのパラメータは、ネットワークモジュールのフィードバックパラメータ、クラウドゲームモジュールの設定パラメータ、及び符号化/復号モジュールの計算パラメータのうちの少なくとも1つを含む。1つの態様では、該評価すべきサンプルのパラメータのタイプは、ソフトウェア開発キット(Software Development Kit:SDK)の分類に基づいて定義されてもよい。例えば、SDKは、ネットワークSDK、クラウドゲームSDK及び符号化/復号SDKなどを含むが、これらに限定されない。
図4は、本発明の実施例に係る第1のモデルの動作原理の概略的なブロック図である。
図4に示すように、第1のモデルは、入力された評価すべきサンプルのパラメータ1~パラメータn(例えば、シナリオに応じてパラメータを選択し、シナリオは、評価すべきサンプルの符号化パラメータ、例えば符号化フレームのパラメータ及びコードストリームに関連するもの、例えば量子化パラメータ(QP)、MV、フレームレート、フレーム長、フレーム複雑度パラメータ及びフレームタイプに関連するものを含むが、これらに限定されない。フレーム複雑度パラメータは、例えば、絶対変換差の和(Sum of Absolute Transformed Difference:SATD)であってもよい。フレームレートとは、1秒あたりに再生される画像の数を意味し、例えば、24フレームは1秒あたり24枚の画像を再生することであり、60フレームは1秒あたり60枚の画像を再生することであり、他の場合も同様である。フレーム長は、データフレームの長さを意味する)。入力されたパラメータ1~パラメータnを計算することによって、評価すべきサンプルの主観真理値に近似する第1の近似値を取得することができる。
幾つかの態様では、該評価すべきサンプルのパラメータに基づいて、ステップS120の前に、該方法100は、以下のステップをさらに含んでもよい。
該k個の訓練サンプルのパラメータに基づいて、該第1のモデルを用いて該k個の訓練サンプルの近似値を計算する。該第2のモデルを用いて取得された該k個の訓練サンプルの近似値及び第1のモデルを用いて算出された該k個の訓練サンプルの近似値に基づいて、該第1のモデルを評価する。該k個の訓練サンプルのうちのそれぞれの訓練サンプルについて、該第1のモデルを用いて算出された近似値と該第2のモデルを用いて取得された近似値との差が第1の所定の閾値以下である場合、該第1のモデルの評価結果が正であると決定し、そうでない場合、該第1のモデルの評価結果が負であると決定する。例えば、k個の訓練サンプルのうちの任意の1つの訓練サンプルについて、該第1のモデルを用いて算出された近似値と第2のモデルを用いて取得された近似値との差が第1の所定の閾値よりも大きい場合、該第1のモデルの評価結果が負であると決定する。
簡単に言えば、第2のモデルの取得された近似値を用いて第1のモデルの性能又は正確度を評価してもよい。
幾つかの態様では、評価すべきサンプルのパラメータに基づいて、ステップS120の前に、該方法100は、以下のステップをさらに含んでもよい。
該k個の訓練サンプルの主観真理値及び該第1のモデルを用いて算出された該k個の訓練サンプルの近似値に基づいて、該第1のモデルを評価する。該k個の訓練サンプルのうちのそれぞれの訓練サンプルについて、該第1のモデルを用いて算出された近似値と主観真理値との差が第2の所定の閾値以下である場合、該第1のモデルの評価結果が正であると決定し、そうでない場合、該第1のモデルの評価結果が負であると決定する。例えば、該k個の訓練サンプルのうちの任意の1つの訓練サンプルについて、第1のモデルを用いて算出された近似値と主観真理値との差が第2の所定の閾値よりも大きい場合、該第1のモデルの評価結果が負であると決定する。
簡単に言うと、主観真理値を用いて第1のモデルの性能又は正確度を評価してもよい。
図5は、本発明の実施例に係る第1のモデルの訓練原理及び評価原理の概略的なブロック図である。
図5に示すように、第1のモデルのフィッティングプロセスは、図5の破線矢印で示す部分のように、復号されたシーケンスセット内の画像フレームの主観真理値Aを主観的な採点方式で取得して、取得された主観真理値Aを第2のモデルを訓練するための訓練セットとすると共に、第2のモデル及び入力すべきパラメータセットに基づいて第1のモデルを取得する。第1のモデルの最適化プロセスは、実線矢印で示す部分のように、第2のモデルにより出力された主観真理値の近似値B及び第1のモデルにより出力された主観真理値の近似値Cに基づいて第1のモデルを評価してもよいし、主観真理値A及び第1のモデルにより出力された主観真理値の近似値Cに基づいて第1のモデルを評価してもよい。
第2のモデルの訓練プロセスは、以下のステップを含んでもよい。
(1)復号されたシーケンスセットを取得する。
クラウドゲームは種類が多いため、複雑度も異なり、主観的な感覚も異なる。本発明は、1つのシナリオについて第2のモデルにおける1つの第2のサブモデル及び第1のモデルにおける第1のサブモデルを訓練することができるように、クラウドゲームビデオに対してシナリオ分類を行ってもよい。なお、1つのシナリオにおける1つのゲームシーンについて第2のモデルにおける1つの第2のサブモデル及び第1のモデルにおける1つの第1のサブモデルを訓練することができるように、シナリオ分類されたクラウドゲームビデオをゲームシーンに基づいて再分割してもよい。本発明の実施例は、シナリオ及びゲームシーンの具体的な分類に限定されない。例えば、シナリオは、評価すべきビデオ又は評価すべき画像を再生するための装置のタイプであってもよい。ゲームシーンは、戦闘シーンや非戦闘シーンなどのゲーム画面のシーンであってもよい。クラウドゲームビデオに対してゲーム分類を行い、分類されたある種類のビデオ(例えば、取得されたソースシーケンスセット)に対して、該ある種類のビデオを符号化構成スキーム(クラウドゲームの特徴のフレームレート、コードレート、解像度などに適応する)によって符号化して圧縮し、符号化されて圧縮されたシーケンスセットを取得してもよい。符号化圧縮シーケンスセットは、取り込まれたソースシーケンスセットに対して損失のある圧縮を行うため、ビデオ画像品質の細部の損失をもたらす。その後、符号化されて圧縮されたシーケンスセットを復号し、復号されたシーケンスセットを取得する。好ましくは、復号されたシーケンスセットは、上記のk個の訓練サンプルであってもよい。
(2)復号されたシーケンスセット内の画像フレームの主観真理値Aを主観的な採点方式で取得する。
クラウドゲームのシナリオは、リアルタイムコミュニケーションの主観的なビデオのシナリオとは異なるため、例えばクラウドゲームのシナリオは、携帯電話のモバイル端末側、固定PC及びテレビのテレビ端末側に関する可能性がある。また、プレイヤの体験に対する要求も、リアルタイム通信のユーザの体験に対する要求とは異なる。本発明では、クラウドゲームビデオの主観評価の標準体系を用いて、復号化されたシーケンスセット内の画像フレームの主観真理値Aを主観的な採点方式で取得してもよい。例えば、符号化及び圧縮されたシーケンスセットは、第三者による復号化により再生され、クラウドゲームビデオの主観評価の標準的な体系に従って、復号化されたシーケンスセット内の画像フレームの主観的な真理値Aを主観的な採点方式に従って手動で(即ち、評価者により)取得する。
(3)復号化されたシーケンスセット内の画像フレームの主観真理値Aに基づいて第2のモデルを訓練する。
符号化された圧縮されたシーケンスセットについて第三者による復号化により復号されたシーケンスセットを作成し、該復号されたシーケンスセットを第2のモデルの訓練セットとして第2のモデルを訓練し、訓練された第2のモデルを使用して、復号化されたシーケンスセット内の画像フレームの主観的な真理値の近似値B(可能な限り主観真理値Aに近似するもの)を取得してもよい。本発明は、第2のモデルの性能複雑度に対して基本的に要求せず、正確性が比較的に高いことのみを要求し、即ち、該第2のモデルは、非常に複雑であり、かつ正確性が非常に高いモデルであってもよい。
(4)該第2のモデルに基づいて該第1のモデルを取得する。
訓練された第2のモデルを用いて、復号化されたシーケンスセット内の画像フレームの主観真理値の近似値Bを取得した後、第1のモデルを取得するために、復号化されたシーケンスセット内の画像フレームの主観真理値の近似値Bと、復号化されたシーケンスセット内の画像フレームのパラメータとに基づいて、フィッティング計算を行ってもよい。フィッティングとは、平面上の一連の点を滑らかな曲線で連結することである。連結された曲線には無数の可能性があるため、様々なフィッティング方法がある。フィッティングされた曲線は、一般に関数で表すことができ、異なる関数に応じて異なるフィッティング名を持つ。一般的なフィッティング方法としては、最小二乗曲線フィッティング法などがある。決定すべき関数が線形である場合、線形フィッティング又は線形回帰(主に統計で)と称され、そうでない場合、非線形フィッティング又は非線形回帰と称される。表現式は、セグメント関数でもあってもよく、この場合にスプラインフィッティングと称される。例えば、本発明に係る第1のモデルは、フィッティングにより得られたモデルであってもよい。この第1のモデルの予測結果は、主観真理値に近似する近似値であってもよい。
幾つかの態様では、方法100は、以下のステップをさらに含んでもよい。
第1のモデルの評価結果が正である場合、第1のモデルをサービスシステムに統合し、第1のモデルの評価結果が負である場合、第1のモデルの評価結果が正になるまで、第1のモデルを再度フィッティングする。
言い換えれば、第1のモデルが所望の評価結果に達した場合、第1のモデルをサービスシステムに統合してもよく、第1のモデルが所望の結果に達していない場合、第1のモデルが所望の結果に達するまで第1のモデルを再度フィッティングする必要がある。
幾つかの態様では、方法100は、以下のステップをさらに含んでもよい。
統計モジュールにより第1の近似値を第2のモデルに報告する。第2のモデルを用いて評価すべきサンプルの第2の近似値を取得する。第1の近似値と第2の近似値との差が第3の所定の閾値よりも大きい場合、評価すべきサンプルのパラメータ及び第2の近似値を用いて第1のモデルを最適化する。第1の近似値と第2の近似値との差が第3の所定の閾値以下である場合、第1のモデルを最適化する必要がないと決定する。
簡単に言えば、第1の近似値を使用して第1のモデルを最適化し、第1のモデルの正確度を向上させることができる。
幾つかの態様では、第1の近似値及び第2の近似値に基づいて、第1のモデルを最適化するか否かを決定する前に、評価すべきサンプルの主観真理値を取得し、第2の近似値と評価すべきサンプルの主観真理値との差が第4の所定の閾値よりも大きい場合、評価すべきサンプル及び評価すべきサンプルの主観真理値を用いて第2のモデルを最適化する。
簡単に言えば、第1の近似値を用いて第2のモデルを最適化し、第2のモデルの正確度を向上させることができる。
図6は、本発明の実施例に係る第1のモデルの最適化原理の概略的なブロック図である。
図6に示すように、まず、主観真理値に近似する近似値を計算するための第1のモデルを取得し、次に、第1のモデルをクラウドゲームサーバ側のシステムに配置する。これに基づいて、取り込みフレーム(評価すべきサンプル)を取得してから取り込みフレームを符号化し、符号化フレームを取得する。その後、符号化フレームからのパラメータ及びコードストリーム情報を符号化することによって、第1のモデルに入力する必要がある評価すべきサンプルのパラメータを取得し、評価すべきサンプルのパラメータを第1のモデルに入力した後、第1のモデルは評価すべきサンプルのパラメータに基づいて計算を行い、評価すべきサンプルの第1の近似値を取得する。この場合、データ統計モジュールを介してプラットフォーム統計モジュールに第1の近似値をフィードバックして、プラットフォーム統計モジュールが第1の近似値に基づいて第1のモデル又は第2のモデルを最適化するか否かを決定してもよい。
図7は、本発明の実施例に係る第1のモデルを含むサービスシステムの概略的なブロック図である。
図7に示すように、フィッティングされた第1のモデルは、サービスシステム内の符号化/復号モジュールに統合され、サービスシステムを利用してパラメータP1、パラメータP2及びパラメータP3などの入力パラメータを取得することができる。パラメータP1は、ネットワークモジュールのフィードバックパラメータを表し、パラメータP2は、クラウドゲームモジュールの設定パラメータを表し、パラメータP3は、符号化/復号モジュールの計算パラメータを表す。次に、第1のモデルは、パラメータP1、パラメータP2及びパラメータP3に基づいて、評価すべきサンプルの第1の近似値を計算する。1つの可能な態様では、第1の近似値は、データ統計モジュールを介してサービスシステムのプラットフォーム統計モジュールに報告され、プラットフォーム統計モジュールは、第1の近似値に基づいて第2のモデル及び第1のモデルを最適化する必要があるか否かを決定してもよい。例えば、プラットフォーム統計モジュールは、統計的な分類を行い、分類に対応する第1のサブモデル又は第2のサブモデルを最適化する必要があるか否かを決定してもよい。なお、第2のモデルを最適化した後、最適化された第2のモデルに基づいて該第1のモデルを最適化してもよいが、本発明の実施例はこれに具体的に限定されない。第1のモデルを最適化することによって、近似値の正確度を向上させることができる。
幾つかの態様では、第1のモデルは、複数のシナリオのそれぞれに対応する第1のサブモデルを含み、第2のモデルは、複数のシナリオのそれぞれに対応する第2のサブモデルを含み、複数のシナリオは、評価すべきサンプルが所在する第1のシナリオを含む。これに基づいて、上記のステップS120は、第1のシナリオに対応する第1のサブモデルを決定するステップと、評価すべきサンプルのパラメータに基づいて、第1のシナリオに対応する第1のサブモデルを用いて、第1の近似値を計算するステップと、を含んでもよい。
言い換えれば、異なるシナリオにおけるサンプルのパラメータに基づいて、異なる第1のサブモデルにフィッティングすることができ、異なるシナリオにおけるサンプルに基づいて、訓練の方式により異なる第2のサブモデルを取得することができる。これによって、第1のサブモデル及び第2のサブモデルの正確度を向上させることができる。
幾つかの態様では、複数のシナリオは、評価すべきビデオ又は評価すべき画像を再生するための装置のタイプを含む。
なお、本発明の他の代替的な態様では、複数のシーンは、評価すべきビデオ又は評価すべき画像が属するアプリケーションプログラム又は再生モードなどを含んでもよいが、本発明はこれらに具体的に限定されない。
幾つかの態様では、第1のモデルは、半参照モデル又は非参照モデルであり、第2のモデルは、完全参照モデル又は非参照モデルであり、半参照モデルは、圧縮前の画像フレームにおける一部のパラメータ及び圧縮後の画像フレームを参照して得られたモデルであり、非参照モデルは、圧縮後の画像フレームのみを参照して得られたモデルであり、完全参照モデルは、圧縮前の画像フレーム及び圧縮後の画像フレームを参照して得られたモデルである。
なお、この半参照モデルは、符号化前の画像フレームにおける一部のパラメータと符号化後の画像フレームとを参照して得られたモデルを意味してもよく、この非参照モデルは、符号化後の画像フレームのみを参照して得られたモデルを意味してもよく、この完全参照モデルは、符号化前の画像フレームと符号化後の画像フレームとを参照して得られたモデルを意味してもよいが、本発明はこれらに具体的に限定されない。
上述したように、本発明は、ビデオの主観的な品質をリアルタイムに評価することができる、近似値に基づいて画像又はビデオの品質を評価する方法を提供する。好ましくは、クラウドゲームの種類やプラットフォームなどの情報を分類することで、ある分類について、k個の訓練サンプルの主観真理値Aを取得してもよい。次に、オフラインの第2のモデルにより、K個の訓練サンプルの主観真理値Aに近似する近似値Bを取得する(可能な限りAに近似する)。そして、取得された近似値Bを基準真理値として、入力されたk個の訓練サンプルの複数のパラメータを用いて第1のモデルをフィッティングする(主観真理値Aに近似する近似値Cを計算するために使用され、近似値Cを迅速に計算することができる)。これによって、第1のモデルによりオンラインに、クラウドゲームのリアルタイムのビデオの主観真理値に近似する近似値を取得することができる。好ましくは、後続の追加されたゲームについて、第2のモデルを更新することによって、更新された第2のモデルに基づいてオンラインの第1のモデルを最適化することができる。
図8は、本発明の実施例に係る第1のモデルの訓練方法200の概略的なフローチャートである。なお、本発明の実施例に係る技術は、データ処理能力を有する任意の電子機器により実行されてもよい。例えば、該電子機器は、サーバとして実施されてもよい。サーバは、独立した物理サーバであってもよいし、複数の物理サーバにより構成されるサーバクラスタ又は分散型システムであってもよいし、クラウドサービス、クラウドデータベース、クラウドコンピューティング、クラウド関数、クラウドストレージ、ネットワークサービス、クラウド通信、ミドルウェアサービス、ドメインネームサービス、セキュリティサービス、及びビッグデータと人工知能プラットフォームなどの基礎クラウドコンピューティングサービスを提供するクラウドサーバであってもよい。サーバは、有線又は無線の通信方式により直接又は間接的に接続されてもよく、本発明はこれらに限定されない。
図8に示すように、方法200は、以下のステップを含んでもよい。
ステップS210:k個の訓練サンプルを取得する。該k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得される。
ステップS220:該k個の訓練サンプル及び該k個の訓練サンプルの主観真理値を訓練セットとして、第2のモデルを取得する。
ステップS230:該k個の訓練サンプルを入力として、該第2のモデルを用いて該k個の訓練サンプルの主観真理値に近似する近似値を取得する。
ステップS240:該k個の訓練サンプルの近似値を参照として、該k個の訓練サンプルのパラメータをフィッティングして該第1のモデルを取得する。
なお、方法200は、方法100における第1のモデルの評価及び最適化に関連するスキームをさらに含んでもよい。言い換えれば、方法200における第1のモデルの評価及び最適化などに関連するスキームは、方法100における対応するスキームを参照してもよく、重複を避けるために、ここでその説明を省略する。
以上は、添付図面を参照しながら、本発明の好ましい実施形態を詳細に説明したが、本発明は、上記の実施形態の具体的な詳細に限定されるものではなく、本発明の技術的思想の範囲内で、本発明の技術的範囲に属する様々な単純な変形が可能である。例えば、上述した実施形態で説明した個々の具体的な技術的特徴は、矛盾することなく、任意の適切な方法で組み合わせることができ、不必要な重複を避けるために、本明細書では、様々な可能な組み合わせ方法については、これ以上説明しない。別の例として、本発明の様々な異なる実施形態の間で任意の組合せが可能であり、本発明の思想に反しない限り、本発明によって開示されたものと同様にみなされる。
なお、本明細書の様々な方法の実施形態において、上述したプロセスのシーケンス番号の大きさは、実行順序の順序を意味するものではなく、各プロセスの実行順序は、その機能及び内在する論理によって決定されるべきであり、本明細書の実施形態の実施プロセスを限定するものではない。また、本発明の実施形態において、「及び/又は」という用語は、係り先を記述する係り受け関係のみであり、3種類の関係が存在し得ることを意味する。具体的に、「A及び/又はB」は、Aのみが存在すること、AとB両方が存在すること、Bのみが存在することという3つの場合を表すことができる。なお、本明細書では、記号「/」は、一般に前後の係り先が「又は」の関係であることを意味する。
以上は本発明の実施例に係る方法を説明したが、以下は本発明の実施例に係る装置を説明する。
図9は、本発明の実施例に係る近似値に基づいて画像又はビデオの品質を評価する装置300の概略的なブロック図である。
取得部310は、評価すべきビデオ又は評価すべき画像を含む評価すべきサンプルを取得する。
計算部320は、評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて評価すべきサンプルの主観真理値に近似する第1の近似値を計算する。
ここで、第1のモデルは、オフラインの第2のモデルに基づいて得られたモデルであり、第2のモデルは、k個の訓練サンプル及びk個の訓練サンプルの主観真理値を訓練セットとして得られたモデルであり、k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得され、第1のモデルは、第2のモデルを用いて取得されたk個の訓練サンプルの近似値を参照として、k個の訓練サンプルのパラメータをフィッティングして得られたモデルであり、kは正の整数である。
評価部330は、第1の近似値に基づいて、評価すべきビデオ又は評価すべき画像の品質を評価する。
幾つかの態様では、評価すべきサンプルのパラメータは、ネットワークモジュールのフィードバックパラメータ、クラウドゲームモジュールの設定パラメータ、及び符号化/復号モジュールの計算パラメータのうちの少なくとも1つを含む。
幾つかの態様では、計算部320が評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて評価すべきサンプルの主観真理値に近似する第1の近似値を計算する前に、評価部330は、k個の訓練サンプルのパラメータに基づいて、第1のモデルを用いてk個の訓練サンプルの近似値を計算し、第2のモデルを用いて取得されたk個の訓練サンプルの近似値及び第1のモデルを用いて算出されたk個の訓練サンプルの近似値に基づいて、第1のモデルを評価し、k個の訓練サンプルのうちのそれぞれの訓練サンプルについて、第1のモデルを用いて算出された近似値と第2のモデルを用いて取得された近似値との差が第1の所定の閾値以下である場合、第1のモデルの評価結果が正であると決定し、そうでない場合、第1のモデルの評価結果が負であると決定する。
幾つかの態様では、計算部320が評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて評価すべきサンプルの主観真理値に近似する第1の近似値を計算する前に、評価部330は、k個の訓練サンプルの主観真理値及び第1のモデルを用いて算出されたk個の訓練サンプルの近似値に基づいて、第1のモデルを評価し、k個の訓練サンプルのうちのそれぞれの訓練サンプルについて、第1のモデルを用いて算出された近似値と主観真理値との差が第2の所定の閾値以下である場合、第1のモデルの評価結果が正であると決定し、そうでない場合、第1のモデルの評価結果が負であると決定する。
幾つかの態様では、評価部330は、第1のモデルの評価結果が正である場合、第1のモデルをサービスシステムに統合し、第1のモデルの評価結果が負である場合、第1のモデルの評価結果が正になるまで、第1のモデルを再度フィッティングする。
幾つかの態様では、評価部330は、統計モジュールにより第1の近似値を第2のモデルに報告し、第2のモデルを用いて評価すべきサンプルの第2の近似値を取得し、第1の近似値と第2の近似値との差が第3の所定の閾値よりも大きい場合、評価すべきサンプルのパラメータ及び第2の近似値を用いて第1のモデルを最適化し、第1の近似値と第2の近似値との差が第3の所定の閾値以下である場合、第1のモデルを最適化する必要がないと決定する。
幾つかの態様では、評価部330が第1の近似値及び前記第2の近似値に基づいて第1のモデルを最適化するか否かを決定する前に、評価部330は、評価すべきサンプルの主観真理値を取得し、第2の近似値と評価すべきサンプルの主観真理値との差が第4の所定の閾値よりも大きい場合、評価すべきサンプル及び評価すべきサンプルの主観真理値を用いて第2のモデルを最適化する。
幾つかの態様では、第1のモデルは、複数のシナリオのそれぞれに対応する第1のサブモデルを含み、複数のシナリオは、評価すべきサンプルが所在する第1のシナリオを含む。計算部320は、第1のシナリオに対応する第1のサブモデルを決定し、評価すべきサンプルのパラメータに基づいて、第1のシナリオに対応する第1のサブモデルを用いて、第1の近似値を計算する。
幾つかの態様では、複数のシナリオは、評価すべきビデオ又は評価すべき画像を再生するための装置のタイプを含む。
幾つかの態様では、第1のモデルは、半参照モデル又は非参照モデルであり、第2のモデルは、完全参照モデル又は非参照モデルであり、半参照モデルは、圧縮前の画像フレームにおける一部のパラメータ及び圧縮後の画像フレームを参照して得られたモデルであり、非参照モデルは、圧縮後の画像フレームのみを参照して得られたモデルであり、完全参照モデルは、圧縮前の画像フレーム及び圧縮後の画像フレームを参照して得られたモデルである。
図10は、本発明の実施例に係る第1のモデルの訓練装置400の概略的なブロック図である。
図10に示すように、装置400は、以下の各部を含んでもよい。
第1の取得部410は、k個の訓練サンプルを取得する。該k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得される。
第1の訓練部420は、k個の訓練サンプル及びk個の訓練サンプルの主観真理値を訓練セットとして、第2のモデルを取得する。
第2の取得部430は、k個の訓練サンプルを入力として、第2のモデルを用いてk個の訓練サンプルの主観真理値に近似する近似値を取得する。
第2の訓練部440は、k個の訓練サンプルの近似値を参照として、k個の訓練サンプルのパラメータをフィッティングして第1のモデルを取得する。
なお、装置の実施例と方法の実施例は互いに対応することができ、同様の説明は方法の実施例を参照することができる。重複を避けるため、ここではその説明を省略する。具体的には、装置300は、本発明の実施例の方法100を実行する主体に対応することができ、装置300の各ユニットは、それぞれ、方法100の対応するフローを実現するために、同様に、装置400は、本発明の実施例の方法200を実行する対応する主体に対応することができ、装置400のユニットは、方法200のフローを実現するために使用することができる。簡潔化のために本明細書ではその説明を省略する。
なお、本発明の実施形態に係るビデオ処理装置の各ユニットは、それぞれ、又は、全てが1つ又は複数の追加のユニットに統合されて構成されてもよく、或いは、これらのユニットのうちの1つが、機能的により小さな複数のユニットに再分割されて構成されてもよく、これは、本発明の実施例の技術的効果の実現に影響を及ぼすことなく、同様の動作を実現することができる。上記のユニットは論理的な機能に基づいて分割されており、実用上は、1つのユニットの機能を複数のユニットで実現してもよいし、複数のユニットの機能を1つのユニットで実現してもよい。本発明の他の実施形態では、装置300又は装置400は、他のユニットを備えていてもよく、実際には、これらの機能は、他のユニットによって支援されてもよく、複数のユニットによって協働して実現されてもよい。本発明の別の実施形態によれば、本発明の実施例に係る装置300又は装置400は、中央処理装置(CPU)、ランダムアクセス記憶媒体(RAM)、読み取り専用記憶媒体(ROM)などの処理要素及び記憶要素を含む汎用コンピュータを含む汎用コンピュータ機器で、それぞれの方法に係るステップを実行可能なコンピュータプログラム(プログラムコードを含める)を実行することによって構築され、近似値に基づいて画像ビデオ品質を評価する本発明の実施例に係る方法又は第1のモデルの訓練方法を実施することができる。コンピュータプログラムは、例えば、コンピュータ読み取り可能な記憶媒体に記録され、コンピュータ読み取り可能な記憶媒体を介して電子機器にロードされ、そこで実行されることによって、本発明の実施例の対応する方法を実施することができる。
言い換えれば、上述したユニットは、ハードウェアで実装されてもよいし、ソフトウェアで実装された命令で実装されてもよいし、ソフトウェアとハードウェアの組み合わせで実装されてもよい。特に、本発明の実施例における方法の態様のステップは、プロセッサ内のハードウェアの統合された論理回路及び/又はソフトウェアの形態の命令によって実行されてもよく、本発明の実施例に関連して開示される方法のステップは、ハードウェアコーディング処理装置によって実行され、或いはコーディング処理装置内のハードウェア及びソフトウェアの組み合わせによって実行されるかの何れかとして直接具現化されてもよい。好ましくは、ソフトウェアは、ランダムアクセスメモリ、フラッシュメモリ、読み取り専用メモリ、プログラマブル読み取り専用メモリ、電気的に書き換え可能なプログラマブルメモリ、レジスタなどの当該技術分野の成熟した記憶媒体中に存在してもよい。該記憶媒体はメモリに位置し、プロセッサはメモリ中の情報を読み取り、そのハードウェアと結合して該方法の実施例のステップを完成する。
図11は、本発明の実施例に係る電子機器500の概略的なブロック図である。
図11に示すように、電子機器500は、少なくとも、プロセッサ510と、コンピュータ読み取り可能な記憶媒体520とを含む。プロセッサ510及びコンピュータ読み取り可能な記憶媒体520は、バス又は他の手段によって接続されてもよい。コンピュータ読み取り可能な記憶媒体520は、コンピュータ命令を含むコンピュータプログラム521を記憶するために使用され、プロセッサ510は、コンピュータ読み取り可能な記憶媒体520に記憶されたコンピュータ命令を実行する。プロセッサ510は、電子機器500の計算コア及び制御コアであり、1つ又は複数のコンピュータ命令を実行することができ、具体的には、対応する方法プロセス又は対応する機能を実現するように、1つ又は複数のコンピュータ命令をロードして実行することができる。
一例として、プロセッサ510は、中央処理装置(CentralProcessingUnit:CPU)と称されてもよい。プロセッサ510は、汎用プロセッサ、デジタル信号プロセッサ(Digital Signal Processor:DSP)、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、フィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA)又は他のプログラマブル論理デバイス、個別ゲート又はトランジスタ論理デバイス、個別ハードウェア構成要素などを含むことができるが、これらに限定されない。
一例として、コンピュータ読み取り可能な記憶媒体520は、高速RAMメモリであってもよく、又は少なくとも1つの磁気ディスクメモリのような非不安定なメモリ(Non-VolatileMemory)であってもよい。好ましくは、プロセッサ510から離れて位置する少なくとも1つのコンピュータ読み取り可能な記憶媒体であってもよい。具体的には、コンピュータ読み取り可能な記憶媒体520は、揮発性メモリ及び/又は不揮発性メモリを含むが、これらに限定されない。ここで、不揮発性メモリは、読み出し専用メモリ(Read-Only Memory:ROM)、プログラマブル読み出し専用メモリ(Programmable ROM:PROM)、消去可能プログラマブル読み出し専用メモリ(Erasable PROM:EPROM)、電気的消去可能プログラマブル読み出し専用メモリ(Electrically EPROM:EEPROM)、又はフラッシュメモリであってもよい。揮発性メモリは、外部キャッシュとして機能するランダムアクセスメモリ(Random Access Memory:RAM)であってもよい。限定するものではないが、一例として、スタティックランダムアクセスメモリ(Static RAM:SRAM)、ダイナミックランダムアクセスメモリ(Dynamic RAM:DRAM)、同期ダイナミックランダムアクセスメモリ(Synchronous DRAM:SDRAM)、ダブルデータレート同期ダイナミックランダムアクセスメモリ(Double Data Rate SDRAM:DDR SDRAM)、拡張同期ダイナミックランダムアクセスメモリ(Enhanced SDRAM:ESDRAM)、同期接続型ダイナミックランダムアクセスメモリ(synch link DRAM:SLDRAM)、及びダイレクトメモリバスランダムアクセスメモリ(Direct Rambus RAM:DR RAM)などの多くの形式のRAMが利用可能である。
1つの実施形態では、電子機器500は、図9に示す近似値に基づいて画像又はビデオの品質を評価する装置300であってもよい。このコンピュータ読み取り可能な記憶媒体520には、コンピュータ命令が記憶されている。図3に示す方法の実施例における対応するステップを実行するために、コンピュータ読み取り可能な記憶媒体520に格納されたコンピュータ命令がプロセッサ510によってロードされて実行される。具体的な実施形態では、コンピュータ読み取り可能な記憶媒体520内のコンピュータ命令は、プロセッサ510によってロードされ、対応するステップを実行するが、重複を避けるために、ここでその説明を省略する。
1つの実施形態では、電子機器500は、図10に示す第1のモデルの訓練装置400であってもよい。このコンピュータ読み取り可能な記憶媒体520には、コンピュータ命令が記憶されている。図8に示す方法の実施例における対応するステップを実行するために、コンピュータ読み取り可能な記憶媒体520に格納されたコンピュータ命令がプロセッサ510によってロードされて実行される。具体的な実施形態では、コンピュータ読み取り可能な記憶媒体520内のコンピュータ命令は、プロセッサ510によってロードされ、対応するステップを実行するが、重複を避けるために、ここでその説明を省略する。
本発明の別の実施形態では、本発明の実施例はまた、プログラム及びデータを格納するための電子機器500内の記憶装置であるコンピュータ読み取り可能な記憶媒体(Memory)を提供する。例えば、コンピュータ読み取り可能な記憶媒体520が挙げられる。なお、本明細書のコンピュータ読み取り可能な記憶媒体520は、電子機器500内の内蔵の記憶媒体を含んでもよいが、電子機器500によってサポートされる拡張記憶媒体も含んでもよい。コンピュータ読み取り可能な記憶媒体は、電子機器500のオペレーティングシステムを格納する記憶領域を提供する。さらに、記憶空間には、プロセッサ510によってロードされて実行されるように構成された1つ又は複数のコンピュータ命令が格納され、これらのコンピュータ命令は、1つ又は複数のコンピュータプログラム521(プログラムコードを含む)であってもよい。
本発明の別の実施形態では、コンピュータ読み取り可能な記憶媒体に記憶されるコンピュータ命令を含むコンピュータプログラム製品又はコンピュータプログラムが提供される。例えば、コンピュータプログラム521が挙げられる。この場合、電子機器500は、プロセッサ510がコンピュータ読み取り可能な記憶媒体520からコンピュータ命令を読み取り、プロセッサ510がコンピュータ命令を実行して、上述の様々な好ましい態様に係る近似値に基づいて画像又はビデオの品質を評価する方法又は第1のモデルの訓練方法をコンピュータに実行させてもよい。
言い換えれば、ソフトウェアを使用して実装される場合、コンピュータプログラム製品の形で全体的又は部分的に実装することができる。該コンピュータプログラム製品は1つ又は複数のコンピュータ命令を含む。コンピュータでコンピュータプログラム命令がロードされ実行されると、本発明の実施例のプロセスが全体的又は部分的に実行され、又は本発明の実施例の機能が実現される。コンピュータは、汎用コンピュータ、専用コンピュータ、コンピュータネットワーク、又は他のプログラム可能な装置であってもよい。コンピュータ命令は、コンピュータ読み取り可能な記憶媒体に記憶されてもよく、又は、1つのコンピュータ読み取り可能な記憶媒体から別のコンピュータ読み取り可能な記憶媒体に転送されてもよく、例えば、コンピュータ命令は、1つのウェブサイト、コンピュータ、サーバ、又はデータセンタから、有線(同軸ケーブル、光ファイバ、デジタル加入者線など(digital subscriber line:DSL))又は無線(例えば赤外線、無線、マイクロ波など)を介して、別のウェブサイト、コンピュータ、サーバ、又はデータセンタに転送されてもよい。
当業者であれば、本明細書に開示された実施形態に関連して説明された様々な例の要素及びプロセスのステップは、電子ハードウェア、又はコンピュータソフトウェア及び電子ハードウェアの組み合わせで実装され得ることを認識するであろう。これらの機能がハードウェアで実行されるかソフトウェアで実行されるかは、特定のアプリケーションや設計上の制約によって異なる。当業者は、記載された機能を実現するために、特定のアプリケーションごとに異なる方法を使用することができるが、そのような実現は、本発明の範囲を超えるものとみなされるべきではない。
最後に、上記は、本発明の特定の実施形態のみであるが、本発明の範囲はこれに限定されるものではなく、当業者であれば、本発明によって開示された技術的範囲内で容易に変更又は置換を思いつくことができる限り、本発明の範囲内に含まれることが意図される。従って、本発明の保護範囲は、特許請求の範囲の保護範囲に従うものとする。

Claims (16)

  1. データ処理能力を有する電子機器が実行する、近似値に基づいて画像又はビデオの品質を評価する方法であって、
    評価すべきビデオ又は評価すべき画像を含む評価すべきサンプルを取得するステップと、
    前記評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて前記評価すべきサンプルの主観真理値に近似する第1の近似値を計算するステップであって、前記第1のモデルは、オフラインの第2のモデルに基づいて得られたモデルであり、前記第2のモデルは、k個の訓練サンプル及び前記k個の訓練サンプルの主観真理値を訓練セットとして得られたモデルであり、前記k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得され、前記第1のモデルは、前記第2のモデルを用いて取得された前記k個の訓練サンプルの近似値を参照として、前記k個の訓練サンプルのパラメータをフィッティングして得られたモデルであり、kは正の整数である、ステップと、
    前記第1の近似値に基づいて、前記評価すべきビデオ又は前記評価すべき画像の品質を評価するステップと、を含む、方法。
  2. 前記評価すべきサンプルのパラメータは、ネットワークモジュールのフィードバックパラメータ、クラウドゲームモジュールの設定パラメータ、及び符号化/復号モジュールの計算パラメータのうちの少なくとも1つを含む、請求項1に記載の方法。
  3. 前記評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて前記評価すべきサンプルの主観真理値に近似する第1の近似値を計算する前に、
    前記k個の訓練サンプルのパラメータに基づいて、前記第1のモデルを用いて前記k個の訓練サンプルの近似値を計算するステップと、
    前記第2のモデルを用いて取得された前記k個の訓練サンプルの近似値及び第1のモデルを用いて算出された前記k個の訓練サンプルの近似値に基づいて、前記第1のモデルを評価するステップと、
    前記k個の訓練サンプルのうちのそれぞれの訓練サンプルについて、前記第1のモデルを用いて算出された近似値と前記第2のモデルを用いて取得された近似値との差が第1の所定の閾値以下である場合、前記第1のモデルの評価結果が正であると決定し、そうでない場合、前記第1のモデルの評価結果が負であると決定するステップと、をさらに含む、請求項1に記載の方法。
  4. 前記評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて前記評価すべきサンプルの主観真理値に近似する第1の近似値を計算する前に、
    前記k個の訓練サンプルの主観真理値及び前記第1のモデルを用いて算出された前記k個の訓練サンプルの近似値に基づいて、前記第1のモデルを評価するステップと、
    前記k個の訓練サンプルのうちのそれぞれの訓練サンプルについて、前記第1のモデルを用いて算出された近似値と主観真理値との差が第2の所定の閾値以下である場合、前記第1のモデルの評価結果が正であると決定し、そうでない場合、前記第1のモデルの評価結果が負であると決定するステップと、をさらに含む、請求項1に記載の方法。
  5. 前記第1のモデルの評価結果が正である場合、前記第1のモデルをサービスシステムに統合し、前記第1のモデルの評価結果が負である場合、前記第1のモデルの評価結果が正になるまで、前記第1のモデルを再度フィッティングするステップ、をさらに含む、請求項3又は4に記載の方法。
  6. 統計モジュールにより前記第1の近似値を前記第2のモデルに報告するステップと、
    前記第2のモデルを用いて前記評価すべきサンプルの第2の近似値を取得するステップと、
    前記第1の近似値と前記第2の近似値との差が第3の所定の閾値よりも大きい場合、前記評価すべきサンプルのパラメータ及び前記第2の近似値を用いて前記第1のモデルを最適化するステップと、
    前記第1の近似値と前記第2の近似値との差が前記第3の所定の閾値以下である場合、前記第1のモデルを最適化する必要がないと決定するステップと、をさらに含む、請求項1に記載の方法。
  7. 前記第1の近似値と前記第2の近似値との差が第3の所定の閾値よりも大きい場合、前記評価すべきサンプルのパラメータ及び前記第2の近似値を用いて前記第1のモデルを最適化する前に、
    前記評価すべきサンプルの主観真理値を取得するステップと、
    前記第2の近似値と前記評価すべきサンプルの主観真理値との差が第4の所定の閾値よりも大きい場合、前記評価すべきサンプル及び前記評価すべきサンプルの主観真理値を用いて前記第2のモデルを最適化するステップと、をさらに含む、請求項6に記載の方法。
  8. 前記第1のモデルは、複数のシナリオのそれぞれに対応する第1のサブモデルを含み、前記複数のシナリオは、前記評価すべきサンプルが所在する第1のシナリオを含み、
    前記評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて前記評価すべきサンプルの主観真理値に近似する第1の近似値を計算するステップは、
    前記第1のシナリオに対応する第1のサブモデルを決定するステップと、
    前記評価すべきサンプルのパラメータに基づいて、前記第1のシナリオに対応する第1のサブモデルを用いて、前記第1の近似値を計算するステップと、を含む、請求項1に記載の方法。
  9. 前記複数のシナリオは、前記評価すべきビデオ又は前記評価すべき画像を再生するための装置のタイプを含む、請求項8に記載の方法。
  10. 前記第1のモデルは、半参照モデル又は非参照モデルであり、
    前記第2のモデルは、完全参照モデル又は非参照モデルであり、
    前記半参照モデルは、圧縮前の画像フレームにおける一部のパラメータ及び圧縮後の画像フレームを参照して得られたモデルであり、
    前記非参照モデルは、圧縮後の画像フレームのみを参照して得られたモデルであり、
    前記完全参照モデルは、圧縮前の画像フレーム及び圧縮後の画像フレームを参照して得られたモデルである、請求項1乃至9の何れかに記載の方法。
  11. データ処理能力を有する電子機器に配備される、近似値に基づいて画像又はビデオの品質を評価する装置であって、
    評価すべきビデオ又は評価すべき画像を含む評価すべきサンプルを取得する取得部と、
    前記評価すべきサンプルのパラメータに基づいて、オンラインの第1のモデルを用いて前記評価すべきサンプルの主観真理値に近似する第1の近似値を計算する計算部であって、前記第1のモデルは、オフラインの第2のモデルに基づいて得られたモデルであり、前記第2のモデルは、k個の訓練サンプル及び前記k個の訓練サンプルの主観真理値を訓練セットとして得られたモデルであり、前記k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得され、前記第1のモデルは、前記第2のモデルを用いて取得された前記k個の訓練サンプルの近似値を参照として、前記k個の訓練サンプルのパラメータをフィッティングして得られたモデルであり、kは正の整数である、計算部と、
    前記第1の近似値に基づいて、前記評価すべきビデオ又は前記評価すべき画像の品質を評価する評価部と、を含む、装置。
  12. データ処理能力を有する電子機器が実行する、第1のモデルの訓練方法であって、
    k個の訓練サンプルを取得するステップであって、前記k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得される、ステップと、
    前記k個の訓練サンプル及び前記k個の訓練サンプルの主観真理値を訓練セットとして、第2のモデルを取得するステップと、
    前記k個の訓練サンプルを入力として、前記第2のモデルを用いて前記k個の訓練サンプルの主観真理値に近似する近似値を取得するステップと、
    前記k個の訓練サンプルの近似値を参照として、前記k個の訓練サンプルのパラメータをフィッティングして前記第1のモデルを取得するステップと、を含む、方法。
  13. データ処理能力を有する電子機器に配備される、第1のモデルの訓練装置であって、
    k個の訓練サンプルを取得する第1の取得部であって、前記k個の訓練サンプルの主観真理値は、主観的な採点の方式で取得される、第1の取得部と、
    前記k個の訓練サンプル及び前記k個の訓練サンプルの主観真理値を訓練セットとして、第2のモデルを取得する第1の訓練部と、
    前記k個の訓練サンプルを入力として、前記第2のモデルを用いて前記k個の訓練サンプルの主観真理値に近似する近似値を取得する第2の取得部と、
    前記k個の訓練サンプルの近似値を参照として、前記k個の訓練サンプルのパラメータをフィッティングして前記第1のモデルを取得する第2の訓練部と、を含む、装置。
  14. コンピュータプログラムを実行可能なプロセッサと、
    コンピュータプログラムが記憶されたコンピュータ読み取り可能な記憶媒体と、を含み、
    前記コンピュータプログラムは、前記プロセッサにより実行される際に、請求項1乃至10の何れかに記載の近似値に基づいて画像又はビデオの品質を評価する方法又は請求項12に記載の第1のモデルの訓練方法を実現する、電子機器。
  15. コンピュータプログラムを記憶するためのコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラムは、請求項1乃至10の何れかに記載の近似値に基づいて画像又はビデオの品質を評価する方法又は請求項12に記載の第1のモデルの訓練方法をコンピュータに実行させる、記憶媒体。
  16. 請求項1乃至10の何れかに記載の近似値に基づいて画像又はビデオの品質を評価する方法又は請求項12に記載の第1のモデルの訓練方法をコンピュータに実行させるためのコンピュータプログラム。
JP2023558311A 2021-04-13 2022-03-11 近似値に基づいて画像又はビデオの品質を評価する方法及び装置、第1のモデルの訓練方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム Pending JP2024511103A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202110395015.2A CN115205188A (zh) 2021-04-13 2021-04-13 基于逼近值评估图像视频质量的方法和相关装置
CN202110395015.2 2021-04-13
PCT/CN2022/080254 WO2022218072A1 (zh) 2021-04-13 2022-03-11 基于逼近值评估图像视频质量的方法和相关装置

Publications (1)

Publication Number Publication Date
JP2024511103A true JP2024511103A (ja) 2024-03-12

Family

ID=83571687

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023558311A Pending JP2024511103A (ja) 2021-04-13 2022-03-11 近似値に基づいて画像又はビデオの品質を評価する方法及び装置、第1のモデルの訓練方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム

Country Status (4)

Country Link
US (1) US20230072918A1 (ja)
JP (1) JP2024511103A (ja)
CN (1) CN115205188A (ja)
WO (1) WO2022218072A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116506622B (zh) * 2023-06-26 2023-09-08 瀚博半导体(上海)有限公司 模型训练方法及视频编码参数优化方法和装置
CN117591815A (zh) * 2023-10-31 2024-02-23 中国科学院空天信息创新研究院 面向多模态伪造生成数据的综合质量评估方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1763248A1 (en) * 2005-09-13 2007-03-14 Siemens Aktiengesellschaft Computation of subjective video quality
CN104902267B (zh) * 2015-06-08 2017-02-01 浙江科技学院 一种基于梯度信息的无参考图像质量评价方法
CN108665455B (zh) * 2018-05-14 2022-04-26 北京航空航天大学 图像显著性预测结果的评价方法和装置
CN111524110B (zh) * 2020-04-16 2023-06-09 北京微吼时代科技有限公司 视频质量的评价模型构建方法、评价方法及装置
CN111741330B (zh) * 2020-07-17 2024-01-30 腾讯科技(深圳)有限公司 一种视频内容评估方法、装置、存储介质及计算机设备

Also Published As

Publication number Publication date
WO2022218072A1 (zh) 2022-10-20
CN115205188A (zh) 2022-10-18
US20230072918A1 (en) 2023-03-09

Similar Documents

Publication Publication Date Title
KR20210114074A (ko) 멀티미디어 데이터의 캡셔닝 정보를 생성하는 방법, 장치, 디바이스 및 매체
CN110751649B (zh) 视频质量评估方法、装置、电子设备及存储介质
JP2024511103A (ja) 近似値に基づいて画像又はビデオの品質を評価する方法及び装置、第1のモデルの訓練方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
JP7451716B2 (ja) 予測される視覚的品質に基づくビデオプレーヤのための最適なフォーマット選択
US11868738B2 (en) Method and apparatus for generating natural language description information
US20230353828A1 (en) Model-based data processing method and apparatus
CN111352965A (zh) 序列挖掘模型的训练方法、序列数据的处理方法及设备
CN112149642A (zh) 一种文本图像识别方法和装置
CN112668608A (zh) 一种图像识别方法、装置、电子设备及存储介质
CN113657272B (zh) 一种基于缺失数据补全的微视频分类方法及系统
CN113762041A (zh) 视频分类方法、装置、计算机设备和存储介质
CN116261009B (zh) 智能转化影视受众的视频检测方法、装置、设备及介质
CN113822291A (zh) 一种图像处理方法、装置、设备及存储介质
CN113822790A (zh) 一种图像处理方法、装置、设备及计算机可读存储介质
CN113538324A (zh) 评估方法、模型训练方法、装置、介质及电子设备
US11870833B2 (en) Methods and systems for encoder parameter setting optimization
CN116996680B (zh) 一种用于视频数据分类模型训练的方法及装置
CN112439200B (zh) 数据处理方法、装置、存储介质及电子设备
KR20230140276A (ko) 슬라이딩 윈도우 단위 예측 기반의 동영상 인코딩 최적화 방법 및 시스템
KR20230143377A (ko) 장면 단위 예측 기반의 동영상 인코딩 최적화 방법 및 시스템
CN117750014A (zh) 视频编码方法、装置及存储介质
CN116962713A (zh) 一种视频压缩方法、视频解码方法和相关装置
Sundeqvist An Implementation Of A Rate Controller Using A Neural Network
KR20230143429A (ko) 영상 세그먼트 단위의 최적 인코딩 프리셋을 이용한 동영상 인코딩 최적화 방법 및 시스템
CN117151967A (zh) 多媒体信息识别方法、装置及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230922