JP2023509918A - 予測される視覚的品質に基づくビデオプレーヤのための最適なフォーマット選択 - Google Patents
予測される視覚的品質に基づくビデオプレーヤのための最適なフォーマット選択 Download PDFInfo
- Publication number
- JP2023509918A JP2023509918A JP2022540529A JP2022540529A JP2023509918A JP 2023509918 A JP2023509918 A JP 2023509918A JP 2022540529 A JP2022540529 A JP 2022540529A JP 2022540529 A JP2022540529 A JP 2022540529A JP 2023509918 A JP2023509918 A JP 2023509918A
- Authority
- JP
- Japan
- Prior art keywords
- video
- training
- machine learning
- learning model
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000007 visual effect Effects 0.000 title abstract description 7
- 238000012549 training Methods 0.000 claims abstract description 138
- 238000010801 machine learning Methods 0.000 claims abstract description 94
- 238000000034 method Methods 0.000 claims abstract description 82
- 230000002123 temporal effect Effects 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims description 23
- 238000003860 storage Methods 0.000 claims description 23
- 230000003287 optical effect Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 13
- 238000013507 mapping Methods 0.000 claims description 11
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 238000005259 measurement Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 5
- 230000001747 exhibiting effect Effects 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 22
- 238000010200 validation analysis Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 238000013528 artificial neural network Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 238000001303 quality assessment method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/004—Diagnosis, testing or measuring for television systems or their details for digital television systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/002—Diagnosis, testing or measuring for television systems or their details for television cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234309—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/23439—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
- H04N21/2402—Monitoring of the downstream path of the transmission network, e.g. bandwidth available
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/44029—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display for generating different versions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Discrete Mathematics (AREA)
- Databases & Information Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Receiver Circuits (AREA)
- Image Analysis (AREA)
Abstract
Description
102A~102N クライアントマシン
104 ネットワーク
105 メディアビューア
110 コンテンツレポジトリ
120~150 サーバマシン
125 アップロードサーバ
131 トレーニングセット生成器
141 トレーニングエンジン
151 品質スコアエンジン
152 フォーマット解析エンジン
160 機械学習モデル、モデル
200 システム
210 トレーニング入力特徴
220 ターゲット出力ラベル
231 トレーニングセット生成器
240 履歴ビデオデータセット、履歴ビデオのセット
242 履歴ビデオ色属性、ビデオ色属性
244 履歴ビデオ空間属性、ビデオ空間属性
246 履歴ビデオ時間属性、ビデオ時間属性
248 ビデオ分類
300 システム
302 トレーニングセット
304 検証セット
306 テストセット
308 モデル
342 履歴ビデオ、履歴画像
344 ビデオ属性
346 ビデオ分類
348 入力ビデオ
400 方法
500 方法
600 方法
700 方法
900 コンピュータシステム
902 処理デバイス
904 揮発性メモリ
906 不揮発性メモリ
908 バス
910 ビデオ表示ユニット
912 英数字入力デバイス
914 カーソル制御デバイス
916 データ記憶デバイス
920 信号生成デバイス
922 ネットワークインターフェースデバイス
924 一時的または非一時的コンピュータ可読記憶媒体、コンピュータ可読記憶媒体
926 命令
Claims (20)
- 方法であって、
機械学習モデルが表示解像度のセットで新しいビデオのトランスコーディングされたバージョンのセットに対する品質スコアを識別するようにトレーニングされるためのトレーニングデータを生成するステップ
を含み、前記トレーニングデータを生成するステップが、
基準ビデオの複数の基準となるトランスコーディングされたバージョンを生成するステップと、
前記基準ビデオの前記複数の基準となるトランスコーディングされたバージョンのフレームに対する品質スコアを取得するステップと、
前記基準ビデオの前記フレームの色属性、空間属性、および時間属性のセットを含む第1のトレーニング入力を生成するステップと、
前記第1のトレーニング入力に対する第1のターゲット出力を生成するステップであって、前記第1のターゲット出力が、前記基準ビデオの前記複数の基準となるトランスコーディングされたバージョンの前記フレームに対する前記品質スコアを含む、生成するステップと、
(i)前記第1のトレーニング入力を含むトレーニング入力のセット、および(ii)前記第1のターゲット出力を含むターゲット出力のセットに対して前記機械学習モデルをトレーニングするために前記トレーニングデータを提供するステップと
を含む、方法。 - 前記品質スコアが、前記フレームのピーク信号対雑音比(PSNR)を含む、請求項1に記載の方法。
- 前記品質スコアが、前記フレームのビデオマルチメソッドアセスメントフュージョン(VMAF)を含む、請求項1に記載の方法。
- 前記色属性が、前記フレームのRGB値またはY値のうちの少なくとも1つを含む、請求項1に記載の方法。
- 前記空間属性が、ガボール特徴フィルタバンクを含む、請求項1に記載の方法。
- 前記時間属性が、オプティカルフローを含む、請求項1に記載の方法。
- 前記機械学習モデルが、前記新しいビデオを処理し、表示解像度の前記セットで前記新しいビデオのトランスコーディングされたバージョンの前記セットに対する品質スコアを示す1つまたは複数の出力を生成するように構成される、請求項1に記載の方法。
- 前記基準ビデオの前記複数のトランスコーディングされたバージョンが、複数の異なるビデオ解像度、トランスコーディング構成、および異なる表示解像度の各々での前記基準ビデオのトランスコーディングを含む、請求項1に記載の方法。
- 装置であって、
ビデオを記憶するためのメモリと、
処理デバイスと
を備え、前記処理デバイスが、
前記ビデオのサンプリングフレームをトレーニングされた機械学習モデルに入力として提供し、
1つまたは複数の出力を前記トレーニングされた機械学習モデルから取得し、
前記1つまたは複数の出力から、第1のビデオフォーマット、第1のトランスコーディング構成、および第1の表示解像度で前記ビデオの知覚品質を示す品質スコアを抽出する
ように前記メモリに動作可能に結合される
装置。 - 前記処理デバイスがさらに、前記品質スコアをクライアントデバイスに提供し、前記品質スコアが、前記クライアントデバイスのメディアビューアにおける前記ビデオのフォーマット選択を通知し、前記第1の表示解像度が、前記クライアントデバイスの表示解像度である、請求項9に記載の装置。
- 前記メディアビューアにおける前記ビデオの前記フォーマット選択が、前記品質スコアと前記1つまたは複数の出力の別の品質スコアとの間の差がしきい値を超えるかどうかに基づき、前記別の品質スコアが、第2のビデオフォーマット、第2のトランスコーディング構成、および前記第1の表示解像度で前記知覚品質を示す、請求項10に記載の装置。
- 前記品質スコアが、ピーク信号対雑音比(PSNR)測定値またはビデオマルチメソッドアセスメントフュージョン(VMAF)測定値のうちの少なくとも1つを含む、請求項9に記載の装置。
- 前記トレーニングされた機械学習モデルが、入力および出力を含む入出力マッピングでトレーニングされ、前記入力が、基準ビデオのフレームの色属性、空間属性、および時間属性のセットに基づき、前記出力が、前記基準ビデオの複数のトランスコーディングされたバージョンのフレームに対する品質スコアに基づく、請求項9に記載の装置。
- 前記色属性が、前記フレームのRGB値またはY値のうちの少なくとも1つを含み、前記空間属性が、前記フレームのガボール特徴フィルタバンクを含み、前記時間属性が、前記フレームのオプティカルフローを含む、請求項13に記載の装置。
- 前記トレーニングされた機械学習モデルからの前記1つまたは複数の出力が、ビデオフォーマット、トランスコーディング構成、および表示解像度の複数の考えられるインデックスタプルに対応する複数の品質スコアを含む、請求項9に記載の装置。
- 実行されたとき、処理デバイスに動作を実行させる命令を記憶した非一時的機械可読記憶媒体であって、前記動作が、
機械学習モデルが表示解像度のセットで新しいビデオのトランスコーディングされたバージョンのセットに対する品質スコアを識別するようにトレーニングされるためのトレーニングデータを生成すること
を含み、前記トレーニングデータを生成することが、
基準ビデオの複数の基準となるトランスコーディングされたバージョンを生成することと、
前記基準ビデオの前記複数の基準となるトランスコーディングされたバージョンのフレームに対する品質スコアを取得することと、
前記基準ビデオの前記フレームの色属性、空間属性、および時間属性のセットを含む第1のトレーニング入力を生成することと、
前記第1のトレーニング入力に対する第1のターゲット出力を生成することであって、前記第1のターゲット出力が、前記基準ビデオの前記複数の基準となるトランスコーディングされたバージョンの前記フレームに対する前記品質スコアを含む、生成することと、
(i)前記第1のトレーニング入力を含むトレーニング入力のセット、および(ii)前記第1のターゲット出力を含むターゲット出力のセットに対して前記機械学習モデルをトレーニングするために前記トレーニングデータを提供することと
を含む、非一時的機械可読記憶媒体。 - 前記品質スコアが、前記フレームのピーク信号対雑音比(PSNR)または前記フレームのビデオマルチメソッドアセスメントフュージョン(VMAF)のうちの少なくとも1つを含む、請求項16に記載の非一時的機械可読記憶媒体。
- 前記色属性が、前記フレームのRGB値またはY値のうちの少なくとも1つを含み、前記空間属性が、ガボール特徴フィルタバンクを含み、前記時間属性が、オプティカルフローを含む、請求項16に記載の非一時的機械可読記憶媒体。
- 前記機械学習モデルが、畳み込みニューラルネットワーク(CNN)トレーニングモデルである、請求項16に記載の非一時的機械可読記憶媒体。
- 前記機械学習モデルが、前記新しいビデオを処理し、表示解像度の前記セットで前記新しいビデオのトランスコーディングされたバージョンの前記セットに対する品質スコアを示す1つまたは複数の出力を生成するように構成される、請求項16に記載の非一時的機械可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024032960A JP2024069300A (ja) | 2019-12-31 | 2024-03-05 | 機械学習を用いた予測される視覚的品質に基づくビデオプレーヤのための最適なフォーマット選択 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2019/069055 WO2021137856A1 (en) | 2019-12-31 | 2019-12-31 | Optimal format selection for video players based on predicted visual quality using machine learning |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024032960A Division JP2024069300A (ja) | 2019-12-31 | 2024-03-05 | 機械学習を用いた予測される視覚的品質に基づくビデオプレーヤのための最適なフォーマット選択 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023509918A true JP2023509918A (ja) | 2023-03-10 |
JP7451716B2 JP7451716B2 (ja) | 2024-03-18 |
Family
ID=69376004
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022540529A Active JP7451716B2 (ja) | 2019-12-31 | 2019-12-31 | 予測される視覚的品質に基づくビデオプレーヤのための最適なフォーマット選択 |
JP2024032960A Pending JP2024069300A (ja) | 2019-12-31 | 2024-03-05 | 機械学習を用いた予測される視覚的品質に基づくビデオプレーヤのための最適なフォーマット選択 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024032960A Pending JP2024069300A (ja) | 2019-12-31 | 2024-03-05 | 機械学習を用いた予測される視覚的品質に基づくビデオプレーヤのための最適なフォーマット選択 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230054130A1 (ja) |
EP (1) | EP3864839A1 (ja) |
JP (2) | JP7451716B2 (ja) |
KR (2) | KR102663852B1 (ja) |
CN (1) | CN114982227A (ja) |
BR (1) | BR112022012563A2 (ja) |
WO (1) | WO2021137856A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210233259A1 (en) * | 2020-01-28 | 2021-07-29 | Ssimwave Inc. | No-reference visual media assessment combining deep neural networks and models of human visual system and video content/distortion analysis |
US11574273B2 (en) * | 2020-12-21 | 2023-02-07 | Sling TV L.L.C. | Systems and methods for automated evaluation of digital services |
CN116264606A (zh) * | 2021-12-14 | 2023-06-16 | 戴尔产品有限公司 | 用于处理视频的方法、设备和计算机程序产品 |
CN115002520B (zh) * | 2022-04-14 | 2024-04-02 | 百果园技术(新加坡)有限公司 | 一种视频流数据处理方法、装置、设备及存储介质 |
US11606553B1 (en) * | 2022-07-15 | 2023-03-14 | RiversideFM, Inc. | Hybrid media recording |
CN115396664A (zh) * | 2022-08-19 | 2022-11-25 | 上海哔哩哔哩科技有限公司 | 视频质量的评价方法、装置、存储介质及计算机系统 |
CN115174919B (zh) * | 2022-09-05 | 2022-11-22 | 腾讯科技(深圳)有限公司 | 一种视频处理方法、装置、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016183011A1 (en) * | 2015-05-11 | 2016-11-17 | Netflix, Inc. | Techniques for predicting perceptual video quality |
US20170109584A1 (en) * | 2015-10-20 | 2017-04-20 | Microsoft Technology Licensing, Llc | Video Highlight Detection with Pairwise Deep Ranking |
WO2019117864A1 (en) * | 2017-12-12 | 2019-06-20 | Google Llc | Transcoding media content using an aggregated quality score |
US20190246112A1 (en) * | 2018-02-07 | 2019-08-08 | Netflix, Inc. | Techniques for predicting perceptual video quality based on complementary perceptual quality models |
US20190258902A1 (en) * | 2018-02-16 | 2019-08-22 | Spirent Communications, Inc. | Training A Non-Reference Video Scoring System With Full Reference Video Scores |
US20190295242A1 (en) * | 2018-03-20 | 2019-09-26 | Netflix, Inc. | Quantifying encoding comparison metric uncertainty via bootstrapping |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8611585B2 (en) * | 2008-04-24 | 2013-12-17 | GM Global Technology Operations LLC | Clear path detection using patch approach |
US10827185B2 (en) * | 2016-04-07 | 2020-11-03 | Netflix, Inc. | Techniques for robustly predicting perceptual video quality |
US20180121733A1 (en) * | 2016-10-27 | 2018-05-03 | Microsoft Technology Licensing, Llc | Reducing computational overhead via predictions of subjective quality of automated image sequence processing |
CN108235001B (zh) * | 2018-01-29 | 2020-07-10 | 上海海洋大学 | 一种基于时空特征的深海视频质量客观评价方法 |
US11483472B2 (en) * | 2021-03-22 | 2022-10-25 | International Business Machines Corporation | Enhancing quality of multimedia |
-
2019
- 2019-12-31 JP JP2022540529A patent/JP7451716B2/ja active Active
- 2019-12-31 EP EP19845753.3A patent/EP3864839A1/en active Pending
- 2019-12-31 KR KR1020227026332A patent/KR102663852B1/ko active IP Right Grant
- 2019-12-31 WO PCT/US2019/069055 patent/WO2021137856A1/en unknown
- 2019-12-31 KR KR1020247014698A patent/KR20240065323A/ko active Search and Examination
- 2019-12-31 US US17/790,102 patent/US20230054130A1/en active Pending
- 2019-12-31 BR BR112022012563A patent/BR112022012563A2/pt unknown
- 2019-12-31 CN CN201980103334.2A patent/CN114982227A/zh active Pending
-
2024
- 2024-03-05 JP JP2024032960A patent/JP2024069300A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016183011A1 (en) * | 2015-05-11 | 2016-11-17 | Netflix, Inc. | Techniques for predicting perceptual video quality |
US20170109584A1 (en) * | 2015-10-20 | 2017-04-20 | Microsoft Technology Licensing, Llc | Video Highlight Detection with Pairwise Deep Ranking |
WO2019117864A1 (en) * | 2017-12-12 | 2019-06-20 | Google Llc | Transcoding media content using an aggregated quality score |
US20190246112A1 (en) * | 2018-02-07 | 2019-08-08 | Netflix, Inc. | Techniques for predicting perceptual video quality based on complementary perceptual quality models |
US20190258902A1 (en) * | 2018-02-16 | 2019-08-22 | Spirent Communications, Inc. | Training A Non-Reference Video Scoring System With Full Reference Video Scores |
US20190295242A1 (en) * | 2018-03-20 | 2019-09-26 | Netflix, Inc. | Quantifying encoding comparison metric uncertainty via bootstrapping |
Also Published As
Publication number | Publication date |
---|---|
KR102663852B1 (ko) | 2024-05-10 |
KR20220123541A (ko) | 2022-09-07 |
CN114982227A (zh) | 2022-08-30 |
EP3864839A1 (en) | 2021-08-18 |
WO2021137856A1 (en) | 2021-07-08 |
BR112022012563A2 (pt) | 2022-09-06 |
JP7451716B2 (ja) | 2024-03-18 |
KR20240065323A (ko) | 2024-05-14 |
JP2024069300A (ja) | 2024-05-21 |
US20230054130A1 (en) | 2023-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7451716B2 (ja) | 予測される視覚的品質に基づくビデオプレーヤのための最適なフォーマット選択 | |
Varga et al. | No-reference video quality assessment via pretrained CNN and LSTM networks | |
CN114359563B (zh) | 模型训练方法、装置、计算机设备和存储介质 | |
Hu et al. | Learning peer recommendation using attention-driven CNN with interaction tripartite graph | |
JP2024511103A (ja) | 近似値に基づいて画像又はビデオの品質を評価する方法及び装置、第1のモデルの訓練方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
CN111125428B (zh) | 基于评分预测函数拟合结构的时间相关电影推荐方法 | |
JP6616008B2 (ja) | ビデオのための相互雑音推定 | |
Xu et al. | Artistic color virtual reality implementation based on similarity image restoration | |
CN117956232A (zh) | 一种视频推荐方法及装置 | |
KR102572415B1 (ko) | 레퍼런스 이미지의 검증을 통해 자연스러운 3차원 디지털 트윈을 생성하기 위한 방법 및 장치 | |
Liborio et al. | Internet Video Delivery Improved by Super-Resolution with GAN | |
Topiwala et al. | Video Quality Analysis: Steps towards Unifying Full and No Reference Cases | |
Wu et al. | DA-ResNet: dual-stream ResNet with attention mechanism for classroom video summary | |
CN113221951B (zh) | 一种基于时域注意力池化网络的动图分类方法及装置 | |
Li et al. | Saliency-enabled coding unit partitioning and quantization control for versatile video coding | |
CN115080856A (zh) | 推荐方法及装置、推荐模型的训练方法及装置 | |
Yang et al. | TV program innovation and teaching under big data background in all media era | |
CN114611565A (zh) | 数据处理方法、装置、设备和存储介质 | |
Zhou et al. | Dynamic foreground detection based on improved Codebook model | |
Kumar et al. | STAR: Efficient SpatioTemporal Modeling for Action Recognition | |
Nie et al. | Multi-receptive field spatiotemporal network for action recognition | |
US11870833B2 (en) | Methods and systems for encoder parameter setting optimization | |
Xiong et al. | SFPANet: Separation and fusion pyramid attention network for crowd counting | |
Zhang et al. | Frame importance and temporal memory effect-based fast video quality assessment for user-generated content | |
US20240338831A1 (en) | Method and apparatus for processing video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220829 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220829 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230919 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240306 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7451716 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |