JP2024505844A - スクリーンコンテンツ処理方法、装置及び機器 - Google Patents
スクリーンコンテンツ処理方法、装置及び機器 Download PDFInfo
- Publication number
- JP2024505844A JP2024505844A JP2023544245A JP2023544245A JP2024505844A JP 2024505844 A JP2024505844 A JP 2024505844A JP 2023544245 A JP2023544245 A JP 2023544245A JP 2023544245 A JP2023544245 A JP 2023544245A JP 2024505844 A JP2024505844 A JP 2024505844A
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- screen content
- target area
- current frame
- hash table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 49
- 238000012545 processing Methods 0.000 claims abstract description 139
- 238000001514 detection method Methods 0.000 claims abstract description 41
- 238000004364 calculation method Methods 0.000 claims abstract description 30
- 238000000034 method Methods 0.000 claims description 76
- 238000004590 computer program Methods 0.000 claims description 36
- 238000004422 calculation algorithm Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 19
- 238000010586 diagram Methods 0.000 abstract description 25
- 238000013461 design Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 238000012360 testing method Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000000835 fiber Substances 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 2
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 2
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 2
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9014—Indexing; Data structures therefor; Storage structures hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/43—Hardware specially adapted for motion estimation or compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
スクリーンコンテンツを複数の領域に分割するステップと、
前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するステップであって、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域であるステップと、
前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするステップと、
前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するステップと、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行い、前記現在のフレームの第1の目標領域のスクリーンコンテンツ処理を完了するステップと、を含む。
スクリーンコンテンツを複数の領域に分割するために用いられる分割モジュールと、
前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するために用いられる判断モジュールであって、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域である判断モジュールと、
前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするために用いられる多重化モジュールと、
前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するために用いられる計算モジュールと、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行い、前記現在のフレームの第1の目標領域のスクリーンコンテンツ処理を完了するために用いられる符号化モジュールと、を含む。
前記メモリにはコンピュータ実行命令が記憶されており、
前記プロセッサが前記メモリに記憶されているコンピュータ実行命令を実行すると、前記少なくとも1つのプロセッサが上記の第1の態様及び第1の態様の様々な可能な設計に記載されているスクリーンコンテンツ処理方法を実行する。
前記現在のフレームの第1の目標領域の画素値と前のフレームの第2の目標領域の画素値とに基づき、プリセットアルゴリズムに従って前記現在のフレームの第1の目標領域の画素と前のフレームの第2の目標領域の画素との類似度を計算する。
前記第1の目標領域は前記スクリーンコンテンツが分割されて得た複数の領域の最後の領域であるかどうかを判断し、そうである場合、前記スクリーンコンテンツの現在のフレームの処理を完了し、そうでない場合、前記スクリーンコンテンツの前記現在のフレームの第1の目標領域の次の領域と前のフレームの同じ領域との画素類似度を検出するステップを引き続き実行するステップを含む。
前記スクリーンコンテンツをN(長)×N(高)個の矩形領域に分割するステップを含み、Nが正の整数である。本開示の実施例では、Nの数値は、スクリーンコンテンツのサイズに応じて分割され得る。各領域のサイズは、長さ及び高さがそれぞれ、スクリーンコンテンツの長さとNとの比の値及びスクリーンコンテンツの高さとNとの比の値である。
判断モジュール502は、前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するために用いられ、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域であり、
多重化モジュール503は、前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするために用いられ、
計算モジュール504は、前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するために用いられ、
符号化モジュール505は、前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行い、前記現在のフレームの第1の目標領域のスクリーンコンテンツ処理を完了するために用いられる。
スクリーンコンテンツを複数の領域に分割するステップと、
前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するステップであって、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域であるステップと、
前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするステップと、
前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するステップと、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行うステップと、を含む。
前記現在のフレームの第1の目標領域の画素値と前記前のフレームの第2の目標領域の画素値とを取得するステップと、
前記現在のフレームの第1の目標領域の画素値と前記前のフレームの第2の目標領域の画素値とに基づき、プリセットアルゴリズムに従って前記現在のフレームの第1の目標領域の画素と前記前のフレームの第2の目標領域の画素との類似度を計算するステップと、を含む。
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、前記符号化対象領域に近い順に、前記参照領域の画素ハッシュテーブルをトラバースし、目標参照ブロックを得るステップと、
前記目標参照ブロックに基づいて、前記現在のフレームの第1の目標領域の符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行うステップと、を含む。
前記第1の目標領域は前記スクリーンコンテンツが分割されて得た複数の領域の最後の領域であるかどうかを判断し、そうである場合、前記スクリーンコンテンツの現在のフレームの処理を完了し、そうでない場合、前記スクリーンコンテンツの前記現在のフレームの第1の目標領域の次の領域と前のフレームの同じ領域との画素類似度を検出するステップを引き続き実行するステップ、を含む。
スクリーンコンテンツを複数の領域に分割するために用いられる分割モジュールと、
前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するために用いられる判断モジュールであって、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域である判断モジュールと、
前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするために用いられる多重化モジュールと、
前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するために用いられる計算モジュールと、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行うために用いられる符号化モジュールと、を含む。
前記メモリにはコンピュータ実行命令が記憶されており、
前記少なくとも1つのプロセッサが前記メモリに記憶されているコンピュータ実行命令を実行すると、前記少なくとも1つのプロセッサが上記の第1の態様及び第1の態様の様々な可能な設計に記載されているスクリーンコンテンツ処理方法を実行する。
スクリーンコンテンツを複数の領域に分割するステップと、
前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するステップであって、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域であるステップと、
前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするステップと、
前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するステップと、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行い、前記現在のフレームの第1の目標領域のスクリーンコンテンツ処理を完了するステップと、を含む。
スクリーンコンテンツを複数の領域に分割するために用いられる分割モジュールと、
前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するために用いられる判断モジュールであって、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域である判断モジュールと、
前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするために用いられる多重化モジュールと、
前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するために用いられる計算モジュールと、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行い、前記現在のフレームの第1の目標領域のスクリーンコンテンツ処理を完了するために用いられる符号化モジュールと、を含む。
前記メモリにはコンピュータ実行命令が記憶されており、
前記プロセッサが前記メモリに記憶されているコンピュータ実行命令を実行すると、前記プロセッサが上記の第1の態様及び第1の態様の様々な可能な設計に記載されているスクリーンコンテンツ処理方法を実行する。
前記現在のフレームの第1の目標領域の画素値と前のフレームの第2の目標領域の画素値とに基づき、プリセットアルゴリズムに従って前記現在のフレームの第1の目標領域の画素と前のフレームの第2の目標領域の画素との類似度を計算する。
前記第1の目標領域は前記スクリーンコンテンツが分割されて得た複数の領域の最後の領域であるかどうかを判断し、そうである場合、前記スクリーンコンテンツの現在のフレームの処理を完了し、そうでない場合、前記スクリーンコンテンツの前記現在のフレームの第1の目標領域の次の領域と前のフレームの前記次の領域に対応する同じ領域との画素類似度を検出するステップを引き続き実行するステップを含む。
前記スクリーンコンテンツをN(長)×N(高)個の矩形領域に分割するステップを含み、Nが正の整数である。本開示の実施例では、Nの数値は、スクリーンコンテンツのサイズに応じて決定され得る。各領域のサイズは、長さ及び高さがそれぞれ、スクリーンコンテンツの長さとNとの比の値及びスクリーンコンテンツの高さとNとの比の値である。
判断モジュール502は、前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するために用いられ、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域であり、
多重化モジュール503は、前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするために用いられ、
計算モジュール504は、前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するために用いられ、
符号化モジュール505は、前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行い、前記現在のフレームの第1の目標領域のスクリーンコンテンツ処理を完了するために用いられる。
スクリーンコンテンツを複数の領域に分割するステップと、
前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するステップであって、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域であるステップと、
前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするステップと、
前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するステップと、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行うステップと、を含む。
前記現在のフレームの第1の目標領域の画素値と前記前のフレームの第2の目標領域の画素値とを取得するステップと、
前記現在のフレームの第1の目標領域の画素値と前記前のフレームの第2の目標領域の画素値とに基づき、プリセットアルゴリズムに従って前記現在のフレームの第1の目標領域の画素と前記前のフレームの第2の目標領域の画素との類似度を計算するステップと、を含む。
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、前記符号化対象領域に近い順に、前記参照領域の画素ハッシュテーブルをトラバースし、目標参照ブロックを得るステップと、
前記目標参照ブロックに基づいて、前記現在のフレームの第1の目標領域の符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行うステップと、を含む。
前記第1の目標領域は前記スクリーンコンテンツが分割されて得た複数の領域の最後の領域であるかどうかを判断し、そうである場合、前記スクリーンコンテンツの現在のフレームの処理を完了し、そうでない場合、前記スクリーンコンテンツの前記現在のフレームの第1の目標領域の次の領域と前のフレームの前記次の領域に対応する同じ領域との画素類似度を検出するステップを引き続き実行するステップ、を含む。
スクリーンコンテンツを複数の領域に分割するために用いられる分割モジュールと、
前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するために用いられる判断モジュールであって、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域である判断モジュールと、
前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするために用いられる多重化モジュールと、
前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するために用いられる計算モジュールと、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行うために用いられる符号化モジュールと、を含む。
前記メモリにはコンピュータ実行命令が記憶されており、
前記少なくとも1つのプロセッサが前記メモリに記憶されているコンピュータ実行命令を実行すると、前記少なくとも1つのプロセッサが上記の第1の態様及び第1の態様の様々な可能な設計に記載されているスクリーンコンテンツ処理方法を実行する。
Claims (14)
- スクリーンコンテンツ処理方法であって、
スクリーンコンテンツを複数の領域に分割するステップと、
前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するステップであって、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域であるステップと、
前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするステップと、
前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するステップと、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行い、前記現在のフレームの第1の目標領域のスクリーンコンテンツ処理を完了するステップと、を含む、スクリーンコンテンツ処理方法。 - 前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するステップは、
前記現在のフレームの第1の目標領域の画素値と前記前のフレームの第2の目標領域の画素値とを取得するステップと、
前記現在のフレームの第1の目標領域の画素値と前記前のフレームの第2の目標領域の画素値とに基づき、プリセットアルゴリズムに従って前記現在のフレームの第1の目標領域の画素と前記前のフレームの第2の目標領域の画素との類似度を計算するステップと、を含む、請求項1に記載の方法。 - 前記プリセットアルゴリズムは、絶対誤差和、時間領域を周波数領域に変換して絶対値を加算するアルゴリズム、及び二乗和誤差のうちの少なくとも1つを含む、請求項2に記載の方法。
- 前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行うステップは、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、前記符号化対象領域に近い順に、前記参照領域の画素ハッシュテーブルをトラバースし、目標参照ブロックを得るステップと、
前記目標参照ブロックに基づいて、前記現在のフレームの第1の目標領域の符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行うステップと、を含む、請求項1~3のいずれか1項に記載の方法。 - 前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行うステップの後に、
前記第1の目標領域は前記スクリーンコンテンツが分割されて得た複数の領域の最後の領域であるかどうかを判断し、そうである場合、前記スクリーンコンテンツの現在のフレームの処理を完了し、そうでない場合、前記スクリーンコンテンツの前記現在のフレームの第1の目標領域の次の領域と前のフレームの同じ領域との画素類似度を検出するステップを引き続き実行するステップ、をさらに含む、請求項1~4のいずれか1項に記載の方法。 - 前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するステップは、
前記現在のフレームの第1の目標領域の各画素位置の対応するハッシュ値を計算するステップと、
前記現在のフレームの第1の目標領域の各画素位置のハッシュ値をkey値として、画素位置をvalue値として用いて、前記画素ハッシュテーブルを作成するステップと、を含む、請求項1~5のいずれか1項に記載の方法。 - 前記類似度が第1の検出結果を満たすことは、前記類似度が設定された類似度しきい値より大きいことであり、前記類似度が第2の検出結果を満たすことは、前記類似度が設定された類似度しきい値以下である、請求項1~6のいずれか1項に記載の方法。
- スクリーンコンテンツを複数の領域に分割するステップは、
前記スクリーンコンテンツをN×N個の矩形領域に分割するステップを含み、前記Nが正の整数である、請求項1~7のいずれか1項に記載の方法。 - 前記第1の目標領域のサイズに基づいて前記類似度しきい値を決定するステップをさらに含む、請求項1~8のいずれか1項に記載の方法。
- スクリーンコンテンツ処理装置であって、
スクリーンコンテンツを複数の領域に分割するために用いられる分割モジュールと、
前記スクリーンコンテンツの現在のフレームの第1の目標領域と前のフレームの第2の目標領域との画素類似度を検出するために用いられる判断モジュールであって、前記第1の目標領域と前記第2の目標領域とはスクリーンコンテンツの互いに対応する領域である判断モジュールと、
前記類似度が第1の検出結果を満たす場合、前記前のフレームの第2の目標領域の画素ハッシュテーブルを前記現在のフレームの第1の目標領域の画素ハッシュテーブルとするために用いられる多重化モジュールと、
前記類似度が第2の検出結果を満たす場合、前記現在のフレームの第1の目標領域の画素ハッシュ値を計算して画素ハッシュテーブルを作成するために用いられる計算モジュールと、
前記現在のフレームの第1の目標領域の符号化対象領域の画素ハッシュテーブルに基づいて、参照領域の画素ハッシュテーブルをトラバースし、前記符号化対象領域に対してフレームのイントラブロックコピー処理又はハッシュベース動き探索処理を行い、前記現在のフレームの第1の目標領域のスクリーンコンテンツ処理を完了するために用いられる符号化モジュールと、を含む、スクリーンコンテンツ処理装置。 - プロセッサとメモリとを含む電子機器であって、
前記メモリにはコンピュータ実行命令が記憶されており、
前記プロセッサが前記メモリに記憶されているコンピュータ実行命令を実行すると、前記少なくとも1つのプロセッサが請求項1~9のいずれか1項に記載のスクリーンコンテンツ処理方法を実行する、ことを特徴とする電子機器。 - コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体にはコンピュータ実行命令が記憶されており、プロセッサが前記コンピュータ実行命令を実行するとき、請求項1~9のいずれか1項に記載のスクリーンコンテンツ処理方法が実現される、ことを特徴とするコンピュータ可読記憶媒体。
- コンピュータプログラムを含む、コンピュータプログラム製品であって、前記コンピュータプログラムがプロセッサにより実行されるとき、請求項1~9のいずれか1項に記載のスクリーンコンテンツ処理方法が実現される、ことを特徴とするコンピュータプログラム製品。
- コンピュータプログラムであって、前記コンピュータプログラムがプロセッサにより実行されるとき、請求項1~9のいずれか1項に記載のスクリーンコンテンツ処理方法が実現される、ことを特徴とするコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110164130.9A CN112804528B (zh) | 2021-02-05 | 2021-02-05 | 屏幕内容处理方法、装置及设备 |
CN202110164130.9 | 2021-02-05 | ||
PCT/CN2022/074131 WO2022166727A1 (zh) | 2021-02-05 | 2022-01-26 | 屏幕内容处理方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024505844A true JP2024505844A (ja) | 2024-02-08 |
Family
ID=75814468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023544245A Pending JP2024505844A (ja) | 2021-02-05 | 2022-01-26 | スクリーンコンテンツ処理方法、装置及び機器 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20240089428A1 (ja) |
EP (1) | EP4277270A4 (ja) |
JP (1) | JP2024505844A (ja) |
CN (1) | CN112804528B (ja) |
WO (1) | WO2022166727A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112804528B (zh) * | 2021-02-05 | 2022-10-28 | 北京字节跳动网络技术有限公司 | 屏幕内容处理方法、装置及设备 |
CN113259672B (zh) * | 2021-07-15 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 解码方法、编码方法、解码器、编码器以及编解码系统 |
CN115580723B (zh) * | 2022-12-09 | 2023-06-09 | 中南大学 | 一种屏幕内容图像的编码优化方法、系统、设备及介质 |
CN116760986B (zh) * | 2023-08-23 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 候选运动矢量生成方法、装置、计算机设备和存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7224731B2 (en) * | 2002-06-28 | 2007-05-29 | Microsoft Corporation | Motion estimation/compensation for screen capture video |
KR101968700B1 (ko) * | 2011-03-09 | 2019-04-12 | 지멘스 악티엔게젤샤프트 | 디지털화된 이미지들의 시퀀스를 코딩하기 위한 방법 |
CN103281538B (zh) * | 2013-06-06 | 2016-01-13 | 上海交通大学 | 基于滚动哈希和块级别帧内预测的帧内编码方法 |
CN105578181B (zh) * | 2016-01-19 | 2019-01-01 | 南京大学 | 一种hevc中屏幕内容压缩的快速帧内模式决策和块匹配方法 |
CN110352599A (zh) * | 2018-04-02 | 2019-10-18 | 北京大学 | 用于视频处理的方法和设备 |
CN108495139A (zh) * | 2018-04-18 | 2018-09-04 | 北方工业大学 | 屏幕内容编码的哈希块匹配 |
CN109743570B (zh) * | 2019-01-09 | 2021-07-06 | 北京工业大学 | 一种屏幕内容视频的压缩方法 |
CN110287149A (zh) * | 2019-05-10 | 2019-09-27 | 同济大学 | 一种使用哈希搜索的匹配编码方法 |
CN110446040A (zh) * | 2019-07-30 | 2019-11-12 | 暨南大学 | 一种适用于hevc标准的帧间编码方法与系统 |
US11930159B2 (en) * | 2019-11-29 | 2024-03-12 | Intel Corporation | Method and system of video coding with intra block copying |
CN111669595A (zh) * | 2020-05-26 | 2020-09-15 | 腾讯科技(深圳)有限公司 | 一种屏幕内容编码方法、装置、设备和介质 |
CN111836046A (zh) * | 2020-06-22 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 视频编码方法及装置、电子设备和计算机可读存储介质 |
CN112804528B (zh) * | 2021-02-05 | 2022-10-28 | 北京字节跳动网络技术有限公司 | 屏幕内容处理方法、装置及设备 |
-
2021
- 2021-02-05 CN CN202110164130.9A patent/CN112804528B/zh active Active
-
2022
- 2022-01-26 EP EP22749006.7A patent/EP4277270A4/en active Pending
- 2022-01-26 JP JP2023544245A patent/JP2024505844A/ja active Pending
- 2022-01-26 WO PCT/CN2022/074131 patent/WO2022166727A1/zh active Application Filing
- 2022-01-26 US US18/262,533 patent/US20240089428A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240089428A1 (en) | 2024-03-14 |
EP4277270A4 (en) | 2024-07-03 |
CN112804528A (zh) | 2021-05-14 |
CN112804528B (zh) | 2022-10-28 |
WO2022166727A1 (zh) | 2022-08-11 |
EP4277270A1 (en) | 2023-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2024505844A (ja) | スクリーンコンテンツ処理方法、装置及び機器 | |
CN111784614B (zh) | 图像去噪方法及装置、存储介质和电子设备 | |
US20240305860A1 (en) | Method and apparatus for playing back video at multiple-speed, electronic device and storage medium | |
CN110413812B (zh) | 神经网络模型的训练方法、装置、电子设备及存储介质 | |
US10681367B2 (en) | Intra-prediction video coding method and device | |
WO2020248890A1 (zh) | 一种视频质量评估方法、装置和电子设备 | |
CN111399956A (zh) | 应用于显示设备的内容展示方法、装置和电子设备 | |
WO2020211422A1 (zh) | 视频处理方法、装置及设备 | |
CN110738657B (zh) | 视频质量评估方法、装置、电子设备及存储介质 | |
CN112565890B (zh) | 视频裁剪方法、装置、存储介质及电子设备 | |
JP2010148037A (ja) | 動画像再生装置、動画像再生方法および動画像再生プログラム | |
WO2022116772A1 (zh) | 视频裁剪方法、装置、存储介质及电子设备 | |
US20220383637A1 (en) | Live streaming sampling method and apparatus, and electronic device | |
CN112561840A (zh) | 视频裁剪方法、装置、存储介质及电子设备 | |
US20160345018A1 (en) | Video encoding and decoding | |
WO2023160617A9 (zh) | 视频插帧处理方法、视频插帧处理装置和可读存储介质 | |
CN112203085B (zh) | 图像处理方法、装置、终端和存储介质 | |
CN110795196A (zh) | 窗口显示方法、装置、终端及存储介质 | |
CN112418232A (zh) | 图像分割方法、装置、可读介质及电子设备 | |
CN112203086B (zh) | 图像处理方法、装置、终端和存储介质 | |
CN113205601A (zh) | 漫游路径生成方法、装置、存储介质及电子设备 | |
CN116248889A (zh) | 图像编码及解码方法、装置和电子设备 | |
CN116828180B (zh) | 视频编码方法、装置、电子设备和计算机可读介质 | |
CN112822418B (zh) | 视频处理方法和装置、存储介质和电子设备 | |
CN111368015B (zh) | 用于压缩地图的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230721 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240730 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241016 |