JP2022501902A - 画像処理方法、装置、システム、ネットワーク機器、端末及びコンピュータプログラム - Google Patents

画像処理方法、装置、システム、ネットワーク機器、端末及びコンピュータプログラム Download PDF

Info

Publication number
JP2022501902A
JP2022501902A JP2021515166A JP2021515166A JP2022501902A JP 2022501902 A JP2022501902 A JP 2022501902A JP 2021515166 A JP2021515166 A JP 2021515166A JP 2021515166 A JP2021515166 A JP 2021515166A JP 2022501902 A JP2022501902 A JP 2022501902A
Authority
JP
Japan
Prior art keywords
image processing
image
interest
instruction information
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021515166A
Other languages
English (en)
Other versions
JP7425788B2 (ja
Inventor
ウー,ジャオ
リー,ミン
ウー,ピン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Publication of JP2022501902A publication Critical patent/JP2022501902A/ja
Application granted granted Critical
Publication of JP7425788B2 publication Critical patent/JP7425788B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/698Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234345Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440245Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本発明の実施例は画像処理方法、装置、システム、ネットワーク機器、端末及び記憶媒体を提供し、ビデオ画像における関心領域間の合成表示方式を指示するための合成指示情報を取得し、前記合成指示情報に基づいて前記ビデオ画像のメディアストリームを生成し、即ち、該合成指示情報をビデオ画像のコードストリームに書き込むことによって、複数(少なくとも2つ)のROIが存在する場合におけるビデオ画像の符号化プロセスを実現する。【選択図】図1

Description

(相互参照)
本発明は、2018年9月19日に中国特許局に提出された、出願番号が201811095593.9、発明名称が「画像処理方法、装置、システム、ネットワーク機器、端末及び記憶媒体」である中国特許出願の優先権を主張し、該出願の全内容が引用により本発明に組み込まれている。
本発明の実施例は画像コーデックの技術分野に関するが、これに限定されず、具体的には、画像処理方法、装置、システム、ネットワーク機器、端末及び記憶媒体に関するが、これらに限定されない。
時下、デジタルメディア技術の急速な発展に伴い、ハードウェア性能が倍増し、ネットワーク帯域幅が大幅に増加し、ネットワーク速度が向上し、モバイル機器の数が幾何学的に増加し、ビデオアプリケーションの発展の機会を提供する。ビデオアプリケーションは、新しいビデオコンテンツタイプやビデオ再現特性、及びより優れた臨場感や視聴体験をユーザーに提供するように、シングルビュー、低解像度、低ビットレートから徐々にマルチビュー、高解像度、高ビットレートへと急速に発展している。
360パノラマビデオ(以下、パノラマビデオと略称する)は新しいビデオコンテンツタイプとして、ユーザーが主観的なニーズに応じて、視野角を任意に選択して視聴することができ、それにより360度全方向視聴を実現する。現在のネットワーク性能及びハードウェア処理性能が高いにもかかわらず、ユーザー数の激増及びパノラマビデオデータ量の膨大さのため、ユーザーの視聴体験を確保するうえで、ネットワーク及びハードウェアリソースの占有を低減させる必要がある。
現在、関心領域(Region Of Interest、以下、ROIと略称する)技術は、すべてのパノラマビデオを処理する必要がなく、ユーザーの好みに応じてパノラマビデオを切り取り表示することができるが、関連技術では、ROIは一般に1つしかないため、パノラマビデオ中の一部の画像のみを表示でき、ユーザーが複数のROIを視聴するニーズを満たすことができない。従って、複数のROIが存在する場合、各ROIの合成表示を指示するようにどのように符号化を実現するかは解決を急いでいる。
本発明の実施例に係る画像処理方法、装置、システム、ネットワーク機器、端末及び記憶媒体が主に解決する課題は、複数のROIが存在する場合に如何に符号化を実現することである。
上記した課題を解決するために、本発明の実施例は、
ビデオ画像における関心領域間の合成表示方式を指示するための合成指示情報を取得するステップと、
前記合成指示情報に基づいて前記ビデオ画像のメディアストリームを生成するステップと、を含む画像処理方法を提供する。
本発明の実施例は、
ビデオ画像のビデオストリーム及び記述データを受信するステップと、
前記記述データを解析して関心領域の合成指示情報を得るステップと、
前記合成指示情報に応じて、前記ビデオストリームにおける関心領域画像の合成再生表示を制御するステップと、を含む画像処理方法をさらに提供する。
本発明の実施例は、
ネットワーク側はビデオ画像における各前記関心領域の合成表示方式を指示するための合成指示情報を取得し、前記合成指示情報に基づいて前記ビデオ画像のメディアストリームを生成し、メディアストリームをターゲットノードに送信するステップと、
前記ターゲットノードは前記メディアストリームを受信し、前記メディアストリームを解析して関心領域の合成指示情報を得て、前記合成指示情報に応じて前記メディアストリームにおけるビデオストリームの再生表示を制御するステップと、を含む画像処理方法をさらに提供する。
本発明の実施例は、
ビデオ画像における各前記関心領域の合成表示方式を指示するための合成指示情報を取得することに用いられる取得モジュールと、
前記合成指示情報に基づいて前記ビデオ画像のメディアストリームを生成することに用いられる処理モジュールと、を含む画像処理装置をさらに提供する。
本発明の実施例は、
ビデオ画像のビデオストリーム及び記述データを受信することに用いられる受信モジュールと、
前記記述データを解析して関心領域の合成指示情報を得ることに用いられる解析モジュールと、
前記合成指示情報に応じて、前記ビデオストリームにおける関心領域画像の合成再生表示を制御することに用いられる制御モジュールと、を含む画像処理装置をさらに提供する。
本発明の実施例は、前記2種の画像処理装置を含む画像処理システムをさらに提供する。
本発明の実施例は、第1プロセッサ、第1メモリ及び第1通信バスを含み、
前記第1通信バスは、第1プロセッサと第1メモリとの接続通信を実現することに用いられ、
前記第1プロセッサは、第1メモリに記憶されている1つ又は複数のコンピュータプログラムを実行して、前記いずれかに記載の画像処理方法のステップを実現することに用いられるネットワーク機器をさらに提供する。
本発明の実施例は、第2プロセッサ、第2メモリ及び第2通信バスを含み、
前記第2通信バスは、第2プロセッサと第2メモリとの接続通信を実現することに用いられ、
前記第2プロセッサは、第2メモリに記憶されている1つ又は複数のコンピュータプログラムを実行して、前記画像処理方法のステップを実現することに用いられる端末をさらに提供する。
本発明の実施例は、1つ又は複数のプロセッサにより実行されると、前記画像処理方法のステップを実現する1つ又は複数のプログラムが記憶されている記憶媒体をさらに提供する。
本発明のその他の特徴及び対応する有益な効果は明細書において後述され、理解できるように、少なくとも有益な効果の一部は本発明の明細書の記載から明らかになる。
本発明の実施例1における画像処理方法の模式的フローチャートである。 本発明の実施例1におけるROI画像接合指示の模式図1である。 本発明の実施例1におけるROI画像接合指示の模式図2である。 本発明の実施例1におけるROI画像接合指示の模式図3である。 本発明の実施例1におけるROI画像接合指示の模式図4である。 本発明の実施例1におけるROI画像接合指示の模式図5である。 本発明の実施例1におけるROI画像融合指示の模式図1である。 本発明の実施例1におけるROI画像融合指示の模式図2である。 本発明の実施例1におけるROI画像重畳領域の模式図である。 本発明の実施例1におけるROI画像入れ子指示の模式図である。 本発明の実施例1におけるROI画像透明チャンネル処理の模式図である。 本発明の実施例1におけるROI画像座標位置の模式図である。 本発明の実施例1におけるROI画像ビデオストリーム生成の模式図1である。 本発明の実施例1におけるROI画像ビデオストリーム生成の模式図2である。 本発明の実施例2における画像処理方法の模式的フローチャートである。 本発明の実施例3における画像処理方法の模式的フローチャートである。 本発明の実施例4における画像処理装置の構造模式図である。 本発明の実施例5における画像処理装置の構造模式図である。 本発明の実施例6における画像処理システムの構造模式図である。 本発明の実施例7におけるネットワーク機器の構造模式図である。 本発明の実施例8における端末の構造模式図である。
本発明の目的、技術案及び利点をより明確にするために、以下、具体的な実施形態及び図面を参照しながら本発明の実施例をさらに詳細に説明する。理解できるように、ここに説明される具体的な実施例は単に本発明を解釈するためのものであり、本発明を限定するものではない。
(実施例1)
ビデオ画像に複数のROIが存在する場合に、ユーザーが複数のROIを同時に視聴するニーズを満たすように符号化を行うために、本発明の実施例は画像処理方法を提供し、主にネットワーク側機器、エンコーダー等に応用され、サーバ、基地局等の機器を含むが、これらに限定されず、図1に示すように、以下のステップS101〜S102を含む。
S101、ビデオ画像における関心領域間の合成表示方式を指示するための合成指示情報を取得する。
ビデオ画像を符号化するとき、ビデオ画像におけるROI間の合成表示方式を指示するための合成指示情報を取得する。理解できるように、該ビデオ画像にROIがないか画定されていない場合、該合成指示情報を取得するプロセスを実行しない。複数のROIが存在する場合のみに、対応する合成指示情報を取得する。1つのROIのみが存在する場合、本技術案を採用して該1つのROIの表示を制御するようにしてもよい。
オプションとして、符号化プロセスでは、まず、ビデオ画像中にROIが存在することを決定し、この場合、該ROIの合成表示方式を指示するための対応する合成指示情報を取得する。
ROIについて、以下の方式によって設定できるが、これらに限定されない。
1、画像処理、ROI識別等の技術によってビデオ画像を予め分析し、さらに分析結果によって、パノラマビデオ中の特定コンテンツ又は特定空間位置を画定し、それによって異なるROIを形成する。例えば、サッカー試合中、1つのカメラを用いてボールの運動軌跡をROIとして追跡撮影し、又はROI識別技術によって、撮影したビデオ画像における特定目標(例えば、特定の選手)に識別追跡を行い、ROIを形成する。
2、ユーザーニーズ又は事前設定情報に応じて、ビデオ画像に対して特定コンテンツ又は特定空間位置を手動で画定し、それにより異なる関心領域を形成する。
3、ビデオ画像再生中、ユーザーの関心領域の情報を収集し、これらの情報に応じてパノラマビデオ中の特定コンテンツ又は特定空間位置を自動で画定し、それにより異なる関心領域を形成する。
4、ユーザーはビデオ画像を視聴中、関心領域を自ら選定する。
S102、前記合成指示情報に基づいて前記ビデオ画像のメディアストリームを生成する。
取得した合成指示情報に基づいて該ビデオ画像のメディアストリームを生成する。つまり、該合成指示情報を符号化し、該ビデオ画像のコードストリームに書き込み、それにより該ビデオ画像のメディアストリームを生成する。再生機器は、該メディアストリームを復号でき、少なくとも該ビデオ画像における各ROIを合成して表示再生できる。
合成指示情報は、
関心領域を接合表示することを指示するための第1指示情報、関心領域を融合表示することを指示するための第2指示情報、関心領域を入れ子表示することを指示するための第3指示情報、関心領域をズーム表示することを指示するための第4指示情報、関心領域を回転表示することを指示するための第5指示情報、及び関心領域を切り取り表示することを指示するための第6指示情報のうちの少なくとも1種を含む。
そのうち、第1指示情報は、各ROIを接合することを指示することに用いられ、接合とは、2つのROIが隣接するが重畳していない。図2に示すように、A、B、C、D領域はビデオ画像における4つの関心領域であり、サイズが同じであり、パノラマ画像における出現位置に応じて接合できる。
オプションとして、図3に示すように、A、B、C、D領域は任意の位置、又は指定の位置に応じて接合してもよい。
オプションとして、図4に示すように、A、B、C、D領域はサイズが異なってもよい。
オプションとして、図5に示すように、A、B、C、D領域は位置が任意であってもよいとともに、サイズが異なってもよい。
オプションとして、図6に示すように、A、B、C、D領域を接合後、矩形ではない任意の形状を形成してもよい。
第2指示情報は、各ROIを融合することを指示することに用いられ、融合により2つのROI間に部分重畳領域が存在するが、一方のROIが完全に他方のROIに重ね合わせられるのではない。図7に示すように、A、B、C、D領域はビデオ画像における4つの関心領域であり、特定範囲の領域を重畳させて融合される。
オプションとして、図8に示すように、4つの関心領域の合成表示方式は、固定カバレッジ順序で画素の直接カバレッジを行うことであってもよく、重ね合わせの順序がA→B→C→Dであり、従って、最後にカバレッジするDがその他の3つのROIによりカバレッジされていない。
オプションとして、融合による重畳部分領域について、その画素値は以下の方式によって処理されてもよい。図9に示すように、4つの異なるROI領域の重畳部分の画素から計算して新たな画素値を生成する。例えば、すべての画素平均値を計算し、又は異なる領域の画素に対して異なる重み値を設定し、又は特徴マッチング方法に応じて新たな画素値を算出し、自然な画像融合効果を取得する。そのうち、特徴マッチング方法で新たな画素値を計算することは、通常、できるだけ最適な融合効果を取得するようにビデオ処理能力が高いネットワーク側機器に適用され、理論的には、端末側にも適用できるが、端末の性能要件が高い。
第3指示情報はROIを入れ子表示することを指示することに用いられ、入れ子表示は一方のROIを他方のROIの上に完全に重畳させる。図10に示すように、A、B領域はビデオ画像における2つの関心領域であり、BをAの上に完全に重畳させて一体にネストし、ネストする位置は実際の需要に応じて設定でき、例えば、画像画面のサイズに応じて設定でき、画像画面が相対的に小さいROIを相対的に大きいROIの上に重畳させ、又はユーザーに応じてカスタマイズされる。
第4指示情報はROIをズームすることを指示することに用いられ、ズームは画像のサイズを変更することである。ズーム率の値を含み、例えば、ズーム率値が2である場合、ROIの対角線長さを元の2倍に拡大することを指示できる。
第5指示情報はROIを回転させることを指示することに用いられ、回転タイプ及び回転角度を含み、回転タイプは水平回転、垂直回転を含むが、これらに限定されない。
第6指示情報は関心領域を切り取り表示することを指示することに用いられ、図11に示すように、A、B領域はビデオ画像における2つの関心領域であり、B領域中の円形領域を切り取り、Alpha透明チャンネルを用いて実現できる。オプションとして、切り取ったBをAとネストして該画像を合成するようにしてもよい。
実際の応用では、通常、ユーザーが複数のROIを視聴するニーズをよりよく満たすように、上記6種の指示情報のうちの複数種を組み合わせて対応するROIを合成処理することができる。
本実施例では、H.264/AVC規格、H.265/HEVC(High Efficiency Video Coding、高効率ビデオ符号化)規格を用いてビデオ画像を符号化できる。符号化を行う過程では、取得した合成指示情報をビデオ画像のコードストリームに書き込む。
本発明のその他の例では、さらに該ビデオ画像における対応するROIの特徴情報を取得し、上記取得した合成指示情報及び該特徴情報に基づいて、該ビデオ画像のメディアストリームを生成するようにしてもよい。つまり、上記合成指示情報及び特徴情報をビデオ画像のコードストリームに同時に書き込む。
そのうち、生成されたメディアストリームは、少なくとも記述データ及びビデオストリームを含む。本実施例では、取得した合成指示情報及び特徴情報を該記述データに書き込む。なお、記述データは主にビデオストリームの復号を指示し、ビデオ画像の再生を実現することに用いられる。記述データは、例えば、時間同期情報、テキスト情報及びその他の関連情報等のうちの少なくとも1種を含んでもよい。
さらになお、記述データはビデオ画像の一部として、オプションとして、以下の2種の形式が存在する。一方は、コードストリームの形式でビデオストリームとともに符号化されてもよく、つまり、ビデオストリームに属する部分データであり、他方は、ビデオストリームと単独に符号化されもよく、ビデオストリームと分離するものである。
ROI特徴情報は位置情報及び/又は符号化品質指示情報を含み、位置情報はROIの特定位置の座標情報、及びROIの長さ値と幅値を含む。特定位置はROI領域の4つの角のうちいずれか1つの角の位置、例えば左上角の画素点、右下角の画素点であってもよく、ROI領域の中心点の位置であってもよい。符号化品質指示情報は符号化プロセスに使用される符号化品質等級であってもよく、異なる符号化品質指示情報は異なる符号化品質等級を表し、異なる符号化品質等級によって符号化を行って生成される画像の画質も異なる。
例えば、符号化品質指示情報は「1」、「2」、「3」、「4」、「5」、「6」であってもよく、異なる数値は異なる符号化品質等級を表し、例えば、符号化品質指示情報が「1」である場合、低品質で符号化することを示し、相対的には、符号化品質指示情報が「2」である場合、「1」よりも高い中品質で符号化することを示し、数値が大きいほど、符号化品質が順に逓増する。
本発明のその他の例では、ROI位置情報は以下の方式で表されてもよい。図12に示すように、ROI領域121は、上側辺がビデオ画像の300行目に位置し、下側辺がビデオ画像の600行目に位置し、左側辺がビデオ画像の500列目に位置し、右側辺がビデオ画像の800列目に位置する。つまり、ROI領域が位置する行列位置によってその位置情報をマークする。1920*1080画像領域の場合、左上角の画素点位置が(0,0)、右下角の画素点位置が(1919,1079)である。2次元又は3次元画像領域の場合、デカルト座標系を使用してもよく、例えば柱面、球面又は極座標系のようなその他の非デカルト曲線座標系を使用してもよい。
理解できるように、ROIの長さ値は、上記図12では、上下側辺の長さであり、つまり、左右側辺の距離はROIの長さ値とすることができ、即ち、800−500=300画素点であり、600−300=300画素点はROIの幅値とすることができる。その逆も同様である。
ROIの合成指示情報及び特徴情報は以下の表1に示される。
Figure 2022501902
table_id:表の識別子;
version:バージョン情報;
length:長さ情報;
roi_num:含まれる関心領域の数;
(roi_position_x,roi_position_y,roi_position_z):ビデオ画像における関心領域の座標情報;
roi_width:関心領域の幅;
roi_height:関心領域の高さ;
roi_quality:関心領域品質情報;
relation_type:関心領域の合成指示情報であり、0は接合、1は入れ子、2は融合である;
(roi_new_position_x,roi_new_position_y,roi_new_position_z):関心領域の新画像における座標情報;
scale:関心領域のズーム率;
rotation:関心領域の回転角度;
flip:関心領域の反転であり、0は水平反転、1は垂直反転である;
alpha_flag:透明チャンネル識別子であり、0は透明チャンネル情報無し、1は透明チャンネル情報有りである;
alpha_info():透明チャンネル情報と関心領域とを組み合わせて(切り取り)新たな画像を生成する;
filter_info():relation_typeが融合方式である場合、融合領域のフィルタリング方式、例えば平均値、中央値等を指すことができる;
user_data():ユーザー情報。
上記ROI合成指示情報及び特徴情報を含むroi_info_tableをビデオ画像の記述データに書き込み、オプションとして、記述データは、付加拡張情報(Supplemental Enhancement Information、SEI)、ビデオユーザビリティ情報(Video Usability Information、VUI)、システム層メディア属性記述単位のうちの少なくとも1種を含む。
roi_info_tableをビデオコードストリーム中の付加拡張情報に書き込み、具体的な例は以下の表2に示される構造であってもよい。
Figure 2022501902
roi_info_tableは対応するROIの関連情報(合成指示情報、特徴情報等)を含み、付加拡張情報に書き込まれ、SEI情報から識別情報がROI_INFOの情報を取得できる。ROI_INFOの情報をSEI情報の識別情報とすることに相当する。
roi_info_tableをビデオユーザビリティ情報に書き込み、具体的な例は以下の表3に示される構造であってもよい。
Figure 2022501902
表3では、roi_info_flagの値が1である場合、後続にROI情報が存在することを示す。roi_info_table()は上記表1中のroi_info_tableデータ構造でもあり、ROI関連情報を含む。VUI情報から識別情報としてroi_info_flagが1である関心領域情報を取得できる。
roi_info_tableをシステム層メディア属性記述単位に書き込み、システム層メディア属性記述単位はトランスポートストリームの記述子、ファイル形式のデータ単位(例えば、Box中)、トランスポートストリームのメディア記述情報(例えば、メディアプレゼンテーション記述(Media Presentation Description、MPD)等の情報単位)を含むが、これらに限定されない。
ROI合成指示情報及び特徴情報をSEIに書き込み、さらにその一時的動き制約タイルセット(temporal Motion-Constrained Tile Sets、MCTS)と組み合わせてもよく、オプションとして、ROIの関連情報とH.265/HEVC規格を用いた一時的動き制約タイルセットとを組み合わせる。ROIの合成指示情報をタイルと緊密に組み合わせ、単独なコーデックROIデータを追加せずに、所要のタイルデータを柔軟に抽出し、このように、ユーザーの異なるニーズを満たすことができるだけでなく、アプリケーションにおいてユーザーとの対話に有利である。以下の表4に示される。
Figure 2022501902
ただし、roi_info_flag:0は関心領域の関連情報無し、1は関心領域の関連情報有りを示す。
roi_infoの一例は以下の表5に示される。
Figure 2022501902
length:長さ情報;
roi_num:含まれる関心領域の数;
(roi_pos_x,roi_pos_y):スライスグループ(Slice Group)又はタイルTileにおける関心領域の座標情報;
roi_width:関心領域の幅;
roi_height:関心領域の高さ;
roi_quality:関心領域品質情報;
relation_type:関心領域の関連関係であり、0は接合、1は入れ子、2は融合である;
(roi_new_pos_x,roi_new_pos_y):新画像における関心領域の座標情報;
scale:関心領域のズーム率;
rotation:関心領域の回転角度;
flip:関心領域の反転であり、0は水平反転、1は垂直反転である;
alpha_flag:透明チャンネル識別子であり、0は透明チャンネル情報無し、1は透明チャンネル情報有りである;
alpha_info():透明チャンネル情報と関心領域とを組み合わせて新たな画像を生成する;
filter_info():relation_typeが融合方式である場合、融合領域のフィルタリング方式、例えば平均値、中央値等を指すことができる。
メディアストリームに含まれるビデオストリームは、ビデオ画像データを含む。該ビデオストリームを生成するプロセスは、該ビデオ画像の関心領域を取得し、同一画像フレーム中の各関心領域の関連画像を少なくとも1つのスライス単位に画定して独立符号化を行い、該ビデオ画像の第1ビデオストリームを生成するステップを含む。
図13に示すように、ビデオ画像の第1フレーム画像を取得し、該第1フレーム画像中の各ROIの関連画像を決定し、該ビデオ画像に2つのROIが存在し、それぞれROI131及びROI132であり、且つ該第1フレーム画像にROI131の関連画像A1、及びROI132の関連画像B1が存在するとする場合、ROI131の関連画像A1を少なくとも1つのスライス単位に画定して独立符号化を行うとともに、ROI132の関連画像B1を少なくとも1つのスライス単位に画定して独立符号化を行い、又は、関連画像A1及び関連画像B1の両方を少なくとも1つのスライス単位に画定して独立符号化を行い、該ビデオ画像のすべての画像フレームの符号化が完了するまで、該ビデオ画像のほかのすべてのフレームに対して、シリアル又はパラレルの方式で、第1フレーム画像と同様なステップを実行し、該第1ビデオストリームを生成する。
例えば、関連画像A1を1つのスライス単位a11として画定して独立符号化を行い、関連画像B1を2つのスライス単位として画定し、それぞれb11及びb12として独立符号化を行う。
ビデオ画像におけるROI関連画像を除くその他の領域133に対して、従来の任意の符号化方式を用いて符号化を行うことができ、独立符号化であってもよく、非独立符号化であってもよい。最終的に生成される第1ビデオストリームは、少なくとも各ROIのすべての独立符号化されたスライス単位を含む。受信側は、ユーザーがROI画像のみを視聴する必要が存在する場合、第1ビデオストリームにおけるROIに対応するスライス単位のみを抽出すればよく(すべてのスライス単位を抽出する必要がない)、該スライス単位を独立復号し、その他のスライスに依存せずに復号を実現でき、受信側の復号性能の要件を低下させる。
必要に応じて、さらにビデオ画像におけるROI関連画像のみを符号化し、関連画像を除くその他の領域を符号化処理するようにしてもよく、又は関連画像とその他の領域を単独に符号化するようにしてもよい。
スライス単位はH.264/AVC規格のスライスSlice、H.265/HEVC規格のタイルTile等を含む。
メディアストリームにおけるビデオストリームは、第2ビデオストリームであってもよく、該第2ビデオストリームを生成するプロセスは、各関連画像を合成指示情報に応じて合成したものを処理すべき画像フレームとし、処理すべき画像フレームを少なくとも1つのスライス単位に画定して符号化を行い、関心領域の第2ビデオストリームを生成する。
図14に示すように、第1ビデオストリームとの相違点として、第2ビデオストリームは、ビデオ画像の同一画像フレーム中のROI(図14では、ROI141及びROI142を含む)の関連画像であり(それぞれC1及びD1である)、まず、合成指示情報に応じて合成し、ここで接合合成と仮定し、さらに合成後の画像を処理すべき画像フレームE1とし、その後、該処理すべき画像フレームE1を少なくとも1つのスライス単位(例えばe11)に画定して符号化を行い、ここで、符号化方式として、独立符号化を採用してもよく、非独立符号化を採用してもよく、又はその他の符号化方式を採用してもよい。該ビデオ画像におけるその他の画像フレームに対して上記方式を用いて処理を行ってもよく、各画像フレームはパラレル又はシリアルの方式で処理できる。それにより該第2ビデオストリームを生成する。
復号側では、第2ビデオストリームに対して、よく使用される復号方式で処理を行うことができ、復号後、ROI関連画像を合併処理せずに、合成後のROI画像を直接得ることができ、このような符号化方式は復号側の処理負荷の低下、復号効率の向上に有利である。しかし、符号化を行う際に、まず合成処理を行う必要がある。
本発明のその他の例では、ネットワーク側又は符号化側は同一ビデオ画像に対して、上記2種のビデオストリームを生成することができる。
生成されるメディアストリームは、記憶されてもよく、対応するターゲットノードに送信されてもよい。例えば、ターゲットノードからのビデオ画像の取得要求を受信すると、該メディアストリームを該ターゲットノードに送信することをトリガーする。オプションとして、取得要求から取得コンテンツを指示する識別情報を解析し、該識別情報に応じて該メディアストリームをターゲットノードに送信する。
オプションとして、識別情報が第1識別子である場合、第1ビデオストリーム及び記述データをターゲットノードに送信し、例えば、サーバ側は、端末からのビデオ画像の要求を受信し、該要求に応じて該ビデオ画像のメディアストリーム(第1ビデオストリーム及び記述データを含む)を端末に送信する。端末は、該メディアストリームを復号して該ビデオ画像を完全に再生することができる。勿論、端末はさらに、該メディアストリームを復号し、関心領域が位置する独立符号化可能なスライス単位データを抽出し、記述データと組み合わせて、該関心領域画像を再生表示することができる。
識別情報が第2識別子である場合、第1ビデオストリームにおける関心領域のスライス単位(復号操作をしない)及び前記記述データを抽出し、ターゲットノードに送信し、例えば、サーバ側は端末からの関心領域の要求を受信し、サーバ側は要求情報に応じて対応する関心領域が位置する独立符号化可能なスライス単位データを見つけ、抽出後、関心領域の関連情報(合成指示情報及び特徴情報等)又は変更後の関心領域情報と組み合わせて、新たなコードストリームを生成して端末に送信する。すべてのコードストリームを端末に送信することを回避し、ネットワークの帯域幅占有及び伝送遅延を低下させる。
識別情報が第3識別子である場合、第2ビデオストリーム及び前記記述データをターゲットノードに送信する。例えば、サーバはさらに端末が送信する要求に応じて、該ビデオ画像の第2ビデオストリーム及び記述データを端末に送信することを選択してもよく、端末はそれを復号した後、合成済みのROI画像を直接得ることができ、記述データ中の合成指示情報に応じてROIを合成処理する必要がなく、端末のリソース占有の低下、端末の処理効率の向上に有利である。
本発明のその他の例では、ビデオ画像は360度パノラマビデオ、立体ビデオ等であってもよい。ビデオ画像が立体ビデオである場合、ROIの関連情報(合成指示情報及び特徴情報等を含む)は左右視野に同時に適用できる。
本発明の実施例に係る画像処理方法は、ビデオ画像におけるROI画像の合成表示を指示するための合成指示情報をビデオ画像のコードストリームに書き込むことによって、ビデオ画像に複数のROIが存在する場合における符号化プロセスを実現し、ユーザーが複数のROI画像を同時に視聴する視聴ニーズを満たす。
ROI画像を独立符号化することによって、復号側が独立復号を行い、その他のスライスに依存せずに復号を実現でき、メディアストリーム送信方式として、ROIが位置する独立復号可能なスライス単位データを抽出して端末に送信することを選択でき、すべてのスライスデータを端末に送信する必要がなく、従って、ネットワークの帯域幅占有の低下、伝送効率及び復号効率の向上に有利である。
(実施例2)
本発明の実施例は、実施例1をもとに、画像処理方法を提供し、主に端末、デコーダー等に適用され、携帯電話、パーソナルコンピュータ等を含むが、これらに限定されない。図15に示すように、該画像処理方法は以下のステップS151〜S153を含む。
S151、ビデオ画像のビデオストリーム及び記述データを受信する。
S152、記述データを解析して関心領域の合成指示情報を得る。
記述データの異なるタイプ、即ち、ROI関連情報が配置される異なる位置、例えばSEI、VUI、MPD等に応じて、関心領域情報の合成指示情報を抽出する。そのうち、合成指示情報の記述は実施例1を参照でき、ここでは詳細説明をしない。オプションとして、さらに記述データから、位置情報及び符号化品質指示情報等を含むROIの特徴情報を取得してもよい。
上記ROIの関連情報に応じて、ROI画像データ、即ちビデオストリームデータを取得する。
S153、合成指示情報に応じてビデオストリームにおける関心領域画像の合成再生表示を制御する。
合成指示情報に応じて、ROI画像を合成して再生表示する。
本発明のその他の例では、ビデオ画像のビデオストリーム及び記述データを受信する前に、取得要求をネットワーク側(又は符号化側)に送信するステップをさらに含み、異なるビデオストリームを取得するように、前記取得要求には取得コンテンツを指示する識別情報がさらに設定されてもよい。
例えば、識別情報を第1識別子とする場合、対応するビデオ画像の第1ビデオストリーム及び記述データを取得することを指示することに用いられ、識別情報を第2識別子とする場合、対応するビデオ画像の第1ビデオストリームにおける関心領域のスライス単位及び記述データを取得することを指示することに用いられ、識別情報を第3識別子とする場合、対応するビデオ画像の第2ビデオストリーム及び記述データを取得することを指示することに用いられる。
取得要求が異なる場合、受信したネットワーク側が送信するメディアストリームは異なり、後続の処理プロセスもその分異なる。例えば、取得要求では識別情報が第1識別子である場合、対応するビデオ画像の第1ビデオストリーム及び記述データを取得し、このとき、第1ビデオストリーム及び記述データを復号し、該ビデオ画像の完全画像を得るようにしてもよく、該完全画像を再生するようにしてもよい。又は、第1ビデオストリームにおけるROI画像の独立符号化可能なスライス単位データを抽出し、記述データ中のROI合成指示情報に応じて、該ROI画像を合成した後、再生表示する。
取得要求では識別情報が第2識別子である場合、対応するビデオ画像のROIが位置する独立復号可能なスライス単位及び記述データを取得し、このとき、端末は該ROIの独立復号可能なスライス単位を直接復号操作し、記述データ中の合成指示情報に応じて該ROI画像を合成した後、再生表示するようにしてもよい。
取得要求では識別情報が第3識別子である場合、対応するビデオ画像の第2ビデオストリーム及び記述データを取得し、このとき、端末は公知の復号方式を直接採用して復号し、合成後のROI画像を得て、その後、再生表示するようにしてもよい。
理解できるように、取得要求は取得コンテンツを指示するための識別情報を含むことに限定されず、例えば、本側及び相手側のアドレス情報、要求される取得対象のビデオ画像の識別情報、検証情報等のその他の必要な情報を含む。
(実施例3)
本発明の実施例は、実施例1及び/又は実施例2をもとに、画像処理方法を提供し、主にネットワーク側及び端末側を含むシステムに適用され、図16に示すように、該画像処理方法は主に以下のステップS161〜S166を含む。
S161、ネットワーク側はビデオ画像における各関心領域の合成表示方式を指示するための合成指示情報を取得する。
S162、ネットワーク側は合成指示情報に基づいてビデオ画像のメディアストリームを生成する。
S163、ネットワーク側はメディアストリームをターゲットノードに送信する。
S164、ターゲットノードはメディアストリームを受信する。
S165、ターゲットノードはメディアストリームを解析して関心領域の合成指示情報を得る。
S166、ターゲットノードは合成指示情報に応じてメディアストリームにおけるビデオストリームの再生表示を制御する。
具体的には、実施例1及び/又は実施例2の関連説明を参照でき、ここでは詳細説明をしない。
なお、理解できるように、ネットワーク側により生成されるメディアストリームとネットワーク側からターゲットノードに送信されるメディアストリームとは同じであってもよく、異なってもよい。実施例1及び/又は実施例2に記載されるように、ネットワーク側はターゲットノードの取得要求に応じて、特定のビデオストリームではなく、ターゲットノードに送信されるビデオストリームを柔軟に選択できる。従って、区別の便宜上、ネットワーク側により生成されるメディアストリームを第1メディアストリーム、ターゲットノードに送信されるメディアストリームを第2メディアストリームとすることができる。
(実施例4)
本発明の実施例は、実施例1をもとに、実施例1に記載の画像処理方法のステップを実現することに用いられる画像処理装置を提供する。図17に示すように、該画像処理装置は、
ビデオ画像における各前記関心領域の合成表示方式を指示するための合成指示情報を取得することに用いられる取得モジュール171と、合成指示情報に基づいてビデオ画像のメディアストリームを生成することに用いられる処理モジュール172と、を含む。画像処理方法の具体的なステップは実施例1の説明を参照でき、ここでは詳細説明をしない。
(実施例5)
本発明の実施例は、実施例2をもとに、実施例2に記載の画像処理方法のステップを実現することに用いられる画像処理装置を提供する。図18に示すように、該画像処理装置は、
ビデオ画像のビデオストリーム及び記述データを受信することに用いられる受信モジュール181と、
記述データを解析して関心領域の合成指示情報を得ることに用いられる解析モジュール182と、
合成指示情報に応じてビデオストリームにおける関心領域画像の再生表示を制御することに用いられる制御モジュール183と、を含む。
画像処理方法の具体的なステップは実施例2の説明を参照でき、ここでは詳細説明をしない。
(実施例6)
本発明の実施例は、実施例3をもとに、画像処理システムを提供し、図19に示すように、実施例4に記載の画像処理装置191及び実施例5に記載の画像処理装置192を含む。該画像処理システムは実施例3に記載の画像処理方法を実現することに用いられる。
画像処理方法の具体的なステップは実施例3の説明を参照でき、ここでは詳細説明をしない。
(実施例7)
本発明の実施例は、実施例1をもとに、ネットワーク機器を提供し、図20に示すように、第1プロセッサ201、第1メモリ202及び第1通信バス203を含み、
第1通信バス203は第1プロセッサ201と第1メモリ202との接続通信を実現することに用いられ、
前記第1プロセッサ201は、第1メモリ202に記憶されている1つ又は複数のコンピュータプログラムを実行して、実施例1に記載の画像処理方法のステップを実現することに用いられる。具体的には、実施例1の説明を参照でき、ここでは詳細説明をしない。
(実施例8)
本発明の実施例は、実施例2をもとに、端末を提供し、図21に示すように、第2プロセッサ211、第2メモリ212及び第2通信バス213を含み、
そのうち、第2通信バス213は第2プロセッサ211と第2メモリ212との接続通信を実現することに用いられ、
前記第2プロセッサ211は、第2メモリ212に記憶されている1つ又は複数のコンピュータプログラムを実行して、実施例2に記載の画像処理方法のステップを実現することに用いられる。具体的には、実施例2の説明を参照でき、ここでは詳細説明をしない。
(実施例9)
本発明の実施例は、実施例1、2をもとに、記憶媒体を提供し、該記憶媒体はコンピュータ読み取り可能な記憶媒体であってもよく、1つ又は複数のコンピュータプログラムが記憶されており、前記1つ又は複数のコンピュータプログラムが1つ又は複数のプロセッサにより実行されると、実施例1又は実施例2に記載の画像処理方法のステップを実現する。
具体的には、実施例1、2の説明を参照でき、ここでは詳細説明をしない。
該記憶媒体は、情報(例えば、コンピュータ読み取り可能な命令、データ構造、コンピュータプログラムモジュール又はその他のデータ)を記憶するための任意の方法又は技術において実施される揮発性又は不揮発性、取り外し可能又は取り外し不可能な媒体を含む。記憶媒体は、RAM(Random Access Memory、ランダムアクセスメモリ)、ROM(Read-Only Memory、読み出し専用メモリ)、EEPROM(Electrically Erasable Programmable read only memory、電気的消去可能プログラマブル読み出し専用メモリ)、フラッシュメモリ又はその他のメモリ技術、CD−ROM(Compact Disc Read-Only Memory、コンパクトディスク読み出し専用メモリ)、デジタル多用途ディスク(DVD)又はその他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶又はその他の磁気記憶装置、又は所望の情報を記憶でき且つコンピュータによりアクセス可能な任意のその他の媒体を含むが、これらに限定されない。
本実施例はコンピュータプログラム(又は、コンピュータソフトウェアという)をさらに提供し、該コンピュータプログラムはコンピュータ読み取り可能な媒体に分布してもよく、コンピューティング装置により実行されると、上記実施例1及び/又は実施例2における画像処理方法の少なくとも1つのステップを実現し、場合によっては、上記実施例に記載される順序で、示される又は説明される少なくとも1つのステップを実行できる。
本実施例はコンピュータプログラム製品をさらに提供し、コンピュータ読み取り可能な装置を含み、該コンピュータ読み取り可能な装置に上記コンピュータプログラムが記憶されている。本実施例では、該コンピュータ読み取り可能な装置は上記コンピュータ読み取り可能な記憶媒体を含んでもよい。
本発明の有益な効果について、
本発明の実施例に係る画像処理方法、装置、システム、ネットワーク機器、端末及び記憶媒体は、ビデオ画像における関心領域間の合成表示方式を指示するための合成指示情報を取得し、前記合成指示情報に基づいて前記ビデオ画像のメディアストリームを生成し、即ち、該合成指示情報をビデオ画像のコードストリームに書き込むことによって、複数(少なくとも2つ)のROIが存在する場合におけるビデオ画像の符号化プロセスを実現し、ビデオ再生時、該合成指示情報に基づいて各ROIの合成表示再生を制御することによって、ユーザーが複数のROIを同時に視聴するニーズを満たすことができ、いくつかの実施プロセスでは、上記技術効果を実現できるが、これらに限定されない。
以上からわかるように、当業者は、以上開示されている方法のすべて又はいくつかのステップ、システム、装置の機能モジュール/ユニットがソフトウェア(コンピューティング装置により実行可能なコンピュータプログラムコードで実現できる)、ファームウェア、ハードウェア及びこれらの適切な組み合わせとして実施できると理解できる。ハードウェア実施形態では、以上説明される機能モジュール/ユニットの画定は必ずしも物理要素の画定に対応せず、例えば、1つの物理要素は複数の機能を有してもよく、又は1つの機能又はステップは複数の物理要素により連携して実行されてもよい。いくつかの物理要素又はすべての物理要素は、例えば、中央処理装置、デジタル信号プロセッサ又はマイクロプロセッサのようなプロセッサにより実行されるソフトウェアとして実施されもよく、又はハードウェアとして実施されてもよく、又は例えば特定用途向け集積回路のような集積回路として実施されてもよい。
また、当業者が周知するように、通信媒体は通常、コンピュータ読み取り可能な命令、データ構造、コンピュータプログラムモジュール、又は例えばキャリアやその他の伝送メカニズムのような変調データ信号中のその他のデータを含み、任意の情報配信媒体を含んでもよい。従って、本発明は任意の特定のハードウェアとソフトウェアとの組み合わせに限定されない。
以上、具体的な実施形態を参照しながら本発明の実施例をさらに詳細に説明したが、本発明の具体的な実施はこれらの説明に限定されるものではないと理解すべきである。当業者が本発明の構想を逸脱せずに種々の簡単な派生や置換を行うことができ、これらはすべて本発明の保護範囲に属するとみなすべきである。
本発明の実施例は、1つ又は複数のプロセッサにより実行されると、前記画像処理方法のステップを実現する1つ又は複数のプログラムをさらに提供する。

Claims (21)

  1. 画像処理方法であって、
    ビデオ画像における関心領域間の合成表示方式を指示するための合成指示情報を取得するステップと、
    前記合成指示情報に基づいて前記ビデオ画像のメディアストリームを生成するステップと、を含むことを特徴とする画像処理方法。
  2. 各前記関心領域の特徴情報を取得するステップをさらに含み、
    前記合成指示情報に基づいて前記ビデオ画像のメディアストリームを生成する前記ステップは、前記合成指示情報及び前記特徴情報に基づいて、前記ビデオ画像のメディアストリームを生成するステップを含むことを特徴とする請求項1に記載の画像処理方法。
  3. 前記合成指示情報は、前記関心領域を接合表示することを指示するための第1指示情報、前記関心領域を融合表示することを指示するための第2指示情報、前記関心領域を入れ子表示することを指示するための第3指示情報、前記関心領域をズーム表示することを指示するための第4指示情報、前記関心領域を回転表示することを指示するための第5指示情報、及び前記関心領域を切り取り表示することを指示するための第6指示情報のうちの少なくとも1種を含むことを特徴とする請求項1に記載の画像処理方法。
  4. 前記特徴情報は位置情報及び/又は符号化品質指示情報を含み、前記位置情報は前記関心領域の特定位置の座標情報、及び前記関心領域の長さ値と幅値を含むことを特徴とする請求項2に記載の画像処理方法。
  5. 前記メディアストリームは記述データを含み、前記合成指示情報及び前記特徴情報に基づいて、前記ビデオ画像のメディアストリームを生成する前記ステップは、
    前記合成指示情報及び前記特徴情報を前記記述データに書き込んで前記メディアストリームを生成するステップを含むことを特徴とする請求項2に記載の画像処理方法。
  6. 前記記述データは、付加拡張情報、ビデオユーザビリティ情報、システム層メディア属性記述単位のうちの少なくとも1種を含むことを特徴とする請求項5に記載の画像処理方法。
  7. 前記メディアストリームはビデオストリームをさらに含み、前記画像処理方法は、
    前記ビデオ画像の前記関心領域を取得し、同一画像フレーム中の各前記関心領域の関連画像を少なくとも1つのスライス単位に画定して独立符号化を行い、前記ビデオ画像の第1ビデオストリームを生成するステップをさらに含むことを特徴とする請求項5に記載の画像処理方法。
  8. 各前記関連画像を前記合成指示情報に応じて合成したものを処理すべき画像フレームとし、前記処理すべき画像フレームを少なくとも1つのスライス単位に画定して符号化を行い、前記関心領域の第2ビデオストリームを生成するステップをさらに含むことを特徴とする請求項7に記載の画像処理方法。
  9. メディアストリームを記憶する、又はターゲットノードに送信するステップをさらに含むことを特徴とする請求項8に記載の画像処理方法。
  10. 前記メディアストリームをターゲットノードに送信する前記ステップの前に、前記ターゲットノードからの前記ビデオ画像の取得要求を受信するステップをさらに含むことを特徴とする請求項9に記載の画像処理方法。
  11. 前記メディアストリームをターゲットノードに送信する前記ステップは、前記取得要求から取得コンテンツを指示する識別情報を解析し、前記識別情報に応じて前記メディアストリームを前記ターゲットノードに送信するステップを含むことを特徴とする請求項10に記載の画像処理方法。
  12. 前記識別情報に応じて前記メディアストリームを前記ターゲットノードに送信する前記ステップは、
    前記識別情報が第1識別子である場合、前記第1ビデオストリーム及び前記記述データを前記ターゲットノードに送信するステップと、
    前記識別情報が第2識別子である場合、前記第1ビデオストリームにおける関心領域のスライス単位及び前記記述データを抽出し、前記ターゲットノードに送信するステップと、
    前記識別情報が第3識別子である場合、前記第2ビデオストリーム及び前記記述データを前記ターゲットノードに送信するステップと、を含むことを特徴とする請求項11に記載の画像処理方法。
  13. 前記ビデオ画像はパノラマビデオ画像であることを特徴とする請求項1−12のいずれか一項に記載の画像処理方法。
  14. 画像処理方法であって、
    ビデオ画像のビデオストリーム及び記述データを受信するステップと、
    前記記述データを解析して関心領域の合成指示情報を得るステップと、
    前記合成指示情報に応じて、前記ビデオストリームにおける関心領域画像の合成再生表示を制御するステップと、を含むことを特徴とする画像処理方法。
  15. 画像処理方法であって、
    ネットワーク側はビデオ画像における各前記関心領域の合成表示方式を指示するための合成指示情報を取得し、前記合成指示情報に基づいて前記ビデオ画像のメディアストリームを生成し、メディアストリームをターゲットノードに送信するステップと、
    前記ターゲットノードは前記メディアストリームを受信し、前記メディアストリームを解析して関心領域の合成指示情報を得て、前記合成指示情報に応じて前記メディアストリームにおけるビデオストリームの再生表示を制御するステップと、を含むことを特徴とする画像処理方法。
  16. 画像処理装置であって、
    ビデオ画像における各前記関心領域の合成表示方式を指示するための合成指示情報を取得することに用いられる取得モジュールと、
    前記合成指示情報に基づいて前記ビデオ画像のメディアストリームを生成することに用いられる処理モジュールと、を含むことを特徴とする画像処理装置。
  17. 画像処理装置であって、
    ビデオ画像のビデオストリーム及び記述データを受信することに用いられる受信モジュールと、
    前記記述データを解析して関心領域の合成指示情報を得ることに用いられる解析モジュールと、
    前記合成指示情報に応じて、前記ビデオストリームにおける関心領域画像の合成再生表示を制御することに用いられる制御モジュールと、を含むことを特徴とする画像処理装置。
  18. 請求項16に記載の画像処理装置及び請求項17に記載の画像処理装置を含むことを特徴とする画像処理システム。
  19. ネットワーク機器であって、第1プロセッサ、第1メモリ及び第1通信バスを含み、
    前記第1通信バスは第1プロセッサと第1メモリとの接続通信を実現することに用いられ、
    前記第1プロセッサは、第1メモリに記憶されている1つ又は複数のコンピュータプログラムを実行して、請求項1〜13のいずれか1項に記載の画像処理方法のステップを実現することに用いられることを特徴とするネットワーク機器。
  20. 端末であって、第2プロセッサ、第2メモリ及び第2通信バスを含み、
    前記第2通信バスは第2プロセッサと第2メモリとの接続通信を実現することに用いられ、
    前記第2プロセッサは第2メモリに記憶されている1つ又は複数のコンピュータプログラムを実行して、請求項14に記載の画像処理方法のステップを実現することに用いられることを特徴とする端末。
  21. 記憶媒体であって、1つ又は複数のプロセッサにより実行されると、請求項1〜13のいずれか1項、又は請求項14に記載の画像処理方法のステップを実現する1つ又は複数のコンピュータプログラムが記憶されていることを特徴とする記憶媒体。
JP2021515166A 2018-09-19 2019-07-23 画像処理方法、装置、システム、ネットワーク機器、端末及びコンピュータプログラム Active JP7425788B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201811095593.9 2018-09-19
CN201811095593.9A CN110933461B (zh) 2018-09-19 2018-09-19 图像处理方法、装置、系统、网络设备、终端及存储介质
PCT/CN2019/097355 WO2020057249A1 (zh) 2018-09-19 2019-07-23 图像处理方法、装置、系统、网络设备、终端及存储介质

Publications (2)

Publication Number Publication Date
JP2022501902A true JP2022501902A (ja) 2022-01-06
JP7425788B2 JP7425788B2 (ja) 2024-01-31

Family

ID=69856069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021515166A Active JP7425788B2 (ja) 2018-09-19 2019-07-23 画像処理方法、装置、システム、ネットワーク機器、端末及びコンピュータプログラム

Country Status (6)

Country Link
US (1) US20220053127A1 (ja)
EP (1) EP3855750A4 (ja)
JP (1) JP7425788B2 (ja)
KR (1) KR102649812B1 (ja)
CN (2) CN110933461B (ja)
WO (1) WO2020057249A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113965749A (zh) * 2020-12-14 2022-01-21 深圳市云数链科技有限公司 静态摄像机视频传输方法及系统
CN113206853B (zh) * 2021-05-08 2022-07-29 杭州当虹科技股份有限公司 一种视频批改结果保存改进方法
CN113573059B (zh) * 2021-09-23 2022-03-01 中兴通讯股份有限公司 图像显示方法、装置、存储介质及电子装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000165641A (ja) 1998-11-24 2000-06-16 Matsushita Electric Ind Co Ltd 画像処理方法,画像処理装置およびデータ記憶媒体
JP2006352539A (ja) * 2005-06-16 2006-12-28 Sharp Corp 広視野映像システム
KR101255226B1 (ko) 2005-09-26 2013-04-16 한국과학기술원 스케일러블 비디오 코딩에서 다중 roi 설정, 복원을위한 장치 및 방법
US9691098B2 (en) * 2006-07-07 2017-06-27 Joseph R. Dollens Method and system for managing and displaying product images with cloud computing
CN1889686A (zh) * 2006-07-14 2007-01-03 北京时越网络技术有限公司 一种同时显示多路视频信息的方法
JP5194679B2 (ja) * 2007-09-26 2013-05-08 日産自動車株式会社 車両用周辺監視装置および映像表示方法
KR101176065B1 (ko) * 2008-12-22 2012-08-24 한국전자통신연구원 스테레오스코픽 영상에 관한 데이터를 전송하는 방법, 스테레오스코픽 영상을 재생하는 방법, 및 스테레오스코픽 영상 데이터의 파일 생성 방법
CN101521745B (zh) * 2009-04-14 2011-04-13 王广生 一组多镜头光心重合式全方位摄像装置及全景摄像、转播的方法
US20120140067A1 (en) * 2010-12-07 2012-06-07 Scott Crossen High Definition Imaging Over Legacy Surveillance and Lower Bandwidth Systems
JP5870835B2 (ja) 2012-04-27 2016-03-01 富士通株式会社 動画像処理装置、動画像処理方法および動画像処理プログラム
US9827487B2 (en) * 2012-05-14 2017-11-28 Sphero, Inc. Interactive augmented reality using a self-propelled device
US9497405B2 (en) * 2012-07-17 2016-11-15 Nec Display Solutions, Ltd. Display device for displaying videos side by side without overlapping each other and method for the same
JP6141084B2 (ja) * 2013-04-19 2017-06-07 キヤノン株式会社 撮像装置
US10397666B2 (en) 2014-06-27 2019-08-27 Koninklijke Kpn N.V. Determining a region of interest on the basis of a HEVC-tiled video stream
JP2016048839A (ja) 2014-08-27 2016-04-07 株式会社小糸製作所 電子制御ユニットおよび車両用映像システム
CN105578204B (zh) * 2014-10-14 2020-10-30 海信视像科技股份有限公司 一种多视频数据显示的方法及装置
CN106331732B (zh) * 2016-09-26 2019-11-12 北京疯景科技有限公司 生成、展现全景内容的方法及装置
CN108322727A (zh) * 2018-02-28 2018-07-24 北京搜狐新媒体信息技术有限公司 一种全景视频传输方法及装置

Also Published As

Publication number Publication date
KR102649812B1 (ko) 2024-03-21
US20220053127A1 (en) 2022-02-17
EP3855750A4 (en) 2021-10-20
JP7425788B2 (ja) 2024-01-31
CN115883882A (zh) 2023-03-31
CN110933461B (zh) 2022-12-30
EP3855750A1 (en) 2021-07-28
WO2020057249A1 (zh) 2020-03-26
CN110933461A (zh) 2020-03-27
KR20210059759A (ko) 2021-05-25

Similar Documents

Publication Publication Date Title
US10880535B2 (en) Method for transmitting 360 video, method for receiving 360 video, apparatus for transmitting 360 video, and apparatus for receiving 360 video
JP7399224B2 (ja) メディアコンテンツを送信するための方法、装置及びコンピュータプログラム
CN109983500B (zh) 重新投影全景视频图片的平板投影以通过应用进行渲染
US11917221B2 (en) Encoding device and method, reproduction device and method, and program
CN108271044B (zh) 一种信息的处理方法及装置
US20190373245A1 (en) 360 video transmission method, 360 video reception method, 360 video transmission device, and 360 video reception device
CN108965929B (zh) 一种视频信息的呈现方法、呈现视频信息的客户端和装置
KR20190094451A (ko) 360 비디오 시스템에서 오버레이 처리 방법 및 그 장치
US20200389640A1 (en) Method and device for transmitting 360-degree video by using metadata related to hotspot and roi
CN110100435B (zh) 生成装置、识别信息生成方法、再现装置和图像再现方法
US10757463B2 (en) Information processing apparatus and information processing method
US20180176650A1 (en) Information processing apparatus and information processing method
US10873737B1 (en) VR device and control method for the same
JP7425788B2 (ja) 画像処理方法、装置、システム、ネットワーク機器、端末及びコンピュータプログラム
US11979544B2 (en) 360 video transmission method, 360 video reception method, 360 video transmission apparatus, and 360 video reception apparatus
CA3018600C (en) Method, apparatus and stream of formatting an immersive video for legacy and immersive rendering devices
WO2019007120A1 (zh) 一种媒体数据的处理方法和装置
TW201841499A (zh) 用於軌道合成的方法以及裝置
US20220217314A1 (en) Method for transmitting 360 video, method for receiving 360 video, 360 video transmitting device, and 360 video receiving device
Seo et al. Bandwidth-Efficient Transmission Method for User View-Oriented Video Services
CN108271084B (zh) 一种信息的处理方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210322

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240119

R150 Certificate of patent or registration of utility model

Ref document number: 7425788

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150