JP2017135464A - 映像送信装置、映像送信システム、映像送信方法、及びプログラム - Google Patents

映像送信装置、映像送信システム、映像送信方法、及びプログラム Download PDF

Info

Publication number
JP2017135464A
JP2017135464A JP2016011712A JP2016011712A JP2017135464A JP 2017135464 A JP2017135464 A JP 2017135464A JP 2016011712 A JP2016011712 A JP 2016011712A JP 2016011712 A JP2016011712 A JP 2016011712A JP 2017135464 A JP2017135464 A JP 2017135464A
Authority
JP
Japan
Prior art keywords
viewpoint
video
video data
group
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016011712A
Other languages
English (en)
Inventor
駿 杉本
Shun Sugimoto
駿 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2016011712A priority Critical patent/JP2017135464A/ja
Publication of JP2017135464A publication Critical patent/JP2017135464A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】頻繁に視点の切り替えが行われたとしても、送信するデータ量の増大を抑制できる装置、システム、方法及びプログラムを提供する。【解決手段】自由視点映像配信システム100のサーバ装置118は、映像データを受ける端末装置に対応する視点を示す視点情報を取得し、複数の視点でそれぞれ撮像された複数の映像データからなる映像群を、任意の視点を基準視点としたフレーム内予測、フレーム間予測、及び視点間予測により符号化する符号化手段114、115、116からフレーム内予測符号化した映像データの取得が行われる周期で、視点情報に基づいて端末装置に送信する映像データを決定し、決定された映像データを符号化手段114、115、116から取得し端末装置に送信する。【選択図】図1

Description

本発明は、映像送信装置、映像送信システム、映像送信方法、及びプログラムに関する。
複数の視点カメラで撮像された映像を、個々の視点映像を独立して符号化するのではなく、周辺視点との相関を利用して符号化する技術としてMVC(Multi View Coding)が知られている。MVCでは、複数の視点映像が1個のベースビュー(基準視点)と1個以上の非ベースビューとして符号化される。ベースビューは、1個の視点内で独立して映像が符号化される。非ベースビューは、ベースビュー又は非ベースビューを含めたその他のビューを参照し、ビュー間予測により映像が符号化される。
また、複数の視点映像の中から見たい視点映像をユーザが自由に選択して視聴することができる自由視点映像が利用されてきている。また、ネットワーク経由でリアルタイムに映像等を伝送するプロトコルであるRTP(A Transport Protocol for Real-Time Application, RFC 3550, IETF)が知られている。
自由視点映像の符号化データをRTP等によりネットワーク経由で伝送する場合、すべての視点映像の符号化データを送信すると送信データ量が大きくなってしまう。そこで、ユーザが見たい視点映像を復号化できる最低限の符号化データを生成又は送信する技術が提案されている。例えば、多視点ビデオストリームを提供するシステムにおいて、ユーザが所望する視点映像を基本設定映像として設定し、動的に符号化ビューを変更することで自由視点映像システムを効率化する技術が提案されている(特許文献1参照)。
特表2009−512270号公報
しかしながら、特許文献1に記載の方法では、視点の切り替えを行う度にデータ量の大きいフレーム内予測符号化データを送信しなければならないため、頻繁に視点の切り替えを行うと送信するデータ量が増大してしまう。本発明は、頻繁に視点の切り替えが行われたとしても、送信するデータ量の増大を抑制できるようにすることを目的とする。
本発明に係る映像送信装置は、複数の視点で撮像される視点映像を送信する映像送信装置であって、映像データを受ける端末装置に対応する視点を示す視点情報を取得する取得手段と、複数の視点でそれぞれ撮像された複数の映像データからなる映像群を、任意の視点を基準視点としたフレーム内予測、フレーム間予測、及び視点間予測により符号化する符号化手段からフレーム内予測符号化した映像データの取得が行われる周期で、前記取得手段により取得した前記視点情報に基づいて前記端末装置に送信する映像データを決定する決定手段と、前記決定手段により決定された映像データを前記符号化手段から取得し前記端末装置に送信する送信手段とを有することを特徴とする。
本発明によれば、頻繁に視点の切り替えが行われたとしても、送信するデータ量の増大を抑制することが可能となる。
本発明の実施形態における映像送信システムの構成例を示す図である。 本実施形態における符号化装置の機能構成例を示す図である。 本実施形態における参照マップの例を示す概念図である。 本実施形態におけるサーバ装置の機能構成例を示す図である。 本実施形態における符号化装置及びサーバ装置のハードウェア構成例を示す図である。 本実施形態における視点映像のグループ化の方法を説明する図である。 本実施形態におけるグループ選択処理の例を示すフローチャートである。 本実施形態におけるユーザAの視点切り替え状況の例を示す図である。 本実施形態におけるユーザBの視点切り替え状況の例を示す図である。 本実施形態における取得する映像符号化データを示す図である。 第2の実施形態における視点映像のグループ化の概要を示す図である。 第2の実施形態におけるグループ化処理の例を示すフローチャートである。 第3の実施形態における参照マップの例を示す概念図である。
以下、本発明の実施形態を図面に基づいて説明する。なお、以下に説明する実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
(第1の実施形態)
本発明の第1の実施形態について説明する。スタジアムで行われる競技の映像をスタジアム内に全周で設置された複数のカメラで撮像し、ユーザがネットワーク経由でそれぞれの視点映像を自由に選択しながら視聴することができる自由視点映像配信システムを例に説明する。なお、自由視点映像とは、複数の視点で撮影された映像から作成される。自由視点映像は、ユーザが視点を変更して視聴することが可能な映像である。なお、視点とは、映像が撮影された位置とも言い換えることができる。
図1は、本発明の一実施形態における映像送信システムとしての自由視点映像配信システムの構成例を示す図である。自由視点映像配信システム100は、カメラ101〜113を含む、スタジアム内に全周で設置された複数のカメラで撮像した映像データから自由視点映像を生成する。説明上、図1においては、カメラ101〜113についてのみ番号を付与しているが、その他のカメラもカメラ101〜113と同等の役割及び機能を有する。また、カメラの数に制限はなく、例示したような全周設置でなくてもよい。
符号化装置114〜116は、複数のカメラでそれぞれ撮像された視点映像データが入力され、マルチビュー符号化による圧縮符号化処理を行う。説明上、図1においては、符号化装置114〜116のみ図示しているが、例えば後述するベースビュー(基準視点)として設定する視点数分の符号化装置が存在しているものとする。なお、符号化装置の数に制限はなく、1つの符号化装置が複数のベースビューに対応していてもよい。符号化装置とカメラとの間の映像データ信号の伝送方式としては、例えばSDI(Serial Digital Interface)やIEEE1394、Gigabit Ethernet(登録商標)等の方式が挙げられるが、これらには限定されない。
マルチビュー符号化では、複数の視点映像データが1個のベースビューと1個以上の非ベースビューとして符号化される。ベースビューは、1個の視点内で独立して映像データが符号化され、非ベースビューは、ベースビュー又は非ベースビューを含めたその他のビューを参照してビュー間予測により映像データが符号化される。マルチビュー符号化処理の方式及び原理等の詳細な説明は省略する。また、図1に示す例では、符号化装置114にはカメラ101〜カメラ109の9視点の映像データが入力されるようになっているが、一例であり9個以上でも以下でもよい。
サーバ装置118は、符号化装置114〜116を含む複数の符号化装置で符号化された映像符号化データが入力される。図1においては、符号化装置で符号化された映像符号化データが中継装置117を経由してサーバ装置118に入力されるようにしているが、中継装置117はなくてもよい。符号化装置とサーバ装置との間の映像符号化データ信号の伝送方式には、符号化装置とカメラとの間と同様に制限はない。
また、サーバ装置118は、外部ネットワーク119と接続されており、ユーザの端末装置に対して外部ネットワーク119経由で自由視点映像を提供する。その際に、ユーザの端末装置は、HTTP(Hypertext Transfer Protocol)やRTSP(Real Time Streaming Protocol)等の通信プロトコルを用いてサーバ装置118にアクセスする。サーバ装置118は、自由視点映像をユーザの端末装置に送信する際にRTP(Real-time Transport Protocol)やHTTP等の通信プロトコルを用いる。使用する通信プロトコルはこれら以外でもよいし、独自の通信プロトコルであってもよい。また、外部ネットワーク119は、例えばインターネットやLAN(Local Area Network)等のネットワークが挙げられるが、これらには限定されない。
図2は、本実施形態における符号化装置の機能構成例を示すブロック図である。図2においては、カメラ101〜109と通信可能に接続される符号化装置114を一例として示しているが、他の符号化装置の機能構成も同様であり通信可能に接続されるカメラが異なる。
データ入力部201は、カメラ101〜109の9個のカメラから撮像された9視点の映像データを入力する。モード判定部202は、入力される映像データを符号化する符号化モードを判定する。また、モード判定部202は、判定した符号化モードに応じて、入力される映像データをフレーム内予測部203、フレーム間予測部216、及びビュー間予測部217に入力する。符号化モードは、入力される映像データを(1)フレーム内予測で符号化するモード、(2)フレーム間予測で符号化するモード、(3)ビュー間予測(視点間予測)で符号化するモード、及び(4)フレーム間予測とビュー間予測とを併用するモードがある。
フレーム内予測符号化モードは、入力された映像データのうち、ベースビューとなる視点の映像データに対して周期的に発生する。一般的な周期としては0.5秒間隔や1秒間隔が用いられるが、これらの間隔に限らない。また、ベースビューは予め決めておいてもよいし、動的に変更するようにしてもよい。本実施形態では、ベースビューは予め決めておくものとし、符号化装置114においては、カメラ105から入力される視点映像をベースビューとする。
以下に、フレーム内予測符号化モードにおける各機能部の役割について説明する。フレーム内予測部203は、入力された映像データからフレーム内予測信号を生成する。入力された映像データからフレーム内予測信号を減算器204で減算して得られた剰余データがDCT変換部205に入力される。DCT変換部205は、入力された剰余データをDCT(Discrete Cosine Transform、離散コサイン変換)し、量子化部206に入力する。量子化部206は、DCT変換された剰余データを量子化し、エントロピー符号化部207及び逆量子化部211に入力する。
エントロピー符号化部207は、DCT変換及び量子化された入力剰余データをエントロピー符号化(可変長符号化)し、符号化データバッファ208に入力する。符号化データバッファ208は、エントロピー符号化された各視点映像の映像符号化データを保存するバッファである。多重化部209は、符号化データバッファ209から送信すべき映像符号化データを取り出し、取り出した映像符号化データをネットワークに適したサイズ及びフォーマットでパケット化して通信部210に入力する。通信部210は、サーバ装置118と中継器117を経由して通信を行う。また、通信部210は、サーバ装置118から要求されるフレームの符号化データパケットを多重化部209から取得し、サーバ装置118に送信する。
逆量子化部211は、DCT変換及び量子化された入力データを逆量子化し、逆DCT変換部212に入力する。逆DCT変換部212は、逆量子化された入力データを逆DCT変換する。逆DCT変換された入力データは、フレーム内予測部203で生成したフレーム内予測信号と加算器213で加算されI(Intra)フレームに復元され、フィルタ214に入力される。フィルタ214に入力されたIフレームは、デブロッキングフィルタによるブロック歪の除去が施された後、フレームメモリ215に保存される。
次に、フレーム間予測符号化モード、ビュー間予測符号化モード、フレーム間予測とビュー間予測併用モードにおける各機能部の役割について説明する。フレーム間予測符号化モード時には、入力された映像データはフレーム間予測部216に入力され、ビュー間予測符号化モード時には、入力された映像データはビュー間予測部217に入力される。また、フレーム間予測とビュー間予測併用モード時には、入力された映像データは、フレーム間予測部216及びビュー間予測部217の両予測部に入力される。
フレーム間予測部216は、異なる撮像時間の同一視点映像をフレームメモリ215から取得して動き補償を行う。ビュー間予測部217は、異なる視点の同一撮像時間映像をフレームメモリ215から取得して視差補償を行う。フレーム間予測部216及びビュー間予測部217は、生成された予測信号を参照方向制御部218に入力するとともにエントロピー符号化部207に入力する。
参照方向制御部218は、入力された予測信号を減算器204に入力するとともに加算器213に入力する。フレーム内予測符号化モードと同様に、入力された映像データから予測信号を減算器204で減算して得られた剰余データがDCT変換部205に入力される。また、逆DCT変換された剰余データと予測信号が加算器213で加算される。また、参照方向制御部218は、参照方向の情報を用いて参照マップ219を更新する。
図3は、参照マップ219の概念図である。図3において、縦軸は異なる視点カメラを示し、横軸は時間軸を示す。図中の矩形ブロックはフレームを示し、Iはフレーム内予測符号化のみによって符号化したIフレームを示す。Pはフレーム間予測符号化又はビュー間予測符号化の何れか一方向のみの参照によって符号化したPフレームを示す。Bはフレーム間予測符号化及びビュー間予測符号化を併用した二方向の参照によって符号化したBフレームを示す。図中の矢印は符号化時の参照方向を示す。なお、図3に示す符号化の参照方向は一例であり、これらに限らない。本実施形態では、参照マップ219をフレーム単位で構成するようにしているが、スライス単位やマクロブロック単位で構成してもよい。
図3において、破線301で囲まれたカメラ105の視点映像群はベースビューの映像であり、カメラ105の視点映像はその他の視点映像を参照しないで符号化される。また、図3において、破線302で囲まれたカメラ101〜109の視点映像群をGOP(Group Of Pictures)とし、フレーム内予測符号化が発生する周期で生成される。なお、異なるGOP間での参照符号化は発生しないものとする。通信部210は、参照マップ219を利用してサーバ装置118から要求されたフレームの復号化に必要な符号化フレームデータを把握する。
図4は、本実施形態におけるサーバ装置118の機能構成例を示すブロック図である。通信部401は、中継器117経由で符号化装置114、115、・・・を含む符号化装置群408と接続される。また、通信部401は、外部ネットワーク119とも接続される。なお、符号化装置群408と接続する通信部と外部ネットワーク119と接続する通信部が別々であってもよい。
配信要求受信部402は、ユーザの端末装置から外部ネットワーク119経由で自由視点映像の配信要求を受信し、ユーザ情報と視点情報とをユーザ情報バッファ403に入力する。また、配信要求受信部402は、受信した配信要求に従って、符号化データ取得部404に対して映像符号化データを取得すべき符号化装置情報及びユーザ情報を通知する。
符号化データ取得部404は、通知された符号化装置情報及びユーザ情報に基づき符号化装置群408の中の適切な符号化装置に対して視点映像の映像符号化データの取得要求を入力する。取得した視点映像の映像符号化データ及びユーザ情報は、符号化データ送信部405に入力される。符号化データ送信部405は、入力されたユーザ情報に応じて入力された視点映像の映像符号化データを外部ネットワーク119経由でユーザの端末装置に対して送信する。
切り替え要求受信部406は、ユーザの端末装置から外部ネットワーク119経由で視点映像の切り替え要求を受信し、ユーザ情報バッファ403の該当するユーザ情報及び視点情報を必要に応じて更新する。また、ユーザ情報バッファ403におけるユーザ情報及び視点情報の更新は、視点の切り替え要求を受信した場合だけでなく、周期的に挿入されるフレーム内予測符号化処理を実施する場合にも実行される。また、切り替え要求受信部406は、符号化データ取得部404に対して映像符号化データを取得すべき符号化装置情報及びユーザ情報を通知する。
グループ化部407は、システム起動時、又はシステム起動後に周期的に複数の視点映像をグループ化し、ユーザ情報バッファ403にグループ情報を入力又は更新する。また、グループ情報は符号化装置群408に対して通知される。グループ化の方法については後述する。
図5は、本実施形態における符号化装置及びサーバ装置のハードウェア構成の一例を示すブロック図である。本実施形態における符号化装置114は、図5(A)に示すようにCPU501、RAM502、ROM503、記憶装置504、ネットワークインタフェース505、及びカメラインタフェース506を有する。CPU501、RAM502、ROM503、記憶装置504、ネットワークインタフェース505、及びカメラインタフェース506は、システムバス507を介して互いに通信可能に接続されている。
CPU501は、ROM503又は記憶装置504に格納されているプログラムを読み出して実行することで、システムバス507に接続された各構成部を総括的に制御する。例えば、CPU501は、ROM503又は記憶装置504から処理プログラムを読み出して実行することで、後述するような動作処理を実現するための制御を行う。RAM502は、CPU501の主メモリ又はワークエリア等として機能する。記憶装置504は、各種処理を実行するためのプログラムを記憶する。また、記憶装置504は、例えば符号化された各視点映像の映像符号化データを記憶する。ネットワークインタフェース505は外部ネットワーク119経由でサーバ装置118と双方向にデータをやりとりする。カメラインタフェース506は、カメラから撮像された映像データを入力する。
また、本実施形態におけるサーバ装置118は、図5(B)に示すようにCPU511、RAM512、ROM513、記憶装置514、及びネットワークインタフェース515を有する。CPU511、RAM512、ROM513、記憶装置514、及びネットワークインタフェース515は、システムバス516を介して互いに通信可能に接続されている。
CPU511は、ROM513又は記憶装置514に格納されているプログラムを読み出して実行することで、システムバス516に接続された各構成部を総括的に制御する。例えば、CPU511は、ROM513又は記憶装置514から処理プログラムを読み出して実行することで、後述するような動作処理を実現するための制御を行う。RAM512は、CPU511の主メモリ又はワークエリア等として機能する。記憶装置514は、各種処理を実行するためのプログラムを記憶する。また、記憶装置514は、例えばユーザ情報や視点情報やグループ情報を記憶する。ネットワークインタフェース515は外部ネットワーク119経由で符号化装置と双方向にデータをやりとりする。
次に、グループ化部407における複数の視点映像のグループ化の方法を、図6を参照して説明する。図6は、本実施形態における視点映像のグループ化の方法を説明する図である。本実施形態では、一例としてマルチビュー符号化におけるベースビューを2ビュー毎に生成する仕様で説明するが、これに限定されない。また、1つのグループに含まれるビューの数を9個として説明するが、これに限定されない。
カメラ101からカメラ113の各視点映像をそれぞれビュー1からビュー13とする。1つのグループは9個のビューで構成され、端から5番目のビューをベースビューとする。また、グループに含まれるビューの一部が、他のグループに含まれるようにしてグループ化する。図6に示す例において、破線601で囲まれたグループ1は、ビュー1からビュー9までで構成され、ベースビューはビュー5となる。破線602で囲まれたグループ2は、ビュー3からビュー11までで構成され、ベースビューはビュー7となる。また、破線603で囲まれたグループ3は、ビュー5からビュー13までで構成され、ベースビューはビュー9となる。説明上、図6においては、グループ1からグループ3までを図示しているが、2ビュー毎にベースビューを生成する場合、グループは(カメラの数)/2個存在する。符号化装置114はグループ1、符号化装置115はグループ2、符号化装置116はグループ3に対してそれぞれマルチビュー符号化処理を行う。
切り替え要求受信部406における符号化装置の選択処理を、図7のフローチャートを用いて説明する。ステップS701にて、切り替え要求受信部406は、ユーザ情報バッファ403からユーザ情報及び視点情報を取得する。視点情報にはユーザが現在どのグループに所属しているかを示す情報が含まれる。ステップS702にて、切り替え要求受信部406は、次に取得する映像フレームがフレーム内予測符号化された符号化データであるフレーム内予測符号化周期であるか否かを判定する。フレーム内予測符号化周期である場合にはステップS704に移行し、フレーム内予測符号化周期でない場合にはステップS703に移行する。
ステップS703にて、切り替え要求受信部406は、入力された切り替え先の視点がユーザの現在所属しているグループの範囲内であるか否かを判定する。現在所属しているグループの範囲内である場合には、特に所属グループの変更はなくステップS706に移行し、範囲外である場合にはステップS704に移行する。
ステップS704にて、切り替え要求受信部406は、切り替え先の視点から最も近い視点をベースビューとするグループを取得する。例えば、切り替え要求受信部406は、切り替え先の視点をベースビューとするグループがあればそのグループを選択し、切り替え先の視点をベースビューとするグループがなければ切り替え先の視点から最も近い視点をベースビューとするグループを選択する。切り替え先視点とベースビューとの距離が等しいグループが複数存在する場合、何れのグループでも良いが、例えば視点切り替え方向のグループを選択する、としてもよい。
ステップS705にて、切り替え要求受信部406は、ユーザ情報バッファ403内のユーザ情報及び視点情報を選択したグループ情報を基に更新する。このとき、ユーザが現在どのグループに所属しているかを示す情報も更新される。ステップS706にて、切り替え要求受信部406は、ユーザが現在所属しているグループの符号化装置情報を符号化データ取得部405に通知する。
本実施形態では、フレーム内予測符号化周期前に現在所属しているグループの範囲外への視点切り替え要求があった場合、新たなグループへの所属変更を許可する例で説明したが、フレーム内予測符号化周期前のグループ切り替えを許可しないようにしてもよい。その場合、ステップS703において切り替え先の視点がユーザの現在所属しているグループの範囲外であると判定された場合、ステップS704、S705の処理は実施せずに、ステップS706に移行して現在の視点、所属グループを維持させる。その際に、ユーザに視点切り替えができない旨を通知してもよい。
図8及び図9は、視点切り替え及びフレーム内予測符号化周期での所属グループ切り替えの例を示す図である。図8では、ユーザA801が、時刻t(1)においてビュー5から自由視点映像の視聴を開始し、時刻t(n)においてビュー7を視聴している例を示す。図中の矢印はユーザA801の視点切り替えの様子を示す。図8に示すように、時刻t(1)〜t(n)の期間において視点切り替えの範囲がビュー5をベースビューとする破線601で囲まれたグループ1の範囲内を保っているため、フレーム内予測符号化周期前でのグループ切り替えは発生しない。フレーム内予測符号化周期である時刻t(n+1)における視点がビュー7であるため、時刻t(n+1)のタイミングでビュー7をベースビューとする破線602で囲まれたグループ2に切り替わる。
図9では、ユーザB901が、時刻t(1)においてビュー5から自由視点映像の視聴を開始し、時刻t(n−1)においてビュー10を視聴している例を示す。図9に示すように、時刻t(n−1)のタイミングでビュー5をベースビューとする破線601で囲まれたグループ1の範囲外に視点を切り替えているため、ビュー10から最も近いビュー11をベースビューとする破線902で囲まれたグループ4に切り替わる。時刻t(n−1)はフレーム内予測符号化周期前のタイミングであるため、図7に示したフローチャートでのステップS703からステップS704へのパスを通る。その後、時刻t(n+1)のフレーム内予測符号化周期において、視点切り替えが発生せずにビュー10を視聴しているため、グループ切り替えは発生せず、時刻t(n+1)からのGOPにおいてもグループ4に所属される。
次に、符号化データ取得部404における取得する視点映像の映像符号化データを決定する方法について図10を用いて説明する。符号化データ取得部404は、ユーザの端末装置から配信要求を受けた時、ユーザの端末装置から視点切り替え要求を受けた時、フレーム内予測符号化周期等のタイミングにおいて、取得するべき視点映像符号化データを決定する。決定方法としてはいくつかの方法があり、例えば、所属するグループ内の全視点映像符号化データを取得してもよいし、視聴している視点映像を復号化できる最低限の視点映像符号化データを取得するようにしてもよい。
復号化できる最低限の視点映像符号化データとは、当該フレームの符号化データが直接的、間接的も含めて参照している視点映像符号化データをすべて含む。例えば、図10においてビュー3のフレーム1001を復号化するのに必要な最低限の視点映像符号化データは、破線1002で囲まれた視点映像符号化データとなる。また、ビュー9のフレーム1003を復号化するのに必要な最低限の視点映像符号化データは、破線1004で囲まれた視点映像符号化データとなる。また、例えばフレーム1001(ビュー3)からフレーム1005(ビュー2)に視点が切り替わると、復号化に必要な最低限の視点映像符号化データは破線1002で囲まれた視点映像符号化データから破線1006で囲まれた視点映像符号化データとなる。視聴している視点映像だけでなく、任意数個の周辺視点映像も復号化できるように視点映像符号化データを取得してもよい。
以上のように本実施形態においては、マルチビュー符号化を用いて複数の視点映像をグループ化した視点映像の映像符号化データを生成し、自由に視点を切り替える複数のユーザに対しても生成及び送信する映像符号化データを共有する。これにより、システムが必要とする符号化処理及びストレージ容量を利用ユーザ数に依らずに抑制することができる。また、フレーム内予測符号化周期でのユーザの現在の視点に応じて所属するグループを切り替えることで、視点の切り替えに応じて送信するデータ量の増加を抑制することができる。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。第2の実施形態では、自由視点映像配信システムが、グループ又は視点毎に所属するユーザ数を把握しておき、ユーザ数に応じてグループ化の方法を動的に制御する例について説明する。システム構成や符号化装置の機能については、第1の実施形態と同様であるので説明は省略し、以下では第1の実施形態と異なる点についてのみ説明する。
図4に示した配信要求受信部402及び切り替え要求受信部406は、ユーザの端末装置から配信要求や視点切り替え要求を受信した際に、ユーザ情報や視点情報だけでなく、グループ又は視点に属するユーザ数もユーザ情報バッファ403において更新する。グループ化部407は、ユーザ情報バッファ403で管理されているグループ又は視点に属するユーザ数を取得し、例えばフレーム内予測符号化周期でグループ化処理を実行する。グループ化処理を実行する周期は、フレーム内予測符号化周期よりも長くてもよいが、グループ化処理を実行するタイミングは、フレーム内予測符号化周期の何れかのタイミングが好ましい。
図11は、第2の実施形態におけるグループ化部407における複数の視点映像のグループ化の概要を示す図である。図11において、ユーザ群1101は、任意のグループ化処理タイミングにおけるビュー7を視聴しているユーザ群である。例えば、ユーザ群1101の人数が予め設定していた第1の閾値を超えている場合、ビュー7をベースビューとする破線602で囲まれたグループ2を構成する視点数を増やす。
カメラ1102から1104の視点映像をそれぞれビュー32からビュー34とする。ユーザ群1105は、任意のグループ化処理タイミングにおけるビュー33を視聴しているユーザ群である。例えば、ユーザ群1105の人数が予め設定していた第2の閾値を下回っている場合、ビュー33をベースビューとする破線1106で囲まれたグループ15を構成する視点数を減らす。また、カメラ1107の視点映像をビュー53とする。ユーザ群1108は、任意のグループ化処理タイミングにおけるビュー53を視聴しているユーザ群である。例えば、ユーザ群1108の人数が0である場合、ビュー53をベースビューとする破線1109で囲まれたグループ25について符号化処理を実行しない。
図12は、第2の実施形態におけるグループ化部407におけるグループ化処理の例を示すフローチャートである。ステップS1201にて、グループ化部407は、ユーザ情報バッファ403で管理されている全グループ内の最初のグループを選択する。ステップS1202にて、グループ化部407は、選択したグループを視聴するユーザ数をユーザ情報バッファ403から取得する。グループを視聴するユーザ数とは、当該グループのベースビューがユーザの視聴視点から最も近いベースビューとなるユーザの数である。
ステップS1203にて、グループ化部407は、ステップS1202において取得したユーザ数が0であるか否かを判定する。ユーザ数が0である場合にはステップS1204に移行し、ユーザ数が1以上である場合にはステップS1205に移行する。ステップS1204にて、グループ化部407は、当該グループの視点数を0に設定する。視点数が0とは、すなわち当該グループの映像データは符号化しないことを意味する。
ステップS1205にて、グループ化部407は、ステップS1202において取得したユーザ数が予め設定した第1の閾値より大きいか否かを判定する。ユーザ数が第1の閾値より大きい場合にはステップS1206に移行し、小さい場合にはステップS1207に移行する。ステップS1206にて、グループ化部407は、当該グループの視点数をH個に設定する。
ステップS1207にて、グループ化部407は、ステップS1202において取得したユーザ数が予め設定した第2の閾値より小さいか否かを判定する。ユーザ数が第2の閾値より小さい場合にはステップS1208に移行し、大きい場合にはステップS1209に移行する。ステップS1208にて、グループ化部407は、当該グループの視点数をL個に設定する。また、ステップS1209にて、グループ化部407は、当該グループの視点数をM個に設定する。
ここで、第1の閾値及び第2の閾値は、システムの規模や利用するユーザ数等に応じて決めることができる。また、L、M、Hの設定値は、L<M<Hとなるようにし、固定値でもあってもよいし、ユーザ数に応じて動的に変更してもよい。
ステップS1210にて、グループ化部407は、全グループの視点数が決定済か否かを判定し、決定済であれば処理を終了し、未決定のグループがあればステップS1211に移行する。ステップS1211にて、グループ化部407は、ユーザ情報バッファ403で管理されている次のグループを選択し、ステップS1202に移行する。
以上のように第2の実施形態においては、グループ又は視点毎に所属するユーザ数を把握しておき、ユーザ数に応じてグループ化の方法を動的に制御する。これにより、ユーザ数の多いグループはより広範囲の視点切り替えに対応することができ、ユーザ数の少ないグループは余計なコンピュータリソースを消費しないようにすることができる。
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。第3の実施形態では、グループ毎にマルチビュー符号化を行う際に、ユーザの視点切り替え可能な範囲を考慮して効率的な符号化を行う。システム構成や符号化装置の機能については、第1の実施形態と同様であるので説明は省略し、以下では第1の実施形態と異なる点についてのみ説明する。なお、第3の実施形態では、1ユーザの同一時刻における視点切り替え、例えば一時停止した状態での視点切り替えや単位時間における2視点距離以上の視点切り替えについては考慮しないものとする。
図13は、第3の実施形態における参照マップ219の概念図である。図13において、軸や矩形、矢印が示すものについては、第1の実施形態に示した図3と同様であるため説明は省略する。ユーザが、時刻t(1)において、ビュー5から自由視点映像の視聴を開始すると、時刻t(2)のタイミングではビュー4からビュー6までの範囲のみ視点切り替えが可能である。同様に、時刻t(3)のタイミングではビュー3からビュー7までの範囲のみ視点切り替えが可能となり、時刻t(4)のタイミングではビュー2からビュー8までの範囲のみ視点切り替えが可能となる。
第3の実施形態では、Iフレームが取得される周期内において後方の時間に進むほど切り替え可能な視点の数を増加させるようにし、ユーザにとって視点切り替えが不可能な範囲の視点映像の映像データについては符号化処理しない。例えば、時刻t(1)におけるビュー1からビュー4、及びビュー6からビュー9、時刻t(2)におけるビュー1からビュー3、ビュー7からビュー9等の視点映像の映像データは符号化処理しない。これにより、余計な符号化処理を行う必要がなくなるだけでなく、ユーザにとって復号化に必要となるデータ量が少なくなり、送信データ量も抑制することができる。
以上のように第3の実施形態においては、ユーザの視点切り替え可能な範囲を考慮して効率的な符号化処理を行うことで、システムにおける余計なコンピュータリソースの消費と送信データ量の増加を抑制することができる。なお、本実施形態では、単位時間におけるユーザの切り替え可能な視点範囲を1視点距離までとしたが、2視点以上で設定してもよいし、1視点切り替えに複数単位時間必要としてもよい。
なお、前述した各実施形態では、符号化装置とサーバ装置118とは異なる装置としているが、符号化装置の機能とサーバ装置118の機能とを1つの装置に持たせて構成するようにしてもよい。例えば、サーバ装置118がカメラから撮像された映像データを受けて符号化処理を行うようにしてもよい。
(本発明の他の実施形態)
本発明は、前述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
なお、前記実施形態は、何れも本発明を実施するにあたっての具体化のほんの一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
100:自由視点映像配信システム 101〜113:カメラ 114〜116:符号化装置 118:サーバ装置 119:外部ネットワーク 401:通信部 402:配信要求受信部 403:ユーザ情報バッファ 404:符号化データ取得部 405:符号化データ送信部 406:切り替え要求受信部 407:グループ化部

Claims (15)

  1. 複数の視点で撮像される映像を送信する映像送信装置であって、
    映像データを受ける端末装置に対応する視点を示す視点情報を取得する取得手段と、
    複数の視点でそれぞれ撮像された複数の映像データからなる映像群を、任意の視点を基準視点としたフレーム内予測、フレーム間予測、及び視点間予測により符号化する符号化手段からフレーム内予測符号化した映像データの取得が行われる周期で、前記取得手段により取得した前記視点情報に基づいて前記端末装置に送信する映像データを決定する決定手段と、
    前記決定手段により決定された映像データを前記符号化手段から取得し前記端末装置に送信する送信手段とを有することを特徴とする映像送信装置。
  2. 前記基準視点で撮像された複数の映像データと該基準視点の周辺の任意の数の視点で撮像された映像データとからなる映像群をグループ化するグループ化手段を有し、
    前記決定手段は、前記取得手段により取得した前記視点情報が示す視点と各々のグループにおける前記基準視点との距離に基づいて前記端末装置に送信する映像データを決定することを特徴とする請求項1記載の映像送信装置。
  3. 前記グループ化手段は、グループに含まれる映像データを撮像した視点の一部が他のグループに含まれるようにグループ化することを特徴とする請求項2記載の映像送信装置。
  4. 前記端末装置から視点の切り替え要求を受信する受信手段とを有し、
    前記受信手段により受信した視点の切り替え要求によって要求された視点が前記端末装置に送信している映像データが含まれるグループの範囲内である場合、要求された視点に応じて前記視点情報を更新することを特徴とする請求項2又は3記載の映像送信装置。
  5. 前記受信手段により受信した視点の切り替え要求によって要求された視点が前記端末装置に送信している映像データが含まれるグループの範囲外である場合、視点の切り替え要求される前の前記視点情報を維持することを特徴とする請求項4記載の映像送信装置。
  6. 前記送信手段は、前記決定手段により決定された映像データが含まれるグループのすべての視点の映像データを送信することを特徴とする請求項2〜5の何れか1項に記載の映像送信装置。
  7. 前記送信手段は、前記決定手段により決定された映像データが含まれるグループの映像データの中から、前記視点情報が示す視点の映像を少なくとも復号できる映像データを送信することを特徴とする請求項2〜5の何れか1項に記載の映像送信装置。
  8. 前記グループ毎の映像データを送信している端末装置の数に応じて、前記グループ毎にグループに含める周辺の視点の数を制御することを特徴とする請求項2〜5の何れか1項に記載の映像送信装置。
  9. 映像データを送信している端末装置の数が第1の閾値より大きいグループに含める周辺の視点の数を増やすことを特徴とする請求項8記載の映像送信装置。
  10. 映像データを送信している端末装置の数が第2の閾値より小さいグループに含める周辺の視点の数を減らすことを特徴とする請求項8又は9記載の映像送信装置。
  11. 前記グループ化手段は、フレーム内予測符号化した映像データの取得が行われる周期内において後方の時間に進むほどグループに含まれる視点の数を増やすことを特徴とする請求項8〜10の何れか1項に記載の映像送信装置。
  12. 前記複数の視点でそれぞれ撮像された複数の映像データからなる映像群を符号化する前記符号化手段を有することを特徴とする請求項1〜11の何れか1項に記載の映像送信装置。
  13. 複数の視点で撮像される映像を送信する映像送信システムであって、
    複数の視点でそれぞれ撮像された複数の映像データからなる映像群を、任意の視点を基準視点としたフレーム内予測、フレーム間予測、及び視点間予測により符号化する符号化装置と、
    前記符号化装置から映像データを取得して端末装置に送信する映像送信装置とを有し、
    前記映像送信装置は、
    前記端末装置に対応する視点を示す視点情報を取得する取得手段と、
    前記符号化装置からフレーム内予測符号化した映像データの取得が行われる周期で、前記取得手段により取得した前記視点情報に基づいて前記端末装置に送信する映像データを決定する決定手段と、
    前記決定手段により決定された映像データを前記符号化装置から取得し前記端末装置に送信する送信手段とを有することを特徴とする映像送信システム。
  14. 複数の視点で撮像される映像を送信する映像送信方法であって、
    映像データを受ける端末装置に対応する視点を示す視点情報を取得する取得工程と、
    複数の視点でそれぞれ撮像された複数の映像データからなる映像群を、任意の視点を基準視点としたフレーム内予測、フレーム間予測、及び視点間予測により符号化する符号化手段からフレーム内予測符号化した映像データの取得が行われる周期で、前記取得工程にて取得した前記視点情報に基づいて前記端末装置に送信する映像データを決定する決定工程と、
    前記決定工程にて決定された映像データを前記符号化手段から取得し前記端末装置に送信する送信工程とを有することを特徴とする映像送信方法。
  15. 複数の視点で撮像される映像を送信する映像送信方法をコンピュータに実行させるプログラムであって、
    映像データを受ける端末装置に対応する視点を示す視点情報を取得する取得ステップと、
    複数の視点でそれぞれ撮像された複数の映像データからなる映像群を、任意の視点を基準視点としたフレーム内予測、フレーム間予測、及び視点間予測により符号化する符号化手段からフレーム内予測符号化した映像データの取得が行われる周期で、前記取得ステップにて取得した前記視点情報に基づいて前記端末装置に送信する映像データを決定する決定ステップと、
    前記決定ステップにて決定された映像データを前記符号化手段から取得し前記端末装置に送信する送信ステップとをコンピュータに実行させるためのプログラム。
JP2016011712A 2016-01-25 2016-01-25 映像送信装置、映像送信システム、映像送信方法、及びプログラム Pending JP2017135464A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016011712A JP2017135464A (ja) 2016-01-25 2016-01-25 映像送信装置、映像送信システム、映像送信方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016011712A JP2017135464A (ja) 2016-01-25 2016-01-25 映像送信装置、映像送信システム、映像送信方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2017135464A true JP2017135464A (ja) 2017-08-03

Family

ID=59503788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016011712A Pending JP2017135464A (ja) 2016-01-25 2016-01-25 映像送信装置、映像送信システム、映像送信方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2017135464A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019075740A (ja) * 2017-10-18 2019-05-16 キヤノン株式会社 画像処理システム、画像処理装置、画像伝送方法、及び、プログラム
CN110149546A (zh) * 2019-04-15 2019-08-20 广州虎牙信息科技有限公司 移动终端及其基于录屏的视频补帧方法、计算机存储介质
KR102124194B1 (ko) * 2018-12-19 2020-06-23 포디리플레이코리아 주식회사 영상분석을 위한 다채널 영상 전송 시스템 및 이의 제어 방법
KR20200073699A (ko) * 2018-12-14 2020-06-24 포디리플레이코리아 주식회사 입체 오디오를 제공하는 다채널 전송 시스템 및 이의 제어 방법
CN113228690A (zh) * 2018-12-25 2021-08-06 索尼集团公司 视频再现装置、再现方法和程序
WO2021172506A1 (ja) * 2020-02-29 2021-09-02 株式会社近江デジタルファブリケーションズ 動画配信方法、動画再生方法、動画配信装置、及び配信データ構造
JP7378465B2 (ja) 2018-09-25 2023-11-13 コーニンクレッカ フィリップス エヌ ヴェ ビデオストリームを生成及びレンダリングするための装置及び方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7104504B2 (ja) 2017-10-18 2022-07-21 キヤノン株式会社 画像処理システム、画像処理装置、画像伝送方法、及び、プログラム
JP2019075740A (ja) * 2017-10-18 2019-05-16 キヤノン株式会社 画像処理システム、画像処理装置、画像伝送方法、及び、プログラム
JP7378465B2 (ja) 2018-09-25 2023-11-13 コーニンクレッカ フィリップス エヌ ヴェ ビデオストリームを生成及びレンダリングするための装置及び方法
KR20200073699A (ko) * 2018-12-14 2020-06-24 포디리플레이코리아 주식회사 입체 오디오를 제공하는 다채널 전송 시스템 및 이의 제어 방법
KR102184131B1 (ko) * 2018-12-14 2020-11-27 포디리플레이코리아 주식회사 입체 오디오를 제공하는 다채널 전송 시스템 및 이의 제어 방법
KR102124194B1 (ko) * 2018-12-19 2020-06-23 포디리플레이코리아 주식회사 영상분석을 위한 다채널 영상 전송 시스템 및 이의 제어 방법
CN113228690B (zh) * 2018-12-25 2023-09-08 索尼集团公司 视频再现装置、再现方法和程序
CN113228690A (zh) * 2018-12-25 2021-08-06 索尼集团公司 视频再现装置、再现方法和程序
US11825066B2 (en) 2018-12-25 2023-11-21 Sony Corporation Video reproduction apparatus, reproduction method, and program
CN110149546A (zh) * 2019-04-15 2019-08-20 广州虎牙信息科技有限公司 移动终端及其基于录屏的视频补帧方法、计算机存储介质
CN114207562A (zh) * 2020-02-29 2022-03-18 近江数码制造株式会社 运动图像分发方法、运动图像再现方法、运动图像分发装置以及分发数据结构
WO2021172506A1 (ja) * 2020-02-29 2021-09-02 株式会社近江デジタルファブリケーションズ 動画配信方法、動画再生方法、動画配信装置、及び配信データ構造
EP4124022A4 (en) * 2020-02-29 2024-03-06 Ohmi Digital Fabrications Co Ltd VIDEO DISTRIBUTION METHOD, VIDEO PLAYBACK METHOD, VIDEO DISTRIBUTION DEVICE AND DISTRIBUTION DATA STRUCTURE

Similar Documents

Publication Publication Date Title
JP2017135464A (ja) 映像送信装置、映像送信システム、映像送信方法、及びプログラム
US11523116B2 (en) Methods and apparatuses for encoding and decoding video using signal dependent adaptive quantization
US11006126B2 (en) Picture coding device, picture coding method, and picture coding program
US9363521B2 (en) Picture coding device, picture coding method, picture coding program, picture decoding device, picture decoding method, and picture decoding program
US9560379B2 (en) Inter-prediction method and video encoding/decoding method using the inter-prediction method
JP4663792B2 (ja) 多視点動映像を符号化及び復号化する装置及び方法
US10582212B2 (en) Warped reference motion vectors for video compression
JP2021517798A (ja) インター予測モードに基づいた映像処理方法及びそのための装置
EP3531700B1 (en) Image coding method, transmission method and image coding device
JP2015095733A (ja) 画像伝送装置、画像伝送方法、及びプログラム
KR101596085B1 (ko) 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법
KR101911587B1 (ko) 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법
Kim et al. Special issue on architectures and algorithms of high-efficiency video coding (HEVC) standard for real‐time video applications
US9451285B2 (en) Inter-prediction method and video encoding/decoding method using the inter-prediction method
JP2016127372A (ja) 動画像符号化装置、動画像復号装置、動画像処理システム、動画像符号化方法、動画像復号方法、およびプログラム
JP7037331B2 (ja) データ配信システム及び配信制御装置
JP2017507538A (ja) 適応予測フィルタを用いて映像信号をエンコード、デコードするための方法及び装置
JP2015185979A (ja) 動画像符号化装置及び動画像符号化器
JP7318686B2 (ja) 画像復号装置、画像復号方法、及び画像復号プログラム
JP5876933B2 (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、動画像復号プログラム及び記録媒体
Ozcinar et al. Dynamic bitrate allocation of interactive real-time streamed multi-view video with view-switch prediction
KR20090078114A (ko) 가변적 화면 그룹 예측 구조를 이용한 다시점 영상 부호화방법 및 장치, 영상 복호화 장치 그리고 상기 방법을수행하는 프로그램이 기록된 기록 매체
US20180262790A1 (en) Systems and methods for adaptive streaming using jpeg 2000
GB2540204A (en) Rate control of streaming modules sharing a communication channel
KR20130086011A (ko) 비디오 정보 전송 방법, 비디오 복호화 방법, 비디오 부호화기 및 비디오 복호화기