JP2019149785A - 映像変換装置及びプログラム - Google Patents
映像変換装置及びプログラム Download PDFInfo
- Publication number
- JP2019149785A JP2019149785A JP2018035252A JP2018035252A JP2019149785A JP 2019149785 A JP2019149785 A JP 2019149785A JP 2018035252 A JP2018035252 A JP 2018035252A JP 2018035252 A JP2018035252 A JP 2018035252A JP 2019149785 A JP2019149785 A JP 2019149785A
- Authority
- JP
- Japan
- Prior art keywords
- video
- scene
- image
- main subject
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
【課題】注目すべき被写体が見やすいように高解像度の映像を低解像度の映像に変換する。【解決手段】映像変換装置1のシーン映像抽出部11は、入力映像を構成するフレーム群をシーン毎に分割してシーン映像を生成する。主要被写体領域特定部12は、シーン映像毎に、シーン映像を構成する全て又は一部のフレームそれぞれから得られた画像の特徴量に基づいて主要被写体が含まれる画像の領域である主要被写体領域を特定する。切り出し領域特定部13は、シーン映像について特定された主要被写体領域に基づいて画像の切り出し領域を特定する。映像変換部14は、シーン映像を構成する各フレームから、当該シーン映像について特定された切り出し領域の画像を切り出し、切り出された画像を予め定められた映像サイズに拡大又は縮小して変換シーン映像を生成する。シーン映像結合部15は、シーン毎の変換シーン映像を結合した映像を生成する。【選択図】図2
Description
本発明は、映像変換装置及びプログラムに関する。
近年、映像を多様な表示装置で視聴する機会が増え、放送用に制作された映像が家庭用のテレビのほか、パブリックビューイングなどの大きなスクリーンや、スマートフォンなどの携帯端末で視聴されることがある。
高解像度ディスプレイにより視聴されることを想定して制作した高解像度映像を、携帯端末等の低解像度ディスプレイで視聴する際には、本来必要となる帯域よりも狭い帯域で伝送する必要がある。しかしながら、高解像度ディスプレイだけでなく低解像度ディスプレイでも視聴されるなど、想定されるすべての視聴環境に応じて撮影や映像編集などを行うことは、リソースの制約や効率性などの点から現実的ではない。そこで、圧縮率を高くすることによりデータ量を削減するか、単純に元画像よりも低い解像度に変換(ダウンコンバート)して画像全体を縮小することにより、狭い帯域中にデータ量が収まるように高解像度映像を変換していた。
しかし、圧縮率を高くした場合は、画質が低下してしまう。また、ダウンコンバートして画像全体を縮小した場合は、注目すべき被写体も縮小率に応じて小さくなり、演出意図が正確に反映されないことや、見づらい映像となることはしばしば不可避であった。
一方で、高解像度映像を低解像度の端末装置で表示する際に、受信画像から有用と想定される領域を選択し、選択した領域のみを端末装置の表示画面に表示することで、重要な情報のみを高画質で表示する技術がある(例えば、特許文献1参照)。また、高解像度のセンサで撮影した画像を低解像度の映像信号に変換可能な場合において、着目領域の大きさに応じて解像度を制御し、着目領域の視認性を向上する技術がある(例えば、特許文献2参照)。
特許文献1の技術では、一定時間毎に、高解像度の映像を所定の大きさに分割したブロックの単位で表示領域を選択している。そのため、領域選択を行う間隔が長い場合、シーンの切り替えと表示領域の移動のタイミングがずれてしまう可能性がある。シーンの切り替えに対応するために領域選択を行う間隔を短くすると、ブロックの大きさに応じた距離の単位で表示領域が移動するように頻繁に切り替わり、見づらい映像となる可能性がある。また、特許文献2の技術では、表示装置の解像度に合わせて選択領域を構成する画素数(画素密度)を変換するが、画像全体の大きさは変わらないため、小さな画面の端末で映像を表示する際に、注目すべき被写体は縮小されることになるため、小さな表示のままとなる。
本発明は、このような事情を考慮してなされたもので、注目すべき被写体が見やすいように高解像度の映像を低解像度の映像に変換することができる映像変換装置及びプログラムを提供する。
本発明の一態様は、入力映像を構成するフレーム群をシーン毎に分割してシーン映像を生成するシーン映像抽出部と、前記シーン映像毎に、前記シーン映像を構成する全て又は一部のフレームそれぞれから得られた画像の特徴量に基づいて主要被写体が含まれる画像の領域である主要被写体領域を特定する主要被写体領域特定部と、前記シーン映像について特定された前記主要被写体領域に基づいて画像の切り出し領域を特定する切り出し領域特定部と、前記シーン映像を構成する各フレームから、当該シーン映像について特定された前記切り出し領域の画像を切り出し、切り出された前記画像を予め定められた映像サイズに拡大又は縮小して変換シーン映像を生成する映像変換部と、前記シーン毎の前記変換シーン映像を結合した映像を生成するシーン映像結合部と、を備えることを特徴とする映像変換装置である。
本発明の一態様は、上述の映像変換装置であって、前記切り出し領域特定部は、前記主要被写体領域を内包する矩形となるように前記切り出し領域を特定する、ことを特徴とする。
本発明の一態様は、上述の映像変換装置であって、前記主要被写体領域特定部は、前記シーン映像を構成する全て又は一部のフレームそれぞれから得られた画像の特徴量を用いて前記フレーム毎の顕著性マップを生成し、生成した前記顕著性マップの総和を、前記主要被写体領域を表す情報として算出する、ことを特徴とする。
本発明の一態様は、上述の映像変換装置であって、前記主要被写体領域特定部は、解像度を低くした前記シーン映像毎に前記主要被写体領域を特定する、ことを特徴とする。
本発明の一態様は、コンピュータを、上述したいずれかに記載の映像変換装置として機能させるためのプログラムである。
本発明によれば、注目すべき被写体が見やすいように高解像度の映像を低解像度の映像に変換することができる。
以下、図面を参照しながら本発明の実施形態を詳細に説明する。本実施形態は、高解像度の映像を、それより低い異なる解像度に適応的に変換する映像変換装置及びプログラムに関する。
図1は、本実施形態の映像変換装置に用いられる高解像度映像から低解像度映像に変換する方法の例を示す図である。例えば、7680×4320画素の8K映像(高解像度映像)を、1920×1080画素の2K映像(低解像度映像)に変換することが想定される。高解像度映像を、本来必要となる帯域よりも狭い帯域で伝送するためには、元画像より低い解像度に変換するダウンコンバートを行う方法がある。ダウンコンバートを行うことで画像全体を縮小し、狭い帯域中に映像が収まるように変換することができる。しかし、例えば、8K映像は、広い画角で視聴することを想定しているため、注目すべき被写体が画像の中心付近に多く、注目すべき被写体が含まれていない余白領域が広い傾向がある。そのため、単純に解像度をダウンコンバートしただけでは、注目すべき被写体も画像全体の縮小率に応じて小さくなる。結果として、演出意図が正確に反映されない映像となる可能性や、見づらい映像となる可能性があった。
上記の可能性を避ける方法として、単純なダウンコンバートにより映像全体を縮小して表示するのではなく、注目すべき主要な被写体の周辺の映像を適切に切り出して表示する方法や、さらには切り出した映像を縮小する方法がある。これにより、注目すべき被写体が小さくなりすぎることを回避し、演出意図が伝わりやすく、見やすい映像を提供できる可能性がある。しかしながら、この注目すべき主要な被写体周辺を切り出す際に手動で領域を指定することは、撮影と同等の労力が必要となる。特に、大量の映像を変換する場合には現実的ではなく、自動的に領域を抽出する方法が望まれる。
そこで、本実施形態の映像変換装置は、映像の一部を切り出して解像度を変換する際に、切り出す領域の大きさと位置を映像の特徴から自動的に決定し、所望のサイズの映像を出力する。具体的には、映像変換装置は、入力映像において主要な被写体が含まれる領域を、顕著性マップを利用することによって特定し、その特定した領域が単一の映像シーン内で移動する範囲を求める。顕著性マップは、人の視覚情報処理モデルに基づいて画像の特徴量を分析して得られた、注目されやすい領域を表す。映像変換装置は、この求めた範囲に基づいて該当シーンに適した切り出し領域を特定し、切り出し領域のサイズが所望の映像サイズと異なる場合はサイズを変換する。
本実施形態により、映像変換装置は、狭い帯域で映像を伝送する際や、表示解像度の低いディスプレイで映像を表示する際にも、表示装置に合わせて各シーンの主要な被写体が適切な大きさで表示されるように、高解像度映像をより低い解像度の映像に変換することができる。これにより、映像変換装置は、演出意図が伝わりやすく、見やすい映像を提供することができる。さらには、映像変換装置は、映像特徴を利用して自動で映像を変換するため、効率的な映像制作が可能となる。
図2は、本発明の一実施形態のよる映像変換装置1の構成を示す機能ブロック図であり、本実施形態と関係する機能ブロックのみを抽出して示してある。同図に示す映像変換装置1は、シーン映像抽出部11、主要被写体領域特定部12、切り出し領域特定部13、映像変換部14及びシーン映像結合部15を備える。
映像変換装置1には、入力映像D1が入力される。入力映像D1は、解像度変換の対象となる映像である。入力映像D1は、例えば、8K、4Kなどの大きな伝送容量を必要とする高解像度映像である。映像変換装置1は、この入力映像D1を、例えば2Kなどのよりデータ量の小さい低解像度映像に変換し、出力映像D6として出力する。
シーン映像抽出部11は、入力映像D1をシーン映像D2に分割する。シーン映像D2は、編集点(カットや各種トランジション効果などのシーン変化)を含まない単一のシーンから構成されるフレーム群である。シーン映像抽出部11は、入力映像D1を、分割されたシーン映像D2ごとに主要被写体領域特定部12及び映像変換部14に出力する。
主要被写体領域特定部12は、シーン映像D2のなかで注目すべき被写体(主要被写体)の領域を特定する。この領域を、主要被写体領域と記載する。主要被写体領域特定部12は、主要被写体領域を特定可能な情報を生成するために、人間の空間的な注意の位置を推定する顕著性マップを使用する。主要被写体領域特定部12は、シーン映像D2を構成する各フレームの顕著性マップを算出する。主要被写体領域特定部12は、それら顕著性マップの総和に基づいてシーン全体において主要被写体分布が高い領域を表す情報であるシーン内被写体領域分布D3を求める。
切り出し領域特定部13は、シーン内被写体領域分布D3により特定される主要被写体領域を内包する最小の矩形となるように、シーン映像D2から切り出す領域を決定する。切り出し領域特定部13は、切り出し領域の座標を特定すると、その座標を表す情報である切り出し領域座標D4を映像変換部14に出力する。
映像変換部14は、シーン映像D2を構成する各フレームから切り出し領域座標D4に基づいて画像を切り出す。映像変換部14は、シーン映像D2の各フレームから切り出した画像をそれぞれ、予め定められた目的の映像サイズ(例えば、2K:1920×1080)に縮小あるいは拡大し、縮小又は拡大された各画像のフレームからなる変換シーン映像D5を得る。
シーン映像結合部15は、映像変換部14により画像の大きさが変換された各シーンの変換シーン映像D5を結合して出力映像D6を生成する。シーン映像結合部15は、生成した出力映像D6を出力する。
図3は、映像変換装置1の処理の流れを示すフロー図である。
初期状態において、シーン映像抽出部11は、入力映像D1の入力を待機している(ステップS1)。入力映像D1は、例えば、複数のシーンが結合された1つの映像である。複数の映像を映像変換装置1に入力する場合、入力映像D1を、それらの映像が結合された1つの映像としてもよい。
初期状態において、シーン映像抽出部11は、入力映像D1の入力を待機している(ステップS1)。入力映像D1は、例えば、複数のシーンが結合された1つの映像である。複数の映像を映像変換装置1に入力する場合、入力映像D1を、それらの映像が結合された1つの映像としてもよい。
シーン映像抽出部11は、入力映像D1が入力されると、編集点を区切りとして、入力映像D1から編集点が含まれないシーン映像D2を抽出する(ステップS2)。編集点の検出には、既存の任意の方法を用いることができる。例えば、シーン映像抽出部11は、入力映像D1を構成する各フレームの特徴量を算出し、算出した特徴量の変化が所定以上である場合に、編集点と判断する。
シーン映像抽出部11は、入力映像D1の編集点を検出する度に、入力映像D1から抽出したシーン映像D2を抽出して主要被写体領域特定部12及び映像変換部14に出力する。なお、シーン映像抽出部11は、入力映像D1の全体をシーン映像D2に分割した後、各シーン映像D2を順に主要被写体領域特定部12及び映像変換部14に出力してもよい。映像変換装置1は、各シーン映像D2についてステップS3〜ステップS7の処理を行う。
主要被写体領域特定部12は、シーン映像D2から主要被写体の分布を抽出する(ステップS3)。具体的には、まず、主要被写体領域特定部12は、シーン映像D2に属する各フレームそれぞれの顕著性マップを算出する。
図4は、顕著性マップの例を示す図である。同図では、1つのシーン映像D2に含まれるフレームF1〜F6それぞれの顕著性マップの例を示している。顕著性マップを算出するモデルとしては、以下の参考文献1〜3など様々なものが提案されているが、何れのモデルを用いたマップを使用してもよい。参考文献1〜3には、人の視覚情報処理モデルに基づいて画像の特徴量を分析し、画像内の画素ごとの注目されやすさを数値化した顕著性マップを推定するモデルが記載されている。
(参考文献1)L. Itti,外2名,"A Model of Saliency-Based Visual Attention for Rapid Scene Analysis",IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE,1998年,VOL. 20,NO.11,p.1254-1259
(参考文献2)O. Le Meur,外2名,"Predicting visual fixations on video based on low-level visual features",Vision Research 47,2007年,p.2483-2498
(参考文献3)Neil D. B. Bruce,外1名,"Saliency, attention, and visual search: An information theoretic approach",Journal of Vision,2009年,9(3) ,p.1-24
(参考文献2)O. Le Meur,外2名,"Predicting visual fixations on video based on low-level visual features",Vision Research 47,2007年,p.2483-2498
(参考文献3)Neil D. B. Bruce,外1名,"Saliency, attention, and visual search: An information theoretic approach",Journal of Vision,2009年,9(3) ,p.1-24
顕著性マップは、例えば、以下のように算出される。まず、特徴量の種類(色、輝度値、動きベクトルなど)別に、フレーム画像の画素ごとの特徴量の値を算出したマップを生成し、さらに、フレーム画像のスケールを1/2、1/4、1/8、…のように小さくしたときの特徴量の値のマップを生成する。そして、特徴量の種類別に、スケール間のマップの差を求めることによって特徴量の値の差分を強調した特徴マップを作成した後、各種類の特徴量について作成した特徴マップを線形結合し、画素ごとに顕著性の程度を数値化した顕著性マップを算出する。
主要被写体領域特定部12は、顕著性マップを算出する際に、計算量を減らすために、入力映像D1の解像度よりも低い解像度にダウンコンバートした映像のフレーム画像を用いてもよい。ダウンコンバートした映像のフレーム画像を用いることにより、複数の画素からなる領域であるブロックごとに顕著性の程度を数値化した顕著性マップを算出することができる。また、主要被写体領域特定部12は、主要被写体の分布の算出のために用いる画像として、シーン映像D2を構成するすべてのフレームの画像を用いてもよく、所定間隔のフレームなど一部のフレームの画像を用いてもよい。
ステップS3の処理の後、図3のフロー図に示すように、主要被写体領域特定部12は、被写体移動領域を解析する(ステップS4)。具体的には、主要被写体領域特定部12は、ステップS3において算出した顕著性マップ(図4)を用いてシーン内被写体領域分布D3を算出する。
図5は、シーン内被写体領域分布D3の例を示す図である。主要被写体領域特定部12は、ステップS3において同一のシーン映像D2の全フレームそれぞれ又は一部のフレームそれぞれについて算出した顕著性マップの総和を算出する。主要被写体領域特定部12は、顕著性マップの総和を正規化し、顕著性の確率密度分布を求める。正規化では、全画素又は全ブロックの顕著性の程度を表す数値の総和が1となるようにする。正規化により得られた確率密度分布は、シーン内における主要被写体の移動を考慮したシーン内被写体領域分布D3となる。なお、主要被写体領域特定部12は、顕著性マップの総和を算出する前に、各フレームの顕著性マップを正規化してもよい。
ステップS4の処理の後、図3のフロー図に示すように、切り出し領域特定部13は、シーン内被写体領域分布D3に基づいて、フレーム画像からの切り出し領域を表す切り出し領域座標D4を特定する(ステップS5)。シーン内被写体領域分布D3のピーク値をhとする。切り出し領域特定部13は、図5に示すように、シーン内被写体領域分布D3において確率分布がピーク値hから一定の割合r以上(rは1以下の正の数。)となる領域が含まれる矩形領域を切り出し領域Rとして特定する。その際、切り出し領域特定部13は、予め決められた変換後の映像のアスペクト比(例えば、横:縦=16:9)に合わせて、確率分布がr×h以上の領域を内包する、可能な限り小さな矩形領域を切り出し領域Rとする。例えば、r=0.5であるが、rの値は入力映像D1に応じて任意に決めてもよい。なお、切り出し領域特定部13は、確率分布がr×h以上の領域を内包する、可能な限り小さな矩形領域を特定し、さらに、特定した矩形領域を所定画素数分又は特定した矩形領域応じた画素数分、大きく又は小さくして切り出し領域Rとしてもよい。
なお、アスペクト比との関係から切り出し領域の位置に不定性がある場合、切り出し領域特定部13は、シーン内被写体領域分布D3におけるピークの位置、又は、累積確率分布の中央値となる位置を矩形領域(切り出し領域R)の中心となる位置としてもよい。あるいは、切り出し領域特定部13は、領域内の確率分布の積分が最大となる位置を切り出し領域Rとしてもよい。この積分は、領域内の顕著性の程度を表す数値の総和に相当する。
図6は、切り出し領域の調整の例を示す図である。確率分布に基づいて矩形領域A1を特定した場合、矩形領域A1が、シーン映像D2のフレーム画像Fの外側の領域を含むことがある。この場合、切り出し領域特定部13は、フレーム画像Fの外側にある矩形領域A1の辺が、矩形領域A1内に含まれるフレーム画像Fの辺と重なるように、矩形領域A1をフレーム画像Fの方向に移動させた位置の矩形領域A2を切り出し領域Rとして決定する。同図では、矩形領域A1がフレーム画像Fの上の辺の一部を含むため、矩形領域A1の上の辺と、矩形領域A1に含まれていたフレーム画像Fの上の辺とが重なるように、矩形領域A1を下方向に移動させた矩形領域A2を切り出し領域Rとする。
切り出し領域特定部13は、特定した切り出し領域Rの座標を示す切り出し領域座標D4を映像変換部14に出力する。例えば、切り出し領域座標D4は、切り出し領域Rの4つの頂点の座標でもよく、切り出し領域Rの対角の2つの頂点の座標でもよく、切り出し領域Rの1つの頂点の座標と縦及び横の長さでもよい。
次に、図3のフロー図に示すように、映像変換部14は、シーン映像D2を構成するすべてのフレーム画像それぞれから、切り出し領域座標D4が示す切り出し領域Rを切り出す領域切り出し処理を行う(ステップS6)。映像変換部14は、ステップS6において切り出されたすべてのフレーム画像を、目的の映像サイズに縮小または拡大する。映像変換部14は、これらの縮小または拡大されたフレーム画像を結合し、シーン映像D2よりも解像度が低い変換シーン映像D5を作成する(ステップS7)。映像変換部14は、作成した変換シーン映像D5をシーン映像結合部15に出力する。
シーン映像抽出部11は、入力映像D1を構成するすべてのシーン映像D2について変換シーン映像D5が得られているかを判断する。シーン映像抽出部11は、変換シーン映像D5が得られていないシーン映像D2があると判断すると(ステップS8:NO)、ステップS2に戻って次のシーン映像D2の抽出処理を行う。シーン映像抽出部11は、すべてのシーン映像D2について変換シーン映像D5が得られたと判断すると(ステップS8:YES)、シーン映像結合部15に全シーン終了を通知する。この通知を受けたシーン映像結合部15は、入力映像D1を構成するすべてのシーン映像D2それぞれに基づいて得られた変換シーン映像D5を結合し、出力映像D6として出力する(ステップS9)。
なお、ステップS5において、切り出し領域特定部13は、目的の映像サイズに応じて予め決められた大きさの矩形領域を切り出し領域Rとしてもよい。切り出し領域Rの大きさは、目的の映像サイズと同じ又は大きなサイズであるが、小さいサイズとしてもよい。この場合、切り出し領域特定部13は、上述した切り出し領域の位置に不定性がある場合と同様に、切り出し領域Rとなる矩形領域を特定することができる。切り出し領域Rが目的と同じサイズである場合、映像変換部14は、ステップS6において切り出されたすべてのフレーム画像の映像サイズを変更することなく結合して変換シーン映像D5を作成することができる。
上述した映像変換装置1は、例えば、番組等のコンテンツを放送又は通信により配信するコンテンツ提供事業者が、高解像度で作成されたコンテンツの映像を、配信先の表示装置の種類に合わせた解像度に変換するために使用することができる。また、視聴者宅に映像変換装置1を設置し、コンテンツ提供事業者から配信された高解像度のコンテンツの映像を、視聴に使用する表示装置に合わせた解像度の映像に変換するために使用することができる。この場合、映像変換装置1は、例えば、視聴者の表示装置又は録画装置に実装されてもよく、表示装置又は録画装置と接続される装置であってもよい。映像変換装置1は、予めテレビジョン受信機やタブレット端末、スマートフォンなどの表示装置に設定されている情報又は視聴者の操作によって表示装置に入力された情報を表示装置から受信し、受信した情報に基づいて出力映像D6の映像サイズを決定してもよい。この情報は、例えば、解像度又は規格を示す情報でもよく、表示装置の種類の情報でもよい。
本実施形態の映像変換装置1は、撮影した高解像度映像から多様なフォーマットの映像を制作・変換する際に有用である。また、映像変換装置1は、小型の表示装置を有する携帯端末などに高解像度映像の一部を表示するサービスを実施する場合に、表示位置の既定値を機械的に算出して提供する技術としても有用である。
なお、上述の映像変換装置1は、内部にコンピュータシステムを有している。そして、映像変換装置1の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
1…映像変換装置、 11…シーン映像抽出部、 12…主要被写体領域特定部、 13…切り出し領域特定部、 14…映像変換部、 15…シーン映像結合部
Claims (5)
- 入力映像を構成するフレーム群をシーン毎に分割してシーン映像を生成するシーン映像抽出部と、
前記シーン映像毎に、前記シーン映像を構成する全て又は一部のフレームそれぞれから得られた画像の特徴量に基づいて主要被写体が含まれる画像の領域である主要被写体領域を特定する主要被写体領域特定部と、
前記シーン映像について特定された前記主要被写体領域に基づいて画像の切り出し領域を特定する切り出し領域特定部と、
前記シーン映像を構成する各フレームから、当該シーン映像について特定された前記切り出し領域の画像を切り出し、切り出された前記画像を予め定められた映像サイズに拡大又は縮小して変換シーン映像を生成する映像変換部と、
前記シーン毎の前記変換シーン映像を結合した映像を生成するシーン映像結合部と、
を備えることを特徴とする映像変換装置。 - 前記切り出し領域特定部は、前記主要被写体領域を内包する矩形となるように前記切り出し領域を特定する、
ことを特徴とする請求項1に記載の映像変換装置。 - 前記主要被写体領域特定部は、前記シーン映像を構成する全て又は一部のフレームそれぞれから得られた画像の特徴量を用いて前記フレーム毎の顕著性マップを生成し、生成した前記顕著性マップの総和を、前記主要被写体領域を表す情報として算出する、
ことを特徴とする請求項1又は請求項2に記載の映像変換装置。 - 前記主要被写体領域特定部は、解像度を低くした前記シーン映像毎に前記主要被写体領域を特定する、
ことを特徴とする請求項1から請求項3のいずれか一項に記載の映像変換装置。 - コンピュータを、請求項1から請求項4のいずれか一項に記載の映像変換装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018035252A JP2019149785A (ja) | 2018-02-28 | 2018-02-28 | 映像変換装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018035252A JP2019149785A (ja) | 2018-02-28 | 2018-02-28 | 映像変換装置及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019149785A true JP2019149785A (ja) | 2019-09-05 |
Family
ID=67849544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018035252A Pending JP2019149785A (ja) | 2018-02-28 | 2018-02-28 | 映像変換装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019149785A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112258614A (zh) * | 2020-10-23 | 2021-01-22 | 南京维伍网络科技有限公司 | 一种Autodesk 3ds Max到D5渲染器的场景数据转换方法 |
JP2021145322A (ja) * | 2020-03-11 | 2021-09-24 | ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド | ビデオ処理方法、ビデオ処理装置および記憶媒体 |
WO2023249271A1 (ko) * | 2022-06-23 | 2023-12-28 | 삼성전자주식회사 | 영상을 크롭하여 투사하는 전자 장치 및 그 제어 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010503006A (ja) * | 2006-09-01 | 2010-01-28 | トムソン ライセンシング | 適応的なビデオ呈示のための方法および装置 |
JP2010176087A (ja) * | 2009-02-02 | 2010-08-12 | Sharp Corp | 画像表示装置、画像表示方法、画像データ供給装置、画像データ供給方法、画像表示プログラムおよび記録媒体 |
JP2013009050A (ja) * | 2011-06-22 | 2013-01-10 | Canon Inc | 画像処理装置、画像処理方法 |
-
2018
- 2018-02-28 JP JP2018035252A patent/JP2019149785A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010503006A (ja) * | 2006-09-01 | 2010-01-28 | トムソン ライセンシング | 適応的なビデオ呈示のための方法および装置 |
JP2010176087A (ja) * | 2009-02-02 | 2010-08-12 | Sharp Corp | 画像表示装置、画像表示方法、画像データ供給装置、画像データ供給方法、画像表示プログラムおよび記録媒体 |
JP2013009050A (ja) * | 2011-06-22 | 2013-01-10 | Canon Inc | 画像処理装置、画像処理方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021145322A (ja) * | 2020-03-11 | 2021-09-24 | ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド | ビデオ処理方法、ビデオ処理装置および記憶媒体 |
JP7062036B2 (ja) | 2020-03-11 | 2022-05-02 | ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド | ビデオ処理方法、ビデオ処理装置および記憶媒体 |
US11488383B2 (en) | 2020-03-11 | 2022-11-01 | Beijing Xiaomi Pinecone Electronics Co., Ltd. | Video processing method, video processing device, and storage medium |
CN112258614A (zh) * | 2020-10-23 | 2021-01-22 | 南京维伍网络科技有限公司 | 一种Autodesk 3ds Max到D5渲染器的场景数据转换方法 |
CN112258614B (zh) * | 2020-10-23 | 2023-08-29 | 南京维伍网络科技有限公司 | 一种Autodesk 3ds Max到D5渲染器的场景数据转换方法 |
WO2023249271A1 (ko) * | 2022-06-23 | 2023-12-28 | 삼성전자주식회사 | 영상을 크롭하여 투사하는 전자 장치 및 그 제어 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10956766B2 (en) | Bit depth remapping based on viewing parameters | |
US10242714B2 (en) | Interface for application-specified playback of panoramic video | |
US10244200B2 (en) | View-dependent operations during playback of panoramic video | |
US10437545B2 (en) | Apparatus, system, and method for controlling display, and recording medium | |
US10244167B2 (en) | Apparatus and methods for image encoding using spatially weighted encoding quality parameters | |
KR101813196B1 (ko) | 화상 통신 방법, 장치, 프로그램 및 기록매체 | |
US20200334789A1 (en) | Image Processing Method and Device | |
CN109983500B (zh) | 重新投影全景视频图片的平板投影以通过应用进行渲染 | |
US9600923B2 (en) | Scale-independent maps | |
US10574933B2 (en) | System and method for converting live action alpha-numeric text to re-rendered and embedded pixel information for video overlay | |
CN112770050B (zh) | 视频展示方法及装置、计算机可读介质和电子设备 | |
CN109547724B (zh) | 一种视频流数据的处理方法、电子设备及存储装置 | |
US20190098347A1 (en) | System and method for remote radiology technician assistance | |
US9471958B2 (en) | Image processing method and apparatus | |
JP2019149785A (ja) | 映像変換装置及びプログラム | |
CN112435244A (zh) | 直播视频的质量评价方法、装置、计算机设备和存储介质 | |
US20220247928A1 (en) | Image processing method and apparatus, aerial camera and storage medium | |
CN110928509B (zh) | 显示控制方法、显示控制装置、存储介质、通信终端 | |
CN114531564A (zh) | 处理方法及电子设备 | |
US7936936B2 (en) | Method of visualizing a large still picture on a small-size display | |
CN112948627B (zh) | 一种报警视频生成方法、显示方法和装置 | |
US20220329912A1 (en) | Information processing apparatus, information processing method, and program | |
CN114666477B (zh) | 一种视频数据处理方法、装置、设备及存储介质 | |
WO2022157105A1 (en) | System for broadcasting volumetric videoconferences in 3d animated virtual environment with audio information, and method for operating said system | |
CN115174994A (zh) | 视频处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220118 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220712 |