JP6307213B2 - 画像処理装置、画像処理方法およびプログラム - Google Patents

画像処理装置、画像処理方法およびプログラム Download PDF

Info

Publication number
JP6307213B2
JP6307213B2 JP2012110717A JP2012110717A JP6307213B2 JP 6307213 B2 JP6307213 B2 JP 6307213B2 JP 2012110717 A JP2012110717 A JP 2012110717A JP 2012110717 A JP2012110717 A JP 2012110717A JP 6307213 B2 JP6307213 B2 JP 6307213B2
Authority
JP
Japan
Prior art keywords
image
caption
parallax
stereoscopic
subtitle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012110717A
Other languages
English (en)
Other versions
JP2013238975A (ja
Inventor
清水 晃
清水  晃
啓介 渡邉
啓介 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Saturn Licensing LLC
Original Assignee
Saturn Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Saturn Licensing LLC filed Critical Saturn Licensing LLC
Priority to JP2012110717A priority Critical patent/JP6307213B2/ja
Priority to PCT/JP2013/058974 priority patent/WO2013172097A1/ja
Priority to US14/400,403 priority patent/US20150138316A1/en
Priority to EP13790657.4A priority patent/EP2852163A4/en
Publication of JP2013238975A publication Critical patent/JP2013238975A/ja
Application granted granted Critical
Publication of JP6307213B2 publication Critical patent/JP6307213B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • H04N13/183On-screen display [OSD] information, e.g. subtitles or menus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/122Improving the 3D impression of stereoscopic images by modifying image signal contents, e.g. by filtering or adding monoscopic depth cues
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/156Mixing image signals

Description

本技術は、画像処理装置、画像処理方法および当該方法をコンピュータに実行させるためのプログラムに関する。詳しくは、字幕を動画に合成する画像処理装置、画像処理方法および当該方法をコンピュータに実行させるためのプログラムに関する。
従来から、立体的に視認できるように動画を表示(すなわち、立体表示)する表示装置が用いられている。例えば、動画を構成する画像として視差のある左側画像および右側画像を撮像しておき、左側画像が左目に映り右側画像が右目に映るように、表示装置がそれらを表示することにより、動画を立体的に見せることができる。表示の際には、時分割で左右の画像を表示装置が交互に表示し、その切り替えタイミングに同期して、専用メガネが左右のシャッターを動作させるアクティブシャッターグラス方式などが用いられる。
上述のような表示装置において、動画にクローズドキャプションを合成する技術が提案されている(例えば、特許文献1参照。)。クローズドキャプションとは、表示装置が、字幕の表示、非表示などを制御することができるように動画と独立して生成された字幕である。これに対して、動画に合成された形式で供給され、表示装置が表示、非表示等を制御することができない字幕はオープンキャプションと呼ばれる。
表示装置がクローズドキャプションを合成する場合、そのクローズドキャプションも立体表示させることが考えられる。字幕の立体表示の際には、通常、字幕を表す平面的な字幕画像が生成され、その字幕画像は、2D−3D変換の技術を利用して、立体表示させるための画像に変換される。この2D−3D変換は、立体表示するための画像でないものを、立体表示させるための画像に変換する技術である。具体的には、平面的な通常の画像を水平方向において左右にずらして2枚の画像を生成し、それらの一方を左目に映すための左側画像とし、他方を右目に映すための右側画像とする手法が用いられる(例えば、特許文献2参照)。
特開2012−4654号公報 特許第3086577号
しかしながら、上述の従来技術では、字幕画像を立体表示させる場合に遠近感を強調することができない。特許文献2に記載の2D−3D変換では、平面的な画像を単にシフトさせているだけであり、このような手法を用いて平面的な字幕画像を立体表示させても、立体物が写った動画を立体表示した場合と比較して、字幕画像の遠近感が不足してしまう。このため、字幕画像を立体表示する場合は、その字幕画像の遠近感を強調することが望ましい。ところが、上述の従来技術では、画像の遠近感を変更する処理を行わないため、字幕画像を立体表示させる場合にこれらの技術を適用すると、遠近感が不足してしまうという問題がある。
本技術はこのような状況に鑑みて生み出されたものであり、字幕画像の遠近感を強調することを目的とする。
本技術は、上述の問題点を解消するためになされたものであり、その第1の側面は、立体主画像に合成される字幕情報を取得する字幕情報取得部と、上記字幕情報を立体表示させるための視差を取得する視差取得部と、上記視差に応じた表示位置に立体表示される立体字幕画像を上記字幕情報から生成する立体字幕画像生成部と、上記表示位置が手前側であるほど上記立体字幕画像が大きくなるように上記立体字幕画像を拡大または縮小する拡大縮小部とを具備する画像処理装置およびその画像処理方法ならびに当該方法をコンピュータに実行させるためのプログラムである。これにより、表示位置が手前側であるほど立体字幕画像が大きくなるように立体字幕画像が拡大または縮小されるという作用をもたらす。
また、この第1の側面において、上記拡大縮小部は、上記表示位置が所定の基準位置より手前側である場合には上記視差に応じて上記立体字幕画像を拡大し、上記表示位置が上記所定の基準位置より奥側である場合には上記視差に応じて上記立体字幕画像を縮小してもよい。これにより、表示位置が基準位置より手前側である場合には視差に応じて立体字幕画像が拡大され、奥側である場合には視差に応じて立体字幕画像が縮小されるという作用をもたらす。
また、この第1の側面において、上記拡大または縮小された立体字幕画像を上記立体主画像に合成する字幕合成部をさらに具備してもよい。これにより、拡大または縮小された立体字幕画像が立体主画像に合成されるという作用をもたらす。
また、この第1の側面において、上記字幕画像と当該字幕情報の視差および表示タイミングとを対応付けて保持するバッファと、上記表示タイミングにおいて当該表示タイミングに対応する上記字幕情報および上記視差を上記バッファから読み出して前記画像生成部に供給する制御部とをさらに具備し、前記字幕情報取得部は前記表示タイミングをさらに取得して当該表示タイミングに前記字幕情報に対応付けて前記バッファに保持させ、前記視差取得部は前記表示タイミングをさらに取得して当該表示タイミングに前記視差を対応付けて前記バッファに保持させてもよい。これにより、表示タイミングにおいて、その表示タイミングに対応する字幕情報および視差が画像生成部に供給されるという作用をもたらす。
また、この第1の側面において、上記拡大縮小部は、所定の補正係数に基づいて補正した拡大率または縮小率に従って上記立体字幕画像を拡大または縮小してもよい。これにより、所定の補正係数に基づいて補正した拡大率または縮小率に従って立体字幕画像が拡大または縮小されるという作用をもたらす。
また、この第1の側面において、上記字幕情報は、字幕を表わす画像または上記字幕を表わす文字列を含むこともできる。これにより、字幕画像に画像または文字列が含まれるという作用をもたらす。
本技術によれば、字幕画像の遠近感を強調することができるという優れた効果を奏し得る。
実施の形態における情報処理システムの一例を示す全体図である。 実施の形態における画像処理装置の一構成例を示すブロック図である。 実施の形態における動画ストリームの一構成例を説明するための図である。 実施の形態における字幕ストリームの一構成例を示す図である。 実施の形態における字幕ストリーム内のPESパケットのデータ構成の一例を示す図である。 実施の形態における字幕ストリーム内のPESパケットに格納されるデータの一例を示す図である。 実施の形態における字幕データバッファの一構成例を示す図である。 実施の形態における画像処理装置の動作の一例を示す図である。 実施の形態における視差を説明するための図である。 実施の形態における立体表示の方法の一例を示す図である。 実施の形態における遠近感を強調した立体字幕画像の一例を示す図である。
以下、本技術を実施するための形態(以下、実施の形態と称する)について説明する。説明は以下の順序により行う。
1.第1の実施の形態(視差に応じて立体字幕画像を拡大または縮小する例)
2.変形例(左側字幕画像を基準とした視差に応じて立体字幕画像を拡大または縮小する例)
<1.第1の実施の形態>
[情報処理システムの構成例]
図1は、実施の形態における情報処理システムの一例を示す全体図である。この情報処理システムは、受信装置100、画像処理装置200、および、表示装置300を備える。
受信装置100は、動画ストリームおよび字幕ストリームを受信するものである。この動画ストリームは、所定の放送規格に準拠して放送局などから配信された動画のデータである。放送規格としては、例えば、DVB(Digital Video Broadcast)が使用される。この動画は、時系列に沿って表示される複数の画像を含む。また、この動画は、立体表示させるために作成された動画であり、動画内の画像の各々を以下、「立体主画像」と称する。立体主画像の各々は、視聴者の左目に映すための左側主画像と、右目に映すための右側主画像とを含む。
また、動画は、所定の符号化方式に従って必要に応じて符号化されている。符号化方式としては、例えば、MPEG(Moving Picture Expert Group)2−TS(Transport Stream)規格が用いられる。MPEG2−TSにおいて、符号化された画像は、PES(Packetized Elementary Stream)パケットに格納され、それぞれの画像にはPTS(Presentation Time Stamp)が付与される。PTSは、再生出力の時刻管理情報であり、そのタイムスタンプが付与された画像をいつ再生出力するかを示す。
なお、受信装置100は、アナログ放送を受信し、その放送波をA/D(Analog to Digital)変換することにより動画ストリームを生成してもよい。
受信装置100が受信する字幕ストリームは、放送局などから配信された字幕に関するデータである。具体的には、字幕ストリームは、字幕データおよび視差を含む。字幕データは、例えば、字幕を表わす画像(以下「字幕画像」と称する。)や字幕を表わす文字列を含む。視差は、字幕を立体表示させるためのものである。具体的には、字幕データから左側字幕画像および右側字幕画像が生成された場合において、それらの画像の水平方向におけるずれが視差に該当する。この左側字幕画像および右側字幕画像からなる画像を以下、「立体字幕画像」と称する。字幕データおよび視差も必要に応じて符号化されてPESパケットに格納され、各々の字幕データおよび視差にはPTSが付与される。このPTSは字幕をいつ再生出力するかを示す時刻管理情報であり、動画と同期して字幕を再生するために用いられる。
字幕ストリームは、動画ストリームに多重化されて配信される。受信装置100は、動画ストリームから字幕ストリームを分離し、分離後の動画ストリームおよび字幕ストリームを画像処理装置200に供給する。なお、受信装置100の代わりに、画像処理装置200が字幕ストリームを分離してもよい。
画像処理装置200は、動画ストリームおよび字幕ストリームに基づいて、動画に字幕を合成するものである。具体的には、画像処理装置200は、字幕ストリームから、視差および字幕データを取得し、その視差に応じた位置に立体表示される立体字幕画像を字幕データから生成する。画像処理装置200は、その立体字幕画像を動画に合成する。そして、画像処理装置200は、立体字幕画像が合成された動画を表示装置300に供給する。
なお、画像処理装置200は、放送局などから配信された動画ストリームおよび字幕ストリームを受信装置100から取得する構成としているが、動画記録装置などに記録された動画ストリームおよび字幕ストリームを画像処理装置200が取得してもよい。
表示装置300は、立体字幕画像が合成された動画を立体表示するものである。立体表示の方式としては、アクティブシャッターグラス方式、偏光表示方式や、視差バリア方式などが用いられる。
[画像処理装置の構成例]
図2は、画像処理装置200の一構成例を示すブロック図である。この画像処理装置200は、視差取得部210、字幕データ取得部220、復号部230、字幕データバッファ240、同期制御部250、立体字幕画像生成部260、拡大縮小部270、および、字幕画像合成部280を含む。
視差取得部210は、字幕ストリームから視差およびPTSを取得するものである。具体的には、視差取得部210は、字幕ストリームにおけるPESパケットのヘッダからPTSを取得し、そのPESパケットのペイロードから視差を取得する。視差取得部210は、同じPESパケットから取得したPTSおよび視差を対応付けて字幕データバッファ240に保持させる。
字幕データ取得部220は、字幕ストリームから字幕データおよびPTSを取得するものである。具体的には、字幕データ取得部220は、字幕ストリームにおけるPESパケットのヘッダからPTSを取得し、そのPESパケットのペイロードから字幕データを取得する。視差取得部210は、同じPESパケットから取得したPTSおよび字幕データを対応付けて字幕データバッファ240に保持させる。なお、字幕データ取得部220は、特許請求の範囲に記載の字幕情報取得部の一例である。
復号部230は、動画ストリームが符号化されている場合に、その動画ストリームを復号するものである。この復号部230は、動画ストリームの符号化方式と対応する復号方式に従って、動画ストリームを復号する。復号部230は、復号した動画ストリームを字幕画像合成部280に供給する。また、復号部230は、字幕ストリームからPTSを取得して、同期制御部250に供給する。
同期制御部250は、動画の表示タイミングに同期して字幕データおよび視差を立体字幕画像生成部260に供給するものである。具体的には、同期制御部250は、復号部230が取得したPTSを受け取り、そのPTSに一致する値のPTSが字幕データバッファ240に保持されているか否かを判断する。保持されていれば、同期制御部250は、そのPTSと対応する字幕データおよび視差を字幕データバッファ240から読み出す。同期制御部250は、読み出した字幕データおよび視差を立体字幕画像生成部260に供給する。
立体字幕画像生成部260は、視差に応じた表示位置に立体表示するための立体字幕画像(左側字幕画像および右側字幕画像)を字幕データから生成するものである。具体的には、字幕データが字幕画像を含む場合には、立体字幕画像生成部260は、画像内において、その字幕画像を視差に応じて、視聴者から見て左方向にずらした画像と、右方向にずらした画像とを生成する。立体字幕画像生成部260は、これらの一方を左側字幕画像とし、他方を右側字幕画像とする。字幕データが、字幕を表わす文字列を含む場合は、立体字幕画像生成部260は、その文字列が描画された画像を字幕画像として生成し、その字幕画像を左右にずらして左側字幕画像および右側字幕画像を生成する。立体字幕画像生成部260は、生成した立体字幕画像を視差とともに拡大縮小部270に供給する。
拡大縮小部270は、立体字幕画像の表示位置が手前側であるほど、その立体字幕画像が大きくなるように立体字幕画像を拡大または縮小するものである。具体的には、拡大縮小部270は、次の式1を使用して、拡大率および縮小率を求める。
S=1−(α/100)×(D/Dm) 式1
式1において、Sは拡大率または縮小率である。αは、拡大率または縮小率を補正するための補正係数を百分率で表したものであり、「0」乃至「100」(%)の値が設定される。視差取得部210において取得された視差Dのみに基づいて決定されたS(拡大率または縮小率)では、遠近感の不足が解消されないことや、逆に遠近感が強調されすぎることがあるため、その場合には、補正係数αを用いてSが補正される。具体的には、遠近感が不足するとユーザが判断する場合にはより大きな補正係数αがユーザにより設定され、強調されすぎるとユーザが判断する場合にはより小さな補正係数がユーザにより設定される。視差Dは、段階数Dmを基準として定義される視差であり、段階数Dmは、手前側または奥側のそれぞれの範囲の視差を区分する段階数を示すものである。それぞれの範囲の視差Dを128段階で区分する場合、「128」が段階数Dmとして使用され、視差Dとして「−128」乃至「127」の値が画像処理装置200により取得される。取得された視差Dは、右側字幕画像を基準として左側字幕画像および右側字幕画像を水平方向にずらす量として用いられる。視差Dが負数である場合には、奥行き方向において、字幕画像が基準位置より手前側に立体表示され、視差Dが正数である場合には、字幕画像が基準位置より奥側に立体表示される。視差Dが「0」である場合には、字幕画像は基準位置に表示されるが、立体的には視認されない。この基準位置は、例えば、表示装置300の表示面の位置に設定される。
式1により、視差Dが負数(すなわち、表示位置が手前側)である場合には、「1」より大きなSが算出され、Sは拡大率として用いられる。一方、視差Dが正数(すなわち、表示位置が奥側)である場合には、「1」より小さなSが算出され、Sは縮小率として用いられる。拡大縮小部270は、算出したSに基づいて立体字幕画像を拡大または縮小して字幕画像合成部280に供給する。
字幕画像合成部280は、拡大または縮小された立体字幕画像を動画に合成するものである。字幕画像合成部280は、立体字幕画像を合成した動画ストリームを表示装置300に供給する。
図3は、第1の実施の形態における動画ストリームの一構成例を示す図である。動画ストリームは、GOP(Group Of Pictures)と呼ばれる単位で符号化されており、このGOP単位で復号部230において復号される。このGOPは、符号化において基準となるI(Intra)ピクチャを少なくとも1枚含む画像の集合である。図3aでは、1枚のIピクチャと、4枚のP(Predirective)ピクチャと、10枚のB(Bidirectionally predictive)ピクチャとの計15枚の画像611によりGOP610を構成する様子が示されている。ここで、Iピクチャは、符号化において基準とされる画像である。Pピクチャは、時間的に先行するIピクチャまたはPピクチャとの差分を利用して符号化される画像である。Bピクチャは、時間的に前後両方向のIピクチャまたはPピクチャとの差分を利用して符号化される画像である。
GOP内の15枚の画像は、図3bに例示するように一部の順序が入れ替えられて符号化される。これは、MPEG規格における符号化方式の特徴に基づくものであり、復号の際に時間的に後続の画像を待つことを回避するためである。例えば、Bピクチャ(B5)を復号化するためにはIピクチャ(I3)とPピクチャ(P6)を参照する必要がある。このため、Bピクチャ(B5)を復号する時点で必要な画像データ(I3およびP6)が揃うように、図3bのような入れ替えをしなければならない。なお、このような画像621の順序関係を定義するために、V_PCKのパックヘッダにおいてPTS622およびDTS(Decoding Time Stamp)623というタイムスタンプが付与される。PTS622は前述したように、再生出力の時刻管理情報であり、そのタイムスタンプが付与された単位画像をいつ再生出力するかを示す。一方、DTS623は復号の時刻管理情報であり、そのタイムスタンプが付与された単位画像をいつ復号するかを示す。
符号化された各画像は、図3cに例示するように、それぞれ1つ以上のパックに収められる。パックとは、複数のPESパケットを連結してパックヘッダを付加したものである。例えば、Iピクチャ(I3)はV_PCK_I3(530)として保持され、Bピクチャ(B1)はV_PCK_B1(531)として保持される。そして、1個のGOP610を構成するV_PCK530の集合においては、補助的なデータを含むARI_PCK520がA_PCK520とともに多重化される。多重化されたパック群は、動画ストリームを構成する。
図4は、実施の形態における字幕ストリームの一構成例を示す図である。字幕ストリームは、動画ストリームとは独立したPESパケット群から構成される。このPESパケットは、字幕ストリームを構成するデータ(字幕データや視差など)を必要に応じて分割し、ヘッダを付加してパケット化したものである。字幕ストリームにおける各々のPESパケットは、パケットヘッダおよびペイロードを含む。パケットヘッダには、PTSなどが記載される。ペイロードには、PTSの示すタイミングで表示される字幕データや、その字幕データの視差が格納される。また、ペイロードには、字幕データが表示される領域の水平座標や垂直座標、字幕データが合成される主画像の構成(水平座標および垂直座標の範囲など)が格納される。
図5は、実施の形態における字幕ストリーム内のPESパケットのデータ構成の一例を示す図である。このPESパケットにおいては、例えば、DVB(Digital Video Broadcasting)規格に従ってデータが記述される。DVB規格において、PESパケットのヘッダには、字幕ストリームの識別情報(Stream_id)、PESパケット長(PES_packet_length)、および、字幕データのPTSなどが記載される。また、字幕データがPESパケット内に配置されることを示すインジケータ(PES_alignment_indicator)が記載される。「PES_packet_data_byte」のフィールドには、PESパケットのペイロード(「PES_data_field」内のデータ)が格納される。このペイロードには、「subtitle_segment()」のフィールドが設けられる。DVB規格においては、字幕ストリームの構成要素のデータのそれぞれは「segment」と呼ばれる。それぞれの「segment」の詳細は、図5における「subtitle_segment()」のフィールドにおいて記述される。具体的には、「subtitle_segment()」には、「segment」の開始位置を特定するための情報(sync_byte)、「segment」の種類(segment_type)、その長さ(segment_length)、および、「segment」が用いられる主画像の識別情報(page_id)が記載される。また、「segment」のデータ自体は「segment_data_field」に格納される。「segment」の種類(segment_type)は、例えば、字幕データ、視差、字幕データの構成情報(表示される領域の水平座標や垂直座標など)、字幕データが合成される主画像の構成(水平座標および垂直座標の範囲など)である。
図6は、実施の形態におけるPESパケットに格納されるデータの一例を示す図である。前述したように、PESパケットのペイロード内の「subtitle_segment()」には、「segment_type」や「segment_data_field()」と呼ばれる領域が設けられる。「segment_data_field()」には、字幕データや視差が格納される。図6aに示すように、「segment_data_field()」に「segment」として字幕データが格納される場合には、「segment_type」のフィールドにおいて、「segment」が字幕データであることを示す「0x13」が記載される。また、図6aに示すように、「segment_data_field()」に「segment」として視差が格納される場合には、「segment_type」のフィールドにおいて、「segment」が視差であることを示す「0x15」が記載される。
図7は、字幕データバッファ240の一構成例を示す図である。字幕データバッファ240には、PTSに対応付けて視差および字幕データが保持される。PTSが付与されたPESパケットから取得された視差は、そのPTSに対応付けて字幕データバッファ250に保持される。また、PTSが付与されたPESパケットから取得された字幕データは、そのPTSに対応付けて字幕データバッファ240に保持される。PTSが共通の字幕データおよび視差は、そのPTSに対応付けて保持される。例えば、「PTS#1」に対応付けて「字幕データ#1」と「10」の視差とが保持される場合、「PTS#1」のタイミングにおいて、「字幕データ#1」および「10」が読み出される。そして、「字幕データ#1」は、視差「10」に応じた位置に立体表示される。
[画像処理装置の動作例]
図8は、実施の形態における画像処理装置200の動作の一例を示す図である。この動作は、例えば、画像処理装置200に動画ストリームおよび字幕ストリームが入力されたときに開始する。
画像処理装置200における視差取得部210は、字幕ストリームからPTSおよび視差を取得して字幕データバッファ240に保持させる(ステップS901)。また、字幕データ取得部220は、字幕ストリームから字幕データおよび視差を取得して字幕データバッファ240に保持させる(ステップS902)。同期制御部250は、動画ストリームから取得されたPTSに対応する字幕データおよび視差を字幕データバッファ240から読み出す。そして、立体字幕画像生成部260は、読み出された字幕データから立体字幕画像を生成する(ステップS903)。
拡大縮小部270は、視差に応じて立体字幕画像を拡大または縮小する(ステップS904)。字幕画像合成部は、拡大または縮小された立体字幕画像を立体主画像に合成する(ステップS905)。ステップS905の後、画像処理装置200はステップS901に戻る。
図9は、実施の形態における視差を説明するための図である。表示装置300の表示面に表示される右側画像の基準の水平座標(例えば、中央の水平座標)をXとし、左側画像の基準の水平座標をXとする。水平座標は、視聴者から見て左側であるほど、値が小さいものとする。この場合において、例えば、XからXを減じた値が視差Dとして用いられる。
ここで、左目と右目との間の距離をベース距離Bとし、視聴者から表示装置300までの距離をfとし、奥行き方向に立体的に視認される立体画像の表示位置をZpとする。このとき、右目、左目および立体画像の中心のなす三角形と、X、Xおよび立体画像の中心のなす三角形とは相似であるため、次の式2が成立する。
D:f=B:Zp 式2
式2により、Zpに表示させるための視差Dが求められて、字幕ストリームにより配信される。Zpに表示された位置では、字幕画像の遠近感が不足する場合には、式1により求められた拡大率または縮小率により、字幕画像が拡大または縮小される。その拡大率または縮小率による遠近感の程度は、式1における補正係数αを変更することにより調整される。
図10は、実施の形態における立体表示の方法の一例を示す図である。図10aは、字幕画像を手前側に表示するための表示方法の一例を示す図である。水平方向において、右側字幕画像701の座標は視聴者から見て左側であり、左側字幕画像702の座標が視聴者から見て右側であるものとする。この場合において、視聴者の左目に左側字幕画像702が映り、右目に右側字幕画像701が映るように、表示装置300がこれらの画像を表示すると、視聴者は、字幕画像801が手前側に表示されているように視認することができる。
図10bは、基準位置に字幕画像を表示する表示方法の一例を示す図である。右側字幕画像701および左側字幕画像702の水平座標は変わらないものとする。この場合において、視聴者の左目に左側字幕画像702が映り、右目に右側字幕画像701が映るように、表示装置300がこれらの画像を表示すると、表示装置300の表示面(基準位置)に字幕画像801が表示されているように視認される。このときは、字幕画像801は、立体的に視認されない。
図10cは、字幕画像を奥側に表示するための表示方法の一例を示す図である。水平方向において、右側字幕画像701の座標は視聴者から見て右側であり、左側字幕画像702の座標が視聴者から見て左側であるものとする。この場合において、視聴者の左目に左側字幕画像702が映り、右目に右側字幕画像701が映るように、表示装置300がこれらの画像を表示すると、視聴者は、字幕画像801が奥側に表示されているように、立体的に視認することができる。
図11は、実施の形態における遠近感を強調した立体字幕画像の一例を示す図である。図11aは、手前側に表示される立体字幕画像の一例を示す図である。この場合、画像処理装置200は、視差に応じて立体字幕画像(701および702)を拡大する。これにより、視聴者が視認する字幕画像801の表示位置が手前側であるほど、字幕画像801が拡大されて立体表示される。
図11bは、字幕画像を奥側に表示される立体字幕画像場合の一例を示す図である。この場合、画像処理装置200は、視差に応じて立体字幕画像(701および702)を縮小する。これにより、視聴者が視認する字幕画像801の表示位置が奥側であるほど、字幕画像801が縮小されて立体表示される。
このように、本技術の実施の形態によれば、表示位置が手前側であるほど立体字幕画像が大きくなるように立体字幕画像を拡大または縮小することにより、字幕画像の遠近感を強調することができる。これにより、立体表示される動画において、2D−3D変換された字幕画像を合成する場合において、視聴者が字幕画像の遠近感の不足を感じることがなくなる。
<2.変形例>
変形例について説明する。第1の実施の形態においては、右側字幕画像を基準として視差Dを定義していた。しかし、これとは逆に左側字幕画像を基準として、左側字幕画像および右側字幕画像の水平方向におけるずれを視差Dとして用いてもよい。変形例の画像処理装置200では、左側字幕画像を基準として視差を定義する点において上述の実施の形態と異なる。具体的には、図9に例示したようにXからXを減じた値を視差Dとするのではなく、画処理装置200は、XからXを減じた値を視差Dとして用いる。この場合には、表示位置が手前側である場合に視差Dが正数となり、奥側である場合に視差Dが負数となる。このため、次の式2を使用してSが算出される。
S=1+(α/100)×(D/Dm) 式3
式3より、視差Dが正数である場合には、「1」より大きなS(拡大率)が算出され、視差Dが負数である場合には、「1」より小さなS(縮小率)が算出される。
なお、上述の実施の形態は本技術を具現化するための一例を示したものであり、実施の形態における事項と、特許請求の範囲における発明特定事項とはそれぞれ対応関係を有する。同様に、特許請求の範囲における発明特定事項と、これと同一名称を付した本技術の実施の形態における事項とはそれぞれ対応関係を有する。ただし、本技術は実施の形態に限定されるものではなく、その要旨を逸脱しない範囲において実施の形態に種々の変形を施すことにより具現化することができる。
また、上述の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。この記録媒体として、例えば、CD(Compact Disc)、MD(MiniDisc)、DVD(Digital Versatile Disk)、メモリカード、ブルーレイディスク(Blu-ray Disc(登録商標))等を用いることができる。
なお、本技術は以下のような構成もとることができる。
(1)立体主画像に合成される字幕情報を取得する字幕情報取得部と、
前記字幕情報を立体表示させるための視差を取得する視差取得部と、
前記視差に応じた表示位置に立体表示される立体字幕画像を前記字幕情報から生成する立体字幕画像生成部と、
前記表示位置が手前側であるほど前記立体字幕画像が大きくなるように前記立体字幕画像を拡大または縮小する拡大縮小部と
を具備する画像処理装置。
(2)前記拡大縮小部は、前記表示位置が所定の基準位置より手前側である場合には前記視差に応じて前記立体字幕画像を拡大し、前記表示位置が前記所定の基準位置より奥側である場合には前記視差に応じて前記立体字幕画像を縮小する
前記(1)記載の画像処理装置。
(3)前記拡大または縮小された立体字幕画像を前記立体主画像に合成する字幕合成部をさらに具備する前記(1)または(2)記載の画像処理装置。
(4)前記字幕画像と当該字幕情報の視差および表示タイミングとを対応付けて保持するバッファと、
前記表示タイミングにおいて当該表示タイミングに対応する前記字幕情報および前記視差を前記バッファから読み出して前記画像生成部に供給する制御部と
をさらに具備し、
前記字幕情報取得部は前記表示タイミングをさらに取得して当該表示タイミングに前記字幕情報に対応付けて前記バッファに保持させ、
前記視差取得部は前記表示タイミングをさらに取得して当該表示タイミングに前記視差を対応付けて前記バッファに保持させる
前記(1)乃至(3)のいずれかに記載の画像処理装置。
(5)前記拡大縮小部は、所定の補正係数に基づいて補正した拡大率または縮小率に従って前記立体字幕画像を拡大または縮小する
前記(1)乃至(4)のいずれかに記載の画像処理装置。
(6)前記字幕情報は、字幕を表わす画像または前記字幕を表わす文字列を含む
前記(1)乃至(5)のいずれかに記載の画像処理装置。
(7)字幕情報取得部が、立体主画像に合成される字幕情報を取得する字幕情報取得手順と、
視差取得部が、前記字幕情報を立体表示させるための視差を取得する視差取得手順と、
立体字幕画像生成部が、前記視差に応じた表示位置に立体表示される立体字幕画像を前記字幕情報から生成する立体字幕画像生成手順と、
拡大縮小部が、前記表示位置が手前側であるほど前記立体字幕画像が大きくなるように前記立体字幕画像を拡大または縮小する拡大縮小手順と
を具備する画像処理方法。
(8)字幕情報取得部が、立体主画像に合成される字幕情報を取得する字幕情報取得手順と、
視差取得部が、前記字幕情報を立体表示させるための視差を取得する視差取得手順と、
立体字幕画像生成部が、前記視差に応じた表示位置に立体表示される立体字幕画像を前記字幕情報から生成する立体字幕画像生成手順と、
拡大縮小部が、前記表示位置が手前側であるほど前記立体字幕画像が大きくなるように前記立体字幕画像を拡大または縮小する拡大縮小手順と
をコンピュータに実行させるためのプログラム。
100 受信装置
200 画像処理装置
210 視差取得部
220 字幕データ取得部
230 復号部
240 字幕データバッファ
250 同期制御部
260 立体字幕画像生成部
270 拡大縮小部
280 字幕画像合成部
300 表示装置

Claims (7)

  1. 立体主画像に合成される字幕情報を取得する字幕情報取得部と、
    前記字幕情報を立体表示させるための視差を取得する視差取得部と、
    前記視差に応じた表示位置に立体表示される立体字幕画像を前記字幕情報から生成する立体字幕画像生成部と、
    前記取得された視差に可変の値である所定の補正係数を乗じた値に基づいて決定された比率により前記立体字幕画像を拡大または縮小する拡大縮小部と
    を具備する画像処理装置。
  2. 前記拡大縮小部は、前記表示位置が所定の基準位置より手前側である場合には前記視差に応じて前記立体字幕画像を拡大し、前記表示位置が前記所定の基準位置より奥側である場合には前記視差に応じて前記立体字幕画像を縮小する
    請求項1記載の画像処理装置。
  3. 前記拡大または縮小された立体字幕画像を前記立体主画像に合成する字幕合成部をさらに具備する請求項1記載の画像処理装置。
  4. 前記字幕画像と当該字幕情報の視差および表示タイミングとを対応付けて保持するバッファと、
    前記表示タイミングにおいて当該表示タイミングに対応する前記字幕情報および前記視差を前記バッファから読み出して前記画像生成部に供給する制御部と
    をさらに具備し、
    前記字幕情報取得部は前記表示タイミングをさらに取得して当該表示タイミングに前記字幕情報に対応付けて前記バッファに保持させ、
    前記視差取得部は前記表示タイミングをさらに取得して当該表示タイミングに前記視差を対応付けて前記バッファに保持させる
    請求項1記載の画像処理装置。
  5. 前記字幕情報は、字幕を表わす画像または前記字幕を表わす文字列を含む
    請求項1記載の画像処理装置。
  6. 字幕情報取得部が、立体主画像に合成される字幕情報を取得する字幕情報取得手順と、
    視差取得部が、前記字幕情報を立体表示させるための視差を取得する視差取得手順と、
    立体字幕画像生成部が、前記視差に応じた表示位置に立体表示される立体字幕画像を前記字幕情報から生成する立体字幕画像生成手順と、
    拡大縮小部が、前記取得された視差に可変の値である所定の補正係数を乗じた値に基づいて決定された比率により前記立体字幕画像を拡大または縮小する拡大縮小手順と
    を具備する画像処理方法。
  7. 字幕情報取得部が、立体主画像に合成される字幕情報を取得する字幕情報取得手順と、
    視差取得部が、前記字幕情報を立体表示させるための視差を取得する視差取得手順と、
    立体字幕画像生成部が、前記視差に応じた表示位置に立体表示される立体字幕画像を前記字幕情報から生成する立体字幕画像生成手順と、
    拡大縮小部が、前記取得された視差に可変の値である所定の補正係数を乗じた値に基づいて決定された比率により前記立体字幕画像を拡大または縮小する拡大縮小手順と
    をコンピュータに実行させるためのプログラム。
JP2012110717A 2012-05-14 2012-05-14 画像処理装置、画像処理方法およびプログラム Expired - Fee Related JP6307213B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2012110717A JP6307213B2 (ja) 2012-05-14 2012-05-14 画像処理装置、画像処理方法およびプログラム
PCT/JP2013/058974 WO2013172097A1 (ja) 2012-05-14 2013-03-27 画像処理装置、画像処理方法およびプログラム
US14/400,403 US20150138316A1 (en) 2012-05-14 2013-03-27 Image processing apparatus, image processing method, and program
EP13790657.4A EP2852163A4 (en) 2012-05-14 2013-03-27 IMAGE PROCESSING DEVICE, IMAGE PROCESSING AND PROGRAM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012110717A JP6307213B2 (ja) 2012-05-14 2012-05-14 画像処理装置、画像処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2013238975A JP2013238975A (ja) 2013-11-28
JP6307213B2 true JP6307213B2 (ja) 2018-04-04

Family

ID=49583516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012110717A Expired - Fee Related JP6307213B2 (ja) 2012-05-14 2012-05-14 画像処理装置、画像処理方法およびプログラム

Country Status (4)

Country Link
US (1) US20150138316A1 (ja)
EP (1) EP2852163A4 (ja)
JP (1) JP6307213B2 (ja)
WO (1) WO2013172097A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6252849B2 (ja) * 2014-02-07 2017-12-27 ソニー株式会社 撮像装置および方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3086577B2 (ja) 1993-12-22 2000-09-11 三洋電機株式会社 2次元画像の3次元化方法
CN102067591B (zh) * 2008-06-26 2014-03-19 松下电器产业株式会社 再现装置、记录装置、再现方法及记录方法
US20110169824A1 (en) * 2008-09-29 2011-07-14 Nobutoshi Fujinami 3d image processing device and method for reducing noise in 3d image processing device
RU2512135C2 (ru) * 2008-11-18 2014-04-10 Панасоник Корпорэйшн Устройство воспроизведения, способ воспроизведения и программа для стереоскопического воспроизведения
US8436918B2 (en) * 2009-02-27 2013-05-07 Deluxe Laboratories, Inc. Systems, apparatus and methods for subtitling for stereoscopic content
JP5274359B2 (ja) * 2009-04-27 2013-08-28 三菱電機株式会社 立体映像および音声記録方法、立体映像および音声再生方法、立体映像および音声記録装置、立体映像および音声再生装置、立体映像および音声記録媒体
JP2011199389A (ja) * 2010-03-17 2011-10-06 Sony Corp 画像処理装置、画像変換方法、およびプログラム
CN102845067B (zh) * 2010-04-01 2016-04-20 汤姆森许可贸易公司 三维(3d)呈现中的字幕
JP2011249945A (ja) * 2010-05-24 2011-12-08 Sony Corp 立体画像データ送信装置、立体画像データ送信方法、立体画像データ受信装置および立体画像データ受信方法
JP2012004654A (ja) 2010-06-14 2012-01-05 Sharp Corp 映像表示装置及びその表示制御方法
CN102598686B (zh) * 2010-08-06 2016-08-17 松下知识产权经营株式会社 再现装置、集成电路、再现方法
JP5633259B2 (ja) * 2010-09-06 2014-12-03 ソニー株式会社 立体画像データ送信装置、立体画像データ送信方法および立体画像データ受信装置
JP2012085166A (ja) * 2010-10-13 2012-04-26 Sony Corp 映像信号処理装置及び映像信号処理方法、並びにコンピューター・プログラム
TWI491244B (zh) * 2010-11-23 2015-07-01 Mstar Semiconductor Inc 調整物件三維深度的方法與裝置、以及偵測物件三維深度的方法與裝置
US8982187B2 (en) * 2011-09-19 2015-03-17 Himax Technologies Limited System and method of rendering stereoscopic images
JP2013239833A (ja) * 2012-05-14 2013-11-28 Sony Corp 画像処理装置、画像処理方法およびプログラム

Also Published As

Publication number Publication date
EP2852163A4 (en) 2016-01-06
US20150138316A1 (en) 2015-05-21
WO2013172097A1 (ja) 2013-11-21
JP2013238975A (ja) 2013-11-28
EP2852163A1 (en) 2015-03-25

Similar Documents

Publication Publication Date Title
TWI520566B (zh) 在三維視訊上疊加三維圖形的方法及裝置
US20100269065A1 (en) Data structure, recording medium, playback apparatus and method, and program
US8848037B2 (en) Data structure, recording medium, playing device and playing method, and program
JP2011172216A (ja) 再生装置
WO2010119814A1 (ja) データ構造、記録媒体、再生装置および再生方法、並びにプログラム
JP6092525B2 (ja) 画像処理装置、情報処理システム、画像処理方法およびプログラム
JP6307213B2 (ja) 画像処理装置、画像処理方法およびプログラム
WO2013172098A1 (ja) 画像処理装置、画像処理方法およびプログラム
JP4707766B1 (ja) 三次元ビデオストリームへの映像変換方法
JP2010252055A (ja) データ構造、記録媒体、再生装置および再生方法、並びにプログラム
JP4985890B2 (ja) 再生装置および再生方法、並びに記録方法
JP5532864B2 (ja) 再生装置、立体映像記録再生方法、及び再生方法
JP5422597B2 (ja) 三次元映像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160527

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20160624

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160729

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170215

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170223

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20170414

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180312

R150 Certificate of patent or registration of utility model

Ref document number: 6307213

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees