WO2013054371A1

WO2013054371A1 - 立体字幕処理装置および立体字幕処理方法

Info

Publication number: WO2013054371A1
Application number: PCT/JP2011/005678
Authority: WO
Inventors: 浩二濱崎; 片岡　充照
Original assignee: パナソニック株式会社
Priority date: 2011-10-11
Filing date: 2011-10-11
Publication date: 2013-04-18
Also published as: US20140240472A1

Abstract

　複数の字幕データが示す複数の字幕を立体表示装置（１０）に立体表示させるための立体字幕処理装置（１００）であって、立体表示装置（１０）における字幕の表示方法に関する設定である字幕表示設定を管理する設定管理部（１０１）と、字幕表示設定が字幕の表示方法を変更することを示している場合であって、かつ複数の字幕データが示す複数の字幕が同一画面上に表示される場合に、複数の字幕のうち、より早く表示が開始される字幕がより奥側に立体表示されるように、複数の字幕データに含まれる複数の奥行情報のうちの少なくとも１つを補正する奥行補正部（１０２）と、複数の奥行情報のうちの少なくとも１つが補正された後の複数の字幕データを用いて、複数の字幕を立体表示装置に立体表示させるための立体字幕画像を生成する字幕描画部（１０３）とを備える。

Description

立体字幕処理装置および立体字幕処理方法

　本発明は、複数の立体字幕を表示部に表示するための立体字幕処理装置および立体字幕処理方法に関する。

　近年、立体映像を表示可能なテレビまたはパーソナルコンピュータが増加している。このようなテレビまたはパーソナルコンピュータによって表示される映像の立体感を損なわないために、テキスト情報（字幕など）も立体表示するための基盤技術が整いつつある。例えば特許文献１では、視聴者であるユーザが遠近感の矛盾を感じないように、画像内の各物体（オブジェクト）よりも手前に字幕を表示する技術が提案されている。これにより、画像内の各物体と字幕との間の遠近感の整合性の維持を図ることができる。

特開２０１１－３０２００号公報

　しかしながら、従来の技術では、画像内の各物体と字幕との間の遠近感の整合性の維持は図られているが、字幕同士の遠近感の整合性については考慮されていない。例えば、立体表示装置において字幕の表示方法の設定が変更された場合（例えば字幕のサイズが大きくされる場合など）、字幕同士の遠近感に不整合が生じることがある。

　例えば、近年の技術革新により、テレビのような大型画面を有する機器だけでなく、小さな画面をもつモバイル機器でも、ユーザが立体映像を視聴することできるようになることは容易に想像できる。このような場合、小さな画面では字幕が見難いため字幕の大きさを表示機器側で変更するといったことが考えられる。例えば、字幕の大きさが拡大されれば、複数の字幕が画面上で重なってしまうこともある。そして、重なりあった複数の字幕が同じ奥行き感をもっている場合、表示上は字幕が重なっているにもかかわらず、奥行き感が同じなので、ユーザに違和感を与えてしまう。

　そこで、本発明は、上記課題の解決をするためになされたものであって、立体表示装置において字幕の表示方法が変更された場合であっても、複数の字幕間における立体表示の不整合を抑制することができる立体字幕処理装置および立体字幕処理方法を提供することを目的とする。

　上記課題を解決するために、本発明の一態様に係る立体字幕処理装置は、複数の字幕データが示す複数の字幕を立体表示装置に立体表示させるための立体字幕処理装置であって、前記立体表示装置における字幕の表示方法に関する設定である字幕表示設定を管理する設定管理部と、前記字幕表示設定が字幕の表示方法を変更することを示している場合であって、かつ複数の字幕データが示す複数の字幕が同一画面上に表示される場合に、前記複数の字幕のうち、より早く表示が開始される字幕がより奥側に立体表示されるように、前記複数の字幕データに含まれる複数の奥行情報のうちの少なくとも１つを補正する奥行補正部と、前記複数の奥行情報のうちの少なくとも１つが補正された後の前記複数の字幕データを用いて、前記複数の字幕を前記立体表示装置に立体表示させるための立体字幕画像を生成する字幕描画部とを備える。

　この構成により、同一画面に表示される複数の字幕のうち、より早く表示が開始される字幕がより奥側に立体表示されるように、複数の字幕の奥行情報を補正するができる。その結果、画面上で古い字幕の上に新しい字幕が重ねられる場合に、新しい字幕が古い字幕よりも手前側に立体表示される。つまり、画面上における字幕の重なり方と字幕の奥行き感との間の整合性を保つことができるので、複数の字幕間における立体表示の不整合を抑制することができる。また、画面上に複数の字幕が分散して表示されるような場合に、複数の字幕の中から最新の字幕を探すことが容易にもなる。

　また、前記立体字幕処理装置は、さらに、前記複数の字幕データと前記字幕表示設定とに基づいて、前記複数の字幕の画面上の表示領域をそれぞれ算出する字幕領域演算部を備え、前記奥行補正部は、算出された複数の表示領域の少なくとも一部が画面上で重なる場合に、前記複数の奥行情報のうちの少なくとも１つを補正することが好ましい。

　この構成により、複数の字幕が画面上で重なる場合にのみ奥行情報を補正することができる。つまり、画面上における字幕の重なり方と字幕の奥行き感との間に不整合が生じる可能性が高い場合にのみ、効率的に奥行情報を補正することができる。また、奥行情報の補正によって、元の字幕データが示す奥行き感が損なわれることを抑制することもできる。

　また、前記奥行補正部は、前記複数の字幕の種別が互いに異なる場合に前記複数の奥行情報のうちの少なくとも１つを補正し、前記複数の字幕の種別が同一である場合に前記複数の奥行情報を補正しないことが好ましい。

　この構成により、複数の字幕の種別が同一の場合に奥行情報を補正することを防止することができる。その結果、例えば、同一人物の一連の発言に対応する複数の字幕が互いに異なる奥行き感で立体表示されることを抑制することができる。したがって、奥行情報の補正によってユーザに不快感を与えることを抑制することができる。

　また、前記奥行補正部は、前記複数の字幕の表示が開始される時刻の差が閾値以上である場合に前記複数の奥行情報のうちの少なくとも１つを補正し、前記複数の字幕の表示が開始される時刻の差が前記閾値未満である場合に前記複数の奥行情報を補正しないことが好ましい。

　この構成により、複数の字幕の表示が次々と開始される場合に、それらの複数の字幕の奥行き感を同一にすることができる。その結果、例えば、同一人物の一連の発言に対応する複数の字幕が互いに異なる奥行き感で立体表示されることを抑制することができる。したがって、奥行情報の補正によってユーザに不快感を与えることを抑制することができる。

　また、前記設定管理部は、前記立体表示装置における字幕の表示サイズおよび表示時間のうちの少なくとも一方に関する設定を前記字幕表示設定として管理することが好ましい。

　この構成により、字幕の表示サイズおよび表示時間のうちの少なくとも一方に関する設定が変更された場合に、奥行情報を補正することができる。つまり、複数の字幕が重なって表示される可能性が高い設定の変更が行われた場合に奥行情報を補正することが可能となる。

　また、前記立体字幕処理装置は、さらに、前記立体字幕画像と立体映像とを重畳した立体字幕映像を前記立体表示装置に出力するビデオ出力部と、前記立体表示装置に立体表示された前記複数の字幕の少なくとも１つに対するユーザの操作を受け付ける操作受付部とを備え、前記ビデオ出力部は、受け付けられた前記操作が予め定められた操作である場合に、特殊再生モードで前記立体字幕映像を出力することが好ましい。

　この構成により、立体表示された字幕に対するユーザの操作に応じた特殊再生モードで立体字幕映像を出力することができる。つまり、ユーザは、字幕に対する直感的な操作により特殊再生モードを制御することが可能となる。

　また、前記ビデオ出力部は、受け付けられた前記操作が、立体表示された前記複数の字幕の少なくとも１つを手前側に移動させるための操作である場合に、巻き戻し再生モードで前記立体字幕映像を出力することが好ましい。

　この構成により、立体表示された字幕を手前側に移動させるための操作により、巻き戻し再生することが可能となる。つまり、古い字幕を新しい字幕に近付ける操作によって巻き戻し再生を実現することができるので、ユーザは、字幕に対する直感的な操作により特殊再生モードを制御することが可能となる。

　また、前記ビデオ出力部は、受け付けられた前記操作が、立体表示された前記複数の字幕の少なくとも１つを奥側に移動させるための操作である場合に、早送り再生モードで前記立体字幕映像を出力することが好ましい。

　この構成により、立体表示された字幕を奥側に移動させるための操作により、早送り再生することが可能となる。つまり、新しい字幕を古い字幕に近付ける操作によって早送り再生を実現することができるので、ユーザは、字幕に対する直感的な操作により特殊再生モードを制御することが可能となる。

　また、前記設定管理部は、立体表示された前記複数の字幕を奥側に移動させるための操作が受け付けられた場合に、前記立体表示装置における映像に対する字幕の表示時間が、字幕データが示す、映像に対する字幕の表示時間よりも長くなるように、前記字幕表示設定を変更することが好ましい。

　この構成により、早送り再生モードの場合に、字幕の表示時間が短くなりすぎることを抑制することができる。

　なお、本発明は、このような立体字幕処理装置として実現することができるだけでなく、このような立体字幕処理装置が備える特徴的な構成要素が行う各処理を含む立体字幕処理方法として実現することができる。

　本発明によれば、立体表示装置において字幕の表示方法が変更された場合であっても、複数の字幕間における立体表示の不整合を抑制することができる。

図１は、本発明の実施の形態１に係る立体字幕処理装置を備える立体表示システムの外観図である。図２は、本発明の実施の形態１に係る立体字幕処理装置の機能構成を示すブロック図である。図３は、本発明の実施の形態１に係る立体字幕処理装置の処理動作を示すフローチャートである。図４は、本発明の実施の形態１において立体表示される複数の字幕を説明するための図である。図５は、本発明の実施の形態２に係る立体字幕処理装置の機能構成を示すブロック図である。図６は、本発明の実施の形態２に係る立体字幕処理部の詳細な機能構成を示すブロック図である。図７は、本発明の実施の形態２に係る字幕領域演算部の処理動作の一例を説明するための図である。図８は、本発明の実施の形態２に係る字幕領域演算部によって算出された複数の表示領域の一例を説明するための図である。図９は、本発明の実施の形態２に係る字幕領域演算部によって算出された複数の表示領域の一例を説明するための図である。図１０は、本発明の実施の形態２に係る奥行補正部によって補正された視差の一例を示す図である。図１１は、本発明の実施の形態２に係る奥行補正部による奥行情報の補正方法の一例を示す図である。図１２は、本発明の実施の形態２に係る立体字幕処理装置における処理動作を示すフローチャートである。図１３は、本発明の実施の形態２に係る奥行補正部による奥行情報の計算方法を説明するための図である。図１４は、本発明の実施の形態３に係る奥行補正部の処理動作の一例を説明するための図である。図１５は、本発明の実施の形態３に係る奥行補正部の処理動作の一例を説明するための図である。図１６は、本発明の実施の形態３に係る立体字幕処理装置の処理動作を示すフローチャートである。図１７は、本発明の実施の形態４に係る立体字幕処理装置の機能構成を示すブロック図である。図１８は、本発明の実施の形態４に係る立体字幕処理装置の処理動作を示すフローチャートである。図１９は、本発明の実施の形態４に係る立体字幕処理装置の処理動作の一例を説明するための図である。

　以下本発明の実施の形態について、図面を参照しながら説明する。なお、以下で説明する実施の形態は、いずれも本発明の好ましい一具体例を示す。つまり、以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置および接続形態、ステップ、ステップの順序などは、本発明の一例であり、本発明を限定する主旨ではない。本発明は、請求の範囲の記載によって限定される。したがって、以下の実施の形態における構成要素のうち、本発明の最上位概念を示す独立請求項に記載されていない構成要素は、本発明の課題を達成するために必ずしも必要ではないが、より好ましい形態を構成する構成要素として説明される。

　（実施の形態１）
　図１は、本発明の実施の形態１に係る立体字幕処理装置１００を備える立体表示システムの外観図である。図１に示すように、立体表示システムは、立体表示装置１０と、立体表示装置１０に接続された立体字幕処理装置１００とを備える。

　立体表示装置１０は、立体字幕処理装置１００から受信する立体字幕画像を画面に表示することにより字幕を立体表示する。例えば、立体表示装置１０は、メガネ式の立体表示方式により字幕を立体表示する。メガネ式の立体表示方式とは、メガネ（例えば、液晶シャッターメガネまたは偏光メガネなど）を着用したユーザに対して、視差を有する右目用画像および左目用画像を表示する方式である。また例えば、立体表示装置１０は、裸眼式の立体表示方式により字幕を立体表示してもよい。裸眼式の立体表示方式は、メガネを用いない立体表示方式（例えば、パララックスバリア方式あるいはレンチキュラーレンズ方式など）である。

　なお、立体表示装置１０は、必ずしも図１に示すような据え置き型機器である必要はない。例えば、立体表示装置１０は、モバイル機器（例えば、携帯電話、タブレットＰＣ、または携帯ゲーム機）であっても構わない。

　立体字幕処理装置１００は、複数の字幕データが示す複数の字幕を立体表示装置１０に立体表示させるための立体字幕画像を生成する。複数の字幕データの各々は、字幕の奥行方向の表示位置（例えば視差）を示す奥行情報を含む。

　図２は、本発明の実施の形態１に係る立体字幕処理装置１００の機能構成を示すブロック図である。図２に示すように、立体字幕処理装置１００は、設定管理部１０１と、奥行補正部１０２と、字幕描画部１０３とを備える。以下に、これらの構成要素について詳細に説明する。

　設定管理部１０１は、立体表示装置１０における字幕の表示方法に関する設定である字幕表示設定を管理する。例えば、設定管理部１０１は、字幕の表示方法を変更するためのユーザからの指示（ユーザ指示）に従って字幕表示設定を変更する。なお、この字幕表示設定は、立体表示装置１０に対して有効な設定である。

　具体的には、設定管理部１０１は、例えば、立体表示装置１０における字幕の表示サイズおよび表示時間のうちの少なくとも一方に関する設定を字幕表示設定として管理する。これにより、設定管理部１０１は、複数の字幕が重なって表示されるか否かに与える影響が大きい字幕の表示方法に関する設定を字幕表示設定として管理することができる。

　なお、設定管理部１０１は、字幕の表示サイズおよび表示時間に関する設定以外の字幕の表示方法に関する設定を字幕表示設定として管理してもよい。例えば、設定管理部１０１は、字幕の画面上の表示位置またはフォントに関する設定を字幕表示設定として管理してもよい。

　奥行補正部１０２は、複数の字幕データを受信する。具体的には、奥行補正部１０２は、例えば放送あるいは通信ネットワークなどを介して、複数の字幕データを受信する。

　さらに、奥行補正部１０２は、字幕表示設定が字幕の表示方法を変更することを示す場合であって、かつ複数の字幕が同一画面上に表示される場合に、複数の字幕データに含まれる複数の奥行情報のうちの少なくとも１つを補正する。このとき、奥行補正部１０２は、複数の字幕データが示す複数の字幕のうち、より早く表示が開始される字幕がより奥側に立体表示されるように、複数の奥行情報のうちの少なくとも１つを補正する。逆に言えば、奥行補正部１０２は、複数の字幕データが示す複数の字幕のうち、より遅く表示が開始される字幕がより手前側に立体表示されるように、複数の奥行情報のうちの少なくとも１つを補正する。

　言い換えれば、奥行補正部１０２は、同一画面上に表示される複数の字幕の中で、表示開始タイミングが早い字幕（古い字幕）が、表示開始タイミングが遅い字幕（新しい字幕）よりも奥側に立体表示されるように、複数の奥行情報のうちの少なくとも１つを補正する。逆に言えば、奥行補正部１０２は、同一画面上に表示される複数の字幕の中で、新しい字幕が古い字幕よりも手前側に立体表示されるように、複数の奥行情報のうちの少なくとも１つを補正する。

　より具体的には、例えば、奥行情報が視差を示し、画面よりも手前に字幕が立体表示される場合、奥行補正部１０２は、複数の字幕のうち、より早く表示が開始される字幕ほど視差が小さくなるように、複数の奥行情報のうちの少なくとも１つを補正する。

　なお、奥行補正部１０２は、複数の奥行情報のすべてを補正してもよいし、複数の奥行情報のうちの１つだけを補正してもよい。

　字幕描画部１０３は、複数の奥行情報のうちの少なくとも１つが補正された後の複数の字幕データを用いて、複数の字幕を立体表示装置１０に立体表示させるための立体字幕画像を生成する。具体的には、字幕描画部１０３は、例えば、複数の字幕を含む右目用画像と、右目用画像に対して視差を有する複数の字幕を含む左目用画像とを、立体字幕画像として生成する。

　次に、以上のように構成された立体字幕処理装置１００における各種動作について説明する。図３は、本発明の実施の形態１に係る立体字幕処理装置１００の処理動作を示すフローチャートである。

　まず、奥行補正部１０２は、字幕表示設定が字幕の表示方法を変更することを示すか否かを判定する（Ｓ１０１）。つまり、設定管理部１０１によって管理されている字幕表示設定が、字幕データが示す字幕の表示方法を変更することを示すか否かが判定される。

　ここで、字幕表示設定が字幕の表示方法を変更することを示す場合（Ｓ１０１のＹｅｓ）、奥行補正部１０２は、複数の字幕データに含まれる複数の奥行情報のうちの少なくとも１つを補正する（Ｓ１０２）。具体的には、奥行補正部１０２は、同一画面に表示される複数の字幕のうち、より早く表示が開始される字幕がより奥側に表示されるように、複数の奥行情報のうちの少なくとも１つを補正する。一方、字幕表示設定が字幕の表示方法を変更しないことを示す場合（Ｓ１０１のＮｏ）、奥行補正部１０２は、複数の奥行情報を補正しない。

　続いて、字幕描画部１０３は、複数の字幕データを用いて、複数の字幕を立体表示装置１０に立体表示させるための立体字幕画像を生成する（Ｓ１０３）。つまり、字幕表示設定が字幕の表示方法を変更することを示す場合は、字幕描画部１０３は、少なくとも１つの奥行き情報が補正された後の複数の字幕データを用いて立体字幕画像を生成する。一方、字幕表示設定が変更されていない場合は、字幕描画部１０３は、奥行情報が補正されていない複数の字幕データをそのまま用いて立体字幕画像を生成する。

　図４は、本発明の実施の形態１において立体表示される複数の字幕を説明するための図である。図４では、字幕表示設定は、立体表示装置１０において字幕の表示方法を変更することを示すとする。

　まず、立体字幕処理装置１００は、第１字幕「ＡＡＡＡＡＡＡ」を示す第１字幕データを受信する。ここでは、複数の字幕が同一画面に表示されないので、奥行補正部１０２は、第１字幕データに含まれる奥行情報を補正しない。したがって、図４の（ａ）に示すように、第１字幕は、第１字幕データに含まれる奥行情報に従って立体表示される。

　その後、立体字幕処理装置１００は、第２字幕「ＢＢＢＢＢＢＢ」を示す第２字幕データを受信する。そこで、奥行補正部１０２は、第２字幕よりも早く表示が開始されている第１字幕が第２字幕よりも奥側に立体表示されるように、第１字幕データまたは第２字幕データに含まれる奥行情報を補正する。その結果、図４の（ｂ）に示すように、古い字幕である第１字幕は、新しい字幕である第２字幕よりも奥側に立体表示される。逆に言えば、第２字幕は、第１字幕よりも手前側に立体表示される。

　以上のように、本実施の形態に係る立体字幕処理装置１００によれば、同一画面に表示される複数の字幕のうち、より早く表示が開始される字幕がより奥側に立体表示されるように、複数の字幕の奥行情報を補正するができる。その結果、画面上で古い字幕の上に新しい字幕が重ねられる場合に、新しい字幕が古い字幕よりも手前側に立体表示される。つまり、画面上における字幕の重なり方と字幕の奥行き感との間の整合性を保つことができるので、複数の字幕間における立体表示の不整合を抑制することができる。また、画面上に複数の字幕が分散して表示されるような場合に、複数の字幕の中から最新の字幕を探すことを容易にすることができる。

　（実施の形態２）
　次に、本発明の実施の形態２について説明する。本実施の形態に係る立体字幕処理装置２００は、複数の字幕の表示領域の少なくとも一部が画面上で重なるか否かに応じて、奥行情報を補正するか否かを切り替える。なお、以下では、字幕が画面から飛び出すように立体表示され、かつ奥行情報が視差を示す場合について説明する。

　図５は、本発明の実施の形態２に係る立体字幕処理装置２００の機能構成を示すブロック図である。図５に示すように、本実施の形態に係る立体字幕処理装置２００は、デマルチプレクサ２０１と、オーディオデコーダ２０２と、ビデオデコーダ２０３と、字幕デコーダ２０４と、立体字幕処理部２０５と、オーディオ出力部２０６と、ビデオ出力部２０７と、字幕表示設定管理部２０８と、表示装置情報管理部２０９とを備える。

　デマルチプレクサ２０１は、入力信号から、ビデオ、オーディオ、および字幕のパケット（ＰＥＳパケット）を抽出し、各デコーダに送出する。

　オーディオデコーダ２０２は、デマルチプレクサ２０１で抽出されたオーディオのパケットからオーディオのエレメンタリストリームを再構成する。そして、オーディオデコーダ２０２は、オーディオのエレメンタリストリームの復号処理を行ってオーディオデータを得る。

　ビデオデコーダ２０３は、デマルチプレクサ２０１で抽出されたビデオのパケットからビデオのエレメンタリストリームを再構成する。そして、ビデオデコーダ２０３は、ビデオのエレメンタリストリームの復号処理を行って映像データを得る。

　字幕デコーダ２０４は、デマルチプレクサ２０１で抽出された字幕のパケットから字幕のエレメンタリストリームを再構成する。そして、字幕デコーダ２０４は、字幕のエレメンタリストリームの復号処理を行って字幕データを得る。この字幕データには、字幕の内容を示すテキスト情報、字幕の表示位置を示す位置情報、および字幕の視差を示す奥行情報などが含まれる。以下において、字幕デコーダ２０４によって得られた字幕データを入力字幕データとも呼ぶ。

　立体字幕処理部２０５は、字幕デコーダ２０４で得られた入力字幕データと、ビデオデコーダ２０３で得られた映像データ（例えば視差ベクトル）と、オーディオデコーダ２０２で得られたオーディオデータとを用いて、立体字幕画像を生成する。立体字幕処理部２０５の詳細は図６を用いて後述する。

　オーディオ出力部２０６は、オーディオデコーダ２０２で得られたオーディオデータを立体表示装置１０に出力する。

　ビデオ出力部２０７は、ビデオデコーダ２０３で得られた映像データが示す立体映像に対して立体字幕処理部２０５で生成された立体字幕画像を重畳することにより、立体字幕映像を生成する。そして、ビデオ出力部２０７は、生成された立体字幕映像を立体表示装置１０に出力する。

　字幕表示設定管理部２０８は、実施の形態１の設定管理部１０１に相当する。字幕表示設定管理部２０８は、ユーザからの指示に従って字幕表示設定（例えば、字幕表示サイズあるいは字幕表示時間など）を管理する。字幕表示設定管理部２０８は、書き換え可能な不揮発性の記憶装置（例えばハードディスク、フラッシュメモリなど）に現在の字幕表示設定を示す情報を保存する。

　表示装置情報管理部２０９は、立体字幕処理装置２００に接続された立体表示装置１０に関する情報（例えば、画面解像度および画面サイズ等）を管理する。

　続いて、立体字幕処理部２０５について詳細に説明する。図６は、本発明の実施の形態２に係る立体字幕処理部２０５の詳細な機能構成を示すブロック図である。

　図６に示すように、立体字幕処理部２０５は、字幕領域演算部２１１と、奥行補正部２１２と、字幕データ保持部２１３と、立体字幕生成部２１４と、字幕描画部２１５とを備える。以下、立体字幕処理部２０５が備える各構成要素について説明する。

　字幕領域演算部２１１は、字幕デコーダ２０４から取得された入力字幕データ（例えば、字幕表示サイズおよび字幕表示位置）と、字幕表示設定管理部２０８から取得された字幕表示設定と、表示装置情報管理部２０９から取得された立体表示装置１０の画面の大きさおよび解像度とに基づいて、画面上の字幕の表示領域を演算する。

　ここで、字幕領域演算部２１１の処理動作について図７を用いて説明する。図７は、本発明の実施の形態２に係る字幕領域演算部２１１の処理動作の一例を説明するための図である。

　例えば、図７の（ａ）のように、入力字幕データが画面上の字幕表示位置（ｘ，ｙ）と、字幕表示領域の横幅および高さ（ｗ，ｈ）とを示すとする。このとき、字幕表示設定管理部２０８から取得された字幕表示設定が拡大率αを示す場合、字幕領域演算部２１１は、図７の（ｂ）に示すように、演算後の字幕表示領域の横幅および高さ（Ｗ，Ｈ）として、入力字幕データが示す字幕表示領域の横幅および高さ（ｗ，ｈ）に拡大率αを乗算した値を算出する。また、字幕領域演算部２１１は、演算後の字幕表示位置（Ｘ，Ｙ）として、入力字幕データが示す字幕表示位置（ｘ，ｙ）に補正値βおよびγをそれぞれ加算した値を算出する。

　補正値βおよびγは、演算後の字幕表示領域が画面からはみ出さないように計算された値である。例えば、演算後の字幕表示領域の高さ（Ｈ）と入力字幕データが示す垂直方向の字幕表示位置（ｙ）との和が、表示装置情報管理部２０９から取得された画面サイズｄｉｓｐＨを超える場合には、補正値γは、γ＝（ｙ＋Ｈ）－ｄｉｓｐＨと計算されればよい。

　なお、字幕表示領域の演算方法は、ここで説明した方法に限られるものではない。例えば、字幕領域演算部２１１は、時間的に前または後に表示が開始される字幕（以下、「前後の字幕」という）の字幕表示位置に対して演算後の字幕表示位置がズレないように、字幕表示領域を演算してもよい。また、ユーザが指示した拡大率で字幕表示領域が拡大された場合に字幕表示領域が画面に収まりきらないときは、字幕領域演算部２１１は、自動的に拡大率を変更してもよい。また、字幕表示領域は、画面からはみ出したりしてもよい。また、ユーザが指示する字幕表示設定は、上述の拡大率だけではなく、表示サイズの絶対値を示してもよい。

　奥行補正部２１２は、字幕の奥行き感を示す視差を再計算する。具体的には、奥行補正部２１２は、実施の形態１に係る奥行補正部１０２と同様に、字幕表示設定が字幕の表示方法を変更することを示す場合であって、かつ複数の字幕が同一画面上に表示される場合に、複数の字幕データに含まれる複数の奥行情報のうちの少なくとも１つを補正する。このとき、奥行補正部２１２は、複数の字幕データが示す複数の字幕のうち、より早く表示が開始される字幕がより奥側に立体表示されるように、複数の奥行情報のうちの少なくとも１つを補正する。

　ただし、本実施の形態に係る奥行補正部２１２は、字幕領域演算部２１１によって算出された複数の表示領域の少なくとも一部が画面上で重なる場合に、複数の奥行情報のうちの少なくとも１つを補正する。つまり、本実施の形態では、奥行補正部２１２は、複数の表示領域の少なくとも一部が画面上で重なるか否かを判定する。そして、複数の表示領域の少なくとも一部が画面上で重なる場合にのみ、奥行補正部２１２は、複数の奥行情報のうちの少なくとも１つを補正する。逆に言えば、複数の表示領域が画面上で重ならない場合には、奥行補正部２１２は、複数の奥行情報を補正しない。

　ここで、奥行補正部２１２における処理について図面を用いて詳細に説明する。図８および図９の各々は、本発明の実施の形態２に係る字幕領域演算部２１１によって算出された複数の表示領域の一例を説明するための図である。

　例えば、入力字幕データが、図８の（ａ）に示す第１字幕領域および第２字幕領域を、第１字幕および第２字幕の表示領域として示しているとする。このとき、字幕の表示領域を拡大することを示す字幕表示設定に基づいて字幕領域演算部２１１が表示領域を演算した場合、演算後の第１字幕領域および第２字幕領域は、図８の（ｂ）のように画面上で重なる場合がある。このように複数の表示領域が画面上で重なる場合に、複数の字幕の視差が同じであれば、ユーザの奥行き感に不整合が生じる。例えば、画面上において第２字幕が第１字幕の前に重なっている場合に、第１字幕が第２字幕より手前または同じ奥行位置に立体表示されれば、ユーザの奥行き感に不整合が生じる。

　また、図９に示すように、字幕の表示時間を立体表示装置１０において変更することをユーザから指示された場合も、字幕表示領域が重なることがある。例えば、放送データに付与される字幕データに従って字幕を表示する場合、複数の字幕が同時に表示されることが無いので字幕表示領域が重なることは無い。しかし、字幕表示設定の変更に従って字幕表示時間が変更された場合、複数の字幕表示領域が画面上で重なることがありうる。

　具体的には、図９の（ａ）に示すように、例えば時刻ｔで第１字幕が表示された後、時刻ｔ＋△ｔで第２字幕が表示される場合を考える。図９において、第１字幕および第２字幕の両方の視差（奥行情報）は同じである。したがって、図９の（ｂ）のように、字幕表示時間が延長された結果、第１字幕と第２字幕との両方が表示される時間区間（ハッチングされた領域）では、第２字幕領域が第１字幕領域の手前に重ねられているにもかかわらず、第１字幕と第２字幕との視差が同じために、ユーザの奥行き感に不整合が生じる。

　図８および図９に示すような場合に奥行き感の不整合を解消するために、奥行補正部２１２は、後述する字幕データ保持部２１３から取得される画面上に表示されている（またはこれから表示する）字幕の表示開始時刻に基づいて、入力字幕データが示す視差を補正する。本実施の形態では、複数の字幕の中で最新の字幕が最も手前に表示されるように視差が補正される。

　図１０は、本発明の実施の形態２に係る奥行補正部２１２によって補正された視差の一例を示す図である。具体的には、図１０は、図９の時刻ｔ＋△ｔにおける第１字幕および第２字幕の補正後の視差を示す。

　図１０において、入力字幕データが示す第１字幕および第２字幕の視差が、共に（Ｒａ，Ｌａ）とする。この場合、入力字幕データの視差が補正されなければ、第１字幕および第２字幕は同じ視差で立体表示される。つまり、第１字幕の奥行き感と第２字幕の奥行き感とは同じになる。しかし、画面上では第２字幕が第１字幕よりも手前に重ねられるため、字幕の重なり方と奥行き感との間に不整合が生じる。そこで、奥行補正部２１２は、最新の字幕が他の字幕よりも手前に立体表示されるように視差を補正する。

　図１０では、奥行補正部２１２は、最新の字幕である第２字幕の視差を（Ｒｂ，Ｌｂ）に補正する。その結果、第２字幕が第１字幕よりも手前に立体表示される。（Ｒｂ，Ｌｂ）は、例えば任意のオフセット量（例えば予め定められた固定値など）を（Ｒａ，Ｌａ）に加算して求められればよい。

　また、（Ｒｂ，Ｌｂ）は、例えば映像の視差を用いて動的に計算された値を（Ｒａ，Ｌａ）に加算して求められてもよい。例えば、第１字幕が表示される領域に含まれる映像の視差が大きいほどオフセット量を大きくしてもよい。

　また、図１１は、本発明の実施の形態２に係る奥行補正部２１２による奥行情報の補正方法の一例を示す図である。図１１では、各字幕の視差は、当該字幕の表示が開始された時刻（以下、「表示開始時刻」または「表示開始タイミング」という）から時間が経過するほど小さくなるように補正されている。つまり、奥行補正部２１２は、時間の経過にともなって字幕の表示位置が奥側に移動するように、各字幕データの奥行情報を補正している。その結果、図１１では、複数の字幕のうち、より早く表示が開始される字幕がより奥側に立体表示される。

　字幕データ保持部２１３は、字幕領域演算部２１１と奥行補正部２１２とによって計算された情報で更新された字幕データ（字幕表示領域、視差、および字幕表示時間等）を保持する。

　図１０で説明したように、本実施の形態では、最新の字幕が手前に表示されるように奥行情報が補正される。奥行補正部２１２は、字幕が更新される度に、字幕データ保持部２１３が保持している各字幕データが示す視差（奥行き感）を減少させ、新規に表示される字幕に対して大きな視差を与える。そのため、字幕データ保持部２１３は、画面上に表示されている字幕毎に字幕表示が開始された時刻（表示開始時刻）を保持している。

　奥行補正部２１２は、字幕が更新されるタイミングで、表示中の字幕毎に、表示開始時刻に基づいて視差を再計算する。なお、字幕データ保持部２１３は、画面に表示されている字幕の字幕データのみを保持してもよいし、既に画面上に表示されていない字幕の字幕データも保持してもよい。

　立体字幕生成部２１４は、字幕データ保持部２１３が保持している字幕データから画面に表示する立体字幕を生成する。具体的には、立体字幕生成部２１４は、字幕を更新するタイミングで、画面上に表示される字幕のうち表示開始時刻の古い字幕から順番に字幕データを取り出し、字幕描画部２１５に取り出した字幕データを渡す。

　字幕描画部２１５は、実施の形態１の字幕描画部１０３に相当する。字幕描画部２１５は、立体字幕生成部２１４から取得した字幕データを順番に描画することにより、立体字幕画像を生成する。描画は、例えばＯＳＤ（Ｏｎ－Ｓｃｒｅｅｎ　Ｄｉｓｐｌａｙ）用のメモリ上で行われてもよい。字幕描画部２１５は、立体字幕生成部２１４から取得した全ての字幕データを描画した後に、ビデオ出力部２０７に、字幕が描画されたメモリ領域（例えばＯＳＤ描画用メモリ）のアクセス権を渡す。ビデオ出力部２０７は、ビデオデコーダ２０３から得られるビデオデータが示す立体映像と字幕描画部２１５から得られる立体字幕画像とを合成し、得られた立体字幕映像を立体表示装置１０に出力する。

　続いて、以上のように構成された本実施の形態に係る立体字幕処理装置２００における処理の流れを説明する。図１２は、本発明の実施の形態２に係る立体字幕処理装置における処理動作を示すフローチャートである。具体的には、図１２は、立体字幕処理部２０５の内部処理の詳細を示す。

　図１２に示す処理は、字幕を更新するタイミングが来れば開始される。字幕を更新するタイミングは、基本的には字幕デコーダから新たな字幕データが入力されたタイミング、あるいは字幕を画面から削除するタイミングである。もちろん、字幕を更新するタイミングは、特に限定される必要はなく、任意のタイミングであってもよい。

　まず、立体字幕処理部２０５は、字幕デコーダ２０４から入力字幕データを取得し、字幕表示設定管理部２０８から字幕表示設定を取得し、表示装置情報管理部２０９から表示装置情報を取得する（Ｓ２０１）。

　入力字幕データが新規に取得された場合、字幕領域演算部２１１は、入力字幕データおよび字幕表示設定に従って、入力字幕データが示す字幕の画面上の表示領域を計算する（Ｓ２０２）。そして、字幕領域演算部２１１は、計算した表示領域を示す情報を含む字幕データを字幕データ保持部２１３に保存する。

　奥行補正部２１２は、字幕データ保持部２１３が保持している字幕データから、表示すべき字幕の字幕データを取得する（Ｓ２０３）。

　奥行補正部２１２は、取得された字幕データが示す表示領域が画面上で重なるか否かを判定する（Ｓ２０４）。ここで、表示領域が画面上で重ならない場合（Ｓ２０４のＮｏ）、ステップＳ２０５の処理はスキップされる。

　一方、表示領域が画面上で重なる場合（Ｓ２０４のＹｅｓ）、奥行補正部２１２は、表示開始時刻が古い字幕ほど視差が小さくなるように、取得された字幕データが示す視差を補正する（Ｓ２０５）。そして、奥行補正部２１２は、補正された視差を用いて、字幕データ保持部２１３に保持されている字幕データを更新する。

　例えば、表示すべき字幕が３つ存在する場合、ステップＳ２０３～Ｓ２０５の処理は以下のようになる。まず、奥行補正部２１２は、表示すべき３つの字幕の字幕データを字幕データ保持部２１３から取得する。表示すべき字幕は、例えば現在の時刻と字幕の表示開始時刻との差が、入力字幕データから得られる字幕の表示時間内に収まっているかどうかで判定できる。

　続いて、奥行補正部２１２は、取得した３つの字幕データが示す表示領域の少なくとも一部が画面上で重なっているか否かを判定する。ここで、表示領域が重なっている場合、奥行補正部２１２は、取得された３つの字幕データが示す視差を補正する。

　ここで、３つの字幕の視差の計算方法について図１３を用いて説明する。まず表示開始時刻が一番古い字幕（図１３では第１字幕）の視差が（Ｒ１，Ｌ１）であるとする。このとき、奥行補正部２１２は、最新の字幕（図１３では第３字幕）の視差（Ｒ３，Ｌ３）を、予め保持された固定のオフセット量などを用いて求める。また、奥行補正部２１２は、一番古い表示開始時刻と最新の表示開始時刻との間に表示開始時刻を有する字幕（図１３では第２字幕）の視差（Ｒ２，Ｌ２）を、（Ｒ１，Ｌ１）と（Ｒ３，Ｌ３）とを用いて求める。奥行補正部２１２は、（Ｒ２，Ｌ２）を、例えば簡単な比例計算に従って計算してもよい。

　なお、上記の視差の計算方法に従って視差が補正されれば、同時に画面に表示する字幕の数が前回よりも減少する場合には、前回よりも視差が増加する（前回よりも字幕が手前に表示される）ことになる。しかし、このような場合には、奥行補正部２１２は、前回計算された視差よりも大きくならないように、今回の視差を計算してもよい。

　図１２のフローチャートの説明に戻る。立体字幕生成部２１４および字幕描画部２１５は、字幕データ保持部２１３から表示すべき字幕の字幕データを表示開始時刻が古い順に取得し、字幕を描画するためのＯＳＤメモリ上に順番に字幕を描画する（Ｓ２０６）。表示すべき字幕がすべて描画されることにより、立体字幕画像が生成される。

　このようにして、本実施の形態に係る立体字幕処理装置２００によれば、複数の字幕のうちの少なくとも１つの字幕の視差を補正することで、複数の字幕が画面上で重なる場合にも、ユーザに対して違和感を与えずに、字幕を立体表示することができる。

　以上のように、本実施の形態に係る立体字幕処理装置２００によれば、複数の字幕が画面上で重なる場合にのみ奥行情報を補正することができる。つまり、画面上における字幕の重なり方と字幕の奥行き感との間に不整合が生じる可能性が高い場合にのみ、効率的に奥行情報を補正することができる。また、奥行情報の補正によって、元の字幕データが示す奥行き感が損なわれることを抑制することもできる。

　（実施の形態３）
　次に、本実施の形態に係る立体字幕処理装置について、実施の形態２に係る立体字幕処理装置と異なる点を中心に説明する。なお、本実施の形態に係る立体字幕処理装置の機能構成を示すブロック図は、図５および図６に示す実施の形態２のブロック図と同様であるので図示を省略する。

　本実施の形態に係る立体字幕処理装置は、字幕の種別および字幕の表示開始時刻を利用して、最新の字幕が手前に表示されるように奥行情報を補正するか否かを決定する。これにより、立体字幕処理装置は、同一種別の字幕の奥行き感が短時間で変化することにより、ユーザに不快感を与えることを抑制することができる。図１４および図１５を用いて、ユーザに不快感が与えられる状況について説明する。

　図１４および図１５の各々は、本発明の実施の形態３に係る奥行補正部の処理動作の一例を説明するための図である。

　図１４では、１人の人物が発言している場面を想定している、なお、以下の説明において、ダブルクォーテーション「“　”」で囲われた文字が画面に表示される文字を表す。時刻ｔ０に第１字幕として“わたしが”が表示された後、時刻ｔ１に第２字幕として“悪かったわ”が表示される。この場合、第１字幕と第２字幕とで視差が異なると、同一人物のほぼ同時刻の発言に対応する２つの字幕の間で奥行き感に差が出てしまい、ユーザに不快感を与えてしまう。

　図１５では、複数の人物が会話をしている場面を想定している。時刻ｔ０に人物Ａの発言に対応する字幕Ａ１が表示され、時刻ｔ１に、人物Ｂの発言に対応する字幕Ｂ１が表示され、更に時刻ｔ２に再度人物Ａの発言に対応する字幕Ａ２が表示されている。このように、複数の字幕が短時間で表示されると、字幕の奥行き感が短時間で連続的に切り替わってしまい、ユーザに不快感を与えてしまう。

　そこで、本実施の形態に係る奥行補正部２１２は、複数の字幕の種別が一致するか否かに応じて、奥行情報を補正するか否かを決定する。具体的には、奥行補正部２１２は、複数の字幕の種別が互いに異なる場合に複数の奥行情報のうちの少なくとも１つを補正し、複数の字幕の種別が同一である場合に複数の奥行情報を補正しない。

　ここで、字幕の種別は、字幕の特徴に依存する情報である。例えば、字幕の種別は、字幕の色である。また例えば、字幕の種別は、種別情報によって特定されてもよい。この種別情報は、例えば、発言者に対応づけて予め字幕データに含まれればよい。

　さらに、奥行補正部２１２は、複数の字幕の表示が開始される時刻の差に応じて、奥行情報を補正するか否かを決定する。具体的には、奥行補正部２１２は、複数の字幕の表示が開始される時刻の差が閾値以上である場合に複数の奥行情報のうちの少なくとも１つを補正し、複数の字幕の表示が開始される時刻の差が閾値未満である場合に複数の奥行情報を補正しない。この閾値は、例えば、実験などにより得られる、ユーザが不快に感じる時刻の差の境界値が設定されればよい。

　以下、図１６を用いて、本実施の形態に係る立体字幕処理装置２００の処理動作を説明する。

　図１６は、本発明の実施の形態３に係る立体字幕処理装置２００の処理動作を示すフローチャートである。なお、図１６において、図１２と同じ処理については同じ符号を付し、適宜説明を省略する。

　ステップＳ２０１の処理の後、奥行補正部２１２は、新規に表示する字幕の字幕データと同じ種別の字幕の字幕データを検索する（Ｓ３０１）。字幕の種別は、例えば字幕の色がある。同一人物の発言に対応する字幕が同じ色で表示される場合、ユーザは、各字幕がどの人物の発言であるかを識別できる。このような場合には、字幕の色を字幕の種別として扱うことができる。

　もちろん、字幕の種別は、字幕の色に限ったものではなく、例えば字幕データに含まれるフラグあるいはシーケンス番号によって特定されてもよい。

　次に、字幕領域演算部２１１は、図１２のステップＳ２０２と同様に、入力字幕データおよび字幕表示設定に従って、入力字幕データが示す字幕の画面上の表示領域を計算する（Ｓ３０２）。その際、字幕領域演算部２１１は、検索された種別が同一の字幕の表示開始時刻に基づいて、表示領域を計算する。例えば、字幕領域演算部２１１は、種別が同一の字幕の表示領域と、入力字幕データが示す字幕の表示領域とが空間的に近接する場合は、互いに表示領域と重ならないように字幕領域を計算する。

　続いて、ステップＳ２０３の処理が実行された後、奥行補正部２１２は、ステップＳ２０３で取得された字幕データにおいて表示開始時刻の差分を計算する（Ｓ３０３）。

　そして、奥行補正部２１２は、視差を補正するか否かを判定する（Ｓ３０４）。具体的には、奥行補正部２１２は、計算された表示開始時刻の差分が閾値未満であり、かつ取得された字幕データの字幕が同じ種別の字幕である場合、字幕の視差を補正しないと判定する。逆に、奥行補正部２１２は、計算された表示開始時刻の差分が閾値以上である、または取得された字幕データの字幕が互いに異なる種別の字幕である場合、字幕の視差を補正しないと判定する。

　ここで、視差を補正すると判定された場合（Ｓ３０４のＹｅｓ）、ステップＳ２０５の処理が実行される。逆に、視差を補正しないと判定された場合（Ｓ３０４のＮｏ）、ステップＳ２０５の処理はスキップされる。

　以上のように、本実施の形態に係る立体字幕処理装置によれば、複数の字幕の種別が同一の場合に奥行情報を補正することを防止することができる。その結果、例えば、同一人物の一連の発言に対応する複数の字幕が互いに異なる奥行き感で立体表示されることを抑制することができる。したがって、奥行情報の補正によってユーザに不快感を与えることを抑制することができる。

　また、本実施の形態に係る立体字幕処理装置によれば、複数の字幕の表示が次々と開始される場合に、それらの複数の字幕の奥行き感を同一にすることができる。その結果、例えば、同一人物の一連の発言に対応する複数の字幕が互いに異なる奥行き感で立体表示されることを抑制することができる。したがって、奥行情報の補正によってユーザに不快感を与えることを抑制することができる。

　（実施の形態４）
　本発明の実施の形態４に係る立体字幕処理装置は、立体表示された字幕に対するユーザの操作に応じて、再生モードを変更する。

　例えば、ユーザの母国語以外の音声が再生され、その音声に対応する母国語の字幕が表示されている場合、ユーザは、映像ではなく字幕を見ていることが多い。この際、特に早いスピードで字幕が更新される場合は、ユーザが字幕を読みきる前に当該字幕が画面から消えてしまうことがある。このような場合、読み逃した字幕まで映像を巻き戻したいという要求がある。

　そこで、本実施の形態に係る立体字幕処理装置３００は、表示された字幕に対する操作に応じて、特殊再生（早送り、巻き戻し）を行う。以下、本実施の形態に係る立体字幕処理装置３００について、図面を参照しながら説明する。なお、以下では、ユーザの操作が画面に対するタッチ操作である場合について説明する。

　図１７は、本発明の実施の形態４に係る立体字幕処理装置３００の機能構成を示すブロック図である。なお、図１７において、図２と同様の構成要素については、同一の符号を付し、適宜説明を省略する。

　立体字幕処理装置３００は、立体表示装置３０と接続されている。図１７に示すように、立体字幕処理装置３００は、設定管理部１０１と、奥行補正部１０２と、字幕描画部１０３と、ビデオ出力部３０１と、操作受付部３０２とを備える。

　ビデオ出力部３０１は、ビデオデータが示す立体映像と立体字幕画像とを重畳した立体字幕映像を出力する。ここで、操作受付部３０２によって受け付けられたタッチ操作が予め定められたタッチ操作である場合に、ビデオ出力部３０１は、特殊再生モードで立体字幕映像を出力する。特殊再生モードとは、いわゆるトリックモードであり、通常の再生速度とは異なる再生速度で映像を再生するモードである。

　操作受付部３０２は、立体表示装置３０に立体表示された複数の字幕の少なくとも１つに対するユーザのタッチ操作を受け付ける。タッチ操作とは、ユーザが手あるいはペンなどを介して画面にタッチする操作である。タッチ操作には、タップ操作、フリック操作、ピンチアウト操作、ピンチイン操作、およびドラッグアンドドロップ操作などが含まれる。

　次に、以上のように構成された立体字幕処理装置３００の処理動作について説明する。

　図１８は、本発明の実施の形態４に係る立体字幕処理装置３００の処理動作を示すフローチャートである。具体的には、図１８は、ユーザのタッチ操作が受け付けられるときの処理動作を示す。

　まず、操作受付部３０２は、ユーザのタッチ操作を受け付ける（Ｓ４０１）。続いて、ビデオ出力部３０１は、受け付けられたタッチ操作が予め定められたタッチ操作である場合に、予め定められた複数の特殊再生モードの中から、そのタッチ操作に対応付けられた特殊再生モードを選択する（Ｓ４０２）。予め定められた複数の特殊再生モードには、例えば、早送り再生モードおよび巻き戻し再生モードなどが含まれる。

　具体的には、例えば受け付けられたタッチ操作が、立体表示された複数の字幕の少なくとも１つを手前側に移動させるためのタッチ操作である場合に、ビデオ出力部３０１は、複数の特殊再生モードの中から巻き戻し再生モードを選択する。

　また例えば、受け付けられたタッチ操作が、立体表示された複数の字幕の少なくとも１つを奥側に移動させるためのタッチ操作である場合に、ビデオ出力部３０１は、複数の特殊再生モードの中から早送り再生モードを選択する。なお、立体表示された複数の字幕を奥側に移動させるためのタッチ操作が受け付けられた場合に、設定管理部１０１は、立体表示装置３０における映像に対する字幕の表示時間が、字幕データが示す、映像に対する字幕の表示時間よりも長くなるように、字幕表示設定を変更してもよい。これにより、早送り再生モードの場合に、字幕の表示時間が短くなりすぎることを抑制することができる。

　最後に、ビデオ出力部３０１は、選択された特殊再生モードで立体字幕映像を出力する（Ｓ４０３）。

　以上のような立体字幕処理装置３００の処理動作の一例を、図１９を用いて説明する。図１９は、本発明の実施の形態４に係る立体字幕処理装置３００の処理動作の一例を説明するための図である。

　図１９では、ユーザが、立体表示装置３０であるモバイル機器で立体字幕映像を視聴している様子が示されている。図１９において、第１字幕“ＡＡＡＡＡＡＡ”は、第２字幕“ＢＢＢＢＢＢＢ”よりも奥側に立体表示されている。

　このように字幕が立体表示された状態において、ユーザは、特殊再生をしたい場合に、表示中の字幕を例えば指でタップする。指が字幕に触れることで、立体字幕処理装置３００は、「字幕ベースモード」となる。この字幕ベースモードにおいて、ユーザが、字幕に対してフリック操作をすることで、現在表示されている字幕の過去または未来の字幕が表示され、映像も過去または未来の字幕に対応する映像に巻き戻しまたは早送りされる。

　例えば、図１９に矢印で示すように、ユーザが、第１字幕を、第１字幕よりも手前に立体表示されている第２字幕に近付けるためのタッチ操作を行った場合、第１字幕の表示が開始された時刻まで立体字幕映像が巻き戻される。

　以上のように、本実施の形態に係る立体字幕処理装置３００によれば、立体表示された字幕に対するユーザのタッチ操作に応じた特殊再生モードで立体字幕映像を出力することができる。つまり、ユーザは、字幕に対する直感的な操作により特殊再生モードを制御することが可能となる。

　また、本実施の形態に係る立体字幕処理装置３００によれば、立体表示された字幕を手前側に移動させるためのタッチ操作により、巻き戻し再生することが可能となる。つまり、古い字幕を新しい字幕に近付ける操作によって巻き戻し再生を実現することができるので、ユーザは、字幕に対する直感的な操作により特殊再生モードを制御することが可能となる。

　また、本実施の形態に係る立体字幕処理装置３００によれば、立体表示された字幕を奥側に移動させるためのタッチ操作により、早送り再生することが可能となる。つまり、新しい字幕を古い字幕に近付ける操作によって早送り再生を実現することができるので、ユーザは、字幕に対する直感的な操作により特殊再生モードを制御することが可能となる。

　なお、本実施の形態では、実施の形態１～３と同様に、字幕が立体表示される場合について説明したが、必ずしも字幕は立体表示される必要はない。この場合、字幕および映像は、通常に、平面的に表示される。このように字幕が平面的に表示された場合であっても、表示された字幕に対するユーザのタッチ操作に応じて、特殊再生モードで字幕映像を出力することにより、ユーザは、直感的に所望の字幕を表示することが可能となる。

　また、上記で説明した、タッチ操作に対する立体字幕処理装置３００の処理は、一例であり、他の処理を行っても構わない。例えば、「字幕ベースモード」において、ユーザがピンチアウトまたはピンチイン操作を行った場合、字幕の大きさが変更されてもよい。つまり、設定管理部１０１は、立体表示装置３０に立体表示された字幕に対するユーザのタッチ操作に従って、字幕の表示サイズに関する字幕表示設定を変更してもよい。また、ユーザが表示された字幕をドラッグアンドドロップすることで、字幕の位置が変更されてもよい。

　また、このようなユーザの操作は、モバイル機器に限定されたものではなく、ＴＶ等の大画面に対するポインタデバイスに対する操作であってもよい。

　以上、本発明の一態様に係る立体字幕処理装置について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したもの、あるいは異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。

　例えば、上記実施の形態１～４では、奥行補正部は、字幕データを用いて奥行情報を補正していたが、他の情報を用いて奥行情報を補正してもよい。例えば、ビデオデータおよびオーディオデータを用いて、奥行情報を補正してもよい。具体的には例えば、奥行補正部は、字幕の視差を計算する際に、オーディオデータから得られる音量に比例して字幕の視差が大きくなるように、字幕の視差を計算してもよいし、ビデオデータから得られる映像の視差を用いて字幕の視差を計算してもよい。

　また、上記実施の形態１～４において、立体字幕処理装置と立体表示装置とは別体の装置として説明していたが、例えば、立体字幕処理装置は、立体表示装置に内蔵されてもよい。つまり、立体表示装置は、立体字幕処理装置を備えてもよい。

　また、上記実施の形態１～４における立体字幕処理装置が備える構成要素の一部または全部は、１個のシステムＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ：大規模集積回路）から構成されているとしてもよい。例えば、立体字幕処理装置は、図２に示す設定管理部１０１と奥行補正部１０２と字幕描画部１０３とを有するシステムＬＳＩから構成されてもよい。

　システムＬＳＩは、複数の構成要素を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などを含んで構成されるコンピュータシステムである。前記ＲＯＭには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムに従って動作することにより、システムＬＳＩは、その機能を達成する。

　なお、ここでは、システムＬＳＩとしたが、集積度の違いにより、ＩＣ、ＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、あるいはＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

　さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。

　また、本発明は、このような特徴的な構成要素を備える立体字幕処理装置として実現することができるだけでなく、立体字幕処理装置に含まれる特徴的な構成要素が行う各処理を含む立体字幕処理方法として実現することもできる。また、立体字幕処理方法に含まれる特徴的な各処理をコンピュータに実行させるコンピュータプログラムとして実現することもできる。そして、そのようなコンピュータプログラムを、ＣＤ－ＲＯＭ等のコンピュータ読取可能な非一時的な記録媒体あるいはインターネット等の通信ネットワークを介して流通させることができるのは、言うまでもない。

　本発明は、立体表示装置において字幕の表示方法が変更された場合であっても、ユーザが違和感なく立体字幕を視聴することができる立体字幕処理装置として利用することができる。

　１０、３０　立体表示装置
　１００、２００、３００　立体字幕処理装置
　１０１　設定管理部
　１０２、２１２　奥行補正部
　１０３、２１５　字幕描画部
　２０１　デマルチプレクサ
　２０２　オーディオデコーダ
　２０３　ビデオデコーダ
　２０４　字幕デコーダ
　２０５　立体字幕処理部
　２０６　オーディオ出力部
　２０７、３０１　ビデオ出力部
　２０８　字幕表示設定管理部
　２０９　表示装置情報管理部
　２１１　字幕領域演算部
　２１３　字幕データ保持部
　２１４　立体字幕生成部
　３０２　操作受付部

Claims

　複数の字幕データが示す複数の字幕を立体表示装置に立体表示させるための立体字幕処理装置であって、
　前記立体表示装置における字幕の表示方法に関する設定である字幕表示設定を管理する設定管理部と、
　前記字幕表示設定が字幕の表示方法を変更することを示している場合であって、かつ複数の字幕データが示す複数の字幕が同一画面上に表示される場合に、前記複数の字幕のうち、より早く表示が開始される字幕がより奥側に立体表示されるように、前記複数の字幕データに含まれる複数の奥行情報のうちの少なくとも１つを補正する奥行補正部と、
　前記複数の奥行情報のうちの少なくとも１つが補正された後の前記複数の字幕データを用いて、前記複数の字幕を前記立体表示装置に立体表示させるための立体字幕画像を生成する字幕描画部とを備える
　立体字幕処理装置。
　前記立体字幕処理装置は、さらに、
　前記複数の字幕データと前記字幕表示設定とに基づいて、前記複数の字幕の画面上の表示領域をそれぞれ算出する字幕領域演算部を備え、
　前記奥行補正部は、算出された複数の表示領域の少なくとも一部が画面上で重なる場合に、前記複数の奥行情報のうちの少なくとも１つを補正する
　請求項１に記載の立体字幕処理装置。
　前記奥行補正部は、前記複数の字幕の種別が互いに異なる場合に前記複数の奥行情報のうちの少なくとも１つを補正し、前記複数の字幕の種別が同一である場合に前記複数の奥行情報を補正しない
　請求項１または２に記載の立体字幕処理装置。
　前記奥行補正部は、前記複数の字幕の表示が開始される時刻の差が閾値以上である場合に前記複数の奥行情報のうちの少なくとも１つを補正し、前記複数の字幕の表示が開始される時刻の差が前記閾値未満である場合に前記複数の奥行情報を補正しない
　請求項１または２に記載の立体字幕処理装置。
　前記設定管理部は、前記立体表示装置における字幕の表示サイズおよび表示時間のうちの少なくとも一方に関する設定を前記字幕表示設定として管理する
　請求項１に記載の立体字幕処理装置。
　前記立体字幕処理装置は、さらに、
　前記立体字幕画像と立体映像とを重畳した立体字幕映像を前記立体表示装置に出力するビデオ出力部と、
　前記立体表示装置に立体表示された前記複数の字幕の少なくとも１つに対するユーザの操作を受け付ける操作受付部とを備え、
　前記ビデオ出力部は、受け付けられた前記操作が予め定められた操作である場合に、特殊再生モードで前記立体字幕映像を出力する
　請求項１に記載の立体字幕処理装置。
　前記ビデオ出力部は、受け付けられた前記操作が、立体表示された前記複数の字幕の少なくとも１つを手前側に移動させるための操作である場合に、巻き戻し再生モードで前記立体字幕映像を出力する
　請求項６に記載の立体字幕処理装置。
　前記ビデオ出力部は、受け付けられた前記操作が、立体表示された前記複数の字幕の少なくとも１つを奥側に移動させるための操作である場合に、早送り再生モードで前記立体字幕映像を出力する
　請求項６に記載の立体字幕処理装置。
　前記設定管理部は、立体表示された前記複数の字幕を奥側に移動させるための操作が受け付けられた場合に、前記立体表示装置における映像に対する字幕の表示時間が、字幕データが示す、映像に対する字幕の表示時間よりも長くなるように、前記字幕表示設定を変更する
　請求項８に記載の立体字幕処理装置。
　複数の字幕データが示す複数の字幕を立体表示装置に立体表示させるための立体字幕処理方法であって、
　前記立体表示装置における字幕の表示方法に関する設定である字幕表示設定が字幕の表示方法を変更することを示している場合であって、かつ複数の字幕データが示す複数の字幕が同一画面上に表示される場合に、前記複数の字幕のうち、より早く表示が開始される字幕がより奥側に立体表示されるように、前記複数の字幕データに含まれる複数の奥行情報のうちの少なくとも１つを補正する奥行補正ステップと、
　前記複数の奥行情報のうちの少なくとも１つが補正された後の前記複数の字幕データを用いて、前記複数の字幕を前記立体表示装置に立体表示させるための立体字幕画像を生成する字幕描画ステップとを含む
　立体字幕処理方法。