以下、本発明による手話映像表示装置について、実施の形態を用いて説明する。なお、以下の実施の形態において、同じ符号を付した構成要素及びステップは同一または相当するものであり、再度の説明を省略することがある。
(実施の形態1)
本発明の実施の形態1による手話映像表示装置について、図面を参照しながら説明する。本実施の形態による手話映像表示装置は、番組映像に関連する番組関連情報をも受け付け、その番組関連情報を用いて、手話映像の表示を行うものである。
図1は、本実施の形態による手話映像表示装置1の構成を示すブロック図である。本実施の形態による手話映像表示装置1は、番組映像受付部11と、手話映像受付部12と、番組関連情報受付部13と、表示設定情報記憶部14と、表示設定情報取得部15と、表示部16とを備える。
番組映像受付部11は、番組の映像である番組映像を受け付ける。番組映像は、例えば、ドラマや、映画、ニュース、ドキュメンタリー、スポーツ等の映像であり、そのジャンルを問わない。また、番組映像のデータ形式も問わない。例えば番組情報は、アナログのデータであってもよく、デジタルのデータであってもよい。後者の場合に、番組映像の形式は、例えば、MPEG(Moving Picture Experts Group)であってもよく、AVI(Audio Video Interleave)であってもよく、あるいは、その他の形式であってもよい。また、その番組映像が圧縮されている場合に、その圧縮形式も問わない。番組映像は、音声の情報を含んでいてもよく、あるいは、含んでいてもよい。
番組映像受付部11は、例えば、カメラ等のデバイスから入力された番組映像を受け付けてもよく、有線もしくは無線の通信回線を介して送信された番組映像を受信してもよく、所定の記録媒体(例えば、光ディスクや磁気ディスク、半導体メモリなど)から読み出された番組映像を受け付けてもよい。本実施の形態では、放送された番組映像を受信する場合について説明する。なお、番組映像受付部11は、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよく、あるいは含まなくてもよい。また、番組映像受付部11は、ハードウェアによって実現されてもよく、あるいは所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
手話映像受付部12は、番組映像に対応した手話の映像である手話映像を受け付ける。この手話映像は、番組映像受付部11が受け付けた番組映像に対応するものである。したがって、聴覚障害者が番組映像と、その番組映像に対応した手話映像とを見ることによって、番組映像に対応する音声の情報を知ることができることになる。手話映像は、例えば、CG(Computer Graphics)の映像であってもよく、アニメーションの映像であってもよく、実写の映像であってもよい。この手話映像が生成される過程は問わない。例えば、放送局において、番組映像と、手話映像とが生成され、それらが同期されて放送されてもよく、番組映像(例えば、放送されたものでもよく、記録媒体から読み出されたものでもよい)に対応する手話通訳が手話通訳者によって行われ、その手話通訳者の映像を撮影することによって手話映像が生成されてもよく、番組映像に対応するテキスト情報(例えば、番組映像に対応する字幕情報であってもよく、番組映像に対応する音声情報を音声認識することによって得られたテキスト情報であってもよい)を用いて自動的に手話映像が生成されてもよく、その他の手法で生成されてもよい。
手話映像受付部12は、例えば、カメラ等のデバイスから入力された手話映像を受け付けてもよく、有線もしくは無線の通信回線を介して送信された手話映像を受信してもよく、所定の記録媒体(例えば、光ディスクや磁気ディスク、半導体メモリなど)から読み出された手話映像を受け付けてもよい。なお、手話映像受付部12は、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよく、あるいは含まなくてもよい。また、手話映像受付部12は、ハードウェアによって実現されてもよく、あるいは所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
なお、番組映像受付部11が受け付ける番組映像と、手話映像受付部12が受け付ける手話映像とは、同期を取ることができるようになっている、すなわち、時間的な位置の対応が分かるようになっていることが好適である。例えば、時間的な位置が対応している番組映像と手話映像とのそれぞれが、番組映像受付部11と手話映像受付部12とにおいて同時に受け付けられてもよく、両者にタイムコードが含まれており、そのタイムコードを用いて両者の同期を取ることができるようになっていてもよい。
番組関連情報受付部13は、番組映像受付部11が受け付ける番組映像に関連する情報である番組関連情報を受け付ける。番組関連情報は、例えば、番組映像のジャンルを示す情報を含んでいてもよく、番組映像の名称を示す情報を含んでいてもよく、番組の内容に関する情報(例えば、番組のトピックや、番組に登場する俳優の氏名等であってもよい)を含んでいてもよく、番組についての説明の情報を含んでいてもよく、その他の情報を含んでいてもよい。また、番組関連情報は、EPG(Electronic Program Guide:電子番組ガイド)の情報そのものであってもよく、その情報の一部であってもよい。このEPGの情報は、例えば、SI情報(公式番組情報)と呼ばれることもある。
番組関連情報受付部13が番組関連情報を受け付ける過程は問わない。番組関連情報受付部13は、例えば、インターネット等のネットワーク上のサーバから番組関連情報を受信してもよく、放送された番組関連情報を受信してもよく、番組映像に重畳されている番組関連情報を受け付けてもよく、所定の記録媒体(例えば、光ディスクや磁気ディスク、半導体メモリなど)から読み出された番組関連情報を受け付けてもよい。本実施の形態では、番組関連情報受付部13は、番組映像に重畳されている番組関連情報を受け付けるものとする。なお、番組関連情報受付部13は、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよく、あるいは含まなくてもよい。また、番組関連情報受付部13は、ハードウェアによって実現されてもよく、あるいは所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
表示設定情報記憶部14では、手話映像を表示する位置に関する情報である位置情報を含む表示設定情報が記憶される。この位置情報によって、番組映像の画面において手話映像が表示される位置が決定されることになる。この位置情報は、例えば、手話映像の画面が表示される番組映像の画面における座標値を示すもの(例えば、手話映像の左上の端点の座標値など)であってもよく、手話映像の画面が表示される複数の位置があらかじめ設定されている場合には、その位置を識別する情報(例えば、「右上」「左下」や、「表示位置01」「表示位置02」など)であってもよい。また、表示設定情報は、手話映像を表示する大きさに関する情報である大きさ情報をも含んでいてもよく、あるいは、そうでなくてもよい。この大きさ情報は、例えば、手話映像の画面の大きさそのものを示す情報(例えば、手話映像の画面の縦・横の長さを示す情報など)であってもよく、番組映像の画面に対する手話映像の画面の相対的な大きさを示す情報(例えば、面積や長さについて50%、30%など)であってもよく、手話映像の画面の複数の大きさがあらかじめ設定されている場合には、その大きさを識別する情報(例えば、「大」「中」「小」など)であってもよい。
また、表示設定情報記憶部14において、この表示設定情報は、番組関連情報に対応付けられて記憶されていてもよい。本実施の形態では、この場合について説明する。表示設定情報が番組関連情報に対応付けられているとは、番組関連情報から、表示設定情報を取得できればよいという意味である。したがって、表示設定情報記憶部14において、番組関連情報と、表示設定情報とを組として含む情報が記憶されていてもよく、番組関連情報と、表示設定情報とをリンク付ける情報が表示設定情報記憶部14において記憶されていてもよい。本実施の形態では、前者の場合について説明する。
表示設定情報記憶部14に表示設定情報等が記憶される過程は問わない。例えば、記録媒体を介して表示設定情報等が表示設定情報記憶部14で記憶されるようになってもよく、通信回線等を介して送信された表示設定情報等が表示設定情報記憶部14で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された表示設定情報等が表示設定情報記憶部14で記憶されるようになってもよい。表示設定情報記憶部14での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。表示設定情報記憶部14は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。
表示設定情報取得部15は、表示設定情報記憶部14から表示設定情報を取得する。特に本実施の形態では、表示設定情報取得部15は、番組関連情報受付部13が受け付けた番組関連情報に対応する表示設定情報を取得するものとする。厳密に言えば、表示設定情報取得部15は、番組関連情報受付部13が受け付けた番組関連情報であって、後述する表示部16が表示する番組映像に対応する番組関連情報に、表示設定情報記憶部14で対応付けられている表示設定情報を取得する。その表示設定情報は、後述する表示部16が表示する番組映像と共に表示される手話映像の表示のために用いられることになる。表示部16によって表示される番組映像に対応する番組関連情報を特定することができるように、番組映像と番組関連情報とが紐付けられていることが好適である。例えば、対応する番組映像と番組関連情報とが番組映像識別情報などによって紐付けられていてもよい。その場合には、表示設定情報取得部15は、表示部16によって表示される番組映像の番組映像識別情報を取得し、その番組映像識別情報に対応する番組関連情報を特定することによって、表示部16によって表示される番組映像に対応する番組関連情報を特定することができることになる。
表示部16は、表示設定情報取得部15が取得した表示設定情報に応じて、手話映像受付部12が受け付けた手話映像と、番組映像受付部11が受け付けた番組映像とを表示する。すなわち、表示部16は、表示設定情報取得部15が取得した表示設定情報に含まれる位置情報の示す位置に、手話映像の画面を表示するように、手話映像と番組映像とを表示する。また、表示設定情報取得部15が取得した表示設定情報に大きさ情報も含まれる場合には、表示部16は、その大きさ情報の示す大きさの手話映像と、番組映像とを表示する。なお、この表示によって、番組映像の画面(ウィンドウ)の上(すなわち、その画面の内側)に、その画面よりも小さい画面(ウィンドウ)で手話映像が表示されることになる。したがって、通常、番組映像が主となり、手話映像が従となるように表示がなされる。
なお、表示部16は、それらの表示を行う表示デバイス(例えば、CRTや液晶ディスプレイなど)を含んでもよく、あるいは含まなくてもよい。本実施の形態では、表示部16が外部のディスプレイに表示のための映像データを出力する場合について説明する。また、表示部16は、ハードウェアによって実現されてもよく、あるいは表示デバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
また、番組映像受付部11が受け付けた番組映像や、手話映像受付部12が受け付けた手話映像、番組関連情報受付部13が受け付けた番組関連情報などは、図示しない記録媒体において一時的に記憶されてもよいことは言うまでもない。
次に、本実施の形態による手話映像表示装置1の動作について、図2のフローチャートを用いて説明する。
(ステップS101)番組関連情報受付部13は、番組関連情報を受け付けたかどうか判断する。そして、番組関連情報を受け付けた場合には、ステップS102に進み、そうでない場合には、ステップS103に進む。
(ステップS102)表示設定情報取得部15は、番組関連情報受付部13が受け付けた番組関連情報を図示しない記録媒体において一時的に記憶する。そして、ステップS101に戻る。
(ステップS103)番組映像受付部11は、番組映像を受け付けたかどうか判断する。そして、番組映像を受け付けた場合には、ステップS104に進み、そうでない場合には、ステップS105に進む。なお、番組映像受付部11は、番組映像を一フレームごとに受信してもよく、あるいは、連続する複数のフレームごとに受信してもよい。
(ステップS104)表示部16は、番組映像受付部11が受け付けた番組映像を表示する。そして、ステップS101に戻る。
(ステップS105)手話映像受付部12は、手話映像を受け付けたかどうか判断する。そして、手話映像を受け付けた場合には、ステップS106に進み、そうでない場合には、ステップS101に戻る。なお、手話映像受付部12は、手話映像を一フレームごとに受信してもよく、あるいは、連続する複数のフレームごとに受信してもよい。
(ステップS106)表示部16は、表示設定情報取得部15によって表示設定情報が取得されているかどうか判断する。そして、取得されている場合、すなわち、手話映像を表示するための表示設定情報が存在する場合には、ステップS108に進み、そうでない場合には、ステップS107に進む。なお、表示部16は、取得された表示設定情報が記憶されるべき領域に、表示設定情報が格納されているかどうかによって、表示設定情報が取得されているかどうか判断してもよい。この場合には、表示設定情報が格納されている場合に、表示設定情報が取得されていることになる。
(ステップS107)表示設定情報取得部15は、一時的に記憶している番組関連情報に対応する表示設定情報を取得する。また、表示設定情報取得部15は、その取得した表示設定情報を図示しない記録媒体において一時的に記憶してもよい。
(ステップS108)表示部16は、表示設定情報取得部15が取得した表示設定情報が示す位置や大きさで、手話映像受付部12が受け付けた手話映像を表示する。そして、ステップS101に戻る。
なお、このフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。また、このフローチャートでは、表示部16が、番組映像と手話映像とを別々に表示する場合について説明したが(ステップS104,S108)、表示部16は、番組映像と手話映像とを一緒に表示するようにしてもよい。例えば、表示部16は、番組映像のフレームの一部の領域に手話映像が表示されるフレームを構成し、その構成したフレームを表示してもよい。
また、後述する具体例で説明するように、通常、番組関連情報に応じて表示設定情報が異なるため、新たな番組映像が受け付けられた場合には、その新たな番組映像に対応する番組関連情報が受け付けられることが好適であり、また、そのようにして受け付けられた新たな番組関連情報に対応する表示設定情報が取得されることが好適である。また、そのようにして取得された新たな表示設定情報を用いて手話映像が表示されることが好適である。
また、このフローチャートでは、手話映像の受け付けを行った後であって、表示設定情報が存在しないときに表示設定情報の取得を行う場合について説明したが、そうでなくてもよい。例えば、表示設定情報取得部15は、番組関連情報受付部13が番組関連情報を受け付けた際に、その番組関連情報に対応する表示設定情報を取得してもよく、その他のタイミングで表示設定情報を取得してもよい。
次に、本実施の形態による手話映像表示装置1の動作について、具体例を用いて説明する。
この具体例では、手話映像表示装置1が放送された番組映像、及び手話映像を受信し、その番組映像に重畳されている番組関連情報を用いて表示設定情報の取得が行われるものとする。したがって、番組映像に、その番組映像に対応する番組関連情報が重畳されていることによって、番組映像と番組関連情報との紐付けが行われていることになる。
また、この具体例において、表示設定情報記憶部14では、図3で示される情報が記憶されているものとする。図3において、番組のジャンルを示す番組関連情報と、表示設定情報とが対応付けられている。表示設定情報は、手話映像の画面の左上の位置を示す位置情報と、手話映像の画面の幅及び高さを示す大きさ情報とを含んでいる。例えば、番組関連情報「ニュース」には、位置情報(X1,Y1)、大きさ情報(W1,H1)を含む表示設定情報が対応付けられている。したがって、ニュースの番組映像の場合には、手話映像の画面の左上が(X1,Y1)の座標値となり、その手話映像の画面の幅がW1となり、高さがH1となるように手話映像が表示されることになる。
まず、手話映像表示装置1のユーザが、手話映像表示装置1を操作することによって、ニュース番組を見るようにチャンネル設定を行ったとする。すると、番組映像受付部11において、そのチャンネルの番組映像が受信され(ステップS103)、その番組映像がディスプレイに表示される(ステップS104)。そのようにして表示された番組映像は、図4で示されるものであったとする。この番組映像受付部11による番組映像の受信と、表示部16による番組映像の表示とは、繰り返して実行されることになる。
なお、その番組映像の受信に応じて、その番組映像に重畳されている番組関連情報「ニュース」が番組映像受付部11によって抽出され、その抽出された番組関連情報が図示しない経路を介して番組関連情報受付部13に渡されたとする。番組関連情報受付部13は、その番組関連情報を受け付けると表示設定情報取得部15に渡す(ステップS101)。表示設定情報取得部15は、その受け取った番組関連情報「ニュース」を図示しない記録媒体において一時的に記憶する(ステップS102)。
手話映像受付部12は、番組映像のチャンネルと、その番組映像に対応した手話映像のチャンネルとを対応付ける情報を用いて、ユーザが設定した番組映像のチャンネルに対応する手話映像のチャンネルを特定し、そのチャンネルの手話映像を受信する(ステップS105)。その手話映像は、例えば、図5で示されるものであったとする。
次に、表示部16は、表示設定情報が記憶されるべき領域を参照し、そこに表示設定情報が格納されていないことを検知して(ステップS106)、表示設定情報取得部15に表示設定情報を取得する指示を出す。すると、表示設定情報取得部15は、図示しない記録媒体で記憶している番組関連情報「ニュース」を読み出し、その番組関連情報を検索キーとして図3の情報を検索する。そして、検索でヒットした図3の1番目のレコードから、位置情報(X1,Y1)、大きさ情報(W1,H1)を含む表示設定情報を取得し、それらを図示しない記録媒体に蓄積する(ステップS107)。
表示部16は、そのようにして取得された表示設定情報を参照し、番組映像の(X1,Y1)の位置が左上の端点となり、幅がW1,高さがH1となるように手話映像受付部12が受け付けた手話映像の画面を表示する(ステップS108)。その結果、図6で示されるように、番組映像上に手話映像が表示されることになる。この手話映像受付部12による手話映像の受信と、表示部16による手話映像の表示とは、繰り返して時刻されることになる。このようにして、番組映像と手話映像との放送の受信が継続され、その番組映像と手話映像との表示が継続されることになる。
この具体例では、表示設定情報が番組のジャンルを示す番組関連情報に対応付けられている場合について説明したが、前述のように、表示設定情報は、例えば、番組の名称やその他の情報を示す番組関連情報に対応付けられていてもよいことは言うまでもない。例えば、番組の名称を示す番組関連情報に表示設定情報が対応付けられていることによって、手話映像のより細かい表示位置の制御が可能となる。
以上のように、本実施の形態による手話映像表示装置1によれば、表示設定情報の示す位置や大きさで、手話映像を表示することができる。また、番組関連情報受付部13が受け付けた番組関連情報に対応する表示設定情報を用いることによって、例えば、番組のジャンルごとや、番組ごとに手話映像の表示位置や大きさを設定することができ、各番組においてできるだけ影響がないと考えられる位置に手話映像を表示することができるようになる。その結果、手話映像と番組映像とを見るユーザは、番組映像と手話映像との両方を、適切に見ることができるようになりうる。
なお、本実施の形態では、番組関連情報に応じた表示設定情報を用いて手話映像を表示する場合について説明したが、そうでなくてもよい。番組関連情報を用いない場合には、手話映像表示装置1は、番組関連情報受付部13を備えていなくてもよい。また、表示設定情報記憶部14において、表示設定情報が番組関連情報に対応付けられていなくてもよい。
(実施の形態2)
本発明の実施の形態2による手話映像表示装置について、図面を参照しながら説明する。本実施の形態による手話映像表示装置は、手話映像表示装置において表示設定情報を生成するものである。
図7は、本実施の形態による手話映像表示装置2の構成を示すブロック図である。本実施の形態による手話映像表示装置2は、番組映像受付部11と、手話映像受付部12と、表示設定情報記憶部14と、表示設定情報取得部15と、表示部16と、オブジェクト特定情報記憶部21と、表示設定情報生成部22とを備える。オブジェクト特定情報記憶部21、表示設定情報生成部22以外の構成及び動作は、表示設定情報取得部15が番組関連情報に対応する表示設定情報を取得するのではなく、表示設定情報記憶部14で記憶されている表示設定情報を単に取得する以外は、実施の形態1と同様であり、その説明を省略する。
オブジェクト特定情報記憶部21では、手話映像によって覆われたくないオブジェクトを特定するための情報であるオブジェクト特定情報が記憶される。例えば、野球の番組である場合には、点数やカウント(ストライク、ボール、アウトのカウント)であってもよく、ニュースの番組である場合には、アナウンサーの顔や、ニュースの概要を示す文字であってもよく、ドラマの番組である場合には、人物であってもよい。オブジェクト特定情報は、手話映像によって覆われたくないオブジェクトを特定するための情報であれば、その内容を問わない。例えば、パターンマッチングで用いるパターンの図形であってもよく、オブジェクトの属性を指定する情報であってもよい。例えば、オブジェクトが野球のカウントである場合には、オブジェクト特定情報は、「S」「B」「O」の文字が直線上に並んでいることであってもよい。このようなオブジェクト特定情報を用いることによって、縦一列や横一列に並ぶ「S」「B」「O」の文字の領域(この領域がカウントの領域に対応する)を特定することができる。また、例えば、オブジェクトが人物である場合には、オブジェクト特定情報は、肌色検出を行い、検出された肌色を含む領域を、輪郭抽出を行うことによって特定する手順を示す情報であってもよい。このようなオブジェクト特定情報を用いることによって、番組映像における人物の領域を特定することができる。なお、例えば、人物やその他のオブジェクトの領域を特定する方法としては、すでに多くの方法が知られており、それらに応じたオブジェクト特定情報がオブジェクト特定情報記憶部21で記憶されていてもよいことは言うまでもない。
オブジェクト特定情報記憶部21にオブジェクト特定情報が記憶される過程は問わない。例えば、記録媒体を介してオブジェクト特定情報がオブジェクト特定情報記憶部21で記憶されるようになってもよく、通信回線等を介して送信されたオブジェクト特定情報がオブジェクト特定情報記憶部21で記憶されるようになってもよく、あるいは、入力デバイスを介して入力されたオブジェクト特定情報がオブジェクト特定情報記憶部21で記憶されるようになってもよい。オブジェクト特定情報記憶部21での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。オブジェクト特定情報記憶部21は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。
表示設定情報生成部22は、番組映像受付部11が受け付けた番組映像から表示設定情報を生成し、表示設定情報記憶部14に蓄積する。本実施の形態では、表示設定情報生成部22は、番組映像受付部11が受け付けた番組映像に対して動き検出を行い、動きのない領域に手話映像を表示する表示設定情報を生成する。ここで、「動きのない領域」とは、例えば、動きが全くない領域であってもよく、他の領域と比較して動きが少ない領域であってもよい。なお、動き検出の方法は、例えば、ブロックマッチング法や勾配法などがすでに知られており、その詳細な説明を省略する。
また、本実施の形態では、表示設定情報生成部22は、番組映像受付部11が受け付けた番組映像に、オブジェクト特定情報で特定されるオブジェクトが存在する場合に、そのオブジェクトを覆わない領域に手話映像を表示する表示設定情報を生成するものとする。例えば、表示設定情報生成部22は、『「S」「B」「O」の文字が直線上に並んでいること』を示すオブジェクト特定情報に応じて、番組映像上において文字認識を行い、「S」「B」「O」の文字が含まれるかどうか判断し、含まれる場合には、それらが直線上に並んでいるかどうか判断する。そして、直線上に並んでいる場合には、表示設定情報生成部22は、その「S」「B」「O」の文字の領域をオブジェクトとして特定する。また、例えば、表示設定情報生成部22は、人物を特定する情報であるオブジェクト特定情報に応じて、肌色検出等を行うことによって、人物の領域を特定してもよい。また、表示設定情報生成部22は、オブジェクトの領域よりもさらに広い領域を覆わないように手話映像を表示する表示設定情報を生成してもよい。オブジェクトの領域よりもさらに広い領域とは、例えば、オブジェクトと、オブジェクトの外周の領域(例えば、オブジェクトの最外縁の位置から、所定の長さだけオブジェクトから離れた位置までの範囲でもよい)とを含む領域であってもよい。また、表示設定情報生成部22は、オブジェクトの外縁の一部に手話映像の一部が表示されるように表示設定情報を生成してもよい。すなわち、オブジェクトの一部と手話映像の一部とが重なってもよい。オブジェクトの外縁のあたりは、オブジェクトの中心のあたりに比較して重要度が低いとも考えられるからである。
なお、表示設定情報生成部22は、番組映像の表示領域を複数のブロックに分け、そのブロック単位で動き検出や、オブジェクトを覆うかどうかの判定等を行ってもよい。本実施の形態では、このようにブロック単位で動き検出等を行う場合について説明する。
なお、本実施の形態では、表示設定情報取得部15は、表示設定情報の取得を繰り返して実行してもよい。前述のように、表示設定情報生成部22が新たな表示設定情報を表示設定情報記憶部14に蓄積するため、その新たな表示設定情報を取得し、その新たな表示設定情報に応じた表示を行うためである。表示設定情報取得部15は、例えば、定期的(例えば、1分ごと、5分ごと、30分ごとなど)に最新の表示設定情報を取得してもよく、表示設定情報記憶部14に新たに生成された表示設定情報が記憶されるごとに、表示設定情報記憶部14で記憶されている最新の表示設定情報を取得してもよい。表示設定情報生成部22が上書きで表示設定情報を表示設定情報記憶部14に蓄積する場合には、表示設定情報記憶部14で記憶されている表示設定情報が最新の表示設定情報となる。一方、表示設定情報生成部22が上書きしないで表示設定情報を表示設定情報記憶部14に蓄積する場合には、最後に蓄積された表示設定情報が最新の表示設定情報となる。
また、表示部16は、表示設定情報取得部15が表示設定情報を取得するごとに、最新の表示設定情報に応じて手話映像を表示することになる。
なお、表示設定情報記憶部14と、オブジェクト特定情報記憶部21とは、同一の記録媒体によって実現されてもよく、あるいは、別々の記録媒体によって実現されてもよい。前者の場合には、例えば、表示設定情報を記憶している領域が表示設定情報記憶部14となり、オブジェクト特定情報を記憶している領域がオブジェクト特定情報記憶部21となる。
次に、本実施の形態による手話映像表示装置2の動作について、図8のフローチャートを用いて説明する。
(ステップS201)番組映像受付部11は、番組映像を受け付けたかどうか判断する。そして、番組映像を受け付けた場合には、ステップS202に進み、そうでない場合には、ステップS204に進む。なお、番組映像受付部11は、番組映像を一フレームごとに受信してもよく、あるいは、連続する複数のフレームごとに受信してもよい。
(ステップS202)表示部16は、番組映像受付部11が受け付けた番組映像を表示する。
(ステップS203)表示設定情報生成部22は、表示設定情報の生成のために、受け付けられた番組映像を一時的に記憶する。そして、ステップS201に戻る。
(ステップS204)手話映像受付部12は、手話映像を受け付けたかどうか判断する。そして、手話映像を受け付けた場合には、ステップS205に進み、そうでない場合には、ステップS206に進む。なお、手話映像受付部12は、手話映像を一フレームごとに受信してもよく、あるいは、連続する複数のフレームごとに受信してもよい。
(ステップS205)表示部16は、表示設定情報取得部15が取得した表示設定情報が示す位置や大きさで、手話映像受付部12が受け付けた手話映像を表示する。そして、ステップS201に戻る。なお、このステップS205の処理が実行されるまでに、ステップS209での表示設定情報の取得が行われているものとする。
(ステップS206)表示設定情報生成部22は、表示設定情報を生成するかどうか判断する。そして、生成する場合には、ステップS207に進み、そうでない場合には、ステップS208に進む。表示設定情報生成部22は、例えば、定期的に(例えば、10秒ごと、30秒ごと、1分ごとなど)に、表示設定情報を生成すると判断してもよく、あらかじめ決められているイベントの発生(例えば、番組映像におけるシーンチェンジの発生でもよい。なお、シーンチェンジを検出する方法はすでに公知である)を契機として、表示設定情報を生成すると判断してもよく、あるいは、その他のタイミングで表示設定情報を生成すると判断してもよい。
(ステップS207)表示設定情報生成部22は、表示設定情報を生成する。この処理の詳細については、図9のフローチャートを用いて後述する。
(ステップS208)表示設定情報取得部15は、表示設定情報を取得するかどうか判断する。そして、表示設定情報を取得する場合には、ステップS209に進み、そうでない場合には、ステップS201に戻る。表示設定情報取得部15は、例えば、定期的に(例えば、10秒ごと、30秒ごと、1分ごとなど)に、表示設定情報を取得すると判断してもよく、あらかじめ決められているイベントの発生(例えば、新たな表示設定情報が表示設定情報記憶部14に蓄積されたことでもよい)を契機として、表示設定情報を取得すると判断してもよく、あるいは、その他のタイミングで表示設定情報を取得すると判断してもよい。
(ステップS209)表示設定情報取得部15は、表示設定情報記憶部14で記憶されている最新の表示設定情報を取得する。また、表示設定情報取得部15は、その取得した表示設定情報を図示しない記録媒体において一時的に記憶してもよい。そして、ステップS201に戻る。
なお、このフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。また、このフローチャートでは、表示部16が、番組映像と手話映像とを別々に表示する場合について説明したが(ステップS202,S205)、表示部16は、番組映像と手話映像とを一緒に表示するようにしてもよい。例えば、表示部16は、番組映像のフレームの一部の領域に手話映像が表示されるフレームを構成し、その構成したフレームを表示してもよい。
図9は、図8のフローチャートにおける表示設定情報の生成(ステップS207)の処理の詳細を示すフローチャートである。なお、このフローチャートでは、番組映像を複数のブロックに分けて、そのブロックごとに処理する場合について説明する。
(ステップS301)表示設定情報生成部22は、ブロックごとに動き検出を行う。
(ステップS302)表示設定情報生成部22は、オブジェクト特定情報記憶部21で記憶されているオブジェクト特定情報を用いて、番組映像上のオブジェクトを特定し、そのオブジェクトを含むブロックを検出する。なお、このブロックの検出において、例えば、特定されたオブジェクトがブロックの面積の所定の割合(例えば、50%)以上を占める場合に、オブジェクトを含むブロックであるとしてもよい。
(ステップS303)表示設定情報生成部22は、ステップS302でオブジェクトを含むブロックが検出された場合には、そのオブジェクトを含むブロック以外のブロックであって、ステップS301で検出した動きの程度が小さい1以上のブロックを、手話映像を表示するブロックに決定する。なお、手話映像を表示するブロックの範囲は、あらかじめその大きさが決められていてもよく(例えば、2×2のブロックに決められていてもよい)、あるいは、そのブロックの最大値のみが決められていてもよい(例えば、ブロックの最大値が3×3のブロックに決められていてもよい)。前者の場合には、例えば、表示設定情報生成部22は、そのブロックの範囲を、特定されたオブジェクトを含まないブロックであって、動きの程度が最も小さくなるブロックの範囲に決定してもよい。後者の場合には、例えば、表示設定情報生成部22は、そのブロックの範囲を、特定されたオブジェクトを含まないブロックであって、動きの程度があらかじめ決められているしきい値以下となるブロックの範囲(ただし、全てのブロックの動きの程度がしきい値を超えている場合には、動きの程度が最も小さいブロック)に決定してもよい。
(ステップS304)表示設定情報生成部22は、ステップS303で決定したブロックの範囲に手話映像が表示されるように、表示設定情報を生成する。
(ステップS305)表示設定情報生成部22は、その生成した表示設定情報を、表示設定情報記憶部14に蓄積する。そして、図8のフローチャートに戻る。
次に、本実施の形態による手話映像表示装置2の動作について、具体例を用いて説明する。
この具体例でも、手話映像表示装置2が放送された番組映像、及び手話映像を受信し、その番組映像に重畳されている番組関連情報を用いて表示設定情報の取得が行われるものとする。また、この具体例では、表示設定情報が位置情報のみを含む場合について説明する。また、この具体例では、表示設定情報生成部22は、10秒ごとに表示設定情報を生成するものとする。また、この具体例では、人物を特定するためのオブジェクト特定情報がオブジェクト特定情報記憶部21で記憶されているものとする。また、この具体例では、2×2のブロックが手話映像の表示領域として特定されるものとする。したがって、手話映像の表示の大きさは、その2×2のブロックの大きさにあらかじめ決められていることになる。また、表示設定情報取得部15は、表示設定情報が蓄積されたタイミングで、新たな表示設定情報を取得すると判断するものとする。
また、この具体例では、図10で示されるように、番組映像を4×5のブロックに分けて、そのブロックごとに動き検出などを行うものとする。ブロック上の「B01」「B02」などは、ブロックを識別するブロックIDである。また、各ブロックの左上の端点の座標値があらかじめ図示しない記録媒体において記憶されているものとする。
まず、手話映像表示装置2のユーザが、手話映像表示装置2を操作することによって、ニュース番組を見るようにチャンネル設定を行ったとする。すると、番組映像受付部11において、そのチャンネルの番組映像が受信され(ステップS201)、その番組映像がディスプレイに表示される(ステップS202)。そのようにして表示された番組映像は、図4で示されるものであったとする。また、その番組映像受付部11が受け付けた番組映像は、表示設定情報生成部22に渡され、その表示設定情報生成部22において一時的に記憶される(ステップS203)。
手話映像受付部12は、番組映像のチャンネルと、その番組映像に対応した手話映像のチャンネルとを対応付ける情報を用いて、ユーザが設定した番組映像のチャンネルに対応する手話映像のチャンネルを特定し、そのチャンネルの手話映像を受信する(ステップS204)。その手話映像は、例えば、図5で示されるものである。表示部16は、表示設定情報取得部15がそれまでに取得している表示設定情報に応じて手話映像を表示する(ステップS205)。したがって、この場合の手話映像の表示は、番組映像に応じていない不適切なものとなりうる。この番組映像受付部11による番組映像の受信と、表示部16による番組映像の表示とは、繰り返して実行されることになる。
次に、番組映像受付部11が第11フレーム目の番組映像を受信した時点で、表示設定情報生成部22は、表示設定情報の生成を行うと判断したとする(ステップS206)。そして、それらの番組映像を用いて、表示設定情報の生成が行われる(ステップS207)。具体的には、表示設定情報生成部22は、図10で示されるブロックごとに、動き検出を行う(ステップS301)。この動き検出は、各ブロックにおいて、時間的に隣接するフレーム間の類似度を算出することによって行うものとする。具体的には、第1フレームのブロックID「B01」で識別されるブロック(このブロックを「ブロックB01」と呼ぶことにする。他のブロックについても同様であるとする)について、第1フレームと、第2フレームとの間の類似度を算出する。その類似度が100%であれば、まったく変化がないことになり、動きのないブロックとなる。一方、その類似度が100%未満であれば、その類似度に応じた変化(動き)が存在したことになる。類似度が低いほど、変化(動き)が大きくなることは自明である。この具体例では、最新の10個の類似度の平均を用いて、動き検出を行うものとする。したがって、表示設定情報生成部22は、ブロックごとに、最新の10個の隣接するフレーム間の類似度を算出し、また、その算出した10個の類似度の平均を算出して、図11で示されるように、図示しない記録媒体に蓄積する。図11において、ブロックIDと、類似度の平均とが対応付けられている。例えば、ブロックB01の類似度の平均が100%であり、ブロックB01では、10フレームにわたって変化が全くなかったことが示されている。
次に、表示設定情報生成部22は、人物を特定するオブジェクト特定情報を読み出し、番組映像の最新のフレームを用いて人物の特定を行う。そして、その特定した人物の領域を含むブロックIDを、図示しない記録媒体に蓄積する(ステップS302)。この場合には、ブロックID「B06」「B07」「B08」「B11」「B12」「B13」「B16」「B17」「B18」がオブジェクトを含むブロックのブロックIDとして蓄積され、一時的に記憶されるものとする。
すると、表示設定情報生成部22は、その一時的に記憶されているオブジェクトを含むブロックIDで識別されるブロックを含まない2×2のブロックであって、その4個のブロックの類似度の合計が最も大きい2×2のブロックを特定する(ステップS303)。この場合には、ブロックB14,B15,B19,B20がそのようにして特定されたとする。
表示設定情報生成部22は、その2×2のブロックの左上の端点に対応する座標値(X101,Y101)を取得し(ステップS304)、その座標値を表示設定情報記憶部14に蓄積する(ステップS305)。その結果、図12で示される表示設定情報が表示設定情報記憶部14で記憶されるようになる。
新たな表示設定情報が蓄積されたため、表示設定情報取得部15は、表示設定情報を取得するタイミングであると判断し(ステップS208)、図12で示される表示設定情報を表示設定情報記憶部14から取得して、図示しない記録媒体に蓄積する(ステップS209)。その後、手話映像が表示される際には、図13で示されるように、ブロックB14,B15,B19,B20の領域に手話映像が表示されることになる(ステップS204,S205)。
なお、この具体例では、表示設定情報生成部22が表示設定情報のうちの位置情報のみを生成する場合について説明したが、表示設定情報生成部22は、大きさ情報も生成してもよい。この具体例の場合には、その大きさ情報は、いつも同じ情報となる。
以上のように、本実施の形態による手話映像表示装置2によれば、動的に表示設定情報を生成することにより、各番組映像において最適な位置に手話映像を表示することができるようになる。動きのない領域に手話映像を表示することによって、ユーザが見たいであろう動きのある領域を手話映像によって隠すことを回避できうる。また、オブジェクト特定情報によって特定されるオブジェクトの領域を避けて手話映像を表示することによって、手話映像によって隠したくない領域が確実にユーザに見られるようにすることができる。
なお、本実施の形態では、オブジェクト特定情報で特定されるオブジェクトを覆わない領域に手話映像を表示する表示設定情報を生成する場合について説明したが、そうでなくてもよい。オブジェクト特定情報を用いた表示設定情報の生成を行わない場合には、手話映像表示装置2は、オブジェクト特定情報記憶部21を備えていなくてもよく、また、表示設定情報生成部22は、オブジェクト特定情報を用いた表示設定情報の生成を行わなくてもよい。
また、本実施の形態では、動き検出を行って、動きのない領域に手話映像を表示する表示設定情報を生成する場合について説明したが、そうでなくてもよい。表示設定情報生成部22は、動き検出を行わないで表示設定情報を生成してもよい。その場合には、例えば、オブジェクト特定情報を用いた表示設定情報の生成を行ってもよい。
また、上記各実施の形態の具体例において、まず番組映像が表示された後に、手話映像を含む番組映像が表示されるようになる場合について説明したが、番組映像のみが表示されている期間は、1,2フレーム程度であり、1/30〜2/30秒程度であるため、あまり影響はないと考えられる。一方、はじめから番組映像と手話映像とが同時に表示されるようにしてもよい。その場合には、手話映像を表示することができるようになるまで、すなわち、表示設定情報の取得等が行われるまで番組映像の表示を行わず、手話映像を表示できるようになってから、手話映像と番組映像とを表示するようにしてもよい。
また、上記各実施の形態では、手話映像表示装置1,2がスタンドアロンである場合について説明したが、手話映像表示装置1,2は、スタンドアロンの装置であってもよく、サーバ・クライアントシステムにおけるサーバ装置であってもよい。後者の場合には、表示部や受付部は、通信回線を介して情報を表示したり、情報を受け付けたりしてもよい。
また、上記各実施の形態において、各処理または各機能は、単一の装置または単一のシステムによって集中処理されることによって実現されてもよく、あるいは、複数の装置または複数のシステムによって分散処理されることによって実現されてもよい。
また、上記各実施の形態において、各構成要素が実行する処理に関係する情報、例えば、各構成要素が受け付けたり、取得したり、選択したり、生成したり、送信したり、受信したりした情報や、各構成要素が処理で用いるしきい値や数式、アドレス等の情報等は、上記説明で明記していない場合であっても、図示しない記録媒体において、一時的に、あるいは長期にわたって保持されていてもよい。また、その図示しない記録媒体への情報の蓄積を、各構成要素、あるいは、図示しない蓄積部が行ってもよい。また、その図示しない記録媒体からの情報の読み出しを、各構成要素、あるいは、図示しない読み出し部が行ってもよい。
また、上記各実施の形態において、各構成要素等で用いられる情報、例えば、各構成要素が処理で用いるしきい値やアドレス、各種の設定値等の情報がユーザによって変更されてもよい場合には、上記説明で明記していない場合であっても、ユーザが適宜、それらの情報を変更できるようにしてもよく、あるいは、そうでなくてもよい。それらの情報をユーザが変更可能な場合には、その変更は、例えば、ユーザからの変更指示を受け付ける図示しない受付部と、その変更指示に応じて情報を変更する図示しない変更部とによって実現されてもよい。その図示しない受付部による変更指示の受け付けは、例えば、入力デバイスからの受け付けでもよく、通信回線を介して送信された情報の受信でもよく、所定の記録媒体から読み出された情報の受け付けでもよい。
また、上記各実施の形態において、手話映像表示装置1,2に含まれる2以上の構成要素が通信デバイスや入力デバイス等を有する場合に、2以上の構成要素が物理的に単一のデバイスを有してもよく、あるいは、別々のデバイスを有してもよい。
また、上記各実施の形態において、各構成要素は専用のハードウェアにより構成されてもよく、あるいは、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。なお、上記実施の形態における手話映像表示装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、番組の映像である番組映像を受け付ける番組映像受付部、前記番組映像に対応した手話の映像である手話映像を受け付ける手話映像受付部、前記手話映像を表示する位置に関する情報である位置情報を含む表示設定情報が記憶される表示設定情報記憶部から表示設定情報を取得する表示設定情報取得部、前記表示設定情報取得部が取得した表示設定情報に応じて、前記手話映像受付部が受け付けた手話映像と、前記番組映像受付部が受け付けた番組映像とを表示する表示部、として機能させるためのものである。
なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得部や、情報を受け付ける受付部、情報を表示する表示部などにおけるモデムやインターフェースカードなどのハードウェアでしか実現できない機能は、上記プログラムが実現する機能には少なくとも含まれない。
また、このプログラムは、サーバなどからダウンロードされることによって実行されてもよく、所定の記録媒体(例えば、CD−ROMなどの光ディスクや磁気ディスク、半導体メモリなど)に記録されたプログラムが読み出されることによって実行されてもよい。また、このプログラムは、プログラムプロダクトを構成するプログラムとして用いられてもよい。
また、このプログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
図14は、上記プログラムを実行して、上記各実施の形態による手話映像表示装置1,2を実現するコンピュータの外観の一例を示す模式図である。上記各実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現されうる。
図14において、コンピュータシステム900は、CD−ROM(Compact Disk Read Only Memory)ドライブ905、FD(Floppy(登録商標) Disk)ドライブ906を含むコンピュータ901と、キーボード902と、マウス903と、モニタ904とを備える。
図15は、コンピュータシステム900の内部構成を示す図である。図15において、コンピュータ901は、CD−ROMドライブ905、FDドライブ906に加えて、MPU(Micro Processing Unit)911と、ブートアッププログラム等のプログラムを記憶するためのROM912と、MPU911に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM(Random Access Memory)913と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク914と、MPU911、ROM912等を相互に接続するバス915とを備える。なお、コンピュータ901は、LANへの接続を提供する図示しないネットワークカードを含んでいてもよい。
コンピュータシステム900に、上記各実施の形態による手話映像表示装置1,2の機能を実行させるプログラムは、CD−ROM921、またはFD922に記憶されて、CD−ROMドライブ905、またはFDドライブ906に挿入され、ハードディスク914に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ901に送信され、ハードディスク914に記憶されてもよい。プログラムは実行の際にRAM913にロードされる。なお、プログラムは、CD−ROM921やFD922、またはネットワークから直接、ロードされてもよい。
プログラムは、コンピュータ901に、上記各実施の形態による手話映像表示装置1,2の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム900がどのように動作するのかについては周知であり、詳細な説明は省略する。
また、本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。