まず本発明の実施形態を説明する前に、日本のデジタル放送関連の規格を策定している社団法人電波産業会(Association of Radio Industries and Businesses、以後、ARIBと称する)が定めた字幕表示に関する規格を説明する。ARIB規格のSTD−B24及びTR−B14、B15等においては、各種のデジタル放送で用いられる字幕ストリームを規定している。字幕ストリームとは、受像機に字幕情報を表示するために放送局が送出するデータである。字幕ストリームデータは、映像データや音声データとともに多重化されたTSとして放送される。
次に、字幕ストリームの構成を説明する。字幕ストリーム(字幕データとも称する)には、字幕に関する各種のパラメータ情報と字幕データの全体制御コードからなる字幕管理データが含まれている。また、さらに字幕ストリームには、字幕の本体部分を構成している文字データ及びその文字に対して適用される字幕文制御コードからなる字幕文データが含まれている。字幕管理データに含まれる各種パラメータ情報は、主に図2の表で示される情報である。また、字幕管理データに含まれる全体制御コードは図3の表で示される情報である。また、字幕文データに含まれる字幕文制御コードには、その字幕文で用いる各種の制御情報が含まれる。特に字幕文制御コードには、図3の表で示した全体制御コードと同じ制御コードを含めることが出来る。その場合には、字幕管理データに含まれる各種パラメータ情報で指定された情報は更新される。字幕データの全体制御コード及び字幕文制御コードの設定は、必要に応じて放送事業者側で行われるため、常にすべての情報が設定されるわけではない。
字幕管理データと字幕文データの送出間隔(受信間隔)は図4に示すタイミングで行われる。一般的には、字幕管理データは0.3秒から5秒程度の間隔で送出されている。また、ARIB規格では、字幕管理データを取得しないと字幕文データが表示できない構成となっている。そのため、放送受信機をARIB規格に従って動作させ、図4に示す401のタイミングで選局が指示された場合、字幕文データA402及び字幕文データB403は表示できない。そして、字幕管理データ405の受信後の、字幕文データC404からの表示が可能となる。上述したように、字幕管理データの送出間隔は、ARIB規格で最大5秒と定められている。したがって、電源投入時や選局時のタイミング次第では、所望のチャンネルを表示してから5秒程度経過後に字幕表示が開始されることになる。図4は字幕管理データの送出間隔(受信間隔)を5秒間隔とした場合の例である。すなわち、字幕管理データは、nを基準とすると、n+5秒後、n+10秒後、・・・のように5秒間隔で送出され、受信される。
従って、字幕管理データを取得する前に受信した字幕文データを表示するためには、字幕管理情報及び全体制御コードを予測する必要がある。字幕データの表示に必要なパラメタは、字幕管理情報の表示書式(format)と、全体制御コードの書式選択(SWF)、表示領域サイズ指定(SDF)及び表示領域位置指定(SDP)である。字幕管理情報の言語数、言語識別番号、言語コード、ロールアップモード、文字サイズ指定(SSM)、文字間隔指定(SHS)及び行間隔指定(SVS)は、運用規定内の任意の数をデフォルト値とし、その値で処理を行えば問題ない。
以上を踏まえ、以下、図1に示したデジタル放送受信装置を例として、本発明の実施形態1について説明する。図1は、本発明が適用された実施形態1のデジタル放送受信装置の機能ブロック構成図である。
図1において、100は受信選局部で、アンテナ101で受信した放送波から希望チャンネルを選択する機能を有する。チャンネルの選択は、通常リモコン102の操作でなされる。受信選局部100は、選局した放送局の番組のMPEG2−TSを出力する。受信選局部100からのMPEG2−TSは、TSパケット処理部103に供給され、映像ES(Elementary Stream)、音声ES、字幕ES、番組情報等に分離して出力される。ARIBに規定されるデジタル放送では、多重層にMPEG2−TSが用いられるため、MPEG2−TSの分離処理を行うことが必要となる。
また、TSパケット処理部103から出力される映像ES及び音声ESは、映像/音声復号処理部104に供給され、圧縮動画信号と、圧縮音声信号とに分離されて出力される。また、TSパケット処理部103は、字幕データ分離処理部105に接続され、分離した字幕データ信号を字幕データ分離処理部105に出力する。映像/音声復号処理部104は、TSパケット処理部103が分離した映像ESおよび音声ESを復号する。すなわち、デジタル放送で用いられる圧縮動画および圧縮音声を復号する。一般的なデジタル放送では、動画にはMPEG2動画、音声にはMPEG2−AAC、MPEG1−Audio、DolbyDigital(AC−3)等が用いられる。しかし、ARIBに規定されるデジタル放送では、動画にMPEG2および音声にAACが用いられるため、MPEG2動画復号及びAAC音声復号が必要となる。
映像/音声復号部104は、さらに映像/音声出力処理部106と接続され、復号映像信号および復号音声信号を出力する。映像/音声出力処理部106では、映像/音声復号処理部104で復号した映像及び音声を出力する。すなわち、復号された動画を決められた解像度およびフレームレートで出力し、復号された音声を決められたサンプルレートで出力する。
映像/音声出力処理部106から復号音声信号は、音声出力端子107から出力され、復号映像信号は、映像合成部114を介して映像出力端子108から出力される。音声出力端子107には、図示しない外部アンプ等が接続され、音声信号を出力する。また、映像出力端子108には、図示しないディスプレイ等が接続される。字幕データ分離処理部105は、TSパケット処理部103が分離した字幕ESを取得し、字幕管理データ及び字幕文データに分離する。字幕データ分離処理部105は、ARIB規格に準拠した字幕を字幕管理データ及び字幕文データに分離する。
すなわち、字幕データ分離処理部105は、TSパケット処理部103に接続され、字幕ESを入力とし、字幕文データ及び字幕管理データを出力する。字幕データ分離処理部105は字幕文情報処理部109に接続され、字幕文情報処理部109に対し字幕文データを出力する。また字幕データ分離処理部105は、さらに字幕管理データ処理部110にも接続されており、字幕管理データ処理部110に対し字幕管理データを出力する。
字幕文情報処理部109は、ARIB規格に準拠する字幕文データを解析し、字幕文データに含まれる字幕文制御コードを取得する。また、字幕文情報処理部109は、字幕管理データ予測処理部111に接続されており、字幕管理データ予測処理部111に字幕文制御コードを出力する。また字幕文情報処理部109は、さらに字幕作成処理部112にも接続されており、字幕作成処理部112に対し字幕文データを出力する。
字幕管理データ処理部110は、ARIB規格に準拠する字幕管理データを解析し、字幕管理データに含まれるパラメータ情報、全体制御コード等を取得し、出力する。また、字幕管理データ処理部110は、字幕管理データ予測処理部111に接続されており、字幕管理データ予測処理部111に対し、字幕管理データが取得されているか否かを示す字幕管理データ存在情報を出力する。また字幕管理データ処理部110は、さらにスイッチ113と接続されている。
字幕管理データ予測処理部111は、字幕管理データ処理部110から、選局中の番組の字幕管理データの取得の有無を示す情報を受け取る。この情報は上述した字幕管理データ存在情報である。字幕管理データが取得されていない場合には、字幕管理データ予測処理部111は、字幕文情報処理部109からの字幕文制御コードを用いて予測字幕管理データを作成する。
また、字幕管理データ予測処理部111もスイッチ113と接続されている。スイッチ113は、この字幕管理データ存在情報に基づいて、出力する字幕文に適用する字幕管理データを放送波から取得したものとするか、字幕管理データ予測処理部111が予測して生成した予測字幕管理データを用いるかを選択する。
字幕作成処理部112は、字幕文情報処理部109から取得した字幕文制御コード及び字幕文データと、スイッチ113で選択されたパラメータ情報及び全体制御コードを含む字幕管理データとに基づいて、表示用字幕データを作成する。字幕作成処理部112は、字幕管理データに記載されるパラメータ情報及び全体制御コードと、字幕文データに記載される字幕文制御コード及び字幕文データを用いて字幕の表示を制御する。さらに字幕文本体の復号を行い、フォントを展開して字幕文を作成する。また、字幕作成処理部112は映像合成部114と接続され、作成した字幕画像を、復号映像信号や各種グラフィックスと合成後、映像出力端子108に出力する。
また、図1のデジタル放送受信装置は、装置全体が、CPU115による制御に従い各種動作を行う。これらは、ROM116に記憶された制御プログラムに従って、RAM117をワークエリアなどとして用いて動作をするものである。本願の以下に説明する実施形態の動作にあっても、ROM116に記憶された制御プログラムに従って動作可能である。また、視聴者がデジタル放送受信装置を操作するには、たとえば、赤外線通信をおこなうリモコン102を操作する。リモコン102からの赤外線信号はリモコン信号受信部118で受信され、解読される。解読されたリモコン信号はCPU115に与えられ、各種の機能の動作が実現可能となる。
次に、本実施形態1における字幕表示の動作を説明する。まず、現在選局されて視聴中である番組の字幕管理データが取得できている場合の動作を説明する。
視聴者のリモコン102の操作により放送の受信が指示されると、受信選局部100は指示されたチャンネルを選局し、受信した番組のMPEG2−TSをTSパケット処理部103に入力する。MPEG2−TSは、映像ストリーム、音声ストリーム、字幕ストリーム、データ放送ストリーム、番組情報、制御情報等が多重された多重ストリームとして構成されている。したがって、TSパケット処理部103では、多重された情報を分離し、各情報を各情報処理のための処理部に渡す。例えば映像ストリーム、音声ストリームであれば、映像/音声復号部104にて映像の復号処理、音声の復号処理が行われ、映像/音声出力処理部106にそれぞれ出力される。本発明の実施形態1の説明においては、デジタル放送の映像/音声出力、データ放送コンテンツの出力に関しては主眼ではない。したがって、本願の実施形態1のデジタル放送表示装置を構成する構成要素ではあるが、それらの説明は省略する。
字幕データ分離処理部105が分離した字幕文データは、字幕文情報処理部109で処理される。字幕文情報処理部109は、字幕文データを解析し、その字幕を表示するために指示されている字幕文制御コードと、字幕文本体を取得する。得られた字幕文データは字幕作成処理部112に送られる。
字幕データ分離処理部105が分離した字幕管理データは、字幕管理データ処理部110で処理される。字幕管理データ処理部110は、字幕管理データを解析し、それぞれの字幕文すべてに適用するパラメータ情報及び全体制御コードを取得する。取得された情報は、スイッチ113を通じて字幕作成処理部112に送られる。
スイッチ113は、字幕管理データ処理部110から出力される字幕管理データ存在情報を用いて、現在視聴中の番組の字幕管理データが取得できているか否かを判定し、スイッチを切り替える。本例では字幕管理データが取得できているので、字幕管理データ処理部110と字幕作成処理部112を接続する。字幕作成処理部112は、パラメータ情報、全体制御コード、字幕文制御コードおよび字幕文本体を受け取り、字幕の復号を行い、制御コードに従った字幕表示信号を作成する。
次に、現在視聴中の番組の字幕文データが取得できているが、字幕管理データが取得できていない場合の字幕管理情報、全体制御コードの予測時の動作を説明する。
視聴者の、リモコン102の操作により受信選局部100に特定の放送の受信が指示されると、受信選局部100から視聴者の指示に従った放送のMPEG2−TSがTSパケット処理部103に入力される。TSパケット処理部103は多重された情報を分離し、各情報を各情報処理のための各処理部に渡す。以下、字幕情報について説明する。
字幕データ分離処理部105は、TSパケット処理部103から字幕ストリームを受け取り、解析及び分離を行う。字幕データ分離処理部105が分離した字幕文データは字幕文情報処理部109で処理される。字幕文情報処理部109は字幕文データを解析し、その字幕を表示するために指示されている字幕文制御コードと、字幕文本体を取得する。得られた字幕文データは字幕作成処理部112に送られる。また本実施形態1では、得られた字幕文制御コードは、字幕管理データ予測処理部111に送られる。
字幕管理データ予測処理部111は、字幕管理データ処理部110から送信される字幕管理データの存在有無を示す情報(字幕管理データ存在情報)を受け付ける。本例では、字幕管理データ処理部110は字幕管理データが取得できていないので、未取得を示す情報を字幕管理データ予測処理部111に出力する。字幕管理データ予測処理部111は、字幕管理データ処理部110から字幕管理データ未取得の通知を受けると、すでに受信済みの字幕文制御コードを解析し、字幕管理データを予測する。予測される字幕管理データは、予測パラメータ情報と、予測全体制御コードからなる。そして、字幕文制御コードから予測された予測字幕管理データをスイッチ113に出力する。予測の手法については後述する。
スイッチ113は、字幕管理データ処理部110が字幕管理データを取得している間は字幕管理データ処理部110と字幕作成処理部112を接続する。しかし、字幕管理データ処理部110が字幕管理データを取得していない間は、字幕管理データ予測処理部111と字幕作成処理部112を接続する。ここでの記載は字幕管理データが取得できていないので、スイッチ113は字幕管理データ予測処理部111と字幕作成処理部112を接続する。
字幕作成処理部112は、入力された予測パラメータ情報、予測全体制御コード、字幕文制御コードおよび字幕文本体を受け取り、制御コードに従った字幕表示を作成する。作成された字幕表示の信号は、映像合成部114で放送の映像信号と合成され、映像出力端子108から出力される。
次に、字幕管理データ予測処理部111の動作を詳細に説明する。字幕管理データ予測処理部111は、前述のとおり、字幕管理データが未取得で、かつ字幕データが取得された場合に、字幕データを表示するための字幕管理データを予測する。字幕管理データ予測処理部111は、以下2つの予測手法を実行する。
(1)字幕文データに含まれる字幕文制御コードから、字幕管理データが予測できる場合は字幕文データから予測する、及び
(2)(1)に記載した方法からは予測できない場合、あらかじめ定めておいた基準値を用いて予測する。さらに字幕管理データ予測処理部111は、予測した字幕表示位置が適切か否かを判定する。
以下順に、図5のフローチャートを用いて予測動作を説明する。字幕文データに含まれる字幕文制御コードから予測が必要なパラメータ情報データ、全体制御コードが予測できるかどうかの判定は、フローチャートの符号500で囲まれた部分となる。
判定は「字幕文制御コードに表示領域サイズ(SDF)が含まれているか」、「字幕文制御コードに表示位置(SDP)が含まれているか」、「字幕文制御コードに縦書き横書き指定(SWF)が含まれているか」で判断する。まず、ステップS501で表示領域サイズコードが含まれていないと判定された場合はステップS504へ移行する。
ステップS504において、表示位置コードが含まれていないと判定された場合はステップS505へ移行する。さらに、ステップS505において、縦書き横書き指定コードが含まれていないと判定された場合は、ステップS521へ移行する。この場合、上述した予測手法のうち、(2)を適用することになる。即ち、字幕文データからの予測は不可として、予め定められたデフォルトパラメータを上述したSDF、SDP、SWFに適用する。上記3つのコードが1つでも含まれる場合は、存在するコードから存在しないコードを予測する。
上記3つのコードが存在する場合と存在しない場合を仮定すると、組み合わせは図6の表に示すように8通り存在する。上記3つのコードがすべて存在する場合(図6の601の場合)は、これらのコードを予測することは不要となる。即ち、図5のフローチャートによれば、ステップS501からステップS502、ステップS503と移行する。そして、符号530で囲まれたステップS531に進む。また、すべて存在しない場合(図6の608の場合)は、上述した通りである。次に、残りの6通りの予測手法について説明する。
表示領域サイズの指定(SDF)及び表示領域位置の指定(SDP)が存在し、縦書き横書きの指定(SWF)が存在しない場合(図6の602の場合)は、ステップS501からステップS502、ステップS503を経由して、ステップS508へ移行する。ステップS508では、表示領域サイズと表示領域位置から縦書きか横書きかを決定する。例えば図7に示した表に定義されているように、指定された表示領域サイズの縦横比から横書きらしさ(横書きである可能性)を4段階で評価する。さらに、指定された表示領域位置から横書きらしさを4段階で評価する。そして、夫々の評価値から縦書きが指定されているか、又は横書きが指定されているかを決定し、暫定の予測字幕管理データとする。
また、表示領域サイズの指定(SDF)及び縦書き横書きの指定(SWF)が存在し、表示領域位置の指定(SDP)が存在しない場合(図6の603)は、ステップS501、ステップS502、ステップS506を経由し、ステップS509へ移行する。ステップS509では、指定された表示領域サイズ指定及び縦書き横書きの指定から表示領域位置を決定する。たとえば、図8に示すように、縦書き指定がされている場合と、横書き指定がされていた場合の表示領域位置の基準位置をあらかじめ決めておく。そして、縦書きか指定か横書き指定かで基準位置を決めた後、その基準位置で表示領域サイズが画面全体のサイズの外に出ないように表示領域位置を調整する。調整した表示領域位置で決定し、暫定の予測字幕管理データとする。
また、表示領域サイズの指定(SDF)は存在するが、表示領域位置の指定(SDP)及び縦書き横書き指定(SWF)も存在しない場合(図6の604)は、ステップS501、ステップS502、ステップS506を経由して、ステップS510に移行する。ステップS510では、表示領域サイズから表示領域位置を決定する。図6の602の場合と同様に、表示領域サイズから横書きらしさを判断する。この場合は、図6の602の場合と異なり、表示領域位置の指定が無いので、縦書きか横書きかの決定は表示領域サイズのみから行えば良い。縦書き或いは横書きのいずれかに決定し、さらに表示領域サイズから、図6の603の場合と同様に表示領域位置を決定し、暫定の予測字幕管理データとする。
また、表示領域サイズの指定(SDF)が存在せず、表示領域位置の指定(SDP)及び縦書き横書き指定(SWF)が存在する場合(図6の605)は、ステップS501からステップS504、ステップS507を経由して、ステップS511に移行する。ステップS511では、表示領域位置と縦書き横書きの指定から表示領域サイズを決定する。例えば、縦書き時の表示領域サイズ、横書き時の表示領域サイズの基準値をあらかじめ決めておき、縦書き又は横書きの指定からそのいずれかを選択する。さらに、表示の領域が画面全体のサイズの外に出ないように表示領域サイズを調整して表示領域サイズを決定し、暫定の予測字幕管理データとする。
また、表示領域サイズの指定(SDF)及び縦書き横書きの指定(SWF)が存在せず、表示領域位置の指定(SDP)が存在する場合(図6の606)は、ステップS501からステップS504、ステップS507を経由して、ステップS512に移行する。そして、ステップS512では、表示領域位置から縦書き横書きと指定表示領域サイズを決定する。上述したように、表示領域位置から縦書きらしさ、横書きらしさの評価を行い、縦書き又は横書きのいずれかに決定する。さらに、表示領域位置と決定した縦書き横書きの指定から、図6の605と同様に表示領域サイズを決定し、暫定の予測字幕管理データとする。
さらに、表示領域サイズの指定(SDF)及び表示領域位置の指定(SDP)が存在せず、縦書き横書きの指定(SWF)が存在する場合(図6の607)は、ステップS501からステップS504、ステップS507を経由し、ステップS513へ移行する。そして、ステップS513では、縦書き横書きの指定から指定表示領域サイズと表示領域位置を決定する。例えば、あらかじめ決めてある縦書き時の表示領域位置及び表示領域サイズの基準値と、横書き時の表示領域位置及び表示領域サイズの基準値を、縦書き横書きの指定から選択して決定し、暫定の予測字幕管理データとする。
字幕管理データ予測処理部111は、このようにして決定された暫定の予測字幕管理データの確度(妥当性)を評価する。評価は、字幕文データに表示領域サイズが含まれていたか否かで手法を変える。
まず、字幕文データに表示領域サイズ指定(SDF)が含まれていた場合は、図5のフローチャートの符号530に囲まれた領域の各ステップに従って処理を行う。この場合は、ステップS531における暫定の字幕管理データ予測値の妥当性の判断基準を、「展開した字幕文が表示領域に収まるか否か」とする。ステップS531で表示領域に収まれば、最終的な字幕管理データ予測値として決定する。ステップS531で表示領域に収まらないと判定された場合はステップS532へ移行する。ステップS532では、文字方向に表示領域及び表示位置を最大化する。
ステップS533では、表示領域及び表示位置を最大化した場合に展開した字幕文が収まるか否かを判定する。判定の結果、表示領域に収まれば最終的な字幕管理データ予測値として決定する。ステップS533の判定の結果、表示領域に収まらないと判定された場合は、ステップS534に移行する。ステップS534では、字幕文の文字間隔を最小化する。つまり、文字間隔の距離を詰めることで表示領域に収まるように調整する。
ステップS535では、文字間隔を詰めた場合に展開した字幕文が表示領域に収まるか否かを判定する。判定の結果、表示領域に収まれば最終的な字幕管理データ予測値として決定する。ステップS535の判定の結果、表示領域に収まらないと判定された場合は、ステップS536に移行する。ステップS536では、字幕文の文字サイズを最小化する。つまり、字幕文のフォントサイズを小さくすることで表示領域に収まるように調整する。
ステップS537では、文字サイズを小さくした場合に展開した字幕文が表示領域に収まるか否かを判定する。判定の結果、表示領域に収まれば最終的な字幕管理データ予測値として決定する。ステップS537の判定の結果、表示領域に収まらないと判定された場合は、ステップS538へ移行する。なお、ステップS532における表示領域の最大化とは、字幕文が表示領域に収まるサイズになるように領域のサイズを調整することを意味している。即ち、必ずしも表示領域を最大値とすることではない。同様に、ステップS534の文字間隔最小化とステップS536の文字サイズ最小化も、表示領域に収まる程度に文字間隔や文字サイズを調整することを意味している。
ステップS538では、すべての文字が表示領域に収まるようになるまで表示領域サイズを行方向に拡大することで表示を行うように調整する。これにより、字幕管理データ予測値が決定され、最終的な予測字幕管理データが生成される。
つぎに、字幕文データに表示領域サイズが含まれていない場合は、図5のフローチャートの符号550に囲まれた領域の各ステップに従って処理を行う。この場合は、ステップ551での暫定の字幕管理データ予測値の妥当性の判断基準を、「展開した字幕文が所定の行数に収まっているか」とする。所定の行数の閾値はあらかじめ決めておくが、2〜3行が好ましい。行数が妥当となれば、最終的な字幕管理データ予測値として決定する。行数が妥当でない場合は、ステップS532、ステップS534、ステップS536と同様の処理を、ステップS552、ステップS554、ステップS556で行う。各ステップでの処理の後、その都度、ステップS553、ステップS555、ステップS557にて、行数が所定の閾値に収まるか否かの判定を行う。
判定の結果、所定の閾値に収まる場合には最終的な字幕管理データ予測値として決定する。これらの各ステップの処理を行っても字幕管理データ予測値が決定できない場合は、ステップS558に移行する。ステップS558では、すべての文字が表示領域に収まるようになるまで表示領域サイズを行方向に拡大することで表示を行うように調整する。これにより、字幕管理データ予測値が決定され、最終的な予測字幕管理データが生成される。
以上、本発明の実施形態1を説明した。なお、本発明の実施形態1における字幕とは、放送局側で映像信号に重畳して送出する文字情報は含まない。あくまでも、映像信号とは別のストリームとして送出される文字データを対象とするものである。なお、放送分野では映像信号と合成して文字情報を画面に表示する機能に文字スーパーと表現されるものがある。こうした文字スーパーについても、上述した字幕と同様の構成で送出されているものに対しては、本発明の実施形態1が適用可能である。また、本発明ではこうした文字スーパーを含めて字幕として表現している。しかしながら、放送局で映像信号に重畳して送出されるような文字スーパーは本発明の適用対象外である。
以上説明した実施形態1では、字幕表示に必要な字幕管理データが未取得の状態であっても、字幕管理データが取得されるまで字幕文が映像に合成されて表示されないという状態を解消することができる。そのため、デジタル放送における字幕表示を高速に行うことが可能となる。
<実施形態2>
次に、本発明の実施形態2について、図面を用いて説明する。図9は本発明の実施形態2のデジタル放送受信装置の構成を説明する図面である。図9において、実施形態1と同様の回路要素には同一の符号を付し、説明を省略する。
符号120は、TSパケット処理部103が処理した番組情報を取得し、解析する番組情報処理部である。デジタル放送で用いられる番組配列情報を取得し、解析が出来ることが好ましい。またさらに、ARIB規格準拠のPSI/SIのうち、PAT(Program Association Table)の取得を行い、現在視聴中の番組サービス番号を取得できることが特に好ましい。また、EIT(Event Information Table)の取得を行い、現在視聴中のジャンル名、イベント名、イベント開始時刻、イベント終了時刻を取得できるようにするのも好適である。
番組情報処理部120は、以下のように接続される。すなわち番組情報処理部120はTSパケット処理部103と接続され、これよりPSI/SIが入力される。また、番組情報処理部120は、さらに設定部121と接続され、現在受信中の番組のサービス番号を設定部121に出力する。また、番組情報処理部120は、さらに字幕管理データ予測処理部111と接続され、現在受信中の番組のサービス番号を字幕管理データ予測処理部111に出力する。なお、番組のサービス番号とは、当該番組を放送しているチャンネルを識別するためのID(サービスIDとも称する)のことである。
符号121は、字幕管理データ処理部110から取得した字幕管理データ及び全体制御コードと、番組情報処理部120から取得するサービス番号を関連付ける設定部である。設定部121は、入力された現在受信中の番組のサービス番号と、字幕管理データであるパラメータ情報及び全体制御コードを関連付けし、それらを字幕管理データ蓄積部122に蓄積する。
設定部121が字幕管理データ蓄積部122に蓄積するサービス番号と字幕管理データを関連づけた情報を、サービス番号対応字幕情報と称することとする。
122は設定部121が作成したサービス番号対応字幕情報を蓄積する字幕管理データ蓄積部である。字幕管理データ蓄積部122は揮発性メモリ、不揮発メモリ、ハードディスクを含むが、電源投入直後でも過去の蓄積情報を取得出来る点から、不揮発性メモリ、ハードディスクが好ましい。
字幕管理データ蓄積部122は、以下のように接続される。すなわち字幕管理データ蓄積部122は設定部121と接続され、これからサービス番号対応字幕情報が入力される。また字幕管理データ蓄積部122は、設定部121から指定されたサービス番号に対応する字幕管理データを設定部121に出力する。また字幕管理データ蓄積部122は、さらに字幕管理データ予測処理部111と接続されている。そして字幕管理データ蓄積部122は、字幕管理データ予測処理部111から指定されたサービス番号に対応する字幕管理データを字幕管理データ予測処理部111に出力する。
字幕管理データ予測処理部111は、字幕管理データ処理部110から現在視聴中の番組の字幕管理データが取得されているか否かの情報を受け取る。字幕管理データが取得されていない場合には、番組情報処理部120から取得した現在視聴中の番組の番組情報を用いる。そして、字幕管理データ蓄積部122から視聴中の番組の放送チャンネルと同一のサービス番号に対応する字幕管理データ及び全体制御コードを取得する。そして、字幕文情報処理部109から受け取る字幕文データとあわせて字幕管理データを予測する。
字幕管理データ予測処理部111は、以下のように他の構成要素と接続されることが好ましい。まず、字幕管理データ予測処理部111は字幕文情報処理部109と接続され、これから字幕文データが入力される。また字幕管理データ予測処理部111は、さらに字幕管理データ処理部110と接続され、これから字幕管理情報存在情報が入力される。また字幕管理データ予測処理部111は、さらに番組情報処理部120と接続され、これから現在受信中の番組のサービス番号が入力される。さらにまた字幕管理データ予測処理部111は字幕管理データ蓄積部122と接続され、現在受信中の番組のサービス番号に対応する字幕管理データ及び全体制御コードを入力する。また字幕管理データ予測処理部111はスイッチ113とも接続され、これに予測字幕管理データを出力する。
次に、本実施形態2における字幕表示動作を説明する。字幕管理データ蓄積部122に何も取得されていない状態で、かつ現在視聴中の番組の字幕管理データが取得できている場合の動作は、実施形態1と同一である。現在視聴中の番組の字幕管理データを、字幕管理データ蓄積部122に蓄積する場合の動作を説明する。
視聴者がリモコン102を操作することにより、受信選局部100に放送の受信が指示される。すると、受信選局部100から視聴者の指示に従って選局された放送局の番組のMPEG2−TSがTSパケット処理部103に入力される。TSパケット処理部103は多重された情報を分離し、分離された各情報を各情報用の処理部に渡す。本実施形態2では、分離された情報として、字幕情報と番組情報に着目して説明する。
字幕データ分離処理部105の処理は、実施形態1において説明した処理と同様であるので説明を省略する。字幕データ分離処理部105が分離した字幕文データは、字幕文情報処理部109に送られ、字幕文情報処理部109で処理される。字幕文情報処理部109の処理は、実施形態1において説明した処理と同様であるので説明を省略する。
字幕データ分離処理部105が分離した字幕管理データは、字幕管理データ処理部110に送られ、字幕管理データ処理部110で処理される。字幕管理データ処理部110の処理は、実施形態1において説明した処理と同様である。しかし、さらに実施形態2では、字幕管理データ処理部110で取得された字幕管理データに含まれるパラメータ情報及び全体制御コードを設定部121に送信する処理が追加されて実行される。
また、TSパケット処理部103で分離された番組情報は、番組情報処理部120に入力される。番組情報処理部120では、番組情報のうちPATを取得し、受信中の番組のサービス番号を取得する。取得したサービス番号は設定部121に出力する。上述したように、設定部121は番組情報処理部120から入力されたサービス番号と、字幕管理データ処理部110から入力された字幕管理データを対応付けしたサービス番号対応字幕情報を生成する。設定部121は、生成したサービス番号対応字幕情報を字幕管理データ蓄積部122に蓄積するように制御する。
字幕管理データ蓄積部122には、サービス番号と字幕管理データを対応付けられたサービス番号対応字幕情報が蓄積されている。このサービス番号対応字幕情報は、字幕データを含む番組を過去に視聴した際に、その番組の字幕管理データと、その番組を放送したチャンネル番号に相当するサービス番号とが対応づけられているものである。また、設定部121は、番組情報処理部120から取得したサービス番号を用いて、字幕管理データ蓄積部122にすでに蓄積されている同一サービス番号の字幕管理データ及び全体制御コードを取得することが可能である。選局された番組が字幕データを含んでいる場合、設定部121は字幕管理データ蓄積部122からその番組に対応するサービス番号を元に既に蓄積されている字幕管理データを取得する。
既に蓄積されている字幕管理データ及び全体制御コードを取得するのは、以下に記載する更新処理を実行するためである。同一のサービス番号に対応する番組の視聴が行われた場合には、設定部121は視聴している番組の字幕管理データを取得する。また、上述したように、当該サービス番号に対応する、既に蓄積された字幕管理データも蓄積部122から取得する。そして、既に蓄積されている字幕管理データの各値を新たに取得した字幕管理データ及び全体制御コードを用いて更新する。
例えば、字幕管理データに含まれるパラメータ情報のformatは、そのサービス番号で過去最も多く取得されたformatに更新する。なお、formatとは字幕表示領域のサイズとレイアウト情報を示すものである。また、全体制御コードのうちSWF、SSMは、そのサービス番号で過去最も多く取得されたものに更新する。また、SDF、SDP、SHS、SVSは、過去から現在に至るまでに取得した値を平均した値を採用する。そして、更新された字幕管理データ及び更新された全体制御コードを字幕管理データ蓄積部122に蓄積する。このとき蓄積されるサービス番号対応字幕情報の概要を示した図が図10である。このように、字幕を含む番組を視聴するたびに、取得された字幕管理データを用いて、過去に蓄積された字幕管理データの値を更新する処理を設定部121が実行する。こうして更新され、蓄積部122に蓄積された情報は、後述する字幕管理データの予測の基準値として利用される。
次に、現在視聴中の番組の字幕文データが取得でき、字幕管理データが取得できていない場合の字幕管理データを予測する処理について説明する。なお、TSパケット処理部103の処理などは上述した構成と同様であるため、ここでは処理内容の説明を省略する。
字幕データ分離処理部105が分離した字幕文データは字幕文情報処理部109で処理される。字幕文情報処理部109は、字幕文データを解析し、その字幕を表示するために指示されている字幕制御コードと、字幕文本体を取得する。字幕文データは字幕作成処理部112に送られる。また本実施形態では、字幕文データが字幕管理データ予測処理部111に送られる。
字幕管理データ予測処理部111は、字幕管理データ処理部110に対して、字幕管理データの存在有無を問い合わせる。本例では、字幕管理データ処理部110は字幕管理データが取得できていないので、字幕管理データ処理部110は未取得を示す情報を字幕管理データ予測処理部111に出力する。字幕管理データ予測処理部111は、字幕管理データ処理部110から字幕管理データ未取得の通知を受けると、番組情報処理部120に対して現在視聴中の番組のサービス番号を問い合わせる。番組情報処理部120は、現在視聴中の番組のPATからサービス番号を取得し、字幕管理データ予測処理部111に出力する。
字幕管理データ予測処理部111は番組情報処理部120からサービス番号を受け取ると、そのサービス番号を用いて字幕管理データ蓄積部122に、そのサービス番号で放送された過去の番組の字幕管理データを問い合わせる。字幕管理データ蓄積部122は、問い合わせられたサービス番号と対応する字幕管理データを出力する。字幕管理データ予測処理部111は、過去の字幕管理データを用いて字幕管理データを予測し、予測字幕管理データをスイッチ113に出力する。字幕管理データの予測処理の詳細は後述する
スイッチ113は、字幕管理データ処理部110が字幕管理データを取得している間は、字幕管理データ処理部110と字幕作成処理部112を接続する。そして、字幕管理データ処理部110が字幕管理データを取得していない間は、字幕管理データ予測処理部111と字幕作成処理部112を接続する。本実施形態2では字幕管理データが取得できていない場合を想定しているので、スイッチ113は字幕管理データ予測処理部111と字幕作成処理部112を接続する図となっている。字幕作成処理部112は、入力される予測パラメータ情報データ、予測全体制御コード、字幕文制御コードおよび字幕文本体を受け取り、制御コードに従った字幕表示を作成する。
次に、字幕管理データ予測処理部111の動作を詳細に説明する。字幕管理データ予測処理部111は、前述のとおり、字幕管理データが未取得で、かつ字幕データが取得された場合に、字幕データを表示するための字幕管理データを予測する。字幕管理データ予測処理部111は、過去に取得した字幕管理データに基づいて生成されている統計的な字幕管理データを字幕管理データ蓄積部122から取得し、取得したデータを利用して字幕管理データを予測する。さらに字幕管理データ予測処理部111は、予測した字幕表示位置が正しいかどうかを判定する。
字幕管理データ予測処理部111は、図11に示したフローチャートの枠1501で囲まれた部分の各ステップに従って処理を行う。字幕管理データ予測処理部111は、ステップS1502で、現在視聴中の番組のサービス番号を番組情報処理部120から取得する。そして、現在視聴中のサービス番号に対応した字幕管理データ(表示領域サイズ、表示領域位置及び縦書き横書き)が蓄積されているか否かを判定する。
蓄積されていれば、ステップS1504に進み、字幕管理データ蓄積部122からその情報を取得して予測字幕管理データとする。ステップS1502において、取得したサービス番号に対応した蓄積情報が存在しない場合には、ステップS1503に移行する。ステップS1503では、字幕管理データの予測値として、あらかじめ決めておいた表示領域サイズ、表示領域位置及び縦書き横書きの基準値を暫定の予測字幕管理データとする。
このようにして決定された暫定の予測字幕管理データについて、字幕管理データ予測処理部111はその妥当性を評価する。評価は図11に示したフローチャートの枠1510で囲まれた部分の各ステップに従って処理を行う。
なお、枠1510で囲まれた部分の各ステップの処理は、実施形態1を説明した図5の枠550で囲まれた部分の各ステップの処理と同様であるので、ここでは説明を省略する。
以上、本発明の好ましい実施形態2を説明した。本実施形態では、字幕表示に必要な「字幕管理データ」が取得できるまでの間、過去に取得した字幕管理データの統計的な情報から字幕管理データを予測する。このようにすることで、電源投入時や選局時など、字幕管理データの取得が遅延するような場合において、字幕表示開始までの時間を短縮することが出来る。
<実施形態3>
次に、本発明の実施形態3について、図面を用いて説明する。実施形態3では、本発明の実施形態2の、図9で示されたデジタル放送受信装置の構成と同一の構成で実施可能である。したがって、実施形態3は、図9のデジタル放送受信装置を用いて説明される。
実施形態3では、字幕管理データ予測処理部111が実施形態1と実施形態2の特徴を併せ持つことが上記の実施形態と異なるところである。まず、字幕管理データ予測処理部111は、字幕管理データ処理部110から現在視聴中の番組の字幕管理データが取得されているか否かを判断するための情報を受け取る。そして、字幕管理データが取得されていないと判定した場合には、番組情報処理部120からの現在視聴中の番組の番組情報を用い、字幕管理データ蓄積部122から同一の番組情報と関連付けられた字幕管理データを取得する。そして、字幕文情報処理部109から受け取る字幕文データとあわせて字幕管理データを予測する。
次に、本実施形態3における字幕表示の動作を説明する。実施形態1及び実施形態2と同一の動作や処理については説明を省略し、現在視聴中の番組の字幕文データが取得でき、字幕管理データが取得できていない場合の字幕管理データの予測時の動作について説明する。
本実施形態3において、字幕管理データ予測処理部111は、字幕管理データ処理部110に対して、字幕管理データの存在有無を問い合わせる。本実施形態3では、字幕管理データ処理部110は字幕管理データを取得できていないので、未取得を示す情報を字幕管理データ予測処理部111に出力する。字幕管理データ予測処理部111は、字幕管理データ処理部110から字幕管理データ未取得の通知を受けると、すでに受信済みの字幕データを解析する。この解析は、字幕管理データが未取得の状態において表示位置を予測できるかどうかの判定を行うためのものである。判定動作の詳細については後述する。表示位置を予測できると判断された場合、字幕データから予測された予測字幕管理データをスイッチ113に出力する。現在取得済みの字幕データからでは字幕管理データが予測できないと判断された場合は、番組情報処理部120に対して現在視聴中の番組のサービス番号を問い合わせる。
番組情報処理部120は、現在視聴中の番組のPATからサービス番号を取得し、字幕管理データ予測処理部111に出力する。字幕管理データ予測処理部111は番組情報処理部120からサービス番号を受け取ると、そのサービス番号を用いて字幕管理データ蓄積部122に、そのサービス番号で放送された過去の番組の字幕管理データを問い合わせる。字幕管理データ蓄積部122は、サービス番号に対応する字幕管理データを出力する。字幕管理データ予測処理部111は、過去の字幕管理データと現在の字幕文データとを用いて、字幕管理データを予測する。その後、予測処理により生成された予測字幕管理データはスイッチ113に出力される。
字幕管理データ予測処理部111は、前述のとおり、字幕管理データが未取得で、かつ字幕データが取得された場合に、字幕データを表示するための字幕管理データを予測する。字幕管理データ予測処理部111は、以下3つの予測手法を実行する。
(1)字幕文データに含まれる字幕文制御コードから、字幕管理データが予測できる場合は、字幕文データから予測する。
(2)(1)字幕文データから予測出来ない場合、過去の字幕管理データを字幕管理データ蓄積部122に問い合わせ、過去の字幕管理データを用いて予測する。
(3)(1)及び(2)で共に予測できない場合、あらかじめ定めておいた基準値を用いて予測する。さらに字幕管理データ予測処理部111は、予測した字幕表示位置が適切かどうかを判定する。
以上より明らかなように、本実施形態3は、実施形態1で説明した予測処理と、実施形態2で説明した予測処理を併用するものである。このように構成することで、予測字幕管理データの精度を向上させることが可能となる。
以上、本発明の好ましい実施形態3を説明した。本実施形態3では、字幕表示に必要な「字幕管理データ」が取得できるまでの間、取得された字幕文データの情報及び過去に取得した字幕管理データの統計的な情報から字幕管理データを予測する。このように構成することで、電源投入時や選局時など、字幕管理データの取得が遅延するような場合において、字幕表示開始までの時間を短縮することが出来る。
本発明によれば、電源投入後及び選局後の字幕表示のレスポンスが向上する。すなわち、電源投入後及び選局後の字幕表示に必要な「字幕管理情報」が取得できるまでの間、取得された字幕の情報から代替情報を予測し設定する。このようにすることで、電源投入時、任意のサービスへの選局時に字幕表示開始までの時間を短縮することが出来る。
さらに、本発明によれば、電源投入後及び選局後の字幕表示のレスポンスが向上する。すなわち、電源投入後及び選局後の字幕表示に必要な「字幕管理情報」が取得できるまでの間、過去に取得した字幕管理情報の統計情報から代替情報を予測し設定する。このようにすることで、電源投入時、任意のサービスへの選局時に字幕表示開始までの時間を短縮することが出来る。
さらに、本発明によれば、電源投入後及び選局後の字幕表示のレスポンスが向上する。すなわち、電源投入後及び選局後の字幕表示に必要な「字幕管理情報」が取得できるまでの間、取得された字幕の情報と過去に取得した字幕管理情報の統計情報から代替情報を予測し設定する。このようにすることで、電源投入時、任意のサービスへの選局時に字幕表示開始までの時間を短縮することが出来る。
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給しても達成可能である。すなわち、そのシステムあるいは装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性の半導体メモリカード、ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される場合もある。しかし、さらにそのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれる場合もあり得る。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。