WO2017130804A1

WO2017130804A1 - 受信装置、受信方法および送信装置

Info

Publication number: WO2017130804A1
Application number: PCT/JP2017/001438
Authority: WO
Inventors: 塚越　郁夫; 高林　和彦
Original assignee: ソニー株式会社
Priority date: 2016-01-26
Filing date: 2017-01-17
Publication date: 2017-08-03
Also published as: CN108476341B; US20190028757A1; JPWO2017130804A1; US10511882B2; EP3410730A1; JP6969386B2; CN108476341A; US20200068247A1; EP3410730A4

Abstract

字幕表示位置を相対位置で指定する場合における字幕表示を良好に行い得るようにする。　ビデオストリームをデコードしてビデオデータを得、字幕情報を持つサブタイトルストリームをデコードして字幕のビットマップデータを得る。字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されている。ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として字幕表示位置を決定し、さらにリサイズ処理を施し、リサイズ処理後の字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御をする。表示位置制御が行われた字幕のビットマップデータをビデオデータに重畳して表示用ビデオデータを得る。

Description

受信装置、受信方法および送信装置

　本技術は、受信装置、受信方法および送信装置に関し、特に、ビデオデータと共に字幕情報を送信する送信装置等に関する。

　従来、例えば、ＤＶＢ（Digital Video Broadcasting）の放送などでは、字幕情報をビットマップデータで送信する運用が行われている。近時、字幕情報をテキストの文字コードで、つまりテキストベースで送信することが提案されている。このテキスト情報として、例えば、Ｗ３Ｃ（World Wide Web Consortium）でＴＴＭＬ（Timed Text Markup Language）が提唱されている（特許文献１参照）。

　従来、字幕情報に含まれる字幕表示位置情報において字幕表示位置を、例えばビデオ領域に対する相対位置で指定することが知られている。この場合、ビデオ領域のアスペクト比とディスプレイ領域のアスペクト比とが一致しない場合には、表示方法によって字幕の一部がディスプレイ領域からはみ出して表示されないことがあった。

特開２０１２－１６９８８５号公報

　上述したように表示方法によって字幕の一部がディスプレイ領域からはみ出して表示されないことを回避するため、例えば、受信側において、ビデオ領域に対する相対位置ではなく、モニタ（ディスプレイ）に表示されるビデオ領域（表示ビデオ領域）に対する相対位置として処理を行うことが考えられる。その場合、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比とが異なる場合、例えば字幕表示位置が水平方向にだけ圧縮されたものとなり、視聴者に違和感を与える字幕表示になる可能性がある。

　本技術の目的は、字幕表示位置を相対位置で指定する場合における字幕表示を良好に行い得るようにすることにある。

　本技術の概念は、
　ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信部と、
　上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置にリサイズ処理を施し、該リサイズ処理が施された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御部を備える
　受信装置にある。

　本技術において、受信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナが受信される。ここで、字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されている。制御部により、ビデオデコード処理、サブタイトルデコード処理、表示位置制御処理および重畳処理が制御される。

　ビデオデコード処理では、ビデオストリームがデコードされてビデオデータが得られる。サブタイトルデコード処理では、サブタイトルストリームがデコードされて字幕のビットマップデータが得られる。表示位置制御処理では、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域が字幕表示範囲とされて字幕表示位置情報に基づいて字幕表示位置が決定される。

　そして、この表示位置制御処理では、この決定された字幕表示位置にリサイズ処理が施され、このリサイズ処理が施された字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御が行われる。ビデオ重畳処理では、表示位置制御が行われた字幕のビットマップデータがビデオデータに重畳される。例えば、リサイズ処理では、決定された字幕表示位置が水平方向にだけ圧縮されたものである場合、垂直方向にも同じ割合で圧縮される。

　このように本技術においては、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域が字幕表示範囲とされて決定された字幕表示位置にさらにリサイズ処理が施される。そのため、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であっても、字幕表示位置として本来の形状を保つことができ、視聴者に違和感を与えることがなく、字幕表示を良好に行い得る。

　なお、本技術において、例えば、表示制御処理では、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合、所定のライン位置を固定した状態で圧縮する、ようにされてもよい。このように所定のライン位置を固定した状態で圧縮することで、例えば、２つの字幕表示位置があった場合、その２つの字幕表示位置の垂直方向の間隔を、リサイズ処理を行っても維持することが可能となる。

　また、本技術において、例えば、サブタイトルストリームが持つ字幕情報に、リサイズ処理に関する情報が含まれており、表示位置制御処理では、リサイズ処理に関する情報を用いて、決定された字幕表示位置にリサイズ処理を施す、ようにされてもよい。例えば、リサイズ処理に関する情報は、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報である、ようにされてもよい。このようにリサイズ処理に関する情報に基づいてリサイズ処理を施すことで、リサイズ処理を適切に行うことが容易に可能となる。

　また、本技術の他の概念は
　ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信部と、
　上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域に字幕表示範囲を設定し、上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御部を備える
　受信装置にある。

　本技術において、受信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナが受信される。ここで、字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されている。制御部により、ビデオデコード処理、サブタイトルデコード処理、表示位置制御処理および重畳処理が制御される。ビデオデコード処理では、ビデオストリームがデコードされてビデオデータが得られる。サブタイトルデコード処理では、サブタイトルストリームがデコードされて字幕のビットマップデータが得られる。

　表示位置制御処理では、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域に字幕表示範囲が設定され、この字幕表示位置情報に基づいて字幕表示位置が決定され、この決定された字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御が行われる。例えば、表示ビデオ領域に、ビデオ領域のアスペクト比と同じアスペクト比の字幕表示範囲が設定される。ビデオ重畳部により、表示位置制御が行われた字幕のビットマップデータがビデオデータに重畳される。

　このように本技術においては、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される。そのため、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であっても、字幕表示位置として本来の形状を保つことができ、視聴者に違和感を与えることがなく、字幕表示を良好に行い得る。

　なお、本技術において、例えば、サブタイトルストリームが持つ字幕情報に、字幕表示範囲の情報が含まれており、表示位置制御処理では、この字幕表示範囲の情報を用いて表示ビデオ領域に字幕表示範囲を設定する、ようにされてもよい。この場合、例えば、字幕表示範囲の情報は、字幕表示範囲の基準点情報およびアスペクト比情報、あるいは字幕表示範囲の基準点情報である、ようにされてもよい。このように字幕表示範囲の情報に基づいて字幕表示範囲を設定することで、表示ビデオ領域に字幕表示範囲を適切に設定することが容易に可能となる。

　また、本技術の他の概念は、
　ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナを送信する送信部を備え、
　上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
　上記字幕情報は、
　ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる、上記字幕表示位置情報に基づいて決定される字幕表示位置のリサイズ処理に関する情報を含む
　送信装置にある。

　本技術において、送信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナが送信される。例えば、コンテナとしては、デジタル放送規格で採用されているＭＰＥＧ－２　ＴＳトランスポートストリームあるいはＭＭＴトランスポートストリーム、インターネット配信で使用されているＩＳＯＢＭＦＦ（ＭＰ４）などの種々のフォーマットのコンテナが該当する。

　字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定される。字幕情報に、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる、字幕表示位置情報に基づいて決定される字幕表示位置のリサイズ処理に関する情報が含まれる。例えば、リサイズ処理に関する情報は、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報である、ようにされてもよい。

　このように本技術においては、字幕情報に、受信側で行われるリサイズ処理に関する情報が含まれるものである。このように字幕情報にリサイズ処理に関する情報が含まれることで、受信側では、この情報に基づいてリサイズ処理を施すことで、リサイズ処理を適切に行うことが容易に可能となる。

　また、本技術の他の概念は、
　ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナを送信する送信部を備え、
　上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
　上記字幕情報は、
　上記字幕表示範囲の情報を含む
　送信装置にある。

　本技術において、送信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナが送信される。字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定される。字幕情報に、字幕表示範囲の情報が含まれる。例えば、字幕表示範囲の情報は、字幕表示範囲の基準点情報およびアスペクト比情報、あるいは字幕表示範囲の基準点情報である、ようにされてもよい。

　このように本技術においては、字幕情報に、字幕表示範囲の情報が含まれるものである。このように字幕情報に字幕表示範囲の情報が含まれることで、受信側では、この情報に基づいて字幕表示範囲を設定することで、表示ビデオ領域に字幕表示範囲を適切に設定することが容易に可能となる。

　本技術によれば、字幕表示位置を相対位置で指定する場合における字幕表示を良好に行い得る。なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。

実施の形態としての送受信システムの構成例を示すブロック図である。字幕表示位置情報で決定される字幕表示位置（リージョン）の一例を示す図である。ＴＴＭＬの構造例（字幕表示位置が１個）を示す図である。ＴＴＭＬ構造における主要な情報の内容を示す図である。ＴＴＭＬの構造例（字幕表示位置が２個）を示す図である。ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が同じである場合における字幕の表示例（字幕表示位置が１個）を示す図である。ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が同じである場合における字幕の表示例（字幕表示位置が２個）を示す図である。ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域が字幕表示範囲とされ、字幕表示位置情報に基づいて字幕表示位置が決定される場合（第１の方法）における字幕の表示例（字幕表示位置が１個）を示す図である。リサイズ処理が施された場合の表示例を示す図である。ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域が字幕表示範囲とされ、字幕表示位置情報に基づいて字幕表示位置が決定され、さらにリサイズ処理が施された場合（第１の方法）における字幕の表示例（字幕表示位置が２個）を示す図である。ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される場合（第２の方法）における字幕の表示例（字幕表示位置が１個）を示す図である。ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される場合（第２の方法）における字幕の表示例（字幕表示位置が２個）を示す図である。放送送出システムのストリーム生成部の構成例を示すブロック図である。テレビ受信機の構成例を示すブロック図である。テレビ受信機のＣＰＵにおける字幕表示位置の決定およびリサイズ処理の手順の一例を示すフローチャートである。ビデオ領域のアスペクト比とモニタ（ディスプレイ）のアスペクト比の一例を示す図である。ビデオ全領域を表示するモードか否かの判断例の説明に供する図である。ビデオ全領域を表示するモードで、かつ字幕表示範囲の指定がない場合における字幕表示位置の決定の説明に供する図である。ビデオ全領域を表示するモードで、かつ字幕表示範囲の指定がある場合における字幕表示位置の決定の説明に供する図である。ビデオ全領域を表示しないモードで、かつ字幕表示範囲の指定がない場合およびある場合における字幕表示位置の決定の説明に供する図である。字幕表示範囲の情報として基準点情報（RPoffset）のみが含まれる場合におけるＴＴＭＬの構造例（字幕表示位置が１個）を示す図である。字幕表示範囲の情報として基準点情報（RPoffset）のみが含まれる場合におけるＴＴＭＬの構造例（字幕表示位置が２個）を示す図である。基準点情報（RPoffset）のみが与えられる場合に、テレビ受信機のＣＰＵがどのようにして字幕表示範囲を設定するかについて説明するための図である。テレビ受信機のＣＰＵにおける字幕表示位置の決定およびリサイズ処理の手順の他の一例を示すフローチャートである。

　以下、発明を実施するための形態（以下、「実施の形態」とする）について説明する。なお、説明を以下の順序で行う。
　１．実施の形態
　２．変形例

　＜１．実施の形態＞
　［送受信システムの構成例］
　図１は、実施の形態としての送受信システム１０の構成例を示している。この送受信システム１０は、放送送出システム１００とテレビ受信機２００により構成されている。放送送出システム１００は、コンテナ（多重化ストリーム）としてのＭＰＥＧ－２　ＴＳのトランスポートストリーム（以下、単に、「トランスポートストリームＴＳ」という）を、放送波に載せて送信する。

　トランスポートストリームＴＳには、ビデオデータを持つビデオストリームと、字幕（サブタイトル）情報を持つサブタイトルストリームが含まれる。ここで、字幕情報は、所定フォーマットの字幕のテキスト情報である。このテキスト情報として、例えば、ＴＴＭＬあるいはＴＴＭＬの派生フォーマットなどが考えられるが、この実施の形態においては、ＴＴＭＬであるとする。このＴＴＭＬに含まれる字幕表示位置情報において、字幕表示位置（リージョン）は字幕表示範囲に対する相対位置（プロポーショナルな値）で指定される。

　このＴＴＭＬに、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる、字幕表示位置情報に基づいて決定された字幕表示位置のリサイズ処理に関する情報が含まれる。この実施の形態において、このリサイズ処理に関する情報は字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報とされる。

　また、このＴＴＭＬに、字幕表示範囲の情報が含まれる。この実施の形態において、この字幕表示範囲の情報は、字幕表示範囲の基準点情報およびアスペクト比情報、あるいは字幕表示範囲の基準点情報とされる。

　テレビ受信機２００は、放送送出システム１００から送られてくるトランスポートストリームＴＳを受信する。テレビ受信機２００は、ビデオデータを持つビデオストリームにデコード処理を施してビデオデータを得ると共に、字幕情報を持つサブタイトルストリームにデコード処理を施して字幕のビットマップデータを得る。上述したように字幕情報に含まれる字幕表示位置情報において、字幕表示位置は字幕表示範囲に対する相対位置で指定されている。

　テレビ受信機２００は、字幕表示位置情報に基づいて字幕表示位置を決定し、この決定された字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御をする。テレビ受信機２００は、表示位置制御が行われた字幕のビットマップデータをビデオデータに重畳して、表示用のビデオデータを得る。

　テレビ受信機２００は、字幕のビットマップデータに対する表示位置制御として、ビデオ領域のアスペクト比と表示ビデオ領域（モニタに表示されるビデオ領域）のアスペクト比が異なる場合、以下の第１の方法あるいは第２の方法を選択的に実行する。

　第１の方法では、テレビ受信機２００は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として字幕表示位置情報に基づいて字幕表示位置を決定した後、この決定された字幕表示位置にリサイズ処理を施し、このリサイズ処理が施された字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御をする。

　リサイズ処理では、字幕表示位置として本来の形状を回復する処理であり、例えば、決定された字幕表示位置が水平方向にだけ圧縮されたものである場合、垂直方向にも同じ割合で圧縮する。例えば、リサイズ処理で垂直方向のサイズを圧縮する場合、トップライン（上のライン）、ボトムライン（下のライン）、あるいはミドルライン（中間のライン）などの所定のライン位置を固定した状態で圧縮する。

　この所定のライン位置を適切に選択することで、例えば、２つの字幕表示位置があった場合、その２つの字幕表示位置の垂直方向の間隔を、リサイズ処理を行っても維持することが可能となる。テレビ受信機２００は、サブタイトルストリームが持つ字幕情報に、リサイズ処理に関する情報として、固定位置とすべきライン位置を示す情報が含まれているとき、その情報を利用できる。

　第２の方法では、テレビ受信機２００は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域に字幕表示範囲を設定し、字幕表示位置情報に基づいて字幕表示位置を決定し、この決定された字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御をする。この場合、例えば、表示ビデオ領域に、ビデオ領域のアスペクト比と同じアスペクト比の字幕表示範囲を設定する。

　テレビ受信機２００は、サブタイトルストリームが持つ字幕情報に字幕表示範囲の情報が含まれているとき、その情報を利用して字幕表示範囲を適切に設定できる。例えば、テレビ受信機２００は、サブタイトルストリームが持つ字幕情報に字幕表示範囲の情報が含まれているときは第２の方法を選択し、それが含まれていないとき第１の方法を選択する。

　図２は、字幕表示位置情報で決定される字幕表示位置（リージョン）の一例を示している。この例は、ＴＴＭＬで、字幕表示位置情報が、字幕表示位置の基点（origin）を示す情報「origin=“OH%OV%”」と、字幕表示位置の領域（extent）を示す情報「extent=“EH%EV%”」で与えられている場合を示している。“ＲＰ”は、字幕表示範囲のトップ―レフト（top-left）である基準点（Reference Pont）を示している。

　図２（ａ）は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が同じ場合の例を示している。この例では、ビデオ領域のアスペクト比が１６：９に対して、モニタのアスペクト比は１６：９であって、表示ビデオ領域のアスペクト比が１６：９となっている。この場合、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報に基づき字幕表示位置が決定される。

　図２（ｂ）は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域が字幕表示範囲とされ、字幕表示位置情報に基づいて字幕表示位置が決定される場合（第１の方法）の例である。この例では、ビデオ領域のアスペクト比が１６：９に対して、モニタのアスペクト比は４：３であり、表示方法がセンターカット（Center-cut）である場合であって、表示ビデオ領域のアスペクト比が４：３となっている。この場合、字幕表示位置は、図２（ａ）の場合と比較して、垂直方向には同じ幅となるが、水平方向には、その幅が圧縮されたものとなる。この場合、字幕表示位置の形状は、図２（ａ）の場合とは異なったものとなる。

　図２（ｃ）は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される場合（第２の方法）の例である。この例では、ビデオ領域のアスペクト比が１６：９に対して、モニタのアスペクト比は４：３であり、表示方法がセンターカット（Center-cut）である場合であって、表示ビデオ領域のアスペクト比が４：３となっている。この場合、字幕表示位置は、図２（ａ）の場合と比較して、垂直方向および水平方向の双方に、その幅が圧縮されたものとなる。設定される字幕表示範囲のアスペクト比が１６：９である場合には、字幕表示位置の形状は、図２（ａ）の場合と同じくなる。

　図３は、ＴＴＭＬ構造の一例を示している。この例は、字幕表示位置（リージョン）が１個の場合の例である。ＴＴＭＬは、ＸＭＬを基本に記載される。ttルートコンテナには、ランゲージ（言語）やネームスペース（名前空間）が定義されている。ネームスペースは、システムあるいは規格体系において全要素中で一意に識別できるための固有の要素名として定義されるものである。また、<tt>において、「tts:extent」は、字幕の位置情報の対象の元となるビデオ１００％の対象領域を最初に宣言するもので、“Fullvideo”は、４Ｋビデオが対象である場合は３８４０（Ｈ）×２１６０（Ｖ）の解像度のビデオ全体を示し、２Ｋ（フルＨＤ）ビデオが対象である場合は１９２０（Ｈ）×１０８０（Ｖ）の解像度のビデオ全体を示す。

　「xmlns=http://www.w3.org/ns/ttml」、「xmlns:ttp=http://www.w3.org/ns/ttml#parameter」、「xmlns:tts=http://www.w3.org/ns/ttml#styling」のネームスペースは、詳細説明は省略するが、予めＷ３ＣでＴＴＭＬの属性分類として確保されているパラメータ、スタイリングなどのネームスペースである。

　「xmlns:dto=http://www.example.org/ns/displaytextoverlay」は、新規に定義するネームスペースである。このネームスペースは、字幕表示範囲の情報を挿入するためのものである。そして、「dto:dispasp=“16:9”」および「dto:RPoffset=“Ax%, By%”」が、字幕表示範囲の情報を示す。

　「dto:dispasp=“16:9”」は、字幕表示範囲のアスペクト比情報を示し、字幕表示範囲は１６：９のアスペクト比の領域であることを示している。図示の例では、字幕表示範囲のアスペクト比が１６：９であることを示しているが、字幕表示範囲のアスペクト比としては、図４に示すように、４：３、２１：９などを指定することも可能である。「dto:RPoffset=“Ax%, By%”」は字幕表示範囲の基準点情報を示し、図４に示すように、表示ビデオ領域の水平垂直のそれぞれを１００％としたときの字幕表示範囲の基準点（ＲＰ：Reference Point）の位置を、表示ビデオ領域のトップ－レフト（top-left）からのオフセットの比率で示している。

　ヘッダ（head）には、レイアウト（layout）の要素が存在している。リージョンＩＤが“ｒ１”で示され、字幕表示位置情報として字幕表示位置の起点（origin）と、その領域（extent）が相対位置で示されている。すなわち、「origin=“OH%OV%”」は字幕表示位置の基点を示し、起点が左（left）からＯＨで、上（top）からＯＶ％であることが示されている。また、「extent=“EH%EV%”」は字幕表示位置の領域を示し、横幅がＥＨ％で、縦幅がＥＶ％であることが示されている。

　ボディ（body）には、ＸＭＬ　ＩＤが“ｐ１”で示され、リージョンＩＤが“ｒ１”で示されると共に、字幕（サブタイトル）のテキストデータが記載されている。ここでは、テキストデータが「ＡＢＣＤＥ」とされている。「dto:scalingjustify=top」は、リサイズ処理に関する情報を構成しており、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示している。図示の例では、固定位置とすべきライン位置がトップライン（上のライン）であることを示しているが、図４に示すように、ボトムライン（下のライン）、ミドルライン（中間のライン）などを指定することも可能である。

　図５も、ＴＴＭＬ構造の一例を示している。この例は、字幕表示位置（リージョン）が２個の場合の例である。ttルートコンテナは、図３と同様であるので、その説明は省略する。

　ヘッダ（head）には、レイアウト（layout）の要素が存在している。第１の字幕表示位置のリージョンＩＤが“ｒ１”で示され、字幕表示位置情報として字幕表示位置の起点（origin）と、その領域（extent）が相対位置で示されている。すなわち、「origin=“OH1%OV1%”」により、起点が左（left）からＯＨ１％で、上（top）からＯＶ１％であることが示されている。また、「extent=“EH1%EV1%”」により、領域の横幅がＥＨ１％で、その縦幅がＥＶ１％であることが示されている。

　また、第２の字幕表示位置のリージョンＩＤが“ｒ２”で示され、字幕表示位置情報として字幕表示位置の起点（origin）と、その領域（extent）が相対位置で示されている。すなわち、「origin=“OH2%OV2%”」により、起点が左（left）からＯＨ２％で、上（top）からＯＶ２％であることが示されている。また、「extent=“EH2%EV2%”」により、領域の横幅がＥＨ２％で、その縦幅がＥＶ２％であることが示されている。

　ボディ（body）には、第１の字幕位置に関連して、ＸＭＬ　ＩＤが“ｐ１”で示され、リージョンＩＤが“ｒ１”で示されると共に、字幕（サブタイトル）のテキストデータが記載されている。ここでは、テキストデータが「ＡＢＣＤＥ」とされている。「dto:scalingjustify=bottom」は、リサイズ処理に関する情報を構成しており、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示している。図示の例では、固定位置とすべきライン位置がボトムライン（下のライン）であることを示している。

　また、ボディ（body）には、第２の字幕位置に関連して、ＸＭＬ　ＩＤが“ｐ２”で示され、リージョンＩＤが“ｒ２”で示されると共に、字幕（サブタイトル）のテキストデータが記載されている。ここでは、テキストデータが「ＦＧＨ」とされている。「dto:scalingjustify=top」は、リサイズ処理に関する情報を構成しており、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示している。図示の例では、固定位置とすべきライン位置がトップライン（上のライン）であることを示している。

　図６は、ビデオ領域のアスペクト比と表示ビデオ領域（モニタに表示されるビデオ領域）のアスペクト比が同じである場合における字幕（サブタイトル）の表示例を示している。図示の例は、ビデオ領域のアスペクト比が１６：９で、モニタのアスペクト比も１６：９である場合であって、図３に示すようなＴＴＭＬ構造（字幕表示位置が１個）を持つ場合の例である。

　図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報（「origin=“OH%OV%”」、「extent=“EH%EV%”」）に基づき字幕表示位置（リージョン）が決定されている。“ＲＰ”は、字幕表示範囲のトップ―レフト（top-left）である基準点（Reference Pont）を示している。

　このように決定された字幕表示位置に、テキストデータによる字幕「ＡＢＣＤＥ」が表示されている。なお、図示の例では、ビデオ領域、モニタ領域および字幕表示範囲を示す各枠がずれて表示されているが、各枠を明確に表示するための処置であり、実際には、各枠は重なっている。説明は省略するが、以下の各図においても、同様の表示がなされている。

　図７も、ビデオ領域のアスペクト比と表示ビデオ領域（モニタに表示されるビデオ領域）のアスペクト比が同じである場合における字幕（サブタイトル）の表示例を示している。図示の例は、ビデオ領域のアスペクト比が１６：９で、モニタのアスペクト比も１６：９である場合であって、図５に示すようなＴＴＭＬ構造（字幕表示位置が２個）を持つ場合の例である。

　図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報（「origin=“OH1%OV1%”」、「extent=“EH1%EV1%”」、「origin=“OH2%OV2%”」、「extent=“EH2%EV2%”」）に基づき、第１、第２の字幕表示位置（リージョン）が決定されている。

　そして、第１の字幕表示位置（第１のリージョン）にテキストデータによる字幕「ＡＢＣＤＥ」が表示され、第２の字幕表示位置（第２のリージョン）にテキストデータによる字幕「ＦＧＨ」が表示されている。この場合、２つの字幕表示位置（リージョン）の間隔は、例えば１０ラインとされている。

　図８は、ビデオ領域のアスペクト比と表示ビデオ領域（モニタに表示されるビデオ領域）のアスペクト比が異なる場合であって、表示ビデオ領域が字幕表示範囲とされ、字幕表示位置情報に基づいて字幕表示位置が決定される場合（第１の方法）における字幕（サブタイトル）の表示例を示している。図示の例は、ビデオ領域のアスペクト比が１６：９で、モニタのアスペクト比は４：３である場合であって、図３に示すようなＴＴＭＬ構造（字幕表示位置が１個）を持つ場合の例である。

　図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報（「origin=“OH%OV%”」、「extent=“EH%EV%”」）に基づき字幕表示位置（リージョン）が決定されている。そして、字幕表示位置に、テキストデータによる字幕「ＡＢＣＤＥ」が表示されている。

　この場合、字幕表示位置は、図６の場合と比較して、垂直方向には同じ幅となるが、水平方向にはその幅が圧縮されたものとなる。この場合、字幕表示位置の幅が圧縮されることに伴って字幕のフォントサイズも小さいサイズに調整される。このように字幕のフォントサイズが調整されることで、図示のように、水平方向に関しては字幕表示位置とそれに表示される字幕との関係は整合した状態となるが、字幕表示位置の幅が圧縮されていない垂直方向に関しては字幕表示位置とそれに表示される字幕との関係は不整合な状態となる。この場合、視聴者は、字幕表示位置の黒領域が浮いたような感じを受けるようになる。

　そこで、上述したように第１の方法においては、決定された字幕表示位置にリサイズ処理が施され、字幕表示位置とそれに表示される字幕との関係が水平方向だけでなく垂直方向にも整合した状態とされる。図９は、リサイズ処理が施された場合の表示例を示している。この場合、リサイズ処理により、字幕表示位置情報（「origin=“OH%OV%”」、「extent=“EH%EV%”」）に基づいて決定されることで水平方向にだけ圧縮された字幕表示位置が、垂直方向にも同じ割合で圧縮されたものとされる。この場合、結果的に、字幕表示位置は、字幕表示位置情報（「origin=“OH%OV%”」、「extent=“EH%EVu%”」）で決定されたものとなる。この場合、ＥＶｕ＝３/４＊ＥＶの関係となる。

　このようにリサイズ処理が行われる場合、所定のライン位置が固定された状態で垂直方向の幅の圧縮が行われる。図示の例は、ＴＴＭＬに含まれる「dto:scalingjustify=top」の情報に基づいて、所定のライン位置がトップライン（上のライン）とされた例である。なお、図示の例において、破線枠は、垂直方向の幅の圧縮が行われる前における字幕表示位置を示している。

　図１０も、ビデオ領域のアスペクト比と表示ビデオ領域（モニタに表示されるビデオ領域）のアスペクト比が異なる場合であって、表示ビデオ領域が字幕表示範囲とされ、字幕表示位置情報に基づいて字幕表示位置が決定される場合（第１の方法）における字幕（サブタイトル）の表示例を示している。図示の例は、ビデオ領域のアスペクト比が１６：９で、モニタのアスペクト比は４：３である場合であって、図５に示すようなＴＴＭＬ構造（字幕表示位置が２個）を持つ場合の例であり、リサイズ処理が施された場合の表示例を示している。

　図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報（「origin=“OH1%OV1%”」、「extent=“EH1%EV1%”」、「origin=“OH2%OV2%”」、「extent=“EH2%EV2%”」）に基づき、第１、第２の字幕表示位置（リージョン）が決定され、その後にさらにリサイズ処理が施されている。

　この場合、第１の字幕表示位置（第１のリージョン）は、結果的に、字幕表示位置情報（「origin=“OH1%OV1%”」、「extent=“EH1%EV1u%”」）で決定されたものとなる。この場合、ＥＶ１ｕ＝３/４＊ＥＶ１の関係となる。同様に、この場合、第２の字幕表示位置（第２のリージョン）は、結果的に、字幕表示位置情報（「origin=“OH2%OV2%”」、「extent=“EH2%EV2u%”」）で決定されたものとなる。この場合、ＥＶ２ｕ＝３/４＊ＥＶ２の関係となる。

　そして、第１の字幕表示位置（第１のリージョン）にテキストデータによる字幕「ＡＢＣＤＥ」が表示され、第２の字幕表示位置（第２のリージョン）にテキストデータによる字幕「ＦＧＨ」が表示されている。この場合、字幕表示位置（リージョン）の圧縮に応じて、それに整合するように字幕のフォントサイズが調整される。

　リサイズ処理が行われる場合、所定のライン位置が固定された状態で垂直方向の幅の圧縮が行われる。図示の例は、ＴＴＭＬに含まれる「dto:scalingjustify=bottom」の情報に基づいて、第１の字幕表示位置（第１のリージョン）に関しては、所定のライン位置がボトムライン（下のライン）とされた例である。また、ＴＴＭＬに含まれる「dto:scalingjustify=top」の情報に基づいて、第２の字幕表示位置（第２のリージョン）に関しては、所定のライン位置がトップライン（上のライン）とされた例である。

　このように第１、第２の字幕表示位置における所定のライン位置が選択されることで、第１、第２の字幕表示位置の間隔として、図７の表示例における場合と同様に例えば１０ラインが維持される。そのため、視聴者における、表示画像上における字幕（サブタイトル）の知覚性をほぼ維持することが可能となる

　図１１は、ビデオ領域のアスペクト比と表示ビデオ領域（モニタに表示されるビデオ領域）のアスペクト比が異なる場合であって、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される場合（第２の方法）における字幕（サブタイトル）の表示例を示している。図示の例は、ビデオ領域のアスペクト比が１６：９で、モニタのアスペクト比は４：３である場合であって、図３に示すようなＴＴＭＬ構造（字幕表示位置が１個）を持つ場合の表示例を示している。

　図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域に字幕表示範囲が設定され、それに対する相対位置で指定される字幕表示位置情報（「origin=“OH%OV%”」、「extent=“EH%EV%”」）に基づき字幕表示位置（リージョン）が決定されている。そして、字幕表示位置に、テキストデータによる字幕「ＡＢＣＤＥ」が表示されている。この場合、字幕表示位置（リージョン）の圧縮に応じて、それに整合するように字幕のフォントサイズが調整される。

　この場合、例えば、表示ビデオ領域に、ビデオ領域のアスペクト比と同じアスペクト比の字幕表示範囲が設定される。図示の例は、ＴＴＭＬに含まれる字幕表示範囲の情報、すなわち字幕表示範囲の基準点情報（「dto:RPoffset=“Ax%, By%”」）と、字幕表示範囲のアスペクト比情報（「dto:dispasp=“16:9”」）に基づいて、表示ビデオ領域にアスペクト比が１６：９である字幕表示範囲が設定された例である。

　この場合、字幕表示位置は、垂直方向および水平方向の双方にその幅が圧縮されたものとなり、字幕表示位置の形状は図６の場合と同じくなり、字幕のフォントサイズの調整に伴う字幕表示位置の調整（リサイズ処理）は不要となる。

　図１２も、ビデオ領域のアスペクト比と表示ビデオ領域（モニタに表示されるビデオ領域）のアスペクト比が異なる場合であって、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される場合（第２の方法）における字幕（サブタイトル）の表示例を示している。図示の例は、ビデオ領域のアスペクト比が１６：９で、モニタのアスペクト比は４：３である場合であって、図５に示すようなＴＴＭＬ構造（字幕表示位置が２個）を持つ場合の表示例を示している。

　図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報（「origin=“OH1%OV1%”」、「extent=“EH1%EV1%”」、「origin=“OH2%OV2%”」、「extent=“EH2%EV2%”」）に基づき、第１、第２の字幕表示位置（リージョン）が決定されている。そして、第１の字幕表示位置（第１のリージョン）にテキストデータによる字幕「ＡＢＣＤＥ」が表示され、第２の字幕表示位置（第２のリージョン）にテキストデータによる字幕「ＦＧＨ」が表示されている。

　［放送送出システムのストリーム生成部の構成例］
　図１３は、放送送出システム１００のストリーム生成部１１０の構成例を示している。このストリーム生成部１１０は、制御部１１１と、ビデオエンコーダ１１２と、オーディオエンコーダ１１３と、テキストフォーマット変換部１１４と、サブタイトルエンコーダ１１５と、ＴＳフォーマッタ（マルチプレクサ）１１６を有している。

　制御部１１１は、例えば、ＣＰＵ（Central Processing Unit）を備えた構成とされており、ストリーム生成部１１０の各部の動作を制御する。ビデオエンコーダ１１２は、ビデオデータＤＶを入力し、このビデオデータＤＶに対して符号化を施し、ペイロードに符号化ビデオデータを持つビデオＰＥＳパケットにより構成されるビデオストリーム（ＰＥＳストリーム）を生成する。

　オーディオエンコーダ１１３は、オーディオデータＤＡを入力し、このオーディオデータＤＡに対して符号化を施し、符号化オーディオデータを持つオーディオＰＥＳパケットにより構成されるオーディオストリーム（ＰＥＳストリーム）を生成する。テキストフォーマット変換部１１４は、テキストデータ（文字コード）ＤＴを入力し、字幕情報としてのＴＴＭＬ（Timed Text Markup Language）を得る（図３、図５参照）。

　このＴＴＭＬに含まれる字幕表示位置情報において、字幕表示位置（リージョン）は字幕表示範囲に対する相対位置（プロポーショナルな値）で指定される。また、このＴＴＭＬに、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる字幕表示位置のリサイズ処理に関する情報、例えば、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報が含まれる。また、このＴＴＭＬに、字幕表示範囲の情報（字幕表示範囲の基準点情報およびアスペクト比情報）が含まれる。

　サブタイトルエンコーダ１１５は、テキストフォーマット変換部１１４で得られるＴＴＭＬを種々のセグメントに変換し、ペイロードにそれらのセグメントを配置したサブタイトルＰＥＳパケットにより構成されるサブタイトルストリーム（ＰＥＳストリーム）を生成する。

　ＴＳフォーマッタ１１６は、ビデオエンコーダ１１２で生成されたビデオストリーム、オーディオエンコーダ１１３で生成されたオーディオストリームおよびサブタイトルエンコーダ１１５で生成されたサブタイトルストリームを、トランスポートパケット化して多重し、コンテナ（多重化ストリーム）としてのトランスポートストリームＴＳを得る。

　図１３に示すストリーム生成部１１０の動作を簡単に説明する。ビデオデータＤＶは、ビデオエンコーダ１１２に供給される。ビデオエンコーダ１１２では、このビデオデータＤＶに対して符号化が施され、ペイロードに符号化画像データを持つビデオＰＥＳパケットからなるビデオストリーム（ＰＥＳストリーム）が生成される。このビデオストリームは、ＴＳフォーマッタ１１６に供給される。

　また、オーディオデータＤＡは、オーディオエンコーダ１１３に供給される。オーディオエンコーダ１１３では、オーディオデータＤＡに対して符号化が施され、符号化音声データを持つオーディオＰＥＳパケットからなるオーディオストリーム（ＰＥＳストリーム）が生成される。このオーディオストリームは、ＴＳフォーマッタ１１６に供給される。

　また、テキストデータ（文字コード）ＤＴは、テキストフォーマット変換部１１４に供給される。このキストフォーマット変換部１１４では、字幕情報としてのＴＴＭＬが得られる（図３、図５参照）。このＴＴＭＬは、サブタイトルエンコーダ１１５に供給される。このサブタイトルエンコーダ１１５では、ＴＴＭＬが種々のセグメントに変換され、ペイロードにそれらのセグメントを配置したサブタイトルＰＥＳパケットからなるサブタイトルストリームが生成される。このサブタイトルストリームは、ＴＳフォーマッタ１１６に供給される。

　ＴＳフォーマッタ１１６では、ビデオエンコーダ１１２で生成されたビデオストリーム、オーディオエンコーダ１１３で生成されたオーディオストリームおよびサブタイトルエンコーダ１１５で生成されたサブタイトルストリームが、トランスポートパケット化されて多重化され、コンテナ（多重化ストリーム）としてのトランスポートストリームＴＳが生成される。

　［テレビ受信機の構成例］
　図１４は、テレビ受信機２００の構成例を示している。このテレビ受信機２００は、受信部２０１と、ＴＳ解析部（デマルチプレクサ）２０２と、ビデオデコーダ２０３と、ビデオ重畳部２０４と、パネル駆動回路２０５と、モニタ（ディスプレイ）としての表示パネル２０６を有している。また、このテレビ受信機２００は、オーディオデコーダ２０７と、オーディオ出力回路２０８と、スピーカ２０９と、サブタイトルデコーダ２１０を有している。また、このテレビ受信機２００は、ＣＰＵ２２１と、フラッシュＲＯＭ２２２と、ＤＲＡＭ２２３と、内部バス２２４と、リモコン受信部２２５と、リモコン送信機２２６を有している。

　ＣＰＵ２２１は、テレビ受信機２００の各部の動作を制御する。フラッシュＲＯＭ２２２は、制御ソフトウェアの格納およびデータの保管を行う。ＤＲＡＭ２２３は、ＣＰＵ２２１のワークエリアを構成する。ＣＰＵ２２１は、フラッシュＲＯＭ２２２から読み出したソフトウェアやデータをＤＲＡＭ２２３上に展開してソフトウェアを起動させ、テレビ受信機２００の各部を制御する。

　リモコン受信部２２５は、リモコン送信機２２６から送信されたリモートコントロール信号（リモコンコード）を受信し、ＣＰＵ２２１に供給する。ＣＰＵ２２１は、このリモコンコードに基づいて、テレビ受信機２００の各部を制御する。ＣＰＵ２２１、フラッシュＲＯＭ２２２およびＤＲＡＭ２２３は、内部バス２２４に接続されている。

　受信部２０１は、放送送出システム１００から放送波に載せて送られてくるトランスポートストリームＴＳを受信する。このトランスポートストリームＴＳには、上述したように、ビデオストリーム、オーディオストリームおよびサブタイトルストリームが含まれている。ＴＳ解析部２０２は、トランスポートストリームＴＳからビデオ、オーディオ、サブタイトルの各ストリームのＰＥＳパケットを抽出する。

　オーディオデコーダ２０７は、ＴＳ解析部２０２で得られたオーディオＰＥＳパケットにデコード処理を施し、オーディオデータを得る。オーディオ出力回路２０８は、オーディオデータに対して、Ｄ／Ａ変換や増幅等の必要な処理を施し、スピーカ２０９に供給する。ビデオデコーダ２０３は、ＴＳ解析部２０２で得られたビデオＰＥＳパケットにデコード処理を施し、ビデオデータを得る。なお、ビデオデコーダ２０３は、表示モードなどに応じて、適宜、ビデオデータの解像度変換も行う。例えば、ビデオ領域のアスペクト比が１６：９でモニタ（ディスプレイ）のアスペクト比が４：３であって、表示モードがレターボックスである場合には、ビデオデータの解像度変換が行われる。

　サブタイトルデコーダ２１０は、ＴＳ解析部２０２で得られたサブタイトルＰＥＳパケットにデコード処理を施し、ＴＴＭＬに含まれる各字幕表示位置（リージョン）の字幕（サブタイトル）のテキストデータ（フォントデータ）を、ビットマップデータ（バイナリイメージ情報）を変換する。この場合、字幕のフォントサイズは、ＣＰＵ２２１の制御のもと、字幕表示位置情報により決定された、あるいはさらにリサイズ処理されて得られた字幕表示位置の大きさに応じて、ＴＴＭＬで指定されたフォントサイズから適宜調整されたものとされる。

　また、サブタイトルデコーダ２１０は、ＴＴＭＬから種々の情報を抽出し、ＣＰＵ２２１に供給する。この情報には、<tt>と<head＞で定義する属性情報（attribute information）も含まれる。ＣＰＵ２２１は、字幕表示位置情報に基づいて字幕表示位置を決定し、さらに、必要に応じて、決定された字幕表示位置にリサイズ処理を施す。ＣＰＵ２２１における字幕表示位置の決定およびリサイズ処理の手順の詳細については、さらに後述する。

　ビデオ重畳部２０４は、ビデオデコーダ２０３で得られたビデオデータに、サブタイトルデコーダ２１０で得られた各字幕表示位置の字幕のビットマップデータを重畳し、表示用ビデオデータを得る。この場合、ＣＰＵ２２１は、上述したように字幕表示位置情報により決定された、あるいはさらにリサイズ処理されて得られた字幕表示位置に基づいて、字幕のビットマップデータの重畳位置が字幕表示位置となるように制御する。

　パネル駆動回路２０５は、ビデオ重畳部２０４で得られる表示用のビデオデータに基づいて、表示パネル２０６を駆動する。表示パネル２０６は、例えば、ＬＣＤ(Liquid Crystal Display)、有機ＥＬディスプレイ（organic electroluminescence display）などで構成されている。

　図１４に示すテレビ受信機２００の動作を簡単に説明する。受信部２０１では、放送送出システム１００から放送波に載せて送られてくるトランスポートストリームＴＳが受信される。このトランスポートストリームＴＳには、ビデオストリーム、オーディオストリームおよびサブタイトルストリームが含まれている。このトランスポートストリームＴＳは、ＴＳ解析部２０２に供給される。ＴＳ解析部２０２では、トランスポートストリームＴＳからビデオ、オーディオ、サブタイトルの各ストリームのＰＥＳパケットが抽出される。

　ＴＳ解析部２０２で抽出されたビデオＰＥＳパケットは、ビデオデコーダ２０３に供給される。ビデオデコーダ２０３では、このビデオＰＥＳパケットにデコード処理が施されて、ビデオデータが得られる。この場合、ビデオデコーダ２０３では、表示モードなどに応じて、適宜、ビデオデータの解像度変換も行われる。

　また、ＴＳ解析部２０２で抽出されるサブタイトルＰＥＳパケットは、サブタイトルデコーダ２１０に供給される。このサブタイトルデコーダ２１０では、ＴＳ解析部２０２で得られたサブタイトルＰＥＳパケットにデコード処理が施され、ＴＴＭＬに含まれるテキストデータに基づいて、ビデオデータに重畳すべき各字幕表示位置の字幕のビットマップデータが得られる。

　また、サブタイトルデコーダ２１０では、ＴＴＭＬから種々の情報が抽出され、ＣＰＵ２２１に供給される。この情報には、<tt>と<head＞で定義する属性情報（attribute information）も含まれる。ＣＰＵ２２１では、字幕表示位置情報に基づいて字幕表示位置が決定され、さらに、必要に応じて、決定された字幕表示位置にリサイズ処理が施される。

　サブタイトルデコーダ２１０から出力される各字幕表示位置の字幕のビットマップデータは、ビデオ重畳部２０４に供給される。ビデオ重畳部２０４では、ビデオデコーダ２０３で得られたビデオデータに、サブタイトルデコーダ２１０で得られた各字幕表示位置の字幕のビットマップデータが重畳され、表示用のビデオデータが得られる。この場合、ＣＰＵ２２１により、字幕表示位置情報により決定された、あるいはさらにリサイズ処理されて得られた字幕表示位置に基づいて、字幕のビットマップデータの重畳位置が字幕表示位置となるように制御される。

　ビデオ重畳部２０４で得られた表示用のビデオデータは、パネル駆動回路２０５に供給される。パネル駆動回路２０５では、表示用のビデオデータに基づいて、表示パネル２０６を駆動することが行われる。これにより、表示パネル２０６には、各字幕表示位置（リージョン）に字幕（サブタイトル）が重畳された画像が表示される。

　また、ＴＳ解析部２０２で抽出されたオーディオＰＥＳパケットは、オーディオデコーダ２０７に供給される。オーディオデコーダ２０７では、このオーディオＰＥＳパケットにデコード処理が施され、オーディオデータが得られる。このオーディオデータは、オーディオ出力回路２０８に供給される。オーディオ出力回路２０８では、オーディオデータに対して、Ｄ／Ａ変換や増幅等の必要な処理が行われる。そして、処理後のオーディオデータはスピーカ２０９に供給される。これにより、スピーカ２０９からは表示パネル２０６の表示画像に対応した音声出力が得られる。

　「字幕表示位置の決定およびリサイズ処理の手順」
　ＣＰＵ２２１における字幕表示位置の決定およびリサイズ処理の手順の詳細について説明する。図１５のフローチャートは、ＣＰＵ２２１における字幕表示位置の決定およびリサイズ処理の手順の一例を示している。

　この例では、ビデオ領域のアスペクト比が１６：９であることを想定している。そして、図１６（ａ）に示すようにＴＴＭＬで字幕表示範囲の指定がない場合と、図１６（ｂ），（ｃ）に示すようにＴＴＭＬで字幕表示範囲の指定がある場合の双方があることを想定している。なお、ここでは、指定される字幕表示範囲のアスペクト比が１６：９と４：３である例を示しているが、指定される字幕表示範囲のアスペクト比がこれに限定されるものではない。また、ここでは、モニタ（ディスプレイ）のアスペクト比が１６：９の場合と４：３の場合の双方があることを想定している。

　ＣＰＵ２２１は、ステップＳＴ１で処理を開始し、その後に、ステップＳＴ２の処理に移る。このステップＳＴ２において、ＣＰＵ２２１は、受信機表示はビデオ全領域を表示するモードか否かを判断する。例えば、モニタのアスペクト比が１６：９である場合（図１７（ａ）参照）、あるいはモニタのアスペクト比が４：３であってレターボックス（Letter box）の表示方法を採る場合（図１７（ｂ）参照）には、ビデオ全領域を表示するモードであると判断する。また、例えば、モニタのアスペクト比が４：３であってセンターカット（Center-cut）の表示方法を採る場合（図１７（ｃ）参照）には、ビデオ全領域を表示しないモードであると判断する。

　ＣＰＵ２２１は、ビデオ全領域を表示するモードであると判断するとき、ステップＳＴ３の処理に移る。このステップＳＴ３において、ＣＰＵ２２１は、字幕表示範囲の指定があるか否かを判断する。例えば、ＴＴＭＬのttルートコンテナに字幕表示範囲の基準点情報（RPoffset）およびアスペクト比情報（dispasp）が存在する場合には、字幕表示範囲の指定があると判断する。

　字幕表示範囲の指定がないとき、ＣＰＵ２２１は、ステップＳＴ４の処理に移る。このステップＳＴ４において、ＣＰＵ２２１は、表示ビデオ領域を字幕表示範囲として、字幕表示位置（リージョン）を決定する。このとき、ＣＰＵ２２１は、表示ビデオ領域のトップ―レフト（top-left）を基準点ＲＰとし、字幕表示範囲に対する相対位置で指定されている字幕表示位置情報（「origin=“OH%OV%”」、「extent=“EH%EV%”」）の指示通りに字幕表示位置（リージョン）を決定する。

　図１８（ａ）は、モニタのアスペクト比が１６：９である場合の例を示している。図１８（ｂ）は、モニタのアスペクト比が４：３であってレターボックス（Letter box）の表示方法を採る場合の例を示している。なお、“ＲＰ”は、字幕表示範囲のトップ―レフト（top-left）である基準点（Reference Pont）を示している。

　このステップＳＴ４の処理の後、ＣＰＵ２２１は、ステップＳＴ５において、処理を終了する。

　上述のステップＳＴ３で字幕表示範囲の指定があるとき、ＣＰＵ２２１は、ステップＳＴ６の処理に移る。このステップＳＴ６において、ＣＰＵ２２１は、指定された字幕表示範囲において、字幕表示位置（リージョン）を決定する。このとき、ＣＰＵ２２１は、字幕表示範囲の情報としてアスペクト比情報（dispasp）のみを用い、表示ビデオ領域上に字幕表示範囲を設定する。そして、ＣＰＵ２２１は、字幕表示範囲のトップ―レフト（top-left）を基準点ＲＰとし、字幕表示範囲に対する相対位置で指定されている字幕表示位置情報（「origin=“OH%OV%”」、「extent=“EH%EV%”」）の指示通りに字幕表示位置（リージョン）を決定する。

　図１９（ａ）は、モニタのアスペクト比が１６：９であり、かつアスペクト比情報（dispasp）が示すアスペクト比が１６：９である場合の例を示している。図１９（ｂ）は、モニタのアスペクト比が１６：９であり、かつアスペクト比情報（dispasp）が示すアスペクト比が４：３である場合の例を示している。

　なお、このようにアスペクト比情報（dispasp）が示すアスペクト比がモニタのアスペクト比と異なる場合、ＣＰＵ２２１は、表示ビデオ領域の中央に、垂直方向幅あるいは水平方向幅が一致し、かつアスペクト比情報（dispasp）が示すアスペクト比の字幕表示範囲を設定する。図示の例においては、モニタのアスペクト比が１６：９であり、かつアスペクト比情報（dispasp）が４：３であるので、垂直方向幅が一致している。

　図１９（ｃ）は、モニタのアスペクト比が４：３であってレターボックスの表示方法を採り、かつアスペクト比情報（dispasp）が示すアスペクト比が１６：９である場合の例を示している。図１９（ｄ）は、モニタのアスペクト比が４：３であってレターボックスの表示方法を採り、かつアスペクト比情報（dispasp）が示すアスペクト比が４；３である場合の例を示している。

　このステップＳＴ６の処理の後、ＣＰＵ２２１は、ステップＳＴ５において、処理を終了する。

　上述のステップＳＴ２でビデオ全領域を表示しないモードであると判断するとき、ステップＳＴ７の処理に移る。このステップＳＴ７において、ＣＰＵ２２１は、字幕表示範囲の指定があるか否かを判断する。例えば、ＴＴＭＬのttルートコンテナに字幕表示範囲の基準点情報（RPoffset）およびアスペクト比情報（dispasp）が存在する場合には、字幕表示範囲の指定があると判断する。

　字幕表示範囲の指定がないとき、ＣＰＵ２２１は、ステップＳＴ８の処理に移る。このステップＳＴ８において、ＣＰＵ２２１は、表示ビデオ領域を字幕表示範囲として、字幕表示位置（リージョン）を決定する。このとき、ＣＰＵ２２１は、表示ビデオ領域のトップ―レフト（top-left）を基準点ＲＰとし、字幕表示範囲に対する相対位置で指定されている字幕表示位置情報（「origin=“OH%OV%”」、「extent=“EH%EV%”」）の指示通りに字幕表示位置（リージョン）を決定する。

　このように決定された字幕表示位置は、水平方向のみその幅が圧縮されたものとなる。そのため、ＣＰＵ２２１は、さらに、決定された字幕表示位置にリサイズ処理を施し、垂直方向の幅も圧縮し、最終的な字幕表示位置を得る。この場合、ＣＰＵ２２１は、例えば、ＴＴＭＬに含まれる「dto:scalingjustify=top」の情報に基づいて、所定のライン位置を固定した状態で垂直方向の幅の圧縮をする。

　図２０（ａ）は、モニタのアスペクト比が４：３であってセンターカット（Center-cut）の表示方法を採る場合の例を示している。字幕表示位置の垂直方向の幅は、リサイズ処理によって、ＥＶ％からＥＶｕ％に圧縮されている。

　このステップＳＴ８の処理の後、ＣＰＵ２２１は、ステップＳＴ５において、処理を終了する。

　上述のステップＳＴ７で字幕表示範囲の指定があるとき、ＣＰＵ２２１は、ステップＳＴ９の処理に移る。このステップＳＴ９において、ＣＰＵ２２１は、指定された字幕表示範囲において、字幕表示位置（リージョン）を決定する。このとき、ＣＰＵ２２１は、字幕表示範囲の情報（基準点情報（RPoffset）、アスペクト比情報（dispasp））を用い、表示ビデオ領域上に字幕表示範囲を設定する。

　この場合、ＣＰＵ２２１は、表示ビデオ領域のトップ―レフト（top-left）から基準点情報（RPoffset）だけずらした位置を字幕表示範囲のトップ―レフト（top-left）とし、アスペクト比情報（dispasp）が示すアスペクト比に対応した範囲を字幕表示範囲に設定する。この場合、字幕表示範囲の水平方向幅は、表示ビデオ領域の水平方向幅と一致したものとされる。

　そして、ＣＰＵ２２１は、上述したように設定された字幕表示範囲のトップ―レフト（top-left）を基準点ＲＰとし、字幕表示範囲に対する相対位置で指定されている字幕表示位置情報（「origin=“OH%OV%”」、「extent=“EH%EV%”」）の指示通りに字幕表示位置（リージョン）を決定する。

　図２０（ｂ）は、モニタのアスペクト比が４：３であってセンターカットの表示方法を採り、かつアスペクト比情報（dispasp）が示すアスペクト比が１６：９である場合の例を示している。図２０（ｃ）は、モニタのアスペクト比が４：３であってセンターカットの表示方法を採り、かつアスペクト比情報（dispasp）が示すアスペクト比が４：３である場合の例を示している。

　このステップＳＴ９の処理の後、ＣＰＵ２２１は、ステップＳＴ５において、処理を終了する。

　以上説明したように、図１に示す送受信システム１０において、テレビ受信機２００は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として字幕表示位置情報に基づいて決定された字幕表示位置にさらにリサイズ処理を施して最終的な字幕表示位置を得るか、あるいは表示ビデオ領域に字幕表示範囲を設定し、字幕表示位置情報に基づいて字幕表示位置を決定する。そのため、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であっても、字幕表示位置として本来の形状を保つことができ、視聴者に違和感を与えることがなく、字幕表示を良好に行い得る。

　また、図１に示す送受信システム１０において、放送送出システム１００は、字幕情報としてのＴＴＭＬに、受信側で行われるリサイズ処理に関する情報として、例えば字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報を含める。そのため、受信側では、この情報に基づいてリサイズ処理を適切に行うことが容易に可能となる。

　また、図１に示す送受信システム１０において、放送送出システム１００は、字幕情報としてのＴＴＭＬに、字幕表示範囲の情報を含める。そのため、受信側では、この情報に基づいて字幕表示範囲を設定することで、表示ビデオ領域に字幕表示範囲を適切に設定することが容易に可能となる。

　＜２．変形例＞
　なお、上述実施の形態においては、放送送出システム１００がＴＴＭＬに字幕表示範囲の情報として基準点情報（RPoffset）とアスペクト比情報（dispasp）を含める例を説明した。しかし、放送送出システム１００は、ＴＴＭＬに字幕表示範囲の情報として基準点情報（RPoffset）のみを含めることも考えられる。図２１、図２２は、その場合におけるＴＴＭＬ構造の一例を示している。これらのＴＴＭＬ構造例は、詳細説明は省略するが、字幕表示範囲のアスペクト比情報（dispasp）がないことを除き、図３、図５に示すＴＴＭＬ構造例と同様である。

　基準点情報（RPoffset）のみが与えられる場合に、テレビ受信機２００のＣＰＵ２２１がどのようにして字幕表示範囲を設定するかについて、その一例を、図２３を参照して説明する。図示の例は、ビデオ領域のアスペクト比が１６：９で表示ビデオ領域のアスペクト比が４：３である場合を示している。

　ＣＰＵ２２１は、基準点情報（RPoffset）に基づいて、まず、表示ビデオ領域のトップ―レフト（top-left）から基準点情報（RPoffset）だけずらした位置を字幕表示範囲の基準点ＲＰとする。表示ビデオ領域の中心位置をＯＰとし、基準点ＲＰのＯＰに関して点対称の座標位置をＴＰとする。また、基準点ＲＰのＯＰを通る水平線ＪＫに関して線対称な位置をＶＰとする。また、基準点ＲＰのＯＰを通る垂直線ＳＴに関して線対称な位置をＨＰとする。そして、字幕表示範囲を、ＲＰ－ＨＰ－ＴＰ－ＶＰで囲まれる矩形領域を字幕表示範囲とする。

　このように放送送出システム１００が字幕表示範囲の情報として基準点情報（RPoffset）のみを送る場合には、基準点情報（RPoffset）とアスペクト比情報（dispasp）の双方を送る場合に比べて、よりフレキシブルな字幕表示範囲の指定が可能となる。

　図２４のフローチャートは、字幕表示範囲の情報として基準点情報（RPoffset）のみを送る場合における、テレビ受信機２００のＣＰＵ２２１における字幕表示位置の決定およびリサイズ処理の手順の一例を示している。この図２４において、図１５と対応する部分には同一符号を付して示している。

　ステップＳＴ２でビデオ全領域を表示するモードであると判断するとき、ＣＰＵ２２１は、ステップＳＴ４において、表示ビデオ領域を字幕表示範囲として、字幕表示位置（リージョン）を決定する。このとき、ＣＰＵ２２１は、表示ビデオ領域のトップ―レフト（top-left）を基準点ＲＰとし、字幕表示範囲に対する相対位置で指定されている字幕表示位置情報（「origin=“OH%OV%”」、「extent=“EH%EV%”」）の指示通りに字幕表示位置（リージョン）を決定する。

　詳細説明は省略するが、図２４のフローチャートのその他のステップは、図１５のフローチャートと同様である。

　また、上述実施の形態においては、所定フォーマットの字幕のテキスト情報としてＴＴＭＬを用いる例を示した。しかし、本技術は、これに限定されず、ＴＴＭＬと同等の情報を持つその他のテキスト情報を用いることも考えらえる。例えば、ＴＴＭＬの派生フォーマットを用いてもよい。

　また、上述実施の形態においては、放送送出システム１００とテレビ受信機２００とからなる送受信システム１０を示したが、本技術を適用し得る送受信システムの構成は、これに限定されるものではない。例えば、テレビ受信機２００の部分が、ＨＤＭＩ（High-Definition Multimedia Interface）などのデジタルインタフェースで接続されたセットトップボックスおよびモニタの構成などであってもよい。なお、「ＨＤＭＩ」は登録商標である。

　また、上述実施の形態においては、コンテナがＭＰＥＧ－２　ＴＳのトランスポートストリームである例を示した。本技術は、コンテナがＭＭＴのトランスポートストリームあるいはＤＡＳＨ/ＩＳＯＢＭＦＦストリームなどである場合にも、同様に適用できることは勿論である。

　また、本技術は、以下のような構成を取ることもできる。
　（１）ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信部と、
　上記ビデオストリームにデコード処理を施してビデオデータを得るビデオデコード部と、
　上記サブタイトルストリームにデコード処理を施して字幕のビットマップデータを得るサブタイトルデコード部を備え、
　上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されており、
　ビデオ領域のアスペクト比と上記表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置にリサイズ処理を施し、該リサイズ処理が施された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示制御部と、
　上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳部をさらに備える
　受信装置。
　（２）上記表示制御部は、
　上記字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合、所定のライン位置を固定した状態で圧縮する
　前記（１）に記載の受信装置。
　（３）上記サブタイトルストリームが持つ字幕情報に、上記リサイズ処理に関する情報が含まれており、
　上記表示制御部は、
　上記リサイズ処理に関する情報を用いて上記決定された字幕表示位置にリサイズ処理を施す
　前記（１）または（２）に記載の受信装置。
　（４）受信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信ステップと、
　上記ビデオストリームにデコード処理を施してビデオデータを得るビデオデコードステップと、
　上記サブタイトルストリームにデコード処理を施して字幕のビットマップデータを得るサブタイトルデコードステップを有し、
　上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されており、
　ビデオ領域のアスペクト比と上記表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置にリサイズ処理を施し、該リサイズ処理が施された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示制御ステップと、
　上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳ステップをさらに有する
　受信方法。
　（５）ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信部と、
　上記ビデオストリームにデコード処理を施してビデオデータを得るビデオデコード部と、
　上記サブタイトルストリームにデコード処理を施して字幕のビットマップデータを得るサブタイトルデコード部を備え、
　上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されており、
　ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域に字幕表示範囲を設定し、上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示制御部と、
　上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳部をさらに備える
　受信装置。
　（６）上記サブタイトルストリームが持つ字幕情報に、上記字幕表示範囲の情報が含まれており、
　上記表示制御部は、
　上記字幕表示範囲の情報を用いて上記表示ビデオ領域に字幕表示範囲を設定する
　前記（５）に記載の受信装置。
　（７）上記字幕表示範囲の情報は、上記字幕表示範囲の基準点情報およびアスペクト比情報、あるいは上記字幕表示範囲の基準点情報である
　前記（６）に記載の受信装置。
　（８）受信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信ステップと、
　上記ビデオストリームにデコード処理を施してビデオデータを得るビデオデコードステップと、
　上記サブタイトルストリームにデコード処理を施して字幕のビットマップデータを得るサブタイトルデコードステップを有し、
　上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されており、
　ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域に字幕表示範囲を設定し、上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示制御ステップと、
　上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳ステップをさらに有する
　受信方法。
　（９）ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
　上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
　上記字幕情報は、
　ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる、上記字幕表示位置情報に基づいて決定される字幕表示位置のリサイズ処理に関する情報を含む
　送信装置。
　（１０）上記リサイズ処理に関する情報は、上記字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報である
　前記（９）に記載の送信装置。
　（１１）ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
　上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
　上記字幕情報は、
　上記字幕表示範囲の情報を含む
　送信装置。
　（１２）上記字幕表示範囲の情報は、上記字幕表示範囲の基準点情報およびアスペクト比情報、あるいは上記字幕表示範囲の基準点情報である
　前記（１１）に記載の送信装置。

　本技術の主な特徴は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として字幕表示位置情報に基づいて決定された字幕表示位置にさらにリサイズ処理を施して最終的な字幕表示位置を得るか、あるいは表示ビデオ領域に字幕表示範囲を設定し、字幕表示位置情報に基づいて字幕表示位置を決定することで、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であっても、字幕表示位置として本来の形状を保つことができ、視聴者に違和感を与えることがなく、字幕表示を良好に行い得るようにしたことである（図２０参照）。

　１０・・・送受信システム
　１００・・・放送送出システム
　１１０・・・ストリーム生成部
　１１１・・・制御部
　１１２・・・ビデオエンコーダ
　１１３・・・オーディオエンコーダ
　１１４・・・テキストフォーマット変換部
　１１５・・・サブタイトルエンコーダ
　１１６・・・ＴＳフォーマッタ
　２００・・・テレビ受信機
　２０１・・・受信部
　２０２・・・ＴＳ解析部
　２０３・・・ビデオデコーダ
　２０４・・・ビデオ重畳部
　２０５・・・パネル駆動回路
　２０６・・・表示パネル
　２０７・・・オーディオデコーダ
　２０８・・・オーディオ出力回路
　２０９・・・スピーカ
　２１０・・・サブタイトルデコーダ
　２２１・・・ＣＰＵ

Claims

　ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信部と、
　上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域を字幕表示範囲として上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置にリサイズ処理を施し、該リサイズ処理が施された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御部を備える
　受信装置。
　上記表示位置制御処理では、
　上記字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合、所定のライン位置を固定した状態で圧縮する
　請求項１に記載の受信装置。
　上記サブタイトルストリームが持つ字幕情報に、上記リサイズ処理に関する情報が含まれており、
　上記表示位置制御処理では、
　上記リサイズ処理に関する情報を用いて上記決定された字幕表示位置にリサイズ処理を施す
　請求項１に記載の受信装置。
　受信部が、ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信ステップと、
　制御部が、上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域を字幕表示範囲として上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置にリサイズ処理を施し、該リサイズ処理が施された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御ステップを有する
　受信方法。
　ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信部と、
　上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域に字幕表示範囲を設定し、上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御部を備える
　受信装置。
　上記サブタイトルストリームが持つ字幕情報に、上記字幕表示範囲の情報が含まれており、
　上記表示位置制御処理では、
　上記字幕表示範囲の情報を用いて上記表示ビデオ領域に字幕表示範囲を設定する
　請求項５に記載の受信装置。
　上記字幕表示範囲の情報は、上記字幕表示範囲の基準点情報およびアスペクト比情報、あるいは上記字幕表示範囲の基準点情報である
　請求項６に記載の受信装置。
　受信部が、ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信ステップと、
　制御部が、上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域に字幕表示範囲を設定し、上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御ステップを有する
　受信方法。
　ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナを送信する送信部を備え、
　上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
　上記字幕情報は、
　ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる、上記字幕表示位置情報に基づいて決定される字幕表示位置のリサイズ処理に関する情報を含む
　送信装置。
　上記リサイズ処理に関する情報は、上記字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報である
　請求項９に記載の送信装置。
　ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナを送信する送信部を備え、
　上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
　上記字幕情報は、
　上記字幕表示範囲の情報を含む
　送信装置。
　上記字幕表示範囲の情報は、上記字幕表示範囲の基準点情報およびアスペクト比情報、あるいは上記字幕表示範囲の基準点情報である
　請求項１１に記載の送信装置。