JP2015065556A - 映像出力装置、映像出力方法および映像出力プログラム - Google Patents
映像出力装置、映像出力方法および映像出力プログラム Download PDFInfo
- Publication number
- JP2015065556A JP2015065556A JP2013197886A JP2013197886A JP2015065556A JP 2015065556 A JP2015065556 A JP 2015065556A JP 2013197886 A JP2013197886 A JP 2013197886A JP 2013197886 A JP2013197886 A JP 2013197886A JP 2015065556 A JP2015065556 A JP 2015065556A
- Authority
- JP
- Japan
- Prior art keywords
- output
- subtitle
- timing
- audio
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【課題】教材となる番組の選択の幅を広げ、かつ低コストで語学学習を効果的に行う。
【解決手段】画像、前記画像に関連する音声、および前記音声に関連する字幕を出力可能な映像出力装置であって、前記画像と、前記音声と、前記字幕と、前記画像を出力すべき出力タイミングを示す画像タイミング情報と、前記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得する番組情報取得部と、前記画像タイミング情報の示す前記出力タイミングおよび前記音声タイミング情報の示す前記出力タイミングに従って、前記番組情報取得部によって取得された前記画像および前記音声をそれぞれ出力する映像出力部と、前記番組情報取得部によって取得された前記字幕を、前記画像または前記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力する字幕出力部とを備える、映像出力装置。
【選択図】図1
【解決手段】画像、前記画像に関連する音声、および前記音声に関連する字幕を出力可能な映像出力装置であって、前記画像と、前記音声と、前記字幕と、前記画像を出力すべき出力タイミングを示す画像タイミング情報と、前記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得する番組情報取得部と、前記画像タイミング情報の示す前記出力タイミングおよび前記音声タイミング情報の示す前記出力タイミングに従って、前記番組情報取得部によって取得された前記画像および前記音声をそれぞれ出力する映像出力部と、前記番組情報取得部によって取得された前記字幕を、前記画像または前記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力する字幕出力部とを備える、映像出力装置。
【選択図】図1
Description
本発明は、映像出力装置、映像出力方法および映像出力プログラムに関し、特に、画像、当該画像に関連する音声、および当該音声に関連する字幕を出力可能な映像出力装置、映像出力方法および映像出力プログラムに関する。
“超字幕 Windows(登録商標)版 主な機能”、[online]、[平成25年8月30日検索]、インターネット〈URL:http://www.sourcenext.com/product/chj/pc/function/〉(非特許文献1)には、「超字幕」の主な機能が記載されている。「超字幕」は、映画が丸ごと1本収録された、英語学習に用いる語学番組情報である。「超字幕」を視聴することにより、生きた表現、ナチュラル・スピードに触れながら、映画の多彩な人物設定で織りなされるストーリーに基づいて英語学習が行われる。”超字幕”の主な機能の1つに、日/英字幕が同時表示できる字幕切り替え機能がある。字幕切り替え機能により、英語のみ、日本語のみ、英語+日本語、字幕なしの4タイプに切り替えすることが可能である。この機能により、通常のDVDプレーヤではできない「英語+日本語」の同時表示が可能となり、その場で対訳を確認することができる。
"超字幕 Windows(登録商標)版 主な機能"、[online]、[平成25年8月30日検索]、インターネット〈URL:http://www.sourcenext.com/product/chj/pc/function/〉
しかしながら、非特許文献1に記載された語学番組情報では、ユーザが音声を聞き取るタイミングと字幕を見るタイミングとがほとんど同時であるため、ユーザは、音声を聞きながら字幕を目で追ってしまう。
この場合、ユーザの頭の中では、耳から入ってくる情報の処理と目から入ってくる情報の処理とが同時に行われるため、ユーザは、いずれの処理にも集中することができない。このため、リスニング能力を向上させるための訓練およびリーディング能力を向上させるための訓練を効果的に行うことができないという問題がある。
また、語学番組情報は、語学学習目的のために専用に制作されたストリームに記録される。このため、語学番組情報を購入するためのコストが発生し、また教材となる番組の選択の幅が制限されてしまう。
この発明は、上述の課題を解決するためになされたもので、その目的は、教材となる番組の選択の幅を広げ、かつ低コストで語学学習を効果的に行うことが可能な映像出力装置、映像出力方法および映像出力プログラムを提供することである。
(1)上記課題を解決するために、この発明のある局面に係わる映像出力装置は、画像、上記画像に関連する音声、および上記音声に関連する字幕を出力可能な映像出力装置であって、上記画像と、上記音声と、上記字幕と、上記画像を出力すべき出力タイミングを示す画像タイミング情報と、上記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得する番組情報取得部と、上記画像タイミング情報の示す上記出力タイミングおよび上記音声タイミング情報の示す上記出力タイミングに従って、上記番組情報取得部によって取得された上記画像および上記音声をそれぞれ出力する映像出力部と、上記番組情報取得部によって取得された上記字幕を、上記画像または上記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力する字幕出力部とを備える。
(12)上記課題を解決するために、この発明のある局面に係わる映像出力方法は、画像、上記画像に関連する音声、および上記音声に関連する字幕を出力可能な映像出力装置における映像出力方法であって、上記画像と、上記音声と、上記字幕と、上記画像を出力すべき出力タイミングを示す画像タイミング情報と、上記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得するステップと、上記画像タイミング情報の示す上記出力タイミングおよび上記音声タイミング情報の示す上記出力タイミングに従って、取得した上記画像および上記音声をそれぞれ出力するステップと、取得した上記字幕を、上記画像または上記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力するステップとを含む。
(13)上記課題を解決するために、この発明のある局面に係わる映像出力プログラムは、画像、上記画像に関連する音声、および上記音声に関連する字幕を出力可能な映像出力装置において用いられる映像出力プログラムであって、コンピュータに、上記画像と、上記音声と、上記字幕と、上記画像を出力すべき出力タイミングを示す画像タイミング情報と、上記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得するステップと、上記画像タイミング情報の示す上記出力タイミングおよび上記音声タイミング情報の示す上記出力タイミングに従って、取得した上記画像および上記音声をそれぞれ出力するステップと、取得した上記字幕を、上記画像または上記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力するステップとを実行させるためのプログラムである。
本発明は、このような特徴的な処理部を備える映像出力装置として実現することができるだけでなく、映像出力装置の一部または全部を実現する半導体集積回路として実現したり、映像出力装置を備える映像出力システムとして実現したりすることができる。
本発明によれば、教材となる番組の選択の幅を広げ、かつ低コストで語学学習を効果的に行うことができる。
最初に、本発明の実施形態の内容を列記して説明する。
(1)本発明の実施の形態に係る映像出力装置は、画像、上記画像に関連する音声、および上記音声に関連する字幕を出力可能な映像出力装置であって、上記画像と、上記音声と、上記字幕と、上記画像を出力すべき出力タイミングを示す画像タイミング情報と、上記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得する番組情報取得部と、上記画像タイミング情報の示す上記出力タイミングおよび上記音声タイミング情報の示す上記出力タイミングに従って、上記番組情報取得部によって取得された上記画像および上記音声をそれぞれ出力する映像出力部と、上記番組情報取得部によって取得された上記字幕を、上記画像または上記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力する字幕出力部とを備える。
このような構成により、映像出力装置のユーザが音声を聞き取るタイミングと字幕を見るタイミングとを異なるタイミングにすることができるので、ユーザが音声を聞くことまたは字幕を見ることのいずれかに集中することができる。
これにより、ユーザの頭の中では、耳から入ってくる情報の処理または目から入ってくる情報の処理のいずれかの処理に集中することができるので、リスニング能力およびリーディング能力を向上させるための訓練を効果的に行うことができる。
また、映像出力装置では、語学学習目的のために専用に制作したストリームを用意することなくリスニング能力およびリーディング能力を向上させるための訓練を行うことができるので、番組情報に要するコストを抑制し、かつ教材となる番組の選択の幅を広げることができる。
(2)好ましくは、上記字幕出力部は、上記対応タイミングより時間的に後のタイミングで上記字幕を出力する。
このような構成により、映像出力装置のユーザは、学習対象とする言語で話された音声を聞き終わった後、当該音声についての字幕を見ることができるので、番組情報を視聴しながらディクテーションの訓練を行うことができる。これにより、ユーザは、上記言語のリスニング能力の向上を図ることができる。
(3)より好ましくは、上記字幕出力部は、時間的に連続する2つの上記字幕について、後の上記字幕の上記対応タイミングである次対応タイミングに基づいて、前の上記字幕を出力する。
このような構成により、前の字幕の対応タイミングにおいて出力される可能性が高い前の字幕に対応する音声、および次対応タイミングに基づいて出力される字幕が同時に出力される可能性を減ずることができるので、映像出力装置のユーザの集中力が分散してしまうことを回避することができる。
(4)より好ましくは、上記字幕出力部は、上記後の字幕の出力期間よりも短い期間、上記前の字幕を出力する。
このような構成により、時間的に連続する2つの字幕について、前の字幕および後の字幕が同時に出力される可能性の低減、または後の字幕の出力タイミングの遅延の抑制を行うことができる。
(5)より好ましくは、上記字幕出力部は、上記前の字幕の上記対応タイミングと上記次対応タイミングとの間隔が大きいとき、上記次対応タイミングの代わりに、上記前の字幕の上記対応タイミングと上記次対応タイミングとの間のタイミングで上記前の字幕を出力する。
このような構成により、大幅に遅れた次対応タイミングにおいて前の字幕が出力される場合と比べて、前の字幕に対応する音声を聞いてから前の字幕を見るまでの時間間隔をディクテーションの訓練として適正な時間間隔に近づけることができ、また、映像出力装置のユーザが感じる違和感を低減することができる。
(6)好ましくは、上記字幕出力部は、上記字幕に対応する上記音声の出力期間の終了タイミングに応答して、上記音声に対応する上記字幕の出力を開始する。
このような構成により、字幕に対応する音声を聞いてから当該字幕を見るまでの時間間隔をディクテーションの訓練として適正な時間間隔に近づけることができる。
(7)好ましくは、上記番組情報取得部は、さらに、上記字幕を出力すべき出力タイミングを示す字幕タイミング情報を取得し、上記字幕出力部は、上記字幕タイミング情報の示す上記字幕を出力すべき期間の終了に応答して、上記字幕の出力を開始する。
このように、字幕に対応する音声の出力期間と一致する可能性が高い上記期間に応答して、当該字幕の出力を開始する構成により、当該音声を聞いてから当該字幕を見るまでの時間間隔をディクテーションの訓練として適正な時間間隔に近づけることができる。
(8)好ましくは、上記映像出力部は、時間的に連続する2つの上記画像および上記音声について、前の上記画像および前の上記音声を出力し、上記字幕出力部によって上記前の音声に対応する上記字幕が出力された後、後の上記画像および後の上記音声の出力を保留または中断し、その後、保留または中断した上記後の画像および上記後の音声の出力を行うか、または再開する。
このような構成により、映像出力装置のユーザは、学習対象とする言語の音声を聞き終わった後、当該音声についての字幕をより長く見ることができるので、当該字幕の文章を読み終わる前に次の字幕の文章が出力されることを避けることができる。これにより、リスニング能力の低い初級者にとって好ましいディクテーションの訓練を行うことができる。
(9)好ましくは、上記映像出力装置は、さらに、上記字幕を表示するための字幕表示命令を受付ける受付け部を備え、上記字幕出力部は、上記受付け部が上記字幕表示命令を受付けると、上記字幕を出力しない状態から上記字幕を出力する状態へ切替える。
このように、映像出力装置のユーザによる操作に基づいて字幕が出力される構成により、ユーザは、内容を聞き取ることができた音声について字幕確認の作業を省略することができ、また、内容を聞き取ることができなかった音声については、字幕確認を行うことにより自己の弱点を把握することができる。これにより、リスニング能力の高い上級者にとって好ましいディクテーションの訓練を行うことができる。
(10)好ましくは、上記番組情報取得部は、上記字幕を表示すべき位置を示す位置情報を取得し、上記字幕出力部は、上記番組情報取得部により取得された上記位置情報が示す位置と異なる位置に上記字幕を出力する。
このような構成により、画像における重要な表示と字幕とが重なってしまう可能性を減ずることができるので、画像における重要な表示が字幕により隠され、映像出力装置のユーザが重要な表示を見ることができなくなる状況を回避することができる。
(11)好ましくは、上記映像出力装置は、さらに、上記音声および上記音声に対応する字幕をリピートするためのリピート命令を受付ける受付け部を備え、上記映像出力部は、上記受付け部が上記リピート命令を命令受付タイミングで受付けると、上記命令受付タイミングより前に出力された上記音声を再び出力し、上記字幕出力部は、上記音声に対応する上記字幕を、上記音声に対応して出力すべき対応タイミングとは異なるタイミングで再び出力する。
このような構成により、映像出力装置のユーザは、反復練習を行うことができるので、リスニング能力およびリーディング能力を向上させるための訓練をより効果的に行うことができる。
(12)本発明の実施の形態に係る映像出力方法は、画像、上記画像に関連する音声、および上記音声に関連する字幕を出力可能な映像出力装置における映像出力方法であって、上記画像と、上記音声と、上記字幕と、上記画像を出力すべき出力タイミングを示す画像タイミング情報と、上記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得するステップと、上記画像タイミング情報の示す上記出力タイミングおよび上記音声タイミング情報の示す上記出力タイミングに従って、取得した上記画像および上記音声をそれぞれ出力するステップと、取得した上記字幕を、上記画像または上記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力するステップとを含む。
このような構成により、映像出力装置のユーザが音声を聞き取るタイミングと字幕を見るタイミングとを異なるタイミングにすることができるので、ユーザが音声を聞くことまたは字幕を見ることのいずれかに集中することができる。
これにより、ユーザの頭の中では、耳から入ってくる情報の処理または目から入ってくる情報の処理のいずれかの処理に集中することができるので、リスニング能力およびリーディング能力を向上させるための訓練を効果的に行うことができる。
また、映像出力装置では、語学学習目的のために専用に制作したストリームを用意することなくリスニング能力およびリーディング能力を向上させるための訓練を行うことができるので、番組情報に要するコストを抑制し、かつ教材となる番組の選択の幅を広げることができる。
(13)本発明の実施の形態に係る映像出力プログラムは、画像、上記画像に関連する音声、および上記音声に関連する字幕を出力可能な映像出力装置において用いられる映像出力プログラムであって、コンピュータに、上記画像と、上記音声と、上記字幕と、上記画像を出力すべき出力タイミングを示す画像タイミング情報と、上記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得するステップと、上記画像タイミング情報の示す上記出力タイミングおよび上記音声タイミング情報の示す上記出力タイミングに従って、取得した上記画像および上記音声をそれぞれ出力するステップと、取得した上記字幕を、上記画像または上記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力するステップとを実行させるためのプログラムである。
このような構成により、映像出力装置のユーザが音声を聞き取るタイミングと字幕を見るタイミングとを異なるタイミングにすることができるので、ユーザが音声を聞くことまたは字幕を見ることのいずれかに集中することができる。
これにより、ユーザの頭の中では、耳から入ってくる情報の処理または目から入ってくる情報の処理のいずれかの処理に集中することができるので、リスニング能力およびリーディング能力を向上させるための訓練を効果的に行うことができる。
また、映像出力装置では、語学学習目的のために専用に制作したストリームを用意することなくリスニング能力およびリーディング能力を向上させるための訓練を行うことができるので、番組情報に要するコストを抑制し、かつ教材となる番組の選択の幅を広げることができる。
以下、本発明の実施の形態について図面を用いて説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。また、以下に記載する実施の形態の少なくとも一部を任意に組み合わせてもよい。
[映像出力装置の構成]
図1は、本発明の実施の形態に係る映像出力システムの構成を示す図である。
図1は、本発明の実施の形態に係る映像出力システムの構成を示す図である。
図1を参照して、映像出力システム201は、映像出力装置101と、アンテナ11と、蓄積部12と、表示装置13とを備える。映像出力装置101は、ストリーム取得部(番組情報取得部)21と、制御部22と、受付け部23と、字幕処理部(字幕出力部)24と、メディアチップ(映像出力部および字幕出力部)25とを備える。ストリーム取得部21は、ストリーム受信部31と、ストリーム解析部32と、読込部33と、ストリーム処理部34と、フィルタ処理部35とを含む。字幕処理部24は、PID管理部41と、字幕解析部42と、描画処理部43と、字幕情報書換部44とを含む。なお、蓄積部12は、映像出力装置101に含まれていてもよい。表示装置13は、映像出力装置101に含まれていてもよい。また、アンテナ11は、映像出力装置101に含まれていてもよい。
アンテナ11は、たとえば番組情報を送信する放送局からの電波を受信する。蓄積部12は、たとえば、HDD(Hard Disk Drive)装置、およびDVD(Digital Versatile Disk)またはブルーレイディスクのプレーヤ等であり、番組情報を蓄積する。表示装置13は、映像出力装置101から受ける映像信号および音声信号に従って、それぞれ画面表示およびスピーカ出力を行う。
映像出力装置101は、たとえば、画像、音声および字幕等が多重化されたストリームを取得し、取得したストリームを処理することにより、画像を含む映像信号および音声を含む音声信号を生成し、表示装置13へ出力する。また、映像出力装置101は、たとえば、画像および字幕を含む映像信号および音声を含む音声信号を生成し、表示装置13へ出力することも可能である。
より詳細には、映像出力装置101における受付け部23は、ユーザからの操作を受付け、受付けたユーザの操作に応じて、モード変更命令、字幕表示命令、表示変更命令、選択番組情報および処理命令等を制御部22へ出力する。処理命令には、再生命令、字幕の一時表示命令およびリピート命令等が含まれる。
制御部22は、たとえばメディアコントローラであり、ストリーム取得部21、字幕処理部24およびメディアチップ25を総合的に制御する。
図2は、本発明の実施の形態に係る映像出力装置における制御部の構成を示す図である。
図2を参照して、制御部22は、動作モード設定部51と、STC(System Time Clock)52と、再生制御部53と、字幕表示切替部54と、番組選択部55とを含む。
具体的には、動作モード設定部51は、受付け部23から受けるモード変更命令に基づいて、自己の映像出力装置101の動作モードを設定する。
より詳細には、動作モード設定部51は、たとえば通常の再生動作を行うための通常再生モード、または語学学習を行うための語学学習モードに自己の映像出力装置101を設定する。動作モード設定部51は、語学学習モードにおいて、たとえばリスニング能力の低いユーザを対象とする初級者モード、またはリスニング能力の高いユーザを対象とする上級者モードに自己の映像出力装置101を設定する。
字幕表示切替部54は、通常再生モードでは、受付け部23から受ける字幕表示命令に基づいて、表示装置13において字幕を表示する字幕表示オン、または字幕を表示しない字幕表示オフの切り替えを行う。
たとえば、語学学習における上級者にとっては、字幕に頼ることなく番組情報のほとんどの音声についてディクテーションを行うことが可能であるが、字幕を確認したい状況が発生する場合がたまにある。
これに対して、字幕表示切替部54は、動作モード設定部51により動作モードが語学学習モードの初級者モードに設定されると、字幕表示オンに切り替え、また、動作モードが語学学習モードの上級者モードに設定されると、字幕表示オフに切り替える。
そして、字幕表示切替部54は、語学学習モードの上級者モードにおいて、受付け部23から字幕の一時表示命令を受けると、字幕表示オフから字幕表示オンへ切替え、たとえば所定時間経過した後、字幕表示オフへ戻す。
これにより、上級者は、所定時間表示される字幕から音声の内容を確認することができる。
また、字幕表示切替部54は、受付け部23から受けた表示変更命令に基づいて、表示装置13において通常の字幕表示を行う拡張字幕表示オフ、または通常より拡張された字幕表示を行う拡張字幕表示オンの切り替えを行う。字幕表示切替部54は、字幕表示のオンオフおよび拡張字幕表示のオンオフについて字幕処理部24およびメディアチップ25に通知する。
STC52は、たとえば自己の映像出力装置101が番組情報である画像、音声および字幕を処理する際の基準とすべき27MHzのクロックであり、現在のシステム時間を示すカウント値を出力する。ストリーム取得部21およびメディアチップ25は、STC52が出力するカウント値に基づいて、画像、音声および字幕を処理する。
再生制御部53は、受付け部23から受けた処理命令に基づいて、映像出力装置101の動作を制御する。具体的には、再生制御部53は、受付け部23から再生命令を受けると、STC52のカウント値をたとえば再生開始位置に応じた値に設定する。そして、再生制御部53は、STC52を動作させることにより、番組情報が標準の速度で表示装置13に表示されるようにストリーム取得部21、字幕処理部24およびメディアチップ25を制御する再生処理を開始する。
また、再生制御部53は、語学学習モードにおいて、受付け部23からリピート命令を受けると、リピート処理を行う。具体的には、再生制御部53は、たとえば、リピートを開始すべきカウント値を示す頭出しカウント値に基づいてSTC52のカウント値を再設定することにより、番組情報の再生位置を戻す。
頭出しカウント値は、たとえば字幕処理部24から受けるカウント値である。再生制御部53は、たとえば、字幕処理部24から受ける頭出しカウント値を配列として保持する。頭出しカウント値の詳細については後述する。
また、再生制御部53は、語学学習モードの初級者モードにおいて、たとえば番組情報の再生を一時停止すべきカウント値であるポーズカウント値を字幕処理部24から受け、受けたポーズカウント値をたとえば配列として保持する。再生制御部53は、保持しているポーズカウント値に基づいてSTC52の動作を所定時間Tp停止する一時停止処理を行う。再生制御部53は、STC52の動作を停止している間、一時停止命令をメディアチップ25へ出力する。
番組選択部55は、受付け部23から受ける選択番組情報に含まれるユーザにより選択されたチャンネルまたは番組に基づいて、放送局からの電波に含まれる番組情報を識別するためのチャンネルIDまたは蓄積部12に蓄積された番組IDを特定する。番組選択部55は、特定したチャンネルIDまたは番組IDに基づいてストリーム取得部21を制御する。
図1に示すストリーム取得部21は、画像、音声および字幕、ならびに画像、音声および字幕を出力すべき出力タイミングをそれぞれ示す画像タイミング情報、音声タイミング情報および字幕タイミング情報を取得する。
より詳細には、ストリーム取得部21におけるストリーム受信部31は、番組選択部55による制御に従って、たとえば1または複数の番組の画像、音声および字幕等が多重化されたMPEG2−TS(Transport Stream)形式のTSストリームを含む電波をアンテナ11経由で受信し、受信した電波からTSストリームを生成する。なお、ストリーム受信部31は、たとえば、TTS(Timestamped TS)パケットをネットワーク経由で受信し、受信したTTSパケットからTSストリームを生成してもよい。ストリーム受信部31は、生成したTSストリームをストリーム解析部32へ出力する。
ここで、TSストリームについて説明する。TSストリームには複数のTSパケットが含まれる。各TSパケットのペイロードには、たとえばPES(Packetized Elementary Stream)の一部または全部が含まれる。
映像出力装置101において処理されるPESには、たとえば、画像を格納する画像PES、音声を格納する音声PESおよび字幕を格納する字幕PES等がある。画像PES、音声PESおよび字幕PESのペイロードには、符号化された、画像、音声および字幕がそれぞれ含まれる。PESのヘッダには、当該PESの識別子であるストリームID、および当該PESのペイロードに含まれる画像、音声または字幕を出力すべきタイミングを示すPTS(Presentation Time Stamp)等が含まれる。画像PES、音声PESおよび字幕PESの各々のヘッダにおけるPTSは、それぞれ画像タイミング情報、音声タイミング情報および字幕タイミング情報に相当する。
各TSパケットにおいて、ヘッダには、ペイロードに含まれる画像PES、音声PESおよび字幕PESに応じて異なる識別子すなわちPID(Packet Identification)が含まれる。
ストリーム解析部32は、ストリーム受信部31から受けたTSストリームをPSI(Program Specific Information)解析する。そして、ストリーム解析部32は、PSI解析結果とともに、TSストリームをストリーム処理部34へ出力する。
より詳細には、ストリーム解析部32は、TSストリームからPIDがゼロであるPAT(Program Association Table)パケットを取得する。そして、ストリーム解析部32は、取得したPATパケットから、TSストリームに含まれる1または複数の番組すなわち現在放送中である1または複数の番組の識別子であるチャンネルID、および各放送チャンネルの情報を含むPMT(Program Map Table)パケットのPID等のセクションデータを含むPATを生成する。
ストリーム解析部32は、PATを参照することにより、番組選択部55により特定されたチャンネルIDに対応するPMTパケットのPIDを取得する。ストリーム解析部32は、取得したPMTパケットのPIDを用いてTSストリームからPMTパケットを特定し、特定したPMTパケットからPMTを生成する。
PMTは、たとえばチャンネルIDごとすなわち番組ごとに生成される。PMTには、対応の番組についての画像PES、音声PESまたは字幕PESに応じたPIDが含まれる。ストリーム解析部32は、生成したPMTをストリーム処理部34および字幕処理部24におけるPID管理部41へ出力する。
読込部33は、たとえば、番組選択部55により特定された番組IDに対応するMPEG2−PS(Program Stream)形式のPSストリームを蓄積部12から読込む。PSストリームには、画像PES、音声PESおよび字幕PESが含まれる。読込部33は、PSストリームを蓄積部12から読込む際に、たとえば上記PSストリームに含まれる画像PES、音声PESおよび字幕PESを識別するためのストリームIDを蓄積部12から取得する。読込部33は、PSストリームをストリームIDとともにストリーム処理部34へ出力する。
ストリーム処理部34は、たとえばストリーム解析部32からのPMTに含まれるPIDを用いて、画像PESの一部または全部を含むTSパケット、および音声PESの一部または全部を含むTSパケットをTSストリームから取得する。そして、ストリーム処理部34は、取得したTSパケットから画像PESおよび音声PESを生成する。
また、ストリーム処理部34は、たとえば読込部33が取得したストリームIDを用いて、読込部33からのPSストリームから画像PESおよび音声PESを取得する。
なお、ストリーム処理部34は、たとえば画像PESおよび音声PESが暗号化されている場合、これらの画像PESおよび音声PESを復号する。
ストリーム処理部34は、画像PESおよび音声PESをメディアチップ25へ出力する。また、ストリーム処理部34は、PSストリームおよびストリームID、またはTSストリームをフィルタ処理部35へ出力する。
[通常再生モードにおける字幕処理]
字幕処理部24は、通常再生モードにおいて字幕表示オンに設定されている場合、字幕処理を行い、また、通常再生モードにおいて字幕表示オフに設定されている場合、字幕処理を行わない。なお、字幕処理部24は、動作モードが語学学習モードに設定されている場合、初級者モードまたは上級者モードの設定に関わらず字幕処理を行う。以下、通常再生モードにおいて字幕表示オンが設定されている場合における字幕処理について説明する。
字幕処理部24は、通常再生モードにおいて字幕表示オンに設定されている場合、字幕処理を行い、また、通常再生モードにおいて字幕表示オフに設定されている場合、字幕処理を行わない。なお、字幕処理部24は、動作モードが語学学習モードに設定されている場合、初級者モードまたは上級者モードの設定に関わらず字幕処理を行う。以下、通常再生モードにおいて字幕表示オンが設定されている場合における字幕処理について説明する。
字幕処理部24におけるPID管理部41は、たとえばストリーム解析部32から受けるPMTに基づいて、字幕PESの一部または全部を含むTSパケットを示すPIDを取得し、取得したPIDをフィルタ処理部35へ出力する。
フィルタ処理部35は、PID管理部41から受けたPIDに基づいて、ストリーム処理部34からのTSストリームから当該PIDをヘッダに含むTSパケットを取得し、取得したTSパケットから字幕PESを生成する。
また、フィルタ処理部35は、たとえば読込部33が取得したストリームIDに基づいて、ストリーム処理部34からのPSストリームから字幕PESを取得する。フィルタ処理部35は、字幕PESをPID管理部41へ出力する。なお、フィルタ処理部35は、たとえば字幕PESが暗号化されている場合は、字幕PESを復号する。
PID管理部41は、フィルタ処理部35から字幕PESを受けると、受けた字幕PESを字幕解析部42へ出力する。
字幕解析部42は、PID管理部41から受ける字幕PESのヘッダおよびペイロードからPTSおよび字幕管理情報をそれぞれ取得する。字幕管理情報には、たとえば字幕の内容を示すテキストデータすなわち文章、字幕の字体を示すフォントデータ、画面において字幕を表示すべき位置を示す位置情報(以下、表示領域ERとも称する)、および字幕表示を継続する時間を示すデュレーション時間等が含まれる。デュレーション時間は、PTSと同様に字幕タイミング情報に相当する。字幕解析部42は、通常再生モードに設定されている場合、たとえば取得したPTSおよび字幕管理情報を含む字幕情報を描画処理部43へ出力する。
描画処理部43は、拡張字幕表示オフに設定されている場合、字幕解析部42からの字幕情報に含まれる字幕管理情報に基づいて字幕プレーンを生成する。ここで、プレーンとは、字幕または画像等のモノメディアを表示するための論理上の表示画面である。字幕プレーンには、フォントデータにより指定されたフォントを用いて作成された文章が、表示領域ERにより指定された位置に字幕として描画される。描画処理部43は、生成した字幕プレーンと当該字幕情報に含まれるPTSおよびデュレーション時間とを対応付けてメディアチップ25へ出力する。拡張字幕表示オンに設定されている場合における字幕プレーンについては後述する。
[拡張字幕表示オフに設定されている場合における出力処理]
メディアチップ25は、たとえばCPUであり、LINUX(登録商標) OS等のライブラリを用いてストリーム処理部34から受ける画像PESおよび音声PESをデコードする。より詳細には、メディアチップ25は、ストリーム処理部34から受ける画像PESに含まれるPTSと制御部22からのSTC52のカウント値とがたとえば一致する画像出力タイミングに従って、当該PESに含まれる符号化された画像をデコードすることにより画像プレーンを生成し、生成した画像プレーンの映像信号を表示装置13へ出力する。
メディアチップ25は、たとえばCPUであり、LINUX(登録商標) OS等のライブラリを用いてストリーム処理部34から受ける画像PESおよび音声PESをデコードする。より詳細には、メディアチップ25は、ストリーム処理部34から受ける画像PESに含まれるPTSと制御部22からのSTC52のカウント値とがたとえば一致する画像出力タイミングに従って、当該PESに含まれる符号化された画像をデコードすることにより画像プレーンを生成し、生成した画像プレーンの映像信号を表示装置13へ出力する。
また、メディアチップ25は、たとえば字幕表示オンに設定されている場合、字幕処理部24から受けるPTS、デュレーション時間および対応の字幕プレーンに基づいて字幕を出力する。
具体的には、メディアチップ25は、PTSとSTC52のカウント値とが一致する字幕出力タイミングからデュレーション時間が経過するまで、字幕処理部24から受ける対応の字幕プレーンを画像プレーンに重ねた合成プレーンを生成し、生成した合成プレーンの映像信号を表示装置13へ出力する字幕出力処理を行う。
メディアチップ25は、たとえば制御部22から一時停止命令を受けた場合、一時停止命令を受けたタイミングにおける合成プレーンの映像信号の出力を、制御部22から一時停止命令を受けなくなるまで継続する。
なお、メディアチップ25は、たとえば字幕表示オフに設定されている場合、字幕出力処理を行わない。拡張字幕表示オンに設定されている場合における合成プレーンについては後述する。
メディアチップ25は、ストリーム処理部34から受ける音声PESに含まれるPTSとSTC52のカウント値とが一致する音声出力タイミングに従って、当該PESに含まれる符号化された音声をデコードすることにより音声信号を生成し、生成した音声信号を表示装置13へ出力する。
[語学学習モードにおける字幕処理]
以下、語学学習モードにおける字幕処理について説明する。PID管理部41、字幕解析部42および描画処理部43における処理は、通常再生モードにおける字幕処理と同様であるので詳細な説明は繰り返さない。
以下、語学学習モードにおける字幕処理について説明する。PID管理部41、字幕解析部42および描画処理部43における処理は、通常再生モードにおける字幕処理と同様であるので詳細な説明は繰り返さない。
字幕解析部42は、語学学習モードでは、たとえば取得したPTSおよび字幕管理情報を含む字幕情報を字幕情報書換部44へ出力する。
図3は、本発明の実施の形態に係る映像出力装置における字幕情報書換部の構成を示す図である。
図3を参照して、字幕情報書換部44は、字幕情報バッファ61と、字幕情報処理部62とを含む。字幕情報バッファ61は、先行字幕情報格納部63と、後続字幕情報格納部64とを含む。字幕情報処理部62は、タイマ65と、PTS差分算出部66と、字幕情報書換判断部67とを含む。
字幕情報書換部44は、字幕解析部42から字幕情報を受けると、受けた字幕情報をバッファ61に蓄積する。この際、字幕情報書換部44は、最も古い字幕情報を先行字幕情報として先行字幕情報格納部63に格納し、2番目以降に古い字幕情報を後続字幕情報格納部64に格納する。
字幕情報処理部62におけるPTS差分算出部66は、先行字幕情報格納部63に先行字幕情報が新たに格納されると、先行字幕情報に含まれるPTSを第1PTSとして取得するとともに、タイマ65を始動する。ここで、第1PTSは、後述する対応タイミングに相当する。
また、PTS差分算出部66は、先行字幕情報から生成される字幕に対応する頭出しカウント値として第1PTSを制御部22へ出力する。
タイマ65は、始動してから所定時間Tmax経過すると、タイマ満了通知を字幕情報書換判断部67へ出力する。
PTS差分算出部66は、先行字幕情報格納部63に先行字幕情報が格納された状態において、後続字幕情報格納部64に字幕情報が新たに格納されると、後続字幕情報格納部63において最も古い字幕情報すなわち先行字幕情報の次の字幕情報に含まれるPTSを第2PTSとして取得するとともに、タイマ65を停止する。ここで、第2PTSは、後述する次対応タイミングに相当する。
そして、PTS差分算出部66は、第2PTSから第1PTSを差し引いた値である差分PTSを字幕情報書換判断部67へ出力する。
字幕情報書換判断部67は、たとえば、差分PTSが大きいとき、先行字幕情報に含まれるPTSを第1PTSと第2PTSとの間の値に書き換える。
後に図9において具体的に説明するが、字幕情報書換判断部67は、たとえば、タイマ65からタイマ満了通知を受ける前にPTS差分算出部66から差分PTSを受けると、以下の処理を行う。すなわち、字幕情報書換判断部67は、たとえば、差分PTSが所定のカウント値Cmax以下である場合、先行字幕情報に含まれるPTSを第2PTSすなわち次の字幕情報に含まれるPTSに書換える。
ここで、カウント値Cmaxは、たとえば所定時間TmaxをSTC52におけるカウント値に換算した値である。
この際、字幕情報書換判断部67は、たとえば、先行字幕情報に含まれるデュレーション時間Td1が、次の字幕情報に含まれるデュレーション時間Td2以上である場合、デュレーション時間Td1をデュレーション時間Td2より短い時間に書き換える。
一方、字幕情報書換判断部67は、たとえば、差分PTSがカウント値Cmaxより大きい場合、先行字幕情報に含まれるPTSを、第1PTSにカウント値Cmaxを加算した値に書換える。
また、字幕情報書換判断部67は、たとえば、差分PTSよりタイマ満了通知を先に受ける場合、先行字幕情報に含まれるPTSを、第1PTSにカウント値Cmaxを加算した値に書換える。
字幕情報書換判断部67は、たとえば、内容が書き換えられた先行字幕情報に含まれるPTSに所定値を加えたカウント値をポーズカウント値として制御部22へ出力する。当該所定値は、たとえば、内容が書き換えられた先行字幕情報に含まれるデュレーション時間をSTC52におけるカウント値に換算した値より小さい値に設定される。そして、字幕情報書換判断部67は、内容が書き換えられた先行字幕情報を描画処理部43へ出力する。
なお、本発明の実施の形態に係る字幕情報書換判断部67は、差分PTSが所定のカウント値Cmax以下である場合、先行字幕情報に含まれるPTSを第2PTSすなわち次の字幕情報に含まれるPTSに書換える構成であるとしたが、これに限定するものではない。
字幕情報書換判断部67は、たとえば、先行字幕情報に対応する字幕を出力すべき期間Torgの終了に応答して、当該字幕の出力が開始されるように先行字幕情報に含まれるPTSを書換える構成であってもよい。
具体的には、字幕情報書換判断部67は、たとえば、先行字幕情報に含まれるデュレーション時間をSTC52におけるカウント値に換算した値に先行字幕情報に含まれるPTSを加えた値を期間Torgの終了タイミングとして算出する。字幕情報書換判断部67は、たとえば、先行字幕情報に含まれるPTSを算出した終了タイミングに書き換える。
字幕情報バッファ61では、内容が書き換えられた先行字幕情報が描画処理部43へ出力された後、後続字幕情報格納部64において最も古い字幕情報が新たな先行字幕情報として先行字幕情報格納部63に格納されるバッファ更新処理が行われる。
描画処理部43は、字幕情報書換判断部67からの字幕情報に含まれる字幕管理情報に基づいて字幕プレーンを生成し、生成した字幕プレーンと当該字幕情報に含まれるPTSおよびデュレーション時間とを対応付けてメディアチップ25へ出力する。
[拡張字幕表示オンに設定されている場合における出力処理]
図4は、本発明の実施の形態に係る映像出力装置が拡張字幕表示オンにおいて表示装置へ出力する画像、音声および字幕の一例を示す図である。
図4は、本発明の実施の形態に係る映像出力装置が拡張字幕表示オンにおいて表示装置へ出力する画像、音声および字幕の一例を示す図である。
図4を参照して、表示装置13は、たとえば、ディスプレイDPLと、スピーカSPとを含む。ディスプレイDPLは、たとえばコーナc1,c2,c3,c4により規定される画面SCRを有する。
メディアチップ25は、たとえば、コーナc1からコーナc1,c3間に位置する座標e2までの1辺と、コーナc1からコーナc1,c2間に位置する座標e1までの1辺とを、隣り合う2辺とする長方形または正方形で指定される領域Rsに画像を表示するための画像プレーンを生成する。
たとえば、画面SCRが4K解像度を有する場合、メディアチップ25は、HD(High Definition Video)規格の画像を、解像度を落とすことなく領域Rsに表示することが可能である。
描画処理部43は、たとえば、表示領域ERが示す位置と異なる位置に字幕を描画する。具体的には、描画処理部43は、画面SCRにおいて、たとえば、領域Rs以外の領域において字幕が描画された字幕プレーンを生成する。より詳細には、描画処理部43は、たとえば、領域Rsの右側の領域において字幕が表示された字幕プレーンを生成する。なお、描画処理部43は、たとえば、領域Rsの下側の領域において字幕が表示された字幕プレーンを生成してもよい。
また、描画処理部43は、語学学習モードでは、画面SCRにおいて、たとえば、領域Rs以外の領域において字幕の履歴を参照することが可能な字幕プレーンを生成する。
[動作]
図5は、本発明の実施の形態に係る映像出力装置が画像、音声および字幕を出力する際の動作手順を定めたフローチャートである。映像出力装置101は、コンピュータを備え、当該コンピュータにおけるCPU等の演算処理部は、以下のフローチャートの各ステップの一部または全部を含むプログラムを図示しないメモリから読み出して実行する。この装置のプログラムは、外部からインストールすることができる。この装置のプログラムは、記録媒体に格納された状態で流通する。
図5は、本発明の実施の形態に係る映像出力装置が画像、音声および字幕を出力する際の動作手順を定めたフローチャートである。映像出力装置101は、コンピュータを備え、当該コンピュータにおけるCPU等の演算処理部は、以下のフローチャートの各ステップの一部または全部を含むプログラムを図示しないメモリから読み出して実行する。この装置のプログラムは、外部からインストールすることができる。この装置のプログラムは、記録媒体に格納された状態で流通する。
図5を参照して、まず、映像出力装置101における制御部22は、受付け部23から再生命令を受けると、たとえばSTC52を動作させることにより、再生処理を開始する(ステップS100)。
次に、受付け部23がユーザによる操作を受付けていない場合(ステップS101でNO)、ストリーム取得部21は、TSストリームまたはPSストリームを取得し、取得したストリームから画像PES、音声PESおよび字幕PESを取得する(ステップS104)。
一方、受付け部23は、ユーザによる操作を受付けた場合(ステップS101でYES)、受付けたユーザの操作に応じて、モード変更命令、字幕表示命令、表示変更命令、字幕の一時表示命令およびリピート命令等を制御部22へ出力する。制御部22は、受付け部23から受けるモード変更命令、字幕表示命令および表示変更命令に応じて、通常再生モード、語学学習モードの初級者モード、または語学学習モードの上級者モードの設定、字幕表示オンまたは字幕表示オフの切り替え、および拡張字幕表示オンまたは拡張字幕表示オフの切り替えを行う(ステップS102)。
次に、ストリーム取得部21は、TSストリームまたはPSストリームを取得し、取得したストリームから画像PES、音声PESおよび字幕PESを取得する(ステップS104)。
次に、メディアチップ25は、ストリーム取得部21において取得された画像PESおよび音声PESをデコードすることにより、画像プレーンおよび音声信号をそれぞれ生成する(ステップS106)。
次に、字幕処理部24は、語学学習モードでない場合すなわち通常再生モードである場合であって、字幕表示オンである場合(ステップS108でNOおよびステップS110でYES)、ストリーム取得部21において取得された字幕PESを用いて字幕プレーンを生成する(ステップS112)。
次に、メディアチップ25は、画像プレーンに字幕プレーンを重ねた合成プレーンを生成する(ステップS114)。
次に、メディアチップ25は、生成した合成プレーンの映像信号、および音声信号を表示装置13へ出力する(ステップS116)。
一方、メディアチップ25は、通常再生モードである場合であって、字幕表示オフである場合(ステップS108でNOおよびステップS110でNO)、生成した画像プレーンの映像信号、および音声信号を表示装置13へ出力する(ステップS116)。
次に、受付け部23は、ユーザによる操作を受付けたか否かを判断する(ステップS101)。
また、字幕処理部24は、語学学習モードである場合(ステップS108でYES)、ストリーム取得部21において取得された字幕PESの字幕情報について書換処理を行う(ステップS118)。
ここで、映像出力装置101は、デフォルトでは、語学学習モードの初級者モードである場合、字幕表示オンに設定され、また、語学学習モードの上級者モードである場合、字幕表示オフに設定されている。
次に、字幕処理部24は、内容を書き換えた字幕情報を用いて、拡張字幕表示オンまたは拡張字幕表示オフの設定に応じた字幕プレーンを生成する(ステップS120)。
次に、メディアチップ25は、字幕表示オンである場合(ステップS122でYES)、拡張字幕表示オンまたは拡張字幕表示オフの設定に応じた、画像プレーンに字幕プレーンを重ねた合成プレーンを生成する(ステップS124)。
次に、メディアチップ25は、生成した合成プレーンの映像信号、および音声信号を表示装置13へ出力する(ステップS126)。
一方、メディアチップ25は、字幕表示オフである場合(ステップS122でNO)、生成した画像プレーンの映像信号および音声信号を表示装置13へ出力する(ステップS126)。
次に、映像出力装置101は、ユーザによる操作に応じた語学学習モード向け処理を行う(ステップS130)。
次に、受付け部23は、ユーザによる操作を受付けたか否かを判断する(ステップS101)。
図6は、本発明の実施の形態に係る制御部が画像、音声および字幕の出力制御を行う際の動作手順を定めたフローチャートである。
以下は、図5に示すステップS130におけるユーザによる操作に応じた語学学習モード向け処理の詳細な動作である。
図6を参照して、制御部22は、初級者モードである場合(ステップS202でYES)、一時停止処理を行う(ステップS204)。
次に、制御部22は、受付け部23からリピート命令を受けたか否かを判断する(ステップS210)。
一方、制御部22は、上級者モードである場合(ステップS202でNO)、受付け部23から字幕の一時表示命令を受けたか否かを判断する(ステップS206)。
次に、制御部22は、受付け部23から字幕の一時表示命令を受けていないと判断する場合(ステップS206でNO)、受付け部23からリピート命令を受けたか否かを判断する(ステップS210)。
一方、制御部22は、受付け部23から字幕の一時表示命令を受けたと判断する場合(ステップS206でYES)、たとえば所定時間字幕表示オフから字幕表示オンへ切り替える(ステップS208)。
次に、制御部22は、受付け部23からリピート命令を受けたか否かを判断する(ステップS210)。
次に、制御部22は、受付け部23からリピート命令を受けたと判断する場合(ステップS210でYES)、リピート処理を行う(ステップS212)。
次に、制御部22は、ユーザによる操作に応じた語学学習モード向け処理を終了する。
一方、制御部22は、受付け部23からリピート命令を受けていないと判断する場合(ステップS210でNO)、ユーザによる操作に応じた語学学習モード向け処理を終了する。
図7は、本発明の実施の形態に係る字幕処理部が字幕情報の書換を行う際の動作手順を定めたフローチャートである。
以下は、図5に示すステップS118における字幕情報書換処理の詳細な動作である。映像出力装置101は語学学習モードに設定されている。また、字幕処理部24における字幕情報書換部44は字幕を格納していない状況を想定する。
図7を参照して、まず、字幕情報書換部44は、ストリーム取得部21から受ける先行の字幕情報を字幕情報バッファ61に格納する(ステップS302)。
次に、字幕情報書換部44における字幕情報処理部62は、タイマ65を始動する(ステップS304)。この際、字幕情報処理部62は、先行の字幕情報に含まれるPTSを第1PTSとして取得する。
次に、字幕情報処理部62は、タイマ65が満了するまでストリーム取得部21からの次の字幕情報を待ち受け(ステップS306でNOおよびステップS308でNO)、次の字幕情報が字幕情報バッファ61に格納されないままタイマ65が満了すると(ステップS306でNOおよびステップS308でYES)、以下の処理を行う。
すなわち、字幕情報処理部62は、先行の字幕情報に含まれるPTSを、第1PTSにカウント値Cmaxを加算した値に書換える(ステップS310)。
一方、字幕情報処理部62は、タイマ65が満了する前に次の字幕情報が字幕情報バッファ61に格納されると(ステップS306でYES)、タイマ65を停止する(ステップS312)。この際、字幕情報処理部62は、次の字幕情報に含まれるPTSを第2PTSとして取得する。
次に、字幕情報処理部62は、第2PTSと第1PTSとの差である差分PTSを算出する(ステップS314)。
次に、字幕情報処理部62は、差分PTSがカウント値Cmaxより大きい場合(ステップS316でNO)、先行の字幕情報に含まれるPTSを、第1PTSにカウント値Cmaxを加算した値に書換える(ステップS310)。
一方、字幕情報処理部62は、差分PTSがカウント値Cmax以下である場合、先行の字幕情報に含まれるPTSを第2PTSに書換える(ステップS318)。
図8は、本発明の実施の形態に係る制御部がリピート処理を行う際の動作手順を定めたフローチャートである。
以下は、図6に示すステップS212におけるリピート処理の詳細な動作である。映像出力装置101は語学学習モードに設定されており、また、制御部22が、受付け部23からリピート命令を受けたと判断する状況を想定する。
図8を参照して、まず、制御部22は、STC52における現在のカウント値を取得する(ステップS402)。
次に、制御部22は、配列として保持する頭出しカウント値のうち、たとえば、現在のカウント値より小さい頭出しカウント値であって、現在のカウント値に最も近い頭出しカウント値を選択する(ステップS404)。
次に、制御部22は、選択した頭出しカウント値にSTC52のカウント値を再設定する(ステップS406)。
次に、制御部22は、STC52に再設定したカウント値から番組情報の再生処理を開始する(ステップS408)。この際、ストリーム取得部21は、制御部22により再設定されたカウント値に応じたストリームを取得する。
[字幕の出力タイミングを遅らせる場合の具体例]
図9は、本発明の実施の形態に係る映像出力装置が表示装置へ出力する画像、音声および字幕の出力タイミングの一例を示す図である。
図9は、本発明の実施の形態に係る映像出力装置が表示装置へ出力する画像、音声および字幕の出力タイミングの一例を示す図である。
図9を参照して、横軸は、システム時間すなわちSTC52のカウント値を示す。以下、表示装置13においてシーン1からシーン2が表示される状況を想定する。以下、シーン1,2の各々をシーンとも称する。なお、各シーンには、たとえば1または複数の画像が含まれる。各画像は、たとえば1または複数の画像PESから生成される。
音声A,Bの出力は、たとえばシーン1におけるカウント値cs1,cs2からそれぞれ開始される。音声C,D,Eの出力は、たとえばシーン2におけるカウント値cs5,cs6,cs7からそれぞれ開始される。以下、音声A〜Eの各々を音声とも称する。各音声は、1または複数の音声PESから生成される。
音声は、たとえば、シーンに関連する音である。具体的には、音声は、たとえば、シーンにおいて登場する人物の話し声および歌声等の人間が聞くことにより意味を理解することができる音である。また、音声は、たとえば、当該シーンを説明するためのナレーション等であってもよい。
音声は、英語および日本語等のいずれの言語であってもよい。また、1つの音声には、複数の人間により行われる会話が含まれてもよい。なお、映像出力装置101は、シーン1,2において音声A〜E以外にも、音楽および物音等の背景音を出力する。
通常再生モードにおいて、字幕A,Bの出力は、たとえばシーン1におけるカウント値cs1,cs2からそれぞれ開始される。字幕C,D,Eの出力は、たとえばシーン2におけるカウント値cs5,cs6,cs7からそれぞれ開始される。以下、字幕A〜Eの各々を字幕とも称する。
字幕は、音声に対応する文章を表す。具体的には、字幕は、たとえば音声が話し声であるときは、当該話し声の文章を表す。字幕は、たとえば音声が英語であるときは、英語の文章を表す。なお、字幕は、音声が英語であるときは、たとえば当該音声の意味を示す日本語の文章を表してもよい。
通常再生モードにおいて、字幕は、たとえば、音声に対応して出力すべき対応タイミングにおいて出力される。具体的には、たとえば、字幕Aは、音声Aの出力開始カウント値cs1から音声Aの出力終了カウント値cs1eまでの対応タイミングにおいて出力される。字幕B〜Dの各々についても同様に、音声B〜Eの出力開始カウント値cs2,cs5,cs6,cs7から音声B〜Eの出力終了カウント値cs2e,cs3e,cs4e,cs5eまでの各対応タイミングにおいてそれぞれ出力される。
なお、ここでは簡単のため、音声が出力されるタイミングと字幕が出力される対応タイミングとが一致しているとしたが、これに限定するものではない。音声が出力されるタイミングと字幕が出力される対応タイミングとが概ね一致していればよい。
たとえば、映像出力装置101のユーザは、英語のリスニング能力の向上を目的として番組情報を視聴する場合、通常再生モードでは、英語の音声を聞きながら表示装置13に表示された英文の字幕の文章を目で追うことになる。
英語の語学学習では、英語で話された音声を聞いた後、聞いた音声について文章で書き起こすディクテーションを行うことにより、リスニング能力の向上を図ることができるといわれている。実際には、聞いた音声を文章で書き起こす代わりに、たとえば頭の中で文章を組み立てることによっても、リスニング能力の向上に対する一定の効果が期待できる。このため、通常再生モードでは、ユーザは、英語のリスニング能力の向上を図ることが困難である。
一方、映像出力装置101の語学学習モードでは、字幕は、たとえば、音声に対応して出力すべき対応タイミングとは異なるタイミングにおいて出力される。たとえば、字幕は、通常再生モードにおける当該字幕の対応タイミングより後のタイミングにおいて出力される。具体的には、時間的に連続する2つの字幕について、後の字幕の対応タイミングである次対応タイミングに基づいて、前の字幕を出力する。
たとえば、図9に示すように、語学学習モードでは、通常再生モードにおける字幕Aは、字幕Bの対応タイミングすなわち次対応タイミングに基づいて、カウント値cs2から出力が開始される。
このような構成により、映像出力装置101のユーザは、英語の音声Aを聞き終わった後、音声Aについての字幕Aを見ることができるので、番組情報を視聴しながらディクテーションの訓練を行うことができる。これにより、ユーザは、英語のリスニング能力の向上を図ることができる。
また、映像出力装置101では、語学学習目的のために専用に制作したストリームを用意することなくディクテーションの訓練を行うことができるので、番組情報に要するコストを抑制し、かつ教材となる番組の選択の幅を広げることができる。
また、たとえば、図9に示すように、音声Bおよび音声Cがシーン1からシーン2への切り替わりの前後に位置する場合、音声Bの出力タイミングと音声Cの出力タイミングとの間隔が長くなるときがある。
字幕Cの対応タイミングの開始カウント値cs5と字幕Bの対応タイミングの開始カウント値cs2との差が図9に示すようにカウント値Cmaxより大きいとき、字幕Bは、語学学習モードにおいて、開始カウント値cs2からカウント値Cmaxを加えたカウント値cs4から出力される。
このような構成により、字幕Bが字幕Cの対応タイミングの開始カウント値cs5から出力される場合と比べて、音声Bを聞いてから字幕Bを見るまでの時間間隔をディクテーションの訓練として適正な時間間隔に近づけることができ、また、映像出力装置101のユーザが感じる違和感を低減することができる。
また、たとえば、字幕Cは、語学学習モードでは、字幕Dの対応タイミングに基づいて、カウント値cs6から出力が開始される。一方、図9に示すように、字幕Cが出力される期間Ccが、字幕Eの対応タイミングの始点であるカウント値cs7、とカウント値cs6との差より大きい場合、語学学習モードでは、字幕Cと字幕Dとが重複して出力されたり、字幕Dの出力タイミングが遅延したりするときがある。
これに対して、字幕処理部24は、たとえば、後の字幕の出力期間よりも短い期間、前の字幕を出力するように、前の字幕に対応する字幕管理情報におけるデュレーション時間を書き換える。
具体的には、字幕処理部24は、たとえば、字幕Cに対応する字幕管理情報におけるデュレーション時間を、字幕Dに対応する字幕管理情報におけるデュレーション時間以下に書き換える。
このような構成により、語学学習モードにおいて、字幕が重複して出力されたり、字幕の出力タイミングが遅延したりすることを抑制することができる。
[初級者モードにおける一時停止処理の具体例]
語学学習における初級者にとっては、番組情報の通常の再生速度が速すぎる場合がある。具体的には、初級者が字幕の文章を読み終わる前に次の字幕の文章が出力される場合、初級者にとってのディクテーションの訓練として好ましくない。
語学学習における初級者にとっては、番組情報の通常の再生速度が速すぎる場合がある。具体的には、初級者が字幕の文章を読み終わる前に次の字幕の文章が出力される場合、初級者にとってのディクテーションの訓練として好ましくない。
これに対して、映像出力装置101では、図9に示すように、語学学習モードにおける字幕A,B,C,Dの出力開始カウント値cs2,cs4,cs6,cs7の各々のカウント値に所定値が加えられたポーズカウント値csp1,csp2,csp3,csp4がそれぞれ設定される。
なお、ポーズカウント値csp1〜csp4の各々は、語学学習モードにおいて字幕A〜Dがそれぞれ出力される期間内であればいずれのカウント値でもよい。
制御部22は、たとえばSTC52のカウント値とポーズカウント値csp1〜csp4とが一致する各タイミングで一時停止処理を行う。
図10は、本発明の実施の形態に係る映像出力装置が表示装置へ出力する画像、音声および字幕の出力タイミングの一例を示す図である。
図10を参照して、横軸は、実時間を示す。たとえば、映像出力装置101において一時停止処理等の再生速度を変更する処理が行われると、システム時間が進む速度すなわちカウント値が増加する速度と実時間が進む速度とが異なる期間が生ずるので、カウント値と実時間とが比例しなくなる。
メディアチップ25は、図9に示すカウント値cs1すなわち実時間における時刻tr1において音声Aの出力を開始する。その後、メディアチップ25は、カウント値cs2すなわち実時間における時刻tr2において音声Bおよび字幕Aの出力を開始する。
そして、制御部22は、カウント値csp1すなわち実時間における時刻trp1において一時停止処理を開始する。この際、制御部22は、たとえばSTC52の動作を停止させ、一時停止命令をメディアチップ25へ出力する。これにより、メディアチップ25は、カウント値csp1において音声Bおよび音声Bに対応する画像の出力を中断する。そして、制御部22は、たとえば所定時間Tp経過後、STC52の動作を再開する。これにより、メディアチップ25は、中断した音声Bおよび音声Bに対応する画像の出力を再開する。字幕B〜Dについても字幕Aと同様である。
このような構成により、映像出力装置101のユーザは、英語の音声Aを聞き終わった後、音声Aについての字幕Aを所定時間Tp分長く見ることができるので、字幕Aの文章を読み終わる前に字幕Bの文章が出力されることを避けることができる。これにより、初級者にとって好ましいディクテーションの訓練を行うことができる。
なお、図10に示す場合、音声Bの出力が時刻tr2において開始された後、時刻trp1において一時停止処理が行われるため、音声Bが連続的に出力されない。このため、ユーザが音声Bを正しく聞き取ることが困難となる場合がある。
これに対して、字幕処理部24は、たとえば、字幕Aが音声Bより先に表示されるように字幕AのPTS300を設定し、かつ、字幕Aについての一時停止処理が完了した後音声Bが出力されるようなポーズカウント値C301を設定する。
上記の設定により、メディアチップ25がPTS300において字幕Aを出力した後、制御部22は、ポーズカウント値C301において一時停止処理を開始する。メディアチップ25は、ポーズカウント値C301において音声Bおよび音声Bに対応する画像の出力を保留する。そして、制御部22は、たとえば所定時間Tp経過後、STC52の動作を再開する。その後、メディアチップ25は、カウント値cs2において音声Bおよび音声Bに対応する画像の出力を行う。
このような構成により、字幕Aについての一時停止処理に起因して音声Bが途切れてしまうことを回避することができるので、ユーザが音声Bを正しく聞き取ることが困難となる状況を回避することができる。
なお、音声Bの出力が開始されるカウント値を把握することが困難である場合、字幕処理部24は、たとえば、所定の繰上げ値を用いて一時停止処理が早めに行われるように語学学習モードにおける字幕AのPTSおよび字幕Aのポーズカウント値を設定してもよい。
具体的には、字幕処理部24は、たとえば、通常再生モードにおける字幕BのPTSであるカウント値cs2から繰上げ値を減じた値を語学学習モードにおける字幕AのPTSに設定する。そして、字幕処理部24は、たとえば、設定した字幕AのPTSとカウント値cs2との間の値に字幕Aのポーズカウント値を設定する。
これにより、音声Bの出力が開始されるカウント値を把握することが困難である場合であっても、音声Bの出力が開始された後のタイミングで一時停止処理が行われてしまう可能性を低減することができるので、音声Bが途切れてしまうことを回避することができる。
[上級者モードにおける字幕表示オンへの切替処理の具体例]
上述したように、語学学習における上級者にとっては、字幕に頼ることなく番組情報のほとんどの音声についてディクテーションを行うことが可能であるが、字幕を確認したい状況が発生する場合がたまにある。たとえば、字幕を確認したい状況において字幕を確認しないままにしておくと、語学学習における自己の弱点を把握することができないのでディクテーションの訓練として好ましくない。
上述したように、語学学習における上級者にとっては、字幕に頼ることなく番組情報のほとんどの音声についてディクテーションを行うことが可能であるが、字幕を確認したい状況が発生する場合がたまにある。たとえば、字幕を確認したい状況において字幕を確認しないままにしておくと、語学学習における自己の弱点を把握することができないのでディクテーションの訓練として好ましくない。
図11は、本発明の実施の形態に係る映像出力装置が表示装置へ出力する画像、音声および字幕の出力タイミングの一例を示す図である。
図11を参照して、横軸は、システム時間すなわちSTC52のカウント値を示す。シーン1,2および音声A〜Eが出力されるタイミングは、図9に示す場合と同様である。
たとえば、映像出力装置101のユーザが、カウント値cs1から開始される音声Aを聞いたけれども、十分に聞き取れなかった状況を想定する。語学学習モードの上級者モードでは、デフォルトで字幕表示オフであるため、字幕Aの出力は、音声Bの対応タイミングであるカウント値cs2を経過しても開始されない。
たとえば、ユーザは、カウント値csr1において、字幕を一時表示させるための操作を受付け部23に対して行う。制御部22は、受付け部23から字幕の一時表示命令を受けた場合、カウント値csr1からカウント値csr1に所定のカウント値Ctempを加えたカウント値csr2まで字幕表示オフから字幕表示オンへ切替える。
このような構成により、カウント値csr1からカウント値csr2まで字幕AまたはBがメディアチップ25から出力されるので、ユーザは、十分に聞き取れなかった音声Aの内容について、字幕Aを見ることにより確認することができる。
また、語学学習モードでは、字幕表示オフに設定されている場合においても字幕処理部24において字幕処理が行われているので、ユーザの操作を受けてから字幕が出力されるまでのレスポンス期間を短くすることができ、ユーザの使用感を向上させることができる。
なお、Ctempが大きい場合、上記のように字幕Aに続いて字幕Bも出力することがある。したがって、制御部22は、たとえば、字幕Aの出力が完了するカウント値cs3から字幕Bの出力開始カウント値cs4までの間のいずれかのカウント値において字幕表示オンから字幕表示オフへ切替えてもよい。
[表示領域変更処理の具体例]
字幕管理情報に含まれる表示領域ERが指定する字幕の表示位置は、対応する画像において重要でない位置に設定される場合が多い。具体的には、たとえば、字幕Aに対応する画像を画像Aとする場合において、画像Aにおいて重要でない位置が下側であるとき、字幕Aに対応する字幕管理情報に含まれる表示領域ERAは、たとえば字幕Aの表示位置を画像Aの下側に指定する。
字幕管理情報に含まれる表示領域ERが指定する字幕の表示位置は、対応する画像において重要でない位置に設定される場合が多い。具体的には、たとえば、字幕Aに対応する画像を画像Aとする場合において、画像Aにおいて重要でない位置が下側であるとき、字幕Aに対応する字幕管理情報に含まれる表示領域ERAは、たとえば字幕Aの表示位置を画像Aの下側に指定する。
また、たとえば、字幕Bに対応する画像を画像Bとする場合において、画像Bにおいて重要でない位置が右側であるとき、字幕Bに対応する字幕管理情報に含まれる表示領域ERBは、たとえば字幕Bの表示位置を画像Bの右側に指定する。したがって、通常再生モードにおいて拡張字幕表示オフに設定されている場合、字幕Aは、画像Aの下側に重ねて描画され、また、字幕Bは、画像Bの右側に重ねて描画される。
一方、語学学習モードにおいて拡張字幕表示オフに設定されている場合、字幕Aは、表示領域ERAの指示に従って画像Bに重ねて描画されるため、字幕Aは、画像Bの下側に重ねて描画される。たとえば、画像Bの下側において重要な表示が行われる場合、字幕Aは、ユーザが画像Bの重要な表示を見ることを妨げてしまうので好ましくない。
再び図4を参照して、これに対して、字幕処理部24は、たとえば、領域Rsの右側の領域において、図9に示すシーン1〜2が領域Rsに描画された期間の字幕を履歴として参照可能なように字幕を描画する。具体的には、字幕処理部24は、たとえば、字幕Dの下に,字幕A〜Cを新しい順に描画する。
このような構成により、画像における重要な表示と字幕とが重なってしまうことを回避することができるので、画像における重要な表示が字幕により隠され、ユーザが重要な表示を見ることができなくなる状況を回避することができる。
なお、字幕処理部24は、たとえば、画像が描画される領域Rsの右側の領域に字幕を描画する構成であるとしたが、これに限定するものではない。字幕処理部24は、たとえば、画像が描画される領域Rs内に字幕を描画する構成であってもよい。
具体的には、字幕処理部24は、たとえば、次の字幕情報に含まれる表示領域ERの指示に従って、先行字幕情報に対応する字幕を描画する。上記の例では、字幕Aは、表示領域ERBの指示に従って、画像Bの右側に重ねて描画される。これにより、画像Bの下側における重要な表示を字幕Aが妨げてしまうことを回避することができる。
[リピート処理の具体例]
映像出力装置101のユーザが、語学学習モードにおいて、音声を十分に聞き取れなかった状況が発生する場合がある。当該音声を再度聞くためには、ユーザは、巻戻し処理を行う必要があるが、当該音声の頭出しに要する時間が長くなることがある。音声の頭出しに時間がかかると、ユーザの使用感を損ねてしまうため好ましくない。
映像出力装置101のユーザが、語学学習モードにおいて、音声を十分に聞き取れなかった状況が発生する場合がある。当該音声を再度聞くためには、ユーザは、巻戻し処理を行う必要があるが、当該音声の頭出しに要する時間が長くなることがある。音声の頭出しに時間がかかると、ユーザの使用感を損ねてしまうため好ましくない。
図12は、本発明の実施の形態に係る映像出力装置が表示装置へ出力する画像、音声および字幕の出力タイミングの一例を示す図である。
図12を参照して、横軸は、実時間を示す。たとえば、ユーザは、時刻tr1から開始される音声Aを聞いた後、時刻tr2から表示される字幕Aを見ながら音声Aを十分に聞き取れなかったことに気づき、時刻trm1すなわち図9に示すカウント値csm1において、音声をリピートするための操作を行う。
一方、制御部22は、時刻tr1において、たとえば頭出しカウント値として字幕処理部24から受けるカウント値cs1を配列に加える。そして、制御部22は、時刻trm1において、受付け部23からリピート命令を受けると、たとえば最新の頭出しカウント値cs1にSTC52のカウント値を再設定することにより、番組情報の再生位置を戻す。これにより、リピート処理に要する時間Twの経過後の時刻trm2から音声Aが再び出力された後、時刻trm52から字幕Aが再び出力される。
この際、制御部22は、音声Aおよび字幕Aに加えて、シーン1の対応する画像についてリピートしてもよい。
このように、字幕に対応する頭出しカウント値を用いて頭出しを行う構成により、字幕および対応する音声の単位で容易に巻き戻すことができるので、短時間で音声の頭出しを完了させることができる。これにより、映像出力装置101のユーザの使用感を損ねてしまうことを回避することができる。
なお、制御部22は、たとえばユーザの操作に応じた頭出しカウント値を配列として保持する頭出しカウント値から抽出することにより、2つ以上前の音声、具体的には音声Aより前の音声をリピートしてもよい。
また、本発明の実施の形態にかかる映像出力装置101は、画像タイミング情報、音声タイミング情報および字幕タイミング情報を含むストリームを処理する構成であるとしたが、これに限定するものではない。
映像出力装置101は、たとえば、字幕タイミング情報を含まないストリームを処理する構成であってもよい。具体的には、映像出力装置101は、たとえば、画像、音声および当該画像に対応付けられた字幕をストリームから取得し、当該画像を出力すべき出力タイミングに基づいて、当該字幕を出力すべき対応タイミングを設定する構成であってもよい。また、映像出力装置101は、たとえば、画像、音声および当該音声に対応付けられた字幕をストリームから取得し、当該音声を出力すべき出力タイミングに基づいて、当該字幕を出力すべき対応タイミングを設定する構成であってもよい。
また、映像出力装置101は、たとえば、音声タイミング情報を含まないストリームを処理する構成であってもよい。具体的には、映像出力装置101は、たとえば、画像、当該画像に対応付けられた音声および当該画像に対応付けられた字幕をストリームから取得し、当該画像を出力すべき出力タイミングに基づいて、当該音声を出力すべき出力タイミングおよび当該字幕を出力すべき対応タイミングを設定する構成であってもよい。
また、本発明の実施の形態にかかる映像出力装置101は、字幕を、画像または音声に対応して出力すべき対応タイミングとして字幕情報に含まれるPTSおよびデュレーション時間を用いる構成であるとしたが、これに限定するものではない。
映像出力装置101は、たとえば、字幕に対応する音声の出力期間を認識可能である場合、当該出力期間を対応タイミングとして用いる構成であってもよい。具体的には、たとえば、字幕に対応する音声の出力期間についての情報がストリームに含まれる場合、映像出力装置101は、当該出力期間を対応タイミングとして用いることが可能である。
この場合、字幕情報書換部44は、たとえば、字幕に対応する音声の出力期間の終了タイミングに応答して、当該音声に対応する字幕の出力が開始されるように当該字幕についてのPTSを書換える構成であってもよい。
再び図9を参照して、具体的には、字幕情報書換部44は、たとえば、字幕Aに対応する音声Aの出力期間の終了タイミングであるカウント値cs1eに応答して、字幕Aの出力が開始されるように語学学習モードにおける字幕AについてのPTSをカウント値cs1eに書換える構成であってもよい。音声B〜Eおよび字幕B〜Eについても、音声Aおよび字幕Aと同様である。
また、本発明の実施の形態にかかる映像出力装置101は、出力する音声の言語に対して、同じ言語の字幕を出力してもよいし、異なる言語の字幕を出力してもよい。具体的には、たとえば、ストリームに英語の音声と日本語および英語の字幕とが含まれている場合、映像出力装置101は、英語の音声を出力した後、当該音声を表す英語の文章の字幕を出力してもよいし、また、当該音声の翻訳を表す日本語の文章の字幕を出力してもよい。
また、本発明の実施の形態にかかる映像出力装置101は、対応タイミングより時間的に後のタイミングで字幕を出力する構成であるとしたが、これに限定するものではない。映像出力装置101は、たとえば、対応タイミングより時間的に前のタイミングで字幕を出力する構成であってもよい。
具体的には、字幕処理部24は、たとえば、連続する2つの字幕情報について、後の字幕情報に含まれるPTSを、前の字幕情報に含まれるPTSに書き換える。
このような構成により、映像出力装置101のユーザは、学習対象とする言語の字幕を見た後、当該字幕についての音声を聞くことができるので、番組情報を視聴しながら文章を読む訓練を行うことができる。これにより、ユーザは、上記言語のリーディング能力の向上を図ることができる。
ところで、非特許文献1に記載された語学番組情報では、ユーザが音声を聞き取るタイミングと字幕を見るタイミングとがほとんど同時であるため、ユーザは、音声を聞きながら字幕を目で追ってしまう。
この場合、ユーザの頭の中では、耳から入ってくる情報の処理と目から入ってくる情報の処理とが同時に行われるため、ユーザは、いずれの処理にも集中することができない。このため、リスニング能力を向上させるための訓練およびリーディング能力を向上させるための訓練を効果的に行うことができないという問題がある。
また、語学番組情報は、語学学習目的のために専用に制作されたストリームに記録される。このため、語学番組情報を購入するためのコストが発生し、また教材となる番組の選択の幅が制限されてしまう。
これに対して、本発明の実施の形態に係る映像出力装置では、ストリーム取得部21は、画像と、音声と、字幕と、画像を出力すべき出力タイミングを示す画像タイミング情報と、音声を出力すべき出力タイミングを示す音声タイミング情報とを取得する。メディアチップ25は、画像タイミング情報の示す出力タイミングおよび音声タイミング情報の示す出力タイミングに従って、ストリーム取得部21によって取得された画像および音声をそれぞれ出力する。そして、字幕処理部24およびメディアチップ25は、ストリーム取得部21によって取得された字幕を、画像または音声に対応して出力すべき対応タイミングとは異なるタイミングで出力する。
このような構成により、映像出力装置101のユーザが音声を聞き取るタイミングと字幕を見るタイミングとを異なるタイミングにすることができるので、ユーザが音声を聞くことまたは字幕を見ることのいずれかに集中することができる。
これにより、ユーザの頭の中では、耳から入ってくる情報の処理または目から入ってくる情報の処理のいずれかの処理に集中することができるので、リスニング能力およびリーディング能力を向上させるための訓練を効果的に行うことができる。
また、映像出力装置101では、語学学習目的のために専用に制作したストリームを用意することなくリスニング能力およびリーディング能力を向上させるための訓練を行うことができるので、番組情報に要するコストを抑制し、かつ教材となる番組の選択の幅を広げることができる。
一般に、語学学習では、学習対象とする言語で話された音声を聞いた後、聞いた音声について文章で書き起こすディクテーションを行うことにより、リスニング能力の向上を図ることができるといわれている。
しかしながら、非特許文献1に記載された語学番組情報では、音声と字幕とが時間的に並行して出力されるので、当該語学番組情報を用いてディクテーションを行うことが困難である。すなわち、ディクテーションによりリスニング能力の向上が図ることができない。
この問題に対して、本発明の実施の形態に係る映像出力装置では、字幕処理部24およびメディアチップ25は、対応タイミングより時間的に後のタイミングで字幕を出力する。
このような構成により、映像出力装置101のユーザは、学習対象とする言語で話された音声を聞き終わった後、当該音声についての字幕を見ることができるので、番組情報を視聴しながらディクテーションの訓練を行うことができる。これにより、ユーザは、上記言語のリスニング能力の向上を図ることができる。
また、本発明の実施の形態に係る映像出力装置では、字幕処理部24およびメディアチップ25は、時間的に連続する2つの字幕について、後の字幕の対応タイミングである次対応タイミングに基づいて、前の字幕を出力する。
このような構成により、前の字幕の対応タイミングにおいて出力される可能性が高い前の字幕に対応する音声、および次対応タイミングに基づいて出力される字幕が同時に出力される可能性を減ずることができるので、映像出力装置101のユーザの集中力が分散してしまうことを回避することができる。
また、本発明の実施の形態に係る映像出力装置では、字幕処理部24およびメディアチップ25は、後の字幕の出力期間よりも短い期間、前の字幕を出力する。
このような構成により、時間的に連続する2つの字幕について、前の字幕および後の字幕が同時に出力される可能性の低減、または後の字幕の出力タイミングの遅延の抑制を行うことができる。
また、本発明の実施の形態に係る映像出力装置では、字幕処理部24およびメディアチップ25は、前の字幕の対応タイミングと次対応タイミングとの間隔が大きいとき、次対応タイミングの代わりに、前の字幕の対応タイミングと次対応タイミングとの間のタイミングで前の字幕を出力する。
このような構成により、大幅に遅れた次対応タイミングにおいて前の字幕が出力される場合と比べて、前の字幕に対応する音声を聞いてから前の字幕を見るまでの時間間隔をディクテーションの訓練として適正な時間間隔に近づけることができ、また、映像出力装置101のユーザが感じる違和感を低減することができる。
また、本発明の実施の形態に係る映像出力装置では、字幕処理部24およびメディアチップ25は、字幕に対応する音声の出力期間の終了タイミングに応答して、音声に対応する字幕の出力を開始する。
このような構成により、字幕に対応する音声を聞いてから当該字幕を見るまでの時間間隔をディクテーションの訓練として適正な時間間隔に近づけることができる。
また、本発明の実施の形態に係る映像出力装置では、ストリーム取得部21は、さらに、字幕を出力すべき出力タイミングを示す字幕タイミング情報を取得する。字幕処理部24およびメディアチップ25は、字幕タイミング情報の示す字幕を出力すべき期間の終了に応答して、当該字幕の出力を開始する。
このように、字幕に対応する音声の出力期間と一致する可能性が高い上記期間に応答して、当該字幕の出力を開始する構成により、当該音声を聞いてから当該字幕を見るまでの時間間隔をディクテーションの訓練として適正な時間間隔に近づけることができる。
また、本発明の実施の形態に係る映像出力装置では、メディアチップ25は、時間的に連続する2つの画像および音声について、前の画像および前の音声を出力する。字幕処理部24およびメディアチップ25によって前の音声に対応する字幕が出力された後、メディアチップ25は、後の画像および後の音声の出力を保留または中断する。その後、メディアチップ25は、保留または中断した後の画像および後の音声の出力を行うか、または再開する。
このような構成により、映像出力装置101のユーザは、学習対象とする言語の音声を聞き終わった後、当該音声についての字幕をより長く見ることができるので、当該字幕の文章を読み終わる前に次の字幕の文章が出力されることを避けることができる。これにより、リスニング能力の低い初級者にとって好ましいディクテーションの訓練を行うことができる。
また、本発明の実施の形態に係る映像出力装置では、受付け部23は、字幕を表示するための字幕表示命令を受付ける。メディアチップ25は、受付け部23が字幕表示命令を受付けると、字幕を出力しない状態から字幕を出力する状態へ切替える。
このように、映像出力装置101のユーザによる操作に基づいて字幕が出力される構成により、ユーザは、内容を聞き取ることができた音声について字幕確認の作業を省略することができ、また、内容を聞き取ることができなかった音声については、字幕確認を行うことにより自己の弱点を把握することができる。これにより、リスニング能力の高い上級者にとって好ましいディクテーションの訓練を行うことができる。
また、本発明の実施の形態に係る映像出力装置では、ストリーム取得部21は、字幕を表示すべき位置を示す位置情報を取得する。字幕処理部24およびメディアチップ25は、ストリーム取得部21により取得された位置情報が示す位置と異なる位置に字幕を出力する。
このような構成により、画像における重要な表示と字幕とが重なってしまう可能性を減ずることができるので、画像における重要な表示が字幕により隠され、映像出力装置101のユーザが重要な表示を見ることができなくなる状況を回避することができる。
また、本発明の実施の形態に係る映像出力装置では、受付け部23は、音声および音声に対応する字幕をリピートするためのリピート命令を受付ける。メディアチップ25は、受付け部23がリピート命令を命令受付タイミングで受付けると、命令受付タイミングより前に出力された音声を再び出力する。そして、字幕処理部24およびメディアチップ25は、当該音声に対応する字幕を、当該音声に対応して出力すべき対応タイミングとは異なるタイミングで再び出力する。
このような構成により、映像出力装置101のユーザは、反復練習を行うことができるので、リスニング能力およびリーディング能力を向上させるための訓練をより効果的に行うことができる。
なお、本発明の実施の形態に係る映像出力装置は、MPEG2−TS規格またはMPEG2−PS規格に従うストリームを取得する構成であるとしたが、これに限定するものではない。映像出力装置は、他の規格に従うストリームを取得する構成であってもよい。
上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記説明ではなく特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
以上の説明は、以下に付記する特徴を含む。
[付記1]
画像、前記画像に関連する音声、および前記音声に関連する字幕を出力可能な映像出力装置であって、
前記画像と、前記音声と、前記字幕と、前記画像を出力すべき出力タイミングを示す画像タイミング情報と、前記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得する番組情報取得部と、
前記画像タイミング情報の示す前記出力タイミングおよび前記音声タイミング情報の示す前記出力タイミングに従って、前記番組情報取得部によって取得された前記画像および前記音声をそれぞれ出力する映像出力部と、
前記番組情報取得部によって取得された前記字幕を、前記画像または前記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力する字幕出力部とを備え、
前記番組情報取得部は、MPEG2−TS形式またはMPEG2−PS形式のストリームから前記画像と、前記音声と、前記字幕と、前記画像を出力すべき出力タイミングを示す画像タイミング情報と、前記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得し、
前記画像タイミング情報および前記音声タイミング情報はPTSであり、
前記画像または前記音声に対応して出力すべき対応タイミングは、前記画像または前記音声に対応する前記字幕のPTSおよびデュレーション時間であり、
前記字幕出力部は、前記字幕を、前記字幕の次の字幕の前記対応タイミングに基づいて出力する、映像出力装置。
画像、前記画像に関連する音声、および前記音声に関連する字幕を出力可能な映像出力装置であって、
前記画像と、前記音声と、前記字幕と、前記画像を出力すべき出力タイミングを示す画像タイミング情報と、前記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得する番組情報取得部と、
前記画像タイミング情報の示す前記出力タイミングおよび前記音声タイミング情報の示す前記出力タイミングに従って、前記番組情報取得部によって取得された前記画像および前記音声をそれぞれ出力する映像出力部と、
前記番組情報取得部によって取得された前記字幕を、前記画像または前記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力する字幕出力部とを備え、
前記番組情報取得部は、MPEG2−TS形式またはMPEG2−PS形式のストリームから前記画像と、前記音声と、前記字幕と、前記画像を出力すべき出力タイミングを示す画像タイミング情報と、前記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得し、
前記画像タイミング情報および前記音声タイミング情報はPTSであり、
前記画像または前記音声に対応して出力すべき対応タイミングは、前記画像または前記音声に対応する前記字幕のPTSおよびデュレーション時間であり、
前記字幕出力部は、前記字幕を、前記字幕の次の字幕の前記対応タイミングに基づいて出力する、映像出力装置。
11 アンテナ
12 蓄積部
13 表示装置
21 ストリーム取得部(番組情報取得部)
22 制御部
23 受付け部
24 字幕処理部(字幕出力部)
25 メディアチップ(映像出力部および字幕出力部)
31 ストリーム受信部
32 ストリーム解析部
33 読込部
34 ストリーム処理部
35 フィルタ処理部
41 PID管理部
42 字幕解析部
43 描画処理部
44 字幕情報書換部
51 動作モード設定部
52 STC
53 再生制御部
54 字幕表示切替部
55 番組選択部
61 字幕情報バッファ
62 字幕情報処理部
63 先行字幕情報格納部
64 後続字幕情報格納部
65 タイマ
66 PTS差分算出部
67 字幕情報書換判断部
101 映像出力装置
201 映像出力システム
12 蓄積部
13 表示装置
21 ストリーム取得部(番組情報取得部)
22 制御部
23 受付け部
24 字幕処理部(字幕出力部)
25 メディアチップ(映像出力部および字幕出力部)
31 ストリーム受信部
32 ストリーム解析部
33 読込部
34 ストリーム処理部
35 フィルタ処理部
41 PID管理部
42 字幕解析部
43 描画処理部
44 字幕情報書換部
51 動作モード設定部
52 STC
53 再生制御部
54 字幕表示切替部
55 番組選択部
61 字幕情報バッファ
62 字幕情報処理部
63 先行字幕情報格納部
64 後続字幕情報格納部
65 タイマ
66 PTS差分算出部
67 字幕情報書換判断部
101 映像出力装置
201 映像出力システム
Claims (13)
- 画像、前記画像に関連する音声、および前記音声に関連する字幕を出力可能な映像出力装置であって、
前記画像と、前記音声と、前記字幕と、前記画像を出力すべき出力タイミングを示す画像タイミング情報と、前記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得する番組情報取得部と、
前記画像タイミング情報の示す前記出力タイミングおよび前記音声タイミング情報の示す前記出力タイミングに従って、前記番組情報取得部によって取得された前記画像および前記音声をそれぞれ出力する映像出力部と、
前記番組情報取得部によって取得された前記字幕を、前記画像または前記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力する字幕出力部とを備える、映像出力装置。 - 前記字幕出力部は、前記対応タイミングより時間的に後のタイミングで前記字幕を出力する、請求項1に記載の映像出力装置。
- 前記字幕出力部は、時間的に連続する2つの前記字幕について、後の前記字幕の前記対応タイミングである次対応タイミングに基づいて、前の前記字幕を出力する、請求項2に記載の映像出力装置。
- 前記字幕出力部は、前記後の字幕の出力期間よりも短い期間、前記前の字幕を出力する、請求項3に記載の映像出力装置。
- 前記字幕出力部は、前記前の字幕の前記対応タイミングと前記次対応タイミングとの間隔が大きいとき、前記次対応タイミングの代わりに、前記前の字幕の前記対応タイミングと前記次対応タイミングとの間のタイミングで前記前の字幕を出力する、請求項3または請求項4に記載の映像出力装置。
- 前記字幕出力部は、前記字幕に対応する前記音声の出力期間の終了タイミングに応答して、前記音声に対応する前記字幕の出力を開始する、請求項1から請求項5のいずれか1項に記載の映像出力装置。
- 前記番組情報取得部は、さらに、前記字幕を出力すべき出力タイミングを示す字幕タイミング情報を取得し、
前記字幕出力部は、前記字幕タイミング情報の示す前記字幕を出力すべき期間の終了に応答して、前記字幕の出力を開始する、請求項1から請求項5のいずれか1項に記載の映像出力装置。 - 前記映像出力部は、時間的に連続する2つの前記画像および前記音声について、前の前記画像および前の前記音声を出力し、前記字幕出力部によって前記前の音声に対応する前記字幕が出力された後、後の前記画像および後の前記音声の出力を保留または中断し、その後、保留または中断した前記後の画像および前記後の音声の出力を行うか、または再開する、請求項1から請求項5のいずれか1項に記載の映像出力装置。
- 前記映像出力装置は、さらに、
前記字幕を表示するための字幕表示命令を受付ける受付け部を備え、
前記字幕出力部は、前記受付け部が前記字幕表示命令を受付けると、前記字幕を出力しない状態から前記字幕を出力する状態へ切替える、請求項1から請求項8のいずれか1項に記載の映像出力装置。 - 前記番組情報取得部は、前記字幕を表示すべき位置を示す位置情報を取得し、
前記字幕出力部は、前記番組情報取得部により取得された前記位置情報が示す位置と異なる位置に前記字幕を出力する、請求項1から請求項9のいずれか1項に記載の映像出力装置。 - 前記映像出力装置は、さらに、
前記音声および前記音声に対応する字幕をリピートするためのリピート命令を受付ける受付け部を備え、
前記映像出力部は、前記受付け部が前記リピート命令を命令受付タイミングで受付けると、前記命令受付タイミングより前に出力された前記音声を再び出力し、
前記字幕出力部は、前記音声に対応する前記字幕を、前記音声に対応して出力すべき対応タイミングとは異なるタイミングで再び出力する、請求項1から請求項10のいずれか1項に記載の映像出力装置。 - 画像、前記画像に関連する音声、および前記音声に関連する字幕を出力可能な映像出力装置における映像出力方法であって、
前記画像と、前記音声と、前記字幕と、前記画像を出力すべき出力タイミングを示す画像タイミング情報と、前記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得するステップと、
前記画像タイミング情報の示す前記出力タイミングおよび前記音声タイミング情報の示す前記出力タイミングに従って、取得した前記画像および前記音声をそれぞれ出力するステップと、
取得した前記字幕を、前記画像または前記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力するステップとを含む、映像出力方法。 - 画像、前記画像に関連する音声、および前記音声に関連する字幕を出力可能な映像出力装置において用いられる映像出力プログラムであって、
コンピュータに、
前記画像と、前記音声と、前記字幕と、前記画像を出力すべき出力タイミングを示す画像タイミング情報と、前記音声を出力すべき出力タイミングを示す音声タイミング情報とを取得するステップと、
前記画像タイミング情報の示す前記出力タイミングおよび前記音声タイミング情報の示す前記出力タイミングに従って、取得した前記画像および前記音声をそれぞれ出力するステップと、
取得した前記字幕を、前記画像または前記音声に対応して出力すべき対応タイミングとは異なるタイミングで出力するステップとを実行させるための、映像出力プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013197886A JP2015065556A (ja) | 2013-09-25 | 2013-09-25 | 映像出力装置、映像出力方法および映像出力プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013197886A JP2015065556A (ja) | 2013-09-25 | 2013-09-25 | 映像出力装置、映像出力方法および映像出力プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015065556A true JP2015065556A (ja) | 2015-04-09 |
Family
ID=52833087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013197886A Pending JP2015065556A (ja) | 2013-09-25 | 2013-09-25 | 映像出力装置、映像出力方法および映像出力プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015065556A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108235115A (zh) * | 2017-12-13 | 2018-06-29 | 福州星网视易信息系统有限公司 | 一种歌曲视频中人声区域定位的方法及终端 |
-
2013
- 2013-09-25 JP JP2013197886A patent/JP2015065556A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108235115A (zh) * | 2017-12-13 | 2018-06-29 | 福州星网视易信息系统有限公司 | 一种歌曲视频中人声区域定位的方法及终端 |
CN108235115B (zh) * | 2017-12-13 | 2020-06-05 | 福州星网视易信息系统有限公司 | 一种歌曲视频中人声区域定位的方法及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4170808B2 (ja) | 情報表示装置、情報表示方法及びプログラム | |
JP4128916B2 (ja) | 字幕制御装置および方法ならびにプログラム | |
US20050180462A1 (en) | Apparatus and method for reproducing ancillary data in synchronization with an audio signal | |
JP2008546016A (ja) | マルチメディア信号で自動的なダビングを実行する方法及び装置 | |
KR101161702B1 (ko) | 오디오 비디오 데이터 스트림의 자막을 네비게이팅하는 방법 및 장치 | |
TW201926999A (zh) | 音視頻播放系統及應用於其上的音訊資料的播放方法 | |
JP2007027846A (ja) | 動画再生システム及び動画再生方法 | |
JP2017507560A (ja) | 2つの電子デバイスにおいて再生を同期させるための方法及び装置 | |
JP2007336593A (ja) | 情報表示装置、情報表示方法及びプログラム | |
JP2008299032A (ja) | 語学教材および文字データ再生装置 | |
JP2010206265A (ja) | 音像制御装置、音像制御方法、ストリームのデータ構造、及びストリーム生成装置 | |
JP2010166322A (ja) | 映像視聴装置及び映像再生制御方法及び記録再生用プログラム | |
KR20170009295A (ko) | 동영상 제공 장치, 동영상 제공 방법, 및 컴퓨터 프로그램 | |
JP2005124169A (ja) | 吹き出し字幕付き映像コンテンツ作成装置、送信装置、再生装置、提供システムならびにそれらで用いられるデータ構造および記録媒体 | |
KR20160093404A (ko) | 캐릭터 선택적 오디오 줌인을 제공하는 멀티미디어 콘텐츠 서비스 방법 및 장치 | |
JP2015065556A (ja) | 映像出力装置、映像出力方法および映像出力プログラム | |
US20090106811A1 (en) | Information processing apparatus, information processing method, program, and recording medium on which such program is recorded | |
JP2002229440A (ja) | Dvdビデオを使用した外国語学習用システム | |
JP2007163801A (ja) | コンテンツ再生装置 | |
TWI271704B (en) | A control method and device capable of playing digital multimedia content according to corresponding time of a caption | |
JP2007174074A (ja) | 再生装置 | |
JP4105975B2 (ja) | 映像音声再生装置 | |
JP2007134859A (ja) | 映像音声再生装置 | |
JP2003018534A (ja) | 再生装置および方法、記録媒体、並びにプログラム | |
JP4850123B2 (ja) | 画像データ処理装置 |