WO2013038636A1 - 表示装置及び録画再生装置 - Google Patents
表示装置及び録画再生装置 Download PDFInfo
- Publication number
- WO2013038636A1 WO2013038636A1 PCT/JP2012/005705 JP2012005705W WO2013038636A1 WO 2013038636 A1 WO2013038636 A1 WO 2013038636A1 JP 2012005705 W JP2012005705 W JP 2012005705W WO 2013038636 A1 WO2013038636 A1 WO 2013038636A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- audio
- data
- video
- reading data
- stream
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
- H04N9/8233—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a character code signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/4302—Content synchronisation processes, e.g. decoder synchronisation
- H04N21/4307—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
- H04N21/43074—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of additional data with content streams on the same device, e.g. of EPG data or interactive icon with a TV program
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/432—Content retrieval operation from a local storage medium, e.g. hard-disk
- H04N21/4325—Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
放送ストリームを分離するデコーダ(1)と、映像/音声ストリームを保存するストレージ(2)と、音声読みデータを生成する音声読みデータ生成部(4)と、字幕読みデータを生成する字幕読みデータ生成部(5)と、音声読みデータに対する字幕読みデータの遅延時間を検出する遅延時間検出部(6)と、映像/音声ストリームから映像/音声データを生成し、遅延時間が検出された文章における映像/音声データの再生を遅延時間よりも長く遅延させる映像音声デコーダ(7)と、遅延させた映像データに字幕データを同期させて合成する映像合成部(8)とを備えている。
Description
本発明は、表示装置及び録画再生装置に関し、特に、字幕放送を視聴するための表示装置及び録画再生装置に関するものである。
近年、地上デジタル放送やBS(broadcasting satellite)デジタル放送では、多くの番組において、字幕付きの放送(字幕放送)を行っているので、ユーザーは、字幕の表示の有無を自由に切り替えて、視聴することができる。
ところで、ドラマなどの収録及び編集済みの番組では、字幕を予め準備することができるので、映像及び音声と字幕との同期が取れているものの、ニュースなどのライブの番組では、音声認識装置や手作業により字幕を作成しながら放送するので、映像及び音声に対して、字幕が遅延する場合がある。
例えば、特許文献1には、映像音声信号遅延手段により、映像音声を、放送信号で送られてくる遅延時間情報で示された遅延時間分送らせることで、映像音声と字幕との出力時間差を調整し、信号重畳手段で、その遅延された映像音声に字幕を重畳させて出力する字幕放送受信装置が開示されている。
しかしながら、特許文献1に開示された字幕放送受信装置では、放送局側が遅延時間の情報を付加して字幕放送を送信する必要があるので、字幕の遅延に対して、全ての放送局が対応することができるとは限らない。
本発明は、かかる点に鑑みてなされたものであり、その目的とするところは、映像及び音声と字幕とを確実に同期させることにある。
上記目的を達成するために、本発明は、装置内で字幕の遅延を検出して、その遅延時間よりも長く映像及び音声の再生を遅延させ、映像及び音声に字幕を同期させるようにしたものである。
具体的に本発明に係る表示装置は、放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離するデコーダと、上記映像ストリーム及び音声ストリームを保存するストレージと、上記音声ストリームから音声データを生成する音声デコーダと、上記音声データから音声読みデータを生成する音声読みデータ生成部と、上記字幕データから字幕読みデータを生成する字幕読みデータ生成部と、上記音声読みデータ及び字幕読みデータにおいて、互いに一致する文章を検索し、該文章における音声読みデータに対する字幕読みデータの遅延時間を検出する遅延時間検出部と、上記ストレージに保存された映像ストリーム及び音声ストリームから映像データ及び音声データをそれぞれ生成し、上記遅延時間が検出された文章における該映像データ及び音声データの再生を上記遅延時間よりも長くそれぞれ遅延させる映像音声デコーダと、上記映像音声デコーダで遅延させた映像データに上記字幕データを同期させて合成する映像合成部と、上記映像合成部で合成された映像データを表示する映像表示部と、上記映像音声デコーダで遅延させた音声データを出力する音声出力部とを備えている。
上記の構成によれば、デコーダで放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離し、音声デコーダで音声ストリームから音声データを生成し、遅延時間検出部では、音声読みデータ生成部で音声データから生成された音声読みデータ、及び字幕読みデータ生成部で字幕データから生成された字幕読みデータにおいて、互いに一致する文章を検索し、その文章における音声読みデータに対する字幕読みデータの遅延時間を検出するので、映像及び音声に対する字幕の遅延が装置内で検出される。そして、映像音声デコーダでは、遅延時間が検出された文章における映像データ及び音声データの再生を遅延時間検出部で検出された遅延時間よりも長くそれぞれ遅延させると共に、映像合成部において、映像音声デコーダで遅延させた映像データに字幕データを同期させて合成するので、映像表示部で表示される映像データ、及び音声出力部で出力される音声データに字幕データが同期することになる。これにより、装置内で字幕の遅延を検出して、その遅延時間よりも長く映像及び音声の再生を遅延させ、映像及び音声に字幕を同期させているので、放送局での対応に影響されることなく、映像及び音声と字幕とが確実に同期される。
上記字幕読みデータ生成部は、漢字を仮名に変換するように構成されていてもよい。
上記の構成によれば、字幕読みデータ生成部が漢字を仮名に変換するように構成されているので、漢字混じりの字幕から仮名だけの字幕読みデータが具体的に生成される。
上記遅延時間検出部は、上記音声読みデータ及び字幕読みデータにおける文章の一致を前方一致で検索するように構成されていてもよい。
上記の構成によれば、遅延時間検出部が音声読みデータ及び字幕読みデータにおける文章の一致を前方一致で検索するように構成されているので、音声読みデータ及び字幕読みデータにおける文章の一致を検索する作業が軽減される。
上記映像表示部は、液晶表示モジュールであってもよい。
上記の構成によれば、映像表示部が液晶表示モジュールであるので、表示装置として、液晶テレビが具体的に構成される。
また、本発明に係る録画再生装置は、放送ストリームを保存するストレージと、上記ストレージに保存された放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離するデコーダと、上記音声ストリームから音声データを生成する音声デコーダと、上記音声データから音声読みデータを生成する音声読みデータ生成部と、上記字幕データから字幕読みデータを生成する字幕読みデータ生成部と、上記音声読みデータ及び字幕読みデータにおいて、互いに一致する文章を検索し、該文章における音声読みデータに対する字幕読みデータの遅延時間を検出する遅延時間検出部と、上記映像ストリーム及び音声ストリームから映像データ及び音声データをそれぞれ生成し、上記遅延時間が検出された文章における該映像データ及び音声データの再生を上記遅延時間よりも長くそれぞれ遅延させる映像音声デコーダと、上記映像音声デコーダで遅延させた映像データに上記字幕データを同期させて合成する映像合成部と、上記映像合成部で合成された映像データを出力するための映像出力ポートと、上記映像音声デコーダで遅延させた音声データを出力するための音声出力ポートとを備えている。
上記の構成によれば、デコーダでストレージに保存された放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離し、音声デコーダで音声ストリームから音声データを生成し、遅延時間検出部では、音声読みデータ生成部で音声データから生成された音声読みデータ、及び字幕読みデータ生成部で字幕データから生成された字幕読みデータにおいて、互いに一致する文章を検索し、その文章における音声読みデータに対する字幕読みデータの遅延時間を検出するので、映像及び音声に対する字幕の遅延が装置内で検出される。そして、映像音声デコーダでは、遅延時間が検出された文章における映像データ及び音声データの再生を遅延時間検出部で検出された遅延時間よりも長くそれぞれ遅延させると共に、映像合成部において、映像音声デコーダで遅延させた映像データに字幕データを同期させて合成するので、映像出力ポートから出力される映像データ、及び音声出力ポートから出力される音声データに字幕データが同期することになる。これにより、装置内で字幕の遅延を検出して、その遅延時間よりも長く映像及び音声の再生を遅延させ、映像及び音声に字幕を同期させているので、放送局での対応に影響されることなく、映像及び音声と字幕とが確実に同期される。
また、本発明に係る録画再生装置は、放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離するデコーダと、上記音声ストリームから音声データを生成する音声デコーダと、上記音声データから音声読みデータを生成する音声読みデータ生成部と、上記字幕データから字幕読みデータを生成する字幕読みデータ生成部と、上記音声読みデータ及び字幕読みデータにおいて、互いに一致する文章を検索し、該文章における音声読みデータに対する字幕読みデータの遅延時間を検出する遅延時間検出部と、上記映像ストリーム及び音声ストリームを上記遅延時間が検出された文章における該映像ストリーム及び音声ストリームの再生が上記遅延時間よりも長くそれぞれ遅延し、上記字幕データが該映像ストリーム及び音声ストリームに同期するように保存するストレージと、上記ストレージに保存された映像ストリーム及び音声ストリームを再生する映像音声再生部とを備えている。
上記の構成によれば、デコーダで放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離し、音声デコーダで音声ストリームから音声データを生成し、遅延時間検出部では、音声読みデータ生成部で音声データから生成された音声読みデータ、及び字幕読みデータ生成部で字幕データから生成された字幕読みデータにおいて、互いに一致する文章を検索し、その文章における音声読みデータに対する字幕読みデータの遅延時間を検出するので、映像及び音声に対する字幕の遅延が装置内で検出される。そして、ストレージでは、遅延時間が検出された文章における映像ストリーム及び音声ストリームの再生が遅延時間検出部で検出された遅延時間よりも長くそれぞれ遅延し、字幕データが映像ストリーム及び音声ストリームに同期するように保存されるので、ストレージで保存された映像ストリーム及び音声ストリームを再生する映像音声再生部では、映像及び音声に字幕が同期して再生される。これにより、装置内で字幕の遅延を検出して、その遅延時間よりも長く映像及び音声の再生を遅延させ、映像及び音声に字幕を同期させているので、放送局での対応に影響されることなく、映像及び音声と字幕とが確実に同期される。
本発明によれば、装置内で字幕の遅延を検出して、その遅延時間よりも長く映像及び音声の再生を遅延させ、映像及び音声に字幕を同期させているので、映像及び音声と字幕とを確実に同期させることができる。
以下、本発明の実施形態を図面に基づいて詳細に説明する。なお、本発明は、以下の各実施形態に限定されるものではない。
《発明の実施形態1》
図1は、本実施形態の液晶テレビ30のブロック図である。また、図2は、液晶テレビ30による字幕を同期させる手順を示す説明図である。また、図3は、液晶テレビ30を構成する音声読みデータ生成部4に入力される音声データを時間軸上に示すタイムテーブルである。また、図4は、液晶テレビ30の表示画面を示す説明図である。
図1は、本実施形態の液晶テレビ30のブロック図である。また、図2は、液晶テレビ30による字幕を同期させる手順を示す説明図である。また、図3は、液晶テレビ30を構成する音声読みデータ生成部4に入力される音声データを時間軸上に示すタイムテーブルである。また、図4は、液晶テレビ30の表示画面を示す説明図である。
液晶テレビ30は、図1に示すように、互いに連関するように設けられたデコーダ1、ストレージ2、音声デコーダ3、音声読みデータ生成部4、字幕読みデータ生成部5、遅延時間検出部6、映像音声デコーダ7、映像合成部8、液晶モジュール9及びスピーカー10を備えている。
デコーダ1は、図1に示すように、放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離するように設けられている。
ストレージ2は、図1に示すように、デコーダ1で分離された映像ストリーム、及びデコーダ1で分離された後に2つに分けられた一方の音声ストリームを保存するように設けられている。また、ストレージ2は、字幕の遅延時間よりも十分に長い時間の映像ストリーム及び音声ストリームを保存するための保存容量を有しており、例えば、ハードディスクやフラッシュメモリなどにより構成されている。
音声デコーダ3は、図1に示すように、デコーダ1で分離された後に2つに分けられた他方の音声ストリームから音声データを生成するように設けられている。
音声読みデータ生成部4は、図1に示すように、音声デコーダ3で生成された音声データから音声読みデータを生成して、音声読みデータ及びその音声データの開始時刻を音声情報として格納するように設けられている。
字幕読みデータ生成部5は、図1に示すように、デコーダ1で分離された後に2つに分けられた一方の字幕データから字幕読みデータを生成して、字幕データ、字幕読みデータ、字幕データの登録時刻及び通し番号(ID)を字幕情報として、格納するように設けられている。ここで、字幕読みデータ生成部5は、漢字混じりの字幕データを全て仮名に変換して、字幕読みデータを生成するように設けられている。
遅延時間検出部6は、図1に示すように、音声読みデータ生成部4で生成された音声読みデータ、及び字幕読みデータ生成部5で生成された字幕読みデータにおいて、互いに一致する文章を検索し、検索された文章における音声読みデータに対する字幕読みデータの遅延時間を検出して、遅延時間に基づいて、映像音声デコーダ7からの映像データに字幕データを適切なタイミングで挿入するように設けられている。ここで、遅延時間検出部6では、音声読みデータ及び字幕読みデータにおける文章の一致を、例えば、前方一致で検索するようになっている。なお、本実施形態では、音声読みデータ及び字幕読みデータにおける文章の一致を、前方一致で検索する方法を例示したが、音声読みデータ及び字幕読みデータにおける文章の一致を完全一致で検索してもよい。
映像音声デコーダ7は、図1に示すように、ストレージ2に保存された映像ストリーム及び音声ストリームから映像データ及び音声データをそれぞれ生成し、遅延時間検出部6で遅延時間が検出された文章における映像データ及び音声データの再生を遅延時間よりも長くそれぞれ遅延させるように設けられている。
映像合成部8は、図1に示すように、映像音声デコーダ7で遅延させた映像データにデコーダ1で分離された後に2つに分けられた他方の字幕データを同期させて合成するように設けられている。
液晶モジュール9は、図1に示すように、映像合成部8で合成された映像データを表示する映像表示部として設けられている。
スピーカー10は、図1に示すように、映像音声デコーダ7で遅延させた音声データを出力する音声出力部として設けられている。
次に、上記構成の液晶テレビ30を用いて、映像及び音声に対して字幕を同期させるための手順(a)~(f)について説明する。なお、下記の(a)~(f)は、図2中の(a)~(f)に対応している。
(a)音声読みデータ生成部4において、音声デコーダ3で生成された音声データ(「気象庁では土砂災害…」)を音声読みデータ(「キショウチョウデワドシャサイガイ…」)に変換し、音声情報として、音声読みデータ及びその音声データの開始時刻(「19:12:20.00」)を格納する。ここで、音声データの開始時刻は、図3に示すように、音声読みデータ生成部4に入力される音声データにおいて、無音やBGMなどが一定時間(例えば、1秒)継続した後に、音声が認識され始めた時刻である。
(b)字幕読みデータ生成部5において、デコーダ1で分離された字幕データ(「気象庁では土砂災害…」)から字幕読みデータ(「キショウチョウデワドシャサイガイ…」)を生成して、字幕データ、字幕読みデータ、字幕データの登録時刻(「19:12:22.50」)及びID(「1001」)を字幕情報として、格納する。
(c)遅延時間検出部6において、(a)で格納した音声情報から(b)で得られた字幕読みデータと一致するものを検索する。ここで、字幕の遅延時間は、それほど大きく変動しないので、検索対象を時間的に絞り込んでもよい。また、検索には、音声読みデータ生成部4での音声認識の誤認識を考慮して、ロバスト性を有するパターンマッチングが望ましい。
(d)遅延時間検出部6において、(c)の検索の結果、ID:1001に対する音声情報が19:12:20.00のものと判明し、時刻19:12:20.00とID=1001とを対応づけるタイムテーブルを作成して、一致した文章(「キショウチョウデワドシャサイガイ…」)における音声読みデータ(開始時刻:19:12:20.00)に対する字幕読みデータ(登録時刻:19:12:22.50)の遅延時間(2.5秒)を検出する。
(e)映像音声デコーダ7において、ストレージ2に保存された映像ストリーム及び音声ストリームから映像データ及び音声データをそれぞれ生成し、それらの映像データ及び音声データの再生を遅延時間(2.5秒)よりも十分に長く、ライブ放送としての価値を失わない程度の時間Δt(例えば、20秒)遅延させて開始する。
(f)時刻Tでの再生データのタイムスタンプは、T-Δtであるので、時刻19:12:20.00+Δtでの再生データのタイムスタンプは、19:12:20.00である。そして、(d)で作成したタイムテーブルを参照すると、19:12:20.00には、ID:1001とあるので、このとき、映像合成部8において、ID:1001に対応する字幕データを映像データに挿入して合成することにより、図4に示すように、音声と字幕とが同期した映像が得られる。
以上のようにして、本実施形態の液晶テレビ30を用いて、映像及び音声に対して字幕を同期させることができる。
以上説明したように、本実施形態の液晶テレビ30によれば、デコーダ1で放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離し、音声デコーダ3で音声ストリームから音声データを生成し、遅延時間検出部6では、音声読みデータ生成部4で音声データから生成された音声読みデータ、及び字幕読みデータ生成部5で字幕データから生成された字幕読みデータにおいて、互いに一致する文章を検索し、その文章における音声読みデータに対する字幕読みデータの遅延時間を検出するので、映像及び音声に対する字幕の遅延を装置内で検出することができる。そして、映像音声デコーダ7では、遅延時間が検出された文章における映像データ及び音声データの再生を遅延時間検出部6で検出された遅延時間よりも長くそれぞれ遅延させると共に、映像合成部8において、映像音声デコーダ7で遅延させた映像データに字幕データを同期させて合成するので、液晶表示モジュール9で表示される映像データ、及びスピーカー10で出力される音声データに字幕データが同期することになる。これにより、装置内で字幕の遅延を検出して、その遅延時間よりも長く映像及び音声の再生を遅延させ、映像及び音声に字幕を同期させているので、放送局での対応に影響されることなく、映像及び音声と字幕とを確実に同期することができる。
また、本実施形態の液晶テレビ30によれば、遅延時間検出部6が音声読みデータ及び字幕読みデータにおける文章の一致を前方一致で検索するように構成されているので、音声読みデータ及び字幕読みデータにおける文章の一致を検索する作業を軽減することができる。
なお、本実施形態では、映像表示部として液晶表示モジュール9を例示して、表示装置として、液晶テレビ30を例示したが、本発明は、有機EL(Electro Luminescence)テレビ、プラスマテレビなどの他の表示装置にも適用することができる。
《発明の実施形態2》
図5は、本実施形態の録画再生装置40のブロック図である。
図5は、本実施形態の録画再生装置40のブロック図である。
録画再生装置40は、図5に示すように、互いに連関するように設けられたストレージ11、デコーダ12、音声デコーダ13、音声読みデータ生成部14、字幕読みデータ生成部15、遅延時間検出部16、映像音声デコーダ17、映像合成部18、映像出力ポート19及び音声出力ポート20を備え、例えば、ブルーレイディスクレコーダーやハードディスクレコーダーなどを構成している。
ストレージ11は、図5に示すように、放送ストリームを保存するように設けられている。
デコーダ12は、図5に示すように、ストレージ11に保存された放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離するように設けられている。
音声デコーダ13は、図5に示すように、デコーダ12で分離された後に2つに分けられた一方の音声ストリームから音声データを生成するように設けられている。
音声読みデータ生成部14は、図5に示すように、音声デコーダ13で生成された音声データから音声読みデータを生成して、音声読みデータ及びその音声データの開始時刻を音声情報として格納するように設けられている。
字幕読みデータ生成部15は、図5に示すように、デコーダ12で分離された後に2つに分けられた一方の字幕データから字幕読みデータを生成して、字幕データ、字幕読みデータ、字幕データの登録時刻及び通し番号(ID)を字幕情報として、格納するように設けられている。
遅延時間検出部16は、図5に示すように、音声読みデータ生成部14で生成された音声読みデータ、及び字幕読みデータ生成部15で生成された字幕読みデータにおいて、互いに一致する文章を検索し、検索された文章における音声読みデータに対する字幕読みデータの遅延時間を検出して、遅延時間に基づいて、映像音声デコーダ17からの映像データに字幕データを適切なタイミングで挿入するように設けられている。
映像音声デコーダ17は、図5に示すように、デコーダ12で分離された映像ストリーム、及びデコーダ12で分離された後に2つに分けられた他方の音声ストリームから映像データ及び音声データをそれぞれ生成し、遅延時間検出部16で遅延時間が検出された文章における映像データ及び音声データの再生を遅延時間よりも長くそれぞれ遅延させるように設けられている。
映像合成部18は、図5に示すように、映像音声デコーダ17で遅延させた映像データにデコーダ12で分離された後に2つに分けられた他方の字幕データを同期させて合成するように設けられている。
映像出力ポート19は、図5に示すように、映像合成部18で合成された映像データを出力するように設けられている。
音声出力ポート20は、図5に示すように、映像音声デコーダ17で遅延させた音声データを出力するように設けられている。
上記構成の録画再生装置40は、上記実施形態1で説明した手順(a)~(f)を行うことにより、映像及び音声に対して字幕を同期させることができる。
以上説明したように、本実施形態の録画再生装置40によれば、デコーダ12でストレージ11に保存された放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離し、音声デコーダ13で音声ストリームから音声データを生成し、遅延時間検出部16では、音声読みデータ生成部14で音声データから生成された音声読みデータ、及び字幕読みデータ生成部15で字幕データから生成された字幕読みデータにおいて、互いに一致する文章を検索し、その文章における音声読みデータに対する字幕読みデータの遅延時間を検出するので、映像及び音声に対する字幕の遅延を装置内で検出することができる。そして、映像音声デコーダ17では、遅延時間が検出された文章における映像データ及び音声データの再生を遅延時間検出部16で検出された遅延時間よりも長くそれぞれ遅延させると共に、映像合成部18において、映像音声デコーダ17で遅延させた映像データに字幕データを同期させて合成するので、映像出力ポート19から出力される映像データ、及び音声出力ポート20から出力される音声データに字幕データが同期することになる。これにより、装置内で字幕の遅延を検出して、その遅延時間よりも長く映像及び音声の再生を遅延させ、映像及び音声に字幕を同期させているので、装置内に録画されたライブ番組に対しても、放送局での対応に影響されることなく、映像及び音声と字幕とを確実に同期させることができる。
《発明の実施形態3》
図6は、本実施形態の録画再生装置50のブロック図である。
図6は、本実施形態の録画再生装置50のブロック図である。
録画再生装置50は、図6に示すように、互いに連関するように設けられたデコーダ21、音声デコーダ22、音声読みデータ生成部23、字幕読みデータ生成部24、遅延時間検出部25、ストレージ26及び映像音声再生部27を備え、例えば、ブルーレイディスクレコーダーやハードディスクレコーダーなどを構成している。
デコーダ21は、図6に示すように、放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離するように設けられている。
音声デコーダ22は、図6に示すように、デコーダ21で分離された後に2つに分けられた一方の音声ストリームから音声データを生成するように設けられている。
音声読みデータ生成部23は、図6に示すように、音声デコーダ22で生成された音声データから音声読みデータを生成して、音声読みデータ及びその音声データの開始時刻を音声情報として格納するように設けられている。
字幕読みデータ生成部24は、図6に示すように、デコーダ21で分離された後に2つに分けられた一方の字幕データから字幕読みデータを生成して、字幕データ、字幕読みデータ、字幕データの登録時刻及び通し番号(ID)を字幕情報として、格納するように設けられている。
遅延時間検出部25は、図6に示すように、音声読みデータ生成部23で生成された音声読みデータ、及び字幕読みデータ生成部24で生成された字幕読みデータにおいて、互いに一致する文章を検索し、検索された文章における音声読みデータに対する字幕読みデータの遅延時間を検出して、遅延時間に基づいて、映像ストリーム及び音声ストリームに字幕データを挿入するタイミングを設定するように設けられている。
ストレージ26は、図6に示すように、デコーダ21で分離された映像ストリーム、及びデコーダ22で分離された後に2つに分けられた他方の音声ストリームを遅延時間が検出された文章における映像ストリーム及び音声ストリームの再生が遅延時間よりも長くそれぞれ遅延し、字幕データが映像ストリーム及び音声ストリームに同期するように保存するように設けられている。
映像音声再生部27は、例えば、ストレージ26に保存された映像ストリーム及び音声ストリームから映像データ及び音声データをそれぞれ生成するための映像音声デコーダと、その映像音声デコーダで生成された映像データ及び音声データを出力するための映像音声出力ポートとを備え、ストレージ26に保存された映像ストリーム及び音声ストリームを再生するように設けられている。
上記構成の録画再生装置50は、上記実施形態1で説明した手順(a)~(f)を行うことにより、映像及び音声に対して字幕を同期させることができる。
以上説明したように、本実施形態の録画再生装置50によれば、デコーダ21で放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離し、音声デコーダ22で音声ストリームから音声データを生成し、遅延時間検出部25では、音声読みデータ生成部23で音声データから生成された音声読みデータ、及び字幕読みデータ生成部24で字幕データから生成された字幕読みデータにおいて、互いに一致する文章を検索し、その文章における音声読みデータに対する字幕読みデータの遅延時間を検出するので、映像及び音声に対する字幕の遅延を装置内で検出することができる。そして、ストレージ26では、遅延時間が検出された文章における映像ストリーム及び音声ストリームの再生が遅延時間検出部25で検出された遅延時間よりも長くそれぞれ遅延し、字幕データが映像ストリーム及び音声ストリームに同期するように保存されるので、ストレージ26で保存された映像ストリーム及び音声ストリームを再生する映像音声再生部27では、映像及び音声に字幕を同期して再生することができる。これにより、装置内で字幕の遅延を検出して、その遅延時間よりも長く映像及び音声の再生を遅延させ、映像及び音声に字幕を同期させているので、放送局での対応に影響されることなく、映像及び音声と字幕とを確実に同期することができる。
また、本実施形態の録画再生装置50によれば、映像及び音声と字幕とが同期した状態で保存しているので、再生開始を装置本体に指示すると、同期した映像が直ちに再生することができる。これに対して、上記実施形態2の録画再生装置40では、再生開始を装置本体に指示すると、同期した映像が所定の時間Δtだけ遅れて再生される。
以上説明したように、本発明は、映像及び音声と字幕とを確実に同期することができるので、字幕放送を視聴するための表示装置及び録画再生装置について有用である。
1,12,21 デコーダ
2,11,26 ストレージ
3,13,22 音声デコーダ
4,14,23 音声読みデータ生成部
5,15,24 字幕読みデータ生成部
6,16,25 遅延時間検出部
7,17 映像音声デコーダ
8,18 映像合成部
9 液晶表示モジュール(映像表示部)
10 スピーカー(音声出力部)
19 映像出力ポート
20 音声出力ポート
27 映像音声再生部
30 液晶テレビ(表示装置)
40,50 録画再生装置
2,11,26 ストレージ
3,13,22 音声デコーダ
4,14,23 音声読みデータ生成部
5,15,24 字幕読みデータ生成部
6,16,25 遅延時間検出部
7,17 映像音声デコーダ
8,18 映像合成部
9 液晶表示モジュール(映像表示部)
10 スピーカー(音声出力部)
19 映像出力ポート
20 音声出力ポート
27 映像音声再生部
30 液晶テレビ(表示装置)
40,50 録画再生装置
Claims (6)
- 放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離するデコーダと、
上記映像ストリーム及び音声ストリームを保存するストレージと、
上記音声ストリームから音声データを生成する音声デコーダと、
上記音声データから音声読みデータを生成する音声読みデータ生成部と、
上記字幕データから字幕読みデータを生成する字幕読みデータ生成部と、
上記音声読みデータ及び字幕読みデータにおいて、互いに一致する文章を検索し、該文章における音声読みデータに対する字幕読みデータの遅延時間を検出する遅延時間検出部と、
上記ストレージに保存された映像ストリーム及び音声ストリームから映像データ及び音声データをそれぞれ生成し、上記遅延時間が検出された文章における該映像データ及び音声データの再生を上記遅延時間よりも長くそれぞれ遅延させる映像音声デコーダと、
上記映像音声デコーダで遅延させた映像データに上記字幕データを同期させて合成する映像合成部と、
上記映像合成部で合成された映像データを表示する映像表示部と、
上記映像音声デコーダで遅延させた音声データを出力する音声出力部とを備えている、表示装置。 - 上記字幕読みデータ生成部は、漢字を仮名に変換するように構成されている、請求項1に記載の表示装置。
- 上記遅延時間検出部は、上記音声読みデータ及び字幕読みデータにおける文章の一致を前方一致で検索するように構成されている、請求項1又は2に記載の表示装置。
- 上記映像表示部は、液晶表示モジュールである、請求項1乃至3の何れか1つに記載の表示装置。
- 放送ストリームを保存するストレージと、
上記ストレージに保存された放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離するデコーダと、
上記音声ストリームから音声データを生成する音声デコーダと、
上記音声データから音声読みデータを生成する音声読みデータ生成部と、
上記字幕データから字幕読みデータを生成する字幕読みデータ生成部と、
上記音声読みデータ及び字幕読みデータにおいて、互いに一致する文章を検索し、該文章における音声読みデータに対する字幕読みデータの遅延時間を検出する遅延時間検出部と、
上記映像ストリーム及び音声ストリームから映像データ及び音声データをそれぞれ生成し、上記遅延時間が検出された文章における該映像データ及び音声データの再生を上記遅延時間よりも長くそれぞれ遅延させる映像音声デコーダと、
上記映像音声デコーダで遅延させた映像データに上記字幕データを同期させて合成する映像合成部と、
上記映像合成部で合成された映像データを出力するための映像出力ポートと、
上記映像音声デコーダで遅延させた音声データを出力するための音声出力ポートとを備えている、録画再生装置。 - 放送ストリームを映像ストリーム、音声ストリーム及び字幕データに分離するデコーダと、
上記音声ストリームから音声データを生成する音声デコーダと、
上記音声データから音声読みデータを生成する音声読みデータ生成部と、
上記字幕データから字幕読みデータを生成する字幕読みデータ生成部と、
上記音声読みデータ及び字幕読みデータにおいて、互いに一致する文章を検索し、該文章における音声読みデータに対する字幕読みデータの遅延時間を検出する遅延時間検出部と、
上記映像ストリーム及び音声ストリームを上記遅延時間が検出された文章における該映像ストリーム及び音声ストリームの再生が上記遅延時間よりも長くそれぞれ遅延し、上記字幕データが該映像ストリーム及び音声ストリームに同期するように保存するストレージと、
上記ストレージに保存された映像ストリーム及び音声ストリームを再生する映像音声再生部とを備えている、録画再生装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011200346 | 2011-09-14 | ||
JP2011-200346 | 2011-09-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2013038636A1 true WO2013038636A1 (ja) | 2013-03-21 |
Family
ID=47882887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2012/005705 WO2013038636A1 (ja) | 2011-09-14 | 2012-09-10 | 表示装置及び録画再生装置 |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2013038636A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6295381B1 (ja) * | 2017-08-31 | 2018-03-14 | 楽天株式会社 | 表示タイミング決定装置、表示タイミング決定方法、及びプログラム |
CN116668763A (zh) * | 2022-11-10 | 2023-08-29 | 荣耀终端有限公司 | 录屏方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005045503A (ja) * | 2003-07-28 | 2005-02-17 | Toshiba Corp | 字幕信号処理装置、字幕信号処理方法及び字幕信号処理プログラム |
JP2005286969A (ja) * | 2004-03-31 | 2005-10-13 | Sharp Corp | 記録再生装置、表示装置、及び字幕放送の字幕表示遅れ補正方法 |
JP2010136067A (ja) * | 2008-12-04 | 2010-06-17 | Sony Corp | データ処理装置、データ処理方法、及び、プログラム |
JP2010233019A (ja) * | 2009-03-27 | 2010-10-14 | Kddi Corp | 字幕ずれ補正装置、再生装置および放送装置 |
-
2012
- 2012-09-10 WO PCT/JP2012/005705 patent/WO2013038636A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005045503A (ja) * | 2003-07-28 | 2005-02-17 | Toshiba Corp | 字幕信号処理装置、字幕信号処理方法及び字幕信号処理プログラム |
JP2005286969A (ja) * | 2004-03-31 | 2005-10-13 | Sharp Corp | 記録再生装置、表示装置、及び字幕放送の字幕表示遅れ補正方法 |
JP2010136067A (ja) * | 2008-12-04 | 2010-06-17 | Sony Corp | データ処理装置、データ処理方法、及び、プログラム |
JP2010233019A (ja) * | 2009-03-27 | 2010-10-14 | Kddi Corp | 字幕ずれ補正装置、再生装置および放送装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6295381B1 (ja) * | 2017-08-31 | 2018-03-14 | 楽天株式会社 | 表示タイミング決定装置、表示タイミング決定方法、及びプログラム |
WO2019043871A1 (ja) * | 2017-08-31 | 2019-03-07 | 楽天株式会社 | 表示タイミング決定装置、表示タイミング決定方法、及びプログラム |
CN116668763A (zh) * | 2022-11-10 | 2023-08-29 | 荣耀终端有限公司 | 录屏方法及装置 |
CN116668763B (zh) * | 2022-11-10 | 2024-04-19 | 荣耀终端有限公司 | 录屏方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4113059B2 (ja) | 字幕信号処理装置、字幕信号処理方法及び字幕信号処理プログラム | |
US20080219641A1 (en) | Apparatus and method for synchronizing a secondary audio track to the audio track of a video source | |
US8931024B2 (en) | Receiving apparatus and subtitle processing method | |
US20060285654A1 (en) | System and method for performing automatic dubbing on an audio-visual stream | |
US20100141834A1 (en) | Method and process for text-based assistive program descriptions for television | |
US20050180462A1 (en) | Apparatus and method for reproducing ancillary data in synchronization with an audio signal | |
US8781291B2 (en) | Data processing device, data processing method, and program | |
JP2005064600A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2007324872A (ja) | 字幕付き映像信号の遅延制御装置及び遅延制御プログラム | |
KR100678938B1 (ko) | 영상과 자막의 동기화 조절 장치 및 방법 | |
JP2008299032A (ja) | 語学教材および文字データ再生装置 | |
WO2009118971A1 (ja) | デジタル放送受信装置、及びデジタル放送受信方法 | |
WO2013038636A1 (ja) | 表示装置及び録画再生装置 | |
JP2008098793A (ja) | 受信装置 | |
JP2004207821A (ja) | 字幕放送受信装置、字幕放送受信方法及び字幕放送受信プログラム | |
JP3998187B2 (ja) | コンテンツ解説データ生成装置、その方法及びそのプログラム、並びに、コンテンツ解説データ提示装置、その方法及びそのプログラム | |
JP2006020102A (ja) | 放送記録再生装置および放送記録再生処理プログラム | |
JP4285099B2 (ja) | データ再生方法及びデータ再生装置 | |
EP1772851A1 (fr) | Système de karaoké pour l'affichage du texte correspondant à la partie vocale d'un flux audiovisuel sur un écran d'un système audiovisuel | |
JP2006165772A (ja) | 情報再生装置及び方法 | |
JP2009152782A (ja) | コンテンツ再生装置及びコンテンツ再生方法 | |
JP2014207619A (ja) | 録画再生装置、及び録画再生装置の制御方法 | |
KR100782196B1 (ko) | 타임 시프트 기능을 가지는 영상표시기기 및 그 제어방법 | |
KR100631783B1 (ko) | 멀티미디어 데이터와 메타데이터를 동기화하는 시스템 및방법 | |
JP2008199444A (ja) | 字幕放送表示システム及び放送受信装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 12831716 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 12831716 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: JP |