JP2009152782A - コンテンツ再生装置及びコンテンツ再生方法 - Google Patents

コンテンツ再生装置及びコンテンツ再生方法 Download PDF

Info

Publication number
JP2009152782A
JP2009152782A JP2007327731A JP2007327731A JP2009152782A JP 2009152782 A JP2009152782 A JP 2009152782A JP 2007327731 A JP2007327731 A JP 2007327731A JP 2007327731 A JP2007327731 A JP 2007327731A JP 2009152782 A JP2009152782 A JP 2009152782A
Authority
JP
Japan
Prior art keywords
information
content
subtitle
audio
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007327731A
Other languages
English (en)
Inventor
Masaru Ishimaru
大 石丸
Takeaki Kobayashi
丈朗 小林
Kazutoshi Horiguchi
和俊 堀口
Shunichi Kawabata
俊一 川端
Atsushi Koyanagi
敦史 小柳
Ryohei Furumachi
亮平 古町
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007327731A priority Critical patent/JP2009152782A/ja
Publication of JP2009152782A publication Critical patent/JP2009152782A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】この発明は、特定の言語に対応した字幕情報を含むコンテンツに対して、その字幕情報を他の言語に変換し本来の音声情報に代えて音声再生させることにより、言語圏に応じて字幕情報の言語を考慮する必要をなくして実用に好適するようにしたコンテンツ再生装置及びコンテンツ再生方法を提供することを目的としている。
【解決手段】字幕情報を特定の言語に翻訳して出力する翻訳処理手段(32)と、翻訳後の字幕情報を音声情報に変換する変換手段(34)と、音声情報から字幕情報の内容に対応した音声情報を除いた無声音情報を取得する取得手段(23)と、取得した無声音情報に、変換手段(34)から出力される音声情報を、字幕情報の表示タイミングに同期させて合成する合成手段(24)とを備える。
【選択図】 図1

Description

この発明は、映像情報、音声情報及び字幕情報を含むコンテンツを再生するコンテンツ再生装置及びコンテンツ再生方法の改良に関する。
周知のように、近年では、デジタル記録媒体としてDVD(digital versatile disk)等の光ディスクが普及している。そして、現在では、DVDよりもさらに高密度記録が可能な、いわゆるHD(high definition)−DVDと称されるハイビジョン対応の次世代DVD規格も完成している。
そして、このDVD規格においては、映像情報と字幕情報とを別々のストリームとして光ディスクに記録しておき、再生時にそれぞれにデコード処理を施して合成することにより、映像に字幕を重畳表示させるようにしている。このため、複数ヵ国語の字幕情報を記録しておけば、再生時に所望の字幕を選択して表示させることが可能となる。
ところで、このような光ディスクの製造側では、複数の異なる言語圏向けの光ディスクを製造する際に、出荷先に対応した言語の字幕情報を記録した光ディスクを製造する手法と、多数の言語圏向けとして共用することができるように、複数ヵ国語に対応した字幕情報を記録させた光ディスクを製造する手法とのいずれかを採用している。
特許文献1には、字幕を表わす文字情報を映像情報と同期した合成音声として聴覚的に出力することにより、映像や字幕を容易に視聴することができ、狭い画面を有する携帯端末を使用する場合でも、映像情報、音声情報及び文字情報を含むコンテンツを容易に視聴することができるようにした情報提示装置が開示されている。
特開2004−140583号公報
そこで、この発明は上記事情を考慮してなされたもので、特定の言語に対応した字幕情報を含むコンテンツに対して、その字幕情報を他の言語に変換し本来の音声情報に代えて音声再生させることにより、言語圏に応じて字幕情報の言語を考慮する必要をなくして実用に好適するようにしたコンテンツ再生装置及びコンテンツ再生方法を提供することを目的とする。
すなわち、この発明に係るコンテンツ再生装置は、映像情報、音声情報及び字幕情報を含むコンテンツを再生するものを対象としている。そして、コンテンツから映像情報、音声情報及び字幕情報を分離する分離手段と、分離手段で分離された字幕情報を特定の言語に翻訳して出力する翻訳処理手段と、翻訳処理手段から出力された翻訳後の字幕情報を音声情報に変換する変換手段と、コンテンツに含まれる音声情報から字幕情報の内容に対応した音声情報を除いた無声音情報を取得する取得手段と、取得手段で取得した無声音情報に、変換手段から出力される音声情報を、字幕情報の表示タイミングに同期させて合成する合成手段とを備えるようにしたものである。
また、この発明に係るコンテンツ再生方法は、映像情報、音声情報及び字幕情報を含むコンテンツを再生する方法を対象としている。そして、コンテンツから映像情報、音声情報及び字幕情報を分離する第1の工程と、第1の工程で分離された字幕情報を特定の言語に翻訳して出力する第2の工程と、第2の工程で翻訳された字幕情報を音声情報に変換する第3の工程と、コンテンツに含まれる音声情報から字幕情報の内容に対応した音声情報を除いた無声音情報を取得する第4の工程と、第4の工程で取得した無声音情報に、第3の工程で変換した音声情報を、字幕情報の表示タイミングに同期させて合成する第5の工程とを備えるようにしたものである。
上記した発明によれば、音声情報から字幕情報の内容に対応した音声情報を除いた無声音情報に、特定の言語に翻訳された字幕情報を音声情報に変換したものを、字幕情報の表示タイミングに同期させて合成することにより、特定の言語に対応した字幕情報を含むコンテンツに対して、その字幕情報を他の言語に変換し本来の音声情報に代えて音声再生させることができるようになるため、言語圏に応じて字幕情報の言語を考慮する必要をなくして実用に好適するようになる。
以下、この発明の実施の形態について図面を参照して詳細に説明する。図1は、この実施の形態で説明する光ディスク再生装置11の信号処理系を示している。この光ディスク再生装置11は、例えばHD DVD等の光ディスク12を装着し、そこに記録されたコンテンツ(アドバンスドコンテンツ)を読み取るディスクドライブ部13を備えている。
このディスクドライブ部13で読み取られたコンテンツは、データプロセッサ部14に供給されてエラー訂正処理が施された後、分離部15に供給される。この分離部15は、入力されたコンテンツを、映像情報、グラフィック情報、字幕情報(サブタイトル情報)及び音声情報に分離している。
このうち、映像情報は、映像デコーダ部16によりデコード処理が施された後、ビデオプロセッサ部17に供給される。また、上記グラフィック情報は、グラフィックデコーダ部18によりデコード処理が施された後、上記ビデオプロセッサ部17に供給される。さらに、上記字幕情報は、アドバンスドサブタイトルデコーダ部19によりデコード処理が施された後、上記ビデオプロセッサ部17に供給される。
そして、上記ビデオプロセッサ部17では、映像デコーダ部16、グラフィックデコーダ部18及びアドバンスドサブタイトルデコーダ部19からそれぞれ供給されたデータを合成し、ビデオデータを生成している。このビデオプロセッサ部17で生成されたビデオデータは、映像出力端子20を介して外部の映像表示部21に供給されて映像表示に供される。
また、上記分離部15で分離された音声情報は、音声デコーダ部22によりデコード処理が施され、後述する音声除去フィルタ23を介した後、オーディオプロセッサ部24によって後述する音声変換部34から供給される音声データが合成された後、音声出力端子25を介して外部のスピーカ26に供給されて音声再生に供される。
ここで、この光ディスク再生装置11は、上記した再生動作を含むその全ての動作を制御部27によって統括的に制御されている。この制御部27は、CPU(central processing unit)27aを内蔵しており、図示しないリモートコントローラ等を含む操作部28からの操作情報を受けて、その操作内容が反映されるように各部をそれぞれ制御している。
この場合、制御部27は、メモリ部27bを利用している。このメモリ部27bとしては、主として、制御部27のCPU27aが実行するための制御プログラムを格納したROM(read only memory)と、該CPU27aに作業エリアを提供するためのRAM(random access memory)と、各種の設定情報及び制御情報等を格納するための不揮発性メモリとを有している。
また、この制御部27には、デジタル送受信部29が接続されている。このデジタル送受信部29は、デジタルインターフェース機能を持つもので、入出力端子30を介してインターネット等のネットワーク回線に接続されることにより、制御部27とネットワーク回線との相互間でのデータ通信を可能にしている。これにより、制御部27は、デジタル送受信部29及び入出力端子30を介してネットワーク回線上のサーバにアクセスし、所望のコンテンツを取得することが可能となる。
ここにおいて、上記アドバンスドサブタイトルデコーダ部19は、字幕テキスト抽出部31を備えている。この字幕テキスト抽出部31は、分離部15から供給された字幕情報を字幕のテキストデータとそれ以外のメタデータ(表示タイミングや文字色等を示すデータ)とに分離し、テキストデータを字幕翻訳部32に出力している。
この字幕翻訳部32は、字幕テキスト抽出部31から供給された字幕のテキストデータを特定の言語に翻訳し、その翻訳データを出力している。この場合、字幕翻訳部32は、字幕のテキストデータを特定の言語に翻訳する際に複数の翻訳候補を生成し、その複数の翻訳候補に対応する翻訳データを最適候補選択部33に出力している。この最適候補選択部33は、字幕翻訳部32から供給された複数の翻訳候補に対応する翻訳データの中から最適な翻訳候補に対応する翻訳データを選択し、その選択された翻訳データを音声変換部34に出力している。
この音声変換部34は、最適候補選択部33で選択された翻訳データを音声データに変換し、上記オーディオプロセッサ部24に出力している。このオーディオプロセッサ部24は、上記音声デコーダ部22から出力され音声除去フィルタ23を介して供給された音声データと、上記音声変換部34から供給された音声データとを合成し、上記音声出力端子25を介して外部のスピーカ26に供給している。
この場合、上記音声除去フィルタ23は、音声デコーダ部22から出力される音声データの中から、字幕の内容に対応する音声データ、つまり、一般的には人間の話す音声に対応する特定の周波数成分の音声データを除去している。これにより、音声除去フィルタ23から出力される音声データは、人の話す音声(台詞等)の除去された無声音データとなる。つまり、例えばBGM(background music)や生活音等のような背景音のみを含むものとなる。なお、上記音声除去フィルタ23としては、例えばバンドエリミネーションフィルタ等が使用される。
そして、上記オーディオプロセッサ部24では、音声除去フィルタ23から供給される無声音データに、上記音声変換部34から供給される翻訳後の音声データを、字幕情報の表示タイミングに同期させて合成する。そして、この合成された音声データが音声出力端子25を介してスピーカ26に供給されることにより、光ディスク12に記録されていた特定の言語の字幕情報が、本来の音声情報に代えて他の言語で音声再生される。
すなわち、特定の言語の字幕情報しか持たないコンテンツの記録された光ディスク12であっても、光ディスク再生装置11側で字幕情報を所定の言語に変換して音声再生させるようにしている。このため、異なる言語圏でもそれぞれその国の言語での音声再生ができるようになる。
これにより、コンテンツ(光ディスク12)の製作側は、これまで各言語圏に向けてそれぞれ異なる製品(光ディスク12)を製造しなければならなかったが、特定の1言語による字幕情報を含む製品(光ディスク12)を製作するだけで、それを全世界で用いることができるようになる。
ここで、上記した光ディスク再生装置11についてさらに詳細に説明する。すなわち、HD DVD規格においては、アドバンスドサブタイトルと称される字幕情報を持つコンテンツが定められている。この字幕情報は、予め光ディスク12に特定の言語のデータとして収容されている。
このため、上記した音声除去フィルタ23、字幕テキスト抽出部31、字幕翻訳部32、最適候補選択部33及び音声変換部34等を併せ持たない、通常の光ディスクプレーヤでは、光ディスク12に予め収容されている特定の言語による字幕しか表示することができないことになる。
ここで、まず、通常の字幕情報の処理動作について説明する。すなわち、上記分離部15で分離された字幕情報(アドバンスドサブタイトル)は、図2に示すように、Manifestファイル35、XAS(アドバンスドサブタイトル:字幕主情報)ファイル36及びフォントファイル37から構成されている。
そして、通常の光ディスクプレーヤでは、まず、光ディスク12からManifestファイル35の読み込みが行なわれる。このManifestファイル35は、図3に示すように、XML(extensible markup language)形式のテキストファイルである。このManifestファイル35には、<Markup>タグのsrc属性にXASファイル名が記述されており、また、<Resource>タグのsrc属性に表示に用いる全リソースのファイル名が記述されている。
リソースは、図3に示すように、個々のファイルを用いる場合と、複数のファイルをアーカイブ化して1つのファイルにまとめて用いる場合とがある。この説明では、個々のファイルを用いる場合を例として挙げているが、アーカイブ化したファイルを用いてもかまわないことはもちろんである。
通常の光ディスクプレーヤでは、Manifestファイル35を読み込み、リソースとして挙げられたファイルがメモリに存在することを確認した後、Manifestファイル35の<Markup>タグのsrc属性に記述されたXASファイル36を読み込み、パース(構文解析)を実行する。
このXASファイル36は、図4に示すように、XML形式のテキストファイルになっている。このXASファイル36には、大きく分けて3種類の情報が記述されている。つまり、実際に画面に表示する表示内容となる字幕テキストデータ、画面に表示するタイミングを指定するためのタイミングデータ、字幕の表示位置や色等を指定するためのスタイルデータである。なお、スタイルデータの中には文字フォントを指定する部分があり、前述のフォントファイル37を指定することになっている。
通常の光ディスクプレーヤでは、これらの情報に基づいて、指定された時間に、指定されたスタイルで、指定された文字を、光ディスクプレーヤ内部のサブピクチャープレーンに生成する。そして、図1の映像デコーダ部16によって生成されたメインビデオプレーン及びサブビデオプレーンと、グラフィックデコーダ部18によって生成されたグラフィックプレーン及びカーソルプレーンと、アドバンスドサブタイトルデコーダ部19で生成された字幕プレーンとが、ビデオプロセッサ部17により合成され、映像信号として映像表示部[例えばCRT(cathode ray tube)や液晶ディスプレイ、プラズマディスプレイ等]21に出力される。
一方、上記した実施の形態に係る光ディスク再生装置11では、XASファイル36をパース(構文解析)した後からの処理が、通常の光ディスクプレーヤと異なっている。すなわち、前述したように、Manifestファイル35の<Markup>タグのsrc属性に記述されており、読み込んでパースされたXASファイル36は、まず、字幕テキスト抽出部31によって処理される。
つまり、この字幕テキスト抽出部31では、XASファイル36を、実際に画面に表示する表示内容を示す字幕テキストデータと、それ以外のメタデータとに分離している。なお、アドバンスドサブタイトルの字幕テキストデータは、必ずXASファイル36の<p>タグ内に存在するため、分離方法については、<p>タグ内のテキストを抜き出すようにすればよい。
この実施の形態の場合、光ディスク再生装置11は、XASファイル36をパースするときに、その内容を図5に示すようなデータテーブルとして記憶する。このデータテーブルには、字幕の表示開始時間、表示終了時間、表示内容、フォント及びその他のスタイル情報が記述されている。
そして、字幕テキスト抽出部31において抽出された字幕テキストデータは、その字幕テキストデータが表示される時間より前に字幕翻訳部32に供給され、特定の言語のテキストデータに変換される。この特定の言語とは、光ディスク再生装置11に予め収容されている字幕翻訳エンジン・音声変換エンジン等によって翻訳・変換可能な言語であり、その指定方法については、特に特定されるものではない。
その後、字幕テキスト抽出部31で特定の言語に変換されたテキストデータは、詳細を後述する最適候補選択部33により所定の翻訳候補が選択されて、音声変換部34に供給される。この音声変換部34では、翻訳後の字幕テキストデータに対して音声変換を行ない、その音声データを内蔵メモリにキャッシュする。
そして、字幕が表示されるタイミングで、変換後の音声データをオーディオプロセッサ部24に送ることで、オーディオプロセッサ部24では、音声除去フィルタ23から供給された無声音データに重ねて、音声合成された音声データを出力する。これにより、特定の言語に対応した字幕情報を持つコンテンツに対し、その字幕情報を別の言語での音声情報に変換し本来の音声情報に代えて音声再生することができるようになる。
ここで、前述したように、字幕翻訳部32は、字幕のテキストデータを特定の言語に翻訳する際に複数の翻訳候補を生成しており、最適候補選択部33は、その複数の翻訳候補の中から最適なものを選択している。この選択は、字幕が画面に表示される本来の時間に基づいて、変換後のテキストデータの長さによって選択する。
例えば、図5に示した最初の字幕アイテム(Rome was not built in a day.)について、図6を参照して説明する。この字幕アイテムは、本来、00:00:05:00から00:00:10:00までの5秒間表示されることになっている。図6は、この字幕アイテムを字幕翻訳部32で翻訳した際に、2つの翻訳候補が生成された場合を示している。1つの候補は「ローマは1日にして成らず。」であり、他の候補は「ローマは1日の間には立てられなかった。」である。
そこで、最適候補選択部33は、それぞれの候補の音声変換後の長さを計算する。この計算方法については、特に特定されるものではない。例えば、日本語であれば、ひらがなに変換した後の文字数に基づいて計算することができる。その結果、例えば「ローマは1日にして成らず。」は4秒、「ローマは1日の間には立てられなかった。」は8秒だったとする。
この字幕アイテムの表示に本来与えられている時間は5秒間であるため、「ローマは1日の間には立てられなかった。」を選択すると時間内に収めることができない。そこで、最低候補選択部33では、2つの翻訳候補のうち「ローマは1日にして成らず。」を選択して音声変換部34に出力する。
また、上記した実施の形態では、字幕テキストデータを、字幕翻訳部32において、光ディスク再生装置11に予め収容されている字幕翻訳エンジン・音声変換エンジンによって翻訳・変換可能な特定の言語に変換することとしたが、これらのエンジンは最初から全て光ディスク再生装置11に存在させる必要は無い。例えば、光ディスク再生装置11を前述したようにネットワーク回線に接続し、所定のサーバから新しいエンジンをダウンロードすることが考えられる。また、例えば、着脱可能なUSB(universal serial bus)メモリのような記録媒体を装着して新しいエンジンを組み込むことも考えられる。
さらに、上記した実施の形態では、音声デコーダ部22の出力音声データから、音声除去フィルタ23により人間の話す音声に対応する周波数成分を除去して、背景音のみの無声音データを生成するようにしている。しかしながら、無声音データは、これ以外の手法によっても取得することができる。
例えば、図7に示すように、複数の映像トラックと複数の音声トラックとを有する光ディスク12の音声トラックに、背景音のみが記録されたトラック3を新たに設け、字幕を翻訳して音声変換する場合には、この背景音のみの音声トラックを再生して無声音データを得るようにすることも考えられる。また、光ディスク再生装置11をネットワーク回線に接続して、所定のサーバから無声音データを得ることも考えられる。
なお、光ディスク12やサーバから取得した無声音データは、音声デコーダ部22から出力される音声データに代えてオーディオプロセッサ部24に供給され、音声変換部34から音声データと合成されるようになる。この場合、音声デコーダ部22から出力される音声データは、オーディオプロセッサ部24に供給されないように制御されている。
また、字幕が存在しない場合には、音声変換部34からオーディオプロセッサ部34への音声データの供給がなくなり、音声デコーダ部22から出力される音声データが、音声除去フィルタ23を経由することなくオーディオプロセッサ部24に供給されるように制御される。これにより、背景音だけでなく人間の話す音声も含んだ通常の音声再生が行なわれるようになる。
図8及び図9は、上記した光ディスク再生装置の主要な処理動作をまとめたフローチャートを示している。この処理は、光ディスク12の再生が開始されたことにより開始(ステップS1)される。すると、制御部27は、ステップS2で、字幕情報が存在するか否かを判別し、存在しないと判断された場合(NO)、ステップS16で、音声デコーダ部22から出力される音声データによる音声再生を行なわせて、処理を終了(ステップS17)する。
また、上記ステップS2で字幕情報が存在すると判断された場合(YES)、制御部27は、ステップS3で、光ディスク12に背景音のみの無声音データが記録された音声トラックが存在するか否かを判別し、存在すると判断された場合(YES)、ステップS4で、その背景音のみが記録された音声トラックを再生させるように制御する。
一方、上記ステップS3で光ディスク12に背景音のみが記録された音声トラックが存在しないと判断された場合(NO)、制御部27は、ステップS5で、背景音のみの無声音データがネットワーク回線上から取得可能か否かを判別し、取得可能でないと判断された場合(NO)、ステップS6で、光ディスク12から人の声も含んだ通常の音声トラックを再生させるように制御する。
また、上記ステップS5で背景音のみの無声音データがネットワーク回線上から取得可能であると判断された場合(YES)、制御部27は、ステップS7で、背景音のみの無声音データをネットワーク回線からダウンロードし、ステップS8で、その無声音データを再生させるように制御する。
上記ステップS4、ステップS6またはステップS8の後、制御部27は、ステップS9で、光ディスク12より取得したコンテンツから字幕情報を抽出させ、ステップS10で、抽出した字幕情報の字幕テキストデータを特定の言語に翻訳させる。この場合、複数の翻訳候補が生成される。その後、制御部27は、ステップS11で、複数の翻訳候補のそれぞれについて音声変換後の長さが字幕の表示時間内に収まるか否かを判別し、収まると判断された候補が見つかった場合、ステップS12で、背景音のみの無声音データが取得されているか否かを判別する。
そして、無声音データが取得されていると判断された場合(YES)、制御部27は、ステップS13で、取得した無声音データをオーディオプロセッサ部24に供給して音声変換部34からの音声データと合成させ、ステップS16で、音声再生を行なわせて、処理を終了(ステップS17)する。この場合、音声デコーダ部22から出力される音声データがオーディオプロセッサ部24に供給されないように制御される。
また、上記ステップS13で無声音データが取得されていないと判断された場合(NO)、制御部27は、ステップS14で、音声デコーダ部22の出力音声データから音声除去フィルタ23で人の声を除去した無声音データを生成させ、ステップS15で、その生成した無声音データをオーディオプロセッサ部24に供給して音声変換部34からの音声データと合成させ、ステップS16で、音声再生を行なわせて、処理を終了(ステップS17)する。
なお、この発明は上記した実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を種々変形して具体化することができる。また、上記した実施の形態に開示されている複数の構成要素を適宜に組み合わせることにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除しても良いものである。さらに、異なる実施の形態に係る構成要素を適宜組み合わせても良いものである。
この発明の実施の形態を示すもので、光ディスク再生装置の信号処理系を説明するために示すブロック構成図。 同実施の形態における光ディスク再生装置で再生する字幕情報を構成するファイルを説明するために示す図。 同実施の形態における光ディスク再生装置で再生する字幕情報を構成するファイルの一例を説明するために示す図。 同実施の形態における光ディスク再生装置で再生する字幕情報を構成するファイルの他の例を説明するために示す図。 同実施の形態における光ディスク再生装置が字幕情報のファイルから作成したデータテーブルを説明するために示す図。 同実施の形態における光ディスク再生装置が行なう字幕テキストデータの翻訳候補の選択動作を説明するために示す図。 同実施の形態における光ディスク再生装置が背景音のみの無声音データを取得する手段の一例を説明するために示す図。 同実施の形態における光ディスク再生装置の主要な処理動作の一部を説明するために示すフローチャート。 同実施の形態における光ディスク再生装置の主要な処理動作の残部を説明するために示すフローチャート。
符号の説明
11…光ディスク再生装置、12…光ディスク、13…ディスクドライブ部、14…データプロセッサ部、15…分離部、16…映像デコーダ部、17…ビデオプロセッサ部、18…グラフィックデコーダ部、19…アドバンスドサブタイトルデコーダ部、20…映像出力端子、21…映像表示部、22…音声デコーダ部、23…音声除去フィルタ、24…オーディオプロセッサ部、25…音声出力端子、26…スピーカ、27…制御部、27a…CPU、27b…メモリ部、28…操作部、29…デジタル送受信部、30…入出力端子、31…字幕テキスト抽出部、32…字幕翻訳部、33…最適候補選択部、34…音声変換部、35…Manifestファイル、36…XASファイル、37…フォントファイル。

Claims (8)

  1. 映像情報、音声情報及び字幕情報を含むコンテンツを再生するコンテンツ再生装置であって、
    前記コンテンツから映像情報、音声情報及び字幕情報を分離する分離手段と、
    前記分離手段で分離された字幕情報を特定の言語に翻訳して出力する翻訳処理手段と、
    前記翻訳処理手段から出力された翻訳後の字幕情報を音声情報に変換する変換手段と、
    前記コンテンツに含まれる音声情報から前記字幕情報の内容に対応した音声情報を除いた無声音情報を取得する取得手段と、
    前記取得手段で取得した無声音情報に、前記変換手段から出力される音声情報を、前記字幕情報の表示タイミングに同期させて合成する合成手段とを具備することを特徴とするコンテンツ再生装置。
  2. 前記翻訳処理手段は、
    前記分離手段で分離された字幕情報を特定の言語に翻訳する際、複数の候補を生成する翻訳手段と、
    前記翻訳手段で生成された複数の候補のうち音声情報への変換後の長さが前記字幕情報の表示時間内に収まるものを選択して出力する選択手段とを具備することを特徴とする請求項1記載のコンテンツ再生装置。
  3. 前記取得手段は、前記コンテンツに含まれる音声情報から、フィルタにより前記字幕情報の内容に対応した音声情報を除くことによって、前記無声音情報を取得することを特徴とする請求項1記載のコンテンツ再生装置。
  4. 前記取得手段は、着脱可能な記録媒体またはネットワークを介して、前記無声音情報を取得することを特徴とする請求項1記載のコンテンツ再生装置。
  5. 前記翻訳処理手段及び前記変換手段は、着脱可能な記録媒体またはネットワークを介して取得したプログラムに基づいてコンピュータがその処理を行なうことを特徴とする請求項1記載のコンテンツ再生装置。
  6. 前記字幕情報は、HD DVD規格に準拠したアドバンスドサブタイトルであることを特徴とする請求項1記載のコンテンツ再生装置。
  7. 映像情報、音声情報及び字幕情報を含むコンテンツを再生するコンテンツ再生方法であって、
    前記コンテンツから映像情報、音声情報及び字幕情報を分離する第1の工程と、
    前記第1の工程で分離された字幕情報を特定の言語に翻訳して出力する第2の工程と、
    前記第2の工程で翻訳された字幕情報を音声情報に変換する第3の工程と、
    前記コンテンツに含まれる音声情報から前記字幕情報の内容に対応した音声情報を除いた無声音情報を取得する第4の工程と、
    前記第4の工程で取得した無声音情報に、前記第3の工程で変換した音声情報を、前記字幕情報の表示タイミングに同期させて合成する第5の工程とを具備することを特徴とするコンテンツ再生方法。
  8. 前記第2の工程は、
    前記第1の工程で分離された字幕情報を特定の言語に翻訳する際、複数の候補を生成する工程と、
    生成された複数の候補のうち音声情報への変換後の長さが前記字幕情報の表示時間内に収まるものを選択して出力する工程とを具備することを特徴とする請求項7記載のコンテンツ再生方法。
JP2007327731A 2007-12-19 2007-12-19 コンテンツ再生装置及びコンテンツ再生方法 Withdrawn JP2009152782A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007327731A JP2009152782A (ja) 2007-12-19 2007-12-19 コンテンツ再生装置及びコンテンツ再生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007327731A JP2009152782A (ja) 2007-12-19 2007-12-19 コンテンツ再生装置及びコンテンツ再生方法

Publications (1)

Publication Number Publication Date
JP2009152782A true JP2009152782A (ja) 2009-07-09

Family

ID=40921423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007327731A Withdrawn JP2009152782A (ja) 2007-12-19 2007-12-19 コンテンツ再生装置及びコンテンツ再生方法

Country Status (1)

Country Link
JP (1) JP2009152782A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014207874A1 (ja) * 2013-06-27 2014-12-31 株式会社東芝 電子機器、出力方法およびプログラム
KR101942804B1 (ko) * 2015-02-27 2019-01-28 이승재 다중언어 음원 콘텐츠 제공시스템
WO2021020825A1 (ko) * 2019-07-31 2021-02-04 삼성전자(주) 전자장치와 그의 제어방법, 및 기록매체

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014207874A1 (ja) * 2013-06-27 2014-12-31 株式会社東芝 電子機器、出力方法およびプログラム
KR101942804B1 (ko) * 2015-02-27 2019-01-28 이승재 다중언어 음원 콘텐츠 제공시스템
WO2021020825A1 (ko) * 2019-07-31 2021-02-04 삼성전자(주) 전자장치와 그의 제어방법, 및 기록매체

Similar Documents

Publication Publication Date Title
JP4127668B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP4430036B2 (ja) 拡張型字幕ファイルを用いて付加情報を提供する装置及び方法
US8195036B2 (en) Storage medium for storing text-based subtitle data including style information, and reproducing apparatus and method for reproducing text-based subtitle data including style information
TWI246036B (en) Information storage medium containing subtitle data for multiple languages using text data and downloadable fonts and apparatus therefor
US20050180462A1 (en) Apparatus and method for reproducing ancillary data in synchronization with an audio signal
JP4113059B2 (ja) 字幕信号処理装置、字幕信号処理方法及び字幕信号処理プログラム
JP2006238147A (ja) コンテンツ再生装置、字幕再生方法及びプログラム
JP2007501486A (ja) テキスト字幕をダウンロードするための情報を保存する情報記録媒体、字幕再生方法及びその装置
US20100142925A1 (en) Data processing device, data processing method, and program
KR101944365B1 (ko) 콘텐츠 싱크 생성 방법, 그 장치 및 이를 위한 인터페이스 모듈
WO2015019774A1 (ja) データ生成装置、データ生成方法、翻訳処理装置、プログラム、およびデータ
JP2009016910A (ja) 映像再生装置及び映像再生方法
JP2009152782A (ja) コンテンツ再生装置及びコンテンツ再生方法
WO2005010880A1 (en) Information storage medium storing scenario, apparatus and method of recording the scenario
JP6641045B1 (ja) コンテンツ生成システム、及びコンテンツ生成方法
JP2006339817A (ja) 情報処理装置およびその表示方法
JP2008092403A (ja) 再生支援装置、再生装置、および、再生方法
JP4500957B2 (ja) 字幕制作システム
JP2008134825A (ja) 情報処理装置および情報処理方法、並びにプログラム
JP2010066675A (ja) 音声情報処理システム及び音声情報処理プログラム
KR200315952Y1 (ko) 사용자 지향적 자막 재생 장치
JP2000358202A (ja) 映像音声記録再生装置および同装置の副音声データ生成記録方法
JP7179387B1 (ja) ハイライト動画生成システム、ハイライト動画生成方法、およびプログラム
JP2002197488A (ja) リップシンクデータ生成装置並びに方法、情報記憶媒体、及び情報記憶媒体の製造方法
JP2003018534A (ja) 再生装置および方法、記録媒体、並びにプログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110301