JP5879169B2 - 字幕同期再生装置およびそのプログラム - Google Patents

字幕同期再生装置およびそのプログラム Download PDF

Info

Publication number
JP5879169B2
JP5879169B2 JP2012068756A JP2012068756A JP5879169B2 JP 5879169 B2 JP5879169 B2 JP 5879169B2 JP 2012068756 A JP2012068756 A JP 2012068756A JP 2012068756 A JP2012068756 A JP 2012068756A JP 5879169 B2 JP5879169 B2 JP 5879169B2
Authority
JP
Japan
Prior art keywords
subtitle
video
display
speed
display time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012068756A
Other languages
English (en)
Other versions
JP2013201606A (ja
Inventor
吉則 和泉
吉則 和泉
木村 武史
武史 木村
井上 誠喜
誠喜 井上
浩行 浜田
浩行 浜田
馬場 秋継
秋継 馬場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2012068756A priority Critical patent/JP5879169B2/ja
Publication of JP2013201606A publication Critical patent/JP2013201606A/ja
Application granted granted Critical
Publication of JP5879169B2 publication Critical patent/JP5879169B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Description

本発明は、映像音声コンテンツを早送り再生する際に、映像音声コンテンツを字幕に同期させて再生させる字幕同期再生装置およびそのプログラムに関する。
従来、デジタルテレビ放送では、映像音声コンテンツ(放送番組)の映像中に、受信機で表示/非表示を切り替えることが可能な字幕(クローズドキャプション)を多重化して伝送している。
この字幕は、放送事業者によって、映像音声コンテンツ内における表示タイミング(表示開始時刻等)、位置、大きさ等が指定されている。そこで、通常、受信機では、その指定された表示タイミング等でしか字幕を表示することができない。
しかし、受信機において、映像音声コンテンツやそれに対応する字幕を一旦蓄積し、早送り再生しようとすると、映像の表示タイミングに同期して字幕の表示時間が短縮され、字幕の可読性が確保されないことになる。
そこで、早送り再生時に、字幕の表示時間を延ばすことで可読に必要な表示時間を確保し、次の字幕の表示タイミングに重なる場合は、字幕の段数を増やすことで、前の字幕と次の字幕とを同時に表示させる技術が開示されている(特許文献1,2参照)。
特開2004−289277号公報 特開2011−61497号公報
従来のように、蓄積された映像音声コンテンツを早送り再生する際に、字幕の表示時間を延ばすと、すでに映像や音声は次の字幕内容に進んでいるにも関わらず、視聴者は、前の字幕を読み進めなければならない。すなわち、従来の手法では、字幕の表示タイミングが、映像や音声とずれてしまうため、映像音声コンテンツの内容を把握することが困難になってしまうという問題がある。
また、従来のように、字幕の段数を変えると、映像音声コンテンツの映像における字幕の領域が増えることになり、映像が見づらくなってしまうという問題がある。さらに、字幕の段数が変化することで、字幕そのものが読みづらくなってしまうという問題がある。
本発明は、以上のような問題に鑑みてなされたものであり、映像音声コンテンツを早送り再生する場合であっても、字幕の可読性を極力保持しつつ、字幕の表示タイミングと映像や音声の再生タイミングとを合わせることが可能な字幕同期再生装置およびそのプログラムを提供することを課題とする。
本発明は、前記課題を解決するために創案されたものであり、まず、請求項1に記載の字幕同期再生装置は、映像音声コンテンツと当該映像音声コンテンツに対応した字幕とを、早送り再生として指定された倍率の再生時間長内で再生する字幕同期再生装置であって、記憶手段と、字幕速度算出手段と、字幕速度判定手段と、表示時間区間設定手段と、字幕再生手段と、映像音声再生手段と、を備え、表示時間区間設定手段が、基準区間設定手段と、短縮区間設定手段と、を備える構成とした。
かかる構成において、字幕同期再生装置は、記憶手段に、映像音声コンテンツと、当該映像音声コンテンツの字幕ごとの字幕文字および当該字幕の時間区間を特定する時間情報を含んだ字幕文字データとを記憶する。この映像音声コンテンツや字幕文字データは、予め記憶手段に記憶したものであってもよいし、放送波や通信回線を介して取得したものを逐次蓄積したものであってもよい。
そして、字幕同期再生装置は、字幕速度算出手段によって、字幕文字データに基づいて、映像音声コンテンツを指定された倍率で再生した場合の再生時間長に対する全字幕の総文字数から、単位時間当たりに表示する字幕の文字数である表示速度を算出する。この表示速度は、その速度が速ければ、字幕を表示している時間長が短いことになり、字幕の可読性を判定する要素となる。
さらに、字幕同期再生装置は、字幕速度判定手段によって、表示速度が予め定めた基準速度を超過するか否かを判定する。この基準速度は、一般的に可読性を確保するために必要とされる4〜6文字/秒程度とする。これによって、指定された倍率の映像音声コンテンツの再生時間長内に字幕を収めた場合の可読性を判定することができる。
そして、字幕同期再生装置は、表示時間区間設定手段によって、字幕速度判定手段の判定結果に基づいて、全字幕を再生時間長内で表示するように各字幕の表示時間区間を設定する。
すなわち、字幕同期再生装置は、字幕速度判定手段で表示速度が基準速度以下であると判定された場合、表示時間区間設定手段の基準区間設定手段によって、字幕ごとに、当該字幕の文字数と基準速度とで特定される表示時間長の区間を表示時間区間として設定する。これによって、表示速度が基準速度を保った状態で、各字幕の表示時間区間が確保される。
一方、字幕速度判定手段で表示速度が基準速度を超過すると判定された場合、表示時間区間設定手段の短縮区間設定手段によって、全字幕の表示時間長の総和が再生時間長となるように、字幕ごとの表示時間長を短縮した区間を表示時間区間として設定する。これによって、再生時間全体に亘って、字幕が表示される区間が確保されることになり、早送り再生の倍率で特定される字幕の時間長よりも長い時間を字幕の表示に用いることができる。
そして、字幕同期再生装置は、字幕再生手段によって、字幕ごとの字幕文字を記憶手段から読み出して、表示時間区間設定手段で設定された、字幕に対応する表示時間区間に表示する。
また、字幕同期再生装置は、映像音声再生手段によって、字幕に対応する映像音声コンテンツを記憶手段から読み出して、当該字幕の表示時間区間に対応する時間長で速度変換して再生する。これによって、字幕の表示時間区間に対応して、映像音声コンテンツが再生されることになる。
また、請求項2に記載の字幕同期再生装置は、請求項1に記載の字幕同期再生装置において、基準区間設定手段が、再生時間長から全字幕の表示時間区間の時間長を減算した時間長を、再生時間長内に、映像音声コンテンツにおいて字幕を表示しない非字幕区間に対応して均等に割り当てることで、表示時間区間を設定することを特徴とする。
かかる構成において、字幕同期再生装置は、基準区間設定手段によって、再生時間長内の字幕の表示時間区間の間に、字幕を表示しない区間を均等に割り当てる。これによって、字幕が一定間隔で表示されることになるとともに、字幕を表示しない映像音声コンテンツの再生時間が確保されることになる。
また、請求項3に記載の字幕同期再生装置は、請求項1に記載の字幕同期再生装置において、基準区間設定手段が、再生時間長内に、映像音声コンテンツにおいて字幕を表示しない非字幕区間の時間長の割合に応じた間隔で表示時間区間を設定することを特徴とする。
かかる構成において、字幕同期再生装置は、基準区間設定手段によって、再生時間長内の字幕の表示時間区間の間に、映像音声コンテンツの字幕を表示しない区間をその時間長に応じて割り当てる。これによって、字幕を表示しない区間の映像音声コンテンツの再生速度が、どの区間においても一定となる。
さらに、請求項4に記載の字幕同期再生装置は、請求項1から請求項3のいずれか一項に記載の字幕同期再生装置において、短縮区間設定手段が、再生時間長内に、全字幕の文字数の総和に対する各字幕の文字数の割合に応じて時間区間を設定することを特徴とする。
かかる構成において、字幕同期再生装置は、短縮区間設定手段によって、字幕の文字数の割合に応じて表示時間区間を設定することで、再生時間全体に亘って字幕速度が一定となる。
また、請求項5に記載の字幕同期再生装置は、請求項1から請求項3のいずれか一項に記載の字幕同期再生装置において、短縮区間設定手段が、再生時間全体に亘って、字幕が表示される区間が確保される再生時間長内に、冒頭ほど単位時間当たりに表示する字幕の文字数が少なくなるように表示時間区間を設定することを特徴とする。
かかる構成において、字幕同期再生装置は、短縮区間設定手段によって、再生時間の冒頭ほど、単位時間当たりに表示する字幕の文字数が少なくすることで、字幕速度が遅くなり、可読性を高めることができる。
さらに、請求項6に記載の字幕同期再生プログラムは、映像音声コンテンツと、当該映像音声コンテンツに対応した字幕ごとの字幕文字および当該字幕の時間区間を特定する時間情報を含んだ字幕文字データとを記憶する記憶手段を備えた字幕同期再生装置において、前記映像音声コンテンツに対して早送り再生として指定された倍率の再生時間長内で前記映像音声コンテンツおよび字幕を再生するために、コンピュータを、字幕速度算出手段、字幕速度判定手段、表示時間区間設定手段、字幕再生手段、映像音声再生手段、として機能させる構成とした。
かかる構成において、字幕同期再生プログラムは、字幕速度算出手段によって、字幕文字データに基づいて、映像音声コンテンツを指定された倍率で再生した場合の再生時間長に対する全字幕の総文字数から、単位時間当たりに表示する字幕の文字数である表示速度を算出する。さらに、字幕同期再生プログラムは、字幕速度判定手段によって、表示速度が予め定めた基準速度を超過するか否かを判定する。
そして、字幕同期再生プログラムは、表示時間区間設定手段によって、字幕速度判定手段の判定結果に基づいて、全字幕を再生時間長内で表示するように各字幕の表示時間区間を設定する。すなわち、字幕速度判定手段で表示速度が基準速度以下であると判定された場合、字幕同期再生プログラムは、表示時間区間設定手段によって、字幕ごとに、当該字幕の文字数と基準速度とで特定される表示時間長の区間を表示時間区間として設定する。
一方、字幕速度判定手段で表示速度が基準速度を超過すると判定された場合、字幕同期再生プログラムは、表示時間区間設定手段によって、全字幕の表示時間長の総和が再生時間長となるように、字幕ごとの表示時間長を短縮した区間を表示時間区間として設定する。
そして、字幕同期再生プログラムは、字幕再生手段によって、字幕ごとの字幕文字を記憶手段から読み出して、表示時間区間設定手段で設定された、字幕に対応する表示時間区間に表示する。また、字幕同期再生プログラムは、映像音声再生手段によって、字幕に対応する映像音声コンテンツを記憶手段から読み出して、当該字幕の表示時間区間に対応する時間長で速度変換して再生する。
本発明は、以下に示す優れた効果を奏するものである。
請求項1,6に記載の発明によれば、映像音声コンテンツを早送り再生する際に、その再生時間長内において、字幕の単位時間当たりの文字数(表示速度)に応じて、字幕の表示時間区間を優先的に設定することができる。これによって、字幕同期再生装置は、映像音声コンテンツを早送り再生する場合であっても、字幕の表示時間が優先的に確保されて、字幕の可読性を極力保持することができる。
また、請求項1,6に記載の発明によれば、字幕の表示時間区間に対応させて映像音声コンテンツを再生させるため、字幕の表示タイミングと映像や音声の再生タイミングとを合わせることができる。これによって、字幕同期再生装置は、映像音声コンテンツを早送り再生する場合であっても、字幕と映像や音声とのタイミングがずれることがない。
請求項2に記載の発明によれば、字幕の表示速度が基準速度以下となる倍率が指定された際に、字幕が一定間隔で表示されるため、次に字幕が表示されるタイミングを、利用者が予測することが可能になり、字幕の可読性を高めることができる。
請求項3に記載の発明によれば、字幕の表示速度が基準速度以下となる倍率が指定された際に、非字幕区間の映像音声コンテンツが一定速度で再生されるため、利用者は、映像音声コンテンツを違和感なく視聴することができる。
請求項4に記載の発明によれば、字幕ごとの文字数が異なる場合であっても、映像音声コンテンツの再生中、字幕速度が一定になるため、字幕が読みやすくなる。
請求項5に記載の発明によれば、早送り再生で字幕速度が速くなる場合であっても、映像音声コンテンツの冒頭の字幕速度を遅くし、徐々に字幕速度を早くすることで、利用者が字幕を読むことに慣れ、コンテンツ全体として字幕の可読性劣化を抑えることができる。
本発明の実施形態に係る字幕同期再生装置の構成を示すブロック構成図である。 図1の表示時間区間設定手段の構成を示すブロック構成図である。 図2の基準区間設定手段における字幕の表示時間区間を設定する手法を説明するための説明図である。 図2の短縮区間設定手段における字幕の表示時間区間を設定する手法を説明するための説明図である。 本発明の実施形態に係る字幕同期再生装置の動作を示すフローチャートである。 図1の字幕同期再生装置の表示時間区間設定手段の他の構成を示すブロック構成図である。 図2の短縮区間設定手段における字幕の表示時間区間を設定する他の手法を説明するための説明図である。 図1の映像音声再生手段における字幕の表示時間区間に映像音声コンテンツの非字幕区間を割り当てる例を説明するための説明図である。
以下、本発明の実施形態について図面を参照して説明する。
[字幕同期再生装置の構成]
まず、図1を参照して、本発明の実施形態に係る字幕同期再生装置1の構成について説明する。
図1に示した字幕同期再生装置1は、映像音声コンテンツと当該映像音声コンテンツに対応した字幕とを、映像音声コンテンツに対して指定された再生倍率の時間長内で再生するものである。ここでは、字幕同期再生装置1は、放送受信手段10と、放送信号解析手段11と、通信送受信手段12と、コンテンツ取得手段13と、記憶手段14と、字幕表示区間制御手段15と、字幕再生手段16と、映像音声再生手段17と、表示手段18と、操作制御手段19と、を備える。
放送受信手段10は、アンテナAを介して、放送データ(放送信号)を受信するものである。この放送受信手段10は、例えば、地上デジタル放送で放送される放送データを受信、復調し、誤り訂正やTMCC(Transmission and Multiplexing Configuration Control)復号等の復号を行い、MPEG2のトランスポートストリーム(TS:Transport Stream)として、放送信号解析手段11に出力する。
なお、この放送受信手段10は、アンテナAを介して、電波によって放送信号を受信するものに限定されず、ケーブルを介して受信するものであってもよい。あるいは、通信データとして放送信号を受信するものであってもよい。
放送信号解析手段11は、放送受信手段10で復調されたストリームデータ(トランスポートストリーム)において、PSI/SI(Program Specific Information〔番組特定情報〕/Service Information〔番組配列情報〕)を解析し、現在選局されている編成チャンネルに対応するデータを抽出するものである。なお、選局は操作制御手段19から指示されるチャンネル切り替え指示に基づいて行われる。
ここでは、放送信号解析手段11は、字幕抽出手段11aと、映像音声抽出手段11bと、を備える。
字幕抽出手段11aは、放送受信手段10で復調されたストリームデータから、現在選局されている編成チャンネルに対応する字幕文字データを抽出するものである。
この字幕抽出手段11aは、操作制御手段19からの指示により字幕文字データの出力先を切り替えて出力する。すなわち、字幕抽出手段11aは、映像音声コンテンツがリアルタイム再生される場合、操作制御手段19からの指示により、字幕再生手段16に字幕文字データを出力する。
また、字幕抽出手段11aは、映像音声コンテンツを蓄積(録画)する場合、操作制御手段19からの指示により、記憶手段14に字幕文字データを書き込む。
映像音声抽出手段11bは、放送受信手段10で復調されたストリームデータから、現在選局されている編成チャンネルに対応する放送番組である映像音声コンテンツを抽出するものである。
この映像音声抽出手段11bは、操作制御手段19からの指示により映像音声コンテンツの出力先を切り替えて出力する。すなわち、映像音声抽出手段11bは、映像音声コンテンツがリアルタイム再生される場合、操作制御手段19からの指示により、映像音声再生手段17に映像音声コンテンツを出力する。
また、映像音声抽出手段11bは、映像音声コンテンツを蓄積(録画)する場合、操作制御手段19からの指示により、記憶手段14に映像音声コンテンツを書き込む。
通信送受信手段12は、通信回線NWを介して、データの通信を行うものである。例えば、TCP/IP等の通信プロトコルによってデータ(通信データ)を、外部のサーバ(図示せず)との間で送受信する。この通信送受信手段12は、コンテンツ取得手段13から要求のあったデータを、外部のサーバから取得し、コンテンツ取得手段13に出力する。
コンテンツ取得手段13は、通信送受信手段12を介して、操作制御手段19から要求のあった映像音声コンテンツや字幕文字データを取得するものである。このコンテンツ取得手段13は、予め設定された、あるいは、操作制御手段19によって指定された外部のサーバ(図示せず)から、映像コンテンツや字幕文字データを取得する。
ここでは、コンテンツ取得手段13は、字幕取得手段13aと、映像音声取得手段13bと、を備える。
字幕取得手段13aは、操作制御手段19から要求のあった映像音声コンテンツに対応する字幕文字データを、通信送受信手段12を介して取得するものである。
この字幕取得手段13aは、操作制御手段19からの指示により字幕文字データの出力先を切り替えて出力する。すなわち、字幕取得手段13aは、映像音声コンテンツがリアルタイム再生される場合、操作制御手段19からの指示により、字幕再生手段16に字幕文字データを出力する。
また、字幕取得手段13aは、映像音声コンテンツを蓄積(録画)する場合、あるいは、すでに、蓄積されている映像音声コンテンツに対して後から字幕を取得する場合、操作制御手段19からの指示により、記憶手段14に字幕文字データを書き込む。
映像音声取得手段13bは、操作制御手段19から要求のあった映像音声コンテンツを、通信送受信手段12を介して取得するものである。
この映像音声取得手段13bは、操作制御手段19からの指示により映像音声コンテンツの出力先を切り替えて出力する。すなわち、映像音声取得手段13bは、映像音声コンテンツがリアルタイム再生される場合、操作制御手段19からの指示により、映像音声再生手段17に映像音声コンテンツを出力する。
また、映像音声取得手段13bは、映像音声コンテンツを蓄積(録画)する場合、操作制御手段19からの指示により、記憶手段14に映像音声コンテンツを書き込む。
記憶手段14は、映像音声コンテンツと、その映像音声コンテンツに対応する字幕文字データとを記憶するものである。この記憶手段14は、例えば、ハードディスク、ブルーレイディスク等の一般的な記憶媒体である。
この記憶手段14に記憶される映像音声コンテンツは、例えば、MPEG2で符号化された符号化データである。この映像音声コンテンツには、当該コンテンツの時間長(番組時間長)が含まれているものとする。
また、記憶手段14に記憶される字幕文字データは、映像音声コンテンツの字幕ごとの字幕文字および当該字幕の時間区間を特定する時間情報を含んだデータである。
ここで、字幕文字データに含まれる字幕文字は、例えば、各字幕の文字数、文字コード等である。
また、字幕の時間区間を特定する時間情報は、例えば、映像音声コンテンツを再生する際に字幕の表示の開始時刻(表示開始時刻)と、表示時間長とで表される情報であってもよいし、開始時刻(表示開始時刻)と、字幕の表示を終了する終了時刻(表示終了時刻)とで表される情報であってもよい。なお、この字幕の開始時刻や終了時刻は、映像音声コンテンツの表示単位に対応したものであって、例えば、時、分、秒およびフレーム番号で表されるタイムコードを用いることができる。
字幕表示区間制御手段15は、操作制御手段19から指示される映像音声コンテンツの再生倍率に対応して、字幕を表示する区間を制御するものである。なお、字幕表示区間制御手段15は、操作制御手段19から、映像音声コンテンツを早送り再生するときの再生倍率が指示された場合に動作し、標準再生(1倍速再生)の場合には動作しないものとする。ここでは、字幕表示区間制御手段15は、字幕速度算出手段15aと、字幕速度判定手段15bと、表示時間区間設定手段15cと、を備える。
字幕速度算出手段15aは、再生倍率で映像音声コンテンツを再生したときの再生時間長に対する全字幕の総文字数から、その再生時間長で全字幕を表示するための字幕表示速度を算出するものである。すなわち、字幕速度算出手段15aは、指定された再生倍率で映像音声コンテンツを再生した際の再生時間長内で、字幕のすべての文字を表示させたときの、単位時間あたりの文字数を算出するものである。なお、字幕速度算出手段15aは、再生倍率については、操作制御手段19から指示され、各字幕の文字数や映像音声コンテンツの時間長については、記憶手段14から取得する。
具体的には、指定された再生倍率をn、各字幕の文字数の総和(総文字数)をW、映像音声コンテンツの時間長(番組長)をTとしたとき、字幕速度算出手段15aは、以下の式(1)により、字幕表示速度Vを算出する。
Figure 0005879169
このように算出された字幕表示速度Vは、字幕速度判定手段15bおよび表示時間区間設定手段15cに出力される。
字幕速度判定手段15bは、字幕速度算出手段15aで算出された字幕表示速度が予め定めた基準速度を超過するか否かを判定するものである。すなわち、字幕速度判定手段15bは、再生倍率で映像音声コンテンツを再生し、その再生倍率に応じて字幕の表示時間を短縮させた場合に、字幕が可読か否かを判定するものである。
一般に、字幕は、標準再生(1倍速再生)時において、1秒あたり4文字〜6文字で表示されるように設定される。すなわち、1秒あたりの文字数が、4文字〜6文字よりも多いと、字幕の可読性が低下する。そこで、字幕速度判定手段15bは、例えば、字幕表示速度の基準速度を4文字/秒とする。なお、この基準速度は、予め定めた速度でもよいし、操作制御手段19によって、例えば、初期設定等によって設定された速度でもよい。
この字幕速度判定手段15bは、字幕表示速度が基準速度を超過するか否かの判定結果を表示時間区間設定手段15cに出力する。
表示時間区間設定手段15cは、字幕速度判定手段15bの判定結果に基づいて、全字幕を、映像音声コンテンツの再生時間長内で表示するように各字幕の再生時間に対する表示時間区間を設定するものである。
ここで、図2を参照(適宜図1参照)して、表示時間区間設定手段15cの構成についてさらに詳細に説明する。字幕速度判定手段15bの字幕速度の判定結果が、字幕速度算出手段15aで算出された字幕表示速度が基準速度以下であるという判定であれば、映像音声コンテンツの再生時間長内で、字幕の文字すべてを基準速度以下で表示することができることになる。
一方、判定結果が、字幕表示速度が基準速度を超過するという判定であれば、映像音声コンテンツの再生時間長内で、字幕の文字すべてを基準速度以下で表示することはできないことになる。
そこで、表示時間区間設定手段15cは、字幕速度判定手段15bの判定結果に基づいて、字幕の表示時間区間を分けて設定するため、基準区間設定手段151と、短縮区間設定手段152と、を備える。
基準区間設定手段151は、字幕速度判定手段15bで字幕表示速度が基準速度以下であると判定された場合、字幕ごとに、当該字幕の文字数と基準速度とに応じた字幕の表示時間長の区間を字幕の表示時間区間として設定するものである。ここでは、基準区間設定手段151は、基準表示時間長算出手段151aと、基準区間配置手段151bと、を備える。
基準表示時間長算出手段151aは、字幕を基準速度で表示するために必要となる時間長を算出するものである。すなわち、基準表示時間長算出手段151aは、字幕ごとに、記憶手段14に記憶されている字幕文字データに含まれている文字数を、可読判定の規準となる基準速度で除算することで、当該字幕の表示時間長を算出する。
具体的には、ある字幕Nの文字数をW、基準速度をVTHとしたとき、基準表示時間長算出手段151aは、以下の式(2)により、字幕Nの表示時間長TWNを算出する。
Figure 0005879169
このように算出された字幕の表示時間長は、基準区間配置手段151bに出力される。
基準区間配置手段151bは、映像音声コンテンツの再生時間長内に、基準表示時間長算出手段151aで算出された時間長に応じて各字幕を配置するものである。
ここでは、基準区間配置手段151bは、前記式(2)で算出された表示時間長の字幕の表示時間区間を、再生倍率で映像音声コンテンツを再生したときの再生時間内に配置する。例えば、基準区間配置手段151bは、映像音声コンテンツの再生時間内に均等の間隔で字幕の表示時間区間を配置する。あるいは、基準区間配置手段151bは、映像音声コンテンツの再生時間内に、標準再生(1倍速再生)における映像音声コンテンツの字幕を表示しない区間(非字幕区間)の時間長の割合に応じた間隔を空けて、字幕の表示時間区間を配置することとしてもよい。
ここで、図3を参照して、基準区間設定手段151における字幕の表示時間区間を設定する手法について説明する。
図3(a)は、標準再生(1倍速再生)における映像音声コンテンツVAの再生時間長(番組長T)と、字幕区間C,C,…,Cとを、時間方向に沿って対応付けて図示したものである。
このとき、映像音声コンテンツVAをn倍速で再生しようとすると、その時間長は、図3(b)に示すように、T/nとなる。
そして、図3(b)に示すように、基準区間配置手段151bは、映像音声コンテンツVAの再生時間(番組長T/n)内に、非字幕区間が等間隔になるように字幕表示区間を配置する。すなわち、基準区間配置手段151bは、番組長T/n内に前記式(2)で計算したそれぞれの字幕区間C,C,…,Cに対応する表示時間長で、字幕の表示時間区間CD1,CD2,…,CDNを配置する。このとき、基準区間配置手段151bは、番組長T/nから字幕の表示時間区間CD1,CD2,…,CDNの時間長を減算した時間を非字幕区間数に応じて均等に割り当てた時間tを、表示時間区間CD1,CD2,…,CDNの間隔とする。
なお、映像音声コンテンツVAにおいて、表示時間区間の間に、非字幕区間が存在せず、表示時間区間が連続している場合、基準区間配置手段151bは、非字幕区間として時間tを割り当てる必要はない。
あるいは、図3(c)に示すように、基準区間配置手段151bは、映像音声コンテンツVAの再生時間内に、標準再生(1倍速再生)における映像音声コンテンツVAの非字幕区間の時間長の割合に応じた間隔を空けて、字幕の表示時間区間を配置する。すなわち、基準区間配置手段151bは、番組長T/n内に前記式(2)で計算したそれぞれの字幕区間C,C,…,Cに対応する表示時間長で、字幕の表示時間区間CD1,CD2,…,CDNを配置する。このとき、基準区間配置手段151bは、図3(c)に示すように、番組長T/nから字幕の表示時間区間CD1,CD2,…,CDNの時間長を減算した時間を図3(a)に示した標準再生における映像音声コンテンツVAの非字幕区間の時間T,T,…,T,TN+1の割合に応じた間隔t,t,…,t,tN+1に分配して、表示時間区間CD1,CD2,…,CDNの間隔とする。
なお、ここでは、図3(a)に示したように、最初の字幕区間Cの前と、最後の字幕区間Cの後とに、字幕が存在しない非字幕区間を含んだ例を示しているが、この非字幕区間が含まれていない場合は、図3(b),(c)において、表示時間区間CD1の前や、表示時間区間CDNの後に時間t,t,tN+1の区間を配置する必要はない。
図2に戻って、表示時間区間設定手段15cの構成について説明を続ける。
短縮区間設定手段152は、字幕速度判定手段15bで字幕表示速度が基準速度を超過すると判定された場合、全字幕の表示時間長の総和が、映像音声コンテンツの再生時間長となるように、字幕ごとの表示時間長を短縮した区間を字幕の表示時間区間として設定するものである。ここでは、短縮区間設定手段152は、短縮表示時間長算出手段152aと、短縮区間配置手段152bと、を備える。
短縮表示時間長算出手段152aは、映像音声コンテンツの再生時間内で字幕を表示するために必要となる時間長を字幕ごとに算出するものである。ここでは、短縮表示時間長算出手段152aは、記憶手段14に記憶されている字幕文字データに基づいて、映像音声コンテンツの再生時間長において、全字幕の文字数の総和(総文字数)に対する各字幕の文字数の割合に相当する時間長を、当該字幕の表示時間長として算出する。
具体的には、指定された再生倍率をn、全字幕の文字数の総和(総文字数)をW、映像音声コンテンツの時間長(番組時間長)をT、ある字幕Nの文字数をWとしたとき、短縮表示時間長算出手段152aは、以下の式(3)により、字幕Nの表示時間長TWNを算出する。
Figure 0005879169
このように算出された字幕の表示時間長は、短縮区間配置手段152bに出力される。
短縮区間配置手段152bは、映像音声コンテンツの再生時間長内に、短縮表示時間長算出手段152aで算出された時間長の各字幕を配置するものである。
ここでは、短縮区間配置手段152bは、前記式(3)で算出された表示時間長の字幕の表示時間区間を、連続して接続するように配置する。
ここで、図4を参照して、短縮区間設定手段152における字幕の表示時間区間を設定する手法について説明する。
図4(a)は、標準再生(1倍速再生)における映像音声コンテンツVAの再生時間長(番組長T)と、字幕区間C,C,…,Cとを、時間方向に沿って対応付けて図示したものである。
このとき、映像音声コンテンツVAをn倍速で再生したとすると、その時間長は、図4(b)に示すように、T/nとなる。一方、字幕は、字幕速度判定手段15bで字幕表示速度が基準速度を超過すると判定されていることから、字幕を基準速度で表示すると、全字幕の表示時間長は、映像音声コンテンツVAの再生時間長(番組長T/n)を超過してしまう。
そこで、短縮表示時間長算出手段152aは、前記式(3)により、字幕の表示時間区間CD1,CD2,…,CDNの表示時間長を算出する。これによって、表示時間区間CD1,CD2,…,CDNの表示時間長の総和は、映像音声コンテンツVAの再生時間長(番組長T/n)となる。また、このとき、各表示時間区間CD1,CD2,…,CDNの表示時間長は、式(3)により、文字数に応じた時間長となるため、単位時間当たりの表示文字数(字幕表示速度)は一定となる。
以上説明したように、表示時間区間設定手段15cは、映像音声コンテンツの再生時間長に、字幕の表示時間区間を設定することができる。
そして、表示時間区間設定手段15c(基準区間配置手段151bおよび短縮区間配置手段152b)は、字幕の表示時間区間を特定する情報(字幕表示時間区間情報)を、字幕再生手段16および映像音声再生手段17に出力する。
なお、この字幕表示時間区間情報は、具体的には、各字幕の表示時間区間の表示開始時刻および表示終了時刻、あるいは、表示時間区間の表示開始時刻および表示時間長を含み、各字幕の表示時間区間が、記憶手段14に記憶されている字幕文字データのどの字幕に対応するのかを示す情報(例えば、映像音声コンテンツの最初の字幕から連続して付したシリアル番号等)である。これによって、それぞれの字幕と、その字幕を表示する表示時間区間とが対応付けられることになる。
図1に戻って、字幕同期再生装置1の構成について説明を続ける。
字幕再生手段16は、映像音声コンテンツに対応する字幕を再生するものである。
ここでは、操作制御手段19からの指示により、記憶手段14に記憶されている映像音声コンテンツを再生するタイムシフト再生において早送り再生する旨が指示された場合、字幕再生手段16は、字幕表示区間制御手段15から出力される字幕表示時間区間情報で特定される字幕の表示時間区間ごとに、表示時間区間の表示開始時刻に当該区間に対応する字幕文字を記憶手段14から読み出して表示手段18に出力する。また、字幕再生手段16は、表示時間区間の表示終了時刻に達した段階、あるいは、表示時間長の時間が経過した段階で、表示手段18への字幕の出力を停止する。
なお、操作制御手段19からの指示により、放送波を介して受信した映像音声コンテンツをリアルタイム再生する場合、字幕再生手段16は、放送信号解析手段11の字幕抽出手段11aで抽出された字幕文字データで特定される字幕ごとに、映像音声コンテンツの再生開始からの時刻が表示開始時刻に達した段階で、当該字幕の字幕文字を表示手段18に出力する。
そして、字幕再生手段16は、字幕ごとに、映像音声コンテンツの再生開始からの時刻が表示終了時刻に達した段階、あるいは、表示時間長の時間が経過した段階で、表示手段18への字幕の出力を停止する。
また、操作制御手段19からの指示により、通信回線NWを介して取得した映像音声コンテンツをリアルタイム再生する場合、字幕再生手段16は、コンテンツ取得手段13の字幕取得手段13aから字幕文字データを入力すること以外、放送波を介して受信した字幕を再生する場合と同様の処理を行う。
また、操作制御手段19からの指示により、記憶手段14に記憶されている映像音声コンテンツを再生するタイムシフト再生において標準再生(1倍速再生)が指示された場合、字幕再生手段16は、記憶手段14から字幕文字データを読み出すこと以外、放送波を介して受信した字幕を再生する場合と同様の処理を行う。
映像音声再生手段17は、映像音声コンテンツを復号するとともに、再生倍率に応じて変化する字幕の表示時間区間に対応して映像音声コンテンツの再生速度を変換するものである。ここでは、映像音声再生手段17は、復号手段17aと、画速変換手段17bと、話速変換手段17cと、を備える。
復号手段17aは、映像音声コンテンツを復号するものである。なお、この復号は、例えば、映像音声コンテンツがMPEG2符号化方式で符号化されたものであれば、MPEG2に対応した復号処理である。
ここでは、復号手段17aは、放送波を介して受信した映像音声コンテンツを再生する場合、放送信号解析手段11の映像音声抽出手段11bで抽出された映像音声コンテンツを復号し、通信回線NWを介して取得した映像音声コンテンツを再生する場合、コンテンツ取得手段13の映像音声取得手段13bで取得された映像音声コンテンツを復号する。
また、復号手段17aは、記憶手段14に記憶されている映像音声コンテンツを再生する場合、操作制御手段19から指示された映像音声コンテンツを記憶手段14から読み出して復号する。
なお、操作制御手段19からの指示により、映像音声コンテンツをリアルタイム再生、あるいは、タイムシフト再生における標準再生(1倍速再生)で再生する場合、復号手段17aは、復号した映像音声コンテンツを表示手段18に出力する。
一方、操作制御手段19からの指示により、映像音声コンテンツを早送り再生する場合、復号手段17aは、復号した映像音声コンテンツのうち、映像信号については画速変換手段17bに、音声信号については話速変換手段17cにそれぞれ出力する。
画速変換手段17bは、字幕表示区間制御手段15から出力される字幕表示時間区間情報に基づいて、映像音声コンテンツの映像信号を速度変換するものである。
ここでは、画速変換手段17bは、記憶手段14に記憶されている字幕文字データのうちで、字幕表示時間区間情報で特定される字幕の標準再生時における表示開始時刻および表示終了時刻に対応する映像音声コンテンツの映像信号を、字幕表示時間区間情報で特定される字幕の表示時間区間の時間長に速度変換する。
また、画速変換手段17bは、字幕表示時間区間情報で特定される字幕の表示時間区間が連続していない場合、すなわち、字幕が存在しない区間については、直前の字幕の標準再生時における表示終了時刻後から、次の字幕の標準再生時における表示開始時刻の直前までの映像音声コンテンツの映像信号を、前後の字幕の表示時間区間の間の時間長に速度変換する。
なお、このとき、直前に字幕が存在していない場合、画速変換手段17bは、映像音声コンテンツの最初から、次の字幕の標準再生時における表示開始時刻の直前までの映像信号を、速度変換の対象とする。また、次の字幕が存在していない場合、画速変換手段17bは、直前の字幕の標準再生時における表示終了時刻後から、映像音声コンテンツの最後までの映像信号を、速度変換の対象とする。
この画速変換手段17bにおける速度変換は、一般的な画速変換技術を用いればよい。例えば、画速変換手段17bは、記憶手段14に記憶されている字幕文字データで特定される字幕の標準再生時の時間長と、字幕表示時間区間情報で特定される表示時間区間の時間長との比に応じて、標準再生時の字幕区間に対応する映像信号をフレーム単位で間引くことで、再生時間長を短くすることができる。
この画速変換手段17bは、画速変換を行った映像信号を、順次、表示手段18に出力する。
話速変換手段17cは、字幕表示区間制御手段15から出力される字幕表示時間区間情報に基づいて、映像音声コンテンツの音声信号を速度変換するものである。
ここでは、話速変換手段17cは、記憶手段14に記憶されている字幕文字データのうちで、字幕表示時間区間情報で特定される字幕の標準再生時における表示開始時刻および表示終了時刻に対応する映像音声コンテンツの音声信号を、字幕表示時間区間情報で特定される字幕の表示時間区間の時間長に速度変換する。
また、話速変換手段17cは、字幕表示時間区間情報で特定される字幕の表示時間区間が連続していない場合、すなわち、字幕が存在しない区間については、直前の字幕の標準再生時における表示終了時刻後から、次の字幕の標準再生時における表示開始時刻の直前までの映像音声コンテンツの音声信号を、前後の字幕の表示時間区間の間の時間長に速度変換する。
なお、このとき、直前に字幕が存在していない場合、話速変換手段17cは、映像音声コンテンツの最初から、次の字幕の標準再生時における表示開始時刻の直前までの音声信号を、速度変換の対象とする。また、次の字幕が存在していない場合、話速変換手段17cは、直前の字幕の標準再生時における表示終了時刻後から、映像音声コンテンツの最後までの音声信号を、速度変換の対象とする。
この話速変換手段17cにおける速度変換は、一般的な話速変換技術を用いればよい。例えば、話速変換手段17cは、記憶手段14に記憶されている字幕文字データで特定される字幕の標準再生時の時間長と、字幕表示時間区間情報で特定される字幕の表示時間区間の時間長との比に応じて、音声ピッチ(基本周波数)の周期で、音声波形の間引きを行い、音声波形どうしを順次重ね合わせて接続すればよい。
この話速変換手段17cは、話速変換を行った音声信号を、順次、表示手段18に出力する。
表示手段18は、映像音声再生手段17で再生された音声信号を表示するとともに、映像音声再生手段17で再生された映像信号に字幕再生手段16で再生された字幕を合成して表示するものである。
なお、表示手段18は、音声信号については、外部に接続されたスピーカ等の音声出力装置Spに出力し、映像信号については、外部に接続された液晶ディスプレイ等の映像表示装置Moに出力する。
操作制御手段19は、外部に接続されたリモコン装置等の入力装置Riからの操作信号を入力して、字幕同期再生装置1内の各手段の動作を制御するものである。
例えば、操作制御手段19は、入力装置Riから、テレビ放送のチャンネル切り替えを指示されることで、放送信号解析手段11に対して、選択されたチャンネルを示すチャンネル切り替え指示を通知する。
また、例えば、操作制御手段19は、入力装置Riを介して、外部のサーバから映像音声コンテンツや字幕を取得する旨を指示されることで、コンテンツ取得手段13に対して、映像音声コンテンツ等の所在を特定する情報(例えば、サーバのIPアドレス、映像音声コンテンツのファイル名等の識別情報)を、コンテンツ取得手段13に通知する。
また、操作制御手段19は、映像音声コンテンツや字幕をリアルタイム再生するのか、あるいは、蓄積するのかを、入力装置Riを介して指示されることで、放送信号解析手段11やコンテンツ取得手段13に対して、映像音声コンテンツや字幕の出力先を切り替える指示を行う。
また、操作制御手段19は、記憶手段14に記憶されている映像音声コンテンツを再生(タイムシフト再生)させる指示を、入力装置Riを介して指示されることで、字幕再生手段16や映像音声再生手段17に対して、記憶手段14に記憶されている字幕や映像音声コンテンツを再生させる旨を指示する。さらに、操作制御手段19は、入力装置Riを介して、早送り再生が指示された場合、字幕表示区間制御手段15に対して、再生倍率を通知する。
以上のように字幕同期再生装置1を構成することで、字幕同期再生装置1は、映像音声コンテンツを再生する際に、字幕の表示速度(単位時間当たりの文字数)を優先し、字幕の表示時間に同期して、それぞれの字幕に対応する映像音声コンテンツを再生することができる。これによって、字幕同期再生装置1は、映像音声コンテンツを早送り再生する場合に、最大で、再生倍率に基づく再生時間長分まで、字幕の表示時間を確保するこができ、字幕の可読性を極力保持することができる。
なお、字幕同期再生装置1は、コンピュータを前記した各手段として機能させるプログラム(字幕同期再生プログラム)によって動作させることができる。
[字幕同期再生装置の動作]
次に、図5を参照(構成については適宜図1,図2参照)して、本発明の実施形態に係る字幕同期再生装置1の動作について説明する。なお、字幕同期再生装置1において、映像音声コンテンツのリアルタイム再生や、一旦蓄積した映像音声コンテンツの標準再生(1倍速再生)は、一般的な動作であるため、ここでは説明を省略し、早送り再生(n倍速再生)の動作についてのみ説明する。また、図5中、「映音」は「映像音声コンテンツ」を示す。
まず、字幕同期再生装置1は、操作制御手段19によって、外部の入力装置Riを介して、利用者(視聴者)が所望する再生倍率nと、再生を行う映像音声コンテンツ(番組)を特定する情報(番組名、ファイル名等)を入力する(ステップS1)。
そして、字幕同期再生装置1は、字幕表示区間制御手段15の字幕速度算出手段15aによって、ステップS1で指定された、記憶手段14に記憶されている映像音声コンテンツおよびそれに対応する字幕文字データから、映像音声コンテンツの標準再生における時間長(番組長T)と、全字幕の総文字数Wとを取得し、ステップS1で指定された再生倍率nから、前記式(1)により、字幕表示速度Vを算出する(ステップS2)。
そして、字幕同期再生装置1は、字幕速度判定手段15bによって、ステップS2で算出された字幕表示速度Vが、予め定めた基準速度VTH以下であるかを判定する(ステップS3)。
ここで、字幕表示速度Vが基準速度VTH以下であった場合(ステップS3でYes)、字幕同期再生装置1は、表示時間区間設定手段15cの基準区間設定手段151によって、映像音声コンテンツの再生時間内に、字幕ごとに、当該字幕の文字数と基準速度VTHとに応じた字幕の表示時間区間を設定する。
すなわち、字幕同期再生装置1は、基準区間設定手段151の基準表示時間長算出手段151aによって、記憶手段14に記憶されている字幕文字データから、字幕ごとの文字数を取得し、ある字幕Nの文字数をWとしたとき、前記式(2)により、字幕Nの表示時間長TWNを算出する(ステップS4)。
そして、字幕同期再生装置1は、基準区間設定手段151の基準区間配置手段151bによって、映像音声コンテンツを再生倍率nで再生したときの再生時間内に、非字幕区間が等間隔になるように字幕の表示時間区間を配置し(図3(b)参照)、各字幕の表示時間区間における表示開始時刻と表示終了時刻とを設定する(ステップS5)。ここで、各表示時間区間の間は、字幕が存在しない字幕非表示時間区間に対応する。
なお、ここでは、映像音声コンテンツの再生時間内に等間隔で字幕の表示時間区間を設定したが、標準再生した際の映像音声コンテンツの非字幕区間の時間長の割合に応じた間隔を空けて、字幕の表示時間区間を設定してもよい(図3(c)参照)。
これによって、映像音声コンテンツの再生時間内に、基準速度で字幕を表示する区間に相当する表示時間区間が設定されることになる。
一方、字幕表示速度Vが基準速度VTHを超過した場合(ステップS3でNo)、字幕同期再生装置1は、表示時間区間設定手段15cの短縮区間設定手段152によって、再生倍率で映像音声コンテンツを再生した際の再生時間内に収まるように、字幕ごとの表示時間長を短縮した字幕の表示時間区間を設定する。
すなわち、字幕同期再生装置1は、短縮区間設定手段152の短縮表示時間長算出手段152aによって、記憶手段14に記憶されている字幕文字データから、字幕ごとの文字数を取得し、ある字幕Nの文字数をW、全字幕の文字数の総和(総文字数)をW、映像音声コンテンツの時間長(番組時間長)をTとしたとき、前記式(3)により、字幕Nの表示時間長TWNを算出する(ステップS6)。
そして、字幕同期再生装置1は、短縮区間設定手段152の短縮区間配置手段152bによって、映像音声コンテンツを再生倍率nで再生したときの再生時間内に、ステップS6で算出した字幕の表示時間区間を連続して接続するように配置し(図4(b)参照)、各字幕の表示時間区間における表示開始時刻と表示終了時刻とを設定する(ステップS7)。
これによって、映像音声コンテンツの再生時間内のすべてに、字幕の文字数に応じた字幕の表示時間区間が設定されることになる。この場合、映像音声コンテンツの再生時間内には、字幕非表示時間区間は設定されないことになる。
このように、ステップS5またはステップS7において、字幕の表示時間区間(表示開始時刻、表示終了時刻)が設定された後、字幕同期再生装置1は、ステップS8以降の動作に進む。
ステップS5またはステップS7の動作後、字幕同期再生装置1は、字幕再生手段16および映像音声再生手段17によって、映像音声コンテンツの早送り再生(n倍速再生)の開始時刻から経過時間に同期して、字幕および映像音声コンテンツの再生を行う。
まず、字幕同期再生装置1は、字幕再生手段16および映像音声再生手段17によって、再生開始時刻からの経過時間が、ステップS5またはステップS7において設定された字幕の表示時間区間内の時刻か否かを判定する。すなわち、経過時間が表示時間区間に達したときに、字幕の再生が必要であると判定し、表示時間区間を経過したときに、字幕の再生が不要であると判定する(ステップS8)。
ここで、字幕の再生が必要であると判定された場合(ステップS8でYes)、字幕同期再生装置1は、字幕再生手段16によって、字幕の表示時間区間の時間長だけ字幕を再生し、表示させる(ステップS9)。すなわち、字幕再生手段16は、字幕の表示時間区間の表示開始時刻に、当該表示時間区間に対応する字幕文字を記憶手段14から読み出して表示手段18に出力して字幕を表示させ、経過時間が表示時間区間の表示終了時刻に達した段階で、表示手段18への字幕文字の出力を停止する。
また、ステップS9と並行して、字幕同期再生装置1は、映像音声再生手段17によって、標準再生時における字幕の表示開始時刻から表示終了時刻までの映像音声コンテンツを、字幕の表示時間区間の時間長で速度変換して再生し、表示させる(ステップS10)。
このとき、映像音声再生手段17は、復号手段17aによって映像音声コンテンツを復号しつつ、画速変換手段17bによって、標準再生時における字幕の表示開始時刻から表示終了時刻までの映像音声コンテンツの映像信号を、字幕の表示時間区間の時間長となるように画速変換する。また、画速変換と同時に、話速変換手段17cによって、標準再生時における字幕の表示開始時刻から表示終了時刻までの映像音声コンテンツの音声信号を、字幕の表示時間区間の時間長となるように話速変換する。
一方、字幕の再生が必要でないと判定された場合(ステップS8でNo)、字幕同期再生装置1は、映像音声再生手段17によって、標準再生時における字幕の非表示時間区間の映像音声コンテンツを、字幕表示時間区間情報で特定される字幕非表示時間区間の時間長で速度変換して再生し、表示させる(ステップS11)。
このとき、映像音声再生手段17は、復号手段17aによって映像音声コンテンツを復号しつつ、画速変換手段17bによって、直前の字幕の標準再生時における表示終了時刻後から、次の字幕の標準再生時における表示開始時刻の直前までの映像音声コンテンツの映像信号を対象として画速変換を行う。また、画速変換と同時に、話速変換手段17cによって、直前の字幕の標準再生時における表示終了時刻後から、次の字幕の標準再生時における表示開始時刻の直前までの映像音声コンテンツの音声信号を対象として話速変換を行う。
なお、画速変換手段17bおよび話速変換手段17cは、直前に字幕が存在していない場合、映像音声コンテンツの最初から速度変換を行い、次の字幕が存在していない場合、映像音声コンテンツの最後まで速度変換を行う。
そして、字幕同期再生装置1は、字幕再生手段16および映像音声再生手段17によって、再生開始時刻からの経過時間において、さらに字幕の表示時間区間または字幕非表示時間区間が存在するか否かを判定する(ステップS12)。
そして、字幕の表示時間区間または字幕非表示時間区間が存在する場合(ステップS12でYes)、字幕同期再生装置1は、ステップS8に戻って、当該区間における映像音声コンテンツおよび字幕の再生を行う。一方、字幕の表示時間区間および字幕非表示時間区間が存在しない場合(ステップS12でNo)、字幕同期再生装置1は、再生動作を終了する。
以上の動作によって、字幕同期再生装置1は、映像音声コンテンツを再生する際に、字幕の表示速度(単位時間当たりの文字数)を優先し、字幕の表示時間に同期して、それぞれの字幕に対応する映像音声コンテンツを再生することができる。
以上、本発明の実施形態に係る字幕同期再生装置1の構成および動作について説明したが、本発明は、この実施形態に限定されるものではない。例えば、以下に示す種々の変形を行うことができる。
(変形例1)
字幕同期再生装置1では、図4(b)に示すように、基準速度で字幕を表示すると、再生倍率nで再生した際の映像音声コンテンツの再生時間長(番組長T/n)を超過する場合、図2で説明した表示時間区間設定手段15cの短縮区間設定手段152によって、各字幕の表示時間長を文字数に応じて短縮することで、字幕速度を一定にして、字幕の総表示時間長を映像音声コンテンツの再生時間長とした。
しかし、この字幕の表示時間長を短縮させる場合に、必ずしも字幕速度を一定にする必要はない。例えば、映像音声コンテンツの冒頭部分は、字幕をゆっくり表示させ、後ろに行くほど、字幕の表示速度を速くすることとしてもよい。これによって、字幕の平均表示速度が基準速度よりも速くなる場合であっても、冒頭部分でゆっくり字幕を表示させることで、利用者(視聴者)が字幕の表示速度に徐々に慣れて、字幕の可読性を高めることができる。
例えば、字幕同期再生装置1の表示時間区間設定手段15cを、図2で説明した構成から、図6に示す構成(表示時間区間設定手段15Bc)に替えることで、字幕の表示速度を変えることができる。ここで、図6を参照(適宜図1参照)して、表示時間区間設定手段15Bcについて説明する。
ここでは、表示時間区間設定手段15Bcは、基準区間設定手段151と、短縮区間設定手段152Bと、を備える。基準区間設定手段151は、図2で説明した表示時間区間設定手段15cの構成と同一であるため、同じ符号を付して説明を省略する。
短縮区間設定手段152Bは、字幕速度判定手段15bで字幕表示速度が基準速度を超過すると判定された場合、全字幕の表示時間長の総和が、映像音声コンテンツの再生時間長となり、かつ、字幕の表示速度が再生時間の冒頭ほど遅く、後ろに行くほど速くするように、字幕ごとの表示時間長を短縮した区間を字幕の表示時間区間として設定するものである。例えば、ここでは、図2で説明した表示時間区間設定手段15cで設定された表示時間区間で字幕を表示した際の字幕表示速度に対して、冒頭の1/3の部分については0.8倍速、中間の1/3の部分については1倍速、後ろの1/3の部分については、1.2倍速と、速度を変えることとする。
ここで、短縮区間設定手段152Bは、短縮表示時間長算出手段152Baと、短縮区間配置手段152bと、を備える。短縮区間配置手段152bは、図2で説明した表示時間区間設定手段15cの構成と同一であるため、同じ符号を付して説明を省略する。
短縮表示時間長算出手段152Baは、映像音声コンテンツの再生時間内で字幕を表示するために必要となる時間長を字幕ごとに算出するものである。
具体的には、短縮表示時間長算出手段152Baは、全字幕の文字数の総和(総文字数)に対して冒頭から(0.8)/3の文字数分の字幕と、中間の1/3の文字数分の字幕と、後ろの(1.2)/3の文字数分の字幕とを、それぞれ、映像音声コンテンツの再生時間長の1/3の時間長になるように各字幕の時間長を算出する。
例えば、指定された再生倍率をn、全字幕の文字数の総和(総文字数)をW、映像音声コンテンツの時間長(番組時間長)をTとしたとき、短縮表示時間長算出手段152Baは、各字幕の文字数を冒頭から累計し、累計文字数が、総文字数Wの(0.8)/3以下の字幕Nについては、以下の式(4)により、字幕Nの表示時間長TWNを算出する。
Figure 0005879169
また、短縮表示時間長算出手段152Baは、累計文字数が、総文字数Wの(0.8)/3から(0.8+1)/3以下となる字幕Nについては、以下の式(5)により、字幕Nの表示時間長TWNを算出する。
Figure 0005879169
さらに、短縮表示時間長算出手段152Baは、累計文字数が、総文字数Wの(0.8+1)/3を超える字幕Nについては、以下の式(6)により、字幕Nの表示時間長TWNを算出する。
Figure 0005879169
なお、字幕文字数を累計する際に、総文字数の(0.8)/3や(0.8+1)/3を跨る字幕については、その境で字幕を区分して、それぞれ算出した表示時間長を加算すればよい。
例えば、ある字幕Nの文字数Wのうちで、WN1までの文字が、総文字数Wの(0.8)/3以下に該当し、それ以降の文字が、総文字数Wの(0.8)/3から(0.8+1)/3以下に該当する場合、短縮表示時間長算出手段152Baは、以下の式(7)により、字幕Nの表示時間長TWNを算出する。
Figure 0005879169
ここで、図7を参照して、短縮区間設定手段152Bにおける字幕の表示時間区間を設定する手法について説明する。
図7(a)は、標準再生(1倍速再生)における映像音声コンテンツVAの再生時間長(番組長T)と、字幕区間C,C,…,Cとを、時間方向に沿って対応付けて図示したものである。
ここで、映像音声コンテンツVAをn倍速で再生し、字幕を基準速度で表示したときに、全字幕の表示時間長が、映像音声コンテンツVAの再生時間長(番組長T)を超過してしまうとする。このとき、短縮表示時間長算出手段152Baは、図7(b)に示すように、字幕の総文字数に対して、冒頭の(0.8)/3、中間の1/3、後ろの(1.2)/3に該当する字幕を、それぞれ、映像音声コンテンツVAの再生時間長(番組長T/n)の1/3となるように、表示時間長を短縮する。
これによって、中間部分で字幕速度がZであったとすると、冒頭部分では0.8Zの字幕速度、後ろ部分では1.2Zの字幕速度となり、冒頭部分の方が後ろ部分よりもゆっくり字幕が表示されるようになる。
なお、この字幕速度を変更する区分やその倍率は一例であって、さらに細かく区分しても構わない。
(変形例2)
また、字幕同期再生装置1では、短縮区間設定手段152(図2)や短縮区間設定手段152B(図6)において、字幕を連続して接続することで、非字幕区間に対応する映像音声コンテンツについては、再生を省略している。
しかし、早送り再生する場合、字幕同期再生装置1では、非字幕区間の映像音声コンテンツについて、仮想的に字幕の表示時間区間に割り当てることとしてもよい。
例えば、映像音声再生手段17の画速変換手段17bや話速変換手段17cにおいて、字幕表示区間制御手段15から出力される字幕表示時間区間情報で特定される字幕の表示時間区間が映像音声コンテンツにおいて非連続である場合、その非連続の部分を表示時間区間に割り当てる。
ここで、図8を参照して、字幕の表示時間区間に映像音声コンテンツの非字幕区間を割り当てる例について説明する。
図8(a)に示すように、映像音声コンテンツVAにおいて、字幕区間C,Cに対応付けられていない非字幕区間NV,NVが存在していたとする。
このとき、例えば、冒頭の非字幕区間については、図8(b)に示すように、最初の字幕区間Cに属するものとする。また、例えば、字幕区間C,Cの間の非字幕区間NVについては、前の字幕区間Cに属するものとする。
また、例えば、字幕区間C,Cの間の非字幕区間NVについては、前の字幕区間Cと、後ろの字幕区間Cとのそれぞれの表示時間長の割合(X:Y)に応じて、非字幕区間NVを、前の字幕区間Cと後ろの字幕区間Cと割り当てることとしてもよい。
(変形例3)
また、ここでは、字幕同期再生装置1が、映像音声コンテンツや字幕を、放送波を介して受信したり、外部サーバから通信回線を介して取得したりすることとしたが、少なくとも、記憶手段14に映像音声コンテンツや字幕が蓄積された状態であれば、本発明を実施することができる。
すなわち、字幕同期再生装置1の構成から、放送受信手段10および放送信号解析手段11を省略してもよい。また、字幕同期再生装置1の構成から、通信送受信手段12およびコンテンツ取得手段13を省略してもよい。
1 字幕同期再生装置
10 放送受信手段
11 放送信号解析手段
11a 字幕抽出手段
11b 映像音声抽出手段
12 通信送受信手段
13 コンテンツ取得手段
13a 字幕取得手段
13b 映像音声取得手段
14 記憶手段
15 字幕表示区間制御手段
15a 字幕速度算出手段
15b 字幕速度判定手段
15c 表示時間区間設定手段
151 基準区間設定手段
151a 基準表示時間長算出手段
151b 基準区間配置手段
152 短縮区間設定手段
152a 短縮表示時間長算出手段
152b 短縮区間配置手段
16 字幕再生手段
17 映像音声再生手段
17a 復号手段
17b 画速変換手段
17c 話速変換手段
18 表示手段
19 操作制御手段

Claims (6)

  1. 映像音声コンテンツと当該映像音声コンテンツに対応した字幕とを、早送り再生として指定された倍率の再生時間長内で再生する字幕同期再生装置であって、
    前記映像音声コンテンツと、当該映像音声コンテンツの字幕ごとの字幕文字および当該字幕の時間区間を特定する時間情報を含んだ字幕文字データとを記憶する記憶手段と、
    前記字幕文字データに基づいて、前記再生時間長に対する全字幕の総文字数から、単位時間当たりに表示する字幕の文字数である表示速度を算出する字幕速度算出手段と、
    前記表示速度が予め定めた基準速度を超過するか否かを判定する字幕速度判定手段と、
    この字幕速度判定手段の判定結果に基づいて、全字幕を前記再生時間長内で表示するように各字幕の表示時間区間を設定する表示時間区間設定手段と、
    前記字幕ごとの字幕文字を前記記憶手段から読み出して、前記表示時間区間設定手段で設定された、前記字幕に対応する表示時間区間に表示する字幕再生手段と、
    前記字幕に対応する映像音声コンテンツを前記記憶手段から読み出して、当該字幕の表示時間区間に対応する時間長で速度変換して再生する映像音声再生手段と、を備え、
    前記表示時間区間設定手段は、
    前記字幕速度判定手段で前記表示速度が前記基準速度以下であると判定された場合、前記字幕ごとに、当該字幕の文字数と前記基準速度とで特定される表示時間長の区間を前記表示時間区間として設定する基準区間設定手段と、
    前記字幕速度判定手段で前記表示速度が前記基準速度を超過すると判定された場合、全字幕の表示時間長の総和が前記再生時間長となるように、前記字幕ごとの表示時間長を短縮した区間を前記表示時間区間として設定する短縮区間設定手段と、
    を備えることを特徴とする字幕同期再生装置。
  2. 前記基準区間設定手段は、前記再生時間長から全字幕の前記表示時間区間の時間長を減算した時間長を、前記再生時間長内に、前記映像音声コンテンツにおいて字幕を表示しない非字幕区間に対応して均等に割り当てることで、前記表示時間区間を設定することを特徴とする請求項1に記載の字幕同期再生装置。
  3. 前記基準区間設定手段は、前記再生時間長内に、前記映像音声コンテンツにおいて字幕を表示しない非字幕区間の時間長の割合に応じた間隔で前記表示時間区間を設定することを特徴とする請求項1に記載の字幕同期再生装置。
  4. 前記短縮区間設定手段は、前記再生時間長内に、前記全字幕の文字数の総和に対する各字幕の文字数の割合に応じて前記表示時間区間を設定することを特徴とする請求項1から請求項3のいずれか一項に記載の字幕同期再生装置。
  5. 前記短縮区間設定手段は、前記再生時間長内に、冒頭ほど単位時間当たりに表示する字幕の文字数が少なくなるように前記表示時間区間を設定することを特徴とする請求項1から請求項3のいずれか一項に記載の字幕同期再生装置。
  6. 映像音声コンテンツと、当該映像音声コンテンツに対応した字幕ごとの字幕文字および当該字幕の時間区間を特定する時間情報を含んだ字幕文字データとを記憶する記憶手段を備えた字幕同期再生装置において、前記映像音声コンテンツに対して早送り再生として指定された倍率の再生時間長内で前記映像音声コンテンツおよび字幕を再生するために、コンピュータを、
    前記再生時間長に対する全字幕の総文字数から、単位時間当たりに表示する字幕の文字数である表示速度を算出する字幕速度算出手段、
    前記表示速度が予め定めた基準速度を超過するか否かを判定する字幕速度判定手段、
    この字幕速度判定手段の判定結果に基づいて、全字幕を前記再生時間長内で表示するように各字幕の表示時間区間を設定する表示時間区間設定手段、
    前記字幕ごとの字幕文字を前記記憶手段から読み出して、前記表示時間区間設定手段で設定された、前記字幕に対応する表示時間区間に表示する字幕再生手段、
    前記字幕に対応する映像音声コンテンツを前記記憶手段から読み出して、当該字幕の表示時間区間に対応する時間長で速度変換して再生する映像音声再生手段、として機能させ、
    前記表示時間区間設定手段は、
    前記字幕速度判定手段で前記表示速度が前記基準速度以下であると判定された場合、前記字幕ごとに、当該字幕の文字数と前記基準速度とで特定される表示時間長の区間を前記表示時間区間として設定し、
    前記字幕速度判定手段で前記表示速度が前記基準速度を超過すると判定された場合、全字幕の表示時間長の総和が前記再生時間長となるように、前記字幕ごとの表示時間長を短縮した区間を前記表示時間区間として設定することを特徴とする字幕同期再生プログラム。
JP2012068756A 2012-03-26 2012-03-26 字幕同期再生装置およびそのプログラム Active JP5879169B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012068756A JP5879169B2 (ja) 2012-03-26 2012-03-26 字幕同期再生装置およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012068756A JP5879169B2 (ja) 2012-03-26 2012-03-26 字幕同期再生装置およびそのプログラム

Publications (2)

Publication Number Publication Date
JP2013201606A JP2013201606A (ja) 2013-10-03
JP5879169B2 true JP5879169B2 (ja) 2016-03-08

Family

ID=49521483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012068756A Active JP5879169B2 (ja) 2012-03-26 2012-03-26 字幕同期再生装置およびそのプログラム

Country Status (1)

Country Link
JP (1) JP5879169B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107809679A (zh) * 2017-10-26 2018-03-16 费非 调节字幕的方法和装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102319462B1 (ko) * 2014-12-15 2021-10-28 조은형 미디어 콘텐츠 플레이백 제어 방법 및 이를 수행하는 전자 기기
KR102319456B1 (ko) 2014-12-15 2021-10-28 조은형 콘텐츠 재생 방법 및 이를 수행하는 전자 기기
US10231001B2 (en) * 2016-05-24 2019-03-12 Divx, Llc Systems and methods for providing audio content during trick-play playback
KR20200142282A (ko) * 2019-06-12 2020-12-22 삼성전자주식회사 컨텐츠 번역 서비스를 제공하는 전자 장치 및 그 제어 방법
CN114025236A (zh) * 2021-11-16 2022-02-08 上海大晓智能科技有限公司 一种视频内容理解方法、装置、电子设备和存储介质
CN114900741B (zh) * 2022-05-07 2024-04-16 北京字跳网络技术有限公司 翻译字幕的显示方法、装置、设备、存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001045408A (ja) * 1999-08-03 2001-02-16 Canon Inc 動画像処理装置、動画像処理方法および記憶媒体
JP4177691B2 (ja) * 2003-03-19 2008-11-05 シャープ株式会社 デジタルデータ再生装置
JP2007243842A (ja) * 2006-03-10 2007-09-20 Sanyo Electric Co Ltd 情報再生装置および情報再生方法
JP2008072586A (ja) * 2006-09-15 2008-03-27 Matsushita Electric Ind Co Ltd デジタルavストリーム再生装置
JP2008141693A (ja) * 2006-12-05 2008-06-19 Matsushita Electric Ind Co Ltd コンテンツ再生装置及びコンテンツ再生方法
JP4666175B2 (ja) * 2006-12-27 2011-04-06 日本ビクター株式会社 記録再生装置および再生装置
JP5222543B2 (ja) * 2007-12-10 2013-06-26 株式会社日立製作所 テレビジョン装置
JP2009164969A (ja) * 2008-01-08 2009-07-23 Sharp Corp コンテンツ再生装置、コンテンツ再生方法、コンテンツ再生プログラム、および該プログラムを記録した記録媒体
JP2009253342A (ja) * 2008-04-01 2009-10-29 Sony Corp 情報処理装置および方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107809679A (zh) * 2017-10-26 2018-03-16 费非 调节字幕的方法和装置

Also Published As

Publication number Publication date
JP2013201606A (ja) 2013-10-03

Similar Documents

Publication Publication Date Title
JP5879169B2 (ja) 字幕同期再生装置およびそのプログラム
TWI571868B (zh) 用於定序內容之方法及裝置
JP5173287B2 (ja) 番組記録装置及びその制御方法
CN108429924B (zh) 用于播放替换用广告的显示装置及其控制方法
JP2005278152A (ja) 映像音声再生装置及び映像音声再生方法
JP2006012225A (ja) 情報処理装置
US20090046994A1 (en) Digital television broadcast recording and reproduction apparatus and reproduction method thereof
JP2004153791A (ja) 動画像・音声記録装置及び動画像・音声記録方法
JP2005204273A (ja) Avシステム及びav機器並びに映像信号出力方法
JP5111134B2 (ja) 録画再生装置
JP5213630B2 (ja) 映像信号再生装置
JP4635098B1 (ja) 電子機器
JP4686628B2 (ja) 電子機器及び番組表表示方法
JP5078417B2 (ja) 信号処理装置及び信号処理方法
JP2004007118A (ja) テレビジョン信号再生装置及び再生方法
WO2012131832A1 (ja) 音声読み上げシステム、音声読み上げ装置、および音声読み上げ方法
EP2302910A1 (en) Electronic apparatus and display method
JP2004153793A (ja) 動画像・音声記録装置及び動画像・音声再生装置
JP4735560B2 (ja) デジタル放送再生装置
JP2013219639A (ja) 字幕表示装置およびそのプログラム
JP4941128B2 (ja) 映像処理装置
JP2006148839A (ja) 放送装置、受信装置、及びこれらを備えるデジタル放送システム
JP2006310916A (ja) 音声映像情報復号装置、音声映像情報復号方法、音声映像情報復号プログラム及び音声映像情報復号プログラムを記録した記録媒体
JP3825646B2 (ja) Mpeg装置
JP2005203834A (ja) デジタル放送受信記録装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140326

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160201

R150 Certificate of patent or registration of utility model

Ref document number: 5879169

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250