JP6733990B2 - 解説音声再生装置、解説音声生成装置及び解説音声再生プログラム - Google Patents

解説音声再生装置、解説音声生成装置及び解説音声再生プログラム Download PDF

Info

Publication number
JP6733990B2
JP6733990B2 JP2016094219A JP2016094219A JP6733990B2 JP 6733990 B2 JP6733990 B2 JP 6733990B2 JP 2016094219 A JP2016094219 A JP 2016094219A JP 2016094219 A JP2016094219 A JP 2016094219A JP 6733990 B2 JP6733990 B2 JP 6733990B2
Authority
JP
Japan
Prior art keywords
reproduction
sound
commentary
time
comment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016094219A
Other languages
English (en)
Other versions
JP2017203827A (ja
Inventor
今井 篤
篤 今井
礼子 齋藤
礼子 齋藤
和穂 尾上
和穂 尾上
信正 清山
信正 清山
都木 徹
徹 都木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
NHK Engineering System Inc
Original Assignee
Japan Broadcasting Corp
NHK Engineering System Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp, NHK Engineering System Inc filed Critical Japan Broadcasting Corp
Priority to JP2016094219A priority Critical patent/JP6733990B2/ja
Publication of JP2017203827A publication Critical patent/JP2017203827A/ja
Application granted granted Critical
Publication of JP6733990B2 publication Critical patent/JP6733990B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、解説音声を生成及び再生する技術に関する。
従来、視覚障害者向けに、放送番組、映画等のコンテンツを音声に置き換えて、音声で解説する解説音声サービスがある。例えば、この解説音声サービスは、テレビ放送では「解説放送」、映画では「音声ガイド」と呼ばれている。
ここで、解説音声サービスに話速変換技術を適用すれば、視覚障害者の方々の嗜好に合わせて、解説音声の再生速度を変更できる(例えば、特許文献1)。この特許文献1に記載の発明では、視覚障害者が変換倍率を設定するだけで、話速変換倍率や無音区間を制御することができる。
特開平10−301598号公報(特許第3220043号公報)
解説音声は、解説音声を読み上げるための台本を準備し、コンテンツの音声にオーバーラップしない(重ならない)ように、手作業で制作する。解説音声の制作には、ラジオドラマに相当するコストと時間がかかると言われている。そのため、解説音声サービスは、放送番組の10%程度しかカバーできていない。そこで、解説音声を自動的に生成する手法が強く求められている。
ここで、解説音声とコンテンツの音声とのオーバーラップを許容すれば、解説音声を自動的に生成できるが、解説音声の聞き取りが困難になるので、解説音声同士のオーバーラップは許容できない。しかし、解説音声の再生速度を遅くした結果、解説音声の再生時間が長くなって解説音声同士がオーバーラップし、解説音声の聞き取りが困難になる場合がある。
本発明は、特に視覚障害者の方々がより多くのコンテンツを十分に楽しめるように、聞き取り易い解説音声を生成及び再生することを課題とする。
前記した課題に鑑みて、本発明に係る解説音声再生装置は、コンテンツ再生装置が再生するコンテンツに同期して映像及び音声からなるコンテンツが含む各映像イベントの解説音声を生成する解説音声生成装置が送信した、各映像イベントの解説音声を再生する解説音声再生装置であって、解説音声受信手段と、再生速度入力手段と、解説音声再生制御手段と、解説音声再生手段と、を備える構成とした。
かかる構成によれば、解説音声再生装置は、解説音声受信手段によって、ネットワークを介して、等倍再生時に前記解説音声同士がオーバーラップしないように予め設定された前記解説音声の再生開始時刻及び再生終了時刻を付加した前記解説音声を受信する。
解説音声再生装置は、再生速度入力手段によって、前記解説音声の再生速度を入力する。
解説音声再生装置は、解説音声再生制御手段によって、前記解説音声と当該解説音声の次に再生する次解説音声とが重ならないように、前記解説音声の再生速度、又は、前記次解説音声の再生開始時刻を制御する。
このとき、解説音声再生制御手段は、前記再生開始時刻及び前記再生終了時刻から、前記再生速度入力手段に入力した再生速度で前記解説音声を再生したときの変更後終了時刻を算出し、算出した前記変更後終了時刻が前記次解説音声の再生開始時刻を超える場合、前記次解説音声の再生開始時刻までに前記解説音声の再生を終了するように前記解説音声の再生速度を制御する。
さらに、前記解説音声再生制御手段は、前記再生速度入力手段に入力した再生速度で前記解説音声の再生を終了したときの再生終了時刻が前記次解説音声の再生開始時刻を超える場合、前記再生終了時刻より後に前記次解説音声の再生を開始するように前記次解説音声の再生開始時刻を制御してもよい。
解説音声再生装置は、解説音声再生手段によって、前記解説音声再生制御手段の制御に従って、前記解説音声を再生する。
このように、解説音声再生装置は、解説音声の再生速度を変更した場合でも、解説音声と、その解説音声の次に再生する次解説音声とがオーバーラップしないように制御を行う。
また、前記した課題に鑑みて、本発明に係る解説音声再生プログラムは、コンテンツ再生装置が再生するコンテンツに同期して映像及び音声からなるコンテンツが含む各映像イベントの解説音声を生成する解説音声生成装置が送信した、各映像イベントの解説音声を再生するために、コンピュータを、前記した解説音声受信手段、再生速度入力手段、解説音声再生制御手段及び解説音声再生手段として機能させる構成とした。
本発明によれば、以下のような優れた効果を奏する。
本発明によれば、解説音声の再生速度を変更した場合でも、解説音声と次解説音声とがオーバーラップしないように制御を行うので、解説音声を聞き取り易くすることができる。さらに、本発明によれば、解説音声を自動的に生成できるので、解説音声の制作に必要な時間及びコストを削減すると共に、解説音声サービスのカバー率を向上させることができる。これにより、視覚障害者の方々がより多くのコンテンツを十分に楽しむことができる。
第1実施形態に係る解説音声再生システムの概略図である。 図1の解説音声再生システムの構成を示すブロック図である。 第1実施形態において、再生速度の制御を説明する説明図である。 図2の解説音声生成装置の動作を示すフローチャートである。 図2の携帯端末の動作を示すフローチャートである。 第2実施形態に係る解説音声再生システムの構成を示すブロック図である。 第2実施形態において、再生開始時間の制御を説明する説明図である。 図6の解説音声生成装置の動作を示すフローチャートである。 図6の携帯端末の動作を示すフローチャートである。 変形例1において、再生速度及び再生開始時間の制御を説明する説明図である。
以下、本発明の各実施形態について、適宜図面を参照しながら詳細に説明する。なお、各実施形態において、同一の手段及び同一の処理には同一の符号を付し、説明を省略した。
(第1実施形態)
[解説音声再生システムの概略]
図1を参照し、第1実施形態に係る解説音声再生システム(解説音声再生装置)1の概略について説明する。
解説音声再生システム1は、放送番組(コンテンツ)を放送すると共に、その放送番組の解説音声を視聴者100(例えば、視覚障害者等)に提供する。本実施形態では、解説音声再生システム1は、放送番組として、テニスの試合を放送する。従って、解説音声は、テニスの試合で発生する映像イベントを解説する音声になる。
映像イベントとは、放送番組の映像が含むイベントのことである。ここで、テニスの映像は、選手の動作(例えば、トスを上げた、サーブを打った)、打球の状況(例えば、球速が何キロメートルだった、サーブが外れた)、試合状況の変化(例えば、得点が入った、選手が休憩した)等、複数の映像イベントを含んでいる。
図1に示すように、解説音声再生システム1は、放送送信装置2と、放送受信装置(コンテンツ再生装置)3と、解説音声生成装置4と、アプリサーバ5と、携帯端末6と、を備える。
なお、「アプリ」とは、「アプリケーション」の略語である。
本実施形態では、放送送信装置2、解説音声生成装置4及びアプリサーバ5が放送局に設置され、放送受信装置3が視聴者100の自宅に設置されていることとする。図1では、放送受信装置3及び携帯端末6を1台のみ図示したが、解説音声再生システム1は、放送受信装置3及び携帯端末6を複数備えてもよい。
放送送信装置2は、地上デジタル放送波を介して、放送番組を放送受信装置3に送信する一般的な放送設備である。例えば、放送送信装置2は、放送番組の映像及び音声をエンコードし、エンコードした映像及び音声の多重化信号を放送受信装置3に送信する。
放送受信装置3は、地上デジタル放送波を介して、放送送信装置2から放送番組を受信し、受信した放送番組を再生する一般的なテレビ受信装置である。例えば、放送受信装置3は、放送送信装置2から多重化信号を受信し、多重化信号から映像及び音声を分離する。そして、放送受信装置3は、分離した映像及び音声をデコードし、放送番組として再生する。
解説音声生成装置4は、放送番組の解説音声を生成し、生成した解説音声に再生開始時刻及び再生終了時刻を付加する。この再生開始時刻は、解説音声の再生を開始する時刻を表しており、放送番組の映像イベントの発生時刻に対応する。そして、解説音声生成装置4は、携帯端末6からの要求に応じて、ネットワークを介して、生成した解説音声を携帯端末6に送信する。
アプリサーバ5は、携帯端末6で動作する解説音声再生アプリ(解説音声再生プログラム)を記憶する一般的なサーバである。このアプリサーバ5は、携帯端末6からの要求に応じて、ネットワークを介して、解説音声再生アプリを携帯端末6に送信する。
携帯端末6は、放送受信装置3が送信した放送番組に同期して、放送番組が含む各映像イベントの解説音声を再生するスマートフォンやPDA(Personal Digital Assistant)である。ここで、携帯端末6は、解説音声を再生するとき、視聴者100の嗜好に応じて、その再生速度を変更できる。
ここで、放送番組が放送局の運行設備(不図示)から出力される時刻と、この放送番組が放送送信装置2や地上デジタル放送波を介して放送受信装置3で再生される時刻との間には差が存在する(時間差A)。また、解説音声生成装置4から解説音声が出力される時刻と、この解説音声がネットワークを介して送信され、携帯端末6で受信される時刻との間にも差が存在する(時間差B)。以後、時間差Aより時間差Bの方か短いこととして説明する。
以下、携帯端末6による解説音声の再生について説明する。
まず、視聴者100は、アプリサーバ5から解説音声再生アプリをダウンロードし、携帯端末6に解説音声再生アプリをインストールする。次に、視聴者100は、解説音声再生アプリを起動して、解説音声生成装置4から、所望の放送番組の解説音声を受信する。
放送受信装置3は、放送送信装置2が送信した放送番組を受信、再生する。
携帯端末6は、解説音声に付加した再生開始時刻になると、その解説音声を再生する。例えば、携帯端末6は、‘○○選手’がサーブを打つときの映像に同期して、‘○○選手のファーストサーブです’という解説音声を再生する。さらに、携帯端末6は、視聴者100が解説音声の再生速度を遅くした場合でも、解説音声と、この解説音声の次に再生する次解説音声とがオーバーラップしないように制御を行う。
[解説音声生成装置の構成]
図2を参照し、解説音声生成装置4の構成について説明する。
図2に示すように、解説音声生成装置4は、イベント情報受信手段40と、文字テキスト変換手段41と、解説音声生成手段42と、再生時刻算出手段43と、解説音声送信手段44と、を備える。
イベント情報受信手段40は、例えば、中継現場(不図示)で予め生成したイベント情報を受信し、受信したイベント情報を文字テキスト変換手段41に出力する。
このイベント情報は、映像イベントの発生時刻及び映像イベントの内容を、XML(eXtensible Markup Language)等のマークアップ言語で記述する。例えば、イベント情報は、サーブを行う選手の氏名やサーブの回数といった映像イベントの内容と、選手のサーブ開始時刻といった映像イベントの発生時刻とを含んでいる。ここで、映像イベントの発生時刻は、解説音声同士がオーバーラップせずに一定の時間間隔を保てるように、中継現場が予め設定する。
文字テキスト変換手段41は、イベント情報受信手段40から入力したイベント情報を、映像イベントの内容を表した文字テキストに変換する。例えば、文字テキスト変換手段41は、サーブを行う選手の氏名が‘○○選手’でサーブの回数が1回目の場合、‘○○選手ファーストサーブです’という文字テキストに変換する。そして、文字テキスト変換手段41は、映像イベントの発生時刻と共に、変換した文字テキストを解説音声生成手段42に出力する。
なお、イベント情報を文字テキストに変換する手法は任意であり、例えば、特開2005−316031号公報に記載の変換手法を利用できる。この変換手法は、映像イベントの内容であるデータサービス情報を文字テキストに変換する変換規則を予め設定する。そして、この変換手法は、変換規則に従って、データサービス情報を項目毎に分類し、文字テキストに変換する。
解説音声生成手段42は、文字テキスト変換手段41から入力した文字テキストを音声合成することで、解説音声を生成する。そして、解説音声生成手段42は、映像イベントの発生時刻と共に、変換した解説音声を再生時刻算出手段43に出力する。
なお、解説音声を生成する手法は任意であり、例えば、特開2016−9061号公報に記載の音声合成手法を利用できる。この音声合成手法は、合成音又は合成音同士の間に挟む無音の長さを調整し、文字テキストから、様々なジャンルの放送番組に対応した解説音声を生成する。
ここで、地上デジタル放送では、映像や音声のエンコード及びデコードに時間を要するので、映像イベントが実際に発生した時刻に対し、その映像イベントに対応した映像を再生する時刻が遅くなる。そこで、再生時刻算出手段43は、エンコード及びデコードに必要な時間を調整し、解説音声の再生開始時刻を算出する。
具体的には、再生時刻算出手段43は、解説音声生成手段42から入力した映像イベントの発生時刻に第1遅延時間を加算することで、解説音声の再生開始時刻を算出する。この第1遅延時間は、エンコード及びデコードに必要な時間に応じて、予め設定する。そして、再生時刻算出手段43は、解説音声と共に、算出した再生開始時刻を解説音声送信手段44に出力する。
具体的には、解説音声送信手段44は、再生時刻算出手段43から入力した再生開始時刻と、解説音声の再生終了時刻とを解説音声に付加する。この再生終了時刻とは、解説音声の再生を終了する時刻のことであり、例えば、放送局で予め設定する。その後、解説音声送信手段44は、ネットワークを介して、再生開始時刻及び再生終了時刻を付加した解説音声を携帯端末6に送信する。
なお、解説音声送信手段44は、1つの放送番組が含む全解説音声を1つの送信データにまとめ、携帯端末6に送信してもよい。また、解説音声送信手段44は、各解説音声を別々に携帯端末6に送信してもよい。
[携帯端末の構成]
以下、携帯端末6の構成について説明する。
図2に示すように、携帯端末6は、アプリダウンロード手段60と、アプリ記憶手段61と、アプリ実行手段62と、解説音声受信手段63と、解説音声記憶手段64と、再生速度入力手段65と、再生時刻遅延手段66と、解説音声再生制御手段67と、解説音声再生手段68とを備える。
アプリダウンロード手段60は、ネットワークを介して、アプリサーバ5から解説音声再生アプリをダウンロードする。例えば、アプリダウンロード手段60は、放送局が事前に通知したURL(Uniform Resource Locator)のアプリサーバ5に対し、解説音声再生アプリを要求する。すると、アプリサーバ5は、解説音声再生アプリを携帯端末6に送信する。このように、アプリダウンロード手段60は、要求した解説音声再生アプリをアプリサーバ5から受信し、受信した解説音声再生アプリをアプリ記憶手段61に書き込む。
アプリ記憶手段61は、アプリダウンロード手段60がダウンロードした解説音声再生アプリを記憶するメモリ、HDD(Hard Disk Drive)等の記憶装置である。
アプリ実行手段62は、視聴者100が入力したアプリ実行指令に応じて、アプリ記憶手段61が記憶する解説音声再生アプリを実行する。例えば、アプリ実行手段62は、視聴者100が解説音声再生アプリのアイコンをダブルタップすると、解説音声再生アプリを実行する。
なお、アプリ実行手段62は、アプリ記憶手段61が記憶する解説音声再生アプリをメモリ空間に展開し、解説音声再生アプリを実行することで、後記する解説音声受信手段63と、再生速度入力手段65と、再生時刻遅延手段66と、解説音声再生制御手段67と、解説音声再生手段68として機能させる。
解説音声受信手段63は、ネットワークを介して、解説音声生成装置4から解説音声を受信し、受信した解説音声を解説音声記憶手段64に書き込む。
解説音声記憶手段64は、解説音声受信手段63が受信した解説音声を記憶するメモリ、HDD等の記憶装置である。
再生速度入力手段65は、視聴者100が解説音声の再生速度を入力し、入力した再生速度を解説音声再生制御手段67に出力する。例えば、再生速度入力手段65は、視聴者100がスライドバーを操作すると、その操作に応じた再生速度を解説音声再生制御手段67に出力する。
本実施形態では、解説音声をそのまま再生したときの速度を等速再生(つまり、再生速度が1.0倍)とする。そして、再生速度は、この等速再生を基準とした倍率で入力することとする。例えば、再生速度が2.0倍の場合、等速再生に比べて、解説音声の再生時間が半分になる。一方、再生速度が0.5倍の場合、等速再生に比べて、解説音声の再生時間が2倍になる。
ここで、地上デジタル放送では、放送番組の伝送に必要な時間が地域毎に若干異なるので、同一の放送番組の再生タイミングが放送受信装置3の設置地域毎に若干ずれてしまう。そこで、再生時刻遅延手段66は、この再生タイミングのずれに応じて、解説音声の再生開始時刻及び再生終了時刻を調整する。
具体的には、再生時刻遅延手段66は、放送受信装置3の設置地域と、その設置地域毎の第2遅延時間とを対応付けたテーブルを予め設定する。この第2遅延時間は、再生タイミングのずれに応じて、予め設定する。
また、再生時刻遅延手段66は、視聴者100が放送受信装置3の設置地域を登録すると、このテーブルから、放送受信装置3の設置地域に対応した第2遅延時間を抽出する。
この他、携帯端末6がGPS(Global Positioning System)等の測位機能を備える場合がある。この場合、再生時刻遅延手段66は、測位機能で求めた携帯端末6の位置を放送受信装置3の設置地域として登録し、このテーブルから、放送受信装置3の設置地域に対応した第2遅延時間を抽出してもよい。
そして、再生時刻遅延手段66は、解説音声記憶手段64が記憶する解説音声の再生開始時刻及び再生終了時刻を抽出し、抽出した再生開始時刻及び再生終了時刻を第2遅延時間だけ遅延させる。その後、再生時刻遅延手段66は、遅延させた再生開始時刻及び再生終了時刻を解説音声再生制御手段67に出力する。
解説音声再生制御手段67は、再生時刻遅延手段66から入力した再生開始時刻において、解説音声を再生することを解説音声再生手段68に指令する。このとき、解説音声再生制御手段67は、解説音声と次解説音声とがオーバーラップしないように、再生速度入力手段65から入力した解説音声の再生速度を制御する。
解説音声再生手段68は、解説音声再生制御手段67からの指令に従って、解説音声記憶手段64が記憶する解説音声を再生する。
<再生速度の制御>
図2,図3を参照し、携帯端末6での再生速度の制御について説明する。
図3は、横軸が放送番組及び解説音声の時間軸である。図3(a)は、放送番組の音声及び映像を表す。また、図3(b)は等倍再生した解説音声を表し、図3(c)は再生速度入力手段65に入力した再生速度で再生した解説音声を表し、図3(d)は解説音声再生制御手段67が制御した再生速度で再生した解説音声を表す。
図3(a)に示すように、放送番組の映像は、例えば、トスを上げたという映像イベントE1と、サーブを打ったという映像イベントE2と、サーブをリターンしたという映像イベントE3とを含んでいる。
映像イベントE1〜E3に対応する解説音声をそれぞれC1〜C3とする。また、解説音声C1の再生開始時刻及び再生終了時刻をそれぞれT1,T2とし、解説音声C2の再生開始時刻をT3とする。
通常、解説音声C1〜C3は、等倍再生時にオーバーラップしない。従って、図3(b)に示すように、解説音声C1の再生終了時刻T2が、解説音声C2の再生開始時刻T3よりも先の時刻になる。
例えば、視聴者100が再生速度を遅くした場合、図3(c)に示すように、解説音声C1の再生時間が長くなる。そこで、解説音声再生制御手段67は、解説音声C1,C2がオーバーラップするか否かを判定する。
具体的には、解説音声再生制御手段67は、解説音声C1の再生開始時刻T1と再生終了時刻T2との差分を、解説音声C1を等倍再生したときの等倍再生時間として算出する。次に、解説音声再生制御手段67は、解説音声C1の等倍再生時間を再生速度入力手段65に入力した再生速度で除算することで、変更後終了時刻T2aを算出する。
以後、再生速度入力手段65に入力した再生速度を「入力再生速度」と略記する。
そして、解説音声再生制御手段67は、解説音声C1の変更後終了時刻T2aが解説音声C2の再生開始時刻T3を超えるか否かにより、解説音声C1,C2がオーバーラップするか否かを判定する。ここでは、解説音声再生制御手段67は、再生終了時刻T2aが再生開始時刻T3を超えるので、解説音声C1,C2がオーバーラップすると判定する。
このため、解説音声再生制御手段67は、図3(d)に示すように、解説音声C2の再生開始時刻T3までに解説音声C1の再生を終了するように、解説音声C1の再生速度を早くする。
具体的には、解説音声再生制御手段67は、入力再生速度に予め設定した倍率を加えることで、再生速度を制御した後の制御後再生速度を算出する。例えば、解説音声再生制御手段67は、再生速度が0.5倍の場合、この再生速度に0.1倍を加算し、制御後再生速度0.6倍を算出する。
続いて、解説音声再生制御手段67は、解説音声C1,C2の再生開始時刻T1,T3の差分を最長再生時間として算出する。この最長再生時間とは、解説音声C2にオーバーラップせずに解説音声C1を再生できる時間の上限のことである。
続いて、解説音声再生制御手段67は、解説音声C1の等倍再生時間を制御後再生速度で除算することで制御後再生時間を算出する。この制御後再生時間とは、解説音声C1の再生速度を制御した後の再生時間のことである。
そして、解説音声再生制御手段67は、算出した制御後再生時間が最長再生時間以内であるか否かを判定する。
制御後再生時間が最長再生時間以内の場合、解説音声再生制御手段67は、解説音声再生手段68に対し、制御後再生速度で解説音声C1を再生することを指令する。
制御後再生時間が最長再生時間を超える場合、解説音声再生制御手段67は、制御後再生速度に予め設定した倍率をさらに加え、制御後再生時間が最長再生時間以内になるまで、前記処理を繰り返す。
なお、図3(c)に示すように、再生速度を遅くした場合でも解説音声C2,C3がオーバーラップしないので、解説音声C2の再生速度を制御する必要がない。この場合、解説音声再生制御手段67は、入力再生速度で解説音声C2を再生することを解説音声再生手段68に指令する。
[解説音声生成装置の動作]
図2,図4を参照し、解説音声生成装置4の動作について説明する。
図4に示すように、イベント情報受信手段40は、映像イベントの発生時刻及び映像イベントの内容を含むイベント情報を受信する(ステップS1)。
文字テキスト変換手段41は、受信したイベント情報を、映像イベントの内容を表した文字テキストに変換する(ステップS2)。
解説音声生成手段42は、変換した文字テキストを音声合成することで、解説音声を生成する(ステップS3)。
再生時刻算出手段43は、映像イベントの発生時刻に第1遅延時間を加算することで、解説音声の再生開始時刻を算出する(ステップS4)。
解説音声送信手段44は、再生開始時刻及び予め設定した再生終了時刻を付加した解説音声を、ネットワークを介して、携帯端末6に送信する(ステップS5)。
[携帯端末の動作]
図2,図5を参照し、携帯端末6の動作について説明する。
ここでは、携帯端末6が解説音声再生アプリをダウンロードし、記憶していることとする。
解説音声受信手段63は、ネットワークを介して、再生開始時刻及び再生終了時刻を付加した解説音声を受信し、受信した解説音声を解説音声記憶手段64に書き込む(ステップS10)。
再生速度入力手段65は、解説音声の再生速度を入力する(ステップS11)。
再生時刻遅延手段66は、解説音声の再生開始時刻及び再生終了時刻を第2遅延時間だけ遅延させる(ステップS12)。
解説音声再生制御手段67は、解説音声と次解説音声とがオーバーラップしないように、解説音声の再生速度を制御する(ステップS13)。
解説音声再生手段68は、解説音声再生制御手段67の制御に従った再生速度で解説音声を再生する(ステップS14)。
(第2実施形態)
図6を参照し、第2実施形態に係る解説音声再生システム1Bについて、第1実施形態と異なる点を説明する。
解説音声再生システム1Bは、解説音声に再生開始時刻のみを付加すると共に、次解説音声の再生開始時間を遅らせる点が、第1実施形態と異なる。
図6に示すように、解説音声再生システム1Bは、放送送信装置2と、放送受信装置3と、解説音声生成装置4Bと、アプリサーバ5と、携帯端末(解説音声再生装置)6Bと、を備える。
なお、解説音声生成装置4B及び携帯端末6B以外の各装置は、第1実施形態と同様のため、説明を省略する。
[解説音声生成装置の構成]
以下、解説音声生成装置4Bの構成について説明する。
解説音声生成装置4Bは、イベント情報受信手段40と、文字テキスト変換手段41と、解説音声生成手段42と、再生時刻算出手段43と、解説音声送信手段44Bと、を備える。
なお、解説音声送信手段44B以外の各手段は、第1実施形態と同様のため、説明を省略する。
解説音声送信手段44Bは、再生時刻算出手段43から入力した再生開始時刻を解説音声に付加する。つまり、解説音声送信手段44Bは、第1実施形態とは異なり、再生終了時刻を解説音声に付加していない。そして、解説音声送信手段44Bは、ネットワークを介して、再生開始時刻のみを付加した解説音声を携帯端末6Bに送信する。
[携帯端末の構成]
以下、携帯端末6Bの構成について説明する。
携帯端末6Bは、アプリダウンロード手段60と、アプリ記憶手段61と、アプリ実行手段62と、解説音声受信手段63Bと、解説音声記憶手段64Bと、再生速度入力手段65と、再生時刻遅延手段66Bと、解説音声再生制御手段67Bと、解説音声再生手段68Bとを備える。
なお、アプリダウンロード手段60、アプリ記憶手段61、アプリ実行手段62及び再生速度入力手段65は、第1実施形態と同様のため、説明を省略する。
解説音声受信手段63Bは、ネットワークを介して、解説音声生成装置4Bから解説音声を受信し、受信した解説音声を解説音声記憶手段64Bに書き込む。
解説音声記憶手段64Bは、解説音声受信手段63Bが受信した解説音声を記憶するメモリ、HDD等の記憶装置である。
再生時刻遅延手段66Bは、解説音声記憶手段64Bが記憶する解説音声の再生開始時刻を抽出し、抽出した再生開始時刻を第2遅延時間だけ遅延させる。そして、再生時刻遅延手段66Bは、遅延させた再生開始時刻を解説音声再生制御手段67Bに出力する。
解説音声再生制御手段67Bは、再生速度入力手段65から入力した再生速度で解説音声を再生することを解説音声再生手段68Bに指令する。このとき、解説音声再生制御手段67Bは、解説音声と次解説音声とがオーバーラップしないように、再生時刻遅延手段66Bから入力した解説音声の再生開始時刻を制御する。
解説音声再生手段68Bは、解説音声再生制御手段67Bからの指令に従って、解説音声記憶手段64Bが記憶する解説音声を再生する。
<再生開始時刻の制御>
図6,図7を参照し、携帯端末6Bでの再生開始時刻の制御について説明する。
図7は、横軸が放送番組及び解説音声の時間軸である。図7(a)は、放送番組の音声及び映像を表す。また、図7(b)は等倍再生した解説音声を表し、図7(c)は入力再生速度で再生した解説音声を表し、図7(d)は解説音声再生制御手段67が制御した再生開始時刻で再生した解説音声を表す。
例えば、視聴者100が再生速度を遅くした場合、図7(c)に示すように、解説音声C1の再生時間が長くなる。また、本実施形態では、解説音声C1に再生終了時刻を付加していないため、携帯端末6Bが解説音声C1の再生時間を事前に算出できない。
そこで、解説音声再生制御手段67Bは、入力再生速度で解説音声C1の再生を終了したときの再生終了時刻T2aが解説音声C2の再生開始時刻T3を超えるか否かにより、解説音声C1,C2がオーバーラップするか否かを判定する。ここでは、解説音声再生制御手段67Bは、再生終了時刻T2aが再生開始時刻T3を超えるので、解説音声C1,C2がオーバーラップすると判定する。
次に、解説音声再生制御手段67Bは、解説音声C1の再生終了時刻T2aより後に解説音声C2の再生を開始するように解説音声C2の再生開始時刻を遅らせる。具体的には、解説音声再生制御手段67Bは、解説音声C1の再生終了時刻T2a以後に解説音声C2の再生開始時刻を遅らせる。そして、解説音声再生制御手段67Bは、解説音声再生手段68Bに対し、遅らせた再生開始時刻で解説音声C2を再生することを指令する。
このように、携帯端末6Bは、解説音声C1に再生終了時刻を付加しない場合でも、解説音声C1,C2のオーバーラップを防止できる。さらに、携帯端末6Bは、解説音声C1の再生開始時刻T1において、解説音声C2を受信できずに再生開始時刻T3が分からない場合でも、解説音声C1,C2のオーバーラップを防止できる。
なお、図7(c)に示すように、再生速度を遅くした場合でも解説音声C2,C3がオーバーラップしないので、解説音声C3の再生開始時刻を制御する必要がない。この場合、解説音声再生制御手段67Bは、解説音声C3に付加した再生開始時刻において、解説音声C3を再生することを解説音声再生手段68Bに指令する。
仮に解説音声C2,C3がオーバーラップしてしまう場合(図7不図示)、解説音声再生制御手段67Bは、解説音声再生手段68Bに対し、解説音声C2と同様、遅らせた再生開始時刻で解説音声C3を再生することを指令する。このように連続して再生時刻を遅らせたとき、解説音声再生制御手段67Bは、例えば、再生速度が0.5倍の場合、この再生速度に0.1倍を加算することで制御後再生速度0.6倍を算出し、解説音声再生手段68Bに対し、この制御後再生速度で解説音声C3を再生することを指令してもよい。これにより、携帯端末6Bは、解説音声の再生時刻の遅れが蓄積する事態を回避できる。
[解説音声生成装置の動作]
図6,図8を参照し、解説音声生成装置4Bの動作について説明する。
解説音声送信手段44Bは、再生開始時刻を付加した解説音声を、ネットワークを介して、携帯端末6Bに送信する(ステップS5B)。
なお、ステップS1〜S4の処理は、第1実施形態と同様のため、説明を省略した。
[携帯端末の動作]
図6,図9を参照し、携帯端末6Bの動作について説明する。
ここでは、携帯端末6Bが解説音声再生アプリをダウンロード、記憶していることとする。
解説音声受信手段63Bは、ネットワークを介して、再生開始時刻を付加した解説音声を受信し、受信した解説音声を解説音声記憶手段64Bに書き込む(ステップS10B)。
なお、ステップS11の処理は、第1実施形態と同様のため、説明を省略した。
再生時刻遅延手段66Bは、解説音声の再生開始時刻を第2遅延時間だけ遅延させる(ステップS12B)。
解説音声再生制御手段67Bは、解説音声と次解説音声とがオーバーラップしないように、次解説音声の再生開始時刻又は再生速度を制御する(ステップS13B)。
解説音声再生手段68Bは、解説音声再生制御手段67Bが指令した再生開始時刻に次解説音声を再生する(ステップS14B)。
(作用・効果)
以上のように、解説音声再生システム1,1Bは、解説音声を自動的に生成できるので、解説音声の制作に必要な時間及びコストを削減すると共に、解説音声サービスのカバー率を向上させることができる。
さらに、解説音声再生システム1,1Bは、放送番組の音声とコンテンツの音声とのオーバーラップを許容するので、解説音声を任意の時刻に挿入することができる。このため、解説音声の再生が可能な時間スロットに合わせた台本の準備や、ごく短時間で伝わる言い回しを工夫する必要がなくなり、解説音声の制作コストを大幅に削減することができる。
さらに、解説音声再生システム1,1Bは、例えば、スポーツ番組のように、得点が入った、球速が何キロメートルだった、選手が交代した等の映像イベントと、その映像イベントの発生時刻とが分かれば、解説音声をほぼリアルタイムで自動的に生成することができる。
さらに、解説音声再生システム1,1Bは、視聴者100が解説音声の再生速度を遅くした場合でも、解説音声同士がオーバーラップしないので、視聴者100にとって聞き易い高品質な解説音声サービスを提供し、視聴者100が放送番組を十分に楽しむことができる。
(変形例1)
以上、本発明の各実施形態を詳述してきたが、本発明は前記した実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
前記した各実施形態では、再生速度の制御と再生開始時刻の制御とを別々に説明したが、本発明は、両制御を組み合わせることもできる。図10を参照し、両制御の組み合わせについて説明する。
図10(a)は、放送番組の音声及び映像を表す。また、図10(b)は等倍再生した解説音声を表し、図10(c)は入力再生速度で再生した解説音声を表し、図10(d)は解説音声再生制御手段67が制御した再生開始時刻で再生した解説音声を表し、図10(e)は解説音声再生制御手段67が制御した再生速度で再生した解説音声を表す。なお、説明を簡易にするため、解説音声C2のみ最長終了時刻T5を算出することとした。
図10(c)に示すように、解説音声再生制御手段は、解説音声同士の間隔を確保するための間隔時間Δを予め設定し、解説音声C3の再生開始時刻T6から間隔時間Δだけ遡った解説音声C2の最長終了時刻T5を算出する。また、図10(d)に示すように、解説音声再生制御手段は、解説音声C2の再生終了時刻T4が最長終了時刻T5を超えないように、第2実施形態と同様に解説音声C2の再生開始時刻T3を遅くする。さらに、図10(e)に示すように、解説音声再生制御手段は、再生開始時刻T3を遅くしても解説音声C1,C2がオーバーラップするので、第1実施形態と同様に解説音声C1の再生速度を制御する。
(その他変形例)
前記した各実施形態では、解説音声再生装置が携帯端末であることとして説明したが、本発明は、これに限定されない。
例えば、解説音声再生装置は、通信機能及び音声出力機能を備え、解説音声再生アプリを実行できる家電機器であってもよい。
さらに、解説音声再生装置は、ハイブリッドキャスト(登録商標)のような放送通信連携受信装置であってもよい。
前記した各実施形態では、コンテンツがテニスの試合であることとして説明したが、本発明は、これに限定されない。例えば、コンテンツは、テニス以外のスポーツ番組であってもよい。さらに、コンテンツは、スポーツ番組以外の放送番組(例えば、バラエティー番組やニュース番組)であってもよい。
前記した各実施形態では、本発明に係る解説音声再生システムを地上デジタル放送に適用する例で説明したが、本発明は、これに限定されない。例えば、本発明に係る解説音声再生システムは、映画やストリーム配信にも適用することができる。
前記した実施形態では、解説音声再生装置を独立したハードウェアとして説明したが、本発明は、これに限定されない。例えば、本願発明は、携帯端末が備えるCPU、メモリ、ハードディスク等のハードウェア資源を、前記した解説音声受信手段、再生速度入力手段、解説音声再生制御手段及び解説音声再生手段として協調動作させる解説音声再生プログラムで実現することもできる。このプログラムは、通信回線を介して配布してもよく、CD−ROMやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。
1,1B 解説音声再生システム(解説音声再生装置)
2 放送送信装置
3 放送受信装置(コンテンツ再生装置)
4,4B 解説音声生成装置
5 アプリサーバ
6,6B 携帯端末
40 イベント情報受信手段
41 文字テキスト変換手段
42 解説音声生成手段
43 再生時刻算出手段
44,44B 解説音声送信手段
60 アプリダウンロード手段
61 アプリ記憶手段
62 アプリ実行手段
63,63B 解説音声受信手段
64,64B 解説音声記憶手段
65 再生速度入力手段
66,66B 再生時刻遅延手段
67,67B 解説音声再生制御手段
68,68B 解説音声再生手段

Claims (7)

  1. コンテンツ再生装置が再生するコンテンツに同期して映像及び音声からなる前記コンテンツが含む各映像イベントの解説音声を生成する解説音声生成装置が送信した、前記各映像イベントの解説音声を再生する解説音声再生装置であって、
    ネットワークを介して、等倍再生時に前記解説音声同士がオーバーラップしないように予め設定された前記解説音声の再生開始時刻及び再生終了時刻を付加した前記解説音声を受信する解説音声受信手段と、
    前記解説音声の再生速度を入力する再生速度入力手段と、
    前記解説音声と当該解説音声の次に再生する次解説音声とが重ならないように、前記解説音声の再生速度、又は、前記次解説音声の再生開始時刻を制御する解説音声再生制御手段と、
    前記解説音声再生制御手段の制御に従って、前記解説音声を再生する解説音声再生手段と、を備え
    前記解説音声再生制御手段は、前記再生開始時刻及び前記再生終了時刻から、前記再生速度入力手段に入力した再生速度で前記解説音声を再生したときの変更後終了時刻を算出し、算出した前記変更後終了時刻が前記次解説音声の再生開始時刻を超える場合、前記次解説音声の再生開始時刻までに前記解説音声の再生を終了するように前記解説音声の再生速度を制御することを特徴とする解説音声再生装置。
  2. コンテンツ再生装置が再生するコンテンツに同期して映像及び音声からなる前記コンテンツが含む各映像イベントの解説音声を生成する解説音声生成装置が送信した、前記各映像イベントの解説音声を再生する解説音声再生装置であって、
    ネットワークを介して、等倍再生時に前記解説音声同士がオーバーラップしないように予め設定された前記解説音声の再生開始時刻を付加した前記解説音声を受信する解説音声受信手段と、
    前記解説音声の再生速度を入力する再生速度入力手段と、
    前記解説音声と当該解説音声の次に再生する次解説音声とが重ならないように、前記解説音声の再生速度、又は、前記次解説音声の再生開始時刻を制御する解説音声再生制御手段と、
    前記解説音声再生制御手段の制御に従って、前記解説音声を再生する解説音声再生手段と、を備え、
    前記解説音声再生制御手段は、前記再生速度入力手段に入力した再生速度で前記解説音声の再生を終了したときの再生終了時刻が前記次解説音声の再生開始時刻を超える場合、前記再生終了時刻より後に前記次解説音声の再生を開始するように前記次解説音声の再生開始時刻を制御することを特徴とする解説音声再生装置。
  3. め設定した第2遅延時間だけ前記再生開始時刻を遅延させる再生時刻遅延手段、をさらに備えることを特徴とする請求項2に記載の解説音声再生装置。
  4. 請求項1又は請求項2に記載の解説音声再生装置に解説音声を送信する解説音声生成装置であって、
    像イベントの発生時刻及び前記映像イベントの内容をマークアップ言語で記述したイベント情報を受信するイベント情報受信手段と、
    前記イベント情報を、前記映像イベントの内容を表した文字テキストに変換する文字テキスト変換手段と、
    前記文字テキストを音声合成することで、前記解説音声を生成する解説音声生成手段と、
    前記映像イベントの発生時刻に基づいた前記解説音声の再生開始時刻を前記解説音声に付加し、ネットワークを介して、前記再生開始時刻を付加した解説音声を送信する解説音声送信手段と、
    を備えることを特徴とする解説音声生成装置。
  5. 前記映像イベントの発生時刻に予め設定した第1遅延時間を加算することで、前記解説音声の再生開始時刻を算出する再生時刻算出手段、をさらに備えることを特徴とする請求項4に記載の解説音声生成装置。
  6. 記解説音声送信手段は、前記解説音声の再生終了時刻をさらに付加した前記解説音声を、解説音声再生装置に送信することを特徴とする請求項5に記載の解説音声生成装置。
  7. コンピュータを、請求項1又は請求項2に記載の解説音声再生装置として機能させるための解説音声再生プログラム。
JP2016094219A 2016-05-10 2016-05-10 解説音声再生装置、解説音声生成装置及び解説音声再生プログラム Active JP6733990B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016094219A JP6733990B2 (ja) 2016-05-10 2016-05-10 解説音声再生装置、解説音声生成装置及び解説音声再生プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016094219A JP6733990B2 (ja) 2016-05-10 2016-05-10 解説音声再生装置、解説音声生成装置及び解説音声再生プログラム

Publications (2)

Publication Number Publication Date
JP2017203827A JP2017203827A (ja) 2017-11-16
JP6733990B2 true JP6733990B2 (ja) 2020-08-05

Family

ID=60322202

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016094219A Active JP6733990B2 (ja) 2016-05-10 2016-05-10 解説音声再生装置、解説音声生成装置及び解説音声再生プログラム

Country Status (1)

Country Link
JP (1) JP6733990B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021240644A1 (ja) * 2020-05-26 2021-12-02 富士通株式会社 情報出力プログラム、装置、及び方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3220043B2 (ja) * 1997-04-30 2001-10-22 日本放送協会 話速変換方法およびその装置
JP2002023787A (ja) * 2000-07-06 2002-01-25 Canon Inc 音声合成装置、音声合成システム、音声合成方法及び記憶媒体
JP4594908B2 (ja) * 2006-08-01 2010-12-08 日本放送協会 解説付加音声生成装置及び解説付加音声生成プログラム
JP6405653B2 (ja) * 2014-03-11 2018-10-17 日本電気株式会社 音声出力装置および音声出力方法

Also Published As

Publication number Publication date
JP2017203827A (ja) 2017-11-16

Similar Documents

Publication Publication Date Title
JP4456004B2 (ja) メディア・サービスの再生自動同期化方法および装置
US20190028746A1 (en) Synchronous and Multi-Sourced Audio and Video Broadcast
JP5609160B2 (ja) 情報処理システム、コンテンツ合成装置および方法、並びに記録媒体
JP2009544247A (ja) オーデイオ情報を配信するための改良された方法及び装置
JP6721510B2 (ja) 2つの電子デバイスにおいて再生を同期させるための方法及び装置
WO2016011814A1 (zh) 混音播放方法及装置
US11758245B2 (en) Interactive media events
JP5278059B2 (ja) 情報処理装置及び方法、プログラム、並びに情報処理システム
WO2019188393A1 (ja) 情報処理装置、情報処理方法、送信装置、及び送信方法
JP6733990B2 (ja) 解説音声再生装置、解説音声生成装置及び解説音声再生プログラム
JP5109496B2 (ja) データ配信装置、データ配信方法およびプログラム
CN109413476A (zh) 一种音视频与钢琴动作同步直播方法及系统
JP4894896B2 (ja) 音声信号処理装置及び音声信号処理方法
JP5867549B2 (ja) 送信装置及び方法、並びに受信装置及び方法
JP6190012B1 (ja) データ再生システム、データ再生方法、データ再生端末及びデータ再生用プログラム
JP6575684B2 (ja) 同期設定装置、配信システム、同期設定方法、及びプログラム
JP2014127213A (ja) 同期再生制御装置及び同期再生制御方法
JP6343171B2 (ja) 受信装置
JP6866948B2 (ja) 端末装置、端末装置の動作方法、およびプログラム
JP2018019404A (ja) データ再生システム、データ再生方法、データ配信装置、広告配信装置、データ再生端末及びデータ再生用プログラム
JP6529116B2 (ja) 送信装置、受信装置およびプログラム
JP5557070B2 (ja) 送信装置及び方法、並びに受信装置及び方法
JP2014066894A (ja) 音楽再生システム、音楽再生装置、及び音楽再生用プログラム
JP2011128461A (ja) ネットワークラジオ受信装置
CN101163195A (zh) 一种音乐影像播放系统及其方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190404

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200707

R150 Certificate of patent or registration of utility model

Ref document number: 6733990

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250