JP2015019299A - シーン検出装置、及びモバイル機器 - Google Patents

シーン検出装置、及びモバイル機器 Download PDF

Info

Publication number
JP2015019299A
JP2015019299A JP2013146241A JP2013146241A JP2015019299A JP 2015019299 A JP2015019299 A JP 2015019299A JP 2013146241 A JP2013146241 A JP 2013146241A JP 2013146241 A JP2013146241 A JP 2013146241A JP 2015019299 A JP2015019299 A JP 2015019299A
Authority
JP
Japan
Prior art keywords
scene
unit
scene detection
synthesized speech
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013146241A
Other languages
English (en)
Inventor
弘昭 芝原
Hiroaki Shibahara
弘昭 芝原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Funai Electric Co Ltd
Original Assignee
Funai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Funai Electric Co Ltd filed Critical Funai Electric Co Ltd
Priority to JP2013146241A priority Critical patent/JP2015019299A/ja
Publication of JP2015019299A publication Critical patent/JP2015019299A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】字幕に基づく音声を聞くユーザへ与える臨場感を向上させることができるシーン検出装置を提供する。
【解決手段】字幕データを含むコンテンツにおけるシーンの激しさの度合いを検出するシーン検出部を備えるシーン検出装置としている。シーン検出部は、前記コンテンツの映像データに基づき動きベクトルを検出し、検出された動きベクトルの大きさに基づきシーンの激しさの度合いを検出することとしてもよい。また、シーン検出部は、前記コンテンツのジャンル情報に基づき特定されるジャンルと、登録されたジャンルとの比較によって、シーンの激しさの度合いを検出することとしてもよい。
【選択図】図2

Description

本発明は、コンテンツにおけるシーンを検出する装置に関する。
従来、字幕データに基づいて合成音声を生成する装置が知られている。
例えば、特許文献1には、受信した放送に含まれた字幕データを日本語に翻訳し、翻訳語のデータに基づき合成音声を生成する字幕データ翻訳装置が開示されている。
上記字幕データ翻訳装置では、字幕データに話者のタイプと話す速度を表すパラメータを付加することで、上記パラメータに基づき音声合成を行う。
特開2000−92460号公報
しかしながら、放送番組では激しいシーンや静かなシーンが存在するが、上記特許文献1による合成音声を視聴者が聞いても、このようなシーンの激しさの度合いを感じにくく、臨場感に欠ける問題がある。
そこで、本発明は、字幕に基づく音声を聞くユーザへ与える臨場感を向上させることができるシーン検出装置、及びモバイル機器を提供することを目的とする。
上記目的を達成するために本発明の一態様に係るシーン検出装置は、字幕データを含むコンテンツにおけるシーンの激しさの度合いを検出するシーン検出部を備える構成としている。
このような構成によれば、ユーザは、コンテンツにおけるシーンの激しさの度合いに応じた字幕に基づく音声を聞くことができるので、臨場感を向上させることができる。
また、上記構成において、前記シーン検出部は、前記コンテンツの映像データに基づき動きベクトルを検出し、検出された動きベクトルの大きさに基づきシーンの激しさの度合いを検出することとしてもよい。
また、上記構成において、前記シーン検出部は、前記コンテンツのジャンル情報に基づき特定されるジャンルと、登録されたジャンルとの比較によって、シーンの激しさの度合いを検出することとしてもよい。
また、上記構成において、前記シーン検出部は、前記コンテンツの字幕データに基づき単位時間当たりに表示する字幕の文字数を算出し、算出された文字数と所定の閾値との比較によって、シーンの激しさの度合いを検出することとしてもよい。
また、上記構成において、前記シーン検出部は、前記コンテンツの字幕データに含まれる文字列と、登録された文字列との比較によって、シーンの激しさの度合いを検出することとしてもよい。
また、上記いずれかの構成において、前記字幕データ、及び前記シーン検出部による検出結果をモバイル機器へ送信する通信部を更に備えることとしてもよい。
このような構成によれば、モバイル機器を利用するユーザは、コンテンツにおけるシーンの激しさの度合いに応じた字幕に基づく音声を手元にて聞くことができる。
また、上記いずれかの構成において、前記字幕データ、及び前記シーン検出部による検出結果に基づき合成音声を生成する合成音声生成部と、前記合成音声生成部により生成された合成音声に基づき音声を発生する内蔵スピーカと、を更に備えることとしてもよい。
このような構成によれば、ユーザは、コンテンツにおけるシーンの激しさの度合いに応じた字幕に基づく音声をシーン検出装置の内蔵スピーカから聞くことができる。
また、本構成において、前記合成音声生成部は、前記シーン検出部による検出結果に応じた音量及び/又は韻律の合成音声を生成することとしてもよい。
このような構成によれば、ユーザは、コンテンツにおけるシーンの激しさの度合いに応じた音量及び/又は韻律の音声をシーン検出装置の内蔵スピーカから聞くことができ、臨場感を向上させることができる。
また、本発明の一態様に係るモバイル機器は、外部装置より送られるコンテンツの字幕データ及び前記コンテンツにおけるシーンの激しさの度合いの検出結果を受信する受信部と、前記受信部により受信された前記字幕データ及び前記検出結果に基づき合成音声を生成する合成音声生成部と、前記合成音声生成部により生成された合成音声を出力する音声出力部と、を備える構成としている。
このような構成によれば、ユーザは、コンテンツにおけるシーンの激しさの度合いに応じた字幕に基づく音声を手元にて聞くことができ、臨場感を向上させることができる。
また、本構成において、前記合成音声生成部は、前記検出結果に応じた音量及び/又は韻律の合成音声を生成することとしてもよい。
このような構成によれば、ユーザは、コンテンツにおけるシーンの激しさの度合いに応じた音量及び/又は韻律の音声を手元にて聞くことができ、臨場感を向上させることができる。
本発明によると、字幕に基づく音声を聞くユーザへ与える臨場感を向上させることができる。
本発明の第1実施形態に係るテレビシステムの概略全体構成を示す図である。 本発明の第1実施形態に係るテレビ装置の概略構成を示すブロック図である。 本発明の第1実施形態に係るモバイル機器の概略構成を示すブロック図である。 本発明の第1実施形態に係る字幕音声生成処理におけるテレビ装置側の処理を示すフローチャートである。 本発明の第1実施形態に係る字幕音声生成処理におけるモバイル機器側の処理を示すフローチャートである。 本発明の第1実施形態に係る字幕音声出力の具体例を示す図である。 本発明の第5実施形態に係るテレビ装置の概略構成を示すブロック図である。 本発明の第5実施形態に係る字幕音声生成処理についてのフローチャートである。
<第1実施形態>
以下に本発明の一実施形態について図面を参照して説明する。本発明の第1実施形態に係るテレビシステムの概略全体構成を図1に示す。図1に示すテレビシステムは、シーン検出装置の一例としてのテレビ装置1と、例えばスマートフォン等であるモバイル機器3から構成される。
テレビ装置1は、接続されたアンテナ2により受信された放送の映像を表示し、音声を内蔵スピーカから出力する。また、テレビ装置1は、無線ルータ4を介してモバイル機器3との間で、例えばWi-Fi等による無線通信を行うこともできる。この無線通信により、テレビ装置1からモバイル機器3へ放送番組の字幕データ及びシーンの検出結果が送信され、モバイル機器3では送信されたデータに基づき合成音声を生成して出力する。これにより、モバイル機器3を利用するユーザは、手元で字幕の音声を聞くことができる。
なお、テレビ装置1は、無線ルータ4を介してインターネットに接続可能に構成してもよい。
次に、テレビ装置1とモバイル機器3の具体的な構成について説明する。テレビ装置1の概略構成を示すブロック図を図2に示す。
図2に示すテレビ装置1は、チューナ11と、復調部12と、分離部13と、デコード部14と、映像出力部15と、表示部16と、OSD(On Screen Display)部17と、無線通信部18と、音声出力部19と、内蔵スピーカ20と、制御部21と、リモコン受光部22を備えている。チューナ11にはアンテナ2が接続される。
チューナ11は、例えば、地上デジタル放送、BSデジタル放送、CSデジタル放送の少なくともいずれかに対応するものであり、アンテナ2から入力された高周波の放送信号から所望のチャンネルの放送信号を選局する。
復調部12は、チューナ11において選局されたチャンネルの放送信号に対してデジタル復調及び誤り訂正などの処理を行い、トランスポートストリームを生成し、分離部13へ出力する。
分離部(デマルチプレクサ)13は、復調部12から入力されるトランスポートストリームを映像ストリーム、音声ストリーム、字幕データ等に分離する。分離部13の出力は、映像デコーダ141、データデコーダ142及び音声デコーダ143から成るデコード部14に入力される。
映像デコーダ141は、分離部13から入力される映像ストリームに対してデコードを行い、生成された映像データを映像出力部15に出力する。
データデコーダ142は、分離部13から入力される字幕データに対してデコードを行い、生成された字幕テキストデータをOSD部17へ出力する。
OSD部17は、メニュー表示などのオンスクリーンディスプレイ用の表示データを生成し、映像出力部15に出力する。また、OSD部17は、データデコーダ142から入力される字幕テキストデータに基づき字幕表示データを生成することも可能であり、字幕表示データを映像出力部15に出力する。
映像出力部15は、映像デコーダ141から入力される映像データにOSD部17から入力される表示データを重畳し、重畳後の映像データを表示部16に適した映像信号に変換し、表示部16に出力する。なお、重畳せずに映像デコーダ141から入力される映像データか、OSD部17から入力される表示データのいずれかのみを映像信号に変換して表示部16に出力する場合もある。
表示部16は、例えば液晶ディスプレイであり、映像出力部15から入力される映像信号に基づき映像を表示する。これにより、字幕を含んだ放送番組の映像や、メニュー画面などの各種映像が表示部16に表示される。
音声デコーダ143は、分離部13から入力される音声ストリームに対してデコードを行い、生成された音声データを音声出力部19へ出力する。音声出力部19は、音声デコーダ143から入力される音声データを内蔵スピーカ20に適した音声信号に変換し、内蔵スピーカ20へ出力する。内蔵スピーカ20は、音声出力部19から入力される音声信号に基づき音声を発生させる。これにより、内蔵スピーカ20から放送番組の音声が発生する。
無線通信部18は、無線ルータ4(図1)を介してモバイル機器3との間でWi-Fi等により無線通信を行う。なお、無線通信は例えばBluetooth等の通信規格に準拠し、テレビ装置1とモバイル機器3が直接的に無線通信を行うこととしてもよい。無線通信部18によって、字幕テキストデータやシーンの検出結果等をモバイル機器3へ送信することができる。
制御部21は、テレビ装置1を統括的に制御する制御装置であり、例えばマイコン等により構成される。シーン検出部211は、制御部21が機能的に有する構成であり、例えばマイコンにより制御部21が構成される場合はソフトウェア的に実現される。
リモコン受光部22は、リモコン装置(不図示)から操作に応じた赤外線信号等の操作信号を受信し、受信した操作信号をリモコンコードに変換し、リモコンコードを制御部21へ送信する。制御部21は、送信されたリモコンコードに応じた制御動作を行う。これにより、ユーザはリモコン装置によってテレビ装置1を操作することができる。
また、モバイル機器3の概略構成を示すブロック図を図3に示す。なお、図3は、モバイル機器3の特に本発明に関わる構成のみを抽出したものである。例えばモバイル機器3がスマートフォンや携帯電話である場合は、図3に示す構成以外の通話機能等を実現する構成をモバイル機器3は有している。
図3に示すように、モバイル機器3は、無線通信部31と、制御部32と、音声出力部33と、内蔵スピーカ34を備えている。
無線通信部31は、無線ルータ4(図1)を介してテレビ装置1との間で無線通信を行う。無線通信部31は、字幕テキストデータやシーンの検出結果等を受信することができる。
制御部32は、モバイル機器3を統括的に制御する制御装置であり、例えばマイコンによって構成される。合成音声生成部321及びシーン判定部322は、制御部32が機能的に有する構成であり、例えばマイコンにより制御部32が構成される場合はソフトウェア的に実現される。
音声出力部33は、合成音声生成部321によって生成された合成音声等の各種音声データを入力され、入力された音声データを内蔵スピーカ34に適した音声信号に変換して内蔵スピーカ34に出力する。内蔵スピーカ34は、音声出力部33から入力される音声信号に基づいて音声を発生する。
次に、このような構成であるテレビ装置1とモバイル機器3による字幕音声生成処理に関して図4A及び図4Bに示すフローチャートを参照して説明する。図4Aがテレビ装置1側のフローチャートであり、図4Bがモバイル機器3側のフローチャートである。
なお、図4A及び図4Bの処理は、例えばリモコン装置(不図示)の操作によってテレビ装置1が字幕音声出力モードに移行した場合に行われ、処理は繰り返し行われる。
図4Aに示すフローチャートが開始されると、まずステップS1で、テレビ装置1の制御部21は、ユーザが理解できる言語の音声が放送に含まれているか否かを判定する。ここでは、例えば制御部21は、リモコン装置の操作によって予め設定されたユーザが理解できる言語が、データデコーダ142から取得されるEIT(Event Information Table)に含まれる音声言語情報に含まれるか否かを判定する。EITは、EPG(電子番組表)を作成するために用いられる番組に関するデータであり、分離部13から出力されるSI(Service Information)をデータデコーダ142によりデコードしたデータに含まれる。
もしユーザが理解できる言語の音声が放送に含まれている場合は(ステップS1のN)、処理は終了するが(エンド)、含まれていない場合は(ステップS1のY)、ステップS2に進む。例えば、ユーザの理解できる言語を日本語としている場合に、音声が英語のみである場合はステップS2に進む。
ステップS2で、制御部21は、ユーザが理解できる言語の字幕が放送に含まれているか否かを判定する。ここでは、例えば制御部21は、リモコン装置の操作によって予め設定されたユーザが理解できる言語が、上記EITに含まれる字幕言語情報に含まれるか否かを判定する。
もしユーザが理解できる言語の字幕が放送に含まれない場合は(ステップS2のN)、処理は終了するが(エンド)、含まれる場合は(ステップS2のY)、ステップS3に進む。例えば、ユーザの理解できる言語を日本語としている場合に、日本語の字幕がある場合はステップS3に進む。
ステップS3では、制御部21の制御により、データデコーダ142は、ユーザが理解できる言語の字幕テキストデータを無線通信部18に送る。これにより、無線通信部18は、字幕テキストデータを無線信号に変換して無線ルータ4(図1)を介してモバイル機器3へ送信する。つまり、字幕がモバイル機器3へ転送される。
次に、ステップS4で、制御部21のシーン検出部211は、シーン検出を実行する。本実施形態では具体的に、シーン検出部211は、映像デコーダ14から取得される映像データに基づき動きベクトルを検出し、検出された動きベクトルが大きいか否かを判定する。例えば、或る時間帯における複数の動きベクトルを検出し、検出された動きベクトルの大きさの平均値や最大値などが閾値を超えるかを判定し、動きベクトルが大きいかを判定する。そして、シーン検出部211は、動きベクトルが大きい場合は、その映像の時間帯を激しさの度合いの大きなシーンであると判定する。同様に、動きベクトルが小さい場合は、激しさの度合いの小さいシーンであると判定し、動きベクトルが大きくも小さくもない場合は、激しさの度合いが中レベルであるシーンと判定する。
そして、ステップS5で、制御部21は、上記ステップS4でのシーンの激しさの度合いの判定結果をシーン検出結果として無線通信部18に送る。これにより、無線通信部18は、シーン検出結果を無線信号に変換して無線ルータ4(図1)を介してモバイル機器3へ送信する。ステップS5の後、処理は終了する(エンド)。
モバイル機器3側の図4Bで示すフローチャートでは、まずステップS11で、モバイル機器3の無線通信部31は、上記ステップS3でテレビ装置1側から送信された字幕テキストデータの無線信号を受信し、無線信号から変換された字幕テキストデータを制御部32へ送る。
次に、ステップS12で、制御部32の合成音声生成部321は、無線通信部31から送られた字幕テキストデータに基づき字幕の合成音声を生成する。
そして、ステップS13で、無線通信部31は、上記ステップS5でテレビ装置1側から送信されたシーン検出結果の無線信号を受信し、無線信号から変換されたシーン検出結果を制御部32へ送る。
そして、ステップS14で、シーン判定部322は、制御部32から送られたシーン検出結果を元にシーンの激しさの度合いが大であるか否かを判定する。もしシーンの激しさの度合いが大きければ(ステップS14のY)、ステップS15に進み、合成音声生成部321は、上記ステップS12で生成された合成音声に対して、音量を上げ、韻律を大きくする補正を行って合成音声を生成する。
また、シーンの激しさの度合いが大きくなければ(ステップS14のN)、ステップS16に進み、シーン判定部322は、シーンの激しさの度合いが小さいか否かを判定する。もしシーンの激しさの度合いが小さければ(ステップS16のY)、ステップS17に進み、合成音声生成部321は、上記ステップS12で生成された合成音声に対して、音量を下げ、韻律を小さくする補正を行って合成音声を生成する。
また、ステップS16で、シーンの激しさの度合いが小さくなければ(ステップS16のN)、即ち中レベルである場合は、上記ステップS12で生成された合成音声は補正されない。
ステップS15又はS17で補正されて生成された合成音声、又は上記のように補正されなかった合成音声は、制御部32から音声出力部33へ送られ、内蔵スピーカ34から音声が発生する。
ここで、図5に具体例を示して説明する。図5に示すように、時間軸に沿って放送番組において静かなシーンであるシーン1と激しいシーンであるシーン2が並んでいるとする。シーン1では、シーンの激しさの度合いが小さいとしたシーン検出が行われ、テレビ装置1からモバイル機器3へ字幕及びシーン検出結果が送信される。これにより、モバイル機器3では、送信された字幕に基づいて音量及び韻律の小さい合成音声が生成されて出力される(図5の吹き出しA)。
また、シーン2では、シーンの激しさの度合いが大きいとしたシーン検出が行われ、テレビ装置1からモバイル機器3へ字幕及びシーン検出結果が送信される。これにより、モバイル機器3では、送信された字幕に基づいて音量及び韻律の大きい合成音声が生成されて出力される(図5の吹き出しB)。
これにより、モバイル機器3を利用するユーザは、放送番組におけるシーンの激しさの度合いに応じた字幕の音声(ユーザの理解できる言語での音声)を手元にて聞くことができ、臨場感を向上させることができる。
なお、テレビ装置1からモバイル機器3へ字幕を送信する際に、テレビ装置1の音声デコーダ143から音声出力部19へ音声データを出力してもよい。これにより、例えば外国語で音声を聞きたいユーザはテレビ装置1の内蔵スピーカ20からの音声を聞くと共に、自国語で音声を聞きたいユーザはモバイル機器3により手元で音声を聞くことができる。
また、例えば、外国語の字幕テキストデータをテレビ装置1からモバイル機器3へ送信し、モバイル機器3側で送信された字幕テキストデータを自国語のテキストデータに翻訳し、自国語のテキストデータに基づき合成音声を生成してもよい。または、モバイル機器3側で送信された外国語の字幕テキストデータに基づき合成音声を生成し、生成された合成音声を自国語の音声に翻訳してもよい。
<第2実施形態>
次に、本発明の第2実施形態について説明する。本実施形態は、上記第1実施形態と比してシーン検出方法について相違点を有する(図4AのステップS4)。
本実施形態では、テレビ装置1のシーン検出部211(図1)は、データデコーダ142から取得される先述したEIT(Event Information Table)に含まれるジャンルコードから放送番組のジャンルを特定する。そして、リモコン装置(不図示)などの操作によりユーザによって予め、動きの大きい(又は小さい)番組のジャンルとして登録されたジャンルと上記特定されたジャンルが一致した場合に、激しさの度合いが大きい(又は小さい)シーンであると判定する。
例えば、動きの大きい番組のジャンルとして、スポーツ等が登録されているとして、EITに含まれるジャンルコードがスポーツを表している場合、激しさの度合いが大きいシーンであると判定する。
なお、登録されたジャンルのいずれにも一致しない場合は、激しさの度合いが中レベルのシーンであると判定する。
<第3実施形態>
次に、本発明の第3実施形態について説明する。本実施形態は、上記第1実施形態と比してシーン検出方法について相違点を有する(図4AのステップS4)。
本実施形態では、テレビ装置1のシーン検出部211(図1)は、データデコーダ142から取得される番組の或る時間帯の字幕テキストデータに基づき、単位時間当たりに表示する字幕の文字数を算出し、算出された文字数が予め設定された第1の閾値を上回るか否かを判定する。
もし第1の閾値を上回る場合、上記番組の時間帯を激しさの度合いが大きいシーンであると判定し、そうでない場合は、第2の閾値(<第1の閾値)との比較を行う。そして、第2の閾値を下回る場合は、上記番組の時間帯を激しさの度合いが小さいシーンであると判定し、そうでない場合は、上記番組の時間帯を激しさの度合いが中レベルのシーンであると判定する。
<第4実施形態>
次に、本発明の第4実施形態について説明する。本実施形態は、上記第1実施形態と比してシーン検出方法について相違点を有する(図4AのステップS4)。
本実施形態では、テレビ装置1のシーン検出部211(図1)は、データデコーダ142から取得される番組の或る時間帯の字幕テキストデータに含まれる文字列が、リモコン装置(不図示)などによってユーザにより、動きの大きい(又は小さい)シーンを表すとして予め登録された文字列と一致するか否かを判定する。
もし一致した場合は、上記番組の時間帯を激しさの度合いが大きい(又は小さい)シーンであると判定し、そうでない場合は、上記番組の時間帯を激しさの度合いが中レベルのシーンであると判定する。
<第5実施形態>
次に、本発明の第5実施形態について説明する。本発明の第5実施形態に係るテレビ装置の概略構成を示すブロック図を図6に示す。上記第1実施形態では、字幕をモバイル機器へ送信してモバイル機器側で字幕の音声を出力したが、本実施形態では、テレビ装置において字幕の音声を出力する実施形態となる。
図6に示すテレビ装置1’は、上記第1実施形態(図2)との相違点として、制御部23を備え、字幕送信のための無線通信部を備えない構成となる。なお、インターネット接続等のために無線通信部を備えても構わない。
制御部23は、機能部として合成音声生成部231、シーン検出部232、及びシーン判定部233を備えている。これらの機能部は、制御部23が例えばマイコンにより構成される場合は、ソフトウェア的に実現される。
本実施形態に係る字幕音声生成処理について図7のフローチャートを参照して説明する。図7におけるステップS21、S22については先述した図4AのステップS1、S2と同様である。
ステップS22でユーザの理解できる言語による字幕がある場合(ステップS22のY)、ステップS23に進む。ステップS23で、合成音声生成部231は、データデコーダ142から取得されるユーザの理解できる言語での字幕テキストデータに基づき合成音声を生成する。
次に、ステップS24で、シーン検出部232がシーン検出を実行する。ここでの処理は、先述した第1〜第4実施形態のいずれの方法によっても構わない。
そして、ステップS25で、シーン判定部233は、上記ステップS24でのシーン検出結果に基づきシーンの激しさの度合いが大きいか否かを判定する。もし大きい場合は(ステップS25のY)、ステップS26に進み、合成音声生成部231は、上記ステップS23で生成された合成音声に対して、音量を上げ、韻律を大きくする補正を行って合成音声を生成する。一方、そうでない場合は(ステップ25のN)、ステップS27に進む。
ステップS27で、シーン判定部233は、上記ステップS24でのシーン検出結果に基づきシーンの激しさの度合いが小さいか否かを判定する。もし小さい場合は(ステップS27のY)、ステップS28に進み、合成音声生成部231は、上記ステップS23で生成された合成音声に対して、音量を下げ、韻律を小さくする補正を行って合成音声を生成する。
一方、そうでない場合は(ステップS27のN)、即ち中レベルである場合は、上記ステップS23で生成された合成音声は補正されない。
ステップS26又はS28で補正されて生成された合成音声、又は上記のように補正されなかった合成音声は、制御部23から音声出力部19へ送られ、内蔵スピーカ20から音声が発生する。なお、このとき、音声デコーダ143から音声出力部19には音声データは送られない。
このような本実施形態によれば、ユーザは、放送番組におけるシーンの激しさの度合いに応じた字幕の音声(ユーザの理解できる言語での音声)をあたかも吹き替えのようにテレビ装置1’の内蔵スピーカ20から聞くことができ、臨場感を向上させることができる。
なお、例えば、制御部23にて外国語の字幕テキストデータを自国語のテキストデータに翻訳し、自国語のテキストデータに基づき合成音声を生成してもよい。または、制御部23にて外国語の字幕テキストデータに基づき合成音声を生成し、生成された合成音声を自国語の音声に翻訳してもよい。
以上、本発明の実施形態について説明したが、本発明の趣旨の範囲内であれば、実施形態は種々の変更が可能である。
例えば、本発明は、放送信号を受信できるものであれば、テレビ装置に限らず、例えばハードディスクレコーダ、光ディスクレコーダやセットトップボックスなどに適用しても構わない。また、映像音声及び字幕は、放送信号に限らず、再生信号に基づくものでも構わない。
1、1’ テレビ装置
2 アンテナ
3 モバイル機器
4 無線ルータ
11 チューナ
12 復調部
13 分離部
14 デコード部
141 映像デコーダ
142 データデコーダ
143 音声デコーダ
15 映像出力部
16 表示部
17 OSD部
18 無線通信部
19 音声出力部
20 内蔵スピーカ
21 制御部
211 シーン検出部
22 リモコン受光部
23 制御部
231 合成音声生成部
232 シーン検出部
233 シーン判定部
31 無線通信部
32 制御部
321 合成音声生成部
322 シーン判定部
33 音声出力部
34 内蔵スピーカ

Claims (10)

  1. 字幕データを含むコンテンツにおけるシーンの激しさの度合いを検出するシーン検出部を備えることを特徴とするシーン検出装置。
  2. 前記シーン検出部は、前記コンテンツの映像データに基づき動きベクトルを検出し、検出された動きベクトルの大きさに基づきシーンの激しさの度合いを検出することを特徴とする請求項1に記載のシーン検出装置。
  3. 前記シーン検出部は、前記コンテンツのジャンル情報に基づき特定されるジャンルと、登録されたジャンルとの比較によって、シーンの激しさの度合いを検出することを特徴とする請求項1に記載のシーン検出装置。
  4. 前記シーン検出部は、前記コンテンツの字幕データに基づき単位時間当たりに表示する字幕の文字数を算出し、算出された文字数と所定の閾値との比較によって、シーンの激しさの度合いを検出することを特徴とする請求項1に記載のシーン検出装置。
  5. 前記シーン検出部は、前記コンテンツの字幕データに含まれる文字列と、登録された文字列との比較によって、シーンの激しさの度合いを検出することを特徴とする請求項1に記載のシーン検出装置。
  6. 前記字幕データ、及び前記シーン検出部による検出結果をモバイル機器へ送信する通信部を更に備えることを特徴とする請求項1〜請求項5のいずれか1項に記載のシーン検出装置。
  7. 前記字幕データ、及び前記シーン検出部による検出結果に基づき合成音声を生成する合成音声生成部と、前記合成音声生成部により生成された合成音声に基づき音声を発生する内蔵スピーカと、を更に備えることを特徴とする請求項1〜請求項5のいずれか1項に記載のシーン検出装置。
  8. 前記合成音声生成部は、前記シーン検出部による検出結果に応じた音量及び/又は韻律の合成音声を生成することを特徴とする請求項7に記載のシーン検出装置。
  9. 外部装置より送られるコンテンツの字幕データ及び前記コンテンツにおけるシーンの激しさの度合いの検出結果を受信する受信部と、
    前記受信部により受信された前記字幕データ及び前記検出結果に基づき合成音声を生成する合成音声生成部と、
    前記合成音声生成部により生成された合成音声を出力する音声出力部と、
    を備えることを特徴とするモバイル機器。
  10. 前記合成音声生成部は、前記検出結果に応じた音量及び/又は韻律の合成音声を生成することを特徴とする請求項9に記載のモバイル機器。
JP2013146241A 2013-07-12 2013-07-12 シーン検出装置、及びモバイル機器 Pending JP2015019299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013146241A JP2015019299A (ja) 2013-07-12 2013-07-12 シーン検出装置、及びモバイル機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013146241A JP2015019299A (ja) 2013-07-12 2013-07-12 シーン検出装置、及びモバイル機器

Publications (1)

Publication Number Publication Date
JP2015019299A true JP2015019299A (ja) 2015-01-29

Family

ID=52439896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013146241A Pending JP2015019299A (ja) 2013-07-12 2013-07-12 シーン検出装置、及びモバイル機器

Country Status (1)

Country Link
JP (1) JP2015019299A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105847860A (zh) * 2016-03-29 2016-08-10 乐视控股(北京)有限公司 一种视频中暴力内容的检测方法及装置
WO2021157192A1 (ja) * 2020-02-04 2021-08-12 ソニーグループ株式会社 制御装置及び制御方法、コンピュータプログラム、並びにコンテンツ再生システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105847860A (zh) * 2016-03-29 2016-08-10 乐视控股(北京)有限公司 一种视频中暴力内容的检测方法及装置
WO2021157192A1 (ja) * 2020-02-04 2021-08-12 ソニーグループ株式会社 制御装置及び制御方法、コンピュータプログラム、並びにコンテンツ再生システム

Similar Documents

Publication Publication Date Title
KR20140144029A (ko) 플렉시블 디스플레이를 포함하는 멀티미디어 디바이스 및 그 제어 방법
KR102277749B1 (ko) 디스플레이 장치 및 그 제어 방법
US9497499B2 (en) Display apparatus and method for remotely outputting audio
JP2007311942A (ja) コンテンツ表示装置
WO2017047466A1 (ja) 受信装置、受信方法、プログラム
KR101661973B1 (ko) 영상표시장치
CN111345045A (zh) 显示装置及其控制方法
WO2009118971A1 (ja) デジタル放送受信装置、及びデジタル放送受信方法
KR20070047665A (ko) 방송수신장치, 방송송신장치, 방송 시스템 및 그 제어방법
KR20080106758A (ko) 방송수신장치 및 그 제어방법
KR20080004311A (ko) 멀티미디어 컨텐츠 재생 장치 및 방법
JP2008160232A (ja) 映像音声再生装置
JP2015019299A (ja) シーン検出装置、及びモバイル機器
JP4320745B2 (ja) デジタル放送受信装置
JP2015018079A (ja) 字幕音声生成装置
KR100884664B1 (ko) 디지털 방송 수신기에서의 서브타이틀 표시 장치 및 방법
JP2008141463A (ja) オンスクリーン表示装置及びテレビジョン受像機
JP2008278199A (ja) テレビジョン受信装置
JP4682446B2 (ja) 放送言語表示機能を有する放送受信装置
KR20160148173A (ko) 디스플레이 디바이스 및 그 제어 방법
KR100726439B1 (ko) 자막 서비스 방법 및 이를 수행하는 영상처리장치
KR20160016341A (ko) 멀티미디어 디바이스 및 이의 제어 방법
JP2008005190A (ja) テレビ受像機
JP2012204988A (ja) テレビジョン受像機
KR100746084B1 (ko) 영상/음성 부분출력 차단 장치 및 방법

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20150601