JP6163680B1 - コンテンツ再生プログラム及びコンテンツ再生装置 - Google Patents

コンテンツ再生プログラム及びコンテンツ再生装置 Download PDF

Info

Publication number
JP6163680B1
JP6163680B1 JP2017508106A JP2017508106A JP6163680B1 JP 6163680 B1 JP6163680 B1 JP 6163680B1 JP 2017508106 A JP2017508106 A JP 2017508106A JP 2017508106 A JP2017508106 A JP 2017508106A JP 6163680 B1 JP6163680 B1 JP 6163680B1
Authority
JP
Japan
Prior art keywords
content
time axis
audio
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017508106A
Other languages
English (en)
Other versions
JPWO2018078768A1 (ja
Inventor
淳 瀧川
淳 瀧川
久晴 鈴木
久晴 鈴木
猛士 那須
猛士 那須
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EVIXAR INC.
Original Assignee
EVIXAR INC.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EVIXAR INC. filed Critical EVIXAR INC.
Application granted granted Critical
Publication of JP6163680B1 publication Critical patent/JP6163680B1/ja
Publication of JPWO2018078768A1 publication Critical patent/JPWO2018078768A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • H04N21/43079Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of additional data with content streams on multiple devices
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • G11B27/3036Time code signal
    • G11B27/3045Time code signal superimposed on the recorded main signal, e.g. burn-in-time code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • H04N21/43072Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of multiple content streams on the same device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8358Generation of protective data, e.g. certificates involving watermark
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content

Abstract

あるコンテンツの時間軸を容易かつ確実に判定し、当該コンテンツの再生に連動して別のコンテンツを再生する。コンテンツ再生プログラムは、コンピュータに、コンピュータの外部で再生される第1コンテンツの音声を検出する音声検出部と、検出された音声に基づいて、コンピュータの外部で第1コンテンツに続いて再生される第2コンテンツの時間軸を判定する時間軸判定部と、判定された時間軸に基づいて、第2コンテンツの再生に合わせて、第2コンテンツに応じた第3コンテンツを再生するコンテンツ再生部と、を実現させる。

Description

本発明は、コンテンツ再生プログラム及びコンテンツ再生装置に関する。
音声を伴った映像に対するセカンドスクリーン情報を、音声入出力及び画像表示可能な携帯デバイスに出力する方法が開示されている(特許文献1)。特許文献1に開示されている方法では、音声中に、映像の各映像シーンに対応づけられたタイムコードが透かしデータとして埋め込まれる。そして、セカンドスクリーン情報に相当するデータにタイムコードを対応付けて携帯デバイスに予め格納し、映像の近傍で携帯デバイスに音声を入力し、映像シーンに同期させてセカンドスクリーン情報を出力することが行われる。
特開2015−61112号公報
特許文献1に開示されている方法では、各映像シーンに対応づけて音声中に透かしデータを埋め込む必要がある。そのため、映画等のコンテンツ制作作業の負荷が高く、制作側の都合で透かしデータの埋め込みを行えない場合がある。
透かしデータではなく、音声の特徴量であるフィンガープリントを用いて映像の時間軸を判定する手法もあるが、無音の場合や、定常的な音声が継続する箇所ではフィンガープリントを作成できない。また、1つの映像の異なる時間帯で全く同じ音声が用いられる場合、フィンガープリントでは、どちらの時間帯であるかを判別することができない。
そこで、本発明は、あるコンテンツの時間軸を容易かつ確実に判定し、当該コンテンツの再生に連動して別のコンテンツを再生するコンテンツ再生プログラム及びコンテンツ再生装置を提供することを目的とする。
本発明の一態様に係るコンテンツ再生プログラムは、コンピュータに、コンピュータの外部で再生される第1コンテンツの音声を検出する音声検出部と、検出された音声に基づいて、コンピュータの外部で第1コンテンツに続いて再生される第2コンテンツの時間軸を判定する時間軸判定部と、判定された時間軸に基づいて、第2コンテンツの再生に合わせて、第2コンテンツに応じた第3コンテンツを再生するコンテンツ再生部と、を実現させる。
また、本発明の一態様に係るコンテンツ再生装置は、外部で再生される第1コンテンツの音声を検出する音声検出部と、検出された音声に基づいて、第1コンテンツに続いて外部で再生される第2コンテンツの時間軸を判定する時間軸判定部と、判定された時間軸に基づいて、第2コンテンツの再生に合わせて、第2コンテンツに応じた第3コンテンツを再生するコンテンツ再生部と、を備える。
なお、本発明において、「部」とは、単に物理的手段を意味するものではなく、その「部」が有する機能をソフトウェアによって実現する場合も含む。また、1つの「部」や装置が有する機能が2つ以上の物理的手段や装置により実現されても、2つ以上の「部」や装置の機能が1つの物理的手段や装置により実現されてもよい。
本発明によれば、あるコンテンツの時間軸を容易かつ確実に判定し、当該コンテンツの再生に連動して別のコンテンツを再生するコンテンツ再生プログラム及びコンテンツ再生装置を提供することができる。
本発明の一実施形態であるコンテンツ再生システムの構成を示す図である。 コンテンツ再生システムにおけるコンテンツ再生の概要を示す図である。 ユーザ端末100のハードウェア構成の一例を示す図である。 ユーザ端末100の機能構成の一例を示す図である。 コンテンツを取得するためのユーザインタフェースの一例を示す図である。 時間軸の判定状態が表示された画面の一例を示す図である。 ユーザ端末100におけるコンテンツ再生処理の一例を示すフローチャートである。
添付図面を参照して、本発明の好適な実施形態について説明する。図1は、本発明の一実施形態であるコンテンツ再生システムの構成を示す図である。コンテンツ再生システムは、ユーザ端末100(コンテンツ再生装置)、スクリーン110及びスピーカ120を備える。スクリーン110及びスピーカ120は、例えば、映画館や球場等の施設に設置され、ユーザ端末100は当該施設の利用者によって利用される。スクリーン110には、映画等のコンテンツの映像が表示され、スピーカ120からは当該コンテンツの音声が出力される。そして、ユーザ端末100では、当該コンテンツの再生に連動して、字幕や音声ガイド等の別のコンテンツが再生される。
図2は、コンテンツ再生システムにおけるコンテンツ再生の概要を示す図である。
映画館等の施設で再生されるコンテンツは、第1コンテンツ200と、当該第1コンテンツ200に続いて再生される第2コンテンツ210が含まれる。第2コンテンツ210は、例えば、映画の本編である。そして、第1コンテンツ200は、例えば、映画の本編の前に再生される予告編や広告等(先付け)である。第1コンテンツ200には、その音声中に透かしデータ220が埋め込まれている。透かしデータ220は、例えば、第1コンテンツ200のフレームごとに埋め込まれており、第2コンテンツ210の開始タイミング(時間軸)を判定するためのタイムコード等のデータ(第1データ)を含む。また、透かしデータ220は、例えば、施設や地域等を示すデータ(第2データ)を含む。
ユーザ端末100で再生される第3コンテンツ230は、例えば、映画の本編と連動して再生される、当該映画の字幕である。第3コンテンツ230は、第2コンテンツ210に連動して再生されるものであれば、字幕に限らず、音声ガイドや手話画像、説明画像等、任意のコンテンツとすることができる。ユーザ端末100では、透かしデータ220に基づいて、第2コンテンツ210の開始タイミング(時間軸)が判定され、第2コンテンツ210に連動して第3コンテンツ230が再生される。
図3は、ユーザ端末100のハードウェア構成の一例を示す図である。ユーザ端末100は、例えば、スマートフォンやタブレット端末等のコンピュータである。図3に示すように、ユーザ端末100は、プロセッサ300、記憶装置310、通信インタフェース(I/F)320、マイク330、音声出力装置340、表示装置350及び入力装置360を備える。
プロセッサ300は、記憶装置310に格納されているプログラムを実行することにより、ユーザ端末100における様々な機能を実現することができる。
記憶装置310は、プログラムやデータを記憶する記憶領域である。記憶装置310は、一時的な記憶領域である揮発性メモリや、恒久的な記憶領域である不揮発性メモリを含むことができる。記憶装置310は、ユーザ端末100の外部に設けられていてもよい。
通信インタフェース320は、外部の装置との間でプログラムやデータの送受信を行うためのインタフェース装置である。通信インタフェース320は、例えば、携帯電話の通信網用のインタフェースや、無線LAN(Local Area Network)用のインタフェースを含む。通信インタフェース320は、有線のインタフェースを含んでもよい。
マイク330は、周囲の音声を検出する。マイク330は、可聴域の音声に限らず、非可聴域の音声も検出することができる。マイク330は、ユーザ端末100の外部に設けられていてもよい。
音声出力装置340は、音声を出力するための出力装置である。音声出力装置340は、例えば、スピーカである。また、音声出力装置340は、イヤホンに音声を出力するための装置であってもよい。第3コンテンツ230が音声(例えば音声ガイドや吹き替え音声)を含む場合、当該音声は音声出力装置340から出力される。
表示装置350は、画像(静止画又は動画)を表示するための出力装置である。表示装置350は、例えば、液晶ディスプレイや有機EL(Electroluminescence)ディスプレイである。表示装置350は、ユーザ端末100の外部に設けられていてもよい。第3コンテンツ230が画像(例えば字幕)を含む場合、当該画像は表示装置350に表示される。
入力装置360は、ユーザ入力を受け付けるための装置である。入力装置360は、例えば、表示装置350と一体的に形成されたタッチパネルであってもよい。入力装置360は、ユーザ端末100の外部に設けられていてもよい。
図4は、ユーザ端末100の機能構成の一例を示す図である。ユーザ端末100は、コンテンツ取得部400、コンテンツ記憶部410、音声検出部420、時間軸判定部430、コンテンツ再生部440、参照データ取得部450、参照データ記憶部460、設定部470及び設定データ記憶部480を備える。図4に示す各部は、例えば、記憶装置310の記憶領域を用いたり、記憶装置310に格納されたプログラム(コンテンツ再生プログラム)をプロセッサ300が実行したりすることにより実現することができる。
コンテンツ取得部400は、ユーザ端末100で再生される第3コンテンツ230を、例えばインターネット経由で取得し、コンテンツ記憶部410に格納する。図5は、コンテンツを取得するためのユーザインタフェースの一例を示す図である。画面500は、例えば、第3コンテンツ230を再生するためのアプリケーションを起動すると表示される。画面500は、コンテンツの種類を選択するための領域510,520を含む。
画面500では、領域510において、字幕、手話又は音声ガイドを選択することができる。また画面500では、領域510において、映画館・劇場、テーマパーク、博物館・美術館、DVD/BD又はその他を選択することができる。そして、領域510,520の選択内容に応じたコンテンツの一覧が領域530に表示される。領域530には、例えば、第2コンテンツ210(例えば本編)のタイトルが表示される。コンテンツ取得部400は、領域530で選択された第2コンテンツ210に対応する第3コンテンツ230を取得する。なお、コンテンツ取得部400は、再生対象ではないものも含む第3コンテンツ230を取得してもよい。
また、コンテンツ取得部400は、第1コンテンツ200で検出される音声(透かしデータ又はフィンガープリント)によって特定される第3コンテンツ230を取得してもよい。例えば、第1コンテンツ200に埋め込まれた透かしデータに第3コンテンツ230を特定するためのデータ(第2データ)が含まれている場合、コンテンツ取得部400は、当該データに基づいて第3コンテンツ230を取得してもよい。
音声検出部420は、ユーザ端末100の外部で再生されるコンテンツの音声を検出する。具体的には、音声検出部420は、第1コンテンツ200(先付け)の音声を検出することができる。また、音声検出部420は、第2コンテンツ210(本編)の音声を検出することもできる。音声検出部420が検出する音声は、例えば、透かしデータやフィンガープリントである。音声検出部420は、時間軸判定部430によって第2コンテンツ210の時間軸が判定されると動作を停止することができる。
時間軸判定部430は、音声検出部420で検出された音声に基づいて、第2コンテンツ210の時間軸を判定する。具体的には、例えば、第1コンテンツ200の音声に埋め込まれた透かしデータに含まれる、第2コンテンツ210の時間軸を判定するためのデータ(第1データ)に基づいて、第2コンテンツ210の時間軸を判定することができる。また、時間軸判定部430は、第2コンテンツ210の音声のフィンガープリントに基づいて、第2コンテンツ210の再生中に第2コンテンツ210の時間軸を判定することができる。ここで、第2コンテンツ210の時間軸の判定とは、第2コンテンツ210の再生タイミングを時刻と対応づけることをいう。例えば、時間軸判定部430は、第2コンテンツ210の再生が開始される時刻(例えば、実際の時刻でもよいし、ある時点を基準とする相対時刻でもよい。)を判定することができる。また例えば、時間軸判定部430は、第2コンテンツ210のどの部分が現在再生されているかを判定することができる。時間軸判定部430は、第2コンテンツ210の時間軸が判定されると動作を停止することができる。
コンテンツ再生部440は、時間軸判定部430で判定された時間軸に基づいて、第2コンテンツ210の再生に合わせて(同期させて)、第3コンテンツ230を再生する。また、コンテンツ再生部440は、時間軸判定部430による時間軸の判定状態を示す情報を出力することができる。図6は、時間軸の判定状態が表示された画面の一例を示す図である。図6の画面600に示すように、コンテンツ再生部440は、時間軸の判定が完了したことを示すメッセージ(例えば「字幕の表示準備が完了しました。本編開始までしばらくお待ちください。」)を表示装置350に表示することができる。
参照データ取得部450は、時間軸判定部430がフィンガープリントに基づいて時間軸を判定するための参照データを、例えばインターネット経由で取得し、参照データ記憶部460に格納する。参照データは、コンテンツの音声の特徴量をコンテンツの再生時刻と対応づけたデータである。時間軸判定部430は、第1コンテンツ200又は第2コンテンツ210の音声の特徴量を参照データと比較することにより、第2コンテンツ210の時間軸を判定することができる。
設定部470は、第3コンテンツ230の再生のための設定をユーザから受け付け、当該設定を示す設定データを設定データ記憶部480に格納する。コンテンツ再生部440は、当該設定データに基づいて第3コンテンツ230を再生することができる。
図7は、ユーザ端末100におけるコンテンツ再生処理の一例を示すフローチャートである。図7に示す処理は、例えば、ユーザがアプリケーションを起動したことにより開始される。
音声検出部420は、第1コンテンツ200の音声に埋め込まれた透かしデータの検出を開始する(S701)。透かしデータが検出されれば、時間軸判定部430は、透かしデータに基づいて第2コンテンツ210の時間軸を判定する(S702)。なお、時間軸判定部430は、第1コンテンツ200の音声のフィンガープリントに基づいて、第2コンテンツ210の時間軸を判定してもよい。
また、音声検出部420は、第1コンテンツ200の音声に基づく時間軸の判定(S701〜S702)と並行して、第2コンテンツ210の音声に基づく時間軸の判定(S703〜S704)を実行する。具体的には、音声検出部420は、第2コンテンツ210の音声のフィンガープリント(特徴量)の検出を開始する(S703)。そして、時間軸判定部430は、当該フィンガープリントに基づいて第2コンテンツ210の時間軸を判定する(S704)。第2コンテンツ210の音声に基づく時間軸の判定(S703〜S704)処理は、例えば、第2コンテンツ210の再生が開始された後に、ユーザが第2コンテンツ210の視聴を開始した場合や、第1コンテンツ200の音声に基づく時間軸の判定(S701〜S702)が正常に動作しなかった場合等に有効である。
第1コンテンツ200又は第2コンテンツ210の音声に基づく時間軸の判定(S701〜S704)が完了するまでの間(S705:N)、時間軸の判定処理が繰り返し実行される。そして、時間軸の判定が完了すると(S705:Y)、音声検出部420及び時間軸判定部430は動作が停止され、コンテンツ再生部440が、判定された時間軸に基づいて、第2コンテンツ210の再生に合わせて第3コンテンツ230を再生する(S706)。
以上、本発明の一実施形態について説明した。本実施形態によれば、第1コンテンツ200(例えば先付け)の音声に基づいて、第1コンテンツ200に続いて再生される第2コンテンツ210(例えば本編)の時間軸を判定することができる。そして、当該判定された時間軸に基づいて、第2コンテンツ210の再生に合わせて、第2コンテンツ210に応じた第3コンテンツ230(例えば字幕や音声ガイド)を再生することができる。したがって、第2コンテンツ210の音声に透かしデータが埋め込まれていない場合や、第2コンテンツ210の音声のフィンガープリントでは第2コンテンツ210の開始タイミングの判定が難しい場合であっても、第2コンテンツ210の時間軸を容易かつ確実に判定することができる。
また、本実施形態によれば、第1コンテンツ200の音声に埋め込まれた透かしデータに基づいて第2コンテンツ210の時間軸を判定することができる。第1コンテンツ200は、第2コンテンツ210と比較して透かしデータを埋め込むことが容易であることが多い。そのため、第1コンテンツ200の音声に透かしデータを埋め込むことにより、第2コンテンツ210の時間軸を容易かつ確実に判定することができる。
さらに、本実施形態によれば、第1コンテンツ200の音声に埋め込まれた透かしデータは非可聴領域の音声データとすることができる。これにより、第1コンテンツ200を視聴しているユーザに影響を与えることなく、第2コンテンツ210の時間軸を容易かつ確実に判定することができる。
また、本実施形態によれば、第1コンテンツ200の音声に埋め込まれた透かしデータに基づく第2コンテンツ210の時間軸の判定に加えて、第2コンテンツ210の音声のフィンガープリント(特徴量)に基づいて第2コンテンツ210の時間軸を判定してもよい。これにより、例えば、第2コンテンツ210の再生開始後にユーザが第2コンテンツ210の視聴を開始した場合等において、第2コンテンツ210の時間軸を容易かつ確実に判定することができる。
また、本実施形態によれば、第1コンテンツ200の音声に埋め込まれた透かしデータ220は、時間軸の判定のためのデータ(例えばタイムコード)に加えて、第3コンテンツ230を特定するためのデータ(例えば施設や地域等を示すデータ)を含んでもよい。これにより、例えば、第1コンテンツ200の音声に埋め込まれた透かしデータ220によって、第3コンテンツ230を選択することができる。
また、本実施形態によれば、第1コンテンツ200の音声の特徴量に基づいて、第2コンテンツ210の時間軸を判定してもよい。これにより、例えば、第1コンテンツ200に透かしデータ220が埋め込まれていない場合であっても、第2コンテンツ210の時間軸を容易かつ確実に判定することができる。
また、本実施形態によれば、音声検出部420及び時間軸判定部430は、第2コンテンツ210の時間軸が判定されると動作を停止することができる。これにより、ユーザ端末100における電力消費を抑制することができる。
なお、ユーザ端末100の性能等の影響により、第2コンテンツ210の時間軸の判定が行われた後に、ユーザ端末100が保持する第2コンテンツ210の時間軸と、第2コンテンツ210の実際の時間軸との間にずれが生じる可能性がある。そのため、時間軸判定部430は、第2コンテンツ210の時間軸の判定が完了した後に、適宜なタイミングで、第2コンテンツ210の音声のフィンガープリント(特徴量)に基づいて、第2コンテンツ210の時間軸を補正してもよい。例えば、時間軸判定部430は、第2コンテンツ210の時間軸の判定が完了した後に、所定の時間間隔で、第2コンテンツ210の音声のフィンガープリント(特徴量)に基づいて、第2コンテンツ210の時間軸を補正してもよい。また例えば、時間軸判定部430は、第2コンテンツ210の時間軸の判定が完了した後に、ユーザからの指示に応じて、第2コンテンツ210の音声のフィンガープリント(特徴量)に基づいて、第2コンテンツ210の時間軸を補正してもよい。
また、本実施形態によれば、第2コンテンツ210の時間軸の判定状態を示す情報を表示装置350に出力することができる。なお、当該情報の出力先は表示装置350に限らず、音声出力装置340であってもよい。これにより、第2コンテンツ210の時間軸の判定状態をユーザに通知することができる。
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
100 ユーザ端末、110 スクリーン、120 スピーカ、200 第1コンテンツ、210 第2コンテンツ、220 透かしデータ、230 第3コンテンツ、300 プロセッサ、310 記憶装置、320 通信インタフェース、330 マイク、340 音声出力装置、350 表示装置、360 入力装置、400 コンテンツ取得部、410 コンテンツ記憶部、420 音声検出部、430 時間軸判定部、440 コンテンツ再生部、450 参照データ取得部、460 参照データ記憶部、470 設定部、480 設定データ記憶部

Claims (10)

  1. コンピュータに、
    前記コンピュータの外部で再生される第1コンテンツの音声を検出する音声検出部と、
    前記検出された音声に基づいて、前記コンピュータの外部で前記第1コンテンツに続いて再生される第2コンテンツの時間軸を判定する時間軸判定部と、
    前記判定された時間軸に基づいて、前記第2コンテンツの再生に合わせて、前記第2コンテンツに応じた第3コンテンツを再生するコンテンツ再生部と、
    を実現させるためのコンテンツ再生プログラム。
  2. 前記音声は、前記第1コンテンツに埋め込まれた透かしデータである、
    請求項1に記載のコンテンツ再生プログラム。
  3. 前記透かしデータは、非可聴領域の音声データである、
    請求項2に記載のコンテンツ再生プログラム。
  4. 前記音声検出部は、さらに、前記コンピュータの外部で再生される前記第2コンテンツの音声の特徴量を検出し、
    前記時間軸判定部は、前記第1コンテンツに埋め込まれた前記透かしデータ又は前記第2コンテンツの前記特徴量に基づいて前記時間軸を判定する、
    請求項2又は3に記載のコンテンツ再生プログラム。
  5. 前記透かしデータは、前記時間軸の判定のための第1データと、前記第3コンテンツを特定するための第2データとを含み、
    前記時間軸判定部は、前記第1データに基づいて前記時間軸を判定し、
    前記コンテンツ再生部は、前記第2データに基づいて前記第3コンテンツを再生する、
    請求項2から4のいずれか一項に記載のコンテンツ再生プログラム。
  6. 前記音声検出部は、前記音声の特徴量を検出し、
    前記時間軸判定部は、前記検出された特徴量に基づいて前記時間軸を判定する、
    請求項1に記載のコンテンツ再生プログラム。
  7. 前記音声検出部及び前記時間軸判定部は、前記時間軸が判定されると動作を停止する、請求項1から6のいずれか一項に記載のコンテンツ再生プログラム。
  8. 前記時間軸判定部は、前記時間軸が判定された後に、前記第2コンテンツの前記特徴量に基づいて前記時間軸を補正する、
    請求項4に記載のコンテンツ再生プログラム。
  9. 前記コンテンツ再生部は、前記時間軸の判定状態を示す情報を出力する、
    請求項1から8のいずれか一項に記載のコンテンツ再生プログラム。
  10. 外部で再生される第1コンテンツの音声を検出する音声検出部と、
    前記検出された音声に基づいて、前記第1コンテンツに続いて外部で再生される第2コンテンツの時間軸を判定する時間軸判定部と、
    前記判定された時間軸に基づいて、前記第2コンテンツの再生に合わせて、前記第2コンテンツに応じた第3コンテンツを再生するコンテンツ再生部と、
    を備えるコンテンツ再生装置。
JP2017508106A 2016-10-27 2016-10-27 コンテンツ再生プログラム及びコンテンツ再生装置 Active JP6163680B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/081900 WO2018078768A1 (ja) 2016-10-27 2016-10-27 コンテンツ再生プログラム及びコンテンツ再生装置

Publications (2)

Publication Number Publication Date
JP6163680B1 true JP6163680B1 (ja) 2017-07-19
JPWO2018078768A1 JPWO2018078768A1 (ja) 2018-11-01

Family

ID=59351268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017508106A Active JP6163680B1 (ja) 2016-10-27 2016-10-27 コンテンツ再生プログラム及びコンテンツ再生装置

Country Status (7)

Country Link
US (1) US11303951B2 (ja)
EP (1) EP3534618A4 (ja)
JP (1) JP6163680B1 (ja)
KR (1) KR102607703B1 (ja)
CN (1) CN109983781B (ja)
TW (1) TWI760383B (ja)
WO (1) WO2018078768A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015510305A (ja) * 2012-01-06 2015-04-02 トムソン ライセンシングThomson Licensing セカンドスクリーン上のコンテンツを同期させるための方法およびシステム
JP2016111492A (ja) * 2014-12-05 2016-06-20 株式会社テレビ朝日 端末装置、サーバ装置、及びプログラム

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004021404B4 (de) * 2004-04-30 2007-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wasserzeicheneinbettung
JP2007207328A (ja) * 2006-01-31 2007-08-16 Toshiba Corp 情報記憶媒体、プログラム、情報再生方法、情報再生装置、データ転送方法、及びデータ処理方法
US8763029B1 (en) * 2006-11-13 2014-06-24 Visible World Inc. Systems and methods for client-based addressable advertising
CN101370261B (zh) * 2007-08-15 2011-12-07 华为技术有限公司 从cs域向ps域切换的资源准备方法及通信设备
JP2010170604A (ja) * 2009-01-21 2010-08-05 Sony Corp 光ディスク装置、光ピックアップ、プリフォーマット信号生成方法及びプログラム
US8925024B2 (en) * 2009-12-31 2014-12-30 The Nielsen Company (Us), Llc Methods and apparatus to detect commercial advertisements associated with media presentations
US9026102B2 (en) * 2010-03-16 2015-05-05 Bby Solutions, Inc. Movie mode and content awarding system and method
CN101877625A (zh) * 2010-06-29 2010-11-03 中兴通讯股份有限公司 下行语音帧的接收处理方法及装置、基带
JP5724283B2 (ja) * 2010-10-15 2015-05-27 ソニー株式会社 情報処理装置、同期方法およびプログラム
US20130083036A1 (en) * 2011-08-19 2013-04-04 Hall of Hands Limited Method of rendering a set of correlated events and computerized system thereof
CN102664007B (zh) * 2012-03-27 2016-08-31 上海量明科技发展有限公司 用于生成字符标识内容的方法、客户端及系统
CN102625164A (zh) * 2012-04-06 2012-08-01 上海车音网络科技有限公司 多媒体数据处理平台及多媒体读物、系统和方法
US9305559B2 (en) * 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
FR3006525B1 (fr) * 2013-06-04 2016-10-14 Visiware Synchronisation de contenus multimedia sur deuxieme ecran
JP6271194B2 (ja) * 2013-09-17 2018-01-31 特定非営利活動法人メディア・アクセス・サポートセンター 携帯デバイスへのセカンドスクリーン情報の提供方法
US10694264B2 (en) * 2013-09-20 2020-06-23 Koninklijke Kpn N.V. Correlating timeline information between media streams
JP6349977B2 (ja) * 2013-10-21 2018-07-04 ソニー株式会社 情報処理装置および方法、並びにプログラム
KR102297919B1 (ko) * 2013-12-09 2021-09-02 파로님 가부시키가이샤 링크처 지정용 인터페이스 장치, 시청자용 인터페이스 장치, 및 컴퓨터 프로그램
CN103702145A (zh) 2013-12-26 2014-04-02 京东方科技集团股份有限公司 节目播放提醒方法及其系统和显示装置
EP3100458B1 (en) * 2014-01-31 2018-08-15 Thomson Licensing Method and apparatus for synchronizing the playback of two electronic devices
CN104023251B (zh) * 2014-06-13 2015-08-19 腾讯科技(深圳)有限公司 基于视频的互动方法和系统
US9665341B2 (en) * 2015-02-09 2017-05-30 Sonos, Inc. Synchronized audio mixing
US20160309214A1 (en) * 2015-04-15 2016-10-20 Rovi Guides, Inc. Method of synchronizing alternate audio content with video content
EP3226570A1 (en) * 2016-03-31 2017-10-04 Thomson Licensing Synchronizing audio and video signals rendered on different devices
JP6157679B2 (ja) 2016-04-12 2017-07-05 日本放送協会 信号処理装置及びプログラム
KR102389040B1 (ko) * 2018-02-23 2022-04-22 에빅사 가부시키가이샤 콘텐츠 재생 프로그램, 콘텐츠 재생 방법 및 콘텐츠 재생 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015510305A (ja) * 2012-01-06 2015-04-02 トムソン ライセンシングThomson Licensing セカンドスクリーン上のコンテンツを同期させるための方法およびシステム
JP2016111492A (ja) * 2014-12-05 2016-06-20 株式会社テレビ朝日 端末装置、サーバ装置、及びプログラム

Also Published As

Publication number Publication date
EP3534618A1 (en) 2019-09-04
KR20190085938A (ko) 2019-07-19
EP3534618A4 (en) 2020-06-03
US11303951B2 (en) 2022-04-12
JPWO2018078768A1 (ja) 2018-11-01
CN109983781B (zh) 2022-03-22
WO2018078768A1 (ja) 2018-05-03
TW201820316A (zh) 2018-06-01
US20190253749A1 (en) 2019-08-15
TWI760383B (zh) 2022-04-11
CN109983781A (zh) 2019-07-05
KR102607703B1 (ko) 2023-11-30

Similar Documents

Publication Publication Date Title
TWI538520B (zh) 視頻資訊添加方法及裝置、視頻資訊顯示方法及裝置
WO2016095384A1 (zh) 一种弹幕显示方法及系统
WO2017113721A1 (zh) 一种预览播放方法及装置
KR101789221B1 (ko) 동영상 제공 장치, 동영상 제공 방법, 및 컴퓨터 프로그램
KR20160013649A (ko) 주변 소음에 기초하여 자막을 생성하는 동영상 디스플레이 방법 및 사용자 단말
US20120287283A1 (en) Electronic device with voice prompt function and voice prompt method
US20160359932A1 (en) Display device and method of controlling the same
CN108172245B (zh) 电影院中音轨的连续自动同步
JP2011030224A (ja) マルチメディア字幕表示システム及びマルチメディア字幕表示方法
JP2007036752A (ja) コンテンツ再生システム、コンテンツ再生方法およびコンテンツ再生プログラム
JP6271194B2 (ja) 携帯デバイスへのセカンドスクリーン情報の提供方法
JP6163680B1 (ja) コンテンツ再生プログラム及びコンテンツ再生装置
JP6986036B2 (ja) コンテンツ再生プログラム、コンテンツ再生方法及びコンテンツ再生システム
KR102389040B1 (ko) 콘텐츠 재생 프로그램, 콘텐츠 재생 방법 및 콘텐츠 재생 시스템
KR102104498B1 (ko) 슬라이드 쇼를 제공하는 시스템 및 방법
JP2019507978A5 (ja)
JP2014123800A (ja) 電子機器及び表示制御方法
KR101832464B1 (ko) 동영상 제공 장치, 동영상 제공 방법, 및 컴퓨터 프로그램
JP2010206716A (ja) 再生装置、その制御方法及びプログラム
JP2015222865A (ja) 携帯端末、関連データ提示方法、及びプログラム
JP2008294513A (ja) 映像再生装置
JP2018160081A (ja) 画像表示制御装置、画像表示制御方法、及びプログラム
US20170169852A1 (en) Method for resuming playing audio-video file after muting and electronic device
KR20140080093A (ko) 휴대단말기의 영상 재생 방법 및 장치
JP2009213022A (ja) 画像表示装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170213

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170213

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170530

R150 Certificate of patent or registration of utility model

Ref document number: 6163680

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250