JP6349977B2 - 情報処理装置および方法、並びにプログラム - Google Patents
情報処理装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JP6349977B2 JP6349977B2 JP2014115406A JP2014115406A JP6349977B2 JP 6349977 B2 JP6349977 B2 JP 6349977B2 JP 2014115406 A JP2014115406 A JP 2014115406A JP 2014115406 A JP2014115406 A JP 2014115406A JP 6349977 B2 JP6349977 B2 JP 6349977B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- feature amount
- synchronization
- unit
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 83
- 230000010365 information processing Effects 0.000 title claims description 52
- 238000004364 calculation method Methods 0.000 claims description 191
- 238000012545 processing Methods 0.000 claims description 175
- 230000005540 biological transmission Effects 0.000 claims description 148
- 238000012937 correction Methods 0.000 claims description 105
- 230000005236 sound signal Effects 0.000 claims description 71
- 230000008569 process Effects 0.000 claims description 57
- 238000006243 chemical reaction Methods 0.000 claims description 54
- 230000001360 synchronised effect Effects 0.000 claims description 43
- 238000005070 sampling Methods 0.000 claims description 38
- 239000000284 extract Substances 0.000 claims description 19
- 230000004044 response Effects 0.000 claims description 15
- 238000003672 processing method Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 description 49
- 230000010354 integration Effects 0.000 description 49
- 239000000872 buffer Substances 0.000 description 39
- 238000004891 communication Methods 0.000 description 30
- 238000005516 engineering process Methods 0.000 description 29
- 238000000926 separation method Methods 0.000 description 21
- 230000000737 periodic effect Effects 0.000 description 19
- 239000011159 matrix material Substances 0.000 description 9
- 238000005311 autocorrelation function Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000001934 delay Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/242—Synchronization processes, e.g. processing of PCR [Program Clock References]
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/23602—Multiplexing isochronously with the video sync, e.g. according to bit-parallel or bit-serial interface formats, as SDI
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/4104—Peripherals receiving signals from specially adapted client devices
- H04N21/4122—Peripherals receiving signals from specially adapted client devices additional display device, e.g. video projector
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
- H04N21/4342—Demultiplexing isochronously with video sync, e.g. according to bit-parallel or bit-serial interface formats, as SDI
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8547—Content authoring involving timestamps for synchronizing content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/04—Synchronising
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
Description
(A2)ある楽曲を楽器毎に演奏、撮影した複数の映像・音声コンテンツ
(A3)1つのシーンを複数の角度から撮影した映像・音声コンテンツ
(A4)メインの映像・音声コンテンツとその高解像版の映像・音声コンテンツ
〈本技術の特徴〉
まず、本技術の特徴について説明する。
本技術によれば、内容の異なる複数のメディアコンテンツを異なる伝送路経由で送信し、異なる複数の機器で受信する際に音声を使って自動同期を行う下記の構成を有する方法および装置を実現することができる。
(1)メディアコンテンツは映像、音声、画像、文字情報などを多重化したデータストリームとされている
(2)伝送対象とする複数メディアコンテンツは、上述した(A1)乃至(A4)に示した例のように時間同期関係を有する
(3)送出対象とする複数のメディアコンテンツのうちの少なくとも1つをメインチャンネル信号と定め、その音声信号から音声同期用特徴量を算出し、システムが規定する伝送フォーマットによりメインチャンネル信号からメイン送出信号を生成する
(4)残りの各メディアコンテンツ(サブチャンネル信号)とメインチャンネル信号の時間同期関係が符合するように、システムが規定する伝送フォーマットによりメインチャンネル信号の音声同期用特徴量とサブチャンネル信号の多重化処理を行い、サブ送出信号を生成する
(5)メイン送出信号を受信するメイン受信機器では、メインチャンネル信号の再生時において、その音声信号をスピーカなどにより出力する
(6)メインチャンネル信号の音声同期用特徴量を含むサブ送出信号を受信するサブ受信機器は、メイン受信機器がスピーカ出力したメインチャンネル信号の音声をマイクロホンなどにより収音して、音声同期用特徴量を計算し、受信したメインチャンネル信号の音声同期用特徴量との自動同期計算を行い、音声特徴量に基づく同期補正情報(時間差情報)を算出する
(7)上記音声特徴量に基づく同期補正情報に基づき、サブ受信機器は受信したサブチャンネル信号に対してメインチャンネル信号との同期補正処理を行い再生する
上記の(特徴B1)において、送出側システムがメイン送出信号とサブ送出信号を各々メイン受信機器、サブ受信機器に対して一方的に送出する。
上記の(特徴B1)において、送出側システムがメイン送出信号をメイン受信機器に対して一方的に送出し、サブ受信機器は自身のタイミングによりネットワーク経由などでサブ送出信号を取得して自動同期計算を行い、サブチャンネル信号の同期再生を行う。
上記の(特徴B1)において、メイン受信機器は、自身のタイミングによりネットワーク経由などでメイン送出信号を取得して、メインチャンネル信号の再生を行い、サブ受信機器も自身のタイミングによりネットワーク経由などでサブ送出信号を取得して自動同期計算を行い、サブチャンネル信号の同期再生を行う。
上記の(特徴B1)において、メインチャンネル信号の音声信号が複数系統ある。
上記の(特徴B1)において、サブ受信機器における自動同期計算において「同期ずれ」を検出し、サブ受信機器側でリアルタイム補正処理を行う。
次に、本技術を適用した具体的な実施の形態について説明する。
また、図1に示した音声同期用特徴量計算部23は、より詳細には例えば図2に示すように構成される。
次に、提供装置11から送信されるメイン送出信号とサブ送出信号を、それぞれメイン受信信号およびサブ受信信号として受信してメインコンテンツとサブコンテンツを再生するコンテンツ再生システムの構成について説明する。このようなコンテンツ再生システムは、例えば図4に示すように構成される。
また、図4に示した音声同期用特徴量計算部121は、より詳細には例えば図5に示すように構成される。
さらに、図4に示した同期計算部126は、より詳細には例えば図6に示すように構成される。
ここで、類似度の計算と最適な類似度のパスの検索について説明する。
続いて、提供装置11の動作について説明する。
次に、図14のフローチャートを参照して、図12のステップS11の処理に対応する音声同期用特徴量算出処理について説明する。
また、提供装置11からメイン送出信号が送信されると、コンテンツ再生システムは、そのメイン送出信号を、メイン受信信号として取得して、メインコンテンツを再生する。以下、図15のフローチャートを参照して、コンテンツ再生システムによるメインコンテンツ再生処理について説明する。
また、メインコンテンツの再生と同期して、コンテンツ再生システムは、サブ受信信号を取得して、サブコンテンツを再生する。以下、図16のフローチャートを参照して、コンテンツ再生システムによるサブコンテンツ再生処理について説明する。
さらに、図18のフローチャートを参照して、図16のステップS105の処理に対応する同期補正情報生成処理について説明する。
また、以上において説明した本技術は、様々な形態のシステムに適用することができる。
また、本技術は、例えば図20に示すシステムにも適用可能である。なお、図20において、図19における場合と対応する部分には同一の符号を付してあり、その説明は省略する。
また、本技術は、例えば図21に示すシステムにも適用可能である。なお、図21において、図20における場合と対応する部分には同一の符号を付してあり、その説明は省略する。
〈本技術の特徴〉
ところで、上述した(A1)乃至(A4)に示した例のように時間同期関係を有する複数のメディアコンテンツを、放送やIP(Internet Protocol)網などを通じて複数機器で受信し、受信したメディアコンテンツを同期して再生するというアプリケーションプログラムが想定される。
メディアコンテンツは映像、音声、画像、文字情報などを多重化したデータストリームとされている。
伝送対象とする複数メディアコンテンツは時間同期関係を有する。
送出対象とする複数のメディアコンテンツのうち少なくとも1つをメインチャンネル信号と定め、残りの各メディアコンテンツをサブチャンネル信号とする。
基準時刻信号からメインチャンネル信号、およびサブチャンネル信号のそれぞれについて提示時刻情報(PTC)を生成する。
メインチャンネル信号の提示時刻情報をメインチャンネル信号と多重化し、メイン送出信号を生成して伝送する。一方、メインチャンネル信号の音声信号から音声同期用特徴量も算出しておく。
メインチャンネル信号とサブチャンネル信号の時間同期関係が符合するようにし、システムが規定する伝送フォーマットにより、サブチャンネル信号の提示時刻情報とメインチャンネル信号の音声同期用特徴量とサブチャンネル信号の多重化処理を行い、サブ送出信号を生成する。
メイン受信機器はメイン受信信号を取得して分離し、メインチャンネル信号の再生時において、その音声信号に基づく音声をスピーカなどにより出力する。同時にメイン受信機器は、受信したメインチャンネル信号の提示時刻情報を外部より参照したり、取得したりできるよう提示する。
サブ受信機器は、サブ受信信号を取得して分離し、受信したサブチャンネル信号の提示時刻情報とメイン受信機器から取得したメインチャンネル信号の提示時刻情報を比較し、提示時刻情報に基づく同期補正情報を生成する。
サブ受信機器は、メイン受信機器がスピーカから出力したメインチャンネル信号の音声をマイクロホンなどにより収音して、音声同期用特徴量を計算し、(特徴B18)で生成された提示時刻情報に基づく同期補正情報を考慮して、受信したメインチャンネル信号の音声同期用特徴量との自動同期計算を行い、音声特徴量に基づく同期補正情報(時間差情報)を算出する。
上記音声特徴量に基づく同期補正情報に基づき、サブ受信機器は受信したサブチャンネル信号に対してメインチャンネル信号との同期補正処理を行い再生する。
次に、以上において説明した特徴B11乃至特徴B20を有する提供装置とコンテンツ再生システムの具体的な実施の形態について説明する。
また、提供装置301から送信されるメイン送出信号とサブ送出信号を、それぞれメイン受信信号およびサブ受信信号として受信してメインコンテンツとサブコンテンツを再生するコンテンツ再生システムは、例えば図23に示すように構成される。なお、図23において、図4における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
続いて、以上において説明した提供装置301とコンテンツ再生システムの具体的な動作について説明する。
また、提供装置301からメイン送出信号が送信されると、コンテンツ再生システムは、そのメイン送出信号を、メイン受信信号として取得して、メインコンテンツを再生する。以下、図25のフローチャートを参照して、コンテンツ再生システムによるメインコンテンツ再生処理について説明する。
また、メインコンテンツの再生と同期して、コンテンツ再生システムは、サブ受信信号を取得して、サブコンテンツを再生する。以下、図26のフローチャートを参照して、コンテンツ再生システムによるサブコンテンツ再生処理について説明する。
さらに、図27のフローチャートを参照して、図26のステップS257の処理に対応する同期補正情報生成処理について説明する。
第1のコンテンツの音声信号から特徴量を抽出する特徴量計算部と、
前記第1のコンテンツと時間同期関係を有する第2のコンテンツに対して同期がとれた状態で取得された前記特徴量と、前記特徴量計算部により抽出された前記特徴量とを比較することで、前記第2のコンテンツを前記第1のコンテンツと同期して再生するための音声特徴量に基づく同期補正情報を生成する同期計算部と
を備える情報処理装置。
(2)
前記特徴量計算部は、再生された前記第1のコンテンツの音声を収音することで得られた前記音声信号から前記特徴量を抽出する
(1)に記載の情報処理装置。
(3)
前記第2のコンテンツと、前記第2のコンテンツに同期がとれた状態で前記第2のコンテンツに対応付けられている前記特徴量とを取得する第1の入力部をさらに備える
(1)または(2)に記載の情報処理装置。
(4)
前記第2のコンテンツおよび前記特徴量は、前記第1のコンテンツとの到着時間差が考慮されたタイミングで前記情報処理装置に送信される
(3)に記載の情報処理装置。
(5)
前記第1の入力部は、前記第2のコンテンツおよび前記特徴量の送信を要求し、その要求に応じて送信されてきた前記第2のコンテンツおよび前記特徴量を受信する
(3)に記載の情報処理装置。
(6)
前記第1のコンテンツの送信を要求し、その要求に応じて送信されてきた前記第1のコンテンツを受信する第2の入力部をさらに備える
(5)に記載の情報処理装置。
(7)
前記特徴量計算部は、再生された1つの前記第1のコンテンツについて、前記音声信号から前記特徴量を抽出し、
前記同期計算部は、前記第2のコンテンツと対応付けられている複数の前記第1のコンテンツの前記特徴量のそれぞれと、前記特徴量計算部により抽出された前記特徴量とを比較することで、再生された前記第1のコンテンツを特定し、特定された前記第1のコンテンツと前記第2のコンテンツを同期して再生するための前記音声特徴量に基づく同期補正情報を生成する
(2)乃至(6)の何れか一項に記載の情報処理装置。
(8)
前記第2のコンテンツの再生を制御する再生処理部をさらに備える
(2)乃至(7)の何れか一項に記載の情報処理装置。
(9)
前記再生処理部は、前記音声特徴量に基づく同期補正情報に基づいて前記第2のコンテンツの再生位置を補正する
(8)に記載の情報処理装置。
(10)
前記第1のコンテンツの提示時刻情報を取得する取得部と、
前記第1のコンテンツの前記提示時刻情報と、前記第2のコンテンツの前記提示時刻情報とを比較して、提示時刻情報に基づく同期補正情報を生成する比較部と
をさらに備え、
前記同期計算部は、取得された前記特徴量の系列のうちの前記提示時刻情報に基づく同期補正情報により示される範囲に含まれる前記特徴量と、前記特徴量計算部により抽出された前記特徴量とを比較して前記音声特徴量に基づく同期補正情報を生成する
(1)乃至(9)の何れか一項に記載の情報処理装置。
(11)
前記同期計算部は、取得された前記特徴量と、前記特徴量計算部により抽出された前記特徴量とのフレームレートが一致するように、取得された前記特徴量、または前記特徴量計算部により抽出された前記特徴量の少なくとも一方に対してフレームレート変換を行ってから前記特徴量を比較する
(1)乃至(10)の何れか一項に記載の情報処理装置。
(12)
第1のコンテンツの音声信号から特徴量を抽出する特徴量計算ステップと、
前記第1のコンテンツと時間同期関係を有する第2のコンテンツに対して同期がとれた状態で取得された前記特徴量と、前記特徴量計算ステップの処理により抽出された前記特徴量とを比較することで、前記第2のコンテンツを前記第1のコンテンツと同期して再生するための音声特徴量に基づく同期補正情報を生成する同期計算ステップと
を含む情報処理方法。
(13)
第1のコンテンツの音声信号から特徴量を抽出する特徴量計算ステップと、
前記第1のコンテンツと時間同期関係を有する第2のコンテンツに対して同期がとれた状態で取得された前記特徴量と、前記特徴量計算ステップの処理により抽出された前記特徴量とを比較することで、前記第2のコンテンツを前記第1のコンテンツと同期して再生するための音声特徴量に基づく同期補正情報を生成する同期計算ステップと
を含む処理をコンピュータに実行させるプログラム。
(14)
第1のコンテンツの音声信号から特徴量を抽出する特徴量計算部と、
前記第1のコンテンツに対して時間同期関係を有する第2のコンテンツと、前記第2のコンテンツに対して同期がとれた状態で、前記第2のコンテンツに対応付けられた前記特徴量とを出力する第1の出力部と
を備える情報処理装置。
(15)
前記第1のコンテンツを出力する第2の出力部をさらに備える
(14)に記載の情報処理装置。
(16)
前記第1の出力部は、前記第1のコンテンツとの到着時間差が考慮されたタイミングで前記第2のコンテンツおよび前記特徴量を出力する
(15)に記載の情報処理装置。
(17)
前記第1の出力部は、前記第2のコンテンツおよび前記特徴量の送信が要求された場合、その要求に応じて前記第2のコンテンツおよび前記特徴量を出力する
(15)に記載の情報処理装置。
(18)
前記第2の出力部は、前記第1のコンテンツの送信が要求された場合、その要求に応じて前記第1のコンテンツを出力する
(17)に記載の情報処理装置。
(19)
前記特徴量計算部は、複数の前記第1のコンテンツについて、前記音声信号から前記特徴量を抽出し、
前記第1の出力部は、複数の前記第1のコンテンツの前記特徴量を前記第2のコンテンツに対応付けて出力する
(14)乃至(18)の何れか一項に記載の情報処理装置。
(20)
前記特徴量計算部は前記特徴量をダウンサンプルし、
前記第1の出力部は、前記第2のコンテンツと、ダウンサンプルされた前記特徴量とを出力する
(14)乃至(19)の何れか一項に記載の情報処理装置。
(21)
第1のコンテンツの音声信号から特徴量を抽出する特徴量計算ステップと、
前記第1のコンテンツに対して時間同期関係を有する第2のコンテンツと、前記第2のコンテンツに対して同期がとれた状態で、前記第2のコンテンツに対応付けられた前記特徴量とを出力する出力ステップと
を含む情報処理方法。
(22)
第1のコンテンツの音声信号から特徴量を抽出する特徴量計算ステップと、
前記第1のコンテンツに対して時間同期関係を有する第2のコンテンツと、前記第2のコンテンツに対して同期がとれた状態で、前記第2のコンテンツに対応付けられた前記特徴量とを出力する出力ステップと
を含む処理をコンピュータに実行させるプログラム。
Claims (20)
- 第1のコンテンツの音声信号から特徴量を抽出する特徴量計算部と、
前記第1のコンテンツと時間同期関係を有する第2のコンテンツに対して同期がとれた状態で取得された前記特徴量と、前記特徴量計算部により抽出された前記特徴量とを比較することで、前記第2のコンテンツを前記第1のコンテンツと同期して再生するための音声特徴量に基づく同期補正情報を生成する同期計算部と
を備え、
前記同期計算部は、取得された前記特徴量と、前記特徴量計算部により抽出された前記特徴量とのフレームレートが一致するように、取得された前記特徴量、または前記特徴量計算部により抽出された前記特徴量の少なくとも一方に対してフレームレート変換を行ってから前記特徴量を比較する
情報処理装置。 - 前記特徴量計算部は、再生された前記第1のコンテンツの音声を収音することで得られた前記音声信号から前記特徴量を抽出する
請求項1に記載の情報処理装置。 - 前記第2のコンテンツと、前記第2のコンテンツに同期がとれた状態で前記第2のコンテンツに対応付けられている前記特徴量とを取得する第1の入力部をさらに備える
請求項1または請求項2に記載の情報処理装置。 - 前記第2のコンテンツおよび前記特徴量は、前記第1のコンテンツとの到着時間差が考慮されたタイミングで前記情報処理装置に送信される
請求項3に記載の情報処理装置。 - 前記第1の入力部は、前記第2のコンテンツおよび前記特徴量の送信を要求し、その要求に応じて送信されてきた前記第2のコンテンツおよび前記特徴量を受信する
請求項3に記載の情報処理装置。 - 前記第1のコンテンツの送信を要求し、その要求に応じて送信されてきた前記第1のコンテンツを受信する第2の入力部をさらに備える
請求項5に記載の情報処理装置。 - 前記特徴量計算部は、再生された1つの前記第1のコンテンツについて、前記音声信号から前記特徴量を抽出し、
前記同期計算部は、前記第2のコンテンツと対応付けられている複数の前記第1のコンテンツの前記特徴量のそれぞれと、前記特徴量計算部により抽出された前記特徴量とを比較することで、再生された前記第1のコンテンツを特定し、特定された前記第1のコンテンツと前記第2のコンテンツを同期して再生するための前記音声特徴量に基づく同期補正情報を生成する
請求項2乃至請求項6の何れか一項に記載の情報処理装置。 - 前記第2のコンテンツの再生を制御する再生処理部をさらに備える
請求項2乃至請求項7の何れか一項に記載の情報処理装置。 - 前記再生処理部は、前記音声特徴量に基づく同期補正情報に基づいて前記第2のコンテンツの再生位置を補正する
請求項8に記載の情報処理装置。 - 前記第1のコンテンツの提示時刻情報を取得する取得部と、
前記第1のコンテンツの前記提示時刻情報と、前記第2のコンテンツの前記提示時刻情報とを比較して、提示時刻情報に基づく同期補正情報を生成する比較部と
をさらに備え、
前記同期計算部は、取得された前記特徴量の系列のうちの前記提示時刻情報に基づく同期補正情報により示される範囲に含まれる前記特徴量と、前記特徴量計算部により抽出された前記特徴量とを比較して前記音声特徴量に基づく同期補正情報を生成する
請求項1乃至請求項9の何れか一項に記載の情報処理装置。 - 第1のコンテンツの音声信号から特徴量を抽出する特徴量計算ステップと、
前記第1のコンテンツと時間同期関係を有する第2のコンテンツに対して同期がとれた状態で取得された前記特徴量と、前記特徴量計算ステップの処理により抽出された前記特徴量とを比較することで、前記第2のコンテンツを前記第1のコンテンツと同期して再生するための音声特徴量に基づく同期補正情報を生成する同期計算ステップと
を含み、
前記同期計算ステップにおいて、取得された前記特徴量と、前記特徴量計算ステップの処理により抽出された前記特徴量とのフレームレートが一致するように、取得された前記特徴量、または前記特徴量計算ステップの処理により抽出された前記特徴量の少なくとも一方に対してフレームレート変換を行ってから前記特徴量を比較する
情報処理方法。 - 第1のコンテンツの音声信号から特徴量を抽出する特徴量計算ステップと、
前記第1のコンテンツと時間同期関係を有する第2のコンテンツに対して同期がとれた状態で取得された前記特徴量と、前記特徴量計算ステップの処理により抽出された前記特徴量とを比較することで、前記第2のコンテンツを前記第1のコンテンツと同期して再生するための音声特徴量に基づく同期補正情報を生成する同期計算ステップと
を含む処理をコンピュータに実行させ、
前記同期計算ステップにおいて、取得された前記特徴量と、前記特徴量計算ステップの処理により抽出された前記特徴量とのフレームレートが一致するように、取得された前記特徴量、または前記特徴量計算ステップの処理により抽出された前記特徴量の少なくとも一方に対してフレームレート変換を行ってから前記特徴量を比較する
プログラム。 - 第1のコンテンツの音声信号から特徴量を抽出し、抽出された前記特徴量をダウンサンプルする特徴量計算部と、
前記第1のコンテンツに対して時間同期関係を有する第2のコンテンツと、前記第2のコンテンツに対して同期がとれた状態で、前記第2のコンテンツに対応付けられた、前記ダウンサンプルされた前記特徴量とを出力する第1の出力部と
を備える情報処理装置。 - 前記第1のコンテンツを出力する第2の出力部をさらに備える
請求項13に記載の情報処理装置。 - 前記第1の出力部は、前記第1のコンテンツとの到着時間差が考慮されたタイミングで前記第2のコンテンツおよび前記ダウンサンプルされた前記特徴量を出力する
請求項14に記載の情報処理装置。 - 前記第1の出力部は、前記第2のコンテンツおよび前記ダウンサンプルされた前記特徴量の送信が要求された場合、その要求に応じて前記第2のコンテンツおよび前記ダウンサンプルされた前記特徴量を出力する
請求項14に記載の情報処理装置。 - 前記第2の出力部は、前記第1のコンテンツの送信が要求された場合、その要求に応じて前記第1のコンテンツを出力する
請求項16に記載の情報処理装置。 - 前記特徴量計算部は、複数の前記第1のコンテンツについて、前記音声信号から前記特徴量を抽出し、
前記第1の出力部は、複数の前記第1のコンテンツの前記ダウンサンプルされた前記特徴量を前記第2のコンテンツに対応付けて出力する
請求項13乃至請求項17の何れか一項に記載の情報処理装置。 - 第1のコンテンツの音声信号から特徴量を抽出し、抽出された前記特徴量をダウンサンプルする特徴量計算ステップと、
前記第1のコンテンツに対して時間同期関係を有する第2のコンテンツと、前記第2のコンテンツに対して同期がとれた状態で、前記第2のコンテンツに対応付けられた、前記ダウンサンプルされた前記特徴量とを出力する出力ステップと
を含む情報処理方法。 - 第1のコンテンツの音声信号から特徴量を抽出し、抽出された前記特徴量をダウンサンプルする特徴量計算ステップと、
前記第1のコンテンツに対して時間同期関係を有する第2のコンテンツと、前記第2のコンテンツに対して同期がとれた状態で、前記第2のコンテンツに対応付けられた、前記ダウンサンプルされた前記特徴量とを出力する出力ステップと
を含む処理をコンピュータに実行させるプログラム。
Priority Applications (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014115406A JP6349977B2 (ja) | 2013-10-21 | 2014-06-04 | 情報処理装置および方法、並びにプログラム |
PCT/JP2014/005186 WO2015059891A1 (en) | 2013-10-21 | 2014-10-10 | Information processing apparatus, method, and program |
RU2016114565A RU2675192C2 (ru) | 2013-10-21 | 2014-10-10 | Устройство обработки информации, способ и программа |
KR1020217003061A KR102325743B1 (ko) | 2013-10-21 | 2014-10-10 | 정보 처리 장치, 방법, 및 프로그램 |
EP14793631.4A EP3061094A1 (en) | 2013-10-21 | 2014-10-10 | Information processing apparatus, method, and program |
US15/029,600 US10484728B2 (en) | 2013-10-21 | 2014-10-10 | Information processing apparatus, method, and program |
KR1020167009295A KR102212926B1 (ko) | 2013-10-21 | 2014-10-10 | 정보 처리 장치, 방법, 및 프로그램 |
CN201910948977.9A CN110751963B (zh) | 2013-10-21 | 2014-10-10 | 信号处理设备、方法 |
CN201480056387.0A CN105684085B (zh) | 2013-10-21 | 2014-10-10 | 信息处理设备、方法及程序 |
TW107136795A TWI695620B (zh) | 2013-10-21 | 2014-10-13 | 資訊處理設備、方法以及程式 |
TW103135375A TWI646830B (zh) | 2013-10-21 | 2014-10-13 | 資訊處理設備、方法以及程式 |
US16/656,487 US11115694B2 (en) | 2013-10-21 | 2019-10-17 | Information processing apparatus, method, and program |
US17/404,793 US20210377582A1 (en) | 2013-10-21 | 2021-08-17 | Information processing apparatus, method, and program |
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013218267 | 2013-10-21 | ||
JP2013218267 | 2013-10-21 | ||
JP2013257508 | 2013-12-12 | ||
JP2013257508 | 2013-12-12 | ||
JP2014000831 | 2014-01-07 | ||
JP2014000831 | 2014-01-07 | ||
JP2014115406A JP6349977B2 (ja) | 2013-10-21 | 2014-06-04 | 情報処理装置および方法、並びにプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018109373A Division JP6471923B2 (ja) | 2013-10-21 | 2018-06-07 | 信号処理装置および方法、並びにプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015149705A JP2015149705A (ja) | 2015-08-20 |
JP2015149705A5 JP2015149705A5 (ja) | 2017-03-02 |
JP6349977B2 true JP6349977B2 (ja) | 2018-07-04 |
Family
ID=51862494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014115406A Active JP6349977B2 (ja) | 2013-10-21 | 2014-06-04 | 情報処理装置および方法、並びにプログラム |
Country Status (8)
Country | Link |
---|---|
US (3) | US10484728B2 (ja) |
EP (1) | EP3061094A1 (ja) |
JP (1) | JP6349977B2 (ja) |
KR (2) | KR102325743B1 (ja) |
CN (2) | CN105684085B (ja) |
RU (1) | RU2675192C2 (ja) |
TW (2) | TWI695620B (ja) |
WO (1) | WO2015059891A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6349977B2 (ja) | 2013-10-21 | 2018-07-04 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP6310109B2 (ja) * | 2016-03-31 | 2018-04-11 | 株式会社インフォシティ | 放送サービス再送信システムおよび視聴用携帯端末 |
JP6163680B1 (ja) * | 2016-10-27 | 2017-07-19 | エヴィクサー株式会社 | コンテンツ再生プログラム及びコンテンツ再生装置 |
JP6789761B2 (ja) * | 2016-11-01 | 2020-11-25 | 日本放送協会 | 受信端末及びプログラム |
US10061677B2 (en) * | 2016-11-16 | 2018-08-28 | Anodot Ltd. | Fast automated detection of seasonal patterns in time series data without prior knowledge of seasonal periodicity |
CN107230474B (zh) * | 2017-04-18 | 2020-06-09 | 福建天泉教育科技有限公司 | 一种合成音频数据的方法及系统 |
US10034029B1 (en) * | 2017-04-25 | 2018-07-24 | Sprint Communications Company L.P. | Systems and methods for audio object delivery based on audible frequency analysis |
JP7102826B2 (ja) * | 2018-03-23 | 2022-07-20 | ヤマハ株式会社 | 情報処理方法および情報処理装置 |
CN108769559B (zh) * | 2018-05-25 | 2020-12-01 | 数据堂(北京)科技股份有限公司 | 多媒体文件的同步方法及装置 |
WO2020251430A1 (en) * | 2019-06-11 | 2020-12-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Method, ue and network node for handling synchronization of sound |
CN110751955B (zh) * | 2019-09-23 | 2022-03-01 | 山东大学 | 基于时频矩阵动态选择的声音事件分类方法及系统 |
KR20220111552A (ko) * | 2021-02-02 | 2022-08-09 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0204057D0 (en) * | 2002-02-21 | 2002-04-10 | Tecteon Plc | Echo detector having correlator with preprocessing |
US7697591B2 (en) * | 2002-08-26 | 2010-04-13 | Texas Instruments Incorporated | Crest factor reduction processor for wireless communications |
JP2005198179A (ja) * | 2004-01-09 | 2005-07-21 | Sanyo Electric Co Ltd | 信号処理装置、信号処理方法及び信号処理プログラム |
JP2006005390A (ja) * | 2004-06-15 | 2006-01-05 | Hitachi Ltd | 同期捕捉方法、同期信号生成方法および通信装置 |
US20060062398A1 (en) * | 2004-09-23 | 2006-03-23 | Mckee Cooper Joel C | Speaker distance measurement using downsampled adaptive filter |
DE102005014477A1 (de) * | 2005-03-30 | 2006-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung |
US7907212B2 (en) * | 2006-03-20 | 2011-03-15 | Vixs Systems, Inc. | Multiple path audio video synchronization |
JP2007306363A (ja) * | 2006-05-12 | 2007-11-22 | Pioneer Electronic Corp | デジタル放送受信装置 |
JP2008131341A (ja) * | 2006-11-21 | 2008-06-05 | Seiko Epson Corp | 映像音声再生システムと映像再生装置 |
JP4948147B2 (ja) * | 2006-12-15 | 2012-06-06 | 富士通株式会社 | 複合コンテンツファイルの編集方法および装置 |
US8194865B2 (en) * | 2007-02-22 | 2012-06-05 | Personics Holdings Inc. | Method and device for sound detection and audio control |
FR2929960B1 (fr) * | 2008-04-11 | 2011-05-13 | Apollon Solar | Procede de fabrication de silicium cristallin de qualite photovoltaique par ajout d'impuretes dopantes |
US8400566B2 (en) * | 2008-08-21 | 2013-03-19 | Dolby Laboratories Licensing Corporation | Feature optimization and reliability for audio and video signature generation and detection |
WO2010106075A1 (en) * | 2009-03-16 | 2010-09-23 | Koninklijke Kpn N.V. | Modified stream synchronization |
US20110063503A1 (en) * | 2009-07-06 | 2011-03-17 | Brand Steven M | Synchronizing secondary content to a multimedia presentation |
US20110026125A1 (en) * | 2009-07-29 | 2011-02-03 | Cheng-Chieh Chang | Transparent conductive film structure and display device |
KR20120103750A (ko) * | 2010-01-27 | 2012-09-19 | 네덜란제 오르가니자티에 포오르 토에게파스트-나투우르베텐샤펠리즈크 온데르조에크 테엔오 | 미디어 스트림의 동기화를 위한 방법, 시스템 및 장치 |
US20110307786A1 (en) * | 2010-06-11 | 2011-12-15 | Brian Shuster | Method and apparatus for bookmarking and retrieval of video content |
JP2012244413A (ja) * | 2011-05-19 | 2012-12-10 | Nippon Hoso Kyokai <Nhk> | 信号監視装置およびプログラム、信号補正装置およびプログラム |
JP2013085139A (ja) * | 2011-10-11 | 2013-05-09 | Toshiba Corp | コンテンツ再生装置、サーバおよびコンテンツ再生方法 |
JP5284451B2 (ja) * | 2011-11-30 | 2013-09-11 | 株式会社東芝 | 電子機器及び音声出力方法 |
JP2013135309A (ja) * | 2011-12-26 | 2013-07-08 | Sony Corp | 信号処理装置、信号処理方法、プログラム、および記録媒体、並びに、信号処理システム |
JP6003083B2 (ja) * | 2012-02-27 | 2016-10-05 | ソニー株式会社 | 信号処理装置、信号処理方法、およびプログラム、電子機器、並びに、信号処理システムおよび信号処理システムの信号処理方法 |
JP6349977B2 (ja) | 2013-10-21 | 2018-07-04 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
-
2014
- 2014-06-04 JP JP2014115406A patent/JP6349977B2/ja active Active
- 2014-10-10 CN CN201480056387.0A patent/CN105684085B/zh active Active
- 2014-10-10 WO PCT/JP2014/005186 patent/WO2015059891A1/en active Application Filing
- 2014-10-10 RU RU2016114565A patent/RU2675192C2/ru active
- 2014-10-10 KR KR1020217003061A patent/KR102325743B1/ko active IP Right Grant
- 2014-10-10 EP EP14793631.4A patent/EP3061094A1/en not_active Ceased
- 2014-10-10 KR KR1020167009295A patent/KR102212926B1/ko active IP Right Grant
- 2014-10-10 CN CN201910948977.9A patent/CN110751963B/zh active Active
- 2014-10-10 US US15/029,600 patent/US10484728B2/en active Active
- 2014-10-13 TW TW107136795A patent/TWI695620B/zh active
- 2014-10-13 TW TW103135375A patent/TWI646830B/zh active
-
2019
- 2019-10-17 US US16/656,487 patent/US11115694B2/en active Active
-
2021
- 2021-08-17 US US17/404,793 patent/US20210377582A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
TW201532429A (zh) | 2015-08-16 |
CN105684085B (zh) | 2019-11-05 |
WO2015059891A1 (en) | 2015-04-30 |
US20210377582A1 (en) | 2021-12-02 |
KR20210014755A (ko) | 2021-02-09 |
KR102212926B1 (ko) | 2021-02-04 |
US11115694B2 (en) | 2021-09-07 |
TWI695620B (zh) | 2020-06-01 |
RU2675192C2 (ru) | 2018-12-17 |
KR20160074475A (ko) | 2016-06-28 |
RU2016114565A3 (ja) | 2018-05-30 |
JP2015149705A (ja) | 2015-08-20 |
US20160269762A1 (en) | 2016-09-15 |
RU2016114565A (ru) | 2017-10-19 |
US10484728B2 (en) | 2019-11-19 |
US20200053402A1 (en) | 2020-02-13 |
CN110751963A (zh) | 2020-02-04 |
TW201907733A (zh) | 2019-02-16 |
EP3061094A1 (en) | 2016-08-31 |
KR102325743B1 (ko) | 2021-11-15 |
CN105684085A (zh) | 2016-06-15 |
CN110751963B (zh) | 2021-09-07 |
TWI646830B (zh) | 2019-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6349977B2 (ja) | 情報処理装置および方法、並びにプログラム | |
US20210151069A1 (en) | Data Driven Radio Enhancement | |
CN112400325A (zh) | 数据驱动的音频增强 | |
US9877066B2 (en) | Synchronization of multimedia streams | |
US20180336930A1 (en) | Recorded data processing method, terminal device, and editing device | |
JP5879169B2 (ja) | 字幕同期再生装置およびそのプログラム | |
US20150310869A1 (en) | Apparatus aligning audio signals in a shared audio scene | |
JP6471923B2 (ja) | 信号処理装置および方法、並びにプログラム | |
JP6003083B2 (ja) | 信号処理装置、信号処理方法、およびプログラム、電子機器、並びに、信号処理システムおよび信号処理システムの信号処理方法 | |
JP2016092772A (ja) | 信号処理装置及びその信号処理方法、並びにプログラム | |
US20210297731A1 (en) | Video distribution system, video generation method, and reproduction device | |
JP6343171B2 (ja) | 受信装置 | |
KR102184131B1 (ko) | 입체 오디오를 제공하는 다채널 전송 시스템 및 이의 제어 방법 | |
US20220261436A1 (en) | Method and a system for determining a 3-dimensional data structure of an audio file, and a playback position in the audio file for synchronization | |
JP2018157385A (ja) | データ同期方法 | |
KR20170060202A (ko) | 동기화된 폐쇄 자막을 생성하는 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170127 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180508 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180521 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6349977 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |