JP5868991B2 - 動画記録中の音声のオーディオ信号再生を向上させる方法およびアセンブリ - Google Patents

動画記録中の音声のオーディオ信号再生を向上させる方法およびアセンブリ Download PDF

Info

Publication number
JP5868991B2
JP5868991B2 JP2013540372A JP2013540372A JP5868991B2 JP 5868991 B2 JP5868991 B2 JP 5868991B2 JP 2013540372 A JP2013540372 A JP 2013540372A JP 2013540372 A JP2013540372 A JP 2013540372A JP 5868991 B2 JP5868991 B2 JP 5868991B2
Authority
JP
Japan
Prior art keywords
audio
image
event
sensor
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013540372A
Other languages
English (en)
Other versions
JP2014500669A (ja
Inventor
ゲルストルバーガー、アイリス
ハートマン、クリスチャン
メイアー、マイケル
Original Assignee
インスティテュート フューア ランドファンクテクニック ゲーエムベーハー
インスティテュート フューア ランドファンクテクニック ゲーエムベーハー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インスティテュート フューア ランドファンクテクニック ゲーエムベーハー, インスティテュート フューア ランドファンクテクニック ゲーエムベーハー filed Critical インスティテュート フューア ランドファンクテクニック ゲーエムベーハー
Publication of JP2014500669A publication Critical patent/JP2014500669A/ja
Application granted granted Critical
Publication of JP5868991B2 publication Critical patent/JP5868991B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • G06F18/256Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/322Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier used signal is digitally coded
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Evolutionary Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Television Signal Processing For Recording (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本願発明は、動画記録中の、特にスポーツ特有の音声などの音声のオーディオ再生を向上させる方法およびアセンブリに関する。そのような方法およびアセンブリは、DE10 2008 045 397A1により公知となっている。
マルチチャンネルのテレビ音声を伴うワイドスクリーンフォーマットの高解像度テレビ画像が導入されることにより、より細かな詳細が大幅に知覚可能となり、特にスポーツイベントの放送の間、テレビ視聴者は、従来のテレビ技術と比較し、スポーツの動きとより深く関わることになる。ライブのスポーツイベントの画像およびオーディオの記録においては、十分な数のマイクを設置することが出来ないことも多く、また重要な音声の音源の近くにマイクを設置することが出来ないことも多い。これら重要な音声とは主に、特定のスポーツを特徴づける音声であり、画像コンテンツの再現性を強調するものである。それに応じて、例えばサッカーの試合のテレビ収録においては、スタジアムが騒々しい空間であるのに対し、音源からフィールドを囲む指向性マイクまでの距離が大きすぎることにより、通常、フィールド上で発せられるゲーム特有の音声がわずかしか知覚出来ないか、まったく知覚出来ない。スキーレースのテレビ収録においては、数キロにも及ぶレースコース全体に亘ってマイクを設置するのはコストがかかり過ぎる。その結果、ゲームのシーンまたはレースに接近して収録した場合であっても、音声の記録によってその特徴的な音声は捉えられないのが典型的である。
DE10 2008 045 397A1は、球技イベントの動画記録中のスポーツ特有の音声を捉えるべく、2以上の指向性マイクを備えた非常に指向性の高いマイクシステムを設けることを開示している。それらの指向性マイクはそれぞれが、空間の全方向に移動可能なガイドエンティティを用いて、ボールの現在位置に近づけて配置される。収録中のマイクのガイドは、ボールトラッキング方法を用いて生成されるボール位置に関するデータに従って自動的に、人為的処理を介さず行われる。
しかし当該公知の音声記録技術はあらゆる動画記録に適用することが出来ず、比較的多大な技術的努力を要する。
本願発明の目的は、軽減された技術的努力により、動画記録中の音声のオーディオ再生を向上させることを可能とする方法およびアセンブリを提供することである。
当該目的を達成する本願発明の方法において、まず画像コンテンツをセンサベースでキャプチャリングし、分析する。取得した情報に対応する音声イベントを、予め定められた基準に従い音声データベースから選択する。選択された音声イベントを、以下で動画を伴う音声と呼ぶこともある、全体の動画オーディオのミキシングの追加的な成分に自動的に加える。
本願発明に係る方法を実施するアセンブリは、3つの主要なコンポーネント、動画像の特徴的な画像コンテンツを検出するセンサエンティティと、検出された画像コンテンツを分析する中央制御装置と、複数の音声(オーディオサンプル)がアーカイブされたオーディオデータベースとからなり、中央制御装置は、動画像内で検出された特徴的な画像コンテンツに基づき、検出された特徴的な画像コンテンツに対応し、動画を伴う音声の成分とミキサーコンソール内でミックスされるオーディオサンプルを、オーディオデータベースから選択する。
本願発明は、添付の図面を参照して説明される、単に例示されるものであり、非限定的な例として示される、以下の詳細な説明により完全に明らかとなるであろう。
図1は、本願発明に係る方法を実施する、3つの主要コンポーネントであるセンサエンティティ、中央制御装置およびオーディオデータベースを有するアセンブリの概略ブロック図を示す。 図2は、図1に示すアセンブリの中央制御装置の詳細を示す。 図3は、オーディオデータベースにおける、オーディオサンプルの異なるカテゴリへの分類(サンプルマッピング)の例を示す。
図1に概略的に示される、本願発明に係る方法を実施するアセンブリ1は、動画像の画像コンテンツを検出するセンサエンティティ10を有する。検出された画像コンテンツは、データ11の形態で、センサエンティティ10により、図2により詳細に示され以下に説明するソフトウェアベースの分析/処理ユニット30へと供給される。
例えば、テレビカメラにより供給される、スポーツイベントの(図1および以下の説明において「伝達画像」と呼ぶこともある)リアルタイムの画像を、画像コンテンツの検出に用いる動画像として用いてもよい。センサエンティティ10は例えば、「マシンビジョン」(コンピュータビジョン)の分野で用いられるアルゴリズムを用いて、伝達画像の分析を実行する。とりわけこれらのアルゴリズムにより、運動するオブジェクトを分離して、画像背景に対する相対的なトラッキングを行うことが可能となり、画像セクションに基づくそれらの位置の判断が可能となる。例としてサッカーの試合を取り上げると、フィールド上のボールの位置および、画像セクションに表示される全サッカープレーヤの位置およびサイズが判断され得る。さらに、着ているジャージに基づいてプレーヤの属するチームを区別することが可能であり、ボールの移動方向および移動速度を計算することが可能である。伝達画像の検出(および分析/処理ユニット30において引き続き行われる分析(図1))によりさらに、複数のテレビカメラを用いたゲームの収録の間、映像ディレクターにより選択(「カット」)されているテレビカメラの位置および焦点距離を推定できるという利点が生まれる。
補足的に、センサエンティティ10および分析/処理ユニット30において、伝達画像のシーン内の特定の動きを特徴付ける(図1および以下の説明において「伝達音声」と呼ぶこともある)オーディオ信号の記録および自動的な分析を行うことも可能である。例えば、伝達音声から取得される情報を用いて、動画分析により検出された画像の動きを音響的に確認する。さらに、運動シーケンスに関しより高い解像度を得、より詳細なキャプチャリングを行うべく、伝達画像内に現れる運動者の動きに係る物理的な判断を行うセンサをセンサエンティティ10に設けてよい。この判断には、例えば、GPSまたは無線搭載システムを用いた運動者の現在位置の判断が含まれる。データ11として、当該追加的な情報もソフトウェアベースの分析/処理ユニット30へ供給される。
より低いコストで画像コンテンツを検出する技術としては、動画の分析に、伝達動画の代わりに、静的に設置された専用トラッキングカメラの信号を用いる技術がある。トラッキングカメラは予め、対応するシーンに合わせてキャリブレーションされていてよく、これにより、動画像内のオブジェクトおよび相対的な動きの自動検出が単純化される。しかしこの場合、(以下に説明される)図面に示されないカメラのメタデータまたは画像ミキサーコンソールのGPIO信号などの、実際の伝達画像に関する外部情報が、ユニット20から供給される必要がある。
センサエンティティ10により供給されるデータ11の分析および処理は、図2でより詳細に示すユニット30で実行される。ユニット30は、例えばPCベースの処理またはDSPベースの処理の一部として、センサエンティティ10のデータ11に基づいてオーディオデータベースに対する制御コマンド31を推定する。(伝達画像とは独立してシーンを分析する)第1分析段階32でユニット30において、動画像の記述に関してセンサベースで判断されるパラメータは、予め定められたルールに従って互いに論理的に結合され、結果として得られる情報に基づき、オーディオデータベース40に格納されるアーカイブされた複数の音声、つまり「オーディオサンプル」を選択するための制御コマンド31が生成される。当該予め定められたルールはアプリケーションから独立しており、あらゆる目的において、特定的に定められ、予め分析/処理ユニット30のソフトウェアに組み込まれている必要がある。データベース40は制御コマンド31により選択されたオーディオサンプルを、オーディオ信号41として出力する。オーディオ信号41はその後、直接、プロダクションミキサーコンソール50へと供給され、そこで、周囲音声(「オリジナル音声」)および、当てはまる場合、ゲームのコメンテータの「会話音声」などの動画を伴う音声の他の成分とミックスされてよい。なお、オーディオサンプルおよび動画を伴う音声との間では、時間的にずれのある、耳障りなダブリング(doubling)が起こらないように注意する。動画シーンの再現性が高くなるようオーディオ編集を行うべく、動画を伴う音声へ加えられるオーディオサンプルの選択の間、(関連性に基づく順番で)
1.音声の種類、
2.音声の音量(速度)、
3.反響音の追加(空間性)および
4.パン(音声に方向性を割り当てる)を含む特徴に基づいて区別が行われる。
本願発明に係る方法のサッカーの試合への適用例において段階32におけるルールの特定とは、例えば、動画分析によって抽出された、ボールの動きのベクトル変化に関する情報に基づいて、シュートが新たに蹴られたことが判断されてもよいことを意味する。フィールド上でのボールの加速度および移動ベクトルの長さによって、ロングシュートであるのか、または相違する音声特徴を有するパスであるのか、およびユニット30により生成される制御コマンド31に従ってオーディオデータベース40からプロダクションミキサーコンソール50(図1)へ供給される対応する音声(オーディオ信号41)の音量はどの程度の大きさ(「速度」値)でなければならないのか、についての情報が提供される。プロダクションミキサーコンソール50へ供給される音声の音量は、さらに、フィールド上のボールの位置に応じて変化させられ、これにより、ビューアに対する音源の距離が再現されてよい。
伝達画像に応じてパラメータを分析する第2分析段階33(図2)において、当該伝達画像の画像セクションに関する情報が、音声選択において考慮される。この情報はユニット20によりデータ21として供給される。伝達画像に対し直接、動画分析が行われた場合、分析されるオブジェクトのサイズに基づいて、カメラの位置および焦点距離が判断されてよい。センサエンティティ10での画像コンテンツの検出に対し、独立したトラッキングカメラ(図1)または他のセンサシステムが用いられた場合、伝達画像の性質に関する外部情報が考慮される。この目的において、テレビカメラの制御装置から抽出されるカメラのメタデータが、とりわけ適用可能である。さらに、伝達画像において複数のテレビカメラのうちどのカメラが現在選択(「カット」)されているのかを特定するミキサーコンソールのGPIO信号が適用可能である。このデータに基づき、第2分析段階33では、プロダクションミキサーコンソール50へ供給されるオーディオ信号410の音量を変化させるための制御コマンド34が生成される。この変化は、オーディオデータベース40のオーディオ信号41のリアルタイム音声編集を行うための、制御コマンド34に基づいた制御が行われる段階70において起こる。プロダクションミキサーコンソール50に供給されるオーディオ信号410の音量をさらに変化させることにより、ビューアが画像内の動きの中心に対応して位置しているような、光学距離の再現をある程度行うことが出来る。サッカーの試合を例にとると、ボールに関する音の音量を変化させることにより、タックルに接近した記録、またはフィールド全体のワイドアングルでの記録を再作成することができ、これらの場合において、ビューアが想定する、動きのある位置までの光学距離はそれぞれ異なる。
補足的に、オーディオデータベース40に依存する、動的にリアルタイム音声編集を行う段階70では、第2分析段階33を用いて、動画像内のオブジェクトの位置に基づいたイコライジング(equalizing)および反響音成分の追加により、空間への散逸および空間性の影響を再現するよう、制御が行われてよい。
上述した、プロダクションミキサーコンソール50へのオーディオ信号41または410のリアルタイムの供給の間、画像コンテンツの検出および分析の結果、オーディオ信号41と動画像との間には、特定の時間的なずれが起こる。しかし、この時間的なずれは、4つの完全な画像よりも小さな範囲のずれであり得る。このため、対応するオーディオ/ビデオイベント間の明確な関連付けが可能である。
図3は、「サンプルマッピング」を用いた、サッカーに関するオーディオデータベース40の構成例を示す。「サンプルマッピング」は、データベース40に格納されるオーディオサンプルの、異なる複数のカテゴリへとの分類として理解される。オーディオデータベース40はハードウェアベースで実装されても、ソフトウェアベースで実装されてもよく、例えば、標準的なハードウェア/ソフトウェアサンプラまたはユニバーサルデータベースフォーマットを用いて実装されてもよい。制御コマンド31、34のデータベース40への送信は、例えば、MIDI規格を用いて行われてもよい。オーディオサンプルの特定の特徴に基づいてオーディオデータベースのオーディオサンプルを分類すべく、適用の必要に応じて「サンプルマッピング」が行われる。
サッカーの試合で再現性の高い音声を合成する例を取り上げると、プレーヤの体、足および頭によるボールのトラップおよびコントロールなど形態の異なる複数の運動技術に関するオーディオサンプルが区別される。体を使った運動技術に関しては、胸、膝および頭によるボールのトラップおよびコントロールがさらに区別される。足によるトラップおよびコントロールは、さらに、「シュート」および「パス」のグループに分けられる。
図3に係る実施形態においては、分析段階33(図2)において動画像に基づいて判断されたシュートの強さに基づき異なる音量(速度)のオーディオサンプルが選択され、異なるオーディオサンプルを用いることにより、運動の強度毎に異なるトーンの差異も反映される。例えば、強いシュートの弾けるような(pop−like sound)音は、強さの弱いシュートの音よりも大きな音量であり、かつ異なる周波数構成を持つ。このことにより、強さの弱いシュートの音は、音量が低くなるようミックスされるだけでなく、さらに、異なるオーディオサンプルを用いてミックスされる。この目的において、強いシュートの直接的な音声特徴を再現し、弱いシュートの直接的でない音声特徴を再現する、音源に対する異なる距離毎(2メートル、6メートルまたは12メートルなど)のオーディオサンプルが記録される。
再生の間、音量、反響音成分、パン、イコライジングなどのパラメータが段階70において、主にリアルタイムに制御コマンド34に基づいて変化させられる。このことがもたらす利点としては、パラメータ化の都度、新たなオーディオサンプルを格納する必要がなくなるということがある。これにより、求められる記憶容量およびオーディオデータベースの作成にかかるコストが劇的に軽減させられる。オーディオが編集されたシーンの再現性に関する全体的な印象を向上させるべく、連続する同様の画像コンテンツに関しても異なるオーディオサンプルを用いる必要がある。この目的において、オーディオサンプルをランダムにローテーションで用いてもよい。

Claims (13)

  1. スポーツイベントの記録である動画記録中の声のオーディオ再生を向上させる方法であり、
    前記スポーツイベント中の特定のスポーツの動きを識別すべく、前記スポーツイベントの動画像の画像コンテンツをセンサベースでキャプチャリングし、分析する段階と、
    前記キャプチャリングし、分析する段階で取得した情報に基づいて、前記スポーツの動きに対応するオーディオイベント、予め定められた基準に従いオーディオデータベースから選択する段階と、
    選択された前記オーディオイベントを、動画を伴う音声の成分に合わせて自動的に再生する段階と
    を備える、方法。
  2. 前記方法は、リアルタイムで実行される、請求項1に記載の方法。
  3. 前記オーディオデータベースから再生される前記オーディオイベントのリアルタイム音声編集は、前記動画像の分析に基づいて実行される、請求項2に記載の方法。
  4. 送信中の前記動画像の画像コンテンツ(伝達画像)をセンサベースでキャプチャリングする間に、「マシンビジョン」の分野で用いられるアルゴリズムを用いて前記伝達画像の分析を行い、
    前記アルゴリズムを用いて、運動するオブジェクトを分離して、画像背景に対する相対的なトラッキングを行い、
    画像セクションに基づく前記運動中のオブジェクトの位置の判断を行う、請求項1に記載の方法。
  5. 前記画像コンテンツをセンサベースでキャプチャリングする間に、送信中の動画像(伝達画像)の代わりに、対応する画像シーンに合わせてキャリブレーションされた、静的に設置された専用トラッキングカメラの信号を用い、
    加えて、カメラのメタデータ、または画像ミキサーコンソールのGPIO信号などの、前記伝達画像に係る外部情報を用いて前記分析を行う、請求項1に記載の方法。
  6. 運動シーケンスに関し高い解像度を得、かつ詳細なキャプチャリングを行うべく、GPSまたは無線搭載システムを用いて、伝達画像に現れる運動者の現在位置の判断など、前記運動者の動きに係る物理的な判断に用いる追加のパラメータをセンサベースでキャプチャリングする、請求項1から4のいずれか1項に記載の方法。
  7. 伝達画像の画像セクションに係る前記情報が、前記選択する段階において考慮される、請求項1からのいずれか1項に記載の方法。
  8. 前記動画像を記述する、センサベースでキャプチャリングされたパラメータは、予め定められたルールに従って互いに論理的に結合され、
    「オーディオサンプル」と呼ばれるアーカイブされた個々の音声を前記選択するための制御コマンドが、論理的に結合された前記パラメータに従って生成される、請求項1からのいずれか1項に記載の方法。
  9. 前記オーディオデータベースからの前記オーディオイベントの選択および前記リアルタイム音声編集の際、音声の種類、音声の音量(速度)、反響音の追加(空間性)およびパン(音声に方向性を割り当てる)を含む特徴に基づいて区別が行われる、請求項に記載の方法。
  10. 前記オーディオサンプルが、前記オーディオサンプルの特定の特徴に基づいて前記オーディオデータベース内で分類される(「サンプルマッピング」)、請求項に記載の方法。
  11. サッカーの試合で再現性の高い音を合成する場合の前記「サンプルマッピング」において、ーディオサンプルは、プレーヤの体または足によるボールのトラップおよびコントロールなど形態の異なる複数の運動技術に関して「体」、「シュート」および「パス」のグループごとに区別される、請求項10に記載の方法。
  12. サッカーの試合で再現性の高い音を合成する場合の前記「サンプルマッピング」において、検出される運動の強度毎に異なる音量のオーディオサンプルが構成され、
    異なるオーディオサンプルは、シュート、パスおよび体を使ったトラップの運動の強度毎に異なるトーンの差異も反映する、請求項10または11に記載の方法。
  13. 請求項1から12のいずれか1項に記載の方法を実施するアセンブリであり、
    スポーツイベントの前記動画記録の特徴的な画像コンテンツを検出するセンサエンティティと、
    前記動画記録の検出された前記画像コンテンツを分析する中央制御装置と、
    前記スポーツイベント中の特定のスポーツの動きに対応する個々のオーディオイベントをアーカイブするオーディオデータベースと
    ミキサーコンソールと
    を備え、
    前記センサエンティティが、前記スポーツイベント中の特定のスポーツの動きを識別し、
    前記中央制御装置が、前記オーディオデータベースでアーカイブされた前記オーディオイベントから、前記動画記録において前記センサエンティティによって識別された前記特定のスポーツの動きに対応するオーディオイベントを選択し、
    前記ミキサーコンソールが、前記中央制御装置によって選択された前記オーディオイベントを、動画を伴う音声にミックスする
    アセンブリ。
JP2013540372A 2010-11-25 2011-11-24 動画記録中の音声のオーディオ信号再生を向上させる方法およびアセンブリ Active JP5868991B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102010052527A DE102010052527A1 (de) 2010-11-25 2010-11-25 Verfahren und Anordnung zur verbesserten Tondarstellung von Geräuschen bei einer Videoaufzeichnung
DE102010052527.8 2010-11-25
PCT/EP2011/070991 WO2012069614A1 (en) 2010-11-25 2011-11-24 Method and assembly for improved audio signal presentation of sounds during a video recording

Publications (2)

Publication Number Publication Date
JP2014500669A JP2014500669A (ja) 2014-01-09
JP5868991B2 true JP5868991B2 (ja) 2016-02-24

Family

ID=45047772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013540372A Active JP5868991B2 (ja) 2010-11-25 2011-11-24 動画記録中の音声のオーディオ信号再生を向上させる方法およびアセンブリ

Country Status (10)

Country Link
US (1) US9240213B2 (ja)
EP (1) EP2643791B8 (ja)
JP (1) JP5868991B2 (ja)
CN (1) CN103329145B (ja)
BR (1) BR112013012550A2 (ja)
DE (1) DE102010052527A1 (ja)
ES (1) ES2923639T3 (ja)
PL (1) PL2643791T3 (ja)
TW (1) TWI548277B (ja)
WO (1) WO2012069614A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10592199B2 (en) 2017-01-24 2020-03-17 International Business Machines Corporation Perspective-based dynamic audio volume adjustment
CN107027053A (zh) * 2017-05-08 2017-08-08 深圳Tcl数字技术有限公司 音频播放方法、终端及计算机可读存储介质
US11172319B2 (en) 2017-12-21 2021-11-09 Insoundz Ltd. System and method for volumetric sound generation
CN109640166A (zh) * 2018-08-13 2019-04-16 张利军 基于动感程度的片尾曲选择方法
US11138431B2 (en) * 2019-04-01 2021-10-05 Foundation Of Soongsil University-Industry Cooperation Method for judging in or out, computer readable medium and apparatus for performing the method
GB2585060A (en) * 2019-06-27 2020-12-30 Sony Interactive Entertainment Inc Audio generation system and method
US11206453B2 (en) 2020-04-14 2021-12-21 International Business Machines Corporation Cognitive broadcasting of an event

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2537755A1 (fr) 1982-12-10 1984-06-15 Aubin Sylvain Dispositif de creation sonore
US5159140A (en) 1987-09-11 1992-10-27 Yamaha Corporation Acoustic control apparatus for controlling musical tones based upon visual images
US4818938A (en) * 1988-02-26 1989-04-04 Picker International, Inc. Audio coded imaging
JP3294457B2 (ja) 1995-01-31 2002-06-24 日本放送協会 自動ミクシング装置
US6067126A (en) 1998-01-05 2000-05-23 Intel Corporation Method and apparatus for editing a video recording with audio selections
FR2785438A1 (fr) 1998-09-24 2000-05-05 Baron Rene Louis Procede et dispositif de generation musicale
WO2012006498A2 (en) * 2010-07-08 2012-01-12 Intheplay, Inc. Sports scorekeeping system with integrated scoreboard and automatic entertainment system
DE19983916B4 (de) 1999-01-28 2010-02-18 Intel Corporation, Santa Clara Verfahren und Einrichtung zum Bearbeiten einer Videoaufzeichnung mit einer Audio-Auswahl
JP2001202082A (ja) 2000-01-17 2001-07-27 Matsushita Electric Ind Co Ltd 映像信号編集装置および方法
JP2002057975A (ja) * 2000-08-11 2002-02-22 Noritsu Koki Co Ltd 撮影画像記録装置
US7254268B2 (en) 2002-04-11 2007-08-07 Arcsoft, Inc. Object extraction
EP1757087A4 (en) * 2004-04-16 2009-08-19 James A Aman AUTOMATIC VIDEO RECORDING OF EVENTS, PURSUIT AND CONTENT PRODUCTION SYSTEM
JP2005316300A (ja) 2004-04-30 2005-11-10 Kyushu Institute Of Technology 楽音生成機能を備えた半導体装置およびこれを用いた携帯型電子機器、携帯電話装置、眼鏡器具並びに眼鏡器具セット
US20110191674A1 (en) * 2004-08-06 2011-08-04 Sensable Technologies, Inc. Virtual musical interface in a haptic virtual environment
JP5067595B2 (ja) 2005-10-17 2012-11-07 ソニー株式会社 画像表示装置および方法、並びにプログラム
US20070124293A1 (en) * 2005-11-01 2007-05-31 Ohigo, Inc. Audio search system
EP1958203A2 (en) 2005-11-21 2008-08-20 Koninklijke Philips Electronics N.V. System and method for using content features and metadata of digital images to find related audio accompaniiment
ITRM20060110A1 (it) * 2006-03-03 2007-09-04 Cnr Consiglio Naz Delle Ricerche Metodo e sistema per la rilevazione automatica di eventi in ambito sportivo
FI20075530A0 (fi) 2007-07-09 2007-07-09 Virtual Air Guitar Company Oy Eleohjattu musiikkisynteesijärjestelmä
KR20090008047A (ko) * 2007-07-16 2009-01-21 삼성전자주식회사 동작 및 위치를 검출하는 음성 입력장치와 노래 반주기 및이를 적용한 노래반주방법
JP2009169109A (ja) 2008-01-16 2009-07-30 Panasonic Electric Works Co Ltd ミラーシステム
US8435109B2 (en) * 2008-03-10 2013-05-07 Universal Entertainment Corporation Gaming machine with mechanical reel rotatable through player's operation and confirmation method of symbol
DE102008045397B4 (de) * 2008-09-02 2013-10-02 Institut für Rundfunktechnik GmbH Anordnung zur verbesserten Tondarstellung der sportartspezifischen Geräusche von Feldsportarten

Also Published As

Publication number Publication date
PL2643791T3 (pl) 2022-12-05
JP2014500669A (ja) 2014-01-09
EP2643791A1 (en) 2013-10-02
ES2923639T3 (es) 2022-09-29
EP2643791B8 (en) 2022-07-27
BR112013012550A2 (pt) 2016-08-09
WO2012069614A1 (en) 2012-05-31
EP2643791B1 (en) 2022-06-22
CN103329145A (zh) 2013-09-25
DE102010052527A1 (de) 2012-05-31
US9240213B2 (en) 2016-01-19
TW201234849A (en) 2012-08-16
CN103329145B (zh) 2017-06-27
US20140003796A1 (en) 2014-01-02
TWI548277B (zh) 2016-09-01

Similar Documents

Publication Publication Date Title
JP5868991B2 (ja) 動画記録中の音声のオーディオ信号再生を向上させる方法およびアセンブリ
CN112165590B (zh) 视频的录制实现方法、装置及电子设备
US10721439B1 (en) Systems and methods for directing content generation using a first-person point-of-view device
JP4760892B2 (ja) 表示制御装置、表示制御方法及びプログラム
US8218033B2 (en) Sound corrector, sound recording device, sound reproducing device, and sound correcting method
CN101552890B (zh) 信息处理设备、信息处理方法
JP2022036998A (ja) 映像音響処理装置および方法、並びにプログラム
JP4934580B2 (ja) 映像音声記録装置および映像音声再生装置
EP2376207B1 (en) Method and system for generating data for controlling a system for rendering at least one signal
JP2017513385A (ja) 自動的にテレビ番組を制作する方法及びシステム
US20200358415A1 (en) Information processing apparatus, information processing method, and program
CN110771175A (zh) 视频播放速度的控制方法、装置及运动相机
JPH11252411A (ja) Tv音声制御装置
KR102299565B1 (ko) 실시간 방송 영상에서 실시간으로 인물 객체를 인식하고 영상 처리하는 방법 및 이러한 방법을 수행하는 장치
CN112165591B (zh) 一种音频数据的处理方法、装置及电子设备
JP6818445B2 (ja) 音データ処理装置および音データ処理方法
JP2006333189A (ja) 映像要約生成装置
WO2010061791A1 (ja) 映像制御装置およびそれを備えた撮像装置、表示装置
CN117859339A (zh) 媒体设备及其控制方法和装置、目标跟踪方法和装置
JP2004147205A (ja) 画像音声記録装置
WO2021200140A1 (ja) 信号処理装置、信号処理方法、および信号処理システム
FR3079706A1 (fr) Procede et systeme de diffusion d'un flux audio multicanal a des terminaux de spectateurs assistant a un evenement sportif
WO2021054152A1 (ja) 信号処理装置および方法、並びにプログラム
JP2004064700A (ja) 画像分類装置、画像分類方法、プログラム、及び記録媒体、並びに画像分類システム
JP2008244865A (ja) 音場切替システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150421

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150717

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160106

R150 Certificate of patent or registration of utility model

Ref document number: 5868991

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250