JP7048825B2 - より短い時定数を使用した、メディア置換イベント中におけるラウドネスレベルのモニタリング - Google Patents

より短い時定数を使用した、メディア置換イベント中におけるラウドネスレベルのモニタリング Download PDF

Info

Publication number
JP7048825B2
JP7048825B2 JP2021527816A JP2021527816A JP7048825B2 JP 7048825 B2 JP7048825 B2 JP 7048825B2 JP 2021527816 A JP2021527816 A JP 2021527816A JP 2021527816 A JP2021527816 A JP 2021527816A JP 7048825 B2 JP7048825 B2 JP 7048825B2
Authority
JP
Japan
Prior art keywords
media content
loudness level
playback device
loudness
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021527816A
Other languages
English (en)
Other versions
JP2022507766A (ja
Inventor
マルクス ケイ クレーマー
シャシャンク マーチャント
ロバート クーヴァー
トッド ジェイ ホッジス
ジョシュア アーネスト モリス
Original Assignee
ロク インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ロク インコーポレイテッド filed Critical ロク インコーポレイテッド
Publication of JP2022507766A publication Critical patent/JP2022507766A/ja
Application granted granted Critical
Publication of JP7048825B2 publication Critical patent/JP7048825B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/22Automatic control in amplifiers having discharge tubes
    • H03G3/24Control dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/458Scheduling content for creating a personalised stream, e.g. by combining a locally stored advertisement with an incoming stream; Updating operations, e.g. for OS modules ; time-related management operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Transforming Light Signals Into Electric Signals (AREA)
  • Computer And Data Communications (AREA)
  • Communication Control (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

〔関連出願との相互参照〕
本開示は、2018年11月16日に出願された米国仮特許出願第62/768,596号、2019年6月14日に出願された米国仮特許出願第62/861,474号、及び2019年10月2日に出願された米国仮特許出願第62/906,676号に対する優先権を主張するものであり、これらの各文献はその全体が引用により本明細書に組み入れられる。
本開示では、別途指定していない限り、及び/又は特定の文脈によって明らかに別様に決定付けられない限り、「a又はan(英文不定冠詞)」という用語は少なくとも1つを意味し、「the(英文定冠詞)」という用語も少なくとも1つを意味する。
本開示では、「接続機構」という用語は、2又は3以上のコンポーネント、装置、システム又はその他のエンティティ間の通信を容易にする機構を意味する。接続機構は、ケーブル又はシステムバスなどの比較的単純な機構、又はパケットベースの通信ネットワーク(例えば、インターネット)などの比較的複雑な機構とすることができる。いくつかの例では、(例えば、接続が無線である場合には)接続機構が無形媒体を含むこともできる。
本開示では、「コンピュータシステム」という用語は、少なくとも1つのコンピュータ装置を含むシステムを意味する。いくつかの例では、コンピュータシステムが1又は2以上の他のコンピュータシステムを含むこともできる。
今後数年間のうちに、メディアコンテンツ内の広告をターゲット広告に置き換えることがますます重要な広告手法になると予想される。一例として、動的広告挿入(DAI:dynamic advertisement insertion)システムでは、コンテンツプロバイダが、ライブコンテンツ又は録画コンテンツなどの一連のメディアコンテンツに割り込むコマーシャル時間(advertisement breaks)に一般広告(generic advertisements)を挿入することができる。各コマーシャル時間は、所定の順序で配置された広告の組を含むことができる。さらに、これらの広告のうちの特定の1つをターゲット広告などの置換メディアコンテンツに置き換えられるように指定又は動的に選択することもできる。
この構成では、再生装置が、特定の広告を表示する前に置換メディアコンテンツを取得して、この特定の広告の代わりに置換メディアコンテンツを表示のために提供することができる。例えば、再生装置は、置換すべき特定の広告の直前にコンテンツを再生している、或いはまさにコンテンツを再生しようとしていると判定したことに応答して、データベースからターゲット広告を検索し、適切な時点で特定の広告の代わりにターゲット広告を表示のために提供することができる。
1つの態様では、方法例を開示する。この方法は、(i)再生装置が、第1のソースからの第1のメディアコンテンツを提示している間に、第1のメディアコンテンツの第1の長さを有する第1の部分の第1のラウドネスレベルを決定することと、(ii)再生装置が、第1のソースからの第1のメディアコンテンツを提示することから、第2のソースからの第2のメディアコンテンツを提示することに切り替えることと、(iii)再生装置が、切り替えたことに基づいて、第2のメディアコンテンツを提示している間に、第1のメディアコンテンツの第1の長さよりも短い第2の長さを有する第2の部分の第2のラウドネスレベルを決定することと、(iv)再生装置が、第2のメディアコンテンツを提示している間に、第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて再生装置の音量を調整することと、を含む。
別の態様では、非一時的コンピュータ可読媒体例を開示する。このコンピュータ可読媒体は、プロセッサによる実行時に、(i)再生装置が第1のソースからの第1のメディアコンテンツを提示している間に、第1のメディアコンテンツの第1の長さを有する第1の部分の第1のラウドネスレベルを決定することと、(ii)第1のソースからの第1のメディアコンテンツを提示することから、第2のソースからの第2のメディアコンテンツを提示することに切り替えることと、(iii)切り替えたことに基づいて、再生装置が第2のメディアコンテンツを提示している間に、第1のメディアコンテンツの第1の長さよりも短い第2の長さを有する第2の部分の第2のラウドネスレベルを決定することと、(iv)再生装置が第2のメディアコンテンツを提示している間に、第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて再生装置の音量を調整することと、を含む一連の動作を実行させるプログラム命令を記憶している。
別の態様では、コンピュータシステム例を開示する。このコンピュータシステムは、(i)再生装置が第1のソースからの第1のメディアコンテンツを提示している間に、第1のメディアコンテンツの第1の長さを有する第1の部分の第1のラウドネスレベルを決定することと、(ii)第1のソースからの第1のメディアコンテンツを提示することから、第2のソースからの第2のメディアコンテンツを提示することに切り替えることと、(iii)切り替えたことに基づいて、再生装置が第2のメディアコンテンツを提示している間に、第1のメディアコンテンツの第1の長さよりも短い第2の長さを有する第2の部分の第2のラウドネスレベルを決定することと、(iv)再生装置が第2のメディアコンテンツを提示している間に、第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて再生装置の音量を調整することと、を含む一連の動作を実行するように構成される。
コンピュータ装置例の簡略ブロック図である。 動的広告挿入(DAI)システム例の簡略ブロック図である。 ある実施形態例による、基準フィンガープリント生成器、クエリフィンガープリント生成器及びビデオ識別システムのコンポーネントを示す簡略ブロック図である。 ある実施形態例による、再生装置及び置換コンテンツサーバのコンポーネントを示す簡略ブロック図である。 方法例のフローチャートである。
I.概要
再生装置におけるメディアコンテンツ置換イベント中には、第1のメディアコンテンツの一部の代わりに第2のメディアコンテンツ(すなわち、置換メディアコンテンツ)が提示される。例えば、メディアコンテンツ置換イベント中には、第1のソースから受け取られた第1のメディアコンテンツのセグメントが、第2のソースから受け取られた第2のメディアコンテンツに置換される。この置換を達成するために、再生装置は、第1のソースから受け取られた第1のメディアコンテンツを提示することから、第2のソースから受け取られた第2のメディアコンテンツを提示することに切り替えることができる。いくつかの場合では、ユーザがこのソースの切り替えを感知できないことがある。
さらに、いくつかの場合では、再生装置が第1のソースからの第1のメディアコンテンツの代わりに第2のソースからの第2のメディアコンテンツを提示するメディアコンテンツ置換イベント中に、再生装置が第1のソースの音量再生情報(volume playback information)に一切アクセスできない場合がある。例えば、第1のソースの音量再生情報は、再生装置にオーディオ信号を提供する装置によって設定することができるが、この音量再生情報に再生装置がアクセスできないことがある。この結果、メディアコンテンツ置換イベント中に、再生装置にオーディオ信号を提供している装置を制御できるリモコン装置を使用してユーザが再生装置の音量を調整しようと試みた場合、意図する調整に再生装置がアクセスできないことがある。例えば、ユーザが音量を増加又は減少させようと試みた場合、再生装置は、要求された変更に関する情報にアクセスできず、相変わらず第2のメディアコンテンツを同じ音量レベルで提示し続けることがある。音量を調整しようと試みているユーザには、リモコン装置が機能していないか、或いは試行された音量調整に再生装置が応答していないかのように思われることがある。これによって、視聴者のユーザ体験が貧弱又は苛立たしいものになってしまう恐れがある。
本明細書では、この及び潜在的にその他の問題に対処する方法及びシステムを開示する。本開示によれば、メディアコンテンツ置換イベント中に、再生装置に第1のメディアコンテンツを提供する装置が、第2のメディアコンテンツに置換されている第1のメディアコンテンツに対応するオーディオ信号を再生装置に提供することができる。この装置は、たとえ再生装置が第1のメディアコンテンツの代わりに第2のメディアコンテンツを提示している場合であっても、再生装置に第1のメディアコンテンツに対応するオーディオ信号を提供することができる。再生装置は、第2のメディアコンテンツを提示している間、第1のメディアコンテンツのラウドネスレベルを測定することによって、第1のメディアコンテンツに対応するオーディオ信号をモニタすることができる。ユーザによって第1のメディアコンテンツの音量レベルが変更された場合には、再生装置がモニタしているオーディオ信号がこの音量変更を示し、再生装置が変更を検出することができる。有利なことに、その後、再生装置は、第2のメディアコンテンツに対応する音量調整を行うことによって、検出された、ユーザがトリガした音量調整に応答することができる。
さらに、再生装置は、このような第1のメディアコンテンツの音量レベルの変更を素早く検出して応答するのに役立つように、メディアコンテンツ置換イベント中に第1のメディアコンテンツの固定長部分のラウドネスレベルを決定することができる。これらの部分の長さは、メディアコンテンツ置換イベントが発生していない時に再生装置が分析する部分の長さよりも短いものとすることができる。一例として、再生装置は、メディアコンテンツ置換イベントが開始すると、第1のメディアコンテンツの30秒部分を分析することから、第1のメディアコンテンツの1秒部分、又は第1のメディアコンテンツの1秒未満の部分(例えば、1/2秒部分)を分析することに切り替えることができる。
本開示の一部は、広告を伴うメディアコンテンツ置換イベントを参照するが、これらの例は限定を意味するものではない。本明細書に開示するシステム及び方法は、1つのソースからのコンテンツストリームの一部である任意のコンテンツセグメントを別のソースからのコンテンツセグメントに置換することにも適用可能である。他のタイプの置換可能コンテンツとしては、気象セグメント、ニュースセグメント、スポーツセグメント、ラジオ広告などを挙げることができる。置換可能コンテンツを含むコンテンツストリームは、インターネット上のサーバ又はURLなどの様々なソースから提供することもできる。従って、以下に示す例は限定を意図するものではない。
II.アーキテクチャ例
A.コンピュータ装置
図1は、コンピュータ装置例100の簡略ブロック図である。コンピュータ装置100は、本開示において説明するような様々な動作及び/又は機能を実行することができる。コンピュータ装置100は、プロセッサ102、データストレージユニット104、通信インターフェイス106及び/又はユーザインターフェイス108などの様々なコンポーネントを含むことができる。これらのコンポーネントは、接続機構110を介して互いに(或いは別の装置、システム又はその他のエンティティに)接続することができる。
プロセッサ102は、汎用プロセッサ(例えば、マイクロプロセッサ)及び/又は専用プロセッサ(例えば、デジタルシグナルプロセッサ(DSP))を含むことができる。
データストレージユニット104は、磁気ストレージ、光学ストレージ又はフラッシュストレージなどの1又は2以上の揮発性、不揮発性、取り外し可能及び/又は取り外し不可能な記憶要素を含むことができ、及び/又は全体的又は部分的にプロセッサ102と一体化することができる。さらに、データストレージユニット104は、プロセッサ102によって実行された時に本開示において説明するような1又は2以上の動作及び/又は機能をコンピュータ装置100に実行させるプログラム命令(例えば、コンパイラ型又は非コンパイラ型プログラムロジック及び/又は機械コード)を記憶した非一時的コンピュータ可読記憶媒体の形態を取ることができる。従って、コンピュータ装置100は、本開示において説明するような1又は2以上の動作及び/又は機能を実行するように構成することができる。このようなプログラム命令は、離散的ソフトウェアアプリケーション(discrete software application)を定め、及び/又はこのような離散的ソフトウェアアプリケーションの一部とすることができる。いくつかの例では、コンピュータ装置100が、通信インターフェイス106及び/又はユーザインターフェイス108などから入力を受け取ったことに応答してプログラム命令を実行することができる。データストレージユニット104は、本開示において説明するタイプなどの他のタイプのデータを記憶することもできる。
通信インターフェイス106は、コンピュータ装置100が1又は2以上のプロトコルに従って別のエンティティと接続及び/又は通信することを可能にすることができる。1つの例では、通信インターフェイス106を、イーサネットインターフェイス又は高解像度シリアルデジタルインターフェイス(HD-SDI)などの有線インターフェイスとすることができる。別の例では、通信インターフェイス106を、セルラ又はWI-FIインターフェイスなどの無線インターフェイスとすることができる。本開示では、接続を直接的接続とすることも、或いはルータ、スイッチャ又はその他のネットワーク装置などの1又は2以上のエンティティを通過及び/又は横断する接続である間接的接続とすることもできる。同様に、本開示では、送信を直接送信又は間接送信とすることができる。
ユーザインターフェイス108は、妥当な場合にコンピュータ装置100とコンピュータ装置100のユーザとの間の相互作用を容易にすることができる。従って、ユーザインターフェイス108は、キーボード、キーパッド、マウス、タッチセンサ式パネル、マイク及び/又はカメラなどの入力要素、及び/又は(例えば、タッチセンサ式パネルと組み合わせることができる)ディスプレイ装置、サウンドスピーカ及び/又は触覚フィードバックシステムなどの出力要素を含むことができる。より一般的に言えば、ユーザインターフェイス108は、コンピュータ装置100とコンピュータ装置100のユーザとの間の相互作用を容易にするハードウェア及び/又はソフトウェアコンポーネントを含むことができる。
コンピュータ装置100は、ワークステーション端末、デスクトップコンピュータ、ラップトップ、タブレット、携帯電話機又はテレビなどの様々な形態を取ることができる。
B.動的広告挿入(DAI)システム
図2は、DAIシステム例200の簡略ブロック図である。DAIシステム200は、メディアコンテンツ(例えば、オーディオコンテンツ及び/又はビデオコンテンツ)の配信及び/又は提示に関連する様々な動作及び/又は機能を実行することができ、コンピュータシステムとして実装することができる。
DAIシステム200は、視聴ステーション(watching station)210、コンテンツソース220、メディア装置230、再生装置240、ビデオ識別システム250及び置換コンテンツサーバ260などの様々なコンポーネントを含むことができ、これらはそれぞれコンピュータシステムとして実装することができる。
視聴ステーション210は、放送局、ウェブサーバ又はケーブルテレビ(TV)局などのコンテンツソース220からビデオ及びその他のマルチメディアコンテンツを受け取ることができる。例えば、コンテンツソース220は、テレビチャンネルを介して視聴ステーション210にメディアをストリーミング又は送信するTV局又はTVネットワークなどの放送局、及び/又はネットワーク270を介して視聴ステーション210にメディアをストリーミング又は送信するウェブサイトなどのウェブサービスとすることができる。視聴ステーション210は、コンテンツソース220から受け取られたビデオコンテンツの基準フィンガープリントを生成する基準フィンガープリント生成器212を含む。視聴ステーション210は、生成された基準フィンガープリントをビデオ識別システム250に送信することができる。
視聴ステーション210は、ラウドネスレベルプロファイル生成器214も含む。或いは、ラウドネスレベルプロファイル生成器214は、視聴ステーション210から独立した別のコンピュータシステムの一部とすることもできる。ラウドネスレベルプロファイル生成器214は、メディアコンテンツのセグメントのラウドネスレベルプロファイルを生成することができる。一例として、ラウドネスレベルプロファイル生成器214は、メディアコンテンツ置換イベント中に置換広告に置き換えられる置換可能広告のラウドネスレベルプロファイルを生成することができる。
ラウドネスレベルプロファイルは、メディアコンテンツのセグメントにおいて時間と共にラウドネスがどのように変化するかを特徴付けることができる。例えば、ラウドネスレベルプロファイルは、メディアコンテンツのセグメントの異なる部分に対するそれぞれのラウドネスレベル(例えば、二乗平均平方根(RMS)ラウドネスレベル又はラウドネス、K-weighted, relative to full scale(LKFS)ラウドネスレベル)を含むことができる。1つの例として、30秒広告のラウドネスレベルプロファイルは、広告の部分に対応する一連のラウドネスレベルを含むことができる。これらの部分は、互いに重なり合う部分又は異なる部分とすることができる。例えば、各ラウドネスレベルは、固定長部分中(例えば、1/2秒、1秒など)の広告のオーディオ信号の特性に基づいて計算される移動平均とすることができる。
いくつかの実装では、オーディオ信号の最初の1秒部分のRMSに基づいて、広告の初期ラウドネスレベルを計算することができる。次に、オーディオ信号の後続の1秒部分に基づいて後続のラウドネスレベルを計算することができる。或いは、他の実装では、オーディオ信号の最初の3秒部分のRMSに基づいて初期ラウドネスレベルを計算することができる。次に、最初の3秒部分の一部に重なり合うオーディオ信号の後続の3秒部分に基づいて後続のラウドネスレベルを計算することができる。例えば、後続の3秒部分は、最初の部分の最後の2秒と、最初の部分に後続する追加部分とを含むことができる。
ラウドネスレベルプロファイル生成器214は、ラウドネスメータを使用してラウドネスレベルプロファイルのラウドネスレベルを計算することができる。ラウドネスメータは、視聴ステーション210上で実行されるように構成されたソフトウェアモジュールを含むことができる。ソフトウェアモジュールは、国際電気通信連合(International Telecommunication Union)によって推奨されるものなどの様々なフィルタリングアルゴリズムを実行してラウドネスレベルを決定することができる。ソフトウェアモジュールは、オーディオ信号の複数のチャンネルの個々のラウドネスレベルを測定した後に、個々のラウドネスレベルを平均化し、合計してラウドネスレベルに到達することができる。
ラウドネスレベルプロファイル生成器214は、ラウドネスレベルプロファイルのインデックスを生成することができる。例えば、ラウドネスレベルプロファイル生成器214は、生成されたラウドネスレベルプロファイルを、ラウドネスレベルプロファイルが生成された元となるメディアコンテンツのセグメントの対応する識別子に関連付けて記憶することができる。視聴ステーション210は、生成されたラウドネスレベルプロファイルを、ビデオ識別システム250、再生装置240、置換コンテンツサーバ260、及び/又は別のコンピュータシステムに送信することができる。
メディア装置230は、放送チャンネル及び/又はネットワーク270などを介してコンテンツソース220からビデオ及びその他のマルチメディアコンテンツを受け取ることができる。メディア装置230は、コンテンツを再生装置240に送る前に受け取ったコンテンツを修正することができる。メディア装置230は、ビデオコンテンツの入力ストリームを受け取り、入力ストリームを処理することによってビデオコンテンツの出力ストリームを生成するように構成されたチューナを含むことができる。メディア装置230は、多チャンネル映像番組配信事業者が利用する地上波放送、ケーブル及び/又は衛星放送ネットワークなどのビデオコンテンツ配信ネットワークを介してビデオコンテンツにアクセスできるように、チューナ、デコーダ及びその他のハードウェア及び/又はソフトウェアを備えた装置とすることができる。これに加えて又はこれに代えて、メディア装置230は、インターネットビデオストリーミングサービスにアクセスする装置が使用するワイドエリアネットワーク(例えば、インターネット)を通じてビデオコンテンツにアクセスできるように、ネットワークアダプタ、デコーダ及びその他のハードウェア及び/又はソフトウェアを備えた装置とすることもできる。メディア装置230は、再生装置240のスピーカ及びディスプレイがユーザにビデオコンテンツを提示するために使用できる信号(例えば、デジタル又はアナログ信号)を出力することができる。
再生装置240は、ビデオ及び/又はその他のマルチメディアコンテンツのストリームを受け取って提示できるいずれかの装置(例えば、TV、ラップトップ又はその他のパーソナルコンピュータ(PC)、タブレット又はその他のモバイル装置、或いはゲーム機)である。再生装置240は、処理済みのビデオコンテンツストリームを表示するように構成されたディスプレイ又はその他のユーザインターフェイスを含むことができる。ディスプレイは、フラットパネルスクリーン、プラズマスクリーン、発光ダイオード(LED)スクリーン、ブラウン管(CRT)、液晶ディスプレイ(LCD)又はプロジェクタとすることができる。再生装置は、1又は2以上のスピーカを含むこともできる。また、再生装置240は、無線放送チャンネルを介してオーディオ及びビデオを受け取るように構成されたアンテナを含むこともできる。
ネットワーク270は、有線ネットワーク及び/又は無線ネットワーク(例えば、モバイルネットワーク)などの、装置間の通信を可能にするいずれかのネットワークとすることができる。ネットワーク270は、プライベートネットワーク(例えば、ケーブルテレビネットワーク又は衛星テレビネットワーク)又はパブリックネットワーク(例えば、無線放送チャンネル又はインターネット)を構成する1又は2以上の部分を含むことができる。
ビデオ識別システム250は、ネットワーク270を介して視聴ステーション210及び再生装置240と通信することができる。ビデオ識別システム250は、ビデオコンテンツを識別するために、再生装置240のクエリフィンガープリント生成器242がビデオコンテンツから生成したクエリフィンガープリントを受け取り、視聴ステーション210の基準フィンガープリント生成器212が生成した既知のフィンガープリントのインデックスを問い合わせることができる。クエリフィンガープリントは、ビデオコンテンツ内のフレーム又はフレームブロックのフィンガープリントとすることができる。ビデオ識別システム250は、クエリフィンガープリントと1又は2以上の基準フィンガープリントとを照合することによってビデオコンテンツを識別することができる。いくつかの例では、ビデオ識別システム250を、再生装置240又はメディア装置230のコンポーネント又はモジュールとすることができる。
ビデオ識別システム250は、ビデオコンテンツを識別すると、ビデオコンテンツに関連する置換メディアコンテンツ(例えば、代替番組又は代替コマーシャル)の識別子を再生装置240に戻すことができる。置換メディアコンテンツは、置換コンテンツサーバ260に記憶することができる。再生装置240は、識別子を使用して置換コンテンツサーバ260から置換メディアコンテンツにアクセスし、その後に置換メディアコンテンツを表示のために提供することができる。或いは、置換コンテンツサーバ260又は別のコンピュータシステムは、置換メディアコンテンツを再生装置240又はメディア装置230のローカルキャッシュに記憶されるように前もって(例えば、メディア装置230が置換動作を実行するようにスケジュールされている数秒前、数分前又は数時間前に)再生装置240又はメディア装置230に送信しておくこともできる。この実装では、再生装置240が、ローカルキャッシュから置換メディアコンテンツにアクセスした後に、置換メディアコンテンツを表示のために提供することができる。このローカルキャッシュ技術の採用は、再生装置240が置換動作の実行までに置換メディアコンテンツを受け取ることを確実にするのに役立つことができる。例えば、再生装置240が信頼できない又は予測できないインターネット接続を有している状況では、このことが特に有用となり得る。
また、ビデオ識別システム250は、ビデオコンテンツを識別する際に、このビデオコンテンツに関連するラウドネスレベルプロファイルの識別子を再生装置240に戻すことができる。この識別子は、例えばビデオコンテンツの識別子とすることができる。ラウドネスレベルプロファイルは、視聴ステーション210、置換コンテンツサーバ260、又は別のコンピュータシステムに記憶することができる。再生装置240は、この識別子を使用して、例えば視聴ステーション210又は置換コンテンツサーバ260からラウドネスレベルプロファイルにアクセスすることができる。或いは、視聴ステーション210又は別のコンピュータシステムは、ラウドネスレベルプロファイルを再生装置240又はメディア装置230のローカルキャッシュに記憶されるように前もって再生装置240又はメディア装置230に送信しておくこともできる。この実装では、再生装置240が、ローカルキャッシュからラウドネスレベルプロファイルにアクセスすることができる。
図2に示す任意の装置は、任意のモジュール、システム及び/又は生成器を配置することができる。例えば、ビデオ識別システム250は、クエリフィンガープリント生成器242を含むことができる。この構成では、ビデオ識別システム250が再生装置240からビデオコンテンツのフレームを受け取り、このビデオコンテンツのフレームを使用してクエリフィンガープリントを生成することができる。別の例として、メディア装置230及び再生装置240を単一の装置内で統合することもできる。他の変形例も可能である。
本開示のDAIシステム200及び他の部分の説明は、フィンガープリント法を使用したビデオコンテンツの識別を参照するが、この例は限定を意図するものではない。本明細書に開示するシステム及び方法は、透かし法を使用してビデオコンテンツを識別することもできる。例えば、視聴ステーション210は、ビデオコンテンツ内に透かし(例えば、オーディオ透かし又はビデオ透かし)を埋め込むことができる。この方法では、再生装置240がビデオコンテンツ内の透かしを検出して、この透かしをビデオ識別システム250に送信することができる。或いは、再生装置240がビデオコンテンツのフレームをビデオ識別システムに送信し、ビデオ識別システム250がビデオコンテンツのフレーム内の透かしを検出することもできる。ビデオ識別システム250は、透かしを取得した後に、この透かしを使用してビデオコンテンツを識別し、ビデオコンテンツに関連する置換メディアコンテンツの識別子を再生装置240に戻すことができる。同様に、本明細書に開示するシステム及び方法は、ビデオストリームに埋め込まれた情報を使用してビデオコンテンツを識別することもできる。例えば、視聴ステーション210は、ビデオストリームのサイド情報又は補助的情報に識別子を埋め込むことができる。この識別子は、メディアコンテンツ置換イベントを伝えることができ、再生装置240は、この埋め込み情報を検出することができる。別の例として、特定のクローズドキャプション情報によってメディアコンテンツ置換イベントをトリガすることもできる。視聴ステーション210は、ビデオコンテンツのクローズドキャプション情報を、メディアコンテンツ置換イベントの開始までのカウントダウンをトリガするテキスト文字列又は一連の文字列を含むように修正することができる。その後、再生装置240を、これらのテキスト文字列又は一連の文字列を探すことによって、メディアコンテンツ置換イベントがいつ発生する予定であるかを判定するように構成することができる。
図3は、基準フィンガープリント生成器212、クエリフィンガープリント生成器242及びビデオ識別システム250のコンポーネントを示す簡略ブロック図である。図3に示すように、クエリフィンガープリント生成器242は、(例えば、バス、共有メモリ又はスイッチを介して)互いに通信するように構成されたパッチ選択モジュール243及び値計算モジュール244を含む。さらに、ビデオ識別システム250は、インデックスモジュール252、フィンガープリント照合モジュール254及び識別モジュール256を含み、これらは全て互いに通信するように構成される。さらに、基準フィンガープリント生成器212は、互いに通信するように構成されたパッチ選択モジュール216及び値計算モジュール218を含む。
図3に示すモジュールのうちの1つ又は2つ以上は、ハードウェア(例えば、機械のプロセッサ、フィールドプログラマブルゲートアレイ(FPGA)又は特定用途向け集積回路(ASIC))、又はハードウェアとソフトウェアとの組み合わせを使用して実装することができる。さらに、図3に示すモジュールのうちのいずれか2つ又は3つ以上を単一モジュールに組み合わせ、本明細書で説明する単一モジュールの機能を複数のモジュール間で細分割することもできる。
上記の説明によれば、クエリフィンガープリント生成器242及び基準フィンガープリント生成器212は、ビデオコンテンツの1又は2以上のフレームのフィンガープリントを生成するように構成することができる。例えば、クエリフィンガープリント生成器242及び基準フィンガープリント生成器212は、ビデオコンテンツ内の1又は2以上のフレームのパッチ(patches)の値を計算することができる。パッチは、フレーム内の異なる位置に存在することができる。クエリフィンガープリント生成器242及び基準フィンガープリント生成器212は、複数のフレームからのフィンガープリントを組み合わせてビデオコンテンツのフレームブロックのフィンガープリントを生成するように構成することができる。
一例として、クエリフィンガープリント生成器242のパッチ選択モジュール243は、ビデオコンテンツ内の1又は複数のフレームの1又は2以上の領域に関連するパッチなどのビデオコンテンツの複数のパッチを選択するように構成することができる。同様に、基準フィンガープリント生成器212のパッチ選択モジュール216も、ビデオコンテンツ内の1又は複数のフレームの1又は2以上の領域に関連するパッチなどのビデオコンテンツの複数のパッチを選択するように構成することができる。
パッチは、フレームを2×2グリッド、4×3グリッド又は4×4グリッドなどのグリッドに分割し、このグリッドに基づいてパッチを選択することによって定めることができる。例えば、フレームの象限(quadrants)に対応する4つの大パッチと、各象限のサブ象限(sub-quadrants)に対応する4つの小パッチ(すなわち、合計16個の小パッチ)とを含む20個のパッチを選択することができる。いくつかの例では、パッチが重なり合うこともできる。さらに、パッチは、フレーム全体よりも小さく累積的に広がることもできる。
クエリフィンガープリント生成器242の値計算モジュール244は、例えば積分画像法(integral image technique)を使用して、選択された複数のパッチの各々の値を計算するように構成することができる。積分画像法は、画素グループの値の総和を生成するエリア総和テーブル(summed area table)又はその他のデータ構造を使用して値を計算することができる。同様に、基準フィンガープリント生成器212の値計算モジュール218も、例えば積分画像法を使用して、選択された複数のパッチの各々の値を計算するように構成することができる。
いくつかの例では、値計算モジュール244及び値計算モジュール218が、パッチを含む画素グループの値を合計し、画素グループの値を平均し、又は画素グループの中央値を求めることによってパッチの値を計算することができる。これに加えて又はこれに代えて、値計算モジュール244及び値計算モジュール218は、画素グループの値間の差分を計算し、又は画素グループの値の線形結合を計算することによってパッチの値を計算することもできる。
ビデオ識別システム250のインデックスモジュール252は、クエリフィンガープリントに一致する可能性がある基準フィンガープリントを識別するために、視聴ステーション210又はビデオ識別システム250に記憶された既知のフィンガープリントのデータベースなどの、ビデオコンテンツの既知の基準フィンガープリントのデータベースに問い合わせを行うように構成することができる。インデックスモジュール252は、既知の基準フィンガープリントの量子化されたパッチ値のインデックスを問い合わせるように構成することができる。
ビデオ識別システム250のフィンガープリント照合モジュール254は、クエリフィンガープリントを1又は2以上の既知の基準フィンガープリントと比較して、クエリフィンガープリントが少なくとも1つの既知の基準フィンガープリントに一致すると判定するように構成することができる。例えば、フィンガープリント照合モジュール254は、クエリフィンガープリントと少なくとも1つの既知の基準フィンガープリントとの間の類似性が所定の閾値を満たすと判定することによって、クエリフィンガープリントが少なくとも1つの既知の基準フィンガープリントに一致すると判定することができる。所定の閾値は、谷本距離測定値、マンハッタン距離測定値、又はその他の距離測定値に関連することができる。これに加えて又はこれに代えて、フィンガープリント照合モジュール254は、ユークリッド法、コサイン法、KLダイバージェンス法及び/又は板倉照合法などの他の照合法を使用することもできる。
さらに、識別モジュール256は、クエリフィンガープリントが少なくとも1つの基準フィンガープリントに一致するとの判定に基づいてビデオコンテンツを識別するように構成することができる。例えば、識別モジュール256は、ビデオコンテンツの名称又はタイトル、再生装置240が現在提示しているビデオコンテンツ内の位置、及び/又はビデオコンテンツを提供しているチャンネル又は放送局を識別することができる。
図4は、再生装置240及び置換メディアサーバ260のコンポーネントを示す簡略ブロック図である。図4に示すように、再生装置240は、クエリフィンガープリント生成器242に加えて、互いに通信するように構成できるオーディオ分析モジュール245及び再生修正モジュール246を含む。さらに、置換コンテンツサーバ260は、ビデオ提供モジュール262を含む。
再生装置240は、メディアコンテンツ置換イベントを実行するためのトリガに遭遇することができる。メディアコンテンツ置換イベントは、第1のソースからの第1のメディアコンテンツを提示することから、第2のソースからの第2のメディアコンテンツを提示することに切り替えることを伴うことができる。第1のソースは、第1のコンテンツパイプとすることができ、第2のソースは、第1のコンテンツパイプとは異なる第2のコンテンツパイプとすることができる。例えば、第1のソースは、無線アンテナ又はメディア装置230のいずれかとすることができ、第2のソースは、インターネット又は再生装置240のローカルキャッシュのいずれかとすることができる。特定の例として、第1のメディアコンテンツは、無線アンテナ又はメディア装置230を介して受け取られる第1のマルチメディアセグメントとすることができ、第2のメディアコンテンツは、ネットワーク270を介して置換コンテンツサーバ260から受け取られて再生装置240のローカルキャッシュに記憶される第2のマルチメディアセグメントとすることができる。或いは、第1のソースを無線アンテナとし、第2のソースをメディア装置230とすることもできる。別の例として、第1のソースをネットワーク270とし(例えば、第1のメディアコンテンツをマルチメディアストリームとし)、第2のソースを再生装置240のローカルキャッシュ又はメディア装置230のいずれかとすることもできる。
トリガに遭遇することは、置換すべき第2のセグメントの直前に生じる第1のセグメントを再生装置240が提示していると判定することを伴うことができる。再生装置240は、上述したフィンガープリント法又は透かし法のいずれかを使用して、第1のセグメントが提示されていると判定することができる。或いは、トリガに遭遇することは、再生装置240が別の装置から置換コマンドを受け取ることを伴うこともできる。
再生装置240は、オーディオ分析モジュール245に、第1のメディアコンテンツの第1の部分の第1のラウドネスレベルを決定するように命令することができる。オーディオ分析モジュール245は、トリガに遭遇する前に第1のラウドネスレベルを決定することができる。第1のラウドネスレベルは、再生装置240が第1のメディアコンテンツを提示している時にオーディオ分析モジュール245が継続的又は断続的に決定する移動平均とすることができる。1つの例では、オーディオ分析モジュール245が、第1のメディアコンテンツの最近提示された部分(例えば、過去1分、過去30秒など)のラウドネスレベル(例えば、二乗平均平方根(RMS))を固定間隔ベースで計算することができる。第1のラウドネスレベルは、ラウドネスメータを使用して計算することができる。オーディオ分析モジュール245は、時間の経過と共に、第1のメディアコンテンツの複数の部分のラウドネスレベルを共に平均化することができる(例えば、5つの1分部分の平均)。第1のメディアコンテンツの複数の部分は、互いに重なり合った部分又は分離した部分とすることができる。さらに、所望数のラウドネスレベルが取得されると、オーディオ分析モジュール245は、第1のラウドネスレベルの移動平均に達するように、最も古い(最も古くなった)ラウドネスレベルを新たな(直前の)ラウドネスレベルに置換し始めることができる。他の例も可能である。
ラウドネスメータは、再生装置240上、及び/又は再生装置240が通信可能に接続されたサーバ装置上で実行されるように構成されたソフトウェアモジュールを含むことができる。ソフトウェアモジュールは、国際電気通信連合によって推奨されるものなどの、第1のラウドネスレベルを決定する様々なフィルタリングアルゴリズムを実行することができる。ソフトウェアモジュールは、オーディオ信号の複数のチャンネルの個々のラウドネスを測定した後に、個々のラウドネス測定値を平均化し、加算してラウドネスレベルを決定することができる。
いくつかの例では、第1のメディアコンテンツのラウドネスレベルプロファイル(すなわち、一定期間にわたるラウドネス)をサーバによってストリームとして又はバルクで再生装置240に提供することができる。ラウドネスレベルプロファイルは、第1のメディアコンテンツにおいてラウドネスが時間と共にどのように変化するかを特徴付けることができる。このラウドネスレベルプロファイルは、例えばサーバ側で事前計算して、決定された固定音量値(例えば、平均ラウドネス、又は何らかの目標音量尺度)に関連付けておくことができる。その後、オーディオ分析モジュール245は、このラウドネスレベルプロファイルと、第1のメディアコンテンツから測定されるラウドネス値とを整列させた後に、装置によって観測された第1のメディアコンテンツと(サーバにおいて遠隔的に分析された)基準とのレベル差を第1のラウドネスレベルとして決定することができる。
いくつかの例では、再生装置240がチャンネル変更イベントを検出することができる。再生装置240は、チャンネル変更イベントを検出すると、オーディオ分析モジュール245に第1のラウドネスレベルの移動平均をリセットするように命令することができる。1つの例として、再生装置240は、第1のメディアコンテンツのオーディオ及び/又はビデオフィンガープリンティングを使用してチャンネル変更イベントを検出することができる。別の例として、再生装置240は、第1のメディアコンテンツを提供する装置から、チャンネル変更が発生したことを示す信号(例えば、高精細マルチメディアインターフェイス信号)を受け取ることもできる。従って、再生装置240は、この信号の受信に基づいてチャンネル変更イベントが発生したと判定することができる。別の例として、再生装置240は、テンプレートマッチングを使用して、第1のメディアコンテンツを提供する装置(例えば、図2のメディア装置230)によってチャンネル変更に関連して提示されるチャンネルバーの表示を認識することによってチャンネル変更イベントを検出することもできる。
置換コンテンツサーバ260のビデオ提供モジュール262は、再生装置240に第2のメディアコンテンツを提供することができる。例えば、ビデオ識別システム250は、再生装置240が表示しているビデオコンテンツを識別することができ、ビデオ提供モジュール262は、識別されたビデオコンテンツに基づいて、ビデオコンテンツに対応する置換メディアコンテンツを再生装置240に提供することができる。再生装置240は、ネットワーク通信インターフェイスを介して第2のメディアコンテンツを受け取ることができる。例えば、第2のメディアコンテンツは、インターネットを介して再生装置240にストリーミングされた後に再生装置240のローカルキャッシュに記憶された置換メディアコンテンツとすることができる。
再生装置240は、トリガに遭遇すると、再生装置240が置換する予定の第1のメディアコンテンツの部分のラウドネスレベルプロファイルを取得することもできる。例えば、ビデオ識別システム250は、再生装置240が表示のために提供しているビデオコンテンツを識別したことに基づいて、再生装置240が置換する予定の第1のメディアコンテンツの部分のラウドネスレベルプロファイルを取得し、これを再生装置240に提供することができる。或いは、ビデオ識別システム250は、再生装置240に識別子を提供することにより、再生装置240がこの識別子を使用してローカルキャッシュ又は別のコンピュータシステムからラウドネスレベルプロファイルを検索できるようにすることもできる。
再生装置240は、トリガに遭遇したことに応答して、第1のメディアコンテンツを提示することから第2のメディアコンテンツを提示することに切り替えることができる。例えば、再生装置240は、第2のメディアコンテンツを一連のメディアコンテンツに挿入するトリガに遭遇すると、ローカルキャッシュから置換メディアコンテンツを検索し、メディアファイルを表示するように構成されたメディアプレーヤを使用して置換メディアコンテンツを表示することができる。メディアプレーヤを使用して置換メディアコンテンツを表示のために提供することは、メディア装置又はアンテナから受け取られたメディアコンテンツなどの他のメディアコンテンツが表示のために提供される別の層の上位に存在するメディアプレーヤ層に置換メディアコンテンツを提示することを伴うことができる。
いくつかの例では、第2のメディアコンテンツを表示のために提供することが、メディア装置230又はアンテナから受け取られたメディアコンテンツを提供することから、再生装置240のデータベースに記憶された置換メディアコンテンツを提供することに切り替えることを伴うことができる。再生装置240は、フレームバッファを含むシステムオンチップを含むことができる。再生装置240のメディアプレーヤは、置換メディアコンテンツを表示のために提供するために、置換メディアコンテンツをフレームバッファに挿入することができる。システムオンチップは、置換メディアコンテンツをフレームバッファに挿入する前に、メディア装置230から受け取られたメディアコンテンツをフレームバッファに挿入しておくことができる。
第2のメディアコンテンツは、置換広告を含むことができる。例えば、第2のメディアコンテンツは、一般広告の代わりとすべきターゲット広告を含むことができる。1つの例として、ターゲット広告は地方広告とすることができ、一般広告は全国広告とすることができる。別の例として、ターゲット広告は、再生装置240のユーザの人口統計データに基づいて選択された広告とすることもできる。
いくつかの例では、再生装置240が、第2のメディアコンテンツを提示する前に第2のメディアコンテンツのラウドネスレベルを調整することができる。例えば、再生装置240のオーディオ分析モジュール245は、第2のメディアコンテンツのラウドネスレベルを決定することができ、その後、再生装置240は、第2のメディアコンテンツのラウドネスレベルと第1のメディアコンテンツのラウドネスレベルとの差分に基づいて第2のメディアコンテンツのラウドネスレベルを調整することができる。いくつかの例では、再生装置240が、2つの広告を順に置換することができる。例えば、再生装置は、第2のメディアコンテンツを提示した後に第3のメディアコンテンツ(例えば、別の置換広告)を提示することができる。この場合、再生装置240は、第2のメディアコンテンツのラウドネスレベルを調整する方法と同じ方法で第3のメディアコンテンツのラウドネスレベルを調整するように構成することができる。
再生装置240のオーディオ分析モジュール245は、第2のメディアコンテンツのラウドネスレベルを様々な方法で決定することができる。1つの例として、オーディオ分析モジュール245は、置換コンテンツサーバ260から第2のメディアコンテンツと共に受け取られる補助的情報に基づいて第2のメディアコンテンツのラウドネスレベルを決定することができる。例えば、ラウドネスレベルは、第2のメディアコンテンツのヘッダ情報内で指定することができる。別の例として、オーディオ分析モジュール245は、第2のメディアコンテンツに関連するオーディオ信号を処理することによってラウドネスレベルを決定することもできる。さらに別の例として、オーディオ分析モジュール245は、広告が従うように意図されたデフォルトラウドネスレベルをラウドネスレベルとして使用することもできる。
いくつかの例では、第1のメディアコンテンツのラウドネスレベル及び第2のメディアコンテンツのラウドネスレベルを絶対尺度で指定することができる。他の例では、第1のメディアコンテンツのラウドネスレベル及び第2のメディアコンテンツのラウドネスレベルをデシベルで指定することができる。ラウドネスレベルは、K-weighting relative to full scale(LKFS)などの知覚的音量重み付けを含むことができる。
再生修正モジュール246は、修正されたメディアコンテンツを生成するように、第1のメディアコンテンツのラウドネスレベルと第2のメディアコンテンツのラウドネスレベルとの差分に基づいて第2のメディアコンテンツのラウドネスを調整することができる。例えば、再生修正モジュール246は、第1のメディアコンテンツのラウドネスレベルの方が第2のメディアコンテンツのラウドネスレベルよりも低いと判定すると、第2のメディアコンテンツのラウドネスを低下させることができる。ラウドネスレベルを低下させることは、第2のメディアコンテンツのラウドネスを、決定されたラウドネスレベルから新たなラウドネスレベルに低下させることを伴うことができる。新たなラウドネスレベルは、第1のメディアコンテンツのラウドネスレベルにほぼ等しいものとすることができる。或いは、新たなラウドネスレベルは、第2のメディアコンテンツのラウドネスレベルと第1のメディアコンテンツのラウドネスレベルとの間のレベルとすることもできる。
一方で、再生修正モジュール246は、第1のメディアコンテンツのラウドネスレベルの方が第2のメディアコンテンツのラウドネスレベルよりも高いと判定すると、第2のメディアコンテンツのラウドネスを高めることができる。例えば、再生修正モジュール246は、第2のメディアコンテンツのラウドネスを、決定されたラウドネスレベルから新たなラウドネスレベルに高めることができる。新たなラウドネスレベルは、第1のメディアコンテンツのラウドネスレベルにほぼ等しいものとすることができる。或いは、新たなラウドネスレベルは、第2のメディアコンテンツのラウドネスレベルと第1のメディアコンテンツのラウドネスレベルとの間のレベルとすることもできる。
第2のメディアコンテンツのラウドネスレベルを調整することは、オーディオ信号を復号した後に第2のメディアコンテンツのオーディオ信号を調整することを伴うことができる。例えば、再生修正モジュール246は、オーディオ信号を減衰させてラウドネスを低下させ、或いは逆にオーディオ信号を増幅させてラウドネスを高めることができる。再生修正モジュール246は、オーディオ信号のラウドネスを増幅させる場合、圧縮器を使用してオーディオ信号の最低点と最高点との間の差分を低減し、及び/又はリミッタを使用してすべてのピークが閾値を超えるのを防ぐことができる。本開示では、メディアコンテンツのラウドネスレベルを調整することが、メディアコンテンツのオーディオ音量レベルを調整することと同義である。従って、音量の調整は、必ずしもスペクトルの心理音響的重み付け(psychoacoustic weighting)を伴う必要はない。
いくつかの例では、再生修正モジュール246が、第1のメディアコンテンツのラウドネスレベルと第2のメディアコンテンツのラウドネスレベルとの差分が閾値条件を満たすと判定し、閾値条件を満たす差分に基づいて第2のメディアコンテンツのラウドネスを調整することができる。これとは逆に、この差分が閾値条件を満たさない場合、再生修正モジュール246は、第2のメディアコンテンツのラウドネスの調整をせず、メディアコンテンツ置換イベント中に第2のメディアコンテンツを提示することができる。この閾値条件は、例えば差分が閾値量よりも大きい状態とすることができる。
再生装置240は、第2のメディアコンテンツを提示する前に第2のメディアコンテンツのラウドネスを修正するか否かにかかわらず、メディアコンテンツ置換イベント中に、第2のメディアコンテンツに置換される第1のメディアコンテンツの部分のラウドネスを追跡することができる。再生装置240は、第1のメディアコンテンツのラウドネスレベルを追跡することによって、ユーザがトリガした音量調整を検出し、再生装置によって提示されている第2のメディアコンテンツに対する音量補正を実行することができる。このように、再生装置240にオーディオ信号を提供する装置を制御できるリモコン装置を使用してユーザが音量レベルを調整する場合、再生装置240は、メディアコンテンツ置換イベント中に再生装置240の音量の対応する調整を行うことができる。
オーディオ分析モジュール245は、再生装置240が第1のメディアコンテンツの音量レベルの変化を素早く検出して応答するのに役立つように、メディアコンテンツ置換イベント中に第1のメディアコンテンツの固定長部分のラウドネスレベルを決定することができる。これらの部分の長さは、メディアコンテンツ置換イベントが発生していない時(例えば、メディアコンテンツ置換イベントの前)にオーディオ分析モジュール245が分析する部分の長さよりも短くすることができる。一例として、メディアコンテンツ置換イベントが開始すると、オーディオ分析モジュール245は、第1のメディアコンテンツの30秒部分の分析から第1のメディアコンテンツの1秒部分、又は1秒よりも短い長さの部分の分析に切り替えることができる。
特定の例として、オーディオ分析モジュール245は、メディアコンテンツ置換イベントの前に第1のメディアコンテンツの30秒部分のラウドネスレベルを決定することができる。任意に、再生装置240は、必要であればこれらのラウドネスレベルを使用して、第2のメディアコンテンツに対して適切な全体的音量調整を実行することができる。その後、オーディオ分析モジュール245は、メディアコンテンツ置換イベント中に、第1のメディアコンテンツの第1、第2、第3及び第4の連続する1秒部分の第1、第2、第3及び第4のラウドネスレベルを決定することができる。オーディオ分析モジュール245は、例えばラウドネスメータを使用してこれらのラウドネスレベルを計算することができる。その後、オーディオ分析モジュール245は、メディアコンテンツ置換イベント中に決定されたラウドネスレベルのうちの1つ又は2つ以上を使用して、ユーザがトリガした音量調整が行われたかどうかを判定することができる。
オーディオ分析モジュール245は、ユーザがトリガした音量調整を様々な方法で検出することができる。1つの例として、オーディオ分析モジュール245は、第1のメディアコンテンツの所与の部分のラウドネスレベルが後続部分のラウドネスレベルと閾値量よりも大きい量だけ異なると判定することができる。後続部分は、所与の部分の直後の部分とすることができる。例えば、所与の部分は、第1のメディアコンテンツの時点T2~T3にわたることができ、後続部分は、第1のメディアコンテンツの時点T3~T4にわたることができ、所与の部分と後続部分とは同じ長さである。このようなシナリオでは、オーディオ分析モジュール245が再生装置240の目標音量を決定し、再生装置240が目標音量に向けて再生装置240の音量を調整できるようにすることもできる。
別の例として、オーディオ分析モジュール245は、ユーザがトリガした音量調整をニューラルネットワークを使用して検出することができる。例えば、ニューラルネットワークは、ユーザがトリガした音量調整を含むことが分かっているオーディオサンプルを使用して訓練することができる。ニューラルネットワークは、2又は3以上のラウドネスレベルを受け取るように構成された入力層と、ノードの複数の隠れ層と、出力層とを含むことができる。オーディオ分析モジュール245は、ニューラルネットワークに複数の連続ラウドネスレベルを入力として提供することができ、ニューラルネットワークは、入力ラウドネスレベルをユーザがトリガした音量調整の特徴、又はメディアコンテンツに固有の変動の特徴として分類するデータを出力層において出力することができる。
従って、オーディオ分析モジュール245は、ニューラルネットワークの出力を分析して、連続ラウドネスレベルがユーザによってトリガされた音量調整を示すか否かを判定することができる。オーディオ分析モジュール245は、ニューラルネットワークの出力がユーザによってトリガされた音量調整を示すと判定すると、適切な音量調整を決定することができる。例えば、オーディオ分析モジュール245は、連続ラウドネスレベルの傾向(例えば、時間の経過に伴うラウドネスの増加又は減少)を識別し、再生装置240の音量を調整する際に使用できるようにこの傾向を出力することができる。
或いは、オーディオ分析モジュール245は、第1のメディアコンテンツのラウドネスレベルと、第1のメディアコンテンツのラウドネスレベルプロファイルによって示される対応する基準ラウドネスレベルとを比較することによって、ユーザがトリガした音量調整を検出することもできる。メディアコンテンツ置換イベント中は、オーディオ分析モジュール245を、ラウドネスレベルプロファイル生成器214が第1のメディアコンテンツのラウドネスレベルプロファイルを生成するために使用した長さと同じ長さを有する時間間隔を使用して第1のメディアコンテンツのラウドネスレベルを決定するように構成することができる。一例として、ラウドネスレベルプロファイル生成器214によって使用される時間間隔は、1秒とすることができる。この実装では、オーディオ分析モジュール245を、再生装置240が第1のソースから第1のメディアコンテンツを受け取った時に第1のメディアコンテンツの1秒部分のラウドネスレベルを決定するように構成することができる。例えば、オーディオ分析モジュール245は、第1のメディアコンテンツの最近受け取られた部分(例えば、過去1秒)のラウドネスレベル(例えば、二乗平均平方根(RMS))を固定間隔ベースで計算することができる。
オーディオ分析モジュール245は、オーディオ分析モジュール245によって決定されたラウドネスレベルと、ラウドネスレベルプロファイルによって示されるラウドネスレベルとの間の比較を容易にするために、ラウドネスレベルプロファイルと、再生装置240が第1のソースから受け取っているオーディオ信号とを整列させることができる。オーディオ分析モジュール245は、この整列を様々な方法で実行することができる。1つの例では、オーディオ分析モジュール245が、フィンガープリント法を使用してラウドネスレベルプロファイルをオーディオ信号に整列させることができる。オーディオ分析モジュール245は、フィンガープリント法を使用してラウドネスレベルプロファイルを整列させるために、ラウドネスレベルプロファイルに対応する基準フィンガープリントを受け取り、基準フィンガープリントと第1のメディアコンテンツから取得されたクエリフィンガープリントとを比較することができる。第1のメディアコンテンツから取得された各クエリフィンガープリントは、関連するタイムスタンプを有することができる。オーディオ分析モジュール245は、基準フィンガープリントがクエリフィンガープリントのうちの1つに一致すると判定すると、クエリフィンガープリントに関連するタイムスタンプを使用して、ラウドネスレベルプロファイルと再生装置240が受け取っているオーディオ信号とを整列させることができる。例えば、オーディオ分析モジュール245は、基準フィンガープリントとクエリフィンガープリントとの一致を、ラウドネスレベルプロファイルの初期ラウドネスレベルがクエリフィンガープリントに関連するタイムスタンプに対応することを意味するものと解釈するように構成することができる。或いは、オーディオ分析モジュール245は、基準フィンガープリントとクエリフィンガープリントとの一致を、ラウドネスレベルプロファイルの初期ラウドネスレベルがクエリフィンガープリントに関連するタイムスタンプからオフセット量(例えば、タイムスタンプの1秒後、タイムスタンプの2秒後など)だけオフセットされた時間に対応することを意味するものと解釈するように構成することができる。
ラウドネスレベルプロファイルを整列させるために使用される基準フィンガープリントは、オーディオフィンガープリント又はビデオフィンガープリントとすることができる。再生装置240は、再生装置240にラウドネスレベルプロファイルを提供する視聴ステーション210などのコンピュータシステムから基準フィンガープリントを取得することができる。
オーディオ分析モジュール245は、同様の方法で透かしを使用して、再生装置240が受け取っているオーディオ信号にラウドネスレベルプロファイルを整列させることができる。オーディオ分析モジュール245は、透かしを使用してラウドネスレベルプロファイルを整列させるために、ラウドネスレベルプロファイルに対応する透かしを受け取ることができる。次に、オーディオ分析モジュール245は、第1のメディアコンテンツ内の特定の時点に透かしが存在することを検出することができる。さらに、オーディオ分析モジュール245は、特定の時点における透かしの検出を、ラウドネスレベルプロファイルの初期ラウドネスレベルが特定の時点に対応することを意味するものと解釈するように構成することができる。或いは、オーディオ分析モジュール245は、特定の時点における透かしの検出を、ラウドネスレベルプロファイルの初期ラウドネスレベルが特定の時点からオフセット量(例えば、特定の時間の1秒後、特定の時間の2秒後など)だけオフセットされた時点に対応することを意味するものと解釈するように構成することができる。
オーディオ分析モジュール245は、再生装置240が第1のソースから受け取っているオーディオ信号にラウドネスレベルプロファイルを整列させた後に、オーディオ分析モジュール245によって決定されたオーディオ信号のラウドネスレベルに対応するラウドネスレベルプロファイルから基準ラウドネスレベルを選択することができる。例えば、オーディオ分析モジュール245は、ラウドネスレベルプロファイルの初期ラウドネスレベルがオーディオ信号の時点T1に整列していると決定しておくことができる。さらに、オーディオ分析モジュール245は、時点T1の5秒後に発生する第1のメディアコンテンツの部分を使用して第1のメディアコンテンツのラウドネスレベルを決定したことに基づいて、初期ラウドネスレベルが対応する時点の5秒後の時点に対応するラウドネスプロファイルの基準ラウドネスレベルを選択することができる。
その後、オーディオ分析モジュール245は、ラウドネスレベルプロファイルから基準ラウドネスレベルを選択した後に、基準ラウドネスレベルと決定されたラウドネスレベルとを比較することができる。いくつかの例では、決定されたラウドネスレベル及び基準ラウドネスレベルを絶対尺度で指定することができる。他の例では、決定されたラウドネスレベル及び第2のラウドネスレベルをデシベルで指定することができる。第1のラウドネスレベル及び第2のラウドネスレベルは、K-weighting relative to full scale(LKFS)などの知覚的音量重み付けを含むことができる。
オーディオ分析モジュール245は、これらの2つのラウドネスレベル間の差分の結果に基づいて、再生装置240の目標音量を決定することができる。例えば、オーディオ分析モジュール245は、再生装置240のオーディオ信号のラウドネスレベルが、ラウドネスレベルプロファイルによって示される対応する基準ラウドネスレベルを第1の量だけ超えていると判定し、再生装置240の現在の音量と第1の量との合計(又は現在の音量と第1の量に比例する値との合計)に等しい音量を目標音量として決定することができる。これとは逆に、オーディオ分析モジュール245は、ラウドネスレベルプロファイルによって示される基準ラウドネスレベルが再生装置240のオーディオ信号のラウドネスレベルを第2の量だけ超えていると判定し、再生装置240の現在の音量と第2の量との差分(又は現在の音量と第2の量に比例する値との差分)に等しい音量を目標音量として決定することができる。
再生修正モジュール246は、再生装置240が第1のメディアコンテンツの代わりに第2のメディアコンテンツを提示している間に、再生装置240の音量を目標音量に向けて調整することができる。例えば、オーディオ分析モジュール245は、再生修正モジュール246に目標音量を提供することができ、再生修正モジュール246は、平滑化フィルタを使用して再生装置の音量を目標音量に向けて徐々に調整することができる。平滑化フィルタを使用すると、再生装置の音量を現在の音量から目標音量に1秒未満で(例えば、100ミリ秒のうちに)調整することができる。このように、再生修正モジュール246は、リモコン装置からメディア装置230に命令を送信することによってトリガされる音量調整などのユーザがトリガした音量調整を考慮するように再生装置240の音量を調整することができる。同様に、再生装置240は、メディアコンテンツ置換イベント中に、決定されたラウドネスレベルと基準ラウドネスレベルとの間の比較を引き続き行い、再生装置の音量の調整を引き続き実行することができる。
いくつかの例では、オーディオ分析モジュール245が、第1のメディアコンテンツのオーディオ信号が通常の時間よりも長時間にわたって(例えば、会話内容の小休止の長さよりも長く)急激かつ予想外に非常に小さくなり/ミュートされたことを検出ことができる。再生修正モジュール246は、このような休止の検出に基づいて、第2のメディアコンテンツのオーディオ信号をミュートすることができる。このように、メディアコンテンツ置換イベント中にユーザが(例えば、メディア装置230のリモコン装置を使用して)第1のメディアコンテンツをミュートした場合、再生装置240は、第1のメディアコンテンツの代わりに提示されている第2のメディアコンテンツをミュートすることもできる。
III.動作例
図5は、方法例500のフローチャートである。方法500は、再生装置240などの再生装置、又はより一般的にはコンピュータシステムによって実行することができる。方法500は、ブロック502において、再生装置が、第1のソースからの第1のメディアコンテンツを提示している間に、第1のメディアコンテンツの第1の部分の第1のラウドネスレベルを決定することを含む。第1の部分は、第1の長さを有する。方法500は、ブロック504において、再生装置が、第1のソースからの第1のメディアコンテンツを提示することから、第2のソースからの第2のメディアコンテンツを提示することに切り替えることを含む。方法500は、ブロック506において、再生装置が、切り替えたことに基づいて、第2のメディアコンテンツを提示している間に、第1のメディアコンテンツの第2の部分の第2のラウドネスレベルを決定することを含む。第2の部分は、第1の長さよりも短い第2の長さを有する。方法500は、ブロック508において、再生装置が、第2のメディアコンテンツを提示している間に、第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて再生装置の音量を調整することを含む。
IV.変形例
本開示において説明した動作及び/又は機能のいくつかは、特定のエンティティが実行するものとして説明したが、本開示において説明したエンティティなどのあらゆるエンティティが実行することができる。さらに、これらの動作及び/又は機能は特定の順序で記載しているが、記載した順序で実行する必要はない。しかしながら、いくつかの例では、これらの動作及び/又は機能を記載した順序で実行することが望ましい場合もある。さらに、各動作及び/又は機能は、他の動作及び/又は機能のうちの1つ又は2つ以上に応答して実行することができる。また、本開示に示す利点のうちの1つ又は2つ以上を達成するためにこれらの動作及び/又は機能を全て実行する必要はなく、従って全ての動作及び/又は機能が必要であるとは限らない。
本開示の1又は2以上の実施例に関連していくつかの変形例を説明したが、これらの変形例は、本開示の他の全ての実施例に適用することもできる。
本開示の選択例について説明したが、当業者にはこれらの例の変更及び置換が明らかであろう。以下の特許請求の範囲に記載する本発明の幅広い態様では、本発明から逸脱することなく他の修正、代用及び/又は変更も可能である。

Claims (20)

  1. 再生装置が、第1のソースからの第1のメディアコンテンツを提示している間に、前記第1のメディアコンテンツの第1の長さを有する第1の部分の第1のラウドネスレベルを決定することと、
    前記再生装置が、前記第1のソースからの前記第1のメディアコンテンツを提示することから、第2のソースからの第2のメディアコンテンツを提示することに切り替えることと、
    前記再生装置が、前記第2のソースからの前記第2のメディアコンテンツを提示している間に、前記第1のメディアコンテンツに対応するオーディオ信号を受け取ることと、
    前記再生装置が、前記切り替えたことに基づいて、前記第2のメディアコンテンツを提示している間に、前記第1のメディアコンテンツに対応する前記オーディオ信号を使用して、前記第1のメディアコンテンツの前記第1の長さよりも短い第2の長さを有する第2の部分の第2のラウドネスレベルを決定することと、
    前記再生装置が、前記第2のメディアコンテンツを提示している間に、前記第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて前記再生装置の音量を調整することと、
    を含むことを特徴とする方法。
  2. 前記第2のラウドネスレベルは、所与の部分のラウドネスレベル及び後続部分のラウドネスレベルを含み、前記方法は、前記所与の部分の前記ラウドネスレベルが前記後続部分の前記ラウドネスレベルと閾値量よりも大きい量だけ異なると判定することをさらに含み、前記再生装置の音量を調整することは、前記所与の部分の前記ラウドネスレベルと前記後続部分のラウドネスレベルとの間の差分に基づいて前記音量を調整することを含む、
    請求項1に記載の方法。
  3. 前記差分に基づいて目標音量を決定することをさらに含み、前記音量を調整することは、前記音量を前記目標音量に向けて調整することを含む、
    請求項2に記載の方法。
  4. 前記第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて前記音量を調整することは、
    前記第2のラウドネスベルの所与のラウドネスレベルと、前記第1のメディアコンテンツのラウドネスレベルプロファイルによって示される基準ラウドネスレベルとを比較することと、
    前記所与のラウドネスレベルと前記基準ラウドネスレベルとの間の差分に基づいて前記再生装置の目標音量レベルを決定することと、
    前記音量を前記目標音量レベルに向けて調整することと、
    を含む、請求項1に記載の方法。
  5. 前記ラウドネスレベルプロファイルは、前記第1のメディアコンテンツの部分のそれぞれのラウドネスレベルを含み、前記方法は、前記ラウドネスレベルプロファイルを、前記再生装置が受け取っている前記第1のメディアコンテンツと整列させることをさらに含む、
    請求項4に記載の方法。
  6. 前記第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて前記音量を調整することは、
    音量調整を含むオーディオサンプルを使用して訓練されたニューラルネットワークに、前記第2のラウドネスレベルを入力として提供することと、
    前記ニューラルネットワークの出力に基づいて、前記第1のメディアコンテンツの音量調整を検出することと、
    前記音量調整に基づいて前記音量を調整することと、
    を含む、請求項1に記載の方法。
  7. 前記第1のラウドネスレベルを決定することは、前記第1のラウドネスレベルの移動平均を決定することを含む、
    請求項1に記載の方法。
  8. チャンネル変更イベントを検出することと、
    前記チャンネル変更イベントの検出時に、前記第1のラウドネスレベルの前記移動平均をリセットすることと、
    をさらに含む、請求項7に記載の方法。
  9. 前記第2のメディアコンテンツのラウドネスレベルを決定することと、
    前記第1のラウドネスレベルと前記第2のメディアコンテンツの前記ラウドネスレベルとの間の差分に基づいて、前記第2のメディアコンテンツを提示する前に前記第2のメディアコンテンツの前記ラウドネスレベルを調整することと、
    をさらに含む、請求項1に記載の方法。
  10. 前記再生装置はテレビを含み、前記第2のメディアコンテンツを提示することは、メディアプレーヤを使用して置換広告を提示することを含む、
    請求項1に記載の方法。
  11. 前記第2のメディアコンテンツは、前記再生装置のローカルキャッシュに記憶され、前記方法は、前記第2のメディアコンテンツを提示する前に前記ローカルキャッシュから前記第2のメディアコンテンツを検索することをさらに含む、
    請求項1に記載の方法。
  12. プロセッサによる実行時に一連の動作を実行させるプログラム命令を記憶した非一時的コンピュータ可読媒体であって、前記一連の動作は、
    再生装置が第1のソースからの第1のメディアコンテンツを提示している間に、前記第1のメディアコンテンツの第1の長さを有する第1の部分の第1のラウドネスレベルを決定することと、
    前記第1のソースからの前記第1のメディアコンテンツを提示することから、第2のソースからの第2のメディアコンテンツを提示することに切り替えることと、
    前記再生装置が前記第2のソースからの前記第2のメディアコンテンツを提示している間に、前記第1のメディアコンテンツに対応するオーディオ信号を受け取ることと、
    前記切り替えたことに基づいて、前記再生装置が前記第2のメディアコンテンツを提示している間に、前記第1のメディアコンテンツに対応する前記オーディオ信号を使用して、前記第1のメディアコンテンツの前記第1の長さよりも短い第2の長さを有する第2の部分の第2のラウドネスレベルを決定することと、
    前記再生装置が前記第2のメディアコンテンツを提示している間に、前記第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて前記再生装置の音量を調整することと、を含む、ことを特徴とする非一時的コンピュータ可読媒体。
  13. 前記第2のラウドネスレベルは、所与の部分のラウドネスレベル及び後続部分のラウドネスレベルを含み、前記一連の動作は、前記所与の部分の前記ラウドネスレベルが前記後続部分の前記ラウドネスレベルと閾値量よりも大きい量だけ異なると判定することをさらに含み、前記再生装置の音量を調整することは、前記所与の部分の前記ラウドネスレベルと前記後続部分のラウドネスレベルとの間の差分に基づいて前記音量を調整することを含む、
    請求項12に記載の非一時的コンピュータ可読媒体。
  14. 前記第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて前記音量を調整することは、
    前記第2のラウドネスベルの所与のラウドネスレベルと、前記第1のメディアコンテンツのラウドネスレベルプロファイルによって示される基準ラウドネスレベルとを比較することと、
    前記所与のラウドネスレベルと前記基準ラウドネスレベルとの間の差分に基づいて前記再生装置の目標音量レベルを決定することと、
    前記音量を前記目標音量レベルに向けて調整することと、
    を含む、請求項12に記載の非一時的コンピュータ可読媒体。
  15. 前記再生装置はテレビを含み、前記第2のメディアコンテンツを提示することは、メディアプレーヤを使用して置換広告を提示することを含む、
    請求項12に記載の非一時的コンピュータ可読媒体。
  16. 前記第2のメディアコンテンツは、前記再生装置のローカルキャッシュに記憶され、前記一連の動作は、前記第2のメディアコンテンツを提示する前に前記ローカルキャッシュから前記第2のメディアコンテンツを検索することをさらに含む、
    請求項12に記載の非一時コンピュータ可読媒体。
  17. 一連の動作を実行するように構成されたコンピュータシステムであって、前記一連の動作は、
    再生装置が第1のソースからの第1のメディアコンテンツを提示している間に、前記第1のメディアコンテンツの第1の長さを有する第1の部分の第1のラウドネスレベルを決定することと、
    前記第1のソースからの前記第1のメディアコンテンツを提示することから、第2のソースからの第2のメディアコンテンツを提示することに切り替えることと、
    前記再生装置が前記第2のソースからの前記第2のメディアコンテンツを提示している間に、前記第1のメディアコンテンツに対応するオーディオ信号を受け取ることと、
    前記切り替えたことに基づいて、前記再生装置が前記第2のメディアコンテンツを提示している間に、前記第1のメディアコンテンツに対応する前記オーディオ信号を使用して、前記第1のメディアコンテンツの前記第1の長さよりも短い第2の長さを有する第2の部分の第2のラウドネスレベルを決定することと、
    前記再生装置が前記第2のメディアコンテンツを提示している間に、前記第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて前記再生装置の音量を調整することと、
    を含む、ことを特徴とするコンピュータシステム。
  18. 前記第2のラウドネスレベルは、所与の部分のラウドネスレベル及び後続部分のラウドネスレベルを含み、前記一連の動作は、前記所与の部分の前記ラウドネスレベルが前記後続部分の前記ラウドネスレベルと閾値量よりも大きい量だけ異なると判定することをさらに含み、前記再生装置の音量を調整することは、前記所与の部分の前記ラウドネスレベルと前記後続部分のラウドネスレベルとの間の差分に基づいて前記音量を調整することを含む、
    請求項17に記載のコンピュータシステム。
  19. 前記第2のラウドネスレベルのうちの1つ又は2つ以上に基づいて前記音量を調整することは、
    前記第2のラウドネスベルの所与のラウドネスレベルと、前記第1のメディアコンテンツのラウドネスレベルプロファイルによって示される基準ラウドネスレベルとを比較することと、
    前記所与のラウドネスレベルと前記基準ラウドネスレベルとの間の差分に基づいて前記再生装置の目標音量レベルを決定することと、
    前記音量を前記目標音量レベルに向けて調整することと、
    を含む、請求項17に記載のコンピュータシステム。
  20. 前記第2のメディアコンテンツは、前記再生装置のローカルキャッシュに記憶され、前記一連の動作は、前記第2のメディアコンテンツを提示する前に前記ローカルキャッシュから前記第2のメディアコンテンツを検索することをさらに含む、
    請求項17に記載のコンピュータシステム。
JP2021527816A 2018-11-16 2019-11-15 より短い時定数を使用した、メディア置換イベント中におけるラウドネスレベルのモニタリング Active JP7048825B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201862768596P 2018-11-16 2018-11-16
US62/768,596 2018-11-16
US201962861474P 2019-06-14 2019-06-14
US62/861,474 2019-06-14
US201962909676P 2019-10-02 2019-10-02
US62/909,676 2019-10-02
US16/684,514 2019-11-14
US16/684,514 US11042353B2 (en) 2018-11-16 2019-11-14 Monitoring loudness level during media replacement event using shorter time constant
PCT/US2019/061632 WO2020102632A1 (en) 2018-11-16 2019-11-15 Monitoring loudness level during media replacement event using shorter time constant

Publications (2)

Publication Number Publication Date
JP2022507766A JP2022507766A (ja) 2022-01-18
JP7048825B2 true JP7048825B2 (ja) 2022-04-05

Family

ID=70726334

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2021527817A Active JP7157878B2 (ja) 2018-11-16 2019-11-05 メディア置換イベント中におけるメディア再生ラウドネスレベルの検出及び対応するオーディオの調整
JP2021527818A Active JP7043683B2 (ja) 2018-11-16 2019-11-15 ラウドネスレベルプロファイルを使用した、メディア置換イベント中における音量調整の検出
JP2021527816A Active JP7048825B2 (ja) 2018-11-16 2019-11-15 より短い時定数を使用した、メディア置換イベント中におけるラウドネスレベルのモニタリング

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2021527817A Active JP7157878B2 (ja) 2018-11-16 2019-11-05 メディア置換イベント中におけるメディア再生ラウドネスレベルの検出及び対応するオーディオの調整
JP2021527818A Active JP7043683B2 (ja) 2018-11-16 2019-11-15 ラウドネスレベルプロファイルを使用した、メディア置換イベント中における音量調整の検出

Country Status (6)

Country Link
US (7) US11347470B2 (ja)
EP (2) EP3881556B1 (ja)
JP (3) JP7157878B2 (ja)
CN (1) CN113330750B (ja)
TW (3) TWI739211B (ja)
WO (3) WO2020101951A2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11347470B2 (en) 2018-11-16 2022-05-31 Roku, Inc. Detection of media playback loudness level and corresponding adjustment to audio during media replacement event
KR102707037B1 (ko) 2019-03-14 2024-09-19 가우디오랩 주식회사 라우드니스 레벨을 제어하는 오디오 신호 처리 방법 및 장치
KR102390643B1 (ko) * 2019-10-10 2022-04-27 가우디오랩 주식회사 오디오 라우드니스 메타데이터 생성 방법 및 이를 위한 장치
WO2022086196A1 (ko) * 2020-10-22 2022-04-28 가우디오랩 주식회사 기계 학습 모델을 이용하여 복수의 신호 성분을 포함하는 오디오 신호 처리 장치
US11750881B2 (en) * 2020-11-24 2023-09-05 Roku, Inc. Server-side matching of supplemental content audio to perceived audio by end-user
US11962870B2 (en) * 2021-02-17 2024-04-16 Roku, Inc. Content-modification system with quiet content detection feature
CN113365010B (zh) * 2021-06-07 2022-11-22 北京字节跳动网络技术有限公司 音量调节方法、装置、设备、存储介质
US11848655B1 (en) * 2021-09-15 2023-12-19 Amazon Technologies, Inc. Multi-channel volume level equalization based on user preferences
US11974012B1 (en) * 2023-11-03 2024-04-30 AVTech Select LLC Modifying audio and video content based on user input

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017169159A (ja) 2016-03-18 2017-09-21 ヤフー株式会社 決定装置、決定方法、決定プログラム
US20180234728A1 (en) 2017-02-10 2018-08-16 Samsung Electronics Co., Ltd. Display device and method for replacing advertisement

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822018A (en) 1996-04-02 1998-10-13 Farmer; James O. Method and apparatus for normalizing signal levels in a signal processing system
US6950623B2 (en) 2000-09-19 2005-09-27 Loudeye Corporation Methods and systems for dynamically serving in-stream advertisements
JP2003134419A (ja) * 2001-10-29 2003-05-09 Nippon Telegr & Teleph Corp <Ntt> コンテンツ再生装置、コンテンツ再生方法、コンピュータ・プログラム、情報記憶媒体
AU2003206429A1 (en) 2002-07-02 2004-01-22 John Christiansen System
US6873341B1 (en) 2002-11-04 2005-03-29 Silicon Image, Inc. Detection of video windows and graphics windows
JP2006166187A (ja) 2004-12-09 2006-06-22 Kenwood Corp 音源切り替え方法及び装置
JP4432858B2 (ja) * 2005-07-29 2010-03-17 ソニー株式会社 放送受信方法
US20070214103A1 (en) 2006-03-10 2007-09-13 Sbc Knowledge Ventures L.P. System and method for providing content over a communications network
DE602007011594D1 (de) 2006-04-27 2011-02-10 Dolby Lab Licensing Corp Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke
KR100938686B1 (ko) 2007-12-03 2010-01-25 김용호 방범 및 광고 기능을 가지는 자동차
CN102017402B (zh) 2007-12-21 2015-01-07 Dts有限责任公司 用于调节音频信号的感知响度的系统
WO2010138311A1 (en) * 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Equalization profiles for dynamic equalization of audio data
US8731216B1 (en) * 2010-10-15 2014-05-20 AARIS Enterprises, Inc. Audio normalization for digital video broadcasts
US8863165B2 (en) 2010-11-01 2014-10-14 Gracenote, Inc. Method and system for presenting additional content at a media system
US9535653B2 (en) 2012-08-31 2017-01-03 Google Inc. Adjusting audio volume of multimedia when switching between multiple multimedia content
KR101403884B1 (ko) * 2012-09-11 2014-06-09 안성룡 음량 자동 조절 장치
CN102946520B (zh) 2012-10-30 2016-12-21 深圳创维数字技术有限公司 一种自动控制频道音量的方法及数字电视终端
US10027303B2 (en) * 2012-11-13 2018-07-17 Snell Advanced Media Limited Management of broadcast audio loudness
US8813120B1 (en) * 2013-03-15 2014-08-19 Google Inc. Interstitial audio control
CN110675884B (zh) 2013-09-12 2023-08-08 杜比实验室特许公司 用于下混合音频内容的响度调整
CN103813184B (zh) 2013-12-13 2017-06-23 北京智谷睿拓技术服务有限公司 播放控制方法、播放控制系统、服务器和用户终端
US20150319506A1 (en) 2014-04-30 2015-11-05 Netflix, Inc. Displaying data associated with a program based on automatic recognition
FI20145493A (fi) * 2014-05-28 2015-11-29 Exaget Oy Sisällön lisääminen mediavirtaan
US10345999B2 (en) 2014-11-03 2019-07-09 Opentv, Inc. Media presentation modification using audio segment marking
US9647624B2 (en) 2014-12-31 2017-05-09 Stmicroelectronics Asia Pacific Pte Ltd. Adaptive loudness levelling method for digital audio signals in frequency domain
US10824385B2 (en) 2015-02-27 2020-11-03 Charter Communications Operating, Llc Automated audio volume stabilizer
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US9936156B2 (en) 2015-09-24 2018-04-03 Samantha WESTERN Volume adjusting apparatus and method
US9858036B2 (en) * 2015-11-10 2018-01-02 Google Llc Automatic audio level adjustment during media item presentation
WO2017106695A2 (en) * 2015-12-16 2017-06-22 Gracenote, Inc. Dynamic video overlays
US10187689B2 (en) 2017-03-16 2019-01-22 The Directv Group, Inc Dynamic advertisement insertion
CN107633850A (zh) 2017-10-10 2018-01-26 维沃移动通信有限公司 一种音量调节方法及电子设备
KR101986905B1 (ko) 2017-10-31 2019-06-07 전자부품연구원 신호 분석 및 딥 러닝 기반의 오디오 음량 제어 방법 및 시스템
US10509558B2 (en) 2017-12-08 2019-12-17 Spotify Ab System and method for enabling advertisement interaction with an electronic device
US10389323B2 (en) * 2017-12-18 2019-08-20 Tls Corp. Context-aware loudness control
KR102510899B1 (ko) * 2018-01-07 2023-03-16 그레이스노트, 인코포레이티드 볼륨 조절을 위한 방법 및 장치
US11347470B2 (en) 2018-11-16 2022-05-31 Roku, Inc. Detection of media playback loudness level and corresponding adjustment to audio during media replacement event

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017169159A (ja) 2016-03-18 2017-09-21 ヤフー株式会社 決定装置、決定方法、決定プログラム
US20180234728A1 (en) 2017-02-10 2018-08-16 Samsung Electronics Co., Ltd. Display device and method for replacing advertisement

Also Published As

Publication number Publication date
US11042353B2 (en) 2021-06-22
US11556304B2 (en) 2023-01-17
US20200159489A1 (en) 2020-05-21
WO2020101951A2 (en) 2020-05-22
EP3881556A4 (en) 2022-08-17
US11372617B2 (en) 2022-06-28
WO2020102633A1 (en) 2020-05-22
WO2020102632A1 (en) 2020-05-22
US20200162049A1 (en) 2020-05-21
US11740860B2 (en) 2023-08-29
TWI786556B (zh) 2022-12-11
US20210311697A1 (en) 2021-10-07
TWI723633B (zh) 2021-04-01
US11347470B2 (en) 2022-05-31
US11748055B2 (en) 2023-09-05
JP2022507766A (ja) 2022-01-18
EP4250563A3 (en) 2023-11-29
EP3881556A1 (en) 2021-09-22
TW202123719A (zh) 2021-06-16
CN113330750A (zh) 2021-08-31
CN113330750B (zh) 2022-11-11
JP2022507767A (ja) 2022-01-18
EP4250563A2 (en) 2023-09-27
US20220253275A1 (en) 2022-08-11
US20210271448A1 (en) 2021-09-02
JP7043683B2 (ja) 2022-03-29
TW202034705A (zh) 2020-09-16
JP2022507768A (ja) 2022-01-18
US20200162048A1 (en) 2020-05-21
EP3881556B1 (en) 2023-09-13
TW202027513A (zh) 2020-07-16
JP7157878B2 (ja) 2022-10-20
WO2020101951A3 (en) 2021-01-21
TWI739211B (zh) 2021-09-11
US20220276831A1 (en) 2022-09-01
US11068232B2 (en) 2021-07-20

Similar Documents

Publication Publication Date Title
JP7048825B2 (ja) より短い時定数を使用した、メディア置換イベント中におけるラウドネスレベルのモニタリング
US11432037B2 (en) Method and system for detecting and responding to changing of media channel
US11317144B2 (en) Detection of mute and compensation therefor during media replacement event

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210716

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210716

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220324

R150 Certificate of patent or registration of utility model

Ref document number: 7048825

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150