JP7196294B2

JP7196294B2 - オーディオ特性の解析に基づいてオーディオ再生設定を調節するための方法及び装置

Info

Publication number: JP7196294B2
Application number: JP2021522530A
Authority: JP
Inventors: ロバートクーバー，; キャメロンオーブリーサマーズ，; トッドホッジズ，; ジョゼフレナー，; マーカスクレーマー，; マシューマッカラム，; ウォーレンマンズフィールド，
Original assignee: グレースノートインコーポレイテッド
Priority date: 2018-10-24
Filing date: 2019-10-23
Publication date: 2022-12-26
Anticipated expiration: 2039-10-23
Also published as: EP3871217A4; JP2022505850A; EP3871217A1; US11792481B2; US20240056635A1; JP2023051951A; KR20230003293A; US20200133622A1; US20210194448A1; US11223340B2; US20200133624A1; US20200133623A1; US20200136580A1; KR102477001B1; US10998872B2; US11218125B2; US20230308718A1; WO2020086771A1; US11611800B2; KR20210129032A

Description

[0002]本開示は、一般にはオーディオ再生設定に関し、より詳細には、オーディオ特性の解析に基づいてオーディオ再生設定を調節するための方法及び装置に関する。

関連出願

[0001]本特許は、２０１８年１０月２４日に出願された米国特許仮出願第６２／７５０，１１３号、２０１９年３月１１日に出願された米国特許仮出願第６２／８１６，８１３号、２０１９年３月１１日に出願された米国特許仮出願第６２／８１６，８２３号及び２０１９年５月２０日に出願された米国特許仮出願第６２／８５０，５２８号の特典を主張する出願から生じるものである。米国特許仮出願第６２／７５０，１１３号、米国特許仮出願第６２／８１６，８１３号、米国特許仮出願第６２／８１６，８２３号及び米国特許仮出願第６２／８５０，５２８号は、参照によりその全体が本明細書に組み込まれる。米国特許仮出願第６２／７５０，１１３号、米国特許仮出願第６２／８１６，８１３号、米国特許仮出願第６２／８１６，８２３号、米国特許仮出願第６２／８５０，５２８号の優先権が本明細書によって主張される。

[0003]近年、様々な特性の多数のメディアが、ますます多くのチャネルを使用して配信されている。メディアは、従来のチャネル（たとえば、ラジオ、携帯電話など）を使用して、又はインターネット接続されたストリーミングデバイスを使用するなど、最近開発されたチャネルを使用して受信することができる。これらのチャネルが開発されるにつれて、複数のソースからのオーディオを処理し、出力することのできるシステムも開発されてきた。これらのオーディオ信号は様々な特性（たとえば、ダイナミックレンジ、音量など）を有することがある。たとえば、ある自動車メディアシステムは、コンパクトディスク（ＣＤ）、ブルートゥース（Ｂｌｕｅｔｏｏｔｈ）（登録商標）接続デバイス、ユニバーサルシリアルバス（ＵＳＢ）接続デバイス、Ｗｉ－Ｆｉ接続デバイス、補助入力及び他のソースからメディアを配信することができる。

メディア特性のリアルタイム解析に基づく動的再生設定調節のための本開示の教示に従って構築された例示的環境を示すブロック図である。本開示の教示の少なくとも第１の実装、第２の実装及び第３の実装によるオーディオ等化のための技法を実施するための、図１のメディアユニットの追加の詳細を示すブロック図である。第２の実装による、図１のコンテンツプロファイルエンジンの追加の詳細を示すブロック図である。図１のオーディオ等化（ＥＱ）エンジンの追加の詳細を示すブロック図である。第１の実装による、メディア特性のリアルタイム解析に基づいてメディア再生設定を動的に調節するように図１及び２のメディアユニットを実装するために実行することのできる例示的機械可読命令を表すフローチャートである。等化設定をパーソナライズするように図１及び２のメディアユニット１０６を実装するために実行することのできる例示的機械可読命令を表すフローチャートである。第１の実装による、ＥＱニューラルネットワークをトレーニングするようにオーディオＥＱエンジンを実装するために実行することのできる例示的機械可読命令を表すフローチャートである。第１の実装による、オーディオ特性のリアルタイム解析に基づく動的オーディオ再生設定調節を受けたが、平滑化フィルタを用いていないオーディオ信号の第１のスペクトログラムである。図８Ａの第１のスペクトログラムについての周波数値に対する平均利得値を示すプロットである。第１の実装による、平滑化フィルタを含む、オーディオ特性のリアルタイム解析に基づく動的オーディオ再生設定調節を受けたオーディオ信号の第２のスペクトログラムである。図９Ａの第２のスペクトログラムの周波数値に対する平均利得値を示すプロットである。第２の実装による、再生デバイスにコンテンツのストリームと共にプロファイル情報を配信するように図１及び３のコンテンツプロファイルエンジンを実装するために実行することのできる例示的機械可読命令を表すフローチャートである。第２の実装による、修正後再生設定を使用してコンテンツを再生するように図１及び２のメディアユニットを実装するために実行することのできる例示的機械可読命令を表すフローチャートである。第２の実装による、コンテンツに関連付けられるプロファイル情報に基づいて再生設定を調節するように図１及び２のメディアユニットを実装するために実行することのできる例示的機械可読命令を表すフローチャートである。本開示の教示による例示的コンテンツプロファイルのブロック図である。本開示の教示による例示的コンテンツプロファイルのブロック図である。第３の実装による、リアルタイムオーディオ等化を実施するように図１及び２のメディアユニットを実装するために実行することのできる機械可読命令を表すフローチャートである。第３の実装による、等化曲線を平滑化するように図１及び２のメディアユニットを実装するために実行することのできる機械可読命令を表すフローチャートである。第３の実装による、データセットを集めて、基準オーディオ信号に基づいてニューラルネットワークをトレーニング及び／又は確認するように図１及び４のオーディオＥＱエンジンを実装するために実行することのできる機械可読命令を表すフローチャートである。図１５に関連して示され、説明される平滑化技法を実施する前の等化後オーディオ信号の例示的表現である。第３の実装による、図１５に関連して示され、説明される平滑化技法を実施した後の図１７Ａのオーディオ信号の例示的表現である。図１及び２のメディアユニットを実装するために図５、６、１１、１２、１４及び１５の命令を実行するように構築された例示的な第１の処理プラットフォームのブロック図である。図１及び４のオーディオＥＱエンジンを実装するために図７及び１６の命令を実行するための例示的な第２の処理プラットフォーム構造のブロック図である。図１及び３のコンテンツプロファイルエンジンを実装するために図１０の命令を実行するための例示的な第２の処理プラットフォーム構造のブロック図である。

[0027]一般には、図面（複数可）及び添付の明細書全体にわたって、同一又は類似の部分を参照するために同一の参照番号が使用される。

[0028]従来のメディア処理実装では、異なるメディアに関連付けられるオーディオ信号は、異なる特性を有することがある。たとえば、異なるオーディオトラックは、異なる周波数プロファイル（たとえば、オーディオ信号の異なる周波数での様々な音量レベル）、異なる全音量（たとえば、平均音量）、ピッチ、音色などを有することがある。たとえば、あるＣＤのメディアは、別のＣＤのメディアとは異なって記録及び／又はマスタリングされることがある。同様に、ストリーミングデバイスから検索されたメディアは、ＣＤなどの非圧縮媒体から検索されたメディアとは著しく異なるオーディオ特性を有することがあり、異なるアプリケーション及び／又はオーディオ圧縮レベルを介して同一のデバイスから検索されたメディアとも異なることがある。ユーザが様々な異なるソース並びに様々なジャンル及びタイプのメディアをますます聴取するにつれて、ソース間のオーディオ特性の違い、及び同一のソースのメディア間のオーディオ特性の違いが非常に顕著になることがあり、潜在的には聴取者にとっていらいらさせられるものとなることがある。オーディオ等化は、オーディオ信号中の異なる周波数の音量レベルを調節するために利用される技法である。たとえば、音楽のジャンル、音楽の年代、ユーザプリファレンス、オーディオ信号が出力される空間などに関連付けられるプリファレンスに基づいて、低周波数信号、中間周波数信号及び／又は高周波数信号の存在を増大させるために等化を実施することができる。しかしながら、最適な、又は好ましい等化設定は、提示されているメディアに応じて変動することがある。したがって、聴取者は、メディアの変化（たとえば、ジャンルの変化、年代の変化、トラックの全音量の変化など）に基づいて聴取体験を最適化するために等化設定を頻繁に調節する必要があることがある。

[0029]いくつかの従来の手法では、特定のジャンル又はタイプの音楽に関連付けられる等化設定を選択することができる。たとえば、車両のメディアユニットでは、ロック音楽の典型的特性に基づいて、大きく聞こえることをユーザが望むことがある周波数をブーストし、非常に強いことがある他の周波数をカットするように構成される「ロック」用のイコライザを聴取者が選択できることがある。しかしながら、そのようなジャンル特有の広く適用される等化設定は、異なる歌の間の著しい違いに対処することができず、さらに、ラジオ局及びオーディオストリーミングアプリケーションでしばしば生じる、ユーザが異なるジャンルの新しいトラックを開始するときに、ユーザが等化設定を手動で変更することを依然として必要とする。

[0030]第１の実装では、本明細書で開示される例示的方法、装置、システム及び製造品が、オーディオ信号のリアルタイム特性に基づいて、オーディオ再生設定（たとえば、等化設定、音量設定など）を動的に調節する。本明細書で開示される例は、オーディオ信号のサンプル（たとえば、３秒のサンプル）の周波数表現（たとえば、ＣＱＴ表現）を決定し、ニューラルネットワークに照会して、オーディオ信号に特有の等化設定を決定する。本明細書で開示されるいくつかの例では、等化設定は、複数のフィルタ（たとえば、低シェルフフィルタ、ピーキングフィルタ、高シェルフフィルタなど）を含み、そのうちの１つ又は複数を選択し、オーディオ信号に適用することができる。本明細書で開示される例示的方法、装置、システム及び製造品では、等化設定を出力するニューラルネットワークが、メディアに対して最適化される（たとえば、オーディオエンジニアによって決定される）複数の等化プロファイルに対応する基準メディアのライブラリを使用してトレーニングされる。

[0031]第１の実装では、本明細書で開示される例示的方法、装置、システム及び製造品が、定期的に（たとえば、毎秒）ニューラルネットワークに対して（たとえば、３秒のオーディオを含む）オーディオサンプルを照会して、プロファイルについての等化設定を決定し、経時的なオーディオ信号の変化（たとえば、異なる特性を有するトラックの異なる部分、曲の遷移、ジャンルの遷移など）を補償する。本明細書で開示される例示的方法、装置、システム及び製造品は、フィルタ設定間を遷移するために平滑化フィルタ（たとえば、指数平滑化アルゴリズム、一極巡回型平滑化フィルタなど）を利用して、等化設定の知覚できる変化を回避する。

[0032]さらに、前処理されたプロファイル情報を使用してコンテンツの再生を修正するための例示的方法、システム及び製造品が、第２の実装に従って説明される。例示的方法、システム及び製造品は、再生デバイスに配信すべきコンテンツのストリームにアクセスし、再生デバイスに配信すべきコンテンツのストリーム内の１つのコンテンツを特定し、特定した１つのコンテンツについてのプロファイルを決定し、決定したプロファイルを再生デバイスに配信する。これらの動作を自動的に（たとえば、リアルタイムに）オンザフライで実施することができる。

[0033]第２の実装では、例示的方法、システム及び製造品は、再生デバイスでコンテンツのストリームを受信し、コンテンツのストリームに関連付けられるプロファイル情報にアクセスし、アクセスしたプロファイル情報に基づいてコンテンツのストリームの再生を修正する。たとえば、例示的方法、システム及び製造品は、オーディオストリームに割り当てられたムード又は他の特性を特定するプロファイル情報と共にオーディオストリームを受信及び／又はアクセスし、プロファイル情報に基づいて再生デバイスの再生設定（たとえば、等化設定）を修正する。

[0034]したがって、第２の実装では、例示的方法、システム及び製造品は、コンテンツプロバイダによって供給されるコンテンツストリームを前処理して、コンテンツストリームについてのプロファイルを決定し、プロファイルを再生デバイスに配信することができ、再生デバイスは、とりわけ調節、修正及び／又は最適化された再生体験と共にコンテンツストリームを再生することができる。

[0035]第３の実装では、本明細書で開示される例示的方法、装置、システム及び製造品が、ユーザ入力又は調節を必要とすることなく、（たとえば、記憶デバイス、ラジオ、ストリーミングサービスなどからの）着信オーディオ信号を解析及び等化する。本明細書で開示される技法は、着信オーディオ信号を解析して、複数の周波数範囲についてのバッファ期間中の平均音量値と、複数の周波数範囲についてのバッファ期間中の標準偏差値と、着信オーディオ信号のエネルギーとを決定する。バッファ期間にわたる平均周波数値を利用することにより、適用する等化曲線を決定するときに着信オーディオ信号の突然の短期変化が平滑化され、以て等化設定の急激な変化が回避される。

[0036]第３の実装では、本明細書で開示される例示的方法、装置、システム及び製造品は、複数の周波数範囲についてのバッファ期間中の平均音量値及び／又は複数の周波数範囲についてのバッファ期間中の標準偏差値を含む入力特徴セットを生成し、入力特徴セットをニューラルネットワークに入力する。本明細書で開示される例示的方法、装置、システム及び製造品は、オーディオエンジニアによって生成された複数の基準オーディオ信号及び複数の等化曲線に関してトレーニングされたニューラルネットワークを利用する。いくつかの例では、基準オーディオ信号及び対応する等化曲線は、等化曲線を生成した特定のオーディオエンジニアの指示でタグ付けされ（たとえば、指示に関連付けられ）、異なるオーディオエンジニアの異なる等化スタイル及びプリファレンスをニューラルネットワークが学習することが可能となる。本明細書で開示される例示的方法、装置、システム及び製造品は、特定の周波数範囲に対応する利得／カット（たとえば、音量調節）をニューラルネットワークから受け取る。いくつかの例では、利得／カットが着信オーディオ信号の周波数表現に適用され、次いで等化後周波数表現が解析され、何らかの異常（たとえば、周波数にわたる音量レベルの鋭いスパイク又はディップ）があるかどうかが判定される。

[0037]第３の実装によれば、本明細書で開示される例示的方法、装置、システム及び製造品は、しきい値処理技法を利用して、オーディオ信号に適用すべき等化曲線（たとえば、複数の周波数範囲についての利得／カット）を確定する前に、等化後オーディオ信号の異常を除去する。いくつかの例では、しきい値処理技法は、隣り合う周波数値（たとえば、３つ以上の隣り合う周波数値）のセットを解析し、（たとえば、周波数範囲にわたって２次導関数を計算することによって決定される）これらの隣り合う周波数値間の音量の違いが、ニューラルネットワークからのＥＱ利得／カット２４１が適用されるときにしきい値を超えるかどうかを判定する。いくつかの例では、隣り合う周波数値間の音量の違いがしきい値を超えると判定したことに応答して、周波数値のうちの中心値に対応する音量を、隣り合う周波数値での音量レベル間の中点に調節することができ、以て等化後オーディオ信号の周波数表現のスパイク又はディップを除去する。この調節は、スペクトルエンベロープにわたるディップ及びピーク（たとえば、局所的異常値）を有するＥＱ曲線と比べたとき、より心地よいＥＱ曲線の主観的効果を有する。

[0038]第３の実装では、本明細書で開示される例示的方法、装置、システム及び製造品は、着信オーディオ信号についてのエネルギー値（たとえば、ＲＭＳ値）と、等化曲線が着信オーディオ信号の表現に適用された後のエネルギー値とを測定して、等化の前後の全音量を正規化するように試みる。たとえば、オーディオ信号に適用されている等化曲線が、音量をカットする周波数範囲よりも多くの周波数範囲で音量をブーストする場合、等化後オーディオ信号の全エネルギーがより高くなることがある。そのようないくつかの例では、等化後オーディオ信号に対して音量正規化を実施して、着信オーディオ信号と等化後オーディオ信号との間の顕著な音量変化を除去することができる。

[0039]第３の実装では、本明細書で開示される例示的方法、装置、システム及び製造品は、着信オーディオ信号を供給するソース（たとえば、ラジオ、モバイルデバイスに記憶されたメディア、コンパクトディスクなど）の変化、又は着信オーディオ信号で表されるメディアの特性（たとえば、ジャンル、年代、ムードなど）の変化を補償するように等化設定を動的に調節することによってオーディオ等化技法を改善する。本明細書で開示される例示的技法は、エキスパートオーディオエンジニアによって等化されたオーディオ信号に関してインテリジェントにトレーニングされたニューラルネットワークを利用して、ニューラルネットワークが様々なオーディオエンジニアからプリファレンス及びスキルを学習することを可能にする。本明細書で開示される例示的技法は、しきい値処理技法を実施することにより、ニューラルネットワークによってもたらされる等化調節をさらに改善して、最終的等化曲線が滑らかであり、隣り合う周波数範囲間の大きな音量差を有さないことを保証する。

[0040]図１は、メディア特性のリアルタイム解析に基づく動的再生設定調節のための本開示の教示に従って構築された例示的環境１００を示すブロック図である。例示的環境１００は、メディアユニット１０６にオーディオ信号を送信するメディアデバイス１０２、１０４を含む。メディアユニット１０６は、オーディオ信号を処理して（たとえば、本明細書で開示されるオーディオ等化技法を実施して）、オーディオ増幅器１０８に信号を送り、その後で、オーディオ増幅器１０８は、出力デバイス１１０を介して、提示すべき増幅後オーディオ信号を出力する。

[0041]図１の例では、メディアデバイス１０２、１０４及び／又はメディアユニット１０６は、オーディオコンテンツ及び／又はビデオコンテンツなどの様々なタイプのマルチメディアコンテンツを供給する例示的コンテンツプロバイダ１１４又はコンテンツソース（たとえば、放送局、ネットワーク、ウェブサイトなど）と、インターネットなどのネットワーク１１２を介して通信する。例示的コンテンツプロバイダ１１４は、地上又は衛星ラジオ局、オンライン音楽サービス、オンラインビデオサービス、テレビジョン放送局及び／又は配給業者、ネットワーク化コンピューティングデバイス（たとえば、ネットワーク上のモバイルデバイス）、ローカルオーディオ又は音楽アプリケーションなどを含むことができる。任意のソースからコンテンツ（たとえば、オーディオ及び／又はビデオコンテンツ）を取得できることに留意されたい。たとえば、「コンテンツソース」という用語は、ユーザ及び他のコンテンツ所有者（アーティスト、ラベル、映画スタジオなど）を含むものとする。いくつかの例では、コンテンツソースは、ユーチューブ（ＹｏｕＴｕｂｅ）（商標）などの公にアクセス可能なウェブサイトである。

[0042]いくつかの例では、ネットワーク１１２は、コンテンツプロバイダ１１４、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６及び／又は他のネットワーク化デバイスの間の通信を可能にする任意のネットワーク又は通信媒体でよい。例示的ネットワーク１１２は、ワイヤードネットワーク、ワイヤレスネットワーク（たとえば、モバイルネットワーク）、無線又は遠隔通信ネットワーク、衛星ネットワークなどでよく、又はそれらを含むことができる。たとえば、ネットワーク１１２は、プライベートネットワーク（たとえば、ケーブルテレビジョンネットワーク又は衛星ラジオネットワーク）、公衆ネットワーク（たとえば、無線ブロードキャストチャネル又はインターネット）などを構成する１つ又は複数の部分を含むことができる。

[0043]図１の図示される例の例示的メディアデバイス１０２は、ポータブルメディアプレーヤ（たとえば、ＭＰ３プレーヤ）である。例示的メディアデバイス１０２は、コンテンツプロバイダ１１４からのメディアに対応するオーディオ信号及び／又はビデオ信号を記憶又は受信する。たとえば、メディアデバイス１０２は、ネットワーク１１２を介してコンテンツプロバイダ１１４からオーディオ信号及び／又はビデオ信号を受信することができる。例示的メディアデバイス１０２は、他のデバイスにオーディオ信号を送信することができる。図１の図示される例では、メディアデバイス１０２は、補助ケーブルを介してメディアユニット１０６にオーディオ信号を送信する。いくつかの例では、メディアデバイス１０２は、任意の他のインターフェースを介してメディアユニット１０６にオーディオ信号を送信することができる。いくつかの例では、メディアデバイス１０２とメディアユニット１０６は同一のデバイスでよい（たとえば、メディアユニット１０６は、モバイルデバイスに対して提示されているオーディオに関して本明細書で開示されるオーディオ等化技法を実施することのできるモバイルデバイスでよい）。

[0044]図１の図示される例の例示的メディアデバイス１０４は、モバイルデバイス（たとえば、セルフォン）である。例示的メディアデバイス１０４は、メディアに対応するオーディオ信号を記憶又は受信し、他のデバイスにオーディオ信号を送信することができる。図１の図示される例では、メディアデバイス１０４は、メディアユニット１０６にオーディオ信号をワイヤレスに送信する。いくつかの例では、メディアデバイス１０４は、Ｗｉ－Ｆｉ、ブルートゥース（登録商標）及び／又は任意の他の技術を使用して、メディアユニット１０６にオーディオ信号を送信することができる。いくつかの例では、メディアデバイス１０４は、車両内で提示されるメディアを聴取者が選択するための車両の構成要素又は他のデバイスと対話することができる。メディアデバイス１０２、１０４は、オーディオ信号を記憶及び／又はアクセスすることのできる任意のデバイスでよい。いくつかの例では、メディアデバイス１０２、１０４は車両と一体である（たとえば、ＣＤプレーヤ、ラジオなど）。

[0045]図１の図示される例の例示的メディアユニット１０６は、オーディオ信号を受信して処理することができる。図１の図示される例では、例示的メディアユニット１０６は、メディアデバイス１０２、１０４からメディア信号を受信して処理し、本明細書で開示されるオーディオ等化技法を実施する。例示的メディアユニット１０６は、出力デバイス１１０によって出力されているオーディオを監視して、オーディオセグメントの平均音量レベル、オーディオ特性（たとえば、周波数、振幅、時間値など）をリアルタイムに決定することができる。いくつかの例では、例示的メディアユニット１０６はソフトウェアとして実装され、直接接続（たとえば、ワイヤード接続）を通じて利用可能な、又はネットワークを通じて利用可能な（たとえば、クラウド上で利用可能な）、別のデバイスの部分として含まれる。いくつかの例では、例示的メディアユニット１０６をオーディオ増幅器１０８及び出力デバイス１１０と共に組み込むことができ、オーディオ信号の処理後にオーディオ信号を例示的メディアユニット１０６自体で出力することができる。

[0046]いくつかの例では、メディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６は、ネットワーク１１２を介してコンテンツプロバイダ１１４及び／又はコンテンツプロファイルエンジン１１６と通信することができる。追加又は代替の例では、メディアデバイス１０２及び／又はメディアデバイス１０４は、オーディオ又はビデオコンテンツのストリームを受信して、ストリームを処理し、メディアデバイス１０２及び／又はメディアデバイス１０４のディスプレイで使用可能な情報（たとえば、デジタル又はアナログ）を出力し、メディアデバイス１０２及び／又はメディアデバイス１０４に関連付けられるユーザにオーディオ又はビデオコンテンツを提示又は再生することによってオーディオ又はビデオコンテンツのストリームを再生するように構成された同調器を含むことができる。メディアデバイス１０２及び／又はメディアデバイス１０４は、コンテンツの処理されたストリーム及び／又は関連するメタデータを表示するように構成されたディスプレイ又は他のユーザインターフェースも含むことができる。ディスプレイは、フラットパネル画面、プラズマ画面、発光ダイオード（ＬＥＤ）画面、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プロジェクタなどでよい。

[0047]いくつかの例では、コンテンツプロバイダ１１４、コンテンツプロファイルエンジン１１６、メディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６は、コンテンツプロバイダ１１４によって送信又はブロードキャストされているコンテンツ、並びに／或いはメディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６によって受信又はアクセスされているコンテンツについての識別子を生成するように構成された１つ又は複数のフィンガープリントジェネレータ（ｆｉｎｇｅｒｐｒｉｎｔｇｅｎｅｒａｔｏｒ）１１５を含むことができる。たとえば、フィンガープリントジェネレータ１１５は、とりわけ、受信されたコンテンツの基準フィンガープリント又は他の識別子を生成するように構成された基準フィンガープリントジェネレータ（たとえば、コンテンツの一部からハッシュ値を計算する構成要素）を含むことができる。

[0048]いくつかの例では、メディアデバイス１０２及び／又はメディアデバイス１０４によって再生されるコンテンツの再生体験を修正するようにメディアユニット１０６を構成することができる。たとえば、メディアユニット１０６は、コンテンツのストリームに関連付けられるプロファイルにアクセスし、プロファイルを利用して、コンテンツの再生のための品質又は特性に関連付けられる様々な再生設定（たとえば、等化設定）を修正、調節及び／又は制御することができる。コンテンツがビデオ又は他の視覚的コンテンツである場合の一例では、再生設定は、カラーパレット設定、カラーレイアウト設定、輝度設定、フォント設定、アートワーク設定などを含むことができる。

[0049]図１の図示される例の例示的オーディオ増幅器１０８は、メディアユニット１０６によって処理（たとえば、等化）されているオーディオ信号を受信することができ、出力デバイス１１０への出力についての適切な再生設定調節（たとえば、オーディオ信号の特定の帯域の増幅、ユーザ入力に基づく音量調節など）を実施することのできるデバイスである。いくつかの例では、オーディオ増幅器１０８を出力デバイス１１０に組み込むことができる。いくつかの例では、オーディオ増幅器１０８は、メディアユニット１０６からの増幅出力値に基づいてオーディオ信号を増幅する。いくつかの例では、オーディオ増幅器１０８は、聴取者（たとえば、音量セレクタを調節する車両内の乗客又はドライバ）からの入力に基づいてオーディオ信号を増幅する。追加又は代替の例では、オーディオが、増幅器に通信されるのではなく、メディアユニット１０６から直接出力される。

[0050]図１の図示される例の例示的出力デバイス１１０はスピーカである。いくつかの例では、出力デバイス１１０は、複数のスピーカ、ヘッドフォン、又は聴取者にオーディオ信号を提示することのできる任意の他のデバイスでよい。いくつかの例では、出力デバイス１１０は、視覚的要素も出力できることがある（たとえば、スピーカ付きテレビジョン）。いくつかの例では、出力デバイス１１０をメディアユニット１０６に一体化することができる。たとえば、メディアユニット１０６がモバイルデバイスである場合、出力デバイス１１０は、モバイルデバイスに一体化され、或いは（たとえば、ブルートゥース（登録商標）、補助ケーブルなどを介して）モバイルデバイスに接続されたスピーカでよい。いくつかのそのような例では、出力デバイス１１０は、モバイルデバイスに接続されたヘッドフォンでよい。

[0051]いくつかの例では、コンテンツプロファイルエンジン１１６は、ネットワーク１１２を介して、コンテンツプロバイダ１１４によって供給されるコンテンツのストリームにアクセスし、様々なプロセスを実施して、コンテンツのストリームについてのプロファイル又はプロファイル情報を決定、生成及び／又は選択することができる。たとえば、コンテンツプロファイルエンジン１１６は、（たとえば、オーディオ又はビデオフィンガープリント比較を使用して）コンテンツのストリームを特定し、特定したコンテンツのストリームについてのプロファイルを決定することができる。コンテンツプロファイルエンジン１１６は、メディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６にプロファイルを配信することができ、メディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６は、コンテンツのストリームと共にプロファイルを受信し、とりわけ、受信したプロファイル内の情報に基づいて関連付け及び／又は選択される一定の再生設定を使用してコンテンツのストリームを再生する。

[0052]図１の例では、環境は、メディアユニット１０６による使用のためのトレーニング済みモデルを提供することのできるオーディオＥＱエンジン１１８を含む。いくつかの例では、トレーニング済みモデルはオーディオＥＱエンジン１１８上にあるが、いくつかの例では、トレーニング済みモデルは、メディアユニット１０６上で直接使用するためにエクスポートされる。機械学習技法は、ディープラーニングネットワークであっても、他の経験／観察学習システムであっても、たとえば、結果を最適化し、イメージ内の物体の位置を突き止め、音声を理解して音声をテキストに変換し、検索エンジン結果の関連性を改善するために使用することができる。

[0053]図１の図示される例示的環境１００が、車両内の再生設定調節（たとえば、オーディオ等化）実装を参照して説明されるが、例示的環境１００に含まれるデバイスの一部又はすべてを任意の環境で、任意の組合せで実装することができる。たとえば、オーディオ増幅器１０８及び／又は出力デバイス１１０のいずれかと共に、メディアユニット１０６を携帯電話で（たとえば、全体的又は部分的に）実装することができ、携帯電話は、モバイルデバイスから提示されている任意のメディア（たとえば、ストリーミング音楽、モバイルデバイス上にローカルに記憶されたメディア、ラジオなど）に対して本明細書で開示される技法を利用して、再生設定調節（たとえば、オーディオ等化）を実施することができる。いくつかの例では、環境１００は家屋のエンターテイメントルーム内でよく、メディアデバイス１０２、１０４は、パーソナルステレオシステム、１つ又は複数のテレビジョン、ラップトップ、他のパーソナルコンピュータ、タブレット、他のモバイルデバイス（たとえば、スマートフォン）、ゲーミングコンソール、バーチャルリアリティデバイス、セットトップボックス、或いはメディアにアクセス及び／又は送信することのできる任意の他のデバイスでよい。さらに、いくつかの例では、メディアは視覚的要素も含むことができる（たとえば、テレビジョンショー、映画）。

[0054]いくつかの例では、コンテンツプロファイルエンジン１１６は、コンテンツプロバイダ１１４、メディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６の部分でよい。別の例として、メディアデバイス１０２及び／又はメディアデバイス１０４は、構成の中でもとりわけ、コンテンツプロバイダ１１４を含むことができる（たとえば、メディアデバイス１０２及び／又はメディアデバイス１０４は、音楽再生アプリケーションを有するモバイルデバイスであり、コンテンツプロバイダ１１４は、歌及び他のオーディオのローカルストアである）。

[0055]図２は、本開示の教示の少なくとも第１の実装、第２の実装及び第３の実装によるオーディオ等化のための技法を実施するための、図１のメディアユニット１０６の追加の詳細を示すブロック図である。例示的メディアユニット１０６は、入力メディア信号２０２を受信し、信号を処理して、オーディオ及び／又はビデオ特性を決定する。次いで、オーディオ及び／又はビデオ特性は、入力メディア信号２０２の特性に基づいて適切なオーディオ及び／又はビデオ再生調節を決定するために利用される。入力メディア信号２０２がオーディオ信号であるとき、メディアユニット１０６は、出力デバイス１１０によって出力する前に、増幅するためにオーディオ増幅器１０８に出力オーディオ信号を送信する。

[0056]例示的メディアユニット１０６は、例示的信号変換器２０４、例示的等化（ＥＱ）モデル照会ジェネレータ２０６、例示的ＥＱフィルタ設定アナライザ２０８、例示的ＥＱパーソナライゼーションマネージャ２１０、例示的デバイスパラメータアナライザ２１２、例示的履歴ＥＱマネージャ２１４、例示的ユーザ入力アナライザ２１６、例示的ＥＱフィルタセレクタ２１８、例示的ＥＱ調節インプリメンタ（ｉｍｐｌｅｍｅｎｔｏｒ）２２０、例示的平滑化フィルタコンフィギュレータ２２２、例示的データストア２２４及び例示的更新モニタ２２６を含む。例示的メディアユニット１０６は、例示的フィンガープリントジェネレータ２２７及び例示的シンクロナイザ２２８をさらに含む。例示的メディアユニット１０６は、例示的バッファマネージャ２３０、例示的時間－周波数領域コンバータ２３２、例示的音量計算器２３４、例示的エネルギー計算器２３６、例示的入力特徴セットジェネレータ２３８、例示的ＥＱ曲線マネージャ２４０、例示的音量調節器２４２、例示的しきい値処理コントローラ２４４、例示的ＥＱ曲線ジェネレータ２４６、例示的音量ノーマライザ２４８及び例示的周波数－時間領域コンバータ２５０をさらに含む。

[0057]例示的メディアユニット１０６は、少なくとも３つの実装に従って動作するように構成される。第１の実装では、メディアユニット１０６は、入力メディア信号２０２の周波数表現を含む照会に応答して、ニューラルネットワークから受け取ったフィルタ設定に従ってメディアをリアルタイムに等化する。第１の実装では、フィルタ設定を処理した後、メディアユニット１０６は、フィルタ設定のうちの少なくともいくつかに従って等化される出力メディア信号２５２を生成することができる。第１の実装のいくつかの例では、メディアユニット１０６は、出力メディア信号２５２を出力する前に、入力メディア信号２０２の等化後バージョンに１つ又は複数の平滑化フィルタをさらに適用することができる。

[0058]第２の実装では、メディアユニット１０６は、コンテンツプロファイルエンジン（たとえば、コンテンツプロファイルエンジン１１６）から受信した１つ又は複数のプロファイルに従ってメディアを動的に等化する。第２の実装では、１つ又は複数のプロファイルを処理した後、メディアユニット１０６は、１つ又は複数のプロファイルのうちの少なくともいくつかに従って等化される出力メディア信号２５２を生成することができる。第２の実装のいくつかの例では、メディアユニット１０６は、出力メディア信号２５２を出力する前に、入力メディア信号２０２にパーソナライズされた等化をさらに適用することができる。

[0059]第３の実装では、メディアユニット１０６は、入力メディア信号２０２に基づく特徴を含む入力特徴セットに応答して、ニューラルネットワークから受け取った等化利得及びカット値に従って、メディアをリアルタイムに等化する。第３の実装では、フィルタ設定を処理した後、メディアユニット１０６は、利得及びカット値のうちの少なくともいくつかに従って等化される出力メディア信号２５２を生成することができる。第３の実装のいくつかの例では、メディアユニット１０６は、入力メディア信号２０２の等化後バージョンにしきい値処理を適用して、出力メディア信号２５２の局所異常値を除去することができる。
第１の実装：フィルタベースの等化

[0060]第１の実装では、例示的入力メディア信号２０２は、提示のために処理及び出力すべきオーディオ信号でよい。無線信号（たとえば、ＦＭ信号、ＡＭ信号、衛星ラジオ信号など）、コンパクトディスク、（たとえば、メディアデバイスに接続された）補助ケーブル、ブルートゥース信号、Ｗｉ－Ｆｉ信号、又は任意の他の媒体から入力メディア信号２０２にアクセスすることができる。入力メディア信号２０２は、信号変換器２０４、ＥＱ調節インプリメンタ２２０及び／又は更新モニタ２２６によってアクセスされる。入力メディア信号２０２は、ＥＱ調節インプリメンタ２２０によって変換され、メディアユニット１０６によって出力メディア信号２５２として出力される。

[0061]図２の図示される例の例示的信号変換器２０４は、入力メディア信号２０２をオーディオ信号の周波数及び／又は特性表現に変換する。たとえば、信号変換器２０４は、入力メディア信号２０２をＣＱＴ表現に変換することができる。いくつかの例では、信号変換器２０４は、フーリエ変換を使用して入力メディア信号２０２を変換する。いくつかの例では、信号変換器２０４は、入力メディア信号２０２を周波数及び／又は特性表現に継続的に変換し、他の例では、信号変換器２０４は、一定の間隔で、又はメディアユニット１０６の１つ又は複数の他の構成要素からの要求に応答して（たとえば、動的オーディオ再生設定調節のために必要とされるときにはいつでも）、入力メディア信号２０２を変換する。いくつかの例では、信号変換器２０４は、（たとえば、オーディオ再生設定を更新する時であることを示す）更新モニタ２２６からの信号に応答して、入力メディア信号２０２を変換する。図示される例の信号変換器２０４は、ＥＱモデル照会ジェネレータ２０６、フィンガープリントジェネレータ２２７及び／又はシンクロナイザ２２８に入力メディア信号２０２の周波数及び／又は特性表現を通信する。

[0062]図２の図示される例のＥＱモデル照会ジェネレータ２０６は、入力メディア信号２０２の周波数及び／又は特性表現に基づいて、ＥＱ照会２０７を生成及び通信する。ＥＱモデル照会ジェネレータ２０６は、入力メディア信号２０２のサンプル時間フレーム（たとえば、３秒のサンプル）に対応する１つ又は複数の周波数表現（複数可）を選択し、ニューラルネットワーク（たとえば、図４のＥＱニューラルネットワーク４０２）に周波数表現（複数可）を通信する。サンプル時間フレームは、オーディオ再生設定を決定するときに考慮すべき入力メディア信号２０２の持続時間に対応する。いくつかの例では、オペレータ（たとえば、聴取者、オーディオエンジニアなど）がサンプル時間フレームを構成することができる。いくつかの例では、ＥＱモデル照会ジェネレータ２０６は、ネットワークを介してニューラルネットワークに照会２０７（入力メディア信号２０２の周波数表現（複数可）を含む）を通信する。いくつかの例では、ＥＱモデル照会ジェネレータ２０６は、メディアユニット１０６（たとえば、データストア２２４）に記憶され、メディアユニット１０６上で実行されるモデルを照会する。いくつかの例では、ＥＱモデル照会ジェネレータ２０６は、更新モニタ２２６からの信号に応答して更新後オーディオ再生設定を決定するために新しい照会２０７を生成する。

[0063]図２の図示される例のＥＱフィルタ設定アナライザ２０８は、ＥＱフィルタ設定２０９にアクセスし、入力メディア信号２０２に適用すべきフィルタ係数を計算する。ＥＱフィルタ設定アナライザ２０８は、ＥＱニューラルネットワーク（たとえば、図４のＥＱニューラルネットワーク４０２）によって出力されるＥＱフィルタ設定２０９にアクセスし、ＥＱフィルタ設定２０９は、１つ又は複数の利得値、周波数値及び／又は品質係数（Ｑ）値を含むことができる。いくつかの例では、ＥＱフィルタ設定２０９は、複数のフィルタ（たとえば、１つの低シェルフフィルタ、４つのピーキングフィルタ、１つの高シェルフフィルタなど）を含む。いくつかのそのような例では、個々のフィルタは、１つ又は複数の利得値、１つ又は複数の周波数値及び／又は１つ又は複数のＱ値などの複数の調節パラメータを含む。たとえば、複数のフィルタを適用すべきオーディオ信号について、複数のフィルタは、それぞれの利得値と、それぞれの周波数値と、それぞれのＱ値（たとえば、それぞれの品質係数値）とを含むそれぞれの調節パラメータを含むことができる。いくつかの例では、ＥＱフィルタ設定アナライザ２０８は、フィルタタイプに基づいてフィルタ係数を計算するために異なる式を利用する。たとえば、第１の式を利用して、低シェルフフィルタについての第１のフィルタ係数を決定することができ、第２の式を利用して、高シェルフフィルタについての第２のフィルタ係数を決定することができる。ＥＱフィルタ設定アナライザ２０８はＥＱフィルタセレクタ２１８と通信して、ＥＱフィルタ設定アナライザ２０８によって受信されたＥＱフィルタ設定２０９の１つ又は複数のセットのうちのどれを入力メディア信号２０２に適用するために（たとえば、フィルタ係数を計算することによって）処理すべきかを決定する。

[0064]図２の図示される例の例示的ＥＱパーソナライゼーションマネージャ２１０は、パーソナライズされた等化設定（複数可）（たとえば、パーソナライズされたＥＱ設定、曲線、フィルタ設定など）を生成し、パーソナライズされた等化設定をニューラルネットワークからの動的に生成されたフィルタ設定と組み合わせて、聴取者のパーソナルプリファレンスを反映することができる。ＥＱパーソナライゼーションマネージャ２１０は、例示的デバイスパラメータアナライザ２１２、例示的履歴ＥＱマネージャ２１４及び例示的ユーザ入力アナライザ２１６を含む。

[0065]デバイスパラメータアナライザ２１２は、メディアユニット１０６及び／又は入力メディア信号２０２を供給するソースデバイスに関連付けられるパラメータを解析する。たとえば、デバイスパラメータアナライザ２１２は、入力メディア信号２０２が発信されたアプリを示すことができる。いくつかのそのような例では、異なるアプリを異なる等化プロファイルに関連付けることができる。たとえば、オーディオブックに関連付けられるアプリからのオーディオ信号は、フィットネスに関連付けられるアプリからのオーディオ信号に比べて、異なる最適等化曲線を有することがある。

[0066]いくつかの例では、デバイスパラメータアナライザ２１２はデバイスの位置を決定する。たとえば、デバイスパラメータアナライザ２１２は、メディアユニット１０６の位置、及び／又はメディアユニット１０６に入力メディア信号２０２を供給するデバイスの位置を決定することができる。たとえば、メディアユニット１０６がモバイルデバイスに一体化され、モバイルデバイスの位置がジムである場合、モバイルデバイスがユーザの自宅又は職場に位置する場合とは異なるパーソナライズされた等化曲線を生成することができる。いくつかの例では、デバイスパラメータアナライザ２１２は、モバイルデバイスの位置が、パーソナライズされた等化設定（たとえば、パーソナライズされたＥＱ設定）がそれについて決定されるエリア（たとえば、ジム、自宅、職場、図書館など）のジオフェンス内にあるかどうかを判定する。

[0067]いくつかの例では、デバイスパラメータアナライザ２１２は、メディアユニット１０６のユーザ、及び／又はメディアユニットに入力メディア信号２０２を供給するデバイスのユーザを決定する。たとえば、メディアユニット１０６がモバイルデバイスに一体化される場合、デバイスパラメータアナライザ２１２は、ユーザデバイスに関連付けられるログイン及び／又はユーザデバイスに関連付けられる別の識別子に基づいて、モバイルデバイスのユーザを決定することができる。いくつかの例では、ユーザプロファイルを選択して、誰がメディアユニット１０６に関連付けられるモバイルデバイス及び／又は他のデバイスを利用しているかを示すようにユーザに求めることができる。

[0068]図示される例のデバイスパラメータアナライザ２１２は、デバイスパラメータアナライザ２１２がアクセスすることのできる任意のパラメータ（たとえば、位置、ユーザ識別子、ソース識別子など）に基づいて、パーソナライズされたＥＱ曲線を出力及び／又は調節する。

[0069]図２の図示される例の履歴ＥＱマネージャ２１４は、後続のパーソナライズされたＥＱ曲線調節を可能にするために利用される過去の等化曲線に関する履歴データを維持する。たとえば、ユーザがロック音楽を頻繁に聴取し、ロック音楽に最も適しているＥＱ曲線を頻繁に利用する場合、履歴ＥＱマネージャ２１４は、ユーザの典型的な音楽プリファレンスに基づいて、パーソナライズされたＥＱ曲線を調節及び／又は生成するのを助けることができる。たとえば、履歴ＥＱマネージャ２１４は、定義済みの履歴聴取期間に基づいて、パーソナライズされたＥＱ曲線を生成することができる。たとえば、履歴ＥＱマネージャ２１４は、前の１時間の聴取、過去の２４時間の聴取、及び／又は任意の他の時間枠に基づいて、パーソナライズされたＥＱ曲線を生成することができる。換言すれば、履歴ＥＱマネージャ２１４は、前の期間に関連付けられるＥＱ設定に基づいて、パーソナライズされたＥＱ曲線を生成及び／又は調節することができる。履歴ＥＱマネージャ２１４は、ＥＱフィルタ設定アナライザ２０８及び／又はニューラルネットワークによってリアルタイムに生成されているＥＱ曲線を取り、ＥＱの各帯域（たとえば、５つの帯域のそれぞれ）についてのそれらの設定を、履歴期間についての設定を平均する、長期のパーソナライズされたＥＱフィルタにまとめる。システムが履歴期間にわたって認識した平均曲線が、パーソナライゼーションＥＱ曲線となる。この曲線は、ユーザが聴取した音楽のタイプの平均ＥＱを反映する。たとえば、ユーザが過去６０分にわたってヘビーメタルを聴取した場合、そのユーザは、ユーザが過去６０分にわたってトップ４０ポップを聴取した場合とは異なるＥＱ曲線をユーザのユーザプロファイルに記憶していることになる。

[0070]平均化操作は、ローリング平均、ＩＩＲフィルタ、時間枠にわたって平均するように設定された係数を有する（全極フィルタ）、又は任意の他の平均化技法でよい。この平均化は、バッファ情報を長期間保持する必要を軽減することができる。履歴ＥＱデータを利用することにより、ＥＱ設定がある程度の「粘性」を有するようにすることができ、以てシステムは、経時的に聴取者のプリファレンスを徐々に学習し、より有用な等化曲線を形成する。

[0071]いくつかの例では、履歴ＥＱマネージャ２１４は、各ジャンル（ロック、カントリー、音声、ヒップホップなど）についての所与のＥＱ曲線を求めるテーブルルックアップと共に使用することのできるジャンルの小サブセットを決定する。このジャンルのサブセットに基づいて、ＥＱ曲線を生成、調節又は選択することができる。

[0072]図２の図示される例のユーザ入力アナライザ２１６は、等化設定に対応するユーザ入力にアクセスし、ユーザ入力に応答する。たとえば、ユーザは、（たとえば、「いいね」ボタンを押すこと、ユーザレーティングを与えることなどによって）特定の等化設定が好ましいかどうかに関する入力を与えることができる。次いで、パーソナライズされたＥＱ曲線を生成するときに、これらの入力を利用して、ユーザが好むことを示した等化設定をより強く重み付けすることができる。いくつかの例では、定義済みの期間（たとえば、数か月、１年など）にわたってユーザプリファレンスが記憶される。いくつかの例では、特定のユーザアカウント（たとえば、デバイスパラメータアナライザ２１２によって特定されるユーザログイン）に関連してユーザプリファレンスが記憶される。いくつかの例では、ユーザ入力アナライザ２１６は、オーディオ信号に適用されている自動化されたパーソナライズされた等化をユーザが取り消したいことを示す「リセット」信号を、聴取者から受信する。いくつかの例では、ユーザ入力アナライザ２１６は、聴取者からの強度入力に基づいて等化の強度を調節する。

[0073]図２の図示される例の例示的ＥＱフィルタセレクタ２１８は、入力メディア信号２０２に適用すべき、ＥＱフィルタ設定アナライザ２０８によって受信されたＥＱフィルタ設定によって表されるフィルタのうちの１つ又は複数（たとえば、低シェルフフィルタ、ピーキングフィルタ、高シェルフフィルタなどのうちの１つ又は複数）を選択する。図示される例のＥＱフィルタセレクタ２１８は、最高の大きさの利得を有する（したがって入力メディア信号２０２に対して最大の影響を及ぼす可能性の高い）１つ又は複数のフィルタを選択する。いくつかの例では、特定の数のフィルタが利用されるべきとき（たとえば、５つの帯域フィルタ）などに、ＥＱフィルタ設定によって表される１つ又は複数の追加のフィルタを廃棄することができる。いくつかの例では、ＥＱフィルタセレクタ２１８は、聴取者に少なくとも知覚できる影響を及ぼすことになるフィルタを決定し、これらのフィルタを廃棄する。たとえば、ＥＱフィルタセレクタは、１つ又は複数のフィルタのスペクトルエンベロープにわたって積分し、フィルタ間のこの出力を比較して、ＥＱフィルタ設定によって表されるフィルタのうちのどれを廃棄すべきかを決定することができる。いくつかの例では、ＥＱフィルタセレクタ２１８は、ＥＱフィルタ設定アナライザ２０８及び／又はＥＱ調節インプリメンタ２２０に、フィルタのうちのどれを入力メディア信号２０２に適用すべきかを通信する。

[0074]図２の図示される例のＥＱ調節インプリメンタ２２０は、ＥＱフィルタセレクタ２１８によって選択され、ＥＱフィルタ設定アナライザ２０８によって解析されたフィルタを適用する。たとえば、ＥＱ調節インプリメンタ２２０は、ＥＱフィルタ設定アナライザ２０８によって計算されたフィルタ係数に基づいて、入力メディア信号２０２の振幅、周波数及び／又は位相特性を調節することができる。いくつかの例では、ＥＱ調節インプリメンタ２２０は、平滑化フィルタコンフィギュレータ２２２によって示される平滑化フィルタを使用して、前のオーディオ再生設定から更新後オーディオ再生設定（たとえば、新しいフィルタ構成）に滑らかに遷移する。１つ又は複数の等化フィルタ（複数可）を適用した後、ＥＱ調節インプリメンタ２２０は出力メディア信号２５２を出力する。

[0075]いくつかの例では、ＥＱ調節インプリメンタ２２０は、ニューラルネットワークからのＥＱフィルタ設定２０９に基づいて生成された等化プロファイルと、ＥＱパーソナライゼーションマネージャ２１０からのパーソナライズされたＥＱとの間で混合する。たとえば、ユーザプロファイルＥＱ曲線を、ニューラルネットワークによって生成されるリアルタイム曲線と混合することができる。いくつかの例では、ＥＱ曲線を混合するために重みが使用される。複数の重みを使用することもできる。一例として、ユーザが最終的に聴取するオーディオを形成する最終ＥＱ曲線は、動的に生成されたフィルタ設定に基づいて現ＥＱの０．５倍でよく、パーソナライズされたＥＱ曲線の０．５倍である。別の例として、最初の数字は、動的に生成されたフィルタ設定に基づいて現ＥＱに対して０．２５でよく、パーソナライズされたＥＱ曲線に対して０．７５でよい。

[0076]図２の図示される例の例示的平滑化フィルタコンフィギュレータ２２２は、オーディオ再生設定間を平滑化するためのパラメータを定義する。たとえば、平滑化フィルタコンフィギュレータ２２２は、オーディオ再生設定を適用するときにＥＱ調節インプリメンタ２２０によって平滑化を実装するために式及び／又はパラメータを供給することができる（たとえば、指数平滑化アルゴリズム、一極巡回型平滑化フィルタなど）。図９Ａの第２のスペクトログラム９００ａは、平滑化フィルタを実装する利点を示し、平滑化フィルタを使用して動的オーディオ再生設定調節を受けたオーディオ信号のスペクトログラムを示す。

[0077]図２の図示される例の例示的データストア２２４は、入力メディア信号２０２、図４のＥＱニューラルネットワーク４０２からの出力モデル、１つ又は複数のプロファイル２２９、ＥＱフィルタ設定２０９、ＥＱ入力特徴セット２３９、ＥＱ利得／カット２４１、平滑化フィルタ設定、オーディオ信号バッファ、並びに／或いはメディアユニット１０６によって実装される動的再生設定調節プロセスに関連する任意の他のデータを記憶する。揮発性メモリ（たとえば、同期型ダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、ラムバス（ＲＡＭＢＵＳ）ダイナミックランダムアクセスメモリ（ＲＤＲＡＭ）など）及び／又は不揮発性メモリ（たとえば、フラッシュメモリなど）によってデータストア２２４を実装することができる。追加又は代替として、ダブルデータレート（ＤＤＲ）、ＤＤＲ２、ＤＤＲ３、モバイルＤＤＲ（ｍＤＤＲ）などの１つ又は複数のＤＤＲメモリによってデータストア２２４を実装することができる。追加又は代替として、ハードディスクドライブ（複数可）、コンパクトディスクドライブ（複数可）、デジタルバーサタイルディスクドライブ（複数可）などの１つ又は複数のマスストレージデバイスによってデータストア２２４を実装することができる。図示される例では、データストア２２４が単一のデータベースとして示されているが、任意の数及び／又はタイプ（複数可）のデータベースによってデータストア２２４を実装することができる。さらに、データストア２２４に記憶されたデータは、たとえば、バイナリデータ、コンマ区切りデータ、タブ区切りデータ、構造化照会言語（ＳＱＬ）構造などの任意のデータフォーマットでよい。

[0078]図示される例の例示的更新モニタ２２６は、オーディオ再生設定調節間の持続時間を監視し、更新持続時間しきい値が満たされるときを判定する。たとえば、１秒の更新しきい値と共に更新モニタ２２６を構成することができ、以てＥＱモデル照会ジェネレータ２０６は、１秒ごとにＥＱニューラルネットワーク（たとえば、図４のＥＱニューラルネットワーク４０２）に照会して、新しい再生設定を決定する。いくつかの例では、更新モニタ２２６は信号変換器２０４と通信して、入力メディア信号２０２のサンプル（たとえば、３秒のサンプル、５秒のサンプルなど）を単純化し、更新後オーディオ再生設定を決定するプロセスを開始する。

[0079]動作の際に、信号変換器２０４は、入力メディア信号２０２にアクセスし、入力オーディオ信号を周波数及び／又は特性形式に変換し、次いで周波数及び／又は特性形式がＥＱモデル照会ジェネレータ２０６によって利用され、ニューラルネットワークが照会され、ＥＱフィルタ設定２０９が決定される。ニューラルネットワークはＥＱフィルタ設定２０９を返し、ＥＱフィルタ設定２０９がＥＱフィルタ設定アナライザ２０８によって解析及び処理される（たとえば、適用可能フィルタ係数に変換される）。ＥＱフィルタセレクタ２１８は、入力メディア信号２０２に適用する、ＥＱ設定によって表されるフィルタのうちの１つ又は複数を決定する。ＥＱ調節インプリメンタ２２０は、平滑化フィルタコンフィギュレータ２２２からのパラメータに基づく平滑化を使用して、選択されたフィルタを適用する。更新モニタ２２６は、前のオーディオ再生設定が適用されてからの持続時間を監視し、更新持続時間しきい値が満たされるとき、オーディオ再生設定を更新する。
第２の実装：プロファイルベースの等化

[0080]第２の実装では、図２の図示される例のフィンガープリントジェネレータ２２７は、メディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６によって受信又はアクセスされる入力メディア信号２０２（たとえば、コンテンツ）についての識別子（たとえば、フィンガープリント及び／又はシグニチャ）を生成する。たとえば、フィンガープリントジェネレータ２２７は、とりわけ、入力メディア信号２０２（たとえば、受信されたコンテンツ）の基準フィンガープリント又は他の識別子を生成するように構成される基準フィンガープリントジェネレータ（たとえば、コンテンツの一部からハッシュ値を計算する構成要素）を含むことができる。いくつかの例では、フィンガープリントジェネレータ２２７は、図１のフィンガープリントジェネレータ１１５を実装する。

[0081]図２の図示される例のシンクロナイザ２２８は、コンテンツプロファイルエンジン１１６からの１つ又は複数のプロファイル２２９を入力メディア信号２０２に同期する。いくつかの例では、メディアユニット１０６は、メディア（たとえば、歌）の再生を順序付ける（又はメディアが再生される順序を修正する（たとえば、調節する））ためのシーケンサを含むことができる。追加又は代替の例では、シーケンサはメディアユニット１０６の外部でよい。

[0082]図２の例では、シンクロナイザ２２８は、入力メディア信号２０２に関連付けられるフィンガープリント（複数可）を利用して、入力メディア信号２０２を１つ又は複数のプロファイル２２９に同期することができる。たとえば、１つ又は複数のプロファイル２２９は、１つ又は複数の設定を入力メディア信号２０２についての既知のフィンガープリントに関係付ける情報を含むことができ、したがってシンクロナイザ２２８は、入力メディア信号２０２の再生中に１つ又は複数のプロファイル２２９のうちの１つを入力メディア信号２０２に同期するために、設定を入力メディア信号２０２の一部に位置合せすることができる。

[0083]いくつかの例では、シンクロナイザ２２８は、入力メディア信号２０２及び／又はその代替表現内の様々なオーディオ又は音響イベント（たとえば、スネアヒット（ｓｎａｒｅｈｉｔ）、ギターソロの開始、最初のボーカル）を特定し、入力メディア信号２０２の再生中に１つ又は複数のプロファイル２２９のうちの１つを入力メディア信号２０２に同期するために、１つ又は複数のプロファイル２２９のうちの１つを入力メディア信号２０２内のイベントに位置合せすることができる。追加又は代替の例では、シーケンサは、適応ラジオ、プレイリスト推薦、現在レンダリングされているメディア（たとえば、（たとえば、そのプロファイルを使用する）コンテンツ）に特有のクラウド（音楽及び／又はビデオ）内のメディア（たとえば、コンテンツ）のプレイリスト、ユーザのプロファイル、パーソナライズされた最適な体験を提供するために前もって知られているデバイス設定などの部分として歌のシーケンスを編成することができる。

[0084]第２の実装では、図２の図示される例の例示的ＥＱパーソナライゼーションマネージャ２１０は、パーソナライズされた等化設定（複数可）（たとえば、パーソナライズされたＥＱ設定、曲線、フィルタ設定など）を生成し、パーソナライズされた等化設定を１つ又は複数のプロファイル２２９と組み合わせて、聴取者のパーソナルプリファレンスを反映することができる。

[0085]デバイスパラメータアナライザ２１２は、メディアユニット１０６及び／又は入力メディア信号２０２を供給するソースデバイスに関連付けられるパラメータを解析する。たとえば、デバイスパラメータアナライザ２１２は、入力メディア信号２０２が発信されたアプリを示すことができる。いくつかのそのような例では、異なるアプリを異なる等化プロファイルに関連付けることができる。たとえば、オーディオブックに関連付けられるアプリからのオーディオ信号は、フィットネスに関連付けられるアプリからのオーディオ信号からのオーディオ信号に比べて、異なる最適等化曲線を有することがある。

[0086]いくつかの例では、デバイスパラメータアナライザ２１２はデバイスの位置を決定する。たとえば、デバイスパラメータアナライザ２１２は、メディアユニット１０６の位置、及び／又はメディアユニット１０６に入力メディア信号２０２を供給するデバイスの位置を決定することができる。たとえば、メディアユニット１０６がモバイルデバイスに一体化され、モバイルデバイスの位置がジムである場合、モバイルデバイスがユーザの自宅又は職場に位置する場合とは異なるパーソナライズされた等化曲線を生成することができる。いくつかの例では、デバイスパラメータアナライザ２１２は、モバイルデバイスの位置が、パーソナライズされた等化設定（たとえば、パーソナライズされたＥＱ設定）がそれについて決定されるエリア（たとえば、ジム、自宅、職場、図書館など）のジオフェンス内にあるかどうかを判定する。

[0087]いくつかの例では、デバイスパラメータアナライザ２１２は、メディアユニット１０６のユーザ、及び／又はメディアユニットに入力メディア信号２０２を供給するデバイスのユーザを決定する。たとえば、メディアユニット１０６がモバイルデバイスに一体化される場合、デバイスパラメータアナライザ２１２は、ユーザデバイスに関連付けられるログイン及び／又はユーザデバイスに関連付けられる別の識別子に基づいて、モバイルデバイスのユーザを決定することができる。いくつかの例では、ユーザプロファイルを選択して、誰がメディアユニット１０６に関連付けられるモバイルデバイス及び／又は他のデバイスを利用しているかを示すようにユーザに求めることができる。

[0088]図示される例のデバイスパラメータアナライザ２１２は、デバイスパラメータアナライザ２１２がアクセスすることのできる任意のパラメータ（たとえば、位置、ユーザ識別子、ソース識別子など）に基づいて、パーソナライズされたＥＱ曲線を出力及び／又は調節する。

[0089]図２の図示される例の履歴ＥＱマネージャ２１４は、後続のパーソナライズされたＥＱ曲線調節を可能にするために利用される過去の等化曲線に関する履歴データを維持する。たとえば、ユーザがロック音楽を頻繁に聴取し、ロック音楽に最も適しているＥＱ曲線を頻繁に利用する場合、履歴ＥＱマネージャ２１４は、ユーザの典型的な音楽プリファレンスに基づいて、パーソナライズされたＥＱ曲線を調節及び／又は生成するのを助けることができる。たとえば、履歴ＥＱマネージャ２１４は、定義済みの履歴聴取期間に基づいて、パーソナライズされたＥＱ曲線を生成することができる。たとえば、履歴ＥＱマネージャ２１４は、前の１時間の聴取、過去の２４時間の聴取、及び／又は任意の他の時間枠に基づいて、パーソナライズされたＥＱ曲線を生成することができる。換言すれば、履歴ＥＱマネージャ２１４は、前の期間に関連付けられるＥＱ設定に基づいて、パーソナライズされたＥＱ曲線を生成及び／又は調節することができる。履歴ＥＱマネージャ２１４は、リアルタイムに生成されている１つ又は複数のプロファイル２２９を取り、ＥＱの各帯域（たとえば、５つの帯域のそれぞれ）についてのそれらの設定を、履歴期間についてのＥＱ設定を平均する、長期のパーソナライズされたＥＱフィルタにまとめる。システムが履歴期間にわたって認識した平均曲線が、パーソナライゼーションＥＱ曲線となる。この曲線は、ユーザが聴取した音楽のタイプの平均ＥＱを反映する。たとえば、ユーザが過去６０分にわたってヘビーメタルを聴取した場合、そのユーザは、ユーザが過去６０分にわたってトップ４０ポップを聴取した場合とは異なるＥＱ曲線をユーザのユーザプロファイルに記憶していることになる。

[0090]平均化操作は、ローリング平均、ＩＩＲフィルタ、時間枠にわたって平均するように設定された係数を有する（全極フィルタ）、又は任意の他の平均化技法でよい。この平均化は、バッファ情報を長期間保持する必要を軽減することができる。履歴ＥＱデータを利用することにより、ＥＱ設定がある程度の「粘性」を有するようにすることができ、以てシステムは、経時的に聴取者のプリファレンスを徐々に学習し、より有用な等化曲線を形成する。

[0091]いくつかの例では、履歴ＥＱマネージャ２１４は、各ジャンル（ロック、カントリー、音声、ヒップホップなど）についての所与のＥＱ曲線を求めるテーブルルックアップと共に使用することのできるジャンルの小サブセットを決定する。このジャンルのサブセットに基づいて、ＥＱ曲線を生成、調節又は選択することができる。

[0092]図２の図示される例のユーザ入力アナライザ２１６は、等化設定に対応するユーザ入力にアクセスし、ユーザ入力に応答する。たとえば、ユーザは、（たとえば、「いいね」ボタンを押すこと、ユーザレーティングを与えることなどによって）特定の等化設定が好ましいかどうかに関する入力を与えることができる。次いで、パーソナライズされたＥＱ曲線を生成するときに、これらの入力を利用して、ユーザが好むことを示した等化設定をより強く重み付けすることができる。いくつかの例では、定義済みの期間（たとえば、数か月、１年など）にわたってユーザプリファレンスが記憶される。いくつかの例では、特定のユーザアカウント（たとえば、デバイスパラメータアナライザ２１２によって特定されるユーザログイン）に関連してユーザプリファレンスが記憶される。いくつかの例では、ユーザ入力アナライザ２１６は、オーディオ信号に適用されている自動化されたパーソナライズされた等化をユーザが取り消したいことを示す「リセット」信号を、聴取者から受信する。いくつかの例では、ユーザ入力アナライザ２１６は、聴取者からの強度入力に基づいて等化の強度を調節する。

[0093]第２の実装では、ＥＱ調節インプリメンタ２２０は、入力メディア信号２０２についての１つ又は複数のプロファイル２２９に基づいて、入力メディア信号２０２の再生を修正するように構成される。そのような追加又は代替の例では、ＥＱ調節インプリメンタ２２０は、１つ又は複数のプロファイル２２９に基づいて入力メディア信号２０２の再生を修正するようにアジャスタ（ａｄｊｕｓｔｏｒ）を実装する。たとえば、ＥＱ調節インプリメンタ２２０は、入力メディア信号２０２（たとえば、コンテンツのストリーム）の再生中に等化を調節及び／又は調整するために、メディアユニット１０６、メディアデバイス１０２及び／又はメディアデバイス１０４のイコライザ及び／又は動的プロセッサの設定を修正又は調節するように１つ又は複数のプロファイル２２９内の情報を適用することができる。換言すれば、１つ又は複数のプロファイル２２９は、入力メディア信号２０２の一部の等化をＥＱ調節インプリメンタ２２０に調節させるための情報を含む。メディア（たとえば、コンテンツ）がビデオであるとき、１つ又は複数のプロファイル２２９を使用して、色温度、ダイナミックレンジ、カラーパレット、輝度、シャープネス、任意の他のビデオ関連の設定などのビデオ設定を調節することができる。

[0094]等化に加えて、ＥＱ調節インプリメンタ２２０は、等化設定、仮想化設定、空間化設定などの様々な異なる再生設定を調節することができる。たとえば、ＥＱ調節インプリメンタ２２０は、入力メディア信号２０２（たとえば、コンテンツのストリーム）に割り当てられたジャンルを特定する情報にアクセスし、特定したジャンルに関連付けられる設定に再生デバイスの等化設定を合わせることによって入力メディア信号２０２の再生（たとえば、コンテンツのストリーム）を修正することができる。別の例として、ＥＱ調節インプリメンタ２２０は、コンテンツのストリームの様々な周波数についての信号強度パラメータを特定する情報にアクセスし、信号強度パラメータを使用する設定に再生デバイスの等化設定を合わせることによってコンテンツのストリームの再生を修正することができる。

[0095]第２の実装のいくつかの例では、ＥＱ調節インプリメンタ２２０は、コンテンツプロファイルエンジン１１６によって生成された１つ又は複数のプロファイル２２９と、ＥＱパーソナライゼーションマネージャ２１０からのパーソナライズされたＥＱとの間で混合する。たとえば、ユーザプロファイルＥＱ曲線をリアルタイムプロファイルと混合することができる。いくつかの例では、パーソナライズされたＥＱ曲線と１つ又は複数のプロファイル２２９とを混合するために重みが使用され、複数の重みを使用することもできる。一例として、ユーザが最終的に聴取するオーディオを形成する最終ＥＱ曲線は、動的に生成されたフィルタ設定に基づいて現ＥＱの０．５倍でよく、パーソナライズされたＥＱ曲線の０．５倍である。別の例として、最初の数字は、動的に生成されたフィルタ設定に基づいて現ＥＱに対して０．２５でよく、パーソナライズされたＥＱ曲線に対して０．７５でよい。
第３の実装：しきい値処理ベースの等化

[0096]第３の実装では、図２の図示される例の例示的バッファマネージャ２３０は入力メディア信号２０２を受信し、入力メディア信号２０２の一部をデータストア２２４に記憶する。バッファマネージャ２３０は、バッファ（たとえば、入力メディア信号２０２の部分）を任意の持続時間（たとえば、１０秒、３０秒、１分など）となるように構成することができる。データストア２２４内のバッファに記憶される入力メディア信号２０２の部分は、等化特徴を決定するために利用され、以て入力メディア信号２０２の瞬間特性に基づいて特徴が生成された場合よりも長い入力メディア信号２０２の持続時間を等化特徴が表すことが可能となる。バッファの持続時間は、等化がどれほどの応答性であるべきかに基づいて調整することができる。たとえば、非常に短いバッファ持続時間の結果、入力メディア信号２０２のスペクトル特性が変化するとき（たとえば、歌の相異なる部分の間）に等化曲線が急激に変化することがあり、一方、長いバッファ期間は、これらの入力メディア信号２０２の大きな変化を平均して、より一貫した等化プロファイルを生成する。バッファマネージャ２３０は、もはやバッファ期間内にない入力メディア信号２０２の部分を廃棄させることができる。たとえば、バッファ期間が１０秒である場合、入力メディア２０２の一部がバッファ内に１０秒間あった後に、この部分が除去される。

[0097]いくつかの例では、ニューラルネットワークが、メディア変化（たとえば、トラック変化、メディアソースの変化など）を特定するために利用され、出力が、メディアの変化に応答して等化を調節するために利用される。たとえば、新しいトラックがニューラルネットワークによって検出されたとき、ＥＱ入力特徴セット２３９、したがって図４のＥＱニューラルネットワーク４０２から受け取ったＥＱ利得／カット２４１の迅速な調節（たとえば、ＥＱニューラルネットワーク４０２から出力される等化調節）を引き起こすように、短期瞬間又は平均音量（たとえば、標準バッファ期間よりも短い期間全体にわたる周波数範囲の音量値、その短い期間全体にわたる周波数範囲の標準偏差値など）を計算することができる。いくつかの例では、メディア変化の間で、トラック全体にわたる等化プロファイルの急速なゆらぎを回避するために、より長い音量平均化技法が利用される（たとえば、３０秒音量平均に基づく等化プロファイルを決定すること、４５秒音量平均に基づく等化プロファイルを決定することなど）。

[0098]いくつかの例では、ニューラルネットワークを利用してメディア変化を特定することの追加又は代替として、入力メディア信号２０２で表されるメディアの特性のより急激な変化が生じたときに（たとえば、低音が強いメディアから高音が強いメディアへの遷移）、より高速な等化変化を引き起こすように、ヒステリシスベースの論理を実装することができる。

[0099]いくつかの例では、メディアユニット１０６は、入力オーディオ信号のソースの変化を検出し、前述の短期等化更新をトリガして（たとえば、短期瞬間又は平均音量を計算し、これらの変化に基づいて等化プロファイルを決定すること）、以前のソースに対する新しいソースからのメディアの違いを補償することができる。

[00100]図２の図示される例の例示的時間－周波数領域コンバータ２３２は、時間領域表現からの入力メディア信号２０２を周波数領域表現に変換する。いくつかの例では、時間－周波数領域コンバータ２３２は高速フーリエ変換（ＦＦＴ）を利用する。いくつかの例では、時間－周波数領域コンバータ２３２は、入力メディア信号２０２を線形空間及び／又は対数空間周波数領域表現に変換する。時間－周波数領域コンバータ２３２は、任意のタイプの変換（たとえば、短時間フーリエ変換、ｃｏｎｓｔａｎｔ－Ｑ変換、ハートレー変換など）利用して、入力メディア信号２０２を時間領域表現から周波数領域表現に変換することができる。いくつかの例では、代替として、メディアユニット１０６は、時間領域で、本明細書で開示されるオーディオ等化技法を実施することができる。

[00101]図２の図示される例の例示的音量計算器２３４は、入力メディア信号２０２についての周波数範囲での音量レベルを計算する。いくつかの例では、音量計算器２３４は、入力メディア信号２０２の線形空間周波数表現の周波数ビン（たとえば、周波数範囲）についてのバッファ持続時間（たとえば、１０秒、３０秒など）全体にわたる平均音量レベルを計算する（たとえば、平均音量表現）。図２の図示される例の音量計算器２３４は、バッファに記憶される入力メディア信号２０２の部分の平均音量の周波数表現を生成する。追加又は代替として、図２の図示される例の音量計算器２３４は、周波数ビンについてのバッファ持続時間全体にわたる標準偏差を計算する。いくつかの例では、音量計算器２３４は、対数空間周波数ビン（たとえば、臨界周波数帯域、Ｂａｒｋ帯域など）についての音量レベルを計算する。いくつかの例では、周波数ビンについて平均音量レベルを計算するために、音量計算器２３４は、入力メディア信号２０２の周波数表現を実数値に変換する。

[00102]図２の図示される例の例示的エネルギー計算器２３６は、メディア信号（たとえば、オーディオ信号）についてのエネルギー値を計算する。いくつかの例では、エネルギー計算器２３６は、等化前（たとえば、バッファに記憶された入力メディア信号２０２の周波数表現に基づいて）、及び等化曲線が適用された後（たとえば、ＥＱ曲線ジェネレータ２４０がオーディオ信号の平均周波数表現に等化利得／カットを適用した後）に、オーディオ信号の周波数表現の平方自乗平均（ＲＭＳ）値を計算する。いくつかの例では、エネルギー計算器２３６は、（たとえば、バッファ期間全体にわたる任意の瞬間の音量レベルに基づいて）入力メディア信号２０２の単一の周波数表現のエネルギーを計算し、及び／又はバッファ期間全体にわたる入力メディア信号２０２の平均周波数表現のエネルギーを計算する。

[00103]いくつかの例では、エネルギー計算器２３６は、音量ノーマライザ２４８に等化前及び等化後のエネルギー値を通信して、音量の正規化を可能にし、等化後の全音量の知覚できる変化を回避する。図２の図示される例のエネルギー計算器２３６は、等化後平均周波数表現のエネルギーを計算する。

[00104]図２の図示される例の例示的入力特徴セットジェネレータ２３８は、図４のＥＱニューラルネットワーク４０２に入力するために、入力メディア信号２０２に対応する特徴（たとえば、オーディオ特徴）を生成する。いくつかの例では、入力特徴セットジェネレータ２３８は、バッファ期間全体にわたる入力メディア信号２０２の周波数表現の周波数ビンについての平均音量測定値、及び／又はバッファ期間全体にわたる入力メディア信号２０２の周波数表現の周波数ビンについての平均標準偏差測定値を含むセットを生成する。いくつかの例では、入力特徴セットジェネレータ２３８は、入力メディア信号２０２について適切な等化設定を利用すべきであると判定する際に図４のＥＱニューラルネットワーク４０２を援助するために図４のＥＱニューラルネットワーク４０２に配信される任意の利用可能なメタデータをセット内に含むことができる。

[00105]図２の図示される例の例示的ＥＱ曲線マネージャ２４０は、入力メディア信号２０２を等化するために利用される等化曲線を決定する。例示的ＥＱ曲線マネージャ２４０は、例示的音量調節器２４２、例示的しきい値処理コントローラ２４４及び例示的ＥＱ曲線ジェネレータ２４６を含む。

[00106]図２の図示される例の例示的音量調節器２４２は、ＥＱ利得／カット２４１を受け取り、入力メディア信号２０２の平均表現の周波数範囲で音量調節を行う。いくつかの例では、音量調節器２４２は、オーディオ信号の特定の周波数範囲に適用すべき複数の値（たとえば、スカラ）としてＥＱ利得／カット２４１を受け取る。他の例では、これらの値は対数ベースの利得及びカットでよい（たとえば、デシベル単位）。いくつかのそのような例では、ＥＱ利得／カット２４１は複数の対数空間周波数ビンに対応する。たとえば、ＥＱ利得／カット２４１は、ＢａｒｋＢａｎｄ表現で使用される２５個の臨界帯域に対応することができる。

[00107]いくつかの例では、ＥＱ利得／カット２４１を入力メディア信号２０２のバッファリング済み部分に適用するために、音量調節器２４２は、（たとえば、時間－周波数領域コンバータ２３２によって生成された）入力メディア信号２０２の線形空間周波数表現を、入力メディア信号２０２の対数空間周波数表現に変換する。いくつかのそのような例では、音量調節器２４２は、デシベル単位のＥＱ利得／カット２４１を対数空間周波数表現の音量レベルに加え、入力メディア信号２０２のバッファリング済み部分の等化対数空間周波数バージョンを生成することができる。図示される例の音量調節器２４２は、入力メディア信号２０２のバッファリング済み部分の等化対数空間周波数バージョンをしきい値処理コントローラ２４４に通信する。いくつかの例では、ＥＱ利得／カット２４１は、線形空間周波数表現及び／又は他の表現で実現され、入力メディア信号２０２のバッファリング済み部分の共通（すなわち、線形空間）表現に適用することができる。

[00108]いくつかの例では、音量調節器２４２は、入力メディア信号２０２のソースの技術的限界、及び／又は入力メディア信号２０２に関する他の技術的特性に関する情報にアクセスし、これらの技術的原型又は特性を利用して、どの周波数範囲が音量の変化を受けるかを改善する。たとえば、音量調節器２４２は、（たとえば、メディアユニット１０６のデコーダによって、アーチファクトを符号化するために入力メディア信号２０２を解析することによって、などで決定される）入力メディア信号２０２の符号化のタイプに関する情報にアクセスし得る。いくつかのそのような例では、音量調節器２４２は、オーディオ信号の品質に負の影響を及ぼすことがある音量調節（たとえば、符号化アーチファクトを含む周波数範囲で音量をブーストする調節）を防止することができる。

[00109]図２の図示される例の例示的しきい値処理コントローラ２４４は、入力メディア信号２０２のバッファリング済み部分の（たとえば、音量調節器２４２からの）等化後バージョンを平滑化する技法を実施する。いくつかの例では、音量調節器２４２が入力メディア信号２０２のバッファリング済み部分にＥＱ利得／カット２４１を適用した後、等化後オーディオ信号の周波数表現が、等化後オーディオ信号中の知覚できるアーチファクトとなることがある局所的異常値（たとえば、等化後オーディオ信号の周波数－音量プロット上の短期ピーク又はディップとして現れる不規則性）を有することがある。本明細書では、局所的異常値という用語は、隣り合う周波数値間の大きな音量差などの、等化後オーディオ信号の周波数－音量プロット上の不規則性を指す。いくつかの例では、局所的異常値は、周波数範囲にわたる音量の２次導関数がしきい値を超えるかどうかを判定することによって検出される。

[00110]図２の図示される例のしきい値処理コントローラ２４４は、しきい値処理技法を開始する複数の周波数値を選択する。しきい値処理コントローラ２４４は、複数の周波数値での音量レベルを決定し、次いでこれらの周波数値間の差の尺度を計算する。いくつかの例では、しきい値処理コントローラ２４４は、複数の周波数値にわたって音量値の２次導関数を計算する。一例として、３つの周波数値の中心値が局所的異常値（たとえば、不規則性）に対応するかどうかを判定するために３つの周波数値が解析されている場合、配列ｖａｌ［］が音量値を含み、添字「ｉ」が周波数値添字に対応するとして、以下の式を利用して２次導関数を計算することができる。
｜（ｖａｌ［ｉ－２］－（２（ｖａｌ［ｉ－１］）＋ｖａｌ［ｉ］）｜・・・（式１）

[00111]しきい値処理コントローラ２４４は、式１の出力をしきい値と比較することができる。いくつかの例では、式１、又は隣り合う周波数値での音量に対する周波数値のうちの１つでの音量の相対的差異を計算するために利用される任意の他の式の出力がしきい値を満たす（たとえば、しきい値を超える）場合、平滑化計算を利用して不規則性を除去することができる。いくつかの例では、しきい値処理コントローラ２４４が、隣り合う周波数値での音量レベル間の中点に音量を変更することによって、検出した不規則性の音量レベルを調節する。図１７Ｂは、図１７Ａに表される等化後オーディオ信号中に示される局所的異常値に関してこの中点音量調節を利用する一例を示す。いくつかの例では、しきい値処理コントローラ２４４は、検出した局所的異常値の音量を変更するために任意の他の技法を利用することができる。たとえば、しきい値処理コントローラ２４４は、局所的異常値を除去することを試みるために、検出した局所的異常値の音量を、隣り合う周波数値での音量又は何らかの他の音量に等しく設定することができる。

[00112]いくつかの例では、しきい値処理コントローラ２４４は、不規則性を表す音量レベルを特定するために、等化後オーディオ信号の周波数範囲全体にわたって反復的に移動する。いくつかの例では、しきい値処理コントローラ２４４は、等化後オーディオ信号の周波数値／範囲のすべてを解析した後、等化後オーディオ信号全体にわたって追加で１回又は複数回反復して、最初の調節段階後に（たとえば、検出した局所的異常値についての音量レベルが変更された後に）局所的異常値が残っているかどうかを判定することができる。いくつかの例では、しきい値処理コントローラ２４４は、不規則性（たとえば、異常）検出のためにトレーニングされたニューラルネットワーク及び／又は他の人工知能である。いくつかのそのような例では、しきい値処理コントローラ２４４は、追加の反復を必要とすることなく、１つの調節で不規則性をなくすことができる。

[00113]しきい値処理コントローラ２４４がオーディオ信号の等化後周波数表現から局所的異常値を除去した後、又は別の停止条件（たとえば、周波数範囲全体にわたって局所的異常値検出及び調節を１０回反復する）に達した後に、しきい値処理コントローラ２４４は、オーディオ信号の最終等化後表現をＥＱ曲線ジェネレータ２４６に通信することができ、その結果、ＥＱ曲線ジェネレータ２４６は、入力メディア信号２０２に適用する等化曲線を決定することができる。

[00114]図２の図示される例のＥＱ曲線ジェネレータ２４６は、入力メディア信号２０２のバッファリング済み部分に適用する最終的等化曲線を決定する。いくつかの例では、図２の図示される例のＥＱ曲線ジェネレータ２４６は、等化のために利用する最終的等化曲線を決定するために、しきい値処理コントローラ２４４から出力される等化後バージョンから、入力メディア信号２０２のバッファリング済み部分の元の平均対数空間周波数表現を差し引く。いくつかのそのような例では、この差引きの後、ＥＱ曲線ジェネレータ２４６は、最終的等化曲線を、バッファリング済みオーディオ信号の周波数領域表現に適用することのできる形式（たとえば、線形空間形式）に変換する。いくつかのそのような例では、次いで、図示される例のＥＱ曲線ジェネレータ２４６は、最終ＥＱ曲線（たとえば、最終ＥＱ曲線の線形空間周波数表現）を、対応する表現（たとえば、バッファリング済みオーディオ信号の線形空間周波数表現）に適用する。ＥＱ曲線ジェネレータ２４６は、得られた等化後オーディオ信号を、エネルギー計算器２３６、音量ノーマライザ２４８及び／又は周波数－時間領域コンバータ２５０に通信することができる。本明細書では、ＥＱ曲線は、オーディオ信号の周波数範囲に対応する利得／カット及び／又は他の音量調節を含む。

[00115]図２の図示される例の例示的音量ノーマライザ２４８は、入力メディア信号２０２の等化の前後のエネルギーレベルの変化の指示にアクセスする。図２の図示される例の音量ノーマライザ２４８は、音量正規化を実施して、等化の前後のオーディオ信号の全変化を補償する。いくつかの例では、入力メディア信号２０２の等化の前後のエネルギーレベルの変化がしきい値を超える場合、音量ノーマライザ２４８は、スカラ音量調節を適用して、エネルギーレベルの変化を補償する。いくつかの例では、音量ノーマライザ２４８はダイナミックレンジ圧縮器を利用することができる。いくつかの例では、エネルギー計算器２３６は、等化プロセスの前後のエネルギーの比を計算することができ、音量ノーマライザ２４８は、この比を利用して、この全音量の変化を打ち消すことができる。たとえば、入力メディア信号２０２のオーディオ部分の全エネルギーが２倍になった場合、音量ノーマライザ２４８は、全音量カットを適用して、音量を１／２に低減することができる。いくつかの例では、音量ノーマライザ２４８は、音量正規化を正当化するにはエネルギーの変化が不十分であると判定することができる。図示される例の音量ノーマライザ２４８は、周波数－時間領域コンバータ２５０に最終等化後オーディオ信号（適用可能な場合、音量調節後の等化後オーディオ信号）を通信する。

[00116]図２の図示される例の周波数－時間領域コンバータ２５０は、最終等化後オーディオ信号を周波数領域から時間領域に変換し、最終的にメディアユニット１０６から出力される。

[00117]図１のメディアユニット１０６を実装する例示的方法が図２に示されているが、図２に示される要素、プロセス及び／又はデバイスのうちの１つ又は複数を組み合わせ、分割し、再構成し、省略し、除去し、及び／又は任意の他の方法で実装することができる。さらに、例示的信号変換器２０４、例示的ＥＱモデル照会ジェネレータ２０６、例示的ＥＱフィルタ設定アナライザ２０８、例示的ＥＱパーソナライゼーションマネージャ２１０、例示的デバイスパラメータアナライザ２１２、例示的履歴ＥＱマネージャ２１４、例示的ユーザ入力アナライザ２１６、例示的ＥＱフィルタセレクタ２１８、例示的ＥＱ調節インプリメンタ２２０、例示的平滑化フィルタコンフィギュレータ２２２、例示的データストア２２４、例示的更新モニタ２２６、例示的フィンガープリントジェネレータ２２７、例示的シンクロナイザ２２８、例示的バッファマネージャ２３０、例示的時間－周波数領域コンバータ２３２、例示的音量計算器２３４、例示的エネルギー計算器２３６、例示的入力特徴セットジェネレータ２３８、例示的ＥＱマネージャ２４０、例示的音量調節器２４２、例示的しきい値処理コントローラ２４４、例示的ＥＱ曲線ジェネレータ２４６、例示的音量ノーマライザ２４８及び／又は例示的周波数－時間領域コンバータ２５０、並びに／或いは、より一般には図２の例示的メディアユニット１０６を、ハードウェア、ソフトウェア、ファームウェア、並びに／或いはハードウェア、ソフトウェア及び／又はファームウェアの任意の組合せによって実装することができる。したがって、たとえば、例示的信号変換器２０４、例示的ＥＱモデル照会ジェネレータ２０６、例示的ＥＱフィルタ設定アナライザ２０８、例示的ＥＱパーソナライゼーションマネージャ２１０、例示的デバイスパラメータアナライザ２１２、例示的履歴ＥＱマネージャ２１４、例示的ユーザ入力アナライザ２１６、例示的ＥＱフィルタセレクタ２１８、例示的ＥＱ調節インプリメンタ２２０、例示的平滑化フィルタコンフィギュレータ２２２、例示的データストア２２４、例示的更新モニタ２２６、例示的フィンガープリントジェネレータ２２７、例示的シンクロナイザ２２８、例示的バッファマネージャ２３０、例示的時間－周波数領域コンバータ２３２、例示的音量計算器２３４、例示的エネルギー計算器２３６、例示的入力特徴セットジェネレータ２３８、例示的ＥＱマネージャ２４０、例示的音量調節器２４２、例示的しきい値処理コントローラ２４４、例示的ＥＱ曲線ジェネレータ２４６、例示的音量ノーマライザ２４８及び／又は例示的周波数－時間領域コンバータ２５０、並びに／或いは、より一般には図２の例示的メディアユニット１０６のいずれかを、１つ又は複数のアナログ又はデジタル回路（複数可）、論理回路、プログラマブルプロセッサ（複数可）、プログラマブルコントローラ（複数可）、グラフィックス処理装置（複数可）（ＧＰＵ（複数可））、デジタル信号プロセッサ（複数可）（ＤＳＰ（複数可））、特定用途向け集積回路（複数可）（ＡＳＩＣ（複数可））、プログラマブル論理デバイス（複数可）（ＰＬＤ（複数可））及び／又はフィールドプログラマブル論理デバイス（複数可）（ＦＰＬＤ（複数可））によって実装することができる。純粋にソフトウェア及び／又はファームウェア実装を包含する本特許の装置又はシステムクレームのいずれかを読むとき、例示的信号変換器２０４、例示的ＥＱモデル照会ジェネレータ２０６、例示的ＥＱフィルタ設定アナライザ２０８、例示的ＥＱパーソナライゼーションマネージャ２１０、例示的デバイスパラメータアナライザ２１２、例示的履歴ＥＱマネージャ２１４、例示的ユーザ入力アナライザ２１６、例示的ＥＱフィルタセレクタ２１８、例示的ＥＱ調節インプリメンタ２２０、例示的平滑化フィルタコンフィギュレータ２２２、例示的データストア２２４、例示的更新モニタ２２６、例示的フィンガープリントジェネレータ２２７、例示的シンクロナイザ２２８、例示的バッファマネージャ２３０、例示的時間－周波数領域コンバータ２３２、例示的音量計算器２３４、例示的エネルギー計算器２３６、例示的入力特徴セットジェネレータ２３８、例示的ＥＱマネージャ２４０、例示的音量調節器２４２、例示的しきい値処理コントローラ２４４、例示的ＥＱ曲線ジェネレータ２４６、例示的音量ノーマライザ２４８及び／又は例示的周波数－時間領域コンバータ２５０、並びに／或いは、より一般には図２の例示的メディアユニット１０６のうちの少なくとも１つは、ソフトウェア及び／又はファームウェアを含む、メモリ、デジタルバーサタイルディスク（ＤＶＤ）、コンパクトディスク（ＣＤ）、ブルーレイ（Ｂｌｕ－ｒａｙ）（登録商標）ディスクなどの非一時的コンピュータ可読記憶デバイス又は記憶ディスクを含むように本明細書によって明白に定義される。さらに、図１の例示的メディアユニット１０６は、図２に示されるものに加えて、又はそれらの代わりに、１つ又は複数の要素、プロセス及び／又はデバイスを含むことができ、並びに／或いは図示される要素、プロセス及びデバイスのうちのいずれか複数又はすべてを含むことができる。本明細書では、「通信している（ｉｎｃｏｍｍｕｎｉｃａｔｉｏｎ）」という語句（その変形を含む）は、１つ又は複数の中間構成要素を介する直接的通信及び／又は間接的通信を包含し、直接的物理的（たとえば、ワイヤード）通信及び／又は一定の通信を必要とせず、むしろ周期的間隔、スケジューリングされた間隔、非周期的間隔及び／又はワンタイムイベントの選択的通信をさらに含む。

[00118]図３は、第２の実装による、図１のコンテンツプロファイルエンジン１１６の追加の詳細を示すブロック図である。例示的コンテンツプロファイルエンジン１１６は、例示的コンテンツリトリーバ（ｃｏｎｔｅｎｔｒｅｔｒｉｅｖｅｒ）３０２、例示的フィンガープリントジェネレータ３０４、例示的コンテンツ識別器３０６、例示的プロファイラ３０８及び例示的プロファイルデータストア３１０を含む。本明細書で説明されるように、いくつかの例では、システム及び方法は、メディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６にストリーミンング或いは送信すべきメディア（たとえば、コンテンツ）を特定し、ムード、スタイル、又はコンテンツの他の属性に関連付けられる情報を提供する、メディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６に配信するためのプロファイルを生成及び／又は決定する。いくつかの例では、プロファイルはコンテンツタイプを特定する識別子でよい。たとえば、プロファイルは、メディア（たとえば、コンテンツ）をニュース、アクション映画、スポーツイベントなどと特定することができる。プロファイルに基づいて、ＴＶに関する異なる設定をリアルタイムに（たとえば、オンザフライで）調節することができる。同様に、プロファイルは、ラジオトークショー、歌、ジングル、歌のジャンルなどを特定することができる。したがって、聴取者に配信されるオーディオを向上させるように、オーディオ設定をリアルタイムに（たとえば、オンザフライで）調節することができる。

[00119]図３の例では、コンテンツリトリーバ３０２は、メディアユニット１０６に配信する前に、入力メディア信号２０２（たとえば、再生デバイス（たとえば、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６など）に配信すべきコンテンツのストリーム）にアクセス及び／又は検索する。たとえば、コンテンツリトリーバ３０２は、ネットワーク１１２を介して再生デバイス（たとえば、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６など）に入力メディア信号２０２（たとえば、コンテンツのストリーム）を供給しているコンテンツプロバイダ１１４からの入力メディア信号２０２にアクセスすることができる。別の例として、コンテンツリトリーバ３０２は、再生デバイス（たとえば、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６など）によってローカルに記憶される、コンテンツプロバイダ１１４からの入力メディア信号２０２（たとえば、コンテンツのストリーム）にアクセスすることができる。

[00120]図３の例では、コンテンツリトリーバ３０２は、オーディオコンテンツストリーム、ビデオストリームなどの様々なタイプのメディア（たとえば、様々なタイプのコンテンツストリーム）にアクセスすることができる。たとえば、コンテンツリトリーバ３０２は、歌又は他の音楽のストリーム、音声コンテンツのストリーム、ポッドキャスト、ユーチューブ（商標）ビデオ及びクリップなどにアクセスすることができる。

[00121]図３の図示される例のフィンガープリントジェネレータ３０４は、コンテンツプロファイルエンジン１１６によって受信又はアクセスされた入力メディア信号２０２（たとえば、コンテンツ）についての識別子（たとえば、フィンガープリント及び／又はシグニチャ）を生成する。たとえば、フィンガープリントジェネレータ３０４は、とりわけ、入力メディア信号２０２（たとえば、受信されたコンテンツ）の基準フィンガープリント又は他の識別子を生成するように構成される基準フィンガープリントジェネレータ（たとえば、コンテンツの一部からハッシュ値を計算する構成要素）を含むことができる。いくつかの例では、フィンガープリントジェネレータ３０４は図１のフィンガープリントジェネレータ１１５を実装する。

[00122]図３の図示される例では、コンテンツ識別器３０６は、再生デバイス（たとえば、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６など）に配信すべき入力メディア信号２０２（たとえば、コンテンツのストリーム）内のメディアの一部（たとえば、コンテンツの一部）を特定する。コンテンツ識別器３０６は、フィンガープリントジェネレータ３０４によって生成された基準フィンガープリントなどの既知のメディア（たとえば、コンテンツ）の基準フィンガープリントに対する入力メディア信号２０２（たとえば、コンテンツ）のフィンガープリントの比較を含む様々なプロセスを介して、メディアの部分（たとえば、コンテンツの部分）を特定することができる。たとえば、コンテンツ識別器３０６は、入力メディア信号２０２の部分又は入力メディア信号２０２のフレーム又はフレームのブロックについての照会フィンガープリントを生成及び／又はアクセスして、入力メディア信号２０２に関連付けられる１つのコンテンツ又はコンテンツのストリームを特定するために、基準フィンガープリントに対する照会フィンガープリントの比較を実施することができる。

[00123]図３に示される例では、プロファイラ３０８は、入力メディア信号２０２内の特定された１つ又はセグメント／部分（たとえば、ストリームコンテンツ）についての１つ又は複数のプロファイル２２９を決定し、再生デバイス（たとえば、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６など）に１つ又は複数のプロファイル２２９を配信する。たとえば、プロファイラ３０８は、入力メディア信号２０２についての１つ又は複数の特性を決定することができ、並びに／或いは入力メディア信号２０２のフレーム又はフレームのブロックなどの入力メディア信号２０２の複数の部分についての１つ又は複数の特性を決定することができる。いくつかの例では、プロファイラ３０８は、プロファイルデータストア３１０に１つ又は複数のプロファイル２２９を記憶する。

[00124]例示的プロファイラ３０８は、様々な異なる特性を有する、オーディオコンテンツなどの入力メディア信号２０２についての１つ又は複数のプロファイル２２９をレンダリング、生成及び／又は決定することができる。たとえば、１つ又は複数のプロファイル２２９は、オーディオコンテンツ内の様々な可聴周波数などのＥＱ設定に関連付けられる特性を含むことができる。１つ又は複数のプロファイル２２９は様々なタイプの情報を含むことができる。例示的プロファイル情報は、（１）音楽のスタイルについてのカテゴリ（たとえば、ロック、クラシック、ヒップホップ、器楽、音声、ジングルなど）などの、歌に関連付けられるカテゴリを特定する情報、（２）ビデオのスタイル（たとえば、ドラマ、サイエンスフィクション、ホラー、ロマンス、ニュース、ＴＶショー、ドキュメンタリー、広告など）などの、ビデオセグメントに関連付けられるカテゴリを特定する情報、（３）アップビートムード、リラックスしたムード、ソフトムードなどの、歌又はビデオクリップに関連付けられるムードを特定する情報、（４）低音及び他の類似のトーンについての低周波数、音声又は歌唱トーンについての高周波数などの、コンテンツ内の様々な周波数についての信号強度パラメータを特定する情報、並びに／或いは（５）カラーパレット、輝度、シャープネス、動き、ぼやけ、テキスト及び／又はサブタイトル若しくは字幕の存在、前記テキスト又はサブタイトルを有する特定のコンテンツ、シーンカット、ブラックフレーム、ディスプレイフォーマット調節バー／ピラーの存在、顔、ランドスケープ、又は他の物体の存在又は欠如、特定の会社の存在、ネットワーク、或いはブロードキャストロゴなどを特定する情報を含むことができる。

[00125]したがって、１つ又は複数のプロファイル２２９は、入力メディア信号２０２の再生属性（たとえば、「ＤＮＡ」）を表すことができ、とりわけ入力メディア信号２０２の再生中の体験を最適化し、又は向上させるために、再生属性をメディアユニット１０６で使用して、再生デバイス（たとえば、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６など）を制御することができる。図３に示されるように、コンテンツプロファイルエンジン１１６は、１つ又は複数のプロファイル２２９を生成して、メディアユニット１０６に配信することができ、メディアユニット１０６は、とりわけ入力メディア信号２０２（たとえば、コンテンツのストリーム）の再生中に再生デバイス（たとえば、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６など）の再生設定を調節する。

[00126]図３の例では、プロファイルデータストア３１０は、１つ又は複数のプロファイル、１つ又は複数の基準フィンガープリント、並びに／或いは１つ又は複数のプロファイル２２９を介してメディアユニット１０６によって実装される動的再生設定調節プロセスに関連する任意の他のデータを記憶する。揮発性メモリ（たとえば、同期型ダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、ラムバスダイナミックランダムアクセスメモリ（ＲＤＲＡＭ）など）及び／又は不揮発性メモリ（たとえば、フラッシュメモリなど）によってプロファイルデータストア３１０を実装することができる。追加又は代替として、ダブルデータレート（ＤＤＲ）、ＤＤＲ２、ＤＤＲ３、モバイルＤＤＲ（ｍＤＤＲ）などの１つ又は複数のＤＤＲメモリによってプロファイルデータストア３１０を実装することができる。追加又は代替として、ハードディスクドライブ（複数可）、コンパクトディスクドライブ（複数可）、デジタルバーサタイルディスクドライブ（複数可）などの１つ又は複数のマスストレージデバイスによってプロファイルデータストア３１０を実装することができる。図示される例では、プロファイルデータストア３１０が単一のデータベースとして示されているが、任意の数及び／又はタイプ（複数可）のデータベースによってプロファイルデータストア３１０を実装することができる。さらに、プロファイルデータストア３１０に記憶されたデータは、たとえば、バイナリデータ、コンマ区切りデータ、タブ区切りデータ、構造化照会言語（ＳＱＬ）構造などの任意のデータフォーマットでよい。

[00127]図１のコンテンツプロファイルエンジン１１６を実装する例示的方法が図３に示されているが、図３に示される要素、プロセス及び／又はデバイスのうちの１つ又は複数を組み合わせ、分割し、再構成し、省略し、除去し、及び／又は任意の他の方法で実装することができる。さらに、例示的コンテンツリトリーバ３０２、例示的フィンガープリントジェネレータ３０４、例示的コンテンツ識別器３０６、例示的プロファイラ３０８、例示的プロファイルデータストア３１０、並びに／或いは、より一般には図３の例示的コンテンツプロファイルエンジン１１６を、ハードウェア、ソフトウェア、ファームウェア、並びに／或いはハードウェア、ソフトウェア及び／又はファームウェアの任意の組合せによって実装することができる。したがって、たとえば、例示的コンテンツリトリーバ３０２、例示的フィンガープリントジェネレータ３０４、例示的コンテンツ識別器３０６、例示的プロファイラ３０８、例示的プロファイルデータストア３１０、並びに／或いは、より一般には、図３の例示的コンテンツプロファイルエンジン１１６のいずれかを、１つ又は複数のアナログ又はデジタル回路（複数可）、論理回路、プログラマブルプロセッサ（複数可）、プログラマブルコントローラ（複数可）、グラフィックス処理装置（複数可）（ＧＰＵ（複数可））、デジタル信号プロセッサ（複数可）（ＤＳＰ（複数可））、特定用途向け集積回路（複数可）（ＡＳＩＣ（複数可））、プログラマブル論理デバイス（複数可）（ＰＬＤ（複数可））及び／又はフィールドプログラマブル論理デバイス（複数可）（ＦＰＬＤ（複数可））によって実装することができる。純粋にソフトウェア及び／又はファームウェア実装を包含する本特許の装置又はシステムクレームのいずれかを読むとき、例示的コンテンツリトリーバ３０２、例示的フィンガープリントジェネレータ３０４、例示的コンテンツ識別器３０６、例示的プロファイラ３０８、例示的プロファイルデータストア３１０、及び／又は、より一般には図３の例示的コンテンツプロファイルエンジン１１６のうちの少なくとも１つは、ソフトウェア及び／又はファームウェアを含む、メモリ、デジタルバーサタイルディスク（ＤＶＤ）、コンパクトディスク（ＣＤ）、ブルーレイディスクなどの非一時的コンピュータ可読記憶デバイス又は記憶ディスクを含むように本明細書によって明白に定義される。さらに、図３の例示的コンテンツプロファイルエンジン１１６は、図３に示されるものに加えて、又はそれらの代わりに、１つ又は複数の要素、プロセス及び／又はデバイスを含むことができ、並びに／或いは図示される要素、プロセス及びデバイスのうちのいずれか複数又はすべてを含むことができる。本明細書では、「通信している」という語句（その変形を含む）は、１つ又は複数の中間構成要素を介する直接的通信及び／又は間接的通信を包含し、直接的物理的（たとえば、ワイヤード）通信及び／又は一定の通信を必要とせず、むしろ周期的間隔、スケジューリングされた間隔、非周期的間隔及び／又はワンタイムイベントの選択的通信をさらに含む。

[00128]図４は、図１のオーディオＥＱエンジン１１８の追加の詳細を示すブロック図である。例示的オーディオＥＱエンジン１１８は、少なくとも２つの実装に従って動作するように構成される。いくつかの例では、トレーニング済みモデルがオーディオＥＱエンジン１１８上に（たとえば、ＥＱニューラルネットワーク４０２内に）常駐するが、いくつかの例では、トレーニング済みモデルが、メディアユニット１０６上での直接的使用のためにエクスポートされる。

[00129]機械学習技法は、ディープラーニングネットワークであっても、他の経験／観察学習システムであっても、たとえば、結果を最適化し、イメージ内の物体の位置を突き止め、音声を理解して音声をテキストに変換し、検索エンジン結果の関連性を改善するために使用することができる。多くの機械学習システムには、機械学習ネットワークの学習及び更新を通じて修正される初期特徴及び／又はネットワーク重みが供給されるが、ディープラーニングネットワークは、解析のために「良好な」特徴を特定するように、それ自体をトレーニングする。多層アーキテクチャを使用して、ディープラーニング技法を利用するマシンは、従来型機械学習技法を使用するマシンよりも良好に生データを処理することができる。評価又は抽象化の様々な層を使用して、高相関値又は弁別的テーマのグループについてのデータを検討することが容易となる。

[00130]機械学習技法は、ニューラルネットワーク、ディープラーニングネットワーク、及び／又は他の経験／観察学習システムであっても、たとえば、最適な結果を生成し、イメージ内の物体の位置を突き止め、音声を理解して音声をテキストに変換し、検索エンジン結果の関連性を改善するために使用することができる。ディープラーニングは、線形及び非線形変換を含む複数の処理層を有するディープグラフを使用してデータ内の高レベル抽象化をモデル化するためにアルゴリズムのセットを使用する機械学習のサブセットである。多くの機械学習システムには、機械学習ネットワークの学習及び更新を通じて修正される初期特徴及び／又はネットワーク重みが供給されるが、ディープラーニングネットワークは、解析のために「良好な」特徴を特定するように、それ自体をトレーニングする。多層アーキテクチャを使用して、ディープラーニング技法を利用するマシンは、従来型機械学習技法を使用するマシンよりも良好に生データを処理することができる。評価又は抽象化の様々な層を使用して、高相関値又は弁別的テーマのグループについてのデータを検討することが容易となる。

[00131]たとえば、畳込みニューラルネットワーク（ＣＮＮ）を利用するディープラーニングは、畳込みフィルタを使用してデータをセグメント化し、データ内の学習済みの観察可能な特徴の位置を突き止め、特定する。ＣＮＮアーキテクチャの各フィルタ又は層は、データの選択性及び不変性を向上させるように入力データを変換する。データのこの抽象化は、マシンが、分類しようと試みているデータ内の特徴に焦点を当て、無関係の背景情報を無視することを可能にする。

[00132]ディープラーニングは、多くのデータセットが低レベル特徴を含む高レベル特徴を含むという理解の上に動作する。たとえばイメージを検査している間、物体を探すのではなく、各部分を形成するモチーフを形成するエッジ、探している物体を形成するエッジを探す方が効率的である。これらの特徴の階層を多くの異なる形式のデータで見つけることができる。

[00133]学習済みの観察可能な特徴は、物体と、教師あり学習中にマシンによって学習される定量化可能な規則性とを含む。良く分類されたデータの大規模なセットを備えるマシンは、新しいデータの順調な分類に関係する特徴を区別及び抽出するように、より良好に装備される。

[00134]転移学習を利用するディープラーニングマシンは、人間のエキスパートによって支持される一定の分類にデータ特徴を適切に結び付けることができる。逆に、同じマシンは、人間のエキスパートによる誤った分類が通知されたとき、分類についてのパラメータを更新することができる。たとえば、設定及び／又は他の構成情報を、学習済みの設定の使用及び／又は他の構成情報によってガイドすることができ、システムがさらに（たとえば、反復的に、及び／又は複数のユーザによって）使用されるにつれて、設定及び／又は他の構成情報についてのいくつかの変動及び／又は他の可能性を、所与の状況について低減することができる。

[00135]例示的ディープラーニングニューラルネットワークを、たとえばエキスパート分類済みデータのセットに関してトレーニングすることができる。このデータのセットは、ニューラルネットワークについての第１のパラメータを構築し、これが教師あり学習の段階となる。教師あり学習の段階の間、所望の挙動が達成されたかどうか、ニューラルネットワークをテストすることができる。ＥＱニューラルネットワーク４０２をトレーニングするための機械可読命令を表す例示的フローチャートが、図７及び１６に関連して図示され、説明される。
第１の実装：フィルタベースの等化

[00136]第１の実装では、図示される例の例示的ＥＱニューラルネットワーク４０２を、オーディオ再生設定が（たとえば、オーディオエンジニアリングによって）それについて特に調整及び最適化される基準オーディオ信号のライブラリを使用してトレーニングすることができる。いくつかの例では、ＥＱニューラルネットワーク４０２は、基準オーディオ信号（たとえば、トレーニングデータ４０８）のうちの１つのサンプルを基準オーディオ信号についての既知のオーディオ再生設定に関連付けることによってトレーニングされる。たとえば、トラックに適用するように推奨される１つ又は複数のフィルタについての利得、周波数及び／又はＱ値を、トラックの個々のオーディオ信号サンプルに関連付けることができ、したがって類似のオーディオサンプルを、最適化された再生設定（たとえば、１つ又は複数の推奨されるフィルタについての利得、周波数及び／又はＱ値）に関連付けるようにＥＱニューラルネットワーク４０２をトレーニングする。いくつかの例では、様々な再生設定に関連付けられる様々なバイアスを示すこともできる。たとえば、最初の１０トラックがトレーニングのために利用され、最初の１０トラックについてのオーディオ再生設定（たとえば、オーディオ再生設定に対応するＥＱパラメータ）が第１のエンジニアによって決定され、第２の１０トラックがトレーニングのために利用され、第２の１０トラックについてのオーディオ再生設定が第２のエンジニアによって決定された場合、第１及び第２のオーディオエンジニアに関連付けられる異なるプリファレンス及び／又はバイアスを学習し、より客観的なモデルを生成するように第１及び第２のオーディオエンジニアを軽減するようにＥＱニューラルネットワーク４０２をさらにトレーニングすることができる。

[00137]いくつかの例では、ＥＱニューラルネットワーク４０２をトレーニングするために損失関数を利用することができる。たとえば、式２は、利用することのできる１つの例示的損失関数を表し、ただしｆはヘルツ単位の周波数に対応し、ｇはデシベル単位の利得に対応し、ｑはＱ値（単位なし）に対応する。

[00138]所望のニューラルネットワーク挙動が達成された（たとえば、特定のしきい値に従って動作するようにマシンがトレーニングされたなど）後に、ニューラルネットワークを使用のために（たとえば、「実際の」データでマシンをテストするためなど）配置することができる。動作中、ニューラルネットワーク挙動を引き続き改善するために、ニューラルネットワーク分類を（たとえば、エキスパートユーザ、エキスパートシステム、基準データベースなどによって）確認又は拒否することができる。次いで、ニューラルネットワーク挙動を決定する分類のためのパラメータが進行中の対話に基づいて更新されるにつれて、例示的ニューラルネットワークは転移学習の状態の状態となる。いくつかの例では、ＥＱニューラルネットワーク４０２などのニューラルネットワークは、オーディオＥＱスコアリングエンジン４０４などの別のプロセスに直接的フィードバックを供給することができる。いくつかの例では、ＥＱニューラルネットワーク４０２は、（たとえば、クラウドなどを介して）バッファリングされ、別のプロセスに供給される前に（たとえば、ＥＱ確認データ４１０を介して）確認されるデータを出力する。

[00139]図４の例では、ＥＱニューラルネットワーク４０２は、オーディオ再生設定トレーニングデータに関連付けられる前の結果データからの入力を受け取り、オーディオ信号に関連付けられるオーディオ再生設定を予測するためのアルゴリズムを出力する。ＥＱニューラルネットワーク４０２には、いくつかの初期相関を供給することができ、次いでＥＱニューラルネットワーク４０２は、進行中の体験から学習することができる。いくつかの例では、ＥＱニューラルネットワーク４０２は、少なくとも１つのオーディオ再生設定トレーニングデータからフィードバックを継続的に受け取る。図４の例では、オーディオＥＱエンジン１１８の動作寿命全体にわたって、ＥＱニューラルネットワーク４０２がフィードバックを介して継続的にトレーニングされ、必要に応じてＥＱニューラルネットワーク４０２及び／又は追加のオーディオ再生設定トレーニングデータ４０８に基づいて例示的オーディオＥＱエンジンバリデータ４０６を更新することができる。ＥＱニューラルネットワーク４０２は、役割、位置、状況などに基づいて学習及び進化することができる。

[00140]いくつかの例では、ＥＱニューラルネットワーク４０２によって生成されたモデルの精度のレベルを例示的オーディオＥＱエンジンバリデータ４０６によって決定することができる。そのような例では、オーディオＥＱスコアリングエンジン４０４及びオーディオＥＱエンジンバリデータ４０６の少なくとも一方が、オーディオ再生設定確認データ４１０のセットを受け取る。そのような例ではさらに、オーディオＥＱスコアリングエンジン４０４は、オーディオ再生設定確認データ４１０に関連する入力（たとえば、ＣＱＴデータ）を受け取り、入力に関連する１つ又は複数のオーディオ再生設定を予測する。予測される結果がオーディオＥＱエンジンバリデータ４０６に配布される。オーディオＥＱエンジンバリデータ４０６は、入力に関連する既知のオーディオ再生設定をさらに受け取り、オーディオＥＱスコアリングエンジン４０４から受け取った、予測されるオーディオ再生設定と、既知のオーディオ再生設定を比較する。いくつかの例では、比較は、ＥＱニューラルネットワーク４０２によって生成されるモデルの精度のレベルを生み出す（たとえば、９５個の比較が合致を生み出し、５つが誤りを生み出す場合、モデルは９５％の精度であるなど）。ＥＱニューラルネットワーク４０２が所望のレベルの精度に達した（たとえば、ＥＱニューラルネットワーク４０２がトレーニングされ、配置の準備ができている）後に、オーディオＥＱエンジンバリデータ４０６は、オーディオ再生設定を決定するためにメディアユニット１０６で使用するために、図２のデータストア２２４にモデル（たとえば、出力４１４）を出力することができる。いくつかの例では、トレーニングされた後、ＥＱニューラルネットワーク４０２は、メディアユニット１０６に十分に正確なＥＱフィルタ設定（たとえば、ＥＱフィルタ設定２０９）を出力する。
第３の実装：しきい値処理ベースの等化

[00141]第３の実装では、オーディオ等化プロファイル（たとえば、利得、カットなど）がそれについて（たとえば、オーディオエンジニアによって）決定された基準オーディオ信号のライブラリを使用して、図示される例の例示的ＥＱニューラルネットワーク４０２をトレーニングすることができる。図４の図示される例では、ＥＱニューラルネットワーク４０２は、例示的トレーニングデータ４０８（たとえば、基準オーディオ信号、ＥＱ曲線及びエンジニアタグ）を受け取る。エンジニアタグは、特定のトラックについて、複数のオーディオエンジニアのうちの誰がトラックについての等化プロファイルを生成したかを示す。いくつかの例では、エンジニアタグをワンホットベクトル（ｏｎｅｈｏｔｖｅｃｔｏｒ）によって表すことができ、ワンホットベクトルの各エントリがエンジニアタグに対応する。いくつかの例では、トラックについての等化プロファイルを生成したエンジニアをＥＱニューラルネットワーク４０２に通知することなく、ＥＱニューラルネットワーク４０２は、様々なオーディオエンジニア間の相対的なスタイルの違いを最終的に平均することができる。たとえば、基準オーディオ信号の第１のセットが、一般に低音周波数範囲をより強調するオーディオエンジニアによって生成されたＥＱ曲線を有し、基準オーディオ信号の第２のセットが、一般に中間周波数範囲をより強調するオーディオエンジニアによって生成されたＥＱ曲線を有する場合、ＥＱニューラルネットワーク４０２は、どのオーディオエンジニアがＥＱ曲線を生成したかを認識していない場合、トレーニング中にこれらの相対的差異を打ち消すことができる。複数の基準オーディオ信号のうちの１つ及び対応するＥＱ曲線に関連付けられるエンジニアタグを提供することによって、ＥＱニューラルネットワーク４０２は、様々な等化スタイルを認識するようにインテリジェントに学習し、ＥＱ入力特徴セット２３９に応答して出力４１４（たとえば、ＥＱ利得／カット２４１）を供給するときに、そのようなスタイルを効果的に利用する。いくつかの例では、ＥＱニューラルネットワーク４０２は、トレーニングデータ４０８内の基準オーディオ信号のうちの１つのサンプルを、基準オーディオ信号についての既知のＥＱ曲線に関連付けることによってトレーニングされる。

[00142]いくつかの例では、プロフェッショナルにエンジニアリングされたトラックを取り、（たとえば、あまり知られていないアーティストの）プロフェッショナルにエンジニアリングされていないトラックのスペクトルエンベロープとの合致を目標にする等化曲線を適用することによってオーディオを劣化させることにより、基準オーディオ信号を生成することができる。次いで、トラックをその元の品質レベルに復元するように等化曲線を適用することによって劣化を戻すようにＥＱニューラルネットワーク４０２をトレーニングすることができる。したがって、プロフェッショナルにエンジニアリングされたトラックをこの劣化技法と共に利用して、高音量トレーニングを使用可能にすることができる。

[00143]いくつかの例では、ＥＱニューラルネットワーク４０２をトレーニングするために損失関数を利用することができる。たとえば、式３は、利用することのできる１つの例示的損失関数を表し、ただしｇ_ｉはビン「ｉ」内のグラウンドトルース利得値であり、

はそのビンについての予測値である。

[00144]所望のニューラルネットワーク挙動が達成された（たとえば、特定のしきい値に従って動作するようにマシンがトレーニングされたなど）後に、ニューラルネットワークを使用のために（たとえば、「実際の」データでマシンをテストするためなど）配置することができる。いくつかの例では、次いで、ニューラルネットワークパラメータ（たとえば、重み）に対してさらに修正又は更新を行うことなく、ニューラルネットワークを使用することができる。

[00145]いくつかの例では、動作中、ニューラルネットワーク挙動を引き続き改善するために、ニューラルネットワーク分類を（たとえば、エキスパートユーザ、エキスパートシステム、基準データベースなどによって）確認又は拒否することができる。次いで、ニューラルネットワーク挙動を決定する分類のためのパラメータが進行中の対話に基づいて更新されるにつれて、例示的ニューラルネットワークは転移学習の状態の状態となる。いくつかの例では、ＥＱニューラルネットワーク４０２などのニューラルネットワークは、オーディオＥＱスコアリングエンジン４０４などの別のプロセスに直接的フィードバックを提供することができる。いくつかの例では、ＥＱニューラルネットワーク４０２は、（たとえば、クラウドなどを介して）バッファリングされ、別のプロセスに供給される前に確認されるデータを出力する。

[00146]いくつかの例では、ＥＱニューラルネットワーク４０２には、いくつかの初期相関を供給することができ、次いでＥＱニューラルネットワーク４０２は、進行中の体験から学習することができる。いくつかの例では、オーディオＥＱエンジン１１８の動作寿命全体にわたって、ＥＱニューラルネットワーク４０２がフィードバックを介して継続的にトレーニングされ、必要に応じてＥＱニューラルネットワーク４０２及び／又は追加のオーディオ再生設定トレーニングデータ４０８に基づいて例示的オーディオＥＱエンジンバリデータ４０６を更新することができる。いくつかの例では、ＥＱニューラルネットワーク４０２は、役割、位置、状況などに基づいて学習及び進化することができる。

[00147]いくつかの例では、ＥＱニューラルネットワーク４０２によって生成されるモデルの精度のレベルを例示的オーディオＥＱエンジンバリデータ４０６によって決定することができる。そのような例では、オーディオＥＱスコアリングエンジン４０４及びオーディオＥＱエンジンバリデータ４０６の少なくとも一方が、オーディオ再生設定トレーニングデータ（たとえば、トレーニングデータ４０８）のセットを受け取る。図４の図示される例のオーディオＥＱスコアリングエンジン４０４は、入力４１２（たとえば、ＥＱ入力特徴セット２３９）に応答してＥＱニューラルネットワーク４０２によって出力された出力４１４（たとえば、ＥＱ利得／カット２４１）の有効性を決定することができる。いくつかの例では、オーディオＥＱスコアリングエンジン４０４は、確認手順中にオーディオＥＱエンジンバリデータ４０６と通信して、入力特徴セットに応答するＥＱニューラルネットワーク４０２の出力が、入力４１２（たとえば、ＥＱ入力特徴セット２３９）についての既知のＥＱ曲線にどれほど密接に対応するかを判定する。たとえば、ＥＱ入力特徴セット２３９は、オーディオエンジニアがそれについてのＥＱ曲線を生成したオーディオサンプルでよく、オーディオＥＱエンジンバリデータ４０６は、ＥＱニューラルネットワーク４０２によって出力された出力（たとえば、ＥＱ利得／カット２４１）を、オーディオエンジニアによって生成されたＥＱ曲線（たとえば、利得／カット）と比較することができる。

[00148]図４の図示される例のＥＱニューラルネットワーク４０２は、トレーニングされた後に、メディアユニット１０６に出力４１４（たとえば、ＥＱ利得／カット２４１）を供給することによって入力４１２（たとえば、ＥＱ入力特徴セット２３９）に応答する。たとえば、ＥＱニューラルネットワーク４０２は、少なくとも基準オーディオ信号、ＥＱ曲線及びエンジニアタグに関連付けられる推論に基づいて、複数の等化調節（たとえば、ＥＱ利得／カット２４１）を決定することができる。いくつかの例では、ＥＱ利得／カット２４１は、複数の周波数範囲に対応する複数の音量調節値（たとえば、利得／カット）を含む。いくつかの例では、ＥＱ利得／カット２４１は、複数の周波数範囲に対応する複数の音量調節値を含む。たとえば、ＥＱニューラルネットワーク４０２によって出力されたＥＱ利得／カット２４１は、聴覚の２４個の臨界帯域に対応する２４個の利得又はカット値を含むことができる。

[00149]いくつかの例では、ＥＱニューラルネットワーク４０２はユーザの入力（複数可）に基づいて等化設定を学習することができる。たとえば、ユーザが特定の方法（たとえば、低音周波数の音量を増大させ、高音周波数の音量を低減するなど）で等化を継続的に調節する場合、ＥＱニューラルネットワーク４０２は、これらの調節を学習して、ユーザプリファレンスを反映するＥＱ利得／カット２４１を出力する。

[00150]いくつかの例では、比較は、ＥＱニューラルネットワーク４０２によって生成されるモデルの精度のレベルを生み出す（たとえば、９５個の比較が合致を生み出し、５つが誤りを生み出す場合、モデルは９５％の精度であるなど）。いくつかの例では、ＥＱニューラルネットワーク４０２が所望のレベルの精度に達した（たとえば、ＥＱニューラルネットワーク４０２がトレーニングされ、配置の準備ができている）後に、オーディオＥＱエンジンバリデータ４０６は、オーディオ再生設定を決定するためにメディアユニット１０６で使用するために、図２のデータストア２２４にモデルを出力することができる。

[00151]図１のオーディオＥＱエンジン１１８を実装する例示的方法が図４に示されているが、図４に示される要素、プロセス及び／又はデバイスのうちの１つ又は複数を組み合わせ、分割し、再構成し、省略し、除去し、及び／又は任意の他の方法で実装することができる。さらに、例示的ＥＱニューラルネットワーク４０２、例示的オーディオＥＱスコアリングエンジン４０４、例示的オーディオＥＱエンジンバリデータ４０６、並びに／或いは、より一般には、図４の例示的オーディオＥＱエンジン１１８を、ハードウェア、ソフトウェア、ファームウェア、並びに／或いはハードウェア、ソフトウェア及び／又はファームウェアの任意の組合せによって実装することができる。したがって、たとえば、例示的ＥＱニューラルネットワーク４０２、例示的オーディオＥＱスコアリングエンジン４０４、例示的オーディオＥＱエンジンバリデータ４０６、並びに／或いは、より一般には、図４の例示的オーディオＥＱエンジン１１８のいずれかを、１つ又は複数のアナログ又はデジタル回路（複数可）、論理回路、プログラマブルプロセッサ（複数可）、プログラマブルコントローラ（複数可）、グラフィックス処理装置（複数可）（ＧＰＵ（複数可））、デジタル信号プロセッサ（複数可）（ＤＳＰ（複数可））、特定用途向け集積回路（複数可）（ＡＳＩＣ（複数可））、プログラマブル論理デバイス（複数可）（ＰＬＤ（複数可））及び／又はフィールドプログラマブル論理デバイス（複数可）（ＦＰＬＤ（複数可））によって実装することができる。純粋にソフトウェア及び／又はファームウェア実装を包含する本特許の装置又はシステムクレームのいずれかを読むとき、例示的ＥＱニューラルネットワーク４０２、例示的オーディオＥＱスコアリングエンジン４０４、例示的オーディオＥＱエンジンバリデータ４０６、並びに／或いは、より一般には、図４の例示的オーディオＥＱエンジン１１８のうちの少なくとも１つは、ソフトウェア及び／又はファームウェアを含む、メモリ、デジタルバーサタイルディスク（ＤＶＤ）、コンパクトディスク（ＣＤ）、ブルーレイディスクなどの非一時的コンピュータ可読記憶デバイス又は記憶ディスクを含むように本明細書によって明白に定義される。さらに、図４の例示的オーディオＥＱエンジン１１８は、図４に示されるものに加えて、又はそれらの代わりに、１つ又は複数の要素、プロセス及び／又はデバイスを含むことができ、並びに／或いは図示される要素、プロセス及びデバイスのうちのいずれか複数又はすべてを含むことができる。本明細書では、「通信している」という語句（その変形を含む）は、１つ又は複数の中間構成要素を介する直接的通信及び／又は間接的通信を包含し、直接的物理的（たとえば、ワイヤード）通信及び／又は一定の通信を必要とせず、むしろ周期的間隔、スケジューリングされた間隔、非周期的間隔及び／又はワンタイムイベントの選択的通信をさらに含む。

[00152]図１及び２のメディアユニット１０６を実装するための例示的ハードウェア論理、機械可読命令、ハードウェアで実装された状態機械及び／又はそれらの任意の組合せを表すフローチャートが、図５、６、１１、１２、１４及び１５に示されている。機械可読命令は、図１８に関連して以下で論じられる例示的プロセッサプラットフォーム１８００に示されるプロセッサ１８１２などのコンピュータプロセッサによる実行のための実行可能プログラム又は実行可能プログラムの部分でよい。ＣＤ－ＲＯＭ、フロッピィディスク、ハードドライブ、ＤＶＤ、ブルーレイディスク、プロセッサ１８１２に関連付けられるメモリなどの非一時的コンピュータ可読記憶媒体に記憶されたソフトウェアでプログラムを実施することができるが、代替として、プログラム全体及び／若しくはその部分をプロセッサ１８１２以外のデバイスによって実行することができ、並びに／又はファームウェア若しくは専用ハードウェアで実施することができる。さらに、図５、６、１１、１２、１４及び１５に示されるフローチャートを参照しながら例示的プログラムが説明されるが、代替として、例示的メディアユニット１０６を実装する多くの他の方法を使用することができる。たとえば、ブロックの実行の順序を変更することができ、及び／又は記載のブロックの一部を変更し、除去し、若しくは組み合わせることができる。追加又は代替として、ソフトウェア又はファームウェアを実行することなく、対応する動作を実施するように構成された１つ又は複数のハードウェア回路（たとえば、ディスクリート及び／又は集積アナログ及び／又はデジタル回路、ＦＰＧＡ、ＡＳＩＣ、比較器、演算増幅器（オペアンプ）、論理回路など）によってブロックのいずれか又はすべてを実装することができる。

[00153]図１及び２のオーディオＥＱエンジン１１８を実装するための例示的ハードウェア論理、機械可読命令、ハードウェアで実装された状態機械及び／又はそれらの任意の組合せを表すフローチャートが、図７及び１６に示されている。機械可読命令は、図１９に関連して以下で論じられる例示的プロセッサプラットフォーム１９００に示されるプロセッサ１９１２などのコンピュータプロセッサによる実行のための実行可能プログラム又は実行可能プログラムの部分でよい。ＣＤ－ＲＯＭ、フロッピィディスク、ハードドライブ、ＤＶＤ、ブルーレイディスク、プロセッサ１９１２に関連付けられるメモリなどの非一時的コンピュータ可読記憶媒体に記憶されたソフトウェアでプログラムを実施することができるが、代替として、プログラム全体及び／若しくはその部分をプロセッサ１９１２以外のデバイスによって実行することができ、並びに／又はファームウェア若しくは専用ハードウェアで実施することができる。さらに、図７及び１６に示されるフローチャートを参照しながら例示的プログラムが説明されるが、代替として、例示的オーディオＥＱエンジン１１８を実装する多くの他の方法を使用することができる。たとえば、ブロックの実行の順序を変更することができ、及び／又は記載のブロックの一部を変更し、除去し、若しくは組み合わせることができる。追加又は代替として、ソフトウェア又はファームウェアを実行することなく、対応する動作を実施するように構成された１つ又は複数のハードウェア回路（たとえば、ディスクリート及び／又は集積アナログ及び／又はデジタル回路、ＦＰＧＡ、ＡＳＩＣ、比較器、演算増幅器（オペアンプ）、論理回路など）によってブロックのいずれか又はすべてを実装することができる。

[00154]図１及び３のコンテンツプロファイルエンジン１１６を実装するための例示的ハードウェア論理、機械可読命令、ハードウェアで実装された状態機械及び／又はそれらの任意の組合せを表すフローチャートが、図１０に示されている。機械可読命令は、図２０に関連して以下で論じられる例示的プロセッサプラットフォーム２０００に示されるプロセッサ２０１２などのコンピュータプロセッサによる実行のための実行可能プログラム又は実行可能プログラムの部分でよい。ＣＤ－ＲＯＭ、フロッピィディスク、ハードドライブ、ＤＶＤ、ブルーレイディスク、プロセッサ２０１２に関連付けられるメモリなどの非一時的コンピュータ可読記憶媒体に記憶されたソフトウェアでプログラムを実施することができるが、代替として、プログラム全体及び／若しくはその部分をプロセッサ２０１２以外のデバイスによって実行することができ、並びに／又はファームウェア若しくは専用ハードウェアで実施することができる。さらに、図１０に示されるフローチャートを参照しながら例示的プログラムが説明されるが、代替として、例示的コンテンツプロファイルエンジン１１６を実装する多くの他の方法を使用することができる。たとえば、ブロックの実行の順序を変更することができ、及び／又は記載のブロックの一部を変更し、除去し、若しくは組み合わせることができる。追加又は代替として、ソフトウェア又はファームウェアを実行することなく、対応する動作を実施するように構成された１つ又は複数のハードウェア回路（たとえば、ディスクリート及び／又は集積アナログ及び／又はデジタル回路、ＦＰＧＡ、ＡＳＩＣ、比較器、演算増幅器（オペアンプ）、論理回路など）によってブロックのいずれか又はすべてを実装することができる。

[00155]前述のように、任意の持続時間にわたって（たとえば、長期間の時間枠にわたって、永続的に、短い事例にわたって、一時的にバッファリングする間、及び／又は情報のキャッシングにわたって）情報が記憶される、ハードディスクドライブ、フラッシュメモリ、読取り専用メモリ、コンパクトディスク、デジタルバーサタイルディスク、キャッシュ、ランダムアクセスメモリ及び／又は任意の他の記憶デバイス若しくは記憶ディスクなどの非一時的コンピュータ及び／又は機械可読媒体に記憶された実行可能命令（たとえば、コンピュータ及び／又は機械可読命令）を使用して、図５、６、７、１０、１１、１２、１４、１５及び１６の例示的プロセスを実装することができる。本明細書では、非一時的コンピュータ可読媒体という用語は、任意のタイプのコンピュータ可読記憶デバイス及び／又は記憶ディスクを含み、伝播信号を除外し、伝送媒体を除外するように明白に定義される。

[00156]「含む（ｉｎｃｌｕｄｉｎｇ）」及び「備える（ｃｏｍｐｒｉｓｉｎｇ）」（並びにそのすべての形及び時制）は、本明細書では非限定的用語となるように使用される。したがって、クレームが任意の形の「含む（ｉｎｃｌｕｄｅ）」又は「備える（ｃｏｍｐｒｉｓｅ）」（たとえば、ｃｏｍｐｒｉｓｅｓ、ｉｎｃｌｕｄｅｓ、ｃｏｍｐｒｉｓｉｎｇ、ｉｎｃｌｕｄｉｎｇ、ｈａｖｉｎｇなど）を、前文として、又は任意の種類のクレーム列挙内で利用するときはいつでも、対応するクレーム又は列挙の範囲外となることなく、追加の要素、用語などが存在することがあることを理解されたい。本明細書では、「少なくとも」という語句が、たとえばクレームの前文での移行用語として使用されるとき、「備える」及び「含む」が非限定的であるのと同様に非限定的である。「及び／又は」という用語は、たとえばＡ、Ｂ及び／又はＣという形などで使用されるとき、（１）Ａのみ、（２）Ｂのみ、（３）Ｃのみ、（４）ＡとＢ、（５）ＡとＣ、（６）ＢとＣ、及び（７）ＡとＢとＣなどの、Ａ、Ｂ、Ｃの任意の組合せ又はサブセットを指す。本明細書の構造、構成要素、項目、物体及び／又は事柄を記述する文脈では、「Ａ及びＢの少なくとも一方」という語句は、（１）少なくとも１つのＡ、（２）少なくとも１つのＢ、並びに（３）少なくとも１つのＡ及び少なくとも１つのＢのいずれかを含む実装を指すものとする。同様に、本明細書の構造、構成要素、項目、物体及び／又は事柄を記述する文脈では、「Ａ又はＢの少なくとも一方」という語句は、（１）少なくとも１つのＡ、（２）少なくとも１つのＢ、並びに（３）少なくとも１つのＡ及び少なくとも１つのＢのいずれかを含む実装を指すものとする。本明細書のプロセス、命令、動作、活動及び／又はステップの実施又は実行を記述する文脈では、「Ａ及びＢの少なくとも一方」という語句は、（１）少なくとも１つのＡ、（２）少なくとも１つのＢ、並びに（３）少なくとも１つのＡ及び少なくとも１つのＢのいずれかを含む実装を指すものとする。同様に、本明細書のプロセス、命令、動作、活動及び／又はステップの実施又は実行を記述する文脈では、「Ａ又はＢの少なくとも一方」という語句は、（１）少なくとも１つのＡ、（２）少なくとも１つのＢ、並びに（３）少なくとも１つのＡ及び少なくとも１つのＢのいずれかを含む実装を指すものとする。
第１の実装：フィルタベースの等化

[00157]図５は、第１の実装による、メディア特性のリアルタイム解析に基づいてメディア再生設定を動的に調節するように図１及び２のメディアユニット１０６を実装するために実行することのできる例示的機械可読命令５００を表すフローチャートである。先行する図及び関連する説明を参照して、例示的機械可読命令５００は、例示的メディアユニット１０６がオーディオ信号にアクセスすることから始まる（ブロック５０２）。いくつかの例では、信号変換器２０４が入力メディア信号２０２にアクセスする。

[00158]ブロック５０４で、例示的メディアユニット１０６はオーディオ信号を周波数表現に変換する。いくつかの例では、信号変換器２０４が入力メディア信号２０２を周波数及び／又は特性表現（たとえば、ＣＱＴ表現、ＦＦＴ表現など）に変換する。

[00159]ブロック５０６で、例示的メディアユニット１０６は周波数表現をＥＱニューラルネットワークに入力する。いくつかの例では、ＥＱモデル照会ジェネレータ２０６が、入力メディア信号２０２の周波数表現をＥＱニューラルネットワーク４０２に入力する。いくつかの例では、ＥＱモデル照会ジェネレータ２０６は、ＥＱニューラルネットワーク４０２によって出力されたモデルに入力メディア信号２０２を入力する。

[00160]ブロック５０８で、例示的メディアユニット１０６は、利得、周波数及びＱ値を含む複数のフィルタ設定にアクセスする。いくつかの例では、ＥＱフィルタ設定アナライザ２０８が、利得、周波数及びＱ値を含む複数のフィルタ設定にアクセスする。いくつかの例では、ＥＱフィルタ設定アナライザ２０８は、ＥＱニューラルネットワーク４０２によって出力された利得、周波数及びＱ値を含む複数のフィルタ設定（たとえば、フィルタ設定のセット）にアクセスする。いくつかの例では、ＥＱフィルタ設定アナライザ２０８は、ＥＱニューラルネットワーク４０２によって出力された１つ又は複数の高シェルフフィルタ、１つ又は複数の低シェルフフィルタ並びに／或いは１つ又は複数のピーキングフィルタにアクセスする。

[00161]ブロック５１０で、例示的メディアユニット１０６は、入力メディア信号２０２に適用する１つ又は複数のフィルタを選択する。いくつかの例では、ＥＱフィルタセレクタ２１８が、入力メディア信号２０２に適用する１つ又は複数のフィルタを選択する。たとえば、５帯域フィルタを実装するために、ＥＱフィルタセレクタ２１８は、ＥＱニューラルネットワーク４０２によって出力されたフィルタのセットから、１つの低シェルフフィルタ、１つの高シェルフフィルタ及び３つのピーキングフィルタを選択することができる。

[00162]ブロック５１２で、例示的メディアユニット１０６は、選択したフィルタ（複数可）の設定に基づいてフィルタ係数を計算する。いくつかの例では、ＥＱフィルタ設定アナライザ２０８が、選択したフィルタ（複数可）のフィルタ設定に基づいてフィルタ係数を計算し、入力メディア信号２０２への１つ又は複数のフィルタ（複数可）の適用を可能にする。

[00163]ブロック５１４で、例示的メディアユニットは等化設定をパーソナライズする。いくつかの例では、ＥＱパーソナライゼーションマネージャ２１０が等化設定をパーソナライズした（たとえば、ＥＱ設定をパーソナライズした）。等化設定をパーソナライズするための詳細な例示的機械可読命令が、図６に関連して図示され、説明される。

[00164]ブロック５１６で、例示的メディアユニット１０６は、前のフィルタ設定（たとえば、前のオーディオ再生設定）から遷移するように、選択したフィルタ（複数可）を平滑化と共に適用する。いくつかの例では、ＥＱ調節インプリメンタ２２０が、選択したフィルタ（複数可）を適用し、平滑化フィルタコンフィギュレータ２２２によって示される平滑化フィルタに基づいて新しい再生設定に遷移する。いくつかの例では、ＥＱ調節インプリメンタ２２０は、平滑化フィルタなしにＥＱフィルタ（たとえば、オーディオ再生設定）を実装することができる。

[00165]ブロック５１８で、例示的メディアユニット１０６は、更新持続時間しきい値が満たされるかどうかを判定する。いくつかの例では、更新モニタ２２６が、更新持続時間しきい値が満たされるかどうかを判定する。たとえば、更新持続時間しきい値が１秒に設定される場合、更新モニタ２２６は、前のオーディオ再生設定が決定され、実装されてから１秒が経過したかどうかを判定する。更新持続時間しきい値が満たされることに応答して、処理はブロック５０２に移る。逆に、更新持続時間しきい値が満たされないことに応答して、処理はブロック５２０に移る。

[00166]ブロック５２０で、例示的メディアユニット１０６は、動的オーディオ再生設定調節が使用可能にされるかどうかを判定する。動的オーディオ再生設定調節が使用可能にされることに応答して、処理はブロック５１８に移る。逆に、動的オーディオ再生設定調節が可能にされないことに応答して、処理は終了する。

[00167]図６は、等化設定をパーソナライズするように図１及び２のメディアユニット１０６を実装するために実行することのできる例示的機械可読命令５１４及び／又は例示的機械可読命令１１０６を表すフローチャートである。先行する図及び関連する説明を参照して、例示的機械可読命令５１４及び／又は例示的機械可読命令１１０６は、例示的メディアユニット１０６が過去のパーソナライゼーション設定にアクセスすることから始まる（ブロック６０２）。

[00168]ブロック６０４で、例示的メディアユニット１０６は、過去のパーソナライゼーション設定に基づいて、パーソナライズされたＥＱ曲線を生成し、又は新しいパーソナライズされたＥＱ曲線を開始する。いくつかの例では、履歴ＥＱマネージャ２１４が、過去のパーソナライゼーション設定に基づいて、パーソナライズされたＥＱ曲線を生成し、又は新しいパーソナライズされたＥＱ曲線を開始する。

[00169]ブロック６０６で、例示的メディアユニット１０６は、履歴ＥＱが使用可能にされるかどうかを判定する。いくつかの例では、履歴ＥＱマネージャ２１４が、履歴ＥＱが使用可能にされる（たとえば履歴等化が使用可能にされる）かどうかを判定する。履歴ＥＱが使用可能にされることに応答して、処理はブロック６０８に移る。逆に、履歴ＥＱが可能にされないことに応答して、処理はブロック６１０に移る。

[00170]ブロック６０８で、例示的メディアユニット１０６は、履歴期間からのＥＱ曲線に基づいて、パーソナライズされたＥＱ曲線を調節する。いくつかの例では、履歴ＥＱマネージャ２１４が、履歴期間（たとえば、過去の時間、過去の日など）からのＥＱ曲線に基づいて、パーソナライズされたＥＱ曲線を調節する。

[00171]ブロック６１０で、例示的メディアユニット１０６は、ユーザプリファレンスデータ（たとえば、ユーザのプリファレンスを示すデータ）が利用可能であるかどうかを判定する。いくつかの例では、ユーザ入力アナライザ２１６が、ユーザプリファレンスデータが利用可能であるかどうかを判定する。たとえば、ユーザ入力アナライザ２１６は、ユーザが音楽を聴取しながら「いいね」ボタンを押した場合に基づいて、ユーザＥＱプリファレンスを決定することができる。ユーザプリファレンスデータが利用可能であること（たとえば、ユーザプリファレンスデータの可用性）に応答して、処理はブロック６１２に移る。逆に、ユーザプリファレンスデータが利用可能ではないないことに応答して、処理はブロック６１６に移る。

[00172]ブロック６１２で、メディア例ユニット１０６は、過去のユーザプリファレンス入力（たとえば、「いいね」レーティングなど）に基づいてＥＱパラメータを決定する。いくつかの例ではユーザ入力アナライザ２１６が、過去のユーザプリファレンス入力に基づいてＥＱパラメータを決定する。

[00173]ブロック６１４で、例示的メディアユニット１０６は、過去のユーザプリファレンス入力に基づいて、パーソナライズされたＥＱ曲線を調節する。いくつかの例では、ユーザ入力アナライザ２１６が、履歴期間からのＥＱ曲線に基づいて、パーソナライズされたＥＱ曲線を調節する。

[00174]ブロック６１６で、例示的メディアユニット１０６は、位置データが利用可能であるかどうかを判定する。いくつかの例では、デバイスパラメータアナライザ２１２が、位置データが利用可能であるかどうかを判定する。位置データが利用可能であること（たとえば、位置データの可用性）に応答して、処理はブロック６１８に移る。逆に、位置データが利用可能ではないことに応答して、処理はブロック６２０に移る。

[00175]ブロック６１８で、例示的メディアユニット１０６は、デバイスの位置に基づいて、パーソナライズされたＥＱ曲線を調節する。いくつかの例では、デバイスパラメータアナライザ２１２が、デバイスの位置に基づいて、パーソナライズされたＥＱ曲線を調節する。たとえば、デバイスがジムにある場合、デバイスが職場にある場合とは異なる、パーソナライズされたＥＱ曲線を生成することができる。

[00176]ブロック６２０で、例示的メディアユニット１０６は、ユーザ識別が利用可能であるかどうかを判定する。いくつかの例では、デバイスパラメータアナライザ２１２が、ユーザ識別が利用可能であるかどうかを判定する。ユーザ識別が利用可能であること（たとえば、ユーザ識別の可用性）に応答して、処理はブロック６２２に移る。逆に、ユーザ識別が利用可能ではないことに応答して、処理はブロック６２４に移る。

[00177]ブロック６２２で、例示的メディアユニット１０６は、ユーザ識別に基づいて、パーソナライズされたＥＱ曲線を調節する。たとえば、デバイスパラメータアナライザ２１２が、ほとんどはロック音楽を聴取する（たとえば、履歴ＥＱマネージャ２１４による）履歴プロファイルを有する第１のユーザがメディアユニット１０６を使用していると判定することができる。そのような例では、デバイスパラメータアナライザ２１２は、パーソナライズされたＥＱ曲線をロック音楽により適するように調節することができる。したがって、履歴ＥＱマネージャ２１４に記憶されたデータは、特定のユーザ、位置、オーディオを供給するアプリなどに基づいてフィルタリング可能でよい。

[00178]ブロック６２４で、例示的メディアユニット１０６は、ソース情報が利用可能であるかどうかを判定する。いくつかの例では、デバイスパラメータアナライザ２１２が、ソース情報が利用可能であるかどうかを判定する。ソース情報が利用可能であること（たとえば、ソース情報の可用性）に応答して、処理はブロック６２６に移る。逆に、ソース情報が利用可能ではないことに応答して、処理はブロック６２８に移る。

[00179]ブロック６２６で、例示的メディアユニット１０６は、ソース情報に基づいて、パーソナライズされたＥＱ曲線を調節する。いくつかの例では、デバイスパラメータアナライザ２１２が、ソース情報に基づいて、パーソナライズされたＥＱ曲線を調節する。たとえば、ソース情報は、モバイルデバイスの特定のアプリ（たとえば、音楽アプリ、フィットネスアプリ、オーディオブックアプリなど）を示すことができる。入力メディア信号２０２のソースに基づいて、パーソナライズされたＥＱ曲線を調節することができる。

[00180]ブロック６２８で、例示的メディアユニット１０６は、動的に生成されたフィルタ出力をパーソナライズされたＥＱ曲線と混合することによって、入力メディア信号２０２に適用すべき、選択したＥＱフィルタ（複数可）を調節する。たとえば、（たとえば、ＥＱニューラルネットワークに発信された照会からの出力に基づいて）動的に生成された曲線及びパーソナライズされたＥＱ曲線のそれぞれに重みを適用することができ、平均曲線を生成して、入力メディア信号２０２に適用することができる。したがって、この平均曲線は、トラック並びにパーソナルプリファレンスの間のどちらの変動も反映する。ブロック６２８の後、機械可読命令５１４及び／又は機械可読命令１１０６は、それぞれ機械可読命令５００のブロック５１６、及び機械可読命令１１００のブロック１１０８に戻る。

[00181]図７は、第１の実装による、ＥＱニューラルネットワーク４０２をトレーニングするように図４のオーディオＥＱエンジン１１８を実装するために実行することのできる例示的機械可読命令７００を表すフローチャートである。先行する図及び関連する説明を参照して、例示的機械可読命令７００は、例示的オーディオＥＱエンジン１１８が基準オーディオ信号のライブラリにアクセスすることから始まる（ブロック７０２）。いくつかの例では、ＥＱニューラルネットワーク４０２が基準オーディオ信号のライブラリにアクセスする。基準オーディオ信号のライブラリは、それについてのオーディオ再生設定が（たとえば、エキスパートによって）決定されているオーディオ信号を含む。

[00182]ブロック７０４で、例示的オーディオＥＱエンジン１１８は、基準オーディオ信号に関連付けられるＥＱパラメータにアクセスする。いくつかの例では、ＥＱニューラルネットワーク４０２が、基準オーディオ信号に関連付けられるＥＱパラメータ（たとえば、オーディオ再生設定）にアクセスする。たとえば、ＥＱニューラルネットワーク４０２は、１つ又は複数のフィルタ、１つ又は複数の利得値、周波数値、Ｑ値などにアクセスすることができる。

[00183]ブロック７０６で、例示的オーディオＥＱエンジン１１８は、複数の基準オーディオ信号のうちの基準オーディオ信号を選択する。いくつかの例では、ＥＱニューラルネットワーク４０２が、複数の基準オーディオ信号のうちの基準オーディオ信号を選択する。

[00184]ブロック７０８で、例示的オーディオＥＱエンジン１１８は基準オーディオ信号をサンプリングする。いくつかの例では、ＥＱニューラルネットワーク４０２が、所定の数のサンプル（たとえば、３００、５００など）をオーディオ信号から作成することによって基準オーディオ信号をサンプリングする。

[00185]ブロック７１０で、例示的オーディオＥＱエンジン１１８は、基準オーディオ信号のサンプルを、基準オーディオ信号に対応するＥＱパラメータ（たとえば、オーディオ再生設定）に関連付ける。いくつかの例では、ＥＱニューラルネットワーク４０２が、基準オーディオ信号のサンプルを、基準オーディオ信号に対応するＥＱパラメータに関連付ける。

[00186]ブロック７１２で、例示的オーディオＥＱエンジン１１８は、トレーニングのために使用する追加の基準オーディオ信号があるかどうかを判定する。いくつかの例では、ＥＱニューラルネットワーク４０２が、トレーニングのために使用する追加の基準オーディオ信号があるかどうかを判定する。トレーニングのために使用する追加の基準オーディオ信号があることに応答して、処理はブロック７０６に移る。逆に、トレーニングのために使用する追加の基準オーディオ信号がないことに応答して、処理は終了する。

[00187]図８Ａは、オーディオ特性のリアルタイム解析に基づく動的オーディオ再生設定調節を受けたが、平滑化フィルタを用いていないオーディオ信号の第１のスペクトログラム８００ａである。第１のスペクトログラム８００ａは、水平軸線８０２（たとえば、ｘ軸線）上のヘルツ単位の周波数値と、垂直軸線８０４（たとえば、ｙ軸線）上の秒単位のオーディオ信号の時間値とを示す。第１のスペクトログラム８００ａのシェーディングは、オーディオ信号についての特定の周波数及び時間での、オーディオ信号の振幅を表す。第１のスペクトログラム８００ａのシェーディングは、多数の周波数でのオーディオ信号振幅間で鋭い遷移を示す。たとえば、第１のスペクトログラム８００ａのシェーディングは、少なくとも部分的には、平滑化フィルタなしに実装される、本明細書で論じられる動的オーディオ再生設定調節技法によって実装されるオーディオ再生設定間の遷移のために、個々の周波数帯内の明るいシェーディングと暗いシェーディングとの間で急激に遷移する。

[00188]図８Ｂは、図８Ａの第１のスペクトログラム８００ａについての周波数値に対する平均利得値を示す第１のプロット８００ｂである。第１のプロット８００ｂは、水平軸線８０６（たとえば、ｘ軸線）上のヘルツ単位の周波数値と、垂直軸線８０８（たとえば、ｙ軸線）上のデシベル単位の平均利得値とを含む。平滑化なしにオーディオ再生設定が調節されたオーディオ信号の平均利得値を表す第１のプロット８００ｂと、平滑化と共にオーディオ再生設定が調節されたオーディオ信号の平均利得値を表す第２のプロット９００ｂとの比較は、オーディオ再生設定間の遷移時に平滑化フィルタを適用することの利点を示す。

[00189]図９Ａは、平滑化フィルタを含む、オーディオ特性のリアルタイム解析に基づく動的オーディオ再生設定調節を受けたオーディオ信号の第２のスペクトログラム９００ａである。第２のスペクトログラム９００ａは、水平軸線９０２（たとえば、ｘ軸線）上のヘルツ単位の周波数値と、垂直軸線９０４（たとえば、（たとえば、ｙ軸線）上の秒単位の時間値とを含む。第２のスペクトログラム９００ａは、第１のスペクトログラム８００ａ（図８Ａ）の元の入力オーディオ信号に対応するが、トラック全体にわたってオーディオ再生設定を適用するときに平滑化フィルタが利用された。第１のスペクトログラム８００ａに比べて、第２のスペクトログラム９００ａは、多数の周波数でのオーディオ信号振幅間の滑らかな（たとえば、段階的な）遷移を示す。たとえば、第１のスペクトログラム８００ａのシェーディングは、図８Ａの第１のスペクトログラム８００ａで示される比較的急激な遷移ではなく、個々の周波数帯内の明るいシェーディングと暗いシェーディングとの間で滑らかに遷移する。

[00190]図９Ｂは、図９Ａの第２のスペクトログラム９００ａでの周波数値に対する平均利得値を示す第２のプロット９００ｂである。第２のプロット９００ｂは、水平軸線９０６（たとえば、ｘ軸線）上のヘルツ単位の周波数値と、垂直軸線９０８（たとえば、ｙ軸線）上のデシベル単位の平均利得値とを含む。図８Ｂの第１のプロット８００ｂに比べて、第２のプロット９００ｂは、多数の周波数帯での平均利得値間のより滑らかな遷移を示す。たとえば、第１のプロット８００ｂで７７Ｈｚの周りに見える平均利得値の多数の急激な遷移が、第２のプロット９００ｂでは存在せず、第２のプロット９００ｂは、７７Ｈｚの周りで平均利得値の段階的で滑らかな減少を示す。
第２の実装：プロファイルベースの等化

[00191]図１０は、再生デバイスにコンテンツのストリーム（たとえば、入力メディア信号２０２）と共にプロファイル情報（たとえば、１つ又は複数のプロファイル２２９）を配信するように図１及び３のコンテンツプロファイルエンジン１１６を実装するために実行することのできる例示的機械可読命令１０００を表すフローチャートである。本明細書で説明されるように、いくつかの例では、コンテンツプロファイルエンジン１１６は、とりわけ、メディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６に配信すべき入力メディア信号２０２についての１つ又は複数のプロファイル２２９を決定及び／又は生成する。先行する図及び関連する説明を参照して、例示的機械可読命令１０００は、コンテンツプロファイルエンジン１１６が再生デバイスに配信すべきコンテンツのストリームにアクセスするときに始まる（ブロック１００２）。たとえば、コンテンツリトリーバ３０２が、ネットワーク１１２を介して再生デバイスに入力メディア信号２０２を供給しているコンテンツプロバイダ１１４からの入力メディア信号２０２にアクセスすることができる。別の例として、コンテンツリトリーバ３０２は、再生デバイスによってローカルに記憶される、コンテンツプロバイダ１１４からの入力メディア信号２０２（たとえば、コンテンツのストリーム）にアクセスすることができる。本明細書で説明されるように、コンテンツリトリーバ３０２は、オーディオコンテンツストリーム、ビデオストリームなどの様々なタイプのコンテンツストリームにアクセスすることができる。たとえば、コンテンツリトリーバ３０２は、歌又は他の音楽のストリーム、音声コンテンツのストリーム、ポッドキャストなどにアクセスすることができる。

[00192]ブロック１００４で、コンテンツプロファイルエンジン１１６は、再生デバイスに配信すべき入力メディア信号２０２の一部（たとえば、コンテンツのストリーム内のコンテンツの一部）を特定する。たとえば、コンテンツ識別器３０６は、基準フィンガープリントジェネレータ２２７によって生成された基準フィンガープリントなどの、既知のコンテンツに関連付けられる基準フィンガープリントのセットに対する、コンテンツについてのフィンガープリントの比較を含む、様々なプロセスを使用して入力メディア信号２０２の部分を特定することができる。もちろん、コンテンツ識別器３０６は、１つのコンテンツに関連付けられるメタデータ（たとえば、関連するタイトル、アーティスト、ジャンルなどを特定する情報）、コンテンツプロバイダ１１４に関連付けられる情報などの他の情報を使用して、１つのコンテンツを特定することができる。

[00193]いくつかの例では、コンテンツ識別器３０６は、入力メディア信号２０２の部分（たとえば、１つのコンテンツ）に関連付けられる一定のカテゴリタイプ又はジャンルを特定することができる。たとえば、入力メディア信号２０２を特定の１つのコンテンツ（たとえば、特定の歌、ユーチューブ（商標）ビデオ／クリップ、ＴＶ番組、映画、ポッドキャストなど）と特定する代わりに、コンテンツ識別器３０６は、本明細書で説明される技法を使用して、入力メディア信号２０２の部分（たとえば、１つのコンテンツ）に適用されるジャンル又はカテゴリを特定することができる。

[00194]ブロック１００６で、コンテンツプロファイルエンジン１１６は、識別した１つのコンテンツについてのプロファイルを決定する。たとえば、プロファイラ３０８は、１つのコンテンツの全体部分についての１つ又は複数の特性を決定することができ、及び／或いはコンテンツのフレーム又はフレームのブロックなどの入力メディア信号２０２の部分（たとえば、１つのコンテンツ）の複数の部分についての１つ又は複数の特性を決定することができる。たとえば、１つ又は複数のプロファイル２２９は、入力メディア信号２０２の第１の部分（たとえば、１つのコンテンツ）についての１つ又は複数の特性の第１のセット、入力メディア信号２０２の第２の部分（たとえば、１つのコンテンツ）についての１つ又は複数の特性の第２のセットなどを含むことができる。

[00195]いくつかの例では、プロファイラ３０８は、様々な異なる特性を有するオーディオコンテンツなどの入力メディア信号２０２（たとえば、１つのコンテンツ）についての１つ又は複数のプロファイル２２９をレンダリング、生成、作成及び／又は決定することができる。たとえば、決定又は生成した１つ又は複数のプロファイル２２９は、等化（ＥＱ）設定、空間化設定、仮想化設定、ビデオ設定などに関連付けられる特性を含むことができる。

[00196]ブロック１００８で、コンテンツプロファイルエンジン１１６は、再生デバイスに１つ又は複数のプロファイル２２９を配信する。たとえば、プロファイラ３０８が、ネットワーク１１２を介して、又は他の通信チャネルを介して、再生デバイスに１つ又は複数のプロファイル２２９を配信することができる。

[00197]たとえば、コンテンツプロファイルエンジン１１６は、カーステレオである再生デバイスにストリーミングすべき歌である１つのコンテンツにアクセスし、歌を、「クラシック音楽」のジャンルに関連付けられる特定の歌と特定し、カーステレオを介して歌を再生するときに使用すべき等化設定のセット（たとえば、歌の中の様々な周波数についての信号強度標識、スピーカ空間化設定など）を含むプロファイルを決定し、カーステレオの動作を制御する、カーエリアネットワーク（ＣＡＮ）などのカーステレオに関連付けられるネットワークによって消費されるべきカーステレオにプロファイルを配信することができる。

[00198]別の例では、コンテンツプロファイルエンジン１１６は、ブロードキャストネットワーク又はインターネットを介して、ＴＶセット又はセットトップボックスである再生デバイスにストリーミングすべき映画である１つのコンテンツにアクセスし、映画を、「アクション」のジャンルに関連付けられる、特定の映画としての特定の映画と特定し、多くの高速なアクションシーケンスを保有していると特定し、ＴＶセット又は他のデバイスを介して映画を再生するときに使用すべきイメージ処理設定のセット（たとえば、カラーパレット設定、フレームレートアップスケーリング設定、低コントラストシーンについてのコントラスト強調設定など）を含むプロファイルを決定し、レンダリング、したがってユーザによるコンテンツ体験を調節するためにＴＶセット又は他のデバイスにプロファイルを配信することができる。

[00199]図１１は、修正後再生設定を使用してコンテンツを再生するように図１及び２のメディアユニット１０６を実装するために実行することのできる例示的機械可読命令１１００を表すフローチャートである。本明細書で説明するように、いくつかの例では、メディアユニット１０６は、とりわけ再生デバイス（たとえば、メディアデバイス１０２、メディアデバイス１０４及び／又はメディアユニット１０６）によるコンテンツの再生を修正又は調節する。先行する図及び関連する説明を参照して、例示的機械可読命令１１００は、メディアユニット１０６が再生デバイスのコンテンツのストリーム又は再生デバイスに関連付けられるコンテンツのストリームを受信及び／又はアクセスするときに始まる（ブロック１１０２）。たとえば、メディアユニット１０６、及び／又は、より具体的にはシンクロナイザ２２８が、再生デバイスによって再生すべき入力メディア信号２０２（たとえば、コンテンツストリーム）にアクセスすることができる。

[00200]ブロック１１０４で、メディアユニット１０６は、コンテンツのストリームに関連付けられるプロファイル情報にアクセスする。たとえば、メディアユニット１０６、及びより具体的にはシンクロナイザ２２８は、コンテンツプロファイルエンジン１１６によって生成されるプロファイル又はプロファイル情報を受信することができる。本明細書で説明されるように、コンテンツプロファイルエンジン１１６は、既知のコンテンツに関連付けられるフィンガープリントのセットに対する、コンテンツのストリームに関連付けられるフィンガープリントの比較に基づいてコンテンツのストリームを特定することによってプロファイルを決定し、識別した入力メディア信号２０２（たとえば、コンテンツのストリーム）に関連付けられる１つ又は複数のプロファイル２２９を選択或いは決定することができる。

[00201]１つ又は複数のプロファイル２２９は、歌に関連付けられるカテゴリ又はジャンルを特定する情報、アップビートムード、リラックスしたムード、ソフトムードなどの、歌に関連付けられるムードを特定する情報、低音及び他の類似のトーンについての低周波数、音声又は歌唱トーンについての高周波数などの、コンテンツ内の様々な周波数についての信号強度パラメータを特定する情報、音声コンテンツから取得される韻律情報及び／又は言語情報などの様々なタイプの情報を含むことができる。

[00202]追加又は代替として、１つ又は複数のプロファイル２２９は、ビデオ、又はビデオクリップのセグメントに関連付けられるカテゴリ又はジャンルを特定する情報、ビデオに関連付けられるムードを特定する情報、輝度を特定する情報、カラーパレット、カラーコントラスト、輝度範囲、ぼやけ、ディスプレイフォーマット、ビデオシーン情報、視覚的物体検出及び／又は認識から得られる情報、顔検出及び／又は認識、或いはブロードキャストロゴ検出及び／又は認識アルゴリズム、テキスト又はサブタイトルの存在及び／又は内容、透かしの存在及び／又は内容などを含むことができる。

[00203]ブロック１１０６で、メディアユニット１０６は等化設定をパーソナライズする。いくつかの例では、ＥＱパーソナライゼーションマネージャ２１０が等化設定をパーソナライズする。等化設定をパーソナライズするための詳細な命令は、図６に関連して図示され、説明される。

[00204]ブロック１１０８で、メディアユニット１０６は、アクセスしたプロファイル情報、及び／又はブロック１１０６で生成された、パーソナライズされたＥＱプロファイルに基づいて、入力メディア信号２０２（たとえば、コンテンツのストリーム）の再生を修正する。たとえば、ＥＱ調節インプリメンタ２２０は、１つ又は複数のプロファイル２２９及びパーソナライズされたＥＱプロファイルに基づいて生成された混合等化に基づいて、再生デバイス上の入力メディア信号２０２の再生を修正することができる。別の例では、ＥＱ調節インプリメンタ２２０は、入力メディア信号２０２（たとえば、コンテンツのストリーム）の再生中に等化を調節及び／又は調整するために、再生デバイスのイコライザの設定を修正又は調節するように１つ又は複数のプロファイル２２９内の情報を適用することができる。等化に加えて、ＥＱ調節インプリメンタ２２０は、仮想化設定、空間化設定などの様々な異なる再生設定を調節することができる。

[00205]いくつかの例では、メディアユニット１０６は、コンテンツの異なる部分に関係する複数の設定を含むプロファイルにアクセスすることができる。たとえば、歌は、相異なるテンポを有する部分を含むことがあり、歌のために生成された、対応するプロファイルが、とりわけ、「低速」の設定を有する第１の部分と、「高速」の設定を有する第２の部分と、「低速」の設定を有する第３の部分とを含むことがある。メディアユニット１０６は、再生デバイスとは異なるプラットフォームからプロファイルを受信することができ、プロファイルに含まれる複数の設定を使用して再生設定を正確に調節するために、プロファイルを歌に同期することができる。

[00206]図１２は、コンテンツに関連付けられるプロファイル情報に基づいて再生設定を調節するように図１及び２のメディアユニット１０６を実装するために実行することのできる例示的機械可読命令１２００を表すフローチャートである。たとえば、メディアユニット１０６は、いくつかの例によれば、コンテンツに関連付けられるプロファイル情報に基づいて再生設定を調節することができる。先行する図及び関連する説明を参照して、例示的機械可読命令１２００は、メディアユニット１０６が入力メディア信号２０２（たとえば、１つのコンテンツ）についての１つ又は複数のプロファイル２２９にアクセスするときに始まる（ブロック１２０２）。たとえば、メディアユニット１０６、及び／又はより具体的には、シンクロナイザ２２８が、単一の設定プロファイル、複数の設定プロファイルなどの様々なタイプのプロファイルにアクセスすることができる。

[00207]ブロック１２０４で、メディアユニット１０６は、入力メディア信号２０２（たとえば、１つのコンテンツ）に１つ又は複数のプロファイル２２９を同期する。たとえば、シンクロナイザ２２８は、入力メディア信号２０２（たとえば、１つのコンテンツ）に関連付けられるフィンガープリント（複数可）を利用して、１つ又は複数のプロファイル２２９に入力メディア信号２０２（たとえば、１つのコンテンツ）を同期することができる。１つ又は複数のプロファイル２２９は、１つのコンテンツについての既知のフィンガープリントに１つ又は複数の設定を関係付け、入力メディア信号２０２の再生中に１つのコンテンツに１つ又は複数のプロファイル２２９を同期するために入力メディア信号２０２の一部（たとえば、１つのコンテンツ）に設定を位置合せする情報を含むことができる。別の例として、シンクロナイザ２２８は、１つのコンテンツ内の様々なオーディオイベント（たとえば、スネアヒット、ギターソロの開始、最初のボーカル）を特定し、入力メディア信号２０２の再生中に１つのコンテンツに１つ又は複数のプロファイル２２９を同期するために、入力メディア信号２０２内のイベントに１つ又は複数のプロファイル２２９を位置合せすることができる。

[00208]ブロック１２０６で、メディアユニット１０６は、入力メディア信号２０２についての同期したプロファイルに基づいて、再生デバイス（たとえば、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６など）を利用する入力メディア信号２０２の再生を修正する。たとえば、ＥＱ調節インプリメンタ２２０は、入力メディア信号２０２（たとえば、コンテンツのストリーム）の再生中の等化を調節及び／又は調整するために、１つ又は複数のプロファイル２２９内の情報を適用して、再生デバイスのイコライザの設定を修正又は調節することができる。同様に、コンテンツがビデオであるとき、１つ又は複数のプロファイル２２９を使用して、ビデオ関連の設定を調節することができる。

[00209]図１３Ａ～１３Ｂは、本開示の教示による例示的コンテンツプロファイルのブロック図である。図１３Ａは、コンテンツ全体についての単一の設定１３０２、すなわち「ムード＃１」を含むコンテンツプロファイル１３００ａを示す。一方、図１３Ｂは、１つのコンテンツについての複数の異なる設定を含むコンテンツプロファイル１３００ｂを示す。たとえば、コンテンツプロファイル１３００ｂは、設定の中でもとりわけ、第１の設定１３０４（たとえば、「ムード＃１」）、第２の設定１３０６（たとえば、「ムード＃２」）、第３の設定１３０８（たとえば、「ムード＃３」）及び第４の設定１３１０（たとえば、「ムード＃４」）を含む。したがって、いくつかの例では、メディアユニット１０６は、とりわけ、コンテンツの再生中の様々な時のコンテンツの再生体験を動的に調節するために、コンテンツの異なる部分に適用すべき異なる設定を含む複合又は多層プロファイルを利用することができる。

[00210]したがって、本明細書で説明されるシステム及び方法は、プロファイル情報（たとえば、コンテンツプロファイル）のリアルタイム又はほぼリアルタイムの処理及び再生デバイスへの配信を容易にするプラットフォームを提供することができ、再生デバイスは、コンテンツプロファイルを利用して、とりわけユーザにコンテンツを再生することに関連する再生体験（たとえば、ビデオ及び／又はオーディオ体験）を調節する。これは、プロファイルを検索又は予測することができるまで、コンテンツのレンダリングの前にコンテンツをバッファリングすることを伴うことがある。一例として、使用履歴に基づいて特定のプロファイルを適用することができる（たとえば、ユーザが、過去数日／数週にわたって日／週のこの時刻に特定のプロファイルに関連付けられる特定のコンテンツタイプを消費しており、したがって使用パターンの決定後に同一のプロファイルが再び適用される）。別の例では、ユーザが特定のタイプのコンテンツ（たとえば、ＴＶドラマと分類されるビデオクリップ）と共に特定のプロファイルのプリファレンスを先に確立しており、したがって前方のコンテンツに進んで、そのプロファイルが、同一又は類似のタイプのコンテンツに対して自動的に適用される。ユーザについてのプロファイルを予測する別の方法は、協調的フィルタリング方法を適用することによるものでよく、他のユーザのプロファイルが、使用パターン、人口統計情報、又はユーザ若しくはユーザグループについての任意の他の情報に基づいて、特定のユーザに対して推論される。さらに別の例は、プロファイル選択を決定し、又はプロファイル選択に影響を及ぼすために、コンテンツソース設定、たとえば、セットトップボックスに接続する入力と、ＤＶＤプレーヤ又はゲームコンソールに接続する入力との間などの、ＴＶセットに関する選択された入力などのデバイス設定を含めることである。

[00211]多くの再生デバイスが、（１）オンライン、衛星若しくは地上ラジオ局からのコンテンツ、及び／又はローカルに記憶されたコンテンツプレーヤ（たとえば、ＣＤプレーヤ、ＭＰ３プレーヤなど）からのコンテンツを受信及び再生するカーステレオシステム、（２）オンライン、衛星若しくは地上ラジオ局からのコンテンツ、及び／又はローカルに記憶されたコンテンツプレーヤ（たとえば、ＣＤプレーヤ、ＭＰ３プレーヤ、ＴＶセット、セットトップボックス（ＳＴＢ）、ゲームコンソールなど）からのコンテンツを受信及び再生するホームステレオシステム、（３）オンライン、衛星若しくは地上ラジオ局からのコンテンツ（たとえば、ビデオ及び／又はオーディオ）、及び／又はローカルに記憶されたコンテンツプレーヤ（たとえば、ＭＰ３プレーヤ）からのコンテンツを受信及び再生するモバイルデバイス（たとえば、スマートフォン又はタブレット）などを含む、そのようなプラットフォームを利用することができる。

[00212]いくつかの例では、システム及び方法は、低品質又は低音量記録及び他のコンテンツを改善及び／又は最適化することができる。たとえば、コンテンツプロファイルエンジン１１６は、コンテンツのストリーム（たとえば、手作りのポッドキャスト）が低オーディオ品質を有すると特定し、コンテンツの再生をブーストするための命令を含むコンテンツの低品質ストリーム用のプロファイルを生成することができる。次いで、メディアユニット１０６は、とりわけ低品質コンテンツの再生の忠実度をブーストするように再生デバイス（たとえば、モバイルデバイス、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６）の再生設定を調節することができる。

[00213]いくつかの例では、システム及び方法は、コンテンツストリーム内の広告などの一定のタイプのコンテンツの品質を低下させることができる。たとえば、コンテンツプロファイルエンジン１１６は、コンテンツのストリームがコマーシャルブレークを含むことを特定し、コマーシャルブレーク中に再生品質を低下させる、コンテンツのストリーム用のプロファイルを生成することができる。次いで、メディアユニット１０６は、とりわけコマーシャルブレーク中のコンテンツの再生の忠実度を低下させるように再生デバイス（たとえば、モバイルデバイス、メディアデバイス１０２、メディアデバイス１０４、メディアユニット１０６）の再生設定を調節することができる。もちろん、他のシナリオが可能であり得る。
第３の実装：しきい値処理ベースの等化

[00214]図１４は、第３の実装による、オーディオ等化を実施するように図１及び２のメディアユニット１０６を実装するために実行することのできる例示的機械可読命令１４００を表すフローチャートである。先行する図及び関連する説明を参照して、例示的機械可読命令１４００は、例示的メディアユニット１０６が入力メディア信号２０２をバッファに記憶することから始まる（ブロック１４０２）。いくつかの例では、例示的バッファマネージャ２３０がデータストア２２４に入力メディア信号２０２を記憶する。いくつかの例では、バッファマネージャ２３０は、バッファ内のその記憶持続時間（たとえば、１０秒、３０秒など）を超過した入力メディア信号２０２の部分を除去する。

[00215]ブロック１４０４で、例示的メディアユニット１０６は、バッファリング済みオーディオに対する周波数変換を実施する。いくつかの例では、時間－周波数領域コンバータ２３２が、バッファ内の入力メディア信号２０２の部分に対する周波数変換（たとえば、ＦＦＴ）を実施する。

[00216]ブロック１４０６で、例示的メディアユニット１０６は、バッファの持続時間全体にわたる線形空間周波数ビンについての平均値及び標準偏差値を計算する。いくつかの例では、音量計算器２３４が、バッファの持続時間全体にわたる線形空間周波数ビンについての平均値及び標準偏差値を計算する。いくつかの例では、異なる領域（たとえば、時間領域）で、又は異なる単位間隔（たとえば、対数間隔）で平均音量値を計算することができる。

[00217]ブロック１４０８で、例示的メディアユニット１０６は、入力メディア信号２０２の周波数表現に基づいて事前等化ＲＭＳ値を計算する。いくつかの例では、エネルギー計算器２３６が、入力メディア信号２０２の周波数表現に基づいて事前等化ＲＭＳ値を計算する。いくつかの例では、エネルギー計算器２３６は、異なるタイプの計算を利用して、入力メディア信号２０２のエネルギー値を決定する。

[00218]ブロック１４１０で、例示的メディアユニット１０６は、線形空間ビンについての平均値及び標準偏差値をエンジニアタグの表現と共にＥＱニューラルネットワーク４０２に入力する。いくつかの例では、入力特徴セットジェネレータ２３８が、バッファの持続時間全体にわたる線形空間周波数ビンについての平均値及び標準偏差値をＥＱニューラルネットワーク４０２に入力する。非参照オーディオ或いは未確認のオーディオについて、エンジニアタグが、可能な値のセット内のある特定の値に設定される。たとえば、オーディオが未確認であるとき、エンジニアタグが常に特定のエンジニア指示に設定されるように入力特徴セットジェネレータ２３８を構成することができる。いくつかの例では、エンジニアタグがベクトルとして表され、ベクトル要素のうちの１つが、選択されたエンジニアについて「１」に設定され、残りのベクトル要素が「０」に設定される。いくつかの例では、入力メディア信号２０２についての平均及び／又は標準偏差値を別の形式（たとえば、時間領域フォーマット、平均ではなく瞬間音量など）でＥＱニューラルネットワーク４０２に入力することができる。

[00219]ブロック１４１２で、例示的メディアユニット１０６は、ＥＱニューラルネットワーク４０２から、対数空間周波数ビンについての利得／カット値を受け取る。いくつかの例では、音量調節器２４２が、ＥＱニューラルネットワーク４０２から、対数空間周波数ビンについての利得／カット値を受け取る。いくつかの例では、利得／カット値は線形空間周波数表現及び／又は別の領域内でよい。

[00220]ブロック１４１４で、例示的メディアユニット１０６は、入力メディア信号２０２の線形空間平均周波数表現を対数空間平均周波数表現に変換する。いくつかの例では、音量調節器２４２が、対数空間フォーマットで受け取られたＥＱ利得／カット２４１を適用するために、入力メディア信号２０２の線形空間平均周波数表現を対数空間平均周波数表現に変換する。いくつかの例では、ＥＱ利得／カット２４１が異なるフォーマットで受け取られる場合、音量調節器２４２は、ＥＱ利得／カット２４１と同一のフォーマットに対応するように、入力メディア信号２０２の平均周波数表現を調節する。

[00221]ブロック１４１６で、例示的メディアユニット１０６は、対数空間平均周波数表現に利得／カットを適用して、等化後対数空間周波数表現を決定する。いくつかの例では、音量調節器２４２が、対数空間平均周波数表現に利得／カットを適用して、入力メディア信号２０２の等化後対数空間平均周波数表現を決定する。機械可読命令１４００のすべてのステップと同様に、いくつかの例では、着信オーディオ信号の平均表現に利得／カットを適用することを、異なる領域及び／又は異なる単位間隔で行うことができる。

[00222]ブロック１４１８で、例示的メディアユニット１０６は、しきい値処理を実行して等化曲線を平滑化する。いくつかの例では、しきい値処理コントローラ２４４が、しきい値処理を実行して等化曲線を平滑化する。しきい値処理を実行して等化曲線を平滑化するための詳細な命令が、図１５に関連して図示され、説明される。

[00223]ブロック１４２０で、例示的メディアユニット１０６は等化後ＲＭＳ値を計算する。いくつかの例では、しきい値処理コントローラ２４４が等化曲線の平滑化を終了した後（たとえば、不規則性の削減後）に、エネルギー計算器２３６が、等化後オーディオ信号に基づいて等化後ＲＭＳ値を計算する。いくつかの例では、エネルギー計算器２３６は、等化後オーディオ信号のエネルギーの別の尺度を計算する。いくつかの例では、ＥＱ曲線ジェネレータ２４６が（たとえば、線形空間周波数表現で）最終的等化曲線を生成し、入力メディア信号２０２に適用した後に、エネルギー計算器２３６は等化後ＲＭＳ値を計算する。

[00224]ブロック１４２２で、例示的メディアユニット１０６は、事前等化ＲＭＳ及び等化後ＲＭＳの計算に基づいて音量正規化を決定する。いくつかの例では、エネルギー計算器２３６は、等化後ＲＭＳと事前等化ＲＭＳの比（又は他の比較メトリック）を計算し、音量ノーマライザ２４８が、この比がオーディオ信号のエネルギーの最大許容変化に関連付けられる（たとえば、許容変化に関連付けられる）しきい値を超えているかどうかを判定する。いくつかのそのような例では、比がしきい値を超えていることに応答して、音量ノーマライザ２４８は、正規化全利得を等化後オーディオ信号に適用する。たとえば、等化後のオーディオ信号の全エネルギーが等化前の全エネルギーの２倍である場合、音量ノーマライザ２４８は、オーディオ信号の全音量を正規化するために全利得１／２を適用することができる。

[00225]ブロック１４２４で、例示的メディアユニット１０６は、オーディオ信号の等化後対数空間周波数表現から平均周波数表現を差し引き、最終的等化曲線を決定する。いくつかの例では、ＥＱ曲線ジェネレータ２４６が、オーディオ信号の等化後対数空間周波数表現から平均周波数表現を差し引き、最終的等化曲線を決定する。

[00226]ブロック１４２６で、例示的メディアユニット１０６は、入力メディア信号２０２の線形空間周波数表現に最終的等化曲線を適用する。いくつかの例では、ＥＱ曲線ジェネレータ２４６が最終的等化曲線を適用し、音量ノーマライザ２４８によって示される全利得調節があればそれをさらに行う。いくつかの例では、ＥＱ曲線ジェネレータ２４６が最終的等化曲線を適用する前又は後に、音量ノーマライザ２４８は音量正規化を実施することができる。

[00227]ブロック１４２８で、例示的メディアユニット１０６は、入力メディア信号２０２の等化後周波数表現に対して逆周波数変換を実施する。いくつかの例では、周波数－時間領域コンバータ２５０が、入力メディア信号２０２の等化後周波数表現に対して逆周波数変換を実施して、出力メディア信号２５２を生成する。

[00228]ブロック１４３０で、例示的メディアユニット１０６は等化を続行するかどうかを判定する。等化を続行することに応答して、処理はブロック１４０２に移る。逆に、等化を続行しないことに応答して、処理は終了する。

[00229]図１５は、第３の実装による、等化曲線を平滑化するように図１及び２のメディアユニット１０６を実装するために実行することのできる例示的機械可読命令１５００を表すフローチャートである。先行する図及び関連する説明を参照して、例示的機械可読命令１５００は、例示的メディアユニット１０６が複数の周波数値を選択することから始まる（ブロック１５０２）。いくつかの例では、しきい値処理コントローラ２４４が、音量の不規則な変化（たとえば、局所的異常値）について解析するために複数の周波数値を選択する。いくつかの例では、しきい値処理コントローラ２４４は、一度に解析するために、隣り合う周波数値のセット（たとえば、３つの別個の必然的な周波数値）を選択する。

[00230]ブロック１５０４で、例示的メディアユニット１０６は複数の周波数値での音量を決定する。いくつかの例では、しきい値処理コントローラ２４４が複数の周波数値での音量を決定する。

[00231]ブロック１５０６で、例示的メディアユニット１０６は、複数の周波数値にわたって音量の２次導関数を決定する。いくつかの例では、しきい値処理コントローラ２４４が、複数の周波数値にわたって音量の２次導関数を決定する。いくつかの例では、しきい値処理コントローラ２４４は、別の技法を利用して、複数の周波数値にわたる音量の変化量を決定する。複数の周波数値にわたって音量の２次導関数を決定するための一つの例示的技法は、この説明の上記で図２に関連して説明された式１を利用することを含む。

[00232]ブロック１５０８で、例示的メディアユニット１０６は、２次導関数の絶対値がしきい値を超えるかどうかを判定する。いくつかの例ではしきい値処理コントローラ２４４が、２次導関数の絶対値がしきい値を超えるかどうかを判定する。いくつかの例では、しきい値処理コントローラ２４４は、複数の周波数値にわたる音量の変化量の別の計算結果をしきい値と比較する。２次導関数の絶対値がしきい値を超えることに応答して、処理はブロック１５１０に移る。逆に、２次導関数の絶対値がしきい値を超えないことに応答して、処理はブロック１５１２に移る。

[00233]ブロック１５１０で、例示的メディアユニット１０６は、複数の値のうちの中心値の音量レベルを、隣り合う周波数値での音量レベル間の中点となるように調節する。いくつかの例では、しきい値処理コントローラ２４４が、複数の値のうちの中心値の音量レベルを、隣り合う周波数値での音量レベル間の中点となるように調節する。いくつかの例では、しきい値処理コントローラ２４４は、別の方法を利用して、複数の値の中心値が隣り合う周波数値での音量により類似するように調節し、以て等化曲線中の不規則性を低減する。

[00234]ブロック１５１２で、例示的メディアユニット１０６は、解析する何らかの追加の周波数値があるかどうかを判定する。いくつかの例では、しきい値処理コントローラ２４４が、解析する何らかの追加の周波数値があるかどうかを判定する。いくつかの例では、しきい値処理コントローラ２４４は、周波数値のすべてを解析することを１回又は複数回反復する。いくつかの例では、しきい値処理コントローラ２４４は、すべての不規則性が除去されるまで、又はしきい数の不規則性だけが残るまで反復する。解析する追加の周波数値があることに応答して、処理はブロック１５０２に移る。逆に、解析する追加の周波数値がないことに応答して、処理は図１４の機械可読命令に戻り、ブロック１４２０に進む。

[00235]図１６は、第３の実装による、データセットを集めて、基準オーディオ信号に基づいてニューラルネットワークをトレーニング及び／又は確認するように図４のオーディオＥＱエンジン１１８を実装するために実行することのできる例示的機械可読命令１６００を表すフローチャートである。先行する図及び関連する説明を参照して、例示的機械可読命令１６００は、例示的オーディオＥＱエンジン１１８が基準オーディオ信号のライブラリにアクセスすることから始まる（ブロック１６０２）。いくつかの例では、ＥＱニューラルネットワーク４０２が、基準オーディオ信号のライブラリにアクセスする。

[00236]ブロック１６０４で、例示的オーディオＥＱエンジン１１８は、基準オーディオ信号に関連付けられる等化曲線にアクセスする。いくつかの例では、ＥＱニューラルネットワーク４０２が、基準オーディオ信号に関連付けられる等化曲線にアクセスする。

[00237]ブロック１６０６で、例示的オーディオＥＱエンジン１１８は、基準オーディオ信号に関連付けられるエンジニアタグ及び／又は他のメタデータにアクセスする。いくつかの例では、ＥＱニューラルネットワーク４０２が、基準オーディオ信号に関連付けられるエンジニアタグ及び／又は他のメタデータにアクセスする。

[00238]ブロック１６０８で、例示的オーディオＥＱエンジン１１８は、基準オーディオ信号のサンプルを、対応するＥＱ曲線及びエンジニアタグ（複数可）に関連付ける。いくつかの例では、ＥＱニューラルネットワーク４０２が、基準オーディオ信号のサンプルを、対応するＥＱ曲線及びエンジニアタグ（複数可）に関連付ける。

[00239]ブロック１６１０で、例示的オーディオＥＱエンジン１１８は、トレーニングのために使用する追加の基準オーディオ信号があるかどうかを判定する。いくつかの例では、ＥＱニューラルネットワーク４０２が、トレーニングに利用するために基準オーディオ信号、ＥＱ曲線、エンジニアタグのうちの追加のものがあるかどうかを判定する。トレーニングのために追加の基準オーディオ信号があることに応答して、処理はブロック１６０２に移る。逆に、トレーニングのために使用する追加の基準オーディオ信号がないことに応答して、処理は終了する。

[00240]図１７Ａは、図１５に関連して示され、説明される平滑化技法を実施する前の等化後オーディオ信号の例示的な第１のプロット１７００ａである。

[00241]例示的な第１のプロット１７００ａは、（たとえば、ｘ軸線にわたって）左から右に増加する周波数値を示す例示的周波数軸線１７０２を含む。第１のプロット１７００ａは、（たとえば、ｙ軸線にわたって）下から上に増加する音量値を示す例示的音量軸線１７０４を含む。一般には、第１のプロット１７００ａは、オーディオ信号が低い周波数値で高い音量レベルを有し、周波数値が増加するにつれて音量が概して増加することを示す。しかしながら、第１のプロット１７００ａは例示的不規則性１７０６を含む。

[00242]第１のプロット１７００ａは、例示的な第１の周波数値１７０８、例示的な第２の周波数値１７１０及び例示的な第３の周波数値１７１２を含む。第１の周波数値１７０８は例示的な第１の音量１７１４に対応し、第２の周波数値１７１０は例示的な第２の音量１７１６に対応し、第３の周波数値１７１２は例示的な第３の音量１７１８に対応する。メディアユニット１０６が第１のプロット１７００ａに示される信号に対するしきい値処理手順を（たとえば、しきい値処理コントローラ２４４を介して）実行しようとしたとき、メディアユニット１０６は、第１の周波数値１７０８と第２の周波数値１７１０との間、並びに第２の周波数値１７１０と第３の周波数値１７１２との間で音量が著しく変化するので、不規則性１７０６（たとえば、局所的異常値）を検出することができる。しきい値処理コントローラ２４４が第１の周波数値１７０８、第２の周波数値１７１０及び第３の周波数値１７１２での音量レベル間の音量の２次導関数（又は音量変化の他の尺度）を計算する場合、しきい値処理コントローラ２４４は、２次導関数がしきい値を超え、不規則性１７０６に対応すると判定することができる。

[00243]図１７Ｂは、図１５に関連して示され、説明される平滑化技法を実施した後の図１７Ａのオーディオ信号の例示的な第２のプロット１７００ｂである。図１７Ｂの図示される例では、不規則性１７０６を検出した後、しきい値処理コントローラ２４４が、第２の周波数値１７１０（たとえば、解析中の３つの周波数値の中心値）に関連付けられる音量レベルを調節する。図１７Ｂの第２のプロット１７００ｂは、第２の周波数値１７１０が前の第２の音量１７１６ではなく、例示的な第４の音量１７２０に対応することを除いて、第１のプロット１７００ａとほぼ同一である。図示される例では、しきい値処理コントローラ２４４は、第２の周波数値１７１０での音量を第１の音量１７１４と第３の音量１７１８の中点に設定することによって、第２の音量１７１６を第４の音量１７２０となるように調節した。図示される例では、次いで、これらの周波数値間の等化曲線の残りの部分が、滑らかな線として生成される。図１７Ｂの図示される例では、等化曲線の調節された部分が、第１の音量１７１４、第４の音量１７２０及び第３の音量１７１８を結ぶ破線として示される。しきい値処理コントローラ２４４は、検出した不規則性での音量レベルを調節するために任意の他の技法を利用することができる。

[00244]図１８は、図１及び２のメディアユニット１０６を実装するために図５、６、１１、１２、１４及び１５の命令を実行するように構築された例示的プロセッサプラットフォーム１８００のブロック図である。プロセッサプラットフォーム１８００は、たとえば、サーバ、パーソナルコンピュータ、ワークステーション、自己学習マシン（たとえば、ニューラルネットワーク）、モバイルデバイス（たとえば、セルフォン、スマートフォン、アイパッド（ｉＰａｄ）（登録商標）などのタブレット）、携帯情報端末（ＰＤＡ）、インターネットアプライアンス、ＤＶＤプレーヤ、ＣＤプレーヤ、デジタルビデオレコーダ、ブルーレイプレーヤ、ゲーミングコンソール、パーソナルビデオレコーダ、セットトップボックス、ヘッドセット若しくは他のウェアラブルデバイス、又は任意の他のタイプのコンピューティングデバイスでよい。

[00245]図示される例のプロセッサプラットフォーム１８００はプロセッサ１８１２を含む。図示される例のプロセッサ１８１２はハードウェアである。たとえば、所望のファミリ又は製造業者からの１つ又は複数の集積回路、論理回路、マイクロプロセッサ、ＧＰＵ、ＤＳＰ或いはコントローラによってプロセッサ１８１２を実装することができる。ハードウェアプロセッサ１８１２は半導体ベースの（たとえば、シリコンベースの）デバイスでよい。この例では、プロセッサ１８１２は、例示的信号変換器２０４、例示的ＥＱモデル照会ジェネレータ２０６、例示的ＥＱフィルタ設定アナライザ２０８、例示的ＥＱパーソナライゼーションマネージャ２１０、例示的デバイスパラメータアナライザ２１２、例示的履歴ＥＱマネージャ２１４、例示的ユーザ入力アナライザ２１６、例示的ＥＱフィルタセレクタ２１８、例示的ＥＱ調節インプリメンタ２２０、例示的平滑化フィルタコンフィギュレータ２２２、例示的データストア２２４、例示的更新モニタ２２６、例示的フィンガープリントジェネレータ２２７、例示的シンクロナイザ２２８、例示的バッファマネージャ２３０、例示的時間－周波数領域コンバータ２３２、例示的音量計算器２３４、例示的エネルギー計算器２３６、例示的入力特徴セットジェネレータ２３８、例示的ＥＱマネージャ２４０、例示的音量調節器２４２、例示的しきい値処理コントローラ２４４、例示的ＥＱ曲線ジェネレータ２４６、例示的音量ノーマライザ２４８及び／又は例示的周波数－時間領域コンバータ２５０を実装する。

[00246]図示される例のプロセッサ１８１２はローカルメモリ１８１３（たとえば、キャッシュ）を含む。図示される例のプロセッサ１８１２は、バス１８１８を介して、揮発性メモリ１８１４及び不揮発性メモリ１８１６を含むメインメモリと通信している。同期型ダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、ラムバス（登録商標）ダイナミックランダムアクセスメモリ（ＲＤＲＡＭ（登録商標））及び／又は任意の他のタイプのランダムアクセスメモリデバイスによって揮発性メモリ１８１４を実装することができる。フラッシュメモリ及び／又は任意の他の所望のタイプのメモリデバイスによって不揮発性メモリ１８１６を実装することができる。メインメモリ１８１４、１８１６へのアクセスが、メモリコントローラによって制御される。

[00247]図示される例のプロセッサプラットフォーム１８００はインターフェース回路１８２０も含む。イーサネットインターフェース、ユニバーサルシリアルバス（ＵＳＢ）、ブルートゥース（登録商標）インターフェース、近距離場通信（ＮＦＣ）インターフェース及び／又はＰＣＩｅｘｐｒｅｓｓインターフェースなどの任意のタイプのインターフェース規格によってインターフェース回路１８２０を実装することができる。

[00248]図示される例では、１つ又は複数の入力デバイス１８２２がインターフェース回路１８２０に接続される。入力デバイス（複数可）１８２２は、ユーザがプロセッサ１８１２にデータ及び／又はコマンドを入力することを可能にする。たとえば、オーディオセンサ、マイクロフォン、カメラ（スチル又はビデオ）、キーボード、ボタン、マウス、タッチスクリーン、トラックパッド、トラックボール、ｉｓｏｐｏｉｎｔ及び／又は音声認識システムによって入力デバイス（複数可）を実装することができる。

[00249]図示される例のインターフェース回路１８２０には１つ又は複数の出力デバイス１８２４も接続される。たとえば、ディスプレイデバイス（たとえば、発光ダイオード（ＬＥＤ）、有機発光ダイオード（ＯＬＥＤ）、液晶ディスプレイ（ＬＣＤ）、陰極線管ディスプレイ（ＣＲＴ）、インプレーンスイッチング（ＩＰＳ）ディスプレイ、タッチスクリーンなど）、触覚出力デバイス、プリンタ及び／又はスピーカによって出力デバイス１８２４を実装することができる。したがって、図示される例のインターフェース回路１８２０は、通常はグラフィックスドライバカード、グラフィックスドライバチップ及び／又はグラフィックスドライバプロセッサを含む。

[00250]図示される例のインターフェース回路１８２０は、ネットワーク１８２６を介する外部マシン（たとえば、任意の種類のコンピューティングデバイス）とのデータの交換を容易にするために、送信機、受信機、トランシーバ、モデム、住居ゲートウェイ、ワイヤレスアクセスポイント及び／又はネットワークインターフェースなどの通信デバイスも含む。通信は、たとえば、イーサネット接続、デジタル加入者線（ＤＳＬ）接続、電話回線接続、同軸ケーブルシステム、衛星システム、ｌｉｎｅ－ｏｆ－ｓｉｔｅワイヤレスシステム、セルラ電話システムなどを介するものでよい。

[00251]図示される例のプロセッサプラットフォーム１８００は、ソフトウェア及び／又はデータを記憶するための１つ又は複数のマスストレージデバイス１８２８も含む。そのようなマスストレージデバイス１８２８の例は、フロッピィディスクドライブ、ハードドライブディスク、コンパクトディスクドライブ、ブルーレイディスクドライブ、ｒｅｄｕｎｄａｎｔａｒｒａｙｏｆｉｎｄｅｐｅｎｄｅｎｔｄｉｓｋｓ（ＲＡＩＤ）システム及びデジタルバーサタイルディスク（ＤＶＤ）ドライブを含む。

[00252]図１８の機械可読命令１８３２、図５の機械可読命令５００、図６の機械可読命令５１４、図１１の機械可読命令１１００、図６の機械可読命令１１０６、図１２の機械可読命令１２００、図１４の機械可読命令１４００及び／又は図１５の機械可読命令１４１８を、マスストレージデバイス１８２８、揮発性メモリ１８１４、不揮発性メモリ１８１６、及び／又はＣＤやＤＶＤなどの取外し可能非一時的コンピュータ可読記憶媒体に記憶することができる。

[00253]図１９は、図１及び４のオーディオＥＱエンジン１１８を実装するために図７及び１６の命令を実行するように構築された例示的プロセッサプラットフォーム１９００のブロック図である。プロセッサプラットフォーム１９００は、たとえば、サーバ、パーソナルコンピュータ、ワークステーション、自己学習マシン（たとえば、ニューラルネットワーク）、モバイルデバイス（たとえば、セルフォン、スマートフォン、アイパッド（商標）などのタブレット）、携帯情報端末（ＰＤＡ）、インターネットアプライアンス、ＤＶＤプレーヤ、ＣＤプレーヤ、デジタルビデオレコーダ、ブルーレイプレーヤ、ゲーミングコンソール、パーソナルビデオレコーダ、セットトップボックス、ヘッドセット若しくは他のウェアラブルデバイス、又は任意の他のタイプのコンピューティングデバイスでよい。

[00254]図示される例のプロセッサプラットフォーム１９００はプロセッサ１９１２を含む。図示される例のプロセッサ１９１２はハードウェアである。たとえば、所望のファミリ又は製造業者からの１つ又は複数の集積回路、論理回路、マイクロプロセッサ、ＧＰＵ、ＤＳＰ或いはコントローラによってプロセッサ１９１２を実装することができる。ハードウェアプロセッサ１９１２は半導体ベースの（たとえば、シリコンベースの）デバイスでよい。この例では、プロセッサ１９１２は、例示的ＥＱニューラルネットワーク４０２、例示的オーディオＥＱスコアリングエンジン４０４及び／又は例示的オーディオＥＱエンジンバリデータ４０６を実装する。

[00255]図示される例のプロセッサ１９１２はローカルメモリ１９１３（たとえば、キャッシュ）を含む。図示される例のプロセッサ１９１２は、バス１９１８を介して、揮発性メモリ１９１４及び不揮発性メモリ１９１６を含むメインメモリと通信している。同期型ダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、ラムバス（登録商標）ダイナミックランダムアクセスメモリ（ＲＤＲＡＭ（登録商標））及び／又は任意の他のタイプのランダムアクセスメモリデバイスによって揮発性メモリ１９１４を実装することができる。フラッシュメモリ及び／又は任意の他の所望のタイプのメモリデバイスによって不揮発性メモリ１９１６を実装することができる。メインメモリ１９１４、１９１６へのアクセスが、メモリコントローラによって制御される。

[00256]図示される例のプロセッサプラットフォーム１９００はインターフェース回路１９２０も含む。イーサネットインターフェース、ユニバーサルシリアルバス（ＵＳＢ）、ブルートゥース（登録商標）インターフェース、近距離場通信（ＮＦＣ）インターフェース及び／又はＰＣＩｅｘｐｒｅｓｓインターフェースなどの任意のタイプのインターフェース規格によってインターフェース回路１９２０を実装することができる。

[00257]図示される例では、１つ又は複数の入力デバイス１９２２がインターフェース回路１９２０に接続される。入力デバイス（複数可）１９２２は、ユーザがプロセッサ１９１２にデータ及び／又はコマンドを入力することを可能にする。たとえば、オーディオセンサ、マイクロフォン、カメラ（スチル又はビデオ）、キーボード、ボタン、マウス、タッチスクリーン、トラックパッド、トラックボール、ｉｓｏｐｏｉｎｔ及び／又は音声認識システムによって入力デバイス（複数可）を実装することができる。

[00258]図示される例のインターフェース回路１９２０には１つ又は複数の出力デバイス１９２４も接続される。たとえば、ディスプレイデバイス（たとえば、発光ダイオード（ＬＥＤ）、有機発光ダイオード（ＯＬＥＤ）、液晶ディスプレイ（ＬＣＤ）、陰極線管ディスプレイ（ＣＲＴ）、インプレーンスイッチング（ＩＰＳ）ディスプレイ、タッチスクリーンなど）、触覚出力デバイス、プリンタ及び／又はスピーカによって出力デバイス１９２４を実装することができる。したがって、図示される例のインターフェース回路１９２０は、通常はグラフィックスドライバカード、グラフィックスドライバチップ及び／又はグラフィックスドライバプロセッサを含む。

[00259]図示される例のインターフェース回路１９２０は、ネットワーク１９２６を介する外部マシン（たとえば、任意の種類のコンピューティングデバイス）とのデータの交換を容易にするために、送信機、受信機、トランシーバ、モデム、住居ゲートウェイ、ワイヤレスアクセスポイント及び／又はネットワークインターフェースなどの通信デバイスも含む。通信は、たとえば、イーサネット接続、デジタル加入者線（ＤＳＬ）接続、電話回線接続、同軸ケーブルシステム、衛星システム、ｌｉｎｅ－ｏｆ－ｓｉｔｅワイヤレスシステム、セルラ電話システムなどを介するものでよい。

[00260]図示される例のプロセッサプラットフォーム１９００は、ソフトウェア及び／又はデータを記憶するための１つ又は複数のマスストレージデバイス１９２８も含む。そのようなマスストレージデバイス１９２８の例は、フロッピィディスクドライブ、ハードドライブディスク、コンパクトディスクドライブ、ブルーレイディスクドライブ、ｒｅｄｕｎｄａｎｔａｒｒａｙｏｆｉｎｄｅｐｅｎｄｅｎｔｄｉｓｋｓ（ＲＡＩＤ）システム及びデジタルバーサタイルディスク（ＤＶＤ）ドライブを含む。

[00261]図１９の機械可読命令１９３２、図７の機械可読命令７００及び／又は図１６の機械可読命令１６００を、マスストレージデバイス１９２８、揮発性メモリ１９１４、不揮発性メモリ１９１６、及び／又はＣＤやＤＶＤなどの取外し可能非一時的コンピュータ可読記憶媒体に記憶することができる。

[00262]図２０は、図１及び３のコンテンツプロファイルエンジン１１６を実装するために図１０の命令を実行するように構築された例示的プロセッサプラットフォーム２０００のブロック図である。プロセッサプラットフォーム２０００は、たとえば、サーバ、パーソナルコンピュータ、ワークステーション、自己学習マシン（たとえば、ニューラルネットワーク）、モバイルデバイス（たとえば、セルフォン、スマートフォン、アイパッド（商標）などのタブレット）、携帯情報端末（ＰＤＡ）、インターネットアプライアンス、ＤＶＤプレーヤ、ＣＤプレーヤ、デジタルビデオレコーダ、ブルーレイプレーヤ、ゲーミングコンソール、パーソナルビデオレコーダ、セットトップボックス、ヘッドセット若しくは他のウェアラブルデバイス、又は任意の他のタイプのコンピューティングデバイスでよい。

[00263]図示される例のプロセッサプラットフォーム２０００はプロセッサ２０１２を含む。図示される例のプロセッサ２０１２はハードウェアである。たとえば、所望のファミリ又は製造業者からの１つ又は複数の集積回路、論理回路、マイクロプロセッサ、ＧＰＵ、ＤＳＰ或いはコントローラによってプロセッサ２０１２を実装することができる。ハードウェアプロセッサ２０１２は半導体ベースの（たとえば、シリコンベースの）デバイスでよい。この例では、プロセッサ２０１２は、例示的コンテンツリトリーバ３０２、例示的フィンガープリントジェネレータ３０４、例示的コンテンツ識別器３０６、例示的プロファイラ３０８及び／又は例示的プロファイルデータストア３１０を実装する。

[00264]図示される例のプロセッサ２０１２はローカルメモリ２０１３（たとえば、キャッシュ）を含む。図示される例のプロセッサ２０１２は、バス２０１８を介して、揮発性メモリ２０１４及び不揮発性メモリ２０１６を含むメインメモリと通信している。同期型ダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、ラムバス（登録商標）ダイナミックランダムアクセスメモリ（ＲＤＲＡＭ（登録商標））及び／又は任意の他のタイプのランダムアクセスメモリデバイスによって揮発性メモリ２０１４を実装することができる。フラッシュメモリ及び／又は任意の他の所望のタイプのメモリデバイスによって不揮発性メモリ２０１６を実装することができる。メインメモリ２０１４、２０１６へのアクセスが、メモリコントローラによって制御される。

[00265]図示される例のプロセッサプラットフォーム２０００はインターフェース回路２０２０も含む。イーサネットインターフェース、ユニバーサルシリアルバス（ＵＳＢ）、ブルートゥース（登録商標）インターフェース、近距離場通信（ＮＦＣ）インターフェース及び／又はＰＣＩｅｘｐｒｅｓｓインターフェースなどの任意のタイプのインターフェース規格によってインターフェース回路２０２０を実装することができる。

[00266]図示される例では、１つ又は複数の入力デバイス２０２２がインターフェース回路２０２０に接続される。入力デバイス（複数可）２０２２は、ユーザがプロセッサ２０１２にデータ及び／又はコマンドを入力することを可能にする。たとえば、オーディオセンサ、マイクロフォン、カメラ（スチル又はビデオ）、キーボード、ボタン、マウス、タッチスクリーン、トラックパッド、トラックボール、ｉｓｏｐｏｉｎｔ及び／又は音声認識システムによって入力デバイス（複数可）を実装することができる。

[00267]図示される例のインターフェース回路２０２０には１つ又は複数の出力デバイス２０２４も接続される。たとえば、ディスプレイデバイス（たとえば、発光ダイオード（ＬＥＤ）、有機発光ダイオード（ＯＬＥＤ）、液晶ディスプレイ（ＬＣＤ）、陰極線管ディスプレイ（ＣＲＴ）、インプレーンスイッチング（ＩＰＳ）ディスプレイ、タッチスクリーンなど）、触覚出力デバイス、プリンタ及び／又はスピーカによって出力デバイス２０２４を実装することができる。したがって、図示される例のインターフェース回路２０２０は、通常はグラフィックスドライバカード、グラフィックスドライバチップ及び／又はグラフィックスドライバプロセッサを含む。

[00268]図示される例のインターフェース回路２０２０は、ネットワーク２０２６を介する外部マシン（たとえば、任意の種類のコンピューティングデバイス）とのデータの交換を容易にするために、送信機、受信機、トランシーバ、モデム、住居ゲートウェイ、ワイヤレスアクセスポイント及び／又はネットワークインターフェースなどの通信デバイスも含む。通信は、たとえば、イーサネット接続、デジタル加入者線（ＤＳＬ）接続、電話回線接続、同軸ケーブルシステム、衛星システム、ｌｉｎｅ－ｏｆ－ｓｉｔｅワイヤレスシステム、セルラ電話システムなどを介するものでよい。

[00269]図示される例のプロセッサプラットフォーム２０００は、ソフトウェア及び／又はデータを記憶するための１つ又は複数のマスストレージデバイス２０２８も含む。そのようなマスストレージデバイス２０２８の例は、フロッピィディスクドライブ、ハードドライブディスク、コンパクトディスクドライブ、ブルーレイディスクドライブ、ｒｅｄｕｎｄａｎｔａｒｒａｙｏｆｉｎｄｅｐｅｎｄｅｎｔｄｉｓｋｓ（ＲＡＩＤ）システム及びデジタルバーサタイルディスク（ＤＶＤ）ドライブを含む。

[00270]図２０の機械可読命令２０３２及び／又は図１０の機械可読命令１０００を、マスストレージデバイス２０２８、揮発性メモリ２０１４、不揮発性メモリ２０１６、及び／又はＣＤやＤＶＤなどの取外し可能非一時的コンピュータ可読記憶媒体に記憶することができる。

[00271]上記から、オーディオ信号を解析し、ニューラルネットワークを利用して最適なオーディオ再生設定を決定することによって、個々のトラックの変化、トラック間の変化、ジャンルの変化、及び／又はオーディオ信号の任意の他の変化に適応するようにオーディオ再生設定を動的に調節する例示的方法、装置及び製造品が開示されたことを理解されよう。さらに、平滑化フィルタを利用して、音量レベル又は等化設定の知覚できる鋭いシフトなしにオーディオ再生設定をインテリジェントに調節する例示的方法、装置及び製造品が開示された。さらに、本明細書で開示される技法は、トラック間の動的調節並びに（パーソナライズされたＥＱプロファイルで表される）ユーザプリファレンスを同期する等化手法を可能にする。

[00272]さらに、本明細書で開示される例示的方法、装置及び製造品は、オーディオ信号をインテリジェントに等化し、ソース及び／又はオーディオ信号の他の特性（たとえば、ジャンル、存在する楽器など）の違いを補償する。本明細書で開示される例示的技法は、オーディオエンジニアによって等化され、基準オーディオ信号を等化した特定のオーディオエンジニアの指示と共にニューラルネットワークに入力された基準オーディオ信号でトレーニングされたニューラルネットワークを利用する。そのようなトレーニングの利用により、ニューラルネットワークがエキスパート等化出力を供給し、異なるトラック間、さらには同一トラック内の両方の微妙な調節を行うことが可能となる。さらに、本明細書で開示される例示的技法は、しきい値処理技法を実施することによってニューラルネットワークの等化出力を改善し、着信オーディオ信号に対して適用される最終的等化曲線が滑らかであり、聴取者に知覚できる最小限の不規則性を有することを保証する。

[00273]オーディオ特性の解析に基づいてオーディオ再生設定を調節するための例示的方法、装置、システム及び製造品が本明細書で開示される。さらなる実施例及びそれらの組合せは以下を含む。

[00274]実施例１は、ニューラルネットワークへの照会を生成するための等化（ＥＱ）モデル照会ジェネレータであって、照会が、オーディオ信号のサンプルの表現を含む、ＥＱモデル照会ジェネレータと、照会に基づいて、ニューラルネットワークによって決定された複数のオーディオ再生設定にアクセスし、複数のオーディオ再生設定に基づいて、オーディオ信号に適用するためのフィルタ係数を決定するためのＥＱフィルタ設定アナライザと、第１の持続時間にオーディオ信号にフィルタ係数を適用するためのＥＱ調節インプリメンタとを備える装置を含む。

[00275]実施例２は、オーディオ信号のサンプルの表現がオーディオ信号のサンプルの周波数表現に対応する、実施例１の装置を含む。

[00276]実施例３は、複数のオーディオ再生設定が１つ又は複数のフィルタを含み、１つ又は複数のフィルタのそれぞれが、オーディオ信号のサンプルに関連付けられる１つ又は複数のそれぞれの利得値、それぞれの周波数値、及びそれぞれの品質係数値のうちの１つ又は複数を含む、実施例１の装置を含む。

[00277]実施例４は、ＥＱフィルタ設定アナライザが、オーディオ信号に適用すべきフィルタ係数に関連付けられるフィルタのタイプに基づいて、オーディオ信号に適用するためのフィルタ係数を決定するためのものである、実施例１の装置を含む。

[00278]実施例５は、ＥＱ調節インプリメンタが、オーディオ信号に平滑化フィルタを適用して、第１の持続時間と第２の持続時間との間のオーディオ信号の平均利得値の鋭い遷移を低減するためのものである、実施例１の装置を含む。

[00279]実施例６は、オーディオ信号をオーディオ信号のサンプルの周波数表現に変換するための信号変換器をさらに含む、実施例１の装置を含む。

[00280]実施例７は、ＥＱ調節インプリメンタが、フィルタ係数に基づいて、オーディオ信号の振幅特性、周波数特性及び位相特性のうちの少なくとも１つを調節するためのものである、実施例１の装置を含む。

[00281]実施例８は、実行されるとき、１つ又は複数のプロセッサに、少なくとも、ニューラルネットワークへの照会を生成することであって、照会が、オーディオ信号のサンプルの表現を含むこと、照会に基づいて、ニューラルネットワークによって決定された複数のオーディオ再生設定にアクセスすること、複数のオーディオ再生設定に基づいて、オーディオ信号に適用するためのフィルタ係数を決定すること、及び第１の持続時間にオーディオ信号にフィルタ係数を適用することを行わせる命令を含む非一時的コンピュータ可読記憶媒体を含む。

[00282]実施例９は、オーディオ信号のサンプルの表現が、オーディオ信号のサンプルの周波数表現に対応する、実施例８の非一時的コンピュータ可読記憶媒体を含む。

[00283]実施例１０は、複数のオーディオ再生設定が１つ又は複数のフィルタを含み、１つ又は複数のフィルタのそれぞれが、オーディオ信号のサンプルに関連付けられるそれぞれの利得値、それぞれの周波数値、及びそれぞれの品質係数値のうちの１つ又は複数を含む、実施例８の非一時的コンピュータ可読記憶媒体を含む。

[00284]実施例１１は、命令が、実行されるとき、１つ又は複数のプロセッサに、オーディオ信号に適用すべきフィルタ係数に関連付けられるフィルタのタイプに基づいて、オーディオ信号に適用するためのフィルタ係数を決定させる、実施例８の非一時的コンピュータ可読記憶媒体を含む。

[00285]実施例１２は、命令が、実行されるとき、１つ又は複数のプロセッサに、オーディオ信号に平滑化フィルタを適用して、第１の持続時間と第２の持続時間との間のオーディオ信号の平均利得値の鋭い遷移を低減させる、実施例８の非一時的コンピュータ可読記憶媒体を含む。

[00286]実施例１３は、命令が、実行されるとき、１つ又は複数のプロセッサに、オーディオ信号をオーディオ信号のサンプルの周波数表現に変換させる、実施例８の非一時的コンピュータ可読記憶媒体を含む。

[00287]実施例１４は、命令が、実行されるとき、１つ又は複数のプロセッサに、フィルタ係数に基づいてオーディオ信号の振幅特性、周波数特性及び位相特性のうちの少なくとも１つを調節させる、実施例８の非一時的コンピュータ可読記憶媒体を含む。

[00288]実施例１５は、ニューラルネットワークへの照会を生成することであって、照会が、オーディオ信号のサンプルの表現を含むこと、照会に基づいて、ニューラルネットワークによって決定された複数のオーディオ再生設定にアクセスすること、複数のオーディオ再生設定に基づいて、オーディオ信号に適用するためのフィルタ係数を決定すること、及び第１の持続時間にオーディオ信号にフィルタ係数を適用することを含む方法を含む。

[00289]実施例１６は、オーディオ信号のサンプルの表現が、オーディオ信号のサンプルの周波数表現に対応する、実施例１５の方法を含む。

[00290]実施例１７は、複数のオーディオ再生設定が１つ又は複数のフィルタを含み、１つ又は複数のフィルタのそれぞれが、オーディオ信号のサンプルに関連付けられる、それぞれの利得値、それぞれの周波数値、及びそれぞれの品質係数値のうちの１つ又は複数を含む、実施例１５の方法を含む。

[00291]実施例１８は、オーディオ信号に適用すべきフィルタ係数に関連付けられるフィルタのタイプに基づいて、オーディオ信号に適用するためのフィルタ係数を決定することをさらに含む、実施例１５の方法を含む。

[00292]実施例１９は、オーディオ信号に平滑化フィルタを適用して、第１の持続時間と第２の持続時間との間のオーディオ信号の平均利得値の鋭い遷移を低減することをさらに含む、実施例１５の方法を含む。

[00293]実施例２０は、オーディオ信号をオーディオ信号のサンプルの周波数表現に変換することをさらに含む、実施例１５の方法を含む。

[00294]実施例２１は、ニューラルネットワークへの照会を生成するための等化（ＥＱ）モデル照会ジェネレータであって、照会が、オーディオ信号のサンプルの表現を含む、ＥＱモデル照会ジェネレータと、照会に基づいて、ニューラルネットワークによって決定された複数のオーディオ再生設定にアクセスし、複数のオーディオ再生設定に基づいて、オーディオ信号に適用するためのフィルタ係数を決定するためのＥＱフィルタ設定アナライザと、パーソナライズされたＥＱ設定を生成するためのＥＱパーソナライゼーションマネージャと、パーソナライズされたＥＱ設定とフィルタ係数とを混合して、混合等化を生成し、第１の持続時間にオーディオ信号に混合等化を適用するためのＥＱ調節インプリメンタとを備える装置を含む。

[00295]実施例２２は、過去のパーソナライゼーション設定に基づいて、パーソナライズされたＥＱ設定を生成し、履歴等化が使用可能にされることに応答して、以前の期間に関連付けられるＥＱ設定に基づいて、パーソナライズされたＥＱ設定を調節するための履歴ＥＱマネージャをさらに含む、実施例２１の装置を含む。

[00296]実施例２３は、ユーザのプリファレンスを示すデータの可用性に応答して、ユーザのプリファレンスを示すデータに基づいてＥＱパラメータを決定することであって、ＥＱパラメータがオーディオ再生設定に対応すること、及びユーザのプリファレンスを示すデータに基づいて決定されたＥＱパラメータに基づいて、パーソナライズされたＥＱ設定を調節することを行うためのユーザ入力アナライザをさらに含む、実施例２１の装置を含む。

[00297]実施例２４は、再生デバイスの位置データの可用性に応答して、再生デバイスの位置データに基づいて、パーソナライズされたＥＱ設定を調節し、ユーザの識別の可用性に応答して、ユーザに関連付けられるプロファイルに基づいて、パーソナライズされたＥＱ設定を調節し、オーディオ信号のソースに関連付けられる情報の可用性に応答して、オーディオ信号のソースに基づいて、パーソナライズされたＥＱ設定を調節するためのデバイスパラメータアナライザをさらに含む、実施例２１の装置を含む。

[00298]実施例２５は、ＥＱ調節インプリメンタが、第１のパーソナライズされたＥＱ設定、第２のパーソナライズされたＥＱ設定及びフィルタ係数に重みを適用して、混合等化を生成するためのものである、実施例２１の装置を含む。

[00299]実施例２６は、パーソナライズされたＥＱ設定が、以前の期間に関連付けられるＥＱ設定、ユーザのプリファレンスを示すデータ、再生デバイスの位置データ、ユーザに関連付けられるプロファイル、又はオーディオ信号のソースのうちの少なくとも１つに基づく、実施例２１の装置を含む。

[00300]実施例２７は、ＥＱ調節インプリメンタが、オーディオ信号に平滑化フィルタを適用して、第１の持続時間と第２の持続時間との間のオーディオ信号の平均利得値の鋭い遷移を低減する、実施例２１の装置を含む。

[00301]実施例２８は、実行されるとき、１つ又は複数のプロセッサに、少なくとも、ニューラルネットワークへの照会を生成することであって、照会が、オーディオ信号のサンプルの表現を含むこと、照会に基づいて、ニューラルネットワークによって決定された複数のオーディオ再生設定にアクセスすること、複数のオーディオ再生設定に基づいて、オーディオ信号に適用するためのフィルタ係数を決定すること、パーソナライズされたＥＱ設定を生成すること、パーソナライズされたＥＱ設定とフィルタ係数とを混合して、混合等化を生成すること、及び第１の持続時間にオーディオ信号に混合等化を適用することを行わせる命令を含む非一時的コンピュータ可読記憶媒体を含む。

[00302]実施例２９は、命令が、実行されるとき、１つ又は複数のプロセッサに、過去のパーソナライゼーション設定に基づいて、パーソナライズされたＥＱ設定を生成させ、履歴等化が使用可能にされることに応答して、以前の期間に関連付けられるＥＱ設定に基づいて、パーソナライズされたＥＱ設定を調節させる、実施例２８の非一時的コンピュータ可読記憶媒体を含む。

[00303]実施例３０は、命令が、実行されるとき、１つ又は複数のプロセッサに、ユーザのプリファレンスを示すデータの可用性に応答して、ユーザのプリファレンスを示すデータに基づいてＥＱパラメータを決定することであって、ＥＱパラメータがオーディオ再生設定に対応すること、及びユーザのプリファレンスを示すデータに基づいて決定されたＥＱパラメータに基づいて、パーソナライズされたＥＱ設定を調節することを行わせる、実施例２８の非一時的コンピュータ可読記憶媒体を含む。

[00304]実施例３１は、命令が、実行されるとき、１つ又は複数のプロセッサに、再生デバイスの位置データの可用性に応答して、再生デバイスの位置データに基づいて、パーソナライズされたＥＱ設定を調節させ、ユーザの識別の可用性に応答して、ユーザに関連付けられるプロファイルに基づいて、パーソナライズされたＥＱ設定を調節させ、オーディオ信号のソースに関連付けられる情報の可用性に応答して、オーディオ信号のソースに基づいて、パーソナライズされたＥＱ設定を調節させる、実施例２８の非一時的コンピュータ可読記憶媒体を含む。

[00305]実施例３２は、命令が、実行されるとき、１つ又は複数のプロセッサに、第１のパーソナライズされたＥＱ設定、第２のパーソナライズされたＥＱ設定及びフィルタ係数に重みを適用して、混合等化を生成させる、実施例２８の非一時的コンピュータ可読記憶媒体を含む。

[00306]実施例３３は、パーソナライズされたＥＱ設定が、以前の期間に関連付けられるＥＱ設定、ユーザのプリファレンスを示すデータ、再生デバイスの位置データ、ユーザに関連付けられるプロファイル、又はオーディオ信号のソースのうちの少なくとも１つに基づく、実施例２８の非一時的コンピュータ可読記憶媒体を含む。

[00307]実施例３４は、命令が、実行されるとき、１つ又は複数のプロセッサに、オーディオ信号に平滑化フィルタを適用して、第１の持続時間と第２の持続時間との間のオーディオ信号の平均利得値の鋭い遷移を低減させる、実施例２８の非一時的コンピュータ可読記憶媒体を含む。

[00308]実施例３５は、ニューラルネットワークへの照会を生成することであって、照会が、オーディオ信号のサンプルの表現を含むこと、照会に基づいて、ニューラルネットワークによって決定された複数のオーディオ再生設定にアクセスすること、複数のオーディオ再生設定に基づいて、オーディオ信号に適用するためのフィルタ係数を決定すること、パーソナライズされたＥＱ設定を生成すること、パーソナライズされたＥＱ設定とフィルタ係数とを混合して、混合等化を生成すること、及び第１の持続時間にオーディオ信号に混合等化を適用することを含む方法を含む。

[00309]実施例３６は、過去のパーソナライゼーション設定に基づいて、パーソナライズされたＥＱ設定を生成すること、及び履歴等化が使用可能にされることに応答して、以前の期間に関連付けられるＥＱ設定に基づいて、パーソナライズされたＥＱ設定を調節することをさらに含む、実施例３５の方法を含む。

[00310]実施例３７は、ユーザのプリファレンスを示すデータの可用性に応答して、ユーザのプリファレンスを示すデータに基づいてＥＱパラメータを決定することであって、ＥＱパラメータがオーディオ再生設定に対応すること、及びユーザのプリファレンスを示すデータに基づいて決定されたＥＱパラメータに基づいて、パーソナライズされたＥＱ設定を調節することをさらに含む、実施例３５の方法を含む。

[00311]実施例３８は、再生デバイスの位置データの可用性に応答して、再生デバイスの位置データに基づいて、パーソナライズされたＥＱ設定を調節すること、ユーザの識別の可用性に応答して、ユーザに関連付けられるプロファイルに基づいて、パーソナライズされたＥＱ設定を調節すること、及びオーディオ信号のソースに関連付けられる情報の可用性に応答して、オーディオ信号のソースに基づいて、パーソナライズされたＥＱ設定を調節することをさらに含む、実施例３５の方法を含む。

[00312]実施例３９は、第１のパーソナライズされたＥＱ設定、第２のパーソナライズされたＥＱ設定及びフィルタ係数に重みを適用して、混合等化を生成することをさらに含む、実施例３５の方法を含む。

[00313]実施例４０は、パーソナライズされたＥＱ設定が、以前の期間に関連付けられるＥＱ設定、ユーザのプリファレンスを示すデータ、再生デバイスの位置データ、ユーザに関連付けられるプロファイル、又はオーディオ信号のソースのうちの少なくとも１つに基づく、実施例３５の方法を含む。

[00314]実施例４１は、再生デバイス上で再生すべきメディア信号を受信したことに応答して、メディア信号に対応する等化（ＥＱ）プロファイルにアクセスするためのシンクロナイザと、パーソナライズされたＥＱ設定を生成するためのＥＱパーソナライゼーションマネージャと、ＥＱプロファイル及びパーソナライズされたＥＱ設定に基づいて生成された混合等化に基づいて、再生デバイス上のメディア信号の再生を修正するためのＥＱ調節インプリメンタとを備える装置を含む。

[00315]実施例４２は、過去のパーソナライゼーション設定に基づいて、パーソナライズされたＥＱ設定を生成し、履歴等化が使用可能にされることに応答して、以前の期間に関連付けられるＥＱ設定に基づいて、パーソナライズされたＥＱ設定を調節するための履歴ＥＱマネージャをさらに含む、実施例４１の装置を含む。

[00316]実施例４３は、ユーザのプリファレンスを示すデータの可用性に応答して、ユーザのプリファレンスを示すデータに基づいてＥＱパラメータを決定することであって、ＥＱパラメータがオーディオ再生設定に対応すること、及びユーザのプリファレンスを示すデータに基づいて決定されたＥＱパラメータに基づいて、パーソナライズされたＥＱ設定を調節することを行うためのユーザ入力アナライザをさらに含む、実施例４１の装置を含む。

[00317]実施例４４は、再生デバイスの位置データの可用性に応答して、再生デバイスの位置データに基づいて、パーソナライズされたＥＱ設定を調節し、ユーザの識別の可用性に応答して、ユーザプロファイルに基づいて、パーソナライズされたＥＱ設定を調節し、メディア信号のソースに関連付けられる情報の可用性に応答して、メディア信号のソースに基づいて、パーソナライズされたＥＱ設定を調節するためのデバイスパラメータアナライザをさらに含む、実施例４１の装置を含む。

[00318]実施例４５は、ＥＱ調節インプリメンタが、第１のパーソナライズされたＥＱ設定、第２のパーソナライズされたＥＱ設定及びＥＱプロファイルに重みを適用して、混合等化を生成するためのものである、実施例４１の装置を含む。

[00319]実施例４６は、パーソナライズされたＥＱ設定が、以前の期間に関連付けられるＥＱ設定、ユーザのプリファレンスを示すデータ、再生デバイスの位置データ、ユーザプロファイル、又はメディア信号のソースのうちの少なくとも１つに基づく、実施例４１の装置を含む。

[00320]実施例４７は、ＥＱプロファイルが、（１）歌に関連付けられるカテゴリを特定する情報、（２）ビデオセグメントに関連付けられるカテゴリを特定する情報、（３）歌又はビデオセグメントに関連付けられるムードを特定する情報、又は（４）メディア信号の一部と共に様々な周波数についての信号強度パラメータを特定する情報のうちの少なくとも１つに対応する再生属性を含む、実施例４１の装置を含む。

[00321]実施例４８は、実行されるとき、１つ又は複数のプロセッサに、少なくとも、再生デバイス上で再生すべきメディア信号を受信したことに応答して、メディア信号に対応する等化（ＥＱ）プロファイルにアクセスさせ、パーソナライズされたＥＱ設定を生成させ、ＥＱプロファイル及びパーソナライズされたＥＱ設定に基づいて生成された混合等化に基づいて、再生デバイス上のメディア信号の再生を修正させる命令を含む非一時的コンピュータ可読記憶媒体を含む。

[00322]実施例４９は、命令が、実行されるとき、１つ又は複数のプロセッサに、過去のパーソナライゼーション設定に基づいて、パーソナライズされたＥＱ設定を生成させ、履歴等化が使用可能にされることに応答して、以前の期間に関連付けられるＥＱ設定に基づいて、パーソナライズされたＥＱ設定を調節させる、実施例４８の非一時的コンピュータ可読記憶媒体を含む。

[00323]実施例５０は、命令が、実行されるとき、１つ又は複数のプロセッサに、ユーザのプリファレンスを示すデータの可用性に応答して、ユーザのプリファレンスを示すデータに基づいてＥＱパラメータを決定することであって、ＥＱパラメータがオーディオ再生設定に対応すること、及びユーザのプリファレンスを示すデータに基づいて決定されたＥＱパラメータに基づいて、パーソナライズされたＥＱ設定を調節することを行わせる、実施例４８の非一時的コンピュータ可読記憶媒体を含む。

[00324]実施例５１は、命令が、実行されるとき、１つ又は複数のプロセッサに、再生デバイスの位置データの可用性に応答して、再生デバイスの位置データに基づいて、パーソナライズされたＥＱ設定を調節させ、ユーザの識別の可用性に応答して、ユーザプロファイルに基づいて、パーソナライズされたＥＱ設定を調節させ、メディア信号のソースに関連付けられる情報の可用性に応答して、メディア信号のソースに基づいて、パーソナライズされたＥＱ設定を調節させる、実施例４８の非一時的コンピュータ可読記憶媒体を含む。

[00325]実施例５２は、命令が、実行されるとき、１つ又は複数のプロセッサに、第１のパーソナライズされたＥＱ設定、第２のパーソナライズされたＥＱ設定及びＥＱプロファイルに重みを適用して、混合等化を生成させる、実施例４８の非一時的コンピュータ可読記憶媒体を含む。

[00326]実施例５３は、パーソナライズされたＥＱ設定が、以前の期間に関連付けられるＥＱ設定、ユーザのプリファレンスを示すデータ、再生デバイスの位置データ、ユーザプロファイル、又はメディア信号のソースのうちの少なくとも１つに基づく、実施例４８の非一時的コンピュータ可読記憶媒体を含む。

[00327]実施例５４は、ＥＱプロファイルが、（１）歌に関連付けられるカテゴリを特定する情報、（２）ビデオセグメントに関連付けられるカテゴリを特定する情報、（３）歌又はビデオセグメントに関連付けられるムードを特定する情報、又は（４）メディア信号の一部と共に様々な周波数についての信号強度パラメータを特定する情報のうちの少なくとも１つに対応する再生属性を含む、実施例４８の非一時的コンピュータ可読記憶媒体を含む。

[00328]実施例５５は、再生デバイス上で再生すべきメディア信号を受信したことに応答して、メディア信号に対応する等化（ＥＱ）プロファイルにアクセスすること、パーソナライズされたＥＱ設定を生成すること、並びにＥＱプロファイル及びパーソナライズされたＥＱ設定に基づいて生成された混合等化に基づいて、再生デバイス上のメディア信号の再生を修正することを含む方法を含む。

[00329]実施例５６は、過去のパーソナライゼーション設定に基づいて、パーソナライズされたＥＱ設定を生成すること、及び履歴等化が使用可能にされることに応答して、以前の期間に関連付けられるＥＱ設定に基づいて、パーソナライズされたＥＱ設定を調節することをさらに含む、実施例５５の方法を含む。

[00330]実施例５７は、ユーザのプリファレンスを示すデータの可用性に応答して、ユーザのプリファレンスを示すデータに基づいてＥＱパラメータを決定することであって、ＥＱパラメータがオーディオ再生設定に対応すること、及びユーザのプリファレンスを示すデータに基づいて決定されたＥＱパラメータに基づいて、パーソナライズされたＥＱ設定を調節することをさらに含む、実施例５５の方法を含む。

[00331]実施例５８は、再生デバイスの位置データの可用性に応答して、再生デバイスの位置データに基づいて、パーソナライズされたＥＱ設定を調節すること、ユーザの識別の可用性に応答して、ユーザプロファイルに基づいて、パーソナライズされたＥＱ設定を調節すること、及びメディア信号のソースに関連付けられる情報の可用性に応答して、メディア信号のソースに基づいて、パーソナライズされたＥＱ設定を調節することをさらに含む、実施例５５の方法を含む。

[00332]実施例５９は、第１のパーソナライズされたＥＱ設定、第２のパーソナライズされたＥＱ設定及びＥＱプロファイルに重みを適用して、混合等化を生成することをさらに含む、実施例５５の方法を含む。

[00333]実施例６０は、パーソナライズされたＥＱ設定が、以前の期間に関連付けられるＥＱ設定、ユーザのプリファレンスを示すデータ、再生デバイスの位置データ、ユーザプロファイル、又はメディア信号のソースのうちの少なくとも１つに基づく、実施例５５の方法を含む。

[00334]実施例６１は、オーディオ信号に複数の等化調節を適用して、等化後オーディオ信号を生成するための音量調節器であって、複数の等化調節が、オーディオ信号の平均音量表現を含む入力特徴セットに応答してニューラルネットワークから出力される、音量調節器と、複数の等化調節の適用後に、オーディオ信号の周波数表現の不規則性を検出することであって、不規則性が、しきい値を超える、隣り合う周波数値間の音量の変化に対応すること、及び隣り合う周波数値の第１の周波数値での音量を調節して、不規則性を低減することを行うためのしきい値処理コントローラと、不規則性が低減されたとき、オーディオ信号に適用するための等化（ＥＱ）曲線を生成するＥＱ曲線ジェネレータと、ＥＱ曲線に基づいて、時間領域で等化後オーディオ信号を出力するための周波数－時間領域コンバータとを備える装置を含む。

[00335]実施例６２は、複数の等化調節の適用前に、オーディオ信号の周波数表現の第１の平方自乗平均（ＲＭＳ）値を決定し、不規則性の低減後に、オーディオ信号の周波数表現の第２のＲＭＳ値を決定し、第２のＲＭＳ値と第１のＲＭＳ値との間の比を決定するためのエネルギー計算器をさらに含む、実施例６１の装置。

[00336]実施例６３は、（１）不規則性の低減後の、オーディオ信号の周波数表現の第１のＲＭＳ値と、（２）複数の等化調節の適用前の、オーディオ信号の周波数表現の第２のＲＭＳ値との間の比が、オーディオ信号の許容できるエネルギーの変化に関連付けられるしきい値を超えているかどうかを判定し、比がしきい値を超えていることに応答して、オーディオ信号の周波数表現の利得の正規化を適用するための音量ノーマライザをさらに含む、実施例６１の装置を含む。

[00337]実施例６４は、複数の等化調節が、複数の周波数範囲に対応する複数の音量調節値を含む、実施例６１の装置を含む。

[00338]実施例６５は、しきい値処理コントローラが、オーディオ信号の周波数表現で複数の周波数値を選択し、複数の周波数値に関連付けられる複数の音量値を決定し、複数の周波数値にわたって音量の２次導関数を決定し、２次導関数の絶対値がしきい値を超えることに応答して、隣り合う周波数値の第１の周波数値での音量を調節して、不規則性を低減するためのものである、実施例６１の装置を含む。

[00339]実施例６６は、複数の等化調節が、少なくとも、基準オーディオ信号と、ＥＱ曲線と、ＥＱ曲線を生成した複数のオーディオエンジニアに関連付けられるタグとに基づき、ニューラルネットワークが、少なくとも、基準オーディオ信号と、ＥＱ曲線と、複数のオーディオエンジニアに関連付けられるタグとに関連付けられる推論に基づいて、複数の等化調節を決定する、実施例６１の装置を含む。

[00340]実施例６７は、入力特徴セットが、オーディオ信号の平均音量表現と、オーディオ信号の周波数表現の周波数ビンについての平均標準偏差測定値とを含む、実施例６６の装置を含む。

[00341]実施例６８は、実行されるとき、１つ又は複数のプロセッサに、少なくとも、オーディオ信号に複数の等化調節を適用して、等化後オーディオ信号を生成することであって、複数の等化調節が、オーディオ信号の平均音量表現を含む入力特徴セットに応答してニューラルネットワークから出力されること、複数の等化調節の適用後に、オーディオ信号の周波数表現の不規則性を検出することであって、不規則性が、しきい値を超える、隣り合う周波数値間の音量の変化に対応すること、隣り合う周波数値の第１の周波数値での音量を調節して、不規則性を低減すること、不規則性が低減されたとき、オーディオ信号に適用するための等化（ＥＱ）曲線を生成すること、及びＥＱ曲線に基づいて、時間領域で等化後オーディオ信号を出力することを行わせる命令を含む非一時的コンピュータ可読記憶媒体を含む。

[00342]実施例６９は、命令が、実行されるとき、１つ又は複数のプロセッサに、複数の等化調節の適用前に、オーディオ信号の周波数表現の第１の平方自乗平均（ＲＭＳ）値を決定させ、不規則性の低減後に、オーディオ信号の周波数表現の第２のＲＭＳ値を決定させ、第２のＲＭＳ値と第１のＲＭＳ値との間の比を決定させる、実施例６８の非一時的コンピュータ可読記憶媒体を含む。

[00343]実施例７０は、命令が、実行されるとき、１つ又は複数のプロセッサに、（１）不規則性の低減後の、オーディオ信号の周波数表現の第１のＲＭＳ値と、（２）複数の等化調節の適用前の、オーディオ信号の周波数表現の第２のＲＭＳ値との間の比が、オーディオ信号の許容できるエネルギーの変化に関連付けられるしきい値を超えているかどうかを判定させ、比がしきい値を超えていることに応答して、オーディオ信号の周波数表現の利得の正規化を適用させる、実施例６８の非一時的コンピュータ可読記憶媒体を含む。

[00344]実施例７１は、複数の等化調節が、複数の周波数範囲に対応する複数の音量調節値を含む、実施例６８の非一時的コンピュータ可読記憶媒体を含む。

[00345]実施例７２は、命令が、実行されるとき、１つ又は複数のプロセッサに、オーディオ信号の周波数表現で複数の周波数値を選択させ、複数の周波数値に関連付けられる複数の音量値を決定させ、複数の周波数値にわたって音量の２次導関数を決定させ、２次導関数の絶対値がしきい値を超えることに応答して、隣り合う周波数値の第１の周波数値での音量を調節して、不規則性を低減させる、実施例６８の非一時的コンピュータ可読記憶媒体を含む。

[00346]実施例７３は、複数の等化調節が、少なくとも、基準オーディオ信号と、ＥＱ曲線と、ＥＱ曲線を生成した複数のオーディオエンジニアに関連付けられるタグとに基づき、ニューラルネットワークが、少なくとも、基準オーディオ信号と、ＥＱ曲線と、複数のオーディオエンジニアに関連付けられるタグとに関連付けられる推論に基づいて、複数の等化調節を決定する、実施例６８の非一時的コンピュータ可読記憶媒体を含む。

[00347]実施例７４は、入力特徴セットが、オーディオ信号の平均音量表現と、オーディオ信号の周波数表現の周波数ビンについての平均標準偏差測定値とを含む、実施例７３の非一時的コンピュータ可読記憶媒体を含む。

[00348]実施例７５は、オーディオ信号に複数の等化調節を適用して、等化後オーディオ信号を生成することであって、複数の等化調節が、オーディオ信号の平均音量表現を含む入力特徴セットに応答してニューラルネットワークから出力されること、複数の等化調節の適用後に、オーディオ信号の周波数表現の不規則を性検出することであって、不規則性が、しきい値を超える、隣り合う周波数値間の音量の変化に対応すること、隣り合う周波数値の第１の周波数値での音量を調節して、不規則性を低減すること、不規則性が低減されたとき、オーディオ信号に適用するための等化（ＥＱ）曲線を生成すること、及びＥＱ曲線に基づいて、時間領域で等化後オーディオ信号を出力することを含む方法を含む。

[00349]実施例７６は、複数の等化調節の適用前に、オーディオ信号の周波数表現の第１の平方自乗平均（ＲＭＳ）値を決定すること、不規則性の低減後に、オーディオ信号の周波数表現の第２のＲＭＳ値を決定すること、及び第２のＲＭＳ値と第１のＲＭＳ値との間の比を決定することをさらに含む、実施例７５の方法を含む。

[00350]実施例７７は、（１）不規則性の低減後の、オーディオ信号の周波数表現の第１のＲＭＳ値と、（２）複数の等化調節の適用前の、オーディオ信号の周波数表現の第２のＲＭＳ値との間の比が、オーディオ信号の許容できるエネルギーの変化に関連付けられるしきい値を超えているかどうかを判定すること、及び比がしきい値を超えていることに応答して、オーディオ信号の周波数表現の利得の正規化を適用することをさらに含む、実施例７５の方法を含む。

[00351]実施例７８は、複数の等化調節が、複数の周波数範囲に対応する複数の音量調節値を含む、実施例７５の方法を含む。

[00352]実施例７９は、オーディオ信号の周波数表現で複数の周波数値を選択すること、複数の周波数値に関連付けられる複数の音量値を決定すること、複数の周波数値にわたって音量の２次導関数を決定すること、及び２次導関数の絶対値がしきい値を超えることに応答して、隣り合う周波数値の第１の周波数値での音量を調節して、不規則性を低減することをさらに含む、実施例７５の方法を含む。

[00353]実施例８０は、複数の等化調節が、少なくとも、基準オーディオ信号と、ＥＱ曲線と、ＥＱ曲線を生成した複数のオーディオエンジニアに関連付けられるタグとに基づき、ニューラルネットワークが、少なくとも、基準オーディオ信号と、ＥＱ曲線と、複数のオーディオエンジニアに関連付けられるタグとに関連付けられる推論に基づいて、複数の等化調節を決定する、実施例７５の方法を含む。

[00354]いくつかの例示的方法、装置及び製造品が本明細書で開示されたが、本特許の保護の範囲はそれに限定されない。そうではなく、本特許は、明確に本特許の特許請求の範囲内に含まれるすべての方法、装置及び製造品を包含する。

Claims

オーディオ信号に複数の等化調節を適用して、等化後オーディオ信号を生成するための音量調節器であって、前記複数の等化調節が、前記オーディオ信号の平均音量表現を含む入力特徴セットに応じてニューラルネットワークから出力される、音量調節器と、
前記複数の等化調節の適用後に前記オーディオ信号の周波数表現の不規則性を検出し、前記不規則性が、しきい値を超える、隣り合う周波数値間の音量の変化に対応し、
前記隣り合う周波数値の第１の周波数値での音量を調節して、前記不規則性を低減する、
ためのしきい値コントローラと、
前記不規則性が低減されたとき、前記オーディオ信号に適用するための等化（ＥＱ）曲線を生成するＥＱ曲線ジェネレータと、
前記ＥＱ曲線に基づいて、時間領域で前記等化後オーディオ信号を出力するための周波数－時間領域コンバータと、
を備える装置。
前記複数の等化調節の適用前に、前記オーディオ信号の前記周波数表現の第１の平方自乗平均（ＲＭＳ）値を決定し、
前記不規則性の低減後に、前記オーディオ信号の前記周波数表現の第２のＲＭＳ値を決定し、
前記第２のＲＭＳ値と前記第１のＲＭＳ値との間の比を決定する、エネルギー計算器、をさらに含む、
請求項１に記載の装置。
前記比は、第１の比であり、
前記しきい値は、第１のしきい値であり、
前記装置は、
（１）前記不規則性の低減後の、前記オーディオ信号の周波数表現の第３のＲＭＳ値と、（２）前記複数の等化調節の適用前の、前記オーディオ信号の前記周波数表現の第４のＲＭＳ値との間の第２の比が、前記オーディオ信号の許容できるエネルギーの変化に関連付けられる第２のしきい値を超えているか否かを判定し、
前記第２の比が前記第２のしきい値を超えていることに応じて、前記オーディオ信号の前記周波数表現の利得の正規化を適用する、音量ノーマライザ、をさらに含む、
請求項２に記載の装置。
前記複数の等化調節が、複数の周波数範囲に対応する複数の音量調節値を含む、
請求項１～３のいずれか一項に記載の装置。
前記しきい値コントローラは、
前記オーディオ信号の前記周波数表現で複数の周波数値を選択し、
前記複数の周波数値に関連付けられる複数の音量値を決定し、
前記複数の周波数値にわたって音量の２次導関数を決定し、
前記２次導関数の絶対値が前記しきい値を超えることに応答して、前記隣り合う周波数値の前記第１の周波数値での音量を調節して、前記不規則性を低減する、
請求項１～４のいずれか一項に記載の装置。
前記複数の等化調節が、少なくとも、基準オーディオ信号と、ＥＱ曲線と、ＥＱ曲線を生成した複数のオーディオエンジニアに関連付けられるタグとに基づき、
前記ニューラルネットワークが、少なくとも、前記基準オーディオ信号と、前記ＥＱ曲線と、前記複数のオーディオエンジニアに関連付けられる前記タグとに関連付けられる推論に基づいて、前記複数の等化調節を決定する、
請求項１～５のいずれか一項に記載の装置。
前記入力特徴セットが、前記オーディオ信号の前記平均音量表現と、前記オーディオ信号の前記周波数表現の周波数ビンについての平均標準偏差測定値とを含む、
請求項１～６のいずれか一項に記載の装置。
実行されるとき、１つ又は複数のプロセッサに、少なくとも、
オーディオ信号に複数の等化調節を適用して、等化後オーディオ信号を生成することであって、前記複数の等化調節が、前記オーディオ信号の平均音量表現を含む入力特徴セットに応じてニューラルネットワークから出力される、こと、
前記複数の等化調節の適用後に前記オーディオ信号の周波数表現の不規則性を検出することであって、前記不規則性が、しきい値を超える、隣り合う周波数値間の音量の変化に対応する、こと、
前記隣り合う周波数値の第１の周波数値での音量を調節して、前記不規則性を低減すること、
前記不規則性が低減されたとき、前記オーディオ信号に適用するための等化（ＥＱ）曲線を生成すること、及び、
前記ＥＱ曲線に基づいて、時間領域で前記等化後オーディオ信号を出力すること、
を実行させる命令を含むコンピュータ可読記憶媒体。
前記命令が、実行されるとき、前記１つ又は複数のプロセッサに、
前記複数の等化調節の適用前に、前記オーディオ信号の前記周波数表現の第１の平方自乗平均（ＲＭＳ）値を決定すること、
前記不規則性の低減後に、前記オーディオ信号の前記周波数表現の第２のＲＭＳ値を決定すること、及び、
前記第２のＲＭＳ値と前記第１のＲＭＳ値との間の比を決定すること、をさらに実行させる、
請求項８に記載のコンピュータ可読記憶媒体。
前記比は、第１の比であり、
前記しきい値は、第１のしきい値であり、
前記命令が、実行されるとき、前記１つ又は複数のプロセッサに、
（１）前記不規則性の低減後の、前記オーディオ信号の周波数表現の第３のＲＭＳ値と、（２）前記複数の等化調節の適用前の、前記オーディオ信号の前記周波数表現の第４のＲＭＳ値との間の第２の比が、前記オーディオ信号の許容できるエネルギーの変化に関連付けられる第２のしきい値を超えているか否かを判定すること、
前記第２の比が前記第２のしきい値を超えていることに応じて、前記オーディオ信号の前記周波数表現の利得の正規化を適用すること、をさらに実行させる、
請求項９に記載のコンピュータ可読記憶媒体。
前記複数の等化調節が、複数の周波数範囲に対応する複数の音量調節値を含む、
請求項８～１０のいずれか一項に記載のコンピュータ可読記憶媒体。
前記命令が、実行されるとき、前記１つ又は複数のプロセッサに、
前記オーディオ信号の前記周波数表現で複数の周波数値を選択すること、
前記複数の周波数値に関連付けられる複数の音量値を決定すること、
前記複数の周波数値にわたって音量の２次導関数を決定すること、及び、
前記２次導関数の絶対値が前記しきい値を超えることに応答して、前記隣り合う周波数値の前記第１の周波数値での音量を調節して、前記不規則性を低減すること、をさらに実行させる、
請求項８～１１のいずれか一項に記載のコンピュータ可読記憶媒体。
前記複数の等化調節が、少なくとも、基準オーディオ信号と、ＥＱ曲線と、ＥＱ曲線を生成した複数のオーディオエンジニアに関連付けられるタグとに基づき、
前記ニューラルネットワークが、少なくとも、前記基準オーディオ信号と、前記ＥＱ曲線と、前記複数のオーディオエンジニアに関連付けられる前記タグとに関連付けられる推論に基づいて、前記複数の等化調節を決定する、
請求項８～１２のいずれか一項に記載のコンピュータ可読記憶媒体。
前記入力特徴セットが、前記オーディオ信号の前記平均音量表現と、前記オーディオ信号の前記周波数表現の周波数ビンについての平均標準偏差測定値とを含む、
請求項８～１３のいずれか一項に記載のコンピュータ可読記憶媒体。
オーディオ信号に複数の等化調節を適用して、等化後オーディオ信号を生成するステップであって、前記複数の等化調節が、前記オーディオ信号の平均音量表現を含む入力特徴セットに応じてニューラルネットワークから出力される、ステップと、
前記複数の等化調節の適用後に前記オーディオ信号の周波数表現の不規則性を検出するステップであって、前記不規則性が、しきい値を超える、隣り合う周波数値間の音量の変化に対応する、ステップと、
前記隣り合う周波数値の第１の周波数値での音量を調節して、前記不規則性を低減するステップと、
前記不規則性が低減されたとき、前記オーディオ信号に適用するための等化（ＥＱ）曲線を生成するステップと、
前記ＥＱ曲線に基づいて、時間領域で前記等化後オーディオ信号を出力するステップと、
を含む方法。
前記複数の等化調節の適用前に、前記オーディオ信号の前記周波数表現の第１の平方自乗平均（ＲＭＳ）値を決定するステップと、
前記不規則性の低減後に、前記オーディオ信号の前記周波数表現の第２のＲＭＳ値を決定するステップと、
前記第２のＲＭＳ値と前記第１のＲＭＳ値との間の比を決定するステップと、をさらに含む、
請求項１５に記載の方法。
前記比は、第１の比であり、
前記しきい値は、第１のしきい値であり、
（１）前記不規則性の低減後の、前記オーディオ信号の周波数表現の第３のＲＭＳ値と、（２）前記複数の等化調節の適用前の、前記オーディオ信号の前記周波数表現の第４のＲＭＳ値との間の第２の比が、前記オーディオ信号の許容できるエネルギーの変化に関連付けられる第２のしきい値を超えているか否かを判定するステップと、
前記第２の比が前記第２のしきい値を超えていることに応じて、前記オーディオ信号の前記周波数表現の利得の正規化を適用するステップと、をさらに含む、
請求項１６に記載の方法。
前記複数の等化調節が、複数の周波数範囲に対応する複数の音量調節値を含む、
請求項１５～１７のいずれか一項に記載の方法。
前記オーディオ信号の前記周波数表現で複数の周波数値を選択するステップと、
前記複数の周波数値に関連付けられる複数の音量値を決定するステップと、
前記複数の周波数値にわたって音量の２次導関数を決定するステップと、
前記２次導関数の絶対値が前記しきい値を超えることに応答して、前記隣り合う周波数値の前記第１の周波数値での音量を調節して、前記不規則性を低減するステップと、をさらに含む、
請求項１５～１８のいずれか一項に記載の方法。
前記複数の等化調節が、少なくとも、基準オーディオ信号と、ＥＱ曲線と、ＥＱ曲線を生成した複数のオーディオエンジニアに関連付けられるタグとに基づき、
前記ニューラルネットワークが、少なくとも、前記基準オーディオ信号と、前記ＥＱ曲線と、前記複数のオーディオエンジニアに関連付けられる前記タグとに関連付けられる推論に基づいて、前記複数の等化調節を決定する、
請求項１５～１９のいずれか一項に記載の方法。
前記入力特徴セットが、前記オーディオ信号の前記平均音量表現と、前記オーディオ信号の前記周波数表現の周波数ビンについての平均標準偏差測定値とを含む、
請求項１５～２０のいずれか一項に記載の方法。