JP2021189450A

JP2021189450A - オーディオの個人化をサポートするためのオーディオトラック分析技術

Info

Publication number: JP2021189450A
Application number: JP2021088172A
Authority: JP
Inventors: コンサリポアオミド; Khonsaripour Omid
Original assignee: Harman International Industries Inc
Current assignee: Harman International Industries Inc
Priority date: 2020-06-01
Filing date: 2021-05-26
Publication date: 2021-12-13
Also published as: US20210377662A1; CN113766307A; US12010495B2; EP3920049A1; KR20210148916A

Abstract

【課題】オーディオの個人化をサポートするためのオーディオトラック分析技術の提供。【解決手段】様々な実施形態により、オーディオの個人化を可能にするためのシステム及び技術が明示される。本技術は、オーディオカテゴリのオーディオ個人化設定を特定することと、オーディオトラックの１つ以上のオーディオプロパティを特定することと、１つ以上のオーディオプロパティに基づいて、オーディオカテゴリを代表するオーディオトラックの第１の部分を選択することと、ユーザにオーディオトラックの第１の部分を再生することと、オーディオトラックの第１の部分の再生時に、ユーザの入力に基づいて、ユーザの個人化設定を調整することと、を含む。【選択図】図３

Description

本開示の実施形態は、概して、オーディオデバイスに関し、より具体的には、オーディオの個人化をサポートするためのオーディオトラック分析に関する。

パーソナルエンターテインメントデバイスは、ユーザが電子メディア及びオーディオコンテンツを個人化することを可能にするモバイルアプリケーション及びコンピュータソフトウェアを含み得る。音楽、ビデオ、ビデオゲーム、及び／またはオンライン広告などのオーディオコンテンツを聴いている間のユーザ体験を向上させるために、このようなアプリケーションは、ユーザが、例えば好みのコンテンツを選択して聴くこと、または設定を調整することを可能にし得る。また、特定のオーディオ品質を強化または明確にするために、このようなアプリケーションは、ユーザがオーディオコンテンツをデジタル操作することを可能にし得る。

しかし、所与のオーディオコンテンツで所望のオーディオ体験を達成するために、ユーザは通常、様々なアプリケーション及び／または設定を手動で調整するが、これは退屈であり得、時間がかかり得、及び／または面倒であり得る。例えば、オーディオトラックのニュアンスやアーティファクトをよりよく聞くために、及び／または他の所望の目標を達成するために、ユーザは、個人の好みに基づいて、低音または高音のレベルを上げるもしくは下げる、周波数帯域フィルタを調整する、及び／または圧縮もしくは等化を適用する必要があり得る。

さらに、オーディオコンテンツの様々なカテゴリを切り替える場合に、アプリケーション設定を個人化することは、ユーザには困難であり得る。特に、オーディオプロパティは、オーディオカテゴリにより異なり得る。例えば、第１のオーディオカテゴリ（例えばロックンロール）に特有のオーディオ個人化設定は、第２のオーディオカテゴリ（例えばクラシック）のオーディオコンテンツには、不適切であり得る。その結果、第１のオーディオカテゴリのオーディオ個人化設定が第２のオーディオカテゴリのオーディオコンテンツに適用された場合、オーディオ個人化設定は、第２のオーディオカテゴリのオーディオコンテンツにあまり合わず、よって、第２のオーディオカテゴリのオーディオコンテンツのリスニング体験は低下する。従って、ユーザは、カテゴリ間の切り替えが起こるたびに、オーディオ個人化設定を調整し得る。これは、多くの場合、特にオーディオコンテンツをストリーミングする場合に、所望のリスニング体験を一貫して実現することを困難にする。これらの個人化問題のうちのいくつかは、オーディオカテゴリごとにユーザの個人化設定を記憶することより、対処できる。次に、ユーザの個人化設定は、対応するオーディオカテゴリのオーディオトラックがユーザに再生されるたびに、ロードされ適用され得る。

しかし、特定のオーディオカテゴリを代表するオーディオサンプルを選択して、それによりその特定のオーディオカテゴリの個人化設定を最初に構成することは、困難である。例えば、ユーザは、特定のオーディオカテゴリ内の相当な数のオーディオコンテンツを熟知し得るが、自身の個人化設定を作成するための代表サンプルとして選択する特定のオーディオトラックを、容易に決定できない場合がある。さらに、オーディオプロパティは通常、１つのオーディオコンテンツ内で異なるため、特定のオーディオトラックが特定のオーディオカテゴリを代表する場合でも、特定のオーディオトラックの全ての部分が、特定のオーディオカテゴリの個人化設定を構成するのに好適であるとは限らない。

その結果、ユーザは通常、面倒で、時間がかかり、エラーが起こりやすい個人化プロセスを経て、質の良くない代表サンプルを選択する可能性が高く、選択した代表サンプルで個人化設定を構成することにより、多くの場合、部分的に最適な個人化設定が生じ、かつ各オーディオカテゴリの多数のオーディオコンテンツでリスニング体験が低下する。

従って、音声コンテンツの様々なカテゴリの個人化設定を構成する時に使用するオーディオサンプルをユーザがより適切に選択することを可能にする技術が求められている。

様々な実施形態により、オーディオカテゴリのオーディオ個人化設定を決定するためのコンピュータ実施方法が明示される。方法は、オーディオトラックの１つ以上のオーディオプロパティを特定することと、１つ以上のオーディオプロパティに基づいて、オーディオカテゴリを代表するオーディオトラックの第１の部分を選択することと、ユーザにオーディオトラックの第１の部分を再生することと、オーディオトラックの第１の部分の再生時に、ユーザの入力に基づいて、ユーザの個人化設定を調整することと、を含む。

さらなる実施形態により、数ある中でも、上記の方法を実施するように構成されたシステム及び１つ以上のコンピュータ可読記憶媒体が提供される。

先行技術に対して、開示される技術の少なくとも１つの技術的利点として、開示される技術は、ユーザが特定のオーディオカテゴリに自分好みの個人化設定を実現することを可能にするオーディオ特性の適切なバランスを含む代表オーディオトラック及び代表オーディオトラックの代表オーディオサンプルを、ユーザがより効率的かつ効果的に選択することを可能にすることにより、向上したオーディオ個人化を可能にすることが挙げられる。開示される技術は、ユーザの選択に基づいて、特定のオーディオカテゴリの個人化設定を作成する時に使用する別の代表オーディオトラックを提案し得る。さらに、開示される技術は、個人化設定の構成に使用できるオーディオ特性のカテゴリ特有バランスを含むオーディオトラックの一部を生成するための、より高速で計算効率の良い手段をユーザに提供する。

様々な実施形態の上記に列挙した特徴を詳細に理解できるようにするために、上記で簡潔にまとめた本発明の概念のより具体的な説明が、様々な実施形態を参照して行われ得、そのうちのいくつかが添付図面に示される。しかしながら、添付図面は本発明の概念の典型的な実施形態のみを示しており、よって、いかなる方法でも範囲を限定するものと解釈されるべきではなく、他の同等に効果的な実施形態が存在することに留意されたい。
例えば、本願は以下の項目を提供する。
（項目１）
オーディオカテゴリのオーディオ個人化設定を決定するためのコンピュータ実施方法であって、
オーディオトラックの１つ以上のオーディオプロパティを特定することと、
上記１つ以上のオーディオプロパティに基づいて、上記オーディオカテゴリを代表する上記オーディオトラックの第１の部分を選択することと、
ユーザに上記オーディオトラックの上記第１の部分を再生することと、
上記オーディオトラックの上記第１の部分の再生時に、上記ユーザの入力に基づいて、上記ユーザの個人化設定を調整することと、
を含む、上記コンピュータ実施方法。
（項目２）
上記オーディオトラックの上記第１の部分の複数の繰り返しを含むオーディオサンプルを作成することをさらに含み、
上記オーディオトラックの上記第１の部分を再生することは、上記オーディオサンプルを再生することをさらに含む、
上記項目に記載のコンピュータ実施方法。
（項目３）
上記オーディオサンプルを作成することは、上記オーディオサンプルにおいて上記オーディオトラックの上記第１の部分の上記繰り返しの間にテンポの不連続性が生じないように、上記オーディオトラックの上記第１の部分の継続時間を短縮または延長することを含む、上記項目のいずれか一項に記載のコンピュータ実施方法。
（項目４）
上記オーディオトラックの上記第１の部分を選択する前に、上記１つ以上のオーディオプロパティに基づいて、上記オーディオトラックが上記オーディオカテゴリを代表するか否かを判定することをさらに含む、上記項目のいずれか一項に記載のコンピュータ実施方法。
（項目５）
上記判定に基づいて、上記オーディオカテゴリを代表する第２のオーディオトラックを提案することをさらに含む、上記項目のいずれか一項に記載のコンピュータ実施方法。
（項目６）
上記１つ以上のオーディオプロパティには、低音レベル、高音レベル、周波数スペクトル、エネルギー、またはテンポのうちの少なくとも１つが含まれる、上記項目のいずれか一項に記載のコンピュータ実施方法。
（項目７）
上記オーディオトラックの上記第１の部分を選択することは、上記１つ以上のオーディオプロパティのそれぞれを、上記オーディオカテゴリに関連付けられた対応するオーディオメトリックと比較することを含む、上記項目のいずれか一項に記載のコンピュータ実施方法。
（項目８）
上記オーディオトラックの上記第１の部分を選択することは、上記１つ以上のオーディオプロパティのそれぞれと、上記オーディオカテゴリに関連付けられた対応するオーディオメトリックとの総計差が、閾値差未満であるか否かを判定することを含む、上記項目のいずれか一項に記載のコンピュータ実施方法。
（項目９）
上記オーディオトラックの上記第１の部分を選択することは、上記１つ以上のオーディオプロパティのそれぞれを、上記オーディオカテゴリに関連付けられた対応するオーディオメトリックの範囲と比較することを含む、上記項目のいずれか一項に記載のコンピュータ実施方法。
（項目１０）
上記オーディオトラックに関連付けられたメタデータまたはユーザ選択に基づいて、上記オーディオトラックの上記オーディオカテゴリを特定することをさらに含む、上記項目のいずれか一項に記載のコンピュータ実施方法。
（項目１１）
メモリと、プロセッサとを備えたシステムであって、
上記メモリは、１つ以上のソフトウェアアプリケーションを格納し、
上記プロセッサは、上記１つ以上のソフトウェアアプリケーションを実行すると、
オーディオトラックの１つ以上のオーディオプロパティを特定することと、
上記１つ以上のオーディオプロパティに基づいて、オーディオカテゴリを代表する上記オーディオトラックの第１の部分を選択することと、
ユーザに上記オーディオトラックの上記第１の部分を再生することと、
上記オーディオトラックの上記第１の部分の再生時に、上記ユーザの入力に基づいて、上記ユーザの個人化設定を調整することと、
のステップを実行するように構成される、上記システム。
（項目１２）
上記プロセッサは、上記オーディオトラックの上記第１の部分を選択する前に、上記１つ以上のオーディオプロパティに基づいて、上記オーディオトラックが上記オーディオカテゴリを代表するか否かを判定することのステップを実行するようにさらに構成される、上記項目に記載のシステム。
（項目１３）
上記プロセッサは、上記判定に基づいて、上記オーディオカテゴリを代表する第２のオーディオトラックを提案することのステップを実行するようにさらに構成される、上記項目のいずれか一項に記載のシステム。
（項目１４）
上記オーディオトラックの上記第１の部分を選択することは、上記１つ以上のオーディオプロパティのそれぞれを、上記オーディオカテゴリに関連付けられた対応するオーディオメトリックと比較することを含む、上記項目のいずれか一項に記載のシステム。
（項目１５）
上記オーディオトラックの上記第１の部分を選択することは、上記１つ以上のオーディオプロパティのそれぞれと、上記オーディオカテゴリに関連付けられた対応するオーディオメトリックとの総計差が、閾値差未満であるか否かを判定することを含む、上記項目のいずれか一項に記載のシステム。
（項目１６）
上記オーディオトラックの上記第１の部分を選択することは、上記１つ以上のオーディオプロパティのそれぞれを、上記オーディオカテゴリに関連付けられた対応するオーディオメトリックの範囲と比較することを含む、上記項目のいずれか一項に記載のシステム。
（項目１７）
命令を格納する１つ以上の非一時的コンピュータ可読媒体であって、上記命令が１つ以上のプロセッサにより実行されると、上記１つ以上のプロセッサに、
オーディオトラックの１つ以上のオーディオプロパティを特定することと、
上記１つ以上のオーディオプロパティに基づいて、オーディオカテゴリを代表する上記オーディオトラックの第１の部分を選択することと、
ユーザに上記オーディオトラックの上記第１の部分を再生することと、
上記オーディオトラックの上記第１の部分の再生時に、上記ユーザの入力に基づいて、上記ユーザの個人化設定を調整することと、
のステップを実行させる、上記１つ以上の非一時的コンピュータ可読媒体。
（項目１８）
上記オーディオトラックの上記第１の部分を選択する前に、上記１つ以上のオーディオプロパティに基づいて、上記オーディオトラックが上記オーディオカテゴリを代表するか否かを判定することをさらに含む、上記項目に記載の１つ以上の非一時的コンピュータ可読媒体。
（項目１９）
上記個人化設定を上記オーディオカテゴリに関連付けることと、
上記個人化設定を保存することと、
をさらに含む、上記項目のいずれか一項に記載の１つ以上の非一時的コンピュータ可読媒体。
（項目２０）
再生する第２のオーディオトラックの選択を受信することと、
上記第２のオーディオトラックの第２のオーディオカテゴリを特定することと、
上記第２のオーディオカテゴリに関連付けられた第２の個人化設定をロードすることと、
上記第２の個人化設定に従って上記第２のオーディオトラックのオーディオを修正することにより、カスタマイズされたオーディオ信号を生成することと、
上記カスタマイズされたオーディオ信号を上記ユーザに再生することと、
をさらに含む、上記項目のいずれか一項に記載の１つ以上の非一時的コンピュータ可読媒体。
（摘要）
様々な実施形態により、オーディオの個人化を可能にするためのシステム及び技術が明示される。本技術は、オーディオカテゴリのオーディオ個人化設定を特定することと、オーディオトラックの１つ以上のオーディオプロパティを特定することと、１つ以上のオーディオプロパティに基づいて、オーディオカテゴリを代表するオーディオトラックの第１の部分を選択することと、ユーザにオーディオトラックの第１の部分を再生することと、オーディオトラックの第１の部分の再生時に、ユーザの入力に基づいて、ユーザの個人化設定を調整することと、を含む。

本開示の１つ以上の態様を実施するように構成されたオーディオ個人化システムを示す概略図である。本開示の様々な実施形態の１つ以上の態様を実施するように構成されたコンピューティングシステムの概念ブロック図である。本開示の様々な実施形態による、オーディオカテゴリの個人化設定をカスタマイズするための方法ステップのフローチャートである。本開示の様々な実施形態による、オーディオ個人化設定をオーディオトラックの再生に適用するための方法ステップのフローチャートである。

明確にするために、該当する場合、図面間で共通の同一要素を指すのに、同一の参照番号が使用されている。ある実施形態の特徴は、さらなる詳述なしに、他の実施形態に組み込まれ得ることが企図される。

下記の説明では、様々な実施形態のより完全な理解をもたらすために、多数の具体的な詳細が明記される。しかし、本発明の概念は、これらの具体的な詳細のうちの１つ以上がなくとも実施され得ることは、当業者には明らかであろう。

図１は、本開示の１つ以上の態様を実施するように構成されたオーディオ個人化システム１００を示す概略図である。オーディオ個人化システム１００は、１つ以上のオーディオ環境１１０と、ユーザプロファイルデータベース１２０と、オーディオプロファイルデータベース１３０と、コンピューティングデバイス１４０とを含むが、これらに限定されない。オーディオ個人化システム１００は、ユーザが代表オーディオトラック及び代表オーディオトラックの代表オーディオサンプルをより効率的かつ効果的に選択することを可能にすることにより、ユーザが、対応するオーディオカテゴリでユーザ好みの個人化設定を達成できるように構成される。いくつかの実施形態では、オーディオ個人化システム１００は、ユーザが複数のオーディオカテゴリの個人化設定をカスタマイズできるように構成される。

いくつかの実施形態では、オーディオ体験用のオーディオコンテンツは、コンピューティングデバイス１４０のローカルに格納され、他の実施形態では、このようなオーディオコンテンツは、クラウドベースのインフラストラクチャ１０５で実施されるストリーミングサービス１０４により提供される。オーディオコンテンツには、音楽、ビデオ、映画、ビデオゲーム、オンライン広告、オーディオブック、音声（着信音、動物の音声、合成音）、ポッドキャスト、スポーツイベント、または音響的に聞こえるもしくは録音できる任意の他のコンテンツが含まれ得る。

クラウドベースのインフラストラクチャ１０５は、分散コンピューティングシステム及び／またはクラウドベースのストレージシステムなど、技術的に実現可能な任意のインターネットベースのコンピューティングシステムであり得る。いくつかの実施形態では、クラウドベースのインフラストラクチャ１０５は、複数のネットワーク、複数のサーバ、複数のオペレーティングシステム、及び／または複数のストレージデバイスなどを含むが、これらに限定されない。サーバは、スタンドアロンサーバ、サーバのクラスタもしくは「ファーム」、１つ以上のネットワークアプライアンス、または本開示の１つ以上の態様を実施するのに好適な任意の他のデバイスであり得る。

１つ以上のオーディオ環境１１０のそれぞれは、特定のユーザのためにオーディオコンテンツを再生するように構成される。例えば、オーディオ環境１１０には、１つ以上のスマートデバイス１１１、ヘッドホン１１２、スマートスピーカ１１３、及び／または他の入力／出力（Ｉ／Ｏ）デバイス１１９が含まれ得るが、これらに限定されない。

図１に示される実施形態では、オーディオ環境１１０は、無線または有線によるポイントツーポイントまたはネットワーク化された通信リンクの任意の技術的に実現可能な組み合わせを介して、コンピューティングデバイス１４０から受信されるオーディオコンテンツを再生する。ネットワーク化された通信リンクには、リモートまたはローカルのコンピュータシステム及びコンピューティングデバイスの間の通信を可能にする任意の好適な通信リンクが含まれ、例えばブルートゥース（登録商標）通信チャネル、無線及び有線のＬＡＮ（ローカルエリアネットワーク）、インターネットベースのＷＡＮ（広域ネットワーク）、及び／またはセルラーネットワークなどが挙げられるが、これらに限定されない。その結果、オーディオ環境１１０には、家庭の「ダム」スピーカ、車両のステレオシステム、及び／または従来の一対のヘッドホンなど、コンピューティングデバイス１４０からオーディオコンテンツを直接受信することができる任意のオーディオデバイスが含まれ得る。さらに、図１に示される実施形態では、オーディオ環境１１０は、オーディオ信号処理を内部で実行する能力、またはクラウドベースのインフラストラクチャ１０５で実施されるエンティティからオーディオコンテンツまたは他の情報を受信する能力に、依存しない。

スマートデバイス１１１には、パーソナルコンピュータ、携帯情報端末、タブレットコンピュータ、携帯電話、スマートフォン、メディアプレーヤ、モバイルデバイス、または本発明の１つ以上の態様を実施するのに好適な任意の他のデバイスであり得るコンピューティングデバイスが含まれ得るが、これらに限定されない。スマートデバイス１１１は、電話サービス、ナビゲーションサービス、及び／またはインフォテインメントサービスなどを含むがこれらに限定されない様々なサービスを提供することにより、オーディオ個人化システム１００の機能を増強し得る。さらに、スマートデバイス１１１は、センサからデータを取得し、そのデータをオーディオ個人化システム１００に送信し得る。スマートデバイス１１１は、オーディオ入力デバイスを介して音声データを取得することができ、音声データを処理のためにオーディオ個人化システム１００に送信する。同様に、ユーザがオーディオ個人化システム１００から発信されるオーディオを聞くことができるように、スマートデバイス１１１は、オーディオ個人化システム１００から音声データを受信し、音声データをオーディオ出力デバイスに送信し得る。

ヘッドホン１１２は、オーディオ個人化システム１００から受信した１つ以上のオーディオ信号に基づいて音声を生成できるオーディオ出力デバイス、及び／またはオーディオ個人化システム１００に関連付けられたパワーアンプなどの代替的なオーディオデバイスを含み得る。より具体的には、オーディオ出力デバイスは、１つ以上の電気信号を音波に変換し、音波を物理的環境内へ送ることができる。

スマートスピーカ１１３は、オーディオ入力デバイスを含み得、これは、周囲環境からユーザの声などの音響データを取得し、音響データに関連付けられた信号をオーディオ個人化システム１００に送信し得る。

ヘッドホン１１２及びスマートスピーカ１１３のそれぞれは、１つ以上のスピーカ１１７、及びいくつかの実施形態では、１つ以上のセンサ１１８を含む。スピーカ（複数可）１１７は、コンピューティングデバイス１４０から受信されるカスタマイズされたオーディオ信号に基づいて、音声出力を生成するように構成されたオーディオ出力デバイスである。センサ（複数可）１１８は、ユーザから生体測定データ（例えば心拍数及び／または皮膚コンダクタンスなど）を取得し、生体測定データに関連付けられた信号をコンピューティングデバイス１４０に送信するように構成される。センサ（複数可）１１８により取得された生体測定データは、次に、コンピューティングデバイス１４０で実行される個人化アプリケーション１４５により処理され、特定のユーザの１つ以上の個人的オーディオ選好が決定され得る。様々な実施形態では、センサ（複数可）１１８には、生体測定データを取得可能な任意の種類の画像センサ、電気センサ、及び／または生体測定センサなどが含まれ得、例えばカメラ、電極、及び／またはマイクなどが含まれるが、これらに限定されない。

他のＩ／Ｏデバイス１１９は、入力デバイス、出力デバイス、及び入力データの受信と出力データの生成の両方が可能であるデバイスを含むが、これらに限定されない。他のＩ／Ｏデバイス１１９は、スマートデバイス１１１、ヘッドホン１１２、スマートスピーカ１１３、スピーカ１１７、センサ（複数可）１１８、リモートデータベース、及び／または他のコンピューティングデバイスなどへデータを送信し、及び／またはこれらからデータを受信する有線及び／または無線の通信デバイスを含み得るが、これらに限定されない。さらに、いくつかの実施形態では、他のＩ／Ｏデバイス１１９は、プッシュツートーク（ＰＴＴ）ボタンを含み得、例えば車両、モバイルデバイス、及び／またはスマートスピーカなどに含まれるＰＴＴボタンが挙げられる。

ユーザプロファイルデータベース１２０は、オーディオ環境１１０のいずれかで、特定のユーザに個人化オーディオ体験を生み出すことを可能にするユーザ特有情報を格納する。示されるように、ユーザプロファイルデータベース１２０はクラウドベースのインフラストラクチャ１０５に実装することができ、よって、コンピューティングデバイス１４０がネットワーク化された通信リンクにアクセスできる場合はいつでも、コンピューティングデバイス１４０はユーザプロファイルデータベース１２０にアクセスすることができる。いくつかの実施形態では、特定のユーザに関連付けられ、かつユーザプロファイルデータベース１２０に格納された情報は、その特定のユーザに関連付けられたコンピューティングデバイス１４０のローカルにも格納される。このような実施形態では、ユーザ選好プロファイル（複数可）１２１及び／または個人化設定（複数可）１２２は、コンピューティングデバイス１４０のローカルユーザプロファイルデータベース１４３に格納される。ユーザプロファイルデータベース１２０に格納されたユーザ特有情報は、ユーザ選好プロファイル（複数可）１２１及び個人化設定（複数可）１２２のうちの１つ以上を含み得る。

ユーザ選好プロファイル（複数可）１２１は、特定のユーザに個人化オーディオ体験を生み出すために使用するユーザ特有情報を含み得る。いくつかの実施形態では、ユーザ選好プロファイル（複数可）１２１は、特定のユーザに関連付けられた音響フィルタ及び／またはＥＱ曲線を含む。いくつかの実施形態では、ユーザ選好プロファイル（複数可）１２１は、ダイナミックレンジ圧縮、ダイナミック拡張、オーディオ制限、及び／またはオーディオ信号の空間処理など、ユーザ好みの他の信号処理を含む。いくつかの実施形態では、ユーザ選好プロファイル（複数可）１２１は、ユーザが好みのリスニング設定を構成している間に選択した事前設定のＥＱ曲線を含み得る。ＥＱ曲線は、ユーザが好みのリスニング設定を構成している間にユーザが行った１つ以上の個別の振幅調整を含み得る。事前設定のＥＱ曲線は、有名なミュージシャンや有名人など、別のユーザに関連付けられ得る。いくつかの実施形態では、ＥＱ曲線は、特定のユーザに特有の頭部伝達関数（ＨＲＴＦ）情報を含み得る。

個人化設定（複数可）１２２は、対応するオーディオカテゴリの再生中に、特定のユーザに個人化オーディオ体験を生み出すために使用する情報を含み得る。いくつかの実施形態では、特定のオーディオカテゴリを代表する１つ以上のオーディオプロパティを有するオーディオトラックの再生中にユーザが行った設定に基づいて、各個人化設定１２２は生成され得る。いくつかの実施形態では、各個人化設定１２２は、オーディオトラックの一部の再生中に受信されるユーザ入力から決定され得、オーディオトラックの当該一部は、特定のオーディオカテゴリを代表する１つ以上のオーディオプロパティを有する。

いくつかの実施形態では、各特定のオーディオカテゴリは、音楽的または非音楽的なオーディオコンテンツの任意の分類を含み得る。例えば、オーディオカテゴリは、音楽のジャンル（クラシック、カントリー、ヒップホップ、及び／またはロックなど）を含み得る。オーディオカテゴリはまた、ビデオ、映画、ビデオゲーム、オンライン広告、オーディオブック、音声（着信音、動物の音声、合成音）、ポッドキャスト、スポーツイベント、または音響的に聞こえるもしくは録音できる任意の他のコンテンツの任意の分類を含み得る。いくつかの実施形態では、各特定のオーディオカテゴリは、リズム、ハーモニー、楽器、調性、及び／またはテンポなどの属性の組み合わせに基づく任意の分類を含み得る。

いくつかの実施形態では、特定のユーザにより選択され、オーディオ環境１１０のうちの１つで再生されるオーディオコンテンツは、対応するオーディオカテゴリのオーディオトラック再生時のそのユーザの個人的リスニング選好に適合するように、修正される。あるいは、またはさらに、いくつかの実施形態では、個人化設定（複数可）１２２は、対応するオーディオカテゴリの再生中に適用する他のユーザ好みかつカテゴリ特有の信号処理、例えばカテゴリ特有ダイナミックレンジ圧縮、カテゴリ特有ダイナミック拡張、カテゴリ特有オーディオ制限、及び／またはオーディオ信号のカテゴリ特有空間処理などを含む。いくつかの実施形態では、このようなカテゴリ特有の信号処理はまた、ユーザがオーディオコンテンツをオーディオ環境１１０のうちの１つで再生する時に、オーディオコンテンツを修正するように、オーディオ処理アプリケーション１４６により使用され得る。

コンピューティングデバイス１４０は、本明細書で説明される本開示の少なくとも１つの態様を実施するように構成され得る任意のコンピューティングデバイスであり得、これには、スマートフォン、電子タブレット、ラップトップコンピュータ、パーソナルコンピュータ、携帯情報端末、モバイルデバイス、または本開示の１つ以上の態様を実施するのに好適な任意の他のデバイスが含まれる。通常、コンピューティングデバイス１４０は、個人化アプリケーション１４５及び／またはオーディオ処理アプリケーション１４６に関連付けられた命令を含むがこれらに限定されないアプリケーションプログラムを実行することができる任意の種類のデバイスであり得る。いくつかの実施形態では、コンピューティングデバイス１４０はさらに、ローカルユーザプロファイルデータベース１４３を格納するように構成され、これは、１つ以上のユーザ選好プロファイル（複数可）１２１及び／または個人化設定（複数可）１２２を含み得る。いくつかの実施形態では、コンピューティングデバイス１４０はさらに、オーディオコンテンツのデジタル録音などのオーディオコンテンツ１４４を格納するように構成される。

個人化アプリケーション１４５は、コンピューティングデバイス１４０と、ユーザプロファイルデータベース１２０、オーディオプロファイルデータベース１３０、及びオーディオ環境１１０との間の通信を実行するように構成される。いくつかの実施形態では、個人化アプリケーション１４５はまた、対応するオーディオカテゴリのオーディオトラックの再生中にユーザ音声選好テスト及び／または設定操作などを可能にするユーザインターフェース（図示せず）を、ユーザに提示するように構成される。いくつかの実施形態では、個人化アプリケーション１４５はさらに、ユーザ特有オーディオ処理情報及びカテゴリ特有オーディオ処理情報に基づいて、オーディオ信号に対し、カスタマイズされたオーディオ個人化手順を生成するように構成される。

オーディオ処理アプリケーション１４６は、個人化アプリケーション１４５により生成されたカスタマイズされたオーディオ個人化手順で初期オーディオ信号を処理することにより、カスタマイズされたオーディオ信号を動的に生成し得る。例えば、オーディオ処理アプリケーション１４６は、特定のオーディオカテゴリの再生に関連付けられた１つ以上の適用可能なユーザ個人化設定１２２に基づいて初期オーディオ信号を修正することにより、カスタマイズされたオーディオ信号を生成し得る。

オーディオプロファイルデータベース１３０は、オーディオコンテンツの複数のカテゴリのそれぞれに関して、１つ以上のオーディオメトリック１３１を格納する。特定のオーディオカテゴリに関連付けられたオーディオメトリック１３１のそれぞれは、特定のオーディオカテゴリに含まれるオーディオサンプルを代表する。これらの１つ以上のオーディオメトリック１３１は、個人化アプリケーション１４５により使用可能であり、対応するオーディオカテゴリの個人化設定１２２を設定する際に使用する代表オーディオトラック及び／または代表オーディオサンプルを選択するのに役立つ。示されるように、オーディオプロファイルデータベース１３０はクラウドベースのインフラストラクチャ１０５に実装することができ、よって、コンピューティングデバイス１４０がネットワーク化された通信リンクにアクセスできる場合はいつでも、コンピューティングデバイス１４０はオーディオプロファイルデータベース１３０にアクセスすることができる。オーディオプロファイルデータベース１３０は、オーディオメトリック１３１などの情報を格納し得る。

いくつかの実施形態では、オーディオメトリック１３１は、オーディオカテゴリのそれぞれを代表するオーディオコンテンツの分析に基づいて、生成され得る。いくつかの実施形態では、オーディオメトリック１３１は、動的プロパティ、低音または高音レベル、周波数スペクトル、エネルギー、及び／またはテンポなどの１つ以上のオーディオプロパティに関連付けられたデータを含み得る。

いくつかの実施形態では、オーディオカテゴリのそれぞれに関してオーディオメトリック１３１を決定するために使用するオーディオサンプルは、事前にラベル付け及び／または分類されたオーディオカテゴリのキュレートされたオーディオサンプル集合から選択され得る。いくつかの実施形態では、１つ以上のオーディオカテゴリは、オーディオサンプルの様々なオーディオプロパティ間の１つ以上の境界を特定するアルゴリズムを使用して決定され得、これは、オーディオサンプルの事前ラベル付けまたは分類と一貫する。いくつかの実施形態では、１つ以上の境界は、クラスタリング技術（例えばｋ平均法クラスタ分析）及び／または機械学習技術などを使用して特定され得る。

いくつかの実施形態では、オーディオメトリック１３１は、オーディオカテゴリごとに個別に格納される。いくつかの実施形態では、オーディオメトリック１３１は、集約オーディオコンテンツの統計モデリング、データマイニング、及び／または他のアルゴリズム分析に基づいて、生成され得る。いくつかの実施形態では、オーディオメトリック１３１は、オーディオカテゴリそれぞれのオーディオコンテンツの１つ以上のオーディオプロパティの平均値、標準偏差、値の範囲、及び／または中央値などの１つ以上の統計プロパティを含み得る。非限定的な例として、オーディオメトリック１３１は、一連の事前定義された周波数帯域のそれぞれにおけるスペクトルエネルギーの平均及び標準偏差を含み得、これらは、オーディオカテゴリのそれぞれに関して、事前定義された周波数帯域のそれぞれにおけるスペクトルエネルギーの典型的な量を示す。別の非限定的な例として、オーディオメトリック１３１は、連続するテンポパルス信号、エネルギーフラックス、エネルギースパイク、及び／またはダウンビート位置などの間の時間的分離の平均及び標準偏差を含み得る。いくつかの実施形態では、オーディオメトリック１３１は、テンポパルス信号、エネルギーフラックス、エネルギースパイク、及び／またはダウンビート位置などの周波数の平均及び標準偏差を含み得る。いくつかの実施形態では、オーディオメトリック１３１は、所定の期間中のテンポパルス信号、エネルギーフラックス、エネルギースパイク、及び／またはダウンビート位置などの数の平均及び標準偏差を含み得る。

いくつかの実施形態では、オーディオメトリック１３１は、各オーディオカテゴリに関連付けられた許容誤差ウィンドウを含み得る。許容誤差ウィンドウは、対応するオーディオカテゴリのオーディオコンテンツの１つ以上のオーディオプロパティの期待値の所定範囲であり得る。いくつかの実施形態では、許容誤差ウィンドウは、１つ以上のオーディオプロパティの偏差の限度を含み得る。

いくつかの実施形態では、オーディオメトリックは、対応するオーディオカテゴリへのオーディオサンプルの適合程度に関連付けられる複合または集約オーディオメトリックの計算において、オーディオプロパティのそれぞれに割り当てられる相対的または絶対的な重みまたはスコアを含み得る。いくつかの実施形態では、集約オーディオメトリックは、対応するオーディオカテゴリの好みの個人化設定を構成するのに使用可能なオーディオプロパティのバランスに関連付けられ得る。

いくつかの実施形態では、オーディオメトリック１３１は、個人化アプリケーション１４５により使用され、オーディオカテゴリの個人化設定１２２をカスタマイズするためにユーザが使用する代表オーディオトラック及び代表オーディオサンプルを、ユーザが選択することを支援し得る。いくつかの実施形態では、ユーザは、オーディオトラックの全長、オーディオトラックの一部、または１つ以上のオーディオトラックの１つ以上の部分の集約などを、潜在的な候補オーディオトラックとして選択し、ユーザの個人化設定１２２を設定する時に使用することができる。いくつかの実施形態では、個人化アプリケーション１４５は、オーディオトラックのオーディオプロパティを、選択したオーディオトラックに関連付けられたオーディオカテゴリのオーディオメトリック１３１と比較する。いくつかの実施形態では、選択したオーディオトラックのオーディオカテゴリは、選択したオーディオトラックに関連付けられた分類データ及び／または他のメタデータ（例えばジャンル、サブジャンル、アーティスト、及び／またはタイトルなど）、並びに／あるいはユーザによるオーディオカテゴリの識別から、特定され得る。いくつかの実施形態では、個人化アプリケーション１４５は、関連するオーディオカテゴリを特定するために、１つ以上のオンラインデータベースに対して、分類データ及び／または他のメタデータのリアルタイム検索を実行し得る。いくつかの実施形態では、個人化アプリケーション１４５は、オーディオトラック内の１つ以上の楽器を識別し、１つ以上のオーディオパターンマッチング技術を実行して、対応するオーディオカテゴリを特定し得る。

いくつかの実施形態では、個人化アプリケーション１４５は、動的プロパティ、低音または高音レベル、周波数スペクトル、エネルギー、及び／またはテンポなど、選択したオーディオトラックの１つ以上のオーディオプロパティを特定する。いくつかの実施形態では、オーディオトラックのエネルギーは、様々な周波数副帯域の振幅（ｄＢレベル）を含む。いくつかの実施形態では、オーディオトラックの周波数範囲は、周波数副帯域に分割され得る。いくつかの実施形態では、副帯域は、所定の周波数範囲に関連付けられる。いくつかの実施形態では、副帯域のそれぞれにおけるスペクトルエネルギーに対応する副帯域係数は、修正離散コサイン変換（ＭＤＣＴ）、高速フーリエ変換（ＦＦＴ）、直交ミラーフィルタバンク（ＱＭＦ）、及び／または共役直交ミラーフィルタバンク（ＣＱＭＦ）など、時間周波数領域変換技術を使用して特定され得る。

いくつかの実施形態では、テンポは、エネルギーフラックスとインパルス信号の相関、及び／または反復エネルギースパイク、ダウンビート位置の発見など、小節線検出技術を使用して特定され得る。いくつかの実施形態では、テンポは、エネルギースパイク及び／またはダウンビート位置などの間の平均継続時間で特定され得る。いくつかの実施形態では、テンポは、エネルギースパイク及び／またはダウンビート位置などの平均周波数で特定され得る。いくつかの実施形態では、テンポは、所定の期間中に発生するエネルギースパイク及び／またはダウンビート位置などのカウント数で特定され得る。いくつかの実施形態では、個人化アプリケーション１４５は、短時間フーリエ変換（ＳＴＦＴ）などの技術を使用して、エネルギーフラックスを特定する。

いくつかの実施形態では、個人化アプリケーション１４５は、選択したオーディオトラックのオーディオプロパティを、対応するオーディオカテゴリに関連付けられた１つ以上のオーディオメトリック１３１と比較することにより、選択したオーディオトラックが対応するオーディオカテゴリを代表するか否かを判定する。いくつかの実施形態では、個人化アプリケーション１４５は、オーディオトラックのオーディオプロパティを、対応するオーディオカテゴリに関連付けられた統計的プロパティ及び／または許容誤差ウィンドウのうちの１つ以上を組み合わせたものと、比較する。

いくつかの実施形態では、個人化アプリケーション１４５は、選択したオーディオトラックの全てまたは所定のパーセンテージ（例えば９０パーセント、８０パーセント、及び／または７５パーセントなど）のオーディオプロパティが、オーディオメトリック１３１における各オーディオプロパティの対応する範囲内にあるか否かを判定する。いくつかの実施形態では、範囲は、各オーディオメトリック１３１の対応する平均からの所定数の標準偏差、及び／または各オーディオメトリック１３１の許容誤差ウィンドウなどに基づいて、決定される。

いくつかの実施形態では、個人化アプリケーション１４５は、オーディオプロパティと、対応するオーディオカテゴリの対応するオーディオメトリック１３１との総計差が、閾値差を下回るか否かを判定する。いくつかの実施形態では、オーディオプロパティと対応するオーディオメトリック１３１との差は、オーディオプロパティが、対応するオーディオメトリック１３１の平均とどれだけ異なるかに基づく。いくつかの実施形態では、差は、対応するオーディオメトリックの平均からオーディオプロパティの標準偏差の数を示すｚスコアを特定することにより、測定される。いくつかの実施形態では、オーディオプロパティと対応するオーディオメトリック１３１との差は、距離関数（例えばユークリッド距離）及び／または加重和などを使用して、集約され得る。いくつかの実施形態では、加重和で使用される重みは、各オーディオプロパティに割り当てられた重みまたはスコアに対応し得、これは、対応するカテゴリに関連付けられた個人化設定を決定する際に、他のオーディオプロパティと比較したオーディオプロパティの重要性を示す。

いくつかの実施形態では、１つ以上のオーディオプロパティが１つ以上のオーディオメトリックを満たさないと個人化アプリケーション１４５が判断した場合、個人化アプリケーション１４５は、代替のオーディオトラックを提案し得る。いくつかの実施形態では、個人化アプリケーション１４５は、オーディオメトリック１３１に使用されたオーディオサンプルのキュレートライブラリ内のオーディオサンプルのうちの１つ以上、ストリーミングサービス１０４を介して再生されるオーディオコンテンツ、オーディオコンテンツ１４４、ウェブベースのプログラムから、コンピューティングデバイス１４０のローカルに格納されたプログラムから、及び／またはプレイリストなどから、オーディオトラックを選択する。いくつかの実施形態では、個人化アプリケーション１４５は、対応するオーディオカテゴリのオーディオプロパティと同様のオーディオプロパティを有するオーディオサンプルを提案する。

いくつかの実施形態では、個人化アプリケーション１４５は、対応するオーディオカテゴリの代替オーディオトラックの提案を動的に生成し得る。いくつかの実施形態では、個人化アプリケーション１４５は、オーディオメトリック１３１に使用されたオーディオサンプルのキュレートライブラリ内のオーディオサンプルのうちの１つ以上の分析に基づいて、対応するオーディオカテゴリを代表するオーディオトラックを提案し得る。いくつかの実施形態では、個人化アプリケーション１４５は、対応するオーディオカテゴリのオーディオプロパティと同様のオーディオプロパティを有する複数のオーディオトラックを分析することにより、代替オーディオトラックの提案を動的に生成する。いくつかの実施形態では、個人化アプリケーション１４５は、対応するオーディオカテゴリの１つ以上のオーディオメトリック１３１に対する１つ以上のオーディオサンプルの１つ以上のオーディオプロパティの動的分析に基づいて、別の代表トラックを自動的に選択するように事前構成されたアルゴリズムを使用する。いくつかの実施形態では、個人化アプリケーション１４５は、関連するオーディオカテゴリでのユーザによる代表トラック選択の履歴データ、オーディオカテゴリの代表オーディオトラックに関するデータ、及び／または類似ユーザが選んだ１つ以上の代表トラックを示す人口統計データなどに基づいて、別のオーディオトラックを提案し得る。

いくつかの実施形態では、個人化アプリケーション１４５は、オーディオトラックの１つ以上の部分のオーディオプロパティを１つ以上のオーディオメトリック１３１と比較して、対応するオーディオカテゴリを代表するオーディオトラックの部分を特定する。いくつかの実施形態では、個人化アプリケーション１４５は、選択したオーディオトラックを１つ以上のフレームに分割する。いくつかの実施形態では、個人化アプリケーション１４５は、オーディオトラックの１つ以上の部分のオーディオプロパティを、対応するオーディオカテゴリに関連付けられた統計的プロパティ及び／または許容誤差ウィンドウのうちの１つ以上を組み合わせたものと、比較する。いくつかの実施形態では、個人化アプリケーション１４５は、選択したオーディオトラックが対応するオーディオカテゴリを代表するものであるか否かを判定することに関して前述された技術と同様の技術を使用して、対応するオーディオカテゴリを最も代表するオーディオトラックの部分を特定する。

いくつかの実施形態では、個人化アプリケーション１４５は、オーディオトラックの部分に基づいてオーディオサンプルを作成する。いくつかの実施形態では、オーディオサンプルは、オーディオトラックの部分から生成された事前定義の長さのオーディオコンテンツを含み得る。例えば、オーディオサンプルは、オーディオトラックの部分から選択された１５〜２５秒のサンプルであり得る。いくつかの実施形態では、個人化アプリケーション１４５は、オーディオトラックの部分からオーディオサンプルを事前に選択する、またはユーザ入力に基づいてオーディオサンプルを作成する。いくつかの実施形態では、オーディオサンプルは、オーディオトラックの部分から生成された反復ループである。いくつかの実施形態では、オーディオサンプルは、オーディオトラックの部分の複数の繰り返しを含む。

いくつかの実施形態では、個人化アプリケーション１４５は、オーディオトラックの部分の繰り返しをまとめて、オーディオサンプルにシームレスに編集することにより、オーディオサンプルを作成する。いくつかの実施形態では、個人化アプリケーションは、オーディオトラックの部分の長さを短縮または延長して、オーディオトラックの部分の第１の繰り返しの終了と、オーディオトラックの第２の繰り返しの開始との間にテンポの不連続性が生じないようにする。いくつかの実施形態では、第１の繰り返しにおける最後のテンポパルス信号、エネルギースパイク、及び／またはダウンビート位置などと、第２の繰り返しにおける最初のテンポパルス信号、エネルギースパイク、及び／またはダウンビート位置との間の継続時間が、オーディオトラックの部分の全体的なテンポと一致するように、短縮または延長が選択される。いくつかの実施形態では、オーディオトラックの複数の部分をまとめて組み合わせてオーディオサンプルを作成する場合に、同様の技術が使用され得る。

いくつかの実施形態では、個人化アプリケーション１４５は、オーディオサンプルの１つ以上のオーディオプロパティの動的分析に基づいて、オーディオサンプルの１つ以上の特定の楽節を連続的に再生する。いくつかの実施形態では、オーディオサンプルの再生は、オーディオサンプルのオーディオプロパティを、対応するオーディオカテゴリに関連付けられた１つ以上のオーディオメトリック１３１と比較することに基づく。いくつかの実施形態では、オーディオサンプルの再生は、対応するオーディオカテゴリの１つ以上のオーディオメトリック１３１との総計差が最小であるオーディオサンプルの１つ以上の特定の楽節に、ユーザの焦点を向け直す。

いくつかの実施形態では、個人化アプリケーション１４５は、次に、オーディオサンプルの再生時に、ユーザ入力に基づいて、ユーザの１つ以上の個人化設定を調整し得る。いくつかの実施形態では、ユーザは、低音または高音レベルの上昇または低下、周波数帯域フィルタの調整、圧縮または等化の適用、離散振幅調整の実行、事前設定音響フィルタの選択もしくは修正、及び／またはオーディオカテゴリの好みの信号処理（ダイナミックレンジ圧縮、ダイナミック拡張、オーディオ制限、オーディオ信号の空間処理など）の選択などを、実行することができる。いくつかの実施形態では、ユーザは、出発点として関連するオーディオカテゴリの過去の個人化設定を選択し、オーディオサンプルの再生中に個人化設定を更新することができる。

いくつかの実施形態では、個人化アプリケーション１４５は、次に、オーディオカテゴリの１つ以上の個人化設定を保存する。いくつかの実施形態では、個人化設定は、ユーザプロファイルデータベース１２０内の個人化設定１２２に保存される。

いくつかの実施形態では、オーディオ処理アプリケーション１４６は、個人化設定をオーディオトラックの再生に適用し得る。いくつかの実施形態では、ユーザは、オーディオトラックの全長、オーディオトラックの一部、または１つ以上のオーディオトラックの１つ以上の部分の集約などを選択し得る。いくつかの実施形態では、オーディオ処理アプリケーション１４６は、個人化アプリケーション１４５に関して前述された技術と同様の技術を使用して、オーディオトラックのオーディオカテゴリを特定し得る。いくつかの実施形態では、オーディオ処理アプリケーション１４６は、選択したオーディオトラックに関連付けられた分類データ及び／または他のメタデータから、及び／またはユーザ入力などから、選択したオーディオトラックのオーディオカテゴリを特定する。

いくつかの実施形態では、オーディオ処理アプリケーション１４６は、特定のオーディオカテゴリの個人化設定が使用可能であるか否かを判定する。いくつかの実施形態では、特定のオーディオカテゴリの個人化設定が使用可能でないとオーディオ処理アプリケーション１４６が判定した場合、オーディオ処理アプリケーション１４６は、個人化アプリケーション１４５を使用して個人化設定を作成するオプションを提供する。いくつかの実施形態では、オーディオカテゴリの個人化設定が使用可能であるとオーディオ処理アプリケーション１４６が判定した場合、オーディオ処理アプリケーション１４６は、オーディオカテゴリの個人化設定をロードする。いくつかの実施形態では、オーディオ処理アプリケーション１４６は、ユーザプロファイルデータベース１２０内の保存された個人化設定１２２から、オーディオカテゴリの個人化設定をロードする。いくつかの実施形態では、オーディオ処理アプリケーション１４６は、個人化設定をオーディオトラックの再生に適用する。

図２は、様々な実施形態の１つ以上の態様を実施するように構成されたコンピューティングデバイス２００の概念的ブロック図である。いくつかの実施形態では、コンピューティングデバイス２００は、コンピューティングデバイス１４０と一致する。コンピューティングデバイス２００は、個人化アプリケーション１４５及び／またはオーディオ処理アプリケーション１４６などに関連付けられた命令を含むがこれらに限定されないアプリケーションプログラムを実行することが可能な任意の種類のデバイスであり得る。例えば、コンピューティングデバイス２００は、電子タブレット、スマートフォン、ラップトップコンピュータ、車両に組み込まれたインフォテインメントシステム、及び／またはホームエンターテインメントシステムなどであり得るが、これらに限定されない。あるいは、コンピューティングデバイス２００は、マイクロプロセッサなどのスタンドアロンチップとして、または特定用途向け集積回路（ＡＳＩＣ）及びシステムオンチップ（ＳｏＣ）などとして実装されるより包括的なソリューションの一部として、実装され得る。本明細書で説明されるコンピューティングシステムは例示であり、任意の他の技術的に実現可能な構成も本発明の範囲に含まれることに留意されたい。

図示されるように、コンピューティングデバイス２００は、プロセッサ２５０と、図１のオーディオ環境１１０に接続された入力／出力（Ｉ／Ｏ）デバイスインターフェース２６０と、メモリ２１０と、ストレージ２３０と、ネットワークインターフェース２７０とを接続する相互接続（バス）２４０を含むが、これらに限定されない。プロセッサ２５０は、中央処理装置（ＣＰＵ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、任意の他の種類の処理ユニット、または、例えばデジタル信号プロセッサ（ＤＳＰ）と連動するように構成されたＣＰＵなどの異なる処理ユニットの組み合わせ、として実装される任意の好適なプロセッサであり得る。例えば、いくつかの実施形態では、プロセッサ２５０は、ＣＰＵ及びＤＳＰを含む。通常、プロセッサ２５０は、本明細書で説明されるコンピューティングデバイス２００の動作を促進するためにデータを処理する及び／または命令を実行することが可能な任意の技術的に実現可能なハードウェアユニットであり得る。さらに、本開示の文脈では、コンピューティングデバイス２００内に示されるコンピューティング要素は、物理コンピューティングシステム（例えばデータセンタ内のシステム）に対応し得る、またはコンピューティングクラウド内で実行される仮想コンピューティングインスタンスであり得る。

Ｉ／Ｏデバイスインターフェース２６０は、図１のオーディオ環境１１０とプロセッサ２５０との通信を可能にする。Ｉ／Ｏデバイスインターフェース２６０は通常、プロセッサ２５０が生成するオーディオ環境１１０に対応するアドレスを解釈するのに必要なロジックを含む。Ｉ／Ｏデバイスインターフェース２６０はまた、プロセッサ２５０とオーディオ環境１１０とのハンドシェイクを実施し、及び／またはオーディオ環境１１０に関連付けられた割り込みを生成するように構成され得る。Ｉ／Ｏデバイスインターフェース２６０は、任意の技術的に実現可能なＣＰＵ、ＡＳＩＣ、ＦＰＧＡ、任意の他の種類の処理ユニットまたはデバイスとして実装され得る。

ネットワークインターフェース２７０は、プロセッサ２５０を通信ネットワーク２０５に接続するコンピュータハードウェアコンポーネントである。ネットワークインターフェース２７０は、スタンドアロンカード、プロセッサ、または他のハードウェアデバイスとしてコンピューティングデバイス２００に実装され得る。いくつかの実施形態では、ネットワークインターフェース２７０は、セルラー通信機能、衛星電話通信機能、無線ＷＡＮ通信機能、または通信ネットワーク２０５及びコンピューティングデバイス２００の外部の他のコンピューティングデバイスとの通信を可能にする他の種類の通信機能を備えるように構成され得る。

メモリ２１０は、ランダムアクセスメモリ（ＲＡＭ）モジュール、フラッシュメモリユニット、または任意の他の種類のメモリユニット、あるいはこれらの組み合わせを含み得る。プロセッサ２５０、Ｉ／Ｏデバイスインターフェース２６０、及びネットワークインターフェース２７０は、メモリ２１０に対してデータの読み出し及び書き込みを行うように構成される。メモリ２１０は、プロセッサ２５０により実行可能な様々なソフトウェアプログラムと、個人化アプリケーション１４５及び／またはオーディオ処理アプリケーション１４６などを含む当該ソフトウェアプログラムに関連付けられたアプリケーションデータとを含む。

ストレージ２３０は、不揮発性ストレージデバイスなどの非一時的コンピュータ可読媒体を含み得る。いくつかの実施形態では、ストレージ２３０は、ローカルユーザプロファイルデータベース１４３を含む。

図３は、本開示の様々な実施形態による、オーディオカテゴリの個人化設定をカスタマイズするための方法ステップのフローチャートである。方法ステップは図１のシステムに関して説明されるが、方法ステップを任意の順序で実行するように構成されたあらゆるシステムが、様々な実施形態の範囲に含まれることが、当業者には理解されよう。いくつかの実施形態では、図３の方法のステップの一部または全ては、個人化アプリケーション１４５により実行され得る。

示されるように、方法３００は、ユーザがオーディオトラックを選択するステップ３０１から始まる。いくつかの実施形態では、ユーザは、オーディオトラックの全長、オーディオトラックの一部、または１つ以上のオーディオトラックの１つ以上の部分の集約などを選択し得る。いくつかの実施形態では、ユーザは、ストリーミングサービス１０４を介して再生されるオーディオコンテンツから、またはコンピューティングデバイス１４０のローカルに格納されたオーディオコンテンツ１４４から、オーディオトラックを選択し得る。いくつかの実施形態では、ユーザは、ウェブベースのプログラムまたはコンピューティングデバイス１４０のローカルに格納されたプログラムを使用して、オーディオトラックを選択し得る。いくつかの実施形態では、オーディオトラックは、センサ（複数可）１１８またはスマートデバイス（複数可）１１１上に配置されたセンサから取得されたデータに基づいて、自動的に選択され得る。例えば、オーディオトラックは、選択に関するユーザ発声、オーディオトラックの選択に関連付けられたユーザの動き及び／またはジェスチャ、並びに／あるいは入力デバイスによるユーザインタラクションなどをセンサがキャプチャすることに基づいて、選択され得る。いくつかの実施形態では、オーディオトラックは、プレイリストから選択され得る。

ステップ３０２にて、オーディオトラックのオーディオプロパティが特定される。いくつかの実施形態では、動的プロパティ、低音または高音レベル、周波数スペクトル、エネルギー、及び／またはテンポなど、選択したオーディオトラックの１つ以上のオーディオプロパティが特定される。いくつかの実施形態では、オーディオトラックの周波数範囲は、周波数副帯域に分割され得る。いくつかの実施形態では、図１の個人化アプリケーション１４５に関して前述された周波数領域技術と同様の周波数領域技術を使用して、副帯域のそれぞれにおけるスペクトルエネルギーに対応する副帯域係数が特定される。

ステップ３０３にて、オーディオトラックのオーディオカテゴリが特定される。いくつかの実施形態では、選択したオーディオトラックのオーディオカテゴリは、選択したオーディオトラックに関連付けられた分類データ及び／または他のメタデータから特定され得る。いくつかの実施形態では、選択したオーディオトラックのオーディオカテゴリは、１つ以上のオンラインデータベースに対して、分類データ及び／または他のメタデータのリアルタイム検索を実行することにより特定され得る。いくつかの実施形態では、選択したオーディオトラックのオーディオカテゴリは、オーディオトラック内の１つ以上の楽器を識別し、１つ以上のオーディオパターンマッチング技術を実行することにより特定され得る。

いくつかの実施形態では、オーディオカテゴリは、ユーザ選択に基づいて特定される。いくつかの実施形態では、オーディオカテゴリは、センサ（複数可）１１８またはスマートデバイス（複数可）１１１上に配置されたセンサから取得されたデータに基づいて、自動的に選択され得る。例えば、オーディオカテゴリは、オーディオカテゴリの選択を識別する音声コマンド、オーディオカテゴリの選択を識別するユーザの動き及び／またはジェスチャ、並びに／あるいは入力デバイスによるユーザインタラクションなどをセンサ（複数可）１１８がキャプチャすることに基づいて、選択され得る。

ステップ３０４にて、オーディオトラックのオーディオプロパティは、オーディオカテゴリの１つ以上のオーディオメトリック１３１と比較され、選択したオーディオトラックが対応するオーディオカテゴリを代表するか否かが判定される。いくつかの実施形態では、オーディオトラックのオーディオプロパティは、対応するオーディオカテゴリに関連付けられた統計的プロパティ及び／または許容誤差ウィンドウのうちの１つ以上を組み合わせたものと、比較される。

いくつかの実施形態では、オーディオトラックのオーディオプロパティは、対応するオーディオメトリック１３１の範囲または平均と比較されて、オーディオプロパティの何パーセントが、対応する範囲内であるか、対応する平均から所定数の標準偏差内であるか、及び／または対応するオーディオメトリック１３１の許容誤差ウィンドウ内であるかなどが特定される。いくつかの実施形態では、オーディオトラックのオーディオプロパティと、対応するオーディオメトリック１３１との総計差が、閾値差と比較される。いくつかの実施形態では、総計差は、距離関数（例えばユークリッド距離）及び／または加重和などに基づく。いくつかの実施形態では、オーディオプロパティと対応するオーディオメトリック１３１との差は、対応するオーディオメトリック１３１の平均から測定される、または対応するオーディオメトリックの平均からオーディオプロパティの標準偏差の数を示すｚスコアを特定することにより測定される。

オーディオプロパティが対応するオーディオカテゴリのオーディオメトリック１３１と一致しない場合（例えば対応する範囲外であるオーディオプロパティが多すぎる、及び／または総距離が閾値距離を超える場合）、ステップ３０５にて代替オーディオトラックが提案される。オーディオプロパティがオーディオトラックのオーディオカテゴリのオーディオメトリック１３１と一致する場合、選択したオーディオトラックは、ステップ３０６からさらに処理される。

ステップ３０５にて、代替オーディオトラックが提案される。いくつかの実施形態では、関連するオーディオカテゴリでのユーザによる代表トラック選択の履歴データ、オーディオカテゴリの代表オーディオトラックに関するデータ、及び／または類似ユーザが選んだ１つ以上の代表トラックを示す人口統計データなどに基づいて、別のオーディオトラックが提案される。次に、ユーザが別のオーディオトラックを選択できるようにステップ３０１〜３０４が繰り返され、別のオーディオトラックがオーディオカテゴリと一致するか否かが判定される。

ステップ３０６にて、オーディオカテゴリを代表するオーディオトラックの部分が選択される。いくつかの実施形態では、オーディオトラックは、１つ以上のフレームまたはセグメントに分割される。いくつかの実施形態では、ステップ３０４で使用される技術と同様の技術を使用して、どのフレーム及び／またはセグメントが、ステップ３０３で特定されたオーディオカテゴリの最適代表オーディオプロパティを有するかが特定される。次に、最適代表フレームまたはセグメントが、オーディオトラックの部分として選択される。いくつかの実施形態では、オーディオカテゴリの１つ以上のオーディオメトリック１３１との総計差が最小であるフレーム及び／またはセグメントが、オーディオトラックの部分として選択される。

ステップ３０７にて、オーディオサンプルは、オーディオトラックの部分に基づいて作成される。いくつかの実施形態では、オーディオサンプルは、オーディオトラックの部分から生成された事前定義の長さのオーディオコンテンツ（例えば１５〜２５秒のサンプル）を含み得る。いくつかの実施形態では、オーディオサンプルは、オーディオトラックの部分から生成された反復ループである。いくつかの実施形態では、オーディオサンプルは、オーディオトラックの第１の部分の複数の繰り返しを含む。いくつかの実施形態では、オーディオトラックの第１の部分の任意の２つの繰り返しの間にテンポの不連続性が生じないように、オーディオトラックの部分の繰り返しを共にオーディオサンプルへとシームレスに編集することにより、オーディオサンプルは作成される。

ステップ３０８にて、ユーザのためにオーディオサンプルが再生される。オーディオサンプルは、１つ以上のスマートデバイス１１１、ヘッドホン１１２、スマートスピーカ１１３、及び他の入力／出力（Ｉ／Ｏ）デバイス１１９を含むがこれらに限定されないオーディオ環境１１０内のデバイスのうちのいずれかを使用して、再生され得る。いくつかの実施形態では、オーディオサンプルは、センサ（複数可）１１８またはスマートデバイス（複数可）１１１上に配置されたセンサから取得されたデータに基づいて、自動的に再生され得る。例えば、オーディオサンプルは、ユーザの再生コマンド発声、オーディオサンプルの再生の開始に関連付けられたユーザの動き及び／またはジェスチャ、並びに／あるいは入力デバイスによるユーザインタラクションなどをセンサがキャプチャすることに基づいて、再生され得る。

ステップ３０９にて、オーディオサンプルの再生時に、ユーザ入力に基づいてユーザの１つ以上の個人化設定は調整される。いくつかの実施形態では、ユーザは、低音または高音レベルの上昇または低下、周波数帯域フィルタの調整、圧縮または等化の適用、離散振幅調整の実行、事前設定音響フィルタの選択もしくは修正、及び／またはオーディオカテゴリの好みの信号処理（ダイナミックレンジ圧縮、ダイナミック拡張、オーディオ制限、オーディオ信号の空間処理など）の選択などを、実行することができる。いくつかの実施形態では、ユーザは、出発点として関連するオーディオカテゴリの過去の個人化設定を選択し、オーディオサンプルの再生中に個人化設定を更新することができる。

いくつかの実施形態では、個人化設定（複数可）は、センサ（複数可）１１８またはスマートデバイス（複数可）１１１上に配置されたセンサから取得されたデータに基づいて、自動的に調整される。例えば、個人化設定（複数可）は、設定を上げる、下げる、選択する、修正する、または調整するコマンドのユーザ発声をセンサがキャプチャすることに基づいて、調整され得る。いくつかの実施形態では、個人化設定（複数可）は、設定の調整に関連付けられたユーザの動き及び／またはジェスチャ、並びに／あるいは入力デバイスによるユーザインタラクションなどをセンサがキャプチャすることに基づいて、調整され得る。

ステップ３１０にて、オーディオカテゴリの個人化設定（複数可）が保存される。いくつかの実施形態では、ユーザは、個人化設定（複数可）を新たな個人化設定（複数可）として保存し得る、またはオーディオコンテンツの１つ以上の関連カテゴリの以前保存された個人化設定（複数可）を更新し得る。いくつかの実施形態では、個人化設定（複数可）は、オーディオカテゴリに関連付けられる。いくつかの実施形態では、個人化設定（複数可）は、センサ（複数可）１１８またはスマートデバイス（複数可）１１１上に配置されたセンサから取得されたデータに基づいて、自動的に保存され得る。例えば、個人化設定（複数可）は、ユーザの保存もしくは更新コマンド発声、個人化設定の保存もしくは更新の開始に関連付けられたユーザの動き及び／またはジェスチャ、並びに／あるいは入力デバイスによるユーザインタラクションなどをセンサがキャプチャすることに基づいて、保存され得る。いくつかの実施形態では、個人化設定（複数可）は、ユーザプロファイルデータベース１２０内の個人化設定１２２に保存される。

図４は、オーディオ個人化設定をオーディオトラックの再生に適用するための方法ステップのフローチャートである。方法ステップは図１のシステムに関して説明されるが、方法ステップを任意の順序で実行するように構成されたあらゆるシステムが、様々な実施形態の範囲に含まれることが、当業者には理解されよう。いくつかの実施形態では、図３の方法のステップの一部または全ては、オーディオ処理アプリケーション１４６により実行され得る。

示されるように、方法４００は、ユーザが再生するオーディオトラックを選択するステップ４０１から始まる。いくつかの実施形態では、ユーザは、オーディオトラックの全長、オーディオトラックの一部、または１つ以上のオーディオトラックの１つ以上の部分の集約などを選択し得る。ユーザは、ストリーミングサービス１０４を介して再生されるオーディオコンテンツから、またはコンピューティングデバイス１４０のローカルに格納されたオーディオコンテンツ１４４から、オーディオトラックを選択し得る。ユーザは、ウェブベースのプログラムまたはコンピューティングデバイス１４０のローカルに格納されたプログラムを使用して、オーディオトラックを選択し得る。オーディオトラックは、センサ（複数可）１１８またはスマートデバイス（複数可）１１１上に配置されたセンサから取得されたデータに基づいて、自動的に選択され得る。例えば、オーディオトラックは、選択に関するユーザ発声、オーディオトラックの選択に関連付けられたユーザの動き及び／またはジェスチャ、並びに／あるいは入力デバイスによるユーザインタラクションなどをセンサがキャプチャすることに基づいて、選択され得る。

ステップ４０２にて、オーディオトラックのオーディオカテゴリが特定される。いくつかの実施形態では、選択したオーディオトラックのオーディオカテゴリは、選択したオーディオトラックに関連付けられた分類データ及び／または他のメタデータから特定され得る。いくつかの実施形態では、選択したオーディオトラックのオーディオカテゴリは、１つ以上のオンラインデータベースに対して、分類データ及び／または他のメタデータのリアルタイム検索を実行することにより特定され得る。いくつかの実施形態では、選択したオーディオトラックのオーディオカテゴリは、オーディオトラック内の１つ以上の楽器を識別し、１つ以上のオーディオパターンマッチング技術を実行することにより特定され得る。

いくつかの実施形態では、ステップ３０４で使用される技術と同様の技術を使用して、選択したオーディオトラックのオーディオカテゴリが特定される。いくつかの実施形態では、オーディオカテゴリは、選択したオーディオトラックのオーディオプロパティを、１つ以上のオーディオカテゴリに関連付けられた１つ以上のオーディオメトリック１３１と比較して、選択したトラックのオーディオプロパティに最もよく一致する１つ以上のオーディオメトリック１３１を有するオーディオカテゴリを見つけることにより、特定される。

ステップ４０３にて、特定のオーディオカテゴリの個人化設定が使用可能か否かの判定が行われる。いくつかの実施形態では、ソフトウェアアプリケーションは、ユーザプロファイルデータベース１２０に問い合わせを実行して、格納された個人化設定（複数可）１２２が特定のオーディオカテゴリの個人化設定を含むか否かを判定する。いくつかの実施形態では、特定のオーディオカテゴリの個人化設定が見つからない場合、個人化設定を作成するためのオプションがステップ４０４で提供される。いくつかの実施形態では、特定のオーディオカテゴリの個人化設定が使用可能である場合、選択したオーディオトラックは、ステップ４０５からさらに処理される。

ステップ４０４にて、個人化設定を作成するためのオプションが提供される。いくつかの実施形態では、特定のオーディオカテゴリの個人化設定の提案オプションが生成され、これにより、ユーザはオーディオカテゴリの個人化設定を選択することが可能となる。いくつかの実施形態では、関連するオーディオカテゴリの過去の個人化設定を選択して、特定のオーディオカテゴリの個人化設定を保存するオプションが、ユーザに与えられる。いくつかの実施形態では、図３に開示される方法のように、オーディオカテゴリの個人化設定をカスタマイズするプロセスを開始するオプションが、ユーザに与えられる。

ステップ４０５にて、オーディオカテゴリの個人化設定がロードされる。いくつかの実施形態では、オーディオカテゴリの個人化設定は、ステップ３１０で保存された個人化設定に対応する。

ステップ４０６にて、個人化設定がオーディオトラックの再生に適用される。いくつかの実施形態では、ステップ４０５でロードした個人化設定に従って、ステップ４０１で選択したオーディオトラックのオーディオを修正することにより、カスタマイズされたオーディオ信号が生成される。

要約すると、様々な実施形態は、代表オーディオトラック及び代表オーディオサンプルを選択するための効率的かつ便宜的な手段を提供することにより、オーディオの個人化を可能にするシステム及び技術を明示する。開示される実施形態では、ソフトウェアアプリケーションは、オーディオトラックを分析してそのオーディオプロパティを特定し、オーディオトラックのオーディオプロパティを対応するオーディオカテゴリに関連付けられた１つ以上のオーディオメトリックと比較することにより、オーディオトラックが対応するオーディオカテゴリを代表するか否かを判定する。オーディオトラックが対応するオーディオカテゴリを十分代表する場合、ソフトウェアアプリケーションは、オーディオトラックの１つ以上の部分のオーディオプロパティを１つ以上のオーディオメトリックと比較して、対応するオーディオカテゴリを代表するオーディオトラックの部分を特定する。ソフトウェアアプリケーションは、次に、オーディオトラックの部分に基づいて、オーディオサンプルを作成する。いくつかの実施形態では、ソフトウェアアプリケーションは、次に、オーディオサンプルの再生時に、ユーザ入力に基づいて、ユーザの１つ以上の個人化設定を調整し得る。いくつかの実施形態では、１つ以上の個人化設定は、対応するオーディオカテゴリのオーディオトラックの再生に適用され得る。

先行技術に対して、開示される技術の少なくとも１つの技術的利点として、開示される技術は、ユーザが特定のオーディオカテゴリに自分好みの個人化設定を実現することを可能にするオーディオプロパティの適切なバランスを含む代表オーディオトラックを、ユーザがより効率的かつ効果的に選択することを可能にすることにより、向上したオーディオ個人化を可能にすることが挙げられる。開示される技術は、ユーザの選択に基づいて、特定のオーディオカテゴリの個人化設定を作成する時に使用する別の代表オーディオトラックを提案し得る。さらに、開示される技術は、個人化設定の構成に使用できるオーディオ特性のカテゴリ特有バランスを含むオーディオトラックの一部を生成するための、より高速で計算効率の良い手段をユーザに提供する。

１．いくつかの実施形態における、オーディオカテゴリのオーディオ個人化設定を決定するためのコンピュータ実施方法であって、オーディオトラックの１つ以上のオーディオプロパティを特定することと、前記１つ以上のオーディオプロパティに基づいて、前記オーディオカテゴリを代表する前記オーディオトラックの第１の部分を選択することと、ユーザに前記オーディオトラックの前記第１の部分を再生することと、前記オーディオトラックの前記第１の部分の再生時に、前記ユーザの入力に基づいて、前記ユーザの個人化設定を調整することと、を含む前記コンピュータ実施方法。

２．前記オーディオトラックの前記第１の部分の複数の繰り返しを含むオーディオサンプルを作成することをさらに含み、前記オーディオトラックの前記第１の部分を再生することは、前記オーディオサンプルを再生することをさらに含む、条項１に記載のコンピュータ実施方法。

３．前記オーディオサンプルを作成することは、前記オーディオサンプルにおいて前記オーディオトラックの前記第１の部分の前記繰り返しの間にテンポの不連続性が生じないように、前記オーディオトラックの前記第１の部分の継続時間を短縮または延長することを含む、条項１または２に記載のコンピュータ実施方法。

４．前記オーディオトラックの前記第１の部分を選択する前に、前記１つ以上のオーディオプロパティに基づいて、前記オーディオトラックが前記オーディオカテゴリを代表するか否かを判定することをさらに含む、条項１〜３のいずれかに記載のコンピュータ実施方法。

５．前記判定に基づいて、前記オーディオカテゴリを代表する第２のオーディオトラックを提案することをさらに含む、条項１〜４のいずれかに記載のコンピュータ実施方法。

６．前記１つ以上のオーディオプロパティには、低音レベル、高音レベル、周波数スペクトル、エネルギー、またはテンポのうちの少なくとも１つが含まれる、条項１〜５のいずれかに記載のコンピュータ実施方法。

７．前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれを、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックと比較することを含む、条項１〜６のいずれかに記載のコンピュータ実施方法。

８．前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれと、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックとの総計差が、閾値差未満であるか否かを判定することを含む、条項１〜７のいずれかに記載のコンピュータ実施方法。

９．前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれを、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックの範囲と比較することを含む、条項１〜８のいずれかに記載のコンピュータ実施方法。

１０．前記オーディオトラックに関連付けられたメタデータまたはユーザ選択に基づいて、前記オーディオトラックの前記オーディオカテゴリを特定することをさらに含む、条項１〜９のいずれかに記載のコンピュータ実施方法。

１１．いくつかの実施形態における、メモリと、プロセッサとを備えたシステムであって、前記メモリは、１つ以上のソフトウェアアプリケーションを格納し、前記プロセッサは、前記１つ以上のソフトウェアアプリケーションを実行すると、オーディオトラックの１つ以上のオーディオプロパティを特定することと、前記１つ以上のオーディオプロパティに基づいて、オーディオカテゴリを代表する前記オーディオトラックの第１の部分を選択することと、ユーザに前記オーディオトラックの前記第１の部分を再生することと、前記オーディオトラックの前記第１の部分の再生時に、前記ユーザの入力に基づいて、前記ユーザの個人化設定を調整することと、のステップを実行するように構成される、前記システム。

１２．前記プロセッサは、前記オーディオトラックの前記第１の部分を選択する前に、前記１つ以上のオーディオプロパティに基づいて、前記オーディオトラックが前記オーディオカテゴリを代表するか否かを判定することのステップを実行するようにさらに構成される、条項１１に記載のシステム。

１３．前記プロセッサは、前記判定に基づいて、前記オーディオカテゴリを代表する第２のオーディオトラックを提案することのステップを実行するようにさらに構成される、条項１１または１２に記載のシステム。

１４．前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれを、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックと比較することを含む、条項１１〜１３のいずれかに記載のシステム。

１５．前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれと、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックとの総計差が、閾値差未満であるか否かを判定することを含む、条項１１〜１４のいずれかに記載のシステム。

１６．前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれを、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックの範囲と比較することを含む、条項１１〜１５のいずれかに記載のシステム。

１７．いくつかの実施形態における、命令を格納する１つ以上の非一時的コンピュータ可読媒体であって、前記命令が１つ以上のプロセッサにより実行されると、前記１つ以上のプロセッサに、オーディオトラックの１つ以上のオーディオプロパティを特定することと、前記１つ以上のオーディオプロパティに基づいて、オーディオカテゴリを代表する前記オーディオトラックの第１の部分を選択することと、ユーザに前記オーディオトラックの前記第１の部分を再生することと、前記オーディオトラックの前記第１の部分の再生時に、前記ユーザの入力に基づいて、前記ユーザの個人化設定を調整することと、のステップを実行させる、前記１つ以上の非一時的コンピュータ可読媒体。

１８．前記オーディオトラックの前記第１の部分を選択する前に、前記１つ以上のオーディオプロパティに基づいて、前記オーディオトラックが前記オーディオカテゴリを代表するか否かを判定することをさらに含む、条項１７に記載の１つ以上の非一時的コンピュータ可読媒体。

１９．前記個人化設定を前記オーディオカテゴリに関連付けることと、前記個人化設定を保存することと、をさらに含む、条項１７または１８に記載の１つ以上の非一時的コンピュータ可読媒体。

２０．再生する第２のオーディオトラックの選択を受信することと、前記第２のオーディオトラックの第２のオーディオカテゴリを特定することと、前記第２のオーディオカテゴリに関連付けられた第２の個人化設定をロードすることと、前記第２の個人化設定に従って前記第２のオーディオトラックのオーディオを修正することにより、カスタマイズされたオーディオ信号を生成することと、前記カスタマイズされたオーディオ信号を前記ユーザに再生することと、をさらに含む、条項１７〜１９のいずれかに記載の１つ以上の非一時的コンピュータ可読媒体。

任意の請求項に列挙される任意の請求項要素、及び／または本出願に記載される任意の要素の、任意の方法での任意の組み合わせ並びに全ての組み合わせは、本発明及び保護の企図される範囲に含まれる。

様々な実施形態の説明は、例示目的で提示されており、網羅的である、または開示される実施形態に限定される意図はない。説明される実施形態の範囲及び趣旨から逸脱することのない数多くの変更形態及び変形形態が、当業者には明らかであろう。

本実施形態の態様は、システム、方法、またはコンピュータプログラム製品として具現化され得る。従って、本開示の態様は、完全なハードウェア実施形態、完全なソフトウェア実施形態（ファームウェア、常駐ソフトウェア、マイクロコードなどを含む）、あるいは本明細書で全て概して「モジュール」、「システム」、または「コンピュータ」と称され得るソフトウェア態様及びハードウェア態様を組み合わせた実施形態の形態を取り得る。さらに、本開示に記載の任意のハードウェア及び／またはソフトウェア技術、プロセス、機能、コンポーネント、エンジン、モジュール、あるいはシステムは、回路または回路のセットとして実装され得る。さらに、本開示の態様は、コンピュータ可読プログラムコードを取り込んだ１つ以上のコンピュータ可読媒体（複数可）に具現化されたコンピュータプログラム製品の形態を取り得る。

１つ以上のコンピュータ可読媒体（複数可）の任意の組み合わせが利用され得る。コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であり得る。コンピュータ可読記憶媒体は、例えば、電子、磁気、光学、電磁気、赤外線、もしくは半導体のシステム、機器、もしくはデバイス、または前述の任意の好適な組み合わせであり得るが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例（非包括的一覧）には、１つ以上の通信回線を有する電気接続、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能プログラマブル読み出し専用メモリ（ＥＰＲＯＭもしくはフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み出し専用メモリ（ＣＤ‐ＲＯＭ）、光学記憶装置、磁気記憶装置、または前述の任意の好適な組み合わせが含まれ得る。本文書の文脈において、コンピュータ可読記憶媒体は、命令実行システム、装置、またはデバイスによるが使用するまたは接続する、プログラムを包含または格納可能な任意の有形媒体であり得る。

本開示の態様は、本開示の実施形態による方法、装置（システム）、及びコンピュータプログラム製品のフローチャート図及び／またはブロック図を参照して上記に説明される。フローチャート図及び／またはブロック図の各ブロック、並びにフローチャート図及び／またはブロック図のブロックの組み合わせは、コンピュータプログラム命令により実施できることが、理解されよう。これらのコンピュータプログラム命令が、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されて、マシンが生成され得る。命令が、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行されることにより、フローチャート及び／またはブロック図の１つ以上のブロックの特定の機能／動作を実施することが可能となる。このようなプロセッサは、汎用プロセッサ、専用プロセッサ、特定用途向けプロセッサ、またはフィールドプログラマブルゲートアレイであり得るが、これらに限定されない。

図中のフローチャート及びブロック図は、本開示の様々な実施形態によるシステム、方法、及びコンピュータプログラム製品の可能な実施態様のアーキテクチャ、機能、及び動作を示す。これに関して、フローチャートまたはブロック図の各ブロックは、特定の論理機能（複数可）を実施するための１つ以上の実行可能命令を含むモジュール、セグメント、またはコードの部分を表し得る。いくつかの代替的な実施態様では、ブロックに記される機能は、図に記される順番以外でも起こり得ることにも留意されたい。例えば、連続して示される２つのブロックは、実際には、ほぼ同時に実行されてもよく、または関与する機能に応じて、ブロックは時に逆の順序で実行されてもよい。ブロック図及び／またはフローチャート図の各ブロック、並びにブロック図及び／またはフローチャート図のブロックの組み合わせは、特定の機能もしくは動作を実行する専用ハードウェアベースシステム、または専用ハードウェア及びコンピュータ命令の組み合わせにより、実施され得ることにも留意されたい。

上記は本開示の実施形態を対象とするが、本開示の他の実施形態及びさらなる実施形態は、その基本的な範囲から逸脱することなく考案されてもよく、その範囲は、添付の特許請求の範囲により特定される。

Claims

オーディオカテゴリのオーディオ個人化設定を決定するためのコンピュータ実施方法であって、
オーディオトラックの１つ以上のオーディオプロパティを特定することと、
前記１つ以上のオーディオプロパティに基づいて、前記オーディオカテゴリを代表する前記オーディオトラックの第１の部分を選択することと、
ユーザに前記オーディオトラックの前記第１の部分を再生することと、
前記オーディオトラックの前記第１の部分の再生時に、前記ユーザの入力に基づいて、前記ユーザの個人化設定を調整することと、
を含む、前記コンピュータ実施方法。
前記オーディオトラックの前記第１の部分の複数の繰り返しを含むオーディオサンプルを作成することをさらに含み、
前記オーディオトラックの前記第１の部分を再生することは、前記オーディオサンプルを再生することをさらに含む、
請求項１に記載のコンピュータ実施方法。
前記オーディオサンプルを作成することは、前記オーディオサンプルにおいて前記オーディオトラックの前記第１の部分の前記繰り返しの間にテンポの不連続性が生じないように、前記オーディオトラックの前記第１の部分の継続時間を短縮または延長することを含む、請求項２に記載のコンピュータ実施方法。
前記オーディオトラックの前記第１の部分を選択する前に、前記１つ以上のオーディオプロパティに基づいて、前記オーディオトラックが前記オーディオカテゴリを代表するか否かを判定することをさらに含む、請求項１に記載のコンピュータ実施方法。
前記判定に基づいて、前記オーディオカテゴリを代表する第２のオーディオトラックを提案することをさらに含む、請求項４に記載のコンピュータ実施方法。
前記１つ以上のオーディオプロパティには、低音レベル、高音レベル、周波数スペクトル、エネルギー、またはテンポのうちの少なくとも１つが含まれる、請求項１に記載のコンピュータ実施方法。
前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれを、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックと比較することを含む、請求項１に記載のコンピュータ実施方法。
前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれと、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックとの総計差が、閾値差未満であるか否かを判定することを含む、請求項１に記載のコンピュータ実施方法。
前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれを、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックの範囲と比較することを含む、請求項１に記載のコンピュータ実施方法。
前記オーディオトラックに関連付けられたメタデータまたはユーザ選択に基づいて、前記オーディオトラックの前記オーディオカテゴリを特定することをさらに含む、請求項１に記載のコンピュータ実施方法。
メモリと、プロセッサとを備えたシステムであって、
前記メモリは、１つ以上のソフトウェアアプリケーションを格納し、
前記プロセッサは、前記１つ以上のソフトウェアアプリケーションを実行すると、
オーディオトラックの１つ以上のオーディオプロパティを特定することと、
前記１つ以上のオーディオプロパティに基づいて、オーディオカテゴリを代表する前記オーディオトラックの第１の部分を選択することと、
ユーザに前記オーディオトラックの前記第１の部分を再生することと、
前記オーディオトラックの前記第１の部分の再生時に、前記ユーザの入力に基づいて、前記ユーザの個人化設定を調整することと、
のステップを実行するように構成される、前記システム。
前記プロセッサは、前記オーディオトラックの前記第１の部分を選択する前に、前記１つ以上のオーディオプロパティに基づいて、前記オーディオトラックが前記オーディオカテゴリを代表するか否かを判定することのステップを実行するようにさらに構成される、請求項１１に記載のシステム。
前記プロセッサは、前記判定に基づいて、前記オーディオカテゴリを代表する第２のオーディオトラックを提案することのステップを実行するようにさらに構成される、請求項１１に記載のシステム。
前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれを、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックと比較することを含む、請求項１１に記載のシステム。
前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれと、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックとの総計差が、閾値差未満であるか否かを判定することを含む、請求項１１に記載のシステム。
前記オーディオトラックの前記第１の部分を選択することは、前記１つ以上のオーディオプロパティのそれぞれを、前記オーディオカテゴリに関連付けられた対応するオーディオメトリックの範囲と比較することを含む、請求項１１に記載のシステム。
命令を格納する１つ以上の非一時的コンピュータ可読媒体であって、前記命令が１つ以上のプロセッサにより実行されると、前記１つ以上のプロセッサに、
オーディオトラックの１つ以上のオーディオプロパティを特定することと、
前記１つ以上のオーディオプロパティに基づいて、オーディオカテゴリを代表する前記オーディオトラックの第１の部分を選択することと、
ユーザに前記オーディオトラックの前記第１の部分を再生することと、
前記オーディオトラックの前記第１の部分の再生時に、前記ユーザの入力に基づいて、前記ユーザの個人化設定を調整することと、
のステップを実行させる、前記１つ以上の非一時的コンピュータ可読媒体。
前記オーディオトラックの前記第１の部分を選択する前に、前記１つ以上のオーディオプロパティに基づいて、前記オーディオトラックが前記オーディオカテゴリを代表するか否かを判定することをさらに含む、請求項１７に記載の１つ以上の非一時的コンピュータ可読媒体。
前記個人化設定を前記オーディオカテゴリに関連付けることと、
前記個人化設定を保存することと、
をさらに含む、請求項１７に記載の１つ以上の非一時的コンピュータ可読媒体。
再生する第２のオーディオトラックの選択を受信することと、
前記第２のオーディオトラックの第２のオーディオカテゴリを特定することと、
前記第２のオーディオカテゴリに関連付けられた第２の個人化設定をロードすることと、
前記第２の個人化設定に従って前記第２のオーディオトラックのオーディオを修正することにより、カスタマイズされたオーディオ信号を生成することと、
前記カスタマイズされたオーディオ信号を前記ユーザに再生することと、
をさらに含む、請求項１７に記載の１つ以上の非一時的コンピュータ可読媒体。