JP2015531084A - 主観的忠実度のための音声コンテンツの変換 - Google Patents

主観的忠実度のための音声コンテンツの変換 Download PDF

Info

Publication number
JP2015531084A
JP2015531084A JP2015527646A JP2015527646A JP2015531084A JP 2015531084 A JP2015531084 A JP 2015531084A JP 2015527646 A JP2015527646 A JP 2015527646A JP 2015527646 A JP2015527646 A JP 2015527646A JP 2015531084 A JP2015531084 A JP 2015531084A
Authority
JP
Japan
Prior art keywords
audio signal
listener
signal
person
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015527646A
Other languages
English (en)
Other versions
JP6231102B2 (ja
JP2015531084A5 (ja
Inventor
アントネリーズ、ダーシー
オストロバー、ルイス
Original Assignee
ワーナー・ブラザーズ・エンターテイメント・インコーポレイテット
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ワーナー・ブラザーズ・エンターテイメント・インコーポレイテット filed Critical ワーナー・ブラザーズ・エンターテイメント・インコーポレイテット
Publication of JP2015531084A publication Critical patent/JP2015531084A/ja
Publication of JP2015531084A5 publication Critical patent/JP2015531084A5/ja
Application granted granted Critical
Publication of JP6231102B2 publication Critical patent/JP6231102B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/005Tone control or bandwidth control in amplifiers of digital signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals

Landscapes

  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

リスナに音楽などの音声プログラミングを配信するための方法または装置は、コンテンツが異なるリスナによって知覚される方法と同様にリスナがコンテンツを知覚するように、音声コンテンツを変換するために、リスナ音声知覚特性(時にリスナ個人波形プロファイルと称される)を識別、記録、および適用することを含んでもよい。音声試験ツールは、個々のリスナ個人波形プロファイルを識別および記録するためのソフトウェアアプリケーションとして実装されてもよい。信号プロセッサは、異なるプロファイル間の差異に基づき音声出力を提供するために、個々のリスナ個人波形プロファイルを使用して、ソース音声コンテンツを処理するアルゴリズムを作動させてもよい。【選択図】 図1

Description

本願は概して、コンピュータを使用して音声データを処理することに関し、より具体的には、コンテンツプロデューサまたは他の人物の聴覚経験に対する主観的忠実度のために、音声コンテンツを変換することに関する。
アナログおよびデジタル音声コンテンツは通常、様々な種類のアナログおよびデジタル媒体を介して、創作、記録、記憶、および消費者に配信される。例えば、CD、DVD、BD、磁気テープ、LPレコード、フィルムプリント、デジタルファイル、およびストリームが、消費者によって楽しまれる十分な忠実度をもたらすために、種々の固有の限界および利点を有して使用される。上記の創作、記録、記憶、および伝送媒体および手段のうちの多くの利点および欠点は、よく知られている。
各リスナは、その聴覚経験に個人的な一連の知覚特性をもたらす。各リスナの聴力と知覚装置との間には自然な差異があるため、個々のリスナは、別の人物によって、例えばコンテンツプロデューサによって経験されるようには、同一のコンテンツとは異なって音声コンテンツを経験し得る。自然な周波数、動的、および時間領域偏差が、リスナ間の各耳の間を含む、異なるリスナ間に存在し得る。これらの自然的に発生する差異は、明らかな音響強度、ピッチ、異なる周波数における「可聴閾値」などの閾値、および位置的キューへの感度における差異を含み得る。
ポピュラー音楽および映画/エピソードサウンドトラックのクリエイティブプロデューサのミックスが入手可能であり、それぞれが、周波数応答曲線およびバランス、動力学、またはサラウンド、エコー、遅延、もしくは他の位置的キューなどの単一チャネル、ステレオ、もしくは多チャネル効果など、ある特定の音声特性を重視し得るクリエイティブな選択を強調する。しかしながら、各リスナの外耳および内耳の身体的特性、ならびに各リスナの知覚バイアスは、同一の環境中で同一の音響再生装置を使用しているときでさえ、同一の録音を聴取するときに各リスナが聞こえるものに影響を及ぼす。各リスナが聞こえるものの差異は、リスナが、クリエイティブプロデューサが目的としたものを主観的に知覚することを妨げることによって、プロデューサとリスナとの間のコミュニケーションにわずかな障害を引き起こす可能性がある。
特定の録音(時に「ミックス」と称される)の提示におけるクリエイティブな目的は、特定の聴取経験、例えば、ある特定の周波数バランス、動力学、およびサラウンド音場を含む聴取経験をリスナに提供することを含み得る。音声再生のための創作、記録、記憶、および配信システムは多くの場合、ソースコンテンツに高忠実度を提供しようとして厳しく管理されるが、それにもかかわらず、各リスナの耳および知覚バイアスは、プレイヤデバイスを使用して録音を聴取するときに、制御されない方法でリスナの聴覚経験に影響を及ぼし得る。したがって、リスナの主観的経験は、オーディオプレイヤおよび聴取環境における高忠実度再生への細心の注意にもかかわらず、コンテンツプロデューサによって意図された音響的経験と一致しない可能性がある。
高忠実度のために音声コンテンツを処理するための従来の方法のこれらおよび他の制限は、本明細書に開示された新規の方法および装置によって克服され得る。
主観的忠実度を達成するために、音声コンテンツを変換するための方法、装置、およびシステムが、発明を実施するための形態に詳述され、ある特定の態様が以下に要約される。この発明の概要および発明を実施するための形態は、総合的な開示の補完的な部分として解釈されるべきであり、それらの部分は、重複主題および/または補足主題を含んでもよい。いずれの項における省略も、総合的な本出願書に記載される任意の要素の優先順位または相対的重要性を示さない。項間の差異は、個々の開示から明らかになるように、異なる用語を使用した代替の実施形態、追加の詳細、または同一の実施形態の代替の記載の補足的な開示を含んでもよい。
音楽などの音声プログラミングをリスナに配信する方法は、別のリスナが、コンテンツがコンテンツプロデューサなどの参照リスナによって知覚される方法と同様にコンテンツを知覚するように、音声コンテンツを変換するために、参照リスナの(例えば、コンテンツプロデューサの)音声知覚特性(本明細書において時にリスナの個人波形プロファイル(PWP)と称される)を識別、記録、および適用することを含んでもよい。したがって、ある意味では、音声信号は、リスナに対して測定または推定されたPWPと、コンテンツプロデューサなどの何らかの他の人物に対して測定または推定されたPWPとの間の差異に基づき、各リスナに対してカスタムメイドされ得る。
方法の態様は、クリエイティブプロデューサおよび各対象とするリスナのそれぞれの固有の個人波形プロファイルを識別および記録するために、音声試験ツールおよびソフトウェアアプリケーションを適用することを含んでもよい。方法はさらに、音声出力を提供するために、個々のリスナの個人波形プロファイルを使用して、ソース音声コンテンツを処理するアルゴリズムの動作を含んでもよい。音声出力は、第2のリスナに、ソース音声コンテンツの第1のリスナの主観的経験により近く、音声出力を主観的に経験させるように構成される。その結果、聴衆の一員の主観的聴取経験が、任意の他の人物、例えば、音声クリエイティブプロデューサの聴取経験により近くなるように行われ得、聴衆の一員であるリスナが他の人物と同様の聴取経験を共有できるようにする。
いくつかの実施形態では、音声入力および音声出力に連結されたデジタル信号プロセッサが、音声信号を処理するための方法を実施してもよい。方法は、聴力測定参照プロファイル、聴力測定リスナプロファイル、および符号化された入力音声信号を受信することを含んでもよい。方法はさらに、出力音声信号が差異を補償するように、参照プロファイルまたは好ましいリスナのプロファイルと他のリスナプロファイルとの間の差異に基づき、信号プロセッサを使用して、入力音声信号を出力音声信号に変換することを含んでもよい。変換は、符号化された信号上でデジタル的に実施され、符号化された出力信号を生成してもよい。代替方法において、変換は、デジタルプロセッサの制御下で、復号されたアナログ音声信号を操作する増幅器および/または遅延回路を使用して実施されてもよい。
いくつかの実施形態では、入力音声信号を変換することは、参照およびリスナプロファイルの対応する1つ以上の周波数における差異に比例して、入力音声信号の1つ以上の周波数を変更することを含んでもよい。方法はさらに、第1の人物に対する聴力検査結果に基づき、聴力測定参照プロファイルを生成することと、第2の人物に対する聴力検査結果に基づき、聴力測定リスナプロファイルを生成することとを含んでもよい。その場合、入力音声信号を変換することはさらに、差異が、第1の人物が第2の人物よりも音に敏感であることを示す、1つ以上の周波数において、入力信号を増大させることによって、かつ差異が、第1の人物が第2の人物ほど音に敏感ではないことを示す、1つ以上の周波数において、入力信号を軽減することによって、出力信号を生成することをさらに含んでもよい。入力信号を増大させることは、例えば、音声スペクトルの定義された周波数帯域部分にわたって、信号の振幅を増加させることを含んでもよい。同様に、入力信号を軽減することは、例えば、音声スペクトルの定義された周波数帯域部分にわたって、信号の振幅を減少させることを含んでもよい。
一態様では、符号化された入力音声信号は、第1の人物によって編集されているものとして示されてもよい。例えば、第1の人物は、音声信号が得られる音声トラックまたはプログラムのクリエイティブプロデューサであってもよい。オーディオプレイヤは、リスナが音声信号の変換の基礎を理解することができるように、プロデューサの指示を提供してもよい。出力音声信号は、オーディオプレイヤデバイスによって再生され、第2の人物によって聴取されるとき、第2の人物の聴取経験が、出力音声信号から生成される音に対して、第1の人物に対する聴取経験により近くなるように構成されてもよい。第1の人物がコンテンツプロデューサであるとき、第2の人物(例えば、音声の消費者)は、よりプロデューサによって経験および意図されたように、音声コンテンツを経験し得る。
他の態様では、聴力測定リスナプロファイルを生成することは、聴力測定リスナプロファイルがリスナの群に対する総計基準を表すように、一般集団のサンプルに対する聴力測定データに基づいてもよい。例えば、総計(例えば、平均または中央)聴力測定プロファイルは、異なる性別および年齢幅に対して作成されてもよい。これらの平均プロファイルは、個人の聴力測定データが利用可能ではないときに、リスナプロファイルに接近するために使用されてもよい。
異なる周波数における感度の差異を補償することに加えて、方法はまた、聴覚応答に必要とされる時間の差異を補償するために使用されてもよい。外耳道および耳の他の身体的構造に差異があるため、個人は、わずかに異なる時間に音を知覚し得る。時間の差異は、位置的キューまたは動的効果を知覚する上で差異を引き起こし得る。これらの差異を補償するために、入力音声信号を変換することは、参照およびリスナプロファイルの対応する1つ以上の時間における差異に比例して、入力音声信号の1つ以上の時間における音声信号の位相を変更することを含んでもよい。例えば、位相を変更することは、音声信号によって符号化された音が発生する時間を変化させることによって、音声信号の定義されたサブバンドに対して実施されてもよい。タイムシフトは、異なるチャネル(例えば、右もしくは左チャネル)または上記のチャネルの周波数帯域の音が互いに対して生じる時間を変化させてもよい。
関連した態様では、音声処理装置は、上記で要約された方法および方法の態様のいずれかを実施するために提供されてもよい。装置は、例えば、メモリに連結されたプロセッサであって、メモリが、装置に上記のような動作を実施させるためのプロセッサによる実行のための命令を保持する、プロセッサと、ソース音声信号を提供するためにプロセッサに連結された音声入力と、変換された音声信号を出力するためにプロセッサに連結された音声出力とを含んでもよい。プロセッサ、音声入力、および音声出力を含む装置のある特定の態様(例えば、ハードウェア態様)は、メディアプレイヤ、mp3プレイヤ、コンピュータサーバ、パーソナルコンピュータ、ネットワーク対応テレビ、セットトップボックス、スマートフォン、ノートパッドまたはタブレットコンピュータ、ラップトップコンピュータ、および音声コンテンツにアクセスするために使用される様々な種類の他のコンピュータデバイスなどの機器によって例示され得る。同様に、プロセッサによって実行されるとき、音声信号処理に適したコンピュータデバイスに、上記に要約されたような方法および方法の態様を実施させ得る、符号化された命令を保持する、非一時的コンピュータ可読媒体を含む、製造物品が提供されてもよい。
主観的忠実度のために音声コンテンツを変換するための方法、装置、およびシステムのさらなる実施形態、態様、および詳細は、以下の発明を実施するための形態に示される。
1つ以上の種々の実施形態に従った本技術は、以下の図面を参照して詳述される。図面は例示目的のみで提供され、単に本技術の典型的または例示的な実施形態を図示するにすぎない。同様の要素番号は、図面のうちの1つ以上に表示される同様の要素を示すために使用され得る。
本明細書に記載されるような方法を実施するために使用されてもよいシステムの一実施形態を示す、概略図である。 本明細書に記載される方法を支持および実行するためのオーディオプレイヤの一実施形態を示す、概略ブロック図である。 主観的忠実度のために音声コンテンツを変換する一般的な態様を示す、状態図である。 主観的忠実度のために音声コンテンツを変換するためのデータフローおよび過程を示す、ブロック図である。 位置的キュー感度の聴力検査のためのグラフィカルユーザインターフェースの一例を示す、簡略化したスクリーンショットである。 異なる周波数における聴覚感度を示す、聴力図の一例である。 異なる周波数における知覚時間差を示す、聴力図の一例である。 代替実施形態における、PWP差異に基づいて音声信号を変更するための信号プロセッサおよび過程の態様を示す、ブロック図である。 代替実施形態における、PWP差異に基づいて音声信号を変更するための信号プロセッサおよび過程の態様を示す、ブロック図である。 主観的忠実度のために音声コンテンツを変換することに関連して、音声処理装置によって実施され得る動作を示す図である。 主観的忠実度のために音声コンテンツを変換することに関連して、音声処理装置によって実施され得る動作を示す図である。 主観的忠実度のために音声コンテンツを変換することに関連して、音声処理装置によって実施され得る動作を示す図である。 主観的忠実度のために音声コンテンツを変換することに関連して、音声処理装置によって実施され得る動作を示す図である。 主観的忠実度のために音声コンテンツを変換するように構成される音声処理装置を示す図である。
以下の記載において、説明目的で、1つ以上の実施形態の徹底的な理解を提供するために、多くの特定の詳細が記載される。しかしながら、1つ以上の実施形態は、これらの特定の詳細なしで実施されてもよいことが明らかであり得る。他の場合において、よく知られている構造およびデバイスが、1つ以上の実施形態の記載を容易にするためにブロック図形態で示される。
音声処理のための既知の方法に反して、本技術は、周波数、動力学、および時間領域において音声を単調または実質的に歪みのない状態にするために音声を補正しないし、何らかの形態の一般的な応答フィルタリングを使用して、複数のリスナ(すなわち、1つの部屋内の複数のリスナ位置における)用にも補正しない。代わりに、本技術は、異なるリスナの聴力間の自然な差異を補償するために、音声信号を意図的に歪ませるか、または別様に輪郭を付けるために使用されてもよい。音声は、クリエイティブプロデューサの個人波形プロファイルに従って輪郭が付けられたそのミックスが他人によって楽しまれ得るように、すでに決定された個人波形プロファイルに従って輪郭が付けられてもよい。
この音声処理は、クリエイティブプロデューサの音声コンテンツのオリジナルおよび個人の経験と一致した方法で、音声コンテンツの特定の経験をより広く共有するために使用され得る。クリエイティブプロデューサのPWPは、デフォルトまたは推定されたPWPを参照して、他のリスナのために他のコンテンツを変換するために使用され得るか、あるいはクリエイティブプロデューサのPWPは、下流のリスナのPWPを置き換えるために効果的に操作するために使用され得る。
本技術の一態様では、各リスナの聴覚応答力および知覚特性またはバイアスの基本的および大きな影響を及ぼす特性のいくつか、例えば、クリエイティブ音声プロデューサの聴覚および音声知覚特性は、パラメータの形態の一貫した双方向の方法で、各リスナのPWPを識別および記録することによって特徴づけられる。例えば、双方向の聴力測定式アプリケーションが、パーソナルコンピュータ、スマートフォン、タブレット、またはノートパッドコンピュータ上で実行されてもよい。アプリケーションは、ビジュアルユーザインターフェースを通して管理される試験プロトコルを用いて、ヘッドホンまたは小型イヤホンを通して聴取され得る聴力測定音を生成してもよい。基準からの各リスナの異なる聴覚応答バイアスまたは偏差は、聴力検査データまたは聴覚パラメータの1セットとして識別および記録され得る。パラメータとして識別および記録され得る各リスナの聴覚および知覚バイアスの基本的なおよび大きな影響を及ぼす特性の例としては、例えば、周波数応答力の基準からの聴力測定偏差、異なる音量レベルに対する周波数応答力、すなわち、ラウドネス曲線、全体バランス、すなわち、周波数応答傾斜、および位置キューに対する感度が挙げられ得る。
他の態様では、アルゴリズムは、双方向の聴力測定式試験アプリケーションから抽出し、PWPパラメータを聴力図もしくは信号変換関数として使用され得る他の表示に変換するために、または音声コンテンツを変換するソフトウェアを駆動するために使用されてもよい。例えば、クリエイティブプロデューサのPWPは、参照値(複数を含む)と比較した聴力図として表示され、次いで、例えば、選択された周波数および/またはチャネルにおける音声周波数またはタイムシフトを増大または軽減することによって、他の測定された聴力検査パラメータPWPが比較および変換され得る基準として使用されてもよい。好ましいクリエイティブプロデューサ以外のリスナに対して、ある特定の測定された聴覚特性を有するクリエイティブプロデューサによって記録されているソース資料は、たとえ聴力検査パラメータによって表される他のリスナの聴覚特性がクリエイティブプロデューサとは異なっていても、周波数応答、動力学、位置キュー、およびクリエイティブプロデューサの聴覚を制御する他の関連特性を復元または別様に協調/非強調するために、例えば等化およびフィルタリング技術を使用して、「正規化」または別様に変換されてもよい。
他の態様では、分散型およびホストコンピューティングリソースのシステムが、記録されたPWP変換を記憶およびアクセス可能にするために、例えば、クラウドストレージを介してデータを記憶し、記憶されたデータへのアクセスを提供するために、使用されてもよい。このデータは後に、PWP中に記録されたバイアスと一致した方法で、音声コンテンツを変換するために選択され、音声コンテンツに適用され得る。一人物のPWPは、PWPパラメータ間の差異に基づき、例えば、選択的周波数強調/非強調、異なる音量バランスにおける周波数感度、および位置キュー強調/非強調によって、別の人物のPWPに対してスワップアウトされ得る。
一モードにおいて、クリエイティブプロデューサのPWP変換は、このクリエイティブプロデューサによってすでにミックスされたコンテンツだけではなく、任意のコンテンツに適用され得る。別のモードにおいて、クリエイティブプロデューサのPWP変換は、好ましいクリエイティブプロデューサのPWP変換対下流のリスナのPWP変換に照らして、所望の音声特性が増大または軽減されるように、下流のリスナのPWP変換が、クリエイティブプロデューサのPWP変換の音声特性をよりよく伝達する逆変換パラメータを使用して、正規化され得るように、第2の異なるリスナのPWPと比較され得る。例えば、フィルタリングまたは他のPWP関連強調/非強調は、クリエイティブプロデューサによって意図されるが、下流のリスナによって意図された忠実度で知覚されない、ある特定の周波数、周波数帯域、動力学、またはバランス特性を復元してもよい。別のモードにおいて、PWPの第1または第2のモードは、例えば比較目的で、スイッチを切られ得る。
PWP変換特性が上記の双方向の聴力測定式試験を使用して識別および記録され得る、異なる環境がある。例えば、試験は、小型イヤホン試験を介して外耳道で、ヘッドホンを使用してオンイヤーもしくはオーバーイヤーで、またはラウドスピーカを使用して部屋もしくは仕切りのない空間などの空間で、実施されてもよい。この場合、外耳道が小型イヤホンを介して伝達される音に影響を与える方法とは異なる方法で、部屋およびヘッドホンが音声システム(例えば、従来のスピーカまたはヘッドホン)によって再生される音を「読み込む」ため、異なる層の解釈が関わり得る。
同様に、例えば、ヘッドホンもしくは小型イヤホンを介して、またはラウドスピーカを使用して部屋もしくは仕切りのない空間で、音声コンテンツが楽しまれ得る、異なる環境がある。加えて、異なる音声再生システムがいくつかの周波数、周波数帯域、動力学、および位置キューを再生することが可能であることまたは不可能であることは、装置およびこれらの環境の詳細によって異なる。
そのような環境の差異を説明するために、PWPを作成するためのアプリケーション試験の異なるモードは、聴力検査または聴取環境がそれぞれ、インイヤ式小型イヤホン、オーバーイヤーもしくはオンイヤーヘッドホン、または他の「包囲」環境であるかどうかに応じて作成されてもよい。再生環境におけるインイヤ式小型イヤホン、オーバーイヤーもしくはオンイヤーヘッドホン、または他の「包囲」環境の変化は、PWP変換を適用するときに考慮されてもよい。
聴力検査のための双方向のアプリケーションは、標準的な聴力検査よりも異なるかつ面白いユーザインターフェースを有して作成され得る。例えば、インターフェースは、ユーザが、PWPの関連パラメータを識別および記録するために、ある特定の周波数、周波数帯域、動力学、および位置キュー材料を強調するコンテンツを使用して、何が「より心地良いか、またはあまり心地良くないか」を選択することを可能にするように構成されてもよい。
コンテンツに適用される、または別のPWP変換と置き換えられる、PWP変換の加法的および/または減法的音声特性は、それにより音声コンテンツを変更し、その結果、一人物が別の人物により近く音声コンテンツを聴取および知覚することができる。例えば、消費者は、2人のリスナの異なる内耳/外耳および知覚バイアスにもかかわらず、クリエイティブプロデューサが聴取および意図したものにより近く聴取することができる。
本明細書に開示された特徴および態様は、図1に示されるシステム100、またはリスナもしくはリスナの群に対する聴力測定データを取得すること、ソース音声コンテンツを取得すること、変換されたコンテンツを取得するために音声コンテンツを処理すること、および変換されたコンテンツから音声出力を提供することが可能な任意の他のシステム内で実装されてもよい。システム100は、広域ネットワーク(WAN)112を介して、または任意の他の好適な方法で通信している、ある特定の信号伝達および処理コンポーネントを含んでもよい。例えば、コンポーネントは、内部バス、無線ネットワーク、ローカルエリアネットワーク、または他の通信ネットワークもしくは回線のうちの1つ以上によって通信してもよい。
システム100は、音声コンテンツ生成のためのコンポーネント102を含んでもよく、それは、聴力測定モジュール114を使用して測定され得る、個人的な聴覚および知覚特性を有し得る、ビデオプロデューサ104によって操作されてもよい。したがって、音声コンテンツ生成モジュール102は、ビデオプロデューサ104による試験過程を通して、またはデータストアから、例えばクラウドストレージ106からすでに取得されたPWPまたは他のプロファイルを取り出すことによって、PWPまたは他の聴力測定プロファイルを取得するために、聴力測定モジュール114と連動してもよい。音声コンテンツ生成モジュール102は、音声生成の技術分野で既知のような任意の好適な音声ミキシングおよび編集装置を備えてもよく、デジタルおよびアナログコンポーネントの両方を含んでもよい。いったん特定の音声コンテンツが生成およびリリースされると、コンテンツは、コンテンツサーバ108にデジタル形態(例えば、mp3または他の音声フォーマットで)で提供されてもよく、コンテンツサーバ108は、任意の好適な非一時的コンピュータ可読媒体、例えば、クラウドストレージコンポーネント106、または他の有形媒体中の音声コンテンツの記憶の準備をしてもよい。
コンテンツサーバ108は、WAN112と通信しているコンピュータサーバとして構成されてもよい。サーバ108は、クラウドストレージ106からの音声コンテンツおよびPWPまたは他の聴力測定データの記憶および取り出しを管理してもよい。サーバ108およびクラウドストレージは、データを記憶および分散するための1つの好適なモードの一例であり、他のモードもまた好適であり得ることが理解されるべきである。例えば、音声コンテンツおよびPWPデータは、携帯媒体上、例えば光ディスクまたはメモリデバイス上で記憶および分散されてもよい。
システム100は、インテリジェントオーディオプレイヤ110を含んでもよく、それは、専用のハードウェアおよび/またはソフトウェアによって、専用オーディオプレイヤ、またはより汎用な機械の専用モジュールとして構成されてもよい。オーディオプレイヤはまた、音声ストリームに同期化されたビデオを再生してもよい。インテリジェントオーディオプレイヤ110は、例えば、パーソナルコンピュータ、スマートフォン、ノートブックコンピュータ、ノートパッドコンピュータ、タブレットコンピュータ、多機能テレビ、または他のコンポーネント中で具体化されてもよい。プレイヤ110は、有線および/または無線インターフェースを介して、WAN112と通信してもよい。プレイヤ110は、聴力測定モジュール114又は同様のモジュールを使用して測定され得る、個人的な聴覚および知覚特性を有する、音声の消費者116によって操作されてもよい。
聴力測定モジュール114は、インテリジェントオーディオプレイヤ110の1つのコンポーネントとして含まれてもよく、または別個のハードウェア中のスタンドアロン型コンポーネントとして構成されてもよい。代替方法において、聴力測定モジュール114の第1の部分は、オーディオプレイヤ110中に、第2の部分は別個のハードウェア中に実装されてもよく、第1および第2の部分は、聴力検査過程を実施するために、WAN112または他の接続を介して互いと連動してもよい。
図2を参照すると、例示的なインテリジェントオーディオプレイヤ200の線図が示される。オーディオプレイヤ200は、コンピュータであってもよく、またはコンピュータを含んでもよい。選択された実施形態では、コンピュータ200は、プロセッサメモリ204に動作可能に連結される、プロセッサ202を含んでもよく、プロセッサメモリ204は、プロセッサ202による実行のための2進化機能モジュールを保持する。そのような2進化機能モジュールは、入力/出力およびメモリアクセスなどのシステム機能を処理するための動作システム206、ユーザインターフェース、例えば、ディスプレー装置228および音声出力ポート218を介して、聴力検査を実施するための聴力測定モジュール208、聴力測定モジュール208からのPWPを参照PWPで処理するための比較モジュール、ならびにユーザPWP(または選択された平均的な群のPWP)の、音声プロデューサからの参照PWPまたは他の基準との比較に基づき、入力音声コンテンツを変換するための音声処理モジュール212を含んでもよい。
バス214または他の通信コンポーネントは、コンピュータ200内の情報の通信を支持してもよい。プロセッサ202は、特定のタスクを定義する機械可読ソフトウェアコードを実行することによって、本明細書に開示された特徴および態様に従って、特定のタスクを実施するように構成される、特殊または専用マイクロプロセッサであってもよい。プロセッサメモリ204(例えば、ランダムアクセスメモリ(RAM)または他の動的記憶デバイス)は、バス214、またはプロセッサ202に直接接続され、プロセッサ202によって実行される情報および命令を記憶してもよい。メモリ204はまた、プロセッサ202によって実行される命令の実行中、一時変数または他の中間情報を記憶してもよい。
記憶デバイス224中のコンピュータ可読媒体は、バス214に接続され、プロセッサ202に対する静的情報および命令を記憶してもよく、例えば、記憶デバイス224は、オーディオプレイヤ200の電源が切られているとき、モジュール206、208、210、および212を記憶してもよく、そこから、モジュールは、クライアント200の電源が入れられるとき、プロセッサメモリ204にロードされてもよい。記憶デバイス224は、情報、命令、またはそれらのいくつかの組み合わせ、例えば、プロセッサ202によって実行されるとき、オーディオプレイヤ200に本明細書に記載される方法の1つ以上の動作を実施させる命令を保持する、非一時的コンピュータ可読媒体を含んでもよい。
通信インターフェース216もまた、バス214に接続され得る。通信インターフェース216は、任意にルータ/モデム226および有線または無線接続(図示せず)を介して、オーディオプレイヤ200と1つ以上の外部デバイス、例えば、コンテンツサーバ108との間の双方向データ通信を提供または支持してもよい。加えて、オーディオプレイヤ200は、ユーザに可聴出力を生成するための好適な音声受信機/スピーカシステム、例えば小型イヤホン228、外部ヘッドホン、外部またはステレオ/サラウンド音響システムを駆動するための、音声出力ポート218を含んでもよい。外耳道に挿入される高品質内部イヤホンは、外部ヘッドホンまたはスピーカが使用されるとき存在する環境上または身体構造上の差異を排除するために有利であることが理解されるべきである。したがって、より一貫したかつ予測可能な結果が、聴力検査およびコンテンツ聴取のための外部システムの代わりに、小型イヤホンを使用することによって達成され得る。
オーディオプレイヤ200は、ディスプレー装置228に接続されてもよい(例えば、バス214およびグラフィック処理ユニット220を介して)。ディスプレー228は、オーディオプレイヤ200のユーザに情報を表示するための任意の好適な構成を含んでもよい。例えば、ディスプレー228は、視覚的表示でオーディオプレイヤ200のユーザに情報を示すために、液晶ディスプレー(LCD)、タッチスクリーンLCD(例えば、容量ディスプレー)、発光ダイオード(LED)ディスプレー、プロジェクタ、または他のディスプレーデバイスを含むか、または利用してもよい。
1つ以上の入力デバイス230(例えば、英数字キーボード、マイクロホン、キーパッド、リモートコントローラ、ゲームコントローラ、カメラ、またはカメラアレイ)は、クライアント200に情報およびコマンドを通信するために、ユーザ入力ポート222を介してバス214に接続されてもよい。選択された実施形態では、入力デバイス230は、カーソルの位置決定の制御を提供または支持してもよい。カーソルの位置決定の制御を提供または支持するカーソル制御デバイスは、ポインティングデバイスとも呼ばれるが、物理的移動を受信または追跡し、その移動を、カーソル移動を示す電気信号に変換するために、マウス、トラックボール、トラックパッド、タッチスクリーン、カーソル方向キー、または他のデバイスとして構成されてもよい。カーソル制御デバイスは、例えばタッチセンサ式スクリーンを使用して、ディスプレー装置228に組み込まれてもよい。カーソル制御デバイスは、プロセッサ202に方向情報およびコマンド選択を通信し、ディスプレー228上のカーソル移動を制御してもよい。カーソル制御デバイスは、2つ以上の自由度を有してもよく、例えば、デバイスが平面または三次元空間中のカーソル位置または他のポインティング/選択情報を特定することを可能にする。
オーディオプレイヤ200は、1つ以上のソース音声コンテンツおよび関連した聴力測定参照プロファイルを受信、処理、および出力するために使用されてもよい。選択された実施形態では、1つ以上のソース音声コンテンツおよび関連した聴力測定参照プロファイルの受信、処理、および出力は、メインメモリ204に含有される1つ以上の命令の1つ以上のシーケンスを実行するプロセッサ202に応答してもよい。メインメモリ204に含有される1つ以上の命令は、別の非一時的コンピュータ可読媒体(例えば、記憶デバイス224)からメインメモリ204に読み込まれてもよい。
メインメモリ204に含有される命令シーケンスの実行は、プロセッサ202に、本明細書に記載される手順または工程のうちの1つ以上を実施させてもよい。選択された実施形態では、多重処理配列中の1つ以上のプロセッサ202もまた、メインメモリ204に含有される命令シーケンスを実行するために採用されてもよい。あるいは、またはそれに加えて、ファームウェアが、本明細書に開示された特徴および態様に従って手順または工程を実装するために、ソフトウェア命令の代わりに、またはソフトウェア命令と組み合わせて使用されてもよい。本明細書に開示された特徴および態様に従った実施形態は、ハードウェア回路およびソフトウェアの任意の特定の組み合わせに限定されない。
図3を参照すると、異なるリスナまたはリスナの群の聴力測定プロファイル間の差異に基づいた、音声信号変更過程300の一般的な態様が示される。初期状態308は、クリエイティブプロデューサによって構成されるようなソース音声コンテンツを表す。初期状態308は、種々の方法で、例えばデジタル音声ファイル、例えば、mp3、AIFF、wav、wma、または他のフォーマットでフォーマットされたファイルによって、コンピュータメモリ中で表されてもよい。初期状態308が、ある期間にわたって、特にスピーカまたはイヤホンなどのトランスデューサからの物理的音声出力を表すデータによって定義されてもよいことが明らかとなるはずである。したがって、初期状態データは、入力デジタル音声ファイルがオーディオプレイヤによって再生されたとき、すでに達成された、または結果となり得た、物理的状態(例えば、特定の音)の変化の特定のパターンを表す。
音声変換過程300は、最終状態310を出力するために初期状態308で動作する、コンピュータプロセッサによって実施される、入力出力計算過程である(またはそれを含む)。最終状態310は同様に、スピーカまたはイヤホンなどのトランスデューサからの物理的音声出力を表す。したがって、音声変換過程300は、入力として、入力デバイスを介して初期状態308およびユーザ入力を受信し、音声出力デバイスによって生成される音の物理的パターンを表す状態データを、最終状態310に変換する、状態機械として動作してもよい。続いて、最終出力状態は、オーディオプレイヤからの物理的出力で実現され、出力は、参照PWPによって定義された実際のまたは仮想的な人物の知覚に近づく主観的知覚を可能にするために、定義されたリスナのPWPに基づきカスタマイズされる、動的音場の出力を含む。
音声変換過程300は、いくつかの双方向のモジュール、例えば、聴力測定プロファイリングモジュール302、プロファイル比較または処理モジュール304、および音声信号処理モジュール306を含んでもよい。モジュール300は、他のモジュール、例えば、音声コンテンツサーバモジュール、音声ドライバモジュール、グラフィクスモジュールなどを含んでもよく、それらは例示を簡単にするために図示されない。聴力測定プロファイリングモジュール302は、聴力検査データおよび関連パラメータ、例えばPWPを取得および管理してもよい。プロファイル比較または処理モジュール304は、音声ファイルを変換するために使用され得る差異を決定するために、2つ以上の異なるPWPまたは他の聴力測定プロファイルを処理してもよい。音声処理モジュール306は、プロファイル比較または処理モジュール304からの入力に基づき、最終状態を決定してもよい。
図4は、主観的忠実度のために音声コンテンツを変換するためのデータフローおよび処理ブロックの一例を示すブロック図である。音声コンテンツ生成過程402は、コンピュータ可読記憶媒体406、例えば、磁気または光記憶媒体上でソース音声コンテンツを記憶してもよい、サーバ404に、ソース音声コンテンツを出力してもよい。聴力検査過程408は、参照人物(例えば、コンテンツプロデューサ)または参照人物の群に対する個々のPWP、およびリスナの群に対するリスナ(例えば、消費者)または総計プロファイルを作成してもよい。サーバ404は、例えば、データベースまたは表を使用して、対応するデータ記録に対する識別子を関連付けることによって、ソース音声コンテンツに対する基準として、参照人物または群に対するPWPを識別してもよい。聴力検査過程は、記憶媒体406中の記憶のために、サーバ404にPWPを出力してもよい。続いて、オーディオプレイヤデバイスは、ソース音声コンテンツに対する要求(図示せず)をサーバ404に伝送してもよい。要求は、オーディオプレイヤを介して要求を創作するものとして識別される、ソース音声コンテンツおよびリスナに対する識別子を含んでもよい。
ソース音声コンテンツに対する要求に応答して、サーバ404は、コンテンツおよび参照PWPを関連付ける記録に基づき、ソース音声コンテンツ、参照人物または群に対するPWPを読み出してもよい。サーバ404はまた、リスナに対するPWPを読み出し、データオブジェクトとしてPWPおよび音声コンテンツを、信号プロセッサ410に提供してもよい。代替方法において、参照人物またはリスナに対するPWPは、音声コンテンツよりも早いまたは遅い時間に提供されてもよく、またはオーディオプレイヤがリスナPWPをローカルで生成している場合、リスナPWPは、代わりにローカルメモリから読み出されてもよい。信号プロセッサ410は、変更または変換された音声コンテンツを生成するために、参照人物およびリスナに対する異なるPWPに基づき、音声コンテンツを処理する。信号プロセッサ410は、クライアントオーディオプレイヤデバイスのモジュールとして、または別個の機械上の遠隔処理として実装されてもよい。プロセッサ410は、変換された音声コンテンツを、音声トランスデューサ412、例えば、オーディオプレイヤの小型イヤホン、ヘッドホン、またはスピーカに提供する。次いで、トランスデューサは、音声ドライバによって、変換された音声コンテンツから生成されたリスナ414への音声を出力する。
聴力検査モジュール408は、聴力検査プロトコルを動作させるためのグラフィカルユーザインターフェースを有する使いやすいアプリケーションとして、オーディオプレイヤまたはサーバ上で実装されてもよい。例えば、図5は、タッチセンサ式ディスプレースクリーン502を含む、オーディオプレイヤ500上のスクリーンショットの一例を示す。タッチセンサ式ディスプレースクリーンは、聴力検査のアプリケーション中、ユーザを誘導するために使用されてもよい。プレイヤ500の音声出力ポートを一組の小型イヤホン(内部イヤホン)もしくは外部ヘッドホンに、またはあまり好ましくはないが、一組のスピーカを駆動する音声受信機に接続し、プレイヤ500で動作する聴力測定プログラムによって生成される可聴およびグラフィカル命令に従うことによって、ユーザは、自身に聴力検査を行ってもよい。アプリケーションとしてオーディオプレイヤまたはサーバ上で実装されてもよい聴力検査モジュールは、例えば、Apple(商標)、App Store(商標)を介してiPod(商標)またはiPad(商標)に利用可能な、関連した音声デバイスの「app store」を介して利用可能になる、アプリケーションであってもよい。
より従来の周波数感度試験において、聴力測定アプリケーションは、種々の周波数および電力レベルにおいて、一式の音を生成してもよい。スクリーンに触れることによって、ユーザは、音が聴取されるときはいつでもフィードバックを提供し、プレイヤはそれにより、各周波数における聴覚閾値を決定することができる。任意に、プログラムは、試験過程をより魅力的にするために、スコアまたは進捗インジケータを維持および表示してもよい。他の試験において、聴力測定アプリケーションは、動的効果および位置的キューに対する感度を試験してもよい。図5は、位置的キューに対する感度を試験するためのスクリーン502の一例を示す。聴力検査器は、位置的キューの種々のレベルでの音のシーケンスを生成してもよい。ユーザは、例えば、リスナの相対位置を表す人物アイコン506の周囲に位置付けられた複数のノードから、3D位置ノード504を選択することによって、明らかな3Dの発音元を区別することが可能になるまで聴取する。したがって、プレイヤは、音声コンテンツ中の位置的キューに対するリスナの感度を決定することができる。他の聴覚試験、例えば、右耳と左耳との間の時間感度の差異もまた、プレイヤ500によって行われ得る。
周波数感度データは、図6Aに示されるように、周波数応答表600として従来法で表され得る。閾値感度は、縦軸604上のデシベルで表され、選択された試験周波数は、横軸602上のヘルツ(Hz)で表される。例示された実施例において、上側の曲線606は、第1の(例えば、右)耳を表し、下側の曲線608は、特定のリスナに対してより感度が低い第2の(例えば、左)耳を表してもよい。曲線606および608を表すデータは、任意の好適な数値形式で(例えば、数列として)符号化され、リスナのPWPの一部として記憶されてもよい。
図6Bは、PWP中に含まれてもよい非従来的な試験データのほんの一例として、非従来的な聴力図650を示す。聴力図は、縦軸654上に時間(例えば、ミリ秒または数十ミリ秒)を、横軸652上にヘルツの選択された試験周波数を含む。曲線656は、例えば、リスナの右耳と左耳との間の時間感度の差異を表す。さらなる例として、250Hzにおいて、曲線は、右耳が左耳よりも約1.4時間単位前に音を聴取することを示す。時間感度の差異は、位置的キューまたは他の動的効果を知覚する上で重要であり得る。曲線656は、任意の好適なフォーマットで符号化され、リスナPWPの第2の部分として記憶されてもよい。
図7Aは、PWP差異に基づき、音声信号を変更するための信号プロセッサおよび過程700の態様を示し、ここで、符号化された音声信号は、同一のフォーマットで別のデジタル信号を生成するために再符号化され、参照PWPとリスナPWPとの間の差異を補償するために変換される。特定のリスナPWPが利用可能ではない場合、一般的または総計リスナPWPが、特定のリスナに対して決定されたPWPに置き換えられてもよいことが理解されるべきである。デジタル符号化されたデータ704は、再符号化のためのプロセッサおよびアルゴリズムを含む制御回路702によって制御される、デジタル再符号化過程706に入力される。再符号化は、参照とリスナプロファイルおよび/または位相/タイムシフトとの間の差異に比例して、周波数の関数としてゲインを増大させることを含んでもよい。再符号化された音声データ708は、従来の方法でデコーダ710によって復号され、復号されたデジタル音声データ712を生成してもよい。復号されたデータは、デジタル/アナログ変換器714に提供されてもよく、それは、デジタルデータを処理し、アナログ音声信号716を作成する。アナログ音声信号716は、増幅器718に提供されてもよく、それは、信号を増幅し、増幅されたアナログ信号720を音声トランスデューサ722に提供する。音声トランスデューサ722は、リスナ726によって聴取されてもよい音724を生成する。
図7Bは、PWP差異に基づき、音声信号を変更するための信号プロセッサおよび過程750の態様を示し、ここで、符号化された音声信号は最初に復号され、アナログ形態に変換され、アナログ信号は、参照PWPとリスナPWPとの間の差異に基づき、変換(調節)される。元の符号化された音声データ752は、従来の方法で復号された音声信号756を作成するデコーダ754に提供されてもよい。復号された音声信号756は、アナログ音声信号760を生成するデジタル/アナログ変換器758に提供されてもよい。
任意に、アナログ音声信号760は、チャネル遅延/フィルタモジュール762に提供されてもよい。制御アルゴリズムを動作させるプロセッサを含む制御回路770の制御下で、遅延/フィルタモジュール762は、参照およびリスナPWPプロファイルによって定義された時間感度差異に比例して、別々のチャネル(例えば、右および左チャネル)を遅延させてもよい。例えば、右チャネルに対するPWPの比較が、参照人物が左耳よりも右耳でリスナよりも速く応答することを示す場合、遅延/フィルタモジュール762は、補償するために左チャネルを遅延させてもよい。さらなる例として、遅延/フィルタモジュールは、差異に比例した量で左チャネルを遅延させ、リスナのより遅い右耳が左耳の知覚に「追いつく」ことを可能にしてもよい。参照およびリスナPWPプロファイルによって定義された時間感度差異は、特に、位置的キューの個々の知覚に影響を及ぼし得る。
代替方法において、または加えて、遅延/フィルタモジュール762および制御回路770は、PWPまたはPWPの一部分から得られたフィルタを使用して、復号された音声信号760をフィルタにかけてもよい。例えば、PWPは、頭部伝達関数(HRTF)を含んでもよい。HRTFは、当該技術分野において既知であり、外耳(耳介)によって引き起こされる音への反射および回折効果を説明する関数のセットとして理解され得る。耳介によって引き起こされる音の反射および回折は、単独でまたは内耳の構造と組み合わせて、音の位置の特定、すなわち、音が生じる位置の知覚において重要な役割を果たし得る。したがって、HRTFを使用したフィルタリングは、三次元(3D)空間でリスナの発音元の知覚を変化させるために使用されてもよい。HRTFが参照およびリスナの個々のPWPに含まれる範囲で、モジュール762は、リスナによって知覚される位置的キューが参照人物によって経験される位置的キューにより厳密に一致するように、音声信号760をフィルタにかけてもよい。HRTFフィルタリングは、異なる個人の耳介/内耳形状間の差異を補償してもよい。さらなる例として、挿耳型トランスデューサ(例えば、イヤホンまたは人工内耳)が参照人物ではなくリスナによってのみ使用されている場合、HRTFフィルタリングは、リスナの音声経路における耳介の非存在を補償するために使用されてもよい。代替方法において、HRTFまたは他のフィルタリングは、図7Aのモジュール706で示されるデジタル処理を使用して適用されてもよいことが理解されるべきである。
HRTFは、異なる個人間で有意に異なり得、HRTFの正確な測定は、個人が概して許容するよりも厳密かつ退屈な試験過程を必要とし得る。したがって、過程700または750等の音声信号変換過程は、ユーザが何らかの外部マーカー、例えば、耳介の大きさおよび形状に基づき、一般的なHRTFを選択することを可能にし得る。代替方法において、または加えて、システムは、位置的キュー試験過程からのユーザフィードバックに基づき、推定されたHRTFを選択してもよい。例えば、定義された音声信号に対するユーザの位置感覚に関する情報を取得するために、図5に示されるユーザインターフェースを使用して、システムは、ユーザをいくつかの推定されたHRTFのうちの1つに関連付けるか、またはアルゴリズムを使用して推定されたHRTFを生成してもよい。
加えて、アナログ音声信号764は、制御回路770の制御下で増幅器766に提供されてもよい。増幅器766は、回路770の制御下で、PWP間の周波数感度差異を補償するために、アナログ信号764のゲインを増大または軽減してもよい。増幅器は、増幅された音声信号768を音声トランスデューサ772に提供してもよく、それは、リスナ776に対する音774を生成する。図7Aおよび7Bはほんの一例であり、デジタルまたはアナログ信号の特定の例示されたモードまたはモジュールへの調節を限定するものとして理解されるべきではない。
したがって、本技術の実施形態は、パラメータと一致した方法で、リスナの関連した音声知覚特性を識別および記録し、次いで、これらのパラメータを、変換、例えば、アルゴリズムを使用して音声コンテンツに適用され得るフィルタまたは他の強調/非強調機能のセットとして記憶する、双方向の聴力検査アプリケーションを介した、リスナの個人波形プロファイルの収集を含んでもよい。この方法で、ユーザのPWP変換は、音声コンテンツがリスナに示される前に、音声コンテンツに適用され得るか、または別のユーザのPWPと置き換えられ得る。そのようにして、PWP変換が上記のようにアクセスされ得るクリエイティブプロデューサによって聴取されるように、作成、ミックス、または別様に輪郭が付けられた音声コンテンツは、後続のリスナの異なるPWPの効果を軽減する方法でコンテンツを変換するために、クリエイティブプロデューサのPWPを使用することによって、それが聴取されることをプロデューサが意図したものにより近い音が出るように変換され得る。
音声処理動作および装置
上記の例は、コンピュータ、例えば、オーディオプレイヤ、サーバ、またはオーディオプレイヤおよびサーバのいくつかの組み合わせによって実施される1つ以上の方法で具体化され得る。開示された主題に従って実装され得る方法は、種々のフローチャートを参照してよりよく理解される。方法は例示を簡単にするために一連の動作/ブロックとして示され、記載されるが、いくつかのブロックが、本明細書に図示および記載されるものとは異なる順序で、および/または他のブロックと実質的に同時に生じ得るため、特許請求の範囲に記載された主題が、ブロックの数または順序によって制限されないことを理解および認識されたい。さらに、全ての例示されたブロックが本明細書に記載される方法を実装するために必要とされるとは限らない場合がある。ブロックと関連した機能性は、ソフトウェア、ハードウェア、それらの組み合わせ、または任意の他の好適な手段(例えば、デバイス、システム、過程、またはコンポーネント)によって実装されてもよいことを理解されたい。加えて、本明細書全体を通して開示される方法は、開示される方法の種々のデバイスへの記憶、伝送、および転送を容易にするために、製造品、例えば、非一時的コンピュータ可読媒体上に符号化された命令および/またはデータとして記憶されることが可能であることをさらに理解されたい。当業者は、方法が別の方法として、状態図中などで一連の相互に関連する状態または事象として示され得ることを理解および認識するであろう。
図8に示されるように、音声処理装置は、主観的忠実度のための音声信号を参照聴力測定プロファイルに変換するための方法800を実施してもよい。方法800は、810において、信号プロセッサによって聴力測定参照プロファイルを受信することを含んでもよい。例えば、信号プロセッサは、音声メタデータ中のクリエイティブプロデューサに対するPWPを受信してもよく、または音声メタデータから得られた参照識別子を使用して、サーバからの参照を要求および受信してもよい。
方法800はさらに、820において、聴力測定リスナプロファイルを受信する信号プロセッサを含んでもよい。例えば、信号プロセッサは、信号プロセッサと同一のプレイヤデバイス上で実行するアプリケーションによる前の聴力測定から得られた、コンピュータメモリからのリスナプロファイルを読み出してもよい。
方法800はさらに、830において、符号化された入力音声信号を受信することを含んでもよい。例えば、信号プロセッサを含むオーディオプレイヤは、コンピュータ可読媒体からの符号化された音声ファイルを読み出してもよく、ネットワーク上でファイルをダウンロードしてもよく、またはストリーミング音声を介してファイルを受信してもよい。
方法800はさらに、840において、出力音声信号が差異を補償するように、参照プロファイルとリスナプロファイルとの間の差異に基づき、入力音声信号を出力音声信号に変換することを実施してもよい信号プロセッサを含んでもよい。変換は、符号化された信号上でデジタル的に実施され、符号化された出力信号を生成してもよい。代替方法において、変換は、デジタルプロセッサの制御下で、復号されたアナログ音声信号を操作する増幅器および/または遅延回路を使用して実施されてもよい。信号プロセッサは、変換前に参照プロファイルとリスナプロファイルとの間の差異を決定してもよい。変換は、データフォーマットの変化を要求も除外もしない。
図9〜11を参照すると、音声変換過程に関して、いくつかの追加の動作900、1000、および1100が示され、それは、単独でまたはオーディオプレイヤおよび/または別のサーバと組み合わせて、コンピュータサーバによって実施されてもよい。動作900、1000、および1100のうちの1つ以上は任意に、方法800の一部として実施されてもよい。これらの動作の要素は、任意の動作順序で実施されてもよく、または特定の実施の発生順を必要とすることなく、開発アルゴリズムによって包含されてもよい。動作は独立して実施され得、相互排他的ではない。したがって、別の下流または上流の動作が実施されるかどうかに関わらず、いくつかの追加の動作のうちのいずれか1つが実施され得る。例えば、方法800が動作900、1000、および1100のうちの少なくとも1つを含む場合、方法800は、例示され得る任意の後続の下流の動作(複数を含む)を必ずしも含む必要なく、少なくとも1つの動作後に終了してもよい。
一態様では、図9を参照すると、方法800はさらに、910において、参照およびリスナプロファイルの対応する1つ以上の周波数における差異に比例して、入力音声信号の1つ以上の周波数を変更することを含んでもよい。例えば、信号プロセッサは、特定の異なる周波数での聴力測定から補間することによって、各周波数における差異を計算してもよい。次いで、信号プロセッサは、各周波数における差異に比例して、ゲインを増大または低減してもよい。例えば、方法800はさらに、920において、差異が、第1の人物が第2の人物よりも音に敏感であることを示す、1つ以上の周波数において、入力信号を増大させること、および差異が、第1の人物が第2の人物ほど音に敏感ではないことを示す、1つ以上の周波数において、入力信号を軽減することをさらに含んでもよい。入力信号を増大させることは、1つ以上の選択された周波数帯域において、適用可能な音声スペクトルの選択された部分にわたって、信号の振幅を増加させることを含んでもよい。入力信号を軽減することは、1つ以上の選択された周波数帯域において、適用可能な音声スペクトルの選択された部分にわたって、信号の振幅を減少させることを含んでもよい。
代替方法において、または加えて、方法800はさらに、930において、参照およびリスナプロファイルの対応する1つ以上の時間における差異に比例して、入力音声信号の1つ以上の時間における音声信号の位相を変更することを含んでもよい。例えば、方法800はさらに、940において、音声信号によって符号化された音が発生する時間を変化させることによって、音声信号の定義されたサブバンドに対して位相を変更することを含んでもよい。
別の態様では、図10を参照すると、方法800はさらに、1010において、第1の人物に対する聴力検査結果に基づき、聴力測定参照プロファイルを生成することを含んでもよい。例えば、第1の人物は、音声クリエイティブプロデューサであってもよく、その個人的な知覚特性が、音声製品の生成を決定したか、またはそれに影響を与えた。その場合、方法は、1020において、符号化された入力音声信号が第1の人物によって編集されているものとして示されることを決定することを含んでもよい。同様に、方法800は、1030において、第2の人物に対する聴力検査結果に基づき、聴力測定リスナプロファイルを生成することを含んでもよい。したがって、方法800はさらに、1040において、第2の人物に対する出力音声信号を再生することを含んでもよく、それにより第2の人物の第2の聴取経験が、出力音声信号から生成された音に対して、第1の人物に対する第1の聴取経験により近くなる。
他の態様では、図11を参照すると、方法800はさらに、1110において、一般集団のサンプルに対する聴力測定データに基づき、聴力測定リスナプロファイルを生成することを含んでもよい。例えば、集団データは、個人の聴力測定プロファイルデータが利用可能ではない場合に使用するために、特定の集団に対して収集されてもよい。例えば、方法800はさらに、1120において、リスナの群に対する総計基準を表す、聴力測定リスナプロファイルを生成することを含んでもよい。総計基準は、例えば、平均または中央値を含んでもよい。方法800は、1130において、リスナの群の一員として識別される人物に対する出力音声信号を再生することを含んでもよく、それにより、その人物の聴取経験が、聴力測定参照プロファイルによって表される参照聴取経験により近くなる。
図12を参照すると、主観的忠実度のために音声変換過程を実装するために、オーディオプレイヤ、またはオーディオプレイヤおよびサーバの組み合わせとして構成されてもよい、例示的な装置1200が提供される。
例示されるように、一実施形態では、装置1200は、聴力測定参照プロファイルを受信するための電気コンポーネントまたは手段1202を含んでもよい。例えば、電気コンポーネントまたは手段1202は、メモリコンポーネント1216に連結される少なくとも1つの制御プロセッサ1210を含んでもよい。制御プロセッサは、メモリコンポーネント中にプログラム命令として保持されてもよいアルゴリズムを動作させてもよい。アルゴリズムは、例えば、音声メタデータから得られたプロファイル識別子をサーバに提供すること、およびそれに応答してサーバからプロファイルデータを受信することを含んでもよい。
装置1200はさらに、聴力測定リスナプロファイルを受信するための電気コンポーネントまたはモジュール1204を含んでもよい。例えば、電気コンポーネントまたは手段1204は、メモリコンポーネント1216に連結される少なくとも1つの制御プロセッサ1210を含んでもよい。制御プロセッサは、メモリコンポーネント中にプログラム命令として保持されてもよいアルゴリズムを動作させてもよい。アルゴリズムは、例えば、ローカルメモリからユーザ識別子を取得すること、およびユーザ識別子に基づき、ローカルデータ表から記憶されたリスナプロファイルを取り出すことを含んでもよい。代替方法において、アルゴリズムは、ユーザ識別子をサーバに提供すること、およびユーザ識別子を提供したことに応答して、サーバからリスナプロファイルを受信することを含んでもよい。
装置1200はさらに、符号化された入力音声信号を受信するための電気コンポーネントまたはモジュール1206を含んでもよい。例えば、電気コンポーネントまたは手段1206は、メモリコンポーネント1216に連結される少なくとも1つの制御プロセッサ1210を含んでもよい。制御プロセッサは、メモリコンポーネント中にプログラム命令として保持されてもよいアルゴリズムを動作させてもよい。アルゴリズムは、例えば、コンピュータ可読媒体から符号化された音声ファイルを読み出すこと、サーバからファイルをダウンロードすること、またはサーバからストリーミング音声ファイルを受信することを含んでもよい。
装置1200はさらに、出力音声信号が差異を補償するように、参照プロファイルとリスナプロファイルとの間の差異に基づき、入力音声信号を出力音声信号に変換するための電気コンポーネントまたはモジュール1208を含んでもよい。例えば、電気コンポーネントまたは手段1208は、メモリコンポーネント1216に連結される少なくとも1つの制御プロセッサ1210を含んでもよい。制御プロセッサは、メモリコンポーネント中にプログラム命令として保持されてもよいアルゴリズムを動作させてもよい。アルゴリズムは、例えば、差異が、第1の人物が第2の人物よりも音に敏感であることを示す、1つ以上の周波数において、入力信号を増大させること、および差異が、第1の人物が第2の人物ほど音に敏感ではないことを示す、1つ以上の周波数において、入力信号を軽減することを含んでもよい。代替方法において、または加えて、アルゴリズムは、参照およびリスナプロファイルの対応する1つ以上の時間における差異に比例して、入力音声信号の1つ以上の時間における音声信号の位相を変更することを含んでもよい。
装置1200は、図8〜11に関連して記載される追加の動作800〜1100のいずれかまたは全部を実施するための同様の電気コンポーネントを含んでもよく、それらは、説明を簡単にするために、図12には示されない。
関連した態様では、装置1200は任意に、少なくとも1つのプロセッサを有するプロセッサコンポーネント1210を含んでもよい。プロセッサ1210は、バス1212または同様の通信連結を介して、コンポーネント1202〜1208または同様のコンポーネントと動作通信していてもよい。プロセッサ1210は、電気コンポーネント1202〜1208によって実施される過程または機能の開始およびスケジューリングを行ってもよい。
さらなる関連した態様では、装置1200は、クライアントとサーバとの間の通信を可能にする、ネットワークインターフェースコンポーネント1214を含んでもよい。装置1200は任意に、情報を記憶するためのコンポーネント、例えば、メモリデバイス/コンポーネント1216を含んでもよい。コンピュータ可読媒体またはメモリコンポーネント1216は、バス1212などを介して装置1200の他のコンポーネントに動作可能に連結されてもよい。メモリコンポーネント1216は、コンポーネント1202〜1208、そのサブコンポーネント、またはプロセッサ1210の過程および動作、または本明細書に開示された方法を実装するためのコンピュータ可読命令およびデータを記憶するように適合されてもよい。メモリコンポーネント1216は、コンポーネント1202〜1208と関連した機能を実行するための命令を保持してもよい。コンポーネント1202〜1208は、メモリ1216の外部にあるものとして示されているが、それらはメモリ1216内に存在することができることを理解されたい。
開示された過程における工程の特定の順序または階層がただの一例にすぎないことが理解される。設計の選好に基づき、過程における工程の特定の順序または階層が、本開示の範囲内にとどまりながら、配列し直されてもよいことが理解される。添付の方法の特許請求の範囲は、見本の順序における種々の工程の要素を示し、示される特定の順序および階層に限定されることを意図しない。
当業者は、情報および信号が、種々の異なるテクノロジーおよび技術のいずれかを使用して表示されてもよいことを理解するであろう。例えば、上記の説明全体を通して参照され得るデータ、命令、コマンド、情報、信号、ビット、記号、およびチップは、電圧、電流、電磁波、磁場もしくは磁性粒子、光場または光学粒子、またはこれらの任意の組み合わせによって表されてもよい。
当業者は、本明細書に開示された実施形態と関連して記載される種々の例示的な論理ブロック、モジュール、回路、およびアルゴリズム工程が、電子ハードウェア、コンピュータソフトウェア、または両方の組み合わせとして実装されてもよいことをさらに理解するであろう。ハードウェアおよびソフトウェアのこの互換性を明確に例示するために、種々の例示的なコンポーネント、ブロック、モジュール、回路、および工程が、概してそれらの機能性の観点から上記に記載されてきた。種々の例示的なコンポーネント、ブロック、モジュール、回路、および工程の機能性がハードウェアまたはソフトウェアとして実装されるかどうかは、全体のシステムに課せられた特定のアプリケーションおよび設計の制約によって決まる。当業者は、各特定のアプリケーションに対して、異なる方法で記載された機能性を実装してもよいが、異なる方法による記載された機能性の実装の決定は、本開示範囲からの逸脱を引き起こすものとして解釈されるべきではない。
本明細書に開示された実施形態と関連して記載される種々の例示的な論理ブロック、モジュール、および回路は、本明細書に記載される機能を実施するように設計される、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、もしくは他のプログラマブル論理デバイス、離散ゲート、もしくはトランジスタ論理、離散ハードウェアコンポーネント、またはこれらの任意の組み合わせを用いて実装または実施されてもよい。汎用プロセッサは、マイクロプロセッサであってもよいが、代替方法において、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であってもよい。プロセッサはまた、コンピュータデバイスの組み合わせ、例えば、DSPおよびマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、DSPコア、システムオンチップ(SOC)、または任意の他のそのような構成と併せた1つ以上のマイクロプロセッサとして実装されてもよい。
開示された実施形態の前述は、当業者が本開示を作製または使用することを可能にするために提供される。これらの実施形態の種々の修正が、当業者には容易に明らかとなり、本明細書に定義された一般的原理は、本開示の精神または範囲から逸脱することなく他の実施形態に適用され得る。したがって、本開示は、本明細書に示される実施形態に限定されることを意図せず、本明細書に開示された原理および新規の特徴と一致した最も広い範囲が与えられるものとする。

Claims (23)

  1. 音声信号を処理するための方法であって、
    聴力測定参照プロファイルを受信することと、
    聴力測定リスナプロファイルを受信することと、
    符号化された入力音声信号を信号プロセッサに提供することと、
    前記参照プロファイルと前記リスナプロファイルとの間の差異に基づき、前記信号プロセッサを使用して、前記入力音声信号を出力音声信号に変換し、前記出力音声信号が前記差異を補償することと、
    を含む、方法。
  2. 前記入力音声信号を変換することは、前記参照およびリスナプロファイルの対応する1つ以上の周波数における前記差異に比例して、前記入力音声信号の1つ以上の周波数を変更することを含む、請求項1に記載の方法。
  3. 第1の人物に対する聴力検査結果に基づき、前記聴力測定参照プロファイルを生成することをさらに含む、請求項1に記載の方法。
  4. 第2の人物に対する聴力検査結果に基づき、前記聴力測定リスナプロファイルを生成することをさらに含む、請求項3に記載の方法。
  5. 前記変換することは、前記差異が、前記第1の人物が前記第2の人物よりも音に敏感であることを示す、1つ以上の周波数において、前記入力信号を増大させることによって、かつ前記差異が、前記第1の人物が前記第2の人物ほど音に敏感ではないことを示す、1つ以上の周波数において、前記入力信号を軽減することによって、前記出力信号を生成することをさらに含む、請求項4に記載の方法。
  6. 前記入力信号を増大させることは、音声スペクトルの定義された周波数帯域部分にわたって、前記信号の振幅を増加させることを含む、請求項5に記載の方法。
  7. 前記符号化された入力音声信号は、前記第1の人物によって編集されているものとして示される、請求項4に記載の方法。
  8. 前記出力音声信号は、オーディオプレイヤデバイスによって再生され、第2の人物によって聴取されるとき、前記第2の人物の聴取経験が、前記出力音声信号から生成される音に対して、前記第1の人物に対する聴取経験により近くなるように構成される、請求項4に記載の方法。
  9. 前記聴力測定リスナプロファイルがリスナの群に対する総計基準を表すように、一般集団のサンプルに対する聴力測定データに基づき、前記聴力測定リスナプロファイルを生成することをさらに含む、請求項3に記載の方法。
  10. 前記入力音声信号を変換することは、前記参照およびリスナプロファイルの対応する1つ以上の時間における前記差異に比例して、前記入力音声信号の1つ以上の時間における前記音声信号の位相を変更することを含む、請求項1に記載の方法。
  11. 前記位相を変更することは、前記音声信号によって符号化された音が生じる時間を変化させるために、前記音声信号の定義されたサブバンドに対して実施される、請求項10に記載の方法。
  12. 聴力測定参照プロファイルを受信するように、
    聴力測定リスナプロファイルを受信するように、
    符号化された入力音声信号を受信するように、
    前記参照プロファイルと前記リスナプロファイルとの間の差異に基づき、前記入力音声信号を出力音声信号に変換し、前記出力音声信号が前記差異を補償するように、
    構成される、少なくとも1つのプロセッサと、
    データを記憶するために、前記少なくとも1つのプロセッサに連結される、メモリと、
    を備える、装置。
  13. 前記プロセッサは、前記参照およびリスナプロファイルの対応する1つ以上の周波数における前記差異に比例して、前記入力音声信号の1つ以上の周波数を変更することによって、前記入力音声信号を変換するようにさらに構成される、請求項12に記載の装置。
  14. 前記プロセッサは、第1の人物に対する聴力検査結果に基づき、前記聴力測定参照プロファイルを生成するようにさらに構成される、請求項12に記載の装置。
  15. 前記プロセッサは、第2の人物に対する聴力検査結果に基づき、前記聴力測定リスナプロファイルを生成するようにさらに構成される、請求項14に記載の装置。
  16. 前記プロセッサは、前記差異が、前記第1の人物が前記第2の人物よりも音に敏感であることを示す、1つ以上の周波数において、前記入力信号を増大させることによって、かつ前記差異が、前記第1の人物が前記第2の人物ほど音に敏感ではないことを示す、1つ以上の周波数において、前記入力信号を軽減することによって、前記入力音声信号を前記出力信号に変換するようにさらに構成される、請求項15に記載の装置。
  17. 前記プロセッサは、音声スペクトルの定義された周波数帯域部分にわたって、前記信号の振幅を増加させることによって、前記入力信号を増大させるようにさらに構成される、請求項16に記載の装置。
  18. 前記プロセッサは、前記符号化された入力音声信号が、前記第1の人物によって編集されているものとして示されることを決定するようにさらに構成される、請求項15に記載の装置。
  19. 前記プロセッサは、第2の人物に対する前記出力音声信号を再生し、それにより前記第2の人物の第2の聴取経験が、前記出力音声信号から生成される音に対して、前記第1の人物に対する第1の聴取経験により近くなるようにさらに構成される、請求項15に記載の装置。
  20. 前記プロセッサは、前記聴力測定リスナプロファイルがリスナの群に対する総計基準を表すように、一般集団のサンプルに対する聴力測定データに基づき、前記聴力測定リスナプロファイルを生成するようにさらに構成される、請求項12に記載の装置。
  21. 前記プロセッサは、前記参照およびリスナプロファイルの対応する1つ以上の時間における前記差異に比例して、前記入力音声信号の1つ以上の時間における前記音声信号の位相を変更することによって、前記入力音声信号を変換するようにさらに構成される、請求項12に記載の装置。
  22. 前記プロセッサは、前記音声信号によって符号化された音が生じる時間を変化させるために、前記音声信号の定義されたサブバンドに対して前記位相を変更するようにさらに構成される、請求項21に記載の装置。
  23. プロセッサによって実行されるとき、信号処理デバイスに、
    聴力測定参照プロファイルを受信する動作、
    聴力測定リスナプロファイルを受信する動作、
    符号化された入力音声信号を受信する動作、および
    前記参照プロファイルと前記リスナプロファイルとの間の差異に基づき、前記入力音声信号を出力音声信号に変換し、前記出力音声信号が前記差異を補償するようにする動作、
    を実施させる、符号化された命令を含む、非一時的コンピュータ可読媒体。
JP2015527646A 2012-08-15 2013-08-15 主観的忠実度のための音声コンテンツの変換 Active JP6231102B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/586,772 US9748914B2 (en) 2012-08-15 2012-08-15 Transforming audio content for subjective fidelity
US13/586,772 2012-08-15
PCT/US2013/055217 WO2014028783A1 (en) 2012-08-15 2013-08-15 Transforming audio content for subjective fidelity

Publications (3)

Publication Number Publication Date
JP2015531084A true JP2015531084A (ja) 2015-10-29
JP2015531084A5 JP2015531084A5 (ja) 2017-06-22
JP6231102B2 JP6231102B2 (ja) 2017-11-15

Family

ID=50100042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015527646A Active JP6231102B2 (ja) 2012-08-15 2013-08-15 主観的忠実度のための音声コンテンツの変換

Country Status (6)

Country Link
US (4) US9748914B2 (ja)
EP (1) EP2885786B1 (ja)
JP (1) JP6231102B2 (ja)
CN (1) CN104541328B (ja)
HK (1) HK1211737A1 (ja)
WO (1) WO2014028783A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9071628B2 (en) * 2012-05-18 2015-06-30 Andrew Milburn Method and apparatus for managing bandwidth by managing selected internet access by devices in a Wi-Fi linked audience
US9748914B2 (en) * 2012-08-15 2017-08-29 Warner Bros. Entertainment Inc. Transforming audio content for subjective fidelity
WO2015035093A1 (en) 2013-09-05 2015-03-12 Daly George William Systems and methods for acoustic processing of recorded sounds
FR3016105B1 (fr) * 2013-12-30 2017-03-10 Arkamys Systeme d’optimisation d’ecoute musicale
WO2016020908A1 (en) * 2014-08-03 2016-02-11 Meq Inc. A method and device for modifying audio signals based on hearing capabilities of the listener
US9680438B2 (en) 2015-07-01 2017-06-13 Meq Inc. Method and device for playing modified audio signals
US20180249263A1 (en) * 2015-08-13 2018-08-30 Meq Inc. Playing Modified Audio Signals to a Group of Listeners
US9832590B2 (en) 2015-09-12 2017-11-28 Dolby Laboratories Licensing Corporation Audio program playback calibration based on content creation environment
KR102649074B1 (ko) * 2018-01-08 2024-03-18 워너 브로스. 엔터테인먼트 인크. 신경 생리학적 상태의 검출을 위한 사회적 상호작용 애플리케이션
EP3641343B1 (en) 2018-10-15 2021-01-20 Mimi Hearing Technologies GmbH Method to enhance audio signal from an audio output device
US20220070604A1 (en) * 2018-12-21 2022-03-03 Nura Holdings Pty Ltd Audio equalization metadata
EP3840222A1 (en) 2019-12-18 2021-06-23 Mimi Hearing Technologies GmbH Method to process an audio signal with a dynamic compressive system
US12086558B2 (en) 2020-03-09 2024-09-10 Warner Bros. Entertainment Inc. Systems and methods for generating multi-language media content with automatic selection of matching voices
US11961167B2 (en) * 2020-12-11 2024-04-16 Jay Alan Zimmerman Methods and systems for visualizing sound and hearing ability

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003510667A (ja) * 1999-09-28 2003-03-18 サウンド・アイ・ディ 聴覚プロフィール及びカスタム化オーディオデータベースの生成及び保存の方法
US20050094822A1 (en) * 2005-01-08 2005-05-05 Robert Swartz Listener specific audio reproduction system
JP2006510946A (ja) * 2002-12-19 2006-03-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音楽ファイルのネットワーク経由ダウンロードの方法及びシステム
JP2009532148A (ja) * 2006-04-04 2009-09-10 クリアトーン テクノロジイズ リミテッド 較正されたデジタル・ヘッドセット及び前記ヘッドセットによる聴力検査方法
WO2012090282A1 (ja) * 2010-12-27 2012-07-05 富士通株式会社 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7181297B1 (en) * 1999-09-28 2007-02-20 Sound Id System and method for delivering customized audio data
GB0116071D0 (en) * 2001-06-30 2001-08-22 Hewlett Packard Co Improvements in audio reproduction
JP2007532988A (ja) * 2004-03-04 2007-11-15 シャープ株式会社 インターネットに接続されたテレビのためのプレゼンス技術に基づく即時共用される個人好み同時情報のための方法およびシステム
KR100707339B1 (ko) * 2004-12-23 2007-04-13 권대훈 청력도 기반 이퀄라이제이션 방법 및 장치
US20060215844A1 (en) * 2005-03-16 2006-09-28 Voss Susan E Method and device to optimize an audio sound field for normal and hearing-impaired listeners
WO2007057800A2 (en) 2005-11-16 2007-05-24 Koninklijke Philips Electronics N.V. Method of generating and methods of filtering a user profile
US20070142942A1 (en) 2005-12-16 2007-06-21 Sony Ericsson Mobile Communications Ab Audio profiles for portable music playback device
US7756281B2 (en) * 2006-05-20 2010-07-13 Personics Holdings Inc. Method of modifying audio content
US20080080722A1 (en) 2006-09-29 2008-04-03 Carroll Tim J Loudness controller with remote and local control
US8099315B2 (en) * 2007-06-05 2012-01-17 At&T Intellectual Property I, L.P. Interest profiles for audio and/or video streams
US8565908B2 (en) * 2009-07-29 2013-10-22 Northwestern University Systems, methods, and apparatus for equalization preference learning
US8447042B2 (en) * 2010-02-16 2013-05-21 Nicholas Hall Gurin System and method for audiometric assessment and user-specific audio enhancement
US20130245798A1 (en) * 2010-04-15 2013-09-19 Sonos, Inc. Method and apparatus for signal processing based upon characteristics of music
JP5917518B2 (ja) 2010-09-10 2016-05-18 ディーティーエス・インコーポレイテッドDTS,Inc. 知覚スペクトルアンバランス改善のための音声信号動的補正
WO2012128798A2 (en) 2010-12-03 2012-09-27 University Of Delaware Simulator and method for simulating an acoustic field of an acoustic waveguide
CN102421049B (zh) 2011-09-29 2014-06-04 美特科技(苏州)有限公司 音讯讯号处理系统及其听力曲线调整单元
US9748914B2 (en) * 2012-08-15 2017-08-29 Warner Bros. Entertainment Inc. Transforming audio content for subjective fidelity

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003510667A (ja) * 1999-09-28 2003-03-18 サウンド・アイ・ディ 聴覚プロフィール及びカスタム化オーディオデータベースの生成及び保存の方法
JP2006510946A (ja) * 2002-12-19 2006-03-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音楽ファイルのネットワーク経由ダウンロードの方法及びシステム
US20050094822A1 (en) * 2005-01-08 2005-05-05 Robert Swartz Listener specific audio reproduction system
JP2009532148A (ja) * 2006-04-04 2009-09-10 クリアトーン テクノロジイズ リミテッド 較正されたデジタル・ヘッドセット及び前記ヘッドセットによる聴力検査方法
WO2012090282A1 (ja) * 2010-12-27 2012-07-05 富士通株式会社 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置

Also Published As

Publication number Publication date
US11075609B2 (en) 2021-07-27
CN104541328A (zh) 2015-04-22
CN104541328B (zh) 2018-01-02
HK1211737A1 (en) 2016-05-27
EP2885786B1 (en) 2018-09-26
US20200403590A1 (en) 2020-12-24
EP2885786A1 (en) 2015-06-24
US10340870B2 (en) 2019-07-02
US20140050334A1 (en) 2014-02-20
US10700657B2 (en) 2020-06-30
EP2885786A4 (en) 2016-04-27
WO2014028783A1 (en) 2014-02-20
US20200162050A1 (en) 2020-05-21
JP6231102B2 (ja) 2017-11-15
US20180006622A1 (en) 2018-01-04
US9748914B2 (en) 2017-08-29

Similar Documents

Publication Publication Date Title
JP6231102B2 (ja) 主観的忠実度のための音声コンテンツの変換
US11962993B2 (en) Grouping and transport of audio objects
JP5898305B2 (ja) 聴覚シナリオシミュレーションを含む音響再生装置
KR101251626B1 (ko) 스마트 기기를 이용한 음향기기의 특성에 대한 보상 서비스 제공 방법
JP2018513424A (ja) ディジタルオーディオの補足
US20230104111A1 (en) Determining a virtual listening environment
EP3503558B1 (en) Audio content format selection
US20240298060A1 (en) Playback of synthetic media content via multiple devices
KR101520799B1 (ko) 개인의 청력 특성에 최적화된 음원의 출력을 가능하게 하는 이어폰 장치
US12096098B2 (en) Content playback reminders
CN203206451U (zh) 一种3d音频处理系统
JP2020537470A (ja) オーディオ信号の個人適用のためのパラメータを設定するための方法
KR102676074B1 (ko) 믹싱 메타데이터를 이용하여 투명 모드를 제공하는 방법 및 오디오 장치
WO2022163308A1 (ja) 情報処理装置、情報処理方法、およびプログラム
KR100703923B1 (ko) 멀티미디어기기를 위한 입체음향 최적화 장치 및 방법
JP2012090249A (ja) 音声再生装置、音声再生装置における再生音調整方法
WO2022129487A1 (en) Personalised audio output
Subhash All About Audio
KR101060546B1 (ko) 사용자의 청력에 맞게 오디오 재생파일을 변환하는 장치
KR20080018409A (ko) 웹 기반의 2채널 출력을 위한 입체 음향 편집 시스템
Costerton A systematic review of the most appropriate methods of achieving spatially enhanced audio for headphone use
CN116208908A (zh) 录音文件播放方法、装置、电子设备及存储介质
Mowen Can future audio products ever match the soundstage (perception of sound) and emotion conveyed from that of industry-standard monitors and acoustic spaces?
Koenig Surround Sound Track Productions Based on a More Channel Headphone

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160812

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160812

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170515

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170515

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171018

R150 Certificate of patent or registration of utility model

Ref document number: 6231102

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250