JP5273688B2 - 小型セル無線ネットワーク内のクライアントデバイスのための上流の信号処理 - Google Patents

小型セル無線ネットワーク内のクライアントデバイスのための上流の信号処理 Download PDF

Info

Publication number
JP5273688B2
JP5273688B2 JP2011527869A JP2011527869A JP5273688B2 JP 5273688 B2 JP5273688 B2 JP 5273688B2 JP 2011527869 A JP2011527869 A JP 2011527869A JP 2011527869 A JP2011527869 A JP 2011527869A JP 5273688 B2 JP5273688 B2 JP 5273688B2
Authority
JP
Japan
Prior art keywords
data
media
rendering device
processing
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011527869A
Other languages
English (en)
Other versions
JP2012503426A (ja
Inventor
バウアー、クラウス
クロケット、ブレット・ジー
ロビンソン、チャールズ・キュー
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2012503426A publication Critical patent/JP2012503426A/ja
Application granted granted Critical
Publication of JP5273688B2 publication Critical patent/JP5273688B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/756Media network packet handling adapting media to device capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/765Media network packet handling intermediate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/214Specialised server platform, e.g. server located in an airplane, hotel, hospital

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephone Function (AREA)

Description

<関連出願への相互参照>
本願は、2008年9月19日に出願され、その全体が本願明細書において参照により援用されている米国特許仮出願第61/098,566号に対する優先権を主張する。
<発明の分野>
本開示は、ストリーミングオーディオデータの信号処理、及びビデオデータの信号処理等の、メディアデータの信号処理に関する。
無線携帯デバイスの人気が高まるととともに機能性も高まり続けている。このように人気が高まっているデバイスとしては、アップルのiPod等のメディアプレーヤ、携帯電話、ヘリオ製のデバイス、リンクシス等の無線IPベースの電話、マイクロソフト Zune、アップル iPhone、等の無線ネットワーク対応マルチメディアデバイス、ソニー PSP、ノキア N Gage等の携帯ゲーム機、ならびに通信及び/又はマルチメディアデータの送信、受信及び/又はレンダリングに用いられることができる他の多くのデバイスが挙げられる。このようなデバイスは通例、デジタル信号プロセッサ(digital signal processor、DSP)またはマイクロコントローラ、ならびにソフトウェア命令を含むメモリ等の、処理システムを含むものであればよい。このような携帯デバイスは処理能力及び機能性の向上ならびに/あるいは電池の長寿命化が続く一方、これらのデバイスは、コンピュータ、ネットワークアダプタ及びルータ、ならびに/あるいは固定コアネットワークデバイス等の非携帯型の処理システムに比べれば、依然として信号処理能力及び/又は他の資源が制限されている。通例、携帯デバイスは、なるべく小さく、なるべく安価であることが好ましいが、制限された処理能力、制限されたメモリ資源、及び/又は制限された電池電力しか持っていない。
無線パーソナルエリアネットワーク(wireless personal area network、WPAN)及びピコセル携帯電話ネットワーク等の小型セル無線ネットワークは周知である。一般に、携帯電話ネットワークの場合は基地局、及び無線ネットワークの場合はアクセスポイントと呼ばれる、セル内で1つ以上のクライアントデバイスと通信する基地局を有する。これらは一般に、数メートル以下のオーダーの比較的小型のセルも有する。このようなシステムは、電池寿命が比較的長く、比較的安価な小型のクライアントデバイスを有することが重要である。
クライアントデバイスとは全く対照的に、無線クライアントデバイスが通信するサーバコンピュータシステム、ネットワークアダプタ、ネットワークルータ、無線基地局/アクセスポイント及び/又は何らかの固定コアネットワークデバイス等の固定処理システムは、クライアントデバイスよりも著しく大きな信号処理能力を有するとともに、電力を比較的制限なく利用できる。従って、固定システムは通例、比較的高速な処理能力、携帯デバイスよりもはるかに大きなメモリ能力、及び事実上、制限なく電力を利用できることを特徴としている。
本願明細書では、固定処理システムと比べて限られた資源しか持たない携帯デバイス等のデバイスを「制限された資源のデバイス」と呼ぶ。本願明細書において、基地局とは、メディアデータを資源制限デバイスに無線送信するアクセスポイント、セルラー基地局または同様の無線送受信機を指す。
米国特許第5802467号に音声およびデータ送受信のための無線通信、指令、制御および検知システムが記載されている。国際公開第02/27985号に、測定されたパラメータに基づいて無線(radio)デバイスに対する音量制御を自動化するシステムが記載されている。
本発明の実施形態に係る無線資源制限デバイスを備える無線機構の一例の簡略ブロック図である。 本発明の実施形態に係る無線資源制限デバイスを備える無線機構の別の例の簡略ブロック図である。 メディアデータの上流の処理を含み、例えば、図1A及び図1Bに示す実施形態を説明する装置実施形態の簡略ブロック図である。 本発明の実施形態の適用例に係る、通路が1本の旅客機内の数列の座席の簡略図である。 各座席が音声入力センサを備える6席の座席の1つのピコセル例であって、そのピコセルを利用して本発明の実施形態が動作することができる、ピコセル例を示す図である。 本発明の方法実施形態の簡略化されたフローチャートを示す図である。 ハイダイナミックレンジ(high dynamic range、HDR)ビデオディスプレイを備える携帯デバイスに、ビデオデータを信号処理装置を介して無線でストリーミングする本発明の簡略ブロック図の一実施形態である。 本発明の一実施形態に係る、クライアントデバイスから離れた所で生成されたメタデータ及び環境雑音情報を用いて、オーディオコンテントの上流雑音補償処理を行う装置の例の簡略ブロック図である。 フィードフォワード機構を用いて部分特定ラウドネス(干渉雑音の存在下における特定ラウドネス)を目標特定ラウドネスに近づけるようにオーディオ信号を変更して変更済みオーディオ信号を生成する品質向上信号処理の一実施形態を表す機能ブロック図である。 フィードフォワード機構を用いて部分特定ラウドネス(干渉雑音の存在下における特定ラウドネス)を目標特定ラウドネスに近づけるようにオーディオ信号を変更して変更済みオーディオ信号を生成する品質向上信号処理の一実施形態を表す機能ブロック図である。 フィードフォワード機構を用いて部分特定ラウドネス(干渉雑音の存在下における特定ラウドネス)を目標特定ラウドネスに近づけるようにオーディオ信号を変更して変更済みオーディオ信号を生成する品質向上信号処理の一実施形態を表す機能ブロック図である。 フィードフォワード機構を用いて部分特定ラウドネス(干渉雑音の存在下における特定ラウドネス)を目標特定ラウドネスに近づけるようにオーディオ信号を変更して変更済みオーディオ信号を生成する品質向上信号処理の実施形態を表す機能ブロック図である。 前処理において入力オーディオを周波数帯域群に分離する、雑音補償用のフィードフォワード機構の実施形態例を示す図である。
<概説>
本発明の実施形態には、方法、装置、及びこの方法を実行するべく1以上のコンピュータ可読有形媒体内にエンコードされたプログラム論理が含まれる。本発明の方法は、1つ以上の環境量を用いて、メディアデータに対して品質向上信号処理を行うためのものである。本発明において、環境量は、資源制約デバイスから離れているが、資源制約デバイスに十分近い場所に設けて、資源制約デバイスの近傍のセンサによる環境量が各環境量と同等の指標になる場所で収集する。本発明の信号処理は、メディアデータをレンダリングするために資源制約デバイスで用いられる処理された出力を生成するためのものである。
本発明の特定の実施形態には、品質向上のために処理ハードウェアを用いてメディアデータを処理する方法が含まれる。メディアデータは、資源制約無線デバイスによりレンダリングされる。この発明の方法には、1つ以上のセンサから求められる1つ以上の検知環境量を受け取るステップが含まれる。センサは、資源制約デバイスから離れているが、当該環境量が、資源制約デバイスの近傍のセンサと同じそれぞれの環境量の指標とするには十分、資源制約デバイスに近い場所にある。この発明の方法はさらに、資源制約デバイスから離れた場所において設置されるかまたはそこに結合されるネットワークノードにおいて、環境量を用いてメディアデータを処理し処理済みデータを生成するステップであって、センサがネットワークノード内にあるかまたはネットワークノードに接続されるステップと;処理済み出力をレンダリングのために資源制約デバイスに無線で送るステップと;を備え、これによって、処理済み出力がメディアデータをレンダリングするためにあるいは処理及びレンダリングするために資源制約デバイスによって利用可能となる。
この発明の方法の実施形態では、ネットワークノードには無線ネットワークの基地局が含まれる。
この発明の方法の実施形態では、処理済み出力には資源制約デバイスによるレンダリング用の処理済みメディアデータが含まれる。
さらに、この発明の方法の実施形態では、一部のメディアデータ処理は資源制約デバイスにおいて行われ、処理済み出力には、資源制約デバイスにおけるメディアデータ処理のために資源制約デバイスによって用いられるための補助データが含まれる。
「ストリーミング実施形態」と呼ばれるこの発明の方法の実施形態では、メディアデータには、1)資源制約デバイスにストリーミングされるメディアデータ、及び/又は2)無線ネットワークを介して、資源制約デバイスを含む双方向通信の一部としての資源制約デバイスにインタラクティブにストリーミングされるメディアデータ、のうちの1つ以上が含まれる。
ストリーミング実施形態では、メディアデータにはオーディオデータが含まれ、1つ以上の環境量には環境内の雑音の音響プロファイルを示す少なくとも1つの量が含まれ、品質向上処理には雑音補償が含まれる。変形例では、雑音補償には:1つ以上のラウドネスレベルパラメータ、及び音響雑音プロファイルの1つ以上のパラメータを用いてオーディオデータから変更パラメータを生成することが含まれる。変更パラメータは、知覚ラウドネス領域において情報に対して操作を実行することによって生成される。雑音補償にはさらに、変更パラメータに基づきオーディオデータを変更して処理済みオーディオデータを生成することが含まれる。1つ以上のラウドネスレベルパラメータには、オーディオ雑音補償のオンの有無、資源制約デバイスのための参照レベル、所望の再現レベル、及び/又は雑音補償の量のうちの1つ以上が含まれる。
雑音補償方法の実施形態では、メディアデータの品質向上処理には、オーディオデータに適用される自動ゲイン制御、ダイナミックレンジ圧縮及び/又はイコライゼーションのうちの1つ以上が含まれる。
ストリーミング実施形態では、メディアデータにはビデオデータが含まれ、1つ以上の環境量には、環境内の照明を示す少なくとも1つのパラメータが含まれ、品質向上処理には、パラメータのうちの1つ以上に従ってビデオデータのコントラスト及び/又は明るさを変更することが含まれる。
ストリーミング実施形態では、メディアデータにはビデオデータが含まれ、1つ以上の環境量には、環境内の照明の指標となる少なくとも1つのパラメータが含まれ、資源制約デバイスには、ビデオデータとともに資源制約デバイスに送られる画像依存調節データに従って各々調節される位置依存性バックライト素子を有するフラットパネルディスプレイデバイスが含まれる。品質向上処理には、ビデオデータのコントラスト及び/又は明るさを変更することが含まれる。ネットワークノードにおけるデータ処理には、1つ以上のパラメータのうちの少なくとも1つに従って画像依存調節データを生成することが含まれる。
特定の実施形態には、処理システムの少なくとも1つのプロセッサによって実行されると本概説セクションにおいて記載されている方法実施形態のうちのいずれか1つを実行させるプログラム論理が含まれる。このようなプログラム論理は、例えばコンピュータ可読記憶媒体内に備えられている。
特定の実施形態には、処理システムの少なくとも1つのプロセッサによって実行されると本概説セクションにおいて記載されている方法実施形態のうちのいずれか1つを実行させるプログラム論理を内蔵するコンピュータ可読媒体が含まれる。
特定の実施形態には、メディアデータの品質向上処理の少なくとも一部を実行する装置が含まれる。この装置は、資源制約デバイスに無線接続するように構成されるネットワークノード、ならびにネットワークノードに接続されるかまたはその中にある1つ以上のセンサを備える。このセンサは、資源制約デバイスから離れているが、資源制約デバイスに十分近い場所にあり、資源制約デバイスの近傍のセンサで検知した環境量が1以上の各環境量の指標になる。この装置はネットワークノードに接続されるかまたはその中にあり、1つ以上の環境量を受け取り、品質向上を達成するべく、受け取られる環境量の少なくとも一部を用いてメディアデータのデータ処理を実行し処理済み出力を生成するように構成された処理ハードウェアをさらに備える。さらに、ネットワークノードは処理済み出力を資源制約デバイスに無線で送るように構成され、それによって、処理済み出力がメディアデータをレンダリングするためにあるいは処理及びレンダリングするために資源制約デバイスによって利用可能となる。この発明の装置は、本概説セクションにおいて記載されている方法の実施形態のうちのいずれか1つを実行可能に構成される。
特定の実施形態には、メディアデータの品質向上処理の少なくとも一部を実行する装置が含まれる。この装置は、少なくとも1つのプロセッサを含む処理システムと、記憶デバイスとを備える。記憶デバイスにはプログラム論理が備えられ、このプログラム論理が実行されたとき、装置は方法の実施形態のうちのいずれか1つを実行する。
特定の実施形態がこれらの態様、特徴または利点の全てを提供する場合もあるし、一部を提供する場合もあるし、または全く提供しない場合もある。特定の実施形態が他の態様、特徴または利点を1つ以上提供する場合があり、そのうちの1つ以上は本願明細書における図、記載、及び請求項から当業者には容易に理解できるであろう。
<実施形態例>
<実施形態の典型的なアーキテクチャ>
図1A及び図2Bは、本発明の実施形態に係る無線資源制限デバイスを含む無線機構の2つの異なる例の簡略ブロック図を示す。
図1Cは、本発明の実施形態を表す簡略ブロック図である。図1A及び図1Bの各々に示される特定の実施形態はそれぞれ図1Cの機構によって説明できる。
図1Aは、クライアントデバイスにおけるレンダリングのためにメディアデータがクライアントデバイスにストリーミングされる第1の機構例を示す。基地局103に結合されるネットワーク101も含まれる。本記載においては「基地局」の用語は同義的且つ交換可能に用いられることに留意されたい。「基地局」とはセルラー通信ネットワークを述べる際に一般に用いられる用語であり、一方、「アクセスポイント」とはインフラストラクチャ型の無線ローカルエリアネットワークを述べる際に一般に用いられる用語である。基地局103は、少なくとも1つのアンテナを含むアンテナサブシステム105に結合された無線送受信機107、ならびにプロセッサ111及び記憶サブシステム113を含む処理サブシステムを備える。記憶サブシステム113にはメモリ要素が1つ以上、及び場合により磁気ディスク等の他の記憶要素が1つ以上含まれる。本願では、サブシステム113を一括して記憶デバイスと呼ぶ。いくつかの実施形態では、記憶デバイスはプログラム論理を備え、例えば実行されたときに、基地局に本発明の実施形態に係る方法のステップを実行させる命令等のプログラム論理を備える。
基地局は資源制約クライアントデバイス121と無線通信するように構成される。基地局は、オーディオデータ、あるいはオーディオデータ及びビデオデータ等の、メディアデータを(資源制約)クライアントデバイス121におけるレンダリングのためにストリーミングするように設計される。資源制約クライアントデバイスは、無線送信を、基地局103などから受信するためのアンテナサブシステム123と、他のコンポーネントとともにオーディオをレンダリングするためのラウドスピーカ/イヤホン、及び/又は他のコンポーネントとともにビデオをレンダリングするための表示画面などの1つ以上のトランスデューサと、を備える。
本発明の1つの実施形態では、オーディオデータ、あるいはオーディオデータ及びビデオデータ等の、メディアデータをストリーミングする。
図1Aに、メディアデータのソースを、ネットワーク101に結合される1つ以上のメディアサーバ(図面には1つのメディアサーバ例131を示す)の形で図示する。このようなサーバに共通しているように、サーバ101には、プロセッサ133を含む処理システムと、メモリ、ならびに場合により光学及び/又は磁気媒体システム等の1つ以上の他の記憶要素を含む記憶サブシステム135とが含まれる。コンピュータ可読記憶サブシステム135には、プロセッサ(単数または複数)133によって実行されたとき、サーバにネットワーク101を介してメディアデータを供給させる命令137が含まれる。
特定の例では、クライアントデバイス121はパーソナルオーディオ再生デバイスであり、出力トランスデューサには、ネットワーク101を介してストリーミングされるオーディオ番組を聴くための飛行機内のヘッドセットが含まれる。もう1つの特定の例として、クライアントデバイス121はパーソナルビデオ再生デバイスであり、出力トランスデューサには、ネットワーク101を介してストリーミングされるビデオデータを見るための、飛行機内の表示画面が含まれる。どちらの場合でも、メディアデータが資源制約クライアントデバイス121におけるレンダリングのためにストリーミングされ、資源制約クライアントデバイス121がメディアデータを、1つ以上の出力トランスデューサ125を介して聴く及び/又は見るためにレンダリングする。
本発明の1つの態様には、クライアントデバイス121によるレンダリング用のメディアデータを、クライアントデバイス121の環境を示す検知環境量を1つ以上用いる信号処理を実行することによって変更することが含まれる。1つ以上のセンサ109が1つ以上の環境量を検知するように構成される。環境量の例としては、オーディオの場合は雑音特性、及びビデオの場合は背景照明が挙げられる。ただし、それらに限定されるものではない。本発明の1つの態様は、1つ以上のセンサは、クライアントデバイス121から離れた場所にあるが、検知される環境量を資源制約デバイスの近傍の1つ以上の環境量と同等の指標とするには十分、資源制約デバイスに近い場所にあるというものである。図1Aの実施形態では、センサ109は基地局103にある、すなわち、基地局103に直接結合されている。これは資源制限デバイスにおける電力の使用を抑え、資源制限クライアントデバイス121における信号処理量も抑える。
本発明の1つの態様は、基地局103を含む無線ネットワークに無線で結合される資源制約デバイス121によるレンダリング用のメディアデータを変更する方法である。処理システム、例えば、プロセッサ111を含む処理システムが、センサ109から1つ以上の検知環境量を受信する。処理システムは、受信された検知環境量を用いてメディアデータをデータ処理し、処理済み出力、例えば、処理済みメディアデータ、及び/又は携帯デバイスにおけるメディアデータの処理のために携帯デバイス内で用いられるべき補助データを生成するように構成される。1つの実施形態では、処理システムによるデータ処理には、受信された検知環境量を用いて変更パラメータを生成し、変更パラメータに基づいてメディアデータを処理し処理済みメディアデータを生成することが含まれる。処理済みメディアデータ及び/又は補助データは、出力トランスデューサを介したレンダリングのために、あるいは処理及びレンダリングのために資源制約デバイス121に無線で送られる。従って、レンダリングデバイス121の環境内の環境量を用いるが、レンダリングデバイス121内では制限されている資源を必要とする信号処理方法が、デバイス121のような資源制限がなく、デバイス121から離れたプロセッサによって実行される。
示されている機構を有利に用いることができるいくつかのこのような信号処理方法が本願明細書において後により詳細に記載される。
いくつかの実施形態では、メディアデータのソースは上流からクライアントデバイス121に送られるが、本発明の他の実施形態では、メディアデータのソースはネットワークの上流の別個のデバイスにあるのではなく、クライアントデバイス121内にある。このような実施形態では、メディアデータは、プロセッサ111を備える処理システムへと上流に送られる。この処理システムは、メディアデータと、1つ以上の検知環境量とを受信する。
図1Bは第2の例を表し、ネットワーク101に結合された基地局103を介した双方向会話に用いられる無線クライアントデバイス121、例えば携帯電話の例を表す。本願明細書においては、図1Aにおけるものと同様の機能を有する参照要素に同じ参照符号が用いられることに留意されたい。たとえ同じ参照符号が用いられていても、任意の特定の要素の詳細は、機能を達成するべく要素によって用いられる手段を含め、実施形態ごとに異なる場合がある。図1Bの本例については、基地局103は、送受信機107を含め最小限のコンポーネントしか備えず、その機能性は、ネットワーク101に同様に結合されたコントローラ141により制御される、いわゆる「軽量」基地局であるという点で、図1Aのものとは異なる動作をする。コントローラ141は、少なくとも1つのプロセッサ143を含む処理サブシステム、及び記憶サブシステム145を備える。記憶サブシステム145は、メモリ要素を1つ以上、及び場合により磁気ディスク等の他の記憶要素を1つ以上備える。本願明細書では、サブシステム145を一括して記憶デバイスと呼ぶ。制御データ及び命令が安全な制御プロトコルによってネットワークを介して通信され、それにより、基地局は、コントローラとの組み合わせにより、図1Aに示されるものより機能豊富な基地局と同様の様式で動作する。本願明細書において記載されるように、ある実施形態では、記憶デバイスは、基地局103に本発明の方法の実施形態の各ステップを実行させる命令を、例えばコンピュータプログラム147として備えている。
基地局103は、例えば記憶サブシステム145内のプログラムによって、資源制約クライアントデバイス121と無線通信するように構成される。基地局はメディアデータを(資源制約)クライアントデバイス121でレンダリングするためのオーディオデータとして受信するように設計されるとともに、クライアントデバイス121内のマイクロホンなどのセンサによって集められるオーディオデータなどのメディアデータを受信するように設計される。資源制約デバイスは、例えば基地局103から無線送信を受信するためのアンテナサブシステム123、ならびに1つ以上の入力/出力トランスデューサ125、例えば、レンダリングのためのラウドスピーカ/イヤホン及びオーディオを受信するためのマイクロホンを備える。
本発明の1つの実施形態では、オーディオデータ等のメディアデータを、資源制約デバイス121を含む双方向通信の一部としての資源制約デバイス121に、基地局103及び資源を含む無線ネットワークを通じてインタラクティブにストリーミングするように設計する。このような用途の典型例は携帯電話である。
図1Bに示すように、コントローラ131に加えて、メディアソースとして、図1Aのメディアサーバと同様のメディアサーバ131が備えられている。メディアサーバ131は、例えばエンタテインメントまたは他のメッセージ等のメディアデータを、資源制限デバイス121または何らかの他の資源制限デバイスにストリーミングすることができる。
本発明の1つの態様では、クライアントデバイス121によるレンダリング用のメディアデータを、クライアントデバイス121の環境を示す検知環境量を1つ以上用いる信号処理を実行することによって変更する。1つ以上のセンサ109が1つ以上の環境量を検知するように構成される。環境量の例としては、オーディオの場合は雑音特性、及び/又はビデオの場合は背景照明が挙げられる。ただし、それらに限定されるものではない。本発明の1つの態様では、1つ以上のセンサは、クライアントデバイス121から離れた場所にあるが、検知された環境量を資源制約デバイスの近傍の1つ以上の環境量と同等の指標とするためには十分資源制約デバイスに近い場所にある。図1Bの実施形態では、センサ109は基地局103にある、すなわち、基地局103に直接結合されている。これは資源制限デバイスにおける電力の使用を抑え、資源制限クライアントデバイス121における信号処理量も抑える。
処理システム、例えばコントローラ141におけるプロセッサ143を含む処理システムが、基地局103及びネットワーク101を介してセンサ109から1つ以上の検知環境量を受信する。処理システムは、受信された検知環境量を用いてメディアデータをデータ処理し、処理済み出力、例えばメディアデータ、及び/又は資源制約デバイス121においてメディアデータをさらに処理するために用いられるべき補助データを生成するように構成される。1つの実施形態では、処理システムによるこのようなデータ処理には、受信された検知環境量を用いて変更パラメータを生成し、変更パラメータに基づいてメディアデータを処理し処理済みメディアデータを生成することが含まれる。コントローラは、処理済みメディアデータ及び/又は補助データを、出力トランスデューサを介したレンダリングのために、または処理及びレンダリングに用いるために、資源制約デバイス121に無線で送られるように構成される。従って、レンダリングデバイス121の環境内の環境量を用いるものの、レンダリングデバイス121内では制約される資源を必要とする信号処理方法を、デバイス121のような資源の制約が無く、デバイス121から離れたプロセッサによって実行することができる。
いくつかの実施形態では、メディアデータのソースは上流からクライアントデバイス121に送られるが、本発明の他の実施形態では、メディアデータのソースは、ネットワークの上流の別個のデバイスにあるのではなく、クライアントデバイス121内にある。それ故、図1A及び図1Bに示すように、クライアントデバイス121は、メディアデータを記憶可能な記憶領域を備える。このような実施形態では、メディアデータは、プロセッサ111を含む上流側の処理システムへ送られる。この処理システムは、メディアデータ及び1つ以上の検知環境量を受信する。
示されている機構を有利に用いることができるいくつかの品質向上信号処理方法が本願明細書において後により詳細に記載される。
<適用例>
図1A及び図2Bの例では、センサとクライアントデバイス121との間の距離が比較的短い。1つの例がピコセルネットワークである。例えば、飛行機の座席を考える。クライアントデバイスは、基地局を介してピコセルのクライアントにストリーミングされる素材を聴くための1対の無線ヘッドホンであるとする。ピコセルには飛行機内の座席のセットのうちの座席のサブセットが含まれる。別の適用例では、例えば再び飛行機の座席を考え、クライアントデバイスは、基地局を介してピコセルのクライアントデバイスにストリーミングされる素材を聴くことも含め、双方向会話を行うための携帯電話であるとする。ピコセルには飛行機内の座席のセットのうちの座席のサブセットが含まれる。第2の例として、無線クライアントデバイス121が例えば航空機の座席の近傍のピコセルに無線接続されるように設計される音楽プレーヤであるとし、航空機は、無線クライアントデバイス121内に記憶される音楽データのための品質向上サービスを提供するものとする。
図2Aに、本発明の実施形態の適用例における、通路が1本の旅客機内の数列の座席201の簡略図を示す。本例では、2列、2通路の座席がピコセル203を形成し、それ故、このようなピコセルが4つ示されており、各ピコセル203には基地局209及び最大6席までの座席が含まれる。
図2Bに、6席の座席の1つのピコセル203の例を示す。各座席205は音声入力センサ、例えば、任意の乗客の頭の近くにあり、座席の後部内のマイクロホン207を備える。一番前の一番左の座席は、そこにいる乗客とともに示されている。その乗客用のセルホン211が、単純化され拡大された形で示されている。各マイクロホン207は基地局に直接結合される。無線ヘッドホン213(同様に単純化され誇張、拡大された形で示されている)も各乗客用の代替のクライアントデバイスとして利用可能である。
多くの処理を必要としないようにするため、且つ、再充電及び/又は電池交換を頻繁に行わなくてすみ多くの電力を要しないようにするため、セルホン受話器211及びヘッドホンは極めて安価なものにすることが有利である。にもかかわらず、例えば乗客に送信されるオーディオなどの乗客のエクスペリエンスを、環境、例えば乗客の近傍の環境雑音、を考慮する信号処理を実行することによって向上させたいという要望が依然ある。
別のシナリオでは、自分たちのオーディオ再生デバイスを自分たちのピコセル無線ネットワークを介して接続する乗客のために、航空機が品質向上サービスを提供することが有利である。
クライアントデバイス211及び213の各々は図1A及び図1Bに示す一般的構造を有する。基地局は、図1Aに示す一般的アーキテクチャを有する完全な基地局、または図1Bのアーキテクチャを有する軽量基地局、すなわち何らかの他のアーキテクチャを用いた基地局であればよい。
適用例の別の変形例では、より少ないマイクロホン207がピコセル203の範囲内で用いられることに留意されたい。例えば、1つのマイクロホンを用いてピコセル領域203全体のための背景雑音量を得ることができる。
図2A及び図2Bにオーディオに関連する適用例を示しているが、同様の適用例を、クライアントデバイスであって、制約された資源を有する携帯ビデオデバイス上でビデオまたは静止画像を見ることに適用することができる。
<方法の実施形態>
図3に、例えば、図1Cに示される装置、ならびに図1A及び図1Bの各々に示される特定の実施形態例によって実施される通りの、本発明の方法実施形態の簡略化されたフローチャートを示す。メディアデータを変更する方法、例えば、無線ネットワークに無線で結合された資源制約デバイスによるレンダリングのための品質向上のために変更する方法300を図示する。この方法には、ステップ301において1つ以上のセンサ109から1つ以上の検知環境量を受信することが含まれる。センサ109は、資源制約デバイス121から離れた場所にあるが、検知された環境量を資源制約デバイス121の近傍の1つ以上の環境量と同等の指標とするには十分、資源制約デバイス121に近い場所にある。
この方法にはさらに、ステップ303において、センサ109の場所、すなわち資源制約デバイス121から離れた場所にあるか、またはそこに結合されたネットワークノード161において、受信された検知環境量を用いてメディアデータをデータ処理し、例えば処理済みメディアデータ等の処理済み出力、または資源制約デバイスでの処理に用いるための補助データ、あるいは処理済みメディアデータ及び補助データの両方を生成することが含まれる。
この方法には、ステップ305において、資源制約デバイス121におけるレンダリングのために、あるいは処理及びレンダリングのために資源制約デバイス121に処理済み出力(処理済みメディアデータ及び/又は補助データ)を無線で送ることが含まれる。
ある実施形態では、メディアデータにはオーディオデータ、例えば、品質向上処理用オーディオデータが含まれる。他の実施形態では、メディアデータには、品質向上処理用のビデオデータが含まれる。ある実施形態では、メディアデータには、品質向上処理用のオーディオデータ、及び品質向上処理用のビデオデータの両方が含まれる。
ある実施形態では、ネットワークノード161には無線ネットワークの基地局が含まれる。「無線ネットワークの基地局」の用語には、処理を実行するための処理能力をそれ自身が有する基地局131、または処理を実行するための処理能力を有する要素にネットワークを介して結合された基地局131のいずれかが含まれる。それ故、「基地局」の用語は図1A及び同様に図1Bのシナリオを範囲に含む。
ある実施形態では、メディアデータには、資源制約デバイスにストリーミングされるメディアデータが含まれる。ある実施形態では、メディアデータには、資源制約デバイスを含む双方向通信の一部としての資源制約デバイスに無線ネットワークを通じてインタラクティブにストリーミングされるメディアデータが含まれる。さらに他の実施形態では、メディアデータには、資源制約デバイスにストリーミングされるメディアデータ、ならびに資源制約デバイスを含む双方向通信の一部としての資源制約デバイスに無線ネットワークを通じてインタラクティブにストリーミングされるメディアデータの両方が含まれる。
ある実施形態では、メディアデータは無線クライアントにおいて作り出され、次に、処理の後、無線クライアントに送り返される。
<検知環境量を用いる処理の形式>
本発明は、検知環境量を用いる処理の形式に限定されるものではなく、本発明を有利に利用することができる多くのこのような形式の信号処理操作が知られている。移動デバイスの環境の近傍の音響雑音プロファイルの推定値を利用することができる、オーディオデータのための品質向上信号処理技法には、知覚ラウドネス領域、または単純にラウドネス領域とも呼ばれる、知覚領域において実行される処理が含まれる。1つの実施形態では、このような処理には雑音補償が含まれる。雑音補償の実施形態では、処理には自動ゲイン制御、ダイナミックレンジ圧縮及び/又はダイナミックイコライゼーションのうちの1つ以上がさらに含まれる。
無線デバイスから離れているがその近くで得られる環境照明の推定値を利用することができるビデオデータの品質向上信号処理技法には、彩度調節、明るさ調節、コントラスト調節等が含まれ、例えばいわゆるハイダイナミックレンジ(HDR)ディスプレイ用のバックライティングLED等の、個別に調節可能な多数の光素子を用いたフラットパネルディスプレイデバイス用のバックライト素子群を調節するための画像依存信号を生成することが含まれる。
<HDRディスプレイ類のための例示的な実施形態>
HDRディスプレイ類及びそれらの背景にある技術は、本発明の譲受人に関係するドルビーラボラトリーズ社によってドルビーコントラスト、ドルビーHDR及びドルビービジョンとして市販されている。現在構築されているHDRディスプレイは、バックライトに調節発光ダイオード(light emitting diode、LED)等の調節光源を用いる。このようなバックライトはIMLED(Individually Modulated Array of LED、個別調節LEDアレイ)バックライトと呼ばれることがある。1つの変形例では、各LEDの明るさは8ビット信号によって制御され、従って、各LEDは256個の明るさ段階を有する。LCD画面の背後に単一の光源を有するのではなく、複数の小領域が、示されているシーン内の局所的な明るさ及びコントラストに従って調節される様式でバックライトされる。
調節信号は、ビデオ信号に対する処理を実行することによって得られ、バックライティング用LEDをさらに調節する信号を生成する。さらなる詳細については、例えば、ヘルゲ・ゼーツェン(Helge Seetzen)、ヴォルフガング・ハイドリッヒ(Wolfgang Heidrich)、ヴォルフガング・シュチュアーズリンガー(Wolfgang Stuerzlinger)、グレッグ・ウォード(Greg Ward)、ローン ・ホワイトヘッド(Lorne Whitehead)、マシュー・トレンタコステ(Matthew Trentacoste)、アビジート・ゴーシュ(Abhijeet Ghosh)、アンドレイ・ヴォロズコフス(Andrejs Vorozcovs):『ハイダイナミックレンジディスプレイシステム』、ACMトランザクションズ・オン・グラフィックス(ACM Transactions on Graphics(TOG))、第23巻、第3号、特別号:2004年SIGGRAPHカンファレンス(2004年8月)の議事録を参照されたい。米国特許出願第6,891,672号も参照されたい。
ビデオ信号から調節信号を求める信号処理はたやすくはない。従って、資源制約のある観視デバイスではこのような処理の能力がない場合がある。しかし、このような信号処理は、資源制約観視デバイスの環境の近くで提供される、求められる、または測定される1つ以上のパラメータに基づいて、上流において有利に実行されることができる。
それ故、コントラスト及び明るさを局所的な観視条件、例えば観視環境の明るさに従って変更することが知られている。1つの実施形態では、処理要素に接続されているが無線クライアントからは離れた環境センサが、観視環境に近い明るさの指標を求める。環境の明るさは上流のプロセスに提供される。1つの実施形態では、1つ以上の他のパラメータ、例えば、コントラスト強調の量を示すパラメータ、観視者によって望まれる明るさ設定を示すパラメータ等が送られる。上流のプロセッサは資源制限観視デバイスからこのようなパラメータを受信し、信号処理を実行してLEDデバイスのバックライティングのためのレベルを求める。通例、バックライティングは単色であり、主ビデオよりもはるかに粗い解像度である。解像度がより低いバックライトデータがビデオ信号と一緒に資源制限デバイスに送られ、受信されたパラメータに従って調節され、資源制限観視デバイスによって組み合わせてレンダリングされる。
図4に、本発明の実施形態の簡略ブロック図を表す。この実施形態ではメディアデータが信号処理装置403を介して携帯デバイスにストリーミングされる。この実施形態の場合、携帯デバイスはLCDパネル415と、環境に依存して調節されるバックライティングとなる多数の個別調節発光ダイオードデバイス417で構成されるHDRビデオディスプレイ413とを備える、無線デバイス511である。当然であるが、図4ではディスプレイ413を最も単純化した2次元の形態で表している。信号処理装置403に結合されるデバイス421が、無線携帯デバイス411付近のアンビエント光の指示を測定するように構成される光センサ325を備える。図示の実施形態には、オーディオ雑音環境量を得るためのマイクロホン423も、メタデータを提供するためのユーザインターフェース(user interface、UI)として含まれている。アンビエント光環境量は、ある頻度で、例えば1秒に1回の頻度で、オーディオ及び/又はビデオの品質向上処理に関するメタデータの1つ以上の他の項目、及び/又は他の環境量と一緒に、上流の信号処理装置403に提供される。上流の信号処理装置は、アンビエント光環境量及びビデオメディアデータを受け取るように構成されるとともに、ビデオデータを処理して、HDRディスプレイ413内の個別調節LEDデバイス417用の信号を生成するべく携帯デバイスによって利用可能な調節信号を生成するようにさらに構成された、HDR信号プロセッサ405を備える。処理とは、ビデオ信号内の輝度に基づくだけでなく、さらに、携帯デバイス409においてビデオが観視されている場のアンビエント照明に基づいて、ビデオ内のコントラストを強調することである。処理装置403にはさらに、メタデータの他の項目による別のオーディオ及び/又はビデオ品質向上処理や、例えば背景雑音等の他の環境量による別のオーディオ及び/又はビデオ品質向上処理が含まれていてもよい。
ある実施形態では、信号処理ブロック403には、プロセッサと、本発明のいくつかの実施形態による方法ステップを実行する命令で構成されるプログラム論理を備える記憶デバイスとが含まれる。
<雑音補償の実施形態例>
図5に、メディアデータにオーディオデータが含まれ、無線携帯デバイス511付近にあるデバイス521の少なくとも1つのセンサ523によって測定される少なくとも1つの環境量を、無線デバイス511の環境付近の音響雑音プロファイルの指標として用いる装置の実施形態の簡略ブロック図を示す。品質向上処理は上流の処理ブロック503内で実行され、品質向上処理にはデバイス521によって生成されるメタデータ及び環境雑音量を用いた雑音補償が含まれる。この雑音補償の詳細は後述する。ある実施形態では、雑音補償に、1つ以上のラウドネスレベルパラメータ、及び音響雑音プロファイルの指標となる1つ以上の環境量を用いて、オーディオデータから変更パラメータを生成することが含まれる。変更パラメータは、「知覚領域」と呼ばれるものにおいて情報に対する操作を実行することによって生成される。雑音補償には、変更パラメータに基づいてオーディオデータを変更し、携帯デバイス511に無線で送られる処理済みオーディオデータを生成することが含まれる。例として、ラウドネスレベルパラメータには:オーディオ雑音補償スイッチがオンか否か、資源制約デバイスのための参照レベル、所望の再現レベル、及び/又は雑音補償の量のうちの1つ以上が含まれる。ある変更例では、オーディオデータの処理には、オーディオデータに適用されるAGC、ダイナミックレンジ圧縮及び/又はダイナミックイコライゼーションのうちの1つ以上がさらに含まれる。図5に、送られる可能性があるメタデータ及び環境量のいくつかの典型的な値を示す。環境量には雑音パワーの推定値が含まれ、例えばいくつかの帯域の組合せにおける雑音の大きさが環境量となる。これらの環境量は、含まれるマイクロホン523からの入力を受け取るデバイス521内に含まれるプロセッサによって決められる。1つの実施形態では、20個の雑音スペクトル強度値を決め、使用する。別の実施形態では、40個の雑音スペクトル強度値を使用する。均一化及び雑音補償の経験がある当業者は、20個ないし40個の周波数帯域内で均一化及び雑音補償を実行すれば、現在の処理能力に基づいた良好な結果が得られることを見いだしている。当然、技術が進歩するに従い、より多くのスペクトル帯域が用いられるようになる可能性があろうし、上流の処理までもいくらか制約される何らかの状況では、より少ない周波数帯域、及び従ってスペクトル雑音値が用いられるだけですむようになる可能性があろう。このメタデータ及び環境量は、オーディオ雑音補償を実施する容量及び能力を有する上流の信号処理システム503、例えば雑音補償処理ブロック505を備えるシステム503によって受け取られる。
通例、環境量はオーディオデータの周波数レンジよりもはるかに低い頻度で、例えば1秒ごとにおよそ1セットの頻度で測定され提供される。
ある実施形態では、信号処理ブロック503には、プロセッサと、本発明のいくつかの実施形態による方法ステップを実行する命令で構成されるプログラム論理を備える記憶デバイスとが含まれる。
1つの実施形態では、ラウドネスに基づく雑音補償では、雑音補償処理が含まれる上流での信号処理において、例えば携帯デバイス等のクライアントデバイスにストリーミングするオーディオデータを処理するために必要な情報が、以下のメタデータパラメータ及び環境情報により提供される。ある実施形態において用いられる単位、及びいくつかの典型的な値を例示する:
パラメータ1:雑音補償オン/オフ(0または1)
パラメータ2:携帯デバイス参照再現レベル(75dB)
パラメータ3:目標再現レベル(−20dB)
パラメータ4:雑音スペクトル推定値、例えば、1秒につきおよそ1回送られる20ないし40個の雑音スペクトル強度値。
パラメータ5:雑音補償の量(1〜10)
図4及び図5は、図1Cの一般構造を有する種々の実施形態によって実行されることができる、ありうるオーディオデータ品質向上信号処理及び/又はビデオデータ品質向上信号処理のほんの数例を示しているだけであることは当業者には明らかであろう。
<知覚領域における処理のさらなる詳細>
本発明はオーディオメディアデータのいずれの特定の形式の品質向上処理にも限定されるものではない。しかし、本発明の実施形態の有利な利用をはっきり示すために、雑音補償−本願明細書において知覚領域と呼ばれる、同様に知覚ラウドネス領域または単純にラウドネス領域とも呼ばれるものにおいて行われるオーディオ品質向上信号処理方法の一例が本セクションにおいて記載される。品質向上信号処理において、知覚されるラウドネスの指標を知覚領域において求め用いることが知られている。例えば、オーディオ信号の、知覚されるラウドネスを算出し調節する方法、装置及びコンピュータプログラム(METHOD,APPARATUS,AND COMPUTER PROGRAM FOR CALCULATING AND ADJUSTING THE PERCEIVED LOUDNESS OF AN AUDIO SIGNAL)と題され、国際公開第2004111994号として公開されている国際特許出願PCT/US2004/016964号、ならびにオーディオ信号の、知覚されるラウドネス及び/又は知覚されるスペクトルバランスの算出及び調節(CALCULATING AND ADJUSTING THE PERCEIVED LOUDNESS AND/OR THE PERCEIVED SPECTRAL BALANCE OF AN AUDIO SIGNAL)と題され、国際公開第2006047600号として公開されている国際特許出願PCT/US2005/038579号を参照されたい。オーディオ信号の、知覚されるラウドネス及び/又は知覚されるスペクトルバランスの算出及び調節(CALCULATING AND ADJUSTING THE PERCEIVED LOUDNESS AND/OR THE PERCEIVED SPECTRAL BALANCE OF AN AUDIO SIGNAL)と題され、国際公開第2007120453号として公開されている国際特許出願PCT/US20075/007946号も参照されたい。これらの出願の各々はアメリカ合衆国を指定国とする。上記の公報、国際公開第2004111994号、国際公開第2006047600号及び国際公開第2007120453号の各々の内容は本願明細書において参照により援用されている。アラン・ゼーフェルト:『ラウドネス領域信号処理(Loudness Domain Signal Processing)』、論文第7180号、議事録、オーディオ技術者協会(Audio Engineering Society)第123回大会、ニューヨーク、ニューヨーク州、アメリカ合衆国、2007年、5−8も参照されたい。本願明細書において記載されているオーディオ品質向上信号処理方法のいくつかの詳細が上記の公開特許出願及び公開論文内にある。
品質向上信号処理方法には、知覚ラウドネス領域において実行された計算から変更パラメータを求め、変更パラメータに従ってオーディオメディアデータを変更することが含まれる。知覚ラウドネス領域において変更パラメータを求めれば、このような変更パラメータを電気信号領域で導出した場合よりも、知覚ラウドネス及び知覚されるスペクトルのバランスのよい制御を達成できる可能性がある。加えて、ラウドネス領域での計算を実施する際に、基底膜を模擬する音響心理学的フィルタバンクまたはその同等物を利用すると、電気信号領域において変更パラメータを導出する機構よりも、知覚されるスペクトルを詳細に制御することができる可能性がある。
オーディオメディアデータが、指定された参照レベルで再現されるように期待されていることがしばしばある。しかし、多くの場合、メディアデータは、低下されたレベルで再生される。再現レベルに応じてオーディオの知覚に変化があることが知られている。このような変化は心理音響学ならびに等ラウドネス曲線及び静音における最小可聴域値に関連する。再生レベルが変更されると、参照レベルで再生される同じメディアデータと比べたとき、オーディオの音色及び空間的知覚に劇的な違いをもたらすことができる。本発明のいくつかの実施形態の品質向上信号処理には、オーディオ信号の中の知覚されるラウドネスを、改良された方法で求めて調節することが含まれる。オーディオ信号のラウドネスの指標を知覚単位で算出するために、音響心理学的モデルを用いる。このような知覚領域ラウドネスの指標は特定ラウドネスと呼ばれ、周波数及び時間の関数としての知覚ラウドネスの指標である。1つの例として、知覚領域において求められるパラメータを用いた音量制御方法に、信号処理方法を用いて広帯域乗算ゲインを計算することが含まれ、広帯域乗算ゲインは、オーディオに適用されたとき、参照ラウドネスと実質的に同じになるゲイン変更されたオーディオのラウドネスを生じさせる。ゲインの調節方法には、再生レベルに応じてオーディオを分析して変更し、それを参照再生レベルで知覚されるような状態に復元する信号処理方法が含まれる。これは、画像化、明瞭度、及びオーディオメディアデータの可聴性の向上をもたらすことが見いだされている。さらなる詳細が後に提示される。
<音量均一化(任意にダイナミックレンジ制御及び/又は自動ゲイン制御を用いる)としての雑音補償>
雑音補償は雑音存在下での(及び雑音を考慮に入れた)音量均一化の一例である。音量均一化はラウドネス均一化及びラウドネス補償均一化とも呼ばれ、とりわけ、特定ラウドネスと目標特定ラウドネスとの間の差を縮小するためにオーディオ信号を変更することによって、オーディオ信号の特定ラウドネスの制御に利用できる情報を導出することも含まれる。実用的な実施では、変更済みオーディオ信号の特定ラウドネスは、目標特定ラウドネスを近似するように作られればよい。近似は、通常の信号処理の考慮だけでなく、変更において用いられる場合がある時間及び/又は周波数平滑化によって影響を受ける場合がある。方法には、オーディオ信号の特定ラウドネスの形でオーディオ信号の知覚ラウドネスを求め、オーディオ信号を変更するためにオーディオ信号の複数の帯域に適用すべきマルチバンドゲインを求めることが含まれる。ある実施形態では、オーディオメディアデータの知覚されるラウドネスの一貫性が保たれるように、信号の変更ではオーディオにマルチバンドゲインの変更を動的に適用する。こうしたものがオーディオシステムの音量制御と併せて用いられると、音量コントローラは変容され、増幅部に送られているオーディオ信号レベルを制御する電気抵抗器をエミュレートするものではもはやなくなる。その代わり、音量コントローラは均一化方法への入力を提供し、ユーザの所望の知覚されるラウドネス再現レベルを示すものとなる。
<雑音補償−雑音干渉の存在下における均一化>
多くのオーディオ再生環境では、聴取者が聴きたいオーディオに干渉する背景雑音が存在する。例えば、動いている自動車の車内にいる聴取者が、搭載されているステレオシステムを通じて音楽をかけている場合があり、エンジン及び道路からの雑音が音楽の知覚を著しく変化させる場合がある。特に、音楽のエネルギーに対して雑音のエネルギーが相当あるスペクトルの部分については、音楽の知覚されるラウドネスは減じられてしまう。雑音のレベルが十分大きければ、音楽は完全にマスキングされてしまう。本発明のいくつかの実施形態における品質向上信号処理には、オーディオ再生環境内で干渉する背景雑音を補償する方法が含まれる。オーディオの部分特定ラウドネスは、雑音等の二次的干渉音声信号の存在下におけるオーディオの知覚ラウドネスとして定義される。いくつかの実施形態における信号処理には、部分特定ラウドネスと目標特定ラウドネスとの間の差を縮小するためにオーディオ信号を変更することによって、オーディオ信号の部分特定ラウドネスの制御に利用できる情報を求めることが含まれる。そのようにすることで、知覚的に正確な様式で雑音の効果が軽減される。
<自動ゲイン制御またはダイナミックレンジ圧縮を用いた雑音補償>
雑音の存在下における均一化を用いて、再現されるオーディオの、知覚されるラウドネスをユーザの所望のラウドネスレベルに一致するように変更するために用いる変更情報を求めることができる。これを用いて自動ゲイン制御及び/又はダイナミックレンジ圧縮を達成することができる。自動ゲイン制御及びダイナミックレンジ圧縮を達成する均一化の詳細は後述する。
<ダイナミックイコライゼーション(Dynamic Equalization、DEQ)>
雑音の存在下における単純な均一化とは異なり、オーディオをユーザの所望の知覚ラウドネスレベルに一致するように変化させる代わりに、ダイナミックイコライゼーションはオーディオを、プリセットの又はユーザが定義するイコライゼーションまたはスペクトルバランスプロファイルに一致するように変化させる。特定ラウドネスは、周波数及び時間の関数としてのオーディオ信号の知覚ラウドネスの指標であるので、オーディオ信号の特定ラウドネスと目標特定ラウドネスとの間の差を縮小するために、変更はオーディオ信号を周波数の関数として変更すればよい。場合によっては、目標特定ラウドネスは時間的に不変である場合があり、オーディオ信号自体は定常状態の時間的に不変な信号である場合があるが、通例、変更はオーディオ信号を時間の関数として変更してもよい。時間且つ周波数変化するスケールファクタの場合、特定ラウドネスは、所望のスペクトル形状の指標の、オーディオ信号のスペクトル形状の指標に対する比によってスケーリングされればよい。このようなスケーリングを用いて、オーディオ信号の、知覚されるスペクトルを、時間変化する知覚されるスペクトルから、実質的に時間的に不変の知覚されるスペクトルに変換すればよい。特定ラウドネスが、所望のスペクトル形状の指標の、オーディオ信号のスペクトル形状の指標に対する比によってスケーリングされる場合、このようなスケーリングはダイナミックイコライザとして利用できる場合がある。
雑音補償等の、均一化を含む知覚領域処理の場合、受信される検知環境量には、資源制約デバイスの環境に近い環境の音響雑音プロファイルを示す1つ以上のパラメータが含まれる。メタデータには1つ以上のラウドネス均一化パラメータが含まれる。メディアデータの処理には、オーディオデータに適用されるダイナミックレンジ圧縮及び/又はイコライゼーションを場合により含む雑音補償が含まれる。雑音補償には、ラウドネスレベルパラメータのうちの1つ以上、及び音響雑音プロファイルの1つ以上のパラメータを用いてオーディオデータから変更パラメータを生成し、変更パラメータに基づきオーディオデータを変更し処理済みオーディオデータを生成することが含まれる。変更パラメータは、知覚ラウドネス領域において情報に対して操作を実行することによって生成される。1つ以上のラウドネスレベルパラメータには、参照再現レベル、所望の再現レベル及び/又は均一化の量のうちの1つ以上が含まれる。
特定の実施形態では、受信される検知環境量には、資源制約デバイスの環境内の音響雑音プロファイルを示す1つ以上のパラメータが含まれる。オーディオデータに適用される雑音補償は、(a)資源制約デバイスの環境内の音響雑音プロファイルを示すパラメータを少なくとも1つ含む、受信される検知環境量のうちの1つ以上、及び(b)オーディオ雑音補償スイッチがオンか否か、などの1つ以上のパラメータ、資源制約デバイスのための参照レベル、ならびに/あるいは所望の再現レベル及び雑音補償の量などの1つ以上の処理パラメータ、に基づく。
<知覚領域ベースの品質向上処理のさらに詳細な概説>
以下の記載全体を通じ、「フィルタ」または「フィルタバンク」等の用語には、無限インパルス応答(infinite impulse response、IIR)フィルタまたは変換、ならびに有限インパルス応答(finite impulse response、FIR)フィルタ等の、本質的に任意の形の再帰型及び非再帰型フィルタリングが含まれる。「フィルタリングされた」情報とは、このようなフィルタまたはフィルタ群を適用することの結果を意味する。後述する実施形態は、変換によって実行されるフィルタバンクを用いるものである。
上述のように、本発明の実施形態に含むことができる知覚ラウドネス領域におけるオーディオ品質向上信号処理の操作には、雑音干渉の存在下における均一化などの雑音補償が含まれる。このような雑音補償はダイナミックレンジ制御または自動ゲイン制御、ならびに/あるいはダイナミックイコライゼーション(DEQ)と好都合に組み合わせられる可能性があろう。
このような実施形態には、オーディオ信号の特定ラウドネス、及び資源制約デバイスの場所に近い場所から送られる環境量に基づいた雑音の特定ラウドネスを求めることが含まれる。品質向上信号処理には、資源制限デバイスから離れて設置されているが、資源制限デバイスの環境内の雑音の指標とするためには十分近くにある1つ以上のセンサから雑音の指標を受信し、さらに、部分特定ラウドネスと目標特定ラウドネスとの間の差を縮小するべくオーディオ信号を変更することによって、オーディオ信号の部分特定ラウドネスを制御することが含まれる。品質向上信号処理には、1つ以上のプロセス及び1つ以上のプロセス制御パラメータに従ってオーディオ信号またはその指標を処理することによってオーディオ信号を処理し、目標特定ラウドネスを有する信号を作成することが含まれていてもよい。
目標特定ラウドネスはオーディオ信号の関数であるか、またはオーディオ信号の関数ではない場合がある。後者の場合、目標特定ラウドネスは、記憶された目標特定ラウドネス、またはパラメータとして受信される目標特定ラウドネスであるか、あるいは受信されたパラメータから求められればよい。このような場合、変更または導出は特定ラウドネスまたは部分特定ラウドネスを陽的または陰的に算出すればよい。陰的算出の例として、ルックアップテーブル、あるいは特定ラウドネス及び/又は部分特定ラウドネスが本質的に求められる数式の計算によることが挙げられる。
<フィードフォワード機構>
図6A〜図6Dに、フィードフォワード機構を用いて部分特定ラウドネスを目標特定ラウドネスに近づけるべく、オーディオ信号を変更して変更済みオーディオを生成する品質向上信号処理のいくつかの実施形態を表す機能ブロック図を示す。特に、図6Aは、オーディオ信号611が、2つの経路:1つ以上の変更パラメータ619に応答してオーディオ信号611を変更するように構成されるプロセスまたはデバイスを1つ以上有する信号変更経路601、並びに変更パラメータ619を生成するように構成されたパラメータ生成制御経路602を有するパラメータ生成制御経路、に印加されるフィードフォワードトポロジを示す。図6Aのフィードフォワードトポロジの例における信号変更経路601は、オーディオ信号、例えばその振幅を、パラメータ生成制御経路602から受信される変更パラメータ619に従って周波数変化及び/又は時間変化するような態様で変更することができるデバイスまたはプロセスであればよい。1つの実施形態では、パラメータ生成制御経路602の少なくとも一部は、知覚ラウドネス領域において動作する。一方、信号変更経路601は電気信号領域において動作し、変更済みオーディオ信号615を作成する。
信号変更経路601及びパラメータ生成制御経路602は、特定ラウドネスと目標特定ラウドネス623との間の差を縮小するべくオーディオ信号を変更するように構成される。
1つの実施形態では、信号変更経路601及びパラメータ生成制御経路602の各々は、前処理操作またはデバイスによって予め処理された信号を処理する。このため、図6Aでは、前処理済みオーディオ613を作成する前処理機能ブロック603を例示している。
図6Aのフィードフォワードの例では、パラメータ生成制御経路602はいくつかのプロセス及び/又はデバイスを備えるものであればよい:図6Aに示す例では、パラメータ生成制御経路602には、オーディオ信号611、またはオーディオ信号の指標に応答して、及び前処理済みオーディオ信号613に応答してオーディオ信号の特定ラウドネス617を算出するように構成された1つ以上のプロセス及び/又はデバイスを備え、特定ラウドネスを算出するブロック605が含まれる。パラメータ生成制御経路602には変更パラメータを算出するブロック607が含まれる。変更パラメータを算出するブロック607は、特定ラウドネスまたは励振617、目標特定ラウドネス623、雑音等の二次的干渉オーディオ信号621による励振や特定ラウドネスに応答して、変更パラメータを算出する。従って、変更パラメータを算出するブロック607は、入力としてこのような二次的干渉オーディオ信号の指標を受信するか、または二次的干渉信号そのものを入力の1つとして受信する。本願明細書において後に、ならびに国際公開第2006047600号及び国際公開第2007120453号においてさらに詳細に記載されているように、二次的干渉信号の指標はその励振とすればよい。図6Aに示す変更パラメータを算出するブロック607への干渉信号の指標または信号そのものの印加によって、適切に構成されたプロセスまたはデバイスにより、雑音補償を達成するべく干渉信号を考慮に入れた変更パラメータ619を算出することができる。
図6Aのフィードフォワードの例では、部分特定ラウドネスが陽的に算出されない。図6Aの、変更パラメータを算出するブロック607が、変更済みオーディオの部分特定ラウドネスに、目標特定ラウドネス623を近似させるのに適当な変更パラメータを算出する。フィードバック及びハイブリッド構成では、部分特定ラウドネスも算出される場合がある。
ある実施形態では、図6Bに示すように、制御経路602の変更パラメータを算出するブロック607の目標特定ラウドネスは、一般にはオーディオ信号またはその指標、ならびに図示の実施形態では前処理済みオーディオ信号613に応答して目標特定ラウドネス623を算出するように構成されるプロセスまたはデバイスを1つ以上備える目標特定ラウドネスブロック631によって求められる。この目標特定ラウドネスを算出するブロック631は、各々が関数パラメータを有する1つ以上の関数「F」を実施する。例えばブロック631はオーディオ信号の特定ラウドネスを算出し、次に、それに1つ以上の関数Fを適用して目標特定ラウドネス623を提供すればよい。このため図6Aに、目標特定ラウドネスを算出するブロック631への「関数及び/又は関数パラメータ」入力633を概略的に図示している。
ある実施形態では、図6Cに示すように、目標特定ラウドネス623は模式的に示す記憶要素635から提供され、パラメータ生成制御経路602内に含まれるか、または関連付けられる。
さらに、図6Dに示すように、ある実施形態では、目標特定ラウドネス623はプロセスまたはデバイス全体の外部のソースによって提供される。
従って、変更パラメータ619は、少なくとも一部が知覚(音響心理学的)ラウドネス領域における算出に基づく。
図6Aの例におけるプロセスまたはデバイス605及び607、ならびに図6Bにおける631によって実施される算出は、陽的及び/又は陰的に実施されればよい。陰的実施の例としては、(1)項目の全部または一部が特定ラウドネス及び/又は目標特定ラウドネス623ならびに/あるいは変更パラメータの算出に基づくルックアップテーブルと、(2)本質的に全てまたは一部が特定ラウドネス及び/又は目標特定ラウドネス623ならびに/あるいは変更パラメータに基づく閉じた数式とが挙げられる。
図6A及び図6Bの例の算出ブロック605、607及び631は模式的に示されており、さらに別個のもののように記載されているが、これは単に説明の目的のためでしかない。これらのプロセスまたはデバイスのうちの或るものまたは全てが、単一のプロセスまたはデバイス内で組み合わせられるか、あるいは複数のプロセスまたはデバイス内で様々に組み合わせられてよいことは理解されよう。
目標特定ラウドネスはオーディオ信号の特定ラウドネス等のオーディオ信号の指標のスケーリングであればよい。例えば、国際公開第2006047600号及び国際公開第2007120453号に詳細に記載されているように、スケーリングは特定ラウドネスの下記のスケーリングの1つまたはその組み合わせであればよい。ここでbは周波数の指標、例えば前処理603が入力信号を複数の周波数帯域に分離する場合の帯域数を示し、tは時間の指標を示し、
Figure 0005273688
は目標特定ラウドネス623を示し、N[b,t]はオーディオ信号611の特定ラウドネス617を示す。
(a)時間且つ周波数変化スケールファクタΞ[b,t]による、次の関係にあるような、特定ラウドネスのスケーリング:
Figure 0005273688
(b)時間変化、周波数不変スケールファクタΦ[t]による、次の関係にあるような、特定ラウドネスのスケーリング:
Figure 0005273688
(c)時間不変、周波数変化スケールファクタΘ[b]による、次の関係にあるような、特定ラウドネスのスケーリング:
Figure 0005273688
(d)時間不変、周波数不変のスケールファクタαによる、次の関係にあるような、オーディオ信号の特定ラウドネスのスケーリング:
Figure 0005273688
Figure 0005273688
と示される目標特定ラウドネス623は、ゆえにオーディオ信号またはオーディオ信号の指標の組み合わせでFによって示される1つ以上の関数として表されればよく、特定ラウドネスN[b,t]をオーディオ信号の1つのありうる指標とすれば、次のようになる:
Figure 0005273688
関数または関数群Fが可逆的であるならば、未変更オーディオ信号611の特定ラウドネスN[b,t]は目標特定ラウドネス623の逆関数または関数群F−1(N[b,t])として算出されてよい。
図6Aにフィードフォワード機構を示しているが、逆関数または関数群F−1( )が算出されるフィードバック及びハイブリッドフィードフォワード/フィードバック機構を用いることも知られている。例えば、国際公開第2006047600号及び国際公開第2007120453号を参照されたい。しかし、解説を簡潔にするために、本願明細書においてはフィードフォワード構成のみを記載する。
ルックアップテーブル、閉じた数式、または何らかの他の技法のいずれを用いるにせよ、パラメータ生成制御経路602の操作は、たとえ特定ラウドネス及び目標特定ラウドネス623が陽的に算出されない場合があっても、算出は知覚(音響心理学的)ラウドネス領域を拠点とするものである。陽的な特定ラウドネスがあるか、又は概念的、陰的な特定ラウドネスがあるかのいずれかがある。同様に、陽的な目標特定ラウドネス623があるか、又は概念的、陰的な目標特定ラウドネス623があるかのいずれかがある。いずれの場合でも、変更パラメータの算出は、特定ラウドネスと目標特定ラウドネス623との間の差を縮小するべくオーディオ信号を変更する変更パラメータを生成することを追求するものである。
変更パラメータ619は、信号変更経路601によってオーディオ信号(または前処理済みオーディオ信号)に適用されると、結果として生じる変更済みオーディオの部分特定ラウドネスと目標特定ラウドネス623との間の差を縮小する。理想的には、変更済みオーディオ信号615の部分特定ラウドネスは目標特定ラウドネス623をよく近似するかまたはそれと同じになる。
ある実施形態では、前処理は、例えばフィルタバンクを用いて、オーディオ信号を複数の周波数帯域に分離する。このような実施形態では、変更パラメータ619は、後により詳細に記載される例におけるように、603内でフィルタバンクから導出される周波数帯域に適用される時間変化ゲインファクタの形をとればよい。代替の実施形態では、変更パラメータ619は時間変化フィルタの係数に適用される。それに応じて、図6Aの例において、信号変更経路601は、例えば或る周波数帯域内で各々動作する複数の振幅スケーラ、または時間変化フィルタ、例えばマルチタップFIRフィルタまたは多極IIRフィルタとして実装されればよい。
特定ラウドネスまたは部分特定ラウドネスを求める際に重要または不可欠というものではないが、ある実施形態では、特定ラウドネスを算出するブロック605において、上述の国際公開第2004/111964号において説明されている技法であって、算出が、2つ以上の特定ラウドネスモデル関数のグループから、特定ラウドネスモデル関数のうちの1つまたはその2つ以上の組み合わせを選択し、その選択は入力オーディオ信号の特性の指標によって制御される、技法を用いるものがある。
本発明のさらなる態様によれば、未変更オーディオ信号611、ならびに(1)変更パラメータ619または(2)目標特定ラウドネス623もしくは目標特定ラウドネス623の表現、例えば、目標特定ラウドネス623を陽的または陰的に算出する際に利用可能なスケールファクタのうちのいずれかは、例えば時間的及び/又は空間的に分離したデバイスまたはプロセスにおける利用のために、記憶されるかまたは送信されればよい。変更パラメータ、目標特定ラウドネス623、または目標特定ラウドネス623の表現は任意の適切な方法で求められればよい。実際には、図6Aの例におけるもの等のフィードフォワード機構が最も複雑さが低く且つ最も高速である。なぜなら、それは変更済みオーディオ信号615に基づいた算出を避けるからである。
図7に、前処理において入力オーディオを周波数帯域群に分離するフィードフォワード機構を備える本発明の態様の一実施形態例の詳細を示す。実際の実施形態では、オーディオの処理はデジタル領域において実行され、従って、アナログ信号のサンプリング及びデジタル化が実行される。このような詳細は本記載からは外されているが、当業者には明らかであろう。
オーディオ611はまず、オーディオ信号を複数の周波数帯域に分割する分析フィルタバンク関数またはデバイス703に通される。これは本実施形態例での前処理603である。図7における太線は複数の信号を示しており、従って各々は分析フィルタバンク703からの周波数帯域である複数の出力である。これらの周波数帯域の各々は、図示されている様々な処理ステップを受け、合成フィルタバンク723に至り、合成フィルタバンク723は帯域を結合広帯域信号に合計して変更済みオーディオ信号615を生成する。
分析フィルタバンク703内の各周波数帯域に関連付けられるフィルタの応答は、人間の内耳内の基底膜の特定の場所における応答を模擬するように設計される。ある実施形態では、分析フィルタバンク703には、等価矩形帯域幅(equivalent rectangular bandwidth、ERB)の周波数スケール上で帯域幅及び間隔が一定である線形フィルタのセットが含まれる。
分析フィルタバンク703は、短時間離散フーリエ変換(短時間DFT、STDFT)または変形離散コサイン変換(変形DCT、MDCT)を用いることによって効率的に実行されればよい。STDFTまたはMDCTは合成フィルタバンク723の実行に同様に用いられればよい。
分析フィルタバンク703内の各フィルタの出力は次に、人間の外耳及び中耳を通じたオーディオの伝導のフィルタリング効果を模擬するように設計される伝導フィルタ関数またはデバイス705内に進む。
入力オーディオ信号のラウドネスを計算するために、分析フィルタバンク703の各フィルタ内の、伝導フィルタ705の適用後のオーディオ信号の短時間エネルギーの指標が得られる。この時間且つ周波数変化指標は励振と呼ばれ、E[b,t]と示される。ここで、bは周波数帯域を示し、tは時間を示す。励振を得るために、伝導フィルタ705の出力は次に励振関数またはデバイス707内に進む。励振関数またはデバイス707の出力は、人間の耳の基底膜に沿ったエネルギーの分布を模擬するように設計される。所望の効果に応じて、励振エネルギー値は、処理の所望の効果の要求に従って設定される時間定数を有するように設計される平滑化関数またはデバイス709によって、時間にわたって平滑化されればよい。励振関数707の出力は、bと示されるそれぞれのERB帯域内の、tと示される時間当たりのEと示されるエネルギーの周波数領域表現である。
特定ラウドネス関数またはデバイス711が、平滑化された励振信号を特定ラウドネス(specific loudness、SL)に変換する。特定ラウドネスは、例えば、単位周波数当たりのソーン単位、例えば、ERB当たりのソーン、で表現されればよい。特定ラウドネスから、全体または総合ラウドネスは、全帯域bにわたる特定ラウドネスの合計となることに留意されたい。特定ラウドネス関数711の設計には、楽音及び雑音についてのラウドネスの増大に関する実験データに一致するように選定される、狭帯域及び広帯域の推定値のためのゲインを求めることが含まれる。さらに、特定ラウドネス関数711は、励振が最小可聴域値にあるときは特定ラウドネスがゼロの代わりに或る小さな値となるように、及び励振がゼロまで減少するにつれて特定ラウドネスがゼロまで単調減少するように設計される。励振E[b,t]の、N[b,t]と示される特定ラウドネスへの変換は、本願明細書においてΨ{・}によって示される関数によるものであり、従って、特定ラウドネスはN[b,t]=Ψ{E[b,t]}となる。
処理の特定の所望の効果または効果群に応じて、周波数帯域に関連付けられる特定ラウドネス成分は、目標特定ラウドネスを生成する特定ラウドネス変更関数、またはデバイス713に送られる。図6Bを参照して、上述のように、ある実施形態ではその目標特定ラウドネスは、処理の所望の効果に従う、入力オーディオの特定ラウドネスの関数である。目標特定ラウドネスは、例えば音量制御のスケールファクタを用いて算出することができる。自動ゲイン制御(automatic gain control、AGC)の場合、またはダイナミックレンジ制御(dynamic range control、DRC)の場合については、所望の出力ラウドネスの、入力ラウドネスに対する比を用いて目標特定ラウドネスを算出すればよい。1つの実施形態でには、全ての帯域についてDRCを実施する代わりに、1つの帯域から次の帯域へ適用されるDRCの量が急激に変化しないように、N[b,t]で表される特定ラウドネスを帯域にわたって実施し平滑化する。
ダイナミックイコライゼーション(DEQ)の場合は、流れているオーディオのスペクトルを考慮した関係を用いて目標特定ラウドネスを算出する。具体的には、信号のスペクトルを測定し、次に信号を動的に変更して、測定されたスペクトルを、EQ[b]と呼ばれ、帯域bにわたって規定される基本的に静的な所望の形状に変換する。オーディオ信号のスペクトル形状はL[b,t]によって表され、1つの実施形態では、N[b,t]と示される特定ラウドネスの、時間にわたる平滑化として求められる。マルチバンドDRCと同様に、DEQ変更が1つの帯域から次へ急激に変化してほしくない場合があるため、帯域平滑化されたスペクトルを生成するために帯域平滑化関数を適用する。オーディオの元のダイナミックレンジを保存するために、所望のスペクトルEQ[b]は、L[b,t]によって与えられる測定スペクトル形状と同じ全体ラウドネスを有するように正規化されなければならない。1つの実施形態では、パラメータ、例えば値0がDEQ無しを示すものとして、適用されるDEQの量を表す0から1まで変化するパラメータが指定される。従って、SL変更713は各帯域とは独立に動作する場合もあるし、あるいは帯域同士の間または帯域群の中に相互依存性が存在する場合もある。
この実施形態には、ブロック703、705、707及び709の操作に対応する方法での、分析フィルタバンク733、伝導フィルタ735、励振737及び平滑化739による雑音励振の測定も含まれる。雑音励振は、平滑化709からのオーディオの励振及びSL変更713からの目標特定ラウドネスとともに、ゲインソルバ631に送られる。
平滑器709からの平滑化された励振周波数帯域成分、平滑器739からの平滑化された励振周波数帯域成分、及びSL変更713からの目標特定ラウドネス623をその入力として取り込むゲインソルバ関数またはデバイス715が、求められた部分特定ラウドネスを目標特定ラウドネス623に変換するために、各帯域に適用する必要があるゲインを求めるように構成される。求められるゲインは一般的に周波数且つ時間変化ゲインであり、そこれらのゲインがオーディオ入力及び雑音の元の励振に適用されると、理想的には所望の目標特定ラウドネスに等しい部分特定ラウドネスを生じさせ、実際には部分特定ラウドネスと目標特定ラウドネスとの間の差を縮小するためにオーディオ信号を変更する結果となる。ゲインソルバ515は様々な方法で実行されればよい。閉じた計算が可能な場合は、それが適用される。テーブル索引が可能な場合は、そのようなテーブル索引が用いられてもよい。1つの実施形態では、ゲインソルバは、反復ごとにゲインの現在の推定値を用いて部分特定ラウドネスが評価される反復プロセスを含むものであればよい。結果として生じる部分特定ラウドネスは所望の目標と比較され、ゲインは誤差に基づいて反復的に更新される。このような反復的方法は、国際公開第2004111964号として公開されている上述の国際特許出願において開示されている。特定ラウドネス及び目標特定ラウドネスの陽的または陰的いずれかの計算を通じて変更パラメータを計算する他の方法が考案されてもよく、本発明はそのような方法を全て範囲に含むことを意図している。
ゲインソルバ715によって生成された帯域当たりのゲインは、知覚アーチファクトを最小限に抑えるために任意の平滑化関数またはデバイス719によって時間にわたってさらに平滑化される。代替的に、時間的平滑化がプロセスまたはデバイス全体内の他所で適用されることが有利である場合がある。
最後に、ゲインソルバ715によって求められたゲインは、各乗算結合関数または結合器721を通じてそれぞれの帯域に適用される。乗算結合関数または結合器721は、ゲインを分析フィルタバンクからの遅延された出力に適用する。分析フィルタバンクからの出力はゲイン計算に関連付けられる任意のレイテンシを補償するように構成されたデバイス725又は適切な遅延関数によって遅延されている。
変更済みオーディオ615は、合成フィルタバンク関数またはデバイス723内のゲイン変更された帯域から合成される。上述のように、分析フィルタバンク703は短時間DFTまたは変形DCTを利用することによって効率的に実行されればよく、STDFTまたはMDCTは合成フィルタバンク723の実行に同様に用いられればよい。各帯域の合成フィルタは、分析フィルタバンク703内で用いられるフィルタ、及び遅延725の遅延から決定される。
あるいは、周波数帯域におけるゲイン変更を行うために利用するゲインを算出する代わりに、ゲインソルバ715はマルチタップFIRフィルタまたは多極IIRフィルタ等の時間変化フィルタを制御するフィルタ係数を算出してもよいことに留意されたい。説明を簡潔にするために、本発明の態様では、主に周波数帯域に適用されるゲインファクタを用いる場合について説明しているが、実際の実施形態ではフィルタ係数及び時間変化フィルタが用いられてもよいことは理解されよう。
雑音補償のために、G[b,t]で表されるゲインソルバからのゲインは、干渉雑音の存在下における処理済みオーディオの特定ラウドネスが目標特定ラウドネスに等しいか、又はそれに近くなる。この効果を得るためには、部分ラウドネスのコンセプトを用いればよい。E[b,t]は雑音からの励振を表し、E[b,t]は雑音のないオーディオからの励振を表す。オーディオ及び雑音の結合特定ラウドネスは次式によって与えられる。
Tot[b,t]=Ψ{E[b,t]+E[b,t]}
ここで、再び、Ψ{・}は励振から特定ラウドネスへの変換を示す。聴取者の聴覚が、結合特定ラウドネスを、結合特定ラウドネスを保存する様式で、オーディオの部分特定ラウドネスと雑音の部分特定ラウドネスとの間で仕切ると仮定してよい。ここで、N[b,t]と表されるオーディオの部分特定ラウドネスが、制御したい値であり、従ってこの値について解かなければならない。国際公開第2006047600号及び国際公開第2007120453号が、E[b,t]、NTot[b,t]、雑音の存在下におけるマスキングされた閾値、及び静音における、帯域bにおける最小可聴域値から雑音の部分特定ラウドネスがどのように近似されればよいかを記載しており、オーディオの励振が雑音のマスク閾値に等しいとき、オーディオの部分特定ラウドネスは、静音における閾値にある信号のラウドネスに等しく、オーディオの励振が雑音のものよりもはるかに大きいとき、オーディオの特定ラウドネスは、雑音がないとした場合のものに大体等しいという特性を持つ、オーディオの部分特定ラウドネスN[b,t]のための式に達することができる。換言すると、オーディオが雑音よりもはるかに大きくなると、雑音はオーディオによってマスキングされる。式には、雑音内の楽音のラウドネスに関するデータに信号対雑音比の関数としてぴったり合うように経験的に選定されることができる指数値が含まれる。雑音のマスキングされた閾値は、雑音励振自身の関数として近似されればよい。
雑音補償の場合、変更されたゲインソルバを用いて、雑音の存在下における処理済みオーディオの部分特定ラウドネスが目標特定ラウドネスに等しいかまたはそれに近くなるようにゲインG[b,t]を算出する。
最も基本的な動作モードでは、図7におけるSL変更713は目標特定ラウドネスをオーディオN[b,t]の元の特定ラウドネスに単に等しく設定すればよい。換言すると、SLの変更は、周波数不変のスケールファクタによるオーディオ信号の特定ラウドネスのスケーリングを提供する。図7の機構等を用いて、雑音の存在下における処理済みオーディオの知覚されるラウドネススペクトルが、雑音の不在下におけるオーディオのラウドネススペクトルに等しくなるようにしてゲインを算出する。さらに、音量制御、AGC、DRC及びDEQを含む目標特定ラウドネスを元のものの関数として計算する上述の技法のうちの任意の1つまたはそれらの組み合わせを、雑音補償ラウドネス変更システムと併せて用いてもよい。
実際の実施形態では、雑音の測定は、オーディオが再生される場になる環境内またはその付近に設けられるマイクロホンから得られればよい。本発明の1つの態様では、雑音の測定は、再生用資源制約デバイスではなく、信号処理が行われるシステム内のネットワーク要素に結合されたセンサによって行われる。
図6A〜4Bを図7と比較すると、前処理ブロック603は分析フィルタバンク703によって実行され、オーディオの変更は遅延725、ゲイン乗算721及び合成フィルタバンクの組み合わせによって実行される。特定ラウドネスを算出するブロック605は伝導フィルタ705、励振707、平滑化709及び特定ラウドネス関数711の組み合わせによって実行される。変更パラメータの算出はゲインG(b,t)を算出し、雑音補償がない場合はゲインソルバ715によって、任意に平滑化719と組み合わせて実行される、ならびに、ゲインソルバ715によって、分析フィルタバンク733、伝導フィルタ735、励振737、平滑化739及び特定ラウドネス関数611と組み合わせて、及び任意に平滑化719と組み合わせて実行される。種々の適用例において、図6Bに示す目標特定ラウドネスの算出631は、特定ラウドネス変更ブロック713によって実行される。
雑音補償が、場合により音量制御、AGC、ダイナミックレンジ制御及び/又はダイナミックイコライゼーションのうちの1つ以上とともに、本願明細書においてある程度詳しく記載されているが、これは、本発明が限定される信号処理の形式を限定することを意味されるものでは決してない。本発明は、メディアデータをレンダリングするべくあるいは処理及びレンダリングするべく資源制約デバイスによって利用可能な処理済み出力を生成するために、資源制限デバイスの環境に関連するが資源制限デバイスからは離れて得られる情報を用いた処理に十分な資源が1つ以上利用可能なネットワーク要素において上流で有利に実行されることができる、メディアデータに対する信号処理操作に適用可能である。
上述の記載ならびに国際公開第2004111994号及び国際公開第2006047600号は、特定ラウドネスを求めるいくつかの方法を記載しているが、特定ラウドネスを求めるための他の方法も知られていることに留意されたい。例えば、国際公開第2007120453号を参照されたい。
1つの実施形態では、コンピュータ可読媒体が、プログラム論理、例えば、少なくとも1つのプロセッサによって実行されると本願明細書において記載されている方法の方法ステップのセットを実行させる命令のセット、を用いて構成される。
一般的な業界用語に従い、「基地局」、「アクセスポイント」及び「AP」の用語は、複数の他の電子デバイスと無線で且つ実質的に同時に通信することができる電子デバイスを表すために本願明細書において同義で用いられ、一方、「クライアント」、「移動デバイス」「携帯デバイス」及び「資源制約デバイス」の用語は、メディアデータをレンダリングする能力を有する複数の他の電子デバイスのいずれかを表すために同義で用いられる。ただし、本発明の範囲は、これらの用語で表されるデバイスに限定されるものではない。
本文書の文脈の中では、「無線」の用語及びその派生語は、非固体媒質を介する変調電磁放射線を利用してデータを通信すればよい回路、デバイス、システム、方法、技法、通信チャンネル等を記載するために用いられればよい。用語は、関連デバイスが線材を全く含まないことを含意するものではない。ただし、実施形態によっては全く含まない場合もある。
特に別に断らない限り、以下の説明から明らかなように、明細書全体を通じて「処理する」、「計算する」、「算出する」、「求める」または同様のもの等の用語を利用する説明が、コンピュータまたは計算システム、あるいは同様の電子計算デバイスの、電子量等の物理量として表現されるデータを、物理量として同様に表現される他のデータに加工及び/又は変換するアクション及び/又はプロセスを指すことは理解されよう。
同様に、「プロセッサ」の用語は、例えばレジスタ及び/又はメモリなどからの電子データを処理し、その電子データを例えばレジスタ及び/又はメモリなどの中に記憶されればよい他の電子データに変換する任意のデバイスまたはデバイスの部分を指すものであればよい。「コンピュータ」あるいは「計算機」または「計算プラットフォーム」とはプロセッサを少なくとも1つ含むものであればよい。
いくつかの要素、例えばいくつかのステップを含む方法が記載されるとき、特に断らない限り、このような要素の順序付け、例えばステップの順序付け、は含意されていないことに留意されたい。
本願明細書において記載されている手法は、1つの実施形態では、1つ以上のコンピュータ可読媒体上で具体化されるコンピュータ実行可能(機械実行可能とも呼ばれる)プログラム論理を受け取る1つ以上のプロセッサによって実施可能である。プログラム論理は、プロセッサのうちの1つ以上によって実行されると本願明細書において記載されている方法のうちの少なくとも1つを実行する命令のセットを含む。取るべきアクションを指定する命令のセット(順次または他の形式)を実行する能力がある任意のプロセッサが含まれる。従って、1つの例は、1つのプロセッサまたはそれを超えるプロセッサを含む典型的な処理システムである。各プロセッサはCPU、グラフィックス処理ユニット及びプログラム可能DSPユニットのうちの1つ以上を含むものであればよい。処理システムはメインRAM及び/又はスタティックRAM、ならびに/あるいはROMを含むメモリサブシステムを含む記憶サブシステムをさらに含んでよい。記憶サブシステムは他の記憶デバイスを1つ以上さらに含んでよい。コンポーネント同士の間の通信のためにバスサブシステムが含まれればよい。処理システムはさらに、ネットワークによって結合されるプロセッサを備える分散処理システムであってもよい。処理システムがディスプレイを必要とする場合は、そのようなディスプレイ、例えば、液晶ディスプレイ(liquid crystal display、LCD)または陰極線管(cathode ray tube、CRT)ディスプレイ、が含まれればよい。手作業のデータ入力が必要とされる場合は、処理システムはキーボード等の英数字入力ユニット、マウス等のポインティング制御デバイスなどのうちの1つ以上等の入力デバイスも含む。本願明細書において用いられるような記憶デバイス、記憶サブシステム等のユニットの用語は、文脈から明らかである場合、及び明示的に別に断らない限り、ディスクドライブユニット等の記憶デバイスも包含する。一部の構成における処理システムは音声出力デバイス及びネットワークインターフェースデバイスを含んでよい。従って、記憶サブシステムは、1つ以上のプロセッサによって実行されると本願明細書において記載されている方法のうちの1つ以上を実施させる命令のセットを含むプログラム論理(例えばソフトウェア)を保持するコンピュータ可読媒体を含む。プログラム論理はハードディスク内にあってもよいし、あるいは処理システムによるその実行中はRAM内に及び/又はプロセッサ内に、完全にまたは少なくとも部分的に、あってもよい。従って、メモリ及びプロセッサも、プログラム論理が例えば命令の形でエンコードされるコンピュータ可読媒体の構成要素となる。
さらに、コンピュータ可読媒体がコンピュータプログラム製品を形成するかまたはその中に含まれてもよい。
代替の実施形態では、1つ以上のプロセッサは単独のデバイスとして動作するか、あるいは、他のプロセッサ(単数または複数)に接続される、例えば、ネットワーク配置内でネットワーク接続されてもよく、1つ以上のプロセッサはサーバ−クライアントネットワーク環境内のサーバもしくはクライアント機械の容量内で、またはピアツーピアまたは分散ネットワーク環境内のピアマシンとして動作すればよい。1つ以上のプロセッサは、パーソナルコンピュータ(personal computer、PC)、タブレットPC、セットトップボックス(set−top box、STB)、パーソナルデジタルアシスタント(Personal Digital Assistant 、PDA)、携帯電話、ウェブ機器、ネットワークルータ、スイッチまたはブリッジ、あるいは当該機械によって取られるべきアクションを指定する命令のセット(順次または他の形式)を実行する能力がある任意の機械を形成するものであればよい。
いくつかの図(単数または複数)は単一のプロセッサ、及び命令を含む論理を保持する単一のメモリしか示していないが、当業者は、上述のコンポーネントは多数含まれるが、本発明の態様をわかりにくくしないようにするために明示的には示されていないまたは記載されていないことを理解しようことに留意されたい。例えば、単一の機械しか図示されていないが、「機械」の用語は、本願明細書において説明される手法のうちの任意の1つ以上を実施する命令のセット(または複数のセット)を個別にまたは合同で実行する機械の任意の集合を含むものとも見なされなければならない。
従って、本願明細書において記載されている方法の各々の1つの実施形態は、信号処理装置の一部である1つ以上のプロセッサなどの1つ以上のプロセッサの上での実行のためのコンピュータプログラムなどの命令のセットで構成されるコンピュータ可読媒体の形態とされている。従って、当業者によって理解されるように、本発明の実施形態は、方法、専用装置等の装置、データ処理システム等の装置、またはコンピュータ可読媒体、例えばコンピュータプログラム製品、として具体化されればよい。コンピュータ可読媒体は、1つ以上のプロセッサ上で実行されると方法ステップを実行させる命令のセットを含む論理を保持する。よって、本発明の態様は、方法、完全にハードウェアの実施形態、完全にソフトウェアの実施形態あるいはソフトウェア及びハードウェアの態様を組み合わせる実施形態の形をとってよい。さらに、本発明は、コンピュータ可読記憶媒体上のコンピュータプログラムなど、コンピュータ可読媒体などにあるプログラム論理、またはコンピュータプログラム製品などのコンピュータ可読プログラムコードで構成されるコンピュータ可読媒体の形をとってもよい。
コンピュータ可読媒体は実施形態例において単一の媒体であるように示されているが、「媒体」の用語は、命令のセットを1つ以上記憶する単一の媒体または複数の媒体(例えば集中または分散データベースならびに/あるいは関連キャッシュ及びサーバ)を含むものと見なされなければならない。「コンピュータ可読媒体」の用語は、プロセッサのうちの1つ以上のものによる実行用のものであって、本発明の手法のうちの任意の1つ以上のものの実行をさせる命令のセットを記憶、エンコードする能力があるかまたはさもなければそれで構成される任意のコンピュータ可読媒体を含むものとも見なされなければならない。コンピュータ可読媒体とは、不揮発性媒体及び揮発性媒体を含む、ただしそれらに限定されるものではない、多くの形態をとってよいものである。不揮発性媒体としては、例えば、光学、磁気ディスク及び磁気光学ディスクが挙げられる。揮発性媒体としては、主メモリ等のダイナミックメモリが挙げられる。
説明されている方法のステップは、1つの実施形態では、記憶内に記憶されている命令を実行する処理システム(例えばコンピュータシステム)の適当なプロセッサ(またはプロセッサ群)によって実施されることは理解されよう。本発明の実施形態はいかなる特定の実装またはプログラミング技法にも限定されるものではないこと、ならびに、本発明は、本願明細書において記載されている機能性を実行するための任意の適当な技法を用いて実行されればよいことも理解されよう。さらに、実施形態はいかなる特定のプログラミング言語またはオペレーティングシステムにも限定されるものではない。
本明細書全体を通じ、「1つの実施形態」または「一実施形態」への言及は、実施形態に関連して記載される特定の特徴、構造または特性が本発明の少なくとも1つの実施形態内に含まれることを意味する。従って、本明細書全体を通じた様々な箇所における「1つの実施形態」または「一実施形態」の語句の出現は、そういう場合もあるが、必ずしも全てが同じ実施形態に言及しているわけではない。さらに、特定の特徴、構造または特性は、本開示から当業者には明らかであろうように、1つ以上の実施形態内で任意の適切な様式で組み合わせられてよい。
同様に、本発明の実施形態例の上述の記載では、開示を簡素化し、種々の本発明の態様のうちの1つ以上のものの理解を助ける目的のために、本発明の種々の特徴が、単一の実施形態、図、またはその説明内にまとめられていることがあることを理解されたい。しかし、この開示方法は、請求されている発明が、各請求項において明示的に記載されているよりも多くの特徴を必要とするという意図を反映するものとして解釈されるべきではない。むしろ、添付の請求項が反映している通り、発明の態様は、先に開示されている単一の実施形態の全ての特徴よりも少ない特徴内に存する。それ故、発明を実施するための形態に続く請求項は、本願明細書によって、この発明を実施するための形態に明示的に組み込まれ、各請求項はそれ自体で本発明の独立した実施形態として存在する。
さらに、本願明細書において記載されているいくつかの実施形態は、他の実施形態内に含まれる特徴を一部含むものの他の特徴は含まないというふうになっているが、当業者によって理解されよう通り、異なる実施形態の特徴の組み合わせが本発明の範囲内にあるように意図され、異なる実施形態を形成する。例えば、添付の請求項では、請求されている実施形態のうちの任意のものが任意の組み合わせで用いられることができる。
さらに、実施形態のうちのいくつかは、本願明細書において、コンピュータシステムのプロセッサによってまたはその機能を実行する他の手段によって実行されることができる方法、または方法の要素の組み合わせとして記載されている。従って、このような方法、または方法の要素を実行するために必要な命令を備えたプロセッサが、方法、または方法の要素を実行する手段を形成する。さらに、本願明細書において記載されている、装置実施形態の要素が、本発明を実行する目的のために要素によって実施される機能を実行する手段の例である。
本願明細書において提供されている記載では、数多くの具体的詳細が説明されている。しかし、これらの具体的詳細を用いずに本発明の実施形態が実施されてもよいことは理解されよう。他の例では、本記載の理解を曖昧にしないようにするために、周知の方法、構造及び技法が詳細に示されていない。
本願明細書において用いられるように、別に指定されない限り、共通の物を記述するための、順序を示す形容詞「第1の」、「第2の」、「第3の」等の使用は、同様の物の異なる例が言及されていることを単に示すだけのものであり、そのように記述されている物が、時間的に、空間的に、順位において、または任意の他の様式のいずれかによって、所与の順序になっていなければならないことを示唆するように意図されるものではない。
本明細書における、従来技術のいかなる説明も、このような従来技術が周知のものであること、公知のものであること、または本分野における一般知識の一部を形成することの承認とは決して見なされてはならない。
添付の請求項及び本願明細書における記載では、〜を備える(comprising)、〜が備えられる(comprised of)または〜を備える〜(which comprises)という用語はいずれも、後に続く要素/特徴を少なくとも含むが、その他を除外するものではないことを意味する非限定語(open term)である。それ故、〜を備える(comprising)の用語は、請求項において用いられる場合、その後に列挙される手段または要素あるいはステップに限定するものとして解釈されてはならない。例えば、A及びBを備えるデバイスという表現の範囲は、要素A及びBのみから成るデバイスに限定されてはならない。本願明細書において用いられているような、〜を含む(including)あるいは〜を含む〜(which includes)または〜を含む〜(that includes)という用語もいずれも、用語の後に続く要素/特徴を少なくとも含むが、その他を除外するものではないことを同様に意味する非限定語である。従って、〜を含む(including)は〜を備える(comprising)と同義でありそれを意味するものである。
同様に、結合される(coupled)という用語は、請求項において用いられる場合、直接的な接続のみに限定するものとして解釈されてはならないことに注意されたい。「結合される(coupled)」及び「接続される(connected)」という用語、ならびにそれらの派生語が用いられる場合がある。これらの用語は互いに対する同義語として意図されるものではないことを理解されたい。従って、デバイスBに結合されるデバイスAという表現の範囲は、デバイスAの出力がデバイスBの入力に直接接続されるデバイスまたはシステムに限定されてはならない。それは、Aの出力とBの入力との間に、他のデバイスまたは手段を含む経路であってもよい経路が存在することを意味するものである。「結合される(Coupled)」は2つ以上の要素が直接的な物理的接触または電気的接触のいずれかの接触をしていること、あるいは2つ以上の要素は互いに直接接触してはいないが、それでもなお、互いに協働または相互作用することを意味するものであればよい。
従って、本発明の好ましい実施形態と考えられるものが記載されているが、当業者は、本発明の精神から逸脱することなく他の及びさらなる変更がそれになされてよいこと、ならびに、このような変化及び変更は全て本発明の範囲内に入るものとして請求することが意図されていることを理解しよう。例えば、上述の式はいずれも、用いられればよい手続きの代表にすぎない。ブロック図から機能性が追加または削除されてもよいし、機能ブロック群の中で操作が入れ替えられてもよい。記載されている方法に本発明の範囲内でステップが追加または削除されてもよい。

Claims (14)

  1. オーディオデータおよび/またはビデオデータを含むメディアデータを、品質向上処理を行うために処理ハードウェア(111、143)により処理する方法であって、前記メディアデータは無線ネットワーク(103、121)内の電池駆動式および/または計算処理能力が制限された無線メディアレンダリングデバイス(121)によるによるレンダリング用のメディアデータであり、前記方法
    ネットワークノード(103)において前記メディアデータを受信するステップと;
    前記メディアレンダリングデバイス(121)が無線で結合された前記ネットワークノード(103)において、前記メディアレンダリングデバイス(121)の中でもでもなく、前記メディアレンダリングデバイスの近傍に設置された1つ以上のセンサ(109)が検知した1つ以上の検知環境量を受け取るステップであって、前記検知環境量が前記メディアレンダリングデバイス(121)の環境に関するものであるステップと;
    前記ネットワークノード(103)において、前記環境量を用いて前記メディアデータをデータ処理し処理済みデータを生成するステップと;
    前記処理済みデータをレンダリングのために前記メディアレンダリングデバイス(121)へ無線で送るステップと;を備え、
    前記メディアデータに含まれる任意のオーディオデータについて、前記1つ以上の環境量に、前記環境内の雑音の音響プロファイルの指標となる少なくとも1つの量が含まれ、前記データ処理に雑音補償が含まれ、及び/又は
    前記メディアレンダリングデバイスにストリーミングされる前記メディアデータ内に含まれる任意のビデオデータについて、前記1つ以上の環境量に、前記環境内の照明の指標となる1つ以上のパラメータが含まれ、ここで、前記メディアレンダリングデバイスは、前記ビデオデータとともに前記メディアレンダリングデバイスに送られる画像依存調節データに従って各々調節される位置依存性バックライト素子を有するフラットパネルディスプレイデバイスを備え、
    前記品質向上処理には、前記ビデオデータのコントラスト及び/または明るさを変更するステップが含まれ、
    前記ネットワークノードにおける前記データ処理に、前記環境内の照明の指標となる1つ以上のパラメータのうちの少なくとも1つによって前記画像依存調節データを生成するステップが含まれることを特徴とする
    方法。
  2. 前記ネットワークノードに無線ネットワークの基地局が含まれることを特徴とする
    請求項1に記載の方法。
  3. 前記処理済み出力に、前記メディアレンダリングデバイスによるレンダリング用の処理済みメディアデータが含まれることを特徴とする
    請求項1に記載の方法。
  4. 一部のメディアデータ処理が前記メディアレンダリングデバイスにおいて行われ、前記処理済み出力に、前記メディアレンダリングデバイスでのメディアデータ処理の際に前記メディアレンダリングデバイスによって用いられる補助データが含まれることを特徴とする
    請求項1に記載の方法。
  5. 前記メディアデータに:
    前記メディアレンダリングデバイスにストリーミングされるメディアデータ、または
    前記無線ネットワークを介して、前記メディアレンダリングデバイスを含む相方向通信の一部としての前記メディアレンダリングデバイスにインタラクティブにストリーミングされるメディアデータ、
    のうちの1つ以上が含まれることを特徴とする
    請求項1から4のいずれか1項に記載の方法。
  6. 前記メディアデータにオーディオデータが含まれ、
    前記1つ以上の環境量に、環境内の雑音の音響プロファイルの指標となる少なくとも1つの量が含まれ、
    前記品質向上処理に雑音補償が含まれることを特徴とする
    請求項5に記載の方法。
  7. 前記メディアデータにオーディオデータが含まれ、
    前記1つ以上の環境量に、環境内の雑音の音響プロファイルであって、前記雑音のスペクトル推定値を含む音響プロファイルの指標となる少なくとも1つの量が含まれ、
    前記メディアデータの前記品質向上処理に雑音補償が含まれ、前記雑音補償は:
    1つ以上のラウドネスレベルパラメータと音響雑音プロファイルの1つ以上のパラメータとを用いて前記オーディオデータから変更パラメータを生成するステップであって、前記変更パラメータを、知覚ラウドネス領域における情報に対して操作を実行することによって生成するステップと、
    前記変更パラメータに基づいて前記オーディオデータを変更して処理済みオーディオデータを生成するステップと、
    を備え、
    前記1つ以上のラウドネスレベルパラメータに:オーディオ雑音補償スイッチがオンか否か、前記メディアレンダリングデバイスの参照レベル、所望の再現レベル、及び/または雑音補償の量のうちの1つ以上が含まれることを特徴とする
    請求項5に記載の方法。
  8. 前記メディアデータの前記品質向上処理に、前記オーディオデータに適用される自動ゲイン制御、ダイナミックレンジ圧縮及び/又はイコライゼーションのうちの1つ以上が含まれることを特徴とする
    請求項7に記載の方法。
  9. 前記メディアデータに、前記メディアレンダリングデバイスにストリーミングされるメディアデータが含まれ、
    前記メディアデータにビデオデータが含まれ、
    前記1つ以上の環境量に、環境内の照明の指標となる少なくとも1つのパラメータが含まれ、
    前記品質向上処理に、前記環境内の照明の指標となるパラメータのうちの1つ以上によって前記ビデオデータのコントラスト及び/または明るさを変更するステップが含まれることを特徴とする
    請求項5に記載の方法。
  10. 前記メディアデータに、前記メディアレンダリングデバイスにストリーミングされるメディアデータが含まれ、
    前記メディアデータにビデオデータが含まれ、
    前記1つ以上の環境量に、環境内の照明の指標となる少なくとも1つのパラメータが含まれ、
    前記メディアレンダリングデバイスは、前記ビデオデータとともに前記メディアレンダリングデバイスに送られる画像依存調節データに従って各々調節される位置依存性バックライト素子を有するフラットパネルディスプレイデバイスを備え、
    前記品質向上処理に、前記ビデオデータのコントラスト及び/または明るさを変更するステップが含まれ、
    前記ネットワークノードにおける前記データ処理に、前記環境内の照明の指標となる1つ以上のパラメータのうちの少なくとも1つによって前記画像依存調節データを生成するステップが含まれることを特徴とする
    請求項5に記載の方法。
  11. 処理システムの少なくとも1のプロセッサにより読み取り可能なプログラムであって、前記処理システムの少なくとも1のプロセッサによって実行されたとき、請求項1から10のいずれか1項に記載の方法を実行させることを特徴とするプログラム。
  12. 処理システムの少なくとも1のプロセッサにより読み取り可能なプログラムの記録媒体であって、前記処理システムの少なくとも1のプロセッサによって実行されたとき、請求項1から10のいずれか1項に記載の方法を実行させるプログラムが記録されていることを特徴とする記録媒体。
  13. オーディオデータ及びビデオデータの少なくとも1以上を含むメディアデータの品質向上処理の少なくとも一部を実行するシステムであって、前記システム
    無線ネットワーク(103、121)内の電池駆動式及び/又は計算処理能力が制限された無線メディアレンダリングデバイス(121)に無線接続するように構成されるネットワークノード(103)と、
    前記メディアレンダリングデバイス(121)の中でもでもなく、前記メディアレンダリングデバイスの近傍に設置されるセンサであって、前記ネットワークノードに接続されるかまたはその中にあり、前記メディアレンダリングデバイス(121)の前記環境に関する1つ以上の環境量を検知する1つ以上のセンサ(109)と;
    前記ネットワークノードに接続されるかまたはその中にある処理ハードウェアであって、
    前記メディアデータを受信する操作の際に前記1つ以上の環境量を受け取り、受け取った環境量の少なくとも一部を用いて処理済み出力を生成することによりメディアデータのデータ処理を実行して品質向上を達成し、前記処理済み出力を前記メディアレンダリングデバイスによるレンダリングのために前記メディアレンダリングデバイスに無線で送る処理ハードウェア(111、143)と;
    を備え、
    前記メディアデータに含まれる任意のオーディオデータについて、前記1つ以上の環境量に、前記環境内の雑音の音響プロファイルの指標となる少なくとも1つの量が含まれ、前記データ処理に雑音補償が含まれ、及び/又は
    前記メディアレンダリングデバイスにストリーミングされる前記メディアデータに含まれる任意のビデオデータについて、前記1つ以上の環境量に、前記環境内の照明の指標となる1つ以上のパラメータが含まれ、前記メディアレンダリングデバイスは、前記ビデオデータとともに前記メディアレンダリングデバイスに送られる画像依存調節データに従って各々調節される位置依存性バックライト素子を有するフラットパネルディスプレイデバイスを備え、前記品質向上処理には前記ビデオデータの前記コントラストおよび/または明るさを変更することが含まれ、前記ネットワークノードにおける前記データ処理に、照明の指標となる1つ以上のパラメータのうちの少なくとも1つによって前記画像依存調節データを生成することが含まれることを特徴とする
    システム。
  14. 請求項1から10のいずれか1項に記載の方法を実行するように構成されたことを特徴とする
    請求項13に記載のシステム。
JP2011527869A 2008-09-19 2009-09-03 小型セル無線ネットワーク内のクライアントデバイスのための上流の信号処理 Expired - Fee Related JP5273688B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US9856608P 2008-09-19 2008-09-19
US61/098,566 2008-09-19
PCT/US2009/055835 WO2010033387A2 (en) 2008-09-19 2009-09-03 Upstream signal processing for client devices in a small-cell wireless network

Publications (2)

Publication Number Publication Date
JP2012503426A JP2012503426A (ja) 2012-02-02
JP5273688B2 true JP5273688B2 (ja) 2013-08-28

Family

ID=41818867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011527869A Expired - Fee Related JP5273688B2 (ja) 2008-09-19 2009-09-03 小型セル無線ネットワーク内のクライアントデバイスのための上流の信号処理

Country Status (8)

Country Link
US (1) US9300714B2 (ja)
EP (1) EP2347556B1 (ja)
JP (1) JP5273688B2 (ja)
CN (1) CN102160358B (ja)
AT (1) ATE552690T1 (ja)
ES (1) ES2385293T3 (ja)
TW (1) TWI458311B (ja)
WO (1) WO2010033387A2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5134508B2 (ja) * 2008-11-19 2013-01-30 株式会社日立製作所 テレビジョン装置
US9692946B2 (en) * 2009-06-29 2017-06-27 Dolby Laboratories Licensing Corporation System and method for backlight and LCD adjustment
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9837097B2 (en) 2010-05-24 2017-12-05 Nec Corporation Single processing method, information processing apparatus and signal processing program
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
US9413322B2 (en) * 2012-11-19 2016-08-09 Harman International Industries, Incorporated Audio loudness control system
KR102071860B1 (ko) * 2013-01-21 2020-01-31 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
EP2787746A1 (en) * 2013-04-05 2014-10-08 Koninklijke Philips N.V. Apparatus and method for improving the audibility of specific sounds to a user
JP2016520854A (ja) * 2013-03-21 2016-07-14 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
CN104080024B (zh) * 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
JP6204681B2 (ja) * 2013-04-05 2017-09-27 日本放送協会 音響信号再生装置
JP6216553B2 (ja) * 2013-06-27 2017-10-18 クラリオン株式会社 伝搬遅延補正装置及び伝搬遅延補正方法
WO2015068404A1 (ja) * 2013-11-11 2015-05-14 日本電気株式会社 Pos端末装置、商品認識方法及びプログラムが格納された非一時的なコンピュータ可読媒体
US10720091B2 (en) 2017-02-16 2020-07-21 Microsoft Technology Licensing, Llc Content mastering with an energy-preserving bloom operator during playback of high dynamic range video
US10833886B2 (en) * 2018-11-07 2020-11-10 International Business Machines Corporation Optimal device selection for streaming content
EP4046387A4 (en) * 2019-10-17 2023-11-15 D-Box Technologies Inc. METHOD AND SYSTEM FOR SYNCHRONIZING A VIEWER EFFECT SIGNAL OF MULTIMEDIA CONTENT WITH A MULTIMEDIA SIGNAL OF THE MULTIMEDIA CONTENT
CN113395551A (zh) * 2021-07-20 2021-09-14 珠海极海半导体有限公司 处理器、npu芯片和电子设备

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8801014D0 (en) * 1988-01-18 1988-02-17 British Telecomm Noise reduction
FR2640839B1 (fr) 1988-12-20 1991-03-15 Portenseigne Radiotechnique Appareil de reproduction d'image video muni d'un reglage de contraste, et procede de reglage du contraste d'un tel appareil de reproduction
US5802467A (en) * 1995-09-28 1998-09-01 Innovative Intelcom Industries Wireless and wired communications, command, control and sensing system for sound and/or data transmission and reception
JP3416469B2 (ja) * 1997-06-06 2003-06-16 三洋電機株式会社 基地局
WO1999014983A1 (en) 1997-09-16 1999-03-25 Lake Dsp Pty. Limited Utilisation of filtering effects in stereo headphone devices to enhance spatialization of source around a listener
CA2325482C (en) 1998-03-25 2009-12-15 Lake Technology Limited Audio signal processing method and apparatus
US6813777B1 (en) * 1998-05-26 2004-11-02 Rockwell Collins Transaction dispatcher for a passenger entertainment system, method and article of manufacture
US6249913B1 (en) * 1998-10-09 2001-06-19 General Dynamics Ots (Aerospace), Inc. Aircraft data management system
US7035897B1 (en) * 1999-01-15 2006-04-25 California Institute Of Technology Wireless augmented reality communication system
US20030154055A1 (en) * 2000-11-07 2003-08-14 Kazuyoshi Yoshimura System for measurement and display of environmental data
KR100476855B1 (ko) 2000-09-22 2005-03-17 세이코 엡슨 가부시키가이샤 화상처리방법
WO2002027985A2 (en) 2000-09-29 2002-04-04 Matsushita Mobile Communications Development Corp. Of U.S.A. Adjustable automatic volume control
JP2005508098A (ja) * 2000-10-18 2005-03-24 ハネウェル・インターナショナル・インコーポレーテッド モジュール式の娯楽及びデータ・システム
JP2002223268A (ja) * 2001-01-29 2002-08-09 Mitsubishi Electric Corp 音声制御装置およびこれを用いた携帯電話機
EP2312380B1 (en) 2001-02-27 2020-11-18 Dolby Laboratories Licensing Corporation A method and device for displaying an image
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7610602B2 (en) * 2001-05-23 2009-10-27 The Directv Group, Inc. Method, system and computer program product for aircraft multimedia distribution
DE60120233D1 (de) * 2001-06-11 2006-07-06 Lear Automotive Eeds Spain Verfahren und system zum unterdrücken von echos und geräuschen in umgebungen unter variablen akustischen und stark rückgekoppelten bedingungen
CA2354755A1 (en) * 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
US6944474B2 (en) * 2001-09-20 2005-09-13 Sound Id Sound enhancement for mobile phones and other products producing personalized audio for users
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
JP2004104245A (ja) * 2002-09-05 2004-04-02 Matsushita Electric Ind Co Ltd 携帯端末装置
JP2004173173A (ja) * 2002-11-22 2004-06-17 Matsushita Electric Ind Co Ltd 音声処理装置
US20040165732A1 (en) * 2003-02-20 2004-08-26 Edwards Systems Technology, Inc. Speaker system and method for selectively activating speakers
JP2004350214A (ja) * 2003-05-26 2004-12-09 Hitachi Ltd コンテンツ配信サーバ及び端末並びにプログラム
SG185134A1 (en) 2003-05-28 2012-11-29 Dolby Lab Licensing Corp Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
KR20060129046A (ko) 2004-03-02 2006-12-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 신호 처리 시스템
JP2008500779A (ja) * 2004-05-27 2008-01-10 タレス アビオニクス インコーポレイテッド 機内の乗客にマルチメディア・コンテンツを配信するシステム
FR2872317A1 (fr) 2004-06-08 2005-12-30 Do Labs Sa Procede pour ameliorer la qualite d'utilisation d'un service relatif a au moins une donnee multimedia
EP1774785B1 (en) * 2004-06-15 2011-11-16 Panasonic Avionics Corporation Portable media device and method for presenting viewing content during travel
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
CA2581810C (en) 2004-10-26 2013-12-17 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US20060176169A1 (en) * 2004-12-17 2006-08-10 The Regents Of The University Of California System for sensing environmental conditions
KR101251426B1 (ko) 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
TWI269565B (en) * 2005-07-20 2006-12-21 Cheng-Yan Kao Human body sensor network gateway (HBG) and the method using the same to perform human body network detecting
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
US20070044126A1 (en) * 2005-08-18 2007-02-22 Rockwell Collins, Inc. Wireless video entertainment system
US7936885B2 (en) * 2005-12-06 2011-05-03 At&T Intellectual Property I, Lp Audio/video reproducing systems, methods and computer program products that modify audio/video electrical signals in response to specific sounds/images
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
CN101421781A (zh) * 2006-04-04 2009-04-29 杜比实验室特许公司 音频信号的感知响度和/或感知频谱平衡的计算和调整
WO2007120452A1 (en) 2006-04-04 2007-10-25 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
CA2648237C (en) 2006-04-27 2013-02-05 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
US7459962B2 (en) * 2006-07-26 2008-12-02 The Boeing Company Transient signal detection algorithm using order statistic filters applied to the power spectral estimate
US7675414B2 (en) * 2006-08-10 2010-03-09 Qualcomm Incorporated Methods and apparatus for an environmental and behavioral adaptive wireless communication device
US20100062713A1 (en) 2006-11-13 2010-03-11 Peter John Blamey Headset distributed processing
US7873114B2 (en) * 2007-03-29 2011-01-18 Motorola Mobility, Inc. Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
WO2008134608A1 (en) * 2007-04-30 2008-11-06 Thales Avionics, Inc. Wireless audio distribution system and method for an in-flight entertainment system
US8489396B2 (en) * 2007-07-25 2013-07-16 Qnx Software Systems Limited Noise reduction with integrated tonal noise reduction
US8138930B1 (en) * 2008-01-22 2012-03-20 Google Inc. Advertising based on environmental conditions
WO2010033384A1 (en) * 2008-09-19 2010-03-25 Dolby Laboratories Licensing Corporation Upstream quality enhancement signal processing for resource constrained client devices
US20100088736A1 (en) * 2008-10-07 2010-04-08 Besen Peter D Enhanced video processing functionality in auxiliary system

Also Published As

Publication number Publication date
CN102160358B (zh) 2015-03-11
EP2347556B1 (en) 2012-04-04
EP2347556A2 (en) 2011-07-27
TW201025969A (en) 2010-07-01
US20110169721A1 (en) 2011-07-14
JP2012503426A (ja) 2012-02-02
CN102160358A (zh) 2011-08-17
WO2010033387A3 (en) 2010-05-27
ATE552690T1 (de) 2012-04-15
TWI458311B (zh) 2014-10-21
WO2010033387A2 (en) 2010-03-25
ES2385293T3 (es) 2012-07-20
US9300714B2 (en) 2016-03-29

Similar Documents

Publication Publication Date Title
JP5273688B2 (ja) 小型セル無線ネットワーク内のクライアントデバイスのための上流の信号処理
US9251802B2 (en) Upstream quality enhancement signal processing for resource constrained client devices
US20170223471A1 (en) Remotely updating a hearing aid profile
JP6377018B2 (ja) 可搬型メディア再生装置に関するオーディオ・システム等化処理
US9307340B2 (en) Audio system equalization for portable media playback devices
RU2658872C2 (ru) Модуль определения коэффициентов частотной корректирующей фильтрации, устройство, процессор коэффициентов частотной корректирующей фильтрации, система и способы
US8929567B2 (en) Equalization profiles for dynamic equalization of audio data
US10706869B2 (en) Active monitoring headphone and a binaural method for the same
US10757522B2 (en) Active monitoring headphone and a method for calibrating the same
TW201142831A (en) Adaptive environmental noise compensation for audio playback
TW201225518A (en) Dynamic compensation of audio signals for improved perceived spectral imbalances
CN1659927A (zh) 房间内扬声器声音的数字均衡方法及其使用
JP6821699B2 (ja) アクティブモニタリングヘッドホンとそれの反転を正則化する方法
TWI832942B (zh) 補償聽力測試之方法、裝置及系統
JP6695256B2 (ja) 仮想低音(bass)のオーディオ信号への付加

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121016

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130115

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130315

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130508

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees