JP2009080485A - オーディオ信号の適応変換装置及びその方法 - Google Patents

オーディオ信号の適応変換装置及びその方法 Download PDF

Info

Publication number
JP2009080485A
JP2009080485A JP2008259476A JP2008259476A JP2009080485A JP 2009080485 A JP2009080485 A JP 2009080485A JP 2008259476 A JP2008259476 A JP 2008259476A JP 2008259476 A JP2008259476 A JP 2008259476A JP 2009080485 A JP2009080485 A JP 2009080485A
Authority
JP
Japan
Prior art keywords
audio
user
audio signal
information
adaptive conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008259476A
Other languages
English (en)
Inventor
Je Ho Nam
ナム、ジェ、ホ
Hae Kwang Kim
キム、ヘ、クァン
Jae Jun Kim
キム、ジェ、ジュン
Jin Woo Hong
ホン、ジン、ウ
Jin-Woong Kim
キム、ジン、ウン
Hyoung Jun Kim
キム、ヒュン、ジュン
Nam Ik Cho
ジョ、ナム、イク
Rin Chul Kim
キム、リン、チョル
Man Bae Kim
キム、マン、ベ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics & Comm Res Inst
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics & Comm Res Inst
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics & Comm Res Inst, Electronics and Telecommunications Research Institute ETRI filed Critical Electronics & Comm Res Inst
Publication of JP2009080485A publication Critical patent/JP2009080485A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1101Session protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/756Media network packet handling adapting media to device capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/764Media network packet handling at the destination 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6377Control signals issued by the client directed to the server or network components directed to server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles

Abstract

【課題】マルチメディアソースで生成された1つのコンテンツを様々な使用環境のユーザ端末が該コンテンツを使用環境に合うように使用する。
【解決手段】オーディオ信号適応変換装置は、オーディオ信号をユーザ特性、端末器容量及びユーザの適応変換要請に応答するユーザ周辺環境を含む使用環境に合うように、ユーザの雑音環境情報と聴力特性及び選好情報を用いて一つのオーディオコンテンツを各々異なる使用環境と様々なユーザの特性と趣向に適合できるように適応、変換処理の可能な単一ソース複数使用環境を提供する。
【選択図】図1

Description

本発明はオーディオ信号の適応変換装置及びその方法に関し、さらに詳細には様々な使用環境、すなわち、ユーザ特性、ユーザ周辺環境及びユーザ端末能力に適合するようにオーディオ信号を適応変換させる装置及びその方法に関する。
MPEGは、MPEG-21の新しい標準作業項目(STANDARD WORKING ITEM)のデジタルアイテム適応変換(DIGITAL ITEM ADAPTATION,DIA)を提示した。デジタルアイテム(DIGITAL ITEM,DI)は、標準化された表現、識別及びメタデータを有する構造化されたデジタルオブジェクト(STRUCTURED DIGITAL OBJECT WITH A STANDARD REPRESENTATION,IDENTIFICATION AND META−DATA)を意味し、DIAは、DIがリソース適応変換エンジン(RESOURCE ADAPTATION ENGINE)または記述子適応変換エンジン(DESCRIPTOR ADAPTATION ENGINE)で処理されて適応変換されたDIを生成するプロセスを意味する。
ここでリソースは、ビデオまたはオーディオクリップ、イメージまたはテキスト項目のように個別的に識別可能な項目を意味し、物理的なオブジェクトを意味することができる。記述子は、DI内の項目またはコンポーネントに関連した情報を意味する。また、ユーザは、DIの生産者、権利者、分配者及び利用者などを全部含む。メディアリソースは、直接的にデジタル表現が可能なコンテンツを意味する。本明細書においてコンテンツという用語は、DI、メディアリソース及びリソースのような意味として使われる。
従来の技術によれば、オーディオコンテンツを使用する使用環境、すなわち、ユーザ特性、ユーザ周辺環境及びユーザ端末能力に対する情報を用いて一つのオーディオコンテンツを各々他の使用環境に適合できるように適応変換処理ができる単一ソース複数使用(Single−Source Multi−Use)環境が提供出来ないという問題点がある。
「単一ソース」とはマルチメディアソースで生成された1つのコンテンツを意味し、「複数使用」とは、様々な使用環境のユーザ端末が「単一ソース」を各々の使用環境に合うように使用することを意味する。
単一ソース複数使用環境の長所は様々な使用環境に適合するように1つのコンテンツを再加工することにより、相違した使用環境に適応変換された様々な形態のコンテンツを提供することができ、進んで様々な使用環境に適応変換された単一ソースをユーザ端末に提供することにおいて、ネットワーク帯域幅を効率的に使用したり減少させたりすることができるということである。
したがって、コンテンツ提供者の立場では、様々な使用環境にオーディオ信号を適合させるために複数のコンテンツを製作したり伝送したりする過程で発生する不必要な費用を低減でき、コンテンツ利用者の立場では、自分が位置した環境の空間的制約を克服すると共にユーザ自分の聴力特性及び選好度を最大限満足させることができる最適のオーディオコンテンツを使用できるようになる。
しかし、従来の技術によれば、単一ソース複数使用環境が支援できる汎用的マルチメディアアクセス(UNIVERSAL MULTIMEDIA ACCESS、UMA)環境でも単一ソース複数使用環境の長所が活用できない。すなわち、マルチメディアソースはユーザ特性、ユーザ周辺環境及びユーザ端末能力のような使用環境を考慮せずに一律的にオーディオコンテンツを伝送し、WINDOWS MEDIA PLAYER、MP3 PLAYER、REAL PLAYERなどのようなオーディオプレーヤーアプリケーションが搭載されたユーザ端末は、マルチメディアソースから受信した形式そのままのオーディオコンテンツを使用するため、単一ソース複数使用環境に適合しない。
このような従来の技術の問題点を解決し単一ソース複数使用環境を支援するために、マルチメディアソースが様々な使用環境を全部考慮してマルチメディアコンテンツを提供するようになれば、コンテンツの生成及び伝送において多くの負担が存在するようになる。
本発明は前記のような従来の技術の問題点を解決するために提案なされたものであって、その目的はオーディオコンテンツを使用するユーザ端末の使用環境を予め記述した情報を用いて、使用環境に適合するようにオーディオコンテンツを適応変換させるオーディオ適応変換装置及びその方法を提供することにある。
本発明が属した技術分野における通常の知識を有した者は、本明細書の図面、発明の詳細な説明及び特許請求の範囲から本発明の他の目的及び長所を容易に認識できる。
前記のような目的を達成するために本発明に係るオーディオ適応変換装置は、
単一ソース複数使用のためのオーディオ適応変換装置において、
オーディオ信号を消費するユーザ端末からオーディオ使用環境情報を収集して記述し管理するオーディオ使用環境情報管理手段と、
前記オーディオ使用環境情報に符合するオーディオ信号が前記ユーザ端末に出力されるように、前記オーディオ信号を適応変換させるオーディオ適応変換手段とを備え、
前記オーディオ使用環境情報は、
前記オーディオ信号に対するユーザの選好度を記述するユーザ特性情報を含むことを特徴とする。
この場合、前記ユーザ特性情報が、
前記オーディオ信号に対するユーザの左右側耳各々の選好度を示す可聴度(audibility)情報を含むようにしてもよい。
この場合、前記可聴度情報が、特定周波数範囲に対する選好度を含むようにしてもよい。
また、前記可聴度情報が、特定レベル範囲に対する選好度を含むようにしてもよい。
また、前記ユーザ特性情報が、前記オーディオ信号のボリウムに対する選好度を含むようにしてもよい。
また、前記ユーザ特性情報が、前記オーディオ信号の特定周波数範囲に対する減衰または増幅で表現される選好度を含むようにしてもよい。
また、前記ユーザ特性情報が、特定オーディオ趣向(前記特定オーディオ趣向は、ROCK、CLASSIC、POP効果などを含む)に対する選好度を含むようにしてもよい。
また、前記ユーザ特性情報が、マルチメディアコンテンツのオーディオ部分が消費されるか否かに対する選好度を含むようにしてもよい。
また、前記オーディオ適応変換手段が、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムに含まれ、
前記特定周波数範囲に対する選好度に基づいて、前記特定周波数範囲内でビットがさらに割り当てられたオーディオ信号が前記ユーザ端末に伝送されるようにオーディオ信号を適応変換させるようにしてもよい。
また、前記オーディオ適応変換手段が、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムに含まれ、
前記特定周波数範囲に対する選好度に基づいて、前記特定周波数範囲内のオーディオ信号だけが前記ユーザ端末に伝送されるようにオーディオ信号を適応変換させるようにしてもよい。
また、前記オーディオ適応変換手段が、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムに含まれ、
前記特定レベル範囲に対する選好度において前記特定レベル範囲の最大レベルと最小レベルの絶対差が小さい場合には、サンプリングレートが増加されるか、量子化ステップの数が増加されたオーディオ信号が前記ユーザ端末に伝送されるようにオーディオ信号を適応変換させるようにしてもよい。
また、前記オーディオ適応変換手段が、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムに含まれ、
前記特定レベル範囲に対する選好度の特定レベル範囲を抜け出すオーディオ信号は前記ユーザ端末に伝送されないようにオーディオ信号を適応変換させるようにしてもよい。
また、前記オーディオ適応変換手段が、
イコライジング機能を持たないユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムに含まれ、
前記オーディオ信号の特定周波数範囲に対する減衰または増幅で表現される選好度に基づいて、エンコーディングされたオーディオ信号が前記ユーザ端末に伝送されるようにオーディオ信号を適応変換させるようにしてもよい。
また、前記オーディオ適応変換手段が、
イコライザー事前設定機能を持たないユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムに含まれ、
前記特定オーディオ趣向に対する選好度に基づいて、イコライザー事前設定されたオーディオ信号が前記ユーザ端末に伝送されるようにしてもよい。
また、前記オーディオ適応変換手段が、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムに含まれ、
前記選好度がマルチメディアコンテンツのオーディオ部分は消費されないことを示す場合には、前記マルチメディアコンテンツのオーディオ部分は前記ユーザ端末に伝送されないようにオーディオ信号を適応変換させるようにしてもよい。
また、前記オーディオ使用環境情報が、前記ユーザが前記オーディオ信号を消費する周辺環境を記述する周辺環境特性情報をさらに含むようにしてもよい。
また、前記周辺環境特性情報が、前記ユーザ端末から入力される雑音信号を処理することによって獲得される雑音レベル情報を含むようにしてもよい。
また、前記周辺環境特性情報が、前記ユーザ端末から入力される雑音信号を処理することによって獲得される雑音周波数スペクトル情報を含むようにしてもよい。
また、前記オーディオ適応変換手段が、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムに含まれ、
前記雑音レベル情報に基づいて前記雑音レベルでも聴取できるレベルのオーディオ信号が前記ユーザ端末に伝送されるようにオーディオ信号を適応変換させるものの、増加されたオーディオ信号レベルが所定の限界に到達した場合には、オーディオ信号が前記ユーザ端末に伝送されないようにオーディオ信号を適応変換させるようにしてもよい。
また、前記オーディオ使用環境情報が、前記オーディオ信号の処理に関連した前記ユーザ端末の能力を記述する端末能力情報をさらに含むようにしてもよい。
また、前記端末能力情報が、前記ユーザ端末の出力チャンネルの個数情報を含むようにしてもよい。
また、前記のような目的を達成するために本発明に係るオーディオ適応変換方法は、単一ソース複数使用のためのオーディオ適応変換方法において、
オーディオ信号を消費するユーザ端末からオーディオ使用環境情報を収集して記述し管理する第1ステップと、
前記オーディオ使用環境情報に符合するオーディオ信号が前記ユーザ端末に出力されるように、前記オーディオ信号を適応変換させる第2ステップと
を備え、
前記オーディオ使用環境情報は、
前記オーディオ信号に対するユーザの選好度を記述するユーザ特性情報を含むことを特徴とする。
この場合、前記ユーザ特性情報が、前記オーディオ信号に対するユーザの左右側耳各々の選好度を示す可聴度(audibility)情報を含むようにしてもよい。
この場合、前記可聴度情報が、特定周波数範囲に対する選好度を含むようにしてもよい。
この場合、前記可聴度情報が、特定レベル範囲に対する選好度を含むようにしてもよい。
また、前記ユーザ特性情報が、前記オーディオ信号のボリウムに対する選好度を含むようにしてもよい。
また、前記ユーザ特性情報が、前記オーディオ信号の特定周波数範囲に対する減衰または増幅で表現される選好度を含むようにしてもよい。
また、前記ユーザ特性情報が、特定オーディオ趣向(前記特定オーディオ趣向はROCK、CLASSIC、POP効果などを含む)に対する選好度を含むようにしてもよい。
また、前記ユーザ特性情報が、マルチメディアコンテンツのオーディオ部分が消費されるか否かに対する選好度を含むようにしてもよい。
また、前記第2ステップが、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムで行われ、
前記特定周波数範囲に対する選好度に基づいて、前記特定周波数範囲内でビットがさらに割り当てられたオーディオ信号が前記ユーザ端末に伝送されるように、オーディオ信号を適応変換させるようにしてもよい。
また、前記第2ステップが、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムで行われ、
前記特定周波数範囲に対する選好度に基づいて前記特定周波数範囲内のオーディオ信号だけが前記ユーザ端末に伝送されるように、オーディオ信号を適応変換させるようにしてもよい。
また、前記第2ステップが、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムで行われ、
前記特定レベル範囲に対する選好度において前記特定レベル範囲の最大レベルと最小レベルとの絶対差が小さい場合には、サンプリングレートが増加されるか量子化ステップの数が増加されたオーディオ信号が前記ユーザ端末で伝送されるようにオーディオ信号を適応変換させるようにしてもよい。
また、前記第2ステップが、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムで行われ、
前記特定レベル範囲に対する選好度の特定レベル範囲を抜け出すオーディオ信号は前記ユーザ端末で伝送されないようにオーディオ信号を適応変換させるようにしてもよい。
また、前記第2ステップが、
イコライジング機能を持たないユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムで行われ、
前記オーディオ信号の特定周波数範囲に対する減衰または増幅で表現される選好度に基づいて、エンコーディングされたオーディオ信号が前記ユーザ端末に伝送されるようにオーディオ信号を適応変換させるようにしてもよい。
また、前記第2ステップが、
イコライザー事前設定機能を持たないユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムで行われ、
前記特定オーディオ趣向に対する選好度に基づいて、イコライザー事前設定されたオーディオ信号が前記ユーザ端末に伝送されるようにオーディオ信号を適応変換させるようにしてもよい。
また、前記第2ステップが、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムで行われ、
前記選好度がマルチメディアコンテンツのオーディオ部分は消費されないことを示す場合には、前記マルチメディアコンテンツのオーディオ部分は前記ユーザ端末に伝送されないようにオーディオ信号を適応変換させるようにしてもよい。
また、前記オーディオ使用環境情が、
前記ユーザが前記オーディオ信号を消費する周辺環境を記述する周辺環境特性情報をさらに含むようにしてもよい。
また、前記周辺環境特性情報が、
前記ユーザ端末から入力される雑音信号を処理することによって獲得される雑音レベル情報を含むようにしてもよい。
また、前記周辺環境特性情報が、
前記ユーザ端末から入力される雑音信号を処理することによって獲得される雑音周波数スペクトル情報を含むようにしてもよい。
また、前記第2ステップが、
前記ユーザ端末に適応変換されたオーディオ信号を提供するネットワークシステムで行われ、
前記雑音レベル情報に基づいて前記雑音レベルでも聴取できるレベルのオーディオ信号が前記ユーザ端末に伝送されるように、オーディオ信号を適応変換させるものの、増加されたオーディオ信号レベルが所定の限界に到達した場合には、オーディオ信号が前記ユーザ端末に伝送されないようにオーディオ信号を適応変換させるようにしてもよい。
また、前記オーディオ使用環境情報が、
前記オーディオ信号の処理に関連した前記ユーザ端末の能力を記述する端末能力情報を含むようにしてもよい。
また、前記端末能力情報が、
前記ユーザ端末の出力チャンネルの個数情報を含むようにしてもよい。
本発明によれば、オーディオコンテンツを使用する使用環境、すなわちユーザ特性、ユーザ周辺環境及びユーザ端末能力情報を用いて一つのオーディオコンテンツを様々な使用環境に適合できるように適応変換処理ができる単一ソース複数使用環境が提供することができる。
本発明の他の目的及び態様は添付図面を参照し、下記で実施の形態を説明することに明確になることであろう。
以下の内容は単に本発明の原理を例示する。したがって、当業者はたとえ本明細書に明確に説明や図示がされなかったとしても本発明の原理を具現して本発明の概念と範囲に含まれた様々な装置を発明することができるものである。また、本明細書に挙げたあらゆる条件付き用語及び実施の形態は原則的に、本発明の概念理解のための目的のみで明確に意図され、このように特別に挙げた実施の形態及び状態に制約的ではないことと理解されなければならない。
また、本発明の原理、観点及び実施の形態だけでなく特定実施の形態を列挙するあらゆる詳細な説明は、このような事項の構造的及び機能的均等物を含むように意図されることと理解されなければならない。また、このような均等物は現在公知された均等物だけでなく将来に開発される均等物すなわち構造と関係がなく同じ機能を行うように発明されたあらゆる素子を含むことと理解されなければならない。
したがって、例えば、本明細書のブロック図は本発明の原理を具体化する例示的な回路の概念的な観点を示すことと理解されなければならない。これと同様に、あらゆるフローチャート、状態変換図、擬似コードなどはコンピュータが読み取り可能な媒体に実質的に示すことができ、コンピュータまたはプロセッサが明確に図示されているか否かを問わずコンピュータまたはプロセッサにより行われる様々なプロセスを示すことと理解されなければならない。
プロセッサまたはこれと類似の概念で表示された機能ブロックを含む図面に示す様々な素子の機能は専用ハードウェアだけでなく適切なソフトウェアと関連してソフトウェアを実行する能力を有したハードウェアの使用で提供されることができる。プロセッサにより提供される時、前記機能は単一専用プロセッサ、単一共有プロセッサまたは複数の個別的プロセッサにより提供されることができ、これらのうち一部は共有できる。
またプロセッサ、制御またはこれと類似の概念で提示される用語の明確な使用は、ソフトウェアを実行する能力を有したハードウェアを排他的に引用して解析されてはならず、制限なしにデジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを保存するためのロム(ROM)、ラム(RAM)及び非揮発性メモリを暗示的に含むことと理解されなければならない。周知慣用の他のハードウェアも含むことができる。
本明細書の特許請求の範囲において、発明の詳細な説明に記載された機能を行うための手段で表現された構成要素は例えば前記機能を行う回路素子の組み合せまたはファームウエア/マイクロコードなどを含むあらゆる形式のソフトウェアを含む機能を行うあらゆる方法を含むことと意図され、前記機能を行うように前記ソフトウェアを実行するための適切な回路と結びつく。このような特許請求の範囲により定義された本発明は様々に列挙された手段により提供されている機能が結びつき、請求項が要求する方式と結びつくため前記機能を提供できるいかなる手段も本明細書から把握されることと均等なものと理解されなければならない。
上述した目的、特徴及び長所は添付された図面と関連した次の詳細な説明を介しててさらに明確になる。まず、各図面の構成要素に参照番号を付加することにおいて、同じ構成要素に限ってはたとえ他の図面上に表示されても可能なかぎり同じ番号を有するようにしていることに留意すべきである。また、本発明を説明することにおいて、関連された公知技術に対する具体的な説明が本発明の要旨を理解する上で不必要であると判断された場合、その詳細な説明を省略する。以下、添付された図面を参照して本発明に係る好ましい実施の形態を詳細に説明する。
図1は、本発明の一実施の形態に係るオーディオ適応変換装置を概略的に示すブロック図である。図1に示すように、本発明の一実施の形態に係るオーディオ適応変換装置100は、オーディオ適応変換手段103及びオーディオ使用環境情報管理手段107を含む。オーディオ適応変換手段103及びオーディオ使用環境情報管理手段107各々は、相互独立的にオーディオ処理システムに搭載されることができる。
オーディオ処理システムは、ラップトップコンピュータ、ノートブックコンピュータ、デスクトップコンピュータ、ワークステーション、メーンフレームまたは他の形態のコンピュータを含む。個人携帯情報端末器(PERSONAL DIGITAL ASSISTANT、PDA)、移動通信モバイルステーションのような他の形態のデータ処理または信号処理システムもオーディオ処理システムに含まれる。
オーディオ処理システムはネットワーク経路を構成するあらゆるノード、すなわちマルチメディアソースノードシステム、マルチメディア中継ノードシステム及びエンドユーザ端末(END USER TERMINAL)の中で任意のノードシステムであり得る。
エンドユーザ端末は、WINDOWS MEDIA PLAYER、MP3 PLAYER及びREAL PLAYERなどのようなオーディオプレーヤーが搭載されている。
例えば、オーディオ適応変換装置100がマルチメディアソースノードシステムに搭載され動作する場合、オーディオコンテンツを使用する使用環境を予め記述した情報を用いて使用環境に適合するようにオーディオコンテンツを適応変換させるためには使用環境に対する情報をエンドユーザ端末から受信し、受信された使用環境に基づいて適応変換されたコンテンツをエンドユーザ端末に伝送する。
本発明に係るオーディオ適応変換装置100がオーディオデータを処理するプロセス、例えばオーディオエンコーディングプロセスに対して、ISO(International Organization for Standardization)/IEC(International Electrotechnical Commission)の技術委員会(Technical Committee)のISO/IEC標準文書は本発明の好ましい実施の形態の各構成要素の機能と動作を説明するための範囲で本明細書の一部として含まれることができる。
オーディオデータソース手段101は、マルチメディアソースから生成されたオーディオデータを受信する。オーディオデータソース手段101は、マルチメディアソースノードシステムに含まれることもでき、マルチメディアソースノードシステムから有線/無線ネットワークを介して伝送されたオーディオデータを受信するマルチメディア中継ノードシステムまたはエンドユーザ端末に含まれることができる。
オーディオ適応変換手段103はオーディオデータソース手段101からオーディオデータを受信し、オーディオ使用環境情報管理手段107が使用環境すなわちユーザ特性、ユーザ周辺環境及びユーザ端末能力を予め記述した情報を用いて、使用環境に適合するようにオーディオデータを適応変換させる。ここで、図面に示されたオーディオ適応変換手段103の機能が必ず1つのノードシステムにだけ含まれなければならないことではなく、ネットワーク経路を構成するノードシステムに分散できる。
例えば、ネットワーク帯域幅と関連しないオーディオボリューム調節機能を有するオーディオ適応変換手段は、エンドユーザ端末に含まれる反面、ネットワーク帯域幅と関連する時間領域での特定オーディオ信号強度すなわちオーディオレベル調節機能を有するオーディオ適応変換手段は、マルチメディアソースノードシステムに含まれることができる。
オーディオ使用環境情報管理手段107は、ユーザ、ユーザ端末及び周辺環境から情報を収集して使用環境情報を予め記述し管理する。
オーディオ適応変換手段103が行う機能に関連した使用環境情報もオーディオ適応変換手段103の場合と同様ににネットワーク経路を構成するノードシステムに分散できる。
オーディオデータ出力手段105は、オーディオ適応変換手段103により適応変換されたオーディオデータを出力する。出力されたオーディオデータは、エンドユーザ端末のオーディオプレーヤーに伝送されることもでき、有線/無線ネットワークを介してマルチメディア中継ノードシステムまたはエンドユーザ端末に伝送されることもできる。
図2は、図1のオーディオ適応変換装置として具現可能な一実施の形態を概略的に示すブロック図である。図2に示したように、オーディオデータソース手段101は、オーディオメタデータ201及びオーディオコンテンツ203を含むことができる。
オーディオデータソース手段101は、マルチメディアソースから生成されたオーディオコンテンツ及びメタデータを収集して格納する。ここでオーディオコンテンツ203は、色々な符号化方式(MP3、AC−3、AAC、WMA、RA、CELPなど)で保存されたりストリーミング形態で伝送される様々なオーディオフォーマットを含む。
オーディオメタデータ201は、オーディオコンテンツの符号化方式、サンプリングレート(Sampling Rate)、チャンネル数(例えば、モノ、ステレオ、5.1チャンネル等)、ビットレート(Bit Rate)などのような、対応されるオーディオコンテンツに関連した情報であって、XML(extensible Markup Language)スキーマ(schema)により定義され記述できる。
オーディオ使用環境情報管理手段107は、ユーザ特性情報管理部207、ユーザ特性情報入力部217、ユーザ周辺環境情報管理部209、ユーザ周辺環境情報入力部219、オーディオ端末能力情報管理部211及びオーディオ端末能力情報入力部221を含むことができる。
ユーザ特性情報管理部207はユーザ特性情報入力部217を介してユーザ端末から聴覚特性、選好音量、選好周波数スペクトル上のイコライジング(Equalizing)パターンなどのようなユーザ特性情報を受信し管理する。入力されたユーザ特性情報は、例えばXML形式の機械読み取り可能な言語で管理される。
ユーザ周辺環境情報管理部209は、ユーザ周辺環境情報入力部219を介してオーディオコンテンツが使用される周辺環境(NATURAL ENVIRONMENT)の情報を受け取って管理する。入力された周辺環境情報は、例えばXML形式の機械読み取り可能な言語で管理される。
ユーザ周辺環境情報入力部219は、特定場所で収集、分析及び処理されたり事前に作られた雑音環境分類表により定義できる雑音環境特性情報をユーザ周辺環境情報管理部209に伝送する。
オーディオ端末能力情報管理部211は、オーディオ端末能力情報入力部211を介して端末能力情報を受信し管理する。入力された端末能力情報は、例えばXML形式の機械読み取り可能な言語で管理される。
オーディオ端末能力情報入力部221は、ユーザ端末に予め設定されていたり、ユーザにより入力される端末能力情報をオーディオ端末能力情報管理部211に伝送できる。
オーディオ適応変換手段103は、オーディオメタデータ適応変換処理部213及びオーディオコンテンツ適応変換処理部215を含むことができる。
オーディオコンテンツ適応変換処理部215はユーザ周辺環境情報管理部209で管理されるユーザ周辺環境情報をパ−シング(Parsing)した後、雑音環境に強くなるように雑音マスキング(Noise−Masking)などのオーディオ信号処理によりオーディオコンテンツが周辺環境に適応するように変換処理(Transcoding)する。
同様に、オーディオコンテンツ適応変換処理部215は、ユーザ特性情報管理部217及びオーディオ端末能力情報管理部211で管理されるユーザ特性情報及びオーディオ端末能力情報をパ−シングした後、オーディオコンテンツがユーザ特性及び端末能力に適合するようにオーディオ信号を適応変換させる。
オーディオメタデータ適応変換処理部213は、オーディオコンテンツ適応変換過程で必要なメタデータを提供し、オーディオコンテンツ適応変換処理結果によって対応するオーディオメタデータ情報の内容を適応変換させる。
図3は図1のオーディオ適応変換装置100で行われるオーディオ適応変換プロセスを説明するためのフローチャートである。図3に示すように、本発明に係るプロセスは、オーディオ使用環境情報管理手段107がユーザ、端末及び周辺環境からオーディオ使用環境情報を収集してユーザ特性、ユーザ周辺環境及びユーザ端末能力情報を予め記述することから始める(S301)。
次に、オーディオデータソース手段101がオーディオデータを受信すれば(S303)、オーディオ適応変換手段103はステップS301で記述した使用環境情報を用いて、ステップS303で受信したオーディオデータを使用環境すなわちユーザ特性、ユーザ周辺環境及びユーザ端末能力に適合するようにオーディオコンテンツを適応変換させる(S305)。オーディオデータ出力手段105は、ステップS305で適応変換されたオーディオデータを出力するS307。
図4は、図3の適応変換プロセス(S305)を説明するためのフローチャートである。
図4に示すように、オーディオ適応変換手段103は、オーディオデータソース手段101が受信したオーディオコンテンツ及びオーディオメタデータを確認して(S401)、適応変換の必要があるオーディオコンテンツをユーザ特性、ユーザ周辺環境及びユーザ端末能力に適合するように適応変換させて(S403)、ステップ(S403)のオーディオコンテンツ適応変換処理結果によって、対応するオーディオメタデータ情報の内容を適応変換させる(S405)。
以下ではオーディオ使用環境情報管理手段107で管理される記述情報構造が開示される。
本発明によってオーディオコンテンツを使用するユーザ特性、ユーザ周辺環境及びユーザ端末能力の使用環境を予め記述した情報を用いて、使用環境に適合するようにオーディオコンテンツを適応変換させるためには、ユーザ特性(USER CHARACTERISTICS)、端末能力(TERMINAL CAPABILITIES)及び周辺環境特性(NATURAL ENVIRONMENT CHARACTERISTICS)に対する情報が管理されなければならない。
次の表1は、本発明の一実施の形態によってオーディオ信号を適応変換させるための記述情報を構造的に表現したテーブルである。
Figure 2009080485
図1のオーディオ使用環境情報管理手段107で管理する使用環境の記述情報構造として、例示的にXMLスキーマ定義によって表現した構文(Syntax)は次の通りである。
<element name = “UserEnvironment”>
<complexType>
<all>
<element ref = “USERCHARACTERISTICS” />
<element
ref = “NATURALENVIRONMENTCHARACTERISTICS”/>
<element ref = “TERMINALCAPABILITIES”/>
</all>
</complexType>
</element>
一方、前記表1においてユーザ特性は、特定ユーザの可聴力と選好度を記述する。図1のオーディオ使用環境情報管理手段107で管理するユーザ特性の記述情報構造として、例示的にXMLスキーマ定義によって表現した構文は次の通りである。
<element name = “USERCHARACTERISTICS”>
<complexType>
<all>
<element
name = “LeftAudibility” type=”Audibility”/>
<element
name = “RightAudibility” type=”Audibility”/>
<element name = “AudioPower” type = “integer”/>
<element name = “FrequencyEqualizer”>
<complexType>
<sequence>
<element name = Period type= “mpeg7:vector”/>
<element name = Level type= “float”/>
</sequence>
</complexType>
</element>
<element name = “PresetEqualizer”>
<complexType>
<sequence>
<enumeration Item = “Rock”>
<enumeration Item = “Classic”>
<eumeration Item = “POP>
</sequence>
</complexType>
</element>
<element name = “Mute” type = “boolean”/>
</all>
</complexType>
</element>
<complexType name = “Audibility”>
<sequence>
<element name = “AudibleFrequencyRange”>
<complexType>
<mpeg7:vector dim = “2”
type= “positiveInteger”/>
</complexType>
</element>
<element name = “AudibleLevelRange”>
<complexType>
<mpeg7:vector dim = “2”
type= “positiveInteger”/> </complexType>
</element>
</sequence>
</complexType>
前記ユーザ特性の構成要素を整理すれば次の表2の通りである。
Figure 2009080485
前記表2において、左可聴及び右可聴は、可聴(Audibility)のデータタイプを有し、ユーザの左右両側の耳各々に対するオーディオ選好度を示す。
可聴データタイプは、AudibleFrequencyRange及びAudibleLevelRangeの2つの要素を有する。
AudibleFrequencyRangeは、特定周波数範囲に対するユーザの選好を記述する。特定周波数範囲の開始点のStartFrequency及び特定周波数範囲の終了点のEndFrequencyは、Hz単位で与えられる。AudibleFrequencyRange記述情報はユーザが好む可聴周波数の範囲を示す。ユーザに与えられたネットワーク帯域幅が固定されている場合、オーディオ適応変換手段103はAudibleFrequencyRange記述情報を用いて特定周波数範囲内でビットをさらに割り当てることによって、向上した品質のオーディオをユーザに提供できる。また、オーディオ適応変換手段103は、AudibleFrequencyRange記述情報を用いて、記述された周波数範囲内のオーディオ信号だけを伝送することによってネットワーク帯域幅を減らしたり、テキスト、イメージ、ビデオなど他の形態の追加情報を残った帯域幅に追加できる。
下の例示はユーザが好む可聴周波数の範囲が20Hzから20KHzまでであることを示す。
<AudibleFrequencyRange>
<StartFrequency>20</StartFrequency>
<EndFrequency>2000</EndFrequency>
</AudibleFrequencyRange>
AudibleLevelRangeは、時間領域において特定オーディオ信号のレベル範囲に対するユーザの選好を記述する。オーディオ信号のレベル範囲の下限線であるLowLimitLevel以下の信号レベル値は黙音になり、オーディオ信号のレベル範囲の上限線であるHighLimitLevel以上の信号レベル値は上限コーナーレベルに制限される。LowLimitLevel及びHighLimitLevelは0.0から1.0までの正規化されたスケールを有するが、0.0は黙音を、1.0は信号の最大レベルを示す。AudibleLevelRange記述情報はユーザが聞こうとするオーディオレベルの最大値及び最小値を示す。
オーディオ適応変換手段103は、ユーザがオーディオコンテンツを最上に経験できるように、AudibleLevelRange記述情報を用いることができる。例えば、ユーザに与えられたネットワーク帯域幅が固定されており、最大レベルと最小レベルとの絶対差が小さい場合、オーディオ適応変換手段103はAudibleLevelRange記述情報を用いることによって、サンプリングレートを増加させたりまたは量子化ステップの数を増加させてオーディオ信号が伝送できる。また、オーディオ適応変換手段103は、AudibleLevelRange記述情報を用いてオーディオ信号のレベル範囲を抜け出すオーディオ信号を除去することによってネットワーク帯域幅を効率的に利用することができ、テキスト、イメージ、ビデオなど他の形態の追加情報を残った帯域幅に追加できる。
下の例示は、ユーザが好むオーディオ信号のレベル範囲が最小0.3から最大0.7であることをを示す。
<AudibleLevelRange>
<LowLimitLevel>0.30</LowLimitLevel>
<HighLimitLevel>0.70</HighLimitLevel>
</AudibleLevelRange>
AudioPowerは、オーディオのボリュームに対するユーザ選好を記述する。AudioPowerは整数値に表現されることもできるが、0.0は黙音(mute)を、1.0は最大ボリウムを示すように0.0から1.0までの正規化されたスケールの値でもあリ得る。オーディオ適応変換手段103は、オーディオ使用環境情報管理手段107で管理されるAudioPower記述情報によってオーディオ信号を調節するようになる。
下の例示はユーザが好むオーディオボリウムが0.85であることを示す。
<AudioPower>0.85</AudioPower>
以下で説明する記述要素は、ユーザのオーディオ信号に対する選好を示す。この記述要素はオーディオ処理能力を持たないユーザ端末に利用されることができる。
FrequencyEqualizerは、周波数範囲及び減衰または増幅値で表現される特定イコライジング構成に対する選好度を記述する。FrequencyEqualizer記述情報は、特定周波数に対するユーザ選好を示す。FrequencyEqualizer記述情報では、周波数バンド及び対応するユーザ選好値を記述する。
ユーザ端末がイコライジング能力を持たない場合、オーディオ適応変換手段103は、ユーザが期待する品質を提供するためにFrequencyEqualizer記述情報を利用することができる。効率的なビット割り当てのために、人間周波数マスキング現象(HUMAN FREQUENCY MASKING PHENOMENA)に基づいてFrequencyEqualizer記述情報がオーディオエンコーディングプロセスで用いられることができる。また、オーディオ適応変換手段103は、FrequencyEqualizer記述情報を基にイコライジングを行い、これによって適応変換されたオーディオ信号をユーザ端末に伝送できる。
PeriodはFrequencyEqualizerの属性であってHzで表現されるイコライジング範囲の下限及び上限コーナー周波数を定義する。LevelはFrequencyEqualizerの属性であって、dBで表現される周波数範囲の減衰または増幅を定義する。Levelは、ユーザイコライジング選好値を示す。
下の例示はユーザが好む特定イコライジング構成を示す。
<FrequencyEqualizer>
<FrequencyBand>
<Period>
<StartFrequency>20</StartFrequency>
<EndFrequency>499</EndFrequency>
</Period>
<Level>0.8</Level>
</FrequencyBand>
<FrequencyBand>
<Period>
<StartFrequency>500</StartFrequency>
<EndFrequency>1000</EndFrequency>
</Period>
<Level>0.5</Level>
</FrequencyBand>
<FrequencyBand>
<Period>
<StartFrequency>1000</StartFrequency>
<EndFrequency>10000</EndFrequency>
</Period>
<Level>0.5</Level>
</FrequencyBand>
<FrequencyBand>
<Period>
<StartFrequency>10000</StartFrequency>
<EndFrequency>20000</EndFrequency>
</Period>
<Level>0.0</Level>
</FrequencyBand>
</FrequencyEqualizer>
PresetEqualizerは、イコライザー事前設定(equalizer preset)に対する言語記述(verbal description)で表現される特定イコライジング構成に対する選好度を記述する。すなわち、PresetEqualizer記述情報は、ROCK、CLASSIC、POP効果のように明確に区分される特定オーディオ趣向に対するユーザ選好を示す。ユーザ端末が事前設定イコライザー選好に対する設定能力を持たない場合、オーディオ適応変換手段103はユーザがオーディオコンテンツを最上に経験できるようにPresetEqualizer記述情報を利用することができる。
下の例示のように、オーディオ適応変換手段103は、ROCKに対して予め設定されたイコライザー設定機能を処理して適応変換されたオーディオ信号をユーザ端末に伝送できる。
<PresetEqualizer>Rock</PresetEqualizer>
Muteは、DIのオーディオ部分を黙音で処理するための選好度を記述する。すなわち、Mute記述情報は、コンテンツのオーディオ部分を使用するか否かに対する選好度を示す。
このような機能は、大部分のオーディオ装置、すなわち、エンドユーザ端末のオーディオプレーヤーに提供されるが、オーディオ適応変換手段103は、ネットワーク帯域幅を確保するためにオーディオ信号を伝送しないようにこの情報を利用することができる。
下の例示は、ユーザがDIのオーディオ部分に対しては利用しないということを示す。
<Mute>true</Mute>
一方、前記表1において、周辺環境特性は、特定ユーザの周辺環境を記述する。図1のオーディオ使用環境情報管理手段107で管理する周辺環境特性の記述情報構造として、例示的にXMLスキーマ定義によって表現した構文は次の通りである。
<element name = “NATURALENVIRONMENTCHARACTERISTICS”>
<complexType>
<element name = “NoiseLevel” type = “integer”/>
<element name = “NoiseFrequencySpectrum”>
<complexType>
<sequence>
<element name = FrequencyPeriod
type= “mpeg7:vector”/>
<element name = FrequencyValue type= “float”/>
</sequence>
</complexType>
</element>
</complexType>
</element>
NoiseLevelは、雑音レベルを記述する。この記述情報は、ユーザ端末から入力された雑音信号を処理することによって獲得でき、dB単位のサウンド圧力レベルで表現される。
オーディオ適応変換手段103は、NoiseLevel記述情報を用いてユーザ端末に対するオーディオ信号レベルを自動に調節できる。一方、オーディオ適応変換手段103がエンドユーザ端末に搭載されて周辺環境の変化する雑音レベルに自動的に対応するようにすることができる。雑音レベルが相対的に高い状況においてオーディオ適応変換手段103は、ユーザが雑音環境でも意図した信号を聴取できるように信号の大きさを増加させる。増加された信号レベルがユーザにより設定された限界に到達した場合、オーディオ適応変換手段103は、オーディオ信号伝送を中断し、使用可能な帯域幅をテキスト、イメージ、グラフィック及びビデオのような他のメディアに割り当てることができる。
例えば周辺環境の雑音が20デシベルの場合、NoiseLevelは下記のように記述される。
<NoiseLevel>20</NoiseLevel>
NoiseFrequencySpectrum記述情報は、ユーザ端末から入力された雑音信号を処理することによって獲得でき、雑音レベルはdB単位のサウンド圧力レベルに測定される。
周波数マスキング現象に基づいた効率的なオーディオコーディングのため、オーディオ適応変換手段103は、NoiseFrequencySpectrum記述情報を利用できる。オーディオ適応変換手段103は、NoiseFrequencySpectrum記述情報に基づいて雑音を減らすか、さらに多い雑音が混ざっている周波数に対してオーディオ信号をさらに増加させることによって、効率的なオーディオコーディングを行い、適応変換されたオーディオ信号をユーザ端末に伝送できる。
例えば、下記のように記述できる。下の例示でFrequency Periodの1番目及び2番目の値は、周波数バンドの開始周波数値と終了周波数値を示す。次に記述されるFrequency Valueは、デシベルで表現されるオーディオパワーである。オーディオ適応変換手段103は、この情報に基いてイコライザー機能を処理しユーザ端末に結果オーディオ信号を伝送する。
<NoiseFrequencySpectrum>
<FrequencyPeriod>20 499</FrequencyPeriod>
<FrequencyValue>30</FrequencyValue>
<FrequencyPeriod>500 1000</FrequencyPeriod>
<FrequencyValue>10</FrequencyValue>
<FrequencyPeriod>1000 10000</FrequencyPeriod>
<FrequencyValue>50</FrequencyValue>
<FrequencyPeriod>10000 20000</FrequencyPeriod>
<FrequencyValue>10</FrequencyValue>
</NoiseFrequencySpectrum>
一方、前記表1において端末能力は、オーディオデータフォーマット、形状及びレベルの多様性、ダイナミックレンジ、スピーカー構成などのようなオーディオ処理において端末能力を記述するためのものである。図1のオーディオ使用環境情報管理手段107で管理する端末能力の記述情報構造として、例示的にXMLシェーマ定義によって表現した構文は次の通りである。
<element name = "TERMINALCAPABILITIES">
<complexType>
<element name = "AudioChannelNumer" type = integer/>
<element name = "Headphone" type = "boolean"/>
<element name = "DecodersType"
type = "DecodersType”/ >
</complexType>
</element>
<complexType name = "DecodersType">
<sequence>
<element name = "DecoderType"/>
<enumeration Item = "AAC"/>
<enumeration Item = "MP3"/>
<enumeration Item = "TTS"/>
<enumeration Item = "SAOL"/>
<element name= "Profile" type = "string"/>
<element name= "Level" type = "string">
</element>
</sequence>
</complexType>
ここでAudioChannelNumberは、ユーザ端末により処理される出力チャンネルの個数を示す情報であって、オーディオ適応変換手段103は、この情報に基づいてオーディオ信号を伝送できる。
またHeadPhoneは、論理値(boolean)で現れる情報であって、ヘッドホンが使われない場合、オーディオ適応変換手段103は、周辺環境雑音レベル及び周波数スペクトル情報と共に周波数マスキングコーディングを行うことができる。ヘッドホンが使われる場合には、周辺環境雑音が減る。
そして、DecoderTypeは、オーディオフォーマット及びプロファイル/レベルの端末処理能力を示す情報であって、オーディオ適応変換手段103はこの情報を用いてユーザ端末に最適のオーディオ信号を伝送することができる。
以上のように本発明によれば、ユーザの雑音環境情報と聴力特性及び選好情報を用いて一つのオーディオコンテンツを各々異なる使用環境と様々なユーザの特性と趣向に適合できるように適応、変換処理の可能な単一ソース複数使用環境を提供することができる。
なお、本発明は、上記の実施の形態に限定されたものではなく、本発明に係る技術的思想から逸脱しない範囲内で様々な変更が可能であり、それらも本発明の技術的範囲に属する。
本発明の前記及び他の目的及び特徴は添付された下記図面等と関連した実施の形態を説明するにしたがいさらに明確になるであろう。
図1は、本発明の一実施の形態に係るオーディオ適応変換装置が含まれたユーザ端末を概略的に示すブロック図である。 図2は、図1のオーディオ適応変換装置として具現可能な一実施の形態を概略的に示すユーザ端末のブロック図である。 図3は、図1のオーディオ適応変換装置で行われるオーディオ適応変換プロセスを説明するためのフローチャートである。 図4は、図3の適応変換プロセスを説明するためのフローチャートである。

Claims (1)

  1. 単一ソース複数使用のためのオーディオ適応変換装置において、
    オーディオ信号を消費するユーザ端末からオーディオ使用環境情報を収集して記述し管理するオーディオ使用環境情報管理手段と、
    前記オーディオ使用環境情報に符合するオーディオ信号が前記ユーザ端末に出力されるように、前記オーディオ信号を適応変換させるオーディオ適応変換手段とを備え、
    前記オーディオ使用環境情報は、
    前記オーディオ信号に対するユーザの選好度を記述するユーザ特性情報を含むことを特徴とするオーディオ適応変換装置。
JP2008259476A 2002-04-26 2008-10-06 オーディオ信号の適応変換装置及びその方法 Pending JP2009080485A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20020023159 2002-04-26

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004500176A Division JP4704030B2 (ja) 2002-04-26 2003-04-26 オーディオ信号の適応変換装置及びその方法

Publications (1)

Publication Number Publication Date
JP2009080485A true JP2009080485A (ja) 2009-04-16

Family

ID=29267904

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2004500176A Expired - Fee Related JP4704030B2 (ja) 2002-04-26 2003-04-26 オーディオ信号の適応変換装置及びその方法
JP2008259476A Pending JP2009080485A (ja) 2002-04-26 2008-10-06 オーディオ信号の適応変換装置及びその方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2004500176A Expired - Fee Related JP4704030B2 (ja) 2002-04-26 2003-04-26 オーディオ信号の適応変換装置及びその方法

Country Status (7)

Country Link
US (1) US20050180578A1 (ja)
EP (1) EP1499949A4 (ja)
JP (2) JP4704030B2 (ja)
KR (1) KR100919884B1 (ja)
CN (1) CN1277180C (ja)
AU (1) AU2003227377A1 (ja)
WO (1) WO2003091870A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016136256A (ja) * 2010-12-03 2016-07-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 複数のメディア処理ノードによる適応処理
CN110024029A (zh) * 2016-11-30 2019-07-16 微软技术许可有限责任公司 音频信号处理

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003091791A1 (en) * 2002-04-26 2003-11-06 Electronics And Telecommunications Research Institute Apparatus and method for reducing power consumption by adjusting backlight and adapting visual signal
WO2004036954A1 (en) * 2002-10-15 2004-04-29 Electronics And Telecommunications Research Institute Apparatus and method for adapting audio signal according to user's preference
US7624021B2 (en) * 2004-07-02 2009-11-24 Apple Inc. Universal container for audio data
KR100691305B1 (ko) * 2004-12-08 2007-03-12 한국전자통신연구원 개인 특성 정보를 이용한 실시간 멀티미디어 트랜스코딩장치 및 그 방법
KR100707339B1 (ko) * 2004-12-23 2007-04-13 권대훈 청력도 기반 이퀄라이제이션 방법 및 장치
EP1834484A4 (en) * 2005-01-07 2010-04-07 Korea Electronics Telecomm DEVICE AND METHOD FOR PROVIDING ADAPTIVE BROADCASTING USING CLASSIFICATION SCHEMES FOR USE ENVIRONMENTAL DESCRIPTION
US20080002839A1 (en) * 2006-06-28 2008-01-03 Microsoft Corporation Smart equalizer
TR200701546A2 (tr) 2007-03-13 2008-10-21 Vestel Elektron�K Sanay� Ve T�Caret A.�. Otomatik ekolayzır ayarlama yöntemi
KR100925021B1 (ko) 2007-04-30 2009-11-04 주식회사 크리스틴 청력도 기반 이퀄라이제이션 방법
KR100925022B1 (ko) 2007-04-30 2009-11-04 주식회사 크리스틴 청력도 기반의 음질보정 음향출력장치
US7861008B2 (en) * 2007-06-28 2010-12-28 Apple Inc. Media management and routing within an electronic device
US8111837B2 (en) * 2007-06-28 2012-02-07 Apple Inc. Data-driven media management within an electronic device
US8171177B2 (en) 2007-06-28 2012-05-01 Apple Inc. Enhancements to data-driven media management within an electronic device
US8041438B2 (en) 2007-06-28 2011-10-18 Apple Inc. Data-driven media management within an electronic device
KR100923641B1 (ko) * 2007-10-31 2009-10-28 (주)씨앤에스 테크놀로지 음성 인식에 따른 멀티미디어 효과 기능을 가지는 VoIP폰, 이를 포함하는 전화 통신 시스템, 및 그 전화 통신방법
US8934645B2 (en) 2010-01-26 2015-01-13 Apple Inc. Interaction of sound, silent and mute modes in an electronic device
CN102142924B (zh) * 2010-02-03 2014-04-09 中兴通讯股份有限公司 一种多用途语音频编码传输方法和装置
US8989884B2 (en) 2011-01-11 2015-03-24 Apple Inc. Automatic audio configuration based on an audio output device
WO2014127279A1 (en) * 2013-02-14 2014-08-21 Singer Howard M Methods, systems, and media for indicating digital media content quality to a user
US9996148B1 (en) * 2013-03-05 2018-06-12 Amazon Technologies, Inc. Rule-based presentation of media items
CN104661045B (zh) * 2013-11-21 2017-09-01 青岛海尔电子有限公司 多媒体内容自适应方法和多媒体播放系统
JP6317235B2 (ja) * 2014-11-07 2018-04-25 日本電信電話株式会社 コンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラム
CN110945494A (zh) * 2017-07-28 2020-03-31 杜比实验室特许公司 向客户端提供媒体内容的方法和系统
EP3588988B1 (en) * 2018-06-26 2021-02-17 Nokia Technologies Oy Selective presentation of ambient audio content for spatial audio presentation
US10855241B2 (en) * 2018-11-29 2020-12-01 Sony Corporation Adjusting an equalizer based on audio characteristics
US20230209281A1 (en) * 2021-12-23 2023-06-29 Intel Corporation Communication device, hearing aid system and computer readable medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020013812A1 (en) * 1996-06-03 2002-01-31 Krueger Mark H. Transcoding audio data by a proxy computer on behalf of a client computer
WO2002031701A2 (en) * 2000-10-11 2002-04-18 United Video Properties, Inc. Systems and methods for providing storage of data on servers in an on-demand media delivery system

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5737720A (en) * 1993-10-26 1998-04-07 Sony Corporation Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation
US5907622A (en) 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
DE19734969B4 (de) * 1996-09-28 2006-08-24 Volkswagen Ag Verfahren und Vorrichtung zur Wiedergabe von Audiosignalen
US6704421B1 (en) * 1997-07-24 2004-03-09 Ati Technologies, Inc. Automatic multichannel equalization control system for a multimedia computer
US6252968B1 (en) * 1997-09-23 2001-06-26 International Business Machines Corp. Acoustic quality enhancement via feedback and equalization for mobile multimedia systems
US6195435B1 (en) * 1998-05-01 2001-02-27 Ati Technologies Method and system for channel balancing and room tuning for a multichannel audio surround sound speaker system
US6999826B1 (en) * 1998-11-18 2006-02-14 Zoran Corporation Apparatus and method for improved PC audio quality
US6859538B1 (en) * 1999-03-17 2005-02-22 Hewlett-Packard Development Company, L.P. Plug and play compatible speakers
JP2000356994A (ja) * 1999-06-15 2000-12-26 Yamaha Corp オーディオシステム、その制御方法および記録媒体
JP2000357930A (ja) * 1999-06-15 2000-12-26 Yamaha Corp オーディオ装置、制御装置、オーディオシステム及びオーディオ装置の制御方法
JP2001194812A (ja) * 2000-01-07 2001-07-19 Kyocera Mita Corp 電子写真感光体
JP2002311996A (ja) * 2001-02-09 2002-10-25 Sony Corp コンテンツ供給システム
JP4190742B2 (ja) * 2001-02-09 2008-12-03 ソニー株式会社 信号処理装置及び方法
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7072726B2 (en) * 2002-06-19 2006-07-04 Microsoft Corporation Converting M channels of digital audio data into N channels of digital audio data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020013812A1 (en) * 1996-06-03 2002-01-31 Krueger Mark H. Transcoding audio data by a proxy computer on behalf of a client computer
WO2002031701A2 (en) * 2000-10-11 2002-04-18 United Video Properties, Inc. Systems and methods for providing storage of data on servers in an on-demand media delivery system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016136256A (ja) * 2010-12-03 2016-07-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 複数のメディア処理ノードによる適応処理
US9842596B2 (en) 2010-12-03 2017-12-12 Dolby Laboratories Licensing Corporation Adaptive processing with multiple media processing nodes
CN110024029A (zh) * 2016-11-30 2019-07-16 微软技术许可有限责任公司 音频信号处理
CN110024029B (zh) * 2016-11-30 2023-08-25 微软技术许可有限责任公司 音频信号处理

Also Published As

Publication number Publication date
KR100919884B1 (ko) 2009-09-30
CN1277180C (zh) 2006-09-27
CN1659507A (zh) 2005-08-24
JP2005524263A (ja) 2005-08-11
AU2003227377A1 (en) 2003-11-10
EP1499949A4 (en) 2008-07-02
US20050180578A1 (en) 2005-08-18
KR20040102093A (ko) 2004-12-03
JP4704030B2 (ja) 2011-06-15
EP1499949A1 (en) 2005-01-26
WO2003091870A1 (en) 2003-11-06

Similar Documents

Publication Publication Date Title
JP4704030B2 (ja) オーディオ信号の適応変換装置及びその方法
JP4393383B2 (ja) ユーザの選好度によるオーディオ信号適応変換装置、および、その方法
JP7053687B2 (ja) ラストマイル等化
JP7302006B2 (ja) Bluetoothデバイスを操作するための方法
JP2021073814A (ja) 効率的なdrcプロファイル伝送
US20180035246A1 (en) Transmitting audio over a wireless link
JP2013502619A (ja) 周波数帯信号エネルギーに基づいた、音声符号化における周波数帯スケール・ファクタ測定
KR100626653B1 (ko) 사용자의 선호도에 따른 오디오 신호 적응 변환 장치 및그 방법
EP3745813A1 (en) Method for operating a bluetooth device
US10290309B2 (en) Reducing codec noise in acoustic devices
US10727858B2 (en) Error resiliency for entropy coded audio data
CN110915223B (zh) 发送设备、发送方法、接收设备、接收方法和程序
JP4120440B2 (ja) 通信処理装置、および通信処理方法、並びにコンピュータ・プログラム
US10586546B2 (en) Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US20240029755A1 (en) Intelligent speech or dialogue enhancement
US20220392460A1 (en) Enabling stereo content for voice calls
US20190387040A1 (en) Level estimation for processing audio data
CN114629987A (zh) 一种实现蓝牙耳机耳返的方法及相关装置
Je-Ho Digital Audio Adaptation in MPEC-21 Framework

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110603

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120124