JP7037671B2 - オーディオの提示のための装置および関連する方法 - Google Patents

オーディオの提示のための装置および関連する方法 Download PDF

Info

Publication number
JP7037671B2
JP7037671B2 JP2020571769A JP2020571769A JP7037671B2 JP 7037671 B2 JP7037671 B2 JP 7037671B2 JP 2020571769 A JP2020571769 A JP 2020571769A JP 2020571769 A JP2020571769 A JP 2020571769A JP 7037671 B2 JP7037671 B2 JP 7037671B2
Authority
JP
Japan
Prior art keywords
audio
user
presentation
information
remote user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020571769A
Other languages
English (en)
Other versions
JP2021528916A (ja
Inventor
ラッセ ラークソネン
アルト レフティニエミ
アンッティ エロネン
ユッシ レッパネン
Original Assignee
ノキア テクノロジーズ オーユー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ノキア テクノロジーズ オーユー filed Critical ノキア テクノロジーズ オーユー
Publication of JP2021528916A publication Critical patent/JP2021528916A/ja
Application granted granted Critical
Publication of JP7037671B2 publication Critical patent/JP7037671B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/21Direction finding using differential microphone array [DMA]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Description

本開示は、オーディオの提示の分野に関し、特に、通信オーディオコンテンツまたは没入型通信オーディオコンテンツなどのオーディオコンテンツの提示に関する。本開示はまた、関連する装置、方法、およびコンピュータプログラムに関する。
背景
モノフォニックなオーディオの捕捉および提示を超えるものを提供する、遠隔通信システムや電話通信システムが開発されている。そのような電話通信のオーディオは、空間オーディオを含んでもよい。そのようなオーディオの提示は、通信がクリアで有効であることを保証するように入念な検討を必要としてもよい。
本明細書における、以前に発行された文献または任意の背景としての言及または説明によって、必ずしも、その文献または背景が従来技術の一部であるか、または一般的な知見であるという認識として受け取られるべきではない。ここで開示の1つ以上の態様や例は、背景の問題のうちの1つ以上に対処してもよいし、対処しなくてもよい。
摘要
本開示の第1の態様では、装置が提供される。当該装置は、
プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、オーディオコンテンツをリモートユーザデバイスから受信し、
前記オーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を受信し、
1つ以上のオーディオソースのそれぞれのオーディオが、基準ポイントの周囲で1つ以上のそれぞれの方向または方向の範囲から発生しているとして知覚されるように、前記1つ以上のオーディオソースからのオーディオが空間オーディオとして現在提示されているかどうかを少なくとも示す、現在のオーディオ提示情報を受信し、
前記プライマリオーディオの提示を提供し、
前記セカンダリオーディオの重要性情報および前記現在のオーディオ提示情報に基づいて、前記セカンダリオーディオの提示を提供する
手段を備える。
1つ以上の例では、前記基準ポイントは、前記オーディオコンテンツが提示されるユーザの場所を示す。1つ以上の例では、前記プライマリオーディオは、ユーザとの通信などのための、1人以上のリモートユーザの音声によって生成されていると判定されるオーディオを含む、音声オーディオを含み、前記セカンダリオーディオは、1人以上のリモートユーザの音声によって生成されていると判定されるもの以外のオーディオを含む、周囲の音響を含む。1つ以上の例では、前記プライマリオーディオは、提示されるときに、指向性情報に従って方向または方向の範囲から発生していると知覚されるように指向性情報を含む、空間オーディオを含み、前記セカンダリオーディオは、前記指向性情報を有しないオーディオ、およびオーディオが方向の閾値範囲よりも大きく知覚されるべき方向の範囲を規定する、前記指向性情報を有する空間オーディオのうちの少なくとも1つを含む。1つ以上の例では、前記オーディオコンテンツは、従来の通信ネットワークを介してもよいし、またはボイスオーバーIPもしくは任意の他のパケットベースもしくは回線交換電話通信サービスを介して提供されてもよい、通信の目的で提供されるオーディオコンテンツを含む、通信オーディオコンテンツを含む。前記プライマリオーディオおよび/または前記セカンダリオーディオが空間オーディオを含む1つ以上の例では、前記プライマリオーディオは、それぞれの1つ以上のオーディオオブジェクトにそれぞれ対応付けられた1つ以上のオーディオチャネルを含んでもよい。これらのオーディオオブジェクトはそれぞれ、提示されるときに、対応付けられたオーディオチャネルが知覚される、規定場所を有する。1つ以上の例では、前記プライマリオーディオに対応付けられた場所は、そのように位置し、および/または前記方向の閾値範囲よりも小さい幅を有する。1つ以上の例では、前記セカンダリオーディオに対応付けられた場所は、そのように位置し、および/または前記方向の閾値範囲よりも大きい幅を有する。
1つ以上の例では、前記セカンダリオーディオの重要性情報は、前記オーディオコンテンツとともにリモートユーザデバイスから受信される。1つ以上の例では、前記オーディオコンテンツは、リモートユーザと装置のユーザとの間のコールの一部として提供される。前記セカンダリオーディオの重要性情報は、リモートユーザによって設定されるか、または少なくとも各コールについて自動的に判定される。1つ以上の例では、前記セカンダリオーディオの重要性情報は、リモートユーザデバイスを介してリモートユーザによって設定され、前記オーディオコンテンツに基づく。1つ以上の例では、前記セカンダリオーディオの重要性情報は、リモートユーザデバイスから前記オーディオコンテンツを受信するサーバによって判定され、サーバから受信される。
1つ以上の例では、前記セカンダリオーディオの重要性情報は、重要であることおよび重要でないことを含む、少なくとも2つのレベルの重要性を規定し、
前記装置は、
前記セカンダリオーディオが重要であることを示す前記セカンダリオーディオの重要性情報に基づいて、前記現在のオーディオ提示情報に基づく前記セカンダリオーディオの提示を提供し、
・ 前記セカンダリオーディオが重要でないことを示す前記セカンダリオーディオの重要性情報、および前記1つ以上のオーディオソースのうちのどれもがオーディオを現在提示していないことを示す前記現在のオーディオ提示情報に基づく、前記セカンダリオーディオの提示の提供、および
・ 前記セカンダリオーディオが重要でないことを示す前記セカンダリオーディオの重要性情報、および前記1つ以上のオーディオソースのうちの少なくとも1つがオーディオを現在提示していることを示す前記現在のオーディオ提示情報に基づく、前記セカンダリオーディオの非提示の提供
のうちの少なくとも1つを行う
手段を備える。
1つ以上の例では、前記手段は、
前記セカンダリオーディオが重要であることを示す前記セカンダリオーディオの重要性情報、および前記1つ以上のオーディオソースのうちの少なくとも1つがオーディオを現在提示していることを示す前記現在のオーディオ提示情報に基づいて、前記セカンダリオーディオの提示を提供し、
前記1つ以上のオーディオソースのうちの少なくとも1つの前記オーディオが前記セカンダリオーディオの提示に適応するように提示される、ボリュームまたは方向の前記範囲のうちの一方または両方の修正を提供する
ように構成されている。
1つ以上の例では、前記手段は、前記セカンダリオーディオが重要であることを示す前記セカンダリオーディオの重要性情報、および前記1つ以上のオーディオソースのうちのどれもがオーディオを現在提示していないことを示す前記現在のオーディオ提示情報に基づいて、ユーザの周囲のすべての方向から発生しているとして知覚されるような前記セカンダリオーディオの提示を提供するように構成されている。
1つ以上の例では、前記手段は、前記現在のオーディオ提示情報に基づいて、前記1つ以上のオーディオソースの前記オーディオに対応付けられる方向または方向の範囲に重複しない、方向または方向の範囲から発生しているとして知覚されるように、空間オーディオとして前記プライマリオーディオの提示を提供するように構成されている。
1つ以上の例では、前記手段は、
前記オーディオコンテンツについてのデフォルトの知覚場所を規定する、デフォルトの知覚場所情報を受信し、
前記デフォルトの知覚場所から発生しているとして知覚されるように、空間オーディオとして前記オーディオコンテンツの少なくとも前記プライマリオーディオの提示を提供する
ように構成されている。
1つ以上の例では、前記手段は、前記デフォルトの知覚場所情報が受信されない場合、前記1つ以上のオーディオソースによって提示されるいずれのオーディオとも重複しない、方向または方向の範囲から知覚されるように、空間オーディオとしての前記オーディオコンテンツの前記プライマリオーディオの提示を提供するように構成されてもよい。
1つ以上の例では、前記手段は、
ユーザのユーザオーディオコンテンツを捕捉し、
前記ユーザと、前記リモートユーザデバイスのリモートユーザとの間の通信を提供するために、プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、前記捕捉されたユーザオーディオコンテンツを前記リモートユーザデバイスに送信し、
前記ユーザオーディオコンテンツに対応付けられ、かつ前記リモートユーザデバイスによる使用のための前記ユーザオーディオコンテンツの前記セカンダリオーディオの重要性を示す、前記ユーザから受信されるユーザ入力に基づくセカンダリオーディオの重要性情報を送信する
ように構成されている。
1つ以上の例では、前記プライマリオーディオは、リモートユーザとの通信などのための、少なくともユーザの音声によって生成されていると判定されるオーディオを含む、音声オーディオを含み、前記セカンダリオーディオは、ユーザの音声によって生成されていると判定されるもの以外のオーディオを含む、周囲の音響を含む。1つ以上の例では、前記プライマリオーディオは、提示されるときに、指向性情報に従って方向または方向の範囲から発生していると知覚されるように指向性情報を含む、空間オーディオを含み、前記セカンダリオーディオは、前記指向性情報を有しないオーディオ、およびオーディオが方向の閾値範囲よりも大きく知覚されるべき方向の範囲を規定する、前記指向性情報を有する空間オーディオのうちの少なくとも1つを含む。
1つ以上の例では、前記セカンダリオーディオの重要性情報は、
前記ユーザオーディオコンテンツのオーディオ分析、および
前記ユーザの判定された現在の場所
のうちの1つ以上に基づく。
1つ以上の例では、前記手段は、前記捕捉されたユーザオーディオコンテンツに対応付けられた前記セカンダリオーディオの重要性情報が、前記ユーザオーディオコンテンツが重要でないことを示す判定時に、前記捕捉されたユーザオーディオコンテンツの前記送信の前に、プライマリオーディオおよびセカンダリオーディオとして分類されるものから、モノフォニックおよびステレオフォニックオーディオのうちの一方に、前記捕捉されたユーザオーディオコンテンツを修正するか、またはモノフォニックおよびステレオフォニックのうちの一方として前記ユーザオーディオコンテンツを捕捉するように構成されている。
1つ以上の例では、前記手段は、ユーザモニタリング情報を前記リモートユーザデバイスに送信するように構成されており、
前記ユーザモニタリング情報は、前記セカンダリオーディオがリモートユーザに少なくとも通知するために提示されているかどうかを示す。
1つ以上の例では、前記手段は、ユーザモニタリング情報を前記リモートユーザデバイスに送信するように構成されており、
前記ユーザモニタリング情報は、
前記装置が使用されるときに前記オーディオコンテンツがどこから知覚されるかを含む、基準方向に対して規定される方向を含む提示方向であって、前記リモートユーザデバイスによってリモートユーザに前記オーディオコンテンツを提示する際に使用するための当該提示方向、
前記リモートユーザデバイスによって前記リモートユーザに提示するための前記現在のオーディオ提示情報で規定されるように前記ユーザに提示される、前記1つ以上のオーディオソースのうちの少なくとも1つのオーディオ、および
前記オーディオが、前記リモートユーザデバイスによって、前記1つ以上のオーディオソースのうちの前記少なくとも1つの前記オーディオを前記リモートユーザに提示するために取り出され得る、前記現在のオーディオ提示情報で規定されるように前記ユーザに提示される、前記1つ以上のオーディオソースのうちの少なくとも1つへの参照
のうちの1つ以上を示す。
1つ以上の例では、前記手段は、
前記リモートユーザデバイスからリモートユーザモニタリング情報を受信し、
・ 提示位置に対応する位置から発生しているとして知覚されるような前記ユーザオーディオコンテンツの提示の提供であって、前記リモートユーザデバイスからの前記リモートユーザモニタリング情報が、前記ユーザオーディオコンテンツが前記リモートユーザデバイスによって提示されるときに知覚される、リモートユーザに対する位置を示す、前記提示位置を含む、当該提供、および
・ 前記リモートユーザに現在提示されている1つ以上のオーディオソースのうちの少なくとも1つの前記オーディオの提示の提供であって、前記リモートユーザデバイスから受信される前記リモートユーザモニタリング情報が、前記オーディオ、または前記リモートユーザに提示される前記1つ以上のオーディオソースのうちの前記少なくとも1つへの参照を含む、当該提供
のうちの1つ以上を行う
ように構成されている。
さらなる態様では、方法が提供される。当該方法は、
プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、オーディオコンテンツをリモートユーザデバイスから受信することと、
前記オーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を受信することと、
1つ以上のオーディオソースのそれぞれのオーディオが、基準ポイントの周囲で1つ以上のそれぞれの方向または方向の範囲から発生しているとして知覚されるように、前記1つ以上のオーディオソースからのオーディオが空間オーディオとして現在提示されているかどうかを少なくとも示す、現在のオーディオ提示情報を受信することと、
前記プライマリオーディオの提示を提供することと、
前記セカンダリオーディオの重要性情報および前記現在のオーディオ提示情報に基づいて、前記セカンダリオーディオの提示を提供することと、
を含む。
さらなる態様では、格納されたコンピュータプログラムコードを含むコンピュータ可読媒体が提供される。前記コンピュータ可読媒体および前記コンピュータプログラムコードは、少なくとも1つのプロセッサ上で実行されると、
プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、オーディオコンテンツをリモートユーザデバイスから受信することと、
前記オーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を受信することと、
1つ以上のオーディオソースのそれぞれのオーディオが、基準ポイントの周囲で1つ以上のそれぞれの方向または方向の範囲から発生しているとして知覚されるように、前記1つ以上のオーディオソースからのオーディオが空間オーディオとして現在提示されているかどうかを少なくとも示す、現在のオーディオ提示情報を受信することと、
前記プライマリオーディオの提示を提供することと、
前記セカンダリオーディオの重要性情報および前記現在のオーディオ提示情報に基づいて、前記セカンダリオーディオの提示を提供することと、
の方法を実施するように構成されている。
さらなる態様では、装置が提供される。当該装置は、
リモートユーザへの提示のために、プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、ローカルユーザデバイスによって捕捉されるユーザオーディオコンテンツをリモートユーザデバイスに送信し、
前記ユーザオーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を送信する
手段を備える。
1つ以上の例では、前記ユーザオーディオコンテンツは、前記ローカルユーザデバイスの少なくともユーザのオーディオを含む。
さらなる態様では、方法が提供される。当該方法は、
リモートユーザへの提示のために、プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、ローカルユーザデバイスによって捕捉されるユーザオーディオコンテンツをリモートユーザデバイスに送信することと、
前記ユーザオーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を送信することと、
を含む。
さらなる態様では、格納されたコンピュータプログラムコードを含むコンピュータ可読媒体が提供される。前記コンピュータ可読媒体および前記コンピュータプログラムコードは、少なくとも1つのプロセッサ上で実行されると、
リモートユーザへの提示のために、プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、ローカルユーザデバイスによって捕捉されるユーザオーディオコンテンツをリモートユーザデバイスに送信することと、
前記ユーザオーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を送信することと、
の方法を実施するように構成されている。
さらなる例示的な態様では、
少なくとも1つのプロセッサと、
コンピュータプログラムコードを含む、少なくとも1つのメモリと、
を備える装置が提供される。
前記少なくとも1つのメモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサによって、前記装置に少なくとも、
プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、オーディオコンテンツをリモートユーザデバイスから受信させ、
前記オーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を受信させ、
1つ以上のオーディオソースのそれぞれのオーディオが、基準ポイントの周囲で1つ以上のそれぞれの方向または方向の範囲から発生しているとして知覚されるように、前記1つ以上のオーディオソースからのオーディオが空間オーディオとして現在提示されているかどうかを少なくとも示す、現在のオーディオ提示情報を受信させ、
前記プライマリオーディオの提示を提供させ、
前記セカンダリオーディオの重要性情報および前記現在のオーディオ提示情報に基づいて、前記セカンダリオーディオの提示を提供させる
ように構成されている。
さらなる例示的な態様では、
少なくとも1つのプロセッサと、
コンピュータプログラムコードを含む少なくとも1つのメモリと、
を備える装置が提供される。
前記少なくとも1つのメモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサによって、前記装置に少なくとも、
リモートユーザへの提示のために、プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、ローカルユーザデバイスによって捕捉されるユーザオーディオコンテンツをリモートユーザデバイスに送信させ、
前記ユーザオーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を送信させる
ように構成されている。
本開示は、1つ以上の対応する態様、例、または特徴を、個別にまたは様々な組合せで、その組合せでまたは個別に具体的に述べられている(特許請求されていることを含む)か否かにかかわらず含む。論じられた機能のうちの1つ以上を実行するための、対応する手段および対応する機能ユニット(例えば、機能エネイブラ、スピーカセレクタ、アンプ、ディスプレイデバイス)もまた本開示内にある。
開示される方法のうちの1つ以上を実施するための対応するコンピュータプログラムもまた本開示内にあり、説明された例のうちの1つ以上に包含される。
上述の摘要は、単に例示であり非限定的であるように意図される。
ここで、添付の図面を参照して、単なる例として説明が示される。
図1は、オーディオの提示を提供するための例示的な装置を示す。 図2は、ユーザと、リモートユーザとの間の通信を示す。 図3は、没入型空間オーディオエンコーダの例示的なブロック図を示す。 図4は、ユーザがオーディオを提示される例示的な提示スペースを示す。 図5は、同じ提示スペースを示すが、装置の制御下でユーザに提供されるオーディオが発生していると知覚される場所を示す例示的な空間オーディオシーンが重ねて表示される。 図6は、図5の平面図を示す。 図7は、ユーザモニタリング情報の使用を例示するために、ユーザおよびリモートユーザへのオーディオの提示を示す。 図8は、通信コールを行う際の装置およびリモート装置の動作を示す。 図9は、例示的な方法を示すフローチャートを示す。 図10は、コンピュータ可読媒体を示す。
例示的な態様の説明
モノフォニックなオーディオの捕捉および提示を超えるものを提供する、通信または電話通信システムが開発されている。第3世代パートナーシッププロジェクト(3rd Generation Partnership Project:3GPP)などによって、電話通信サービスでの新しいレベルの没入感を可能にする、没入型電話通信システムが開発されている。没入型電話通信は、ユーザ間通信の提供において、空間オーディオ提示技術の使用および空間オーディオコンテンツの捕捉を含んでもよい。そのようなサービスは、例えば、モバイル4Gまたは5Gネットワークを介して、マルチマイクロフォン空間オーディオ捕捉および処理、好適な没入型オーディオフォーマットでのエンコーディング、伝達およびデコーディング、ならびにバイノーラルまたはスピーカ提示によって実現され得る。そのようなシステムは、パラメトリック空間オーディオなどの没入型空間オーディオコンテンツの伝達および提示を提供してもよい。これは、通信コール参加者またはユーザ間での包囲オーディオシーンの受信および送信を可能にしてもよい。したがって、例えば、リモートユーザがユーザにコールするとき、ユーザは、自分が物理的にリモートユーザの場所に位置しているかのように、逆の場合も同様に、リモートユーザの周囲の音響環境を体験し得る。
しかしながら、1つ以上の例では、ユーザは、既に、1つ以上のオーディオソースからの没入型空間オーディオコンテンツを体験している場合がある。したがって、上記オーディオが1つ以上のそれぞれの方向から知覚されるように、空間オーディオとして提示される1つ以上のオーディオソースからのオーディオを含む、既に存在する空間オーディオシーンと組み合わせて、没入型オーディオ通信コンテンツの提示を提供するように入念な検討を必要としてもよい。例えば、時間、周波数、および/または空間精度での聴覚のマスキングに関する複雑化は、同時に提示中の1つ以上のオーディオソースのうちの少なくとも1つについて生じる場合がある。
1つ以上の例では、上記通信の一部として提供されるオーディオコンテンツは、プライマリオーディオおよびセカンダリオーディオとして分類されてもよい。プライマリオーディオは、通信コールを理解するための重要なオーディオを含んでもよく、一方、セカンダリオーディオは、周囲の音響を含んでもよい。周囲の音響は、オーディオコンテンツの背景オーディオとみなされてもよい。本明細書での例は、通信の分野でのオーディオコンテンツに関するが、原理は、オーディオコンテンツ提示の他の分野に適用されてもよいことが理解されるであろう。
1つ以上の例では、プライマリオーディオは、(ローカルユーザと称されることもある)ユーザとの通信で1人以上のリモートユーザの音声によって生成されていると判定されるオーディオを含む、音声オーディオを含んでもよい。「音声」プライマリオーディオは、オーディオ分析技術を使用して、または上記通信に関与するサーバもしくは任意の他のエンティティによって、捕捉のポイントまたはプレイバックのポイントで分類されてもよい。1つ以上の例では、セカンダリオーディオは、1人以上のリモートユーザの音声によって生成されていると判定されるもの以外のオーディオを含む、周囲の音響を含んでもよい。したがって、1つ以上の例では、ユーザの音声を検出するように構成された第1のマイクロフォンは、プライマリオーディオを提供してもよく、他の場所からのオーディオを検出するように構成された1つ以上の他のマイクロフォンは、セカンダリオーディオを提供してもよい。マルチマイクロフォン配置を用いて、同じオーディオが、2つ以上のマイクロフォンによって検出されてもよく、したがって、オーディオ処理技術は、他のマイクロフォンによって検出されるオーディオから、第1のマイクロフォンによって主として検出される音声オーディオを分離するために使用されてもよいことが理解されるであろう。例えば、オーディオを捕捉するために携帯電話が使用される場合、ユーザの口の近くのマイクロフォンは、主として、音声オーディオを捕捉するように構成されてもよく、携帯電話の後ろにあるマイクロフォンは、周囲の音響を捕捉するように構成されてもよい。1つ以上の例では、単一のマイクロフォンが使用されてもよく、プライマリオーディオおよびセカンダリオーディオとして分類されるオーディオコンテンツを提供するように、任意の周囲のノイズから音声オーディオを分離するために、オーディオ処理アルゴリズムが使用されてもよく、そのようなアルゴリズムは、当業者に既知である。さらなる例では、音声オーディオは、クローズアップマイクロフォンまたはマイクロフォンを使用して捕捉されてもよいが、周囲音は、シーン内で固定された位置を有してもよい(アンビソニックスマイクロフォンなどの)マイクロフォンアレイを使用して捕捉されてもよい。
1つ以上の例では、プライマリオーディオは、指向性情報を含む空間オーディオコンテンツを含んでもよく、その結果、提示されるときに、指向性情報に従って1つ以上の方向から発生しているとして知覚される。1つ以上の例では、プライマリオーディオは、指向性情報を含まない場合がある。1つ以上の例では、セカンダリオーディオは、指向性情報を伴わないか、または閾値レベルよりも上の区別可能な到来方向を伴わないオーディオを含む、周囲の音響を含んでもよい。1つ以上の例では、周囲の音響は、空間オーディオを含むが、ユーザが知覚し得るか、または捕捉されたオーディオから判定され得る、(例えば、指向性の閾値レベルよりも上の)クリアな方向を有しない場合がある。したがって、1つ以上の例では、セカンダリオーディオは、少なくともいくつかの指向性情報も含んでもよい。しかしながら、伝達する側または任意の他の要素は、これらの指向性音声成分を、コミュニケーションに特に関連するか、またはコミュニケーションに知覚的に重要な情報を提供しないものとみなしてもよい。したがって、1つ以上の例では、分類またはコンテンツ分析は、どのオーディオがプライマリとして分類されるべきか、セカンダリとして分類されるべきか、任意で指向性情報がオーディオに対応付けられるべきかどうかを判定するために実行されてもよい。
1つ以上の例では、プライマリオーディオは、通信コールを理解するために重要であってもよく、一方、周囲のセカンダリオーディオは、リモートユーザの場所での背景オーディオであるとみなされてもよい。したがって、通信コールにとって、単に、重要「かも知れない」だけであってもよいことが理解されるであろう。デフォルトでのセカンダリオーディオは、広範囲またはすべての方向から聞かれるように、または不特定の方向もしくは場所から知覚されるように提示するように構成されてもよい。したがって、セカンダリオーディオは、リモートユーザの周囲の音響環境をユーザに再現するために、または逆の場合も同様に、デフォルトで提供されるように構成されてもよい。オーディオコンテンツがオーディオブックである場合、プライマリオーディオは、オーディオブックのリーダーを含んでもよく、一方、セカンダリオーディオは、ストーリーを補うために提供される背景音声を含んでもよい。1つ以上の例では、セカンダリオーディオは、選択的に提示されてもよいし、その提示は、その重要性、および通信コールの受信時にユーザに既に提示されているオーディオのうちの一方または両方に基づいて、そのデフォルト提示から修正されてもよい。
空間オーディオコンテンツを含むプライマリオーディオを用いて、リモートユーザの場所でオーディオが受信された方向は、空間オーディオ提示の使用によって、オーディオを第1のユーザ(または任意の他のユーザ)に提示するときに再生されてもよい。1つ以上の例では、プライマリオーディオは、(空間オーディオコンテンツなどから)モノフォニックオーディオに変換され、それが所望の方向または場所から知覚されるように空間オーディオ提示を使用して提示されてもよい。
空間オーディオは、オーディオのソースが特定の場所または方向に位置しているかのように、特定の場所または方向から発生していると知覚されるような方法でユーザに提示されるオーディオを含む。空間オーディオコンテンツは、空間オーディオとしての提示のためのオーディオを含み、したがって、典型的には、指向性情報(例えば、メタデータとして明示的に指定されるか、またはオーディオが捕捉される方法に本来存在する)を有するオーディオを含み、その結果、その成分オーディオが、指向性情報に従って1つ以上のポイントまたは1つ以上の方向から発生していると知覚されるように、空間オーディオコンテンツが提示され得る。没入型オーディオ通信コールのために空間オーディオをエンコードし、送達するための1つの方法は、ユーザの音声および空間周囲音を別々にエンコードすることである。例えば、ニアファーステレオ、1次アンビソニックス(First Order Ambisonics:FOA)/より高次のアンビソニックス(Higher Order Ambisonics:HOA)(+オブジェクト)、および他の空間オーディオエンコーディングスキームを含む、様々なエンコーディングフォーマットが存在する。1つ以上の例では、プライマリおよびセカンダリオーディオの提供は、上述のエンコーディングスキームによって提供されてもよい。
1つ以上の例では、非空間オーディオコンテンツは、空間オーディオとして提示されてもよい。したがって、「従来の」モノフォニックもしくはステレオフォニックオーディオ(またはそのようなフォーマットに変換されたオーディオ)は、特定の場所または方向から発生していると知覚されるような提示のために提供されてもよい。本明細書で説明される実施形態のうちの1つ以上は、空間オーディオコンテンツまたは非空間オーディオコンテンツに基づいて、空間オーディオを提示してもよい。
空間オーディオの空間ポジショニングは、オーディオがユーザへの提示のために位置付けられ得る、(拡張現実の場合に実世界スペースで整列される)空間オーディオスペースを生成するために、頭部伝達関数を利用するものなどの3Dオーディオ効果によって提供されてもよい。空間オーディオは、頭部伝達関数(Head-Related-Transfer-Function:HRTF)フィルタリング技術を使用することによってヘッドフォンにより、またはスピーカに対して、オーディオコンテンツの知覚される音声の起点を位置付けるためにベクトルベース振幅パンニング技術を使用することにより、提示されてもよい。他の実施形態では、空間オーディオを提示するために、アンビソニックスオーディオ提示が使用されてもよい。
空間オーディオは、オーディオの起点がスペース内の特定の場所または特定の方向にあるという知覚を生成するために、ユーザの耳のそれぞれへの可聴提示間のボリュームの違い、タイミングの違い、およびピッチの違いのうちの1つ以上を使用してもよい。オーディオの知覚された起点までの知覚された距離は、空間オーディオの知覚されたソースからの近さまたは距離を示すために、反響およびゲインの量を制御することによってレンダリングされてもよい。本明細書で説明されるような空間オーディオ提示は、その起点に向かう知覚された方向のみでのオーディオの提示、およびオーディオの起点が、例えば、ユーザからの距離の知覚を含む、知覚された場所を有するような、オーディオの提示に関してもよいことが理解されるであろう。
例示的な図1および例示的な図2は、ユーザ200へのオーディオコンテンツの提示を制御または提供するために使用されてもよい装置100を示す。装置100は、通信の分野のアプリケーションを有してもよく、したがって、以下の例では、オーディオコンテンツは、通信オーディオコンテンツと称される。しかしながら、オーディオコンテンツは、通信のためである必要がないことが理解されるであろう。通信オーディオコンテンツへの参照は、どのようにオーディオコンテンツが送達されるかについて限定しないことを意味し、従来の電話ネットワーク、モバイルもしくは携帯電話ベースのネットワーク、ボイスオーバーIPを使用するインターネットなどのデータネットワーク、またはパケットベースか回線交換型のいずれか任意の電話通信サービスを介するものであってもよいことも理解されるであろう。装置100は、通信オーディオコンテンツ、または別の装置による通信オーディオコンテンツの受信についての情報を受信するための手段、例えば入力Iを、含んでもよい。装置100は、ユーザ200への提示のための他のオーディオソースからのオーディオ、または別の装置によってユーザ200に提示される他のオーディオについての情報を受信するためなどのさらなる入力を含んでもよいことが理解されるであろう。入力Iは、リモートユーザデバイス202(図2に示す)から、プライマリおよびセカンダリオーディオを含む、没入型オーディオなどのオーディオを受信してもよい。1つ以上の例では、装置100は、通信ネットワーク203を介して、リモートユーザデバイス202との通信を提供するための能力を有してもよい、ローカルユーザデバイス201の一部を含んでもよい。ローカルユーザデバイス201および/またはリモートユーザデバイス202は、携帯電話または任意の他の通信機器を備えてもよい。したがって、第1のユーザ200は、リモートユーザデバイス202に対応付けられたリモートユーザ204と通信し得る。
以下の説明は、主として、ローカルユーザデバイス201の一部として装置100を説明するが、対応するリモート装置(図示しないが、装置100に相当する)は、リモートユーザデバイス202の一部として提供されてもよく、それに対してリモートであるグループから受信されるオーディオおよび情報についての相当する機能を実施してもよいことが理解されるであろう。
装置100は、プロセッサ108およびメモリ109を含んでもよいし、それらと接続されてもよく、さらにコンピュータプログラムコードを実行するように構成されてもよい。装置100は、1つのプロセッサ108および1つのメモリ109のみを有してもよいが、他の実施形態は、2つ以上のプロセッサおよび/または2つ以上のメモリ(例えば、同じまたは異なるプロセッサ/メモリタイプ)を利用してもよいことが理解されるであろう。さらに、装置100は、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)であってもよい。
プロセッサは、メモリでコンピュータプログラムコードの形態で格納される命令に従って、通信オーディオコンテンツなど、他の構成要素から受信される情報の実行/処理に特化させた汎用プロセッサであってもよい。プロセッサのそのような動作によって生成される出力シグナリングは、オーディオをユーザ200に提示するためのスピーカ、ヘッドフォン、アンプ、または他のオーディオ提示機器(図示せず)などのさらなる構成要素に向けて提供される。
メモリ109(必ずしも単一のメモリユニットではない)は、コンピュータプログラムコードを格納するコンピュータ可読媒体(この例では、ソリッドステートメモリであるが、ハードドライブ、ROM、RAM、フラッシュなどの他のタイプのメモリであってもよい)である。このコンピュータプログラムコードは、プログラムコードがプロセッサ上で実行されると、プロセッサによって実行可能な命令を格納する。メモリとプロセッサとの間の内部接続は、1つ以上の例示的な実施形態では、プロセッサがメモリ上に格納されたコンピュータプログラムコードにアクセスすることを可能にするように、プロセッサとメモリとの間のアクティブな接続を提供するためであることが理解され得る。
この例では、それぞれのプロセッサおよびメモリは、それぞれの構成要素間での電気的通信を可能にするために、内部で互いに電気的に接続されている。この例では、構成要素はすべて、ASICとして一緒に形成されるように、言い換えると、電子デバイス内に取り付けられ得る単一のチップ/回路として一緒に統合されるように互いに近接して位置している。一部の例では、構成要素のうちの1つ以上またはすべては、互いに別れて位置してもよい。
したがって、ユーザ200は、音楽プレイヤーからの音楽、ラップトップコンピュータ上で提供される作業提示からのオーディオ、および電子メールまたはメッセージの着信をユーザに注意喚起するラップトップコンピュータからのオーディオなどの1つ以上のオーディオソース(図示せず)からのオーディオを提示されてもよい。装置100は、オーディオソースからの前述のオーディオの提示を提供してもよく、もしくはオーディオソースからのオーディオの提示を制御してもよいし、オーディオソースからのどのオーディオがユーザ200に提示されているかについての情報をオーディオ提示機器から受信してもよい。装置100は、通信オーディオコンテンツの提示を提供してもよいし、1つ以上のオーディオソースからのオーディオと組み合わせて、通信オーディオコンテンツの提示を制御してもよい。1つ以上の例では、装置100は、通信からの前述のオーディオおよびオーディオコンテンツの提示の制御のためのユーザインタフェースを提供してもよい。
図3は、没入型オーディオエンコーダによる没入型オーディオコンテンツの捕捉およびエンコーディングの例示的なブロック図を示す。ブロック301は、携帯電話、没入型ビデオ捕捉デバイス、コンピュータ、またはスマートフォンなどの1つ以上のソースからの1つ以上のマイクロフォンによるオーディオの捕捉を示す。ブロック302は、モノフォニック、アンビソニックスオーディオ、複数のチャネルまたはストリームなど、様々なフォーマットで捕捉されてもよいオーディオの受信を示す。1つ以上の例では、上記オーディオは、少なくともオーディオのソースからのオーディオの到来方向またはオーディオのソースの場所を規定してもよいメタデータに、対応付けられてもよい。エンコーダブロック303は、その様々なフォーマットで捕捉されるオーディオを受信する。エンコーダブロック303は、オーディオミキシングを提供してもよい。オーディオに対応付けられたメタデータは、複数の異なるフォーマットで捕捉されてもよい。1つ以上の例では、ブロック303は、メタデータを標準フォーマットに変換してもよい。1つ以上の例では、オーディオ自体は、異なるフォーマットで捕捉およびエンコードされてもよく、ブロック303は、オーディオを標準フォーマットにコード変換してもよい。ブロック304は、没入型オーディオエンコードフォーマットでのビットストリームの生成を提供する。1つ以上の例では、本明細書で称されるオーディオコンテンツは、上述のように処理されてもよい。
例示的な図4は、ユーザ200のリビングルームを備えるオーディオ提示スペース400にいるユーザ200を示す。リビングルーム400は、ソファ401と、書棚402と、大画面テレビ403と、スピーカ404、405と、を備える。ユーザ200は、空間オーディオ提示などの、没入型の方法で提示されるオーディオコンテンツを体験してもよい。オーディオコンテンツは、1つ以上のオーディオソースからであってもよい。オーディオソースは、空間オーディオ、モノフォニックオーディオまたはステレオフォニックオーディオなどの、様々なフォーマットでのオーディオを提供してもよい。オーディオ提示機器(図示しないが、ヘッドフォン406は一部を含んでもよい)は、1つ以上のソースからの空間オーディオとしてオーディオを提示してもよいし、オーディオソースは、どのように、もしくはどの知覚場所から、オーディオソースのそれぞれが基準ポイントに対してそれらのオーディオを提示するかを調整するために通信してもよい。基準ポイントは、典型的には、ユーザの場所である。したがって、1つ以上の例では、1つ以上のオーディオソースのオーディオは、1つ以上のそれぞれの方向またはユーザの周囲の方向の範囲から発生しているとして知覚される。
空間オーディオコンテンツ(例えば、頭部追従バイノーラルオーディオ)をレンダリングすることができる、高品質空間オーディオサービス、アプリケーション、およびデバイスの普及は、それらの使用の著しい増加につながる可能性が高い。逆の場合も同様に、没入型媒体の関心が高まると、市場での提供がますます増えることにつながる。使用が増えると、ユーザ200は、リモートユーザ204がユーザ200への通信コールをするときに空間オーディオコンテンツ(または空間オーディオとして提示されるモノフォニックコンテンツもしくはステレオフォニックコンテンツ)を消費する可能性が高い。さらに、ユーザ200は、空間オーディオ提示の能力をマルチタスクすること、つまり新しい独創的な方法で利用することを望む可能性が高い。
この1つ以上の例では、ユーザ200は、以下で説明されるような没入型空間オーディオを体験してもよい。ユーザ200は、リビングルームの大画面テレビ403を使用してコンピュータ上で作業していてもよく、頭部追従ヘッドフォン406を介して空間オーディオを提示されてもよい。ヘッドフォン406は、リモートユーザ204との通信コールにおいて、そのような通信コールが確立される場合にユーザ参加を可能にするために、マイクロフォン(可視化せず)を提供されてもよい。マイクロフォンは、ヘッドフォン406から独立してもよいことが理解されるであろう。ユーザ200は、作業していることに関連するオーディオを受信し、(ソーシャルメディアアプリケーションオーディオソースからの)ソーシャルメディアアップデートの着信に対応付けられたオーディオ、(音楽プレイヤーオーディオソースからの)音楽、および(コールをユーザが受信またはかける場合、通信デバイスからの)通信オーディオコンテンツを受信することを決定してもよい。ユーザ200は、オーディオソースのオーディオがどこで知覚されるかについての決定を行わない場合があり、その代わりに、配置は、所定の選択もしくはルールに基づくか、または他のオーディオソースと重複しない場所であってもよいことが理解されるであろう。一部の例では、ユーザは、空間オーディオレンダリングおよび提示の少なくともいくつかの態様を制御するために使用されるユーザインタフェースを介してオーディオを知覚する、知覚方向または知覚場所のうちの少なくともいくつかを規定し得る。1つ以上の例では、ユーザがオーディオを知覚する方向または場所は、ユーザが位置する部屋またはスペースに対して規定されてもよい。したがって、ユーザが自らの頭部を回転させるか、または部屋の周囲を移動するにつれて、オーディオのレンダリングは、固定された知覚方向/場所での知覚方向/場所を維持するように、部屋でのユーザの新しい配向または位置を考慮するために修正されてもよい。
図5および図6は、どのようにユーザが空間オーディオシーン500を配置したかを示しており、空間オーディオシーン500は、ユーザが様々なオーディオソースからオーディオを知覚するスペース内の場所を規定する。前述のように、空間オーディオシーンは、ユーザ制御を用いて、またはユーザ制御を用いずに、自動的に生成されてもよい。図5は、図4と同じ図を示し、図6は、同じオーディオ提示スペース400の平面図を示す。
ユーザ200は、提示されるときに前方の位置501から発生していると知覚されるように、自らの作業関連オーディオを配置している。空間オーディオシーン500は、提示されるときに音楽が前方右の位置502から発生していると知覚されるようにさらに構成されている。空間オーディオシーン500は、ソーシャルメディアアップデートのオーディオが後方の位置503から発生していると知覚されるようにさらに構成されている。空間オーディオシーン500は、入って来る任意の通信オーディオコンテンツのオーディオが、前方左の位置504から発生していると知覚されるように提示されるようにさらに構成されている。したがって、1つ以上のオーディオソースからのオーディオが、ヘッドフォン406もしくはスピーカ404、405、またはそれらの組合せによって空間オーディオとして、例えば、ユーザ200に提示される、空間オーディオシーンが生成されてもよく、その結果、各オーディオソースからのオーディオが、ユーザ200に対して異なる方向または場所から知覚される。したがって、オーディオソースのオーディオの知覚された起点は、ユーザ200の周囲でバーチャルに位置付けられていることが理解され得る。
入って来る没入型オーディオ通信コールが受信されるとき、本発明の一部を形成しない空間オーディオシーン500のデフォルト構成は、オーディオソースのオーディオの空間オーディオ提示を、入って来る通信に置き換えてもよい。しかしながら、これは、現在マルチタスクをしていて、空間オーディオシーン500でのオーディオソースの好ましい配置をセットアップさえしているユーザ200にとっては不愉快で不便な場合がある。
以下で説明されるように、どのように通信オーディオコンテンツが、既存の空間オーディオシーン500内での提示の観点で提示されるか、またはユーザ200の空間オーディオシーン500での他のオーディオの提示を置き換えもしくは修正しているかは、装置100によって受信される情報に基づいてもよい。したがって、装置100は、通信オーディオコンテンツのセカンダリオーディオの重要性についての情報を受信してもよい。さらに、装置100は、(もしあれば)既存の空間オーディオシーン500で提示されるオーディオについての情報を受信してもよい。
したがって、1つ以上の例では、装置100は、
オーディオコンテンツの受信、
セカンダリオーディオの重要性情報の受信、および
現在のオーディオ提示情報の受信
の少なくとも一部に基づいて、入って来る通信オーディオコンテンツの提示を提供する手段を備えてもよい。
装置100は、ローカルユーザデバイス201などを介して、ユーザ200への提示のためにリモートユーザデバイス202からであり得る、通信オーディオコンテンツを受信してもよい。通信オーディオコンテンツは、リモートユーザ204の音声と、リモートユーザ204の場所で聴こえる周囲の音響と、を含んでもよい。したがって、通信オーディオコンテンツは、上述のように、プライマリオーディオおよびセカンダリオーディオとして分類されてもよい。
したがって、1つ以上の例では、プライマリオーディオは、音声オーディオを含むものとして規定されてもよい。したがって、プライマリオーディオは、ユーザ200と通信を行うリモートユーザ204の音声によって生成されていると判定されるオーディオを含んでもよい。セカンダリオーディオは、周囲の音響を含むものとして規定されてもよい。したがって、周囲の音響は、リモートユーザ204の音声によって生成されていると判定されるもの以外のオーディオを含んでもよい。
1つ以上の他の例では、プライマリオーディオは、指向性情報を含む空間オーディオコンテンツを含むものとして規定されてもよく、その結果、ユーザ200に提示されるときに、指向性情報に従って特定の方向または方向の範囲から発生しているとして知覚される。これらの1つ以上の例では、より明確でない方向または方向の範囲から知覚される、より拡散するオーディオから、より明確な方向または方向の範囲から知覚されるオーディオを分離することが望ましい場合がある。一部の例では、これは、指向性情報がオーディオに対応付けられているかどうかに基づいて達成されてもよく、したがって、指向性情報を有するオーディオは、プライマリオーディオとして分類され、指向性情報を有しないオーディオは、オーディオ周囲音を構成すると考えられるため、セカンダリオーディオとして分類される。他の例では、対応付けられた指向性情報を有するが、上記対応付けられた指向性情報が、方向の閾値範囲を超える方向の広範囲から知覚されるように提示されるべきであることを示すオーディオをセカンダリオーディオとして分類することが望ましい場合がある。したがって、閾値範囲は180°を含んでもよいので、オーディオが、180°未満の起点の知覚方向を提示されるべきであることを示す指向性情報を有する場合、プライマリオーディオとして考えられ、オーディオが、180°以上の知覚方向を示す指向性情報を有する場合、セカンダリオーディオとして考えられる。閾値は、セカンダリオーディオからプライマリオーディオを分離するための任意の所望の閾値を含んでもよいことが理解されるであろう。
1つ以上の例では、セカンダリオーディオの重要性情報は、上記通信オーディオコンテンツに対応付けられ、そのセカンダリオーディオの重要性を示す。重要性は、リモートユーザ204によって設定される、知覚の重要性であってもよい。例えば、リモートユーザ204は、自らのノイズの多いオフィスから通信コールを行い、周囲のセカンダリオーディオを重要でないと考えてもよい。他の例では、リモートユーザ204は、音楽コンサートにいて、ユーザ200に自らのオーディオ体験を聞いて欲しい場合がある。したがって、リモートユーザ204は、セカンダリオーディオを重要であると考えてもよく、これを自らのリモート装置またはリモートユーザデバイス202に示して、装置100による受信のためにセカンダリオーディオの重要性情報を提供してもよい。1つ以上の例では、周囲の音響を重要でないとみなすリモートユーザ204は、「音声コール」アプリケーションショートカットを使用してコールしてもよい。別の例では、周囲の音響を重要であるとみなすリモートユーザ204は、「没入型コール」アプリケーションショートカットを使用してコールしてもよい。言い換えると、例えば、リモートユーザデバイス202のスマートフォンユーザインタフェース上のアプリケーションアイコンは、周囲の音響であるセカンダリオーディオについての相対的な重要性の異なる2つの場合について異なってもよい。周囲の音響すなわちセカンダリオーディオの重要性を示す任意の他の好適な方法はまた、ユーザが自らの選択を行うために使用され得る。ここで、「音声コール」は、セカンダリオーディオコンテンツが(例えば、オーディオの重要性情報およびネットワーク輻輳などの他のビットレート判定因子に基づいて、)時間変化の方法で、伝達されるビットストリームに存在していて存在していなくてもよい、通信コールを指してもよく、一方、ここで、「没入型コール」は、セカンダリオーディオコンテンツが、好ましくはコール全体を通じて提示のために利用可能である、通信コールを指すことが理解される。
一部の例では、リモート装置またはリモートユーザデバイス202は、例えば、クラウドもしくは近くの端末またはそれらの組合せから受信される、リモート装置またはリモートユーザデバイス202によって収集される知覚データのいずれかに基づいて、例えば、現在の環境の予期された重要性または文脈上の重要性を分析してもよい。リモート装置またはリモートユーザデバイス202は、この情報に基づいて、現在の環境または文脈が、セカンダリオーディオすなわち周囲音を提供するのに重要であるとみなされるとき、例えば、「没入型コール」アプリケーションがまず示されるか、ユーザに好ましいオプションとして別の方法で提供されるように、ユーザインタフェースを適応させるように構成されてもよい。一方、セカンダリオーディオすなわち周囲音が分析によって重要でないとみなされるとき、「音声コール」ショートカットが、ユーザに好ましいかまたはデフォルトのオプションとして、まず示されてもよいし、別の方法で提供されてもよい。少なくとも一部の例では、ネットワークは、この適応を行うためにさらなる情報をデバイスに提供してもよい。例えば、ネットワークが輻輳していて(没入型コールがより多くの帯域幅を必要とするため、「音声コール」が好ましくあるべき)か、または現在のセルもしくは現在の時間に「没入型コール」について特別な価格設定があることを、ネットワークが示してもよい。したがって、様々な例によれば、リモートユーザ204は、少なくとも1つの手段を介して、「周囲音」すなわちセカンダリオーディオの重要性をこのように選択してもよい。
したがって、1つ以上の例では、セカンダリオーディオの重要性情報は、リモートユーザデバイス202によって捕捉されてもよい通信オーディオコンテンツでリモートユーザデバイス202から受信される。1つ以上の例では、セカンダリオーディオの重要性情報は、通信コール毎に設定される。したがって、確立される各通信コールについて、リモートユーザ204は、装置100に送信するためにセカンダリオーディオの重要性情報を設定してもよい。1つ以上の他の例では、セカンダリオーディオの重要性情報の設定は、所定の基準に基づいて自動化されてもよいし、自動化されたオーディオ分析に基づいて自動化されてもよい。例えば、リモートユーザ204が頻繁によく行く場所にいる場合、セカンダリオーディオを、重要でないものとして自動的に設定してもよい。しかしながら、リモートユーザ204がサファリパークなどの珍しい場所にいる場合、セカンダリオーディオを、セカンダリオーディオの重要性情報として通信するために重要なものとして自動的に設定してもよい。1つ以上の例では、上記セカンダリオーディオの重要性情報は、(ネットワーク203の一部として図2に示される)サーバ205によって判定され、サーバ205から受信される。サーバ205は、リモートユーザデバイス202から通信オーディオコンテンツを受信し、上記通信を提供するためにそれをローカルユーザデバイス201に転送してもよい。
1つ以上のオーディオソース例では、現在のオーディオ提示情報は、少なくとも、1つ以上のオーディオソースからのオーディオが現在、空間オーディオとしてユーザに提示されているかどうかを示す。したがって、現在のオーディオ提示情報は、既存の空間オーディオシーン500についての情報を装置100に提供してもよい。この情報は、任意のオーディオソースが現在提示されているかどうかであってもよく、またはそれは、オーディオソースのオーディオの空間オーディオ提示のために使用される場所の詳細を含んでもよい。1つ以上の例では、装置100は、オーディオソースのオーディオを提示するように構成されてもよく、したがって、現在のオーディオ提示情報は、装置100に既知であってもよい。
入って来る通信オーディオコンテンツの提示は、通信オーディオコンテンツのプライマリオーディオの提示を提供することと、セカンダリオーディオの重要性情報および現在のオーディオ提示情報に基づいて、セカンダリオーディオの提示を提供することと、を含んでもよい。したがって、プライマリオーディオは、セカンダリオーディオの重要性情報から独立して、すなわち、それを検討せずに提示されてもよい。装置100は、現在のオーディオ提示情報に基づいて、プライマリオーディオの提示を提供するように構成されてもよい。しかしながら、装置100は、セカンダリオーディオの重要性情報および現在のオーディオ提示情報の両方に基づいて、セカンダリオーディオを提示するかどうか、および/またはそれをどのように(すなわち、どの方向から知覚されるか)提示するかを判定するように構成されてもよい。
1つ以上の例では、装置100は、ある方向または方向の範囲から発生していると知覚されるように、空間オーディオとしてプライマリオーディオの提示を提供するように構成されている。1つ以上の例では、上記「方向の範囲」は、(1)オーディオの知覚された起点の方向/場所の「幅」または「空間範囲」(すなわち、オーディオは、ポイントソースから起きるものとして知覚されない)、および(2)オーディオが、時間の経過とともに方向の上記範囲で移動するように構成されたポイントソースから知覚される、エリア/セクターのうちの一方または両方を含む。どの方向からプライマリオーディオが知覚されるかは、現在のオーディオ提示情報に基づいて判定されてもよい。例えば、ユーザ200が、通信オーディオを知覚する位置または領域504を指定している場合、装置100は、上記所定の位置504から知覚されるように、空間オーディオとして、通信オーディオのプライマリオーディオを提示するように構成されてもよい。次いで、通信オーディオについての所定の位置504が予め決められていない1つ以上の他の例では、装置100は、方向または方向の範囲、すなわち、例えば、現在のオーディオ提示情報に基づいて1つ以上のオーディオソースのオーディオに対応付けられる、ユーザ200に向かう位置501、502、および503からの方向と重複しない位置を識別するように構成されてもよい。したがって、装置100は、既存の空間オーディオシーン500で未使用の位置を識別して、上記未使用の位置から知覚される空間オーディオとしてプライマリオーディオを提示するときに使用するように構成されてもよい。1つ以上の他の例では、現在のオーディオ提示情報は、現在提示されているオーディオがないことを示してもよく、装置100は、ユーザ200の正面の知覚位置、または通信オーディオコンテンツの空間オーディオコンテンツに付随する指向性情報によって規定される任意の他の配置に従う知覚位置から、空間オーディオとして通信オーディオコンテンツのプライマリオーディオを提示するように構成されてもよい。
セカンダリオーディオの重要性情報は、例えば、重要であることおよび重要でないことを含む、少なくとも2つのレベルの重要性を規定してもよい。3つ以上のレベルの重要性が規定されてもよいことが理解されるであろう。
1つ以上の例では、セカンダリオーディオの重要性情報は、受信者適応情報を含んでもよく、リモートユーザまたはリモートユーザデバイス202は、例えば、ローカルユーザの現在提示されているオーディオについての情報を受信するように構成されてもよく、セカンダリオーディオの重要性情報は、上記受信された情報に基づいてもよい。さらに、セカンダリオーディオの重要性情報は、セカンダリオーディオコンテンツによる、少なくとも1つの現在提示されているオーディオソースの提案される置換の規定を含んでもよい。そのような提案を受信すると、装置100は、現在のオーディオ提示を修正するための上記提案を受け入れるかまたは拒否するかを少なくとも選択し得るローカルユーザからユーザ入力を受信するために、ユーザインタフェースの提示を提供するように構成されてもよい。
一般的に、装置は、セカンダリオーディオの重要性情報および現在のオーディオ提示情報に基づいて、セカンダリオーディオを提示するかどうかを判定するように構成されてもよい。さらに、1つ以上の例では、装置は、セカンダリオーディオが提示されるべきイベントで、空間オーディオとして提示されるセカンダリオーディオが発生しているとして知覚される場所を現在のオーディオ提示情報に基づいて判定するように構成されてもよい。
1つ以上の例では、セカンダリオーディオは、通信コールのメインコンテンツではなく、通信コールの周囲の音響であるとみなされてもよい。
したがって、装置100は、セカンダリオーディオが重要である(またはセカンダリオーディオの重要性情報の別の「重要性」指定よりも重要である)ことを示すセカンダリオーディオの重要性情報に基づいて、セカンダリオーディオの提示を提供し、上記提示が、現在のオーディオ提示情報に基づくように構成されてもよい。したがって、セカンダリオーディオが提示に重要または望ましいとみなされるか指定されることに基づいて、装置100は、その提示を必須と考えてもよい。次いで、装置100は、現在のオーディオ提示情報に基づいて、それが提示される方法を検討してもよい。例えば、どの方向からセカンダリオーディオが聞かれるかは、現在のオーディオ提示情報に基づいて判定されてもよい。ユーザが、通信オーディオを知覚する位置または領域504を指定している場合、装置100は、上記所定の位置504から知覚されるように、空間オーディオとして、通信オーディオのセカンダリオーディオを提示するように構成されてもよい。次いで、通信オーディオについての所定の位置504が予め決められていない1つ以上の他の例では、装置100は、方向または方向の範囲、すなわち、例えば、現在のオーディオ提示情報に基づいて1つ以上のオーディオソースのオーディオに対応付けられる、ユーザ200に向かう位置501、502、および503からの方向と重複しない位置を識別するように構成されてもよい。1つ以上の例では、セカンダリオーディオは、モノフォニックオーディオとして提示されてもよく、したがって、知覚される起点場所または方向なしで提示されてもよい。現在のオーディオ提示情報が、現在提示されているオーディオがないことを示す1つ以上の他の例では、装置100は、通信オーディオコンテンツのセカンダリオーディオに付随する指向性情報によって規定される空間配置に従って、ユーザ200の全周囲の知覚位置または方向から空間オーディオとして通信オーディオコンテンツのセカンダリオーディオを提示するように構成されてもよい。
セカンダリオーディオの重要性情報が、セカンダリオーディオが重要であることを示し、現在のオーディオ提示情報が、1つ以上のオーディオソースのうちの少なくとも1つがオーディオをユーザ200に現在提示していることを示す1つ以上の例では、装置100は、セカンダリオーディオの提示を提供し、1つ以上のオーディオソースのうちの少なくとも1つのオーディオがセカンダリオーディオの提示に適応するように提示される、ボリュームまたは方向の範囲のうちの一方または両方の修正を提供するように構成されてもよい。したがって、知覚位置501、502、503からオーディオを提示したボリュームが低減されてもよい。1つ以上の例では、知覚位置501、502、503のサイズは、各オーディオソースのオーディオがより狭い方向の範囲から知覚されるように低減されてもよい。1つ以上の例では、知覚位置501、502、503の位置は、セカンダリオーディオの提示のために既存の空間オーディオシーン500でより大量のスペースが存在するように移動されてもよい。ボリューム、オーディオソースオーディオの知覚位置、および位置501、502、503の知覚サイズのうちの1つ以上の修正が提供される度合いは、セカンダリオーディオの所定の基準および/またはコンテンツに基づいてもよいことが理解されるであろう。例えば、セカンダリオーディオが空間オーディオコンテンツを含む場合、指向性情報は、リモートユーザ204のオーディオ体験を再現するためにセカンダリオーディオが提示されるべき方向の範囲を示してもよい。したがって、装置100は、方向のこの範囲を使用して、既存の空間オーディオシーンを修正するように構成されてもよい。
セカンダリオーディオの重要性情報が、セカンダリオーディオが重要でないことを示す1つ以上の例では、装置100は、セカンダリオーディオを全く提示しないように構成されてもよい。1つ以上の他の例では、装置100は、1つ以上のオーディオソースのうちの少なくとも1つがオーディオをユーザ200に現在提示していることを示す、現在のオーディオ提示情報に基づいて、セカンダリオーディオの非提示を提供するように構成されてもよい。したがって、他のオーディオソースが提示されている場合、重要でないセカンダリオーディオが同様に提示されることは、非常に紛らわしい場合があり、したがって、それは無視されてもよい。1つ以上の例では、重要でないとするセカンダリオーディオの指定によって、リモートユーザデバイス202によるセカンダリオーディオを非送信としてもよい。したがって、装置100は、セカンダリオーディオがなくプライマリオーディオのみを含む通信オーディオコンテンツを受信してもよい。
セカンダリオーディオの重要性情報が、セカンダリオーディオが重要でないことを示す1つ以上の他の例では、装置100は、1つ以上のオーディオソースのうちのどれもがオーディオをユーザ200に現在提示していないことを、現在のオーディオ提示情報が示すときにのみ、セカンダリオーディオの提示を提供するように構成されてもよい。したがって、現在の既存の空間オーディオシーン500がない場合、セカンダリオーディオは、それがセカンダリオーディオの重要性情報において重要でないと考えられるにもかかわらず提示されてもよい。セカンダリオーディオの重要性情報が3つ以上のレベルを含む1つ以上の例では、最も低いレベルの重要性が、常に、セカンダリオーディオの非提示を提供してもよく、一方、高いレベルであるが最も高いレベルではない重要性が、1つ以上のオーディオソースのうちのどれもが、オーディオをユーザ200に現在提示していないことを現在のオーディオ提示情報が示すときなど、現在のオーディオ提示情報に基づく限定された状況でのみ、セカンダリオーディオの提示を提供してもよい。
1つ以上の例では、装置100は、オーディオコンテンツについてのデフォルトの知覚場所を規定する、デフォルトの知覚場所情報を受信してもよい。したがって、装置は、通信オーディオコンテンツの提示のためのデフォルトの知覚場所として、位置504などの位置の設定を提供してもよい。上記デフォルトの知覚場所の設定は、現在のオーディオ提示情報で提供されてもよい。他の例では、デフォルトの知覚場所の別々の指定は、通信オーディオコンテンツの提示での装置100による使用のための現在のオーディオ提示情報から独立して提供されてもよいことが理解されるであろう。1つ以上の例では、装置100は、通信オーディオコンテンツの受信時に、上記デフォルトの知覚場所が設定される場合、上記コンテンツの少なくとも上記プライマリオーディオが、上記デフォルトの知覚場所から発生しているとして知覚される空間オーディオとしての提示を提供されるように構成されてもよい。1つ以上の例では、装置100は、通信オーディオコンテンツの受信時に、上記デフォルトの知覚場所が設定されない場合、1つ以上のオーディオソースから提示されるいずれのオーディオとも重複しない、方向または方向の範囲から知覚されるように、上記コンテンツの少なくともプライマリオーディオが空間オーディオとしての提示を提供されるように構成されてもよい。したがって、方向は、異なるオーディオ間の知覚される空間の重複を回避するように自動的に判定される。
したがって、装置100は、提案される没入型オーディオコールなどの、プライマリおよびセカンダリオーディオを含む通信オーディオコンテンツの受信時に、通信オーディオコンテンツの提示が、少なくともセカンダリオーディオの重要性情報の存在によって制御され得るため、有利な場合がある。セカンダリオーディオの重要性情報は、セカンダリオーディオがどれほど重要かに関して装置100にシグナリングするための手段をリモートユーザ204、リモートユーザデバイス202、またはサーバ205に有利に提供してもよい。したがって、装置100は、入って来る通信オーディオコンテンツをユーザ200にどのようにレンダリングおよび/または提示するかについて、情報に基づく選択をしてもよい。
上記では、ローカルユーザデバイス201は、リモートユーザデバイス202から通信オーディオコンテンツを受信するものとして説明される。しかし当然のことながら、双方向通信を提供するために、ローカルユーザデバイス201は同様に、ユーザ通信オーディオコンテンツ(または上述のオーディオコンテンツから意味的に区別するために、より一般的には「ユーザオーディオコンテンツ」)と称される、ユーザ200のオーディオコンテンツおよびその周囲の音響を捕捉するように構成されてもよい。したがって、装置100は、ユーザ200とリモートユーザデバイス202のリモートユーザ204との間の通信を提供するために、上記ユーザ通信オーディオコンテンツをリモートユーザデバイス202に送信するように構成されてもよい。装置は、ユーザ通信オーディオコンテンツの送信を提供するために、通信デバイスまたはトランスミッタを制御してもよい。1つ以上の例では、上記ユーザ通信オーディオコンテンツは、通信オーディオコンテンツと同様に、プライマリオーディオと、セカンダリオーディオと、を含む。
さらに、装置100は、例えば、リモートユーザデバイス202のリモート装置による使用のためのセカンダリオーディオの重要性情報の生成および送信を提供するように構成されてもよい。当然のことながら、装置100によって提供されるセカンダリオーディオの重要性情報は、上記ユーザ通信オーディオコンテンツに対応付けられて、ユーザ通信オーディオコンテンツのセカンダリオーディオの重要性を示してもよい。
リモートユーザデバイス202に送信されるユーザ通信オーディオコンテンツに対応付けられたセカンダリオーディオの重要性情報は、ユーザ200から受信されるユーザ入力に基づいてもよい。したがって、1つ以上の例では、ユーザ200は、ユーザ入力を通じて、通信コールを開始するときにおよび/または通信コール中に、セカンダリオーディオの重要性を示してもよい。1つ以上の他の例では、ユーザ通信オーディオコンテンツに対応付けられたセカンダリオーディオの重要性情報は、装置100、ローカルユーザデバイス201、またはサーバ205によって実行されるオーディオ分析によって自動的に判定されてもよい。ユーザ200は、セカンダリオーディオの重要性情報の自動的な判定を確認するように要求されても要求されなくてもよい。したがって、装置100は、確認のユーザ入力を受信するように構成されていても構成されていなくてもよい。1つ以上の他の例では、ユーザ通信オーディオコンテンツに対応付けられたセカンダリオーディオの重要性情報は、ユーザ200の現在の場所に基づいて、自動的に判定されてもよい。例えば、ユーザ200の現在の場所は、現在の場所が珍しいかまたは注目に値するかどうか、したがって、セカンダリオーディオの潜在的な重要性を判定するために、ユーザ200(または多くの他のユーザ)がそこにいたことのある地図データまたは歴史的な場所と比較されてもよい。
上述のように、セカンダリオーディオの重要性情報が、セカンダリオーディオが重要でないことを示すとき、装置100は、特定の場所からの空間オーディオとしてセカンダリオーディオを提示しないように構成されてもよいし、提示するように構成されてもよいし、空間オーディオ提示なしで構成されてもよい。したがって、セカンダリオーディオは、ネットワーク203を介して提供されてもよいが、最終的に使用されない場合がある。したがって、1つ以上の例では、装置100は、ユーザ通信コンテンツに対応付けられたセカンダリオーディオの重要性情報が、セカンダリオーディオが重要でないことを示すことに基づいて、リモートユーザデバイス202に送信する前に、セカンダリオーディオを修正するか、またはセカンダリオーディオを除去するために、ユーザ通信オーディオコンテンツの修正を提供してもよい。1つ以上の例では、対応付けられた指向性情報を用いて、またはそれを用いずに送信するためにプライマリオーディオのみが提供されてもよい。1つ以上の例では、装置100は、プライマリオーディオおよびセカンダリオーディオとして分類されるものから、モノフォニックおよびステレオフォニックオーディオのうちの一方を含むものへの、ユーザ通信オーディオコンテンツのオーディオ修正を提供するように構成されてもよい。したがって、セカンダリオーディオが重要でない場合、没入型コールの提供の関連性が失われてもよく、通信コールは、モノフォニックまたはステレオフォニックオーディオコールに「ダウングレード」されてもよい。そのようなモノフォニックまたはステレオフォニックオーディオコールは、少なくとも一部の例では、オーディオコール中に唯一伝達されたオーディオコンテンツであってもよいプライマリオーディオコンテンツのための少なくともいくつかの空間情報を含んでもよい。
セカンダリオーディオがどのように提示されるか、またはセカンダリオーディオが本当に提示されるかどうかは、セカンダリオーディオの重要性情報に少なくとも基づいて、装置100によって選択されてもよい。1つ以上の例では、リモートユーザ204またはリモートユーザデバイス202が、装置100によって行われる選択を把握していることが有利な場合がある。したがって、1つ以上の例では、装置100は、リモートユーザデバイス202へのユーザモニタリング情報の送信を提供するように構成されてもよい。ユーザモニタリング情報は少なくとも、通信オーディオのセカンダリオーディオが、少なくともリモートユーザ204またはリモートユーザデバイスに通知するためにユーザ200に提示されているかどうかを示す。
したがって、ユーザモニタリング情報に基づいて、リモートユーザデバイス202に対応付けられた装置100に相当するリモート装置は、ユーザ200に送信しているセカンダリオーディオがユーザ200に提示されているかどうかのリモートユーザ204への通知を提供するように構成されてもよい。
同様に、リモートユーザデバイス202またはリモート装置から装置100によって受信されるユーザモニタリング情報に基づいて、装置100は、リモートユーザ204に送信しているユーザ通信オーディオコンテンツのセカンダリオーディオがリモートユーザ204に提示されているかどうかをユーザ200に通知するように構成されてもよい。
関連ユーザ200、204への通知は、テキスト、図形、聴覚、または触覚によるメッセージなどのメッセージの提示を含んでもよい。
ユーザモニタリング情報は、通信オーディオまたはユーザ通信オーディオのソースへのフィードバックとみなされて、それがその送信先でどのように提示されているかについての情報を提供してもよい。
ユーザモニタリング情報は、(ユーザ)通信オーディオコンテンツの提示の他のパラメータについて示してもよい。
1つ以上の例では、ユーザ200が提示位置504から発生しているように通信オーディオコンテンツを知覚するような、通信オーディオコンテンツのユーザ200への提示に対応付けられたユーザ200に対する位置を含む提示位置504を、ユーザモニタリング情報が示してもよい。したがって、リモートユーザデバイス202またはそのリモート装置は、ユーザ200が通信オーディオコンテンツの起点を現在知覚している、提示スペース400または空間オーディオシーン500での場所を通知されてもよい。
リモートユーザデバイス202またはリモート装置は、相当する提示位置504での通信オーディオコンテンツのリモートユーザ204への提示を提供するように構成されてもよい。したがって、リモートユーザの自己生成オーディオ、すなわち、通信オーディオコンテンツは、ユーザ200に対して位置504に相当する前方左の位置から知覚されるように捕捉されて、リモートユーザ204に提示される。
同様に、装置100は、リモートユーザデバイス202またはそのリモート装置から、明確にするためにリモートユーザモニタリング情報と称される、対応するユーザモニタリング情報を受信するように構成されてもよい。したがって、リモートユーザモニタリング情報に基づいて、装置100は、上記リモートユーザモニタリング情報で示される提示位置に対応する、ユーザ200に対する方向または場所から、ユーザ通信オーディオコンテンツのユーザ200への提示を提供するように構成されてもよい。
例示的な図7を参照して、リモートユーザ204は701に示されているが、これは、リモートユーザ204のオーディオ環境を示す。通信オーディオコンテンツは、プライマリオーディオとしてのリモートユーザ204の少なくとも音声と、(猫を含む)場所705および(犬を含む)場所706から受信される周囲のセカンダリオーディオの少なくとも2つの実体と、を含む。
ユーザ200は702に示されているが、これは、ユーザ200のオーディオ環境およびユーザ200に提示される空間オーディオシーンを示す。リモートユーザからの通信オーディオコンテンツ(プライマリおよびセカンダリオーディオ)は、位置707から発生していると知覚されるように提示されるように生じる。ユーザ200はまた、オーディオソースのオーディオを聴いており、これは、位置708から発生していると知覚されるように提示される。この例では、オーディオソースのオーディオは、音符によって示される音楽である。位置709(子供)および位置710(第2の子供)に、ユーザ200を取り囲む周囲の音響のいくつかのソースもある。
装置100によって提供されるユーザモニタリング情報は、ユーザ200が通信オーディオコンテンツを知覚する場所を含む場所707、すなわち、位置707を示す情報を含んでもよい。
上記ユーザモニタリング情報を受信したリモートユーザ204は、703に示されている。したがって、リモートユーザデバイスのリモート装置は、位置707に対応する位置711での通信オーディオコンテンツの提示を提供している。したがって、リモートユーザ204は、ユーザ200がその通信オーディオコンテンツを知覚している、空間オーディオシーン500での場所を知っている。これがリモートグループのオーディオシーンを理解するうえで有利な場合がある。したがって、オーディオコンテンツ(例えば、プライマリオーディオおよび/またはセカンダリオーディオ)が、基準方向(例えば、ユーザが面している方向)に対してユーザによって知覚されるかまたは知覚されている方向が、ユーザモニタリング情報としてリモートユーザデバイスに提供されてもよい。次いで、オーディオコンテンツは、リモートユーザに、そのオーディオコンテンツがどのようにユーザに提示されているかを理解させるために、ユーザモニタリング情報に作用するリモートユーザデバイスによってリモートユーザに提示され得る。
1つ以上の例では、ユーザモニタリング情報は、リモートユーザデバイス202またはその相当するリモート装置によってリモートユーザ204に提示するための現在のオーディオ提示情報で規定されるようにユーザに提示される、1つ以上のオーディオソースのうちの少なくとも1つのオーディオを示してもよい。したがって、ユーザモニタリング情報は、ユーザ200によって聴かれるオーディオソースオーディオの、リモートユーザデバイス202に送信されるオーディオストリームを含んでもよい。1つ以上の例では、ユーザ200によってプライベートであるとして指定されるオーディオは、ストリーミングされない。1つ以上の例では、ユーザモニタリング情報は、ユーザ200に提示される1つ以上のオーディオソースのうちの少なくとも1つ(すなわち、708で提示される音楽)への、URLまたはリンクなどの参照を示してもよい。
オーディオソースオーディオまたはそこへの参照を含むときのユーザモニタリング情報の使用が704に示されている。リモートユーザ204は、位置707に対応する位置711での通信オーディオコンテンツ、ならびに706および705での周囲の音響を再び含むオーディオシーン内で、704に示されている。しかしながら、さらに、ユーザモニタリング情報に基づいて、リモート装置は、位置708に対応し得る712で示されるように、音符によって示され、ユーザ200によって聴かれる音楽のリモートユーザ204への提示を提供してもよい。この例では、ユーザ通信オーディオのセカンダリオーディオは、位置709および710に対応する位置713および714で提示される。子供および第2の子供は、リモートユーザ204とともに物理的に存在するものではなくリモートユーザ204の空間オーディオシーンに存在する単なるオーディオであることを示すためにボックスで示される。
図7の説明は、リモートユーザデバイス202または装置100に相当するそのリモート装置が、ユーザモニタリング情報に基づいてどのようにオーディオの提示を提供し得るかに関するが、装置100が、リモートユーザモニタリング情報と称される、リモートユーザデバイス202からのユーザモニタリング情報に基づいて、相当する動作を実行してもよいことが理解されるであろう。
したがって、装置100は、リモートユーザデバイスから受信されるリモートユーザモニタリング情報に基づいて、リモートユーザ204に対する位置に対応し、リモートユーザがユーザ通信コンテンツを知覚する、ユーザ200に対する位置から知覚されるように、ユーザ通信コンテンツのユーザ200への提示を提供するように構成されてもよい。したがって、この例では、リモートユーザモニタリング情報は、リモートユーザが、提示位置から発生しているようにユーザ通信オーディオコンテンツ(少なくともそのプライマリオーディオ)を知覚するような、ユーザ通信オーディオコンテンツのリモートユーザ204への提示に対応付けられたリモートユーザ204に対する位置を含む、提示位置を含む。
1つ以上の例では、装置100は、リモートユーザデバイス202から受信されるリモートユーザモニタリング情報に基づいて、リモートユーザ204に現在提示されている1つ以上のオーディオソースのうちの少なくとも1つのオーディオのユーザ200への提示を提供するように構成されてもよい。この例では、リモートユーザデバイス202から受信される上記リモートユーザモニタリング情報は、上記オーディオ、またはリモートユーザ204に提示される1つ以上のオーディオソースのうちの少なくとも1つに対する参照を含む。
図8は、801でリモート装置の観点から、802で装置100の観点から、通信コールを示す一対のフローチャートを示す。典型的には、上記通信コールは双方向であり、したがって、各装置100は、他方から受信される情報およびコンテンツに少なくとも部分的に基づいて、両方のフローチャートで動作を実行し得ることが理解されるであろう。
フローチャート801は、803において、没入型通信コールを開始するリモートユーザ204を示す。リモートユーザ204は、さらに、804において、セカンダリオーディオの重要性を示すためのユーザ入力を提供してもよい。ユーザ入力に基づいて、セカンダリオーディオの重要性情報と称される適切なシグナリングが、805において、生成および伝達される。リモート装置は、806において、ユーザ200の装置100からユーザモニタリング情報を受信してもよい。
フローチャート802は、オーディオソースのオーディオが提示されているユーザ200を示す。ユーザ200は、ステップ807において、現在のオーディオ提示情報を設定してもよい。装置100は、808において、ステップ805において送信されるセカンダリオーディオの重要性情報とともにリモートユーザから通信オーディオコンテンツを受信してもよい。装置100は、ステップ809において、セカンダリオーディオの重要性情報、現在のオーディオ提示情報、および任意でデフォルトの知覚場所に基づいて、通信オーディオコンテンツとともにオーディオソースのオーディオのレンダリングを提供してもよい。
したがって、ローカルユーザデバイスを介したリモートユーザ204への提示のためにユーザ通信オーディオコンテンツをリモートユーザデバイス202に提供するように構成された装置100も開示する。上記ユーザ通信オーディオコンテンツは、ローカルユーザデバイス201の少なくともユーザのオーディオを含む。上記通信オーディオコンテンツは、プライマリオーディオと、セカンダリオーディオと、を含む。装置100は、さらに、上記ユーザ通信オーディオコンテンツのセカンダリオーディオの重要性を示す、上記ユーザ通信オーディオコンテンツに対応付けられたセカンダリオーディオの重要性情報を提供するように構成されてもよい。
図9はフロー図を示す。このフロー図は、
プライマリオーディオ、および前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオを含む、オーディオコンテンツをリモートユーザデバイスから受信するステップ900と、
前記オーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を受信するステップ901と、
1つ以上のオーディオソースのそれぞれのオーディオが、基準ポイントの周囲で1つ以上のそれぞれの方向または方向の範囲から発生しているとして知覚されるように、前記1つ以上のオーディオソースからのオーディオが空間オーディオとして現在提示されているかどうかを少なくとも示す、現在のオーディオ提示情報を受信するステップ902と、
前記プライマリオーディオの提示を提供するステップ903と、
前記セカンダリオーディオの重要性情報および前記現在のオーディオ提示情報に基づいて、前記セカンダリオーディオの提示を提供するステップ904と、
を示す。
図10は、一例による、プログラムを提供するコンピュータ/プロセッサ可読媒体1000を概略的に示す。この例では、コンピュータ/プロセッサ可読媒体は、デジタルバーサタイルディスク(Digital Versatile Disc:DVD)またはコンパクトディスク(Compact Disc:CD)などのディスクである。一部の例では、コンピュータ可読媒体は、発明の機能を実施するような方法でプログラムされた任意の媒体であってもよい。コンピュータプログラムコードは、同じタイプの複数のメモリ、またはROM、RAM、フラッシュ、ハードディスク、ソリッドステートなどの異なるタイプの複数のメモリ間で分配されてもよい。
ユーザ入力は、タップ、スワイプ、スライド、プレス、ホールド、回転ジェスチャー、デバイスのユーザインタフェースの近くでの静的ホバリングジェスチャー、デバイスの近くでの移動ホバリングジェスチャー、デバイスの少なくとも一部を曲げること、デバイスの少なくとも一部をつかむこと、複数本の指によるジェスチャー、デバイスを傾けること、または制御デバイスを裏返すことのうちの1つ以上を含む、ジェスチャーであってもよい。さらに、ジェスチャーは、腕などのユーザの体や、フリースペースユーザジェスチャーを実行するのに好適なスタイラスまたは他の要素を使用する、任意のフリースペースユーザジェスチャーであってもよい。
上述の例に示される装置は、ポータブル電子デバイス、ラップトップコンピュータ、携帯電話、スマートフォン、タブレットコンピュータ、携帯情報端末(Personal Digital Assistant:PDA)、デジタルカメラ、スマートウォッチ、スマートアイウェア、ペンベースのコンピュータ、非ポータブル電子デバイス、デスクトップコンピュータ、モニター、スマートテレビ、サーバ、ウェアラブル装置、仮想現実装置、またはそれらの1つ以上についてのモジュール/回路であってもよい。
任意の前述の装置および/または特定の前述の装置の他の特徴は、例えば、スイッチオンなど、有効にされるときにのみ所望の動作を実行するように構成された状態になるように用意された装置によって提供されてもよい。そのような場合、それらは、必ずしも、有効でないとき(例えば、スイッチオフ状態)にアクティブメモリ内にロードされる適切なソフトウェアを有しておらず、有効なとき(例えば、オン状態)に適切なソフトウェアをロードするだけであってもよい。装置は、ハードウェア回路および/またはファームウェアを備えてもよい。装置は、メモリ上にロードされるソフトウェアを備えてもよい。そのようなソフトウェア/コンピュータプログラムは、同じメモリ/プロセッサ/機能ユニットおよび/または1つ以上のメモリ/プロセッサ/機能ユニット上に記録されてもよい。
一部の例では、特定の前述の装置は、所望の動作を実行するための適切なソフトウェアで予めプログラムされてもよい。適切なソフトウェアは、例えば、ソフトウェアおよび関連するその機能をロック解除/有効にするための「キー」をダウンロードするユーザによって使用のために有効にされ得る。そのような例に対応付けられる利点は、さらなる機能がデバイスに必要なときにデータをダウンロードする要求が少ないことを含み得る。これは、デバイスが、ユーザによって有効にされない場合がある機能のためにそのような予めプログラムされたソフトウェアを格納するのに十分な能力を有すると認識される例で有用であり得る。
任意の前述の装置/回路/要素/プロセッサは、前述の機能に加えて、他の機能を有してもよい。これらの機能は、同じ装置/回路/要素/プロセッサによって実行されてもよい。1つ以上の開示された態様は、関連するコンピュータプログラム、および適切なキャリア(例えば、メモリ、信号)上に記録される(エンコードされるソース/輸送であってもよい)コンピュータプログラムの電子分配を包含してもよい。
本明細書で説明される任意の「コンピュータ」は、同じ回路基板もしくは回路基板の同じ領域/位置または同じデバイスにさえ位置していても位置していなくてもよい、1つ以上の個々のプロセッサ/処理要素の集合を備え得る。一部の例では、任意の前述のプロセッサのうちの1つ以上は、複数のデバイスで分配されてもよい。同じまたは異なるプロセッサ/処理要素は、本明細書で説明される1つ以上の機能を実施してもよい。
「シグナリング」という用語は、一連の伝達および/または受信された電気/光信号として伝達される1つ以上の信号を指してもよい。一連の信号は、上述のシグナリングを構成するための、1つ、2つ、3つ、4つ、もしくはさらに多くの個々の信号構成要素または別個の信号を含んでもよい。これらの個々の信号のうちの一部またはすべては、同時に、連続して、および/または一時的に互いに重複するように、無線または有線通信によって伝達/受信されてもよい。
任意の前述のコンピュータならびに/またはプロセッサおよび(例えば、ROM、CD-ROMなどを含む)メモリの任意の説明を参照して、これらは、コンピュータプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(Field-Programmable Gate Array:FPGA)、および/または発明の機能を実施するような方法でプログラムされた他のハードウェア構成要素を備えてもよい。
本明細書の出願人は、2つ以上の特徴または特徴の組合せが本明細書に開示される任意の問題を解決するかどうかにかかわらず、特許請求の範囲を限定することなく、当業者の一般的な知見に照らして、そのような特徴または組合せが全体として本明細書に基づいて実行されることが可能な程度まで、本明細書で説明される個々の特徴を個別に、2つ以上のそのような特徴の任意の組合せを開示する。出願人は、開示された態様/例が任意のそのような個々の特徴または特徴の組合せで構成されてもよいことを示す。前述の説明の観点から、本開示の範囲内で様々な修正が行われてもよいことが当業者に明らかであろう。
例示に適用されるような基本的な新しい特徴が示され、説明され、指摘されているが、説明されるデバイスおよび方法の形態および詳細における様々な省略ならびに置換および変更が、本開示の範囲から逸脱することなく当業者によって行われてもよいことが理解されるであろう。例えば、同じ結果を達成するために実質的に同じ方法で実質的に同じ機能を実施する、それらの要素および/または方法ステップのすべての組合せが、本開示の範囲内にあることが明確に意図される。さらに、任意の開示された形態または例に関連して示され、かつ/または説明される構造および/もしくは要素ならびに/または方法ステップが、設計選択の一般的な事項として、任意の他の開示、説明、または提案された形態または例に組み込まれてもよいことを認識されたい。さらに、特許請求の範囲において、ミーンズプラスファンクションクレームは、記載された機能を実施するとして本明細書で説明される構造をカバーするように意図され、これは構造的な等価物だけでなく等価構造も含まれる。したがって、釘は、木製部品を一緒に固定するために円柱形表面を採用するが、一方、ねじは、らせん形表面を採用するという点で、釘およびねじは構造的な等価物でない場合があるが、木製部品を固定する環境では、釘およびねじは等価構造であってもよい。

Claims (15)

  1. プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、オーディオコンテンツをリモートユーザデバイスから受信し、
    前記オーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を受信し、
    1つ以上のオーディオソースのそれぞれのオーディオが、基準ポイントの周囲で1つ以上のそれぞれの方向または方向の範囲から発生しているとして知覚されるように、前記1つ以上のオーディオソースからのオーディオが空間オーディオとして現在提示されているかどうかを少なくとも示す、現在のオーディオ提示情報を受信し、
    前記プライマリオーディオの提示を提供し、
    前記セカンダリオーディオの重要性情報および前記現在のオーディオ提示情報に基づいて、前記セカンダリオーディオの提示を提供する
    手段を備える装置。
  2. 前記セカンダリオーディオの重要性情報は、重要であることおよび重要でないことを含む、少なくとも2つのレベルの重要性を規定し、
    前記装置は、
    前記セカンダリオーディオが重要であることを示す前記セカンダリオーディオの重要性情報に基づいて、前記現在のオーディオ提示情報に基づく前記セカンダリオーディオの提示を提供し、
    ・ 前記セカンダリオーディオが重要でないことを示す前記セカンダリオーディオの重要性情報、および前記1つ以上のオーディオソースのうちのどれもがオーディオを現在提示していないことを示す前記現在のオーディオ提示情報に基づく、前記セカンダリオーディオの提示の提供、および
    ・ 前記セカンダリオーディオが重要でないことを示す前記セカンダリオーディオの重要性情報、および前記1つ以上のオーディオソースのうちの少なくとも1つがオーディオを現在提示していることを示す前記現在のオーディオ提示情報に基づく、前記セカンダリオーディオの非提示の提供
    のうちの少なくとも1つを行う
    ように構成される、請求項1に記載の装置。
  3. 前記手段は、
    前記セカンダリオーディオが重要であることを示す前記セカンダリオーディオの重要性情報、および前記1つ以上のオーディオソースのうちの少なくとも1つがオーディオを現在提示していることを示す前記現在のオーディオ提示情報に基づいて、前記セカンダリオーディオの提示を提供し、
    前記1つ以上のオーディオソースのうちの少なくとも1つの前記オーディオが前記セカンダリオーディオの提示に適応するように提示される、ボリュームまたは方向の前記範囲のうちの一方または両方の修正を提供する
    ように構成されている、請求項2に記載の装置。
  4. 前記手段は、前記セカンダリオーディオが重要であることを示す前記セカンダリオーディオの重要性情報、および前記1つ以上のオーディオソースのうちのどれもがオーディオを現在提示していないことを示す前記現在のオーディオ提示情報に基づいて、ユーザの周囲のすべての方向から発生しているとして知覚されるような前記セカンダリオーディオの提示を提供するように構成されている、請求項2または3に記載の装置。
  5. 前記現在のオーディオ提示情報に基づいて、前記1つ以上のオーディオソースの前記オーディオに対応付けられる方向または方向の範囲に重複しない、方向または方向の範囲から発生しているとして知覚されるように、空間オーディオとして前記プライマリオーディオの提示を提供するように構成される、請求項1から4のいずれかに記載の装置。
  6. 前記手段は、
    前記オーディオコンテンツについてのデフォルトの知覚場所を規定する、デフォルトの知覚場所情報を受信し、
    前記デフォルトの知覚場所から発生しているとして知覚されるように、空間オーディオとして前記オーディオコンテンツの少なくとも前記プライマリオーディオの提示を提供する
    ように構成されている、請求項1から5のいずれかに記載の装置。
  7. 前記手段は、
    ユーザのユーザオーディオコンテンツを捕捉し、
    前記ユーザと、前記リモートユーザデバイスのリモートユーザとの間の通信を提供するために、プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、前記捕捉されたユーザオーディオコンテンツを前記リモートユーザデバイスに送信し、
    前記ユーザオーディオコンテンツに対応付けられ、かつ前記リモートユーザデバイスによる使用のための前記ユーザオーディオコンテンツの前記セカンダリオーディオの重要性を示す、前記ユーザから受信されるユーザ入力に基づくセカンダリオーディオの重要性情報を送信する
    ように構成されている、請求項1から6のいずれかに記載の装置。
  8. 前記セカンダリオーディオの重要性情報は、
    前記ユーザオーディオコンテンツのオーディオ分析、および
    前記ユーザの判定された現在の場所
    のうちの1つ以上に基づく、請求項7に記載の装置。
  9. 前記手段は、前記捕捉されたユーザオーディオコンテンツに対応付けられた前記セカンダリオーディオの重要性情報が、前記ユーザオーディオコンテンツが重要でないことを示す判定時に、前記捕捉されたユーザオーディオコンテンツの前記送信の前に、プライマリオーディオおよびセカンダリオーディオとして分類されるものから、モノフォニックおよびステレオフォニックオーディオのうちの一方に、前記捕捉されたユーザオーディオコンテンツを修正するか、またはモノフォニックおよびステレオフォニックのうちの一方として前記ユーザオーディオコンテンツを捕捉するように構成されている、請求項7または8に記載の装置。
  10. 前記手段は、ユーザモニタリング情報を前記リモートユーザデバイスに送信するように構成されており、
    前記ユーザモニタリング情報は、前記セカンダリオーディオがリモートユーザまたは前記リモートユーザデバイスに少なくとも通知するために提示されているかどうかを示す、請求項1から9のいずれかに記載の装置。
  11. 前記手段は、ユーザモニタリング情報を前記リモートユーザデバイスに送信するように構成されており、
    前記ユーザモニタリング情報は、
    前記装置が使用されるときに前記オーディオコンテンツがどこから知覚されるかを含む、基準方向に対して規定される方向を含む提示方向であって、前記リモートユーザデバイスによってリモートユーザに前記オーディオコンテンツを提示する際に使用するための当該提示方向、
    前記リモートユーザデバイスによって前記リモートユーザに提示するための前記現在のオーディオ提示情報で規定されるように前記ユーザに提示される、前記1つ以上のオーディオソースのうちの少なくとも1つのオーディオ、および
    前記オーディオが、前記リモートユーザデバイスによって、前記1つ以上のオーディオソースのうちの前記少なくとも1つの前記オーディオを前記リモートユーザに提示するために取り出され得る、前記現在のオーディオ提示情報で規定されるように前記ユーザに提示される、前記1つ以上のオーディオソースのうちの少なくとも1つへの参照
    のうちの1つ以上を示す、請求項1から10のいずれかに記載の装置。
  12. 前記手段は、
    前記リモートユーザデバイスからリモートユーザモニタリング情報を受信し、
    ・ 提示位置に対応する位置から発生しているとして知覚されるような前記ユーザオーディオコンテンツの提示の提供であって、前記リモートユーザデバイスからの前記リモートユーザモニタリング情報が、前記ユーザオーディオコンテンツが前記リモートユーザデバイスによって提示されるときに知覚される、リモートユーザに対する位置を示す、前記提示位置を含む、当該提供、および
    ・ 前記リモートユーザに現在提示されている1つ以上のオーディオソースのうちの少なくとも1つの前記オーディオの提示の提供であって、前記リモートユーザデバイスから受信される前記リモートユーザモニタリング情報が、前記オーディオ、または前記リモートユーザに提示される前記1つ以上のオーディオソースのうちの前記少なくとも1つへの参照を含む、当該提供
    のうちの1つ以上を行う
    ように構成されている、請求項7に記載の装置。
  13. プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、オーディオコンテンツをリモートユーザデバイスから受信することと、
    前記オーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を受信することと、
    1つ以上のオーディオソースのそれぞれのオーディオが、基準ポイントの周囲で1つ以上のそれぞれの方向または方向の範囲から発生しているとして知覚されるように、前記1つ以上のオーディオソースからのオーディオが空間オーディオとして現在提示されているかどうかを少なくとも示す、現在のオーディオ提示情報を受信することと、
    前記プライマリオーディオの提示を提供することと、
    前記セカンダリオーディオの重要性情報および前記現在のオーディオ提示情報に基づいて、前記セカンダリオーディオの提示を提供することと、
    を含む方法。
  14. 装置の少なくとも1つのプロセッサ上で実行されると、前記装置に、
    プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、オーディオコンテンツをリモートユーザデバイスから受信することと、
    前記オーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を受信することと、
    1つ以上のオーディオソースのそれぞれのオーディオが、基準ポイントの周囲で1つ以上のそれぞれの方向または方向の範囲から発生しているとして知覚されるように、前記1つ以上のオーディオソースからのオーディオが空間オーディオとして現在提示されているかどうかを少なくとも示す、現在のオーディオ提示情報を受信することと、
    前記プライマリオーディオの提示を提供することと、
    前記セカンダリオーディオの重要性情報および前記現在のオーディオ提示情報に基づいて、前記セカンダリオーディオの提示を提供することと、
    を遂行させるように構成されているプログラムコードを備える、コンピュータプログラム。
  15. リモートユーザへの提示のために、プライマリオーディオと、前記プライマリオーディオと異なり、かつ周囲の音響を含むセカンダリオーディオと、を含む、ローカルユーザデバイスによって捕捉されるユーザオーディオコンテンツをリモートユーザデバイスに送信し、
    前記ユーザオーディオコンテンツに対応付けられ、かつ前記セカンダリオーディオの重要性を示す、セカンダリオーディオの重要性情報を送信する
    手段を備える装置。
JP2020571769A 2018-06-26 2019-06-17 オーディオの提示のための装置および関連する方法 Active JP7037671B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18179707.7A EP3588988B1 (en) 2018-06-26 2018-06-26 Selective presentation of ambient audio content for spatial audio presentation
EP18179707.7 2018-06-26
PCT/EP2019/065856 WO2020002023A1 (en) 2018-06-26 2019-06-17 An apparatus and associated methods for presentation of audio

Publications (2)

Publication Number Publication Date
JP2021528916A JP2021528916A (ja) 2021-10-21
JP7037671B2 true JP7037671B2 (ja) 2022-03-16

Family

ID=62909332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020571769A Active JP7037671B2 (ja) 2018-06-26 2019-06-17 オーディオの提示のための装置および関連する方法

Country Status (5)

Country Link
US (2) US11228833B2 (ja)
EP (1) EP3588988B1 (ja)
JP (1) JP7037671B2 (ja)
CN (1) CN112313972B (ja)
WO (1) WO2020002023A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3599777B1 (en) * 2018-07-24 2024-01-03 Nokia Technologies Oy An apparatus, system, method and computer program for providing spatial audio

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006114942A (ja) 2004-10-12 2006-04-27 Nippon Telegr & Teleph Corp <Ntt> 音声提示システム、音声提示方法、この方法のプログラム、および記録媒体
JP2016100677A (ja) 2014-11-19 2016-05-30 株式会社国際電気通信基礎技術研究所 臨場感伝達システムおよび臨場感再現装置
WO2016172111A1 (en) 2015-04-20 2016-10-27 Dolby Laboratories Licensing Corporation Processing audio data to compensate for partial hearing loss or an adverse hearing environment
WO2017208820A1 (ja) 2016-05-30 2017-12-07 ソニー株式会社 映像音響処理装置および方法、並びにプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1277180C (zh) * 2002-04-26 2006-09-27 韩国电子通信研究院 用于适应音频信号的装置和方法
GB2415862B (en) 2004-07-01 2007-03-28 Motorola Inc A method and a system for operating an ambience listening mode in a wireless communication system
US7783594B1 (en) * 2005-08-29 2010-08-24 Evernote Corp. System and method for enabling individuals to select desired audio
BRPI0809760B1 (pt) * 2007-04-26 2020-12-01 Dolby International Ab aparelho e método para sintetizar um sinal de saída
EP2061201A1 (en) 2007-11-16 2009-05-20 Lucent Technologies Inc. Method and system for enhancing a communication session with personalised ambience
KR20110010443A (ko) 2009-07-24 2011-02-01 뉴브로드테크놀러지(주) 인터넷 전화의 원격 품질측정을 위한 자동응답과 루프백 방법
US9014058B2 (en) * 2010-06-25 2015-04-21 Cisco Technology, Inc. Enhancement of audio conference productivity through gain biasing
US20120166188A1 (en) 2010-12-28 2012-06-28 International Business Machines Corporation Selective noise filtering on voice communications
TW202339510A (zh) * 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
JP2015507762A (ja) * 2011-12-22 2015-03-12 ノキア コーポレイション オーディオトラックの決定方法,装置およびコンピュータプログラム
US9111542B1 (en) * 2012-03-26 2015-08-18 Amazon Technologies, Inc. Audio signal transmission techniques
US8903526B2 (en) * 2012-06-06 2014-12-02 Sonos, Inc. Device playback failure recovery and redistribution
US9622010B2 (en) * 2012-08-31 2017-04-11 Dolby Laboratories Licensing Corporation Bi-directional interconnect for communication between a renderer and an array of individually addressable drivers
CN104885151B (zh) * 2012-12-21 2017-12-22 杜比实验室特许公司 用于基于感知准则呈现基于对象的音频内容的对象群集
US9344826B2 (en) * 2013-03-04 2016-05-17 Nokia Technologies Oy Method and apparatus for communicating with audio signals having corresponding spatial characteristics
US10219093B2 (en) * 2013-03-14 2019-02-26 Michael Luna Mono-spatial audio processing to provide spatial messaging
US10204614B2 (en) * 2013-05-31 2019-02-12 Nokia Technologies Oy Audio scene apparatus
EP2830334A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
US20150046943A1 (en) * 2013-08-12 2015-02-12 Sony Corporation Automatic switching from primary to secondary audio during emergency broadcast
EP2879131A1 (en) * 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
EP3264802A1 (en) * 2016-06-30 2018-01-03 Nokia Technologies Oy Spatial audio processing for moving sound sources

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006114942A (ja) 2004-10-12 2006-04-27 Nippon Telegr & Teleph Corp <Ntt> 音声提示システム、音声提示方法、この方法のプログラム、および記録媒体
JP2016100677A (ja) 2014-11-19 2016-05-30 株式会社国際電気通信基礎技術研究所 臨場感伝達システムおよび臨場感再現装置
WO2016172111A1 (en) 2015-04-20 2016-10-27 Dolby Laboratories Licensing Corporation Processing audio data to compensate for partial hearing loss or an adverse hearing environment
WO2017208820A1 (ja) 2016-05-30 2017-12-07 ソニー株式会社 映像音響処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP2021528916A (ja) 2021-10-21
US20210227320A1 (en) 2021-07-22
WO2020002023A1 (en) 2020-01-02
EP3588988B1 (en) 2021-02-17
US11228833B2 (en) 2022-01-18
CN112313972B (zh) 2021-09-10
EP3588988A1 (en) 2020-01-01
US20220095047A1 (en) 2022-03-24
CN112313972A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
US8073125B2 (en) Spatial audio conferencing
US11477598B2 (en) Apparatuses and associated methods for spatial presentation of audio
US20140226842A1 (en) Spatial audio processing apparatus
US11399254B2 (en) Apparatus and associated methods for telecommunications
US20170195817A1 (en) Simultaneous Binaural Presentation of Multiple Audio Streams
US11930350B2 (en) Rendering audio
JP7037671B2 (ja) オーディオの提示のための装置および関連する方法
EP4085661A1 (en) Audio representation and associated rendering
US10993064B2 (en) Apparatus and associated methods for presentation of audio content
JPWO2020022154A1 (ja) 通話端末、通話システム、通話端末の制御方法、通話プログラム、および記録媒体
US11665271B2 (en) Controlling audio output
US20230073568A1 (en) Audio/Video Capturing Using Audio from Remote Device
US11627429B2 (en) Providing spatial audio signals
US20230262169A1 (en) Core Sound Manager
JP2024041721A (ja) ビデオ電話会議

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210125

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220224

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220304

R150 Certificate of patent or registration of utility model

Ref document number: 7037671

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150