JP2011512694A - 通信システムの少なくとも2人のユーザ間の通信を制御する方法 - Google Patents

通信システムの少なくとも2人のユーザ間の通信を制御する方法 Download PDF

Info

Publication number
JP2011512694A
JP2011512694A JP2010537580A JP2010537580A JP2011512694A JP 2011512694 A JP2011512694 A JP 2011512694A JP 2010537580 A JP2010537580 A JP 2010537580A JP 2010537580 A JP2010537580 A JP 2010537580A JP 2011512694 A JP2011512694 A JP 2011512694A
Authority
JP
Japan
Prior art keywords
user
relationship
communication
terminal
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010537580A
Other languages
English (en)
Inventor
ブライン ウェルネル ピー ジェイ デ
アキ エス ハルマ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2011512694A publication Critical patent/JP2011512694A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6016Substation equipment, e.g. for use by subscribers including speech amplifiers in the receiver circuit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/131Protocols for games, networked simulations or virtual reality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/62Details of telephonic subscriber devices user interface aspects of conference calls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

通信システムは、少なくとも、一方のユーザによって他方のユーザに通信される音声を可聴的に再生する音声再生システム13―16,18―20を含んでいる。前記通信システムの少なくとも1の第1のユーザと少なくとも1の第2のユーザとの間の通信を制御する方法は、前記他方のユーザと前記他方のユーザによって知覚される再生される音の源の場所との間の見掛け距離が調整されるように、音声再生システム13―16,18―20を調整するステップを含んでいる。少なくとも前記少なくとも1の第1のユーザ及び前記少なくとも1の第2のユーザの対人的な関係の少なくとも1つの指標を表しているデータ23,25が得られる。前記見掛け距離は、少なくとも対人的な関係の指標と所望の対人的な距離との間の所定の機能的な関係に少なくとも部分的に基づいて決定される。

Description

本発明は、通信システムの少なくとも1の第1のユーザと少なくとも1の第2のユーザとの間の通信を制御するシステムであって、前記通信システムは、前記第1のユーザ及び前記第2のユーザの一方によって前記第1のユーザ及び前記第2のユーザの他方へ通信される音声を可聴的に再生する音声再生システムを少なくとも含んでいる、通信を制御するシステムにも関する。
本発明は、コンピュータプログラムにも関する。
米国特許第2004/0109023号は、プレーヤによって操作されると共にネットワークノードに接続されているゲーム装置が、サーバ装置によって制御されているネットワーク接続構成を開示している。前記ネットワークノードに接続されているゲーム装置間の音声チャットは、前記サーバ装置によって制御される。ゲーム装置のメインCPUは、周辺インターフェースを介してコントローラから入力されるプレーヤ操作信号を得て、ゲームの処理を実施する。前記メインCPUが、前記コントローラによる入力に従って、仮想空間における対象の位置(座標)、移動距離又は速度等を算出する。前記サーバ装置から送られる音声情報は、モデムを通ってバッファ内に記憶される。サウンドプロセッサは、前記バッファ内に記憶されている順において音声情報を順次読み込み、音声信号を生成して、これをスピーカから出力する。前記サーバ装置は、前記ゲーム画面に表示されていると共に当該プレーヤによって操作されるキャラクタの位置関係を反映するように、音声チャットの出力ボリュームを調整している。
この既知の方法及びシステムの問題は、ユーザ位置の対象が、自身らのチャットの主題に関連していない考慮に従ってこれらによって操作されているという点にある。この結果として、誤解が発生し得て、この会話は人工の特性を呈し得る。
本発明の目的は、通信システムの離れたユーザ間の音声通信に対面個人会話の特性を与えるのに比較的効果的である方法、システム及びコンピュータプログラムを提供することにある。
この目的は、本発明による方法であって、
前記少なくとも1の第1のユーザの前記少なくとも1の第2のユーザに対する少なくとも対人的な関係の少なくとも1つの指標を表しているデータを得るステップと、
他のユーザと前記他のユーザによって知覚される再生された前記音声の源の場所との間の見掛け距離が調整されるように、前記音声再生システムを調整するステップであって、前記見掛け距離は、少なくとも対人的な関係の指標と所望の対人的な距離との間の所定の機能的関係によって少なくとも部分的に決定される、ステップと、
を有する方法によって達成される。
自然な日々の会話において、会話を有する2人が最も快適であると感じる対人的な距離は、様々な因子(最も特には前記2人の社会的関係及び前記2人の会話の性質)に依存することが分っている。前記2人の社会的関係及び前記2人の会話の性質は、当該会話の内容及び前記2人の感情状態に関連した因子を含むかもしれない。この依存性に関する知識は、所定の関係に組み込まれ、従って、前記通信システムによって実行される会話に、更に自然な特性を与えるように使用される。
実施例において、前記少なくとも1つの指標のうちの少なくとも1つは、前記第1のユーザ及び前記第2のユーザのアイデンティティに依存する。
この効果は、彼らのアイデンティティに基づいて、前記第1のユーザと前記第2のユーザとの間の対人的な関係の自動的な特徴づけが、可能にされることにある。通信システムの前記ユーザのアイデンティティは、これらは一般に接続の確立を構成するので、一般に知られている。
実施例において、少なくとも1つの指標を表しているデータの少なくとも一部は、前記第1の及び第2のユーザによって提供されるデータに基づく。
この効果は、適切な指標が、簡単で効率的な態様において提供されることにある。
実施例において、前記第1のユーザ及び前記第2のユーザのうちの少なくとも1のユーザにより提供されるデータは、前記第1のユーザ及び前記第2のユーザのうちの他のユーザを関係の分類の集合のうちの1つに関連付けるデータを含んでおり、前記関係の分類の各々は、少なくとも1つの指標の値を表しているデータに関連付けられている。
この効果は、少なくとも前記第1のユーザの前記第2のユーザに対する対人的な関係の少なくとも1つの指標を表しているデータの効率的な検索が、可能にされることにある。少なくとも最初に、有限な数の指標の値があり、これに基づいて、前記見掛け距離を調整するための信号が決定されることができる。
変形は、ユーザ入力に応答して1つの前記関係の分類に関連付けられている少なくとも1つの指標の値に優先して少なくとも1つの指標の値を選択することも含む。
この効果は、ユーザが、選択された前記分類に関連付けられている設定を微調整する又は越えることを可能にされていることにある。このことは、2人のユーザ間の関係が、状況によって変化し得る(例えば、友人として特徴付けられる人々が、仲たがい又は仲直りし得る)という問題を解決する。通信システムの離れたユーザ間の音声通信に対面個人会話の特性を与えるシステムを達成するために、一時的に変更された状況への適応の可能性が、この実施例において提供される。
実施例において、少なくとも1つの指標を表しているデータは、前記第1のユーザ及び前記第2のユーザのうちの少なくとも1のユーザに関する連絡先の詳細に関連付けられて記憶される。
効果は、前記方法が実際の音声通信システムに関連して実施化されることができる効率の改善にある。ユーザによる当該通信のパートナの選択は、接続を確立するための詳細と、取得されるべき前記通信のパートナのうちの少なくとも1のパートナによって知覚される前記見掛け距離を調整するための詳細との両方に関して十分である。
実施例において、少なくとも1つの指標を表しているデータは、前記第1のユーザと前記第2のユーザとの間の少なくとも1つの信号通信音声の少なくとも一部を分析することによって得られる。
この効果は、2人の通信パートナ間の関係の変更の見地への適応において比較的効果的である方法が提供されることにある。
変形は、前記第1のユーザと前記第2のユーザとの間で通信されるスピーチの内容の分析を意味的に含む。
この種類の分析は、一方の人が、どのように他方の人に気が向いているかを設定するのに比較的信頼できる。従って、他方の人に対するこの人の対人的な関係は、比較的効果的に決定され、これらの人の間の当該通信は、対面してなされる会話についての比較的現実的な印象を与える。
更なる変形は、前記第1のユーザと前記第2のユーザとの間の少なくとも1つの信号通信音声の前記少なくとも一部の少なくとも1つの信号特性の分析も含む。
この種類の分析は、比較的容易に実施されることができ、計算的に比較的効率的な態様にあることができる。これは、シソーラスに依存せず、一般に、言語特性から独立しているが、比較的に効果的でもある。テンポ及びボリュームは、例えば、受信者(addressee)に対する話者の対人的な関係の比較的信頼できる指標である。
通信を制御する方法の実施例は、他方のユーザによって知覚される再生される音声の源の見掛けの場所が、機能的な関係に従って決定される前記対人的な距離に従って調整されるようにするための前記音声再生システムの調整を含む。
この効果は、例えば、簡単なボリューム調整によって達成されることができる、人によって話されていることのより現実的な印象である。前記音声が或る点から到来しているように思われる場合、距離感は良好に伝えられる。
実施例において、前記通信システムは、前記他のユーザによって前記一方のユーザに通信される音声を可聴的に再生する更なる音声再生システムを含んでおり、両方の音声再生システムは、前記一方のユーザと前記一方のユーザによって知覚される再生される音声の源の場所との間の見掛け距離と、他方のユーザと前記他方のユーザによって知覚される再生される音声の源の場所との間の見掛け距離とが、概ね同じ値に調整されるようにするように、調整される。
この効果は、前記通信が、前記第1のユーザに与えられる印象と、前記第2のユーザに与えられる印象との間の如何なる不調和も取り除くことによって、更に現実的なものにされることにある。
本発明の他の見地によれば、通信システムの少なくとも1の第1のユーザと少なくとも1の第2のユーザとの間の通信を制御するシステムであって、
前記通信システムは、少なくとも、前記第1のユーザ及び前記第2のユーザの一方によって前記第1のユーザ及び前記第2のユーザの他方に通信される音声の可聴的な再生のための音声再生システムを含んでおり、前記通信を制御するシステムは、
少なくとも前記少なくとも1の第1のユーザの前記少なくとも1の第2のユーザとの対人的な関係の少なくとも1つの指標を表しているデータを得て、
前記他方のユーザと前記他方のユーザによって知覚される再生される音声の源の場所との間の前記見掛け距離が、少なくとも対人的な関係の指標と対人的な距離との間の所定の機能的な関係に少なくとも部分的に従って調整されるように、前記音声再生システムを調整する、
ように構成されている。
当該システムの実施例は、本発明による方法を実施するように構成されている。
本発明の他の見地によれば、機械読み取り可能な媒体に組み込まれた場合、情報処理能力を持つシステムに本発明による方法を実施させることができる一組の命令を含むコンピュータプログラムが、提供される。
通信システムの模式的な図である。 前記通信システムのユーザ間の通信を制御する方法の第1の実施例のフローチャートである。 前記通信システムのユーザ間の通信を制御する方法の第2の実施例のフローチャートである。
本発明は、添付の図面を参照して更に詳細に説明される。
例として、第1の通信端末1が、データ通信ネットワーク3へのネットワークインターフェース2を含んでいる。後述される原理は、パケット切替ネットワーク及びコネクション型(connection-oriented)ネットワークに関連して機能する。データ通信ネットワーク3は、一実施例において、IP(インターネットプロトコル)ベースのネットワークである。他の実施例において、これは、音声データ(例えば、携帯電話ネットワーク)の通信専用のネットワークである。他の実施例において、これは、このようなネットワークのインターネットワークである。従って、第1の通信端末1は、例えば、携帯電話機、ワイヤレスアダプタ又はモデムを備えるパーソナルデジタルアシスタント(PDA)等のような、移動端末であり得る。
他の実施例において、第1の端末1は、ビデオ電話通信又はテレビ会議のための端末であり、ネットワーク3は、オーディオ及びビデオデータの両方を担持するように配されている。
示されている実施例において、第1の通信端末1は、データ処理ユニット4、メモリ5、及びユーザ制御手段6(例えば、キーパッド、ボタン、スクリーン上のカーソルを制御するためのポインタデバイス(図示略)等)を含んでいる。示されている実施例において、音声通信システムの加入者(ユーザ)に関連付けられているトークン装置7が、前記第1の通信端末に関連付けられている。トークン装置7は、例えば、携帯電話ネットワークのためのSIM(加入者識別モジュール)カードであり得る。
音声入力は、マイクロフォン8及びA/Dコンバータ9を介して受け取られる。音声出力は、音声出力段10と第1のイヤフォン11及び第2のイヤフォン12によって提供される。
データ処理ユニット4及び音声出力段10は、イヤフォン11,12を着用しているユーザによって知覚される音声の源の見掛けの場所が目標値に合うように、音声が第1のイヤフォン11及び第2のイヤフォン12によって再生される態様を制御するように構成されている。音声の前記源の前記見掛けの場所を調整する技術は、知られており、例えば、Head-Related(又は解剖学)伝達関数(HRTF)処理、又は直接的なもの/反響の比の制御に依存する技術である。音声の3次元表現のためのシステムの例は、特に、国際特許出願公開第96/13962号パンフレット、国際特許出願公開第95/31881号パンフレット及び米国特許第5、371、799号において与えられる。
第2の通信端末13も、ネットワーク3に接続されており、同様に、音声再生システムを備えている。この音声再生システムは、スピーカのアレイ14―16を含んでおり、説明の便宜上、前記アレイの少数のみが示されている。第2の端末13も、マイクロフォン17を備えている。
第3の通信端末18が、同様に設けられており、第1の端末1に実質的に対応しており、イヤフォン19,20及びマイクロフォン21を備えている。第3の通信端末18及び関連する周辺装置によって構成されている音声再生システムは、第1の端末1の音声再生システムと同様である。
第2の通信端末13の音声再生システムは、スピーカ14―16の近傍に位置するユーザによって知覚されるような音声の源の見掛けの場所が調整可能であるように、構成されている。第1の実施化において、音声をユーザに向かって発することができる高度な指向性スピーカを含む一組のスピーカ14−16が使用される。使用されるスピーカ及び/又は前記音声再生ボリュームの特定の副次的な組合せを変化させることによって、少なくとも、聴取者と音声の知覚される源との間の前記見掛け距離は、可変的である。適切で高度な指向性のスピーカの構造の原理は、2007年11月22日にインターネットhttp://www.panphonics.fiから取得された、Peltonen, T.の"Panphonics Audio Panel White Paper"第1.1版、rev. Jse(2003年5月7日)に記載されている。第2の実施例において、第2の端末13に関連付けられている音声再生システムは、仮想音源を再生する技術であるWave Field Synthesisを利用している。Wave Field Synthesis技術は、スピーカ14―16の前後の両方に仮想音源を作るように使用されることができる。この技術は、Berkhout, A.Jの"A holographic approach to acoustic control"音響工学学会誌、36(12)、第977―995頁(1998年)、及びVerheijen, E.の "Sound reproduction by Wave Field Synthesis" 学術博士論文、デルフト技術大学(1997年)に、より完全に記載されている。第3の実施例において、第2の端末13に関連付けられている音声再生システムは、ビームフォーミングと呼ばれるアレイ処理技術を使用している。例えば、Van Veen, B.E及びBuckley, K.の"Beamforming: a versatile approach to spatial filtering" IEEE ASSP Mag.,(1998年)に記載されているような、標準的なDelay-and-Sumビームフォーミングを使用することもできる。所望の仮想の音源を実現し、場合によっては、スピーカ14―16の特性及び部屋の影響に対する補償も組み込んでいるデジタル有限インパルス応答(FIR)フィルタ(スピーカ14―16の各々に1つ)の集合を得るために数最適化手順を使用することもできる。このことは、より完全に、Van Veen及びBuckleyによる上述の論文、並びにSpors, S.らによる"Efficient active listening room compensation for Wave Field Synthesis"音響工学学会 第116回会議 論文集6619(2004年)に、より完全に記載されている。
図2は、第1の端末1のユーザと、第2の端末13及び第3の端末18の一方又は両方の1以上のユーザとの間の通信を制御する第1の実施例を示している。
第1のステップ22において、特定のユーザ記録23が、メモリ5内又はトークン装置7に含まれているメモリモジュール内に記憶されている複数のユーザ記録24から選択される。ユーザ記録23は、選択されたユーザに関する連絡先の詳細を含んでおり、前記選択されたユーザに関連付けられている第2の端末13及び第3の端末18の一方への接続が確立される又は要求されるのを可能にしている。コールの発信の場合、第1の端末1のユーザは、ユーザ制御手段6を使用してユーザ記録23を選択する。コールの着信の場合、ユーザ記録23は、例えば、発信者の番号の認識及びユーザ記録24に含まれている連絡先の詳細からのこの検索を使用して、選択されることができる。
選択されたユーザ記録23は、複数のユーザのプロファイル25のうちの正しいものを識別するデータを更に含んでいる。次のステップ26において、選択された前記ユーザに関連付けられている前記プロファイル(又は分類)が決定される。第1の端末1のユーザは、ユーザ記録24において識別される前記ユーザの各々を(例えば、これらの両極端の間に任意の数の中間レベルを有して、前記ユーザの配偶者のための「親密な」分類から他人全体のための分類までにわたる)社会的な「近さ」の度合いが変化している幾つかのグループのうちの1つに割り当てる。
示されている実施例において、適切なプロファイルからのデータが、選択された他のユーザと、第2の端末13及び第3の端末18を使用している前記他のユーザによって知覚される再生される音声の源の場所との間の前記見掛け距離を調整するためのデータを第1の端末1が決定するのを可能にするように、取得される(ステップ27)。前記データは、前記第1のユーザの、選択された前記第2のユーザに対する対人的な関係の少なくとも1つの指標と、この2人の間の対人的な距離との間の所定の機能的関係によって決定される。選択された前記通信パートナに関連付けられているユーザ記録がない場合、デフォルトのユーザプロファイルが、ユーザプロファイル25から選択されることができる。
一実施例において、このデータは、第1の端末1の提供者によって、前記機能的な関係に基づいて、プロファイル25内に既に提供されている。他の実施例において、前記機能的な関係を表しているパラメータは、第1の端末1によって維持されており、第1の端末1が社会的な指標の値から目標距離値までの変換を実行するのを可能にしている。更に他の実施例において、社会的な指標の値は、このステップ27においてユーザプロファイル25から取得され、目標距離値への変換が、前記選択されたユーザに関連付けられている前記端末において実行される。
社会科学から、自然な日々の会話において、会話をしている人々が最も快適であると感じる対人的な距離は、様々な因子に依存し、最も特には、この2人の間の社会的関係と、この2人の会話の性質とに依存することが知られている。前記2人の会話の性質は、例えば、前記2人の会話の内容(例えば、個人的なものであるか否か)、前記2人の感情の状態(怒っている、親密である等)に関連する要因を含み得る。このことは、Hall, E.T.による"A system for the notation of proxemic behaviour"、アメリカ人類学者 65、第1003―1026頁(1963年)に更に完全に説明されている。
図2に示されている実施例において、通信パートナのうちの少なくとも1の通信パートナと、前記少なくとも1の通信パートナによって知覚される音声の源の場所との間の知覚される距離の目標値は、まず第一に、前記第1のユーザ及び前記第2のユーザのアイデンティティに基づく。通信パートナの特定の選択は、結果として、前記対人的な距離の特定の目標値になる。彼らの会話の性質は、(以下で説明されるように)図3の実施例の彼らの(瞬間的な)対人的な関係の指標として使用される。更なる実施例(図示略)は、上述の2つの実施例の組合せである。
図2に示されているように、コールの発信の場合、第1の端末1は、ユーザ記録23内で識別されている第2の端末13及び第3の端末18の特定の一方に対する接続を確立する(ステップ28)。コールの着信の場合、このステップ28は、前記接続を確立するための第2の端末13及び第3の端末18の前記特定の一方からの要求の受け入れを含む。
示されている前記実施例において、予め決定されている設定が、例えば、第3の端末に対して通信され(ステップ29)、これに応じて前記設定に関連付けられている前記音声再生システムを調整する。
第1の端末1は、イヤフォン11,12を着用しているユーザによって知覚される音声の源の前記見掛けの場所が調整可能であるような仕方において構成されている音声再生システムにも関連付けられていることに留意されたい。実際、第1の端末1のユーザと、前記ユーザによって知覚される再生される音声の源の場所との間の前記見掛け距離が、第3の端末18のユーザとこのユーザによって知覚される再生される音声の源の場所との間の前記見掛け距離と実質的に同じであるようにさせるように、第1の端末1は、この音声再生システムの設定を調整する(ステップ30)。このことは、自然な会話において、物理的な対人的な距離及びこの距離の動的な変化は、双方の人に明らかであり、自然な会話の変遷(dynamics)の重要な非言語的な部分を形成しているという事実を考慮に入れている。
他の実施例において、第1の端末1及び第3の端末18の一方のみが、調整される。一般に、このことは、自身が所望の対人的な距離を決定する端末であるので、第1の端末1であっても良い。
次いで、スピーチ信号は、第1の端末1と第3の端末18との間で通信され(ステップ31)、前記設定に従って再生される。
示されている実施例において、第1の端末1のユーザ(しかし、このことは、第3の端末18のユーザにも拡張し得る)は、所与の人に対する好適な対人的な距離は、常に同じにはなり得ないので、所望どおりに描かれた音響的な対人的な距離を変化させる可能性を与えられる。例えば、それは、前記ユーザのムード又は通信パートナ間の社会的関係における変遷に依存する。ユーザ制御手段6を経たユーザ入力を受け取ると、第1の端末1は、最初に選択されたユーザプロファイル25と関連付けられている値に優先して、再生される音声の源の場所までの知覚される距離の目標値を変化させる(ステップ32)。この新しい設定は、第1の端末1に関連付けられている音声再生システムを調整するために使用され(ステップ33)、これらは、第3の端末18へ通信される(ステップ34)。後者のステップ34は、一実施例において省略されている。示されている実施例は、ちょうど上述したステップ32―34が、通信セッションの継続期間全体にわたって繰り返されても良い。
図3に示される方法において、少なくとも第1のユーザの第2のユーザに対する対人的な関係の少なくとも1つの指標を表しているデータを得る異なる手段が、使用される。しかしながら、第1ステップ35は、前記ユーザが、通信をしたいと望む所望の他のユーザを選択する又は第1の端末1が通信するのを望んでいる前記ユーザを識別する点において、図2の方法における対応するステップ22と同じである。コールの着信の場合、このステップ35は、省略されても良く、接続の確立の要求を受け取るステップと置き換えられても良い。コールの発信に関して示されている場合において、選択されたユーザのユーザ記録23が、例えば、第3の端末18への接続を確立するための詳細を取得するために、記憶されているユーザ記録24から取得される。
次いで、前記接続が確立され(ステップ36)、直ちに音声が通信される(ステップ37)。しかしながら、第1の端末1は、これら2人のユーザ間の(複数の)信号通信音声を分析する(ステップ28)。一実施例において、第1の端末1は、第3の端末18のユーザから第1の端末1のユーザへの信号通信スピーチ入力のみを分析する。他の実施例において、第1の端末1は、通信パートナの両方のスピーチ入力を分析する。第1の端末1が、第1の端末1のユーザから生じる信号通信音声のみを分析することも可能である。
人々の好適な対人的な距離に影響している因子は、人々の会話の内容及び/又はムードに関連している。会話が個人的なものである場合、人々は、軽い話に関与している場合よりも、短い対人的な距離を好む。人々が怒っている又は加熱している議論をしている場合、好適な距離は、大きくさえなり得る。
第1の実施例において、当該通信システムのユーザの間で通信される前記スピーチの一部又は全ての内容が、意味的に分析される。このことは、スピーチ認識と或る種類の会話を示す或るキーワードの認識とを含む。従って、第1の端末1は、スピーチ/テキスト変換のためのアプリケーションと、言葉を発している人の言葉が向けられている人に対する社会的関係を示すキーワード及び関連するデータのデータベースとを備えている。この信号通信スピーチのセクションにおいて認識されるキーワードは、この関係を決定する39のに使用される。
第2の実施例において、この2人の通信パートナ間の少なくとも1つの信号通信音声の前記少なくとも一部の少なくとも1つの特性が、分析される。この分析は、例えば、このスピーチ信号のスペクトル成分、振幅又は動的な特性を分析することによって、信号レベルに対して実行される。このようにして、誰かがささやいていること(この場合、短い目標の距離が好まれる)、又は誰かが叫んでいること(この場合、より大きい距離が好まれ得る)が検出され得る。スピーチ信号の分析に基づいた、例えば、攻撃性、興奮、怒りを検出するための技術が、知られている。一例は、Rajput, N., Gupta, P.の"Two-Stream Emotion Recognition For Call Center Monitoring" インタースピーチ学会会誌、アントワープ,ベルギー国(2007年)に与えられている。
このように得られた少なくとも1の第1のユーザの少なくとも1の第2のユーザに対する少なくとも前記対人的な関係の少なくとも1つの指標を表しているデータは、(複数の)前記指標と、2人の間の好ましい対人的な距離との間の所定の機能的な関係に従った設定を提供するように使用される(ステップ40)。
前記設定は、第1の端末1に関連付けられている音声再生システムを調整する(ステップ41)及び第3の端末18に関連付けられている音声再生システムを遠隔調整する(ステップ42)ために使用される。従って、図2の実施例のように、第1の端末1のユーザと前記ユーザによって知覚される再生される音声の源の場所との間の見掛け距離は、第3の端末18の他のユーザと前記他のユーザによって知覚される再生される音声の源の場所との間の見掛け距離と実質的に同じであるように保持される。代替的な実施例において、2つのステップ41,42のうちの一方は、省略され、一般に、第3の端末18(即ち前記信号分析を実施したもの以外の端末)のユーザによって知覚される見掛け距離の調整に至る方が省略される。
図3に示されている実施例において、第1の端末1のユーザ(及び/又は第3の端末のユーザ18)は、所望のとおりに描かれている音響的な対人的な距離を変化させる可能性を与えられている。ユーザ制御手段6を介したユーザ入力を受信すると、第1の端末1は、再生される音声の源の場所までの前記知覚される距離の目標値を変更する(ステップ43)。この新しい設定は、少なくともこの示されている実施例において、第1の端末1に関連付けられている音声再生システムを調整するのに使用され(ステップ44)、第3の端末18に通信される(ステップ45)。他の実施例において、この調整をしている人のムードを第3の端末18のユーザに通信するのは望ましくないこともあるので、このステップ45は省略される。示されている実施例において、上述したばかりのステップ43―45が、通信セッションの継続期間全体にわたって繰り返されても良い。
同じ調子において、前記ユーザが、前記第1のユーザと前記第2のユーザとの間の少なくとも1つの信号通信音声の分析によって前記第1の端末によって決定される設定を無効にしていない場合、前記分析は、知覚された対人的な距離を前記2人の通信パートナの関係の変化に適応させるために、一定の間隔で又は継続的に繰り返されることができる。
他の実施例において、図2及び3の方法を組み合わせている方法であって、前記ユーザプロファイル25のうちの1つが、最初に、第1の端末1のユーザの第3の端末18のユーザに対する対人的な関係の指標として使用され、ひとたび前記通信セッションが開始されたならば、前記分析が使用される、方法が使用される。
上述の実施例は、本発明を制限するというよりはむしろ説明するためのものであり、当業者であれば、添付請求項の範囲を逸脱することなく、多くの代替的な実施例を設計することができることに留意されたい。前記請求項において、括弧内に置かれた如何なる符号も、請求項を限定するようにみなしてはならない。「有する」という語は、請求項に記載されていない構成要素又はステップの存在を排除するものではない。単数形の構成要素は、複数のこのような構成要素を排除するものではない。本発明は、幾つか別個の構成要素を有するハードウェアによって、及び適当にプログラムされたコンピュータによって実施化することができる。幾つかの手段を列挙している装置請求項において、これらの手段の幾つかは1つの同じハードウェアの項目によって、実施化することができる。特定の手段が、相互に異なる従属請求項において引用されているという単なる事実は、これらの手段の組み合わせが有利になるように使用されることができないと示すものではない。
会議の用途において、第1のユーザと複数の第2の端末の複数の第2のユーザとの間の通信が、上述で概説された方法に従って制御されることができ、前記第1のユーザの前記複数の第2のユーザに対する対人的な関係の指標は、例えば、個々に、前記第1のユーザの前記第2のユーザの各々に対する関係を規定する情報に基づいて決定されることができる(例えば、彼は、前記複数の第2のユーザを雇っている組織の顧客である)。他の実施例において、上述で概説された方法は、第1及び第2のユーザに関連付けられている前記端末の一方においてよりもむしろ中央通信プロセッサによって実行される。
当業者にとっては明らかであるが、「手段」とは、単独で若しくは他の機能と連動して、他の要素と隔離されて若しくは協働して、動作中に機能する又は特定の機能を実施するように設計されている如何なるハードウェア(例えば、別個の回路又は集積回路又は電子的な要素)、又はソフトウェア(例えば、プログラム又はプログラムの一部)も含むことを意味している。「コンピュータプログラム」とは、コンピュータ光ディスクのような、読み取り可能な媒体に記憶されている、インターネットのような、ネットワークを介してダウンロード可能な又は他の何らかの態様において市場性のある何らかのソフトウェアを意味するものと理解されたい。

Claims (14)

  1. 通信システムの少なくとも1の第1のユーザと少なくとも1の第2のユーザとの間の通信を制御する方法であって、前記通信システムは、
    前記第1のユーザ及び前記第2のユーザの一方によって、前記第1のユーザ及び前記第2のユーザの他方に通信される音声を可聴的に再生するステップと、
    少なくとも前記少なくとも1の第1のユーザ及び前記少なくとも1の第2のユーザの対人的な関係の少なくとも1つの指標を表しているデータを得るステップと、
    前記他のユーザと、前記他のユーザによって知覚される再生される音声の源の場所との間の見掛け距離が調整されるように、前記音声再生システムを調整するステップであって、前記見掛け距離は、少なくとも対人的な関係の指標と所望の対人的な距離との間の所定の機能的な関係に少なくとも部分的に従って決定される、ステップと、
    のための音声再生システムを少なくとも含んでいる、方法。
  2. 前記少なくとも1つの指標のうちの少なくとも1つは、前記第1のユーザ及び前記第2のユーザのアイデンティティに依存している、請求項1に記載の方法。
  3. 少なくとも1つの指標を表している前記データの少なくとも一部は、前記第1のユーザ及び前記第2のユーザの少なくとも一方によって知覚されるデータに基づいている、請求項1又は2に記載の方法。
  4. 前記第1のユーザ及び前記第2のユーザの少なくとも一方によって提供される前記データは、前記第1のユーザ及び前記第2のユーザの他方を、各々が少なくとも1つの指標の値を表しているデータに関連付けられている関係の分類の集合うちの1つに関連付けるデータを含んでいる、請求項3に記載の方法。
  5. ユーザ入力に応答して、前記関係の分類の集合うちの前記1つに関連付けられている少なくとも1つの指標の値に優先して、前記少なくとも1つの指標の値を選択するステップを含む、請求項4に記載の方法。
  6. 少なくとも1つの指標を表しているデータ例が、前記第1のユーザ及び前記第2のユーザのうちの少なくとも1のユーザに関する連絡先の詳細に関連付けられて記憶されている、請求項3及び4に記載の方法。
  7. 少なくとも1つの指標を表しているデータは、前記第1のユーザと前記第2のユーザとの間の少なくとも1つの信号通信音声の少なくとも一部を分析することによって得られる、請求項1に記載の方法。
  8. 前記第1のユーザと前記第2のユーザとの間で通信されるスピーチの内容を意味的に分析するステップを含む、請求項7に記載の方法。
  9. 前記第1のユーザと第2のユーザとの間の少なくとも1つの信号通信音声の少なくとも一部の前記少なくとも1つの信号特性を分析するステップを含んでいる、請求項7又は8に記載の方法。
  10. 前記他方のユーザによって知覚される再生された音声の源の見掛けの場所が、機能的な関係によって決定される前記対人的な距離に従って調整されるように、前記音声再生システムを調整するステップを含んでいる、請求項1に記載の方法。
  11. 前記通信システムは、更なる音声再生システムを有しており、前記更なる音声再生システムは、前記他方のユーザによって前記一方のユーザに通信される音声を可聴的に再生するステップであって、前記一方のユーザと前記一方のユーザによって知覚される再生される音声の源の場所との間の見掛け距離と、前記他方のユーザと前記他方のユーザによって知覚される再生される音声の源の場所との間の見掛け距離とが、概ね同じ値であるように調整されるように、両方の前記音声再生システムが調整されるステップのためのものである、請求項1に記載の方法。
  12. 通信システムの少なくとも1の第1のユーザと少なくとも1の第2のユーザとの間の通信を制御するシステムであって、少なくとも、前記第1のユーザ及び前記第2のユーザの一方によって、前記第1のユーザ及び前記第2のユーザの他方に通信される音声を可聴的に再生する音声再生システムを含んでおり、少なくとも前記少なくとも1の第1のユーザの前記少なくとも1の第2のユーザに対する対人的な関係の少なくとも1つの指標を表しているデータを得て、前記他方のユーザと、前記他方のユーザによって知覚される前記再生される音声の源の場所との間の見掛け距離であって、少なくとも対人的な関係の指標と所望の対人的な距離との間の所定の機能的な関係に少なくとも部分的に従って決定されている前記見掛け距離が調整されるように前記音声再生システムを調整する、通信を制御するシステム。
  13. 請求項1乃至11の何れか一項に記載の方法を実行する、請求項12に記載のシステム。
  14. 機械読み取り可読媒体に組み込まれている場合、情報処理能力を有するシステムに請求項1乃至11の何れか一項に記載の方法を実行させることができる命令の集合を含んでいるコンピュータプログラム。
JP2010537580A 2007-12-17 2008-12-10 通信システムの少なくとも2人のユーザ間の通信を制御する方法 Withdrawn JP2011512694A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP07123343 2007-12-17
PCT/IB2008/055196 WO2009077936A2 (en) 2007-12-17 2008-12-10 Method of controlling communications between at least two users of a communication system

Publications (1)

Publication Number Publication Date
JP2011512694A true JP2011512694A (ja) 2011-04-21

Family

ID=40795956

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010537580A Withdrawn JP2011512694A (ja) 2007-12-17 2008-12-10 通信システムの少なくとも2人のユーザ間の通信を制御する方法

Country Status (6)

Country Link
US (1) US20100262419A1 (ja)
EP (1) EP2241077A2 (ja)
JP (1) JP2011512694A (ja)
KR (1) KR20100097739A (ja)
CN (1) CN101904151A (ja)
WO (1) WO2009077936A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014116722A (ja) * 2012-12-07 2014-06-26 Sony Corp 機能制御装置およびプログラム

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100077318A1 (en) * 2008-09-22 2010-03-25 International Business Machines Corporation Modifying environmental chat distance based on amount of environmental chat in an area of a virtual world
US9384469B2 (en) 2008-09-22 2016-07-05 International Business Machines Corporation Modifying environmental chat distance based on avatar population density in an area of a virtual world
US8902272B1 (en) 2008-11-24 2014-12-02 Shindig, Inc. Multiparty communications systems and methods that employ composite communications
US9401937B1 (en) 2008-11-24 2016-07-26 Shindig, Inc. Systems and methods for facilitating communications amongst multiple users
US8647206B1 (en) 2009-01-15 2014-02-11 Shindig, Inc. Systems and methods for interfacing video games and user communications
US9712579B2 (en) 2009-04-01 2017-07-18 Shindig. Inc. Systems and methods for creating and publishing customizable images from within online events
US9344745B2 (en) 2009-04-01 2016-05-17 Shindig, Inc. Group portraits composed using video chat systems
US8779265B1 (en) 2009-04-24 2014-07-15 Shindig, Inc. Networks of portable electronic devices that collectively generate sound
JP5787128B2 (ja) * 2010-12-16 2015-09-30 ソニー株式会社 音響システム、音響信号処理装置および方法、並びに、プログラム
US8958567B2 (en) * 2011-07-07 2015-02-17 Dolby Laboratories Licensing Corporation Method and system for split client-server reverberation processing
JP5727980B2 (ja) * 2012-09-28 2015-06-03 株式会社東芝 表現変換装置、方法およびプログラム
CN104010265A (zh) * 2013-02-22 2014-08-27 杜比实验室特许公司 音频空间渲染设备及方法
US10271010B2 (en) 2013-10-31 2019-04-23 Shindig, Inc. Systems and methods for controlling the display of content
JP6148163B2 (ja) * 2013-11-29 2017-06-14 本田技研工業株式会社 会話支援装置、会話支援装置の制御方法、及び会話支援装置のプログラム
US9438602B2 (en) * 2014-04-03 2016-09-06 Microsoft Technology Licensing, Llc Evolving rule based contact exchange
US9952751B2 (en) 2014-04-17 2018-04-24 Shindig, Inc. Systems and methods for forming group communications within an online event
US9733333B2 (en) 2014-05-08 2017-08-15 Shindig, Inc. Systems and methods for monitoring participant attentiveness within events and group assortments
US9711181B2 (en) 2014-07-25 2017-07-18 Shindig. Inc. Systems and methods for creating, editing and publishing recorded videos
US9734410B2 (en) 2015-01-23 2017-08-15 Shindig, Inc. Systems and methods for analyzing facial expressions within an online classroom to gauge participant attentiveness
US20180018974A1 (en) * 2016-07-16 2018-01-18 Ron Zass System and method for detecting tantrums
US11195542B2 (en) 2019-10-31 2021-12-07 Ron Zass Detecting repetitions in audio data
US10133916B2 (en) 2016-09-07 2018-11-20 Steven M. Gottlieb Image and identity validation in video chat events
JP6672114B2 (ja) * 2016-09-13 2020-03-25 本田技研工業株式会社 会話メンバー最適化装置、会話メンバー最適化方法およびプログラム
US10558421B2 (en) 2017-05-22 2020-02-11 International Business Machines Corporation Context based identification of non-relevant verbal communications
CN109729109B (zh) * 2017-10-27 2020-11-10 腾讯科技(深圳)有限公司 语音的传输方法和装置、存储介质、电子装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5371799A (en) * 1993-06-01 1994-12-06 Qsound Labs, Inc. Stereo headphone sound source localization system
US5596644A (en) * 1994-10-27 1997-01-21 Aureal Semiconductor Inc. Method and apparatus for efficient presentation of high-quality three-dimensional audio
GB2303516A (en) * 1995-07-20 1997-02-19 Plessey Telecomm Teleconferencing
JPH0983655A (ja) * 1995-09-14 1997-03-28 Fujitsu Ltd 音声対話システム
JPH09288645A (ja) * 1996-04-19 1997-11-04 Atsushi Matsushita 大部屋的仮想オフィスシステム
US7308080B1 (en) * 1999-07-06 2007-12-11 Nippon Telegraph And Telephone Corporation Voice communications method, voice communications system and recording medium therefor
JP4095227B2 (ja) * 2000-03-13 2008-06-04 株式会社コナミデジタルエンタテインメント ビデオゲーム装置、ビデオゲームにおける背景音出力設定方法及び背景音出力設定プログラムが記録されたコンピュータ読み取り可能な記録媒体
JP3434487B2 (ja) * 2000-05-12 2003-08-11 株式会社イサオ 位置連動式チャットシステム、そのための位置連動式チャット方法、および、プログラムを記録したコンピュータ読み取り可能な記録媒体
US7478047B2 (en) * 2000-11-03 2009-01-13 Zoesis, Inc. Interactive character system
US8108509B2 (en) * 2001-04-30 2012-01-31 Sony Computer Entertainment America Llc Altering network transmitted content data based upon user specified characteristics
US6956955B1 (en) * 2001-08-06 2005-10-18 The United States Of America As Represented By The Secretary Of The Air Force Speech-based auditory distance display
AUPR989802A0 (en) * 2002-01-09 2002-01-31 Lake Technology Limited Interactive spatialized audiovisual system
JP4280901B2 (ja) * 2002-02-05 2009-06-17 株式会社セガ 音声チャットシステム
US7098776B2 (en) * 2003-04-16 2006-08-29 Massachusetts Institute Of Technology Methods and apparatus for vibrotactile communication
US8066568B2 (en) * 2005-04-19 2011-11-29 Microsoft Corporation System and method for providing feedback on game players and enhancing social matchmaking
US20080253547A1 (en) * 2007-04-14 2008-10-16 Philipp Christian Berndt Audio control for teleconferencing
CN100583804C (zh) * 2007-06-22 2010-01-20 清华大学 基于专家值传播算法的社会网络专家信息处理系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014116722A (ja) * 2012-12-07 2014-06-26 Sony Corp 機能制御装置およびプログラム

Also Published As

Publication number Publication date
KR20100097739A (ko) 2010-09-03
EP2241077A2 (en) 2010-10-20
WO2009077936A3 (en) 2010-04-29
WO2009077936A2 (en) 2009-06-25
US20100262419A1 (en) 2010-10-14
CN101904151A (zh) 2010-12-01

Similar Documents

Publication Publication Date Title
JP2011512694A (ja) 通信システムの少なくとも2人のユーザ間の通信を制御する方法
JP6374529B2 (ja) ヘッドセットと音源との間のオーディオの協調的処理
JP6325686B2 (ja) ヘッドセットと音源との間のオーディオの協調的処理
US10491643B2 (en) Intelligent augmented audio conference calling using headphones
US9686627B2 (en) Multidimensional virtual learning system and method
JP6163468B2 (ja) 音響品質評価装置、音響品質評価方法、およびプログラム
US9749474B2 (en) Matching reverberation in teleconferencing environments
US8488820B2 (en) Spatial audio processing method, program product, electronic device and system
JP2011512768A (ja) オーディオ装置及びその動作方法
US10121491B2 (en) Intelligent volume control interface
US11521636B1 (en) Method and apparatus for using a test audio pattern to generate an audio signal transform for use in performing acoustic echo cancellation
KR102577901B1 (ko) 오디오 신호 처리 장치 및 방법
US20100266112A1 (en) Method and device relating to conferencing
WO2011148570A1 (ja) 聴覚ディスプレイ装置及び方法
JP2013540379A (ja) プライバシー及び個人使用のための背景音除去
JP6363429B2 (ja) データ構造、データ生成装置、データ生成方法、およびプログラム
WO2022054900A1 (ja) 情報処理装置、情報処理端末、情報処理方法、およびプログラム
JP7375817B2 (ja) 音声処理装置、通話デバイス、音声処理方法、およびプログラム
US20120150542A1 (en) Telephone or other device with speaker-based or location-based sound field processing
WO2015101523A1 (en) Method of improving the human voice
JP6126053B2 (ja) 音響品質評価装置、音響品質評価方法、およびプログラム
JP6392161B2 (ja) 音声会議システム、音声会議装置、その方法及びプログラム
JP2023107364A (ja) コミュニケーション装置及びコミュニケーション方法
US20230319488A1 (en) Crosstalk cancellation and adaptive binaural filtering for listening system using remote signal sources and on-ear microphones
US20230262169A1 (en) Core Sound Manager

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120306