JP5739009B2

JP5739009B2 - 会議情報を提供するためのシステムおよび方法

Info

Publication number: JP5739009B2
Application number: JP2013542056A
Authority: JP
Inventors: キム、テス; ユ、キスン; ホワン、キュ・ウォン; リー、テ−ウォン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2010-12-03
Filing date: 2011-11-22
Publication date: 2015-06-24
Anticipated expiration: 2031-11-22
Also published as: CN103190139B; US20120142324A1; CN103190139A; JP2013546282A; WO2012074843A1; KR20130063542A; EP2647188A1; KR101528086B1

Description

関連出願の表示

３５Ｕ．Ｓ．Ｃ．§１１９の下の優先権の主張
本特許出願は、２０１０年１２月３日に出願された米国仮出願番号６１／４１９，６８３の優先権の利益を主張しており、その譲受人に譲渡され、本明細書中に明示的に参照によって組み込まれる。

本開示は、一つまたは複数の場所（locations）での会議に関する情報を提供することに関する。より詳細には、本開示は、モバイルデバイスでの会議の一つまたは複数の始動要件（starting requirements）を検出することにより、会議に関する情報をモバイルデバイスに提供するためのシステムおよび方法に関する。

個人およびビジネスのコミュニケーションでは、打合せや会議がしばしば必要である。特に、遠隔会議（teleconference）は、打合せが開催される離れた場所への移動の不便および距離のために、広く使用されている。例えば、仕事のセッティングにおいて、二つまたはそれ多くの別個の地理的場所を含む会議は、しばしば、リアルタイムで地理的に離れた場所にある人々の間の議論および意見を共有することが必要である。

残念ながら、会議はしばしば多くの見慣れられない人の出席を必要とするので、従来の会議は、しばしば、例えば名前、現在の話し手、出席者の配置などの出席者に関する十分な情報の不足のために、出席者に不便や混乱である。例えば、人はなじみのない人々とのビジネス打合せに出席するとき、会議中に他の出席者の名前を特定したり、覚えておくことが難しいかもしれない。二つ以上の地理的に遠隔地における遠隔会議のセッティングでは、特に、出席者は会議に参加したり、または、十分な視覚情報なしに会議の詳細を覚えることに、混乱および不便を見出すかもしれない。つまり、遠隔会議の状況では、一つの場所で出席者が他の場所で他の離れた出席者を見ることができないので、彼らは、他の場所で他の出席者を特定したり、覚えたり、または、ある特定の時間に他の出席者のなかの現在の話し手を認識することができないかもしれない。加えて、出席者は、他の場所の他の出席者の活動に関する情報、例えば、特定の出席者が会議に出席したままか、または、会議を終了したかなどの、他の出席者の着座配置（sitting arrangement）へのアクセスを持っていないかもしれない。

上記問題に対処するために、ある場所の出席者のイメージが送信され、そして、他の場所の他の出席者に表示され、かつ、逆も同様になるように、カメラなどの視覚センサおよびテレビなどの表示デバイスが各場所に設置されてもよい。しかしながら、このような解決策は、一般に、追加のハードウェアおよびコストを必要とする。さらに、前記カメラおよび表示デバイスは、特に、出席者が識別（identification）またはプロフィール情報が前もって他の離れた出席者に提供されていない時には、上述した問題に対する完全な解決策ではないかもしれない。そのうえ、このような配置は、一般的に、高価な機器を必要とし、そして、しばしば、普通のユーザーには便利ではないかもしれない、長くて複雑な初期セットアップを必要とする。

本開示は、周囲の音の類似性に基づいて、一つまたは複数の場所での会議の出席者の間で様々な情報を共有するためのシステムおよび方法を提供する。さらに、本開示のシステムおよび方法は、各モバイルデバイス内で会議の一つまたは複数の始動要件を検出したら、会議のための情報を自動的に生成することによって、一つまたは複数のモバイルデバイスに会議のための情報を提供する。

本開示の一態様によれば、モバイルデバイス内に会議情報を提供するための方法が開示されている。前記方法は、モバイルデバイス内で、一つまたは複数の場所での会議の一つまたは複数の始動要件を監視することを含む。会議の一つまたは複数の始動要件が検出された時に、入力音（input sound）情報がモバイルデバイスからサーバーに送信される。会議情報はサーバーから受信され、そして、会議情報はモバイルデバイス上に表示される。本開示はまた、装置、手段の組合せ、および、この方法に関連するコンピュータ可読媒体を記載する。

本開示の別の態様によれば、会議情報を提供するためのモバイルデバイスが提供される。前記モバイルデバイスは、開始ユニット、送信ユニット、受信ユニットおよび表示ユニットを含む。前記開始ユニットは、一つまたは複数の場所での会議の一つまたは複数の始動要件を監視するように適合されている。前記送信ユニットは、前記会議の前記一つまたは複数の始動要件が検出された時に、入力音情報（input sound information）をサーバーに送信するように構成されている。さらに、前記受信ユニットは、前記サーバーから会議情報を受信するように構成され、そして、前記表示ユニットは、前記会議情報を表示するように適合されている。

本開示のさらに別の態様によれば、サーバーおよび複数のモバイルデバイスを有するシステムにおいて会議情報を提供するための方法が開示される。この方法では、一つまたは複数のモバイルデバイスは、一つまたは複数の場所での会議の一つまたは複数の始動要件を監視し、そして、前記会議の前記一つまたは複数の始動要件が検出されたら、サーバーに入力音情報を送信する。前記サーバーは、各モバイルデバイスからの前記入力音情報に基づいて会議情報を生成し、そして、各モバイルデバイスに前記会議情報を送信する。前記会議情報は、各モバイルデバイス上に表示される。本開示はまた、装置、手段の組合せ、および、この方法に関連するコンピュータ可読媒体を記載する。

図１は、本開示の一実施形態に係る会議情報を生成して提供するための複数のモバイルデバイスおよびサーバーを含むシステムを示す。図２は、本開示の一実施形態に係るモバイルデバイスの典型的な構成を示す。図３は、本開示の一実施形態に係るサーバーの典型的な構成を示す。図４は、本開示の一実施形態に係る、モバイルデバイスによって実行される、サーバーに入力音情報を送信し、前記サーバーから会議情報を受信する方法のフローチャートを示す。図５は、本開示の一実施形態に係る、サーバーによって実行される、各モバイル・デバイスから入力音情報を受信し、そして、各モバイルデバイスに会議情報を提供する方法のフローチャートを示す。図６は、本開示の一実施形態に係る、サーバーによって実行される、会議での出席者を決定する方法のフローチャートを示す。図７Ａは、出席者に情報を表示しているモバイルデバイスの典型的なスクリーンを示す。図７Ｂは、出席者に情報を表示しているモバイルデバイスの別の典型的なスクリーンを示す。図８Ａは、本開示の一実施形態に係る、モバイルデバイスによって実行され、始動要件が検出された時に、サーバーに入力音情報を送信する開始の方法のフローチャートを示す。図８Ｂは、本開示の一実施形態に係る、モバイルデバイスによって実行され、二つ以上の始動要件が検出された時に、サーバーに入力音情報を送信する開始の方法のフローチャートを示す。図９Ａは、本開示の一実施形態に係る、サーバーによって実行される、各モバイルデバイスの入力音の音レベルに基づいて、会議の出席者の間で現在の話し手を決定する方法のフローチャートを示す。図９Ｂは、ある期間にわたる、モバイルデバイスのサブセットの入力音の音レベルダイアグラムを示す。図１０Ａは、本開示の一実施形態に係る、サーバーによって実行される、各モバイルデバイスの音声活動情報に基づいて、会議の出席者の間で現在の話し手を決定する方法のフローチャートを示す。図１０Ｂは、ある期間にわたる、各モバイルデバイスの平均入力音レベルに対する現在の入力音レベルの比のダイアグラムを示す。図１１Ａは、本開示の一実施形態に係る、サーバーによって実行される、各モバイルデバイスの音声活動情報に基づいて、会議の出席者の間で現在の話し手を決定する方法のフローチャートを示す。図１１Ｂは、ある期間にわたる、各モバイルデバイスの入力音がモバイルデバイスのユーザーの音声の音響特性と一致している、モバイルデバイスのサブセットに対する確率のダイアグラムを示す。図１２Ａは、本開示の一実施形態に係る、サーバーによって実行される、出席者の配置を計算する方法を示す。図１２Ｂは、モバイルデバイス上に表示される出席者の配置の例を示す。図１３は、出席者の参加情報を含む会議の打合せログ（meeting log）の例を示す。図１４は、無線通信システムにおける典型的なモバイルデバイスの設計のブロックダイアグラムを示す。

種々の実施形態が今から図面を参照して説明され、ここにおいて、同様な参照番号は、全体を通して同様な要素について言及するために使用される。以下の説明においては、説明の目的のために、非常に多くの特定の詳細が、一つまたは複数の実施形態についての完全な理解を提供するために述べられる。しかしながら、そのような態様（単数または複数）は、これらの特定の詳細なしに実行されることができることは明らかであろう。他の例においては、よく知られている構造およびデバイスは、一つまたは複数の実施形態を説明することを容易にするためにブロック図の形式で示される。

図１は、本開示の一実施形態に係る、会議情報を生成して提供するように構成された複数のモバイルデバイス１６０，１６２，１６４，１６６および１６８、ならびにサーバー１５０を含むシステム１００を示す。モバイルデバイス１６０，１６２，１６４，１６６および１６８ならびにサーバー１５０は無線ネットワーク１４０を介して互いに通信する。モバイルデバイス１６０および１６２は、一つの地理的場所（geographic location）１１０、例えば、都市の第１の会議室に置かれる。一方、モバイルデバイス１６４および１６６は、別の地理的場所１２０、例えば、別の都市の第２の会議室に置かれる。モバイルデバイス１６８は、さらに別の地理的場所１３０、例えば、路上等の第１および第２会議室の外に置かれる。

図示の実施形態では、モバイルデバイス１６０，１６２，１６４，１６６および１６８は、単なる例として提示されており、そして、したがって、各場所に置かれるモバイルデバイスの数または場所の数は個々の会議の設定に応じて変更されても構わない。

モバイルデバイスは、収音機能（sound capturing capability）、例えば、マイク、およびデータおよび／または通信ネットワークを通じての通信機能などが装備された携帯電話、スマートフォン、ラップトップコンピュータ、またはタブレットパーソナルコンピュータなどの任意の適切なデバイスでも構わない。

システム１００は、モバイルデバイス１６０，１６２，１６４，１６６および１６８によって受信された入力音に基づいて会議に関連付けられた様々な情報を生成し、かつ、会議の出席者、例えば、少なくとも一つのモバイルデバイスのユーザーに、前記情報を提供するように構成されている。ある会議の状況では、場所１２０および１３０等の離れた場所の他のユーザーを含むことなく、両方が場所１１０に位置するモバイルデバイス１６０および１６２のユーザーだけが、会議に出席する。別の会議の状況では、場所１１０に位置しているモバイルデバイス１６０および１６２のユーザーは、場所１２０のような遠隔地に位置するモバイルデバイス１６４および１６６のユーザーと遠隔会議に出席する。このような状況では、モバイルデバイス１６０，１６２，１６４および１６６のユーザーは、従来の遠隔会議電話および離れた場所で遠隔会議電話間の音を交換することができる遠隔会議機器でインプリメントされている、遠隔会議システム（図示せず）を使用して、遠隔会議に参加する。前記遠隔会議電話および機器は、モバイルデバイス１６０，１６２，１６４，１６６および１６８、ネットワーク１４０、およびシステム１００のサーバー１５０とは別個に動作させても構わない。さらに、また別の会議の状況では、モバイルデバイス１６０および１６２のユーザーは、離れた場所１２０のモバイルデバイス１６４および１６６のユーザーとの遠隔会議に加わる前に、場所１１０にて彼らの間で内部または予備的な議論のためにローカル会議を開始しても構わない。その間、場所１１０および１２０から地理的に離れそして個別の場所１３０、例えば、街路（street）に位置するモバイルデバイス１６８のユーザーは、モバイルデバイス１６０，１６２，１６４および１６６のユーザー間のいずれの会議にも含まれない。

二つの場所１１０および１２０は互いに地理的に離れているが、もし前記二つの場所の複数のユーザーが遠隔会議システム、サラウンディングアンビエントサウンド（surrounding ambient sound）および各場所で生成された音声を介して互いに通信し、そして、それぞれ、モバイルデバイス１６０，１６２，１６４および１６６に入力されると、互いに似たようになり得る。特に、場所１１０内で生成された音は遠隔会議電話機（図示せず）を介して場所１２０へ送信される。同様に、場所１２０内で生成された別の音が遠隔会議電話を介して場所１１０に送信される。結果として、場所１１０において、そこで発生された音および場所１２０から送信された音はモバイルデバイス１６０および１６２に入力される。同様に、場所１２０において、そこで発生された音および場所１１０から送信された音は、モバイルデバイス１６４および１６６に入力される。その結果、モバイルデバイス１６０，１６２，１６４および１６６の入力音は、互いに類似しているかもしれない。

その間、場所１３０に位置するモバイルデバイス１６８のユーザーはいずれの遠隔会議に含まれない。故に、モバイルデバイス１６８は、遠隔会議の期間中に、モバイルデバイス１６０，１６２，１６４および１６６に入力されるいずれの音、または、場所１１０または１２０から発する周囲の音を受信しない。したがって、モバイルデバイス１６８の入力音は、モバイルデバイス１６０，１６２，１６４および１６６のそれらと同様でないかもしれない。

一実施形態では、モバイルデバイス１６０，１６２，１６４，１６６および１６８の各々は、ネットワーク１４０を介してサーバー１５０に入力音情報を送信する。入力音情報は各モバイルデバイスの入力音の任意の適切な表現（representation）、前記入力音から抽出された音シグネチャ（sound signature）、音レベル、音活動情報などを含んでも構わないが、それには限定されない。これらにモバイルデバイスからの入力音情報に基づいて、サーバー１５０は、会議情報を生成して、モバイルデバイス１６０，１６２，１６４および１６６に会議情報を提供し、そして、必要ならモバイルデバイス１６８に会議情報を提供する。会議情報は、以下に詳細に説明される、出席者の識別（identification）および場所、出席者の配置、および／または、出席者の参加情報を含む会議の打合せログなどの、一つまたは複数の場所での会議の出席者に関する情報を含む。

サーバー１５０が上記の会議情報を生成するように作動された一つの例示的な設定としては、モバイルデバイス１６０，１６２，１６４，１６６および１６８は、それぞれのユーザーによって運ばれか、または、前記ユーザーの近くに配置されるものとする。また、モバイルデバイスが、他のモバイルデバイスのユーザーよりも、そのユーザーの近くに配置されているものとする。例えば、モバイルデバイス１６０は、第１の会議室内では、モバイルデバイス１６２のユーザーよりも、そのユーザーの近くに配置されている。同様に、モバイルデバイス１６４は、第２の会議室内で、モバイルデバイス１６６のユーザーよりも、そのユーザーの近くに配置されている。

図２は、本開示の一実施形態に係るモバイルデバイスの典型的な構成を示す。図２に示されるように、モバイルデバイス１６０は、開始ユニット２１０、音センサ２２０、音シグネチャ抽出ユニット２３０、送信ユニット２４０、受信ユニット２５０、記憶ユニット２６０、クロックユニット２７０、ポジショニングユニット２８０および表示ユニット２９０を含む。モバイルデバイス１６０の構成は、図２に示されているが、他のモバイルデバイス１６２，１６４，１６６および１６８にも同じ構成が実装されても構わない。モバイルデバイス１６０の上述したユニットは、ハードウェア、一つまたは複数のプロセッサで実行されるソフトウェア、および／またはそれらの組合せによって実装されても構わない。

開始ユニット２１０は、特定の会議の一つまたは複数の始動要件をモニタし、そして、一つまたは複数の始動要件が検出された否かを決定する。音センサ２２０（例えば、マイクロホン）は、モバイルデバイス１６０の周囲に音を受信し、感知するように構成されている。音シグニチャ抽出センサ２３０は、音シグニチャ、つまり、特有なまたは区別できる特性を前記音から抽出する。クロックユニット２７０は、モバイルデバイス１６０の現在時刻をモニタし、そして、ポジショニングユニット２８０は、例えば、全地球測位システム（ＧＰＳ）を用いて、モバイルデバイス１６０の現在位置を推定する。送信ユニット２４０は、情報、例えば、入力音情報をネットワーク１４０を介してサーバー１５０に送信し、そして、受信ユニット２５０は、ネットワーク１４０を介してサーバー１５０から会議情報を受信する。表示ユニット２９０は、様々な情報、例えば、サーバー１５０から受信した会議情報を表示する。記憶ユニット２６０は、入力音、入力音情報、場所、時間、会議情報等を処理するために必要な様々な情報を記憶する。

情報音センサ２２０は、例えば、一つまたは複数のマイクロフォン、またはキャプチャし、測定し、記録し、および／または、モバイルデバイス１６０のキャプチャされた入力音の任意の様相（aspect）を伝えるために用いられる、他の任意のタイプのサウンドキャプチャを含んでも構わない。いくつかの実施形態は、通話中にユーザーの声を伝えるために使用されるマイクなどの日常作業で既に使用されるモバイルデバイス１６０のセンサを利用しても構わない。すなわち、音センサ２２０は、モバイルデバイス１６０について何の変更を必要とせずとも実施し得る。また、音センサ２２０は、モバイルデバイス１６０内でその機能を実行するために、追加のソフトウェアおよび／またはハードウェアを採用しても構わない。

さらに、音シグネチャ抽出ユニット２３０は、入力音の音シグネチャを抽出するための音声圧縮、強調、認識、合成方法を含む任意の適切な信号処理方式を使用しても構わない。例えば、このような信号処理方式は、音声認識または音声コーデックのための周知の方法である、ＭＦＣＣ（メル周波数ケプストラム係数）、ＬＰＣ（線形予測符号化）、および／またはＬＳＰ（線スペクトル対）技術を採用しても構わない。

一実施形態では、音シグネチャは、ｎ次元の値を有するベクトルとして表わされる、多重コンポーネント（multiple components）を含んでいても構わない。ＭＦＣＣ法では、例えば、音シグネチャは、各次元が１６ビット値で表されると１３次元を含んでいても構わない。この場合、音シグネチャは、２６バイト長である。別の実施形態では、音シグネチャは、各次元が１ビットの２進数値として表現されるように、二値化されていても構わない。このような場合には、二値化された音シグネチャは１３ビット長であっても構わない。

音シグネチャは、以下のようにＭＦＣＣ方法下で入力音から抽出し得る。時間領域内における入力音（例えば、生の音信号）のフレームは、ウィンドウ関数、例えば、ハミングウィンドウが乗算される。その後、音声信号は、波数領域にフーリエ周波数領域に変換され、そしてそれから、周波数領域内の変換された信号のスペクトルにおける各帯域について電力が計算される。各計算された電力に対して対数演算および離散コサイン変換（ＤＣＴ）演算が行われて、ＤＣＴ係数が取得される。過去の所定時間の期間にわたる平均値が二値化のために各ＤＣＴ係数から減算され、そして、一組の二値化結果は、音シグネチャを構成する。

図３は、本開示の一実施形態に係るサーバー１５０の典型的な構成を示す。図２に示されるように、サーバー１５０は、類似度決定ユニット３１０、出席者決定ユニット３２０、送信ユニット３３０、受信ユニット３４０、情報データベース３５０、ログ生成ユニット３６０、出席者配置算出ユニット３７０および話し手決定ユニット３８０を含む。サーバー１５０は、ネットワーク１４０上で通信能力を有する本開示の方法を実行する従来のコンピュータシステムにより実装されても構わない。サーバー１５０は、モバイルデバイス１６０，１６２，１６４，１６６および１６８、ならびに他のクライアントデバイスにクラウドコンピューティングサービスを提供するためのシステム内に使用されても構わない。さらに、例えば、Ｗｉ−ＦｉＤｉｒｅｃｔ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＦｌａｓｈＬｉｎｑ技術を使用して、追加の外部サーバーなしで、モバイルデバイスが互いに直接的に通信するとき、モバイルデバイス１６０，１６２，１６４，１６６および１６８の一つは、サーバー１５０として機能するように構成されていても構わない。サーバー１５０はまた、複数の遠隔会議電話のうちのいずれか一つ、または、モバイルデバイス１６０，１６２，１６４，１６６および１６８に関連付けられた遠隔会議を行うために作動される機器の内で、実装されても構わない。サーバー１５０内の上述したユニットは、ハードウェア、一つまたは複数のプロセッサで実行されるソフトウェア、および／またはそれらの組合せによって実装されても構わない。

受信ユニット３４０は、情報、例えば、入力音情報を、モバイルデバイス１６０，１６２，１６４、１６６および１６８の各々から、受信するように構成されている。類似度決定ユニット３１０は、モバイルデバイス１６０，１６２，１６４，１６６および１６８からの入力音情報の間の類似度を決定する。出席者決定ユニット３２０は前記類似度に基づいて会議の出席者を決定する。ログ生成ユニット３６０は、出席者の参加情報を含む打合せログを生成する。さらに、出席者配置算出ユニット３７０は、会議の各場所での出席者の配置を計算する。話し手決定ユニット３８０は、特定の時間での出席者中の現在の話し手を決定する。送信ユニット３３０は、モバイルデバイス１６０，１６２，１６４および１６６のそれぞれに上記の情報を含む会議情報を送信するように構成され、そして、もし必要であれば、モバイルデバイス１６８にも送信する。情報データベース３５０は、上記の情報、および、上記の情報を処理するために必要なその他何かの情報を含む、様々な情報を記憶するように構成されていても構わない。

図４は、本開示の一実施形態に係る、モバイルデバイスによって実行される、入力音情報をキャプチャしてサーバー１５０に入力音情報を送信し、サーバー１５０から会議情報を受信する方法のフローチャートを示す。図４において、４１０にて、モバイルデバイス１６０の音センサ２２０は、入力音をキャプチャし、そして、アナログまたはデジタル形式でキャプチャされた音を出力する。入力音は、モバイルデバイス１６０の周りの環境音（ambient sound）およびモバイルデバイス１６０のユーザーおよび近くの他のユーザーの声を含んでいても構わない。

４２０にて、モバイルデバイス１６０中の送信ユニット２４０は、ネットワーク１４０を介してサーバー１５０に入力音に関連付けられた入力音情報を送信する。他の各モバイルデバイス１６２，１６４，１６６および１６８中の送信ユニットもまた、ネットワーク１４０を介してサーバー１５０にそれぞれの音センサによってキャプチャされた入力音に関連付けられた入力音情報を送信する。

送信ユニット２４０もまた、限定するわけではないが、識別情報、時間情報、および場所情報を含む、ユーザーおよびモバイルデバイス１６０に関連する情報を送信しても構わない。例えば、識別情報は、モバイルデバイス１６０の製品番号、シリアル番号、ＩＤ、ユーザー名、ユーザープロファイルなどを含んでいても構わない。時刻情報は、クロックユニット２７０によってモニタし得る、現在の時間または入力音がキャプチャされる時の時間を含んでいても構わない。場所情報は、入力音がキャプチャされた時に、ポジショニングユニット２８０によって推定し得る、モバイルデバイス１６０の地理的場所を含んでいても構わない。上記情報の一部は、モバイルデバイス１６０の記憶ユニット２６０に予め記憶されていても構わない。

４３０にて、モバイルデバイス１６０中の受信ユニット２５０は、サーバー１５０からの会議情報を受信する。４４０にて、表示ユニット２９０は、所望の表示形式に従って会議情報を表示する。

図５は、本開示の一実施形態に係る、サーバー１５０によって実行される、各モバイルデバイスから入力音情報を受信し、そして、各モバイルデバイスに会議情報を提供する方法のフローチャートを示す。図５において、５１０にて、サーバー１５０のユニット３４０は、モバイルデバイス１６０，１６２，１６４，１６６および１６８の各々から入力音情報を受信する。受信ユニット３４０は、さらに、上述したような様々な情報を受信し得る。受信ユニット３４０により受信されたこのような情報は、情報データベース３５０内に記憶されても構わない。

５２０にて、サーバー１５０は、受信した情報に基づいて、少なくとも一つのモバイルデバイスの１６０，１６２，１６４，１６６および１６８に関与する会議ための会議情報を生成する。例えば、類似度決定ユニット３１０、出席者決定ユニット３２０、情報データベース３５０、ログ生成ユニット３６０、出席者配置算出ユニット３７０および話し手決定ユニット３８０の少なくとも一つは、会議情報を生成する際に使用されても構わない。

５３０にて、会議情報が生成されると、送信サーバー１５０は、送信ユニット３３０を介して、モバイルデバイス１６０，１６２の各々に会議情報を送信し、必要ならモバイルデバイス１６８にも送信する。もしモバイルデバイス（devices）のサブセットが会議中なら、サーバー１５０はそれらのモバイルデバイスに会議情報を送信しても構わない。例えば、サーバー１５０は、会議に参加していないユーザーのモバイルデバイス１６８に会議情報を送信しなくても構わない。

本開示の実施形態に係るサーバー１５０およびモバイルデバイス１６０，１６２，１６４，１６６および１６８の詳細な動作について、図６−１３を参照して以下に説明する。

図６は、本開示の一実施形態に係る、サーバー１５０によって実行される、会議での出席者を決定する方法のフローチャートを示す。受信ユニット３４０のサーバー１５０は、モバイルデバイス１６０，１６２，１６４，１６６および１６８のそれぞれからのキャプチャされた入力音に関連付けられた入力音情報を受信する。６２０にて、類似度決定ユニット３１０は、モバイルデバイスの各ペアからの入力音情報を比較することによって入力音情報に基づいて、複数のモバイルデバイス１６０，１６２，１６４，１６６および１６８の各ペアの入力音間の類似度を決定する。

本開示の一実施形態では、二つのモバイルデバイス、例えば、ｍ番目のモバイルデバイスおよびｎ番目のモバイルデバイスの入力音間の類似度は、例えば、以下の式に従って、二つのモバイルデバイスの入音の音シグニチャを表しているベクトル間のユークリッド距離に基づいて、決定されても構わない。

ここで、ａ［ｉ］はｍ番目のモバイルデバイスの音シグニチャを表しているベクトルａのｉ番目の次元の値を示し、そして、ｂ［ｉ］はｎ番目のモバイルデバイスの音シグニチャを表しているベクトルｂのｉ番目の次元の値を示している。

二つのモバイルデバイスの入力音間の類似度は、所定の時間間隔で一定期間にわたって抽出された音シグネチャシーケンスのペアの間のユークリッド距離に基づいて決定されても構わない。ｍ番目およびｎ番目のモバイルデバイスの各々において、音シグネチャのシーケンスが１秒の期間にかけて１０ミリ秒の時間間隔で抽出されるとすると、サーバー１５０は前記モバイルデバイスから百ペアの音シグネチャを受信する。この場合、ｍ番目およびｎ番目のモバイルデバイスからの音声シグネチャの各ペアに対するユークリッド距離が算出され、そして、前記ユークリッド距離の平均値に基づいて類似度は決定される。例えば、前記類似度は平均値の逆数または前記逆数の対数スケール値であるかもしれない。

６３０にて、前記類似度に基づいて、サーバー１５０内の出席者決定ユニット３２０は、サーバー１５０に入力音情報を送信した全ての複数のモバイルデバイスの中で、同じ会議に出席しているユーザーのモバイルデバイスのサブセットを決定する。例えば、特定の会議に出席しているユーザーのモバイルデバイスは、同じ会議中にはない別のモバイルデバイスよりも、同じ会議中の別のモバイルデバイスに対してより大きな類似度を有すると考えられる。いったん会議中にあるモバイルデバイスが決定されたら、出席者決定ユニット３２０は、前記モバイルデバイスおよび前記関連付けられたユーザーに関する情報に基づいて、前記決定されたモバイルデバイスのユーザーを特定し、そして、彼らをその会議の出席者であると決定する。

サーバー１５０は、少なくとも識別情報、各出席者の場所情報等のうちの一つを含む、前記出席者についての情報を含む会議情報を生成する。次に、６４０にて、サーバー１５０の送信ユニット３３０は、会議中であると決定されてきているモバイルデバイスのサブセットに会議情報を送信する。

いくつかの実施形態では、所定の類似閾値より大きい類似度を有するモバイルデバイスは、会議グループに属すると決定されても構わなく、一方、所定の類似閾値以下の類似度を有するモバイルデバイスは、前記会議グループに属していないと決定されても構わない。前記所定の類似閾値は、システム１００のニーズに応じて設定され、そして、サーバー１５０の情報データベース３５０に予め記憶されていても構わない。

以下は、一実施形態に係る、類似度および会議の出席者を決定するより詳細な手順である。

図１に参照を戻すと、モバイルデバイス１６０，１６２，１６４，１６６および１６８は、それぞれ、サーバー１５０に入力音情報を送信する。サーバー１５０の類似度決定ユニット３１０は、モバイルデバイス１６０，１６２，１６４，１６６および１６８のそれぞれの入力音情報間の類似度、および、他のモバイルデバイスのそれぞれの入力音情報間の類似度を決定する。例えば、類似度決定ユニット３１０は、モバイルデバイス１６０の入力音情報と、その他のモバイルデバイス１６２，１６４，１６６および１６８の各々のそれとの間の類似度を評価する。同様に、モバイルデバイス１６２の入力音情報と、その他のモバイルデバイス１６４，１６６および１６８の各々のそれとの間の類似度が評価される。

図１の第１の会議の状況では、モバイルデバイス１６０および１６２のユーザーは、同じ場所に位置して、会議に出席し、一方、他のモバイルデバイス１６４，１６６，および１６８の他のユーザーは、前記会議に出席しないとしている。このような会議は、追加のユーザーが参加する可能性のある主要会議前の予備会議であるかもしれない。この予備会議では、モバイルデバイス１６０および１６２のユーザー間での、モバイルデバイス１６０およびモバイルデバイス１６２の間の入力音情報の類似度は、他のモバイルデバイス１６４，１６６および１６８に関連付けられた類似度よりも大きくなるであろう。類似閾値を用いる場合、モバイルデバイス１６０とモバイルデバイス１６２との間の入力音情報の類似度は前記類似閾値よりも大きくなるかもしれないが、一方、他の類似度は前記類似閾値よりも大きくなることはないかもしれない。その結果、サーバー１５０の出席者決定ユニット３２０は、モバイルデバイス１６０および１６２のユーザーが同じ会議に出席していると決定する。サーバー１５０から送信された会議情報を受信すると、各モバイルデバイスの表示ユニットは図２に示されるように、会議情報を表示しても構わない。例えば、第１の会議の状況では、モバイルデバイス１６０および１６２のユーザーは、図７Ａに示されるように、表示ユニット上に彼らの位置および名前が表示されても構わない。

第２の会議の状況では、場所１１０でのモバイルデバイス１６０および１６２のユーザーと、場所１２０に置かれるモバイルデバイス１６４および１６６のユーザーとは、それぞれの場所から同じ会議に出席しているとする。モバイルデバイス１６８のユーザーは、場所１３０にとどまり、そして、前記会議には出席しない。このような会議は、上記の第１の状況のような予備会議の後の主要会議かもしれないし、そして、電話会議、ビデオ会議などかもしれない。

上述のように、モバイルデバイス１６０のための入力音情報の類似度は、他のモバイルデバイス１６２，１６４，１６６および１６８の各々のそれに関して決定される。モバイルデバイス１６０，１６２，１６４および１６６は、類似した入力音を伴う同じ会議中にあるため、前記会議中にあるモバイルデバイス１６０，１６２，１６４および１６６の各ペア間の入力音情報の類似度は、モバイルデバイス１６８とモバイルデバイス１６０，１６２，１６４，１６６の各々との間の入力音情報の類似度よりも大きくなるであろう。類似閾値が用いられる場合、モバイルデバイス１６０，１６２，１６４，１６６の各ペア間の入力音情報の類似度は前記類似閾値よりも大きいかもしれないし、一方、他の類似度は前記類似閾値よりも大きくないかもしれない。その結果、出席者決定ユニット３２０は、モバイルデバイス１６０，１６２，１６４および１６６のユーザーが同じ会議に出席していると決定する。この場合、モバイルデバイス１６０，１６２，１６４および１６６のユーザーは、図７Ｂに示されるように、各モバイルデバイスの表示ユニット上に出席者の位置および名前が表示されても構わない。

本開示の一実施形態によれば、もし会議の一つまたは複数の始動要件が検出されたら、モバイルデバイスによる入力音情報の送信の動作は自動的に開始されても構わない。一般に、会議に対しての一つまたは複数の始動要件は、出席者リスト、会議の開始時刻、会議の場所（例えば、会議が遠隔会議のときには複数の会議室）など、その会議の前に決定されていても構わない。モバイルデバイスの各ユーザーは、会議始動要件を入力し、そして、保存しても構わない。加えてまたは代替的に、本開示に係る会議スケジューリングルアプリケーションは、モバイルデバイスまたはパーソナルコンピュータ等の外部のデバイス上で実行している、別のアプリケーション、例えば、カレンダーアプリケーション、ＭＳＯｕｔｌｏｏｋ^TMプログラム等のスケジュール管理アプリケーションなどから会議始動要件を取得しても構わない。

図８Ａは、本開示の一実施形態に係る、モバイルデバイス１６０によって実行され、始動要件が検出された時に、サーバー１５０に入力音情報を送信する開始の方法のフローチャートを示す。図８には、モバイルデバイス１６０によって行われる方法が示されているが、他のモバイルデバイス１６２，１６４，１６６および１６８もまた前記方法を行っても構わないことを理解すべきである。この方法では、８１０にて、モバイルデバイス１６０の開始ユニット２１０は、始動要件が検出されたか否かを決定するための始動要件をモニタする。もし始動要件が検出されないなら（８１０にて“ＮＯ”）、開始ユニット２１０は始動要件をモニタし続ける。もし始動要件が検出されたら（８１０にて“ＹＥＳ”）、８２０にて、送信ユニット２４０は、サーバー１５０にモバイルデバイス１６０の入力音情報を送信することを開始する。モバイルデバイス１６０から、および、一つまたは複数のモバイルデバイス１６２，１６４，１６６および１６８から入力音情報を受信すると、サーバー１５０は、各モバイルデバイスからの入力音情報に基づいて、会議情報を生成する。サーバー１５０は次に会議情報をモバイルデバイス１６０に送信し、もし必要なら、他のモバイルデバイスの各々にも送信する。８３０にて、モバイルデバイス１６０の受信ユニット２５０は、サーバー１５０から会議情報を受信する。８４０にて、次にモバイルデバイス１６０の表示ユニット２９０は、ユーザーのために会議情報を表示する。

始動要件は、入力音情報の送信を開始する条件を明記しても構わない。例えば、始動要件は、開始時間、一つまたは複数の会議の場所、会議環境の音響特性などでも構わない。モバイルデバイスが一つまたは複数の始動要件を検出したときに自動的に動作するように、始動要件はユーザーによって各モバイルデバイスに記憶されても構わない。例えば、クロックユニット２７０によってモニタされ得るモバイルデバイス１６０の現在時刻が会議の開始時間に達したときに、始動要件は満たされても構わない。同様に、ポジショニングユニット２８０によって推定され得るモバイルデバイス１６０の現在の場所が会議の場所、例えば、会議室であると決定されたときに、始動要件は満たされても構わない。いくつかの実施形態では、場所要件は、モバイルデバイス１６０の現在の場所が所定の範囲内、例えば、特定の会議場所から２０メートル内にあると決定されたら、満たされても構わない。

さらに、会議環境の音代表（sound representative）もまた始動始条件として使用することができる。一実施形態によれば、会議環境は、音響特性に基づいて区別される。例えば、会議環境は、会議内に存在するモバイルデバイスに入力される音に含まれることができる会議出席者の声によって特徴付けることができる。会議出席者の、つまり、モバイルデバイスに声が入力されるモバイルデバイスユーザーの最大数は、所定のしきい値に設定されても構わない。また、入力音声に含まれる、雑音を指し得る、許容可能な背景音のレベルは、所定の音レベル閾値に設定されても構わない。会議出席者の最大数が所定の閾値を超えるか、または背景音のレベルが音レベル閾値を超えるかのいずれかの場合、始動要件が検出されないだろう。さらに、入力音の許容残響時間は、適当な大きさの会議室において測定可能な残響時間の範囲に入る所定の時間（time period）（例えば２００〜５００ミリ秒）に設定されても構わない。

別の実施形態によれば、会議環境の音響モデルは、始動要件として使用されても構わない。この場合、様々な会議環境は、会議環境の音響モデルの代表（representative）を得るためにＧＭＭ（ガウス混合モデル）法またはＨＭＭ（隠れマルコフモデル）法などのモデリング方法論を通じて訓練される。このような音響モデルを用いて、モバイルデバイスの入力音が音響モデルに対応する時に、始動要件は検出される。例えば、始動要件は、入力音と音響モデルとの類似度が所定の類似閾値よりも大きい時に検出されても構わない。

図８Ｂは、本開示の一実施形態に係る、モバイルデバイスによって実行され、二つ以上の始動要件が検出された時に、サーバー１５０に入力音情報を送信する開始の方法のフローチャートを示す。図８Ｂでは、二つの始動要件、つまり、第１の始動要件および第２の始動要件がモバイルデバイス１６０の開始するユニット２１０によってモニタされる。もし第１の始動要件が検出されないなら（８１２にて“ＮＯ”）、開始ユニット２１０は第１の始動要件をモニタし続ける。もし第１の始動要件が検出されたならば（８１２にて“ＹＥＳ”）、第２の始動要件がモニタされる。もし第２の始動要件が検出されないなら（８１４にて“ＮＯ”）、開始ユニット２１０は第２の始動要件をモニタし続ける。もし第２の始動要件が検出されたなら（８１４にて“ＹＥＳ”）、８２０にて、モバイルデバイス１６０の送信ユニット２４０は、サーバー１５０に入力音情報を送信することを開始する。モバイルデバイス１６０から入力音情報を受信すると、サーバー１５０は、上述したように、会議情報を生成してモバイルデバイス１６０に送信する。８３０にて、モバイルデバイス１６０の受信ユニット２５０は、サーバー１５０から会議情報を受信する。その後、８４０にて、モバイルデバイス１６０のディスプレイユニット２９０は、ユーザーのために会議情報を表示する。

図８Ｂは、二つの始動要件をモニタしていることを示しているが、二つよりも多くの始動要件がモニタされても構わない。さらに、図８Ｂは、順次二つの始動要件を連続してモニタすることを示しているが、始動要件は、互いに並列にモニタされても構わなく、そして、送信ユニット２４０は、一つまたは複数の始動要件が検出されたと決定された時に、サーバー１５０に入力音情報を送信することを開始しても構わない。

本開示の別の実施形態では、サーバー１５０は、出席者のモバイルデバイスからの入力音の音レベルまたは音声活動情報に基づいて、特定の時間での会議に出席者中の現在の話し手を決定する。図９Ａは、本開示の一実施形態に係る、サーバー１５０によって実行される、各モバイルデバイスの入力音の音レベルに基づいて、会議の出席者の間で現在の話し手を決定する方法のフローチャートを示す。例証のために、図９Ｂは、ある期間にわたるモバイルデバイスのサブセットの入力音の音レベルダイアグラムを示す。

一実施形態によれば、各モバイルデバイスでキャプチャされた入力音に関連付けられた入力音情報は入力音の音レベルを含む。音レベルは、音のエネルギーや音の大きさを示し、そして、振幅、強度などで表され得り、そして、例えば、デシベルで測られ得る。各モバイルデバイスは、サーバー１５０に音レベルを含む入力音情報を送信する。

図９Ａに関して、９１０にて、サーバー１５０の受信ユニット３４０は、モバイルデバイスから音レベルを含む入力音情報を受信する。サーバー１５０の出席者決定ユニット３２０は、モバイルデバイスからの入力音情報に基づいて、複数のモバイルデバイスのユーザーの全ての中での会議の出席者を決定する。９２０にて、サーバー１５０の話し手決定ユニット３８０は決定された出席者のモバイルデバイスからの入力音情報に関連付けられた音レベルを比較し、そして、９３０にて、現在の話し手を決定し、現在の話し手のモバイルデバイスは比較された音レベルの中で最大の音レベルを有する。

現在の話し手は、所定の時間間隔で定期的に決定されても構わない。図９Ｂは、四つの期間間隔Ｔ₁−Ｔ₄にわたる三つのモバイルデバイスの音レベルダイアグラムを示す。図示されるように、音レベルは音レベルの振幅によって示され、そして、各時間間隔の間の話し手は各区間内の振幅および／または持続時間（duration）に基づいて決定される。時間間隔Ｔ₁の間に、第１のモバイルデバイスの音レベル振幅は最大となり、そして、したがって、第１のモバイルデバイスのユーザーは現在の話し手であると決定される。時間間隔Ｔ₂においては、第３のモバイルデバイスのユーザーが現在の話し手であると決定される、何故なら音レベル振幅はこのモバイルデバイスで最も大きいからである。同様に、時間間隔Ｔ₃においては、第２のモバイルデバイスのユーザーが現在の話し手であると決定される、何故なら第２のモバイルデバイスに対しての音レベル振幅がこの間隔内で最も大きいからである。同様に、時間間隔Ｔ₄の間中においては、第３のモバイルデバイスのユーザーがその音圧レベル振幅に基づいて現在の話し手であると判定される。

モバイルデバイスの音レベルに基づいて、サーバー１５０は、現在の話し手に関する情報を含む会議情報を生成し、そして、出席者のモバイルデバイスに前記会議情報を送信する。サーバー１５０から会議情報を受信した各モバイルデバイスは、その表示ユニット上に現在の話し手に関する情報を表示し得る。

図１０Ａは、本開示の一実施形態に係る、サーバー１５０によって実行される、音声活動情報に基づいて、会議の出席者の間で現在の話し手を決定する方法のフローチャートを示す。例証の目的のために、図１０Ｂは、ある期間にわたる各モバイルデバイスの平均入力音レベルに対する現在の入力音レベルの比のダイアグラムを示す。

この実施形態では、各モバイルデバイスでキャプチャされた入力音に関連付けられた入力音情報は、入力音の音声活動情報を含む。各モバイルデバイスの音声活動情報は、所定の時間にわたる平均入力音レベルに対する現在の入力音レベルの比から決定される。前記比は、所定の期間にわたる平均入力音と比べた所定の時間での現在の入力音の大きさを示している。平均入力音は、モバイルデバイスの周囲から連続的に発している背景音またはモバイルデバイスの周囲の環境音を表すことができ、そして、したがって、前記比は、現在の話し手を決定する際における背景音の影響を抑制または取り除くことをできる。各モバイルデバイスは、サーバー１５０に音声活動情報を含む入力音情報を送信する。

図１０Ａに関して、１０１０にて、サーバー１５０の受信ユニット３４０は、モバイルデバイスから音声活動情報を含む入力音情報を受信する。モバイルデバイスからの入力音情報に基づいて、サーバー１５０の出席者決定ユニット３２０は、複数のモバイルデバイスの全てのユーザーの中での会議の出席者を決定する。１０２０にて、サーバー１５０の話し手決定ユニット３８０は、決定された出席者のモバイルデバイスからの入力音情報に関連付けられた音レベル比を比較し、そして、１０３０にて、現在の話し手を決定し、その話し手のモバイルデバイスは比較された音レベル比の中で最も大きな音レベル比を有する。

現在の話し手は、所定の時間間隔で定期的に決定されても構わない。図１０Ｂは、四つの時間間隔Ｔ₁−Ｔ₄にわたる三つのモバイルデバイスの音レベル比ダイアグラムを示す。図示されるように、各モバイルデバイスの音レベル比は、所定の期間にわたる平均入力音に対する現在の入力音レベルの比によって示され、そして、各時間間隔の間の話し手は各間隔内の音レベル比および／または持続時間（duration）に基づいて決定される。時間間隔Ｔ₁の間に、第１のモバイルデバイスの音レベル比は最大となり、そして、したがって、第１のモバイルデバイスのユーザーは現在の話し手であると決定される。時間間隔Ｔ₂においては、第３のモバイルデバイスのユーザーが現在の話し手であると決定される、何故なら音レベル比はこのモバイルデバイスで最も大きいからである。同様に、時間間隔Ｔ₃においては、第２のモバイルデバイスのユーザーが現在の話し手であると決定される、何故なら第２のモバイルデバイスに対しての音レベル比がこの間隔内で最も大きいからである。同様に、時間間隔Ｔ₄の間中においては、第３のモバイルデバイスのユーザーがその音圧レベル比に基づいて現在の話し手であると判定される。

モバイルデバイスの音レベル比に基づいて、サーバー１５０は、現在の話し手に関する情報を含む会議情報を生成し、そして、出席者のモバイルデバイスの前記会議情報を送信する。サーバー１５０から会議情報を受信した各モバイルデバイスは、その表示ユニット上に現在の話し手に関する情報を表示し得る。

図１１Ａは、本開示の一実施形態に係る、サーバー１５０によって実行される、音声活動情報に基づいて、会議の出席者の間で現在の話し手を決定する方法のフローチャートを示す。例証の目的のために、図１１Ｂは、ある期間にわたる、各モバイルデバイスの入力音がモバイルデバイスのユーザーの音声の音響特性と一致している、モバイルデバイスのサブセットに対する確率のダイアグラムを示す。

この実施形態では、各モバイルデバイスでキャプチャされた入力音に関連付けられた入力音情報は、入力音の音声活動情報を含む。各モバイルデバイスの音声活動情報は、モバイルデバイスの入力音がモバイルデバイスのユーザーの音声の音響特性と一致する確率から決定される。前記音響特性は、各モバイルデバイスに予め記憶されていても構わない。例えば、モバイルデバイスの表示ユニットに表示されるメッセージは、ユーザーの音声がモバイルデバイス内に記憶され、そして、分析するために処理され、そして、その音響特性を記憶するように、ユーザーに所定のフレーズを読むように促す。一実施形態では、ユーザーの音声の音響的特徴を表す音響モデルが使用されても構わない。具体的には、入力音が音響モデルに対応する確率は、入力音と音響モデルとの類似度に基づいて決定されても構わない。例えば、類似度は、入力音を表すベクトルと音響モデルを表す別のベクトルとの間のユークリッド距離に基づいて、推定されても構わない。各モバイルデバイスは、サーバー１５０に音声活動情報を含む入力音情報を送信する。

図１１Ａに関して、１１１０にて、サーバー１５０の受信ユニット３４０は、モバイルデバイスから音声活動情報を含む入力音情報を受信する。モバイルデバイスからの入力音情報に基づいて、サーバー１５０の出席者決定ユニット３２０は、複数のモバイルデバイスの全てのユーザーの中での会議の出席者を決定する。１１２０にて、サーバー１５０の話し手決定ユニット３８０は、決定された出席者のモバイルデバイスからの入力音情報に関連付けられた前記確率を比較し、そして、１１２０にて、現在の話し手を決定し、その話し手のモバイルデバイスは比較された確率の中で最も高い確率を有する。

現在の話し手は、所定の時間間隔で定期的に決定されても構わない。図１１Ｂは、四つの時間間隔Ｔ₁−Ｔ₄にわたる三つのモバイルデバイスのマッチング確率ダイアグラムを示す。図示されるように、各モバイルデバイスのマッチング確率は、所定の期間にわたるマッチング確率の値によって示され、そして、各時間間隔の間の話し手は各間隔内のマッチング確率および／または持続時間（duration）に基づいて決定される。時間間隔Ｔ₁の間に、第１のモバイルデバイスのマッチング確率は最大となり、そして、したがって、第１のモバイルデバイスのユーザーは現在の話し手であると決定される。時間間隔Ｔ₂においては、第３のモバイルデバイスのユーザーが現在の話し手であると決定される、何故ならマッチング確率はこのモバイルデバイスで最も高いからである。同様に、時間間隔Ｔ₃においては、第２のモバイルデバイスのユーザーが現在の話し手であると決定される、何故なら第２のモバイルデバイスに対してのマッチング確率がこの間隔内で最も大きいからである。同様に、時間間隔Ｔ₄の間中においては、第３のモバイルデバイスのユーザーがそのマッチング確率に基づいて現在の話し手であると判定される。

モバイルデバイスのマッチング確率に基づいて、サーバー１５０は、現在の話し手に関する情報を含む会議情報を生成し、そして、出席者のモバイルデバイスに前記会議情報を送信する。サーバー１５０から会議情報を受信した各モバイルデバイスは、その表示ユニット上に現在の話し手に関する情報を表示し得る。

本開示の一実施形態では、サーバー１５０は、出席者のモバイルデバイスの各ペアの入力音情報間の類似度に基づいて、会議での出席の配置を算出する。

モバイルデバイス１６０および１６２などのモバイルデバイスを伴うＮ人の出席者は、場所１１０などの一つの特定の場所で会議に参加するとする。サーバー１５０は、モバイルデバイスからの入力音の情報間の類似度に基づいてＮ人の出席者を識別する。さらに、サーバー１５０は、Ｎ個のモバイルデバイスから送信される場所情報に基づいて、Ｎ個のモバイルデバイスの場所を識別する。Ｎ個のモバイルデバイスの各々もまた、その入力音情報をサーバーに送信し、そして、サーバー１５０の出席者配置算出ユニット３７０は、Ｎ個のモバイルデバイスからの入力音情報に基づいて、Ｎ×Ｎ行列を算出する。各モバイルデバイスからの入力音情報は、モバイルデバイスの入力音および／または前記入力音の音シグニチャを含む。ａ,_ij,と言及される、Ｎ×Ｎ行列のｉ番目の行かつｊ番目の列のエントリは、Ｎ個のモバイルデバイスのｉ番目のモバイルデバイスからの入力音とｊ番目のモバイルデバイスからの入力音との類似度に基づいて計算されても構わない。上記実施形態では、類似度が用いられるが、出席者のモバイルデバイスの各ペアの入力音情報間の相違度が交換可能に（interchangeably）用いられることは理解されるべきである。

いくつかの実施形態では、類似度は、ｉ番目のモバイルデバイスからの音声シグネチャを表すベクトルと、ｊ番目のモバイルデバイスからの音声シグネチャを表す別のベクトルとの間のユークリッド距離に基づいて算出されても構わない。例えば、類似度は、ユークリッド距離に反比例する値、例えば、ユークリッド距離の逆数または前記逆数の対数をとる値でも構わなく、一方、相違度はユークリッド距離に比例する値でも構わない。

一実施形態では、Ｎ×Ｎ行列の各エントリは、Ｎ個のモバイルデバイスの各ペアの入力音間の音レベルの差に基づいて計算されても構わない。例えば、ｊ番目の列中のｉ番目の行のエントリは、ｊ番目のモバイルデバイスに対してのｉ番目のモバイルデバイスの入力音の差または比に基づいて決定されても構わない。

Ｎ×Ｎ行列の全てのエントリが決定された後、出席者配置算出ユニット３７０は、Ｎ×Ｎ行列を、ＰＣＡ（主成分分析）、ＭＤＳ（多次元スケーリング）などの次元削減手法を通じて、２×Ｎ行列に変換する。Ｎ×Ｎ行列は、一般に、対称行列であるので、固有値分解プロセスは、二つの最大の固有ベクトルが２×Ｎ行列を構成するように、Ｎ×Ｎ行列に対して行われる。２×Ｎ行列の各列の二つのエントリは、２次元平面上の特定のモバイルデバイスのｘおよびｙ座標とみなされても構わない。例えば、２×Ｎ行列のｊ番目の列内の二つのエントリａ_1,jおよびａ_2,jは、２次元平面上のｊ番目のモバイルデバイスのｘおよびｙ座標でも構わない。

図１２Ａは、特定の場所での会議でのモバイルデバイス１２０１，１２０２，１２０３および１２０４の典型的な配置、および、前記配置を計算するための相似行列を示している。出席者配置算出ユニット３７０は、四つのモバイルデバイスの各ペアの入力音情報間の類似度に基づいて、４×４行列を算出する。具体的には、４×４行列のエントリａ_i,jは、ｉ番目のモバイルデバイスからの入力音とｊ番目のモバイルデバイスからの入力音との間の類似度を表す。例えば、エントリａ_1,3は、モバイルデバイス１２０１からの入力音とモバイルデバイス１２０３からの入力音声との間の類似度を表す。

全てのエントリが決定された後、出席者配置算出ユニット３７０は、４×４行列を、例えば、上述したＰＣＡまたはＭＤＳなどを用いて、２×４行列に変換する。２×４行列の各列の二つのエントリは、２次元平面上の各モバイルデバイスのｘおよびｙ座標を示す。例えば、エントリａ_1,jおよびａ_2,jは、それぞれ、モバイルデバイス１２０１のｘおよびｙ座標、つまり、（ｘ₁,ｙ₁）を示しても構わない。モバイルデバイスの場所は出席者の場所であるとみなされ、そして、したがって、出席者の配置は、２×４行列のエントリに基づいて、図１２Ａに示されるように、２次元平面上に表すことができる。

２次元平面上の配置は、出席者間の相対的な位置関係を示す。それ故に、出席者の実際の配置は、２次元平面上に表された配置をｘおよびｙ座標に関して、回転したり、スケーリングしたり、またはひっくり返す（flipping）などの特定の処理を経ることで得られる。

サーバー１５０は、上記のように算出された出席者の配置に関する情報を含む会議情報を生成し、そして、出席者のモバイルデバイスの各々に前記会議情報を送信する。各モバイルデバイスの表示ユニットは、図１２Ｂに示されるように、出席者の配置を視覚的に表示しても構わない。

本開示の一実施形態では、サーバー１５０のログ生成ユニット３６０は、出席者参加情報を含む会議の打合せログを生成する。出席者参加情報は、例えば、いつどの出席者が会議に参加したか、いつどの出席者が特定の時間での現在の話し手か、いつどの出席者が会議を去ったかなどの、会議での出席者の様々な活動を含む。

具体的には、サーバー１５０の出席者決定ユニット３２０は、新しい出席者のモバイルデバイスからの入力音と他の出席者の他のモバイルデバイスの各々からの入力音との間の類似度に基づいて、新しい出席者が会議に参加したことを決定する。次に、ログ生成ユニット３６０は、例えば、いつ新しい出席者が参加したか、新しい出席者の識別（identification）を伴って、ログ情報を更新する。同様に、サーバー１５０の出席者決定ユニット３２０はまた、その去っている出席者のモバイルデバイスからの入力音と他の出席者の他のモバイルデバイスの各々からの入力音との間の類似度に基づいて、会議の出席者の一人が会議を去ったことを決定する。次に、ログ生成ユニット３６０は、例えば、いつ出席者が去ったかの時間、その去っている出席者の識別（identification）を伴って、ログ情報を更新する。次に、ログ生成ユニット３６０は、例えば、所定の時間での現在の話し手の識別（identification）を伴って、ログ情報をさらに更新する。

ログ情報は、図１３に示されるように、ダイアグラムを表すことが可能な形態で生成されても構わない。図１３のログ情報は、第１のユーザーおよび第２のユーザーがまず会議に参加し、その後、第３のユーザーが会議に参加することを表している。さらに、ログ情報は引き続く現在の話し手、例えば、第２のユーザーの次に第３のユーザーが続くことをさらに表している。そのうえ、ログ情報は、第３のユーザーが会議を去って、その後、第１のユーザーおよび第２のユーザーが会議を去ることを示している。

いくつかの実施形態では、ログ情報は、各出席者が現在の話し手として決定された合計時間を含むことができる。各出席者の会議全体時間に対する現在の話し手としての合計時間の比率をさらに含んでいても構わない。

サーバー１５０は、先に述べたようにログ情報を含む会議情報を生成し、そして、出席者のモバイルデバイスの各々に前記会議情報を送信する。

図１４は、無線通信システムにおける典型的なモバイルデバイスの設計のブロックダイアグラムを示す。典型的なモバイルデバイス１４００の構成は、モバイルデバイス１６０，１６２，１６４，１６６および１６８により実効されても構わない。モバイルデバイス１４００は、携帯電話、端末、ハンドセット、パーソナルデジタルアシスタント（ＰＤＡ）、無線モデム、コードレス電話などでも構わない。無線通信システムは、符号分割多元接続（ＣＤＭＡ）システム、グローバル・システム・フォー・モバイル・コミュニケーションズ（ＧＳＭ（登録商標））システム、広帯域符号分割多元接続（ＷＣＤＭＡ（登録商標））システム、ロング・ターム・エボルーション（ＬＴＥ）システム、ＬＴＥアドバンストシステムなどでも構わない。さらに、モバイルデバイス１４００は、例えば、Ｗｉ−Ｆｉダイレクト、Ｂｌｕｅｔｏｏｔｈ（登録商標）またはＦｌａｓｈＬｉｎｑ技術を用いて、別のモバイルデバイスと直接的に通信を行っても構わない。

モバイルデバイス１４００は、受信経路および送信経路を介して双方向通信を提供することができる。受信経路上では、基地局によって送信された信号は、アンテナ１４１２によって受信され、そして、受信機（ＲＣＶＲ）１４１４に提供される。受信機１４１４は、受信信号を調整およびデジタル化し、そして、前記調整およびデジタル化された信号などのサンプルをさらなる処理のためのデジタルセクションに提供する。送信経路上では、送信機（ＴＭＴＲ）１４１６は、デジタルセクション１４２０から送信されるデータを受信し、前記データを処理および調整し、そして、アンテナ１４１２を介して基地局に送信される、変調信号を生成する。受信機１４１４および送信機１４１６は、ＣＤＭＡ、ＧＳＭ、ＬＴＥ、ＬＴＥアドバンストなどをサポートする送受信機の一部でも構わない。

デジタルセクション１４２０は、様々な処理、インタフェース、およびメモリユニット、例えば、モデムプロセッサ１４２２、縮小命令セットコンピュータ／デジタル信号プロセッサ（ＲＩＳＣ／ＤＳＰ）１４２４、コントローラ／プロセッサ１４２６、内部メモリ１４２８、汎用オーディオエンコーダ１４３２、汎用オーディオデコーダ１４３４、グラフィックス／ディスプレイプロセッサ１４３６、および外部バスインタフェース（ＥＢＩ）１４３８などを含む。モデムプロセッサ１４２２は、データ送信および受信のための処理、例えば、符号化、変調、復調、および復号を行っても構わない。ＲＩＳＣ／ＤＳＰ１４２４は、モバイルデバイス１４００のための一般的および特殊な処理を行っても構わない。コントローラ／プロセッサ１４２６は、デジタルセクション１４２０内の処理およびインタフェースユニット（processing and interface units）の様々な動作を行っても構わない。内部メモリ１４２８は、デジタルセクション１４２０内の様々なユニットのためのデータおよび／または命令を記憶しても構わない。汎用オーディオエンコーダ１４３２は、オーディオソース１４４２、マイクロフォン１４４３などからの入力信号に対して符号化を行っても構わない。汎用オーディオデコーダ１４３４は、符号化されたオーディオデータに対して復号を行っても構わなく、そして、スピーカー／ヘッドセット１４４４に出力信号を提供しても構わない。グラフィクス／表示プロセッサ１４３６は、表示ユニット１４４６に提示され得る、グラフィックス、ビデオ、画像、およびテキストのための処理を行っても構わない。ＥＢＩ１４３８は、デジタルセクション１４２０メインメモリ１４４８との間のデータ転送を容易にすることができる。

デジタルセクション１４２０は、一つまたは複数のＤＳＰ、マイクロプロセッサ、ＲＩＳＣなどで実装されても構わない。デジタルセクション１４２０はまた、一つまたは複数の特定用途向け集積回路（ＡＳＩＣ）および／またはいくつかの他のタイプの集積回路上に製造されても構わない。

一般に、本明細書に記載の任意のデバイスは、無線電話、セルラフォン、ラップトップコンピュータ、無線マルチメディアデバイス、無線通信パーソナルコンピュータ（ＰＣ）カード、ＰＤＡ、外部または内部モデム、無線チャネルを介して通信するデバイスなどの様々なタイプのデバイスを表し得る。デバイスは、例えば、アクセスターミナル（ＡＴ）、アクセスユニット、加入者ユニット、移動局、モバイルデバイス、モバイルユニット、携帯電話、モバイル、遠隔局、遠隔ターミナル、遠隔ユニット、ユーザーデバイス、ユーザー機器、ハンドヘルドデバイスなどのなどの様々な手段を持ち得る。本明細書に記載する任意のデバイスは、命令およびデータを記憶するためのメモリの他に、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組合せを有し得る。

本明細書に記載された技術は、様々な手段によって実施し得る。例えば、これらの技術は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの組合せで実現し得る。当業者は、さらに、本明細書の開示に関連して説明された様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップが、電子ハードウェア、コンピュータソフトウェア、または両方の組合せとして実施し得ることを理解するであろう。ハードウェアとソフトウェアとのこの互換性を明確に説明するために、様々な例示的なコンポーネント、ブロック、モジュール、回路、およびステップが、それらの機能の観点から一般的に上述されている。そのような機能がハードウェアまたはソフトウェアとして実装されるかどうかは、特定の用途およびシステム全体に課された設計制約に依存する。当業者は、各特定のアプリケーションのために様々な方法で説明された機能を実装することができるが、そのような実装の決定は、本開示の範囲からの逸脱を引き起こすと解釈されるべきではない。

ハードウェア実装のために、技術を実行するために使用される処理ユニットは、一つまたは複数の、ＡＳＩＣ、ＤＳＰ、デジタル信号処理デバイス（ＤＳＰＤ）、プログラマブルロジックデバイス（ＰＬＤ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書に記載の機能を実行するように設計された他の電子ユニット、または、それらの組合せ内で実装され得る。

したがって、本明細書の開示に関連して説明された様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、ＤＳＰ、ＡＳＩＣ、ＦＰＧＡ、または他のプログラマブル論理デバイス、ディスクリートゲートまたはトランジスタロジック、ディスクリートハードウェアコンポーネント、または、本明細書に記載の機能を実行するように設計された任意の組合せを伴って、実装または実施されても構わない。汎用プロセッサは、マイクロプロセッサでもよいが、代わりに、前記プロセッサは任意の従来のプロセッサ、コントローラ、マイクロコントローラ、またはステートマシーンでも構わない。プロセッサはまた、コンピューティングデバイスの組合せ、例えば、ＤＳＰとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと合同の一つまたは複数のマイクロプロセッサ、または任意の他のそのような構成として実装されても構わない。

ファームウェアおよび／またはソフトウェア実装については、前記技術は、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）、プログラマブル読取り専用メモリ（ＰＲＯＭ）、電気的消去可能ＰＲＯＭ（ＥＥＰＲＯＭ）、ＦＬＡＳＨメモリ、コンパクトディスク（ＣＤ）、磁気または光データ記憶デバイスなどのコンピュータ可読媒体上に格納された命令として実施することができる。前記命令は、一つまたは複数のプロセッサによって実行可能であってもよいし、そして、前記プロセッサ（ｓ）に本明細書に記載の機能性のある態様を実行させてもよい。

一つまたは複数の例示的な実施形態では、説明した機能はハードウェア、ソフトウェア、ファームウェア、またはその任意の組合せで実装できる。ソフトウェアで実装する場合、機能は、一つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶するか、あるいはコンピュータ可読媒体を介して送信することができる。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、コンピュータ記憶媒体と通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスできる任意の利用可能な媒体でよい。限定ではなく例として、そのようなコンピュータ可読媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭもしくは他の光ディスク記憶装置、磁気ディスク記憶装置もしくは他の磁気記憶デバイス、または、命令もしくはデータ構造の形態の所望のプログラムコードを運搬または記憶するために使用でき、コンピュータによってアクセスできる任意の他の媒体を備えることができる。さらに、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバー、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。本明細書で使用されるディスク（disk）およびディスク（disc）は、ＣＤ、レーザディスク（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびブルーレイディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。

ソフトウェアモジュールは、ＲＡＭメモリ、フラッシュメモリ、ＲＯＭメモリ、ＥＰＲＯＭメモリ、ＥＥＰＲＯＭメモリ、レジスタ、ハードディスク、取外し可能ディスク、ＣＤ−ＲＯＭ、または当技術分野で知られている任意の他の形態の記憶媒体内に存在してもよい。例示的な記憶媒体は、プロセッサが、記憶媒体から情報を読み出し、記憶媒体に情報を書き込むことができるようにプロセッサに結合されている。代替的には、記憶媒体は、プロセッサと一体であってよい。プロセッサおよび記憶媒体は、ＡＳＩＣ内に存在してもよい。ＡＳＩＣはユーザー端末内に存在してもよい。代替的には、プロセッサおよび記憶媒体は、ユーザー端末内でディスクリートコンポーネントとして存在してもよい。

本開示の先の説明は、任意の当業者が本開示を作製かまたは使用することを可能にするために提供されている。本開示に対する種々の変更は、当業者に容易に明らかになり、そして、本書類で規定される一般的な原理は、本開示の精神または範囲から逸脱することなく、他の変更に適用されてもよい。したがって、本開示は、本書類で説明された例および設計に限定されることを意図されるのではなく、本書類に開示される原理および新規な特徴に一致する最も広い範囲に一致することを意図される。

例示的な実施は、一つまたは複数のスタンドアロンのコンピュータシステムとの関係で本明細書に開示される主題の態様を利用することを言及することがあるが、前記主題はそのように限定されるものではなく、むしろ、ネットワークまたは分散コンピューティング環境などの任意のコンピューティング環境との関連で実施することができる。さらに、本明細書に開示される主題の態様は、複数の処理チップまたはデバイスの内または複数の処理チップまたはデバイスに跨がって実装されても構わなく、そして、記憶も同様に複数のデバイスに跨がって遂げられても構わない。このようなデバイスは、ＰＣ、ネットワークサーバー、およびハンドヘルドデバイスを含み得る。

前記主題は、構造的な特徴および／または方法論的な動作に特有の言葉で説明されてきたが、添付の特許請求の範囲内で定義される主題は、必ずしも上述した特定の特徴または動作に限定されないことを理解されたい。むしろ、上述の特定の特徴および動作は、特許請求の範囲を実施する例示的な形態として開示されている。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［１］モバイルデバイス内に会議情報を提供するための方法、前記方法は、
前記モバイルデバイス内で、一つまたは複数の場所（locations）での会議の一つまたは複数の始動要件（starting requirements）をモニタすること；
前記会議の前記一つまたは複数の始動要件が検出されたときに、前記モバイルデバイスからの入力音情報（input sound information）をサーバーに送信すること；
前記サーバーから会議情報を受信すること；および
前記会議情報を前記モバイルデバイス上に表示すること
を具備してなること。
［２］［１］の方法において、前記会議は、二つ以上の場所間での遠隔会議（teleconference）である。
［３］［１］の方法において、前記会議は、一つの場所にてである。
［４］［１］の方法において、前記会議の前記一つまたは複数の始動要件は、前記会議の開始時間、前記会議の場所および会議環境（conference environment）の音響特性の少なくとも一つを具備してなる。
［５］［１］の方法において、前記一つまたは複数の始動要件は、前記モバイルデバイス中に入力される音（sound）が会議環境の音響特性に対応するときに検出される。
［６］［１］の方法においては、一つまたは複数の始動要件をモニタすることは、前記モバイルデバイス内に前記会議の前記一つまたは複数の始動要件を予め記憶することを具備してなる。
［７］［１］の方法において、前記会議情報は、前記会議での出席者についての情報を具備してなる。
［８］［７］の方法において、前記出席者についての前記情報は、前記出席者の識別（identification）および場所の少なくとも一つを具備してなる。
［９］［１］の方法において、前記入力音情報は、前記モバイルデバイスの入力音の音レベルを具備してなる。
［１０］［１］の方法において、前記入力音情報は、前記会議での出席者中の現在の話し手を決定するための、前記モバイルデバイスの音声活動（voice activity）情報を具備してなる。
［１１］［１０］の方法において、前記音声活動情報は、前記モバイルデバイスの所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を具備してなる。
［１２］［１０］の方法において、前記音声活動情報は、前記モバイルデバイスの入力音が前記モバイルデバイスのユーザーの音声の音響特性と一致する確率を具備してなる。
［１３］［１］の方法において、前記会議情報は、前記会議での出席者の配置についての情報を具備してなる。
［１４］［１］の方法において、前記会議情報は、参加者参加（attendee participation）情報を含む打合せログ（meeting log）を具備してなる。
［１５］会議情報を提供するためのモバイルデバイスは、
一つまたは複数の場所（locations）での会議の一つまたは複数の始動要件（starting requirements）をモニタするように構成された開始（initiating）ユニット；
前記会議の前記一つまたは複数の始動要件が検出されたときに、入力音情報（input sound information）をサーバーに送信するように構成された送信ユニット；
前記サーバーから会議情報を受信するように構成された受信ユニット；および
前記会議情報を表示するように構成された表示ユニット
を具備してなること。
［１６］［１５］のモバイルデバイスにおいて、前記会議は、二つ以上の場所間での遠隔会議（teleconference）である。
［１７］［１５］のモバイルデバイスにおいて、前記会議は、一つの場所にてである。
［１８］［１５］のモバイルデバイスにおいて、前記会議の前記一つまたは複数の始動要件は、前記会議の開始時間、前記会議の場所および会議環境（conference environment）の音響特性の少なくとも一つを具備してなる。
［１９］［１５］のモバイルデバイスにおいて、前記一つまたは複数の始動要件は、前記モバイルデバイス中に入力される音（sound）が会議環境の音響特性に対応するときに検出される。
［２０］［１５］のモバイルデバイス置において、前記会議の前記一つまたは複数の始動要件は、前記モバイルデバイス内に予め記憶されている。
［２１］［１５］のモバイルデバイスにおいて、前記会議情報は、前記会議の出席者についての情報を具備してなる。
［２２］［２１］のモバイルデバイスにおいて、前記出席者についての前記情報は、前記出席者の識別（identification）および場所の少なくとも一つを具備してなる。
［２３］［１５］のモバイルデバイスにおいて、前記入力音情報は、前記モバイルデバイスの入力音の音レベルを具備してなる。
［２４］［１５］のモバイルデバイスにおいて、前記入力音情報は、前記会議での出席者中の現在の話し手を決定するための、前記モバイルデバイスの音声活動（voice activity）情報を具備してなる。
［２５］［２４］のモバイルデバイスにおいて、前記音声活動情報は、前記モバイルデバイスの所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を具備してなる。
［２６］［２４］のモバイルデバイスにおいて、前記音声活動情報は、前記モバイルデバイスの入力音が前記モバイルデバイスのユーザーの音声の音響特性と一致する確率を具備してなる。
［２７］［１５］のモバイルデバイスにおいて、前記会議情報は、前記会議での出席者の配置についての情報を具備してなる。
［２８］［１５］のモバイルデバイスにおいて、前記会議情報は、参加者参加（attendee participation）情報を含む打合せログ（meeting log）を具備してなる。
［２９］会議情報を提供するためのモバイルデバイスは、
一つまたは複数の場所での会議の一つまたは複数の始動要件（starting requirements）をモニタするための開始（initiating）手段；
前記会議の前記一つまたは複数の始動要件が検出されたときに、入力音情報（input sound information）をサーバーに送信するための送信手段；
前記サーバーから会議情報を受信するための受信手段；および
前記会議情報を表示するための表示手段
を具備してなること。
［３０］［２９］のモバイルデバイスにおいて、前記会議は、二つ以上の場所間での遠隔会議（teleconference）である。
［３１］［２９］のモバイルデバイスにおいて、前記会議は、一つの場所にてである。
［３２］［２９］のモバイルデバイスにおいて、前記会議の前記一つまたは複数の始動要件は、前記会議の開始時間、前記会議の場所および会議環境（conference environment）の音響特性の少なくとも一つを具備してなる。
［３３］［２９］のモバイルデバイスにおいて、前記一つまたは複数の始動要件は、前記モバイルデバイス中に入力される音（sound）が会議環境の音響特性に対応するときに検出される。
［３４］［２９］のモバイルデバイス置において、前記会議の前記一つまたは複数の始動要件は、前記モバイルデバイス内に予め記憶されている。
［３５］［２９］のモバイルデバイスにおいて、前記会議情報は、前記会議の出席者についての情報を具備してなる。
［３６］［３５］のモバイルデバイスにおいて、前記出席者についての前記情報は、前記出席者の識別（identification）および場所の少なくとも一つを具備してなる。
［３７］［２９］のモバイルデバイスにおいて、前記入力音情報は、前記モバイルデバイスの入力音の音レベルを具備してなる。
［３８］［２９］のモバイルデバイスにおいて、前記入力音情報は、前記会議での出席者中の現在の話し手を決定するための、前記モバイルデバイスの音声活動（voice activity）情報を具備してなる。
［３９］［３８］のモバイルデバイスにおいて、前記音声活動情報は、前記モバイルデバイスの所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を具備してなる。
［４０］［３８］のモバイルデバイスにおいて、前記音声活動情報は、前記モバイルデバイスの入力音が前記モバイルデバイスのユーザーの音声の音響特性と一致する確率を具備してなる。
［４１］［２９］のモバイルデバイスにおいて、前記会議情報は、前記会議での出席者の配置についての情報を具備してなる。
［４２］［２９］のモバイルデバイスにおいて、前記会議情報は、参加者参加（attendee participation）情報を含む打合せログ（meeting log）を具備してなる。
［４３］会議情報を提供するための命令（instructions）を具備してなるコンピュータ可読媒体、前記命令はプロセッサに、
モバイルデバイス内で、一つまたは複数の場所での会議の一つまたは複数の始動要件（starting requirements）をモニタすること；
前記会議の前記一つまたは複数の始動要件が検出されたときに、前記モバイルデバイスからの入力音情報（input sound information）をサーバーに送信すること；
前記サーバーから会議情報を受信すること；および
前記会議情報を前記モバイルデバイス上に表示すること
の動作（operations）を行わせること。
［４４］［４３］の媒体において、前記会議は、二つ以上の場所間での遠隔会議（teleconference）である。
［４５］［４３］の媒体において、前記会議は、一つの場所にてである。
［４６］［４３］の媒体において、前記一つまたは複数の始動要件は、前記会議の開始時間、前記会議の場所および会議環境（conference environment）の音響特性の少なくとも一つを具備してなる。
［４７］［４３］の媒体において、前記一つまたは複数の始動要件は、前記モバイルデバイス中に入力される音（sound）が会議環境の音響特性に対応するときに検出される。
［４８］［４３］の媒体において、一つまたは複数の始動要件をモニタすることは、前記モバイルデバイス内に前記一つまたは複数の始動要件を予め記憶することを具備してなる。
［４９］［４３］の媒体において、前記会議情報は、前記会議の出席者についての情報を具備してなる。
［５０］［４９］の媒体において、前記出席者についての前記情報は、前記出席者の識別（identification）および場所の少なくとも一つを具備してなる。
［５１］［４３］の媒体において、前記入力音情報は、前記モバイルデバイスの入力音の音レベルを具備してなる。
［５２］［４３］の媒体において、前記入力音情報は、前記会議での出席者中の現在の話し手を決定するための、前記モバイルデバイスの音声活動（voice activity）情報を具備してなる。
［５３］［５２］の媒体において、前記音声活動情報は、前記モバイルデバイスの所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を具備してなる。
［５４］［５２］の媒体において、前記音声活動情報は、前記モバイルデバイスの入力音が前記モバイルデバイスのユーザーの音声の音響特性と一致する確率を具備してなる。
［５５］［４３］の媒体において、前記会議情報は、前記会議での出席者の配置についての情報を具備してなる。
［５６］［４３］の媒体において、前記会議情報は、参加者参加（attendee participation）情報を含む打合せログ（meeting log）を具備してなる。
［５７］サーバーおよび複数のモバイルデバイスを有するシステム内に会議情報を提供するための方法、前記方法は、
一つまたは複数のモバイルデバイスによって、一つまたは複数の場所での会議の一つまたは複数の始動要件（starting requirements）をモニタすること；
前記会議の前記一つまたは複数の始動要件が検出されたときに、各モバイルデバイスからの入力音情報（input sound information）を前記サーバーに送信すること；
前記サーバーによって、各モバイルデバイスからの前記入力音情報に基づいて、会議情報を生成すること；
前記サーバーからの前記会議情報を各モバイルデバイスに送信すること；および
前記会議情報を各モバイルデバイス上に表示すること
を具備してなること。
［５８］［５７］の方法において、前記会議は、二つ以上の場所間での遠隔会議（teleconference）である。
［５９］［５７］の方法において、前記会議は、一つの場所にてである。
［６０］［５７］の方法において、前記会議の前記一つまたは複数の始動要件は、前記会議の開始時間、前記会議の場所および会議環境（conference environment）の音響特性の少なくとも一つを具備してなる。
［６１］［５７］の方法において、前記一つまたは複数の始動要件は、各モバイルデバイス中に入力される音（sound）が会議環境の音響特性に対応するときに検出される。
［６２］［５７］の方法において、一つまたは複数の始動要件をモニタすることは、各モバイルデバイス内に前記一つまたは複数の始動要件を予め記憶することを具備してなる。
［６３］［５７］の方法において、前記会議情報は、前記会議の出席者についての情報を具備してなる。
［６４］［６３］の方法において、前記出席者についての前記情報は、前記出席者の識別（identification）および場所の少なくとも一つを具備してなる。
［６５］［５７］の方法において、前記入力音情報は、各モバイルデバイスからの入力音の音レベルを具備してなり、および
ここにおいて、会議情報を生成することは、前記一つまたは複数のモバイルデバイスからの前記音レベルに基づいて、前記会議での出席者中の現在の話し手を決定することを具備してなる。
［６６］［５７］の方法において、前記入力音情報は、各モバイルデバイスからの音声活動（voice activity）情報を具備してなり、および
ここにおいて、会議情報を生成することは、前記一つまたは複数のモバイルデバイスからの前記音声活動に基づいて、前記会議での出席者中の現在の話し手を決定することを具備してなる。
［６７］［６６］の方法において、各モバイルデバイスからの前記音声活動情報は、所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を具備してなる。
［６８］［６６］の方法において、各モバイルデバイスからの前記音声活動情報は、入力音が前記モバイルデバイスのユーザーの音声の音響特性と一致する確率を具備してなる。
［６９］［５７］の方法において、前記会議情報は、前記会議での出席者の配置についての情報を具備してなる。
［７０］［６９］の方法において、前記会議での前記出席者の前記配置は、前記一つまたは複数のモバイルデバイスの各ペア間の前記入力音情報の類似度に基づいて決定される。
［７１］［５７］の方法において、前記会議情報は、参加者参加（attendee participation）情報を含む打合せログ（meeting log）を具備してなる。
［７２］［５７］の方法において、前記一つまたは複数のモバイルデバイスの各々からの前記入力音情報は入力音（input sound）を具備してなり、そして
ここにおいて、会議情報を生成することは、
前記サーバーによって、前記一つまたは複数のモバイルデバイスの各ペア間の入力音の類似度を決定すること；および
前記サーバーによって、前記類似度に基づいて、前記会議での出席者のモバイルデバイスを決定すること
を具備してなる。
［７３］［７２］の方法において、前記出席者の前記モバイルデバイスは、前記類似度が所定の閾値よりも大きいかに基づいて決定される。
［７４］サーバーおよび複数のモバイルデバイスを有するシステム内に会議情報を提供するための命令（instructions）を具備してなるコンピュータ可読記憶媒体、前記命令はプロセッサに、
一つまたは複数のモバイルデバイスによって、一つまたは複数の場所での会議の一つまたは複数の始動要件（starting requirements）をモニタすること；
前記会議の前記一つまたは複数の始動要件が検出されたときに、各モバイルデバイスからの入力音情報（input sound information）を前記サーバーに送信すること；
前記サーバーによって、各モバイルデバイスからの前記入力音情報に基づいて、会議情報を生成すること；
前記サーバーから前記会議情報を各モバイルデバイスに送信すること；および
前記会議情報を各モバイルデバイス上に表示すること
の動作（operations）を行わせること。
［７５］［７４］の媒体において、前記会議は、二つ以上の場所間での遠隔会議（teleconference）である。
［７６］［７４］の媒体において、前記会議は、一つの場所にてである。
［７７］［７４］の媒体において、前記会議の前記一つまたは複数の始動要件は、前記会議の開始時間、前記会議の場所（location）および会議環境（conference environment）の音響特性の少なくとも一つを具備してなる。
［７８］［７４］の媒体において、前記一つまたは複数の始動要件は、各モバイルデバイス中に入力される音（sound）が会議環境の音響特性に対応するときに検出される。
［７９］［７４］の媒体において、一つまたは複数の始動要件をモニタすることは、各モバイルデバイス内に前記一つまたは複数の始動要件を予め記憶することを具備してなる。
［８０］［７４］の媒体において、前記会議情報は、前記会議の出席者についての情報を具備してなる。
［８１］［８０］の媒体において、前記出席者についての前記情報は、前記出席者の識別（identification）および場所の少なくとも一つを具備してなる。
［８２］［７４］の媒体において、前記入力音情報は、各モバイルデバイスからの入力音の音レベルを具備してなり、および
ここにおいて、会議情報を生成することは、前記一つまたは複数のモバイルデバイスからの前記音レベルに基づいて、前記会議での出席者中の現在の話し手を決定することを具備してなる。
［８３］［７４］の媒体において、前記入力音情報は、各モバイルデバイスからの音声活動（voice activity）情報を具備してなり、および
ここにおいて、会議情報を生成することは、前記一つまたは複数のモバイルデバイスからの前記音声活動に基づいて、前記会議での出席者中の現在の話し手を決定することを具備してなる。
［８４］［８３］の媒体において、各モバイルデバイスからの前記音声活動情報は、所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を具備してなる。
［８５］［８３］の媒体において、各モバイルデバイスからの前記音声活動情報は、入力音が前記モバイルデバイスのユーザーの音声の音響特性と一致する確率を具備してなる。
［８６］［７４］の媒体において、前記会議情報は、前記会議での出席者の配置についての情報を具備してなる。
［８７］［８６］の媒体において、前記会議での前記出席者の前記配置は、前記一つまたは複数のモバイルデバイスの各ペア間の前記入力音情報の類似度に基づいて決定される。
［８８］［７４］の媒体において、前記会議情報は、参加者参加（attendee participation）情報を含む打合せログ（meeting log）を具備してなる。
［８９］［７４］の媒体において、前記一つまたは複数のモバイルデバイスの各々からの前記入力音情報は入力音（input sound）を具備してなり、そして
ここにおいて、会議情報を生成することは、
前記サーバーによって、前記一つまたは複数のモバイルデバイスの各ペア間の入力音の類似度を決定すること；および
前記サーバーによって、前記類似度に基づいて、前記会議での出席者のモバイルデバイスを決定すること
を具備してなる。
［９０］［８９］の媒体において、前記出席者の前記モバイルデバイスは、前記類似度が所定の閾値よりも大きいかに基づいて決定される。

Claims

会議中に、モバイルデバイスが所定の構内に位置している間に、前記モバイルデバイスからサーバーに入力音情報（input sound information）を送信することと、
前記サーバーから会議情報を受信することとを含み、
前記会議情報は、前記モバイルデバイスの、前記所定の構内の第１の物理的な場所と、第２のモバイルデバイスの、前記所定の構内の第２の物理的な場所とを示しており、
前記第１の物理的な場所と前記第２の物理的な場所は、前記モバイルデバイスからの前記入力音情報と、前記第２のモバイルデバイスからの第２の入力音情報との間の類似性に基づいて決定されたものである方法。
請求項１の方法において、前記会議は、二つ以上の構内に位置しているデバイス間での遠隔会議（teleconference）である。
請求項１の方法において、前記第１の物理的な場所に対応する第１の表示の場所における第１のアイコンと、前記第２の物理的な場所に対応する第２の表示の場所における第２のアイコンとを含むグラフィカルユーザインターフェースを表示することをさらに含む。
請求項１の方法において、前記会議情報は、前記会議での出席者に関連する情報を含む。
請求項４の方法において、前記情報は、前記出席者の、識別（identification）と場所とのうちの少なくとも一つを含む。
請求項１の方法において、前記入力音情報は、前記モバイルデバイスの入力音の音レベルを含む。
請求項１の方法において、前記入力音情報は、前記会議での出席者中の現在の話し手を決定するための、前記モバイルデバイスの音声活動（voice activity）情報を含む。
請求項７の方法において、前記音声活動情報は、所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を含む。
請求項７の方法において、前記音声活動情報は、前記モバイルデバイスの入力音が前記モバイルデバイスのユーザーの音声の音響特性と一致する確率を含む。
請求項１の方法において、前記会議情報は、前記会議の打合せログ（meeting log）を含み、参加者参加（attendee participation）情報を含む。
会議情報を提供するサーバーにおいて、
所定の構内に関係付けられている会議に参加している複数のモバイルデバイスから入力音情報を受信するように構成されている受信ユニットと、
前記複数のモバイルデバイスのうちの第２のモバイルデバイスから受信された第２の入力音情報に対する、前記複数のモバイルデバイスのうちの第１のモバイルデバイスから受信された第１の入力音情報の類似性に基づいて、前記第１のモバイルデバイスの、前記所定の構内の第１の物理的な場所を決定するようにと、前記第１の入力音情報に対する前記第２の入力音情報の類似性に基づいて、前記第２のモバイルデバイスの、前記所定の構内の第２の物理的な場所を決定するように構成されている配置ユニットと、
前記サーバーから前記複数のモバイルデバイスに会議情報を送信するように構成されている送信ユニットとを具備するサーバー。
請求項１１のサーバーにおいて、前記会議は、二つ以上の構内に位置しているデバイス間での遠隔会議（teleconference）である。
請求項１１のサーバーにおいて、前記所定の構内は所定の都市の会議室を含む。
請求項１１のサーバーにおいて、前記会議情報は、前記会議の出席者に関連する情報を含む。
請求項１４のサーバーにおいて、前記情報は、前記出席者の、識別（identification）と場所とのうちの少なくとも一つを含む。
請求項１１のサーバーにおいて、前記入力音情報は、前記複数のモバイルデバイスのそれぞれの入力音の音レベルを含む。
請求項１１のサーバーにおいて、前記入力音情報は、前記複数のモバイルデバイスのそれぞれの音声活動（voice activity）情報を含む。
請求項１７のサーバーにおいて、前記音声活動情報は、所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を含む。
請求項１７のサーバーにおいて、前記複数のモバイルデバイスのそれぞれからの前記音声活動情報は、入力音が前記複数のモバイルデバイスのうちの所定のモバイルデバイスのユーザーの音声の音響特性と一致する確率を含む。
請求項１１のサーバーにおいて、前記会議情報は、前記会議の打合せログ（meeting log）を含み、参加者参加（attendee participation）情報を含む。
サーバーにおいて、
所定の構内に関係付けられている会議に参加している複数のモバイルデバイスから入力音情報を受信する手段と、
前記複数のモバイルデバイスのうちの第２のモバイルデバイスから受信された第２の入力音情報に対する、前記複数のモバイルデバイスのうちの第１のモバイルデバイスから受信された第１の入力音情報の類似性に基づいて、前記第１のモバイルデバイスの、前記所定の構内の第１の物理的な場所と、前記第１の入力音情報に対する前記第２の入力音情報の類似性に基づいて、前記第２のモバイルデバイスの、前記所定の構内の第２の物理的な場所とを決定する手段と、
前記サーバーから前記複数のモバイルデバイスに会議情報を送信する手段とを具備するサーバー。
請求項２１のサーバーにおいて、前記会議は、二つ以上の構内に位置しているデバイス間での遠隔会議（teleconference）である。
請求項２１のサーバーにおいて、前記所定の構内は所定の都市の会議室を含む。
請求項２１のサーバーにおいて、前記会議情報は、前記会議の出席者に関連する情報を含む。
請求項２４のサーバーにおいて、前記情報は、前記出席者の、識別（identification）と場所とのうちの少なくとも一つを含む。
請求項２１のサーバーにおいて、前記入力音情報は、前記複数のモバイルデバイスのそれぞれの入力音の音レベルを含む。
請求項２１のサーバーにおいて、前記入力音情報は、前記複数のモバイルデバイスのそれぞれの音声活動（voice activity）情報を含む。
請求項２７のサーバーにおいて、前記音声活動情報は、所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を含む。
請求項２７のサーバーにおいて、前記複数のモバイルデバイスのそれぞれからの前記音声活動情報は、入力音が前記複数のモバイルデバイスのうちの所定のモバイルデバイスのユーザーの音声の音響特性と一致する確率を含む。
請求項２１のサーバーにおいて、前記会議情報は、前記会議の打合せログ（meeting log）を含み、参加者参加（attendee participation）情報を含む。
プロセッサによって実行されるときに前記プロセッサに動作（operations）を実行させる命令（instructions）を具備するコンピュータ可読記憶デバイスにおいて、
前記動作は、
会議中に、モバイルデバイスが所定の構内に位置している間に、前記モバイルデバイスからサーバーに入力音情報（input sound information）を送信することと、
前記サーバーから会議情報を受信することとを含み、
前記会議情報は、前記モバイルデバイスの、前記所定の構内の第１の物理的な場所と、第２のモバイルデバイスの、前記所定の構内の第２の物理的な場所とを示しており、
前記第１の物理的な場所と前記第２の物理的な場所は、前記モバイルデバイスからの前記入力音情報と、前記第２のモバイルデバイスからの第２の入力音情報との間の類似性に基づいて決定されたものであるコンピュータ可読記憶デバイス。
請求項３１のコンピュータ可読記憶デバイスにおいて、前記会議は、二つ以上の構内に位置しているデバイス間での遠隔会議（teleconference）である。
請求項３１のコンピュータ可読記憶デバイスにおいて、前記動作は、前記第１の物理的な場所に対応する第１の表示の場所における第１のアイコンと、前記第２の物理的な場所に対応する第２の表示の場所における第２のアイコンとを含むグラフィカルユーザインターフェースを表示することをさらに含む。
請求項３１のコンピュータ可読記憶デバイスにおいて、前記会議情報は、前記会議の出席者に関連する情報を含む。
請求項３４のコンピュータ可読記憶デバイスにおいて、前記情報は、前記出席者の、識別（identification）と場所とのうちの少なくとも一つを含む。
請求項３１のコンピュータ可読記憶デバイスにおいて、前記入力音情報は、前記モバイルデバイスの入力音の音レベルを含む。
請求項３１のコンピュータ可読記憶デバイスにおいて、前記入力音情報は、前記モバイルデバイスの音声活動（voice activity）情報を含む。
請求項３７のコンピュータ可読記憶デバイスにおいて、前記音声活動情報は、所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を含む。
請求項３７のコンピュータ可読記憶デバイスにおいて、前記音声活動情報は、前記モバイルデバイスの入力音が前記モバイルデバイスのユーザーの音声の音響特性と一致する確率を含む。
請求項３１のコンピュータ可読記憶デバイスにおいて、前記会議情報は、前記会議の打合せログ（meeting log）を含み、参加者参加（attendee participation）情報を含む。
所定の構内に関係付けられている会議に参加している複数のモバイルデバイスからの入力音情報（input sound information）を、サーバーにおいて受信することと、
前記複数のモバイルデバイスのうちの第２のモバイルデバイスから受信された第２の入力音情報に対する、前記複数のモバイルデバイスのうちの第１のモバイルデバイスから受信された第１の入力音情報の類似性に基づいて、前記第１のモバイルデバイスの、前記所定の構内の第１の物理的な場所を、前記サーバーによって決定することと、
前記第１の入力音情報に対する前記第２の入力音情報の類似性に基づいて、前記第２のモバイルデバイスの、前記所定の構内の第２の物理的な場所を、前記サーバーによって決定することと、
前記サーバーから前記複数のモバイルデバイスに会議情報を送信することとを含む方法。
請求項４１の方法において、前記会議は、二つ以上の構内に位置しているデバイス間での遠隔会議（teleconference）である。
請求項４１の方法において、前記所定の構内は所定の都市の会議室を含む。
請求項４１の方法において、前記会議情報は、前記会議の出席者に関連する情報を含む。
請求項４４の方法において、前記情報は、前記出席者の、識別（identification）と場所とのうちの少なくとも一つを含む。
請求項４１の方法において、前記入力音情報は、前記複数のモバイルデバイスのそれぞれからの入力音の音レベルを含み、前記サーバーは、一つまたは複数のモバイルデバイスからの前記音レベルに基づいて、前記会議での出席者中の現在の話し手を決定する。
請求項４１の方法において、前記入力音情報は、前記複数のモバイルデバイスのそれぞれからの音声活動（voice activity）情報を含み、前記サーバーは、一つまたは複数のモバイルデバイスからの前記音声活動情報に基づいて、前記会議での出席者中の現在の話し手を決定する。
請求項４７の方法において、前記複数のモバイルデバイスのそれぞれからの前記音声活動情報は、所定の期間の時間（period of time）にわたる平均入力音レベルに対する現在の入力音レベルの比を含む。
請求項４７の方法において、前記複数のモバイルデバイスのそれぞれからの前記音声活動情報は、入力音が前記複数のモバイルデバイスのうちの所定のモバイルデバイスのユーザーの音声の音響特性と一致する確率を含む。
請求項４１の方法において、前記会議情報は、前記会議の打合せログ（meeting log）を含み、参加者参加（attendee participation）情報を含む。
請求項４１の方法において、
前記サーバーによって、前記複数のモバイルデバイスのうちのモバイルデバイスの各ペア間の前記入力音情報の類似度に基づき、相似行列を決定することと、
前記サーバーによって、前記相似行列の変換に基づいて、互いに関しての前記複数のモバイルデバイスの物理的な配置を決定することとをさらに含む。
請求項５１の方法において、前記物理的な配置は、それぞれの類似度が閾値よりも大きいか否かに基づいて決定され、前記相似行列の変換は固有値分解プロセスに基づく。
プロセッサによって実行されるときに前記プロセッサに動作（operations）を実行させる命令（instructions）を具備するコンピュータ可読記憶デバイスにおいて、
前記動作は、
所定の構内に関係付けられている会議に参加している複数のモバイルデバイスからの入力音情報を、サーバーにおいて受信することと、
前記複数のモバイルデバイスのうちの第２のモバイルデバイスから受信された第２の入力音情報に対する、前記複数のモバイルデバイスのうちの第１のモバイルデバイスから受信された第１の入力音情報の類似性に基づいて、前記第１のモバイルデバイスの、前記所定の構内の第１の物理的な場所を、前記サーバーによって決定することと、
前記第１の入力音情報に対する前記第２の入力音情報の類似性に基づいて、前記第２のモバイルデバイスの、前記所定の構内の第２の物理的な場所を、前記サーバーによって決定することと、
前記サーバーから前記複数のモバイルデバイスに会議情報を送信することとを含むコンピュータ可読記憶デバイス。
請求項５３のコンピュータ可読記憶デバイスにおいて、前記会議は、二つ以上の構内に位置しているデバイス間での遠隔会議（teleconference）である。
請求項５３のコンピュータ可読記憶デバイスにおいて、前記所定の構内は所定の都市の会議室を含む。
請求項５３のコンピュータ可読記憶デバイスにおいて、前記会議情報は、前記会議の打合せログ（meeting log）を含み、参加者参加（attendee participation）情報を含む。