WO2023243059A1

WO2023243059A1 - 情報提示装置、情報提示方法及び情報提示プログラム

Info

Publication number: WO2023243059A1
Application number: PCT/JP2022/024206
Authority: WO
Inventors: 聡一郎内田; 充裕後藤
Original assignee: 日本電信電話株式会社
Priority date: 2022-06-16
Filing date: 2022-06-16
Publication date: 2023-12-21

Abstract

この発明の一態様の情報提示装置は、ネットワークを介して複数の参加者端末の内の第１の参加者端末から取得した音声情報を、ネットワークを介して１以上の第２の参加者端末に提示する情報提示装置であって、音源位置規定部と、音声提示部と、視覚効果提示部と、を備える。音源位置規定部は、第２の参加者端末それぞれについて、複数の参加者端末を使用するそれぞれの参加者に対して割り当てられた役割に応じて、第２の参加者端末の第２の参加者の位置を基準とした、第１の参加者端末の第１の参加者の位置である音源位置を規定する。音声提示部は、第２の参加者端末毎に、第１の参加者の音源位置に基づいて、第１の参加者端末からの音声情報を音像定位させた音場情報を生成して、第２の参加者端末それぞれに送信する。視覚効果提示部は、第２の参加者端末毎に、第１の参加者の音源位置に基づく視覚効果を生成して、第２の参加者端末それぞれに送信する。

Description

情報提示装置、情報提示方法及び情報提示プログラム

　この発明の一態様は、情報提示装置、情報提示方法及び情報提示プログラムに関する。

　現状のオンラインコミュニケーションは、音声会話をベースとしたビデオ通話が主流である。

　このビデオ通話では、対面での会話と比べて、非言語要素の情報伝達が制限され、相手との距離感を掴めず画一的な会話になりがちである。そこで、立体音響技術により空間的な音像を形成する情報提示技術が提案されている。しかしながら、このような情報提示技術であっても、聴覚情報だけでは特に奥行き方向の聞き分けが難しく、適切に距離感を把握できない。また、話者の姿を映してその方向から話者の声が聞こえてくるような情報提示技術も提案されている。しかしながら、このような情報提示技術では、会話内容は加味されておらず、画面上の映った位置から音声が聞こえてくる、いわゆる現実再現の文脈に留まっており、必ずしも心地良い距離感で会話できるとは限らない。

　また、最近では、１対１に留まらず、数十名規模での会話が可能となっており、様々な立場や役割の人々と同時にオンラインで会話する機会が増えている。そのため、会話相手の非言語情報を提示できるようにすることが益々重要になってきている。

　会話相手の非言語情報を伝える技術として、非特許文献１はアバターで表現する技術が提案されている。また、非特許文献２はロボットを用いる技術を提案している。しかしながら、これら提案された技術では、視覚的に表示できる人数に限りがあり、大人数の会話には適用が難しい。

　また、多人数でのオンラインコミュニケーションは、雑談だけでなく、会議、商談、学会、展示会、などの明確な目的を持って利用されるケースが増えてきており、そもそも会話相手を視覚的に表現せず、資料（スライド）を中心に閲覧しながら進行する場合も多い。そのような用途には、非特許文献１及び２に提案されている技術を適用することができない。

伊藤冬子ら、「雰囲気の視覚化機能とアバターの利用による合意形成のためのオンライン会議システム」、人工知能学会全国大会論文集、Vol.JSAI06、pp.119-119、2006 長谷川孔明ら、「テレプレゼンスロボットによる無意識的身ぶりの表出が発話交替に与える影響」、日本機械学会論文集、Vol.80、No.819、p.DR0321、2014

　この発明は上記事情に着目してなされたもので、投影すべき視覚情報を妨げることなく話者との適切な距離感を知覚させ得る情報提示技術を提供しようとするものである。

　上記課題を解決するためにこの発明の一態様の情報提示装置は、ネットワークを介して複数の参加者端末の内の第１の参加者端末から取得した音声情報を、ネットワークを介して第１の参加者端末とは異なる１以上の第２の参加者端末に提示する情報提示装置であって、音源位置規定部と、音声提示部と、視覚効果提示部と、を備える。音源位置規定部は、第２の参加者端末それぞれについて、複数の参加者端末を使用するそれぞれの参加者に対して割り当てられた役割に応じて、第２の参加者端末の参加者である第２の参加者の位置を基準とした、第１の参加者端末の参加者である第１の参加者の位置である音源位置を規定する。音声提示部は、１以上の第２の参加者端末毎に、第１の参加者の音源位置に基づいて、第１の参加者端末からの音声情報を音像定位させた音場情報を生成して、第２の参加者端末それぞれに送信する。視覚効果提示部は、１以上の第２の参加者端末毎に、第１の参加者の音源位置に基づく視覚効果を生成して、第２の参加者端末それぞれに送信する。

　すなわちこの発明の一態様によれば、投影すべき視覚情報を妨げることなく話者との適切な距離感を知覚させ得る情報提示技術を提供することができる。

図１は、この発明の一実施形態における情報提示システムの構成の一例を示す図である。図２は、この発明の情報提示装置の一実施形態としてのコミュニケーションサーバのハードウェア構成の一例を示すブロック図である。図３は、コミュニケーションサーバのソフトウェア構成の一例を示すブロック図である。図４は、コミュニケーションサーバの制御部が実行する準備処理の処理手順と処理内容の一例を示すフローチャートである。図５は、コミュニケーションサーバの会話種別データベースが記憶するプリセットデータセットの一例を示す図である。図６は、図５の例のプリセットデータセットが示す参加者の位置関係を表す模式図である。図７は、図４に示した準備処理における参加者情報と役割を登録する処理によってコミュニケーションサーバの参加者情報データベースに記憶された参加者アサインテーブルの内容の一例を示す図である。図８は、図４に示した準備処理における各参加者の音源位置を規定する処理によってコミュニケーションサーバの規定情報データベースに記憶された参加者規定データセットの一例を示す図である。図９は、図８の例の参加者規定データセットに基づく各参加者の位置関係を表す模式図である。図１０は、図９の例における訪問者Ａを基準とした位置関係を表す模式図である。図１１は、図４に示した準備処理における各参加者の音源位置を規定する処理によってコミュニケーションサーバの規定情報データベースに記憶された訪問者Ａについての音源位置規定データテーブルの内容の一例を示す図である。図１２は、訪問者Ａを基準とした位置関係におけるスライドの仮想位置を表す模式図である。図１３は、図１２のスライドの仮想位置での訪問者Ａの表示画面上の見え方の一例を示す模式図である。図１４は、奥行き表現の基準位置をスライドの仮想位置に固定した場合における訪問者Ａの表示画面上の見え方の一例を示す模式図である。図１５は、奥行き表現の基準位置を話者に応じて動的に変化させる場合における訪問者Ａの表示画面上の見え方の一例を示す模式図である。図１６は、コミュニケーションサーバの制御部が実行する会話処理の処理手順と処理内容の一例を示すフローチャートである。図１７は、第１変形例における会話種別データベースが記憶するプリセットデータセットの一例を示す図である。図１８は、第２変形例におけるＹ軸の設定の省略を表す模式図である。

　以下、図面を参照してこの発明に係わる実施形態を説明する。

　［実施形態］
　（構成例）
　（１）システム
　図１は、この発明の一実施形態における情報提示システムの構成の一例を示す図である。

　本実施形態の情報提示システムは、その主体的な構成要素として、この発明の情報提示装置の一実施形態としてのコミュニケーションサーバＣＳを備える。情報提示システムは、このコミュニケーションサーバＣＳと、多人数でのオンラインコミュニケーションを開催する開催者が使用する開催者端末ＯＴ及びオンラインコミュニケーションに参加する参加者が使用する複数の参加者端末ＰＴ１～ＰＴｎ（ｎは任意の整数）との間で、ネットワークＮＷを介して情報データの伝送を行えるようにしたものである。

　ネットワークＮＷは、インターネットである。勿論、ネットワークＮＷは、ＬＡＮ（Local Area Network）など、上記情報データの伝送が可能なものであれば、どのようなネットワークであっても良い。

　多人数でのオンラインコミュニケーションは、オンラインで相互に頻繁なやり取りが行われる会話であり、その会話種別としては、例えば、会議、商談、学会、展示会、大学の講義やディスカッション、などが含まれる。更に多人数でのオンラインコミュニケーションは、役割が複数有るような会話であれば一方向なものであっても良い。例えば、そのような会話種別としては、有識者同士でのパネルディスカッション、選手解説によるスポーツ実況、商品販売、演劇、などが含まれる。

　なお、図１では、開催者端末ＯＴを一つしか示していないが、本実施形態の情報提示システムは、複数の開催者端末ＯＴを含み得ることは勿論である。図１では、代表してその内の一つを示しているに過ぎない。

　（２）装置
　（２－１）開催者端末ＯＴ及び参加者端末ＰＴ１～ＰＴｎ
　開催者端末ＯＴ及び参加者端末ＰＴ１～ＰＴｎは、ＰＣ（Personal Computer）、スマートフォン、グラス型デバイス、などの音声と映像を出力でき、インターネットなどのネットワークＮＷを経由して他者と会話できるものであれば制限しない。

　（２－２）コミュニケーションサーバＣＳ
　図２及び図３は、コミュニケーションサーバＣＳのハードウェア構成及びソフトウェア構成の一例を示すブロック図である。

　コミュニケーションサーバＣＳは、例えば、ウェブ上又はクラウド上に設置されるサーバコンピュータからなる。なお、コミュニケーションサーバＣＳは、開催者端末ＯＴ又は参加者端末ＰＴ１～ＰＴｎの一つであるＰＣが兼用されても良い。

　コミュニケーションサーバＣＳは、制御部１を備え、この制御部１に対し、プログラム記憶部２及びデータ記憶部３を有する記憶ユニットと、通信インタフェース部４とを、バス５を介して接続したものとなっている。なお、図２及び図３では、インタフェースをＩ／Ｆと記している。

　制御部１は、ＣＰＵ（Central Processing Unit）等のハードウェアプロセッサである。例えばＣＰＵは、マルチコア及びマルチスレッドのものを用いることで、同時に複数の情報処理を実行することができる。制御部１は、複数のハードウェアプロセッサを備えていても良い。

　通信インタフェース部４は、制御部１の制御の下、開催者端末ＯＴ及び参加者端末ＰＴ１～ＰＴｎとの間でそれぞれ情報データの送受信を行う。

　プログラム記憶部２は、例えば、記憶媒体としてＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の随時書込み及び読み出しが可能な不揮発性メモリと、ＲＯＭ（Read Only Memory）等の不揮発性メモリとを組み合わせて構成したものである。プログラム記憶部２は、ＯＳ（Operating System）等のミドルウェアに加えて、一実施形態の情報提示に必要な上記各情報の入力及びその登録要求を送信するために必要なアプリケーション・プログラムを格納する。なお、以後、ＯＳと各アプリケーション・プログラムとをまとめてプログラムと称する。

　データ記憶部３は、例えば、記憶媒体として、ＨＤＤやＳＳＤ等の随時書込み及び読み出しが可能な不揮発性メモリと、ＲＡＭ（Random Access Memory）等の揮発性メモリと組み合わせたものである。データ記憶部３は、その記憶領域に、この発明の一実施形態を実施するために必要な主たる記憶部として、会話種別データベース３１と、参加者情報データベース３２と、規定情報データベース３３と、生成情報データベース３４と、を備える。なお、図２及び図３では、データベースをＤＢと記している。

　会話種別データベース３１は、会議、商談、学会、展示会、大学の講義やディスカッション、などの多人数でのオンラインコミュニケーションそれぞれの種別に応じたプリセットデータセットを記憶している。プリセットデータは、参加者の役割と、その役割毎の音源位置と向きとを含む。また、会話種別データベース３１は、開催者によってプリセットデータセットから編集されたデータセットを記憶することができる。参加者情報データベース３２は、この情報提示システムを利用する全てのユーザについて、ユーザＩＤ、パスワードなどのログイン情報、氏名、などのユーザ情報を記憶する。更に、参加者情報データベース３２は、開催者となるユーザからの選択により参加者となるユーザそれぞれ（開催者も参加者となり得る）についての、開催者によって割り当てられた役割の情報を記憶する。規定情報データベース３３は、参加者それぞれについて規定され他の参加者の音源位置に関する情報を記憶する。生成情報データベース３４は、参加者それぞれについて生成された音場情報及び視覚効果情報を記憶する。

　制御部１は、一実施形態を実施するために必要な処理機能部として、会話種別設定部１１、会話種別編集部１２、参加者情報登録部１３、音源位置規定部１４、音声取得部１５、音場生成部１６、音声再生部１７、視覚効果生成部１８及び視覚効果表現部１９を備える。これらの処理機能部は、何れも、プログラム記憶部２に格納されたアプリケーション・プログラムを制御部１のハードウェアプロセッサに実行させることにより実現される。

　なお、処理機能部の内の少なくとも一つの、少なくとも一部の処理機能については、アプリケーション・プログラムと制御部１のハードウェアプロセッサにより実現する代わりに、ＡＳＩＣ（Application Specific Integrated Circuit）、ＤＳＰ（Digital Signal Processor）、ＦＰＧＡ（field-programmable gate array）、ＧＰＵ（Graphics Processing Unit）、等の集積回路により実現するようにしても良い。

　会話種別設定部１１は、通信インタフェース部４によりネットワークＮＷを介して開催者端末ＯＴと通信して、会話種別データベース３１にプリセットデータセットとして記憶されている会話種別のリストを開催者端末ＯＴに提示し、開催者端末ＯＴから会話種別の選択を受け付ける。会話種別設定部１１は、開催者が選択した会話種別のプリセットデータセットを、開催するオンラインコミュニケーションの選択データセットとして、会話種別データベース３１に記憶させる。

　会話種別編集部１２は、通信インタフェース部４によりネットワークＮＷを介して開催者端末ＯＴと通信して、開催者端末ＯＴに会話種別データベース３１に記憶された選択データセットの内容を提示し、開催者端末ＯＴから選択データセットに対する編集を受け付ける。会話種別編集部１２は、編集結果を会話種別データベース３１に記憶された選択データセットに反映させる。

　参加者情報登録部１３は、通信インタフェース部４によりネットワークＮＷを介して開催者端末ＯＴと通信して、開催者端末ＯＴから参加者それぞれについての役割の割り当てを受け付け、割り当てられた役割の情報を参加者情報データベース３２に記憶させる。

　音源位置規定部１４は、参加者情報データベース３２に記憶された各参加者の役割に従って、各参加者の音源位置を確定する。音源位置規定部１４は、確定した参加者それぞれについての音源位置の情報を規定情報データベース３３に記憶させる。音源位置規定部１４は、更に、各参加者の音源位置の位置関係に基づいて、参加者端末ＰＴ１～ＰＴｎそれぞれに提示する視覚表現を決定する。この視覚表現については、動作の説明において、詳細に説明する。音源位置規定部１４は、決定した視覚表現を規定情報データベース３３に記憶させる。

　音声取得部１５は、通信インタフェース部４によりネットワークＮＷを介して、参加者情報データベース３２に記憶されたオンラインコミュニケーションに参加している参加者の参加者端末ＰＴ１～ＰＴｎと通信して、参加者端末ＰＴ１～ＰＴｎそれぞれから音声情報を取得する。

　音場生成部１６は、規定情報データベース３３に記憶された参加者それぞれについて規定された音源位置の情報に基づいて、音声取得部１５が取得した音声情報の送信元である参加者端末の参加者が参加するオンラインコミュニケーションに参加している各参加者の位置に対する送信元の参加者の位置を判別する。そして、音場生成部１６は、その判別結果に基づいて、送信元以外の参加者それぞれに対して提供する音場情報を生成する。音場情報は、音声情報を立体音響技術による空間的な音像として出力するための情報である。音場生成部１６は、生成した各参加者に対する音場情報を生成情報データベース３４に記憶させる。

　音声再生部１７は、音声取得部１５が参加者端末ＰＴ１～ＰＴｎの何れかから音声情報を取得した際、生成情報データベース３４に記憶されている、音声情報の送信元の参加者端末を除く各参加者端末に対する音場情報に、その取得した音声情報を適用する。即ち、音声再生部１７は、取得した音声情報を音像定位させた音場情報を生成する。そして、音声再生部１７は、その音声情報を音像定位させた音場情報を、通信インタフェース部４によりネットワークＮＷを介して、音声情報の送信元の参加者端末を除く各参加者の参加者端末へ送信する。

　視覚効果生成部１８は、規定情報データベース３３に記憶された参加者それぞれについて規定された音源位置の情報に基づいて、音声取得部１５が取得した音声情報の送信元である参加者端末の参加者が参加するオンラインコミュニケーションに参加している各参加者の位置に対する送信元の参加者の位置を判別する。そして、視覚効果生成部１８は、その判別結果に基づいて、規定情報データベース３３に記憶された各参加者の視覚表現に従って、参加者それぞれに対して提供する視覚効果情報を生成する。視覚効果情報は、参加者端末で音声情報を出力する際に提示される視覚表現に関する情報である。視覚効果生成部１８は、生成した各参加者に対する視覚効果情報を生成情報データベース３４に記憶させる。また、視覚効果生成部１８は、音声取得部１５が参加者端末ＰＴ１～ＰＴｎの何れかから音声情報を取得した際、生成情報データベース３４に記憶されている、音声情報の送信元の参加者端末を除く各参加者端末に対する視覚効果情報に、その取得した音声情報を適用する。即ち、視覚効果生成部１８は、取得した音声情報の位置などを表す視覚効果を、視覚効果情報に追加する。そして、視覚効果生成部１８は、生成した参加者それぞれに対して提供する視覚効果情報を、視覚効果表現部１９へ送信する。

　視覚効果表現部１９は、通信インタフェース部４によりネットワークＮＷを介して参加者端末ＰＴ１～ＰＴｎと通信して、オンラインコミュニケーションに参加している各参加者の参加者端末へ、視覚効果表現部１９が生成した各参加者に対する視覚効果情報を送信する。

　（動作例）
　次に、以上のように構成されたコミュニケーションサーバＣＳの動作例を説明する。なお、開催者端末ＯＴ及び参加者端末ＰＴ１～ＰＴｎからのログイン等の基礎的な動作については、その説明を省略する。

　（１）準備処理
　図４は、コミュニケーションサーバＣＳの制御部１が実行する準備処理の処理手順と処理内容の一例を示すフローチャートである。制御部１は、通信インタフェース部４により、ネットワークＮＷを介してオンラインコミュニケーションを開催しようとする開催者が使用する開催者端末ＯＴから送信されてくる準備要求を受けたときに、この準備処理を開始する。準備処理は、基本的に、開催者端末ＯＴとの間の処理であり、参加者端末ＰＴ１～ＰＴｎとの間では何も実施しない。

　準備処理を開始すると、制御部１は、会話種別設定部１１として動作して、開催者端末ＯＴから、会議や展覧会と言った会話種別を設定する処理を実施する（ステップＳ１０１）。具体的には、制御部１は、通信インタフェース部４によりネットワークＮＷを介して開催者端末ＯＴと通信して、会話種別データベース３１にプリセットデータセットとして記憶されている会話種別のリストを開催者端末ＯＴに提示し、開催者端末ＯＴから会話種別の選択を受け付ける。

　プリセットデータセットは、当該会話種別における主な役割の一覧と、それら各役割についての音源位置及び向きが予め設定されたものである。図５は、会話種別データベース３１が記憶するプリセットデータセット３１１の一例を示す図である。図５に示す例は、会話種別が「展覧会」のプリセットデータセット３１１である。即ち、この「展示会」のプリセットデータセットでは、参加者の役割として「展示員ＥＨ」、「アテンダントＡＴ」、「有識者ＥＰ」、「訪問者ＶＩ」、などが存在し、各役割毎の音源位置と向きが設定されている。

　このプリセットデータセットにおける各役割間の位置関係は、例えば現実の会話での位置関係を模倣して設定されている。図６は、図５の例のプリセットデータセットが示す参加者の位置関係を表す模式図である。なお、音源位置の原点（０，０，０）については、訪問者ＶＩなど任意の役割の訪問者の音源位置の座標を設定しても良いし、４つの役割間の中央付近に設けても良い。

　会話種別設定部１１は、開催者が選択した会話種別のプリセットデータセットを、開催すべきオンラインコミュニケーションの選択データセットとして、会話種別データベース３１に別途記憶させる。勿論、データ記憶部３に別のデータベースを別途構成して、この選択データセットをはじめとした、後述する開催するべきオンラインコミュニケーションに係わる情報を、そこに記憶するようにしても構わない。

　次に、制御部１は、会話種別編集部１２として動作して、開催者端末ＯＴから、役割、音源位置及び向きを編集する処理を実施する（ステップＳ１０２）。上記ステップＳ１０１で選択されて会話種別データベース３１に記憶された選択データセットは、一般的なフォーマットであり、開催者が意図するオンラインコミュニケーションに沿わない場合が有る。よって、制御部１は、通信インタフェース部４によりネットワークＮＷを介して開催者端末ＯＴと通信して、会話種別データベース３１に記憶した、選択データセットを開催者端末ＯＴに提示し、その選択データセットに対する開催者によるカスタマイズを受け付ける。そして、制御部１は、そのカスタマイズ結果を、会話種別データベース３１に記憶された選択データセットに反映させる。勿論、開催者がデフォルトのプリセットデータセットの役割、音源位置及び向きに異存が無いならば、このステップＳ１０２の処理はスキップされることができる。

　次に、制御部１は、参加者情報登録部１３として動作して、参加者情報と役割を登録する処理を実施する（ステップＳ１０３）。具体的には、制御部１は、通信インタフェース部４によりネットワークＮＷを介して開催者端末ＯＴと通信して、参加者情報データベース３２に記憶されているユーザの中から、開催するオンラインコミュニケーションに参加する参加者の選択を受け付ける。そして、制御部１は、個々の参加者についての、選択した会話種別に応じた、会話を構成する役割の何れかへの割り当てを受け付ける。この場合、各役割には、複数名の参加者を割り当てても良い。そして、制御部１は、開催者によって割り当てられた役割の情報を参加者情報データベース３２に記憶させる。なお、参加者情報データベース３２に記憶されていないユーザを、開催者端末ＯＴから新たに登録できるようにしても良い。

　図７は、こうして割り当てられた役割の情報を記憶する参加者情報データベース３２の参加者アサインテーブル３２１の内容の一例を示す図である。この例では、二人のユーザが展示員ＥＨ、一人のユーザがアテンダントＡＴ、一人のユーザが有識者ＥＰ、三人のユーザが訪問者ＶＩ、の役割に割り当てられている。

　次に、制御部１は、音源位置規定部１４として動作して、各参加者の音源位置を規定する処理を実施する（ステップＳ１０４）。具体的には、制御部１は、会話種別データベース３１に記憶されたプリセットデータセット３１１と参加者情報データベース３２に記憶された参加者アサインテーブル３２１とに基づいて、割り当てられた役割に従って各参加者の音源位置を確定する。この際、制御部１は、先ず、参加者情報データベース３２に記憶された参加者アサインテーブル３２１から各役割の人数を判別し、会話種別データベース３１に記憶されたプリセットデータセット３１１に対して、その人数の情報を加えた参加者規定データセットを作成し、規定情報データベース３３に記憶させる。図８は、規定情報データベース３３に記憶された参加者規定データセット３３１の一例を示す図である。

　参加者規定データセット３３１において、展示員及び訪問者のように、１つの役割に複数名の参加者が割り当てられた場合、制御部１は、それら複数人の音源位置を、単純に同座標上に配置することができる。或いは、制御部１は、例えば参加者規定データセット３３１に記憶された音源位置を中心として、それら複数の参加者の音源位置を、一定の距離内にランダムに配置したり、均一に分散させたりしても良い。図９は、図８の例の参加者規定データセット３３１に基づいて、１つの役割に複数名の参加者が割り当てられた場合に、複数の参加者の音源位置を規定した、各参加者の位置関係を表す模式図である。同様に、向きについても、単純に役割毎の向きを適用しても良いし、例えば全参加者の音源位置の平均座標（ここでは中央とする）を求め、その中央が正面になるように変更しても良い。制御部１は、こうして規定した参加者それぞれについての音源位置及び向きの情報を規定情報データベース３３に記憶させる。

　そして更に、制御部１は、この参加者それぞれについての音源位置の情報に基づいて、各訪問者の音源位置を基準にした音源位置規定データテーブルをそれぞれ作成し、規定情報データベース３３に記憶させる。

　図１０は、図９の例における訪問者Ａを基準とした位置関係を表す模式図である。図１０において、ＥＨ－Ａは展示員Ａであり、ＥＨ－Ｂは展示員Ｂである。また、ＶＩ－Ａは訪問者Ａであり、ＶＩ－Ｂは訪問者Ｂであり、ＶＩ－Ｃは訪問者Ｃである。訪問者ＡＶＩ－Ａを基準としたとき、展示員ＥＨ－Ａ，ＥＨ－Ｂは前方遠距離、アテンダントＡＴは右前中距離、他の訪問者ＶＩ－Ｂ，ＶＩ－Ｃは周囲近距離、有識者ＥＰは左前近距離に存在する。

　図１１は、規定情報データベース３３に記憶された音源位置規定データテーブル３３２の内容の一例として、他の参加者に対して図１０のような位置関係にある訪問者ＡＶＩ－Ａについての音源位置規定データテーブル３３２を示す図である。制御部１は、規定情報データベース３３に記憶した参加者それぞれについての音源位置及び向きの情報に基づいて、訪問者Ａの音源位置と各参加者の音源位置との２点間の距離Ｄを求め、この距離Ｄを音源位置規定データテーブル３３２に記憶させる。また、制御部１は、訪問者Ａの音源位置及び向きと各参加者の音源位置とを用いて角度を求め、この角度を向きθとして音源位置規定データテーブル３３２に記憶させる。

　制御部１は、他の訪問者である、訪問者ＶＩ－Ｂ，ＶＩ－Ｃ、展示員ＥＨ－Ａ，ＥＨ－Ｂ、アテンダントＡＴ、及び有識者ＥＰ、のそれぞれについて、同様に音源位置規定データテーブル３３２を作成して、規定情報データベース３３に記憶させる。

　その後、制御部１は、規定情報データベース３３の規定情報データベース３３に記憶した各参加者の音源位置関係に基づいて、各参加者についての視覚表現を決定し、規定情報データベース３３に記憶させる（ステップＳ１０５）。具体的には、制御部１は、各参加者に関して、他の参加者の音源位置からの距離に応じてどのように表現するか、その表現を他の参加者の音源位置の方向に応じて画面上のどの位置に出力するか、をそれぞれ決定する。

　視覚表現は、例えば、スライド（資料）を基準として奥行きや左右を表現しながら、音源位置を波紋等の記号で表示する。オフラインの対面会議や展示会などでは、スライドを見ながら会が進行する。そこで、オンラインコミュニケーションの展示会などにおいても、スライドの想定位置を決めて、それを奥行き表現の基準位置とする。図１２は、訪問者Ａを基準とした位置関係におけるスライドの仮想位置ＳＶＰを表す模式図である。制御部１は、このように、各参加者について、奥行き表現の基準位置を決定する。

　図１３は、図１２のスライドの仮想位置ＳＶＰでの訪問者ＡＶＩＣ－Ａの参加者端末における表示画面ＳＣ上の見え方の一例を示す模式図である。音源位置を表す波紋等の記号ＳＹを表示する際、スライドＳＬの中身を画像解析し、情報量が高い領域（具体的には小さい文字が書かれている領域、色の変化が激しい領域、など）を敢えて避けて表示したり、表示時の透明度を一時的に高くしたりすることで、スライドＳＬの見にくさを緩和しても良い。制御部１は、その他、デザイン上の工夫により、スライドＳＬの視聴を阻害せずに距離感を表現する、つまり、基準位置及びその基準位置からの距離を表現する表示形態を決定する。

　デザイン上の工夫としては、「構図の工夫」、「濃淡の工夫」、「大きさ，明度，レイヤの工夫」、「焦点の工夫」、「アニメーションの工夫」、などが採用可能である。「構図の工夫」は、例えば、スライドＳＬの内か外で、スライドＳＬを中心にパース線ＰＬを引く、などである。「濃淡の工夫」は、濃淡ＳＨを、スライドＳＬの縁や外を画面中央に向かい徐々に暗くしていったり明暗を交互に表示したりする、などである。「大きさ、明度、レイヤの工夫」は、スライドＳＬとの距離が近づくにつれ記号ＳＹを大きく表示したり、明るく表示したり、手前に表示したりする、などである。「焦点の工夫」は、スライドＳＬとの距離が離れるにつれて記号ＳＹをぼかす、などである。「アニメーションの工夫」は、音量が大きくなるにつれ記号ＳＹとしての波紋の数が増える、などである。

　なお、奥行き表現の基準位置は、（１）上記のようにスライドＳＬを基準に固定するパターンに限らず、（２）話者に応じて動的に変化するパターン、及び、（３）開催者ないしは参加者が自由に変更するパターン、の３パターンの何れとしても良い。図１４は、奥行き表現の基準位置ＢＰをスライドＳＬの仮想位置に固定したパターンである（１）の場合における訪問者Ａの表示画面ＳＣ上の見え方の一例を示す模式図である。また、図１５は、奥行き表現の基準位置ＢＰを話者に応じて動的に変化させるパターンである（２）の場合における訪問者Ａの表示画面ＳＣ上の見え方の一例を示す模式図である。図１４及び図１５では、「濃淡の工夫」として、奥行き表現の基準位置ＢＰが最も明るくなるようにし、「焦点の工夫」として、奥行き表現の基準位置ＢＰから離れるほど記号ＳＹぼかして表示されるようにしている。なお、図１５に示すパターン（２）の場合、役割又は参加者の優先順位を決めて、複数の参加者が同時に発声した場合でも一意に定まるようにすることが望ましい。

　これらの視覚表現における工夫を行うことで、各参加者に、他の参加者との距離感を適切に知覚させることが可能となる。

　以上のような視覚表現を決定した後、制御部１は、通信インタフェース部４によりネットワークＮＷを介して開催者端末ＯＴから準備処理の終了を指示された、つまり、準備終了要求を受けたか否か判断する（ステップＳ１０６）。未だ、準備処理の終了を指示されていないと判断した場合には、制御部１は、上記ステップＳ１０１に移行して、別のオンラインコミュニケーションについての準備を実施する。また、準備処理の終了を指示されたと判断した場合には、制御部１は、この準備処理を終了する。

　（２）会話処理
　図１６は、制御部１が実行する会話処理の処理手順と処理内容の一例を示すフローチャートである。制御部１は、開催者によって設定されたオンラインコミュニケーションのそれぞれについて、このフローチャートに示す会話処理を実行する。制御部１は、同時に開催される複数のオンラインコミュニケーションに対するこのフローチャートに示す処理を並行して実施することができる。

　通信インタフェース部４により、ネットワークＮＷを介して、オンラインコミュニケーションの開始指令を受信すると、制御部１は、当該オンラインコミュニケーションについて、この会話処理を開始する。そうすると、制御部１は、新規参加者の有無を判断する（ステップＳ１１１）。例えば、制御部１は、オンラインコミュニケーションの開始指令を受信した場合、その開始指令の送信元の参加者端末の参加者を新規参加者と判定する。また、制御部１は、参加者情報データベース３２に当該オンラインコミュニケーションの参加者として記憶されている参加者の参加者端末ＰＴ１～ＰＴｎの内、生成情報データベース３４に音場情報などを未だ記憶していない参加者端末から、参加指令を受信した場合、その参加指令の送信元である参加者端末の参加者を新規参加者と判定する。

　新規参加者が有ると、制御部１は、音場生成部１６として動作して、参加者同士の位置関係を考慮して当該新規参加者に対する音場を生成する（ステップＳ１１２）。具体的には、制御部１は、その参加者の参加者端末について、規定情報データベース３３の音源位置規定データテーブル３３２に記憶された参加者同士の位置関係に基づいて、他の参加者の参加者端末から送信されてきた音声情報を音像定位させるための音場情報を生成する。制御部１は、生成した新規参加者に対する音場情報を生成情報データベース３４に記憶させる。

　また、制御部１は、視覚効果生成部１８と動作して、新規参加者に対する視覚効果を生成する（ステップＳ１１３）。具体的には、制御部１は、規定情報データベース３３の音源位置規定データテーブル３３２に記憶された当該新規参加の位置と、規定情報データベース３３に記憶された視覚表現とに基づいて、当該新規参加者の参加者端末に対する視覚効果情報を生成する。この視覚効果情報は、例えば、図１３乃至図１５に示した例における、記号ＳＹを除いたものとなる。制御部１は、生成した新規参加者に対する視覚効果情報を生成情報データベース３４に記憶させる。

　そして、制御部１は、視覚効果表現部１９として動作して、通信インタフェース部４によりネットワークＮＷを介して当該新規参加者に対し、その生成した視覚効果を提供する（ステップＳ１１４）。具体的には、制御部１は、新規参加者の参加者端末に対して、上記ステップＳ１１３で生成した視覚効果情報を送信する。

　その後、或いは上記ステップＳ１１１において新規参加者は無いと判断した場合には、制御部１は、音声取得部１５として動作して、通信インタフェース部４により、ネットワークＮＷを介して、当該オンラインコミュニケーションの参加者が使用する参加者端末ＰＴ１～ＰＴｎの何れかから音声情報が入力されたか否か判断する（ステップＳ１１５）。ここで、音声情報の入力が無い場合には、制御部１は、上記ステップＳ１１１の処理へ移行する。

　これに対して、参加者端末ＰＴ１～ＰＴｎの何れかから音声情報が入力されたならば、制御部１は、音声再生部１７として動作して、参加者同士の位置関係を考慮して、音声情報の送信元を除く他参加者に対して音声を再生する（ステップＳ１１６）。具体的には、制御部１は、音声情報の送信元の参加者端末ＰＴｉを除いた参加者端末ＰＴ１～ＰＴｎのそれぞれに関して生成情報データベース３４に記憶されている音場情報に、入力された音声情報を適用する。即ち、音声再生部１７は、他参加者のそれぞれに対して、入力された音声情報を音像定位させた音場情報を生成する。例えば、展示員ＡＥＨ－Ａの役割が割り当てられた参加者の参加者端末ＰＴｉから音声情報が送信されてきた場合、制御部１は、訪問者ＡＶＩ－Ａの役割が割り当てられた参加者の参加者端末ＰＴａに対して、距離Ｄ_{r4-a_r1-a}、方向θ_{r4a_r1a}に基づく位置に、その音声情報による音声の音像を定位させるような音場情報を生成する。同様にして、制御部１は、展示員ＢＥＨ－Ｂ、アテンダントＡＴ、有識者ＥＰ、訪問者ＢＶＩ－Ｂ、訪問者ＣＶＩ－Ｃの役割が割り当てられた参加者のそれぞれの参加者端末に対する音場情報を生成することができる。

　なお、この音場を生成する処理においては、例えば、発声者と当該参加者とが対面している時を基準として、定位位置が正面から傾くにつれて徐々に音量を減衰させていき、定位位置が当該参加者の背面となるような状態を音量の下限値とする、など、音像位置に応じて音量も調整するようにしても良い。

　そして、制御部１は、通信インタフェース部４により、ネットワークＮＷを介して音声情報の送信元の参加者端末ＰＴｉを除いた他参加者端末ＰＴ１～ＰＴｎへ、他参加者それぞれに対して生成した音場情報を送信する。

　また、制御部１は、上記ステップＳ１１６の処理と並行して、視覚効果生成部１８と動作して、参加者同士の位置関係を考慮して他参加者に対する視覚効果を生成する（ステップＳ１１７）。具体的には、制御部１は、生成情報データベース３４に記憶されている、音声情報の送信元の参加者端末ＰＴｉを除いた他参加者端末ＰＴ１～ＰＴｎのそれぞれに対する視覚効果情報に、入力された音声情報を適用する、即ち、視覚効果としての記号ＳＹを追加する。

　そして、制御部１は、視覚効果表現部１９として動作して、通信インタフェース部４により、ネットワークＮＷを介して各参加者に対して、音声情報の送信元に基づく記号ＳＹを追加した視覚効果を提供する（ステップＳ１１８）。具体的には、制御部１は、発信元の参加者端末ＰＴｉを除いた参加者端末ＰＴ１～ＰＴｎに対して、上記ステップＳ１１７で生成したそれぞれの視覚効果情報を送信する。

　以上のようにして、話者の参加者端末とは異なる任意の参加者の参加者端末上で、話者の音源位置から音声を再生するとともに、合わせてその音源位置を視覚表現で提示したならば、制御部１は、当該オンラインコミュニケーションから抜ける参加者である退出者の有無を判断する（ステップＳ１１９）。退出者が有ったならば、制御部１は、生成情報データベース３４に記憶されている、その退出者に対する音場情報及び視覚効果情報を消去する（ステップＳ１２０）。

　その後、或いは上記ステップＳ１１９において退出者は無いと判断した場合には、制御部１は、この会話処理を終了するか否か判断する（ステップＳ１２１）。具体的には、制御部１は、当該オンラインコミュニケーションに参加している参加者が未だ居るのか居ないのかを判断し、未だ居る場合には終了しない、居ない場合には終了すると判断する。例えば、制御部１は、生成情報データベース３４に音場情報などが未だ記憶されているか否かにより、参加者の有無を判断することができる。終了しないと判断した場合には、制御部１は、上記ステップＳ１１１に移行して、未だ終了していない参加者端末に対する会話処理を継続する。また、終了すると判断した場合には、制御部１は、この会話処理を終了する。

　（作用・効果）
　以上述べたように一実施形態では、コミュニケーションサーバＣＳは、ネットワークをＮＷ介して複数の参加者端末ＰＴ１～ＰＴｎの内の第１の参加者端末から取得した音声情報を、ネットワークＮＷを介して第１の参加者端末とは異なる１以上の第２の参加者端末に提示する情報提示装置として機能する。そして、コミュニケーションサーバＣＳは、第２の参加者端末それぞれについて、複数の参加者端末を使用するそれぞれの参加者に対して割り当てられた役割に応じて、第２の参加者端末の参加者である第２の参加者の位置を基準とした、第１の参加者端末の参加者である第１の参加者の位置である音源位置を規定する音源位置規定部１４と、１以上の第２の参加者端末毎に、第１の参加者の音源位置に基づいて、第１の参加者端末からの音声情報を音像定位させた音場情報を生成して、第２の参加者端末それぞれに送信する音声提示部として機能する音場生成部１６及び音声再生部１７と、１以上の第２の参加者端末毎に、第１の参加者の音源位置に基づく視覚効果を生成して、第２の参加者端末それぞれに送信する視覚効果提示部として機能する視覚効果生成部１８及び視覚効果表現部１９と、を備える。　
　従って、一実施形態によれば、役割を踏まえて各話者の音像を個別に定位し、各音像位置を視覚効果を活用しながら効果的に可視化することで、投影すべき視覚情報を妨げることなく話者との適切な距離感を知覚させ得る情報提示技術を提供することができる。

　また、一実施形態では、音源位置規定部は、第１及び第２の参加者の位置関係に基づいて、第２の参加者端末それぞれの表示画面において音像定位の位置に対応する位置を可視化する視覚表現を決定し、視覚効果提示部は、音源位置規定部が決定した視覚表現に従って視覚効果を生成する。　
　従って、一実施形態によれば、話者との位置関係に基づく視覚表現を参加者毎に決定しておくことで、話者が次々と変わっても素早く視覚効果を生成することができ。よって、タイムラグ無く視覚効果を提示でき、参加者に違和感を与えない視覚効果を提供することができる。

　また、一実施形態では、視覚表現は、基準位置及びその基準位置からの距離を表現する表示形態を含む。　
　従って、一実施形態によれば、基準位置や基準位置からの距離に応じて、色の濃淡差やぼかしなどの、デザインで用いられる視覚表現を変えることで、少ない情報量で奥行き方向の距離感を可視化することができる。即ち、既存の視覚情報を邪魔せずに、音像の奥行きを表現することができる。

　また、一実施形態では、役割のそれぞれについての音源位置を記憶した第１の記憶部として機能する会話種別データベース３１と、参加者のそれぞれについて割り当てられた役割を記憶した第２の記憶部として機能する参加者情報データベース３２と、を更に備え、音源位置規定部は、第１の記憶部に記憶された音源位置と第２の記憶部に記憶された役割とに基づいて、第２の参加者それぞれの音源位置を規定する。　
　従って、一実施形態によれば、音源位置の規定に必要な情報を予め準備しておくことで、任意の参加者に対する多の参加者の音源位置を容易に規定することができる。

　また、一実施形態では、複数の参加者端末の参加者それぞれに対して役割を割り当てて、第２の記憶部に記憶させる参加者登録部として機能する参加者情報登録部１３を更に備える。　
　従って、一実施形態によれば、参加者に任意に役割を割り当てることができる。なお、複数の参加者に同じ役割を割り当てても良い。

　［第１変形例］
　一実施形態では、全役割、全参加者で共通の位置関係を利用している。しかしながら、共通である必要は無く、それぞれで最適な位置関係を個別に構築しても良い。例えば、オンラインコミュニケーションの会話種別として「展覧会」では、「訪問者」として参加する参加者にとっては、「展示員」は前方遠距離にいて欲しい。これに対して、「展示員」として参加する参加者では、「訪問者」は右側近距離にいて欲しい。また、オンラインコミュニケーションの会話種別として「会議」などのディスカッションにおいては、参加者は、自身と近しい考えを持つ人には近距離にいて欲しい、などという要求も有る。

　そこで、会話種別データベース３１には、役割のそれぞれについて、その役割の参加者を基準とした他の役割の参加者の音源位置を記憶する。図１７は、この第１変形例における会話種別データベース３１が記憶するプリセットデータセット３１１の一例を示す図である。

　図１７に示すように、参加時の役割に対して、その他の役割（対象の役割）それぞれについて、音源位置と向きとを記憶しておくことで、音源位置規定部１４は、当該参加者に対する他の参加者の音源位置を規定することができる。

　［第２変形例］
　一実施形態では、音源位置をＸ，Ｙ，Ｚ軸の値により表している。しかしながら、全役割の音源位置のＸ，Ｙ，Ｚ軸何れかの値が同値であれば、その軸の設定を省略しても良い。

　図１８は、第２変形例におけるＹ軸の設定の省略を表す模式図である。このように、全役割の位置関係の高さ（Ｙ軸の座標）が同値の場合には、ＸＺ軸の二次元座標を設定することができる。音源位置に基づく各種の処理においても、このＸＺ軸の座標のみを元に行うことが可能である。

　［その他の実施形態］
　各参加者の役割の割り当ては、開催者側からの設定に依らずに、制御部１が自動的に行うようにしても良い。例えば、制御部１は、参加者情報データベース３２に予め記憶されているユーザの所属情報に基づいて、割り当てを実施することができる。また、各ユーザの過去の会話内容、会話量、会話時期を蓄積しておくことで、制御部１は、それら蓄積された情報に基づいて役割を推測することができる。例えば、会話種別「展示会」のオンラインコミュニケーションにおいて、会話の前半で多く話しているユーザは「展示員」である可能性が高い、などのように、制御部１はユーザが割り当てられる可能性が高い役割を推測することができる。

　また、制御部１は、オンラインコミュニケーションを開催中、途中で参加人数が増えた場合に、その新規参加者に対して役割を自動割り当てするようにしても良い。例えば、会話種別「展示会」のオンラインコミュニケーションであれば、途中参加するのは「訪問者」である可能性が高く、よって、制御部１は、その途中参加者に自動的に「訪問者」の役割を割り当てることができる。

　また、音源位置同士の位置関係から視覚表現を決定する際において、制御部１は、全役割、全参加者で共通の視覚表現とする必要は無く、それぞれで変えるようにしても良い。例えば、各参加者の会話中又は会話後のフィードバックを受けて、制御部１は、視覚表現の種類や強調度合いを調整することができる。

　また、制御部１が決定した視覚表現に対して、任意のタイミングで意図的に話者の音源位置を移動させることで、距離感を変える、など、開催者端末ＯＴから編集できるようにしても良い。例えば、説明中に敢えて身近な声として聞かせたいため距離を縮めようにしたり、演劇中に役者が複数の役を演じ分ける際に距離を変化させたりする、など、開催者が任意に視覚表現を変更できるようにしても良い。

　また、音声の再生についても、距離による音量の減衰とは別に、制御部１は、役割の重要度や割り当てられている人数に応じて音量を調整するようにしても良い。例えば、制御部１は、展示員のベースの音量を大きくし、訪問者のベースの音量を小さく設定することができる。また、例えば、訪問者に割り当てられる人数が多くなるにつれて、制御部１は、各訪問者のベースの音量を徐々に大きくするようなことをしても良い。

　なお、本発明は、実施形態で説明したような会話のシーンを含む、音声を伴うオンラインコミュニケーション全般に適用可能であるが、更には、オンラインコミュニケーションだけでなく、一部実世界（オフライン）での利用にも適用可能である。例えば、美術館での音声ガイドなど、対象者がイヤホンやヘッドホンを装着して姿の見えない話者の説明音声を聞きながらコンテンツを視聴するシーンに適用できる（立体音響のみ）。これに加え、ＡＲ（Augmented Reality）グラスを装着することで、視覚効果も表現するシーンにも適用可能である（立体音響＋視覚効果）。

　また、前述した展示会や美術館での例のように、一方向での発話（情報提示）が多い会話種別においては、聞く側（情報提示を受ける側）の参加者が「あたかも会話しているかのような感覚」を得られさえすれば、必ずしもインタラクティブな会話である必要は無く、事前に集音した音声を用いても良い。

　なお、実施形態では、情報提示装置が一つのコミュニケーションサーバＣＳで構成される場合を示したが、複数のサーバによって構成されても良い。例えば、準備処理を行うサーバと、会話処理を行うサーバとを分けたり、会話種別に応じてサーバを切り分けたりして良い。

　また、フローチャートを参照して説明した各処理の流れは、説明した手順に限定されるものではないことは言うまでも無い。

　以上、この発明の実施形態を詳細に説明してきたが、前述までの説明はあらゆる点においてこの発明の例示に過ぎない。この発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、この発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されても良い。

　要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除しても良い。更に、異なる実施形態に亘る構成要素を適宜組み合わせても良い。

　１…制御部
　２…プログラム記憶部
　３…データ記憶部
　４…通信インタフェース部
　５…バス
　１１…会話種別設定部
　１２…会話種別編集部
　１３…参加者情報登録部
　１４…音源位置規定部
　１５…音声取得部
　１６…音場生成部
　１７…音声再生部
　１８…視覚効果生成部
　１９…視覚効果表現部
　３１…会話種別データベース
　３２…参加者情報データベース
　３３…規定情報データベース
　３４…生成情報データベース
３１１…プリセットデータセット
３２１…参加者アサインテーブル
３３１…参加者規定データセット
３３２…音源位置規定データテーブル
ＡＴ…アテンダント
ＢＰ…奥行き表現の基準位置
ＣＳ…コミュニケーションサーバ
ＥＨ，ＥＨ－Ａ，ＥＨ－Ｂ…展示員
ＥＰ…有識者
ＮＷ…ネットワーク
ＯＴ…開催者端末
ＰＬ…パース線
ＰＴ１～ＰＴｎ…参加者端末
ＳＣ…表示画面
ＳＨ…濃淡
ＳＬ…スライド
ＳＶＰ…スライドの仮想位置
ＳＹ…記号
ＶＩ，ＶＩ-Ａ，ＶＩ-Ｂ，ＶＩ－Ｃ…訪問者

Claims

　ネットワークを介して複数の参加者端末の内の第１の参加者端末から取得した音声情報を、前記ネットワークを介して前記第１の参加者端末とは異なる１以上の第２の参加者端末に提示する情報提示装置であって、
　前記第２の参加者端末それぞれについて、前記複数の参加者端末を使用するそれぞれの参加者に対して割り当てられた役割に応じて、前記第２の参加者端末の参加者である第２の参加者を基準とした、前記第１の参加者端末の参加者である第１の参加者の音源位置を規定する音源位置規定部と、
　前記１以上の第２の参加者端末毎に、前記第１の参加者の前記音源位置に基づいて、前記第１の参加者端末からの前記音声情報を音像定位させた音場情報を生成して、前記第２の参加者端末それぞれに送信する音声提示部と、
　前記１以上の第２の参加者端末毎に、前記第１の参加者の前記音源位置に基づく視覚効果を生成して、前記第２の参加者端末それぞれに送信する視覚効果提示部と、
　を具備する情報提示装置。
　前記音源位置規定部は、前記第１及び第２の参加者の位置関係に基づいて、前記第２の参加者端末それぞれの表示画面において前記音像定位の位置に対応する位置を可視化する視覚表現を決定し、
　前記視覚効果提示部は、前記音源位置規定部が決定した前記視覚表現に従って前記視覚効果を生成する、
　請求項１に記載の情報提示装置。
　前記視覚表現は、基準位置及び前記基準位置からの距離を表現する表示形態を含む、
　請求項２に記載の情報提示装置。
　前記役割のそれぞれについての前記音源位置を記憶した第１の記憶部と、
　前記参加者のそれぞれについて割り当てられた前記役割を記憶した第２の記憶部と、
を更に具備し、
　前記音源位置規定部は、前記第１の記憶部に記憶された前記音源位置と前記第２の記憶部に記憶された前記役割とに基づいて、前記第２の参加者それぞれの前記音源位置を規定する、
　請求項１乃至３の何れかに記載の情報提示装置。
　前記複数の参加者端末の前記参加者それぞれに対して前記役割を割り当てて、前記第２の記憶部に記憶させる参加者登録部を更に具備する、
　請求項４に記載の情報提示装置。
　プロセッサとメモリとを備え、ネットワークを介して複数の参加者端末の内の第１の参加者端末から取得した音声情報を、前記ネットワークを介して前記第１の参加者端末とは異なる１以上の第２の参加者端末に提示する情報提示装置が実行する情報提示方法であって、
　前記プロセッサが、前記第２の参加者端末それぞれについて、前記複数の参加者端末を使用するそれぞれの参加者に対して割り当てられた役割に応じて、前記第２の参加者端末の参加者である第２の参加者の位置を基準とした、前記第１の参加者端末の参加者である第１の参加者の位置である音源位置を規定し、前記規定した前記第２の参加者端末それぞれについての前記第１の参加者の前記音源位置を前記メモリに記憶させることと、
　前記プロセッサが、前記１以上の第２の参加者端末毎に、前記メモリに記憶した前記第１の参加者の前記音源位置に基づいて、前記第１の参加者端末からの前記音声情報を音像定位させた音場情報を生成して、前記第２の参加者端末それぞれに送信することと、
　前記プロセッサが、前記１以上の第２の参加者端末毎に、前記メモリに記憶した前記第１の参加者の前記音源位置に基づく視覚効果を生成して、前記第２の参加者端末それぞれに送信することと、
　を含む情報提示方法。
　請求項１に記載の情報提示装置の各部が行う処理を、前記情報提示装置が備えるプロセッサに実行させる情報提示プログラム。