WO2023105887A1

WO2023105887A1 - 情報処理装置、情報処理方法、および記録媒体

Info

Publication number: WO2023105887A1
Application number: PCT/JP2022/035322
Authority: WO
Inventors: 征範慎
Original assignee: 株式会社Abelon
Priority date: 2021-12-07
Filing date: 2022-09-22
Publication date: 2023-06-15

Abstract

【課題】従来、ウェブ会議中における画像とユーザのバイタル情報とを対応付けて蓄積することができなかった。【解決手段】ウェブ会議中の２以上の各ユーザの各ユーザ端末から送信された画像を含むユーザ情報を受信する情報受信部３２１と、情報受信部３２１が受信した２以上のユーザ中の１以上の各ユーザのバイタル情報を取得するバイタル取得部３３０と、２以上の各ユーザ端末から受信された画像または２以上の画像に基づく画像である蓄積画像を取得する蓄積画像取得部３３５と、情報取得部が取得した１以上の各ユーザのバイタル情報を含む付加情報を、蓄積画像取得部３３５が取得した蓄積画像に対応付けて蓄積する蓄積部３３６とを具備する情報処理装置３により、ウェブ会議中における画像とユーザのバイタル情報とを対応付けて蓄積できる。

Description

情報処理装置、情報処理方法、および記録媒体

　本発明は、ウェブ会議に利用される情報処理装置等に関するものである。

　従来、ネットワークを介して接続された複数の端末を利用して、仮想的な会議を行うウェブ会議システムが知られている（例えば、特許文献１参照）。

特開２０１９－１１７９９８号公報

　このようなウェブ会議システムにおいては、ユーザ同士が直接会う場合とは異なり、ユーザの状態を詳細に見たり、話したりすること等が難しく、ウェブ会議に参加しているユーザの状態（例えば、健康状態等）を容易に把握することが困難である、という課題があった。

　また、従来技術においては、ウェブ会議中における画像とユーザのバイタル情報とを対応付けて蓄積することができなかった。

　また、従来技術においては、例えば、ウェブ会議中における画像とユーザのバイタル情報とを利用することができなかった。

　本第一の発明の情報処理装置は、ウェブ会議中の２以上の各ユーザの各ユーザ端末から送信された画像を含むユーザ情報を受信する情報受信部と、情報受信部が受信した２以上のユーザ中の１以上の各ユーザのバイタル情報を取得するバイタル取得部と、２以上の各ユーザ端末から受信された画像または２以上の画像に基づく画像である蓄積画像を取得する蓄積画像取得部と、情報取得部が取得した１以上の各ユーザのバイタル情報を含む付加情報を、蓄積画像取得部が取得した蓄積画像に対応付けて蓄積する蓄積部とを具備する情報処理装置である。

　かかる構成により、ウェブ会議中における画像とユーザのバイタル情報とを対応付けて蓄積できる。

　また、本第二の発明の情報処理装置は、第一の発明に対して、ユーザ情報は、ウェブ会議中のユーザの発話に基づく音声情報または音声情報から取得された会話テキストも含み、音声情報から取得される会話テキストを取得するテキスト取得部をさらに具備し、蓄積部は、会話テキストを含む付加情報を、蓄積画像に対応付けて蓄積する情報処理装置である。

　かかる構成により、ウェブ会議中における画像と会話テキストとユーザのバイタル情報とを対応付けて蓄積できる。

　また、本第三の発明の情報処理装置は、第二の発明に対して、情報受信部は、ユーザ識別子に対応付けてユーザ情報を受信し、蓄積部は、会話テキストをユーザ識別子に対応付けて蓄積する情報処理装置である。

　かかる構成により、会話テキストとユーザ識別子とを対応付けて蓄積できる。

　また、本第四の発明の情報処理装置は、第一の発明に対して、ウェブ会議中のユーザの発話に対する通訳音声情報または通訳音声情報から取得された通訳テキストである通訳情報を受信する通訳情報受信部をさらに具備し、蓄積部は、通訳音声情報または通訳テキストである通訳情報を含む付加情報を、蓄積画像に対応付けて蓄積する情報処理装置である。

　かかる構成により、発話の通訳情報と画像とを対応付けて蓄積できる。

　また、本第五の発明の情報処理装置は、第一の発明に対して、ウェブ会議における発話に対して、通訳が行われ、通訳の音声を聞く１以上の各ユーザのバイタル情報を用いて、通訳者の評価を示す評価情報を取得する通訳評価部と、評価情報を出力する評価出力部とをさらに具備する情報処理装置である。

　かかる構成により、バイタル情報を用いて通訳者の評価ができる。

　また、本第六の発明の情報処理装置は、第五の発明に対して、通訳評価部は、通訳の対象の発話の言語である原言語に対応する１以上のユーザのバイタル情報と、通訳の目的言語に対応する１以上のユーザのバイタル情報とを用いて、評価情報を取得する情報処理装置である。

　かかる構成により、バイタル情報を用いて通訳者の精度の高い評価ができる。

　また、本第七の発明の情報処理装置は、第一の発明に対して、ユーザが発話していないタイミングにおけるバイタル情報が、着目条件に合致するか否かを判断する判断部と、判断部が着目条件に合致すると判断したバイタル情報に対する第一ユーザ識別子と、タイミングにおける発話者の第二ユーザ識別子とを対応付ける関係情報を取得する関係検出部と、関係情報を出力する関係出力部とをさらに具備する情報処理装置である。

　かかる構成により、聞き手のユーザのバイタル情報を用いて、聞き手と発話者の関係を特定できる。

　また、本第八の発明の情報処理装置は、第七の発明に対して、関係出力部は、関係情報をタイミングにおける画像またはバイタル情報に対応付けて出力する情報処理装置である。

　かかる構成により、聞き手と発話者の関係を特定する関係情報を出力できる。

　また、本第九の発明の情報処理装置は、第一の発明に対して、１以上のユーザのバイタル情報を統計処理し、処理結果を取得する統計処理部と、処理結果を出力する結果出力部とをさらに具備する情報処理装置である。

　かかる構成により、ウェブ会議中のユーザのバイタル情報を統計処理できる。

　また、本第十の発明の情報処理装置は、第九の発明に対して、バイタル情報は、ユーザ識別子に対応付いており、統計処理部は、ユーザ識別子ごと、またはユーザ識別子と対になるユーザ属性値ごとに、バイタル情報を統計処理し、処理結果を取得する情報処理装置である。

　かかる構成により、ウェブ会議中のユーザのバイタル情報を、ユーザごとまたはユーザ属性値ごとに統計処理できる。

　また、本第十一の発明の情報処理装置は、第一から第十いずれか１つの発明に対して、ウェブ会議中の２以上の各ユーザのユーザ領域を含む画面画像を出力する画面出力部と、情報取得部が取得したバイタル情報が、着目条件に合致するか否かを判断する判断部をさらに具備し、画面出力部は、判断部が着目条件に合致すると判断したバイタル情報に対応するユーザのユーザ領域を他のユーザのユーザ領域と視覚的に区別可能な態様の画面を出力する情報処理装置である。

　かかる構成により、着目条件を満たすバイタル情報に対応するユーザを明示できる。

　また、本第十二の発明の情報処理装置は、第一から第十一いずれか１つの発明に対して、バイタル情報またはバイタル情報の処理結果または会話テキストである付加情報に関する検索条件を受け付ける検索受付部と、蓄積部が蓄積した蓄積画像の中で、検索条件に合致する付加情報に対応付く蓄積画像を検知し、蓄積画像または蓄積画像から取得される画像を出力する検索部とをさらに具備する情報処理装置である。

　かかる構成により、バイタル情報等を用いて、ウェブ会議の画像を検索できる。

　また、本第十三の発明の情報処理装置は、第一から第十二いずれか１つの発明に対して、バイタル情報は、呼吸、体温、血圧、意識レベル、心拍変動、交感神経、副交感神経、またはＬＦ（低周波）／ＨＦ（高周波）である情報処理装置である。

　かかる構成により、ウェブ会議中における画像とユーザの特定のバイタル情報とを対応付けて蓄積できる。

　本発明のサーバは、２以上のユーザ端末の間におけるウェブ会議を行うサーバであって、ウェブ会議を行っている間に、２以上の各ユーザ端末から送信される画像を受信する情報受信部と、情報受信部が受信した２以上の画像の中の１以上の画像に含まれるユーザの人物領域から、１以上のユーザのバイタル情報を、画像に対応付けて取得する情報取得部と、ウェブ会議を行っている間に、情報取得部が取得したバイタル情報に対応する情報を、２以上のユーザ端末のうちの１以上のユーザ端末に送信する情報送信部と、を具備するサーバである。

　かかる構成により、ウェブ会議に参加しているユーザの状態を容易に把握することができる。

　また、本発明のサーバは、前記サーバにおいて、情報取得部は、情報受信部が受信した２以上の画像の中の画像であり、予め決められたユーザ端末から送信された画像のみに含まれるユーザの人物領域から、１以上のユーザのバイタル情報を取得するようにしてもよい。

　かかる構成により、ウェブ会議に参加しているユーザのうちの予め決められたユーザの状態を選択的に、容易に把握することができる。

　また、本発明のサーバは、前記サーバにおいて、情報送信部は、バイタル情報を取得する元になった画像を送信したユーザ端末を除く１以上の他のユーザ端末のみにバイタル情報を送信するようにしてもよい。

　かかる構成により、バイタル情報を提供するユーザにバイタル情報を提供しないようにできる。これにより、例えば、バイタル情報を利用して、ユーザの状態等を把握することが好ましいユーザにのみ、バイタル情報に対応する情報を提供できる。

　また、本発明のサーバは、前記サーバにおいて、情報取得部が取得したバイタル情報が、出力条件に合致するか否かを判断する判断部をさらに具備し、情報送信部は、判断部が出力条件に合致すると判断したバイタル情報に対応する情報のみを送信するようにしてもよい。

　かかる構成により、出力条件に合致しないバイタル情報に対応する情報を送信しないようにでき、例えば、観察や確認等が不要なバイタル情報を送信しないようにできる。例えば、かかる構成により、正常なバイタル情報に関する情報を送信しないようにできる。

　また、本発明のサーバは、前記サーバにおいて、情報取得部は、情報受信部が受信した２以上の画像の中の１以上の画像に含まれるユーザの人物領域から、１以上のユーザのバイタル情報を取得し、情報受信部が受信した画像を含む２以上のユーザ領域を含む画面画像であって、着目条件を満たすバイタル情報が情報取得部により取得された画像を含むユーザ領域が、他のユーザ領域と視覚的に区別可能な画面画像を構成する構成部をさらに備え、情報送信部は、構成部が構成した画面画像を送信するようにしてもよい。

　かかる構成により、バイタル情報を利用して着目することが好ましいユーザを視覚的に示すことができる。例えば、バイタル情報が正常値でないユーザを視覚的に示すことが可能となる。

　また、本発明のサーバは、前記サーバにおいて、バイタル情報を用いた保険条件と提案する保険に関する保険情報とを有する１以上の提案情報が格納される提案格納部を参照し、情報取得部が取得したバイタル情報が満たす保険条件を決定し、保険条件と対になる保険情報を提案格納部から取得する保険情報取得部と、保険情報取得部が取得した保険情報をバイタル情報を取得する元になった画像を送信したユーザ端末に送信する保険情報送信部と、をさらに具備するようにしてもよい。

　かかる構成により、バイタル情報に応じた適切な保険情報をユーザに提示することができる。

　また、本発明のサーバは、前記サーバにおいて、情報取得部は、１以上の特定のユーザ端末から受信された時系列の各画像から、バイタル情報を取得し、情報取得部が取得した時系列のバイタル情報を、蓄積する蓄積部をさらに具備するようにしてもよい。

　かかる構成により、ウェブ会議に利用される画像から、時系列のバイタル情報を取得することができる。

　また、本発明のサーバは、前記サーバにおいて、情報取得部は、２以上の各ユーザ端末から受信された時系列の各画像から、バイタル情報を取得し、２以上の各ユーザ端末に対応付けて、情報取得部が取得した時系列のバイタル情報を蓄積する蓄積部をさらに具備してもよい。

　かかる構成により、ウェブ会議に利用される画像から、２以上のユーザについての時系列のバイタル情報を取得することができる。

　また、本発明のサーバは、前記サーバにおいて、蓄積部は、情報受信部が受信した時系列の各画像に対応付けて、時系列のバイタル情報を蓄積するようにしてもよい。

　かかる構成により、時系列のバイタル情報と、その取得元の画像とを対応付けて蓄積することにより、時系列のバイタル情報と画像を参照して、ユーザの状況等を確認することができる。

　本発明による情報処理装置によれば、ウェブ会議中における画像とユーザのバイタル情報とを対応付けて蓄積できる。

本発明の実施の形態におけるウェブ会議システムのブロック図同ウェブ会議システムのサーバの動作について説明するフローチャート同ウェブ会議システムのサーバの動作について説明するフローチャート同ウェブ会議システムの具体例の構成を示す模式図同ウェブ会議システムのサーバの特定情報管理表を示す図同サーバの出力条件管理表を示す図（図６（ａ））、および着目条件管理表を示す図（図６（ｂ））同サーバの提案情報管理表を示す図（図７（ａ））、および保険送信管理情報を示す図（図７（ｂ））同ウェブ会議システムのサーバのバイタル情報管理表を示す図同サーバが構成する画面画像を説明するための図（図９（ａ）－図９（ｄ））同サーバが構成する画面画像を説明するための図（図１０（ａ）－図１０（ｃ））同ウェブ会議システムのユーザ端末による表示例を示す図（図１１（ａ）および図１１（ｂ））同ウェブ会議システムのユーザ端末による表示例を示す図（図１２（ａ）および図１２（ｂ））実施の形態２における情報システム２０００の概念図同情報システム２０００のブロック図同情報処理装置３のブロック図同情報処理装置３の動作例について説明するフローチャート同情報処理装置３の動作例について説明するフローチャート同統計処理の例について説明するフローチャート同ユーザ毎統計処理の例について説明するフローチャート同属性値毎統計処理の例について説明するフローチャート同ウェブ会議統計処理の例について説明するフローチャート同評価処理の例について説明するフローチャート同関係検出処理の例について説明するフローチャート同検索処理の例について説明するフローチャート同ユーザ端末４の動作例について説明するフローチャート同通訳者端末５の動作例について説明するフローチャート同ユーザ管理表を示す図同バイタル情報管理表を示す図同テキスト等管理表を示す図上記実施の形態におけるコンピュータシステムの概観図同コンピュータシステムのブロック図

　以下、情報処理装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。

　（実施の形態１）
　図１は、本実施の形態におけるウェブ会議システム１０００のブロック図である。

　ウェブ会議システム１０００は、サーバ１と、１または２以上のユーザ端末２を備える。サーバ１と、１または２以上のユーザ端末２とは、インターネット等のネットワークを介して、情報の送受信が可能となるよう接続される。なお、図１においては、一例として、ウェブ会議システム１０００が、３以上のユーザ端末２を備えている場合を示している。

　サーバ１は、情報受信部１００、特定情報格納部１０１、情報取得部１０２、出力条件格納部１０３、着目条件格納部１０４、判断部１０５、構成部１０６、情報送信部１０７、蓄積部１０８、バイタル情報格納部１０９、提案格納部１１０、保険情報取得部１１１、および保険情報送信部１１２を備える。

　サーバ１は、クラウドサーバや、アプリケーションサーバである。サーバ１は、例えば、ウェブ会議を提供するサーバである。ここでのウェブ会議は、ネットワークを介して接続された複数の端末を利用して行われるセミナーや、授業等も含む概念である。サーバ１は、例えば、コンピュータ等により実現される。

　情報受信部１００は、ウェブ会議を行っている間に、２以上の各ユーザ端末２から送信される画像を受信する。情報受信部１００がユーザ端末２から受信する画像は、例えば、会議に参加するユーザ（例えば、ユーザの顔を含む領域）を撮影した画像である。情報受信部１００が受信する画像は、動画像であっても静止画像であってもよい。情報受信部１００が受信する画像は、例えば、時系列の画像である。時系列の画像は、例えば、動画像であってもよく、時系列に沿って送信される複数の静止画像であってもよい。ただし、情報受信部１００が受信する画像は、画像からバイタル情報が取得可能な画像であることが好ましい。情報受信部１００は、通常、ユーザ端末２と対応付けられた画像を受信する。例えば、情報受信部１００は、ユーザ端末２の端末識別子と対応付けられた画像を受信する。端末識別子は、例えば、ユーザ端末２の名前であってもよく、ユーザ端末２に割り当てられたコードや、ユーザ端末２のＩＰアドレス等のアドレス情報であってもよい。また、セッション識別子等を端末識別子として用いてもよい。また、端末識別子として、ユーザ端末２を利用するユーザのユーザ識別子を用いてもよい。情報受信部１００は、通常、画像に加えて、音声も受信する。

　情報受信部１００は、通常、無線または有線の通信手段で実現される。情報受信部１００は、通信デバイスを含むと考えても、含まないと考えてもよい。

　特定情報格納部１０１は、特定のユーザ端末２を指定する特定情報が格納される。特定情報は、例えば、ユーザ端末２の端末識別子である。特定情報は、例えば、バイタル情報の取得対象となるユーザ端末２を指定する情報である。また、特定情報は、バイタル情報に対応する情報の送信先となるユーザ端末２を指定する情報である。特定情報は、どのような対象として特定されるユーザ端末２であるかを指定する情報をさらに有していてもよい。

　特定情報格納部１０１は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。かかることは、他の格納部についても同様である。

　情報取得部１０２は、情報受信部１００が受信した２以上の画像の中の１以上の画像に含まれるユーザの人物領域から、１以上のユーザのバイタル情報を、画像に対応付けて取得する。情報受信部１００が受信した２以上の画像は、２以上の各ユーザ端末２から送信される画像である。画像に含まれるユーザの人物領域は、例えば、画像内のユーザが写っている領域である。ユーザの人物領域は、ユーザの顔を含む領域であることが好ましい。バイタルとは、脈拍、呼吸、体温、血圧、意識レベル等である。バイタルは、バイタルサインとも呼ばれる。バイタル情報は、例えば、呼吸数や、脈拍数等のバイタルを表す情報である。ここでのバイタル情報は、心拍変動、交感神経、副交感神経、ＬＦ（低周波）／ＨＦ（高周波）、等の、１または２以上のバイタル情報を加工して得られる情報であってもよい。ＬＦ／ＨＦは、例えば、ストレスの指標として用いられる情報である。情報取得部１０２は、各ユーザについて異なる複数の種類のバイタル情報を取得してもよい。画像に対応付けてバイタル情報を取得する、ということは、画像を送信したユーザ端末２に対応付けてバイタル情報を取得することと考えてもよい。情報取得部１０２は、例えば、予め決められた期間内に受信した画像（例えば時系列の画像）からバイタル情報を取得する。画像に含まれるユーザの人物領域から、ユーザのバイタル情報を取得する技術は公知技術であるため、ここでは詳細な説明を省略する。このようなバイタル情報を取得する技術としては、例えば、以下のＵＲＬに記載されたような技術が利用可能である（ＵＲＬ：https://sensing-art.com/#tech-feature）。ただし、ここで利用する画像の人物領域からバイタル情報を取得する技術は、上記の技術に限定されない。

　情報取得部１０２は、情報受信部１００が受信した２以上の画像の中の画像であり、予め決められた１以上のユーザ端末２から送信された画像のみに含まれるユーザの人物領域から、１以上のユーザのバイタル情報を取得する。ユーザ端末２から送信された画像に含まれるユーザは、例えば、ユーザ端末２を利用してウェブ会議に参加しているユーザである。

　情報取得部１０２は、例えば、１以上の特定のユーザ端末２から受信された時系列の各画像から、バイタル情報を取得してもよい。特定のユーザ端末２とは、例えば、特定のユーザが利用するユーザ端末２である。特定のユーザは、例えば、患者や生徒、社員等である。また、情報取得部１０２は、２以上の各ユーザ端末から受信された時系列の各画像から、バイタル情報を取得してもよい。バイタル情報の取得対象となる特定のユーザ端末２は、例えば、特定情報格納部１０１に格納される特定情報により特定される。

　情報取得部１０２が、１以上のユーザ端末２から情報受信部１０１が受信する時系列の各画像からバイタル情報を取得する時期等は問わない。例えば、情報取得部１０２は、一定または任意の時間間隔ごとに、各画像からバイタル情報を取得する。また、情報受信部１００が、バイタル情報に対応する情報の送信先となるユーザ端末２から受信する指示に応じて、情報取得部１０２が１以上の特定のユーザ端末２から受信した画像からバイタル情報を取得してもよい。この指示は、バイタル情報を取得する画像を送信するユーザ端末２を指定する情報をさらに有していてもよい。

　出力条件格納部１０３には、１または２以上の出力条件が格納される。出力条件は、情報取得部１０２が取得したバイタル情報を送信してよいか判断するための条件である。出力条件は、例えば、情報取得部１０２が取得するユーザの１以上のバイタル情報に関する条件である。ユーザのバイタル情報は、例えば、ユーザ端末２から受信した画像から取得されるこのユーザ端末２を利用するユーザのバイタル情報である。

　出力条件は、例えば、数値や指標で表されるバイタル情報についての閾値である。例えば、出力条件は、心拍数が閾値以上であるという条件や、呼吸数が閾値以上であるという条件や、ＬＦ／ＨＦが示すストレスの指標となる値が、閾値以上であるという条件である。出力条件格納部１０３には、バイタル情報の種類ごとに異なる出力条件が格納されていてもよい。出力条件格納部１０３には、例えば、１または２以上の異なるバイタル情報についての出力条件が、バイタル情報の種類を識別するバイタル識別子と対応付けて格納されていてもよい。バイタル識別子は、例えば、バイタル名や、バイタルに割り当てられたコード等であってもよい。出力条件は、複数の種類のバイタル情報についての条件の組み合わせ（例えば、ＡＮＤ条件やＯＲ条件等）であってもよい。

　着目条件格納部１０４は、１または２以上の着目条件が格納される。着目条件は、ユーザの１以上のバイタル情報に関する条件であって、ユーザに対応するユーザ領域を、他のユーザ領域に対して視覚的に区別可能とした画面画像を構成部１０６が構成するか判断するための条件である。

　着目条件は、例えば、数値や指標で表されるバイタル情報についての閾値である。例えば、着目条件は、例えば、心拍数が閾値以上であるという条件や、呼吸数が閾値以上であるという条件や、ＬＦ／ＨＦが示すストレスの指標となる値が、閾値以上であるという条件である。着目条件格納部１０４には、バイタル情報の種類ごとに異なる着目条件が格納されていてもよい。着目条件格納部１０４には、例えば、１または２以上の異なるバイタル情報についての着目条件が、バイタル識別子と対応付けて格納されていてもよい。着目条件は、複数の種類のバイタル情報についての条件の組み合わせ（例えば、ＡＮＤ条件やＯＲ条件等）であってもよい。

　なお、本実施の形態においては、サーバ１が出力条件格納部１０３および着目条件格納部１０４を有している場合について説明するが、これらの少なくとも一方は、サーバ１が有する代わりに、サーバ１がアクセス可能な他の装置等が有していてもよい。

　また、着目条件として、出力条件と同じ条件を用いてもよく、この場合、着目条件や、着目条件格納部１０４を省略し、着目条件を用いる処理において、出力条件を用いるようにしてもよい。

　判断部１０５は、情報取得部１０２が取得したバイタル情報が、出力条件格納部１０３に格納されている出力条件に合致するか判断する。出力条件格納部１０３に複数の種類のバイタル情報についての出力条件が格納されている場合、判断部１０５は、情報取得部１０２が取得した複数のバイタル情報が、それぞれの種類に対応する出力条件を満たすか判断してもよい。出力条件が複数の条件の組み合わせである場合、判断部１０５は、複数の条件にそれぞれ対応するバイタル情報が、各条件を満たすか否かを判断し、その判断結果の組み合わせにより、出力条件を満たすか判断してもよい。

　構成部１０６は、情報受信部１００が受信した画像を含む１以上、好ましくは２以上のユーザ領域を含む画面画像を構成する。一のユーザ領域は、例えば、情報受信部１００が一のユーザ端末２から受信した画像を含む（例えば、画像が配置される）領域である。構成部１０６は、情報受信部１００が受信した画像（を含む１または２以上のユーザ領域を含む画面画像を構成する。構成部１０６が構成する画面画像は、例えば、２以上のユーザ領域をタイル状に配列した画面画像である。構成部１０６が構成する画面画像は、例えば、情報受信部１００が２以上のユーザ端末からそれぞれ受信する画像のすべてをタイル状に配列した画面画像であってもよい。

　構成部１０６は、画面画像の送信先となるユーザ端末２ごとに異なる画面画像を構成してもよく、同じ画面画像を構成してもよい。例えば、構成部１０６は、画面画像の送信先となるユーザ端末２に対応するユーザのユーザ領域を他のユーザ領域よりも小さくした画面画像を構成してもよい。また、例えば、構成部１０６は、画面画像の送信先となるユーザ端末２に対応するユーザ以外の、情報受信部１００が音声を受信したユーザ端末に対応するユーザのユーザ領域を他のユーザ領域よりも大きくした画面画像を構成してもよい。

　構成部１０６は、情報取得部１０２が取得したバイタル情報に対応する画面画像を構成する。バイタル情報に対応する画面画像は、例えば、バイタル情報を配置した画面画像であってもよい。例えば、構成部１０６は、情報取得部１０２が取得した１または２以上のバイタル情報を、各バイタル情報が取得された画像を含むユーザ領域に配置した画面画像を構成する。また、構成部１０６は、情報取得部１０２が取得した１または２以上のバイタル情報に対応するグラフやマークや記号を、各バイタル情報が取得された画像を含むユーザ領域に配置した画面画像を構成してもよい。

　構成部１０６は、例えば、情報取得部１０２が取得したバイタル情報を、このバイタル情報を取得する元になった画像に対応する態様とした画面画像を構成する。この画面画像も、バイタル情報に対応する画面画像と考えてよい。バイタル情報を、バイタル情報を取得する元になった画像に対応する態様とした画面画像とは、例えば、情報取得部１０２が取得したバイタル情報を埋め込んだ画面画像であってもよく、情報取得部１０２が取得したバイタル情報を、このバイタル情報を取得した画像を含むユーザ領域内の所定の位置（例えば、ユーザ領域の下部や上部等）に配置した画面画像であってもよい。また、バイタル情報を、バイタル情報を取得する元になった画像に対応する態様とした画面画像は、例えば、情報取得部１０２が取得したバイタル情報を、このバイタル情報を取得した画像を含むユーザ領域内の、ユーザの人物領域（好ましくは人物の顔や額等の領域）と重なる位置や、人物領域に隣接する位置（例えば、顔の横や、頭上等）に配置した画面画像であってもよい。例えば、ユーザの人物領域や、顔や、頭等は、画像認識処理により実現可能である。

　構成部１０６は、例えば、情報受信部１００が受信した画像を含む２以上のユーザ領域を含む画面画像であって、着目条件を満たすバイタル情報が情報取得部１０２により取得された画像を含むユーザ領域が、他のユーザ領域と視覚的に区別可能な画面画像を構成する。視覚的に区別可能な画面情報とは、例えば、着目条件を満たすバイタル情報が取得された画像を含むユーザ領域の枠が、ハイライト表示された画面画像であってもよく、着目条件を満たすバイタル情報が取得された画像を含むユーザ領域が他のユーザ領域よりも大きく表示された画面画像であってもよい。なお、着目条件を満たすバイタル情報が取得された画像を含むユーザ領域が視覚的に区別可能であれば、上記のような態様に限定されない。ここでの着目条件は、例えば、着目条件格納部１０４に格納された着目条件である。

　画面画像とは、例えば、ユーザ端末２の画面に表示される画像である。画面画像は、例えば、動画像等の時系列の画像である。ただし、画面画像は、１または２以上の静止画像であってもよい。なお、画面画像は、例えば、結果的にユーザ端末２の画面に上述したような画像を表示することが可能な情報であってもよい。例えば、画面画像は、画面の1以上のユーザ領域に配置される画像（例えば、情報受信部１００が各ユーザ端末２から受信する動画像）と、画面の構造を示すＨＴＭＬ等で記述されたデータとの組み合わせや、これらに対し、さらにＣＳＳファイル等のレイアウトやスタイルを示すデータを加えた情報であってもよい。また、画面の構造を示すデータやレイアウトやスタイルを示すデータの少なくとも一部を、各ユーザ端末２が有していてもよい。画面画像は、例えば、画面に表示される上述したようなバイタル情報を有する情報であってもよく、このバイタル情報の配置される位置を指定する情報をさらに有していてもよい。また、画面画像は、着目条件を満たすバイタル情報が配置されたユーザ領域の表示態様を、他と異なる表示態様となるよう指定する情報を有していてもよく、その表示態様を指定する情報を有していてもよい。

　情報送信部１０７は、構成部１０６が構成した画面画像を、２以上のユーザ端末２に送信する。また、情報送信部１０７は、情報受信部１００が受信した音声を、画面画像と対応付けて、２以上のユーザ端末２に送信してもよい。

　情報送信部１０７は、ウェブ会議を行っている間に、情報取得部１０２が取得したバイタル情報に対応する情報を、２以上のユーザ端末２のうちの１以上のユーザ端末２に送信する。情報送信部１０７は、バイタル情報に対応する情報として、情報取得部１０２が取得したバイタル情報を送信してもよく、構成部１０６が構成した画面画像であって、バイタル情報に対応する情報が配置された画面画像を送信してもよい。

　情報送信部１０７は、情報取得部１０２が取得したバイタル情報を、このバイタル情報を取得する元になった画像に対応する態様で送信してもよい。例えば、バイタル情報を、このバイタル情報を取得する元になった画像に埋め込んで送信してもよく、構成部１０６が構成した画面画像であって、上記のように、バイタル情報を、バイタル情報を取得する元になった画像を含むユーザ領域内の予め決められた位置に配置した画面画像を送信してもよい。

　情報送信部１０７は、例えば、予め決められた１以上のユーザ端末２に、情報取得部１０２が取得したバイタル情報に対応する情報を送信する。情報送信部１０７は、例えば、バイタル情報を取得する元になった画像を送信したユーザ端末２を除く１以上の他のユーザ端末２のみにバイタル情報に対応する情報を送信する。この場合の他のユーザ端末２が、予め決められたユーザ端末２でもよい。予め決められたユーザ端末は、例えば、医師や看護士等の医療関係者が利用するユーザ端末や、企業等において社員等の健康管理等を行う管理者等が利用するユーザ端末である。

　情報送信部１０７は、判断部１０５が出力条件に合致すると判断したバイタル情報に対応する情報のみを送信するようにしてもよい。例えば、情報送信部１０７は、複数のユーザ端末２から情報受信部１００がそれぞれ受信したバイタル情報が、出力条件を満たすか判断し、出力条件を満たすバイタル情報に対応する情報のみを送信してもよい。また、例えば、情報送信部１０７は、一のユーザ端末について情報取得部１０２が取得した異なる種類のバイタル情報が、それぞれの種類に対応するバイタル条件を満たすか判断し、バイタル条件を満たす種類のバイタル情報に対応する情報のみを送信してもよい。

　蓄積部１０８は、情報取得部１０２が取得した時系列のバイタル情報をバイタル情報格納部１０９に蓄積する。蓄積部１０８は、例えば、２以上の各ユーザ端末２に対応付けて、情報取得部１０２が２以上の各ユーザ端末２から受信した時系列の各画像から取得した時系列のバイタル情報を蓄積する。蓄積部１０８は、例えば、情報受信部１００が受信した時系列の各画像に対応付けて、この時系列の各画像から取得した時系列のバイタル情報を蓄積してもよい。

　また、蓄積部１０８は、情報取得部１０２が取得した時系列のバイタル情報を、このバイタル情報を取得した時系列の画像と対応付けて蓄積してもよい。

　バイタル情報格納部１０９には、時系列のバイタル情報が格納される。例えば、１または２以上のユーザ端末２から受信した時系列の各画像から取得された時系列のバイタル情報が、対応する１または２以上のユーザ端末２に対応付けて格納される。また、例えば、情報受信部１００が１または２以上のユーザ端末２から受信した時系列の各画像に対応付けて、この時系列の各画像から取得した時系列のバイタル情報が格納されてもよい。

　提案格納部１１０には、１以上の提案情報が格納される。提案情報は、保険条件と保険情報とを有する情報である。

　保険情報は、保険に関する情報である。ここでの保険は、例えば、情報取得部１０２が取得する１以上の種類のバイタル情報に関連した保険である。バイタル情報に関連した情報は、例えば、バイタル情報が示すユーザの健康状態に関連して提案される入院保険や、通院保険、生命保険等である。また、バイタル情報に関連した情報は、例えば、１以上の種類のバイタル情報の異常により検出されうる特定の疾病に対する保険（例えば、がん保険等）であってもよい。保険情報は、例えば、ユーザに提案する保険を示す情報（例えば、保険名や保険の識別子等）や、その保険の補償内容等を示す情報である。また、保険情報は、保険に加入するための申込書等の情報や、申し込みを行うためのウェブサイト等を示す情報であってもよい。ウェブサイトを示す情報は、例えば、ウェブサイト名や、ウェブサイトのＵＲＬ等）また、保険情報は、保険を提供する企業等を示す情報や、その企業や保険を紹介するためのウェブサイトを示す情報であってもよい。

　保険条件は、対応する保険をユーザ端末２に送信するか判断するために用いられる、ユーザのバイタル情報に関する条件である。保険条件は、例えば、数値で表されるバイタル情報についての閾値である。保険条件は、例えば、心拍数が閾値以上であるという条件や、呼吸数が閾値以上であるという条件や、ＬＦ／ＨＦが示すストレスの指標となる値が、閾値以上であるという条件である。バイタル情報格納部１０９には、バイタル情報の種類ごとに異なる保険条件が格納されていてもよい。バイタル情報格納部１０９には、例えば、１または２以上の異なるバイタル情報についての保険条件が、バイタル識別子と対応付けて格納されていてもよい。保険条件は、複数の種類のバイタル情報についての条件の組み合わせ（例えば、ＡＮＤ条件やＯＲ条件等）であってもよい。

　なお、本実施の形態においては、サーバ１が提案格納部１１０を有している場合について説明するが、これらの少なくとも一方は、サーバ１が有する代わりに、サーバ１がアクセス可能な他の装置等が有していてもよい。

　また、保険条件として、出力条件または着目条件と同じ条件を用いてもよく、この場合、出力条件または着目条件を省略し、出力条件または着目条件を用いる処理において、提案格納部１１０に格納された保険条件を用いてもよい。

　保険情報取得部１１１は、提案格納部１１０を参照し、情報取得部１０２が取得したバイタル情報が満たす保険条件を決定し、保険条件と対になる保険情報を提案格納部１１０から取得する。

　保険情報送信部１１２は、保険情報取得部１１１が取得した保険情報を、バイタル情報を取得する元になった画像を送信したユーザ端末２に送信する。

　保険情報送信部１１２は、通常、無線または有線の通信手段で実現される。保険情報送信部１１２は、通信デバイスを含むと考えても、含まないと考えても良い。

　ユーザ端末２は、ユーザが利用する装置である。ユーザ端末２は、コンピュータや、いわゆるスマートフォン等の多機能携帯電話、タブレット型端末等により実現可能である。また、ユーザ端末２は、ウェブ会議専用の端末装置等であってもよい。

　ユーザ端末２は、例えば、ユーザを撮影可能なカメラ（図示せず）と、カメラが撮影した画像をサーバ１に送信する端末送信部（図示せず）と、サーバ１から送信される画面画像を受信する端末受信部（図示せず）と、端末受信部が受信した画面画像等の画像を表示する端末表示部（図示せず）と、ユーザからの操作を受け付ける端末受付部（図示せず）と、受け付けた操作に応じた処理（例えば、ウェブ会議を開始させる処理や、終了させる処理、ウェブ会議の設定等を行う処理等）を実行する処理部（図示せず）等を備えている。端末表示部は、モニタ等の表示デバイス（図示せず）を有していてもよい。ユーザ端末２は、さらに、ユーザの音声を取得可能なマイクロフォン（図示せず）を備えており、端末送信部が、マイクロフォンが取得した音声をサーバ１に送信してもよい。また、端末受信部が、さらに、サーバ１から送信される音声を受信し、ユーザ端末２が、端末受信部が受信した音声等を出力する音声出力部（図示せず）等を有していてもよい。音声出力部は、スピーカー等の音声出力デバイス（図示せず）を有していてもよい。

　次に、ウェブ会議システム１０００のサーバ１の動作の一例について図２のフローチャートを用いて説明する。

　（ステップＳ１０１）サーバ１は、ウェブ会議を開始するか判断する。例えば、予定された時刻になった場合に、サーバ１の処理部（図示せず）等が、開始することを決定してもよい。また、情報受信部１００等が、１以上のユーザ端末２からウェブ会議を開始する指示を受信した場合に、ウェブ会議を開始してもよい。ウェブ会議を開始することを決定した場合、ウェブ会議を開始して、ステップＳ１０２に進み、開始しない場合、ステップＳ１０１に戻る。

　（ステップＳ１０２）情報受信部１００は、ウェブ会議に参加している各ユーザ端末２からの画像の受信を開始する。そして、情報受信部１００は、例えば、各ユーザ端末２から送信される画像を受信する。受信する画像は、例えば、動画像等の時系列の画像である。複数のユーザ端末２からの画像の受信は、例えば並列処理で行ってもよく、時分割で行ってもよく、どのように受信するかは、これらに限定されない。また、情報受信部１００は、さらに、音声を受信してもよい。情報受信部１００は、例えば、端末識別子と対応付けられた画像を受信する。

　（ステップＳ１０３）情報取得部１０２は、ステップＳ１０２で受信した各画像から、バイタル情報を取得する時期であるか判断する。例えば、画像の受信を開始してから一定の時間が経過するごとに、バイタル情報を取得する時期であると判断してもよい。また、予め決められた時刻や、ランダムに決定した時期を、バイタル情報を取得する時期であると判断してもよい。取得する時期をどのように決定するかは問わない。また、取得する時期間の長さ等は問わない。取得する時期である場合、ステップＳ１０４に進み、取得時期でない場合、ステップＳ１１５に進む。

　（ステップＳ１０４）情報取得部１０２は、カウンターｎの値に１を代入する。

　（ステップＳ１０５）情報取得部１０２は、ウェブ会議に参加しているユーザ端末２において、ｎ番目のバイタル情報の取得対象となるユーザ端末２があるか判断する。バイタル情報の取得対象となるユーザ端末２とは、バイタル情報の取得対象となる画像を送信するユーザ端末である。取得対象となるユーザ端末２は、例えば、特定情報格納部１０１に格納される特定情報を用いて検出する。ある場合、ステップＳ１０６に進み、ない場合、ステップＳ１１５に進む。

　（ステップＳ１０６）情報取得部１０２は、ステップＳ１０２でｎ番目のユーザ端末２から受信した画像に含まれるユーザの人物領域から、予め決められた１以上の種類のバイタル情報を取得する。情報取得部１０２は、例えば、時系列の画像からバイタル情報を取得する。

　（ステップＳ１０７）蓄積部１０８は、ステップＳ１０６で取得したバイタル情報を、バイタル情報格納部１０９に蓄積する。例えば、取得した時系列の順番で蓄積してもよく、取得した時刻と対応付けて蓄積してもよい。蓄積部１０８は、例えば、ステップＳ１０２で受信した画像を、送信したユーザ端末２と対応付けて、取得したバイタル情報を蓄積してもよい。また、蓄積部１０８は、例えば、取得した異なる種類のバイタル情報に、バイタル情報の種類を示す種類識別子等を対応付けて蓄積してもよい。また、蓄積部１０８は、情報受信部１００が受信した時系列の各画像に対応付けて、ステップＳ１０６で取得した時系列のバイタル情報を蓄積してもよい。例えば、受信した時系列の画像のうちの、バイタル情報を取得する際に利用した期間内の画像を、取得したバイタル情報と対応付けて蓄積してもよい。また、受信した時系列の画像を蓄積するとともに、その画像内のステップＳ１０６においてバイタル情報の取得に利用した部分を特定する情報（例えば、タイムコードの開始時刻や、終了時刻等）をバイタル情報と対応付けて蓄積してもよい。

　（ステップＳ１０８）判断部１０５は、ステップＳ１０６で取得したバイタル情報が、出力条件に合致するか判断する。例えば、取得したバイタル情報が、異なる複数の種類のバイタル情報である場合、判断部１０５は、それぞれの種類ごとに、対応する出力条件を満たすか判断してもよい。合致する場合、ステップＳ１０９に進み、合致しない場合、ステップＳ１１０に進む。なお、合致する場合とは、例えば、合致するバイタル情報が１以上ある場合と考えてもよく、合致しない場合とは、合致するバイタル情報が一つもない場合と考えてもよい。

　（ステップＳ１０９）判断部１０５は、出力条件に合致するバイタル情報に対応する情報の送信を行うことを決定する。例えば、ステップＳ１０６で取得した出力条件に合致するバイタル情報と、ｎ番目のユーザ端末２の端末識別子とを、対応付けて、格納部（図示せず）等に蓄積する。なお、合致するバイタル情報の種類を示す情報等をさらに対応付けて蓄積してもよい。

　（ステップＳ１１０）構成部１０６は、ステップＳ１０６で取得したバイタル情報が、着目条件に合致するか判断する。合致する場合、ステップＳ１１１に進み、合致しない場合、ステップＳ１１２に進む。

　（ステップＳ１１１）構成部１０６は、バイタル情報を取得した画像を含むユーザ領域を他のユーザ領域に対して視覚的に区別可能な画面画像を構成することを決定する。構成部１０６は、例えば、視覚的に区別可能とするユーザ領域に対応するユーザ端末２の端末識別子を、格納部（図示せず）等に蓄積する。

　（ステップＳ１１２）保険情報取得部１１１は、ステップＳ１０６で取得したバイタル情報が、提案格納部１１０に格納されている保険条件に合致するか判断する。例えば、ステップＳ１０４で取得した複数種類のバイタル情報について、それぞれの種類に対応する保険条件を満たすか判断する。保険条件に合致する場合、ステップＳ１１３に進み、合致しない場合、ステップＳ１１４に進む。なお、保険条件に合致する場合とは、例えば、保険情報に合致する種類のバイタル情報が１以上ある場合と考えてもよく、合致しない場合は、合致する種類のバイタル情報が一つもない場合と考えてもよい。

　（ステップＳ１１３）保険情報取得部１１１は、バイタル情報と合致する保険条件に対応する保険情報の送信を行うことを決定する。例えば、バイタル情報と合致する保険条件に対応する保険情報と、ｎ番目のユーザ端末２の端末識別子との組を対応付けて格納部（図示せず）等に蓄積する。例えば、保険情報取得部１１１は、バイタル情報と合致する保険条件に対応する保険情報を提案格納部１１０から取得し、取得した保険情報をｎ番目のユーザ端末２の端末識別子と対応付けて格納部（図示せず）等に蓄積してもよい。バイタル情報と合致する保険条件に対応する保険情報は、例えば、バイタル情報と合致する保険情報と同じ提案情報に含まれる保険情報である。なお、既に同じ保険情報とユーザ端末２との組を対応付けた情報が格納部（図示せず）に格納されている場合、新たに保険情報とユーザ端末２とを対応付ける情報を蓄積しなくてもよく、新たに保険情報を取得しなくてもよい。

　（ステップＳ１１４）情報取得部１０２は、カウンターｎの値を１インクリメントする。そして、ステップＳ１０５に戻る。

　（ステップＳ１１５）サーバ１は、ステップＳ１０２で受信した画像を用いて画面画像を構成する。そして、構成された画面画像を２以上のユーザ端末２に送信する。また、例えば、画像を受信する際に受信した音声も送信する。なお、ステップＳ１１５の処理の詳細については後述する。そして、ステップＳ１１６に進む。

　（ステップＳ１１６）サーバ１は、ウェブ会議を終了するか判断する。例えば、情報受信部１００が１以上のユーザ端末２からウェブ会議を終了する指示を受信した場合に、サーバ１は、ウェブ会議を終了することを決定する。また、予め決められた時刻等に、ウェブ会議を終了することを決定してもよい。終了する場合、ステップＳ１１７に進み、終了しない場合、ステップＳ１０３に戻る。

　（ステップＳ１１７）サーバ１は、ウェブ会議を終了する。また、画像の受信等も終了する。

　（ステップＳ１１８）保険情報取得部１１１は、保険情報の送信先となるユーザ端末２があるか判断する。例えば、保険情報取得部１１１は、ステップＳ１１３で対応付けて蓄積した保険情報とユーザ端末との１以上の組が、格納部（図示せず）に格納されているか判断し、格納されている場合、保険情報の送信先となるユーザ端末２があると判断して、ステップＳ１１９に進み、格納されていない場合、保険情報の送信先となるユーザ端末２がないと判断して、ステップＳ１０１に戻る。

　（ステップＳ１１９）保険情報取得部１１１は、ステップＳ１１３でユーザ端末２に対応付けて蓄積した保険情報を取得する。ここでの取得は、上記で保険情報を端末識別子と対応付けて蓄積したメモリ等の格納部（図示せず）からの読み出し等であってもよい。

　（ステップＳ１２０）保険情報送信部１１２は、ステップＳ１１９で取得した各保険情報を、ステップＳ１１３で各保険情報に対応づけられたユーザ端末２に送信する。そして、ステップＳ１０１に戻る。

　なお、図２のフローチャートにおいて、ウェブ会議の終了直後に、保険情報を送信する場合について説明したが、保険情報を送信する時期は、ウェブ会議終了直後でなくてもよく、例えば、ウェブ会議中に送信してもよく、ウェブ会議終了後の任意の時機等に送信してもよい。

　なお、図２のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

　次に、サーバ１が、画面画像を構成して、２以上のユーザ端末２に送信する処理の一例について、図３のフローチャートを用いて説明する。なお、この処理は、図２のステップＳ１１５の処理の一例に相当する。

　（ステップＳ２０１）構成部１０６は、ステップＳ１０２で複数のユーザ端末２からそれぞれ受信した画像を含む複数のユーザ領域を配置して画面画像を構成する。例えば、構成部１０６は、複数のユーザ端末２からそれぞれ受信した動画像であって、動画像が有するタイムコード等により同期させた動画像をそれぞれ含む複数のユーザ領域を配置して画面画像を構成する。例えば、複数のユーザ領域をタイル状に配置して画面画像を構成する。

　（ステップＳ２０２）情報送信部１０７はステップＳ２０１で構成した画面画像を、バイタル情報に対応する情報の送信先として予め決められたユーザ端末２以外のユーザ端末２に送信する。例えば、情報送信部１０７は、特定情報格納部１０１に格納された特定情報を用いて、バイタル情報に対応する情報の送信先として予め決められたユーザ端末２以外のユーザ端末２を決定する。

　（ステップＳ２０３）構成部１０６は、ステップＳ１０９でバイタル情報に対応する情報の送信を行うことを決定したバイタル情報があるか判断する。ある場合、ステップ２０４に進み、ない場合、ステップＳ２０５に進む。

　（ステップＳ２０４）構成部１０６は、ステップＳ２０１で構成した画面画像の、構成部１０６がステップＳ１０９で出力条件と対応付けて蓄積した端末識別子に対応するユーザ領域に、ステップＳ１０９で各端末識別子と対応付けて蓄積した出力条件に合致する１以上のバイタル情報を、それぞれ配置する。例えば、各ユーザ領域に含まれる画像に対応する態様でバイタル情報を配置する。

　（ステップＳ２０５）構成部１０６は、ステップＳ１１１で視覚的に区別可能に出力することを決定したユーザ領域があるか判断する。ある場合、ステップＳ２０６に進み、ない場合、ステップＳ２０７に進む。

　（ステップＳ２０６）構成部１０６は、ステップＳ１１１で取得した視覚的に区別可能に出力することを決定したユーザ領域に対応するユーザ端末２の端末識別子を用いて、ステップＳ２０１で構成した画面画像、またはステップＳ２０４でバイタル情報を配置した画面画像を、この端末識別子に対応するユーザ領域を視覚的に区別可能とした画面画像となるよう変更する。

　（ステップＳ２０７）情報送信部１０７は、特定情報格納部１０１に格納された特定情報を用いて、ステップＳ２０１で構成された画面画像であって、ステップＳ２０４およびステップＳ２０６の判断に応じた処理を経た画面画像（例えば、判断結果に応じて、バイタル情報が配置されたり、ユーザ領域が変更されたりした画面画像や、変更が加えられたかった画面画像等）を、バイタル情報に対応する情報の送信先として予め決められたユーザ端末２に送信する。そして、上位の処理にリターンする。

　次に、ユーザ端末２の動作について簡単に説明する。ユーザ端末２のカメラが撮影した画像と、マイクロフォンが取得した音声を、端末送信部がサーバ１に送信する。また、ユーザ端末２の端末受信部が、サーバ１から送信される画面画像および音声を受信し、受信した画面画像を端末表示部がモニタ等に表示し、受信した音声を音声出力部がスピーカーやヘッドホン等の音声出力デバイスから出力する。

　以下、本実施の形態におけるウェブ会議システム１０００の具体的な動作について一例を挙げて説明する。

　図４は、ウェブ会議システム１０００の具体例を示す模式図である。ここでは、ユーザ端末２が、いずれもコンピュータである場合を例に挙げて説明する。また、ここでは、４つのユーザ端末２を、ユーザ端末２ａ－２ｄとして表している。ただし、ユーザ端末２ａ－２ｄのそれぞれを区別せずにユーザ端末２と呼ぶ場合もある。

　ここでは、サーバ１がウェブ会議を開始しており、４人のユーザがそれぞれユーザ端末２を利用してウェブ会議に参加しているものとする。４人のユーザの１人は企業において、社員の健康管理を行う産業医であり、他の３人は、企業に勤務する社員であるとする。ウェブ会議に参加しているユーザ端末２を管理するために、例えば、参加しているユーザ端末２ａ－２ｄに対応する端末識別子と、ウェブ会議の会議名やウェブ会議に割り当てられたコード等の会議識別子とが対応付けられて、メモリ等格納部（図示せず）に格納されているものとする。

　図５は、特定情報格納部１０１に格納されている特定情報を管理する特定情報管理表である。特定情報管理表は、「端末ＩＤ」と、「指定」という属性を有している。「端末ＩＤ」は、ユーザ端末２の端末識別子であり、ここでは、値「Ｕ００１」から「Ｕ００４」までの４つの端末識別子にそれぞれ対応するユーザ端末２が、ウェブ会議に参加しているものとする。「指定」は、ユーザ端末２を利用するユーザが、バイタル情報の取得対象となるユーザであるか否かを指定する情報、およびバイタル情報に対応する情報の送信先となるユーザであるか否かを指定する情報であり、値「１」は、バイタル情報の取得対象となるユーザであることを示し、値「２」は、バイタル情報に対応する情報の送信先となるユーザであることを示し、値「０」は、そのいずれでもないユーザであることを示す。なお、ユーザ端末２ａの端末識別子が「Ｕ００１」、ユーザ端末２ｂの端末識別子が「Ｕ００２」、ユーザ端末２ｃの端末識別子が「Ｕ００３」、ユーザ端末２ｄの端末識別子が「Ｕ００４」であるとする。

　図６（ａ）は、出力条件格納部１０３に格納されている出力条件を管理する出力条件管理表である。出力条件管理表は、「出力バイタルＩＤ」と「出力条件」という属性を有している。「出力バイタルＩＤ」は、対応する出力条件を満たす場合に出力されるバイタル情報の種類を示す識別子であり、ここでは種類名であるとする。「出力条件」は、対応するバイタル情報を出力するための出力条件である。なお、出力条件のＸ_１－Ｘ_３等は、予め決められた値であるとする。かかることは、着目条件のＸ_４や保険条件のＸ_５等についても同様である。

　図６（ｂ）は、着目条件格納部１０４に格納されている着目条件を管理する着目条件管理表である。着目条件管理表において、属性「着目条件」は、着目条件を示している。

　図７（ａ）は、提案格納部１１０に格納されている提案情報を管理する提案情報管理表である。提案管理表において、属性「保険情報」は保険情報であり、ここでは、保険情報のファイル名を示している。属性「保険条件」は、保険条件を示している。

　なお、図６（ａ）、図６（ｂ）、および図７においては、出力条件、着目条件、および保険条件を、それぞれ自然言語で表しているが、これらの条件は、例えば、これらの自然言語に相当する一以上の関数や、メソッド名や、「ｉｆ」、「ｔｈｅｎ」等で示される制御構文等で構成されていてもよい。また、これらの条件は、これらの自然言語に対応する判断処理等を行うためのアルゴリズムであってもよい。

　ウェブ会議が開始されると、４つのユーザ端末２ａ－２ｄが、サーバ１に、それぞれが撮影した時系列の画像である動画像およびそれぞれが取得した音声を、自端末の端末識別子と対応付けて順次送信する。

　ここで、例えば、情報取得部１０２が、バイタル情報を取得する時期になった、と判断したとする。例えば、情報取得部１０２は、画像の受信開始から一定の時間が経過するごとに、バイタル情報を取得する処理を行っており、前回のバイタル情報を取得する時期から、予め決められた時間が経過したとする。

　情報取得部１０２は、まず、図５に示した特定情報管理表を用いて、現在ウェブ会議に参加している４台のユーザ端末２のうち、バイタル情報の取得の対象となるユーザ端末２を検出する。例えば、情報取得部１０２は、図５に示した特定情報管理表の、「端末ＩＤ」の値が、ウェブ会議に参加しているユーザ端末２に対応する端末識別子が「Ｕ００１」から「Ｕ００４」のいずれかであるレコード（行）において、「指定」の値が、バイタル情報の取得対象であることを示す値「１」であるレコードを検出し、検出したレコードの「端末ＩＤ」の値である端末識別子を、バイタル情報の取得対象となるユーザ端末２の端末識別子として取得する。ここでは、端末識別子「Ｕ００３」および「Ｕ００４」が取得されたとする。

　なお、対応する「指定」の値が「０」としたユーザ端末２が送信する画像からバイタル情報を取得しないようにすることで、例えば、バイタル情報に対応した情報の送信先以外のユーザのうちの、予め決められたユーザを、バイタル情報の取得対象から除外することができる。これにより、例えば、ユーザの意思を尊重して、バイタル情報を取得するか否かを設定したり、ユーザの状態を観察する必要があるユーザから選択的にバイタル情報を取得したりすることができる。

　次に、情報取得部１０２は、取得した端末識別子のうちの１番目の端末識別子「Ｕ００３」を取り出し、端末識別子「Ｕ００３」と対応付けられて送信される画像から、バイタル情報を取得する。例えば、バイタル情報を取得する時期から、一定時間経過するまでに送信された画像からバイタル情報を取得する。なお、取得した端末識別子から、端末識別子を取り出す順番は、どのように割り当ててもよい。

　例えば、情報取得部１０２は、予め決められたバイタル情報として、ここでは、脈拍数と、心拍数と、ＬＦ／ＨＦの値とを取得する。例えば、情報受信部１００が受信した予め決められた長さの動画像において、ユーザが撮影されている領域である人物領域を検出し、この人物領域から上記の３種類のバイタル情報を取得する。例えば、取得した脈拍数がｘ_１１０、心拍数がｘ_２１０、ＬＦ／ＨＦの値がｘ_３１０であったとする。また、これらの値を取得した時刻はｔ_６であったとする。なお、ｘ_１１０、ｘ_２１０、ｘ_３１０、ｔ_６等はそれぞれ特定の値であるとする。

　蓄積部１０８は、上記で情報取得部１０２が取得した各バイタル情報を、各バイタル情報の種類名と、端末識別子「Ｕ００３」と、取得時刻と対応付けて、バイタル情報格納部１０９に蓄積する。また、ここでは、さらに、バイタル情報を取得する際に利用した画像（ここでは、動画像の一部）を切り出したファイル「００３５．ｍｐ４」を、バイタル情報と対応付けて、バイタル情報格納部１０９に蓄積する。

　図８は、バイタル情報格納部１０９に蓄積されたバイタル情報を管理するバイタル情報管理表である。バイタル情報格納部１０９は、「時刻」、「端末ＩＤ」、「脈拍数」、「心拍数」、「ＬＦ／ＨＦ」、および「画像」という属性を有している。「時刻」はバイタル情報を取得した時刻であり、ｔ_１、ｔ_２等は異なる特定の時刻であるとする。「端末ＩＤ」は端末識別子である。「脈拍数」は脈拍数、「心拍数」は心拍数、「ＬＦ／ＨＦ」はＬＦ／ＨＦの値であり、これらの３つが、情報取得部１０２が取得したバイタル情報である。「画像」は、バイタル情報を取得した画像のファイルのファイル名である。この画像は、例えば、バイタル情報を取得するために利用した予め決められた長さの動画像のファイルである。

　次に、判断部１０５は、上記で情報取得部１０２が１番目の端末識別子「Ｕ００３」について取得したバイタル情報が、出力条件に合致するか判断する。具体的には、判断部１０５は、図６（ａ）に示した出力条件格納部１０３に格納された出力条件を管理する出力条件管理表の各レコード（行）の「出力条件」が示す出力条件に、上記で取得したバイタル情報が合致するか判断する。そして、合致する場合、同じレコードの「出力バイタルＩＤ」が示す種類のバイタル情報に対応する情報を送信することを決定する。

　まず、判断部１０５は、図６（ａ）に示した出力条件管理表の上から１番目のレコード（行）の「出力条件」の値「１分当たりの脈拍数がＸ_１回以上である」を読み出し、上記で取得したバイタル情報がこの出力条件に合致するか、具体的には、上記で取得したバイタル情報の一つである脈拍数ｘ_１１０が、Ｘ_１回以上であるか判断する。ここでは、ｘ_１１０が、Ｘ_１以上の値であったとすると、判断部１０５は、この出力条件に合致すると判断し、取得したバイタル情報である脈拍数ｘ_１１０に対応する情報を送信することを決定する。

　また、図６（ａ）に示した出力条件管理表の上から２番目のレコード（行）の「出力条件」の値「１分当たりの呼吸数がＸ_２回以上である」を読み出し、上記で取得したバイタル情報の一つである呼吸数ｘ_２１０が、Ｘ_２回以上であるか判断する。ここでは、ｘ_２回以上でないため、この呼吸数ｘ_２１０に対応する情報を送信しないことを決定する。

　また、図６（ａ）に示した出力条件管理表の上から３番目のレコード（行）の「出力条件」の値「ＬＦ／ＨＦの値がＸ_３以上である」を読み出し、上記で取得したバイタル情報の一つであるＬＦ／ＨＦの値ｘ_３１０が、Ｘ_３回以上であるか判断する。ここでは、ｘ_３回以上であるため、この呼吸数ｘ_３１０に対応する情報を送信することを決定する。

　そして、対応する情報を送信することを決定したバイタル情報である脈拍数ｘ_１０１と、ＬＦ／ＨＦの値ｘ_３０１とを、端末識別子「Ｕ００３」と対応付けて、メモリ等の格納部（図示せず）等に一時記憶する。

　次に、構成部１０６は、上記で情報取得部１０２が取得したバイタル情報が、着目条件格納部１０４に格納された着目条件に合致するか判断する。具体的には、構成部１０６は、図６（ｂ）に示した着目条件管理表で管理される着目条件「呼吸数が２４回／分以上、または、ＬＦ／ＨＦの値がＸ_４以上である」を読み出し、この着目条件に上記で取得したバイタル情報が合致するか判断する。例えば、構成部１０６は、まず、上記で取得したバイタル情報のうちの呼吸数ｘ_２１０が、２４回以上であるか判断し、２４回以上であれば、条件に合致すると判断する。ここでは、２４回以上でなく、この条件に合致しないとする。この場合、さらに、上記で取得したバイタル情報のうちのＬＦ／ＨＦの値ｘ_３１０が、Ｘ_４以上であるか判断し、Ｘ_４以上であればこの条件に合致すると判断する。ここでは、Ｘ_４以上であったとすると、ＬＦ／ＨＦの値がＸ_４以上であるという条件に合致するため、構成部１０６は、取得したバイタル情報が着目条件に合致すると判断する。このため、構成部１０６は、端末識別子「Ｕ００３」が識別するユーザ端末２から受信した画像を含むユーザ領域を、他のユーザ領域に対して視覚的に区別可能な画面画像を構成することを決定する。そして、端末識別子「Ｕ００３」を、対応するユーザ領域を視覚的に区別可能なユーザ領域とする端末識別子として、メモリ等の格納部（図示せず）等に一時記憶する。

　次に、保険情報取得部１１１は、提案格納部１１０に格納されている各提案情報が有する保険条件に、上記で情報取得部１０２が取得したバイタル情報が合致するか判断する。そして、合致する保険条件を有する提案情報の保険情報を、取得したバイタル情報に対応するユーザ端末２に送信する保険情報に決定する。

　例えば、保険情報取得部１１１は、まず、図７（ａ）に示した提案情報管理表の上から１行目のレコード（行）の提案情報の「保険条件」である「ＬＦ／ＨＦの値がＸ_５以上」を取得し、取得した保険条件に、上記で取得したバイタル情報が合致するか判断する。ここでは、上記で取得したバイタル情報のＬＦ／ＨＦの値ｘ_３１０が、Ｘ_５以上であったとすると、この保険条件を満たすため、保険情報取得部１１１は、上から１行目のレコードの提案情報の「保険情報」の値が示すファイル名が「Ｆ００１．ｈｔｍ」である保険情報を、端末識別子「Ｕ００３」が識別するユーザ端末２に送信する保険情報に決定する。そして、この保険情報のファイル名「Ｆ００１．ｈｔｍ」を、端末識別子「Ｕ００３」と対応付けた情報を、保険情報の送信を管理するための保険送信管理情報として、メモリ等の格納部（図示せず）に蓄積する。なお、既に同じ保険情報のファイル名と、端末識別子との組を有する保険送信管理情報が格納されている場合、新たな保険送信管理情報を蓄積しなくてもよく、既に蓄積されている同じ保険送信管理情報を、新たな保険送信管理情報で上書きしてもよい。

　図７（ｂ）は、格納部（図示せず）に格納されている保険送信管理情報を示す図である。保険送信管理情報は、保険情報のファイル名である「保険情報」と、端末識別子である「端末ＩＤ」という属性を有している。ここでは、既に、保険情報「Ｆ００２．ｈｔｍ」と、端末ＩＤ「Ｕ００４」とを有する情報が蓄積されており、上記の保険情報等が新たに蓄積されたものする。

　情報取得部１０２は、同様にして、バイタル情報の取得対象であるユーザ端末２のうちの、２番目以降のユーザ端末２から送信される画像についても、上記と同様にバイタル情報を順次取得し、順次取得されるバイタル情報について、判断部１０５、構成部１０６、および保険情報取得部１１１等が、上記と同様の、出力条件に合致するか、着目条件に合致するか、保険情報に合致するか等の処理を行う。ここでは、端末識別子が「Ｕ００４」から受信した画像から取得されたバイタル情報について上記と同様の処理を行い、その結果、出力条件と、着目条件と、保険条件とのいずれも満たさなかったものとする。

　そして、バイタル情報の取得対象であるユーザ端末２から送信される画像についてバイタル情報等を取得する処理を行った後、構成部１０６は、判断部１０５による出力条件についての判断結果や、構成部１０６による着目条件についての判断結果に応じて、情報受信部１００が受信した画像を含むユーザ領域を有する画面画像を構成する。

　図９（ａ）－図９（ｄ）、および図１０（ａ）－図１０（ｃ）は、構成部１０６が構成する画面画像を説明するための画面画像の例を示す図である。

　例えば、情報受信部１００が、同じウェブ会議に参加している端末識別子が「Ｕ００１」－「Ｕ００４」であるユーザ端末２から、同じタイミングで、それぞれ図９（ａ）－図９（ｄ）のような画像７１－７４を受信したとすると、構成部１０６は、これらの画像７１－７４をそれぞれ含むユーザ領域１００１－１００５をタイル状に配列した図１０（ａ）に示すような画面画像１００５を構成する。なお、画像７１－７４および画面画像１００５の画像の大きさや解像度等は問わない。例えば、これらの全てが同じであってもよく、少なくとも一部が異なっていてもよい。

　そして、情報送信部１０７は、端末識別子が「Ｕ００１」－「Ｕ００４」である画像を送信した４つのユーザ端末２のうちの、図５に示した特定情報管理表により各端末識別子と対応付けられた「指定」の値が、バイタル情報の送信先であることを示す値「２」であるユーザ端末２以外のユーザ端末２に、上記で構成した画面画像を送信する。ここでは、端末識別子「Ｕ００１」に対応する「指定」の値だけが「２」であるため、情報送信部１０７は、端末識別子が「Ｕ００１」であるユーザ端末２ａを除いた、端末識別子が「Ｕ００２」－「Ｕ００４」であるユーザ端末２ｂ－２ｄに、上記で取得した画面画像１００５を送信する。また、上記で受信した音声も、画像１００５に対応付けて送信する。

　例えば、端末識別子が「Ｕ００２」であるユーザ端末２ｂが、端末受信部（図示せず）によりこの画面画像１００５および音声を受信すると、端末表示部（図示せず）がこの画面画像１００５をユーザ端末２が有するモニタに表示する。また、音声出力部（図示せず）が受信した音声を出力する。

　図１１（ａ）は、ユーザ端末２ｂによる画面画像１００５の表示例を示す図である。なお、ユーザ端末２ｃおよび２ｄも同様の画面画像１００５を表示する。

　また、ここでは、端末識別子が「Ｕ００３」であるユーザ端末２ｃが受信した画像から取得したバイタル情報が、上記のように１以上の出力条件に合致しており、バイタル情報である脈拍数ｘ_１１０と、ＬＦ／ＨＦの値ｘ_３１０とが、端末識別子「Ｕ００３」と対応付けられて、メモリ等の格納部（図示せず）等に一時記憶されているため、構成部１０６は、これらの情報を読み出して、上記で構成した図１０（ａ）に示すような画面画像１００５の、端末識別子「Ｕ００３」に対応するユーザ領域１００３に、バイタル情報である脈拍数ｘ_１１０と、ＬＦ／ＨＦの値ｘ_３１０と、を配置する。ここでは、バイタル情報を取得する元となった画像に対応する態様として、ユーザ領域内の画像の、人物領域の横に読み出したバイタル情報を配置する。なお、出力条件に合致するバイタル情報が、端末識別子が「Ｕ００３」であるユーザ端末２ｃが送信した画像から取得できなかった場合、ユーザ領域１００３に上記のようなバイタル情報は配置されない。

　また、ここでは、端末識別子が「Ｕ００３」であるユーザ端末２が受信した画像から取得したバイタル情報が、上記のように着目条件に合致しており、端末識別子「Ｕ００３」を、対応するユーザ領域を視覚的に区別可能なユーザ領域とする端末識別子として、メモリ等の格納部（図示せず）等に一時記憶しているため、構成部１０６は、この端末識別子を読み出して、上記で構成した図１０（ｂ）に示すような画面画像１００５の、端末識別子「Ｕ００３」に対応するユーザ領域１００３を、視覚的に他のユーザ領域と区別可能なユーザ領域となるよう画面画像を変更する。図１０（ｃ）に示すように、ここでは、ユーザ領域１００３に強調表示（例えば、ハイライトカラーの枠線を配置）した枠５０を配置した画面画像１００５に変更する。なお、着目条件に合致するバイタル情報が、端末識別子が「Ｕ００３」であるユーザ端末２ｃが送信した画像から取得できなかった場合、ユーザ領域１００３は、上記のように視覚的に区別可能となるよう変更されない。

　そして、上記で構成した図１０（ｃ）に示したような画面画像１００５ａと音声とを、図５に示した特定情報管理表により端末識別子と対応付けられた「指定」の値が「２」である端末識別子が「Ｕ００１」であるユーザ端末２ａに送信する。

　このユーザ端末２ａの端末受信部（図示せず）が、図１０（ｃ）に示したような画面画像１００５ａと音声を受信すると、端末表示部（図示せず）が受信した画面画像１００５ａをモニタに表示する。また、音声出力部（図示せず）が、受信した音声を出力する。

　図１１（ｂ）は、端末識別子が「Ｕ００１」であるユーザ端末２ａによる画面画像１００５ａの表示例を示す図である。

　図１１（ｂ）に示すように、予め決められたユーザ端末２ａに表示される画面画像において、バイタル情報に応じて、他のユーザ端末２のユーザのユーザ領域が視覚的に識別可能に示されるため、例えば、ユーザ端末２ａのユーザは、ウェブ会議の他のユーザの状態に応じて適切な対応を行うことが可能である。例えば、体調の悪いユーザに注意を払うことが可能となる。

　また、ウェブ会議システム１０００を利用して講義等を行っている場合、予め決められたユーザ端末２ａを利用する講師が、視覚的に識別可能に表示されるユーザ領域を参照して、例えば、状態が好ましくないユーザを、できるだけ指名したりしないようにすることができる。

　なお、バイタル情報を取得する時期以外やバイタル情報の取得中等において情報受信部１００が受信した画像についても、構成部１０６が上記と同様に、各ユーザ端末２が送信する画像をタイル状に配列した画面画像を構成して、情報送信部１０７が、端末識別子が「Ｕ００２」－「Ｕ００４」であるユーザ端末２ｂ－２ｄにこの画面画像を送信する。また、端末識別子が「Ｕ００１」であるユーザ端末２ａに送信する画面画像としては、一のユーザ端末２が送信した画像から直近に取得したバイタル情報が、出力条件に合致していた場合には、構成部１０６は、上記と同様に構成した各ユーザ端末２が送信する画像をタイル状に配列した画面画像の、この画像を含むユーザ領域にバイタル情報を配置した画面画像を、ユーザ端末２ａに送信し、一のユーザ端末２が送信した画像から直近に取得したバイタル情報が、着目条件に合致していた場合には、構成部１０６は、上記と同様に構成した各ユーザ端末２が送信する画像をタイル状に配列した画面画像の、この画像を含むユーザ領域を視覚的に識別可能とした画面画像を、ユーザ端末２ａに送信する。また、一のユーザ端末２が送信した画像から直近に取得したバイタル情報が、出力条件および着目条件のいずれとも合致していない場合には、ユーザ端末２ｂ－２ｄに送信した画面画像と同じ画面画像をユーザ端末２ａに送信する。

　ここで、ユーザ端末２ａ等から送信される指示等に応じて、サーバ１が上記のウェブ会議を終了したとすると、保険情報取得部１１１は、バイタル情報に応じて取得した保険情報の送信先があるか判断する。具体的には、バイタル情報に応じて取得した保険情報の送信先となるユーザ端末２の端末識別子を有する保険送信管理情報が、格納部（図示せず）に格納されているか判断する。ここでは、図７（ｂ）に示すように、２つの保険送信管理情報が格納部に格納されているため、保険情報の送信先があると判断する。このため、保険情報取得部１１１は、図７（ｂ）に示す２つの保険情報管理情報から、それぞれ、保険情報のファイル名と、保険情報の送信先となる端末識別子との組を読み出し、読み出した組ごとに、ファイル名が示す保険情報を提案格納部１１０から取得して、対応する端末識別子に送信する。

　例えば、保険情報取得部１１１は、図７（ｂ）に示す上から１番目のレコードから、「保険情報」の値であるファイル名「Ｆ００２．ｈｔｍ」と、「端末ＩＤ」の値「Ｕ００３」とを取得し、ファイル名が「Ｆ００２．ｈｔｍ」である保険情報のファイルを、提案格納部１１０から読み出して、端末識別子が「Ｕ００３」であるユーザ端末２ｃに送信する。

　端末識別子が「Ｕ００３」であるユーザ端末２ｃの端末受信部（図示せず）が、ファイル名が「Ｆ００２．ｈｔｍ」である保険情報のファイルを受信すると、端末表示部（図示せず）が、この保険情報を、モニタに表示する。

　図１２（ａ）は、ユーザ端末２ｂが表示する保険情報の表示例を示す図である。ここでは、例えば、がん保険についての情報がユーザ端末２ｃのモニタに表示されるものとする。

　また、例えば、保険情報取得部１１１は、図７（ｂ）に示す上から２番目のレコードから、「保険情報」の値であるファイル名「Ｆ００１．ｈｔｍ」と、「端末ＩＤ」の値「Ｕ００４」とを取得し、ファイル名が「Ｆ００１．ｈｔｍ」である保険情報のファイルを、提案格納部１１０から読み出して、端末識別子が「Ｕ００４」であるユーザ端末２ｄに送信する。

　端末識別子が「Ｕ００４」であるユーザ端末２ｃの端末受信部（図示せず）が、ファイル名が「Ｆ００１．ｈｔｍ」である保険情報のファイルを受信すると、端末表示部（図示せず）が、この保険情報を、モニタに表示する。

　図１２（ｂ）は、ユーザ端末２ｄが表示する保険情報の表示例を示す図である。ここでは、例えば、医療保険についての情報がユーザ端末２ｄのモニタに表示されるものとする。

　以上、本実施の形態によれば、ユーザ端末から送信された画像から取得したバイタル情報に対応する情報を送信することにより、ウェブ会議に参加しているユーザの状態を容易に把握できる。

　（実施の形態２）
　本実施の形態において、ウェブ会議中の１以上の各ユーザのバイタル情報を取得し、当該バイタル情報とウェブ会議における画像とを対応付けて蓄積する情報処理装置について説明する。

　また、本実施の形態において、ウェブ会議中のユーザの発話を音声認識し、取得されたテキストである会話テキストもバイタル情報に対応付けて蓄積する情報処理装置について説明する。なお、会話テキストは、通常、発話したユーザのユーザ識別子に対応付けられて蓄積される。

　また、本実施の形態において、ユーザの発話の通訳の音声情報、または当該音声情報を音声認識した通訳テキストもバイタル情報に対応付けて蓄積する情報処理装置について説明する。

　また、本実施の形態において、通訳者の通訳を聞くユーザのバイタル情報を用いて、通訳者の評価を行う情報処理装置について説明する。なお、かかる評価は、例えば、通訳の原言語の発話を聞くユーザのバイタル情報と、目的言語の通訳の結果を聞くユーザのバイタル情報との比較に基づく。

　また、本実施の形態において、発話者の発話を聞いたユーザのバイタル情報が着目条件を満たす場合に、発話者のユーザ識別子と、発話の聞き手のユーザのユーザ識別子とを対応付ける情報処理装置について説明する。

　また、本実施の形態において、１または２以上のユーザのバイタル情報を統計処理し、処理結果を出力する情報処理装置について説明する。なお、統計処理は、例えば、ユーザごとのバイタル情報の統計処理、ユーザ属性値ごとのバイタル情報の統計処理、ウェブ会議全体のバイタル情報の統計処理である。

　また、本実施の形態において、着目条件を満たすバイタル情報が取得された画像を含むユーザ領域が他のユーザ領域と視覚的に異なるような画面画像を出力する情報処理装置について説明する。

　さらに、本実施の形態において、バイタル情報やテキストや統計処理の結果を用いて、ウェブ会議における画像の検索が可能な情報処理装置について説明する。

　なお、本実施の形態において、情報Ｘが情報Ｙに対応付いていることは、情報Ｘから情報Ｙを取得できること、または情報Ｙから情報Ｘを取得できることであり、その対応付けの方法は問わない。情報Ｘと情報Ｙとがリンク付いていても良いし、同じバッファに存在していても良いし、情報Ｘが情報Ｙに含まれていても良いし、情報Ｙが情報Ｘに含まれている等でも良い。

　図１３は、本実施の形態における情報システム２０００の概念図である。情報システム２０００は、情報処理装置３、２以上のユーザ端末４、および１または２以上の通訳者端末５を備える。

　情報処理装置３は、２以上のユーザによるウェブ会議を支援するための装置である。情報処理装置３は、ウェブ会議における１または２以上のユーザ端末４から送信された画像、とユーザのバイタル情報とを対応付けて蓄積する。情報処理装置３は、ウェブ会議の機能を有することは好適であるが、ウェブ会議の機能を有さなくても良い。ウェブ会議の機能とは、例えば、Zoom、Teams（登録商標）が有する機能である。

　ここでのウェブ会議は、ネットワークを介して接続された複数の端末を利用して行われるセミナー、授業、医者による１または２以上の患者の診察等も含む概念である。なお、ウェブ会議の内容は問わない。情報処理装置３は、サーバ１の機能の全部または一部を実現できることは好適である。

　実施の形態１において、サーバ１は、画像からバイタル情報を取得する処理を行ったが、ウェブ会議システム１０００や情報システム２０００において、ユーザ端末２やユーザ端末４がウェブ会議における画像からバイタル情報を取得しても良い。かかる場合、サーバ１、情報処理装置３は、ユーザ端末２またはユーザ端末４から、画像に対応付けて、バイタル情報を受信する。ユーザ端末２やユーザ端末４は、センサ（例えば、心拍センサ、血圧センサ等）が取得した１または２種類以上のバイタル情報をサーバ１または情報処理装置３に送信しても良い。

　情報処理装置３は、いわゆるサーバである。情報処理装置３は、例えば、クラウドサーバやＡＳＰサーバであるが、その種類は問わない。

　ユーザ端末４は、ウェブ会議に参加するユーザが使用する端末である。通訳者端末５は、ユーザの発話を翻訳する通訳者が使用する端末である。通訳者は、通常、人であるが、音声翻訳を行う装置でも良い。なお、かかる翻訳は、同時通訳であることは好適である。ユーザ端末４、および通訳者端末５は、例えば、いわゆるパソコン、タブレット端末。スマートフォンであるが、その種類は問わない。

　情報処理装置３と２以上の各ユーザ端末４、および情報処理装置３と１または２以上の各通訳者端末５とは、インターネットやＬＡＮ等のネットワークにより、通信可能である。

　図１４は、本実施の形態における情報システム２０００のブロック図である。図１５は、情報処理装置３のブロック図である。

　情報処理装置３は、格納部３１、受信部３２、処理部３３、および出力部３４を備える。

　格納部３１は、情報格納部３１１を備える。受信部３２は、情報受信部３２１、通訳情報受信部３２２、および検索受付部３２３を備える。処理部３３は、バイタル取得部３３０、テキスト取得部３３１、通訳情報取得部３３２、判断部３３３、関係検出部３３４、蓄積画像取得部３３５、蓄積部３３６、通訳評価部３３８、統計処理部３３７、および検索部３３９を備える。出力部３４は、画面出力部３４１、関係出力部３４２、評価出力部３４３、および結果出力部３４４を備える。

　ユーザ端末４は、ユーザ格納部４１、ユーザ受付部４２、ユーザ処理部４３、ユーザ送信部４４、ユーザ受信部４５、およびユーザ出力部４６を備える。

　通訳者端末５は、通訳者格納部５１、通訳者受信部５２、通訳者処理部５３、通訳者出力部５４、通訳者受付部５５、および通訳者送信部５６を備える。

　情報処理装置３を構成する格納部３１には、各種の情報が格納される。各種の情報は、例えば、特定情報、各種の条件、情報格納部３１１に格納される情報である。各種の条件は、例えば、１または２以上の着目条件、１または２以上の出力条件、１または２以上の減点条件である。

　減点条件とは、通訳者の評価を減じるための条件である。減点条件は、通訳者の通訳音声を聞くユーザのバイタル情報に基づく条件である。減点条件は、例えば、通訳者の通訳音声を聞くユーザのバイタル情報と、ユーザの人数または割合いとに関する条件である。減点条件は、例えば、「心拍数が閾値以上（例えば、不快な感情を抱いている）であるユーザが存在すること」「心拍数が第一閾値以上であるユーザ数が第二閾値以上であること」「心拍数が第一閾値未満（寝ている）であるユーザが存在すること」「心拍数が第一閾値未満であるユーザの割合いが第二閾値以上であること」である。

　情報格納部３１１には、各種の情報が格納される。各種の情報は、蓄積画像、バイタル情報、音声情報、会話テキスト、通訳音声情報、通訳テキストである。蓄積画像は、２以上の各ユーザ端末４から受信された画像のうちの１または２以上の画像、または２以上の各ユーザ端末４から受信された２以上の画像に基づく画像を含む。２以上の画像に基づく画像は、例えば、２以上の画像を合成した画像である。蓄積画像は、２以上の各ユーザ端末４から受信された画像のうちの１または２以上の画像、および２以上の各ユーザ端末４から受信された２以上の画像に基づく画像であっても良い。なお、画像は、動画像であっても静止画像であってもよい。情報格納部３１１の蓄積画像は、通常、時系列の画像である。時系列の画像は、例えば、動画像であってもよく、時系列に沿って送信される複数の静止画像であってもよい。

　蓄積画像には、付加情報が対応付いていることは好適である。蓄積画像と、当該蓄積画像に対応付く付加情報は、各々、概ね同じ時に取得された情報である。なお、付加情報とは、ウェブ会議における付加的な情報である。付加情報は、バイタル情報、バイタル情報の処理結果、会話テキスト、通訳音声情報、通訳テキストのうちの１または２以上の情報である。バイタル情報の処理結果は、バイタル情報を解析した結果を示す情報、バイタル情報の統計処理結果である。バイタル情報の処理結果は、例えば、「緊張」「ネガティブ」「ポジティブ」である。

　受信部３２は、各種の情報を受信する。各種の情報は、例えば、ユーザ情報、画像、付加情報、バイタル情報、音声情報、通訳音声情報、会話テキスト、通訳テキストである。

　情報受信部３２１は、ウェブ会議中の２以上の各ユーザの各ユーザ端末４が送信した画像を含むユーザ情報を受信する。情報受信部３２１は、例えば、ウェブ会議中の２以上の各ユーザの各ユーザ端末４から、画像を含むユーザ情報を、順次、受信する。情報受信部３２１は、例えば、ウェブ会議中の２以上の各ユーザの各ユーザ端末４から画像を受信した図示しないサーバから、ユーザ情報を受信しても良い。情報受信部３２１は、通常、ユーザ識別子に対応付けてユーザ情報を受信する。かかるユーザ識別子は、ユーザ情報を送信したユーザ端末４のユーザの識別子である。

　ユーザ情報は、通常、音声情報も含む。音声情報は、ユーザがウェブ会議中に発話した音声の情報である。ユーザ情報は、例えば、ユーザ端末４で取得されたバイタル情報を含む。ユーザ情報は、例えば、ユーザの発話に基づく音声情報に対して音声認識処理が行われて取得された会話テキストを含む。

　バイタル情報は、上述した通りであるが、呼吸、体温、血圧、意識レベル、心拍変動、交感神経、副交感神経、またはＬＦ（低周波）／ＨＦ（高周波）のうちの１以上の情報であることは好適である。

　通訳情報受信部３２２は、ウェブ会議中のユーザの発話に対する通訳音声情報または通訳音声情報から取得された通訳テキストである通訳情報を受信する。通訳情報受信部３２２は、通訳音声情報と通訳テキストとを含む通訳情報を受信しても良い。通訳情報受信部３２２は、通常、１または２以上の各通訳者端末５から通訳情報を受信する。

　検索受付部３２３は、検索条件を受け付ける。検索受付部３２３は、通常、ユーザ端末４から検索条件を受け付ける。検索条件は、例えば、画像を検索するための条件である。検索条件は、例えば、バイタル情報、音声情報、会話テキスト、通訳テキストを検索するための条件でも良い。検索条件は、通常、付加情報に関する情報である。

　ここでは、受け付けとは、通常、有線もしくは無線の通信回線を介して送信された情報の受信であるが、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念であっても良い。

　処理部３３は、各種の処理を行う。各種の処理は、例えば、バイタル取得部３３０、テキスト取得部３３１、通訳情報取得部３３２、蓄積部３３６、判断部３３３、関係検出部３３４、蓄積画像取得部３３５、通訳評価部３３８、統計処理部３３７、検索部３３９が行う処理である。

　バイタル取得部３３０は、ウェブ会議を行う２以上のユーザ中の１以上の各ユーザのバイタル情報を取得する。バイタル取得部３３０は、通常、ユーザ識別子に対応付けて、当該ユーザ識別子で識別されるユーザの１以上のバイタル情報を取得する。

　バイタル取得部３３０は、通常、画像に対応付けて、１以上のバイタル情報を取得する。かかる１以上のバイタル情報は、例えば、対応付く画像から取得されたバイタル情報、または対応付く画像が撮影された時に取得されたバイタル情報である。画像が撮影された時とバイタル情報が発生した時は一致することが好適であるが、多少のずれがあっても良い。なお、多少のずれの間隔は問わない。

　バイタル取得部３３０は、例えば、ユーザ端末４から受信されたユーザ情報に含まれるバイタル情報を取得する。かかるバイタル情報は、ユーザ端末４が取得したバイタル情報である。ユーザ端末４からバイタル情報が受信される場合、ユーザ端末４は画像に含まれるユーザの人物領域から取得した１以上のバイタル情報を送信しても良いし、センサが取得した１以上のバイタル情報を送信しても良い。

　バイタル取得部３３０は、例えば、１以上の各ユーザ端末４から受信されたユーザ情報に含まれる画像に含まれるユーザの人物領域から、ユーザの１以上のバイタル情報を取得しても良い。かかる処理は、情報取得部１０２の処理と同様である。

　テキスト取得部３３１は、音声情報から取得される会話テキストを取得する。テキスト取得部３３１は、通常、ユーザ識別子に対応付けて、会話テキストを取得する。かかるユーザ識別子は、音声情報の元になった発話を行ったユーザの識別子である。テキスト取得部３３１は、通常、画像や音声情報に対応付けて、会話テキストを取得する。

　テキスト取得部３３１は、例えば、受信された音声情報に対して音声認識処理を行い、会話テキストを取得する。

　テキスト取得部３３１は、例えば、ユーザ端末４から受信されたユーザ情報に含まれる会話テキストを取得する。かかる場合、ユーザ端末４が、通常、ユーザの発話に対応する音声情報を取得し、当該音声情報に対して音声認識処理を行い、会話テキストを取得し、当該会話テキストを情報処理装置３に送信する。

　通訳情報取得部３３２は、通訳情報を取得する。通訳情報とは、通訳音声情報、通訳テキストのうちの１または２種類の情報である。通訳音声情報とは、ユーザの発話に対する通訳の結果の音声情報である。通訳音声情報は、通常、通訳者端末５から送信される情報である。

　通訳情報取得部３３２は、通訳情報受信部３２２が受信した通訳音声情報を取得する。通訳情報取得部３３２は、例えば、取得した通訳音声情報に対して音声認識処理を行って、通訳テキストを取得するが、通訳情報受信部３２２が受信した通訳テキストを取得しても良い。つまり、通訳音声情報に対する音声認識処理は、通訳情報取得部３３２が行っても良いし、通訳者端末５が行っても良い。

　通訳情報取得部３３２が取得する通訳情報は、通常、画像や音声情報に対応付いている。かかる画像は、通訳情報の元になった音声情報と同じタイミングで取得された画像である。なお、同じタイミングとは、完全に一致するタイミングであることは好適であるが、完全に一致するタイミングでなくても良い。

　判断部３３３は、バイタル取得部３３０が取得したバイタル情報が、着目条件に合致するか否かを判断する。

　判断部３３３は、例えば、ユーザが発話していないタイミングにおける当該ユーザのバイタル情報が、着目条件に合致するか否かを判断する。

　着目条件とは、ユーザの１以上のバイタル情報に関する条件である。着目条件は、例えば、関係情報を取得するための条件である。着目条件は、例えば、ユーザに対応するユーザ領域を、他のユーザ領域に対して視覚的に区別可能とした画面画像を構成するか判断するための条件である。

　なお、画面画像とは、ユーザ端末４の画面に出力される画像である。画面画像は、ユーザ端末４の画面に出力される画像を構成するための情報でも良い。画面画像は、蓄積画像と同じであることは好適であるが、異なる画像であっても良い。画面画像は、例えば、２以上のユーザ領域をタイル状に配列した画像である。画面画像は、例えば、情報受信部３２１が２以上のユーザ端末４からそれぞれ受信されるすべての画像をタイル状に配列した画像であっても良いし、特定のユーザ（例えば、診察を行う医師）のユーザ端末４から受信される画像を除いた１以上の画像を配列した画像等であっても良い。

　関係検出部３３４は、判断部３３３が着目条件に合致すると判断したバイタル情報に対する第一ユーザ識別子と、当該タイミングにおける発話者の第二ユーザ識別子とを対応付ける関係情報を取得する。当該タイミングとは、バイタル情報が取得されたタイミングである。

　なお、かかる着目条件は、例えば、１または２種類以上のバイタル情報がネガティブな感情であると推定されるバイタル情報であることを判断するための条件である。かかる着目条件は、例えば、「脈拍数が閾値以上または閾値より多い」「血圧が閾値以上または閾値より高い」「ＬＦ／ＨＦが閾値以上または閾値よりおお大きい」である。

　関係検出部３３４は、例えば、判断部３３３が着目条件に合致すると判断したバイタル情報と対になるユーザ識別子である１または２以上の第一ユーザ識別子を取得する。また、関係検出部３３４は、例えば、当該バイタル情報と対になる音声情報に対応するユーザ識別子を第二ユーザ識別子として取得する。そして、関係検出部３３４は、例えば、第一ユーザ識別子と第二ユーザ識別子とを対応付ける関係情報を構成する。なお、関係情報は、例えば、1以上の第一ユーザ識別子と第二ユーザ識別子とを有する。

　着目条件がネガティブな感情であると推定されるバイタル情報を特定する条件である場合、当該関係情報は不良な関係である二人のユーザを特定する情報である。かかる状況を確認し、例えば、当該二人のユーザを同じプロジェクトに配属しないようにする、といったことが可能になる。着目条件がポジティブな感情であると推定されるバイタル情報を特定する条件である場合、当該関係情報は良好な関係である二人のユーザを特定する情報である。かかる状況を確認し、例えば、当該二人のユーザを同じチームで仕事をさせるようにする、といったことが可能になる。

　蓄積画像取得部３３５は、蓄積画像を取得する。蓄積画像とは、バイタル情報に対応付けて蓄積される画像である。蓄積画像は、通常、Ｗｅｂ会議中にユーザ端末４で出力される画面画像である。ただし、蓄積画像は、２以上の各ユーザ端末４から受信された画像でも良い。蓄積画像は、画面画像と２以上の各ユーザ端末４から受信された画像の両方でも良い。

　蓄積画像取得部３３５は、例えば、２以上の各ユーザ端末４から受信された画像に基づく画像である画面画像を取得する。蓄積画像取得部３３５は、例えば、２以上の各ユーザ端末４から受信された画像を取得する。

　蓄積部３３６は、バイタル取得部３３０が取得した１以上の各ユーザのバイタル情報と、蓄積画像取得部３３５が取得した蓄積画像とを、対応付けて蓄積する。バイタル情報と蓄積画像との対応付けは、通常、各々、同様のタイミングにおけるバイタル情報と蓄積画像との対応付けである。同様のタイミングとは、一致するタイミングであることは好適であるが、少しのずれは許容するものとする。

　蓄積部３３６は、通常、バイタル取得部３３０が取得したバイタル情報を、情報受信部３２１が受信した時系列の画像であって、当該バイタル情報の取得に利用した期間内の時系列の画像と対応付けて蓄積する。

　蓄積部３３６は、例えば、テキスト取得部３３１が取得した会話テキストを蓄積画像に対応付けて蓄積する。なお、対応付く会話テキストと蓄積画像とは、各々、同様のタイミングで発話された音声と撮影された画像に基づく。

　蓄積部３３６は、例えば、１または２以上の各会話テキストをユーザ識別子に対応付けて蓄積する。ここでのユーザ識別子は、当該会話テキストの元になる音声を発話をしたユーザの識別子である。

　蓄積部３３６は、例えば、通訳情報取得部３３２が取得した通訳情報を蓄積画像に対応付けて蓄積する。通訳情報は、通訳音声情報または通訳テキストのうちの１種類以上の情報である。対応付く通訳情報と蓄積画像とは、各々、同様のタイミングで発話された会話に対する通訳と撮影された画像に基づく。

　統計処理部３３７は、１以上のユーザのバイタル情報を統計処理し、処理結果を取得する。

　統計処理部３３７は、ユーザ識別子ごと、またはユーザ識別子と対になるユーザ属性値ごとに、バイタル情報を統計処理し、処理結果を取得する。なお、ユーザ属性値ごととは、ユーザ属性値の条件ごと、と言っても良い。統計処理部３３７は、ウェブ会議全体のバイタル情報を統計処理し、処理結果を取得しても良い。

　統計処理部３３７は、例えば、１以上の各ユーザ識別子と対になるバイタル情報（例えば、血圧、脈拍数）の集合を取得する。次に、統計処理部３３７は、例えば、１以上の各ユーザ識別子ごとに、バイタル情報の集合の代表値を取得する。なお、代表値は、例えば、平均値、中央値、最低値、最高値である。

　統計処理部３３７は、例えば、ユーザ識別子と対になるユーザ属性値ごと（例えば、「男性」「女性」）に、当該ユーザ属性値対になるバイタル情報（例えば、血圧、脈拍数）の集合を取得する。次に、統計処理部３３７は、例えば、１以上の各ユーザ属性値ごとに、バイタル情報の集合の代表値を取得する。なお、代表値は、例えば、平均値、中央値、最低値、最高値である。また、ユーザ属性値は、例えば、性別、目的言語が原言語か、年齢、年齢層、部署である。

　通訳評価部３３８は、通訳の音声を聞く１以上の各ユーザのバイタル情報を用いて、通訳者の評価を示す評価情報を取得する。なお、通訳者は、通常、同時通訳者である。ただし、通訳者は、音声翻訳を行う図示しない装置でも良い。

　通訳評価部３３８は、例えば、通訳の対象の発話の言語である原言語に対応する１以上の各ユーザの時系列のバイタル情報を取得する。次に、通訳評価部３３８は、例えば、単位期間（例えば、５秒、１分）ごとに、１以上の各ユーザのバイタル情報の集合が減点条件に合致するか否かを判断する。次に、通訳評価部３３８は、例えば、減点条件に合致する単位期間の数を取得する。次に、通訳評価部３３８は、例えば、減点条件に合致する単位期間の数が多いほど、低い評価を示す評価情報を取得する。通訳評価部３３８は、例えば、減点条件に合致する単位期間の数をパラメータとする減少関数により、評価情報を算出する。

　なお、減点条件は、例えば、「一の単位期間における血圧と平常時（例えば、ウェブ会議の開始時）の血圧との差異の平均値が第一閾値以上であるユーザの割合いが第二閾値以上であること」「一の単位期間における脈拍数と平常時（例えば、ウェブ会議の開始時）の脈拍数との差異の平均値が第一閾値以上であるユーザの割合いが第二閾値以上であること」「脈拍数が第一閾値以下のユーザが第二閾値の割合い以上、存在すること」である。

　通訳評価部３３８は、通訳の対象の発話の言語である原言語に対応する１以上のユーザのバイタル情報と、通訳の目的言語に対応する１以上のユーザのバイタル情報とを用いて、評価情報を取得する。

　通訳評価部３３８は、例えば、一の期間での原言語に対応する１以上のユーザのバイタル情報と、当該一の期間での目的言語に対応する１以上のユーザのバイタル情報との差異に関する情報が減点条件に合致する場合に、当該一の期間の翻訳は上手くなかった、と判断する。そして、通訳評価部３３８は、例えば、減点条件に合致する期間の数を取得する。次に、通訳評価部３３８は、例えば、減点条件に合致する単位期間の数が多いほど、低い評価を示す評価情報を取得する。

　なお、減点条件は、例えば、一の期間での原言語に対応する１以上のユーザのバイタル情報（例えば、血圧、脈拍数、呼吸数）の平均値と、当該一の期間での目的言語に対応する１以上のユーザのバイタル情報（例えば、血圧、脈拍数、呼吸数）の平均値との差異が閾値以上または閾値より大きいことである。

　原言語に対応するユーザとは、発話者の発話をそのまま聞くユーザである。目的言語に対応するユーザとは、通訳された音声を聞くユーザである。

　通訳評価部３３８は、例えば、統計処理部３３７が取得した処理結果を用いて、通訳者の評価を示す評価情報を取得する。

　通訳評価部３３８は、通訳の音声を聞く１以上の各ユーザのバイタル情報に基づいて、通訳者の評価を示す評価情報を取得すれば良く、そのアルゴリズムは問わない。

　検索部３３９は、蓄積部３３６が蓄積した蓄積画像の中で、検索条件に合致する付加情報に対応付く蓄積画像を検知し、蓄積画像または蓄積画像から取得される画像を出力する。検索条件は、例えば、付加情報に関する条件、バイタル情報に関する条件、会話テキストに関する条件、通訳テキストに関する条件、またはこれらの組み合わせの条件である。

　検索部３３９は、例えば、情報格納部３１１を参照し、検索条件に合致する付加情報に対応付く蓄積画像を取得する。検索部３３９は、例えば、情報格納部３１１を参照し、検索条件に合致する付加情報に対応付く蓄積画像の中の箇所を示す情報を取得する。蓄積画像の中の箇所を示す情報は、例えば、ウェブ会議全体の画像である蓄積画像の中のオフセットである。オフセットは、動画の中の箇所を示す情報であり、例えば、時刻、フレーム数である。

　検索部３３９は、例えば、検索条件に合致する付加情報を情報格納部３１１から検索し、当該付加情報と対になる蓄積画像を取得し、当該蓄積画像を出力する。検索部３３９は、例えば、検索条件に合致する付加情報を情報格納部３１１から検索し、当該付加情報と対になる蓄積画像を取得し、当該付加情報と当該蓄積画像とを出力する。

　なお、ここでの出力とは、通常、ユーザ端末４への送信である。ただし、出力は、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念であっても良い。

　出力部３４は、各種の情報を出力する。各種の情報は、例えば、画面画像、関係情報、評価情報、処理結果である。

　なお、ここでの出力とは、通常、ユーザ端末４への送信である。ただし、出力は、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、記録媒体への蓄積、他の処理装置（例えば、通訳者端末５）や他のプログラムなどへの処理結果の引渡しなどを含む概念であっても良い。

　画面出力部３４１は、ウェブ会議中の２以上の各ユーザのユーザ領域を含む画面画像を出力する。画面出力部３４１は、蓄積画像取得部３３５が取得した画面画像を出力する。

　画面出力部３４１は、判断部３３３が着目条件に合致すると判断したバイタル情報に対応するユーザのユーザ領域を他のユーザのユーザ領域と視覚的に区別可能な態様の画面を出力することは好適である。

　画面出力部３４１は、通常、画面画像をユーザ端末４に送信する。画面出力部３４１は、画面画像を通訳者端末５に送信しても良い。

　関係出力部３４２は、関係検出部３３４が取得した関係情報を出力する。関係出力部３４２は、関係情報を、当該関係情報に対応するタイミングにおける画像またはバイタル情報に対応付けて出力する。

　ここで、関係出力部３４２は、関係情報に対応するタイミングにおける画像またはバイタル情報に対応付けて、当該関係情報を蓄積することは好適である。

　評価出力部３４３は、通訳評価部３３８が取得した評価情報を出力する。評価出力部３４３は、例えば、評価情報を通訳者端末５に送信する。評価出力部３４３は、例えば、評価情報を蓄積する。評価出力部３４３は、例えば、評価情報を通訳者識別子と対にして蓄積する。評価情報の蓄積先は、例えば、格納部３１であるが、他の装置でも良く、問わない。

　結果出力部３４４は、統計処理部３３７が取得した処理結果を出力する。処理結果の蓄積先は、例えば、格納部３１であるが、他の装置でも良く、問わない。結果出力部３４４は、例えば、統計処理部３３７が取得した処理結果を、ウェブ会議の会議識別子と対にして蓄積する。

　ユーザ端末４は、ユーザを撮影可能なカメラ（図示せず）を具備する。ユーザ端末４は、通常、音声を取得するマイク（図示せず）を具備する。

　ユーザ端末４を構成するユーザ格納部４１には、各種の情報が格納される。各種の情報は、例えば、ユーザ識別子、画像、バイタル情報、音声情報、出力条件である。

　ここでの出力条件は、ユーザ処理部４３が取得したバイタル情報を情報処理装置３に送信して良いか否かを判断するための条件である。出力条件は、例えば、ユーザ処理部４３が取得するユーザの１以上のバイタル情報に関する条件である。ユーザのバイタル情報は、例えば、ユーザ受付部４２に有するカメラが撮影した画像から取得されるこのユーザ端末４を利用するユーザのバイタル情報である。

　出力条件は、例えば、数値や指標で表されるバイタル情報についての閾値である。例えば、出力条件は、心拍数が閾値以上であるという条件や、呼吸数が閾値以上であるという条件や、ＬＦ／ＨＦが示すストレスの指標となる値が、閾値以上であるという条件である。ユーザ格納部４１には、バイタル情報の種類ごとに異なる出力条件が格納されていてもよい。ユーザ格納部４１には、例えば、１または２以上の異なるバイタル情報についての出力条件が、バイタル情報の種類を識別するバイタル識別子と対応付けて格納されていてもよい。バイタル識別子は、例えば、バイタル名や、バイタルに割り当てられたコード等であってもよい。出力条件は、複数の種類のバイタル情報についての条件の組み合わせ（例えば、ＡＮＤ条件やＯＲ条件等）であってもよい。

　ユーザ受付部４２は、各種の情報や指示等を受け付ける。各種の情報や指示等とは、例えば、検索条件である。

　各種の情報や指示等の入力手段は、タッチパネルやキーボードやマウスやメニュー画面によるもの等、何でも良い。

　ユーザ処理部４３は、各種の処理を行う。各種の処理は、例えば、受け付けられた情報や指示等を、送信する構造の情報や指示等にする処理である。各種の処理は、例えば、受信された情報を出力する構造の情報にする処理である。

　ユーザ処理部４３は、例えば、図示しないカメラが撮影した画像に含まれるユーザの人物領域からユーザのバイタル情報を、当該画像に対応付けて取得する。かかる場合、ユーザ処理部４３は、情報取得部１０２の機能を有する。対応付く画像とバイタル情報とは、各々、同様のタイミングで取得された情報である。

　ユーザ処理部４３は、例えば、図示しないセンサが取得したユーザのバイタル情報を、当該画像に対応付けて取得する。なお、図示しないセンサは、例えば、血圧計、脈拍計、体温計である。対応付く画像とバイタル情報とは、各々、同様のタイミングで取得された情報である。

　ユーザ処理部４３は、例えば、マイクが集音したユーザの音声から音声情報を構成する。

　ユーザ処理部４３は、例えば、カメラが撮影した画像と、取得した音声情報と、取得した１または２以上のバイタル情報とを対応付ける。

　ユーザ処理部４３は、例えば、取得したバイタル情報が出力条件を満たすか否かを判断する。ユーザ処理部４３は、例えば、取得したバイタル情報が２以上のすべての出力条件を満たすか否かを判断する。ユーザ処理部４３は、例えば、取得したバイタル情報が２以上のいずれかの出力条件を満たすか否かを判断する。

　ユーザ送信部４４は、カメラが撮影した画像を情報処理装置３に送信する。ユーザ送信部４４は、ユーザ処理部４３が取得した音声情報を情報処理装置３に送信する。ユーザ送信部４４は、例えば、ユーザ処理部４３が取得したバイタル情報を情報処理装置３に送信する。ユーザ送信部４４は、例えば、対応付いた画像と音声情報とバイタル情報とを情報処理装置３に送信する。

　ユーザ送信部４４は、例えば、ユーザ処理部４３が出力条件を満たすと判断した１または２種類以上のバイタル情報を情報処理装置３に送信する。ユーザ送信部４４は、例えば、ユーザ処理部４３がすべての出力条件を満たすと判断した１または２種類以上のバイタル情報を情報処理装置３に送信する。ユーザ送信部４４は、例えば、ユーザ処理部４３がいずれかの出力条件を満たすと判断した１または２種類以上のバイタル情報を情報処理装置３に送信する。なお、ユーザ送信部４４は、取得されたすべてのバイタル情報を情報処理装置３に送信しても良い。

　ユーザ受信部４５は、各種の情報を受信する。各種の情報は、例えば、画面画像、音声情報、検索された蓄積画像または当該蓄積画像から取得される画像である。

　ユーザ出力部４６は、各種の情報を出力する。各種の情報は、例えば、ウェブ会議における画面画像、ウェブ会議における音声情報、検索された蓄積画像または当該蓄積画像から取得される画像である。

　通訳者端末５を構成する通訳者格納部５１には、各種の情報が格納される。各種の情報は、例えば、通訳者識別子である。通訳者識別子とは、通訳者を識別する情報である。通訳者識別子は、例えば、ＩＤ、氏名、メールアドレス、電話番号である。

　通訳者受信部５２は、各種の情報を受信する。各種の情報は、例えば、通訳対象（原言語）の音声情報、画面画像である。

　通訳者処理部５３は、各種の処理を行う。各種の処理は、例えば、受け付けられた情報や指示等を、送信する構造の情報や指示等にする処理である。各種の処理は、例えば、受信された情報を出力する構造の情報にする処理である。

　通訳者処理部５３は、例えば、受け付けられた通訳音声から通訳音声情報を構成する。

　通訳者処理部５３は、例えば、構成した通訳音声情報に対して音声認識処理を行い、通訳テキストを取得する。

　通訳者出力部５４は、各種の情報を出力する。各種の情報は、例えば、音声情報に基づく音声、画面画像に基づく画面である。音声は、通常、通訳対象の音声である。

　通訳者受付部５５は、各種の情報や指示を受け付ける。各種の情報や指示は、例えば、通訳音声である。通訳者受付部５５は、例えば、マイクにより実現される。

　通訳者送信部５６は、各種の情報や指示等を情報処理装置３に送信する。各種の情報や指示等は、例えば、通訳音声情報、通訳テキストである。

　格納部３１、情報格納部３１１、ユーザ格納部４１、および通訳者格納部５１は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。

　格納部３１等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部３１等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部３１等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部３１等で記憶されるようになってもよい。

　受信部３２、情報受信部３２１、通訳情報受信部３２２、検索受付部３２３、ユーザ受信部４５、および通訳者受信部５２は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。

　処理部３３、バイタル取得部３３０、テキスト取得部３３１、通訳情報取得部３３２、蓄積部３３６、判断部３３３、関係検出部３３４、蓄積画像取得部３３５、通訳評価部３３８、統計処理部３３７、検索部３３９、ユーザ処理部４３、および通訳者処理部５３は、通常、プロセッサやメモリ等から実現され得る。処理部３３等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。なお、プロセッサは、ＣＰＵ、ＭＰＵ、ＧＰＵ等であり、その種類は問わない。

　出力部３４、画面出力部３４１、関係出力部３４２、評価出力部３４３、結果出力部３４４、ユーザ送信部４４、および通訳者送信部５６は、通常、無線または有線の通信手段で実現される。

　画面出力部３４１、関係出力部３４２、評価出力部３４３、および結果出力部３４４は、プロセッサやメモリ等から実現されても良い。なお、プロセッサは、ＣＰＵ、ＭＰＵ、ＧＰＵ等であり、その種類は問わない。

　ユーザ受付部４２、および通訳者受付部５５は、マイク、カメラ、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。

　ユーザ出力部４６、および通訳者出力部５４は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。ユーザ出力部４６は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。

　次に、情報システム２０００の動作例について説明する。まず、情報処理装置３の動作例について、図１６、図１７のフローチャートを用いて説明する。

　（ステップＳ１６０１）情報処理装置３は、ウェブ会議を開始するか否かを判断する。ウェブ会議を開始する場合はステップＳ１６０２に行き、開始しない場合はステップＳ１６１９に行く。なお、例えば、受信部３２がウェブ会議の開始指示を受信した場合に、ウェブ会議を開始すると判断される。

　（ステップＳ１６０２）情報受信部３２１は、１または２以上の各ユーザ端末４または通訳者端末５から、ユーザ情報等を受信したか否かを判断する。ユーザ情報等を受信した場合はステップＳ１６０３に行き、ユーザ情報等を受信しなかった場合はステップＳ１６１７に行く。なお、情報受信部３２１は、通常、ユーザ識別子に対応付けて、ユーザ情報等を受信する。また、ユーザ情報等は、通訳情報でも良い。

　（ステップＳ１６０３）処理部３３は、ステップＳ１６０２で受信されたユーザ情報等を、送信した端末を識別する識別子と対にして、一時蓄積する。なお、識別子は、例えば、ユーザ識別子、通訳者識別子である。

　（ステップＳ１６０４）処理部３３は、ステップＳ１６０２で受信されたユーザ情報等から、１または２以上の各ユーザ識別子に対応付くバイタル情報を取得する。なお、ここでバイタル情報を取得できない場合があっても良い。また、取得したバイタル情報は、２以上の時系列のバイタル情報でも良い。時系列のバイタル情報とは、取得された時刻が異なるバイタル情報である。時系列のバイタル情報は、通常、連続して取得された２以上のバイタル情報である。連続して取得された２以上のバイタル情報は、時間的な間隔が空いて取得されたバイタル情報でも良い。

　（ステップＳ１６０５）判断部３３３は、ステップＳ１６０４で取得された１または２以上の各ユーザ識別子に対応付くバイタル情報が、１または２以上の各着目条件に合致するか否かを判断する。着目条件に合致するバイタル情報が存在する場合はステップＳ１６０６に行き、存在しない場合はステップＳ１６０７に行く。

　（ステップＳ１６０６）判断部３３３は、着目条件に合致するバイタル情報と対になる１以上のユーザ識別子を図示しないバッファに蓄積する。なお、２以上の着目条件が存在する場合、判断部３３３は、着目条件を識別する条件識別子に対応付けて、１以上のユーザ識別子を図示しないバッファに蓄積することは好適である。

　（ステップＳ１６０７）テキスト取得部３３１は、ステップＳ１６０２で受信された１または２以上の各ユーザ情報等から会話テキストを、ユーザ識別子と対にして取得する。テキスト取得部３３１は、例えば、受信された１または２以上の各ユーザ情報等に含まれる音声情報に対して音声認識処理を行い、１以上の各ユーザの会話テキストを、ユーザ識別子と対にして取得する。テキスト取得部３３１は、例えば、受信された１または２以上の各ユーザ情報等に含まれる会話テキストを、ユーザ識別子と対にして取得する。

　（ステップＳ１６０８）蓄積画像取得部３３５は、２以上のユーザ端末４から送信された画像を用いて、画面画像を構成する。また、蓄積画像取得部３３５は、図示しないバッファに蓄積されたユーザ識別子で識別される画面上の領域を、他の領域と比較して、区別可能な画面画像を構成することは好適である。蓄積画像取得部３３５は、図示しないバッファに蓄積されたユーザ識別子で識別される画面上の領域を、着目条件を識別する条件識別子を特定できる態様にした画面画像を構成することは好適である。

　（ステップＳ１６０９）処理部３３は、画面画像と受信された音声情報とを有する会議情報を構成する。なお、かかる構成の処理は、公知のウェブ会議システムで行われている処理である。処理部３３は、通訳音声情報をも含む会議情報を構成することは好適である。処理部３３は、会話テキスト、または通訳テキストを含む会議情報を構成しても良い。なお、ここでの会議情報を構成する処理は、蓄積画像取得部３３５が行っても良い。また、会議情報は、ユーザ端末４で出力される情報である。

　（ステップＳ１６１０）出力部３４は、ステップＳ１６０９で構成された会議情報を２以上のユーザ端末４に送信する。また、出力部３４は、ステップＳ１６０９で構成された会議情報を１以上の通訳者端末５に送信することは好適である。

　（ステップＳ１６１１）通訳情報取得部３３２は、ステップＳ１６０２で受信されたユーザ情報等の中に、通訳情報が含まれるか否かを判断する。通訳情報が含まれる場合はステップＳ１６１２に行き、含まれない場合はステップＳ１６１４に行く。

　（ステップＳ１６１２）通訳情報取得部３３２は、ステップＳ１６０２で受信されたユーザ情報等の中の通訳音声情報を取得する。

　（ステップＳ１６１３）通訳情報取得部３３２は、通訳音声情報に基づく、通訳テキストを取得する。

　（ステップＳ１６１４）蓄積部３３６は、ステップＳ１６０８で取得された画面画像を含む蓄積画像を取得する。

　（ステップＳ１６１５）蓄積部３３６は、付加情報を取得する。蓄積部３３６は、例えば、ステップＳ１６０２で受信されたユーザ情報等の中に含まれる付加情報を取得する。なお、かかる付加情報は、例えば、１以上の各ユーザ識別子に対応付く１または２種類以上のバイタル情報、１以上の各ユーザ識別子に対応付く音声情報、通訳音声情報である。蓄積部３３６は、ステップＳ１６０２で受信されたユーザ情報等の中に含まれる音声情報を音声認識した結果である会話テキスト、ステップＳ１６０２で受信されたユーザ情報等の中に含まれる通訳音声情報を音声認識した結果である通訳テキストを含む付加情報を取得することは好適である。なお、付加情報の中の会話テキストはユーザ識別子に対応付いている。

　（ステップＳ１６１６）蓄積部３３６は、ステップＳ１６１４で取得した蓄積画像と、音声情報と、ステップＳ１６１５で取得した付加情報とを、対応付けて蓄積する。ステップＳ１６０２に戻る。なお、蓄積画像等の蓄積先は、例えば、情報格納部３１１であるが、他の装置でも良い。

　（ステップＳ１６１７）処理部３３は、ウェブ会議を終了するか否かを判断する。ウェブ会議を終了する場合はステップＳ１６１８に行き、終了しない場合はステップＳ１６０２に戻る。なお、ウェブ会議を終了する場合は，例えば、終了指示をユーザ端末４から受信した場合であるが、そのトリガーは問わない。

　（ステップＳ１６１８）処理部３３は、ウェブ会議の終了処理を行う。ステップＳ１６０１に戻る。なお、ウェブ会議の終了処理は、公知技術である。

　（ステップＳ１６１９）処理部３３は、統計処理のタイミングであるか否かを判断する。統計処理のタイミングであればステップＳ１６２０に行き、統計処理のタイミングでなければステップＳ１６２１に行く。なお、統計処理のタイミングは、例えば、ウェブ会議が終了したタイミング、ユーザからの指示を受信したこと等である。

　（ステップＳ１６２０）統計処理部３３７は、一のウェブ会議の蓄積画像に対応付いているバイタル情報に対して、統計処理を行う。統計処理の例について、図１８のフローチャートを用いて説明する。

　（ステップＳ１６２１）処理部３３は、通訳者評価を行うか否かを判断する。通訳者評価を行う場合はステップＳ１６２２に行き、通訳者評価を行わない場合はステップＳ１６２３に行く。なお、通訳者評価を行う場合は、例えば、ウェブ会議の開始後、所定時間が経過した時、ウェブ会議の開催中の所定時間ごと、ウェブ会議の終了後、ユーザからの指示を受信したこと等である。

　（ステップＳ１６２２）通訳評価部３３８は、一のウェブ会議における通訳者の評価処理を行う。評価処理の例について、図２２のフローチャートを用いて説明する。

　（ステップＳ１６２３）処理部３３は、関係検出を行うか否かを判断する。関係検出を行う場合はステップＳ１６２４に行き、関係検出を行わない場合はステップＳ１６２５に行く。なお、関係検出を行う場合は、例えば、ウェブ会議の終了後であるが、ユーザからの指示を受信した時等、そのタイミングやトリガーは問わない。

　（ステップＳ１６２４）関係検出部３３４は、関係検出処理を行う。関係検出処理の例について、図２３のフローチャートを用いて説明する。

　（ステップＳ１６２５）検索受付部３２３は、検索条件を受信したか否かを判断する。検索条件を受信した場合はステップＳ１６２６に行き、受信しなかった場合はステップＳ１６０１に戻る。

　（ステップＳ１６２６）検索部３３９は、検索処理を行う。検索処理の例について、図２４のフローチャートを用いて説明する。

　（ステップＳ１６２７）検索部３３９は、ステップＳ１６２６における検索結果である画像等をユーザ端末４に送信する。

　なお、図１６、図１７のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

　次に、ステップＳ１６２０の統計処理の例について、図１８のフローチャートを用いて説明する。

　（ステップＳ１８０１）統計処理部３３７は、カウンタｉに１を代入する。

　（ステップＳ１８０２）統計処理部３３７は、統計処理の対象のｉ番目のユーザ識別子が存在するか否かを判断する。ｉ番目のユーザ識別子が存在する場合はステップＳ１８０３に行き、存在しない場合はステップＳ１８０５に行く。

　（ステップＳ１８０３）統計処理部３３７は、ユーザ毎統計処理を行う。ユーザ毎統計処理の例について、図１９のフローチャートを用いて説明する。なお、ユーザ毎統計処理とは、一のユーザのバイタル情報の統計処理である。

　（ステップＳ１８０４）統計処理部３３７は、カウンタｉを１、インクリメントする。ステップＳ１８０２に戻る。

　（ステップＳ１８０５）統計処理部３３７は、カウンタｊに１を代入する。

　（ステップＳ１８０６）統計処理部３３７は、統計処理の対象のｊ番目のユーザ属性値の条件が存在するか否かを判断する。ｊ番目のユーザ属性値の条件が存在する場合はステップＳ１８０７に行き、存在しない場合はステップＳ１８０９に行く。

　（ステップＳ１８０７）統計処理部３３７は、ｊ番目のユーザ属性値の条件に合致する１または２以上のユーザのバイタル情報に対する統計処理を行う。かかる統計処理は、属性値毎統計処理である。属性値毎統計処理の例について、図２０のフローチャートを用いて説明する。

　（ステップＳ１８０８）統計処理部３３７は、カウンタｊを１、インクリメントする。ステップＳ１８０６に戻る。

　（ステップＳ１８０９）統計処理部３３７は、ウェブ会議統計処理を行う。上位処理にリターンする。ウェブ会議統計処理の例について、図２１のフローチャートを用いて説明する。なお、ウェブ会議統計処理とは、ウェブ会議における対象ユーザの全部のバイタル情報を用いた統計処理である。

　なお、統計処理部３３７は、取得した統計処理の結果は、通常、統計処理対象のウェブ会議の蓄積画像と対にして蓄積する。

　次に、ステップＳ１８０３のユーザ毎統計処理の例について、図１９のフローチャートを用いて説明する。

　（ステップＳ１９０１）統計処理部３３７は、カウンタｉに１を代入する。

　（ステップＳ１９０２）統計処理部３３７は、統計処理するｉ番目のバイタル情報が存在するか否かを判断する。統計処理するｉ番目のバイタル情報が存在する場合はステップＳ１９０３に行き、存在しない場合はステップＳ１９０５に行く。なお、統計処理するバイタル情報は、通常、予め決まっている。

　（ステップＳ１９０３）統計処理部３３７は、統計処理対象のウェブ会議のバイタル情報の中から、着目ユーザ識別子（Ｓ１８０２のｉ番目のユーザ識別子）と対になるｉ番目のバイタル情報をすべて取得する。次に、統計処理部３３７は、取得したすべてのバイタル情報の代表値を取得する。次に、統計処理部３３７は、着目ユーザ識別子と対にして、バイタル情報の代表値を格納部３１に蓄積する。かかるバイタル情報の代表値は、統計処理対象のウェブ会議の蓄積画像に対応付いている。また、バイタル情報の代表値は、例えば、平均値、中央値、最高値、最低値である。

　（ステップＳ１９０４）統計処理部３３７は、カウンタｉを１、インクリメントする。ステップＳ１９０２に戻る。

　（ステップＳ１９０５）統計処理部３３７は、カウンタｊに１を代入する。

　（ステップＳ１９０６）統計処理部３３７は、ｊ番目の着目条件が存在するか否かを判断する。ｊ番目の着目条件が存在する場合はステップＳ１９０７に行き、存在しない場合は上位処理にリターンする。なお、ここでの着目条件は、ウェブ会議中に発生した回数を測定したい着目条件である。着目条件は、例えば、「心拍数が第一閾値以上のユーザの割合いが第二閾値以上であったこと（例えば、興奮状態のユーザの割合いが第二閾値以上）」「心拍数が第一閾値未満のユーザの割合いが第二閾値以上であったこと（例えば、寝ているユーザの割合いが第二閾値以上」である。

　（ステップＳ１９０７）統計処理部３３７は、変数ｊを初期化する。つまり、変数ｊに０を代入する。

　（ステップＳ１９０８）統計処理部３３７は、カウンタｋに１を代入する。

　（ステップＳ１９０９）統計処理部３３７は、ウェブ会議のｋ番目の検査単位が存在するか否かを判断する。ｋ番目の検査単位が存在する場合はステップＳ１９１０に行き、存在しない場合はステップＳ１９１４に行く。なお、ウェブ会議のｋ番目の検査単位とは、着目条件を満たすか否かを判断するための対象のバイタル情報の集合であり、例えば、ウェブ会議中の所定時間（例えば、１分）の中でのバイタル情報の集合である。

　（ステップＳ１９１０）統計処理部３３７は、統計処理対象のウェブ会議のバイタル情報の中から、着目ユーザ識別子と対になるバイタル情報であり、ｋ番目の検査単位に対応するバイタル情報であり、ｊ番目の着目条件の判断に使用するバイタル情報を、すべて取得する。

　（ステップＳ１９１１）統計処理部３３７は、ステップＳ１９１０で取得したバイタル情報が、ｊ番目の着目条件に合致するか否かを判断する。ｊ番目の着目条件に合致する場合はステップＳ１９１２に行き、合致しない場合はステップＳ１９１３に行く。なお、かかる判断処理は、判断部３３３が行っても良い。

　（ステップＳ１９１２）統計処理部３３７は、変数ｊに１を加える。

　（ステップＳ１９１３）統計処理部３３７は、カウンタｋを１、インクリメントする。ステップＳ１９０９に戻る。

　（ステップＳ１９１４）統計処理部３３７は、変数ｊの値を、ｊ番目の着目条件と着目ユーザ識別子と対にして蓄積する。統計処理部３３７は、変数ｊの値を、通常、統計処理対象のウェブ会議の蓄積画像と対にして、格納部３１に蓄積する。

　（ステップＳ１９１５）統計処理部３３７は、カウンタｊを１、インクリメントする。ステップＳ１９０６に戻る。

　次に、ステップＳ１８０７の属性値毎統計処理の例について、図２０のフローチャートを用いて説明する。図２０のフローチャートにおいて、図１９のフローチャートと同一のステップについて、説明を省略する。

　（ステップＳ２００１）統計処理部３３７は、統計処理の対象のｊ番目のユーザ属性値の条件に対応するバイタル情報であり、統計処理の対象のｉ番目のバイタル情報をすべて取得する。統計処理部３３７は、取得したすべてのバイタル情報の代表値（例えば、平均値、最大値等）を取得し、ｊ番目のユーザ属性値の条件と対にして蓄積する。ステップＳ１９０４に行く。

　（ステップＳ２００２）統計処理部３３７は、統計処理の対象のｊ番目のユーザ属性値の条件に対応する変数ｊの値を、すべて取得する。統計処理部３３７は、取得したすべての変数ｊの値の代表値を取得する。

　（ステップＳ２００３）統計処理部３３７は、ステップＳ２００２で取得した代表値を、ｊ番目の着目条件と当該ユーザ属性値の条件と対にして、格納部３１に蓄積する。

　次に、ステップＳ１８０９のウェブ会議統計処理の例について、図２１のフローチャートを用いて説明する。図２１のフローチャートにおいて、図１９のフローチャートと同一のステップについて、説明を省略する。

　（ステップＳ２１０１）統計処理部３３７は、ウェブ会議全体のバイタル情報の中から、統計処理の対象のｉ番目のバイタル情報をすべて取得する。統計処理部３３７は、取得したすべてのバイタル情報の代表値（例えば、平均値、最大値等）を取得する。ステップＳ１９０４に行く。

　（ステップＳ２１０２）統計処理部３３７は、ウェブ会議全体の変数ｊの値のすべてを取得する。統計処理部３３７は、取得した変数ｊの値の代表値を取得する。

　（ステップＳ２１０３）統計処理部３３７は、ステップＳ２１０２で取得した変数ｊの値の代表値を、ｊ番目の着目条件と当該ウェブ会議の蓄積画像と対にして、格納部３１に蓄積する。ステップＳ１９１５に行く。

　次に、ステップＳ１６２２の評価処理の例について、図２２のフローチャートを用いて説明する。

　（ステップＳ２２０１）通訳評価部３３８は、カウンタｉに１を代入する。

　（ステップＳ２２０２）通訳評価部３３８は、ｉ番目の減点条件が存在するか否かを判断する。

　（ステップＳ２２０３）通訳評価部３３８は、ｉ番目の減点条件を格納部３１から取得する。

　（ステップＳ２２０４）通訳評価部３３８は、カウンタｊに１を代入する。

　（ステップＳ２２０５）通訳評価部３３８は、ｊ番目の検査単位が存在するか否かを判断する。ｊ番目の検査単位が存在する場合はステップＳ２２０６に行き、存在しない場合はステップＳ２２１０に行く。検査単位は、例えば、通訳音声情報が存在する区間である。

　（ステップＳ２２０６）通訳評価部３３８は、ｊ番目の検査単位に対応するバイタル情報であり、通訳音声を聞く１または２以上の各ユーザ（対象ユーザ）のバイタル情報であり、ｉ番目の減点条件の判断に使用されるバイタル情報を情報格納部３１１から取得する。

　（ステップＳ２２０７）通訳評価部３３８は、ステップＳ２２０６で取得したバイタル情報が、ｉ番目の減点条件に合致するか否かを判断する。ｉ番目の減点条件に合致する場合はステップＳ２２０８に行き、合致しない場合はステップＳ２２０９に行く。

　（ステップＳ２２０８）通訳評価部３３８は、ｉ番目の減点条件に対応する減点度（例えば、減点する点数）を取得し、図示しないバッファに蓄積する。なお、ｉ番目の減点条件に対応する減点度は、例えば、ｉ番目の減点条件に対応付けて、格納部３１で格納されているが、すべての減点条件に共通でも良い。

　（ステップＳ２２０９）通訳評価部３３８は、カウンタｊを１、インクリメントする。ステップＳ２２０４に戻る。

　（ステップＳ２２１０）通訳評価部３３８は、カウンタｉを１、インクリメントする。ステップＳ２２０２に戻る。

　（ステップＳ２２１１）通訳評価部３３８は、ステップＳ２２０８で図示しないバッファに蓄積された減点度の累積を取得する。通訳評価部３３８は、当該減点度の累積が多いほど、低い評価を示す評価情報を取得する。

　（ステップＳ２２１２）評価出力部３４３は、ステップＳ２２１１で取得された評価情報を出力する。上位処理にリターンする。ここで、評価出力部３４３は、例えば、評価情報を、翻訳者識別子と対にして、格納部３１に蓄積する。評価出力部３４３は、例えば、評価情報を、翻訳者識別子に対応する通訳者端末５に送信する。

　なお、図２２のフローチャートにおいて、通訳者は一人であることが前提であったが、２以上の通訳者の評価を行っても良い。かかる場合、通訳者ごとに、Ｓ２２０１からＳ２２１２の処理が繰り返し実行される。

　次に、ステップＳ１６２４の関係検出処理の例について、図２３のフローチャートを用いて説明する。

　（ステップＳ２３０１）関係検出部３３４は、カウンタｉに１を代入する。

　（ステップＳ２３０２）関係検出部３３４は、検査対象のウェブ会議の蓄積画像と対になる音声情報または会話テキストと対になるユーザ識別子を、ウェブ会議の時系列に検査し、ｉ番目の発話者の音声情報または会話テキストと対になるユーザ識別子が存在するか否かを判断する。ユーザ識別子が存在する場合はステップＳ２３０３に行き、存在しない場合は上位処理にリターンする。

　（ステップＳ２３０３）関係検出部３３４は、カウンタｊに１を代入する。

　（ステップＳ２３０４）関係検出部３３４は、ｉ番目の発話者のユーザ識別子に対応する音声情報または会話テキストに対応するバイタル情報であり、ｉ番目の発話者の発話を聞いているｊ番目のユーザ識別子に対応するバイタル情報が存在するか否かを判断する。ｊ番目のユーザ識別子に対応するバイタル情報が存在する場合はステップＳ２３０５に行き、存在しない場合はステップＳ２３１３に行く。なお、ｉ番目の発話者の発話を聞いているｊ番目のユーザ識別子に対応するバイタル情報が存在する場合は、通常、ｉ番目の発話者の発話を聞いているｊ番目のユーザ識別子が存在する場合である。

　（ステップＳ２３０５）関係検出部３３４は、ｉ番目の発話者の発話を聞いているｊ番目のユーザ識別子に対応するバイタル情報であり、ｉ番目の発話者の発話のタイミングにおけるバイタル情報を、情報格納部３１１から取得する。ｉ番目の発話者の発話のタイミングにおけるバイタル情報とは、ｉ番目の発話者の音声情報または会話テキストと対になる（タイミング的に同様である）バイタル情報である。なお、取得されるバイタル情報は、着目条件の判断に使用されるバイタル情報であり、１または２種類以上のバイタル情報である。

　（ステップＳ２３０６）関係検出部３３４は、カウンタｋに１を代入する。

　（ステップＳ２３０７）関係検出部３３４は、ｋ番目の着目条件が存在するか否かを判断する。ｋ番目の着目条件が存在する場合はステップＳ２３０８に行き、存在しない場合はステップＳ２３１２に行く。

　（ステップＳ２３０８）関係検出部３３４は、ステップＳ２３０５で取得した１または２種類以上のバイタル情報が、ｋ番目の着目条件に合致するか否かを判断する。ｋ番目の着目条件に合致する場合はステップＳ２３０９に行き、合致しない場合はステップＳ２３１１に行く。

　（ステップＳ２３０９）関係検出部３３４は、ｉ番目の発話者のユーザ識別子である第二ユーザ識別子と、ｊ番目のユーザ識別子である第一ユーザ識別子とを取得する。

　（ステップＳ２３１０）関係検出部３３４は、第一ユーザ識別子と第二ユーザ識別子とを対応付ける関係情報を構成する。関係検出部３３４は、当該関係情報を、蓄積画像に対応付けて、格納部３１に蓄積する。関係検出部３３４は、当該関係情報を、上記の音声情報または会話テキストに対応付けて、格納部３１に蓄積することは好適である。

　（ステップＳ２３１１）関係検出部３３４は、カウンタｋを１、インクリメントする。ステップＳ２３０７に戻る。

　（ステップＳ２３１２）関係検出部３３４は、カウンタｊを１、インクリメントする。ステップＳ２３０４に戻る。

　（ステップＳ２３１３）関係検出部３３４は、カウンタｉを１、インクリメントする。ステップＳ２３０２に戻る。

　次に、ステップＳ１６２６の検索処理の例について、図２４のフローチャートを用いて説明する。

　（ステップＳ２４０１）検索部３３９は、カウンタｉに１を代入する。

　（ステップＳ２４０２）検索部３３９は、蓄積画像に対応付く付加情報の集合の中で、ｉ番目のタイミングにおける付加情報が存在するか否かを判断する。ｉ番目のタイミングにおける付加情報が存在する場合はステップＳ２４０３に行き、存在しない場合は上位処理にリターンする。

　（ステップＳ２４０３）検索部３３９は、蓄積画像に対応付く付加情報の集合の中で、ｉ番目のタイミングにおける付加情報が、受信された検索条件に合致するか否かを判断する。検索条件に合致する場合はステップＳ２４０４に行き、合致しない場合はステップＳ２４０５に行く。

　（ステップＳ２４０４）検索部３３９は、蓄積画像におけるｉ番目のタイミングに、フラグを対応付ける。なお、かかるフラグは、ユーザ端末４で、フラグが付された箇所の蓄積画像にジャンプするためのフラグである。

　（ステップＳ２４０５）検索部３３９は、カウンタｉを１、インクリメントする。ステップＳ２４０２に戻る。

　次に、ユーザ端末４の動作例について、図２５のフローチャートを用いて説明する。

　（ステップＳ２５０１）ユーザ受付部４２は、ウェブ会議の開始指示を受け付けたか否かを判断する。開始指示を受け付けた場合はステップＳ２５０２に行き、受け付けなかった場合はステップＳ２５１３に行く。

　（ステップＳ２５０２）ユーザ処理部４３は、ユーザ格納部４１のユーザ識別子を取得し、当該ユーザ識別子を有する開始指示を構成する。ユーザ送信部４４は、当該開始指示を情報処理装置３に送信する。

　（ステップＳ２５０３）ユーザ受付部４２は、カメラを用いて、当該カメラで撮影した画像を取得する。

　（ステップＳ２５０４）ユーザ受付部４２は、マイクを用いて、当該マイクで集音した音声から音声情報を取得する。

　（ステップＳ２５０５）ユーザ処理部４３は、画像と音声情報とを有するユーザ情報を構成する。ここで、ユーザ処理部４３は、当該画像に含まれるユーザの人物領域からユーザの１または２種類以上のバイタル情報を取得し、当該１または２種類以上のバイタル情報を含むユーザ情報を構成することは好適である。

　（ステップＳ２５０６）ユーザ送信部４４は、ステップＳ２５０５で構成されたユーザ情報を情報処理装置３に送信する。

　（ステップＳ２５０７）ユーザ受信部４５は、情報処理装置３から会議情報を受信したか否かを判断する。会議情報を受信した場合はステップＳ２５０８に行き、受信しなかった場合はステップＳ２５０７に戻る。

　（ステップＳ２５０８）ユーザ処理部４３は、ステップＳ２５０７で受信された会議情報を用いて、出力する画面画像を構成する。ユーザ出力部４６は、当該画面画像を出力する。なお、ユーザ出力部４６は、画面画像に加えて、１以上のユーザのバイタル情報、会話テキストのうちの１または２種類の情報を出力しても良い。

　（ステップＳ２５０９）ユーザ処理部４３は、通訳音声を出力するか否かを判断する。通訳音声を出力する場合はステップＳ２５１０に行き、出力しない場合はステップＳ２５１１に行く。

　（ステップＳ２５１０）ユーザ出力部４６は、ユーザの発話の通訳音声を出力する。ステップＳ２５１２に行く。

　（ステップＳ２５１１）ユーザ出力部４６は、ユーザの発話である音声情報を出力する。

　（ステップＳ２５１２）ユーザ処理部４３は、ウェブ会議を終了するか否かを判断する。ウェブ会議を終了する場合はステップＳ２５０１に戻り、ウェブ会議を終了しない場合はステップＳ２５０３に戻る。なお、ウェブ会議を終了する場合は、例えば、ユーザ受付部４２がウェブ会議の終了指示を受け付けた場合である。

　（ステップＳ２５１３）ユーザ受付部４２は、検索条件を受け付けたか否かを判断する。検索条件を受け付けた場合はステップＳ２５１４に行き、検索条件を受け付けなかった場合はステップＳ２５０１に戻る。

　（ステップＳ２５１４）ユーザ処理部４３は、ユーザ格納部４１からユーザ識別子を取得し、当該ユーザ識別子に対応付く検索条件を構成する。ユーザ送信部４４は、ユーザ識別子に対応付く検索条件を情報処理装置３に送信する。

　（ステップＳ２５１５）ユーザ受信部４５は、検索条件に合致する画像等を受信したか否かを判断する。画像等を受信した場合はステップＳ２５１６に行き、受信しなかった場合はステップＳ２５１５に戻る。なお、画像等は、例えば、蓄積画像に加えて、付加情報、フラグを有する。なお、フラグは、検索条件に合致する箇所を特定する情報である。

　（ステップＳ２５１６）ユーザ処理部４３は、出力する画像等を構成する。ユーザ出力部４６は、当該画像等を出力する。なお、出力する画像等は、例えば、検索条件に合致した最初の付加情報に対応するフラグが付された箇所の蓄積画像と、当該付加情報である。

　（ステップＳ２５１７）ユーザ受付部４２は、ユーザから指示を受け付けたか否かを判断する。指示を受け付けた場合はステップＳ２５１８に行き、指示を受け付けなかった場合はステップＳ２５１９に行く。なお、指示は、１または２以上のフラグが特定する蓄積画像の箇所にジャンプする指示である。

　（ステップＳ２５１８）ユーザ処理部４３は、指示に対応するフラグの箇所であり、蓄積画像の箇所を含む画面画像を構成する。ユーザ出力部４６は、当該画面画像を出力する。なお、ユーザ出力部４６は、当該画面画像に加えて、フラグに対応する付加情報も出力することは好適である。

　（ステップＳ２５１９）ユーザ処理部４３は、検索結果の出力を終了するか否かを判断する。出力を終了する場合はステップＳ２５０１に戻り、出力を終了しない場合はステップＳ２５１７に戻る。

　なお、図２５のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

　次に、通訳者端末５の動作例について、図２６のフローチャートを用いて説明する。

　（ステップＳ２６０１）通訳者受信部５２は、通訳対象の音声情報を含む情報を受信したか否かを判断する。情報を受信した場合はステップＳ２６０２に行き、情報を受信しなかった場合はステップＳ２６０３に行く。なお、受信する情報は、例えば、通訳対象の音声情報と、ウェブ会議中の画面画像である。

　（ステップＳ２６０２）通訳者処理部５３は、受信された音声情報を用いて、出力する音声を構成する。通訳者出力部５４は、当該通訳対象の音声を出力する。なお、通訳者出力部５４は、ウェブ会議中の画面画像も出力することは好適である。ステップＳ２６０１に戻る。

　（ステップＳ２６０３）通訳者受付部５５は、通訳者からの通訳音声を受け付けたか否かを判断する。通訳音声を受け付けた場合はステップＳ２６０４に行き、受け付けなかった場合はステップＳ２６０５に行く。なお、通訳者は、通常、人であるが、音声翻訳を行う装置でも良い。

　（ステップＳ２６０４）通訳者処理部５３は、受け付けられた通訳音声から送信する通訳音声情報を構成する。通訳者送信部５６は、当該通訳音声情報を情報処理装置３に送信する。ステップＳ２６０１に戻る。

　（ステップＳ２６０５）通訳者受信部５２は、評価情報を受信したか否かを判断する。評価情報を受信した場合はステップＳ２６０６に行き、受信しなかった場合はステップＳ２６０１に戻る。

　（ステップＳ２６０６）通訳者処理部５３は、ステップＳ２６０５で受信された評価情報を用いて、出力する評価情報を構成する。通訳者出力部５４は、当該評価情報を出力する。ステップＳ２６０１に戻る。

　なお、図２６のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

　以下、本実施の形態における情報システム２０００の具体的な動作例について説明する。情報システム２０００の概念図は、図１３である。本具体例において、ユーザ端末４がユーザの１以上のバイタル情報を取得し、情報処理装置３に送信するものとする。なお、上述した通り、情報処理装置３が受信した画像からユーザの１以上のバイタル情報を取得しても良い。

　今、情報処理装置３の格納部３１には、図６（ｂ）に示す着目条件が格納されている、とする。

　また、格納部３１には、減点条件「ＬＦ／ＨＦが第一閾値以下のユーザが第二閾値以上の割合い、存在すること」が格納されている、とする。

　また、情報格納部３１１には、図２７に示すユーザ管理表が格納されている。ユーザ管理表とは、ユーザ情報を管理する表である。ユーザ管理表は、「ＩＤ」「ユーザＩＤ」「ユーザ属性値」を有する１以上のレコードを管理する。「ユーザ属性値」は、ここでは、「年齢」「性別」「所属」「役職」「言語」を有する。「ＩＤ」は、レコードを識別する情報である。「ユーザＩＤ」は、ユーザ識別子である。「所属」は、ユーザが所属する会社名である。「言語」は、ウェブ会議でユーザが使用する言語である。

　また、情報格納部３１１には、図２８に示すに示す構造を有するバイタル情報管理表が格納されている。バイタル管理表とは、ウェブ会議中のユーザのバイタル情報を管理する表である。バイタル管理表は、「会議ＩＤ」「蓄積画像」「ユーザＩＤ」「オフセット」「バイタル情報」「フラグ」を有する１以上のレコードを管理する。「バイタル情報」は、ここでは「脈波数」「心拍数」「ＬＦ／ＨＦ」を有する。「会議ＩＤ」は、ウェブ会議を識別する情報である。「蓄積画像」は、ウェブ会議における蓄積画像の識別情報である。「蓄積画像」は、ここでは、ウェブ会議における蓄積画像のファイル名である。「オフセット」は、蓄積画像における箇所や範囲を特定する情報であり、「バイタル情報」に対応する箇所や範囲を特定する情報である。ここでは、「オフセット」は、蓄積画像の開始時からの経過時間であるが、蓄積画像におけるフレームのＩＤ等でも良く、蓄積画像における箇所や範囲を特定する情報であれば良い。「オフセット」は、バイタル情報が発生したタイミングを特定する情報である。「フラグ」とは、着目条件に合致したバイタル情報を特定する情報である。フラグ「１」は着目条件に合致したバイタル情報を示し、フラグ「０は着目条件に合致しなかったバイタル情報を示す。

　また、情報格納部３１１には、図２９に示す構造を有するテキスト等管理表が格納されている。テキスト等管理表とは、ウェブ会議中のユーザの発話の会話テキスト、通訳情報等を管理する表である。テキスト等管理表は、「会議ＩＤ」「蓄積画像」「オフセット」「ユーザＩＤ」「会話テキスト」「通訳テキスト」「通訳音声情報」「通訳者ＩＤ」を有する１以上のレコードを管理する。「通訳音声情報」は、例えば、通訳した音声情報のファイル名であるが、音声情報のファイル名とファイルの中の箇所（例えば、オフセット）を示す情報でも良い。

　さらに、ユーザ端末４のユーザ格納部４１には、図６（ａ）に示す出力条件が格納されている、とする。

　かかる状況において、以下の２つの具体例について説明する。具体例１は、蓄積画像と付加情報とが蓄積される場合である。具体例２は、蓄積画像を検索する場合である。

（具体例１）
　今、ユーザＩＤ「Ｕ００１」「Ｕ００２」「Ｕ００３」「Ｕ００４」の４名が、ウェブ会議を開始した、とする。

　そして、ウェブ会議中において、４名の各ユーザのユーザ端末４は、画像と音声情報とを取得し、情報処理装置３に送信する。

　また、４名の各ユーザのユーザ端末４のユーザ処理部４３は、例えば、定期的に、取得された画像から「脈拍数」「心拍数」「ＬＦ／ＨＦ」を取得する。そして、ユーザ処理部４３は、取得した１種類以上のバイタル情報が、図６のいずれかの出力条件に合致するか否かを判断する。そして、いずれかの出力条件に合致した場合、ユーザ処理部４３は、画像と音声情報に加えて、バイタル情報（ここでは、「脈拍数」「心拍数」「ＬＦ／ＨＦ」）を含むユーザ情報を構成する。なお、ユーザ処理部４３は、取得されたバイタル情報を、常に含むユーザ情報を構成しても良い。

　次に、ユーザ送信部４４は、構成されたユーザ情報を、ユーザ識別子に対応付けて、情報処理装置３に送信する。４名の各ユーザに対するユーザ情報に含まれる画像は、例えば、図９（ａ）（ｂ）（ｃ）（ｄ）である。

　次に、情報処理装置３の情報受信部３２１は、４名の各ユーザのユーザ端末４からユーザ情報を受信する。

　次に、処理部３３は、受信されたユーザ情報等を、ユーザ識別子と対にして、一時蓄積する。

　次に、処理部３３は、受信されたユーザ情報等から、１または２以上の各ユーザ識別子に対応付くバイタル情報を取得する。

　次に、判断部３３３は、取得された１または２以上の各ユーザ識別子に対応付くバイタル情報が、着目条件（図６（ｂ））に合致するか否かを判断する。なお、ユーザ端末４で、同じ着目条件に合致するバイタル情報のみが送信される場合には、判断部３３３によるかかる判断は不要である。

　ここで、例えば、判断部３３３は、いずれのバイタル情報も着目条件に合致しない、と判断したとする。

　また、テキスト取得部３３１は、受信された各ユーザのユーザ情報に含まれる音声情報に対して、音声認識処理を行い、各ユーザの会話テキストを、各ユーザ識別子およびオフセットと対にして取得する。

　また、蓄積画像取得部３３５は、例えば、４つの各ユーザ端末４から送信された画像をそれぞれ含むユーザ領域１００１－１００５をタイル状に配列した図１０（ａ）に示すような画面画像１００５を構成する。

　次に、処理部３３は、蓄積画像取得部３３５が構成した画面画像と受信された音声情報とを有する会議情報を構成する。

　次に、出力部３４は、構成された会議情報を４つの各ユーザ端末４と４つの通訳者端末５に送信する。４つの通訳者端末５の各々は、通訳対象の担当のユーザが決まっている、とする。

　なお、ユーザ識別子「Ｕ００１」のユーザに対する通訳者は、「日本語→英語」の通訳を行い、その通訳者ＩＤは「ＴＲ１１」である。ユーザ識別子「Ｕ００２」のユーザに対する通訳者は、「英語→日本語」の通訳を行い、その通訳者ＩＤは「ＴＲ２１」である。ユーザ識別子「Ｕ００３」のユーザに対する通訳者は、「日本語→英語」の通訳を行い、その通訳者ＩＤは「ＴＲ１２」である。ユーザ識別子「Ｕ００４」のユーザに対する通訳者は、「日本語→英語」の通訳を行い、その通訳者ＩＤは「ＴＲ１３」である。

　次に、４つの各ユーザ端末４は、会議情報を受信し、当該会議情報に含まれる画面画像を表示し、自分の言語に対応する音声情報を出力する。

　また、通訳者端末５は、会議情報を受信し、当該会議情報に含まれる画面画像を表示し、通訳者が担当するユーザの発話に対する音声情報を出力する。

　次に、翻訳者は、担当するユーザの発話に対する音声情報を聞き、同時通訳の音声を発する。次に、通訳者端末５は、当該音声を受け付け、通訳音声情報を構成し、当該通訳音声情報を、通訳者ＩＤと対にして情報処理装置３に送信する。

　情報処理装置３は、通訳音声情報を受信し、４つの各ユーザ端末４または、対象となる１以上のユーザ端末４に、当該通訳音声情報を送信する。

　また、情報処理装置３の通訳情報取得部３３２は、受信された通訳音声情報に対して音声認識処理を行い、通訳テキストを取得し、元の音声情報を発したユーザのユーザ識別子とオフセットと対にする。また、通訳情報取得部３３２は、通訳音声情報も当該通訳テキストと通訳者ＩＤと対にする。

　蓄積部３３６は、取得された蓄積画像をファイル「Ｍ０１．ｍｐ４」に蓄積する。また、蓄積部３３６は、オフセット（例えば、ウェブ開始からの時間）を取得する。また、蓄積部３３６は、ファイル識別子「Ｍ０１．ｍｐ４」とオフセットとに対応付けて、取得された付加情報（各ユーザ識別子に対応付くバイタル情報（脈拍数、心拍数、ＬＦ／ＨＦ））を、図２８に示すバイタル情報管理表に蓄積する。

　また、蓄積部３３６は、ファイル識別子「Ｍ０１．ｍｐ４」とオフセットとに対応付けて、発話したユーザのユーザ識別子に対応付く、会話テキスト、通訳テキスト、通訳音声情報と通訳者ＩＤとを図２９に示すテキスト等管理表に蓄積する。

　そして、ウェブ会議の進行中、上述の処理が繰り返される。そして、例えば、図２８に示すバイタル情報管理表のレコード、図２９に示すテキスト等管理表のレコードが蓄積されていく、とする。

　また、例えば、判断部３３３は、ウェブ会議の進行中、受信されたバイタル情報の中で、ユーザ識別子「Ｕ００３」と対になるバイタル情報が着目条件に合致する、と判断したとする。

　かかる場合、判断部３３３は、着目条件に合致するバイタル情報と対になる１以上のユーザ識別子「Ｕ００３」を図示しないバッファに蓄積する。また、蓄積部３３６は、着目条件に合致するバイタル情報と対に、フラグ「１」を、図２８のバイタル情報管理表に書き込む。

　そして、蓄積画像取得部３３５は、図１０（ｃ）に示すように、ユーザ識別子「Ｕ００３」で識別されるユーザの領域が、他のユーザの領域と比較して、視覚的に区別可能となる画面画像を構成する。

　次に、処理部３３は、構成された画面画像と受信された音声情報とを有する会議情報を構成する。

　次に、出力部３４は、構成された会議情報を４つの各ユーザ端末４、および４つの各通訳者端末５に送信する。

　次に、４つの各ユーザ端末４は、会議情報を受信し、図１１（ｂ）に示すような画面画像を出力する。また、４つの各ユーザ端末４は、自分の言語に対応する音声情報、通訳音声情報を出力する。

　また、４つの各通訳者端末５は、会議情報を受信し、図１１（ｂ）に示すような画面画像を出力し、かつ自分の担当するユーザの音声情報を出力する。

　以上、本具体例において、ウェブ会議において取得された蓄積画像と、各ユーザのバイタル情報を含む付加情報とが、対応付けられて、蓄積された。なお、付加情報は、ここでは、ユーザ識別子とオフセットとに対応付く会話テキスト、ユーザ識別子とオフセットとに対応付く通訳テキスト、ユーザ識別子とオフセットとに対応付く通訳音声情報を含む。

（具体例２）
　ユーザは、ここで、バイタル情報に関する検索条件、着目条件に合致したバイタル情報に関する検索条件、会話テキストに関する検索条件、通訳テキストに関する検索条件等の多様な検索条件をユーザ端末４に入力できる、とする。

　そして、ユーザ端末４は、検索条件を受け付け、情報処理装置３に送信した、とする。情報処理装置３は、検索条件を受信し、検索部３３９は、当該検索条件に合致する蓄積画像とオフセットとの組を、図２８または図２９の表から検索する。そして、結果出力部３４４は、検索条件にヒットした蓄積画像とオフセットの情報をユーザ端末４に送信する。なお、ここで、結果出力部３４４は、検索条件にヒットしたオフセットに対応するバイタル情報と、当該バイタル情報と対になるユーザ識別子をも、図２８または図２９の表から取得し、ユーザ端末４に送信することは好適である。

　次に、ユーザ端末４は、蓄積画像とオフセットの情報とを受信し、当該蓄積画像の当該オフセットの箇所の画像を出力する。なお、ユーザ端末４は、受信されたバイタル情報とユーザ識別子をも出力することは好適である。

　なお、上記の具体例において、例えば、会議ＩＤ「Ｍ０１」で識別されるウェブ会議の終了後に、図１８、図１９の処理により、統計処理部３３７は、当該ウェブ会議のバイタル情報を用いて、４人の各ユーザのバイタル情報の統計処理の結果を取得しても良い。また、統計処理部３３７は、図１８、図２０の処理により、ユーザ属性値の条件ごと（例えば、役職「部長」と「部長以外」）のバイタル情報の統計処理の結果を取得しても良い。また、統計処理部３３７は、図１８、図２１の処理により、ウェブ会議全体のバイタル情報の統計処理の結果を取得しても良い。そして、結果出力部３４４は、取得した統計処理の結果を、会議ＩＤ「Ｍ０１」、または会議ＩＤ「Ｍ０１」とユーザ識別子と対にして、蓄積しても良い。

　また、上記の具体例において、例えば、会議ＩＤ「Ｍ０１」で識別されるウェブ会議の終了後に、図２２に示す処理により、４名の各通訳者の評価情報を取得し、通訳者ＩＤと対にして、蓄積しても良い。

　さらに、上記の具体例において、例えば、会議ＩＤ「Ｍ０１」で識別されるウェブ会議の終了後に、関係検出部３３４は、１以上の関係情報を取得し、ユーザ識別子「Ｕ００１」の部長と会議することに対して、ストレスがある部下のユーザ識別子「Ｕ００３」を検出し、関係情報「Ｕ００１，Ｕ００３」を取得し、蓄積しても良い。かかることにより、部下のユーザ識別子「Ｕ００３」のユーザを、もっと能力が発揮されるであろう部署に異動させることを考慮できる。

　以上、本実施の形態によれば、ウェブ会議における画像とユーザのバイタル情報とを対応付けて蓄積できる。

　また、本実施の形態によれば、ウェブ会議における画像と会話テキストとユーザのバイタル情報とを対応付けて蓄積できる。

　また、本実施の形態によれば、ウェブ会議における会話テキストとユーザ識別子とを対応付けて蓄積できる。

　また、本実施の形態によれば、ウェブ会議における発話の通訳情報と画像とを対応付けて蓄積できる。

　また、本実施の形態によれば、バイタル情報を用いて通訳者の評価ができる。

　また、本実施の形態によれば、発話の聞き手のユーザのバイタル情報を用いて、聞き手と発話者の関係を特定できる。

　また、本実施の形態によれば、ウェブ会議におけるユーザのバイタル情報を統計処理できる。

　さらに、本実施の形態によれば、バイタル情報等を用いて、ウェブ会議の画像を検索できる。

　なお、本実施の形態において、情報処理装置３は、２以上の図示しないウェブ会議サーバと連携し、バイタル情報を用いた上述の機能を提供できる。かかる場合の情報処理装置３は、ウェブ会議を行う２以上の各ユーザの各ユーザ端末から送信された画像を含むユーザ情報を受信する情報受信部と、前記ウェブ会議を行う前記２以上のユーザ中の１以上の各ユーザのバイタル情報を取得するバイタル取得部と、前記２以上の各ユーザ端末から送信された画像または当該２以上の画像に基づく画像である蓄積画像を取得する蓄積画像取得部と、前記情報取得部が取得した前記１以上の各ユーザのバイタル情報を含む付加情報を、前記蓄積画像取得部が取得した前記蓄積画像に対応付けて蓄積する蓄積部である。そして、かかる場合の情報処理装置３の蓄積部は、例えば、付加情報をウェブ会議サーバに蓄積しても良いし、情報格納部３１１に蓄積しても良い。

　さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをＣＤ－ＲＯＭなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、ウェブ会議を行う２以上の各ユーザの各ユーザ端末から送信された画像を含むユーザ情報を受信する情報受信部と、前記ウェブ会議を行う前記２以上のユーザ中の１以上の各ユーザのバイタル情報を取得するバイタル取得部と、前記２以上の各ユーザ端末から送信された画像または当該２以上の画像に基づく画像である蓄積画像を取得する蓄積画像取得部と、前記情報取得部が取得した前記１以上の各ユーザのバイタル情報を含む付加情報を、前記蓄積画像取得部が取得した前記蓄積画像に対応付けて蓄積する蓄積部として機能させるためのプログラムである。

　また、図３０は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態のサーバ１や情報処理装置３等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図３０は、このコンピュータシステム３００の概観図であり、図３１は、システム３００のブロック図である。

　図３０において、コンピュータシステム３００は、ＣＤ－ＲＯＭドライブを含むコンピュータ３０１と、キーボード３０２と、マウス３０３と、モニタ３０４とを含む。

　図３１において、コンピュータ３０１は、ＣＤ－ＲＯＭドライブ３０１２に加えて、ＭＰＵ３０１３と、ＣＤ－ＲＯＭドライブ３０１２等に接続されたバス３０１４と、ブートアッププログラム等のプログラムを記憶するためのＲＯＭ３０１５と、ＭＰＵ３０１３に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのＲＡＭ３０１６と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク３０１７とを含む。ここでは、図示しないが、コンピュータ３０１は、さらに、ＬＡＮへの接続を提供するネットワークカードを含んでも良い。

　コンピュータシステム３００に、上述した実施の形態の情報処理装置３等の機能を実行させるプログラムは、ＣＤ－ＲＯＭ３１０１に記憶されて、ＣＤ－ＲＯＭドライブ３０１２に挿入され、さらにハードディスク３０１７に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ３０１に送信され、ハードディスク３０１７に記憶されても良い。プログラムは実行の際にＲＡＭ３０１６にロードされる。プログラムは、ＣＤ－ＲＯＭ３１０１またはネットワークから直接、ロードされても良い。

　プログラムは、コンピュータ３０１に、上述した実施の形態の情報処理装置３等の機能を実行させるオペレーティングシステム（ＯＳ）、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能（モジュール）を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム３００がどのように動作するかは周知であり、詳細な説明は省略する。

　なお、上記プログラムにおいて、情報を送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理（ハードウェアでしか行われない処理）は含まれない。

　また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。

　また、上記各実施の形態において、一の装置に存在する２以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。

　また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。

　本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。

　以上のように、本発明にかかる情報処理装置３は、ウェブ会議中における画像とユーザのバイタル情報とを対応付けて蓄積できるという効果を有し、ウェブ会議を支援するサーバ等として有用である。

Claims

ウェブ会議を行う２以上の各ユーザの各ユーザ端末から送信された画像を含むユーザ情報を受信する情報受信部と、
前記ウェブ会議を行う前記２以上のユーザ中の１以上の各ユーザのバイタル情報を取得するバイタル取得部と、
前記２以上の各ユーザ端末から送信された画像または当該２以上の画像に基づく画像である蓄積画像を取得する蓄積画像取得部と、
前記情報取得部が取得した前記１以上の各ユーザのバイタル情報を含む付加情報を、前記蓄積画像取得部が取得した前記蓄積画像に対応付けて蓄積する蓄積部とを具備する情報処理装置。
前記ユーザ情報は、前記ウェブ会議中のユーザの発話に基づく音声情報または当該音声情報から取得された会話テキストも含み、
前記音声情報から取得される会話テキストを取得するテキスト取得部をさらに具備し、
前記蓄積部は、
前記会話テキストを含む前記付加情報を、前記蓄積画像に対応付けて蓄積する請求項１記載の情報処理装置。
前記情報受信部は、
ユーザ識別子に対応付けて前記ユーザ情報を受信し、
前記蓄積部は、
前記会話テキストを前記ユーザ識別子に対応付けて蓄積する請求項２記載の情報処理装置。
前記ウェブ会議中のユーザの発話に対する通訳音声情報または当該通訳音声情報から取得された通訳テキストである通訳情報を受信する通訳情報受信部をさらに具備し、
前記蓄積部は、
前記通訳音声情報または前記通訳テキストである通訳情報を含む前記付加情報を、前記蓄積画像に対応付けて蓄積する請求項１記載の情報処理装置。
前記ウェブ会議における発話に対して、通訳が行われ、
前記通訳の音声を聞く１以上の各ユーザのバイタル情報を用いて、前記通訳者の評価を示す評価情報を取得する通訳評価部と、
前記評価情報を出力する評価出力部とをさらに具備する請求項１記載の情報処理装置。
前記通訳評価部は、
通訳の対象の発話の言語である原言語に対応する１以上のユーザのバイタル情報と、前記通訳の目的言語に対応する１以上のユーザのバイタル情報とを用いて、前記評価情報を取得する請求項５記載の情報処理装置。
ユーザが発話していないタイミングにおけるバイタル情報が、着目条件に合致するか否かを判断する判断部と、
前記判断部が前記着目条件に合致すると判断した前記バイタル情報に対する第一ユーザ識別子と、当該タイミングにおける発話者の第二ユーザ識別子とを対応付ける関係情報を取得する関係検出部と、
前記関係情報を出力する関係出力部とをさらに具備する請求項１記載の情報処理装置。
前記関係出力部は、
前記関係情報を前記タイミングにおける画像または前記バイタル情報に対応付けて出力する請求項７記載の情報処理装置。
前記１以上のユーザの前記バイタル情報を統計処理し、処理結果を取得する統計処理部と、
前記処理結果を出力する結果出力部とをさらに具備する請求項１記載の情報処理装置。
前記バイタル情報は、ユーザ識別子に対応付いており、
前記統計処理部は、
ユーザ識別子ごと、またはユーザ識別子と対になるユーザ属性値ごとに、前記バイタル情報を統計処理し、処理結果を取得する請求項９記載の情報処理装置。
前記ウェブ会議中の２以上の各ユーザのユーザ領域を含む画面画像を出力する画面出力部と、
前記情報取得部が取得した前記バイタル情報が、着目条件に合致するか否かを判断する判断部をさらに具備し、
前記画面出力部は、
前記判断部が前記着目条件に合致すると判断した前記バイタル情報に対応するユーザのユーザ領域を他のユーザのユーザ領域と視覚的に区別可能な態様の画面を出力する請求項１から請求項１０いずれか一項に記載の情報処理装置。
バイタル情報またはバイタル情報の処理結果または会話テキストである付加情報に関する検索条件を受け付ける検索受付部と、
前記蓄積部が蓄積した蓄積画像の中で、前記検索条件に合致する付加情報に対応付く蓄積画像を検知し、当該蓄積画像または当該蓄積画像から取得される画像を出力する検索部とをさらに具備する請求項１から請求項１１いずれか一項に記載の情報処理装置。
前記バイタル情報は、呼吸、体温、血圧、意識レベル、心拍変動、交感神経、副交感神経、またはＬＦ（低周波）／ＨＦ（高周波）である請求項１から請求項１２いずれか一項に記載の情報処理装置。
情報受信部と、バイタル取得部と、蓄積画像取得部と、蓄積部とにより実現される情報処理方法であって、
前記情報受信部が、ウェブ会議中の２以上の各ユーザの各ユーザ端末から送信された画像を含むユーザ情報を、順次、受信する情報受信ステップと、
前記バイタル取得部が、前記情報受信ステップで受信された２以上のユーザ中の１以上の各ユーザのバイタル情報を取得するバイタル取得ステップと、
前記蓄積画像取得部が、前記２以上の各ユーザ端末から受信された画像または当該２以上の画像に基づく画像である蓄積画像を取得する蓄積画像取得ステップと、
前記蓄積部が、前記情報取得ステップで取得された前記１以上の各ユーザのバイタル情報を含む付加情報を、前記蓄積画像取得ステップで取得された前記蓄積画像に対応付けて蓄積する蓄積ステップとを具備する情報処理方法。
コンピュータを、
ウェブ会議を行う２以上の各ユーザの各ユーザ端末から送信された画像を含むユーザ情報を受信する情報受信部と、
前記ウェブ会議を行う前記２以上のユーザ中の１以上の各ユーザのバイタル情報を取得するバイタル取得部と、
前記２以上の各ユーザ端末から送信された画像または当該２以上の画像に基づく画像である蓄積画像を取得する蓄積画像取得部と、
前記情報取得部が取得した前記１以上の各ユーザのバイタル情報を含む付加情報を、前記蓄積画像取得部が取得した前記蓄積画像に対応付けて蓄積する蓄積部として機能させるためのプログラムを記録した記録媒体。