WO2022029859A1

WO2022029859A1 - コミュニケーション支援装置、コミュニケーション支援方法およびプログラム

Info

Publication number: WO2022029859A1
Application number: PCT/JP2020/029737
Authority: WO
Inventors: 充望月; 真一郎永徳; 仁志瀬下; 治松田
Original assignee: 日本電信電話株式会社
Priority date: 2020-08-04
Filing date: 2020-08-04
Publication date: 2022-02-10

Abstract

一実施形態に係るコミュニケーション支援装置は、第１のユーザを撮影した画像と第１のユーザの識別情報とを含む、第１のユーザに関する第１のユーザ情報を取得する第１の取得部と、第１のユーザへのアクセスを要求する第２のユーザの識別情報を取得する第２の取得部と、第２のユーザからのアクセス要求に対する第１のユーザの応答の結果を表す応答情報を取得する第３の取得部と、第１のユーザ情報、第２のユーザの識別情報および応答情報に基づく教師データを用いてモデルの学習を行う学習部とを備える。

Description

コミュニケーション支援装置、コミュニケーション支援方法およびプログラム

　本発明の実施形態は、作業者間のコミュニケーションを支援するコミュニケーション支援装置、コミュニケーション支援方法およびプログラムに関する。

　近年、情報通信技術の発展により、地理的な場所にとらわれない多様な働き方が可能となってきた。リモートワークのように、遠隔地にいる作業者どうしが協調して作業を行う場合、効率的な協調作業のためには作業者間の円滑なコミュニケーションが必要である。

　ここで、作業者が遠隔地にいる他の作業者と意思疎通を行おうとする場合、相手の状況、例えば、相手がただちにコミュニケーションをとれる状態にあるかどうか、わからないことが多い。そのため、遠隔地の相手にコミュニケーションを直接取ること（例えば、電話やＴＶ会議など）に躊躇してしまうことも多い。あるいは逆に、コミュニケーションを直接取ることによって、相手にストレスを与えてしまうこともある。

　遠隔地間での協調作業を支援するため、固定したビデオカメラから取り込まれる画像に画像処理を施すことによって、遠隔地のユーザの周辺の特徴情報を獲得し、作業状況を判断するシステムが提案されている（例えば、非特許文献１参照）。このシステムでは、コンピュータを利用した作業形態については、マウスとキーボードによる入力頻度からユーザの忙しさが判断される。このシステムではまた、ユーザ周辺の特徴情報に基づいてユーザの現在の状況を示す一覧を表示し、ユーザに現在の状況の選択を促す試みも行われている。

室田将司ほか、"コミュニケーション支援のための作業状況の認識と利用"、映像情報メディア学会技術報告、１９９９、２３．１４巻、インターネット＜https://www.jstage.jst.go.jp/article/itetr/23.14/0/23.14_69/_pdf/-char/ja＞

　しかし、非特許文献１に記載されているシステムでは、ユーザ周辺の特徴情報を獲得して作業状況を判断するため、コンピュータを利用した作業形態では作業状況の把握が困難である。上記のように、ユーザは、都度、与えられた一覧から、自身の状況を選択し入力を行う必要があり、ユーザに負荷やストレスを与えるおそれがある。

　また、リモートワークの作業が主に事務作業である場合、入力作業が中心のため、例えば脈拍数が上がることに基づいてストレス状態が高い傾向を推測することができる。しかし、リモートワークの作業が主に知的生産作業である場合は、入力作業のような単純作業のストレスの状態よりも、集中状態にある場合の方が他者からの介入の負担が大きいと推測される。すなわち、作業者とその主な作業形態に応じて、他者からの介入が負担となるタイミングは異なるものとなり得る。

　この発明は上記事情に着目してなされたもので、その目的とするところは、作業者に都度入力を要求することなく、作業者の状況を他の作業者が推測するのに役立つ情報を生成できる、コミュニケーション支援技術を提供することにある。

　上記課題を解決するために、この発明の第１の態様は、コミュニケーション支援装置にあって、第１のユーザを撮影した画像と第１のユーザの識別情報とを含む、第１のユーザに関する第１のユーザ情報を取得する第１の取得部と、第１のユーザへのアクセスを要求する第２のユーザの識別情報を取得する第２の取得部と、第２のユーザからのアクセス要求に対する第１のユーザの応答の結果を表す応答情報を取得する第３の取得部と、上記第１のユーザ情報、上記第２のユーザの識別情報、および上記応答情報に基づく教師データを用いてモデルの学習を行う学習部とを備えるようにしたものである。

　この発明の第１の態様によれば、アクセス要求の要求先（アクセス要求の対象）の作業者である第１のユーザを撮影した画像と第１のユーザの識別情報とを含む、第１のユーザに関する第１のユーザ情報と、当該第１のユーザへのアクセスを要求するアクセス要求の要求元の作業者である第２のユーザの識別情報と、アクセス要求に対する応答の結果とに基づく教師データを用いて、モデルの学習が行われる。上記コミュニケーション支援装置は、アクセス要求の要求先である第１のユーザの画像だけでなく、第１のユーザの識別情報とアクセス要求の要求元である第２のユーザの識別情報も含むので、個々のユーザの区別またはユーザ間の関係までも考慮した学習を行うことができる。このような学習により、アクセス要求の要求先ユーザおよび要求元ユーザの情報と応答結果との関係を細やかに反映したモデルを生成することができる。生成されるモデルを用いれば、アクセス要求に対してどのように応答されるかを個々の状況に応じて精度良く推定することができる。

　すなわちこの発明の第１の態様によれば、作業者に都度入力を要求することなく、作業者の状況を他の作業者が推測するのに役立つ情報を生成できる、コミュニケーション支援技術を提供することができる。

図１は、一実施形態に係るコミュニケーション支援装置の機能構成の一例を示すブロック図である。図２は、一実施形態に係るコミュニケーション支援装置のハードウェア構成の一例を示すブロック図である。図３は、図１に示したコミュニケーション支援装置による学習処理の一例を示すフローチャートである。図４は、図１に示したコミュニケーション支援装置による推定処理の一例を示すフローチャートである。

　［一実施形態］
　以下、図面を参照してこの発明の一実施形態について説明する。

　（１）構成
　（１－１）機能構成
　図１は、この発明の一実施形態に係るコミュニケーション支援装置１００の機能構成の一例を示す図である。

　一実施形態に係るコミュニケーション支援装置１００は、協調作業を行うチームのメンバー（作業者、ユーザ）間のコミュニケーションを支援する機能を有する。各メンバーは、図示しない情報処理端末（例えば、パーソナルコンピュータ、スマートフォン、タブレット端末など）を使用して、各自の作業をし、他のメンバーとコミュニケーションをとり、または他のメンバーの状況を表す情報を閲覧することができる。なお、ここでは、メンバー、ユーザ、作業者という用語は、特に指定のない限り、同義で使用されている。

　コミュニケーション支援装置１００は、上記の各メンバーが使用する情報処理端末であってもよいし、各メンバーが使用する端末との間で情報のやり取りが可能な別個の装置であってもよい。以下では一例として、コミュニケーション支援装置１００が、各メンバーが所有する情報処理端末との間でネットワークを介して通信可能なサーバコンピュータであるものとして説明する。なお、ネットワークは、ＬＡＮ、インターネット、電話通信網など、相互に通信可能な任意のものであってよい。

　図１に示すコミュニケーション支援装置１００は、作業者情報取得部１と、アクセス情報取得部２と、学習部３と、表示生成部４と、推定部５と、組織情報記憶部１０と、モデル記憶部２０とを有する。

　作業者情報取得部１は、第１の取得部として、アクセス要求の要求先である作業者（第１のユーザ）を撮影した画像と、当該作業者の識別情報（以下、「作業者ＩＤ」または「要求先ＩＤ」と言う。）とを含む、当該作業者に関する作業者情報（第１のユーザ情報）を取得する機能を有する。画像は、一例として、作業デスクに着座した作業者を撮影した画像である。作業者情報はさらに、当該作業者の生体情報を含み得る。生体情報は、例えば、脈拍数やまばたき数を含み得る。生体情報は、追加的に、または代替的に、心電図、心拍数、呼吸、体温、血圧などを含んでもよい。作業者情報取得部１は、取得した画像と作業者ＩＤとを含む作業者情報を、学習部３または推定部５に渡す。

　アクセス情報取得部２は、アクセス要求の要求先である作業者（第１のユーザ）がアクセス要求に対して応答（受け入れる、拒否する、など）を返したタイミングで動作を開始し、当該応答に関わる情報を取得する機能を有する。アクセス情報取得部２は、例えば、作業者の情報処理端末から要求元メンバーの情報処理端末への応答情報を何らかの形で受信することにより、応答情報から、第２の取得部としてアクセス要求の要求元メンバー（第２のユーザ）の識別情報（以下、「要求元ＩＤ」と言う。）を取得し、第３の取得部として上記アクセス要求に対して上記作業者がどのように応答したかを表す応答情報を取得する。応答情報はアクセス要求の要求先である作業者ＩＤも含み、アクセス情報取得部２は、作業者ＩＤも取得し得る。アクセス情報取得部２は、取得した情報を学習部３に渡す。

　学習部３は、作業者情報取得部１から受け取った作業者情報と、アクセス情報取得部２から受け取った情報とに基づく教師データを用いて、モデル記憶部２０に記憶された機械学習モデルを読み出し、当該モデルの学習を行う。より詳細には、学習部３は、作業者ＩＤと要求元ＩＤから両者の関係を表す情報を第１の特徴量として抽出し、作業者情報から作業者の状態を表す情報を第２の特徴量として抽出し、第１の特徴量と第２の特徴量を入力したときに上記の応答の結果を出力するようにモデルの学習を行う。学習部３は、組織情報記憶部１０に記憶された組織情報を用いて、作業者ＩＤと要求元ＩＤから作業者と要求元メンバーとの関係（例えば、上司、部下、仕事仲間など、仕事上の関係）を判定し、第１の特徴量として用いることができる。第２の特徴量は、第１のユーザの脈拍数、感情または集中度を表す特徴量を含み得る。学習部３は、作業者のまばたき数に基づき、作業者の集中度を推定し、第２の特徴量とすることができる。学習部３はまた、例えば作業者を撮影した画像に基づいて現在の作業者の感情（喜怒哀楽など）を推定し、第２の特徴量とすることができる。一例では、学習部３は、作業者の感情、作業者の脈拍数、作業者の集中度、作業者とアクセス要求の要求元メンバーとの関係、および応答結果の組合せを教師データとして用いて学習を行う。なお、モデルは、ニューラルネットワークなど公知の機械学習アルゴリズムを利用して生成され、あらかじめモデル記憶部２０に記憶される。学習部３は、モデル記憶部２０に記憶された情報を学習済みモデルで更新する。

　表示生成部４は、コミュニケーションを支援する情報を表示するための表示情報を生成し、各メンバーが使用する情報処理端末に出力（送信）する機能を有する。表示生成部４によって生成され出力される表示情報は、出力先の情報処理端末を使用するメンバーごとに異なり得る。詳細には、表示生成部４は、後述する推定部５による推定の結果を表す情報を含む表示情報を生成する。一例として、いずれかのメンバーが他のメンバーとコミュニケーションをとろうとして自身の情報処理端末に当該他のメンバーのＩＤ（要求先ＩＤ）を入力すると、要求先ＩＤと入力したメンバー自身のＩＤ（要求元ＩＤ）とを含む表示要求がネットワークを介してコミュニケーション支援装置１００に送られ、表示生成部４は、この表示要求を受け取ることによって処理を開始し得る。表示生成部４は、表示要求に含まれる要求先ＩＤと要求元ＩＤを推定部５に渡し、推定部５から推定結果を受け取り、推定結果に基づいて表示情報を生成し出力する。表示生成部４から出力される表示情報は、表示要求を発した情報処理端末により受信され、情報処理端末のディスプレイ等に表示される。実施形態によれば、表示情報は、要求先ＩＤに係る作業者を撮影した画像に、推定部５による推定結果を重畳させたものである。推定結果は、応答の度合い（アクセス要求が受け入れられる確率、拒否される確率、またはその両方）を表しており、例えば、画像内の背景部分に「オーラ」として重畳表示される。ここでは「オーラ」とは、作業者のステータス情報（すなわち、ただちにコミュニケーションがとれる状態かどうかを表す情報）を示すものである。オーラは、色、画像、文字などを含み得る。

　推定部５は、表示生成部４から要求先ＩＤおよび要求元ＩＤを受け取ると、作業者情報取得部１から要求先メンバー（第１のユーザ）を撮影した画像を含む作業者情報（第１のユーザ情報）を取得して、要求元メンバー（第２のユーザ）が要求先メンバーへのアクセスを要求する場合の当該アクセス要求に対する応答の度合いを推定する機能を有する。応答の度合いは、アクセス要求が受け入れられる確率、拒否される確率、またはその両方を含む。一実施形態によれば、推定部５は、上記学習部３によって学習されたモデルを用いて応答の度合いを推定する。推定部５は、学習部３と同様に、要求先ＩＤおよび要求元ＩＤから、組織情報記憶部１０に記憶された組織情報を用いて、要求先メンバーと要求元メンバーとの関係（例えば、上司、部下、仕事仲間など、仕事上の関係）を抽出する。推定部５はまた、学習部３と同様に、作業者情報として取得されるまばたき数から要求先メンバーの集中度を推定し、画像から要求先メンバーの現在の感情（喜怒哀楽など）を推定する。そして、推定部５は、要求先メンバーの現在の感情、脈拍数、集中度、および要求元メンバーとの関係を表す情報、モデル記憶部２０に記憶された学習済みモデルに入力することによって、学習済みモデルからの出力として、最新の学習状況に応じた応答の度合いの推定結果を得ることができる。

　組織情報記憶部１０は、あらかじめ作成された、チームのメンバーの関係を示す組織情報を記憶する。組織情報を用いることで、アクセス要求の要求先ＩＤ（または作業者ＩＤ）と要求元ＩＤから両者の関係を判定することができる。

　モデル記憶部２０は、あらかじめ生成された学習モデルを記憶する。モデル記憶部２０に記憶された情報は、学習部３による学習の都度、更新される。

　以上のような構成により、一実施形態に係るコミュニケーション支援装置１００は、第１のユーザを撮影した画像と第１のユーザの識別情報とを含む第１のユーザ情報と、第１のユーザへのアクセスを要求する第２のユーザの識別情報と、第２のユーザからのアクセス要求に対する第１のユーザの応答の結果を表す応答情報に基づく教師データを用いてモデルの学習を行う機能を有する。より詳細には、コミュニケーション支援装置１００は、第１のユーザ情報と第２のユーザの識別情報とから抽出される、第１のユーザと第２のユーザの関係、第１のユーザの感情、第１のユーザの脈拍数、第１のユーザの集中度、および第２のユーザからのアクセス要求に対する第１のユーザによる応答の結果の組合せを教師データとして用いて、モデルの学習を行うことができる。

　なお、教師データは、協調作業を行うチームの全メンバーについて収集される情報に基づくものであってよい。各メンバーは、アクセスの要求元にもなり得るし、アクセスの要求先にもなり得る。

　あるいは、一実施形態に係るコミュニケーション支援装置１００は、第１のユーザを撮影した画像と第１のユーザの識別情報とを含む第１のユーザ情報と、第１のユーザへのアクセスを要求可能な第２のユーザの識別情報とに基づいて、第２のユーザが第１のユーザへのアクセスを要求する場合の当該要求に対する第１のユーザの応答の度合いを推定し、推定された応答の度合いを表す情報を表示するための表示情報を生成する機能を有する。より詳細には、コミュニケーション支援装置１００は、アクセスを要求する要求元ユーザと当該アクセスの要求先ユーザとの関係を表す第１の特徴量と、要求先ユーザの状態を表す第２の特徴量とを入力したときに、要求元ユーザからのアクセス要求に対する要求先ユーザの応答の結果を出力するように学習された学習済みモデルに対し、第１のユーザ情報および前記第２のユーザの識別情報から抽出される第１の特徴量および第２の特徴量を入力し、学習済みモデルからの出力を得ることによって、第１のユーザの応答の度合いを推定し、表示情報を生成する。表示情報は、第１のユーザを撮影した画像に、応答の度合いを表す情報を重畳表示させるものであってよい。

　表示情報は、例えば、各メンバーが使用する情報処理端末の表示部に表示される。この表示を閲覧するメンバーは、他のメンバーについて推定された応答の度合い、言い換えれば、閲覧しているメンバーがアクセスを要求した場合に他のメンバーがアクセス要求を受け入れるかどうか、さらに言い換えれば、他のメンバーが「ただちにコミュニケーションがとれる状態かどうか」を知ることができる。

　はじめのうちは、アクセスしようとする対象の遠隔作業者の顔の映像は、現実そのものが映っているだけであるが、ＡＩが学習していくにつれて遠隔作業者を撮影した映像が、要求が受け入れられやすい場合と、拒否されやすい場合とで、背景が変わって見えるようになっていく。ここで、要求が受け入れられやすい場合と、拒否されやすい場合は、相手と自分の関係を含めて学習させているため、同じ相手に対して異なる人が映像を見ると、背景の見え方が変わって見える。

　これにより、遠隔で作業している人同士が、相手が現在どのような状況であるか（ただちにコミュニケーションがとれる状態であるか）を理解することができ、安心して相手にアクセスすることができる。また、作業者の現在の状況が自動的に判断され表示に反映されるので、作業者自身に現在の状況の入力を要求する必要がなく、作業者の負担を軽減することができる。さらに、作業ステータスの設定し忘れによるコミュニケーション・ロスや、意思疎通の齟齬を防止することができるようになる。

　なお、協調作業に係るチームのメンバーすべてが互いに遠隔地にいる必要はなく、コミュニケーション支援装置１００は、同じ場所で作業しているメンバーが含まれる状況で、上記のような学習および推定を行ってもよい。

　ここでは、「アクセス」または「アクセス要求」は、特に指定のない限り、同義で使用され、いずれかのメンバーが他のメンバーに対し、コミュニケーションを開始したいという意思表示として、情報処理端末を介して応答要求を送ることを指す。応答要求は、例えば、電話、テレビ会議、Ｗｅｂ会議、チャット、電子メール、その他応答を求める任意のメッセージの形態であってよい。
　同様に、「コミュニケーション」には、電話、テレビ会議、Ｗｅｂ会議、チャット、電子メール、対面での面会など、あらゆるコミュニケーション形式が含まれてよい。コミュニケーションは、上記の情報処理端末を用いるものであってもよいし、情報処理端末を用いないものであってもよい。

　（１－２）ハードウェア構成
　図２は、コミュニケーション支援装置１００のハードウェア構成の一例を示す。コミュニケーション支援装置１００は、ＣＰＵ（Central Processing Unit）１００１、ＲＡＭ（Random Access Memory）１００２、ＲＯＭ（Read Only Memory）１００３、補助記憶装置１００４、入力装置１００５、出力装置１００６、および通信装置１００７を備える。

　ＣＰＵ１００１は、コミュニケーション支援装置１００の全体的な動作を制御するプロセッサである。ＣＰＵ１００１は、ＲＯＭ１００３または補助記憶装置１００４に記憶されたプログラムをＲＡＭ１００２に展開し、このプログラムを実行することによって、上述した作業者情報取得部１、アクセス情報取得部２、学習部３、表示生成部４、および推定部５として動作し得る。ＣＰＵ１００１は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（field-programmable gate array）などの集積回路を含む、他の多様な形式で実現されてもよい。またＣＰＵ１００１は、複数のプロセッサを含んでもよい。

　補助記憶装置１００４は、例えば、ＨＤＤ（Hard Disk Drive）またはＳＤＤ（Solid State Drive）であり得る。補助記憶装置１００４は、ＣＰＵ１００１により実行されるプログラムや、プログラムを実行するために必要な設定データなどを非一時的に記憶する。補助記憶装置１００４は、上述した組織情報記憶部１０およびモデル記憶部２０を含む記憶部としても機能し得る。

　入力装置１００５は、例えば、タッチスクリーン、キーボード、マウスなど、ユーザからの入力を受け付ける。出力装置１００６は、例えば、ディスプレイやスピーカなど、出力を行うための装置である。

　通信装置１００７は、外部の装置と通信するための装置であり、例えば無線または有線ＬＡＮ（Local Area Network）通信のためのインタフェースを備える。通信装置１００７は、インターネットなどのネットワークを介して外部の装置と通信可能である。コミュニケーション支援装置１００は、通信装置１００７によって、各メンバーが使用する情報処理端末との間で情報のやり取りを行うことができる。

　（２）動作
　次に、以上のように構成されたコミュニケーション支援装置１００の動作について説明する。コミュニケーション支援装置１００の動作は、学習処理に係る動作と、推定処理に係る動作を含む。

　なお、以下の説明の前提として、各メンバー（作業者）を撮影可能なカメラ、各メンバー（作業者）の生体情報としての脈拍数およびまばたき数を計測するセンサがあらかじめ適切に設置されているものとする。また、カメラの初期設定はあらかじめ行われているものとする。初期設定としては、例えば、作業者が作業デスクに着座した状態を撮影できるよう、作業するメインディスプレイの上部にカメラを設置し、作業者の上半身がカメラ画像からはみ出さない位置に設置されていることや、解像度が著しく低いものでないことなどがあげられる。脈拍数は、例えばスマートウォッチなどのウェアラブルデバイスを介してリアルタイムに取得される。まばたき数は、例えば市販のメガネデバイスにより計測され、やはりリアルタイムに取得される。作業者を撮影した画像、作業者の脈拍数およびまばたき数は、作業者を識別する情報（作業者ＩＤ）とともに、例えば当該作業者が使用する情報処理端末を介してコミュニケーション支援装置１００に送信または出力される。あるいは、各センサ（カメラ、ウェアラブルデバイス、メガネデバイスなど）からＢｌｕｅｔｏｏｔｈ（登録商標）などの近距離無線通信によりコミュニケーション支援装置１００に直接送信可能としてもよい。

　また、コミュニケーション支援装置１００は、各作業者が使用する情報処理端末間で送受信される情報を仲介可能なものとして説明する。例えば、コミュニケーション支援装置１００は、各作業者が自身の情報処理端末から他の作業者の情報処理端末に宛てて送信したアクセス要求またはアクセス要求に対する応答を受信し、宛先の情報処理端末へと送信（仲介）する。あるいは上述したように、コミュニケーション支援装置１００と情報処理端末とは一体であってもよい。

　（２－１）学習処理
　図３は、コミュニケーション支援装置１００による学習処理の流れを例示するフローチャートである。図３の各ステップは、処理の流れを概略的に示すものであり、必ずしもすべてのステップが時間的に連続して行われる必要はない。

　一実施形態によれば、コミュニケーション支援装置１００は、いずれかのメンバーが他のメンバーからのアクセス要求に対して応答（受け入れる、拒否する、など）を返したタイミングで学習処理に係る動作を開始し得る。コミュニケーション支援装置１００は、例えば各メンバーが使用する情報処理端末のいずれかから、他のメンバーの情報処理端末に宛てたアクセス要求の受け入れまたは拒否を表す応答情報を受信することによって、以下の動作を開始する。

　ステップＳ１０１において、コミュニケーション支援装置１００は、アクセス情報取得部２によりアクセス情報を取得する。アクセス情報は、上記応答情報から取得され、アクセス要求の要求元ＩＤと、要求先の作業者ＩＤと、当該アクセス要求に対する応答結果（受け入れた、拒否した、など）を表す応答情報を含む。ステップＳ１０１において、コミュニケーション支援装置１００はまた、アクセス情報取得部２により取得された作業者ＩＤに基づき、作業者情報取得部１により、該当する作業者の作業者情報を取得する。作業者情報は、作業者を撮影した画像と作業者ＩＤを含む。作業者情報はさらに、作業者の生体情報として、脈拍数およびまばたき数を含み得る。作業者情報取得部１およびアクセス情報取得部２は、取得した情報を学習部３に渡す。

　作業者情報取得部１は、応答情報から作業者ＩＤが取得されたときに、対応する情報処理端末に対して必要な情報を要求することによって、上記の作業者情報を取得することができる。あるいは作業者情報取得部１は、各情報処理端末または各センサ（カメラ、ウェアラブルデバイス、メガネデバイスなど）から、各メンバーの画像、脈拍数およびまばたき数などのデータを随時収集し、図示しない記憶部に一定量または一定期間蓄積しておき、応答情報から作業者ＩＤが取得されたときに記憶部から必要なデータを読み出すようにしてもよい。いずれの場合にも、取得される作業者情報は、アクセス要求の要求時点または応答時点から一定時間内に撮影または計測された情報であることが好ましい。

　次いで、ステップＳ１０２において、コミュニケーション支援装置１００は、学習部３により、取得された情報に基づき教師データを生成する。教師データは、アクセス要求に対する応答の結果と、当該アクセス要求に係る作業者と要求元メンバーとの関係を表す第１の特徴量と、作業者の状態を表す第２の特徴量とを含む。第２の特徴量は、作業者の感情、作業者の脈拍数および作業者の集中度を含み得る。したがって、一実施形態によれば、学習部３は、作業者の感情、作業者の脈拍数、作業者の集中度、作業者と要求元メンバーとの関係、および応答結果の組合せを教師データとして後続の学習を行う。

　ここで、学習部３は、組織情報記憶部１０に記憶された組織情報を用いて、作業者ＩＤと要求元ＩＤに基づき、作業者と要求元メンバーとの関係（上司、部下、仕事仲間など）を表す情報を抽出することができる。学習部３はまた、入力されたまばたき数の状況を解析して、作業者の集中度を推定することができる。まばたき数に基づく集中度の推定は、公開されている技術を用いて行われてよい（例えば、呉剣ほか、「集中力の分析法の一考察（A study on Analysis Method for Concentration）」、ＦＩＴ２０１８（第１７回情報科学技術フォーラム）、１５９～１６０頁、など）。学習部３はまた、入力された画像から現在の作業者の感情（喜怒哀楽など）を機械学習によって推定することができる。画像からの感情の推定もまた、公開されている技術を用いて行われてよい（例えば、西銘大喜ほか、「畳み込みニューラルネットワークを用いた表情表現の獲得と顔特徴量の分析」、人工知能学会論文誌、２０１７年３２巻５号、ｐ．Ｆ－Ｈ３４＿１－８、など）。

　次いでステップＳ１０３において、学習部３は、モデル記憶部２０に記憶されたモデルを読み出し、上記教師データを用いて学習を行う。上述したように、モデルは、ニューラルネットワークなど公知の機械学習アルゴリズムを利用してあらかじめ生成される。学習部３は、作業者ＩＤと要求元ＩＤとから決定される作業者と要求元メンバーとの関係を表す第１の特徴量と、作業者情報から抽出される作業者の状態を表す第２の特徴量とを入力したときに、応答の結果を出力するようにモデルの学習を行う。第２の特徴量は、作業者の感情、作業者の脈拍数および作業者の集中度を含み得る。言い換えれば、一実施形態では、学習部３は、作業者の感情、作業者の脈拍数、作業者の集中度、および作業者と要求元メンバーとの関係を入力したときに、応答結果が出力されるように、上記モデルの学習を行うことができる。

　学習には、他の特徴量が用いられてもよい。例えば、作業者の年齢や性別等の個人情報が用いられてもよい。年齢や性別は画像から推定されてもよい。他の生体情報、例えば心電図、心拍数、呼吸、体温、血圧などから、感情または集中度が推定されてもよい。あるいは、作業者の生体情報の計測値がそのまま特徴量として用いられてもよい。

　また学習処理自体は任意のタイミングで行われてよい。例えば、学習処理は、いずれかのメンバーからアクセス要求に対する応答が返され、新しい教師データが取得されるたびに実施されてもよい。あるいは、教師データを蓄積しておき、一定時間経過するたびにまたは一定量のデータが蓄積されるたびに、蓄積した教師データを用いて学習処理が実施されてもよい。この場合、前回の学習後新たに取得されたデータのみを学習処理に用いてもよいし、新たに取得されたデータを含む全データまたは一定量のデータを学習処理に用いてもよい。

　学習部３による学習の後、ステップＳ１０４において、コミュニケーション支援装置１００は、学習済みモデルを更新する。

　以上のように、コミュニケーション支援装置１００は、学習処理において、アクセス要求の要求先ユーザおよび要求元ユーザの情報と応答結果との関係を細やかに反映したモデルを生成することができる。

　（２－２）推定処理
　図４は、コミュニケーション支援装置１００による推定処理の流れを例示するフローチャートである。推定処理もまた任意のタイミングで行われてよい。ここでは、いずれかのメンバーが他のメンバーとコミュニケーションをとろうとし、自身の情報処理端末に当該他のメンバーのＩＤを入力して応答の度合いの推定値を表示させようとする状況を想定する。他のメンバーのＩＤ（要求先ＩＤ）が入力されると、情報処理端末は、要求先ＩＤと要求元ＩＤを含む表示要求を生成し、コミュニケーション支援装置１００に対して送信する。コミュニケーション支援装置１００は、この表示要求の受信をトリガとして、推定処理を開始することができる。ただし、これに限定されるものではなく、例えば一定時間ごとに自動的に推定処理が実施され、各メンバーの情報処理端末上の表示を更新するようにしてもよい。

　コミュニケーション支援装置１００は、情報処理端末から表示要求を受信すると、受信した情報を表示生成部４に渡す。表示要求は、要求先ＩＤと、要求元ＩＤとを含む。

　ステップＳ２０１において、表示生成部４は、要求元ＩＤを推定部５に渡す。また表示生成部４は、要求先ＩＤを作業者情報取得部１に渡して作業者情報を取得させる。作業者情報取得部１は、受け取った要求先ＩＤに基づいて作業者情報を取得し、取得した作業者情報を推定部５に渡す。作業者情報は、学習処理の場合と同様に、アクセス要求の要求先作業者に関する識別情報（要求先ＩＤ）、当該作業者を撮影した画像、当該作業者の脈拍数および当該作業者のまばたき数を含む。作業者情報取得部１は、取得した作業者情報を推定部５に渡す。

　学習処理の場合と同様に、作業者情報取得部１は、表示生成部４から要求先ＩＤを受け取ったときに、対応する情報処理端末に対して必要な情報の送信を要求することによって、上記作業者情報を取得してもよい。あるいは作業者情報取得部１は、各メンバーの画像、脈拍数およびまばたき数のデータを随時収集し、記憶部に蓄積しておき、表示生成部４から要求先ＩＤを受け取ったときに記憶部から必要なデータを読み出すようにしてもよい。

　次いで、ステップＳ２０２において、推定部５は、取得された情報に基づき、学習処理で教師データを生成したのと同様に、推定処理に用いる入力データを生成する。入力データは、要求先メンバーと要求元メンバーとの関係を表す第１の特徴量と、要求先メンバーの状態を表す第２の特徴量とを含む。第２の特徴量は、要求先メンバーの感情、要求先メンバーの脈拍数および要求先メンバーの集中度を含み得る。したがって、一実施形態によれば、推定部５は、要求先メンバーの感情、要求先メンバーの脈拍数、要求先メンバーの集中度、および要求先メンバーと要求元メンバーとの関係を入力データとして用いる。

　学習処理で教師データを生成したのと同様に、推定部５は、組織情報記憶部１０に記憶された組織情報を用いて、要求先ＩＤと要求元ＩＤに基づき、要求先メンバーと要求元メンバーとの関係（上司、部下、仕事仲間など）を表す情報を抽出することができる。推定部５はまた、入力されたまばたき数の状況を解析して、要求先メンバーの集中度を推定する。まばたき数に基づく集中度の推定は、学習処理の場合と同様に、公開されている技術を用いて行われてよい。推定部５はまた、入力された画像から現在の要求先メンバーの感情（喜怒哀楽など）を機械学習によって推定することができる。画像からの感情の推定もまた、学習処理の場合と同様に、公開されている技術を用いて行われてよい。なお、推定部５によって用いられる入力データは、モデルの学習に用いられたのと同じ特徴量であれば任意のものでよい。

　ステップＳ２０３において、推定部５は、生成された入力データを用いて推定処理を行う。すなわち、推定部５は、モデル記憶部２０から読み出した最新の学習済みモデルに対し、入力データを入力し、モデルからの出力を推定結果として取得する。実施形態によれば、推定部５は、アクセスを要求する要求元メンバーと要求先メンバーとの関係を表す第１の特徴量と、要求先メンバーの状態を表す第２の特徴量とを入力したときに、要求元メンバーからのアクセス要求に対する要求先メンバーの応答の結果を出力するように学習された学習済みモデルに対し、学習に用いられたのと同じ、要求先メンバーと要求元メンバーとの関係を表す第１の特徴量と、作業者の状態を表す第２の特徴量とをモデルに入力することによって、モデルからの出力として推定結果を得る。言い換えれば、推定部５は、学習部３によって学習された学習済みモデルに対し、作業者の感情、作業者の脈拍数、作業者の集中度、および作業者と要求元メンバーとの関係を表す情報を入力することによって、出力として推定結果を得る。推定結果は、応答の度合いを表す情報を含み、例えば、アクセス要求が受け入れられる確率または拒否される確率を数値化したものとして得られる。推定部５は、推定結果を表示生成部４に渡す。

　ステップＳ１０４において、表示生成部４は、推定結果をもとに表示情報を生成し、表示要求を発信した情報処理端末に表示情報を送信する。一実施形態によれば、表示生成部４は、要求先ＩＤに基づき作業者情報取得部１から作業者の画像を取得し、その画像に推定結果に基づく情報を重畳表示させる表示情報を生成する。より詳細には、表示情報は、作業者の画像の背景部分にアクセス要求が受け入れられる確率の高さに応じた「オーラ」を重畳表示させる。

　以上のように、コミュニケーション支援装置１００は、アクセスしようとする相手の現在の状況と相手との関係に基づいて推定処理を行う。さらにコミュニケーション支援装置１００は、推定結果に基づいて、アクセスしようとする相手の状況を推測できる表示情報を自動的に作成する。

　（３）効果
　以上詳述したように、一実施形態に係るコミュニケーション支援装置１００は、他のメンバーからのアクセス要求に対して要求先の作業者からの応答があった場合に、当該作業者を撮影した画像と作業者のＩＤとを含む作業者情報と、要求元メンバーのＩＤと、アクセス要求に対する上記応答の結果を表す応答情報とを取得し、これらから抽出される情報を教師データとして用いて、モデルの学習を行う。一実施形態では、上記の情報から抽出される、作業者と要求元メンバーとの間の関係を表す第１の特徴量と、作業者の状態を表す第２の特徴量とを入力したときに、上記の応答の結果を出力するように、モデルの学習が行われる。作業者情報は、作業者の生体情報を含み得る。作業者の生体情報は、脈拍数およびまばたき数を表す情報を含み得る。第２の特徴量は、作業者の脈拍数、感情または集中度を表す特徴量であり得る。一例として、作業者の感情、作業者の脈拍数、作業者の集中度、作業者とアクセス要求の要求元メンバーとの関係を表す情報、および応答結果の組合せが教師データとして用いられる。

　これにより、アクセス要求の要求先メンバーの画像および識別情報を含む情報ならびに要求元メンバーの識別情報と、アクセス要求に対する応答の結果との関係を反映する機械学習モデルを得ることができる。得られる機械学習モデルは、個々のメンバーの区別またはメンバー間の関係までも考慮したものとなる。

　一実施形態に係るコミュニケーション支援装置１００は、さらに、上記の学習済みモデルを用いて、アクセス要求をしようとする要求元メンバーの識別情報と、アクセス要求の要求先メンバーの画像および識別情報を含む情報とから抽出される情報を入力することによって、要求元メンバーが要求先メンバーに対してアクセス要求をする場合の応答の度合いを推定する。一例として、モデルに入力される情報は、要求先メンバーの感情、要求先メンバーの脈拍数、要求先メンバーの集中度、要求先メンバーと要求元メンバーとの関係を表す情報を含む。コミュニケーション支援装置１００はさらに、推定された応答の度合いを表す情報を表示するための表示情報を生成する。一例として、表示情報は、要求先メンバーの画像に、推定結果を反映するステータス情報（オーラ）を重畳表示させる。

　これにより、他のメンバーにアクセスを要求しようとするメンバーは、あらかじめ上記表示情報をもとにどのような応答が得られるかの推定結果を確認することができる。例えば、表示を見たメンバーは、受け入れられる確率が高ければすぐにアクセスを要求し、拒絶される確率が高ければ時間をおいて再度推定結果を確認するなどの対応をとることができる。

　以上のようなコミュニケーション支援装置１００により、推定結果が視覚的に表示されるので、遠隔で作業している人同士が、コミュニケーションをとりたい相手が現在どのような状況であるか（ただちにコミュニケーションがとれる状態であるか）を、単なる映像または画像から得られる情報以上に掌握でき、安心して相手にアクセスすることができる。また、コミュニケーション支援装置１００は、作業者に特別な入力を要求することなく学習および推定処理を行うことができる。したがって、いずれかのメンバーから表示要求として他のメンバーのＩＤを受け付けたときに、当該他のメンバーの現在の状況を自動で判断し反映することができ、作業者の負担を軽減することができる。さらに、作業ステータスの設定し忘れによるコミュニケーション・ロスや、意思疎通の齟齬を防止することができるようになる。

　すなわち、上記実施形態のコミュニケーション支援装置１００によれば、個々の作業者が自身の状況を都度入力する必要なしに、作業者の状況、例えばコミュニケーションに応じられるかどうか、を他の作業者が推測するのに役立つ情報を生成できる、コミュニケーション支援技術が提供される。

　［他の実施形態］
　なお、この発明は上記実施形態に限定されるものではない。例えば、上記実施形態では、協調作業をするチームのメンバーから得られる情報に基づいて学習処理および推定処理の両方を行うものとして説明したが、必ずしもこれに限られない。学習処理の対象メンバーと、推定処理の対象メンバーは、同一でもよいし、一部が重複してもよいし、異なるものでもよい。例えば、あるチームから得られた情報に基づき学習を行い、学習済みのモデルを別のチームに対して用いて推定を行ってもよい。

　教師データとして使用する応答結果は、アクセス要求を受け入れたか拒否したかの二値であってもよいし、多値の情報、例えば、応答までに何秒かかったかの経過時間などを用いてもよい。

　また、学習処理と推定処理は、別個の装置によって行われてもよい。例えば、チームのメンバーが使用する複数の情報処理端末と、各情報処理端末と通信可能なサーバコンピュータとを含む、コミュニケーション支援システムを想定する場合に、サーバコンピュータが学習処理を実行し、各情報処理端末が学習済みモデルを用いて推定処理を実行してもよい。

　さらに、コミュニケーション支援装置１００が備えるものとして説明した各機能部および各記憶部を、複数の装置に分散配置し、これらの装置が互いに連携することにより処理を行うようにしてもよい。例えば、コミュニケーション支援装置１００は推定処理までを実施し、推定結果を他の装置に出力して、他の装置が推定結果に基づき表示情報の生成処理を行うことも可能である。また各機能部は、回路を用いることで実現されてもよい。回路は、特定の機能を実現する専用回路であってもよいし、プロセッサのような汎用回路であってもよい。

　さらに、以上で説明した各処理の流れは、説明した手順に限定されるものではなく、いくつかのステップの順序が入れ替えられてもよいし、いくつかのステップが同時並行で実施されてもよい。また、以上で説明した一連の処理は、時間的に連続して実行される必要はなく、各ステップは任意のタイミングで実行されてもよい。例えば、学習処理に関して説明した、ステップＳ１０１の作業者情報およびアクセス情報の取得処理、ステップＳ１０２の教師データ生成処理、ステップＳ１０３の学習処理は、必ずしも連続的に実行される必要はない。取得した作業者情報およびアクセス情報を蓄積し、一定時間の経過後、または一定量蓄積されてから、後続の教師データ生成処理や学習処理を実行してもよい。

　以上で記載した手法は、計算機（コンピュータ）に実行させることができるプログラム（ソフトウェア手段）として、例えば磁気ディスク（フロッピー（登録商標）ディスク、ハードディスク等）、光ディスク（ＣＤ－ＲＯＭ、ＤＶＤ、ＭＯ等）、半導体メモリ（ＲＯＭ、ＲＡＭ、フラッシュメモリ等）等の記録媒体（記憶媒体）に格納し、また通信媒体により伝送して頒布することもできる。なお、媒体側に格納されるプログラムには、計算機に実行させるソフトウェア手段（実行プログラムのみならずテーブル、データ構造も含む）を計算機内に構成させる設定プログラムをも含む。上記装置を実現する計算機は、記録媒体に記録されたプログラムを読み込み、また場合により設定プログラムによりソフトウェア手段を構築し、このソフトウェア手段によって動作が制御されることにより上述した処理を実行する。なお、本明細書でいう記録媒体は、頒布用に限らず、計算機内部あるいはネットワークを介して接続される機器に設けられた磁気ディスク、半導体メモリ等の記憶媒体を含むものである。

　なお、この発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の発明が含まれており、開示される複数の構成要件から選択された組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、課題が解決でき、効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。

　１００…コミュニケーション支援装置
　１…作業者情報取得部
　２…アクセス情報取得部
　３…学習部
　４…表示生成部
　５…推定部
　１０…組織情報記憶部
　２０…モデル記憶部

Claims

　第１のユーザを撮影した画像と前記第１のユーザの識別情報とを含む、前記第１のユーザに関する第１のユーザ情報を取得する、第１の取得部と、
　前記第１のユーザへのアクセスを要求する第２のユーザの識別情報を取得する、第２の取得部と、
　前記第２のユーザからのアクセス要求に対する前記第１のユーザの応答の結果を表す応答情報を取得する、第３の取得部と、
　前記第１のユーザ情報、前記第２のユーザの識別情報および前記応答情報に基づく教師データを用いてモデルの学習を行う、学習部と
　を備える、コミュニケーション支援装置。
　前記学習部は、前記第１のユーザの識別情報と前記第２のユーザの識別情報とから決定される前記第１のユーザと前記第２のユーザの関係を表す第１の特徴量と、前記第１のユーザ情報から抽出される前記第１のユーザの状態を表す第２の特徴量とを入力したときに、前記応答の結果を出力するように前記モデルの学習を行う、
　請求項１に記載のコミュニケーション支援装置。
　前記第１のユーザ情報は、前記第１のユーザの生体情報をさらに含み、
　前記学習部は、前記第２の特徴量として、前記第１のユーザを撮影した画像または前記第１のユーザの生体情報から、前記第１のユーザの脈拍数、感情または集中度を表す特徴量を抽出し、前記モデルの学習を行う、
　請求項２に記載のコミュニケーション支援装置。
　第１のユーザを撮影した画像と前記第１のユーザの識別情報とを含む、前記第１のユーザに関する第１のユーザ情報を取得する、第１の取得部と、
　前記第１のユーザへのアクセスを要求可能な第２のユーザの識別情報を取得する、第２の取得部と、
　前記第１のユーザ情報および前記第２のユーザの識別情報に基づいて、前記第２のユーザが前記第１のユーザへのアクセスを要求する場合の当該要求に対する前記第１のユーザの応答の度合いを推定する、推定部と、
　推定された前記応答の度合いを表す情報を表示するための表示情報を生成する、表示生成部と
　を備えるコミュニケーション支援装置。
　前記推定部は、アクセスを要求する要求元ユーザと当該アクセスの要求先ユーザとの関係を表す第１の特徴量と、前記要求先ユーザの状態を表す第２の特徴量とを入力したときに、前記要求元ユーザからのアクセス要求に対する前記要求先ユーザの応答の結果を出力するように学習された学習済みモデルに対し、前記第１のユーザ情報および前記第２のユーザの識別情報から抽出される前記第１の特徴量および前記第２の特徴量を入力し、前記学習済みモデルからの出力を得ることによって、前記第１のユーザの応答の度合いを推定する、
　請求項４に記載のコミュニケーション支援装置。
　第１のユーザを撮影した画像と前記第１のユーザの識別情報とを含む、前記第１のユーザに関する第１のユーザ情報を取得することと、
　前記第１のユーザへのアクセスを要求する第２のユーザの識別情報を取得することと、
　前記第２のユーザからのアクセス要求に対する前記第１のユーザの応答の結果を表す応答情報を取得することと、
　前記第１のユーザ情報、前記第２のユーザの識別情報および前記応答情報に基づく教師データを用いてモデルの学習を行うことと
　を備えるコミュニケーション支援方法。
　第１のユーザを撮影した画像と前記第１のユーザの識別情報とを含む、前記第１のユーザに関する第１のユーザ情報を取得することと、
　前記第１のユーザへのアクセスを要求可能な第２のユーザの識別情報を取得することと、
　前記第１のユーザ情報および前記第２のユーザの識別情報に基づいて、前記第２のユーザが前記第１のユーザへのアクセスを要求する場合の当該要求に対する前記第１のユーザの応答の度合いを推定することと、
　推定された前記応答の度合いを表す情報を表示するための表示情報を生成することと
　を備えるコミュニケーション支援方法。
　請求項１乃至５のいずれか一項に記載のコミュニケーション支援装置の各部による処理をコンピュータに実行させるプログラム。