JP2022072949A - Program, method, information processing apparatus, and system - Google Patents
Program, method, information processing apparatus, and system Download PDFInfo
- Publication number
- JP2022072949A JP2022072949A JP2020182664A JP2020182664A JP2022072949A JP 2022072949 A JP2022072949 A JP 2022072949A JP 2020182664 A JP2020182664 A JP 2020182664A JP 2020182664 A JP2020182664 A JP 2020182664A JP 2022072949 A JP2022072949 A JP 2022072949A
- Authority
- JP
- Japan
- Prior art keywords
- party
- message
- advice
- content
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 57
- 230000010365 information processing Effects 0.000 title claims description 13
- 238000004891 communication Methods 0.000 claims abstract description 130
- 238000004458 analytical method Methods 0.000 claims abstract description 73
- 230000004044 response Effects 0.000 claims description 105
- 230000008569 process Effects 0.000 claims description 43
- 238000013519 translation Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 description 69
- 238000010586 diagram Methods 0.000 description 54
- 230000006870 function Effects 0.000 description 54
- 238000000605 extraction Methods 0.000 description 30
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000003825 pressing Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000007688 edging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/02—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本開示は、プログラム、方法、情報処理装置、及びシステムに関する。 The present disclosure relates to programs, methods, information processing devices, and systems.
ユーザ同士の遠隔通信において、通信セッションに含まれるメッセージを分析してタスクを特定し、特定されたタスクを完了する支援を提供するアプリケーションが用いられることがある。特許文献1では、この種のアプリケーションにより実現される仮想アシスタントを用いた通信セッションについて開示されている。
In remote communication between users, applications may be used that analyze messages contained in a communication session to identify a task and provide assistance in completing the identified task.
特許文献1では、仮想アシスタントは、クライアントデバイスのユーザによって提供されたメッセージが、通信セッションの他の参加者を意図したものか、又は仮想アシスタントを意図したものかを判定する。このため、ユーザは、仮想アシスタントがユーザの特定のタスクを支援する要求又はコマンド等の仮想アシスタントを意図したメッセージを入力するようにしている。
In
しかしながら、特許文献1に記載の仕様では、仮想アシスタントへの入力ためにメッセージを発信する必要があるため、ユーザ間の会話の流れが止まることになり、利便性に欠ける場合がある。
However, in the specification described in
そこで、本開示では、遠隔通信におけるユーザの利便性を向上させることを目的とする。 Therefore, it is an object of the present disclosure to improve the convenience of the user in remote communication.
上記課題を解決するため、本開示のプログラムは、プロセッサと、メモリとを備えるコンピュータに実行させるためのプログラムである。プログラムは、プロセッサに、第1者と第2者との遠隔通信において、第1者又は第2者から入力されるメッセージを認識するステップと、認識されたメッセージを分析するステップと、第1者から第2者へのメッセージ、又は第2者から第1者へのメッセージについての分析の結果に基づき、第1者へのサポートが必要か否かを判定するステップと、必要と判定する場合、分析の結果に基づき、第1者に対する助言を与える助言内容を生成するステップとを実行させる。 In order to solve the above problems, the program of the present disclosure is a program for causing a computer including a processor and a memory to execute the program. The program has a step of recognizing a message input from the first party or the second party, a step of analyzing the recognized message, and a first party in the remote communication between the first party and the second party to the processor. Based on the results of the analysis of the message from the second party to the second party, or the message from the second party to the first party, a step to determine whether or not support to the first party is necessary, and when it is determined to be necessary. Based on the result of the analysis, the step of generating the advice content that gives the advice to the first party is executed.
本開示によれば、遠隔通信におけるユーザの利便性を向上させることができる。 According to the present disclosure, it is possible to improve the convenience of the user in remote communication.
以下、図面を参照しながら、実施の形態について説明する。なお、以下に説明する本実施形態は、特許請求の範囲に記載された本開示の内容を不当に限定するものではない。また本実施形態で説明される構成の全てが、本開示の必須構成要件であるとは限らない。 Hereinafter, embodiments will be described with reference to the drawings. It should be noted that the present embodiment described below does not unreasonably limit the content of the present disclosure described in the claims. Moreover, not all of the configurations described in the present embodiment are essential constituent requirements of the present disclosure.
<概要>
本実施形態に係る情報処理装置10は、自装置のユーザと、他装置のユーザとの遠隔通信において、仮想アシスタントを動作させる。本実施形態に係る仮想アシスタントは、セッション中のメッセージを分析し、分析した内容に基づく助言、又は補助をする。
<Overview>
The
(第1の実施形態)
<1 全体構成>
図1は、第1の実施形態に係るシステム1の全体構成の例を示す図である。図1に示すように、システム1は、端末装置10と、サーバ20とを備えている。端末装置10と、サーバ20とは、有線又は無線の通信規格を用い、ネットワーク80を介して相互に通信可能に接続されている。ネットワーク80は、例えば、インターネット、及び/又は通信事業者が提供する通信網等により実現される。図示の例では、複数の端末装置10がシステム1に含まれている。
(First Embodiment)
<1 Overall configuration>
FIG. 1 is a diagram showing an example of the overall configuration of the
なお、図1では、サーバ20が1台のコンピュータである場合を示しているが、サーバ20は、複数台のコンピュータが組み合わされて実現されてもよい。また、図1では、端末装置10が1台である場合を示しているが、システム1に収容される端末装置10の台数は、複数台であっても構わない。
Although FIG. 1 shows a case where the
端末装置10は、サーバ20により提供されるサービスを利用するユーザが使用する端末である。例えば、端末装置10は、サーバ20により提供される遠隔会議に参加する参加者が利用する端末である。端末装置10は、例えば、据え置き型のPC(Personal Computer)、ラップトップPC、ヘッドマウントディスプレイ等により実現される。また、端末装置10は、スマートフォン、又はタブレット端末等の携行性を備えたコンピュータであってもよい。
The
図1に示すように、端末装置10は、通信IF(Interface)12と、入力装置13と、出力装置14と、メモリ15と、ストレージ16と、プロセッサ19とを備える。通信IF12、入力装置13、出力装置14、メモリ15、ストレージ16、及びプロセッサ19は、例えば、バスを介して互いに通信可能に接続されている。
As shown in FIG. 1, the
通信IF12は、端末装置10が外部の装置と通信するため、信号を送受信するためのインタフェースである。入力装置13は、ユーザからの入力操作を受け付けるための入力装置である。入力装置13は、例えば、タッチパネル、タッチパッド、マウス等のポインティングデバイス、キーボード等を含む。出力装置14は、ユーザに対し情報を提示するための出力装置である。出力装置14は、例えば、ディスプレイ、スピーカ等を含む。
The communication IF 12 is an interface for transmitting and receiving signals because the
メモリ15は、プログラム、及び、プログラム等で処理されるデータ等を一時的に記憶するためのものであり、例えば、DRAM(Dynamic Random Access Memory)等の揮発性のメモリにより実現される。ストレージ16は、データを保存するための記憶装置であり、例えば、フラッシュメモリ、HDD(Hard Disc Drive)等の不揮発性のメモリにより実現される。プロセッサ19は、プログラムに記述された命令セットを実行するためのハードウェアであり、演算装置、レジスタ、周辺回路等により構成される。
The
サーバ20は、サービスに関する情報を管理し、管理している情報を参照し、サービスを提供する装置である。例えば、サーバ20は、遠隔会議に関する情報を管理し、管理している情報を参照して遠隔会議をサービスとして提供する。サーバ20は、例えば、ネットワーク80に接続されたコンピュータである。
The
なお、サーバ20により提供されるサービスは、遠隔会議に限定されない。複数のユーザの間で遠隔通信を確立させるサービスであれば、遠隔会議以外であっても構わない。また、サーバ20により提供されるサービスは、メッセージを音声で伝えるものに限定されない。メッセージを伝えるサービスであれば、テキスト形式でメッセージを伝えるサービス、つまり、チャットサービスであってもよい。
The service provided by the
図1に示すように、サーバ20は、通信IF22と、入出力IF23と、メモリ25と、ストレージ26と、プロセッサ29とを備える。通信IF22、入出力IF23、メモリ25、ストレージ26、及びプロセッサ29は、例えば、バスを介して互いに通信可能に接続されている。
As shown in FIG. 1, the
通信IF22は、サーバ20が外部の装置と通信するため、信号を送受信するためのインタフェースである。入出力IF23は、ユーザからの入力操作を受け付けるための入力装置、及び、ユーザに対し情報を提示するための出力装置とのインタフェースとして機能する。メモリ25は、プログラム、及び、プログラム等で処理されるデータ等を一時的に記憶するためのものであり、例えばDRAM等の揮発性のメモリにより実現される。
The communication IF 22 is an interface for transmitting and receiving signals because the
ストレージ26は、データを保存するための記憶装置であり、例えばフラッシュメモリ、HDD等の不揮発性のメモリにより実現される。ストレージ26は、必ずしも単独の回路により実現されなくてもよい。ストレージ26は、例えば、複数の記憶回路により実現されてもよい。プロセッサ29は、プログラムに記述された命令セットを実行するためのハードウェアであり、演算装置、レジスタ、周辺回路などにより構成される。
The
<1.1 端末装置の構成>
図2は、本実施形態のシステム1に含まれる端末装置10の構成を示すブロック図である。図2に示すように、端末装置10は、通信部121と、入力装置13と、出力装置14と、カメラ160と、記憶部170と、制御部180とを備える。
<1.1 Configuration of terminal equipment>
FIG. 2 is a block diagram showing a configuration of a
通信部121は、端末装置10が他の装置と通信するための処理を行う。通信部121は、制御部180で生成された信号に送信処理を施し、外部(例えば、サーバ20)へ送信する。通信部121は、外部から受信した信号に受信処理を施し、制御部180へ出力する。
The
入力装置13は、端末装置10を所有するユーザが指示を入力するための装置である。入力装置13は、例えば、マウス131、キーボード132、及び、操作面へ触れることで指示が入力されるタッチ・センシティブ・デバイス133等により実現される。また、入力装置13は、マイク134により実現される。入力装置13は、ユーザから入力される指示又は音声を電気信号へ変換し、電気信号を制御部180へ出力する。なお、入力装置13は、マウス131、及びキーボード132等の物理的な操作デバイスに限定されない。入力装置13には、例えば、外部の入力機器から入力される電気信号を受け付ける受信ポートが含まれてもよい。
The
出力装置14は、端末装置10を所有するユーザへ情報を提示するための装置である。出力装置14は、例えば、ディスプレイ141、スピーカ142等により実現される。ディスプレイ141は、制御部180の制御に応じて、画像、動画、テキスト等のデータを表示する。ディスプレイ141は、例えば、LCD(Liquid Crystal Display)、又は有機EL(Electro-Luminescence)ディスプレイ等によって実現される。スピーカ142は、制御部180の制御に応じて、音声を出力する。
The
カメラ160は、受光素子により光を受光し、撮影信号として出力するためのデバイスである。カメラ160は、例えば、光を受光するレンズがディスプレイ141と並べて設置されている。これにより、カメラ160は、ディスプレイ141を視認するユーザを撮影可能となっている。
The
記憶部170は、例えば、メモリ15、及びストレージ16等により実現され、端末装置10が使用するデータ、及びプログラムを記憶する。具体的には、記憶部170は、例えば、第1アプリケーション171、第2アプリケーション172を記憶する。第1アプリケーション171は、他のユーザとの遠隔通信を実現するためのアプリケーションである。第2アプリケーション172は、遠隔通信において仮想アシスタントを動作させるためのアプリケーションである。また、記憶部170は、遠隔通信における対話の履歴に関する対話履歴データ173を記憶する。
The
なお、図2では、記憶部170に記憶される第2アプリケーション172が1つである場合を示しているが、記憶部170に記憶される第2アプリケーション172は、複数であっても構わない。第2アプリケーション172は、ユーザに対して与える助言の内容に応じ、様々な種類があって構わない。ユーザは、用途に応じた第2アプリケーション172をダウンロードし、必要に応じて実行する第2アプリケーション172を切り換えるようにしてもよい。
Although FIG. 2 shows a case where the
第2アプリケーション172は、第1学習済みモデルに関するデータ、第2学習済みモデルに関するデータ、及び第2アプリケーション172についてのプログラムに関するデータを含む。第1及び第2学習済みモデルは、例えば、機械学習により生成される。本実施形態において、学習済みモデルとは、モデル学習プログラムに従って機械学習モデルに機械学習を行わせることで生成されるモデルを表す。
The
本実施形態に係る学習済みモデルは、例えば、ユーザから入力される信号に基づき、所定の推論を実施する、複数の関数が合成されたパラメータ付き合成関数である。パラメータ付き合成関数は、複数の調整可能な関数及びパラメータの組合せにより定義される。本実施形態に係る学習済みモデルは、上記の要請を満たす如何なるパラメータ付き合成関数であってもよい。 The trained model according to the present embodiment is, for example, a synthetic function with parameters in which a plurality of functions are synthesized to perform a predetermined inference based on a signal input from a user. A parameterized composition function is defined by a combination of multiple adjustable functions and parameters. The trained model according to the present embodiment may be a synthetic function with any parameter that satisfies the above requirements.
例えば、学習済みモデルが順伝播型の多層化ネットワークを用いて生成される場合、パラメータ付き合成関数は、例えば、重み行列を用いた各層間の線形関係、各層における活性化関数を用いた非線形関係(又は線形関係)、及びバイアスの組み合わせとして定義される。重み付行列、及びバイアスは、多層化ネットワークのパラメータと呼ばれる。パラメータ付き合成関数は、パラメータをどのように選ぶかで、関数としての形を変える。多層化ネットワークでは、構成するパラメータを適切に設定することで、出力層から好ましい結果を出力することが可能な関数を定義することができる。 For example, if the trained model is generated using a forward propagation multi-layered network, the parameterized composition function may be, for example, a linear relationship between layers using a weight matrix, a non-linear relationship using an activation function at each layer. (Or linear relationship), and defined as a combination of biases. Weighted matrices and biases are called multi-layered network parameters. A composite function with parameters changes its form as a function depending on how the parameters are selected. In a multi-layered network, by appropriately setting the parameters to be configured, it is possible to define a function capable of outputting a preferable result from the output layer.
本実施形態に係る多層化ネットワークとしては、例えば、深層学習(Deep Learning)の対象となる多層ニューラルネットワークである深層ニューラルネットワーク(Deep Neural Network:DNN)が用いられ得る。DNNとしては、例えば、画像を対象とする畳み込みニューラルネットワーク(Convolution Neural Network:CNN)を用いてもよい。また「Transformer」と呼ばれる注意機構(アテンション )を用いた多層ニューラルネットワークを用いても良い。 As the multi-layered network according to the present embodiment, for example, a deep neural network (DNN), which is a multi-layered neural network targeted for deep learning, can be used. As the DNN, for example, a convolutional neural network (CNN) for an image may be used. Further, a multi-layer neural network using an attention mechanism (attention) called "Transformer" may be used.
第1学習済みモデルは、文章のインテント及びスロットの認識に用いられるモデルである。本実施形態において、インテントは、対象となる文章の意図の種別を意味する。スロットは、インテントが示す意図を処理するために必要な付属的情報を意味する。なお、本実施形態において、「文章」は、インテント及びスロットを認識する対象となり得る情報を総称して便宜的に表すものである。具体的には、例えば、文章には、ユーザの発話音声をテキスト化したもの、ユーザが入力したテキスト等が含まれる。 The first trained model is a model used for recognizing sentence intents and slots. In the present embodiment, the intent means the type of intention of the target sentence. A slot means ancillary information necessary to process the intent indicated by the intent. In the present embodiment, the “text” is a general term for information that can be a target for recognizing an intent and a slot, and is used for convenience. Specifically, for example, the text includes a text of the user's spoken voice, a text input by the user, and the like.
第1学習済みモデルは、文章と、正解ラベルとの組み合わせを含む学習データを用いて学習される。本実施形態では、ある文章に対応する正解ラベルは、その文章のインテントの種別、スロットの種別、及びスロットの値を示すラベルである。インテントの種別によって、スロットは複数の場合もあり、また存在しない場合もある。なお、本実施形態に係るラベル付き学習データの態様は、あくまで一例である。 The first trained model is trained using training data including a combination of sentences and correct labels. In the present embodiment, the correct answer label corresponding to a certain sentence is a label indicating the intent type, the slot type, and the slot value of the sentence. Depending on the type of intent, there may be multiple slots or none. The aspect of the labeled learning data according to the present embodiment is merely an example.
第1学習済みモデルは、入力情報(文章)に基づくデータを入力し、インテントの種別、スロットの種別、及びスロットの値を出力する。入力情報に基づくデータは、例えば、対象となる文章について、前処理や、特徴量抽出等の必要な処理が行われて、学習済みモデルが処理可能な情報へと変換されたデータを表す。 The first trained model inputs data based on input information (sentence) and outputs an intent type, a slot type, and a slot value. The data based on the input information represents, for example, data in which the target sentence is subjected to necessary processing such as preprocessing and feature amount extraction and converted into information that can be processed by the trained model.
なお、第1学習済みモデルは、文章のインテント、及びスロットの認識に用いられるモデルであればよく、その機能が本実施形態に係る第1学習済みモデルと同じである必要はない。一例として、第1学習済みモデルは、複数のインテントの種別の候補について正しい種別である確率を出力したり、複数のスロットの値の候補について正しい値である確率を出力したりするモデルであってもよい。 The first trained model may be any model used for recognizing sentence intents and slots, and its function does not have to be the same as that of the first trained model according to the present embodiment. As an example, the first trained model is a model that outputs the probability of being the correct type for candidates of multiple intent types, or outputs the probability of being the correct value for candidates of values of multiple slots. May be.
第2学習済みモデルは、固有名詞の抽出に用いられるモデルである。第2学習済みモデルは、文章と、正解ラベルとの組み合わせを含む学習データを用いて学習される。本実施形態では、ある文章に対応する正解ラベルは、固有表現についての分類の定義、及び固有表現の値を示すラベルである。なお、本実施形態に係るラベル付き学習データの態様は、あくまで一例である。 The second trained model is a model used for extracting proper nouns. The second trained model is trained using the training data including the combination of the sentence and the correct answer label. In the present embodiment, the correct answer label corresponding to a certain sentence is a label indicating the definition of the classification for the named entity and the value of the named entity. The aspect of the labeled learning data according to the present embodiment is merely an example.
第2学習済みモデルは、入力情報(文章)に基づくデータを入力し、固有表現についての分類、及び固有表現の値を出力する。入力情報に基づくデータは、例えば、対象となる文章について、前処理や、特徴量抽出等の必要な処理が行われて、学習済みモデルが処理可能な情報へと変換されたデータを表す。 The second trained model inputs data based on the input information (sentence), classifies the named entity, and outputs the value of the named entity. The data based on the input information represents, for example, data in which the target sentence is subjected to necessary processing such as preprocessing and feature amount extraction and converted into information that can be processed by the trained model.
なお、第2学習済みモデルは、固有名詞の抽出に用いられるモデルであればよく、その機能が本実施形態に係る第2学習済みモデルと同じである必要はない。 The second trained model may be any model used for extracting proper nouns, and its function does not have to be the same as that of the second trained model according to the present embodiment.
制御部180は、プロセッサ19が記憶部170に記憶されるプログラムを読み込み、プログラムに含まれる命令を実行することにより実現される。制御部180は、端末装置10の動作を制御する。具体的には、例えば、制御部180は、操作受付部181、通信制御部182、助言制御部183、表示制御部184としての機能を発揮する。
The
操作受付部181は、入力装置13から入力されるユーザの操作を受け付けるための処理を行う。
The
通信制御部182は、端末装置10が、遠隔通信に参加する他の端末装置10と、通信プロトコルに従って通信するための処理を行う。通信制御部182は、例えば、第1アプリケーション171がプロセッサ19により実行されることで実現される。通信制御部182は、例えば、マイク134から入力される音声に基づくデータを遠隔通信に参加する他の端末装置10へ送信する。また、通信制御部182は、他の端末装置10から送信されるデータを受信し、音声に変換してスピーカ142から出力する。
The
また、通信制御部182は、例えば、キーボード132、タッチ・センシティブ・デバイス133等から入力されるテキストデータを遠隔通信に参加する他の端末装置10へ送信する。また、通信制御部182は、他の端末装置10から送信されるデータを受信し、テキストデータに変換してディスプレイ141から出力する。
Further, the
助言制御部183は、通信セッションに含まれるメッセージを分析し、分析結果に基づく助言をユーザに与える処理を行う。助言制御部183は、例えば、第2アプリケーション172がプロセッサ19により実行されることで実現される。具体的には、助言制御部183は、例えば、図3に示す処理を実施する。
The
図3は、助言制御部183の機能構成の例を表すブロック図である。図3に示す助言制御部183は、音声認識部1831、意図解釈部1832、固有名詞抽出部1833、助言判定部1834、外部サービス呼出部1835、応答生成部1836を有する。
FIG. 3 is a block diagram showing an example of the functional configuration of the
音声認識部1831は、ユーザが発話した音声を認識し、テキスト形式のデータに変換する。音声認識の手法は、既存のいかなる手法を用いても構わない。なお、ユーザがテキスト形式で情報を入力する場合は、音声認識部1831はテキスト入力部であっても構わない。
The
意図解釈部1832は、テキストデータに含まれる意図を解釈する。具体的には、意図解釈部1832は、例えば、第1学習済みモデルを用い、入力されるテキストデータに基づき、インテントの種別、スロットの種別、及びスロットの値を出力する。
The
固有名詞抽出部1833は、テキストデータに含まれる固有名詞を抽出する。具体的には、固有名詞抽出部1833は、例えば、第2学習済みモデルを用い、入力されるテキストデータに基づき、固有表現についての分類、及び固有表現の値を出力する。なお、意図解釈部1832と、固有名詞抽出部1833とは、必ずしも両方が設けられていなくても構わない。いずれか一方が設けられている場合であっても構わない。
The proper
助言判定部1834は、テキストデータを分析した結果に基づき、ユーザに対して助言するか否かを判定する。具体的には、助言判定部1834は、例えば、対話履歴データ173を参照し、意図解釈部1832により解釈された意図に対して助言が必要か否かを判定する。助言判定部1834は、例えば、解釈された意図が、ユーザが所定の情報を確認する必要がある内容の場合、助言が必要であると判定する。
The
また、助言判定部1834は、例えば、固有名詞抽出部1833により抽出された固有名詞に対して助言が必要か否かを判定する。助言判定部1834は、例えば、固有名詞が略称である場合、専門用語である場合、予め登録される一般的な用語に含まれていない場合等に助言が必要と判定する。なお、助言判定部1834は、所定の固有名詞が連呼される場合にも助言が必要と判定してもよい。また、過去の議事録、社内文書、一般のWeb文書から、その単語を含む文書数に応じて助言の要否を判定してもよい。つまり、例えば、議事録になく、かつ、重要度・専門性が高い固有名詞に対し、助言が必要と判定するようにしてもよい。文章中に含まれる単語の重要度を評価する手法は、例えば、tf-idf等、既存の手法を利用してもよい。このように、単語の重要度に基づいて助言の要否を判定することで、登録されていない固有名詞であっても、当人が知り得たである固有名詞については助言がされなくなる。このため、過剰説明を避けることが可能となる。
Further, the
また、助言判定部1834は、助言をするのに必要な情報を外部サービスから取得するか否かを判定する。助言判定部1834は、例えば、意図解釈部1832により解釈された意図に対して応答するために、外部からの情報が必要である場合、外部サービスから情報を取得する必要があると判定する。また、助言判定部1834は、例えば、固有名詞抽出部1833により抽出された固有名詞を説明するのに外部からの情報が必要である場合、外部サービスから情報を取得する必要があると判定する。
In addition, the
外部サービス呼出部1835は、助言に要する情報を外部サービスから取得する。例えば、外部サービス呼出部1835は、解釈された意図に対して応答するための情報を外部サービスから取得する。また、外部サービス呼出部1835は、固有名詞を説明するための情報を外部サービスから取得する。外部サービス呼出部1835は、例えば、所定のAPIにより実現される。
The external
応答生成部1836は、助言内容を生成する。具体的には、例えば、応答生成部1836は、解釈された意図と対応する処理を実行し、実行結果に基づいて助言を生成する。また、応答生成部1836は、例えば、外部サービスから取得された情報に基づき、解釈された意図、又は固有名詞に対する助言を生成する。
The
表示制御部184は、ユーザに対して種々の情報を提示するため、出力装置14を制御する。具体的には、例えば、表示制御部184は、助言制御部183で生成された助言をディスプレイ141に表示させる。
The
<2.動作>
複数のユーザにより遠隔通信が実施される際の助言制御部183の動作について説明する。
<2. Operation>
The operation of the
図4は、遠隔通信がなされる際のシステム1の機能構成の例を示すブロック図である。図5は、助言を生成する際の助言制御部183の動作の一例を示すフローチャートである。図4では、端末装置10-1~10-4の間で遠隔会議が開催され、端末装置10-1で仮想アシスタントとしての助言制御部183が起動する場合を示している。
FIG. 4 is a block diagram showing an example of the functional configuration of the
図6は、ユーザ1~ユーザ4の間で開催される遠隔会議での発言の例を表す図である。図6に示すように、まず、ユーザ1からユーザ2~4へ、メッセージM1:「最近の音声認識サービスにはどんなものがありますか?」との質問が音声で投げかけられる。
FIG. 6 is a diagram showing an example of remarks at a remote conference held between
助言制御部183は、音声認識部1831により、端末装置10-1から端末装置10-2~10-4へ送信されるメッセージM1に対し、音声認識を実施する(ステップS11)。音声認識部1831は、メッセージM1についての音声データをテキストデータに変換する。
The
助言制御部183は、テキストデータに対し、固有名詞抽出処理、及び意図解釈処理を並列して実施する。図5の説明では、まず固有名詞抽出処理から説明する。
The
助言制御部183は、固有名詞抽出部1833により、テキストデータに含まれる固有名詞を抽出する(ステップS12)。具体的には、固有名詞抽出部1833は、例えば、第2学習済みモデルを用い、入力されるテキストデータに基づき、固有表現についての分類、及び固有表現の値を出力する。
The
図7は、意図解釈部1832、固有名詞抽出部1833による分析により出力される分析結果の例を表す模式図である。図7に示す例において、分析結果R1が固有名詞抽出処理の結果を表し、分析結果R2が意図解釈処理の結果を表す。図7に示す例によれば、固有名詞抽出部1833は、メッセージM1に対し、分類:「固有名詞」、固有表現の値:「音声認識サービス」を出力する。
FIG. 7 is a schematic diagram showing an example of the analysis result output by the analysis by the
助言判定部1834は、テキストデータを分析した結果に基づき、ユーザ1に対して助言するか否かを判定する(ステップS13)。具体的には、助言判定部1834は、例えば、固有名詞抽出部1833により抽出された固有名詞に対して助言が必要か否かを判定する。助言判定部1834は、例えば、「固有名詞=音声認識サービス」が、略称でなく、専門用語でなく、予め登録される一般的な用語に含まれているとして、助言が必要でないと判定し(ステップS13のNo)、メッセージM1についての処理を終了させる。
The
助言制御部183は、意図解釈部1832により、テキストデータに含まれる意図を解釈する(ステップS16)。具体的には、意図解釈部1832は、例えば、第1学習済みモデルを用い、入力されるテキストデータに基づき、インテントの種別、スロットの種別、及びスロットの値を出力する。
The
図7に示す例によれば、意図解釈部1832は、メッセージM1に対し、インテントの種別:「検索」、スロットの種別:「キーワード」、スロットの値:「音声認識サービス」を出力する。
According to the example shown in FIG. 7, the
助言判定部1834は、テキストデータを分析した結果に基づき、ユーザ1に対して助言するか否かを判定する(ステップS17)。具体的には、助言判定部1834は、例えば、対話履歴データ173を参照し、意図解釈部1832により解釈された意図に対して助言が必要か否かを判定する。助言判定部1834は、インテントの種別:「検索」、スロットの種別:「キーワード」、スロットの値:「音声認識サービス」が、例えば、会議における最初の議題であるため、又は、他者への質問であるため、助言が不要と判定し(ステップS17のNo)、メッセージM1についての処理を終了させる。
The
続いて、図6に示すように、ユーザ2は、メッセージM2:「米国のGAFAMは音声認識サービスを提供しています。」と音声でユーザ1へ回答する。
Subsequently, as shown in FIG. 6, the
助言制御部183は、音声認識部1831により、端末装置10-2から端末装置10-1へ送信されるメッセージM2に対し、音声認識を実施する(ステップS11)。音声認識部1831は、メッセージM2についての音声データをテキストデータに変換する。
The
助言制御部183は、固有名詞抽出部1833により、例えば、第2学習済みモデルを用い、入力されるテキストデータに基づき、固有表現についての分類、及び固有表現の値を出力する。図7に示す例によれば、固有名詞抽出部1833は、メッセージM2に対し、分類:「固有名詞」、固有表現の値:「GAFAM」を出力する(ステップS12)。
The
助言判定部1834は、例えば、固有名詞抽出部1833により抽出された固有名詞に対して助言が必要か否かを判定する(ステップS13)。助言判定部1834は、例えば、「固有名詞=GAFAM」が、略称であるため、助言は必要と判定し(ステップS13のYes)、処理をステップS14へ移行させる。
The
ステップS14において、助言判定部1834は、助言をするのに必要な情報を外部サービスから取得するか否かを判定する。具体的には、助言判定部1834は、例えば、抽出された固有名詞が記憶部170に登録されている用語に含まれているか否かによって、情報を外部サービスから取得するか否かを判定する。ここでは、例えば、「固有名詞=GAFAM」が記憶部170に登録されていないとし、助言判定部1834は、「固有名詞=GAFAM」についての情報を外部サービスから取得すると判定する(ステップS14のYes)。
In step S14, the
外部サービス呼出部1835は、助言に要する情報を外部サービスから取得する(ステップS15)。具体的には、例えば、外部サービス呼出部1835は、「固有名詞=GAFAM」をキーワードとして入力することで、固有名詞を説明するための情報を外部サービスで検索する。
The external
応答生成部1836は、検索結果に基づいて助言内容を生成する(ステップS110)。具体的には、例えば、応答生成部1836は、固有名詞に対して外部サービスから取得された最上位の検索結果に基づいて助言内容A1:「GAFAは、Google(登録商標), Amazon(登録商標), Facebook(登録商標), Apple(登録商標)の4社を指し、GAFAMは更にMicrosoft(登録商標)を含む5社を指します。」を生成する。これにより、図6に示すように、メッセージM2に対する仮想アシスタントの助言内容A1が生成される。
The
助言制御部183は、意図解釈部1832により、例えば、第1学習済みモデルを用い、入力されるテキストデータに基づき、インテントの種別、スロットの種別、及びスロットの値を出力する(ステップS16)。
The
図7に示す例によれば、意図解釈部1832は、メッセージM2に対し、インテントの種別:「検索」、スロットの種別:「キーワード」、スロットの値:「GAFAM」を出力する。
According to the example shown in FIG. 7, the
助言判定部1834は、例えば、対話履歴データ173を参照し、意図解釈部1832により解釈された意図に対して助言が必要か否かを判定する(ステップS17)。助言判定部1834は、インテントの種別:「検索」、スロットの種別:「キーワード」、スロットの値:「GAFAM」に対し、助言が必要と判定し(ステップS17のYes)、処理をステップS18へ移行させる。
The
ステップS18において、助言判定部1834は、助言をするのに必要な情報を外部サービスから取得するか否かを判定する。具体的には、助言判定部1834は、例えば、インテントの種別に基づき、情報を外部サービスから取得するか否かを判定する。ここでは、例えば、インテントの種別:「検索」であるため、助言判定部1834は、「キーワード=GAFAM」についての情報を外部サービスから取得すると判定する(ステップS18のYes)。
In step S18, the
外部サービス呼出部1835は、助言に要する情報を外部サービスから取得する(ステップS15)。具体的には、例えば、外部サービス呼出部1835は、「キーワード=GAFAM」を説明するための情報を外部サービスから取得する。助言制御部183は、外部サービスから情報を取得すると、処理をステップS110へ移行させる。
The external
表示制御部184は、助言制御部183で助言内容が生成されると、生成された助言内容をディスプレイ141に表示させる。図8は、仮想アシスタントからの助言内容を表示するディスプレイ141の表示例を表す模式図である。図8に示す例では、遠隔会議に出席するユーザ2~4を表す画像が表示されている。図8に示す例では、ユーザ2の発言に対して仮想アシスタントが助言を生成したため、ユーザ2が発言をしたことをユーザ1が識別可能に、ユーザ2~4が表示されている。具体的には、ユーザ2の画像が、ユーザ3、ユーザ4よりも大きく表示されている。なお、発言者の識別表示は画像を大きくすることに限られない。例えば、画像を縁取りすることで発言者を識別するようにしてもよい。
When the advice content is generated by the
また、図8に示す例では、ユーザ2の画像の下方に助言内容A1が表示されている。なお、助言内容A1の表示位置は、ユーザ1が視認しやすい位置であればどこに表示されてもよい。
Further, in the example shown in FIG. 8, the advice content A1 is displayed below the image of the
図6に示す例によれば、ユーザ2は、メッセージM2:「米国のGAFAMは音声認識サービスを提供しています。」の後、「性能は深層学習のエンドツーエンドの方式が高度化することで相当あがりそうです。」と発言する。助言判定部1834は、このメッセージの分析結果に基づき、このメッセージについての助言は不要と判定する(ステップS13のNo、ステップS17のNo)。そのため、このメッセージについて、助言内容は表示されない。
According to the example shown in FIG. 6, the
同様に、図6において、ユーザ1は、ユーザ2~4へ向け、メッセージ:「GAFAMですか。そうだとすると会議の自動議事録を作るのは簡単になりそうですね。」と発言する。助言判定部1834は、このメッセージの分析結果に基づき、このメッセージについての助言は不要と判定する(ステップS13のNo、ステップS17のNo)。そのため、このメッセージについて、助言内容は表示されない。
Similarly, in FIG. 6,
続いて、図6において、ユーザ3は、ユーザ1、2、4へ向け、メッセージM3:「そのことについて明日の午後、遠隔会議を設定したいのですが可能でしょうか?」と発言する。
Subsequently, in FIG. 6, the
助言制御部183は、音声認識部1831により、端末装置10-3から端末装置10-1、10-2、10-4へ送信されるメッセージM3に対し、音声認識を実施する(ステップS11)。音声認識部1831は、メッセージM3についての音声データをテキストデータに変換する。
The
助言制御部183は、固有名詞抽出部1833により、例えば、第2学習済みモデルを用い、入力されるテキストデータに基づき、固有表現についての分類、及び固有表現の値を出力する。固有名詞抽出部1833は、メッセージM3に対し、分類:「日時」、固有表現の値:「明日、午後」等を出力する(ステップS12)。
The
助言判定部1834は、例えば、固有名詞抽出部1833により抽出された固有名詞に対して助言が必要か否かを判定する(ステップS13)。助言判定部1834は、固有名詞が抽出されていないため、助言は不要と判定し(ステップS13のNo)、固有名詞抽出を経たメッセージM3についての処理を終了させる。
The
助言制御部183は、意図解釈部1832により、例えば、第1学習済みモデルを用い、入力されるテキストデータに基づき、インテントの種別、スロットの種別、及びスロットの値を出力する(ステップS16)。
The
図7に示す例によれば、意図解釈部1832は、メッセージM3に対し、インテントの種別:「スケジュール検索」、スロットの種別:「日時」及びスロットの値:「明日、午後」、スロットの種別:「参加者」及びスロットの値:「ユーザ1」を出力する。
According to the example shown in FIG. 7, the
助言判定部1834は、例えば、対話履歴データ173を参照し、意図解釈部1832により解釈された意図に対して助言が必要か否かを判定する(ステップS17)。助言判定部1834は、インテントの種別:「スケジュール検索」、スロットの種別:「日時」及びスロットの値:「明日、午後」、スロットの種別:「参加者」及びスロットの値:「ユーザ1」に対し、助言が必要と判定し(ステップS17のYes)、処理をステップS18へ移行させる。
The
ステップS18において、助言判定部1834は、助言をするのに必要な情報を外部サービスから取得するか否かを判定する。ここでは、例えば、インテントの種別:「スケジュール検索」であるため、助言判定部1834は、「日時=明日、午後」、「参加者=ユーザ1」についての情報を記憶部170から取得すると判定する(ステップS18のNo)。
In step S18, the
応答生成部1836は、助言に要する情報を記憶部170から取得する(ステップS19)。具体的には、応答生成部1836は、「日時=明日、午後」、「参加者=ユーザ1」に基づき、明日の午後において予定のない時間帯を取得する。
The
応答生成部1836は、取得結果に基づいて助言内容を生成する(ステップS110)。具体的には、例えば、応答生成部1836は、明日の午後における予定のない時間帯についての情報に基づいて助言内容A2:「明日の午後の予定は空いています。」を生成する。これにより、図6に示すように、メッセージM3に対する仮想アシスタントの助言内容A2が生成される。
The
表示制御部184は、助言制御部183で助言内容A2が生成されると、生成された助言内容A2をディスプレイ141に表示させる。
When the advice content A2 is generated by the
図6に示す例によれば、ユーザ1は、助言内容A2を確認すると、ユーザ2~4へ向け、メッセージ:「可能ですよ。午後1時から午後2時はどうでしょうか?」と発言する。助言判定部1834は、このメッセージの分析結果に基づき、このメッセージについての助言は不要と判定する(ステップS13のNo、ステップS17のNo)。そのため、このメッセージについて、助言内容は表示されない。
According to the example shown in FIG. 6, when the
同様に、図6において、ユーザ2~4は、ユーザ1へ向け、メッセージ:「良いですよ。」と発言する。助言判定部1834は、このメッセージの分析結果に基づき、このメッセージについての助言は不要と判定する(ステップS13のNo、ステップS17のNo)。そのため、このメッセージについて、助言内容は表示されない。
Similarly, in FIG. 6,
続いて、図6において、ユーザ1は、ユーザ2~4へ向け、メッセージM4:「それでは明日の午後1時からの午後2時に遠隔会議を設定します。」と発言する。
Subsequently, in FIG. 6, the
助言制御部183は、音声認識部1831により、端末装置10-1から端末装置10-2~10-4へ送信されるメッセージM4に対し、音声認識を実施する(ステップS11)。音声認識部1831は、メッセージM4についての音声データをテキストデータに変換する。
The
助言制御部183は、固有名詞抽出部1833により、例えば、第2学習済みモデルを用い、入力されるテキストデータに基づき、固有表現についての分類、及び固有表現の値を出力する。固有名詞抽出部1833は、メッセージM4に対し、分類:「日時」、固有表現の値:「明日」等を出力する(ステップS12)。
The
助言判定部1834は、例えば、固有名詞抽出部1833により抽出された固有名詞に対して助言が必要か否かを判定する(ステップS13)。助言判定部1834は、固有名詞が抽出されていないため、助言は不要と判定し(ステップS13のNo)、固有名詞抽出を経たメッセージM4についての処理を終了させる。
The
助言制御部183は、意図解釈部1832により、例えば、第1学習済みモデルを用い、入力されるテキストデータに基づき、インテントの種別、スロットの種別、及びスロットの値を出力する(ステップS16)。
The
図7に示す例によれば、意図解釈部1832は、メッセージM4に対し、インテントの種別:「スケジュール設定」、スロットの種別:「日時」及びスロットの値:「明日」、スロットの種別:「開始時間」及びスロットの値:「午後1時」、スロットの種別:「終了時間」及びスロットの値:「午後2時」、スロットの種別:「参加者」及びスロットの値:「ユーザ1」を出力する。
According to the example shown in FIG. 7, the
助言判定部1834は、例えば、対話履歴データ173を参照し、意図解釈部1832により解釈された意図に対して助言が必要か否かを判定する(ステップS17)。助言判定部1834は、インテントの種別:「スケジュール設定」、スロットの種別:「日時」及びスロットの値:「明日」、スロットの種別:「開始時間」及びスロットの値:「午後1時」、スロットの種別:「終了時間」及びスロットの値:「午後2時」、スロットの種別:「参加者」及びスロットの値:「ユーザ1」に対し、助言が必要と判定し(ステップS17のYes)、処理をステップS18へ移行させる。
The
ステップS18において、助言判定部1834は、助言をするのに必要な情報を外部サービスから取得するか否かを判定する。ここでは、例えば、インテントの種別:「スケジュール設定」であるため、助言判定部1834は、「日時=明日」、「開始時間=午後1時」、「終了時間=午後2時」、「参加者=ユーザ1」についての情報を記憶部170から取得すると判定する(ステップS18のNo)。
In step S18, the
応答生成部1836は、助言に要する情報を記憶部170から取得する(ステップS19)。具体的には、応答生成部1836は、「日時=明日」、「開始時間=午後1時」、「終了時間=午後2時」、「参加者=ユーザ1」に基づき、明日の午後1時から午後2時に遠隔会議を設定し、スケジュールを設定した旨の情報を取得する。
The
応答生成部1836は、取得結果に基づいて助言内容を生成する(ステップS110)。具体的には、例えば、応答生成部1836は、明日の午後1時から午後2時に遠隔会議を設定した旨の情報に基づいて助言内容A3:「明日の午後1時から午後2時に遠隔会議を設定しました。」を生成する。これにより、図6に示すように、メッセージM4に対する仮想アシスタントの助言内容A3が生成される。
The
表示制御部184は、助言制御部183で助言内容A3が生成されると、生成された助言内容A3をディスプレイ141に表示させる。
When the advice content A3 is generated by the
以上のように、第1の実施形態では、助言制御部183は、第1者と第2者との遠隔通信において、第1者又は第2者から入力されるメッセージを認識する。助言制御部183は、認識されたメッセージを分析する。助言制御部183は、第1者から第2者へのメッセージ、又は第2者から第1者へのメッセージについての分析の結果に基づき、第1者へのサポートが必要か否かを判定する。そして、助言制御部183は、必要と判定する場合、分析の結果に基づき、第1者に対する助言を与える助言内容を生成するようにしている。これにより、助言制御部183は、助言制御部183を意図したメッセージがなくても、第1者と第2者との通信に基づき、第1者への助言内容を作成することが可能となる。このため、第1者と第2者とのセッションを損なわずに第1者への助言内容を作成することが可能となる。
As described above, in the first embodiment, the
したがって、第1の実施形態に係る情報処理装置10によれば、遠隔通信におけるユーザの利便性を向上させることができる。
Therefore, according to the
なお、第1の実施形態では、仮想アシスタント(助言制御部183)が、固有名詞を説明する場合、及び、解釈した意図に基づき、スケジュールに関する助言をする場合を例に説明した。第1の実施形態に係る助言制御部183がする助言は、これらに限定されない。
In the first embodiment, the case where the virtual assistant (advice control unit 183) explains the proper noun and the case where the advice regarding the schedule is given based on the interpreted intention will be described as an example. The advice given by the
助言制御部183は、新たなインテントが登録されることで、解釈可能な意図の幅が広がる。そのため、助言制御部183は、会話に応じたインテントを登録することで、様々な分野における会話で、ユーザに対して適切な助言を与えることが可能となる。また、助言制御部183は、異なるインテントが登録されている第2アプリケーション172をプロセッサ19が実行することで異なる機能を実現するようにしてもよい。そのため、実施の目的に対応する第2アプリケーション172をダウンロードしておくことで、用途に応じた助言制御部183を利用することが可能となる。
The
具体的には、例えば、助言制御部183は、遠隔会議を円滑に進めるファシリテーターのような助言をするようにしてもよい。例えば、端末装置10-1の記憶部170に過去の会議の議事録が記憶されているとする。助言判定部1834は、例えば、ユーザ1~ユーザ4のいずれかが発したメッセージの分析結果に基づき、メッセージに含まれるトピックを認識する。助言判定部1834は、認識したトピックについて議論した議事録が記憶部170に記憶されているか否かに基づき、助言が必要であるか否かを判定する。認識したトピックについて議論した議事録が記憶部170に記憶されている場合、助言判定部1834は、助言が必要であると判定する。
Specifically, for example, the
応答生成部1836は、助言に要する情報を記憶部170に記憶される議事録から取得する。具体的には、応答生成部1836は、認識したトピックが話題になった議事録を検索する。応答生成部1836は、検索した議事録に基づいて助言内容を生成する。具体的には、例えば、応答生成部1836は、検索した議事録に基づき、過去の議題が再度議論されていることを指摘する助言内容:「そのトピックは、MM月DD日の打ち合わせで、…との結論に至りました。」を生成する。このため、助言制御部183は、同じ議論が繰り返されるのを防ぐことが可能となる。
The
また、助言判定部1834は、トピックの変化が乏しいか否かに基づき、助言が必要であるか否かを判定してもよい。トピックの変化が乏しいか否かは、認識したトピックの分布の時間軸に沿った変化の程度に基づいて判定される。具体的には、例えば、解決策が提示されずに、同じような議論が繰り返されている状態が、トピックの変化が乏しい状態に相当する。トピックの変化が乏しい場合、助言判定部1834は、議論が進展していない可能性があるため、助言が必要であると判定する。
Further, the
応答生成部1836は、議論が進展していない可能性を勘案して助言内容を生成する。具体的には、例えば、応答生成部1836は、論点を整理することを提案する助言内容:「一度、論点を整理した方が良いと思います。」を生成する。このため、助言制御部183は、堂々巡りを防ぐことが可能となる。
The
また、例えば、端末装置10-1の記憶部170に、会議のアジェンダが記憶されているとする。会議のアジェンダは、例えば、議論ポイントの説明、参加者の意見表明、今日の結論、残課題、アクションアイテム等のトピックを含む。助言判定部1834は、例えば、ユーザ1~ユーザ4のいずれかが発したメッセージの分析結果に基づき、メッセージに含まれるトピックを認識する。助言判定部1834は、会議の残時刻が所定値となると、アジェンダに含まれるトピックが全て議論されたか否かに基づき、助言が必要であるか否かを判定する。アジェンダに含まれるトピックのうち議論されていないトピックがある場合、助言判定部1834は、助言が必要であると判定する。
Further, for example, it is assumed that the agenda of the conference is stored in the
応答生成部1836は、アジェンダにおいて議論されていないトピックに基づいて助言内容を生成する。具体的には、例えば、応答生成部1836は、アクションアイテムについて議論されていない場合、助言内容:「アクションアイテムの話が出来ていませんが、大丈夫ですか?」を生成する。このため、助言制御部183は、アウトプット志向の会議運営を支援することが可能となる。
また、例えば、端末装置10-1の記憶部170に、会議に参加しているユーザのプロフィールに関する情報が記憶されているとする。助言判定部1834は、例えば、ユーザ1~ユーザ4のいずれかが発したメッセージの分析結果に基づき、メッセージに含まれるトピックを認識する。助言判定部1834は、認識したトピックに含まれる固有名詞、固有名詞の上位概念、関連概念を把握する。助言判定部1834は、把握した固有名詞、上位概念、関連概念を含むプロフィールが記憶部170に記憶されているか否かに基づき、助言が必要であるか否かを判定する。把握した概念を含むプロフィールが記憶部170に記憶されている場合、助言判定部1834は、認識したトピックについて知識を有する参加者がいるとして、助言が必要であると判定する。
Further, for example, it is assumed that the
応答生成部1836は、助言に要する情報を記憶部170に記憶されるプロフィールに関する情報から取得する。具体的には、応答生成部1836は、把握した固有名詞、上位概念、関連概念を含むプロフィールに関する情報を検索する。応答生成部1836は、取得した情報に基づいて助言内容を生成する。具体的には、例えば、応答生成部1836は、検索したプロフィール情報に基づいて助言内容:「そのトピックなら、AAAAさんに話してもらうのがいいですね。」を生成する。議論中のトピックと参加者とをマッチング可能であるため、助言制御部183は、参加者の発言意志の温度差、会議のオーナーとの関係性等、会議での発言の偏りが出やすい要因を排し、内容に応じたフェアで適切なファシリテーションが可能となる。
The
また、助言制御部183は、音声認識部1831で変換されたテキストデータをそのまま助言内容として出力してもよい。これにより、遠隔通信の内容がテキストで表示されるようになる。こうすることで、ユーザの聴力が弱い場合であっても、ユーザは遠隔通信の理解することが可能となる。また、ユーザが遠隔通信の音声を聞き取り辛い環境、例えば、雑音の多い場所等にいる場合であっても、ユーザは遠隔通信の理解することが可能となる。
Further, the
また、助言制御部183は、音声認識部1831で変換されたテキストデータを、異なる言語へ変換して出力してもよい。これにより、遠隔通信の内容が異なる言語で表示されるようになる。
Further, the
また、第1の実施形態では、音声で入力されたメッセージに対して助言制御部183が助言をする例を説明した。しかしながら、入力されるメッセージは、音声に限定されない。助言制御部183は、テキストで入力されるメッセージに対しても同様に応答するようにしてもよい。
Further, in the first embodiment, an example in which the
図9は、仮想アシスタントからの助言内容を表示するディスプレイ141の表示例を表す模式図である。図9に示す例では、領域1411にチャット画面が表示されている。助言制御部183は、テキストで入力されるメッセージに対し、助言内容を生成する。表示制御部184は、例えば、生成された助言内容A1を、図9に示すように、領域1411に表示する。
FIG. 9 is a schematic diagram showing a display example of the
また、第1の実施形態では、仮想アシスタント(助言制御部183)の機能に応じた表示については説明していない。しかしながら、助言制御部183の機能を識別可能な画像がディスプレイ141に表示されても構わない。例えば、助言制御部183の機能を識別可能な画像が、助言制御部183により作成された助言と関連するスペース、具体的には、図8のスペースS1に表示される。このとき、スペースS1に表示される画像は、例えば、助言制御部183が固有名詞を説明する場合には、知識を表すアイコン(例えば、辞書を表すアイコン等)となる。また、例えば、助言制御部183がスケジュールに関する助言をする場合には、表示される画像は、予定を調整する者を表すアイコン(例えば、秘書を表すアイコン等)となる。また、例えば、助言制御部183がファシリテーターのような助言をする場合には、表示される画像は、会議の進行を担当する者を表すアイコン(例えば、司会者を表すアイコン等)となる。また、例えば、助言制御部183が翻訳をする場合には、表示される画像は、翻訳をしていることを表すアイコン(例えば、言語変換を表すアイコン等)となる。また、例えば、助言制御部183が議事録を作成する場合には、表示される画像は、会議の内容を記録していることを表すアイコン(例えば、速記者を表すアイコン、又はメモ作成を表すアイコン等)となる。なお、助言制御部183の機能を識別可能な画像は、助言内容の属性を識別可能な画像と換言可能である。
Further, in the first embodiment, the display according to the function of the virtual assistant (advice control unit 183) is not described. However, an image that can identify the function of the
(第1の実施形態の変形例)
第1の実施形態において、助言制御部183の機能について説明したが、助言制御部183の機能は上記に限定されない。例えば、助言制御部183は、音声を切り替える機能を有していてもよい。
(Variation example of the first embodiment)
Although the function of the
図10は、端末装置10の機能構成の例を示すブロック図である。図10に示す例では、端末装置10は、第1切替部185と、第2切替部1837とを有する。
FIG. 10 is a block diagram showing an example of the functional configuration of the
第1切替部185は、マイク134のミュート機能のオン/オフを切り替える。ミュート機能がオンとなっていると、マイク134からの入力は通信制御部182へ到達しない。一方、ミュート機能がオフとなっていると、マイク134からの入力は通信制御部182へ到達する。図10に示す例では、ミュート機能がオフになっている状態が表されている。
The
第2切替部1837は、マイク134からの入力を、通信制御部182へ出力するか、助言制御部183へ出力するかを切り替える。第2切替部1837は、第1切替部185の前段で機能するように設計されている。第2切替部1837は、例えば、所定のボタンが押下されている間だけ助言制御部183と接続される、いわゆる、プッシュトゥトーク方式が用いられてもよい。
The
第2切替部1837が助言制御部183と接続されている場合、ユーザから入力される音声は、助言制御部183へ出力される。このとき、第1切替部185により、ミュート機能がオンになっていてもオフになっていても、音声は助言制御部183へ出力される。第2切替部1837が助言制御部183と接続され、かつ、第1切替部185により、ミュート機能がオフになっている場合、ユーザから入力される音声は、通信制御部182へ出力される。
When the
図11は、仮想アシスタントからの助言内容を表示するディスプレイ141の表示例を表す模式図である。図11に示す例では、第1アイコン1412と、第2アイコン1413とが表示されている。第1アイコン1412は、第1切替部185の切り替えを操作するアイコンであり、押下するとミュート機能のオン/オフが切り換えられる。第2アイコン1413は、第2切替部1837の切り替えを操作するアイコンであり、継続して押下すると、押下している間だけ助言制御部183への音声入力が可能となる。
FIG. 11 is a schematic diagram showing a display example of the
このように、第2切替部1837を設けることで、助言制御部183は、ユーザからの音声入力を、他ユーザに漏らさずに、受け付けることが可能となる。つまり、助言制御部183への会話指示が他ユーザに誤って送信されることがなくなる。また、第1切替部185の前段に第2切替部1837を配置することで、ミュート機能がオンの時でも仮想アシスタントへ音声により指示を入力することが可能となる。
By providing the
本機能の使用例として、例えば、仮想アシスタントを用いてメモを作成する例がある。このとき、例えば、助言制御部183は、入力された音声データに音声認識を実施し、生成したテキストデータに基づいて助言内容を生成する。
As an example of using this function, for example, there is an example of creating a memo using a virtual assistant. At this time, for example, the
メモを作成したいユーザは、第2アイコン1413を押下し続け、助言制御部183に対し、メモしたい内容を音声として入力する。助言制御部183は、入力された音声データをテキストデータに変換し、変換したテキストデータを助言内容として生成する。表示制御部184は、生成した助言内容をディスプレイ141に表示させる。
The user who wants to create a memo keeps pressing the
図12は、仮想アシスタントにより作成されたメモを表示するディスプレイ141の表示例を表す模式図である。図12に示す例では、領域1414に、助言制御部183により作成されたメモが表示されている。
FIG. 12 is a schematic diagram showing a display example of the
このように、助言制御部183は、ユーザが入力した音声をリアルタイムでテキストとして表示することが可能であるため、ユーザは、音声でメモを作成することが可能となる。このため、メモを取ることに労力をかける必要がなくなる。
As described above, since the
また、本機能の使用例として、例えば、助言制御部183と、所望の参加者とを接続する例がある。
Further, as an example of using this function, for example, there is an example of connecting the
図13は、助言制御部183により生成された助言内容が、端末装置10-1と端末装置10-2とで共有される際のシステム1の機能構成の例を示すブロック図である。
FIG. 13 is a block diagram showing an example of the functional configuration of the
所望の参加者、例えば、ユーザ2へ助言内容を出力したいユーザは、第2アイコン1413を押下し、押下している間に、助言制御部183に対し、接続したい参加者の名称を発声する。助言制御部183は、入力された参加者へも助言内容を送信するように設定する。
A desired participant, for example, a user who wants to output the advice content to the
図14は、助言内容を共有する参加者を表示するディスプレイ141の表示例を表す模式図である。図14に示す例では、助言内容を共有している参加者を表す指示オブジェクト1415が、ユーザ2を表示する領域に配置されている。なお、助言内容を共有する参加者の指名は、第2アイコン1413を押下しての音声入力に限らず、参加者の表示領域の押下によるものでも構わない。
FIG. 14 is a schematic diagram showing a display example of a
図15は、助言内容が共有されている参加者が使用する端末装置のディスプレイ141の表示例を表す模式図である。図15に示す例は、ユーザ2が操作する端末装置10-2のディスプレイ141の表示例を表している。図15に示す例では、助言内容の送信元を表す指示オブジェクト1416が、ユーザ1を表示する領域に配置されている。また、図15に示す例では、画面の下方に助言内容A1が表示されている。助言内容A1には、助言内容の送信元についての情報、例えば、「[ユーザ1からの助言内容]」が表示されている。
FIG. 15 is a schematic diagram showing a display example of the
このように、助言制御部183は、助言内容を指定された参加者と共有することが可能であるため、ユーザは、会議中に得られる情報を共有しながら会議に臨むことが可能となる。
In this way, since the
また、助言制御部183と所望の参加者とを接続した後、助言制御部183は、例えば、設定者から入力された音声を、共有先の参加者へ送信するようにしてもよい。つまり、助言相手を特定した後にはその助言相手にユーザの肉声で助言をするようにしてもよい。
Further, after connecting the
このとき、例えば、特定のグループを設定しておけば、グループ内での情報の共有も可能となる。例えば、ディスプレイ141に、設定されているグループを指定するアイコンを表示させ、助言制御部183は、このアイコンが押下されると、設定されているグループのメンバーに接続するようにする。助言制御部183は、入力された音声についてのデータを、例えば、接続されているメンバーへ送信する。
At this time, for example, if a specific group is set, information can be shared within the group. For example, the
このように、助言制御部183は、設定している参加者へユーザから入力された音声を送信することが可能である。そのため、第1アイコン1412を押下してミュート機能をオンとした状態でグループ通話を実施すれば、会議中にグループ内で通話することが可能となる。
In this way, the
また、第1の実施形態において、助言制御部183は、例えば、音声を生成する機能を有していてもよい。
Further, in the first embodiment, the
図16は、助言制御部183の機能構成の例を示すブロック図である。図16に示す例では、助言制御部183は、音声認識部1831、意図解釈部1832、固有名詞抽出部1833、助言判定部1834、外部サービス呼出部1835、応答生成部1836に加え、音声合成部1838を有する。
FIG. 16 is a block diagram showing an example of the functional configuration of the
音声合成部1838は、助言内容に基づき、音声を生成する。助言制御部183は、生成した音声データを、スピーカ142からユーザへ出力する。
The
(第2の実施形態)
第1の実施形態では、助言制御部183による仮想アシスタントが、ユーザ間のセッションを監視し、必要に応じて助言を与える例を説明した。第2の実施形態では、仮想アシスタントが、ユーザに代わってセッションに参加する等、ユーザを補助する場合を説明する。
(Second embodiment)
In the first embodiment, an example is described in which a virtual assistant by the
<1 全体構成>
第2の実施形態に係るシステムの全体構成は、第1の実施形態に係るシステム1の全体構成と同様である。
<1 Overall configuration>
The overall configuration of the system according to the second embodiment is the same as the overall configuration of the
<1.1 端末装置の構成>
図17は、本実施形態のシステムに含まれる端末装置10Aの構成を示すブロック図である。図17に示すように、端末装置10Aは、通信部121と、入力装置13と、出力装置14と、カメラ160と、記憶部170Aと、制御部180Aとを備える。
<1.1 Configuration of terminal equipment>
FIG. 17 is a block diagram showing a configuration of the
記憶部170Aは、例えば、メモリ15、及びストレージ16等により実現され、端末装置10Aが使用するデータ、及びプログラムを記憶する。具体的には、記憶部170Aは、例えば、第1アプリケーション171、第3アプリケーション174を記憶する。第3アプリケーション174は、遠隔通信において、第2の実施形態に係る仮想アシスタントを動作させるためのアプリケーションである。また、記憶部170Aは、遠隔通信における対話の履歴に関する対話履歴データ173と、遠隔通信における議事録に関する議事録データ175とを記憶する。
The
なお、図17では、記憶部170Aに記憶される第3アプリケーション174が1つである場合を示しているが、記憶部170Aに記憶される第3アプリケーション174は、複数であっても構わない。第3アプリケーション174は、ユーザに対する補助の内容に応じ、様々な種類があって構わない。ユーザは、用途に応じた第3アプリケーション174をダウンロードし、必要に応じて実行する第3アプリケーション174を切り換えるようにしてもよい。
Although FIG. 17 shows a case where the
第3アプリケーション174は、第1学習済みモデルに関するデータ、及び第3アプリケーション174についてのプログラムに関するデータを含む。第1学習済みモデルは、例えば、機械学習により生成される。本実施形態において、学習済みモデルとは、モデル学習プログラムに従って機械学習モデルに機械学習を行わせることで生成されるモデルを表す。なお、第3アプリケーション174は、第2学習済みモデルに関するデータを含んでいても構わない。
The
制御部180Aは、プロセッサ19が記憶部170Aに記憶されるプログラムを読み込み、プログラムに含まれる命令を実行することにより実現される。制御部180Aは、端末装置10Aの動作を制御する。具体的には、例えば、制御部180Aは、操作受付部181、通信制御部182、補助制御部186、表示制御部184としての機能を発揮する。
The
補助制御部186は、通信セッションに含まれるメッセージを分析し、分析結果に基づきユーザを補助する処理を行う。補助制御部186は、例えば、第3アプリケーション174がプロセッサ19により実行されることで実現される。具体的には、補助制御部186は、例えば、図18に示す処理を実施する。
The
図18は、補助制御部186の機能構成の例を表すブロック図である。図18に示す補助制御部186は、テキスト入力部1861、第1意図解釈部1862、音声認識部1863、第2意図解釈部1864、対話制御部1865、外部サービス呼出部1866、第1応答生成部1867、第2応答生成部1868、音声合成部1869を有する。
FIG. 18 is a block diagram showing an example of the functional configuration of the
テキスト入力部1861は、補助制御部186を使用するユーザが入力する指示を受け付ける。図18に示す例では、ユーザがテキスト形式で指示を入力することを想定している。なお、ユーザが音声で指示を入力する場合、テキスト入力部1861は、音声認識部であっても構わない。
The
第1意図解釈部1862は、テキスト入力部1861から入力されたテキストデータに含まれる意図を解釈する。具体的には、第1意図解釈部1862は、例えば、第1学習済みモデルを用い、入力されるテキストデータに基づき、インテントの種別、スロットの種別、及びスロットの値を出力する。
The first
音声認識部1863は、通信制御部182から出力される音声を認識し、テキスト形式のデータに変換する。音声認識の手法は、既存のいかなる手法を用いても構わない。音声認識部1863により変換されたテキストデータは、議事録データ175として、記憶部170Aに記憶される。なお、ユーザがテキスト形式で情報を入力する場合は、音声認識部1863はテキスト入力部であっても構わない。
The
第2意図解釈部1864は、音声認識部1863から出力されたテキストデータに含まれる意図を解釈する。具体的には、第2意図解釈部1864は、例えば、第1学習済みモデルを用い、入力されるテキストデータに基づき、インテントの種別、スロットの種別、及びスロットの値を出力する。
The second
対話制御部1865は、ユーザからの指示に応じた処理を実施する。具体的には、対話制御部1865は、例えば、ユーザから議事録の作成が指示されると、議事録の作成を開始する。対話制御部1865は、議事録を作成する処理の実施中において、第2意図解釈部1864により解釈された意図を受信すると、受信した意図を第1応答生成部1867へ出力する。
The
また、対話制御部1865は、例えば、ユーザから異なる言語への翻訳文の作成が指示されると、翻訳文の作成を開始する。対話制御部1865は、翻訳文を作成する処理の実施中において、第2意図解釈部1864により解釈された意図を受信すると、受信した意図を第1応答生成部1867へ出力する。
Further, the
また、対話制御部1865は、例えば、ユーザから代理モードの設定が指示されると、代理モードに遷移する。対話制御部1865は、代理モードにおいて、第1意図解釈部1862、又は第2意図解釈部1864により解釈された意図に対して応答が必要か否かを判定する。対話制御部1865は、例えば、第1意図解釈部1862により解釈された意図が、会議へのメッセージの送信を求めるものである場合、応答が必要であると判定する。また、対話制御部1865は、例えば、対話履歴データ173を参照し、第2意図解釈部1864により解釈された意図が、ユーザからの応答を求めるものである場合、応答が必要であると判定する。また、対話制御部1865は、例えば、代理モードにおいて会議の要約が指示されている場合、第2意図解釈部1864により解釈された意図を受信すると、受信した意図を第1応答生成部1867へ出力する。
Further, the
また、対話制御部1865は、例えば、ユーザから助言を求める旨の指示が入力されると、助言をするのに必要な情報を外部サービスから取得するか否かを判定する。対話制御部1865は、例えば、第1意図解釈部1862により解釈された意図に対して応答するために、外部からの情報が必要である場合、外部サービスから情報を取得する必要があると判定する。
Further, the
外部サービス呼出部1866は、助言に要する情報を外部サービスから取得する。例えば、外部サービス呼出部1866は、第1意図解釈部1862で解釈された意図に対して応答するための情報を外部サービスから取得する。外部サービス呼出部1866は、例えば、所定のAPIにより実現される。
The external
第1応答生成部1867は、対話制御部1865から出力される意図に基づき、ユーザから要求されている処理を実施し、応答内容を生成する。具体的には、例えば、第1応答生成部1867は、第2意図解釈部1864により解釈された意図に基づき、会議の議事録、会議内容の翻訳文、又は会議の要約文を生成する。また、第1応答生成部1867は、例えば、第1意図解釈部1862により解釈された意図に基づき、助言内容を生成する。また、第1応答生成部1867は、例えば、外部サービスから取得された情報に基づき、第1意図解釈部1862により解釈された意図に対する助言を生成する。
The first
第2応答生成部1868は、対話制御部1865から出力される意図に基づき、ユーザから要求されている処理を実施し、応答内容を生成する。具体的には、例えば、第2応答生成部1868は、第2意図解釈部1864により解釈された意図に基づき、応答内容を生成する。
The second
音声合成部1869は、応答内容に基づき、音声を生成する。補助制御部186は、生成した音声データを、通信制御部182を介して他の端末装置10へ送信する。
The
表示制御部184は、ユーザに対して種々の情報を提示するため、出力装置14を制御する。具体的には、例えば、表示制御部184は、補助制御部186で生成された補助内容をディスプレイ141に表示させる。
The
<2.動作>
複数のユーザにより遠隔通信が実施される際の補助制御部186の動作について説明する。
<2. Operation>
The operation of the
図19は、遠隔通信がなされる際のシステムの機能構成の例を示すブロック図である。図20は、補助制御部186が議事録を作成する際の対話制御部1865の動作の一例を示すフローチャートである。図19では、端末装置10A-1~10-4の間で遠隔会議が開催され、端末装置10A-1で仮想アシスタントとしての補助制御部186が起動する場合を示している。
FIG. 19 is a block diagram showing an example of the functional configuration of the system when remote communication is performed. FIG. 20 is a flowchart showing an example of the operation of the
まず、端末装置10A-1を操作するユーザ1は、議事録を取る場合、端末装置10A-1を操作し、例えば、「議事録を取る」を入力する。
First, the
テキスト入力部1861は、ユーザ1から入力された「議事録を取る」を受け付ける。第1意図解釈部1862は、テキスト入力部1861から入力されたテキストデータに含まれる意図を解釈する。具体的には、第1意図解釈部1862は、例えば、第1学習済みモデルを用い、入力されるテキストデータ:「議事録を取る」に基づき、インテントの種別:「議事録」、スロットの種別:「処理」、スロットの値:「開始」を出力する。
The
対話制御部1865は、第1意図解釈部1862から、議事録作成の指示があったか否かを判定する(ステップS21)。第1意図解釈部1862から出力された分析結果が、インテントの種別:「議事録」、スロットの種別:「処理」、スロットの値:「開始」であるため、対話制御部1865は、議事録作成の指示があったと判定する(ステップS21のYes)。
The
対話制御部1865は、議事録作成の指示があったと判定すると、議事録の作成を開始する(ステップS22)。対話制御部1865は、議事録の作成を開始すると、第1応答生成部1867に、議事録の作成を開始したことを通知する。
When the
第1応答生成部1867は、議事録作成の通知を受けると、応答内容:「議事の音声認識を開始します。」を作成する。表示制御部184は、作成された応答内容:「議事の音声認識を開始します。」をディスプレイ141に表示させる。
Upon receiving the notification of the minutes creation, the first
音声認識部1863は、通信制御部182から出力される音声を認識し、テキストデータに変換する。第2意図解釈部1864は、音声認識部1863から出力されたテキストデータに含まれる意図を解釈する。具体的には、第2意図解釈部1864は、例えば、第1学習済みモデルを用い、入力されるテキストデータに基づき、インテントの種別、スロットの種別、及びスロットの値を出力する。
The
対話制御部1865は、第2意図解釈部1864により解釈された意図を受信すると(ステップS23)、受信した意図を議事録の作成に用いるか否かを判定する(ステップS24)。議事録の作成に要すると判定すると(ステップS24のYes)、処理をステップS25に移行させる。議事録の作成に不要と判定すると(ステップS24のNo)、処理をステップS23に移行させ、第2意図解釈部1864から次の意図が出力されるのを待つ。
When the
ステップS25において、対話制御部1865は、第2意図解釈部1864から出力された意図を第1応答生成部1867へ出力する。
In step S25, the
第1応答生成部1867は、対話制御部1865から、第2意図解釈部1864で分析された意図を受け取ると、受け取った意図に基づき、議事録を作成する。表示制御部184は、作成された議事録をディスプレイ141に表示させる。制御部180は、作成された議事録を議事録データ175に記憶させる。
When the first
対話制御部1865は、議事録の作成を停止する旨の指示がユーザ1から入力されるまで、ステップS23~ステップS25の処理を繰り返す。
The
図21は、補助制御部186が翻訳文を作成する際の対話制御部1865の動作の一例を示すフローチャートである。
FIG. 21 is a flowchart showing an example of the operation of the
まず、端末装置10A-1を操作するユーザ1は、翻訳文を作成する場合、端末装置10A-1を操作し、例えば、「翻訳文を作成」を入力する。
First, the
テキスト入力部1861は、ユーザ1から入力された「翻訳文を作成」を受け付ける。第1意図解釈部1862は、テキスト入力部1861から入力されたテキストデータに含まれる意図を解釈する。具体的には、第1意図解釈部1862は、例えば、第1学習済みモデルを用い、入力されるテキストデータ:「翻訳文を作成」に基づき、インテントの種別:「翻訳文」、スロットの種別:「処理」、スロットの値:「開始」を出力する。
The
対話制御部1865は、第1意図解釈部1862から、翻訳文作成の指示があったか否かを判定する(ステップS26)。第1意図解釈部1862から出力された分析結果が、インテントの種別:「翻訳文」、スロットの種別:「処理」、スロットの値:「開始」であるため、対話制御部1865は、翻訳文作成の指示があったと判定する(ステップS26のYes)。
The
対話制御部1865は、翻訳文作成の指示があったと判定すると、翻訳文の作成を開始する(ステップS27)。対話制御部1865は、翻訳文の作成を開始すると、第1応答生成部1867に、翻訳文の作成を開始したことを通知する。
When the
第1応答生成部1867は、翻訳文作成の通知を受けると、応答内容:「翻訳を開始します。」を作成する。表示制御部184は、作成された応答内容:「翻訳を開始します。」をディスプレイ141に表示させる。
Upon receiving the notification of the translation sentence creation, the first
音声認識部1863は、通信制御部182から出力される音声を認識し、テキストデータに変換する。第2意図解釈部1864は、音声認識部1863から出力されたテキストデータに含まれる意図を解釈する。具体的には、第2意図解釈部1864は、例えば、第1学習済みモデルを用い、入力されるテキストデータに基づき、インテントの種別、スロットの種別、及びスロットの値を出力する。
The
対話制御部1865は、第2意図解釈部1864により解釈された意図を受信すると(ステップS28)、受信した意図を第1応答生成部1867へ出力する(ステップS29)。
When the
第1応答生成部1867は、対話制御部1865から、第2意図解釈部1864で分析された意図を受け取ると、受け取った意図に基づき、翻訳文を作成する。表示制御部184は、作成された翻訳文をディスプレイ141に表示させる。
When the first
対話制御部1865は、翻訳文の作成を停止する旨の指示がユーザ1から入力されるまで、ステップS28、ステップS29の処理を繰り返す。
The
図22は、補助制御部186を代理モードで動作させる際の対話制御部1865の動作の一例を示すフローチャートである。
FIG. 22 is a flowchart showing an example of the operation of the
まず、端末装置10A-1を操作するユーザ1は、補助制御部186を代理モードで動作させる場合、端末装置10A-1を操作し、例えば、「代理モードとして動作」を入力する。
First, when the
テキスト入力部1861は、ユーザ1から入力された「代理モードとして動作」を受け付ける。第1意図解釈部1862は、テキスト入力部1861から入力されたテキストデータに含まれる意図を解釈する。具体的には、第1意図解釈部1862は、例えば、第1学習済みモデルを用い、入力されるテキストデータ:「代理モードとして動作」に基づき、インテントの種別:「動作モード設定」、スロットの種別:「動作モード」、スロットの値:「代理」を出力する。
The
対話制御部1865は、第1意図解釈部1862から、代理モードへの切り替えの指示があったか否かを判定する(ステップS210)。第1意図解釈部1862から出力された分析結果が、インテントの種別:「動作モード設定」、スロットの種別:「動作モード」、スロットの値:「代理」であるため、対話制御部1865は、代理モードへの切替指示があったと判定する(ステップS210のYes)。
The
対話制御部1865は、代理モードへの切替指示があったと判定すると、代理モードへ遷移する(ステップS211)。対話制御部1865は、代理モードへ遷移すると、第1応答生成部1867に、代理モードへ遷移したことを通知する。
When the
第1応答生成部1867は、代理モードへの遷移の通知を受けると、応答内容:「代理モードを設定しました。」を作成する。表示制御部184は、作成された応答内容:「代理モードを設定しました。」をディスプレイ141に表示させる。
Upon receiving the notification of the transition to the surrogate mode, the first
音声認識部1863は、通信制御部182から出力される音声を認識し、テキストデータに変換する。例えば、音声認識部1863は、ユーザ2からユーザ1に対して入力される、「ユーザ1さん、前回の議事録はどこにありますか?」をテキストデータに変換する。第2意図解釈部1864は、音声認識部1863から出力されたテキストデータに含まれる意図を解釈する。具体的には、第2意図解釈部1864は、例えば、第1学習済みモデルを用い、入力されるテキストデータ:「ユーザ1さん、前回の議事録はどこにありますか?」に基づき、インテントの種別:「ユーザ1への質問」、スロットの種別:「発話者」、スロットの値:「ユーザ2」、スロットの種別:「発話内容」、スロットの値:「ユーザ1さん、前回の議事録はどこにありますか?」を出力する。
The
対話制御部1865は、第2意図解釈部1864により解釈された意図を受信すると(ステップS212)、通信制御部182を介してメッセージを送信する必要があるか否かを判定する(ステップS213)。対話制御部1865は、第2意図解釈部1864により解釈された意図に基づき、通信制御部182を介してメッセージを送信する必要がないと判定し(ステップS213のNo)、ユーザ1からの応答が求められているか否かを判定する(ステップS214)。
When the
第2意図解釈部1864により解釈された意図に基づき、ユーザ1からの応答が求められていると判定すると(ステップS214のYes)、対話制御部1865は、処理をステップS215に移行させる。ユーザ1からの応答が不要と判定すると(ステップS214のNo)、対話制御部1865は、処理をステップS212に移行させ、第2意図解釈部1864から次の意図が出力されるのを待つ。
When it is determined that the response from the
ステップS215において、対話制御部1865は、第2意図解釈部1864から出力された意図、インテントの種別:「ユーザ1への質問」、スロットの種別:「発話者」、スロットの値:「ユーザ2」、スロットの種別:「発話内容」、スロットの値:「ユーザ1さん、前回の議事録はどこにありますか?」を第2応答生成部1868へ出力する。
In step S215, the
第2応答生成部1868は、対話制御部1865から、第2意図解釈部1864で分析された意図を受け取ると、受け取った意図に基づき、応答内容:「ユーザ1は今、不在なので後で返事をします。」を作成する。音声合成部1869は、応答内容に基づき、音声を生成する。補助制御部186は、生成した音声データを、通信制御部182を介して他の端末装置10へ送信する。
When the second
また、テキスト入力部1861は、ユーザ1から入力された「皆さんに「後5分で会議から退席する」と伝えて」を受け付ける。第1意図解釈部1862は、テキスト入力部1861から入力されたテキストデータに含まれる意図を解釈する。具体的には、第1意図解釈部1862は、例えば、第1学習済みモデルを用い、入力されるテキストデータ:「皆さんに「後5分で会議から退席する」と伝えて」に基づき、インテントの種別:「発話依頼」、スロットの種別:「発話対象」、スロットの値:「皆さん」、スロットの種別:「発話内容」、スロットの値:「5分後に会議から退席する」を出力する。
In addition, the
対話制御部1865は、第1意図解釈部1862により解釈された意図を受信すると(ステップS212)、通信制御部182を介してメッセージを送信する必要があるか否かを判定する(ステップS213)。対話制御部1865は、第1意図解釈部1862により解釈された意図に基づき、通信制御部182を介してメッセージを送信する必要があると判定し(ステップS213のYes)、処理をステップS215に移行させる。
When the
ステップS215において、対話制御部1865は、第1意図解釈部1862から出力された意図、インテントの種別:「発話依頼」、スロットの種別:「発話対象」、スロットの値:「皆さん」、スロットの種別:「発話内容」、スロットの値:「5分後に会議から退席する」を第2応答生成部1868へ出力する。
In step S215, the
第2応答生成部1868は、対話制御部1865から、第1意図解釈部1862で分析された意図を受け取ると、受け取った意図に基づき、応答内容:「皆さん、後5分で会議から退席します。」を作成する。音声合成部1869は、応答内容に基づき、音声を生成する。音声合成部1869は、ユーザからの指示に応じ、生成する音声を切り替えてもよい。例えば、音声合成部1869は、ユーザからの指示に応じ、アシスタントの音声にしてもよいし、ユーザ自身の音声にしてもよい。補助制御部186は、生成した音声データを、通信制御部182を介して他の端末装置10へ送信する。
When the second
対話制御部1865は、代理モードを停止する旨の指示がユーザ1から入力されるまで、ステップS212~ステップS215の処理を繰り返す。なお、ユーザ1から、例えば、「代理モード解除」が入力されると、ディスプレイ141に「代理モードを解除しました。」が表示され、代理モードが解除される。
The
図23は、補助制御部186がユーザ1に対して助言を作成する際の対話制御部1865の動作の一例を示すフローチャートである。
FIG. 23 is a flowchart showing an example of the operation of the
まず、端末装置10A-1を操作するユーザ1は、補助制御部186からの助言を求める場合、端末装置10A-1を操作し、例えば、「10分後に虎ノ門から渋谷に出るバスを調べて。」を入力する。
First, the
テキスト入力部1861は、ユーザ1から入力された「10分後に虎ノ門から渋谷に出るバスを調べて。」を受け付ける。第1意図解釈部1862は、テキスト入力部1861から入力されたテキストデータに含まれる意図を解釈する。具体的には、第1意図解釈部1862は、例えば、第1学習済みモデルを用い、入力されるテキストデータ:「10分後に虎ノ門から渋谷に出るバスを調べて。」に基づき、インテントの種別:「移動」、スロットの種別:「出発地」、スロットの値:「虎ノ門」、スロットの種別:「目的地」、スロットの値:「渋谷」、スロットの種別:「日時」、スロットの値:「10分後」、スロットの種別:「手段」、スロットの値:「バス」を出力する。
The
対話制御部1865は、第1意図解釈部1862で解釈された意図を受信すると(ステップS216)、テキストデータを分析した結果に基づき、ユーザ1に対して助言するか否かを判定する(ステップS217)。対話制御部1865は、インテントの種別:「移動」、スロットの種別:「出発地」、スロットの値:「虎ノ門」、スロットの種別:「目的地」、スロットの値:「渋谷」、スロットの種別:「日時」、スロットの値:「10分後」、スロットの種別:「手段」、スロットの値:「バス」であるため、助言が必要と判定し(ステップS217のYes)、処理をステップS218へ移行させる。なお、助言が不要と判定した場合(ステップS217のNo)、対話制御部1865は、処理をステップS216に移行させ、次の意図が出力されるのを待つ。
When the
ステップS218において、対話制御部1865は、助言をするのに必要な情報を外部サービスから取得するか否かを判定する。対話制御部1865は、インテントの種別:「移動」、スロットの種別:「出発地」、スロットの値:「虎ノ門」、スロットの種別:「目的地」、スロットの値:「渋谷」、スロットの種別:「日時」、スロットの値:「10分後」、スロットの種別:「手段」、スロットの値:「バス」であるため、助言をするのに必要な情報を外部サービスから取得すると判定し(ステップS218のYes)、処理をステップS219へ移行させる。
In step S218, the
ステップS219において、対話制御部1865は、外部サービス呼出部1866により、助言に要する情報を外部サービスから取得する。具体的には、例えば、外部サービス呼出部1866は、「出発地=虎ノ門」、「目的地=渋谷」、「日時=10分後」、「手段=バス」をキーワードとして入力することで、10分後に虎ノ門から渋谷に出るバスを提示するための情報を外部サービスで検索する。対話制御部1865は、取得した情報を第1応答生成部1867へ出力する。
In step S219, the
ステップS218において、助言をするのに必要な情報を外部サービスから取得しない判定した場合(ステップS218のNo)、対話制御部1865は、記憶部170Aから情報を取得することを第1応答生成部1867へ通知する(ステップS220)。
When it is determined in step S218 that the information necessary for giving advice is not acquired from the external service (No in step S218), the
ステップS221において、対話制御部1865は、第1意図解釈部1862から出力された意図を第1応答生成部1867へ出力する。
In step S221, the
第1応答生成部1867は、対話制御部1865から、第1意図解釈部1862で分析された意図を受け取ると、受け取った意図と、外部サービスから取得した情報、又は記憶部170Aから読み出した情報とに基づき、助言内容:「12時15分に六本木通りから出発します。」を作成する。表示制御部184は、作成された助言内容をディスプレイ141に表示させる。
When the first
図24は、補助制御部186が動作している際の端末装置のディスプレイ141の表示例を表す模式図である。図24に示す例では、例えば、複数の第3アプリケーション174が動作している場合の表示例を表す。図24において、ディスプレイ141に、表示オブジェクト1417~1419が表示されている。表示オブジェクト1417は、会議1についての表示を表している。ユーザ1は、会議1に、補助制御部186が実行する代理モードで参加している。表示オブジェクト1417には、代理モードとして動作していることを表す、例えば、ロボットのアイコンが表示されている。また、表示オブジェクト1417には、代理モードで参加している会議1の要約文が表示されている。なお、ロボットのアイコンはユーザ1の操作により任意に変更可能である。アイコンでなく、テキストでの表示であってもよい。
FIG. 24 is a schematic diagram showing a display example of the
表示オブジェクト1418、1419は、会議2についての表示を表している。ユーザ1は、会議2に通常の状態で参加している。ユーザ1は、会議2に対し、補助制御部186が翻訳文を作成するように設定している。表示オブジェクト1418には、補助制御部186が翻訳文を作成していることを表すアイコンが表示されている。また、表示オブジェクト1418には、補助制御部186が作成している翻訳文が表示されている。表示オブジェクト1419には、会議2に参加している参加者の画像が表示されている。
The display objects 1418 and 1419 represent a display for the
また、図24において、ディスプレイ141に、領域14110が表示されている。表示制御部184は、ユーザ1から入力される指示を右側に表示し、入力される指示に対する補助制御部186からの応答を左側に表示している。図24に示す例では、ユーザ1から入力される「10分後に虎ノ門から渋谷に出るバスを調べて。」の指示に対し、補助制御部186は、「12時15分に六本木通りから出発します。」の応答を返している。
Further, in FIG. 24, the
なお、図24に示す例では、会議2について補助制御部186が翻訳文を生成する場合を示している。翻訳文の生成は、代理モードで参加している会議1について実施することも可能である。つまり、同一の会議に対して複数の処理が並列して実施されてもよい。
The example shown in FIG. 24 shows a case where the
図25は、会議参加者のいずれかが代理モードを利用している際の端末装置のディスプレイ141の表示例を表す模式図である。図25(a)に示す例は、ユーザ2が操作する端末装置10-2のディスプレイ141の表示例を表している。図25(a)に示す例では、ユーザ1が代理モードで会議に参加している場合を示している。図25(a)において、ユーザ1の画像が、代理モードとして動作していることを表す、例えば、ロボットのアイコンで表されている。図25(a)で示されるユーザ1のアイコンは、ユーザ1の操作により切り替えられてもよい。例えば、ロボットのアイコンではなく、アシスタント対応中、本人離席中等、現在の状況を表すテキストによる表示であっても構わない。
FIG. 25 is a schematic diagram showing a display example of the
なお、代理モードでは、特定のサービスを提供する機能がってもよい。例えば、代理モードにおいて、翻訳機能があってもよい。具体的には、ユーザ3が会議の機械翻訳サービス提供者であったとする。この場合、例えば、ユーザ3は会議参加の冒頭から自分のアイコンを通訳者のアイコンに設定する。そうすれば、他の会議者は、機械翻訳サービスが導入され、会議の翻訳がされていることを認識できる。さらなる例として、代理モードにおいて、議事録作成機能があってもよい。具体的には、ユーザ4が会議の議事録作成サービス提供者であったとする。この場合、例えば、ユーザ4は、自分のアイコンを速記者とわかるアイコンに設定する。そうすれば、他の会議者は、議事録作成サービスが導入され、会議の議事録が作成されていることを認識できる。このように、離席、中座とは異なるサービスの視認性を参加者の擬人化メタファーで認識することができる。図25(b)に示す例は、ユーザ3が機械翻訳サービス提供者であり、ユーザ4が議事録作成サービス提供である場合の、端末装置10-2のディスプレイ141の表示例を表している。
In the proxy mode, there may be a function of providing a specific service. For example, in the surrogate mode, there may be a translation function. Specifically, it is assumed that the
以上のように、第2の実施形態では、補助制御部186は、第1者と第2者との遠隔通信において、第2者から入力されるメッセージを認識する。補助制御部186は、認識されたメッセージを分析する。補助制御部186は、分析の結果に基づき、メッセージの内容に関する情報を第1者に対して生成する。補助制御部186は、分析の結果に基づき、メッセージに対する応答内容を第2者に対して生成する。補助制御部186は、第2者から入力されるメッセージの代わりに、メッセージの内容に関する情報を第1者へ提示する。そして、補助制御部186は、メッセージに対する応答内容を第2者へ提示するようにしている。これにより、補助制御部186は、セッション相手への代理応答をしながら、セッションの内容に関する情報を第1者へ提示することが可能となる。このため、補助制御部186は、遠隔通信にかかる第1者の負担を軽減することが可能となる。
As described above, in the second embodiment, the
したがって、第2の実施形態に係る情報処理装置10Aによれば、遠隔通信におけるユーザの利便性を向上させることができる。
Therefore, according to the
なお、第2の実施形態では、仮想アシスタント(補助制御部186)の動作例について説明した。第2の実施形態に係る補助制御部186の動作は、上記に限定されない。
In the second embodiment, an operation example of the virtual assistant (auxiliary control unit 186) has been described. The operation of the
補助制御部186は、新たなインテントが登録されることで、解釈可能な意図の幅が広がる。そのため、補助制御部186は、所望する動作に応じたインテントを登録することで、様々な動作を実行することが可能となる。また、補助制御部186は、異なるインテントが登録されている第3アプリケーション174をプロセッサ19が実行することで異なる機能を実現するようにしてもよい。そのため、実施の目的に対応する第3アプリケーション174をダウンロードしておくことで、用途に応じた補助制御部186を利用することが可能となる。
The
例えば、補助制御部186は、セッションにアクセスするためのセキュリティ質問を生成するようにしてもよい。
For example,
具体的には、例えば、補助制御部186は、以下のように動作する。例えば、ユーザ1とユーザ2とでセッションが実施されたとする。このとき、補助制御部186は、ユーザ1とユーザ2とで実施されたセッション内容の履歴を記憶部170Aに記憶しておく。
Specifically, for example, the
続いて、ユーザ1とユーザ2との間で、前回と関連する内容でのセッションが改めて設定されたとする。ユーザ1は、ユーザ2とのセッションの場を設け、ユーザ2からのアクセスを受け付ける。
Subsequently, it is assumed that a session with the content related to the previous time is set again between the
補助制御部186は、ユーザ2からのアクセスがあると、記憶部170Aに記憶しているセッション内容の履歴を読み出し、履歴に基づく質問を生成する。例えば、補助制御部186は、ユーザ1と話した内容、アクションポイントに関する情報等に基づいて質問を生成する。また、補助制御部186は、履歴に含まれていない話題を質問として生成してもよい。補助制御部186は、例えば、複数の質問を生成する。
When the
補助制御部186は、生成した質問をユーザ2へ提示し、質問に対する回答をユーザ2から受け付ける。質問に対してユーザ2が正しく回答できた場合、補助制御部186は、ユーザ2の接続を許可する。なお、補助制御部186が生成した質問はユーザ1へ提示されてもよい。質問に対してユーザ1が正しく回答できた場合、補助制御部186は、ユーザ1の接続を許可する。
The
このように、補助制御部186は、セキュリティ質問を生成することで、セッションにアクセスしてきたユーザの正当性を証明するようにしている。また、質問の内容は、前回のセッションの情報に基づいているため、ユーザは、自身のプライバシーに触れる個人活動を暴露する必要がない。また、セッションの内容に基づくため、ユーザと生活を共にする第3者であっても、ユーザに成りすましてセッションに参加することができない。
In this way, the
セキュリティ質問を生成する補助制御部186は、例えば、会議の参加者の正当性を証明するために活用可能である。例えば、ホストユーザと、他のユーザとで遠隔会議が開催されたとする。このとき、補助制御部186は、遠隔会議の議事録を記憶部170Aに記憶しておく。
続いて、前回と同様のメンバーで、前回と関連する内容での遠隔会議が再度予定されたとする。ホストユーザは、遠隔会議の場を設け、他のユーザからのアクセスを受け付ける。 Then, it is assumed that a remote conference with the same members as the previous one and the contents related to the previous one is scheduled again. The host user sets up a place for a remote conference and accepts access from other users.
補助制御部186は、他のユーザからのアクセスがあると、記憶部170Aに記憶している議事録を読み出し、議事録に基づく質問を生成する。例えば、補助制御部186は、前回の参加者の名前、出席予定だったが欠席した者の名前、アクションポイントに関する情報等に基づいて質問を生成する。また、補助制御部186は、議事録として記憶されていない、会議中の不規則発言、又は参加者の振る舞いに対する質問を生成してもよい。
When the
補助制御部186は、生成した質問を他のユーザへ提示し、質問に対する回答を他のユーザから受け付ける。質問に対して他のユーザが正しく回答できた場合、正しく回答できたユーザの接続を許可する。なお、補助制御部186は、生成した質問をホストユーザへ提示し、質問に対する回答をホストユーザから受け付けるようにしてもよい。質問に対してホストユーザが正しく回答できた場合、ホストユーザの接続を許可する。
The
また、補助制御部186は、セキュリティ質問の生成と共に、議事録の正当性を確認してもよい。なお、議事録の正当性を確認ことは、例えば、議事録の内容の精度を向上させること、又は議事録の検証をすることと換言可能である。
In addition, the
具体的には、例えば、補助制御部186は、セキュリティ質問に対して回答したユーザのうち、正当性の高いユーザを特定する。補助制御部186は、例えば、特定したユーザに対し、議事録の内容とは異なっているが、類似の内容に基づいて質問を生成する。補助制御部186は、質問に対するユーザからの回答に基づき、議事録を修正する。また、補助制御部186は、例えば、前回の会議の要約の少なくとも一部を質問として生成する。補助制御部186は、質問に対するユーザからの回答に基づき、議事録を修正する。
Specifically, for example, the
これにより、補助制御部186は、セッション参加者の正当性を確認するのと同時に、議事録を修正することが可能となる。
As a result, the
また、例えば、補助制御部186は、メッセージの内容に基づく提案内容を生成するようにしてもよい。提案内容は、例えば、メッセージの内容に基づくお勧めの商品等である。
Further, for example, the
また、第2の実施形態では、補助制御部186の動作を切り替える際、実施する機能を明示した文としての指示を入力する例を説明した。しかしながら、補助制御部186への指示は、文でなくても構わない。補助制御部186への指示は、特別な符丁が設定されていてもよいし、補助制御部186の所定機能を読み出すためのキーワードが予め設定されていてもよい。
Further, in the second embodiment, when switching the operation of the
(その他の実施形態)
第1の実施形態では、制御部180が助言制御部183を有し、第2の実施形態では、制御部180Aが補助制御部186を有する場合を説明した。助言制御部183、及び補助制御部186は、同時に、又は切り替えて実現されてもよい。図26は、その他の実施形態のシステムに含まれる端末装置10Bの構成を示すブロック図である。図27は、遠隔通信がなされる際のシステムの機能構成の例を示すブロック図である。
(Other embodiments)
In the first embodiment, the case where the
図27に示す通信制御部182は、ミュート機能を有している。通信制御部182のミュート機能がオンの際に、助言制御部183、補助制御部186からの音声が他のユーザへ送信されないように、助言制御部183、補助制御部186にもミュート機能が付いている。助言制御部183、補助制御部186のミュート機能は、通信制御部182のミュート機能がオンとなると、自動的にオンになるようにしてもよい。
The
上記実施形態において、第1アプリケーション171、第2アプリケーション172、第3アプリケーション174とをそれぞれ別のアプリケーションであるとして説明したが、第1アプリケーション171の機能として、第2アプリケーション172、第3アプリケーション174の機能があってもよい。
In the above embodiment, the
また、第1の実施形態では、端末装置10が助言制御部183の機能を実行する場合を説明し、第2の実施形態では、端末装置10Aが補助制御部186の機能を実行する場合を説明した。しかしながら、助言制御部183、及び補助制御部186の機能は、サーバ20で実行されてもよい。
Further, in the first embodiment, the case where the
図28は、助言制御部がサーバで実行される場合のサーバ20Aの機能的な構成を示すブロック図である。図28に示すように、サーバ20Aは、通信部201、記憶部202、及び制御部203としての機能を発揮する。
FIG. 28 is a block diagram showing a functional configuration of the
通信部201は、サーバ20Aが外部の装置と通信するための処理を行う。
The
記憶部202は、サーバ20Aが使用するデータ及びプログラムを記憶する。例えば、記憶部202は、助言制御プログラム2021、対話履歴データ2022を記憶する。助言制御プログラム2021は、端末装置10に助言を表示させる処理を実行するためのプログラムである。助言制御プログラム2021は、第1の実施形態における第2アプリケーション172に相当する。対話履歴データ2022は、遠隔通信における対話履歴を記憶する。なお、助言制御プログラム2021は、記憶部202に記憶される通信制御プログラム(図示せず)の一部であっても構わない。
The
制御部203は、プロセッサ29が記憶部202に記憶されるプログラムを読み込み、プログラムに含まれる命令を実行することにより実現される。制御部203は、サーバ20Aの動作を制御する。具体的には、例えば、制御部203は、送受信部2031、記憶制御部2032、助言制御部2033、提示部2034としての機能を発揮する。
The
送受信部2031は、サーバ20Aが、端末装置10等の外部の装置と、通信プロトコルに従ってデータを送受信する処理を制御する。
The transmission /
記憶制御部2032は、記憶部202への情報の記憶を制御する。
The
助言制御部2033は、通信セッションに含まれるメッセージを分析し、分析結果に基づく助言をユーザに与える処理を行う。助言制御部2033は、例えば、通信セッションに参加する複数のユーザに対して助言を生成する。助言制御部2033に設定されているインテントは、ユーザ毎に設定されていてもよい。助言制御部2033の動作は、例えば、第1の実施形態で記載される助言制御部183の動作と同様である。
The
提示部2034は、遠隔通信に関する画像をユーザに提示する。また、提示部2034は、助言制御部2033で生成された助言をユーザに提示する。
The
図29は、遠隔通信がなされる際のシステムの機能構成の例を示すブロック図である。図29では、端末装置10-1~10-4の間で遠隔会議が開催され、サーバ20Aで仮想アシスタントとしての助言制御部2033が起動する場合を示している。
FIG. 29 is a block diagram showing an example of the functional configuration of the system when remote communication is performed. FIG. 29 shows a case where a remote conference is held between the terminal devices 10-1 to 10-4, and the
図30は、補助制御部がサーバで実行される場合のサーバ20Bの機能的な構成を示すブロック図である。図30に示すように、サーバ20Bは、通信部201、記憶部202B、及び制御部203Bとしての機能を発揮する。
FIG. 30 is a block diagram showing a functional configuration of the
記憶部202Bは、サーバ20Bが使用するデータ及びプログラムを記憶する。例えば、記憶部202Bは、補助制御プログラム2023、対話履歴データ2022、議事録データ2024を記憶する。補助制御プログラム2023は、端末装置10を補助する処理を実行するためのプログラムである。補助制御プログラム2023は、第2の実施形態における第3アプリケーション174に相当する。議事録データ2024は、遠隔通信における議事録を記憶する。なお、補助制御プログラム2023は、記憶部202Bに記憶される通信制御プログラム(図示せず)の一部であっても構わない。
The
制御部203Bは、プロセッサ29が記憶部202Bに記憶されるプログラムを読み込み、プログラムに含まれる命令を実行することにより実現される。制御部203Bは、サーバ20Bの動作を制御する。具体的には、例えば、制御部203Bは、送受信部2031、記憶制御部2032、補助制御部2035、提示部2034としての機能を発揮する。
The
補助制御部2035は、通信セッションに含まれるメッセージを分析し、分析結果に基づきユーザを補助する処理を行う。補助制御部2035は、例えば、通信セッションに参加する複数のユーザを補助する。補助制御部2035に設定されているインテントは、ユーザ毎に設定されていてもよい。補助制御部2035の動作は、例えば、第2の実施形態で記載される補助制御部186の動作と同様である。
The
提示部2034は、遠隔通信に関する画像をユーザに提示する。また、提示部2034は、補助制御部2035による補助をユーザに提示する。
The
図31は、遠隔通信がなされる際のシステムの機能構成の例を示すブロック図である。図31では、端末装置10-1~10-4の間で遠隔会議が開催され、サーバ20Bで仮想アシスタントとしての補助制御部2035が起動する場合を示している。
FIG. 31 is a block diagram showing an example of the functional configuration of the system when remote communication is performed. FIG. 31 shows a case where a remote conference is held between the terminal devices 10-1 to 10-4, and the
図28~図31で示す助言制御部2033、及び補助制御部2035は、同時に、又は切り替えて実現されてもよい。図32は、助言制御部2033、及び補助制御部2035がサーバで実行される場合のサーバ20Cの機能的な構成を示すブロック図である。図33は、遠隔通信がなされる際のシステムの機能構成の例を示すブロック図である。
The
なお、助言制御部2033、及び補助制御部2035は、両方がサーバ20Cで実行される必要はない。助言制御部2033、又は補助制御部2035が、助言制御部183、又は補助制御部186として端末装置10で実行されてもよい。具体的には、助言制御部2033がサーバ20Cで実行され、補助制御部186が端末装置10で実行されてもよい。また、助言制御部183が端末装置10で実行され、補助制御部2035がサーバ20Cで実行されてもよい。
It is not necessary that both the
以上、本開示のいくつかの実施形態を説明したが、これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものとする。 Although some embodiments of the present disclosure have been described above, these embodiments can be implemented in various other embodiments, and various omissions, replacements, and modifications are made without departing from the gist of the invention. It can be performed. These embodiments and variations thereof shall be included in the scope of the invention described in the claims and the equivalent scope thereof, as well as in the scope and gist of the invention.
<付記>
以上の各実施形態で説明した事項を以下に付記する。
<Additional Notes>
The matters described in each of the above embodiments are added below.
(付記1)
プロセッサ19と、メモリ15とを備えるコンピュータに実行させるためのプログラムであって、プログラムは、プロセッサに、第1者と第2者との遠隔通信において、第1者又は第2者から入力されるメッセージを認識するステップ(ステップS11)と、認識されたメッセージを分析するステップ(ステップS12,16)と、第1者から第2者へのメッセージ、又は第2者から第1者へのメッセージについての分析の結果に基づき、第1者へのサポートが必要か否かを判定するステップ(ステップS13,17)と、必要と判定する場合、分析の結果に基づき、第1者に対する助言を与える助言内容を生成するステップ(ステップS110)とを実行させるプログラム。
(Appendix 1)
A program for causing a computer including a
(付記2)
メッセージを分析するステップにおいて、第1者又は第2者から発せられたメッセージの意図を解釈し、サポートの要否を判定するステップにおいて、解釈した意図と、メッセージの履歴とに基づき、第1者へのサポートが必要か否かを判定し、助言内容を生成するステップにおいて、解釈した意図と、メッセージの履歴とに基づき、助言内容を生成する(付記1)に記載のプログラム。
(Appendix 2)
In the step of analyzing the message, in the step of interpreting the intention of the message issued by the first party or the second party, and in the step of determining the necessity of support, the first party based on the interpreted intention and the history of the message. The program described in (Appendix 1) that generates advice content based on the intent interpreted and the history of the message in the step of determining whether or not support is required and generating advice content.
(付記3)
メッセージを分析するステップにおいて、解釈可能な意図の種類は予め登録可能である(付記2)に記載のプログラム。
(Appendix 3)
In the step of analyzing a message, the type of intent that can be interpreted can be registered in advance (Appendix 2).
(付記4)
メッセージを分析するステップにおいて、第1者又は第2者から発せられたメッセージに含まれる固有名詞を抽出し、サポートの要否を判定するステップにおいて、抽出した固有名詞に基づき、第1者へのサポートが必要か否かを判定し、助言内容を生成するステップにおいて、抽出した固有名詞に基づき、助言内容を生成する(付記1)乃至(付記3)のいずれかに記載のプログラム。
(Appendix 4)
In the step of analyzing the message, the proper noun contained in the message issued from the first person or the second person is extracted, and in the step of determining the necessity of support, the first person is referred to based on the extracted proper noun. The program according to any one of (Appendix 1) to (Appendix 3), which generates advice content based on the extracted proper noun in the step of determining whether or not support is required and generating advice content.
(付記5)
助言内容を生成するステップにおいて、分析の結果に基づき、難解な固有名詞を説明するための助言内容を生成する(付記1)乃至(付記4)のいずれかに記載のプログラム。
(Appendix 5)
The program according to any one of (Appendix 1) to (Appendix 4) for generating an advice content for explaining an esoteric proper noun based on the result of analysis in the step of generating the advice content.
(付記6)
助言内容を生成するステップにおいて、分析の結果に基づき、スケジュールに関する助言内容を生成する(付記1)乃至(付記4)のいずれかに記載のプログラム。
(Appendix 6)
The program according to any one of (Appendix 1) to (Appendix 4) for generating advice content regarding a schedule based on the result of analysis in the step of generating advice content.
(付記7)
助言内容を生成するステップにおいて、分析の結果に基づき、会議の進行を手助けする助言内容を生成する(付記1)乃至(付記4)のいずれかに記載のプログラム。
(Appendix 7)
The program according to any one of (Appendix 1) to (Appendix 4) that generates advice content that assists the progress of the meeting based on the result of analysis in the step of generating advice content.
(付記8)
第1者から第2者へのメッセージの出力を停止するステップ(1837)をプロセッサに実行させ、助言内容を生成するステップにおいて、第1者から第2者へのメッセージの出力を停止している間に第1者から入力されるメッセージに基づいて、助言内容を生成する(付記1)乃至(付記4)のいずれかに記載のプログラム。
(Appendix 8)
In the step of causing the processor to execute the step (1837) of stopping the output of the message from the first party to the second party and generating the advice content, the output of the message from the first party to the second party is stopped. The program according to any one of (Appendix 1) to (Appendix 4) that generates advice content based on a message input from a first party in between.
(付記9)
第1者から第2者へのメッセージの出力を停止している間に、複数存在する第2者のうちいずれかの指定を受け付けるステップと、助言内容を指定された第2者へ送信するステップとをプロセッサに実行させる(付記8)に記載のプログラム。
(Appendix 9)
While the output of the message from the first party to the second party is stopped, the step of accepting the designation of one of the plurality of second parties and the step of transmitting the advice content to the designated second party. The program described in (Appendix 8).
(付記10)
プロセッサ19と、メモリ15とを備えるコンピュータに実行させるためのプログラムであって、プログラムは、プロセッサに、第1者との遠隔通信に参加する第2者の画像を表示するステップ(184)と、第2者からのメッセージを分析して生成される、第1者に対する助言を与える助言内容を、第2者の画像と関連付けて表示するステップ(184)とを実行させるプログラム。
(Appendix 10)
A program for causing a computer including a
(付記11)
第2者の画像を表示するステップにおいて、第1者との音声会話に参加する第2者の画像を表示し、助言内容を表示するステップにおいて、第2者から入力される音声を分析して生成される助言内容を、第2者の画像と関連付けて表示する(付記10)に記載のプログラム。
(Appendix 11)
In the step of displaying the image of the second party, the image of the second party participating in the voice conversation with the first party is displayed, and in the step of displaying the advice content, the voice input from the second party is analyzed. The program according to (Appendix 10), which displays the generated advice content in association with the image of a second party.
(付記12)
助言内容の属性を識別可能な画像を表示するステップをプロセッサに実行させる(付記10)又は(付記11)に記載のプログラム。
(Appendix 12)
The program according to (Appendix 10) or (Appendix 11), which causes a processor to execute a step of displaying an image in which the attributes of the advice content can be identified.
(付記13)
第1者から第2者へのメッセージの出力を停止させるためのアイコン(1413)を表示するステップをプロセッサに実行させ、助言内容を表示するステップにおいて、第1者から第2者へのメッセージの出力を停止している間に、第1者から入力されるメッセージが分析されて生成される助言内容を表示する(付記10)乃至(付記12)のいずれかに記載のプログラム。
(Appendix 13)
In the step of causing the processor to execute the step of displaying the icon (1413) for stopping the output of the message from the first party to the second party and displaying the advice content, the message from the first party to the second party is displayed. The program according to any one of (Appendix 10) to (Appendix 12), which displays the advice content generated by analyzing a message input from a first party while the output is stopped.
(付記14)
プロセッサ19と、メモリ15とを備えるコンピュータが実行する方法であって、第1者と第2者との遠隔通信において、第1者又は第2者から入力されるメッセージを認識するステップ(ステップS11)と、認識されたメッセージを分析するステップ(ステップS12,16)と、第1者から第2者へのメッセージ、又は第2者から第1者へのメッセージについての分析の結果に基づき、第1者へのサポートが必要か否かを判定するステップ(ステップS13,17)と、必要と判定する場合、分析の結果に基づき、第1者に対する助言を与える助言内容を生成するステップ(ステップS110)とを実行する方法。
(Appendix 14)
A method executed by a computer including the
(付記15)
プロセッサ19と、メモリ15とを備える情報処理装置10であって、プロセッサが、第1者と第2者との遠隔通信において、第1者又は第2者から入力されるメッセージを認識するステップと、認識されたメッセージを分析するステップと、第1者から第2者へのメッセージ、又は第2者から第1者へのメッセージについての分析の結果に基づき、第1者へのサポートが必要か否かを判定するステップと、必要と判定する場合、分析の結果に基づき、第1者に対する助言を与える助言内容を生成するステップとを実行する情報処理装置。
(Appendix 15)
An
(付記16)
第1者と第2者との遠隔通信において、第1者又は前記第2者から入力されるメッセージを認識する手段(1831)と、認識されたメッセージを分析する手段(1832,1833)と、第1者から第2者へのメッセージ、又は第2者から第1者へのメッセージについての分析の結果に基づき、第1者へのサポートが必要か否かを判定する手段(1834)と、必要と判定する場合、分析の結果に基づき、第1者に対する助言を与える助言内容を生成する手段(1836)とを具備するシステム。
(Appendix 16)
In the remote communication between the first party and the second party, means for recognizing a message input from the first party or the second party (1831), means for analyzing the recognized message (1832, 1833), and A means (1834) for determining whether or not support for the first party is necessary based on the result of analysis of the message from the first party to the second party or the message from the second party to the first party. A system including means (1836) for generating advice content that gives advice to a first party based on the result of analysis when it is determined to be necessary.
(付記17)
プロセッサ19と、メモリ15とを備えるコンピュータに実行させるためのプログラムであって、プログラムは、プロセッサに、第1者と第2者との遠隔通信において、第2者から入力されるメッセージを認識するステップ(1863)と、認識されたメッセージを分析するステップ(1864)と、分析の結果に基づき、メッセージの内容に関する情報を第1者に対して生成するステップ(1867)と、分析の結果に基づき、メッセージに対する応答内容を第2者に対して生成するステップ(1868)と、第2者から入力されるメッセージの代わりに、メッセージの内容に関する情報を第1者へ提示するステップ(184)と、メッセージに対する応答内容を第2者へ提示するステップ(182)とを実行させるプログラム。
(Appendix 17)
A program for causing a computer including a
(付記18)
メッセージの内容に関する情報を生成するステップにおいて、分析の結果に基づき、メッセージの内容をまとめた文を生成する(付記17)に記載のプログラム。
(Appendix 18)
The program according to (Appendix 17), which generates a sentence summarizing the contents of a message based on the result of analysis in a step of generating information regarding the contents of the message.
(付記19)
メッセージの内容に関する情報を生成するステップにおいて、分析の結果に基づき、メッセージの翻訳文を生成する(付記17)に記載のプログラム。
(Appendix 19)
The program according to (Appendix 17), which generates a translated text of a message based on the result of analysis in a step of generating information regarding the content of the message.
(付記20)
第1者及び第2者が、以前に参加した遠隔通信の記録に基づき、第1者又は第2者の正当性を確認するための質問を生成するステップをプロセッサに実行させる(付記17)乃至(付記19)のいずれかに記載のプログラム。
(Appendix 20)
Have the processor perform a step in which the first party and the second party generate a question to confirm the validity of the first party or the second party based on the record of the remote communication previously participated (Appendix 17). The program described in any of (Appendix 19).
(付記21)
質問に対する第1者又は第2者の回答を利用し、遠隔通信の記録を修正するステップをプロセッサに実行させる(付記20)に記載のプログラム。
(Appendix 21)
The program according to (Appendix 20), which causes a processor to perform a step of correcting a remote communication record by using a first-party or second-party answer to a question.
(付記22)
メッセージの内容に関する情報を生成するステップにおいて、第1者からの指示に応じた処理を実施する(付記18)又は(付記19)に記載のプログラム。
(Appendix 22)
The program according to (Appendix 18) or (Appendix 19), which performs processing according to an instruction from a first party in a step of generating information regarding the content of a message.
(付記23)
第1者から入力されるメッセージを認識するステップ(ステップS11)と、第1者から第2者へのメッセージ、又は第2者から第1者へのメッセージについての分析の結果に基づき、第1者へのサポートが必要か否かを判定するステップ(ステップS13,17)と、必要と判定する場合、分析の結果に基づき、第1者に対する助言を与える助言内容を生成するステップ(ステップS110)と、助言内容を第1者へ提示するステップ(184)とをプロセッサに実行させる(付記17)乃至(付記22)のいずれかに記載のプログラム。
(Appendix 23)
The first is based on the step of recognizing the message input from the first party (step S11) and the result of the analysis of the message from the first party to the second party or the message from the second party to the first party. A step of determining whether or not support for a person is necessary (steps S13 and 17), and a step of generating advice content that gives advice to a first person based on the result of analysis if it is determined to be necessary (step S110). The program according to any one of (Appendix 17) to (Appendix 22), which causes the processor to execute the step (184) of presenting the advice content to the first party.
(付記24)
プロセッサ19と、メモリ15とを備えるコンピュータに実行させるためのプログラムであって、プログラムは、プロセッサに、第1者と第2者とが遠隔通信に参加し、第1者が、第2者からのメッセージに対するメッセージを入力している場合、第2者の画像を表示するステップと、第2者からのメッセージに基づき、第1者からの入力を経ずに、自動で応答を生成している場合、第2者の画像を、代理であることを表す代理画像にして表示するステップとを実行させるプログラム。
(Appendix 24)
A program for causing a computer having a
(付記25)
第2者からのメッセージが分析されて生成される、メッセージの内容に関する情報を、代理画像と関連付けて表示するステップをプロセッサに実行させる(付記24)に記載のプログラム。
(Appendix 25)
The program according to (Appendix 24), which causes a processor to execute a step of displaying information about the content of a message, which is generated by analyzing a message from a second party, in association with a proxy image.
(付記26)
第2者からのメッセージに基づいてメッセージの内容に関する情報を生成する処理を実施していることを表す画像を表示するステップをプロセッサに実行させる(付記24)又は(付記25)に記載のプログラム。
(Appendix 26)
The program according to (Appendix 24) or (Appendix 25), which causes a processor to execute a step of displaying an image indicating that a process of generating information regarding the content of the message is being performed based on a message from a second party.
(付記27)
第2者からのメッセージを分析して生成される、第1者に対する助言を与える助言内容を、第2者の画像と関連付けて表示するステップをプロセッサに実行させる(付記24)乃至(付記26)のいずれかに記載のプログラム。
(Appendix 27)
Have the processor execute a step of displaying the advice content that gives advice to the first party, which is generated by analyzing the message from the second party, in association with the image of the second party (Appendix 24) to (Appendix 26). The program described in any of.
(付記28)
プロセッサ19と、メモリ15とを備えるコンピュータが実行する方法であって、第1者と第2者との遠隔通信において、第2者から入力されるメッセージを認識するステップ(1863)と、認識されたメッセージを分析するステップ(1864)と、分析の結果に基づき、メッセージの内容に関する情報を第1者に対して生成するステップ(1867)と、分析の結果に基づき、メッセージに対する応答内容を第2者に対して生成するステップ(1868)と、第2者から入力されるメッセージの代わりに、メッセージの内容に関する情報を第1者へ提示するステップ(184)と、メッセージに対する応答内容を第2者へ提示するステップ(182)とを実行する方法。
(Appendix 28)
A method executed by a computer including a
(付記29)
プロセッサ19と、メモリ15とを備える情報処理装置10Aであって、プロセッサが、第1者と第2者との遠隔通信において、第2者から入力されるメッセージを認識するステップ(1863)と、認識されたメッセージを分析するステップ(1864)と、分析の結果に基づき、前記メッセージの内容に関する情報を前記第1者に対して生成するステップ(1867)と、分析の結果に基づき、メッセージに対する応答内容を第2者に対して生成するステップ(1868)と、第2者から入力されるメッセージの代わりに、メッセージの内容に関する情報を第1者へ提示するステップ(184)と、メッセージに対する応答内容を第2者へ提示するステップ(182)とを実行する情報処理装置。
(Appendix 29)
In the
(付記30)
第1者と第2者との遠隔通信において、第2者から入力されるメッセージを認識する手段(1863)と、認識されたメッセージを分析する手段(1864)と、分析の結果に基づき、メッセージの内容に関する情報を第1者に対して生成する手段(1867)と、分析の結果に基づき、メッセージに対する応答内容を第2者に対して生成する手段(1868)と、第2者から入力されるメッセージの代わりに、メッセージの内容に関する情報を第1者へ提示する手段(184)と、メッセージに対する応答内容を第2者へ提示する手段(182)とを具備するシステム。
(Appendix 30)
In the remote communication between the first party and the second party, the means for recognizing the message input from the second party (1863), the means for analyzing the recognized message (1864), and the message based on the analysis result. The means for generating information about the contents of the above (1867) and the means for generating the response contents to the message for the second party based on the result of the analysis (1868) are input from the second party. A system including means for presenting information about the content of a message to a first party (184) and means for presenting a response to the message to a second party (182) instead of the message.
1…システム
10,10A,10B…端末装置
12…通信IF
121…通信部
13…入力装置
131…マウス
132…キーボード
133…タッチ・センシティブ・デバイス
134…マイク
14…出力装置
141…ディスプレイ
142…スピーカ
15…メモリ
16…ストレージ
160…カメラ
170,170A…記憶部
171…第1アプリケーション
172…第2アプリケーション
173…対話履歴データ
174…第3アプリケーション
175…議事録データ
180,180A…制御部
181…操作受付部
182…通信制御部
183…助言制御部
1831…音声認識部
1832…意図解釈部
1833…固有名詞抽出部
1834…助言判定部
1835…外部サービス呼出部
1836…応答生成部
1837…第2切替部
1838…音声合成部
184…表示制御部
185…第1切替部
186…補助制御部
1861…テキスト入力部
1862…第1意図解釈部
1863…音声認識部
1864…第2意図解釈部
1865…対話制御部
1866…外部サービス呼出部
1867…第1応答生成部
1868…第2応答生成部
1869…音声合成部
19…プロセッサ
20,20A~20C…サーバ
201…通信部
202,202B,202C…記憶部
2021…助言制御プログラム
2022…対話履歴データ
2023…補助制御プログラム
2024…議事録データ
203,203B,203C…制御部
2031…送受信部
2032…記憶制御部
2033…助言制御部
2034…提示部
2035…補助制御部
22…通信IF
23…入出力IF
25…メモリ
26…ストレージ
29…プロセッサ
80…ネットワーク
1 ...
121 ...
23 ... Input / output IF
25 ...
Claims (30)
第1者と第2者との遠隔通信において、前記第1者又は前記第2者から入力されるメッセージを認識するステップと、
前記認識されたメッセージを分析するステップと、
前記第1者から前記第2者へのメッセージ、又は前記第2者から前記第1者へのメッセージについての前記分析の結果に基づき、前記第1者へのサポートが必要か否かを判定するステップと、
必要と判定する場合、前記分析の結果に基づき、前記第1者に対する助言を与える助言内容を生成するステップと
を実行させるプログラム。 A program for causing a computer having a processor and a memory to execute the program, wherein the program causes the processor to execute the program.
In the remote communication between the first party and the second party, the step of recognizing the message input from the first party or the second party, and
The steps to analyze the recognized message and
Based on the result of the analysis of the message from the first party to the second party or the message from the second party to the first party, it is determined whether or not support for the first party is necessary. Steps and
A program for executing a step of generating advice content that gives advice to the first party based on the result of the analysis when it is determined to be necessary.
前記サポートの要否を判定するステップにおいて、前記解釈した意図と、メッセージの履歴とに基づき、前記第1者へのサポートが必要か否かを判定し、
前記助言内容を生成するステップにおいて、前記解釈した意図と、前記メッセージの履歴とに基づき、前記助言内容を生成する請求項1記載のプログラム。 In the step of analyzing the message, the intent of the message issued by the first party or the second party is interpreted.
In the step of determining the necessity of the support, it is determined whether or not the support to the first party is necessary based on the interpreted intention and the history of the message.
The program according to claim 1, wherein in the step of generating the advice content, the advice content is generated based on the interpreted intention and the history of the message.
前記サポートの要否を判定するステップにおいて、前記抽出した固有名詞に基づき、前記第1者へのサポートが必要か否かを判定し、
前記助言内容を生成するステップにおいて、前記抽出した固有名詞に基づき、前記助言内容を生成する請求項1乃至3のいずれかに記載のプログラム。 In the step of analyzing the message, the proper noun contained in the message issued from the first person or the second person is extracted.
In the step of determining the necessity of the support, it is determined whether or not the support to the first party is necessary based on the extracted proper noun.
The program according to any one of claims 1 to 3, which generates the advice content based on the extracted proper noun in the step of generating the advice content.
前記助言内容を生成するステップにおいて、前記第1者から前記第2者へのメッセージの出力を停止している間に前記第1者から入力されるメッセージに基づいて、前記助言内容を生成する請求項1乃至4のいずれかに記載のプログラム。 The processor is made to execute a step of stopping the output of the message from the first party to the second party.
A claim to generate the advice content based on the message input from the first party while the output of the message from the first party to the second party is stopped in the step of generating the advice content. The program according to any one of Items 1 to 4.
前記助言内容を前記指定された第2者へ送信するステップと
を前記プロセッサに実行させる請求項8記載のプログラム。 A step of accepting the designation of one of a plurality of existing second parties while the output of the message from the first party to the second party is stopped.
The program according to claim 8, wherein the processor executes the step of transmitting the advice content to the designated second party.
第1者との遠隔通信に参加する第2者の画像を表示するステップと、
前記第2者からのメッセージを分析して生成される、前記第1者に対する助言を与える助言内容を、前記第2者の画像と関連付けて表示するステップと
を実行させるプログラム。 A program for causing a computer having a processor and a memory to execute the program, wherein the program causes the processor to execute the program.
A step to display an image of a second party participating in remote communication with the first party,
A program for executing a step of displaying an advice content for giving advice to the first party, which is generated by analyzing a message from the second party, in association with an image of the second party.
前記助言内容を表示するステップにおいて、前記第2者から入力される音声を分析して生成される助言内容を、前記第2者の画像と関連付けて表示する請求項10記載のプログラム。 In the step of displaying the image of the second party, the image of the second party participating in the voice conversation with the first party is displayed.
The program according to claim 10, wherein in the step of displaying the advice content, the advice content generated by analyzing the voice input from the second party is displayed in association with the image of the second party.
前記助言内容を表示するステップにおいて、前記第1者から前記第2者へのメッセージの出力を停止している間に、前記第1者から入力されるメッセージが分析されて生成される助言内容を表示する請求項10乃至12のいずれかに記載のプログラム。 The processor is made to perform a step of displaying an icon for stopping the output of the message from the first party to the second party.
In the step of displaying the advice content, the advice content generated by analyzing the message input from the first party while the output of the message from the first party to the second party is stopped. The program according to any one of claims 10 to 12 to be displayed.
第1者と第2者との遠隔通信において、前記第1者又は前記第2者から入力されるメッセージを認識するステップと、
前記認識されたメッセージを分析するステップと、
前記第1者から前記第2者へのメッセージ、又は前記第2者から前記第1者へのメッセージについての前記分析の結果に基づき、前記第1者へのサポートが必要か否かを判定するステップと、
必要と判定する場合、前記分析の結果に基づき、前記第1者に対する助言を与える助言内容を生成するステップと
を実行する方法。 It's a way a computer with a processor and memory does it.
In the remote communication between the first party and the second party, the step of recognizing the message input from the first party or the second party, and
The steps to analyze the recognized message and
Based on the result of the analysis of the message from the first party to the second party or the message from the second party to the first party, it is determined whether or not support for the first party is necessary. Steps and
A method of performing a step of generating advice content that gives advice to the first party based on the result of the analysis when it is determined to be necessary.
前記プロセッサが、
第1者と第2者との遠隔通信において、前記第1者又は前記第2者から入力されるメッセージを認識するステップと、
前記認識されたメッセージを分析するステップと、
前記第1者から前記第2者へのメッセージ、又は前記第2者から前記第1者へのメッセージについての前記分析の結果に基づき、前記第1者へのサポートが必要か否かを判定するステップと、
必要と判定する場合、前記分析の結果に基づき、前記第1者に対する助言を与える助言内容を生成するステップと
を実行する情報処理装置。 An information processing device equipped with a processor and a memory.
The processor
In the remote communication between the first party and the second party, the step of recognizing the message input from the first party or the second party, and
The steps to analyze the recognized message and
Based on the result of the analysis of the message from the first party to the second party or the message from the second party to the first party, it is determined whether or not support for the first party is necessary. Steps and
An information processing device that executes a step of generating advice content that gives advice to the first party based on the result of the analysis when it is determined to be necessary.
前記認識されたメッセージを分析する手段と、
前記第1者から前記第2者へのメッセージ、又は前記第2者から前記第1者へのメッセージについての前記分析の結果に基づき、前記第1者へのサポートが必要か否かを判定する手段と、
必要と判定する場合、前記分析の結果に基づき、前記第1者に対する助言を与える助言内容を生成する手段と
を具備するシステム。 A means for recognizing a message input from the first person or the second person in remote communication between the first person and the second person.
A means of analyzing the recognized message and
Based on the result of the analysis of the message from the first party to the second party or the message from the second party to the first party, it is determined whether or not support for the first party is necessary. Means and
A system provided with a means for generating advice content that gives advice to the first party based on the result of the analysis when it is determined to be necessary.
第1者と第2者との遠隔通信において、前記第2者から入力されるメッセージを認識するステップと、
前記認識されたメッセージを分析するステップと、
前記分析の結果に基づき、前記メッセージの内容に関する情報を前記第1者に対して生成するステップと、
前記分析の結果に基づき、前記メッセージに対する応答内容を前記第2者に対して生成するステップと、
前記第2者から入力されるメッセージの代わりに、前記メッセージの内容に関する情報を前記第1者へ提示するステップと、
前記メッセージに対する応答内容を前記第2者へ提示するステップと
を実行させるプログラム。 A program for causing a computer having a processor and a memory to execute the program, wherein the program causes the processor to execute the program.
In the remote communication between the first party and the second party, the step of recognizing the message input from the second party and
The steps to analyze the recognized message and
A step of generating information about the content of the message for the first party based on the result of the analysis, and
Based on the result of the analysis, a step of generating a response content to the message to the second party, and
A step of presenting information about the content of the message to the first party instead of the message input from the second party.
A program for executing a step of presenting a response content to the message to the second party.
前記第1者から前記第2者へのメッセージ、又は前記第2者から前記第1者へのメッセージについての前記分析の結果に基づき、前記第1者へのサポートが必要か否かを判定するステップと、
必要と判定する場合、前記分析の結果に基づき、前記第1者に対する助言を与える助言内容を生成するステップと、
前記助言内容を前記第1者へ提示するステップと
を前記プロセッサに実行させる請求項17乃至22のいずれかに記載のプログラム。 The step of recognizing the message input from the first party,
Based on the result of the analysis of the message from the first party to the second party or the message from the second party to the first party, it is determined whether or not support for the first party is necessary. Steps and
If it is determined to be necessary, a step of generating advice content that gives advice to the first party based on the result of the analysis, and
The program according to any one of claims 17 to 22, which causes the processor to execute the step of presenting the advice content to the first party.
第1者と第2者とが遠隔通信に参加し、前記第1者が、前記第2者からのメッセージに対するメッセージを入力している場合、前記第2者の画像を表示するステップと、
前記第2者からのメッセージに基づき、第1者からの入力を経ずに、自動で応答を生成している場合、前記第2者の画像を、代理であることを表す代理画像にして表示するステップと
を実行させるプログラム。 A program for causing a computer having a processor and a memory to execute the program, wherein the program causes the processor to execute the program.
When the first party and the second party participate in the remote communication and the first party inputs a message for the message from the second party, the step of displaying the image of the second party and the step of displaying the image of the second party.
When a response is automatically generated based on the message from the second party without input from the first party, the image of the second party is displayed as a proxy image indicating that it is a proxy. A program that executes the steps to be performed.
第1者と第2者との遠隔通信において、前記第2者から入力されるメッセージを認識するステップと、
前記認識されたメッセージを分析するステップと、
前記分析の結果に基づき、前記メッセージの内容に関する情報を前記第1者に対して生成するステップと、
前記分析の結果に基づき、前記メッセージに対する応答内容を前記第2者に対して生成するステップと、
前記第2者から入力されるメッセージの代わりに、前記メッセージの内容に関する情報を前記第1者へ提示するステップと、
前記メッセージに対する応答内容を前記第2者へ提示するステップと
を実行する方法。 It's a way a computer with a processor and memory does it.
In the remote communication between the first party and the second party, the step of recognizing the message input from the second party and
The steps to analyze the recognized message and
A step of generating information about the content of the message for the first party based on the result of the analysis, and
Based on the result of the analysis, a step of generating a response content to the message to the second party, and
A step of presenting information about the content of the message to the first party instead of the message input from the second party.
A method of performing a step of presenting a response content to the message to the second party.
前記プロセッサが、
第1者と第2者との遠隔通信において、前記第2者から入力されるメッセージを認識するステップと、
前記認識されたメッセージを分析するステップと、
前記分析の結果に基づき、前記メッセージの内容に関する情報を前記第1者に対して生成するステップと、
前記分析の結果に基づき、前記メッセージに対する応答内容を前記第2者に対して生成するステップと、
前記第2者から入力されるメッセージの代わりに、前記メッセージの内容に関する情報を前記第1者へ提示するステップと、
前記メッセージに対する応答内容を前記第2者へ提示するステップと
を実行する情報処理装置。 An information processing device equipped with a processor and a memory.
The processor
In the remote communication between the first party and the second party, the step of recognizing the message input from the second party and
The steps to analyze the recognized message and
A step of generating information about the content of the message for the first party based on the result of the analysis, and
Based on the result of the analysis, a step of generating a response content to the message to the second party, and
A step of presenting information about the content of the message to the first party instead of the message input from the second party.
An information processing device that executes a step of presenting a response content to the message to the second party.
前記認識されたメッセージを分析する手段と、
前記分析の結果に基づき、前記メッセージの内容に関する情報を前記第1者に対して生成する手段と、
前記分析の結果に基づき、前記メッセージに対する応答内容を前記第2者に対して生成する手段と、
前記第2者から入力されるメッセージの代わりに、前記メッセージの内容に関する情報を前記第1者へ提示する手段と、
前記メッセージに対する応答内容を前記第2者へ提示する手段と
を具備するシステム。 A means for recognizing a message input from the second party in remote communication between the first party and the second party,
A means of analyzing the recognized message and
A means for generating information about the content of the message to the first party based on the result of the analysis, and
A means for generating a response content to the message to the second party based on the result of the analysis, and
A means of presenting information about the content of the message to the first party instead of the message input from the second party.
A system including means for presenting a response content to the message to the second party.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020182664A JP2022072949A (en) | 2020-10-30 | 2020-10-30 | Program, method, information processing apparatus, and system |
PCT/JP2021/035648 WO2022091675A1 (en) | 2020-10-30 | 2021-09-28 | Program, method, information processing device, and system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020182664A JP2022072949A (en) | 2020-10-30 | 2020-10-30 | Program, method, information processing apparatus, and system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022072949A true JP2022072949A (en) | 2022-05-17 |
Family
ID=81384021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020182664A Pending JP2022072949A (en) | 2020-10-30 | 2020-10-30 | Program, method, information processing apparatus, and system |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2022072949A (en) |
WO (1) | WO2022091675A1 (en) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130071958A (en) * | 2011-12-21 | 2013-07-01 | 엔에이치엔(주) | System and method for providing interpretation or translation of user message by instant messaging application |
KR20170132715A (en) * | 2015-02-09 | 2017-12-04 | 가부시키가이샤 퓨트렉 | A communication terminal, a message translation system, a message translation method, and a message translation program |
US10460227B2 (en) * | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
JP2017211857A (en) * | 2016-05-26 | 2017-11-30 | Ground株式会社 | Task management system |
JP2018160088A (en) * | 2017-03-23 | 2018-10-11 | 株式会社サテライトオフィス | Chat system and program |
JP7073839B2 (en) * | 2018-03-27 | 2022-05-24 | 日本電信電話株式会社 | Response statement generator, response statement generator, and program |
JP2020047028A (en) * | 2018-09-20 | 2020-03-26 | 富士ゼロックス株式会社 | Information processing system, method and program |
JP6469299B1 (en) * | 2018-10-10 | 2019-02-13 | 株式会社FiNC Technologies | Method |
JP6646240B1 (en) * | 2019-04-09 | 2020-02-14 | 富士通クライアントコンピューティング株式会社 | Information processing apparatus and information processing program |
-
2020
- 2020-10-30 JP JP2020182664A patent/JP2022072949A/en active Pending
-
2021
- 2021-09-28 WO PCT/JP2021/035648 patent/WO2022091675A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022091675A1 (en) | 2022-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6776462B2 (en) | Automatic assistant with meeting ability | |
US10395220B2 (en) | Auto-generation of actions of a collaborative meeting | |
CN110574004B (en) | Initializing a conversation with an automated agent via an optional graphical element | |
US10069877B2 (en) | Multiplexed, multimodal conferencing | |
KR20180134994A (en) | Automated Assistant invocation of the appropriate agent | |
JP2022105273A (en) | Computer-implemented method, computer-implemented system and computer program product for generating summaries and next actions in real time for multiple users from interaction records in natural language | |
JP7297797B2 (en) | Method and apparatus for managing holds | |
US11671467B2 (en) | Automated session participation on behalf of absent participants | |
WO2018186416A1 (en) | Translation processing method, translation processing program, and recording medium | |
KR20240046508A (en) | Decision and visual display of voice menu for calls | |
Warnicke et al. | The headset as an interactional resource in a video relay interpreting (VRI) setting | |
CN111554280A (en) | Real-time interpretation service system for mixing interpretation contents using artificial intelligence and interpretation contents of interpretation experts | |
US11783836B2 (en) | Personal electronic captioning based on a participant user's difficulty in understanding a speaker | |
WO2022091675A1 (en) | Program, method, information processing device, and system | |
EP2863341A1 (en) | Cross-channel content translation engine | |
Demaeght et al. | A survey-based study to identify user annoyances of german voice assistant users | |
Santos et al. | Voice interaction on TV: analysis of natural language interaction models and recommendations for voice user interfaces | |
JP6867061B1 (en) | Assist device and program | |
WO2022239053A1 (en) | Information processing device, information processing method, and information processing program | |
Hackbarth | Voices from Industry Revolutionizing Augmentative and Alternative Communication with Generative Artificial Intelligence | |
Hackbarth | Revolutionizing Augmentative and Alternative Communication with Generative Artificial Intelligence | |
Tsubokura et al. | Analysis of the relationship between user response to dialog breakdown and personality traits | |
Hori et al. | Conversation Summarization System Emphasizing Recent Context for Supporting Seamless Rejoining of a Group Chat After Temporary Absence | |
Jadon et al. | Augmented Conversation with Embedded Speech-Driven On-the-Fly Referencing in AR | |
KR20190056352A (en) | A collaborative personal assistant system for delegating providing of services supported by third party task providers and method therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210322 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231023 |