JP6679360B2 - Information providing apparatus and information providing method - Google Patents
Information providing apparatus and information providing method Download PDFInfo
- Publication number
- JP6679360B2 JP6679360B2 JP2016055545A JP2016055545A JP6679360B2 JP 6679360 B2 JP6679360 B2 JP 6679360B2 JP 2016055545 A JP2016055545 A JP 2016055545A JP 2016055545 A JP2016055545 A JP 2016055545A JP 6679360 B2 JP6679360 B2 JP 6679360B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- conference
- concept
- vector space
- information providing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 69
- 230000004044 response Effects 0.000 claims description 105
- 239000013598 vector Substances 0.000 claims description 87
- 230000008569 process Effects 0.000 claims description 45
- 230000002787 reinforcement Effects 0.000 claims description 22
- 238000013459 approach Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000004807 localization Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 description 28
- 238000012545 processing Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 235000004522 Pentaglottis sempervirens Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、情報提供装置および情報提供方法に関する。 The present invention relates to an information providing device and an information providing method.
従来、入力された情報の解析結果に基づいて、入力された情報と関連する情報を検索もしくは生成し、検索もしくは生成した情報を応答として出力する技術が知られている。このような技術の一例として、入力されたテキストに含まれる単語、文章、文脈を多次元ベクトルに変換して解析し、解析結果に基づいて、入力されたテキストと類似するテキストや、入力されたテキストに続くテキストを類推し、類推結果を出力する自然言語処理の技術が知られている。 BACKGROUND ART Conventionally, there is known a technique of searching or generating information related to the input information based on an analysis result of the input information and outputting the searched or generated information as a response. As an example of such a technique, the words, sentences, and contexts included in the input text are converted into a multidimensional vector and analyzed, and based on the analysis result, text similar to the input text or the input text is input. There is a known natural language processing technique in which a text following a text is analogized and the analogy result is output.
しかしながら、上記の従来技術を会議の補助として適用した場合、会議を効率的に進めることができない場合がある。 However, when the above-mentioned conventional technique is applied as an aid to a conference, the conference may not be able to proceed efficiently.
例えば、上述した従来技術を用いて、会議等の発言に対応する発言をロボット等から出力するといった技術が考えられる。しかしながら、上記の従来技術では、入力されたテキストと類似するテキストや、入力されたテキストに続くテキスト等、利用者が予測しうる情報を出力しているに過ぎない。このため、例えば、上記の従来技術では、会議を効率的に進めることができないおそれがある。 For example, a technique is conceivable in which a utterance corresponding to a utterance at a conference or the like is output from a robot or the like by using the above-described conventional technique. However, in the above-mentioned conventional technique, the information similar to the input text, the text following the input text, and the like that the user can predict are merely output. Therefore, for example, in the above-described related art, there is a possibility that the conference cannot be efficiently advanced.
本願は、上記に鑑みてなされたものであって、会議を効率的に進めることを目的とする。 The present application has been made in view of the above, and an object thereof is to efficiently advance a conference.
本願にかかる情報提供装置は、会議における複数の利用者の発言内容を取得する取得部と、前記取得部により取得された利用者の発言内容をベクトル空間上に投影する投影部と、前記ベクトル空間上に投影された発言内容の履歴の位置と、前記ベクトル空間上に投影された新たな発言内容の位置とに基づいて、前記会議を誘導する方向を特定する特定部と、前記会議を前記特定された方向へと誘導するための応答を出力する出力部とを有することを特徴とする。 An information providing apparatus according to the present application includes an acquisition unit that acquires the content of statements of a plurality of users in a conference, a projection unit that projects the content of statements of the users acquired by the acquisition unit onto a vector space, and the vector space. A specifying unit that specifies the direction in which the conference is guided based on the position of the history of the comment contents projected above and the position of the new comment contents projected on the vector space, and the specifying of the meeting. And an output unit that outputs a response for guiding in the specified direction.
実施形態の一態様によれば、会議を効率的に進めることができる。 According to one aspect of the embodiment, the conference can be efficiently advanced.
以下に、本願にかかる情報提供装置および情報提供方法を実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願にかかる情報提供装置および情報提供方法が限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Hereinafter, modes (hereinafter, referred to as “embodiments”) for carrying out the information providing apparatus and the information providing method according to the present application will be described in detail with reference to the drawings. The information providing apparatus and the information providing method according to the present application are not limited by this embodiment. Further, in the following embodiments, the same parts are designated by the same reference numerals, and duplicated description will be omitted.
〔1.情報提供装置の一例〕
まず、図1を用いて、情報提供装置10が実行する応答処理の一例について説明する。図1は、実施形態に係る情報提供装置の一例を示す図である。例えば、図1に示す例では、応答処理の一例を、複数の利用者がブレインストーミング等の会議を行っている際に、利用者の発言を入力情報として取得し、取得した入力情報に基づいて、会議に参加した個々の意見や会議における話題の方向性を深層強化学習(DQN:Deep Q-Network)により学習することで、会議に参加した利用者の集団的知能の学習を行う学習処理と、会議における発言内容をベクトル空間上にマッピングし、自動運転等で用いられているSLAM(Simultaneous Localization and Mapping)の技術を用いて、会議における話題の方向性を誘導する誘導処理とに分けて説明する。
[1. Example of information providing device]
First, an example of the response process executed by the
より具体的には、以下の説明では、学習処理として、会議に参加した利用者の集団的知能の学習を行い、学習結果に基づいて、会議における現在の状況をコントロールするための応答を出力する処理の一例について説明する。また、以下の説明では、誘導処理として、会議において過去に行われた議論を避けたり、過去に会議が盛り上がった話題等に会議の内容を誘導する処理の一例について説明する。 More specifically, in the following description, as a learning process, the collective intelligence of the users who participated in the conference is learned, and a response for controlling the current situation in the conference is output based on the learning result. An example of processing will be described. In addition, in the following description, an example of a process of avoiding a discussion conducted in the past in the conference or guiding the contents of the conference to a topic or the like that the conference was excited in the past will be described as the guidance process.
図1に示した情報提供装置10は、サーバ装置等の情報処理装置により実現される。なお、情報提供装置10は、単一の情報処理装置に実現されてもよく、例えば、クラウドネットワーク上に存在する複数の情報処理装置が協調して実現されてもよい。このような、情報提供装置10は、利用者の発言をテキストデータに変換し、テキストデータを自然言語処理により解析する。そして、情報提供装置10は、解析結果に基づいて、会議や利用者の思考を支援する発言を生成し、生成した発言を出力する。
The
〔1−1.応答処理の一例〕
ここで、従来技術では、入力されたテキストを構成する複数次元の単語ベクトルで示す分散表現を用いて、入力されたテキストと類似するテキストや、入力されたテキストに続くテキストを類推する。このような従来技術を用いて、会議等の発言に対応する発言をロボット等から出力することで、会議の進行を補助するといった技術が考えられる。しかしながら、上記の従来技術では、入力されたテキストと類似するテキストや、入力されたテキストに続くテキスト等、利用者が予測しうる情報を出力しているに過ぎない。このため、例えば、上記の従来技術では、会議の内容を停滞させたり、会議の内容を発散させたりしてしまい、会議を効率的に進めることができないおそれがある。そこで、情報提供装置10は、応答処理として、集団知能の学習を行う学習処理と、会議の内容を誘導する誘導処理とを実行する。なお、以下の説明では、学習処理と誘導処理とをそれぞれ個別に説明するが、実際には、情報提供装置10により学習処理と誘導処理とが同時並行的に実行されることとなる。
[1-1. Example of response processing]
Here, in the prior art, a text similar to the input text or a text following the input text is analogized by using a distributed expression represented by a multidimensional word vector forming the input text. A technique of assisting the progress of the conference by outputting a utterance corresponding to the utterance of the conference or the like from a robot or the like using such a conventional technique is conceivable. However, in the above-mentioned conventional technique, the information similar to the input text, the text following the input text, and the like that the user can predict are merely output. Therefore, for example, in the above-described conventional technology, the content of the conference may be stagnant or the content of the conference may be diverged, and the conference may not be able to proceed efficiently. Therefore, the
〔1−1−1.学習処理〕
まず、情報提供装置10が実行する学習処理の一例について説明する。まず、情報提供装置10は、会議における利用者の発言内容を取得する。続いて、情報提供装置10は、入力された発言内容に対する応答であって、後続する他の発言の内容を会議の目的に近づくように誘導する応答を決定する。より具体的には、情報提供装置10は、取得された発言内容に対して出力された応答に後続する発言が、会議の目的に近づくようにする応答を決定する。例えば、情報提供装置10は、ある発言内容に後続する発言が会議の目的に近づくように、発言に対する応答を深層強化学習により学習した学習器を用いて、応答を決定する。そして、情報提供装置10は、決定した応答を発言に対する応答として出力する。
[1-1-1. Learning process]
First, an example of the learning process executed by the
ここで、深層強化学習とは、所謂ディープラーニング等の深層学習と、前回の出力結果による現在の状況を観測し、観測結果に応じて取るべき行動を決定する強化学習とを組み合わせた学習手法である。より具体的には、情報提供装置10は、入力層と、複数の中間層と、出力層とを有するニューラルネットワークであるDNN(Deep Neural Network)を学習器として保持し、入力情報を入力層から入力した際に出力層から出力される情報に基づいて、応答を決定する。さらに、情報提供装置10は、決定した応答を出力した後における環境、すなわち、応答に対する利用者の評価や反応、会議の内容等を取得し、取得した評価等を報酬として取得し、取得した報酬に基づいて、学習器の修正(再学習)を行う。すなわち、情報提供装置10は、会議における利用者の発言を深層強化学習における状態Sとし、状態Sと方策πとに基づいて、方策aを決定する。そして、情報提供装置10は、後述する利用者の発言を深層強化学習における方策πの結果(すなわち、報酬R)として状態価値関数を算出し、算出した状態価値関数に基づいて、方策πの更新を行う。
Here, deep reinforcement learning is a learning method that combines deep learning such as so-called deep learning with reinforcement learning that observes the current situation based on the previous output result and determines the action to be taken according to the observation result. is there. More specifically, the
例えば、情報提供装置10は、出力した応答に対する利用者の発言内容を新たに取得する。そして、情報提供装置10は、新たに取得された利用者の発言内容に基づいて、応答を評価する値、すなわち、状態価値関数を算出し、算出した状態価値関数に基づいて、新たに取得された利用者の発言内容に対する応答を決定する。
For example, the
ここで、情報提供装置10は、利用者の発言が会議の目的に近づくように、報酬Rの値を設定する。例えば、情報提供装置10は、前回取得した発言内容と、新たに取得した発言内容とのブレが少ない程、報酬Rの値を大きくする。ここで、報酬Rの値は、例えば、形態素解析等の文章解析技術に基づいて、前回の発言内容と、新たな発言内容との比較を行い、前回の発言内容と新たな発言内容との差分が大きい程、報酬Rの値を小さくするといった手段により実現される。
Here, the
また、報酬Rの値は、例えば、発言後において、会議に参加する利用者が入力した評価の値に基づいて決定されてもよい。例えば、情報提供装置10は、応答の出力後に、会議に参加する利用者から、会議の内容が目的に近づいているか否かの評価を受付ける。このような評価は、例えば、各利用者に与えられたスライダ等の入力装置や、BMI(Brain-machine Interface)等によって取得される。そして、情報提供装置10は、取得された評価に基づいて、報酬Rの値を設定し、設定した報酬Rの値に基づいて、学習器の修正を行う。
Further, the value of the reward R may be determined, for example, based on the evaluation value input by the users who participate in the conference after the statement. For example, the
〔1−1−2.誘導処理〕
ここで、利用者の発言が単純に会議の目的に近づくような応答を出力したとしても、会議を適切に誘導することができない場合もある。例えば、会議等においては、各利用者に前回とは異なるアイデアを出させたり、過去に盛り上がった話題等に誘導することで、会議を円滑に進めたい場合等が考えられる。
[1-1-2. Induction processing)
Here, even if a response in which the user's remark simply approaches the purpose of the conference is output, it may not be possible to appropriately guide the conference. For example, in a meeting or the like, there may be a case where the user wants to smoothly advance the meeting by causing each user to come up with an idea different from the previous one, or by leading to a topic or the like that has been excited in the past.
そこで、情報提供装置10は、以下の誘導処理を実行する。例えば、情報提供装置10は、会議における複数の利用者の発言内容を取得する。そして、情報提供装置10は、取得された利用者の発言内容をベクトル空間上に投影する。例えば、情報提供装置10は、W2V(Word 2 Vector)等、単語や文章等が有する意味や概念を複数次元の量(分散表現)に変換する任意の技術を用いて、利用者の発言内容が有する意味をベクトル空間上に投影する。すなわち、情報提供装置10は、同じ話題の発言内容が、ベクトル空間のうち所定の範囲内に収まるように、発言内容の投影を行う。そして、情報提供装置10は、ベクトル空間上に投影された発言内容の履歴の位置と、ベクトル空間上に投影された新たな発言内容の位置とに基づいて、会議を誘導する方向を決定する。
Therefore, the
すなわち、情報提供装置10は、発言内容の意味をベクトル空間上の位置に置き換えることで、過去の会議の内容と、現在の会議内容との関係性を、ベクトル空間上の位置に置き換える。そして、情報提供装置10は、自動運転等に用いられるSLAM等の技術を用いて、ベクトル空間上において会議を誘導する方向を特定し、特定した方向に会議を誘導する応答を出力する。すなわち、情報提供装置10は、発言内容の意味をベクトル空間上に投影することで、発言内容の意味やアイデアの近さを距離空間上にマッピングしたアイデアマップを生成する。そして、情報提供装置10は、最新の発言内容や、それまでの発言内容を投影したベクトルの合成をベクトル空間上に投影することで、アイデアマップ中における会議の現状を示す位置を特定することで、議論の中心の位置を議論全体の中から俯瞰できるようにする。
That is, the
その後、情報提供装置10は、特定した方向へ会議を誘導する応答を生成して出力する。例えば、情報提供装置10は、上述した学習処理において、利用者の発言内容がベクトル空間上において特定した方向へ向かうように学習器の更新を行うことで、特定した方向へ会議を誘導する応答を出力する。より具体的には、情報提供装置10は、応答に続く利用者の新たな発言内容をベクトル空間上に投影し、新たな発言内容を投影した位置が前回の発言内容を投影した位置よりも特定した方向に近づいている場合には、報酬Rの値をより大きな値に更新し、学習器の修正を行う。
After that, the
ここで、情報提供装置10は、会議を誘導する方向として任意の方向を特定してよい。例えば、情報提供装置10は、過去に会議が盛り上がった際における利用者の発言内容が投影された方向を特定し、特定した方向へ会議を誘導する応答を出力する。この結果、情報提供装置10は、会議の停滞等を防ぎ、会議を円滑に進めることができる。また、他の例では、情報提供装置10は、過去の会議における発言内容が投影された位置、すなわち、発言内容の履歴が投影された位置から離れる方向を特定し、特定した方向へ会議を誘導する応答を出力する。この結果、情報提供装置10は、会議が同じ話題で堂々巡りする等といった事態を防ぎ、会議を目的に沿った方向へ進めることができる。
Here, the
なお、会議を誘導する方向を特定する処理については、会議の目的や会議の現状、過去における会議の内容などに基づいて、任意の設定や戦略が適用可能である。例えば、情報提供装置10は、会議が盛り上がらなかった際における利用者の発言内容が投影されたベクトル空間上の領域を障害物と見做し、SLAMの技術を用いて障害物をよけるベクトル空間上の経路を特定し、会議を特定した経路に沿うように誘導してもよい。
Regarding the process of identifying the direction in which the conference is guided, arbitrary settings and strategies can be applied based on the purpose of the conference, the current state of the conference, the content of the conference in the past, and the like. For example, the
また、情報提供装置10は、高次元なベクトル空間を高速に処理するため、各点間の距離を保持するように次元数を圧縮するMDS(Multi Dimensional Scaling)(多次元距離尺度)等の技術を用いて、ベクトル空間の次元を圧縮してから、誘導方向を特定する処理を実行してもよい。
In addition, the
〔1−2.応答処理の一例〕
次に、図1を用いて、情報提供装置10が実行する応答処理の一例について説明する。例えば、図1に示す例では、情報提供装置10は、会議における利用者の発言Aや発言Bを入力として受付ける(ステップS1)。より具体的には、情報提供装置10は、利用者が発声した発言Aをテキストデータに変換し、変換後のテキストデータを入力情報として取得する。
[1-2. Example of response processing]
Next, an example of the response process executed by the
かかる場合、情報提供装置10は、応答処理を実行する(ステップS2)。まず、情報提供装置10は、発言内容をベクトル空間上に投影する(ステップS3)。そして、情報提供装置10は、ベクトル空間上における過去の発言内容の位置と、新たな発言内容の位置との位置関係を特定する(ステップS4)。そして、情報提供装置10は、特定した位置関係に基づいて、SLAM等の技術を用いて、会議を誘導する方向を特定する(ステップS5)。
In such a case, the
続いて、情報提供装置10は、会議の目的に近づけるように深層強化学習を行った学習器を用いて、発言内容に対する応答を生成する(ステップS6)。そして、情報提供装置10は、生成した応答を出力する(ステップS7)。例えば、情報提供装置10は、生成した応答を発言Cとしてロボット等に読み出させることで、会議の誘導を行う。
Subsequently, the
また、情報提供装置10は、発言Cに対する利用者の評価を受付ける(ステップS8)。例えば、会議に参加する利用者は、発言Cにより会議が目的へと近づいたと感じた場合等には、発言Cが有用である旨の評価を入力する。すると、情報提供装置10は、入力された評価を現在の方策に対する報酬として、深層強化学習を行う(ステップS9)。すなわち、情報提供装置10は、より良い報酬を得ることができるように、学習器の修正を行う。
Further, the
なお、上述した例では、応答処理として、学習処理と誘導処理との実行結果を応答として出力する処理の一例について記載した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、上述した誘導処理のみを実行して得られる応答を出力してもよく、誘導処理を実行せず、深層強化学習の結果得られる学習器を用いて生成した応答を出力してもよい。
In addition, in the above-mentioned example, an example of the process of outputting the execution result of the learning process and the guidance process as the response is described as the response process. However, the embodiment is not limited to this. For example, the
〔2.情報提供装置の構成〕
次に、図2を用いて、図1に示した学習処理および誘導処理を実行する情報提供装置10の構成について説明する。図2は、実施形態に係る情報提供装置が有する機能構成の一例を示す図である。図2に示すように、情報提供装置10は、入力装置30および出力装置31と接続されている。また、情報提供装置10は、通信部11、記憶部12、および制御部16を有する。
[2. Configuration of information providing device]
Next, the configuration of the
通信部11は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部11は、マイクやキーボード等の入力装置30と、モニタやプリンタ、音声を発声することができるロボット等の出力装置31と接続され、各種情報の送受信を行う。
The
記憶部12は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部12は、モデルデータベース13およびベクトル空間データベース14を有する。
The
モデルデータベース13には、学習処理によって学習されるモデル、すなわち、深層強化学習により、後続する利用者の発言内容を会議の目的に近づけるようにする応答を学習した学習器のデータが登録されている。例えば、モデルデータベース13には、学習器に含まれるニューロン間の接続関係や、接続係数等が登録されている。
In the
ベクトル空間データベース14には、会議における利用者の発言内容が投影されたベクトル空間が登録されている。例えば、ベクトル空間データベース14には、W2Vの技術等を用いて、複数次元の量に変換された利用者の発言内容の履歴が登録されている。なお、各発言内容を示すベクトル(分散表現)は、各発言内容の関係性に基づいて生成されるため、各発言内容の向きや距離は、各発言内容が有する意味、概念および共起性の類似度に対応することとなる。 In the vector space database 14, a vector space in which the user's utterance content in the conference is projected is registered. For example, in the vector space database 14, a history of user's utterance contents converted into a plurality of dimensions using W2V technology or the like is registered. Since the vector (distributed expression) indicating each utterance content is generated based on the relationship between each utterance content, the direction and distance of each utterance content indicate the meaning, concept, and co-occurrence of each utterance content. It corresponds to the degree of similarity.
制御部16は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部16は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
The
図2に示すように、制御部16は、取得部17、投影部18、位置特定部19、誘導方向特定部20、応答決定部21、応答出力部22、評価取得部23、およびモデル更新部24を有する。なお、各部17〜20は、上述した誘導処理を実現するための機能構成であり、各部21〜24は、学習処理を実現するための機能構成である。このため、情報提供装置10は、例えば、各部17〜20を有する誘導装置と、各部21〜24有する学習装置とが協調して動作することにより、実現されてもよい。
As shown in FIG. 2, the
〔2−1.誘導処理を実現する構成例〕
取得部17は、会議における利用者の発言内容を取得する。例えば、取得部17は、マイクやキーボード等により実現される入力装置30から、会議における利用者の発言を取得する。かかる場合、取得部17は、受付けた利用者の発言をテキストデータに変換する。
[2-1. Configuration example for implementing guidance processing]
The
投影部18は、取得された利用者の発言内容をベクトル空間上に投影する。例えば、投影部18は、形態素解析等の技術を用いて、テキストデータに含まれる単語群を抽出し、抽出した単語群が有する概念や意味、すなわち、発言内容が有する概念や意味を複数次元の量に変換することで、発言内容をベクトル空間上に投影する。そして、投影部18は、変換後の発言内容をベクトル空間データベース14に登録する。 The projection unit 18 projects the acquired speech content of the user on the vector space. For example, the projection unit 18 extracts a word group included in the text data by using a technique such as morphological analysis, and calculates the concept or meaning of the extracted word group, that is, the concept or meaning of the utterance content in multiple dimensions. By converting it into a quantity, the content of the speech is projected on the vector space. Then, the projection unit 18 registers the converted speech content in the vector space database 14.
位置特定部19は、ベクトル空間上に投影された発言内容の履歴の位置と、ベクトル空間上に投影された新たな発言内容の位置との関係を特定する。例えば、位置特定部19は、ベクトル空間データベース14を参照し、現在の会議の状態を示す位置と、過去の発言内容が投影されたベクトル空間上の位置との位置関係を特定する。例えば、位置特定部19は、最後に出力された発言内容(最新の発言内容)が投影されたベクトル空間上の位置や、会議における発言内容を投影したベクトルの合計等を現在の会議の状態を示すベクトル空間上の位置として、過去の発言内容が投影されたベクトル空間上の位置との関係を特定する。
The
誘導方向特定部20は、位置特定部19によって特定された位置関係に基づいて、会議を誘導する方向を特定する。例えば、誘導方向特定部20は、最後に出力された発言内容が投影されたベクトル空間上の位置を現在の位置とし、過去の発言内容が投影されたベクトル空間上の位置を過去の位置として、SLAMの技術を用いて、会議を誘導する方向を特定する。例えば、誘導方向特定部20は、会議を誘導する方向として、発言内容の履歴が投影された位置から離れる方向や、会議が盛り上がった際における発言内容が投影された方向を特定する。
The guidance
例えば、図3は、実施形態に係る情報提供装置が会議を誘導する方向を特定する処理の一例を示す図である。例えば、投影部18は、図3中(A)に示すように、会議における利用者の発言内容をベクトル空間上に投影することで、発言内容の意味や概念の関係性を距離空間に投影したアイデアマップを生成する。より具体的には、投影部18は、図3中(B)に示すように、発言内容を、その発言内容の意味や概念を相対的に示す位置に投影する。そこで、誘導方向特定部20は、SLAMの技術を用いて、図3中(A)に示すアイデアマップにおいて、どのように移動するかを特定することで、どのように会議を誘導するかを決定する。
For example, FIG. 3 is a diagram illustrating an example of processing in which the information providing apparatus according to the embodiment specifies a direction in which a conference is guided. For example, as shown in FIG. 3A, the projection unit 18 projects the user's utterance content in the conference on the vector space, thereby projecting the meaning of the utterance content and the relationship between the concepts to the metric space. Generate an idea map. More specifically, as shown in FIG. 3B, the projection unit 18 projects the utterance content at a position relatively indicating the meaning or concept of the utterance content. Therefore, the guiding
例えば、誘導方向特定部20は、図3中(C)に示すように、過去の会議における利用者の発言内容が投影された領域を障害物として特定する。そして、誘導方向特定部20は、会議における過去の話題とは異なる話題の方向へ会議を誘導する場合には、図3中(D)に示すように、障害物をよけるように、アイデアマップ上の経路を特定することで、会議を誘導する方向を特定する。すなわち、誘導方向特定部20は、会議における利用者の発言内容を投影したアイデアマップを作成しつつ、過去の会議の内容とは異なる道筋で、会議を目的へと誘導する。
For example, as shown in FIG. 3C, the guiding
例えば、図4は、実施形態に係る情報提供装置が会議を誘導する道筋の一例を示す図である。例えば、誘導方向特定部20は、図4中(A)に示すように、利用者の発言S1を取得した場合、図4中(B)に示すように、会議の目的へと各利用者の発言S2〜Stが行われ、会議の目的から離れた発言z1〜ztが行われないように、各利用者の発言を誘導する方向を特定する。また、誘導方向特定部20は、会議の目的から離れた発言θ1、θ2、u1〜ut等が行われた場合には、各利用者の発言s2〜stが行われる方向を、各利用者の発言を誘導する方向とする。
For example, FIG. 4 is a diagram illustrating an example of a route by which the information providing apparatus according to the embodiment guides a conference. For example, when the guidance
ここで、誘導方向特定部20がSLAMの技術を用いて、会議を誘導する方向を決定する手法の一例について説明する。例えば、誘導方向特定部20は、誘導対象となる会議の時刻「t」におけるベクトル空間上の位置を「st」とする。例えば、誘導方向特定部20は、会議における全発言内容をベクトル空間上に投影したベクトルの和や、最後の発言内容を投影したベクトルを「st」とする。また、誘導方向特定部20は、誘導するベクトル空間上の方向を「θ」とする。また誘導方向特定部20は、ベクトル空間上にマッピングした発言内容のベクトル位置を「zt」(計量に対応)とし、会議における所定期間内の利用者の発言内容の合成ベクトルを「ut」(制御に対応)とし、ベクトル空間上における移動距離を「nt」とする。このような場合、誘導方向特定部20は、以下の式(1)を用いて、SLAMの技術に基づき、次の時刻における誘導方向を特定する。
Here, an example of a method in which the guidance
なお、例えば、誘導方向特定部20は、ベクトル空間上に投影した発言内容の位置に基づいて、会議に参加する各利用者の立場を明確化してもよい。また、誘導方向特定部20は、ベクトル空間上に発言内容を投影することで、各利用者の発言内容が同じことを異なる表現で言っているだけであるか否かを判定してもよく、会議における議論がループしているか否かを判定してもよい。そして、誘導方向特定部位20は、判定結果に基づいて、会議を誘導する方向を特定してもよい。
Note that, for example, the guidance
〔2−2.DQNを用いた学習処理を実現する構成例〕
図2に戻り、説明を続ける。応答決定部21は、後続する利用者の発言内容を会議の目的に近づけるようにする応答を深層強化学習により学習した学習器を用いて、取得された発言内容に対する応答を決定する。例えば、応答決定部21は、モデルデータベース13から深層強化学習が行われた学習器を取得し、取得された利用者の発言内容を学習器に入力し、学習器の出力に応じて、会議における利用者の発言に対する応答を決定する。そして、応答出力部22は、応答決定部21によって決定された応答をスピーカー等の出力装置31から出力する。
[2-2. Configuration example for realizing learning process using DQN]
Returning to FIG. 2, the description will be continued. The
なお、後述する様に、モデルデータベース13に登録される学習器は、応答が出力される度に、評価取得部23によって取得された評価に基づいて、モデル更新部24により順次更新が行われる。このため、応答決定部21は、新たな発言内容が取得された場合には、前回の発言内容に対応する応答に基づいて更新された学習器を用いて、新たな応答を出力することとなる。
As will be described later, the learning device registered in the
評価取得部23は、スライダやBMIなどの所定のインターフェースを有する入力装置30を介して、応答出力部22が出力した応答に対する評価を取得する。なお、評価取得部23は、例えば、応答を出力した際における利用者の発言内容を取得し、取得した発言内容を解析することで、応答に対する利用者の評価を取得してもよい。すなわち、評価取得部23は、応答が出力された後における会議の状態を取得する。
The evaluation acquisition unit 23 acquires an evaluation for the response output by the
なお、評価取得部23は、応答の前に取得した利用者の発言内容と、応答の後に取得した利用者の発言内容とに基づいて、会議が目的に近づいているか否かを判定し、判定結果に応じた評価を取得してもよい。例えば、評価取得部23は、応答の前に取得した利用者の発言内容の意味と、応答の後に取得した利用者の発言内容の意味とを比較し、各発言内容の意味がブレていない場合や、誘導方向特定部20により特定された方向、すなわち、会議の目的の方向に向かっている場合には、応答が有益である旨の評価を取得してもよい。
The evaluation acquisition unit 23 determines whether or not the meeting is close to the purpose based on the content of the user's statement acquired before the response and the content of the user's statement acquired after the response. You may acquire the evaluation according to a result. For example, the evaluation acquisition unit 23 compares the meaning of the remark content of the user acquired before the response with the meaning of the remark content of the user acquired after the response, and when the meaning of each remark content is not blurred. Alternatively, when the direction is specified by the guide
モデル更新部24は、応答が出力された後の会議の状態に基づいて、学習器の更新を行う。すなわち、モデル更新部24は、学習器によって応答が出力された後の会議の状態に基づいて、後続する利用者の発言内容を会議の目的に近づけるようにする応答を学習するように、学習器の深層強化学習を行う。具体的には、モデル更新部24は、応答出力部22が前回応答を出力した後で評価取得部23が取得した評価に基づいて、学習器の深層強化学習を行う。
The
例えば、図5は、実施形態に係る情報提供装置が実行する深層強化学習の一例を説明する図である。例えば、会議において利用者の発言を「s」、学習器が発言に対してどのような応答を出力するかを示す方策を「π」、利用者の発言「s」があった際に方策「π」で出力される応答を「π(s)」と記載すると、会議における利用者の発言と応答とは、図5中(A)に示す図で模式的に示すことができる。より具体的には、利用者Aの発言「S0」があった場合、情報提供装置10は、応答「π(s0)」を出力する。このような応答「π(s0)」に対して利用者Bの発言「S1」があった場合、情報提供装置10は、応答「π(s1)」を出力し、応答「π(s1)」に対して利用者Cの発言「S2」があった場合、応答「π(s2)」を出力する。
For example, FIG. 5 is a diagram illustrating an example of deep reinforcement learning executed by the information providing apparatus according to the embodiment. For example, in a conference, the user's utterance is “s”, the measure indicating what response the learner outputs to the utterance is “π”, and the user's utterance “s” is the measure. When the response output by “π” is described as “π (s)”, the message and response of the user in the conference can be schematically shown in the diagram shown in FIG. More specifically, when there is a statement “S 0 ” of the user A, the
このような発言および応答があった場合、情報提供装置10は、図5中(B)に示すように、方策「π」に対して、評価に基づく状態行動価値関数「Qπ(s,a)」を算出する。そして、情報提供装置10は、状態行動価値関数「Qπ(s,a)」に基づいて、方策「π」を更新する。より具体的には、情報提供装置10は、状態行動価値関数「Qπ(s,a)」の値を最大化するように、方策「π」の値を更新する。このような応答の出力と、出力に対する評価に基づいた方策の更新とを繰り返し実行することで、情報提供装置10は、学習器の深層強化学習を実現する。
When there is such a statement and response, the
より具体的には、情報提供装置10は、以下の式(2)に示すように、方策に対する応答「π(s)」の値の「a」と見做すと、以下の式(3)に示すように、報酬に応じた次の方策「π*(s)」を、状態行動価値関数の値の最大化に基づいて決定する。すなわち、情報提供装置10は、報酬に応じて、次に得られるであろう報酬の値が最大化するように、状態行動価値関数を算出し、算出した状態行動価値関数に基づいて、方策の更新を行う。
More specifically, when the
ここで、状態行動価値関数は、以下の式(4)にて求めることができる。ここで、R(S0、a0、s1)とは、前回の応答に対する報酬を示す変数である。なお、「s」および「a」の添え字は、方策および方策に対する応答の時間(順番)を示す値である。例えば「st」は、時刻「t」における「s」の値であり、「st+1」は、時刻「t+1」における「s」の値である。 Here, the state action value function can be obtained by the following equation (4). Here, R (S 0 , a 0 , s 1 ) is a variable indicating the reward for the previous response. The subscripts of "s" and "a" are values indicating the policy and the response time (order) to the policy. For example, “s t ” is the value of “s” at time “t”, and “s t + 1 ” is the value of “s” at time “t + 1”.
このように、情報提供装置10は、出力した応答に対する利用者の評価に基づいて、学習器の更新を行い、更新後の学習器を用いて、会議を目的となる方向に誘導するような応答を出力する。このため、情報提供装置10は、会議を効率的に進めることができる。
As described above, the
〔3.情報提供装置10が実行する応答処理の流れ〕
次に、図6を用いて、情報提供装置10が実行する応答処理の流れについて説明する。図6は、実施形態に係る情報提供装置が実行する応答処理の流れを説明するフローチャートである。なお、情報提供装置10は、以下に説明するステップS101〜ステップS108の処理を繰り返し実行する。
[3. Flow of response processing executed by the information providing apparatus 10]
Next, the flow of the response process executed by the
まず、情報提供装置10は、利用者の発言内容を取得する(ステップS101)。そして、情報提供装置10は、取得した発言内容をベクトル空間上に投影し(ステップS102)、発言内容の履歴の位置と現在の発言内容の位置との関係を特定する(ステップS103)。そして、情報提供装置10は、SLAMの技術を用いて、会議を誘導する方向を特定する(ステップS104)。
First, the
また、情報提供装置10は、利用者の発言内容を会議の目的となる方向に誘導するための応答を深層強化学習により学習した学習器を用いて、発言内容に対する応答を決定し(ステップS105)、決定した応答を出力する(ステップS106)。また、情報提供装置10は、応答に対する利用者の評価に基づく報酬を設定し(ステップS107)、設定した報酬に基づく深層強化学習を実行する(ステップS108)。
Further, the
〔4.変形例〕
上記では、図1に例示した態様を用いながら、情報提供装置10が実行する処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する抽出処理のバリエーションについて説明する。
[4. Modification)
In the above, an example of the process executed by the
〔4−1.処理の実行形態について〕
上述した例では、情報提供装置10は、会議を効率的に進めるため、発言内容をベクトル空間上に投影し、各発言内容の位置関係に基づいて、会議を誘導する方向を特定するとともに、利用者の発言を会議の目的となる方向に誘導させる応答を深層強化学習により学習した学習器を用いて、応答を生成、出力した。しかしながら、実施形態は、これに限定されるものではない。
[4-1. Execution mode of processing]
In the above-described example, the
例えば、情報提供装置10は、上述した誘導処理の結果、会議を誘導する方向を特定し、特定した方向を示す情報を出力してもよい。また、情報提供装置10は、上述した学習器を用いて、応答を生成して出力してもよい。すなわち、情報提供装置10は、上述した学習処理や誘導処理を、それぞれ独立に実行し、実行結果を出力する装置であってもよい。
For example, the
〔4−2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-2. Other]
Further, of the processes described in the above embodiment, all or part of the processes described as being automatically performed may be manually performed, or the processes described as manually performed may be performed. All or part of the process can be automatically performed by a known method. In addition, the processing procedures, specific names, and information including various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each drawing is not limited to the information shown.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each device shown in the drawings is functionally conceptual, and does not necessarily have to be physically configured as shown. That is, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part of the device may be functionally or physically distributed / arranged in arbitrary units according to various loads and usage conditions. It can be integrated and configured.
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Further, the respective embodiments described above can be appropriately combined within a range in which the processing content is not inconsistent.
〔4−3.ハードウェア構成について〕
また、上述してきた実施形態に係る情報提供装置10は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[4-3. About hardware configuration]
Further, the
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一時的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
The
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
The output IF 1060 is an interface for transmitting information to be output to an output device 1010 that outputs various kinds of information such as a monitor and a printer. For example, a USB (Universal Serial Bus) or a DVI (Digital Visual Interface), It is realized by a connector of a standard such as HDMI (registered trademark) (High Definition Multimedia Interface). The input IF 1070 is an interface for receiving information from
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
The
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
The network IF 1080 receives data from another device via the network N and sends the data to the
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
The
例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部16の機能を実現する。
For example, when the
〔5.効果〕
上述したように、情報提供装置10は、会議における複数の利用者の発言内容を取得し、取得された利用者の発言内容をベクトル空間上に投影する。そして、情報提供装置10は、ベクトル空間上に投影された発言内容の履歴の位置と、ベクトル空間上に投影された新たな発言内容の位置とに基づいて、会議を誘導する方向を特定し、会議を特定された方向へと誘導するための応答を出力する。このため、情報提供装置10は、それまでの発言内容と現在の会議との関連性をベクトル空間上の位置関係に投影し、ベクトル空間上の位置関係に基づいて、会議を誘導する方向を特定するので、会議を適切な方向へ誘導することができる結果、会議を効率的に進めることができる。
[5. effect〕
As described above, the
また、情報提供装置10は、SLAMの技術を用いて、ベクトル空間上において会議を誘導する方向を特定する。例えば、情報提供装置10は、会議を誘導する方向として、会議が盛り上がった際における利用者の発言内容が投影された方向や、発言内容の履歴が投影された位置から離れる方向を特定する。このため、情報提供装置10は、会議を盛り上げたり、同じ話題が繰り返される等といった事態を防ぎ、会議を効率的に進めることができる。
Further, the
また、情報提供装置10は、同じ話題に属する複数の発言内容を、ベクトル空間上のうち、所定の領域内に投影する。このため、情報提供装置10は、会議を誘導する方向を適切に特定することができる。
Further, the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 As described above, some of the embodiments of the present application have been described in detail based on the drawings, but these are examples, and various modifications based on the knowledge of those skilled in the art, including the modes described in the section of the disclosure of the invention, It is possible to implement the present invention in other forms with improvements.
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。 Further, the above-mentioned "section (module, unit)" can be read as "means" or "circuit". For example, the control unit can be read as a control unit or a control circuit.
10 情報提供装置
11 通信部
12 記憶部
13 モデルデータベース
14 ベクトル空間データベース
16 制御部
17 取得部
18 投影部
19 位置特定部
20 誘導方向特定部
21 応答決定部
22 応答出力部
23 評価取得部
24 モデル更新部
30 入力装置
31 出力装置
10
Claims (5)
概念が類似する文章を類似するベクトルへと変換する変換手法を用いて、前記取得部により取得された利用者の発言に含まれる単語群をベクトル化して所定の記憶装置に登録することで、当該発言の概念をベクトル空間上に投影する投影部と、
前記記憶装置に登録されたベクトルのうち過去の発言の概念が投影された前記ベクトル空間上における位置から、最後に出力された発言である新たな発言の概念が投影された前記ベクトル空間上における位置への方向と、過去の会議における発言に基づいて予め定められた発言の概念が投影されたベクトル空間上における位置への方向との類似性に基づいて、前記新たな発言が会議の目的からずれたか否かを判定し、新たな発言が会議の目的からずれたと判定された場合は、新たな発言の概念が投影された前記ベクトル空間上における位置から前記予め定められた発言の概念が投影されたベクトル空間上における位置への方向を、前記会議を誘導する方向として特定する特定部と、
前記会議を前記特定部により特定された方向へと誘導するための応答として、応答を出力した後の利用者の発言が前記会議を誘導する方向に近づく程大きい値の報酬であって、かつ、過去の発言の概念が投影された前記ベクトル空間上における位置と、応答を出力した後における新たな発言の概念が投影された前記ベクトル空間上における位置との差分が大きいほど小さい値の報酬を設定することで深層強化学習が行われたモデルにより生成された応答を出力する出力部と
を有することを特徴とする情報提供装置。 An acquisition unit that acquires the content of statements of multiple users in a meeting,
By using a conversion method for converting a sentence having a similar concept into a similar vector, the word group included in the user's statement acquired by the acquisition unit is vectorized and registered in a predetermined storage device. A projection unit that projects the concept of remarks on a vector space,
Of the vectors registered in the storage device, from the position on the vector space where the concept of the past utterance is projected, to the position on the vector space where the concept of the new utterance that is the last output utterance is projected. Based on the similarity of the direction to the position and the direction to the position in the vector space where the concept of the predetermined utterance based on the utterances in the past meetings is projected , the new utterance deviates from the purpose of the meeting. If it is determined that the new utterance has deviated from the purpose of the conference, the predetermined utterance concept is projected from the position on the vector space where the new utterance concept is projected. A direction to the position in the vector space, a specifying unit that specifies the direction to guide the conference,
As a response for guiding the conference in the direction specified by the specifying unit , the user's utterance after outputting a response is a reward of a larger value as it approaches the direction in which the conference is guided, and, The smaller the difference between the position on the vector space onto which the concept of the past utterance is projected and the position on the vector space onto which the new utterance concept is projected after outputting the response, the smaller the reward is set. And an output unit that outputs a response generated by the model in which deep reinforcement learning is performed .
ことを特徴とする請求項1に記載の情報提供装置。 The specifying unit uses a SLAM (Simultaneous Localization and Mapping) technique to project a concept that the user wants to make a new statement from a position in the vector space where the new concept of the statement is projected. The information providing apparatus according to claim 1, wherein a direction to a position in the vector space is specified.
ことを特徴とする請求項1または2に記載の情報提供装置。 The specifying unit specifies a direction in which a concept of a predetermined utterance is projected as a utterance of the user when the conference is excited as a direction for guiding the conference. Alternatively, the information providing device described in 2.
ことを特徴とする請求項1〜3のうちいずれか1つに記載の情報提供装置。 The said specific | specification part specifies the direction which deviates from the position where the concept of the speech acquired last time was projected as a direction which guides the said meeting. The claim | item 1 characterized by the above-mentioned. Information providing device.
会議における複数の利用者の発言内容を取得する取得工程と、
概念が類似する文章を類似するベクトルへと変換する変換手法を用いて、前記取得工程により取得された利用者の発言に含まれる単語群をベクトル化して所定の記憶装置に登録することで、当該発言の概念をベクトル空間上に投影する投影工程と、
前記記憶装置に登録されたベクトルのうち過去の発言の概念が投影された前記ベクトル空間上における位置から、最後に出力された発言である新たな発言の概念が投影された前記ベクトル空間上における位置への方向と、過去の会議における発言に基づいて予め定められた発言の概念が投影されたベクトル空間上における位置への方向との類似性に基づいて、前記新たな発言が会議の目的からずれたか否かを判定し、新たな発言が会議の目的からずれたと判定された場合は、新たな発言の概念が投影された前記ベクトル空間上における位置から前記予め定められた発言の概念が投影されたベクトル空間上における位置への方向を、前記会議を誘導する方向として特定する特定工程と、
前記会議を前記特定工程により特定された方向へと誘導するための応答として、応答を出力した後の利用者の発言が前記会議を誘導する方向に近づく程大きい値の報酬であって、かつ、過去の発言の概念が投影された前記ベクトル空間上における位置と、応答を出力した後における新たな発言の概念が投影された前記ベクトル空間上における位置との差分が大きいほど小さい値の報酬を設定することで深層強化学習が行われたモデルにより生成された応答を出力する出力工程と
を含むことを特徴とする情報提供方法。 An information providing method executed by an information providing device, comprising:
An acquisition process for acquiring the content of remarks of multiple users in a meeting,
By using a conversion method for converting a sentence having a similar concept into a similar vector, the word group included in the user's statement acquired in the acquisition step is vectorized and registered in a predetermined storage device. A projection process for projecting the concept of speech on a vector space,
Of the vectors registered in the storage device, from the position on the vector space where the concept of the past utterance is projected, to the position on the vector space where the concept of the new utterance that is the last output utterance is projected. Based on the similarity of the direction to the position and the direction to the position in the vector space where the concept of the predetermined utterance based on the utterances in the past meetings is projected , the new utterance deviates from the purpose of the meeting. If it is determined that the new utterance has deviated from the purpose of the conference, the predetermined utterance concept is projected from the position on the vector space where the new utterance concept is projected. A step of identifying the direction to the position in the vector space as a direction guiding the conference,
As a response for guiding the conference in the direction specified by the specifying step , the user's utterance after outputting a response is a reward of a larger value as it approaches the direction in which the conference is guided, and, The smaller the difference between the position on the vector space onto which the concept of the past utterance is projected and the position on the vector space onto which the new utterance concept is projected after outputting the response, the smaller the reward is set. And an output step of outputting a response generated by the model for which deep reinforcement learning has been performed .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016055545A JP6679360B2 (en) | 2016-03-18 | 2016-03-18 | Information providing apparatus and information providing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016055545A JP6679360B2 (en) | 2016-03-18 | 2016-03-18 | Information providing apparatus and information providing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017173874A JP2017173874A (en) | 2017-09-28 |
JP6679360B2 true JP6679360B2 (en) | 2020-04-15 |
Family
ID=59972092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016055545A Active JP6679360B2 (en) | 2016-03-18 | 2016-03-18 | Information providing apparatus and information providing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6679360B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019199218A (en) * | 2018-05-18 | 2019-11-21 | 株式会社デンソーアイティーラボラトリ | Driving operation system, method and program |
JP7196610B2 (en) * | 2019-01-08 | 2022-12-27 | 株式会社リコー | Opinion evaluation system, information processing system, opinion evaluation method and program |
JP7342491B2 (en) | 2019-07-25 | 2023-09-12 | オムロン株式会社 | Inference device, inference method, and inference program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6115074B2 (en) * | 2012-10-25 | 2017-04-19 | 株式会社リコー | Information presentation system, information presentation apparatus, program, and information presentation method |
-
2016
- 2016-03-18 JP JP2016055545A patent/JP6679360B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017173874A (en) | 2017-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6854921B2 (en) | Multitasking neural network system with task-specific and shared policies | |
US10417566B2 (en) | Self-learning technique for training a PDA component and a simulated user component | |
US20240070392A1 (en) | Computing numeric representations of words in a high-dimensional space | |
KR102535411B1 (en) | Apparatus and method related to metric learning based data classification | |
CN111712834B (en) | Artificial intelligence system for inferring realistic intent | |
KR20220047850A (en) | Exploring resource-constrained neural network architectures | |
CN114641779A (en) | Countermeasure training of machine learning models | |
US20200193331A1 (en) | Systems and methods for automatically configuring training data for training machine learning models of a machine learning-based dialogue system including seeding training samples or curating a corpus of training data based on instances of training data identifiedas anomalous | |
JP6679360B2 (en) | Information providing apparatus and information providing method | |
CN111832312A (en) | Text processing method, device, equipment and storage medium | |
JP6824795B2 (en) | Correction device, correction method and correction program | |
Yang et al. | Foundation models meet visualizations: Challenges and opportunities | |
JP6429819B2 (en) | Information providing apparatus and information providing method | |
Saggese et al. | MIVIABot: a cognitive robot for smart museum | |
Provost et al. | The impacts of fine-tuning, phylogenetic distance, and sample size on big-data bioacoustics | |
JP7169770B2 (en) | Artificial intelligence programming server and its program | |
CN110059164B (en) | Method and system for presenting a user interface of a dialog system | |
JP2018159992A (en) | Parameter adjustment device, learning system, parameter adjustment method and program | |
Hwang et al. | End-to-end dialogue system with multi languages for hospital receptionist robot | |
CN113407806B (en) | Network structure searching method, device, equipment and computer readable storage medium | |
WO2018066083A1 (en) | Learning program, information processing device and learning method | |
JP7057229B2 (en) | Evaluation device, evaluation method and evaluation program | |
Tencer et al. | TITS-FM: Transductive incremental Takagi-Sugeno fuzzy models | |
Newnham | Machine Learning with Core ML: An iOS developer's guide to implementing machine learning in mobile apps | |
Timilsina et al. | Enabling Dataspaces Using Foundation Models: Technical, Legal and Ethical Considerations and Future Trends |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170919 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181225 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190904 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20190912 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6679360 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |