JP7149560B2 - リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム - Google Patents
リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム Download PDFInfo
- Publication number
- JP7149560B2 JP7149560B2 JP2018077454A JP2018077454A JP7149560B2 JP 7149560 B2 JP7149560 B2 JP 7149560B2 JP 2018077454 A JP2018077454 A JP 2018077454A JP 2018077454 A JP2018077454 A JP 2018077454A JP 7149560 B2 JP7149560 B2 JP 7149560B2
- Authority
- JP
- Japan
- Prior art keywords
- request
- training
- model
- input
- training data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
<構成>
《全体構成》
図1を参照して、本発明の第1の実施の形態に係る質問応答システムの全体は、ユーザ入力56を受けて回答60を応答として出力する質問応答システム58と、この質問応答システム58で使用されるディープニューラルネットワークからなるニューラル言換モデル94及びリクエストを分類する分類モデル98の訓練を行う訓練処理部62と、訓練処理部62が訓練のために使用する訓練データを記憶した訓練データ記憶部50とを含む。訓練データは複数の訓練データ項目を含む。各訓練データ項目は、第1のリクエストと、第1のリクエストと実質的に同じ意味を表し、質問応答システム58の応答可能である確率が第1のリクエストよりも高い第2のリクエストと、第1のリクエストがどのような分類に属するかを示す分類コードとの組合せを含む。
(2)どうなる質問
(3)定義質問
(4)なぜ質問
(5)どうやって質問
なに質問の場合には、主に「疑問詞+助詞」、又は「~は+疑問詞」の形に言換える。疑問詞としては「何」「誰」「どこ」等がある。例えば「宮崎行くんだけど、おすすめの場所って?」→「宮崎でどこに行く」。
訓練データ記憶部50に記憶された訓練データは多数の訓練データ項目を含む。各訓練データ項目は。自然言語からなる言換前のリクエスト(言換の対象リクエスト)と、この言換前のリクエストを、質問応答装置122が回答可能である確率が言換前のリクエストより高い形に言換えた質問文であるリクエストと、言換前のリクエストが上記した分類のいずれに属するかを示す分類コードとを含む。
訓練処理部62は、訓練データ記憶部50に記憶された訓練データを用いた機械学習によりニューラル言換モデル94の訓練を行うための言換モデル訓練処理部92と、訓練データ記憶部50に記憶された訓練データ内の、各訓練データ項目に含まれる第1のリクエストとその分類コードとを用いて、入力されたリクエストが上記した5つの分類のいずれに属するかを示す分類コードを出力するよう、機械学習により分類モデル98を訓練するための分類モデル訓練処理部96とを含む。
質問応答システム58は、既存の質問応答装置122と、ユーザ入力56を受けて、質問応答装置122が回答を生成できる確率がユーザ入力56よりも高いリクエストにこのユーザ入力56を言換えるためのリクエスト言換システム120とを含む。なお、質問応答装置122に与えられる入力には、何らかの情報を要求する文と、何らかの行為を要求する文との2種類がある。以下の説明における「リクエスト」は、これらのいずれも含む概念である。
図1に示すニューラル言換モデル94は、本実施の形態では、ニューラルネットワークの一種であるRNN、より具体的にはRNNの一種であるGRUを1モジュールとして、必要な数だけコピーしたネットワークにより構成されるシステムである。入力文の末尾にはいずれも文末記号<S>が付されている。
図3は図1に示す分類モデル98を構成する畳込みニューラルネットワーク180の構成を説明する模式図である。図3を参照して、ここでは、説明を分かりやすくするために、分類モデル98の畳込みニューラルネットワーク180が、入力層190、畳込み層192、及びプーリング層194のみからなっているものとするが、この3つの層を複数個備えているものでもよい。
図4に、図1に示す訓練処理部62の機能をコンピュータとの協働により実現するためのプログラムの制御構造をフローチャート形式で示す。図4を参照して、このプログラムは、訓練データ記憶部50に記憶されている訓練データ項目の各々に対してニューラル言換モデル94の訓練処理242を行うステップ240と、ステップ240の後に、所定の終了条件が成立しているか否かを判定し、判定結果に応じて制御の流れを分岐させるステップ244と、ステップ244の判定結果が肯定のときに、ニューラル言換モデル94のパラメータを所定の記憶装置に保存して処理を終了するステップ246とを含む。ステップ244の判定が否定であるときには制御はステップ240に戻り、次の訓練が実行される。
上記第1の実施の形態に係る訓練処理部62及び質問応答システム58は以下のように動作する。
以上のようにこの第1の実施の形態によれば、ニューラル言換モデル94を用いてユーザが入力したリクエストを質問応答装置122が回答可能である確率が言換前より高いリクエストに言換えて質問応答装置122に入力する。そのため、ユーザ入力が複文であったり、口語体であったり、不要な情報を含んでいたりする場合でも、質問応答装置122から適切な回答が出力される可能性を高めることができる。またニューラル言換モデル94の訓練データを工夫することにより、ユーザが明確には意識していなくても潜在的に求めている情報が、質問応答装置122からの回答として得られる可能性も高くなる。
<構成>
《全体構成》
上記第1の実施の形態は、質問応答システムに関するものであった。したがって入力文がリクエストであることを想定して処理しても問題はない。しかし、より一般的な対話システムの場合、入力がリクエストである場合もあるが、そうでない場合もある。どのような入力があるかについても予測はできないことが一般的である。そうした場合には、第1の実施の形態のようにニューラル言換モデル94を用いて無条件で入力文を言換えるのは妥当ではない。リクエストである場合のみニューラル言換モデルを適用する必要がある。この第2の実施の形態は、そのための判定を、第1の実施の形態で使用した分類モデル98と同様、ディープニューラルネットワークの1例である畳込みニューラルネットワークからなる判定モデルで判定し、判定が肯定である(入力が何らかのリクエストである)場合のみ、入力文をニューラル言換モデルで入力文を言換えて質問応答システムに与える。
リクエスト判定モデル326は図3に示す分類モデル98と同様の構成である。ただし、リクエスト判定モデル326の出力はリクエストである確率とリクエストでない確率とをそれぞれ示す2つの出力であるという点でリクエスト判定モデル326と分類モデル98とは異なっている。リクエスト判定モデル326と分類モデル98とでは、層の数、素性マップの数及びその構成等においては分類モデル98と異なるが、基本的には同様の構成である。また訓練方法も、訓練データが異なる点を除き同様である。したがってここではその構造についての詳細は繰返さない。
図7を参照して、対話システム330は、リクエスト判定モデル訓練装置324により訓練されたリクエスト判定モデル326と、ユーザ入力328を受けて単語ベクトル列に変換する前処理を行い、リクエスト判定モデル326を用いてユーザ入力328がリクエストか否かを判定してその結果にしたがいユーザ入力328を2つの出力のいずれかに振り分けるリクエスト判定部340と、リクエスト判定モデル326による判定がリクエストであることを示すときに、リクエスト判定部340から単語ベクトル列を受け、当該単語ベクトルが表す質問に対する応答を行う質問応答システム342と、リクエスト判定モデル326によりユーザ入力328がリクエストでないと判定されたときに、単語ベクトル列をリクエスト判定部340から受けて適切な応答をするよう構成された、質問応答システムとは異なる、他の応答システム344と、リクエスト判定部340による判定結果にしたがって、質問応答システム342の出力する応答と他の応答システム344の出力する応答とのいずれか適切な一方を選択し応答332として出力するための選択部346とを含む。
リクエスト判定部340は、前処理としてユーザ入力328を形態素解析し、各単語を単語ベクトルに変換することで単語ベクトル列を生成する。リクエスト判定部340はこの単語ベクトル列をリクエスト判定モデル326に与えてリクエスト判定モデル326の出力を得る。リクエスト判定部340は、リクエスト判定モデル326の出力が真(ユーザ入力328がリクエスト)であることを示すときには単語ベクトル列を質問応答システム342に与える。そうでないときにはリクエスト判定部340は単語ベクトル列を他の応答システム344に与える。
質問応答システム342は、第1の実施の形態に係るリクエスト言換システム120と同様の構成のリクエスト言換システム350と、リクエスト言換システム350によって言換えられたリクエストに対する回答を応答として選択部346に出力する質問応答装置352とを含む。
図7を参照して、リクエスト判定モデル訓練装置324は、訓練データ記憶部322に記憶された訓練データを用いてリクエスト判定モデル326の訓練を行うためのものである。訓練データ記憶部322が記憶する訓練データ項目の各々は、自然言語からなる文と、その文がリクエストか否かを示すラベルとの対を含む。この訓練データ項目は、主として人手で作成される。この機能は本実施の形態ではコンピュータハードウェアとコンピュータプログラムとの協働により実現される。そのコンピュータプログラムの構造については図4及び図5に示したものと同様である。
図8は、図7に示す対話システム330としてコンピュータを機能させるためのプログラムの制御構造を示す。図8を参照して、このプログラムは、ユーザ入力328を形態素解析し形態素列に変換するステップ360と、ステップ360により得られた形態素列の各単語を単語ベクトルに変換することで単語ベクトル列を出力するステップ362と、ステップ362で得られた単語ベクトル列をリクエスト判定モデル326に与えてリクエスト判定モデル326の出力を得るステップ364と、ステップ364におけるリクエスト判定モデル326の出力に基づいて、ユーザ入力328がリクエストか否かを判定し、判定結果に応じて制御の流れを分岐させるステップ366とを含む。
この第2の実施の形態では、リクエスト言換システム350の訓練が既に完了しているものとすると、2つの動作フェーズがある。第1はリクエスト判定モデル訓練装置324によるリクエスト判定モデル326の訓練フェーズであり、第2は訓練済みのリクエスト判定モデル326を用いた対話システム330の対話応答フェーズである。
図7を参照して、訓練フェーズではリクエスト判定モデル訓練装置324は以下のように動作する。訓練データ記憶部322には、予め人手で作成した訓練データが記憶される。リクエスト判定モデル326は所定の初期状態で準備される。すなわち、畳込みネットワークを実現するためのプログラムがメモリにロードされ、畳込みネットワークが表す関数を規定するパラメータを格納する領域がメモリに確保され、それぞれ初期値に設定される。
対話応答フェーズでは対話システム330は以下のように動作する。図7を参照して、対話システム330のリクエスト判定部340は、ユーザ入力328を受けて単語ベクトル列に変換する前処理を行う(図8のステップ360及び362)。リクエスト判定部340は、リクエスト判定モデル326にリクエスト判定の対象としてこの単語ベクトルを入力してユーザ入力328がリクエストか否かを判定する(ステップ364及び366)。リクエスト判定部340は、その判定結果にしたがいユーザ入力328を2つの出力のいずれかに振分ける。すなわちリクエスト判定部340は、リクエスト判定モデル326による判定が肯定であるとき(ステップ366においてYES)には質問応答システム342に単語ベクトル列を与える(ステップ370)。質問応答システム342のリクエスト言換システム350は、リクエスト判定部340から与えられた単語ベクトル列を質問応答装置352が応答できる確率が言換前より高いリクエストに言換え、質問応答装置352に入力する(ステップ372)。質問応答装置352はこのリクエストに対する回答の生成を試みる。回答があれば(ステップ374でYES)質問応答装置352は回答を生成し選択部346に対して出力する(ステップ376)。回答がなければ質問応答装置352はウェブ検索エンジンを用い、言換後のリクエストをキーワードにウェブを検索し、検索結果を出力する(ステップ378)。
この第2の実施形態では、質問応答システムに限らず、一般的な対話システムにおいてリクエストとそうでないものとを分け、質問応答システムに与えるリクエストとして適切なもののみを質問応答システムへの入力とする。そのため、対話として適切な応答を生成できる。また第1の実施形態と同様、質問応答システムへの入力の前段階として、質問応答システムが回答可能である確率が言換前より高くなるようにリクエストの言換を行っている。その結果、対話中に含まれるリクエストに対しては、第1の実施の形態と同様、ユーザ入力が複文であったり、不要な情報を含んでいたりする場合でも、対話システムから適切な回答が出力される可能性を高めることができる。またニューラル言換モデルの訓練データを工夫することにより、ユーザが明確には意識していなくても潜在的に求めている情報が、質問応答システムからの回答として得られる可能性も高くなる。
<構成>
第1の実施の形態では、訓練データ記憶部50に記憶する訓練データ項目は、(1)人手で言換前の文と言換後のリクエストとを生成する第1の訓練データ生成部64と、(2)質問応答装置122が回答できなかったリクエストを記憶した質問応答システムログ記憶部54から読出した、質問応答装置122が回答できなかった質問に、人手でそのリクエストと実質的に同じ情報を表現する言換後のリクエストを付す第2の訓練データ生成部66と、(3)リクエスト候補記憶部52に記憶されたリクエスト候補に人手で言換後のリクエストを付す第3の訓練データ生成部68により生成される。このようにして作成された訓練データを使用し、訓練データそのものを変更したり追加したりすることなくニューラル言換モデル94の訓練が行われる。しかし本発明はそのような実施の形態には限定されない。これらに加えて、以下のような方法で訓練データを追加しながらニューラル言換モデル94の訓練を行うこともできる。
図9に示すリクエスト言換モデル訓練システム400において、訓練データを追加する処理をコンピュータとの協働により実現するコンピュータプログラムの制御構造を図10に示す。図10に示すのは、訓練処理が一旦終了したリクエスト言換システム412を用いて訓練データを追加するためのものである。
この第3の実施の形態に係るリクエスト言換モデル訓練システム400は以下のように動作する。
上記した各実施の形態に係る訓練データ記憶部50、リクエスト候補記憶部52、質問応答システムログ記憶部54、質問応答システム58、訓練処理部62、第1の訓練データ生成部64、第2の訓練データ生成部66、第3の訓練データ生成部68、ニューラル言換モデル94、分類モデル98、訓練データ追加装置320、訓練データ記憶部322、リクエスト判定モデル訓練装置324、リクエスト判定モデル326、対話システム330、及びリクエスト言換モデル訓練システム400等は、それぞれコンピュータハードウェアと、そのハードウェア上でCPU(中央演算処理装置)及びGPU(Graphic Processing Unit)により実行されるコンピュータプログラムとにより実現できる。図11及び図12に上記各装置及びシステムを実現するコンピュータハードウェアを示す。GPUは通常は画像処理を行うために使用されるが、このようにGPUを画像処理ではなく通常の演算処理に使用する技術をGPGPU(General-purpose computing on graphics processing units)と呼ぶ。GPUは同種の複数の演算を同時並列的に実行できる。一方、ニューラルネットワークの訓練時及び動作時には、各ノードの重み演算は単純な積和演算であり、しかもそれらは同時に実行できることが多い。したがって、図2に示すニューラル言換モデル94及び分類モデル98、図7に示すリクエスト判定モデル326、並びに図9に示すリクエスト言換システム412はGPGPUに適している。
上記実施の形態は、既存の質問応答システム又は対話システムが対応可能な入力の幅を広げるものである。システムに自然言語で入力する際の入力のスタイルには、検索エンジンに入力する際のような断片的なキーワードによるものから、口語的なくだけた表現で話しかけるようなものまで、様々なものが考えられる。質問応答システム及び対話システムの前処理として上記実施の形態に係るリクエスト言換システムを用いることで、そのようなスタイルの違いが吸収できる。その結果、既存のシステムに変更を加えることなく、そのまま上記実施の形態に係るリクエスト言換システムを使用できる。言換の結果をユーザに提示する必要はないため、ユーザがリクエスト言換システムを意識することはない。
52 リクエスト候補記憶部
54 質問応答システムログ記憶部
56、328 ユーザ入力
58、342 質問応答システム
60 回答
62 訓練処理部
64 第1の訓練データ生成部
66 第2の訓練データ生成部
68 第3の訓練データ生成部
92 言換モデル訓練処理部
94 ニューラル言換モデル
96 分類モデル訓練処理部
98 分類モデル
120、350、412 リクエスト言換システム
122、352 質問応答装置
130 前処理部
140 単語ベクトル列
144 エンコーダ
146 順方向GRU列
148 逆方向GRU列
150 連結部
152 中間ノードベクトル
154 デコーダ
156 単語列
158 デコーダ入力
160 アテンション層
162 係数算出部
164 コンテクストベクトル生成部
166 隠れ状態ベクトル
168 コンテクストベクトル
170 組
180 畳込みニューラルネットワーク
182 最終層
184 Softmax層
190 入力層
192 畳込み層
194 プーリング層
200 Nグラム
210 最大の要素
220、222 要素
240、244、246、250、252、254、260、264、266、270、272、274、290、292、294、296、298、300、302、304、360、362、364、366、370、372、374、376、378、380、382、450、452、454、456、458、460、462、464、470、480、482 ステップ
242、262 訓練処理
320 訓練データ追加装置
324 リクエスト判定モデル訓練装置
326 リクエスト判定モデル
330 対話システム
332 応答
340 リクエスト判定部
344 他の応答システム
346 選択部
400 リクエスト言換モデル訓練システム
410 リクエスト
414 言換候補記憶部
416 回答記憶部
418 回答評価部
420 訓練データ生成部
466 処理
Claims (5)
- 入力されたリクエストを形態素解析して形態素列に変換するための形態素解析手段と、
前記形態素列内の各単語を単語ベクトルに変換することにより、前記形態素列を入力単語ベクトル列に変換するための変換手段と、
前記入力単語ベクトル列を入力として受け、前記入力単語ベクトル列により表される前記リクエストを、所定の対話システムが応答可能である確率が前記入力単語ベクトル列より高いリクエストに対応する出力単語列に変換して出力するよう、予め機械学習により学習済のリクエスト言換モデルとを含み、
前記リクエスト言換モデルの出力する前記出力単語列が前記対話システムに与えるリクエストとなる、リクエスト言換システム。 - 前記入力されたリクエストを予め定めた複数種類のリクエスト分類のいずれかに分類し対応する分類コードを出力するためのリクエスト分類手段をさらに含み、
前記リクエスト言換モデルは、前記入力単語ベクトル列及び前記分類コードを入力として受け、前記入力単語ベクトル列により表される前記リクエストを、前記対話システムが応答可能である確率が前記入力単語ベクトル列より高いリクエストに対応する出力単語列に変換して出力するよう、予め機械学習により学習済の分類付リクエスト言換モデルを含む、請求項1に記載のリクエスト言換システム。 - 入力単語ベクトル列を入力として受け、前記入力単語ベクトル列により表されるリクエストを、対話システムが応答可能である確率が前記入力単語ベクトル列より高いリクエストに対応する出力単語列に変換して出力するよう、リクエスト言換モデルを機械学習により訓練するためのリクエスト言換モデルの訓練方法であって、
コンピュータが、前記リクエスト言換モデルの訓練のための複数の訓練データ項目を、機械可読な訓練データ記憶装置に記憶させるステップを含み、前記複数の訓練データ項目の各々は、単語列を含む第1のリクエストと、当該第1のリクエストの言換である単語列を含む第2のリクエストとを含み、
前記方法はさらに、
コンピュータが、前記訓練データ記憶装置に記憶された前記複数の訓練データ項目の各々について、前記第1のリクエストを入力とし、前記第2のリクエストを教師データとして前記リクエスト言換モデルの訓練を行う訓練ステップを含む、リクエスト言換モデルの訓練方法。 - 前記複数の訓練データ項目の各々は、前記第1のリクエストが予め定めた複数種類のリクエスト分類のいずれであるかを示す分類コードをさらに含み、
前記訓練ステップは、コンピュータが、前記訓練データ記憶装置に記憶された前記複数の訓練データ項目の各々について、前記第1のリクエスト及び前記分類コードを入力とし、前記第2のリクエストを教師データとして前記リクエスト言換モデルの訓練を行う訓練ステップを含む、請求項3に記載のリクエスト言換モデルの訓練方法。 - 所定の対話型リクエスト応答システムと、当該対話型リクエスト応答システムと異なる他の応答システムとを含む対話システムであって、
入力された自然言語文がリクエストか否かを判定するための判定手段と、
前記判定手段によりリクエストと判定された自然言語文を、前記対話型リクエスト応答システムによる応答が得られる可能性が前記自然言語文より高いリクエストに言換えた言換リクエストを出力するためのリクエスト言換手段と、
前記リクエスト言換手段により出力された言換リクエストを前記対話型リクエスト応答システムに与え、当該対話型リクエスト応答システムに当該言換リクエストに対して応答させるための手段と、
前記判定手段によりリクエストではないと判定された自然言語文を、前記他の応答システムに与え、当該他の応答システムに前記自然言語文に対して応答させるための手段とを含む、対話システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018077454A JP7149560B2 (ja) | 2018-04-13 | 2018-04-13 | リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム |
US17/043,069 US11861307B2 (en) | 2018-04-13 | 2019-03-05 | Request paraphrasing system, request paraphrasing model and request determining model training method, and dialogue system |
PCT/JP2019/008607 WO2019198386A1 (ja) | 2018-04-13 | 2019-03-05 | リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018077454A JP7149560B2 (ja) | 2018-04-13 | 2018-04-13 | リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019185521A JP2019185521A (ja) | 2019-10-24 |
JP7149560B2 true JP7149560B2 (ja) | 2022-10-07 |
Family
ID=68162840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018077454A Active JP7149560B2 (ja) | 2018-04-13 | 2018-04-13 | リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11861307B2 (ja) |
JP (1) | JP7149560B2 (ja) |
WO (1) | WO2019198386A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472251B (zh) * | 2018-05-10 | 2023-05-30 | 腾讯科技(深圳)有限公司 | 翻译模型训练的方法、语句翻译的方法、设备及存储介质 |
JP7099521B2 (ja) * | 2018-05-25 | 2022-07-12 | 日本電気株式会社 | 採点装置、採点方法、記録媒体 |
WO2020186458A1 (zh) * | 2019-03-19 | 2020-09-24 | 京东方科技集团股份有限公司 | 问题生成方法和装置、问诊系统、计算机可读存储介质 |
US11586973B2 (en) | 2019-03-22 | 2023-02-21 | International Business Machines Corporation | Dynamic source reliability formulation |
US11238027B2 (en) * | 2019-03-22 | 2022-02-01 | International Business Machines Corporation | Dynamic document reliability formulation |
JP2020187470A (ja) * | 2019-05-13 | 2020-11-19 | 富士通株式会社 | ネットワーク分析装置およびネットワーク分析方法 |
US11996098B2 (en) * | 2019-06-05 | 2024-05-28 | Hewlett-Packard Development Company, L.P. | Missed utterance resolutions |
US11163947B2 (en) * | 2019-07-30 | 2021-11-02 | Imrsv Data Labs Inc. | Methods and systems for multi-label classification of text data |
CN111241398B (zh) * | 2020-01-10 | 2023-07-25 | 百度在线网络技术(北京)有限公司 | 数据预取方法、装置、电子设备及计算机可读存储介质 |
CN110990555B (zh) * | 2020-03-05 | 2020-06-12 | 中邮消费金融有限公司 | 端到端检索式对话方法与系统及计算机设备 |
JP7276752B2 (ja) * | 2020-04-28 | 2023-05-18 | 株式会社Askプロジェクト | 自然言語処理装置及び自然言語処理方法 |
JP7428245B2 (ja) * | 2020-05-20 | 2024-02-06 | 日本電信電話株式会社 | 応答文生成装置およびプログラム |
US11782685B2 (en) * | 2020-06-17 | 2023-10-10 | Bank Of America Corporation | Software code vectorization converter |
CN111831813B (zh) * | 2020-09-21 | 2021-02-05 | 北京百度网讯科技有限公司 | 对话生成方法、装置、电子设备及介质 |
CN112883179B (zh) * | 2021-02-23 | 2024-05-24 | 中国科学技术大学 | 一种人机对话方法及系统 |
CN114610845B (zh) * | 2022-03-02 | 2024-05-14 | 北京百度网讯科技有限公司 | 基于多系统的智能问答方法、装置和设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004094521A (ja) | 2002-08-30 | 2004-03-25 | Nippon Telegr & Teleph Corp <Ntt> | 質問タイプ学習方法、学習装置、質問タイプ学習プログラム、同プログラムを記録した記録媒体、学習データを記録した記録媒体、学習データを用いた質問タイプ同定方法、装置、プログラム、および該プログラムを記録した記録媒体 |
JP2017076403A (ja) | 2015-10-16 | 2017-04-20 | バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC | 人間から示唆を得た簡単質問応答(hisqa)システム及び方法 |
JP2018041160A (ja) | 2016-09-05 | 2018-03-15 | 国立研究開発法人情報通信研究機構 | 文脈解析装置及びそのためのコンピュータプログラム |
JP2018060273A (ja) | 2016-10-03 | 2018-04-12 | エヌ・ティ・ティ レゾナント株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7519529B1 (en) * | 2001-06-29 | 2009-04-14 | Microsoft Corporation | System and methods for inferring informational goals and preferred level of detail of results in response to questions posed to an automated information-retrieval or question-answering service |
US20080040339A1 (en) * | 2006-08-07 | 2008-02-14 | Microsoft Corporation | Learning question paraphrases from log data |
US8447589B2 (en) * | 2006-12-22 | 2013-05-21 | Nec Corporation | Text paraphrasing method and program, conversion rule computing method and program, and text paraphrasing system |
US9002869B2 (en) * | 2007-06-22 | 2015-04-07 | Google Inc. | Machine translation for query expansion |
JP4331233B2 (ja) * | 2007-12-26 | 2009-09-16 | 株式会社東芝 | 無線通信装置 |
US20110125734A1 (en) * | 2009-11-23 | 2011-05-26 | International Business Machines Corporation | Questions and answers generation |
CN103229162B (zh) * | 2010-09-28 | 2016-08-10 | 国际商业机器公司 | 使用候选答案逻辑综合提供问题答案 |
US10535041B2 (en) * | 2012-06-26 | 2020-01-14 | Oath Inc. | System and method of predicting community member responsiveness |
US10810193B1 (en) * | 2013-03-13 | 2020-10-20 | Google Llc | Querying a data graph using natural language queries |
US10002177B1 (en) * | 2013-09-16 | 2018-06-19 | Amazon Technologies, Inc. | Crowdsourced analysis of decontextualized data |
JP6178208B2 (ja) | 2013-10-28 | 2017-08-09 | 株式会社Nttドコモ | 質問分野判定装置及び質問分野判定方法 |
US9830556B2 (en) * | 2014-05-21 | 2017-11-28 | Excalibur Ip, Llc | Synthetic question formulation |
JP6264215B2 (ja) | 2014-07-18 | 2018-01-24 | トヨタ自動車株式会社 | 質疑応答装置および質疑応答装置の制御方法 |
US10318586B1 (en) * | 2014-08-19 | 2019-06-11 | Google Llc | Systems and methods for editing and replaying natural language queries |
JP6414956B2 (ja) * | 2014-08-21 | 2018-10-31 | 国立研究開発法人情報通信研究機構 | 質問文生成装置及びコンピュータプログラム |
US11829373B2 (en) * | 2015-02-20 | 2023-11-28 | Google Llc | Methods, systems, and media for presenting search results |
US9875296B2 (en) * | 2015-03-25 | 2018-01-23 | Google Llc | Information extraction from question and answer websites |
EP3145127B1 (en) * | 2015-09-21 | 2019-07-10 | Sap Se | Short text messaging in digital mobile telecommunication networks |
US10380154B2 (en) * | 2015-10-17 | 2019-08-13 | International Business Machines Corporation | Information retrieval using structured resources for paraphrase resolution |
US20170169355A1 (en) * | 2015-12-11 | 2017-06-15 | International Business Machines Corporation | Ground Truth Improvement Via Machine Learned Similar Passage Detection |
US10262062B2 (en) * | 2015-12-21 | 2019-04-16 | Adobe Inc. | Natural language system question classifier, semantic representations, and logical form templates |
US20170249595A1 (en) * | 2016-02-29 | 2017-08-31 | Linkedin Corporation | Automatically creating handling strategy rules for a normalized question record |
US20170302613A1 (en) * | 2016-04-19 | 2017-10-19 | Original Skateboards, Llc | Environment for Processing and Responding to User Submitted Posts |
US10431205B2 (en) * | 2016-04-27 | 2019-10-01 | Conduent Business Services, Llc | Dialog device with dialog support generated using a mixture of language models combined using a recurrent neural network |
US9858263B2 (en) * | 2016-05-05 | 2018-01-02 | Conduent Business Services, Llc | Semantic parsing using deep neural networks for predicting canonical forms |
US9830315B1 (en) * | 2016-07-13 | 2017-11-28 | Xerox Corporation | Sequence-based structured prediction for semantic parsing |
US10726023B2 (en) * | 2016-09-13 | 2020-07-28 | Microsoft Technology Licensing, Llc | Generating modifiers for updating search queries |
US9812151B1 (en) * | 2016-11-18 | 2017-11-07 | IPsoft Incorporated | Generating communicative behaviors for anthropomorphic virtual agents based on user's affect |
US11669691B2 (en) * | 2017-03-30 | 2023-06-06 | Nec Corporation | Information processing apparatus, information processing method, and computer readable recording medium |
US10417266B2 (en) * | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US20180341871A1 (en) * | 2017-05-25 | 2018-11-29 | Accenture Global Solutions Limited | Utilizing deep learning with an information retrieval mechanism to provide question answering in restricted domains |
US10404636B2 (en) * | 2017-06-15 | 2019-09-03 | Google Llc | Embedded programs and interfaces for chat conversations |
US10348658B2 (en) * | 2017-06-15 | 2019-07-09 | Google Llc | Suggested items for use with embedded applications in chat conversations |
WO2019160791A1 (en) * | 2018-02-16 | 2019-08-22 | Mz Ip Holdings, Llc | System and method for chat community question answering |
-
2018
- 2018-04-13 JP JP2018077454A patent/JP7149560B2/ja active Active
-
2019
- 2019-03-05 WO PCT/JP2019/008607 patent/WO2019198386A1/ja active Application Filing
- 2019-03-05 US US17/043,069 patent/US11861307B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004094521A (ja) | 2002-08-30 | 2004-03-25 | Nippon Telegr & Teleph Corp <Ntt> | 質問タイプ学習方法、学習装置、質問タイプ学習プログラム、同プログラムを記録した記録媒体、学習データを記録した記録媒体、学習データを用いた質問タイプ同定方法、装置、プログラム、および該プログラムを記録した記録媒体 |
JP2017076403A (ja) | 2015-10-16 | 2017-04-20 | バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC | 人間から示唆を得た簡単質問応答(hisqa)システム及び方法 |
JP2018041160A (ja) | 2016-09-05 | 2018-03-15 | 国立研究開発法人情報通信研究機構 | 文脈解析装置及びそのためのコンピュータプログラム |
JP2018060273A (ja) | 2016-10-03 | 2018-04-12 | エヌ・ティ・ティ レゾナント株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US11861307B2 (en) | 2024-01-02 |
JP2019185521A (ja) | 2019-10-24 |
WO2019198386A1 (ja) | 2019-10-17 |
US20210034817A1 (en) | 2021-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7149560B2 (ja) | リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム | |
US11113479B2 (en) | Utilizing a gated self-attention memory network model for predicting a candidate answer match to a query | |
WO2019200923A1 (zh) | 基于拼音的语义识别方法、装置以及人机对话系统 | |
US20180137855A1 (en) | Method and apparatus for processing natural language, method and apparatus for training natural language processing model | |
CN108595629B (zh) | 用于答案选择系统的数据处理方法及应用 | |
CN109214006B (zh) | 图像增强的层次化语义表示的自然语言推理方法 | |
CN110457718B (zh) | 一种文本生成方法、装置、计算机设备及存储介质 | |
CN110795552A (zh) | 一种训练样本生成方法、装置、电子设备及存储介质 | |
CN111401084A (zh) | 一种机器翻译的方法、设备以及计算机可读存储介质 | |
WO2019167296A1 (ja) | 自然言語処理のための装置、方法及びプログラム | |
CN113326374B (zh) | 基于特征增强的短文本情感分类方法及系统 | |
KR102263656B1 (ko) | 답변을 유도하는 대화 시스템 및 대화 방법 | |
JP7279099B2 (ja) | 対話管理 | |
CN112084769B (zh) | 依存句法模型优化方法、装置、设备及可读存储介质 | |
KR102697095B1 (ko) | Qa 모델을 이용하여 지식 그래프를 구축하는 방법, 장치 및 컴퓨터 프로그램 | |
WO2022251719A1 (en) | Granular neural network architecture search over low-level primitives | |
CN115510230A (zh) | 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法 | |
US20240143940A1 (en) | Architecture for generating qa pairs from contexts | |
CN115827879A (zh) | 基于样本增强和自训练的低资源文本智能评阅方法和装置 | |
CN110909142B (zh) | 一种问答模型的问题语句处理方法、装置、电子设备及存储介质 | |
KR20220056462A (ko) | 외부 정렬정보에 기반한 실시간 동시통역 모델 학습 방법, 동시통역 방법 및 시스템 | |
CN113555006B (zh) | 一种语音信息识别方法、装置、电子设备及存储介质 | |
Li et al. | Seq-CNN: A lightweight and efficient neural network for sentimental analysis of text | |
US12032964B2 (en) | Speculative execution of dataflow program nodes | |
JP7411149B2 (ja) | 学習装置、推定装置、学習方法、推定方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220830 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220916 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7149560 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |