JP2019197363A - 対話データ生成装置、対話データ生成方法、およびプログラム - Google Patents
対話データ生成装置、対話データ生成方法、およびプログラム Download PDFInfo
- Publication number
- JP2019197363A JP2019197363A JP2018090637A JP2018090637A JP2019197363A JP 2019197363 A JP2019197363 A JP 2019197363A JP 2018090637 A JP2018090637 A JP 2018090637A JP 2018090637 A JP2018090637 A JP 2018090637A JP 2019197363 A JP2019197363 A JP 2019197363A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- data
- utterance
- question
- utterance sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】会話を深掘りする質問文を生成するための対話データを低コストに生成することができるようにする。【解決手段】対話データ生成部110が、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、当該第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの各々について、当該データの第2発話文が、疑問詞を用いた質問文である場合に、当該データの第1発話文と、当該データの第2発話文との組を対話データとして生成する。【選択図】図1
Description
本発明は、対話データ生成装置、対話データ生成方法、およびプログラムに係り、特に、対話システムにおいて質問文を生成するための対話データ生成装置、対話データ生成方法、およびプログラムに関する。
ユーザとの間で対話を行う対話システムは、大きく分けて、タスク指向型対話システムと非タスク指向型対話システムの二種類に分けられる。
タスク指向型対話システムは、特定のタスクをシステムとの対話により達成するものである。例えば、フライトの予約システムや、天気情報案内システム(非特許文献1)に用いられている。これらのシステムでは、一般的にフレーム(スロット名とスロット値からなるスロットから構成される)という構造を持ち、フレームに基づいて対話が進行する。
タスク指向型対話システムでは、このような構造を持っているため、埋まっていないスロットを聞く質問文を生成して、相手の情報を聞き出すということができる。
一方、非タスク指向型対話システムは、目的のない対話を扱い、対話の内容はいわゆる雑談である。
Ryuichiro Higashinaka, Katsuhito Sudoh, Mikio Nakano, "Incorporating Discourse Features into Confidence Scoring of Intention Recognition Results in Spoken Dialogue Systems", Speech Communication, Volume 48, Issues 3-4, 2006, pp.417-436.
しかし、雑談には、様々な話題が含まれるため、タスク指向型対話システムと異なり、スロットという構造は持っておらず、どういった疑問詞を用いて質問をすれば良いのかということは自明ではない。
このため、非タスク指向型対話システムでは、相手の発話を深掘りする質問文を生成することは困難である、という問題があった。
このような問題を解決すべく、従来の非タスク指向型対話システムでは、ルールベースによる手法や、機械学習による手法によって、ユーザとの対話を実現している。
しかし、ルールベースによる手法では、人手でルールを記載するため、対話を幅広く深掘りするためには、大量のルールを人手で作成する必要がある、という問題があった。
また、機械学習の手法では、相手の発話に対する質問文である発話といったデータが世の中に存在しておらず、十分に学習するためのデータ量を用意することが困難である。すなわち、質問文生成を目的とした機械学習のためのコーパス(学習用データ)を用意することが困難である、という問題があった。
まとめると、従来の非タスク指向型対話システムでは、低コストに対話を深掘りする対話システムを実現することができないため、対話システムとユーザとのインタラクションを円滑にすることができない、という問題があった。
本発明は上記の点に鑑みてなされたものであり、会話を深掘りする質問文を生成するための対話データを低コストに生成することができる対話データ生成装置、対話データ生成方法、およびプログラムを提供することを目的とする。
本発明に係る対話データ生成装置は、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、前記第1発話文に対する応答である第2発話文と、前記第1のユーザが発話した文であって、前記第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付ける入力部と、前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、疑問詞を用いた質問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成する対話データ生成部と、を備えて構成される。
また、本発明に係る対話データ生成方法は、入力部が、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、前記第1発話文に対する応答である第2発話文と、前記第1のユーザが発話した文であって、前記第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付け、対話データ生成部が、前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、疑問詞を用いた質問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成する。
本発明に係る対話データ生成装置及び対話データ生成方法によれば、入力部が、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付ける。
そして、対話データ生成部が、入力部が受け付けた複数のデータの各々について、当該データの第2発話文が、疑問詞を用いた質問文である場合に、当該データの第1発話文と、当該データの第2発話文との組を対話データとして生成する。
このように、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、当該第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの各々について、当該データの第2発話文が、疑問詞を用いた質問文である場合に、当該データの第1発話文と、当該データの第2発話文との組を対話データとして生成することにより、会話を深掘りする質問文を生成するための対話データを低コストに生成することができる。
また、本発明に係る対話データ生成装置の前記対話データ生成部は、前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、時制、場所、主体、対象、理由、方法、程度、又は状態に関する疑問詞を含み、かつ、疑問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成することができる。
また、本発明に係る対話データ生成装置は、前記対話データ生成部により得られた複数の対話データの各々について、前記対話データに含まれる前記第1発話文を入力としたときに、前記対話データに含まれる前記第2発話文を出力するように、入力された文から文を生成するニューラルネットワークを学習する質問生成モデル学習部を更に備えることができる。
また、本発明に係る対話データ生成装置は、入力された発話文を、前記ニューラルネットワークに入力し、前記ニューラルネットワークの出力を、前記発話文に対する質問文とする質問文生成部を更に備えることができる。
本発明に係るプログラムは、上記の対話データ生成装置の各部として機能させるためのプログラムである。
本発明の対話データ生成装置、対話データ生成方法、およびプログラムによれば、会話を深掘りする質問文を生成するための対話データを低コストに生成することができる。
以下、本発明の実施の形態について図面を用いて説明する。
<本発明の実施の形態に係る対話データ生成装置の構成>
図1を参照して、本発明の実施の形態に係る対話データ生成装置10の構成について説明する。図1は、本発明の実施の形態に係る対話データ生成装置10の構成を示すブロック図である。
図1を参照して、本発明の実施の形態に係る対話データ生成装置10の構成について説明する。図1は、本発明の実施の形態に係る対話データ生成装置10の構成を示すブロック図である。
対話データ生成装置10は、CPUと、RAMと、後述するモデル学習処理ルーチン及び質問文生成処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
図1に示すように、本実施形態に係る対話データ生成装置10は、入力部100、対話データ生成部110と、質問生成モデル学習部120と、質問生成モデル記憶部130と、入力部140と、質問文生成部150と、出力部160とを備えて構成される。
入力部100は、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、当該第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付ける。
当該複数のデータは、チャットシステムや、発話文を投稿するソーシャルネットワーキングサービス(SNS)等から、第1のユーザの発話である第1発話文と、第2のユーザによる第1発話文に対する応答である第2発話文と、第1のユーザによる第2発話文に対する応答である第3発話文との組を予め抜き出して収集したものである。
例えば、図2に示すように、第1のユーザであるAから『この間京都に行ったよ』という発話があったとすると、これを第1発話文とする。そして、第2のユーザであるBから、第1発話文に対して、『なにしに行ったの?』という応答があったとすると、これを第2発話文とする。更に、ユーザAから、第2発話文に対して、『紅葉を見に行ってきたよ。きれいだった。』という応答があったとすると、これを第3発話文とする。
なお、公開されているインターネット上のチャットシステムやSNS等から、自動的にこれらを収集する装置等により、当該複数のデータが入力部100に入力されるように構成してもよい。
そして、入力部100は、このような第1発話文と、第2発話文と、第3発話文との組からなる複数のデータの入力を受け付けると、対話データ生成部110に当該複数のデータを渡す。
対話データ生成部110は、入力部100が受け付けた複数のデータの各々について、当該データの第2発話文が、時制、場所、主体、対象、理由、方法、程度、又は状態に関する疑問詞を含み、かつ、疑問文である場合に、当該データの第1発話文と、当該データの第2発話文との組を対話データとして生成する。
具体的には、まず、対話データ生成部110は、複数のデータの各々について、当該データの第2発話文が、疑問文であり、かつ、「いつ、どこ、誰が、なにしに、なんで、どのように、どんな」等、いわゆる5W1H(When、Where、Who、What、Why、How)について質問する際の疑問詞を含むか否かを判定する。
すなわち、対話データ生成部110は、単なる疑問文の発話(例えば「?」で終わっている発話等)を判定するのではなく、5W1Hの質問かどうかを判定する。
なぜなら、雑談対話は、可能な限り長く対話を続けることが必要とされるため、Yes/Noで答えられるような質問だと、相手がその質問に答えたところで対話が終了してしまう。
そこで、発話の内容を深掘りするような質問をすることにより、対話が継続できるようにすべく、5W1Hによる質問文により対話データを作成する。なお、5W1Hに限定されるものでなく、誰に(Whom)、誰の(Whose)等、Yes/Noで答えられるような質問でない場合に用いられる疑問詞であれば、何でもよい。
例えば、図3のような複数のデータの各々について、1番上のデータの第2発話文『なにしにいったの』という発話は、「なにしに」という対象について質問する際に用いられる疑問詞である単語を含んだ質問文である。このため、対話データ生成部110は、当該データの第1発話文である『この間京都に行った。』及び当該第2発話文の組を対話データとする。
また、例えば、図3において1番下のデータの第2発話文『金曜日といえば、飲み会ですよね?』は、質問文ではあるものの、Yes/Noで答えることができる質問であるため、対話データ生成部110は、当該データの第1発話文及び第2発話文の組を対話データとしない。
また、第2発話文の直後の第3発話文が、第1のユーザによる第2発話文に対する応答であるものであるため、疑問詞を用いた質問文である第2発話文は、発話の内容を深掘りする質問文としての質が高いと考えられる。
また、対話データ生成部110は、5W1Hを用いて質問している質問文であるか否かの判定に、予め学習した判定器を用いてもよい。
そして、対話データ生成部110は、生成した複数の対話データを、質問生成モデル学習部120に渡す。
質問生成モデル学習部120は、複数の対話データの各々について、当該対話データに含まれる第1発話文を入力としたときに、当該対話データに含まれる当該第2発話文を出力するように、入力された文から文を生成するニューラルネットワークを学習する。
具体的には、質問生成モデル学習部120は、対話データ生成部110により生成された複数の対話データの各々について、当該対話データの第1発話文を発話文として入力した場合に、当該発話文への応答となる質問文が当該対話データの第2発話文となるように、入力された文から文を生成するニューラルネットワークである質問生成モデルを学習する(図4)。
例えば、質問生成モデルを、Encoder−Decoderの枠組みで学習する。すなわち、当該対話データの第1発話文を発話文(入力)として入力し、当該対話データの第2発話文を質問文(出力)となるように、Encoder−Decoderを用いて質問生成モデルを学習する(例えば、参考文献1)。
[参考文献1]Oriol Vinyals, Quoc Le, "A Neural Conversational Model", [online], 2015, インターネット<URL:https://arxiv.org/abs/1506.05869>.
[参考文献1]Oriol Vinyals, Quoc Le, "A Neural Conversational Model", [online], 2015, インターネット<URL:https://arxiv.org/abs/1506.05869>.
そして、質問生成モデル学習部120は、学習した質問生成モデルを、質問生成モデル記憶部130に格納する。
質問生成モデル記憶部130は、学習済みの質問生成モデルを格納している。
入力部140は、対話システムやユーザ等から発話文の入力を受け付け、当該発話文を質問文生成部150に渡す。
質問文生成部150は、入力された発話文を、ニューラルネットワークに入力し、当該ニューラルネットワークの出力を、当該発話文に対する質問文とする。
具体的には、まず、質問文生成部150は、質問生成モデル記憶部130から質問生成モデルを取得する。
次に、質問文生成部150は、入力部140から発話文を取得すると、取得した質問生成モデルに当該発話文を入力して、疑問詞を用いた質問文を生成する。
ここで、Encoder−Decoderを用いる事で、生成された何れの対話データの第1発話文に該当しなくても、疑問詞を用いた質問文を生成することができる。
そして、質問文生成部150は、生成した質問文を、出力部160に渡す。
出力部160は、生成された質問文を出力する。例えば、対話システムの発話として、当該対話システムと対話しているユーザに対して、当該質問文を表示する等の方法により出力する。
<本発明の実施の形態に係る対話データ生成装置の作用>
図5は、本発明の実施の形態に係るモデル学習処理ルーチンを示すフローチャートである。
図5は、本発明の実施の形態に係るモデル学習処理ルーチンを示すフローチャートである。
入力部100にデータが入力されると、対話データ生成装置10において、図5に示すモデル学習処理ルーチンが実行される。
まず、ステップS100において、入力部100が、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、当該第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付ける。
ステップS110において、対話データ生成部110は、上記ステップS100により受け付けた複数のデータのうち、1番目のデータを選択する。
ステップS120において、対話データ生成部110は、当該データの第2発話文が、時制、場所、主体、対象、理由、方法、程度、又は状態に関する疑問詞を含む質問文であるか否かを判定する。
選択されているデータの第2発話文が、疑問詞を含む質問文でない場合(ステップS120のNO)、ステップS140に進む。
一方、選択されているデータの第2発話文が、疑問詞を含む質問文である場合(ステップS120のYES)、ステップS130において、対話データ生成部110は、当該データの第1発話文と、当該データの第2発話文との組を対話データとして生成する。
ステップS140において、対話データ生成部110は、入力された複数のデータの全てについて、上記処理を行ったか否かを判定する。
全てのデータについて処理していない場合(ステップS140のNO)、ステップS150において、対話データ生成部110は、次のデータを選択する。
一方、全てのデータについて処理している場合(ステップS140のYES)、ステップS160において、質問生成モデル学習部120は、生成された複数の対話データの各々について、当該対話データに含まれる第1発話文を入力としたときに、当該対話データに含まれる当該第2発話文を出力するように、入力された文から文を生成するニューラルネットワークを学習する。
ステップS170において、質問生成モデル学習部120は、学習したニューラルネットワークを、質問生成モデル記憶部130に格納する。
図6は、本発明の実施の形態に係る質問文生成処理ルーチンを示すフローチャートである。
入力部140に発話文が入力されると、対話データ生成装置10において、図6に示す質問文生成処理ルーチンが実行される。
まず、ステップS200において、入力部140が、対話システムやユーザ等から発話文の入力を受け付ける。
ステップS210において、質問文生成部150は、質問生成モデル記憶部130からニューラルネットワークを取得する。
ステップS220において、質問文生成部150は、入力された発話文を、ニューラルネットワークに入力し、当該ニューラルネットワークの出力を、当該発話文に対する質問文とする。
ステップS230において、出力部160は、生成された質問文を出力する。
以上説明したように、本発明の実施形態に係る対話データ生成装置によれば、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、当該第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの各々について、当該データの第2発話文が、当該第2発話文に対する応答が肯定文又は否定文とならない質問文である場合に、当該データの第1発話文及び第2発話文を対話データとすることにより、会話を深掘りする質問文を生成するための対話データを低コストに生成することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
上述の実施形態では、質問文生成部150は、複数の対話データに基づいて学習されたニューラルネットワークを用いて質問文を生成したが、これに限定されるものではなく、生成された複数の対話データを用いて、質問文を生成してもよい。
例えば、入力された発話文が、生成された複数の対話データの何れかの対話データの第1発話文と同一、又は最も類似する場合に、当該対話データの第2発話文を質問文として生成してもよい。
また、複数の対話データを雑談対話のシナリオとして利用してもよい。
また、上述の実施形態では、第3発話文を、第2発話文に対して第1発話文を発話した者による応答であるか否かという観点でのみ用い、チャットシステムや発話文を投稿するソーシャルネットワーキングサービス(SNS)等から収集される、第1発話文と第2発話文と、第3発話文との組からなるデータを入力とする場合を例に説明したが、これに限定されるものではない。
第3発話文が、第2発話文に対する応答として適切であるか否かを判断し、第3発話文が、第2発話文に対する応答として適切であると判断されたもののみ、第1発話文と、第2発話文と、第3発話文との組からなるデータとして入力するようにしてもよい。
これにより、対話データとして生成される第2発話文について、深掘りするための質問文としての質を更に高めることができる。
なお、第3発話文が、第2発話文に対する応答として適切であるか否かの判断は、目視で確認した結果の入力を受け付ける方法、第2発話文と第3発話文との関係が応答関係にあるか否かを自動的に判定する方法等を用いることができる。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 対話データ生成装置
100 入力部
110 対話データ生成部
120 質問生成モデル学習部
130 質問生成モデル記憶部
140 入力部
150 質問文生成部
160 出力部
100 入力部
110 対話データ生成部
120 質問生成モデル学習部
130 質問生成モデル記憶部
140 入力部
150 質問文生成部
160 出力部
Claims (6)
- 第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、前記第1発話文に対する応答である第2発話文と、前記第1のユーザが発話した文であって、前記第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付ける入力部と、
前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、疑問詞を用いた質問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成する対話データ生成部と、
を備えることを特徴とする対話データ生成装置。 - 前記対話データ生成部は、前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、時制、場所、主体、対象、理由、方法、程度、又は状態に関する疑問詞を含み、かつ、疑問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成する
ことを特徴とする請求項1記載の対話データ生成装置。 - 前記対話データ生成部により得られた複数の対話データの各々について、前記対話データに含まれる前記第1発話文を入力としたときに、前記対話データに含まれる前記第2発話文を出力するように、入力された文から文を生成するニューラルネットワークを学習する質問生成モデル学習部
を更に備えることを特徴とする請求項1又は2記載の対話データ生成装置。 - 入力された発話文を、前記ニューラルネットワークに入力し、前記ニューラルネットワークの出力を、前記発話文に対する質問文とする質問文生成部
を更に備えることを特徴とする請求項3記載の対話データ生成装置。 - 入力部が、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、前記第1発話文に対する応答である第2発話文と、前記第1のユーザが発話した文であって、前記第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付け、
対話データ生成部が、前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、疑問詞を用いた質問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成する
を特徴とする対話データ生成方法。 - コンピュータを、請求項1乃至4の何れか1項記載の対話データ生成装置の各部として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018090637A JP6775545B2 (ja) | 2018-05-09 | 2018-05-09 | 対話データ生成装置、対話データ生成方法、およびプログラム |
PCT/JP2019/018268 WO2019216316A1 (ja) | 2018-05-09 | 2019-05-07 | 対話データ生成装置、対話データ生成方法、およびプログラム |
US17/053,744 US12026460B2 (en) | 2018-05-09 | 2019-05-07 | Dialogue data generation device, dialogue data generation method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018090637A JP6775545B2 (ja) | 2018-05-09 | 2018-05-09 | 対話データ生成装置、対話データ生成方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019197363A true JP2019197363A (ja) | 2019-11-14 |
JP6775545B2 JP6775545B2 (ja) | 2020-10-28 |
Family
ID=68468285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018090637A Active JP6775545B2 (ja) | 2018-05-09 | 2018-05-09 | 対話データ生成装置、対話データ生成方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US12026460B2 (ja) |
JP (1) | JP6775545B2 (ja) |
WO (1) | WO2019216316A1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021069589A (ja) * | 2019-10-30 | 2021-05-06 | 株式会社三洋物産 | 遊技機 |
JP2021069591A (ja) * | 2019-10-30 | 2021-05-06 | 株式会社三洋物産 | 遊技機 |
JP2021069590A (ja) * | 2019-10-30 | 2021-05-06 | 株式会社三洋物産 | 遊技機 |
JP2021069592A (ja) * | 2019-10-30 | 2021-05-06 | 株式会社三洋物産 | 遊技機 |
JP2021069588A (ja) * | 2019-10-30 | 2021-05-06 | 株式会社三洋物産 | 遊技機 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017027234A (ja) * | 2015-07-17 | 2017-02-02 | 日本電信電話株式会社 | フレーム作成装置、方法、及びプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8332394B2 (en) * | 2008-05-23 | 2012-12-11 | International Business Machines Corporation | System and method for providing question and answers with deferred type evaluation |
US8275803B2 (en) * | 2008-05-14 | 2012-09-25 | International Business Machines Corporation | System and method for providing answers to questions |
JP5377430B2 (ja) * | 2009-07-08 | 2013-12-25 | 本田技研工業株式会社 | 質問応答データベース拡張装置および質問応答データベース拡張方法 |
JP6428954B2 (ja) * | 2016-02-18 | 2018-11-28 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP6819990B2 (ja) * | 2016-08-16 | 2021-01-27 | 国立研究開発法人情報通信研究機構 | 対話システム及びそのためのコンピュータプログラム |
JP6515897B2 (ja) * | 2016-09-28 | 2019-05-22 | トヨタ自動車株式会社 | 音声対話システムおよび発話意図理解方法 |
JP6721179B2 (ja) * | 2016-10-05 | 2020-07-08 | 国立研究開発法人情報通信研究機構 | 因果関係認識装置及びそのためのコンピュータプログラム |
CA3055379C (en) * | 2017-03-10 | 2023-02-21 | Eduworks Corporation | Automated tool for question generation |
CN107273487A (zh) * | 2017-06-13 | 2017-10-20 | 北京百度网讯科技有限公司 | 基于人工智能的聊天数据的生成方法、装置及计算机设备 |
KR102289917B1 (ko) * | 2017-06-30 | 2021-08-12 | 삼성에스디에스 주식회사 | 화행 정보를 이용한 대화 처리 방법 및 그 장치 |
US11734520B2 (en) * | 2018-10-05 | 2023-08-22 | Nippon Telegraph And Telephone Corporation | Dialog apparatus, method and program for the same |
-
2018
- 2018-05-09 JP JP2018090637A patent/JP6775545B2/ja active Active
-
2019
- 2019-05-07 WO PCT/JP2019/018268 patent/WO2019216316A1/ja active Application Filing
- 2019-05-07 US US17/053,744 patent/US12026460B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017027234A (ja) * | 2015-07-17 | 2017-02-02 | 日本電信電話株式会社 | フレーム作成装置、方法、及びプログラム |
Non-Patent Citations (2)
Title |
---|
大原康平、外4名: "不足情報を自律的に問う対話エージェントの実現に向けた聞き返しの必要性検知", 第9回データ工学と情報マネジメントに関するフォーラム (第15回日本データベース学会年次大会) [O, JPN6019026616, 31 March 2017 (2017-03-31), ISSN: 0004355189 * |
川島嵩弘、外5名: "経験を含むツイートを利用したライフログ雑談対話システムにおける応答生成", 第80回(平成30年)全国大会講演論文集(2) 人工知能と認知科学, JPN6019026619, 13 March 2018 (2018-03-13), pages 2 - 421, ISSN: 0004355190 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021069589A (ja) * | 2019-10-30 | 2021-05-06 | 株式会社三洋物産 | 遊技機 |
JP2021069591A (ja) * | 2019-10-30 | 2021-05-06 | 株式会社三洋物産 | 遊技機 |
JP2021069590A (ja) * | 2019-10-30 | 2021-05-06 | 株式会社三洋物産 | 遊技機 |
JP2021069592A (ja) * | 2019-10-30 | 2021-05-06 | 株式会社三洋物産 | 遊技機 |
JP2021069588A (ja) * | 2019-10-30 | 2021-05-06 | 株式会社三洋物産 | 遊技機 |
Also Published As
Publication number | Publication date |
---|---|
US20210342553A1 (en) | 2021-11-04 |
JP6775545B2 (ja) | 2020-10-28 |
WO2019216316A1 (ja) | 2019-11-14 |
US12026460B2 (en) | 2024-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019216316A1 (ja) | 対話データ生成装置、対話データ生成方法、およびプログラム | |
Moussalli et al. | Intelligent personal assistants: can they understand and be understood by accented L2 learners? | |
US20190034414A1 (en) | Method for providing dialogue service with chatbot assisted by human agents | |
EP3276498A1 (en) | Method and system for dynamically generating adaptive response to user interactions | |
JP5728527B2 (ja) | 発話候補生成装置、発話候補生成方法、及び発話候補生成プログラム | |
CN107133709B (zh) | 一种客户服务的质量检验方法、装置及系统 | |
JP2016001242A (ja) | 質問文生成方法、装置、及びプログラム | |
CN115700878A (zh) | 通过动态响应打断内容改进会话ai的双工通信 | |
DE102021208201A1 (de) | Erkennung von Vokabelkenntnissen und Korrektur von Fehlanpassungen bei Ferninteraktionen | |
JP2018197924A (ja) | 情報処理装置、対話処理方法、及び対話処理プログラム | |
US11361754B2 (en) | Method and system for speech effectiveness evaluation and enhancement | |
US11776546B1 (en) | Intelligent agent for interactive service environments | |
Kuhn et al. | Measuring the accuracy of automatic speech recognition solutions | |
JPWO2014045546A1 (ja) | メンタルヘルスケア支援装置、システム、方法およびプログラム | |
US12014148B2 (en) | Utterance generation device, method, and program | |
JP7224278B2 (ja) | ユーザの発話文に対する応答文を推定する装置、プログラム及び方法 | |
Buschmeier et al. | Co-constructing grounded symbols—feedback and incremental adaptation in human–agent dialogue | |
JP6097791B2 (ja) | 話題継続願望判定装置、方法、及びプログラム | |
JP2021125164A (ja) | 情報処理装置、チャットボットアシストプログラム及びチャットボットアシスト方法 | |
KR102372070B1 (ko) | 외국어 회화 학습 장치 및 방법 | |
WO2020137696A1 (ja) | 発話文生成モデル学習装置、発話文収集装置、発話文生成モデル学習方法、発話文収集方法、及びプログラム | |
Rosas-Maldonado | Use of communication strategies in an interactional context: The interlocutor influence | |
JP6858721B2 (ja) | コンテンツに関する対話を実施可能な対話制御装置、プログラム及び方法 | |
Putri et al. | Why am I Changed? The Convergent Process in a Multilingual Community: Speech Accommodation Perspective | |
Kondrashov et al. | Anticipatory completions in conversations between people who stutter and people who do not stutter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200929 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201006 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6775545 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |