JP2019197363A - 対話データ生成装置、対話データ生成方法、およびプログラム - Google Patents

対話データ生成装置、対話データ生成方法、およびプログラム Download PDF

Info

Publication number
JP2019197363A
JP2019197363A JP2018090637A JP2018090637A JP2019197363A JP 2019197363 A JP2019197363 A JP 2019197363A JP 2018090637 A JP2018090637 A JP 2018090637A JP 2018090637 A JP2018090637 A JP 2018090637A JP 2019197363 A JP2019197363 A JP 2019197363A
Authority
JP
Japan
Prior art keywords
sentence
data
utterance
question
utterance sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018090637A
Other languages
English (en)
Other versions
JP6775545B2 (ja
Inventor
太一 片山
Taichi Katayama
太一 片山
淳史 大塚
Atsushi Otsuka
淳史 大塚
航 光田
Wataru Mitsuta
航 光田
齋藤邦子
Kuniko Saito
邦子 齋藤
準二 富田
Junji Tomita
準二 富田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018090637A priority Critical patent/JP6775545B2/ja
Priority to PCT/JP2019/018268 priority patent/WO2019216316A1/ja
Priority to US17/053,744 priority patent/US12026460B2/en
Publication of JP2019197363A publication Critical patent/JP2019197363A/ja
Application granted granted Critical
Publication of JP6775545B2 publication Critical patent/JP6775545B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】会話を深掘りする質問文を生成するための対話データを低コストに生成することができるようにする。【解決手段】対話データ生成部110が、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、当該第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの各々について、当該データの第2発話文が、疑問詞を用いた質問文である場合に、当該データの第1発話文と、当該データの第2発話文との組を対話データとして生成する。【選択図】図1

Description

本発明は、対話データ生成装置、対話データ生成方法、およびプログラムに係り、特に、対話システムにおいて質問文を生成するための対話データ生成装置、対話データ生成方法、およびプログラムに関する。
ユーザとの間で対話を行う対話システムは、大きく分けて、タスク指向型対話システムと非タスク指向型対話システムの二種類に分けられる。
タスク指向型対話システムは、特定のタスクをシステムとの対話により達成するものである。例えば、フライトの予約システムや、天気情報案内システム(非特許文献1)に用いられている。これらのシステムでは、一般的にフレーム(スロット名とスロット値からなるスロットから構成される)という構造を持ち、フレームに基づいて対話が進行する。
タスク指向型対話システムでは、このような構造を持っているため、埋まっていないスロットを聞く質問文を生成して、相手の情報を聞き出すということができる。
一方、非タスク指向型対話システムは、目的のない対話を扱い、対話の内容はいわゆる雑談である。
Ryuichiro Higashinaka, Katsuhito Sudoh, Mikio Nakano, "Incorporating Discourse Features into Confidence Scoring of Intention Recognition Results in Spoken Dialogue Systems", Speech Communication, Volume 48, Issues 3-4, 2006, pp.417-436.
しかし、雑談には、様々な話題が含まれるため、タスク指向型対話システムと異なり、スロットという構造は持っておらず、どういった疑問詞を用いて質問をすれば良いのかということは自明ではない。
このため、非タスク指向型対話システムでは、相手の発話を深掘りする質問文を生成することは困難である、という問題があった。
このような問題を解決すべく、従来の非タスク指向型対話システムでは、ルールベースによる手法や、機械学習による手法によって、ユーザとの対話を実現している。
しかし、ルールベースによる手法では、人手でルールを記載するため、対話を幅広く深掘りするためには、大量のルールを人手で作成する必要がある、という問題があった。
また、機械学習の手法では、相手の発話に対する質問文である発話といったデータが世の中に存在しておらず、十分に学習するためのデータ量を用意することが困難である。すなわち、質問文生成を目的とした機械学習のためのコーパス(学習用データ)を用意することが困難である、という問題があった。
まとめると、従来の非タスク指向型対話システムでは、低コストに対話を深掘りする対話システムを実現することができないため、対話システムとユーザとのインタラクションを円滑にすることができない、という問題があった。
本発明は上記の点に鑑みてなされたものであり、会話を深掘りする質問文を生成するための対話データを低コストに生成することができる対話データ生成装置、対話データ生成方法、およびプログラムを提供することを目的とする。
本発明に係る対話データ生成装置は、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、前記第1発話文に対する応答である第2発話文と、前記第1のユーザが発話した文であって、前記第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付ける入力部と、前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、疑問詞を用いた質問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成する対話データ生成部と、を備えて構成される。
また、本発明に係る対話データ生成方法は、入力部が、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、前記第1発話文に対する応答である第2発話文と、前記第1のユーザが発話した文であって、前記第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付け、対話データ生成部が、前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、疑問詞を用いた質問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成する。
本発明に係る対話データ生成装置及び対話データ生成方法によれば、入力部が、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付ける。
そして、対話データ生成部が、入力部が受け付けた複数のデータの各々について、当該データの第2発話文が、疑問詞を用いた質問文である場合に、当該データの第1発話文と、当該データの第2発話文との組を対話データとして生成する。
このように、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、当該第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの各々について、当該データの第2発話文が、疑問詞を用いた質問文である場合に、当該データの第1発話文と、当該データの第2発話文との組を対話データとして生成することにより、会話を深掘りする質問文を生成するための対話データを低コストに生成することができる。
また、本発明に係る対話データ生成装置の前記対話データ生成部は、前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、時制、場所、主体、対象、理由、方法、程度、又は状態に関する疑問詞を含み、かつ、疑問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成することができる。
また、本発明に係る対話データ生成装置は、前記対話データ生成部により得られた複数の対話データの各々について、前記対話データに含まれる前記第1発話文を入力としたときに、前記対話データに含まれる前記第2発話文を出力するように、入力された文から文を生成するニューラルネットワークを学習する質問生成モデル学習部を更に備えることができる。
また、本発明に係る対話データ生成装置は、入力された発話文を、前記ニューラルネットワークに入力し、前記ニューラルネットワークの出力を、前記発話文に対する質問文とする質問文生成部を更に備えることができる。
本発明に係るプログラムは、上記の対話データ生成装置の各部として機能させるためのプログラムである。
本発明の対話データ生成装置、対話データ生成方法、およびプログラムによれば、会話を深掘りする質問文を生成するための対話データを低コストに生成することができる。
本発明の実施の形態に係る対話データ生成装置の構成を示す概略図である。 本発明の実施の形態に係る対話データ生成装置の入力部が受け付けるデータの例を示すイメージ図である。 本発明の実施の形態に係る対話データ生成装置の入力部が受け付けるデータの例を示すイメージ図である。 本発明の実施の形態に係る対話データ生成装置の対話データ生成部が生成する対話データの例を示すイメージ図である。 本発明の実施の形態に係る対話データ生成装置のモデル学習処理ルーチンを示すフローチャートである。 本発明の実施の形態に係る対話データ生成装置の質問文生成処理ルーチンを示すフローチャートである。
以下、本発明の実施の形態について図面を用いて説明する。
<本発明の実施の形態に係る対話データ生成装置の構成>
図1を参照して、本発明の実施の形態に係る対話データ生成装置10の構成について説明する。図1は、本発明の実施の形態に係る対話データ生成装置10の構成を示すブロック図である。
対話データ生成装置10は、CPUと、RAMと、後述するモデル学習処理ルーチン及び質問文生成処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
図1に示すように、本実施形態に係る対話データ生成装置10は、入力部100、対話データ生成部110と、質問生成モデル学習部120と、質問生成モデル記憶部130と、入力部140と、質問文生成部150と、出力部160とを備えて構成される。
入力部100は、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、当該第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付ける。
当該複数のデータは、チャットシステムや、発話文を投稿するソーシャルネットワーキングサービス(SNS)等から、第1のユーザの発話である第1発話文と、第2のユーザによる第1発話文に対する応答である第2発話文と、第1のユーザによる第2発話文に対する応答である第3発話文との組を予め抜き出して収集したものである。
例えば、図2に示すように、第1のユーザであるAから『この間京都に行ったよ』という発話があったとすると、これを第1発話文とする。そして、第2のユーザであるBから、第1発話文に対して、『なにしに行ったの?』という応答があったとすると、これを第2発話文とする。更に、ユーザAから、第2発話文に対して、『紅葉を見に行ってきたよ。きれいだった。』という応答があったとすると、これを第3発話文とする。
なお、公開されているインターネット上のチャットシステムやSNS等から、自動的にこれらを収集する装置等により、当該複数のデータが入力部100に入力されるように構成してもよい。
そして、入力部100は、このような第1発話文と、第2発話文と、第3発話文との組からなる複数のデータの入力を受け付けると、対話データ生成部110に当該複数のデータを渡す。
対話データ生成部110は、入力部100が受け付けた複数のデータの各々について、当該データの第2発話文が、時制、場所、主体、対象、理由、方法、程度、又は状態に関する疑問詞を含み、かつ、疑問文である場合に、当該データの第1発話文と、当該データの第2発話文との組を対話データとして生成する。
具体的には、まず、対話データ生成部110は、複数のデータの各々について、当該データの第2発話文が、疑問文であり、かつ、「いつ、どこ、誰が、なにしに、なんで、どのように、どんな」等、いわゆる5W1H(When、Where、Who、What、Why、How)について質問する際の疑問詞を含むか否かを判定する。
すなわち、対話データ生成部110は、単なる疑問文の発話(例えば「?」で終わっている発話等)を判定するのではなく、5W1Hの質問かどうかを判定する。
なぜなら、雑談対話は、可能な限り長く対話を続けることが必要とされるため、Yes/Noで答えられるような質問だと、相手がその質問に答えたところで対話が終了してしまう。
そこで、発話の内容を深掘りするような質問をすることにより、対話が継続できるようにすべく、5W1Hによる質問文により対話データを作成する。なお、5W1Hに限定されるものでなく、誰に(Whom)、誰の(Whose)等、Yes/Noで答えられるような質問でない場合に用いられる疑問詞であれば、何でもよい。
例えば、図3のような複数のデータの各々について、1番上のデータの第2発話文『なにしにいったの』という発話は、「なにしに」という対象について質問する際に用いられる疑問詞である単語を含んだ質問文である。このため、対話データ生成部110は、当該データの第1発話文である『この間京都に行った。』及び当該第2発話文の組を対話データとする。
また、例えば、図3において1番下のデータの第2発話文『金曜日といえば、飲み会ですよね?』は、質問文ではあるものの、Yes/Noで答えることができる質問であるため、対話データ生成部110は、当該データの第1発話文及び第2発話文の組を対話データとしない。
また、第2発話文の直後の第3発話文が、第1のユーザによる第2発話文に対する応答であるものであるため、疑問詞を用いた質問文である第2発話文は、発話の内容を深掘りする質問文としての質が高いと考えられる。
また、対話データ生成部110は、5W1Hを用いて質問している質問文であるか否かの判定に、予め学習した判定器を用いてもよい。
そして、対話データ生成部110は、生成した複数の対話データを、質問生成モデル学習部120に渡す。
質問生成モデル学習部120は、複数の対話データの各々について、当該対話データに含まれる第1発話文を入力としたときに、当該対話データに含まれる当該第2発話文を出力するように、入力された文から文を生成するニューラルネットワークを学習する。
具体的には、質問生成モデル学習部120は、対話データ生成部110により生成された複数の対話データの各々について、当該対話データの第1発話文を発話文として入力した場合に、当該発話文への応答となる質問文が当該対話データの第2発話文となるように、入力された文から文を生成するニューラルネットワークである質問生成モデルを学習する(図4)。
例えば、質問生成モデルを、Encoder−Decoderの枠組みで学習する。すなわち、当該対話データの第1発話文を発話文(入力)として入力し、当該対話データの第2発話文を質問文(出力)となるように、Encoder−Decoderを用いて質問生成モデルを学習する(例えば、参考文献1)。
[参考文献1]Oriol Vinyals, Quoc Le, "A Neural Conversational Model", [online], 2015, インターネット<URL:https://arxiv.org/abs/1506.05869>.
そして、質問生成モデル学習部120は、学習した質問生成モデルを、質問生成モデル記憶部130に格納する。
質問生成モデル記憶部130は、学習済みの質問生成モデルを格納している。
入力部140は、対話システムやユーザ等から発話文の入力を受け付け、当該発話文を質問文生成部150に渡す。
質問文生成部150は、入力された発話文を、ニューラルネットワークに入力し、当該ニューラルネットワークの出力を、当該発話文に対する質問文とする。
具体的には、まず、質問文生成部150は、質問生成モデル記憶部130から質問生成モデルを取得する。
次に、質問文生成部150は、入力部140から発話文を取得すると、取得した質問生成モデルに当該発話文を入力して、疑問詞を用いた質問文を生成する。
ここで、Encoder−Decoderを用いる事で、生成された何れの対話データの第1発話文に該当しなくても、疑問詞を用いた質問文を生成することができる。
そして、質問文生成部150は、生成した質問文を、出力部160に渡す。
出力部160は、生成された質問文を出力する。例えば、対話システムの発話として、当該対話システムと対話しているユーザに対して、当該質問文を表示する等の方法により出力する。
<本発明の実施の形態に係る対話データ生成装置の作用>
図5は、本発明の実施の形態に係るモデル学習処理ルーチンを示すフローチャートである。
入力部100にデータが入力されると、対話データ生成装置10において、図5に示すモデル学習処理ルーチンが実行される。
まず、ステップS100において、入力部100が、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、当該第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付ける。
ステップS110において、対話データ生成部110は、上記ステップS100により受け付けた複数のデータのうち、1番目のデータを選択する。
ステップS120において、対話データ生成部110は、当該データの第2発話文が、時制、場所、主体、対象、理由、方法、程度、又は状態に関する疑問詞を含む質問文であるか否かを判定する。
選択されているデータの第2発話文が、疑問詞を含む質問文でない場合(ステップS120のNO)、ステップS140に進む。
一方、選択されているデータの第2発話文が、疑問詞を含む質問文である場合(ステップS120のYES)、ステップS130において、対話データ生成部110は、当該データの第1発話文と、当該データの第2発話文との組を対話データとして生成する。
ステップS140において、対話データ生成部110は、入力された複数のデータの全てについて、上記処理を行ったか否かを判定する。
全てのデータについて処理していない場合(ステップS140のNO)、ステップS150において、対話データ生成部110は、次のデータを選択する。
一方、全てのデータについて処理している場合(ステップS140のYES)、ステップS160において、質問生成モデル学習部120は、生成された複数の対話データの各々について、当該対話データに含まれる第1発話文を入力としたときに、当該対話データに含まれる当該第2発話文を出力するように、入力された文から文を生成するニューラルネットワークを学習する。
ステップS170において、質問生成モデル学習部120は、学習したニューラルネットワークを、質問生成モデル記憶部130に格納する。
図6は、本発明の実施の形態に係る質問文生成処理ルーチンを示すフローチャートである。
入力部140に発話文が入力されると、対話データ生成装置10において、図6に示す質問文生成処理ルーチンが実行される。
まず、ステップS200において、入力部140が、対話システムやユーザ等から発話文の入力を受け付ける。
ステップS210において、質問文生成部150は、質問生成モデル記憶部130からニューラルネットワークを取得する。
ステップS220において、質問文生成部150は、入力された発話文を、ニューラルネットワークに入力し、当該ニューラルネットワークの出力を、当該発話文に対する質問文とする。
ステップS230において、出力部160は、生成された質問文を出力する。
以上説明したように、本発明の実施形態に係る対話データ生成装置によれば、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、当該第1発話文に対する応答である第2発話文と、当該第1のユーザが発話した文であって、当該第2発話文に対する応答である第3発話文との組からなる複数のデータの各々について、当該データの第2発話文が、当該第2発話文に対する応答が肯定文又は否定文とならない質問文である場合に、当該データの第1発話文及び第2発話文を対話データとすることにより、会話を深掘りする質問文を生成するための対話データを低コストに生成することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
上述の実施形態では、質問文生成部150は、複数の対話データに基づいて学習されたニューラルネットワークを用いて質問文を生成したが、これに限定されるものではなく、生成された複数の対話データを用いて、質問文を生成してもよい。
例えば、入力された発話文が、生成された複数の対話データの何れかの対話データの第1発話文と同一、又は最も類似する場合に、当該対話データの第2発話文を質問文として生成してもよい。
また、複数の対話データを雑談対話のシナリオとして利用してもよい。
また、上述の実施形態では、第3発話文を、第2発話文に対して第1発話文を発話した者による応答であるか否かという観点でのみ用い、チャットシステムや発話文を投稿するソーシャルネットワーキングサービス(SNS)等から収集される、第1発話文と第2発話文と、第3発話文との組からなるデータを入力とする場合を例に説明したが、これに限定されるものではない。
第3発話文が、第2発話文に対する応答として適切であるか否かを判断し、第3発話文が、第2発話文に対する応答として適切であると判断されたもののみ、第1発話文と、第2発話文と、第3発話文との組からなるデータとして入力するようにしてもよい。
これにより、対話データとして生成される第2発話文について、深掘りするための質問文としての質を更に高めることができる。
なお、第3発話文が、第2発話文に対する応答として適切であるか否かの判断は、目視で確認した結果の入力を受け付ける方法、第2発話文と第3発話文との関係が応答関係にあるか否かを自動的に判定する方法等を用いることができる。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 対話データ生成装置
100 入力部
110 対話データ生成部
120 質問生成モデル学習部
130 質問生成モデル記憶部
140 入力部
150 質問文生成部
160 出力部

Claims (6)

  1. 第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、前記第1発話文に対する応答である第2発話文と、前記第1のユーザが発話した文であって、前記第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付ける入力部と、
    前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、疑問詞を用いた質問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成する対話データ生成部と、
    を備えることを特徴とする対話データ生成装置。
  2. 前記対話データ生成部は、前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、時制、場所、主体、対象、理由、方法、程度、又は状態に関する疑問詞を含み、かつ、疑問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成する
    ことを特徴とする請求項1記載の対話データ生成装置。
  3. 前記対話データ生成部により得られた複数の対話データの各々について、前記対話データに含まれる前記第1発話文を入力としたときに、前記対話データに含まれる前記第2発話文を出力するように、入力された文から文を生成するニューラルネットワークを学習する質問生成モデル学習部
    を更に備えることを特徴とする請求項1又は2記載の対話データ生成装置。
  4. 入力された発話文を、前記ニューラルネットワークに入力し、前記ニューラルネットワークの出力を、前記発話文に対する質問文とする質問文生成部
    を更に備えることを特徴とする請求項3記載の対話データ生成装置。
  5. 入力部が、第1のユーザが発話した文である第1発話文と、第2のユーザが発話した文であって、前記第1発話文に対する応答である第2発話文と、前記第1のユーザが発話した文であって、前記第2発話文に対する応答である第3発話文との組からなる複数のデータの入力を受け付け、
    対話データ生成部が、前記入力部が受け付けた前記複数のデータの各々について、前記データの前記第2発話文が、疑問詞を用いた質問文である場合に、前記データの前記第1発話文と、前記データの前記第2発話文との組を対話データとして生成する
    を特徴とする対話データ生成方法。
  6. コンピュータを、請求項1乃至4の何れか1項記載の対話データ生成装置の各部として機能させるためのプログラム。
JP2018090637A 2018-05-09 2018-05-09 対話データ生成装置、対話データ生成方法、およびプログラム Active JP6775545B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018090637A JP6775545B2 (ja) 2018-05-09 2018-05-09 対話データ生成装置、対話データ生成方法、およびプログラム
PCT/JP2019/018268 WO2019216316A1 (ja) 2018-05-09 2019-05-07 対話データ生成装置、対話データ生成方法、およびプログラム
US17/053,744 US12026460B2 (en) 2018-05-09 2019-05-07 Dialogue data generation device, dialogue data generation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018090637A JP6775545B2 (ja) 2018-05-09 2018-05-09 対話データ生成装置、対話データ生成方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2019197363A true JP2019197363A (ja) 2019-11-14
JP6775545B2 JP6775545B2 (ja) 2020-10-28

Family

ID=68468285

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018090637A Active JP6775545B2 (ja) 2018-05-09 2018-05-09 対話データ生成装置、対話データ生成方法、およびプログラム

Country Status (3)

Country Link
US (1) US12026460B2 (ja)
JP (1) JP6775545B2 (ja)
WO (1) WO2019216316A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021069589A (ja) * 2019-10-30 2021-05-06 株式会社三洋物産 遊技機
JP2021069591A (ja) * 2019-10-30 2021-05-06 株式会社三洋物産 遊技機
JP2021069590A (ja) * 2019-10-30 2021-05-06 株式会社三洋物産 遊技機
JP2021069592A (ja) * 2019-10-30 2021-05-06 株式会社三洋物産 遊技機
JP2021069588A (ja) * 2019-10-30 2021-05-06 株式会社三洋物産 遊技機

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017027234A (ja) * 2015-07-17 2017-02-02 日本電信電話株式会社 フレーム作成装置、方法、及びプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332394B2 (en) * 2008-05-23 2012-12-11 International Business Machines Corporation System and method for providing question and answers with deferred type evaluation
US8275803B2 (en) * 2008-05-14 2012-09-25 International Business Machines Corporation System and method for providing answers to questions
JP5377430B2 (ja) * 2009-07-08 2013-12-25 本田技研工業株式会社 質問応答データベース拡張装置および質問応答データベース拡張方法
JP6428954B2 (ja) * 2016-02-18 2018-11-28 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP6819990B2 (ja) * 2016-08-16 2021-01-27 国立研究開発法人情報通信研究機構 対話システム及びそのためのコンピュータプログラム
JP6515897B2 (ja) * 2016-09-28 2019-05-22 トヨタ自動車株式会社 音声対話システムおよび発話意図理解方法
JP6721179B2 (ja) * 2016-10-05 2020-07-08 国立研究開発法人情報通信研究機構 因果関係認識装置及びそのためのコンピュータプログラム
CA3055379C (en) * 2017-03-10 2023-02-21 Eduworks Corporation Automated tool for question generation
CN107273487A (zh) * 2017-06-13 2017-10-20 北京百度网讯科技有限公司 基于人工智能的聊天数据的生成方法、装置及计算机设备
KR102289917B1 (ko) * 2017-06-30 2021-08-12 삼성에스디에스 주식회사 화행 정보를 이용한 대화 처리 방법 및 그 장치
US11734520B2 (en) * 2018-10-05 2023-08-22 Nippon Telegraph And Telephone Corporation Dialog apparatus, method and program for the same

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017027234A (ja) * 2015-07-17 2017-02-02 日本電信電話株式会社 フレーム作成装置、方法、及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
大原康平、外4名: "不足情報を自律的に問う対話エージェントの実現に向けた聞き返しの必要性検知", 第9回データ工学と情報マネジメントに関するフォーラム (第15回日本データベース学会年次大会) [O, JPN6019026616, 31 March 2017 (2017-03-31), ISSN: 0004355189 *
川島嵩弘、外5名: "経験を含むツイートを利用したライフログ雑談対話システムにおける応答生成", 第80回(平成30年)全国大会講演論文集(2) 人工知能と認知科学, JPN6019026619, 13 March 2018 (2018-03-13), pages 2 - 421, ISSN: 0004355190 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021069589A (ja) * 2019-10-30 2021-05-06 株式会社三洋物産 遊技機
JP2021069591A (ja) * 2019-10-30 2021-05-06 株式会社三洋物産 遊技機
JP2021069590A (ja) * 2019-10-30 2021-05-06 株式会社三洋物産 遊技機
JP2021069592A (ja) * 2019-10-30 2021-05-06 株式会社三洋物産 遊技機
JP2021069588A (ja) * 2019-10-30 2021-05-06 株式会社三洋物産 遊技機

Also Published As

Publication number Publication date
US20210342553A1 (en) 2021-11-04
JP6775545B2 (ja) 2020-10-28
WO2019216316A1 (ja) 2019-11-14
US12026460B2 (en) 2024-07-02

Similar Documents

Publication Publication Date Title
WO2019216316A1 (ja) 対話データ生成装置、対話データ生成方法、およびプログラム
Moussalli et al. Intelligent personal assistants: can they understand and be understood by accented L2 learners?
US20190034414A1 (en) Method for providing dialogue service with chatbot assisted by human agents
EP3276498A1 (en) Method and system for dynamically generating adaptive response to user interactions
JP5728527B2 (ja) 発話候補生成装置、発話候補生成方法、及び発話候補生成プログラム
CN107133709B (zh) 一种客户服务的质量检验方法、装置及系统
JP2016001242A (ja) 質問文生成方法、装置、及びプログラム
CN115700878A (zh) 通过动态响应打断内容改进会话ai的双工通信
DE102021208201A1 (de) Erkennung von Vokabelkenntnissen und Korrektur von Fehlanpassungen bei Ferninteraktionen
JP2018197924A (ja) 情報処理装置、対話処理方法、及び対話処理プログラム
US11361754B2 (en) Method and system for speech effectiveness evaluation and enhancement
US11776546B1 (en) Intelligent agent for interactive service environments
Kuhn et al. Measuring the accuracy of automatic speech recognition solutions
JPWO2014045546A1 (ja) メンタルヘルスケア支援装置、システム、方法およびプログラム
US12014148B2 (en) Utterance generation device, method, and program
JP7224278B2 (ja) ユーザの発話文に対する応答文を推定する装置、プログラム及び方法
Buschmeier et al. Co-constructing grounded symbols—feedback and incremental adaptation in human–agent dialogue
JP6097791B2 (ja) 話題継続願望判定装置、方法、及びプログラム
JP2021125164A (ja) 情報処理装置、チャットボットアシストプログラム及びチャットボットアシスト方法
KR102372070B1 (ko) 외국어 회화 학습 장치 및 방법
WO2020137696A1 (ja) 発話文生成モデル学習装置、発話文収集装置、発話文生成モデル学習方法、発話文収集方法、及びプログラム
Rosas-Maldonado Use of communication strategies in an interactional context: The interlocutor influence
JP6858721B2 (ja) コンテンツに関する対話を実施可能な対話制御装置、プログラム及び方法
Putri et al. Why am I Changed? The Convergent Process in a Multilingual Community: Speech Accommodation Perspective
Kondrashov et al. Anticipatory completions in conversations between people who stutter and people who do not stutter

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201006

R150 Certificate of patent or registration of utility model

Ref document number: 6775545

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150