JP2018151578A - 決定装置、決定方法および決定プログラム - Google Patents

決定装置、決定方法および決定プログラム Download PDF

Info

Publication number
JP2018151578A
JP2018151578A JP2017049089A JP2017049089A JP2018151578A JP 2018151578 A JP2018151578 A JP 2018151578A JP 2017049089 A JP2017049089 A JP 2017049089A JP 2017049089 A JP2017049089 A JP 2017049089A JP 2018151578 A JP2018151578 A JP 2018151578A
Authority
JP
Japan
Prior art keywords
meaning
estimation
utterance
user
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017049089A
Other languages
English (en)
Other versions
JP6199517B1 (ja
Inventor
伸裕 鍜治
Nobuhiro Kaji
伸裕 鍜治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017049089A priority Critical patent/JP6199517B1/ja
Application granted granted Critical
Publication of JP6199517B1 publication Critical patent/JP6199517B1/ja
Publication of JP2018151578A publication Critical patent/JP2018151578A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】新たなドメインを迅速に生成する。【解決手段】本願に係る決定装置は、利用者から受付けた発話の意味を推定する推定モデルであって、対話を通じて学習が行われる推定モデルを用いて、前記発話の意味を推定する推定部と、前記推定部により推定された意味に基づいて、前記利用者に対する応答の内容を決定する決定部とを有することを特徴とする。【選択図】図1

Description

本発明は、決定装置、決定方法および決定プログラムに関する。
従来、利用者の発話に対して応答を出力する技術が知られている。このような技術の一例として、対話データを学習することにより、対話モデルを生成する技術が知られている。また、発話や応答の内容に応じたドメインごとに対話モデルを生成する技術が知られている。
特開2013−105436号公報
Kim et al., Domainless Adaptation by Constrained Decoding on a Schema Lattice, In COLING2016
しかしながら、上述した従来技術では、新たなドメインを迅速に生成することができるとは言い難い。
例えば、従来技術においては、利用者の発話を意味表現に変換する意味理解部と、意味表現から応答を生成する対話管理部により構成される対話モデルが生成され、利用者の発話の意図を正確に意味表現へと変換するために、教師あり学習で意味理解部の学習を行い、強化学習により対話管理部を学習するといった学習戦略が採用される。しかしながら、このような学習戦略では、意味理解部の学習に比較的多くの学習データが必要となるため、新たなドメインを追加する際に対話モデルを迅速に生成することができない。
本願は、上記に鑑みてなされたものであって、新たなドメインを迅速に生成することを目的とする。
本願に係る決定装置は、利用者から受付けた発話の意味を推定する推定モデルであって、対話を通じて学習が行われる推定モデルを用いて、前記発話の意味を推定する推定部と、前記推定部により推定された意味に基づいて、前記利用者に対する応答の内容を決定する決定部とを有することを特徴とする。
実施形態の一態様によれば、新たなドメインを迅速に生成できる。
図1は、実施形態に係る情報提供装置が実行する処理の一例を示す図である。 図2は、実施形態に係る情報提供装置の構成例を示す図である。 図3は、実施形態に係る推定モデルデータベースに登録される情報の一例を示す図である。 図4は、実施形態に係るルールデータベースに登録される情報の一例を示す図である。 図5は、実施形態に係る情報処理装置が実行する処理の概念を示す図である。 図6は、実施形態に係る情報提供装置が実行する決定処理の流れの一例を示すフローチャートである。 図7は、実施形態に係る情報提供装置が実行する強化学習の流れの一例を示すフローチャートである。 図8は、ハードウェア構成の一例を示す図である。
以下に、本願に係る決定装置、決定方法および決定プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る決定装置、決定方法および決定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。
〔1−1.情報提供装置の概要〕
まず、図1を用いて、決定装置の一例となる情報提供装置が実行する決定処理の一例について説明する。図1は、実施形態に係る情報提供装置が実行する処理の一例を示す図である。なお、以下の説明では、情報提供装置10が実行する処理として、利用者Uの発話に対する応答の内容を決定する決定処理と、決定した内容の応答を出力する出力処理との一例について説明する。すなわち、情報提供装置10は、利用者Uとの対話を実現する対話システムである。
情報提供装置10は、インターネット等の所定のネットワークN(例えば、図2を参照。)を介して、利用者端末100、第1外部サーバ200および第2外部サーバ300と通信可能な情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。なお、情報提供装置10は、ネットワークNを介して、任意の数の利用者端末100、第1外部サーバ200および第2外部サーバ300と通信可能であってよい。
利用者端末100は、対話システムで対話を行う利用者Uが使用する情報処理装置であり、PC(Personal Computer)、サーバ装置、スマートデバイスといった情報処理装置により実現される。例えば、利用者端末100は、利用者Uが発話した音声を取得すると、所定の外部サーバ(図示は、省略)に音声データを出力し、利用者Uの発話のテキストデータを取得する。そして、利用者端末100は、テキストデータを発話として情報提供装置10へと送信する。なお、利用者端末100は、利用者Uが入力した文字列を発話として情報提供装置10へと送信してもよい。
このような場合、情報提供装置10は、発話として受信したテキストデータを解析し、内容を推定する。そして、情報提供装置10は、推定した内容に応じて応答となるテキストを生成し、生成したテキストデータやテキストデータを音声として出力するための音声データを利用者端末100へと送信する。この結果、利用者端末100は、各種テキストの読み上げ技術や、受信した音声データを再生することで、利用者Uとの対話を実現する。
第1外部サーバ200および第2外部サーバ300(以下、「各外部サーバ200、300」と記載する場合がある。)は、各種のサービスを提供する情報処理装置であり、例えば、サーバ装置やクラウドシステムにより実現される。例えば、第1外部サーバ200は、天気予報に関する情報を配信するサービスを提供しており、API(Application Programming Interface)を介して、情報提供装置10に各種天気予報に関する情報(例えば、所定の地域の天気や気温を示す情報)を配信する。また、第2外部サーバ300は、例えば、電子商取引に関するサービスを提供する。
〔1−2.決定処理について〕
ここで、利用者Uとの対話を円滑にするため、予め生成された対話モデルを用いて利用者Uとの対話を実演する技術が知られている。このような技術の一例として、発話の内容が天気に関する内容であるか、時計に関する内容であるかというように、発話の内容が属するドメインを推定し、ドメインごとに生成された対話モデルを用いて、利用者Uの発話に対して自然な内容の応答を出力する技術が知られている。
しかしながら、従来技術では、新たなドメインを迅速に追加することができない。例えば、従来技術として、利用者の発話の内容を推定し、推定した内容を示す意味表現を生成する言語理解処理を実行する推定モデルと、意味表現から利用者との会話の状態を特定する状態追跡処理および利用者の会話の状態に応じて、応答の内容を決定する応答決定処理を実行する対話管理モデルとにより構成される対話システムが知られている。そして、従来技術では、利用者との円滑な対話を実現するため、推定モデルを教師あり学習により学習し、対話管理モデルを強化学習により学習していた。
しかしながら、教師あり学習には、比較的多くのデータを必要とするため、新たなドメインを追加する際に、そのドメインと関連する多くの発話データが必要となる。このため、学習データの収集や学習に時間を要する結果、迅速に新たなドメインを追加することができない。
そこで、情報提供装置10は、以下の決定処理を実行する。まず、情報提供装置10は、利用者Uから受付けた発話の意味を推定する推定モデルであって、対話を通じて学習が行われる推定モデルを用いて、発話の意味を推定する。そして、情報提供装置10は、推定された意味に基づいて、利用者Uに対する応答の内容を決定する。
例えば、情報提供装置10は、発話に関連する分野ごと、すなわち、ドメインごとに異なる推定モデルを保持する。そして、情報提供装置10は、推定モデルを用いて利用者Uの発話の意味を推定する。その後、情報提供装置10は、発話に関連するドメインによらず、推定された意味に応じて、利用者Uに対する応答の内容を決定する。例えば、情報提供装置10は、利用者Uの発話の意味と、出力する応答の内容とをあらかじめ記憶し、推定された意味に対して予め対応付けられた内容を応答の内容として決定する。
すなわち、情報提供装置10は、利用者Uとの対話を通して、発話の意味を推定する推定モデルをQ学習やバンディッドアルゴリズム等といった強化学習により学習する。このような強化学習を用いて推定モデルの学習を行った場合、ある程度の精度で発話の意味を推定する推定モデルを教師あり学習と比較して少ない学習データで構成することができるとともに、利用者Uとの対話を通じて推定精度を順次向上させることができる。そこで、情報提供装置10は、利用者Uの発話の意味を推定する処理については、発話内容が属するドメインごとに、強化学習を行う推定モデルにより実現する。
一方、推定モデルの精度がある程度高い場合、応答内容はドメインに寄らず、所定のルールベースでも実現できると考えられる。そこで、情報提供装置10は、推定モデルにより発話の意味を推定した場合は、ドメインによらず共通の対話管理モデルを用いて、利用者Uに対する応答の内容を決定する。そして、情報提供装置10は、決定した内容の応答を出力することで、利用者Uとの対話を実現する。
なお、以下の説明では、情報提供装置10は、利用者Uとの対話を通じた強化学習を用いて推定モデルの学習を行う処理について記載するが、実施形態は、これに限定されるものではない。情報提供装置10は、利用者Uとの対話を通じて行われる学習であれば、任意の学習手法を用いて、推定モデルの学習を行ってよい。
〔1−3.決定処理の一例〕
ここで、図1を用いて、情報提供装置10が実行する処理の一例について説明する。まず、情報提供装置10は、利用者端末100から発話#1を受付ける(ステップS1)。このような場合、情報提供装置10は、ドメインごとに異なる推定モデルであって、発話の意味を強化学習する推定モデルを用いて、発話#1の意味を推定する(ステップS2)。すなわち、情報提供装置10は、発話#1から意味表現を生成する。
例えば、情報提供装置10は、発話#1の内容に応じて、発話の内容が属するドメインを判定するドメイン判定処理を実行する(ステップS3)。例えば、情報提供装置10は、発話#1に含まれる単語等に応じて、発話の内容が属するドメインを推定する。より具体的には、情報提供装置10は、発話に含まれるテキストに基づいて発話をいずれかのドメインに分類する分類モデルを用いて、発話の分類を実行する。なお、情報提供装置10は、対話システムにおいて発話の内容が属するドメインを判定する技術であれば、任意の周知技術を採用してよい。
続いて、情報提供装置10は、判定したドメインの推定モデルを用いて、発話#1の意味を推定する言語理解処理を実行する(ステップS4)。例えば、情報提供装置10は、発話#1のドメインがドメイン#1であると判定した場合は、ドメイン#1に対応する推定モデル#1を用いて、発話#1の内容の意味#1を推定する。なお、情報提供装置10は、強化学習により学習が進むモデルであって、発話のテキストデータから発話の内容の意味を推定するように学習が行われるモデルであれば、任意の種別のモデルを推定モデルとして採用してよい。また、情報提供装置10は、ドメインごとに異なる種別のモデルを採用してもよい。このような推定モデルは、例えば、SVM(Support Vector Machine)やDNN(Deep Neural Network)等、任意の学習器又は分類器等のモデルにより実現される。
そして、情報提供装置10は、推定された意味に基づいて、利用者Uとの対話の状態を追跡する状態追跡処理を実行する(ステップS5)。そして、情報提供装置10は、各ドメイン共通で所定のルールに基づき応答内容を決定する応答決定処理を実行する(ステップS6)。
ここで、対話システムにおいては、「地域Aの天気予報を教えて」や「B駅までの行き方を教えて」等といった処理の命令が含まれる場合がある。このように、利用者Uの発話#1の意味に、所定の情報を収集して提供する旨が含まれる場合、情報提供装置10は、応答を作成するための情報を、例えば、第1外部サーバ200等、所定のサーバに対して要求する(ステップS8)。この結果、情報提供装置10は、地域Aの天気予報や、B駅までの乗換案内等といった応答に含まれる各種の情報を取得し(ステップS9)、取得した情報を用いて、各種の応答を生成する(ステップS10)。そして、情報提供装置10は、生成した応答、すなわち、発話#1に対する応答#1を利用者端末100へと出力する(ステップS11)。
ここで、情報提供装置10は、利用者端末100から、応答#1に続く発話#2を受付ける(ステップS12)。このような発話#2の内容は、利用者Uが応答#1の内容に満足しているか否か、発話#1の内容を誤って解釈していたか否か等、発話の内容の意味が適切に推定されたか否かの判断の指標となりうる。そこで、情報提供装置10は、発話#2の内容と、前回発話#1から推定した意味#1とに基づいて、前回の応答作成時に用いた推定モデル#1の強化学習を実行する(ステップS13)。すなわち、情報提供装置10は、推定モデルを用いて推定した意味と、その意味に応じて決定した内容の応答に対する利用者Uの反応とに基づいて、推定モデルの強化学習を行う。
例えば、情報提供装置10は、発話#1を強化学習におけるコントローラの状態観測の結果とし、意味#1をコントローラの行動とし、発話#2に基づく報酬をコントローラに対して設定する。より具体的な例を挙げると、情報提供装置10は、発話#2が発話#1と同様の内容であったり、応答#1が誤っている旨の内容等が含まれる場合は、負の報酬を設定し、発話#2が発話#1とは異なる内容であったり、応答#1が正しい旨の内容等が含まれる場合は、正の報酬を設定する。そして、情報提供装置10は、推定モデル#1の強化学習を行うことで、発話から意味を推定する精度を向上させる。
なお、情報提供装置10は、ステップS13の処理を、発話#2に対するステップS2の処理(すなわち、応答を生成する処理)と平行して実行してもよく、先駆けて実行してもよい。また、情報提供装置10は、利用者Uとの対話を保持し、所定の期間内(例えば、夜間等)に保持した対話を用いて推定モデルの学習を行ってもよい。
すなわち、情報提供装置10は、利用者Uの発話から意味を推定するフロントエンドの処理において、利用者Uとの対話を用いた強化学習を行うことで、試行錯誤的に利用者Uとの対話を実現する。このため、情報提供装置10は、ドメインの追加を行う場合等にも、ある程度の学習を行った推定モデルを準備すればよいので、迅速なドメインの追加を実現できる。また、情報提供装置10は、状態追跡処理や応答決定処理の内容を簡素化することができる。
〔1−4.スロットフィリングの採用〕
ここで、情報提供装置10は、応答決定処理をルールベースで実現する。この際、情報提供装置10は、所謂スロットフィリングの技術を用いて、利用者Uに対する応答を生成してもよい。より具体的には、情報提供装置10は、推定モデルを用いて推定された意味が所定の条件を満たしていない場合は、所定の条件を満たす意味の発話を利用者Uに対して求める内容を、応答の内容として決定してもよい。
例えば、情報提供装置10は、乗換案内を実行するための条件として、出発地と到着地の情報が必要である旨をあらかじめ記憶する。このような場合、情報提供装置10は、推定した意味に出発地の情報と到着地の情報とが含まれるか否かを判定する。そして、情報提供装置10は、例えば、利用者Uの発話に出発地である「B駅」が含まれない場合や、推定モデルの精度により「B駅」を認識することができなかった場合、欠落した出発地の情報を得るため、「出発地はどこですか?」などといった応答を出力してもよい。
なお、このようなスロットフィリングに関する処理の実行は、例えば、推定モデルが有する機能であってもよい。例えば、推定モデルは、ドメインに応じた各種の処理と、その処理を実行するための情報の項目とをあらかじめ対応付けて記憶する。例えば、推定モデルは、処理が「経路案内」である場合には、項目「出発地」および「到着地」を記憶する。そして、推定モデルは、利用者Uの発話から、各処理の項目に対応する情報を推定し、ある処理について推定した情報により全ての項目が満たされた場合は、その処理を実行する旨の情報を意味表現として出力してもよい。
また、推定モデルが推定する内容は、対話モデルにおいてどのような処理構成を採用するかにより、任意の構成が採用可能である。例えば、情報提供装置10は、推定モデルとして、発話に含まれる単語の中から応答を作成するために必要な単語を抽出することで、発話の意味を推定するモデルを採用してもよく、発話の内容から利用者Uが所望する処理の内容等を推定し、推定結果を出力するようなモデルを採用してもよい。すなわち、情報提供装置10は、対話システムにおいて、利用者Uの発話が明示的或いは暗示的に示す情報であって、発話に対する応答の内容を決定したり、応答として含まれる情報を取得するために必要な情報であれば、任意の情報を発話から推定するモデルを推定モデルとして採用してよい。
〔1−5.利用者の属性に応じた意味推定〕
また、情報提供装置10は、推定モデルとして、利用者Uの属性に応じて発話の意味を推定する推定モデルを用いて、発話の意味を推定してもよい。例えば、利用者Uの発話に含まれる意味は、利用者Uの属性に応じて変化するとも考えられる。そこで、情報提供装置10は、利用者Uのデモグラフィック属性、サイコグラフィック属性、各種のペルソナ、過去の会話履歴等を利用者Uの属性として取得し、推定モデルの強化学習の際に、強化学習におけるコントローラの状態観測の結果として、発話と利用者Uの属性とを採用する。そして、情報提供装置10は、例えば、発話#2から意味#2を推定する際に、属性モデルに発話#2と利用者Uの属性とを入力することで、利用者Uの属性に応じた意味の推定を実現してもよい。
〔1−6.意味推定のバリエーション〕
また、情報提供装置10は、全ての推定モデルを用いて、発話の意味の推定およびドメインの選択を行ってもよい。例えば、情報提供装置10は、それぞれ異なる分野に対応する複数の推定モデルを用いて、発話の意味を推定する。そして、情報提供装置10は、複数の推定モデルによって推定された意味のうち、所定の数以上の推定モデルによって推定された意味に基づいて、応答の内容を決定する。
例えば、情報提供装置10は、推定モデル#1〜推定モデル#3のそれぞれを用いて、発話#1の意味を推定する。ここで、情報提供装置10は、推定モデル#1が発話#1の意味として「意味#1」および「意味#2」を推定し、推定モデル#2が発話#1の意味として「意味#2」および「意味#3」を推定し、推定モデル#3が発話#1の意味として「意味#1」および「意味#2」を推定したものとする。
このような場合、「意味#2」については、全ての推定モデルが発話#1の意味であると推定しているため、「意味#1」や「意味#3」よりも発話#1の意味としてより確度が高いと考えられる。そこで、情報提供装置10は、各推定モデル#1〜#3が出力した意味のうち「意味#2」を用いて、利用者Uに対する応答#1の生成を行ってもよい。なお、情報提供装置10は、全ての推定モデルが出力した意味を採用する必要はなく、例えば、全推定モデルのうち、出力した推定モデルの数の割合が所定の閾値を超える意味を採用してもよい。また、情報提供装置10は、採用した意味を推定した推定モデルと対応するドメインを、発話のドメインとして採用してもよい。また、情報提供装置10は、最も確度が高い意味を推定した推定モデルを対応するドメインを、発話のドメインとして採用してもよい。
〔1−7.利用者への問合せ〕
また、情報提供装置10は、意味の推定結果を適時利用者Uに開示することで、推定結果が正しいか否かの確認を行うことで、推定モデルの強化学習に必要なデータを対話的に取得してもよい。例えば、情報提供装置10は、所定のタイミングで、発話から推定した意味の内容と、利用者Uから受付けた発話の意味が推定モデルにより推定した意味で合っているか否かの問合せとを応答の内容としてもよい。より具体的な例を挙げると、情報提供装置10は、発話#1から推定した意味が「意味#1」である場合、「意味#1で合っていますか?」等といった応答を出力してもよい。
また、情報提供装置10は、推定された意味の確度を利用することで、利用者に確認を行うか否かを判定してもよい。例えば、情報提供装置10は、推定した意味の確度が所定の閾値以下となる場合にのみ、意味の問い合わせを出力することで、対話におけるユーザエクスペリメントの低下を防いでもよい。例えば、情報提供装置10は、発話の意味を、その発話がその意味を有する確度と共に推定する推定モデルを用いて、発話#1の意味#1と確度#1とを推定する。そして、情報提供装置10は、推定された確度#1が所定の閾値以下となる場合は、意味#1を利用者Uに対して問い合わせる内容を応答の内容として決定してもよい。
〔1−8.外部連携について〕
ここで、情報提供装置10は、発話に対応するドメインと関連する分野の外部サーバ等に適宜アクセスを行い、推定した意味に矛盾が含まれるか否かを判定してもよい。また、情報提供装置10は、推定した意味に矛盾が含まれるか否かの判定結果に基づいて、推定モデルの強化学習を実現してもよい。
例えば、情報提供装置10は、推定モデル#1を用いて意味#1を推定した場合、所定のタイミングで、意味#1が適切であるか否かを判定するための情報を第2外部サーバ300から取得する(ステップS14)。例えば、情報提供装置10は、ドメイン#1が電子商取引に関連するドメインである場合は、電子商取引に関するサービスを提供する第2外部サーバ300にアクセスし、取引対象の種別や販売数等、電子商取引に関する情報を取得する。
そして、情報提供装置10は、取得した情報と、意味#1とを比較することで、意味#1に矛盾や乖離が含まれるか否かを判定する。例えば、情報提供装置10は、意味#1が「取引対象#1を500個購入」といった意味を有するが、第2外部サーバ300から取得した購入履歴において取引対象#1を購入する数が5個を上回ることが無い場合、推定した意味#1と現実の情報との間に矛盾や乖離が含まれると判定し、意味#1が誤りであると判定する。そして、情報提供装置10は、判定結果に基づいて、推定モデル#1の強化学習を行ってもよい(ステップS15)。
なお、このような推定した意味と実際の情報との間の矛盾や乖離を判定する技術については、任意の技術が採用可能である。例えば、情報提供装置10は、意味#1と、各種外部サーバから取得する情報との間の乖離性を示す乖離度を算出し、算出した乖離度が所定の閾値を超える場合は、乖離や矛盾が生じたと判定してもよい。
〔2.情報提供装置の構成〕
以下、上記した情報提供装置10が有する機能構成の一例について説明する。図2は、実施形態に係る情報提供装置の構成例を示す図である。図2に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、利用者端末100との間で情報の送受信を行う。
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、推定モデルデータベース31およびルールデータベース32を記憶する。
推定モデルデータベース31には、ドメインごとの推定モデルが登録される。例えば、図3は、実施形態に係る推定モデルデータベースに登録される情報の一例を示す図である。図3に示すように、推定モデルデータベース31には、「モデルID(Identifier)」、「ドメイン」、および「モデルデータ」といった項目を有する情報が登録される。
ここで、「モデルID」とは、モデルの識別子である。また、「ドメイン」とは、対応付けられた「モデルID」が示すモデルがどのドメインの発話の意味を推定するモデルであるかを示す情報である。また、「モデルデータ」とは、対応付けられた「モデルID」が示すモデルを構成する各種パラメータ等のデータである。
例えば、図3に示す例では、推定モデルデータベース31には、モデルID「モデル#1」、ドメイン「ドメイン#1」、およびモデルデータ「モデルデータ#1」が対応付けて登録されている。このような情報は、モデルID「モデル#1」が示すモデルが、ドメイン「ドメイン#1」が示すドメインに属する発話の意味を推定するモデルであり、そのモデルの各種パラメータ等がモデルデータ「モデルデータ#1」である旨を示す。なお、図3に示す例では、「モデル#1」、「ドメイン#1」、「モデルデータ#1」等といった概念的な値を記載したが、実際には、推定モデルデータベース31には、モデルをやドメインを識別する文字列、モデルを構築するための各種パラメータ等のデータが登録されることとなる。
図2に戻り、説明を続ける。ルールデータベース32には、発話の意味に応じてどのような内容の応答を出力するかを定めるルールが登録される。例えば、図4は、実施形態に係るルールデータベースに登録される情報の一例を示す図である。図4に示すように、ルールデータベース32には、「ルールID」、「状態」、および「応答内容」といった項目を有する情報が登録される。
ここで、「ルールID」とは、ルールの識別子である。また、「状態」とは、利用者Uとの対話の状態を示す情報である。また、「応答内容」とは、対応付けられた「条件」が示す条件が満たされた場合に、決定される応答の内容である。例えば、図4に示す例では、ルールID「ルール#1」、状態「状態#1」、および応答内容「応答内容#1」が対応付けて登録されている。このような情報は、ルールID「ルール#1」が示すルールが、状態「状態#1」が示す状態となった場合に応答内容「応答内容#1」を応答の内容として出力するルールである旨を示す。より具体的には、このようなルールは、利用者Uとの対話の状態(すなわち、ステート)が「状態#1」となった場合は、「応答内容#1」が示す内容の応答を生成して出力する旨を示す。
なお、「応答内容」は、応答として出力する音声のテキストデータのみならず、どのような外部サーバからどのような情報を収集し、収集した情報を用いてどのようなテキストデータを生成するかといった情報が含まれるものとする。例えば、「応答内容#1」とは、例えば、各種外部サーバから天気予報や乗換案内の情報を収集し、収集した情報を含む定型文の応答を生成する旨を示す。また、図4に示す例では、「ルール#1」、「状態#1」、「処理#1」等といった概念的な値を記載したが、実際には、ルールデータベース32には、ルールを識別する文字列、状態を識別する識別子、意味を示す意味表現や処理の具体的な内容を示す情報が登録されることとなる。
図2に戻り、説明を続ける。制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。図2に示すように、制御部40は、分類部41、推定部42、決定部43、生成部44、判定部45、および学習部46を有する。
分類部41は、利用者Uの発話を対応するドメインに分類する。例えば、分類部41は、利用者端末100から、利用者Uが発声した音声を変換したテキストデータを受付ける。なお、例えば、分類部41は、利用者端末100から利用者Uが発声した音声データを受付け、受付けた音声データをテキストデータに変換してもよい。また、分類部41は、音声データをテキストデータへと変換する所定の外部サーバを介して、利用者端末100から利用者Uが発声した音声のテキストデータを受付けてもよい。
このような場合、分類部41は、利用者Uの発話の内容と対応するドメインを特定する。例えば、分類部41は、各種の文字解析技術や分類技術を用いて、利用者Uの発話の内容やどのような分野に属する内容であるかを判定し、判定結果を推定部42に通知する。なお、分類部41は、発話の分類処理を、SVM等の任意の分類モデルにより実現してよい。
推定部42は、利用者Uから受付けた発話の意味を推定する推定モデルであって、強化学習により学習される推定モデルを用いて、発話の意味を推定する。例えば、推定部42は、利用者Uから受け付けた発話に関連する分野ごとに異なる推定モデルを用いて、発話の意味を推定する。
例えば、推定部42は、分類部41により発話に対応すると判定されたドメインの通知を受付けると、通知されたドメインと対応する推定モデルを推定モデルデータベース31から読み出す。すなわち、推定部42は、発話の意味を推定する推定モデルであって、強化学習により学習が行われる推定モデルを読み出す。そして、推定部42は、利用者Uの発話のテキストデータを推定モデルに入力することにより、発話の内容の意味を示す意味表現を生成する。そして、推定部42は、生成した意味表現を決定部43に出力する。
なお、推定部42は、推定モデルとして、利用者Uの属性に応じて発話の意味を推定する推定モデルを用いて、発話の意味を推定してもよい。例えば、推定部42は、発話元の利用者Uの各種属性を示す属性情報を、利用者端末100や所定の外部サーバ等から取得する。そして、推定部42は、発話のテキストデータと、属性情報とを推定モデルに入力することで、発話の意味を推定してもよい。
決定部43は、推定された意味に基づいて、利用者Uに対する応答の内容を決定する。例えば、決定部43は、利用者Uから受け付けた発話に関連する分野によらずに、推定された意味に応じて、利用者Uに対する応答の内容を決定する。より具体的には、決定部43は、推定部42がドメインに応じた推定モデルにより推定した発話の意味を示す意味表現を取得する。このような場合、決定部43は、推定された意味に基づいて、利用者Uとの対話の状態を判定する。
例えば、決定部43は、利用者Uとの会話がどのような状態であるかを示すステートマシンを保持し、推定部42によって生成された意味表現が示す意味に基づいて、ステートマシンが示す状態を更新する。そして、決定部43は、更新後の状態と対応する応答内容を、ルールデータベース32から特定する。
また、決定部43は、例えば、特定した応答内容が天気予報や乗換案内等といった外部サーバから取得する情報を含む場合、対応する外部サーバ(例えば、第1外部サーバ200等)から情報を取得する。より具体的には、決定部43は、発言の意味として推定部42により推定された出発地や到着地の情報を用いて、乗換案内の検索結果等を取得する。そして、決定部43は、取得した検索結果の内容を含む定型文等を生成し、生成した定型文を応答の内容とする。
このように、決定部43は、発言に対応するドメインによらず、推定された意味に対して予め対応付けられた内容を応答の内容とする。なお、決定部43は、例えば、推定された意味が所定の条件を満たしていない場合は、所定の条件を満たす意味の発話を利用者Uに対して求める内容を、応答の内容として決定してもよい。例えば、決定部43は、スロットフィリングの技術を用いて、検索に必要な各種の情報がそろっていない場合は、かかる情報の入力を利用者Uに対して求める内容を応答の内容として決定してもよい。このような処理は、例えば、ルールデータベース32に、情報検索に必要な一部の検索クエリのみが取得されている旨の状態に対し、応答内容として、必要な他の検索クエリの入力を要求する定型文とが対応付けて登録されることにより実現される。
また、決定部43は、推定された意味を利用者Uに対して問い合わせる内容を応答の内容として決定してもよい。例えば、決定部43は、利用者Uの発話から推定された意味表現では、ステートマシンが示す状態を更新させることができない場合は、利用者Uに対して意味表現が示す意味で合っているか否かを問い合わせる内容を応答の内容としてもよい。また、決定部43は、ルールデータベース32に登録されたルールによらず、所定のタイミングで、意味表現が示す意味で合っているか否かを問い合わせる内容を応答の内容としてもよい。
なお、どのような状態において、どのような意味表現が取得された際に、どのような状態へとステートを更新するかについては、対話システムの構成に応じて任意の設定が可能であり、ステートマシンを用いた周知の対話システムの技術が適用可能である。
生成部44は、決定部43が決定した内容の応答を生成する。例えば、生成部44は、決定部43が決定した内容の定型文を読み上げるための音声データを生成し、生成した音声データを利用者端末100へと送信する。
判定部45は、推定された意味の内容が、適切であるか否かを判定する。例えば、判定部45は、ドメイン「電子商取引」について、推定部42が推定した発話から、「取引対象#A」、「500個」、「注文する」であった場合、第2外部サーバ300にアクセスし、取引対象#Aの購入履歴を参照する。そして、判定部45は、取引対象#Aが購入される際の平均的な購入数と、推定された購入数とを比較し、購入数に所定の数以上の乖離があった場合は、推定した意味に矛盾や乖離が含まれると判定する。
なお、上述した処理以外にも、判定部45は、ドメインに対応する外部サーバが管理する情報と、推定された意味との比較結果に基づいて、推定された意味に矛盾や乖離が含まれるか否かを判定してもよい。また、判定部45は、上述した判定処理を決定部43が応答の内容を決定する前に実行してもよい。このような場合、決定部43は、応答の内容に矛盾や乖離が存在すると判定部45によって判定された場合は、応答の作成を行うための情報を収集する処理や、取引対象の注文などといった応答の作成に伴う各種の処理を実行せずに、利用者Uに対して再度の発話を求める文章等を応答内容として決定しても良い。
学習部46は、推定モデルを用いて推定した意味と、その意味に応じて決定した内容の応答に対する利用者Uの反応とに基づいて、推定モデルの強化学習を行う。例えば、学習部46は、利用者Uの発話#1に対し、推定モデル#1を用いることで応答#1が出力された場合、利用者Uが応答#1に対して発生した発話#2を取得する。このような場合、学習部46は、発話#2の内容に基づいて、利用者Uが応答#1に満足しているか否かを判定する。例えば、学習部46は、発話#2から推定部42が推定した意味が、応答#1に対する同意や好意的な内容を示しているか否かを判定する。
そして、学習部46は、利用者Uが応答#1に満足していると判定した場合は、正の報酬を設定し、利用者Uが応答#1に満足していないと判定した場合は、負の報酬を設定する。そして、学習部46は、応答#1の生成に用いた推定モデル#1の強化学習を行う。この結果、学習部46は、利用者Uとの対話を介して、推定モデルの強化学習を実現できる。
なお、学習部46は、判定部45による判定結果に基づいて、推定モデルの強化学習を実行してもよい。例えば、学習部46は、発話#1から推定モデル#1が推定した意味#1に矛盾や乖離が含まれると判定された場合は、負の報酬を設定し、推定モデル#1の強化学習を行ってもよい。
ここで、図5は、実施形態に係る情報処理装置が実行する処理の概念を示す図である。例えば、情報提供装置10は、利用者Uの発話から、ドメインごとに異なる推定モデルを用いた言語理解処理#1〜#4を実行することで、意味表現を生成する。そして、情報提供装置10は、意味表現から利用者Uとの会話の状態を追跡する状態追跡処理を実行するとともに、状態に応じて応答内容を決定する応答決定処理を実行する。そして、情報提供装置10は、応答決定処理の結果、決定した内容の応答を利用者Uに出力する。
このような処理の流れの下、情報提供装置10は、処理のフロントエンドとなる言語理解処理#1〜#4については、ドメインごとに強化学習を行うことで、発話から意味表現を生成する精度の向上を図る。そして、情報提供装置10は、状態追跡処理や応答決定処理といった対話管理処理については、ルールベースでドメイン共通の汎用的な処理を実行する。
このような情報提供装置10において、新たなドメインの追加を行う場合は、利用者Uとの会話を通じて強化学習が行われる言語理解処理を追加する。この結果、情報提供装置10は、教師あり学習等、比較的多くのデータを用いてモデルの学習を行わずともよいので、ドメインの追加を迅速かつ容易に実現することができる。
〔3.機能構成のバリエーションについて〕
なお、図2に示した推定部42は、それぞれ異なる分野に対応する複数の推定モデルを用いて、発話の意味を推定してもよい。例えば、推定部42は、推定モデルデータベース31に登録された全ての推定モデルを用いて、発話#1の意味を推定する。このような場合、決定部43は、複数の推定モデルによって推定された意味のうち、所定の数以外の推定モデルによって推定された意味に基づいて、応答の内容を決定してもよい。例えば、決定部43は、過半数の推定モデルによって共通して推定された内容の意味に基づき、応答の内容を決定してもよい。
また、複数の推定モデルを用いて意味の推定を行う場合、情報提供装置10は、分類部41を有していなくともよい。また、例えば、分類部41は、発言#1が属する可能性が所定の閾値を超えるドメインが複数存在する場合は、それらのドメインを推定部42に通知する。このような場合、推定部42は、通知された複数のドメインと対応する複数の推定モデルを用いて、発言の内容を推定してもよい。また、学習部46は、意味の推定を行った複数の推定モデルのうち、応答の生成に用いられた意味を推定した推定モデルについて、利用者Uの反応に応じた強化学習を行ってもよい。
また、情報提供装置10は、発話から意味と意味の確度とを推定する推定モデルを用いてもよい。このような場合、推定部42は、推定モデルが確度とともに推定した複数の意味のうち、確度が所定の閾値を超える意味のみを推定結果として採用してもよい。また、決定部43は、推定モデルによって推定された全ての意味について、確度が所定の閾値以下となる場合は、発話の内容が推定された各意味で合っているか否かを問い合わせる内容を、応答の内容として決定してもよい。
〔4.情報提供装置が実行する処理の流れの一例〕
続いて、図6、図7を用いて、情報提供装置10が実行する処理の流れの一例を説明する。図6は、実施形態に係る情報提供装置が実行する決定処理の流れの一例を示すフローチャートである。また、図7は、実施形態に係る情報提供装置が実行する強化学習の流れの一例を示すフローチャートである。
まず、図6を用いて、決定処理の流れの一例を説明する。例えば、情報提供装置10は、利用者Uの発話を受付けると、発話が属するドメインを特定する(ステップS101)。続いて、情報提供装置10は、特定したドメインと対応する推定モデルであって、発話の意味を強化学習する推定モデルを選択する(ステップS102)。そして、情報提供装置10は、選択した推定モデルを用いて、発話の意味を推定する(ステップS103)。また、情報提供装置10は、推定した意味に基づいて、ドメイン共通の処理により、応答内容を決定する(ステップS104)。そして、情報提供装置10は、決定した応答を出力し(ステップS105)、処理を終了する。
続いて、図7を用いて、強化学習の流れの一例を説明する。まず、情報提供装置10は、応答に対する利用者の発話を取得する(ステップS201)。続いて、情報提供装置10は、発話が応答に対して好意的であるか否かを判定する(ステップS202)。そして、情報提供装置10は、判定結果に基づく報酬を設定し、応答を出力した際に用いた推定モデルの強化学習を行い(ステップS203)、処理を終了する。
〔5.変形例〕
上記では、情報提供装置10による決定処理や強化学習の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する提供処理や決定処理のバリエーションについて説明する。
〔5−1.同音異義語、異音同義語の推定について〕
情報提供装置10は、発話から意味を適切に推定することができるのであれば、強化学習において任意の学習を行ってよい。例えば、情報提供装置10は、発話の中に異なる意味が複数存在する単語(すなわち、同音異義語が存在する単語)が含まれる場合は、推定した意味で合っているか否かを利用者Uに対して問い合わせる応答を出力し、かかる応答に対する利用者Uの発話が好意的な内容であるか否かに基づいて、推定モデルの強化学習を行ってもよい。また、情報提供装置10は、利用者Uに意味の問い合わせを行った際に、正しい意味を示す発話を受付けた場合は、かかる発話が示す意味を推定するように、推定モデルの強化学習を行ってもよい。
〔5−2.ドメイン判定処理について〕
また、情報提供装置10は、ドメイン判定処理に用いる分類モデルの強化学習を行ってもよい。すなわち、情報提供装置10は、利用者Uとの対話を通じて学習が行われる分類モデルを用いて、発話が属するドメインの分類を行ってもよい。また、情報提供装置10は、分類モデルと、発話が属するドメインの推定モデルとの強化学習を同時に行ってもよい。
〔5−3.応答決定処理について〕
上述した処理では、情報提供装置10は、所定のルールに基づいて応答内容を決定する応答決定処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、状態追跡処理および応答決定処理を実行するモデルを準備し、教師あり学習や利用者との対話を用いた強化学習を行うことで、対話管理を実現してもよい。
〔5−4.装置構成〕
記憶部30に登録された各データベース31、32は、外部のストレージサーバに保持されていてもよい。また、情報提供装置10は、発話を分類する分類サーバ、ドメインごとに発話の意味を推定する1台または複数台の推定サーバ、推定結果に基づいて応答の内容を決定する決定サーバ、推定モデルの強化学習を行う学習サーバとが連携して動作することにより、実現されてもよい。このような場合、分類サーバには、図2に示す分類部41が配置され、推定サーバには、推定部42が配置され、決定サーバには、決定部43および生成部44が配置され、学習サーバには、判定部45および学習部46が配置されていてもよい。また、ドメインに対応する複数の推定サーバが存在する場合、各推定サーバには、対応するドメインの推定モデルが保持されるとともに、各推定モデルの強化学習を行う学習部が配置されていてもよい。
〔5−5.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
〔5−6.プログラム〕
また、上述した実施形態に係る情報提供装置10は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
〔6.効果〕
上述したように、情報提供装置10は、利用者Uから受付けた発話の意味を推定する推定モデルであって、対話を通じて学習が行われる推定モデルを用いて、発話の意味を推定する。そして、情報提供装置10は、推定された意味に基づいて、利用者Uに対する応答の内容を決定する。このように、情報提供装置10は、対話システムにおいて利用者Uとの対話により学習される推定モデルを用いて、利用者Uの発話の意味を推定するので、学習データの数を削減する結果、新たなドメインの追加を容易にすることができる。
また、情報提供装置10は、利用者Uから受け付けた発話に関連する分野ごとに異なる推定モデルを用いて、発話の意味を推定する。また、情報提供装置10は、利用者Uから受け付けた発話に関連する分野によらずに、推定された意味に応じて、利用者Uに対する応答の内容を決定する。このため、情報提供装置10は、新たなドメインの追加を行う際に、対話システムにおいて利用者Uとの対話により学習される推定モデルを追加することで、新たなドメインの追加を実現できるので、新たなドメインの追加を容易にすることができる。
また、情報提供装置10は、それぞれ異なる分野に対応する複数の推定モデルを用いて、発話の意味を推定し、複数の推定モデルによって推定された意味のうち、所定の数以上の推定モデルによって推定された意味に基づいて、応答の内容を決定する。このため、情報提供装置10は、発話の意味の推定精度を向上させることができる。
また、情報提供装置10は、推定された意味に基づいて、利用者Uとの対話の状態を判定し、判定結果に基づいて、利用者Uに対する応答の内容を決定する。このため、情報提供装置10は、一問一答等といった応答ではなく、利用者Uとの対話の流れを考慮した応答を出力できる。
また、情報提供装置10は、推定された意味に対して予め対応付けられた内容を応答の内容とする。このため、情報提供装置10は、各ドメイン共通のルールベースで、応答を生成することができるので、新たなドメインの追加を容易にすることができる。
また、情報提供装置10は、推定された意味が所定の条件を満たしていない場合は、その所定の条件を満たす意味の発話を利用者Uに対して求める内容を、応答の内容として決定する。このため、情報提供装置10は、応答に必要な情報を効率良く取得することができる。
また、情報提供装置10は、推定モデルとして、利用者Uの属性に応じて発話の意味を推定する推定モデルを用いて、発話の意味を推定する。このため、情報提供装置10は、利用者Uの属性を考慮して、発話の意味を推定することができる。
また、情報提供装置10は、推定モデルを用いて推定した意味と、その意味に応じて決定した内容の応答に対する利用者Uの反応とに基づいて、推定モデルの学習を行う。このため、情報提供装置10は、利用者Uとの対話を介して、推定モデルの学習を実現できる。
また、情報提供装置10は、推定された意味を利用者Uに対して問い合わせる内容を応答の内容として決定する。例えば、情報提供装置10が用いる推定モデルは、発話の意味を、その発話がその意味を有する確度と共に推定する。そして、情報提供装置10は、推定された確度が所定の閾値以下となる場合は、推定された意味を利用者Uに対して問い合わせる内容を応答の内容として決定する。このため、情報提供装置10は、推定モデルの学習に必要な情報を利用者から得ることができる。
また、情報提供装置10は、推定された意味の内容が、適切であるか否かを判定する。そして、情報提供装置10は、判定結果に基づいて、推定モデルの学習を実行する。このため、情報提供装置10は、例えば、推定した意味に矛盾や乖離が含まれるか否かに応じて、推定モデルの学習を実現するので、発話の意味の推定精度を向上させることができる。
例えば、情報提供装置10は、推定モデルとして、利用者Uとの対話を用いて強化学習が行われる推定モデルを用いて、発話の意味を推定する。このため、情報提供装置10は、新たなドメインの追加を容易にすることができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、推定部は、推定手段や推定回路に読み替えることができる。
10 情報提供装置
20 通信部
30 記憶部
31 推定モデルデータベース
32 ルールデータベース
40 制御部
41 分類部
42 推定部
43 決定部
44 生成部
45 判定部
46 学習部
100 利用者端末
200 第1外部サーバ
300 第2外部サーバ

Claims (15)

  1. 利用者から受付けた発話の意味を推定する推定モデルであって、対話を通じて学習が行われる推定モデルを用いて、前記発話の意味を推定する推定部と、
    前記推定部により推定された意味に基づいて、前記利用者に対する応答の内容を決定する決定部と
    を有することを特徴とする決定装置。
  2. 前記推定部は、前記利用者から受け付けた発話に関連する分野ごとに異なる推定モデルを用いて、前記発話の意味を推定する
    ことを特徴とする請求項1に記載の決定装置。
  3. 前記決定部は、前記利用者から受け付けた発話に関連する分野によらずに、前記推定部により推定された意味に応じて、前記利用者に対する応答の内容を決定する
    ことを特徴とする請求項2に記載の決定装置。
  4. 前記推定部は、それぞれ異なる分野に対応する複数の推定モデルを用いて、前記発話の意味を推定し、
    前記決定部は、複数の推定モデルによって推定された意味のうち、所定の数以上の推定モデルによって推定された意味に基づいて、前記応答の内容を決定する
    ことを特徴とする請求項2または3に記載の決定装置。
  5. 前記決定部は、前記推定部により推定された意味に基づいて、前記利用者との対話の状態を判定し、判定結果に基づいて、前記利用者に対する応答の内容を決定する
    ことを特徴とする請求項1〜4のうちいずれか1つに記載の決定装置。
  6. 前記決定部は、前記推定部により推定された意味に対して予め対応付けられた内容を前記応答の内容とする
    ことを特徴とする請求項1〜5のうちいずれか1つに記載の決定装置。
  7. 前記決定部は、前記推定部により推定された意味が所定の条件を満たしていない場合は、当該所定の条件を満たす意味の発話を前記利用者に対して求める内容を、前記応答の内容として決定する
    ことを特徴とする請求項1〜6のうちいずれか1つに記載の決定装置。
  8. 前記推定部は、前記推定モデルとして、前記利用者の属性に応じて前記発話の意味を推定する推定モデルを用いて、前記発話の意味を推定する
    ことを特徴とする請求項1〜7のうちいずれか1つに記載の決定装置。
  9. 前記推定部が前記推定モデルを用いて推定した前記意味と、当該意味に応じて前記決定部が決定した内容の応答に対する前記利用者の反応とに基づいて、前記推定モデルを学習する学習部
    を有することを特徴とする請求項1〜8のうちいずれか1つに記載の決定装置。
  10. 前記決定部は、さらに、前記推定部により推定された意味を前記利用者に対して問い合わせる内容を前記応答の内容として決定する
    ことを特徴とする請求項9に記載の決定装置。
  11. 前記推定部は、前記発話の意味を、当該発話が当該意味を有する確度と共に推定し、
    前記決定部は、前記推定部により推定された確度が所定の閾値以下となる場合は、前記推定部により推定された意味を前記利用者に対して問い合わせる内容を前記応答の内容として決定する
    ことを特徴とする請求項10に記載の決定装置。
  12. 前記推定部により推定された意味の内容が、適切であるか否かを判定する判定部
    を有し、
    前記学習部は、前記判定部による判定結果に基づいて、前記推定モデルの学習を実行する
    ことを特徴とする請求項9〜11のうちいずれか1つに記載の決定装置。
  13. 前記推定部は、前記推定モデルとして、前記利用者との対話を用いて強化学習が行われる推定モデルを用いて、前記発話の意味を推定する
    ことを特徴とする請求項1〜12のうちいずれか1つに記載の決定装置。
  14. 決定装置が実行する決定方法であって、
    利用者から受付けた発話の意味を推定する推定モデルであって、対話を通じて学習が行われる推定モデルを用いて、前記発話の意味を推定する推定工程と、
    前記推定工程により推定された意味に基づいて、前記利用者に対する応答の内容を決定する決定工程と
    を含むことを特徴とする決定方法。
  15. 利用者から受付けた発話の意味を推定する推定モデルであって、対話を通じて学習が行われる推定モデルを用いて、前記発話の意味を推定する推定手順と、
    前記推定手順により推定された意味に基づいて、前記利用者に対する応答の内容を決定する決定手順と
    をコンピュータに実行させるための決定プログラム。
JP2017049089A 2017-03-14 2017-03-14 決定装置、決定方法および決定プログラム Active JP6199517B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017049089A JP6199517B1 (ja) 2017-03-14 2017-03-14 決定装置、決定方法および決定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017049089A JP6199517B1 (ja) 2017-03-14 2017-03-14 決定装置、決定方法および決定プログラム

Publications (2)

Publication Number Publication Date
JP6199517B1 JP6199517B1 (ja) 2017-09-20
JP2018151578A true JP2018151578A (ja) 2018-09-27

Family

ID=59895695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017049089A Active JP6199517B1 (ja) 2017-03-14 2017-03-14 決定装置、決定方法および決定プログラム

Country Status (1)

Country Link
JP (1) JP6199517B1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021131906A1 (ja) * 2019-12-25 2021-07-01 学校法人日本大学 食生活推定装置
JP2021111336A (ja) * 2020-01-08 2021-08-02 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド スキルサービスの更新方法、装置、電子機器、プログラム及び可読記憶媒体
JP2021131528A (ja) * 2020-02-19 2021-09-09 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド ユーザ意図認識方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
WO2022158665A1 (ko) * 2021-01-19 2022-07-28 삼성전자주식회사 전자 장치 및 그 제어 방법
US11915691B2 (en) 2021-01-19 2024-02-27 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114416931A (zh) * 2020-10-28 2022-04-29 华为云计算技术有限公司 标签生成方法、装置及相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339314A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 自動応答方法及び対話解析方法並びに応答文生成方法、その装置、そのプログラムを記録した媒体
JP2015219583A (ja) * 2014-05-14 2015-12-07 日本電信電話株式会社 話題決定装置、発話装置、方法、及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339314A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 自動応答方法及び対話解析方法並びに応答文生成方法、その装置、そのプログラムを記録した媒体
JP2015219583A (ja) * 2014-05-14 2015-12-07 日本電信電話株式会社 話題決定装置、発話装置、方法、及びプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021131906A1 (ja) * 2019-12-25 2021-07-01 学校法人日本大学 食生活推定装置
JP2021103434A (ja) * 2019-12-25 2021-07-15 学校法人日本大学 食生活推定装置
JP7269585B2 (ja) 2019-12-25 2023-05-09 学校法人日本大学 食生活推定装置
JP2021111336A (ja) * 2020-01-08 2021-08-02 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド スキルサービスの更新方法、装置、電子機器、プログラム及び可読記憶媒体
JP7092282B2 (ja) 2020-01-08 2022-06-28 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド スキルサービスの更新方法、装置、電子機器、プログラム及び可読記憶媒体
JP2021131528A (ja) * 2020-02-19 2021-09-09 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド ユーザ意図認識方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
JP7130194B2 (ja) 2020-02-19 2022-09-05 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド ユーザ意図認識方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
US11646016B2 (en) 2020-02-19 2023-05-09 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for recognizing user intention, device, and readable storage medium
WO2022158665A1 (ko) * 2021-01-19 2022-07-28 삼성전자주식회사 전자 장치 및 그 제어 방법
US11915691B2 (en) 2021-01-19 2024-02-27 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof

Also Published As

Publication number Publication date
JP6199517B1 (ja) 2017-09-20

Similar Documents

Publication Publication Date Title
JP6199517B1 (ja) 決定装置、決定方法および決定プログラム
KR102313473B1 (ko) 자동 어시스턴트를 위한 명령 번들 제안 제공
WO2019101083A1 (zh) 一种语音数据处理方法、语音交互设备及存储介质
US11868733B2 (en) Creating a knowledge graph based on text-based knowledge corpora
JP2021534493A (ja) 限られた知識ドメイン内でナレッジグラフを構築するための技術
JP6224857B1 (ja) 分類装置、分類方法および分類プログラム
JP2023520416A (ja) ドメイン外(ood)検出のための改良された技術
US20120259801A1 (en) Transfer of learning for query classification
KR20180022762A (ko) 실시간 답변 메시지 생성을 이용한 고객 상담 서비스 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
US20200027443A1 (en) Task-independent conversational systems
KR20170137419A (ko) 실시간 답변 메시지 생성을 이용한 고객 상담 서비스 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
JP6370962B1 (ja) 生成装置、生成方法および生成プログラム
CN111340220A (zh) 用于训练预测模型的方法和装置
CN117157643A (zh) 利用知识蒸馏的ai nlp编码器的域自适应
JP6824795B2 (ja) 修正装置、修正方法および修正プログラム
AU2022201193A1 (en) System and method for designing artificial intelligence (ai) based hierarchical multi-conversation system
US20190164083A1 (en) Categorical Data Transformation and Clustering for Machine Learning using Natural Language Processing
JP2024508502A (ja) 情報をプッシュする方法および装置
JP2020135689A (ja) モデル学習システム、意図解釈システム、モデル学習方法およびモデル学習用プログラム
CN117575008A (zh) 训练样本生成方法、模型训练方法、知识问答方法及设备
JP6983729B2 (ja) 抽出装置、評価装置、抽出方法および抽出プログラム
US11868886B2 (en) Time-preserving embeddings
US20230106590A1 (en) Question-answer expansion
CN114064854A (zh) 查询文本处理方法、装置、设备及存储介质
JP2019021210A (ja) 特定装置および特定方法

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170823

R150 Certificate of patent or registration of utility model

Ref document number: 6199517

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250