JP6632764B2 - 意図推定装置及び意図推定方法 - Google Patents
意図推定装置及び意図推定方法 Download PDFInfo
- Publication number
- JP6632764B2 JP6632764B2 JP2019514140A JP2019514140A JP6632764B2 JP 6632764 B2 JP6632764 B2 JP 6632764B2 JP 2019514140 A JP2019514140 A JP 2019514140A JP 2019514140 A JP2019514140 A JP 2019514140A JP 6632764 B2 JP6632764 B2 JP 6632764B2
- Authority
- JP
- Japan
- Prior art keywords
- intention
- unit
- estimation
- intentions
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 26
- 238000004458 analytical method Methods 0.000 claims description 128
- 230000000877 morphologic effect Effects 0.000 claims description 82
- 239000002131 composite material Substances 0.000 claims description 77
- 230000010354 integration Effects 0.000 claims description 48
- 150000001875 compounds Chemical class 0.000 claims description 33
- 238000010586 diagram Methods 0.000 description 53
- 230000004044 response Effects 0.000 description 44
- 238000012217 deletion Methods 0.000 description 18
- 230000037430 deletion Effects 0.000 description 18
- 238000013500 data storage Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000009471 action Effects 0.000 description 6
- 238000007619 statistical method Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 235000012054 meals Nutrition 0.000 description 3
- 235000013305 food Nutrition 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
Description
しかしながら、上述したような、1つの発話に対して、実行時に複数のモデルに基づく判定結果を統合する方式では、発話が1つの意図しか含まない場合(以下、単意図発話ともいう)でも、複数のモデルそれぞれに基づく意図推定を行うため、複数の意図が推定されて出力されることがあり、全体として意図の推定精度が低くなる場合があるという課題があった。
実施の形態1.
なお、ナビゲーション装置に搭載される例等は一例に過ぎず、実施の形態1に係る意図推定装置1は、ナビゲーション装置のユーザに限らず、ユーザから発話等によって入力された情報を受け付け、当該受け付けた情報に応じた動作を行うあらゆる装置において、当該装置のユーザの意図を推定する意図推定装置に適用できる。
意図推定装置1は、図1に示すように、音声受付部101と、音声認識部102と、形態素解析部103と、係り受け解析部104と、意図数推定モデル記憶部105と、意図数推定部106と、単意図推定モデル記憶部107と、単意図推定部108と、複合意図推定モデル記憶部109と、複合意図推定部110と、推定結果統合部111と、コマンド実行部112と、応答生成部113と、通知制御部114とを備える。
なお、この実施の形態1では、図1に示すように、意図数推定モデル記憶部105、単意図推定モデル記憶部107、及び、複合意図推定モデル記憶部109は、意図推定装置1に備えられるものとするが、これに限らず、意図数推定モデル記憶部105、単意図推定モデル記憶部107、及び、複合意図推定モデル記憶部109は、意図推定装置1の外部の、意図推定装置1が参照可能な場所に備えられるものとしてもよい。
ここで、形態素解析とは、文字列を、言語として意味を持つ最小単位である形態素に区切り、辞書を利用して品詞を付与する、既存の自然言語処理技術である。例えば、「東京タワーへ行く」という文字列に対して形態素解析が行われると、当該文字列は、「東京タワー/固有名詞、へ/格助詞、行く/動詞」のような形態素に区切られる。
形態素解析部103は、形態素解析結果を、係り受け解析部104及び意図数推定部106に出力する。
係り受け解析部104は、形態素間の関係性の解析結果を、係り受け情報として意図数推定部106に出力する。
図2に例示した意図数推定モデルにおいては、各意図数と、係り受け情報との関連度がスコアとして記述されている。
この実施の形態1では、係り受け情報は、各形態素間の関係性及びその出現件数が“_”で接続される形で表現されている。
例えば図2のように、「並列関係」の関係にある形態素の組が1つの文字列の中に1回出現している場合には、係り受け情報は、「並列関係_1件」となる。
図2に示された係り受け情報のうち、「動作対象_1件」は、一つの文字列に「動作対象」の関係にある形態素の組が1組しかないことを示すため、意図数も「1」となる場合が多い。したがって、図2に示すように、「動作対象_1件」については、意図数「1件」に対するスコアが、意図数「2件」及び「3件」に対するスコアよりも高くなる。これに対し、「並列関係_1件」及び「動作対象_2件」については、いずれも意図数が2以上になる可能性が高いので、意図数「2件」及び「3件」に対するスコアが、意図数「1件」に対するスコアよりも高くなる。このように、意図数推定モデルでは、意図数と係り受け情報の関連度に応じて、当該関連度が高いほど高いスコアが設定されている。
なお、説明を容易にするため、図2では、意図数について、「1件」、「2件」及び「3件」の三種類のみを示している。
この実施の形態1では、図2に例示したような意図数推定モデルを用いて、統計的な手法で、ユーザの意図数を推定する。
意図数推定部106は、推定した意図数に応じて、音声受付部101が受け付けた音声に基づく文字列が、単意図発話であるか、複意図発話であるかを判断し、当該判断結果に応じて、形態素解析部103が出力した、文字列の形態素解析結果を、単意図推定部108、あるいは、複合意図推定部110に出力する。具体的には、意図数推定部106は、音声受付部101が受け付けた音声に基づく文字列が単意図発話による単意図文字列であると判断した場合は、形態素解析部103が出力した、文字列の形態素解析結果を、単意図推定部108に出力する。また、音声受付部101が受け付けた音声に基づく文字列が複意図発話であると判断した場合は、形態素解析部103が出力した、文字列の形態素解析結果を、複合意図推定部110に出力する。
スロット名及びスロット値は、主意図を実行するために必要な情報を示す。例えば、「近くのレストランを検索する」という文字列に含まれる意図は、主意図が「周辺検索」であり、スロット名が「施設種類」であり、スロット値が「レストラン」である。よって、近くのレストランを検索する」という文字列に含まれる意図は、「周辺検索[施設種類=レストラン]」のように表すことができる。
図3に示すように、単意図推定モデルは、「目的地設定[施設=○○]」(○○は具体的な施設名であり、以下同じ)または「周辺検索[施設種類=レストラン]」等の意図に対する各形態素のスコアを表すものである。この実施の形態1の単意図推定モデルにおいて、意図に対する各形態素のスコアとは、意図と各形態素との関連度であり、意図と各形態素との関連度が高いほど、各形態素のスコアは高く設定されている。単意図推定モデルは、図3に示すように、意図と形態素との関連度の学習によって作成された、意図毎に形態素との関係度を対応付けたモデルである。
例えば、図3に示すように、形態素「行く」または「目的地」については、ユーザは目的地設定を意図している可能性が高いので、意図「目的地設定[施設=○○]」における、形態素「行く」または「目的地」のスコアは、他の形態素のスコアよりも高くなる。一方で、形態素「美味しい」または「食事」については、ユーザは周辺レストランの検索を意図している可能性が高いので、意図「周辺検索[施設種類=レストラン]」における、形態素「美味しい」または「食事」のスコアは、他の形態素のスコアよりも高くなる。
複合意図推定モデルは、意図毎に生成された複数の判定用意図推定モデルを含む。
なお、図4では、説明を容易にするため、意図の数は「目的地設定[施設=○○]」(図4A参照)、「周辺検索[施設種類=レストラン]」(図4B参照)、及び「経由地追加[施設=○○]」(図4C参照)の三つとして例を示している。この実施の形態1の複合意図推定モデルにおいて、意図に対する各形態素のスコアとは、意図と各形態素との関連度であり、意図と各形態素との関連度が高いほど、各形態素のスコアは高く設定されている。複合意図推定モデルは、図4に示すように、複数の意図について、別々に、意図と形態素との関連度の学習によって作成され、意図毎に形態素との関係度を対応付けたモデルである。
複合意図推定部110は、複合意図推定モデルに含まれる判定用意図推定モデル毎の判定結果を、推定結果として、推定結果統合部111へ出力する。
推定結果統合部111は、推定した意図の統合結果を、複合意図推定結果としてコマンド実行部112へ出力する。
コマンド実行部112は、コマンド処理部に実行させたコマンドの内容を示す実行操作情報を、応答生成部113に出力する。
応答生成部113が、応答データを音声データの形式で生成する場合、応答生成部113は、例えば、「周辺のレストランを検索しました。リストから選択してください」のような合成音を出力するための音声データを生成すればよい。
応答生成部113は、生成した応答データを、通知制御部114に出力する。
図5A,図5Bは、この発明の実施の形態1に係る意図推定装置1のハードウェア構成の一例を示す図である。
この発明の実施の形態1において、音声認識部102と、形態素解析部103と、係り受け解析部104と、意図数推定部106と、単意図推定部108と、複合意図推定部110と、推定結果統合部111と、コマンド実行部112と、応答生成部113と、通知制御部114の各機能は、処理回路501により実現される。すなわち、意図推定装置1は、受け付けたユーザの発話に関する情報に基づき、ユーザの意図を推定する処理、または、推定した意図に応じた機械コマンドを実行及び通知させる処理の制御を行うための処理回路501を備える。
処理回路501は、図5Aに示すように専用のハードウェアであっても、図5Bに示すようにメモリ505に格納されるプログラムを実行するCPU(Central Processing Unit)506であってもよい。
意図数推定モデル記憶部105、単意図推定モデル記憶部107、及び、複合意図推定モデル記憶部109は、例えば、HDD502を使用する。なお、これは一例にすぎず、意図数推定モデル記憶部105、単意図推定モデル記憶部107、及び、複合意図推定モデル記憶部109は、DVD、またはメモリ505等によって構成されるものであってもよい。
また、意図推定装置1は、ナビゲーション装置等の外部機器との通信を行う、入力インタフェース装置503、及び、出力インタフェース装置504を有する。
音声受付部101は、入力インタフェース装置503で構成される。
まず、意図推定装置1におけるユーザの意図を推定する動作の前提となる、意図数推定モデルの生成処理に関する動作について説明する。
ここでは、意図数推定モデルの生成処理は、意図推定装置1とは別の、意図数推定モデル生成装置2によって行われるものとする。
意図数推定モデル生成装置2は、図6に示すように、学習用データ記憶部115と、形態素解析部103と、係り受け解析部104と、意図数推定モデル生成部116とを備える。
形態素解析部103及び係り受け解析部104の構成及び動作は、図1等を用いて説明した形態素解析部103及び係り受け解析部104の構成及び動作と同様であるため、同じ符号を付して重複した説明を省略する。
図7に示すように、学習用データは、発話等により音声出力される文字列の例示文である発話の文例(以下、発話文例という)に、対応する意図数が付与されたデータである。例えば、発話文例701「○○へ行きたい」については、意図数「1件」が付与されている。
学習用データは、予め、モデルの作成者等によって作成されるものである。モデルの作成者等は、複数の発話文例について、発話文例毎に予め意図数を付与した学習データを作成し、学習用データ記憶部115に記憶させておく。
まず、形態素解析部103は、学習用データ記憶部115に記憶されている学習用データの各文例に対して形態素解析を行う(ステップST801)。例えば、図7の発話文例701の場合、形態素解析部103は、「○○へ行きたい」に対して形態素解析を行い、「○○/名詞、へ/格助詞、行き/動詞、たい/助動詞」という形態素解析結果を得る。形態素解析部103は、形態素解析結果を、係り受け解析部104に出力する。
そして、意図数推定モデル生成部116は、生成した意図数推定モデルを、意図数推定モデル記憶部105に記憶させる。なお、意図数推定モデル記憶部105は、例えば、ネットワークを介して、意図数推定モデル生成装置2がアクセス可能な場所に備えられている。
図10は、実施の形態1に係る意図推定装置1の動作を説明するためのフローチャートである。
ナビゲーション装置が、「ピっと鳴ったらお話ください」という音声を出力すると、当該音声に対し、ユーザが「○○へ行きたい。」と発話する(U1)。なお、図9では、ナビゲーション装置が意図推定装置1から指示を受けて出力する音声を「S」と表し、ユーザからの発話を「U」と表している。
形態素解析部103は、音声認識部102から出力された文字列に対し、形態素解析処理を行う(ステップST1002)。例えば、形態素解析部103は、「○○」、「へ」、「行き」及び「たい」という形態素を得て、当該形態素の情報を、形態素解析結果として係り受け解析部104及び意図数推定部106に出力する。
まず、意図数推定部106は、係り受け解析部104から出力された係り受け情報と意図数推定モデルとを照合し、各意図数に対する各係り受け情報のスコアを取得する(ステップST1101)。
図12に示すように、特徴量とする係り受け情報が「動作対象_1件」である場合、意図数推定部106は、例えば、意図数「1件」に対する特徴量「動作対象_1件」のスコアとして、0.2を取得する。意図数推定部106は、他の意図数についても、同様に、特徴量「動作対象_1件」のスコアを取得する。
図13は、実施の形態1において、意図数推定部106が最終スコアを算出するために用いる計算式を示す図である。
図13において、Sは、推定対象に対する複数の意図数のうち、最終スコアの算出対象としたある意図数(以下、対象意図数という)の最終スコアである。また、図13において、Siは、対象意図数に対するi番目の特徴量のスコアである。
意図数推定部106は、図13に示す計算式を用いて、図14に示す最終スコアを算出する。この例では、特徴量となる係り受け情報は「動作対象_1件」の1つであるため、最終スコアと特徴量「動作対象_1件」に対応するスコアは同じである。
図14に示したように、意図数「1件」に対して、特徴量「動作対象_1件」のスコアは0.2となり、最終スコアSも0.2となる。意図数推定部106は、同様に、他の意図数についても、それぞれ最終スコアを算出する。
意図数推定部106は、ステップST1102において算出した各意図数の最終スコアに基づき、意図数を推定する(ステップST1103)。具体的には、意図数推定部106は、算出した推定対象の各意図数のうち、最も高い最終スコアを有する意図数を、推定対象の意図数として推定する。
ここでは、意図数推定部106は、意図数「1件」を意図数として推定する。
意図数推定部106は、ステップST1004で意図数を推定した結果、意図数が1より大きいかどうかを判定する(ステップST1005)。
ステップST1005において、推定した意図数が1より大きい場合(ステップST1005の“YES”の場合)、ステップST1010〜ステップST1014へ進む。ステップST1005において、推定した意図数が1より大きくなった場合の、ステップST1010以降の処理の詳細については、具体例をあげて後述する。
例えば、図9のU1の例では、意図数推定部106は意図数を推定した結果、意図数が「1」であるため、ステップST1006へ進む。
ステップST1006において、意図数推定部106は、ステップST1002において形態素解析部103が形態素解析した形態素解析結果である文字列を単意図推定部108に出力する。そして、単意図推定部108は、単意図推定モデル記憶部107に記憶された単意図推定モデル(図3参照)を用いて、形態素解析結果である文字列、すなわち、単意図発話文に対して、ユーザの意図を推定する(ステップST1006)。例えば、文字列が「○○へ行きたい。」である場合、「目的地設定[施設=○○]」をユーザの意図と推定する。具体的には、単意図推定部108は、単意図推定モデルを用いて、形態素解析部103による、文字列の形態素解析結果のスコアが一番大きくなる意図を、ユーザの意図と推定する。
単意図推定部108は、当該意図推定結果を、単意図推定結果としてコマンド実行部112に出力する。
また、コマンド実行部112は、ステップST1007で実行させたコマンドの内容を示す実行操作情報を、応答生成部113に出力する。
「U2」で示すようにユーザが発話すると、音声受付部101が当該発話による音声を受け付け、音声認識部102は、受け付けた発話による音声に対して音声認識処理を行い(ステップST1001)、文字列に変換する。音声認識部102は、変換した文字列を形態素解析部103に出力する。
形態素解析部103は、音声認識部102から出力された文字列に対し、形態素解析処理を行う(ステップST1002)。例えば、形態素解析部103は、「△△」、「も」、「寄っ」、「て」、「高速道路」、「を」、「選択し」及び「て」の形態素を得、当該形態素の情報を、形態素解析結果として係り受け解析部104に出力する。
ステップST1004の具体的な動作は、上記のように、図11を用いて詳細に説明したとおりであるが、まず、「U1」の場合の処理と同じように、意図数推定部106は、係り受け解析部104から出力された係り受け情報と意図数推定モデルを照合し、各意図数に対する各係り受け情報のスコアを取得する(図11のステップST1101参照)。
続いて、意図数推定部106は、図13で示した計算式より、推定対象の意図数に対する最終スコアを算出する(図11のステップST1102参照)。
意図数推定部106は、図13に示す計算式を用いて、ユーザによる発話「U2」に対して、図15に示す最終スコアを算出する。ここでは、意図数「1件」に対して、特徴量「動作対象_2件」のスコアは0.01、「並列関係_1件」のスコアは0.01となる。その結果、意図数推定部106は、発話「U2」に対する意図数「1件」の最終スコアSを1e−4(=0.0001)と算出する。意図数推定部106は、同様に、発話「U2」に対する他の意図数についても、それぞれ最終スコアを算出する。
意図数推定部106は、ステップST1004で意図数を推定した結果、意図数が1より大きいかどうかを判定する(ステップST1005)。
ステップST1005において、推定した意図数が1より大きい場合(ステップST1005の“YES”の場合)、ステップST1010へ進む。
ここでは、推定した意図数は1より大きい「2件」であるため(ステップST1005の“YES”の場合)、ステップST1010に進む。
図16では、説明を容易にするため、複合意図推定モデル記憶部109に記憶されている複合意図推定モデルとして、意図「経由地追加[施設=△△]」の判定用意図推定モデル、意図「ルート変更[高速道路優先]」の判定用意図推定モデル、及び、意図「目的地設定[施設=△△]」の判定用意図推定モデルの三つのモデルがあるものとして説明する。すなわち、複合意図推定部110は、形態素解析部103による形態素解析結果である文字列が、この三つの意図に該当するかどうかについて判定する。複合意図推定部110は、上記三つの判定用意図推定モデルを用いて判定する意図に対する意図推定スコアが0.5を超えた場合に、当該意図推定スコアが0.5を超えたと判定された意図を、該当意図であると判定するものとする。
なお、意図推定スコアとは、各形態素のスコアを足したものを元に算出される確率値をいう。よって、各判定用意図推定モデルにおいて意図推定スコアを合計すると「1」となる。
図16において、図16Bは、意図「ルート変更[高速道路優先]」の判定用意図推定モデルの判定結果である。複合意図推定部110は、意図推定スコアが0.7であり、0.5を超えるため(図16B参照)、意図「ルート変更[高速道路優先]」も「U2」の文字列の該当意図であると判定する。
図16において、図16Cは、意図「目的地設定[施設=△△]」の判定用意図推定モデルの判定結果である。複合意図推定部110は、意図「目的地設定[施設=△△]」の意図推定スコアが0.5以下であるため、意図「目的地設定[施設=△△]」ではなく、「他の意図」が「U2」の文字列の該当意図であると判定する。
一方、図16Cに示すように、意図「目的地設定[施設=△△]」の判定用意図推定モデルの判定結果は、「他の意図」であるため、推定結果統合部111は、意図「目的地設定[施設=△△]」も「他の意図」も統合結果には加えない。
推定結果統合部111は、推定した意図の統合結果を、複合意図推定結果としてコマンド実行部112へ出力する。
また、コマンド実行部112は、ステップST1012で実行させたコマンドの内容を示す実行操作情報を、応答生成部113に出力する。
実施の形態1では、ユーザの発話から、ユーザの意図が2以上であると推定した場合、複合意図推定部110が推定した複合意図推定結果を推定結果統合部111が統合し、コマンド実行部112が、当該統合された複合意図推定結果に対応するコマンドをナビゲーション装置に実行させるようにしていた。
この実施の形態2では、さらに、複合意図推定部110が推定した複合意図推定結果の意図数に上限を設定する実施の形態について説明する。
以下、図面を用いて本発明の実施の形態2について説明する。
この実施の形態2の意図推定装置1Bは、実施の形態1において図1を用いて説明した意図推定装置1とは、推定結果選択部117を備える点において異なる。意図推定装置1Bのその他の構成については、実施の形態1において図1を用いて説明した意図推定装置1の構成と同様であるので、意図推定装置1と同様の構成については、図1と同一の符号を付して重複した説明を省略する。
なお、この実施の形態2では、推定結果統合部111は、推定した意図の統合結果である複合意図推定結果を推定結果選択部117に出力する。このとき、推定結果統合部111は、意図推定スコアについても、複合意図推定結果に含めて、推定結果選択部117に出力する。
また、この実施の形態2では、意図数推定部106は、推定した意図数の情報を、推定結果選択部117に出力するようにする。
ここで、図19は、実施の形態2において、ユーザとナビゲーション装置との間で行われる対話例を示す図である。
図20は、実施の形態2における意図推定装置1Bの動作を説明するためのフローチャートである。
ナビゲーション装置が、「ピっと鳴ったらお話ください。」という音声を出力すると、当該音声に対し、ユーザが「○○は寄らなくていい、近くにコンビニある?」と発話する(U01)。なお、ここでは、図19に示すように、ナビゲーション装置が意図推定装置1Bから指示を受けて出力する音声を「S」と表し、ユーザからの発話を「U」と表している。
次に、係り受け解析部104が文字列に対して係り受け解析処理を行う(ステップST2003)。例えば、「○○」が「寄ら」の動作の対象であり、「コンビに」が「ある」の動作の対象であり、また、動作「いい」と「ある」は「並列関係」であるため、係り受け解析部104は、「動作対象_2件」、「並列関係_1件」との解析結果を、係り受け情報とし、意図数推定部106に出力する。
そして、係り受け解析部104から出力された係り受け情報を用いて、意図数推定部106が意図数を推定する(ステップST2004)。ここでは、意図数推定部106が推定した意図数が「2件」となり(実施の形態1で説明した図11のステップST1104参照)、推定された意図数が「1」より大きいため(ステップST2005の“YES”の場合)、ステップST2010以後の処理に移る。ここまでは実施の形態1で説明した図10のステップST1001〜1005と同様である。
図21では、説明を容易にするため、複合意図推定モデル記憶部109に記憶されている複合意図推定モデルとして、意図「経由地削除[施設=○○]」の判定用意図推定モデル、意図「周辺検索[施設種類=コンビニ]」の判定用意図推定モデル、意図「ルート削除」の判定用意図推定モデルの三つのモデルがあるものとして説明する。なお、実施の形態1と同様、意図数推定部106は、上記三つの判定用意図推定モデルを用いて判定する意図に対する意図推定スコアが0.5を超えた場合に、当該意図推定スコアが0.5を超えたと判定された意図を、該当意図であると判定するものとする。
図21において、図21Bは、意図「周辺検索[施設種類=コンビニ]」判定用意図推定モデルの判定結果であり、図21Cは、意図「ルート削除」判定用意図推定モデルの判定結果である。複合意図推定部110は、意図推定スコアが0.7であり、0.5を超えるため(図21B参照)、意図「周辺検索[施設種類=コンビニ]」も「U01」の文字列の該当意図であると判定する。また、複合意図推定部110は、意図推定スコアが0.55であり、0.5を超えるため(図21C参照)、「ルート削除」も「U01」の文字列の該当意図であると判定する。
複合意図推定部110は、図21A〜図21Cで示す三つの意図推定モデルにより得た該当意図である、「経由地削除[施設=○○]」、「周辺検索[施設種類=コンビニ]」、及び、「ルート削除」を推定結果統合部111に出力する。
推定結果統合部111は、推定した意図の統合結果を、複合意図推定結果として推定結果選択部117へ出力する。
具体的には、推定結果選択部117は、意図数推定部106から出力された意図数を意図出力上限とし、意図推定スコアを判断基準として、当該意図推定スコアの上位の推定意図のみを選択する。
また、図22で示したように意図推定スコアは、「経由地削除[施設=○○]」が「0.65」、「周辺検索[施設種類=コンビニ]」が「0.7」、「ルート削除」が「0.55」である。
推定結果選択部117は、意図数推定部106から出力された意図数を意図出力上限とし、複合意図推定結果の意図推定スコアの上位二つを選択して、最終意図推定結果として出力するので、推定結果選択部117は、「経由地削除[施設=○○]」及び「周辺検索[施設種類=コンビニ]」を選択し、最終意図推定結果とすることになる。
図23は、実施の形態2において、推定結果選択部117により生成された最終意図推定結果の内容の一例を示す図である。
推定結果選択部117は、最終意図推定結果をコマンド実行部112に出力する。
また、応答生成部113は、コマンド実行部112がコマンド処理部に実行させたコマンドに対応する応答データを生成し(ステップST2014)、通知制御部114は、応答生成部113が生成した応答データを、ナビゲーション装置が備えるスピーカから出力させる(ステップST2015)。その結果、図19の「S02」に示すように、「経由地○○を削除しました。」「周辺のコンビニを検索します。リストから選択してください。」等の音声が出力され、ユーザへの、実行されたコマンドの通知を行うことができる。具体的な動作は、実施の形態1で説明した、図10のステップST1012〜ステップST1014と同じである。
Claims (6)
- 取得した文字列に基づき当該文字列に含まれる形態素の解析を行う形態素解析部と、
前記形態素解析部が解析した形態素に基づき、前記文字列に含まれる形態素間の関係性を解析し、係り受け情報を生成する係り受け解析部と、
前記係り受け解析部が生成した係り受け情報と意図数との対応関係を示す情報を用いて、前記文字列に対する意図数を推定し、推定した意図数に応じて、当該文字列が、一つしか意図を含まない単意図文字列であるか、複数の意図を含む複意図文字列であるかを判断する意図数推定部と、
前記意図数推定部が、前記文字列は単意図文字列であると判断した場合、前記形態素解析部が解析した形態素に基づき、意図毎に形態素との関連度が対応付けられた単意図推定モデルを用いて、当該単意図文字列に対する意図を単意図として推定する単意図推定部と、
前記意図数推定部が、前記文字列は複意図文字列であると判断した場合、前記形態素解析部が解析した形態素に基づき、複数の意図毎に形態素との関連度が対応付けられた複合意図推定モデルを用いて、当該複意図文字列に対する複数の意図を推定する複合意図推定部と、
前記複合意図推定部が推定した複数の意図を複合意図として統合する推定結果統合部
とを備えた意図推定装置。 - 前記意図数推定部は、
前記係り受け情報を特徴量とし、前記係り受け情報と意図数との対応関係を学習した意図数推定モデルを用いて、前記文字列に対する意図数を推定する
ことを特徴とする請求項1記載の意図推定装置。 - 前記意図数推定部が推定した意図数を上限として、前記推定結果統合部が統合した複数の意図のうち、前記意図数推定部が意図数を推定する際に算出した意図推定スコアの上位の意図を選択し、前記複合意図とする推定結果選択部を備えた
ことを特徴とする請求項1記載の意図推定装置。 - 形態素解析部が、取得した文字列に基づき当該文字列に含まれる形態素の解析を行うステップと、
係り受け解析部が、前記形態素解析部が解析した形態素に基づき、前記文字列に含まれる形態素間の関係性を解析し、係り受け情報を生成するステップと、
意図数推定部が、前記係り受け解析部が生成した係り受け情報と意図数との対応関係を示す情報を用いて、前記文字列に対する意図数を推定し、推定した意図数に応じて、当該文字列が、一つしか意図を含まない単意図文字列であるか、複数の意図を含む複意図文字列であるかを判断するステップと、
単意図推定部が、前記意図数推定部が、前記文字列は単意図文字列であると判断した場合、前記形態素解析部が解析した形態素に基づき、意図毎に形態素との関連度が対応付けられた単意図推定モデルを用いて、当該単意図文字列に対する意図を単意図として推定するステップと、
複合意図推定部が、前記意図数推定部が、前記文字列は複意図文字列であると判断した場合、前記形態素解析部が解析した形態素に基づき、複数の意図毎に形態素との関連度が対応付けられた複合意図推定モデルを用いて、当該複意図文字列に対する複数の意図を推定するステップと、
推定結果統合部が、前記複合意図推定部が推定した複数の意図を複合意図として統合するステップ
とを備えた意図推定方法。 - 前記意図数推定部は、
前記係り受け情報を特徴量とし、前記係り受け情報と意図数との対応関係を学習した意図数推定モデルを用いて、前記文字列に対する意図数を推定するステップを有する
ことを特徴とする請求項4記載の意図推定方法。 - 推定結果選択部が、前記意図数推定部が推定した意図数を上限として、前記推定結果統合部が統合した複数の意図のうち、前記意図数推定部が意図数を推定する際に算出した意図推定スコアの上位の意図を選択し、前記複合意図とするステップを備えた
ことを特徴とする請求項4記載の意図推定方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/022144 WO2018229937A1 (ja) | 2017-06-15 | 2017-06-15 | 意図推定装置及び意図推定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018229937A1 JPWO2018229937A1 (ja) | 2019-07-11 |
JP6632764B2 true JP6632764B2 (ja) | 2020-01-22 |
Family
ID=64659078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019514140A Active JP6632764B2 (ja) | 2017-06-15 | 2017-06-15 | 意図推定装置及び意図推定方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6632764B2 (ja) |
WO (1) | WO2018229937A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023208504A1 (de) | 2022-04-29 | 2023-11-02 | Siemens Mobility GmbH | Fahrzeug mit brennstoffzellensystem und aufbereitungsvorrichtung zur aufbereitung des prozesswassers |
KR102490519B1 (ko) * | 2022-07-21 | 2023-01-19 | 주식회사 라피치 | 발신자의 텍스트데이터에 대응하여 암호화를 하는 개인정보 보호 기능을 가지는 자동응답 시스템 및 방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000200273A (ja) * | 1998-11-04 | 2000-07-18 | Atr Interpreting Telecommunications Res Lab | 発話意図認識装置 |
WO2016120904A1 (ja) * | 2015-01-28 | 2016-08-04 | 三菱電機株式会社 | 意図推定装置及び意図推定方法 |
-
2017
- 2017-06-15 WO PCT/JP2017/022144 patent/WO2018229937A1/ja active Application Filing
- 2017-06-15 JP JP2019514140A patent/JP6632764B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2018229937A1 (ja) | 2019-07-11 |
WO2018229937A1 (ja) | 2018-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10269346B2 (en) | Multiple speech locale-specific hotword classifiers for selection of a speech locale | |
JP6556575B2 (ja) | 音声処理装置、音声処理方法及び音声処理プログラム | |
CN106328127B (zh) | 语音识别设备,语音识别方法和电子装置 | |
US10037758B2 (en) | Device and method for understanding user intent | |
US8972260B2 (en) | Speech recognition using multiple language models | |
US8731926B2 (en) | Spoken term detection apparatus, method, program, and storage medium | |
JP6328260B2 (ja) | 意図推定装置及び意図推定方法 | |
JP6400936B2 (ja) | 音声検索方法、音声検索装置、並びに、音声検索装置用のプログラム | |
KR20190100334A (ko) | 문맥상의 핫워드들 | |
US20160104482A1 (en) | Dynamically biasing language models | |
JP4410265B2 (ja) | 音声認識装置及び方法 | |
US10586528B2 (en) | Domain-specific speech recognizers in a digital medium environment | |
US20140350934A1 (en) | Systems and Methods for Voice Identification | |
KR20140025361A (ko) | 위치-기반 대화 해석 | |
JP4515054B2 (ja) | 音声認識の方法および音声信号を復号化する方法 | |
JP6275354B1 (ja) | 意図推定装置及び意図推定方法 | |
KR20170035529A (ko) | 전자 기기 및 그의 음성 인식 방법 | |
US11257482B2 (en) | Electronic device and control method | |
JP7058574B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR102120751B1 (ko) | 대화 이해 ai 시스템에 의하여, 머신러닝을 대화 관리 기술에 적용한 하이브리드 계층적 대화 흐름 모델을 기초로 답변을 제공하는 방법 및 컴퓨터 판독가능 기록 매체 | |
JP6632764B2 (ja) | 意図推定装置及び意図推定方法 | |
JP2021033051A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5980101B2 (ja) | 音響モデル学習用テキスト作成装置とその方法とプログラム | |
US20220392439A1 (en) | Rescoring Automatic Speech Recognition Hypotheses Using Audio-Visual Matching | |
JP3911246B2 (ja) | 音声認識装置、及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190313 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190313 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190403 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6632764 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |