JP7055764B2 - 対話制御システム、対話制御方法及びプログラム - Google Patents

対話制御システム、対話制御方法及びプログラム Download PDF

Info

Publication number
JP7055764B2
JP7055764B2 JP2019046452A JP2019046452A JP7055764B2 JP 7055764 B2 JP7055764 B2 JP 7055764B2 JP 2019046452 A JP2019046452 A JP 2019046452A JP 2019046452 A JP2019046452 A JP 2019046452A JP 7055764 B2 JP7055764 B2 JP 7055764B2
Authority
JP
Japan
Prior art keywords
keyword
attribute
input
weight
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019046452A
Other languages
English (en)
Other versions
JP2020149369A (ja
Inventor
優佳 小林
浩司 藤村
憲治 岩田
尚水 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2019046452A priority Critical patent/JP7055764B2/ja
Priority to CN201910753635.1A priority patent/CN111694933A/zh
Priority to US16/798,711 priority patent/US11783129B2/en
Publication of JP2020149369A publication Critical patent/JP2020149369A/ja
Application granted granted Critical
Publication of JP7055764B2 publication Critical patent/JP7055764B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施形態は対話制御システム、対話制御方法及びプログラムに関する。
例えば、ユーザが自然文を入力して、自然文から必要な情報を抽出し、自然文で応答を返す対話制御システムでは、システムの知識にない未知のキーワードが入力される場合がある。未知のキーワードを正しく解析するためには、未知のキーワードをシステムの知識に追加する必要がある。商品名や流行語など、ユーザが使用するキーワードは日々新規のものが出現するため、その都度、キーワードを知識に追加する必要がある。また、自然文等の入力情報からキーワードの属性を推定し、当該属性を対話制御に利用する技術が従来から知られている。
特開2002-288155号公報 特開2008-293302号公報
しかしながら、従来の技術では、入力情報に含まれるキーワードの属性の推定精度を向上させることが難しかった。
実施形態の対話制御システムは、変換部と第1推定部と第2推定部と重み決定部と属性決定部とを備える。検出部は、入力情報から入力キーワードを検出する。変換部は、前記入力情報を、前記入力キーワードを含む情報と、前記入力情報の前記入力キーワード以外の部分を含む文脈情報と、に変換する。第1推定部は、前記文脈情報から、前記入力キーワードの第1属性と、前記第1属性の尤度を示す第1尤度とが関連付けられた第1推定情報を少なくとも1つ推定する。第2推定部は、前記入力キーワードから、前記入力キーワードの第2属性と、前記第2属性の尤度を示す第2尤度とが関連付けられた第2推定情報を少なくとも1つ推定する。重み決定部は、前記第1尤度の重みを示す第1重みを、前記第1推定部により推定された少なくとも1つの第1尤度の値に基づいて決定し、前記第2尤度の重みを示す第2重みを、前記第2推定部により推定された少なくとも1つの第2尤度の値に基づいて決定する。属性決定部は、前記第1推定情報、前記第1重み、前記第2推定情報、及び、前記第2重みに基づいて、前記入力キーワードの属性を決定する。
第1実施形態の対話制御システムの機能構成の例を示す図。 第1実施形態の属性決定方法の例1を示すフローチャート。 第1実施形態の属性決定方法の例2を示すフローチャート。 第1実施形態のキーワードリストの例を示す図。 第1実施形態の変形例の対話制御システムの機能構成の例を示す図。 第2実施形態の対話制御システムの機能構成の例を示す図。 第2実施形態の属性決定方法の例を示すフローチャート。 第2実施形態の変形例の対話制御システムの機能構成の例を示す図。 第3実施形態の対話制御システムの機能構成の例を示す図。 第3実施形態の対話制御方法の例を示すフローチャート。 第4実施形態の対話制御システムの機能構成の例を示す図。 第4実施形態のコンテンツの例を示す図。 第4実施形態の検索方法の例1を示すフローチャート。 第4実施形態の検索方法の例2を示すフローチャート。 第1乃至第4実施形態のハードウェア構成の例を示す図。
以下に添付図面を参照して、対話制御システム、対話制御方法及びプログラムの実施形態を詳細に説明する。
(第1実施形態)
[機能構成の例]
図1は第1実施形態の対話制御システム10の機能構成の例を示す図である。第1実施形態の対話制御システム10は、検出部101、変換部102、第1推定部103、第2推定部104及び属性決定部105を備える。本対話制御システム10は、入力情報(例えば発話文)から入力キーワードを検出し、当該入力キーワードの属性を推定する。属性及び入力キーワードは、対話制御に使用される。具体的には、属性及び入力キーワードは、例えば検索タスク、及び、質問に応答するアプリケーション等で使用される。
検出部101は、入力情報から入力キーワードを検出する。検出部101は、入力情報が、日本語などの単語が分割されていない言語の場合、形態素解析を行い、発話文を単語に分割する。
キーワードを検出する方法はいくつか考えられる。以下に例をあげる。
一つ目のキーワード検出方法の例は、検出対象のキーワードのリストを用意しておき、そのキーワードが発話文に含まれていればキーワードとして検出する方法である。
二つ目のキーワード検出方法の例は、検出対象のキーワードが使われる文脈、例えば「この辺で_が食べられるお店」のような文脈のテンプレートのリストを用意しておき、そのテンプレートが発話文に含まれていれば「_」の部分をキーワードとして検出する方法である。
三つ目のキーワード検出方法の例は、検出対象のキーワードが含まれる複数の発話文と、検出対象のキーワードの箇所を示すラベルとを含む学習データを用いて機械学習モデルを作成し、当該機械学習モデルを用いてキーワードを検出する方法である。
変換部102は、入力情報を、入力キーワードを含む情報と、当該入力情報の当該入力キーワード以外の部分を含む文脈情報と、に変換する。
例えば「お寿司屋さんに行きたい」という発話文が入力情報である場合、入力キーワードの最小単位は「寿司」である。また、入力キーワードを含む情報は、「お寿司屋さん」及び「お寿司屋さんに行きたい」等である。
文脈情報は、例えば入力情報に含まれる情報のうち、入力キーワード以外の情報である。一番長い文脈情報の例は、入力キーワード以外を全て含む文である。例えば「お寿司屋さんに行きたい」という発話文で入力キーワードが「寿司」だった場合に、文脈情報は入力キーワード部分をマスクした「お_さんに行きたい」である。また、文脈情報は、入力キーワードに付随する情報もマスクして、「_に行きたい」及び「_行きたい」などでもよい。
なお、文脈情報に、入力キーワードの一部又は全部を含めるようにしてもよい。例えば、入力情報が「フードストアに行きたい」であり、入力キーワードが「フードストア」である場合、文脈情報は、「_ストアに行きたい」のように、入力キーワードの一部を含んでいてもよい。また例えば、文脈情報は、「フードストアに行きたい」のように、入力キーワードの全部を含んでいてもよい。
変換部102は、文脈情報を第1推定部103に入力し、入力キーワードを第2推定部104に入力する。
第1推定部103は、文脈情報から、入力キーワードの第1属性と、第1属性の尤度を示す第1尤度とが関連付けられた第1推定情報を少なくとも1つ推定する。キーワードから推定される属性と区別するため、文脈情報から推定される属性を第1属性と称する。第1尤度及び第1推定情報についても同様である。第1尤度の範囲は、例えば0~1である。
第2推定部104は、入力キーワードから、入力キーワードの第2属性と、第2属性の尤度を示す第2尤度とが関連付けられた第2推定情報を少なくとも1つ推定する。文脈情報から推定される属性と区別するため、キーワードから推定される属性を第2属性と称する。第2尤度及び第2推定情報についても同様である。第2尤度の範囲は、例えば0~1である。
属性決定部105は、第1推定情報及び第2推定情報に基づいて、入力キーワードの属性を決定する。
[属性決定方法の例1]
図2Aは第1実施形態の属性決定方法の例1を示すフローチャートである。図2Aでは、入力情報が「和食が食べたい」という発話文である場合について説明する。「和食」は、対話制御システム10にとって既知のキーワードであるとする。
はじめに、検出部101が、入力情報「和食が食べたい」からキーワード「和食」を検出する(ステップs101)。次に、変換部102が、入力情報「和食が食べたい」を、キーワード「和食」と、文脈情報「_が食べたい」に変換する(ステップs102)。変換部102は、キーワード「和食」を第2推定部104に入力し、文脈情報「_が食べたい」を第1推定部103に入力する。
次に、第2推定部104が、キーワード「和食」から、キーワードの第2属性を推定する(ステップs103)。このとき、第2推定部104は、第2属性とともに第2尤度を推定する。キーワード「和食」は、対話制御システムにとって既知のキーワードであり、キーワード「和食」の属性がfoodであるという知識も保持しているため、p(food)=0.9という高い第2尤度が推定される。また、キーワード「和食」から、p(item)=0.1という低い第2尤度が推定される。
次に、第1推定部103が、文脈情報から、キーワード「和食」の第1属性を推定する(ステップs104)。このとき、第1推定部103は、第1属性とともに第1尤度を推定する。ステップS104では、「_が食べたい」という文脈情報から第1属性foodが推定される。「_が食べたい」という文脈情報は、属性foodで使われるので、p(food)=0.8という高い第1尤度が推定される。また、「_が食べたい」という文脈情報から、p(item)=0.1という低い第1尤度が推定される。
次に、属性決定部105が、ステップS103の処理により推定された第2尤度と、ステップS104の処理により推定された第1尤度とを使用して、キーワード「和食」の属性を決定する(ステップS105)。図2Aの例では、属性決定部105が、属性foodの第1尤度及び第2尤度の平均値0.85と、属性itemの第1尤度及び第2尤度の平均値0.1と、を比較し、平均値が高い方の属性foodを、キーワード「和食」の属性に決定する。
[属性決定方法の例2]
図2Bは第1実施形態の属性決定方法の例2を示すフローチャートである。図2Bでは、入力情報が「ふわふわリング食べたい」という発話文である場合について説明する。「ふわふわリング」は、対話制御システム10にとって未知のキーワードであるとする。「ふわふわリング」はここではドーナツの商品名として使用しており、属性はfoodになるのが正しい。
はじめに、検出部101が、入力情報「ふわふわリング食べたい」からキーワード「ふわふわリング」を検出する(ステップs101)。次に、変換部102が、入力情報「ふわふわリング食べたい」を、キーワード「ふわふわリング」と、文脈情報「_食べたい」に変換する(ステップs102)。変換部102は、キーワード「ふわふわリング」を第2推定部104に入力し、文脈情報「_食べたい」を第1推定部103に入力する。
次に、第2推定部104が、キーワード「ふわふわリング」から、キーワードの第2属性を推定する(ステップs103)。このとき、第2推定部104は、第2属性とともに第2尤度を推定する。キーワード「ふわふわリング」は、対話制御システムにとって未知のキーワードであり、キーワード「ふわふわリング」の属性がfoodであるという知識も保持していない。そのため、p(food)=0.3、及び、p(item)=0.4という低い第2尤度が推定され、キーワード「ふわふわリング」からは、属性を1つに決定できない。
次に、第1推定部103が、文脈情報から、キーワード「ふわふわリング」の第1属性を推定する(ステップs104)。このとき、第1推定部103は、第1属性とともに第1尤度を推定する。ステップS104では、「_食べたい」という文脈情報から属性foodが推定される。「_食べたい」という文脈情報は、属性foodで使われるので、p(food)=0.8という高い第1尤度が推定される。また、「_食べたい」という文脈情報から、p(item)=0.1という低い第1尤度が推定される。
次に、属性決定部105が、ステップS103の処理により推定された第2尤度と、ステップS104の処理により推定された第1尤度とを使用して、キーワード「ふわふわリング」の属性を決定する(ステップs105)。図2Bの例では、属性決定部105が、属性foodの第1尤度及び第2尤度の平均値0.55と、属性itemの第1尤度及び第2尤度の平均値0.25と、を比較し、平均値が高い方の属性foodを、キーワード「ふわふわリング」の属性に決定する。このように未知のキーワードについては第2属性の推定精度が低いが、第1推定部103が、文脈情報を使用して第1属性を推定することで、最終的にはキーワードの正しい属性を出力することができる。
第1推定部103によって、第1属性を推定する方法はいくつか考えられる。以下に例をあげる。
一つ目の第1属性推定方法は、各属性に対して、その属性のキーワードが使われる文脈(例えば「この辺で_が食べられるお店」等)のテンプレートを用意し、そのテンプレートが入力情報(例えば発話文)に含まれていれば該当する第1属性を推定する方法である。
二つ目の第1属性推定方法は、学習対象の学習キーワードが含まれる複数の文と、文に含まれる学習キーワードの位置及び属性を示すラベルと、を含む学習データによって機械学習された第1属性推定モデルを用いて、第1属性を推定する方法である。
第2推定部104によって、第2属性を推定する方法はいくつか考えられる。以下に例をあげる。
一つ目の第2属性推定方法は、キーワードリストを用いて、第2属性を推定する方法である。
図3は第1実施形態のキーワードリスト201の例を示す図である。キーワードリスト201は、属性毎に1以上のサンプルキーワードを関連付けて記憶する。例えば、第2属性がfoodである場合、「和食」、「洋食」及び「スイーツ」等のサンプルキーワードが関連付けられている。
第2推定部104は、属性毎に1以上のサンプルキーワードが関連付けられたキーワードリストを参照して、入力キーワードが、サンプルキーワードとしてキーワードリスト201に含まれているか否かを判定する。そして、第2推定部104は、入力キーワードが、サンプルキーワードとしてキーワードリスト201に含まれている場合、サンプルキーワードに関連付けられた属性によって、入力キーワードの第2属性を推定する。
二つ目の第2属性推定方法は、各属性のキーワードの言い換え表現を大量に用意しておき、これを学習データとして用いて、キーワードの属性を推定する機械学習モデルを作成し、当該機械学習モデルによって第2属性を推定する方法である。
以上、説明したように、第1実施形態の対話制御システム10では、検出部101が、入力情報から入力キーワードを検出する。変換部102が、入力情報を、入力キーワードを含む情報と、入力情報の入力キーワード以外の部分を含む文脈情報と、に変換する。第1推定部103が、文脈情報から、入力キーワードの第1属性と、第1属性の尤度を示す第1尤度とが関連付けられた第1推定情報を少なくとも1つ推定する。第2推定部104が、入力キーワードから、入力キーワードの第2属性と、第2属性の尤度を示す第2尤度とが関連付けられた第2推定情報を少なくとも1つ推定する。属性決定部105は、第1推定情報、及び、第2推定情報に基づいて、入力キーワードの属性を決定する。
これにより第1実施形態の対話制御システム10によれば、入力情報に含まれるキーワードの属性の推定精度を向上させることができる。具体的には、文脈情報による入力キーワードの第1属性の推定は未知キーワードでも性能が劣化しないというメリットがある。しかし、複数の第1属性で共通に使われる文脈情報もあるため、キーワードの情報を使用した第2推定よりは推定精度が落ちる。一方、キーワードの情報による第2属性の推定は、既知の入力キーワードについては高性能であるが、未知の入力キーワードについては推定精度が劣化する。第1実施形態の対話制御システム10では、第1推定部103及び第2推定部104の両方を備えているので、入力情報に含まれるキーワードの属性の推定精度を向上させることができる。
(第1実施形態の変形例)
次に第1実施形態の変形例について説明する。変形例の説明では、第1実施形態と同様の説明については省略する。変形例では、入力キーワード(単語)を分散表現に変換して取り扱う場合について説明する。
図4は第1実施形態の変形例の対話制御システム10-2の機能構成の例を示す図である。変形例の対話制御システム10-2は、検出部101、変換部102、第1推定部103、第2推定部104、属性決定部105及び生成部106を備える。すなわち、変形例では、生成部106が追加されている。
生成部106は、単語(キーワード)から、当該単語の特徴がベクトルにより表された分散表現を生成する。例えば、生成部106は、入力キーワードから、入力キーワードの特徴がベクトルにより表された分散表現を生成する。具体的には、入力キーワードの分散表現は、入力キーワードが、当該入力キーワードの意味や文章中での使われ方に基づいて、1次元以上のベクトルデータに変換されることによって生成される。生成部106の生成処理は、意味が似ている単語や、文中での使われ方が似ている単語はベクトルデータの同士の距離が小さくなるように、あらかじめ大規模なデータによって作成される。距離の算出方法には、例えばユークリッド距離及びコサイン距離等があげられる。
第1推定部103は、学習対象の学習キーワードが含まれる複数の文と、文に含まれる学習キーワードの位置及び属性を示すラベルと、を含む学習データによって機械学習された第1属性推定モデルを用いて、第1属性を推定する。変形例では、学習キーワードのデータ形式が、生成部106によって、分散表現としてベクトルデータに変換されている点が、第1実施形態とは異なる。
第2推定部104は、各属性のキーワードの言い換え表現を大量に用意しておき、これを学習データとして用いて、キーワードの属性を推定する機械学習モデルを作成し、当該機械学習モデルによって第2属性を推定する。変形例では、キーワードの言い換え表現のデータ形式が、生成部106によって、分散表現としてベクトルデータに変換されている点が、第1実施形態とは異なる。
なお、第2推定部104は、属性毎に1以上のサンプルキーワードが関連付けられたキーワードリスト201を参照して、サンプルキーワードと、入力キーワードとの類似度を算出し、類似度に基づいて、第2属性及び第2尤度を含む第2推定情報を少なくとも1つ推定してもよい。例えば、第2推定部104は、入力キーワードの分散表現と、キーワードリスト201に含まれるサンプルキーワードの分散表現との距離を類似度として算出し、当該距離と、サンプルキーワードの属性とに基づいて、入力キーワードの第2属性を推定してもよい。例えば、第2推定部104は、入力キーワードとの距離がより近い1以上のサンプルキーワードの属性を、当該入力キーワードの第2属性として推定し、当該第2属性の第2尤度を距離に応じて推定してもよい。
(第2実施形態)
次に第2実施形態について説明する。第2実施形態の説明では、第1実施形態と同様の説明については省略する。第2実施形態では、推定された第1属性及び第2属性の重みを考慮して、入力キーワードの属性を決定する場合について説明する。
[機能構成の例]
図5は第2実施形態の対話制御システム10-3の機能構成の例を示す図である。第2実施形態の対話制御システム10-3は、検出部101、変換部102、第1推定部103、第2推定部104、属性決定部105及び重み決定部107を備える。すなわち、第2実施形態では、重み決定部107が追加されている。
重み決定部107は、例えば第1尤度及び第2尤度に応じて、第1重み及び第2重みを決定する。
[属性決定方法の例]
図6は第2実施形態の属性決定方法の例を示すフローチャートである。ステップS201~ステップS204の説明は、図2AのステップS101~ステップS104の説明と同じなので省略する。
重み決定部107は、ステップS204の処理(第1推定部103)により推定された第1尤度、及び、ステップS203の処理(第2推定部104)により推定された第2尤度に応じて、第1重み及び第2重みを決定する(ステップS205)。
重みの決定する方法はいくつか考えられる。尤度が高いほど、推定される属性は正しい可能性が高い。そのため図6の例では、第1尤度及び第2尤度に応じて、重みを分配して、第1重み及び第2重みを決定する方法が用いられている。
図6の例では、ステップS203及びステップS204の処理結果は以下の通りである。
ステップS203の処理結果:p(food)=0.3,p(item)=0.4
ステップS204の処理結果:p(food)=0.8,p(item)=0.1
重み決定部107は、例えばステップS203の処理により推定された第2属性の第2尤度の最大値によって、第2重みを決定する。すなわち、図6の例では、第2重み(キーワード)は0.4である。
また、重み決定部107は、例えばステップS204の処理により推定された第1属性の第1尤度の最大値によって、第1重みを決定する。すなわち、図6の例では、第1重み(文脈)は0.8である。
次に、属性決定部106が、ステップS203の処理により推定された第2尤度と、ステップS204の処理により推定された第1尤度と、ステップS205の処理により決定された第1重み及び第2重みを使用して、キーワード「ふわふわリング」の属性を決定する(ステップs206)。図6の例では、(第1属性)*(第1重み)+(第2属性)*(第2重み)の算出結果に基づいて、キーワード「ふわふわリング」の属性がfoodに決定されている。
具体的には、
p(food)=0.8*p(food)+0.4*p(food)=0.76
p(item)=0.8*p(item)+0.4*p(item)=0.24
となり、属性foodの尤度の方が高いので、「ふわふわリング」の属性はfoodに決定される。図6の例では、重みを考慮していない図2Bの場合よりも、属性foodと属性itemとの差がより顕著になっている。
以上、説明したように、第2実施形態では、属性決定部105が、推定された第1属性及び第2属性の重み(上述の第1重み及び第2重み)を更に考慮して、入力キーワードの属性を決定する。これにより、第2実施形態によれば、入力情報に含まれるキーワードの属性の推定精度を更に向上させることができる。
(第2実施形態の変形例)
次に第2実施形態の変形例について説明する。変形例の説明では、第2実施形態と同様の説明については省略する。変形例では、入力キーワード(単語)を分散表現に変換して取り扱う場合について説明する。
[機能構成の例]
図7は第2実施形態の変形例の対話制御システム10-4の機能構成の例を示す図である。変形例の対話制御システム10-4は、検出部101、変換部102、第1推定部103、第2推定部104、属性決定部105、生成部106及び重み決定部107を備える。すなわち、第2実施形態の変形例では、生成部106が追加されている。
生成部106の説明は、第1実施形態の変形例の説明と同様である。生成部106は、入力キーワードから、入力キーワードの特徴がベクトルにより表された分散表現を生成する。また、生成部106は、キーワードリスト201に含まれるサンプルキーワードの分散表現を生成する。
第2推定部104は、入力キーワードの分散表現と、キーワードリスト201に含まれるサンプルキーワードの分散表現との距離を類似度として算出し、当該距離と、サンプルキーワードの属性とに基づいて、入力キーワードの第2属性を推定する。
重み決定部107は、入力キーワードの分散表現と、キーワードリスト201に含まれるサンプルキーワードの分散表現との距離(類似度)に基づいて、第1重み及び第2重みを決定する。入力キーワードが、キーワードリスト201内のサンプルキーワードに近いほど、第2属性の推定精度が高い。そこで、変形例では、推定精度の高さをキーワードリスト201内のサンプルキーワードを使用して見積もる。
以下に具体例をあげる。
生成部106は、入力キーワードと、キーワードリスト201内のサンプルキーワードとの距離を算出する。ここでは距離を0~1に正規化しておく。そして、重み決定部107は、入力キーワードとの距離が一番小さいサンプルキーワードの距離を第1重みとし、第2重みを1から第1重みを引いた値により決定する。
<具体例1>
「日本料理がいい」(distance(日本料理、和食)=0.1)
第1属性(文脈):p(food)0.4,p(item)=0.4
→ 第1重み:0.1
第2属性(キーワード):p(food)=0.9,p(item)=0.1
→ 第2重み:0.9
p(food)=0.1*p(food)+0.9*p(food)=0.85
p(item)=0.1*p(item)+0.9*p(item)=0.13
となり、foodの尤度が高いので、「日本料理」の属性としてfoodを出力する。
<具体例2>
「ふわふわリングが食べたい」(distance(ふわふわリング、指輪)=0.6)
第1属性(文脈):p(food)=0.8,p(item)=0.1
→ 第1重み:0.6
第2属性(キーワード):p(food)=0.3,p(item)=0.4
→ 第2重み:0.4
p(food)=0.6*p(food)+0.4*p(food)=0.66
p(item)=0.6*p(item)+0.4*p(item)=0.22
となり、foodの尤度が高いので、「ふわふわリング」の属性としてfoodを出力する。
なお、重み決定部107による第1重み及び第2重みの決定方法は、上述の例に限られない。例えば、重み決定部107は、機械学習を利用して、第1重み及び第2重みを決定してもよい。例えば、重み決定部107は、学習対象の学習キーワードが含まれる複数の文と、文に含まれる学習キーワードの位置及び属性を示すラベルと、を含む学習データによって機械学習された重み決定モデルを用いて、第1重み(文脈から推定された第1属性の重み)、及び、第2重み(入力キーワードから推定された第2属性の重み)を決定してもよい。
(第3実施形態)
次に第3実施形態について説明する。第3実施形態の説明では、第2実施形態と同様の説明については省略する。第3実施形態では、推定された第1属性及び第2属性の重みを考慮して、入力キーワードの属性を決定する場合について説明する。また、第3実施形態では、属性が1つに決定できない場合の対話制御について説明する。
[機能構成の例]
図8は第3実施形態の対話制御システム10-5の機能構成の例を示す図である。第3実施形態の対話制御システム10は、検出部101、変換部102、第1推定部103、第2推定部104、属性決定部105、重み決定部107及び制御部108を備える。すなわち、第3実施形態では、制御部108が追加されている。
制御部108は、入力キーワードの属性が1つに決定できない場合、入力キーワードの属性を問い合わせる情報を出力する。これにより、無理に1つに絞る場合に比べて、誤った属性を出力する可能性を下げることができる。
[対話制御方法の例]
図9は第3実施形態の対話制御方法の例を示すフローチャートである。図9の例では、属性決定部105が、属性決定部105による属性決定(ステップS206)の後に、入力キーワードの属性が1つに絞り込めたか否かを判定する(ステップS207)。
属性が1つに絞り込めなかった場合(ステップS207,No)、制御部108が、入力キーワードの属性を問い合わせる情報を出力する。制御部108は、例えば図9の例では、「『ふわふわリング』は食べ物ですか?ファッションアイテムですか?」と問い合わせる。これにより、ユーザの応答から正しい属性を得ることができる。
以下にステップS207の判定方法の例をあげる。ここでは属性決定部105により出力された尤度を使用する。例えば、各属性の尤度の差に対して閾値を設ける。制御部108は、例えば属性の尤度の差が閾値より小さい場合、差が取得された2つの属性を使用して、入力キーワードの属性を問い合わせる情報を出力する。
また例えば、属性決定部105は、属性を属性の尤度が高い順にソートし、1位と各順位間の尤度の差を算出し、閾値より小さいか否かを判定する。そして、制御部108は、尤度の差が閾値より小さい場合、差が取得された属性を使用して、入力キーワードの属性を問い合わせる情報を出力する。例えば、制御部108は、1位と2位との差、1位と3位との差が閾値より小さい場合、1位~3位までの属性を使用して、入力キーワードの属性を問い合わせる情報を出力する。
また例えば、制御部108は、尤度が閾値より大きい属性を使用して、入力キーワードの属性を問い合わせる情報を出力する。
以下は、属性決定部105が、属性を1つに絞り込めない場合の具体例である。
<具体例1>
「ふわふわリングがいい」
第1属性(文脈):p(food)=0.4,p(item)=0.4,p(name)=0.2 → 第1重み:0.6(=1-(第2重み))
第2属性(キーワード):p(food)=0.3,p(item)=0.4,p(name)=0.2 → 第2重み:0.4
p(food)=0.6*p(food)+0.4*p(food)=0.36
p(item)=0.6*p(item)+0.4*p(item)=0.4
p(name)=0.6*p(name)+0.4*p(name)=0.2
foodとitemの尤度が近い値である。例えば尤度の差に対する閾値を0.1にしておくと、
p(food)-p(item)=0.04 < 0.1
p(food)-p(name)=0.16 > 0.1
となる。この場合、属性決定部105は、属性を1つに絞り込まずに、food及びitemを、入力キーワードの属性として出力する。
また例えば尤度に対する閾値を0.3にしておくと、
p(food)=0.36 > 0.3
p(item)=0.4 > 0.3
p(name)=0.2 < 0.3
となる。この場合も、属性決定部105は、属性を1つに絞り込まずに、food及びitemを、入力キーワードの属性として出力する。
以上、説明したように、第3実施形態では、入力キーワードの属性が1つに決定できない場合、制御部108が、入力キーワードの属性を問い合わせる情報を出力する。これにより、無理に1つに絞る場合に比べて、誤った属性を出力する可能性を下げることができる。
(第4実施形態)
次に第4実施形態について説明する。第4実施形態の説明では、第2実施形態と同様の説明については省略する。第4実施形態では、属性に関連付けられたサンプルキーワードを検索に使用する場合について説明する。
[機能構成の例]
図10は第4実施形態の対話制御システム10-6の機能構成の例を示す図である。第4実施形態の対話制御システム10-6は、検出部101、変換部102、第1推定部103、第2推定部104、属性決定部105、重み決定部107、選択部109、記憶部110及び検索部111を備える。すなわち、第4実施形態では、選択部109、記憶部110及び検索部111が追加されている。
選択部109は、入力キーワードの属性と同じ属性に関連付けられた1以上のサンプルキーワード(図3のキーワードリスト201参照)と、入力キーワードとの類似度に基づいて、1以上のサンプルキーワードから検索キーワードを選択する。例えば、選択部109は、入力キーワードと、属性決定部106により決定された属性のサンプルキーワードとの距離を、類似度として算出する。この場合、選択部109は、属性決定部106により決定された属性のサンプルキーワードのうち、例えば入力キーワードとの距離が最小のサンプルキーワードを、検索キーワードとして選択する。選択部109は、例えば入力キーワード「日本料理」に一番近いサンプルキーワードは「和食」なので、「和食」を選択する。
また例えば、選択部109は、「ふわふわリング」の属性はfoodなので、food内のサンプルキーワードで、一番近い距離の近い「スイーツ」を選択する。なお、「ふわふわリング」に一番近いサンプルキーワードは、全サンプルキーワードの中では「指輪」である。選択部109が、属性を絞らずに全属性のサンプルキーワードと比較すると、「指輪」が一番近いので「指輪」を選択してしまう。選択部109が、属性決定部105により決定された属性に関連付けられたサンプルキーワードを比較対象とすることで、「スイーツ」を選択できる。これにより、検索部111が、「スイーツ」のコンテンツを検索することができるようになる。
記憶部110は情報を記憶する。記憶部110は、例えば上述のキーワードリスト201、及び、検索対象のコンテンツ等を記憶する。
図11は第4実施形態のコンテンツの例を示す図である。図11の例では、コンテンツは、各属性(food,item,area及びname)をカラムとして有するデータ-ベースに記憶される。各属性に設定されているデータは、例えばキーワードリスト201のサンプルキーワードに対応する。
検索部111は、選択部109により選択されたキーワードを使用してコンテンツを検索する。
<検索方法の例1>
図12は第4実施形態の検索方法の例1を示すフローチャートである。ステップS301~ステップS306の説明は、図6のステップS201~ステップS206の説明と同じなので省略する。選択部111が、「ふわふわリング」の属性はfoodなので、foodに関連付けられた1以上のサンプルキーワードと、「ふわふわリング」との類似度に基づいて、検索キーワードを選択する。例えば、選択部111は、food内のサンプルキーワードで、一番近い距離の近い「スイーツ」を、検索キーワードとして選択する(ステップS307)。
次に、検索部111が、ステップS307の処理により選択されたキーワードを使用してコンテンツを検索する。図12の例では、検索部111は、「『スイーツ』のお店が10件見つかりました。」と通知するとともに、コンテンツの検索結果を出力する。
<検索方法の例2>
図13は第4実施形態の検索方法の例2を示すフローチャートである。ステップS301~ステップS308の説明は、図12の説明と同じなので省略する。検索部111は、foodに関連付けられたサンプルキーワード「スイーツ」と、入力キーワード「ふわふわリング」との類似度が閾値Xより大きいか否かを判定する(ステップS309)。なお、閾値Xは、類似度の判断基準等に応じて適宜、定めてよい。
類似度が閾値Xより大きい場合(ステップS309、Yes)、検索部111は、「『スイーツ』のお店が10件見つかりました。」と通知するとともに、コンテンツの検索結果を出力する。
類似度が閾値X以下の場合(ステップS309、No)、すなわち、類似していないと判定された検索キーワードの場合は、検索部111が、当該検索キーワードで検索してもユーザの好みのコンテンツが提示できない可能性が高い。そのため、検索部111は、「『ふわふわリング』のお店は見つかりませんでした。スイーツのお店なら10件見つかりました。」と代替案であることを通知する。または、検索部111は、「『ふわふわリング』のお店はみつかりませんでした。どんなものが食べたいですか?」等の情報を通知して、別のキーワードの入力をするように促す。この際に属性foodがわかっているので、検索部111が、「どんなものが食べたいですか?」と食べ物のキーワードを要求することで、何を言うべきかをわかりやすくユーザに認識させることができる。例えばユーザが「ドーナツが食べたい」のように別の食べ物で言い換えることで、検索部111は、検索に使える入力キーワード「ドーナツ」を取得できる。
なお、上述の第3実施形態のように、属性決定部105が、属性を1つに絞り込めない場合もある。この場合、検索部111は、ユーザに問い返して1つの属性に絞り込むことも可能だが、絞り込まずにそのまま検索に使用することも可能である。この場合、選択部109が、属性決定部105から出力された複数の属性のそれぞれに対して、1以上のサンプルキーワードとの距離を算出する。例えば、選択部109は、属性決定部105から属性food及びitemが出力された場合は、それぞれの属性に関連付けられた1以上のサンプルキーワードと、入力キーワードとの距離を算出する。選択部109は、各属性で、例えば一番距離の小さいサンプルキーワードを選択し、当該サンプルキーワードを検索キーワードとして出力する。そして、検索部111が、各属性の検索キーワードでコンテンツを検索し、例えば「『ふわふわリング』のお店は見つかりませんでした。『指輪』のお店なら10件見つかりました。また、『スイーツ』のお店なら10件見つかりました。」等の情報を通知する。
また、選択部109は、入力キーワードの属性と同じ属性に関連付けられた1以上のサンプルキーワードと、入力キーワードとの類似度が閾値Xより小さい場合、当該入力キーワードは受け付けられないことを示す情報を通知してもよい。
以上、説明したように、第4実施形態では、検索部111が、属性決定部105により決定された属性と同じ属性に関連付けられたサンプルキーワードで、コンテンツを検索する。第4実施形態によれば、属性決定部105により決定された属性を、コンテンツの検索に使用することができる。
最後に、実施形態の対話制御システム10のハードウェア構成の例について説明する。
[ハードウェア構成の例]
図14は第1乃至第4実施形態のハードウェア構成の例を示す図である。
対話制御システム10は、制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306を備える。制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306は、バス310を介して接続されている。
制御装置301は、補助記憶装置303から主記憶装置302に読み出されたプログラムを実行する。主記憶装置302は、ROM(Read Only Memory)、及び、RAM(Random Access Memory)等のメモリである。補助記憶装置303は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及び、メモリカード等である。
表示装置304は表示情報を表示する。表示装置304は、例えば液晶ディスプレイ等である。入力装置305は、対話制御システム10として動作させるコンピュータを操作するためのインタフェースである。入力装置305は、例えばキーボードやマウス等である。コンピュータがスマートフォン及びタブレット型端末等のスマートデバイスの場合、表示装置304及び入力装置305は、例えばタッチパネルである。通信装置306は、他の装置と通信するためのインタフェースである。
コンピュータで実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、メモリカード、CD-R及びDVD(Digital Versatile Disc)等のコンピュータで読み取り可能な記憶媒体に記録されてコンピュータ・プログラム・プロダクトとして提供される。
またコンピュータで実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。またコンピュータで実行されるプログラムをダウンロードさせずにインターネット等のネットワーク経由で提供するように構成してもよい。
またコンピュータで実行されるプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
コンピュータで実行されるプログラムは、上述の対話制御システム10の機能構成(機能ブロック)のうち、プログラムによっても実現可能な機能ブロックを含むモジュール構成となっている。当該各機能ブロックは、実際のハードウェアとしては、制御装置301が記憶媒体からプログラムを読み出して実行することにより、上記各機能ブロックが主記憶装置302上にロードされる。すなわち上記各機能ブロックは主記憶装置302上に生成される。
なお上述した各機能ブロックの一部又は全部をソフトウェアにより実現せずに、IC(Integrated Circuit)等のハードウェアにより実現してもよい。
また複数のプロセッサを用いて各機能を実現する場合、各プロセッサは、各機能のうち1つを実現してもよいし、各機能のうち2つ以上を実現してもよい。
また対話制御システム10として動作させるコンピュータの動作形態は任意でよい。例えば、対話制御システム10を1台のコンピュータにより実現してもよい。また例えば、対話制御システム10を、ネットワーク上のクラウドシステムとして動作させてもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10 対話制御システム
101 検出部
102 変換部
103 第1推定部
104 第2推定部
105 属性決定部
106 生成部
107 重み決定部
108 制御部
109 選択部
110 記憶部
111 検索部
201 キーワードリスト
301 制御装置
302 主記憶装置
303 補助記憶装置
304 表示装置
305 入力装置
306 通信装置
310 バス

Claims (10)

  1. 入力情報から入力キーワードを検出する検出部と、
    前記入力情報を、前記入力キーワードを含む情報と、前記入力情報の前記入力キーワード以外の部分を含む文脈情報と、に変換する変換部と、
    前記文脈情報から、前記入力キーワードの第1属性と、前記第1属性の尤度を示す第1尤度とが関連付けられた第1推定情報を少なくとも1つ推定する第1推定部と、
    前記入力キーワードから、前記入力キーワードの第2属性と、前記第2属性の尤度を示す第2尤度とが関連付けられた第2推定情報を少なくとも1つ推定する第2推定部と、
    前記第1尤度の重みを示す第1重みを、前記第1推定部により推定された少なくとも1つの第1尤度の値に基づいて決定し、前記第2尤度の重みを示す第2重みを、前記第2推定部により推定された少なくとも1つの第2尤度の値に基づいて決定する重み決定部と、
    前記第1推定情報、前記第1重み、前記第2推定情報、及び、前記第2重みに基づいて、前記入力キーワードの属性を決定する属性決定部と、
    を備える対話制御システム。
  2. 前記重み決定部は、学習対象の学習キーワードが含まれる複数の文と、前記文に含まれる前記学習キーワードの位置及び属性を示すラベルと、を含む学習データによって機械学習された重み決定モデルを用いて、前記第1重み及び前記第2重みを決定する、
    請求項に記載の対話制御システム。
  3. 前記第2推定部は、属性毎に1以上のサンプルキーワードが関連付けられたキーワードリストを参照して、前記入力キーワードが、前記サンプルキーワードとして前記キーワードリストに含まれているか否かを判定し、前記入力キーワードが、前記サンプルキーワードとして前記キーワードリストに含まれている場合、前記サンプルキーワードに関連付けられた属性によって、前記入力キーワードの第2属性を推定する、
    請求項に記載の対話制御システム。
  4. 前記第2推定部は、属性毎に1以上のサンプルキーワードが関連付けられたキーワードリストを参照して、前記サンプルキーワードと、前記入力キーワードとの類似度を算出し、前記類似度に基づいて、前記第2推定情報を少なくとも1つ推定する、
    請求項に記載の対話制御システム。
  5. 前記重み決定部は、前記類似度に基づいて、前記第2重みを決定し、前記第2重みに基づいて前記第1重みを決定する、
    請求項に記載の対話制御システム。
  6. 前記入力キーワードの属性が1つに決定できない場合、前記入力キーワードの属性を問い合わせる情報を出力する制御部、
    を更に備える請求項1に記載の対話制御システム。
  7. 前記入力キーワードの属性と同じ属性に関連付けられた前記1以上のサンプルキーワードと、前記入力キーワードとの類似度に基づいて、前記1以上のサンプルキーワードから検索キーワードを選択する選択部と、
    前記検索キーワードを使用して、コンテンツを検索する検索部と、
    を更に備える請求項に記載の対話制御システム。
  8. 前記選択部は、前記入力キーワードの属性と同じ属性に関連付けられた前記1以上のサンプルキーワードと、前記入力キーワードとの類似度が閾値より小さい場合、前記入力キーワードは受け付けられないことを示す情報を通知する、
    請求項に記載の対話制御システム。
  9. 対話制御システムが、入力情報から入力キーワードを検出するステップと、
    前記対話制御システムが、前記入力情報を、前記入力キーワードを含む情報と、前記入力情報の前記入力キーワード以外の部分を含む文脈情報と、に変換するステップと、
    前記対話制御システムが、前記文脈情報から、前記入力キーワードの第1属性と、前記第1属性の尤度を示す第1尤度とが関連付けられた第1推定情報を少なくとも1つ推定する第1推定ステップと、
    前記対話制御システムが、前記入力キーワードから、前記入力キーワードの第2属性と、前記第2属性の尤度を示す第2尤度とが関連付けられた第2推定情報を少なくとも1つ推定する第2推定ステップと、
    前記対話制御システムが、前記第1尤度の重みを示す第1重みを、前記第1推定ステップにより推定された少なくとも1つの第1尤度の値に基づいて決定し、前記第2尤度の重みを示す第2重みを、前記第2推定ステップにより推定された少なくとも1つの第2尤度の値に基づいて決定するステップと、
    前記対話制御システムが、前記第1推定情報、前記第1重み、前記第2推定情報、及び、前記第2重みに基づいて、前記入力キーワードの属性を決定するステップと、
    を含む対話制御方法。
  10. コンピュータを、
    入力情報から入力キーワードを検出する検出部と、
    前記入力情報を、前記入力キーワードを含む情報と、前記入力情報の前記入力キーワード以外の部分を含む文脈情報と、に変換する変換部と、
    前記文脈情報から、前記入力キーワードの第1属性と、前記第1属性の尤度を示す第1尤度とが関連付けられた第1推定情報を少なくとも1つ推定する第1推定部と、
    前記入力キーワードから、前記入力キーワードの第2属性と、前記第2属性の尤度を示す第2尤度とが関連付けられた第2推定情報を少なくとも1つ推定する第2推定部と、
    前記第1尤度の重みを示す第1重みを、前記第1推定部により推定された少なくとも1つの第1尤度の値に基づいて決定し、前記第2尤度の重みを示す第2重みを、前記第2推定部により推定された少なくとも1つの第2尤度の値に基づいて決定する重み決定部と、
    前記第1推定情報、前記第1重み、前記第2推定情報、及び、前記第2重みに基づいて、前記入力キーワードの属性を決定する属性決定部、
    として機能させるためのプログラム。
JP2019046452A 2019-03-13 2019-03-13 対話制御システム、対話制御方法及びプログラム Active JP7055764B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019046452A JP7055764B2 (ja) 2019-03-13 2019-03-13 対話制御システム、対話制御方法及びプログラム
CN201910753635.1A CN111694933A (zh) 2019-03-13 2019-08-15 对话控制系统、对话控制方法以及存储介质
US16/798,711 US11783129B2 (en) 2019-03-13 2020-02-24 Interactive control system, interactive control method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019046452A JP7055764B2 (ja) 2019-03-13 2019-03-13 対話制御システム、対話制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2020149369A JP2020149369A (ja) 2020-09-17
JP7055764B2 true JP7055764B2 (ja) 2022-04-18

Family

ID=72424707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019046452A Active JP7055764B2 (ja) 2019-03-13 2019-03-13 対話制御システム、対話制御方法及びプログラム

Country Status (3)

Country Link
US (1) US11783129B2 (ja)
JP (1) JP7055764B2 (ja)
CN (1) CN111694933A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11663402B2 (en) * 2020-07-21 2023-05-30 International Business Machines Corporation Text-to-vectorized representation transformation
JP2022165879A (ja) * 2021-04-20 2022-11-01 富士通株式会社 情報生成プログラム、情報生成方法、および情報生成装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001034292A (ja) 1999-07-26 2001-02-09 Denso Corp 単語列認識装置
JP2005157494A (ja) 2003-11-20 2005-06-16 Aruze Corp 会話制御装置及び会話制御方法
JP2006107353A (ja) 2004-10-08 2006-04-20 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
WO2008023470A1 (fr) 2006-08-21 2008-02-28 Kyoto University Procédé de recherche de phrase, moteur de recherche de phrase, programme informatique, support d'enregistrement et stockage de document
JP2014215826A (ja) 2013-04-25 2014-11-17 株式会社デンソー 検索システム
JP2016177359A (ja) 2015-03-18 2016-10-06 Kddi株式会社 検索装置及びプログラム
JP2017021523A (ja) 2015-07-09 2017-01-26 日本電信電話株式会社 用語意味コード判定装置、方法、及びプログラム
JP2017049930A (ja) 2015-09-04 2017-03-09 株式会社東芝 文書解析装置、方法及びプログラム
US20180341631A1 (en) 2017-05-24 2018-11-29 Ca, Inc. Data provenance system

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288155A (ja) 2001-03-23 2002-10-04 Nippon Telegr & Teleph Corp <Ntt> 単語属性推定装置、単語属性推定方法、そのプログラムおよび記録媒体
US8359371B2 (en) * 2007-04-26 2013-01-22 Access Co., Ltd. Input candidate providing device, input candidate providing system, input candidate providing method, and input candidate providing program
JP2008293302A (ja) 2007-05-25 2008-12-04 Fuji Xerox Co Ltd 文書解析システム、および文書解析方法、並びにコンピュータ・プログラム
CN102663123B (zh) * 2012-04-20 2014-09-03 哈尔滨工业大学 基于伪种子属性和随机漫步排序的语义属性自动抽取方法及实现该方法的系统
CN103198155B (zh) * 2013-04-27 2017-09-22 北京光年无限科技有限公司 一种基于移动终端的智能问答交互系统及方法
MX2019001576A (es) * 2016-08-09 2019-09-18 Ripcord Inc Sistemas y metodos para la recuperacion contextual de registros electronicos.
JP7132090B2 (ja) 2018-11-07 2022-09-06 株式会社東芝 対話システム、対話装置、対話方法、及びプログラム
US11210462B1 (en) * 2019-06-12 2021-12-28 Amazon Technologies, Inc. Voice input processing

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001034292A (ja) 1999-07-26 2001-02-09 Denso Corp 単語列認識装置
JP2005157494A (ja) 2003-11-20 2005-06-16 Aruze Corp 会話制御装置及び会話制御方法
JP2006107353A (ja) 2004-10-08 2006-04-20 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
WO2008023470A1 (fr) 2006-08-21 2008-02-28 Kyoto University Procédé de recherche de phrase, moteur de recherche de phrase, programme informatique, support d'enregistrement et stockage de document
JP2014215826A (ja) 2013-04-25 2014-11-17 株式会社デンソー 検索システム
JP2016177359A (ja) 2015-03-18 2016-10-06 Kddi株式会社 検索装置及びプログラム
JP2017021523A (ja) 2015-07-09 2017-01-26 日本電信電話株式会社 用語意味コード判定装置、方法、及びプログラム
JP2017049930A (ja) 2015-09-04 2017-03-09 株式会社東芝 文書解析装置、方法及びプログラム
US20180341631A1 (en) 2017-05-24 2018-11-29 Ca, Inc. Data provenance system

Also Published As

Publication number Publication date
JP2020149369A (ja) 2020-09-17
CN111694933A (zh) 2020-09-22
US11783129B2 (en) 2023-10-10
US20200293717A1 (en) 2020-09-17

Similar Documents

Publication Publication Date Title
JP6310150B2 (ja) 意図理解装置、方法およびプログラム
US10565520B2 (en) Feature extraction for machine learning
US11055338B2 (en) Dynamic facet tree generation
US20130060769A1 (en) System and method for identifying social media interactions
US20180114136A1 (en) Trend identification using multiple data sources and machine learning techniques
US10387568B1 (en) Extracting keywords from a document
CN108920543B (zh) 查询和交互的方法及装置、计算机装置、存储介质
KR101573854B1 (ko) 관계어 기반 확률추정 방법을 이용한 통계적 문맥의존 철자오류 교정 장치 및 방법
US11989215B2 (en) Language detection of user input text for online gaming
US11080330B2 (en) Generation of digital content navigation data
JP7132090B2 (ja) 対話システム、対話装置、対話方法、及びプログラム
WO2020232898A1 (zh) 文本分类方法、装置、电子设备及计算机非易失性可读存储介质
JP5768492B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN111538837A (zh) 用于分析企业经营范围信息的方法和装置
JP2021179979A (ja) ショッピング検索のための商品属性抽出方法
JP7055764B2 (ja) 対話制御システム、対話制御方法及びプログラム
JP2018194902A (ja) 生成装置、生成方法および生成プログラム
JP7254925B2 (ja) 改良されたデータマッチングのためのデータレコードの字訳
US8554539B2 (en) Method for analyzing morpheme using additional information and morpheme analyzer for executing the method
JP5679194B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN111373386A (zh) 相似度指标值计算装置、相似检索装置及相似度指标值计算用程序
JP2022173084A (ja) 埋め込み類似度に基づく商品検索方法、コンピュータ装置、およびコンピュータプログラム
US10929446B2 (en) Document search apparatus and method
US11289095B2 (en) Method of and system for translating speech to text
CN114020864A (zh) 搜索结果的展示方法、装置及设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200826

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220406

R151 Written notification of patent or utility model registration

Ref document number: 7055764

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151