JP6856498B2 - 支援システム、支援方法、プログラム、及び記憶媒体 - Google Patents

支援システム、支援方法、プログラム、及び記憶媒体 Download PDF

Info

Publication number
JP6856498B2
JP6856498B2 JP2017220054A JP2017220054A JP6856498B2 JP 6856498 B2 JP6856498 B2 JP 6856498B2 JP 2017220054 A JP2017220054 A JP 2017220054A JP 2017220054 A JP2017220054 A JP 2017220054A JP 6856498 B2 JP6856498 B2 JP 6856498B2
Authority
JP
Japan
Prior art keywords
evaluation value
model
dialogue
slot
dialogue data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017220054A
Other languages
English (en)
Other versions
JP2019091287A (ja
Inventor
尚水 吉田
尚水 吉田
憲治 岩田
憲治 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2017220054A priority Critical patent/JP6856498B2/ja
Priority to US15/904,210 priority patent/US10490189B2/en
Publication of JP2019091287A publication Critical patent/JP2019091287A/ja
Application granted granted Critical
Publication of JP6856498B2 publication Critical patent/JP6856498B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明の実施形態は、支援システム、支援方法、プログラム、及び記憶媒体に関する。
ユーザに情報を提供する1つの方法として、例えば、ユーザの音声を認識し、応答文を生成する対話システムがある。さらに、ユーザが入力した文字情報からユーザが望むサービスを提供する方法もある。サービス提供システムの運用は、容易であることが望ましい。
特許第4769005号公報
本発明の実施形態は、サービス提供システムの運用を容易にできる支援システム、支援方法、プログラム、及び記憶媒体を提供する。
実施形態に係る支援システムは、対話システムに用いられる新規スロットパラメータを追加するためのものである。前記支援システムは、取得部及び第1処理部を含む。前記取得部は、前記対話システムに追加される新規スロットパラメータを取得する。前記第1処理部は、前記新規スロットパラメータを選定するための第1評価値に基づいて、前記新規スロットパラメータを含む第1情報を、前記対話システムの管理者に送信する。
図1は、第1実施形態に係る支援システムを例示する模式図である。 図2は、第1実施形態に係る支援システムが用いられるサービス提供システムを例示する模式図である。 図3は、スロットパラメータ及びスロットを例示する図である。 図4は、第1実施形態に係る支援システムの動作を例示するフローチャートである。 図5は、第1実施形態に係る支援システムの動作を例示するフローチャートである。 図6は、第1実施形態に係る別の支援システムを例示する模式図である。 図7は、第1実施形態に係る別の支援システムの動作を例示するフローチャートである。 図8は、第2実施形態に係る支援システムを例示する模式図である。 図9は、第2実施形態に係る支援システムを例示するフローチャートである。
以下に、本発明の各実施形態について図面を参照しつつ説明する。
本願明細書と各図において、既に説明したものと同様の要素には同一の符号を付して詳細な説明は適宜省略する。
図1は、第1実施形態に係る支援システムを例示する模式図である。
図1に示すように、支援システム110は、取得部10及び第1処理部21を含む。 取得部10は、情報を取得する。第1処理部21は、その情報の処理を行う。支援システム110は、例えば、ユーザにサービスを提供するサービス提供システムの運用を支援する。
以下、まず、サービス提供システムの例について説明する。
図2は、第1実施形態に係る支援システムが用いられるサービス提供システムを例示する模式図である。
サービス提供システム80は、例えば、対話システムを含む。サービス提供システム80は、ユーザUSが発した音声を認識し、応答文を生成する。サービス提供システム80は、音声の認識及び応答文の生成により、ユーザUSと対話することで、ユーザUSの意図を推定する。サービス提供システム80は、例えば、ユーザUSとの文字情報の授受により、ユーザUSの意図を推定しても良い。推定されたユーザUSの意図に応じて、サービス提供システム80は、サービス(ユーザUSが望む情報など)を、ユーザUSに提供する。
例えば、サービス提供システム80は、ショッピングモールに設置される。ショッピングモールには、複数のレストラン、複数の玩具店、及び、複数の衣類店などが設けられている。ショッピングモールを訪れたユーザUSが、サービス提供システム80に例えば音声で、種々の「問いかけ」を行う。その「問いかけ」に応じたサービス(情報)が、サービス提供システム80からユーザUSに提供される。
例えば、ユーザUSが食事を望む場合の1つの例において、ユーザUSは、行きたいレストランの店名を知っており、その場所を知らない。この場合、ユーザUSは、その店名を発声する。サービス提供システム80は、この発声を音声認識し、その店の場所に関する情報を、そのユーザUSに教える。例えば、その店の場所が、情報(サービス)として提供される。
一方、ユーザUSが、自分の望むことの概略だけを認識しており、具体的な店の名前を知らない場合がある。このような場合にも、適切な情報(提案)を提供できることが望ましい。例えば、ユーザUSが、「日本料理は」と発声する場合や、「和風の」とだけ発声する場合もある。このような曖昧な発声を意図理解することで、適切な情報(サービス)が提供できる。
サービス提供システム80おいて適切な意図理解が可能なように、例えば、サービス提供システム80に、情報を格納できる複数の「分類」が設けられる。複数の分類の1つが「レストラン」に割り当てられる。複数の「分類」の別の1つが例えば、「衣料品店」などの他の店(サービス)に割り当てられる。
複数の「分類」の1つ(レストラン)に、複数の言葉(日本料理、韓国料理またはイタリア料理など)が格納可能である。例えば、「分類」に、「日本料理」の「言葉」が格納される場合には、ユーザUSが、「日本料理店は?」、「和食は?」、「日本風の」、または、「日本の家庭料理」などの発声をすると、そのユーザUSの意図が適切に推定され、日本料理に関するショッピングモール内の情報が提供できる。
一方、例えば、ユーザUSが「中華料理」と発声すると、サービス提供システム80は、中華料理に関するショッピングモール内の情報を提供する。
「分類」に格納される複数の「言葉」を適切に設定することで、ユーザUSの意図を正確に推定することができる。
「分類」に格納される複数の「言葉」は、例えば、サービス提供システム80の設計時に設けられる。そして、ショッピングモールにおけるユーザUSとの「対話」の結果に応じて、経時的に学習が行われても良い。
さらに、ショッピングモールに新しい店が設けられる場合、その店に対応して、必要に応じて新しい「言葉」を設定可能であることが好ましい。例えば、そのショッピングモールに従来から「日本料理店」があり、別の「日本料理店」が追加して設けられるときには、新しく「言葉」を追加する必要がない場合が多い。これに対して、そのショッピングモールに今まで「ベトナム料理店」がなかった場合に、新しく「ベトナム料理」が設定されても良い。
新しい「言葉」の設定は、第1ユーザUS1(図2参照)により行われる。第1ユーザUS1は、サービス提供システム80の運用者(またはその従業者)である。第1ユーザUS1は、新しい「言葉」の設定に関する作業を行う。第1ユーザUS1は、サービス提供システム80の管理者であっても良い。第1ユーザUS1は、例えば、ショッピングモールの運営者(またはその従業員)もしくはショッピングモールに含まれる店舗の運営者(またはその従業者)である。一方、サービス提供システム80は、第1ユーザUS1とは異なる第2ユーザUS2により設計され、販売される。第2ユーザUS2は、サービス提供システム80の別の管理者である。例えば、サービス提供システム80における「分類」及び「言葉」は、第2ユーザUS2により初期設定される。そして、サービス提供システム80の運営中に、新しい「言葉」を、第1ユーザUS1により設定できる。
初期設定の後のサービス提供システム80の運営中に、新しい「言葉」を第1ユーザUS1により設定できることで、サービス提供システム80の仕様の変更が、容易に、適切なタイミングで実施できる。
第1ユーザUS1が新しい「言葉」を設定する際に、新しく設定しようとしている「言葉」が不適切である場合、ユーザUSの意図理解が不正確になりうる。実施形態に係る支援システム110は、新しく「言葉」を追加する場合に、その「言葉」が適切かどうかを推定できる。例えば、新しい「言葉」として、「ベトナム料理」と設定した場合に、ユーザUSの曖昧な「問いかけ」に対して、適切な意図推定が行われる可能性が高いかどうかが推定される。そして、その推定結果に応じて、例えば、第1ユーザUS1または第2ユーザUS2に、その状況に適した情報が提供される。
図3は、スロットパラメータ(バリュー)及びスロットを例示する図である。
サービス提供システム80は、推定の際に、予め設定された「分類」と、その「分類」に含まれる「言葉」を参照する。この「分類」は、スロットと呼ばれる。この「言葉」は、スロットパラメータまたはバリューと呼ばれる。図3は、ショッピングモールのレストランに関する複数のスロットS1〜Smを例示する。それぞれのスロットには、複数のバリューが設定される。例えば、料理に関するスロットS1は、日本料理のバリューV11、韓国料理のバリューV12、イタリア料理のバリューV13などを含む。価格帯に関するスロットS2は、高級のバリューV21、庶民派のバリューV22などを含む。それぞれのバリューには、特徴量が設定されている。サービス提供システム80は、複数のスロットS1〜Smを参照し、ユーザUSが意図しているバリューを推定して、そのバリューに関する応答文を生成する。
図4は、第1実施形態に係る支援システムの動作を例示するフローチャートである。
取得部10は、情報を取得する。情報は、例えば、第1ユーザUS1によって入力される。情報は、例えば、音情報(音声情報)及び文字情報の少なくともいずれかを含む。音声方法が入力され、その音声情報から導出された文字情報が、取得部10により取得されても良い。 取得部10は、例えば、キーボード、マイクロフォン、及びタッチパネルの少なくともいずれかを含む。
第1処理部21は、取得部10によって取得された情報を処理する。第1処理部21は、例えば、CPU(例えば、コンピュータなど)を含む。第1処理部21は、メモリを含んでも良い。
例えば、第1ユーザUS1による入力に基づき、取得部10は、第1スロットに追加される第1バリュー(第1スロットパラメータ)を取得する(Step1)。
例えば、第1処理部21は、第1バリューの推定の精度を表す第1評価値を決定する(Step2)。第1処理部21は、例えば、第1評価値と、あらかじめ設定された第1閾値と、を比較する(Step3)。第1処理部21は、第1評価値が第1閾値よりも低いときに、第1ユーザUS1に向けて第1情報を送信する(Step4)。この場合、第1処理部21は、例えば、第1スロットに第1バリューを追加しない。第1処理部21は、第1評価値が第1閾値以上であるとき、第1スロットに第1バリューを追加しても良い。この場合、第1処理部21は、第1ユーザUS1に承認を求めても良い。第1処理部21は、第1ユーザUS1による承認を受けて、第1スロットに第1バリューを追加する。
第1情報は、例えば、第1バリューと、第1バリューとは異なる第2バリュー(第2スロットパラメータ)と、を含む。第2バリューは、第1バリューに代わる候補である。例えば、第1情報は、第1ユーザUS1に、第1バリューに代えて第2バリューを追加する提案を含む。第2バリューの推定の精度は、第1バリューの推定の精度よりも高い。第2バリューは、例えば、第1バリューと第2バリューとの間の類似度に基づいて決定される。第1情報は、第2バリューと、別のバリューと、を含んでいても良い。
第1情報が第2ユーザUS2に送信される場合、第1情報は、対話システムの識別情報および対話システムのバージョンからなる群より選択される少なくとも1つをさらに含んでも良い。識別情報は、第1ユーザUS1に提供された対話システムを特定するための固有情報である。バージョンは、第1ユーザUS1に提供された対話システムの詳細を示す情報である。
支援システム110は、出力部30を含んでいても良い。出力部30は、第1情報を受信すると、第1情報を出力する。例えば、出力部30は、モニタである。この場合、出力部30は、第1情報を表示する。出力部30は、スピーカであり、第1情報を音声で出力しても良い。出力部30は、プリンタであり、第1情報を印刷して表示しても良い。
支援システム110は、第1バリューの推定の精度を表す第1評価値が低いときに、前記第1ユーザに第1情報を送信する。例えば、対話システムが第1バリューを含む問合せを受けた場合に適切に応答できないと推定されたとき、第1ユーザに第1情報が送信される。支援システム110は、第1バリューの推定の精度を表す第1評価値が高いときに、例えば、第1スロットに第1バリューを追加する。
これにより、第1ユーザUS1は、第1情報を参照して、第1スロットを編集できる。第1ユーザUS1が、第1バリューの推定の精度を、自ら調べる必要が無い。第1ユーザUS1のサービス提供システムに関する運用の知識が乏しい場合でも、第1ユーザUS1が、スロットへのバリューの追加を容易に行うことが可能となる。例えば、第1情報は、第2バリューを含む。これにより、第1ユーザUS1は、第1バリューに代えて、第2バリューを第1スロットに追加できる。第1スロットに追加されるバリューの推定の精度を向上できる。
例えば、ショッピングモールに中華料理を提供するレストランが開店する。この場合、図3に示したスロットS1に中華料理のバリューが含まれていないと、サービス提供システム80は、対話において中華料理を推定できない。サービス提供システムの利便性を向上させるためには、スロットに新たなバリュー(新規スロットパラメータ)を追加することが望ましい。この場合、サービス提供システムを運用する第1ユーザUS1によって、スロットへバリューが追加される。第1ユーザUS1の知識が乏しい場合、追加されたバリューが対話システムにおいて精度良く推定されるか、判断が難しい。
実施形態に係る支援システム110または支援方法によれば、第1バリューの推定の精度を表す第1評価値が低いときに、運用者に第1情報が送信される。実施形態に係るプログラムまたはこのプログラムを記憶した記憶媒体を用いることで、第1バリューの推定の精度を表す第1評価値が低いときに、運用者に第1情報が送信されるよう、第1処理部21を動作できる。これにより、運用者は、対話システムをより容易に運用することが可能となる。
上述した例では、第1バリューの推定の精度が低いほど、第1評価値が低い。第1バリューの推定の精度が高いほど、第1評価値が高い。第1評価値は、第1バリューの推定の精度が低いほど、高くなるように算出されて決定されても良い。第1評価値は、第1バリューの推定の精度が高いほど、低くなるように算出されて決定されても良い。
すなわち、支援システム110は、例えば、第1バリューの追加に関する第1評価値が第1状態のときに第1情報を送信し、第1評価値が第2状態のときに第1バリューを対話システムに追加する。第1評価値が第1状態にある場合、第1評価値が第2状態にある場合よりも、対話システムが第1バリューを含む問合せを受けた場合に適切に応答できない可能性が高い。
以下で、支援システム110のより具体的な一例を説明する。
支援システム110は、例えば、第1記憶部41、第2記憶部42、第3記憶部43、及び第1モデル記憶部51を含む。
第1記憶部41は、第1対話データを記憶する。第1対話データは、対話を模した文章を含む。第1対話データは、少なくとも1つの第1ブランクを含む。一例として、第1対話データは、「〇〇を食べたい」、「〇〇のお店を教えて」、または「〇〇じゃないお店」などの文章を含む。第1対話データに含まれる〇〇は、第1ブランクを表す。
第2記憶部42は、複数のバリューと複数の単語ベクトルを記憶する。複数の単語ベクトルは、それぞれ、複数のバリューに対応する。
第3記憶部43は、第1スロットを含む少なくとも1つのスロットを記憶する。複数のスロットのそれぞれは、少なくとも1つのバリューを含む。例えば、第3記憶部43は、図3に示すような複数のスロットS1〜Smを記憶する。
第1モデル記憶部51は、第1モデルを記憶する。第1モデルは、入力部及び出力部を含む。出力部は、複数の関数を含む。複数の関数は、それぞれ、複数のバリューに関する。第1モデルは、例えば、ニューラルネットワークである。上記複数の関数は、それぞれ、複数のニューロンに対応する。例えば、第1モデルに対話データの特徴量が入力されると、上記複数のニューロンの少なくとも1つが反応する。
第1記憶部41、第2記憶部42、第3記憶部43、及び第1モデル記憶部51は、例えば、HDDまたはフラッシュメモリである。
図5は、第1実施形態に係る支援システムの動作を例示するフローチャートである。
第1処理部21は、例えば、変換部21a、第1決定部21b、及び送信部21cを含む。
取得部10が第1バリューを取得する(Step1)と、変換部21aは第1記憶部41にアクセスする。変換部21aは、第1ブランクに第1バリューを設定する。一例として、第1バリューが「中華料理」である場合、変換部21aは、「中華料理を食べたい」という第1対話データを生成する。変換部21aは、第1記憶部41を参照し、第1バリューを含む第1対話データを、第2評価値に変換する(Step2a)。第2評価値は、上記第1対話データの特徴を表す。第1決定部21bは、第1モデル記憶部51を参照する。第1処理部21は、第1対話データの特徴を表す第2評価値を、第1モデルに入力し、第1モデルの出力に基づいて第1評価値を決定する(Step2b)。
例えば、第1モデルの出力部は、第1関数(第1ニューロン)を含む。第1関数は、第1バリューに関する。例えば、第1決定部21bは、第2評価値を第1モデルに入力し、出力部に含まれるニューロンのそれぞれの活性度を検出する。例えば、第1決定部21bは、活性度の総和に対する、それぞれのニューロンの活性度の割合を、推定の精度とする。第1決定部21bは、活性度の総和に対する、第1関数の活性度(第1関数の出力値)の割合を、第1評価値とする。
一例として、第1バリューは「中華料理」であり、第1関数は「中華料理の希望」という意図に対応する。第1バリューを含む第1対話データは、例えば、「中華料理を食べたい」である。この場合、第1バリューを含む第1対話データを第1モデルに入力し、第1関数の出力値が大きければ、第1対話データの意図を正しく推定できていることを意味する。
送信部21cは、例えば、第1評価値と、あらかじめ設定された第1閾値と、を比較する(Step3)。送信部21cは、第1評価値が第1閾値よりも低いときに、第1ユーザUS1に向けて第1情報を送信する(Step4)。
第1処理部21は、第1バリューを第1スロットに追加した際の、第1スロットに含まれる別のバリューの推定の精度の変化を検出しても良い。例えば、第1バリューが追加される前に、第1スロットは、第1既存バリューを含む。第1処理部21は、第1スロットに第1バリューが追加された状態における、第1既存バリューの推定の第1精度と、第1スロットに第1バリューが含まれない状態における、第1既存バリューの推定の第2精度と、を比較する。第1情報は、この比較結果を含んでいても良い。
図6は、第1実施形態に係る別の支援システムを例示する模式図である。
図6に示すように、支援システム120では、第1処理部21は、第1評価値が低いときに、第2ユーザUS2に第2情報を送信する。
例えば、第2情報は、第1スロットに含まれる別のバリューと、第1バリューと、を含む。支援システム120によれば、第2ユーザUS2は、第1バリューの推定の精度を向上させるために、第1モデルの再学習等を行うことができる。
図6に示す例では、支援システム120は、第2処理部22、第4記憶部44、第5記憶部45、及び第2モデル記憶部52をさらに含む。この例では、第1処理部21は、第2処理部22に第1情報を送信する。第2処理部22は、第1情報を用いて、第2モデルを再学習する。
第4記憶部44は、第2対話データを記憶する。第2対話データは、対話を模した文章を含む。第2対話データは、少なくとも1つの第2ブランクを含む。第2対話データは、第1対話データと同じであっても良い。一例として、第2対話データは、「〇〇を食べたい」、「〇〇のお店を教えて」、または「〇〇じゃないお店」などの文章を含む。第2対話データに含まれる〇〇は、第2ブランクを表す。
第5記憶部45は、第1ラベルを記憶する。第1ラベルは、第2対話データの意図を示す。一例として、第2対話データが「〇〇を食べたい」または「〇〇のお店を教えて」である場合、第1ラベルは「〇〇を希望」である。第2対話データが「〇〇じゃないお店」である場合、第1ラベルは「〇〇を否定」である。第1ラベルに含まれる〇〇は、第3ブランクを表す。
第2モデル記憶部52は、第2モデルを記憶する。第2モデルは、入力部及び出力部を含む。出力部は、複数の関数を含む。複数の関数は、複数のバリューに関する。第1モデル記憶部51に記憶された第1モデルは、例えば、第2モデルのコピーである。
図7は、第1実施形態に係る別の支援システムの動作を例示するフローチャートである。
第2処理部22は、例えば、第1データ生成部22a、第2データ生成部22b、推定部22c、第2決定部22d、及び更新部22eを含む。
図7に示したStep1〜Step4は、例えば、図5に示したStepS1〜StepS4と同様に実行される。
第1データ生成部22aは、第1情報を受信すると、第4記憶部44を参照する。第1データ生成部22aは、第2対話データの第2ブランクに第1バリューを設定する。これにより、第1バリューを含む第2対話データが生成される(Step5)。
第2データ生成部22bは、第1情報を受信すると、第5記憶部45を参照する。第2データ生成部22bは、第1ラベルの第3ブランクに第1バリューを設定する。これにより、第1バリューを含む第1ラベルが生成される(Step6)。
例えば第1バリューが「中華料理」である場合、第1データ生成部22aは、中華料理を第2ブランクに設定する。第2データ生成部22bは、中華料理を第3ブランクに設定する。これにより、「中華料理を食べたい」という第2対話データと、第2対話データの第2意図を示す「中華料理を希望」という第1ラベルと、が生成される。
推定部22cは、第1バリューを含む第2対話データを第3評価値に変換する(Step7)。第3評価値は、第1バリューを含む第2対話データの特徴を表す。推定部22cは、第2モデル記憶部52を参照する。推定部22cは、第2モデルに第3評価値を入力する。推定部22cは、第2モデルの出力に基づいて、第1バリューを含む第2対話データの第1意図を推定する(Step8)。
第2決定部22dは、第1意図及び第2意図に基づいてパラメータ更新量を決定する(Step9)。パラメータ更新量は、第2モデルのパラメータを変化させる量を表す。パラメータ更新量は、第1意図が第2意図に近づくように決定される。
一例として、第2対話データは「中華料理を食べたい」であり、第1ラベルは「中華料理を希望」である。例えば、この第2対話データに基づく推定部22cの推定結果は、「中華料理を否定」であった。この場合、第2決定部22dは、推定結果が第1ラベルと同じ「中華料理を希望」となるように、パラメータ更新量を決定する。
更新部22eは、第2決定部22dから出力されたパラメータ更新量に基づき、第2モデル記憶部52に記憶された第2モデルのパラメータを更新する(Step10)。
第2処理部22、第4記憶部44、第5記憶部45、及び第2モデル記憶部52は、例えば、第2ユーザUS2が所有する。この支援システム120によれば、第1バリューを含む第1情報が、第2ユーザUS2に向けて送信された際に、第2モデルが再学習される。第2ユーザUS2は、例えば、第2処理部22によって再学習された(パラメータが更新された)第2モデルを、第1ユーザUS1に提供する。再学習された第2モデルを、第1モデルに代えて第1モデル記憶部51に記憶することで、第1バリューの推定の精度を向上させることができる。
図8は、第2実施形態に係る支援システムを例示する模式図である。
図9は、第2実施形態に係る支援システムを例示するフローチャートである。
図8に示すように、支援システム210は、第6記憶部46、第3モデル記憶部53、及び第4モデル記憶部54を含む。
第3モデル記憶部53は、バリューの特徴に関する値と、バリューの推定の精度に関する値と、の関係を表す第3モデルを記憶する。第1決定部21bは、第1バリューの特徴量と、第3モデルと、を用いて、第1バリューの推定の精度を決定する。
第6記憶部46は、第2対話データを含む複数の対話データを記憶する。複数の対話データD1〜Dnでは、それぞれ、複数のバリューV1〜Vnに言及されている。複数のバリューV1〜Vnは、第3記憶部43に記憶されるバリューとは異なる別のバリューを含む。
第4モデル記憶部54は、第4モデルを含む複数のモデルM1〜Mnを記憶する。複数のモデルM1〜Mnは、それぞれ、複数の対話データD1〜Dnの特徴量と、複数のバリューV1〜Vnの推定の精度と、の関係を表す。
第3モデルは、例えば、複数の対話データD1〜Dnに基づいて予め学習される。
例えば、第1処理部21は、複数のバリューV1〜Vnのうち、m番目のバリューVmを新たに追加されたバリューとする(Step11)。複数の対話データD1〜Dnを、バリューVmに言及された対話データDmと、その他の対話データと、に分ける(Step12)。上記他の対話データの特徴を表す第5評価値を用いて、m番目のモデルMmを学習する。モデルMmと、対話データDmと、を用いて、バリューVmの推定の精度を測定する(Step13)。複数のバリューV1〜Vnの全てについてモデルを作成したか判定する(Step14)。
複数のバリューV1〜Vnの全てについてモデルが作成されている場合、それまでの過程で、複数のバリューV1〜Vnのそれぞれの推定の精度が測定されている。複数のバリューV1〜Vnの特徴量から、上記の複数の精度が算出されるよう第3モデルを学習する(Step15)。
例えば、第1ユーザUS1による入力に基づき、取得部10は、第1スロットに追加される第1バリューを取得する(Step16)。変換部21aは、第2記憶部42を参照し、第1バリューを第4評価値に変換する(Step17)。第4評価値は、第1バリューの特徴を表す。第1決定部21bは、第4評価値と第3モデルとを用いて、第1バリューの推定の精度を表す第1評価値を決定する(Step18)。送信部21cは、第1評価値と第1閾値とを比較する(Step19)。送信部21cは、第1評価値が第1閾値よりも低いときに、第1ユーザUS1に向けて第1情報を送信する(Step20)。
第2実施形態に係る支援システム210では、第3値と第3モデルを用いて、第1評価値が決定される。このため、第1実施形態に係る支援システム110に比べて、第1評価値をより短い時間で決定できる。
第2実施形態に係る支援システム210において、支援システム120と同様に、第2ユーザUS2に第1情報が送信されても良い。支援システム210は、支援システム120と同様に、第2処理部22、第4記憶部44、第5記憶部45、及び第2モデル記憶部52をさらに含んでいても良い。
以上で説明した各実施形態によれば、対話システムの運用を容易にできる支援システム、支援方法、プログラム、及び記憶媒体を提供できる。
以上、具体例を参照しつつ、本発明の実施の形態について説明した。しかし、本発明の実施形態は、これらの具体例に限定されるものではない。例えば、取得部、処理部、出力部、記憶部などの各要素の具体的な構成に関しては、当業者が公知の範囲から適宜選択することにより本発明を同様に実施し、同様の効果を得ることができる限り、本発明の範囲に包含される。
また、各具体例のいずれか2つ以上の要素を技術的に可能な範囲で組み合わせたものも、本発明の要旨を包含する限り本発明の範囲に含まれる。
その他、本発明の実施の形態として上述した支援システム、支援方法、プログラム、及び記憶媒体を基にして、当業者が適宜設計変更して実施し得る全ての支援システム、支援方法、プログラム、及び記憶媒体も、本発明の要旨を包含する限り、本発明の範囲に属する。
その他、本発明の思想の範疇において、当業者であれば、各種の変更例及び修正例に想到し得るものであり、それら変更例及び修正例についても本発明の範囲に属するものと了解される。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10 取得部、 21 第1処理部、 21a 変換部、 21b 第1決定部、 21c 送信部、 22 第2処理部、 22a 第1データ生成部、 22b 第2データ生成部、 22c 推定部、 22d 第2決定部、 22e 更新部、 30 出力部、 41 第1記憶部、 42 第2記憶部、 43 第3記憶部、 44 第4記憶部、 45 第5記憶部、 46 第6記憶部、 51 第1モデル記憶部、 52 第2モデル記憶部、 53 第3モデル記憶部、 54 第4モデル記憶部、 80 サービス提供システム、 110、120、210 支援システム、 D1〜Dn、Dm 対話データ、 M1〜Mn、Mm モデル、 S1〜Sm スロット、 US ユーザ、 US1 第1ユーザ、 US2 第2ユーザ、 V1〜Vn、Vm、V11〜V13、V21、V22 バリュー

Claims (16)

  1. 対話システムに用いられる新規スロットパラメータを追加するための支援システムであって、
    前記対話システムに追加される新規スロットパラメータを取得する取得部と、
    前記新規スロットパラメータを含む第1対話データを生成し、
    前記第1対話データを、前記第1対話データの特徴を表す第2評価値に変換し、
    前記第2評価値を第1モデルに入力し、前記第1モデルの出力に基づいて第1評価値を決定し、
    前記第1評価値に基づいて、前記新規スロットパラメータを含む第1情報を、前記対話システムの管理者の出力装置に送信する
    第1処理部と、
    を備えた支援システム。
  2. 既存スロットパラメータを有する対話システムに追加される第1スロットパラメータを取得する取得部と、
    前記第1スロットパラメータの追加に関する第1評価値が第1状態のときに、前記第1スロットパラメータと、前記第1スロットパラメータに代わる候補としての第2スロットパラメータと、を含む第1情報を前記対話システムの第1管理者の出力装置に送信し、前記第1評価値が前記第1状態と異なる第2状態のときに、前記第1スロットパラメータを前記対話システムに追加する第1処理部であって
    前記第1スロットパラメータを含む第1対話データを生成し、
    前記第1対話データを、前記第1対話データの特徴を表す第2評価値に変換し、
    前記第2評価値を第1モデルに入力し、前記第1モデルの出力に基づいて前記第1評価値を決定する、
    前記第1処理部と、
    を備えた支援システム。
  3. 前記第1処理部は、前記第1評価値が前記第1状態のときに、前記既存スロットパラメータ及び前記第1スロットパラメータを含む第2情報を前記対話システムの第2管理者の出力装置にさらに送信する請求項2記載の支援システム。
  4. 既存スロットパラメータを有する対話システムに追加される第1スロットパラメータを取得する取得部と、
    前記第1スロットパラメータの追加に関する第1評価値が第1状態のときに、前記既存スロットパラメータ及び前記第1スロットパラメータを含む情報を前記対話システムの管理者の出力装置に送信し、前記第1評価値が前記第1状態と異なる第2状態のときに、前記第1スロットパラメータを前記対話システムに追加する第1処理部であって
    前記第1スロットパラメータを含む第1対話データを生成し、
    前記第1対話データを、前記第1対話データの特徴を表す第2評価値に変換し、
    前記第2評価値を第1モデルに入力し、前記第1モデルの出力に基づいて前記第1評価値を決定する、
    前記第1処理部と、
    を備えた支援システム。
  5. 前記対話システムは、前記既存スロットパラメータを含む第1分類を有し、
    前記第1処理部は、前記第1評価値が前記第2状態のときに、前記第1分類へ前記第1スロットパラメータを追加する請求項4記載の支援システム。
  6. 第2処理部をさらに備え、
    前記第2処理部は、
    第2対話データ及び第1ラベルに前記第1スロットパラメータを設定し、
    第2モデルの入力部に、前記第1スロットパラメータを含む前記第2対話データの特徴を表す第3評価値を入力し、
    前記第2モデルから出力される第2意図が、前記第1ラベルに示される第1意図と一致するように、前記第2モデルに含まれるスロットパラメータを変更する、
    請求項2〜5のいずれか1つに記載の支援システム。
  7. 前記第1処理部は、前記第1スロットパラメータの特徴を表す第4評価値を生成し、前記第4評価値に基づいて前記第1評価値を決定する請求項のいずれか1つに記載の支援システム。
  8. 前記第1処理部は、
    前記第1スロットパラメータに対応する単語ベクトルに基づき前記第4評価値を生成し、
    第3モデルの入力部に前記第4評価値を入力し、
    前記第3モデルの出力に基づいて前記第1評価値を決定する
    請求項記載の支援システム。
  9. 前記第1処理部は、
    第4モデルを、第3スロットパラメータに関する第3対話データを用いて学習させ、
    前記第1スロットパラメータを含む第4対話データを前記第4モデルに入力し、前記第4モデルの出力に基づいて第5評価値を決定し、
    前記第3モデルを、前記第1スロットパラメータの特徴を表す値と、前記第5評価値と、を用いて学習させ、
    学習された前記第3モデルに前記第4評価値を入力し、前記第3モデルの前記出力に基づいて前記第1評価値を決定する
    請求項記載の支援システム。
  10. 前記第1処理部は、前記第1スロットパラメータが追加された際の前記既存スロットパラメータの推定の精度の変化を検出する請求項のいずれか1つに記載の支援システム。
  11. 対話システムに用いられる新規スロットパラメータを追加するための支援システムであって、
    第1ユーザにより追加される第1新規スロットパラメータを取得する取得部と、
    前記新規スロットパラメータを含む第1対話データを生成し、
    前記第1対話データを、前記第1対話データの特徴を表す第2評価値に変換し、
    前記第2評価値を第1モデルに入力し、前記第1モデルの出力に基づいて、前記第1新規スロットパラメータの推定の精度を表す第1評価値を決定し、
    前記第1評価値が低いときに、前記第1ユーザの出力装置に第1情報を送信する
    処理部と、
    を備えた支援システム。
  12. 前記第1情報は、前記第1新規スロットパラメータに代わる候補としての第2新規スロットパラメータを含む請求項11記載の支援システム。
  13. 第1ユーザが対話システムに追加する新規スロットパラメータを取得する取得部と、
    前記対話システムを利用する場合に前記新規スロットパラメータを含む問合せに適切に応答できないと推定されたとき、前記新規スロットパラメータを含む第1情報を、前記第1ユーザの出力装置に送信する第1処理部であって、
    前記新規スロットパラメータを含む第1対話データを生成し、
    前記第1対話データを、前記第1対話データの特徴を表す第2評価値に変換し、
    前記第2評価値を第1モデルに入力し、前記第1モデルの出力に基づいて第1評価値を決定し、
    前記第1評価値に基づいて、前記問合わせへの応答の適否を判定する、前記第1処理部と、
    を備えた支援システム。
  14. 対話システムに用いられる新規スロットパラメータを追加するための支援方法であって、
    前記対話システムに追加される新規スロットパラメータを取得し、
    前記新規スロットパラメータを含む第1対話データを生成し、
    前記第1対話データを、前記第1対話データの特徴を表す第2評価値に変換し、
    前記第2評価値を第1モデルに入力し、前記第1モデルの出力に基づいて第1評価値を決定し、
    前記第1評価値に基づいて、前記新規スロットパラメータを含む第1情報を、前記対話システムの管理者の出力装置に送信する支援方法。
  15. 第1処理部に、
    対話システムに追加される新規スロットパラメータを取得させ、
    前記新規スロットパラメータを含む第1対話データを生成させ、
    前記第1対話データを、前記第1対話データの特徴を表す第2評価値に変換させ、
    前記第2評価値を第1モデルに入力し、前記第1モデルの出力に基づいて第1評価値を決定させ、
    前記第1評価値に基づいて、前記新規スロットパラメータを含む第1情報を、前記対話システムの管理者の出力装置に送信させる
    プログラム。
  16. 第1処理部に、
    対話システムに追加される新規スロットパラメータを取得させ、
    前記新規スロットパラメータを含む第1対話データを生成させ、
    前記第1対話データを、前記第1対話データの特徴を表す第2評価値に変換させ、
    前記第2評価値を第1モデルに入力し、前記第1モデルの出力に基づいて第1評価値を決定させ、
    前記第1評価値に基づいて、前記新規スロットパラメータを含む第1情報を、前記対話システムの管理者の出力装置に送信させるプログラムを記憶した記憶媒体。
JP2017220054A 2017-11-15 2017-11-15 支援システム、支援方法、プログラム、及び記憶媒体 Active JP6856498B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017220054A JP6856498B2 (ja) 2017-11-15 2017-11-15 支援システム、支援方法、プログラム、及び記憶媒体
US15/904,210 US10490189B2 (en) 2017-11-15 2018-02-23 Support system, support method, and memory medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017220054A JP6856498B2 (ja) 2017-11-15 2017-11-15 支援システム、支援方法、プログラム、及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2019091287A JP2019091287A (ja) 2019-06-13
JP6856498B2 true JP6856498B2 (ja) 2021-04-07

Family

ID=66433502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017220054A Active JP6856498B2 (ja) 2017-11-15 2017-11-15 支援システム、支援方法、プログラム、及び記憶媒体

Country Status (2)

Country Link
US (1) US10490189B2 (ja)
JP (1) JP6856498B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743127B (zh) * 2021-09-10 2024-06-18 京东科技信息技术有限公司 任务型对话的方法、装置、电子设备及存储介质

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6088091A (ja) 1983-10-21 1985-05-17 Hitachi Ltd 噴流層石炭ガス化炉の運転方法及びその装置
US5404295A (en) * 1990-08-16 1995-04-04 Katz; Boris Method and apparatus for utilizing annotations to facilitate computer retrieval of database material
JP3279684B2 (ja) * 1992-11-17 2002-04-30 株式会社日立製作所 音声インタフェース・ビルダ・システム
US5963902A (en) * 1997-07-30 1999-10-05 Nynex Science & Technology, Inc. Methods and apparatus for decreasing the size of generated models trained for automatic pattern recognition
JP2001022778A (ja) * 1999-07-09 2001-01-26 Fuji Xerox Co Ltd 検索装置及び検索方法
CA2307404A1 (en) * 2000-05-02 2001-11-02 Provenance Systems Inc. Computer readable electronic records automated classification system
JP4220151B2 (ja) * 2001-11-26 2009-02-04 株式会社豊田中央研究所 音声対話装置
US7103542B2 (en) * 2001-12-14 2006-09-05 Ben Franklin Patent Holding Llc Automatically improving a voice recognition system
JP2004240859A (ja) * 2003-02-07 2004-08-26 Oki Electric Ind Co Ltd 言い換えシステム
US8185399B2 (en) * 2005-01-05 2012-05-22 At&T Intellectual Property Ii, L.P. System and method of providing an automated data-collection in spoken dialog systems
JP4769005B2 (ja) 2005-03-31 2011-09-07 株式会社日立製作所 情報処理支援システム及び情報処理支援プログラム
US8027457B1 (en) * 2005-12-01 2011-09-27 Cordell Coy Process for automated deployment of natural language
KR100766586B1 (ko) * 2006-08-16 2007-10-12 포스데이타 주식회사 무선통신망의 구성요소 관리 시스템
US8494136B2 (en) * 2007-06-25 2013-07-23 International Business Machines Corporation Systems and arrangements for communicating with an automated interactive telecommunications service system
US8185539B1 (en) * 2008-08-12 2012-05-22 Foneweb, Inc. Web site or directory search using speech recognition of letters
JP5379665B2 (ja) * 2009-12-16 2013-12-25 ニフティ株式会社 辞書生成処理方法、プログラム及び装置
JP2012247948A (ja) 2011-05-26 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> 辞書管理装置、辞書管理方法、辞書管理プログラム
US9373322B2 (en) * 2013-04-10 2016-06-21 Nuance Communications, Inc. System and method for determining query intent
KR101770527B1 (ko) 2013-11-27 2017-08-22 가부시키가이샤 엔티티 도코모 기계학습에 기초한 자동 태스크 분류 방법
US20150228004A1 (en) * 2014-02-07 2015-08-13 Kristin Kaye Bednarek Smart Device Apps and Incentives For Encouraging The Creation and Sharing Electronic Lists To Imrpove Targeted Marketing While Preserving User Anonymity
US20150227890A1 (en) * 2014-02-07 2015-08-13 Kristin Kaye Bednarek Communications system and smart device apps supporting segmented order distributed distribution system
CN104360897B (zh) * 2014-10-29 2017-09-22 百度在线网络技术(北京)有限公司 对话处理方法和对话管理系统
US9886953B2 (en) * 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9812127B1 (en) * 2016-04-29 2017-11-07 Conduent Business Services, Llc Reactive learning for efficient dialog tree expansion
JP6088091B1 (ja) 2016-05-20 2017-03-01 ヤフー株式会社 更新装置、更新方法、及び更新プログラム
US20180054464A1 (en) * 2016-08-16 2018-02-22 Rulai, Inc. Method and system for collaborative intelligent virtual agents
US10643601B2 (en) * 2017-02-09 2020-05-05 Semantic Machines, Inc. Detection mechanism for automated dialog systems
US20180293221A1 (en) * 2017-02-14 2018-10-11 Microsoft Technology Licensing, Llc Speech parsing with intelligent assistant
WO2018161048A1 (en) * 2017-03-02 2018-09-07 Semantic Machines, Inc. Developer platform for providing automated assistant in new domains

Also Published As

Publication number Publication date
JP2019091287A (ja) 2019-06-13
US20190147866A1 (en) 2019-05-16
US10490189B2 (en) 2019-11-26

Similar Documents

Publication Publication Date Title
KR102447513B1 (ko) 점증적 대화지식 자가학습 기반 대화장치 및 그 방법
US20200074993A1 (en) Electronic device, method for determining utterance intention of user thereof, and non-transitory computer-readable recording medium
JP7132090B2 (ja) 対話システム、対話装置、対話方法、及びプログラム
US10839788B2 (en) Systems and methods for selecting accent and dialect based on context
US20200193971A1 (en) System and methods for accent and dialect modification
JP7249378B2 (ja) 対話装置、プログラム、及び対話方法
EP3966809B1 (en) Wake word selection assistance architectures and methods
EP3201770B1 (en) Methods and apparatus for module arbitration
CN102483883B (zh) 电子阅读装置
JP6408080B1 (ja) 生成装置、生成方法及び生成プログラム
KR101832816B1 (ko) 질의에 대한 응답 생성 장치 및 방법
US20200243082A1 (en) Dialog system and dialog method
JP6873805B2 (ja) 対話支援システム、対話支援方法、及び対話支援プログラム
JP7058574B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US11158308B1 (en) Configuring natural language system
JP2018194902A (ja) 生成装置、生成方法および生成プログラム
KR20190024148A (ko) 음성 인식 장치 및 음성 인식 방법
KR20090023417A (ko) 의심스런 인식 결정을 식별하기 위한 방법 및 컴퓨터 판독가능 매체
CN113555021A (zh) 用于对IoT设备执行动作的设备、方法及计算机程序
JP6856498B2 (ja) 支援システム、支援方法、プログラム、及び記憶媒体
US11922126B1 (en) Use of semantic confidence metrics for uncertainty estimation in large language models
JP2004053652A (ja) 発音判定システム、システム管理用サーバ及びプログラム
US12051415B1 (en) Integration of speech processing functionality with organization systems
KR20170048008A (ko) 질의의도를 분석하기 위한 장치 및 방법
JP6481643B2 (ja) 音声処理システムおよび音声処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190815

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200917

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210318

R151 Written notification of patent or utility model registration

Ref document number: 6856498

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151