JP6882975B2 - 対話ログ群からコンテキストを決定可能な対話シナリオ生成装置、プログラム及び方法 - Google Patents

対話ログ群からコンテキストを決定可能な対話シナリオ生成装置、プログラム及び方法 Download PDF

Info

Publication number
JP6882975B2
JP6882975B2 JP2017230224A JP2017230224A JP6882975B2 JP 6882975 B2 JP6882975 B2 JP 6882975B2 JP 2017230224 A JP2017230224 A JP 2017230224A JP 2017230224 A JP2017230224 A JP 2017230224A JP 6882975 B2 JP6882975 B2 JP 6882975B2
Authority
JP
Japan
Prior art keywords
dialogue
context
utterance
scenario
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017230224A
Other languages
English (en)
Other versions
JP2019101619A (ja
Inventor
剣明 呉
剣明 呉
俊幸 萩谷
俊幸 萩谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2017230224A priority Critical patent/JP6882975B2/ja
Publication of JP2019101619A publication Critical patent/JP2019101619A/ja
Application granted granted Critical
Publication of JP6882975B2 publication Critical patent/JP6882975B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ユーザとの間で対話を行う対話システムの技術に関する。
近年、ユーザと対話を行い、当該ユーザに種々のサービスを提供可能な対話システムの開発が盛んに進められている。例えば、現在普及しているスマートフォンには、ユーザの発話による問合せに音声で回答し、検索結果等の情報を提供する対話応答機能が常備されているものも少なくない。
また、この対話システムで使用される対話シナリオを作成するためのオーサリングツールも、現在盛んに改良が進められている。例えば、対話遷移を可視化することによって、シナリオ作成者の作成作業を容易化するツールが数多く開発されている。
このような対話システムの具体例として、特許文献1には、ユーザの問合せに対し網羅的に回答を提供できるようなエージェントの技術が開示されている。このエージェントは、ユーザとエージェントとの対話の発話単位をノードとするリスト構造を形成し、ノードの情報に基づいてリスト構造の対話を結合させ、対話を分岐木構造として記録する対話データベースを有している。このエージェントは、ユーザ又は自身が要求する所定の条件に基づき、この対話データベースに記録された分岐木構造の対話を検索して応答を行う。
特開2009−205552号公報
しかしながら、特許文献1に記載されたような従来技術では、対話の相手が置かれた状況に応じた対話を実現することが、依然大きな課題となっている。
実際、対話における発話から発話への移り変わり(対話遷移)は、発話を構成する言語の情報(言語情報)によって変化するだけでなく、例えば場所や時刻、季節等の、対話の相手が置かれた状況、すなわち「コンテキスト」によっても大きく変わり得るのである。
一方で、このようなコンテキストを考慮した対話シナリオの作成は容易ではない。具体的には、対話遷移における複数の分岐やターンの条件にコンテキストを含めることになるが、この場合、これらのコンテキストを含む条件に相応する応答、すなわち状態遷移の適切な記述が必要となってしまう。
また、シナリオ作成者が想定したシナリオ通りにコンテキストをカバーすることも容易ではない。すなわち、対話シナリオを作成する際、どのようなコンテキストを想定して条件分岐を準備しておくかを決めることは相当に困難となっている。実際、対話遷移を可視化してシナリオ作成者が容易に対話を作成可能なように工夫されたオーサリングツールは開発されているが、依然として、如何にコンテキストを考慮して適切な対話遷移を含む対話シナリオの作成を進めるかが重大な問題となっているのである。
そこで、本発明は、作成すべきシナリオ内容に応じたコンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを生成可能な装置、プログラム及び方法を提供することを目的とする。
本発明によれば、コンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを生成する装置であって、
過去に生成された対話シナリオを利用したユーザについての対話ログ群であって、発話毎にコンテキスト情報が紐づけられた対話ログの集合である対話ログ群から、想定発話と類似する発話を含む複数の対話ログを抽出する類似対話ログ抽出手段と、
抽出された当該複数の対話ログに含まれる単語のうち、所定条件を満たす高い特徴の度合いを有する単語を、コンテキストとして抽出するコンテキスト抽出手段と、
過去に生成された対話シナリオから生成される対話シナリオデータベースであってコンテキスト毎に発話が紐づけられた対話シナリオデータベースから抽出した、抽出されたコンテキストに紐づけられた発話を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定する、または、過去に生成された対話シナリオの内容を要約した若しくは象徴するテキストであるタイトルテキストを取得して、当該タイトルテキストから固有表現及び発話に係る情報を抽出し、抽出されたコンテキストに相当する当該固有表現に対応する発話に係る情報を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定するコンテキスト対応発話決定手段と、
抽出されたコンテキストと、当該コンテキストに対応する当該コンテキスト対応発話とを、選択可能なように提示させるユーザインタフェース制御手段と、
選択されたコンテキストを、生成すべきシナリオにおける当該想定発話からの遷移条件としており、選択されたコンテキスト対応発話を用いて構成された対話遷移パターンを生成する対話遷移パターン生成手段と
を有する対話シナリオ生成装置が提供される。
この本発明による対話シナリオ生成装置において、類似対話ログ抽出手段は、当該対話ログ群の各対話ログに含まれる発話の特徴ベクトル又は分散表現と、当該想定発話の特徴ベクトル又は分散表現との類似度を算出し、所定条件を満たす高い類似度を有する発話を含む複数の対話ログを抽出することも好ましい。
また、本発明による対話シナリオ生成装置において、コンテキスト抽出手段は、当該複数の対話ログの各対話ログに含まれる発話の特徴ベクトル又は分散表現に対して主成分分析を行い、所定条件を満たす大きい主成分負荷量を係数とする変数に係る単語を、コンテキストとして抽出することも好ましい。
またはその変更態様として、コンテキスト抽出手段は、抽出された当該複数の対話ログに含まれる単語のうち、自身の含まれる対話ログの数が所定条件を満たす大きい数である単語を、コンテキストとして抽出することも好ましい。
さらに、本発明による対話シナリオ生成装置の一実施形態において、このユーザインタフェース制御手段は、抽出されたコンテキストを、当該コンテキストの特徴の度合いの高い順に提示させることも好ましい。
を有することを特徴とする対話シナリオ生成方法。
本発明によれば、また、コンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを生成する装置に搭載されたコンピュータを機能させるプログラムであって、
過去に生成された対話シナリオを利用したユーザについての対話ログ群であって、発話毎にコンテキスト情報が紐づけられた対話ログの集合である対話ログ群から、想定発話と類似する発話を含む複数の対話ログを抽出する類似対話ログ抽出手段と、
抽出された当該複数の対話ログに含まれる単語のうち、所定条件を満たす高い特徴の度合いを有する単語を、コンテキストとして抽出するコンテキスト抽出手段と、
過去に生成された対話シナリオから生成される対話シナリオデータベースであってコンテキスト毎に発話が紐づけられた対話シナリオデータベースから抽出した、抽出されたコンテキストに紐づけられた発話を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定する、または、過去に生成された対話シナリオの内容を要約した若しくは象徴するテキストであるタイトルテキストを取得して、当該タイトルテキストから固有表現及び発話に係る情報を抽出し、抽出されたコンテキストに相当する当該固有表現に対応する発話に係る情報を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定するコンテキスト対応発話決定手段と、
抽出されたコンテキストと、当該コンテキストに対応する当該コンテキスト対応発話とを、選択可能なように提示させるユーザインタフェース制御手段と、
選択されたコンテキストを、生成すべきシナリオにおける当該想定発話からの遷移条件としており、選択されたコンテキスト対応発話を用いて構成された対話遷移パターンを生成する対話遷移パターン生成手段と
してコンピュータを機能させる対話シナリオ生成プログラムが提供される。
本発明によれば、さらに、コンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを生成する装置に搭載されたコンピュータにおいて実施される対話シナリオ生成方法であって、
過去に生成された対話シナリオを利用したユーザについての対話ログ群であって、発話毎にコンテキスト情報が紐づけられた対話ログの集合である対話ログ群から、想定発話と類似する発話を含む複数の対話ログを抽出するステップと、
抽出された当該複数の対話ログに含まれる単語のうち、所定条件を満たす高い特徴の度合いを有する単語を、コンテキストとして抽出するステップと、
過去に生成された対話シナリオから生成される対話シナリオデータベースであってコンテキスト毎に発話が紐づけられた対話シナリオデータベースから抽出した、抽出されたコンテキストに紐づけられた発話を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定する、または、過去に生成された対話シナリオの内容を要約した若しくは象徴するテキストであるタイトルテキストを取得して、当該タイトルテキストから固有表現及び発話に係る情報を抽出し、抽出されたコンテキストに相当する当該固有表現に対応する発話に係る情報を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定するステップと、
抽出されたコンテキストと、当該コンテキストに対応する当該コンテキスト対応発話とを、選択可能なように提示させるステップと、
選択されたコンテキストを、生成すべきシナリオにおける当該想定発話からの遷移条件としており、選択されたコンテキスト対応発話を用いて構成された対話遷移パターンを生成するステップと
を有する対話シナリオ生成方法が提供される。
本発明の対話シナリオ生成装置、プログラム及び方法によれば、作成すべきシナリオ内容に応じたコンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを生成することができる。
本発明による対話シナリオ生成装置の一実施形態における機能構成を示す機能ブロック図である。 対話ログデータベース(DB)に保存・管理された対話ログ群の一実施例を示すテーブルである。 対話シナリオ生成装置における対話作成のための想定発話入力画面の一実施例を示す模式図である。 本発明に係る特徴ベクトル生成部及び類似度算出部での処理における2つの実施形態を説明するための模式図である。 対話シナリオ生成装置における対話作成のためのコンテキスト候補提示画面の一実施例を示す模式図である。 本発明による対話シナリオ生成方法の一実施形態を概略的に示すフローチャートである。
以下では、本発明の実施形態について、図面を用いて詳細に説明する。
[対話シナリオ生成装置]
図1は、本発明による対話シナリオ生成装置の一実施形態における機能構成を示す機能ブロック図である。
図1によれば、本発明の一実施形態としての対話シナリオ生成装置1は、シナリオ作成者との間で、キーボード(KB)102及びディスプレイ(DP)103を介して情報の入出力(やり取り)を行いながら、対話シナリオを生成するオーサリングツールである。
この対話シナリオ生成装置1は、本実施形態において通信インタフェース101を備えており、対話ログデータベース(DB)3から通信ネットワークを介して、対話シナリオを利用したユーザについての「対話ログ群」を取得する。
ここで、対話ログDB3は、例えば対話エンジン211を搭載した多数のスマートフォン2において実施されたユーザ・装置間の対話情報を収集してデータベース化し、発話毎にコンテキスト情報が紐づけられた対話ログの集合である「対話ログ群」を提供可能となっている。この「対話ログ群」については、後に図2を用いて具体的に説明する。
対話シナリオ生成装置1は、このような「対話ログ群」を利用することによって、「コンテキスト」を遷移条件とした対話遷移パターンを含む対話シナリオを生成可能となっている。具体的に、対話シナリオ生成装置1は、その特徴として、
(A)「対話ログ群」から、想定発話と類似する発話を含む複数の対話ログを抽出する類似対話ログ抽出部111と、
(B)抽出された複数の対話ログに含まれる単語のうち、所定条件を満たす高い特徴の度合いを有する単語を、「コンテキスト」として抽出するコンテキスト抽出部112と、
(C)抽出された「コンテキスト」を、生成すべきシナリオにおける想定発話からの遷移条件又は遷移条件候補として、対話遷移パターンを生成する対話遷移パターン生成部115と
を有している。
ここで、「コンテキスト」とは、対話の相手が置かれた状況(例えば場所、時刻や、季節等)のことである。実際、対話シナリオを作成する場合、対話における発話から発話への移り変わり(対話遷移)は、発話を構成する言語の情報(言語情報)によって変化するだけでなく、この「コンテキスト」によっても大きく変わり得る。すなわち、「コンテキスト」は非常に重要な遷移条件の1つとなっている。しかしながら、従来、このような「コンテキスト」を考慮した対話シナリオの作成は非常に困難であった。
これに対し、対話シナリオ生成装置1によれば、取得した「対話ログ群」から、遷移条件となり得る「コンテキスト」を決定し、この好適に決定された「コンテキスト」を遷移条件又は遷移条件候補とした対話遷移パターンを含む対話シナリオを生成することが可能となるのである。
また、「対話ログ群」から動的に「コンテキスト」を抽出するので、網羅すべき遷移条件となり得る「コンテキスト」を決定することができ、最終的に、生成した対話シナリオにおける応答のバリエーションや応答の網羅性をより向上させることが可能となる。
なお当然に、「対話ログ群」は、外部のデータベースから取得されるものに限定されない。例えば、対話シナリオ生成装置1で若しくは他のツールで作成された対話シナリオを搭載した対話エンジン211を備えた多数のスマートフォン2から、実施されたユーザ・装置間の対話情報を、装置1自体が収集してもよい。この場合、装置1内に設けられた対話ログDB104が、「対話ログ群」を保存・管理することになる。
また、対話シナリオ生成装置1が取得する「対話ログ群」は、特定のユーザ又はユーザ集合についての対話ログ群や、特定のシナリオ作成者が作成した対話シナリオを利用したユーザ・装置間対話についての対話ログ群に限定してもよい。この場合、特定のユーザ(集合)にカスタマイズされた対話シナリオや、特定のシナリオ作成者の特徴が反映された対話シナリオを生成することも可能となる。
また、対話シナリオ生成装置1は、決定した「コンテキスト」を遷移条件や遷移条件候補としてディスプレイ103に表示したり、表示した「コンテキスト」に合った発話の候補や、生成した対話遷移パターン、さらには対話シナリオデータをディスプレイ103に表示したりし、これらの情報をシナリオ作成者に提示することも好ましい。また、これらの情報を、通信インタフェース101を介して外部の情報処理装置へ送信してもよい。
さらに例えば、遷移条件候補としての「コンテキスト」や、それに合った「発話候補」を提示されたシナリオ作成者が、いずれの「コンテキスト」や「発話候補」を採用するかについての指示を、例えばキーボード102を介して装置1に入力可能となっていることも好ましい。また、シナリオ作成者が当初、想定発話(文)を例えばキーボード102を介して装置1に入力可能となっていることも好ましい。この場合、対話シナリオ生成装置1は、コンテキストの付与された「対話ログ群」に基づいて、入力された想定発話に対し自動的にコンテキストを提示するのである。
いずれにしても本発明によれば、シナリオ作成者との間のユーザインタフェースを、上述したように充実させることも可能となる。この場合、コンテキストを考慮した対話シナリオ作成に好適なユーザインタフェース環境を提供することができるので、そのような対話シナリオ作成の際の作業の煩雑さを軽減し、また、シナリオ作成者が熟練者でなくとも容易に、そのような対話シナリオを作成することが可能となるのである。
[装置機能構成]
同じく図1の機能ブロック図によれば、対話シナリオ生成装置1は、通信インタフェース101と、キーボード(KB)102と、ディスプレイ(DP)103と、対話ログデータベース(DB)104と、対話シナリオDB105と、タイトルテキスト保存部106と、プロセッサ・メモリとを有する。
ここで、このプロセッサ・メモリは、本発明による対話シナリオ生成プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、この対話シナリオ生成プログラムを実行することによって、対話シナリオ生成処理を実施する。このことから、対話シナリオ生成装置1は、本発明による対話シナリオ生成プログラムを搭載した、例えばパーソナル・コンピュータ(PC)、ノート型若しくはタブレット型コンピュータ、又はスマートフォン等であってもよい。
さらに、このプロセッサ・メモリは、機能構成部として、特徴ベクトル生成部111a及び類似度算出部111bを含む類似対話ログ抽出部111と、特徴ベクトル生成部112a及び主成分分析部112bを含むコンテキスト抽出部112と、コンテキスト対応発話決定部113と、ユーザインタフェース制御部114と、対話遷移パターン生成部115と、通信制御部121とを有する。なお、これらの機能構成部は、プロセッサ・メモリに保存された対話シナリオ生成プログラムの機能と捉えることができる。また、図1における対話シナリオ生成装置1の機能構成部間を矢印で接続して示した処理の流れは、本発明による対話シナリオ生成方法の一実施形態としても理解される。
同じく図1の機能ブロック図において、対話ログDB104は、対話シナリオを利用したユーザについての対話ログ群であって、発話毎にコンテキスト情報が紐づけられた対話ログの集合である対話ログ群を保存・管理している。勿論、この対話ログDB104に代えて、外部の対話ログDB3がこのような対話ログ群を保存・管理しることも好ましい。
図2は、対話ログDB(3,104)に保存・管理された対話ログ群の一実施例を示すテーブルである。
図2によれば、対話ログDB(3,104)では、ユーザの発話毎に、(a)当該発話が行われた年月日、(b)当該発話が行われた時刻、(c)当該発話が行われた場所の区分、d)当該発話が行われた場所の市町村別、(e)当該発話を行ったユーザの識別子(ID)、及び(f)当該発話が行われた際の天気区分、が対応付けられて記録されている。
このうち、(e)ユーザID以外は全て、抽出すべきコンテキストの候補となり得るのである。ちなみに、ここで、特定のユーザIDの発話のみを対話ログとして採用することも可能である。これにより、特定のユーザにカスタマイズされた対話シナリオを生成することも可能となる。次に、対話ログ群からのコンテキスト抽出処理を実施するにあたって必要となる、想定発話の入力を説明する。
図3は、対話シナリオ生成装置1における対話作成のための想定発話入力画面の一実施例を示す模式図である。
図3によれば、シナリオ作成者は最初に、ディスプレイ103に表示されたユーザ入力画面の想定発話入力ボックスに、想定発話テキストデータ「おはよう。」を入力する。なおこの想定発話は、キーボード102を介して入力されてもよく、(図示していない)マイクから音声入力されてもよく、または、外部の端末等から装置1へ送信されてくるデータとすることも可能である。
図1に戻って、類似対話ログ抽出部111は、シナリオ作成者が入力した想定発話(テキストデータ)を取得し、対話ログDB3から取得した対話ログ群から、この想定発話と類似する発話を含む複数の対話ログ(類似対話ログ集合)を抽出する。
具体的に、類似対話ログ抽出部111の特徴ベクトル生成部111aは、
(a)取得された想定発話の特徴ベクトル又は分散表現と、
(b)取得された対話ログ群の各対話ログに含まれる発話の特徴ベクトル又は分散表現と
を算出する。次いで、類似度算出部111bは、上記(a)の特徴ベクトル又は分散表現と、上記(b)の特徴ベクトル又は分散表現との類似度を算出する。
ここで、類似対話ログ抽出部111は、算出された類似度に基づき、所定条件を満たす高い類似度(例えば所定閾値以上の類似度)を有する発話を含む類似対話ログ集合を抽出するのである。
図4は、特徴ベクトル生成部111a及び類似度算出部111bでの処理における2つの実施形態を説明するための模式図である。
図4(A)に示した実施形態では、取得された想定発話、及び対話ログ群における1つの対話ログとしてそれぞれ、
S1:「おはようございます!」
S2:「やあ、おはよう」
を設定し、両者の類似度を算出している。ここで、形態素解析等を用いて上記の両文を単語列にすると、例えば下記の通りとなる。
S1:「おはよう」「ござい」「ます」「!」
S2:「やあ」「おはよう」
本実施形態では、
(a)このような想定発話S1及び対話ログS2のそれぞれにおいて、Bag Of Wordsを用いて発話文に出現する各単語の出現数を導出し、
(b)これら単語毎の出現数をベクトル要素とした(単語毎の出現数を基底とした)特徴ベクトルV1及びV2(図4(A))を生成して、
(c)ベクトルV1及びV2のcos類似度Cos(V1,V2)(図4(A))を算出し、
算出されたcos類似度Cos(V1,V2)を、想定発話S1及び対話ログS2の類似度とするのである。
一方、図4(B)に示した実施形態では、Word2Vecを利用している。具体的には、
(a)想定発話S1及び対話ログS2のそれぞれにおいて、Word2Vecを用い、文中に含まれる単語毎の分散表現のベクトルV1及びV2(図4(B))を生成し、
(b)分散表現V1及びV2のcos類似度Cos(V1,V2)(図4(B))から、想定発話S1及び対話ログS2の類似度を算出する。
ちなみに、いずれの実施形態を採用するにしても、類似度値(スコア)は、図4(A)及び(B)のCos(V1,V2)のように、0(類似の度合いが最低)から1(類似の度合いが最高)までの値に規格化されることも好ましい。この場合、対話ログ群から類似対話ログ集合を抽出する際に用いる類似度の閾値Thは、0と1との間の値、例えば0.5とすることができる。例えば、算出された類似度がこの類似度閾値Thを超えている対話ログを対話ログ群から抽出して、類似対話ログ集合とするのである。
図1に戻って、コンテキスト抽出部112は、類似対話ログ抽出部111で抽出された類似対話ログ集合(類似する複数の対話ログ)に含まれる単語のうち、所定条件を満たす高い特徴の度合いを有する単語を、コンテキストとして抽出する。このコンテキストとしての単語の抽出方法としては、例えば、
(a)主成分分析を用いて、主成分負荷量の大きい単語を抽出してもよく、または、
(b)対話ログにおける出現数の大きい単語を抽出してもよい。
このうち上記(a)では、抽出された類似対話ログ集合の各対話ログに含まれる発話の(正規化された)特徴ベクトル又は分散表現に対して主成分分析を行い、所定条件を満たす大きい主成分負荷量を係数とする変数に係る単語を、コンテキストとして抽出する。
具体的には例えば、類似対話ログ集合におけるN個の対話ログの各々を構成する各単語を変数Xとした合成変数(主成分)Zを設定して主成分分析処理を行い、次式
(1) Zi=ai1X1+ai2X2+・・+aijXj+・・ (i=1, 2, ・・・, N)
における主成分負荷量a(aij)を算出する。次いで、算出された主成分負荷量aから大きい順に所定数(例えば3つ)だけマークし、マークされた主成分負荷量を係数とする変数Xに係る単語を、コンテキストとして抽出する。
ここで、主成分負荷量aは、変数(単語)Xの主成分Zに対する寄与の程度を示す指標となっており、主成分負荷量aが大きいほど、その単語の類似対話ログ群に対する特徴の度合いがより高いと判断されるのである。
一方、上記(b)では、抽出された類似対話ログ集合に含まれる単語のうち、自身の含まれる対話ログの数が所定条件を満たす大きい数(例えば所定閾値を超える数)である単語を、コンテキストとして抽出する。
いずれにしても、類似対話ログ集合から特徴的な付加情報ともいえるコンテキストを抽出することができる。例えば具体的に、以下のようなコンテキストが取得される。
・時間に係るコンテキスト:「朝」
・場所に係るコンテキスト:「自宅」
・天候に係るコンテキスト:「晴れ」
以上説明したように、コンテキスト抽出部112は、現実の対話実績である対話ログ群から想定発話に関連するコンテキストを取り出すので、このように取り出されたコンテキストを考慮することによって、実際に起こり得る様々なコンテキスト下での対話遷移をカバーすることが可能となるのである。
同じく図1において、コンテキスト対応発話決定部113は、
(a)過去に生成された対話シナリオから生成される、コンテキスト毎に発話が紐づけられた対話シナリオデータベースから、コンテキスト抽出部112で抽出されたコンテキストに紐づけられた発話を取り出し、
(b)取り出した発話を、抽出されたコンテキスト毎に対応付け、コンテキスト対応発話として出力する。
ここで、上記(a)の対話シナリオデータベースは、対話シナリオ保存部105が、本装置1で生成された対話シナリオや、通信インタフェース101を介して外部から取得された対話シナリオを、発話内容毎に管理して保存しているものとすることができる。
また変更態様として、コンテキスト対応発話決定部113は、タイトルテキスト保存部106から「タイトルテキスト」を取得し、この「タイトルテキスト」から「固有表現」及び「発話に係る情報」を抽出して、抽出されたコンテキスト相当の「固有表現」に対応する「発話に係る情報」を、コンテキスト対応発話としてもよい。
ここで、「固有表現」の抽出(named entity extraction)とは、人名、地名等の固有名詞・名詞や、日付、時間等の数値表現等を抽出することである。「固有表現」は、例えば具体的に、組織名、人名、地名・場所名、固有物名、日付表現、時間表現、金額表現、及び割合表現の計8種類のカテゴリに分類し、データベース化することが可能となっている。さらに、様々な粒度での分類を可能にする階層構造を備えた拡張固有表現として整理することも可能である。
また、「タイトルテキスト」は、対話シナリオの内容を要約した文(テキスト)であってもよく、対話シナリオの内容を象徴するタイトル的なテキストとすることもできる。タイトルテキスト保存部106は、例えばシナリオ作成者からキーボード102を介して入力された、作成すべき対話シナリオに関連する「タイトルテキスト」を取得して保存する。
ユーザインタフェース制御部114は、ディスプレイ103に対し、
(a)コンテキスト抽出部112で抽出されたコンテキストと、
(b)当該コンテキストに対応するコンテキスト対応発話と
を、それぞれコンテキスト候補及び発話候補として、選択可能なようにシナリオ作成者に提示(表示)させる。
図5は、対話シナリオ生成装置1における対話作成のためのコンテキスト候補提示画面の一実施例を示す模式図である。
図5によれば、ディスプレイ103には、入力された想定発話「「おはよう。」」(図3)からの対話遷移の遷移条件として設定すべき、3つのコンテキスト(群)候補が、候補リストボックスに表示されている。ここで好適な態様として、これらのコンテキスト候補は、コンテキストの特徴の度合いの高い順に提示されている。具体的には、
(a)コンテキスト抽出部112において、主成分分析処理を行ってコンテキストを抽出した場合における主成分負荷量(寄与度)、又は
(b)コンテキスト抽出部112において、対話ログにおける出現数の大きい単語を抽出した場合における当該出現数(出現頻度)
の大きい(高い)順に表示されているのである。
さらに変更態様として、シナリオ作成者が予めコンテキスト候補の重み(優先度)を設定し、上記(a)又は(b)のようなスコアを、設定した重み(優先度)で再計算して表示順を決定することも可能である。
また、ディスプレイ103には、各コンテキスト候補に対応する形で、コンテキスト対応発話が発話候補として発話リストボックスに表示されている。これにより、シナリオ作成者は、起こり得る対話遷移の遷移条件としての種々のコンテキストを漏れなく考慮しながら、コンテキスト対応発話を対話システム側発話として選択したり、当該コンテキスト対応発話を参考にして(調整して)、好適な対話システム側発話を作成したりすることができる。
いずれにしても、以上に説明したようなユーザインタフェースの提供によって、シナリオ作成者は、作成すべきシナリオ内容に応じたコンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを、より容易に作成することができるのである。また、遷移条件としてシナリオ作成者も気付き難いような複数のコンテキストを提示することも可能であり、最終的に、生成した対話シナリオにおける対話遷移パターンの網羅性をより向上させることも可能となる。
ちなみに、図5に示したようなコンテキスト候補提示画面に対し、シナリオ作成者の選択・入力処理が終了した際、図3に示したような想定発話入力画面に戻って再度、想定発話の入力処理から始め、全ての想定発話に対する処理が終わった段階で、次に述べる対話遷移パターン生成処理・対話シナリオ生成処理に移行してもよい。
対話遷移パターン生成部115は、抽出され(且つシナリオ作成者によって選択された)コンテキストを、生成すべきシナリオにおける想定発話からの遷移条件(候補)として、対話遷移パターンを生成し、対話シナリオを生成する。この際、(同じくシナリオ作成者によって選択された)コンテキスト対応発話を用いて対話遷移パターン(の発話部分)を構成することも好ましい。
ここで、生成された対話シナリオは、対話シナリオDB105に保存され、適宜利用されることも好ましい。さらに、通信制御部121によって通信インタフェース101を介し、外部の情報処理装置、例えばスマートフォン2に提供されてもよい。
[対話シナリオ生成方法]
図6は、本発明による対話シナリオ生成方法の一実施形態を概略的に示すフローチャートである。このフローは、以上に説明した各機能構成部での処理の流れの大筋をまとめたものとなっている。
(S101)例えばユーザによるキーボード102を介した入力によって、想定発話を取得する。
(S102)コンテキストの付与された対話ログ群を取得する。
(S103)想定発話及び各対話ログの特徴ベクトル/分散表現を生成する。
(S104)想定発話と各対話ログとのcos類似度を算出する。
(S105)所定閾値以上のcos類似度を有する発話を含む類似対話ログを抽出する。
(S106)抽出された類似対話ログの集合である類似対話ログ群から、主成分分析等の手法によってコンテキスト候補を抽出する。
(S107)抽出された各コンテキスト候補に対応したコンテキスト対応発話を生成する。
(S108)抽出されたコンテキスト候補、及び当該コンテキスト候補に対応したコンテキスト対応発話を、例えばディスプレイ103に表示した対話作成画面をもって提示する。
(S109)(例えば表示された対話作成画面を見た)シナリオ作成者によって決定されたコンテキスト及びコンテキスト対応発話に基づき、対話遷移パターンを生成して対話シナリオを生成する。
以上詳細に説明したように、従来、コンテキストは非常に重要な対話遷移の遷移条件となり得るにもかかわらず、コンテキストを考慮した対話シナリオの作成が困難であった。これに対し、本発明によれば、取得した対話ログ群から、遷移条件となり得るコンテキストを決定し、この好適に決定されたコンテキストを遷移条件又は遷移条件候補とした対話遷移パターンを含む対話シナリオを生成することが可能となるのである。
また、対話ログ群から動的にコンテキストを抽出するので、網羅すべき遷移条件となり得るコンテキストを決定することができ、最終的に、生成した対話シナリオにおける応答のバリエーションや応答の網羅性がより向上することになる。
さらに、このような本発明の技術を用いて、ユーザの置かれた状況(コンテキスト)によって発話内容を動的に選択し、その状況に合った発話を行う対話システム、対話プラットフォームや、対話エージェントを実現することも可能となるのである。
以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 対話シナリオ生成装置
101 通信インタフェース
102 キーボード(KB)
103 ディスプレイ(DP)
104、3 対話ログデータベース(DB)
105 対話シナリオDB
106 タイトルテキスト保存部
111 類似対話ログ抽出部
111a 特徴ベクトル生成部
111b 類似度算出部
112 コンテキスト抽出部
112a 特徴ベクトル生成部
112b 主成分分析部
113 コンテキスト対応発話決定部
114 ユーザインタフェース制御部
115 対話遷移パターン生成部
121 通信制御部
2 スマートフォン
211 対話エンジン

Claims (7)

  1. コンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを生成する装置であって、
    過去に生成された対話シナリオを利用したユーザについての対話ログ群であって、発話毎にコンテキスト情報が紐づけられた対話ログの集合である対話ログ群から、想定発話と類似する発話を含む複数の対話ログを抽出する類似対話ログ抽出手段と、
    抽出された当該複数の対話ログに含まれる単語のうち、所定条件を満たす高い特徴の度合いを有する単語を、コンテキストとして抽出するコンテキスト抽出手段と、
    過去に生成された対話シナリオから生成される対話シナリオデータベースであってコンテキスト毎に発話が紐づけられた対話シナリオデータベースから抽出した、抽出されたコンテキストに紐づけられた発話を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定する、または、過去に生成された対話シナリオの内容を要約した若しくは象徴するテキストであるタイトルテキストを取得して、当該タイトルテキストから固有表現及び発話に係る情報を抽出し、抽出されたコンテキストに相当する当該固有表現に対応する発話に係る情報を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定するコンテキスト対応発話決定手段と、
    抽出されたコンテキストと、当該コンテキストに対応する当該コンテキスト対応発話とを、選択可能なように提示させるユーザインタフェース制御手段と、
    選択されたコンテキストを、生成すべきシナリオにおける当該想定発話からの遷移条件としており、選択されたコンテキスト対応発話を用いて構成された対話遷移パターンを生成する対話遷移パターン生成手段と
    を有することを特徴とする対話シナリオ生成装置。
  2. 前記類似対話ログ抽出手段は、当該対話ログ群の各対話ログに含まれる発話の特徴ベクトル又は分散表現と、当該想定発話の特徴ベクトル又は分散表現との類似度を算出し、所定条件を満たす高い類似度を有する発話を含む複数の対話ログを抽出することを特徴とする請求項1に記載の対話シナリオ生成装置。
  3. 前記コンテキスト抽出手段は、当該複数の対話ログの各対話ログに含まれる発話の特徴ベクトル又は分散表現に対して主成分分析を行い、所定条件を満たす大きい主成分負荷量を係数とする変数に係る単語を、コンテキストとして抽出することを特徴とする請求項1又は2に記載の対話シナリオ生成装置。
  4. 前記コンテキスト抽出手段は、抽出された当該複数の対話ログに含まれる単語のうち、自身の含まれる対話ログの数が所定条件を満たす大きい数である単語を、コンテキストとして抽出することを特徴とする請求項1又は2に記載の対話シナリオ生成装置。
  5. 前記ユーザインタフェース制御手段は、抽出されたコンテキストを、当該コンテキストの特徴の度合いの高い順に提示させることを特徴とする請求項1から4のいずれか1項に記載の対話シナリオ生成装置。
  6. コンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを生成する装置に搭載されたコンピュータを機能させるプログラムであって、
    過去に生成された対話シナリオを利用したユーザについての対話ログ群であって、発話毎にコンテキスト情報が紐づけられた対話ログの集合である対話ログ群から、想定発話と類似する発話を含む複数の対話ログを抽出する類似対話ログ抽出手段と、
    抽出された当該複数の対話ログに含まれる単語のうち、所定条件を満たす高い特徴の度合いを有する単語を、コンテキストとして抽出するコンテキスト抽出手段と、
    過去に生成された対話シナリオから生成される対話シナリオデータベースであってコンテキスト毎に発話が紐づけられた対話シナリオデータベースから抽出した、抽出されたコンテキストに紐づけられた発話を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定する、または、過去に生成された対話シナリオの内容を要約した若しくは象徴するテキストであるタイトルテキストを取得して、当該タイトルテキストから固有表現及び発話に係る情報を抽出し、抽出されたコンテキストに相当する当該固有表現に対応する発話に係る情報を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定するコンテキスト対応発話決定手段と、
    抽出されたコンテキストと、当該コンテキストに対応する当該コンテキスト対応発話とを、選択可能なように提示させるユーザインタフェース制御手段と、
    選択されたコンテキストを、生成すべきシナリオにおける当該想定発話からの遷移条件としており、選択されたコンテキスト対応発話を用いて構成された対話遷移パターンを生成する対話遷移パターン生成手段と
    してコンピュータを機能させることを特徴とする対話シナリオ生成プログラム。
  7. コンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを生成する装置に搭載されたコンピュータにおいて実施される対話シナリオ生成方法であって、
    過去に生成された対話シナリオを利用したユーザについての対話ログ群であって、発話毎にコンテキスト情報が紐づけられた対話ログの集合である対話ログ群から、想定発話と類似する発話を含む複数の対話ログを抽出するステップと、
    抽出された当該複数の対話ログに含まれる単語のうち、所定条件を満たす高い特徴の度合いを有する単語を、コンテキストとして抽出するステップと、
    過去に生成された対話シナリオから生成される対話シナリオデータベースであってコンテキスト毎に発話が紐づけられた対話シナリオデータベースから抽出した、抽出されたコンテキストに紐づけられた発話を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定する、または、過去に生成された対話シナリオの内容を要約した若しくは象徴するテキストであるタイトルテキストを取得して、当該タイトルテキストから固有表現及び発話に係る情報を抽出し、抽出されたコンテキストに相当する当該固有表現に対応する発話に係る情報を、当該コンテキストに対応する発話であるコンテキスト対応発話に決定するステップと、
    抽出されたコンテキストと、当該コンテキストに対応する当該コンテキスト対応発話とを、選択可能なように提示させるステップと、
    選択されたコンテキストを、生成すべきシナリオにおける当該想定発話からの遷移条件としており、選択されたコンテキスト対応発話を用いて構成された対話遷移パターンを生成するステップと
    を有することを特徴とする対話シナリオ生成方法。
JP2017230224A 2017-11-30 2017-11-30 対話ログ群からコンテキストを決定可能な対話シナリオ生成装置、プログラム及び方法 Active JP6882975B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017230224A JP6882975B2 (ja) 2017-11-30 2017-11-30 対話ログ群からコンテキストを決定可能な対話シナリオ生成装置、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017230224A JP6882975B2 (ja) 2017-11-30 2017-11-30 対話ログ群からコンテキストを決定可能な対話シナリオ生成装置、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2019101619A JP2019101619A (ja) 2019-06-24
JP6882975B2 true JP6882975B2 (ja) 2021-06-02

Family

ID=66973657

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017230224A Active JP6882975B2 (ja) 2017-11-30 2017-11-30 対話ログ群からコンテキストを決定可能な対話シナリオ生成装置、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP6882975B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023249419A1 (ko) * 2022-06-21 2023-12-28 네이버 주식회사 대화 제공 방법 및 대화 처리 시스템

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112685056A (zh) * 2019-10-18 2021-04-20 华为技术有限公司 脚本更新方法及装置
JP2021105805A (ja) * 2019-12-26 2021-07-26 株式会社日立製作所 情報処理装置及び対話シナリオの作成支援方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4465730B2 (ja) * 1999-01-20 2010-05-19 日本ビクター株式会社 対話装置
CN105094315B (zh) * 2015-06-25 2018-03-06 百度在线网络技术(北京)有限公司 基于人工智能的人机智能聊天的方法和装置
JP6694319B2 (ja) * 2016-04-22 2020-05-13 株式会社Nttドコモ 情報処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023249419A1 (ko) * 2022-06-21 2023-12-28 네이버 주식회사 대화 제공 방법 및 대화 처리 시스템

Also Published As

Publication number Publication date
JP2019101619A (ja) 2019-06-24

Similar Documents

Publication Publication Date Title
CN107832286B (zh) 智能交互方法、设备及存储介质
CN108647205B (zh) 细粒度情感分析模型构建方法、设备及可读存储介质
US9489625B2 (en) Rapid development of virtual personal assistant applications
CN103345467B (zh) 语音翻译系统
JP6759308B2 (ja) 保守装置
US11586689B2 (en) Electronic apparatus and controlling method thereof
CN107609101A (zh) 智能交互方法、设备及存储介质
CN109829052A (zh) 一种基于人机交互的开放式对话方法和系统
KR20190015797A (ko) 인공지능(ai)을 통한 딥러닝훈련모듈과, 순위화프레임워크모듈을 활용하여, 법률전문가에게 최적화된 모범답안을 제시하는 한편, 법률정보를 의미 벡터로 변환하여, 데이터베이스에 저장하고, 이에 대한 문자열 사전모듈을 활용한 온라인 법률정보사전을 제공하는 시스템 및 그 방법
KR101751113B1 (ko) 기억 능력을 이용하는 다중 사용자 기반의 대화 관리 방법 및 이를 수행하는 장치
US20080177528A1 (en) Method of enabling any-directional translation of selected languages
JP3266586B2 (ja) データ分析システム
US20080071533A1 (en) Automatic generation of statistical language models for interactive voice response applications
JP6123143B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
JP2006201870A (ja) 対話処理装置
CN109920409B (zh) 一种声音检索方法、装置、系统及存储介质
JP2010048980A (ja) 自動会話システム、並びに会話シナリオ編集装置
KR102090237B1 (ko) 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
JP6882975B2 (ja) 対話ログ群からコンテキストを決定可能な対話シナリオ生成装置、プログラム及び方法
WO2010125709A1 (ja) 対話制御システム、方法及びコンピュータ可読記憶媒体、並びに、多次元オントロジー処理システム、方法及びコンピュータ可読記憶媒体
CN112912873A (zh) 动态地抑制搜索中的查询答复
JP7297458B2 (ja) 対話コンテンツ作成支援方法
US20230103313A1 (en) User assistance system
CN110110218A (zh) 一种身份关联方法及终端

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210507

R150 Certificate of patent or registration of utility model

Ref document number: 6882975

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150