JP6843689B2 - コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法 - Google Patents

コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法 Download PDF

Info

Publication number
JP6843689B2
JP6843689B2 JP2017084493A JP2017084493A JP6843689B2 JP 6843689 B2 JP6843689 B2 JP 6843689B2 JP 2017084493 A JP2017084493 A JP 2017084493A JP 2017084493 A JP2017084493 A JP 2017084493A JP 6843689 B2 JP6843689 B2 JP 6843689B2
Authority
JP
Japan
Prior art keywords
text
context
dialogue
transition
scenario
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017084493A
Other languages
English (en)
Other versions
JP2018181250A (ja
Inventor
剣明 呉
剣明 呉
俊幸 萩谷
俊幸 萩谷
亮翼 住友
亮翼 住友
矢崎 智基
智基 矢崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2017084493A priority Critical patent/JP6843689B2/ja
Publication of JP2018181250A publication Critical patent/JP2018181250A/ja
Application granted granted Critical
Publication of JP6843689B2 publication Critical patent/JP6843689B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ユーザ等との間で対話を行う対話システムの技術に関する。
近年、ユーザと対話を行い、当該ユーザに種々のサービスを提供可能な対話システムの開発が盛んに進められている。例えば、現在普及しているスマートフォンには、ユーザの発話による問合せに音声で回答し、検索結果等の情報を提供する対話応答機能が常備されているものも少なくない。
また、この対話システムで使用される対話シナリオを作成するためのオーサリングツールも、現在盛んに改良が進められている。例えば、対話遷移を可視化することによって、シナリオ作成者の作成作業を容易化するツールが数多く開発されている。
このような対話システムの具体例として、特許文献1には、ユーザの問合せに対し網羅的に回答を提供できるようなエージェントの技術が開示されている。このエージェントは、ユーザとエージェントとの対話の発話単位をノードとするリスト構造を形成し、ノードの情報に基づいてリスト構造の対話を結合させて、対話を分岐木構造として記録する対話データベースを有している。エージェントは、ユーザ又は自身が要求する所定の条件に基づいて、この対話データベースに記録された分岐木構造の対話を検索し応答を行う。
特開2009−205552号公報
しかしながら、特許文献1に記載されたような従来技術では、対話の相手が置かれた状況に応じた対話を実現することが、依然大きな課題となっている。
実際、対話における発話から発話への移り変わり(対話遷移)は、発話を構成する言語の情報(言語情報)によって変化するだけでなく、例えば場所や時刻、季節等の、対話の相手が置かれた状況、すなわち、コンテキストによっても大きく変わり得るのである。
一方で、このようなコンテキストを考慮した対話シナリオの作成は容易ではない。具体的には、対話遷移における複数の分岐やターン(数)の条件にコンテキストを含めることになるが、これらのコンテキストを含む条件に相応する応答、すなわち状態遷移の適切な記述が必要となってしまう。
また、シナリオ作成者が想定したシナリオ通りにコンテキストをカバーすることも容易ではない。実際、対話シナリオを作成する際、どのようなコンテキストを想定して条件分岐を準備しておくかを決めることは、非常に困難となっている。
そこで、本発明は、作成すべき対話シナリオに応じたコンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを生成可能な装置、プログラム及び方法を提供することを目的とする。
本発明によれば、対話シナリオに関連するテキストを取得して、当該テキストから固有表現と発話に係る情報とを抽出し、抽出した当該固有表現に関連する関連コンテキスト要素を、予め用意された辞書を用いて決定するコンテキスト決定手段と、
決定された当該関連コンテキスト要素と、抽出された当該発話に係る情報とに基づいて、当該テキストに関連する関連テキストを生成する関連テキスト生成手段と、
生成された当該関連テキスト、又は当該関連テキストから選択された関連テキストに基づいて、当該関連テキストに係る関連コンテキストを、対話シナリオの対話遷移における遷移の条件とし、当該関連テキストに係る発話に係る情報に基づいた発話を含む対話遷移パターンを生成する遷移パターン生成手段と
を有する対話シナリオ生成装置が提供される。
また、本発明による対話シナリオ生成装置の他の実施形態として、対話シナリオに関連するテキストから固有表現を抽出する場合に、コンテキスト決定手段は、当該テキストから抽出した当該固有表現に基づいてコンテキストを決定し、遷移パターン生成手段は、当該固有表現に基づき決定された当該コンテキストが採用された場合には、採用された当該コンテキストを、対話シナリオの対話遷移における遷移の条件とすることも好ましい。また、本発明による対話シナリオ生成装置の更なる他の実施形態として、コンテキスト決定手段は、当該テキストとは異なる他のテキストを取得して、当該他のテキストから固有表現を抽出し、抽出した当該固有表現に基づいて新たなコンテキストを決定し、遷移パターン生成手段は、当該新たなコンテキストが選択された場合には、当該新たなコンテキストを、対話シナリオの対話遷移における遷移の条件とすることも好ましい。
本発明によれば、また、当該テキストと該テキストに基づいて生成された対話遷移フローとの組を複数取得し、当該テキスト間の類似の度合いと、対応する当該対話遷移フロー間の類似の度合いとに基づいて、当該テキストから対話遷移フローに影響する語句を抽出し、また当該テキストから発話に係る情報を抽出し、抽出した当該語句に基づいて潜在コンテキストを決定するコンテキスト決定手段と、
定された当該潜在コンテキスト、又は当該潜在コンテキストから選択された潜在コンテキストを、対話シナリオの対話遷移における遷移の条件とし、抽出された当該発話に係る情報に基づいた発話を含む対話遷移パターンを生成する遷移パターン生成手段と
を有する対話シナリオ生成装置が提供される。
また、上記の類似の度合いを利用する本発明において、コンテキスト決定手段は、当該テキスト同士が類似しているにもかかわらず、対応する当該対話遷移フロー同士が類似していない場合、当該テキスト間の差分に相当する当該語句を抽出し、当該語句が当該対話遷移フロー間の相違をもたらしたとして、当該語句に基づいて潜在コンテキストを決定することも好ましい。さらに、コンテキスト決定手段は、述語項構造解析によって、抽出した当該語句の語句種を決定し、決定した当該語句種に基づいて潜在コンテキストを決定することも好ましい。
本発明によれば、また、対話シナリオを生成する装置に搭載されたコンピュータを機能させるプログラムであって、
対話シナリオに関連するテキストを取得して、当該テキストから固有表現と発話に係る情報とを抽出し、抽出した当該固有表現に関連する関連コンテキスト要素を、予め用意された辞書を用いて決定するコンテキスト決定手段と、
決定された当該関連コンテキスト要素と、抽出された当該発話に係る情報とに基づいて、当該テキストに関連する関連テキストを生成する関連テキスト生成手段と、
生成された当該関連テキスト、又は当該関連テキストから選択された関連テキストに基づいて、当該関連テキストに係る関連コンテキストを、対話シナリオの対話遷移における遷移の条件とし、当該関連テキストに係る発話に係る情報に基づいた発話を含む対話遷移パターンを生成する遷移パターン生成手段と
してコンピュータを機能させる対話シナリオ生成プログラムが提供される。
本発明によれば、さらに、対話シナリオを生成する装置に搭載されたコンピュータにおいて実施される対話シナリオ生成方法であって、
対話シナリオに関連するテキストを取得して、当該テキストから固有表現と発話に係る情報とを抽出し、抽出した当該固有表現に関連する関連コンテキスト要素を、予め用意された辞書を用いて決定するステップと、
決定された当該関連コンテキスト要素と、抽出された当該発話に係る情報とに基づいて、当該テキストに関連する関連テキストを生成するステップと、
生成された当該関連テキスト、又は当該関連テキストから選択された関連テキストに基づいて、当該関連テキストに係る関連コンテキストを、対話シナリオの対話遷移における遷移の条件とし、当該関連テキストに係る発話に係る情報に基づいた発話を含む対話遷移パターンを生成するステップと
を有する対話シナリオ生成方法が提供される。
本発明の対話シナリオ生成装置、プログラム及び方法によれば、作成すべき対話シナリオに応じたコンテキストを遷移条件とした対話遷移パターンを含む対話シナリオを生成することができる。
本発明による対話シナリオ生成装置の一実施形態における機能構成を示す機能ブロック図である。 本発明による対話シナリオ生成方法の一実施形態を示すフローチャートである。 本発明による対話シナリオ生成方法の他の実施形態を示すフローチャートである。 本発明による対話シナリオ生成方法の更なる他の実施形態を示すフローチャートである。 テキスト間及びフロー間の類似度を用いた潜在コンテキスト要素の抽出に係る実施例1を説明するための模式図である。 テキスト間及びフロー間の類似度を用いた潜在コンテキスト要素の抽出に係る実施例2を説明するための模式図である。 テキスト間及びフロー間の類似度を用いた潜在コンテキスト要素の抽出に係る実施例3を説明するための模式図である。
以下では、本発明の実施形態について、図面を用いて詳細に説明する。
[対話シナリオ生成装置]
図1は、本発明による対話シナリオ生成装置の一実施形態における機能構成を示す機能ブロック図である。
図1によれば、本発明の一実施形態としての対話シナリオ生成装置1は、対話シナリオ作成者との間で、キーボード(KB)101及びディスプレイ(DP)108を介して情報の入出力(やり取り)をしながら、対話シナリオを生成するオーサリングツールである。
対話シナリオ生成装置1は、本実施形態において、シナリオ作成者からキーボード(KB)101を介し、作成すべき対話シナリオに関連するテキストである「要約テキスト」を入力する。この「要約テキスト」は、文字通り対話シナリオの内容を要約した文(テキスト)であってもよく、対話シナリオの内容を象徴するタイトル的なものとすることもできる。本実施形態では、シナリオ作成者は、作成すべき対話シナリオの内容に基づいてこの「要約テキスト」を作成し、キーボード101を用いて装置1への入力を行う。
この「要約テキスト」を取得した対話シナリオ生成装置1は、その特徴として、
(A)「要約テキスト」から「固有表現」と「発話に係る情報」とを抽出し、抽出した「固有表現」に基づいて「コンテキスト」を決定し、
(B)決定した「コンテキスト」を、対話シナリオの対話遷移における遷移の条件とし、抽出された「発話に係る情報」に基づいた発話を含む「対話遷移パターン」を生成するのである。
ここで、「コンテキスト」とは、対話の相手が置かれた状況のことである。対話シナリオ生成装置1は、シナリオ作成者による設定を含め、場所、時刻や、季節等をこの「コンテキスト」として設定することができる。また、遷移の条件は、例えば「対話遷移パターン」を示すフローにおける分岐が発生する条件やターン(数)を決定する条件のことである。
ちなみに、実際に対話シナリオを作成する場合において、対話における発話から発話への移り変わり(対話遷移)は、発話を構成する言語の情報(言語情報)によって変化するだけでなく、この「コンテキスト」によっても大きく変わり得る。しかしながら、従来、このような「コンテキスト」を考慮した対話シナリオの作成は非常に困難であった。
これに対し、対話シナリオ生成装置1は、取得した「要約テキスト」から、作成すべき対話シナリオに応じた「コンテキスト」を決定し、この適切な「コンテキスト」を遷移条件とした「対話遷移パターン」を含む対話シナリオを生成することを可能にするのである。
なお当然に、シナリオ作成者による「要約テキスト」は、キーボード101を使用した形に限定されない。例えば、「要約テキスト」を読み上げたシナリオ作成者の音声が(図示していない)マイクを介して入力され、対話シナリオ生成装置1は、この入力された音声をテキストに変換して「要約テキスト」を取得してもよい。または、外部の情報処理装置から送信された「要約テキスト」を、通信インタフェース109を介して取得してもよい。
さらに、対話シナリオ生成装置1は、決定した「コンテキスト」や、生成した「対話遷移パターン」、さらには生成した対話シナリオをディスプレイ108に表示し、シナリオ作成者に提示することも好ましい。また、これらの情報を、通信インタフェースを介して外部の情報処理装置へ送信してもよい。例えば、後に詳細に説明するように、決定した「コンテキスト」の提示を受けたシナリオ作成者は、この「コンテキスト」を採用するか否かの指示を、例えばキーボード101を介して装置1に与えてもよい。
[装置機能構成]
同じく図1の機能ブロック図によれば、対話シナリオ生成装置1は、キーボード101と、要約テキスト保存部102と、固有表現辞書103と、コンテキスト保存部104と、同義語・関連語辞書105と、関連要約テキスト保存部106と、対話シナリオ保存部107と、ディスプレイ108と、通信インタフェース109と、プロセッサ・メモリとを有する。ここで、プロセッサ・メモリは、対話シナリオ生成装置1に搭載されたコンピュータを機能させるプログラムを実行することによって、対話シナリオ生成機能を実現させる。すなわち、対話シナリオ生成装置1は、本発明による対話シナリオ生成プログラムを搭載した、例えばパーソナル・コンピュータ(PC)、ノート型若しくはタブレット型コンピュータ、又はスマートフォン等であってもよい。
さらに、このプロセッサ・メモリは、機能構成部として、固有表現抽出部111、要約テキスト間類似度算出部112、対話遷移フロー間類似度算出部113、コンテキスト判定部114及び関連コンテキスト要素決定部115を含むコンテキスト決定部11と、関連要約テキスト生成部116と、遷移パターン生成部117と、入出力制御部121と、通信制御部122とを有する。なお、図1によれは、各機能構成部を矢印で接続した処理の流れは、本発明による対話テキスト生成方法の一実施形態としても理解される。
同じく図1の機能ブロック図において、コンテキスト決定部11は、
(1a)(例えばキーボード101から入出力制御部121を介して)要約テキストを取得し、
(1b)固有表現抽出部111において、取得した要約テキストから(ア)固有表現(コンテキスト要素)、及び(イ)発話に係る情報(発話情報)を抽出し、さらに、
(1c)コンテキスト判定部114において、抽出した(ア)固有表現(コンテキスト要素)に基づいてコンテキストを決定する。
ここで、(1a)において、コンテキスト決定部11は、要約テキスト保存部102に予め準備していた要約テキストを取得してもよく、または、外部の要約テキスト蓄積部2から、予め作成された要約テキストを、通信ネットワークを介し通信制御部122を通して取得してもよい。なお、(1c)の固有表現抽出については、後に、実施形態1の中で図2を用いて詳細に説明する。
さらに、コンテキスト決定部11は、関連コンテキスト要素決定部115において、抽出された固有表現(コンテキスト要素)に関連する関連コンテキスト要素を、同義語・関連語辞書105を用いて決定してもよい。後に、実施形態1の中で図2を用いて詳細に説明するように、関連要約テキスト生成部116は、ここで決定された関連コンテキスト要素と、先に抽出された発話情報とに基づいて、取得した要約テキストに関連する関連要約テキストを生成するのである。ちなみに、生成された関連要約テキストは、関連要約テキスト保存部106に登録され保存されることも好ましい。
さらに、コンテキスト決定部11は、
(2a)取得した要約テキストとは異なる他の要約テキストを取得し、
(2b)固有表現抽出部111において、取得した他の要約テキストから固有表現を抽出し、
(2c)コンテキスト判定部114において、抽出した固有表現に基づいて新たなコンテキスト(潜在コンテキスト)を決定する
ことも好ましい。ここで、(2a)の他の要約テキストとして、例えば、シナリオ作成者が過去に作成し要約テキスト保存部102に保存しておいたものを読み出して使用することができる。このような他の要約テキストを利用する実施形態は、後に図3を用い、実施形態2として詳細に説明する。
さらにまた、コンテキスト決定部11は、
(3a)要約テキストとこの要約テキストに基づいて生成された対話遷移フローとの組を複数取得し、
(3b)要約テキスト間類似度算出部112において、要約テキスト間の類似の度合いを算出し、
(3c)対話遷移フロー間類似度算出部113において、対応する対話遷移フロー間の類似の度合いを算出し、
(3d)コンテキスト判定部114において、要約テキスト間の類似の度合いと、対応する対話遷移フロー間の類似の度合いとに基づいて、当該要約テキストから対話遷移フローに影響する語句を抽出し、抽出した語句に基づいて新たなコンテキスト(潜在コンテキスト)を決定する
ことも好ましい。
具体的に1つの例として、コンテキスト決定部11は、他の要約テキスト同士が類似しているにもかかわらず、対応する対話遷移フロー同士が類似していない場合、当該他の要約テキスト間の差分に相当する語句を抽出し、当該語句が対話遷移フロー間の相違をもたらしたとして、当該語句に基づいて新たな潜在コンテキストを決定することができる。
このような類似度を利用する実施形態は、後に図4〜図7を用い、実施形態3及び実施例1〜3として詳細に説明する。なお、以上に述べたようなコンテキスト決定部11で決定された関連コンテキスト要素や潜在コンテキストを含むコンテキストは、コンテキスト保存部104に登録され保存されることも好ましい。
同じく図1の機能ブロック図において、遷移パターン生成部117は、
(1d)決定されたコンテキスト、
(1e)(生成された関連テキスト若しくは当該関連テキストから選択された関連テキストに係る)関連コンテキスト要素、及び/又は
(2d,3e)決定された新たなコンテキスト(潜在コンテキスト)、若しくは当該新たなコンテキストから選択された新たなコンテキスト(潜在コンテキスト)
を、対話シナリオの対話遷移における遷移条件(分岐及び/又はターンの条件)とし、抽出された発話情報に基づいた発話を含む対話遷移パターンを生成する。
また、遷移パターン生成部117は、例えば、生成した対話遷移パターンを、入出力制御部121を介してディスプレイ108に表示させ、これを見たシナリオ作成者の指示によって又は確認の下、生成した対話遷移パターンに基づき対話シナリオを生成してもよい。ここで、生成された対話遷移パターンや対話シナリオは、対話シナリオ保存部107に保存されてもよく、通信制御部122及び通信インタフェース109を介して外部の情報処理装置に送信されてもよい。
次に、以上のような機能構成を有する対話シナリオ生成装置1で実施される対話シナリオ生成方法における、種々の実施形態・実施例を説明する。
[対話シナリオ生成方法:実施形態1]
図2は、本発明による対話シナリオ生成方法の一実施形態を示すフローチャートである。
(S101)シナリオ作成者が記述した要約テキスト(タイトル)を取得する。ここでは具体的に、
「ユーザが深夜自宅に帰った際にテレビをつけるかどうかを問いかける」
との要約テキストが取得されたとする。
(S102)要約テキストの形態素解析を実施する。
(S103)固有表現辞書103又は外部の固有表現データベース(DB)3を用いて、形態素解析処理済みの要約テキストから、コンテキスト要素としての固有表現と、発話情報である発話内容とを抽出する。
ここで、固有表現の抽出(named entity extraction)とは、人名、地名等の固有名詞・名詞や、日付、時間等の数値表現等を抽出することである。固有表現は、例えば具体的に、組織名、人名、地名・場所名、固有物名、日付表現、時間表現、金額表現、及び割合表現の計8種類のカテゴリに分類し、データベース化することができる。また、様々な粒度での分類を可能にする階層構造を備えた拡張固有表現として整理することも可能となっている。
この固有表現抽出は、CRF(Conditional Random Fields)等の公知の識別モデル(統計的言語モデル)を用いて実施することができる。本実施形態では、固有表現のラベルを予め付された学習用データを用いて学習済みのCRFを生成し、このCRFによって、形態素解析処理済みの要約テキストに対し固有表現ラベルの付与を行う。
具体的に、上述した要約テキスト「ユーザが深夜自宅に帰った際にテレビをつけるかどうかを問いかける」からは、
時間(固有表現):「深夜」、
場所(固有表現):「自宅」
発話内容:「テレビをつけるかどうか」
が抽出される。ここで、本実施形態では、抽出された固有表現を、その分類種をコンテキストとしたコンテキスト要素として取り扱う。例えば、上記の「深夜」は、時間というコンテキストのコンテキスト要素とされる。
(S104)抽出したコンテキスト要素をコンテキスト設定欄に設定する。ここで、例えば、設定されたコンテキスト要素の並んだコンテキスト設定欄が、ディスプレイ108に表示され、シナリオ作成者に提示されてもよい。また、この提示を受けたシナリオ作成者によって、例えば、このコンテキスト要素に係るコンテキストを確認したり、このコンテキスト要素に係るコンテキストを採用する又は採用しない旨を指示したりすることが可能であってもよい。
(S105)同義語・関連語辞書105又は外部の同義語・関連語データベース4を用いて、抽出したコンテキスト要素の同義語や関連語を決定し、これらを、関連するコンテキスト要素(拡充設定値)としてディスプレイ108に表示し、シナリオ作成者に提示する。
具体的に、上述した固有表現(コンテキスト要素)抽出の例では、例えば、以下の3つの情報が提示される。
(ア)時間:「朝」,場所:「自宅」,発話内容:「朝のニュースを見る?」
(イ)時間:「深夜」,場所:「オフィス」,発話内容:「大変だね!」
(ウ)時間:「朝」,場所:「オフィス」,発話内容:「今日の天気は晴れ」
ちなみに、例えば上記(イ)において、カメラで撮影された対話の相手の顔画像に対する表情分析結果から「疲れ」とのコンテキスト要素を抽出することを前提として、
(イ’)時間:「深夜」,場所:「オフィス」,表情:「疲れ」,発話内容:「大変だね!」
との情報を提示してもよい。
ここで、抽出された発話内容:「テレビをつけるかどうか」から、上記の「朝のニュースを見る?」、「大変だね!」、及び「今日の天気は晴れ」との発話内容を導出することは、例えば以下の手法(a)及び(b)によって可能となる。
(a)抽出されたコンテキスト要素及び発話内容から、時間、場所、及び表情のコンテキスト設定値、並びに発話内容の発話意図スロットをベクトル成分とした特徴量ベクトルを生成する。上記の例では、この特徴量ベクトルは、
<深夜, 自宅, , テレビON確認>、
となる。
(b)次いで、要約テキスト保存部202に保存された過去の要約テキストに予め紐づけられた特徴量ベクトル中のコンテキスト要素の値と、上記(a)に関連する(ア)〜(ウ)の拡充設定値(比較条件は(ア)では時間:「朝」,場所:「自宅」、(イ)では時間:「深夜」,場所:「オフィス」、(ウ)では時間:「朝」,場所:「オフィス」)とを比較(検索)し、コンテキスト要素との間で所定閾値以上の類似度を有するもの、又は類似度が高い順に並べた際の上位所定数のものを読み出す。上記の例では、以下に示す3つの類似した特徴量ベクトル
<朝, 自宅, , ニュース表示確認>、
<深夜, オフィス, (ネガティブ表情, )心配する挨拶>、及び
<朝, オフィス, , 天気確認>
の3つの特徴量ベクトル、及び対応する過去の要約テキストが読み出され、シナリオ作成者に提示される。ここで、要約テキストが生成されて提示される場合、(コンテキスト要素)+(発話内容)の形で生成・提示されるのである。
(S106)上記のコンテキスト要素及び発話内容に基づいて関連要約テキストを生成し、ディスプレイ108に表示する(シナリオ作成者に提示する)。
(S107)生成した関連要約テキスト、又はそのうちシナリオ作成者によって選択された関連要約テキストに基づいて状態遷移テーブルを生成する。
具体的には、例えば、上記(ア)、(イ’)及び(ウ)からそれぞれ、
(ア1)「ユーザが朝自宅に帰った際に朝のニュースをみるかどうかを問いかける」
(イ'1)「ユーザが深夜オフィスに疲れた表情で入ってきた際、大変だねと言う」
(ウ1)「ユーザが朝オフィスに入ってきた際、今日の天気は晴れと言う」
との関連要約テキストが生成され、シナリオ作成者に提示される。このような関連要約テキストの提示を受けたシナリオ作成者は、例えばキーボード101を介し、それらの関連要約テキストの各々を採用するか否かの指示を行うことができる。
以上説明したように、本実施形態では、作成すべき対話シナリオにおける対話遷移の遷移条件となり得るコンテキストや関連コンテキスト要素を決定し、シナリオ作成者に提示することができる。また、決定した関連コンテキスト要素に基づく関連要約テキストを生成して提示することも可能となる。これにより、シナリオ作成者は、コンテキストを考慮した対話シナリオをより容易に且つより確実に作成することができる。
[対話シナリオ生成方法:実施形態2]
図3は、本発明による対話シナリオ生成方法の他の実施形態を示すフローチャートである。
上述した図2に示した実施形態では、要約テキスト(タイトル)が与えられれば、それに基づくコンテキストを考慮した対話遷移を有する対話シナリオが生成される。この場合、決定されるコンテキストは、固有表現辞書103内に収録されているものやシナリオ作成者が選択したコンテキストの範囲内に限定されることになる。これに対し、図3に示す実施形態は、要約テキストを作成したシナリオ作成者自身が設定・想定していない又は気付かないコンテキスト、すなわち潜在コンテキストをも抽出することを意図したものである。
(S201)要約テキスト保存部102に保存された(シナリオ作成者又は他の者により)過去に作成された要約テキストを取得する。
(S202)取得された要約テキストの形態素解析を実施する。
(S203)固有表現辞書103内に収録されていない語句でコンテキストになり得るものを、公知の線形判別分析(LDA,Linear Discriminant Analysis)等の手法によって、形態素解析処理済みの過去の要約テキストから、潜在コンテキスト要素として抽出する。
具体的には、あるトピックについての過去の要約テキスト群に出現した各語句の頻度を算出し、この頻度に基づいて出現した語句をLDAによってクラスタリングして、すでにコンテキスト要素として抽出している語句と同じクラスタ(クラス)に属する語句を抽出してもよい。
(S204)抽出した潜在コンテキスト要素をコンテキスト設定欄に設定する。ここで、潜在コンテキスト要素の並んだコンテキスト設定欄が、例えばディスプレイ108に表示され、シナリオ作成者に提示される。
(S205)シナリオ作成者によって潜在コンテキストが存在するか否かが判断され、その指示を受ける。ここで、潜在コンテキストは存在しない(潜在コンテキストなし)との指示を受けた場合、ステップS207に移行する。
(S206)一方、ステップS205で潜在コンテキストが存在する(潜在コンテキストあり)との指示を受けた場合、抽出した潜在コンテキスト要素から潜在コンテキストを決定する。この決定された新たな潜在コンテキストは、作成中の要約テキストや、さらには固有表現辞書103に反映されることも好ましい。
(S207)シナリオ作成者によってコンテキストを追加(拡充)するか否かが判断され、その指示を受ける。ここで、コンテキストは拡充しないとの指示を受けた場合、ステップS209に移行する。
(S208)一方、ステップS207でコンテキストを拡充するとの指示を受けた場合、同義語・関連語辞書105又は外部の同義語・関連語データベース4を用いて、抽出した潜在コンテキスト要素の同義語や関連語を決定し、これらを、関連する潜在コンテキスト要素(拡充設定値)としてディスプレイ108に表示し、シナリオ作成者に提示する。
(S209)上記の潜在コンテキスト要素及び発話内容に基づいて関連要約テキストを生成し、ディスプレイ108に表示する(シナリオ作成者に提示する)。
(S210)生成した関連要約テキストに基づいて状態遷移テーブルを生成する。
[対話シナリオ生成方法:実施形態3]
図4は、本発明による対話シナリオ生成方法の更なる他の実施形態を示すフローチャートである。
上述した図3に示した実施形態では、潜在コンテキスト要素は対話遷移の内容と関係なく過去の他の要約テキストのみから抽出される。これに対し、図4に示す実施形態は、対話シナリオにより適したコンテキストを選択すべく、対話遷移の内容をも勘案して潜在コンテキストを決定している。
(S301)要約テキスト保存部102に保存された(シナリオ作成者又は他の者により)過去に作成された要約テキストを取得する。
(S302)要約テキストの形態素解析を実施する。
(S303)要約テキスト間の類似度、及び対話遷移フロー間の類似度を算出する。
(S304)算出されたこれらの類似度に基づいて、潜在コンテキスト要素を抽出する。
以下、上記のステップS303及びS304での処理内容について、図5〜7に示した実施例1〜3を用いて具体的に説明する。ちなみに、本実施形態においてこの後に続くステップS305〜S311はそれぞれ、上述した図3の実施形態におけるステップS204〜S210に対応するものであるので、説明を省略する。
[実施例1]
図5は、テキスト間及びフロー間の類似度を用いた潜在コンテキスト要素の抽出に係る実施例1を説明するための模式図である。
本実施例1では、潜在コンテキスト要素を抽出するべく、過去に作成された2つの要約テキストとして
・図5(A)に示す「妻が午後家から出るとき挨拶する」、及び
・図5(B)に示す「雨の日に妻が午後家から出るとき挨拶する」
が取得されている。ここで、前提として、時間、場所及び動作は、すでに正例として決定された既知のコンテキストであり、一方、天候は、これまでコンテキストとの判断はなされていない。
最初に、上記要約テキスト間の類似度を算出する。この類似度としては、例えば、CRFによる各要約テキストの特徴ベクトルの比較結果を採用することができる。また、各要約テキストをBoW(Bag of Words)として扱い、各要約テキストについて語句の出現頻度を要素とした特徴量ベクトルを算出して、この特徴量ベクトル間のコサイン距離を類似度とすることも可能である。さらに、要約テキストの文としての構造、例えば5W1Hに関する構造を比較した結果や、要約テキストに紐づけられたトピック(話題)を比較した結果を、類似度決定の条件としてもよい。
本実施例1では、CRFに基づいて算出した類似度が所定閾値を超えるので、上記の2つの要約テキストは類似していると判定される。
次いで、図5(A)及び図5(B)に示す対話遷移フローの間の類似度を算出する。具体的には、最初に、各対話遷移フローの特徴量ベクトルを生成する。この特徴量ベクトルの成分として、当該対話遷移フローにおける
(a)ターン数、(b)条件分岐数、(c)発話意図スロット
等を採用することができる。ちなみに、(b)の条件分岐数を説明するための対話遷移フローの1つの例を図5(C)に示している。
ここで、(a)のターン数とは、発話に対して発話が応答される様子を示す矢印のフロー中での総数であって、例えば図5(A)では1であり、図5(B)では3となる。また、(b)の条件分岐数は、応答される発話を示す1つのボックスから伸びた当該矢印の数であり、図5(C)の例では、(α)及び(β)の2本の矢印が存在するので2となる。さらに、(c)の発話意図スロットとは、当該対話遷移フローにおける予め設定された発話の意図のカテゴリである。1つの例として、「おはよう」から始まる挨拶のやり取りの対話遷移フローにおいて、挨拶とのカテゴリが設定されている場合、この対話遷移フローの発話意図をこの挨拶とすることができる。
本実施例1では、図5(A)及び図5(B)の対話遷移フローの各々について、(a)ターン数、(b)条件分岐数、及び(c)発話意図スロットをベクトル成分として含む特徴量ベクトルを生成した際、これらの特徴量ベクトルの類似度が所定閾値以下となる。したがって、図5(A)及び図5(B)の対話遷移フローは互いに非類似であると判定される。ちなみに、図5の対話遷移フロー、並びに以下に示す図6及び7の対話遷移フローにおける、ユーザの発話を示すボックス内の「*」は、任意の発話内容(応答内容)であることを示している。
このように、図5(A)及び図5(B)においては、要約テキストは互いに類似しているにもかかわらず、対話遷移フローは互いに非類似となっている。そこで本実施例1では、互いに類似している要約テキストの差分としての「雨の日に」という語句が、この対話遷移フローの相違、具体的にはターン数の違い、をもたらすと判断する。ここで、この「雨の日に」との語句は、天候というコンテキストのコンテキスト要素であるから、この天候を、新たなコンテキストとして(コンテキストの正例として)登録するのである。
[実施例2]
図6は、テキスト間及びフロー間の類似度を用いた潜在コンテキスト要素の抽出に係る実施例2を説明するための模式図である。
本実施例2では、潜在コンテキスト要素を抽出するべく、過去に作成された2つの要約テキストとして
・図6(A)に示す「子供が朝学校に行くとき挨拶する」
・図6(B)に示す「子供が朝妻と学校に行くとき挨拶する」
が取得されている。ここで、前提として、時間、場所及び動作は、すでに正例として決定された既知のコンテキストであり、一方、人物はこれまで、コンテキストの負例、すなわち非コンテキストとなっている。
最初に、上記要約テキスト間の類似度を算出する。本実施例2では、CRFに基づいて算出した類似度が所定閾値を超えるので、上記の2つの要約テキストは類似していると判定される。
次いで、図6(A)及び図6(B)に示す対話遷移フローの間の類似度を算出する。本実施例2では、これらの対話遷移フローの各々について、(a)ターン数、(b)条件分岐数、及び(c)発話意図スロットをベクトル成分として含む特徴量ベクトルを生成した際、これらの特徴量ベクトルの類似度が所定閾値以下となる。したがって、図6(A)及び図6(B)の対話遷移フローは互いに非類似であると判定される。
このように、図6(A)及び図6(B)においては、要約テキストは互いに類似しているにもかかわらず、対話遷移フローは互いに非類似となっている。本実施例2では、互いに類似している要約テキストの差分としての「妻と」という語句が、この対話遷移フローの相違、具体的にはターン数の違い、をもたらすと判断する。ここで、この「妻と」との語句はカテゴリとして人物に属するが、この人物は、すでにコンテキストの負例とされており、実施例1のように単純にコンテキストの正例とすることには問題がある。
そこで、図6(A)及び図6(B)に示す対話遷移フローの各々について算出されたCRF特徴量ベクトルからさらに、述語項構造解析を用いて、構成語句を主語、目的語や、動詞修飾語等のカテゴリ(語句種)に分類する。これにより、動詞修飾語として「妻と」が検出される。本実施例2では、この動詞修飾語「妻と」がフローにおけるターン数増大をもたらしたとして、「人物の動詞修飾語」をコンテキストの正例として登録するのである。
[実施例3]
図7は、テキスト間及びフロー間の類似度を用いた潜在コンテキスト要素の抽出に係る実施例3を説明するための模式図である。
本実施例3では、潜在コンテキスト要素を抽出するべく、過去に作成された2つの要約テキストとして
・図7(A)に示す「深夜家に帰る」
・図7(B)に示す「彼女が深夜家に帰る」
が取得されている。ここで、前提として、時間、場所及び動作は、すでに正例として決定された既知のコンテキストであり、一方、人物は、これまでコンテキストとの判断はなされていない。
最初に、上記要約テキスト間の類似度を算出する。本実施例3では、CRFに基づいて算出した類似度が所定閾値を超えるので、上記の2つの要約テキストは類似していると判定される。
次いで、図7(A)及び図7(B)に示す対話遷移フローの間の類似度を算出する。本実施例3では、これらの対話遷移フローの各々について、(a)ターン数、(b)条件分岐数、及び(c)発話意図スロットをベクトル成分として含む特徴量ベクトルを生成した際、これらの特徴量ベクトルの類似度が所定閾値を超える値となる。したがって、図7(A)及び図7(B)の対話遷移フローは互いに類似していると判定される。
このように、図7(A)及び図7(B)においては、要約テキストも互いに類似していて、対話遷移フローも互いに類似している。そこで本実施例3では、互いに類似している要約テキストの差分としての「彼女が」という語句は、対話遷移フローの態様に影響を及ぼさないと判断する。ここで、語句「彼女は」は、人物というコンテキストのコンテキスト要素であるから、この人物をコンテキストの負例として登録するのである。
また、変更態様として、実施例2と同じく述語項構造解析を行って、「彼女は」が主語であることを決定し、「人物の主語」をコンテキストの負例として登録することも好ましい。
以上詳細に説明したように、本発明によれば、取得した要約テキストから、作成すべき対話シナリオに応じたコンテキストを決定し、この適切なコンテキストを分岐やターンの条件とした対話遷移パターンを含む対話シナリオを生成することができる。その結果、シナリオ作成者の作成作業の負担を軽減しつつ、対話シナリオにおける応答のバリエーションを向上させ、網羅的な応答を提供することも可能となる。
さらに、これにより、ユーザの置かれた状況(コンテキスト)によって発話内容を動的に選択し、その状況に合った発話を行う対話システム、対話プラットフォームや、対話エージェントを実現することも可能となるのである。
以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 対話シナリオ生成装置
101 キーボード
102 要約テキスト保存部
103 固有表現辞書
104 コンテキスト保存部
105 同義語・関連語辞書
106 関連要約テキスト保存部
107 対話シナリオ保存部
106 ディスプレイ
109 通信インタフェース
11 コンテキスト決定部
111 固有表現抽出部
112 要約テキスト間類似度算出部
113 対話遷移フロー間類似度算出部
114 コンテキスト判定部
115 関連コンテキスト要素決定部
116 関連要約テキスト生成部
117 遷移パターン生成部
121 入出力制御部
122 通信制御部
2 要約テキスト蓄積部
3 固有表現データベース(DB)
4 同義語・関連語データベース(DB)

Claims (8)

  1. 対話シナリオに関連するテキストを取得して、当該テキストから固有表現と発話に係る情報とを抽出し、抽出した当該固有表現に関連する関連コンテキスト要素を、予め用意された辞書を用いて決定するコンテキスト決定手段と、
    決定された当該関連コンテキスト要素と、抽出された当該発話に係る情報とに基づいて、当該テキストに関連する関連テキストを生成する関連テキスト生成手段と、
    生成された当該関連テキスト、又は当該関連テキストから選択された関連テキストに基づいて、当該関連テキストに係る関連コンテキストを、対話シナリオの対話遷移における遷移の条件とし、当該関連テキストに係る発話に係る情報に基づいた発話を含む対話遷移パターンを生成する遷移パターン生成手段と
    を有することを特徴とする対話シナリオ生成装置。
  2. 対話シナリオに関連するテキストを取得して、当該テキストと該テキストに基づいて生成された対話遷移フローとの組を複数取得し、当該テキスト間の類似の度合いと、対応する当該対話遷移フロー間の類似の度合いとに基づいて、当該テキストから対話遷移フローに影響する語句を抽出し、また当該テキストから発話に係る情報を抽出し、抽出した当該語句に基づいて潜在コンテキストを決定するコンテキスト決定手段と、
    決定された当該潜在コンテキスト、又は当該潜在コンテキストから選択された潜在コンテキストを、対話シナリオの対話遷移における遷移の条件とし、抽出された当該発話に係る情報に基づいた発話を含む対話遷移パターンを生成する遷移パターン生成手段と
    を有することを特徴とする対話シナリオ生成装置。
  3. 前記コンテキスト決定手段は、当該テキスト同士が類似しているにもかかわらず、対応する当該対話遷移フロー同士が類似していない場合、当該テキスト間の差分に相当する当該語句を抽出し、当該語句が当該対話遷移フロー間の相違をもたらしたとして、当該語句に基づいて潜在コンテキストを決定することを特徴とする請求項に記載の対話シナリオ生成装置。
  4. 前記コンテキスト決定手段は、述語項構造解析によって、抽出した当該語句の語句種を決定し、決定した当該語句種に基づいて潜在コンテキストを決定することを特徴とする請求項又はに記載の対話シナリオ生成装置。
  5. 前記コンテキスト決定手段は、当該テキストから抽出した当該固有表現に基づいてコンテキストを決定し、
    前記遷移パターン生成手段は、当該固有表現に基づき決定された当該コンテキストが採用された場合には、採用された当該コンテキストを、対話シナリオの対話遷移における遷移の条件とする
    ことを特徴とする請求項1に記載の対話シナリオ生成装置。
  6. 前記コンテキスト決定手段は、当該テキストとは異なる他のテキストを取得して、当該他のテキストから固有表現を抽出し、抽出した当該固有表現に基づいて新たなコンテキストを決定し、
    前記遷移パターン生成手段は、当該新たなコンテキスト選択された場合には、当該新たなコンテキストを、対話シナリオの対話遷移における遷移の条件とす
    とを特徴とする請求項1から5のいずれか1項に記載の対話シナリオ生成装置。
  7. 対話シナリオを生成する装置に搭載されたコンピュータを機能させるプログラムであって、
    対話シナリオに関連するテキストを取得して、当該テキストから固有表現と発話に係る情報とを抽出し、抽出した当該固有表現に関連する関連コンテキスト要素を、予め用意された辞書を用いて決定するコンテキスト決定手段と、
    決定された当該関連コンテキスト要素と、抽出された当該発話に係る情報とに基づいて、当該テキストに関連する関連テキストを生成する関連テキスト生成手段と、
    生成された当該関連テキスト、又は当該関連テキストから選択された関連テキストに基づいて、当該関連テキストに係る関連コンテキストを、対話シナリオの対話遷移における遷移の条件とし、当該関連テキストに係る発話に係る情報に基づいた発話を含む対話遷移パターンを生成する遷移パターン生成手段と
    してコンピュータを機能させることを特徴とする対話シナリオ生成プログラム。
  8. 対話シナリオを生成する装置に搭載されたコンピュータにおいて実施される対話シナリオ生成方法であって、
    対話シナリオに関連するテキストを取得して、当該テキストから固有表現と発話に係る情報とを抽出し、抽出した当該固有表現に関連する関連コンテキスト要素を、予め用意された辞書を用いて決定するステップと、
    決定された当該関連コンテキスト要素と、抽出された当該発話に係る情報とに基づいて、当該テキストに関連する関連テキストを生成するステップと、
    生成された当該関連テキスト、又は当該関連テキストから選択された関連テキストに基づいて、当該関連テキストに係る関連コンテキストを、対話シナリオの対話遷移における遷移の条件とし、当該関連テキストに係る発話に係る情報に基づいた発話を含む対話遷移パターンを生成するステップと
    を有することを特徴とする対話シナリオ生成方法。
JP2017084493A 2017-04-21 2017-04-21 コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法 Active JP6843689B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017084493A JP6843689B2 (ja) 2017-04-21 2017-04-21 コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017084493A JP6843689B2 (ja) 2017-04-21 2017-04-21 コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2018181250A JP2018181250A (ja) 2018-11-15
JP6843689B2 true JP6843689B2 (ja) 2021-03-17

Family

ID=64275721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017084493A Active JP6843689B2 (ja) 2017-04-21 2017-04-21 コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP6843689B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7244910B2 (ja) * 2019-04-16 2023-03-23 学校法人早稲田大学 情報伝達システムおよびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008152637A (ja) * 2006-12-19 2008-07-03 Toyota Central R&D Labs Inc 応答生成装置及び応答生成プログラム
JP5393732B2 (ja) * 2011-06-29 2014-01-22 ヤフー株式会社 対話ルール変更装置、対話ルール変更方法及び対話ルール変更プログラム
JP5851378B2 (ja) * 2012-10-17 2016-02-03 日本電信電話株式会社 時系列データ探索方法、装置、及びプログラム
JP6180340B2 (ja) * 2014-02-17 2017-08-16 株式会社デンソーアイティーラボラトリ 対話文生成装置、対話文生成方法およびプログラム
JP6305274B2 (ja) * 2014-08-20 2018-04-04 ヤフー株式会社 応答生成装置、応答生成方法及び応答生成プログラム

Also Published As

Publication number Publication date
JP2018181250A (ja) 2018-11-15

Similar Documents

Publication Publication Date Title
CN110717017B (zh) 一种处理语料的方法
Sutton et al. Voice as a design material: Sociophonetic inspired design strategies in human-computer interaction
CN109844708B (zh) 通过聊天机器人推荐媒体内容
CN110770694B (zh) 获得来自多个语料库的响应信息
Juola et al. A prototype for authorship attribution studies
KR20220149629A (ko) 컨퍼런스 기능을 갖는 자동화된 어시스턴트
KR20200003871A (ko) 인간-대-컴퓨터 대화들에 요청되지 않은 콘텐츠의 선행적 통합
US9548052B2 (en) Ebook interaction using speech recognition
CN113906433A (zh) 澄清问题以用于重写有歧义的用户话语
JP2006201870A (ja) 対話処理装置
CN109920409B (zh) 一种声音检索方法、装置、系统及存储介质
Dethlefs et al. Conditional random fields for responsive surface realisation using global features
JP2009099088A (ja) Snsユーザプロファイル摘出装置、摘出方法並びに摘出プログラム、及び該ユーザプロファイルを利用する装置
US20200117742A1 (en) Dynamically suppressing query answers in search
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
WO2003085550A1 (en) Conversation control system and conversation control method
KR101478146B1 (ko) 화자 그룹 기반 음성인식 장치 및 방법
JP6843689B2 (ja) コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法
JP6882975B2 (ja) 対話ログ群からコンテキストを決定可能な対話シナリオ生成装置、プログラム及び方法
Trivedi Fundamentals of Natural Language Processing
CN116888661A (zh) 用于辅助系统的包括非拉丁或不可解析内容项的通信内容的读出
JP3691773B2 (ja) 文章解析方法とその方法を利用可能な文章解析装置
JP6858721B2 (ja) コンテンツに関する対話を実施可能な対話制御装置、プログラム及び方法
JP6821542B2 (ja) 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法
Furui Overview of the 21st century COE program “Framework for Systematization and Application of Large-scale Knowledge Resources”

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201102

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210224

R150 Certificate of patent or registration of utility model

Ref document number: 6843689

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150