JP2019087123A - 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 - Google Patents

複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 Download PDF

Info

Publication number
JP2019087123A
JP2019087123A JP2017216234A JP2017216234A JP2019087123A JP 2019087123 A JP2019087123 A JP 2019087123A JP 2017216234 A JP2017216234 A JP 2017216234A JP 2017216234 A JP2017216234 A JP 2017216234A JP 2019087123 A JP2019087123 A JP 2019087123A
Authority
JP
Japan
Prior art keywords
text
dialogue
utterance
word
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017216234A
Other languages
English (en)
Other versions
JP6821542B2 (ja
Inventor
俊一 田原
Shunichi Tawara
俊一 田原
池田 和史
Kazufumi Ikeda
和史 池田
啓一郎 帆足
Keiichiro Hoashi
啓一郎 帆足
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2017216234A priority Critical patent/JP6821542B2/ja
Publication of JP2019087123A publication Critical patent/JP2019087123A/ja
Application granted granted Critical
Publication of JP6821542B2 publication Critical patent/JP6821542B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】第1種の対話から第2種の対話への対話遷移をより自然に実施することができる対話制御装置を提供する。【解決手段】本対話制御装置は、第1種及び/又は第2種の対話に関連する第1及び/又は第2のテキスト群に含まれる各テキストについて、各テキストのテキスト構成要素情報を決定するテキスト解析手段と、第1テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストのテキスト関連情報と、第2のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストのテキスト関連情報との対比に基づいて、第1のテキスト群が複数のテキストを含む場合に第1のテキスト群から、第1種の対話における発話に係るテキストを決定し、第2のテキスト群から、第2種の対話における発話に係るテキストを決定するテキスト決定手段と、決定されたテキストに基づいた発話を出力する発話制御手段とを有する。【選択図】図1

Description

本発明は、ユーザ等との間で対話を行う対話システムの技術に関する。
近年、ユーザと対話を行い、当該ユーザに種々のサービスを提供可能な対話システムの開発が盛んに進められている。例えば、現在普及しているスマートフォンには、ユーザの発話による問合せに音声で回答し、検索結果等の情報を提供する対話応答機能が常備されているものも少なくない。
通常、人間同士の対話では、1つの内容・種類の対話から別の内容・種類の対話への対話遷移が少なからず発生する。 例えば、ある事件を報じたニュース記事についての対話から、この事件に関する話題についての雑談対話へ、対話の内容・種類が変換することも多い。
このような対話遷移について、例えば、特許文献1には、話題転換の自然性を目的として、ユーザによる発話文の単語を抽出し、抽出した単語に関連する発話を応答する対話制御装置が開示されている。この装置では、その単語に関連する発話が存在しない場合、その単語に含まれる部分文字列を抽出し、抽出した部分文字列に関連する発話を応答している。
また、対話遷移ではないが、話題となり得るコンテンツを配信する技術として、特許文献2には、ユーザの携帯端末内のニュース記事閲覧履歴に基づき、ニュース記事のカテゴリ候補を抽出し、そのカテゴリ内のニュース記事をユーザに推薦する最新記事推薦方法の技術が開示されている。
特開2017−49471号公報 特開2003−216636号公報
しかしながら、特許文献1や特許文献2といったような従来技術をもってしても、対話遷移が不自然になる問題は依然、十分に解消されていない。
実際、特許文献1に記載された技術では、ユーザの話題に基づき、当該話題と同一の話題又は類似する話題を応答する対応がとられている。すなわち、あくまでユーザの発話を前提として装置側が応答するのである。そのため、装置側は、ユーザの話題の範囲内でしか応答することができず、例えば、外部のコンテンツに基づくニュース対話と、それに続く雑談対話とを行った場合、両種対話間の対話遷移が不自然になる可能性が解消されない。
また、特許文献2に記載された技術ではたしかに、ユーザの趣味嗜好に応じたニュース記事を推薦する手法も提示されてはいる。しかしながら、例えば上記のようにニュース対話とそれに続く雑談対話との間で対話遷移を行う状況において、ニュース記事の選択にこのような手法を適用したとしても、対話遷移先の雑談対話について何ら考慮することなくニュース記事を選択せざるを得ないので、結局、対話の流れが不自然になってしまう可能性が残ってしまう。
そこで、本発明は、ある種の対話から別の種の対話への対話遷移をより自然に実施することができる対話制御装置、対話制御プログラム、及び対話制御方法を提供することを目的とする。
本発明によれば、第1種の対話と、それに次ぐ第2種の対話とを実施可能な対話制御装置であって、
当該第1種の対話に関連する第1のテキスト群に含まれる各テキスト、及び当該第2種の対話に関連する第2のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するテキスト解析手段と、
当該第1テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第2のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第1のテキスト群が複数のテキストを含む場合に当該第1のテキスト群から、当該第1種の対話における発話に係るテキストを決定し、当該第2のテキスト群から、当該第2種の対話における発話に係るテキストを決定するテキスト決定手段と、
決定された当該テキストに基づいた発話を出力する発話制御手段と
を有する対話制御装置が提供される。ここで、典型的な実施形態として、当該テキスト構成要素情報は、当該テキストに含まれる単語及び該単語の特徴度であることも好ましい。
この本発明による対話制御装置の一実施形態として、当該第1のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、当該第2のテキスト群は所定の発話に係るテキストであって当該テキスト関連情報としてのキーワードが紐づけられたテキストである発話テキストの集合であり、
テキスト解析手段は、当該各コンテンツテキストに含まれる単語を抽出して該単語の特徴度を算出し、当該特徴度に基づいて当該コンテンツテキストの特徴語を決定し、
テキスト決定手段は、当該キーワードと一致する特徴語である一致特徴語に係るコンテンツテキストを、当該第1種の対話における発話に係るテキストに決定し、当該一致特徴語と一致するキーワードに係る発話テキストを、当該第2種の対話における発話に係るテキストに決定することも好ましい。
また、本発明による対話制御装置の他の実施形態として、当該第1のテキスト群は少なくとも所定の発話に係るテキストである発話テキストを含み、当該第2のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、
テキスト解析手段は、当該発話テキストに含まれる単語を抽出して該単語の特徴度を算出し、また、当該各コンテンツテキストに含まれる単語を抽出して該単語の特徴度を算出し、
テキスト決定手段は、当該発話テキストに含まれる単語及び該単語の特徴度と、当該各コンテンツテキストに含まれる単語及び該単語の特徴度とに基づいて、当該発話テキストと当該各コンテンツテキストとの類似度を算出し、当該発話テキストに類似したコンテンツテキストを、当該第2種の対話における発話に係るテキストに決定することも好ましい。
さらに、本発明による対話制御装置において、当該第1テキスト群に含まれる各テキストに係る当該単語のうち当該特徴度の最も高い単語を用いて、当該第1種の対話から当該第2種の対話への対話遷移のための遷移発話を生成する遷移発話生成手段を更に有し、
発話制御手段は、当該第1種の対話から当該第2種の対話へ対話を遷移させるタイミングで、当該遷移発話を出力することも好ましい。
さらにまた、本発明による対話制御装置において、当該テキスト関連情報は当該テキストに紐づけられたキーワードであって、当該キーワードの1つは職業名に係る単語であり、
テキスト解析手段は、当該特徴語が人名に係る単語である場合に、人物と職業とが対応付けられた辞書を用いて、該特徴語を職業名に係る単語に置換する職業置換手段を有し、
テキスト決定手段は、当該発話に係るテキストを決定する際の対比を、置換後の当該職業名に係る単語について実施することも好ましい。
また、上記の職業置換手段を有する実施形態において、当該第1テキスト群に含まれる各テキストに係る当該単語のうち当該特徴度の最も高い単語を用いて、当該第1種の対話から当該第2種の対話への対話遷移のための遷移発話を生成し、当該特徴度の最も高い単語が当該職業名に係る単語に置換されていても元の当該特徴度の最も高い単語を用いて遷移発話を生成する遷移発話生成手段を更に有し、
発話制御手段は、当該第1種の対話から当該第2種の対話へ対話を遷移させるタイミングで、当該遷移発話を出力することも好ましい。
さらに、上記の職業置換手段を有する実施形態において、職業置換手段は、当該職業名に係る単語に置換された特徴語の特徴度を、意外性を有する対話遷移を行うためにより高い値に変更し、または、置換の過誤を抑制するためにより低い値に変更することも好ましい。
また、本発明による対話制御装置の更なる他の実施形態として、当該第1のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、当該第2のテキスト群は所定の発話に係るテキストであって当該テキスト関連情報としてのキーワードが紐づけられたテキストである発話テキストの集合であり、
テキスト決定手段は、当該第1種の対話に次ぐ当該第2種の対話の後に再び当該第1種の対話を実施すべく、実施された当該発話テキストに係る当該単語及び特徴度と、当該各コンテンツテキストに含まれる単語と該単語の特徴度とに基づいて、当該発話テキストと当該各コンテンツテキストとの類似度を算出し、当該発話テキストに類似したコンテンツテキストを、再び実施する当該第1種の対話における発話に係るテキストに決定することも好ましい。
さらに、本発明による対話制御装置において、当該第1のテキスト群又は当該第2のテキスト群は、所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、
発話制御手段は、所定のSNS(Social Networking Service)投稿を取得するSNS投稿取得手段を有し、取得されたSNS投稿であって、当該発話に係るテキストに決定されたコンテンツテキストに関連しており所定条件を満たすSNS投稿に基づいた発話を出力することも好ましい。
本発明によれば、また、第1種の対話と、それに次ぐ第2種の対話とを実施可能な装置に搭載されたコンピュータを機能させるプログラムであって、
当該第1種の対話に関連する第1のテキスト群に含まれる各テキスト、及び当該第2種の対話に関連する第2のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するテキスト解析手段と、
当該第1テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第2のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第1のテキスト群が複数のテキストを含む場合に当該第1のテキスト群から、当該第1種の対話における発話に係るテキストを決定し、当該第2のテキスト群から、当該第2種の対話における発話に係るテキストを決定するテキスト決定手段と、
決定された当該テキストに基づいた発話を出力する発話制御手段と
してコンピュータを機能させる対話制御プログラムが提供される。
本発明によれば、さらに、第1種の対話と、それに次ぐ第2種の対話とを実施可能な装置に搭載されたコンピュータにおいて実施される対話制御方法であって、
当該第1種の対話に関連する第1のテキスト群に含まれる各テキスト、及び当該第2種の対話に関連する第2のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するステップと、
当該第1テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第2のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第1のテキスト群が複数のテキストを含む場合に当該第1のテキスト群から、当該第1種の対話における発話に係るテキストを決定し、当該第2のテキスト群から、当該第2種の対話における発話に係るテキストを決定するステップと、
決定された当該テキストに基づいた発話を出力するステップと
を有する対話制御方法が提供される。
本発明の対話制御装置、対話制御プログラム、及び対話制御方法によれば、ある種の対話から別の種の対話への対話遷移をより自然に実施することが可能となる。
本発明による対話制御装置の一実施形態における機能構成を示す機能ブロック図である。 本発明に係る雑談シナリオデータベース(DB)に格納された雑談発話テキストの一実施例を示す模式図である。 本発明に係るニュース記事テキスト解析処理の一実施例を説明するための模式図である。 発話制御部による雑談シナリオDBを用いた発話制御処理の一実施例を示す模式図である。 ユーザインタフェースがタッチパネル・ディスプレイである場合の発話出入力例を示す模式図である。 発話制御部における、取得したSNS投稿を利用したニュース対話の一実施形態を説明するための機能ブロック図である。 本発明による対話制御方法の一実施形態を概略的に示すフローチャートである。 本発明による対話制御方法の他の実施形態を概略的に示すフローチャートである。 本発明による対話制御方法の更なる他の実施形態を概略的に示すフローチャートである。
以下では、本発明の実施形態について、図面を用いて詳細に説明する。
[対話制御装置]
図1は、本発明による対話制御装置の一実施形態における機能構成を示す機能ブロック図である。
図1によれば、本発明の一実施形態としての対話制御装置1は、ユーザとの間で、スピーカ・マイクやタッチパネル・ディスプレイといったユーザインタフェース(UI)102を介して対話を実施可能な装置であり、特に、第1種の対話と、それに次ぐ第2種の対話との間の対話遷移をより自然にする、言い換えれば第1種の対話から第2種の対話への対話の流れをより違和感のないものにすることの可能な装置となっている。
ここで、対話の種類は、大きく2つに大別される。1つはニュース記事、解説記事や、評論・エッセイ、さらにはSNS(Social Networking Service)投稿等、通信ネットワークを介して取得されるコンテンツについての対話(コンテンツ対話)であり、もう1つは、このようなコンテンツに限定されない内容の非コンテンツ対話である。
また、このコンテンツ対話を、そのコンテンツの種別によってさらに分類することも可能である。さらに、非コンテンツ対話も、雑談対話や講義対話等、便宜的な分類を行うことができる。以下に示す実施形態では、2つの種類の対話として、ニュース記事についてのニュース対話と、非コンテンツ対話としての雑談対話とを採用しているが、本発明に係る複数種の対話は当然、これらに限定されるものではない。
同じく図1に示すように、対話制御装置1は、本実施形態において通信インタフェース101を備えており、通信ネットワーク上に設置された、(a)デジタルコンテンツ配信事業者の運営する種々のニュース記事データを配信・提供可能なニュースサーバ2や、(b)SNS投稿データを配信・提供可能なSNSサーバ4と通信接続して、ニュース記事データやSNS投稿データを取得することができる。これらのデータは、より自然な対話遷移を伴うユーザとの対話を実施する際に活用される。
具体的に、対話制御装置1は、その顕著な特徴として、
第1種の対話と、それに次ぐ第2種の対話とを実施可能な対話制御装置であって、
(A)第1種の対話に関連する「第1のテキスト群」に含まれる各テキスト、及び第2種の対話に関連する「第2のテキスト群」に含まれる各テキストのうちの少なくとも一方について、各テキストの構成要素に係る「テキスト構成要素情報」を決定するテキスト解析部(111f,111s)と、
(B)「第1テキスト群」に含まれる各テキストに係る「テキスト構成要素情報」又は当該テキストに関連付けられた「テキスト関連情報」と、「第2のテキスト群」に含まれる各テキストに係る「テキスト構成要素情報」又は当該テキストに関連付けられた「テキスト関連情報」との対比に基づいて、「第1のテキスト群」が複数のテキストを含む場合に「第1のテキスト群」から、第1種の対話における発話に係るテキスト(発話テキスト)を決定し、「第2のテキスト群」から、第2種の対話における発話に係るテキスト(発話テキスト)を決定するテキスト決定部(112)と、
(C)決定されたテキストに基づいた発話を出力する発話制御部(114)と
を有している。
ここで、第1種及びそれに次ぐ第2種の対話として、それぞれ上述したニュース対話及び雑談対話を採用した場合、「第1のテキスト群」は、例えばニュースサーバ2から取得されるニュース記事テキストデータの集合とすることができ、また、「第2のテキスト群」は、例えば装置1内の雑談シナリオデータベース(DB)104に格納された雑談発話テキストデータの集合とすることができる。ちなみに、この雑談シナリオDBは、装置1内ではなく外部、例えば通信ネットワーク上に(図1では雑談シナリオDB3として)設置されてもよい。または、第1種及びそれに次ぐ第2種の対話として、それぞれ(上記とは逆である)雑談対話及びニュース対話を採用した場合は、「第1のテキスト群」を雑談発話テキストデータの集合とし、「第2のテキスト群」をニュース記事テキストデータの集合とすることができる。
以上に述べたように対話制御装置1は、第1種の対話での発話テキストを決定する際には、「第2のテキスト群」のテキストも考慮し、第2種の対話での発話テキストを決定する際には、「第1のテキスト群」のテキストも考慮している。これにより、第1種の対話での発話と、第2種の対話での発話との間に、発話内容や話題の関連性が生じ、結果的に、第1種の対話から第2種の対話への対話遷移がより自然な形で行われることになるのである。
特に例えば、当初のニュース対話での発話テキストとしてニュース記事テキストを選択することができる状況において、雑談対話での雑談発話テキストとの対比を行い、次いで行われる予定の雑談対話の内容へ自然な形で遷移し易い内容のニュース記事テキストを選択して、ニュース対話を実施することができるので、対話遷移の自然性がより向上する。
ちなみに、「テキスト構成要素情報」は、以下に示す実施形態では、テキストに含まれる単語及び当該単語の特徴度である。このような単語は、例えば後述するように形態素解析によってテキストから抽出可能である。勿論、この「テキスト構成要素情報」として、テキストを構成する要素単位についての情報であれば種々のものが採用可能であり、例えばN-gramによって求められるn文字単位及びその出現頻度を採用してもよい。さらに、以下に示す実施形態では、「テキスト関連情報」は、予めテキストに紐づけられたキーワードとしているが、これもテキストに関連する情報であれば種々の情報が採用可能である。
[装置機能構成]
同じく図1の機能ブロック図によれば、対話制御装置1は、通信インタフェース101と、ユーザインタフェース(UI)102と、ニュース記事データベース(DB)103と、雑談シナリオDB104と、SNS投稿DB105と、人物・職業辞書106と、プロセッサ・メモリとを有する。
ここで、このプロセッサ・メモリは、本発明による対話制御プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、この対話制御プログラムを実行することによって、対話制御処理を実施する。したがって、対話制御装置1は、本発明による対話制御プログラムを搭載した、例えばスマートフォン、タブレット型若しくはノート型コンピュータ、又はパーソナル・コンピュータ(PC)等であってもよい。
さらに、このプロセッサ・メモリは、機能構成部として、第1職業置換部111faを含む第1テキスト解析部111fと、第2職業置換部111saを含む第2テキスト解析部111sと、第1発話生成部112a及び第2発話生成部112bを含むテキスト決定部112と、遷移発話生成部113と、SNS投稿取得部114aを含む発話制御部114と、通信制御部121と、テキスト取得部122と、入出力制御部123とを有する。
なお、これらの機能構成部は、プロセッサ・メモリに保存された対話制御プログラムの機能と捉えることができ、また、図1における対話制御装置1の機能構成部間を矢印で接続して示した処理の流れは、本発明による対話制御方法の一実施形態としても理解される。
同じく図1において、ニュース記事データベースDB103は、例えば外部に設置されたニュースサーバ2から通信インタフェース101及び通信制御部121を介して取得されたニュース記事テキストデータを、例えば記事の内容を表す記事キーワードや予め設定された記事種別情報を対応付けて保存したデータベースである。ここで、ニュース記事テキスト(データ)は、例えばタイトルと本文とから構成されていてもよい。
また、雑談シナリオDB104は、想定される装置1とユーザとの対話を記述した雑談発話テキスト(データ)を保存したデータベースである。ここで、各雑談発話テキストには、後に実施されるテキスト決定処理の際に利用すべく所定のキーワードが対応付けられている。
図2は、本発明に係る雑談シナリオDB104に格納された雑談発話テキストの一実施例を示す模式図である。
図2(A)によれば、雑談シナリオDB104には、多数の雑談発話テキストが識別番号を付与されて格納されている。また、これらの雑談発話テキストは、対話制御装置1側の発話テキストと、ユーザ側の発話テキストとの2種類に分類されている。ちなみに、これらの雑談発話テキストは、本装置や他の対話システムで収集された対話シナリオや対話の実績データ、さらには種々のオーサリングツールで作成された対話シナリオから抽出されたものとすることができる。
また、図2(B)によれば、装置1側の雑談発話テキスト(図2(A)では番号1〜50のテキスト)には各々、
(a)その発話内容に関係する、類似する又は当該発話内容を代表する名詞等である類似キーワードと、
(b)その発話内容に出現する又は関係する職業名である職業キーワードと
が人手等によってタグ付けされている。このうち職業キーワードは、例えば、雑談発話テキストの内容に合致した(例えばテキストに出現する知名人についての)Wikipediaの記載を検索し、当該記載から職業名を、職業名辞書を用いて抽出し入手してもよい。
勿論、雑談発話テキストに予め紐づけされるキーワードは、上記(a)及び(b)に限定されるものではない。例えばその一方のみでも後のテキスト決定処理を実施することができ、また、他の種類のキーワードも採用可能である。しかしながら、本実施形態のように類似キーワード及び職業キーワードを採用することによって、対話遷移をより自然にするニュース記事テキストと、それに合った雑談発話テキストとを決定することが可能となっている。
図1に戻って、第1種及び第2種の対話がそれぞれニュース対話及び雑談対話である場合に、テキスト取得部122は、ニュース記事DB103から、ニュース記事テキストを複数取得し、第1テキスト解析部111fへ出力する。その際、ユーザの趣味嗜好に合ったテキストを取得することも好ましい。例えば、後述するSNS投稿取得部114aで決定された、又は所定のルートで取得されたユーザの趣味嗜好情報が「野球」である場合、ニュース記事DB103から、記事キーワードや記事種別情報として「野球」が紐づけられているニュース記事テキストを引き出してきてもよい。
また、テキスト取得部122は、雑談シナリオDB104から、所定分だけの又は所定の種別の雑談発話テキストを複数取得し、第2テキスト解析部111sへ出力する。
第1テキスト解析部111fは、入力されたニュース記事テキスト群に含まれるニュース記事テキストの各々について、タイトルと本文とを合わせて1つのテキストとし、このテキストから、例えばTF-IDF(Term Frequency-Inverse Document Frequency)解析によって、特徴的な単語である「ニュース単語」を例えば所定数だけ抽出し、抽出した各単語のスコア(特徴度)を算出する。このスコアは、例えばtf・idfスコア(tf値×idf値)とすることができる。また、ここで解析されたニュース記事テキストと抽出されたニュース単語及びそのスコアとは、テキスト決定部112へ出力される。
図3は、本発明に係るニュース記事テキスト解析処理の一実施例を説明するための模式図である。
図3によれば、識別番号1〜100が付与された100個のニュース記事テキストの各々について、TF-IDF解析を行い、スコア(特徴度)の高い順に5つのニュース単語(特徴語)を抽出して列挙している。例えば、識別番号2のニュース記事テキストでは、最高のスコア(0.82)を有しており最も特徴的なニュース単語として「野球」が挙がっている。
図1に戻って、一方、第2テキスト解析部111sは、第1種及び第2種の対話がそれぞれニュース対話及び雑談対話である場合、テキスト取得部122から入力した雑談発話テキスト群を、テキスト決定部112へ出力する。
次いで、テキスト決定部112は、
(a1)入力したニュース記事テキストの各々におけるニュース単語及びそのスコアと、
(a2)同じく入力した雑談発話テキストの各々における紐づけられた類似キーワード及び職業キーワードと
を対比し、類似及び職業キーワードのいずれかと一致するニュース単語である「一致ニュース単語」(一致特徴語)を決定する。
テキスト決定部112は、さらに、
(b)決定した一致ニュース単語の中から、スコアの最も高い単語である「高スコア単語」を決定し、
(c)決定した高スコア単語が属するニュース記事テキストを、ニュース対話における発話テキストに決定し、
(d)高スコア単語が一致したところの(類似又は職業)キーワードが対応付けられた雑談発話テキストを、ニュース対話に次いで行う雑談対話における発話テキストに決定する。
ここで、上述したテキスト決定処理の一実施例を説明する。図3に示したニュース記事テキスト1〜100のニュース単語のうち、図2(B)に示された類似及び職業キーワードのいずれかと一致し、且つ最もtf・idfスコアが高いのは「野球」となっている。そこで、テキスト決定部112は、高スコア単語「野球」の属するニュース記事テキスト2を、ニュース対話の発話テキストに決定する。また、図2(A)に示された装置1側の発話テキストのうち、類似キーワード「野球」が対応付けられた識別番号2の「スポーツする?」を、雑談対話の発話テキストに決定するのである。
ちなみに、上記(c)のニュース記事テキストの決定処理についての変更態様として、テキスト決定部112は、決定した一致ニュース単語を含む各ニュース記事テキストにおいて、一致ニュース単語のスコアの合計値を算出し、この合計値の最も高いニュース記事テキストを、ニュース対話における発話テキストに決定してもよい。この場合、高スコア単語だけに依存しない総合的な単語対比に基づいて、テキスト決定の判断を行うことができる。
また、一致するキーワードの対応付けられた雑談発話テキストが複数存在し、それ故、上記(d)の雑談対話における発話テキストが複数決定され得る場合も存在する。この場合、それらの中から1つをランダムで選択してもよい。または、対応付けられた他の(非一致である)キーワードの種別が、予め分類された複数の種別のうちの所定のものであるような雑談発話テキストを選択することも可能である。
ここで図1に示したように、第1テキスト解析部111fは、第1職業置換部111faを有することも好ましい。この第1職業置換部111faは、(第1種の対話に係るニュース記事テキストについて決定された)ニュース単語が人名に係る単語(人名語)である場合に、人物と職業とが対応付けられた辞書である人物・職業辞書106を用いて、このニュース単語を職業名に係る単語(職業名語)に置換する。ちなみにこの場合、テキスト決定部112は、発話テキストを決定する際の対比を、置換後の職業名語について実施することになる。
このように、第1テキスト解析部111fにおいて人名語を職業名語に置換することによって、単語対比で人名そのものが一致するケースが相当に限定される実情に対処することができる。例えば、ニュース単語が人名語である場合において、雑談発話テキスト群にも同一の人名語がキーワードとして対応付けられていれば両者の一致を判定できる。しかしながら実際には、人名語は膨大な数存在し、その雑談発話テキストに関連しそうな人名語を例えば人手で紐づけていくことには限界がある。一方、その人名の人物が従事する職業の名前であれば、比較的数も少ないので例えば人手でテキストへの対応付けを行うことも可能となる。
そこで、雑談発話テキストに予め職業キーワードを紐づけた上で、人名語であるニュース単語は対応する職業名語に置換することによって、両テキストの単語対比を適切に実施することが可能となるのである。
具体的には、例えばWikipediaを利用し、Wikipediaの存命人物カテゴリに含まれる人物毎に、当該人物の人名語と、各人物についての記載から抽出された職業名語とを紐づけたデータを作成して、このデータを例えばオープンソースの形態素解析エンジンであるMeCabの辞書に登録する。この辞書を補強したMeCabを利用することにより、人名語であるニュース単語を、対応する職業名語に置換することができる。
なお、第2テキスト解析部111sの第2職業置換部111saも、第2種の対話に係るテキストがニュース記事テキストである場合に、上記の第1職業置換部111faと同様の置換処理を実施することが可能な機能構成部となっている。また、後に図8及び図9を用いて説明するように、雑談対話からニュース対話へ対話遷移する実施形態では、第1(第2)職業置換部111sa(111fa)は、雑談対話に係る発話テキストについて、人名語を職業名語に置換する処理を行ってもよい。
またさらに、第1職業置換部111fa(第2職業置換部111sa)は、職業名語に置換されたニュース単語のスコアを、(ア)意外性を有する対話遷移を行うためにより高い値に変更し、または、(イ)置換の過誤を抑制するためにより低い値に変更することも好ましい。
ここで、上記(ア)の例として、第1種の対話としてのニュース対話における話題が「ファッション」であり、そのニュース単語がプロ野球の選手名であって職業名語「プロ野球選手」に置換された場合を説明する。この場合、通常は、次いで実施される雑談対話においても話題を「ファッション」とした対話を実施することが、自然な対話遷移を実現する観点から好ましいといえる。
しかしながら、例えばこのニュース対話における話題がより具体的に「プロ野球選手のプライベートにおけるファッション」である場合、次いで実施される雑談対話において話題を、(「ファッション」からすると意外なものである)「プロ野球(選手)」に変更することも自然な対話遷移の下、十分にあり得る。そこで、「プロ野球(選手)」を話題とした雑談発話テキストを選択され易くすべく、このニュース対話のニュース単語(プロ野球の選手名)のスコアをより高くするのである。
一方、上記(イ)の例としては、ニュース単語の人名が同姓同名であって異なる職業に従事する人物の人名である場合が挙げられる。例えば、このニュース単語の人名が、上述したMeCabの辞書に登録された人名ではあるが互いに職業の異なる複数の人物の人名に相当する場合である。
この場合、人名語を職業名語に置換した結果、ニュース単語の人名とは無関係の職業名に係るキーワードを対応付けられた雑談発話テキストが選択されてしまい、対話遷移が不自然となる可能性が高くなってしまう。そこで、このような雑談発話テキストが選択され難くなるように、このような人名であるニュース単語のスコアをより低くする。これにより、より自然な対話遷移を確保することが可能となるのである。
また、テキスト決定部112の第1発話生成部112a及び第2発話生成部112bはそれぞれ、
(a)第1種の対話であるニュース対話のためのニュース発話(データ)を、ニュース対話の発話テキストとして決定されたニュース記事テキストから生成し、及び
(b)第2種の対話である雑談対話のための雑談発話(データ)を、雑談対話の発話テキストとして決定された雑談発話テキストを含めた雑談発話テキスト群から、さらにはユーザインタフェース102を介して取得したユーザ側の発話データに基づいて、生成する。
ここで、上記(a)のニュース発話は例えば、決定されたニュース記事テキストにおけるタイトルと本文の全部又は所定の一部とをもって構成されていてもよい。
また同じく図1に示すように、装置1の機能構成部として遷移発話生成部113が設けられていることも好ましい。遷移発話生成部113は、(第1種の対話である)ニュース対話に係るニュース記事テキストから決定された高スコア単語を用いて、ニュース対話から(第2種の対話である)雑談対話への対話遷移のための遷移発話を生成する。ここで、決定された雑談発話テキストに対応付けられた、当該高スコア単語とは一致していないキーワードも用いて、遷移発話を生成することも可能である。
ちなみに、このように生成された遷移発話は、ニュース対話から雑談対話への対話遷移の際に(第1種の対話から第2種の対話へ対話を遷移させるタイミングで)出力され、当該対話遷移を自然な形で進める作用効果を奏する。
本実施形態の遷移発話生成部113は具体的に、高スコア単語と、決定された雑談発話テキストとから遷移発話(データ)を生成する。簡単な例として、「ところで、ニュース記事に<高スコア単語>が出てきたけど、<雑談発話テキスト>」といった定型フォーマットを用いて遷移発話データを生成してもよい。この場合、高スコア単語が「野球」であって、決定された雑談発話テキストが「スポーツはする?」である場合、遷移発話は「ところで、ニュース記事に野球が出てきたけど、何かスポーツはする?」となる。
ちなみに、上記のように雑談発話テキストを用いて生成した遷移発話は、対話の種別としては、雑談対話(第2種の対話)に含まれることになる。すなわちこの場合、遷移発話は、ニュース対話(第1種の対話)の終了直後に開始された雑談対話における冒頭の発話となる。また、このような遷移発話を実施しない形態では、上記の決定された雑談発話テキストである「スポーツはする?」から雑談発話を生成し、ニュース対話の終了直後に雑談対話の出だしとして出力することも可能である。
また、遷移発話生成部113は、第1職業置換部111faにおいて高スコア単語(人名語)が職業名語に置換されている場合でも、この元の高スコア単語(人名語)を用いて遷移発話を生成することも好ましい。これにより、ニュース発話で使用された可能性の低い置換後の職業名語に代わって、使用された可能性の高い人名語(高スコア単語)を遷移発話に使用し、対話遷移をより自然な形で進めることが可能となる。
発話制御部114は、第1発話生成部112a、遷移発話生成部113、及び第2発話生成部112bから、それぞれで生成されたニュース発話、遷移発話、及び雑談発話を入力し、所定の順序(ニュース発話→遷移発話→雑談発話の順序)、及びユーザインタフェース102及び入出力制御部123を介したユーザとの対話が成立するような所定のタイミングでそれらの発話を入出力制御部123へ出力し、ユーザインタフェース102を介してユーザに提示(例えば画面表示及び/又は音声提示)する。
図4は、発話制御部114による雑談シナリオDB104を用いた発話制御処理の一実施例を示す模式図である。
図4に示すように、本実施形態の雑談シナリオDB104には、当初の装置1側の発話である雑談発話(図4では「野球好きですか?」)に対する応答としてのユーザ側の発話候補が、複数通り(図4では3通り)設定されている。また、これらのユーザ側の発話候補の各々に沿って分岐する形で、当該発話候補に合った応答となる雑談発話テキストを設定している。
ここで、発話制御部114は、実際に応答としてのユーザ側の発話を取得した際、雑談シナリオDB104にアクセスし、取得したユーザ側の発話との間で最も高い類似度を有するユーザ側発話候補に対応付けられた雑談発話テキストを取得して、これに応じた発話を生成し出力する。例えば、応答としてのユーザ側の発話:「ええ、野球は好きですよ。」を取得した際、最も類似しているユーザ側発話候補:「はい。野球は大好きですよ。」に対応付けられた「そうなんですね。野球って楽しいですもんね。」との雑談発話を取得・生成し、出力するのである。
図1に戻って、入出力制御部123は、発話制御部114から入力された発話(ニュース発話、遷移発話、雑談発話)を、ユーザインタフェース102で出力可能な形に変換し、発話制御部114から指定された順序及びタイミングでユーザインタフェース102へ出力する。
例えば、ユーザインタフェース102がタッチパネル・ディスプレイである場合、入出力制御部123は、発話をディスプレイ表示データに変換して出力する。また、この場合、タッチパネル経由で入力されたユーザ側の発話を、例えばテキストデータに変換して発話制御部114へ出力することも好ましい。さらに、ユーザインタフェース102がスピーカ・マイクである場合、入出力制御部123は、発話を音声データに変換して出力する。また、この場合は、マイク経由で入力されたユーザ側の発話音声データを、例えばテキストデータに変換して発話制御部114へ出力することも好ましい。
図5は、ユーザインタフェース102がタッチパネル・ディスプレイである場合の発話出入力例を示す模式図である。
図5によれば、ユーザインタフェース102の表示画面に、左端部からの吹き出しの形で装置1側発話が表示され、右端部からの吹き出しの形でユーザ側発話が表示されている。両者の発話は上から順に交互に表示され、雑談対話の実施されていることが一目で理解される。
このうち、ユーザ側発話の入力は、タッチパネルを用いた文字入力でもよく、装置1に備えられたマイクを介したユーザによる音声入力であってもよい。また、装置1側の発話の出力も装置1に備えられたスピーカを介した音声出力することもできる。勿論、発話の入出力を音声入出力だけとしてもよい。ちなみに例えば、対話制御装置1が、本発明による対話制御プログラムである対話アプリをダウンロードしたスマートフォンである場合、このアプリの機能としてこのような入出力を実現することが可能となる。
なお、ユーザインタフェース102の他の実施形態として、キーボードを備えたものや点字入出力器を備えたものを採用することも可能である。
図1に戻って、発話制御部114は、SNS投稿取得部114aを有していてもよい。このSNS投稿取得部114aは、SNSサーバ4から通信インタフェース101を介して受信したSNS投稿群を蓄積したSNS投稿DB105から、SNS投稿を取得し、さらにSNSにおけるユーザのプロフィールやツイート本文の情報を取得して、ユーザの趣味嗜好に係る情報を決定する。
例えば、ユーザのプロフィールとツイート本文とを1つの文書にし、この文書からTF-IDF解析によって特徴語を抽出して、tf・idfスコアが上位である単語の中から趣味嗜好に関連する単語を選択し、この単語をユーザの趣味嗜好に係る情報としてもよい。このように決定されたユーザの趣味嗜好情報は例えば、テキスト取得部122が、ニュース記事DB103から、ユーザの趣味嗜好に合ったニュース記事テキストを取得する際に利用される。
また、発話制御部114は、例えば第1のテキスト群又は第2のテキスト群がニュース記事テキスト群(コンテンツテキスト群)である場合に、取得されたSNS投稿であって、決定されたニュース記事テキストに関連しており所定条件を満たすSNS投稿に基づいたニュース発話を出力することも好ましい。
図6は、発話制御部114における、取得したSNS投稿を利用したニュース対話の一実施形態を説明するための機能ブロック図である。
図6によれば、発話制御部114は、ニュース対話に係る機能構成部として、すでに述べたSNS投稿取得部114aと、ニュース発話出力部114bと、SNS投稿判定部114cと、SNS投稿発話出力部114dとを有している。このうち、ニュース発話出力部114bは、決定されたニュース記事テキストから生成された(例えばニュース記事テキストのタイトルと本文の全部又は所定の一部とから構成された)ニュース発話を出力する。
また、SNS投稿取得部114aは、決定されたニュース記事テキストに関連する複数のSNS投稿を取得する。例えば、このニュース記事のSNSリンクボタン(ツイートボタン)を通して生成されたSNS投稿を、関連する投稿として取得してもよい。
さらに、SNS投稿判定部114cは、取得したSNS投稿をポジティブ又はネガティブの2つのカテゴリに分類し、ニュース対話時に取得されるユーザ側発話の内容に応じて、いずれかのカテゴリの中からSNS投稿を1つ選択する。例えば、ユーザの発話内容がネガティブな内容であると判定された場合、ネガティブ・カテゴリの中からSNS投稿を1つ選択する。
ここで、SNS投稿やユーザ側発話におけるポジティブ/ネガティブの分類は、予め作成されたポジティブ語・ネガティブ語辞書を用いて行うことができる。この場合、SNS投稿(若しくはユーザ側発話)から抽出した単語群又は特徴語を、この辞書を用いてポジティブ/ネガティブに分類して判断してもよい。例えば、「すごいね」を有するSNS投稿はポジティブであり、「・・・ない」を有するSNS投稿はネガティブであると判断されてもよい。さらに他の分類方法として、SVM(Support Vector Machine)等の(ポジティブ/ネガティブの学習済みの)識別器を用いて分類を行うことも可能である。
また、SNS投稿発話出力部114dは、SNS投稿判定部114cで選択したSNS投稿を、装置1側のニュース発話としてユーザインタフェース102へ出力する。以上説明したように、発話制御部114は、ユーザとの間で、関連するSNS投稿も利用した好適なニュース対話を実施することができるのである。
[対話制御方法]
図7は、本発明による対話制御方法の一実施形態を概略的に示すフローチャートである。同図に示す対話制御方法は、対話制御装置1における以上に説明したような、第1種及び第2種の対話がそれぞれニュース対話及び雑談対話である場合における対話制御処理に相当する。
(S101)所定の(例えばユーザの趣味嗜好情報に類似する)複数のニュース記事テキストを取得する。
(S102)取得したニュース記事テキストから、ニュース単語を抽出し、抽出した各ニュース単語のスコアを算出する。
(S103)各々キーワードの付与された複数の雑談発話テキストを取得する。
(S104)取得した雑談発話テキストのキーワードと一致しており最高のスコアを有するニュース単語である高スコア単語を決定し、取得したニュース記事テキストの中から、決定した高スコア単語が属しているニュース記事テキストを選択し、ニュース発話を生成する。
(S105)決定した高スコア単語と一致するキーワードが紐づけられた雑談発話テキストを選択する。
(S106)決定した高スコア単語及び選択した雑談発話テキストに基づいて、対話遷移発話を生成する。
(S107)ユーザインタフェース102を介して対話を実施する。具体的には、生成したニュース発話を出力し、次いで、生成した遷移発話を出力して、その後、ユーザ側発話に基づき生成した雑談発話を出力する。
次に、本発明による対話制御方法の他の実施形態を説明する。この実施形態は、対話制御装置1において以上に説明してきたように、最初にニュース対話(第1種の対話)が実施されて、次いで雑談対話(第2種の対話)が実施され、その後再びニュース対話(第1種の対話)が実施される形態となっている。
この場合、第1(第2)テキスト解析部111f(111s)及びテキスト決定部112(図1)は、ニュース対話(第1種の対話)に次ぐ雑談対話(第2種の対話)の後に再びニュース対話(第1種の対話)を実施すべく、
(a)直前に実施された雑談対話で実施された(ユーザ側及び装置1側の)発話テキストに係る単語及びその特徴度と、
(b)ニュース記事テキスト群の各ニュース記事テキストに含まれる単語及びその特徴度と
に基づいて、直前に実施された雑談対話の発話テキストと各ニュース記事テキストとの類似度を算出し、この発話テキストに類似したニュース記事テキストを、再び実施するニュース対話(第1種の対話)における発話テキストに決定する。
より具体的には、第1(第2)テキスト解析部111f(111s)及びテキスト決定部112は、雑談対話からニュース対話へ戻る形で対話遷移を行う際、この雑談対話におけるユーザ側発話と装置1側発話とをまとめて1つの雑談文章テキストとし、TF-IDF解析を用いてこの雑談文章テキストから特徴語である雑談単語を抽出して当該雑談単語のtf・idfスコアを算出する。ここで、抽出した雑談単語に人名語があれば、この人名語を上述したようにMeCab等を用いて職業名語に置換する。ここで上述した目的の下、職業名語に置換した雑談単語のtf・idfスコアをより高くしたり、又はより低くしたりしてもよい。
次いで、この雑談文章テキストにおける雑談単語と、すでに最初のニュース対話について抽出されたニュース単語とを比較し、一致したニュース単語をマーキングする。ここで、雑談文章テキストのtf・idfスコアベクトルと、マーキングしたニュース単語の属する各ニュース記事テキストのtf・idfスコアベクトルとのコサイン(cos)類似度を算出し、cos類似度の最も高いニュース記事テキストを、次いで実施するニュース対話の発話テキストに決定するのである。
ちなみに、対話の中で同じ内容を繰り返す事態を回避するため、過去のニュース対話の中ですでに選択されたニュース記事テキストは、ここでは発話テキストとして決定されないことも好ましい。
なお、本実施形態において、遷移発話生成部113(図1)は、雑談対話から、それに続く再度のニュース対話への対話遷移をより自然な形にする目的で、この対話遷移のタイミングで遷移発話を生成し出力することも好ましい。簡単な例として、「ところで、会話の中に<雑談文章テキストにおける最高のtf・idfスコアを有する特徴語>って出てきたけど、こんなニュースがあったよ。」といった定型フォーマットを用いて遷移発話を生成してもよい。
図8は、本発明による対話制御方法の他の実施形態を概略的に示すフローチャートである。同図に示す対話制御方法は、対話制御装置1における以上に説明したような、第1種及び第2種の対話としてそれぞれニュース対話及び雑談対話を実施した後に再度、ニュース対話を実施する場合における対話制御処理に相当する。具体的には、図7に示したフローの続きのフローとなっている。
(S201)ユーザインタフェース102を介して雑談対話を実施し、実施した雑談対話の発話を文章化した雑談文章テキストから、雑談単語(特徴語)を抽出し、抽出した雑談単語のスコアを算出する。
(S202)抽出した雑談単語と一致するニュース単語(一致ニュース単語)と、一致ニュース単語の(すでに算出された)スコアとを抽出する。
(S203)一致ニュース単語を有するニュース記事テキストと対話文章テキストとの間で、スコアベクトルの類似度を算出する。
(S204)類似度の最も高いニュース記事テキストを選択し、ニュース発話を生成する。
(S205)雑談文章テキストで最高のスコアを有する雑談単語に基づいて、遷移発話を生成する。
(S206)ユーザインタフェース102を介して対話を実施する。具体的には、生成した遷移発話を出力し、その後、生成したニュース発話を出力する。
次いで、本発明による対話制御方法の更なる他の実施形態を説明する。この実施形態は、対話制御装置1において以上に説明してきたのとは逆に、最初に雑談対話(第1種の対話)が実施され、次いでニュース対話(第2種の対話)が実施される形態となっている。
この場合、第1(第2)テキスト解析部111f(111s)及びテキスト決定部112(図1)は、
(a)各ニュース記事テキストに含まれる単語及びその特徴度と、
(b)実施した雑談対話の発話テキストに含まれる単語及びその特徴度と
に基づいて、この発話テキストと各ニュース記事テキストとの類似度を算出し、この発話テキストに類似したニュース記事テキストを、ニュース対話(第2種の対話)における発話テキストに決定することができる。
より具体的には、第1(第2)テキスト解析部111f(111s)及びテキスト決定部112は、各ニュース記事テキストからニュース単語を抽出し、ニュース単語のtf・idfスコアを算出する。また、最初の雑談対話(第1種の対話)におけるユーザ側発話と装置1側発話とをまとめて1つの雑談文章テキストとし、TF-IDF解析を用いてこの雑談文章テキストから特徴語である雑談単語を抽出して当該雑談単語のtf・idfスコアを算出する。ここで、抽出した雑談単語に人名語があれば、この人名語を上述したようにMeCab等を用いて職業名語に置換する。また、上述したような目的の下、職業名語に置換した雑談単語のtf・idfスコアをより高くしたり、又はより低くしたりしてもよい。
次いで、この雑談文章テキストにおける雑談単語と、ニュース対話について抽出されたニュース単語とを比較し、一致したニュース単語をマーキングする。ここで、雑談文章テキストのtf・idfスコアベクトルと、マーキングしたニュース単語の属する各ニュース記事テキストのtf・idfスコアベクトルとのcos類似度を算出し、cos類似度の最も高いニュース記事テキストを、次いで実施するニュース対話の発話テキストに決定するのである。
このように、最初に説明した「ニュース対話→雑談対話」の(図7に示した)実施形態では、雑談対話における内容の異なる複数の発話に係る情報(類似キーワード及び職業キーワード)を考慮してニュース記事テキストが選択されるが、本実施形態では、雑談対話からのより自然な対話遷移を達成するため、装置1とユーザとの雑談対話そのものを考慮して選択を行っているのである。ちなみに、算出したcos類似度がいずれもゼロである場合、この最初に説明した実施形態と同じく雑談対話の発話に係る情報(類似キーワード及び職業キーワード)を考慮してニュース記事テキストを選択することも好ましい。
なお、本実施形態では、第1のテキスト群には、雑談文章テキストが1つ含まれている形であるので当然に、第1種の対話(雑談対話)における発話テキストを決定する処理は行われない。
図9は、本発明による対話制御方法の更なる他の実施形態を概略的に示すフローチャートである。同図に示す対話制御方法は、対話制御装置1において以上に説明してきたように、第1種及び第2種の対話としてそれぞれ雑談対話及びニュース対話を実施する場合における対話制御処理に相当する。
(S301)所定の(例えばユーザの趣味嗜好情報に類似する)複数のニュース記事テキストを取得する。
(S302)取得したニュース記事テキストから、ニュース単語を抽出し、抽出した各ニュース単語のスコアを算出する。
(S303)ユーザインタフェース102を介して雑談対話を実施し、実施した雑談対話の発話を文章化した雑談文章テキストから、雑談単語(特徴語)を抽出し、抽出した雑談単語のスコアを算出する。
(S304)雑談文章テキストと各ニュース記事テキストとの間で、スコアベクトルの類似度を算出し、類似度の最も高いニュース記事テキストを選択し、ニュース発話を生成する。
(S305)雑談文章テキストで最高のスコアを有する雑談単語に基づいて、遷移発話を生成する。
(S306)ユーザインタフェース102を介して対話を実施する。具体的には、生成した遷移発話を出力し、その後、生成したニュース発話を出力する。
以上詳細に説明したように、本発明によれば、第1種の対話での発話テキストを決定する際には、第2のテキスト群のテキストも考慮し、第2種の対話での発話テキストを決定する際には、第1のテキスト群のテキストも考慮している。これにより、第1種の対話での発話と、第2種の対話での発話との間に、発話内容や話題の関連性が生じ、結果的に、第1種の対話から第2種の対話への対話遷移がより自然な形で行われることになる。
特に、所定のコンテンツに係る対話(コンテンツ対話)での発話テキストとして、このコンテンツテキストを選択することができる状況において、非コンテンツ対話での発話テキストとの対比を行い、次いで行われる予定の非コンテンツ対話の内容へ自然な形で遷移し易い内容のコンテンツテキストを選択して、コンテンツ対話を実施することができるので、対話遷移の自然性がより向上するのである。
以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 対話制御装置
101 通信インタフェース
102 ユーザインタフェース(UI)
103 ニュース記事データベース(DB)
104、3 雑談シナリオDB
105 SNS投稿DB
106 人物・職業辞書
111f 第1テキスト解析部
111fa 第1職業置換部
111s 第2テキスト解析部
111sa第2職業置換部
112 テキスト決定部
112a 第1発話生成部
112b 第2発話生成部
113 遷移発話生成部
114 発話制御部
114a SNS投稿取得部
121 通信制御部
122 テキスト取得部
123 入出力制御部
2 ニュースサーバ
4 SNSサーバ

Claims (12)

  1. 第1種の対話と、それに次ぐ第2種の対話とを実施可能な対話制御装置であって、
    当該第1種の対話に関連する第1のテキスト群に含まれる各テキスト、及び当該第2種の対話に関連する第2のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するテキスト解析手段と、
    当該第1テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第2のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第1のテキスト群が複数のテキストを含む場合に当該第1のテキスト群から、当該第1種の対話における発話に係るテキストを決定し、当該第2のテキスト群から、当該第2種の対話における発話に係るテキストを決定するテキスト決定手段と、
    決定された当該テキストに基づいた発話を出力する発話制御手段と
    を有することを特徴とする対話制御装置。
  2. 当該テキスト構成要素情報は、当該テキストに含まれる単語及び該単語の特徴度であることを特徴とする請求項1に記載の対話制御装置。
  3. 当該第1のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、当該第2のテキスト群は所定の発話に係るテキストであって当該テキスト関連情報としてのキーワードが紐づけられたテキストである発話テキストの集合であり、
    前記テキスト解析手段は、当該各コンテンツテキストに含まれる単語を抽出して該単語の特徴度を算出し、当該特徴度に基づいて当該コンテンツテキストの特徴語を決定し、
    前記テキスト決定手段は、当該キーワードと一致する特徴語である一致特徴語に係るコンテンツテキストを、当該第1種の対話における発話に係るテキストに決定し、当該一致特徴語と一致するキーワードに係る発話テキストを、当該第2種の対話における発話に係るテキストに決定する
    ことを特徴とする請求項2に記載の対話制御装置。
  4. 当該第1のテキスト群は少なくとも所定の発話に係るテキストである発話テキストを含み、当該第2のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、
    前記テキスト解析手段は、当該発話テキストに含まれる単語を抽出して該単語の特徴度を算出し、また、当該各コンテンツテキストに含まれる単語を抽出して該単語の特徴度を算出し、
    前記テキスト決定手段は、当該発話テキストに含まれる単語及び該単語の特徴度と、当該各コンテンツテキストに含まれる単語及び該単語の特徴度とに基づいて、当該発話テキストと当該各コンテンツテキストとの類似度を算出し、当該発話テキストに類似したコンテンツテキストを、当該第2種の対話における発話に係るテキストに決定する
    ことを特徴とする請求項2に記載の対話制御装置。
  5. 当該第1テキスト群に含まれる各テキストに係る当該単語のうち当該特徴度の最も高い単語を用いて、当該第1種の対話から当該第2種の対話への対話遷移のための遷移発話を生成する遷移発話生成手段を更に有し、
    前記発話制御手段は、当該第1種の対話から当該第2種の対話へ対話を遷移させるタイミングで、当該遷移発話を出力する
    ことを特徴とする請求項2から4のいずれか1項に記載の対話制御装置。
  6. 当該テキスト関連情報は当該テキストに紐づけられたキーワードであって、当該キーワードの1つは職業名に係る単語であり、
    前記テキスト解析手段は、当該特徴語が人名に係る単語である場合に、人物と職業とが対応付けられた辞書を用いて、該特徴語を職業名に係る単語に置換する職業置換手段を有し、
    前記テキスト決定手段は、当該発話に係るテキストを決定する際の対比を、置換後の当該職業名に係る単語について実施する
    ことを特徴とする請求項2から5のいずれか1項に記載の対話制御装置。
  7. 当該第1テキスト群に含まれる各テキストに係る当該単語のうち当該特徴度の最も高い単語を用いて、当該第1種の対話から当該第2種の対話への対話遷移のための遷移発話を生成し、当該特徴度の最も高い単語が当該職業名に係る単語に置換されていても元の当該特徴度の最も高い単語を用いて遷移発話を生成する遷移発話生成手段を更に有し、
    前記発話制御手段は、当該第1種の対話から当該第2種の対話へ対話を遷移させるタイミングで、当該遷移発話を出力する
    ことを特徴とする請求項6に記載の対話制御装置。
  8. 前記職業置換手段は、当該職業名に係る単語に置換された特徴語の特徴度を、意外性を有する対話遷移を行うためにより高い値に変更し、または、置換の過誤を抑制するためにより低い値に変更することを特徴とする請求項6又は7に記載の対話制御装置。
  9. 当該第1のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、当該第2のテキスト群は所定の発話に係るテキストであって当該テキスト関連情報としてのキーワードが紐づけられたテキストである発話テキストの集合であり、
    前記テキスト決定手段は、当該第1種の対話に次ぐ当該第2種の対話の後に再び当該第1種の対話を実施すべく、実施された当該発話テキストに係る当該単語及び特徴度と、当該各コンテンツテキストに含まれる単語と該単語の特徴度とに基づいて、当該発話テキストと当該各コンテンツテキストとの類似度を算出し、当該発話テキストに類似したコンテンツテキストを、再び実施する当該第1種の対話における発話に係るテキストに決定する
    ことを特徴とする請求項2又は3に記載の対話制御装置。
  10. 当該第1のテキスト群又は当該第2のテキスト群は、所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、
    前記発話制御手段は、所定のSNS(Social Networking Service)投稿を取得するSNS投稿取得手段を有し、取得されたSNS投稿であって、当該発話に係るテキストに決定されたコンテンツテキストに関連しており所定条件を満たすSNS投稿に基づいた発話を出力する
    ことを特徴とする請求項2から9のいずれか1項に記載の対話制御装置。
  11. 第1種の対話と、それに次ぐ第2種の対話とを実施可能な装置に搭載されたコンピュータを機能させるプログラムであって、
    当該第1種の対話に関連する第1のテキスト群に含まれる各テキスト、及び当該第2種の対話に関連する第2のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するテキスト解析手段と、
    当該第1テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第2のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第1のテキスト群が複数のテキストを含む場合に当該第1のテキスト群から、当該第1種の対話における発話に係るテキストを決定し、当該第2のテキスト群から、当該第2種の対話における発話に係るテキストを決定するテキスト決定手段と、
    決定された当該テキストに基づいた発話を出力する発話制御手段と
    してコンピュータを機能させることを特徴とする対話制御プログラム。
  12. 第1種の対話と、それに次ぐ第2種の対話とを実施可能な装置に搭載されたコンピュータにおいて実施される対話制御方法であって、
    当該第1種の対話に関連する第1のテキスト群に含まれる各テキスト、及び当該第2種の対話に関連する第2のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するステップと、
    当該第1テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第2のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第1のテキスト群が複数のテキストを含む場合に当該第1のテキスト群から、当該第1種の対話における発話に係るテキストを決定し、当該第2のテキスト群から、当該第2種の対話における発話に係るテキストを決定するステップと、
    決定された当該テキストに基づいた発話を出力するステップと
    を有することを特徴とする対話制御方法。

JP2017216234A 2017-11-09 2017-11-09 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 Active JP6821542B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017216234A JP6821542B2 (ja) 2017-11-09 2017-11-09 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017216234A JP6821542B2 (ja) 2017-11-09 2017-11-09 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2019087123A true JP2019087123A (ja) 2019-06-06
JP6821542B2 JP6821542B2 (ja) 2021-01-27

Family

ID=66763142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017216234A Active JP6821542B2 (ja) 2017-11-09 2017-11-09 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP6821542B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023286118A1 (ja) * 2021-07-12 2023-01-19 日本電信電話株式会社 対話装置、対話方法およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358304A (ja) * 2001-05-31 2002-12-13 P To Pa:Kk 会話制御システム
JP2010244498A (ja) * 2009-04-07 2010-10-28 Gengo Rikai Kenkyusho:Kk 自動応答文生成システム
JP2015153261A (ja) * 2014-02-17 2015-08-24 株式会社デンソーアイティーラボラトリ 対話文生成装置、対話文生成方法およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358304A (ja) * 2001-05-31 2002-12-13 P To Pa:Kk 会話制御システム
JP2010244498A (ja) * 2009-04-07 2010-10-28 Gengo Rikai Kenkyusho:Kk 自動応答文生成システム
JP2015153261A (ja) * 2014-02-17 2015-08-24 株式会社デンソーアイティーラボラトリ 対話文生成装置、対話文生成方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023286118A1 (ja) * 2021-07-12 2023-01-19 日本電信電話株式会社 対話装置、対話方法およびプログラム

Also Published As

Publication number Publication date
JP6821542B2 (ja) 2021-01-27

Similar Documents

Publication Publication Date Title
JP7095000B2 (ja) 会話型インターフェースの一部として動的に適用されるフィルタリングオペレータを伴う適応会話状態管理のための方法
US10977452B2 (en) Multi-lingual virtual personal assistant
KR101583181B1 (ko) 응답 스티커 추천방법 및 컴퓨터 프로그램
US9947317B2 (en) Pronunciation learning through correction logs
US20200395008A1 (en) Personality-Based Conversational Agents and Pragmatic Model, and Related Interfaces and Commercial Models
US9053096B2 (en) Language translation based on speaker-related information
EP4046097A1 (en) Generating proactive content for assistant systems
US11562744B1 (en) Stylizing text-to-speech (TTS) voice response for assistant systems
US20220188361A1 (en) Voice-based Auto-Completions and Auto-Responses for Assistant Systems
US20080240379A1 (en) Automatic retrieval and presentation of information relevant to the context of a user's conversation
JP6618992B2 (ja) 発言提示装置、発言提示方法およびプログラム
US11501764B2 (en) Apparatus for media entity pronunciation using deep learning
JP5620349B2 (ja) 対話装置、対話方法および対話プログラム
JP2009099088A (ja) Snsユーザプロファイル摘出装置、摘出方法並びに摘出プログラム、及び該ユーザプロファイルを利用する装置
JP7096172B2 (ja) キャラクタ性に応じた形容発話を含む対話シナリオを生成する装置、プログラム及び方法
US20230128422A1 (en) Voice Command Integration into Augmented Reality Systems and Virtual Reality Systems
JP6994289B2 (ja) キャラクタ属性に応じた対話シナリオを作成するプログラム、装置及び方法
JP6320397B2 (ja) 音声選択支援装置、音声選択方法、およびプログラム
CN116888661A (zh) 用于辅助系统的包括非拉丁或不可解析内容项的通信内容的读出
EP2261818A1 (en) A method for inter-lingual electronic communication
JP6821542B2 (ja) 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法
US11809480B1 (en) Generating dynamic knowledge graph of media contents for assistant systems
JP2014109998A (ja) 対話装置及びコンピュータ対話方法
JP6858721B2 (ja) コンテンツに関する対話を実施可能な対話制御装置、プログラム及び方法
JP7211384B2 (ja) 音声認識装置、個人識別方法および個人識別プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200812

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200918

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201223

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210106

R150 Certificate of patent or registration of utility model

Ref document number: 6821542

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150