JP2017027234A - フレーム作成装置、方法、及びプログラム - Google Patents

フレーム作成装置、方法、及びプログラム Download PDF

Info

Publication number
JP2017027234A
JP2017027234A JP2015143326A JP2015143326A JP2017027234A JP 2017027234 A JP2017027234 A JP 2017027234A JP 2015143326 A JP2015143326 A JP 2015143326A JP 2015143326 A JP2015143326 A JP 2015143326A JP 2017027234 A JP2017027234 A JP 2017027234A
Authority
JP
Japan
Prior art keywords
question sentence
label
question
unit
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015143326A
Other languages
English (en)
Inventor
竜一郎 東中
Ryuichiro Higashinaka
竜一郎 東中
俊朗 牧野
Toshiaki Makino
俊朗 牧野
義博 松尾
Yoshihiro Matsuo
義博 松尾
九月 貞光
Kugatsu Sadamitsu
九月 貞光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015143326A priority Critical patent/JP2017027234A/ja
Publication of JP2017027234A publication Critical patent/JP2017027234A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】雑談であっても自然な展開の会話を実現する対話システムのためのフレームを作成することができるようにする。【解決手段】質問文抽出部30が、入力された発話集合から質問文を抽出する。ラベル推定部40が、質問文の各々について、質問文の内容を表す少なくとも1つのラベルを推定する。単語抽出部60が、質問文の各々から、質問文に含まれる単語を抽出する。ラベル集計部70が、単語の各々に対し、単語が抽出された質問文の各々についてラベル推定部40によって推定された少なくとも1つのラベルを集計し、頻度が高いラベルをスロット名とし、スロット名とスロット値との組み合わせの各々からなるフレームを作成する。【選択図】図1

Description

本発明は、フレーム作成装置、方法、及びプログラムに係り、特に、対話システムのためのフレームを作成するフレーム作成装置、方法、及びプログラムに関する。
対話システムは大きく分けて二種類あり、タスク指向型対話システムと非タスク指向型対話システムに分けられる。
タスク指向型対話システムは特定のタスクをシステムとの対話により達成するものであり、たとえば、フライトの予約システムや天気情報案内システムに用いられている。これらのシステムでは、一般的にフレーム(スロット名とスロット値からなるスロットから構成される)という構造を持ち、フレームに基づいて対話が進行する。非特許文献1には、フレームに基づく天気情報案内システムが詳述されている。
非特許文献1におけるフレームは図12のようなものであり、place(場所)、date(日付)、info(情報種別)というスロットがある。
これらのスロット値をユーザからの発話によって埋めることで、対話が進行する。たとえば、ユーザが「大阪の天気なんですけど」と発話したとすると、図13のように、placeのスロット値が「大阪」、infoが「天気」で埋められる。
dateのスロット値が空であるので、対話システムはdateについての質問をするとする。たとえば、「いつですか」とシステムが質問をする。もしユーザが「明日」と答えたとすると、図14のように、date が「明日」で埋められる。
スロットがすべて埋まったら、対話システムはこの情報をもとに、アクセス可能な天気情報のデータベースから明日の大阪の天気を検索し、その情報をユーザに伝えることができる。以上が、一般的なタスク指向型対話システムの挙動である。
一方、非タスク指向型対話システムでは、目的のない対話を扱い、対話の内容はいわゆる雑談である。雑談はさまざまな話題が話される。雑談を行う対話システムの構築の仕方は主に二つあり、一つはルールベースの手法で、大量の応答ルールを手作業で記述する手法である(非特許文献2)。もう一つは、抽出ベースの手法で、ウェブやツイッター(登録商標)などの文章をデータベース化しておき、ユーザ発話に関連するものを選択することで発話する(非特許文献3)。
近年では、非特許文献4のように、ツイッター(登録商標)から発話を検索するだけでなく、大規模テキストから述語項構造(述語とその項からなる構造)のデータベースを作成しておき、対話における現在の話題について、関連する述語項構造を検索し、検索された述語項構造から発話文を生成する手法も研究されている。
Ryuichiro Higashinaka, Katsuhito Sudoh, Mikio Nakano, "Incorporating Discourse Features into Confidence Scoring of Intention Recognition Results in Spoken Dialogue Systems", Speech Communication, Volume 48, Issues 3-4, pp.417-436, 2006. R. S. Wallace, The Anatomy of A.L.I.C.E. A.L.I.C.E. Artificial Intelligence Foundation, Inc., 2004. Bessho, F., Harada, T., and Kuniyoshi, Y. (2012). "Dialog System Using Real-Time Crowdsourcing and Twitter Large-Scale Corpus." In Proc. SIGDIAL, pp. 227-231. Ryuichiro Higashinaka, Kenji Imamura, Toyomi Meguro, Chiaki Miyazaki, Nozomi Kobayashi, Hiroaki Sugiyama, Toru Hirano, Toshiro Makino, Yoshihiro Matsuo, Towards an open domain conversational system fully based on natural language processing, In Proc. COLING, pp.928-939, 2014.
人間同士が「ペット」についての会話をする場合には、最初はペットが好きかどうかという話をし、その後、ペットを飼っているかどうか、そして、飼っているならどんなペットを飼っているかというように話が進行するだろう。しかし、現在の雑談対話システムでは、このような構造を知識として持っていないため、自然な展開の会話ができない。
たしかに、ルールベースの雑談対話システムでは、手作業で会話の流れを作り込むことにより、少数の話題であれば自然な展開の会話も実現できるかもしれない。しかし、雑談のような広い話題に対応することは、コスト面から非現実的である。また、抽出ベースの手法でも、現在の話題についての構造を持たず、ユーザ入力毎に発話の検索を行うため、反射的な反応ばかりをしてしまうという問題がある。
本発明は、上記の事情を鑑みてなされたもので、雑談であっても自然な展開の会話を実現する対話システムのためのフレームを作成することができるフレーム作成装置、方法、及びプログラムを提供することを目的とする。
上記の目的を達成するために本発明に係るフレーム作成装置は、入力された発話集合から質問文を抽出する質問文抽出部と、前記質問文抽出部によって抽出された質問文の各々について、前記質問文の内容を表す少なくとも1つのラベルを推定するラベル推定部と、前記質問文抽出部によって抽出された質問文の各々から、前記質問文に含まれる単語を抽出する単語抽出部と、前記単語の各々に対し、前記単語が抽出された前記質問文の各々について前記ラベル推定部によって推定された前記少なくとも1つのラベルを集計し、頻度が高い前記少なくとも1つのラベルをスロット名とし、前記スロット名とスロット値との組み合わせの各々からなるフレームを作成するラベル集計部と、を含んで構成されている。
本発明に係るフレーム作成方法は、質問文抽出部が、入力された発話集合から質問文を抽出し、ラベル推定部が、前記質問文抽出部によって抽出された質問文の各々について、前記質問文の内容を表す少なくとも1つのラベルを推定し、単語抽出部が、前記質問文抽出部によって抽出された質問文の各々から、前記質問文に含まれる単語を抽出し、ラベル集計部が、前記単語の各々に対し、前記単語が抽出された前記質問文の各々について前記ラベル推定部によって推定された前記少なくとも1つのラベルを集計し、頻度が高い前記少なくとも1つのラベルをスロット名とし、前記スロット名とスロット値との組み合わせの各々からなるフレームを作成する。
本発明に係るプログラムは、コンピュータを、上記のフレーム作成装置の各部として機能させるためのプログラムである。
以上説明したように、本発明のフレーム作成装置、方法、及びプログラムによれば、単語の各々に対し、単語が抽出された質問文の各々について推定された少なくとも1つのラベルを集計し、頻度が高いラベルをスロット名とし、スロット名とスロット値との組み合わせの各々からなるフレームを作成することにより、雑談であっても自然な展開の会話を実現する対話システムのためのフレームを作成することができる、という効果が得られる。
本発明の実施の形態に係るフレーム作成装置の構成を示す概略図である。 学習に用いた質問文と質問タイプの一例である。 質問タイプの一例を示す図である。 形態素解析結果の一例を示す図である。 対話行為の一例を示す図である。 ラベルの推定結果の一例を示す図である。 ラベルの推定結果の一例を示す図である。 質問文と統合されたラベルとの一例を示す図である。 ラベルの集計結果の一例を示す図である。 フレームの一例を示す図である。 本発明の実施の形態に係るフレーム作成装置におけるフレーム作成処理ルーチンの内容を示すフローチャートである。 従来技術におけるフレームの一例を示す図である。 従来技術におけるフレームの一例を示す図である。 従来技術におけるフレームの一例を示す図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態の概要>
多くの話題について、タスク指向型対話システムと同様のフレームを、大規模なユーザ発話の集合から自動的に構築する。具体的には、大規模な発話の集合(今回はツイッター(登録商標)のデータを用いる)から、質問文のみを抽出する。そして、これらの質問文について、質問文の内容を表す一つ以上のラベルを推定する。本発明の実施の形態では、質問タイプ、対話行為、カテゴリ、拡張固有表現タイプのラベルをそれぞれ推定する。ラベル推定器は別途用意した学習用データから学習しておいたものを用いる。これにより、各質問文について一つ以上のラベルからなるラベル集合が得られる。最後に、すべての質問文中に含まれる単語を列挙した上、各単語についてラベル集合を集計する。ラベル集合を頻度が多いもの順にソートし、頻度が一定値以上のもの、もしくは、その上位を用いることで、その単語についてのフレームとする。このフレームにしたがって対話システムを構成することで、人間がよく質問するものについて尋ねるといった、自然な展開の会話が実現できる。
<システム構成>
図1に示すように、本発明の実施の形態に係るフレーム作成装置100は、大規模発話データベース10から、発話集合が入力され、対話システムのためのフレーム90を生成する。このフレーム作成装置100は、CPUと、RAMと、後述するフレーム作成処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。図1に示すように、フレーム作成装置100は、入力部20と、質問文抽出部30と、ラベル推定部40と、ラベル統合部50と、単語抽出部60と、ラベル集計部70とを備えている。
入力部20は、大規模発話データベース10から発話集合を受け付ける。ここで、大規模発話データベース10は別途用意されたものであり、本実施の形態ではツイッター(登録商標)から取得したツイートの集合である。発話集合は質問文抽出部30に渡される。ツイートはノイズが多いため、たとえば、文字列長が極端に短かったり(例えば、5文字未満)長かったりする(例えば、20文字を超える)場合や、日本語以外の文字列のみの発話などはフィルタして質問文抽出部30に渡す。
質問文抽出部30は、入力部20から発話集合を受け取り、質問文のみからなる質問文集合を抽出する。具体的には、文末がクエスチョンマーク(「?」)であるもののみを抽出する。なお、質問文とそうでない文を学習データとして作成した上、質問文を判定する装置を一般的な文書分類の手法により構築し、この出力によって質問文かどうかを判定しても良い(判定の一例は質問タイプ推定部42の説明で詳述する)。質問文集合は後述する質問タイプ推定部42、対話行為推定部44、カテゴリ推定部46、及び拡張固有表現タイプ推定部48に送られる。
ラベル推定部40は、質問タイプ推定部42、対話行為推定部44、カテゴリ推定部46、及び拡張固有表現タイプ推定部48を備えている。
ラベル推定部40は、質問文集合に含まれる質問文の各々について、出願人の形態素解析器JTAGによって形態素解析を行う。
質問タイプ推定部42は、質問文抽出部30によって抽出された質問文集合に含まれる質問文の各々について、自然言語処理において一般的な文書分類の手法によって質問タイプを推定する。具体的には、質問タイプが付与された質問文を大量に準備し、質問文に含まれる単語や意味情報などから、最も尤もらしい質問タイプを推定する推定器を機械学習の手法により構築しておく。そして、この推定器を用いて質問文の質問タイプ推定を行う。図2は、学習に用いた質問文とそれに付与された質問タイプの例を示す。
質問タイプとしては図3に示す24種類を用いる。
質問タイプ推定部42は、質問文集合の各質問文の形態素解析結果に基づいて、各質問文から単語N-gramを抽出する。ここでは、unigram、bigram、trigram、4-gram、5-gramを抽出する。Nは1以上であればよい。また、JTAGは、単語に対して意味属性(意味情報を表すラベル)を出力するため、これらの意味属性を抽出する。具体的には、「世界で一番高い山は?」という文であれば、図4に示すように形態素解析される。
各行は単語の情報に対応しており、最初のカラムが単語表記である。以降、品詞、標準表記、基本形、読み、意味属性と続く。EOSは文末を表す。意味属性は3つのフィールドからなっており、名詞に関する意味属性、固有名詞に関する意味属性、用言に関する意味属性である。「世界」は名詞に関する意味属性として462 と384 を持つことが分かる。なお、意味属性を用いないのであれば、形態素解析に、フリーソフトのChasen やMecab を用いてもよい。
各質問文について抽出したunigram〜5-gramおよび意味属性のそれぞれが存在するかどうかをバイナリの素性として機械学習に用いる。たとえば、「世界で一番高い山は?」であれば、unigram として、「世界」「で」「一番」「高」「い」「山」「は」「?」が得られるが、このそれぞれが素性となり、これらの素性値が1(存在する)となる。bigram〜5-gram および意味属性についても同様である。素性と素性値の集合を素性ベクトルと呼ぶ。
このようにして質問文のそれぞれについて素性ベクトルを抽出したら、この素性ベクトルから質問タイプを推定する推定器を教師あり機械学習の手法によって構築する。具体的には、ロジスティック回帰分析に基づくマルチクラス分類を行う。この分類手法は文書分類において一般的なものである。ここでは、実装として、LIBLINEAR(http://www.csie.ntu.edu.tw/~cjlin/liblinear/) を用いる。マルチクラス分類のアルゴリズムとして、サポートベクトルマシンなど他の一般的な分類アルゴリズムを用いてもよい。
たとえば、「誰誘います?」という質問文に対してこの推定器は「名称:人名 0.651149」のように出力する。推定された質問タイプは「名称:人名」(人名を聞く質問であるという意味)であり、その確信度は0.651149 であるという意味である。
質問タイプ推定部42は、質問文抽出部30から受け取った質問文集合に含まれる質問文のそれぞれについて推定を行い、その結果をラベル統合部50に送る。
対話行為推定部44は、質問文集合の各質問文の形態素解析結果に基づいて、質問文抽出部30によって抽出された質問文集合に含まれる質問文の各々について、当該質問文の対話行為(発話意図)を推定する。ここでの方法は、質問タイプ推定部42と全く同様の方法のものを用いる。つまり、質問文と対話行為が付与されたデータを大量の準備し、質問文を形態素解析することによって得られる素性ベクトルから対話行為を推定する推定器を学習しておく。
対話行為は、図5に示す10種類を用いる。
学習データについては、質問文について対話行為を人手で付与したものを準備する。データから学習された推定器は「誰誘います?」について「質問_事実 0.37933」と出力する。0.37933 は先の例と同様、確信度である。
対話行為推定部44は、質問文抽出部30から受け取った質問文集合に含まれる質問文のそれぞれについて推定を行い、その結果をラベル統合部50に送る。
カテゴリ推定部46は、質問文集合の各質問文の形態素解析結果に基づいて、質問文抽出部30によって抽出された質問文集合に含まれる質問文の各々について、当該質問文のカテゴリ(質問文が関係するおおまかなジャンル)を推定する。ここでの方法は、質問タイプ推定部42、対話行為推定部44と全く同様である。つまり、質問文と対話行為が付与されたデータを大量の準備し、質問文を形態素解析することによって得られる素性ベクトルからカテゴリを推定する推定器を学習しておく。
カテゴリは122種類ある。カテゴリ数は多いので、ここではすべてを列挙しないが、たとえば、「アニメ・キャラクター」、「人生観・生き方・ポリシー」、「防災・災害」、「メンタルヘルス」、「宗教/信仰/寺・神社」、「デンタルケア」、「友達・仲間関係」などである。
学習データについては、質問文についてカテゴリを人手で付与したものを準備する。データから学習された推定器は「誰誘います?」について「友達・仲間関係 0.0779089」と出力する。0.0779089 は確信度である。
カテゴリ推定部46は、質問文抽出部30から受け取った質問文集合に含まれる質問文のそれぞれについて推定を行い、その結果をラベル統合部50に送る。
拡張固有表現タイプ推定部48は、質問文集合の各質問文の形態素解析結果に基づいて、質問文抽出部30によって抽出された質問文集合に含まれる質問文の各々について、当該質問文が求める回答の拡張固有表現タイプを推定する。拡張固有表現タイプは、質問文がどのような固有表現(固有名詞や数量表現)を回答として求めているかを表すタイプである。固有表現として一般的なIREXの固有表現の体系を用いてもよいが、本実施の形態では、より細かな固有表現の分類である、関根らによる拡張固有表現の体系を用いて拡張固有表現質問タイプとする。拡張固有表現は全部で200種類ある。200種類については、以下の非特許文献に詳述されている。
[非特許文献5]:S. Sekine,K. Sudo, and C. Nobata: "Extended named entity hierarchy,", In Proc. LREC,2002.
推定法は、質問タイプ推定部42、対話行為推定部44、及びカテゴリ推定部46と全く同様である。つまり、質問文と固有表現タイプが付与されたデータを大量の準備し、質問文を形態素解析することによって得られる素性ベクトルから拡張固有表現タイプを推定する推定器を学習しておく。
学習データについては、質問文について拡張固有表現タイプを人手で付与したものを準備する。データから学習された推定器は「誰誘います?」について「Person 0.211636」と出力する。Person が拡張固有表現タイプであり、0.211636 は確信度である。
拡張固有表現タイプ推定部48は、質問文抽出部30から受け取った質問文集合に含まれる質問文のそれぞれについて推定を行い、その結果をラベル統合部50に送る。
ラベル統合部50は、質問文抽出部30が抽出した質問文集合に含まれる質問文について、質問タイプ推定部42、対話行為推定部44、カテゴリ推定部46、及び拡張固有表現タイプ推定部48が出力した結果を統合して、ラベルを付与する。
たとえば、「誰誘います?」について、質問タイプ推定部42、対話行為推定部44、カテゴリ推定部46、及び拡張固有表現タイプ推定部48の各々の推定結果を統合すると図6のようになる。
ラベル統合部50は、各質問文についての推定結果を統合した上で、これらの結果に対して、1つのラベルもしくは2つ以上のラベルの組み合わせに応じて、以下の(1)〜(3)のフィルタ処理を行う。
(1)質問タイプが「名称」で始まる、「数量」で始まる、もしくは、「その他:選択」の場合、質問タイプ、対話行為、カテゴリ、及び拡張固有表現タイプの確信度のいずれか一つでも閾値を下回っている場合は、この質問文とその統合結果をフィルタする。たとえば、閾値は0.5である。
(2)上記(1)以外の場合、拡張固有表現タイプの情報は削除する。その上で、質問タイプ、対話行為、及びカテゴリの確信度のいずれか一つでも閾値を下回っている場合は、この質問文とその統合結果をフィルタする。たとえば、閾値は0.5である。
(3)すべての場合において、質問タイプが「その他」の場合は、この質問文をフィルタする。「その他」は情報を持たないためである。そして、対話行為が「確認」「質問_自問」の場合も、この質問文をフィルタする。これらは「確認」は直前の発話に依存し、「質問_自問」は相手から情報を得る発話ではないことを示すからである。
ラベル統合部50は、フィルタされなかった質問文について、確信度以外の推定結果の部分を文字列として連結し、当該質問文について統合されたラベルとして付与する。
たとえば、「一番好きなミスチルの歌は何ですか?」であれば、図7に示すような、質問タイプ推定部42、対話行為推定部44、カテゴリ推定部46、及び拡張固有表現タイプ推定部48の推定結果が得られる。
この結果はフィルタ処理によってフィルタされないため、「一番好きなミスチルの歌は何ですか?」についてはラベルとして「名称:固有物名|質問評価|音楽|Music」が得られる。「|」は推定結果を結合する際に用いる連結記号である。
なお、質問文「誰誘います?」については上記フィルタ処理によってフィルタされる.
ラベル統合部50によってフィルタされなかった質問文は、そのラベルが付与されて単語抽出部60に送られる。
図8は、単語抽出部60に送られる質問文とそのラベルの例である。なお、質問文には固有のIDが振られるものとする。
単語抽出部60は、ラベル付きの質問文集合を入力として、各質問文に対して形態素解析を行う。ここでは、形態素解析器にJTAGを用いる。そして、形態素解析結果に基づいて、質問文集合の各質問文に対し、当該質問文に含まれる単語を抽出する。
本実施の形態では特に、名詞句を抽出することにする。処理としては、質問文中の連続した、品詞が名詞の単語を連結することで、名詞句を抽出する。たとえば、「パンを横須賀食堂で食べましたか?」であれば、「パン」と「横須賀食堂」が名詞句として抽出される。そして、名詞句と質問文IDの対応を表に記録する。すべての質問文を処理し終えたとき、この表を参照することで、どの名詞句がどの質問文に含まれているかが分かる。ラベル集計部70には、この対応表を送る。
なお、名詞句のみならず、固有表現抽出技術を用いて固有表現を抽出し、名詞句の代わりに用いてもよいし、名詞句とともに用いてもよい。固有表現抽出は文章から固有名詞や数値表現を抽出する一般的な技術であり、Conditional Random Fieldsといった系列ラベリングの技術を用いて実現される。
ラベル集計部70は、ラベル付きの質問文集合に基づいて、単語抽出部60から送られる対応表に含まれる各名詞句について以下の処理を行う。
まず、当該名詞句に対応付いているすべての質問IDについて、ラベル付きの質問文集合から、ラベルを取得し、そのラベルの頻度を集計する。
そして、ラベルを頻度の降順でソートする。ここで、頻度が一定の閾値以下のものは削除する。もしくは、上位N個のラベルのみを残しそれ以外は削除する。この処理によって、名詞句について頻度が多く重要と考えられるラベル集合が得られる。たとえば、「ミスチル」については、図9に示すラベル集合が得られる。最後のカラムの数値はそのラベルの頻度である。ここでは、ラベルの頻度が2以上のもののみを残している。
ここで得られるラベル集合は名詞句(この場合「ミスチル」)についてよく質問される項目を表しており、タスク指向型対話におけるフレームとみなすことが可能である。たとえば、一つ目のスロットのスロット名は「名称:固有物名|質問評価|音楽|Music」である。
なお、ラベルはスロット名に対応するが、スロット値に入りうる値は、ラベル情報から特定される。スロット名「名称:固有物名|質問評価|音楽|Music」であれば、拡張固有表現タイプの情報から、このスロットのスロット値はMusic(音楽名)によって埋められることが分かる。また、2番目〜7番目のスロットの質問タイプは真偽であるため、スロット値としてYes/Noの値が入ることになる。8番目のスロットのスロット値には一つ目のスロットと同じくMusicが入り、最後のスロットは質問タイプが「説明:意味」であるため、のスロット値には、任意の文字列表現が入ることを特定することができる。
最終的に、「ミスチル」についてのフレーム90として図10が自動作成できる。
このようなフレーム90があれば、これに基づいて自然な展開の会話が実現できる。たとえば、最初のスロットに基づいて、「ミスチルの曲は何が好きですか?」と発話した後、二番目のスロットに基づいて「ミスチルは聴きますか」と尋ね、三つ目のスロットに基づいてミスチルについての情報についての真偽を尋ねていくといった流れを持った会話をすることができるようになる。
本発明の実施の形態では、ラベル集計部70は、このようなフレーム90を質問文集合に含まれるすべての名詞句について作成できる。よって、広い話題について自然な展開の会話が実現できるようになる。
<フレーム作成装置の作用>
次に、本実施の形態に係るフレーム作成装置100の作用について説明する。まず、入力部20によって、大規模発話データベース10から発話集合を受け付けると、フレーム作成装置100によって、図11に示すフレーム作成処理ルーチンが実行される。
まず、ステップS100において、大規模発話データベース10から受け付けた発話集合を読み込む。ステップS102において、上記ステップS100で読み込んだ発話集合から、質問文集合を抽出する。
次のステップS104では、上記ステップS102で得られた質問文集合の各質問文に対して、形態素解析を行う。
ステップS106では、上記ステップS102で得られた質問文集合の各質問文に対して、上記ステップS104で得られた形態素解析結果に基づいて、質問タイプを推定する。
ステップS108では、上記ステップS102で得られた質問文集合の各質問文に対して、上記ステップS104で得られた形態素解析結果に基づいて、対話行為を推定する。
ステップS110では、上記ステップS102で得られた質問文集合の各質問文に対して、上記ステップS104で得られた形態素解析結果に基づいて、カテゴリを推定する。
ステップS112では、上記ステップS102で得られた質問文集合の各質問文に対して、上記ステップS104で得られた形態素解析結果に基づいて、拡張固有表現タイプを推定する。
そして、ステップS114において、質問文集合から、上記ステップS106〜S112で得られた各推定結果の関係に応じて質問文をフィルタし、フィルタされなかった各質問文に対して、上記ステップS106〜S112で得られた各推定結果を統合して、ラベルを付与する。
次のステップS116では、上記ステップS114でラベルが付与された質問文集合の各質問文から、名詞句を抽出する。
そして、ステップS118において、上記ステップS114でラベルが付与された質問文集合と、上記ステップS116での各質問文からの名詞句の抽出結果とに基づいて、各名詞句についてラベルを集計し、各名詞句について、ラベルの集計結果に基づいてフレームを作成し、スロット名のラベルに応じて、スロット値に入りうる値を特定してフレームに付与し、各名詞句について作成したフレームを出力して、フレーム作成処理ルーチンを終了する。
以上説明したように、本実施の形態に係るフレーム作成装置によれば、質問文集合から抽出された名詞句の各々に対し、名詞句が抽出された質問文の各々について付与された、統合されたラベルを集計し、頻度が高いラベルをスロット名とし、スロット名とスロット値との組み合わせの各々からなるフレームを作成することにより、雑談であっても自然な展開の会話を実現する対話システムのためのフレームを作成することができる。
また、対話システムの会話の展開が自然になり、ユーザにとって理解しやすいものになる。それにより、システムとユーザの意思疎通がしやすくなり、システムとユーザのインタラクションが円滑になる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、ラベル推定部40は、質問タイプ推定部42、対話行為推定部44、カテゴリ推定部46、及び拡張固有表現タイプ推定部48の少なくとも1つを備えていればよい。ラベル推定部40が、質問タイプ推定部42、対話行為推定部44、カテゴリ推定部46、及び拡張固有表現タイプ推定部48のいずれか1つのみを備える場合には、ラベル統合部50は不要である。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 大規模発話データベース
20 入力部
30 質問文抽出部
40 ラベル推定部
42 質問タイプ推定部
44 対話行為推定部
46 カテゴリ推定部
48 拡張固有表現タイプ推定部
50 ラベル統合部
60 単語抽出部
70 ラベル集計部
90 フレーム
100 フレーム作成装置

Claims (8)

  1. 入力された発話集合から質問文を抽出する質問文抽出部と、
    前記質問文抽出部によって抽出された質問文の各々について、前記質問文の内容を表す少なくとも1つのラベルを推定するラベル推定部と、
    前記質問文抽出部によって抽出された質問文の各々から、前記質問文に含まれる単語を抽出する単語抽出部と、
    前記単語の各々に対し、前記単語が抽出された前記質問文の各々について前記ラベル推定部によって推定された前記少なくとも1つのラベルを集計し、頻度が高い前記少なくとも1つのラベルをスロット名とし、前記スロット名とスロット値との組み合わせの各々からなるフレームを作成するラベル集計部と、
    を含むフレーム作成装置。
  2. 前記ラベル推定部は、
    前記質問文抽出部によって抽出された質問文の各々について、前記質問文の質問タイプを推定する質問タイプ推定部と、
    前記質問文抽出部によって抽出された質問文の各々について、前記質問文の対話行為を推定する対話行為推定部と、
    前記質問文抽出部によって抽出された質問文の各々について、前記質問文のカテゴリを推定するカテゴリ推定部と、
    前記質問文抽出部によって抽出された質問文の各々について、前記質問文が求める回答の拡張固有表現タイプを推定する拡張固有表現タイプ推定部と、
    の少なくとも1つを含む請求項1記載のフレーム作成装置。
  3. 前記質問文の各々は、前記ラベル推定部によって前記質問文から推定された前記少なくとも1つのラベルもしくは2つ以上のラベルの組み合わせに応じてフィルタされる請求項1又は2記載のフレーム作成装置。
  4. 前記質問文の各々について、前記質問文から推定された前記少なくとも1つのラベルを統合するラベル統合部を更に含み、
    前記ラベル集計部は、前記単語の各々に対し、前記単語が抽出された前記質問文の各々について前記ラベル統合部によって統合された前記少なくとも1つのラベルを集計する請求項1〜請求項3の何れか1項記載のフレーム作成装置。
  5. 前記ラベル集計部は、前記単語の各々に対し、前記スロット名とスロット値との組み合わせの各々からなるフレームを作成し、前記スロット名である前記少なくとも1つのラベルに応じて、前記スロット値に入りうる値を特定する請求項1〜請求項4の何れか1項記載のフレーム作成装置。
  6. 質問文抽出部が、入力された発話集合から質問文を抽出し、
    ラベル推定部が、前記質問文抽出部によって抽出された質問文の各々について、前記質問文の内容を表す少なくとも1つのラベルを推定し、
    単語抽出部が、前記質問文抽出部によって抽出された質問文の各々から、前記質問文に含まれる単語を抽出し、
    ラベル集計部が、前記単語の各々に対し、前記単語が抽出された前記質問文の各々について前記ラベル推定部によって推定された前記少なくとも1つのラベルを集計し、頻度が高い前記少なくとも1つのラベルをスロット名とし、前記スロット名とスロット値との組み合わせの各々からなるフレームを作成する
    フレーム作成方法。
  7. 前記ラベル推定部がラベルを推定することでは、
    質問タイプ推定部が、前記質問文抽出部によって抽出された質問文の各々について、前記質問文の質問タイプを推定すること、
    対話行為推定部が、前記質問文抽出部によって抽出された質問文の各々について、前記質問文の対話行為を推定すること、
    カテゴリ推定部が、前記質問文抽出部によって抽出された質問文の各々について、前記質問文のカテゴリを推定すること、及び
    拡張固有表現タイプ推定部が、前記質問文抽出部によって抽出された質問文の各々について、前記質問文が求める回答の拡張固有表現タイプを推定すること
    の少なくとも1つを含む請求項6記載のフレーム作成方法。
  8. コンピュータを、請求項1〜請求項5の何れか1項記載のフレーム作成装置を構成する各部として機能させるためのプログラム。
JP2015143326A 2015-07-17 2015-07-17 フレーム作成装置、方法、及びプログラム Pending JP2017027234A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015143326A JP2017027234A (ja) 2015-07-17 2015-07-17 フレーム作成装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015143326A JP2017027234A (ja) 2015-07-17 2015-07-17 フレーム作成装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2017027234A true JP2017027234A (ja) 2017-02-02

Family

ID=57950541

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015143326A Pending JP2017027234A (ja) 2015-07-17 2015-07-17 フレーム作成装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2017027234A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971051A (zh) * 2017-04-19 2017-07-21 民航成都电子技术有限责任公司 一种航班保障服务时间估算方法及系统
CN107360431A (zh) * 2017-06-30 2017-11-17 武汉斗鱼网络科技有限公司 一种帧类型的判断方法及装置
CN108932326A (zh) * 2018-06-29 2018-12-04 北京百度网讯科技有限公司 一种实例扩展方法、装置、设备和介质
WO2019216316A1 (ja) * 2018-05-09 2019-11-14 日本電信電話株式会社 対話データ生成装置、対話データ生成方法、およびプログラム
JP2019220115A (ja) * 2018-06-22 2019-12-26 株式会社日立製作所 音声対話システムとモデル作成装置およびその方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971051A (zh) * 2017-04-19 2017-07-21 民航成都电子技术有限责任公司 一种航班保障服务时间估算方法及系统
CN106971051B (zh) * 2017-04-19 2020-04-28 民航成都电子技术有限责任公司 一种航班保障服务时间估算方法及系统
CN107360431A (zh) * 2017-06-30 2017-11-17 武汉斗鱼网络科技有限公司 一种帧类型的判断方法及装置
CN107360431B (zh) * 2017-06-30 2019-08-02 武汉斗鱼网络科技有限公司 一种帧类型的判断方法及装置
WO2019216316A1 (ja) * 2018-05-09 2019-11-14 日本電信電話株式会社 対話データ生成装置、対話データ生成方法、およびプログラム
JP2019197363A (ja) * 2018-05-09 2019-11-14 日本電信電話株式会社 対話データ生成装置、対話データ生成方法、およびプログラム
JP2019220115A (ja) * 2018-06-22 2019-12-26 株式会社日立製作所 音声対話システムとモデル作成装置およびその方法
CN108932326A (zh) * 2018-06-29 2018-12-04 北京百度网讯科技有限公司 一种实例扩展方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
Bonta et al. A comprehensive study on lexicon based approaches for sentiment analysis
Muresan et al. Identification of nonliteral language in social media: A case study on sarcasm
US8856119B2 (en) Holistic disambiguation for entity name spotting
US20040148154A1 (en) System for using statistical classifiers for spoken language understanding
US20130253910A1 (en) Systems and Methods for Analyzing Digital Communications
Donato et al. Investigating redundancy in emoji use: Study on a twitter based corpus
US9710829B1 (en) Methods, systems, and articles of manufacture for analyzing social media with trained intelligent systems to enhance direct marketing opportunities
JP2017027234A (ja) フレーム作成装置、方法、及びプログラム
JP6663826B2 (ja) 計算機及び応答の生成方法
CN106383814B (zh) 一种英文社交媒体短文本分词方法
JP6251562B2 (ja) 同一意図の類似文を作成するプログラム、装置及び方法
Tran et al. A hybrid approach for building a Vietnamese sentiment dictionary
JP2017125921A (ja) 発話選択装置、方法、及びプログラム
JP2017027233A (ja) 質問文生成装置、方法、及びプログラム
Kolchyna et al. Methodology for twitter sentiment analysis
Koto et al. The use of POS sequence for analyzing sentence pattern in Twitter sentiment analysis
Morales-Ramirez et al. Discovering Speech Acts in Online Discussions: A Tool-supported method.
JP2017091368A (ja) 言い換え装置、方法、及びプログラム
JP5911911B2 (ja) 結束性判定装置、モデル学習装置、方法、及びプログラム
Zainuddin et al. Hate crime on twitter: Aspect-based sentiment analysis approach
Rodrigues Processing highly variant language using incremental model selection
Shirai et al. JAIST annotated corpus of free conversation
JP5744150B2 (ja) 発話生成装置、方法、及びプログラム
Ahed et al. An enhanced twitter corpus for the classification of Arabic speech acts
Rameshkumar et al. Assigning people to tasks identified in email: The EPA dataset for addressee tagging for detected task intent