JP5831951B2 - 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム - Google Patents

対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム Download PDF

Info

Publication number
JP5831951B2
JP5831951B2 JP2013546951A JP2013546951A JP5831951B2 JP 5831951 B2 JP5831951 B2 JP 5831951B2 JP 2013546951 A JP2013546951 A JP 2013546951A JP 2013546951 A JP2013546951 A JP 2013546951A JP 5831951 B2 JP5831951 B2 JP 5831951B2
Authority
JP
Japan
Prior art keywords
question
question sentence
user
answer
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013546951A
Other languages
English (en)
Other versions
JPWO2013080406A1 (ja
Inventor
康高 山本
康高 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solutions Innovators Ltd
Original Assignee
NEC Solutions Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solutions Innovators Ltd filed Critical NEC Solutions Innovators Ltd
Priority to JP2013546951A priority Critical patent/JP5831951B2/ja
Publication of JPWO2013080406A1 publication Critical patent/JPWO2013080406A1/ja
Application granted granted Critical
Publication of JP5831951B2 publication Critical patent/JP5831951B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ユーザ発言に対して何らかの応答メッセージを出力することによりユーザとの対話を行う対話システム、該対話システムにおける冗長メッセージ排除方法およびプログラムに関する。
近年、ユーザからの質問に対する回答や不明点のユーザへの確認を自動化してユーザへの対応コストを削減する目的で、対話システムが多く利用されている。
例えば、コールセンタなどで利用される対話システムとして、オペレータのコスト削減のために、顧客からのクレームや質問に対して自動で回答するQA自動化支援システムが挙げられる。この他にも、対話システムは、医師のコスト削減のために、データベースに蓄積した専門的な知識を基に、ユーザの悩みに対してアドバイスや共感を示すメッセージを返答する対話的ケアシステムなどに利用されている。
ところで、対話システムの中には、ユーザが満足する解やシステムが欲する情報を全て得るまで対話を続けるために、ユーザが入力した内容に対して質問文の形式で応答メッセージを出力する方法を適用するものがある。
このような方法を適用する対話システムでは、ユーザが入力した内容に対していかに適切な質問文を返すかが円滑な対話を進めるための重要なポイントとなる。例えば、ユーザと対話システムとの間の一連のやり取りの中で、ユーザが既に述べたことが回答となるような質問文を応答メッセージとして出力してしまうと、ユーザが同じような内容を再び回答として入力しなければならない。その結果、無駄な作業を強いることになるだけでなく、対話感を得られないといった問題が生じていた。
対話システムで円滑な対話を進めるための技術の一例が、例えば、特許文献1に記載されている。特許文献1に記載されている音声対話システムは、ユーザから検索対象名が入力されるとその検索対象名に対する検索結果の情報を出力するシステムである。特許文献1に記載されている音声対話システムは、順次必要な情報項目をユーザに入力させる対話システムではなく、あえて語彙の規模が大きい検索対象名を先に入力させて、そこから得られた検索対象名から他に必要な入力項目の情報を推定しようというものである。1の入力項目から他の入力項目の情報が推定できれば、推定できた入力項目について冗長な質問を行わないですむ。
特開2001−100787号公報
課題は、対話システムにおいて、一連のやり取りの中でユーザが既に述べたことが回答となるような質問文をシステムが出力する可能性があることである。
例えば、特許文献1に記載されている方法によれば、「藤沢市役所」の電話番号を要求している利用者に、検索対象名である「藤沢市役所」を先に入力させることで、その検索対象名から市名である「藤沢市」や業種分野である「市役所」を推定して、それらの質問を省略することができる可能性がある。
しかし、特許文献1に記載された方法は、あくまで検索対象名のように、予め決められた入力項目間に存在する付随的な関係性を利用して、冗長な質問を排除しようというものである。すなわち、特許文献1に記載された方法は、純粋に、ユーザが既に発言した中にシステム側から行われる質問の回答となるような内容が含まれているか否かを判断して、そのような冗長な質問を排除しようというものではない。
従って、特許文献1に記載された方法は、必要な入力項目等が予め決まっていて、かつ入力項目間に付随性がある対話システムにしか適用できない。例えば、上述のQA自動化支援システムや対話的ケアシステムのように、ユーザから自由な形式で入力を受け付ける対話システムでは、特徴語となる部分文字列も膨大にあり、また「入力項目」が予め定まっていない又は会話内容によって変化する場合も多い。また、特徴語によっては、実際の対話の中でその言葉が意味するものが異なるなど、入力項目との対応づけが難しいものも多い。このように、ユーザから自由な形式で入力を受け付ける対話システムでは、予め全ての特徴語について、その特徴語に対応する入力項目を適切に登録しておくことは非常に困難である。
ここで、特徴語と入力項目とを「適切に」登録するとは、あらゆる可能性がある中で冗長な質問を省略できるレベルにまで高精度にかつ限定して登録しておくことを意味する。特徴語と入力項目の対応関係が適切でないと、推定結果の精度を上げることができないため、その入力項目に関する質問を省略するまでには至らないからである。
すなわち、特許文献1に記載された方法は、部分文字列ベースのデータベースを準備することで所定の質問文に対応する特徴量を設定可能にしている。しかし、そのような部分文字列ベースのデータベース等を事前に準備して質問文毎の特徴量を設定しておく方法では、多くの質問文毎に対応する特徴量を網羅的に選定することは難しい。
そこで、本発明は、多様な入力がなされる対話システムにおいて、ユーザが既に述べたことが回答となるような質問文をシステムが出力することを防止できる対話システム、該対話システムにおける冗長メッセージ排除方法およびプログラムを提供することを目的とする。
本発明による対話システムは、ユーザの発言内容を示す文字列情報であるユーザ発話に対する応答メッセージの候補であって質問形式の文字列情報である質問文の集合に含まれる各質問文について、これまでの一連のユーザ発話に当該質問文に対する回答となる表現が含まれている度合いを表す回答含有率を求める回答性評価手段と、回答性評価手段によって求められた各質問文のユーザ発話に対する回答含有率に基づいて、各質問文を回答含有率が低い順に順位付ける質問文順位付け手段とを備えたことを特徴とする。
また、本発明による冗長メッセージ排除方法は、ユーザの発言内容を示す文字列情報であるユーザ発話に対する応答メッセージの候補であって質問形式の文字列情報である質問文の集合に含まれる各質問文について、これまでの一連のユーザ発話に当該質問文に対する回答となる表現が含まれている度合いを表す回答含有率を求め、求めた質問文のユーザ発話に対する回答含有率が所定の閾値以上に高い場合に、当該質問文を冗長な質問をする応答メッセージであるとして応答メッセージの候補から排除することを特徴とする。
また、本発明による冗長メッセージ排除プログラムは、コンピュータに、ユーザの発言内容を示す文字列情報であるユーザ発話に対する応答メッセージの候補であって質問形式の文字列情報である質問文の集合に含まれる各質問文について、これまでの一連のユーザ発話に当該質問文に対する回答となる表現が含まれている度合いを表す回答含有率を求める処理、および求めた質問文のユーザ発話に対する回答含有率が所定の閾値以上に高い場合に、当該質問文を冗長な質問をする応答メッセージであるとして応答メッセージの候補から排除する処理を実行させることを特徴とする。
本発明によれば、多様な入力がなされる対話システムにおいて、ユーザが既に述べたことが回答となるような質問文をシステムが出力することを防ぐことができる。
本発明による対話システムの構成例を示すブロック図である。 冗長質問文排除部14の構成例を示すブロック図である。 対話知識データベース22に記憶される対話知識の一例を示す説明図である。 実施形態の対話システムの動作の一例を示すフローチャートである。 冗長質問文排除部14による冗長質問文の排除処理の処理フローの一例を示すフローチャートである。 回答性評価部141による回答含有率の算出処理の処理フローの一例を示すフローチャートである。 冗長質問文排除部14に入力されるユーザ発言および質問文集合の例を示す説明図である。 ID1の質問文に対して行った形態素解析の解析結果の例および質問文特徴量の抽出例を示す説明図である。 ID2の質問文に対して行った形態素解析の解析結果の例および質問文特徴量の抽出例を示す説明図である。 ID3の質問文に対して行った形態素解析の解析結果の例および質問文特徴量の抽出例を示す説明図である。 ID4の質問文に対して行った形態素解析の解析結果の例および質問文特徴量の抽出例を示す説明図である。 ID5の質問文に対して行った形態素解析の解析結果の例および質問文特徴量の抽出例を示す説明図である。 各質問文からの質問文特徴量の抽出結果およびその保持例を示す説明図である。 ユーザ発言に対して行った形態素解析の解析結果とユーザ発言特徴量の抽出の例を示す説明図である。 各質問文の特徴量含有率の計算結果を示す説明図である。 単語重要度を加味した場合の各質問の回答含有率の計算結果を示す説明図である。 変換表の例を示す説明図である。 質問文の変換の例を示す説明図である。 ユーザ発言に対して行った形態素解析の解析結果の例および属性値推定の例を示す説明図である。 各質問文の質問可能度の算出例およびその質問可能度に基づき各質問文を順位付けた例を示す説明図である。 質問可能度の他の算出例およびその質問可能度に基づき各質問文を順位付けた例を示す説明図である。 冗長質問文排除部14の他の構成例を示すブロック図である。 本発明の概要を示すブロック図である。
図1は、本発明による対話システムの構成例を示すブロック図である。図1に示す対話システム100は、ユーザが入力したテキストを解析し、それに応じたメッセージを自動で生成または選択して出力する対話システムである。図1に示す対話システム100は、ユーザ発言入力部11と、ユーザ発言解析部12と、応答メッセージ生成部13と、冗長質問文排除部14と、応答メッセージ出力部15と、ユーザ発言保持部21と、対話知識データベース22とを備えている。
また、図2は、冗長質問文排除部14の構成例を示すブロック図である。冗長質問文排除部14は、一連のユーザ発言D11と質問文集合D12とを入力として、冗長質問文排除済みの質問文集合D12’を出力する処理部である。図2に示すように、冗長質問文排除部14は、回答性評価部141と、質問順序付け部142と、質問文集合更新部143とを含む。
ユーザ発言入力部11は、ユーザ発言を入力する。より具体的には、ユーザ発言入力部11は、ユーザ発言の入力を受け付けて、後段のユーザ発言解析部12に渡す。また、ユーザ発言入力部11は、受け付けたユーザ発言をユーザ発言保持部21に保持させる処理を行ってもよい。ユーザ発言とは、ユーザがシステムに入力した発言内容を示す文字列情報である。なお、ユーザが音声で入力した場合には、ユーザ発言入力部11は、その音声をテキスト形式に変換すればよい。ユーザ発言入力部11は、例えば、キーボード等の情報入力装置によって実現される。なお、通信回線を通じてユーザ発言を入力する場合には、ユーザ発言入力部11は、ネットワークインタフェースとその制御部とによって実現される。
ユーザ発言解析部12は、入力されたユーザ発言に対して、その発言形式および発話内容を認識するための構文解析や意味解析等の解析処理を行う。また、ユーザ発言解析部12は、ユーザ発話の原文に代えてまたは原文に加えて、解析の結果得られた情報をユーザ発言保持部21に保持させる処理を行ってもよい。
ユーザ発言解析部12は、例えば、ユーザ発言に含まれる各文に対して形態素解析や構文解析を行い、各文に含まれる単語の抽出や、文の品詞構造、係り受け関係の特定を行う。また、ユーザ発言解析部12は、抽出された単語のうち特徴となる単語にその語義や構文環境の情報を表す意味タグを付与する処理などを行う。これにより、ユーザ発言をシステムがその発言内容を理解できる形式のデータに変換する。なお、意味タグとして付与する単語の語義は、後述する対話知識において使用される単語の属性に関する分類項目を表すものであってもよい。
例えば、「公園で財布をなくした」というユーザ発言が入力された場合、形態素解析によって「公園/で/財布/を/なくす/た」といった構文情報が得られる。このようにして得られた構文情報を基に、ユーザ発言解析部12は、名詞等の所定の品詞の単語に対して、その単語の語彙分類項目を表す意味タグを付与してもよい。ユーザ発言解析部12は、意味タグの付与に、図示しない単語辞書を利用してもよい。ユーザ発言解析部12は、例えば、「公園」という単語は語彙分類項目のうち[場所]を表す単語であるとして、[場所]を表す意味タグを付与する。また、ユーザ発言解析部12は、「財布」という単語は語彙分類項目のうち[付帯物]を表す単語であるとして、[付帯物]を表す意味タグを付与する。
ユーザ発話保持部21は、一連のユーザ発話を保持する。ユーザ発話保持部21は、例えば、ユーザ別に、対話が開始されてからこれまでの間に入力されたユーザ発話を全て記憶しておくデータベースであってもよい。
応答メッセージ生成部13は、ユーザ発言解析部12による解析結果と、対話知識データベース22に記憶されている対話知識とに基づいて、入力されたユーザ発言に対する応答メッセージの候補を生成する。また、応答メッセージ生成部13は、生成した応答メッセージ候補のうち質問文形式の応答メッセージからなる質問文集合を、後述する冗長質問文排除部14に出力し、冗長質問文の排除処理を行わせる。そして、応答メッセージ生成部13は、冗長質問文排除部14による冗長質問文を排除した後、最終的に残った応答メッセージ候補の中から出力する応答メッセージを決定する。
対話知識データベース22は、対話知識を予め記憶しておくデータベースである。対話知識は、対話を成立させるために予め蓄積されている対話に関する情報である。対話知識は、例えば、一般的な入力文章表現とそれに対する出力文章と対応付けた情報であってもよい。その際、入力文章表現や出力文章を、予め定められている語彙分類項目を使ってテンプレート化してもよい。図3は、対話知識データベース22に記憶される対話知識の一例を示す説明図である。図3に示す例は、対話知識として、意味タグが[付帯物]である単語の後に「なくす」という単語が続く文章に対して、「交番に行ってはいかがでしょう?」という応答メッセージと、「最後に見たのはいつですか?」という応答メッセージの2つの応答メッセージが登録されている例である。また、図3に示す例は、意味タグが[人]である単語の後に「なくす」という単語が続く文章に対して、「それは辛いですね」という応答メッセージが登録されている例である。この他にも、意味タグが[付帯物]である単語の後に「なくす」という単語が続く文章に対する応答メッセージには、「どんな[付帯物]ですか?」、「家を探してみてはいかがでしょうか?」、「いつもはどこにあるのですか?」といったものが挙げられる。なお、図3における“[]”の囲みは、その中身がその単語に付された意味タグに用いられている分類項目名であることを示している。また、応答メッセージ内で“[]”が用いられている場合には、その部分を[]内で示される分類項目名の単語であって入力文章に用いられた単語に言い換えて出力することを示している。例えば、上記における「どんな[付帯物]ですか?」は「どんな財布ですか?」に変換されて出力される。
冗長質問文排除部14は、一連のユーザ発言と、質問文集合とを入力する。冗長質問文排除部14は、入力された質問文集合の中にユーザが既に述べたことが回答となるような質問文があるか否かを判定し、あった場合はその質問文を排除する。
なお、一連のユーザ発言として、具体的にどの範囲のユーザ発言を入力するかは特に限定されない。一連のユーザ発言は、例えば、対話が開始されてからこれまでに入力された全てのユーザ発言であってもよい。また、途中で明示的話題の転換を検出した場合には、一連のユーザ発言を、その検出後からこれまでに入力されたユーザ発言に限定してもよい。また、単純に1つ前までのユーザ発言を対象とする、または、直近1時間の間に入力されたユーザ発言を対象とするというように、単純に対話の回数や対話時間で一連のユーザ発言を区切ってもよいし、今回入力された1ユーザ発話のみを対象としてもよい。
回答性評価部141は、入力された質問文集合に含まれる各質問文について、一連のユーザ発言に対する回答含有率を求める。回答性評価部141は、任意の2つの文章が質疑応答の関係になっているかを定量的な確信度として出力する評価モデルを用いて、当該質問文と一連のユーザ発言に含まれる各文章との間の確信度を求める。回答性評価部141は、求めた確信度を総合して当該質問文のユーザ発言に対する回答含有率としてもよい。本実施形態では、回答含有率は、0〜1の値をとるものとし、1のときにユーザ発言とその質問文とが質疑応答の関係になっている確度が高いものとし、0のときに最もその確度が低いものとする。なお、ユーザ発言が複数ある場合には、回答性評価部141は、それぞれにつき回答含有率を求めて、そのうちのもっとも高い回答含有率を、その質問文の一連のユーザ発言に対する回答含有率とすればよい。
回答性評価部141で使用される評価モデルは、例えば、ある質問に対してされた回答についてその回答性を評価する評価モデルであってもよい。この評価モデルは、例えば、予めQAサイトのような質疑応答がすでに多数なされているサイトのテキスト情報を利用して機械学習を行って構築された評価モデルであってもよい。
評価モデルは、例えば、質問と回答のペアの関係を、質問の種類等とそれに対する回答部分として把握された単語の文字列、品詞、意味タグ、係り先または係り元の単語の文字列、品詞、意味タグなどを素性として機械学習を行うことにより構築される。
具体的な例を用いて説明すると、「富士山の高さは何メートルですか?」という質問に対して「3776mです」という回答がされていたことを示す情報のペアがあるとする。この質問に対して、形態素解析、構文解析、意味タグの付与等を行えば、質問文には、富士山という単語に対して[山の名称]という意味タグ、「高さ」という単語、「メートル」という単語に対して[長さの単位]という意味タグなどを付与できる。また、回答文に対しては、「3776」に対して[数字]という意味タグ、「m」に対して[長さの単位]という意味タグを付与できる。これと類似する情報のペアが大量にあり、文字列、品詞、意味タグなどを素性として機械学習を行えば、「山の高さ」に対する質問には[数字]+[長さの単位]の組み合わせが回答となりやすいという統計モデルを構築できる。
また、回答性評価部141は、例えば、質問文とユーザ発言との間に同一の単語があった場合に、回答含有率を高くする計算方法を用いて回答含有率を計算してもよい。このような方法によれば、事前知識となる情報を持たずに回答含有率を求めることが可能となる。この場合、回答性評価部141は、上述の計算ロジックを、質問文とユーザ発言との間の類似性に基づく確信度を出力する評価モデルとみなして、回答性含有率の計算に利用すればよい。
質問順序付け部142は、質問文集合に含まれる各質問文を回答含有率が低いものを優先するよう順位付けする。具体的には、質問順序付け部142は、回答含有率が低いものほど、まだユーザが発言していないことを聞き出す質問とみなして、その優先度を高くする処理を行う。質問順位付け部142は、優先度の代わりに、各質問文について質問可能度を求めてもよい。例えば、質問文毎に、(1−回答含有率)を質問可能度としてもよい。なお、質問可能度は、その値が高いほどその質問文が応答メッセージとして適していることを表す。また、質問文集合に含まれる各質問文に、質問としての重要度が付与されていてもよい。この場合、質問順序付け部142は、各質問文に付与されている重要度から回答含有率を減じた値によって質問可能度を求めてもよい。また、質問順位付け部142は、求めた各質問文の順位や質問可能度に基づいて、質問文集合に含まれる質問文からユーザ発言に適した質問文を選択してもよい。また、質問順位付け部142は、求めた各質問文の順位や質問可能度に基づいて、各質問文が冗長とされる質問文か否かを決定する処理を行ってもよい。
質問文集合更新部143は、質問文順位付け部142による順位付けの結果、質問可能度の算出結果やそれらに基づいて適した質問文が選択された結果、冗長とされる質問文か否かの判定結果を基に、質問文集合を更新して出力する。
質問文集合更新部143は、例えば、各質問文に順位や質問可能度の情報を付加する処理を行って出力してもよいし、冗長とされる質問文を質問文集合から削除して出力してもよいし、質問文集合から適した質問文として選択された1の質問文以外を削除して出力してもよい。
応答メッセージ出力部15は、応答メッセージ生成部13によって生成され、または選択された応答メッセージを出力する。
本実施形態において、ユーザ発言解析部12、応答メッセージ生成部13、冗長質問文排除部14、応答メッセージ出力部15は、プログラムに従って動作するCPU等の情報処理装置によって実現される。なお、応答メッセージ出力部15は、情報処理装置と、ディスプレイ等の情報出力装置とによって実現されてもよい。また、応答メッセージ出力部15は、通信回線を通じて応答メッセージを出力する場合には、情報処理装置とネットワークインタフェースとその制御部とによって実現されてもよい。また、ユーザ発言保持部21、対話知識データベース22は、例えば、記憶装置によって実現される。
なお、本実施形態では、冗長質問文排除部14以外の構成は、ユーザが入力したテキストを解析し、それに応じたメッセージを自動で生成または選択して出力する一般的な対話システムと同様でよい。すなわち、冗長質問文排除部14以外の各処理部は、一般的な対話システムが有する機能を有していればよい。
次に、本実施形態の動作を説明する。図4は、本実施形態の対話システムの動作の一例を示すフローチャートである。図4に示すように、まずユーザ発話入力部11が、ユーザ発話を受け付ける(ステップS11)。ユーザ発話入力部11は、ユーザ発話を受け付けると、ユーザ発言保持部21に記録するとともに、ユーザ発言解析部12に渡す。
ユーザ発言解析部12は、入力されたユーザ発言を解析し、システムがその発言内容を理解できる形式のデータに変換する(ステップS12)。ここでは、ユーザ発言解析部12は、例えば、ユーザ発言に対する形態素解析や解析された構文を基に特徴となる単語に意味タグを付与する処理などを行う。
次いで、応答メッセージ生成部13が、ユーザ発言解析部12による解析結果に基づき、対話知識データベース22に記憶されている対話知識を利用して、入力されたユーザ発言に対する応答メッセージの候補を生成する(ステップS13)。応答メッセージ生成部13は、生成した応答メッセージ候補のうち質問文形式の応答メッセージからなる質問文集合を冗長質問文排除部14に出力する。このとき、応答メッセージ生成部13は、判定に用いられるユーザ発言も併せて出力する。
判定に用いられるユーザ発言と質問文集合とが入力されると、冗長質問文排除部14は、入力された質問文集合に対して冗長質問文の排除処理を行う(ステップS14)。なお、冗長質問文の排除処理については後述する。
冗長質問文の排除処理が完了すると、応答メッセージ生成部13は、冗長質問文の排除処理後に残った応答メッセージ候補の中から実際に出力する応答メッセージを決定する。そして、応答メッセージ出力部15が、決定された応答メッセージを出力する(ステップS15)。
次に、冗長質問文排除部14による冗長質問文の排除処理を説明する。図5は、冗長質問文排除部14による冗長質問文の排除処理の処理フローの一例を示すフローチャートである。図5に示すように、冗長質問文排除部14では、判定に用いられるユーザ発言と質問文集合とが入力されると、まず回答性評価部141が、入力された質問文集合に含まれる各質問文について、入力されたユーザ発言に対する回答含有率を求め、そのユーザ発言における回答性を評価する(ステップS101)。
回答性評価部141によって各質問文の回答含有率が求められると、質問順序付け部142は、各質問文の回答含有率に基づいて、各質問文に順位付けを行う(ステップS102)。
最後に、質問文集合更新部143が、質問文順位付け部142による順位付けの結果を基に、質問文集合を更新して出力する(ステップS103)。
次に、回答性評価部141による回答含有率の算出方法をより詳細に説明する。図6は、回答性評価部141による回答含有率の算出処理の処理フローの一例を示すフローチャートである。図6に示す例は、事前知識となる情報をもたずに回答含有率を算出する例である。回答性評価部141は、まず、各々の質問文に対してIDを割り当てる(ステップS111)。回答性評価部141は、IDを割り当てると、各々の質問文に形態素解析を実施し、その結果をIDと紐付けて保持する(ステップS111)。
次いで、回答性評価部141は、質問文毎に、品詞が名詞、形容詞、動詞である単語を当該文章において特徴となる単語であるとみなし、その単語の原型を質問文特徴量として取得する(ステップS112)。回答性評価部141は、質問文特徴量を、例えば、形態素結果を登録したデータベースから対象とする単語の原型の情報をベクトル形式で取得してもよい。ベクトル形式とは、データを配列として保持することを意味し、この場合、単語の原型の情報を一つの配列として特徴量とすることを表す。
図7(a)は、冗長質問文排除部14に入力されるユーザ発言の一例を示す説明図である。また、図7(b)は、冗長質問文排除部14に入力される質問文集合の例およびIDの割り当て例を示す説明図である。以下では、図7に示すように、1つのユーザ発言「茶色い財布をなくして、交番に行ったけど見つからなくて困っている」と、5つの質問文を含む質問文集合が入力されたものとして説明する。5つの質問文は、ID1「交番に行ってはいかがでしょう?」、ID2「最後に見たのはいつでしょうか?」、ID3「どんな財布ですか?」、ID4「家を探してみてはいかがでしょうか?」、ID5「いつもはどこにあるのですか?」である。
また、図8〜12は、各質問文に対して行った形態素解析の解析結果の例および質問文特徴量の抽出例を示す説明図である。なお、図8に示す内容がID1の質問文の例である。また、図9に示す内容がID2の質問文の例である。図10に示す内容がID3の質問文の例である。図11に示す内容がID4の質問文の例である。図12に示す内容がID5の質問文の例である。
また、図13は、各質問文からの質問文特徴量の抽出結果およびその保持例を示す説明図である。図13に示すように、ID1の質問文から抽出された質問文特徴量は{交番、行く}である。ID2の質問文から抽出された質問文特徴量は{見る}である。ID3の質問文から抽出された質問文特徴量は{財布}である。ID4の質問文から抽出された質問文特徴量は{家、探す}である。ID5の質問文から抽出された質問文特徴量は{いつも、ある}である。
次に、回答性評価部141は、ユーザ発言に対してステップS112,S113と同様の処理を行い、ユーザ発言特徴量を取得する(ステップS114、S115)。
図14(a)は、ユーザ発言に対して行われた形態素解析の解析結果の例およびユーザ発言特徴量の抽出例を示す説明図である。また、図14(b)は、ユーザ発言からユーザ発言特徴量を抽出した結果および保持例を示す説明図である。図14に示すように、ユーザ発言からは、ユーザ発言特徴量として{茶色い、財布、なくす、交番、行く、見つかる、困る}が取得される。
各質問文の質問文特徴量とユーザ発言特徴量とを取得し終えると、回答性評価部141は、各々の質問文の質問文特徴量がどの程度ユーザ発言特徴量に包含されているかを定量的に表す特徴量含有率を計算し、それを各々の質問文の回答含有率とする(ステップS116)。
図15は、各質問文の特徴量含有率の計算結果を示す説明図である。図15では、i番目の質問文の質問文特徴量を集合Qiで表わし、ユーザ発言特徴量を集合Uで表す。図15に示す例では、i番目の質問文の特徴量含有率Ciは、以下に示す式(1)で求められる。なお、||は、集合の要素数を表す。また、記号∩は共通集合を表す。
Ci=|Qi ∩ U|/|Qi| ・・・式(1)
図15に示す例では、ID1の質問文の特徴量含有率C1=1、ID2の質問文の特徴量含有率C2=0、ID3の質問文の特徴量含有率C3=1、ID4の質問文の特徴量含有率C4=0、ID5の質問文の特徴量含有率C5=0と求められている。
また、回答性評価部141は、別の方法として、ユーザ発言の質問特徴量集合Uに含まれる単語毎に単語重要度を付与し、単語重要度を加味した特徴量含有率を求めてもよい。単語重要度を用いる場合、例えば、回答性評価部141は、単語と重要度とを対応付けて記録した重要度参照情報を予め保持しておくものとする。重要度参照情報は、単語をキーとして該単語に対する重要度を参照できるものである。
回答性評価部141は、任意の文書集合における単語の頻度を求め、頻度が低いものほど単語重要度が高くなるよう算出したものを重要度参照情報として用いてもよい。回答性評価部141は、このように重要度参照情報を入手してもよい。
ここで、i番目の質問文の質問文特徴量である集合Qiの各要素(すなわち各単語)をq_ijとし、ユーザ発言特徴量である集合Uの各要素(すなわち各単語)をu_k、ユーザ発言特徴量に含まれる各単語u_kの単語重要度をw_kとする。j,kは集合Qiの各要素または集合Uの各要素を指し示すインデックスである。単語重要度を用いる場合、i番目の質問文の特徴量含有率Ciは、次のように求められる。すなわち、先の|Qi ∩ U|について、q_ijとu_kが一致する場合、w_kが加算されるものとする。これは、質問文特徴量に含まれる単語と、ユーザ発言特徴量に含まれる単語が一致する場合に、単純に1単語につき1を加算するのではなく、単語の重要度に応じて重み付けされた値を加算する方法である。
図16は、単語重要度を加味した場合の各質問の回答含有率の計算結果を示す説明図である。なお、図16に示す例は、単語重要度として、「茶色い」=0.5、「財布」=0.3、「なくす」=0.3、「交番」=1.0、「行く」=0.2、「見つかる」=0.3、「困る」=0.5が与えられた場合の回答含有率である。例えば、図16に示す例では、単語重要度を加味した結果、ID1の質問文の特徴量含有率C3=0.6、ID3の質問文の特徴量含有率C3=0.3と求められている。このような方法によれば、単語重要度の高いものが一致するほど特徴量含有率が高まるため、精度向上が期待できる。
この他にも、特徴量の作り方や特徴量含有率の測り方に事前知識を用いれば、より高精度に回答含有率を求めることができる。
例えば、特徴量の作り方として、「ある」や「する」など、特徴となりづらい単語は、事前にストップワードとして登録しておき、特徴量から削除してもよい。
また、回答性評価部141は、例えば、特徴量含有率の計り方として、質問文特徴量に含まれる単語やユーザ発言特徴量に含まれる単語を同義表現等に拡張して、単語の同一性判断をおこなってもよい。そのような場合には、表記ゆれがあっても同一のものとみなすことができる。例えば、ユーザ表現では「見あたらない」という表現がされていたとする。この場合に、そのままでは「見あたらない」という単語と、「無くす」という単語との間で同一性があるとはみなされない。しかし、このような場合でも、「無くす」「紛失する」といった同義表現に変換したものを加えることで、精度よく同一性判断を行うことができる。
また、回答性評価部141は、質問文とユーザ発言との間で直接に特徴的な単語の類似性(すなわち特徴量含有率)を計るのではなく、質問文をその質問文に対する回答となりやすい情報(例えば、予想回答文パターン)に変換して、変換後の情報とユーザ発言との間での類似性を計るようにしてもよい。以下、質問文をその質問文に対する回答となりやすい情報に変換することを、単に質問文の変換という。
質問文の変換規則は、例えば、変換表を用いて生成することができる。図17は、変換表の例を示す説明図である。図17に示す例では、1つのレコードにつき1つの変換規則が登録されている。図17に示す例において、“:”は、その左右の要素が連続する単語や属性値、直接の係り受けの関係にあることを示している。また、図17に示す例において、“[]”で囲んだものは、単語の属性値を表す。単語の属性値には、形態素解析で得られる品詞、原型、活用などのほかに、その単語が人を表すのか、場所を表すのか、時間を表すのかといった所定の分類項目を指す情報も含まれる。
また、“[]”内に数字が付与されている属性値は、変換後、同じ数字がついた[]部分に変換前の単語が代入されることを表す。例えば、質問中文に「どんな財布」という文字列がある場合、財布は名詞であるため、これは変換表にある規則No2の変換規則における変換前の単語や属性値の系列「どんな:[名詞1]」に該当する。そのため、この変換規則における変換後の単語や属性値の系列「[形容詞]:[名詞1]」に従って、当該質問文の変換後の情報として「[形容詞]:財布」が得られる。
例えば、上述のステップS112において、各質問文は形態素解析により単語に分割される。その際に、回答性評価部141は、各々の単語の属性値を特定してもよい。形態素解析器には、単語毎に該当する固有表現の種類を出力できるものもあるので、その機能を用いてもよい。また、回答性評価部141は、単語と属性値との対応関係を記録するデータベースを用いて、各単語に属性値を割り当ててもよい。
このようにして、単語毎に付与された属性値と変換表による変換後の情報(例えば、予想回答文パターン)が得られる。図18は、質問文の変換の例を示す説明図である。図18において、変換前の質問文に引かれた下線はその部分が変換規則に該当したことを表している。例えば、図18に示す例では、ID2の質問文が図17の変換規則No1の変換規則に該当し、ID3の質問文が図17の変換規則No2の変換規則に該当する。そのため、回答性評価部141は、それぞれ変換規則により示される変換処理を施すことにより、変換後の情報としてID2の質問文について「[時間]」、ID3の質問文について「[形容詞]:財布」という予想回答文パターンを得ることができる。
なお、該当無しの場合は、回答性評価部141は、上述の質問文とユーザ発言との間での直接の特徴量含有率を求め、回答含有率とすればよい。変換後の情報が得られた場合には、回答性評価部141は、その質問文について、質問文とユーザ発言との間での直接の特徴量含有率に加え、質問文の変換後の情報とユーザ発言との間での特徴量含有率を求める。1つの質問に対して2以上の回答含有率が求まるが、その場合、回答性評価部141は、大きい値を採用すればよい。
質問文の変換後の情報とユーザ発言との間の特徴量含有率を求める場合、回答性評価部141は、ユーザ発言についても属性値推定を行えばよい。図19は、ユーザ発言に対して行われた形態素解析の解析結果の例および属性値推定の例を示す説明図である。なお、図19に示した属性値の例は、固有表現の分類項目を利用したものであるが、利用できる属性値はこの限りではない。
変換表では、変換後の情報として単語や属性値の系列が扱われる。そのため、回答性評価部141は、質問文の変換後の情報とユーザ発言との間の特徴量含有率を求める際にも、単語をベクトル系列には扱わず、変換後の情報に含まれる単語や属性の系列があるかを検索する。
ID3の質問文の場合、変換後の情報として「[形容詞]:財布」という単語および属性値の系列が得られる。よって、回答性評価部141は、ユーザ発言の中に、品詞が形容詞の単語があり、かつその単語の後に連続してまたは直接係り受ける関係にある「財布」という単語があるか否かを確認する。回答性評価部141は、ユーザ発言の中にこれらの条件を満たす単語が存在すれば、変換後の系列に該当するとして、ID3の質問文の回答含有率を1.0とする。このようにすることで、「どんな財布ですか?」というID3の質問文に対する回答らしきものが当該ユーザ発言に含まれていることがより高精度に判定できる。
また、例えばID2の質問文の場合、変換後の情報として「[時間]」という属性値の系列が得られる。しかし、ユーザ発言の中に、属性値が「時間」を指す単語はない。そのため、「最後に見たのはいつでしょうか?」というID2の質問文に対する回答らしきものは、当該ユーザ発言には含まれていないと判定できる。
属性値の他の例としては、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現といったものが挙げられる。また、これらの属性値をさらに詳細に分類したものを属性値としてもよい。また、例えばある専門分野に特化して属性値を分類することも可能である。対話システムにおいてどのような内容の対話がなされるか、また、属性値の解析能力に応じて属性値を定めればよい。
次に、質問文順序付け部142による質問文の順序づけ方法をより詳細に説明する。質問文順序付け部142は、例えば、図5のステップS102において、質問文毎に(1−回答含有率)を計算してそれを質問可能度とし、質問可能度の最も高いものをユーザ発言に対する質問文として出力してもよい。なお、質問可能度が最も高い値となる質問文が複数ある場合には、質問文順序付け部142は、ランダムに1つを選んで出力してもよい。
また、質問文順序付け部142は、質問文集合に含まれる質問文の質問可能度の総和で各々の質問可能度を除算した値を確率とみなし、その確率でユーザ発言に対する質問文を決定してもよい。
図20(a)は、各質問文の質問可能度を算出する例を示す説明図である。また、図20(b)は、質問可能度に基づき各質問文を順位付けした例を示す説明図である。図20に示す例では、質問可能度が(1−回答含有率)によって求められ、求められた結果から各質問文を質問候補とする質問文と質問候補としない質問文とに分けられている。これは、2段階の順位付けを行っていることと同義である。
なお、図20に示す例では、質問可能性の値が0と1しかないため2通りの分類となっている。質問文順序付け部142は、例えば、質問可能性が0以下であれば質問候補としない旨の決定をし、0より大きい値であればその値に応じた優先順位を付けて質問候補として出力するようにしてもよい。なお、質問候補とするか否かの閾値をシステムに設定値として持たせてもよい。
図21(a)は、質問可能度の他の算出例を示す説明図である。また、図21(b)は、その質問可能度に基づき各質問文を順序づけした例を示す説明図である。図21に示す例では、質問可能度が(質問重要度−回答含有率)によって求められ、求められた結果から質問可能度が高いものほど優先するよう各質問文に質問候補としての優先順位がつけられている。図21(b)によれば、ID2の質問文が最も優先される。
このように、各質問文の回答含有率に基づいてその質問文が適切であるか否かを考慮しつつ他の要素も考慮して総合的に順付けを行えば、質問文の集合に対してより適切な質問文を順位付けることができる。
なお、図1に示す例では、応答メッセージ生成部13により対話機能が自動化されている例を示しているが、質問文集合は人が登録したものであってもよい。また、各々の質問文に対して付与される質問重要度についても同様である。すなわち、各々の質問文に質問重要度を人が付与してもかまわない。なお、自動対話機能が用いられる場合、通常、応答メッセージの候補には、ユーザ発話と対話が成立する確信度のようなものが定量化されているため、質問文順序付け部142は、その値を質問重要度として用いてもよい。
なお、これまでの説明では、冗長質問文排除部14に質問文集合D12が与えられて、その質問文集合に含まれる質問文を回答含有率に基づいて順位付けし、その結果を質問文集合D12’として出力する例を示した。なお、ここでいう順序付けには、その中から冗長な質問文を排除することや、最もよい質問文を1つ選択することも含まれる。
ところで、本実施形態において、冗長質問文排除部14に入力される質問文は複数でなくてもよい。例えば、図22のように、冗長質問文排除部14は、1つの質問文D12を入力とし、その都度当該質問文が質問候補としてあり得るか否かの判定結果D13を返す構成であってもよい。図22は、冗長質問文排除部14の他の構成例を示すブロック図である。
図22に示す冗長質問文排除部14は、質問順序付け部142の代わりに、質問可否判定部144を備えている。質問可否判定部144は、入力された質問文に対して他の質問文の情報を用いずに質問可能度を算出し、算出した質問可能度に基づき、当該質問文が質問候補としてあり得るか否かを判定すればよい。質問可能度の算出方法は、基本的には上述と同じでよい。
以上のように、本実施形態の対話システムは、システムが出力しようとする質問文について、その質問文に対する回答が入力済みのユーザ発言に含まれているか否かの判定を、1組の文章が質疑応答の関係になっているかを自然言語処理の観点から評価する回答性の評価手法を用いて行っている。すなわち、本実施形態の対話システムは、品詞などの素性情報に基づく特徴量選択を行い、選択された特徴量によるマッチング処理と質問文の順位付け処理とを組み合わせることで、質問の冗長性を排除している。このため、部分文字列データベース等を用いて予め質問文毎に特徴量を設定する必要がないので、多くの質問文をシステム側が利用することができる。従って、多様な入力がなされる対話システムにおいても、冗長な質問文をシステムが出力することを排除できる。その結果、ユーザは、対話感が損なわれることなく、円滑に対話を進められる。
また、本実施形態によれば、事前知識となる情報を持たなくても回答含有率を求めることができるので、事前準備が不要な上、簡単な構成で、冗長な質問文をシステムが出力することを排除できる。
次に、本発明の概要を説明する。図23は、本発明の概要を示すブロック図である。図23に示す対話システムは、回答性評価手段501と、質問文順位付け手段502とを備えている。
回答性評価手段501(例えば、回答性評価部141)は、ユーザの発言内容を示す文字列情報であるユーザ発話に対する応答メッセージの候補であって質問形式の文字列情報である質問文の集合に含まれる各質問文に対して、これまでの一連のユーザ発話に当該質問文に対する回答となる表現が含まれている度合いを表す回答含有率を求める。
質問文順位付け手段502(例えば、質問文順位付け部142、質問可否判定部144)は、回答性評価手段501によって求められた各質問文のユーザ発話に対する回答含有率に基づいて、各質問文を回答含有率が低い順に順位付ける。
なお、質問文の集合に含まれる質問文の数は問わない。例えば、1つであってもよい。また、質問文の数に関わらず、質問文順位付け手段502が行う順位付けには、応答メッセージの候補として許可するものと許可しないものとに分けることも含まれる。
質問文順位付け手段502は、例えば、順位付けの際に、回答含有率が所定の閾値以上に高い質問文を冗長な質問をする応答メッセージであるとして応答メッセージの候補から排除してもよい。
また、質問文順位付け手段502は、回答含有率が低い質問文ほどその質問文が応答メッセージの候補として優先されるよう、各質問文を順位付けてもよい。
また、質問文順位付け手段502は、各質問文に付与されている質問としての重要度と、回答含有率とに基づいて、各質問文を順位付けてもよい。
また、回答性評価手段501は、任意の2つの文章がどの程度質疑応答の関係になっているかを定量的な確信度にして出力する評価する評価モデルを用いて、各質問文とユーザ発言とが質疑応答の関係になっている確信度を求め、求めた確信度に基づいて当該質問文のユーザ発言に対する回答含有率を求めてもよい。
また、回答性評価手段501は、任意の2つの文章がどの程度質疑応答の関係になっているかを定量的な確信度にして出力する評価する評価モデルであって、任意の2つの文章に各々含まれる所定の品詞の単語である特徴的単語が2つの文章間で重複する場合に質疑応答の関係となっている確信度が高くなる評価モデルを用いて、各質問文とユーザ発言とが質疑応答の関係になっている確信度を求め、求めた確信度に基づいて当該質問文のユーザ発言に対する回答含有率を求めてもよい。
また、回答性評価手段501は、上記の確信度を求める際に、質問文およびユーザ発言に含まれる特徴的単語に同義語表現を含めた上で、2つの文章間で特徴的単語が重複しているかどうかを判断してもよい。
また、回答性評価手段501は、各質問文を、当該質問文に対する回答となりやすい文章表現を単語または属性値の系列によって規定した情報である単語属性系列に変換する質問文変換手段を含み、回答性評価手段501は、任意の2つの文章がどの程度質疑応答の関係になっているかを定量的な確信度にして出力する評価モデルであって、任意の単語属性系列と任意の文章との間の類似性に基づく確信度を出力する評価モデルを用いて、各質問文から変換した単語属性系列とユーザ発言との類似性に基づく確信度を求め、求めた確信度に基づいて当該質問文のユーザ発言に対する回答含有率を求めてもよい。
以上、実施形態及び実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年11月28日に出願された日本特許出願2011−258843を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明は、対話システムに限らず、計算機が自然言語処理技術を利用して入力された文章に対して質問形式のメッセージを出力する可能性があるものであれば、好適に適用可能である。
100 対話システム
11 ユーザ発言入力部
12 ユーザ発言解析部
13 応答メッセージ生成部
14 冗長質問文排除部
141 回答性評価部
142 質問文順序付け部
143 質問文集合更新部
144 質問可否判定部
15 応答メッセージ出力部
21 ユーザ発言保持部
22 対話知識データベース
501 回答性評価手段
502 質問文順位付け手段

Claims (10)

  1. ユーザの発言内容を示す文字列情報であるユーザ発話に対する応答メッセージの候補であって質問形式の文字列情報である質問文の集合に含まれる各質問文について、これまでの一連のユーザ発話に当該質問文に対する回答となる表現が含まれている度合いを表す回答含有率を求める回答性評価手段と、
    前記回答性評価手段によって求められた各質問文のユーザ発話に対する回答含有率に基づいて、各質問文を回答含有率が低い順に順位付ける質問文順位付け手段とを備えた
    ことを特徴とする対話システム。
  2. 質問文順位付け手段は、順位付けの際に、回答含有率が所定の閾値以上に高い質問文を冗長な質問をする応答メッセージであるとして応答メッセージの候補から排除する
    請求項1に記載の対話システム。
  3. 質問文順位付け手段は、回答含有率が低い質問文ほどその質問文が応答メッセージの候補として優先されるよう、各質問文を順位付ける
    請求項1または請求項2に記載の対話システム。
  4. 質問文順位付け手段は、各質問文に付与されている質問としての重要度と、回答含有率とに基づいて、各質問文を順位付ける
    請求項1から請求項3のうちのいずれか1項に記載の対話システム。
  5. 回答性評価手段は、任意の2つの文章がどの程度質疑応答の関係になっているかを定量的な確信度にして出力する評価モデルを用いて、各質問文とユーザ発言とが質疑応答の関係になっている確信度を求め、求めた確信度に基づいて当該質問文のユーザ発言に対する回答含有率を求める
    請求項1から請求項4のうちのいずれか1項に記載の対話システム。
  6. 回答性評価手段は、任意の2つの文章がどの程度質疑応答の関係になっているかを定量的な確信度にして出力する評価モデルであって、任意の2つの文章に各々含まれる所定の品詞の単語である特徴的単語が2つの文章間で重複する場合に質疑応答の関係となっている確信度が高くなる評価モデルを用いて、各質問文とユーザ発言とが質疑応答の関係になっている確信度を求め、求めた確信度に基づいて当該質問文のユーザ発言に対する回答含有率を求める
    請求項5に記載の対話システム。
  7. 回答性評価手段は、質問文およびユーザ発言に含まれる特徴的単語の同義語表現を特徴的単語に含める
    請求項6に記載の対話システム。
  8. 回答性評価手段は、各質問文を、当該質問文に対する回答となりやすい文章表現を単語または単語の属性値の系列によって規定した情報である単語属性系列に変換する質問文変換手段を含み、
    前記回答性評価手段は、任意の2つの文章がどの程度質疑応答の関係になっているかを定量的な確信度にして出力する評価モデルであって、任意の単語属性系列と任意の文章との間の類似性に基づく確信度を出力する評価モデルを用いて、各質問文から変換した単語属性系列とユーザ発言との類似性に基づく確信度を求め、求めた確信度に基づいて当該質問文のユーザ発言に対する回答含有率を求める
    請求項1から請求項7のうちのいずれか1項に記載の対話システム。
  9. ユーザの発言内容を示す文字列情報であるユーザ発話に対する応答メッセージの候補であって質問形式の文字列情報である質問文の集合に含まれる各質問文について、これまでの一連のユーザ発話に当該質問文に対する回答となる表現が含まれている度合いを表す回答含有率を求め、
    求めた質問文のユーザ発話に対する回答含有率が所定の閾値以上に高い場合に、当該質問文を冗長な質問をする応答メッセージであるとして応答メッセージの候補から排除する
    ことを特徴とする冗長メッセージ排除方法。
  10. コンピュータに、
    ユーザの発言内容を示す文字列情報であるユーザ発話に対する応答メッセージの候補であって質問形式の文字列情報である質問文の集合に含まれる各質問文について、これまでの一連のユーザ発話に当該質問文に対する回答となる表現が含まれている度合いを表す回答含有率を求める処理、および
    求めた質問文のユーザ発話に対する回答含有率が所定の閾値以上に高い場合に、当該質問文を冗長な質問をする応答メッセージであるとして応答メッセージの候補から排除する処理
    を実行させるための冗長メッセージ排除プログラム。
JP2013546951A 2011-11-28 2012-08-14 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム Active JP5831951B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013546951A JP5831951B2 (ja) 2011-11-28 2012-08-14 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011258843 2011-11-28
JP2011258843 2011-11-28
JP2013546951A JP5831951B2 (ja) 2011-11-28 2012-08-14 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム
PCT/JP2012/005150 WO2013080406A1 (ja) 2011-11-28 2012-08-14 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム

Publications (2)

Publication Number Publication Date
JPWO2013080406A1 JPWO2013080406A1 (ja) 2015-04-27
JP5831951B2 true JP5831951B2 (ja) 2015-12-09

Family

ID=48534914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013546951A Active JP5831951B2 (ja) 2011-11-28 2012-08-14 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム

Country Status (3)

Country Link
US (1) US20140351228A1 (ja)
JP (1) JP5831951B2 (ja)
WO (1) WO2013080406A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101700820B1 (ko) * 2012-07-11 2017-02-01 한국전자통신연구원 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법
JP6225012B2 (ja) * 2013-07-31 2017-11-01 日本電信電話株式会社 発話文生成装置とその方法とプログラム
JP6180340B2 (ja) * 2014-02-17 2017-08-16 株式会社デンソーアイティーラボラトリ 対話文生成装置、対話文生成方法およびプログラム
JP6359327B2 (ja) * 2014-04-25 2018-07-18 シャープ株式会社 情報処理装置および制御プログラム
US9400956B2 (en) * 2014-11-05 2016-07-26 International Business Machines Corporation Answer interactions in a question-answering environment
US10061842B2 (en) 2014-12-09 2018-08-28 International Business Machines Corporation Displaying answers in accordance with answer classifications
US10671619B2 (en) 2015-02-25 2020-06-02 Hitachi, Ltd. Information processing system and information processing method
JP6343586B2 (ja) * 2015-05-15 2018-06-13 日本電信電話株式会社 発話選択装置、方法、及びプログラム
JP6819990B2 (ja) * 2016-08-16 2021-01-27 国立研究開発法人情報通信研究機構 対話システム及びそのためのコンピュータプログラム
JP6440660B2 (ja) * 2016-09-12 2018-12-19 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
WO2018131048A1 (en) * 2017-01-11 2018-07-19 Satyanarayana Krishnamurthy System and method for natural language generation
JP6769405B2 (ja) * 2017-07-11 2020-10-14 トヨタ自動車株式会社 対話システムおよび対話方法
JP7018278B2 (ja) * 2017-09-19 2022-02-10 株式会社豆蔵 情報処理装置、情報処理システム、情報処理方法及びプログラム
US11138506B2 (en) 2017-10-10 2021-10-05 International Business Machines Corporation Abstraction and portability to intent recognition
JP7136120B2 (ja) 2017-11-07 2022-09-13 日本電気株式会社 情報処理装置、方法及びプログラム
JP6993575B2 (ja) * 2018-02-23 2022-01-13 富士通株式会社 情報処理プログラム、情報処理装置及び情報処理方法
CN108538298B (zh) * 2018-04-04 2021-05-04 科大讯飞股份有限公司 语音唤醒方法及装置
CN111309875B (zh) * 2018-12-10 2023-08-04 百度在线网络技术(北京)有限公司 问题应答的方法、装置、设备和存储介质
US20220139402A1 (en) * 2019-02-18 2022-05-05 Nec Corporation Voice authentication apparatus, voice authentication method, and a recording medium
JP7270188B2 (ja) * 2019-05-23 2023-05-10 本田技研工業株式会社 知識グラフ補完装置、および知識グラフ補完方法
JP7196122B2 (ja) * 2020-02-18 2022-12-26 株式会社東芝 インタフェース提供装置、インタフェース提供方法およびプログラム
JP7466143B2 (ja) * 2020-03-16 2024-04-12 カラクリ株式会社 情報処理装置、学習提案プログラム、及び学習提案方法
JP7507647B2 (ja) * 2020-09-28 2024-06-28 株式会社日立製作所 関連表現抽出装置及び関連表現抽出方法
JP2023035549A (ja) * 2021-09-01 2023-03-13 ウェルヴィル株式会社 プログラム、情報処理装置、及び情報処理方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7177798B2 (en) * 2000-04-07 2007-02-13 Rensselaer Polytechnic Institute Natural language interface using constrained intermediate dictionary of results
JP2003108375A (ja) * 2001-09-28 2003-04-11 Seiko Epson Corp 対話型エキスパートシステム及びプログラム
JP3737068B2 (ja) * 2002-03-27 2006-01-18 富士通株式会社 最適質問提示方法及び最適質問提示装置
US7155459B2 (en) * 2002-06-28 2006-12-26 Miccrosoft Corporation Time-bound database tuning
US20060173880A1 (en) * 2005-01-28 2006-08-03 Microsoft Corporation System and method for generating contextual survey sequence for search results
JP2011513811A (ja) * 2008-02-22 2011-04-28 リード ホース テクノロジーズ インコーポレイテッド 自動化オントロジー生成システムおよび方法
US20090234838A1 (en) * 2008-03-14 2009-09-17 Yahoo! Inc. System, method, and/or apparatus for subset discovery
US9092517B2 (en) * 2008-09-23 2015-07-28 Microsoft Technology Licensing, Llc Generating synonyms based on query log data
KR101173556B1 (ko) * 2008-12-11 2012-08-13 한국전자통신연구원 토픽맵 기반 색인 장치, 토픽맵 기반 검색 장치, 토픽맵 기반 검색 시스템 및 그 방법
CN102012900B (zh) * 2009-09-04 2013-01-30 阿里巴巴集团控股有限公司 信息检索方法和系统
US20120047124A1 (en) * 2010-08-17 2012-02-23 International Business Machines Corporation Database query optimizations
US20130304730A1 (en) * 2011-01-18 2013-11-14 Google Inc. Automated answers to online questions
US9449045B2 (en) * 2011-04-08 2016-09-20 Sybase, Inc. System and method for enhanced query optimizer search space ordering
US8766789B2 (en) * 2011-09-30 2014-07-01 Cardiocom, Llc First emergency response device

Also Published As

Publication number Publication date
US20140351228A1 (en) 2014-11-27
WO2013080406A1 (ja) 2013-06-06
JPWO2013080406A1 (ja) 2015-04-27

Similar Documents

Publication Publication Date Title
JP5831951B2 (ja) 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム
US11568855B2 (en) System and method for defining dialog intents and building zero-shot intent recognition models
US20210256417A1 (en) System and method for creating data to train a conversational bot
WO2019153737A1 (zh) 用于对评论进行评估的方法、装置、设备和存储介质
US10540965B2 (en) Semantic re-ranking of NLU results in conversational dialogue applications
CN108304372B (zh) 实体提取方法和装置、计算机设备和存储介质
US10616414B2 (en) Classification of transcripts by sentiment
US11037553B2 (en) Learning-type interactive device
US9742912B2 (en) Method and apparatus for predicting intent in IVR using natural language queries
US9582757B1 (en) Scalable curation system
US7966171B2 (en) System and method for increasing accuracy of searches based on communities of interest
WO2021017612A1 (zh) 基于语音分析的问答方法、装置、设备及存储介质
US8165887B2 (en) Data-driven voice user interface
US20060129396A1 (en) Method and apparatus for automatic grammar generation from data entries
US20200035229A1 (en) Word clustering and categorization
JP6251562B2 (ja) 同一意図の類似文を作成するプログラム、装置及び方法
US10573311B1 (en) Generating self-support metrics based on paralinguistic information
CN109508441B (zh) 通过自然语言实现数据统计分析的方法、装置及电子设备
CN113807103B (zh) 基于人工智能的招聘方法、装置、设备及存储介质
US11711469B2 (en) Contextualized speech to text conversion
US11521642B2 (en) Systems and methods for classification and rating of calls based on voice and text analysis
JP2017125921A (ja) 発話選択装置、方法、及びプログラム
CN115714002A (zh) 抑郁风险检测模型训练方法、抑郁症状预警方法及相关设备
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN112115229A (zh) 文本意图识别方法、装置、系统以及文本分类系统

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151022

R150 Certificate of patent or registration of utility model

Ref document number: 5831951

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150