JPWO2016178337A1 - 情報処理装置、情報処理方法及びコンピュータプログラム - Google Patents

情報処理装置、情報処理方法及びコンピュータプログラム Download PDF

Info

Publication number
JPWO2016178337A1
JPWO2016178337A1 JP2016561036A JP2016561036A JPWO2016178337A1 JP WO2016178337 A1 JPWO2016178337 A1 JP WO2016178337A1 JP 2016561036 A JP2016561036 A JP 2016561036A JP 2016561036 A JP2016561036 A JP 2016561036A JP WO2016178337 A1 JPWO2016178337 A1 JP WO2016178337A1
Authority
JP
Japan
Prior art keywords
answer
information processing
processing apparatus
target document
question sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016561036A
Other languages
English (en)
Inventor
角川 元輝
元輝 角川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2016178337A1 publication Critical patent/JPWO2016178337A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザが知りたい情報を得る際にユーザの手間を低減させて、ユーザが効率的に情報を得られることが可能な情報処理装置を提供する。【解決手段】入力された質問文を解析して得られる該質問文の構造と、前記質問文を用いて生成された検索語を用いた検索により得られた対象文書を解析して得られる対象文書の構造とを取得する取得部と、前記取得部が取得した前記質問文の構造と前記対象文書の構造とを比較して回答候補を判定し、該判定の結果を前記質問文と対比して提示するための情報を生成する制御部と、を備える、情報処理装置が提供される。【選択図】図1

Description

本開示は、情報処理装置、情報処理方法及びコンピュータプログラムに関する。
インターネットには検索エンジンを搭載した検索サイトがある。ユーザは、知りたい情報がある場合にはその検索サイトにキーワードを入力して、検索サイトが表示する情報の中に自分が要求する答えがあるかどうかを探していた。検索サイトを用いた情報検索に関する技術として例えば特許文献1などがある。
特開2011−118770号公報
しかし、既存の検索サイトは、キーワードにヒットしたサイトを一覧で表示し、また、そのサイトの内容の一部を表示するだけである。従って、ユーザの知りたい情報が本当に検索サイトでヒットしたサイトに存在するかどうかは、ユーザが実際にサイトを訪れなければ分からなかった。そのため、ユーザが知りたい情報をより効率的に得られるような仕組みが求められる。
そこで本開示では、ユーザが知りたい情報を得る際にユーザの手間を低減させて、ユーザが効率的に情報を得られることが可能な、新規かつ改良された情報処理装置、情報処理方法及びコンピュータプログラムを提案する。
本開示によれば、入力された質問文を解析して得られる該質問文の構造と、前記質問文を用いて生成された検索語を用いた検索により得られた対象文書を解析して得られる対象文書の構造とを取得する取得部と、前記取得部が取得した前記質問文の構造と前記対象文書の構造とを比較して回答候補を判定し、該判定の結果を前記質問文と対比して提示するための情報を生成する制御部と、を備える、情報処理装置が提供される。
また本開示によれば、入力された質問文を解析して得られる該質問文の構造と、前記質問文を用いて生成された検索語を用いた検索により得られた対象文書を解析して得られる対象文書の構造とを取得することと、取得された前記質問文の構造と前記対象文書の構造とを比較して回答候補を判定し、該判定の結果を前記質問文と対比して提示するための情報を生成することと、を含む、情報処理方法が提供される。
また本開示によれば、コンピュータに、入力された質問文を解析して得られる該質問文の構造と、前記質問文を用いて生成された検索語を用いた検索により得られた対象文書を解析して得られる対象文書の構造とを取得することと、取得された前記質問文の構造と前記対象文書の構造とを比較して回答候補を判定し、該判定の結果を前記質問文と対比して提示するための情報を生成することと、を実行させる、コンピュータプログラムが提供される。
以上説明したように本開示によれば、ユーザが知りたい情報を得る際にユーザの手間を低減させて、ユーザが効率的に情報を得られることが可能な、新規かつ改良された情報処理装置、情報処理方法及びコンピュータプログラムを提供することが出来る。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。
本開示の一実施形態に係る情報処理装置100のハードウェア構成例を示す説明図である。 制御部120の機能構成例を示す説明図である。 本開示の一実施形態に係る情報処理装置100の動作例を示す流れ図である。 本開示の一実施形態に係る情報処理装置100の動作例を示す流れ図である。 本開示の一実施形態に係る情報処理装置100の動作例を示す流れ図である。 質問意図構造の例を示す説明図である。 対象文書構造の例を示す説明図である。 回答候補判定処理の例を示す説明図である。 回答候補判定処理の別の例を示す説明図である。 回答候補判定処理の別の例を示す説明図である。 回答判定処理の結果の例を示す説明図である。 情報処理装置100による応答文の出力例を示す説明図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
1.本開示の一実施形態
1.1.背景
1.2.概要
1.3.ハードウェア構成例
1.4.機能構成例
1.5.動作例
1.6.ユースケース例
2.まとめ
<1.本開示の一実施形態>
[1.1.背景]
本開示の実施の形態について詳細に説明する前に、まず、本開示の実施の形態の背景を説明する。
上述したように、インターネットには検索エンジンを搭載した検索サイトがある。ユーザは、知りたい情報がある場合には、その検索サイトにキーワードを入力して、検索サイトがそのキーワードに基づいて表示する情報の中に、自分が要求する答えがあるかどうかを探していた。
しかし、既存の検索サイトは、キーワードにヒットしたサイトを一覧で表示し、そのサイトの内容の一部を表示するだけであり、ユーザの知りたい情報が本当にそのサイトに存在するかどうかは、ユーザが実際にサイトを訪れなければ分からなかった。
また、既存の検索サイトは、キーワードにはヒットするが、ユーザが知りたい情報とは無関係のサイトをヒットして表示したり、ユーザが知りたい情報と関係があるのに、アルゴリズムの関係で表示順が後ろの方になったりしていて、精度が悪いものがあった。
従って、ユーザが情報を知りたいと思っている場合に、そのユーザが知りたい情報を、ユーザがより効率的に得られるような仕組みが求められる。
そこで本件開示者は、ユーザが知りたい情報を得る際にユーザの手間を低減させて、ユーザが効率的に情報を得られることが可能な技術について鋭意検討を行った。その結果、本件開示者は、ユーザの自然文による質問に対して、その回答を直接提示することで、ユーザが効率的に情報を得られることが可能な技術を考案するに至った。
[1.2.概要]
続いて、本開示の実施の形態の概要について説明する。本開示の実施の形態は、以下のような技術的な特徴を有する。
まず本実施形態では、ユーザからの質問を、音声やテキストなどによる自然文で受け付ける。ユーザから自然文で受け付けた質問は、言語解析処理によって、まず質問の意図の構造が判定される。音声で受け付けたものであれば音声認識処理によってテキスト化してから言語解析処理を行う。質問の意図の構造のことを本実施形態では、「質問意図構造」とも称する。
質問意図構造が判定されると、続いて本実施形態では、質問意図構造に基づいた情報の検索が行われる。この情報の検索は、インターネットに対する検索や、所有しているデータに対する検索が含まれる。検索対象はテキストであれば良く、また検索対象は自然文でも良く、検索処理は通常のキーワード検索で良い。
質問意図構造に基づいた情報の検索が行われると、続いて本実施形態では、検索でヒットした対象文書に対する言語解析が行われ、対象文書の構造が生成される。検索でヒットした対象文書の構造のことを本実施形態では、「対象文書構造」とも称する。
対象文書構造が生成されると、続いて本実施形態では、質問意図構造と、対象文書構造とが比較されて、ユーザの質問に対する回答の候補が特定される。ユーザの質問に対する回答の候補を本実施形態では、「回答候補」とも称する。この回答候補は、回答を含んだレコード(例えば、検索でヒットしたサイトや文書そのもの)では無く、ユーザが求めていると思われる回答の箇所そのものであるとする。
本実施形態では、回答候補の特定は、検索でヒットした対象文書の数だけ行っても良く、検索でヒットした対象文書の中の上位所定数の対象文書に対して行っても良い。
続いて本実施形態では、特定した回答候補が集計されて、ユーザに提示する回答が求められる。このユーザに提示する回答は、例えばユーザの専門度に基づいて求められても良い。ユーザの専門度は、予めユーザに入力してもらってもよく、回答の提示の際にユーザに入力してもらってもよい。またユーザの専門度は、例えば分野毎に入力してもらってもよい。
続いて本実施形態では、求められた回答が、音声による発話やテキストの表示などで出力される。回答だけで無く、特定した回答候補が併せて出力されても良い。また、出力された回答について、ユーザに満足度を入力してもらってもよい。さらに、検索でヒットした対象文書が収められているサイトごとに予め信頼度が設定されても良く、回答に併せて、その回答に対する信頼度が出力されても良い。
本実施形態は、上述したような技術的な特徴を有することで、ユーザが自然文で知りたいことを音声やテキストで入力すると、その質問に対する回答箇所を直接返すことができる。従って、本実施形態は、上述したような技術的な特徴を有することで、ユーザが回答を探す手間が大幅に低減される。また、本実施形態は、上述したような技術的な特徴を有することで、多くの回答候補をシステムが処理するので、ヒットした情報を一つ一つ人間が見ていくよりも高い精度の回答を提示することができる。
本実施形態は、上述したような技術的な特徴を有することで、ユーザの専門度を考慮し、ユーザの知識レベルを超えた回答を出力しないようにしたり、回答を返すために、検索したサイトの信頼度や、過去に同様の質問をおこなった際のユーザの満足度も加味してスコア値を算出して出力したりするので、出力された回答に対してユーザに安心感を与えられることが想定される。
以上、本開示の実施の形態の概要を説明した。続いて、本開示の実施の形態について詳細に説明する。
[1.3.構成例]
まず、本開示の実施の形態に係る情報処理装置100のハードウェア構成例について説明する。図1は、本開示の一実施形態に係る情報処理装置100のハードウェア構成例を示す説明図である。以下、図1を用いて本開示の一実施形態に係る情報処理装置100のハードウェア構成例について説明する。
以下で説明する処理は、例えば図1に示したような情報処理装置100のハードウェア構成を用いて実行することが可能である。つまり、以下で説明する処理は、コンピュータプログラムを用いて図1に示すハードウェアを制御することにより実現される。
なお、この図1に示したハードウェアの形態は任意であり、例えば、パーソナルコンピュータ、携帯電話、PHS、PDA等の携帯情報端末、ゲーム機、接触式又は非接触式のICチップ、接触式又は非接触式のICカード、スピーカ、テレビ、モニタ、ウェアラブル機器、又は種々の情報家電がこれに含まれる。但し、上記のPHSは、Personal Handy−phone Systemの略である。また、上記のPDAは、Personal Digital Assistantの略である。
図1に示した情報処理装置100は、主に、ハードディスク101と、情報アクセス部102と、操作装置103と、操作I/F(インタフェース)104と、通信I/F105と、マイク106と、音声入力I/F107と、音声出力I/F108と、スピーカ109と、映像出力I/F110と、ディスプレイ111と、制御部120と、を含んで構成される。
ハードディスク101は、各種のデータを格納するための装置である。図1ではハードディスク101を示したが、他にも半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられてもよい。ハードディスク101には、例えば情報処理装置100を動作させるコンピュータプログラムが格納されても良く、上述した特徴を実現するためのデータが格納されていても良い。
情報アクセス部102は、制御部120からの制御に基づき、ハードディスク101に対するデータの読み書きを実行する。
操作装置103は、情報処理装置100に対するユーザからの入力操作を受け付ける装置であり、例えばキーボード、マウス、タッチパネル、ボタン、スイッチ、レバー等で構成される。また操作装置103には、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラが用いられることもある。
操作I/F104は、操作装置103によって入力された内容を制御部120に渡すためのインタフェースである。
通信I/F105は、インターネット10等のネットワークに接続するための通信インタフェースであり、例えば、有線又は無線LAN、Bluetooth(登録商標)、又はWUSB用の通信カード、光通信用のルータ、ADSL用のルータ、又は接触又は非接触通信用のデバイス等である。また、通信I/F105に接続されるネットワークは、有線又は無線により接続されたネットワークにより構成され、インターネット10の他に、例えば、家庭内LAN、赤外線通信、可視光通信、放送、又は衛星通信等である。但し、上記のLANは、Local Area Networkの略である。また、上記のWUSBは、Wireless USBの略である。そして、上記のADSLは、Asymmetric Digital Subscriber Lineの略である。
マイク106は、情報処理装置100のユーザによる発話を集音する。音声入力I/F107は、マイク106が集音した内容を制御部120に渡すためのインタフェースである。
スピーカ109は、音声を出力する。音声出力I/F108は、制御部120から送られる音声データに基づいてスピーカ109に音声を出力させるためのインタフェースである。
ディスプレイ111は、例えばLCD、PDP、又はELD等のディスプレイ装置である。映像出力I/F110は、制御部120から送られる映像データに基づいてディスプレイ111に映像を出力させるためのインタフェースである。
制御部120は、情報処理装置100の動作を制御する。図1に示したように、制御部120は、CPU121と、ROM122と、RAM123と、を含んで構成される。
CPU121は、例えば、演算処理装置又は制御装置として機能し、ハードディスク101、ROM122、RAM123等に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。ROM122は、CPU121に読み込まれるプログラムや演算に用いるデータ等を格納する。RAM123は、例えば、CPU121に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等を一時的又は永続的に格納する。
以上、図1を用いて本開示の一実施形態に係る情報処理装置100のハードウェア構成例について説明した。続いて、図1を用いて本開示の一実施形態に係る情報処理装置100に含まれる制御部120の機能構成例について説明する。
図2は、本開示の一実施形態に係る情報処理装置100に含まれる制御部120の機能構成例を示す説明図である。以下、図2を用いて制御部120の機能構成例について説明する。
図2に示したように、制御部120は、音声認識部131と、言語解析部132と、情報検索部133と、質問意図構造判定部134と、対象文書構造判定部135と、回答候補判定部136と、回答判定部137と、ユーザ満足度判定部138と、ソース信頼度判定部139と、専門度判定部140と、応答生成部141と、音声合成部142と、を含んで構成される。
音声認識部131は、ユーザがマイク106に向かって発話した内容を認識し、認識した発話の内容をテキストに置き換える。音声認識部131による、ユーザが発話した内容をテキストに置き換える処理は特定の処理に限定されるものではない。音声認識部131は、テキストに置き換えたユーザの発話の内容を言語解析部132に送る。
言語解析部132は、音声認識部131から送られてくる、テキストに置き換えられたユーザの発話の内容や、ユーザが操作装置103を用いて入力したテキストに対する解析処理を実行する。言語解析部132は、解析処理として、形態素解析や構文解析などを行う。そして言語解析部132は、解析処理の結果として、分かち書き、格、モダリティなどを判定する。言語解析部132は、解析処理の結果を質問意図構造判定部134に送る。
ユーザが「誰が日本で最初にラーメンを食べたのですか?」と入力した場合、言語解析部132は、「誰が 日本で 最初に ラーメンを 食べたのですか?」と分かち書きを行う。また言語解析部132は、それぞれの文節に対して格、モダリティなどの判定を行う。上述の例では、「誰が 日本で 最初に ラーメンを」までが格で「食べたのですか?」が述部にあたる。また「誰が」が主格、「日本で」が場所格、「最初に」が時間格、「ラーメンを」が対象格して判定され、「食べたのですか?」が疑問のモダリティとして判定される。
情報検索部133は、インターネット10の検索サイトや、ハードディスク101などに格納されているデータに対する検索処理を実行する。情報検索部133は、検索処理の実行に際し、質問意図構造判定部134によって生成される質問意図構造を用いる。情報検索部133は、検索処理の結果、ヒットした対象文書を対象文書構造判定部135に渡す。
情報検索部133は、ユーザが入力したテキストから形態素を抽出し、抽出した形態素の中から特徴的なキーワードを抜き出し、そのキーワードを用いてインターネット上の検索サイトや、情報処理装置100が所持しているデータ等に対する検索処理を実行する。情報検索部133は、抜き出したキーワードに対して、必要に応じてシソーラス辞書により同義語などに展開してもよい。
例えば、上述したようにユーザが「誰が日本で最初にラーメンを食べたのですか?」と入力した場合、情報検索部133は、「日本」、「ジャパン(日本を同義語展開)」、「最初」、「ラーメン」、「食べる」といったキーワードを抜き出し、そのキーワードを用いてインターネット上の検索サイトや、情報処理装置100が所持しているデータ等に対する検索処理を実行する。
質問意図構造判定部134は、言語解析部132による解析処理の結果を用いて言語解析を行って、質問意図構造を生成する。質問意図構造の詳細については後述する。質問意図構造判定部134は、生成した質問意図構造を情報検索部133及び回答候補判定部136に渡す。
対象文書構造判定部135は、情報検索部133の検索処理によりヒットした対象文書に対する言語解析を行って、対象文書構造を判定する。なお、対象文書に対する言語解析処理は、言語解析部132が実行しても良い。対象文書に対する言語解析処理を言語解析部132が実行する場合、対象文書構造判定部135は、言語解析部132による言語解析処理の結果を用いて対象文書構造を判定する。対象文書構造判定部135は、対象文書に対する言語解析を行って、対象文書構造を判定すると、判定した対象文書構造を回答候補判定部136に送る。
回答候補判定部136は、質問意図構造判定部134から渡される質問意図構造と、対象文書構造判定部135から渡される対象文書構造とを比較し、回答候補を特定する。回答候補判定部136は、回答候補を特定すると、特定した回答候補を回答判定部137に送る。回答候補判定部136は、回答候補の特定を、情報検索部133の検索処理によりヒットした対象文書の数だけ行っても良く、情報検索部133の検索処理によりヒットした対象文書の中の上位所定数の対象文書に対して行っても良い。
回答判定部137は、回答候補判定部136が特定した回答候補を集計し、回答を算出する。回答判定部137は、回答を算出する際に、ユーザ満足度判定部138によるユーザ満足度の判定結果、ソース信頼度判定部139によるソース信頼度の判定結果、専門度判定部140による専門度の集計結果の少なくともいずれかを用いても良い。回答判定部137は、回答を算出すると、算出した回答を応答生成部141に渡す。回答判定部137は、ユーザ満足度及びソース信頼度を加味して、回答として相応しい度合いを示すスコアを算出してもよい。本実施形態では、回答判定部137は、スコアを所定の算出基準に基づいて算出する。スコアの算出方法の例については後に詳述する。
ユーザ満足度判定部138は、ユーザに提示した回答に対するユーザの満足度を管理しておき、ユーザから同様の質問がされた場合に、満足度を回答判定部137に提供する。例えば情報処理装置100は、ユーザにある回答を提示する際に、併せてその回答について満足したかどうかを問い合わせる。ユーザ満足度判定部138は、その回答にユーザが満足したと回答した件数を記録する。そして、同様の質問がユーザからされた場合に、ユーザ満足度判定部138は、満足したと回答した件数の比率をユーザ満足度として回答判定部137に提供する。
ソース信頼度判定部139は、インターネット10の検索サイトを通じて対象文書を取得する際に、その対象文書が存在するサイトのソース信頼度を集計する。ソース信頼度は、本開示における回答候補に対する根拠の信頼度一例である。ソース信頼度は、予めサイトごと、またはサイトの種類毎に設定されうる。例えば、公的なサイトや、新聞社やテレビ局のサイトは信頼度が高く、個人のブログは信頼度が低いというような設定がなされても良い。
専門度判定部140は、回答に対する専門度を回答判定部137に提供する。回答判定部137は、回答に対する専門度を専門度判定部140から取得することで、ユーザ自身の専門度に合った回答に絞って回答を提示することができる。
応答生成部141は、回答判定部137が算出した回答を基に、ユーザに提示する応答の基となる情報を生成する。応答生成部141は、ユーザに提示する応答の基となる情報として、例えば回答が含まれる応答文を生成する。応答生成部141は、生成した、ユーザに提示する応答の基となる情報をそのままディスプレイ111から出力させてもよく、生成した情報を音声で出力するために音声合成部142に渡しても良い。
応答生成部141は、例えば、ユーザが入力した質問文の構造と、検索により取得した対象文書の構造とを比較して回答候補を判定した結果を、質問文と対比して提示するための情報を生成する。このように、質問文の構造と、検索により取得した対象文書の構造とを比較して回答候補を判定した結果を、質問文と対比して提示するための情報を生成することで、本実施形態に係る情報処理装置100は、回答として提示する情報のどの部分がユーザの求めているものであるかを分かりやすくユーザに提示できる。
応答生成部141は、回答候補の基となっている対象文書に対する言語解析処理の結果を表示するための情報を生成してもよい。また応答生成部141は、対象文書に対する言語解析処理の結果を表示するための情報を生成する際には、質問に対する言語解析処理の結果と対応づけて表示するための情報を生成しても良い。例えば、対象文書に「ジャパンでは一番最初に徳川光圀が醤油ラーメンを食べた」というテキストが含まれている場合、応答生成部141は、「ジャパン」、「最初」、「醤油ラーメン」、「食べた」といったキーワードを枠で囲うなどして強調表示するための情報を生成してもよい。
さらに応答生成部141は、それぞれの回答候補に対する詳細なデータ、例えばユーザ満足度、ソースデータ信頼度、専門度などの情報を表示するための情報を生成しても良い。さらに応答生成部141は、回答候補が複数存在する場合、最もスコアの高い回答候補だけを回答として提示するための情報を生成しても良く、一部の回答候補を回答として提示するための情報を生成してもよく、全ての回答候補を回答として提示するための情報を生成しても良い。さらに応答生成部141は、回答候補が複数存在する場合、回答候補のソート順をユーザに指定させるためのGUIを表示するための情報を生成しても良い。回答候補のソート順としては、例えばスコア順、ソース信頼度順、ユーザ満足度順、専門度順、などがある。
音声合成部142は、応答生成部141が生成した応答文を音声データに変換する。音声合成部142による音声データへの変換処理は特定の処理に限定されるものではない。音声合成部142は、生成した音声データを音声出力I/F108に送り、スピーカ109から音声データに基づく音声として出力させる。
制御部120は、図2に示したような構成を有することで、ユーザが自然文で知りたいことを音声やテキストで入力すると、その質問に対する回答箇所を直接返すことができる。従って、制御部120は、図2に示したような構成を有することで、ユーザが回答を探す手間を大幅に低減させる効果が期待できる。また、制御部120は、図2に示したような構成を有することで、多くの回答候補を制御部120で処理するので、ヒットした情報を一つ一つ人間が見ていくよりも高い精度の回答をユーザに提示することができる。
なお、図2に示した制御部120の機能構成例において、質問意図構造判定部134及び対象文書構造判定部135は、本開示の取得部の一例として機能しうる。また図2に示した制御部120の機能構成例において、回答候補判定部136、回答判定部137及び応答生成部141は、本開示の制御部の一例として機能しうる。
以上、図2を用いて本開示の一実施形態に係る制御部120の機能構成例について説明した。続いて、本開示の一実施形態に係る情報処理装置100の動作例について説明する。
[1.4.動作例]
図3〜図5は、本開示の一実施形態に係る情報処理装置100の動作例を示す流れ図である。図3〜図5に示したのは、ユーザが自然文で入力した質問に対して、回答を算出して、回答に基づく応答文を当該ユーザに提示する際の、情報処理装置100の動作例である。以下図3〜図5を用いて本開示の一実施形態に係る情報処理装置100の動作例について説明する。
ユーザがマイク106に向かって質問を発話した場合、情報処理装置100は、ユーザが発話した内容を認識し、認識した発話の内容をテキストに置き換える(ステップS101)。ステップS101の音声認識は、例えば音声認識部131が実行する。音声認識部131による音声認識処理は、特定の処理に限定されるものでは無い。
続いて情報処理装置100は、上記ステップS101でテキストに置き換えられたユーザの発話の内容、または、ユーザが操作装置103を用いて入力したテキストに対して言語解析処理を行う(ステップS102)。ステップS102の言語解析処理は、例えば言語解析部132が実行する。
ステップS102の言語解析処理では、上記ステップS101でテキストに置き換えられたユーザの発話の内容、または、ユーザが操作装置103を用いて入力したテキストに対して、形態素解析、構文解析などが行われる。そしてテキストに対して、形態素解析、構文解析などが行われた結果、テキストに対する分かち書きや、格、モダリティなどの判定が行われる。
例えば、ユーザが「誰が日本で最初にラーメンを食べたのですか?」と入力した場合、ステップS102の言語解析処理では、「誰が 日本で 最初に ラーメンを 食べたのですか?」と分かち書きが行われる。またそれぞれの文節に対して格、モダリティなどの判定が行われる。上述の例では、「誰が 日本で 最初に ラーメンを」までが格で「食べたのですか?」が述部にあたる。また「誰が」が主格、「日本で」が場所格、「最初に」が時間格、「ラーメンを」が対象格して判定され、「食べたのですか?」が疑問のモダリティとして判定される。
続いて情報処理装置100は、上記ステップS102での言語解析処理の結果を用いて。質問意図構造判定処理を実行する(ステップS103)。ステップS103の質問意図構造判定処理は、例えば質問意図構造判定部134が実行する。ステップS103の質問意図構造判定処理では、言語解析処理の解析結果から質問意図構造が生成される。なお、上記ステップS102での言語解析処理の結果、モダリティが疑問であるテキストに対してのみ、このステップS103の質問意図構造判定処理が行われる。
図6は、質問意図構造の例を示す説明図である。上述したようにユーザが「誰が日本で最初にラーメンを食べたのですか?」と入力した場合、ステップS102の言語解析処理において、「誰が」が主格、「日本で」が場所格、「最初に」が時間格、「ラーメンを」が対象格して判定され、「食べたのですか?」が疑問のモダリティとして判定される。そして情報処理装置100は、格構造(述部+格)を判定し、事前に定義した、疑問詞および疑問詞の属性(何を聞いているのかの質問対象)をマッピングすることで、図6に示したような質問意図構造を生成する。図6に示した例では、質問意図構造を生成した結果、質問対象が人物であることが判定されている。
なお本実施形態では、上記ステップS102での言語解析処理で格構造やモダリティの解析を行ったが、本開示は係る例に限定されるものでは無く、テキストに対する形態素解析に疑問詞や疑問表現を現したテーブルを当てはめることで質問意図構造が生成されてもよい。
続いて情報処理装置100は、ステップS103の質問意図構造判定処理によって生成した質問意図構造のキーワードを使って、インターネット上の検索サイトや、情報処理装置100が所持しているデータ等に対する検索処理を実行する(ステップS104)。ステップS104の検索処理は、例えば情報検索部133が実行する。情報処理装置100は、ステップS104の検索処理の結果、対象文書を取得する。対象文書は1つだけに限られない。
情報処理装置100は、ステップS104の検索処理において、ユーザが入力したテキストから形態素を抽出し、抽出した形態素の中から特徴的なキーワードを抜き出し、そのキーワードを用いてインターネット上の検索サイトや、情報処理装置100が所持しているデータ等に対する検索処理を実行する。情報処理装置100は、抜き出したキーワードに対して、必要に応じてシソーラス辞書により同義語などに展開してもよい。
例えば、上述したようにユーザが「誰が日本で最初にラーメンを食べたのですか?」と入力した場合、情報処理装置100は、「日本」、「ジャパン(日本を同義語展開)」、「最初」、「ラーメン」、「食べる」といったキーワードを抜き出し、そのキーワードを用いてインターネット上の検索サイトや、情報処理装置100が所持しているデータ等に対する検索処理を実行する。
情報処理装置100は、ステップS104で検索処理を実行し、対象文書を取得すると、続いてその取得した対象文書に対する言語解析処理を実行する(ステップS105)。ステップS105の対象文書に対する言語解析処理は、例えば対象文書構造判定部135または言語解析部132が実行する。ステップS105の対象文書に対する言語解析処理では、形態素解析、構文解析、照応解析などが行われる。そしてステップS105の対象文書に対する言語解析処理では、対象文書に対して、形態素解析、構文解析、照応解析などが行われた結果、テキストに対する分かち書きや、格、モダリティなどの判定が行われる。
情報処理装置100は、続いて、対象文書に対する言語解析処理の結果を用いて、対象文書構造判定処理を実行する(ステップS106)。ステップS106の対象文書構造判定処理は、例えば対象文書構造判定部135が実行する。ステップS106の対象文書構造判定処理では、対象文書に対する言語解析処理の解析結果から対象文書構造が生成される。なお、上記ステップS105での対象文書に対する言語解析処理の結果、モダリティが断定であるテキストに対してのみ、このステップS106の対象文書構造判定処理が行われる。
図7は、対象文書構造の例を示す説明図である。情報処理装置100が、「日本」、「ジャパン」、「最初」、「ラーメン」、「食べる」といったキーワードを用いて検索処理を行った結果、「ジャパンでは一番最初に徳川光圀が醤油ラーメンを食べた」というテキストが含まれた対象文書を取得したとする。この場合、ステップS106の対象文書構造判定処理において、「ジャパンでは」が場所格、「一番最初に」が時間格、「徳川光圀が」が主格、「醤油ラーメンを」が対象格して判定され、「食べた」が断定のモダリティとして判定される。
情報処理装置100は、続いて、上記ステップS103の処理で生成された質問意図構造と、ステップS106の処理で生成された対象文書構造とを比較して、回答候補判定処理を実行する(ステップS107)。ステップS107の回答候補判定処理は、例えば回答候補判定部136が行う。
情報処理装置100は、回答候補判定処理において、質問意図構造と対象文書構造とを比較し、述部が意味的に一致しているが、格および意味的な表記が所定の比率以上一致しているかを判断する。情報処理装置100は、格および意味的な表記が所定の比率以上一致しているかを判断する際は、対比される格が存在する場合は完全に一致しているもの、対比される格が存在しない場合は所定の比率以上一致しているものを条件とする。
そして情報処理装置100は、上述した条件を満たしている質問意図構造の質問対象の格を回答候補とする。情報処理装置100は、回答候補判定処理を、検索処理でヒットした対象文書の数だけ行っても良く、検索処理でヒットした対象文書の中の上位所定数の対象文書に対して行っても良い。
図8は、ステップS107の回答候補判定処理の例を示す説明図である。図8に示したのは、図6に示した質問意図構造と、図7に示した対象文書構造とを比較した場合の例である。この2つを比較すると、格一致率は4/4=100%であり、対比する4つの格に対して意味的な表記が一致している。従って、図6に示した質問意図構造と、図7に示した対象文書構造とを比較すると、「徳川光圀」が回答候補として判定される。
図9は、ステップS107の回答候補判定処理の別の例を示す説明図である。図9に示したのは、図6に示した質問意図構造と、図7に示した対象文書構造から「ジャパンでは」が無くなっているものとを比較した場合の例である。この2つを比較すると、格一致率は3/4=100%であり、対比する3つの格に対して意味的な表記が一致している。従って、図6に示した質問意図構造と、図7に示した対象文書構造から「ジャパンでは」が無くなっているものとを比較すると、格一致率が70%以上のものを回答候補の対象とすると決められていた場合、「徳川光圀」が回答候補として判定される。
図10は、ステップS107の回答候補判定処理のさらに別の例を示す説明図である。図10に示したのは、図6に示した質問意図構造と、「アメリカでは一番最初にリンカーンが醤油ラーメンを食べた」というテキストが含まれた対象文書を取得し、その対象文書から生成される対象文書構造とを比較した場合の例である。この2つを比較すると、対比する格のうち、場所格の表記が異なっている。従って、図10に示した対象文書構造は、回答候補の抽出の対象とはならない。
情報処理装置100は、続いて、ステップS107の回答候補判定処理で得られた回答候補から、ユーザに提示する回答を算出する回答判定処理を実行する(ステップS108)。ステップS108の回答判定処理は、例えば回答判定部137が実行する。
情報処理装置100は、ステップS108の回答判定処理において、回答候補となったものに対して、同一内容のものが何件挙がっているかを集計する。ステップS108の回答判定処理においては、後述のソース信頼度判定処理(ステップS109)、ユーザ満足度判定処理(ステップS110)、専門度判定処理(ステップS111)の結果が用いられてもよい。
ステップS109のソース信頼度判定処理は、インターネット10の検索サイトを通じて対象文書を取得する際に、その対象文書が存在するサイトのソース信頼度を集計する処理である。ソース信頼度は、本開示における回答候補に対する根拠の一例である。ソース信頼度判定処理は、例えばソース信頼度判定部139が実行する。ソース信頼度は、予めサイト毎と、またはサイトの種類毎に設定されうる。例えば、公的なサイトや、新聞社やテレビ局のサイトは信頼度が高く、個人のブログは信頼度が低いというような設定がなされても良い。
ステップS110のユーザ満足度判定処理は、提示した回答に対してフィードバックされたユーザの満足度に基づいてユーザ満足度を集計し、必要に応じて提示する処理である。ステップS110のユーザ満足度判定処理は、例えばユーザ満足度判定部138が実行する。
例えば、ユーザからの「日本で最初にラーメンを食べたのは誰ですか?」という質問の入力に対して情報処理装置100が「徳川光圀」と回答した場合に、情報処理装置100は、ユーザがその回答に対して満足であると情報処理装置100へフィードバックした件数、それぞれの質問意図構造、対象文書構造、回答と併せて記録しておく。そして情報処理装置100は、同様の質問が来た場合に、満足とした件数の比率をユーザ満足度として算出する。
同様の質問とは、例えば、今回の質問の質問意図構造と、過去の質問の質問意図構造が完全に一致する場合、または、今回の質問の質問意図構造と、過去の質問の質問意図構造の格一致率が所定の値以上の場合の今回の質問をいう。
例えば、今回の質問が「日本で最初にラーメンを食べたのは誰ですか?」であり、過去に「最初に日本でラーメンを食べたのは誰ですか?」という質問がなされた場合、今回の質問の質問意図構造と、過去の質問の質問意図構造が完全に一致するので、今回の質問は過去の質問と同様の質問となる。また、今回の質問が「最初にラーメンを食べたのは誰ですか?」であり、過去に「最初に日本でラーメンを食べたのは誰ですか?」という質問がなされた場合、今回の質問の質問意図構造と、過去の質問の質問意図構造の格一致率は3/4であるので、例えば格一致率が70%以上であれば同様の質問であると判定する場合は、今回の質問は過去の質問と同様の質問となる。
ステップS111の専門度判定処理は、事前に情報処理装置100に設定されたユーザプロファイル内のキーワードがユーザからの今回の質問文に含まれている場合、ユーザプロファイル内のユーザの専門度と、回答に対する専門度と、を取得する処理である。ステップS108の回答判定処理において、ユーザプロファイル内のユーザの専門度と、回答に対する専門度とを比較し、所定の条件を満たす回答のみを抽出ことができる。所定の条件とは、例えば、ユーザプロファイル内のユーザの専門度が、回答に対する専門度以上を満たすものであってもよい。情報処理装置100は、ユーザプロファイル内のユーザの専門度が、回答に対する専門度以上を満たす回答のみを抽出ことで、ユーザの専門度内での回答のみを提示する対象とすることができる。
情報処理装置100は、ステップS108の回答判定処理において、ユーザ満足度及びソース信頼度を加味して、回答として相応しい度合いを示すスコアを算出する。本実施形態では、情報処理装置100は、ステップS108の回答判定処理において、スコアを、それぞれの回答候補の件数比率×ユーザ満足度×ソースデータ信頼度を正規化して合計で100%になるよう算出する。そして情報処理装置100は、ステップS108の回答判定処理において、算出したスコア値を降順でソートしたものを回答とする。もちろんスコアの算出方法は係る例に限定されるものでは無い。
図11は、ステップS108の回答判定処理の結果の例を示す説明図である。例えば「日本で最初にラーメンを食べたのは誰ですか?」というユーザからの質問に対して検索処理を実行し、回答候補を集計した結果、「徳川光圀」が35件、「織田信長」が7件、「豊臣秀吉」が2件だったとする。そして、「徳川光圀」についてユーザ満足度が86%であって、ソース信頼度が77%であったとする。同様に、「織田信長」についてユーザ満足度が11%であって、ソース信頼度が12%、「豊臣秀吉」についてユーザ満足度が5%であって、ソース信頼度が7%であったとする。
その結果、情報処理装置100は、ステップS108の回答判定処理において、「徳川光圀」のスコアを99.57、「織田信長」のスコアを0.40、「豊臣秀吉」のスコアを0.03と算出することが出来る。
情報処理装置100は、ユーザプロファイルに応じて表示する回答を変えてもよい。例えば、パソコンに詳しいとユーザプロファイルに登録したユーザが「パソコンの速度を速くするには?」という質問を情報処理装置100へ入力した場合、情報処理装置100は、「CPUをより高速なものに載せ替えましょう」といった専門的な回答のスコアを高くするような重み付けを設定しても良い。一方、パソコンに詳しくないとユーザプロファイルに登録したユーザが「パソコンの速度を速くするには?」という質問を情報処理装置100へ入力した場合、情報処理装置100は、「同時に複数のアプリを立ち上げないようにしましょう」といったあまり専門度が高くない回答のスコアを高くするような重み付けを設定しても良い。
具体的には、情報処理装置100のユーザに、予めユーザプロファイルとして、キーワードと専門度を設定してもらう。例えばパソコンというキーワードに対して、ユーザに専門度を0〜1の間で設定させる。情報処理装置100は、ユーザプロファイルに設定された専門度Aと、各回答に付与された専門度Bとを比較して、例えばA≧Bとなっている回答だけを抽出することで、ユーザの専門度に合った回答をユーザに提示できる。
上記ステップS108で回答判定処理を実行すると、続いて情報処理装置100は、回答判定処理で得られる回答に基づいて、ユーザに提示するための応答文を生成する応答文生成処理を実行する(ステップS112)。ステップS112の応答文生成処理は、例えば応答生成部141が実行する。なお情報処理装置100は、文章では無く、単に回答判定処理で得られる回答だけをユーザに提示しても良い。
例えば、情報処理装置100は、例えば「日本で最初にラーメンを食べたのは誰ですか?」というユーザからの質問に対して「徳川光圀」を回答として生成した場合、「日本で最初にラーメンを食べたのは徳川光圀です。」という文章をステップS112の応答文生成処理で生成しても良く、単に「徳川光圀」という情報だけを生成しても良い。
上記ステップS112で応答文生成処理を実行すると、続いて情報処理装置100は、生成した応答文をディスプレイ111から出力しても良く、生成した応答文を音声に変換して出力する音声合成処理を実行しても良い(ステップS113)。ステップS113の音声合成処理は、例えば音声合成部142が実行する。ステップS113の音声合成処理は、特定の処理に限定されるものではない。
ここで、情報処理装置100による応答文の出力例を説明する。
(1)音声で出力する場合
例えば、ユーザが「日本で最初にラーメンを食べたのは誰ですか?」という質問を情報処理装置100へ入力した際に、情報処理装置100が、スコアの1位から順に徳川光圀、織田信長、豊臣秀吉の3通りの回答候補を抽出したとする。回答候補のスコアの1位が2位以下と大差をつけている場合、情報処理装置100は、例えば「答えは、徳川光圀です。」と音声で出力する。一方、回答候補のスコアが拮抗している場合、情報処理装置100は、例えば「徳川光圀、織田信長、豊臣秀吉が考えられます。」と音声で出力する。
(2)ディスプレイへの表示により出力する場合
応答文のディスプレイへの表示による出力には様々なものが考えられる。例えば、ユーザが「日本で最初にラーメンを食べた人は誰ですか?」という質問を情報処理装置100へ入力した際に、情報処理装置100が、スコアの1位から順に徳川光圀、織田信長、豊臣秀吉の3通りの回答候補を抽出したとする。回答候補のスコアの1位が2位以下と大差をつけている場合、情報処理装置100は、例えば「答えは、徳川光圀です。」という文章だけを単にディスプレイ111に表示させても良い。
また情報処理装置100は、質問文と対象文書とを言語解析処理した結果が分かるような表示を行っても良い。
図12は、情報処理装置100による応答文のディスプレイ111への出力例を示す説明図である。ユーザが「日本で最初にラーメンを食べた人は誰ですか?」という質問を情報処理装置100へ入力した際に、情報処理装置100が、スコアの1位から順に徳川光圀、織田信長、豊臣秀吉の3通りの回答候補を抽出し、スコアを図11のように算出したとする。
情報処理装置100は、図12のように「日本」、「最初」、「ラーメン」、「食べた」といったキーワードを枠で囲うなどして強調表示してもよい。そして、情報処理装置100は、徳川光圀、織田信長、豊臣秀吉の順に回答を表示するが、その際にスコアが大きいほど表示を大きくしても良い。また回答候補の横に棒グラフ及びスコアを表示しても良い。
また情報処理装置100は、それぞれの回答候補の基となっている対象文書における回答箇所を強調表示してもよい。例えば、対象文書に「ジャパンでは一番最初に徳川光圀が醤油ラーメンを食べた」というテキストが含まれている場合、情報処理装置100は、「徳川光圀」の部分に色を付けたり、文字を太くしたり、文字を大きくしたり、下線を付したりする等して、回答の部分を強調表示してもよい。図12に示した例では、「徳川光圀」の部分に下線が付されている様子が示されている。
さらに情報処理装置100は、それぞれの回答候補の基となっている対象文書に対する言語解析処理の結果を表示してもよい。情報処理装置100は、対象文書に対する言語解析処理の結果を表示する際には、質問に対する言語解析処理の結果と対応づけて表示しても良い。例えば、対象文書に「ジャパンでは一番最初に徳川光圀が醤油ラーメンを食べた」というテキストが含まれている場合、情報処理装置100は、「ジャパン」、「最初」、「醤油ラーメン」、「食べた」といったキーワードを枠で囲うなどして強調表示してもよい。
さらに情報処理装置100は、それぞれの回答候補に対する詳細なデータ、例えばユーザ満足度、ソースデータ信頼度、専門度などの情報を表示しても良い。
さらに情報処理装置100は、回答候補が複数存在する場合、回答候補のソート順をユーザに指定させるためのGUIを表示しても良い。図12には、回答候補のソート順をスコア順、ユーザ満足度順、ソース信頼度順、専門度順の中から選択させるGUIを表示した例が示されている。
[1.6.ユースケース例]
最後に、本実施形態に係る情報処理装置100が使用されるユースケース例を説明する。
本実施形態に係る情報処理装置100は、ユーザの発話による自然文や、ユーザが入力したテキストを用いて検索を行い、回答を直接ユーザに提示する装置である。このような情報処理装置100の用途には以下のようなものが考えられる。
例えば、ユーザがテレビ番組を視聴していて、出演者や場所などでふと疑問に思ったことが出てきた場合、ユーザはその疑問について本実施形態に係る情報処理装置100を用いることで簡単に調べることができる。
また例えば、ユーザが音楽を聴いていて、アーティストや曲に関してふと疑問に思ったことが出てきた場合、ユーザはその疑問について本実施形態に係る情報処理装置100を用いることで簡単に調べることができる。
また例えば、ユーザが街中を歩いている際にふと疑問に思ったことが出てきた場合、ユーザはその疑問について本実施形態に係る情報処理装置100を用いることで簡単に調べることができる。
また例えば、ユーザが仕事中に資料を作成している際にふと疑問に思ったことが出てきた場合、ユーザはその疑問について本実施形態に係る情報処理装置100を用いることで簡単に調べることができる。
また例えば、検索対象として情報処理装置100に保存されているユーザのスケジュールや文書などを設定することで、ユーザは情報処理装置100に保存されている情報について本実施形態に係る情報処理装置100を用いることで簡単に調べることができる。
情報処理装置100に複数のユーザの情報、例えば家族の情報が保存されている場合、例えばユーザが「お父さんの今度の日曜日の予定は?」と質問すると、本実施形態に係る情報処理装置100は、「ゴルフ」等のようにお父さんの予定を直接出力することが出来る。家族の予定などを調べる場合は、予め家族のお互いの呼び名やよく行く場所の呼び名等が情報処理装置100に登録されていてもよい。情報処理装置100は、それらの呼び名が質問文に含まれていても、その呼び名を解釈して回答を提示することができる。
<2.まとめ>
以上説明したように本開示の一実施形態によれば、ユーザの自然文による質問を言語解析して、その解析結果から検索語を生成してその検索語を用いて検索し、検索結果について言語解析して、ユーザの質問に対する回答を抽出して提示することができる情報処理装置100が提供される。
本開示の一実施形態に係る情報処理装置100は、例えばユーザが「日本で最初にラーメンを食べた人は誰ですか?」という質問を発話したり、またキーボードやタッチパネルなどを用いて入力したりした場合に、その質問を言語解析して質問意図構造を判定する。また本開示の一実施形態に係る情報処理装置100は、その言語解析の結果から検索語を生成して、その検索語を用いてインターネット10等を検索し、検索結果として対象文書を取得する。また本開示の一実施形態に係る情報処理装置100は、対象文書を言語解析して対象文書構造を判定して、質問意図構造と対象意図構造とを比較することで、質問に対する回答の候補となる回答候補を抽出する。そして本開示の一実施形態に係る情報処理装置100は、回答候補に対してスコアを算出して、そのスコアに基づいて回答を出力する。
本開示の一実施形態に係る情報処理装置100は、ユーザの質問に対する回答を抽出して提示することで、ユーザが回答を効率的に得られることを可能にする。
本明細書の各装置が実行する処理における各ステップは、必ずしもシーケンス図またはフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、各装置が実行する処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
また、各装置に内蔵されるCPU、ROMおよびRAMなどのハードウェアを、上述した各装置の構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供されることが可能である。また、機能ブロック図で示したそれぞれの機能ブロックをハードウェアまたはハードウェア回路で構成することで、一連の処理をハードウェアまたはハードウェア回路で実現することもできる。
また上述の説明で用いた機能ブロック図で示したそれぞれの機能ブロックの一部又は全部は、たとえばインターネット等のネットワークを介して接続されるサーバ装置で実現されてもよい。また上述の説明で用いた機能ブロック図で示したそれぞれの機能ブロックの構成は、単独の装置で実現されてもよく、複数の装置が連携するシステムで実現されても良い。複数の装置が連携するシステムには、例えば複数のサーバ装置の組み合わせ、サーバ装置と端末装置との組み合わせ等が含まれ得る。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
入力された質問文を解析して得られる該質問文の構造と、前記質問文を用いて生成された検索語を用いた検索により得られた対象文書を解析して得られる対象文書の構造とを取得する取得部と、
前記取得部が取得した前記質問文の構造と前記対象文書の構造とを比較して回答候補を判定し、該判定の結果を前記質問文と対比して提示するための情報を生成する制御部と、
を備える、情報処理装置。
(2)
前記制御部は、前記回答候補に対して算出された、回答として相応しい度合いを示すスコアを加味して情報を生成する、前記(1)に記載の情報処理装置。
(3)
前記制御部は、前記回答候補に対する根拠の信頼度を加味して情報を生成する、前記(1)または(2)に記載の情報処理装置。
(4)
前記制御部は、前記回答候補が複数存在する場合、回答の可能性が最も高い回答候補だけを提示するための情報を生成する、前記(1)〜(3)のいずれかに記載の情報処理装置。
(5)
前記制御部は、前記回答候補が複数存在する場合、回答の可能性が高い複数の回答候補を提示するための情報を生成する、前記(1)〜(3)のいずれかに記載の情報処理装置。
(6)
前記制御部は、前記回答候補を所定の条件で並べ替えるための情報を生成する、前記(1)〜(5)のいずれかに記載の情報処理装置。
(7)
前記取得部は、前記質問文を解析して該質問文の構造及び/または前記対象文書を解析して対象文書の構造を取得する、前記(1)〜(6)のいずれかに記載の情報処理装置。
(8)
前記制御部は、前記回答候補の判定結果から前記質問文の回答を判定する、前記(1)〜(7)のいずれかに記載の情報処理装置。
(9)
前記制御部は、各前記回答候補に対して回答として相応しい度合いを示すスコアを算出する、前記(8)に記載の情報処理装置。
(10)
前記制御部は、各前記回答候補に対して、同様の質問について提示された回答に対しフィードバックされた満足度を用いて前記スコアを算出する、前記(9)に記載の情報処理装置。
(11)
前記制御部は、各前記回答候補に対して、対象文書が存在する場所に対し設定された信頼度を用いて前記スコアを算出する、前記(9)に記載の情報処理装置。
(12)
前記制御部は、各前記回答候補に対して、質問者の専門度及び前記対象文書に対して設定された専門度を用いて回答を判定する、前記(8)〜(11)のいずれかに記載の情報処理装置。
(13)
前記取得部は、前記質問文を用いて前記検索語を生成して、該検索語を用いた検索を行って前記対象文書を取得する、前記(1)〜(12)のいずれかに記載の情報処理装置。
(14)
入力された質問文を解析して得られる該質問文の構造と、前記質問文を用いて生成された検索語を用いた検索により得られた対象文書を解析して得られる対象文書の構造とを取得することと、
取得された前記質問文の構造と前記対象文書の構造とを比較して回答候補を判定し、該判定の結果を前記質問文と対比して提示するための情報を生成することと、
を含む、情報処理方法。
(15)
コンピュータに、
入力された質問文を解析して得られる該質問文の構造と、前記質問文を用いて生成された検索語を用いた検索により得られた対象文書を解析して得られる対象文書の構造とを取得することと、
取得された前記質問文の構造と前記対象文書の構造とを比較して回答候補を判定し、該判定の結果を前記質問文と対比して提示するための情報を生成することと、
を実行させる、コンピュータプログラム。
100 情報処理装置
120 制御部

Claims (15)

  1. 入力された質問文を解析して得られる該質問文の構造と、前記質問文を用いて生成された検索語を用いた検索により得られた対象文書を解析して得られる対象文書の構造とを取得する取得部と、
    前記取得部が取得した前記質問文の構造と前記対象文書の構造とを比較して回答候補を判定し、該判定の結果を前記質問文と対比して提示するための情報を生成する制御部と、
    を備える、情報処理装置。
  2. 前記制御部は、前記回答候補に対して算出された、回答として相応しい度合いを示すスコアを加味して情報を生成する、請求項1に記載の情報処理装置。
  3. 前記制御部は、前記回答候補に対する根拠の信頼度を加味して情報を生成する、請求項1に記載の情報処理装置。
  4. 前記制御部は、前記回答候補が複数存在する場合、回答の可能性が最も高い回答候補だけを提示するための情報を生成する、請求項1に記載の情報処理装置。
  5. 前記制御部は、前記回答候補が複数存在する場合、回答の可能性が高い複数の回答候補を提示するための情報を生成する、請求項1に記載の情報処理装置。
  6. 前記制御部は、前記回答候補を所定の条件で並べ替えるための情報を生成する、請求項1に記載の情報処理装置。
  7. 前記取得部は、前記質問文を解析して該質問文の構造及び/または前記対象文書を解析して対象文書の構造を取得する、請求項1に記載の情報処理装置。
  8. 前記制御部は、前記回答候補の判定結果から前記質問文の回答を判定する、請求項1に記載の情報処理装置。
  9. 前記制御部は、各前記回答候補に対して回答として相応しい度合いを示すスコアを算出する、請求項8に記載の情報処理装置。
  10. 前記制御部は、各前記回答候補に対して、同様の質問について提示された回答に対しフィードバックされた満足度を用いて前記スコアを算出する、請求項9に記載の情報処理装置。
  11. 前記制御部は、各前記回答候補に対して、対象文書が存在する場所に対し設定された信頼度を用いて前記スコアを算出する、請求項9に記載の情報処理装置。
  12. 前記制御部は、各前記回答候補に対して、質問者の専門度及び前記対象文書に対して設定された専門度を用いて回答を判定する、請求項8に記載の情報処理装置。
  13. 前記取得部は、前記質問文を用いて前記検索語を生成して、該検索語を用いた検索を行って前記対象文書を取得する、請求項1に記載の情報処理装置。
  14. 入力された質問文を解析して得られる該質問文の構造と、前記質問文を用いて生成された検索語を用いた検索により得られた対象文書を解析して得られる対象文書の構造とを取得することと、
    取得された前記質問文の構造と前記対象文書の構造とを比較して回答候補を判定し、該判定の結果を前記質問文と対比して提示するための情報を生成することと、
    を含む、情報処理方法。
  15. コンピュータに、
    入力された質問文を解析して得られる該質問文の構造と、前記質問文を用いて生成された検索語を用いた検索により得られた対象文書を解析して得られる対象文書の構造とを取得することと、
    取得された前記質問文の構造と前記対象文書の構造とを比較して回答候補を判定し、該判定の結果を前記質問文と対比して提示するための情報を生成することと、
    を実行させる、コンピュータプログラム。
JP2016561036A 2015-05-01 2016-03-14 情報処理装置、情報処理方法及びコンピュータプログラム Pending JPWO2016178337A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015093967 2015-05-01
JP2015093967 2015-05-01
PCT/JP2016/057916 WO2016178337A1 (ja) 2015-05-01 2016-03-14 情報処理装置、情報処理方法及びコンピュータプログラム

Publications (1)

Publication Number Publication Date
JPWO2016178337A1 true JPWO2016178337A1 (ja) 2018-02-22

Family

ID=57218277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016561036A Pending JPWO2016178337A1 (ja) 2015-05-01 2016-03-14 情報処理装置、情報処理方法及びコンピュータプログラム

Country Status (3)

Country Link
US (1) US10380125B2 (ja)
JP (1) JPWO2016178337A1 (ja)
WO (1) WO2016178337A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11227230B2 (en) * 2017-03-17 2022-01-18 International Business Machines Corporation Automated technical content conversion based on user understanding level
JP6818706B2 (ja) * 2018-02-13 2021-01-20 日本電信電話株式会社 情報提供装置、情報提供方法、およびプログラム
JP7231190B2 (ja) * 2018-11-02 2023-03-01 株式会社ユニバーサルエンターテインメント 情報提供システム、及び、情報提供制御方法
US11537558B2 (en) * 2018-11-13 2022-12-27 Dokkio, Inc. File management systems and methods
CN109783631B (zh) * 2019-02-02 2022-05-17 北京百度网讯科技有限公司 社区问答数据的校验方法、装置、计算机设备和存储介质
CN111611364B (zh) * 2020-05-15 2023-08-15 北京百度网讯科技有限公司 一种智能应答方法、装置、设备及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080183745A1 (en) * 2006-09-25 2008-07-31 David Cancel Website analytics
US7444327B2 (en) 2004-01-09 2008-10-28 Microsoft Corporation System and method for automated optimization of search result relevance
JP4654745B2 (ja) * 2005-04-13 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
KR101050013B1 (ko) * 2009-04-30 2011-07-19 엔에이치엔(주) 대표자의 신뢰도를 이용한 검색 결과 순위화 장치 및 방법
JP5347949B2 (ja) 2009-12-24 2013-11-20 富士通株式会社 トラブル対処プログラム及びトラブル対処方法
JP5292322B2 (ja) * 2010-01-25 2013-09-18 日本電信電話株式会社 文書検索方法、文書検索装置、文書検索プログラム
JP5673336B2 (ja) * 2011-05-06 2015-02-18 株式会社Jvcケンウッド 情報処理方法、表示方法、情報処理装置、表示装置、情報処理プログラム、表示プログラム
JP2013206130A (ja) * 2012-03-28 2013-10-07 Fujitsu Ltd 検索装置、検索方法およびプログラム

Also Published As

Publication number Publication date
US20180039632A1 (en) 2018-02-08
WO2016178337A1 (ja) 2016-11-10
US10380125B2 (en) 2019-08-13

Similar Documents

Publication Publication Date Title
CN107818781B (zh) 智能交互方法、设备及存储介质
CN107832286B (zh) 智能交互方法、设备及存储介质
CN107609101B (zh) 智能交互方法、设备及存储介质
KR101878488B1 (ko) 대화 연관 컨텐츠 제공 방법 및 장치
JPWO2016178337A1 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
JP6570169B2 (ja) ユーザ対話システムと共にユーザ操作を支援する対話支援プログラム、サーバ及び方法
CN110770694B (zh) 获得来自多个语料库的响应信息
KR101309042B1 (ko) 다중 도메인 음성 대화 장치 및 이를 이용한 다중 도메인 음성 대화 방법
US20130246392A1 (en) Conversational System and Method of Searching for Information
US9484034B2 (en) Voice conversation support apparatus, voice conversation support method, and computer readable medium
US20120290561A1 (en) Information processing apparatus, information processing method, program, and information processing system
JP2015511746A5 (ja)
WO2012139475A1 (zh) 获取与输入按键序列相对应的候选字符串的方法与设备
JP7096172B2 (ja) キャラクタ性に応じた形容発話を含む対話シナリオを生成する装置、プログラム及び方法
KR20140109729A (ko) 의미기반 검색 시스템 및 이의 검색방법
JP6994289B2 (ja) キャラクタ属性に応じた対話シナリオを作成するプログラム、装置及び方法
JP2021114070A (ja) 情報検索装置、情報検索方法、および情報検索プログラム
JP6676698B2 (ja) 予約語及び属性言語間の関連度を用いた情報検索方法及び装置
US20230143777A1 (en) Semantics-aware hybrid encoder for improved related conversations
CN109284364B (zh) 一种用于语音连麦互动的互动词汇更新方法及装置
JP2022018724A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US11636271B2 (en) Dialogue apparatus, method and non-transitory computer readable medium
KR101188730B1 (ko) 검색 서버에서 수행되는 서제스트 검색어 제공 방법
CN112767923B (zh) 一种语音识别方法及装置
CN114036373B (zh) 搜索方法及装置、电子设备和存储介质

Legal Events

Date Code Title Description
A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A527

Effective date: 20161005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190129

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190129

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190208

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190214

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190222

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190515

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200310

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200616