JP6745127B2 - 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム - Google Patents
情報処理システム、サーバ、端末装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP6745127B2 JP6745127B2 JP2016068689A JP2016068689A JP6745127B2 JP 6745127 B2 JP6745127 B2 JP 6745127B2 JP 2016068689 A JP2016068689 A JP 2016068689A JP 2016068689 A JP2016068689 A JP 2016068689A JP 6745127 B2 JP6745127 B2 JP 6745127B2
- Authority
- JP
- Japan
- Prior art keywords
- question
- answer
- reliability
- specifying
- lod
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 51
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000011156 evaluation Methods 0.000 claims description 45
- 238000004364 calculation method Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 description 43
- 238000000034 method Methods 0.000 description 35
- 230000008569 process Effects 0.000 description 33
- 230000006870 function Effects 0.000 description 15
- 235000010724 Wisteria floribunda Nutrition 0.000 description 13
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
LODにおいては、エンティティ(主語)、プロパティ(述語)、リテラル(目的語)と呼ばれる3つの要素によって関係する要素が表現され、これらの関係づけられた要素はトリプルと呼ばれている。
そして、トリプルにおける1つの要素が質問として問われた場合に、LODが検索され、他の2つの要素から特定された要素が回答として提示される。
なお、LODに関連する技術は、例えば、非特許文献1に記載されている。
そのため、LODのデータベースは、要素として格納されているデータのリンク情報が不正である、リンク情報が欠落している、同一の要素に多くの異なる表現が存在する(同義語、表記の揺れ(漢字・かな・カタカナ・英字)、誤字・脱字等)、同名の要素の場合には識別のための付加文字が付される(「○○山(X県)」・「○○山(Y県)」等)という性質がある。
このように、LODのデータベースは情報の精度や検索機能が十分でないことから、質問に対する適切な回答を得ることが困難であった。
質問を入力する端末装置と、前記端末装置に入力された質問に対する回答を提示するサーバとが通信可能に構成された情報処理システムであって、
前記サーバは、
前記端末装置に入力されたユーザからの質問を取得する質問取得手段と、
前記質問取得手段によって取得された質問におけるLODに基づく要素を特定する要素特定手段と、
前記要素特定手段によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索手段と、
前記検索手段の検索結果における他の要素を拡張する要素拡張手段と、
前記検索手段の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出手段と、
前記信頼度算出手段によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定手段と、
を備えることを特徴とする。
[システム構成]
図1は、本発明に係る情報処理システム1のシステム構成を示す図である。
図1に示すように、本発明に係る情報処理システム1は、端末装置10と、サーバ20とを含んで構成され、端末装置10及びサーバ20は、ネットワーク30を介して互いに通信可能に構成されている。
本発明に係る情報処理システム1は、端末装置10から音声等により質問が入力されると、サーバ20において質問が解釈され、LODデータベース(LOD知識ベース)におけるデータを利用して回答の候補がスコア化される。このとき、サーバ20は、質問を構成する要素及びLODデータベースに含まれる要素を拡張し、LODデータベースに格納されているデータにおいて、質問が表す内容に関連する可能性があるデータを包括的に候補として取得し、これらを所定の方法でスコア化する。そして、各データのスコアに基づいて、質問に対する回答を特定する。
これにより、情報の精度や検索機能が十分でないLODのデータベースを参照して、質問に対するより適切な回答を得ることが可能となる。
次に、情報処理システム1を構成する各装置のハードウェア構成を説明する。
図2は、端末装置10のハードウェア構成を示す模式図である。
端末装置10は、スマートフォン、タブレット端末あるいはPC(Personal Computer)等の情報処理装置によって構成される。
図2に示すように、端末装置10は、CPU(Central Processing Unit)111と、ROM(Read Only Memory)112と、RAM(Random Access Memory)113と、バス114と、タッチ操作入力部115と、出力部116と、音声入力部117と、撮像部118と、センサ部119と、記憶部120と、通信部121と、ドライブ122と、を備えている。
RAM113には、CPU111が各種の処理を実行する上において必要なデータ等も適宜記憶される。
出力部116は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
即ち、本実施形態では、タッチ操作入力部115と出力部116のディスプレイとにより、タッチパネルが構成されている。
なお、音声のアナログ信号は、A/D(Analog/Digital)変換処理が施されて、音声データを表すデジタル信号に変換される。このA/D変換処理の実行主体は、特に限定されず、CPU111であってもよいし、図示しない専用のハードウェアであってもよいが、本実施形態では説明の便宜上、音声入力部117であるものとする。
即ち、本実施形態では、音声入力部117は、入力された音声に基づく音声データをCPU111等に出力する。
光学レンズ部は、被写体を撮影するために、光を集光するレンズ、例えばフォーカスレンズ等で構成される。なお、フォーカスレンズの他、焦点距離を一定の範囲で自在に変化させるズームレンズを光学レンズ部に備えることとしてもよい。
光学レンズ部にはまた、必要に応じて、焦点、露出、ホワイトバランス等の設定パラメータを調整する周辺回路が設けられる。
光電変換素子は、例えばCMOS(Complementary Metal Oxide Semiconductor)型の光電変換素子等から構成される。撮像素子は、一定時間毎に、その間に入射されて蓄積された被写体像の光信号を光電変換(撮像)して、その結果得られるアナログの電気信号をAFEに順次供給する。
AFEは、このアナログの電気信号に対して、A/D変換処理等の各種信号処理を実行する。各種信号処理によって、デジタル信号が生成され、撮像部118の出力信号として出力される。撮像部118の出力信号によって示される画像のデータを、以下、適宜「撮像画像データ」と呼ぶ。撮像画像データは、CPU111の指示に従って、RAM113あるいは記憶部120に記憶される。
記憶部120は、DRAM(Dynamic Random Access Memory)等の記憶装置で構成され、各種データを記憶する。
通信部121は、ネットワークを介して他の装置との間で行う通信を制御する。
ドライブ122には、必要に応じて、リムーバブルメディア131が適宜装着される。ドライブ122によってリムーバブルメディア131から読み出されたプログラムは、必要に応じて記憶部120にインストールされる。また、リムーバブルメディア131は、記憶部120に記憶されている各種データも、記憶部120と同様に記憶することができる。
サーバ20は、サーバコンピュータ等の情報処理装置によって構成される。
図3に示すように、サーバ20は、CPU211と、ROM212と、RAM213と、バス214と、入力部215と、出力部216と、記憶部217と、通信部218と、ドライブ219と、を備えている。
RAM213には、CPU211が各種の処理を実行する上において必要なデータ等も適宜記憶される。
出力部216は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
記憶部217は、ハードディスクあるいはDRAM等で構成され、各サーバで管理される各種データを記憶する。
通信部218は、ネットワークを介して他の装置との間で行う通信を制御する。
次に、情報処理システム1において実現される主な機能構成について説明する。
図4は、情報処理システム1において実現される主な機能構成を示すブロック図である。
また、図5は、情報処理システム1において、質問に対する回答が特定される処理(後述する回答提示処理)の概念を示す模式図である。
なお、本実施形態においては、エンティティ及びプロパティを含む質問が入力され、リテラルを回答として出力する場合を想定して説明する。ただし、エンティティまたはプロパティが回答となる質問が入力されるものとしてもよい。
以下、図5を適宜参照しつつ、図4に示す機能構成について説明する。
質問送信部152は、質問入力部151に入力されたユーザの質問をネットワーク30を介してサーバ20に送信する。
回答取得部153は、質問送信部152によって送信された質問の回答を、ネットワーク30を介してサーバ20から取得する。
回答出力部154は、回答取得部153によって取得された質問の回答を出力部116のディスプレイやスピーカから、文字列あるいは音声として出力する。
また、サーバ20の記憶部217には、LOD知識ベース271と、同義語・類義語辞書データベース(同義語・類義語辞書DB)272とが形成される。なお、サーバ20の記憶部217には、音声認識に関連する各種辞書等も適宜記憶することができる。
対話処理部253は、質問を行うユーザとの対話内容に基づいて、ユーザに対して応答する台詞を決定(対話処理)する。
質問取得部254は、端末装置10から送信され、音声認識処理部251によって文字情報とされた質問のデータを取得する。なお、端末装置10から文字情報による質問が送信された場合、質問取得部254は、通信部218を介して受信した当該質問のデータを取得する。
このように質問属性特定部255によって特定されたトリプルの要素は、質問のエンティティ、プロパティ及びリテラルのいずれか1つ(質問対象)を除く2つの要素に分類される。本実施形態においては、特定された2つの要素を同時に検索条件としてLOD知識ベース271を検索するのではなく、これらのうちの1つ(ここではエンティティとする)をキーとして検索が開始される。即ち、回答提示処理では、質問におけるエンティティを特定し、特定されたエンティティをキーとして、LOD知識ベース271において、質問のエンティティと同一または関連するエンティティに該当するトリプルが抽出されることとなる。
これにより、質問における各要素の候補として、質問を構成すると推定される多様な単語が特定されることとなる。例えば、質問の中に「ハシ」という単語が含まれる場合、「箸」及び「橋」の両方をトリプルの要素の候補とすること等ができる。そのため、質問として入力された音声が表す可能性のある内容を広く対象として、回答提示処理が行われる。
具体的には、要素拡張部257は、質問における各要素に対応するLOD知識ベース271の要素について、表現のバリエーション(言い換え表現)を取得する。このとき、要素拡張部257は、同義語・類義語辞書DB272を参照して、LOD知識ベース271の要素と同義または類義の単語を取得することができる。また、要素拡張部257は、LOD知識ベース271において言い換え表現や関連する項目としてリンクされている単語を取得することができる。本実施形態において、要素拡張部257は、候補特定部256によって特定された要素のうちの1つ(ここではエンティティとする)をキーとして、LOD知識ベース271を検索する。そして、要素拡張部257は、LOD知識ベース271において、キーとなる要素と同一または関連する要素に該当するトリプルを抽出し、抽出したトリプルに含まれる他の要素について、表現のバリエーション(言い換え表現)を取得する。
また、例えば、図5のプロパティの項目に示すように、LOD知識ベース271に記憶されている「富士山_静岡県」というエンティティに対して、「height」という単語がプロパティとして対応付けられている場合、同義語・類義語辞書を参照して、「height」という単語(拡張元の単語)と実質的に同意または関連性が高いと考えられる単語(拡張された単語)が取得される。具体的には、「height」という単語の同義語または類義語として、同義語・類義語辞書から「標高」及び「身長」という単語が取得される。なお、図5において、LOD知識ベース271のプロパティにおける単語に続く数値は、拡張元の単語との類似度を示し、それに続く数値は、質問のプロパティの単語(「高さ」)との類似度を示している。また、このように拡張されたプロパティに対しては、拡張の元となる「height」と同一のリテラル「3776m」が設定される。
これにより、LOD知識ベース271におけるエンティティやプロパティ等の要素を、同義語・類義語、あるいは、言い換え表現や関連する項目に拡張した状態(拡張されたLOD知識ベース271)を形成することができる。
具体的には、信頼度算出部258は、質問における各要素について、以下のように信頼度を算出する。
ただし、
評価項目A:当該単語の検索頻度(ユーザ個人における検索履歴ベースの検索頻度または一般ユーザ全体の検索履歴における検索頻度)から算出される評価
評価項目B:トレンド(インターネット等における検索のトレンド情報)を利用した評価
評価項目C:音声認識処理における音声認識スコアを利用した評価
評価項目D:質問における要素の特定時の属性スコアを利用した評価
なお、図5に示す例では、質問における要素はエンティティ(「富士山」)及びプロパティ(「高さ」)であり、それぞれの要素について算出された信頼度の積が質問の信頼度となる。
ただし、
評価項目E:質問の要素(エンティティ)の文字列とLODの要素(エンティティ)の文字列の一致度(完全一致の場合は最大値1)
評価項目F:LODに定義されているリンクの辿り着きやすさ
なお、評価項目Fにおけるリンクの辿り着きやすさは、LODにおいて、曖昧さ回避等の目的により、特定の単語から他の単語へのリンクが定義されることがあり、そのリンクの階層によって定義することができる。ただし、このようなリンクが定義されておらず、直接的に当該単語に辿り着ける場合には、最大値1を設定することができる。
ただし、
評価項目G1:オリジナルのLODのプロパティと、上位語・下位語の概念を利用した類義語拡張後のLODのプロパティとの類似度
評価項目H1:オリジナルのLODのプロパティと、単語ベクトルを利用した類義語拡張後のLODのプロパティとの類似度
評価項目I1:オリジナルのLODのプロパティと、類義語拡張後のLODのプロパティの文字列の類似度
(4)LODのプロパティの信頼度2=(評価項目G2の結果)×重みWg2+(評価項目H2の結果)×重みWh2+(評価項目I2の結果)×重みWi2
ただし、
評価項目G2:質問のプロパティと、上位語・下位語の概念を利用した類義語拡張後のLODのプロパティとの類似度
評価項目H2:質問のプロパティと、単語ベクトルを利用した類義語拡張後のLODのプロパティとの類似度
評価項目I2:質問のプロパティと、類義語拡張後のLODのプロパティの文字列の類似度
したがって、LODのプロパティの信頼度は以下のようになる。
LODのプロパティの信頼度=LODのプロパティの信頼度1×LODのプロパティの信頼度2
また、評価項目H1,H2は、単語ベクトルを利用した類似度が定義されたデータベースを利用して算出することができる。例えば、評価項目H1,H2の結果は、情報処理システム1が独自に保有するデータベースや、一般に利用が解放されている民間あるいは行政によるデータベースを利用して取得すること等が可能である。このとき用いられるデータベースは、日本語コーパスを利用し、単語ベクトル化技術(Word2Vec等)によって単語類似度を測り、その結果をデータベース化したものである。
即ち、リテラルの結果の信頼度は、質問のエンティティの信頼度、質問のプロパティの信頼度、LODのエンティティの信頼度及びLODのプロパティの信頼度を総合したスコアを示している。
次に、情報処理システム1の動作を説明する。
[回答提示処理]
図6は、情報処理システム1のサーバ20が実行する回答提示処理の流れを示すフローチャートである。
回答提示処理は、端末装置10から質問が送信された場合に、LOD知識ベース271を利用して回答を自動的に特定し、特定した回答を端末装置10に提示する処理である。
なお、回答提示処理は、回答提示処理の実行が指示入力されることにより開始され、回答提示処理の終了が指示入力されるまで、繰り返し実行される。
ステップS2において、質問取得部254は、端末装置10から送信され、音声認識処理部251によって文字情報とされた質問のデータを取得する。
ステップS5において、要素拡張部257は、LOD知識ベース271を検索することにより、候補特定部256によって特定された各要素(質問におけるトリプルの各要素)に対応するLOD知識ベース271の要素を、当該要素と実質的に同意または関連性が高いと考えられる単語に拡張する。このとき、要素拡張部257は、同義語・類義語辞書DB272を参照して、LOD知識ベース271の要素と同義または類義の単語を取得することができる。また、要素拡張部257は、LOD知識ベース271において言い換え表現や関連する項目としてリンクされている単語を取得することができる。これにより、LOD知識ベース271におけるエンティティやプロパティ等の要素を、同義語・類義語、あるいは、言い換え表現や関連する項目に拡張した状態を形成することができる。
ステップS7において、回答特定部259は、信頼度算出部258によって算出されたリテラルの結果の信頼度に基づいて、質問に対する回答を特定する。例えば、図5に示すように、「富士山の高さは?」という質問に対して、エントリ「富士山_静岡県」及びプロパティ「標高」のリテラルである「3776m」が最もスコアの高い回答として特定される。
ステップS9において、音声合成処理部252は、対話処理部253によって決定された台詞に基づいて、音声を合成(音声合成処理)する。例えば、図5に示すように、リテラル「3776m」を回答する台詞が音声として合成される。このようにして合成された回答を提示する台詞は、ネットワーク30を介して端末装置10に送信される。
提示した回答が適切でない場合、ステップS10においてNOと判定されて、処理はステップS7に移行する。
一方、提示した回答が適切である場合、ステップS10においてYESと判定されて、回答提示処理が繰り返される。
これにより、情報の精度や検索機能が十分でないLODのデータベースを参照して、質問に対するより適切な回答を得ることが可能となる。
上述の実施形態において、信頼度算出部258が各種信頼度を算出する場合の重みは、予め設定された固定値とすることに加え、提示した回答の精度をフィードバックする(図6におけるステップS10の処理結果をフィードバックする等)ことにより機械学習して自動調整することが可能である。
例えば、回答として提示したリテラルの結果の信頼度が0.8であり、この回答が正解であった場合に、質問における要素の信頼度、LODのエンティティの信頼度及びLODのプロパティの信頼度を算出するために用いた各評価項目の結果のうち、0.8より高い評価結果を出した評価項目の重みを所定値高め(例えば0.1高め)、0.8より低い評価結果を出した評価項目の重みを所定値低くする(例えば0.1低くする)と言ったことが可能である。
これにより、回答として提示した結果の正否に応じて、次に回答を特定する際のスコアの算出方法を補正することができ、より精度の高い回答を提示することが可能となる。
上述の実施形態において、提示した回答の精度をフィードバックする(図6におけるステップS10の処理結果をフィードバックする等)ことにより、回答として提示したエンティティ、プロパティあるいはリテラルの適否を機械学習して自動判定することが可能である。
例えば、回答特定部259が、回答として提示したエンティティ、プロパティあるいはリテラルが正解でない場合に評価値を加算すると共に、正解である場合には評価値を減算していき、評価値が閾値を超えたエンティティ、プロパティあるいはリテラルについては、ブラックリストに登録して、以降、要素拡張部257によるLOD知識ベース271の検索範囲から除外することにより、回答の提示に使用しないことが可能である。
即ち、ブラックリストに登録されたエンティティ、プロパティあるいはリテラルについては、回答を提示する際に検索範囲から除外し、回答に使用しないものとする。
LODの中には、質問の回答には必ずしも必要ない単語(ページの作成日時等)が含まれているところ、このような処理を行うことにより、不適切な単語が回答を提示する際の検索範囲から自動的に除外され、不要な処理が行われることを抑制できる。
質問取得部254は、端末装置に入力されたユーザからの質問を取得する。
質問属性特定部255は、質問取得部254によって取得された質問におけるLODに基づく要素を特定する。
要素拡張部257は、質問属性特定部255によって特定された要素の1つに基づいて、LODデータベースを検索する。
要素拡張部257は、検索結果における他の要素を拡張する。
信頼度算出部258は、要素拡張部257の検索結果に含まれる要素及び拡張された他の要素について、当該要素それぞれの信頼度を算出する。
回答特定部259は、信頼度算出部258によって算出された信頼度に基づいて、前記質問に対する回答を特定する。
これにより、LODデータベースに含まれる要素を拡張し、LODデータベースに格納されているデータにおいて、質問が表す内容に関連する可能性があるデータを包括的に検索することができる。
したがって、情報の精度や検索機能が十分でないLODのデータベースを参照して、質問に対するより適切な回答を得ることが可能となる。
これにより、複数の要素を条件として検索する場合に比べ、より広い対象を索出することができる。
これにより、質問が表す可能性のある内容を広く対象として、回答の検索を行うことができる。
これにより、質問における他の要素の同意語及び類義語の範囲に拡張された対象を基に、回答の検索を行うことができる。
これにより、拡張された要素の信頼度をより適切に算出することができる。
信頼度算出部258は、音声認識において算出されたスコアを用いて、質問の要素の信頼度を算出する。
これにより、音声認識において質問として認識される可能性が一定以上の高さであった内容を対象として、回答の検索を行うことができる。
これにより、表現のゆれがより少ないエンティティを用いて、より適確なデータを検索することができる。
これにより、回答として提示した結果の正否に応じて、次に回答を特定する際のスコアの算出方法を補正することができ、より精度の高い回答を提示することが可能となる。
これにより、不適切な要素が回答を提示する際の検索範囲から自動的に除外され、不要な処理が行われることを抑制できる。
例えば、上述の実施形態において、サーバ20の構成は一例として示したものであり、情報処理システム1全体として、サーバ20の機能が備えられていれば、サーバ20の機能を複数のサーバに分割して実装したり、端末装置10にサーバ20の機能の一部を実装したりすることができる。
即ち、上述の実施形態において、LOD知識ベース271をサーバ20が備える構成を例に挙げて説明したが、LOD知識ベース271を他のサーバが備えることとしてもよい。
また、上述の実施形態において、音声認識処理部251あるいは回答特定部259等のサーバ20の機能の一部を端末装置10に実装することとしてもよい。
また、上述の実施形態及び変形例を適宜組み合わせた構成とすることとしてもよい。
換言すると、図2の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が情報処理システム1に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図2の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。
Claims (14)
- 質問を入力する端末装置と、前記端末装置に入力された質問に対する回答を提示するサーバとが通信可能に構成された情報処理システムであって、
前記サーバは、
前記端末装置に入力されたユーザからの質問を取得する質問取得手段と、
前記質問取得手段によって取得された質問におけるLODに基づく要素を特定する要素特定手段と、
前記要素特定手段によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索手段と、
前記検索手段の検索結果における他の要素を拡張する要素拡張手段と、
前記検索手段の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出手段と、
前記信頼度算出手段によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定手段と、
を備え、
前記信頼度算出手段は、前記回答特定手段によって特定された回答の正否に基づいて、前記要素それぞれの信頼度を算出する際に用いるパラメータを補正することを特徴とする情報処理システム。 - 質問を入力する端末装置と、前記端末装置に入力された質問に対する回答を提示するサーバとが通信可能に構成された情報処理システムであって、
前記サーバは、
前記端末装置に入力されたユーザからの質問を取得する質問取得手段と、
前記質問取得手段によって取得された質問におけるLODに基づく要素を特定する要素特定手段と、
前記要素特定手段によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索手段と、
前記検索手段の検索結果における他の要素を拡張する要素拡張手段と、
前記検索手段の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出手段と、
前記信頼度算出手段によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定手段と、
を備え、
前記検索手段は、前記回答特定手段によって特定された回答に含まれる前記要素それぞれについて、当該回答の正否に基づいて算出される評価値が予め設定された条件に合致した場合に、当該要素を前記LODデータベースにおける検索範囲から除外することを特徴とする情報処理システム。 - 前記検索手段は、前記要素の1つと同一または関連する要素を前記LODデータベースにおいて検索することを特徴とする請求項1または2に記載の情報処理システム。
- 前記要素特定手段は、質問におけるLODに基づく要素を拡張して特定することを特徴とする請求項1から3のいずれか1項に記載の情報処理システム。
- 前記要素拡張手段は、前記他の要素の同意語及び類義語の少なくともいずれかに拡張することを特徴とする請求項1から4のいずれか1項に記載の情報処理システム。
- 前記信頼度算出手段は、前記他の要素と、当該他の要素から拡張された要素との類似度に基づいて、当該他の要素から拡張された要素の信頼度を算出することを特徴とする請求項1から5のいずれか1項に記載の情報処理システム。
- 前記質問は音声によって入力され、音声認識によって文字情報とされたものであり、
前記信頼度算出手段は、前記音声認識において算出されたスコアを用いて、前記質問の要素の信頼度を算出することを特徴とする請求項1から6のいずれか1項に記載の情報処理システム。 - 前記検索手段は、質問におけるLODに基づく要素のうち、エンティティを優先して前記LODデータベースを検索することを特徴とする請求項1から7のいずれか1項に記載の情報処理システム。
- 質問を入力する端末装置と、前記端末装置に入力された質問に対する回答を提示するサーバとが通信可能に構成された情報処理システムにおけるサーバであって、
前記端末装置に入力されたユーザからの質問を取得する質問取得手段と、
前記質問取得手段によって取得された質問におけるLODに基づく要素を特定する要素特定手段と、
前記要素特定手段によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索手段と、
前記検索手段の検索結果における他の要素を拡張する要素拡張手段と、
前記検索手段の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出手段と、
前記信頼度算出手段によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定手段と、
を備え、
前記信頼度算出手段は、前記回答特定手段によって特定された回答の正否に基づいて、前記要素それぞれの信頼度を算出する際に用いるパラメータを補正することを特徴とするサーバ。 - 質問を入力する端末装置と、前記端末装置に入力された質問に対する回答を提示するサーバとが通信可能に構成された情報処理システムにおけるサーバであって、
前記端末装置に入力されたユーザからの質問を取得する質問取得手段と、
前記質問取得手段によって取得された質問におけるLODに基づく要素を特定する要素特定手段と、
前記要素特定手段によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索手段と、
前記検索手段の検索結果における他の要素を拡張する要素拡張手段と、
前記検索手段の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出手段と、
前記信頼度算出手段によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定手段と、
を備え、
前記検索手段は、前記回答特定手段によって特定された回答に含まれる前記要素それぞれについて、当該回答の正否に基づいて算出される評価値が予め設定された条件に合致した場合に、当該要素を前記LODデータベースにおける検索範囲から除外することを特徴とするサーバ。 - 情報処理装置が実行する情報処理方法であって、
入力されたユーザからの質問を取得する質問取得ステップと、
前記質問取得ステップにおいて取得された質問におけるLODに基づく要素を特定する要素特定ステップと、
前記要素特定ステップにおいて特定された前記要素の1つに基づいて、LODデータベースを検索する検索ステップと、
前記検索ステップの検索結果における他の要素を拡張する要素拡張ステップと、
前記検索ステップの検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出ステップと、
前記信頼度算出ステップにおいて算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定ステップと、
を含み、
前記信頼度算出ステップでは、前記回答特定ステップにおいて特定された回答の正否に基づいて、前記要素それぞれの信頼度を算出する際に用いるパラメータを補正することを特徴とする情報処理方法。 - 情報処理装置が実行する情報処理方法であって、
入力されたユーザからの質問を取得する質問取得ステップと、
前記質問取得ステップにおいて取得された質問におけるLODに基づく要素を特定する要素特定ステップと、
前記要素特定ステップにおいて特定された前記要素の1つに基づいて、LODデータベースを検索する検索ステップと、
前記検索ステップの検索結果における他の要素を拡張する要素拡張ステップと、
前記検索ステップの検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出ステップと、
前記信頼度算出ステップにおいて算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定ステップと、
を含み、
前記検索ステップでは、前記回答特定ステップにおいて特定された回答に含まれる前記要素それぞれについて、当該回答の正否に基づいて算出される評価値が予め設定された条件に合致した場合に、当該要素を前記LODデータベースにおける検索範囲から除外することを特徴とする情報処理方法。 - コンピュータに、
入力されたユーザからの質問を取得する質問取得機能と、
前記質問取得機能によって取得された質問におけるLODに基づく要素を特定する要素特定機能と、
前記要素特定機能によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索機能と、
前記検索機能の検索結果における他の要素を拡張する要素拡張機能と、
前記検索機能の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出機能と、
前記信頼度算出機能によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定機能と、
を実現させ、
前記信頼度算出機能は、前記回答特定機能によって特定された回答の正否に基づいて、前記要素それぞれの信頼度を算出する際に用いるパラメータを補正することを特徴とするプログラム。 - コンピュータに、
入力されたユーザからの質問を取得する質問取得機能と、
前記質問取得機能によって取得された質問におけるLODに基づく要素を特定する要素特定機能と、
前記要素特定機能によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索機能と、
前記検索機能の検索結果における他の要素を拡張する要素拡張機能と、
前記検索機能の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出機能と、
前記信頼度算出機能によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定機能と、
を実現させ、
前記検索機能は、前記回答特定機能によって特定された回答に含まれる前記要素それぞれについて、当該回答の正否に基づいて算出される評価値が予め設定された条件に合致した場合に、当該要素を前記LODデータベースにおける検索範囲から除外することを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016068689A JP6745127B2 (ja) | 2016-03-30 | 2016-03-30 | 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016068689A JP6745127B2 (ja) | 2016-03-30 | 2016-03-30 | 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017182457A JP2017182457A (ja) | 2017-10-05 |
JP6745127B2 true JP6745127B2 (ja) | 2020-08-26 |
Family
ID=60008488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016068689A Active JP6745127B2 (ja) | 2016-03-30 | 2016-03-30 | 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6745127B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7258047B2 (ja) * | 2018-05-09 | 2023-04-14 | オラクル・インターナショナル・コーポレイション | 収束質問に対する回答を改善するための仮想談話ツリーの構築 |
CN111241380B (zh) * | 2018-11-28 | 2023-10-03 | 富士通株式会社 | 用于生成推荐的方法和设备 |
CN109657129B (zh) * | 2018-12-26 | 2023-04-18 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN109783631B (zh) * | 2019-02-02 | 2022-05-17 | 北京百度网讯科技有限公司 | 社区问答数据的校验方法、装置、计算机设备和存储介质 |
CN112862409A (zh) * | 2021-03-10 | 2021-05-28 | 中国工商银行股份有限公司 | 提运单核验方法及装置 |
CN118349660B (zh) * | 2024-06-14 | 2024-08-27 | 长江水利委员会网络与信息中心 | 一种涉水法律法规的知识问答方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004246824A (ja) * | 2003-02-17 | 2004-09-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声ドキュメント検索方法及び装置及び音声ドキュメント検索プログラム |
JP3856388B2 (ja) * | 2003-04-15 | 2006-12-13 | 独立行政法人産業技術総合研究所 | 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体 |
GB201210234D0 (en) * | 2012-06-12 | 2012-07-25 | Fujitsu Ltd | Reconciliation of large graph-based data storage |
-
2016
- 2016-03-30 JP JP2016068689A patent/JP6745127B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017182457A (ja) | 2017-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6745127B2 (ja) | 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム | |
CN109933785B (zh) | 用于实体关联的方法、装置、设备和介质 | |
CN113906433A (zh) | 澄清问题以用于重写有歧义的用户话语 | |
JP2020191075A (ja) | Web APIおよび関連エンドポイントの推薦 | |
US20180285744A1 (en) | System and method for generating multimedia knowledge base | |
KR102688236B1 (ko) | 인공 지능을 이용한 음성 합성 장치, 음성 합성 장치의 동작 방법 및 컴퓨터로 판독 가능한 기록 매체 | |
KR20090068380A (ko) | 개선된 이동 통신 단말 | |
JP6558863B2 (ja) | モデル作成装置、推定装置、方法、及びプログラム | |
US20150104065A1 (en) | Apparatus and method for recognizing object in image | |
CN114981885A (zh) | 用于自动语音识别的字母数字序列偏置 | |
KR20200095947A (ko) | 전자 장치 및 이의 제어 방법 | |
JPWO2018061839A1 (ja) | 送信装置、送信方法及び送信プログラム | |
JP2015104078A (ja) | 撮像装置、撮像システム、サーバ、撮像方法、及び撮像プログラム | |
JP5484113B2 (ja) | 文書画像関連情報提供装置、及び文書画像関連情報取得システム | |
JP2017182646A (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP6427807B2 (ja) | 物体認証装置および物体認証方法 | |
JP2017191357A (ja) | 単語判定装置 | |
KR100949353B1 (ko) | 언어 장애인용 대화 보조 장치 | |
US20240126993A1 (en) | Transformer-based text encoder for passage retrieval | |
JP6107003B2 (ja) | 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム | |
CN113539235B (zh) | 文本分析与语音合成方法、装置、系统及存储介质 | |
US20230117535A1 (en) | Method and system for device feature analysis to improve user experience | |
KR102642617B1 (ko) | 인공 지능을 이용한 음성 합성 장치, 음성 합성 장치의 동작 방법 및 컴퓨터로 판독 가능한 기록 매체 | |
Alam et al. | Exploring Sign Language Detection on Smartphones: A Systematic Review of Machine and Deep Learning Approaches | |
JP6082085B1 (ja) | ジャンル推定サーバ、ジャンル推定方法、およびジャンル推定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200326 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200721 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200803 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6745127 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |