JP6745127B2 - 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム - Google Patents

情報処理システム、サーバ、端末装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP6745127B2
JP6745127B2 JP2016068689A JP2016068689A JP6745127B2 JP 6745127 B2 JP6745127 B2 JP 6745127B2 JP 2016068689 A JP2016068689 A JP 2016068689A JP 2016068689 A JP2016068689 A JP 2016068689A JP 6745127 B2 JP6745127 B2 JP 6745127B2
Authority
JP
Japan
Prior art keywords
question
answer
reliability
specifying
lod
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016068689A
Other languages
English (en)
Other versions
JP2017182457A (ja
Inventor
沈宇 張
沈宇 張
瑞樹 横山
瑞樹 横山
淳志 佐々木
淳志 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced Media Inc
Original Assignee
Advanced Media Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Media Inc filed Critical Advanced Media Inc
Priority to JP2016068689A priority Critical patent/JP6745127B2/ja
Publication of JP2017182457A publication Critical patent/JP2017182457A/ja
Application granted granted Critical
Publication of JP6745127B2 publication Critical patent/JP6745127B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理システム、サーバ、端末装置、情報処理方法及びプログラムに関する。
近年、自動応答等を行う人工知能において、知識を自動的に収集(獲得)するために、構造化されたオープンな知識データ(LOD:Linked Open Data)が利用されている。
LODにおいては、エンティティ(主語)、プロパティ(述語)、リテラル(目的語)と呼ばれる3つの要素によって関係する要素が表現され、これらの関係づけられた要素はトリプルと呼ばれている。
そして、トリプルにおける1つの要素が質問として問われた場合に、LODが検索され、他の2つの要素から特定された要素が回答として提示される。
なお、LODに関連する技術は、例えば、非特許文献1に記載されている。
「次世代のインターネットがすぐそこに!LODが描く"データの未来図"」、[online]、2014年1月10日、FUJITSU JOURNAL、[2016年3月25日検索]、インターネット<URL:http://journal.jp.fujitsu.com/2014/01/10/01/>
しかしながら、LODのデータベースは、機械抽出によって他のデータベースから自動的にデータを取得して構築したり、ボランティアベースで人手によりデータを入力して構築したりするものである。
そのため、LODのデータベースは、要素として格納されているデータのリンク情報が不正である、リンク情報が欠落している、同一の要素に多くの異なる表現が存在する(同義語、表記の揺れ(漢字・かな・カタカナ・英字)、誤字・脱字等)、同名の要素の場合には識別のための付加文字が付される(「○○山(X県)」・「○○山(Y県)」等)という性質がある。
このように、LODのデータベースは情報の精度や検索機能が十分でないことから、質問に対する適切な回答を得ることが困難であった。
本発明は、LODを利用して、質問に対するより適切な回答を得ることを目的とする。
上記目的を達成するため、本発明の一態様の情報処理システムは、
質問を入力する端末装置と、前記端末装置に入力された質問に対する回答を提示するサーバとが通信可能に構成された情報処理システムであって、
前記サーバは、
前記端末装置に入力されたユーザからの質問を取得する質問取得手段と、
前記質問取得手段によって取得された質問におけるLODに基づく要素を特定する要素特定手段と、
前記要素特定手段によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索手段と、
前記検索手段の検索結果における他の要素を拡張する要素拡張手段と、
前記検索手段の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出手段と、
前記信頼度算出手段によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定手段と、
を備えることを特徴とする。
本発明によれば、LODを利用して、質問に対するより適切な回答を得ることが可能となる。
本発明に係る情報処理システムのシステム構成を示す図である。 端末装置のハードウェア構成を示す模式図である。 サーバのハードウェア構成を示す模式図である。 情報処理システムにおいて実現される主な機能構成を示すブロック図である。 情報処理システムにおいて、質問に対する回答が特定される処理(回答提示処理)の概念を示す模式図である。 情報処理システムのサーバが実行する回答提示処理の流れを示すフローチャートである。
以下、本発明の実施形態について、図面を用いて説明する。
[構成]
[システム構成]
図1は、本発明に係る情報処理システム1のシステム構成を示す図である。
図1に示すように、本発明に係る情報処理システム1は、端末装置10と、サーバ20とを含んで構成され、端末装置10及びサーバ20は、ネットワーク30を介して互いに通信可能に構成されている。
本発明に係る情報処理システム1は、端末装置10から音声等により質問が入力されると、サーバ20において質問が解釈され、LODデータベース(LOD知識ベース)におけるデータを利用して回答の候補がスコア化される。このとき、サーバ20は、質問を構成する要素及びLODデータベースに含まれる要素を拡張し、LODデータベースに格納されているデータにおいて、質問が表す内容に関連する可能性があるデータを包括的に候補として取得し、これらを所定の方法でスコア化する。そして、各データのスコアに基づいて、質問に対する回答を特定する。
これにより、情報の精度や検索機能が十分でないLODのデータベースを参照して、質問に対するより適切な回答を得ることが可能となる。
[ハードウェア構成]
次に、情報処理システム1を構成する各装置のハードウェア構成を説明する。
図2は、端末装置10のハードウェア構成を示す模式図である。
端末装置10は、スマートフォン、タブレット端末あるいはPC(Personal Computer)等の情報処理装置によって構成される。
図2に示すように、端末装置10は、CPU(Central Processing Unit)111と、ROM(Read Only Memory)112と、RAM(Random Access Memory)113と、バス114と、タッチ操作入力部115と、出力部116と、音声入力部117と、撮像部118と、センサ部119と、記憶部120と、通信部121と、ドライブ122と、を備えている。
CPU111は、ROM112に記録されているプログラム、または、記憶部120からRAM113にロードされたプログラムに従って各種の処理(端末装置10の機能を実現するための処理)を実行する。
RAM113には、CPU111が各種の処理を実行する上において必要なデータ等も適宜記憶される。
CPU111、ROM112及びRAM113は、バス114を介して相互に接続されている。バス114には、タッチ操作入力部115、出力部116、音声入力部117、撮像部118、センサ部119、記憶部120、通信部121及びドライブ122が接続されている。
タッチ操作入力部115は、例えば出力部116の表示領域に積層される静電容量式または抵抗膜式の位置入力センサにより構成され、タッチ操作がなされた位置の座標を検出する。ここで、タッチ操作とは、タッチ操作入力部115に対する物体(ユーザの指やタッチペン等)の接触または近接の操作をいう。
出力部116は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
即ち、本実施形態では、タッチ操作入力部115と出力部116のディスプレイとにより、タッチパネルが構成されている。
音声入力部117は、例えばマイクロフォンにより構成され、入力された音声をアナログ電気信号に変換する。音声入力部117を構成するマイクロフォンとしては、端末装置10の内蔵マイクロフォンとすることや、ノイズの多い状況においても特定の発話者の音声をより高音質で集音できる身体装着型のマイクロフォンとすること等が可能である。
なお、音声のアナログ信号は、A/D(Analog/Digital)変換処理が施されて、音声データを表すデジタル信号に変換される。このA/D変換処理の実行主体は、特に限定されず、CPU111であってもよいし、図示しない専用のハードウェアであってもよいが、本実施形態では説明の便宜上、音声入力部117であるものとする。
即ち、本実施形態では、音声入力部117は、入力された音声に基づく音声データをCPU111等に出力する。
撮像部118は、図示はしないが、光学レンズ部と、イメージセンサと、を備えている。
光学レンズ部は、被写体を撮影するために、光を集光するレンズ、例えばフォーカスレンズ等で構成される。なお、フォーカスレンズの他、焦点距離を一定の範囲で自在に変化させるズームレンズを光学レンズ部に備えることとしてもよい。
光学レンズ部にはまた、必要に応じて、焦点、露出、ホワイトバランス等の設定パラメータを調整する周辺回路が設けられる。
イメージセンサは、光電変換素子や、AFE(Analog Front End)等から構成される。
光電変換素子は、例えばCMOS(Complementary Metal Oxide Semiconductor)型の光電変換素子等から構成される。撮像素子は、一定時間毎に、その間に入射されて蓄積された被写体像の光信号を光電変換(撮像)して、その結果得られるアナログの電気信号をAFEに順次供給する。
AFEは、このアナログの電気信号に対して、A/D変換処理等の各種信号処理を実行する。各種信号処理によって、デジタル信号が生成され、撮像部118の出力信号として出力される。撮像部118の出力信号によって示される画像のデータを、以下、適宜「撮像画像データ」と呼ぶ。撮像画像データは、CPU111の指示に従って、RAM113あるいは記憶部120に記憶される。
センサ部119は、端末装置10における3軸方向の加速度を検出する3軸加速度センサ、端末装置10における3軸方向の角速度を検出するジャイロセンサ、端末装置10の位置を検出する位置センサ(例えばGPS受信機)あるいは地磁気を検出する地磁気センサ等の各種センサを備えている。センサ部119の検出信号は、CPU111等に出力される。
記憶部120は、DRAM(Dynamic Random Access Memory)等の記憶装置で構成され、各種データを記憶する。
通信部121は、ネットワークを介して他の装置との間で行う通信を制御する。
ドライブ122には、必要に応じて、リムーバブルメディア131が適宜装着される。ドライブ122によってリムーバブルメディア131から読み出されたプログラムは、必要に応じて記憶部120にインストールされる。また、リムーバブルメディア131は、記憶部120に記憶されている各種データも、記憶部120と同様に記憶することができる。
図3は、サーバ20のハードウェア構成を示す模式図である。
サーバ20は、サーバコンピュータ等の情報処理装置によって構成される。
図3に示すように、サーバ20は、CPU211と、ROM212と、RAM213と、バス214と、入力部215と、出力部216と、記憶部217と、通信部218と、ドライブ219と、を備えている。
CPU211は、ROM212に記録されているプログラム、または、記憶部217からRAM213にロードされたプログラムに従って各種の処理(サーバ20の機能を実現するための処理)を実行する。
RAM213には、CPU211が各種の処理を実行する上において必要なデータ等も適宜記憶される。
CPU211、ROM212及びRAM213は、バス214を介して相互に接続されている。バス214には、入力部215、出力部216、記憶部217、通信部218及びドライブ219が接続されている。
入力部215は、各種釦等で構成され、指示操作に応じて各種情報を入力する。
出力部216は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
記憶部217は、ハードディスクあるいはDRAM等で構成され、各サーバで管理される各種データを記憶する。
通信部218は、ネットワークを介して他の装置との間で行う通信を制御する。
ドライブ219には、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリ等よりなる、リムーバブルメディア231が適宜装着される。ドライブ219によってリムーバブルメディア231から読み出されたプログラムは、必要に応じて記憶部217にインストールされる。
[機能的構成]
次に、情報処理システム1において実現される主な機能構成について説明する。
図4は、情報処理システム1において実現される主な機能構成を示すブロック図である。
また、図5は、情報処理システム1において、質問に対する回答が特定される処理(後述する回答提示処理)の概念を示す模式図である。
なお、本実施形態においては、エンティティ及びプロパティを含む質問が入力され、リテラルを回答として出力する場合を想定して説明する。ただし、エンティティまたはプロパティが回答となる質問が入力されるものとしてもよい。
以下、図5を適宜参照しつつ、図4に示す機能構成について説明する。
図4に示すように、情報処理システム1は、端末装置10のCPU111において、質問入力部151と、質問送信部152と、回答取得部153と、回答出力部154とが機能する。
質問入力部151は、ユーザによる質問の入力を受け付ける。本実施形態において、質問入力部151は、音声及び文字入力による質問の入力を受け付けることが可能である。
質問送信部152は、質問入力部151に入力されたユーザの質問をネットワーク30を介してサーバ20に送信する。
回答取得部153は、質問送信部152によって送信された質問の回答を、ネットワーク30を介してサーバ20から取得する。
回答出力部154は、回答取得部153によって取得された質問の回答を出力部116のディスプレイやスピーカから、文字列あるいは音声として出力する。
また、情報処理システム1は、サーバ20のCPU211において、音声認識処理部251と、音声合成処理部252と、対話処理部253と、質問取得部254と、質問属性特定部255と、候補特定部256と、要素拡張部257と、信頼度算出部258と、回答特定部259とが機能する。
また、サーバ20の記憶部217には、LOD知識ベース271と、同義語・類義語辞書データベース(同義語・類義語辞書DB)272とが形成される。なお、サーバ20の記憶部217には、音声認識に関連する各種辞書等も適宜記憶することができる。
LOD知識ベース271には、構造化されたオープンな知識データが記憶されている。なお、LOD知識ベース271としては、情報処理システム1が独自のデータベースとして保有することや、一般に利用が解放されている民間あるいは行政によるデータベースを利用すること等が可能である。
同義語・類義語辞書DB272には、種々の単語と、その同義語及び類義語が対応付けて記憶されている。なお、同義語・類義語辞書DB272としては、情報処理システム1が独自のデータベースとして保有することや、汎用の同義語辞書あるいは類義語辞書のデータベースを利用すること等が可能である。
音声認識処理部251は、端末装置10から音声として送信された質問を音声認識処理し、文字情報に変換する。このとき、音声認識処理部251は、音響モデル、言語モデル及び発音辞書を参照して質問の音声を分析し、質問の音声を、意味を有する単語に変換する。なお、音声認識処理においては、質問の音声をいずれの単語に変換するか決定する上で、候補となる単語のスコア(以下、「音声認識スコア」と呼ぶ。)が算出され、この音声認識スコアに基づいて、可能性の高い単語が選択される。
音声合成処理部252は、対話処理部253によって決定された台詞に基づいて、音声を合成(音声合成処理)する。
対話処理部253は、質問を行うユーザとの対話内容に基づいて、ユーザに対して応答する台詞を決定(対話処理)する。
質問取得部254は、端末装置10から送信され、音声認識処理部251によって文字情報とされた質問のデータを取得する。なお、端末装置10から文字情報による質問が送信された場合、質問取得部254は、通信部218を介して受信した当該質問のデータを取得する。
質問属性特定部255は、質問のデータに含まれる単語を対象として、トリプルの要素(エンティティ、プロパティあるいはリテラル)を特定する。具体的には、質問属性特定部255は、質問のデータを構文解析することにより、質問のデータに含まれる各単語が、エンティティ、プロパティ及びリテラルである可能性を推定する。このとき、構文解析の結果、質問のデータに含まれる各単語が、エンティティ、プロパティあるいはリテラルである可能性を示すスコア(以下、適宜「属性スコア」と呼ぶ。)が算出され、この属性スコアに基づいて、質問のデータに含まれる単語のいずれがエンティティであるか等が特定される。
例えば、「富士山の高さは?」という質問に対して、構文解析により、質問のエンティティとして「富士山」、質問のプロパティとして「高さ」が特定される。この場合、リテラルである「3776m」が回答となる。
このように質問属性特定部255によって特定されたトリプルの要素は、質問のエンティティ、プロパティ及びリテラルのいずれか1つ(質問対象)を除く2つの要素に分類される。本実施形態においては、特定された2つの要素を同時に検索条件としてLOD知識ベース271を検索するのではなく、これらのうちの1つ(ここではエンティティとする)をキーとして検索が開始される。即ち、回答提示処理では、質問におけるエンティティを特定し、特定されたエンティティをキーとして、LOD知識ベース271において、質問のエンティティと同一または関連するエンティティに該当するトリプルが抽出されることとなる。
候補特定部256は、質問におけるトリプルの各要素として、回答を決定する上で検討の対象とする候補を特定(即ち、質問を拡張)する。一例として、候補特定部256は、音声認識処理において算出された音声認識スコアが最も高い1つの単語のみではなく、一定以上の音声認識スコアが算出された単語を、トリプルの各要素の候補として拡張して特定することができる。例えば、「フジサン」という音声に対して、音声認識処理では、「富士山」(山の固有名称)が最も高い音声認識スコアとなっている場合に、候補特定部256は、「富士山」(山の固有名称)に次いで、所定以上の音声認識スコアが算出された単語(例えば、「藤さん」(苗字)等)をトリプルの各要素の候補として特定する。本実施形態では、特定された候補それぞれによって表される質問について、図5に示すような回答提示処理が実行される。なお、図5において、質問のエントリ「富士山」(山の固有名称)に続く数値及び質問のプロパティ「高さ」に続く数値は、それぞれの要素の信頼度(後述)を示している。
これにより、質問における各要素の候補として、質問を構成すると推定される多様な単語が特定されることとなる。例えば、質問の中に「ハシ」という単語が含まれる場合、「箸」及び「橋」の両方をトリプルの要素の候補とすること等ができる。そのため、質問として入力された音声が表す可能性のある内容を広く対象として、回答提示処理が行われる。
要素拡張部257は、候補特定部256によって特定された各要素(質問におけるトリプルの各要素)に対応するLOD知識ベース271の要素を、当該要素と実質的に同意または関連性が高いと考えられる単語に拡張する。
具体的には、要素拡張部257は、質問における各要素に対応するLOD知識ベース271の要素について、表現のバリエーション(言い換え表現)を取得する。このとき、要素拡張部257は、同義語・類義語辞書DB272を参照して、LOD知識ベース271の要素と同義または類義の単語を取得することができる。また、要素拡張部257は、LOD知識ベース271において言い換え表現や関連する項目としてリンクされている単語を取得することができる。本実施形態において、要素拡張部257は、候補特定部256によって特定された要素のうちの1つ(ここではエンティティとする)をキーとして、LOD知識ベース271を検索する。そして、要素拡張部257は、LOD知識ベース271において、キーとなる要素と同一または関連する要素に該当するトリプルを抽出し、抽出したトリプルに含まれる他の要素について、表現のバリエーション(言い換え表現)を取得する。
例えば、図5のエンティティの項目に示すように、質問における「富士山」というエンティティに対して、LOD知識ベース271に記憶されている「富士山_静岡県」、「富士山_群馬県」、「富士山駅」・・・という単語群が、「富士山」というエンティティの言い換え表現や関連する項目(同一または関連する要素)として取得される。
また、例えば、図5のプロパティの項目に示すように、LOD知識ベース271に記憶されている「富士山_静岡県」というエンティティに対して、「height」という単語がプロパティとして対応付けられている場合、同義語・類義語辞書を参照して、「height」という単語(拡張元の単語)と実質的に同意または関連性が高いと考えられる単語(拡張された単語)が取得される。具体的には、「height」という単語の同義語または類義語として、同義語・類義語辞書から「標高」及び「身長」という単語が取得される。なお、図5において、LOD知識ベース271のプロパティにおける単語に続く数値は、拡張元の単語との類似度を示し、それに続く数値は、質問のプロパティの単語(「高さ」)との類似度を示している。また、このように拡張されたプロパティに対しては、拡張の元となる「height」と同一のリテラル「3776m」が設定される。
これにより、LOD知識ベース271におけるエンティティやプロパティ等の要素を、同義語・類義語、あるいは、言い換え表現や関連する項目に拡張した状態(拡張されたLOD知識ベース271)を形成することができる。
信頼度算出部258は、質問におけるトリプルの各要素及び要素拡張部257によって拡張されたLOD知識ベース271の各要素について、信頼度を算出する。
具体的には、信頼度算出部258は、質問における各要素について、以下のように信頼度を算出する。
(1)質問における要素の信頼度=(評価項目Aの結果)×重みWa+(評価項目Bの結果)×重みWb+(評価項目Cの結果)×重みWc+(評価項目Dの結果)×重みWd
ただし、
評価項目A:当該単語の検索頻度(ユーザ個人における検索履歴ベースの検索頻度または一般ユーザ全体の検索履歴における検索頻度)から算出される評価
評価項目B:トレンド(インターネット等における検索のトレンド情報)を利用した評価
評価項目C:音声認識処理における音声認識スコアを利用した評価
評価項目D:質問における要素の特定時の属性スコアを利用した評価
なお、図5に示す例では、質問における要素はエンティティ(「富士山」)及びプロパティ(「高さ」)であり、それぞれの要素について算出された信頼度の積が質問の信頼度となる。
(2)LODのエンティティの信頼度=(評価項目Eの結果)×重みWe+(評価項目Fの結果)×重みWf
ただし、
評価項目E:質問の要素(エンティティ)の文字列とLODの要素(エンティティ)の文字列の一致度(完全一致の場合は最大値1)
評価項目F:LODに定義されているリンクの辿り着きやすさ
なお、評価項目Fにおけるリンクの辿り着きやすさは、LODにおいて、曖昧さ回避等の目的により、特定の単語から他の単語へのリンクが定義されることがあり、そのリンクの階層によって定義することができる。ただし、このようなリンクが定義されておらず、直接的に当該単語に辿り着ける場合には、最大値1を設定することができる。
(3)LODのプロパティの信頼度1=(評価項目G1の結果)×重みWg1+(評価項目H1の結果)×重みWh1+(評価項目I1の結果)×重みWi1
ただし、
評価項目G1:オリジナルのLODのプロパティと、上位語・下位語の概念を利用した類義語拡張後のLODのプロパティとの類似度
評価項目H1:オリジナルのLODのプロパティと、単語ベクトルを利用した類義語拡張後のLODのプロパティとの類似度
評価項目I1:オリジナルのLODのプロパティと、類義語拡張後のLODのプロパティの文字列の類似度
(4)LODのプロパティの信頼度2=(評価項目G2の結果)×重みWg2+(評価項目H2の結果)×重みWh2+(評価項目I2の結果)×重みWi2
ただし、
評価項目G2:質問のプロパティと、上位語・下位語の概念を利用した類義語拡張後のLODのプロパティとの類似度
評価項目H2:質問のプロパティと、単語ベクトルを利用した類義語拡張後のLODのプロパティとの類似度
評価項目I2:質問のプロパティと、類義語拡張後のLODのプロパティの文字列の類似度
したがって、LODのプロパティの信頼度は以下のようになる。
LODのプロパティの信頼度=LODのプロパティの信頼度1×LODのプロパティの信頼度2
なお、評価項目G1,G2は、上位語・下位語の概念を利用した類似度が定義されたデータベースを利用して算出することができる。例えば、評価項目G1,G2の結果は、情報処理システム1が独自に保有するデータベースや、一般に利用が解放されている民間あるいは行政によるデータベース(WordNet等)を利用して取得すること等が可能である。この場合、例えば、拡張後のLODのプロパティがオリジナルのLODのプロパティの上位語であれば、信頼度はオリジナルの0.7、下位語であれば、信頼度はオリジナルの0.8、拡張後のLODのプロパティがオリジナルのLODのプロパティの下位語の上位語であれば、オリジナルのLODのプロパティの0.5とすること等ができる。
また、評価項目H1,H2は、単語ベクトルを利用した類似度が定義されたデータベースを利用して算出することができる。例えば、評価項目H1,H2の結果は、情報処理システム1が独自に保有するデータベースや、一般に利用が解放されている民間あるいは行政によるデータベースを利用して取得すること等が可能である。このとき用いられるデータベースは、日本語コーパスを利用し、単語ベクトル化技術(Word2Vec等)によって単語類似度を測り、その結果をデータベース化したものである。
(5)リテラルの結果の信頼度=(質問のエンティティの信頼度)×(質問のプロパティの信頼度)×(LODのエンティティの信頼度)×(LODのプロパティの信頼度)
即ち、リテラルの結果の信頼度は、質問のエンティティの信頼度、質問のプロパティの信頼度、LODのエンティティの信頼度及びLODのプロパティの信頼度を総合したスコアを示している。
例えば、図5において、「富士山_静岡県」というエントリに対しては、LOD知識ベース271には「height」というプロパティと「初登頂」というオリジナルのプロパティが含まれており、プロパティの拡張により、例えば、「height」というプロパティの類義語として、「標高」及び「身長」というプロパティが設定されている。この場合、エントリ「富士山_静岡県」については、(LODのエンティティの信頼度)が0.99、プロパティ「height」については、(LODのプロパティの信頼度)が0.4となる。なお、音声認識処理において、質問の信頼度(質問のエンティティの信頼度及び質問のプロパティの信頼度の積)は、「富士山の高さは?」という質問の内容が最も高い信頼度0.81となっているものとする。このようにして、拡張後のLOD知識ベース271におけるプロパティ及びエントリの組み合わせに対し、リテラルの結果の信頼度が算出される。この結果、図5においては、エントリ「富士山_静岡県」及びプロパティ「標高」の組み合わせに対するリテラル「3776m」の信頼度が最も高いものとなっている。即ち、「富士山の高さは?」という質問に対して、回答提示処理の結果では、エントリ「富士山_静岡県」及びプロパティ「標高」のリテラルである「3776m」が最もスコアの高い回答となる。
回答特定部259は、信頼度算出部258によって算出されたリテラルの結果の信頼度に基づいて、質問に対する回答を特定する。このとき、回答特定部259は、リテラルの結果の信頼度が高い順に、対話処理部253にリテラルの結果を出力し、ユーザが求める回答を順次提示する。
[動作]
次に、情報処理システム1の動作を説明する。
[回答提示処理]
図6は、情報処理システム1のサーバ20が実行する回答提示処理の流れを示すフローチャートである。
回答提示処理は、端末装置10から質問が送信された場合に、LOD知識ベース271を利用して回答を自動的に特定し、特定した回答を端末装置10に提示する処理である。
なお、回答提示処理は、回答提示処理の実行が指示入力されることにより開始され、回答提示処理の終了が指示入力されるまで、繰り返し実行される。
回答提示処理が開始されると、ステップS1において、音声認識処理部251は、端末装置10から音声として送信された質問を音声認識処理し、文字情報に変換する。このとき、音声認識処理部251は、音声認識処理において特定された単語の音声認識スコアを算出し、音声認識スコアに基づいて、可能性の高い単語を選択する。
ステップS2において、質問取得部254は、端末装置10から送信され、音声認識処理部251によって文字情報とされた質問のデータを取得する。
ステップS3において、質問属性特定部255は、質問のデータに含まれる単語を対象として、トリプルの要素(エンティティ、プロパティあるいはリテラル)を特定する。このとき、質問属性特定部255は、質問のデータに含まれる各単語について、エンティティ、プロパティあるいはリテラルである可能性を示す属性スコアを算出し、この属性スコアに基づいて、質問のデータに含まれる単語のいずれがエンティティであるか等を特定する。
ステップS4において、候補特定部256は、質問におけるトリプルの各要素として、回答を決定する上で検討の対象とする候補を特定する。即ち、候補特定部256は、音声認識処理において算出された音声認識スコアが一定以上の単語を、トリプルの各要素の候補として特定する。
ステップS5において、要素拡張部257は、LOD知識ベース271を検索することにより、候補特定部256によって特定された各要素(質問におけるトリプルの各要素)に対応するLOD知識ベース271の要素を、当該要素と実質的に同意または関連性が高いと考えられる単語に拡張する。このとき、要素拡張部257は、同義語・類義語辞書DB272を参照して、LOD知識ベース271の要素と同義または類義の単語を取得することができる。また、要素拡張部257は、LOD知識ベース271において言い換え表現や関連する項目としてリンクされている単語を取得することができる。これにより、LOD知識ベース271におけるエンティティやプロパティ等の要素を、同義語・類義語、あるいは、言い換え表現や関連する項目に拡張した状態を形成することができる。
ステップS6において、信頼度算出部258は、質問におけるトリプルの各要素及び要素拡張部257によって拡張された後のLOD知識ベース271の各要素について、信頼度を算出する。具体的には、信頼度算出部258は、(1)質問における要素の信頼度、(2)LODのエンティティの信頼度、(3)LODのプロパティの信頼度1、(4)LODのプロパティの信頼度2、及び、(5)リテラルの結果の信頼度を算出する。これにより、図5に示す各トリプルの要素について、信頼度が設定された状態となる。
ステップS7において、回答特定部259は、信頼度算出部258によって算出されたリテラルの結果の信頼度に基づいて、質問に対する回答を特定する。例えば、図5に示すように、「富士山の高さは?」という質問に対して、エントリ「富士山_静岡県」及びプロパティ「標高」のリテラルである「3776m」が最もスコアの高い回答として特定される。
ステップS8において、対話処理部253は、回答特定部259によって特定された回答に基づいて、回答をユーザに対して応答するための台詞を決定(対話処理)する。
ステップS9において、音声合成処理部252は、対話処理部253によって決定された台詞に基づいて、音声を合成(音声合成処理)する。例えば、図5に示すように、リテラル「3776m」を回答する台詞が音声として合成される。このようにして合成された回答を提示する台詞は、ネットワーク30を介して端末装置10に送信される。
ステップS10において、回答特定部259は、提示した回答が適切であるか否かの判定を行う。具体的には、回答特定部259は、端末装置10から他の回答が要求されていないか否かまたは提示した回答が承認されたか否かの判定を行う。
提示した回答が適切でない場合、ステップS10においてNOと判定されて、処理はステップS7に移行する。
一方、提示した回答が適切である場合、ステップS10においてYESと判定されて、回答提示処理が繰り返される。
このような処理により、情報処理システム1においては、質問を構成する要素及びLOD知識ベース271に含まれる要素を拡張し、LODデータベースに格納されているデータにおいて、質問が表す内容に関連する可能性があるデータを包括的に候補として取得する。そして、情報処理システム1においては、拡張された質問におけるトリプルの各要素及び拡張されたLOD知識ベース271におけるトリプルの各要素の信頼度を算出する。さらに、回答の候補となるトリプルの要素を、対応するトリプルの他の要素の信頼度に基づいてスコア化し、このスコアに基づいて、質問に対する回答を特定する。
これにより、情報の精度や検索機能が十分でないLODのデータベースを参照して、質問に対するより適切な回答を得ることが可能となる。
[変形例1]
上述の実施形態において、信頼度算出部258が各種信頼度を算出する場合の重みは、予め設定された固定値とすることに加え、提示した回答の精度をフィードバックする(図6におけるステップS10の処理結果をフィードバックする等)ことにより機械学習して自動調整することが可能である。
例えば、回答として提示したリテラルの結果の信頼度が0.8であり、この回答が正解であった場合に、質問における要素の信頼度、LODのエンティティの信頼度及びLODのプロパティの信頼度を算出するために用いた各評価項目の結果のうち、0.8より高い評価結果を出した評価項目の重みを所定値高め(例えば0.1高め)、0.8より低い評価結果を出した評価項目の重みを所定値低くする(例えば0.1低くする)と言ったことが可能である。
これにより、回答として提示した結果の正否に応じて、次に回答を特定する際のスコアの算出方法を補正することができ、より精度の高い回答を提示することが可能となる。
[変形例2]
上述の実施形態において、提示した回答の精度をフィードバックする(図6におけるステップS10の処理結果をフィードバックする等)ことにより、回答として提示したエンティティ、プロパティあるいはリテラルの適否を機械学習して自動判定することが可能である。
例えば、回答特定部259が、回答として提示したエンティティ、プロパティあるいはリテラルが正解でない場合に評価値を加算すると共に、正解である場合には評価値を減算していき、評価値が閾値を超えたエンティティ、プロパティあるいはリテラルについては、ブラックリストに登録して、以降、要素拡張部257によるLOD知識ベース271の検索範囲から除外することにより、回答の提示に使用しないことが可能である。
即ち、ブラックリストに登録されたエンティティ、プロパティあるいはリテラルについては、回答を提示する際に検索範囲から除外し、回答に使用しないものとする。
LODの中には、質問の回答には必ずしも必要ない単語(ページの作成日時等)が含まれているところ、このような処理を行うことにより、不適切な単語が回答を提示する際の検索範囲から自動的に除外され、不要な処理が行われることを抑制できる。
以上のように構成される情報処理システム1は、サーバ20において、質問取得部254と、質問属性特定部255と、要素拡張部257と、信頼度算出部258と、回答特定部259とを備える。
質問取得部254は、端末装置に入力されたユーザからの質問を取得する。
質問属性特定部255は、質問取得部254によって取得された質問におけるLODに基づく要素を特定する。
要素拡張部257は、質問属性特定部255によって特定された要素の1つに基づいて、LODデータベースを検索する。
要素拡張部257は、検索結果における他の要素を拡張する。
信頼度算出部258は、要素拡張部257の検索結果に含まれる要素及び拡張された他の要素について、当該要素それぞれの信頼度を算出する。
回答特定部259は、信頼度算出部258によって算出された信頼度に基づいて、前記質問に対する回答を特定する。
これにより、LODデータベースに含まれる要素を拡張し、LODデータベースに格納されているデータにおいて、質問が表す内容に関連する可能性があるデータを包括的に検索することができる。
したがって、情報の精度や検索機能が十分でないLODのデータベースを参照して、質問に対するより適切な回答を得ることが可能となる。
要素拡張部257は、要素の1つと同一または関連する要素を前記LODデータベースにおいて検索する。
これにより、複数の要素を条件として検索する場合に比べ、より広い対象を索出することができる。
質問属性特定部255は、質問におけるLODに基づく要素を拡張して特定する。
これにより、質問が表す可能性のある内容を広く対象として、回答の検索を行うことができる。
要素拡張部257は、他の要素の同意語及び類義語の少なくともいずれかに拡張する。
これにより、質問における他の要素の同意語及び類義語の範囲に拡張された対象を基に、回答の検索を行うことができる。
信頼度算出部258は、他の要素と、当該他の要素から拡張された要素との類似度に基づいて、当該他の要素から拡張された要素の信頼度を算出する。
これにより、拡張された要素の信頼度をより適切に算出することができる。
質問は音声によって入力され、音声認識によって文字情報とされたものである。
信頼度算出部258は、音声認識において算出されたスコアを用いて、質問の要素の信頼度を算出する。
これにより、音声認識において質問として認識される可能性が一定以上の高さであった内容を対象として、回答の検索を行うことができる。
要素拡張部257は、質問におけるLODに基づく要素のうち、エンティティを優先してLODデータベースを検索する。
これにより、表現のゆれがより少ないエンティティを用いて、より適確なデータを検索することができる。
信頼度算出部258は、回答特定部259によって特定された回答の正否に基づいて、要素それぞれの信頼度を算出する際に用いるパラメータを補正する。
これにより、回答として提示した結果の正否に応じて、次に回答を特定する際のスコアの算出方法を補正することができ、より精度の高い回答を提示することが可能となる。
要素拡張部257は、回答特定部259によって特定された回答に含まれる要素それぞれについて、当該回答の正否に基づいて算出される評価値が予め設定された条件に合致した場合に、当該要素をLODデータベースにおける検索範囲から除外する。
これにより、不適切な要素が回答を提示する際の検索範囲から自動的に除外され、不要な処理が行われることを抑制できる。
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
例えば、上述の実施形態において、サーバ20の構成は一例として示したものであり、情報処理システム1全体として、サーバ20の機能が備えられていれば、サーバ20の機能を複数のサーバに分割して実装したり、端末装置10にサーバ20の機能の一部を実装したりすることができる。
即ち、上述の実施形態において、LOD知識ベース271をサーバ20が備える構成を例に挙げて説明したが、LOD知識ベース271を他のサーバが備えることとしてもよい。
また、上述の実施形態において、音声認識処理部251あるいは回答特定部259等のサーバ20の機能の一部を端末装置10に実装することとしてもよい。
また、上述の実施形態及び変形例を適宜組み合わせた構成とすることとしてもよい。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、図2の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が情報処理システム1に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図2の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図2及び図3のリムーバブルメディア131,231により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディア131,231は、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、または光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk−Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini−Disk)等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図2及び図3のROM112,212や、図2及び図3の記憶部120,217に含まれるDRAM等で構成される。
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。
1 情報処理システム、10 端末装置、111,211 CPU、112,212 ROM、113,213 RAM、114,214 バス、115 タッチ操作入力部、116,216 出力部、117 音声入力部、118 撮像部、119 センサ部、120,217 記憶部、121,218 通信部、122,219 ドライブ、131,231 リムーバブルメディア、215 入力部、151 質問入力部、152 質問送信部、153 回答取得部、154 回答出力部、251 音声認識処理部、252 音声合成処理部、253 対話処理部、254 質問取得部、255 質問属性特定部、256 候補特定部、257 要素拡張部、258 信頼度算出部、259 回答特定部、271 LOD知識ベース、272 同義語・類義語辞書データベース(同義語・類義語辞書DB)

Claims (14)

  1. 質問を入力する端末装置と、前記端末装置に入力された質問に対する回答を提示するサーバとが通信可能に構成された情報処理システムであって、
    前記サーバは、
    前記端末装置に入力されたユーザからの質問を取得する質問取得手段と、
    前記質問取得手段によって取得された質問におけるLODに基づく要素を特定する要素特定手段と、
    前記要素特定手段によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索手段と、
    前記検索手段の検索結果における他の要素を拡張する要素拡張手段と、
    前記検索手段の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出手段と、
    前記信頼度算出手段によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定手段と、
    を備え
    前記信頼度算出手段は、前記回答特定手段によって特定された回答の正否に基づいて、前記要素それぞれの信頼度を算出する際に用いるパラメータを補正することを特徴とする情報処理システム。
  2. 質問を入力する端末装置と、前記端末装置に入力された質問に対する回答を提示するサーバとが通信可能に構成された情報処理システムであって、
    前記サーバは、
    前記端末装置に入力されたユーザからの質問を取得する質問取得手段と、
    前記質問取得手段によって取得された質問におけるLODに基づく要素を特定する要素特定手段と、
    前記要素特定手段によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索手段と、
    前記検索手段の検索結果における他の要素を拡張する要素拡張手段と、
    前記検索手段の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出手段と、
    前記信頼度算出手段によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定手段と、
    を備え
    前記検索手段は、前記回答特定手段によって特定された回答に含まれる前記要素それぞれについて、当該回答の正否に基づいて算出される評価値が予め設定された条件に合致した場合に、当該要素を前記LODデータベースにおける検索範囲から除外することを特徴とする情報処理システム。
  3. 前記検索手段は、前記要素の1つと同一または関連する要素を前記LODデータベースにおいて検索することを特徴とする請求項1または2に記載の情報処理システム。
  4. 前記要素特定手段は、質問におけるLODに基づく要素を拡張して特定することを特徴とする請求項1から3のいずれか1項に記載の情報処理システム。
  5. 前記要素拡張手段は、前記他の要素の同意語及び類義語の少なくともいずれかに拡張することを特徴とする請求項1からのいずれか1項に記載の情報処理システム。
  6. 前記信頼度算出手段は、前記他の要素と、当該他の要素から拡張された要素との類似度に基づいて、当該他の要素から拡張された要素の信頼度を算出することを特徴とする請求項1からのいずれか1項に記載の情報処理システム。
  7. 前記質問は音声によって入力され、音声認識によって文字情報とされたものであり、
    前記信頼度算出手段は、前記音声認識において算出されたスコアを用いて、前記質問の要素の信頼度を算出することを特徴とする請求項1からのいずれか1項に記載の情報処理システム。
  8. 前記検索手段は、質問におけるLODに基づく要素のうち、エンティティを優先して前記LODデータベースを検索することを特徴とする請求項1からのいずれか1項に記載の情報処理システム。
  9. 質問を入力する端末装置と、前記端末装置に入力された質問に対する回答を提示するサーバとが通信可能に構成された情報処理システムにおけるサーバであって、
    前記端末装置に入力されたユーザからの質問を取得する質問取得手段と、
    前記質問取得手段によって取得された質問におけるLODに基づく要素を特定する要素特定手段と、
    前記要素特定手段によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索手段と、
    前記検索手段の検索結果における他の要素を拡張する要素拡張手段と、
    前記検索手段の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出手段と、
    前記信頼度算出手段によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定手段と、
    を備え
    前記信頼度算出手段は、前記回答特定手段によって特定された回答の正否に基づいて、前記要素それぞれの信頼度を算出する際に用いるパラメータを補正することを特徴とするサーバ。
  10. 質問を入力する端末装置と、前記端末装置に入力された質問に対する回答を提示するサーバとが通信可能に構成された情報処理システムにおけるサーバであって、
    前記端末装置に入力されたユーザからの質問を取得する質問取得手段と、
    前記質問取得手段によって取得された質問におけるLODに基づく要素を特定する要素特定手段と、
    前記要素特定手段によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索手段と、
    前記検索手段の検索結果における他の要素を拡張する要素拡張手段と、
    前記検索手段の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出手段と、
    前記信頼度算出手段によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定手段と、
    を備え、
    前記検索手段は、前記回答特定手段によって特定された回答に含まれる前記要素それぞれについて、当該回答の正否に基づいて算出される評価値が予め設定された条件に合致した場合に、当該要素を前記LODデータベースにおける検索範囲から除外することを特徴とするサーバ。
  11. 情報処理装置が実行する情報処理方法であって、
    入力されたユーザからの質問を取得する質問取得ステップと、
    前記質問取得ステップにおいて取得された質問におけるLODに基づく要素を特定する要素特定ステップと、
    前記要素特定ステップにおいて特定された前記要素の1つに基づいて、LODデータベースを検索する検索ステップと、
    前記検索ステップの検索結果における他の要素を拡張する要素拡張ステップと、
    前記検索ステップの検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出ステップと、
    前記信頼度算出ステップにおいて算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定ステップと、
    を含み、
    前記信頼度算出ステップでは、前記回答特定ステップにおいて特定された回答の正否に基づいて、前記要素それぞれの信頼度を算出する際に用いるパラメータを補正することを特徴とする情報処理方法。
  12. 情報処理装置が実行する情報処理方法であって、
    入力されたユーザからの質問を取得する質問取得ステップと、
    前記質問取得ステップにおいて取得された質問におけるLODに基づく要素を特定する要素特定ステップと、
    前記要素特定ステップにおいて特定された前記要素の1つに基づいて、LODデータベースを検索する検索ステップと、
    前記検索ステップの検索結果における他の要素を拡張する要素拡張ステップと、
    前記検索ステップの検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出ステップと、
    前記信頼度算出ステップにおいて算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定ステップと、
    を含み、
    前記検索ステップでは、前記回答特定ステップにおいて特定された回答に含まれる前記要素それぞれについて、当該回答の正否に基づいて算出される評価値が予め設定された条件に合致した場合に、当該要素を前記LODデータベースにおける検索範囲から除外することを特徴とする情報処理方法。
  13. コンピュータに、
    入力されたユーザからの質問を取得する質問取得機能と、
    前記質問取得機能によって取得された質問におけるLODに基づく要素を特定する要素特定機能と、
    前記要素特定機能によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索機能と、
    前記検索機能の検索結果における他の要素を拡張する要素拡張機能と、
    前記検索機能の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出機能と、
    前記信頼度算出機能によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定機能と、
    を実現させ、
    前記信頼度算出機能は、前記回答特定機能によって特定された回答の正否に基づいて、前記要素それぞれの信頼度を算出する際に用いるパラメータを補正することを特徴とするプログラム。
  14. コンピュータに、
    入力されたユーザからの質問を取得する質問取得機能と、
    前記質問取得機能によって取得された質問におけるLODに基づく要素を特定する要素特定機能と、
    前記要素特定機能によって特定された前記要素の1つに基づいて、LODデータベースを検索する検索機能と、
    前記検索機能の検索結果における他の要素を拡張する要素拡張機能と、
    前記検索機能の検索結果に含まれる要素及び拡張された前記他の要素について、当該要素それぞれの信頼度を算出する信頼度算出機能と、
    前記信頼度算出機能によって算出された信頼度に基づいて、前記質問に対する回答を特定する回答特定機能と、
    を実現させ、
    前記検索機能は、前記回答特定機能によって特定された回答に含まれる前記要素それぞれについて、当該回答の正否に基づいて算出される評価値が予め設定された条件に合致した場合に、当該要素を前記LODデータベースにおける検索範囲から除外することを特徴とするプログラム。
JP2016068689A 2016-03-30 2016-03-30 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム Active JP6745127B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016068689A JP6745127B2 (ja) 2016-03-30 2016-03-30 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016068689A JP6745127B2 (ja) 2016-03-30 2016-03-30 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2017182457A JP2017182457A (ja) 2017-10-05
JP6745127B2 true JP6745127B2 (ja) 2020-08-26

Family

ID=60008488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016068689A Active JP6745127B2 (ja) 2016-03-30 2016-03-30 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6745127B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7258047B2 (ja) * 2018-05-09 2023-04-14 オラクル・インターナショナル・コーポレイション 収束質問に対する回答を改善するための仮想談話ツリーの構築
CN111241380B (zh) * 2018-11-28 2023-10-03 富士通株式会社 用于生成推荐的方法和设备
CN109657129B (zh) * 2018-12-26 2023-04-18 北京百度网讯科技有限公司 用于获取信息的方法及装置
CN109783631B (zh) * 2019-02-02 2022-05-17 北京百度网讯科技有限公司 社区问答数据的校验方法、装置、计算机设备和存储介质
CN112862409A (zh) * 2021-03-10 2021-05-28 中国工商银行股份有限公司 提运单核验方法及装置
CN118349660B (zh) * 2024-06-14 2024-08-27 长江水利委员会网络与信息中心 一种涉水法律法规的知识问答方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004246824A (ja) * 2003-02-17 2004-09-02 Nippon Telegr & Teleph Corp <Ntt> 音声ドキュメント検索方法及び装置及び音声ドキュメント検索プログラム
JP3856388B2 (ja) * 2003-04-15 2006-12-13 独立行政法人産業技術総合研究所 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体
GB201210234D0 (en) * 2012-06-12 2012-07-25 Fujitsu Ltd Reconciliation of large graph-based data storage

Also Published As

Publication number Publication date
JP2017182457A (ja) 2017-10-05

Similar Documents

Publication Publication Date Title
JP6745127B2 (ja) 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム
CN109933785B (zh) 用于实体关联的方法、装置、设备和介质
CN113906433A (zh) 澄清问题以用于重写有歧义的用户话语
JP2020191075A (ja) Web APIおよび関連エンドポイントの推薦
US20180285744A1 (en) System and method for generating multimedia knowledge base
KR102688236B1 (ko) 인공 지능을 이용한 음성 합성 장치, 음성 합성 장치의 동작 방법 및 컴퓨터로 판독 가능한 기록 매체
KR20090068380A (ko) 개선된 이동 통신 단말
JP6558863B2 (ja) モデル作成装置、推定装置、方法、及びプログラム
US20150104065A1 (en) Apparatus and method for recognizing object in image
CN114981885A (zh) 用于自动语音识别的字母数字序列偏置
KR20200095947A (ko) 전자 장치 및 이의 제어 방법
JPWO2018061839A1 (ja) 送信装置、送信方法及び送信プログラム
JP2015104078A (ja) 撮像装置、撮像システム、サーバ、撮像方法、及び撮像プログラム
JP5484113B2 (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
JP2017182646A (ja) 情報処理装置、プログラム及び情報処理方法
JP6427807B2 (ja) 物体認証装置および物体認証方法
JP2017191357A (ja) 単語判定装置
KR100949353B1 (ko) 언어 장애인용 대화 보조 장치
US20240126993A1 (en) Transformer-based text encoder for passage retrieval
JP6107003B2 (ja) 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム
CN113539235B (zh) 文本分析与语音合成方法、装置、系统及存储介质
US20230117535A1 (en) Method and system for device feature analysis to improve user experience
KR102642617B1 (ko) 인공 지능을 이용한 음성 합성 장치, 음성 합성 장치의 동작 방법 및 컴퓨터로 판독 가능한 기록 매체
Alam et al. Exploring Sign Language Detection on Smartphones: A Systematic Review of Machine and Deep Learning Approaches
JP6082085B1 (ja) ジャンル推定サーバ、ジャンル推定方法、およびジャンル推定プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200721

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200803

R150 Certificate of patent or registration of utility model

Ref document number: 6745127

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250