JP6960289B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP6960289B2
JP6960289B2 JP2017179115A JP2017179115A JP6960289B2 JP 6960289 B2 JP6960289 B2 JP 6960289B2 JP 2017179115 A JP2017179115 A JP 2017179115A JP 2017179115 A JP2017179115 A JP 2017179115A JP 6960289 B2 JP6960289 B2 JP 6960289B2
Authority
JP
Japan
Prior art keywords
image data
entity
data
image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017179115A
Other languages
English (en)
Other versions
JP2019053683A (ja
Inventor
翔悟 湯浅
マナサプリヤ コデュリ
モヒト アガルワル
レテュラジ バラヌワル
直彦 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017179115A priority Critical patent/JP6960289B2/ja
Publication of JP2019053683A publication Critical patent/JP2019053683A/ja
Application granted granted Critical
Publication of JP6960289B2 publication Critical patent/JP6960289B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。
従来、ウェブからデータ(文書や画像など)を収集し、収集したデータを自動的にデータベース化するクローラが知られている(特許文献1参照)。クローラは、ウェブページ中のリンクを辿って、様々なIPアドレスのウェブページからデータを収集する。クローラによって収集されたデータは、ウェブ情報データベースに蓄積される。
一方、検索エンジンは、ユーザによって入力された検索ワードを受信すると、受信した検索ワードに関連するウェブページの情報をウェブ情報データベースから取得する。また、検索エンジンは、取得したウェブページの情報の一覧を検索結果として出力する。
特開2012−69171号公報
ユーザ満足度を向上させるため、検索エンジンは、ユーザによって入力された検索ワードに関連する画像を検索結果とともに出力することが考えられる。これを実現するためには、ウェブから収集した画像と、画像に関連するテキストデータを示すエンティティとを関連付けたデータベースが用いられる。ここで、検索ワードやエンティティによって示される検索対象の現状に伴ってデータベースに記憶される画像が更新されることが好ましい。
しかしながら、特許文献1に開示されたクローラは、ウェブから収集した画像に関連するエンティティを、自動的に判別することができなかった。このため、特許文献1に開示されたクローラは、ウェブから収集した画像と、この画像に関連するエンティティとを関連付けてデータベースを更新することができなかった。
本発明は、このような事情を考慮してなされたものであり、画像とエンティティとを関連付けたデータベースを適切に更新することができる情報処理装置、情報処理方法及びプログラムを提供することを目的の一つとする。
本発明の一態様は、画像データ及びテキストデータを含む収集対象データを収集する収集部と、前記収集部により収集された前記収集対象データに含まれる前記テキストデータから、互いに関連する画像データとエンティティの組を抽出する抽出部と、エンティティによって関連付けられて記憶部に記憶された画像データのうち、前記抽出部により抽出されたエンティティと一致するエンティティに関連付けられた画像データを選択する第1選択部と、前記抽出部により抽出された画像データと、前記第1選択部により選択された画像データとを含む画像の集合の中で、画像の特徴が近い画像データを選択する第2選択部と、前記第2選択部により選択された画像データを、前記抽出部によって抽出された前記エンティティに関連する画像データとして前記記憶部に記憶されたデータを更新する更新部と、を備える情報処理装置である。
本発明の一態様によれば、画像とエンティティとを関連付けたデータベースを適切に更新することができる。
本実施形態に係るナレッジデータサーバの使用環境及び構成を示す図である。 本実施形態に係るナレッジデータの一例を示す図である。 本実施形態に係るエンティティ抽出部のエンティティ抽出処理の概要を示す図である。 本実施形態に係る端末装置の表示部に表示される検索結果ページの一例を示す図である。 本実施形態に係る画像データ抽出部の処理の概要を示す図である。 本実施形態に係る第2選択部の処理の概要を示す図である。 本実施形態のナレッジデータサーバの動作の一例を示す流れ図である。
以下、図面を参照し、本発明の情報処理装置、情報処理方法及びプログラムの実施形態について説明する。本実施形態においては、情報処理装置の一例として、ナレッジデータサーバについて説明する。ナレッジデータサーバは、例えば、画像データおよびテキストデータを含む収集対象データを収集し、収集したデータに基づいてナレッジデータを生成するサーバである。ナレッジデータは、エンティティやクラス、プロパティと、エンティティに関連する画像データ(または画像の所在情報)とが関連付けられたデータである。
エンティティとは、例えば、ある対象事物の実体(例えば、実世界で存在している物体)を表していてもよいし、ある対象事物の概念(例えば、実世界または仮想世界の中で定義された概念)を表していてもよい。例えば、対象事物が「建物」という概念である場合、エンティティは、「○○塔」や「○○ビルディング」などといった実体を表してよい。また、例えば、対象事物が「経済学」という概念である場合、エンティティは、「ミクロ経済学」や「マクロ経済学」などといった実体のない抽象的な概念を表してよい。所在情報とは、ウェブ上の位置を特定するための情報であり、例えば、URL(Uniform Resource Locator)である。以下、実施形態について詳細に説明する。
<実施形態>
<1−1.ナレッジデータサーバの使用環境>
図1は、本実施形態に係るナレッジデータサーバ100の使用環境及び構成を示す図である。ナレッジデータサーバ100は、例えば、制御部110と、記憶部120とを備える。
記憶部120は、例えば、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置などにより実現される。また、記憶部120の一部または全部は、NAS(Network Attached Storage)や外部のストレージサーバなど、ナレッジデータサーバ100がアクセス可能な外部装置であってもよい。記憶部120には、エンティティと、エンティティに関連する画像データとが対応付けられたナレッジデータ(以下、ナレッジデータD1)が記憶される。
図2は、本実施形態に係るナレッジデータD1の一例を示す図である。上述したように、ナレッジデータD1は、エンティティと、エンティティに関連する画像データとが対応付けられた情報である。本実施形態において、ナレッジデータD1に含まれるエンティティには、各エンティティを識別することが可能な情報(以下、エンティティ識別情報EID)が対応付けられる。図2に示すナレッジデータD1において、「内閣総理大臣」というエンティティには、エンティティ識別情報EIDとして「0001」が対応付けられている。また、「アメリカ合衆国大統領」というエンティティには、エンティティ識別情報EIDとして「0002」が対応付けられている。また、図2に示すナレッジデータD1において、「内閣総理大臣」というエンティティには、「XXX.JPG」、「YYY.JPG」及び「ZZZ.JPG」というファイル名の画像データが対応付けられている。また、「アメリカ合衆国大統領」というエンティティには、「xxx.JPG」、「yyy.JPG」及び「zzz.JPG」というファイル名の画像データが対応付けられている。
図1に戻り、制御部110は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。制御部110は、例えば、収集部111と、エンティティ抽出部112と、画像データ抽出部113と、第1選択部114と、第2選択部115と、更新部116と、所在情報取得部117とを備える。また、これらの構成要素のうち一部または全部(内包する記憶部を除く)は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
収集部111は、画像データおよびHTML(HyperText Markup Language)データを含む収集対象データを、ネットワークNWを介してクロールの対象機器(以下、クロール対象機器DV)から収集する。収集部111は、いわゆるクローラプログラムにより実現される。ここで、収集対象データは、ネットワークNW上(クロール対象機器DVの記憶領域内)にあり、ブラウザで閲覧可能なデータである。なお、収集対象データは、ブラウザに限らず、アプリケーションプログラムによって再生されるデータであってもよい。ネットワークNWは、ワールドワイドウェブ(World Wide Web)を意味し、インターネットやイントラネットで標準的に用いられるHTML文書などを利用したシステムである。収集対象データは、例えば、HTMLのソースを示すテキストデータと、画像とを含むウェブページである。
収集部111は、収集対象データに含まれるHTMLデータからリンク先のURLを取得し、取得したURLにアクセスして更に別の収集対象データを収集する。この処理を繰り返すことにより、収集部111は、収集対象データを収集する対象を広げることができる。収集部111は、収集した収集対象データをエンティティ抽出部112及び画像データ抽出部113に出力する。
エンティティ抽出部112は、収集部111から入力された収集対象データに含まれるHTMLデータから、収集対象データに含まれる画像データに関連するエンティティを抽出する。エンティティ抽出部112は、例えば、階層構造を有するHTMLのソースを解析し、画像データを示すノードからパスの数が少ないノードに存在するテキストデータに基づいて、画像データに関連するエンティティを抽出する。
図3は、本実施形態に係るエンティティ抽出部112のエンティティ抽出処理の概要を示す図である。具体的には、収集部111が収集した収集対象データに含まれるHTMLのソースの一例を模式的に示す図である。エンティティ抽出部112は、収集対象データを解析し、画像の所在情報を示すノード(以下、ノードND)を特定する。図3に示す収集対象データには、ノードND1〜ノードND3、ノードND21、ノードND22及びノードND31〜ノードND34が含まれる。図3に示す収集対象データにおいて、画像の所在情報を示すノードNDは、ノードND31及びノードND33である。エンティティ抽出部112は、画像の所在情報を示すノードND(この一例では、ノードND31及びノードND33)からパスの数が所定数以下であるノードNDに存在するテキストデータを、当該画像に関連するエンティティの候補とする。本実施形態では、エンティティ抽出部112は、画像の所在情報を示すノードNDから「2パス」以内のノードNDに存在するテキストデータを、画像に関連するエンティティの候補とする。したがって、エンティティ抽出部112は、ノードND32に存在するテキストデータ及びノードND34に存在するテキストデータを、画像に関連するエンティティの候補とする。
エンティティ抽出部112は、画像に関連するエンティティの候補であるテキストデータ中に、ナレッジデータD1に含まれるエンティティが存在するか否かを判定する。エンティティ抽出部112は、ナレッジデータD1に含まれるエンティティが、テキストデータ中に存在する場合、当該エンティティを画像に関連するエンティティとして抽出する。エンティティ抽出部112は、抽出したエンティティに対応付けられるエンティティ識別情報EIDを収集部111及び画像データ抽出部113に供給する。図3に示す収集対象データにおいて、ノードND32に存在するテキストデータは、エンティティである。また、ノードND34に存在するテキストデータは、エンティティではない。したがって、エンティティ抽出部112は、ノードND32に存在するテキストデータであるエンティティのエンティティ識別情報EIDを収集部111及び画像データ抽出部113に供給する。
図1に戻り、画像データ抽出部113は、収集部111から入力された収集対象データに基づいて、エンティティ抽出部112が抽出したエンティティに関連する画像データを抽出する。具体的には、画像データ抽出部113は、エンティティ抽出部112が抽出したエンティティを示すエンティティ識別情報EIDを取得する。画像データ抽出部113は、ナレッジデータD1に基づいて、エンティティ識別情報EIDが示すエンティティを取得する。画像データ抽出部113は、収集対象データに含まれるHTMLのソースを解析し、エンティティ識別情報EIDが示すエンティティが含まれる(又はエンティティそのものを示す)テキストデータが存在するノードNDを特定する。画像データ抽出部113は、特定したノードNDから所定のパス数(この一例では、「2パス」)以内の画像データの所在情報を示すノードNDを特定する。画像データ抽出部113は、特定したノードNDに存在するテキストデータによって所在情報が示される画像データを抽出する。ここで、エンティティ抽出部112及び画像データ抽出部113とは、抽出部の一例である。なお、画像に対して二以上のエンティティが対応付けられた場合、その画像を破棄してもよい。
図3に示す収集対象データにおいて、画像データ抽出部113は、エンティティ抽出部112から取得した情報に基づいて、テキストデータがエンティティであるノードNDとして、ノードND32を特定する。画像データ抽出部113は、ノードND32から「2パス」以内に存在するノードNDであって、かつ画像データの所在情報を示すノードNDとして、ノードND31を特定する。画像データ抽出部113は、ノードND31のテキストデータに基づいて、画像データを抽出する。ここで、図3に示す収集対象データにおいて、ノードND34も画像データの所在情報を示すノードNDである。しかし、ノードND34から「2パス」以内には、エンティティが含まれるテキストデータのノードNDが存在しない。したがって、画像データ抽出部113は、図3に示す収集対象データにおいて、ノードND31が示す画像データのみを抽出する。画像データ抽出部113は、抽出した画像データと、当該画像データを特定する際に用いたエンティティのエンティティ識別情報EIDとを対応付けて第2選択部115に供給する。
図1に戻り、第1選択部114は、ナレッジデータD1から、エンティティ抽出部112が抽出したエンティティと一致するエンティティと関連付けられた画像データを読み出す。具体的には、第1選択部114は、エンティティ抽出部112が抽出したエンティティを示すエンティティ識別情報EIDを取得する。第1選択部114は、ナレッジデータD1のうち、取得したエンティティ識別情報EIDが対応付けられた画像データを選択する。本実施形態の一例において、第1選択部114は、「0001」を示すエンティティ識別情報EIDを取得する。第1選択部114は、ナレッジデータD1に含まれる画像データのうち、「XXX.JPG」、「YYY.JPG」及び「ZZZ.JPG」というファイル名の画像データを選択する。第1選択部114は、選択した画像データと、エンティティ識別情報EIDとを対応付けて、第2選択部115に供給する。
第2選択部115は、画像データ抽出部113が抽出した画像データと、第1選択部114が画像データを含む画像の集合の中で、エンティティに関連する画像データとして適切な画像データを、エンティティ毎に選択する。第2選択部115は、例えば、画像データ抽出部113が抽出した画像データと、第1選択部114が選択した画像データとのうち、エンティティに関連する画像データとして適切な画像データを、エンティティ識別情報EID毎に選択する。第2選択部115の処理の詳細については、後述する。
更新部116は、第2選択部115が選択した画像データを、エンティティに関連する画像データとして更新する。具体的には、更新部116は、エンティティ抽出部112が抽出したエンティティ毎に、エンティティと、第2選択部115が新たに選択し、或いは既存のものを維持すると決定した画像データとを関連付けたナレッジデータD1を、記憶部120に記憶させる。
一方、ナレッジデータサーバ100と、端末装置200と、ウェブサーバ300は、ネットワークNWを介して通信可能に接続されており、ナレッジデータサーバ100と、ウェブサーバ300とは、ネットワークを介して通信可能に接続されている。端末装置200は、ユーザによって使用される装置であり、例えば、タブレット型コンピュータ、ノート型コンピュータ、デスクトップ型コンピュータ、またはスマートフォンである。ウェブサーバ300は、検索エンジンを用いて検索結果を表示するための検索結果ページを生成し、端末装置200に提供するサーバである。
ユーザは、端末装置200を用いて、端末装置200の表示部に表示された検索ページに検索クエリを入力する。検索クエリとは、一つの検索ワードまたは複数の検索ワードの組み合わせである。端末装置200は、ユーザによって入力された検索クエリをウェブサーバ300に送信する。
ウェブサーバ300は、端末装置200から受信した検索クエリをナレッジデータサーバ100に送信する。ウェブサーバ300は、送信した検索クエリに対応するエンティティ及びエンティティに関連する画像データをナレッジデータサーバ100から受信する。ウェブサーバ300は、受信したエンティティに関連する画像データを含めた検索結果ページを、検索エンジンを用いて生成する。
<1−2.検索結果ページ>
図4は、本実施形態に係る端末装置200の表示部(以下、表示部310)に表示される検索結果ページの一例を示す図である。図4に示されるように、表示部310には、検索クエリ入力領域311と、ナレッジパネル320と、検索結果330とが含まれる検索結果ページが表示される。ナレッジパネル320には、検索クエリに対応するエンティティ312と、エンティティ312に関連する画像322と、エンティティ312に関連する関連情報323とが含まれる。
図4に示される例においては、検索クエリとして「内閣総理大臣」が入力され、ナレッジパネル320には「内閣総理大臣」に関連する画像や様々な情報が表示されている。このように、検索結果330だけでなく、ナレッジパネル320を表示部310に表示することで、検索結果に対するユーザ満足度を向上させることができる。
検索結果ページにナレッジパネル320を表示するため、ウェブサーバ300は、検索クエリに含まれるエンティティに関連する画像データを取得する必要がある。このため、ウェブサーバ300は、検索クエリに含まれるエンティティを、ナレッジデータサーバ100に送信する。
上述したように、ナレッジデータサーバ100の記憶部120には、エンティティに画像データが関連付けられたナレッジデータD1が記憶されている。所在情報取得部117は、記憶部120に記憶されたナレッジデータD1を参照して、ウェブサーバ300から受信した検索クエリに対応するエンティティを取得する。また、所在情報取得部117は、取得したエンティティに関連する画像データ画像データのURLを取得する。その後、所在情報取得部117は、取得した画像データのURLをウェブサーバ300に送信する。
このように、所在情報取得部117は、ウェブサーバ300から検索クエリを受信した場合、検索クエリに対応するエンティティを特定する。このとき、クエリとエンティティ名とが完全一致する場合だけでなく、部分一致または意味的に同一とみなされる程度の相違がある場合も、対応するエンティティとみなしてよい。例えば、「内閣総理大臣」という検索クエリに対して、「AA総理」や「AA首相」などが対応するエンティティとみなされる。そして、所在情報取得部117は、特定したエンティティと、当該エンティティに対応する画像データとをナレッジデータD1から取得する。所在情報取得部117は、取得したエンティティ及び画像データを併せて、「表示用データ」としてウェブサーバ300に返信する。ウェブサーバ300は、所在情報取得部117から受信した「表示用データ」に基づいて、検索結果ページを生成する。所在情報取得部117とは、クエリ取得部の一例である。ウェブサーバ300は、生成した検索結果ページを端末装置200に送信する。端末装置200は、ウェブサーバ300から検索結果ページを受信すると、受信した検索結果収集対象データを用いて検索結果ページ(図4)を表示部310に表示する。ここで、所在情報取得部117とウェブサーバ300とのうち一方または双方を含むものが、提供部の一例である。
<1−3.エンティティ抽出部及び画像データ抽出部の処理>
図5は、本実施形態に係る画像データ抽出部113の処理の概要を示す図である。図5に示す画像IMG1及び画像IMG2は、収集対象データに含まれる画像データの所在情報によって所在が示される画像の一例である。画像IMG1〜2には、いずれも同一のエンティティ(この一例では、「内閣総理大臣」)に関連する画像データである。図5に示す通り、画像IMG1の被写体は、「内閣総理大臣」である。収集対象データに含まれる画像IMG1に関連するテキストデータは、例えば、「内閣総理大臣」や内閣総理大臣の氏名を示す。エンティティ抽出部112は、この画像IMG1に関連するテキストデータに基づいて、「内閣総理大臣」をエンティティとして抽出する。画像IMG2の被写体は、「内閣総理大臣」及び他者(この一例では、「アメリカ合衆国大統領」)である。収集対象データに含まれる画像IMG2に関連するテキストデータは、例えば、「内閣総理大臣と握手を交わすアメリカ合衆国大統領」である。エンティティ抽出部112は、この画像IMG2に関連するテキストデータに基づいて、「内閣総理大臣」及び「アメリカ合衆国大統領」の2つのエンティティを抽出する。
上述したように、画像データ抽出部113は、収集部111から入力された収集対象データに含まれるHTMLデータから、エンティティ抽出部112が抽出したエンティティに関連する画像データを抽出する。また、画像データ抽出部113は、画像に対して二以上のエンティティが対応付けられた場合、その画像を破棄してもよい。従って、図5の例では、画像IMG2が破棄されてもよい。したがって、画像データ抽出部113は、収集部111が収集した収集対象データに含まれる画像のうち、画像IMG1を抽出する。
<1−4.第1選択部及び第2選択部の処理>
図6は、本実施形態に係る第2選択部115の処理の概要を示す図である。上述したように、第1選択部114は、記憶部120のナレッジデータD1から、エンティティ抽出部112が抽出したエンティティに関連する画像データを選択する。本実施形態では、第1選択部114は、エンティティ抽出部112が抽出したエンティティに関連する画像データとして、図6に示す画像IMG30〜34をナレッジデータD1から選択する。
第2選択部115は、画像データ抽出部113がから抽出した画像データ(この一例では、画像IMG1)と、第1選択部114がナレッジデータD1から選択した画像データ(この一例では、画像IMG30〜34)とを取得する。第2選択部115は、取得した画像データのうち、被写体の特徴が近い画像データを選択する。具体的には、第2選択部115は、取得した画像IMGのうち、画像間距離が近い画像IMGを、被写体の特徴が近い画像データとして選択する。より具体的には、第2選択部115は、例えば、輪郭抽出処理によって画像IMGにおける顔領域を特定し、その顔領域の配置、更には顔領域に含まれる顔の各部(目、鼻、口、眉など)のパーツのサイズやレイアウトなどに基づいて、顔の特徴を示す密ベクトル(特徴量の一例)を算出する。そして、算出された密ベクトル間の距離を、画像間距離として取得する。第2選択部115は、例えば、特徴量の中央値(例えば平均ベクトル)を算出し、算出した中央値から所定の閾値以下の特徴量である(つまり、他の画像との画像間距離が近い)画像データを選択し、所定の閾値より大きい特徴量である(つまり、他の画像との画像間距離が遠い)画像データを選択しない。なお、第2選択部115は、このような処理を外部装置またはAPI(Application Programming Interface)などに依頼し、結果を取得してもよい。密ベクトルは、例えば、ディープラーニング等の機械学習によって取得されてもよい。なお、第2選択部115は、特徴量の中央値に代えて、特徴量の平均値に基づいて画像データを選択してもよく、その他の基準に基づいて画像データを選択してもよい。
図6に示す画像IMG1及び画像IMG30〜34のうち、画像IMG1、画像IMG30及び画像IMG31は、エンティティが示す被写体(この一例では、「内閣総理大臣」)の顔の領域の画像IMGに占める割合が大きい画像データである。この場合、画像IMG1、画像IMG30及び画像IMG31には、被写体の顔が大きく示されているため、画像IMG1、画像IMG30及び画像IMG31の画像間距離が近くなる可能性が高い。これに対し、画像IMG32〜34は、エンティティが示す被写体の顔の領域の占める割合が小さい画像データである。この場合、画像IMG32〜34には、被写体の顔が小さく示されるため、画像IMG1との画像間距離が遠くなる可能性が高い。この一例では、第2選択部115は、画像IMG1及び画像IMG30〜34のうち、画像IMG1、画像IMG30及び画像IMG31を、エンティティに関連する画像データとして選択する。
更新部116は、第2選択部115が選択した画像データを、エンティティに関連する画像データとしてナレッジデータD1を更新し、記憶部120に記憶させる。
<1−5.ナレッジデータサーバの動作>
図7は、本実施形態のナレッジデータサーバ100の動作の一例を示す流れ図である。収集部111は、画像データおよびHTMLデータを含む収集対象データを、ネットワークNWを介してクロール対象機器DVから収集する(S110)。次に、エンティティ抽出部112は、収集部111によって収集された収集対象データからエンティティを抽出する(S120)。次に、画像データ抽出部113は、収集部111によって収集された収集対象データから、エンティティ抽出部112によって抽出されたエンティティに関連する画像データを抽出する(S130)。次に、第1選択部114は、ナレッジデータD1として記憶部120に記憶される画像データのうち、エンティティ抽出部112によって抽出されたエンティティに関連する画像データを選択する(S140)。次に、第2選択部115は、画像データ抽出部113によって抽出された画像データと、第1選択部114によって選択された画像データとを含む画像データの集合の中で、他の画像データとの画像間距離が遠いものを除外する(S150)。画像データ抽出部113は、例えば、画像データの集合の中で、画像間距離が近い画像データを所定の数だけ選択する構成であってもよく、画像データの集合の中で、画像間距離の閾値より画像間距離が遠い画像データを除外する構成であってもよい。更新部116は、第2選択部115によって除外されずに残った画像データをエンティティに関連する画像データとしてナレッジデータD1を更新する(S160)。
以上説明したように、本実施形態のナレッジデータサーバ100は、画像データ及びテキストデータを含む収集対象データを収集する収集部111と、収集部111により収集された収集対象データに含まれるテキストデータから、互いに関連する画像データとエンティティの組を抽出する抽出部(エンティティ抽出部112及び画像データ抽出部113)と、エンティティによって関連付けられて記憶部120に記憶された画像データのうち、抽出部により抽出されたエンティティと一致するエンティティに関連付けられた画像データを選択する第1選択部114と、収集部111により抽出された画像データと、第1選択部114により選択された画像データとを含む画像の集合の中で、画像の特徴が近い画像データを選択する第2選択部115と、第2選択部115により選択された画像データを、収集部111によって抽出されたエンティティに関連する画像データとして記憶部120に記憶されたナレッジデータD1を更新する更新部116と、を備える。
これによって、本実施形態のナレッジデータサーバ100は、画像とエンティティとを関連付けたナレッジデータD1を適切に更新することができる。記憶部120にエンティティと、エンティティに関連する画像データとをナレッジデータD1として記憶することにより、端末装置200の表示部310に表示される画像であって、検索クエリに含まれるエンティティに関連する情報(この一例では、ナレッジパネル320)として、画像データを提供することができる。これにより、本実施形態のナレッジデータサーバ100は、検索結果に対するユーザ満足度を向上させることができる。
また、本実施形態のナレッジデータサーバ100において、第2選択部115は、画像データの中の被写体に関する特徴量に基づく画像間距離が近い画像データを、画像の特徴が近い画像データとして選択する、ここで、ナレッジデータD1には、あるエンティティが主な被写体ではない画像データが含まれる場合がある。あるエンティティが主な被写体ではない画像データとは、例えば、複数の人物が被写体である画像データ等である。ただし、ナレッジデータD1には、あるエンティティが主な被写体ではない画像データが含まれていても、あるエンティティが主な被写体である画像データの方が多く含まれる。したがって、画像間距離が近い画像データを選択することによって、あるエンティティが主な被写体である画像データを選択することができる。本実施形態のナレッジデータサーバ100は、あるエンティティによって示される人物の顔の特徴量に基づく画像間距離を用いて、画像データを選択し、ナレッジデータD1として記憶する。これにより、本実施形態のナレッジデータサーバ100は、ナレッジデータD1に含まれる画像データをより精度高くエンティティが主な被写体である画像データに更新することができる。
<1−6.ナレッジデータ更新に伴うデッドリンクの防止>
なお、上述では、ナレッジデータサーバ100は、ウェブサーバ300に対して、記憶部120に記憶される画像データのURLを直接提供する場合について説明したが、これに限られない。ここで、記憶部120に記憶される画像データは、上述した構成によって、エンティティに関連する画像データとして選択されず、削除される場合がある。ここで、端末装置200のキャッシュに削除された画像データのURLが残っている場合など、当該画像データを参照することができず、検索結果に対するユーザ満足度が低下する場合がある。これに対応するため、ナレッジデータサーバ100は、例えば、ウェブサーバ300の提供用のナレッジデータD1を記憶する記憶部(以下、提供用記憶部201(不図示))を備える構成であってもよい。この場合、ナレッジデータサーバ100は、記憶部120に記憶されるナレッジデータD1が更新部116によって更新された場合であっても、所定の期間は提供用記憶部201のナレッジデータD1に当該更新を反映せず、所定の期間が経過した後に反映する構成であってもよい。これにより、本実施形態のナレッジデータサーバ100は、検索結果に対するユーザ満足度を向上させることができる。
また、上述した画像データ抽出部113は、エンティティを1つだけ抽出された画像データを抽出する場合について説明したが、これに限られない。画像データ抽出部113は、例えば、エンティティ抽出部112によって複数のエンティティを抽出された画像データであっても、抽出された複数のエンティティがずれも同義語のエンティティであれば、当該画像データを抽出してもよい。この場合、画像データ抽出部113は、同義語のエンティティを示す情報(例えば、同義語のエンティティの辞書情報)に更に基づいて画像データを抽出する。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
100…ナレッジデータサーバ
110…制御部
111…収集部
112…エンティティ抽出部
113…画像データ抽出部
114…第1選択部
115…第2選択部
116…更新部
117…所在情報取得部
120…記憶部
200…端末装置
201…提供用記憶部
300…ウェブサーバ
310…表示部
311…検索クエリ入力領域
312…エンティティ
320…ナレッジパネル
330…検索結果
D1…ナレッジデータ
DV…クロール対象機器
EID…エンティティ識別情報
IMG、IMG1、IMG2、IMG3、IMG30、IMG31…画像

Claims (6)

  1. 画像データ及びテキストデータを含む収集対象データを収集する収集部と、
    前記収集部により収集された前記収集対象データに含まれる前記テキストデータから、前記収集対象データに含まれる画像データに関連するエンティティを抽出し、前記収集対象データに含まれる画像データのうち抽出したエンティティと関連する画像データを前記エンティティと関連付ける抽出部と、
    エンティティによって関連付けられた画像データを予め記憶した記憶部に記憶された画像データのうち、前記抽出部により抽出されたエンティティと一致するエンティティに関連付けられた画像データを選択する第1選択部と、
    前記抽出部により抽出された画像データと、前記第1選択部により選択された画像データとを含む画像の集合の中で、画像の特徴が近い画像データを選択する第2選択部と、
    前記第2選択部により選択された画像データを、前記抽出部によって抽出された前記エンティティに関連する画像データとして前記記憶部に記憶されたデータを更新する更新部と、
    を備える情報処理装置。
  2. 前記第2選択部は、
    前記画像データの中の被写体に関する特徴量に基づく画像間距離が近い画像データを、前記画像の特徴が近い画像データとして選択する、
    請求項1に記載の情報処理装置。
  3. 前記特徴量は、前記被写体に関連し、機械学習によって学習される密ベクトルである、
    請求項2に記載の情報処理装置。
  4. ユーザ使用する端末装置によって送信されたクエリを取得するクエリ取得部と、
    クエリに関連するエンティティを特定し、特定したエンティティと、前記特定したエンティティに関連する画像データとの組み合わせを前記記憶部から読み出して前記端末装置に提供する提供部と、
    を備える請求項1から請求項3のいずれか一項に記載の情報処理装置。
  5. コンピュータが、
    画像データ及びテキストデータを含む収集対象データを収集し、
    収集された前記収集対象データに含まれる前記テキストデータから、前記収集対象データに含まれる画像データに関連するエンティティを抽出し、前記収集対象データに含まれる画像データのうち抽出したエンティティと関連する画像データを前記エンティティと関連付け、
    エンティティによって関連付けられた画像データを予め記憶した記憶部に記憶された画像データのうち、抽出されたエンティティと一致するエンティティに関連付けられた画像データを選択し、
    抽出された画像データと、選択された画像データとを含む画像の集合の中で、画像の特徴が近い画像データを選択し、
    選択された画像の特徴が近い画像データを、抽出された前記エンティティに関連する画像データとして前記記憶部に記憶されたデータを更新する、
    情報処理方法。
  6. コンピュータに、
    画像データ及びテキストデータを含む収集対象データを収集させ、
    集された前記収集対象データに含まれる前記テキストデータから、前記収集対象データに含まれる画像データに関連するエンティティを抽出し、前記収集対象データに含まれる画像データのうち抽出したエンティティと関連する画像データを前記エンティティと関連付けさせ、
    エンティティによって関連付けられた画像データを予め記憶した記憶部に記憶された画像データのうち、抽出されたエンティティと一致するエンティティに関連付けられた画像データを選択させ、
    抽出された画像データと、選択された画像データとを含む画像の集合の中で、画像の特徴が近い画像データを選択させ、
    選択された画像の特徴が近い画像データを、抽出された前記エンティティに関連する画像データとして前記記憶部に記憶されたデータを更新させる、
    プログラム。
JP2017179115A 2017-09-19 2017-09-19 情報処理装置、情報処理方法及びプログラム Active JP6960289B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017179115A JP6960289B2 (ja) 2017-09-19 2017-09-19 情報処理装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017179115A JP6960289B2 (ja) 2017-09-19 2017-09-19 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2019053683A JP2019053683A (ja) 2019-04-04
JP6960289B2 true JP6960289B2 (ja) 2021-11-05

Family

ID=66014956

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017179115A Active JP6960289B2 (ja) 2017-09-19 2017-09-19 情報処理装置、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6960289B2 (ja)

Also Published As

Publication number Publication date
JP2019053683A (ja) 2019-04-04

Similar Documents

Publication Publication Date Title
US10642938B2 (en) Artificial intelligence based method and apparatus for constructing comment graph
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
JP6167493B2 (ja) 情報を管理するための方法、コンピュータプログラム、記憶媒体及びシステム
JP2010211556A (ja) 観光ルート提供装置、観光ルート提供方法、及びプログラム
JP6662689B2 (ja) 単語判定装置
JP2010128917A (ja) 情報伝播ネットワーク抽出方法、情報伝播ネットワーク抽出装置、及び情報伝播ネットワーク抽出プログラム
JP2010237721A (ja) 検索システム、検索方法および検索用プログラム
JP6960289B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP5321258B2 (ja) 情報収集システムおよび情報収集方法ならびにそのプログラム
JP4774087B2 (ja) 動画評価方法、装置及びプログラム
JP6727097B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6982520B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP7003020B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2016126569A (ja) 行動認識装置、方法およびプログラム
US11967135B2 (en) Labeling support method, labeling support apparatus and program
JP2019144823A (ja) 情報取得プログラム、情報取得方法及び情報取得装置
JP5228529B2 (ja) データ検索プログラム、データ検索装置およびデータ検索方法
JP2018147169A (ja) 特徴語分類プログラム、特徴語分類方法および情報処理装置
JP7434493B2 (ja) 情報処理装置、情報処理システム、情報処理方法、およびプログラム
JP3985826B2 (ja) 画像検索方法及びその装置
JP6971209B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP7354019B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6578679B2 (ja) 画像処理装置及びプログラム
US20180060357A1 (en) Method and system for determining image-based content styles
JP7088693B2 (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210914

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211011

R150 Certificate of patent or registration of utility model

Ref document number: 6960289

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350