JP6960289B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP6960289B2 JP6960289B2 JP2017179115A JP2017179115A JP6960289B2 JP 6960289 B2 JP6960289 B2 JP 6960289B2 JP 2017179115 A JP2017179115 A JP 2017179115A JP 2017179115 A JP2017179115 A JP 2017179115A JP 6960289 B2 JP6960289 B2 JP 6960289B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- entity
- data
- image
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 15
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000000605 extraction Methods 0.000 claims description 46
- 239000000284 extract Substances 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 5
- 238000010801 machine learning Methods 0.000 claims description 2
- 238000013075 data extraction Methods 0.000 description 33
- 101150013335 img1 gene Proteins 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 101150071665 img2 gene Proteins 0.000 description 6
- 238000000034 method Methods 0.000 description 2
- 230000009193 crawling Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
エンティティとは、例えば、ある対象事物の実体(例えば、実世界で存在している物体)を表していてもよいし、ある対象事物の概念(例えば、実世界または仮想世界の中で定義された概念)を表していてもよい。例えば、対象事物が「建物」という概念である場合、エンティティは、「○○塔」や「○○ビルディング」などといった実体を表してよい。また、例えば、対象事物が「経済学」という概念である場合、エンティティは、「ミクロ経済学」や「マクロ経済学」などといった実体のない抽象的な概念を表してよい。所在情報とは、ウェブ上の位置を特定するための情報であり、例えば、URL(Uniform Resource Locator)である。以下、実施形態について詳細に説明する。
<1−1.ナレッジデータサーバの使用環境>
図1は、本実施形態に係るナレッジデータサーバ100の使用環境及び構成を示す図である。ナレッジデータサーバ100は、例えば、制御部110と、記憶部120とを備える。
図4は、本実施形態に係る端末装置200の表示部(以下、表示部310)に表示される検索結果ページの一例を示す図である。図4に示されるように、表示部310には、検索クエリ入力領域311と、ナレッジパネル320と、検索結果330とが含まれる検索結果ページが表示される。ナレッジパネル320には、検索クエリに対応するエンティティ312と、エンティティ312に関連する画像322と、エンティティ312に関連する関連情報323とが含まれる。
図5は、本実施形態に係る画像データ抽出部113の処理の概要を示す図である。図5に示す画像IMG1及び画像IMG2は、収集対象データに含まれる画像データの所在情報によって所在が示される画像の一例である。画像IMG1〜2には、いずれも同一のエンティティ(この一例では、「内閣総理大臣」)に関連する画像データである。図5に示す通り、画像IMG1の被写体は、「内閣総理大臣」である。収集対象データに含まれる画像IMG1に関連するテキストデータは、例えば、「内閣総理大臣」や内閣総理大臣の氏名を示す。エンティティ抽出部112は、この画像IMG1に関連するテキストデータに基づいて、「内閣総理大臣」をエンティティとして抽出する。画像IMG2の被写体は、「内閣総理大臣」及び他者(この一例では、「アメリカ合衆国大統領」)である。収集対象データに含まれる画像IMG2に関連するテキストデータは、例えば、「内閣総理大臣と握手を交わすアメリカ合衆国大統領」である。エンティティ抽出部112は、この画像IMG2に関連するテキストデータに基づいて、「内閣総理大臣」及び「アメリカ合衆国大統領」の2つのエンティティを抽出する。
図6は、本実施形態に係る第2選択部115の処理の概要を示す図である。上述したように、第1選択部114は、記憶部120のナレッジデータD1から、エンティティ抽出部112が抽出したエンティティに関連する画像データを選択する。本実施形態では、第1選択部114は、エンティティ抽出部112が抽出したエンティティに関連する画像データとして、図6に示す画像IMG30〜34をナレッジデータD1から選択する。
図7は、本実施形態のナレッジデータサーバ100の動作の一例を示す流れ図である。収集部111は、画像データおよびHTMLデータを含む収集対象データを、ネットワークNWを介してクロール対象機器DVから収集する(S110)。次に、エンティティ抽出部112は、収集部111によって収集された収集対象データからエンティティを抽出する(S120)。次に、画像データ抽出部113は、収集部111によって収集された収集対象データから、エンティティ抽出部112によって抽出されたエンティティに関連する画像データを抽出する(S130)。次に、第1選択部114は、ナレッジデータD1として記憶部120に記憶される画像データのうち、エンティティ抽出部112によって抽出されたエンティティに関連する画像データを選択する(S140)。次に、第2選択部115は、画像データ抽出部113によって抽出された画像データと、第1選択部114によって選択された画像データとを含む画像データの集合の中で、他の画像データとの画像間距離が遠いものを除外する(S150)。画像データ抽出部113は、例えば、画像データの集合の中で、画像間距離が近い画像データを所定の数だけ選択する構成であってもよく、画像データの集合の中で、画像間距離の閾値より画像間距離が遠い画像データを除外する構成であってもよい。更新部116は、第2選択部115によって除外されずに残った画像データをエンティティに関連する画像データとしてナレッジデータD1を更新する(S160)。
これによって、本実施形態のナレッジデータサーバ100は、画像とエンティティとを関連付けたナレッジデータD1を適切に更新することができる。記憶部120にエンティティと、エンティティに関連する画像データとをナレッジデータD1として記憶することにより、端末装置200の表示部310に表示される画像であって、検索クエリに含まれるエンティティに関連する情報(この一例では、ナレッジパネル320)として、画像データを提供することができる。これにより、本実施形態のナレッジデータサーバ100は、検索結果に対するユーザ満足度を向上させることができる。
なお、上述では、ナレッジデータサーバ100は、ウェブサーバ300に対して、記憶部120に記憶される画像データのURLを直接提供する場合について説明したが、これに限られない。ここで、記憶部120に記憶される画像データは、上述した構成によって、エンティティに関連する画像データとして選択されず、削除される場合がある。ここで、端末装置200のキャッシュに削除された画像データのURLが残っている場合など、当該画像データを参照することができず、検索結果に対するユーザ満足度が低下する場合がある。これに対応するため、ナレッジデータサーバ100は、例えば、ウェブサーバ300の提供用のナレッジデータD1を記憶する記憶部(以下、提供用記憶部201(不図示))を備える構成であってもよい。この場合、ナレッジデータサーバ100は、記憶部120に記憶されるナレッジデータD1が更新部116によって更新された場合であっても、所定の期間は提供用記憶部201のナレッジデータD1に当該更新を反映せず、所定の期間が経過した後に反映する構成であってもよい。これにより、本実施形態のナレッジデータサーバ100は、検索結果に対するユーザ満足度を向上させることができる。
110…制御部
111…収集部
112…エンティティ抽出部
113…画像データ抽出部
114…第1選択部
115…第2選択部
116…更新部
117…所在情報取得部
120…記憶部
200…端末装置
201…提供用記憶部
300…ウェブサーバ
310…表示部
311…検索クエリ入力領域
312…エンティティ
320…ナレッジパネル
330…検索結果
D1…ナレッジデータ
DV…クロール対象機器
EID…エンティティ識別情報
IMG、IMG1、IMG2、IMG3、IMG30、IMG31…画像
Claims (6)
- 画像データ及びテキストデータを含む収集対象データを収集する収集部と、
前記収集部により収集された前記収集対象データに含まれる前記テキストデータから、前記収集対象データに含まれる画像データに関連するエンティティを抽出し、前記収集対象データに含まれる画像データのうち抽出したエンティティと関連する画像データを前記エンティティと関連付ける抽出部と、
エンティティによって関連付けられた画像データを予め記憶した記憶部に記憶された画像データのうち、前記抽出部により抽出されたエンティティと一致するエンティティに関連付けられた画像データを選択する第1選択部と、
前記抽出部により抽出された画像データと、前記第1選択部により選択された画像データとを含む画像の集合の中で、画像の特徴が近い画像データを選択する第2選択部と、
前記第2選択部により選択された画像データを、前記抽出部によって抽出された前記エンティティに関連する画像データとして前記記憶部に記憶されたデータを更新する更新部と、
を備える情報処理装置。 - 前記第2選択部は、
前記画像データの中の被写体に関する特徴量に基づく画像間距離が近い画像データを、前記画像の特徴が近い画像データとして選択する、
請求項1に記載の情報処理装置。 - 前記特徴量は、前記被写体に関連し、機械学習によって学習される密ベクトルである、
請求項2に記載の情報処理装置。 - ユーザが使用する端末装置によって送信されたクエリを取得するクエリ取得部と、
クエリに関連するエンティティを特定し、特定したエンティティと、前記特定したエンティティに関連する画像データとの組み合わせを前記記憶部から読み出して前記端末装置に提供する提供部と、
を備える請求項1から請求項3のいずれか一項に記載の情報処理装置。 - コンピュータが、
画像データ及びテキストデータを含む収集対象データを収集し、
収集された前記収集対象データに含まれる前記テキストデータから、前記収集対象データに含まれる画像データに関連するエンティティを抽出し、前記収集対象データに含まれる画像データのうち抽出したエンティティと関連する画像データを前記エンティティと関連付け、
エンティティによって関連付けられた画像データを予め記憶した記憶部に記憶された画像データのうち、抽出されたエンティティと一致するエンティティに関連付けられた画像データを選択し、
抽出された画像データと、選択された画像データとを含む画像の集合の中で、画像の特徴が近い画像データを選択し、
選択された画像の特徴が近い画像データを、抽出された前記エンティティに関連する画像データとして前記記憶部に記憶されたデータを更新する、
情報処理方法。 - コンピュータに、
画像データ及びテキストデータを含む収集対象データを収集させ、
収集された前記収集対象データに含まれる前記テキストデータから、前記収集対象データに含まれる画像データに関連するエンティティを抽出し、前記収集対象データに含まれる画像データのうち抽出したエンティティと関連する画像データを前記エンティティと関連付けさせ、
エンティティによって関連付けられた画像データを予め記憶した記憶部に記憶された画像データのうち、抽出されたエンティティと一致するエンティティに関連付けられた画像データを選択させ、
抽出された画像データと、選択された画像データとを含む画像の集合の中で、画像の特徴が近い画像データを選択させ、
選択された画像の特徴が近い画像データを、抽出された前記エンティティに関連する画像データとして前記記憶部に記憶されたデータを更新させる、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017179115A JP6960289B2 (ja) | 2017-09-19 | 2017-09-19 | 情報処理装置、情報処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017179115A JP6960289B2 (ja) | 2017-09-19 | 2017-09-19 | 情報処理装置、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019053683A JP2019053683A (ja) | 2019-04-04 |
JP6960289B2 true JP6960289B2 (ja) | 2021-11-05 |
Family
ID=66014956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017179115A Active JP6960289B2 (ja) | 2017-09-19 | 2017-09-19 | 情報処理装置、情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6960289B2 (ja) |
-
2017
- 2017-09-19 JP JP2017179115A patent/JP6960289B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019053683A (ja) | 2019-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10642938B2 (en) | Artificial intelligence based method and apparatus for constructing comment graph | |
KR101721338B1 (ko) | 검색 엔진 및 그의 구현 방법 | |
JP6167493B2 (ja) | 情報を管理するための方法、コンピュータプログラム、記憶媒体及びシステム | |
JP2010211556A (ja) | 観光ルート提供装置、観光ルート提供方法、及びプログラム | |
JP6662689B2 (ja) | 単語判定装置 | |
JP2010128917A (ja) | 情報伝播ネットワーク抽出方法、情報伝播ネットワーク抽出装置、及び情報伝播ネットワーク抽出プログラム | |
JP2010237721A (ja) | 検索システム、検索方法および検索用プログラム | |
JP6960289B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP5321258B2 (ja) | 情報収集システムおよび情報収集方法ならびにそのプログラム | |
JP4774087B2 (ja) | 動画評価方法、装置及びプログラム | |
JP6727097B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6982520B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7003020B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2016126569A (ja) | 行動認識装置、方法およびプログラム | |
US11967135B2 (en) | Labeling support method, labeling support apparatus and program | |
JP2019144823A (ja) | 情報取得プログラム、情報取得方法及び情報取得装置 | |
JP5228529B2 (ja) | データ検索プログラム、データ検索装置およびデータ検索方法 | |
JP2018147169A (ja) | 特徴語分類プログラム、特徴語分類方法および情報処理装置 | |
JP7434493B2 (ja) | 情報処理装置、情報処理システム、情報処理方法、およびプログラム | |
JP3985826B2 (ja) | 画像検索方法及びその装置 | |
JP6971209B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7354019B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6578679B2 (ja) | 画像処理装置及びプログラム | |
US20180060357A1 (en) | Method and system for determining image-based content styles | |
JP7088693B2 (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200305 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210914 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211011 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6960289 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |