JP6982520B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents
情報処理装置、情報処理方法、およびプログラム Download PDFInfo
- Publication number
- JP6982520B2 JP6982520B2 JP2018041087A JP2018041087A JP6982520B2 JP 6982520 B2 JP6982520 B2 JP 6982520B2 JP 2018041087 A JP2018041087 A JP 2018041087A JP 2018041087 A JP2018041087 A JP 2018041087A JP 6982520 B2 JP6982520 B2 JP 6982520B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- entity
- alias
- word
- web page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 16
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000000605 extraction Methods 0.000 claims description 29
- 238000000034 method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- BJEPYKJPYRNKOW-REOHCLBHSA-N (S)-malic acid Chemical compound OC(=O)[C@@H](O)CC(O)=O BJEPYKJPYRNKOW-REOHCLBHSA-N 0.000 description 4
- BJEPYKJPYRNKOW-UHFFFAOYSA-N alpha-hydroxysuccinic acid Natural products OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 235000011090 malic acid Nutrition 0.000 description 4
- 239000001630 malic acid Substances 0.000 description 4
- 238000010923 batch production Methods 0.000 description 3
- 230000003442 weekly effect Effects 0.000 description 3
- 241000272194 Ciconiiformes Species 0.000 description 2
- 241000271567 Struthioniformes Species 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 210000003323 beak Anatomy 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 210000001364 upper extremity Anatomy 0.000 description 2
- 241000271566 Aves Species 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
<1−1.ナレッジデータサーバの使用環境>
図1は、本実施形態に係るナレッジデータサーバ100の使用環境及び構成を示す図である。ナレッジデータサーバ100は、端末装置200と、ウェブサーバ300と、クロール対象機器DVと、ネットワークNWを介して通信可能に接続される。ネットワークNWは、ワールドワイドウェブ(World Wide Web)を意味し、インターネットやイントラネットで標準的に用いられるHTML文書などを利用したシステムである。ネットワークNWは、無線基地局やプロバイダ装置、専用回線などを更に含んでよい。
図4は、本実施形態に係る検索結果ウェブページの一例を示す図である。図4に示されるように、端末装置200の表示部210には、クエリ入力領域211と、ナレッジパネル220と、検索結果230とが含まれる検索結果ウェブページが表示される。ナレッジパネル220には、検索クエリに対応するエンティティ221と、エンティティ221に関連する画像222と、エンティティ221に関連する関連情報223とが含まれる。ユーザは、端末装置200を用いて、端末装置200の表示部210に表示された検索ページに検索クエリを入力する。検索クエリとは、一つの検索ワードまたは複数の検索ワードの組み合わせである。端末装置200は、ユーザによって入力された検索クエリをウェブサーバ300に送信する。
図1に戻り、制御部110は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。制御部110は、例えば、通信I/F(Interface)111と、収集部112と、リダイレクト情報抽出部113(抽出部)と、誘導情報抽出部114(抽出部)と、非同義語除去部115(除去部)と、所在情報取得部116とを備える。また、これらの構成要素のうち一部または全部(内包する記憶部を除く)は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。通信I/F111は、ネットワークNWを介した各機能部と、他の機器(例えば、クロールの対象機器(以下、クロール対象機器DV)、端末装置200、及びウェブサーバ300)との通信を仲介する。
図11は、本実施形態のナレッジデータサーバ100のリダイレクト情報に基づく別名情報抽出動作の一例を示す流れ図である。ナレッジデータサーバ100は、例えば、日次、週次等の任意のタイミングで実施されるバッチ処理により別名情報抽出動作を行う。
図12は、本実施形態のナレッジデータサーバ100の誘導情報に基づく別名情報抽出動作の一例を示す流れ図である。ナレッジデータサーバ100は、例えば、日次、週次等の任意のタイミングで実施されるバッチ処理により別名情報抽出動作を行う。
図13は、本実施形態のナレッジデータサーバ100の別名情報の非同義語除去動作の一例を示す流れ図である。ナレッジデータサーバ100は、例えば、日次、週次等の任意のタイミングで実施されるバッチ処理により非同義語除去動作を行う。
図14は、本実施形態のナレッジデータサーバ100のオンライン動作の一例を示す流れ図である。まず、所在情報取得部116は、ウェブサーバ300から検索クエリを受信する(S40)。
110…制御部
111…通信I/F
112…収集部
113…リダイレクト情報抽出部
114…誘導情報抽出部
115…非同義語除去部
116…所在情報取得部
120…記憶部
200…端末装置
210…表示部
211…クエリ入力領域
220…ナレッジパネル
221…エンティティ
222…画像
223…関連情報
230…検索結果
300…ウェブサーバ
D1…ナレッジグラフ
D2…別名情報
R1…リダイレクト情報
Claims (7)
- 第1ワードによって名前が示される第1エンティティの別名である第2ワードが検索クエリとして入力された場合、リダイレクトによって前記第1エンティティの関連データを記載する第1ページが表示されるように動作するウェブページのリダイレクト情報を収集する収集部と、
前記収集部により収集された前記リダイレクト情報に基づいて、前記第2ワードを前記第1エンティティの別名情報として抽出する抽出部と、
を備える情報処理装置。 - 前記別名情報のうち、所定の条件を満たさないワードを除去する除去部をさらに備える、
請求項1に記載の情報処理装置。 - 前記除去部は、前記第1エンティティの名前を示す前記第1ワードと関連付けられたウェブページにおいて、別名に関する情報の存在を示唆するキーワードが含まれる一文に含まれていないワードを除去する、
請求項2に記載の情報処理装置。 - 前記除去部は、前記第1エンティティの名前を示す前記第1ワードと関連付けられたウェブページにおいて、前記第1エンティティの名前の言い換え表現として示されるワードに含まれていないワードを除去する、
請求項2または3に記載の情報処理装置。 - 検索ワードと合致するワードが前記別名情報に含まれている場合、前記ワードと関連付けられたエンティティに対応付けられている所在情報を取得する取得部をさらに備える、
請求項1から4のいずれか一項に記載の情報処理装置。 - コンピュータが、
第1ワードによって名前が示される第1エンティティの別名である第2ワードが検索クエリとして入力された場合、リダイレクトによって前記第1エンティティの関連データを記載する第1ページが表示されるように動作するウェブページのリダイレクト情報を収集し、
収集された前記リダイレクト情報に基づいて、前記第2ワードを、前記第1エンティティの別名情報として抽出する、
情報処理方法。 - コンピュータに、
第1ワードによって名前が示される第1エンティティの別名である第2ワードが検索クエリとして入力された場合、リダイレクトによって前記第1エンティティの関連データを記載する第1ページが表示されるように動作するウェブページのリダイレクト情報を収集させ、
収集された前記リダイレクト情報に基づいて、前記第2ワードを、前記第1エンティティの別名情報として抽出させる、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018041087A JP6982520B2 (ja) | 2018-03-07 | 2018-03-07 | 情報処理装置、情報処理方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018041087A JP6982520B2 (ja) | 2018-03-07 | 2018-03-07 | 情報処理装置、情報処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019159404A JP2019159404A (ja) | 2019-09-19 |
JP6982520B2 true JP6982520B2 (ja) | 2021-12-17 |
Family
ID=67996245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018041087A Active JP6982520B2 (ja) | 2018-03-07 | 2018-03-07 | 情報処理装置、情報処理方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6982520B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7462198B1 (ja) | 2023-06-13 | 2024-04-05 | 株式会社コンテンシャル | キーワード収集方法、情報処理装置およびプログラム |
-
2018
- 2018-03-07 JP JP2018041087A patent/JP6982520B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019159404A (ja) | 2019-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6906419B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
KR101060594B1 (ko) | 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법 | |
US8255414B2 (en) | Search assist powered by session analysis | |
US10216831B2 (en) | Search results summarized with tokens | |
US10423672B2 (en) | Network resource-specific search assistance | |
US20130030788A1 (en) | System and method for locating bilingual web sites | |
JP6165955B1 (ja) | 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム | |
CN107690634A (zh) | 自动查询模式生成 | |
JP6982520B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7003020B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6106489B2 (ja) | 語義解析装置、及びプログラム | |
JP6971104B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5228529B2 (ja) | データ検索プログラム、データ検索装置およびデータ検索方法 | |
JP6971209B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7088693B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7078569B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2021140246A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7183077B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6971210B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6985189B2 (ja) | データ収集装置、データ収集方法、およびプログラム | |
JP6998282B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6960289B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Gunawan et al. | Building the Pornography Corpus for Bahasa Indonesia Based on TRUST+™ Positif Database | |
JP6226314B2 (ja) | 検索用インデックス構築装置、検索用インデックス構築方法、及び、検索用インデックス構築装置のプログラム | |
Babaei et al. | YAPPTCHA: Yet another picture promoted CAPTCHA with spam stopping, image labeling and SIFT accomplishment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20180405 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6982520 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |