JP2019020958A - 情報収集支援装置および情報収集支援方法 - Google Patents
情報収集支援装置および情報収集支援方法 Download PDFInfo
- Publication number
- JP2019020958A JP2019020958A JP2017137862A JP2017137862A JP2019020958A JP 2019020958 A JP2019020958 A JP 2019020958A JP 2017137862 A JP2017137862 A JP 2017137862A JP 2017137862 A JP2017137862 A JP 2017137862A JP 2019020958 A JP2019020958 A JP 2019020958A
- Authority
- JP
- Japan
- Prior art keywords
- information collection
- information
- collection destination
- destination
- specific expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
ザの興味対象に関して有用なウェブサイトをどれだけ最初から知っているか、にやはり左右されることとなる。
図1は、本実施形態における情報収集支援装置1000を含むネットワーク構成例を示す図である。図1に示す情報収集支援装置1000は、ユーザにとって未知の情報を、当
該ユーザにおける情報収集先の知見有無に係わらず、効率的に収集可能とするコンピュータ装置である。
上述の収集先更新機能1300における関連性判定部1301は、上述の情報先探索部1203により探索したウェブサイトに存在する情報と、収集情報記憶部1005に存在する情報とを比較し、その関連度合いとして一致度を計算するものとなる。
続いて、本実施形態における情報収集支援装置1000のハードウェア構成例について説明する。図2は、本実施形態の情報収集支援装置1000のハードウェア構成例を示す図である。
続いて、本実施形態の情報収集支援装置1000が用いるテーブル類について説明する。図3に、本実施形態における収集先テーブル3000のデータ構成例を示す。図3に例
示する収集先テーブル3000は、収集先記憶部1003が保持するテーブルであり、既知の情報収集先に関する登録情報のリストを示している。本実施形態における情報収集支援装置1000は、この収集先テーブル3000における登録情報を活用して情報を収集することとなる。
カイツリー」といった固有名称が規定されている。
「ファイル形式」5002は、「入力先」5005に対する入力情報のファイル形式を示している。本実施形態の情報収集支援装置1000の固有表現探索部1104は、本項目をキーとして探索手段を呼び出す。
「固有表現分類」6002は、固有表現の属性に関する分類を示している。収集先探索部1203は、本項目をキーとして探索手段を呼び出すこととなる。
以下、本実施形態における情報収集支援方法の実際手順について図に基づき説明する。以下で説明する情報収集支援方法に対応する各種動作は、情報収集支援装置1000がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
有表現が見つからなかった場合(s102:n)、情報収集支援装置1000は、フローを終了する。
図8は、情報分析機能1100で実施される上述の情報分析(s102)の詳細フロー例を示す図である。情報収集支援装置1000は、本フローにより、情報収集(s101)で収集した情報から、新たな情報収集先を探索する鍵となる情報を発見する。
図9は、収集先探索機能1200で実行する収集先探索(s103)の処理フローの例を示した図である。本処理では、上述の情報分析(s102)で発見した固有表現に基づいて、未知の情報収集先たるウェブサイトを発見する。
図10は、収集先更新機能1300が実行する関連性判定(s104)の処理フローの
例を示した図である。本処理では、先の収集先探索(s103)で発見した未知のウェブサイトを情報収集先として登録するか否か判定する。
となる。
102 メモリ
103 外部記憶装置(記憶装置)
104 通信装置
105 入力装置
106 出力装置
107 読取装置
108 インターフェイス
120 可搬性を有する記憶媒体
1000 情報収集支援装置
1001 情報収集機能
1002 収集先登録部
1003 収集先記憶部
1004 情報収集部
1005 収集情報記憶部
1100 情報分析機能
1101 固有表現探索手段登録部
1102 情報分解部
1103 固有表現探索手段記憶部
1104 固有表現探索部
1105 意味分類部
1106 辞書記憶部
1107 文字分解部
1108 画像分解部
1200 収集先探索機能
1201 収集先探索手段登録部
1202 収集先探索手段記憶部
1203 収集先探索部
1300 収集先更新機能
1301 関連性判定部
1302 収集先更新部
1400 クライアント端末
1500 インターネット
1510 ネットワーク
1600 ネットワーク
3000 収集先テーブル
4000 固有表現辞書
5000 固有表現探索手段テーブル
6000 収集先探索手段テーブル
Claims (8)
- ネットワーク上における既知の情報収集先のアドレスを保持する記憶装置と、
前記既知の情報収集先のアドレスにアクセスして収集した情報から、予め定めた所定属性の固有表現を所定ルールで抽出する処理と、前記固有表現の属性ごとに予め定めた探索アルゴリズムに、前記抽出した固有表現を適用して、未知の情報収集先を探索し、前記未知の情報収集先に存在する情報と前記固有表現との一致度を判定する処理と、前記一致度が予め定めた所定範囲にある場合、前記未知の情報収集先のアドレスを前記既知の情報収集先のアドレスとして追加する処理と、を実行する演算装置と、
を有することを特徴とする情報収集支援装置。 - 前記演算装置は、
前記固有表現を抽出するに際し、所定属性の事物各々に関して存在しうる固有名称の辞書情報に基づき、前記収集した情報から固有表現を抽出するものである、
ことを特徴とする請求項1に記載の情報収集支援装置。 - 前記演算装置は、
前記未知の情報収集先を探索するに際し、前記探索した未知の情報収集先と、前記既知の情報収集先とを比較して、前記未知の情報収集先のうち前記既知の情報収集先と重複しないものを未知の情報収集先とするものである、
ことを特徴とする請求項2に記載の情報収集支援装置。 - 前記演算装置は、
前記一致度が予め定めた所定範囲にあるかについて、前記一致度が最低基準値以上かつ最高基準値以下の範囲内にあるか判定し、当該範囲内に前記一致度がある場合、前記未知の情報収集先のアドレスを前記既知の情報収集先のアドレスとして追加し、
前記追加の対象となった前記未知の情報収集先のうち、当該一致度が、前記最高基準値と前記最低基準値との間の中間基準値以上で前記最高基準値以下の範囲にあるものについては、前記固有表現の抽出から以降の各処理を更に実行するものである、
ことを特徴とする請求項1に記載の情報収集支援装置。 - ネットワーク上における既知の情報収集先のアドレスを保持する記憶装置を備えた情報処理装置が、
前記既知の情報収集先のアドレスにアクセスして収集した情報から、予め定めた所定属性の固有表現を所定ルールで抽出する処理と、
前記固有表現の属性ごとに予め定めた探索アルゴリズムに、前記抽出した固有表現を適用して、未知の情報収集先を探索し、前記未知の情報収集先に存在する情報と前記固有表現との一致度を判定する処理と、
前記一致度が予め定めた所定範囲にある場合、前記未知の情報収集先のアドレスを前記既知の情報収集先のアドレスとして追加する処理と、
を実行することを特徴とする情報収集支援方法。 - 前記情報処理装置が、
前記固有表現を抽出するに際し、所定属性の事物各々に関して存在しうる固有名称の辞書情報に基づき、前記収集した情報から固有表現を抽出する、
ことを特徴とする請求項5に記載の情報収集支援方法。 - 前記情報処理装置が、
前記未知の情報収集先を探索するに際し、前記探索した未知の情報収集先と、前記既知の情報収集先とを比較して、前記未知の情報収集先のうち前記既知の情報収集先と重複し
ないものを未知の情報収集先とする、
ことを特徴とする請求項6に記載の情報収集支援方法。 - 前記情報処理装置が、
前記一致度が予め定めた所定範囲にあるかについて、前記一致度が最低基準値以上かつ最高基準値以下の範囲内にあるか判定し、当該範囲内に前記一致度がある場合、前記未知の情報収集先のアドレスを前記既知の情報収集先のアドレスとして追加し、
前記追加の対象となった前記未知の情報収集先のうち、当該一致度が、前記最高基準値と前記最低基準値との間の中間基準値以上で前記最高基準値以下の範囲にあるものについては、前記固有表現の抽出から以降の各処理を更に実行する、
ことを特徴とする請求項5に記載の情報収集支援方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017137862A JP6795467B2 (ja) | 2017-07-14 | 2017-07-14 | 情報収集支援装置および情報収集支援方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017137862A JP6795467B2 (ja) | 2017-07-14 | 2017-07-14 | 情報収集支援装置および情報収集支援方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019020958A true JP2019020958A (ja) | 2019-02-07 |
JP6795467B2 JP6795467B2 (ja) | 2020-12-02 |
Family
ID=65353597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017137862A Active JP6795467B2 (ja) | 2017-07-14 | 2017-07-14 | 情報収集支援装置および情報収集支援方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6795467B2 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004280569A (ja) * | 2003-03-17 | 2004-10-07 | Mitsubishi Electric Corp | 情報監視装置 |
JP2006235729A (ja) * | 2005-02-22 | 2006-09-07 | Mitsubishi Electric Corp | 選択的Web情報収集装置 |
JP2008197877A (ja) * | 2007-02-13 | 2008-08-28 | Nec Corp | セキュリティ運用管理システム、方法およびプログラム |
JP2009289202A (ja) * | 2008-05-30 | 2009-12-10 | Toshiba Corp | キーワード入力支援装置、キーワード入力支援方法及びプログラム |
WO2010041517A1 (ja) * | 2008-10-08 | 2010-04-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報収集装置、検索エンジン、情報収集方法およびプログラム |
JP2010286888A (ja) * | 2009-06-09 | 2010-12-24 | Nec Corp | 情報収集システムおよび情報収集方法ならびにそのプログラム |
JP2017072964A (ja) * | 2015-10-07 | 2017-04-13 | Necソリューションイノベータ株式会社 | 情報分析装置及び情報分析方法 |
-
2017
- 2017-07-14 JP JP2017137862A patent/JP6795467B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004280569A (ja) * | 2003-03-17 | 2004-10-07 | Mitsubishi Electric Corp | 情報監視装置 |
JP2006235729A (ja) * | 2005-02-22 | 2006-09-07 | Mitsubishi Electric Corp | 選択的Web情報収集装置 |
JP2008197877A (ja) * | 2007-02-13 | 2008-08-28 | Nec Corp | セキュリティ運用管理システム、方法およびプログラム |
JP2009289202A (ja) * | 2008-05-30 | 2009-12-10 | Toshiba Corp | キーワード入力支援装置、キーワード入力支援方法及びプログラム |
WO2010041517A1 (ja) * | 2008-10-08 | 2010-04-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報収集装置、検索エンジン、情報収集方法およびプログラム |
JP2010286888A (ja) * | 2009-06-09 | 2010-12-24 | Nec Corp | 情報収集システムおよび情報収集方法ならびにそのプログラム |
JP2017072964A (ja) * | 2015-10-07 | 2017-04-13 | Necソリューションイノベータ株式会社 | 情報分析装置及び情報分析方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6795467B2 (ja) | 2020-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6643554B2 (ja) | エンティティ推薦方法及び装置 | |
CN105183761B (zh) | 敏感词替换方法和装置 | |
US11762926B2 (en) | Recommending web API's and associated endpoints | |
JP2020027649A (ja) | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 | |
JP2018504727A (ja) | 参考文書の推薦方法及び装置 | |
US11036764B1 (en) | Document classification filter for search queries | |
US20170277672A1 (en) | Information processing device, information processing method, and computer program product | |
JP6411800B2 (ja) | 情報管理装置、情報管理システム、及び情報管理プログラム | |
WO2015188719A1 (zh) | 结构化数据与图片的关联方法与关联装置 | |
US9542474B2 (en) | Forensic system, forensic method, and forensic program | |
JP2020170538A (ja) | 検索データを処理するための方法、装置及びプログラム | |
CN114598597B (zh) | 多源日志解析方法、装置、计算机设备及介质 | |
US20160267409A1 (en) | Methods for identifying related context between entities and devices thereof | |
CN111930949A (zh) | 搜索串处理方法、装置、计算机可读介质及电子设备 | |
JP2018005633A (ja) | 関連コンテンツ抽出装置、関連コンテンツ抽出方法及び関連コンテンツ抽出プログラム | |
TW201500941A (zh) | 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體 | |
US10620911B2 (en) | Machine learning to identify a user interface trace | |
JP6795467B2 (ja) | 情報収集支援装置および情報収集支援方法 | |
US11507593B2 (en) | System and method for generating queryeable structured document from an unstructured document using machine learning | |
JP6640519B2 (ja) | 情報分析装置及び情報分析方法 | |
CN105677827B (zh) | 一种表单的获取方法及装置 | |
JP2016038667A (ja) | 情報提供装置、情報提供方法、および情報提供プログラム | |
JP6680472B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
KR20190040046A (ko) | 정보 수집 시스템, 정보 수집 방법 및 기록 매체 | |
JP2014110005A (ja) | 情報検索装置及び情報検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200109 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201016 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201020 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6795467 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |