JP2011081794A - 相互検索およびアラートのための方法、情報処理システム、およびコンピュータ・プログラム(構造化データ・ソースと非構造化データ・ソースとの間の相互検索およびアラート) - Google Patents
相互検索およびアラートのための方法、情報処理システム、およびコンピュータ・プログラム(構造化データ・ソースと非構造化データ・ソースとの間の相互検索およびアラート) Download PDFInfo
- Publication number
- JP2011081794A JP2011081794A JP2010224539A JP2010224539A JP2011081794A JP 2011081794 A JP2011081794 A JP 2011081794A JP 2010224539 A JP2010224539 A JP 2010224539A JP 2010224539 A JP2010224539 A JP 2010224539A JP 2011081794 A JP2011081794 A JP 2011081794A
- Authority
- JP
- Japan
- Prior art keywords
- search
- results
- terms
- query
- generic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2423—Interactive query statement specification based on a database schema
Abstract
【解決手段】検索エンジンから受け取られる検索ヒットが収集され、検索ヒットから、検索タームの候補が取り出される。検索ヒットから、抽出されたタームに対応するエンティティが抽出される。抽出されたエンティティおよび抽出されたタームは、リレーショナル・データベース内のテーブルなどの構造化データ・ソースにクエリを行うために使用される。次に、構造化データ・ソースに対して実行されたクエリからのクエリ結果が受け取られる。こうしたクエリ結果は、非構造化データ・ソースをさらに検索するために使用され、再び、検索ヒットが受け取られ、そこからタームおよびエンティティが抽出される。検索ヒットおよび抽出されるエンティティは、分析用に結果データ・ストアに記憶される。
【選択図】図3
Description
310 エンティティ・リゾルバ
320 検索エンジン
325 非構造化データ・ソース
340 エンティティ・エクストラクタ
350 結果データ・ストア
Claims (20)
- 機械に実装される方法であって、
検索エンジンを使用して、1つ以上の初期検索タームによって1つ以上の非構造化データ・ソースの第1のセットを検索するステップと、
非構造化データ・ソースの前記第1のセットの前記検索からの、1つ以上の検索ヒットを受け取るステップと、
前記検索ヒットから、1つ以上のタームを取り出すステップと、
前記取り出された1つ以上のタームに対応する1つ以上のエンティティを、前記検索ヒットから抽出するステップと、
前記1つ以上の抽出されたエンティティと、前記対応する1つ以上のタームとを検索パラメータとして使用して、1つ以上の構造化データ・ソースにクエリを行うステップと、
前記クエリからの1つ以上のクエリ結果を受け取るステップと、
前記検索エンジンを使用し、検索タームとして前記クエリ結果のうちの1つ以上によって、1つ以上の非構造化データ・ソースの第2のセットを検索するステップと、
検索ヒットおよび前記抽出されたエンティティを、結果データ・ストアに記録するステップと、
を含む方法。 - 前記方法は、
前記1つ以上のクエリ結果を、前記クエリ結果のカーディナリティに基づき分析するステップ
をさらに含み、前記分析は、
前記1つ以上のクエリ結果から選択されたクエリ結果が、非汎用、非一般タームであると特定するステップと、
前記特定に応答して、1つ以上の非構造化データ・ソースの前記第2のセットの前記検索を、前記選択されたクエリ結果を使用して実行するステップと、
をさらに含む、請求項1に記載の方法。 - 前記選択されたクエリ結果を使用する前記検索の前記実行から生じる前記検索ヒットを、前記結果データ・ストアに記録するステップ
をさらに含む、請求項2に記載の方法。 - 前記1つ以上のクエリ結果に関して、エンティティ関係解明分析を実行するステップ
をさらに含む、請求項2に記載の方法。 - 前記方法は、
前記エンティティ関係解明分析の結果を、未処理結果データ・ストアに記憶するステップ
をさらに含み、カーディナリティに基づく前記分析は、前記未処理結果データ・ストア内の前記結果それぞれに対して実行される、請求項4に記載の方法。 - 前記クエリ結果それぞれを汎用ターム・データ・ストアと比較することによって、前記クエリ結果のうちの1つ以上を汎用タームであると判断するステップと、
汎用タームであると判断された前記クエリ結果それぞれをスキップするステップと、
非汎用タームであると判断された前記クエリ結果を処理するステップであって、前記非汎用タームそれぞれと、一般ターム・データ・ストアとを比較することによって、前記非汎用タームのうちの1つ以上を一般タームであると判断するステップを含む、前記処理するステップと、
一般タームであると判断された前記クエリ結果それぞれをスキップするステップと、
非汎用および非一般タームの両方であると判断された前記クエリ結果それぞれを、前記検索エンジンを利用することによって、前記1つ以上の非構造化データ・ソースを使用して検索するステップと、
をさらに含む、請求項2に記載の方法。 - 前記一般タームは、周知の施設に関連する識別データを含む、請求項6に記載の方法。
- 1つ以上のプロセッサと、
前記プロセッサのうちの少なくとも1つによってアクセス可能なメモリと、
前記プロセッサのうちの少なくとも1つによってアクセス可能な不揮発性記憶媒体と、
前記メモリに記憶された命令のセットであって、以下のアクション:
検索エンジンを使用して、1つ以上の初期検索タームによって1つ以上の非構造化データ・ソースの第1のセットを検索すること、
非構造化データ・ソースの前記第1のセットの前記検索からの、1つ以上の検索ヒットを受け取ること、
前記検索ヒットから、1つ以上のタームを取り出すこと、
前記取り出された1つ以上のタームに対応する1つ以上のエンティティを、前記検索ヒットから抽出すること、
前記1つ以上の抽出されたエンティティと、前記対応する1つ以上のタームとを検索パラメータとして使用して、1つ以上の構造化データ・ソースにクエリを行うこと、
前記クエリからの1つ以上のクエリ結果を受け取ること、
前記検索エンジンを使用し、検索タームとして前記クエリ結果のうちの1つ以上によって、1つ以上の非構造化データ・ソースの第2のセットを検索すること、および
検索ヒットおよび前記抽出されたエンティティを、結果データ・ストアに記録すること
を実行するために前記プロセッサのうちの少なくとも1つによって実行される、前記命令のセットと、
を含む情報処理システム。 - 前記アクションは、
前記1つ以上のクエリ結果を、前記クエリ結果のカーディナリティに基づき分析すること
をさらに含み、前記分析は、
前記1つ以上のクエリ結果から選択されたクエリ結果が、非汎用、非一般タームであると特定すること、および
前記特定に応答して、1つ以上の非構造化データ・ソースの前記第2のセットの前記検索を、前記選択されたクエリ結果を使用して実行すること
をさらに含む、請求項8に記載の情報処理システム。 - 前記アクションは、
前記選択されたクエリ結果を使用する前記検索の前記実行から生じる前記検索ヒットを、前記結果データ・ストアに記録すること
をさらに含む、請求項9に記載の情報処理システム。 - 前記アクションは、
前記1つ以上のクエリ結果に関して、エンティティ関係解明分析を実行すること
をさらに含む、請求項9に記載の情報処理システム。 - 前記アクションは、
前記エンティティ関係解明分析の結果を、未処理結果データ・ストアに記憶すること
をさらに含み、カーディナリティに基づく前記分析は、前記未処理結果データ・ストア内の前記結果それぞれに対して実行される、請求項11に記載の情報処理システム。 - 前記アクションは、
前記クエリ結果それぞれを汎用ターム・データ・ストアと比較することによって、前記クエリ結果のうちの1つ以上を汎用タームであると判断すること、
汎用タームであると判断された前記クエリ結果それぞれをスキップすること、
非汎用タームであると判断された前記クエリ結果の処理であって、前記非汎用タームそれぞれと、一般ターム・データ・ストアとを比較することによって、前記非汎用タームのうちの1つ以上を一般タームであると判断することを含む、前記処理を行うこと、
一般タームであると判断された前記クエリ結果それぞれをスキップすること、および
非汎用および非一般タームの両方であると判断された前記クエリ結果それぞれを、前記検索エンジンを利用することによって、前記1つ以上の非構造化データ・ソースを使用して検索すること
をさらに含む、請求項9に記載の情報処理システム。 - 機能的記述情報を含み、コンピュータ可読媒体に記憶されたコンピュータ・プログラムであって、前記機能的記述情報は、情報処理システムによって実行されると、前記情報処理システムに、
検索エンジンを使用して、1つ以上の初期検索タームによって1つ以上の非構造化データ・ソースの第1のセットを検索すること、
非構造化データ・ソースの前記第1のセットの前記検索からの、1つ以上の検索ヒットを受け取ること、
前記検索ヒットから、1つ以上のタームを取り出すこと、
前記取り出された1つ以上のタームに対応する1つ以上のエンティティを、前記検索ヒットから抽出すること、
前記1つ以上の抽出されたエンティティと、前記対応する1つ以上のタームとを検索パラメータとして使用して、1つ以上の構造化データ・ソースにクエリを行うこと、
前記クエリからの1つ以上のクエリ結果を受け取ること、
前記検索エンジンを使用し、検索タームとして前記クエリ結果のうちの1つ以上によって、1つ以上の非構造化データ・ソースの第2のセットを検索すること、および
検索ヒットおよび前記抽出されたエンティティを、結果データ・ストアに記録すること
を含むアクションを実行させる、コンピュータ・プログラム。 - 前記アクションは、
前記1つ以上のクエリ結果を、前記クエリ結果のカーディナリティに基づき分析すること
をさらに含み、前記分析は、
前記1つ以上のクエリ結果から選択されたクエリ結果が、非汎用、非一般タームであると特定すること、および
前記特定に応答して、1つ以上の非構造化データ・ソースの前記第2のセットの前記検索を、前記選択されたクエリ結果を使用して実行すること
をさらに含む、請求項14に記載のコンピュータ・プログラム。 - 前記アクションは、
前記選択されたクエリ結果を使用する前記検索の前記実行から生じる前記検索ヒットを、前記結果データ・ストアに記録すること
をさらに含む、請求項15に記載のコンピュータ・プログラム。 - 前記アクションは、
前記1つ以上のクエリ結果に関して、エンティティ関係解明分析を実行すること
をさらに含む、請求項15に記載のコンピュータ・プログラム。 - 前記アクションは、
前記エンティティ関係解明分析の結果を、未処理結果データ・ストアに記憶すること
をさらに含み、カーディナリティに基づく前記分析は、前記未処理結果データ・ストア内の前記結果それぞれに対して実行される、請求項17に記載のコンピュータ・プログラム。 - 前記アクションは、
前記クエリ結果それぞれを汎用ターム・データ・ストアと比較することによって、前記クエリ結果のうちの1つ以上を汎用タームであると判断すること、
汎用タームであると判断された前記クエリ結果それぞれをスキップすること、
非汎用タームであると判断された前記クエリ結果の処理であって、前記非汎用タームそれぞれと、一般ターム・データ・ストアとを比較することによって、前記非汎用タームのうちの1つ以上を一般タームであると判断することを含む、前記処理を行うこと、
一般タームであると判断された前記クエリ結果それぞれをスキップすること、および
非汎用および非一般タームの両方であると判断された前記クエリ結果それぞれを、前記検索エンジンを利用することによって、前記1つ以上の非構造化データ・ソースを使用して検索すること
をさらに含む、請求項15に記載のコンピュータ・プログラム。 - 前記一般タームは、周知の施設に関連する識別データを含む、請求項19に記載のコンピュータ・プログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/574,660 US8930389B2 (en) | 2009-10-06 | 2009-10-06 | Mutual search and alert between structured and unstructured data stores |
US12/574660 | 2009-10-06 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011081794A true JP2011081794A (ja) | 2011-04-21 |
JP5558997B2 JP5558997B2 (ja) | 2014-07-23 |
Family
ID=43823995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010224539A Expired - Fee Related JP5558997B2 (ja) | 2009-10-06 | 2010-10-04 | 相互検索およびアラートのための方法、情報処理システム、およびコンピュータ・プログラム(構造化データ・ソースと非構造化データ・ソースとの間の相互検索およびアラート) |
Country Status (4)
Country | Link |
---|---|
US (1) | US8930389B2 (ja) |
JP (1) | JP5558997B2 (ja) |
KR (1) | KR20110037889A (ja) |
CN (1) | CN102033900B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015049734A1 (ja) * | 2013-10-02 | 2015-04-09 | 株式会社日立製作所 | 検索システム及び検索方法 |
WO2016006098A1 (ja) * | 2014-07-11 | 2016-01-14 | 株式会社日立製作所 | データ処理システム、データベース管理システム及びデータ処理方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012023050A2 (en) | 2010-08-20 | 2012-02-23 | Overtis Group Limited | Secure cloud computing system and method |
US8442982B2 (en) * | 2010-11-05 | 2013-05-14 | Apple Inc. | Extended database search |
WO2014062192A1 (en) * | 2012-10-19 | 2014-04-24 | Hewlett-Packard Development Company, L.P. | Performing a search based on entity-related criteria |
US8954441B1 (en) * | 2014-01-02 | 2015-02-10 | Linkedin Corporation | Graph-based system and method of information storage and retrieval |
CN106101662A (zh) * | 2016-08-18 | 2016-11-09 | 青岛晟铭网络科技有限公司 | 一种利用条码传输数据的系统和方法 |
US10713247B2 (en) * | 2017-03-31 | 2020-07-14 | Amazon Technologies, Inc. | Executing queries for structured data and not-structured data |
US10956436B2 (en) | 2018-04-17 | 2021-03-23 | International Business Machines Corporation | Refining search results generated from a combination of multiple types of searches |
CN109885735A (zh) * | 2018-12-29 | 2019-06-14 | 北京奥鹏远程教育中心有限公司 | 数据搜索方法和装置 |
CN112905644B (zh) * | 2021-03-17 | 2022-08-02 | 杭州电子科技大学 | 一种融合结构化和非结构化数据的混合搜索方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000020537A (ja) * | 1998-07-01 | 2000-01-21 | Nec Corp | テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2004133510A (ja) * | 2002-10-08 | 2004-04-30 | Hironobu Shishido | 技術文献検索システム |
US20050283473A1 (en) * | 2004-06-17 | 2005-12-22 | Armand Rousso | Apparatus, method and system of artificial intelligence for data searching applications |
JP2006500075A (ja) * | 2001-11-02 | 2006-01-05 | シーメンス コーポレイト リサーチ インコーポレイテツド | 肺がん判別のための患者データマイニング |
US20060053096A1 (en) * | 2004-09-08 | 2006-03-09 | Oracle International Corporation | Natural language query construction using purpose-driven template |
US20060101017A1 (en) * | 2004-11-08 | 2006-05-11 | Eder Jeffrey S | Search ranking system |
JP2006155275A (ja) * | 2004-11-30 | 2006-06-15 | Denso It Laboratory Inc | 情報抽出方法及び情報抽出装置 |
JP2007140721A (ja) * | 2005-11-16 | 2007-06-07 | Hitachi Ltd | 文書専門度取得プログラム |
JP2007257083A (ja) * | 2006-03-20 | 2007-10-04 | Fujitsu Ltd | データベース統合参照プログラム、データベース統合参照方法及びデータベース統合参照装置 |
JP2007287169A (ja) * | 2007-06-15 | 2007-11-01 | Ricoh Co Ltd | 文書管理装置、文書管理システム、文書管理方法、文書管理プログラムおよび記録媒体 |
WO2008063974A2 (en) * | 2006-11-13 | 2008-05-29 | Exegy Incorporated | Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6993475B1 (en) * | 2000-05-03 | 2006-01-31 | Microsoft Corporation | Methods, apparatus, and data structures for facilitating a natural language interface to stored information |
US20050076003A1 (en) * | 2003-10-06 | 2005-04-07 | Dubose Paul A. | Method and apparatus for delivering personalized search results |
US20060095345A1 (en) * | 2004-10-28 | 2006-05-04 | Microsoft Corporation | System and method for an online catalog system having integrated search and browse capability |
US20080295101A1 (en) | 2005-01-27 | 2008-11-27 | Paul David Vicars | Electronic document manager |
CN101501685A (zh) * | 2005-08-24 | 2009-08-05 | 微软公司 | 可个性化信息的实现 |
US9977827B2 (en) * | 2007-03-30 | 2018-05-22 | Innography, Inc. | System and methods of automatic query generation |
-
2009
- 2009-10-06 US US12/574,660 patent/US8930389B2/en active Active
-
2010
- 2010-09-29 CN CN2010102961683A patent/CN102033900B/zh active Active
- 2010-10-04 JP JP2010224539A patent/JP5558997B2/ja not_active Expired - Fee Related
- 2010-10-05 KR KR1020100096719A patent/KR20110037889A/ko not_active Application Discontinuation
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000020537A (ja) * | 1998-07-01 | 2000-01-21 | Nec Corp | テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2006500075A (ja) * | 2001-11-02 | 2006-01-05 | シーメンス コーポレイト リサーチ インコーポレイテツド | 肺がん判別のための患者データマイニング |
JP2004133510A (ja) * | 2002-10-08 | 2004-04-30 | Hironobu Shishido | 技術文献検索システム |
US20050283473A1 (en) * | 2004-06-17 | 2005-12-22 | Armand Rousso | Apparatus, method and system of artificial intelligence for data searching applications |
US20060053096A1 (en) * | 2004-09-08 | 2006-03-09 | Oracle International Corporation | Natural language query construction using purpose-driven template |
US20060101017A1 (en) * | 2004-11-08 | 2006-05-11 | Eder Jeffrey S | Search ranking system |
JP2006155275A (ja) * | 2004-11-30 | 2006-06-15 | Denso It Laboratory Inc | 情報抽出方法及び情報抽出装置 |
JP2007140721A (ja) * | 2005-11-16 | 2007-06-07 | Hitachi Ltd | 文書専門度取得プログラム |
JP2007257083A (ja) * | 2006-03-20 | 2007-10-04 | Fujitsu Ltd | データベース統合参照プログラム、データベース統合参照方法及びデータベース統合参照装置 |
WO2008063974A2 (en) * | 2006-11-13 | 2008-05-29 | Exegy Incorporated | Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors |
JP2007287169A (ja) * | 2007-06-15 | 2007-11-01 | Ricoh Co Ltd | 文書管理装置、文書管理システム、文書管理方法、文書管理プログラムおよび記録媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015049734A1 (ja) * | 2013-10-02 | 2015-04-09 | 株式会社日立製作所 | 検索システム及び検索方法 |
JP6084700B2 (ja) * | 2013-10-02 | 2017-02-22 | 株式会社日立製作所 | 検索システム及び検索方法 |
WO2016006098A1 (ja) * | 2014-07-11 | 2016-01-14 | 株式会社日立製作所 | データ処理システム、データベース管理システム及びデータ処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5558997B2 (ja) | 2014-07-23 |
US8930389B2 (en) | 2015-01-06 |
CN102033900A (zh) | 2011-04-27 |
CN102033900B (zh) | 2013-04-24 |
US20110082873A1 (en) | 2011-04-07 |
KR20110037889A (ko) | 2011-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5558997B2 (ja) | 相互検索およびアラートのための方法、情報処理システム、およびコンピュータ・プログラム(構造化データ・ソースと非構造化データ・ソースとの間の相互検索およびアラート) | |
US9237161B2 (en) | Malware detection and identification | |
US7866542B2 (en) | System and method for resolving identities that are indefinitely resolvable | |
US8150813B2 (en) | Using relationships in candidate discovery | |
US10990674B2 (en) | Malware clustering based on function call graph similarity | |
Yoon et al. | Forensic investigation framework for the document store NoSQL DBMS: MongoDB as a case study | |
US8290968B2 (en) | Hint services for feature/entity extraction and classification | |
US10097569B2 (en) | System and method for tracking malware route and behavior for defending against cyberattacks | |
KR20130044290A (ko) | 악성 소프트웨어를 분석 및 검출하기 위한 방법 및 장치 | |
US11586735B2 (en) | Malware clustering based on analysis of execution-behavior reports | |
WO2017206376A1 (zh) | 搜索方法、装置及非易失性计算机存储介质 | |
US11695791B2 (en) | System for extracting, classifying, and enriching cyber criminal communication data | |
US7756798B2 (en) | Extensible mechanism for detecting duplicate search items | |
CN104156669A (zh) | 一种计算机信息取证系统 | |
EP3108400B1 (en) | Virus signature matching method and apparatus | |
US9876809B2 (en) | Standard metadata model for analyzing events with fraud, attack, or any other malicious background | |
CN105354506B (zh) | 隐藏文件的方法和装置 | |
US9286349B2 (en) | Dynamic search system | |
US20140074870A1 (en) | Combining Problem and Solution Artifacts | |
WO2021104279A1 (zh) | 用户画像构建方法和装置、设备和存储介质 | |
JP2009199385A (ja) | 情報管理装置 | |
US10296990B2 (en) | Verifying compliance of a land parcel to an approved usage | |
US11625558B2 (en) | Punctuation controlled machine learning model temporal validity | |
Peterson et al. | A generalized bio-inspired method for discovering sequence-based signatures | |
JP2023152910A (ja) | コンピュータ実装方法、コンピュータプログラム、システム(データベース監査の精度及び効率を改善するための構造化監査ログの活用) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130603 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140204 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140513 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140605 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5558997 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |