JP2006244505A - 安全なフルテキストインデックス処理のためのシステムおよび方法 - Google Patents
安全なフルテキストインデックス処理のためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2006244505A JP2006244505A JP2006058440A JP2006058440A JP2006244505A JP 2006244505 A JP2006244505 A JP 2006244505A JP 2006058440 A JP2006058440 A JP 2006058440A JP 2006058440 A JP2006058440 A JP 2006058440A JP 2006244505 A JP2006244505 A JP 2006244505A
- Authority
- JP
- Japan
- Prior art keywords
- document
- indexer
- limited
- security setting
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99938—Concurrency, e.g. lock management in shared database
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99939—Privileged access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
Abstract
【解決手段】プロセスのフィルタリング部分およびワード分割部分が、制限セキュリティ設定下で行われるように、該部分を分離するプロセスに従って、文書をインデックス処理する。インデクサ322によって文書が要求されると、文書は検索され、次いでより高いセキュリティプロセスに受け渡される。次いで文書は、インデクサ322に受け渡される前に、限定セキュリティ設定下で1つまたは複数のフィルタ334でフィルタリングされ、かつ1つまたは複数のワードブレーカ332によってトークン化される。限定セキュリティ設定は、フィルタリングおよびワード分割プロセス中にセキュリティ上の脆弱性が利用されることを防止する。
【選択図】図3
Description
図1に関連して、本発明を実現するための1つの例示的システムは、コンピューティング装置100のようなコンピューティング装置を含む。コンピューティング装置100は、クライアント、サーバ、モバイル装置、またはいずれかの他のコンピューティング装置として構成することができる。非常に基本的な構成では、コンピューティング装置100は一般的に、少なくとも1つの処理装置102およびシステムメモリ104を含む。コンピューティング装置の厳密な構成およびタイプによって、システムメモリ104は揮発性(RAMのような)、不揮発性(ROM、フラッシュメモリ等のような)、またはこの2つの何らかの組合せとすることができる。システムメモリ104は一般的にオペレーティングシステム105、1つまたは複数のアプリケーション106を含み、かつプログラムデータ107を含むことがある。一実施形態では、アプリケーション106は、本発明の機能を実現するための検索およびインデックス処理アプリケーション120を含む。この基本構成を、破線108内の構成要素によって図1に示す。
本発明は、ネットワーク上の文書の安全なフルテキストインデックス処理に関する。以下の説明および特許請求の範囲全体を通じて、用語「文書」とは、ネットワーク文書、ファイル、フォルダ、ウェブページ、電子メール添付、および他の資源のような、ネットワークの検索クエリまたはクロールの結果返される任意の可能な資源を指す。
Claims (20)
- コンピュータで実行される、文書の安全なフルテキストインデックス処理のための方法であって、
インデクサから文書識別子を受け取ること、
前記文書識別子に対応する文書を検索すること、
前記文書を限定セキュリティ設定下で処理すること、および
前記処理済み文書を前記インデクサに転送すること、
を含むことを特徴とする方法。 - 前記文書を検索する前に、前記文書識別子を前記インデクサと照合することをさらに含むことを特徴とする請求項1に記載の方法。
- 前記文書識別子の照合は、受け取った前記文書識別子を前記インデクサによって送られた文書識別子と比較することをさらに含むことを特徴とする請求項2に記載の方法。
- 前記文書識別子の照合が失敗したときに、前記限定セキュリティ設定下での前記文書の処理は一時的に中断されることを特徴とする請求項2に記載の方法。
- セキュリティを侵害する機会が制限されるように、限定セキュリティ設定下での処理を断続的に中断することをさらに含むことを特徴とする請求項1に記載の方法。
- 限定セキュリティ設定下での前記文書の処理は、フィルタを使用して前記文書を処理することをさらに含むことを特徴とする請求項1に記載の方法。
- 限定セキュリティ設定下での前記文書の処理は、ワードブレーカを使用して前記文書を処理することをさらに含むことを特徴とする請求項1に記載の方法。
- 一群の文書識別子が前記インデクサによって送られ、文書が一括して検索されることを特徴とする請求項1に記載の方法。
- 前記文書は、前記限定セキュリティ設定とは異なる第二のセキュリティ設定を持つ第二のプロセスに従って検索されることを特徴とする請求項1に記載の方法。
- 前記インデクサは、前記第二のセキュリティ設定および前記限定セキュリティ設定とは異なる、第三のセキュリティ設定の下で動作することを特徴とする請求項9に記載の方法。
- 前記文書はプロトコルハンドラによって検索されることを特徴とする請求項1に記載の方法。
- 前記プロトコルハンドラは前記インデクサから前記文書要求を直接受け取ることを特徴とする請求項11に記載の方法。
- 前記プロトコルハンドラは前記文書要求を、それが前記限定セキュリティ設定に対応するプロセスを通して伝えられた後に、受け取ることを特徴とする請求項11に記載の方法。
- 文書の安全なフルテキストインデックス処理のためのシステムであって、
インデックスのエントリーが前記文書のワードに対応するインデックスを作るように構成されたインデクサと、
前記インデクサから受け取る文書要求により、データソースから文書を検索するように構成されたプロトコルハンドラと、
限定セキュリティ設定下で前記文書を処理し、かつ処理済みの前記文書を前記インデクサに転送するように構成された限定プロセスと、
を含むことを特徴とするシステム。 - 前記限定プロセスは前記文書を純粋テキストに変換するフィルタをさらに含むことを特徴とする請求項14に記載のシステム。
- 前記限定プロセスは前記純粋テキストをワードにトークン化するワードブレーカをさらに含むことを特徴とする請求項15に記載のシステム。
- 前記限定プロセスは断続的に中断されて、前記限定プロセスのハイジャックを防止するようにさらに構成されることを特徴とする請求項14に記載のシステム。
- 前記プロトコルハンドラは、前記文書を前記データソースから検索する前に、文書識別子を前記インデクサと照合することを特徴とする請求項14に記載のシステム。
- インデクサから文書識別子を受け取ること、
前記文書識別子をインデクサと照合すること、
前記文書識別子に対応する文書を検索すること、
前記文書を限定セキュリティ設定下で処理すること、
前記処理済み文書を前記インデクサに転送すること、および
セキュリティを侵害する機会が制限されるように、前記限定セキュリティ設定下での処理を断続的に中断すること、
を含む、文書の安全なフルテキストインデックス処理のためのコンピュータ実行可能命令を備えたことを特徴とするコンピュータ可読媒体。 - 前記文書を限定セキュリティ設定下で処理することは、フィルタおよびワードブレーカの少なくとも一方を使用して文書を処理することをさらに含むことを特徴とする請求項19に記載のコンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/072,726 | 2005-03-03 | ||
US11/072,726 US7392253B2 (en) | 2005-03-03 | 2005-03-03 | System and method for secure full-text indexing |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006244505A true JP2006244505A (ja) | 2006-09-14 |
JP2006244505A5 JP2006244505A5 (ja) | 2009-03-26 |
JP5005930B2 JP5005930B2 (ja) | 2012-08-22 |
Family
ID=36429893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006058440A Expired - Fee Related JP5005930B2 (ja) | 2005-03-03 | 2006-03-03 | 安全なフルテキストインデックス処理のためのシステムおよび方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7392253B2 (ja) |
EP (1) | EP1698987B1 (ja) |
JP (1) | JP5005930B2 (ja) |
KR (1) | KR101238595B1 (ja) |
CN (1) | CN100550017C (ja) |
AT (1) | ATE504881T1 (ja) |
DE (1) | DE602006021086D1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030135499A1 (en) | 2002-01-14 | 2003-07-17 | Schirmer Andrew Lewis | System and method for mining a user's electronic mail messages to determine the user's affinities |
US8131674B2 (en) | 2004-06-25 | 2012-03-06 | Apple Inc. | Methods and systems for managing data |
US8538997B2 (en) * | 2004-06-25 | 2013-09-17 | Apple Inc. | Methods and systems for managing data |
US7805416B1 (en) * | 2005-09-30 | 2010-09-28 | Emc Corporation | File system query and method of use |
US7624099B2 (en) * | 2005-10-13 | 2009-11-24 | Microsoft Corporation | Client-server word-breaking framework |
US7849065B2 (en) * | 2007-07-20 | 2010-12-07 | Microsoft Corporation | Heterogeneous content indexing and searching |
US7725454B2 (en) * | 2007-07-20 | 2010-05-25 | Microsoft Corporation | Indexing and searching of information including handler chaining |
US8479203B2 (en) * | 2009-07-24 | 2013-07-02 | International Business Machines Corporation | Reducing processing overhead and storage cost by batching task records and converting to audit records |
JP2011065546A (ja) * | 2009-09-18 | 2011-03-31 | Hitachi Solutions Ltd | ファイル検索システム及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5905980A (en) * | 1996-10-31 | 1999-05-18 | Fuji Xerox Co., Ltd. | Document processing apparatus, word extracting apparatus, word extracting method and storage medium for storing word extracting program |
US6381602B1 (en) * | 1999-01-26 | 2002-04-30 | Microsoft Corporation | Enforcing access control on resources at a location other than the source location |
US20030158867A1 (en) * | 2002-01-14 | 2003-08-21 | Goodwin James P. | System and method for mapping knowledge data based on user's affinity to knowledge |
JP2003529133A (ja) * | 1999-11-08 | 2003-09-30 | イメージタグ インコーポレイテッド | デジタルファイリングのための装置および方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5182705A (en) * | 1989-08-11 | 1993-01-26 | Itt Corporation | Computer system and method for work management |
US5864683A (en) * | 1994-10-12 | 1999-01-26 | Secure Computing Corporartion | System for providing secure internetwork by connecting type enforcing secure computers to external network for limiting access to data based on user and process access rights |
US5659746A (en) * | 1994-12-30 | 1997-08-19 | Aegis Star Corporation | Method for storing and retrieving digital data transmissions |
US5742807A (en) * | 1995-05-31 | 1998-04-21 | Xerox Corporation | Indexing system using one-way hash for document service |
US7031954B1 (en) * | 1997-09-10 | 2006-04-18 | Google, Inc. | Document retrieval system with access control |
US6321334B1 (en) * | 1998-07-15 | 2001-11-20 | Microsoft Corporation | Administering permissions associated with a security zone in a computer system security model |
US6732087B1 (en) * | 1999-10-01 | 2004-05-04 | Trialsmith, Inc. | Information storage, retrieval and delivery system and method operable with a computer network |
JP3918374B2 (ja) * | 1999-09-10 | 2007-05-23 | 富士ゼロックス株式会社 | 文書検索装置および方法 |
GB2362972A (en) * | 2000-06-02 | 2001-12-05 | Res Summary Com | An internet based searchable database for up to date financial executive summaries with links to full documents |
US6574617B1 (en) * | 2000-06-19 | 2003-06-03 | International Business Machines Corporation | System and method for selective replication of databases within a workflow, enterprise, and mail-enabled web application server and platform |
US6959326B1 (en) | 2000-08-24 | 2005-10-25 | International Business Machines Corporation | Method, system, and program for gathering indexable metadata on content at a data repository |
US7669051B2 (en) * | 2000-11-13 | 2010-02-23 | DigitalDoors, Inc. | Data security system and method with multiple independent levels of security |
US7185364B2 (en) * | 2001-03-21 | 2007-02-27 | Oracle International Corporation | Access system interface |
US7017183B1 (en) * | 2001-06-29 | 2006-03-21 | Plumtree Software, Inc. | System and method for administering security in a corporate portal |
US20050108200A1 (en) * | 2001-07-04 | 2005-05-19 | Frank Meik | Category based, extensible and interactive system for document retrieval |
US20030177124A1 (en) * | 2002-03-18 | 2003-09-18 | Al Sauri | System for searching secure servers |
EP1563402A4 (en) * | 2002-10-30 | 2010-11-10 | Portauthority Technologies Inc | METHOD AND SYSTEM FOR ADMINISTRATING CONFIDENTIAL INFORMATION |
US7490116B2 (en) * | 2003-01-23 | 2009-02-10 | Verdasys, Inc. | Identifying history of modification within large collections of unstructured data |
-
2005
- 2005-03-03 US US11/072,726 patent/US7392253B2/en not_active Expired - Fee Related
-
2006
- 2006-02-02 AT AT06101205T patent/ATE504881T1/de not_active IP Right Cessation
- 2006-02-02 DE DE602006021086T patent/DE602006021086D1/de active Active
- 2006-02-02 EP EP06101205A patent/EP1698987B1/en not_active Not-in-force
- 2006-02-08 KR KR1020060012089A patent/KR101238595B1/ko active IP Right Grant
- 2006-02-10 CN CNB2006100037904A patent/CN100550017C/zh not_active Expired - Fee Related
- 2006-03-03 JP JP2006058440A patent/JP5005930B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5905980A (en) * | 1996-10-31 | 1999-05-18 | Fuji Xerox Co., Ltd. | Document processing apparatus, word extracting apparatus, word extracting method and storage medium for storing word extracting program |
US6381602B1 (en) * | 1999-01-26 | 2002-04-30 | Microsoft Corporation | Enforcing access control on resources at a location other than the source location |
JP2003529133A (ja) * | 1999-11-08 | 2003-09-30 | イメージタグ インコーポレイテッド | デジタルファイリングのための装置および方法 |
US20030158867A1 (en) * | 2002-01-14 | 2003-08-21 | Goodwin James P. | System and method for mapping knowledge data based on user's affinity to knowledge |
Also Published As
Publication number | Publication date |
---|---|
US20060200446A1 (en) | 2006-09-07 |
JP5005930B2 (ja) | 2012-08-22 |
US7392253B2 (en) | 2008-06-24 |
EP1698987B1 (en) | 2011-04-06 |
CN100550017C (zh) | 2009-10-14 |
EP1698987A1 (en) | 2006-09-06 |
ATE504881T1 (de) | 2011-04-15 |
KR101238595B1 (ko) | 2013-02-28 |
CN1828589A (zh) | 2006-09-06 |
DE602006021086D1 (de) | 2011-05-19 |
KR20060096281A (ko) | 2006-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5005930B2 (ja) | 安全なフルテキストインデックス処理のためのシステムおよび方法 | |
US10963578B2 (en) | Methods and systems for preventing transmission of sensitive data from a remote computer device | |
US10102238B2 (en) | Multi-user search system using tokens | |
US8516591B2 (en) | Security monitoring | |
US8800043B2 (en) | Pre-emptive pre-indexing of sensitive and vulnerable assets | |
JP5165126B2 (ja) | 予め選択されたデータを含むメッセージを取り扱う方法及び装置 | |
KR101122821B1 (ko) | 아이템 저장소를 위한 바이러스 방지 | |
US10521423B2 (en) | Apparatus and methods for scanning data in a cloud storage service | |
US20060259854A1 (en) | Structuring an electronic document for efficient identification and use of document parts | |
US20150088933A1 (en) | Controlling disclosure of structured data | |
US8079065B2 (en) | Indexing encrypted files by impersonating users | |
US11062129B2 (en) | Systems and methods for enabling search services to highlight documents | |
US9081784B2 (en) | Delta indexing method for hierarchy file storage | |
US7703139B2 (en) | Antivirus product using in-kernal cache of file state | |
US9053108B2 (en) | File system extended attribute support in an operating system with restricted extended attributes | |
JP6194180B2 (ja) | 文章マスク装置及び文章マスクプログラム | |
US11526609B1 (en) | System and method for recent file malware scanning | |
CN115186255B (zh) | 工业主机白名单提取方法、装置、终端设备以及存储介质 | |
RU2802539C1 (ru) | Способ выявления угроз информационной безопасности (варианты) | |
US20170293645A1 (en) | Organizing multiple versions of content | |
US11496444B1 (en) | Enforcing access control to resources of an indexing system using resource paths | |
US20220083645A1 (en) | Information processing apparatus, information processing method, and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110819 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120518 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120524 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150601 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5005930 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |