CA2841027C - Identification rapide de chaines complexes dans un flux de donnees - Google Patents

Identification rapide de chaines complexes dans un flux de donnees Download PDF

Info

Publication number
CA2841027C
CA2841027C CA2841027A CA2841027A CA2841027C CA 2841027 C CA2841027 C CA 2841027C CA 2841027 A CA2841027 A CA 2841027A CA 2841027 A CA2841027 A CA 2841027A CA 2841027 C CA2841027 C CA 2841027C
Authority
CA
Canada
Prior art keywords
string
complex
segment
dictionary
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CA2841027A
Other languages
English (en)
Other versions
CA2841027A1 (fr
Inventor
Kevin Gerard Boyce
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Trend Micro Inc
Original Assignee
Trend Micro Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Trend Micro Inc filed Critical Trend Micro Inc
Priority to CA2841027A priority Critical patent/CA2841027C/fr
Publication of CA2841027A1 publication Critical patent/CA2841027A1/fr
Application granted granted Critical
Publication of CA2841027C publication Critical patent/CA2841027C/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3341Query execution using boolean model

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

Un procédé pour détecter et localiser lapparition dans un flux de données de toute chaîne complexe appartenant à un dictionnaire complexe prédéfini est décrit. Une chaîne complexe peut comprendre un nombre arbitraire de chaînes cohérentes entrelacées et de chaînes ambiguës. Le procédé comprend un premier processus visant à transformer le dictionnaire complexe en une structure simple pour permettre de mener continuellement une recherche efficace sur le plan des calculs et un deuxième processus pour examiner les données reçues en temps réel à laide de la structure simple. Le procédé peut être accompli par un article manufacturé comprenant au moins un support lisible par processeur et des instructions figurant sur le au moins un support. Les instructions amènent un processeur à apparier les données examinées à une chaîne complexe d'objets appartenant au dictionnaire complexe, le processus d'appariement étant fondé sur l'égalité à des chaînes cohérentes constituantes et sur la congruence à des chaînes ambiguës, de la chaîne complexe de l'objet.
CA2841027A 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees Active CA2841027C (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CA2841027A CA2841027C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA2841027A CA2841027C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees
CA2579561A CA2579561C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CA2579561A Division CA2579561C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees

Publications (2)

Publication Number Publication Date
CA2841027A1 CA2841027A1 (fr) 2008-08-26
CA2841027C true CA2841027C (fr) 2014-10-07

Family

ID=39718240

Family Applications (4)

Application Number Title Priority Date Filing Date
CA2855382A Active CA2855382C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees
CA2579561A Active CA2579561C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees
CA2855398A Active CA2855398C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees
CA2841027A Active CA2841027C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CA2855382A Active CA2855382C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees
CA2579561A Active CA2579561C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees
CA2855398A Active CA2855398C (fr) 2007-02-26 2007-02-26 Identification rapide de chaines complexes dans un flux de donnees

Country Status (1)

Country Link
CA (4) CA2855382C (fr)

Also Published As

Publication number Publication date
CA2855382C (fr) 2015-08-25
CA2855398C (fr) 2015-07-14
CA2855382A1 (fr) 2008-08-26
CA2579561C (fr) 2014-10-07
CA2841027A1 (fr) 2008-08-26
CA2579561A1 (fr) 2008-08-26
CA2855398A1 (fr) 2008-08-26

Similar Documents

Publication Publication Date Title
US8812547B2 (en) Fast identification of complex strings in a data stream
JP3077765B2 (ja) 語彙辞書の検索範囲を削減するシステム及び方法
Navarro Spaces, trees, and colors: The algorithmic landscape of document retrieval on sequences
KR100414236B1 (ko) 데이터의 검색을 위한 서치 시스템 및 방법
US5977890A (en) Method and apparatus for data compression utilizing efficient pattern discovery
JP2726568B2 (ja) 文字認識方法及び装置
JP2790466B2 (ja) 文字列検索方法及び装置
US20070198566A1 (en) Method and apparatus for efficient storage of hierarchical signal names
CA2841027C (fr) Identification rapide de chaines complexes dans un flux de donnees
CA2873011C (fr) Identification rapide de chaines complexes dans un flux de donnees
Fujino et al. Discovering unordered and ordered phrase association patterns for text mining
Daciuk et al. Gazetteer compression technique based on substructure recognition
Straszyński et al. Faster Recovery of Approximate Periods
Singer A wavelet tree based fm-index for biological sequences in seqan
Arimura et al. Discovering Unordered and Ordered Phrase Association Patterns for Text Mining
Giegerich et al. E cient implementation of lazy su x trees
Sherriff A TRIE-TREE with sequential filial pointers
Garg Cross Lingual Information Retrieval and Error Tracking in search engine
NO311657B1 (no) Sökesystem og fremgangsmåte til gjenfinning av data, og bruken derav i en sökemotor

Legal Events

Date Code Title Description
EEER Examination request

Effective date: 20140130