JP2013506215A - データの確率的処理方法およびシステム - Google Patents
データの確率的処理方法およびシステム Download PDFInfo
- Publication number
- JP2013506215A JP2013506215A JP2012531281A JP2012531281A JP2013506215A JP 2013506215 A JP2013506215 A JP 2013506215A JP 2012531281 A JP2012531281 A JP 2012531281A JP 2012531281 A JP2012531281 A JP 2012531281A JP 2013506215 A JP2013506215 A JP 2013506215A
- Authority
- JP
- Japan
- Prior art keywords
- bits
- data
- tuple
- matrix
- hash functions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/02—Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
- H04L63/0227—Filtering policies
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Optimization (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Complex Calculations (AREA)
Abstract
Description
の形のしきい値超過クエリにも回答することができる。認識されるように、構成から、行列の各行が計上するのは、最終ビットマップにおいてセットされているビットの高々1/Kである(Kは、使用される独立なハッシュ関数の個数)。これはもちろん控えめな推定値である。というのは、相異なる行のセットビットが重複する可能性があるからである。そこで、濃度が所定しきい値を超過する集合Sxiに対応するビットマップBxiは、少なくともNthreshビットがセットされているはずであると仮定される。その結果、行
[Hk(x),m] ∀k∈1...K,m∈1...M
のそれぞれは、少なくともNthresh/Kビットがセットされているはずであり、しきい値超過イベントは以下のように検出できる。
[Hk(x1),Hk(x2)] ∀k∈1...K
のビットがセットされる。
[Hk(x1),Hk(x2)] ∀k∈1...K
のすべてのビットがセットされている場合、「真」を返す。これは、タプル(x1,x2)が、(偽陽性確率を考慮に入れると)少なくとも高い確率でデータ構造に含まれていることを意味する。そうでない場合、すなわち、関連するビットのうちのただ1つでもセットされていない場合、「偽」を返す。これは、タプル(x1,x2)がデータ構造に決して含まれていないことを意味する。
[Hk(x),m] ∀k∈1...K,m∈1...M
の論理的ORとしてビットマップBx1を計算する。こうして計算されたBx1において少なくともKビット(すなわち、図2の実施形態では2ビット)がセットされている場合、「真」を返す。例示した状況では、全部で7ビットがセットされているので、これは((x1,*)の形のタプルの形式で)値x1が、(偽陽性確率を考慮に入れると)少なくとも高い確率でデータ構造に含まれていることを意味する。そうでない場合、「偽」を返すことになる。これは、(x1,*)の形のタプルがデータ構造には決して含まれていないことを意味する。
Claims (16)
- データの確率的処理方法において、前記データは、(x1,...,xn)の形の多次元n−タプルからなるデータ集合Sの形式で提供され、
ビット行列を用意し、
前記行列内のビットを指定するために使用されるK個の独立なハッシュ関数Hkを用意し、
前記K個の独立なハッシュ関数Hkのそれぞれについて前記n−タプルのすべての値xに対するハッシュ値Hk(x)を計算して結果を前記行列のビット[Hk(x1),...,Hk(xn)]にセットすることにより前記ビット行列に前記n−タプル(x1,...,xn)を挿入する、
ことによってn次元データ構造が生成されることを特徴とする、データの確率的処理方法。 - 前記ビット行列がM行およびN列を有し、数MおよびNが、前記データ集合Sの前記n−タプルの可能な値xの濃度に適応されることを特徴とする請求項1に記載の方法。
- n−タプル(x1,...,xn)の単純メンバーシップクエリが、
前記K個の独立なハッシュ関数Hkのそれぞれについて前記n−タプルのすべての値xに対するハッシュ値Hk(x)を計算し、
前記K個の独立なハッシュ関数Hkのそれぞれについて位置[Hk(x1),...,Hk(xn)]における前記行列のすべてのビットがセットされているかどうかを分析する、
ことによって実行されることを特徴とする請求項1または2に記載の方法。 - 前記K個の独立なハッシュ関数Hkのそれぞれについて位置[Hk(x1),...,Hk(xn)]における前記行列のすべてのビットがセットされている場合、出力「真」が返されることを特徴とする請求項3に記載の方法。
- 1次元だけで確定した値xiを含むn−タプルのワイルドカードクエリ、すなわち単純ワイルドカードクエリが、
前記K個の独立なハッシュ関数Hkのそれぞれについて前記n−タプルの確定値xiに対するハッシュ値Hk(xi)を計算し、
K個のビットマップ[Hk(x),m](∀k∈1...K,m∈1...M)の論理的ORとしてビットマップBxiを計算する、
ことによって実行されることを特徴とする請求項1ないし4のいずれか1項に記載の方法。 - 前記ビットマップBxiにおいて少なくともKビットがセットされている場合、出力「真」が返されることを特徴とする請求項5に記載の方法。
- 複合ワイルドカードクエリが、
前記複合ワイルドカードクエリを構成するすべての単純ワイルドカードクエリの前記ビットマップBxiを計算し、
前記ビットマップBxiの間のビットごとの演算により集約ビットマップを計算する、
ことによって実行されることを特徴とする請求項5または6に記載の方法。 - 積集合演算子が論理的AND演算にマップされることを特徴とする請求項7に記載の方法。
- 和集合演算子が論理的OR演算にマップされることを特徴とする請求項7または8に記載の方法。
- 前記集約ビットマップにおいて少なくともKビットがセットされている場合、出力「真」が返されることを特徴とする請求項7ないし9のいずれか1項に記載の方法。
- 前記ビットマップBxiに基づいて、単純および複合両方のワイルドカード条件を満たすn−タプルの集合にわたる濃度クエリに対して回答されることを特徴とする請求項5ないし10のいずれか1項に記載の方法。
- しきい値超過イベントが、
しきい値を設定し、
1次元ブルームフィルタによる前記設定しきい値に対応するセットビットの個数Nthreshを計算し、
前記ビット行列の各行について、Nthresh/Kより多くのビットがセットされているかどうかチェックする、
ことにより検出されることを特徴とする請求項1ないし11のいずれか1項に記載の方法。 - 前記ビット行列の少なくともK行がNthresh/Kより多くのセットビットを含む場合、出力「真」が返されることを特徴とする請求項12に記載の方法。
- データの確率的処理システム、特に請求項1ないし13のいずれか1項に記載の方法を実行するシステムにおいて、前記データは、(x1,...,xn)の形の多次元n−タプルからなるデータ集合Sの形式で提供され、該システムは、
前記n−タプルを受容する入出力要素と、
ビット行列を用意し、前記行列内のビットを指定するために使用されるK個の独立なハッシュ関数Hkを用意し、前記K個の独立なハッシュ関数Hkのそれぞれについて前記n−タプルのすべての値xに対するハッシュ値Hk(x)を計算して結果を前記行列のビット[Hk(x1),...,Hk(xn)]にセットすることにより前記ビット行列に前記n−タプル(x1,...,xn)を挿入する、ことによってn次元データ構造を生成する処理要素と、
前記ビット行列を保存する保存要素と
を備えたことを特徴とする、データの確率的処理システム。 - 前記入出力要素が、単純メンバーシップクエリ、単純および/または複合ワイルドカードクエリ、および/またはしきい値超過クエリを受容するように構成されることを特徴とする請求項14に記載のシステム。
- ネットワークであって、
該ネットワークにわたって配備され、パケットの送信元アドレスおよび宛先アドレスを観測することによりネットワークパケットモニタリングを実行する複数のネットワークプローブと、
前記ネットワークプローブから、それぞれのネットワークプローブによって観測された送信元アドレスおよび宛先アドレスのペアのサマリを含むモニタリングレポートを受容するように構成されたモニタリングアプリケーションと
を備え、
前記ネットワークプローブおよび前記モニタリングアプリケーションが、前記サマリの生成および/またはクエリを実行するために請求項1ないし13のいずれか1項に記載の方法を使用するように構成される
ことを特徴とするネットワーク。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09012319 | 2009-09-29 | ||
EP09012319.1 | 2009-09-29 | ||
PCT/EP2010/005942 WO2011038899A1 (en) | 2009-09-29 | 2010-09-29 | Method and system for probabilistic processing of data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013506215A true JP2013506215A (ja) | 2013-02-21 |
JP5490905B2 JP5490905B2 (ja) | 2014-05-14 |
Family
ID=43500486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012531281A Expired - Fee Related JP5490905B2 (ja) | 2009-09-29 | 2010-09-29 | データの確率的処理方法およびシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9305265B2 (ja) |
EP (1) | EP2483851A1 (ja) |
JP (1) | JP5490905B2 (ja) |
WO (1) | WO2011038899A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101476039B1 (ko) * | 2013-06-19 | 2014-12-23 | 세명대학교 산학협력단 | 데이터베이스 암호화 방법 및 이의 실시간 검색 방법 |
JP2017526081A (ja) * | 2014-08-28 | 2017-09-07 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 2次元フィルタの生成方法、クエリ方法、及び装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5745464B2 (ja) * | 2012-06-15 | 2015-07-08 | 日本電信電話株式会社 | アクセス履歴記憶及び検索装置及び方法 |
AU2013317706B2 (en) * | 2012-09-21 | 2017-05-11 | Myriota Pty Ltd | Multi-access communication system |
US9465826B2 (en) * | 2012-11-27 | 2016-10-11 | Hewlett Packard Enterprise Development Lp | Estimating unique entry counts using a counting bloom filter |
US20140172927A1 (en) * | 2012-12-19 | 2014-06-19 | Htc Corporation | File information processing method and portable device |
CN103678550B (zh) * | 2013-09-09 | 2017-02-08 | 南京邮电大学 | 一种基于动态索引结构的海量数据实时查询方法 |
US9886513B2 (en) | 2015-05-25 | 2018-02-06 | International Business Machines Corporation | Publish-subscribe system with reduced data storage and transmission requirements |
US10320749B2 (en) * | 2016-11-07 | 2019-06-11 | Nicira, Inc. | Firewall rule creation in a virtualized computing environment |
CN111881312B (zh) * | 2020-07-24 | 2022-07-05 | 成都成信高科信息技术有限公司 | 一种图像数据集分类划分方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009065413A (ja) * | 2007-09-06 | 2009-03-26 | Oki Electric Ind Co Ltd | 記憶制御装置、方法及びプログラム、並びに、情報監視装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6212184B1 (en) * | 1998-07-15 | 2001-04-03 | Washington University | Fast scaleable methods and devices for layer four switching |
US7865608B1 (en) * | 2005-01-21 | 2011-01-04 | Oracle America, Inc. | Method and apparatus for fast and scalable matching of structured data streams |
ATE520270T1 (de) * | 2007-06-15 | 2011-08-15 | Ericsson Telefon Ab L M | Verfahren zum entdecken von sich überlappenden zellen |
US8005868B2 (en) * | 2008-03-07 | 2011-08-23 | International Business Machines Corporation | System and method for multiple distinct aggregate queries |
-
2010
- 2010-09-29 WO PCT/EP2010/005942 patent/WO2011038899A1/en active Application Filing
- 2010-09-29 EP EP10773239A patent/EP2483851A1/en not_active Withdrawn
- 2010-09-29 JP JP2012531281A patent/JP5490905B2/ja not_active Expired - Fee Related
- 2010-09-29 US US13/498,943 patent/US9305265B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009065413A (ja) * | 2007-09-06 | 2009-03-26 | Oki Electric Ind Co Ltd | 記憶制御装置、方法及びプログラム、並びに、情報監視装置 |
Non-Patent Citations (4)
Title |
---|
CSNG200700890010; 清雄一、外2名: 'variable-size DBFによる分散ハッシュテーブルのトラヒック量削減' 電子情報通信学会論文誌 第J90-D巻,第9号, 20070901, p.2378-2387, 社団法人電子情報通信学会 * |
CSNG200900206004; 的野晃整、外1名: '分散RDF問合せ処理時の転送量減少のためのブルームフィルタの拡張' 情報処理学会論文誌 論文誌トランザクション 平成20年度(2)[CD-ROM] 第2巻,第1号, 20090415, p.33-45, 社団法人情報処理学会 * |
JPN6013032093; 的野晃整、外1名: '分散RDF問合せ処理時の転送量減少のためのブルームフィルタの拡張' 情報処理学会論文誌 論文誌トランザクション 平成20年度(2)[CD-ROM] 第2巻,第1号, 20090415, p.33-45, 社団法人情報処理学会 * |
JPN6013032095; 清雄一、外2名: 'variable-size DBFによる分散ハッシュテーブルのトラヒック量削減' 電子情報通信学会論文誌 第J90-D巻,第9号, 20070901, p.2378-2387, 社団法人電子情報通信学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101476039B1 (ko) * | 2013-06-19 | 2014-12-23 | 세명대학교 산학협력단 | 데이터베이스 암호화 방법 및 이의 실시간 검색 방법 |
JP2017526081A (ja) * | 2014-08-28 | 2017-09-07 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 2次元フィルタの生成方法、クエリ方法、及び装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2011038899A1 (en) | 2011-04-07 |
US9305265B2 (en) | 2016-04-05 |
US20120271940A1 (en) | 2012-10-25 |
JP5490905B2 (ja) | 2014-05-14 |
EP2483851A1 (en) | 2012-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5490905B2 (ja) | データの確率的処理方法およびシステム | |
US9848004B2 (en) | Methods and systems for internet protocol (IP) packet header collection and storage | |
Yuan et al. | ProgME: towards programmable network measurement | |
US7903566B2 (en) | Methods and systems for anomaly detection using internet protocol (IP) traffic conversation data | |
CN111371735B (zh) | 僵尸网络检测方法、系统及存储介质 | |
US8762515B2 (en) | Methods and systems for collection, tracking, and display of near real time multicast data | |
Mahmood et al. | Critical infrastructure protection: Resource efficient sampling to improve detection of less frequent patterns in network traffic | |
US20100046393A1 (en) | Methods and systems for internet protocol (ip) traffic conversation detection and storage | |
US11706114B2 (en) | Network flow measurement method, network measurement device, and control plane device | |
Callegari et al. | When randomness improves the anomaly detection performance | |
Liu et al. | Near-optimal approximate membership query over time-decaying windows | |
Wang et al. | Utilizing dynamic properties of sharing bits and registers to estimate user cardinalities over time | |
Alsuhibany | A space-and-time efficient technique for big data security analytics | |
Wang et al. | Virtual indexing based methods for estimating node connection degrees | |
Yao et al. | Identifying frequent flows in large datasets through probabilistic bloom filters | |
Guan et al. | A new data streaming method for locating hosts with large connection degree | |
US8842690B2 (en) | System, method, and media for network traffic measurement on high-speed routers | |
Cao et al. | Finding persistent elements of anomalous flows in distributed monitoring systems | |
Patcha et al. | Detecting denial-of-service attacks with incomplete audit data | |
Wang et al. | Continuously distinct sampling over centralized and distributed high speed data streams | |
Lahiri | Detecting exploit patterns from network packet streams | |
Soleimani et al. | Critical episode mining in intrusion detection alerts | |
Callegari et al. | Detecting heavy change in the heavy hitter distribution of network traffic | |
Mahmood et al. | Hierarchical summarization techniques for network traffic | |
Callegari et al. | Forecasting the distribution of network traffic for anomaly detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130703 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131002 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131009 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131031 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131108 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131202 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5490905 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |