JP2006012140A - Anomaly detection in data perspective - Google Patents
Anomaly detection in data perspective Download PDFInfo
- Publication number
- JP2006012140A JP2006012140A JP2005163148A JP2005163148A JP2006012140A JP 2006012140 A JP2006012140 A JP 2006012140A JP 2005163148 A JP2005163148 A JP 2005163148A JP 2005163148 A JP2005163148 A JP 2005163148A JP 2006012140 A JP2006012140 A JP 2006012140A
- Authority
- JP
- Japan
- Prior art keywords
- data
- perspective
- anomaly
- user
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 76
- 230000008569 process Effects 0.000 claims abstract description 35
- 238000012886 linear function Methods 0.000 claims abstract description 8
- 230000005856 abnormality Effects 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 11
- 230000003068 static effect Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims 2
- 230000001419 dependent effect Effects 0.000 claims 1
- 230000000007 visual effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 31
- 239000000047 product Substances 0.000 description 15
- 230000002159 abnormal effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 238000003860 storage Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 238000007418 data mining Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000002547 anomalous effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000005055 memory storage Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000012047 cause and effect analysis Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/953—Organization of data
- Y10S707/957—Multidimensional
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/953—Organization of data
- Y10S707/958—Data cubes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
Abstract
Description
本発明は、一般にはデータマイニングに関し、より詳細には、データパースペクティブ(data perspectives)の自動的なデータ異常検出(data anomaly detection)を提供するシステムおよび方法に関する。 The present invention relates generally to data mining, and more particularly to a system and method for providing automatic data anomaly detection of data perspectives.
情報をデジタル化することにより、膨大な量のデータを驚くほど少量の空間に記憶することができる。この手法は、例えば、図書館の蔵書の記憶を1つのコンピュータハードドライブに取り込むことを可能にする。これは、データがバイナリ状態に変換され、その状態で、デジタル符号化デバイスを介して、ハードドライブ、CD−ROMディスク、フロッピー(登録商標)ディスクなどの各種のデジタル記憶媒体に記憶することができるために可能になる。デジタル記憶技術の発展に伴い、記憶装置の密度は、以前に比べて所与の量の空間にかなり多くのデータを記憶できるようになっており、データの密度は、主に物理的特性と製法によって制限される。 By digitizing information, a huge amount of data can be stored in a surprisingly small amount of space. This approach, for example, allows library library storage to be captured on a single computer hard drive. In this state, data is converted into a binary state, and can be stored in various digital storage media such as a hard drive, a CD-ROM disk, and a floppy (registered trademark) disk through the digital encoding device. To be possible. With the development of digital storage technology, the density of storage devices has been able to store much more data in a given amount of space than before, and the density of data mainly depends on physical properties and manufacturing methods. Limited by.
記憶容量の増大に伴い、効果的なデータ検索の課題も増えており、データに容易にアクセスできることが最も重要視される。例えば、ある本が図書館にあるが、その本を見つけられないのでは、その本を読みたい利用者の役に立たない。同様に、データに容易にアクセスできるのでなければ、単にデータをデジタル化することは、前進とはならない。この結果、効率的なデータ検索を助けるデータ構造が作成された。そうした構造は、一般には「データベース」として知られる。データベースは、構造化されたフォーマットでデータを保持して、データへの効率的なアクセスを提供する。データ記憶を構造化することにより、構造化されていないデータ記憶に比べてデータ検索の効率を高めることができる。索引付けおよび他の編成技術も利用することができる。データと併せてデータ間の関係も記憶して、データの価値を高めることができる。 As the storage capacity increases, there are increasing issues of effective data retrieval, and it is most important that data can be easily accessed. For example, if a book is in a library but cannot find it, it will not help the user who wants to read the book. Similarly, simply digitizing data is not a step forward unless the data is easily accessible. As a result, a data structure that helps efficient data retrieval was created. Such a structure is commonly known as a “database”. A database holds data in a structured format and provides efficient access to the data. By structuring the data store, the efficiency of data retrieval can be increased compared to an unstructured data store. Indexing and other organization techniques can also be utilized. In addition to data, the relationship between data can be stored to increase the value of the data.
データベース開発の初期には、ユーザは、「生データ」、すなわちデータベースに入力された通りに表示されるデータを見るのが一般的であった。最終的に、より効率的な方式でデータをフォーマットし、操作し、閲覧できるようにする技術が開発された。これにより、ユーザは、例えば、データに数学演算子を適用し、さらには報告書を作成することができるようになった。ビジネスユーザは、個々の売上高だけを含むデータベースのデータから「総売上高」などの情報にアクセスできるようになった。ユーザインターフェースの開発が続けられて、使いやすいフォーマットでデータを検索し、表示することがさらに容易になった。ユーザは、最終的には、個々の売上高からの総売上高のようなデータの異なるビューで、データベースの生データから追加的な情報を得られることを認識するようになった。この追加的なデータの収集は、「データマイニング」として知られ、「メタデータ」(データについてのデータ)を生成する。データマイニングで、生データから有用な追加的情報を抽出することができる。これは、特に、企業の売上げや生産高の理由を説明する情報を見つけることができるビジネスにおいて有用であり、データベースの生の入力データだけから得られる結果より優れる。 In the early days of database development, it was common for users to see “raw data”, ie data displayed as entered into the database. Eventually, technologies were developed that allow data to be formatted, manipulated, and viewed in a more efficient manner. This allows the user to apply mathematical operators to the data and create reports, for example. Business users can now access information such as “total sales” from database data that includes only individual sales. User interface development continued, making it easier to search and display data in an easy-to-use format. Users eventually realized that they could obtain additional information from raw data in the database with different views of the data, such as total sales from individual sales. This collection of additional data is known as “data mining” and produces “metadata” (data about the data). Data mining can extract useful additional information from raw data. This is particularly useful in businesses where information can be found that explains the reasons for a company's sales or output, and is superior to results obtained from raw input data in a database alone.
したがって、データの操作により、生データからきわめて重要な情報を抽出することができる。このデータ操作は、記憶されたデータのデジタル性のために可能になる。莫大な量のデジタル化されたデータを、手作業で試みた場合よりもかなり高速に、様々な側面から見ることができる。データの新しい各パースペクティブは、ユーザが、そのデータについてのさらに洞察を得ることを可能にすることができる。これは、ビジネスがこの概念を用いて成功するか、あるいは用いないで失敗するかを導きかねない、非常に影響力のある概念である。例えば、トレンド分析、原因結果分析、インパクト研究、および予測などを、データベースに入力された生データから求めることができ、その価値と適時性は、デジタル化された情報への直感的で利用しやすいアクセスを備えることにある。 Therefore, extremely important information can be extracted from the raw data by manipulating the data. This data manipulation is possible because of the digital nature of the stored data. Enormous amounts of digitized data can be viewed from various aspects, much faster than if attempted manually. Each new perspective of data can allow the user to gain further insight into the data. This is a very influential concept that can lead to the success or failure of a business using this concept. For example, trend analysis, cause-and-effect analysis, impact research, and prediction can be obtained from raw data entered in the database, and its value and timeliness are intuitive and easy to use for digitized information To have access.
現在、データマイニング機能を高めるためのデータ操作は、各種のデータパースペクティブに誤りデータが含まれないようにするために、相当のユーザ入力とユーザの知識を必要とする。これは、データの深い知識と、データに起こりうる誤りの種類についての見識を持つことをユーザに要求する。この事前の知識がないと、ユーザは、所与のデータパースペクティブに埋もれたデータ異常を見つけることを期待して「行き当たりばったり」式の手法を試みなければならない。この手法は、一般には、たまに利用するユーザには歯が立たず、かつ/または、上級ユーザにとっては時間がかかりすぎる。一般には、記憶されたデータの量は、ユーザが、すべてのデータ異常を確実に見つけるための使用可能な方式を効率的に開発するには、あまりにも膨大で、関係が複雑である。 Currently, data manipulation to enhance the data mining function requires considerable user input and user knowledge in order to prevent error data from being included in various data perspectives. This requires the user to have deep knowledge of the data and insight into the types of errors that can occur in the data. Without this prior knowledge, the user must try a “spot” approach in the hope of finding data anomalies buried in a given data perspective. This approach generally does not add up to occasional users and / or is too time consuming for advanced users. In general, the amount of stored data is too large and complex to allow a user to efficiently develop a usable scheme for reliably finding all data anomalies.
以下に、本発明のいくつかの態様の基本的な理解を提供するために、簡略化した本発明の要約を述べる。この要約は、本発明の広範囲にわたる概要ではない。この要約は、本発明の主要/不可欠な要素を明らかにするものでも、本発明の範囲を定義するものでもない。その唯一の目的は、その後に記載されるより詳細な説明の前置きとして、簡略化した形で本発明のいくつかの概念を述べることである。 The following presents a simplified summary of the invention in order to provide a basic understanding of some aspects of the invention. This summary is not an extensive overview of the invention. This summary is not intended to identify key / essential elements of the invention or to define the scope of the invention. Its sole purpose is to present some concepts of the invention in a simplified form as a prelude to the more detailed description that is presented later.
本発明は、一般的にはデータマイニングに関し、より詳細には、データパースペクティブの自動的なデータ異常検出を提供するシステムおよび方法に関する。データ曲線当てはめ(data curve fitting)技術を活用して、データパースペクティブからの「データチューブ」のデータ異常の自動的な検出を提供する。データチューブは、1つのみの変化するデータ次元を有するデータを含んでいる。これにより、例えば、表計算ピボットテーブルおよび/またはOLAP(オンライン分析処理)キューブなどの中の画面内のデータ異常(on-screen data anomaly)、下方への展開データ異常(drill down data anomaly)、および横方向に展開したデータ異常(drill across data anomaly)などのデータ異常を検出することができる。自動的なデータパースペクティブ分析を提供することにより、本発明は、経験の浅いユーザが、データベースの誤りデータ情報を容易に見つけられるようにする。これは、例えばデータチューブに適用される区分線形関数(a piece-wise linear function)などの曲線当てはめプロセスによって確定される予測値からデータが相当逸脱(deviation)するかどうかを判定することによって達成される。本発明で閾値を用いて、データ値が異常であると見なされる前に必要とされる逸脱の度合いを判定することを助けることもできる。この閾値は、例えばシステムにより、および/またはユーザインターフェースなどを介してユーザにより、動的かつ/または静的に供給されることができる。また、本発明は、検出された異常のタイプと、最上位のデータパースペクティブからの場所を容易にユーザに示すことができ、ユーザがより低いレベルにあるデータ異常を探し求める必要性をなくす。 The present invention relates generally to data mining and, more particularly, to a system and method for providing automatic data anomaly detection in a data perspective. Utilizes data curve fitting technology to provide automatic detection of “data tube” data anomalies from the data perspective. A data tube contains data having only one changing data dimension. This allows, for example, on-screen data anomaly, drill down data anomaly, and down-down data anomaly in spreadsheets and / or OLAP (online analytical processing) cubes, etc. It is possible to detect data anomalies such as laterally developed data anomalies (drill across data anomaly). By providing automatic data perspective analysis, the present invention allows inexperienced users to easily find erroneous data information in a database. This is accomplished by determining if the data deviates significantly from the predicted value established by a curve fitting process, such as a piece-wise linear function applied to the data tube. The The threshold can also be used in the present invention to help determine the degree of deviation required before a data value is considered abnormal. This threshold can be provided dynamically and / or statically, for example by the system and / or by the user, such as via a user interface. The present invention also allows the user to easily indicate the type of anomaly detected and the location from the top data perspective, eliminating the need for the user to search for data anomalies at a lower level.
前述の目的とそれに関連する目的を達成するために、以下の説明と添付図面との関連で本発明の例示的態様を本明細書に記載する。ただし、それらの態様は、本発明の原理を用いることが可能な各種方式の数例を示すに過ぎず、本発明は、そのような態様とその均等物をすべて包含するものとする。本発明の他の利点と新規の特徴は、図面と併せて以下の本発明の詳細な説明を検討することから明らかになろう。 To the accomplishment of the foregoing and related ends, illustrative aspects of the invention are described herein in connection with the following description and the annexed drawings. However, these modes merely show some examples of various systems in which the principle of the present invention can be used, and the present invention includes all such modes and equivalents thereof. Other advantages and novel features of the invention will become apparent from the following detailed description of the invention when considered in conjunction with the drawings.
次いで、図面を参照して本発明を説明する。すべての図面で、同様の要素は同様の参照符号を用いて参照する。以下の説明では、説明の目的で、本発明の完全な理解を提供するために多数の具体的な詳細事項を述べる。しかし、本発明は、それらの具体的な詳細を用いずに実施できることは明らかであろう。他の事例では、本発明の説明を容易にするために、よく知られた構造および装置は、ブロック図の形態で示す。 Next, the present invention will be described with reference to the drawings. In all the drawings, like elements are referred to with like reference numerals. In the following description, for the purposes of explanation, numerous specific details are set forth in order to provide a thorough understanding of the present invention. However, it will be apparent that the invention may be practiced without these specific details. In other instances, well-known structures and devices are shown in block diagram form in order to facilitate describing the present invention.
本願で使用される用語「コンポーネント」は、ハードウェア、ハードウェアとソフトウェアの組合せ、ソフトウェア、あるいは実行中のソフトウェアを問わず、コンピュータに関連するエンティティを指すものとする。例えば、コンポーネントは、これらに限定しないが、プロセッサで実行されるプロセス、プロセッサ、オブジェクト、実行ファイル、実行のスレッド、プログラム、および/またはコンピュータ等である。例示として、サーバで実行されるアプリケーションとサーバの両方がコンピュータコンポーネントとなることができる。プロセスおよび/または実行のスレッドには1つまたは複数のコンポーネントが存在することができ、コンポーネントは、1つのコンピュータに集中させても、かつ/または2つ以上のコンピュータに分散してもよい。「スレッド」とは、オペレーティングシステムカーネルが実行をスケジュールするプロセス中のエンティティである。当技術分野でよく知られるように、各スレッドは、関連付けられた「コンテキスト」を有し、コンテキストは、そのスレッドの実行に関連付けられた揮発性データである。スレッドのコンテキストは、システムレジスタの内容と、そのスレッドのプロセスに属する仮想アドレスを含む。したがって、スレッドのコンテキストからなる実際のデータは、実行時に様々に異なる。 As used herein, the term “component” is intended to refer to an entity associated with a computer, whether hardware, a combination of hardware and software, software, or running software. For example, a component may be, but is not limited to being, a process running on a processor, a processor, an object, an executable, a thread of execution, a program, and / or a computer. By way of illustration, both an application running on a server and the server can be a computer component. There may be one or more components in a process and / or thread of execution, and the components may be centralized on one computer and / or distributed across two or more computers. A “thread” is an entity in the process that the operating system kernel schedules for execution. As is well known in the art, each thread has an associated “context”, which is volatile data associated with the execution of that thread. The context of a thread includes the contents of the system register and a virtual address belonging to the thread's process. Therefore, the actual data consisting of the thread context varies at runtime.
本発明は、自動的に異常データを検出することにより、データパースペクティブの分析を助ける。表示を使用して、特定のデータパースペクティブのいずれかのレベルに誤りデータがある旨の通知をユーザに提供する。このレベルは、例えば、画面内すなわち最上位レベル、および/または現在は表示されておらず、その誤りデータの価値を明らかにするためにデータを下方に展開する、かつ/またはデータを横方向に展開することを必要とするレベルである。このようにして、ユーザは、データ異常が存在することと、その誤りデータを明らかにするために必要とされる労力の量および/またはデータビューを容易に判断することができる。ユーザおよび/またはシステムは、自動的な検出を助けるために、閾値を静的および/または動的に設定することもできる。ユーザは、各種タイプのデータ異常に異なる閾値を選択することもできる。閾値は、データが異常と見なされる前に、データ値がどれだけ逸脱しなければならないかを決定する。この逸脱は、データ値と、1つのみの変化するデータ次元を有するデータチューブに適用される曲線当てはめプロセスから得られる予測データ値とを比較することによって求められる。この曲線当てはめプロセスで利用される関数も、ユーザが選択できるようにすることができる。このように、本発明は、ユーザが、検討するデータの興味ある特性を容易に識別できるようにする。 The present invention aids data perspective analysis by automatically detecting anomalous data. The display is used to provide a notification to the user that there is erroneous data at any level of the particular data perspective. This level is, for example, within the screen, ie the top level, and / or currently not displayed, expanding the data downwards to reveal the value of the erroneous data and / or moving the data horizontally It is a level that needs to be expanded. In this way, the user can easily determine the presence of a data anomaly and the amount of effort and / or data view required to reveal the erroneous data. Users and / or systems can also set thresholds statically and / or dynamically to aid in automatic detection. The user can also select different thresholds for various types of data anomalies. The threshold determines how far the data value must deviate before the data is considered abnormal. This deviation is determined by comparing the data value with the predicted data value obtained from the curve fitting process applied to a data tube having only one changing data dimension. The functions used in this curve fitting process can also be made selectable by the user. Thus, the present invention allows a user to easily identify interesting characteristics of the data being considered.
図1に、本発明の一態様による、自動データパースペクティブ異常検出システム100のブロック図を示す。自動データパースペクティブ異常検出システム100は、データパースペクティブ104を受け取り、自動的にデータ異常106を判定する自動データパースペクティブ異常検出コンポーネント102からなる。データパースペクティブには、これらに限定しないが、表計算ピボットテーブル、OLAPキューブなどが含まれる。オプションの外部閾値入力108を自動データパースペクティブ異常検出コンポーネント102によって利用して、どのデータに異常があるかの判定を助けることができる。例えばシステムによって決定される値および/またはシステムによって決定される逸脱の割合などとして、自動データパースペクティブ異常検出コンポーネント102の一部として閾値を決定することもできる。ユーザによって指定された複数の閾値を本発明で用いて、異なるタイプのデータ異常に利用することもできる。自動データパースペクティブ異常検出コンポーネント102は、データパースペクティブからのデータチューブに適用される曲線当てはめプロセスを利用して、どのデータに異常があるかを判定する。曲線当てはめプロセスは、データ異常の自動的な検出を助ける、ユーザによって指定された関数を取り込むこともできる。
FIG. 1 shows a block diagram of an automatic data perspective
図2を参照すると、本発明の一態様による、自動データパースペクティブ異常検出システム200の別のブロック図が示される。自動データパースペクティブ異常検出システム200は、データチューブコンポーネント204と異常検出コンポーネント206とから構成される自動データパースペクティブ異常検出コンポーネント202からなる。データチューブコンポーネント204は、データパースペクティブ208を受け取り、データパースペクティブ208を処理してデータチューブにする。データチューブは、1つのみの変化するデータ次元を有する、データパースペクティブ208からのデータのスライスからなる。異常検出コンポーネント206は、データチューブを受け取り、曲線当てはめプロセスを利用してデータチューブを処理して、データ異常があるかどうかを判定する。曲線当てはめプロセスは、データチューブ中のデータを推定することが可能な関数を生成することを試みるプロセスから構成される。推定されたデータは、データチューブ中のデータの逸脱スコアを判定するために利用される「予測データ」になる。閾値入力212が異常検出コンポーネント206によって用いられて、許容できる逸脱の量を決定する。閾値入力212は、システムによって生成されても、かつ/またはユーザによって生成されてもよい。異常検出コンポーネント206で閾値入力212を超えると判定されたデータは、異常210として出力される。
Referring to FIG. 2, another block diagram of an automatic data perspective
図3を見ると、本発明の一態様による、自動データパースペクティブ異常検出コンポーネント300のさらに別のブロック図が示される。自動データパースペクティブ異常検出コンポーネント300は、データチューブコンポーネント310と異常検出コンポーネント302からなる。異常検出コンポーネント302は、曲線当てはめ関数コンポーネント304、データ逸脱スコアコンポーネント306、および異常判定コンポーネント308からなる。曲線当てはめ関数コンポーネント304は、データチューブコンポーネント310からデータチューブを受け取り、そのデータチューブのデータを表すのに適した関数を決定する。これにより、そのデータチューブのデータ値の予測データを生成することができる。曲線当てはめ関数コンポーネント304は、ユーザによって指定されたオプションの関数316を受け取って、適切な関数として利用することもできる。これにより、ユーザが、検出プロセスを調整することができる。データ逸脱スコアコンポーネント306は、曲線当てはめ関数コンポーネント304からの曲線当てはめ関数とともに、データチューブからデータを受け取る。データ逸脱スコアコンポーネント306は、曲線当てはめ関数を利用してそのデータの値を予測する。次いで、それらの値が実際のデータ値と比較され、予測値からの逸脱の量に基づくスコアが求められる。異常検出コンポーネント308は、逸脱スコアを受け取り、閾値入力314を利用して、閾値を超えるデータを検出する。閾値を超えると判定されたデータは、異常があると見なされ、データ異常312として出力される。
Turning to FIG. 3, yet another block diagram of an automatic data perspective
上記のシステムをより理解するには、データのコンテキストと意味を理解することが役立つ。ピボットテーブルおよび/またはOLAPキューブなどのデータパースペクティブは、ビジネスにとって重要なツールである。それらは、ユーザが大きなデータセットを迅速かつ容易に操作する(navigate)ことを可能にし、それによりビジネス上の、および他の決定を助ける。基本的に、ピボットテーブルやOLAPキューブなどのデータパースペクティブは、データセットのn次元のビューである。例えば、表1に一部を示すデータに対応するピボットテーブルを表2に示す。 To better understand the above system, it is helpful to understand the context and meaning of the data. Data perspectives such as pivot tables and / or OLAP cubes are important tools for business. They allow users to navigate large data sets quickly and easily, thereby helping business and other decisions. Basically, data perspectives such as pivot tables and OLAP cubes are n-dimensional views of the dataset. For example, Table 2 shows a pivot table corresponding to data partially shown in Table 1.
このデータパースペクティブでは、日付と「製品カテゴリ」の関数としての平均売上高が示され、売上高は、地域(販売地域)で平均されている。この例では、「売上高」がターゲットであり、一方「日付」と「製品カテゴリ」は表示される次元であり、「地域」は、集約された次元である。表2では、集約は平均であるが、合計、最小値、最大値など他の集約が可能である。同じデータセットの他のデータパースペクティブが可能である。例えば、製品カテゴリで平均された、日付と地域の関数としての売上高が可能である。表示される次元の数は、2つより多くてよい(表4参照)。 In this data perspective, average sales as a function of date and “product category” are shown, and sales are averaged by region (sales region). In this example, “Sales” is the target, while “Date” and “Product Category” are the displayed dimensions, and “Region” is the aggregated dimension. In Table 2, the aggregation is average, but other aggregations are possible, such as total, minimum, maximum. Other data perspectives of the same data set are possible. For example, sales as a function of date and region, averaged by product category, are possible. The number of dimensions displayed may be more than two (see Table 4).
各次元は、階層を有することができる。この例では、日付の階層は、年、四半期、週であり、製品の階層は、製品カテゴリ、製品であり、場所の階層は、地域、州である。ピボットテーブルなどのデータパースペクティブの重要な部分の1つは、表示される階層のレベルである。表2では、表示されるレベルは、日付の次元の年、製品の次元の製品カテゴリ、および場所の次元の地域である。ユーザは、表示された次元まで展開(drill down)することができる。これは、その次元の階層中の次に低いレベルまで移動することに相当する(表5参照)。ユーザは、現在ピボットテーブルにない次元に従ってピボットを拡大することにより、所与のピボットを横に展開(drill across)することもできる。例えば、表4に、表2のピボットテーブルを地域単位で横に展開した結果を示す。 Each dimension can have a hierarchy. In this example, the date hierarchy is year, quarter, week, the product hierarchy is product category, product, and the location hierarchy is region, state. One important part of a data perspective, such as a pivot table, is the level of the hierarchy that is displayed. In Table 2, the displayed levels are the year in the date dimension, the product category in the product dimension, and the region in the location dimension. The user can drill down to the displayed dimensions. This corresponds to moving to the next lower level in the dimension hierarchy (see Table 5). The user can also drill across a given pivot by expanding the pivot according to a dimension that is not currently in the pivot table. For example, Table 4 shows the result of horizontally expanding the pivot table of Table 2 on a regional basis.
ピボットテーブルは、示されるデータを選択する次元を、その階層のいずれかのレベルで含むページフィールドも有する。表2で、ページフィールドは、地域のレベルに場所の次元を含んでいる。すべての地域の売上高が選択されている。あるいは、ユーザは、特定の地域または州の売上高を選択してもよい。一般に、データセットのピボットテーブルは、(1)ターゲット、(2)階層のいずれかのレベルに表示される次元、(3)階層のいずれかのレベルのページフィールドの次元、および(4)集約関数、に対応する。 The pivot table also has a page field that contains the dimensions for selecting the data shown at any level of its hierarchy. In Table 2, the page field contains the location dimension at the regional level. Sales in all regions are selected. Alternatively, the user may select sales for a specific region or state. In general, a dataset pivot table consists of (1) a target, (2) a dimension displayed at any level of the hierarchy, (3) a dimension of a page field at any level of the hierarchy, and (4) an aggregate function. , Corresponding to.
通例は、例えばピボットテーブルなどのデータパースペクティブ中の1つまたは複数のセルに異常がある可能性がある。本発明は、例えば(1)画面内の異常、(2)横方向に展開した異常、(3)下方への展開異常、などの少なくとも3つのタイプのセル異常を自動的に検出し、表示する。セルは、画面に表示された他のデータとの関係で異常がある場合に画面内の異常となる。セルは、そのセルを横方向に展開することで異常が明らかになる場合に横方向に展開した異常となる。セルは、そのセルの中へと展開することで異常が明らかになる場合に下方への展開異常となる。これらのタイプの異常を表3に示す。表3は、フォーマットを除いては表2と同じである。 Typically, there may be an anomaly in one or more cells in a data perspective, such as a pivot table. The present invention automatically detects and displays at least three types of cell abnormalities such as (1) abnormalities in the screen, (2) abnormalities developed in the horizontal direction, and (3) abnormalities developed downward. . A cell becomes abnormal in the screen when there is an abnormality in relation to other data displayed on the screen. A cell becomes an anomaly developed in the lateral direction when the anomaly becomes apparent by expanding the cell in the lateral direction. A cell becomes a downward expansion abnormality when an abnormality becomes apparent by expanding into the cell. These types of abnormalities are shown in Table 3. Table 3 is the same as Table 2 except for the format.
表3では、カテゴリ2/1999のセルが、同じ行または列にあるどの他のセルよりも高い売上げ平均を有するので、画面内の異常である。表3のカテゴリ2/2001のセルは、横方向に展開した異常である。この異常は、下の表4に示すように、ユーザがこのデータパースペクティブを地域単位で横に展開するまで明らかにならない。 In Table 3, category 2/1999 cells are anomalies in the screen because they have a higher sales average than any other cell in the same row or column. The cell of category 2/2001 in Table 3 is an anomaly developed in the horizontal direction. This anomaly will not become apparent until the user deploys this data perspective horizontally on a regional basis, as shown in Table 4 below.
表4で、r3の売上高は、r1およびr2の売上高より大幅に低く示されている。また、表3のセル、カテゴリ3/2002は、下方に展開した異常である。この場合も、この異常は、下の表5に示すようにユーザが製品の階層を下方に展開するまで明らかにならない。 In Table 4, sales of r3 are shown significantly lower than sales of r1 and r2. Moreover, the cell of Table 3, category 3/2002 is an abnormality developed downward. Again, this anomaly will not become apparent until the user expands the product hierarchy down as shown in Table 5 below.
表5で、製品3の売上げは、製品1および製品2の売上げよりはるかに低く示されている。これらの例では、画面内の異常は、ハイライト表示され、横方向に展開した異常と下方への展開異常は、枠線で示されている。しかし、当業者は、多くの他の種類が可能であることを認識されよう。
In Table 5, sales of product 3 are shown much lower than sales of
本発明による自動的な異常検出の例を続ける。用語「チューブ」を利用して、1つのみの次元が変化する所与のデータパースペクティブのスライスを意味する。2次元のデータパースペクティブでは、チューブは、単に、行および/または列に対応する。表4の3次元のピボットテーブルにチューブの例をいくつか示すが、この表は、(1)日付と地域を固定した、様々に異なる製品カテゴリ、(2)製品カテゴリと日付を固定した、様々に異なる地域、(3)製品カテゴリと地域を固定した、様々に異なる日付、に対応する。 Continuing with the example of automatic anomaly detection according to the present invention. The term “tube” is used to mean a slice of a given data perspective in which only one dimension changes. In the two-dimensional data perspective, tubes simply correspond to rows and / or columns. Some examples of tubes are shown in the three-dimensional pivot table in Table 4, which shows (1) different product categories with fixed dates and regions, and (2) various fixed product categories and dates. (3) The product category and the region are fixed, and various dates are different.
セルは、曲線当てはめ関数で計算されたそのセルに予想される値から著しく逸脱する場合に、チューブに対して異常があることになる。データパースペクティブ中の値が連続することを必要とするのではなく、データパースペクティブは1次元であり、順序付けられた索引を有すると想定する。例えば、データパースペクティブは、時間、距離、または金額で索引付けされたデータパースペクティブとすることができる。したがって、データパースペクティブの値は、連続していても、かつ/または離散していてもよい。そして、異常検出のために、そのパースペクティブに例えば「自己回帰」(auto-regressive)型の曲線当てはめ法などの曲線当てはめ法を適用することができる。本発明の一事例では、予測値からの逸脱の量に逸脱スコアを割り当てることにより、異常検出を容易にすることができる。そして、逸脱スコアを所与の閾値と比較して、異常が存在するかどうかを判定することができる。例えば、離散データには、データパースペクティブ中の観測値の確率が求められる。その確率が著しく低い場合、データは異常と見なされる。 A cell will be abnormal for the tube if it deviates significantly from the expected value for that cell as calculated by the curve fitting function. Rather than requiring the values in the data perspective to be contiguous, assume that the data perspective is one-dimensional and has an ordered index. For example, the data perspective can be a data perspective indexed by time, distance, or amount. Thus, the data perspective values may be continuous and / or discrete. In order to detect anomalies, a curve fitting method such as an “auto-regressive” type curve fitting method can be applied to the perspective. In one example of the present invention, anomaly detection can be facilitated by assigning a deviation score to the amount of deviation from the predicted value. The deviation score can then be compared with a given threshold to determine if an anomaly exists. For example, the probability of the observed value in the data perspective is obtained for discrete data. If the probability is significantly low, the data is considered abnormal.
本発明の別の事例では、チューブ中の連続した次元データが、例えば回帰木(regression tree)を利用して区分線形関数に当てはめられる。そして、セルは、
|セル中の値−セルの予測値|>閾値 (式1)
の場合に異常であることになり、この式の左側は、セルの逸脱スコアである。
In another example of the present invention, continuous dimensional data in a tube is applied to a piecewise linear function using, for example, a regression tree. And the cell
| Value in cell−Predicted value of cell |> Threshold (Formula 1)
In this case, the left side of this formula is the cell deviation score.
本発明のさらに別の事例では、チューブ中の離散した次元データが自己回帰モデルに当てはめられる。すると、セル中の値の確率が何らかの閾値より低い場合に、セルが異常であることになる。 In yet another case of the present invention, discrete dimensional data in the tube is fitted to the autoregressive model. Then, when the probability of the value in the cell is lower than some threshold value, the cell is abnormal.
上記から明らかなように、本発明は、連続したデータと離散データに異なる曲線当てはめ関数を適用する。しかし、次元が離散しているか連続しているかを判定する方法は複数ある。例えば、例えばフォーマットコマンドなどを介して次元に「数」という名前を付けるなどユーザが、選択を指定することができる。あるいはさらなる例として、この選択は、データを調べることにより自動的に行うことができる(1999年4月23日にHeckrman他によって出願された「Determining Whether A Variable Is Numeric Or Non-Numeric」という名称の米国特許出願第09/298,737号明細書に記載されるようなシステムおよび方法を利用する)。 As is apparent from the above, the present invention applies different curve fitting functions to continuous data and discrete data. However, there are multiple methods for determining whether a dimension is discrete or continuous. For example, the user can specify a selection, for example by naming the dimension “number” via a format command or the like. Alternatively, as a further example, this selection can be made automatically by examining the data (named “Determining Whether A Variable Is Numeric Or Non-Numeric” filed by Heckrman et al. On April 23, 1999). System and method as described in US patent application Ser. No. 09 / 298,737).
次いで、ピボットテーブルなど所与のデータパースペクティブについて、この例の3つのタイプの異常を定義する。セルは、表示されたチューブのいずれかに対して異常がある場合に画面内の異常になる。他の定義としては、これらに限定しないが、(1)表示されたすべてのチューブに対してセルに異常がある場合に画面内の異常となる、(2)画面のすべてのチューブに沿って平均された逸脱の度合いが閾値を超える場合に、画面内の異常になる、等が可能である。セルは、表示されていない次元にわたって変化する異常なチューブがある場合に、表示された次元を固定した状態で横方向に展開した異常となる。セルは、より深いレベルまで展開された、現在表示されている次元にわたって変化する異常なチューブがある場合に、すべての他の表示された次元を固定した状態で下方への展開異常となる。 The three types of anomalies in this example are then defined for a given data perspective, such as a pivot table. A cell becomes an anomaly in the screen when there is an anomaly for any of the displayed tubes. Other definitions include, but are not limited to: (1) Anomaly in the screen when there is a cell abnormality for all displayed tubes, (2) An average along all tubes on the screen When the degree of deviation made exceeds a threshold value, an abnormality in the screen is possible. When there is an abnormal tube that changes over a dimension that is not displayed, the cell becomes an anomaly that is expanded laterally with the displayed dimension fixed. A cell becomes a downward expansion anomaly with all other displayed dimensions fixed when there is an abnormal tube that has been expanded to a deeper level and changes across the currently displayed dimension.
横方向に展開した異常と下方への展開異常は、当然のことながら、ユーザには見ることができない。それらを明らかにする機構により、ユーザは、異常を見るためにどの次元および/または階層を拡大する必要があるかが分かる。一部のデータパースペクティブアプリケーションでは、これは、異常なセルの上でマウスなどポインティングデバイスを右クリックすることを介して行うことができる。異常を含む次元および/または階層を示すことに加えて、例えば、対応する逸脱スコアに従って次元および階層を分類することにより、異常の程度も示すことができる。 Obviously, the abnormality developed in the horizontal direction and the abnormality developed in the downward direction cannot be seen by the user. The mechanism that reveals them tells the user which dimension and / or hierarchy needs to be expanded to see the anomaly. In some data perspective applications, this can be done via right clicking on a pointing device such as a mouse over an abnormal cell. In addition to indicating dimensions and / or hierarchies that include anomalies, the degree of anomalies can also be indicated, for example, by classifying dimensions and hierarchies according to corresponding deviation scores.
画面内の異常に関しては、ユーザは、セルが異常である理由の説明を求める場合がある。これは、本発明を介して、その逸脱スコアが閾値を超えるチューブを表示する、例えばハイライト表示することによって実現される。この機能は、一部のアプリケーションではマウスなどポインティングデバイスの右クリックを利用することによって用いることもできる。 With regard to the abnormality in the screen, the user may ask for an explanation of why the cell is abnormal. This is achieved through the present invention by displaying, for example, highlighting tubes whose deviation score exceeds a threshold. This function can also be used in some applications by using a right click of a pointing device such as a mouse.
閾値については、2つの事例を考慮すべきである。1つ目は、問題となるセルの中へと展開する、かつ/または、問題となるセルを横に展開することができ、かつ/または元のデータに同じセルの複数のエントリがある。この場合は、閾値cσを利用することができ、cは、ユーザによって制御される定数であり、σは、そのセルを1回または複数回拡大した結果生じるデータの標準的な逸脱である。2つ目は、セルが拡大されることができない場合、または上記の閾値の代替法として、c<予測値>あるいは単に閾値としてのcを用いることができ、この場合も、cは、ユーザによって制御される定数である。あるいは、上位k個の異常を示すことができ、kは、ユーザによって選択される。あるいは、拡大することができないセルは名前が付けられないように選択することができる。 Two cases should be considered for the threshold. The first can expand into the cell in question and / or expand the cell in question horizontally and / or have multiple entries of the same cell in the original data. In this case, a threshold cσ can be used, where c is a constant controlled by the user, and σ is the standard deviation of data resulting from expanding the cell one or more times. Second, if the cell cannot be enlarged, or as an alternative to the above threshold, c <predicted value> or simply c as the threshold can be used, where c is also determined by the user. A constant to be controlled. Alternatively, the top k anomalies can be indicated and k is selected by the user. Alternatively, cells that cannot be expanded can be selected so that they are not named.
図示し、上記で説明した例示的システムに照らして、本発明により実施することが可能な方法論が、図4〜5のフローチャートを参照してよりよく理解されよう。説明を分かりやすくするために、方法論は、ブロックの連続として図示し、説明するが、本発明は、このブロックの順序によって制限されず、一部のブロックは、本発明により、図示し、ここに説明する順序とは異なる順序で、かつ/または他のブロックと同時に行ってよいことを理解されたい。さらに、本発明による方法論を実施するために、図示されるブロックがすべて必要であるとは限らない。 In light of the exemplary system illustrated and described above, methodologies that can be implemented in accordance with the present invention will be better understood with reference to the flowcharts of FIGS. For clarity of explanation, the methodology is illustrated and described as a series of blocks, but the present invention is not limited by this block order, and some blocks are illustrated and described herein according to the present invention. It should be understood that this may be done in a different order than described and / or simultaneously with other blocks. Moreover, not all illustrated blocks may be required to implement a methodology in accordance with the present invention.
本発明は、1つまたは複数のコンポーネントによって実行されるプログラムモジュールなどのコンピュータ実行可能命令との一般的なコンテキストで説明することができる。一般に、プログラムモジュールには、特定のタスクを行うか、特定の抽象データ型を実装する、ルーチン、プログラム、オブジェクト、データ構造などがある。通例、プログラムモジュールの機能は、各種実施形態で必要に応じて組み合わせても、分散してもよい。 The invention can be described in the general context of computer-executable instructions, such as program modules, being executed by one or more components. Generally, program modules include routines, programs, objects, data structures, etc. that perform particular tasks or implement particular abstract data types. In general, the functions of the program modules may be combined or distributed as necessary in various embodiments.
図4に、本発明の一態様による、自動的なデータパースペクティブ異常の検出を容易にする方法400の流れ図を示す。方法400は、1つのみの次元が変化するデータパースペクティブからデータスライスを表すチューブデータを受け取る(404)ことによって開始する(402)。次いで、データに適用される曲線当てはめ関数を利用して、データ中の異常が自動的に検出される(406)。曲線当てはめ関数は、導出する、かつ/またはユーザによって指定することができる。異常検出は、システムおよび/またはユーザによって供給される閾値逸脱値によってさらに容易にすることができる。閾値逸脱値は、データ異常のタイプに応じて異なってもよい。次いで、検出された異常がデータ異常として出力され(408)、流れが終了する(410)。
FIG. 4 illustrates a flowchart of a
図5を参照すると、本発明の一態様による自動的なデータパースペクティブ異常の検出を容易にする方法500の別の流れ図が示される。方法500は、1つのみの次元が変化するデータパースペクティブからのデータスライスを表すチューブデータを受け取ることによって開始する(504)。次いで、そのデータチューブのデータを最もよく表す関数が判定される(506)。この関数は、連続したデータと離散データに対して、区分的線形プロセスや回帰木プロセスなどの自己回帰プロセスを通じて得ることができる。この関数は、ユーザによって提供される関数として得ることもできる。次いで、曲線当てはめ関数から得られるデータの予測値と実際のデータ値とに基づいて逸脱スコアを求める(508)。次いで、データ値が異常と見なされる前に許容される逸脱の量を決定する閾値が受け取られる(510)。この閾値は、システムを介して決定するか、かつ/またはユーザから提供されることができる。この閾値は、静的な値および/または動的な値である。閾値は、データ異常のタイプに応じて異なってもよい。次いで、閾値を超える逸脱スコアを有するデータ値を判定することによってデータ異常が検出され(512)、流れが終了する(514)。通例、データ異常は、ハイライト表示、枠線、および/または色分けなどの画面内の表示を介してユーザに伝達される。しかし、アイコンおよび他のグラフィック表示(indicator)も利用することができる。そうした表示により、ユーザは、どのレベルにデータ異常を見つけることができるかを判断することができる。表示を利用して、データ異常のタイプおよび/またはデータ異常の逸脱の度合いを示すこともできる。本発明の他の事例は、実際の異常データを見るためにさらなるユーザ入力を必要とせずに、自動的にデータ異常をユーザに表示するさらなる動作を含む。これにより、ユーザが、データ異常に到達し、見るためのすべてのデータレベル表示を知り、理解することが必要でなくなるので、ユーザへのデータの伝達が激減する。
Referring to FIG. 5, another flow diagram of a
本発明の各種態様を実施する追加的なコンテキストを提供するために、図6と以下の説明で、本発明の各種態様を実施することが可能な適切なコンピューティング環境600の簡単で概略的な説明を提供する。上記ではローカルコンピュータおよび/またはリモートコンピュータで実行されるコンピュータプログラムのコンピュータ実行可能命令との一般的関連で本発明を説明したが、当業者は、本発明は、他のプログラムモジュールと組み合わせて実施してもよいことを認識されよう。一般に、プログラムモジュールには、特定のタスクを行うか、かつ/または特定の抽象データ型を実施する、ルーチン、プログラム、コンポーネント、データ構造などが含まれる。さらに、当業者は、本発明の方法は、シングルプロセッサまたはマルチプロセッサのコンピュータシステム、ミニコンピュータ、メインフレームコンピュータ、パーソナルコンピュータ、ハンドヘルドコンピューティングデバイス、マイクロプロセッサを利用した、かつ/またはプログラム可能な家庭電化製品などを含む他のコンピュータシステム構成で実施できることを理解されよう。上記のような各デバイスは、1つまたは複数の関連付けられたデバイスと動作上通信することができる。ここに説明する本発明の態様は、通信ネットワークを通じてつながれた遠隔の処理デバイスによって特定のタスクが行われる分散コンピューティング環境で実施することもできる。しかし、本発明のすべてではなくとも一部の態様は、独立型のコンピュータで実施することができる。分散コンピューティング環境では、プログラムモジュールは、ローカルおよび/またはリモートのメモリ記憶装置に置くことができる。
To provide additional context for implementing various aspects of the present invention, a simplified and schematic representation of a
本願で使用される用語「コンポーネント」は、ハードウェア、ハードウェアとソフトウェアの組合せ、ソフトウェア、あるいは実行中のソフトウェアを問わず、コンピュータに関連するエンティティを指すものとする。例えば、コンポーネントは、これらに限定しないが、プロセッサで実行されるプロセス、プロセッサ、オブジェクト、実行ファイル、実行のスレッド、プログラム、およびコンピュータなどである。例示として、サーバで実行されるアプリケーションおよび/またはサーバがコンポーネントとなることができる。また、コンポーネントは、1つまたは複数の下位コンポーネントを含むことができる。 As used herein, the term “component” is intended to refer to an entity associated with a computer, whether hardware, a combination of hardware and software, software, or running software. For example, a component may be, but is not limited to being, a process executed by a processor, a processor, an object, an executable, a thread of execution, a program, a computer, and the like. By way of illustration, an application running on a server and / or the server can be a component. A component can also include one or more subcomponents.
図6を参照すると、本発明の各種態様を実施する例示的なシステム環境600は、従来のコンピュータ602を含み、コンピュータ602は、処理装置604、システムメモリ606、およびシステムメモリを含む各種のシステム構成要素を処理装置604に結合するシステムバス608を含む。処理装置604は、市販のプロセッサでも独自のプロセッサでもよい。また、処理装置は、並列に接続できるような2つ以上のプロセッサから形成されるマルチプロセッサとして実施してよい。
With reference to FIG. 6, an
システムバス608は、数例を挙げるとPCI、VESA、Microchannel、ISA、EISAなどの従来のバスアーキテクチャを使用した、メモリバスまたはメモリコントローラ、ペリフェラルバス、ローカルバスを含む数種のバス構造のいずれでもよい。システムメモリ606には、読み取り専用メモリ(ROM)610とランダムアクセスメモリ(RAM)612が含まれる。起動時などにコンピュータ602内の要素間の情報転送を助ける基本ルーチンを含む基本入出力システム(BIOS)614は、ROM601に記憶される。
The
コンピュータ602は、例えば、ハードディスクドライブ616、例えば取り外し可能ディスク620の読み書きを行う磁気ディスクドライブ618、例えばCD−ROMディスク624や他の光学媒体の読み書きを行う光ディスクドライブ622も含むことができる。ハードディスクドライブ616、磁気ディスクドライブ618、および光ディスクドライブ622は、それぞれハードディスクドライブインターフェース626、磁気ディスクドライブインターフェース628、および光ドライブインターフェース630によりシステムバス608に接続される。これらのドライブ616〜622とそれに関連付けられたコンピュータ可読媒体は、データ、データ構造、コンピュータ実行可能命令などの不揮発性の記憶をコンピュータ602に提供する。上記のコンピュータ可読媒体の説明では、ハードディスク、取り外し可能磁気ディスク、およびCDを挙げたが、当業者には、磁気カセット、フラッシュメモリカード、デジタルビデオディスク、ベルヌーイカートリッジなど、コンピュータ可読の他タイプの媒体も例示的動作環境600で使用することができ、さらに、そのような媒体は、本発明の方法を行うコンピュータ実行可能命令を保持することができることを理解されよう。
The computer 602 can also include, for example, a
ドライブ616〜622およびRAM612には複数のプログラムモジュールを記憶することができ、これには、オペレーティングシステム632、1つまたは複数のアプリケーションプログラム634、他のプログラムモジュール636、およびプログラムデータ638が含まれる。オペレーティングシステム632は、任意の適当なオペレーティングシステム、またはオペレーティングシステムの組合せであってよい。例として、アプリケーションプログラム634は、本発明の一態様によるデータパースペクティブ分析法を含むことができる。
A plurality of program modules may be stored in the drives 616-622 and the
ユーザは、キーボード640およびポインティングデバイス(マウスなど642)などの1つまたは複数のユーザ入力装置を通じてコンピュータ602にコマンドと情報を入力することができる。他の入力装置(図示せず)には、マイクロフォン、ジョイスティック、ゲームパッド、衛星受信アンテナ、無線リモコン、スキャナなどがある。上記および他の入力装置は、多くの場合、システムバス608に結合されたシリアルポートインターフェース644を通じて処理装置604に接続されるが、パラレルポート、ゲームポート、ユニバーサルシリアルバス(USB)などの他のインターフェースで接続してもよい。モニタ646または他のタイプの表示装置も、ビデオアダプタ648などのインターフェースを介してシステムバス608に接続される。モニタ646に加えて、コンピュータ602は、スピーカやプリンタなど他の周辺出力装置(図示せず)を含むことができる。
A user may enter commands and information into the computer 602 through one or more user input devices such as a
コンピュータ602は、1つまたは複数のリモートコンピュータ660との論理接続を使用するネットワーク環境で動作できることは理解されたい。リモートコンピュータ660は、ワークステーション、サーバコンピュータ、ルータ、ピアデバイス、または他の一般的なネットワークノードであり、図を簡潔にするために図6にはメモリ記憶装置662のみを示すが、通例は、コンピュータ602との関連で上述した要素の多くまたはすべてを含む。図6に示す論理接続は、ローカルエリアネットワーク(LAN)664とワイドエリアネットワーク(WAN)666を含むことができる。このようなネットワーキング環境は、オフィス、企業内のコンピュータネットワーク、イントラネット、およびインターネットに一般的に見られる。
It should be understood that the computer 602 can operate in a network environment that uses logical connections with one or more
例えばLANネットワーキング環境で使用される場合、コンピュータ602は、ネットワークインターフェースあるいはアダプタ668を通じてローカルネットワーク664に接続される。WANネットワーキング環境で使用される場合、コンピュータ602は通例、モデム(電話モデム、DSLモデム、ケーブルモデムなど)670を含むか、LAN上の通信サーバに接続されるか、インターネットなどのWAN666を通じて通信を確立する他の手段を有する。モデム670は、コンピュータ602に対して内部にあっても外部にあってもよく、シリアルポートインターフェース644を介してシステムバス608に接続される。ネットワーク環境では、プログラムモジュール(アプリケーションプログラム634を含む)および/またはプログラムデータ638は、遠隔のメモリ記憶装置662に記憶することができる。ここで示すネットワーク接続は例示的なものであり、本発明の態様を実行する際には、コンピュータ602と660の間に通信リンクを確立する他の手段(有線または無線)を使用できることは理解されよう。
For example, when used in a LAN networking environment, the computer 602 is connected to the
コンピュータプログラミングの当業者の慣行に従い、本発明は、特に指摘しない限りは、コンピュータ602やリモートコンピュータ660などのコンピュータによって行われる動作と操作の記号的表現を参照して説明した。そのような動作と操作は、時に、コンピュータによって実行されると言及される。動作と記号的に表現される操作は、処理装置604による、データビットを表す電気信号の操作を含み、その結果、電気信号表現が変換または変形され、また、メモリシステム(システムメモリ606、ハードドライブ616、フロッピー(登録商標)ディスク620、CD−ROM624、リモートメモリ662を含む)の記憶場所にデータビットが保持されて、それにより、コンピュータシステムの動作と他の信号処理が再設定されるか、またはその他の形で変更されることは理解されよう。そのようなデータビットが保持される記憶場所は、そのデータビットに対応する特定の電気的、磁気的、または光学的特性を有する物理的な場所である。
In accordance with the practice of those skilled in the art of computer programming, the invention has been described with reference to acts and symbolic representations of operations performed by a computer, such as the computer 602 and
図7は、本発明が対話することのできるコンピュータ環境例700の別のブロック図である。システム700はさらに、1つまたは複数のクライアント702を含むシステムを表す。クライアント702は、ハードウェアおよび/またはソフトウェア(スレッド、プロセス、コンピューティングデバイスなど)である。システム700は、1つまたは複数のサーバ704も含む。サーバ704もハードウェアおよび/またはソフトウェア(スレッド、プロセス、コンピューティングデバイスなど)である。サーバ704は、例えば本発明を用いることにより変換を行うスレッドを収容することができる。クライアント702とサーバ704間で可能な通信の1つは、2つ以上のコンピュータプロセス間で送信されるように適合されたデータパケットの形態である。システム700は、クライアント702とサーバ704間の通信を助けるために用いることができる通信フレームワーク708を含む。クライアント702は、クライアント702にとってローカルの情報を記憶するために用いることができる1つまたは複数のクライアントデータストア710に動作的に接続される。同様に、サーバ704も、サーバ704にとってローカルの情報を記憶するために用いることができる1つまたは複数のサーバデータストア706に動作的に接続される。
FIG. 7 is another block diagram of an
本発明の1つの事例では、2つ以上のコンピュータコンポーネント間でデータパースペクティブ分析を助けるデータパケットが送信され、このデータパケットは、少なくとも一部分は、データチューブのデータに適用される曲線当てはめプロセスを少なくとも部分的に利用するデータパースペクティブ分析システムに関連する情報からなり、データチューブは、1つのみのデータ次元が変化するデータパースペクティブの少なくとも1つのデータセルを含むデータスライスからなる。 In one example of the present invention, a data packet is transmitted between two or more computer components that aids data perspective analysis, the data packet at least partially comprising a curve fitting process applied to data tube data. The data tube consists of data slices that contain at least one data cell of the data perspective where only one data dimension changes.
本発明のシステムおよび/または方法は、コンピュータコンポーネントと非コンピュータ関連コンポーネントの双方を助けるデータパースペクティブ分析方式で利用することができることを理解されたい。さらに、本発明のシステムおよび/または方法は、これらに限定しないがコンピュータ、サーバ、および/またはハンドヘルド電子機器など、多数の電子関連技術で用いることができることを当業者は認識されよう。 It should be understood that the system and / or method of the present invention can be utilized in a data perspective analysis scheme that helps both computer and non-computer related components. Further, those skilled in the art will recognize that the systems and / or methods of the present invention can be used in numerous electronic-related technologies such as, but not limited to, computers, servers, and / or handheld electronics.
上記の説明には本発明の例が含まれる。言うまでもなく、本発明を説明するために構成要素または方法論のあらゆる着想可能な組合せを記載することは不可能であり、当業者は、本発明の多数のさらなる組合せおよび置き換えが可能であることを理解されよう。したがって、本発明は、頭記の特許請求の主旨および範囲に該当するそのような改変、変更、および変形をすべて包含するものとする。さらに、詳細な説明または特許請求の範囲で用語「〜を含む」が使用される限りでは、この語は、請求項で接続語として用いられた場合の用語「〜を備える」の解釈と同様に、包含的な意味とする。 What has been described above includes examples of the present invention. Of course, it is not possible to describe every conceivable combination of components or methodologies to illustrate the invention, and those skilled in the art will appreciate that many further combinations and substitutions of the invention are possible. Let's be done. Accordingly, the present invention is intended to embrace all such alterations, modifications and variations that fall within the spirit and scope of the appended claims. Further, to the extent that the term “comprising” is used in the detailed description or in the claims, this term is similar to the interpretation of the term “comprising” when used as a conjunctive in a claim. Inclusive meaning.
104 データパースペクティブ
102 自動データパースペクティブ異常検出コンポーネント
106 異常
108 閾値入力
208 データパースペクティブ
202 自動データパースペクティブ異常検出コンポーネント
204 データチューブコンポーネント
206 異常検出コンポーネント
210 異常
212 閾値入力
310 データチューブコンポーネント
302 異常検出コンポーネント
304 曲線当てはめ関数コンポーネント
306 データ逸脱スコアコンポーネント
308 異常判定コンポーネント
312 異常
316 ユーザ指定関数
314 閾値入力
606 システムメモリ
632 オペレーティングシステム
634 アプリケーションプログラム
636 他のプログラムモジュール
638 プログラムデータ
604 処理装置
608 バス
626 ハードディスクドライブインターフェース
628 磁気ディスクドライブインターフェース
630 光学ドライブインターフェース
644 シリアルポートインターフェース
646 モニタ
648 ビデオアダプタ
668 ネットワークインターフェース
664 ローカルエリアネットワーク
666 ワイドエリアネットワーク
670 モデム
660 リモートコンピュータ
702 クライアント
704 サーバ
710 クライアントデータストア
708 通信フレームワーク
706 サーバデータストア
104 Data Perspective 102 Automatic Data Perspective Anomaly Detection Component 106
Claims (39)
少なくとも1つのデータパースペクティブを受け取るコンポーネントと、
前記データパースペクティブを自動的に分析して、データチューブからの連続したデータおよび/または離散データに適用される曲線当てはめプロセスを介して少なくとも1つのデータ異常を検出する異常検出コンポーネントと
を備え、前記データチューブは、1つのみのデータ次元が変化する、前記データパースペクティブの少なくとも1つのデータセルを含むデータスライスを含むことを特徴とするシステム。 A system that facilitates analysis of data perspectives,
A component that receives at least one data perspective;
An anomaly detection component that automatically analyzes the data perspective to detect at least one data anomaly through a curve fitting process applied to continuous and / or discrete data from a data tube; and The system includes a data slice including at least one data cell of the data perspective, wherein only one data dimension varies.
少なくとも1つのデータパースペクティブを受け取るステップと、
前記データパースペクティブからデータチューブを確立するステップであって、前記データチューブは、1つのみのデータ次元が変化する、前記データパースペクティブの少なくとも1つのデータセルを含むデータスライスを含むステップと、
前記データチューブの連続データおよび/または離散データを表す曲線当てはめ関数を決定するステップと、
実際のデータ値と、前記曲線当てはめ関数を介して与えられる予測値との差に少なくとも部分的に基づく逸脱スコアを計算するステップと、
前記逸脱スコアと検出基準との評価を介してデータ異常を検出するステップと
を備えることを特徴とする方法。 A method that facilitates analysis of data perspectives,
Receiving at least one data perspective;
Establishing a data tube from the data perspective, the data tube comprising a data slice including at least one data cell of the data perspective, wherein only one data dimension varies;
Determining a curve fitting function representing continuous and / or discrete data of the data tube;
Calculating a deviation score based at least in part on a difference between an actual data value and a predicted value provided via the curve fitting function;
Detecting data anomalies through evaluation of the deviation score and detection criteria.
異常へのアクセス可能性の表示のセットを利用して、前記データ異常をユーザに対して表示するステップと
をさらに含むことを特徴とする請求項19に記載の方法。 Classifying the data anomalies according to their accessibility,
20. The method of claim 19, further comprising: displaying the data anomaly to a user utilizing a set of indications of accessibility to the anomaly.
をさらに含むことを特徴とする請求項21に記載の方法。 The method of claim 21, further comprising: automatically displaying on the screen at least one data anomaly to the user.
逸脱スコアが前記閾値を超えるかどうかを判定するステップ
を含むことを特徴とする請求項26に記載の方法。 The evaluation of the deviation score is:
27. The method of claim 26, comprising determining whether a departure score exceeds the threshold.
少なくとも1つのデータパースペクティブを受け取る手段と、
前記データパースペクティブを自動的に分析して、データチューブからの連続したデータおよび/または離散データに適用される曲線当てはめプロセスを介して少なくとも1つのデータ異常を検出する手段と
を備え、
前記データチューブは、1つのみのデータ次元が変化する、前記データパースペクティブの少なくとも1つのデータセルを含むデータスライスを備えることを特徴とするシステム。 A system that facilitates analysis of data perspectives,
Means for receiving at least one data perspective;
Means for automatically analyzing said data perspective to detect at least one data anomaly through a curve fitting process applied to continuous and / or discrete data from a data tube;
The data tube comprises a data slice comprising at least one data cell of the data perspective, wherein only one data dimension changes.
The device using the system of claim 1, comprising at least one selected from the group consisting of a computer, a server, and a handheld electronic device.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/874,956 US7065534B2 (en) | 2004-06-23 | 2004-06-23 | Anomaly detection in data perspectives |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006012140A true JP2006012140A (en) | 2006-01-12 |
Family
ID=35115991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005163148A Pending JP2006012140A (en) | 2004-06-23 | 2005-06-02 | Anomaly detection in data perspective |
Country Status (10)
Country | Link |
---|---|
US (2) | US7065534B2 (en) |
EP (1) | EP1610264A3 (en) |
JP (1) | JP2006012140A (en) |
KR (1) | KR101083519B1 (en) |
CN (1) | CN100568234C (en) |
AU (1) | AU2005201997B2 (en) |
BR (1) | BRPI0501784A (en) |
CA (1) | CA2505983C (en) |
MX (1) | MXPA05005537A (en) |
RU (1) | RU2378694C2 (en) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4610240B2 (en) * | 2004-06-24 | 2011-01-12 | 富士通株式会社 | Analysis program, analysis method, and analysis apparatus |
JP4652741B2 (en) * | 2004-08-02 | 2011-03-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Abnormality detection device, abnormality detection method, abnormality detection program, and recording medium |
US7874000B1 (en) * | 2004-11-22 | 2011-01-18 | Symantec Corporation | Reducing false positives generated by a database intrusion detection system |
US8209406B2 (en) | 2005-10-28 | 2012-06-26 | Adobe Systems Incorporated | Assessment of click or traffic quality |
US20070136115A1 (en) * | 2005-12-13 | 2007-06-14 | Deniz Senturk Doganaksoy | Statistical pattern recognition and analysis |
US20070226099A1 (en) * | 2005-12-13 | 2007-09-27 | General Electric Company | System and method for predicting the financial health of a business entity |
US20070260578A1 (en) * | 2006-05-04 | 2007-11-08 | Microsoft Corporation | Pivot table without server side on-line analytical processing service |
JP4201027B2 (en) * | 2006-07-10 | 2008-12-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | System and method for detecting differences between multiple observations |
US8880541B2 (en) | 2006-11-27 | 2014-11-04 | Adobe Systems Incorporated | Qualification of website data and analysis using anomalies relative to historic patterns |
CA2675216A1 (en) * | 2007-01-10 | 2008-07-17 | Nick Koudas | Method and system for information discovery and text analysis |
US7797264B2 (en) * | 2007-02-02 | 2010-09-14 | Microsoft Corporation | Detecting and displaying exceptions in tabular data |
US7792770B1 (en) | 2007-08-24 | 2010-09-07 | Louisiana Tech Research Foundation; A Division Of Louisiana Tech University Foundation, Inc. | Method to indentify anomalous data using cascaded K-Means clustering and an ID3 decision tree |
US8094154B1 (en) | 2007-12-20 | 2012-01-10 | The United States Of America As Represented By The Secretary Of The Navy | Intelligent leading indicator display |
US8204637B1 (en) | 2007-12-20 | 2012-06-19 | The United States Of America As Represented By The Secretary Of The Navy | Aircraft approach to landing analysis method |
US7797130B1 (en) | 2007-12-20 | 2010-09-14 | The United States Of America As Represented By The Secretary Of The Navy | Baseline comparative leading indicator analysis |
US8738652B2 (en) * | 2008-03-11 | 2014-05-27 | Paragon Science, Inc. | Systems and methods for dynamic anomaly detection |
US8086611B2 (en) | 2008-11-18 | 2011-12-27 | At&T Intellectual Property I, L.P. | Parametric analysis of media metadata |
US9292857B2 (en) * | 2010-11-23 | 2016-03-22 | Panorama Software Inc. | One-click exceptions |
RU2474873C2 (en) * | 2010-12-29 | 2013-02-10 | Алексей Сергеевич Кашик | Method for analysing and predicting development of complex-structure system and apparatus for realising said method |
JP5533894B2 (en) * | 2011-05-17 | 2014-06-25 | 株式会社豊田中央研究所 | Outlier detection device, outlier detection method, program, and vehicle fault diagnosis system |
US9400825B2 (en) * | 2013-05-23 | 2016-07-26 | Strategy Companion Corporation | Pivot analysis method using condition group |
US8966074B1 (en) | 2013-09-13 | 2015-02-24 | Network Kinetix, LLC | System and method for real-time analysis of network traffic |
CN103473473B (en) * | 2013-09-26 | 2018-03-02 | 深圳市华傲数据技术有限公司 | A kind of data quality checking method and system based on scatter diagram |
CN103761673A (en) * | 2014-01-03 | 2014-04-30 | 浙江大唐乌沙山发电有限责任公司 | Regression method and system for judging index abnormity |
WO2015119607A1 (en) * | 2014-02-06 | 2015-08-13 | Hewlett-Packard Development Company, L.P. | Resource management |
CN104077471A (en) * | 2014-06-13 | 2014-10-01 | 华东师范大学 | Data analysis method used for silicon nanowire chip to detect biomolecule |
US10140576B2 (en) * | 2014-08-10 | 2018-11-27 | Palo Alto Research Center Incorporated | Computer-implemented system and method for detecting anomalies using sample-based rule identification |
US10089589B2 (en) * | 2015-01-30 | 2018-10-02 | Sap Se | Intelligent threshold editor |
CN104636503A (en) * | 2015-03-10 | 2015-05-20 | 浪潮集团有限公司 | Method for querying data |
CN106445938B (en) * | 2015-08-05 | 2021-03-23 | 阿里巴巴集团控股有限公司 | Data detection method and device |
US11144575B2 (en) * | 2015-08-12 | 2021-10-12 | Kyvos Insights, Inc. | Assisting a user to identify outliers and anomalies in a dataset |
CN105608006B (en) * | 2015-12-22 | 2018-06-08 | 武汉工程大学 | A kind of program error detection method and system based on probabilistic model |
US10043070B2 (en) * | 2016-01-29 | 2018-08-07 | Microsoft Technology Licensing, Llc | Image-based quality control |
CN107202852A (en) * | 2017-05-23 | 2017-09-26 | 国家电网公司 | A kind of oil chromatography online monitoring data rejecting outliers method based on variable thresholding |
US10698911B1 (en) * | 2018-03-15 | 2020-06-30 | Keysight Technologies, Inc. | Method for ranking possible causes for anomalies in large data sets |
CN112307093B (en) * | 2020-12-28 | 2021-05-04 | 江西科技学院 | Electric digital data processing and analyzing device and method |
US20230102152A1 (en) * | 2021-09-24 | 2023-03-30 | International Business Machines Corporation | Automatic detection of changes in data set relations |
CN116739532B (en) * | 2023-08-11 | 2023-11-03 | 北京华清鼎立物业管理有限公司 | Energy project management method, system, terminal equipment and storage medium |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6094651A (en) * | 1997-08-22 | 2000-07-25 | International Business Machines Corporation | Discovery-driven exploration of OLAP data cubes |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW383508B (en) | 1996-07-29 | 2000-03-01 | Nichia Kagaku Kogyo Kk | Light emitting device and display |
JPH11345124A (en) | 1998-05-29 | 1999-12-14 | Ibm Japan Ltd | Method and device for determining rules in data base |
US6542878B1 (en) | 1999-04-23 | 2003-04-01 | Microsoft Corporation | Determining whether a variable is numeric or non-numeric |
US20020127529A1 (en) * | 2000-12-06 | 2002-09-12 | Cassuto Nadav Yehudah | Prediction model creation, evaluation, and training |
US8868544B2 (en) * | 2002-04-26 | 2014-10-21 | Oracle International Corporation | Using relational structures to create and support a cube within a relational database system |
US20040181519A1 (en) * | 2002-07-09 | 2004-09-16 | Mohammed Shahbaz Anwar | Method for generating multidimensional summary reports from multidimensional summary reports from multidimensional data |
EP1593072A2 (en) * | 2003-02-07 | 2005-11-09 | Power Measurement Ltd | A method and system for calculating and distributing utility costs |
US20050283511A1 (en) * | 2003-09-09 | 2005-12-22 | Wei Fan | Cross-feature analysis |
US20050222928A1 (en) * | 2004-04-06 | 2005-10-06 | Pricewaterhousecoopers Llp | Systems and methods for investigation of financial reporting information |
-
2004
- 2004-06-23 US US10/874,956 patent/US7065534B2/en not_active Expired - Fee Related
-
2005
- 2005-04-04 KR KR1020050028033A patent/KR101083519B1/en not_active IP Right Cessation
- 2005-04-29 CA CA2505983A patent/CA2505983C/en not_active Expired - Fee Related
- 2005-05-10 AU AU2005201997A patent/AU2005201997B2/en not_active Ceased
- 2005-05-11 RU RU2005114223/09A patent/RU2378694C2/en not_active IP Right Cessation
- 2005-05-23 BR BR0501784-0A patent/BRPI0501784A/en not_active IP Right Cessation
- 2005-05-24 MX MXPA05005537A patent/MXPA05005537A/en active IP Right Grant
- 2005-05-27 CN CNB2005100758481A patent/CN100568234C/en not_active Expired - Fee Related
- 2005-06-02 JP JP2005163148A patent/JP2006012140A/en active Pending
- 2005-06-17 EP EP05105343A patent/EP1610264A3/en not_active Withdrawn
- 2005-12-12 US US11/299,539 patent/US7162489B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6094651A (en) * | 1997-08-22 | 2000-07-25 | International Business Machines Corporation | Discovery-driven exploration of OLAP data cubes |
Also Published As
Publication number | Publication date |
---|---|
RU2378694C2 (en) | 2010-01-10 |
KR20060045490A (en) | 2006-05-17 |
RU2005114223A (en) | 2006-11-20 |
EP1610264A3 (en) | 2007-12-19 |
CN1713182A (en) | 2005-12-28 |
US20060106560A1 (en) | 2006-05-18 |
MXPA05005537A (en) | 2006-01-11 |
CA2505983A1 (en) | 2005-12-23 |
US7065534B2 (en) | 2006-06-20 |
CN100568234C (en) | 2009-12-09 |
EP1610264A2 (en) | 2005-12-28 |
US20050288883A1 (en) | 2005-12-29 |
US7162489B2 (en) | 2007-01-09 |
BRPI0501784A (en) | 2006-02-07 |
KR101083519B1 (en) | 2011-11-16 |
AU2005201997B2 (en) | 2010-04-22 |
CA2505983C (en) | 2014-11-18 |
AU2005201997A1 (en) | 2006-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006012140A (en) | Anomaly detection in data perspective | |
US11670021B1 (en) | Enhanced graphical user interface for representing events | |
US11868404B1 (en) | Monitoring service-level performance using defined searches of machine data | |
US11755634B2 (en) | Generating reports from unstructured data | |
US9972105B2 (en) | Visualization of data clusters | |
CN106605222A (en) | Guided data exploration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080602 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110215 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110511 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110707 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120306 |