JP2015108990A - Abnormality detection device and abnormality detection method - Google Patents

Abnormality detection device and abnormality detection method Download PDF

Info

Publication number
JP2015108990A
JP2015108990A JP2013251694A JP2013251694A JP2015108990A JP 2015108990 A JP2015108990 A JP 2015108990A JP 2013251694 A JP2013251694 A JP 2013251694A JP 2013251694 A JP2013251694 A JP 2013251694A JP 2015108990 A JP2015108990 A JP 2015108990A
Authority
JP
Japan
Prior art keywords
histogram
periodicity
cluster
abnormality detection
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013251694A
Other languages
Japanese (ja)
Other versions
JP6082341B2 (en
Inventor
岩田 泰明
Yasuaki Iwata
泰明 岩田
俊子 松本
Toshiko Matsumoto
俊子 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2013251694A priority Critical patent/JP6082341B2/en
Publication of JP2015108990A publication Critical patent/JP2015108990A/en
Application granted granted Critical
Publication of JP6082341B2 publication Critical patent/JP6082341B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To pinpointedly extract data on abnormality through analysis of a histogram collecting data causing a periodic variation due to an elapsed time.SOLUTION: An abnormality detection device acquiring data from a sensor device outputting a time-variant measurement value includes: a database in which a histogram collecting past measurement values is stored; a periodicity extraction processing unit that extracts periodicity from the histogram; a clustering processing unit that clusters a plurality of histograms stored in the database using the extracted periodicity and extracts a normal time pattern; and an abnormality detection processing unit that determines if the histogram of a determination object is abnormal, depending upon whether the histogram of the determination object and the normal time pattern have the same periodic characteristic.

Description

本発明は、異常検出装置に関し、特に、周期的に変動する指標を用いて効率的にパターンを抽出し、例外的なデータを検出する技術に関する。   The present invention relates to an anomaly detection device, and more particularly to a technique for efficiently extracting a pattern using an index that varies periodically and detecting exceptional data.

IT機器やデバイスの小型化・高速化・大容量化によって、コンシューマ機器・産業用機器・それらの基盤となるITシステム・人間の行動など様々な人間の活動を観測することが可能となり、観測データ(センサデータ)を分析することによって新しい知見を発見し、ビジネスに有効に活用し、社会を変革させることが可能となりつつある。ビッグデータの分析においては、コストを削減しながら、精度良く知見を得ることが課題になっている。全ての観測データを用いることは、容量・通信量を増大させるため、ヒストグラムなど集計値を用いた分析手法が重要である。   By downsizing, speeding up, and increasing capacity of IT equipment and devices, it is possible to observe various human activities such as consumer equipment, industrial equipment, IT systems that form the basis of them, and human behavior. It is becoming possible to discover new knowledge by analyzing (sensor data), effectively use it in business, and transform society. In big data analysis, it is an issue to obtain accurate knowledge while reducing costs. The use of all observation data increases the capacity and communication volume, so an analysis method using aggregate values such as a histogram is important.

従来、ヒストグラムを対象とした分析方法は数多く提案されており、主に画素の色相ヒストグラムによる医療用画像分類技術(特許文献1)や、文書の単語出現頻度のヒストグラムによる文書分類技術(特許文献2)などがある。これらの方法では、観測対象は複数の状態から成り、状態に応じてヒストグラムに一定の傾向が現れることを仮定し、ヒストグラムのクラスタリングや判別器を用いて分析する。   Conventionally, many analysis methods for histograms have been proposed, mainly medical image classification technology based on a hue histogram of pixels (Patent Document 1), and document classification technology based on a histogram of word appearance frequency of a document (Patent Document 2). )and so on. In these methods, the observation target is composed of a plurality of states, and it is assumed that a certain tendency appears in the histogram depending on the state, and analysis is performed using histogram clustering or a discriminator.

特願2012−29903号公報Japanese Patent Application No. 2012-29903 特願2013−84216号公報Japanese Patent Application No. 2013-84216

しかし、前述した従来の方法を機器観測データのヒストグラムに適用する場合、抽出対象となる状態以外の環境要因がヒストグラムやクラスタに与える影響が課題となる。特に、ビジネス活動、人間行動、自然現象などにおいては時間や季節に応じた変動が見られることが多く、この変動がヒストグラムの傾向を抽出する場合にノイズ要因となることがある。そこで、本発明では、時間経過による周期的変動が生じるデータを対象とした、ヒストグラムデータの分析方法を提供する。   However, when the above-described conventional method is applied to the histogram of the device observation data, the influence of environmental factors other than the state to be extracted on the histogram and the cluster becomes a problem. In particular, in business activities, human behavior, natural phenomena, etc., fluctuations according to time and season are often observed, and this fluctuation may become a noise factor when extracting a tendency of a histogram. Therefore, the present invention provides a histogram data analysis method for data that undergoes periodic fluctuations over time.

本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、時間的に変化する測定値を出力するセンサ装置からデータを取得する異常検出装置であって、過去の測定値を集計したヒストグラムを格納するデータベースと、前記ヒストグラムから周期性を抽出する周期性抽出処理部と、前記データベースに格納された複数のヒストグラムを、前記抽出された周期性を用いてクラスタリングして正常時パターンを抽出するクラスタリング処理部と、判定対象のヒストグラムと前記正常時パターンとが同じ周期的特徴を有するかによって、前記判定対象のヒストグラムが異常かを判定する異常検出処理部と、を有する。   A typical example of the invention disclosed in the present application is as follows. That is, an anomaly detection device that acquires data from a sensor device that outputs a measurement value that changes with time, a database that stores a histogram that summarizes past measurement values, and a periodicity that extracts periodicity from the histogram An extraction processing unit, a clustering processing unit that extracts a normal pattern by clustering a plurality of histograms stored in the database using the extracted periodicity, and a determination target histogram and the normal pattern And an abnormality detection processing unit that determines whether the histogram to be determined is abnormal depending on whether or not the same periodic characteristics are included.

本発明の代表的な実施形態によれば、異常なデータを的確に抽出することができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。   According to the representative embodiment of the present invention, abnormal data can be accurately extracted. Problems, configurations, and effects other than those described above will become apparent from the description of the following embodiments.

本発明の実施形態の異常検出装置の構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of the abnormality detection apparatus of embodiment of this invention. 本実施形態の測定項目のデータ構造を説明する図である。It is a figure explaining the data structure of the measurement item of this embodiment. 本実施形態のヒストグラムのデータ構造を説明する図である。It is a figure explaining the data structure of the histogram of this embodiment. 本実施形態のクラスタのデータ構造を説明する図である。It is a figure explaining the data structure of the cluster of this embodiment. 本実施形態のリアルタイムヒストグラムのデータ構造を説明する図である。It is a figure explaining the data structure of the real-time histogram of this embodiment. 本実施形態の周期性変動パターン抽出処理部において行われる処理のフローチャートである。It is a flowchart of the process performed in the periodicity fluctuation pattern extraction process part of this embodiment. 本実施形態の周期性指標設定画面の例を説明する図である。It is a figure explaining the example of the periodicity parameter | index setting screen of this embodiment. 図4のステップ402において周期性変動指標抽出処理部が実行する処理のフローチャートである。5 is a flowchart of processing executed by a periodicity variation index extraction processing unit in Step 402 of FIG. 4. 図4のステップ403においてクラスタリング処理部が実行する処理のフローチャートである。5 is a flowchart of processing executed by a clustering processing unit in Step 403 of FIG. 4. 図7のステップ706においてクラスタリング処理部が実行する周期性変動指標抽出処理のフローチャートである。It is a flowchart of the periodicity fluctuation | variation index extraction process which a clustering process part performs in step 706 of FIG. 本実施形態のクラスリング結果表示画面の例を説明する図である。It is a figure explaining the example of the class ring result display screen of this embodiment. 本実施形態の異常データ検出処理部が実行する処理のフローチャートである。It is a flowchart of the process which the abnormal data detection process part of this embodiment performs. 図10のステップ1011において異常判別処理部が実行する処理のフローチャートである。It is a flowchart of the process which an abnormality determination process part performs in step 1011 of FIG.

以下、添付図面を参照しながら、本発明の実施形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings.

図1〜図11は、本発明の実施形態を例示する図である。これらの図において、同一の符号を付した部分は同一物を表し、基本的な構成及び動作は同じである。なお、本発明の実施形態において、使用される機器及び手法等は一例であり、本発明はこれらに限定されるものではない。   1 to 11 are diagrams illustrating an embodiment of the present invention. In these drawings, parts denoted by the same reference numerals represent the same thing, and the basic configuration and operation are the same. In addition, in embodiment of this invention, the apparatus, method, etc. which are used are examples, and this invention is not limited to these.

さらに、本発明の実施形態は、後述するように、汎用コンピュータ上で稼動するソフトウェアで実装してもよいし、専用ハードウェアで実装してもよいし、又はソフトウェアとハードウェアとの組み合わせで実装してもよい。   Further, as will be described later, the embodiment of the present invention may be implemented by software running on a general-purpose computer, may be implemented by dedicated hardware, or implemented by a combination of software and hardware. May be.

なお、以後の説明では「テーブル」形式によって本発明の各情報について説明するが、これらの情報は必ずしもテーブルによるデータ構造で表現されなくてもよく、リスト、データベース、キュー等のデータ構造やそれ以外で表現されていてもよい。そのため、データ構造に依存しないことを示すために「テーブル」、「リスト」、「DB」、「キュー」等について、単に「情報」と呼ぶことがある。   In the following description, each information of the present invention will be described in a “table” format. However, such information does not necessarily have to be represented by a table data structure, such as a list, database, queue, or other data structure. It may be expressed as Therefore, “table”, “list”, “DB”, “queue”, etc. may be simply referred to as “information” in order to show that they do not depend on the data structure.

また、各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「名前」、「ID」という表現を用いることが可能であり、これらについてはお互いに置換が可能である。   In addition, when explaining the contents of each information, the expressions “identification information”, “identifier”, “name”, “name”, “ID” can be used, and these can be replaced with each other. It is.

以下では「プログラム」を主語(動作主体)として本発明の実施形態における各処理について説明するが、プログラムはプロセッサによって実行されることで定められた処理をメモリ及び通信ポート(通信制御装置)を用いながら行うため、プロセッサを主語とした説明と置き換えることができる。また、プログラムを主語として開示された処理は、管理サーバ等の計算機、情報処理装置が行う処理として記述してもよい。プログラムの一部又は全ては専用ハードウェアで実現してもよく、また、モジュール化してもよい。各種プログラムはプログラム配布サーバや記憶メディアによって各計算機にインストールされてもよい。   Hereinafter, each process in the embodiment of the present invention will be described using “program” as a subject (operation subject). However, the program uses a memory and a communication port (communication control device) to perform the process defined by the processor. However, the description can be replaced with a processor as the subject. Further, the processing disclosed with the program as the subject may be described as processing performed by a computer such as a management server or an information processing apparatus. Part or all of the program may be realized by dedicated hardware or may be modularized. Various programs may be installed in each computer by a program distribution server or a storage medium.

<異常検出装置の概要>
図1は、本発明の実施形態の異常検出装置の構成を示す機能ブロック図である。
<Outline of abnormality detection device>
FIG. 1 is a functional block diagram showing the configuration of the abnormality detection apparatus according to the embodiment of the present invention.

異常検出装置は、ヒストグラムデータDB100と、表示装置101と、入力装置102と、データ転送端末103と、中央処理装置104と、プログラムメモリ105と、データメモリ106とを有する。   The abnormality detection device includes a histogram data DB 100, a display device 101, an input device 102, a data transfer terminal 103, a central processing unit 104, a program memory 105, and a data memory 106.

ヒストグラムデータDB100は、データ転送端末103から転送されたヒストグラムを格納するデータベースである。表示装置101は、液晶ディスプレイ装置等、プログラムの実行結果をユーザが視認可能な形式で表示するインターフェースである。入力装置102は、キーボード及びマウス等の、ユーザからの操作を受けるインターフェースである。データ転送端末103は、機器に取り付けられたセンサの測定値を集計してヒストグラムとして転送する。   The histogram data DB 100 is a database that stores a histogram transferred from the data transfer terminal 103. The display device 101 is an interface such as a liquid crystal display device that displays the execution result of the program in a format that can be visually recognized by the user. The input device 102 is an interface that receives an operation from a user, such as a keyboard and a mouse. The data transfer terminal 103 aggregates the measured values of the sensors attached to the devices and transfers them as a histogram.

中央処理装置104は、プログラムメモリ105に格納されたプログラムを実行する。プログラムメモリ105は、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子内に設けられ、中央処理装置104によって実行されるプログラムを格納する。データメモリ106は、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子内に設けられ、プログラムの実行時に使用されるデータを格納する。   The central processing unit 104 executes a program stored in the program memory 105. The program memory 105 is provided in a high-speed and volatile storage element such as a DRAM (Dynamic Random Access Memory), and stores a program executed by the central processing unit 104. The data memory 106 is provided in a high-speed and volatile storage element such as a DRAM (Dynamic Random Access Memory), and stores data used when the program is executed.

中央処理装置104は、周期性変動パターン抽出処理部107と、異常データ検出処理部と、周期性変動指標設定画面表示処理部と、クレンジング条件選択画面表示処理部と、周期性変動指標設定画面表示処理部109と、クラスタリング結果表示処理部110と、を有する。本実施形態では、これらの各処理部、コンピュータ上で実行されるプログラムの機能の一部として実現される。なお、これらのプログラムは、プログラムメモリ105に格納され、処理実行の際に中央処理装置104が内部メモリに読み込む。なお、周期性変動パターン抽出処理部107は、周期性変動指標抽出処理部111と、クラスタリング処理部112とを有する。また、異常データ検出処理部108は、異常判別処理部113を有する。   The central processing unit 104 includes a periodic variation pattern extraction processing unit 107, an abnormal data detection processing unit, a periodic variation index setting screen display processing unit, a cleansing condition selection screen display processing unit, and a periodic variation index setting screen display. A processing unit 109 and a clustering result display processing unit 110 are included. In the present embodiment, these processing units are realized as part of the functions of a program executed on the computer. These programs are stored in the program memory 105, and are read into the internal memory by the central processing unit 104 when processing is executed. The periodic variation pattern extraction processing unit 107 includes a periodic variation index extraction processing unit 111 and a clustering processing unit 112. In addition, the abnormal data detection processing unit 108 includes an abnormality determination processing unit 113.

データメモリ106は、ヒストグラムデータDB100から読み込まれた測定項目114及びヒストグラム115と、周期性変動パターン抽出処理部107で生成されたヒストグラムのクラスタ116と、ネットワーク経由などでデータ転送端末103から逐次転送されるリアルタイムヒストグラム117とを格納する。   The data memory 106 is sequentially transferred from the data transfer terminal 103 via a network or the like, through the measurement item 114 and the histogram 115 read from the histogram data DB 100, the histogram cluster 116 generated by the periodic variation pattern extraction processing unit 107, and the like. Real-time histogram 117 to be stored.

<データ構造>
次に、本実施形態の異常検出装置が用いるデータの構造について説明する。なお、図2Aから図3Bに図示するメンバ名は一例に過ぎず、産業用機器や所定の位置における移動体の動向、携帯端末の座標を用いたエリアごとの人口分布、通信状態など、それぞれの測定対象の状態を監視する上で適切な測定項目が選ばれ、それらを格納するためのデータ構造としてもよい。
<Data structure>
Next, the data structure used by the abnormality detection apparatus of the present embodiment will be described. Note that the member names illustrated in FIGS. 2A to 3B are merely examples, and each of the industrial equipment, the trend of the mobile body at a predetermined position, the population distribution for each area using the coordinates of the mobile terminal, the communication state, etc. An appropriate measurement item for monitoring the state of the measurement target may be selected, and a data structure for storing them may be used.

図2Aは、データメモリ106に格納される測定項目114のデータ構造を説明する図である。   FIG. 2A is a diagram for explaining the data structure of the measurement item 114 stored in the data memory 106.

測定項目114は、項目名200及び級数201を含み、例えば、配列の形式でこれらの情報を保有している。項目名200は、例えば、監視対象となる移動体の状態を監視するために取り付けられたセンサの種類や操作状態などの測定項目の種類を格納する。また、級数201は、測定項目の度数分布における級数を定義する値が配列で保持され、例えば、速度の級数では15km/sの間隔を級数を定義する。   The measurement item 114 includes an item name 200 and a series 201, and holds such information in an array format, for example. The item name 200 stores, for example, the types of measurement items such as the types of sensors and operation states attached to monitor the state of a moving object to be monitored. In the series 201, values defining the series in the frequency distribution of the measurement items are held in an array. For example, in the speed series, the series is defined with an interval of 15 km / s.

図2Bは、データメモリ106に格納されるヒストグラム115のデータ構造を説明する図である。   FIG. 2B is a diagram for explaining the data structure of the histogram 115 stored in the data memory 106.

ヒストグラム115は、ID202、項目名203、測定開始日時204、測定終了日時205、経路206、天候207、気温208、累積渋滞時間209、度数210、状態211及び周期性変動指標212を含み、例えば、配列の形式でこれらの情報を保有する。   The histogram 115 includes ID 202, item name 203, measurement start date and time 204, measurement end date and time 205, route 206, weather 207, temperature 208, accumulated traffic time 209, frequency 210, state 211, and periodicity variation index 212, for example. This information is held in the form of an array.

ID202は、ヒストグラムの一意に識別するための識別子を格納する。項目名203は、ヒストグラムに集計したセンサや操作状態などの種類を格納する。測定開始日時204は、測定項目の集計を開始した日時を保持する。測定終了日時205は、測定項目の集計を終了した日時を保持する。経路206は、移動体の出発地名及び到着地名を保持する。天候207は、天候状態を示す「晴れ」「曇り」「雨」「雪」のいずれかを格納する。気温208は、当該ヒストグラムの集計期間中の、経路の地域における平均気温を格納する。累積渋滞時間209は、出発地から目的地において渋滞した時間の累積値を保持する。なお、経路206は、移動体に測位装置(GPSなど)を搭載し、外部リソースからの座標情報に基づいて、予め決定されているとする。また、気温208及び累積渋滞時間209の測定点も同様である。   The ID 202 stores an identifier for uniquely identifying the histogram. The item name 203 stores the types of sensors and operation states that are tabulated in the histogram. The measurement start date and time 204 holds the date and time when measurement item aggregation has started. The measurement end date and time 205 holds the date and time when the aggregation of measurement items is completed. The route 206 holds the departure place name and arrival place name of the mobile unit. The weather 207 stores any one of “sunny”, “cloudy”, “rain”, and “snow” indicating the weather state. The temperature 208 stores the average temperature in the area of the route during the aggregation period of the histogram. The accumulated traffic time 209 holds a cumulative value of the time during which traffic jams from the departure point to the destination. Note that the route 206 is assumed to be determined in advance based on coordinate information from an external resource by mounting a positioning device (GPS or the like) on the moving body. The same applies to the measurement points for the temperature 208 and the accumulated traffic time 209.

度数210は、一定時間間隔で測定した数値を度数分布で格納した値である。状態211はヒストグラムの集計期間中の監視対象の状態を示すもので、正常、例外、又は異常のいずれかが格納される。また、異常が予め詳細にカテゴリ分けされている場合には、それらのカテゴリ(異常の種類)が格納されてもよい。例えば、危険運転を検出する場合、事故が起きた際のヒストグラムについてカテゴリとして前方不注意、飲酒、居眠りなどの原因を格納してもよい。また、配送業に用いる自動車のドライブレコーダのように、燃費(効率的な運転傾向)を検出をする場合、状態の定義を正常及び異常の代わりに、効率及び非効率にしてもよい。周期性変動指標212は、ヒストグラムの分布に影響を与える外部環境を特徴量とした特徴ベクトルを格納する。なお、初期状態では、周期性変動指標212をnullとする。   The frequency 210 is a value obtained by storing numerical values measured at regular time intervals in a frequency distribution. The state 211 indicates the state of the monitoring target during the aggregation period of the histogram, and stores either normal, exception, or abnormality. In addition, when abnormalities are categorized in detail in advance, those categories (abnormality types) may be stored. For example, when dangerous driving is detected, causes such as forward carelessness, drinking, and falling asleep may be stored as categories for the histogram when an accident occurs. Moreover, when detecting fuel consumption (efficient driving tendency) as in the drive recorder of an automobile used in the delivery business, the definition of the state may be made efficient and inefficient instead of normal and abnormal. The periodicity variation index 212 stores a feature vector whose feature quantity is an external environment that affects the histogram distribution. In the initial state, the periodicity fluctuation index 212 is null.

図3Aは、データメモリ106に含まれるクラスタ116のデータ構造を説明する図である。   FIG. 3A is a diagram for explaining the data structure of the cluster 116 included in the data memory 106.

クラスタ116は、項目名300、ヒストIDリスト301、周期性変動指標302及び正常時パターンフラグ303を含み、例えば、これらの情報を配列の形式で保有する。項目名300は、ヒストグラムに集計したセンサや操作状態などの種類を格納する。ヒストID301リストは、クラスタに含まれるヒストグラムのIDを配列の形式で格納する。周期性変動指標302は、ヒストグラムの分布に影響を与える外部環境を特徴量とした特徴ベクトルを格納する。なお、初期状態ではnullとする。正常時パターンフラグ303は、監視対象である移動体が正常時に観測されるヒストグラムパターンのみを含むクラスタかを示すフラグであり、Trueのときは正常、falseのときは正常以外であるとする。   The cluster 116 includes an item name 300, a histo ID list 301, a periodicity variation index 302, and a normal pattern flag 303, and holds such information in the form of an array, for example. The item name 300 stores the types of sensors and operation states that are tabulated in the histogram. The histogram ID 301 list stores the IDs of histograms included in a cluster in the form of an array. The periodicity variation index 302 stores a feature vector whose feature quantity is an external environment that affects the histogram distribution. Note that the initial state is null. The normal pattern flag 303 is a flag indicating whether the moving object to be monitored is a cluster including only a histogram pattern observed at normal time. It is assumed that the normal state is true for True and the normal state is false for False.

図3Bは、データメモリ106に含まれるリアルタイムヒストグラム117のデータ構造を説明する図である。   FIG. 3B is a diagram for explaining the data structure of the real-time histogram 117 included in the data memory 106.

リアルタイムヒストグラム117は、項目名304、測定開始日時305、測定終了日時306、経路307、天候308、気温309、累積渋滞時間310、度数311、異常時フラグ312及び移動体ID313を含む。   The real-time histogram 117 includes an item name 304, a measurement start date / time 305, a measurement end date / time 306, a route 307, a weather 308, an air temperature 309, an accumulated traffic time 310, a frequency 311, an abnormal time flag 312, and a moving body ID 313.

項目名304は、ヒストグラムに集計したセンサや操作状態などの種類を格納する。測定開始日時305は、測定項目の集計を開始した日時を保持する。測定終了日時306は、測定項目の集計を終了した日時を保持する。経路307は、移動体の出発地名及び到着地名を保持する。天候308は、天候状態を示す「晴れ」「曇り」「雨」「雪」のいずれかを格納する。気温309は、当該ヒストグラムの集計期間中の、経路の地域における平均気温を格納する。累積渋滞時間310は、出発地から目的地において渋滞した時間の累積値を保持する。なお、経路307は、移動体に測位装置(GPSなど)を搭載し、外部リソースからの座標情報に基づいて、予め決定されているとする。また、天候308、気温309及び累積渋滞時間310の測定点も同様である。   The item name 304 stores the types of sensors and operation states that are tabulated in the histogram. The measurement start date and time 305 holds the date and time when measurement item aggregation has started. The measurement end date and time 306 holds the date and time when measurement item aggregation has been completed. The route 307 holds the departure place name and arrival place name of the mobile object. The weather 308 stores one of “sunny”, “cloudy”, “rain”, and “snow” indicating the weather condition. The temperature 309 stores the average temperature in the route area during the aggregation period of the histogram. The accumulated traffic time 310 holds a cumulative value of the time during which traffic jams from the departure point to the destination. Note that the route 307 is assumed to be determined in advance based on coordinate information from an external resource by mounting a positioning device (such as GPS) on the moving body. The measurement points of the weather 308, the temperature 309, and the accumulated traffic time 310 are the same.

度数311は、一定時間間隔で測定した数値を度数分布で格納した値である。異常時フラグ312は、移動体が異常時に測定されたヒストグラムであるかどうかのスコアを格納する。なお、初期状態ではnullとする。移動体ID313は、監視対象を一意に識別するための識別子を格納する。   The frequency 311 is a value obtained by storing numerical values measured at regular time intervals in a frequency distribution. The abnormal flag 312 stores a score indicating whether or not the moving object is a histogram measured when abnormal. Note that the initial state is null. The mobile body ID 313 stores an identifier for uniquely identifying the monitoring target.

<周期性変動パターン抽出処理の概要>
図4は、周期性変動パターン抽出処理部107において行われる処理のフローチャートである。
<Outline of periodic fluctuation pattern extraction processing>
FIG. 4 is a flowchart of processing performed in the periodic variation pattern extraction processing unit 107.

周期性変動パターン抽出処理部107は、ログデータとして蓄積されたヒストグラムと周期変動する指標である気温や曜日、時間帯などを用いて、正常時における周期条件のヒストグラムパターンをクラスタリングによって抽出する処理を行う。   The periodic fluctuation pattern extraction processing unit 107 performs a process of extracting a histogram pattern of periodic conditions by normal clustering using the histogram accumulated as log data and the temperature, day of the week, time zone, etc., which are periodic fluctuation indexes. Do.

まず、ヒストグラムデータDB100からヒストグラムを取得し、データメモリ106に格納する(ステップ400)。   First, a histogram is acquired from the histogram data DB 100 and stored in the data memory 106 (step 400).

次に、周期性変動指標設定画面表示処理部109を起動し、ヒストグラムの変動に影響の要因となる周期性の定義を設定するための画面を表示装置101に表示する(ステップ401)。なお、ステップ401で表示装置101に表示される画面は、図5を用いて後述する。   Next, the periodicity variation index setting screen display processing unit 109 is activated, and a screen for setting the definition of periodicity that has an influence on the variation of the histogram is displayed on the display device 101 (step 401). The screen displayed on the display device 101 in step 401 will be described later with reference to FIG.

続いて、周期性変動指標抽出処理部111が、周期性に基づいて、ヒストグラム115に周期性変動指標を割り当る(ステップ402)。なお、ステップ402のの処理は、図6を用いて後述する。   Subsequently, the periodicity fluctuation index extraction processing unit 111 assigns a periodicity fluctuation index to the histogram 115 based on the periodicity (step 402). The process of step 402 will be described later with reference to FIG.

そして、クラスタリング処理部112が、形状が類似するヒストグラムをクラスタリングし、監視対象となるシステム及び機器における正常時のヒストグラムのパターンをクラスタとして抽出する(ステップ403)。   Then, the clustering processing unit 112 clusters histograms having similar shapes, and extracts normal histogram patterns in the systems and devices to be monitored as clusters (step 403).

クラスタリング処理の後、クラスタリング結果表示処理部110を起動し、生成されたクラスタを確認するためのクラスタリング結果表示画面を表示装置101に描画する(ステップ404)。なお、ステップ404で表示装置101に表示される画面は、図9を用いて後述する。ユーザはクラスタリング結果表示画面において、生成されたクラスタの確認して処理を終了する。   After the clustering process, the clustering result display processing unit 110 is activated, and a clustering result display screen for confirming the generated cluster is drawn on the display device 101 (step 404). The screen displayed on the display device 101 in step 404 will be described later with reference to FIG. The user confirms the generated cluster on the clustering result display screen and ends the process.

<周期性変動指標設定画面表示処理部109の詳細(ステップ401)>
図5は、図4のステップ401で表示装置101に表示される画面を説明する図である。
<Details of Periodic Variation Index Setting Screen Display Processing Unit 109 (Step 401)>
FIG. 5 is a diagram for explaining the screen displayed on the display device 101 in step 401 of FIG.

図5に示すように、周期性指標設定画面は、月単位500と、週単位505と、曜日単位506と、日単位507と、時間単位508とで周期性の定義が可能である。例えば、月単位500では、1月〜12月を周期とする場合501やビジネス面での時間経過における周期として4半期502、年を半分に分割する半期503、さらに、特定の月でイベントがある場合、例えば、決済月や業務における繁忙期などがある月を一つのカテゴリなどとして任意指定504ができる。このように、ユーザは周期性変動指標設定画面から、ヒストグラムの変動要因となる周期を定義する。そして、ユーザは実行ボタン509を操作することによって、ユーザが設定した周期性指標を取得し、周期性指標設定処理を終了する。   As shown in FIG. 5, in the periodicity index setting screen, the periodicity can be defined by a monthly unit 500, a week unit 505, a day unit 506, a day unit 507, and a time unit 508. For example, in a monthly unit 500, there are events in a period of January to December 501, a quarter in a business period of time 502, a half period 503 in which a year is divided in half, and an event in a specific month. In this case, for example, a month with a settlement month or a busy period in business can be arbitrarily designated 504 as one category. As described above, the user defines a cycle that is a factor of fluctuation of the histogram from the periodicity variation index setting screen. Then, the user operates the execution button 509 to acquire the periodicity index set by the user, and ends the periodicity index setting process.

<周期性変動指標抽出処理部111の詳細(ステップ402)>
図6は、図4のステップ402において周期性変動指標抽出処理部111が実行する処理のフローチャートである。図6に示す周期性変動指標抽出処理は、周期性指標設定画面(図5)においてユーザが定義した周期及びヒストグラムの集計期間中の外部環境値から、ヒストグラムのパターンに影響を与える周期性変動指標を抽出する処理である。
<Details of Periodic Variation Index Extraction Processing Unit 111 (Step 402)>
FIG. 6 is a flowchart of processing executed by the periodicity variation index extraction processing unit 111 in step 402 of FIG. The periodic variation index extraction process shown in FIG. 6 is performed by using a periodic variation index that affects the pattern of the histogram from the period defined by the user on the periodic index setting screen (FIG. 5) and the external environment value during the aggregation period of the histogram. This is a process for extracting.

まず、ヒストグラム115のインデックス hist_idxを0で初期化する(ステップ600)。   First, the index hist_idx of the histogram 115 is initialized with 0 (step 600).

次に、hist_idx番目のヒストグラムがあるか判定して(ステップ601)、ない場合には処理を終了する。   Next, it is determined whether or not there is a hist_idx-th histogram (step 601).

hist_idx 番目のヒストグラム115がある場合、当該ヒストグラム115の集計期間が時間単位(1時間以内で集計されたもの)であるかを判定して(ステップ602)、ヒストグラム115の集計期間が時間単位である場合、時間単位、日単位、天候、曜日単位、週単位、及び月単位の該当する値を当該ヒストグラムの周期性変動指標212に割り当てる(ステップ606〜610)。なお、周期性変動指標設定画面(図5)において指標が選択されなかったヒストグラムの周期性変動指標はnullとする。   If there is a hist_idx-th histogram 115, it is determined whether the aggregation period of the histogram 115 is a time unit (aggregated within one hour) (step 602), and the aggregation period of the histogram 115 is a time unit. In this case, corresponding values of time unit, day unit, weather, day of week unit, week unit, and month unit are assigned to the periodicity fluctuation index 212 of the histogram (steps 606 to 610). Note that the periodicity fluctuation index of the histogram in which no index is selected on the periodicity fluctuation index setting screen (FIG. 5) is null.

また、ステップ602において、ヒストグラム115の集計期間が時間単位でないと判定された場合、ヒストグラム115の集計期間が日単位(24時間以内で集計されたもの)であるかを判定する(ステップ603)。ヒストグラム115の集計期間が日単位である場合、日単位、天候、曜日単位、週単位、及び月単位の該当する値を当該ヒストグラムの周期性変動指標212に割り当てる(ステップ607〜610)。   If it is determined in step 602 that the aggregation period of the histogram 115 is not in time units, it is determined whether the aggregation period in the histogram 115 is in days (aggregated within 24 hours) (step 603). When the aggregation period of the histogram 115 is daily, corresponding values of daily, weather, day of the week, weekly, and monthly are assigned to the periodicity fluctuation index 212 of the histogram (steps 607 to 610).

また、ステップ603において、ヒストグラムの集計期間が日単位でないと判定された場合、ヒストグラムの集計期間が週単位(168時間以内で集計されたもの)であるかを判定する(ステップ604)。ヒストグラムの集計期間が週単位である場合、週単位、及び月単位の該当する値を当該ヒストグラムの周期性変動指標212に割り当てる(ステップ609、610)。   If it is determined in step 603 that the aggregation period of the histogram is not in units of days, it is determined whether the aggregation period of the histogram is in weeks (totaled within 168 hours) (step 604). When the aggregation period of the histogram is a week unit, the corresponding values of the week unit and the month unit are assigned to the periodicity fluctuation index 212 of the histogram (steps 609 and 610).

また、ステップ604において、ヒストグラムの集計期間が週単位でないと判定された場合、ヒストグラムの集計期間が月単位(720時間以内で集計されたもの)であるかを判定する(ステップ605)。ヒストグラムの集計期間が月単位である場合、月単位の該当する値を当該ヒストグラムの周期性変動指標212に割り当てる(ステップ610)。   If it is determined in step 604 that the histogram aggregation period is not weekly, it is determined whether the histogram aggregation period is monthly (aggregated within 720 hours) (step 605). When the aggregation period of the histogram is monthly, a corresponding value of the monthly unit is assigned to the periodicity fluctuation index 212 of the histogram (step 610).

そして、ステップ605において、ヒストグラムの集計期間が月単位でないと判定された場合、例えば、集計時間の累積値が予め設定された閾値となった時点でデータ転送端末103がヒストグラムを転送する場合、気温などの連続値(環境変数)と、ヒストグラムの特徴量の平均、分散、尖度、歪度などの統計値との相関係数を算出し、閾値以上の相関係数を持つ外部環境変数を当該ヒストグラムの周期性変動指標212に割り当てる(ステップ611)。   If it is determined in step 605 that the aggregation period of the histogram is not in units of months, for example, if the data transfer terminal 103 transfers the histogram when the accumulated value of the aggregation time reaches a preset threshold value, Calculate the correlation coefficient between continuous values (environment variables) such as histograms and statistical values such as the average, variance, kurtosis, and skewness of the feature values of the histogram. This is assigned to the periodicity fluctuation index 212 of the histogram (step 611).

そして、hist_idxをインクリメントして(ステップ612)、ステップ601の処理に戻る。また、ステップ601において、hist_idx番目のヒストグラムがない場合、処理を終了する。   Then, hist_idx is incremented (step 612), and the process returns to step 601. If there is no hist_idx-th histogram in step 601, the process ends.

<クラスタリング処理部112の詳細(ステップ403)>
図7は、図4のステップ403においてクラスタリング処理部112が実行する処理のフローチャートである。図7に示すクラスタリング処理は、周期性変動指標が割り当てられた正常時及び異常時のヒストグラムを用いてクラスタリングを行い、周期性変動した際のクラスタを生成することによって、外部要因の影響をパラメータとして保持するための正常時のヒストグラムパターンを抽出する処理である。
<Details of Clustering Processing Unit 112 (Step 403)>
FIG. 7 is a flowchart of processing executed by the clustering processing unit 112 in step 403 of FIG. In the clustering process shown in FIG. 7, clustering is performed using normal and abnormal histograms to which periodicity fluctuation indexes are assigned, and a cluster at the time of periodic fluctuations is generated, whereby the influence of external factors is used as a parameter. This is a process of extracting a normal histogram pattern for holding.

まず、測定項目114のインデックス sensor_idxを0に初期化する(ステップ700)。次に、sensor_idx番目の測定項目114があるか判定して(ステップ701)、ない場合には処理を終了する。   First, the index sensor_idx of the measurement item 114 is initialized to 0 (step 700). Next, it is determined whether or not there is a sensor_idx-th measurement item 114 (step 701).

sensor_idx番目の測定項目114がある場合、当該測定項目114の項目名200を持つヒストグラム115を取得してクラスタリングする(ステップ702)。なお、クラスタリングは度数分布の形状が類似しているヒストグラムをクラスタとして纏める処理であり、度数210の配列一つ一つを特徴とした特徴ベクトルによってヒストグラム間の距離(例えば、ユークリッド距離やマハラノビス距離など)を計算して、ウォード法で分類してもよい。また、ヒストグラム間の類似度をバタチャリア係数やピアソン係数を用いて計算して郡平均法で分類してもよい。   When there is a sensor_idx-th measurement item 114, the histogram 115 having the item name 200 of the measurement item 114 is acquired and clustered (step 702). Clustering is a process of collecting histograms having similar frequency distribution shapes as a cluster, and the distance between histograms (for example, Euclidean distance, Mahalanobis distance, etc.) by a feature vector characterized by each frequency 210 array. ) May be calculated and classified by the Ward method. Further, the similarity between histograms may be calculated using the Batacharia coefficient or Pearson coefficient and classified by the county average method.

次に、クラスタリングによって生成されたクラスタ116のインデックスcluster_idxを0で初期化する(ステップ703)。そして、cluster_idx番目のクラスタ116があるかを確認し(ステップ704)、ない場合はsensor_idxをインクリメントした後(ステップ709)、ステップ701の処理に戻る。   Next, the index cluster_idx of the cluster 116 generated by clustering is initialized with 0 (step 703). Then, it is confirmed whether or not the cluster_idx-th cluster 116 exists (step 704). If not, sensor_idx is incremented (step 709), and the process returns to step 701.

また、ステップ704の処理においてcluster_idx番目のクラスタがある場合、当該クラスタに含まれる全てのヒストグラムの状態211が異常であるかを判定する(ステップ705)。   Further, when there is a cluster_idx-th cluster in the processing of step 704, it is determined whether or not the state 211 of all histograms included in the cluster is abnormal (step 705).

クラスタ内の全てのヒストグラムの状態211が異常である場合、当該クラスタは監視対象が異常時のヒストグラムパターンなので、当該クラスタの正常時パターンフラグ303にFalseを格納する(ステップ707)。   If all the histogram states 211 in the cluster are abnormal, the cluster is a histogram pattern when the monitoring target is abnormal, and therefore False is stored in the normal pattern flag 303 of the cluster (step 707).

一方、ステップ705において、クラスタ内の一部のヒストグラムが異常でない場合、当該クラスタの周期性変動指標を抽出する(ステップ706)。この周期性変動指標抽出処理は、図8を用いて後述する。   On the other hand, if some of the histograms in the cluster are not abnormal in step 705, the periodicity fluctuation index of the cluster is extracted (step 706). This periodicity variation index extraction process will be described later with reference to FIG.

そして、cluster_idxをインクリメントして(ステップ708)、ステップ704の処理へ戻る。   Then, cluster_idx is incremented (step 708), and the process returns to step 704.

このクラスタリング処理によって、異常時のヒストグラムが全てであるクラスタは異常時パターンとして、正常時のヒストグラムを含むクラスタは正常時パターンとしてクラスタリングすることができる。   By this clustering process, a cluster including all the histograms at the time of abnormality can be clustered as an abnormal pattern, and a cluster including the histogram at the normal time can be clustered as a normal pattern.

<クラスタの周期性変動指標抽出処理の詳細(ステップ706)>
図8は、図7のステップ706においてクラスタリング処理部112が実行する処理のフローチャートである。図8に示すクラスタ周期性変動指標抽出処理は、正常時のヒストグラムを含むクラスタから周期性変動指標における共通項目を探し出し、周期変動に伴うヒストグラムのパターンを抽出する処理である。
<Details of Cluster Periodic Variation Index Extraction Processing (Step 706)>
FIG. 8 is a flowchart of processing executed by the clustering processing unit 112 in step 706 of FIG. The cluster periodicity fluctuation index extraction process shown in FIG. 8 is a process for finding a common item in the periodicity fluctuation index from a cluster including a normal histogram and extracting a histogram pattern associated with the periodic fluctuation.

まず、当該クラスタに含まれる全てのヒストグラムの状態211が正常であるか判定する(ステップ800)。当該クラスタ内の全てのヒストグラムが正常であれば、当該クラスタは正常時パターンを表しているので、ステップ805の処理へ進む。   First, it is determined whether the state 211 of all histograms included in the cluster is normal (step 800). If all the histograms in the cluster are normal, the cluster represents a normal pattern, and the process proceeds to step 805.

一方、当該クラスタ内の一部のヒストグラムが異常である場合、異常時のヒストグラムと周期性変動指標の値が同じヒストグラムをクラスタから取り除く(ステップ801)。異常時とパターンが同一の正常時のヒストグラムを取り除くことによって、より正確に正常時のヒストグラムを取得する。また、周期性変動指標には、曜日や気候などのカテゴリで表されるものと、気温などの数値(離散値又は連続値)で表されるものとがある。カテゴリで表される周期性変動指標に関しては、いずれかの周期性変動指標の値が一致するかによって、正常時のヒストグラムであるかを判定できる。また、数値(離散値又は連続値)で表される周期性変動指標に関しては、各周期性変動指標の値を特徴量とした特徴ベクトルにおいてユークリッド距離、マハラノビス距離などの距離が閾値以下であるかによって、正常時のヒストグラムであるかを判定できる。   On the other hand, if some of the histograms in the cluster are abnormal, a histogram having the same value of the periodicity variation index as the histogram at the time of abnormality is removed from the cluster (step 801). By removing the normal histogram having the same pattern as that in the abnormal state, the normal histogram is obtained more accurately. In addition, the periodicity variation index includes those represented by categories such as day of the week and climate, and those represented by numerical values (discrete values or continuous values) such as temperature. With respect to the periodic fluctuation index represented by the category, it can be determined whether it is a normal histogram depending on whether the values of any of the periodic fluctuation indices match. In addition, regarding periodicity fluctuation indexes represented by numerical values (discrete values or continuous values), are distances such as Euclidean distances and Mahalanobis distances equal to or less than a threshold in a feature vector using the value of each periodicity fluctuation index as a feature quantity? Can determine whether the histogram is normal.

次に、クラスタから異常時のヒストグラムを取り出して、一つの新しいクラスタを生成する(ステップ802)。   Next, an abnormal histogram is extracted from the cluster to generate one new cluster (step 802).

そして、新しく生成したクラスタの正常時パターンフラグ303にFalseを格納する(ステップ803)。このように、異常時のヒストグラムと類似する正常時のヒストグラムを除外することによって、より正確な正常時のパターンを抽出する。   Then, False is stored in the normal pattern flag 303 of the newly generated cluster (step 803). In this way, a more accurate normal pattern is extracted by excluding the normal histogram similar to the abnormal histogram.

次に、一つ以上の正常時のヒストグラムが残っているか判定し(ステップ804)、一つも残っていない場合には処理を終了する。   Next, it is determined whether or not one or more normal histograms remain (step 804). If no histogram remains, the process ends.

一方、正常時のヒストグラムが一つ以上ある場合、正常時のヒストグラムにおける全ての周期性変動指標212が同一かを判定する(ステップ805)。カテゴリで表される周期性変動指標に関しては、クラスタ内の正常時の全てのヒストグラムで周期性変動指標の値が同一かによって周期性変動指標が同一かを判定できる。また、数値(離散値又は連続値)で表される周期性変動指標に関しては、全てのヒストグラム間の距離の分散が閾値以下である周期性変動指標の値があるかによって周期性変動指標の値が同一かを判定できる。なお、複数の周期性変動指標を含む場合、全ての周期性変動指標において同一と判断されることが必要である。   On the other hand, if there are one or more normal histograms, it is determined whether all the periodic fluctuation indexes 212 in the normal histogram are the same (step 805). Regarding the periodicity variation index represented by the category, it can be determined whether the periodicity variation index is the same depending on whether the values of the periodicity variation index are the same in all the histograms in the normal cluster. In addition, regarding the periodic fluctuation index represented by a numerical value (discrete value or continuous value), the value of the periodic fluctuation index depends on whether there is a periodic fluctuation index value in which the dispersion of distances between all histograms is equal to or less than a threshold value. Can be determined to be the same. When a plurality of periodic fluctuation indices are included, it is necessary to determine that all periodic fluctuation indices are the same.

そして、ステップ805において一部の周期性変動指標の値が同一ではないと判定された場合、当該正常時のヒストグラムを含むクラスタをデータメモリ106から除外する(ステップ807)。   If it is determined in step 805 that the values of some periodic fluctuation indices are not the same, the cluster including the normal histogram is excluded from the data memory 106 (step 807).

一方、ステップ805において全ての周期性変動指標が同一であると判定された場合、各周期性変動指標の値を特徴とした特徴ベクトルを当該クラスタの周期性変動指標302に格納する(ステップ806)。なお、共有していない周期性変動指標はnullとする。   On the other hand, if it is determined in step 805 that all periodic fluctuation indices are the same, a feature vector characterized by the value of each periodic fluctuation index is stored in the periodic fluctuation index 302 of the cluster (step 806). . Note that the periodicity fluctuation index that is not shared is null.

<クラスタリング結果表示処理部110の詳細(ステップ404)>
図9は、図4のステップ404で表示装置101に表示される画面を説明する図である。ユーザは、クラスタリング結果表示画面によって、生成されたクラスタと共通する周期性を確認し、不用なクラスタを削除することができる。
<Details of Clustering Result Display Processing Unit 110 (Step 404)>
FIG. 9 is a diagram for explaining the screen displayed on the display device 101 in step 404 of FIG. The user can confirm the periodicity common to the generated clusters on the clustering result display screen, and can delete unnecessary clusters.

図9に示すように、クラスリング結果表示画面は、速度900、加速度901、ブレーキ圧力902、ウィンカー点灯時間903、車体正面を中心とした進行方向の変化角度904、エンジン回転数905などの、単位時間ごとの移動体の状態を測定した項目がタブメニューから選択できるようになっている。例えば、ユーザが速度900を選択した場合、速度のヒストグラムのクラスタリング結果の一覧906を表示する。   As shown in FIG. 9, the classing result display screen includes units such as a speed 900, an acceleration 901, a brake pressure 902, a blinker lighting time 903, a change angle 904 in the traveling direction centered on the front of the vehicle body, and an engine speed 905. Items that measure the state of the moving body over time can be selected from the tab menu. For example, when the user selects the speed 900, a list 906 of clustering results of the speed histogram is displayed.

一覧906には、各クラスタを選択するためのラジオボタン、クラスタに付与される周期性変動指標907が表示される。クラスリング結果の一覧からラジオボタンを選択することによって、選択したクラスタに含まれるヒストグラムを重ね合わせた表示する折れ線グラフ908を描画する。また、一覧906によって、クラスタのノード数や共通の周期性変動指標を表示して、不要なクラスタはチェックボックス909で選択して、削除することができる。ユーザが確認ボタン910を操作することによって、チェックボックスで選択されたクラスタをデータメモリ106から削除することができる。   The list 906 displays a radio button for selecting each cluster and a periodicity change index 907 assigned to the cluster. By selecting a radio button from the list of class ring results, a line graph 908 that displays the superimposed histograms included in the selected cluster is drawn. Further, the list 906 displays the number of nodes of the cluster and the common periodicity variation index, and an unnecessary cluster can be selected by the check box 909 and deleted. When the user operates the confirmation button 910, the cluster selected by the check box can be deleted from the data memory 106.

<異常データ検出処理の概要>
図10は、異常データ検出処理部108が実行する処理のフローチャートである。図10に示す異常データ検出処理は、データメモリ106に格納された正常時のヒストグラムを含むクラスタを用いて、データ転送端末103から転送されるヒストグラムが異常であるかをリアルタイムで判別する処理である。
<Overview of abnormal data detection processing>
FIG. 10 is a flowchart of processing executed by the abnormal data detection processing unit 108. The abnormal data detection process shown in FIG. 10 is a process for determining in real time whether or not the histogram transferred from the data transfer terminal 103 is abnormal, using a cluster including a normal histogram stored in the data memory 106. .

まず、データ転送端末103からリアルタイムで転送されるヒストグラムをデータメモリ106に格納する(ステップ1000)。   First, the histogram transferred in real time from the data transfer terminal 103 is stored in the data memory 106 (step 1000).

次に、ヒストグラム115の集計期間が時間単位(1時間以内で集計されたもの)であるかを判定して(ステップ1001)、ヒストグラム115の集計期間が時間単位である場合、時間単位、日単位、天候、曜日単位、週単位、及び月単位の該当する値を特徴ベクトルとして周期性変動指標212に割り当てる(ステップ1005〜1009)。なお、周期性変動指標設定画面(図5)において選択されなかった周期性変動指標はnullとする。   Next, it is determined whether or not the aggregation period of the histogram 115 is a time unit (aggregated within one hour) (step 1001). If the aggregation period of the histogram 115 is a time unit, the time unit and the day unit The corresponding values of weather, day of the week, week, and month are assigned to the periodicity change index 212 as feature vectors (steps 1005 to 1009). Note that the periodicity variation index not selected on the periodicity variation index setting screen (FIG. 5) is null.

また、ステップ1001において、ヒストグラム115の集計期間が時間単位でないと判定された場合、ヒストグラムの集計期間が日単位(24時間以内で集計されたもの)であるかを判定する(ステップ1002)。ヒストグラム115の集計期間が日単位である場合、日単位、天候、曜日単位、週単位、及び月単位の該当する値を特徴ベクトルとして周期性変動指標212に割り当てる(ステップ1006〜1009)。   If it is determined in step 1001 that the aggregation period of the histogram 115 is not in time units, it is determined whether the aggregation period in the histogram is in days (aggregated within 24 hours) (step 1002). When the aggregation period of the histogram 115 is daily, corresponding values of daily, weather, day of the week, weekly, and monthly are assigned to the periodicity variation index 212 as feature vectors (steps 1006 to 1009).

また、ステップ1002において、ヒストグラム115の集計期間が日単位でないと判定された場合、ヒストグラムの集計期間が週単位(168時間以内で集計されたもの)であるかを判定する(ステップ1003)。ステップ1003において、ヒストグラムの集計期間が週単位である場合、週単位、及び月単位の該当する値を特徴ベクトルとして周期性変動指標212に割り当てる(ステップ1008、1009)。   If it is determined in step 1002 that the aggregation period of the histogram 115 is not a day unit, it is determined whether the aggregation period of the histogram is a week unit (totaled within 168 hours) (step 1003). In step 1003, when the aggregation period of the histogram is in units of weeks, the corresponding values in units of weeks and months are assigned to the periodicity variation index 212 as feature vectors (steps 1008 and 1009).

また、ステップ1003において、ヒストグラムの集計期間が週単位でないと判定された場合、ヒストグラムの集計期間が月単位(720時間以内で集計されたもの)であるかを判定する(ステップ1004)。ヒストグラムの集計期間が月単位である場合には、月単位の該当する値を特徴ベクトルとして周期性変動指標212に割り当てる(ステップ1009)。   If it is determined in step 1003 that the aggregation period of the histogram is not weekly, it is determined whether the histogram aggregation period is monthly (aggregated within 720 hours) (step 1004). If the tabulation period of the histogram is in units of months, the corresponding value in units of months is assigned to the periodicity fluctuation index 212 as a feature vector (step 1009).

そして、ステップ1004において、ヒストグラムの集計期間が月単位でないと判定された場合、例えば、集計時間の累積値が予め設定された閾値となった時点でデータ転送端末103がヒストグラムを転送する場合、気温などの連続値(環境変数)と、ヒストグラムの特徴量の平均、分散、尖度、歪度などの統計値との相関係数を算出し、閾値以上の相関係数を持つ外部環境変数を当該ヒストグラムの周期性変動指標212に割り当てる(ステップ1010)。   If it is determined in step 1004 that the histogram total period is not in units of months, for example, when the data transfer terminal 103 transfers the histogram when the cumulative value of the total time reaches a preset threshold value, Calculate the correlation coefficient between continuous values (environment variables) such as histograms and statistical values such as the average, variance, kurtosis, and skewness of the feature values of the histogram. This is assigned to the periodicity fluctuation index 212 of the histogram (step 1010).

なお、ステップ1005〜1010において、周期性変動指標として割り当てられた値は、それぞれを特徴量として特徴ベクトルで格納される。次に、異常判別処理部113によって、リアルタイムヒストグラムが異常であるかを判別して(ステップ1011)、処理を終了する。なお、ステップ1011の処理は、図11を用いて後述する。   In steps 1005 to 1010, the values assigned as periodicity fluctuation indexes are stored as feature vectors, respectively, as feature vectors. Next, the abnormality determination processing unit 113 determines whether or not the real-time histogram is abnormal (step 1011), and ends the process. Note that the processing of step 1011 will be described later with reference to FIG.

<異常判別処理部113の詳細(ステップ1011)>
図11は、図10のステップ1011において異常判別処理部113が実行する処理のフローチャートである。図11に示す異常判別処理は、データメモリ106に格納された正常時のヒストグラムを含むクラスタを用いて、リアルタイムヒストグラムが周期性変動指標が類似する正常時のヒストグラムパターンがあるかを評価し、スコアを算出する処理である。
<Details of Abnormality Determination Processing Unit 113 (Step 1011)>
FIG. 11 is a flowchart of processing executed by the abnormality determination processing unit 113 in step 1011 of FIG. The abnormality determination process shown in FIG. 11 uses a cluster including a normal histogram stored in the data memory 106 to evaluate whether a real-time histogram has a normal histogram pattern with a similar periodic fluctuation index, and score Is a process for calculating.

まず、リアルタイムヒストグラム117の異常時フラグ312にFalseを格納する(ステップ1100)。   First, False is stored in the abnormal flag 312 of the real-time histogram 117 (step 1100).

次に、リアルタイムヒストグラム117と同じ項目名のヒストグラムを含むクラスタのインデックスcluster_idxを0に初期化する(ステップ1101)。   Next, the cluster index cluster_idx including the histogram having the same item name as that of the real-time histogram 117 is initialized to 0 (step 1101).

そして、cluster_idx番目のクラスタがあるかを判定し(ステップ1102)、cluster_idx番目のクラスタがある場合、cluster_idx番目のクラスタが異常時パターンであるか判定する(ステップ1103)。   Then, it is determined whether there is a cluster_idx-th cluster (step 1102). If there is a cluster_idx-th cluster, it is determined whether the cluster_idx-th cluster is an abnormal pattern (step 1103).

ステップ1103において、当該クラスタが異常時パターンでないと判定された場合、リアルタイムヒストグラムのnull以外の特徴量である周期性変動指標の値が、クラスタの周期性変動指標の値と同じかを判定する(ステップ1104)。なお、カテゴリで表される周期性変動指標に関しては、ヒストグラムの周期性変動指標の値とクラスタの周期性変動指標の値とが同一であるかによって周期性変動指標の値が同じかを判別する。また、数値(離散値又は連続値)で表される周期性変動指標に関しては、クラスタのセントロイド(質量中心)のユークリッド距離、マハラノビス距離などの距離を算出し、閾値以下であった場合に周期性変動指標の値が同一であると判別する。なお、複数の周期性変動指標を含む場合、全ての周期性変動指標において同一と判断されることが必要である。   If it is determined in step 1103 that the cluster is not an abnormal pattern, it is determined whether the value of the periodic variation index, which is a feature quantity other than null in the real-time histogram, is the same as the value of the periodic variation index of the cluster ( Step 1104). Regarding the periodic fluctuation index represented by the category, it is determined whether the periodic fluctuation index value is the same depending on whether the periodic fluctuation index value of the histogram and the periodic fluctuation index value of the cluster are the same. . In addition, for periodicity fluctuation indices expressed as numerical values (discrete values or continuous values), distances such as the Euclidean distance and Mahalanobis distance of the centroid (mass center) of the cluster are calculated, and if the distance is below the threshold, the period It is determined that the values of the sex variation index are the same. When a plurality of periodic fluctuation indices are included, it is necessary to determine that all periodic fluctuation indices are the same.

ステップ1104において、リアルタイムヒストグラムと周期性変動指標の値が同じクラスタがあると判定された場合、リアルタイムヒストグラムの度数分布がクラスタ内のヒストグラムの度数分布と類似しているかを判定する(ステップ1105)。リアルタイムヒストグラムとクラスタ内のヒストグラムとが類似しているかは、度数の配列を特徴ベクトルとして、ヒストグラム間のユークリッド距離、マハラノビス距離などの距離を算出し、ウォード法を用いてリアルタイムヒストグラムとクラスタとの距離を算出し、リアルタイムヒストグラムとクラスタとの距離が閾値以下であれば類似していると判定する。また、距離の代わりに、バタチャリア係数又はピアソン係数を類似度とし、郡平均法でリアルタイムヒストグラムとクラスタとの類似度を計算し、類似度が閾値以上であった場合に類似していると判定してもよい。   If it is determined in step 1104 that there is a cluster having the same value of the real-time histogram and the periodicity variation index, it is determined whether the frequency distribution of the real-time histogram is similar to the frequency distribution of the histogram in the cluster (step 1105). Whether the real-time histogram and the histogram in the cluster are similar is calculated by calculating distances such as Euclidean distance and Mahalanobis distance between histograms using the frequency array as a feature vector, and using the Ward method, the distance between the real-time histogram and the cluster If the distance between the real-time histogram and the cluster is equal to or smaller than the threshold, it is determined that they are similar. Also, instead of the distance, the Batacharia coefficient or Pearson coefficient is used as the similarity, the similarity between the real-time histogram and the cluster is calculated by the county average method, and it is determined that the similarity is similar when the similarity is greater than or equal to the threshold. May be.

ステップ1105において、リアルタイムヒストグラムとクラスタとが類似していると判定された場合、リアルタイムヒストグラムは正常時と判定し、リアルタイムヒストグラム117の異常時フラグ312にFalseを格納して(ステップ1106)、処理を終了する。   If it is determined in step 1105 that the real-time histogram and the cluster are similar, it is determined that the real-time histogram is normal, false is stored in the abnormal flag 312 of the real-time histogram 117 (step 1106), and processing is performed. finish.

また、ステップ1105において、リアルタイムヒストグラムとクラスタとが類似していないと判定された場合、クラスタのインデックスcluster_idxをインクリメントして(ステップ1107)、ステップ1102の処理に戻る。また、ステップ1104において、リアルタイムヒストグラムのnull以外の特徴量である周期性変動指標の値が正常時のクラスタに共通の周期性変動指標の値と同一でないと判定された場合、クラスタのインデックスcluster_idxをインクリメント(ステップ1107)してステップ1102の処理に戻る。また、ステップ1103において、クラスタが異常時のパターンであると判定された場合、クラスタのインデックスcluster_idx をインクリメントして(ステップ1107)、ステップの処理に戻る。   If it is determined in step 1105 that the real-time histogram and the cluster are not similar, the cluster index cluster_idx is incremented (step 1107), and the process returns to step 1102. If it is determined in step 1104 that the value of the periodic variation index, which is a feature quantity other than null in the real-time histogram, is not the same as the value of the periodic variation index common to the normal cluster, the cluster index cluster_idx is set. Increment (step 1107) and return to the processing of step 1102. If it is determined in step 1103 that the cluster has an abnormal pattern, the cluster index cluster_idx is incremented (step 1107), and the process returns to step processing.

なお、ステップ1102において、cluster_idx番目のクラスタがないと判定された場合、処理を終了する。   If it is determined in step 1102 that there is no cluster_idx-th cluster, the process ends.

以上の処理によって、リアルタイムヒストグラムが異常であるかを判別し、フラグを設定する。判別結果を用いて、異常なヒストグラムをリアルタイムで表示画面に描画するGUIや設けてもよい。また、判別結果を逐次DBに格納して一覧として表示する処理を設けてもよい。これらによって、異常のヒストグラムを確認してもよい。   Through the above processing, it is determined whether the real-time histogram is abnormal, and a flag is set. A GUI that draws an abnormal histogram on the display screen in real time using the determination result may be provided. Moreover, you may provide the process which stores a discrimination | determination result in DB sequentially and displays it as a list. From these, an abnormality histogram may be confirmed.

なお、リアルタイムヒストグラムがいずれのクラスタとも類似しない場合、ステップ1104で判定条件を緩めて、異常判別処理をもう一回実行してもよい。   If the real-time histogram is not similar to any cluster, the determination condition may be relaxed in step 1104 and the abnormality determination process may be executed once again.

また、図11に示す異常判別処理は、リアルタイムヒストグラムが異常であるかを判別したが、予めデータベースに格納されているヒストグラムが異常であるかを判定することもできる。   Further, the abnormality determination process shown in FIG. 11 determines whether or not the real-time histogram is abnormal, but it is also possible to determine whether or not the histogram stored in advance in the database is abnormal.

<まとめ>
本実施形態では、ヒストグラムデータの例の一つとして移動体の操作ログデータを例にして、機器に取り付けられた単位時間あたりの操作を監視するための機器の状態変化を測定するセンサを用いて、例えば、速度、加速度、ブレーキ圧力、ウィンカー点灯時間、車体正面を中心とした進行方向の変化角度、エンジン回転数などの集計値であるヒストグラムについて、時間帯、曜日、営業日、4半期などを周期性として、特定経路、消費燃費量、安全操作に関するヒストグラムパターンをクラスタリングによって抽出し、センサからリアルタイムで送られてくるヒストグラムが特定経路、消費燃費量、安全操作などであるかを判別する処理について説明した。
<Summary>
In the present embodiment, the operation log data of the moving body is taken as an example of the histogram data as an example of the histogram data, and a sensor for measuring a change in the state of the device for monitoring the operation per unit time attached to the device is used. For example, regarding the histogram that is the aggregate value of speed, acceleration, brake pressure, blinker lighting time, change angle of the traveling direction centered on the front of the vehicle body, engine speed, etc., time zone, day of the week, business day, quarter period, etc. As a periodicity, a histogram pattern related to a specific route, fuel consumption, and safe operation is extracted by clustering to determine whether the histogram sent in real time from the sensor is a specific route, fuel consumption, safe operation, etc. explained.

なお、センサの種類としては、本実施形態で記載したものに限らず、例えば、産業用機器に取り付けられたシステムの状態を監視するための稼動ログデータを測定するセンサとして、例えば、温度センサ、振動解析センサなどの測定値から、周波数、回転部品の回転数、油圧駆動系における油の粘度などの集計値であるヒストグラムから、機器の異常を検出する場合、外部環境の周期性として気温、湿度、操業状態の周期性として稼動時間などを用いて、特定の周期的条件下における正常時のヒストグラムのパターンをクラスタリングにより抽出し、センサからリアルタイムで送られてくるヒストグラムが異常であるかを判別する処理を行ってもよい。   In addition, as a kind of sensor, it is not restricted to what was described in this embodiment, For example, as a sensor which measures the operation log data for monitoring the state of the system attached to industrial equipment, for example, a temperature sensor, When detecting abnormalities in equipment from histograms that are aggregate values such as frequency, number of rotations of rotating parts, oil viscosity in hydraulic drive systems, etc. from measured values from vibration analysis sensors, etc., temperature and humidity as periodicity of the external environment Using the operating time as the periodicity of the operating state, the histogram pattern at normal time under a specific periodic condition is extracted by clustering to determine whether the histogram sent in real time from the sensor is abnormal Processing may be performed.

また、複合機の異常検出をする場合、産業用機器にて例示したヒストグラムの他に、感熱、消費電力、ローラ回転数、インクなどの消耗品の消費量などのセンサによる測定値を集計したヒストグラムを用いて、紙の大きさごとの印刷枚数などを周期性とすることによって、異常を判別してもよい。   In addition, when detecting abnormalities in a multifunction device, in addition to the histograms exemplified in industrial equipment, a histogram that summarizes the measured values by sensors such as heat sensitivity, power consumption, roller rotation speed, consumption of consumables such as ink, etc. The abnormality may be determined by making the number of printed sheets for each paper size periodic.

また、昇降機(例えば、エレベータ)の異常検出をする場合、前記産業用機器にて例示したヒストグラムの他に、感圧、加速度、音の周波数などのセンサによる測定値を集計したヒストグラムを用いて処理を行ってもよい。この他にも、産業用機器として工作機械、製造機械、農業機械などに取り付けた単位時間ごとに測定するセンサの集計値であるヒストグラムを用いて異常を判別してもよい。   In addition, when detecting an abnormality in an elevator (for example, an elevator), in addition to the histogram exemplified in the industrial equipment, processing is performed using a histogram in which measured values by sensors such as pressure sensitivity, acceleration, and sound frequency are aggregated. May be performed. In addition to this, abnormality may be determined using a histogram that is a total value of sensors that are measured every unit time attached to a machine tool, a manufacturing machine, an agricultural machine, or the like as industrial equipment.

また、例えば、移動体検出ログデータを用いて、特定の場所に取り付けられた単位時間あたりの移動体の通過量(交通量)を集計したヒストグラムを用いて、時間帯、曜日など周期性として正常時の交通量のヒストグラムパターンをクラスタリングによって抽出し、事故発生などの特定のイベントのタイミングから特定の周期的条件下での例外となるヒストグラムパターンをクラスタリングによって抽出し、センサを取り付けた場所の整備(例えば交差点の形状変更)、管理者(例えば、警察官)の最適配置などに用いてもよい。   In addition, for example, using a moving body detection log data, a periodicity such as time zone, day of the week, etc. is normal using a histogram that aggregates the passing amount (traffic volume) of a moving body per unit time attached to a specific location. Histogram patterns of traffic volume are extracted by clustering, and histogram patterns that are exceptions under specific periodic conditions are extracted by clustering from the timing of specific events such as the occurrence of accidents, and the location where the sensor is attached ( For example, it may be used for an optimal arrangement of an administrator (for example, a police officer) or the like.

また、例えば、GPSを搭載した携帯端末の座標ログデータからエリアを級数とした単位時間当たりの人口を集計し、端末所有者のプロファイルデータ、例えば、年代、性別、年収、消費支出傾向などのセグメント別のヒストグラムを用いて、時間帯、日付、曜日などを周期性として、商品ごとの売上高と人口分布のヒストグラムパターンを特定の周期条件下においてクラスタリングによって分類し、周期変動に伴いエリアごと人口と商品との関連を分析してもよい。   Also, for example, the population per unit time with the area as a series from the coordinate log data of mobile terminals equipped with GPS, and the terminal owner's profile data, for example, segments such as age, gender, annual income, consumption expenditure trends Using another histogram, the time pattern, date, day of the week, etc. are periodic, and the histogram pattern of sales and population distribution for each product is classified by clustering under a specific periodic condition. You may analyze the relation with goods.

また、例えば、通信ログデータを用いて、通信トラフィックを分析してもよい。例えば、ネットワーク内の観測点における単位時間当たりのプロトコル別パケット(例えば、TCP、UDP、ICMP、フラグメントにおけるSYN、FIN、PHS、RSTなど)の転送数を集計したヒストグラムを用いて、時間帯、曜日などを周期性として正常時のヒストグラムパターンをクラスタリングによって抽出し、プレスリリースなどの特定のイベントのタイミングから特定の周期条件下での、リアルタイムヒストグラムが不正アクセスであるかを判別してもよい。   Further, for example, communication traffic may be analyzed using communication log data. For example, the time zone, day of the week using a histogram that summarizes the number of transfers of packets per unit time (for example, TCP, UDP, ICMP, SYN, FIN, PHS, RST, etc. in fragments) at observation points in the network The normal time histogram pattern may be extracted by clustering based on the periodicity, and it may be determined whether the real-time histogram is unauthorized access under a specific periodic condition from the timing of a specific event such as a press release.

本発明の実施形態によれば、時間、曜日などの周期や、営業時間、営業日、4半期などの人間の活動における周期について、移動体の操作データから事故を起こしやすい操作を検出して、早期に異常を発見することができる。また、産業用機器の稼動データから異常を検出したり、所定の位置における移動体を検出したデータから移動体の流れを最適化したり、所有者の位置データ及びプロファイルデータから顧客をクラスタリングしたり、通信ログデータから不正アクセスを検出できる。   According to an embodiment of the present invention, for a period of time, day of the week, and a period of human activities such as business hours, business days, quarters, etc., an operation that easily causes an accident is detected from the operation data of the moving body, Abnormalities can be detected early. In addition, anomalies are detected from the operation data of industrial equipment, the flow of the moving object is optimized from the data that has detected the moving object at a predetermined position, customers are clustered from the owner's position data and profile data, Unauthorized access can be detected from communication log data.

なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加・削除・置換をしてもよい。   The present invention is not limited to the above-described embodiments, and includes various modifications and equivalent configurations within the scope of the appended claims. For example, the above-described embodiments have been described in detail for easy understanding of the present invention, and the present invention is not necessarily limited to those having all the configurations described. A part of the configuration of one embodiment may be replaced with the configuration of another embodiment. Moreover, you may add the structure of another Example to the structure of a certain Example. In addition, for a part of the configuration of each embodiment, another configuration may be added, deleted, or replaced.

また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。   In addition, each of the above-described configurations, functions, processing units, processing means, etc. may be realized in hardware by designing a part or all of them, for example, with an integrated circuit, and the processor realizes each function. It may be realized by software by interpreting and executing the program to be executed.

各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、ICカード、SDカード、DVD等の記録媒体に格納することができる。   Information such as programs, tables, and files that realize each function can be stored in a storage device such as a memory, a hard disk, or an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.

また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。   Further, the control lines and the information lines are those that are considered necessary for the explanation, and not all the control lines and the information lines that are necessary for the mounting are shown. In practice, it can be considered that almost all the components are connected to each other.

100・・・ヒストグラムデータDB
101・・・表示装置
102・・・入力端末
103・・・データ転送端末
104・・・中央処理装置
105・・・プログラムメモリ
106・・・データメモリ
107・・・周期性変動パターン抽出処理部
108・・・異常データ検出処理部
109・・・周期性指標設定画面表示処理部
110・・・クラスタリング処理部
111・・・周期性変動指標抽出処理部
112・・・クラスタリング処理部
113・・・異常判別処理部
114・・・測定項目
115・・・ヒストグラム
116・・・クラスタ
117・・・リアルタイムヒストグラム
100 ... Histogram data DB
DESCRIPTION OF SYMBOLS 101 ... Display apparatus 102 ... Input terminal 103 ... Data transfer terminal 104 ... Central processing unit 105 ... Program memory 106 ... Data memory 107 ... Periodic fluctuation pattern extraction process part 108 ... Abnormal data detection processing unit 109 ... Periodic index setting screen display processing unit 110 ... Clustering processing unit 111 ... Periodic variation index extraction processing unit 112 ... Clustering processing unit 113 ... Abnormal Discrimination processing unit 114 ... measurement item 115 ... histogram 116 ... cluster 117 ... real-time histogram

Claims (10)

時間的に変化する測定値を出力するセンサ装置からデータを取得する異常検出装置であって、
過去の測定値を集計したヒストグラムを格納するデータベースと、
前記ヒストグラムから周期性を抽出する周期性抽出処理部と、
前記データベースに格納された複数のヒストグラムを、前記抽出された周期性を用いてクラスタリングして正常時パターンを抽出するクラスタリング処理部と、
判定対象のヒストグラムと前記正常時パターンとが同じ周期的特徴を有するかによって、前記判定対象のヒストグラムが異常かを判定する異常検出処理部と、を有することを特徴とする異常検出装置。
An anomaly detection device that acquires data from a sensor device that outputs a measurement value that changes over time,
A database that stores histograms that aggregate past measurements;
A periodicity extraction processing unit for extracting periodicity from the histogram;
A clustering processing unit that extracts a normal pattern by clustering a plurality of histograms stored in the database using the extracted periodicity;
An abnormality detection apparatus comprising: an abnormality detection processing unit that determines whether the determination target histogram is abnormal depending on whether the determination target histogram and the normal pattern have the same periodic characteristics.
請求項1に記載の異常検出装置であって、
前記周期性抽出処理部は、ビジネス活用、人間行動又は自然現象に関する期間を用いて、前記ヒストグラムから周期的特徴を抽出することを特徴とする異常検出装置。
The abnormality detection apparatus according to claim 1,
The abnormality detection apparatus, wherein the periodicity extraction processing unit extracts a periodic feature from the histogram using a period related to business utilization, human behavior, or a natural phenomenon.
請求項1又は2に記載の異常検出装置であって、
前記周期性抽出処理部は、前記一つのヒストグラムの集計期間である周期性に、時間、日、曜日、週、及び、月の少なくとも一つを設定するための画面を出力することを特徴とする異常検出装置。
The abnormality detection device according to claim 1 or 2,
The periodicity extraction processing unit outputs a screen for setting at least one of a time, a day, a day of the week, a week, and a month in the periodicity that is the aggregation period of the one histogram. Anomaly detection device.
請求項1から3のいずれか一つに記載の異常検出装置であって、
前記周期性抽出処理部は、時間変動する環境要因に関する期間を用いて、前記ヒストグラムから周期性を抽出することを特徴とする異常検出装置。
The abnormality detection apparatus according to any one of claims 1 to 3,
The abnormality detection apparatus, wherein the periodicity extraction processing unit extracts periodicity from the histogram using a period related to a time-varying environmental factor.
請求項4に記載の異常検出装置であって、
前記周期性抽出処理部は、前記環境要因と前記ヒストグラムとの間で統計的な相関を計算し、相関がある環境要因に関する期間をヒストグラムの周期性とすることを特徴とする異常検出装置。
The abnormality detection device according to claim 4,
The periodicity extraction processing unit calculates a statistical correlation between the environmental factor and the histogram, and sets a period regarding the correlated environmental factor as a periodicity of the histogram.
請求項1から5のいずれか一つに記載の異常検出装置であって、
前記クラスタリング処理部は、
複数のヒストグラムを含むクラスタから異常時のヒストグラムを除外し、
その後、当該クラスタに含まれるヒストグラムの周期的特徴が同じである場合、当該クラスタを正常時のパターンとすることを特徴とする異常検出装置。
An abnormality detection device according to any one of claims 1 to 5,
The clustering processing unit
Exclude the abnormal histogram from the cluster containing multiple histograms,
Thereafter, when the periodic features of the histograms included in the cluster are the same, the abnormality detection device is characterized in that the cluster is used as a normal pattern.
請求項6に記載の異常検出装置であって、
前記クラスタリング処理部は、
周期性が複数の区分を含むカテゴリによって特徴付けられる場合、他の正常時のヒストグラムとカテゴリが異なれば、除外される異常時のヒストグラムであると判定し、
周期性が数値によって特徴付けられる場合、他の正常時のヒストグラムとの周期的特徴の距離が所定の閾値より大きければ、除外される異常時のヒストグラムであると判定することを特徴とする異常検出装置。
The abnormality detection device according to claim 6,
The clustering processing unit
If the periodicity is characterized by a category that includes multiple categories, if the category is different from other normal histograms, it is determined to be an abnormal histogram that is excluded,
When periodicity is characterized by a numerical value, the abnormality detection is characterized in that if the distance of the periodic feature from another normal histogram is larger than a predetermined threshold, it is determined that the histogram is an abnormal histogram to be excluded. apparatus.
請求項6に記載の異常検出装置であって、
前記クラスタリング処理部は、
周期性が複数の区分を含むカテゴリによって特徴付けられる場合、前記クラスタに含まれる全てのヒストグラムのカテゴリが同じであれば、当該クラスタを正常時のパターンとし、
周期性が数値によって特徴付けられる場合、前記クラスタに含まれるヒストグラムの全ての組み合わせの周期的特徴の距離が所定の閾値より小さければ、当該クラスタを正常時のパターンとすることを特徴とする異常検出装置。
The abnormality detection device according to claim 6,
The clustering processing unit
When the periodicity is characterized by a category including a plurality of divisions, if all histograms included in the cluster have the same category, the cluster is set as a normal pattern,
When the periodicity is characterized by numerical values, if the distance between the periodic features of all the combinations of histograms included in the cluster is smaller than a predetermined threshold, the abnormality is characterized by making the cluster a normal pattern. apparatus.
請求項1から8のいずれか一つに記載の異常検出装置であって、
前記異常検出処理部は、
前記判定対象のヒストグラムについて、複数の区分を含むカテゴリによって特徴付けられる周期性が同一であり、かつ、周期性が数値によって特徴付けられる周期的特徴の距離が所定の閾値より小さいクラスタを、当該ヒストグラムと類似するクラスタとして選択し、
前記クラスタが一つも選択されない場合、当該判定対象のヒストグラムが異常であると判定することを特徴とする異常検出装置。
The anomaly detection device according to any one of claims 1 to 8,
The abnormality detection processing unit
For the histogram to be determined, a cluster having the same periodicity characterized by a category including a plurality of sections and a periodic feature whose periodicity is characterized by a numerical value is smaller than a predetermined threshold. Select as a cluster similar to
An abnormality detection apparatus, wherein when no cluster is selected, the determination target histogram is determined to be abnormal.
時間的に変化する測定値を出力するセンサ装置からデータを取得し、過去の測定値を集計したヒストグラムを格納するデータベースと、プログラムを実行するプロセッサと、前記プログラムを格納するメモリと、を有する計算機で実行される異常検出方法であって、
前記方法は、
前記プロセッサが、前記ヒストグラムから周期性を抽出し、
前記プロセッサが、前記データベースに格納された複数のヒストグラムを、前記抽出された周期性を用いてクラスタリングして正常時パターンを抽出し、
前記プロセッサが、判定対象のヒストグラムと前記正常時パターンとの周期的特徴が同じかによって、前記判定対象のヒストグラムが異常かを判定することを特徴とする異常検出方法。
A computer that acquires data from a sensor device that outputs a measurement value that changes with time, stores a histogram that summarizes past measurement values, a processor that executes the program, and a memory that stores the program An abnormality detection method executed in
The method
The processor extracts periodicity from the histogram;
The processor clusters a plurality of histograms stored in the database using the extracted periodicity to extract a normal pattern,
An abnormality detection method, wherein the processor determines whether the histogram to be determined is abnormal depending on whether the periodic characteristic of the determination target histogram and the normal pattern are the same.
JP2013251694A 2013-12-05 2013-12-05 Abnormality detection apparatus and abnormality detection method Expired - Fee Related JP6082341B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013251694A JP6082341B2 (en) 2013-12-05 2013-12-05 Abnormality detection apparatus and abnormality detection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013251694A JP6082341B2 (en) 2013-12-05 2013-12-05 Abnormality detection apparatus and abnormality detection method

Publications (2)

Publication Number Publication Date
JP2015108990A true JP2015108990A (en) 2015-06-11
JP6082341B2 JP6082341B2 (en) 2017-02-15

Family

ID=53439288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013251694A Expired - Fee Related JP6082341B2 (en) 2013-12-05 2013-12-05 Abnormality detection apparatus and abnormality detection method

Country Status (1)

Country Link
JP (1) JP6082341B2 (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017033437A (en) * 2015-08-05 2017-02-09 三菱電機ビルテクノサービス株式会社 Retrieval system
JP2017076359A (en) * 2015-10-17 2017-04-20 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Multi-sensor data summarization
JP2017117438A (en) * 2015-11-13 2017-06-29 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Multi-sensor visual analytics
WO2017221452A1 (en) * 2016-06-24 2017-12-28 蛇の目ミシン工業株式会社 Log collection device, industrial robot, and electric-powered press
JP2018039343A (en) * 2016-09-07 2018-03-15 株式会社日立製作所 Vehicle operation control system, vehicle operation controlling method, and vehicle operation control program
US10109298B2 (en) 2015-11-30 2018-10-23 Fujitsu Limited Information processing apparatus, computer readable storage medium, and information processing method
JP2019069004A (en) * 2017-10-10 2019-05-09 パナソニックIpマネジメント株式会社 Body motion analysis system, body motion analysis method, and program
WO2020045791A1 (en) * 2018-08-29 2020-03-05 국방과학연구소 Method and device for receiving data from plurality of adjacent devices
JP2020052674A (en) * 2018-09-26 2020-04-02 株式会社日立製作所 Process state analyzer and process state display method
CN117786445B (en) * 2024-02-26 2024-05-10 山东盈动智能科技有限公司 Intelligent processing method for operation data of automatic yarn reeling machine

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070635A (en) * 2009-08-28 2011-04-07 Hitachi Ltd Method and device for monitoring state of facility
US20120253178A1 (en) * 2011-04-01 2012-10-04 Varian Medical Systems, Inc. System and method for triggering an imaging process based on non-periodicity in breathing
JP2013008092A (en) * 2011-06-22 2013-01-10 Hitachi Engineering & Services Co Ltd Abnormality sign diagnostic system and abnormality sign diagnostic method
WO2013030984A1 (en) * 2011-08-31 2013-03-07 株式会社日立エンジニアリング・アンド・サービス Facility state monitoring method and device for same
WO2013051101A1 (en) * 2011-10-04 2013-04-11 株式会社日立製作所 System and method for management of time-series data
JP2013140135A (en) * 2011-12-09 2013-07-18 Tokyo Electron Ltd Abnormality detection apparatus for periodic driving system, processing apparatus including periodic driving system, abnormality detection method for periodic driving system, and computer program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070635A (en) * 2009-08-28 2011-04-07 Hitachi Ltd Method and device for monitoring state of facility
US20120253178A1 (en) * 2011-04-01 2012-10-04 Varian Medical Systems, Inc. System and method for triggering an imaging process based on non-periodicity in breathing
JP2013008092A (en) * 2011-06-22 2013-01-10 Hitachi Engineering & Services Co Ltd Abnormality sign diagnostic system and abnormality sign diagnostic method
WO2013030984A1 (en) * 2011-08-31 2013-03-07 株式会社日立エンジニアリング・アンド・サービス Facility state monitoring method and device for same
WO2013051101A1 (en) * 2011-10-04 2013-04-11 株式会社日立製作所 System and method for management of time-series data
JP2013140135A (en) * 2011-12-09 2013-07-18 Tokyo Electron Ltd Abnormality detection apparatus for periodic driving system, processing apparatus including periodic driving system, abnormality detection method for periodic driving system, and computer program

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017033437A (en) * 2015-08-05 2017-02-09 三菱電機ビルテクノサービス株式会社 Retrieval system
JP2017076359A (en) * 2015-10-17 2017-04-20 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Multi-sensor data summarization
US10332030B2 (en) 2015-10-17 2019-06-25 Tata Consultancy Services Limited Multi-sensor data summarization
JP2017117438A (en) * 2015-11-13 2017-06-29 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Multi-sensor visual analytics
US10109298B2 (en) 2015-11-30 2018-10-23 Fujitsu Limited Information processing apparatus, computer readable storage medium, and information processing method
US10921776B2 (en) 2016-06-24 2021-02-16 Janome Sewing Machine Co., Ltd. Log collecting device, industrial robot, and electric-powered press
WO2017221452A1 (en) * 2016-06-24 2017-12-28 蛇の目ミシン工業株式会社 Log collection device, industrial robot, and electric-powered press
JP2017228245A (en) * 2016-06-24 2017-12-28 蛇の目ミシン工業株式会社 Log collection device, industrial robot, and electrically driven press
CN109416532A (en) * 2016-06-24 2019-03-01 蛇目缝纫机工业株式会社 Record collection device, industrial robot and electric pressuring machine
JP2018039343A (en) * 2016-09-07 2018-03-15 株式会社日立製作所 Vehicle operation control system, vehicle operation controlling method, and vehicle operation control program
JP2019069004A (en) * 2017-10-10 2019-05-09 パナソニックIpマネジメント株式会社 Body motion analysis system, body motion analysis method, and program
CN111108712A (en) * 2018-08-29 2020-05-05 国防科学研究所 Method and apparatus for receiving data from multiple peripheral devices
JP2020536295A (en) * 2018-08-29 2020-12-10 国防科学研究所Agency For Defense Development How to receive data from multiple peripheral devices and their devices
WO2020045791A1 (en) * 2018-08-29 2020-03-05 국방과학연구소 Method and device for receiving data from plurality of adjacent devices
US11362905B2 (en) 2018-08-29 2022-06-14 Agency For Defense Development Method and device for receiving data from a plurality of peripheral devices
JP2020052674A (en) * 2018-09-26 2020-04-02 株式会社日立製作所 Process state analyzer and process state display method
JP7034874B2 (en) 2018-09-26 2022-03-14 株式会社日立製作所 Process state analysis device and process state display method
CN117786445B (en) * 2024-02-26 2024-05-10 山东盈动智能科技有限公司 Intelligent processing method for operation data of automatic yarn reeling machine

Also Published As

Publication number Publication date
JP6082341B2 (en) 2017-02-15

Similar Documents

Publication Publication Date Title
JP6082341B2 (en) Abnormality detection apparatus and abnormality detection method
CN111128399B (en) Epidemic disease epidemic situation risk level assessment method based on people stream density
US10572512B2 (en) Detection method and information processing device
CN105808639B (en) Network access behavior identification method and device
JP5805169B2 (en) Behavior pattern analysis apparatus and behavior pattern analysis method
JP6226846B2 (en) Information analysis apparatus, information analysis method, and information analysis program
US20140180727A1 (en) System and Method for Classifying and Identifying a Driver Using Driving Performance Data
KR101611166B1 (en) System and Method for Deducting about Weak Signal Using Big Data Analysis
US9424288B2 (en) Analyzing database cluster behavior by transforming discrete time series measurements
US8903757B2 (en) Proactive information technology infrastructure management
US11201802B2 (en) Systems and methods for providing infrastructure metrics
JP6419234B2 (en) Measurement solution service provision system
CN114270332A (en) Method and system for automatically detecting anomalies in data
CN111178452A (en) Driving risk identification method, electronic device and readable storage medium
CN116711339A (en) System and method for monitoring water quality
CN111062642A (en) Method and device for identifying industrial risk degree of object and electronic equipment
CN116910102A (en) Enterprise query method and device based on user feedback and electronic equipment
JP2020052674A (en) Process state analyzer and process state display method
CN115295129A (en) People flow prediction method, system, electronic equipment and storage medium
JP4938367B2 (en) Security diagnostic system
CN113742365A (en) Vehicle utilization data visual dynamic monitoring system and method
CN112988536A (en) Data anomaly detection method, device, equipment and storage medium
EP2915059B1 (en) Analyzing data with computer vision
CN113220551A (en) Index trend prediction and early warning method and device, electronic equipment and storage medium
CN107679145B (en) Store monitoring method and electronic equipment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170120

R150 Certificate of patent or registration of utility model

Ref document number: 6082341

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees