JPH02304643A - データベース管理システムにおける異常データの検査方法 - Google Patents

データベース管理システムにおける異常データの検査方法

Info

Publication number
JPH02304643A
JPH02304643A JP1124316A JP12431689A JPH02304643A JP H02304643 A JPH02304643 A JP H02304643A JP 1124316 A JP1124316 A JP 1124316A JP 12431689 A JP12431689 A JP 12431689A JP H02304643 A JPH02304643 A JP H02304643A
Authority
JP
Japan
Prior art keywords
data
abnormal
information
abnormal data
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1124316A
Other languages
English (en)
Inventor
Hidefumi Kondo
近藤 秀文
Hiroyuki Muroi
室井 裕之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP1124316A priority Critical patent/JPH02304643A/ja
Publication of JPH02304643A publication Critical patent/JPH02304643A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、数値データを含むデータの蓄積を行なうデー
タベースの、異常データの検査方法に関する。
〔従来の技術〕
従来、データベースへの異常データの入力を検査する方
法としては1文献[アン イントロダクション ツー 
データベース システムズ、アヂスソ ウニズレ−出版
配列、(An Introductionto  Da
tabage  Systems、  C,J、Dat
e、1983.ADDISUN −1d14SLl<Y
 PUBLISHING COMPANY、 l’40
)コに示されるように、データベースのデータ構造を定
義しているカラムに対してとり得る値の範囲を事前に指
定しておき、この指定をはずれたデータの入力に対して
は警告を発するという方法である。
〔発明が解決しようとする課題〕
上記従来の技術では、カラム毎に具体的な範囲を示す値
を記述しておかねばならない。この従来の方法には、3
つの問題がある。1つは、カラムのとる値が事前に明確
になっている場合は指定できるが、明確でない場合に適
切な指定方法が用意されていないということである。2
つ目は、事前にカラム毎に範囲を示す値を指定しなくで
も特別な異常データが入力さhたときには警告を出して
くれると便利であるが、このような技術が何も用意され
ていないということである。3つ目は、入力した時点で
は異常データとは考えられなかったが、データの蓄積と
共に他のデータと比較すると異常データと見なせるよう
になったとき、そのデータの存在を知らせてくれると便
利であるが、このような技術は何も用意されていないと
いうことである。
〔課題を解決するための手段〕
上記目的を達成するために、本発明においては、データ
入力時に数値の異常データを検査するという要求を事前
に登録しておく。登録の仕方は、例えば、(1)データ
ベース中のデータが数値データであれば全て異常データ
の検査を要求するという登録、(2)データベースの中
の特定の範囲に限定して(リレーショナルデータベース
の場合ならば。
テーブルを限定して)異常データの検査を要求するとい
う登録、(3)特定のカラムに限定して(リレーショナ
ルデータベースの場合ならば、デープル中の特定カラム
に限定して)、異常データの検査を要求するという登録
、(4)他のカラムとの関係を前提として特定カラムを
限定して(リレショナルデータベースの場合ならば、テ
ーブル中のあるカラムのカラム値毎に特定カラムのカラ
ム値の異常データを検査するという限定によって)異常
データの検査を要求するという登録を設定する6以下で
は、リレーショナルデータベースを対象として説明する
異常データの検査は、異常データ検査用情報を参照して
検査する。異常データ検査用情報は、検査時点までに入
力したデータの統計情報を用いて作成する。統計情報の
利用方法は、直前までに入力したデータが正規分布する
もものと仮定し、今、入力したデータの値が平均値から
座標偏差のこう倍以上離れている場合に異常データとみ
なすという方法である。この方法では、ユーザが範囲を
指定する必要はなくなる・。
データベースにデータが蓄積されてくると、既に蓄積さ
れたデータの中に、他のデータとの異なりが顕著になっ
ていくる場合がある。これは、既に蓄積されたデータが
蓄積時点では異常でなかったにもかかわらず、異常デー
タと見なされる状況になったと考えることができる8本
方法では、前述の異常データ検査用情報を使用してデー
タベース中の異常データの検査を行なう。
入力データが異常データであると判断した場合およびデ
ータベース中に異常データが存在することを発見した場
合のいずれの場合にも、警告メツセージを表示する。
〔作用〕
異常データ検査用情報は、データベースに容積したデー
タの統計情報である。統計情報は、#/積したデータの
件数、値の総和、平均値、不偏分散標準偏差であり、こ
れらの値は、データが一#Mされる毎にそのデータとそ
のときまでの統計情報を使用して1次の統計情報を計算
することができるので統計情報の修正は容易である。
異常データ検査用情報は、上記統計情報を使用し、デー
タが正規分布するものとして、平均値からの離れ具合を
標準偏差の3倍として計算する。
データの入力と共に新しいデータベースの状態に反映し
た統計情報および異常データ検査情報が常に作成される
ので、異常データの検査は正し〈実施される。
〔実施例〕
第1図は、本発明の処理手順を示すフローチャートであ
る。第1図(a)の処理101は、データベースにデー
タが入力とれたとき、異常データであるかの検査を行な
うか否かを本発明を具体化したシステムに事前に知らせ
て9.録しておく部分である、第1図(b)の処理10
2は、処理101で検査登録が行なわれているときデー
タ入力があった場合にデータを受理する部分である。処
理101と処理102以下は処理が連続しているもので
はない。
処理103は、入力データが異常データでないかを検査
する部分である。ここでは、統計情報に基づいて作成し
た異常データ検査用情報を使用する。処理104は、入
力データに異常があったとき、警告メツセージを表示す
る部分である。処理105は、異常データでない場合、
入力データをデータベースに蓄積し、統計情報および異
常データ検査用情報更新する部分である。処理106は
、データの蓄積に伴ない、データベースの状態が変化す
るので異常データと見なされるデータが発生したかどう
かを検査し、発見された場合に警告メツセージを表示す
る部分である。
第2図は、本発明の方法を実施する装置の例である。2
01は中央処理装置(CP U)、202は必要な情報
を利用者が入力する端末キーボード。
203は、出力結果を表示するディスプレイ。
204は統計情報および異常データ検査用情報を格納す
るための外部記憶装置、205は、データベースを格納
するための外部記憶装置である。
また、206は1本発明の異常データ検査およびデータ
の#積検索を行なうブムグラムを実行させるための主メ
モリ、207はデータベース管理システムであり、20
8に示す異常データ検査系、209に示す蓄積系、21
0に示す検索系からなる。
第1図101に示した異常データ検査要求を行なう部分
を第3図〜第6図、第8図〜第11図を用いて説明する
第3図処理301は、入力データが異常データであるか
の検査要求を事前に登録する部分を示す。
第5図501は、登録を行なうための両面表示と利用者
入力を表わす。ここでは登録(Yで示す)を行った様子
を示す、処理302は、検査範囲をデータベース中で限
定する場合の指示である。第5図502は、商品発注管
理テーブルに限定したことを示す、処理303は、検査
対象を特定カラムに限定する場合の指示である。第5図
503゜504は、商品発注管理テーブルの発注量カラ
ムに限定して検査を行なうことを示す。
処理304は、異常データの検査をカラム間の関係で検
査する場合の指示である。第5図505゜50f3,5
07は、商品発注管理テーブルの商品カラムのカラム値
毎に発注量カラムのカラム値の異常データの検査を行な
うことを示す、処−理305は、統計情報および異常デ
ータ検査用情報の初期設定を行なうことを示す。
第8図〜第1111!dに具体例を示す。
第8図において801は、商品発注管理テーブルのカラ
ム構成を示す、第9図は第5図501゜502の指定結
果であり、テーブル名で限定した例を示す、901は検
査要求有りを示す、902は限定すべきテーブルの記憶
を行なう、903は。
指定テーブルは商品発注管理、テーブル限定による指定
(903A)を示す、904は、指定した商品テーブル
中の数値カラムを登録するものである。
905の発注日、906の発注量が数値データであるた
め登録されたカラム名であることを示す。
第10図は、特定カラムを指定して異常データ検査を行
なう場合の例で、第5図501,503゜504の指定
結果である。第10図1003゜1005で、商品発注
管理テーブルの発注量カラムが検査対象であることを示
す。
第11図は、カラム間の関係を考慮した異常デ−タの検
査を行なう場合の例で、第5・図501゜505,50
6.507の指定結果である。第11図1103.11
05が曲品発注管理テーブルの商品カラムのカラム値開
に発注量の異常データ検査を行なうことを示す。
第4図は、データを蓄積したことによりデータベースの
状態が全化し、そのために異常データと見なされるデー
タとなってしまうものを発見するためのフローチャート
である。第3図では、入力データを検査するが第4図で
は、データベース中のデータを検査するという点が異な
るのみで、内容は全く同様である。第3図301〜30
5が第4図405に対応する。
登録のための入力を第6図に示す、これは、第5図と同
様な入力方法である。
第1図の処理102〜106の部分を第7図〜第11図
を用いて説明する。
第1図処理102は、データの受理で、第7図の処理7
01に対応する。処理103は、異常データの検査で、
処理702に対応する一1異常データの検査は下限・上
限値をはずれるか否かという検査を行なう。下限・上限
値設定の具体例を示す。
第8図の802〜807は、6件のデータと入力順序を
示したものである。
第9図905,906は第8図802のデータが入力さ
れた時点で求めた統計情報である。1件目であるため、
不偏分散、標準偏差は計算されていない。
第10図1005は第8図802の1件目のデータ入力
時点の統計情報を表わす。不偏分散等の記入がないのは
1件目のためである。第10図1006〜1010の5
件は、第8図803〜807の5件が順に入力れたとき
、第10図1005がどのように変化したかを示すもの
である。統計情報、異常データ検査用情報の作成方法は
第7図704〜707で説明する。第10図1008は
、第8図805のデータが#/積されたときの情報であ
り、次のデータの下限値は、−104,176、上限値
は216.176であることを示す6次のデータ第8図
806の発注量の値は100であるから異常データには
ならないことがわかる、第10図では、電子レンジの発
注量と蛍光電球の発注量を区別していない。第11図で
は区別している。第11図1106は、電子レンジに関
する情報を記録するためのエリアで、1109゜111
1のように内容が変化する。蛍光電流の場合には、記憶
エリアを1107であり、1108゜1110のように
変化する。
第7図の処理704は1入力データの件数を記憶する部
分である。これは、第9図、第10図。
第11図の件数の部分に記憶される。件数が2件の場合
には不偏分散、標準偏差を利用するにはデータが少なす
ぎる。したがって、下限・上限値の計算をも行なわない
、第7図の処理705は、このことを示している。
第7図の処理706は、3件目で不偏分数、標準偏差を
利用して、下限・上限値の設定を行なうことを示してい
る。すなわち、4件目から異常データの検査が行なえる
ことになる。処理707、はこのことを示している。
第12図は、不偏分数、標準偏差、下限値、上限値を計
算するためのフローチャートである。1件目(1203
で示す)では、不偏分数等は計算しない、2件目(12
05で示す)では、不偏分散の原形を作業する。3件目
以上(1207で示す)では、記憶しである不偏分散、
平均値を用いて新たな不偏分散、平均値を求める。この
計算方法は、1208に示しである。
第13図は、別の実施例を示す装置構成である。
キーボード等の入力装置1302から利用者によって入
力されたデータは統計情報が外部記憶装置1304に記
憶され、その統計情報を使用して異常データ検査用情報
が作成される0本処理は、第1図の101〜104と同
様であり、105のデータベースへの蓄積を除いて10
5の処理とも同様である。すなわち、第13図のシステ
ムでは、データの蓄積は行なわず、データのチェックの
みを行なうシステムである。
〔発明の効果〕
データベースに対する入力データのうち鯉値デ−タの異
常値の検査を、事前に異常データの検査を依頼するとい
う登録だけで実現することができる。データベースに対
して正常値の範囲をあらかじめ決めるのは賽易ではない
。データを#積しているうちに自然にデータの性質をシ
ステムがつかみ、#積されているものとの差があまり大
きくなるときに自動的に警告を発してくれる。
上述のように本発明は、統計情報に基づいて。
自動的に異常データを検出できるようにしたため、利用
者の負担を極めて少なくすることができるという効果が
ある。
【図面の簡単な説明】
第1図は本発明の一実施例のフローチャート、第2図、
第13図は、実施例を実現するための装置の構成図、第
3図、第4wiは、第1図のフローチャートの詳細を示
すフローチャート、第5図。 第6図は、本発明の実施例におけるシステムの入力画面
図、第7図は第1図のフローチャートの詳細示すフロー
チャート、第8図〜第11図は1本発明の実施例におけ
るデータ構成図、第12図は異常データを検査するため
に使用する情報の作成方法の実施例を示したフローチャ
ートである。 204.208・・・統計情報と異常データ検査用情報
の外部記憶およびそれらの情報を利用した異常データ検
査系、501〜507・・・異常データ検査の依頼を行
なう画面、1201〜1208・・・統計鳩 l 図 (cL) 鴇 2(!1 第 3 Σ 84 区 第 夕 記 ぐOI 鳩 6 田 第 1 口 喚 8  口 o  q トト 第 12  i!1 鴇  /3  I!1

Claims (1)

  1. 【特許請求の範囲】 1、データ入力時に数値の異常データを検査するという
    要求を事前に登録するための情報と、その情報を読込む
    ステップと、入力データを受理するステップと、その入
    力データに異常データが含まれていないかを検査するた
    めの情報と、その情報を参照して入力データを検査する
    ステップと、その情報を入力データの統計計算によつて
    求めるステップと、データを入力したことによつてデー
    タベースの状態が変化しそれに伴なつて既に蓄積されて
    いるデータが異常データとみなされるようになつたかを
    検査するという要求を事前に登録するための情報と、そ
    の情報を読込むステップと、既に蓄積されているデータ
    が異常データとみなされるようになつたかを異常データ
    が含まれていないかを検査するための情報を参照して検
    査するステップと、入力データに異常データが発見され
    たとき警告メッセージを出すステップと、既に蓄積され
    ているデータに異常データが発見されたとき警告メッセ
    ージを出すステップを有することを特徴とするデータベ
    ース管理システムにおける異常データの検査方法。 2、データ入力時に数値の異常データを検査するという
    要求を事前に登録するための情報と、その情報を読込む
    ステップと、入力データを受理するステップとその入力
    データに異常データが含まれていないかを検査するため
    の情報とその情報を参照して入力データを検査するステ
    ップと、その情報を入力デデータの統計計算によつて求
    めるステップを保有することを特徴とするデータ入力シ
    ステムにおける異常データ検査方法。
JP1124316A 1989-05-19 1989-05-19 データベース管理システムにおける異常データの検査方法 Pending JPH02304643A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1124316A JPH02304643A (ja) 1989-05-19 1989-05-19 データベース管理システムにおける異常データの検査方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1124316A JPH02304643A (ja) 1989-05-19 1989-05-19 データベース管理システムにおける異常データの検査方法

Publications (1)

Publication Number Publication Date
JPH02304643A true JPH02304643A (ja) 1990-12-18

Family

ID=14882314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1124316A Pending JPH02304643A (ja) 1989-05-19 1989-05-19 データベース管理システムにおける異常データの検査方法

Country Status (1)

Country Link
JP (1) JPH02304643A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0785076A (ja) * 1993-06-26 1995-03-31 Just Syst Corp データ格納方法
JP2005259140A (ja) * 2004-03-09 2005-09-22 Iplocks Inc データベースを監視するための方法、命令の1つ以上のシーケンスを保持するコンピュータ読み取り可能な媒体、および装置
JP2012221213A (ja) * 2011-04-08 2012-11-12 Toshiba Tec Corp 発注監視装置及び発注監視プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0785076A (ja) * 1993-06-26 1995-03-31 Just Syst Corp データ格納方法
JP2005259140A (ja) * 2004-03-09 2005-09-22 Iplocks Inc データベースを監視するための方法、命令の1つ以上のシーケンスを保持するコンピュータ読み取り可能な媒体、および装置
JP2012221213A (ja) * 2011-04-08 2012-11-12 Toshiba Tec Corp 発注監視装置及び発注監視プログラム

Similar Documents

Publication Publication Date Title
US10521191B1 (en) Multi-faceted search
US7219104B2 (en) Data cleansing
US7672966B2 (en) Adding extrinsic data columns to an existing database schema using a temporary column pool
US20050091206A1 (en) Method and system for handling data available in multidimensional databases using a spreadsheet
US6408312B1 (en) Method and system for supporting multiple, historical, and future designs in a relational database
US20060074953A1 (en) Metadata management for a data abstraction model
CN107016025A (zh) 一种非关系型数据库索引的建立方法及装置
CN111159161A (zh) 基于etl规则的数据质量监控及预警系统和方法
CN111428095B (zh) 图数据质量验证方法及图数据质量验证装置
CN111913954A (zh) 智能数据标准目录生成方法和装置
US20070011176A1 (en) Business reporting under system failures
CN111414410A (zh) 数据处理方法、装置、设备和存储介质
JP2002202810A (ja) 装置管理方法、装置管理システム及び装置管理プログラムを記録した記録媒体
JP2007079705A (ja) 部材属性情報の不正抽出方法、およびオブジェクト属性情報の不正抽出システム
JP2008159023A (ja) 部品の採用決定支援システム、部品の採用決定支援方法、および部品の採用決定支援プログラム
CN109947797B (zh) 一种数据检查装置及方法
JP2007133624A (ja) 連結関係情報を用いた情報管理方法及び装置
JPH02304643A (ja) データベース管理システムにおける異常データの検査方法
JPH05216651A (ja) プログラム品質評価システム
JP4810113B2 (ja) データベースチューニング装置及びデータベースチューニング方法並びにプログラム
JPH11250135A (ja) 情報システム
JP2010044473A (ja) 含有化学物質情報管理システム、含有化学物質情報共通基盤管理システム、含有化学物質情報取得方法、材料マスタ作成方法、および含有化学物質情報評価支援プログラム
US9158818B2 (en) Facilitating identification of star schemas in database environments
JPH06348477A (ja) ソフトウエア開発システム
JPH0227475A (ja) データ管理装置