JPH06332956A - データ処理方法 - Google Patents

データ処理方法

Info

Publication number
JPH06332956A
JPH06332956A JP5116183A JP11618393A JPH06332956A JP H06332956 A JPH06332956 A JP H06332956A JP 5116183 A JP5116183 A JP 5116183A JP 11618393 A JP11618393 A JP 11618393A JP H06332956 A JPH06332956 A JP H06332956A
Authority
JP
Japan
Prior art keywords
data
output
information group
old
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5116183A
Other languages
English (en)
Inventor
Toshio Nakamura
敏夫 中村
Seiichi Ido
誠一 伊土
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5116183A priority Critical patent/JPH06332956A/ja
Publication of JPH06332956A publication Critical patent/JPH06332956A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 データベースシステムが管理しているデータ
群のデータ不良検出処理において、データ不良の検証の
ための時間及び人手の負荷の削減を図る。 【構成】 10はデータ不良検出を行う対象データベー
ス、20は比較するための別のデータベースである。対
象データベース10の1世代前にデータ不一致を検出し
た結果は、旧データ不一致情報群50として予め登録し
ておく。データ不良検出プログラム35は、データベー
ス10と20の対応するデータ項目同士の値を突き合
せ、データ不一致を検出すると、新データ不一致情報群
60に書き出す。このデータ不良検出プログラム35の
実行結果としての出力リスト45を出力する際、旧/新
データ不一致情報群50と60を比較して、旧データ不
一致と重複するもののリスト出力を省略するか否か決め
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データベース・システ
ム等で管理している複数データ項目からなるデータの集
まりからなるデータ群に関するデータ不良検出処理にお
いて、かかるデータ不良の履歴情報を取得するデータ処
理方法に関するものである。
【0002】
【従来の技術】データベース・システム等で管理してい
るデータ群は、データの追加・変更等が頻繁に行われる
もであるから、データ不良検出処理は、定期的に実施さ
れるものである。ここで、データ不良とは、あるデータ
項目の値(value)が、例えば、血液型が正しくは
“A型”であるのに、データ群中では“B型”となって
いるなど、値の誤りを示すものである。
【0003】データ・チエック、即ち、データ不良の検
出では、データベースシステム中のデータ群と実体(現
実の世界の情報を言う)との比較を行うわけであるが、
この実体との比較は、通常の場合、多大な時間と人手を
要する。そのため、従来は簡単な手段として、対象とす
るデータベースシステムとは別のデータベースで、共通
しているデータ項目(かならずしも同値ではない)に関
し、値を突き合わせることで、データ不良の存在を検出
する方法が採られる場合が多かった。
【0004】図3に、従来のかかるデータ不良検出方法
の構成図を示す。図3において、10はデータ不良検出
を行う対象データベース(DB−a)、20は比較する
ための別のデータベース(DB−b)、30は両者のデ
ータベースの等価なデータ項目間の値の突き合わせを行
うデータ不良検出プログラム、40はデータ不良検出プ
ログラム30の実行結果の出力リストである。
【0005】定期的に実行するデータ不良検出処理は、
必ず対象データベース10と比較する別のデータベース
20とで行うものとする。
【0006】まず、データ不良検出プログラム30は、
対象データベース10と別データベース20のそれぞれ
のデータ群から、キー値の一致するデータ同士を選択す
る。次に、1対のデータの対応するデータ項目同士の値
の突き合わせを行い、“同一の意味を持つ値であるか否
か”を判定する。同一意味を持つ値で無い場合は、デー
タ不一致として、後述の関連情報も含め、出力リスト4
0に出力する。なお、データ項目によっては、両者のコ
ード体系が違う場合も有り、その場合は、デー変換後、
突き合わせを行うことになる。以上の処理を、対象デー
タベース10の全データについて行う。
【0007】ここで、出力リスト40には、データ不一
致の情報を出力するといった意味は、データ不良検出プ
ログラム30が通常完全ではないため、データ不良では
無いが、“データ不一致”として、リストに出力される
から、結局のところ、出力リスト40は、データ不一致
の情報群ということである。これは、同一の意味を持つ
値であるか否かという判定のケース分けが複雑なため、
完全プログラム化することが効率的でないという理由か
らである。
【0008】また、出力リスト40には、データ項目間
の値の不一致の情報だけでなく、関連する情報として、
例えば、電話に関するデータベース/業務で言えば、お
客様住所、電話番号、また、データ不一致が機器あるい
はその個数であれば、それを含む関連機器情報など、各
種の情報を出力する必要があり、出力件数に比例して出
力リスト量が大きくなる。
【0009】このように、従来のデータ不良の検出方法
においては、データベースで管理しているデータ群中の
全データについて突き合わせを行っている。このため、
通常のデータベースでは、格納しているデータ数は増加
する一方であるため、その突合わせの処理件数、処理時
間はだんだん増加していく。
【0010】また、出力リストには、データ不良では無
いが、“データ不一致”として出力されるものなどがあ
り、1世代前のデータ不一致情報群との重複分を無視し
たい場合であっても、全て出力されてしまうという欠点
があった。さらに、前回出力と同じ内容か否かが簡単に
はわからないため、出力リスト全てについて検証する必
要があった。
【0011】
【発明が解決しようとする課題】以上述べたように、従
来のデータ不良検出処理においては、データ不良検出プ
ログラムの処理結果としての出力リスト量が多いことに
より、データ不良の検証のための時間及び人手の負荷が
大きいという問題点があった。
【0012】本発明の目的は、上記のごとき問題点を解
決するものであり、データベース・システム等で管理し
ているデータ群に関するデータ不良検出処理において、
データ不良の検証のための時間及び人手の負荷の削減を
可能とするデータ処理方法を提供することにある。
【0013】
【課題を解決するための手段】上記目的を達成するため
に、本発明では、予め1世代前のデータ群中のデータ不
一致の情報群(旧データ不一致情報群)を登録してお
き、現世代におけるデータ群についてデータ不一致を検
出し、そのデータ不一致の情報群(新データ不一致情報
群)を格納し、登録済みの旧データ不一致情報群と新デ
ータ不一致情報群とを比較して、旧データ不一致と重複
するもののリスト出力を省略するかを制御するようにし
たことである。
【0014】
【作用】1世代前のデータ不一致情報群を保存している
から、 データ不良では無いが、”データ不一致”として、リ
ストに出力されるもの、 稼働上等、何等かの理由から、データの修正が未処理
になっているもの、 など、1世代前のデータ不一致と重複しているものか否
かが容易に判定でき、前回データ不一致との重複分を省
略し、出力リスト量を削減できる。結局、データ不良の
検証のための時間及び人手の負荷の削減ができる。
【0015】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。
【0016】図1は、本発明の一実施例の構成図であ
る。図中、10はデータ不良検出を行う対象データベー
ス(DB−a)、20は比較するための別のデータベー
ス(DB−b)35は両者のデータベースの等価なデー
タ項目間の値の突き合わせを行うデータ不良検出プログ
ラム、45はデータ不良検出プログラム35の実行結果
としての出力リスト、50は予め対象データベース10
の1世代前のデータ不一致の情報群を登録済みの旧デー
タ不一致情報群、60は今回の現世代の対象データベー
ス10のデータ・チエック結果としてのデータ不一致の
情報群を示す新データ不一致情報群である。
【0017】旧データ不一致情報群50は、対象データ
ベース10の1世代前にデータ不一致を検出した結果を
予め登録しておくものとする。この旧データ不一致情報
群50のレコードは、キー値でソートされているものと
する(例えば、昇順に)。以降では、昇順にソートされ
ているものとして説明する。
【0018】データ不良検出プログラム35を起動する
際の出力表示パラメータとして、ここでは、次の3つの
モードが指定できるものとする。 出力表示モード1 前回の出力リストと同じものは省略し、新規検出のデー
タ不良情報のみを出力する。 出力表示モード2 旧データ不一致及び新規検出のデータ不一致の両方を区
別して出力する。 出力表示モード3 従来技術における出力と同じ。
【0019】対象データベース10の現世代のデータ不
一致の検出処理は、以下の手順で行う。
【0020】まず、データ不良検出プログラム35は、
対象データベース10と別データベース20のそれぞれ
のデータ群から、キー値の一致するデータ同士を選択す
る。これは、従来技術の場合と同等である。
【0021】次に、1対のデータの対応するデータ項目
同士の値の突き合わせを行い、“同一の意味を持つ値で
あるか否か”を判定する。同一意味を持つ値で無い場合
は、データ不一致として、関連情報も含めて、例えば図
2に示すデータ不一致情報レコード)の形式で、新デー
タ不一致情報群60に書き出す。
【0022】以上の処理を、対象データベース10の全
データについて行う。
【0023】次に、新データ不一致情報群60のレコー
ドについて、キー値で昇順にソートする。勿論、データ
不良検出プログラム35でのデータ突き合わせの順序
が、キー値の昇順になっていれば、ソートは不要にな
る。
【0024】次に、データ不良検出プログラム35の指
定された起動パラメータに従い、以下のように出力リス
ト45への出力処理を行う。
【0025】(出力表示モード1の場合)新データ不一
致情報群60中にあるレコードを、キー値の昇順に1件
ずつ取り出し、旧データ不一致情報群50のレコードと
一致するかを判定する。そして、一致すれば、出力リス
ト45にはなにも出力しない。一致しなければ、新規の
データ不一致であるから、データ不一致の出力リスト内
容(図2の73)を、出力リスト45に出力する。この
処理を、新データ不一致情報群60にあるレコード全て
について行う。
【0026】(出力表示モード2の場合)新データ不一
致情報群60中にあるレコードを、キー値の昇順に1件
ずつ取り出し、旧データ不一致情報群50のレコードと
一致するかを判定する。そして、一致すれば、出力リス
ト45には、旧分と同じ旨のメッセージを出力し、デー
タ不一致の出力リスト内容(図2の73)を出力する。
一致しなければ、新規のデータ不一致であるから、新規
分である旨のメッセージと出力データ不一致の出力リス
ト内容(図2の73)を、出力リスト45に出力する。
なお、新旧どちらかに、その旨の表示をするのでもよ
い。
【0027】(出力表示モード3の場合)この場合は、
新データ不一致情報群60中にあるレコードを、順番に
取り出し、そのレコード中のデータ不一致の出力リスト
内容(図2の73)を、出力リスト45に出力する。
【0028】図2は、図1中の旧データ不一致情報群5
0及び新データ不一致情報群60の1レコードの論理的
な構成例であり、対象データベース10及び比較する別
データベース20のデータを一意に識別するキー値7
1、データ項目を識別する情報であるデータ項目識別情
報74とそのデータの属性75と基準になる値(この場
合は、別データベース20の該データの該データ項目に
おける値)76と対象データベース10の該データの該
データ項目の値77からなるデータ不一致識別情報7
2、及びデータ不一致の出力リスト内容73から構成さ
れる。データ1件につき、n件のデータ不良があれば、
n件分のデータ不一致情報レコードが並ぶことになる。
【0029】データ不一致識別情報72は、前回データ
不一致と同一内容のものかを判定するための情報であ
り、旧データ不一致情報群のレコードと同じものか否か
は、データ不一致識別情報72の構成要素である、デー
タ項目識別情報74、そのデータ項目のデータ属性7
5、基準になる値76、該データベース中の値77が、
全て一致するか否かで判定する。データ不一致の出力リ
スト内容73には、関連情報も格納する。
【0030】次回のデータ不良検出時は、今回格納した
新データ不一致情報群60を、旧データ不一致情報群5
0として使用すればよい。
【0031】以上、実施例では、データ不良の処理例に
ついて説明したが、本発明はこれに限定されるものでは
なく、データ不良とは関係のない、一般的なデータ処理
として、処理結果としての出力内容を識別する情報が一
意に決まるものであれば、如何なるものであっても容易
に拡張できる。
【0032】
【発明の効果】以上説明したように、本発明によれば、
1世代前のデータ不一致情報群があるので、前回データ
不一致と同じ内容のものかどうかが判定できるため、前
回の出力リストと同じものは省略し、前回データ不良検
査では無かった新規のデータ不良情報のみを出力するこ
とで、全体の出力リスト量を削減でき、データ不良の検
証のための時間及び人手の負荷の削減することができ
る。
【0033】また、前回データ不一致との重複分も念の
ため出力したいということであれば、両方を区別して出
力するということができるので(例えば、旧データ不一
致分を先に出力し、次に、新規データ不一致の分である
というメッセージを出力して、新規のデータ不一致情報
を出力する、など)、データ不良の検証作業を効率的に
できる。
【図面の簡単な説明】
【図1】本発明の一実施例の構成図である。
【図2】本発明によるデータ不一致情報のレコード構成
例を示す図である。
【図3】従来のデータ不良検出方法の構成例を示す図で
ある。
【符号の説明】
10 データ不良検出を行う対象データベース 20 比較するための別のデータベース 35 データ不良検出プログラム 45 出力リスト 50 予め登録済みの旧データ不一致情報群 60 今回の現世代の新データ不一致情報群

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 データベース・システムなどで管理して
    いる複数データの集まりからなるデータ群に関するデー
    タ不一致を検出するデータ処理方法において、予め1世
    代前のデータ群中のデータ不一致の情報群(以下、旧デ
    ータ不一致情報群という)を登録しておき、現世代にお
    けるデータ群についてデータ不一致を検出し、そのデー
    タ不一致の情報群(以下、新データ不一致情報群とい
    う)を格納し、登録済みの旧データ不一致情報群と新デ
    ータ不一致情報群とを比較して、旧データ不一致と重複
    するもののリスト出力を省略するか否かを制御すること
    を特徴とするデータ処理方法。
JP5116183A 1993-05-18 1993-05-18 データ処理方法 Pending JPH06332956A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5116183A JPH06332956A (ja) 1993-05-18 1993-05-18 データ処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5116183A JPH06332956A (ja) 1993-05-18 1993-05-18 データ処理方法

Publications (1)

Publication Number Publication Date
JPH06332956A true JPH06332956A (ja) 1994-12-02

Family

ID=14680868

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5116183A Pending JPH06332956A (ja) 1993-05-18 1993-05-18 データ処理方法

Country Status (1)

Country Link
JP (1) JPH06332956A (ja)

Similar Documents

Publication Publication Date Title
US20070005543A1 (en) System and method for rule-based data object matching
US20040034668A1 (en) Managing data integrity
US20080027578A1 (en) Parts production management system and parts production management method
CN111767350A (zh) 数据仓库测试方法、装置、终端设备及存储介质
JPH06332956A (ja) データ処理方法
CN101425141B (zh) 图像识别装置和图像识别方法
JPH05274467A (ja) データ入力装置
JP2699436B2 (ja) パラメータ検査処理方法
JPH06332957A (ja) データ処理方法
JPH07225792A (ja) 特別世帯名寄せ処理方式
JPH05257950A (ja) 顧客マスタ更新方式
JPH0581110A (ja) インデクスフアイルの整合性自動検証方式
JPH07234809A (ja) データ処理方法及びチェックスキップ機能を有する計算機
JP2003091431A (ja) テストシナリオ選択実行システム、方法、およびプログラム
JP2002007121A (ja) ソースファイル変更履歴管理方法、装置およびプログラムを記録した記録媒体
JPH05122335A (ja) 局データ照合方式
JPS5856150A (ja) プログラム管理方式
CN114924978A (zh) 基于人工智能的多分支增量检查方法及相关设备
JP2663903B2 (ja) 工程パスチェック方法及び装置
JPH03296836A (ja) 入力データデバック方法
JPH03257637A (ja) チェック項目自動抽出機構
JPH0870349A (ja) 電子交換機の試験結果自動判定方式
JPH0256037A (ja) データベースのページ破壊検知方式
JPS62224833A (ja) デ−タ形式の適否検査方式
JPS62150432A (ja) コマンド解析方式