JPH07234809A

JPH07234809A - データ処理方法及びチェックスキップ機能を有する計算機

Info

Publication number: JPH07234809A
Application number: JP6024509A
Authority: JP
Inventors: Toshio Nakamura; 敏夫中村; Shoichiro Ishigaki; 昭一郎石垣
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1994-02-22
Filing date: 1994-02-22
Publication date: 1995-09-05

Abstract

(57)【要約】【目的】本発明の目的は、データベース・システム等
で管理しているレコード群に関するデータ不良検出処理
において、データ不良検出に要する処理時間の削減を可
能とするデータ処理方法を提供することである。【構成】本発明は、複数のデータ項目で構成されるレ
コードの集まりからなるレコード群に関するデータ不一
致を検出するデータ処理方法において、レコード内の更
新日付がチェックした日付より以前の場合には、レコー
ド毎または該レコードのデータ項目毎のデータ不一致の
チェックを行わない。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、データ処理方法及びチ
ェックスキップ機能を有する計算機に係り、特に、デー
タベース・システム等で管理している複数データ項目か
らなるレコードの集まりからなるレコード群のデータ不
良の検出処理（データ・チェック処理）を行うデータ処
理方法及びチェックスキップ機能を有する計算機に関す
る。

【０００２】データベース・システム等で管理している
レコード群は、レコードの追加・データ項目値の変更が
頻繁に行われることにより、データ不良チェック処理を
定期的に実施する必要がある。本発明は、データ不良チ
ェック処理をレコード及びデータ項目のデータが別デー
タベースのレコード及びデータ項目のデータと比較して
同一の意味を持っているかをチェックする場合の効率化
を図る。

【０００３】なお、どちらのデータベースのデータが不
良であるかはわからないため、このチェック結果を基
に、人手で正解値を調査することになる。

【０００４】

【従来の技術】データ不良とは、あるデータ項目値（va
lue)が例えば、血液型が正しくは“Ａ型”であるのに、
データ群中では、“Ｂ型”となっている等の値の誤りを
言う。

【０００５】データ・チェック、即ち、データ不良の検
出方法としては、データベース・システム中のレコード
群と実体（現実の世界の情報を言う）との比較を行う際
に、この実体とレコード群との比較は、通常の場合、多
大な時間と人手を要するという欠点がある。そのため、
簡易な手段として対象とするデータベース・システム
（ＤＢ−ａ）とは別のデータベース（ＤＢ−ｂ）で、共
通しているデータ項目（必ずしも同値ではない）に関
し、値を突き合わせることで、データ不良の存在を検出
する方法がある。

【０００６】図１４は、従来のデータ不良検出方法を説
明するための図である。同図においてデータ不良検出
は、データ不良検出を行う対象データベースＤＢ−ａ１
０、比較するための別のデータベース（ＤＢ−ｂ）２
０、両者のデータベースの等価なデータ項目間の値の突
き合わせを行うデータ不良検出プログラム３０及び、デ
ータ不良検出プログラム３０の実行結果の出力リスト４
０を用いて行う。

【０００７】ここで、定期的に実行するデータ不良検出
処理は、必ず対象データベース１０と比較する別のテキ
ストデータベース２０とで行うものとする。

【０００８】なお、実際には、この逆も当然あり、両方
が対象となるわけであるが、説明を簡単にするために、
仮に対象データベース１０、別データベース２０と呼ん
でいる。

【０００９】図１５は、従来のデータ不良検出プログラ
ムの動作を示すフローチャートである。まず、データ不
良検出プログラム３０は、前段の処理として、対象デー
タベース１０と別データベース２０のそれぞれのデータ
群を読み込み、それぞれのキー値の一致しているレコー
ド同士を１対として組み合わせて、全レコードについて
１対の組が選択される。なお、ここで、１対の組が出来
なかったレコードについては、データ不良としてリスト
出力することになるが、ここでは、その処理の詳細につ
いては、説明を省略する。

【００１０】なお、対象データベース１０と別データベ
ース２０間でコード体系が異なる場合（例えば、一方が
ＩＮＴＥＧＥＲ（４バイト）で、他方がＣＨＡＲＡＣＴ
ＥＲ（８バイト）の場合等）は、データ変換を行い、キ
ー値の一致しているレコード同士を選択する。

【００１１】なお、この処理の詳細な説明は省略する
が、例えば、ＮＴＴのデータベース品質管理システムＤ
ＱＳのマッチングシステム等がその例として挙げられる
（参考文献として、田中他：データベース品質向上を支
援する新システム−データベース品質管理システム（Ｄ
ＱＳ）の開発−、ＮＴＴ技術ジャーナル、Vol.4,No.11,
pp.67-68(1992).)。

【００１２】次に、両方のデータベース（ＤＢ）の１対
のレコードを読み出し（ステップ１０２）、対応するデ
ータ項目同士の値の突き合わせを行い（ステップ１０
５）、“同一の意味を持つ値であるか否かを”を判定す
る。同一意味を持つ値でない場合は、データ不一致とし
て、後述の関連情報も含め、出力リスト４０に出力する
（ステップ１０６）。なお、データ項目によっては、両
者のコード体系が違う場合もあり、その場合には、デー
タ変換後（ステップ１０４）に突き合わせを行う。

【００１３】上記のデータ項目同士の値の突き合わせを
全てのデータ項目について行う（なお、場合によって
は、一部の特定のデータ項目についてのみ突き合わせを
行うこともある）。ここで行うデータ項目同士の突き合
わせは、データの種別・内容等により個々に異なるた
め、詳細な説明は省略する。

【００１４】さらに、上記の処理を対象データベース１
０の全てのレコードについて行う（ステップ１０１）。
その結果、出力リスト４０にデータ不一致の情報及び関
連情報を出力する。ここで、関連情報として、例えば、
電話に係わるデータベース／業務の例では、お客様氏
名、お客様住所、電話番号、又はデータ不一致が機器あ
るいはその個数であれば、それを含む関連機器情報等の
各種の情報を出力する。

【００１５】上記の処理において、出力リスト４０にデ
ータ不一致の情報を出力するのは、データ不良検出プロ
グラム３０が通常完全ではないため、データ不良ではな
いが、“データ不一致”としてリストに出力されること
により、出力リスト４０は、データ不一致の情報群とい
うことができる。これは、同一の意味を持つ値であるか
否かという判定のケース分けが複雑なため、完全プログ
ラム化することが効率的ではないという理由からであ
る。

【００１６】

【発明が解決しようとする課題】しかしながら、上記従
来の方法では、データ不良検出プログラムが同一の意味
を持つか否かの判定方法が複雑であるため、出力リスト
に出力されるデータは、データ不良であるという限定は
できないデータ不一致情報である。また、出力リストに
は、データ不一致情報に加えて、関連情報も出力される
ため、データ不一致情報の件数に比例して出力リスト量
が増大する。このように、従来のデータ不要の検出方法
において、レコード群の全レコードの全データ項目につ
いて突き合わせを行っている。このため、通常のデータ
ベースでは、格納しているレコード数は増加する一方で
あるため、その突き合わせ処理件数、処理時間が増大す
る。

【００１７】このように、従来のデータ不良検出処理に
おいては、データ不良検出プログラムにより、全てのレ
コードの全てのデータ項目について、毎回チェック処理
を行っていることにより、データ不良検出に要する処理
時間が大きいという問題がある。

【００１８】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、データベース・システ
ム等で管理しているレコード群に関するデータ不良検出
処理において、データ不良検出に要する処理時間の削減
を可能とするデータ処理方法及びチェックスキップ機能
を有する計算機を提供することを目的とする。

【００１９】

【課題を解決するための手段】本発明は、複数のデータ
項目で構成されるレコードの集まりからなるレコード群
に関するデータ不一致を検出するデータ処理方法におい
て、レコード内の更新日付がチェックした日付より以前
の場合には、レコード毎または該レコードのデータ項目
毎のデータ不一致のチェックを行わない。

【００２０】図１は、本発明の原理を説明するための図
（その１）である。

【００２１】本発明は、複数のデータ項目で構成される
レコードの集まりからなるレコード群に関するデータ不
一致を検出するデータ処理方法において、各レコード毎
に、データ不一致をチェックした年月日及びチェックし
た日時（チェック日時）を表すチェック識別フィールド
と、各データ項目毎に、更新した年月日及び時刻（更新
日時）を表す更新識別フィールドを設け、データ項目の
更新時には、更新する１つ或いは複数のデータ項目に対
応する更新識別フィールドに更新日時を設定する（詳細
な説明は省略する）。

【００２２】データ不一致をチェックする時は、各レコ
ードにおける各データ項目に対してチェック識別フィー
ルドの値（Ａ）と、データ項目の更新識別フィールドの
値（Ｂ）とを比較して（ステップ１）、チェック識別フ
ィールドの値（Ａ）がデータ項目の更新識別フィールド
の値（Ｂ）より大きい場合（Ａ＞Ｂ）は、データ項目は
チェック済として該データ項目に関するデータ不一致の
チェック処理はスキップし、チェック識別フィールドの
値（Ａ）がデータ項目の更新識別フィールドの値（Ｂ）
以下である場合（Ａ≦Ｂ）は、データ項目のチェックを
行うという処理を順次行い（ステップ１、２、３）、該
レコードを構成するデータ項目全てのチェックが完了し
たとき、チェック識別フィールドにチェック日時を設定
する（ステップ４）。

【００２３】図２は、本発明の原理を説明するための図
（その２）である。

【００２４】本発明は、データベース・システム等で管
理している複数の集まりからなるレコード群に関するデ
ータ不一致を検出するデータ処理方法において、各レコ
ード毎にチェック識別フィールドと最新更新識別フィー
ルドを設け、データ項目の更新時には、最新更新識別フ
ィールドに、最新更新日時を設定する。

【００２５】データ不一致をチェックする時は、各レコ
ードに対して、チェック識別フィールドの値（Ａ）と、
最新更新識別フィールドの値（Ｃ）とを比較して（ステ
ップ１１）、チェック識別フィールドの値（Ａ）が最新
更新識別フィールドの値（Ｃ）より大きけれ（Ａ＞Ｃ）
ば、レコードは、チェック済として、データ不一致のチ
ェック処理はスキップするとともに、チェック識別フィ
ールドにデータ不一致をチェックした日時を設定し（ス
テップ１３）、チェック識別フィールドの値（Ａ）が最
新更新識別フィールドの値（Ｃ）以下の場合（Ａ≦Ｃ）
は、レコードのデータ項目についてのチェックを行うと
いう処理を順次行い（ステップ１２）、データ項目全て
のチェックが完了した時、チェック識別フィールドにデ
ータ不一致をチェックしたチェック日時を設定する（ス
テップ１３）。

【００２６】図３は、本発明の原理を説明するための図
（その３）である。

【００２７】本発明は、データベース・システム等で管
理している複数の集まりからなるレコード群に関するデ
ータ不一致を検出するデータ処理方法において、各レコ
ード毎に、データ不一致をチェックしたチェック日時を
表すチェック識別フィールドと、最新更新した日時を表
す最新更新識別フィールドと、各データ項目毎に更新し
た日時を表す更新識別フィールドを設け、データ項目の
更新時には、更新する１つ或いは複数のデータ項目に対
応する更新識別フィールドに更新日時を設定し、最新更
新識別フィールドに更新日時を設定する。

【００２８】データ不一致をチェックする時は、各レコ
ードに対してチェック識別フィールドの値（Ａ）と最新
更新フィールドの値（Ｃ）とを比較して（ステップ２
１）、チェック識別フィールドの値（Ａ）が最新更新識
別フィールドの値（Ｃ）より大きい場合（Ａ＞Ｃ）は、
レコードはチェック済として、データ不一致のチェック
処理はスキップすると共に、チェック識別フィールドに
データ不一致をチェックしたチェック日時を設定し（ス
テップ２５）、チェック識別フィールドの値（Ａ）が最
新更新識別フィールドの値（Ｃ）以下の場合（Ａ≦Ｃ）
には、各レコードにおける各データ項目に対してチェッ
ク識別フィールドの値（Ａ）と、データ項目の更新識別
フィールドの値（Ｂ）とを比較して（ステップ２２）、
チェック識別フィールドの値（Ａ）が該データ項目の更
新識別フィールドの値（Ｂ）よりも大きい場合（Ａ＞
Ｂ）には、データ項目はチェック済として、データ項目
に関するデータ不一致のチェック処理はスキップし、チ
ェック識別フィールドの値（Ａ）がデータ項目の更新識
別フィールドの値（Ｂ）以下である場合（Ａ≦Ｂ）に
は、データ項目のチェックを行う処理を順次行い（ステ
ップ２２、２３、２４）、レコードを構成するデータ項
目全てのチェックが完了した時、チェック識別フィール
ドにチェック日時を設定する（ステップ２５）。

【００２９】また、本発明のチェックスキップ機能を有
する計算機は、複数のデータ項目で構成されるレコード
の集まりからなるレコード群に関するデータ不一致を検
出する計算機において、レコード内の更新日付が、デー
タ不一致のチェックを行った日付より以前の場合には、
レコード毎または該レコードのデータ項目毎のデータ不
一致のチェックを行わないように制御する制御手段を有
する。

【００３０】

【作用】本発明は、第１にチェック識別フィールドの値
とデータ項目の更新識別フィールドの値とを比較して、
チェック識別フィールドの値＞データ項目の更新識別フ
ィールドの値であれば、データ項目はチェック済とし
て、データ項目に関するデータ不一致のチェック処理は
スキップすることができるため、データ不良検出に要す
る処理時間の削減が可能である。

【００３１】また、本発明は、第２にチェック識別フィ
ールドの値と最新更新識別フィールドの値を比較して、
チェック識別フィールドの値＞最新更新識別フィールド
の値である場合には、当該レコードはチェック済とし
て、データ不一致のチェック処理はスキップすることが
できるため、データ不要検出に要する処理時間の削減が
可能である。

【００３２】また、本発明は、第３に各レコードに対し
てチェック識別フィールドの値と最新更新識別フィール
ドの値とを比較し、また、各レコードの各データ項目対
しては、チェック識別フィールドの値とデータ項目の更
新識別フィールドの値とを比較して、チェック済のレコ
ードあるいは、データ項目に対するデータ不一致のチェ
ック処理はスキップすることができるので、データ不良
検出に要する処理時間を削減することが可能である。

【００３３】即ち、本発明は、レコード又はレコード内
のデータ項目の更新された日時がチェックを行った日付
より以前であれば、更新後、既にチェックは完了してい
ることになるので、この場合の不一致チェックは行わな
い。これによりチェック処理の時間が削減される。

【００３４】

【実施例】以下、図面とともに本発明の実施例を詳細に
説明する。

【００３５】図４は、本発明のデータ処理のシステム構
成を示す。同図において、図１４と同一構成部分には、
同一符号を付す。同図に示すデータ処理システムは、デ
ータ不良検出を行う対象データベース（ＤＢ−ａ）１
０、比較対象のデータベース（ＤＢ−ｂ）２０、両者の
データベースの等価なデータ項目間の値の突き合わせを
行うデータ不良検出プログラム３５、データ不良検出プ
ログラム３５の実行結果として出力する出力リスト４０
より構成される。

【００３６】［第１の実施例］最初に、本発明の第１の
実施例としてチェック識別フィールドの値とデータ項目
の更新識別フィールドの値を比較する例について説明す
る。

【００３７】図５は、本発明の第１の実施例のデータベ
ースのレコードの論理構成を示す。同図に示すレコード
は、対象データベース１０（以下対象ＤＢと呼ぶ）及び
比較する別のデータベース２０（以下別ＤＢと呼ぶ）の
データを一意に識別するキー値５０、データ不良をチェ
ックした年月日及び時刻（チェック日時）を表すチェッ
ク識別フィールド６０、対象ＤＢ１０、別ＤＢ２０のレ
コードのデータ項目の値７０、データ項目毎の更新した
年月日及び時刻（更新日時）を表す更新識別フィールド
８０より構成されている。なお、データ項目の値７０と
データ項目毎の更新識別フィールド８０は、全てのデー
タ項目について繰り返しとなっている。即ち、それぞれ
のフィールドの数は、データ項目の値７０₁〜７０_n、
更新識別フィールド８０₁〜８０_nである。

【００３８】更新識別フィールド８０は、データ項目の
値７０を更新した時、その時の更新日時を設定する。よ
って、更新識別フィールド８０は、データ項目の最新更
新日時を表していることになる。なお、レコードの挿入
（ＩＮＳＥＲＴ）の場合には、レコードを構成している
全てのデータ項目に対応する更新識別フィールド８０
は、更新した同一時刻が設定される。また、対象ＤＢ１
０、別ＤＢ２０に対して、１回も、データの不一致のチ
ェックが行われていない場合は、全てのレコードのチェ
ック識別フィールド６０には、未チェックの印として
“ＮＵＬＬ”あるいはオール“０”が設定されているも
のとする。また、データチェック後、追加されたレコー
ドについては、チェック識別フィールド６０は、“ＮＵ
ＬＬ”或いはオール“０”が設定されるものとする。以
降の説明中ではオール“０”（all ０）で説明するもの
とする。

【００３９】以下に対象データベース１０のデータ不一
致の検出処理（チェック処理）の動作を説明する。図
６、図７は、本発明の第１の実施例のチェック処理を説
明するためのフローチャートである。

【００４０】データ不良検出プログラム３５は、前段の
処理として、対象ＤＢ１０と別ＤＢ２０からレコードを
読み出し、それぞれのキー値の一致しているレコード同
士を１対として組み合わせて、全レコードについて１対
の組が選択される。なお、ここで、１対の組ができなか
ったレコードについては、データ不良としてリスト出力
することになるが、ここでは、その処理の詳細について
は説明を省略する。

【００４１】なお、読み出したレコードのキー値のコー
ド体系が異なっている場合には、データ変換を行い、読
み出したデータ群からキー値５０が一致するレコード同
士を選択する（従来の技術と同様）。

【００４２】次に、キー値５０が一致したＤＢ１０とＤ
Ｂ２０の一対のレコードを読み出し（ステップ２０
２）、データに対応するデータ項目７０の値の突き合わ
せを行い“同一の意味を持つ値であるか否か”を判定す
る。詳しくは、まず、対象ＤＢ１０の最初のレコードの
チェック識別フィールド６０の値を見て、“all ０”で
あり（ステップ２０３，Ｙｅｓ）、全てのデータ項目に
ついてデータ変換が必要なデータ項目については（ステ
ップ２０４）データ変換を行い（ステップ２０５）、別
ＤＢ２０の対となる対象ＤＢ１０のデータ項目７０の値
の突き合わせを行う（ステップ２０６）。突き合わせに
より同一の意味を持つか否かを判定し、同一意味を持つ
値でない場合は、データ不一致として関連情報を含めて
出力リスト４０に出力する（ステップ２０７）。ここ
で、関連情報としては、対象ＤＢ１０が電話情報を管理
しているデータベースであれば、電話番号、カスタマ氏
名・住所、使用形態等を出力リスト４０に表示する。な
お、本実施例では、データ不一致の場合に出力リスト４
０に表示するように構成しているが、この例に限定され
ることなく、ディスプレイ装置上に表示してもよい。

【００４３】また、対象ＤＢ１０の最初のレコードのチ
ェック識別フィールド６０の値が“all ０”ではない場
合（ステップ２０３，Ｎｏ）には、先頭のデータ項目の
更新識別フィールド８０とチェック識別フィールド６０
を比較して（ステップ２１１）、チェック識別フィール
ド６０の値＞当該データ項目の更新識別フィールド８０
である場合には（ステップ２１１，＞）、データ・チェ
ック後の更新が行われていないことを意味しており、当
該データ項目はチェック済（チェック不要）として、デ
ータ項目に関するデータ不一致のチェックは行わず、ス
テップ２１６に移行する。例えば、図５において（ｂ）
の例では、であるため、８月２０日に更新し、１２月１０日にチェ
ックを行っているため、再度チェックは不要である。

【００４４】また、ステップ２１１において、チェック識別フィールド６０の値≦当該データ項目の更
新識別フィールド８０の場合に、当該データ項目の値７０についてデータ変換
が必要な場合は（ステップ２１２、Ｙｅｓ）データ変換
を行い（ステップ２１３）、別ＤＢ２０のデータ項目７
０と対となる対象ＤＢ１０のデータ項目の値７０との値
の突き合わせを行い（ステップ２１４）、“同一の意味
を持つ値であるか否か”を判定する。同一の意味を持た
ない場合は、データ不一致として関連情報を含め出力リ
スト４０に出力する（ステップ２１５）。例えば、図５
（ｃ）の例において、であるから当該データ項目７０のチェックを行う。この
場合は、チェック日時が１２月１０日であり、それ以降
の日付である１２月２０日に更新を行っているため、デ
ータ項目７０のチェックが必要となる。

【００４５】上記のステップ２１１からステップ２１６
の処理を順次行い、当該レコードを構成するデータ項目
全てについてデータの不一致のチェックを行う。データ
項目全てについてのチェックが完了したら、チェック識
別フィールド６０にチェック日時を付与する（ステップ
２２０）。

【００４６】上記の処理を全てのレコードについて行う
（ステップ２０１）。

【００４７】［第２の実施例］次に、本発明の第２の実
施例について説明する。

【００４８】図８は、本発明の第２の実施例のデータベ
ースレコードの論理構成を示す。同図（ａ）は、ＤＢ１
０，ＤＢ２０に共通のレコードのフォーマットを示し、
同図（ｂ）、（ｃ）は、レコードの内容を示す。図８
（ａ）に示すように、データベースレコードは、対象Ｄ
Ｂ１０及び別ＤＢ２０のデータを一意に識別するキー値
５０、データ不要をチェックした年月日及び時刻（チェ
ック日時）を表すチェック識別フィールド６０、レコー
ドの更新した年月日及び時刻（最新更新日時）を表す最
新更新識別フィールド９０から構成される。

【００４９】最新更新識別フィールド９０は、当該レコ
ードのどれか１つのデータ項目の値を更新した時、その
時の更新日時を設定する。従って、最新更新識別フィー
ルド９０の値は、当該レコードの最新の更新日時を示し
ていることになる。なお、レコードの挿入（ＩＮＳＥＲ
Ｔ）の場合にも当該レコードの最新更新識別フィールド
９０に同様に設定される。

【００５０】また、データベース・システムに対して１
回もデータの不一致のチェックが行われていない場合に
は、全てのレコードのチェック識別フィールド６０に
は、未チェックの印として“ＮＵＬＬ”或いはオール０
（all ０）が設定されているものとする。また、データ
チェック後、レコード追加されたレコードについては、
チェック識別フィールド６０は、“ＮＵＬＬ”或いは
“all ０”が設定される。以降の説明では、前述の第１
の実施例と同様に“all ０”を用いて説明するものとす
る。

【００５１】対象ＤＢ１０のデータ不一致の検出処理
（チェック処理）は以下の手順で行う。図９、１０は、
本発明の第２の実施例のチェック処理を説明するための
フローチャートである。

【００５２】まず、データ不良検出プログラム３５は、
前段の処理として対象ＤＢ１０と別ＤＢ２０からレコー
ドを読み出し、それぞれのキー値の一致しているレコー
ド同士を１対として組み合わせて、全レコードについて
１対の組が選択される。なお、ここで、１対の組ができ
なかったレコードについては、データ不良としてリスト
出力することになるが、ここでは、その処理の詳細につ
いては、説明を省略する。読み出したレコードのキー値
のコード体系が異なっている場合にはデータ変換を行
い、読み出したデータ群からキー値５０が一致するレコ
ード同士を選択する（従来の技術と同様）。

【００５３】次に、キー値５０が一致したＤＢ１０とＤ
Ｂ２０の一対のレコードを読み出し（ステップ３０
２）、対応するデータ項目同士の突き合わせを行い“同
一の意味を持つ値であるか否か”を判定する。詳しく
は、まず、対象ＤＢ１０の最初のレコードのチェック識
別フィールド６０の値を見て、“all ０”であれば（ス
テップ３０３，Ｙｅｓ）、全てのデータ項目についてデ
ータ変換が必要なデータ項目については（ステップ３０
４）データ変換を行い（ステップ３０５）、別ＤＢ２０
の対となる対象ＤＢ１０のデータ項目の値の突き合わせ
を行う（ステップ３０６）。突き合わせにより同一の意
味を持つか否かを判定し、同一意味を持つ値でない場合
は、データ不一致として関連情報を含めて出力リスト４
０に出力する（ステップ３０７）。

【００５４】次に、対象ＤＢ１０の最初のレコードのチ
ェック識別フィールド６０の値を見て“all ０”でなけ
れば（ステップ３０３、Ｎｏ）、チェック識別フィール
ド６０と最新更新識別フィールド９０を比較する（ステ
ップ３１１）。比較の結果チェック識別フィールド６０
の値＞最新更新識別フィールド９０の値であれば、デー
タチェック後の更新を行っていないことを意味している
ので、当該レコードはチェック済（チェック不要）とし
てデータ不一致のチェック処理はスキップする。例え
ば、図８（ｂ）の例では、であるため、８月２０日に更新し、１２月１０日にチェ
ックを行っているため、再度チェックは不要である。従
って、チェック処理は行わずステップ３２０に移行す
る。

【００５５】また、ステップ３１１において、チェック識別フィールド６０の値≦最新更新識別フィー
ルド９０の値である場合には、当該レコードのデータ項目についてデ
ータ変換が必要なものについては（ステップ３１２，Ｙ
ｅｓ）、データ変換を行い（ステップ３１３）、別ＤＢ
２０の対となるデータ項目の値との突き合わせを行い
“同一の意味を持つ値であるか否か”を判定する（ステ
ップ３１４）。同一意味を持つ値でない場合には、デー
タ不一致として関連情報も含め、出力リスト４０に出力
する（ステップ３１５）。

【００５６】当該レコードのデータ項目全てのチェック
が完了した時、チェック識別フィールド６０にデータ不
一致をチェックした年月日及び時刻（チェック日時）を
設定する（ステップ３２０）。例えば、図８（ｃ）の例
では、であるため、更新日時がチェック日付より後であるから
全データ項目についてデータ不一致処理を行う。

【００５７】上記の処理を全レコードについて行う（ス
テップ３０１）。

【００５８】［第３の実施例］次に、本発明の第３の実
施例として、各レコードに対してチェック識別フィール
ドと最新更新識別フィールドを比較し、各レコードの各
データ項目に対しては、チェック識別フィールドと更新
識別フィールドの値を比較してデータ項目に対するデー
タ不一致のチェック処理を行う場合について説明する。

【００５９】図１１は本発明の第３の実施例のデータベ
ースレコードの論理構成を示す。同図（ａ）は、データ
ベースレコードの論理構成を示し、同図（ｂ），（ｃ）
は、レコードの内容を示す。

【００６０】同図（ａ）において、対象ＤＢ１０及び別
ＤＢ２０のデータを一意に識別するキー値５０、データ
不要をチェックした年月日及び時刻（チェック日時）を
表すチェック識別フィールド７０、当該データ項目毎の
更新識別フィールドした年月日及び時刻（更新日時）を
表す更新識別フィールド８０から構成されている。な
お、データ項目の値７０とデータ項目毎の更新識別フィ
ールド８０は、全てのデータ項目について繰り返しとな
っている。即ち、それぞれのフィールド数は、データ項
目の値７０₁〜７０_n、更新識別フィールド８０₁〜８
０_nである。

【００６１】データ項目毎の更新識別フィールド８０
は、データ項目の値を更新したとき、その時の更新日時
を設定する。従って更新識別フィールド８０は、データ
項目の最新更新日時を表している。さらに、最新更新識
別フィールド９０はレコードを更新した時の日時を設定
する。従って、最新更新識別フィールド９０の値は、レ
コードの最新更新日時を表していることになる。なお、
レコードの挿入（ＩＮＳＥＲＴ）の場合には、レコード
を構成している全てのデータ項目に対応する更新識別フ
ィールド９０及び最新更新識別フィールド９０には、更
新した同一時刻が設定されていることになる。

【００６２】なお、データベース・システムに対して１
回もデータ不一致のチェックが行われていない場合は、
全てのレコードのチェック識別フィールドには、未チェ
ックの印として“ＮＵＬＬ”或いはオール“０”（all
０）が設定されているものとする。また、データ・チェ
ック後、レコード追加されたレコードについてはチェッ
ク識別フィールドは、“ＮＵＬＬ”或いはオール“０”
（all ０）が設定される。以降の説明においては、前述
の第１、第２の実施例と同様に、“all ０”を用いて説
明する。

【００６３】対象ＤＢ１０のデータ不一致の検出処理
（チェック処理）は、以下の手順で行う。

【００６４】図１２、図１３は、本発明の第３の実施例
のチェック処理の動作を示すフローチャートである。

【００６５】まず、データ不良検出プログラム３５は、
前段の処理として、対象ＤＢ１０と別ＤＢ２０からレコ
ードを読み出し、それぞれのキー値の一致しているレコ
ード同士を１対として組み合わせて全レコードについて
１対の組が選択される。なお、ここで、１対の組ができ
なかったレコードについては、データ不良としてリスト
出力することになるが、ここでは、その処理の詳細につ
いては説明を省略する。読み出したレコードのキー値の
コード体系が異なっている場合には、データ変換を行
い、読み出したデータ群からキー値５０が一致するレコ
ード同士を選択する（従来の技術と同様）。

【００６６】次に、キー値５０が一致したＤＢ１０とＤ
Ｂ２０の一対のレコードを読み出し（ステップ４０
２）、対応するデータ項目同士の突き合わせを行い“同
一の意味を持つ値であるか否か”を判定する。詳しく
は、まず、対象ＤＢ１０の最初のレコードのチェック識
別フィールド６０の値を見て、“all ０”であれば（ス
テップ４０３，Ｙｅｓ）、全てのデータ項目についてデ
ータ変換が必要なデータ項目については（ステップ４０
４）データ変換を行い（ステップ４０５）、別ＤＢ２０
の対となる対象ＤＢ１０のデータ項目の値の突き合わせ
を行う（ステップ４０６）。突き合わせにより同一の意
味を持つか否かを判定し、同一意味を持つ値でない場合
は、データ不一致として関連情報を含めて出力リスト４
０に出力する（ステップ４０７）。

【００６７】次に、チェック識別フィールド６０の値が
“all ０”でなければ（ステップ４０３，Ｎｏ）、最新
更新識別フィールド９０とチェック識別フィールド６０
を比較して、チェック識別フィールド６０の値＞最新更新識別フィー
ルド９０の値であれば、データチェック後の更新がないということで
あり、当該レコードはチェック済（チェック不要）とし
てデータ不一致のチェック処理はスキップすると共に、
チェック識別フィールド６０にデータ不一致をチェック
した年月日及び時刻（チェック日時）を設定する（ステ
ップ４２０）。図１１の例では、であるから、当該レコードは更新後にチェック処理が済
んでいるため、チェックは不要である。

【００６８】また、チェック識別フィールド６０の値と
最新更新識別フィールド９０の値を比較して（ステップ
４１１）、チェック識別フィールド６０の値≦最新更新識別フィー
ルド９０の値であれば、先頭のデータ項目の更新識別フィールド８０
とチェック識別フィールド６０を比較して（ステップ４
１２）、チェック識別フィールド６０＞データ項目の更新識別フ
ィールド８０の値である場合には、データチェック後の更新がないという
ことであり、当該データ項目はチェック済（チェック不
要）として当該データ項目に関するデータ不一致のチェ
ック処理はスキップし、ステップ４１７に移行する。例
えば、図１１の例では、であるから、チェック日時の1993年12月10日以降には、
当該データ項目は更新されていないため、当該データ項
目のチェックは不要である。

【００６９】また、チェック識別フィールド６０≦デー
タ項目の更新識別フィールド８０の値である場合には、
データ項目の値７０についてデータ変換処理が必要な場
合には（ステップ４１３）、データ変換処理を行い（ス
テップ４１４）、別ＤＢ２０の対となるデータ項目の値
７０と値の突き合わせを行い、“同一の意味を持つ値で
あるか否か”を判定する（ステップ４１５）。同一意味
を持たないである場合には、データ不一致として関連情
報も含めて出力リスト４０に出力する（ステップ４１
６）。例えば、図１１の（ｃ）の例では、であるから、チェック日時1993年12月10日以降の日付19
93年12月20に当該データ項目が更新されているため、デ
ータ項目のチェックが必要となる。

【００７０】上記の処理を当該レコードを構成するデー
タ項目全てについて行う（ステップ４１７）。上記の処
理が完了した時、チェック識別フィールド６０にチェッ
ク日時を設定する（ステップ４２０）。

【００７１】以上、本発明の第１〜第３の実施例につい
て説明したが、本発明は、上記実施例に限定されるもの
ではなく、その要旨を逸脱しない範囲において種々変更
可能である。

【００７２】例えば、上記の実施例では、データ不良検
出プログラム３５において、チェック日付と更新日付を
比較してチェックのスキップ処理を行っていたが、この
プログラムに限定されることなく、チェック日付と更新
日付が入力された場合に比較を行い、チェック日付が更
新日付より以前の場合のみ、データ項目のチェックを行
うプログラムを呼び出すような制御部を備えてもよい。

【００７３】さらに、上記の実施例では、チェック識別
フィールド、レコードの最新更新識別フィールド、デー
タ項目対応の更新識別フィールドをレコード中に保持す
る方法としたが、別テーブル等で管理する方法等があ
る。

【００７４】

【発明の効果】上述のように本発明によれば、データ不
良検出プログラムでの不要なチェックを省略することが
できるため、データ不良検出のための処理時間を削減す
ることが可能である。

【図面の簡単な説明】

【図１】本発明の原理を説明するための図（その１）

【図２】本発明の原理を説明するための図（その２）

【図３】本発明の原理を説明するための図（その３）

【図４】本発明のデータ処理のシステム構成図である。

【図５】本発明の第１の実施例のデータベースのレコー
ドの論理構成図である。

【図６】本発明の第１の実施例のチェック処理を説明す
るためのフローチャート（その１）である。

【図７】本発明の第１の実施例のチェック処理を説明す
るためのフローチャート（その２）である。

【図８】本発明の第２の実施例のデータベースレコード
の論理構成図である。

【図９】本発明の第２の実施例のチェック処理を説明す
るためのフローチャート（その１）である。

【図１０】本発明の第２の実施例のチェック処理を説明
するためのフローチャート（その２）である。

【図１１】本発明の第３の実施例のデータベースレコー
ドの論理構成図である。

【図１２】本発明の第３の実施例のチェック処理を説明
するためのフローチャート（その１）である。

【図１３】本発明の第３の実施例のチェック処理を説明
するためのフローチャート（その２）である。

【図１４】従来のデータ不良検出方法を説明するための
図である。

【図１５】従来のデータ不良検出ルログラム動作を示す
フローチャートである。

【符号の説明】

１０対象データベース２０比較するための別データベース３０，３５データ不要検出プログラム４０出力リスト５０キー値６０チェック識別フィールド７０データ項目の値８０当該データ項目の更新識別フィールド９０当該レコードの最新更新識別フィールド

Claims

【特許請求の範囲】

【請求項１】複数のデータ項目で構成されるレコード
の集まりからなるレコード群に関するデータ不一致を検
出するデータ処理方法において、レコード内の更新日付が、データ不一致のチェックを行
った日付より以前の場合には、レコード毎または該レコ
ードのデータ項目毎のデータ不一致のチェックを行わな
いことを特徴とするデータ処理方法。
【請求項２】複数のデータ項目で構成されるレコード
の集まりからなるレコード群に関するデータ不一致を検
出するデータ処理方法において、各レコード毎に、データ不一致をチェックした年月日及
びチェックした日時（チェック日時）をを表すチェック
識別フィールドと、各データ項目毎に、更新した年月日
及び時刻（更新日時）を表す更新識別フィールドを設
け、データ項目の更新時には、更新する１つ或いは複数のデ
ータ項目に対応する更新識別フィールドに更新日時を設
定し、データ不一致をチェックする時は、各レコードにおける
各データ項目に対してチェック識別フィールドの値と、
該データ項目の更新識別フィールドの値とを比較して、
チェック識別フィールドの値が該データ項目の更新識別
フィールドの値より大きい場合は、該データ項目はチェ
ック済として該データ項目に関するデータ不一致のチェ
ック処理はスキップし、チェック識別フィールドの値が該データ項目の更新識別
フィールドの値以下である場合は、該データ項目のチェ
ックを行うという処理を順次行い、該レコードを構成す
るデータ項目全てのチェックが完了したとき、チェック
識別フィールドにチェック日時を設定する請求項１記載
のデータ処理方法。
【請求項３】データベース・システム等で管理してい
る複数の集まりからなるレコード群に関するデータ不一
致を検出するデータ処理方法において、各レコード毎にチェック識別フィールドと最新更新識別
フィールドを設け、データ項目の更新時には最新更新識別フィールドに最新
更新日時を設定し、データ不一致をチェックする時は、各レコードに対し
て、チェック識別フィールドの値と、最新更新識別フィ
ールドの値とを比較して、該チェック識別フィールドの
値が該最新更新識別フィールドの値より大きければ、該
レコードは、チェック済として、データ不一致のチェッ
ク処理はスキップするとともに、チェック識別フィール
ドにデータ不一致をチェックした日時を設定し、該チェック識別フィールドの値が該最新更新識別フィー
ルドの値以下の場合は、該レコードのデータ項目につい
てのチェックを行うという処理を順次行い、データ項目
全てのチェックが完了した時、チェック識別フィールド
にデータ不一致をチェックしたチェック日時を設定する
請求項１記載のデータ処理方法。
【請求項４】データベース・システム等で管理してい
る複数の集まりからなるレコード群に関するデータ不一
致を検出するデータ処理方法において、各レコード毎に、データ不一致をチェックしたチェック
日時を表すチェック識別フィールドと、最新更新した日
時を表す最新更新識別フィールドと、各データ項目毎に
更新した日時を表す更新識別フィールドを設け、データ項目の更新時には、更新する１つ或いは複数のデ
ータ項目に対応する更新識別フィールドに更新日時を設
定し、さらに、該最新更新識別フィールドに更新日時を設定し、データ不一致をチェックする時は、各レコードに対して
チェック識別フィールドの値と該最新更新フィールドの
値とを比較して、該チェック識別フィールドの値が該最
新更新識別フィールドの値より大きい場合は、該レコー
ドはチェック済としてデータ不一致のチェック処理はス
キップすると共に、チェック識別フィールドにデータ不
一致をチェックしたチェック日時を設定し、該チェック識別フィールドの値が該最新更新識別フィー
ルドの値以下の場合には、各レコードにおける各データ
項目に対してチェック識別フィールドの値と、該データ
項目の更新識別フィールドの値とを比較して、該チェッ
ク識別フィールドの値が該データ項目の更新識別フィー
ルドの値よりも大きい場合には、該データ項目はチェッ
ク済として、該データ項目に関するデータ不一致のチェ
ック処理はスキップし、該チェック識別フィールドの値が該データ項目の更新識
別フィールドの値以下である場合には、該データ項目の
チェックを行う処理を順次行い、該レコードを構成する
データ項目全てのチェックが完了した時、チェック識別
フィールドにチェック日時を設定する請求項１記載のデ
ータ処理方法。
【請求項５】複数のデータ項目で構成されるレコード
の集まりからなるレコード群に関するデータ不一致を検
出する計算機において、レコード内の更新日付が、データ不一致のチェックを行
った日付より以前の場合には、レコード毎または該レコ
ードのデータ項目毎のデータ不一致のチェックを行わな
いように制御するチェックスキップ機能を有する計算
機。