JP6527984B1 - 差異データ抽出装置、差異データ抽出プログラムおよび差異データ抽出方法 - Google Patents

差異データ抽出装置、差異データ抽出プログラムおよび差異データ抽出方法 Download PDF

Info

Publication number
JP6527984B1
JP6527984B1 JP2018085812A JP2018085812A JP6527984B1 JP 6527984 B1 JP6527984 B1 JP 6527984B1 JP 2018085812 A JP2018085812 A JP 2018085812A JP 2018085812 A JP2018085812 A JP 2018085812A JP 6527984 B1 JP6527984 B1 JP 6527984B1
Authority
JP
Japan
Prior art keywords
data
mask
difference
difference data
migration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018085812A
Other languages
English (en)
Other versions
JP2019192038A (ja
Inventor
圭佑 齊藤
圭佑 齊藤
章 大内
章 大内
勇太 森
勇太 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Information Systems Corp
Original Assignee
Mitsubishi Electric Information Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Information Systems Corp filed Critical Mitsubishi Electric Information Systems Corp
Priority to JP2018085812A priority Critical patent/JP6527984B1/ja
Application granted granted Critical
Publication of JP6527984B1 publication Critical patent/JP6527984B1/ja
Publication of JP2019192038A publication Critical patent/JP2019192038A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】データ比較等の試験を行うとき、差異が発生してもよいデータについては対象外とし、本来差異を見つけるべきデータを抽出することを課題とする。【解決手段】第1のデータ11と第2のデータ12との差異データを抽出する差異データ抽出装置100であって、マスク設定部2は、第1のデータ11に含まれる同一処理からの出力である複数データの差異を差異ありデータとしてマスク候補情報13に記憶し、マスク候補情報13に基づき差異ありデータとしないマスクデータをマスク設定情報14に登録する。マスク処理部4は、第1のデータ11および第2のデータ12のうち、マスク設定情報14に登録されたマスクデータに含まれる部分についてデータマスク処理を行う。【選択図】図2

Description

この発明は、たとえばシステム移行が正しく行われているかを出力データによって確認する差異データ抽出装置に関するものである。
たとえばオンプレミスのシステムをクラウドサービスシステムに移行するとき、システムとしての出力データが移行の前後で同一のものになっているかの試験を行う必要がある。同一のものであれば移行が正しく行われたと判定できるが、差異があれば移行に何らかの問題がある可能性がある。
出力データがたとえば帳票形式のCSVファイルであるとき、2つのファイルのデータ比較を行うと日時データ項目(タイムスタンプやデータ作成日時等)は必ず差異が出るが、日時データ項目については差異があっても問題ないものである。ところが日時データ項目の差異についても「差異データ」と判別してしまうと、差異を目視で確認するとき確認すべき項目が多数となってしまう。それにより、本来差異を見つけなければならない、たとえばロジック誤りによる不正項目を見逃してしまう可能性もある。
特許文献1では、処理単位を示す箱単位でデータ比較を行うことが開示されている。しかしながら特許文献1では、必ず差異が出る日時データ項目を考慮して、差異と判定しないことについては開示がない。
特開2014−6717号公報
この発明は、データ比較等の試験を行うとき、差異が発生してもよいデータについては対象外とし、本来差異を見つけるべきデータを抽出することを課題とする。
この発明に係る差異データ抽出装置は、第1のデータと第2のデータとの差異データを抽出する差異データ抽出装置であって、上記第1のデータに含まれる同一処理からの出力である複数データの差異を差異ありデータとしてマスク候補情報に記憶し、上記マスク候補情報に基づき差異ありデータとしないマスクデータをマスク設定情報に登録するマスク設定部と、上記第1のデータおよび上記第2のデータのうち、上記マスクデータに含まれる部分についてデータマスク処理を行うマスク処理部とを備える。
この発明の差異データ抽出装置によると、本来差異を見つけなければならないデータを抽出することができる。
実施の形態1におけるシステム構成図である。 実施の形態1における差異データ抽出装置100の構成図である。 実施の形態1における処理の流れを説明した図である。 実施の形態1における処理の流れを説明した図である。 実施の形態1における処理の流れを説明した図である。 実施の形態1で用いる移行前データ11の一例を示した図である。 実施の形態1におけるマスク候補情報13の一例を示した図である。 実施の形態1で用いる管理者向け設定画面500の一例を示した図である。 実施の形態1で用いるマスク設定情報14の一例を示した図である。 実施の形態1で生成するマスク済移行前データ15の一例を示した図である。 実施の形態1で生成するマスク済移行後データ16の一例を示した図である。 実施の形態1で生成する差異データ17の一例を示した図である。 実施の形態2で生成するマスク候補情報13の一例を示した図である。 実施の形態2で生成するマスク設定情報14の一例を示した図である。 実施の形態2で生成する差異データ17の一例を示した図である。 実施の形態1における差異データ抽出装置100の変形した構成図である。
実施の形態1.
本実施の形態において、差異データ抽出装置100は、移行前データ(第1のデータ)11と移行後データ(第2のデータ)12とを比較し、差異があるデータを抽出する。移行前データ11とは、移行前サーバ(移行前システム)200で動作する所定処理(たとえば処理A)からの出力データである。また移行後データ12とは、移行後サーバ(移行後システム)300で動作する、移行前サーバ200の所定処理(たとえば処理A)と同等の処理(たとえば処理a)からの出力データである。差異データ抽出装置100は、システムの試験に関連して移行前サーバ200で動作している処理が移行後サーバ300で正しく動作するか、つまりシステム移行が正しくされているかを、対応する処理からの出力データを比較することで実現している。
本実施の形態における「データ」には、文字データ(文字列、数値)が含まれる。文字データは1以上の項目と、その項目に対応する値からなる。1つの項目に対応する値を列、1つの項目に対応する値全体を列全体と呼ぶ。
また本実施の形態における「データマスク処理」とは、一般的にマスキングとも呼ばれる処理であり、機密情報や個人情報等、部分的にデータ公開を避けたい場合にも用いられる。具体的には、文字データのうち該当データを特定の数値や文字列に置き換えることを言う。あるいは、データそのものの存在を隠し、何らかの抽出の対象外とすることも考えられる。またデータマスク処理を行った文字データを画面に表示するときは、伏字(*等)で表示するように構成してもよい。
図1は、本実施の形態におけるシステム構成図である。差異データ抽出装置100は、ネットワーク400を介して、移行前サーバ200および移行後サーバ300と接続されている。
図2は、本実施の形態における差異データ抽出装置100の構成図を示した図である。差異データ抽出装置100は、コンピュータであり、プロセッサ910、記憶装置920、入力インタフェース930、出力インタフェース940といったハードウェアを備える。
また差異データ抽出装置100は、機能構成として、データ収集部1、マスク設定部2、表示部3、マスク処理部4、データ比較部5および記憶部150を備える。以下の説明では、データ収集部1と、マスク設定部2と、表示部3と、マスク処理部4と、データ比較部5との機能を、差異データ抽出装置100の「部」の機能という。差異データ抽出装置100の「部」の機能は、ソフトウェアで実現される。
また記憶部150は、記憶装置920で実現される。記憶部150には、移行前データ11、移行後データ12、マスク候補情報13、マスク設定情報14、マスク済移行前データ15、マスク済移行後データ16および差異データ17が記憶されている。
プロセッサ910は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。
プロセッサ910は、プロセッシングを行うIC(Integrated・Circuit)である。プロセッサ910は、具体的には、CPU(Central・Processing・Unit)である。
記憶装置920は、補助記憶装置921及びメモリ922を含む。補助記憶装置921は、具体的には、ROM(Read・Only・Memory)、フラッシュメモリ、または、HDD(Hard・Disk・Drive)である。メモリ922は、具体的には、RAM(Random・Access・Memory)である。記憶部150は、メモリ922により実現される。なお、記憶部150は、補助記憶装置921により実現されていてもよいし、補助記憶装置921とメモリ922の両方により実現されてもよい。
入力インタフェース930は、マウス、キーボード、タッチパネルといった入力装置と接続されるポートである。入力インタフェース930は入力された情報を差異データ抽出装置100に取り込む。入力インタフェース930は、具体的には、USB(Universal・Serial・Bus)端子、RS−232Cといったシリアルインタフェースである。
なお、入力インタフェース930は、LAN(Local・Area・Network)と接続されるポートであってもよい。
出力インタフェース940は、ディスプレイといった表示機器のケーブルが接続されるポートである。出力インタフェース940は、具体例として、USB端子、HDMI(登録商標)(High・Definition・Multimedia・Interface)端子、RS−232Cといったシリアルインタフェースである。ディスプレイは、具体的には、LCD(Liquid・Crystal・Display)である。
補助記憶装置921には、「部」の機能を実現するプログラムが記憶されている。このプログラムは、メモリ922にロードされ、プロセッサ910に読み込まれ、プロセッサ910によって実行される。補助記憶装置921には、OS(Operating・System)も記憶されている。OSの少なくとも一部がメモリ922にロードされ、プロセッサ910はOSを実行しながら、「部」の機能を実現するプログラムを実行する。
差異データ抽出装置100は、1つのプロセッサ910のみを備えていてもよいし、複数のプロセッサ910を備えていてもよい。複数のプロセッサ910が「部」の機能を実現するプログラムを連携して実行してもよい。
「部」の機能による処理の結果を示す情報、データ、信号値、および、変数値は、補助記憶装置921、メモリ922、または、プロセッサ910内のレジスタ又はキャッシュメモリに記憶される。
「部」の機能を実現するプログラムは、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ(登録商標)ディスク、DVD(Digital・Versatile・Disc)といった可搬記録媒体に記憶されてもよい。
なお、「部」の機能を実現するプログラムを差異データ抽出プログラム120ともいう。
差異データ抽出プログラム120は、「部」として説明している機能を実現するプログラムである。また、差異データ抽出プログラムプロダクトと称されるものは、差異データ抽出プログラム120が記録された記憶媒体及び記憶装置であり、見た目の形式に関わらず、コンピュータ読み取り可能なプログラムをロードしているものである。
データ収集部1は、移行前サーバ200および移行後サーバ300から所定処理が出力するデータを受信し、それぞれ移行前データ11および移行後データ12として記憶する。所定処理が定期的に動作するものであれば、移行前データ11および移行後データ12には該当の所定処理と関連付けられて、複数のデータが記憶されているものとする。
マスク設定部2は、移行前データ11に含まれる同一処理(たとえば処理A)からの出力である複数データの差異を「差異ありデータ」として認定した後、マスク候補情報13に記憶する。その後マスク候補情報13に基づき、一部または全部のデータを「差異ありデータ」としない「マスクデータ」と設定し、その「マスクデータ」をマスク設定情報14に登録する。マスク設定部2は、たとえば管理者からの指定に基づき、マスク候補情報13の「差異ありデータ」の一部または全体を「マスクデータ」と設定し、マスク設定情報14に記憶する。つまり「マスクデータ」とは、差異があっても問題がないデータであり、そのため実体のデータを隠すデータのことを示す。
あるいは、一定のルールを定め、そのルールに基づきマスク候補情報13の「差異ありデータ」の一部または全体を「マスクデータ」と設定し、マスク設定情報14に記憶する。
ルールの一例としては、1つの項目について列全体の値が差異ありデータとなったとき、列全体をマスクデータにすることが考えられる。つまりその項目は、日時データ項目等、必ず差異が発生する項目と言える。別のルールとしては、値の形式が8桁の数値である等日時データとみなされる項目は、マスクデータとすることが考えられる。
マスク処理部4は、移行前データ11および移行後データ12のうち、マスク設定情報14に記憶されたマスクデータに含まれる部分についてデータマスク処理を行う。
データ比較部5は、マスク処理部4がデータマスク処理を行った、マスク済第1のデータ15とマスク済第2のデータ16とのデータ比較を行い、差異データ17を出力する。このとき、データ比較部5は、マスク済第1のデータ15とマスク済第2のデータ16とが同等の対応する処理からの出力であることを判別した上で、データ比較を行う。具体的には、データ比較部5は、処理Aからの出力であるマスク済第1のデータ15と、処理aからの出力であるマスク済第2のデータ16が対応することを確認した上で、データ比較を行う。
本実施の形態において、移行前データ11、移行後データ12およびマスクデータは文字データであり、マスク処理部4が行うデータマスク処理とは、移行前データ11および移行後データ12のうち、マスクデータで特定される項目の値を予め定めた値に変換する。あるいは、マスクデータで特定される項目と項目の値とを移行前データ11、移行後データ12から除外する。それぞれのデータマスク処理については、詳細を後述する。
図3〜図12を用いて、本実施の形態における処理の流れについて、説明する。
本実施の形態では、移行前サーバ200で動作する処理Aの出力データと、移行後サーバ300で動作する処理aの出力データを比較するものとする。また差異データ抽出装置100の各部は、処理Aと処理aの対応、処理Aが出力した移行前データ11と処理aが出力した移行後データ12の対応を判別できるものとする。
具体的には、処理Aと処理aの対応付け情報は、管理者からの指定により記憶部150に記憶する。あるいは、差異データ抽出装置100上でシステム的に処理Aと処理aとの対応付けるように構成してもよい。その上で移行前サーバ200および移行後サーバ300から、移行前データ11および移行後データ12を受信するとき、合わせて処理名(処理Aまたは処理a)を受信する。あるいは移行前データ11および移行後データ12内に処理名を埋め込むことで、実現できる。
図3は、データ収集部1に関する処理の流れを説明したフローチャートである。データ収集部1は、任意のタイミングで移行前サーバ200から受信した、処理Aからの出力データを移行前データ11に蓄積する(ステップS1)。処理Aが定期的にデータを出力する構成であれば、移行前データ11には処理Aからの出力であることを関連付けられた上で、少なくても一定期間、複数データが蓄積される。
またデータ収集部1は、任意のタイミングで移行後サーバ300から受信した、処理aからの出力データを移行後データ12に蓄積する(ステップS2)。処理aが定期的にデータを出力する構成であれば、移行後データ12には処理aからの出力であることを関連付けられた上で、少なくても一定期間、複数データが蓄積される。
図4は、マスク設定部2と表示部3に関する処理の流れを説明したフローチャートである。マスク設定部2は、処理Aが出力した移行前データ11aと移行前データ11bとを比較し、値に差異がある項目を処理Aに関連するマスク候補情報13として記憶する(ステップS11)。マスク設定部2は、表示部3を用いてマスク候補情報13を表示し、管理者の指定に基づきマスク設定情報14を生成し、記憶部150に記憶する(ステップS12)。
図6は、移行前データ11aと移行前データ11bの一例を示している。図7は、図6に示した移行前データ11aと移行前データ11bとに基づき、マスク設定部2が生成したマスク候補情報13を例示している。移行前データ11aおよび移行前データ11bの矩形で囲んだ箇所は、マスク設定部2が、差異があるデータと認定したデータである。
図7では、マスク候補情報13をマークアップ言語と呼ばれるタグで囲まれた形式で表しているが、マスク候補情報13の形式はそれに限定されるものではない。<report id= >で示されるタブで項目ID(PID)が指定され、<columnName>で示されるタグで項目IDに対応して値の差異がある項目名が指定される。項目ID=P01では、UDATEの値に差異があること、項目ID=P02はUDATEおよびデータ2の値に差異があることが定義されている。同様に、項目ID=P03はデータ1およびUDATEの値に差異があることが定義されている。
移行前データ11aと移行前データ11bとは、たとえば直近とその1つ前の移行前データ11であるが、どのような選択でも構わない。
図8は、ステップS12で管理者からの指定を受け付ける管理者向け設定画面500の一例である。管理者向け設定画面500は、マスク候補情報13、移行前データ11aおよび移行前データ11bの情報に基づき、生成される。「PID」および「項目名」の列は、マスク候補情報13のreport idとcolumnNameの組み合わせで生成され、「サンプル1」と「サンプル2」のデータは、移行前データ11aおよび移行前データ11bの項目名に対応する値が参照され表示される。また「選択」は、管理者からマスクデータとする項目の選択を受け付ける列である。つまり管理者は、管理者向け設定画面500を用いて、図8に例示したように「選択」に○を付けることなどにより、日時データ等差異が出ても問題ない項目をマスクデータとして選択する。
なお管理者からの選択の受け付け方法は、項目をタッチパネルで選択する等、任意の方法で実現可能である。
図9は、マスク設定部2が生成したマスク設定情報14の一例である。マスク設定部2は、管理者向け設定画面500での管理者からの指定に基づき、マスク候補情報13の一部または全部をマスク設定情報14に複製する。具体的には、report idがP01、P02、P03の項目名UDATEがマスクデータとして設定される。
なお図4で示したステップS12では、管理者の指定に基づきマスク設定情報14を生成しているが、前述したように一定のルールに基づきマスク設定情報14を生成することも可能である。1つめのルールとしては、1つの項目について列全体の値が差異ありデータとなったとき、それらをマスクデータにする。図7に示したマスク候補情報13では、項目名UDATEが全てのreport idに対応して記憶されているので、マスク設定部2は項目名UDATEの列全体の値が差異ありデータであり、すなわちそれらをマスクデータであると判別する。
2つめのルールとしては、8桁の数値等日時データとみなされる項目をマスクデータにする。図7に示したマスク候補情報13に登録された項目名から移行前データ11(aまたはb)の値を参照し、桁数やデータ形式が予め定めたものであれば、かならず差異があるデータとし、それらをマスクデータであると判別する。なおこのルールは日時データに限定されず、差異があっても支障がないデータをマスクデータにする定義を行うことができる。
図5は、マスク処理部4、データ比較部5および表示部3に関する処理の流れを説明したフローチャートである。マスク処理部4は、対になる移行前データ11、移行後データ12およびマスク設定情報14を選定する(ステップS21)。移行前データ11から、マスク設定情報14のマスクデータに基づき、マスク済移行前データ15を生成する(ステップS22)。続いて、移行後データ12から、マスク設定情報14のマスクデータに基づき、マスク済移行後データ16を生成する(ステップS23)。なおステップS22およびステップS23の処理は、順序が逆でもよく、同時に動作してもよい。
データ比較部5は、マスク済移行前データ15とマスク済移行後データ16との比較を行い、差異のあるデータを差異データ17に出力する(ステップS24)その後、データ比較部5は表示部3を用いて管理者に対して、差異データ17に表示する(ステップS25)。
図5で示した処理の流れを図10〜図12を用いて、具体的に説明する。図10は、マスク処理部4が移行前データ11aから、図9に示したマスク設定情報14に基づき生成した、マスク済移行前データ15aの例である(ステップS22)。同じく図11は、マスク処理部4が移行後データ12aから、図9に示したマスク設定情報14に基づき生成した、マスク済移行後データ16aの例である(ステップS23)。図10および図11では、マスクデータに該当すると判定したデータの値を予め定めたマーク(図の例では、「×」のマーク)に変換した例を示す。
図12は、データ比較部5が生成した差異データ17の例である(ステップS24)。図12に示すように、マスク済移行前データ15aおよびマスク済移行後データ16aで差異が発生しても問題ない項目はマスクデータとして同じ値に変換されているか、あるいは削除されているので、差異データ17にはマスクデータを除いた差異データが登録される。例示した差異データ17aは、差異がない項目は空欄(NULL値)で入力され、差異がある項目はマスク済移行後データ16aの値が入力されている。例示した差異データ17bは、差異がある項目についてマスク済移行前データ15aおよびマスク済移行後データ16aの値が入力されている。ステップS25で、表示部3がこれらいずれかの差異データ17に基づき該当の処理名と差異データを表示することにより、管理者は本来見つけなければならない、差異データを効率的に抽出し、必要な対策を講じることができる。
本実施の形態において、移行前サーバ(第1のコンピュータ)200と移行後サーバ(第2のコンピュータ)300とは、システム移行の前後であることには限定されず、別のコンピュータであればよい。さらに、移行前データ(第1のデータ)11と移行後データ(第2のデータ)12とは、システム移行の前後のデータに限定されず、同等の処理からの出力データであればよい。
また異なるコンピュータからの出力に限定されず、第1のコンピュータ200および第2のコンピュータ300とは同じコンピュータであってもよく、第1のデータ11と第2のデータ12が同一コンピュータ上の異なる処理からの出力データであったとしても、それ同士を比較する場合にも用いることができる。よって、本実施の形態によると、同等の処理同士の出力データが正しいかどうかの確認処理を行うことができる。
本実施の形態では、差異データ抽出装置100は、入力インタフェース930を介して情報を取得し、出力インタフェース940を介して情報を出力する構成であった。しかし、差異データ抽出装置100が通信装置を備え、通信装置を介して情報を受信してもよい。また、差異データ抽出装置100は、通信装置を介して情報を送信してもよい。この場合、通信装置はレシーバとトランスミッタとを備える。具体的には、通信装置は通信チップまたはNIC(Network・Interface・Card)である。通信装置はデータを通信する通信部として機能する。レシーバはデータを受信する受信部として機能し、トランスミッタはデータを送信する送信部として機能する。
また、本実施の形態では、差異データ抽出装置100の「部」の機能がソフトウェアで実現されるが、変形例として、差異データ抽出装置100の「部」の機能がハードウェアで実現されてもよい。
図16を用いて、本実施の形態の変形例に係る差異データ抽出装置100の構成について説明する。
図16に示すように、変形例の差異データ抽出装置100では、図1のプロセッサ910及び記憶装置920に替えて、処理回路909を備える。
処理回路909は、前述した「部」の機能及び記憶部150を実現する専用の電子回路である。処理回路909は、具体的には、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックIC、GA(Gate・Array)、ASIC(Application・Specific・Integrated・Circuit)、または、FPGA(Field−Programmable・Gate・Array)である。
「部」の機能は、1つの処理回路909で実現されてもよいし、複数の処理回路909に分散して実現されてもよい。
別の変形例として、差異データ抽出装置100の機能がソフトウェアとハードウェアとの組合せで実現されてもよい。すなわち、差異データ抽出装置100の一部の機能が専用のハードウェアで実現され、残りの機能がソフトウェアで実現されてもよい。
プロセッサ910、記憶装置920、および、処理回路909を、総称して「プロセッシングサーキットリ」という。つまり、差異データ抽出装置100の構成が図1および図16のいずれに示した構成であっても、「部」の機能及び記憶部150は、プロセッシングサーキットリにより実現される。「部」を「工程」又は「手順」又は「処理」に読み替えてもよい。また、「部」の機能をファームウェアで実現してもよい。
本実施の形態では、マスク設定部2が第1のデータ(移行前データ)11に含まれる同一処理からの出力である複数データ(例えば、移行前データ11aと移行前データ11b)の差異を差異ありデータとしてマスク候補情報13に記憶する。その後管理者の選択またはルールに基づき、このマスク候補情報13から差異ありデータとしないマスクデータをマスク設定情報14に登録する。マスク処理部4が第1のデータ11および第2のデータ(移行後データ)12のうち、マスク設定情報14に登録されたマスクデータに含まれる部分についてデータマスク処理を行う。データ比較部5がマスク処理部4がデータマスク処理を行った、マスク済第1のデータ15とマスク済第2のデータ16とのデータ比較を行い、差異データ17を出力する。その後表示部3が差異データ17に基づき該当の処理名と差異データを表示する。
このように動作することにより、本実施の形態では管理者は本来見つけなければならない、差異データを効率的に抽出し、必要な対策を講じることができる。また差異データ抽出装置100ではデータ比較するデータ量を削減することができるので、処理効率の向上が見込まれる。
実施の形態2.
本実施の形態における「データ」には、画像データが含まれる。画像データは出力された文字データをスクリーンショット等の方法で画像に変換したデータであり、BMP、JPEG、GIF等の形式で保存される。
また本実施の形態における「データマスク処理」の対象は画像データであり、該当領域に上からマスク用の画像(マスク領域)を重ね合わせるような処理を実行することにより、該当領域の色情報を変換することを言う。
本実施の形態におけるシステム構成図および差異データ抽出装置100の構成図は、図1および図2を用いて実施の形態1で説明したとおりである。また処理の流れについても図3〜図5を用いて実施の形態1で説明したとおりである。
図13〜図14を用いて本実施の形態における処理の流れの一例を示す。図13は、移行前データ11cと移行前データ11dとに基づき、マスク設定部2が生成したマスク候補情報13を例示している。移行前データ11cと移行前データ11dは、画像データであり、図13において矩形で囲んだ箇所はマスク候補領域である。図4に示したステップS11の処理において、マスク設定部2が画像データである移行前データ11cと移行前データ11dとを比較し、画像として差異がある領域を画像データとしたマスク候補情報13を生成する。図13におけるマスク候補情報13は、黒塗りされている領域である。なおステップS11における画像データの比較処理は、抽出した特徴量の比較等、既存の技術で実行する。
図14は、ステップS12においてマスク設定部2が生成したマスク設定情報14を例示している。図13に示したマスク候補情報13を管理者向け設定画面500に表示し、タッチ操作等でマスク領域を選択させ、マスク設定情報14を生成するように構成する。
また本実施の形態においても一定のルールに基づきマスク設定情報14を生成することが可能である。
1つめのルールとしては、マスク候補情報13に含まれる黒塗りされている領域が1つの列全体に及ぶものをマスク領域とする。図13に示したマスク候補情報13で、特定の項目名に関して黒塗りされている領域が列全体にかかっているものがあれば、この領域をマスク領域であると判別する。
2つめのルールとしては、予め定めた一定の大きさより黒塗りされている領域が大きい場合、項目全体に及ぶ領域と判定し、この領域をマスク領域とする。図13に示したマスク候補情報13で、項目名UDATEに関して黒塗りされている領域が一定の大きさ以上である場合、項目名UDATEに関する領域をマスク領域であると判別する。
図15は、本実施の形態においてデータ比較部5が生成した差異データ17の例である(ステップS24)。図15に示すように、マスク済移行前データ15aおよびマスク済移行後データ16aで、差異が発生しても問題ない項目はマスク領域に変換されているので、差異データ17aにはマスク領域を除いて差異がある領域が登録される。例示した差異データ17aは、差異がある領域のみが登録されている。
例示した差異データ17bは、差異がある領域についてマスク済移行前データ15aおよびマスク済移行後データ16aの領域が登録されている。(わかりやすさのため、差異データ17aおよび差異データ17bの表示例では、項目を区別する線を表示している。)
ステップS25で、表示部3がこれらいずれかの差異データ17に基づき該当の処理名と差異領域を表示することにより、管理者は本来見つけなければならない、差異データを画像データとして効率的に抽出し、必要な対策を講じることができる。
画像データの比較処理の方が文字データの比較より効率的であることが見込める場合、本実施の形態での処理方法は、差異データ抽出装置100の処理負荷軽減としても有効になる。
1 データ収集部、2 マスク設定部、3 表示部、4 マスク処理部、5 データ比較部、11 移行前データ、12 移行後データ、13 マスク候補情報、14 マスク設定情報、15 マスク済移行前データ、16 マスク済移行後データ、17 差異データ、100 差異データ抽出装置、120 差異データ抽出プログラム、200 移行前サーバ、300 移行後サーバ、400 ネットワーク、500 管理者向け設定画面。

Claims (9)

  1. 第1のデータと第2のデータとの差異データを抽出する差異データ抽出装置であって、
    上記第1のデータに含まれる同一処理からの出力である複数データの差異を差異ありデータとしてマスク候補情報に記憶し、上記マスク候補情報に基づき差異ありデータとしないマスクデータをマスク設定情報に登録するマスク設定部と、
    上記第1のデータおよび上記第2のデータのうち、上記マスク設定情報に登録されたマスクデータに含まれる部分についてデータマスク処理を行うマスク処理部とを
    備えた差異データ抽出装置。
  2. さらに、
    上記マスク処理部がデータマスク処理を行った、マスク済第1のデータとマスク済第2のデータとのデータ比較を行い、差異データを出力するデータ比較部
    を備えたことを特徴とする請求項1に記載の差異データ抽出装置。
  3. 上記第1のデータおよび上記第2のデータは文字データであり、上記マスクデータは項目を特定する情報であり、
    上記マスク処理部が行うデータマスク処理とは、上記第1のデータおよび上記第2のデータのうち、上記マスクデータに含まれる項目の値を予め定めた値に変換することを特徴とする請求項1または2に記載の差異データ抽出装置。
  4. 上記第1のデータおよび上記第2のデータは文字データであり、上記マスクデータは項目を特定する情報であり、
    上記マスク処理部が行うデータマスク処理とは、上記マスクデータに含まれる項目と項目の値とを上記第1のデータおよび上記第2のデータから除外することを特徴とする請求項1または2に記載の差異データ抽出装置。
  5. 上記第1のデータ、上記第2のデータ、および上記マスクデータは画像データであり、
    上記マスク処理部が行うデータマスク処理とは、上記マスクデータに含まれる画像データに基づき、上記第1のデータおよび上記第2のデータの所定領域を所定の色に変換することを特徴とする請求項1または2に記載の差異データ抽出装置。
  6. 上記第1のデータとは移行前サーバで動作する所定処理からの出力データであり、上記第2のデータとは移行後サーバで動作する上記所定処理と同等の処理からの出力データであることを特徴とする請求項1〜5のいずれか1項に記載の差異データ抽出装置。
  7. さらに、
    管理者から上記マスク設定情報に関する指定を受け付ける画面を表示し、上記データ比較部が出力した上記差異データを表示する表示部と
    を備えたことを特徴とする請求項2に記載の差異データ抽出装置。
  8. コンピュータを、請求項1〜7のいずれか1項に記載の差異データ抽出装置として機能させる差異データ抽出プログラム。
  9. マスク設定部が、第1のデータに含まれる同一処理からの出力である複数データの差異を差異あり項目としてマスク候補情報に記憶し、管理者からの指定に基づき上記マスク候補情報から差異ありデータとしないマスクデータをマスク設定情報に登録するステップと、
    マスク処理部が、上記第1のデータと第2のデータのうち、上記マスク設定情報に登録されたマスクデータに含まれる部分についてデータマスク処理を行うステップとを
    備えた差異データ抽出方法。
JP2018085812A 2018-04-26 2018-04-26 差異データ抽出装置、差異データ抽出プログラムおよび差異データ抽出方法 Active JP6527984B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018085812A JP6527984B1 (ja) 2018-04-26 2018-04-26 差異データ抽出装置、差異データ抽出プログラムおよび差異データ抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018085812A JP6527984B1 (ja) 2018-04-26 2018-04-26 差異データ抽出装置、差異データ抽出プログラムおよび差異データ抽出方法

Publications (2)

Publication Number Publication Date
JP6527984B1 true JP6527984B1 (ja) 2019-06-12
JP2019192038A JP2019192038A (ja) 2019-10-31

Family

ID=66821532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018085812A Active JP6527984B1 (ja) 2018-04-26 2018-04-26 差異データ抽出装置、差異データ抽出プログラムおよび差異データ抽出方法

Country Status (1)

Country Link
JP (1) JP6527984B1 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4093426B2 (ja) * 2005-07-06 2008-06-04 大日本印刷株式会社 検査装置、検査方法
JP2015141472A (ja) * 2014-01-27 2015-08-03 株式会社東芝 情報処理装置及び情報処理プログラム

Also Published As

Publication number Publication date
JP2019192038A (ja) 2019-10-31

Similar Documents

Publication Publication Date Title
US8751465B2 (en) Document management apparatus, document management system, and document management method
JP6260130B2 (ja) ジョブ遅延検知方法、情報処理装置、およびプログラム
US9002877B2 (en) Quick font match
US20160098390A1 (en) Command history analysis apparatus and command history analysis method
US10769216B2 (en) Data acquisition method, data acquisition apparatus, and recording medium
JP4591229B2 (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JPWO2018066661A1 (ja) ログ分析方法、システムおよび記録媒体
CN109933502A (zh) 电子装置、用户操作记录的处理方法和存储介质
CN112650909A (zh) 产品展示方法、装置、电子设备及存储介质
JP6527984B1 (ja) 差異データ抽出装置、差異データ抽出プログラムおよび差異データ抽出方法
JP7235110B2 (ja) 操作ログ取得装置、操作ログ取得方法および操作ログ取得プログラム
JP5355497B2 (ja) 成果物管理装置、成果物管理方法及び成果物管理プログラム
JP2020197777A (ja) 監視装置、および監視システム
WO2019225007A1 (ja) 入力ミス検知装置、入力ミス検知方法および入力ミス検知プログラム
US20230367884A1 (en) Cyber attack scenario generation method and device
KR20220073951A (ko) 블룸필터를 이용한 분산식별자 검색 방법
US8788537B2 (en) Computer readable medium storing information processing program, information processing apparatus, and information processing method
JP2011059864A (ja) 画像処理装置及び画像処理プログラム
US20210356947A1 (en) Information processing apparatus, information processing method and computer readable medium
WO2023105696A1 (ja) 情報付与装置、情報付与方法及び情報付与プログラム
US20180081951A1 (en) Information generation system, a method and a non-transitory computer readable medium thereof
JP6455087B2 (ja) 帳票情報処理プログラム、帳票情報処理装置、および帳票情報処理方法
US12124353B2 (en) Operation logs acquiring device, operation logs acquiring method, and operation logs acquiring program
EP4435688A1 (en) Information processing apparatus, information processing program, and information processing method
US20240045416A1 (en) Logging support apparatus, logging system, method for logging support, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190513

R150 Certificate of patent or registration of utility model

Ref document number: 6527984

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250