JP2011197844A - Difference detection system - Google Patents

Difference detection system Download PDF

Info

Publication number
JP2011197844A
JP2011197844A JP2010061776A JP2010061776A JP2011197844A JP 2011197844 A JP2011197844 A JP 2011197844A JP 2010061776 A JP2010061776 A JP 2010061776A JP 2010061776 A JP2010061776 A JP 2010061776A JP 2011197844 A JP2011197844 A JP 2011197844A
Authority
JP
Japan
Prior art keywords
difference
format
difference detection
document data
detection system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010061776A
Other languages
Japanese (ja)
Inventor
Takashi Oshima
敬志 大島
Yuji Sumiya
有司 角谷
Toshihiko Kashiyama
俊彦 樫山
Hiroshige Fujiwara
啓成 藤原
Yuichi Mori
森  有一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2010061776A priority Critical patent/JP2011197844A/en
Publication of JP2011197844A publication Critical patent/JP2011197844A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To mechanically display the cause of a difference between a plurality of documents, regarding the operation of analyzing the cause if there is a difference.SOLUTION: The difference detection system includes: a means for inputting a plurality of document data; a means for detecting information about the formats of the plurality of document data input; a means for comparing the plurality of document data input, and extracting a difference between the formats in the document data; and a means for specifying the information corresponding to the extracted difference among the pieces of information about the formats, and specifying the cause of the difference using the specified information.

Description

本発明は、いわゆる文書データ、特に、帳票データ等の書式のデータを扱う技術に関し、その中でも特に、複数の文書間での差分(相違)を検知するための技術に関する。この文書データには、帳票データが含まれ、帳票システム(作成)が新システムへ移行する場合の帳票の変更を確認するための技術にも関する。なお、技術の適用先として、金融、流通、産業などの各分野に渡る。   The present invention relates to a technique for handling so-called document data, in particular, data in a format such as form data, and more particularly to a technique for detecting a difference (difference) between a plurality of documents. This document data includes form data, and also relates to a technique for confirming a form change when the form system (creation) is transferred to the new system. The technology is applied to various fields such as finance, distribution, and industry.

金融、流通、産業などで利用されている文書システム、特に、帳票システムとは、業務アプリケーション、基幹システム、パッケージシステム等のデータを入力とし、作業者が事前に定義した書式にそのデータをマッピングし、紙、pdf、excel等の形式で帳票を出力するシステムである。作業者が事前に定義する内容として、文字の入力や罫線や網掛けや図形等の描画定義、帳票に取り込むデータを表示位置定義などが挙げられる。以下、作業者が事前に定義する情報を書式定義、帳票システムの入力となるデータを業務データと呼ぶ。   Document systems used in finance, distribution, industry, etc., especially form systems, input data from business applications, core systems, package systems, etc., and map the data to a format predefined by the operator. , Paper, pdf, excel and other forms output system. Examples of the contents defined in advance by the operator include character input, ruled lines, shading, graphic drawing definitions, and display position definition of data to be imported into a form. Hereinafter, information defined in advance by the operator is referred to as format definition, and data that is input to the form system is referred to as business data.

帳票システムを新システムに移行する際、新システムで作成された帳票が旧システムで作成された帳票と同様に出力されているかを検証する作業を行うことで、新システムに正しく移行されているかを確認している。具体的には、新旧システムのふたつの帳票を人力で比較し、新システムの移行に伴い帳票生成用の部を変更していた場合は変更したとおりに出力されていること、変更していない個所は旧システムの帳票と同じに出力されていること、を都度確認している。   When the form system is migrated to the new system, it is verified whether the form created in the new system is output in the same way as the form created in the old system. I have confirmed. Specifically, the two forms of the new and old systems are compared manually, and if the part for generating forms is changed with the migration of the new system, it is output as it is changed, and the parts that have not been changed Confirms that it is output in the same way as the form of the old system.

一方、スキャナ(OCR)で取り込んだ文書について、文書画像のマッチング(比較)を行う技術が特許文献1に開示されている。   On the other hand, Patent Document 1 discloses a technique for matching (comparing) document images with a document captured by a scanner (OCR).

特開2000−285139号公報JP 2000-285139 A

上述した内容では、人力による比較を行っているため、作業者に作業負荷が掛かることや見落としが発生する可能性が残る。これを回避するために、特許文献1を適用し、ふたつの帳票を電子化して違いのある部分を自動的に検出することが考えられる。   In the above-described contents, since comparison is performed by human power, there is a possibility that a work load is applied to the worker and oversight may occur. In order to avoid this, it is conceivable to apply Patent Document 1 and digitize two forms to automatically detect a difference.

しかし、特許文献1では、同じ文書が画像データとして格納されているかを確認することで、二重登録を防止するためのものであり、そもそも差分(相違)を検出することはできない。また、仮に差分を検出しても、その要因を分析する作業は人力で行うため、作業負荷は高いままである。なお、差分の要因を分析する作業とは、新旧帳票の差分が発生することを前提として作業者が意図的に書式定義を変更したために発生した仕様なのか、新システムのプログラムのバグや書式定義の設定間違いにより発生したバグなのか、を判断する作業、及びバグと判断された差分に対して影響を与えているプログラムや書式定義を抽出する作業のことである。以下、これらの作業を差分要因分析作業と呼ぶ。   However, in Patent Document 1, it is for preventing double registration by confirming whether the same document is stored as image data, and a difference (difference) cannot be detected in the first place. Even if a difference is detected, the work for analyzing the factor is performed manually, so the work load remains high. Whether the work of analyzing the cause of the difference is a specification that occurs because the worker deliberately changed the format definition on the assumption that a difference between the old and new forms occurs, or a bug in the new system or a format definition This is the work of determining whether or not a bug has occurred due to a setting error, and the work of extracting a program or format definition that affects the difference determined to be a bug. Hereinafter, these operations are referred to as difference factor analysis operations.

本発明は、2以上の文書(特に、帳票)で生じた差分について、その発生の要因を特定するものである。この際、要因を各文書の作成システムに関する情報や当該文書の定義情報を用いて判断することが好適である。また、対象とする文書が、旧システムとこれから移行された新システムでそれぞれ作成されるものの場合、作成システムに関する情報として、この移行に伴い変更した作業のログを用いることがより好適である。また、定義情報として、帳票の生成のために定義される書式定義を用いることも本発明の一態様である。   The present invention specifies a cause of occurrence of a difference generated in two or more documents (particularly, a form). At this time, it is preferable to determine the factor by using information related to each document creation system and definition information of the document. In addition, when the target document is created by the old system and the new system migrated from now on, it is more preferable to use a log of the work changed along with the migration as information on the creation system. In addition, it is an aspect of the present invention to use a format definition defined for generating a form as the definition information.

本発明により、複数の文書で差分があった場合にその要因を分析する作業に関して、その要因を機械的に表示可能となるため、人力での作業が削減される。   According to the present invention, when there is a difference in a plurality of documents, the factor can be mechanically displayed with respect to the task of analyzing the factor, so that the manual work is reduced.

本発明の一実施の形態である新システムと旧システムで生成された帳票を比較する帳票目検システムに関する第1の実施例の概要を示す構成図である。It is a block diagram which shows the outline | summary of the 1st Example regarding the form inspection system which compares the form produced | generated by the new system which is one embodiment of this invention, and an old system. 第1の実施例において、新システムと旧システムで生成された帳票を比較する場合のフローチャート図である。FIG. 10 is a flowchart for comparing forms generated by the new system and the old system in the first embodiment. 業務データの構成である。This is the structure of business data. 書式定義の構成である。This is the structure of the format definition. 書式変更ログの構成である。This is the format change log configuration. 第1の実施例において、新システムの帳票生成サーバの生成する帳票である新システム帳票データの例である。In the first embodiment, it is an example of new system form data which is a form generated by the form generation server of the new system. 書式定義座標の構成である。It is a structure of format definition coordinates. 第1の実施例において、旧システムの帳票生成サーバの生成する帳票である旧システム帳票データの例である。In the first embodiment, it is an example of old system form data which is a form generated by the form generation server of the old system. 新旧帳票差分結果の構成である。It is a structure of a new and old form difference result. 差分要因分析結果の構成である。It is a structure of a difference factor analysis result. 第1の実施例において、差分要因結果を作業者に表示する画面の例である。In a 1st Example, it is an example of the screen which displays a difference factor result to an operator.

図1は、実施例1における帳票目検システムの構成図である。帳票目検システムは、帳票を生成する計算機1と旧システムの帳票と差分を比較する計算機2とからなり、これらはネットワーク等を介して接続される。この構成は実施例1の場合の例であり、ひとつの計算機の中に帳票を生成する機能と差分の要因を分析する機能とが存在する場合、計算機1もしくは計算機2が複数存在する場合もありえる。   FIG. 1 is a configuration diagram of a form inspection system according to the first embodiment. The form inspection system includes a computer 1 that generates a form and a computer 2 that compares a form with a form of an old system, and these are connected via a network or the like. This configuration is an example in the case of the first embodiment, and when a function for generating a form and a function for analyzing a difference factor exist in one computer, there may be a plurality of computers 1 or 2. .

帳票を生成する計算機1は、CPU10、メインメモリ11、記憶装置12、入力装置13、出力装置14、及び通信インタフェース15とからなる計算機であり、これらは内部バス等により接続される。CPU10は、記憶装置12に格納されている部をメインメモリ11に読み込み、実行することにより、種々の処理を行う。記憶装置12は、帳票を生成する帳票生成部101、書式定義を作成する書式作成部102、帳票の文字の入力や罫線や網掛けや図形等の描画定義や帳票に取り込むデータを表示位置定義などの帳票の書式の定義となる書式定義103、業務アプリケーションなどから出力されて帳票に表示するデータとなる業務データ104、書式作成部で変更した作業内容を保存した書式変更ログ105、pdfやexcel等といった出力される帳票の電子データとなる新システム帳票データ106、書式として定義された内容が帳票のどの座標に出力されたかを保存する書式定義座標107を格納している。なお、書式定義座標107としては、帳票中の位置を特定する情報であれば構わない。以下、帳票を生成する計算機を帳票生成サーバと呼ぶ。   A computer 1 that generates a form is a computer including a CPU 10, a main memory 11, a storage device 12, an input device 13, an output device 14, and a communication interface 15, and these are connected by an internal bus or the like. The CPU 10 performs various processes by reading the unit stored in the storage device 12 into the main memory 11 and executing it. The storage device 12 includes a form generation unit 101 that generates a form, a format generation unit 102 that generates a form definition, a character definition of a form, a drawing definition of ruled lines, shading, and graphics, and a display position definition of data to be imported into the form Format definition 103 which is the format definition of the form, business data 104 which is output from the business application and displayed on the form, format change log 105 which stores the work contents changed in the format creation unit, pdf, excel, etc. The new system form data 106, which is electronic data of the output form, and the format definition coordinates 107 for storing the coordinates of the contents defined as the form are output. The format definition coordinates 107 may be any information that specifies the position in the form. Hereinafter, a computer that generates a form is referred to as a form generation server.

旧システムの帳票と差分を比較する計算機2は、CPU20、メインメモリ21、記憶装置22、入力装置23、出力装置24、及び通信インタフェース25とからなる計算機であり、これらは内部バス等により接続される。記憶装置22に格納されている部をメインメモリ21に読み込み、実行することにより、種々の処理を行う。記憶装置22は、新システムで生成される新システム帳票データ106と後述する旧システムで生成される旧システム帳票データ114を比較し差分を抽出する差分抽出部111、抽出された差分に該当する書式定義の情報を抽出する差分要因分析部112、作業者に差分要因分析部112の結果を表示する差分要因表示部113、旧システムで生成された帳票の電子データもしくは旧システムで生成された紙の帳票をスキャナ等で電子データ化した旧システム帳票データ114、新システム帳票データ106と旧システム帳票データ114を比較して発生した差分の座標とその帳票名を格納した新旧帳票差分結果115、新旧帳票差分結果115に格納された差分の情報と書式定義を対応づけた差分要因分析結果116を格納している。以下、旧システムの帳票と差分を比較する計算機2を帳票比較サーバと呼ぶ。   The computer 2 for comparing the difference with the form of the old system is a computer comprising a CPU 20, a main memory 21, a storage device 22, an input device 23, an output device 24, and a communication interface 25, which are connected by an internal bus or the like. The Various processes are performed by reading a part stored in the storage device 22 into the main memory 21 and executing it. The storage device 22 compares the new system form data 106 generated in the new system with the old system form data 114 generated in the old system, which will be described later, and extracts a difference, and a format corresponding to the extracted difference Difference factor analysis unit 112 that extracts definition information, difference factor display unit 113 that displays a result of the difference factor analysis unit 112 to the worker, electronic data of a form generated in the old system, or paper generated in the old system Old system form data 114 obtained by converting the form into electronic data using a scanner, the new system form data 106 and the old system form data 114 are compared and the difference coordinates generated by comparing the old system form data 114 and the form name are stored. The difference factor analysis result 116 in which the difference information stored in the difference result 115 is associated with the format definition is stored. Hereinafter, the computer 2 that compares the difference with the old system form is referred to as a form comparison server.

図2は、帳票生成部101が新システム帳票106を生成し、差分抽出部111が旧システム帳票114との比較を行い、差分要因分析部112が差分の要因を分析し、差分要因表示部113が差分の要因を表示するフローチャートである。この表示によって、作業者が要因を確認することが可能になる。また、本フローチャートは、上述の各装置のCPUがプログラムに従ってその処理を実行するものである。   In FIG. 2, the form generation unit 101 generates a new system form 106, the difference extraction unit 111 performs comparison with the old system form 114, the difference factor analysis unit 112 analyzes a difference factor, and a difference factor display unit 113. Is a flowchart for displaying the cause of the difference. This display allows the operator to confirm the factor. Further, in this flowchart, the CPU of each device described above executes the processing according to the program.

ステップ201では、作業者の書式作成部102に対する操作を受け付け、業務アプリケーションの生成する業務データ104に基づいて書式定義103を作成する。作業者が書式作成部102を操作する方法は一般的な帳票生成ツールと同様であり、GUIによるフォームの位置や属性の設定、業務データ104の表示位置の設定などを行う。以下、業務データ104と書式定義103の具体例を図3と図4で述べる。   In step 201, the operator's operation on the format creation unit 102 is received, and a format definition 103 is created based on the business data 104 generated by the business application. The method of operating the form creation unit 102 by the operator is the same as that of a general form generation tool, and setting of the position and attribute of the form and setting of the display position of the business data 104 are performed by the GUI. Specific examples of the business data 104 and the format definition 103 will be described below with reference to FIGS.

業務データ104は、業務アプリケーション、基幹システム、パッケージシステム等から出力されるデータのことであり、図3では、業務アプリケーションから出力されたcsvファイルを例としており、ファイル名をP、格納されているデータは各列が2カラムで構成される3列のデータである。   The business data 104 is data output from a business application, backbone system, package system, etc. In FIG. 3, the csv file output from the business application is taken as an example, and the file name is stored as P. The data is three columns of data each having two columns.

書式定義103は、文字の入力や罫線や網掛けや図形等の描画定義、帳票に取り込む業務データ104の表示位置などを格納している。図4に書式定義103の例を示す。書式定義103には、帳票名401、帳票のレイアウトを定めたレイアウト定義402、レイアウトを構成するフォームの詳細を示すフォーム定義403、業務データ104をどのフォームに表示するかという表示位置定義404が格納されている。図4では、帳票名Qに関する書式定義を例としており、帳票Qのレイアウト定義と8個のフォーム定義と6個の表示位置定義を記述している。フォーム定義403に関して、フォームAは外枠、フォームBは表、フォームCからフォームHまではテキストボックスであり、線種、線の太さ、塗りつぶし色、フォントのサイズ、フォントの色、フォントの種類、文字寄せ方法等をフォームごとに設定している。表示位置定義404に関して、フォームCからフォームHに図3で示したファイルPの情報を各フォームに割り当てている。図4では、レイアウト定義402をグラフィカルに表示しているが、実際には、各フォームの起点となる座標、各フォームの縦横の長さ等が定義されている。なお、レイアウト定義402とフォーム定義403は、一般的な描画ツール(ソフトウエア)においてGUI操作で画面を作成する際に定義する情報と同様である。   The format definition 103 stores input definitions of characters, ruled lines, drawing definitions such as shading, graphics, and the like, the display position of the business data 104 to be imported into the form, and the like. FIG. 4 shows an example of the format definition 103. The form definition 103 stores a form name 401, a layout definition 402 that defines the layout of the form, a form definition 403 that shows the details of the forms constituting the layout, and a display position definition 404 that indicates which form the business data 104 is displayed on. Has been. In FIG. 4, the format definition for the form name Q is taken as an example, and the layout definition of the form Q, 8 form definitions, and 6 display position definitions are described. Regarding form definition 403, form A is an outer frame, form B is a table, form C to form H are text boxes, line type, line thickness, fill color, font size, font color, font type , Character alignment method is set for each form. With respect to the display position definition 404, the information of the file P shown in FIG. In FIG. 4, the layout definition 402 is graphically displayed, but actually, the coordinates of the starting point of each form, the vertical and horizontal lengths of each form, and the like are defined. The layout definition 402 and the form definition 403 are the same as the information defined when creating a screen by GUI operation in a general drawing tool (software).

また、旧帳票と同じ形式で新帳票を作成するために書式定義を変更しているのか、新旧帳票の差分が発生することを前提として書式定義を変更しているのかを区別するために、書式作成部102は書式変更ログ105を作成する。なお、旧帳票と同じ形式で新帳票を作成するために書式定義を変更している場合を移行要件による変更、新旧帳票の差分が発生することを前提として書式定義を変更している場合を新規要件による変更と呼ぶ。   In order to distinguish whether the format definition has been changed to create a new form in the same format as the old form, or whether the format definition has been changed on the assumption that a difference between the old and new forms will occur. The creation unit 102 creates the format change log 105. If the format definition has been changed to create a new form in the same format as the old form, the change is due to migration requirements, and the format definition has been changed on the assumption that a difference between the old and new forms will occur. This is called a change by requirement.

書式変更ログ105の例を図5に示す。変更作業を識別する変更ID501、変更作業の対象となる帳票名502、変更作業の対象となるフォーム名503、変更作業の詳細を記述した操作内容504、移行要件による変更なのか新規要件による変更なのかを記述した変更要件505が格納されている。図5は帳票PのフォームCに関する変更作業の一覧であり、移行要件に基づき文字寄せを中央とし、新規要件に基づきフォントサイズを12にし、フォントを明朝にしている。なお、図5は、旧帳票システムの書式定義から書式定義変換ツールを用いて書式定義103に格納する各フォームのレイアウト定義や表示位置定義等を生成し、その後に作業者が微調整を行っている場合を想定している。もし、書式定義変換ツールを適用しない場合、作業者が各フォームのレイアウト定義や表示位置定義等の変更を行うため、書式変更ログ105にそれらの変更も登録される。   An example of the format change log 105 is shown in FIG. A change ID 501 for identifying a change work, a form name 502 to be changed, a form name 503 to be changed, an operation content 504 describing details of the change work, a change due to a migration requirement or a change due to a new requirement The change requirement 505 describing whether or not is stored. FIG. 5 is a list of changes related to the form C of the form P. The character alignment is set to the center based on the transition requirement, the font size is set to 12 based on the new requirement, and the font is set to the Mincho. In FIG. 5, the layout definition and display position definition of each form stored in the format definition 103 is generated from the format definition of the old form system using the format definition conversion tool, and then the operator performs fine adjustment. Assumes that If the format definition conversion tool is not applied, the operator changes the layout definition and display position definition of each form, and those changes are also registered in the format change log 105.

書式作成部102は、作業者の操作ごとに変更ID501、帳票名502、フォーム名503、操作内容504を登録する。変更要件505は、作業者が書式作成部への操作ごとに都度定義する。もしくは、書式作成部102の操作の後、新規要件による変更と移行要件による変更を区別するためのルールを登録し、そのルールに従って変更要件505を入力してもよい。例えば、旧帳票はフォントが全てゴジック体だが、新帳票の文字は明朝体にするという新規の要件が発生していた場合、フォームのフォントを明朝体に変更している変更ログの変更要件505は新規とする。   The form creation unit 102 registers the change ID 501, form name 502, form name 503, and operation content 504 for each operation by the worker. The change requirement 505 is defined each time the operator operates the form creation unit. Alternatively, after the operation of the format creation unit 102, a rule for distinguishing a change due to a new requirement and a change due to a migration requirement may be registered, and the change requirement 505 may be input according to the rule. For example, if there is a new requirement that the fonts of the old form are all Gothic fonts, but the characters of the new form are Mincho type, the change log change requirement that changes the form font to Mincho type 505 is assumed to be new.

ステップ202では、帳票生成部101が書式定義103と業務データ104に基づき新システム帳票データ106と書式定義座標107を生成する。図6は新システム帳票データ106の例であり、図3で示した業務データ104の例と図4で示した書式定義104の例に基づいて生成される新システム帳票データである。図7は書式定義座標107の例である。生成される帳票名701、生成される帳票に定義されたフォーム名702、フォームの種類を表すフォーム属性703、各フォームが新システム帳票データ106のどこに表示されているかを示すフォーム座標704が格納されている。フォーム属性703は、テキストボックスや図形といったフォームの種類のことである。フォーム座標704は、新システム帳票データ106の出力媒体に対応した各フォームの表示位置の座標のことであり、XYの座標が(10、20)、(10、200)、(100、20)、(100、200)の四点で構成される四角形であれば、(10、20、100、200)と表示する。帳票生成部101は、新システム帳票データ106を生成する際、新システム帳票データ106の出力媒体に対応した座標704をフォームごとに取得し、帳票名701とフォーム名702とフォーム属性703とあわせて登録する。例えば、出力媒体がpdfの場合、pdfで指定した座標をフォームごとに取得し、書式定義座標107に登録する。   In step 202, the form generation unit 101 generates new system form data 106 and format definition coordinates 107 based on the format definition 103 and the business data 104. FIG. 6 shows an example of the new system form data 106, which is new system form data generated based on the example of the business data 104 shown in FIG. 3 and the example of the format definition 104 shown in FIG. FIG. 7 shows an example of the format definition coordinates 107. A generated form name 701, a form name 702 defined in the generated form, a form attribute 703 indicating the type of form, and form coordinates 704 indicating where each form is displayed in the new system form data 106 are stored. ing. The form attribute 703 is a form type such as a text box or a figure. Form coordinates 704 are the coordinates of the display position of each form corresponding to the output medium of the new system form data 106, and the coordinates of XY are (10, 20), (10, 200), (100, 20), If it is a quadrangle composed of four points (100, 200), (10, 20, 100, 200) is displayed. When generating the new system form data 106, the form generation unit 101 acquires coordinates 704 corresponding to the output medium of the new system form data 106 for each form, and combines the form name 701, form name 702, and form attribute 703. sign up. For example, when the output medium is pdf, the coordinates designated by pdf are acquired for each form and registered in the format definition coordinates 107.

ステップ203では、差分抽出部111が新システム帳票データ106と旧システム帳票データ114を比較し、差分となる座標を取得し、新旧帳票差分結果115に登録する。旧システム帳票データ114の例を図8、新旧帳票差分結果115の例を図9に示す。新旧帳票差分結果115は抽出した差分を識別する差分ID901、比較した帳票名902、差分の発生した差分座標903が格納されている。差分抽出部111は、新システム帳票データ106と旧システム帳票データ114を比較し、抽出した差分ごとに新旧帳票差分結果115へ登録を行う。差分抽出部111が図6と図8を比較した場合、「ID」という文字のフォント及びフォントサイズが異なること、「金額」という文字のフォントおよびフォントサイズが異なること、「100000000」という数字のフォントサイズが異なること、の3つの差分を抽出する。次に「ID」、「金額」、「100000000」という文字の表示されている座標を取得し、新旧帳票差分結果115に登録を行う。例えば、「ID」の座標が(30、20、50、30)であれば、差分ID901=1、帳票名902=Q、差分座標903=(30、20、50、30)と登録する。「金額」、「100000000」についても同様である。本実施例では文字の違いを例としているが、線種や線幅等の図形の違いについても同様に差分の発生している座標を取得する。   In step 203, the difference extraction unit 111 compares the new system form data 106 and the old system form data 114, acquires the coordinates that are the difference, and registers them in the new and old form difference result 115. An example of the old system form data 114 is shown in FIG. 8, and an example of the old and new form difference result 115 is shown in FIG. The new and old form difference result 115 stores a difference ID 901 for identifying the extracted difference, a compared form name 902, and a difference coordinate 903 where the difference has occurred. The difference extraction unit 111 compares the new system form data 106 and the old system form data 114 and registers the extracted differences in the new and old form difference result 115. When the difference extraction unit 111 compares FIG. 6 and FIG. 8, the font and font size of the character “ID” are different, the font and font size of the character “money” are different, and the font of the number “100000000” Three differences of different sizes are extracted. Next, the coordinates where the characters “ID”, “money amount”, and “100000000” are displayed are acquired and registered in the new and old form difference result 115. For example, if the coordinates of “ID” are (30, 20, 50, 30), the difference ID 901 = 1, the form name 902 = Q, and the difference coordinates 903 = (30, 20, 50, 30) are registered. The same applies to “amount” and “100000000”. In the present embodiment, the difference in characters is taken as an example, but the coordinates where the difference is generated are similarly acquired for differences in figures such as line type and line width.

なお、システム帳票データ106と旧システム帳票データ114の比較方法はいくつかの従来手法が存在する。例えば、スキャナで取り込んだふたつの帳票を比較して、画像として比較する方法、OCRによる文字の特定を行い比較する方法などである。これらのいずれの方法に関しても、差分の座標を取得することで本特許を適用できる。   There are several conventional methods for comparing the system form data 106 and the old system form data 114. For example, there are a method in which two forms captured by a scanner are compared and compared as an image, a method in which characters are identified by OCR and compared. For any of these methods, this patent can be applied by acquiring the difference coordinates.

ステップ204では、差分要因分析部112が差分の要因を分析し、分析結果を差分要因分析結果116に登録する。図10に差分要因分析結果116の例を示す。差分要因分析結果116は、差分ID1001、帳票名1002、差分の発生した要因と思われるフォームである要因候補フォーム名1003、変更ID1004、操作内容1005、変更要件1006を格納している。   In step 204, the difference factor analysis unit 112 analyzes the difference factor and registers the analysis result in the difference factor analysis result 116. FIG. 10 shows an example of the difference factor analysis result 116. The difference factor analysis result 116 stores a difference ID 1001, a form name 1002, a factor candidate form name 1003, a change ID 1004, an operation content 1005, and a change requirement 1006.

まず、差分要因分析部112は、新旧帳票差分結果115と書式定義座標107とから、抽出した差分ごとにその要因の候補となるフォームを抽出する。具体的には、差分座標903と各フォームのフォーム座標704を比較し、重なる領域が存在するフォームが要因候補フォーム名1003となる。図10では、差分ID=1の差分の差分座標が(30、20、50、30)のため、その領域を含んでいるフォームBとフォームCが要因候補フォーム名として抽出される。同様に、差分ID=2の要因候補フォーム名として、フォームBとフォームF、差分ID=3の要因候補フォーム名として、フォーム名BとフォームHが抽出される。   First, the difference factor analysis unit 112 extracts a candidate form of the factor for each extracted difference from the new and old form difference results 115 and the format definition coordinates 107. Specifically, the difference coordinates 903 and the form coordinates 704 of each form are compared, and the form in which the overlapping area exists becomes the factor candidate form name 1003. In FIG. 10, since the difference coordinates of the difference with the difference ID = 1 are (30, 20, 50, 30), Form B and Form C including the area are extracted as the factor candidate form names. Similarly, form B and form F are extracted as the cause candidate form names with difference ID = 2, and form name B and form H are extracted as the cause candidate form names with difference ID = 3.

次に、差分要因分析部112は、要因候補フォーム名をキーとして、書式変更ログ105から変更ID501と操作内容504と変更要件505とを取得し、変更ID1004と操作内容1005と変更要件1006とを登録する。例えば、差分ID=1の場合、フォームCに該当する変更ID=1、2、3を取得し、差分要因分析結果116に登録する。一方、差分ID=3の場合、フォームHに該当する変更IDは存在しないため、該当なしを表す「−」を登録する。   Next, the difference factor analysis unit 112 acquires the change ID 501, the operation content 504, and the change requirement 505 from the format change log 105 using the factor candidate form name as a key, and obtains the change ID 1004, the operation content 1005, and the change requirement 1006. sign up. For example, when the difference ID = 1, change IDs = 1, 2, and 3 corresponding to the form C are acquired and registered in the difference factor analysis result 116. On the other hand, when the difference ID = 3, since there is no change ID corresponding to the form H, “-” indicating no corresponding is registered.

ステップ205では、作業者が新旧帳票の差分の問合せを差分要因表示部113に行い、結果を作業者に表示する。表示例を図11に示す。図11では、比較している帳票名1101、新旧システムで生成された帳票を比較した比較結果1102、差分の発生した箇所の一覧である差分ID一覧1103、差分ID別に差分の発生した要因となる可能性のある変更作業を一覧表示した差分ID別要因分析1104で構成されている。差分要因表示部113は作業者から選択された帳票名に基づき比較結果1102と差分ID一覧1103を表示する。次に、作業者が差分ID一覧1103や差分結果1102から差分IDを選択し、差分要因表示部113は選択された差分IDに関する変更作業を差分ID別要因分析1104に表示する。   In step 205, the worker makes an inquiry about the difference between the old and new forms in the difference factor display unit 113 and displays the result to the worker. A display example is shown in FIG. In FIG. 11, the form name 1101 being compared, the comparison result 1102 comparing the forms generated by the old and new systems, the difference ID list 1103 that is a list of the places where the difference has occurred, and the cause of the difference for each difference ID. It consists of a factor analysis 1104 for each difference ID that displays a list of possible change operations. The difference factor display unit 113 displays the comparison result 1102 and the difference ID list 1103 based on the form name selected by the operator. Next, the worker selects a difference ID from the difference ID list 1103 and the difference result 1102, and the difference factor display unit 113 displays the change work related to the selected difference ID in the factor analysis 1104 for each difference ID.

比較結果1102に関して、従来も新旧システムで生成されたふたつの帳票をひとつの画面上で比較する方法は存在している。例えば、スキャナで取り込んだ際のずれや歪みを自動補正して本当に違っている部分のみを差分として検出すること、目視では違いがわかりにくい場所などを多角形枠で囲むことで違いを見やすくすること等を行っている。しかし、従来技術では、検出した差分がどのような要因で発生したかを作業者が即座に判断する事はできない。   Regarding the comparison result 1102, there is conventionally a method for comparing two forms generated by the new and old systems on one screen. For example, to automatically correct misalignment and distortion when scanned with a scanner and detect only the really different parts as differences, and to enclose a place where it is difficult to see the difference with a polygonal frame to make the difference easy to see Etc. However, in the prior art, the operator cannot immediately determine what causes the detected difference has occurred.

一方、本実施形態では、差分毎に図10で述べた情報を保持しているため、検出した差分の要因ごとに表示方法を変更する事で、作業者がその要因を即座に判断する事が可能となる。例えば、図11では、作業者が書式定義を変更していないにもかかわらず差分の発生した箇所を赤色枠、そうでない個所を青色枠で表示している。これにより、差分の発生した要因が書式定義を変更したために発生した仕様なのか、システムのプログラムのバグや書式定義の設定忘れにより発生したバグなのかをグラフィカルに判断する事が可能となる。   On the other hand, in this embodiment, since the information described in FIG. 10 is held for each difference, the operator can immediately determine the factor by changing the display method for each factor of the detected difference. It becomes possible. For example, in FIG. 11, a portion where a difference has occurred even though the operator has not changed the format definition is displayed in a red frame, and a portion where the difference has not occurred is displayed in a blue frame. As a result, it is possible to graphically determine whether the cause of the difference is a specification generated due to a change in the format definition, or a bug in the system program or a bug caused by forgetting to set the format definition.

また、本実施形態を適用する事で、あるポリシーに従って変更した書式定義に関連する個所だけを差分結果として表示し、そのポリシーが問題ないかを確認することが可能となる。以下、これまでゴシック体で表示ししていた文字を明朝体にするというポリシーを設定した場合を例として述べる。作業者は、帳票名1002、操作内容1005、変更要件1006の属性値を選択し、差分要因表示部113に問合せを行う。本例であれば、操作内容1005の値を「フォント(明朝)」とし、問合せを行う。差分要因表示部113は、差分要因分析結果116の操作内容1005を検索し、フォントを明朝体に変更した帳票と要因候補フォーム名を抽出し、そのフォームだけを多角形枠で囲み画面に表示する。これにより、ポリシーに該当する差分だけをグラフィカルに表示できるため、作業者の判断が容易となる。   Further, by applying this embodiment, it is possible to display only a portion related to the format definition changed according to a certain policy as a difference result and confirm whether the policy is satisfactory. In the following, an example is described in which a policy has been set in which characters that have been displayed in the Gothic font until now are in the Mincho style. The worker selects the attribute value of the form name 1002, the operation content 1005, and the change requirement 1006, and makes an inquiry to the difference factor display unit 113. In this example, the value of the operation content 1005 is “font (Mincho)” and an inquiry is made. The difference factor display unit 113 retrieves the operation content 1005 of the difference factor analysis result 116, extracts a form whose font is changed to Mincho and a factor candidate form name, and displays only the form in a polygon frame and displays it on the screen. To do. As a result, only the difference corresponding to the policy can be graphically displayed, so that the operator's judgment becomes easy.

なお、本実施形態では、書式変更ログ105が存在する場合を想定している。書式変更ログ105が存在しない場合でも、発生した差分に影響を与えるフォームをグラフィカルに作業者に表示できる。これにより、差分要因分析作業を軽減できる。   In the present embodiment, it is assumed that the format change log 105 exists. Even when the format change log 105 does not exist, a form that affects the generated difference can be graphically displayed to the operator. Thereby, the difference factor analysis work can be reduced.

101帳票生成部
102帳票作成部
103書式定義
104業務データ
105書式変更ログ
106新システム帳票データ
107書式定義座標
111差分抽出部
112差分要因分析部
113差分要因表示部
114旧システム帳票データ
115新旧帳票差分結果
116差分要因分析結果
101 form generation unit 102 form creation unit 103 format definition 104 business data 105 format change log 106 new system form data 107 format definition coordinate 111 difference extraction unit 112 difference factor analysis unit 113 difference factor display unit 114 old system form data 115 new and old form difference Result 116 Difference factor analysis result

Claims (12)

複数の文書データにおける書式の差分を検知する差分検知システムにおいて、
前記複数の文書データを入力する手段と、
入力された前記複数の文書データのそれぞれの書式に関する情報を検出する手段と、
入力された前記複数の文書データのそれぞれを比較して、文書データにおける書式の差分を抽出する手段と、
前記書式に関する情報のうち、抽出された前記差分に対応する情報を特定して、特定された情報を用いて、前記差分の要因を特定する手段を有することを特徴とする差分検知システム。
In the difference detection system that detects the format difference in multiple document data,
Means for inputting the plurality of document data;
Means for detecting information relating to the format of each of the plurality of input document data;
Means for comparing each of the plurality of input document data and extracting a format difference in the document data;
A difference detection system comprising: means for identifying information corresponding to the extracted difference among the information relating to the format, and identifying a factor of the difference using the identified information.
請求項1に記載の差分検知システムにおいて、
前記書式に関する情報には、前記文書データの書式を定義する定義情報および前記文書データを作成する装置に関する情報が含まれることを特徴とする差分検知システム。
The difference detection system according to claim 1,
The information relating to the format includes definition information defining a format of the document data and information relating to an apparatus that creates the document data.
請求項2に記載の差分検知システムにおいて、
前記文章データを作成する装置に関する情報は、当該装置が移行する際の作業ログであることを特徴とする差分検知システム。
The difference detection system according to claim 2,
The difference detection system according to claim 1, wherein the information related to the device that creates the text data is a work log when the device moves.
請求項2または3のいずれかに記載の差分検知システムにおいて、
前記定義情報として、前記文書データである帳票の定義情報を用いることを特徴とする差分検知システム。
In the difference detection system according to claim 2 or 3,
A difference detection system using the definition information of a form which is the document data as the definition information.
請求項1乃至4のいずれかに記載の差分検知システムにおいて
さらに、
利用者の指定による前記文書データの書式の変更内容を保存する手段と、
前記抽出する手段により抽出される前記書式の変更により発生した差分と書式の変更によらずに発生した差分の双方をに表示する手段と有することを特徴とした差分検知システム。
The difference detection system according to any one of claims 1 to 4, further comprising:
Means for storing changes in the format of the document data specified by the user;
A difference detection system comprising: a means for displaying both the difference generated by the format change extracted by the extracting means and the difference generated without the format change.
請求項5に記載の差分検知システムにおいて、
当該差分検知システムを利用する作業者から書式の変更内容の選択を受け付ける手段をさらに有し、
前記表示する手段は、前記作業者から受け付けた書式の変更内容をキーとして検索を行うことで該当する箇所を表示することを特徴とした差分検知システム。
The difference detection system according to claim 5,
A means for accepting selection of format change content from an operator who uses the difference detection system;
The difference detection system according to claim 1, wherein the display means displays a corresponding portion by performing a search using a format change received from the worker as a key.
複数の文書データにおける書式の差分を検知する差分検知方法において、
前記複数の文書データを入力するステップと、
入力された前記複数の文書データのそれぞれの書式に関する情報を検出するステップと、
入力された前記複数の文書データのそれぞれを比較して、文書データにおける書式の差分を抽出するステップと、
前記書式に関する情報のうち、抽出された前記差分に対応する情報を特定して、特定された情報を用いて、前記差分の要因を特定するステップを有することを特徴とする差分検知方法。
In a difference detection method for detecting a format difference in a plurality of document data,
Inputting the plurality of document data;
Detecting information on each format of the plurality of input document data;
Comparing each of the plurality of input document data to extract a format difference in the document data; and
A difference detection method comprising: identifying information corresponding to the extracted difference among information relating to the format, and identifying the factor of the difference using the identified information.
請求項7に記載の差分検知方法において、
前記書式に関する情報には、前記文書データの書式を定義する定義情報および前記文書データを作成する装置に関する情報が含まれることを特徴とする差分検知方法。
The difference detection method according to claim 7,
The difference detection method, wherein the information related to the format includes definition information that defines a format of the document data and information related to an apparatus that creates the document data.
請求項8に記載の差分検知方法において、
前記文章データを作成する装置に関する情報は、当該装置が移行する際の作業ログであることを特徴とする差分検知方法。
The difference detection method according to claim 8,
The difference detection method according to claim 1, wherein the information related to the device that creates the text data is a work log when the device is transferred.
請求項8または9のいずれかに記載の差分検知方法において、
前記定義情報として、前記文書データである帳票の定義情報を用いることを特徴とする差分検知方法。
In the difference detection method in any one of Claim 8 or 9,
A difference detection method characterized in that definition information of a form which is the document data is used as the definition information.
請求項6乃至10のいずれかに記載の差分検知方法において
さらに、
利用者の指定による前記文書データの書式の変更内容を保存するステップと、
前記抽出するステップにより抽出される前記書式の変更により発生した差分と書式の変更によらずに発生した差分の双方をに表示するステップと有することを特徴とした差分検知方法。
The difference detection method according to claim 6, further comprising:
Storing changes in the format of the document data as specified by the user;
A difference detection method comprising: displaying both the difference generated by the format change extracted by the extracting step and the difference generated without the format change.
請求項11に記載の差分検知方法において、
当該差分検知システムを利用する作業者から書式の変更内容の選択を受け付けるステップをさらに有し、
前記表示するステップは、前記作業者から受け付けた書式の変更内容をキーとして検索を行うことで該当する箇所を表示することを特徴とした差分検知方法。
The difference detection method according to claim 11,
The method further includes a step of accepting selection of format change content from an operator who uses the difference detection system,
The difference detection method characterized in that the displaying step displays a corresponding portion by performing a search using a change in format received from the worker as a key.
JP2010061776A 2010-03-18 2010-03-18 Difference detection system Pending JP2011197844A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010061776A JP2011197844A (en) 2010-03-18 2010-03-18 Difference detection system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010061776A JP2011197844A (en) 2010-03-18 2010-03-18 Difference detection system

Publications (1)

Publication Number Publication Date
JP2011197844A true JP2011197844A (en) 2011-10-06

Family

ID=44875997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010061776A Pending JP2011197844A (en) 2010-03-18 2010-03-18 Difference detection system

Country Status (1)

Country Link
JP (1) JP2011197844A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014021507A (en) * 2012-07-12 2014-02-03 Hitachi Ltd Business form compare verification method
JP5461716B1 (en) * 2013-01-10 2014-04-02 中国電力株式会社 Program verification system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014021507A (en) * 2012-07-12 2014-02-03 Hitachi Ltd Business form compare verification method
JP5461716B1 (en) * 2013-01-10 2014-04-02 中国電力株式会社 Program verification system

Similar Documents

Publication Publication Date Title
JP2007279828A (en) Business form processor, business form format preparation device, business form, program for processing business form and program for preparing business form format
US11303769B2 (en) Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
JP2016024528A (en) Information processor, program and digital plate inspection method
JP2008145611A (en) Information processor and program
US8548250B2 (en) Information processing apparatus and information processing method
JP6531368B2 (en) INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING DEVICE, PROCESSING METHOD, AND PROGRAM
JP6150766B2 (en) Information processing apparatus, program, and automatic page replacement method
JP5491774B2 (en) Data entry system and data entry method
JP2012203491A (en) Document processing device and document processing program
CN112417826B (en) PDF online editing method and device, electronic equipment and readable storage medium
JP4983464B2 (en) Form image processing apparatus and form image processing program
JP2011197844A (en) Difference detection system
CN107861931B (en) Template file processing method and device, computer equipment and storage medium
JP2014146253A (en) Image processing system, image processing method and image processing program
JP6619891B2 (en) Screen test apparatus and screen test program
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
JP2021047688A (en) Form recognition method and program
JP7404943B2 (en) Information processing device and information processing program
JP6149697B2 (en) Information processing apparatus and information processing program
JP2020030722A (en) Document image processing system, document image processing method, and document image processing program
US20230079441A1 (en) Apparatus and Method of Re-Ordering Drawing Blocks on a Slide of a User Interface Canvas
US11462014B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2018085093A (en) Information processing apparatus, control method, and program
JP2011010227A (en) Information embedding device, input detector, information embedding method, input detection method, program and storage medium