JP2010218386A - Method of matching data between business models and computer program - Google Patents
Method of matching data between business models and computer program Download PDFInfo
- Publication number
- JP2010218386A JP2010218386A JP2009066307A JP2009066307A JP2010218386A JP 2010218386 A JP2010218386 A JP 2010218386A JP 2009066307 A JP2009066307 A JP 2009066307A JP 2009066307 A JP2009066307 A JP 2009066307A JP 2010218386 A JP2010218386 A JP 2010218386A
- Authority
- JP
- Japan
- Prior art keywords
- model
- data
- graph
- business
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、複数の業務モデルをデータマッチングさせるための信号処理技術に関する。例えばある企業で使用されている業務モデルと業界リファレンスとして使用される業務モデルとを信号処理を通じてデータマッチングさせるための技術に関する。 The present invention relates to a signal processing technique for data matching of a plurality of business models. For example, the present invention relates to a technique for data matching between a business model used in a certain company and a business model used as an industry reference through signal processing.
現在、IT基盤への投資の抑制や相互接続を目的として、業界団体による業務モデルの標準化が進められている。業界団体によって策定されたリファレンスとなる業務モデルを、この明細書では「リファレンス業務モデル」というものとする。リファレンス業務モデルには、例えばテレコム分野のNGOSS (New Generation Operation Systems and Software)、保健医療分野のHL7(Healthcare Level Seven)、ACORD (Association for Cooperative Operations Research and Development)等がある。 Currently, industry groups are working to standardize business models for the purpose of reducing investment in IT infrastructure and interconnecting them. A business model to be a reference developed by an industry group is referred to as a “reference business model” in this specification. Reference service models include, for example, NGOSS (New Generation Operation Systems and Software) in the telecom field, HL7 (Healthcare Level Seven) in the health care field, and ACORD (Association for Cooperative Operations Research and Development).
ところが、リファレンス業務モデルを企業内に展開する場合には、リファレンス業務モデルと企業内にある既存の業務モデルとのマッチングが問題となる。一般に、業務モデルは交換されるデータを表現したデータモデルと、処理とその手順を表したプロセスモデルとで構成される。このため、両モデルを合わせるとマッチング対象となる項目は、場合によって数万項目にも及ぶ。しかし、現時点において、両業務モデルをマッチングさせる技術は確立されていない。このため、現在のマッチング作業は人手で行われており、大きな工数が問題となっている。 However, when the reference business model is deployed in a company, matching between the reference business model and an existing business model in the company becomes a problem. In general, a business model is composed of a data model representing data to be exchanged, and a process model representing processing and its procedure. For this reason, when the two models are combined, the number of items to be matched reaches tens of thousands in some cases. However, at present, a technology for matching both business models has not been established. For this reason, the current matching work is performed manually, and a large man-hour is a problem.
現在、複数の業務モデルのマッチングを自動化する技術として、データモデルにおけるメタモデル(スキーマ)間のマッチングが知られている。図1に、発注伝票に対応するリファレンスデータモデルのメタモデル101(図1(A))の具体例と、対応する既存データモデルのメタモデル102(図1(B))の具体例を示す。データモデルは、一般にはUMLクラス図やデータフロー図等として与えられる。以下の説明では、図1に示すように、このUML表記によりデータモデルを表記する。このように、既存の手法では、メタモデルレベルでマッチングを実行するのが一般的である。なお、既存のマッチング技術では、クラス・属性の名前・型の類似性や継承・集約・依存等のクラス間の関係をマッチングに利用する。 Currently, matching between metamodels (schema) in a data model is known as a technique for automating matching of a plurality of business models. FIG. 1 shows a specific example of the meta model 101 (FIG. 1A) of the reference data model corresponding to the order slip and a specific example of the meta model 102 (FIG. 1B) of the corresponding existing data model. The data model is generally given as a UML class diagram or a data flow diagram. In the following description, as shown in FIG. 1, the data model is represented by this UML notation. As described above, in existing methods, matching is generally performed at the metamodel level. In the existing matching technology, the class / attribute name / type similarity and the relationship between classes such as inheritance / aggregation / dependency are used for matching.
しかし、データモデルとプロセスモデルから構成される業務モデルの全体をデータマッチングによって統合する仕組みは未だ実現されていない。特に、プロセスモデルの場合、データモデルについて前述したメタモデルレベルでのマッチング方法をそのまま適用することができない。共通のメタモデルに基づいて作成されたプロセスモデル同士がマッチングの対象となるためである。 However, a mechanism for integrating the entire business model composed of the data model and the process model by data matching has not yet been realized. In particular, in the case of a process model, the above-described matching method at the metamodel level for the data model cannot be applied as it is. This is because process models created based on a common metamodel are subject to matching.
図2に、購買業務に対するリファレンスプロセスモデル210(図2(B))の具体例と、対応する既存プロセスモデル220(図2(C))の具体例とを示す。ここで、プロセスモデルは、BPMN(Business Process Management Notation)、UMLアクティビティ図等のグラフで表記される。以下の説明では、このBPMN表記によりプロセスモデルを表記する。なお、プロセスモデルのメタモデル201を図2(A)に示す。メタモデル201は、グラフを表現する節(Node)と辺(Edge)により表現される。前述したように、リファレンスプロセスモデル210と既存プロセスモデル220は、共にメタモデル201に基づいて作成されている。 FIG. 2 shows a specific example of the reference process model 210 (FIG. 2B) for a purchasing operation and a specific example of the corresponding existing process model 220 (FIG. 2C). Here, the process model is represented by a graph such as a BPMN (Business Process Management Notation) or a UML activity diagram. In the following description, a process model is expressed by this BPMN notation. A metamodel 201 of the process model is shown in FIG. The meta model 201 is represented by a node (Node) and an edge (Edge) representing a graph. As described above, both the reference process model 210 and the existing process model 220 are created based on the meta model 201.
従って、プロセスモデルのマッチングレベルは、データモデルのマッチングレベル(すなわち、メタモデル)とは異なるレベルで実行する必要がある。加えて、プロセスモデルレベルでのマッチングでは、意味的には同じプロセスモデルであるにもかかわらず、構造的には異なる表記を採り得るという、プロセスモデルに特有の曖昧性が問題となる。 Accordingly, the process model matching level needs to be executed at a level different from the data model matching level (ie, meta model). In addition, in the matching at the process model level, the ambiguity peculiar to the process model, in which the description is structurally different even though the process model is semantically the same, becomes a problem.
そこで、発明者は、業務モデルレベルでのデータマッチング処理を実現するために、データモデルとプロセスモデルを同等に扱うことができ、かつ、プロセスモデルが有する曖昧性を解決できる次のような仕組みを提供する。 Therefore, the inventor has the following mechanism that can handle the data model and the process model equally and can solve the ambiguity of the process model in order to realize the data matching process at the business model level. provide.
まず、データ処理部は、第1の業務モデルに対応するデータモデルとプロセスモデルの要素間の関係に基づいて、これらを一つのグラフに統合して第1の拡張プロセスグラフをデータ上で生成する。同様に、データ処理部は、第2の業務モデルに対応するデータモデルとプロセスモデルの要素間の関係に基づいて、これらを一つのグラフに統合して第2の拡張プロセスグラフをデータ上で生成する。この後、データ処理部は、第1の拡張プロセスグラフの要素と第2の拡張プロセスグラフの要素とでペアを形成すると共に、各ペア間の関係をラベルで記述するペアワイズ接続グラフをデータ上で生成する。次に、データ処理部は、ペア間の類似度及び伝播係数を設定した類似性伝播グラフをデータ上で生成し、ペア間の類似性を繰り返し演算により計算する。その後、データ処理部は、フィルタリングにより類似性の高いペアを表示装置上に提示する。 First, the data processing unit generates a first extended process graph on the data by integrating them into one graph based on the relationship between the data model corresponding to the first business model and the elements of the process model. . Similarly, the data processing unit generates a second extended process graph on the data by integrating them into one graph based on the relationship between the data model corresponding to the second business model and the elements of the process model. To do. Thereafter, the data processing unit forms a pair with the elements of the first extended process graph and the elements of the second extended process graph, and creates a pair-wise connection graph describing the relationship between each pair with a label on the data. Generate. Next, the data processing unit generates a similarity propagation graph in which the similarity between the pairs and the propagation coefficient are set on the data, and calculates the similarity between the pairs by repeated calculation. Thereafter, the data processing unit presents a pair having high similarity on the display device by filtering.
本発明によれば、従来手法に比してマッチングに要する工数を大幅に削減することができる。加えて、発明者の提案する拡張プロセスグラフを用いれば、データモデルとプロセスモデルを統一的に扱うことができる。これにより、2つの業務モデルの全体をデータマッチングすることができる。これにより、マッチング精度を向上することができる。 According to the present invention, the number of man-hours required for matching can be greatly reduced as compared with the conventional method. In addition, if the extended process graph proposed by the inventor is used, the data model and the process model can be handled in a unified manner. As a result, the entire two business models can be data-matched. Thereby, matching accuracy can be improved.
以下、業務モデル間のデータマッチング処理を実行するマッチングシステムの形態例を説明する。 An example of a matching system that executes data matching processing between business models will be described below.
(1)形態例
(1−1)マッチングシステムの構成
図3に、業務モデル間のマッチング処理を実行するマッチングシステムの構成例を示す。形態例に係るマッチングシステムは、コンピュータ300と、入力装置320と、表示装置330とで構成される。コンピュータ300は、データ演算を実行するCPU301、ROM302、RAM303、ハードディスク駆動装置306、これらデバイス間のデータ転送を実現するCPUバス312、これらデバイスとCPUバス312とを結合するインターフェース309〜311により構成される。
(1) Configuration Example (1-1) Configuration of Matching System FIG. 3 shows a configuration example of a matching system that executes matching processing between business models. The matching system according to the embodiment includes a computer 300, an
因みに、RAM303には、CPU301に演算処理を実行させる業務モデル間マッチングプログラム304の実行領域と、演算時に一時的に生成されるデータを格納する作業領域305とが少なくとも確保される。また、ハードディスク駆動装置306の記憶領域には、業務モデル間マッチングプログラム304の格納領域としてのプログラム格納部307と、リファレンス業務モデルと既存業務モデルのデータ格納領域としてのデータ格納部308とが少なくとも確保される。
Incidentally, the
なお、形態例の説明では、マッチング処理がコンピュータ300上で実行されるプログラムの一機能として実現される場合を想定しているが、マッチング処理専用の装置として実現することもできる。その場合、当該処理機能は、ASICや専用の処理ボードとして実現することもできる。因みに、これらのハードウェア構成が、特許請求の範囲における「データ処理部」に対応する。 In the description of the embodiment, it is assumed that the matching process is realized as one function of a program executed on the computer 300, but the matching process may be realized as an apparatus dedicated to the matching process. In this case, the processing function can be realized as an ASIC or a dedicated processing board. Incidentally, these hardware configurations correspond to the “data processing unit” in the claims.
また、ハードディスク駆動装置306に対する業務モデル間マッチングプログラム304の書き込みは、当該プログラムを記録した記録媒体から行っても良く、当該プログラムを含む放送信号又は通信信号等を通じて行っても良い。
Further, the business
また、この形態例の場合には、ハードディスク駆動装置306に対して業務モデル間マッチングプログラム304を書き込んでいるが、記録媒体はフレキシブルディスク、CD-ROM、DVD-ROM、半導体メモリその他のコンピュータが読み取り可能記憶媒体であれば良い。
In this embodiment, the business
(1−2)業務モデル間マッチング動作
(a)概略動作
図4に、業務モデル間マッチングプログラム304を通じて実行されるデータマッチングプロセスの概要を示す。このデータマッチングプロセスは、ユーザによる入力装置320を通じての操作入力により開始される(ステップ401)。コンピュータ300は、当該操作入力を検出すると、マッチング対象に指定入力されたリファレンス業務モデルのデータと既存業務モデルのデータを、それぞれハードディスク駆動装置306のデータ格納部308から読み込む。ここで、リファレンス業務モデルのデータとは、リファレンスデータモデルに対応するメタモデル101とリファレンスプロセスモデル210で構成される。また、既存業務モデルのデータとは、既存データモデルに対応するメタモデル102と既存プロセスモデル220で構成される。コンピュータ300は、読み込んだデータをRAM303の作業領域305に格納する(ステップ402)。
(1-2) Business Model Matching Operation (a) Schematic Operation FIG. 4 shows an overview of a data matching process executed through the business
コンピュータ300は、業務モデル間マッチングプログラム304に記述された処理手順に従い、作業領域305に格納された業務モデルのデータ間についてのマッチング演算を実行する(ステップ403)。処理手順の詳細については後述する。なお、コンピュータ300のマッチング演算によって得られた計算結果は作業領域305に格納される。
The computer 300 executes a matching operation between the business model data stored in the
コンピュータ300は、作業領域305に格納された計算結果を表示装置330に表示する(ステップ404)。これにより、業務モデル間マッチングプログラム304としての処理動作は終了する(ステップ405)。
The computer 300 displays the calculation result stored in the
一方、表示装置330を通じて計算結果の提示を受けたユーザは、提示された可能性の高いマッチング結果についての検証作業を開始する。ここでの検証作業は確度の高いマッチング結果に対して行えば良い。従って、ユーザの作業工数を大幅に削減することができる。
On the other hand, the user who has received the calculation result through the
(b)マッチング演算で実行される詳細動作
続いて、ステップ403で実行されるマッチング演算の詳細動作を説明する。図5に、マッチング演算で実行される処理手順の概要を示す。
(B) Detailed Operation Performed in Matching Calculation Next, the detailed operation of the matching calculation performed in
(ステップ502)
マッチング演算の開始後、コンピュータ300は、初期マッチング処理を実行する。この初期マッチング処理において、コンピュータ300は、リファレンスデータモデルのメタモデル101と既存データモデルのメタモデル102を要素毎に文字列で比較するマッチング処理と、リファレンスプロセスモデル210と既存プロセスモデル220を要素毎に文字列で比較するマッチング処理とを実行する。例えば図2の例の場合、リファレンスプロセスモデル210の処理「検収」と既存プロセスモデル220の処理「検収」とは、名称が一致している。この場合、コンピュータ300は、これらの要素がマッチングすると判定する。
(Step 502)
After the start of the matching calculation, the computer 300 executes an initial matching process. In this initial matching process, the computer 300 compares the meta model 101 of the reference data model and the meta model 102 of the existing data model by a character string for each element, and compares the reference process model 210 and the existing process model 220 for each element. And a matching process for comparing with a character string. For example, in the case of the example in FIG. 2, the process “verification” of the reference process model 210 and the process “verification” of the existing process model 220 have the same name. In this case, the computer 300 determines that these elements match.
(ステップ503)
次に、コンピュータ300は、リファレンスプロセスモデル210と既存のプロセスモデル220とを参照して、同じ意味でありながら複数の構造を採り得る構造を検索し、事前に定めた特定の構造に統一する処理を実行する。すなわち、プロセスモデルの正規化処理を実行する。図6に、プロセスモデルの正規化動作例を示す。図6(A)は、戻り辺があるプロセスモデル600を、ループ処理のプロセスモデル601に書き換えた例である。また、図6(B)の例は、お互いにデータを交換することがない連続する処理をもつプロセスモデル610を、並列処理を実行するプロセスモデル611に書き換えた例である。
(Step 503)
Next, the computer 300 refers to the reference process model 210 and the existing process model 220, searches for a structure that can have a plurality of structures with the same meaning, and unifies the structure into a predetermined specific structure. Execute. That is, a process model normalization process is executed. FIG. 6 shows an example of normalization operation of the process model. FIG. 6A shows an example in which a
このように、プロセスモデルに対して予め正規化処理を実行することにより、モデル構造上での表現の違いを統一的な表現に変更することができる。これにより、マッチング精度を向上することができる。また、正規化の際に戻り辺を排除して処理の順番を確定することにより、後述する拡張プロセスグラフ上での要素間の対応関係や辺のラベリングが可能になる。 Thus, by performing normalization processing on the process model in advance, the difference in expression on the model structure can be changed to a unified expression. Thereby, matching accuracy can be improved. Also, by eliminating the return edge and determining the processing order during normalization, it is possible to make correspondence between elements and labeling edges on the extended process graph described later.
(ステップ504)
この後、コンピュータ300は、データモデルをプロセスモデルに統合したグラフ(以下、「拡張プロセスグラフ」という。)を、各業務モデルについて生成する(ステップ504)。すなわち、コンピュータ300は、リファレンスデータモデルのメタデータ101とリファレンスプロセスモデル210の要素間の関係に基づいて、リファレンス業務モデルに対応する拡張プロセスグラフ710(図7(A))を作成する。同様に、既存データモデルのメタデータ102と既存プロセスモデル220の要素間の関係に基づいて、既存業務モデルに対応する拡張プロセスグラフ720(図7(B))を作成する。
(Step 504)
Thereafter, the computer 300 generates a graph in which the data model is integrated with the process model (hereinafter referred to as “extended process graph”) for each business model (step 504). That is, the computer 300 creates an extended process graph 710 (FIG. 7A) corresponding to the reference business model based on the relationship between the elements of the reference data model metadata 101 and the reference process model 210. Similarly, based on the relationship between the metadata 102 of the existing data model and the elements of the existing process model 220, an extended process graph 720 (FIG. 7B) corresponding to the existing business model is created.
ここで、拡張プロセスグラフGepとは、プロセスモデルとデータモデルを統合したものであり、以下の式(1)に示すように定義される。 Here, the extended process graph G ep is an integration of the process model and the data model, and is defined as shown in the following equation (1).
因みに、拡張プロセスグラフGepは、節の集合Vepと辺の集合Eepとによって定義される。節の集合Vepは、プロセスモデルの節の集合Vprocessと、データモデルの節の集合Vdataとを合わせたものとして定義される。もっとも、図7に示すように、プロセスモデルとデータモデル間の辺上に1つ又は複数の仮想的な節を定義する場合には、これらの節の集合も、節の集合Vepに含まれる。辺の集合Eepは、プロセスモデルの辺の集合Eprocessと、データモデルの辺の集合Edataと、プロセスモデルとデータモデル間の辺の集合Ecrossとを合わせたものとして定義される。なお、この明細書において、プロセスモデルとデータモデルともに辺(vs ,l,vt )は、開始節vs と、終了節vt と、ラベルlとの組み合わせによって定義される。 Incidentally, the extended process graph G ep is defined by a set of nodes V ep and a set of edges E ep . The clause set V ep is defined as a combination of the process model clause set V process and the data model clause set V data . However, as shown in FIG. 7, when one or more virtual clauses are defined on the edge between the process model and the data model, the set of these clauses is also included in the clause set V ep. . The edge set E ep is defined as a combination of a process model edge set E process , a data model edge set E data, and an edge set E cross between the process model and the data model. In this specification, in both the process model and the data model, the edge (v s , l, v t ) is the start clause v s. And the end clause v t And a combination with the label l.
なお、この形態例における拡張プロセスグラフGepでは、データモデルに由来する辺と、プロセスモデルに由来する辺と、データモデルとプロセスモデルとを接続する辺とで異なるラベルを付けることによりデータ上区別する。例えば拡張プロセスグラフ710、720の場合、プロセスモデルに由来する辺にはラベルL1又はL2を付し、データモデルに由来する辺にはラベルO1を付し、プロセスモデルとデータモデルとを接続する辺にはラベルC1を付す。それ以外の辺には、ラベルとして要素間の関係を表すラベルattribute、type等を付す。 In the extended process graph G ep in this embodiment, the data model is distinguished by attaching different labels to the edge derived from the data model, the edge derived from the process model, and the edge connecting the data model and the process model. To do. For example, in the case of the extended process graphs 710 and 720, the side derived from the process model is labeled L1 or L2, the side derived from the data model is labeled O1, and the side connecting the process model and the data model Is labeled C1. Labels “attribute” and “type” representing the relationship between elements are attached to the other sides as labels.
また、この形態例における拡張プロセスグラフGepでは、ステップ502の初期マッチングでマッチングした要素に対してプロセス的に上流側の辺と下流側の辺とで異なるラベルを付けることによりデータ上区別する。この形態例の場合、ステップ502において、リファレンスプロセスモデル210の処理「検収」と既存プロセスモデル220の処理「検収」とがマッチしている。このため、図7(A)に示す拡張プロセスグラフ710では、処理「検収」に対応する要素RT6よりも上流側の辺にラベルL1を付し、要素RT6よりも下流側の辺にラベルL2を付している。同様に、図7(B)に示す拡張プロセスグラフ720では、処理「検収」に対応する要素AT5よりも上流側の辺にラベルL1を付し、要素AT5よりも下流側の辺にラベルL2を付している。これにより、リファレンス業務モデルに対応する拡張プロセスグラフ710の要素RT6以降の要素が、既存業務モデルに対応する拡張プロセスグラフ720の要素AT5以前の要素とマッチングするのを防止することができる。
Further, in the extended process graph Gep in this embodiment, the elements matched by the initial matching in
また、この形態例における拡張プロセスグラフGepでは、データモデルに由来する節の要素と、プロセスモデルに由来する節の要素との間でも異なるラベルを付けてデータ上区別する。また、リファレンス業務モデルに対応する拡張プロセスグラフGepと既存業務モデルに対応する拡張プロセスグラフGepとで異なるラベルを付してデータ上区別する。また、節の要素には、由来が同じモデル内の上流側から順番に通し番号を付してデータ上区別する。これにより、拡張プロセスグラフ710の要素と拡張プロセスグラフ720の要素のプロセス上での位置関係が明確化され、後述するペアワイズ接続グラフの生成の際、拡張プロセスグラフ710の要素と拡張プロセスグラフ720の要素のペアを過不足無く作成することが可能になる。 Further, in the extended process graph Gep in this embodiment, a different label is also provided between the element of the node derived from the data model and the element of the node derived from the process model to distinguish on the data. Moreover, distinguishing the data given different labels and expansion process graph G ep corresponding to the existing business model and expansion process graph G ep corresponding to the reference work model. In addition, the elements of the sections are serially numbered from the upstream side in the model with the same origin to distinguish them in the data. As a result, the positional relationship of the elements of the extended process graph 710 and the extended process graph 720 in the process is clarified, and when the pairwise connection graph described later is generated, It is possible to create pairs of elements without excess or deficiency.
(ステップ505)
この後、コンピュータ300は、ステップ504で生成された拡張プロセスグラフ710の各要素と拡張プロセスグラフ720の各要素について考えられる全てのペアの接続関係をグラフで表現するペアワイズ接続グラフを作成する。図7の拡張プロセスグラフから作成されるペアワイズ接続グラフの一部分を図8に示す。図8では、拡張プロセスグラフを構成する節のうちラベルが一致する要素同士をペアとしてペアワイズ接続グラフを作成している。因みに、部分グラフ810(図8(A))、820(図8(B))、830(図8(C))、840(図8(D))は、それぞれ辺のラベルがL1、L2、activityType、C1の例である。
(Step 505)
Thereafter, the computer 300 creates a pair-wise connection graph that represents the connection relationships of all the possible pairs for each element of the extended process graph 710 and each element of the extended process graph 720 generated in
ペアワイズ接続グラフGpcは、リファレンス業務モデルに対応する拡張プロセスグラフGep(reff)の節と既存業務モデルに対応する拡張プロセスグラフGep(AsIs)の節の間の関係を見るためのグラフであり、以下の式(2)に示すように定義される。節の集合Vpcの要素は、リファレンス業務モデルに対応する拡張プロセスグラフの節Vep(reff)の要素と、既存業務モデルに対応する拡張プロセスグラフの節の集合Vep(AsIs)の要素との対として定義される。辺の集合Epcは、リファレンス業務モデルに対応する拡張プロセスグラフの辺の集合Epc(reff)と既存業務モデルに対応する拡張プロセスグラフの辺の集合Epc(AsIs)のうちラベルlが等しい辺から構成される。 The pairwise connection graph G pc is a graph for viewing the relationship between the clause of the extended process graph G ep (reff) corresponding to the reference business model and the clause of the extended process graph G ep (AsIs) corresponding to the existing business model. Yes, it is defined as shown in Equation (2) below. The elements of the clause set V pc are the elements of the extended process graph clause V ep (reff) corresponding to the reference business model and the elements of the extended process graph clause set V ep (AsIs) corresponding to the existing business model. Defined as a pair. The edge set E pc has the same label l among the edge set E pc (reff) of the extended process graph corresponding to the reference business model and the edge set E pc (AsIs) of the extended process graph corresponding to the existing business model. Consists of sides.
この際、計算量の削減のため、正規化されたプロセスモデルの実行順序を考慮して節同士のペアを作成する。この形態例の場合、拡張プロセスグラフ710のうちプロセスモデルに由来する節に対して順番に番号iを付与し、拡張プロセスグラフ720のうちプロセスモデルに由来の節に対して順番jを付与している。 At this time, in order to reduce the amount of calculation, pairs of clauses are created in consideration of the execution order of the normalized process model. In the case of this embodiment, number i is assigned in order to the nodes derived from the process model in the extended process graph 710, and order j is assigned to the nodes derived from the process model in the extended process graph 720. Yes.
ここで、レファレンス業務モデルに対応する拡張プロセスグラフ710の節vi0(reff)と、既存業務モデルに対応する拡張プロセスグラフの節vj0(AsIs)とをペアにしてペアワイズ接続グラフの新たな節(vi0(reff),vj0(AsIs))を生成する場合を考える。このとき、次の拡張プロセスグラフ710の節vi0+1(reff)は、拡張プロセスグラフ720の節vj0+1(AsIs)以降の節とのみペアを組む。これにより、例えば図7の拡張プロセスグラフから、ペア(RT2,AT2)を作成した後、(RE1,AT3)という本来のプロセスモデルの実行順序が逆転したペアを作成するのを防止し、計算量を削減することができる。 Here, a clause v i0 (reff) of the extended process graph 710 corresponding to the reference business model and a clause v j0 (AsIs) of the extended process graph corresponding to the existing business model are paired, and a new clause of the pair-wise connection graph. Consider the case of generating (v i0 (reff) , v j0 (AsIs) ). At this time, the node v i0 + 1 (reff) of the next extended process graph 710 forms a pair only with the node after the node v j0 + 1 (AsIs) of the extended process graph 720. Thus, for example, after creating the pair (RT2, AT2) from the extended process graph of FIG. 7, it is possible to prevent the creation of a pair (RE1, AT3) in which the execution order of the original process model is reversed, and the calculation amount Can be reduced.
(ステップ506)
この後、コンピュータ300は、ステップ505で作成したペアワイズ接続グラフ(図8)に基づいて類似性伝播グラフを作成する。図9に、ペアワイズ接続グラフ810、820、830、840にそれぞれ対応する類似性伝播グラフ910(図9(A))、920(図9(B))、930(図9(C))、940(図9(D))を示す。特に、類似性伝播グラフ940は、プロセスモデルとデータモデルとを結びつける類似性伝播グラフである。この類似性伝播グラフ940が存在することで、プロセスモデル間の節のペアとデータモデル間の節のペアとの間で類似性の相互伝播が保障される。
(Step 506)
Thereafter, the computer 300 creates a similarity propagation graph based on the pair-wise connection graph created in step 505 (FIG. 8). FIG. 9 shows similarity propagation graphs 910 (FIG. 9A), 920 (FIG. 9B), 930 (FIG. 9C), and 940 corresponding to the
類似性伝播グラフGspとは、ペアワイズ接続グラフGpcの節(vreff,vAsIs)∈VpcのペアvreffとvAsIs間の類似性とこの類似性がどのように隣接する節に伝播するかを表現したグラフであり、以下の式(3)で定義される。式(3)に示すように、類似性伝播グラフGspは、節の集合Vsp、辺の集合Esp、類似度関数σ、類似度の集合Σ、伝播関数ω、伝播係数の集合Ωで定義される。なお、ペアワイズ接続グラフGpcの辺が片方向だったのに対し、この類似性伝播グラフGspにおける辺の集合Espは双方向の辺から構成される。 The affinity propagation graph G sp, pairwise connection graph G pc sections (v reff, v AsIs) ∈V pc similarity between pairs v reff and v AsIs with the paragraph this similarity is how adjacent propagated It is a graph expressing whether or not to be defined, and is defined by the following formula (3). As shown in the equation (3), the similarity propagation graph G sp includes a node set V sp , an edge set E sp , a similarity function σ, a similarity set Σ, a propagation function ω, and a propagation coefficient set Ω. Defined. Note that the edge of the pair-wise connection graph G pc is unidirectional, whereas the edge set E sp in the similarity propagation graph G sp is composed of bidirectional edges.
ここで、ペアの類似度の集合Σの各要素の値は、0〜1の実数値で与えられるものとする。なお、類似度Σに対する初期値の与え方は複数考えられるが、例えば全ての初期値を1とする方法、ペアがともにテキストの場合は、シソーラスや編集距離などからテキスト間の類似性を求め、それを類似性の初期値とする方法などを使用する。同様に、伝播係数の集合Ωの各要素の値は、0〜1の実数値で与えられるものとする。なお、初期値は、着目している節が開始節となっている全ての辺に対する伝播係数の合計が1となるように与える。個々の辺に対する初期値の与え方は複数考えられるが、例えば着目している節が開始節となっている全ての辺で等しくなるように与える方法、その辺がプロセスモデルに由来する辺かデータモデルに由来する辺かで異なる値を与える方法などを使用する。 Here, the value of each element of the pair similarity set Σ is assumed to be a real value from 0 to 1. There are a plurality of ways of giving initial values for the similarity Σ. For example, when all the initial values are set to 1, when both pairs are texts, the similarity between the texts is obtained from the thesaurus or the edit distance, A method of using it as an initial value of similarity is used. Similarly, the value of each element of the set of propagation coefficients Ω is given as a real value from 0 to 1. Note that the initial value is given so that the sum of the propagation coefficients for all sides where the node of interest is the start node is 1. There are multiple ways to assign initial values to each side. For example, a method in which the target node is the same for all the sides that are the starting clause, or the side is derived from the process model or data Use a method that gives different values depending on the edges from the model.
(ステップ507)
次に、コンピュータ300は、作成された類似性伝播グラフ(例えば910〜940)における各ペアの類似性を、以下の式(4)に基づいて計算し、計算結果が収束するまで計算処理を繰り返し実行する。すなわち、コンピュータ300は、与えられたペアに対する類似度関数σk+1 の値とσk の値との差が与えられた閾値以下になるまで繰り返し計算処理を実行する。ここで、kは繰り返し回数である。なお、式(4)の第2項は計算対象とする節に対してプロセスの下流側に位置する節との間における類似成分値であり、第3項は計算対象とする節に対してプロセスの上流側に位置する節との間における類似成分値である。
(Step 507)
Next, the computer 300 calculates the similarity of each pair in the created similarity propagation graph (for example, 910 to 940) based on the following formula (4), and repeats the calculation process until the calculation result converges: Execute. That is, the computer 300 repeatedly performs a calculation process until the difference between the value of the similarity function σ k + 1 and the value of σ k for a given pair is equal to or less than a given threshold value. Here, k is the number of repetitions. Note that the second term of Equation (4) is the similar component value between the node to be calculated and the node located downstream of the process, and the third term is the process for the node to be calculated. It is a similar component value between the nodes located on the upstream side.
(ステップ508)
この後、コンピュータ300は、先のステップ507で算出されたペア間の類似度と閾値とを比較し、閾値より小さい類似度が得られたペアを除外するフィルタリング処理を実行する。なお、閾値は、ユーザによる作業工数やフィルタリング結果として残るペア数等を考慮して適時修正する。因みに、閾値の修正には入力装置320を使用する。
(Step 508)
Thereafter, the computer 300 compares the similarity between the pairs calculated in the
(1−3)まとめ
以上説明したように、マッチング処理の対象となる各プロセスモデルに現れる表記上のバラツキを、戻り辺や順序関係の曖昧性を排除した表記に初期化することにより、プロセスモデルの順番関係を明確にできる。
(1-3) Summary As described above, the process model is initialized by initializing the notation variation appearing in each process model to be subjected to the matching process to the notation in which the ambiguity of the return side and the order relation is excluded. The order relationship can be clarified.
また、初期化処理が終了したプロセスモデルのモデルとデータモデルのメタモデルとを同一グラフ上に表現した拡張プロセスグラフを作成し、その際、節と節を接続する辺の由来に基づいて固有のラベルを付ける。同様に、初期マッチングにおいて、プロセスモデル間の比較においてマッチングが確認された節の要素に対するプロセスの前に位置するか後に位置するかに基づいて各辺に異なるラベルを付ける。これにより、プロセス上の処理順序を考慮して、拡張プロセスグラフについてペアワイズ接続グラフを作成する際のマッチング範囲の切り分けを明確にできる。この結果、コンピュータ300によるペアの探索範囲が不必要に広がるのを避けることができる。その分、計算量を削減できる。 In addition, an extended process graph that represents the model of the process model that has been initialized and the meta model of the data model is created on the same graph. Label it. Similarly, in the initial matching, each side is given a different label based on whether it is located before or after the process for the element of the clause whose matching is confirmed in the comparison between the process models. This makes it possible to clarify the matching range when creating a pair-wise connection graph for the extended process graph in consideration of the processing order on the process. As a result, it is possible to avoid unnecessarily widening the pair search range by the computer 300. The amount of calculation can be reduced accordingly.
また、この形態例の場合、類似性伝播グラフの作成時には、テキストのペアである節に対してシソーラスや編集距離を用いテキスト間の類似度を求め、これをペア間の類似性の初期値に与えることにより、算出されるペア間の類似度に対する信頼性を高めることができる。また、類似性伝播グラフの作成時、信頼度の高いモデルに由来する辺か否かで伝播係数の初期値を変更することにより、算出されるペア間の類似度に対する信頼性を高めることができる。特に、マッチング対象である業務モデルを構成するプロセスモデルとデータモデルとの間に信頼性の差がある場合には、信頼性の高い方から伝播係数の影響を高めることにより、最終的に算出される各ペア間の類似度の信頼性を高めることができる。 In the case of this form example, when creating the similarity propagation graph, the similarity between texts is obtained using a thesaurus or editing distance for the clauses that are pairs of text, and this is used as the initial value of similarity between pairs. By giving, the reliability with respect to the calculated similarity between pairs can be improved. In addition, when creating a similarity propagation graph, the reliability of similarity between calculated pairs can be improved by changing the initial value of the propagation coefficient depending on whether the edge is derived from a model with high reliability. . In particular, if there is a difference in reliability between the process model and the data model that make up the business model to be matched, it is finally calculated by increasing the influence of the propagation coefficient from the higher reliability. The reliability of the similarity between each pair can be increased.
(2)他の形態例
前述した形態例の場合には、購買業務を具体例として業務モデル同士をデータマッチングする場合について説明した。しかし、言うまでも無く、マッチング対象とする業務モデルはこれに限らない。
(2) Other Embodiments In the case of the above-described embodiment examples, the case has been described in which business models are subjected to data matching using a purchase operation as a specific example. However, it goes without saying that the business model to be matched is not limited to this.
また、形態例の説明では、便宜上、マッチング対象とする一方の業務モデル(データモデル、プロセスモデル)をリファレンスモデルと呼び、他方の業務モデル(データモデル、プロセスモデル)を既存モデルと呼んだが、マッチング対象の一方が業界団体によって策定されたリファレンス業務モデルである必要は無い。 In the description of the example, for convenience, one business model (data model, process model) to be matched is called a reference model, and the other business model (data model, process model) is called an existing model. One of the targets need not be a reference business model formulated by an industry group.
前述した形態例の場合には、初期マッチング(ステップ502)の実行後に、プロセスモデルの正規化処理(ステップ503)を実行する場合について説明した。しかしながら、実行順序は入れ替わっても良い。 In the case of the above-described embodiment, the case where the process model normalization process (step 503) is executed after the initial matching (step 502) has been described. However, the execution order may be changed.
300…コンピュータ
301…CPU
302…ROM
303…RAM
306…HD
320…入力装置
330…表示装置
300 ...
302 ... ROM
303 ... RAM
306 ... HD
320 ...
Claims (9)
データ処理部が、前記第1の業務モデルに対応するプロセスモデルを構成する各要素の文字列と前記第2の業務モデルに対応するプロセスモデルを構成する各要素の文字列とをデータ上で比較し、一致関係が認められる要素を検出する処理と、
データ処理部が、前記第1及び第2の業務モデルに対応するプロセスモデルのモデル表記を予め設定したモデル表記を用いた表記に正規化する処理と、
データ処理部が、前記第1の業務モデルに対応するデータモデルとプロセスモデルの要素間の関係に基づいて、これらを一つのグラフに統合して第1の拡張プロセスグラフをデータ上で生成する処理と、
データ処理部が、前記第2の業務モデルに対応するデータモデルとプロセスモデルの要素間の関係に基づいて、これらを一つのグラフに統合して第2の拡張プロセスグラフをデータ上で生成する処理と、
データ処理部が、前記第1の拡張プロセスグラフの要素と前記第2の拡張プロセスグラフの要素とでペアを形成すると共に、各ペア間の関係をラベルで記述するペアワイズ接続グラフをデータ上で生成する処理と、
データ処理部が、ペア間の類似度及び伝播係数を設定した類似性伝播グラフをデータ上で生成する処理と、
データ処理部が、ペア間の類似性を繰り返し演算により計算する処理と、
データ処理部が、計算結果をフィルタリングし、類似性の高いペアを表示装置上に提示する処理と
を有する業務モデル間のデータマッチング方法。 A process in which the data processing unit reads the data of the data model and the process model corresponding to the first business model and the data model and the process model of the data corresponding to the second business model from the storage device;
The data processing unit compares the character string of each element constituting the process model corresponding to the first business model and the character string of each element constituting the process model corresponding to the second business model on the data And a process for detecting an element with a matching relationship,
A process in which the data processing unit normalizes the model notation of the process model corresponding to the first and second business models into a notation using a preset model notation;
A process in which the data processing unit generates a first extended process graph on data by integrating these into one graph based on the relationship between the data model corresponding to the first business model and the elements of the process model When,
A process in which the data processing unit generates a second extended process graph on data by integrating these into one graph based on the relationship between the data model corresponding to the second business model and the elements of the process model When,
The data processing unit forms a pair with the elements of the first extended process graph and the elements of the second extended process graph and generates a pair-wise connection graph describing the relationship between each pair with a label on the data Processing to
A process in which the data processing unit generates on the data a similarity propagation graph in which the similarity and propagation coefficient between pairs are set;
A process in which the data processing unit repeatedly calculates the similarity between the pairs,
A data matching method between business models, in which a data processing unit has a process of filtering calculation results and presenting pairs with high similarity on a display device.
ことを特徴とする請求項1に記載のマッチング方法。 2. The matching method according to claim 1, wherein, in the process of normalizing the process model, the data processing unit rewrites the notation into a loop notation when a return side exists in the process model.
ことを特徴とする請求項1又は2に記載のマッチング方法。 In the process of normalizing the process model, the data processing unit rewrites the notation into a parallel execution process when there is a notation of a process having no data relation between continuously executed processes. The matching method according to claim 1 or 2.
ことを特徴とする請求項1〜3のいずれか1項に記載のマッチング方法。 In the process of generating the extended process graph, the data processing unit attaches different labels to edges derived from the data model and edges derived from the process model, respectively. Matching method as described in.
ことを特徴とする請求項1〜4のいずれか1項に記載のマッチング方法。 Processing for generating the extended process graph when an element having a matching character string is detected between the process model corresponding to the first business model and the process model corresponding to the second business model; 5. The matching according to claim 1, wherein the data processing unit to execute attaches different labels to the upstream side and the downstream side to the element for which a match is detected. Method.
ことを特徴とする請求項1〜5のいずれか1項に記載のマッチング方法。 6. The matching according to claim 1, wherein, in the process of generating the pair-wise connection graph, the data processing unit creates a pair in consideration of the order of the normalized process model. Method.
ことを特徴とする請求項1〜6のいずれか1項に記載のマッチング方法。 In the process of generating the similarity propagation graph, the data processing unit obtains a similarity between texts using a thesaurus or an editing distance for a clause that is a text pair, and uses this as an initial value of the similarity between the pairs. It sets. The matching method of any one of Claims 1-6 characterized by the above-mentioned.
ことを特徴とする請求項1〜7のいずれか1項に記載のマッチング方法。 In the process of generating the similarity propagation graph, the data processing unit changes an initial value of the propagation coefficient according to whether the edge propagation coefficient is derived from a process model or a data model. Item 8. The matching method according to any one of Items 1 to 7.
前記第1の業務モデルに対応するプロセスモデルを構成する各要素の文字列と前記第2の業務モデルに対応するプロセスモデルを構成する各要素の文字列とをデータ上で比較し、一致関係が認められる要素を検出する処理と、
前記第1及び第2の業務モデルに対応するプロセスモデルのモデル表記を予め設定したモデル表記を用いた表記に正規化する処理と、
前記第1の業務モデルに対応するデータモデルとプロセスモデルの要素間の関係に基づいて、これらを一つのグラフに統合する第1の拡張プロセスグラフをデータ上で生成する処理と、
前記第2の業務モデルに対応するデータモデルとプロセスモデルの要素間の関係に基づいて、これらを一つのグラフに統合する第2の拡張プロセスグラフをデータ上で生成する処理と、
前記第1の拡張プロセスグラフの要素と前記第2の拡張プロセスグラフの要素とでペアを形成すると共に、各ペア間の関係をラベルで記述するペアワイズ接続グラフをデータ上で生成する処理と、
ペア間の類似度及び伝播係数を設定した類似性伝播グラフをデータ上で生成する処理と、
ペア間の類似性を繰り返し演算により計算する処理と、
計算結果をフィルタリングし、類似性の高いペアを表示装置上に提示する処理と
をコンピュータに実行させるコンピュータプログラム。 A process of reading data from the data model and process model corresponding to the first business model, and a data model and process model data corresponding to the second business model, respectively from the storage device;
A character string of each element constituting the process model corresponding to the first business model and a character string of each element constituting the process model corresponding to the second business model are compared on the data, and the matching relationship is A process to detect the allowed elements;
Normalizing the model notation of the process model corresponding to the first and second business models into a notation using a preset model notation;
Based on the relationship between the data model corresponding to the first business model and the elements of the process model, processing for generating on the data a first extended process graph that integrates them into one graph;
Based on the relationship between the data model corresponding to the second business model and the elements of the process model, a process of generating on the data a second extended process graph that integrates these into one graph;
Forming a pair-wise connection graph on the data that forms a pair with the elements of the first extended process graph and the elements of the second extended process graph and that describes the relationship between each pair with a label;
Processing to generate a similarity propagation graph in which the similarity and propagation coefficient between pairs are set on the data;
A process of calculating similarity between pairs by iterative operations;
A computer program that causes a computer to execute a process of filtering a calculation result and presenting a highly similar pair on a display device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009066307A JP5145275B2 (en) | 2009-03-18 | 2009-03-18 | Data matching method between business models and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009066307A JP5145275B2 (en) | 2009-03-18 | 2009-03-18 | Data matching method between business models and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010218386A true JP2010218386A (en) | 2010-09-30 |
JP5145275B2 JP5145275B2 (en) | 2013-02-13 |
Family
ID=42977137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009066307A Expired - Fee Related JP5145275B2 (en) | 2009-03-18 | 2009-03-18 | Data matching method between business models and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5145275B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180082396A (en) * | 2016-08-02 | 2018-07-18 | (주)씽크포비엘 | Business goal management system, business goal management network system, and business goal management method |
CN109598407A (en) * | 2018-10-26 | 2019-04-09 | 阿里巴巴集团控股有限公司 | A kind of execution method and device of operation flow |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008310566A (en) * | 2007-06-14 | 2008-12-25 | Hitachi Ltd | Business process creation method, business process creation device and business process creation program |
-
2009
- 2009-03-18 JP JP2009066307A patent/JP5145275B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008310566A (en) * | 2007-06-14 | 2008-12-25 | Hitachi Ltd | Business process creation method, business process creation device and business process creation program |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180082396A (en) * | 2016-08-02 | 2018-07-18 | (주)씽크포비엘 | Business goal management system, business goal management network system, and business goal management method |
KR102425520B1 (en) * | 2016-08-02 | 2022-07-27 | (주)씽크포비엘 | Business goal management system, business goal management network system, and business goal management method |
CN109598407A (en) * | 2018-10-26 | 2019-04-09 | 阿里巴巴集团控股有限公司 | A kind of execution method and device of operation flow |
CN109598407B (en) * | 2018-10-26 | 2024-04-05 | 创新先进技术有限公司 | Method and device for executing business process |
Also Published As
Publication number | Publication date |
---|---|
JP5145275B2 (en) | 2013-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107610770B (en) | Question generation system and method for automated diagnosis | |
JP5536907B2 (en) | System, method, and computer program for ranking individualized tags | |
JP5995409B2 (en) | Graphical model for representing text documents for computer analysis | |
WO2014126657A1 (en) | Latent semantic analysis for application in a question answer system | |
JP4908073B2 (en) | Service-based software design support method and apparatus therefor | |
US10380132B2 (en) | Information landscape modeling, analysis and validation | |
CN111581479B (en) | One-stop data processing method and device, storage medium and electronic equipment | |
JPWO2013094003A1 (en) | Method, program, and apparatus for determining software installation order | |
US11954820B2 (en) | Graph alignment techniques for dimensioning drawings automatically | |
JP5145275B2 (en) | Data matching method between business models and computer program | |
JP6048957B2 (en) | Information processing apparatus, program, and information processing method | |
Adamu et al. | Similarity Assessment of UML Sequence Diagrams Using Dynamic Programming | |
Viswanathan et al. | Datafinder: Scientific dataset recommendation from natural language descriptions | |
CN113704415A (en) | Vector representation generation method and device for medical text | |
US9311219B2 (en) | Automatic trace retrieval using semantic bridge | |
WO2014050837A1 (en) | Determination device, determination method, and computer-readable recording medium | |
US20210089539A1 (en) | Associating user-provided content items to interest nodes | |
US8140305B2 (en) | Conversion of an application program | |
Wang et al. | Radiology text analysis system (RadText): architecture and evaluation | |
Koren | Graph drawing by subspace optimization | |
JP6549786B2 (en) | Data cleansing system, method and program | |
US11281475B2 (en) | Reusable asset performance estimation | |
US20120084224A1 (en) | Automatically created report generator for managing information technology service projects | |
EP2911107A1 (en) | Graph pruning in hipergraph | |
US20080183537A1 (en) | Approach to comprehensive requirements specifications for complex workflows |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110802 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121126 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |