JP2022059247A

JP2022059247A - 情報処理装置及びプログラム

Info

Publication number: JP2022059247A
Application number: JP2020166861A
Authority: JP
Inventors: 恒介友國; Kosuke Tomokuni; 淳一清水; Junichi Shimizu; 麻美子佐藤; Mamiko Sato; 周作久保; Shusaku Kubo
Original assignee: Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2020-10-01
Filing date: 2020-10-01
Publication date: 2022-04-13
Also published as: US20220107711A1; CN114282138A

Abstract

【課題】第１データの関連付け先の各候補のデータの名前のみを表示する場合に比べて、作業者が、他の装置で入力されるデータのうちより適切なものを第１データに関連付けられるようにする。【解決手段】ＧＵＩ画面８００は、基幹システムが設定する発注Ｎｏ、発注日等の必要属性８０４に対して、その前段のＯＣＲシステムや確認訂正システムが設定する属性（＝ソース属性）を関連付けるためのユーザインタフェースである。マッピング属性８０６の欄には、必要属性８０４に対して関連付けられるソース属性の情報が表示される。この情報は、そのソース属性を設定する装置の名前例えば「ＯＣＲ」と、そのソース属性の名前例えば「注文番号」との組が表示される。またボタン８０８が押下されると、マッピング属性８０６の候補となるソース属性を示す候補リスト８１０又は８２０が表示される。【選択図】図８

Description

本発明は、情報処理装置及びプログラムに関する。

特許文献１に開示されたデータ連携ルール生成システムは、モデル化した各業務で使用される概念的なデータの連携を示す情報を含む業務モデル定義情報、及び、モデル化した業務で使用される概念的なデータと、モデル化した業務の処理を行う業務システムで使用されるデータとの対応付けを示すシステム物理仕様マッピング定義情報を基に、業務システム間で連携されるデータの対応付けを示すシステム連携ルール定義情報を生成する。データ・コントロール・システムは、生成されたシステム連携ルール定義情報を用いて業務システムのデータを連携させる。

特許文献２に開示されるシステムは、上流から下流までのデータ定義を見える化し、下流へのデータマッピングにおいて任意の上流の属性をセットする。コンポーネントタイプによって属性が自動決定される。

特許文献３に開示されるシステムは、文書からメタ情報を抽出し、関連辞書情報（同義語、翻訳辞書、書き言葉と話し言葉の変換辞書等）を用いてマッピングし、マッピングした情報に従ってメタ情報を変換する。

特許文献４に開示されるシステムは、データソースからデータターゲットにインポートする場面において、複数のインポート手順をユースケース（使用事例）として保持する。インポート時は、インポートパラメータの条件が一致するユースケースが選択され、当該ユースケースのインポート手順が実行される。

特開２００５－６３２６１号公報特許第６４１２９２４号明細書特許第５９０３１７１号明細書特許第６５４２８８０号明細書

複数の装置を用いたワークフローを実現するためには、複数の装置にて設定（例えば入力）される属性同士を関連付けることが必要である。その際、それら複数の装置のうち第１装置にて設定される複数の属性のうちの第１属性に対して、他の複数の装置で設定される複数の属性が関連付けの候補となってしまう場合がある。

本発明は、第１データの関連付け先の各候補のデータの名前のみを表示する場合に比べて、作業者が、他の装置で入力されるデータのうちより適切なものを第１データに関連付けられるようにすることを目的とする。

請求項１に係る発明は、プロセッサを備え、前記プロセッサは、ワークフローを構成する複数の装置のうちの第１装置で設定されるデータである第１データと、前記複数の装置のうちの前記第１装置以外の装置で設定されるデータである第２データとの間の、名前同士の類似度である第１類似度と、データ形式同士の類似度である第２類似度とに基づいて、前記第１データに関連付けるべき前記第２データの候補を選定し、選定された前記候補ごとに、前記第１データの名前と、当該候補の名前と、当該候補の設定が行われる前記装置の名前と、を互いに対応付けて表示する第１画面であって、前記候補の中から前記第１データと関連付ける第２データの選択を受け付けるための第１画面、を生成する、ことを特徴とする情報処理装置である。

請求項２に係る発明は、前記第２データは、前記第１装置よりも前記ワークフローの上流の装置で設定されるデータであり、前記プロセッサは、前記ワークフローの上流側の前記装置から順に、当該装置を前記第１装置として前記第１画面を生成し、生成した前記第１画面を用いて１以上の前記候補の中から前記第１データに関連付けるものの選択を受け付ける、ことを特徴とする請求項１に記載の情報処理装置である。

請求項３に係る発明は、前記ワークフローの上流側の前記装置から順に行われた前記選択の結果互いに関連付けられた前記第２データ同士の間では、当該第２データが設定される前記装置が前記ワークフロー中で上流である前記第２データほど、前記第１画面において前記第１データに対する関連が強い候補として表示されにくくなることを特徴とする請求項２に記載の情報処理装置である。

請求項４に係る発明は、互いに関連付けられる前記第２データ同士の間では、当該第２データが設定される前記装置が前記ワークフロー中で上流である前記第２データほど、前記第１画面において前記第１データに対する関連が強い候補として表示されにくくなる、ことを特徴とする請求項１に記載の情報処理装置である。

請求項５に係る発明は、前記データ形式には、少なくともデータ型が含まれ、前記第２データのうち前記第１データと同じデータ型のものは、そうでないものよりも前記第２類似度が高いと判定される、ことを特徴とする請求項１に記載の情報処理装置である。

請求項６に係る発明は、前記第１データと同じデータ型でない前記第２データ同士の間では、型変換により前記第１データと同じデータ型に変換可能なものの方が、そうでないものよりも前記第２類似度が高いと判定される、ことを特徴とする請求項５に記載の情報処理装置である。

請求項７に係る発明は、前記第１画面には、選定された前記候補のうち、前記第１データと同じデータ型にするために型変換が必要な前記候補は、前記第１データと同じデータ型にするために型変換が不要な前記候補とは区別可能な表示態様で表示される、ことを特徴とする請求項１に記載の情報処理装置である。

請求項８に係る発明は、前記データ形式には、データ長が含まれ、前記第２データのうち前記第１データよりもデータ長が長いものは、前記候補に選定されない、ことを特徴とする請求項１に記載の情報処理装置である。

請求項９に係る発明は、前記プロセッサは、前記第１画面に表示された前記候補の中からユーザが前記第１データに関連付ける前記候補を選択した場合に、前記ユーザから選択された前記候補である前記第２データについては、前記第１データとの前記名前同士の前記第１類似度が高く計算されるよう学習する、ことを特徴とする請求項１に記載の情報処理装置である。

請求項１０に係る発明は、前記候補の選定では、前記第１類似度と前記第２類似度とに基づき計算される点数が所定の第１閾値より高い前記第２データが前記候補として選定され、前記第１画面では、前記点数が前記第１閾値よりも高い第２閾値以上である前記候補がある場合、当該候補は前記第１データと関連付けるものとして仮選択された状態で表示され、前記第１画面に対してユーザが前記第１データと関連付ける前記候補を選択する操作を行わなかった場合、前記仮選択された状態の前記候補が前記第１データと関連付けるものとして選択されたものとみなされる、ことを特徴とする請求項１に記載の情報処理装置である。

請求項１１に係る発明は、コンピュータに、ワークフローを構成する複数の装置のうちの第１装置で設定されるデータである第１データと、前記複数の装置のうちの前記第１装置以外の装置で設定されるデータである第２データとの間の、名前同士の類似度である第１類似度と、データ形式同士の類似度である第２類似度とに基づいて、前記第１データに関連付けるべき前記第２データの候補を選定し、選定された前記候補ごとに、前記第１データの名前と、当該候補の名前と、当該候補の設定が行われる前記装置の名前と、を互いに対応付けて表示する第１画面であって、前記候補の中から前記第１データと関連付ける第２データの選択を受け付けるための第１画面、を生成する、処理を実行させるためのプログラムである。

請求項１又は１１に係る発明によれば、第１データの関連付け先の各候補のデータの名前のみを表示する場合に比べて、作業者が、他の装置で入力されるデータのうちより適切なものを第１データに関連付けられるようにすることができる。

請求項２に係る発明によれば、ワークフローにおける順序と関わりなくユーザが選んだ装置を第１装置として関連付けを行う方式と比べて、関連付けのやり直しが必要となる可能性を低減することができる。

請求項３に係る発明によれば、上流の装置で設定されたデータを下流の装置が修正、変更するワークフローにおいて、第１装置にとって最新の修正又は変更の結果が第１データに関連付けられやすくすることができる。

請求項４に係る発明によれば、上流の装置で設定されたデータを下流の装置が修正、変更するワークフローにおいて、第１装置にとって最新の修正又は変更の結果が第１データに関連付けられやすくすることができる。

請求項５に係る発明によれば、第１データとデータ型が同じ第２データが、そうでない第２データよりも第１データに対して関連付けられやすくすることができる。

請求項６に係る発明によれば、第１データと同じデータ型に変換できる第２データの方が、そうでない第２データよりも第１データに対して関連付けられやすくすることができる。

請求項７に係る発明によれば、型変換が必要な第２データについては、その旨が分かるように表示することができる。

請求項８に係る発明によれば、第１データのデータ長を超える第２データが第１データに関連付けられることを防ぐことができる。

請求項９に係る発明によれば、ユーザが行った関連付けを、次回以降の第１類似度の計算に反映させることができる。

請求項１０に係る発明によれば、点数がある程度高い（すなわち第２閾値以上）第２データについては、関連付けのためのユーザの明示的な操作を省略可能とすることができる。

属性関連付けシステムとこれが適用されるワークフローシステムとからなる全体システムの例を示す図である。帳票と、その中から抽出される属性の例を示す図である。コンピュータのハードウエア構成を例示する図である。属性間の類似性を示す得点を求める例を示す図である。属性間の類似性を示す得点を求める別の例を示す図である。ＧＵＩに選択肢として表示するソース属性を得点に応じて決定する処理を説明するための図である。ターゲットの必要属性に対してＧＵＩにそれぞれ異なるレベルで提示されるソース属性の例を示す図である。ＧＵＩの表示内容の例を示す図である。属性関連付けシステムの全体的な処理手順を例示する図である。属性関連付けシステムのＧＵＩ生成処理の手順を例示する図である。属性関連付けシステムのソース属性の得点評価の手順を例示する図である。進捗画面の例を示す図である。ユーザの選択の結果を名前用語辞書に反映させる形での学習を説明するための図である。

図１を参照して、本発明に係る情報処理装置の実施形態である属性関連付けシステム１２０と、これが適用されるワークフローシステムと、からなる全体システムを例示する。図１に例示するワークフローシステムは、メールサーバ１０２、スキャナ１０４、データエントリシステム１００、基幹システム１１０、及び文書管理システム１１２等のサブシステムを含んでいる。このワークフローシステムは、帳票の記入内容をデジタル化して保存する処理のためのものである。このうちメールサーバ１０２及びスキャナ１０４は、データエントリシステム１００に帳票の画像データを入力する入力システムである。また、基幹システム１１０及び文書管理システム１１２は、データエントリシステム１００がデジタル化した帳票の記入内容を受け取って処理する後段システムである。

入力システムの一つであるスキャナ１０４は、紙等の帳票をスキャンし、その帳票の画像データ（以下、帳票画像と呼ぶ）を生成し、その帳票画像を例えばネットワーク経由でデータエントリシステム１００に入力する。また、スキャナ１０４が生成した帳票画像や、文書編集システムを用いてユーザが記入した帳票画像が、電子メールに添付され、メールサーバ１０２経由でデータエントリシステム１００に入力されることもある。図示は省略したが、データエントリシステム１００への帳票画像の入力は、例示した電子メール添付やスキャナ１０４からの入力以外に、例えばファクシミリ等の画像転送システムを経由して行われてもよい。

データエントリシステム１００は、紙等の帳票の記入内容を認識してデジタル化するシステムである。データエントリシステム１００は、ＯＣＲシステム１０６と確認訂正システム１０８を含む。

ＯＣＲ（光学文字認識）システム１０６は、入力された帳票画像に対して文字認識を実行し、帳票画像中の各属性の値である文字列を求める。ここで、ＯＣＲシステム１０６は、公知のｋｅｙ－ｖａｌｕｅ抽出の手法を用いて、各属性の値を特定してもよい。ｋｅｙ－ｖａｌｕｅ抽出は、帳票画像中から、例えば「注文日」や「合計金額」等の属性を表すｋｅｙ（キー）の文字列を認識する。そして、そのｋｅｙの文字列の近傍の予め想定される場所にある、その属性のデータ種類（例えば年月日に該当し得る数字列、金額に該当し得る数字列）に合致する文字列を、その属性の値として認識する。

図２に、帳票２００の例を示す。この帳票２００は注文書であり、注文番号２０２、注文日２０４、得意先名２０６、合計金額２０８等の属性を含んでいる。

確認訂正システム１０８は、ＯＣＲシステム１０６による文字認識結果に対して、人間のオペレータによる確認、訂正を受け付けるシステムである。確認訂正システム１０８は、例えば、帳票内の属性ごとにその属性の画像と文字認識結果の文字列とを対応付けて表示した確認画面をオペレータに提示する。オペレータは、その確認画面に対して、その文字認識結果が正しければその旨を確認する入力を、誤っていれば正しく訂正する入力を行う。このようにしてオペレータから確認又は訂正を受けた各属性の文字列が、後段システムである基幹システム１１０及び文書管理システム１１２に入力される。

基幹システム１１０は、ワークフローシステムを利用している組織の業務のための中核となる情報処理を行うシステムである。基幹システム１１０は、例えば、データエントリシステム１００から帳票の記入内容をデジタル化したデータ、すなわち属性ごとの値（＝文字列）のデータを受け取り、そのデータに従って会計処理等の基幹業務の情報処理を実行する。

文書管理システム１１２は、組織の業務に用いられる文書を保存するシステムである。文書管理システム１１２は、例えば、データエントリシステム１００から受け取った帳票の記入内容をデジタル化したデータと、帳票画像とを対応付けて保存し、保存したそれらの情報をユーザの利用に供する。

図１に例示したワークフローシステムでは、同じ帳票に関する処理が、ＯＣＲシステム１０６、確認訂正システム１０８、基幹システム１１０（又は文書管理システム１１２）の順に進んでいく。このように、ワークフローの処理の順序において前（すなわち時間的に早い）側のことを以下では「上流」と呼び、後ろ側のことを「下流」と呼ぶ。例えば、ＯＣＲシステム１０６及び確認訂正システム１０８は、基幹システム１１０から見て「上流」のサブシステムであり、確認訂正システム１０８はＯＣＲシステム１０６から見て「下流」のサブシステムである。

ワークフローシステムを構成するメールサーバ１０２、スキャナ１０４、ＯＣＲシステム１０６、確認訂正システム１０８、基幹システム１１０、及び文書管理システム１１２は、入力された帳票に関していくつかの属性の値を設定する。あるシステムが属性の値を「設定する」とは、その属性の値を自システムの出力データに組み込むこと、又はその属性の値を自システムの情報処理（データベースへの登録も含む）への入力データに組み込むことを意味する。以下では、既述の煩雑さを避けるため、「システムが設定する属性」のことを、単に「システムの属性」と呼ぶこともある。

例えば、メールサーバ１０２は、帳票画像が添付された電子メールのデータから、タイトル、宛先、受信日時等の属性の値を抽出し、抽出した各属性の値を、帳票画像に対応付けて、ワークフローにおける次段階であるデータエントリシステムへと出力する。

また、ＯＣＲシステム１０６は、帳票画像から、注文番号、注文日１３２、得意先名、合計金額１４２等の属性とその値を認識し、認識したそれら各属性の値を次の確認訂正システム１０８に出力する。この例では、合計金額１４２という属性には、その属性の値のデータ型として、「文字列型：￥カンマ付」というデータ型が設定されている。これは、合計金額１４２の値が、文字列型であり、先頭に「￥」マークがつき、所定の桁数ごとにカンマで区切られたものであることを示す。

また例えば確認訂正システム１０８は、ＯＣＲシステム１０６から入力された帳票画像の各属性の確認結果又は訂正結果の値と、オペレータ又は確認訂正システム１０８自体が入力した他の属性の値を、次の基幹システム１１０及び文書管理システム１１２への出力データに組み込む。確認訂正システム１０８が設定する属性には、例えば案件番号、確認者名、確認日時１３４、得意先名、得意先番号、担当営業、合計金額１４４等がある。このうち、得意先名や合計金額１４４は、ＯＣＲシステム１０６から入力された同名の属性の値についての、オペレータによる確認又訂正の結果である。また例えば確認者名、確認日時、得意先番号は、オペレータ又は確認訂正システム１０８自体がその属性の値を入力又は生成する。この例では、確認日時１３４という属性の値に対して、「ｙｙｙｙＭＭｄｄＨＨｍｍｓｓ」というデータ型が定められている。このデータ型は、４桁の年「ｙｙｙｙ」、２桁の月「ＭＭ」、２桁の日「ｄｄ」、２桁の時「ＨＨ」、２桁の分「ｍｍ」、２桁の秒「ｓｓ」をこの順に連ねた数字列である。

また例えば基幹システム１１０は、上流側の各システム、例えば確認訂正システム１０８、から入力された各属性の値を、販売管理、在庫管理、財務会計等の基幹業務アプリケーションに入力する。入力する属性には、例えば見積Ｎｏ．、発注Ｎｏ．、発注日１３６、顧客名、顧客Ｎｏ．、発注金額１４６等がある。

ここで注意すべきは、ワークフローの各サブシステムが値を設定する属性には、それぞれサブシステムごとに個別に名前（すなわち識別名）が決められている場合があることである。個々のサブシステムを別々に開発した場合等には、このようなことが起こり得る。この場合、同じ属性に対してサブシステムごとに異なる名前が付けられているといった状況も生じ得る。

また、属性のデータ型がサブシステムごとに設計されている場合、同じ属性のデータ型がサブシステムごとに異なっている場合がある。

ワークフローの各段階（すなわち各システム）で属性の名前が異なっていると、下流側のサブシステムが上流側のサブシステムで設定された属性の値を正しく引き継げない場合が出てくる。このような事態を避けるため、従来は、人手により各サブシステム間の属性同士の関連付けを行っていた。しかし、人手による対応には手間暇が掛かる。そこで、本実施形態では、それら各サブシステム間の属性同士の関連付けを支援する属性関連付けシステム１２０を設けている。

属性関連付けシステム１２０は、ワークフロー中の各サブシステムが設定する属性同士の類似性を評価し、その評価結果に従ってサブシステム間での属性同士の関連付けのための支援処理を行う。属性同士の関連付けの最終判断は、人間であるユーザが行う。属性関連付けシステム１２０は、そのユーザに対して関連付けの判断材料となる情報を提示し、ユーザから最終判断を求める。属性同士の類似性は、属性の名前同士の類似度と、属性のデータ形式同士の類似度と、の２つに基づき評価される。属性のデータ形式には、属性の値のデータ型とデータ長との内の少なくとも一つが含まれる。

属性関連付けシステム１２０が実行する処理については、それのベースとなるコンピュータハードウエアの例を説明した後で、詳しく説明する。

属性関連付けシステム１２０は、例えば、汎用のコンピュータを用いて構成される。図３に例示するように、属性関連付けシステム１２０のベースとなるコンピュータは、プロセッサ３０２、ランダムアクセスメモリ（ＲＡＭ）等のメモリ（主記憶装置）３０４、フラッシュメモリやＳＳＤ（ソリッドステートドライブ）、ＨＤＤ（ハードディスクドライブ）等の不揮発性記憶装置である補助記憶装置３０６を制御するコントローラ、各種の入出力装置３０８とのインタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース３１０等が、例えばバス３１２等のデータ伝送路を介して接続された回路構成を有する。上記実施形態の処理の内容が記述されたプログラムが、ネットワーク等を経由してそのコンピュータにインストールされ、補助記憶装置３０６に記憶される。補助記憶装置３０６に記憶されたプログラムが、プロセッサ３０２によりメモリ３０４を用いて実行されることにより、属性関連付けシステム１２０が構成される。

上記各実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ（例えばＣＰＵ：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、等）や、専用のプロセッサ（例えばＧＰＵ：ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＡＳＩＣ：ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、ＦＰＧＡ：ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ、プログラマブル論理デバイス、等）を含むものである。

また上記各実施形態におけるプロセッサの動作は、１つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働してなすものであってもよい。また、プロセッサの各動作は、以上の実施形態において説明した順序のみに限定されるものではなく、適宜に変更してもよい。

次に、図４～図８を参照して、属性関連付けシステム１２０が行う関連付け支援の詳しい例を説明する。

この例では、基幹システム１１０をターゲットシステムとし、このターゲットシステムが設定する属性をターゲット属性と呼ぶ。また、ワークフローシステムにおけるそのターゲットシステムの上流側のサブシステムをソースシステムと呼び、ソースシステムが設定する属性をソース属性と呼ぶ。関連付け支援では、ターゲット属性ごとに、これに対する類似度合いが高いソース属性を、関連付け先の候補としてユーザに提示する。

図４に、ターゲット属性に対するソース属性の得点の求め方の例を示す。この得点は、ターゲット属性に対するソース属性の類似度合い、すなわち関連の強さ、を示す評価値である。

図４の例は、基幹システム１１０をターゲットシステムとし、発注Ｎｏ．をターゲット属性とした場合の例である。またこの例では、ＯＣＲシステム１０６と確認訂正システム１０８をソースシステムとして取り上げている。またソース属性として、ＯＣＲシステム１０６が設定する注文番号、注文日、得意先名、合計金額と、確認訂正システム１０８が設定する案件番号、確認日時、合計金額を取り上げている。

属性関連付けシステム１２０は、ソース属性の得点を、ターゲット属性に対する名前の類似度を示す第１得点と、ターゲット属性に対するデータ型の類似度を示す第２得点とに基づき計算する。すなわち、ソース属性とターゲット属性との名前同士の類似度として第１得点を計算し、それら両属性のデータ型同士の類似度として第２得点を計算し、それら２種類の得点に基づいてソース属性の総合得点を計算する。

第１得点の算出には、名前用語辞書１２２が用いられる。名前用語辞書１２２には、属性の名前に用いられる用語（例えば単語や複合語）ごとに、類義語と得点とが登録されている。例えば図示例では、用語「発注」に対する類義語「注文」、「ご注文」、「オーダー」、「受注」の得点は３０点である。図示は省略したが、名前用語辞書１２２には、単語「発注」に対して、３０点以外の得点（例えば２０点）の類義語が含まれていてもよい。なお、用語に対して類義語でない語句については、例えば得点を０点とする。

属性関連付けシステム１２０による第１の得点の算出は、例えば以下のように行われる。すなわち、ソース属性の名前に含まれる用語（ソース用語と呼ぶ）がターゲット属性の名前に含まれる用語の類義語である場合、名前用語辞書１２２内のその類義語の得点を、そのソース用語の得点とする。このようにして求めたソース用語の得点の合計を、そのソース属性の第１得点とする。なお、この算出手法はあくまで一例に過ぎない。この代わりに例えば意味解析等の自然言語解析の手法を用いてターゲット属性とソース属性の名前同士の類似度すなわち第１得点を計算してもよい。

第２得点の算出には、型変換辞書１２４が用いられる。型変換辞書１２４には、ターゲット属性のデータ型（ターゲット型と呼ぶ）に対して型変換可能なソース属性のデータ型（ソース型と呼ぶ）の各々について、前者に対する後者の類似度の得点が登録されている。なお、同じデータ型も型変換可能なデータ型に含める。図４には、型変換辞書１２４のうち、データ型ｓｔｒｉｎｇ（＝文字列型）に型変換可能な各データ型の得点を示す部分が示される。この部分には、ｓｔｒｉｎｇ型に変換可能なデータ型として、ｓｔｒｉｎｇ型、ｄａｔｅ（＝日付）型、ｉｎｔ（＝整数）型、ｂｏｏｌｅａｎ（＝ブール）型が登録されている。そして、各ソース型の得点として、ｓｔｒｉｎｇ型は３０点、ｄａｔｅ型及びｉｎｔ型は２０点、ｂｏｏｌｅａｎ型は５点が登録されている。

第２得点の計算では、例えば、ソース型がターゲット型に変換可能なものである場合、型変換辞書１２４内のそのソース型の得点を、そのソース属性の第２得点とする。なお、この算出手法はあくまで一例に過ぎない。

総合得点は、例えば第１得点と第２得点とを合計したものとする。図４において、例えばＯＣＲシステム１０６が設定するソース属性の名前「注文番号」は、ターゲット属性の名前「発注Ｎｏ．」のうちの用語「発注」及び「Ｎｏ．」に対してそれぞれ得点が３０点である用語「注文」及び「番号」を含んでいる。したがって、ソース属性「注文番号」の第１得点は６０点である。また、型変換辞書１２４において、ソース属性のデータ型ｓｔｒｉｎｇはターゲット属性のデータ型ｓｔｒｉｎｇに対して３０点の得点を持つので、ソース属性「注文番号」の第２得点は３０点である。したがって、ソース属性「注文番号」の総合得点は９０点となる。また別の例として、ソース属性「注文日」は、「発注」に対して得点が３０点である「注文」を含んでいるので、第１得点が３０点であり、「注文日」のデータ型であるｄａｔｅ型はｓｔｒｉｎｇ型に対して第２得点が２０点である。したがって、ソース属性「注文日」の総合得点は５０点となる。

なお、第１得点と第２得点の合計を総合得点とするのは一例に過ぎない。総合得点の計算には、合計に限らず、第１得点と第２得点を入力変数とする様々な関数を用いることができる。この関数は、第１得点が同じならば第２得点が高いほど、第２得点が同じであれば第１得点が高いほど、出力である総合得点が高くなるものでよい。また、関数の代わりに、第１得点と第２得点との組合せに対する総合得点を出力するルックアップテーブルを用いてもよい。

また図示例では、総合得点の算出において、ソース属性のデータ長がターゲット属性のデータ長より大きい場合には、そのソース属性の総合得点がいかなる値であっても、その総合得点を強制的に０点に変更している。これは、ソース属性の値を、その値よりもデータ長が短いターゲット属性の値に代入しようとすると、桁あふれが生じ、誤った結果となるためである。総合得点は０以上の値であり、総合得点が０点ということは、ソース属性はターゲット属性に対して関連がない、従って関連付けの対象にならない、ことを意味する。

例えば図４において、ＯＣＲシステム１０６が設定するソース属性「得意先名」は、名前に関する第１得点は０点だが、データ型ｓｔｒｉｎｇがターゲット型ｓｔｒｉｎｇに対して３０点なので、第２得点は３０点である。したがって、第１得点と第２得点の合計は３０点である。しかし、ソース属性「得意先名」のデータ長は６４バイトであり、ターゲット属性「発注Ｎｏ．」のデータ長１２バイトよりも長いので、ソース属性「得意先名」の総合得点は強制的に０点に変更される。同様に、ＯＣＲシステム１０６が設定するソース属性「合計金額」も、データ長がターゲット属性のそれよりも長いので、総合得点は０点である。

ただし、ソース属性のデータ型が、類似した意味を持つ別の一以上のデータ型への型変換可能であると定められ、それら別の一以上のデータ型の中にデータ長がターゲット属性のデータ長以下のものがある場合がある。この場合、ソース属性のデータ型を、ターゲット属性のデータ長以下のデータ長である別のデータ型に型変換した上で、総合得点は元の点数、例えば第１得点と第２得点の合計点のままとしてもよい。

例えば、確認訂正システム１０８が設定するソース属性「確認日時」のデータ型は、データ長１７バイトの「ｙｙｙｙＭＭｄｄＨＨｍｍｓｓｆｆｆ」（ｆｆｆは秒の小数点以下３桁の値）の形式であるｄａｔｅｔｉｍｅ型である。このデータ長１７バイトは、ターゲット属性「発注Ｎｏ．」のデータ長１２バイトよりも長い。ここで、ｄａｔｅｔｉｍｅ型がデータ長８バイトの「ｙｙｙｙＭＭｄｄ」の形式であるｄａｔｅ型に変換可能であることが属性関連付けシステム１２０に登録されているとする。この場合、ソース属性「確認日時」のデータ型をｄａｔｅｔｉｍｅ型からｄａｔｅ型に変換すれば、そのソース属性のデータ長はターゲット属性のデータ長以下となる。そこで、ソース属性「確認日時」については、データ型をｄａｔｅ型に変換した上で、その得点を評価する。この場合、名前に関する第１得点は０点だが、データ型についてはｄａｔｅ型はｓｔｒｉｎｇ型に対して２０点なので第２得点は２０点である。そして、８バイト長のｄａｔｅ型は、ターゲット属性のデータ長１２バイト以下なので、０点への強制変更はなされない。このため、ｄａｔｅ型へ変更後のソース属性「確認日時」の総合得点は２０点となる。

なお、属性のデータ長は、属性のデータ型と共に、属性のデータ形式の要素と捉えてもよい。属性のデータ形式は、属性の値の形式のことである。上述の例では、型変換辞書１２４にて、ターゲット型に変換可能なソース型に対して第２得点を定めていたが、この第２得点は、ターゲット型とソース型の類似度を示す得点と捉えてよい。例えば、ターゲット型とソース型が同じである場合、両者の類似度は最大であり、この場合、ソース型には最高得点が与えられる。したがって、データ形式がデータ型のことを指すとした場合、第２得点はターゲット属性とソース属性とのデータ形式同士の類似度を示す評価値といえる。また上述の例では、ソース属性のデータ長がターゲット属性のデータ長より大きい場合に総合得点を強制的に０点にした。これはソース属性のデータ長がターゲット属性のデータ長以下であれば前者は後者に類似し、そうでなければ類似しないという２段階の類似度を定めたものと捉えてよい。この場合、データ形式についての得点である第２得点は、データ長が類似しない場合には負の点数（例えば－１点）、類似する場合には型変換辞書１２４に規定される点数とし、第２得点が負値の場合は、第１得点が何点であっても総合得点を強制的に０点とする。０点という総合得点は、０以上の値域をとる総合得点の最低点であり、ソース属性がターゲット属性に対してまったく関連がない（又は関連が極めて薄い）ことを示す。一つの例では、総合得点が０点のソース属性は、ユーザがターゲット属性に対するソース属性を選ぶ際の選択肢に入れない。

図５に示す例では、ターゲット属性は、３２バイト長のｉｎｔ型の「発注金額」である。この例では、ＯＣＲシステム１０６のソース属性「注文番号」及び「合計金額」、並びに確認訂正システム１０８のソース属性「合計金額」は、いずれもｓｔｒｉｎｇ型であるが、その属性の値に含み得る文字が制限されている。例えば、ＯＣＲシステム１０６のソース属性「注文番号」は、１２バイト長の文字列（すなわちｓｔｒｉｎｇ）であり、その文字列に含まれる文字は半角英数字（すなわち０－９までの数字と英小文字と英大文字）に限られる。また「合計金額」のデータ型は、ｓｔｒｉｎｇ［＼,.0-9］である。すなわち「合計金額」は、半角の「＼」マークの後に半角数字が続く３２バイトの文字列である。型変換辞書１２４には、ターゲット型ｉｎｔに対して、ソース型としてｉｎｔ型は３０点、半角の「＼」マークの後に半角数字が続くｓｔｒｉｎｇ型は２０点、ｂｏｏｌｅａｎ型は５点が定められている。なお、半角の「＼」マークの後に半角数字が続く形式に該当しないｓｔｒｉｎｇ型は、型変換辞書１２４のターゲット型ｉｎｔに対応するソース型として登録されていない。これは、そのような一般的なｓｔｒｉｎｇ型はターゲット型ｉｎｔに変換不可であることを示す。このように、型変換辞書１２４には、ターゲット型に変換不可であるソース型は登録されない。

この例では、例えばＯＣＲシステム１０６のソース属性について説明すると、まず「注文番号」は、ターゲット属性の名前に含まれる用語「発注」に対して３０点の用語「注文」を含んではいるので、第１得点は３０点である。しかし、そのソース型は小文字及び大文字のアルファベットを含み得るｓｔｒｉｎｇ型であり、これはターゲット型ｉｎｔに変換不可である。この例では、ソース型がターゲット型に変換不可の場合、第２得点は、例えば総合得点を強制的に０点にすることを示す値とする。したがって、図５の例では、ターゲット属性「発注金額」に対するソース属性「注文番号」の総合得点は０点となる。同様に、「注文日」も、そのデータ型ｄａｔｅがターゲット型へと変換不可なので、総合得点は０点となっている。「得意先名」は、名前に関する第１得点が０点であると共に、データ長がソースのデータ長よりも大きいためソース型はターゲット型に変換不可である。これら両方の点から「注文日」の総合得点は０点となる。またソース属性「合計金額」は、名前用語辞書１２２にてターゲット属性の名前の用語「金額」に対して３０点の用語「合計金額」を含んでいるので、第１得点が３０点である。またそのデータ型ｓｔｒｉｎｇ［＼,.0-9］は、ターゲット型ｉｎｔに対して２０点なので、第２得点は２０点である。これらから、ＯＣＲシステム１０６のソース属性「合計金額」の総合得点は５０点となる。

しかし、ＯＣＲシステム１０６のソース属性「合計金額」は、確認訂正システム１０８のソース属性「合計金額」と同じものであることが分かると、ワークフロー上の順序が相対的に前であるＯＣＲシステム１０６のソース属性「合計金額」の総合得点は所定の点数（図示例では３０点）だけ減点される。

ワークフロー上の異なるサブシステムにおいて同じ属性が設定される場合、それは、あるサブシステムが設定したその属性の値を、ワークフロー上での順序がそれより後の別のサブシステムが修正又は上書きすることを意味する。したがって、同じ属性であれば、順序が後のサブシステムが設定した値の方が、順序が前のサブシステムが設定した値よりも、ターゲット属性の値に相応しい可能性が高い。そこで、順序が後の確認訂正システム１０８のソース属性「合計金額」の総合得点５０点は維持し、順序が前のＯＣＲシステム１０６のソース属性「合計金額」の総合得点を減点するのである。この減点により総合得点が０点以下になる場合には、その総合得点を、０点より高い最低点（例えば５点）に変更する。総合得点は０点以上の値であり、０点はソース属性がターゲット属性にまったく関連しないことを示す値である。これに対して、総合得点が所定値だけ減点されたソース属性は、減点は受けたものの、属性の名前やデータ形式からみてターゲット属性とまったく関連がないとはいえない。そこで、減点されたソース属性が、属性間の関連付けを最終的に判断するユーザに提示する選択肢から外されないよう、減点後の点数の下限を０点より高い点数にとどめている。総合得点が０点よりも高いというのは、ソース属性をＧＵＩ画面８００に表示する候補に選定するための閾値に相当する。

このように、図５に示した例では、互いに関連するＯＣＲシステム１０６のソース属性「合計金額」と確認訂正システム１０８のソース属性「合計金額」のうち、上流側である前者の総合得点を減点している。このような減点により、下流側のサブシステムの属性の方が、ターゲット属性により関連が強いものとして扱われることとなる。

以上に説明した処理により、ターゲット属性に対する各ソース属性の総合得点を求めると、次に属性関連付けシステム１２０は、ターゲット属性に関連付けるソース属性を決定するためのＵＩ（ユーザインタフェース）画面を生成し、ユーザに提示する。このＵＩ画面は、例えばＧＵＩ（グラフィカルＵＩ）の形態（以下、ＧＵＩ画面と呼ぶ）のものとする。

本実施形態では、ソース属性を総合得点に基づいて、（ａ）自動マッピング候補、（ｂ）レコメンド候補、（ｃ）一般候補、（ｄ）非候補、の４種類に分類する。

分類（ａ）に属するソース属性、すなわち自動マッピング候補は、ターゲット属性に対して自動マッピング、すなわち自動的な関連付け、が行われるソース属性である。自動マッピング候補は、ＧＵＩ画面において、ターゲット属性に対する自動的なマッピング結果として表示される。この自動的なマッピング結果は、ユーザによって別の候補へと変更可能であるが、ユーザがこのような変更を行わなければ、ターゲット属性に対する最終的なマッピング結果としてターゲットシステムに登録されることとなる。すなわち自動マッピング候補は、ターゲット属性に関連付けるソース属性として仮選択されたソース属性であるといえる。自動マッピング候補は、ＧＵＩ画面上で、分類（ｂ）に属するレコメンド候補や、分類（ｃ）に属する一般候補よりも、強調された表示形態で表示される。マッピング候補は、通常の利用シーンでは、１つのターゲット属性に対して高々１つである。

分類（ｂ）に属するレコメンド候補は、マッピング対象としてユーザにレコメンドすなわち推奨するソース属性である。レコメンド候補は、自動マッピング候補よりもターゲット属性に対する関連度合い（すなわち総合得点）が低いので、自動マッピングは行わず、ユーザにレコメンドするにとどめる。レコメンド候補は、ＧＵＩ上では、分類（ｃ）に属する一般候補より強調された表示形態で表示される。レコメンド候補は、ＧＵＩ画面上でユーザからマッピング対象として選択されてはじめて、ターゲット属性に関連付けられる資格を得る。逆に言えば、単にレコメンドされただけで、ユーザからマッピング対象に選択されていないソース属性は、ターゲット属性と関連付けられない。レコメンド候補の数は、高々一つ、又は比較的少数に制限される。

分類（ｃ）に属する一般候補は、マッピング対象の選択肢としてユーザに提示されるソース属性である。一般候補の総合得点は、レコメンド候補のそれよりも低いが、０点よりは高い。

分類（ｄ）に属する非候補は、マッピング対象の選択肢すなわち候補でないソース属性である。非候補に該当するソース属性の総合得点は０点である。０点は、総合得点が取りうる値の範囲の中の最低点である。総合得点が０点のソース属性は、名前及びデータ形式のいずれの観点からもターゲット属性と関連がないといえる。

自動マッピング候補は、ターゲット属性と同じ属性である可能性が極めて高いソース属性であり、逆に言えばこれをターゲット属性に関連付けたとしても誤りとなる可能性は極めて低い。これに対して、レコメンド候補は、ターゲット属性と同じ属性である可能性は高いが、そうでない可能性もある程度あるため、自動的に関連付けることはせず、ユーザに推奨するにとどめる。一般候補は、ターゲット属性と同じ属性である可能性はあるが、そうでない可能性も低くないので、推奨すらせず、単に一般的な候補としてユーザに提示する。非候補は、ターゲット属性と同じ属性である可能性がないソース属性であり、これについては、候補にすら選ばない。

図６を参照して、属性関連付けシステム１２０によるソース属性の分類処理について例示する。この処理では、属性関連付けシステム１２０内の閾値記憶部６０２に記憶されている二つの閾値、すなわち第１閾値Ａ及び第２閾値Ｂ（ただしＡ＞Ｂ）を用いる。

属性関連付けシステム１２０は、ターゲット属性ごとに、そのターゲット属性に対する各ソース属性の総合得点を計算する。そして、ソース属性のうち総合得点が最高点のものを探索し、その最高点を第１閾値Ａ及び第２閾値Ｂと比較する（６０４）。そして、最高点が第１閾値Ａ以上であれば、その最高点を持つソース属性を、分類（ａ）すなわち自動マッピング候補に選ぶ（６０６）。またその最高点が第２閾値Ｂ以上かつ第１閾値Ａ未満であれば、その最高点を持つソース属性をレコメンド候補に選ぶ（６０８）。またその最高点が第２閾値Ｂ未満だが０より高ければ、その最高点を持つソース属性を一般候補とする（６１０）。そして、その最高点が０点の場合、その最高点を持つソース属性を非候補とする（６１２）。

図６に例示したのは、あるターゲット属性に対する総合得点が最高点であるソース属性についての分類処理であった。総合得点が最高点より低いソース属性については、一つの例では、総合得点が０より高いものは一律に一般候補とし、総合得点が０点のものは非候補とする。この例では、最高点である単一のソース属性のみが、自動マッピング候補又はレコメンド候補となり得る。

また、別の例として、最高点以外のソース属性にも、自動マッピング（６０６）を除き、図６に示したものと同様の分類を行ってもよい。自動マッピング候補は、高々一つに限定されるので、最高点以外のものは自動マッピング候補にはならない。最高点以外のソース属性で、その総合得点が第１閾値Ａ以上のものは、自動マッピング候補ではなくレコメンド候補とする。また、レコメンド候補の数に上限を設けている場合、総合得点が第２閾値Ｂ以上であるソース属性のうち、自動マッピング候補を除いて総合得点が上位からその上限の数までのものはレコメンド候補とし、その数を超えたものについては一般候補とする。

図７に、ターゲットシステムである基幹システム１１０の２つのターゲット属性、発注Ｎｏ．及び発注金額についての、属性関連付けシステム１２０によるソース属性の分類結果のデータを例示する。

この例では、発注Ｎｏ．に対しては、自動マッピング候補７０２として、「［ＯＣＲ］＞「注文番号」」と表現されるソース属性が選ばれている。「［ＯＣＲ］＞「注文番号」」と言う表現は、ＯＣＲシステム１０６が設定する属性のうちの「注文番号」という名前の属性を指し示す。すなわち、この表現のうち「＞」より左側はソースシステムの識別名であり、右側はそのソースシステムが設定する属性の名前を示す。また、発注Ｎｏ．に対して、一般候補７０６として「［ＯＣＲ］＞「注文日」」、「［確認訂正］＞「案件番号」」、「［確認訂正］＞「確認日時」」と言う３つの属性が選ばれている。このうち例えば「［確認訂正］＞「案件番号」」は、確認訂正システム１０８が設定する属性のうち名前が「案件番号」である属性を指し示す。

また図７の例では、ターゲット属性「発注金額」に対しては、レコメンド候補７０４として確認訂正システム１０８が設定する属性「合計金額」が、一般候補７０６としてＯＣＲシステム１０６が設定する属性「合計金額」が、それぞれ選ばれている。

図８に、属性関連付けシステム１２０がユーザに提示するＧＵＩ画面８００の例を示す。

このＧＵＩ画面８００は、基幹システム１１０をターゲットシステムとした場合のものであり、同画面内にはターゲットシステムの名前８０２が表示される。またこのＧＵＩ画面８００には、必要属性８０４とマッピング属性８０６のペアが列挙して表示される。必要属性８０４はターゲットシステムが設定するターゲット属性であり、マッピング属性８０６はそのターゲット属性に対して関連付けるソース属性である。

属性関連付けシステム１２０が上述の方法でターゲット属性に対する自動マッピング候補を見いだした場合、ユーザに対してＧＵＩ画面８００を最初に提示する時点では、そのターゲット属性に対するマッピング属性８０６の欄にその自動マッピング候補を表示する。図８に示したＧＵＩ画面８００がそのような「最初に提示する」画面であった場合、必要属性８０４の「発注Ｎｏ．」に対するマッピング属性８０６であるＯＣＲシステム１０６のソース属性「注文番号」は、自動マッピングされたものである。これに対して、「見積Ｎｏ．」、「発注日」、「発注金額」については、自動マッピング候補は見いだされていない。

マッピング属性８０６の欄に表示されるマッピング属性は、そのソース属性を設定するソースシステムを特定する情報と、そのソース属性の名前と、の組で表現される。図示例における「発注Ｎｏ．」に対するマッピング属性「［ＯＣＲ］＞「注文番号」」のうち、［ＯＣＲ］は、そのマッピング属性を設定するソースシステムであるＯＣＲシステム１０６を示す。また「注文番号」はそのマッピング属性の属性名である。

マッピング属性８０６の欄の右側にはマッピング属性８０６の候補リスト８１０を呼び出すためのボタン８０８が表示される。候補リスト８１０又は８２０は、例えばプルダウンメニューの形態で表示される。

図示例では、例えば必要属性「発注Ｎｏ．」に対応するボタン８０８がユーザにより押下されると、候補リスト８１０が表示される。この候補リスト８１０には一般候補であるソース属性が三つ列挙されている。

この候補リスト８１０に示される候補のソース属性も、そのソース属性を設定するソースシステムを特定する情報と、そのソース属性の名前と、の組で表現される。この表現により、ユーザは、表示された各候補がどのサブシステムのどの属性であるかを把握しやすい。

この候補リスト８１０に示された最下段の候補「［確認訂正］＞「確認日時」」には警告マーク８１２が表示されている。この警告マーク８１２は、その候補を必要属性「発注Ｎｏ．」にマッピングするには型変換が必要であることを示す。警告マーク８１２をクリックする等の操作に応じて、「マッピングするにはｄａｔｅｔｉｍｅ型からｄａｔｅ型が必要です。」といった、必要な型変換を説明するメッセージを表示してもよい。

また例えば必要属性「発注金額」に対応するボタン８０８がユーザにより押下されると、候補リスト８２０が表示される。この候補リスト８２０には２つの候補が含まれる。そのうちの最初の候補「［確認訂正］＞「合計金額」」はレコメンド候補であり、その下の一般候補である「［ＯＣＲ］＞「合計金額」」よりも表示が強調されている。一般候補に対するレコメンド候補の表示の強調の仕方は特に限定されない。例えば、文字又は背景の色をより目立つ色にすることで強調を行ってもよい。

図８に示した必要属性「発注Ｎｏ．」及び「発注金額」についての例は、図４及び図５に示した総合得点の例において、第１閾値Ａを８０点、第２閾値Ｂを５０点とした場合の例である。

ユーザは、表示されたＧＵＩ画面８００上で、各必要属性８０４に対してマッピング属性８０６を決定していく。例えば、必要属性「発注金額」にマッピング属性８０６が表示されていないことを認識したユーザは、候補リスト８２０を呼び出し、その候補リスト８２０に列挙された候補の中から、マッピング属性とするものを選択する。候補リスト８２０の中からユーザが例えば「［確認訂正］＞「合計金額」」を選択すると、属性関連付けシステム１２０は、「発注金額」に対するマッピング属性８０６の欄に「［確認訂正］＞「合計金額」」を表示する。また、ユーザは、必要属性「発注金額」のマッピング属性８０６の欄に表示されている「［ＯＣＲ］＞「注文番号」」が正しいか確認するために、候補リスト８１０を呼び出して他の候補を確認してもよい。候補リスト８１０の中に「［ＯＣＲ］＞「注文番号」」よりも相応しいマッピング対象のソース属性がある場合、ユーザは候補リスト８１０上のそのソース属性を選択する。これに応じて、属性関連付けシステム１２０は、選択されたソース属性をマッピング属性８０６の欄に表示する。また、マッピング属性８０６欄内の「［ＯＣＲ］＞「注文番号」」が正しいことを確認した場合は、候補リスト８１０を単に閉じればよい。

なお、必要属性８０４の中には、ソース属性への関連付けが不要なものもある。例えばターゲットシステム上でユーザが値を入力するターゲット属性については、ソース属性への関連付けは不要である。このようにソース属性への関連付けが不要な必要属性については、マッピング属性８０６は空欄のままとなる。

ユーザは、ターゲットシステムにおける必要属性へのマッピング属性８０６の指定を終えると、完了ボタン８３０を押下する。この押下に応じて、属性関連付けシステム１２０は、ＧＵＩ画面８００に表示されている各必要属性８０４に対するマッピング属性８０６の情報を、ターゲットシステムに登録する。

ターゲットシステムは、必要属性に対応付けて登録されたマッピング属性の値をソースシステムから取得し、その必要属性の値に設定することにより、自分の処理を実行する。

次に、図９～図１１を参照して、属性関連付けシステム１２０の処理手順の例を説明する。

図９は、全体的な処理手順の例を示す。

この処理のために、属性関連付けシステム１２０は、ワークフローシステムの構成を特定する情報の入力を受け付ける。この情報には、ワークフローを構成する各サブシステムを特定する情報、ワークフローにおけるそれらサブシステムの順序関係を特定する情報、各サブシステムが設定する属性の名前及びデータ形式を特定する情報が含まれる。

属性関連付けシステム１２０は、そのワークフローの上流側から順に、サブシステム間の属性の関連付けを行っていく。図９に示す手順では、属性関連付けシステム１２０は、ワークフローの最上流から２番目のサブシステムを注目システムとし（９０２）、注目システムが設定する各属性に対する、その上流のサブシステムが設定する属性の関連付けを決定するための処理を実行する。

この処理では、属性関連付けシステム１２０は、注目システムをターゲットシステムとして、関連付けのためのＧＵＩ画面８００を生成して表示する（９０４）。ステップ９０４の処理の詳細な例については、あとで図１０を参照して説明する。

次に属性関連付けシステム１２０は、ＧＵＩ画面８００に対するユーザからの入力を受け付ける（９０６）。ユーザからの入力には例えば、候補リスト８１０又は８２０の呼び出し、候補リスト８１０又は８２０からのマッピング属性の選択、完了ボタン８３０の押下等がある。次に属性関連付けシステム１２０は、ユーザの入力が完了ボタン８３０の押下か否かを判定し（９０８）、この判定の結果がＮｏ（否定）ならば、ステップ９０６に戻ってユーザからの次の入力を受け付ける。ステップ９０８の判定結果がＹｅｓの場合、属性関連付けシステム１２０は、ＧＵＩ画面８００に表示された必要属性（＝ターゲット属性）８０４とマッピング属性（＝ソース属性）との関連付けをターゲットシステムに対して登録する（９１０）。

そして、属性関連付けシステム１２０は、現在の注目システムがワークフローにおける最下流のサブシステムであるか否かを判定する（９１２）。この判定の結果がＮｏの場合、ワークフローにおいて現在の注目システムから一つ下流のサブシステムを新たな注目システムとし（９１４）、ステップ９０４から９１２までの処理を繰り返す。ステップ９１２の判定結果がＹｅｓの場合、属性関連付けシステム１２０は、図９に示す全体的な処理手順を終了する。

以上に説明したように、図９の手順では、ワークフローの上流から順に、サブシステム間の属性同士の関連付けが決定されていく。

次に図１０を参照して、上述したステップ９０４の処理の詳細な例を説明する。この手順では、属性関連付けシステム１２０は、まずステップ９０２又は９１４で決定された注目システムをターゲットシステムとし（１００２）、ターゲットシステムの属性すなわちターゲット属性ごとにステップ１００４の処理を繰り返す。ステップ１００４では、各ターゲット属性について、上流の各サブシステムの各属性すなわちソース属性の関連度合いを評価する。このステップ１００４の詳細な処理の例については、あとで図１１を参照して説明する。

ステップ１００４の後、属性関連付けシステム１２０は、ワークフローにおいてターゲットシステムの一つ上流のサブシステムが、そのワークフローの最上流であるか否かを判定する（１００６）。この判定の結果がＮｏの場合、属性関連付けシステム１２０は、現在のターゲットシステムよりもワークフローにおいて１段階上流のサブシステムを新たなターゲットシステムとし（１００８）、ステップ１００４～１００６の処理を繰り返す。

この繰り返しによりステップ１００６の判定結果がＹｅｓとなると、属性関連付けシステム１２０は、注目システムの各属性に対する上流の各サブシステムの属性の関連度合いの得点を再評価する（１０１０）。この再評価は、確定済みの上流のサブシステム間での属性同士の関連付けに基づいて行う。すなわち、図９の手順のステップ９０４～９１４をワークフローの上流側から実行していくことにより、上流側から順に、サブシステムの属性に関連付ける更に上流のサブシステムの属性が、ＧＵＩ画面８００に対するユーザの操作により確定されていく。再評価では、このように関連付けが確定された属性同士の間では、例えば、最下流のものの総合得点は維持し、最下流以外のものの総合得点は減点する。減点幅は固定値であってもよいし、上流ほど減点幅を相対的に大きくしてもよい。なお、この例では互いに関連するものとして確定されたソース属性のうち、最下流のソース属性以外のものの総合得点を減点したが、これは一例に過ぎない。減点の代わりに、例えば、最下流のソース属性の総合得点を加点してもよい。

例えば、図１及び図５に示した例では、確認訂正システム１０８を注目システムとしたときのステップ９０４～９１４の処理にて、確認訂正システム１０８の属性「合計金額」に対してＯＣＲシステム１０６の属性「合計金額」が関連付けられる。したがって、基幹システム１１０の属性「発注金額」に対する関連度合いの評価において、名前及びデータ形式に応じて算出された総合得点を再評価する際、下流側の確認訂正システム１０８の属性「合計金額」の総合得点は維持され、上流側であるＯＣＲシステム１０６の属性「合計金額」の総合得点は所定値だけ減点される。

減点されたソース属性は、減点される前よりも、ＧＵＩ画面８００における、ユーザへの推奨のレベルが低くなる。すなわち、減点される前は第１閾値Ａ以上あった総合得点が減点により第１閾値Ａを下回れば、そのソース属性は自動マッピング候補としてＧＵＩ画面８００に表示されることはなくなり、レコメンド候補又は一般候補として表示されることとなる。このように、減点されたソース属性は、ターゲット属性に対する関連の強い候補として表示されにくくなる。

次に属性関連付けシステム１２０は、注目システムの属性ごとに、ステップ１０１２～１０２０の処理を実行する。

すなわち、属性関連付けシステム１２０は、各ソース属性のうちステップ１００４で求めた総合得点が最高点のものを抽出し（１０１２）、抽出したソース属性の総合得点を第１閾値Ａと比較する（１０１４）。この比較の結果、総合得点が第１閾値Ａ以上であるかどうかを判定し（１０１６）、総合得点が第１閾値Ａ以上であれば、抽出したソース属性を、ＧＵＩ画面８００における自動マッピング候補に設定する（１０１８）。

この後属性関連付けシステムは、ステップ１００４で計算した総合得点が０点より大きい各ソース属性をＧＵＩ画面８００の一般候補に設定し（１０２０）、注目システムの属性についての処理を終了する。

ステップ１０１６の判定で、総合得点が第１閾値Ａ未満であれば、属性関連付けシステム１２０は、抽出した属性の総合得点を第２閾値Ｂと比較し（１０２２）、この比較の結果、総合得点が第２閾値Ｂ以上であるかどうかを判定する（１０２４）。この判定で総合得点が第２閾値Ｂ以上であれば、抽出したソース属性を、ＧＵＩ画面８００におけるレコメンド候補に設定する（１０２６）。ステップ１０２４の判定で総合得点が第２閾値Ｂ未満であれば、抽出したソース属性をＧＵＩ画面８００の一般候補に設定する（１０２８）。ステップ１０２６又は１０２８の後、ステップ１００４で計算した総合得点が０点より大きい各ソース属性をＧＵＩ画面８００の一般候補に設定し（１０２０）、注目システムの属性についての処理を終了する。

このようにして、図１０の手順により、注目システムの各属性について自動マッピング候補、レコメンド候補、及び一般候補が設定され、ＧＵＩ画面８００が表示可能となる。

次に図１１を参照して、上述したステップ１００４の処理の詳細な手順を例示する。

この手順では、属性関連付けシステム１２０は、まずステップ１００４で注目しているターゲット属性の情報、例えば名前、データ型、データ長等の情報を取得する（１１０２）。

次に属性関連付けシステム１２０は、個々のソース属性にそれぞれ注目し、それら注目するソース属性ごとに、ステップ１１０４～１１２４の処理を実行する。この処理では、まず注目するソース属性の名前、データ型、データ長等の情報を取得する（１１０４）。そして、ターゲット属性の名前と注目するソース属性の名前から、名前用語辞書１２２を参照して、名前の類似度を示す第１得点を計算する（１１０６）。またターゲット属性のデータ型と注目するソース属性のデータ型から、型変換辞書１２４を参照して、データ型の類似度を示す第２得点を計算する（１１０８）。次に、ターゲット属性のデータ長と注目するソース属性のデータ長とを比較し（１１１０）、後者が前者以下であるかどうかを判定する（１１１２）。この判定で、注目するソース属性のデータ長がターゲット属性のデータ長以下であれば（ステップ１１１２の判定結果が「小」）、第１得点と第２得点の合計を、注目するソース属性の総合得点にセットし（１１２４）、当該ソース属性についての処理を完了する。

ステップ１１１２の判定で、注目するソース属性のデータ長がターゲット属性のデータ長より大きい場合、属性関連付けシステム１２０は、そのソース属性をデータ長の異なる別のデータ型に変換可能かどうかを評価する（１１１４）。例えば、上述の例では、１７バイトのｄａｔｅｔｉｍｅ型に対して８バイトのｄａｔｅ型が変換先として属性関連付けシステム１２０に登録されていた。このように、ソース属性のデータ型に対して、データ長の異なる別のデータ型が登録されているかをステップ１１１４で調べる。この評価の結果、変換可能かどうかを判定し（１１１６）、判定の結果が変換不可であれば、注目するソース属性の総合得点を０点にセットし（１１１８）、当該ソース属性についての処理を終了する。ステップ１１１６の判定の結果が変換可能であることを示す場合、変換後のデータ型のデータ長をターゲット属性のデータ長と比較し（１１２０）、前者が後者以下であるかどうかを判定する（１１２２）。変換後のデータ型のデータ長がターゲット属性のデータ長以下である場合、第１得点と第２得点の合計を、注目するソース属性の総合得点にセットし（１１２４）、当該ソース属性についての処理を完了する。ステップ１１２２の判定で、変換後のデータ型のデータ長がターゲット属性のデータ長より長い場合、注目するソース属性の総合得点を０点にセットし（１１１８）、当該ソース属性についての処理を終了する。

以上に説明した図１１の処理手順により、各ソース属性のターゲット属性に対する総合得点が計算される。

以上に説明した図９～図１１の処理手順では、ワークフローの上流のサブシステムから順に、そのサブシステムの属性をソース属性と関連付けていく。このようにすることで、サブシステムの属性についての関連付けの作業のやり直しが抑止又は低減される。

すなわち、仮に、下流側の装置が設定する属性についての関連付けを先に終えた後、それより上流の各装置が設定する属性同士の関連付けを行うと、それら上流の属性同士の関連付けの結果に応じてそれら属性の総合得点に対する減点が変化する。このため、各ソース属性の総合得点が変化し、その結果、属性関連付けシステム１２０がＧＵＩ画面８００に提示する自動マッピング候補やレコメンド候補が変化し、これら候補をみて行うユーザの判断が変化し、関連付けのやり直しが必要になる可能性がある。これに対し、本実施形態のように上流側から関連付けを確定していけば、そのようなやり直しは起こりにくい。

以上、本実施形態の処理について説明した。

図９に示した手順では、ワークフローの上流側から順に全てのサブシステムを注目システムとし、注目システムのためのＧＵＩ画面８００を提供した。別の例として、属性関連付けシステム１２０は、全ての属性について自動マッピング候補が求めることができた注目システムについては、ＧＵＩ画面８００を提供せず、それら各属性に対してそれぞれ自動マッピング候補を関連付けて注目システムに登録してもよい。

また、属性関連付けシステム１２０は、図１２に例示するような進捗画面１２００を画面に表示し、ユーザにワークフローの上流のサブシステムから順に属性マッピングの確認を促してもよい。進捗画面１２００には、ワークフロー図１２０２が示される。ワークフロー図１２０２は、ワークフローを構成する各サブシステムを示すブロックと、それらブロック間の処理の流れを示す矢印から構成される。また、ワークフロー図内の各サブシステムのブロックの近傍には、そのサブシステムにおける属性マッピングの進捗状況を示すマーク１２０４、１２０６又は１２０８が表示される。マーク１２０４は、当該サブシステムが設定する属性の中に、図１０及び図１１の手順によりソース属性との自動マッピングができなかった属性があることを示す。マーク１２０６は、当該サブシステムが設定する全ての属性についてソース属性との自動マッピングができている（ただしユーザによるマッピングの確定操作は受けていない）ことを示す。またマーク１２０８は、当該サブシステムが設定する属性のマッピングについてユーザの確定操作が済んだことを示す。

進捗画面１２００には、各マークの説明と、上流側からマッピングの確認又は入力を行うことを促すメッセージとが表示される。サブシステムに付されたマーク１２０４又は１２０６を選択してＧＵＩ画面８００を開くことができるのは、そのサブシステムの上流の全てのサブシステムについて自動マッピング又はユーザによる確定が済んでいる場合に限ってもよい。すなわち、あるサブシステムに付されたマーク１２０４又は１２０６は、上流側のサブシステムの中にマーク１２０４が付されたものが一つでもあれば選択不可状態となり、そうでなければ選択可能状態となる。

属性関連付けシステム１２０は、図１０及び図１１に例示した処理が終わった時点では、各サブシステムにマーク１２０４又は１２０６を表示した進捗画面１２００を表示する。あるサブシステムのマーク１２０４～１２０８がクリック操作等で選ばれると、属性関連付けシステム１２０は、ＧＵＩ画面８００（図８参照）をユーザに提示し、関連付けの確認又は入力を受け付ける。ＧＵＩ画面８００上でユーザが完了ボタン８３０を押下すると、当該サブシステムの属性マッピングがユーザにより確定されたことになり、進捗画面１２００上の当該サブシステムのブロックに対してマーク１２０８が表示される。

さて、属性関連付けシステム１２０は、ＧＵＩ画面８００上でのユーザによるマッピング属性の選択結果を学習し、次回以降の得点の算出に反映させる機能を更に備えていてもよい。この機能は、ＧＵＩ画面８００の候補リスト８１０又は８２０（図８参照）内の候補をユーザがマッピング属性８０６に選択した場合、次回以降の属性マッピングの際、必要属性８０４（＝ターゲット属性）に対するその候補の得点が高くなるように学習する。この学習は、例えば、ユーザが選択した候補の名前に含まれる用語の、必要属性の名前中の対応する用語に対する得点を上昇させることにより行う。

例えば、必要属性「見積Ｎｏ．」に対して、ユーザが候補リスト８１０中の「［確認訂正］＞「案件番号」」をマッピング属性８０６に選択した場合を考える。

この選択が行われる前の名前用語辞書１２２では、用語「見積」に関するエントリは、図１３の状態（ａ）に示すように、得点３０点の類義語「見積」、「見積もり」、及び「見積り」のみが登録されていたものとする。この時点では用語「案件」は用語「見積」の類義語ではない。このため、ソース属性「［確認訂正］＞「案件番号」」の、必要属性「見積Ｎｏ．」に対する属性の名前の類似度を示す第１得点は、用語「Ｎｏ．」に対する類義語「番号」の得点のみである。この結果、データ型の類似度を示す第２得点を加算した総合得点でも、そのソース属性は自動マッピング候補にはならず、一般候補に留まったとする。

この後、ＧＵＩ画面８００の候補リストで、ユーザが必要属性「見積Ｎｏ．」のマッピング属性８０６として候補リストからこのソース属性「［確認訂正］＞「案件番号」」を選択したとする。この場合、属性関連付けシステム１２０は、「案件番号」を「見積Ｎｏ．」と同じ意味であることを認識し、用語「案件」を用語「見積」の類義語として名前用語辞書１２２に登録する。この場合の名前用語辞書１２２における「案件」の得点は、予め定めた値であってもよい。また、別の例として、ソース属性「［確認訂正］＞「案件番号」」の総合得点が自動マッピング候補を選ぶ基準点すなわち第１閾値Ａ以上となるために不足している点数を、用語「案件」の得点としてもよい。例えば、ソース属性「［確認訂正］＞「案件番号」」の総合得点が６０点であり、第１閾値Ａが８０点である場合、そのソース属性が自動マッピング候補となるのに不足する点数は２０点である。このため、用語「案件」を用語「見積」の類義語として名前用語辞書１２２に登録する場合の得点は２０点とすればよい。名前用語辞書１２２の用語「見積」に関するエントリに類義語「案件」を追加した状態を図１３の状態（ｂ）に示す。図１３の状態（ｂ）では、類義語「案件」に対する得点は２０点とされている。

図１３の例は、ユーザによるマッピング属性の選択の前に、用語「案件」が名前用語辞書１２２に類義語として登録されていない場合の例であった。一方、その選択の前に用語「案件」が用語「見積」の類義語として名前用語辞書１２２に登録済である場合もあり得る。この場合、属性関連付けシステム１２０は、ソース属性「［確認訂正］＞「案件番号」」が選択されたことに応じて、名前用語辞書１２２における用語「見積」に対する類義語「案件」の得点を上昇させる。上昇幅は予め定められた値であってもよいし、ソース属性「［確認訂正］＞「案件番号」」が自動マッピング候補となるのに不足している点数としてもよい。また、名前用語辞書１２２における用語「見積」に対する類義語「案件」の得点だけでなく、用語「Ｎｏ．」に対する類義語「番号」の得点も同時に上昇させてもよい。この場合の上昇分は、例えば上述した不足分の点数を「案件」と「番号」で均等割としたものとしてもよい。

１００：データエントリシステム
１０２：メールサーバ
１０４：スキャナ
１０６：ＯＣＲシステム
１０８：確認訂正システム
１１０：基幹システム
１１２：文書管理システム
１２０：属性関連付けシステム
１２２：名前用語辞書
１２４：型変換辞書
３０２：プロセッサ
３０４：メモリ
３０６：補助記憶装置
３０８：入出力装置
３１０：ネットワークインタフェース
３１２：バス
８００：ＧＵＩ画面
８０２：名前
８０４：必要属性
８０６：マッピング属性
８０８：ボタン
８１０：候補リスト
８１２：警告マーク
８２０：候補リスト
８３０：完了ボタン

Claims

プロセッサを備え、
前記プロセッサは、
ワークフローを構成する複数の装置のうちの第１装置で設定されるデータである第１データと、前記複数の装置のうちの前記第１装置以外の装置で設定されるデータである第２データとの間の、名前同士の類似度である第１類似度と、データ形式同士の類似度である第２類似度とに基づいて、前記第１データに関連付けるべき前記第２データの候補を選定し、
選定された前記候補ごとに、前記第１データの名前と、当該候補の名前と、当該候補の設定が行われる前記装置の名前と、を互いに対応付けて表示する第１画面であって、前記候補の中から前記第１データと関連付ける第２データの選択を受け付けるための第１画面、を生成する、
ことを特徴とする情報処理装置。
前記第２データは、前記第１装置よりも前記ワークフローの上流の装置で設定されるデータであり、
前記プロセッサは、
前記ワークフローの上流側の前記装置から順に、当該装置を前記第１装置として前記第１画面を生成し、生成した前記第１画面を用いて１以上の前記候補の中から前記第１データに関連付けるものの選択を受け付ける、
ことを特徴とする請求項１に記載の情報処理装置。
前記ワークフローの上流側の前記装置から順に行われた前記選択の結果互いに関連付けられた前記第２データ同士の間では、当該第２データが設定される前記装置が前記ワークフロー中で上流である前記第２データほど、前記第１画面において前記第１データに対する関連が強い候補として表示されにくくなることを特徴とする請求項２に記載の情報処理装置。
互いに関連付けられる前記第２データ同士の間では、当該第２データが設定される前記装置が前記ワークフロー中で上流である前記第２データほど、前記第１画面において前記第１データに対する関連が強い候補として表示されにくくなる、ことを特徴とする請求項１に記載の情報処理装置。
前記データ形式には、少なくともデータ型が含まれ、
前記第２データのうち前記第１データと同じデータ型のものは、そうでないものよりも前記第２類似度が高いと判定される、
ことを特徴とする請求項１に記載の情報処理装置。
前記第１データと同じデータ型でない前記第２データ同士の間では、型変換により前記第１データと同じデータ型に変換可能なものの方が、そうでないものよりも前記第２類似度が高いと判定される、
ことを特徴とする請求項５に記載の情報処理装置。
前記第１画面には、選定された前記候補のうち、前記第１データと同じデータ型にするために型変換が必要な前記候補は、前記第１データと同じデータ型にするために型変換が不要な前記候補とは区別可能な表示態様で表示される、
ことを特徴とする請求項１に記載の情報処理装置。
前記データ形式には、データ長が含まれ、
前記第２データのうち前記第１データよりもデータ長が長いものは、前記候補に選定されない、
ことを特徴とする請求項１に記載の情報処理装置。
前記プロセッサは、
前記第１画面に表示された前記候補の中からユーザが前記第１データに関連付ける前記候補を選択した場合に、前記ユーザから選択された前記候補である前記第２データについては、前記第１データとの前記名前同士の前記第１類似度が高く計算されるよう学習する、
ことを特徴とする請求項１に記載の情報処理装置。
前記候補の選定では、前記第１類似度と前記第２類似度とに基づき計算される点数が所定の第１閾値より高い前記第２データが前記候補として選定され、
前記第１画面では、前記点数が前記第１閾値よりも高い第２閾値以上である前記候補がある場合、当該候補は前記第１データと関連付けるものとして仮選択された状態で表示され、前記第１画面に対してユーザが前記第１データと関連付ける前記候補を選択する操作を行わなかった場合、前記仮選択された状態の前記候補が前記第１データと関連付けるものとして選択されたものとみなされる、
ことを特徴とする請求項１に記載の情報処理装置。
コンピュータに、
ワークフローを構成する複数の装置のうちの第１装置で設定されるデータである第１データと、前記複数の装置のうちの前記第１装置以外の装置で設定されるデータである第２データとの間の、名前同士の類似度である第１類似度と、データ形式同士の類似度である第２類似度とに基づいて、前記第１データに関連付けるべき前記第２データの候補を選定し、
選定された前記候補ごとに、前記第１データの名前と、当該候補の名前と、当該候補の設定が行われる前記装置の名前と、を互いに対応付けて表示する第１画面であって、前記候補の中から前記第１データと関連付ける第２データの選択を受け付けるための第１画面、を生成する、
処理を実行させるためのプログラム。