WO2022254487A1

WO2022254487A1 - 情報処理プログラム、情報処理方法および情報処理装置

Info

Publication number: WO2022254487A1
Application number: PCT/JP2021/020615
Authority: WO
Inventors: 雅樹西垣
Original assignee: 富士通株式会社
Priority date: 2021-05-31
Filing date: 2021-05-31
Publication date: 2022-12-08
Also published as: EP4350505A1; JPWO2022254487A1

Abstract

非互換情報の同一性を判定する。　記憶部（１１）は、第１のソフトウェアを使用するソースコードの中から第２のソフトウェアと非互換である記述を探索するための情報であって、２以上の言語要素がもつキーワードと２以上の言語要素の位置関係とに対する条件を示す非互換情報（１３）を記憶する。処理部（１２）は、非互換情報（１３）から２以上のキーワードを抽出し、同一のキーワードの出現頻度に基づく頻度情報（１５）を生成し、位置関係の条件から推定される２以上のキーワードの出現順序を示す順序情報（１７）を生成し、頻度情報（１５）と非互換情報（１４）に対応する頻度情報（１６）との間の類似度と、順序情報（１７）と非互換情報（１４）に対応する順序情報（１８）との間の類似度とに基づいて、非互換情報（１３，１４）の同一性を判定する。

Description

情報処理プログラム、情報処理方法および情報処理装置

　本発明は情報処理プログラム、情報処理方法および情報処理装置に関する。

　情報処理システムは、ソフトウェアベンダから提供されるソフトウェアを使用することがある。ソフトウェアの例として、ＤＢＭＳ（Database Management System）などのミドルウェアが挙げられる。情報処理システムで実行されるプログラムのソースコードは、提供されるソフトウェアの仕様に依存して作成されることがある。例えば、プログラムは、ＤＢＭＳにＳＱＬ文を送信してデータベース操作機能を呼び出すなど、提供されるソフトウェアに対して要求を送信してソフトウェアの機能を呼び出すことがある。

　情報処理システムは、使用するソフトウェアを変更することがある。例えば、ソフトウェアベンダがバージョンアップを行った場合、情報処理システムが、使用するソフトウェアを新バージョンに更新することがある。また、例えば、情報処理システムが、他のソフトウェアベンダから提供される同種のソフトウェアに切り替えることがある。

　ただし、使用するソフトウェアを変更することによって、ソフトウェア間の非互換性に基づく不具合が既存プログラムに発生することがある。例えば、サポートしているＳＱＬ文の言語仕様など、要求を記述するための言語仕様が異なるために、既存プログラムから新ソフトウェアへの要求の送信にエラーが発生することがある。よって、使用するソフトウェアを変更することは、ソースコードの修正を伴う可能性がある。

　なお、異なる計算機にインストールされた同一種類の動的リンクライブラリの非互換性を、計算機間で動的リンクライブラリおよび障害メッセージを転送することで検出する計算機システムが提案されている。また、ユーザから開示情報を取得し、開示情報から閲覧価値を算出し、算出された閲覧価値に応じて、開示情報を提供したユーザに対して対価を付与する情報開示活性化システムが提案されている。また、ＡＰＩ（Application Programming Interface）名の類似性と値域の類似性に基づいて、旧システムのＡＰＩと新システムのＡＰＩとの対応関係を判定するシステム移行支援装置が提案されている。

特開２００１－１００９９８号公報特開２０１１－９５８５６号公報特開２０１２－１１３５３６号公報

　ソースコードの修正を支援する１つの方法として、コンピュータが、非互換性に基づく不具合が発生する可能性のある記述の特徴を規定した非互換情報を保存しておき、非互換情報に基づいてソースコードの中から非互換箇所を探索する方法が考えられる。

　ただし、非互換情報において規定される非互換箇所の特徴は、単一のキーワードのような単純な特徴であるとは限らず、２以上の言語要素の組み合わせに対する条件を示す複雑な特徴であることがある。そのため、２つの非互換情報が形式的には異なる記載を含んでいても、探索される非互換箇所が実質的には同一であるということが生じ得る。

　一方、複数の非互換情報を管理する上で、コンピュータは、ある非互換情報と他の非互換情報との間で実質的な同一性を判定したいことがある。そこで、１つの側面では、本発明は、非互換情報の同一性を判定することを目的とする。

　１つの態様では、以下の処理をコンピュータに実行させる情報処理プログラムが提供される。第１のソフトウェアを使用するソースコードの中から第２のソフトウェアと非互換である記述を探索するための情報であって、２以上の言語要素がもつキーワードと２以上の言語要素の位置関係とに対する条件を示す第１の非互換情報を取得する。第１の非互換情報から２以上のキーワードを抽出し、同一のキーワードの出現頻度に基づく第１の頻度情報を生成し、位置関係の条件から推定される２以上のキーワードの出現順序を示す第１の順序情報を生成する。第１の頻度情報と第２の非互換情報に対応する第２の頻度情報との間の第１の類似度と、第１の順序情報と第２の非互換情報に対応する第２の順序情報との間の第２の類似度とに基づいて、第１の非互換情報および第２の非互換情報の同一性を判定する。

　また、１つの態様では、コンピュータが実行する情報処理方法が提供される。また、１つの態様では、記憶部と処理部とを有する情報処理装置が提供される。

　１つの側面では、非互換情報の同一性を判定できる。
　本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。

第１の実施の形態の情報処理装置を説明するための図である。第２の実施の形態の情報処理システムの例を示す図である。情報処理装置のハードウェア例を示すブロック図である。データベース製品の非互換吸収の流れの例を示す図である。情報処理装置の機能例を示すブロック図である。構文ツリーの第１の例を示す図である。属性情報の例を示す図である。構文テーブルの例を示す図である。命令テーブルの例を示す図である。非互換情報の第１の例を示す図である。構文ツリーの第２の例を示す図である。非互換情報の第２の例を示す図である。非互換情報の第２の例を示す図（続き）である。ＳＱＬプロシジャのソースコードの例を示す図である。構文ツリーの第３の例を示す図である。構文ツリーの第３の例を示す図（続き）である。非互換情報の第３の例を示す図である。エディタ画面の例を示す図である。エディタ画面の第１の操作手順例を示す図である。エディタ画面の第２の操作手順例を示す図である。非互換情報のテストの例を示す図である。非互換情報の第４の例を示す図である。ＢＯＷベクトルテーブルの例を示す図である。キーワードリストの第１の生成例を示す図である。キーワードリストの第２の生成例を示す図である。非互換サブ情報の抽出例を示す図である。非互換情報の分割例を示す図である。非互換情報生成の手順例を示すフローチャートである。非互換情報生成の手順例を示すフローチャート（続き１）である。非互換情報生成の手順例を示すフローチャート（続き２）である。非互換情報生成の手順例を示すフローチャート（続き３）である。非互換情報テストの手順例を示すフローチャートである。非互換情報同一性判定の手順例を示すフローチャートである。非互換情報同一性判定の手順例を示すフローチャート（続き１）である。非互換情報同一性判定の手順例を示すフローチャート（続き２）である。

　以下、本実施の形態を図面を参照して説明する。
　［第１の実施の形態］
　第１の実施の形態を説明する。

　図１は、第１の実施の形態の情報処理装置を説明するための図である。
　第１の実施の形態の情報処理装置１０は、あるソフトウェアに依存するソースコードの中から他のソフトウェアと非互換の記述を探索するための非互換情報を分析し、その非互換情報と他の非互換情報との実質的な同一性を判定する。同一性判定を通じて、情報処理装置１０は、複数の非互換情報の蓄積および管理を支援すると共に、使用するソフトウェアを変更する際のソースコードの修正を支援する。情報処理装置１０は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置１０が、コンピュータ、同一性判定装置、非互換情報管理装置、開発支援装置などと呼ばれてもよい。

　情報処理装置１０は、記憶部１１および処理部１２を有する。記憶部１１は、ＲＡＭ（Random Access Memory）などの揮発性半導体メモリでもよいし、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの不揮発性ストレージでもよい。処理部１２は、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）などのプロセッサである。ただし、処理部１２が、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの特定用途の電子回路を含んでもよい。プロセッサは、例えば、ＲＡＭなどのメモリ（記憶部１１でもよい）に記憶されたプログラムを実行する。プロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。

　記憶部１１は、非互換情報１３を記憶する。非互換情報１３は、例えば、新規に作成されて知識データベースに保存されようとしている情報である。非互換情報１３は、非互換情報１３の作成者が使用する端末装置などの他の情報処理装置から受信されてもよい。

　非互換情報１３は、第１のソフトウェアを使用するプログラムのソースコードの中から第２のソフトウェアと非互換である記述（非互換箇所）を探索するための知識を、一定の形式で表現した知識情報である。第１のソフトウェアは移行元のソフトウェアに相当し、第２のソフトウェアは移行先のソフトウェアに相当する。これら２つのソフトウェアは、ソフトウェアベンダから提供されるソフトウェア製品であってもよく、ＤＢＭＳやＷｅｂサーバなどのミドルウェアであってもよい。また、２つのソフトウェアは、異なるソフトウェアベンダから提供される同種のソフトウェアでもよいし、同一のソフトウェアベンダから提供される異なるバージョンのソフトウェアでもよい。

　ソースコードは、ソフトウェアへの要求を示す要求メッセージを規定してもよい。要求メッセージはＳＱＬ文でもよく、ソースコードはＳＱＬまたはＳＱＬプロシジャ言語で記述されてもよい。２つのソフトウェアへの要求を記述するための言語は、類似しているものの同一でないことがある。例えば、２つのソフトウェアはそれぞれ、ＳＱＬなどの汎用的なクエリ言語をサポートする一方、クエリ言語を独自に拡張していることがある。

　非互換情報１３は、ソースコードに含まれる非互換箇所の特徴を示す。非互換情報１３は、ソースコードに含まれる２以上の言語要素の組み合わせについての条件を示す。言語要素は、文、節、句、語などの構文上の単位要素である。言語要素が構文要素と呼ばれてもよい。非互換情報１３が示す条件を満たす２以上の言語要素が存在することは、ソースコードに非互換箇所が含まれることに相当する。

　非互換情報１３が規定する条件には、２以上の言語要素に含まれる２以上のキーワードと、それら２以上の言語要素の間の位置関係とに対する条件が含まれる。位置関係は、ソースコードを構文解析することで生成される構文ツリーにおける位置関係であってもよい。非互換情報１３は、条件を満たす２以上の言語要素を探索する手順を示す命令列を含んでもよい。例えば、非互換情報１３は、あるキーワードをもつ第１の言語要素を検出し、第１の言語要素から特定の探索範囲内で、別のキーワードをもつ第２の言語要素を検出するという探索手順を示す命令列を含んでもよい。

　処理部１２は、非互換情報１３から頻度情報１５および順序情報１７を生成する。処理部１２は、非互換情報１３から２以上のキーワードを抽出し、それら２以上のキーワードそれぞれの出現頻度に基づく頻度情報１５を生成する。出現頻度は、各キーワードの出現回数であってもよいし、非互換情報１３のサイズに対する各キーワードの出現回数の割合である出現確率であってもよい。

　また、処理部１２は、非互換情報１３から同一の言語要素についてのキーワードと属性のペアを２以上抽出し、それら２以上のペアそれぞれの出現回数を示すように頻度情報１５を生成してもよい。属性は、例えば、命令語やオブジェクト種別などの文法上の役割を含む。キーワードと併せて属性を抽出することで、キーワードが使用される文脈が考慮され、同一のキーワードがもつ複数の役割が区別される。この場合、出現頻度は、各ペアの出現回数であってもよいし、非互換情報１３のサイズに対する各ペアの出現回数の割合である出現確率であってもよい。頻度情報１５は、２以上の出現頻度を列挙したベクトルであってもよく、ＢＯＷ（Bug of Words）ベクトルと呼ばれてもよい。

　また、処理部１２は、非互換情報１３が示す位置関係の条件から、ソースコードに上記の２以上のキーワードが出現する場合のソースコード上での出現順序を推定し、推定された出現順序を示す順序情報１７を生成する。順序情報１７は、２以上のキーワードを出現順に並べたキーワードリストであってもよい。処理部１２は、第１の言語要素から第２の言語要素を探索する際の横方向の探索範囲を非互換情報１３から抽出し、抽出された探索範囲から２つの言語要素に対応する２つのキーワードの前後関係を推定してもよい。

　処理部１２は、非互換情報１４に対応する頻度情報１６および順序情報１８を取得する。非互換情報１４は、非互換情報１３の前に作成された既存の非互換情報であってもよく、知識データベースに登録済みの非互換情報であってもよい。頻度情報１６は頻度情報１５と同様の方法で非互換情報１４から生成されてもよく、順序情報１８は順序情報１７と同様の方法で非互換情報１４から生成されてもよい。

　非互換情報１４は記憶部１１に記憶されてもよく、頻度情報１６および順序情報１８は記憶部１１に記憶されてもよい。また、頻度情報１６および順序情報１８は、非互換情報１３の検証の前に生成されて知識データベースに保存されていてもよいし、非互換情報１３の検証の際に処理部１２によって非互換情報１４から生成されてもよい。

　処理部１２は、頻度情報１５と頻度情報１６とを比較し、頻度情報１５と頻度情報１６との間の第１の類似度を算出する。第１の類似度は、コサイン類似度であってもよい。例えば、処理部１２は、同一のキーワード毎または同一のキーワードと属性のペア毎に２つの出現頻度の積を算出して合算し、頻度情報１５，１６それぞれのノルムで割る。また、第１の類似度は、ユークリッド距離であってもよい。第１の類似度の指標値は、大きいほど類似度が高いことを意味してもよいしその逆でもよい。例えば、コサイン類似度は１が最大値であり、１に近いほど類似度が高いことを意味する。

　また、処理部１２は、順序情報１７と順序情報１８とを比較し、順序情報１７と順序情報１８との間の第２の類似度を算出する。第２の類似度は、レーベンシュタイン距離などの編集距離であってもよい。例えば、処理部１２は、順序情報１７が示すキーワード列を順序情報１８が示すキーワード列に変更するためのキーワード置換操作の最短回数を算出する。また、第２の類似度は、ユークリッド距離であってもよい。例えば、処理部１２は、２つのキーワードの間の類似度を定義しておき、キーワードリストの中の同一の位置にあるキーワード同士の類似度の合計または平均を算出する。第２の類似度の指標値は、大きいほど類似度が高いことを意味してもよいしその逆でもよい。

　処理部１２は、第１の類似度および第２の類似度に基づいて、非互換情報１３，１４の同一性を判定する。実質的に同一ではないことは新規性や一意性と呼ばれてもよい。非互換情報１３，１４は、２以上の言語要素の組み合わせに対する条件を規定するものであるため、同一の非互換箇所を探索するための異なる探索方法を規定している可能性がある。

　例えば、非互換情報１３は、第１の言語要素を起点にして第２の言語要素を探索する探索方法を規定し、非互換情報１４は、第２の言語要素を起点にして第１の言語要素を探索する探索方法を規定する。その場合、非互換情報１３，１４は実質的に同一であり、非互換情報１３は非互換情報１４に対して新規性を有していないことになる。このように、同一の非互換箇所の特徴を示す非互換情報が、異なる記載を含むことがある。

　例えば、処理部１２は、第１の類似度と第１の閾値とを比較し、第２の類似度と第２の閾値とを比較する。処理部１２は、第１の類似度が第１の閾値より大きく、かつ、第２の類似度が第２の閾値より大きい場合、非互換情報１３，１４が実質的に同一であると判定する。一方、処理部１２は、第１の類似度が第１の閾値以下であるか、または、第２の類似度が第２の閾値以下の場合、非互換情報１３，１４が実質的に同一でないと判定する。

　処理部１２は、まず第１の類似度と第１の閾値とを比較し、第１の類似度が第１の閾値より大きい場合、第２の類似度と第２の閾値とを比較してもよい。また、処理部１２は、まず非互換情報１３から頻度情報１５を生成して第１の類似度を算出し、第１の類似度が第１の閾値より大きい場合、非互換情報１３から順序情報１７を生成してもよい。

　例えば、非互換情報１３は、キーワード"TABLESPACE"を検出し、そのキーワードと同一の節に属するキーワード"CREATE"を探索し、そのキーワードの後続の句に含まれるキーワード"TABLE"を探索する手順を規定する。一方、非互換情報１４は、キーワード"CREATE"を検出し、そのキーワードと同一の節に属する句に含まれるキーワード"TABLE"を探索し、その句の後続の句に含まれるキーワード"TABLESPACE"を探索する手順を規定する。

　その場合、非互換情報１３，１４は共に、キーワード"CREATE"，"TABLE"，"TABLESPACE"を１つずつ含む。このため、頻度情報１５，１６は同一である。また、非互換情報１３，１４における３つのキーワードの探索順序は異なるものの、探索範囲の条件から推定される３つのキーワードの順序は共に、"CREATE"，"TABLE"，"TABLESPACE"である。このため、順序情報１７，１８は同一である。そこで、処理部１２は、非互換情報１３と非互換情報１４とが実質的に同一であると判定する。

　処理部１２は、同一性の判定結果を出力してもよい。例えば、処理部１２は、同一性の判定結果を不揮発性ストレージに保存してもよいし、表示装置に表示してもよいし、他の情報処理装置に送信してもよい。また、処理部１２は、同一性の判定結果に基づいて、知識データベースへの非互換情報１３の登録を制御してもよい。例えば、処理部１２は、非互換情報１３，１４が実質的に同一でないと判定した場合、非互換情報１３を新規の非互換情報として知識データベースに登録することを認める。一方、処理部１２は、非互換情報１３，１４が実質的に同一であると判定した場合、非互換情報１３の登録を拒否する。

　以上説明したように、第１の実施の形態の情報処理装置１０は、非互換情報１３から、２以上のキーワードの出現頻度に基づく頻度情報１５と、それら２以上のキーワードの出現順序を示す順序情報１７とを生成する。そして、情報処理装置１０は、頻度情報１５，１６の類似度と順序情報１７，１８の類似度とに基づいて、非互換情報１３，１４の同一性を判定する。これにより、情報処理装置１０は、非互換情報１３，１４の記載が異なっていても、非互換情報１３，１４が、ソースコードから同一の非互換箇所を検出する実質的に同一の非互換情報であるか否か判定することができる。

　よって、情報処理装置１０は、実質的に同一の非互換情報が知識データベースに重複して登録されることを抑制でき、知識データベースの管理を効率化できる。また、情報処理装置１０は、新規な非互換情報と実質的に新規でない非互換情報とを区別することができ、新規な非互換情報の価値を適切に評価することが可能となる。

　また、情報処理装置１０は、キーワードの出現頻度に基づいて非互換情報１３，１４の類似度を評価する。キーワードの出現頻度は、非互換情報１３から簡潔に算出することが可能である。よって、情報処理装置１０は、非互換情報１３，１４の類似度を効率的に評価することができる。また、情報処理装置１０は、キーワードの出現頻度に加えて、キーワードの出現順序に基づいて非互換情報１３，１４の類似度を評価する。よって、情報処理装置１０は、語順の違いに基づく意味の違いを考慮でき、類似度の評価精度が上がる。

　例えば、"CREATE TABLE ... TABLESPACE ..."というＳＱＬ文と、"CREATE TABLESPACE ... TABLE ..."というＳＱＬ文とは、非互換性の観点から異なる特徴をもつと認定されることがある。この点、上記２つのＳＱＬ文を探索する２つの非互換情報では、キーワードの出現頻度が同一であるものの、これらキーワードの出現順序が異なる。そこで、情報処理装置１０は、出現順序を考慮することで非互換情報の類似度を適切に評価できる。

　また、情報処理装置１０は、キーワードの出現頻度に基づいて非互換情報１３，１４の類似度を評価し、第１段階の類似度が高い場合のみ、キーワードの出現順序に基づいて非互換情報１３，１４の類似度を評価することもできる。この場合、情報処理装置１０は、非互換情報１３，１４の類似度を効率的に評価できる。また、情報処理装置１０は、キーワードの出現頻度に基づいて非互換情報１３と類似する可能性がある他の非互換情報を絞り込み、その後、キーワードの出現順序に基づいて非互換情報１３と類似する他の非互換情報を判定することもできる。この場合、情報処理装置１０は、非互換情報１３と類似する他の非互換情報を効率的に抽出することができる。

　［第２の実施の形態］
　次に、第２の実施の形態を説明する。第２の実施の形態の情報処理システムは、データベース製品を使用するプログラムのソースコードを解析し、使用するデータベース製品を変更する際の修正作業を支援する。データベース製品の変更は、異なるソフトウェアベンダから提供されるデータベース製品の間の変更と、同一のソフトウェアベンダから提供される異なるバージョンの間の変更とを含む。データベース製品の間には非互換性が存在することがある。非互換性による不具合を解消するようにソースコードを修正することは、非互換吸収と呼ばれることがある。

　図２は、第２の実施の形態の情報処理システムの例を示す図である。
　第２の実施の形態の情報処理システムは、ネットワーク３０に接続された端末装置３１，３２，３３および情報処理装置１００を含む。ネットワーク３０は、ＬＡＮ（Local Area Network）を含んでもよく、インターネットを含んでもよい。端末装置３１，３２，３３は、ユーザが操作するクライアントコンピュータである。情報処理装置１００は、端末装置３１，３２，３３からアクセスされるサーバコンピュータである。情報処理装置１００は、第１の実施の形態の情報処理装置１０に対応する。

　端末装置３１は、非互換情報を作成する作成者が使用するクライアントコンピュータである。非互換情報は、非互換吸収の業務に従事する複数の関係者によって共有される知識情報である。非互換情報は、ソースコードの中から非互換箇所を特定する特定方法と、特定された非互換箇所を非互換性が解消されるように書き換える書き換え方法とを規定する。端末装置３１は、情報処理装置１００と通信し、作成された非互換情報を情報処理装置１００にアップロードする。後述するように、端末装置３１は、情報処理装置１００から提供されるエディタを用いて非互換情報の作成を支援することがある。

　端末装置３２は、情報処理装置１００にアップロードされた非互換情報を承認する承認者が使用するクライアントコンピュータである。端末装置３１から情報処理装置１００にアップロードされた非互換情報は、「プリペアード」状態に設定され、知識データベースへの正式な登録が保留される。プリペアード状態の非互換情報は、情報処理装置１００による自動検証や承認者による承認を通じて、知識データベースに正式に登録される。承認者は、アップロードされた非互換情報のレビューやテスト実行などの検証作業を行い、非互換情報が正しく動作することや記載の妥当性を確認する。

　端末装置３３は、情報処理装置１００に蓄積された非互換情報を使用して非互換吸収を行う非互換吸収作業者が使用するクライアントコンピュータである。端末装置３３は、変更前のデータベース製品と変更後のデータベース製品の組に対して有効な非互換情報を、情報処理装置１００から検索して受信する。端末装置３３は、変更前のデータベース製品に対応するソースコードに非互換情報を適用して、変更後のデータベース製品に適合するようにソースコードを自動的に変換する。

　情報処理装置１００は、非互換情報を管理するサーバコンピュータである。情報処理装置１００は、非互換情報の作成を支援するエディタのユーザインタフェースを、端末装置３１に提供する。ただし、端末装置３１は、エディタを使用せずに非互換情報を作成することも可能である。情報処理装置１００は、非互換情報を端末装置３１から受信する。すると、情報処理装置１００は、受信された非互換情報をプリペアード状態に設定して自動検証を行う。自動検証には、サンプルソースコードおよびテストデータベースを用いた自動テストと、既存の非互換情報と実質的に同一であるか判定する同一性判定が含まれる。

　また、情報処理装置１００は、端末装置３２から承認メッセージを受信する。情報処理装置１００は、自動検証が成功しかつ承認メッセージが受信された非互換情報のプリペアード状態を解除し、知識データベースに正式に登録する。また、情報処理装置１００は、端末装置３３からの要求に応じて、今回の非互換吸収作業に適合する非互換情報を知識データベースから検索し、該当する非互換情報を端末装置３３に送信する。

　なお、変形例として、上記の機能の一部が端末装置３１，３２，３３および情報処理装置１００の間で移動されてもよい。例えば、非互換情報の作成を支援するエディタに相当するアプリケーションソフトウェアが、端末装置３１にインストールされてもよい。その場合、情報処理装置１００が端末装置３１にエディタ機能を提供しなくてもよい。また、端末装置３１が、非互換情報の自動検証を実行してもよい。また、端末装置３１，３２，３３が、非互換情報の知識データベースの複製を保持してもよい。また、情報処理装置１００が、端末装置３３からの要求に応じて非互換吸収を実行してもよい。

　図３は、情報処理装置のハードウェア例を示すブロック図である。
　情報処理装置１００は、バスに接続されたＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ１０３、ＧＰＵ１０４、入力インタフェース１０５、媒体リーダ１０６および通信インタフェース１０７を有する。ＣＰＵ１０１は、第１の実施の形態の処理部１２に対応する。ＲＡＭ１０２またはＨＤＤ１０３は、第１の実施の形態の記憶部１１に対応する。端末装置３１，３２，３３が、情報処理装置１００と同様のハードウェアを有してもよい。

　ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムおよびデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。情報処理装置１００は、複数のプロセッサを有してもよい。プロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。

　ＲＡＭ１０２は、ＣＰＵ１０１で実行されるプログラムおよびＣＰＵ１０１で演算に使用されるデータを一時的に記憶する揮発性半導体メモリである。情報処理装置１００は、ＲＡＭ以外の種類の揮発性メモリを有してもよい。

　ＨＤＤ１０３は、ＯＳ（Operating System）、ミドルウェア、アプリケーションソフトウェアなどのソフトウェアのプログラム、および、データを記憶する不揮発性ストレージである。情報処理装置１００は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の不揮発性ストレージを有してもよい。

　ＧＰＵ１０４は、ＣＰＵ１０１と連携して画像を生成し、情報処理装置１００に接続された表示装置１１１に画像を出力する。表示装置１１１は、例えば、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイまたはプロジェクタである。なお、情報処理装置１００に、プリンタなどの他の種類の出力デバイスが接続されてもよい。

　入力インタフェース１０５は、情報処理装置１００に接続された入力デバイス１１２から入力信号を受け付ける。入力デバイス１１２は、例えば、マウス、タッチパネルまたはキーボードである。情報処理装置１００に複数の入力デバイスが接続されてもよい。

　媒体リーダ１０６は、記録媒体１１３に記録されたプログラムおよびデータを読み取る読み取り装置である。記録媒体１１３は、例えば、磁気ディスク、光ディスクまたは半導体メモリである。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）およびＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）およびＤＶＤ（Digital Versatile Disc）が含まれる。媒体リーダ１０６は、記録媒体１１３から読み取られたプログラムおよびデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、ＣＰＵ１０１によって実行されることがある。

　記録媒体１１３は、可搬型記録媒体であってもよい。記録媒体１１３は、プログラムおよびデータの配布に用いられることがある。また、記録媒体１１３およびＨＤＤ１０３が、コンピュータ読み取り可能な記録媒体と呼ばれてもよい。

　通信インタフェース１０７は、ネットワーク３０に接続され、ネットワーク３０を介して端末装置３１，３２，３３と通信する。通信インタフェース１０７は、スイッチやルータなどの有線通信装置に接続される有線通信インタフェースでもよいし、基地局やアクセスポイントなどの無線通信装置に接続される無線通信インタフェースでもよい。

　次に、情報処理システムによる非互換吸収の流れを説明する。
　図４は、データベース製品の非互換吸収の流れの例を示す図である。
　情報処理システムは、変更前のデータベース製品に依存するソースコード１３１を取得する。ソースコード１３１は、ＳＱＬ文またはＳＱＬプロシジャコードを含む。ＳＱＬ文は、ＳＱＬを用いて記述されたデータベースクエリである。ＳＱＬの基本仕様は標準化されているものの、データベース製品によっては基本仕様を拡張した独自仕様をもつことがある。ＳＱＬプロシジャコードは、ＳＱＬと整合するように規定された手続き型言語のプログラムであり、ストアドプロシジャとして動作する。

　情報処理システムは、ソースコード１３１の構文解析を行い、構文ツリー１３２を生成する。構文ツリー１３２は、文、節、句、語などの言語要素の構造を示すツリー型データである。構文解析を通じて生成される構文ツリー１３２は、字句解析のみを行う場合と異なり、ソースコード１３１において各語が出現する文脈を表現できる。例えば、ＳＱＬ文やＳＱＬプロシジャコードでは、同じ変数であっても、変数が記述される位置によって変数の有効範囲が異なることがある。そのため、非互換吸収では構文ツリー１３２が有用である。ただし、情報処理システムはソースコード１３１の意味解析を行わなくてよく、構文ツリー１３２は言語要素の論理的意味を示す意味情報を含まなくてよい。

　情報処理システムは、変更前のデータベース製品と変更後のデータベース製品との組に対応付けられた非互換情報１３３を、知識情報として保持している。データベース製品は、製品名とバージョン番号の組で識別され得る。非互換情報１３３は、特定命令の列と書換命令の列とを含む。特定命令は、変更前のデータベース製品では正常に動作するものの変更後のデータベース製品では不具合が発生するおそれがある非互換箇所を、構文ツリー１３２の中から特定するための命令である。書換命令は、特定命令によって特定された非互換箇所について、変更後のデータベース製品において不具合が発生しないように構文ツリー１３２を書き換えるための命令である。

　情報処理システムは、構文ツリー１３２に対して、非互換情報１３３に含まれる特定命令を実行する。特定命令によって構文ツリー１３２の中から非互換箇所が検出された場合、情報処理システムは、構文ツリー１３２に対して、非互換情報１３３に含まれる書換命令を実行して非互換吸収を行う。これにより、非互換性が解消されるように構文ツリー１３２が書き換えられる。情報処理システムは、書き換え後の構文ツリー１３２からソースコード１３４を生成する。ソースコード１３４は、ソースコード１３１に対して非互換吸収を行った結果であり、変更後のデータベース製品用のソースコードである。

　図５は、情報処理装置の機能例を示すブロック図である。
　情報処理装置１００は、サンプルコード記憶部１２１および非互換情報記憶部１２２を有する。これらの記憶部は、例えば、ＲＡＭ１０２またはＨＤＤ１０３を用いて実装される。また、情報処理装置１００は、エディタ１２３、登録部１２４、テスト部１２５、同一性判定部１２６および検索部１２７を有する。これらの処理部は、例えば、ＣＰＵ１０１およびプログラムを用いて実装される。

　サンプルコード記憶部１２１は、変換前のソースコードのサンプルを記憶する。ソースコードは、ＳＱＬ文またはＳＱＬプロシジャコードを含む。ソースコードは、非互換情報の作成者によって作成され、端末装置３１から情報処理装置１００にアップロードされる。エディタ１２３を利用して非互換情報を作成する際に、端末装置３１からソースコードが提供されることがある。また、非互換情報を情報処理装置１００に登録する際に、非互換情報と併せてソースコードが端末装置３１から提供されることがある。

　エディタ１２３を利用する際に提供されるソースコードと、非互換情報を登録する際に提供されるソースコードとは、同一でもよいし異なってもよい。また、サンプルコード記憶部１２１は、変換後のソースコードを変更後のデータベース製品で実行した場合に期待される正解の実行結果を記憶することがある。正解の実行結果は、例えば、ソースコードに含まれるＳＱＬ文またはＳＱＬプロシジャコードによって生成されるテーブルを示す。正解の実行結果は、非互換情報を登録する際に、非互換情報および変換前のソースコードと併せて端末装置３１から提供されることがある。

　非互換情報記憶部１２２は、非互換情報を蓄積する知識データベースである。非互換情報は、データベース製品間の非互換吸収に関する技術的ノウハウを示す知識情報である。非互換情報は、構文ツリーから非互換箇所を特定する手順を示す特定命令と、特定された非互換箇所を書き換える手順を示す書換命令とを含む。後述するように、非互換情報は、再利用可能な単位として複数の非互換サブ情報を含むことがある。

　各非互換情報は、変更前のデータベース製品と変更後のデータベース製品の組に対応付けられる。非互換情報記憶部１２２は、変更前のデータベース製品と変更後のデータベース製品の組から、利用可能な非互換情報を検索するための管理情報を記憶してもよい。端末装置３１からアップロードされた非互換情報は、まずプリペアード状態に設定される。プリペアード状態の非互換情報は、テスト部１２５および同一性判定部１２６による自動検証と承認者による承認とを通じて有用性が確認された後に、プリペアード状態が解除されて非互換情報記憶部１２２に正式に登録される。

　エディタ１２３は、非互換情報を効率的に作成するためのグラフィカルユーザインタフェースを提供し、端末装置３１による非互換情報の作成を支援する。エディタ１２３は、端末装置３１から変換前のソースコードのサンプルを取得する。エディタ１２３は、ソースコードを構文解析して構文ツリーを生成し、生成された構文ツリーを端末装置３１の表示装置に表示させる。エディタ１２３は、構文ツリーに含まれる２以上のノードを順に選択する操作や一部のノードを書き換える操作を端末装置３１から受信する。エディタ１２３は、受信した操作に基づいて、非互換情報の特定命令および書換命令を順に生成し、自動的に生成された非互換情報を端末装置３１に送信する。

　登録部１２４は、非互換情報および変換前のソースコードのサンプルを端末装置３１から受信する。登録部１２４は、変更後のデータベース製品における正解の実行結果を端末装置３１から更に受信してもよい。非互換情報は、エディタ１２３を利用して作成されたものでもよいし、エディタ１２３を利用せずに作成されたものでもよい。ソースコードは、エディタ１２３で使用されたものと同じでもよい。

　登録部１２４は、受信された非互換情報をプリペアード状態に設定し、非互換情報記憶部１２２に仮登録する。また、登録部１２４は、受信されたソースコードをサンプルコード記憶部１２１に保存し、正解の実行結果が提供された場合は正解の実行結果をサンプルコード記憶部１２１に保存する。そして、登録部１２４は、テスト部１２５に非互換情報の自動テストを要求し、同一性判定部１２６に非互換情報の同一性判定を要求する。自動テストおよび同一性判定は、バックグラウンド処理としてスケジュールされる。また、登録部１２４は、端末装置３２に非互換情報の承認の要求を送信する。

　登録部１２４は、自動テストの結果をテスト部１２５から取得し、同一性判定の結果を同一性判定部１２６から取得し、承認者の承認結果を端末装置３２から受信する。自動テストの結果は、非互換情報が正常に動作するか否かを示す。同一性判定の結果は、非互換情報が他の非互換情報と実質的に同一ではないという新規性を有しているか否かを示す。承認結果は、承認者が非互換情報を承認したか否かを示す。登録部１２４は、非互換情報が正常に動作し、新規性を有しており、かつ、承認者によって承認された場合、非互換情報のプリペアード状態を解除する。

　テスト部１２５は、プリペアード状態の非互換情報をテストする。テスト部１２５は、変換前のソースコードのサンプルに非互換情報を適用して変換後のソースコードを生成する。テスト部１２５は、変更後のデータベース製品に相当するテストデータベースを用いて、変換後のソースコードに含まれるＳＱＬ文またＳＱＬプロシジャコードを実行する。テストデータベースは、情報処理装置１００にインストールされていてもよいし、他の情報処理装置にインストールされていてもよい。

　テスト部１２５は、テストデータベースから実行結果を抽出して正解の実行結果と比較する。テスト部１２５は、今回の実行結果と正解の実行結果が一致する場合、テスト成功であり非互換情報が正常に動作すると判定する。一方、テスト部１２５は、今回の実行結果と正解の実行結果が一致しない場合、テスト失敗であり非互換情報が正常に動作しないと判定する。ただし、正解の実行結果が端末装置３１から提供されていない場合、テスト部１２５は、テストデータベースにおける実行結果を端末装置３１に送信し、今回の実行結果が正常であるか否かを示す評価結果を端末装置３１から受信する。

　同一性判定部１２６は、プリペアード状態の非互換情報が、非互換情報記憶部１２２に登録されている既存の非互換情報と実質的に同一であるか否か判定する。プリペアード状態の非互換情報と既存の非互換情報とが同一の特定命令をもつ場合、両者は同一の非互換性を解消するための知識情報であり、プリペアード状態の非互換情報は新規性を有しない。また、プリペアード状態の非互換情報と既存の非互換情報とが異なる特定命令をもつ場合であっても、構文ツリー上で探索される非互換箇所が同一である場合、両者は同一の非互換性を解消するための知識情報であり、プリペアード状態の非互換情報は新規性を有しない。同一性判定の詳細については後述する。

　検索部１２７は、端末装置３３からの要求に応じて、非互換情報記憶部１２２から非互換情報を読み出して端末装置３３に送信する。例えば、検索部１２７は、変更前のデータベース製品と変更後のデータベース製品の指定を端末装置３３から受け付ける。検索部１２７は、指定されたデータベース製品の組に対応付けられた非互換情報を非互換情報記憶部１２２から検索し、検索された非互換情報を端末装置３３に提供する。

　次に、構文ツリーおよび非互換情報について説明する。
　図６は、構文ツリーの第１の例を示す図である。
　ここで、ＳＱＬ文の構文について説明する。文は末尾に終端記号を含む。文は終端記号の前に節を含むことがある。節は先頭に命令語を含み、命令語と終端記号の間に句、式または語を含む。句は先頭にオブジェクト種別、前置詞、副詞または括弧を含む。句は続いて句、式または語を含み、句、式または語が２回以上連続することがある。句は続いて節を含むことがある。式は関数名または語を含み、続いて演算子を含む。

　終端記号は、文の終端を表す。終端記号は、セミコロン（「；」）であることがある。語は、文の中で意味をもつ最小の言語単位である。語には、識別子、予約語、関数名および演算子が含まれる。予約語には、命令語、オブジェクト種別およびその他の予約語が含まれる。命令語は、CREATEやUPDATEなどの命令を示す。オブジェクト種別は、TABLEなどのオブジェクトの種類を示す。その他の予約語は、BEGINなど、命令語およびオブジェクト種別以外の予約語である。式には、演算子によって結合された語と語の組や、演算子によって結合された語と式の組が含まれる。また、式には、関数名と引数の組が含まれる。引数は、開括弧（「（」）と閉括弧（「）」）に挟まれる。

　句には、一般句、述語句、接尾句、定義句および未分類句が含まれる。一般句は、修飾語と目的語の組である。例えば、TABLE T1のように、オブジェクト種別と識別子の組は一般句である。述語句には、FROM T1やAS T2のように、前置詞と目的語の組が含まれる。また、述語句には、WHERE C1のように、副詞と目的語の組が含まれる。接尾句は、開括弧と閉括弧とで挟まれており、データ型の指定やキーカラムの指定に使用され得る。定義句は、変数の型を指定する言語要素であり、予約語以外の語とデータ型を示す予約語とを含む。未分類句は、一般句、述語句、接尾句および定義句の何れにも該当しない句である。

　なお、構文ツリーの例では、終端記号が「終」、一般句が「句」、述語句が「述」、接尾句が「接」、定義句が「定」、未分類句が「未」と記載されることがある。
　構文ツリー１５１は、ソースコード１４１の構文を示す。ソースコード１４１は、CREATE TABLE T1(C1 CHAR(10), C2 NUMERIC(3,1), PRIMARY KEY(C1,C2)) TABLESPACE SPC1;というＳＱＬ文を含む。構文ツリー１５１は、ツリー構造の無向グラフである。構文ツリー１５１は、それぞれ言語要素を示す複数のノードと、それら複数のノードをツリー構造に結合する複数のエッジとを含む。上位ノードと下位ノードとの間のエッジは、下位ノードに対応する言語要素が、上位ノードに対応する言語要素に包含されることを表す。同一レベル内では、複数の言語要素の出現順序が保持される。左ノードに対応する言語要素は、右ノードに対応する言語要素よりも先に出現する。

　構文ツリー１５１は、ノード１５１ａ，１５１ｂ，１５１ｃ，１５１ｄを含む。ノード１５１ａは、節に含まれる２番目の句のオブジェクト種別を表し、TABLESPACEという文字列に対応する。ノード１５１ｂは、節の先頭の命令語を表し、CREATEという文字列に対応する。ノード１５１ｃは、節に含まれる１番目の句のオブジェクト種別を表し、TABLEという文字列に対応する。ノード１５１ｄは、節に含まれる２番目の句を表す。ノード１５１ａは、ノード１５１ｄの１番目の子ノードである。なお、各ノードは言語要素の種別や値などの属性をもつ。構文ツリーの表示例では、一部の属性のみが表示されている。

　図７は、属性情報の例を示す図である。
　属性情報１７１は、構文ツリーの１つのノードに対応付けられる。属性情報１７１は、位置情報、分類、分類属性、種別、値、値属性および行番号を含む。ただし、ノードの種別によって、一部の項目の項目値が定義されないことがある。

　位置情報は、構文ツリー内でのノードの位置を示す。後述するように、ノードの位置は、縦位置と横位置を含む二次元座標で表現され得る。分類は、文、節、句、式、語などの最上位の分類を示す。分類属性は、一般ノードと補完ノードの区別を示す。一般ノードは、ソースコードの記述から直接的に抽出された言語要素を示す。補完ノードは、ソースコードに明示的に記述されていないものの解釈上補完された言語要素を示す。種別は、一般句や命令語など、上記の分類を更に細分化したグループである。値は、語の文字列である。値属性は、値の種別である。値属性には、一般文字列と補完文字列が含まれる。行番号は、ノードに対応する言語要素がソースコードの中で出現する行の番号である。

　構文ツリーは、二次元表形式の構文テーブルとして表現され得る。これにより、ノードの位置の特定が容易となり、ノードの識別やノード探索の手順の記述が容易となる。構文ツリーの各ノードは、以下のような規則で構文テーブルに配置される。

　図８は、構文テーブルの例を示す図である。
　構文テーブル１７２は、図６の構文ツリー１５１と同等の構文テーブルである。構文テーブル１７２の左上のセルの位置座標が（１，１）である。下に進むほど縦位置を示す行番号が大きくなり、右に進むほど横位置を示す列番号が大きくなる。各セルの位置座標は（行番号，列番号）として定義される。

　文を示すノードは、構文テーブル１７２の左上のセルに配置される。あるノードの直下にある子ノードのうち最も左側の子ノードは、当該ノードに対応するセルの１つ下のセルに配置される。１つ下のセルは、行番号が１つ大きく列番号が同じセルである。あるノードと同じ親ノードをもつ他のノードであって当該ノードより右側にある他のノードは、当該ノードに対応するセルの右側のセルに配置される。右側のセルは、行番号が同じであり列番号が大きいセルである。各ノードが配置されるセルは、深さ優先順に決定される。

　１つの列には、構文ツリーに含まれる１つの語のノードが配置される。よって、親子関係にある２つのノードの行番号は連続する一方、同一の親ノードをもつ２つのノードの列番号は不連続であることがある。これにより、ソースコード１４１に含まれる２９個の語に対応する語ノードが、構文テーブル１７２の第１列から第２９列に順序を保持して配置される。構文テーブル１７２と構文ツリー１５１とは、相互に変換可能である。

　非互換情報は、構文ツリーの上で条件を満たすノードを探索する１以上の特定命令と、構文ツリーに含まれる一部のノードを書き換える１以上の書換命令とを含む。
　図９は、命令テーブルの例を示す図である。

　命令テーブル１７３は、非互換情報で使用され得る命令の定義を示す。命令テーブル１７３の１つのレコードが１つの命令を示す。命令テーブル１７３の１つのレコードは、命令、縦位置、横位置、探索属性およびキーワードを含む。

　縦位置、横位置、探索属性およびキーワードは、命令の引数である。縦位置は、着目する現ノードと対象ノードとの間の上下方向の位置関係に対する条件である。＋は上方向を示し、－は下方向を示し、ｎは現ノードからの距離を示し、＊は距離制限なしを示す。横位置は、着目する現ノードと対象ノードとの間の左右方向の位置関係に対する条件である。＝は現ノードと同じ横位置を示し、＋は右方向を示し、－は左方向を示し、ｎは現ノードからの距離を示し、＊は距離制限なしを示す。

　横位置は［命令番号］というフォーマットで指定されることがある。これは、その命令番号をもつ命令で選択されたノードの横位置を始点として探索を行うことを示す。また、横位置は［命令番号１：命令番号２］というフォーマットで指定されることがある。これは、命令番号１をもつ命令で選択されたノードの横位置と、命令番号２をもつ命令で選択されたノードの横位置との間を探索することを示す。探索属性は、対象ノードがもつ分類、分類属性、種別および値属性に対する条件である。

　キーワードは、ノードを特定するための探索属性以外の情報である。キーワードは、語の値としての識別子であることがある。また、キーワードとして、実行済みの命令の命令番号が指定されることがある。これは、その命令によって特定されたノードを再選択することを示す。また、命令の結果が真である場合、すなわち、条件を満たすノードが存在する場合に実行されるアクションが、命令に付随して規定され得る。

　アクションなしは、次の命令に進むことを示す。RETは、次の命令を実行し、次の命令の結果が偽である場合に当該命令に戻ることを示す。NEXT[命令番号]は、指定された命令番号の命令にジャンプすることを示す。また、着目する現ノードの属性情報を利用した他の命令そのものが、アクションとして規定されることがある。

　命令には、FETCH，SEARCH，POP，GET PRM，SET PRM，！，DELETE，CREATE，MODIFYが含まれる。FETCH，SEARCH，POP，GET PRM，SET PRM，！は、特定命令として使用され得る。DELETE，CREATE，MODIFYは、書換命令として使用され得る。

　FETCHは、条件を満たすノードを探索し、着目する現ノード（カレントノード）を、検出されたノードに変更する命令である。SEARCHは、条件を満たすノードを探索するものの、現ノードを変更しない命令である。POPは、現ノードを、実行済みのFETCHによって選択されたノードに戻す命令である。GET PRMは、条件を満たすノードの属性情報をスタックに保存する命令である。SET PRMは、スタックに保存された属性情報を出力する命令である。SET PRMは、FETCHまたはSEARCHのキーワードの中で使用されることがある。！は、真偽を反転する否定命令である。SEARCHの前に！を付加することで、条件を満たすノードが検出されない場合に命令の結果が真と判定される。

　DELETEは、現ノードを基準にして指定範囲のノードを構文ツリーから削除する命令である。CREATEは、現ノードの前または後に部分ツリーを挿入する命令である。挿入される部分ツリーは、命令列とは別にCREATE情報として保存されている。CREATEは、CREATE情報を識別するCREATE情報番号を含むキーワードを引数としてもつ。MODIFYは、現ノードの属性情報を書き換える命令である。アクションでは正規表現プログラムが指定され得る。

　通常、非互換情報は、非互換箇所に関する最も特徴的なキーワードを最初に検索する。最初のキーワードはアンカーと呼ばれることがあり、構文ツリーからのアンカーの検索はアンカーサーチと呼ばれることがある。非互換情報は、構文ツリーにおけるアンカーの周辺から、属性が特定の条件を満たす周辺ノードを検索する。これにより、非互換箇所を形成するノード集合が特定される。非互換箇所の特徴は一意条件と呼ばれることがある。構文ツリーの中から非互換箇所が特定されると、非互換情報は、検出済みの何れかのノードを基点として、書き換えるノードを特定する。基点はアンカーであることがある。

　図１０は、非互換情報の第１の例を示す図である。
　非互換情報１６１は、図６の構文ツリー１５１に適用される非互換情報の例である。ここでは、ソースコード１４１に含まれるTABLESPACE SPC1が変更後のデータベース製品と非互換であり、TABLESPACE SPC1を削除することで非互換性が解消される場合を考える。非互換情報１６１の１つのレコードは、１つの特定命令または１つの書換命令に対応する。非互換情報１６１の各レコードは、命令番号、命令属性、命令、縦位置、横位置、探索属性、キーワードおよびアクションを含む。

　命令番号は、命令の実行順序を示す昇順の自然数である。命令属性は、特定命令と書換命令の区別を示す。縦位置、横位置、探索属性およびキーワードは、命令の引数である。アクションは、命令の結果が真である場合に実行される処理を示す。非互換情報１６１は、第１命令から第８命令までの８個の命令を含む。第１命令から第５命令までは特定命令であり、第６命令から第８命令までは書換命令である。

　第１命令は、構文ツリー１５１の中から、種別がオブジェクト種別であり値がTABLESPACEであるノード１５１ａを検索し、現ノードとして選択する。第２命令は、縦位置が現ノードより上であり横位置が現ノードより左であり、分類が節であるノードであって現ノードに最も近いノードを検索し、現ノードとして選択する。第３命令は、現ノードの直下のノードであって、種別が命令語であり値がCREATEであるノード１５１ｂを検索する。第４命令は、縦位置が現ノードの１つ下であり、横位置がCREATEとTABLESPACEの間であり、分類が句であるノードを検索し、現ノードとして選択する。

　第５命令は、現ノードの直下のノードであって、種別がオブジェクト種別であり値がTABLEであるノード１５１ｃを検索する。第５命令の結果が偽である場合は第４命令に戻る。第６命令は、第１命令で選択されたTABLESPACEのノード１５１ａに現ノードを戻す。第７命令は、現ノードの直上のノードであって分類が句であるノード１５１ｄを検索し、現ノードとして選択する。第８命令は、現ノードおよびその配下のノードを削除する。

　第１命令から始めて末尾の特定命令である第５命令まで到達した場合、構文ツリー１５１が非互換箇所を含むと判定される。そして、特定命令の結果を用いて、特定命令に続けて書換命令が実行される。ただし、情報処理システムは、非互換情報１６１に含まれる命令のうち特定命令のみを実行し、検出された非互換箇所の情報を出力してもよい。

　図１１は、構文ツリーの第２の例を示す図である。
　構文ツリー１５２は、ソースコード１４２の構文を示す。ソースコード１４２は、SELECT CAST(C1 AS NUMBER) FROM T1 AS TBL1 WHERE EXISTS(SELECT 1 FROM T2 AS TBL2 WHERE TBL1.C2=CAST(TBL2.C2 AS NUMBER));というＳＱＬ文を含む。このＳＱＬ文は、WHERE EXISTS以下に副問い合わせを含んでおり、複雑な構文をもつ。構文ツリー１５２は、ノード１５２ａ，１５２ｂを含む。ノード１５２ａは、主問い合わせに含まれる式の中のデータ型を表し、NUMBERという文字列に対応する。ノード１５２ｂは、副問い合わせに含まれる式の中のデータ型を表し、NUMBERという文字列に対応する。

　図１２は、非互換情報の第２の例を示す図である。
　非互換情報１６２は、図１１の構文ツリー１５２に適用される非互換情報の例である。ここでは、ソースコード１４２に含まれるデータ型NUMBERが変更後のデータベース製品と非互換であり、NUMBERをNUMERICに置換することで非互換性が解消される場合を考える。

　非互換情報１６２は、第１命令から第１９命令までの１９個の命令を含む。第１命令から第４命令までは、１つ目のデータ型を探索するための特定命令であり、第５命令から第６命令までは、１つ目のデータ型を書き換えるための書換命令である。第７命令から第１７命令までは、２つ目のデータ型を探索するための特定命令であり、第１８命令から第１９命令までは、２つ目のデータ型を書き換えるための書換命令である。

　第１命令は、構文ツリー１５２の中から、種別が命令語であり値がSELECTであるノードを検索し、現ノードとして選択する。第２命令は、縦位置が現ノードより上であり、分類が節であるノードを検索し、現ノードとして選択する。第３命令は、縦位置が現ノードの１つ下であり、横位置が第１命令のSELECTより右であり、分類が式であるノードを検索し、現ノードとして選択する。第４命令は、縦位置が現ノードの１つ下であり、横位置が現ノードより右であり、種別がデータ型であり値がNUMBERであるノード１５２ａを検索し、現ノードとして選択する。第４命令の結果が偽である場合は第３命令に戻る。

　第５命令は、現ノードを削除する。第６命令は、種別がデータ型であり値がNUMERICである新たなノードを生成し、削除されたノードの位置に挿入する。
　図１３は、非互換情報の第２の例を示す図（続き）である。

　第７命令は、第１命令で選択されたSELECTのノードに現ノードを戻す。第８命令は、縦位置が現ノードの１つ下であり、種別が述語句であるノードを検索し、現ノードとして選択する。第９命令は、縦位置が現ノードの１つ下であり、横位置が現ノードより右であり、分類が式であるノードを検索し、現ノードとして選択する。第９命令の結果が偽である場合は第８命令に戻る。第１０命令は、縦位置が現ノードの１つ下であり、横位置が現ノードより右であり、種別が接続句であるノードを検索し、現ノードとして選択する。第１０命令の結果が偽である場合は第９命令に戻る。

　第１１命令は、縦位置が現ノードの１つ下であり、横位置が現ノードより右であり、分類が節であるノードを検索し、現ノードとして選択する。第１１命令の結果が偽である場合は第１０命令に戻る。第１２命令は、縦位置が現ノードの１つ下であり、種別が命令語であり値がSELECTであるノードを検索する。第１２命令の結果が偽である場合は第１１命令に戻る。第１３命令は、第１２命令のSELECTの上にあり、分類が節であるノードを検索し、現ノードとして選択する。第１３命令の結果が偽である場合は第１２命令に戻る。

　第１４命令は、縦位置が現ノードの１つ下であり、横位置が第１１命令の節より右であり、種別が述語句であるノードを検索し、現ノードとして選択する。第１５命令は、縦位置が現ノードの１つ下であり、横位置が第１２命令のSELECTより右であり、分類が式であるノードを検索し、現ノードとして選択する。第１５命令の結果が偽である場合は第１４命令に戻る。第１６命令は、縦位置が現ノードの１つ下であり、横位置が第１３命令の節より右であり、分類が式であるノードを検索し、現ノードとして選択する。第１６命令の結果が偽である場合は第１５命令に戻る。

　第１７命令は、縦位置が現ノードの１つ下であり、横位置が第１４命令の述語句より右であり、種別がデータ型であり値がNUMBERであるノード１５２ｂを検索し、現ノードとして選択する。第１７命令の結果が偽である場合は第１６命令に戻る。第１８命令は、現ノードを削除する。第１９命令は、種別がデータ型であり値がNUMERICである新たなノードを生成し、削除されたノードの位置に挿入する。

　図１４は、ＳＱＬプロシジャのソースコードの例を示す図である。
　ここで、ＳＱＬプロシジャコードの構文について説明する。データベース製品は、ユーザプログラムが複雑なデータ処理を簡潔に要求できるように、一纏まりのデータ処理を記述するためのＳＱＬプロシジャ言語を定義していることがある。ただし、ＳＱＬプロシジャ言語は、ＳＱＬと類似する文法をもつことが多い。そこで、情報処理装置１００は、ＳＱＬプロシジャ言語に特有の言語要素を追加した上で、ＳＱＬの構文とＳＱＬプロシジャ言語の構文とを包含する共通の構文規則を定義する。

　ＳＱＬプロシジャコードは、前述のＳＱＬの言語要素に加えて、制御文、セクション、ブロックおよびモジュールを言語要素として含む。制御文は、条件分岐やループなどの制御構造を表す文である。制御文は、IF，WHEN，IN，THEN，ELSE，END IF，LOOP，END LOOPなどの制御用の語または句を含む。セクションは、特定のキーワードによって挟まれるソースコード内の領域であり、ブロックに包含される。セクションの開始または終了を示す語には、DECLARE，BEGIN，EXCEPTION，END，AS，ISなどが含まれる。

　ブロックは、セクションまたはブロックを１つ以上含むソースコード内の領域である。ブロックには、FUNCTIONブロック、PROCEDUREブロック、ブロック名が付与されていない無名ブロックなどが含まれる。モジュールは、ソースコード全体を表す単位である。１つのモジュールは、物理的な１つのファイルに対応する。ソースコードの言語種別は、ファイル名の拡張子またはソースコードの先頭の宣言に基づいて判別される。言語種別は、ＳＱＬまたはＳＱＬプロシジャ言語である。

　制御文、セクション、ブロックおよびモジュールの境界は、特定のキーワードによって判定される。ただし、ソースコードの末尾にはEOF（End Of File）が含まれているとみなす。例えば、ソースコードの中から、IFからEND IFまでの領域やDECLAREからBEGINまでの領域が抽出される。構文ツリーにおいて、制御文、セクション、ブロックまたはモジュールを表すノードには、領域の先頭のキーワードが割り当てられる。当該ノードの配下には、次のキーワードが現れる前までの言語要素が展開される。

　ソースコード１４３は、ＳＱＬプロシジャコードを含む。ソースコード１４３は、空行も含めて１９行のソースコードである。１行目のASは、セクションの開始を示すキーワードである。ただし、ASの前の文字列が文として完結していない。そこで、情報処理システムは、ASの直前に終端記号を補完して１つの文として解釈する。３行目のv VARCHAR(50)は定義句であるものの、命令語を含む節の一部として使用されていない。そこで、情報処理システムは、定義句を包含する節がソースコードに明示的に出現しない場合、DECLAREという命令語が省略されていると解釈する。

　５行目のFUNCTIONは、ブロックの開始を示すキーワードである。５行目のRETURN NUMBERは、命令語に続く句を含んでいない。そこで、情報処理システムは、データ型の後にTBD（To Be Determined）を補完し、データ型と値とを含む句が命令語の後に続いている節であると解釈する。８行目のBEGINは、セクションの開始を示すキーワードである。１０行目のRETURN d;は、命令語に続く句を含んでいない。そこで、情報処理システムは、データ型が規定済みであることを示すEST（Established）を補完し、データ型と値とを含む句が命令語の後に続いている節であると解釈する。

　１１行目のENDは、セクションの区切りを示すキーワードである。ただし、ENDの後に、FUNCTIONブロックの名称と終端記号が続いている。そこで、情報処理システムは、ENDセクションの中にEND命令を含む節が省略されていると解釈し、そのような節を補完する。また、情報処理システムは、ESTを補完し、データ型とFUNCTIONの名称とを含む句がEND命令の後に続いていると解釈する。１３行目のPROCEDUREは、ブロックの開始を示すキーワードである。情報処理システムは、１５行目のBEGIN、１７行目のEND protestおよび１９行目のEND ptest;についても、上記と同様に解釈する。

　図１５は、構文ツリーの第３の例を示す図である。
　構文ツリー１５３は、ソースコード１４３の構文を示す。構文ツリー１５３は、ノード１５３ａ，１５３ｂ，１５３ｃ，１５３ｄ，１５３ｅ，１５３ｆを含む。ノード１５３ａは、ソースコード１４３の１行目から始まるASセクションを表す。ノード１５３ｂは、ソースコード１４３の３行目に補完された命令語DECLAREを表す。ノード１５３ｃは、ソースコード１４３の３行目に記載された変数vを表す。ノード１５３ｄは、ソースコード１４３の５行目から始まるFUNCTIONブロックを表す。

　図１６は、構文ツリーの第３の例を示す図（続き）である。
　ノード１５３ｅは、ソースコード１４３の１３行目から始まるPROCEDUREブロックを表す。ノード１５３ｆは、ソースコード１４３の１６行目に記載された変数vを表す。ノード１５３ｆは、ノード１５３ｃで定義された変数vの参照を意味する。

　図１７は、非互換情報の第３の例を示す図である。
　非互換情報１６３は、図１５，１６の構文ツリー１５３に適用される非互換情報の例である。ここでは、ソースコード１４３において、FUNCTIONブロックおよびPROCEDUREブロックの外で変数vを宣言する記載方法が非互換であり、外部変数であることを示す修飾子externを変数名の前に挿入することで非互換性が解消される場合を考える。

　変更前のデータベース製品は、ASセクションが２以上のブロックを含み、それら２以上のブロックの外で変数が宣言されている場合、その変数を２以上のブロックで共通に使用できるグローバル変数（外部変数）として解釈する。一方、変更後のデータベース製品は、外部変数として明示的に宣言されていない変数をローカル変数（内部変数）として解釈する。よって、構文ツリー１５３のノード１５３ｃ，１５３ｆに非互換性が存在する。この非互換性は、ノード１５３ｃの前に修飾子externを示すノードを挿入し、ノード１５３ｆの変数名をextern.vに書き換えることで解消される。

　ただし、PROCEDUREブロックの中で同じ変数名の内部変数が定義されている場合、ノード１５３ｆが示す変数vはノード１５３ｃで定義された外部変数を指しているのではなく、内部変数を指している。そこで、ノード１５３ｆの変数名の書き換えは、PROCEDUREブロックの中で同じ変数名の内部変数が定義されていない場合のみ実行される。

　非互換情報１６３は、第１命令から第１４命令までの１４個の命令を含む。第１命令から第６命令までは、ブロック外の変数宣言を探索するための特定命令であり、第７命令から第８命令までは、変数宣言を書き換えるための書換命令である。第９命令から第１３命令までは、ブロック内の変数参照を探索するための特定命令であり、第１４命令は、変数参照を書き換えるための書換命令である。

　第１命令は、構文ツリー１５３の中から、分類がセクションであり値がASであるノード１５３ａを検索し、現ノードとして選択する。第２命令は、縦位置が現ノードより１つ下であり、分類が文であるノードを検索し、現ノードとして選択する。第３命令は、縦位置が現ノードより１つ下であり、分類が節であるノードを検索し、現ノードとして選択する。第３命令の結果が偽である場合は第２命令に戻る。

　第４命令は、現ノードの直下のノードであって、種別が命令語であり値がDECLAREであるノード１５３ｂを検索する。第４命令の結果が偽である場合は第３命令に戻る。第５命令は、現ノードの直下のノードであって、種別が定義句であるノードを検索し、現ノードとして選択する。第６命令は、現ノードの直下のノードであって、種別が語であるノード１５３ｃを検索し、ノード１５３ｃの値を保存する。

　第７命令は、第１命令で選択されたノード１５３ａに現ノードを戻す。第８命令は、現ノードの左横に、CREATE情報番号で指定された部分ツリーを挿入する。
　第９命令は、縦位置が現ノードより下であり、分類がブロックであるノード１５３ｄ，１５３ｅを検索し、現ノードとして選択する。第１０命令は、縦位置が現ノードより下であり、分類が式であるノードを検索し、現ノードとして選択する。第１０命令の結果が偽である場合は第９命令に戻る。第１１命令は、縦位置が現ノードより下であり、分類が語であるノード１５３ｆを検索し、現ノードとして選択する。第１１命令の結果が偽である場合は第１０命令に戻る。第１２命令は、現ノードの値が、第６命令で保存された変数名と一致するか判定する。第１２命令の結果が偽である場合は第１１命令に戻る。

　第１３命令は、縦位置が現ノードの１つ上であり、種別が定義節であるノードが存在しないことを確認する。第１４命令は、現ノードの値を、アクションで指定された正規表現プログラムに従って書き換える。ここでは、変数名の先頭にexternが挿入される。

　このようにして、構文ツリーから非互換箇所が探索される。ただし、構文ツリーは副問い合わせなどの入れ子構造をもつことがあるため、探索が複雑化して計算量が大きくなるおそれがある。また、非互換情報が複雑化するおそれがあり、非互換情報の作成や管理の負担が大きくなるおそれがある。そこで、情報処理システムは、アンカーからの探索範囲を制限する。あるノードの子ノードが、文法的に当該ノードのレベル以上の分類（例えば、句に対する句や節）をもつ場合、その子ノードが探索範囲から除外される。また、あるノードの親ノードが、文法的に当該ノードのレベル以下の分類（例えば、節に対する節や句）をもつ場合、その親ノードが探索範囲から除外される。

　よって、情報処理システムは、非互換情報が上方向への探索を指示する場合であっても、親ノードの分類が現ノードの分類以下である場合は上方向の探索を停止する。また、情報処理システムは、非互換情報が下方向への探索を指示する場合であっても、子ノードの分類が現ノードの分類以上である場合は下方向の探索を停止する。

　また、情報処理システムは、非互換情報が右方向への探索を指示する場合であっても、現ノードが属する命令範囲を超えるような既知のキーワードが検出された場合は、右方向への探索を停止する。同様に、情報処理システムは、非互換情報が左方向への探索を指示する場合であっても、現ノードが属する命令範囲を超えるような既知のキーワードが検出された場合は、左方向への探索を停止する。

　次に、エディタ１２３による非互換情報の作成の支援について説明する。
　図１８は、エディタ画面の例を示す図である。
　エディタ１２３は、非互換情報１６１の作成を支援するユーザインタフェースとして、エディタ画面１７４を端末装置３１に提供する。端末装置３１は、ソースコード１４１をエディタ１２３に送信する。エディタ１２３は、ソースコード１４１を構文解析して構文ツリー１５１を生成し、構文ツリー１５１を含むエディタ画面１７４を生成する。エディタ１２３は、エディタ画面１７４を端末装置３１に送信する。

　端末装置３１は、エディタ画面１７４を表示する。端末装置３１は、エディタ画面１７４に対する操作を受け付ける。エディタ画面１７４に対する操作には、構文ツリー１５１の中から着目するノードを順に選択するノード選択が含まれ、選択されたノードを削除するノード削除や指定した位置にノードを挿入するノード追加が含まれる。また、エディタ画面１７４に対する操作には、条件リストの中から定義済みの検索条件を選択する条件指定が含まれる。また、エディタ画面１７４に対する操作には、選択されたノードの属性をパラメータケースに保存するパラメータ保存や、パラメータケースに保存された属性を検索条件として使用するパラメータ読み出しが含まれる。

　端末装置３１は、受け付けた操作をエディタ１２３に送信する。エディタ１２３は、受信された操作に応じて特定命令および書換命令を生成する。例えば、エディタ１２３は、構文ツリー１５１のノードを順に選択するノード選択に基づいて、選択されたノードを一筆書きで辿る経路を判定する。エディタ１２３は、経路上の各ノードの属性および経路上のノードの位置関係から、FETCH命令やSEARCH命令を自動的に生成する。

　エディタ１２３は、生成された特定命令および書換命令を端末装置３１に送信する。端末装置３１は、受信された特定命令および書換命令をエディタ画面１７４に表示する。なお、ソースコード１４１の構文解析、エディタ画面１７４の生成、エディタ画面１７４に対する操作の解釈および非互換情報の生成のうちの一部または全部が、端末装置３１によって実行されてもよい。情報処理装置１００は、エディタ１２３に相当するプログラムを端末装置３１に送信するようにしてもよい。

　図１９は、エディタ画面の第１の操作手順例を示す図である。
　ここでは、構文ツリー１５１から非互換情報１６１を生成するための操作例を説明する。端末装置３１は、キーワードTABLESPACEをもつノード１５１ａを選択する（Ｓ１０）。これにより、第１命令が生成される。次に、端末装置３１は、キーワードCREATEをもつノード１５１ｂを選択する（Ｓ１１）。これにより、ノード１５１ａからノード１５１ｂに到達する経路が探索され、第２命令から第３命令が生成される。

　次に、端末装置３１は、キーワードTABLEをもつノード１５１ｃを選択する（Ｓ１２）。これにより、ノード１５１ｂからノード１５１ｃに到達する経路が探索され、第４命令から第５命令が生成される。次に、端末装置３１は、ノード１５１ａを再び選択して、着目するノードをノード１５１ａに戻す（Ｓ１３）。これにより、第６命令が生成される。次に、端末装置３１は、TABLESPACE句を示すノード１５１ｄを選択する（Ｓ１４）。これにより、第７命令が生成される。最後に、端末装置３１は、構文ツリー１５１からノード１５１ｄを削除する（Ｓ１５）。これにより、第８命令が生成される。

　図２０は、エディタ画面の第２の操作手順例を示す図である。
　ここでは、構文ツリー１５３から非互換情報１６３を生成するための操作例を説明する。端末装置３１は、ASセクションを示すノード１５３ａを選択する（Ｓ２０）。これにより、第１命令が生成される。次に、端末装置３１は、キーワードDECLAREをもつノード１５３ｂを選択する（Ｓ２１）。これにより、ノード１５３ａからノード１５３ｂに到達する経路が探索され、第２命令から第４命令が生成される。

　次に、端末装置３１は、変数名vを示すノード１５３ｃを選択し、変数名vをパラメータケースに保存する（Ｓ２２）。これにより、ノード１５３ｂからノード１５３ｃに到達する経路が探索され、ノード１５３ｃの値が抽出され、第５命令から第６命令が生成される。次に、端末装置３１は、ノード１５３ａを再び選択して、着目するノードをノード１５３ａに戻す（Ｓ２３）。これにより、第７命令が生成される。

　次に、端末装置３１は、事前に作成された部分グラフを示すCREATE情報番号を入力することで、構文ツリー１５３に部分グラフを挿入する（Ｓ２４）。これにより、第８命令が生成される。次に、端末装置３１は、ASセクションの配下にあるブロックとして、FUNCTIONブロックを示すノード１５３ｄおよびPROCEDUREブロックを示すノード１５３ｅを選択し、ノード１５３ｄ，１５３ｅの下を探索範囲として指定する（Ｓ２５）。

　次に、端末装置３１は、パラメータケースから変数名vを読み出し、条件リストから「定義節の子でない」という検索条件を選択し、変数名vを示すノード１５３ｆを選択する（Ｓ２６）。これにより、探索範囲からノード１５３ｆを検索する検索方法が特定され、第９命令から第１３命令が生成される。最後に、端末装置３１は、ノード１５３ｆの値をvからextern.vに書き換える（Ｓ２７）。これにより、第１４命令が生成される。

　次に、テスト部１２５による非互換情報の自動テストについて説明する。
　図２１は、非互換情報のテストの例を示す図である。
　テスト部１２５は、サンプルコード記憶部１２１からソースコード１４１を読み出す。ソースコード１４１は、プリペアード状態の非互換情報１６１と併せて端末装置３１から提供される。ソースコード１４１は、カラムＣ１，Ｃ２を含むテーブルＴ１を新規に作成することを要求するＳＱＬ文を含む。前述のように、ソースコード１４１は、変更後のデータベース製品と非互換であるTABLESPACE句を含む。

　テスト部１２５は、ソースコード１４１を構文解析して構文ツリー１５１を生成し、非互換情報１６１に含まれる一連の命令を構文ツリー１５１に対して実行することで、ソースコード１４１をソースコード１４４に変換する。ソースコード１４４は、ソースコード１４１と同様に、カラムＣ１，Ｃ２を含むテーブルＴ１を新規に作成することを要求するＳＱＬ文を含む。ただし、ソースコード１４４は、TABLESPACE句を含まない。

　テスト部１２５は、ソースコード１４４に含まれるＳＱＬ文をテストデータベース１２８に送信してＳＱＬ文を実行し、テストデータベース１２８から実行結果を抽出する。テストデータベース１２８は、非互換情報が想定する変更後のデータベース製品であり、情報処理装置１００または他の情報処理装置に事前にインストールされている。

　テスト部１２５は、サンプルコード記憶部１２１から正解の実行結果を読み出し、テストデータベース１２８から抽出された今回の実行結果と正解の実行結果を比較して両者が一致しているか判定する。正解の実行結果は、ソースコード１４１と併せて端末装置３１から提供される。ソースコード１４１に対応する正解の実行結果は、カラムＣ１，Ｃ２を含む空のテーブルＴ１が生成されたことである。

　今回の実行結果と正解の実行結果とが一致した場合、テスト部１２５は、非互換情報１６１が正しく動作していると判定する。一方、今回の実行結果と正解の実行結果とが一致しなかった場合、テスト部１２５は、非互換情報１６１が正しく動作しておらず非互換情報１６１に不具合があると判定する。なお、正解の実行結果が端末装置３１から提供されていない場合、テスト部１２５は、今回の実行結果を端末装置３１に送信し、今回の実行結果が正しいか否か判断した結果を端末装置３１から受信する。

　次に、同一性判定部１２６による非互換情報の同一性判定について説明する。
　図２２は、非互換情報の第４の例を示す図である。
　非互換情報１６４は、非互換情報１６１と同一の非互換箇所を検出することができる。ただし、非互換情報１６１，１６４は、探索手順が異なるために異なる特定命令を含む。非互換情報１６４は、特定命令として第１命令から第６命令までの６個の命令を含む。

　第１命令は、構文ツリー１５１の中から、種別が命令語であり値がCREATEであるノード１５１ｂを検索し、現ノードとして選択する。第２命令は、縦位置が現ノードより上であり、分類が節であるノードを検索し、現ノードとして選択する。第３命令は、縦位置が現ノードの１つ下であり、横位置が第１命令のCREATEより右であり、分類が句であるノードを検索し、現ノードとして選択する。第４命令は、現ノードの直下にあるノードであって、種別がオブジェクト種別であり値がTABLEであるノード１５１ｃを検索する。

　第５命令は、横位置が第３命令のTABLE句より右であり、分類が句であるノード１５１ｄを検索し、現ノードとして選択する。第６命令は、現ノードの直下のノードであって、種別がオブジェクト種別であり値がTABLESPACEであるノード１５１ａを検索する。このように、探索の始点であるアンカーは非互換情報の作成者の主観に依存するため、同一の非互換箇所を検出することができる複数の非互換情報が作成され得る。

　そこで、同一性判定部１２６は、既存の非互換情報とプリペアード状態の非互換情報との間の実質的な同一性を判定する。情報処理装置１００は、既存の非互換情報と実質的に同一であると判定された非互換情報の登録を拒否することがある。これにより、情報処理装置１００は、知識データベースの冗長性を削減して非互換情報を効率的に管理できる。また、情報処理装置１００は、プリペアード状態の非互換情報と実質的に同一であると判定された既存の非互換情報が、他者によって再発見されて使用されたとみなし、既存の非互換情報の使用実績としてカウントすることがある。これにより、情報処理装置１００は、各非互換情報の価値を適切に評価することができる。

　実質的同一性を判定するにあたり、同一性判定部１２６は、以下のようにして各非互換情報からＢＯＷベクトルを生成する。既存の非互換情報のＢＯＷベクトルは、非互換情報と併せて非互換情報記憶部１２２に保存されてもよい。

　図２３は、ＢＯＷベクトルテーブルの例を示す図である。
　同一性判定部１２６は、非互換情報からキーワードが含まれる命令を抽出し、抽出された各命令から探索属性とキーワードのペアを抽出する。同一性判定部１２６は、同一のペアの出現回数をカウントし、出現回数を列挙したＢＯＷベクトルを生成する。ＢＯＷベクトルの１つの要素は、あるペアの出現回数を示す。ただし、同一性判定部１２６は、出現回数を非互換情報の命令数で割るなどの調整によって、同一のペアの出現確率を算出し、出現確率を列挙したＢＯＷベクトルを生成してもよい。

　これにより、同一性判定部１２６は、ＢＯＷベクトルテーブル１８１を生成する。ＢＯＷベクトルテーブル１８１は、非互換情報１６１，１６４のＢＯＷベクトルを含む。同一性判定部１２６は、非互換情報１６１について、第１命令から（オブジェクト種別，TABLESPACE）を抽出し、第３命令から（命令語，CREATE）を抽出し、第５命令から（オブジェクト種別，TABLE）を抽出する。また、同一性判定部１２６は、非互換情報１６４について、第１命令から（命令語，CREATE）を抽出し、第４命令から（オブジェクト種別，TABLE）を抽出し、第６命令から（オブジェクト種別，TABLESPACE）を抽出する。

　よって、同一性判定部１２６は、第１要素を（命令語，CREATE）、第２要素を（オブジェクト種別，TABLE）、第３要素を（オブジェクト種別，TABLESPACE）に割り当てると、非互換情報１６１，１６４から共に（１，１，１）というＢＯＷベクトルを生成する。

　同一性判定部１２６は、プリペアード状態の非互換情報のＢＯＷベクトルと既存の非互換情報のＢＯＷベクトルとの間でコサイン類似度を算出する。コサイン類似度は、例えば、同一次元毎に積を算出して合算し、２つのＢＯＷベクトルのノルムで割ることで算出される。コサイン類似度の最大値は１であり、１に近いほど類似度が高いことを意味する。非互換情報１６１，１６４のＢＯＷベクトルは同一であり、そのコサイン類似度は１である。同一性判定部１２６は、コサイン類似度が閾値以下である場合、２つの非互換情報が類似しておらず、同一の非互換箇所を検出するものではないと判定する。

　ただし、上記のＢＯＷベクトルはキーワードの出現順序を考慮していない。そのため、ＢＯＷベクトルのコサイン類似度が閾値以下であっても、２つの非互換情報が同一の非互換箇所を検出するものではないことがある。例えば、CREATE TABLESPACE SPC1 TABLE COMPRESSION::=();というＳＱＬ文からCREATE TABLESPACEという非互換箇所を検出する非互換情報からは、非互換情報１６１と同一のＢＯＷベクトルが生成される可能性がある。

　そこで、同一性判定部１２６は、まず上記のＢＯＷベクトルを用いて、既存の非互換情報の中からプリペアード状態の非互換情報と実質的に同一である可能性があるものを絞り込む。その後、同一性判定部１２６は、プリペアード状態の非互換情報と絞り込まれた既存の非互換情報との間で、非互換情報から推定されるソースコード上でのキーワードの出現順序を比較して、最終的に同一性を判定する。

　このとき、同一性判定部１２６は、以下のようにして各非互換情報からキーワードリストを生成する。既存の非互換情報のキーワードリストは、非互換情報と併せて非互換情報記憶部１２２に保存されてもよい。

　図２４は、キーワードリストの第１の生成例を示す図である。
　同一性判定部１２６は、非互換情報からFETCH命令に含まれるキーワードおよびSEARCH命令に含まれるキーワードを抽出する。同一性判定部１２６は、非互換情報に含まれる命令の横位置を追跡することで、抽出された２以上のキーワードがソースコードに含まれる場合における当該２以上のキーワードの出現順序を推定する。非互換情報は、２以上のキーワードを構文ツリーの左から右に向かう順序で探索するとは限らないため、同一性判定部１２６は、非互換情報に規定された探索範囲に基づいて出現順序を推定する。同一性判定部１２６は、キーワードを出現順に並べたキーワードリストを生成する。

　同一性判定部１２６は、非互換情報１６１からキーワードリスト１８２を生成する。まず、同一性判定部１２６は、第１命令からキーワードTABLESPACEを抽出し、TABLESPACEを示すノード１８３を生成する。次に、同一性判定部１２６は、第２命令の横位置に基づいて、次のノード位置をノード１８３の左と判定する。次に、同一性判定部１２６は、第３命令からキーワードCREATEを抽出し、CREATEを示すノード１８４を生成する。

　次に、同一性判定部１２６は、第４命令の横位置に基づいて、次のノード位置をノード１８３とノード１８４の間と判定する。最後に、同一性判定部１２６は、第５命令からキーワードTABLEを抽出し、TABLEを示すノード１８５を生成する。これにより、CREATE，TABLE，TABLESPACEの順にキーワードが並んだキーワードリスト１８２が生成される。

　図２５は、キーワードリストの第２の生成例を示す図である。
　同一性判定部１２６は、非互換情報１６４からキーワードリスト１８６を生成する。まず、同一性判定部１２６は、第１命令からキーワードCREATEを抽出し、CREATEを示すノード１８７を生成する。次に、同一性判定部１２６は、第３命令の横位置に基づいて、次のノード位置をノード１８７の右と判定する。次に、同一性判定部１２６は、第４命令からキーワードTABLEを抽出し、TABLEを示すノード１８８を生成する。

　次に、同一性判定部１２６は、第５命令の横位置に基づいて、次のノード位置をノード１８８の右と判定する。最後に、同一性判定部１２６は、第６命令からキーワードTABLESPACEを抽出し、TABLESPACEを示すノード１８９を生成する。これにより、CREATE，TABLE，TABLESPACEの順にキーワードが並んだキーワードリスト１８６が生成される。

　同一性判定部１２６は、２つのキーワードリストの間で類似度を算出する。例えば、同一性判定部１２６は、キーワードリストの編集距離を算出する。同一性判定部１２６は、一方のキーワードリストを他方のキーワードリストに変換するためのキーワードの挿入、削除および置換の操作回数の最小値を算出する。また、例えば、同一性判定部１２６は、キーワードリストのユークリッド距離を算出する。同一性判定部１２６は、異なるキーワード間の類似度を事前に定義しておき、キーワードリストの同じ位置にあるキーワード同士の類似度の二乗和平方根または二乗平均平方根を算出する。

　なお、キーワードの出現順序を考慮して文書間の類似度を算出する方法については、例えば、次の文献にも記載されている。小中史人、三浦孝夫、「語の並びを考慮した意味類似度手法の提案」、第７回データ工学と情報マネジメントに関するフォーラム（ＤＥＩＭ２０１５）、Ａ２－６、２０１５年３月２日。

　同一性判定部１２６は、キーワードリストの類似度が閾値以下である場合、２つの非互換情報が類似しておらず、同一の非互換箇所を検出するものではないと判定する。一方、同一性判定部１２６は、キーワードリストの類似度が閾値を超える場合、２つの非互換情報が類似しており、同一の非互換箇所を検出するものである可能性があると判定する。この点、キーワードリスト１８２，１８６は同一である。よって、同一性判定部１２６は、非互換情報１６１，１６４が実質的に同一であると判定する。

　次に、非互換情報の非互換サブ情報への分割について説明する。非互換情報は、同一の非互換性に関連して、構文ツリー上の離れた位置にある複数のノードを検索して書き換えることがある。その場合、非互換情報は、特定命令の列および書換命令の列を複数セット含むことがある。そのような複数の命令セットは、互いに分離して再利用可能であることがあり、ある命令セットは他の非互換情報に流用できることがある。

　そこで、情報処理装置１００は、再利用可能な命令セットとして、非互換情報から非互換サブ情報を抽出する。同一性判定部１２６は、端末装置３１から受信された非互換情報全体の同一性に加えて、非互換サブ情報単位での同一性も判定する。

　複数の非互換サブ情報を含む非互換情報の例として、図１２，１３に示した非互換情報１６２のように、入れ子構造をもつ構文ツリーにおいて、ある部分ツリーを探索する命令セットと別の部分ツリーを探索する命令セットとを含むものがある。前述のように、構文ツリーの探索は、各ノードの分類レベルに基づいて縦方向の探索範囲を制限し、各ノードのキーワードに基づいて横方向の探索範囲を制限する。そこで、入れ子構造を探索する非互換情報は、複数の非互換サブ情報に分割され得る。

　ただし、非互換情報に含まれる後方の命令セットは、POP命令によって、前方の命令セットで検出されたノードを基点として探索を行うことがある。後方の命令セットを再利用可能な非互換サブ情報として評価するにあたっては、前方の命令セットに依存する特定命令を排除することが好ましい。そこで、同一性判定部１２６は、非互換情報を単純に分割するだけでなく、一部の命令を変更することがある。

　また、複数の非互換サブ情報を含む非互換情報の例として、図１７に示した非互換情報１６３のように、GET PRM命令とSET PRM命令を用いて、前方の命令セットから後方の命令セットにパラメータを引き継ぐものがある。このような非互換情報からは、GET PRM命令を用いた命令セット間の結合の態様に応じて、再利用可能な命令範囲を複数通り抽出することができる。よって、非互換情報から複数の非互換サブ情報が抽出され得る。

　図２６は、非互換サブ情報の抽出例を示す図である。
　非互換サブ情報１６５は、非互換情報１６２から抽出される２番目の非互換サブ情報である。非互換情報１６２から抽出される１番目の非互換サブ情報は、非互換情報１６２の第１命令から第６命令までと同一である。同一性判定部１２６は、非互換情報１６２の中から、命令属性が書換命令から特定命令に切り替わる境界を検出する。同一性判定部１２６は、境界前後で命令セットを分割する。

　ただし、非互換情報１６２の第７命令は、第１命令で検出された１番目のSELECTに現ノードを戻すPOP命令である。非互換情報１６２の第８命令から第１２命令は、１番目のSELECTを基点にして２番目のSELECTを探索する命令である。そのため、非互換情報１６２の第７命令から第１９命令は１番目の非互換サブ情報に依存しており、第７命令から第１９命令そのものを独立した非互換サブ情報として評価することは難しい。

　そこで、同一性判定部１２６は、境界後において以前の命令に依存する命令列を、以前の命令に依存しないアンカーサーチの命令に置換する。具体的には、同一性判定部１２６は、境界直後にPOP命令が存在する場合、POP命令からキーワードを指定したFETCH命令またはSEARCH命令までの区間を、当該キーワードを指定したFETCH命令に置換する。

　ここでは、同一性判定部１２６は、非互換情報１６２の第７命令から第１２命令までを削除し、その代わりに、種別が命令語であり値がSELECTであるノードを検索するFETCH命令を追加する。非互換情報１６２の第１３命令から第１９命令はそのまま使用される。これにより、同一性判定部１２６は、８個の命令を含む非互換サブ情報１６５を生成する。

　図２７は、非互換情報の分割例を示す図である。
　非互換情報１６３からは、以下のようにして非互換サブ情報が抽出される。同一性判定部１２６は、非互換情報１６３に含まれる１４個の命令を、命令属性およびGET PRM命令に応じて、４個の命令群とJOINT命令に分割する。

　同一性判定部１２６は、GET PRM命令をJOINT命令として分離する。また、同一性判定部１２６は、連続する特定命令である第１命令から第５命令を命令群＃１として抽出し、連続する書換命令である第７命令から第８命令を命令群＃２として抽出する。また、同一性判定部１２６は、連続する特定命令である第９命令から第１３命令を命令群＃３として抽出し、書換命令である第１４命令を命令群＃４として抽出する。

　同一性判定部１２６は、JOINT命令の位置と各命令群の命令属性とに基づいて、再利用可能な命令群の組み合わせを決定する。ここでは、同一性判定部１２６は、命令群＃１を１つの非互換サブ情報として採用する。この非互換サブ情報は、ASセクション配下の定義句を検索するものである。また、同一性判定部１２６は、命令群＃１，＃２の組み合わせを１つの非互換サブ情報として採用する。この非互換サブ情報は、ASセクション配下の定義句を検索して書き換えるものである。

　また、同一性判定部１２６は、命令群＃１とJOINT命令と命令群＃３の組み合わせを１つの非互換サブ情報として採用する。この非互換サブ情報は、ASセクション配下の定義句を検索し、その定義句で定義された変数の参照を更に検索するものである。また、同一性判定部１２６は、命令群＃１とJOINT命令と命令群＃２～＃４の組み合わせを１つの非互換サブ情報として採用する。この非互換サブ情報は、非互換情報１６３そのものである。このように、同一性判定部１２６は、GET PRM命令が含まれる非互換情報からは、実質的に意味のある命令群の組み合わせを非互換サブ情報として抽出する。

　次に、情報処理装置１００の処理手順について説明する。
　図２８は、非互換情報生成の手順例を示すフローチャートである。
　（Ｓ１００）エディタ１２３は、ソースコードを構文解析して構文ツリーを生成する。

　（Ｓ１０１）エディタ１２３は、エディタ画面上のユーザ操作を受け付ける。
　（Ｓ１０２）エディタ１２３は、ユーザ操作が、以前に選択されたノードの再選択であるか判断する。ユーザ操作が以前の選択ノードの再選択である場合はステップＳ１０３に処理が進み、それ以外の場合はステップＳ１０４に処理が進む。

　（Ｓ１０３）エディタ１２３は、POP命令を生成して非互換情報に追加する。このPOP命令の縦位置はなし、横位置はなし、探索属性はなし、キーワードは以前のノード選択の命令番号、アクションはなしである。そして、ステップＳ１０１に処理が戻る。

　（Ｓ１０４）エディタ１２３は、ユーザ操作が、ノードを削除するDELETE操作であるか判断する。ユーザ操作がDELETE操作である場合はステップＳ１０５に処理が進み、それ以外の場合はステップＳ１０６に処理が進む。

　（Ｓ１０５）エディタ１２３は、DELETE命令を生成して非互換情報に追加する。このDELETE命令の縦位置は-*、横位置は*、探索属性はなし、キーワードはなし、アクションはなしである。そして、ステップＳ１０１に処理が戻る。

　（Ｓ１０６）エディタ１２３は、ユーザ操作が、CREATE情報番号を指定したCREATE操作であるか判断する。ユーザ操作がCREATE操作である場合はステップＳ１０７に処理が進み、それ以外の場合はステップＳ１０８に処理が進む。

　（Ｓ１０７）エディタ１２３は、CREATE命令を生成して非互換情報に追加する。このCREATE命令の縦位置は指定位置、横位置は指定位置、探索属性はなし、キーワードはなし、アクションはCREATE情報番号である。そして、ステップＳ１０１に処理が戻る。

　（Ｓ１０８）エディタ１２３は、ユーザ操作が、構文ツリーから最初にノードを選択するものであるか判断する。ユーザ操作が最初のノード選択である場合はステップＳ１０９に処理が進み、それ以外の場合はステップＳ１１０に処理が進む。

　（Ｓ１０９）エディタ１２３は、選択ノードのキーワードを取得し、取得したキーワードを検索するアンカーサーチを示すFETCH命令を生成して非互換情報に追加する。このFETCH命令の縦位置は*、横位置は*、探索属性は選択ノードの属性、キーワードは選択ノードのキーワード、アクションはなしである。そして、ステップＳ１０１に処理が戻る。

　（Ｓ１１０）エディタ１２３は、ユーザ操作が、非互換情報の作成を終了する終了操作であるか判断する。ユーザ操作が終了操作である場合はステップＳ１３１に処理が進み、それ以外の場合はステップＳ１１１に処理が進む。

　図２９は、非互換情報生成の手順例を示すフローチャート（続き１）である。
　（Ｓ１１１）エディタ１２３は、以前のユーザ操作によって選択されたノードが存在するか判断する。前回の選択ノードが存在する場合はステップＳ１１２に処理が進み、それ以外の場合はステップＳ１１４に処理が進む。

　（Ｓ１１２）エディタ１２３は、前回の選択ノードの構文ツリー上の横位置と、今回の選択ノードの構文ツリー上の横位置とを比較する。
　（Ｓ１１３）エディタ１２３は、前回の横位置と今回の横位置とが同じ場合、横方向の探索範囲（探索の横位置）を0に設定する。エディタ１２３は、今回の横位置が前回の横位置より大きい場合、探索の横位置を［前回位置：今回位置］に設定する。エディタ１２３は、前回の横位置が今回の横位置より大きい場合、探索の横位置を［今回位置：前回位置］に設定する。そして、ステップＳ１１５に処理が進む。

　（Ｓ１１４）エディタ１２３は、探索の横位置を*に設定する。
　（Ｓ１１５）エディタ１２３は、非互換情報に含まれる生成済みの既存命令を、先頭から優先的に１つ選択する。エディタ１２３は、選択した既存命令がFETCH命令であり、かつ、FETCH命令の探索の横位置が今回の選択ノードの横位置を含むか判断する。選択した既存命令が上記条件を満たすFETCH命令である場合はステップＳ１１６に処理が進み、選択した既存命令がそれ以外の場合はステップＳ１１８に処理が進む。

　（Ｓ１１６）エディタ１２３は、選択した既存命令を非互換情報から削除する。また、エディタ１２３は、選択した既存命令から連続する既存命令であって、選択した既存命令と同じ探索の横位置をもつFETCH命令も非互換情報から削除する。

　（Ｓ１１７）エディタ１２３は、今回の選択ノードの横位置を基準にして、削除された既存命令の探索範囲を二分割する。エディタ１２３は、削除された既存命令に代えて、分割された探索範囲をもつ新たなFETCH命令を生成して非互換情報に追加する。

　（Ｓ１１８）エディタ１２３は、ステップＳ１１５において、非互換情報に含まれる全ての既存命令を選択したか判断する。全ての既存命令を選択した場合はステップＳ１１９に処理が進み、未選択の既存命令がある場合はステップＳ１１５に処理が戻る。

　図３０は、非互換情報生成の手順例を示すフローチャート（続き２）である。
　（Ｓ１１９）エディタ１２３は、ユーザ操作が、パラメータケースからのキーワードの読み出しを含むか判断する。ユーザ操作がキーワードの読み出しを含む場合はステップＳ１２０に処理が進み、それ以外の場合はステップＳ１２１に処理が進む。

　（Ｓ１２０）エディタ１２３は、SEARCH命令を生成して非互換情報に追加する。このSEARCH命令の縦位置は-1、横位置は*、探索属性は今回の選択ノードの属性、キーワードはSET PRM、アクションはなしである。

　（Ｓ１２１）エディタ１２３は、ユーザ操作が、分類が語である語ノードの選択であるか判断する。ユーザ操作が語ノードの選択である場合はステップＳ１２２に処理が進み、それ以外の場合はステップＳ１２７に処理が進む。

　（Ｓ１２２）エディタ１２３は、ユーザ操作が、パラメータケースへのキーワードのドロップを含むか判断する。ユーザ操作がキーワードのドロップを含む場合はステップＳ１２３に処理が進み、それ以外の場合はステップＳ１２４に処理が進む。

　（Ｓ１２３）エディタ１２３は、キーワードを保存するGET PRM命令を生成して非互換情報に追加する。このGET PRM命令の縦位置は指定位置、横位置は0、探索属性は語、キーワードはなし、トランザクションはなしである。

　（Ｓ１２４）エディタ１２３は、ユーザ操作によって、現ノードの親ノードについて付帯条件が指定されたか判断する。付帯条件は、例えば、エディタ画面の条件リストから選択される。付帯条件が指定された場合はステップＳ１２５に処理が進み、付帯条件が指定されていない場合はステップＳ１２６に処理が進む。

　（Ｓ１２５）エディタ１２３は、付帯条件を満たすノードを検索するSEARCH命令を生成して非互換情報に追加する。このSEARCH命令の縦位置は+1、横位置は*、探索属性は付帯条件で指定された属性、キーワードは付帯条件で指定されたキーワード、アクションは付帯条件で指定されたアクションである。ただし、付帯条件が、該当するノードが存在しないという否定表現である場合、SEARCH命令の前に否定命令!が付される。

　（Ｓ１２６）エディタ１２３は、SEARCH命令を生成して非互換情報に追加する。このSEARCH命令の縦位置は-1、横位置は*、探索属性は選択ノードの属性、キーワードは選択ノードの値、アクションはなしである。

　（Ｓ１２７）エディタ１２３は、構文ツリーにおいて前回の選択ノードと今回の選択ノードのうち高い方（ルートノードに近い方）の高さを基準高として特定する。
　（Ｓ１２８）エディタ１２３は、前回の選択ノードと今回の選択ノードのうち低い方の選択ノードから基準高まで親を辿るFETCH命令を生成する。低い方が前回の選択ノードである場合、FETCH命令の縦位置は+1、横位置は*、探索属性はなし、キーワードはなし、アクションはなしである。低い方が今回の選択ノードである場合、FETCH命令の縦位置は-1、横位置は*、探索属性は親ノードの属性、キーワードはなし、アクションはRETである。

　（Ｓ１２９）エディタ１２３は、ステップＳ１２８で高さが揃った２つのノードが共通ノードに到達するまで、更に親を辿るFETCH命令を生成する。前回の選択ノード側のFETCH命令の縦位置は+1、横位置は+、探索属性はなし、キーワードはなし、アクションはなしである。今回の選択ノード側のFETCH命令の縦位置は-1、横位置は*、探索属性は親ノードの属性、キーワードはなし、アクションはRETである。

　（Ｓ１３０）エディタ１２３は、ステップＳ１２８，Ｓ１２９で生成されたFETCH命令のうち今回の選択ノードに関するFETCH命令を逆順に変更する。エディタ１２３は、順序変更後のFETCH命令を非互換情報に追加する。そして、ステップＳ１０１に処理が戻る。

　図３１は、非互換情報生成の手順例を示すフローチャート（続き３）である。
　（Ｓ１３１）エディタ１２３は、非互換情報に含まれる生成済みの既存命令を、先頭から優先的に１つ選択する。エディタ１２３は、選択した既存命令がFETCH命令であるか判断する。選択した既存命令がFETCH命令である場合はステップＳ１３２に処理が進み、選択した既存命令がFETCH命令でない場合はステップＳ１３８に処理が進む。

　（Ｓ１３２）エディタ１２３は、今回選択したFETCH命令の命令番号を「終了番号」に設定し、前回の終了番号を「開始番号」に設定する。
　（Ｓ１３３）エディタ１２３は、選択したFETCH命令が非互換情報の中の最初のFETCH命令であるか判断する。最初のFETCH命令である場合はステップＳ１３８に処理が進み、２番目以降のFETCH命令である場合はステップＳ１３４に処理が進む。

　（Ｓ１３４）エディタ１２３は、選択したFETCH命令の縦位置が+1であるか判断する。選択したFETCH命令の縦位置が+1である場合はステップＳ１３５に処理が進み、それ以外の場合はステップＳ１３６に処理が進む。

　（Ｓ１３５）エディタ１２３は、選択したFETCH命令の横位置を-［開始番号］に変更する。そして、ステップＳ１３８に処理が進む。
　（Ｓ１３６）エディタ１２３は、選択したFETCH命令の縦位置が-1であるか判断する。選択したFETCH命令の縦位置が-1である場合はステップＳ１３７に処理が進み、それ以外の場合はステップＳ１３８に処理が進む。

　（Ｓ１３７）エディタ１２３は、選択したFETCH命令の横位置を+［開始番号：終了番号］に変更する。
　（Ｓ１３８）エディタ１２３は、ステップＳ１３１において、非互換情報に含まれる全ての既存命令を選択したか判断する。全ての既存命令を選択した場合は非互換情報生成が終了し、未選択の既存命令がある場合はステップＳ１３１に処理が戻る。

　図３２は、非互換情報テストの手順例を示すフローチャートである。
　（Ｓ１４０）テスト部１２５は、取得した非互換情報が、エディタ１２３を用いて作成されたものであるか判断する。エディタ１２３で作成された非互換情報である場合はステップＳ１４５に処理が進み、それ以外の場合はステップＳ１４１に処理が進む。

　（Ｓ１４１）テスト部１２５は、非互換情報と併せて取得したソースコードを構文解析して構文ツリーを生成する。ソースコードは、非互換情報の作成者から提供される。
　（Ｓ１４２）テスト部１２５は、ステップＳ１４１で生成した構文ツリーに対して、非互換情報に含まれる命令を順に実行する。このとき、テスト部１２５は、命令の処理対象となったノードに処理済みフラグを付与して、処理済みノードを特定しておく。

　（Ｓ１４３）テスト部１２５は、非互換情報に含まれる全ての命令を実行し終えるまでに、処理済みノードの再選択が発生したか、すなわち、命令の処理対象のノードが重複したか判断する。ノードの再選択が発生した場合はステップＳ１４４に処理が進み、ノードの再選択が発生しなかった場合はステップＳ１４５に処理が進む。

　（Ｓ１４４）テスト部１２５は、ノードの再選択が発生した命令を示す重複エラーを出力する。例えば、テスト部１２５は、重複エラーを端末装置３１に送信する。
　（Ｓ１４５）テスト部１２５は、非互換情報と併せて取得したソースコードに非互換情報を適用して、変換後ソースコードを生成する。

　（Ｓ１４６）テスト部１２５は、ステップＳ１４５で生成された変換後ソースコードをテストデータベースで実行し、テストデータベースから実行結果を抽出する。例えば、テスト部１２５は、変換後ソースコードに含まれるＳＱＬ文をテストデータベースに送信する。また、例えば、テスト部１２５は、変換後ソースコードに含まれるＳＱＬプロシジャコードをテストデータベースで実行する。

　（Ｓ１４７）テスト部１２５は、非互換情報およびソースコードと併せて、正解の実行結果が記憶されているか判断する。正解の実行結果が記憶されている場合はステップＳ１４８に処理が進み、記憶されていない場合はステップＳ１５０に処理が進む。

　（Ｓ１４８）テスト部１２５は、ステップＳ１４６のテストの実行結果と正解の実行結果とが一致するか判断する。テストの実行結果と正解の実行結果とが一致する場合、テスト部１２５は、非互換情報が正常に動作していると判定して非互換情報テストを終了する。一致しない場合、ステップＳ１４９に処理が進む。

　（Ｓ１４９）テスト部１２５は、非互換情報が正常に動作しなかったことを示すテストエラーを出力する。例えば、テスト部１２５は、テストエラーを端末装置３１に送信する。そして、非互換情報テストが終了する。

　（Ｓ１５０）テスト部１２５は、ステップＳ１４６のテストの実行結果を出力して、テストの実行結果が正しいか否かの確認を依頼する。例えば、テスト部１２５は、テストの実行結果を端末装置３１に送信する。

　図３３は、非互換情報同一性判定の手順例を示すフローチャートである。
　（Ｓ１６０）同一性判定部１２６は、非互換情報に含まれる命令を先頭から優先的に１つ選択する。同一性判定部１２６は、選択した命令が命令属性の変化点であるか判断する。選択した命令が変化点である場合には、選択した命令が非互換情報の先頭の命令である場合と、１つ前の命令が特定命令であり今回の命令が書換命令である場合と、１つ前の命令が書換命令であり今回の命令が特定命令である場合とが含まれる。変化点である場合はステップＳ１６１に処理が進み、変化点でない場合はステップＳ１６２に処理が進む。

　（Ｓ１６１）同一性判定部１２６は、新たな命令群を定義する。別の命令群が定義されるまで、選択される命令はこの命令群に振り分けられる。
　（Ｓ１６２）同一性判定部１２６は、選択した命令がGET PRM命令であるか判断する。選択した命令がGET PRM命令である場合はステップＳ１６３に処理が進み、選択した命令がGET PRM命令でない場合はステップＳ１６４に処理が進む。

　（Ｓ１６３）同一性判定部１２６は、命令をJOINT命令として命令群から分離する。
　（Ｓ１６４）同一性判定部１２６は、ステップＳ１６０において、非互換情報に含まれる全ての命令を選択したか判断する。全ての命令を選択した場合はステップＳ１６５に処理が進み、未選択の命令がある場合はステップＳ１６０に処理が戻る。

　（Ｓ１６５）同一性判定部１２６は、ステップＳ１６０～Ｓ１６４によって生成された命令群のうち何れか１つの命令群を選択する。同一性判定部１２６は、選択した命令群の先頭が特定命令かつPOP命令であるか判断する。先頭が特定命令かつPOP命令である場合はステップＳ１６６に処理が進み、それ以外の場合はステップＳ１６８に処理が進む。

　（Ｓ１６６）同一性判定部１２６は、選択した命令群の先頭のPOP命令から、キーワード付きのSEARCH命令またはキーワード付きのFETCH命令の直前の命令までを削除する。
　（Ｓ１６７）同一性判定部１２６は、削除されずに残った命令の先頭がSEARCH命令である場合、SEARCH命令をFETCH命令に変換する。

　（Ｓ１６８）同一性判定部１２６は、ステップＳ１６５において、生成された全ての命令群を選択したか判断する。全ての命令群を選択した場合はステップＳ１６９に処理が進み、未選択の命令群がある場合はステップＳ１６５に処理が戻る。

　（Ｓ１６９）同一性判定部１２６は、非互換情報に含まれるJOINT命令を分割点として、連続する特定命令群と書換命令群とを含むリストを生成する。例えば、非互換情報から、特定命令群＃１、書換命令群＃１、JOINT命令、特定命令群＃２および書換命令群＃２が生成されたとする。この場合、特定命令群＃１＋書換命令群＃１のリストと、特定命令群＃２＋書換命令群＃２のリストとが生成される。

　（Ｓ１７０）同一性判定部１２６は、ステップＳ１６９で生成された各リストから先頭の特定命令群を抽出して、別のリストとして生成する。例えば、特定命令群＃１＋書換命令群＃１のリストから、特定命令群＃１のみのリストが生成され、特定命令群＃２＋書換命令群＃２のリストから、特定命令群＃２のみのリストが生成される。

　（Ｓ１７１）同一性判定部１２６は、ステップＳ１６９，Ｓ１７０で生成されたリストにJOINT命令を付加して、別のリストを生成する。別のリストの生成には、JOINT命令を用いて２つのリストを結合することが含まれる。ただし、別のリストの生成は、命令の出現順序が非互換情報と整合する範囲で行われる。例えば、特定命令群＃１＋JOINT命令のリストと、特定命令群＃１＋書換命令群＃１＋JOINT命令のリストとが生成される。また、特定命令群＃１＋JOINT命令＋特定命令群＃２のリストと、特定命令群＃１＋書換命令群＃１＋JOINT命令＋特定命令群＃２＋書換命令群＃２のリストとが生成される。ステップＳ１６９～Ｓ１７１で生成された各リストが、非互換サブ情報とみなされる。

　図３４は、非互換情報同一性判定の手順例を示すフローチャート（続き１）である。
　（Ｓ１７２）同一性判定部１２６は、非互換サブ情報を１つ選択する。同一性判定部１２６は、選択した非互換サブ情報から、探索属性とキーワードのペアを抽出する。

　（Ｓ１７３）同一性判定部１２６は、探索属性＋キーワード毎に出現回数をカウントし、出現回数または出現確率を列挙したＢＯＷベクトルを生成する。
　（Ｓ１７４）同一性判定部１２６は、登録済みの非互換情報または非互換サブ情報（登録済み情報）との間でＢＯＷベクトルの類似度（類似度＃１）を算出する。登録済み情報のＢＯＷベクトルは、非互換情報記憶部１２２に保存されていてもよいし、ここで生成されてもよい。類似度＃１は、例えば、コサイン類似度である。

　（Ｓ１７５）同一性判定部１２６は、ステップＳ１７４で算出された類似度＃１が閾値＃１より大きいか判断する。類似度＃１が閾値＃１より大きい場合はステップＳ１８３に処理が進み、類似度＃１が閾値＃１以下の場合はステップＳ１８１に処理が進む。なお、登録済み情報が複数ある場合、少なくとも１つの登録済み情報の類似度＃１が閾値＃１より大きい場合、ステップＳ１８３に処理が進む。

　（Ｓ１７６）同一性判定部１２６は、登録済み情報との間で、後述するステップＳ１８３～Ｓ１９４によって生成されるキーワードリストの類似度（類似度＃２）を算出する。登録済み情報のキーワードリストは、非互換情報記憶部１２２に保存されていてもよいし、ここで生成されてもよい。登録済み情報が複数ある場合、類似度＃２を算出する登録済み情報は、類似度＃１が閾値＃１より大きいものに限定される。

　（Ｓ１７７）同一性判定部１２６は、ステップＳ１７６で算出された類似度＃２が閾値＃２より大きいか判断する。類似度＃２が閾値＃２より大きい場合はステップＳ１７８に処理が進み、類似度＃２が閾値＃２以下の場合はステップＳ１８１に処理が進む。なお、登録済み情報が複数ある場合、少なくとも１つの登録済み情報の類似度＃２が閾値＃２より大きい場合、ステップＳ１７８に処理が進む。

　（Ｓ１７８）同一性判定部１２６は、ＢＯＷベクトルが同一でありかつキーワードリストが同一の登録済み情報が存在するか判断する。該当する登録済み情報が存在する場合はステップＳ１７９に処理が進み、存在しない場合はステップＳ１８０に処理が進む。

　（Ｓ１７９）同一性判定部１２６は、選択した非互換サブ情報が新規情報でなく登録不可であると判定する。そして、ステップＳ１８２に処理が進む。
　（Ｓ１８０）同一性判定部１２６は、類似する登録済み情報が存在することを示す類似警告を出力する。類似する登録済み情報は、類似度＃２が閾値＃２より大きい登録済み情報である。例えば、同一性判定部１２６は、端末装置３１，３２に類似警告を送信する。そして、ステップＳ１８２に処理が進む。

　（Ｓ１８１）同一性判定部１２６は、選択した非互換サブ情報が新規情報であり、自動テストの成功と承認者による承認とを条件として登録可であると判定する。
　（Ｓ１８２）同一性判定部１２６は、ステップＳ１７２において、全ての非互換サブ情報を選択したか判断する。全ての非互換サブ情報を選択した場合は非互換情報同一性判定が終了し、未選択の非互換サブ情報がある場合はステップＳ１７２に処理が戻る。なお、非互換情報に含まれる全ての非互換サブ情報が新規情報と判定された場合、非互換情報の登録が許可されると共に、各非互換サブ情報の登録が許可されてもよい。また、非互換情報に含まれる一部の非互換サブ情報のみが新規情報と判定された場合、新規情報と判定された非互換サブ情報の登録が許可されてもよい。

　図３５は、非互換情報同一性判定の手順例を示すフローチャート（続き２）である。
　（Ｓ１８３）同一性判定部１２６は、非互換サブ情報に含まれる命令を先頭から優先的に１つ選択する。同一性判定部１２６は、選択した命令がFETCH命令またはSEARCH命令であるか判断する。選択した命令がFETCH命令またはSEARCH命令である場合はステップＳ１８４に処理が進み、それ以外の場合はステップＳ１９２に処理が進む。

　（Ｓ１８４）同一性判定部１２６は、選択した命令が非互換サブ情報に含まれる最初のFETCH命令であるか判断する。最初のFETCH命令である場合はステップＳ１８５に処理が進み、最初のFETCHでない場合はステップＳ１８６に処理が進む。

　（Ｓ１８５）同一性判定部１２６は、キーワードリストにおいて次のノードを挿入する次位置を初期位置に設定する。そして、ステップＳ１９２に処理が進む。
　（Ｓ１８６）同一性判定部１２６は、選択した命令が、縦位置+かつキーワードありの命令か、または、縦位置-かつ横位置-の命令か判断する。上記条件を満たす命令の場合はステップＳ１８７に処理が進み、それ以外の場合はステップＳ１８８に処理が進む。

　（Ｓ１８７）同一性判定部１２６は、キーワードリストにおける次位置を現ノードの左に設定する。現ノードは現在着目している既存ノードであり、通常、キーワードリストに最後に追加されたノードである。そして、ステップＳ１９２に処理が進む。

　（Ｓ１８８）同一性判定部１２６は、選択した命令が、縦位置-かつ横位置+の命令か判断する。上記条件を満たす命令の場合はステップＳ１８９に処理が進み、それ以外の場合はステップＳ１９０に処理が進む。

　（Ｓ１８９）同一性判定部１２６は、キーワードリストにおける次位置を現ノードの右に設定する。そして、ステップＳ１９２に処理が進む。
　（Ｓ１９０）同一性判定部１２６は、選択した命令が、縦位置-かつ横位置が範囲指定の命令か判断する。上記条件を満たす命令の場合はステップＳ１９１に処理が進み、それ以外の場合はステップＳ１９２に処理が進む。

　（Ｓ１９１）同一性判定部１２６は、キーワードリストにおける次位置を、選択した命令の横位置の範囲内にある既存ノードの右に設定する。
　（Ｓ１９２）同一性判定部１２６は、選択した命令がキーワードを含むか判断する。選択した命令がキーワードを含む場合はステップＳ１９３に処理が進み、選択した命令がキーワードを含まない場合はステップＳ１９４に処理が進む。

　（Ｓ１９３）同一性判定部１２６は、選択した命令の命令番号とキーワードとを含むノードを生成し、ステップＳ１８３～Ｓ１９１で設定された次位置に挿入する。
　（Ｓ１９４）同一性判定部１２６は、ステップＳ１８３において、非互換サブ情報に含まれる全ての命令を選択したか判断する。全ての命令を選択した場合はステップＳ１７６に処理が進み、未選択の命令がある場合はステップＳ１８３に処理が戻る。

　以上説明したように、第２の実施の形態の情報処理システムは、データベース製品を使用するソースコードに対する非互換吸収の手順を規定した非互換情報を、知識情報として蓄積する。蓄積された非互換情報を用いることで、情報処理システムは、ソースコードの非互換吸収の一部または全部を自動化でき、非互換吸収を効率化できる。

　また、情報処理システムは、非互換情報を作成する作成者に対し、非互換情報の作成を支援するエディタを提供する。エディタは、ソースコードのサンプルの構文ツリーを表示し、構文ツリーに対するユーザ操作に基づいて非互換情報を自動的に生成する。よって、再利用可能な非互換情報を作成する負担が軽減される。

　また、情報処理システムは、知識データベースに非互換情報を登録する前に、その非互換情報が正常に動作することを確認する自動テストを実行する。よって、蓄積される非互換情報の品質が向上する。また、情報処理システムは、知識データベースに非互換情報を登録する前に、同一の非互換箇所を検出することができる実質的に同一の非互換情報が既に存在するか判定する。よって、実質的に同一の非互換情報が知識データベースに重複して登録されることが抑制され、非互換情報の検索や管理が効率化される。また、各非互換情報の使用実績が適切にカウントされ、各非互換情報の評価が適正化される。

　また、情報処理システムは、探索属性とキーワードのペアの出現頻度を示すＢＯＷベクトルを用いて、類似する既存の非互換情報を絞り込み、キーワードの出現順序を示すキーワードリストを用いて、実質同一の既存の非互換情報が存在するか最終的に判定する。よって、キーワードの探索順序が異なるために２つの非互換情報の記載が異なる場合であっても、同一の非互換箇所を検出することができる実質的な同一性が判定される。

　また、キーワードの出現順序が考慮されるため、判定精度が向上し、異なる非互換箇所を検出する非互換情報が誤って実質同一と判定されるリスクが低下する。また、情報処理システムは、キーワードの出現順序を考慮しないＢＯＷベクトルによって既存の非互換情報を絞り込んだ後に、キーワードの出現順序によって実質的な同一性を評価する。よって、同一性判定が効率的に実行される。

　上記については単に本発明の原理を示すものである。更に、多数の変形や変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応する全ての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。

　１０　情報処理装置
　１１　記憶部
　１２　処理部
　１３，１４　非互換情報
　１５，１６　頻度情報
　１７，１８　順序情報

Claims

　第１のソフトウェアを使用するソースコードの中から第２のソフトウェアと非互換である記述を探索するための情報であって、２以上の言語要素がもつキーワードと前記２以上の言語要素の位置関係とに対する条件を示す第１の非互換情報を取得し、
　前記第１の非互換情報から２以上のキーワードを抽出し、同一のキーワードの出現頻度に基づく第１の頻度情報を生成し、前記位置関係の条件から推定される前記２以上のキーワードの出現順序を示す第１の順序情報を生成し、
　前記第１の頻度情報と第２の非互換情報に対応する第２の頻度情報との間の第１の類似度と、前記第１の順序情報と前記第２の非互換情報に対応する第２の順序情報との間の第２の類似度とに基づいて、前記第１の非互換情報および前記第２の非互換情報の同一性を判定する、
　処理をコンピュータに実行させる情報処理プログラム。
　前記第１の非互換情報は、前記２以上の言語要素がもつ属性に対する条件を更に示し、
　前記第１の頻度情報の生成では、前記キーワードと前記属性とのペアを２以上抽出し、同一のペアの出現頻度を示すように前記第１の頻度情報を生成する、
　請求項１記載の情報処理プログラム。
　前記第１の非互換情報は、構文ツリーにおいて第１の言語要素から第２の言語要素を探索する際の探索範囲を、前記位置関係に対する条件として規定し、
　前記第１の順序情報の生成では、前記探索範囲に基づいて前記出現順序を推定する、
　請求項１記載の情報処理プログラム。
　前記同一性の判定では、前記第１の類似度と第１の閾値とを比較し、前記第１の類似度が前記第１の閾値を超える場合、前記第２の類似度と第２の閾値とを比較する、
　請求項１記載の情報処理プログラム。
　前記第１の非互換情報が、第１の言語要素から第２の言語要素を探索する第１の探索と、前記第１の言語要素または前記第２の言語要素から第３の言語要素を探索する第２の探索とを規定している場合、前記第１の非互換情報を、前記第１の探索を示す第１の非互換サブ情報と、前記第２の探索を示す第２の非互換サブ情報とに分割する、
　処理を前記コンピュータに更に実行させ、
　前記第１の頻度情報の生成、前記第１の順序情報の生成および前記同一性の判定は、前記第１の非互換サブ情報および前記第２の非互換サブ情報それぞれに対して実行される、
　請求項１記載の情報処理プログラム。
　第１のソフトウェアを使用するソースコードの中から第２のソフトウェアと非互換である記述を探索するための情報であって、２以上の言語要素がもつキーワードと前記２以上の言語要素の位置関係とに対する条件を示す第１の非互換情報を取得し、
　前記第１の非互換情報から２以上のキーワードを抽出し、同一のキーワードの出現頻度に基づく第１の頻度情報を生成し、前記位置関係の条件から推定される前記２以上のキーワードの出現順序を示す第１の順序情報を生成し、
　前記第１の頻度情報と第２の非互換情報に対応する第２の頻度情報との間の第１の類似度と、前記第１の順序情報と前記第２の非互換情報に対応する第２の順序情報との間の第２の類似度とに基づいて、前記第１の非互換情報および前記第２の非互換情報の同一性を判定する、
　処理をコンピュータが実行する情報処理方法。
　第１のソフトウェアを使用するソースコードの中から第２のソフトウェアと非互換である記述を探索するための情報であって、２以上の言語要素がもつキーワードと前記２以上の言語要素の位置関係とに対する条件を示す第１の非互換情報を記憶する記憶部と、
　前記第１の非互換情報から２以上のキーワードを抽出し、同一のキーワードの出現頻度に基づく第１の頻度情報を生成し、前記位置関係の条件から推定される前記２以上のキーワードの出現順序を示す第１の順序情報を生成し、前記第１の頻度情報と第２の非互換情報に対応する第２の頻度情報との間の第１の類似度と、前記第１の順序情報と前記第２の非互換情報に対応する第２の順序情報との間の第２の類似度とに基づいて、前記第１の非互換情報および前記第２の非互換情報の同一性を判定する処理部と、
　を有する情報処理装置。