JP2003228499A

JP2003228499A - 構成要素分類方法、実装多重度評価方法、実装多重コード抽出方法、同時変更対象箇所抽出方法、クラス階層再構成方法、およびプログラム

Info

Publication number: JP2003228499A
Application number: JP2002027172A
Authority: JP
Inventors: Takeo Imai; 健男今井
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2002-02-04
Filing date: 2002-02-04
Publication date: 2003-08-15
Also published as: US20070209033A1; US20030149968A1; US7886274B2; US7228530B2

Abstract

(57)【要約】【課題】プログラムを構成する各構成要素間の比較指
標値を用いて、プログラム中の実装多重度を定量的に容
易に評価可能とし、実装多重なコードを効率的かつ確実
に抽出可能とし、実装多重度の定量的な評価に基づいて
プログラムにおける同時変更が必要な箇所を効率的かつ
確実に抽出可能とする。【解決手段】ツリーＴが入力されると（Ｓ５０１）、
ツリーＴによって表現されるプログラムＰに対する実装
多重度ｍ(Ｐ)の初期値を０とし、節ＮとしてツリーＴの
頂点を選択する（Ｓ５０２）。選択した節Ｎについて、
その節が持つ「類似度」と「子の数」という属性情報を
取得して所定の演算を行い、得られる値αを実装多重度
ｍ(Ｐ)に加える（Ｓ５０３）。所定の演算を、ツリーＴ
中の全ての節に対して行う（Ｓ５０４のＹＥＳ、Ｓ５０
５）ことにより、全ての節に対する値αの総和を含む実
装多重度ｍ(Ｐ)が得られる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、プログラム中に同
様の機能が分散して複数実装されている場合に、その機
能がどれだけ重複しているかを示す実装多重度を定量的
に評価する実装多重度評価方法、および重複しているコ
ードを抽出する実装多重コード抽出方法に関するもので
ある。

【０００２】

【従来の技術】ソフトウェアを開発する際、類似した機
能を持つ部分がプログラムの設計全体に分散して発見さ
れることがある。このような状況においても、ソフトウ
ェア開発者が、そのような類似機能の分散に気づかずに
そのままプログラミングを進めたり、あるいは気づいた
としても、時間的なコスト等を節約するるために、以前
実装したプログラムコードを複製したりすることによ
り、結果的に同様の機能を果たすコードが、プログラム
中に分散して多数実装されてしまうことがある。

【０００３】しかしながら、ある機能を果たすコードに
対して、同様の機能を果たしながら他の箇所に重複して
実装されているコード（実装多重なコード）が存在する
場合に、この重複したコードの果たす機能を変更しよう
とすると、実装多重なコードを全て修正しなければなら
ない可能性が生じる。同時に修正すべきコード部分が多
数存在すると、修正すべき箇所の発見にかかるコストが
増大する上、発見漏れを発生する可能性が高まる。発見
漏れが発生すると、発見できなかった箇所がソフトウェ
ア開発者の意図に合わない挙動を起こし、その結果、そ
の不具合を解消するために新たな変更を行う手間が必要
となり、さらにコストが増大する。

【０００４】このように、実装多重なコードの存在は、
ソフトウェアの変更に関連するソフトウェア保守のコス
トに大きく影響する。しかも、あるコード部分に対して
実装多重なコードの集合を取った場合、その集合の大き
さが大きければ大きいほど、保守のコストに及ぼす影響
は大きい。

【０００５】従来、実装多重なコードを発見するための
技術としては、プログラムあるいは２つのコード部分が
どれだけ類似しているかを比較指標（類似度）を用いて
評価する技術（特開平８−２４１１９３号公報等）や、
予めしきい値を設定しておき、類似度がしきい値以上で
あるものを実装多重なコードと判定する技術（特開２０
０１−１２５７８３号公報等）が存在している。

【０００６】一方、オブジェクト指向言語によってソフ
トウェアの設計を行う際に、複数のクラス間で同様の機
能を持つ場合には、「汎化」という作業を行って新たな
クラスを作成し、そこに共通機能を括り出している。こ
の汎化作業を行うことにより、（１）共通機能を修正す
る際に、共通化クラスの修正だけで済み、修正にかかる
コストを削減できる、（２）同様に共通機能を持った派
生クラスを新たに作成する際に作業が簡便になる、等の
メリットが得られる。この場合、元来のクラスは共通化
したクラスから派生したクラスと定義する。これらの作
業により、クラス定義の一部は階層的な構成をなす。

【０００７】

【発明が解決しようとする課題】しかしながら、上記の
ような従来技術を用いた場合、実装多重なコードを発見
できたとしても、実装多重なコードに関する定量的な保
守性評価を実現することはできないため、定量的な評価
に基づいてプログラムの変更部分を効率的に選択するこ
とはできない。この点について以下に説明する。

【０００８】まず、実装多重なコードを発見するために
類似度を用いた前記手法は、１つのコードに類似する実
装多重なコードを個別に発見することはできても、多数
の実装多重なコードが存在する場合に、その実装多重度
を定量的に評価できるものではないため、実装多重なコ
ードの存在に起因する保守コストの大きさを定量的に評
価できるものではない。

【０００９】また、しきい値を用いた前記手法の場合、
得られる結果がしきい値の設定の仕方に大きく依存する
ことになる上、所定のしきい値に対して得られる結果は
一律であり、ある特定の変更を加える際に特化した実装
多重コードを検出できないという問題がある。

【００１０】一方、統計学的手法として、要素間の類似
度から、よく似た特徴を持つ要素同士をグループ分けす
る階層的クラスター分析（ＨＣＡ）という手法（特開２
００１−９２８４１号公報等）が存在している。この階
層的クラスター分析手法は、各種のアンケート結果の分
析手法（特開２００１−１８４４０５号公報等）として
広く用いられている他、監視対象の状態データの分析
（特開平０９−０９３６６５号公報等）や、ネットワー
ク上でリンク付けされた多数の電子文書の分類（特開平
１０−０２７１２５号公報等）に応用される等、各種の
分野で幅広く使用されている。

【００１１】しかしながら、この階層的クラスター分析
手法は、対象となる多数のデータを複数のグループに階
層的に分類して各グループの特徴を把握するための手法
であり、その分類結果からさらに、１つの指標値を導き
出して全体の傾向を評価したり、その指標値に大きく寄
与しているグループを特定する等の目的では使用されて
いない。

【００１２】また、オブジェクト指向言語で開発された
プログラムの場合、前述したように、設計段階において
複数のクラス間で共通機能を持つ場合には、汎化の作業
を行って共通化クラスを作成して共通機能を括り出し、
元のクラスを派生クラスと定義している。しかしなが
ら、実際にオブジェクト指向言語によるプログラムの実
装を施した段階で、設計段階では見つからなかった共通
機能が発見されることがある。このような場合に、前述
したようなメリットを得るためには、共通機能に対して
再び汎化の作業を行う必要があり、実装後の作業が増大
してしまう。

【００１３】本発明は、上記した従来の問題点を解消す
るためになされたものであり、その目的は、しきい値等
を使用せずに、プログラムを構成する各構成要素間の比
較指標値を用いて、プログラム中の実装多重度を定量的
に容易に評価可能な実装多重度見積方法、実装多重なコ
ードを効率的かつ確実に抽出可能な実装多重コード抽出
方法、および実装多重度の定量的な評価に基づいてプロ
グラムにおける同時変更が必要な箇所を効率的かつ確実
に抽出可能な同時変更対象箇所抽出方法、を提供するこ
とである。

【００１４】本発明の別の目的は、プログラム中の実装
多重度を定量的に評価可能とするために、プログラムの
構成要素を、実装多重度を反映した理解しやすい構造に
分類可能な構成要素分類方法を提供することである。本
発明のさらに別の目的は、オブジェクト指向言語で記述
されたプログラム中から、実装多重なコードを持つクラ
ス定義群を効率的かつ確実に抽出して、クラス階層を適
切に再構成可能なクラス階層再構成方法を提供すること
である。

【００１５】

【課題を解決するための手段】上記目的を達成するため
に、本発明は、ソースプログラムの構成要素群に対し
て、構成要素間の比較指標値とそれを反映させたツリー
状の階層構造とを用いることにより、しきい値等を使用
せずに、プログラムを構成する各構成要素間の類似度を
用いて、プログラム中の実装多重度を定量的に評価可能
とし、実装多重なコードを効率的に抽出可能とし、さら
に、定量的な評価に基づいてプログラムにおける同時変
更が必要な箇所を効率的に抽出可能としたものである。

【００１６】なお、本発明において重要な用語の定義は
次の通りである。「構成要素」は、ソースプログラムを
処理する場合の処理単位となるような、１行以上の命令
の列を示しており、例えば、プログラム中の関数や手
続、オブジェクト指向言語におけるクラス定義等であ
る。「比較指標値」は、構成要素間の類似度を表現する
値であるが、階層的クラスター分析手法において使用さ
れるような類似度を含まない樹形図においては、樹形図
中の「各節の高さ」により表現できる。

【００１７】請求項１の発明は、コンピュータを利用し
て、ソースプログラムの構成要素を分類する構成要素分
類方法において、構成要素解析ステップ、構成要素比較
ステップ、構成要素分類ステップを含むことを特徴とし
ている。ここで、構成要素解析ステップは、ソースプロ
グラムのソースコードを構成要素に分割して構成要素群
を抽出するステップであり、構成要素比較ステップは、
抽出された構成要素群から各２つの構成要素を比較して
その２構成要素間の比較指標値を求めるステップであ
る。また、構成要素分類ステップは、抽出された構成要
素群と、それに対して得られた各２構成要素間の比較指
標値とに基づいて、その構成要素群を、構成要素間の比
較指標値、各節が持つ子の数、各節が持つ葉の数、とい
う３種類の情報を各節が保持するツリー状の階層構造に
分類するステップである。この方法によれば、プログラ
ムの構成要素を、実装多重度を反映した理解しやすいツ
リー状の階層構造に分類することができるため、プログ
ラム中の実装多重度の定量的な評価の実現に貢献でき
る。

【００１８】請求項２の発明は、請求項１の構成要素分
類方法においてさらに、構成要素比較ステップにおいて
は、抽出された構成要素群に対して得られた各２構成要
素間の比較指標値を段階的にグループ化し、構成要素分
類ステップにおいては、グループ化された比較指標値の
各段階に応じた各階層からなる階層構造に分類する、こ
とを特徴としている。この方法によれば、比較指標値を
グループ化する段階の数に応じて、階層構造の階層の数
を自由に調整できる。特に、グループ化する段階の数を
ある程度制限することにより、類似度の近い構成要素の
集合を大きくまとめることができるため、その集合を容
易に把握可能となり、実装多重度の定量的な評価が容易
になる。

【００１９】請求項３の発明は、コンピュータを利用し
て、ソースプログラム中の実装多重度を定量的に評価す
る実装多重度見積方法において、情報取得・演算ステッ
プと実装多重度評価ステップを含むことを特徴としてい
る。ここで、情報取得・演算ステップは、ソースプログ
ラムの構成要素群を表現するツリー状の階層構造から、
ツリー中の各節について、その節が保持する構成要素間
の比較指標値と、その節が持つ子の数または葉の数、と
いう２種類の情報を取得して所定の演算を行うステップ
である。また、実装多重度評価ステップは、ツリー中の
各節について得られた演算結果の総和から実装多重度を
定量的に評価するステップである。この方法によれば、
比較指標値に関する情報を含むツリー状の階層構造から
ツリー中の各節についての演算を機械的に行い、その演
算結果の総和からプログラム全体の実装多重度を定量的
に容易に評価することができる。

【００２０】請求項４の発明は、請求項３の実装多重度
評価方法において、所定の演算が、子の数マイナス１と
比較指標値との積であることを特徴としている。この方
法によれば、ツリー中の各節の比較指標値をプログラム
全体の実装多重度の評価に等しく反映することができる
ため、実装多重度の正規化が可能となる。

【００２１】請求項５の発明は、請求項３の実装多重度
評価方法において、所定の演算が、子の数のべき乗と比
較指標値との積であることを特徴としている。この方法
によれば、ツリー中の節のうち、特に、子の数が多い節
の比較指標値が大きく反映されることになる。この場
合、１つの節が持つ子の数は、同じ機能を持つ構成要素
の数を示しているため、同じ機能を持つ構成要素が多数
存在するほど、その情報が強く反映されることになる。
したがって、この方法は、請求項１によって得られるよ
うな、比較指標値に関する情報を含むツリー状の積層構
造を使用する場合に最適である。

【００２２】請求項６の発明は、コンピュータを利用し
て、ソースプログラム中の実装多重なコードを抽出する
実装多重コード抽出方法において、節選択ステップと要
素集合出力ステップを含むことを特徴としている。ここ
で、節選択ステップは、ソースプログラムの構成要素群
を表現するツリー状の階層構造と予め設定された構成要
素の集合数に対する基準値とを用いて、ツリーの頂点か
ら葉に向かって、常に、葉の数が最大となる子を選択し
ながら順に節をたどるステップである。また、要素集合
出力ステップは、新たに選択された節の持つ葉の数が前
記基準値より小さくなるか、あるいは子となる節がなく
なった時点で、その時点で選択されている節が持つ葉に
対応する構成要素集合を出力するステップである。この
方法によれば、ツリー構造を利用して、ツリーの頂点か
ら葉に向かって葉の数が最大となる子を選択するという
機械的な作業を繰り返すだけで、プログラム中の実装多
重なコードを効率的かつ確実に抽出することができる。

【００２３】請求項７の発明は、コンピュータを利用し
て、ソースプログラム中の任意の箇所を変更しようとす
る場合に、同時に変更すべき別の箇所を抽出する同時変
更対象箇所抽出方法において、構成要素選択ステップ、
実装多重度評価ステップ、同時変更候補抽出ステップを
含むことを特徴としている。ここで、構成要素選択ステ
ップは、ユーザに、変更しようとする構成要素を選択さ
せるステップである。また、実装多重度評価ステップ
は、ソースプログラムの構成要素群とこの構成要素群の
各２つの構成要素間の比較指標値を含む構成要素群情報
に基づいて、ユーザにより選択された構成要素の実装多
重度を評価するステップである。そしてまた、同時変更
候補抽出ステップは、前記構成要素群情報に基づいて、
ユーザにより選択された構成要素に対して実装多重な構
成要素を、同時に変更すべき構成要素の候補として抽出
するステップである。

【００２４】この方法によれば、比較指標値を含む構成
要素群情報を利用して、ユーザにより選択された構成要
素の実装多重度を容易に評価できると同時に、その構成
要素に対して実装多重な構成要素を効率的かつ確実に抽
出することができる。したがって、ある構成要素を変更
しようとしているユーザに対し、その構成要素の実装多
重度の評価結果と変更の必要な構成要素の候補集合との
両方を提示して、構成要素の変更作業を強力に支援する
ことができる。

【００２５】請求項８の発明は、コンピュータを利用し
て、オブジェクト指向言語で記述されたソースプログラ
ム中のクラス階層を再構成するクラス階層再構成方法に
おいて、再構成候補抽出ステップを含むことを特徴とし
ている。ここで、再構成候補抽出ステップは、ソースプ
ログラム中の各クラス定義とクラス間の比較指標値を含
むクラス群情報に対して、ユーザからクラス階層を再構
成する必要性が提示された場合に、請求項６または請求
項７に記載の方法により、前記クラス群情報に基づい
て、実装多重なコードを持つクラス定義群を、再構成す
べきクラス定義群の候補として抽出するステップであ
る。

【００２６】この方法によれば、請求項６または請求項
７の方法を、オブジェクト指向言語で記述されたソース
プログラムに適用することにより、比較指標値を含むク
ラス群情報を利用して、実装多重なコードを持つクラス
定義群を効率的かつ確実に抽出することができる。した
がって、ユーザがクラス階層の再構成の必要性を入力し
た時点で、実装多重なコードを持つクラス定義群を、再
構成の必要なクラス定義群の候補に関する情報としてユ
ーザに提示して、クラス階層の再構成作業を強力に支援
することができる。

【００２７】請求項９の発明は、請求項８のクラス階層
再構成方法において、再構成判断支援ステップを含むこ
とを特徴としている。ここで、再構成判断支援ステップ
は、前記クラス群情報に対して、ユーザからクラス階層
を再構成する必要性の有無が提示されていない場合に、
請求項３に記載の方法により、クラス群情報に基づいて
実装多重度を評価し、評価結果をユーザに提示すること
により、ユーザにクラス階層を再構成する必要性の有無
を判断させるステップである。

【００２８】この方法によれば、ユーザがクラス階層の
再構成の必要性を認識していない場合でも、請求項３の
方法を適用して、クラス群情報に基づいて実装多重度を
評価し、評価結果をユーザに提示することにより、ユー
ザは、その評価結果に基づいて、クラス階層の再構成が
必要であるか否かを容易に判断することができる。した
がって、ユーザが再構成の必要性を認識していなくて
も、実装多重度が高く、クラス階層の再構成が必要な場
合には、ユーザに再構成の必要性を認識させ、再構成候
補抽出ステップへと進むことができる。

【００２９】なお、請求項１０〜１３の発明は、請求項
１、３、６、７の発明の方法をそれぞれプログラムの観
点から把握したものであり、各プログラムによれば、対
応する各方法について上述した作用と同様の作用が得ら
れる。

【００３０】

【発明の実施の形態】以下には、本発明の実施形態を図
面に沿って具体的に説明する。ただし、ここで記載する
実施形態は、本発明を何ら限定するものではなく、本発
明の一態様を例示するものにすぎない。

【００３１】本発明は、典型的には、コンピュータをソ
フトウェアで制御することにより実現される。この場合
のソフトウェアは、コンピュータのハードウェアを物理
的に活用することで本発明の作用効果を実現するもので
あり、また、従来技術を適用可能な部分には好適な従来
技術が適用される。さらに、本発明を実現するハードウ
ェアやソフトウェアの具体的な種類や構成、ソフトウェ
アで処理する範囲などは自由に変更可能であり、例え
ば、本発明を実現するプログラムは本発明の一態様であ
る。

【００３２】なお、前述したように、本発明における構
成要素は、例えば、プログラム中の関数や手続、オブジ
ェクト指向言語におけるクラス定義等であるが、以下で
は、一例として、構成要素がＣ言語における関数である
場合について説明する。

【００３３】［１．構成要素分類方法］図１は、本発明
を適用した構成要素分類方法の概要を示すフローチャー
トであり、図２は、図１におけるツリーへの追加処理の
サブルーチンを示すフローチャートである。

【００３４】図１に示すように、ソースプログラムが入
力されてコンピュータのメモリ等の格納部に格納される
と（Ｓ１１０）、プログラムに含まれる全ての関数を構
成要素解析ステップ（Ｓ１２０）にて抽出し、その後、
構成要素比較ステップ（Ｓ１３０）にて全ての２関数間
の類似度を測定する。なお、「類似度」とは、２つの関
数から一意に定まる値であり、その２関数がどれだけ類
似しているかどうかを評価する比較指標値である。

【００３５】類似度についてより詳細に説明すれば、任
意個数の類似度の集合は順序集合となる。つまり、任意
の２関数ａ１，ａ２の組み合わせをＡとし、別の任意の
２関数ｂ１，ｂ２の組み合わせをＢとした場合、すなわ
ち、Ａ＝（ａ１，ａ２）、Ｂ＝（ｂ１，ｂ２）、に対し
て、Ａの組み合わせの方がＢの組み合わせ以上に類似し
ている関係にあると判断されるならば、Ａから得られる
類似度ｓ(Ａ)と、Ｂから得られる類似度ｓ(Ｂ)に対し
て、「ｓ(Ａ)の順位はｓ(Ｂ)の順位以上」という順序関
係が存在する。ただし、「ｓ(Ａ)の順位はｓ(Ｂ)の順位
以上」であり、かつ、「ｓ(Ａ)はｓ(Ｂ)と等しくない」
場合には、「ｓ(Ａ)の順位はｓ(Ｂ)の順位より上」が成
り立つものとする。そしてこの場合、Ａの２関数ａ１，
ａ２はＢの２関数ｂ１，ｂ２より「類似度が高い」と表
現する。逆に、Ｂの２関数ｂ１，ｂ２はＡの２関数ａ
１，ａ２より「類似度が低い」と表現する。

【００３６】なお、具体的な類似度の例として、例え
ば、２関数を行ごとに文字列比較し、一致した行数が２
関数の全行数に占める割合を類似度と定義できる。この
場合、類似度は実数値で表現できる。

【００３７】次に、構成要素解析ステップ（Ｓ１２０）
にて得られた関数群と、構成要素比較ステップ（Ｓ１３
０）にて得られた各２関数間の類似度を使用して、構成
要素分類ステップ（Ｓ１４０）を行い、ｎ分木で構成さ
れるツリー状の階層構造（以下には、ツリーと略称す
る）を構成する。

【００３８】すなわち、構成要素分類ステップにおいて
は、まず、構成要素群である関数群と、比較指標値であ
る類似度とを入力として与え（Ｓ１４１）、与えられた
類似度の中から最も大きな値を持つ関数の組み合わせを
選択する（Ｓ１４２）。ここで、最大の類似度を持つ関
数の組み合わせが複数存在する場合には、それらの複数
の組み合わせを選択する。そして、選択した関数の組み
合わせをツリーに追加登録し、同時に選択した類似度を
必要に応じて節として登録する（Ｓ１４３）。このよう
なツリーへの追加処理の詳細は、図２に示す通りであ
る。

【００３９】すなわち、比較指標値である類似度と比較
対象の２構成要素（ａ，ｂ）を入力し（Ｓ２０１）、２
構成要素（ａ，ｂ）ともツリーに登録されているか否か
を判断する（Ｓ２０２）。そして、いずれか一方でも未
登録である場合（Ｓ２０２のＮＯ）には、類似度を登録
した節Ｎを生成する（Ｓ２０３）。次に、一方の構成要
素ａがツリーに登録されているか否かを判断し（Ｓ２０
４）、未登録の場合（Ｓ２０４のＮＯ）にはその構成要
素ａを節Ｎの子として登録し（Ｓ２０５）、登録済みの
場合（Ｓ２０４のＹＥＳ）にはその構成要素ａが属する
ツリーの頂点を節Ｎの子として登録する（Ｓ２０６）。

【００４０】続いて、他方の構成要素ｂがツリーに登録
されているか否かを判断し（Ｓ２０７）、未登録の場合
（Ｓ２０７のＮＯ）にはその構成要素ｂを節Ｎの子とし
て登録し（Ｓ２０８）、登録済みの場合（Ｓ２０７のＹ
ＥＳ）にはその構成要素ｂが属するツリーの頂点を節Ｎ
の子として登録して（Ｓ２０９）、ツリーへの追加処理
を終了する。また、２構成要素が共に登録済みである場
合（Ｓ２０２のＹＥＳ）には、その時点でツリーへの追
加処理を終了する。

【００４１】ツリーへの追加処理を終了すると、登録さ
れた組み合わせが持つ類似度を処理対象から除外した
（Ｓ１４４）上で、処理対象となる類似度がまだ残って
いるか否かを判別する（Ｓ１４５）。処理対象となる類
似度が残っている場合（Ｓ１４５のＹＥＳ）には、Ｓ１
４２に戻って次に大きな類似度を持つ組み合わせを選択
し、処理対象となる類似度が残っていない場合（Ｓ１４
５のＮＯ）には処理を終了する。

【００４２】以下には、この構成要素分類ステップにつ
いて、図３に示すような関数群と各２関数間の類似度の
一例を用いて具体的に説明する。この図３においては、
８個の関数ｆ１〜ｆ８をそれぞれ表現する円が示される
と共に、２関数間の類似度が、それらの関数に対応する
２つの円の間を接続する線とそれに添えられた数字とい
う形で示されている。この例では、類似度を小数点第１
位までの小数としている。

【００４３】まず、類似度の最大値を持つ関数の組み合
わせを順次選択するという前述の処理（Ｓ１４２〜Ｓ１
４５）は、具体的には、類似度の基準値を設定し、基準
値を下げながらその値以下の類似度を排除していく、と
いう作業によって実現される。図３の例においては、最
大の類似度は「０．８」であるため、まず、基準値を
「０．８」とすると、最も類似度の高い関数のグループ
｛ｆ１，ｆ２，ｆ３｝が形成されるので、このグループ
をツリーに追加すると共に、類似度「０．８」を節とし
て登録する。

【００４４】次に基準値を「０．７」とすると、次に類
似度の高い関数のグループ｛ｆ７，ｆ８｝が形成される
ので、このグループをツリーに追加すると共に、類似度
「０．７」を節として登録する。以降、最小の類似度
「０．１」まで、同様の作業を繰り返すと、図３中に円
で囲んで示すような、類似度が高い順に階層化されたグ
ループ構造が形成されると共に、図４に示すように、そ
の階層構造を反映したツリーが形成される。すなわち、
図４は、図３に示す関数ｆ１〜ｆ８、各２関数間の類似
度、および類似度に応じて形成された関数のグループ
を、ｎ分木で表現したものである。

【００４５】この図４に示すように、本実施形態におい
て、ツリーは、一般のｎ分木と同様に、接点とその親子
関係から構成され、頂点（親を持たない接点）、葉（子
を持たない接点）、節（葉以外の接点）が定義できる。

【００４６】この例では、図４のツリーにおける葉は、
ソースプログラム中の関数の１つ１つにそれぞれ対応し
ており、全ての関数が漏れなく葉に対応している。ま
た、節は、葉または他の節を子として持ち、その節が持
つ葉の数と、類似度を属性情報として持つ。これらの属
性情報は以下のように定義される。

【００４７】（定義１）：「ある節が持つ葉」とは、
その節の子となる葉、および子となる節が持つ葉を意味
する。したがって、ある節Ｋが持つ葉の数は、その節の
子となる葉の数と、子となる節が持つ葉の数の総和に等
しい。

【００４８】（定義２）：ある節が属性情報として持
つ類似度は、次のように定義される。節Ｋがｎ個の子を
持っている場合に、各々の子に対して、子が葉であれ
ば、その葉自身を選び出し、また、子が節であれば、そ
の節が持つ葉の中の１つを選び出し、選び出されたｎ個
の葉からなる集合leaf(Ｋ)＝｛ｋ１，ｋ２，…，ｋｎ｝
を考える。さらに、任意の類似度ｓが与えられた場合
に、「ｋ∈leaf(Ｋ)である任意のｋに対し、ｋｉ∈leaf
(Ｋ)でありかつｋとの類似度がｓであるｋｉ（１≦ｉ≦
ｎ，ｋ≠ｋｉ）が必ず存在するようなleaf(Ｋ)」を、
「conleaf(Ｋ，ｓ)」と定義する。そして、「節Ｋが属
性情報として類似度ｓを持つ」とは、次の（ｉ）、（i
i）が共に成立することと同義である、とする。（ｉ）conleaf(Ｋ，ｓ)が必ず１つ以上存在する。（ii）「ｓ１の順位はｓの順位より上」である任意のｓ
１に対して、conleaf(Ｋ，ｓ１)は存在しない。

【００４９】さらに、本実施形態のツリーは、次の規則
にしたがって構成される。（規則）：親子関係にある任意の２節間において、親
の節が持つ類似度ｓ(Ｐ)、子の節が持つ類似度ｓ(Ｃ)に
対して、「ｓ(Ｃ)の順位はｓ(Ｐ)の順位より上」という
順序関係が成立する。すなわち、関数間の類似度が高け
れば高いほど、これらの関数が同一の機能を実装してい
る可能性が高い。また、同じ機能を実装している関数が
多いほど、やはり機能変更にかかるコストを高める可能
性が高い。このツリーを用いて関数を分類すると、「あ
る値以上の類似度を持つ関数の集合、数」、および「類
似度の高低」を、ツリー内の節と節間の関係で表現する
ことができる。ここで、「ある値以上の類似度を持つ関
数の集合」は、その類似度を属性情報として持つ節が持
つ葉の集合の和に対応する。「数」は節が持つ葉の数に
相当し、節に属性情報として記述されている。「類似度
の高低」は、節間の親子関係で表現される。

【００５０】以上のような本実施形態の構成要素分類方
法によれば、階層的クラスター分析手法において使用さ
れるような樹形図では抽出しにくい実装多重度に関する
情報を反映した、理解しやすいツリーを形成することが
できる。この点について以下に説明する。

【００５１】まず、階層的クラスター分析手法において
使用される樹形図（デンドログラム）は、その目的や構
築手法から、ある節の子となる節あるいは葉の数は、２
つ程度にすぎない。しかしながら、本発明が対象として
いるようなソフトウェアにおいては、実装多重なコード
は、同一の類似度で類似しあうことが多く、したがっ
て、同一の類似度で類似しあう要素・グループとその数
が重要視されるべきであり、これらは同一の節を親とし
た方が望ましい。その点で、図４に示すようなツリーで
は、同一の類似度で類似しあう要素を１つのグループに
まとめており、樹形図では抽出しにくい実装多重度に関
する情報を効率よく取り扱うことができる。

【００５２】また、例えば類似度を実数値とした場合、
実際には非常に大きな桁数を持ったり、無限の桁数を持
った数値が得られることが多い。その際には、計算機の
扱える範囲内で桁数を制限することとなるが、本実施形
態においては、類似度の桁数を意図的に少なく制限する
ことにより、ある程度の幅を有する類似度を同じ類似度
のグループとしてまとめることもできる。すなわち、図
３の例のように、類似度を小数点第１位までの小数とし
た場合には、類似度は、０．１〜０．９までの最大９段
階で段階的にグループ化されることになる。このよう
に、類似度を段階的にグループ化することにより、段階
の数に応じて、ツリーの階層の数を自由に調整できる。

【００５３】このように、本実施形態の構成要素分類方
法によれば、プログラムの構成要素を、実装多重度を反
映した理解しやすいツリー状の階層構造に分類すること
ができるため、プログラム中の実装多重度の定量的な評
価の実現に貢献できる。また、類似度を段階的にグルー
プ化することにより、段階の数に応じて、ツリーの階層
の数を自由に調整して、類似度の近い構成要素の集合を
適切に表現することができる。特に、グループ化する段
階の数をある程度制限することにより、類似度の近い構
成要素の集合を大きくまとめることができるため、その
集合を容易に把握可能となり、実装多重度の定量的な評
価が容易になる。

【００５４】［２．実装多重度見積方法］図５は、本発
明を適用した実装多重度見積方法の概要を示すフローチ
ャートである。この実装多重度見積方法は、前述した構
成要素分類方法で得られたツリーや、あるいは階層的ク
ラスター分析手法によって作成された樹形図を元に、プ
ログラムの実装多重度を見積もる方法である。

【００５５】まず、前提として、「実装多重度」は、次
のような性質を持つものとする。（性質１）：関数間の類似度が高い程、これらの関数
が同一の機能を実装していると推測できる。すなわち、
それだけ実装多重度が高くなる。（性質２）：同じ機能を実装している（と推測でき
る）関数が多いほど、実装多重度が高い。

【００５６】本実施形態における実装多重度見積方法に
おいては、このような性質を反映させるように、ツリー
中の各節が属性として持つ「類似度」と節が持つ「子の
数」（あるいは節が持つ「葉の数」）から実装多重度を
見積もる。なお、便宜上の理由から、以下では、前述し
た構成要素分類方法で得られるようなツリーについて説
明するが、樹形図を用いる場合には、「節が持つ類似
度」を樹形図中の各節の高さによって置き換えることに
より、同様の方法で実装多重度を見積もることができ
る。

【００５７】図５に示すように、ツリーＴが入力されて
コンピュータのメモリ等の格納部に格納されると（Ｓ５
０１）、そのツリーＴによって表現されるプログラムＰ
に対する実装多重度ｍ(Ｐ)の初期値を０とし、節Ｎとし
てツリーＴの頂点を選択する（Ｓ５０２）。そして、選
択した節Ｎについて、その節が持つ「類似度」と「子の
数」という属性情報を取得して所定の演算を行い、その
演算結果である値αを実装多重度ｍ(Ｐ)に加える（Ｓ５
０３）。このような所定の演算を、ツリーＴ中の全ての
節に対して行う（Ｓ５０４のＹＥＳ、Ｓ５０５）ことに
より、全ての節に対する値αの総和を含む実装多重度ｍ
(Ｐ)が得られる。以下には、各節に対して行う演算の具
体例について説明する。

【００５８】［演算例１］類似度が実数値で表現できる
場合には、一例として、各節Ｎに対する値αを、次の式
で求める。

【数１】α＝（Ｎの子の数−１）×（Ｎが持つ類似度）この場合、プログラムＰに対する実装多重度ｍ(Ｐ)を求
める式は、次のように定義される。

【数２】この式（１）において、nodes(Ｐ)は、プログラムＰか
ら求めたツリーＴに含まれる全ての節からなる集合であ
る。

【００５９】この式（１）により実装多重度ｍ(Ｐ)を求
めると、右辺にある「項（Ｎの子の数−１）の総数＋
１」が、「Ｐが持つ関数の数」に等しくなる。したがっ
て、類似度の値域が[０...１]であるとすると、次の式
が成立する。

【数３】ｍ(Ｐ)≦（Ｐが持つ関数の数）したがって、次の式による正規化が可能となり、他のプ
ログラムとの間での指標値の比較が可能となる。

【数４】ｍ(Ｐ)／（Ｐが持つ関数の数）

【００６０】なお、図４に示すツリーについて上記の式
（１）で実装多重度ｍ(Ｐ)を計算すると、次のようにな
る。

【数５】ｍ(Ｐ) ＝0.1×１＋0.4×１＋0.4×１＋0.6×１＋0.7×１＋0.8×２＋１＝４．８

【００６１】［演算例２］類似度が実数値で表現できる
場合には、別の一例として、各節Ｎに対する値αを、次
の式で求める。

【数６】α＝（Ｎの子の数）²×（Ｎが持つ類似度）この場合、プログラムＰに対する実装多重度ｍ(Ｐ)を求
める式は、次のように定義される。

【数７】

【００６２】この式（２）により実装多重度ｍ(Ｐ)を求
めると、ツリーＴ中の節のうち、特に、子の数が多い節
の比較指標値が大きく反映されることになる。この場
合、１つの節が持つ子の数は、同じ機能を持つ関数の数
を示しているため、同じ機能を持つ関数が多数存在する
ほど、その情報が強く反映されることになる。したがっ
て、この方法は、階層的クラスター分析手法によって作
成された樹形図よりは、前述した構成要素分類方法で得
られたツリーを使用して計算する場合に好適であり、そ
の特徴を生かすことができる。

【００６３】なお、図４に示すツリーについて上記の式
（２）で実装多重度ｍ(Ｐ)を計算すると、次のようにな
る。

【数８】ｍ(Ｐ) ＝0.1×２²＋0.4×２²＋0.4×２²＋0.6×２²＋0.7×２²＋0.8×３² ＝１６

【００６４】以上のような本実施形態の実装多重度評価
方法によれば、比較指標値に関する情報を含むツリー状
の階層構造からツリー中の各節についての演算を機械的
に行い、その演算結果の総和からプログラム全体の実装
多重度を定量的に容易に評価することができる。

【００６５】［３．実装多重コード抽出方法］図６は、
本発明を適用した実装多重コード抽出方法の概要を示す
フローチャートである。この実装多重コード抽出方法
は、前述した構成要素分類方法で得られたツリーや、あ
るいは階層的クラスター分析手法によって作成された樹
形図を元に、プログラム中の実装多重なコードを抽出す
る方法であり、この方法において重要なポリシーは、
「類似度が高く、かつ、共通の機能実装を持つと推測さ
れるような関数の集合のうち、最も大きいものを抽出す
る」ことである。

【００６６】図６に示すように、ツリーＴが入力されて
コンピュータのメモリ等の格納部に格納されると（Ｓ６
０１）、まず、節ＮとしてツリーＴの頂点を選択する
（Ｓ６０２）と共に、関数の集合数に対する基準値Ｕを
設定する（Ｓ６０３）。そして、ツリーＴの頂点から葉
に向かって、順に節をたどっていく。この場合、ツリー
の性質から、親の節が持つ葉の数は子の節が持つ葉の数
より大きいので、節が持つ葉の数は、たどっていくうち
に小さくなっていく。そして、親の節から子の節へたど
る際には、前述したポリシーに基づき、常に、葉の数が
最大となる子を選択しながら順に節Ｎをたどる。

【００６７】すなわち、新たに選択された節Ｎの葉の数
が基準値Ｕ以上であり（Ｓ６０４のＮＯ）、その節Ｎに
子となる節がある場合（Ｓ６０５のＹＥＳ）には、子と
なる節のうち、葉の数が最大となる節を新たな節Ｎとし
て選択する（Ｓ６０６）。そして、新たに選択された節
Ｎの葉の数が基準値Ｕより小さくなった時点（Ｓ６０４
のＹＥＳ）、あるいは節Ｎに子となる節がなくなった時
点（Ｓ６０５のＮＯ）で、その時点で選択されている節
Ｎが持つ葉に対応する構成要素集合、すなわち関数集合
を、ユーザに提示する（Ｓ６０７）。この方法によれ
ば、葉の数が最大となる子を常に選択するので、より大
きい関数の集合、すなわち、より構成要素数の多い実装
多重なコードの集合を選択することができる。

【００６８】図４に示すツリーの例では、まず、頂点の
節「０．１（８）」を選択し、葉の数が多い節「０．４
（５）」、「０．８（３）」を順にたどっていくことに
なる。ここで、基準値Ｕが５より小さい場合には、
「０．８（３）」が持つ葉ｆ１〜ｆ３に対応する関数が
実装多重なコードとして得られる。また、基準値Ｕが５
以上の場合には、「０．４（５）」が持つ葉ｆ１〜ｆ５
に対応する関数が得られる。なお、このようにして得ら
れた関数をユーザに提示する際には、ツリーの構造をそ
のまま画像表示することが望ましい。それにより、ユー
ザは、ツリー構造の形で画像表示された関数の中から、
共通化する際の優先順位を容易に決定することができる
ので、同一機能を予め共通化する等の改善作業の効率を
向上できる。

【００６９】以上のような本実施形態の実装多重コード
抽出方法によれば、ツリー構造を利用して、ツリーの頂
点から葉に向かって葉の数が最大となる子を選択すると
いう機械的な作業を繰り返すだけで、プログラム中の実
装多重なコードを効率的かつ確実に抽出することができ
る。したがって、同一機能の分散実装に対して、変更に
係るリスクの軽減を目的として予め共通化する等の改善
作業を行う場合に、ユーザは、どの機能を共通化するこ
とが効率的であるかを容易に把握することができるた
め、改善作業を効率的に行うことができる。

【００７０】［４．同時変更対象箇所抽出方法］図７
は、本発明を適用した同時変更対象箇所抽出方法の概要
を示すフローチャートである。この同時変更対象箇所抽
出方法は、プログラム中の任意の箇所を変更しようとす
る場合に、前述した構成要素分類方法で得られたツリー
や、あるいは階層的クラスター分析手法によって作成さ
れた樹形図を元に、変更しようとする箇所と同時に変更
すべき別の箇所を抽出する方法である。

【００７１】図７に示すように、構成要素である関数群
と各２関数間の類似度に関する関数群情報を含むツリー
Ｔが入力されてコンピュータのメモリ等の格納部に格納
された状態で（Ｓ７０１）、ユーザが、変更しようとす
る関数ｆを選択すると（Ｓ７０２）、その関数ｆに対応
する葉のｎ代前の祖先となる節ｐ_n(ｆ)を求める（Ｓ７
０３）。そして、この節ｐ_n(ｆ)が持つ情報から関数ｆ
の実装多重度ｍ（ｆ，ｎ）を求める（Ｓ７０４）。ここ
で、関数ｆの実装多重度ｍ（ｆ，ｎ）は、節ｐ _n(ｆ)を
頂点としたツリーの部分木に対応する実装多重度と定義
され、例えば、部分木内に含まれる各節について、節が
持つ子の数と類似度を用いた所定の演算を行い、その演
算結果の総和から定量的に評価される。

【００７２】また、関数ｆの実装多重度ｍ（ｆ，ｎ）の
評価と同時に、関数ｆに対応する葉のｎ代前の祖先とな
る節ｐ_n(ｆ)が持つ葉の集合を、同時に変更すべき関数
の候補として求める（Ｓ７０５）。この場合、自然数で
あるｎの値を適宜変更することにより、候補の数、範囲
を適切に調節することができる。

【００７３】以上のようにして求めた実装多重度と同時
変更候補に関する情報をユーザに提示する（Ｓ７０６）
ことにより、ユーザは、その情報から、変更しようとす
る関数に対して、他の関数を変更すべきか否かを判断で
きると共に、具体的にどの関数を変更すべきかを把握す
ることができる。なお、このようにして得られた情報を
ユーザに提示する際には、ツリーの構造をそのまま画像
表示することが望ましい。それにより、ユーザは、他の
関数の変更の有無の判断や変更すべき関数の特定を容易
に行うことができるので、関数の変更による改善作業の
効率を向上できる。

【００７４】また、図７においては、関数ｆの実装多重
度および同時に変更すべき関数の候補として、関数ｆに
対応する葉のｎ代前の祖先となる節ｐ_n(ｆ)を頂点とし
たツリーの部分木に対応する実装多重度ｍ（ｆ，ｎ）を
求めると共に、節ｐ_n(ｆ)が持つ葉の集合を求めたが、
関数ｆに対応する葉の親となる節ｐ(ｆ)が持つ情報だけ
を使用することも可能である。

【００７５】この場合には、関数ｆの実装多重度ｍ(ｆ)
は、例えば次のように定義される。

【数９】ｍ(ｆ)＝（ｐ(ｆ)が持つ子の数）×（ｐ(ｆ)が
持つ類似度）そして、このような実装多重度ｍ(ｆ)が求められると共
に、ｐ(ｆ)が持つ葉の集合が変更すべき関数の候補とし
て求められ、ユーザに提示されることになる。

【００７６】以上のような本実施形態の同時変更対象箇
所抽出方法によれば、関数群と各２関数間の類似度に関
する関数群情報を含むツリーを利用して、ユーザにより
選択された関数の実装多重度を容易に評価できると同時
に、その関数に対して実装多重な他の関数を効率的かつ
確実に抽出することができる。したがって、ある関数を
変更しようとしているユーザに対し、その関数の実装多
重度の評価結果と変更の必要な他の関数の候補集合との
両方を提示して、関数の変更によるプログラムの改善作
業を強力に支援することができる。

【００７７】さらに、上記の説明では、予めツリーを入
力した場合について説明したが、本発明における同時変
更対象箇所抽出方法はこれに限定されるものではなく、
ユーザにより関数が選択された時点で、その関数に対応
する葉を含む部分木を形成して必要な情報を取得するこ
とも可能である。

【００７８】［５．クラス階層再構成方法］図８は、本
発明を適用したクラス階層再構成方法の概要を示すフロ
ーチャートである。このクラス階層再構成方法は、前述
した実装多重度評価方法、実装多重コード抽出方法、同
時変更対象箇所抽出方法等を、オブジェクト指向言語で
開発されたソフトウェアにおけるクラス階層の再構成に
応用した方法であり、対象となる構成要素は、オブジェ
クト指向言語におけるクラス定義である。

【００７９】図８に示すように、プログラム中に定義さ
れているクラス定義群と各２クラス定義間の類似度に関
するクラス群情報が入力されてコンピュータのメモリ等
の格納部に格納された状態で（Ｓ８０１）、ユーザから
クラス階層を再構成する必要性の有無が提示されている
か否かを判断する（Ｓ８０２）。そして、ユーザが必要
性を理解していない等の理由により、必要性の有無が提
示されていない場合（Ｓ８０２のＮＯ）には、前述した
実装多重度評価方法（図５）等を用いて、クラス定義と
それらの間の類似度に基づいた実装多重度を測定してユ
ーザに提示する（Ｓ８０３）。これにより、ユーザは、
提示された実装多重度から、クラス階層の再構成が必要
か否かを容易に判断することができる。

【００８０】ユーザが再構成の必要性があると判断して
その旨を提示した場合（Ｓ８０４のＹＥＳ）には、前述
した実装多重コード抽出方法（図６）あるいは同時変更
対象箇所抽出方法（図７）等を用いて、実装多重なコー
ドを持つクラス定義群を、再構成すべきクラス定義群の
候補として抽出する（Ｓ８０５）。抽出されたクラス群
に、すでに共通化されたクラスがあるか否かを判別する
（Ｓ８０６）。共通化されたクラスがない場合（Ｓ８０
６のＮＯ）には、共通化クラスの定義を作成する（Ｓ８
０７）。そして、抽出されたクラス群が共通に持つ機能
の定義を既存のあるいは新たに作成された共通化クラス
の機能としてクラス定義に追加する（Ｓ８０８）。

【００８１】続いて、抽出された元の各クラスごとに
（Ｓ８０９）、共通化クラスの派生クラスとしてのクラ
ス定義を作成し（Ｓ８１０）、元のクラスと共通化クラ
スとの間の機能の差分を派生クラスの機能としてクラス
定義に追加する（Ｓ８１１）、という一連のループ処理
を行う（Ｓ８１２）。これにより、クラス階層の再構成
を終了する。

【００８２】図９および図１０は、Ｊａｖａによるプロ
グラムコードに対して上記のようなクラス階層の再構成
を行った場合の具体例を示しており、図９は再構成前の
コード、図１０は再構成後のコードを示している。な
お、図面の簡略化の観点から、説明に必要な部分以外は
省略している。この例について以下に説明する。

【００８３】まず、図９に示すコードのうち、「Class
1」の「func1」と「Class2」の「func3」が同様の機能
を別個に実装しており、また、「Class1」の「func2」
と「Class2」の「func4」が同様の機能を別個に実装し
ているものとする。そして、「func1」と「func3」は全
く同一であり、また、「func2」と「func4」は差異があ
るものの、その一部が共通しているものとする。

【００８４】これらのクラス「Class1」、「Class2」が
実装多重なコードを持つクラス群として抽出された場合
に、共通化クラスがなければ、共通化クラス「CommonCl
ass」のクラス定義が作成される。そして、この共通化
クラス「CommonClass」のクラス定義に、クラス「Class
1」、「Class2」を通じて共通である機能が追加され
る。すなわち、この例では、「func1_3」（「func1」と
「func3」の共通機能）、「func2_4」（「func2」と「f
unc4」の共通機能）がそれぞれ実装される。

【００８５】そして、元のクラス「Class1」、「Class
2」には、共通化クラスの派生クラスであることを示す
宣言「extends CommonClass」が追加され、新たなクラ
ス定義が作成される。続いて、これらの派生クラス「Cl
ass1」、「Class2」に対し、元のクラスと共通化クラス
との機能の差分が追加される。すなわち、派生クラス
「Class1」については、「func2」と「func2_4」との間
の差分が実装され、また、派生クラス「Class2」につい
ては、「func4」と「func2_4」との間の差分が実装され
る。なお、「func1」と「func3」は全く同一であるた
め、「func1_3」との間には差分は存在せず、派生クラ
ス定義には何も発生しない。

【００８６】以上のような本実施形態のクラス階層再構
成方法によれば、前述した実装多重コード抽出方法（図
６）あるいは同時変更対象箇所抽出方法（図７）等を、
オブジェクト指向言語で記述されたソースプログラムに
適用することにより、類似度を含むクラス群情報を利用
して、実装多重なコードを持つクラス定義群を効率的か
つ確実に抽出することができる。したがって、ユーザが
クラス階層の再構成の必要性を入力した時点で、実装多
重なコードを持つクラス定義群を、再構成の必要なクラ
ス定義群の候補に関する情報としてユーザに提示して、
クラス階層の再構成作業を強力に支援することができ
る。

【００８７】また、ユーザがクラス階層の再構成の必要
性を認識していない場合でも、前述した実装多重度評価
方法（図５）等を適用して、クラス群情報に基づいて実
装多重度を評価し、評価結果をユーザに提示することに
より、ユーザは、その評価結果に基づいて、クラス階層
の再構成が必要であるか否かを容易に判断することがで
きる。したがって、ユーザが再構成の必要性を認識して
いなくても、実装多重度が高く、クラス階層の再構成が
必要な場合には、実装多重度を提示してユーザに再構成
の必要性を認識させ、クラス階層の再構成を確実に実施
することができる。

【００８８】なお、クラス階層の再構成作業は、ユーザ
自身が行ってもよいが、クラス階層の再構成作業は、共
通化クラスやその派生クラスのクラス定義の作成や各ク
ラスへの機能の追加等により機械的に実行可能であるた
め、コンピュータにより自動的に実行することにより、
クラス階層の再構成を効率よく確実に行うことができる
と共に、ユーザの作業を少なくすることができる。

【００８９】［６．他の実施形態］なお、本発明は、前
述した実施形態に限定されるものではなく、本発明の範
囲内で他にも多種多様な形態が実施可能である。例え
ば、前述した実装多重度見積方法、実装多重コード抽出
方法、同時変更対象箇所抽出方法等の説明においては、
本発明による構成要素分類方法で得られたツリーを用い
た場合について記載したが、それらの方法は、構成要素
間の比較指標値となる情報を含む限り、階層的クラスタ
ー分析手法によって作成された樹形図を用いた場合で
も、同様に適用可能であり、同様に優れた効果が得られ
るものである。

【００９０】

【発明の効果】以上説明したように、本発明によれば、
ソースプログラムの構成要素群に対して、構成要素間の
比較指標値とそれを反映させたツリー状の階層構造とを
用いることにより、しきい値等を使用せずに、プログラ
ムを構成する各構成要素間の比較指標値を用いて、プロ
グラム中の実装多重度を定量的に容易に評価可能な実装
多重度見積方法、実装多重なコードを効率的かつ確実に
抽出可能な実装多重コード抽出方法、および実装多重度
の定量的な評価に基づいてプログラムにおける同時変更
が必要な箇所を効率的かつ確実に抽出可能な同時変更対
象箇所抽出方法、を提供することができる。

【００９１】また、プログラム中の実装多重度を定量的
に評価可能とするために、プログラムの構成要素を、実
装多重度を反映した理解しやすいツリー状の階層構造に
分類可能な構成要素分類方法を提供することができる。
そしてまた、オブジェクト指向言語で記述されたプログ
ラム中から、実装多重なコードを持つクラス定義群を効
率的かつ確実に抽出して、クラス階層を適切に再構成可
能なクラス階層再構成方法を提供することができる。

【図面の簡単な説明】

【図１】本発明を適用した構成要素分類方法の概要を示
すフローチャート。

【図２】図１におけるツリーへの追加処理のサブルーチ
ンを示すフローチャート。

【図３】関数群と各２関数間の類似度の一例を示す概念
図。

【図４】図３に示す関数、各２関数間の類似度、および
類似度に応じて形成された関数のグループをｎ分木で表
現したツリー状の積層構造を示すデータ構造図。

【図５】本発明を適用した実装多重度見積方法の概要を
示すフローチャート。

【図６】本発明を適用した実装多重コード抽出方法の概
要を示すフローチャート。

【図７】本発明を適用した同時変更対象箇所抽出方法の
概要を示すフローチャート。

【図８】本発明を適用したクラス階層再構成方法の概要
を示すフローチャート。

【図９】Ｊａｖａによるプログラムコードに対して図８
に示すクラス階層再構成方法を適用した場合の具体例を
示しており、再構成前のコードを示す図。

【図１０】図９に示すコードの再構成後のコードを示す
図。

Claims

【特許請求の範囲】

【請求項１】コンピュータを利用して、ソースプログ
ラムの構成要素を分類する構成要素分類方法において、前記ソースプログラムのソースコードを構成要素に分割
して構成要素群を抽出する構成要素解析ステップと、抽出された構成要素群から各２つの構成要素を比較して
その２構成要素間の比較指標値を求める構成要素比較ス
テップと、抽出された構成要素群と、それに対して得られた各２構
成要素間の比較指標値とに基づいて、その構成要素群
を、構成要素間の比較指標値、各節が持つ子の数、各節
が持つ葉の数、という３種類の情報を各節が保持するツ
リー状の階層構造に分類する構成要素分類ステップと、
を含むことを特徴とする構成要素分類方法。
【請求項２】前記構成要素比較ステップにおいては、
抽出された構成要素群に対して得られた各２構成要素間
の比較指標値を段階的にグループ化し、前記構成要素分類ステップにおいては、グループ化され
た比較指標値の各段階に応じた各階層からなる階層構造
に分類する、ことを特徴とする請求項１に記載の構成要
素分類方法。
【請求項３】コンピュータを利用して、ソースプログ
ラム中の実装多重度を定量的に評価する実装多重度見積
方法において、前記ソースプログラムの構成要素群を表現するツリー状
の階層構造から、ツリー中の各節について、その節が保
持する構成要素間の比較指標値と、その節が持つ子の数
または葉の数、という２種類の情報を取得して所定の演
算を行う情報取得・演算ステップと、ツリー中の各節について得られた演算結果の総和から実
装多重度を定量的に評価する実装多重度評価ステップ
と、を含むことを特徴とする実装多重度評価方法。
【請求項４】前記所定の演算は、子の数マイナス１と
比較指標値との積であることを特徴とする請求項３に記
載の実装多重度評価方法。
【請求項５】前記所定の演算は、子の数のべき乗と比
較指標値との積であることを特徴とする請求項３に記載
の実装多重度評価方法。
【請求項６】コンピュータを利用して、ソースプログ
ラム中の実装多重なコードを抽出する実装多重コード抽
出方法において、前記ソースプログラムの構成要素群を表現するツリー状
の階層構造と予め設定された構成要素の集合数に対する
基準値とを用いて、ツリーの頂点から葉に向かって、常
に、葉の数が最大となる子を選択しながら順に節をたど
る節選択ステップと、新たに選択された節の持つ葉の数が前記基準値より小さ
くなるか、あるいは子となる節がなくなった時点で、そ
の時点で選択されている節が持つ葉に対応する構成要素
集合を出力する要素集合出力ステップと、を含むことを
特徴とする実装多重コード抽出方法。
【請求項７】コンピュータを利用して、ソースプログ
ラム中の任意の箇所を変更しようとする場合に、同時に
変更すべき別の箇所を抽出する同時変更対象箇所抽出方
法において、ユーザに、変更しようとする構成要素を選択させる構成
要素選択ステップと、前記ソースプログラムの構成要素群とこの構成要素群の
各２つの構成要素間の比較指標値を含む構成要素群情報
に基づいて、前記ユーザにより選択された構成要素の実
装多重度を評価する実装多重度評価ステップと、前記構成要素群情報に基づいて、前記ユーザにより選択
された構成要素に対して実装多重な構成要素を、同時に
変更すべき構成要素の候補として抽出する同時変更候補
抽出ステップと、を含むことを特徴とする同時変更対象
箇所抽出方法。
【請求項８】コンピュータを利用して、オブジェクト
指向言語で記述されたソースプログラム中のクラス階層
を再構成するクラス階層再構成方法において、前記ソースプログラム中の各クラス定義とクラス間の比
較指標値を含むクラス群情報に対して、ユーザからクラ
ス階層を再構成する必要性が提示された場合に、前記請
求項６または請求項７に記載の方法により、前記クラス
群情報に基づいて、実装多重なコードを持つクラス定義
群を、再構成すべきクラス定義群の候補として抽出する
再構成候補抽出ステップ、を含むことを特徴とするクラ
ス階層再構成方法。
【請求項９】前記クラス群情報に対して、ユーザから
クラス階層を再構成する必要性の有無が提示されていな
い場合に、前記請求項３に記載の方法により、クラス群
情報に基づいて実装多重度を評価し、評価結果をユーザ
に提示することにより、ユーザにクラス階層を再構成す
る必要性の有無を判断させる再構成判断支援ステップ、
を含むことを特徴とする請求項８に記載のクラス階層再
構成方法。
【請求項１０】コンピュータを利用して、ソースプロ
グラムの構成要素を分類するためのプログラムにおい
て、前記ソースプログラムのソースコードを構成要素に分割
して構成要素群を抽出する構成要素解析機能と、抽出された構成要素群から各２つの構成要素を比較して
その２構成要素間の比較指標値を求める構成要素比較機
能と、抽出された構成要素群と、それに対して得られた各２構
成要素間の比較指標値とに基づいて、その構成要素群
を、構成要素間の比較指標値、各節が持つ子の数、各節
が持つ葉の数、という３種類の情報を各節が保持するツ
リー状の階層構造に分類する構成要素分類機能と、をコ
ンピュータに実現させることを特徴とするプログラム。
【請求項１１】コンピュータを利用して、ソースプロ
グラム中の実装多重度を定量的に評価するためのプログ
ラムにおいて、前記ソースプログラムの構成要素群を表現するツリー状
の階層構造から、ツリー中の各節について、その節が保
持する構成要素間の比較指標値と、その節が持つ子の数
または葉の数、という２種類の情報を取得して所定の演
算を行う情報取得・演算機能と、ツリー中の各節について得られた演算結果の総和から実
装多重度を定量的に評価する実装多重度評価機能と、を
コンピュータに実現させることを特徴とするプログラ
ム。
【請求項１２】コンピュータを利用して、ソースプロ
グラム中の実装多重なコードを抽出するためのプログラ
ムにおいて、前記ソースプログラムの構成要素群を表現するツリー状
の階層構造と予め設定された構成要素の集合数に対する
基準値とを用いて、ツリーの頂点から葉に向かって、常
に、葉の数が最大となる子を選択しながら順に節をたど
る節選択機能と、新たに選択された節の持つ葉の数が前記基準値より小さ
くなるか、あるいは子となる節がなくなった時点で、そ
の時点で選択されている節が持つ葉に対応する構成要素
集合を出力する要素集合出力機能と、をコンピュータに
実現させることを特徴とするプログラム。
【請求項１３】コンピュータを利用して、ソースプロ
グラム中の任意の箇所を変更しようとする場合に、同時
に変更すべき別の箇所を抽出するためのプログラムにお
いて、ユーザに、変更しようとする構成要素を選択させる構成
要素選択機能と、前記ソースプログラムの構成要素群とこの構成要素群の
各２つの構成要素間の比較指標値を含む構成要素群情報
に基づいて、前記ユーザにより選択された構成要素の実
装多重度を評価する実装多重度評価機能と、前記構成要素群情報に基づいて、前記ユーザにより選択
された構成要素に対して実装多重な構成要素を、同時に
変更すべき構成要素の候補として抽出する同時変更候補
抽出機能と、をコンピュータに実現させることを特徴と
するプログラム。