WO2022038666A1

WO2022038666A1 - 分析装置、分析方法、およびプログラム

Info

Publication number: WO2022038666A1
Application number: PCT/JP2020/031080
Authority: WO
Inventors: 謙輔高橋; 翔金丸; 友基池谷; 剛司豊嶋
Original assignee: 日本電信電話株式会社
Priority date: 2020-08-18
Filing date: 2020-08-18
Publication date: 2022-02-24
Also published as: JPWO2022038666A1; US20230273773A1

Abstract

スプリントを繰り返して実施するソフトウェア開発チームの成果を分析する分析装置１であって、ソフトウェア開発チームの成果物を格納する開発リポジトリ２からコミット履歴を取得する取得部１１と、スプリントの単位でコミット履歴を集計して統計情報を算出する解析部１２と、統計情報を表示する表示部１３を備える。解析部１２は、ソフトウェア開発チームの成果の偏在性をスプリントの単位でみたジニ係数を算出する。

Description

分析装置、分析方法、およびプログラム

　本発明は、分析装置、分析方法、およびプログラムに関する。

　アジャイルソフトウェア開発においては、動作するソフトウェアの創出に価値を置き、短期間のサイクルでの開発を繰り返し実施することで、変化する要件に柔軟に対応している。

秦泉寺，他、"ＶＳＭを用いたアジャイル開発の生産性指標の提案とウォータフォール開発との比較"，情報処理学会，研究報告ソフトウェア工学，2019-SE-208，pp. 1-7 Ayako Masuda, et.al, "Team Activities Measurement Method for Open Source Software Development Using the Gini Coefficient"，2019 IEEE ICSTW.

　しかしながら、アジャイル開発を行う開発チームの生産性および安定性については、開発チーム自身では内部の体感として理解できるものの、外部から見た時に客観的に測定することが難しいという課題があった。

　また、開発チームは、各サイクルの終了時に振り返り（レトロスペクティブ）を行うことでプロセスの改善を実施しているが、開発者の主観に基づくものが多く、客観的な指標が存在していないという課題があった。

　アジャイル開発の生産性の客観的な指標を算出するために、質問紙を用いたアンケートや人月工数やテスト密度といったプロジェクト管理の強化が存在しているが、計測による開発メンバーへの負担が増大するといった課題が存在している。

　非特許文献１では、「価値」に着目し、リーンソフトウェア開発におけるバリュー・ストリーム・マップ（ＶＭＳ）の考え方を基本とした生産性評価のメトリクスが提案されている。非特許文献１は工数を指標とした生産性評価であり、開発チームで用いられるリポジトリの履歴の分析については言及されていない。

　非特許文献２では、大規模オープンソースソフトウェア（ＯＳＳ）プロジェクトにおけるチーム活動の活発度をＯＳＳの開発に携わった人数と期間をもとにジニ係数を算出して定量化している。しかしながら、アジャイル開発におけるスプリントごとの継続的な生産性および安定性の測定については言及されていない。

　本発明は、上記に鑑みてなされたものであり、アジャイル開発の効率的なマネジメントを可能にすることを目的とする。

　本発明の一態様の分析装置は、開発サイクルを繰り返して実施するソフトウェア開発チームの成果を分析する分析装置であって、前記ソフトウェア開発チームの成果物を格納する開発リポジトリからコミット履歴を取得する取得部と、前記開発サイクルの単位で前記コミット履歴を集計して統計情報を算出する解析部と、前記統計情報を表示する表示部を備える。

　本発明の一態様の分析方法は、開発サイクルを繰り返して実施するソフトウェア開発チームの成果を分析する分析方法であって、コンピュータが、前記ソフトウェア開発チームの成果物を格納する開発リポジトリからコミット履歴を取得し、前記開発サイクルの単位で前記コミット履歴を集計して統計情報を算出し、前記統計情報を表示する。

　本発明によれば、アジャイル開発の効率的なマネジメントを可能にすることができる。

図１は、本実施形態の分析装置の構成の一例を示す図である。図２は、コミット履歴の一例を示す図である。図３は、スプリント期間の一例を示す図である。図４Ａは、スプリント毎のジニ係数の表示例である。図４Ｂは、スプリント毎のコミットライン数の表示例である。図４Ｃは、コミットライン数の対数ヒストグラムの表示例である。図４Ｄは、ローレンツ曲線の表示例である。図５は、分析装置の処理の流れの一例を示すフローチャートである。図６は、統計情報としてジニ係数を算出する分析装置の処理の流れの一例を示すフローチャートである。図７は、スプリント毎のジニ係数の表示例である。図８は、コミットライン数の対数ヒストグラムの表示例である。図９は、分析装置のハードウェア構成の一例を示す図である。

　以下、図面を参照しながら、一実施の形態の分析装置を説明する。

　図１は、分析装置１の構成の一例を示す図である。同図に示す分析装置１は、取得部１１、解析部１２、および表示部１３を備えて、開発サイクル（スプリント期間ともいう）を繰り返して実施する開発チームの成果を分析する。

　取得部１１は、開発リポジトリ２からコミット履歴を取得する。開発リポジトリ２は、ソフトウェア開発に用いるバージョン管理システムがソースコードやドキュメントなどのファイルおよび変更履歴などの各種データを保管する場所である。バージョン管理システムとしては、例えば、ＧｉｔまたはＳＶＮなどのコミット履歴が残るものを利用する。コミットとは、開発者が作成または修正したファイルを開発リポジトリ２に格納することである。コミット履歴とは、開発チームのコミットの履歴である。

　図２に、取得部１１が取得するコミット履歴の一例を示す。コミット履歴は、コミット単位で記録される。図２は、１回のコミットで記録されるコミット履歴の一例を示している。図２に示すコミット履歴は、コミット日、コミット著者、修正ファイル数、修正ライン数、追加ライン数、削除ライン数、およびコミットメッセージを含む。コミット日は、ファイルをコミットした日付である。コミット著者は、コミットした人の名前であり、実際にファイルを修正した人の名前である。修正ファイル数は、このコミットで修正したファイル数である。修正ライン数は、このコミットで修正した総ライン数であり、追加ライン数と削除ライン数を合計した値である。追加ライン数は、このコミットで追加したライン数である。削除ライン数は、このコミットで削除したライン数である。コミットメッセージは、このコミットに付与されたメッセージである。コミット履歴は、これ以外の情報を含んでもよい。

　解析部１２は、繰り返されるスプリント期間の単位でコミット履歴を集計して統計情報を算出する。スプリント期間は、例えば図３に示すように、開始日と終了日が与えられている。解析部１２は、開始日と終了日で示されるスプリント期間毎にコミット履歴を集計する。解析部１２が求める統計情報としては、例えば、スプリント毎のジニ係数、スプリント毎のコミットライン数、コミットライン数のヒストグラム、およびローレンツ曲線などがある。なお、解析部１２が求める統計情報をこれらに限定するものではない。

　表示部１３は、解析部１２が算出した統計情報を可視化する。図４Ａ～４Ｄに、可視化して表示した統計情報の一例を示す。図４Ａは、スプリント毎のジニ係数の表示例である。図４Ｂは、スプリント毎のコミットライン数の表示例である。図４Ｃは、コミットライン数の対数ヒストグラムの表示例である。図４Ｄは、ローレンツ曲線の表示例である。

　次に、本実施形態の分析装置１の動作について説明する。

　図５は、本実施形態の分析装置１の処理の流れの一例を示すフローチャートである。図５の処理は、所定のタイミング、例えばスプリントが終了する度に実施される。

　ステップＳ１にて、取得部１１は、開発リポジトリ２からコミット履歴を取得する。取得部１１は、特定のコミット履歴を除外してもよいし、コミット履歴のコミット著者の名前の表記揺れを是正してもよい。取得部１１による前処理の詳細は後述する。

　ステップＳ２にて、解析部１２は、スプリント期間の単位でコミット履歴を集計して、統計情報を算出する。統計情報としてジニ係数を算出する例については後述する。

　ステップＳ３にて、表示部１３は、統計情報を可視化して表示する。利用者（例えば開発チーム）は、分析装置１を操作し、表示する統計情報を選択したり、表示態様を選択したりできる。

　以上の処理により、利用者は、スプリント間を定量的に比較することができ、アジャイルソフトウェア開発における開発チームの生産性および安定性を客観的に測定することが可能となる。

　次に、統計情報としてジニ係数を利用する実施例について説明する。

　ジニ係数とは、所得、富の偏在性、エネルギー消費における不平等さなどを測る指標である。本実施形態では、コミットライン数、コミット数、あるいはファイル数などのソフトウェア開発における成果を示す履歴をキーとして集計し、あるスプリントまでのソフトウェア開発における成果の偏在性をスプリント単位でみたジニ係数を算出し、ソフトウェア開発における成果の偏在性を定量的に可視化する。

　ジニ係数は、ローレンツ曲線と均等分配線によって囲まれる領域と均等分配線より下の領域の面積の比として定義される。均等分配線とは、成果の分布が一様である場合のローレンツ曲線である。ジニ係数は、ローレンツ曲線Ｌ（Ｆ）の積分を用いて次式で表現できる。

　ジニ係数がとる値の範囲は０から１で、値が大きいほどその集団における格差が大きい状態であるという評価になる。

　図６のフローチャートを参照し、統計情報としてジニ係数を算出する処理の流れを説明する。

　ステップＳ１にて、取得部１１は、開発リポジトリ２からコミット履歴を取得する。

　ステップＳ２１にて、解析部１２は、コミット履歴のコミット日をもとに、コミット履歴を含むスプリントを特定する。

　ステップＳ２２にて、解析部１２は、ジニ係数を算出したいキーの値をスプリント毎に集計する。例えば、キーとしてコミットライン数を用いると、スプリント１のライン数、スプリント２のライン数、・・・、スプリントＸのライン数が得られる。コミットライン数は一例でありこれに限定するものではない。ファイル数、コミット数などのコミット履歴から取得可能なデータをキーとして用いることができる。

　ステップＳ２３にて、解析部１２は、集計された値をもとにジニ係数を算出する。解析対象となる集団の数値をｘ＝｛ｘ１，ｘ２，・・・，ｘｎ｝と表すと、以下の式でスプリントｎのジニ係数を算出可能である。

　解析部１２は、ステップＳ２２，Ｓ２３を必要なだけ繰り返す。例えば、ソフトウェア開発がスプリントＸまで行われていた場合、ステップＳ２２，Ｓ２３を繰り返してスプリント１からスプリントＸまでのジニ係数を算出する。

　ステップＳ２４にて、解析部１２は、スプリント間のジニ係数の差分を算出する。差分が一定範囲内の場合は、安定して同等の成果物が創出できていると判断できる。差分が一定以上に増加している場合は、開発チームに負荷が掛かっている可能性がある。差分が一定以上に減少している場合は、開発チームに成果創出の課題が発生している可能性がある。

　ステップＳ３にて、表示部１３は、統計情報を可視化して表示する。

　図７に、スプリント毎のジニ係数の表示例を示す。符号１１０で示すスプリント１では、ジニ係数の算出にスプリント１のデータのみを用いるので、ジニ係数は０（偏在性無し）となる。符号１２０で示すスプリント７までの区間では、ジニ係数が上昇しているので、成果物の大量創出があったと考えられる。符号１３０で示すスプリント８から１４までの区間は、ジニ係数が安定しており、一定の成果を創出していることが分かる。符号１４０で示すスプリント１５から、再度、ジニ係数が上昇している。

　次に、コミット履歴を解析する前に行う前処理について説明する。

　コミット履歴の前処理として、取得部１１は、除外条件に合致するコミット履歴を除外してもよい。

　スプリントの途中で継続的インテグレーション（ＣＩ）ツールによる自動コミットが追加されることがある。この場合、取得部１１の取得したコミット履歴には、開発チームによる成果を示すコミット履歴以外のコミット履歴が混在し、開発チームとしての安定性の測定に影響が出てしまう。そこで、取得部１１は、例えば、コミットメッセージに「ａｕｔｏ」という文字が入っているコミット履歴を除外する。これにより、ＣＩによる自動コミットのコミット履歴を処理対象から除外できる。

　また別の例として、図８の対数ヒストグラムの符号１５０で示す部分は、大量のライン数を一回のコミットで実施しており、解析の妨げとなると考えられる。図８では、修正ライン数のｌｏｇ１０を横軸としている。したがって、例えば符号１５０内の横軸が５の階級では、１０の５乗（１０万）行を１回のコミットで修正していることになる。そこで、取得部１１は、１回のコミットにおける修正ライン数が大きすぎるコミット履歴を除外する。これにより、異常コミットと思われるコミット履歴を処理対象から除外できる。

　このように、前処理として除外条件に合致するコミット履歴を分析対象から除外することで、開発チームの安定性を客観的に測定することが可能となる。

　コミット履歴の前処理として、取得部１１は、コミット履歴のコミット著者の名前の表記揺れを是正してもよい。

　例えば、バージョン管理システムとして広く利用されているＧｉｔでは、コミット者の名前を任意に設定できる。開発担当者が複数の開発環境（例えばデスクトップとサーバ）を利用して開発している場合、開発環境毎に名前の表記揺れが発生する可能性がある。解析部１２が開発担当者毎の統計情報を集計する場合、名前の表記揺れが発生すると、コミット履歴の分析に影響が出てしまう。

　そこで、取得部１１は、コミット履歴のコミット著者を変換して表記揺れを是正する。例えば、コミット履歴からコミット著者を抽出し、同一人物であって複数のコミット著者を含むものについて、コミット著者の変換前／変換後の正誤表を作成しておく。取得部１１は、正誤表を用いて機械的にコミット著者の名前を変換する。

　あるいは、開発チームに存在している開発担当者の名前の一覧を作成しておく。取得部１１は、一覧に記載されている名前とコミット著者の名前の標準化レーベンシュタイン距離を算出し、算出された標準化レーベンシュタイン距離が閾値より小さい、かつ、最小となる名前に変換する。取得部１１は、一覧に記載されている名前とコミット著者の名前のジャロウィンクラー距離を算出し、算出されたジャロウィンクラー距離が閾値より大きい、かつ、最大となる名前に変換してもよい。なお、表記揺れの是正方法は上記に限るものではない。

　以上説明したように、本実施形態の分析装置１は、スプリントを繰り返して実施するソフトウェア開発チームの成果を分析する分析装置であって、ソフトウェア開発チームの成果物を格納する開発リポジトリ２からコミット履歴を取得する取得部１１と、スプリントの単位でコミット履歴を集計して統計情報を算出する解析部１２と、統計情報を表示する表示部１３を備える。また、解析部１２は、ソフトウェア開発チームの成果の偏在性をスプリントの単位でみたジニ係数を算出する。これにより、継続的な成果創出についての偏在性を定量的に可視化でき、開発チームにおける生産性と安定性の客観的な評価が可能となる。その結果、アジャイル開発の効率的なマネジメントを可能にできる。

　上記説明した分析装置１には、例えば、図９に示すような、中央演算処理装置（ＣＰＵ）９０１と、メモリ９０２と、ストレージ９０３と、通信装置９０４と、入力装置９０５と、出力装置９０６とを備える汎用的なコンピュータシステムを用いることができる。このコンピュータシステムにおいて、ＣＰＵ９０１がメモリ９０２上にロードされた所定のプログラムを実行することにより、分析装置１が実現される。このプログラムは磁気ディスク、光ディスク、半導体メモリ等のコンピュータ読み取り可能な記録媒体に記録することも、ネットワークを介して配信することもできる。

　１…分析装置
　１１…取得部
　１２…解析部
　１３…表示部

Claims

　開発サイクルを繰り返して実施するソフトウェア開発チームの成果を分析する分析装置であって、
　前記ソフトウェア開発チームの成果物を格納する開発リポジトリからコミット履歴を取得する取得部と、
　前記開発サイクルの単位で前記コミット履歴を集計して統計情報を算出する解析部と、
　前記統計情報を表示する表示部を備える
　分析装置。
　請求項１に記載の分析装置であって、
　前記解析部は、前記ソフトウェア開発チームの成果の偏在性を前記開発サイクルの単位でみたジニ係数を算出する
　分析装置。
　請求項１または２に記載の分析装置であって、
　前記取得部は、除外条件に合致する前記コミット履歴を除外する
　分析装置。
　請求項１ないし３のいずれかに記載の分析装置であって、
　前記取得部は、前記コミット履歴に含まれる名前の表記揺れを是正する
　分析装置。
　開発サイクルを繰り返して実施するソフトウェア開発チームの成果を分析する分析方法であって、
　コンピュータが、
　前記ソフトウェア開発チームの成果物を格納する開発リポジトリからコミット履歴を取得し、
　前記開発サイクルの単位で前記コミット履歴を集計して統計情報を算出し、
　前記統計情報を表示する
　分析方法。
　請求項１ないし４のいずれかに記載の分析装置の各部としてコンピュータを動作させるプログラム。