JP7131199B2 - クロスプロジェクト学習のための関連ソフトウェアプロジェクトの自動識別 - Google Patents
クロスプロジェクト学習のための関連ソフトウェアプロジェクトの自動識別 Download PDFInfo
- Publication number
- JP7131199B2 JP7131199B2 JP2018156256A JP2018156256A JP7131199B2 JP 7131199 B2 JP7131199 B2 JP 7131199B2 JP 2018156256 A JP2018156256 A JP 2018156256A JP 2018156256 A JP2018156256 A JP 2018156256A JP 7131199 B2 JP7131199 B2 JP 7131199B2
- Authority
- JP
- Japan
- Prior art keywords
- target
- project
- target project
- projects
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/71—Version control; Configuration management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
- G06F8/33—Intelligent editors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/75—Structural analysis for program understanding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/20—Software design
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Debugging And Monitoring (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(外1)
と表せる。クエリベクトルは
(外2)
と表せる。クエリベクトルとドキュメントベクトルは、例示のBM25表現にしたがって、
(付記1) 対象プロジェクトを改善するクロスプロジェクト学習の方法であって、
ターゲットプロジェクト候補データベースが、一以上のターゲットプロジェクト候補のフィーチャ情報を含むフィーチャにアクセスすることと、
サーバが、対象プロジェクトのフィーチャ情報を含むフィーチャにアクセスすることであって、前記ターゲットプロジェクト候補と前記対象プロジェクトはソフトウェアプログラムである、ことと、
前記ターゲットプロジェクト候補の各々のフィーチャ情報と、前記対象プロジェクトのフィーチャ情報との間の類似度スコアを決定することであって、類似度スコアは前記ターゲットプロジェクト候補の各々の各フィーチャに対して決定される、ことと、
前記ターゲットプロジェクト候補の各フィーチャの類似度スコアを合計して、前記ターゲットプロジェクト候補の各々の合計類似度スコアを生成することと、
前記合計類似度スコアにより前記ターゲットプロジェクト候補をソートすることと、
前記合計類似度スコアが閾値より低いターゲットプロジェクト候補をフィルタすることと、
前記合計類似度スコアが前記閾値以上のターゲットプロジェクト候補を含む類似ターゲットプロジェクトのセットを生成することと、
前記類似ターゲットプロジェクトに基づいて対象プロジェクト中の不具合を特定することと、
前記類似ターゲットプロジェクトに基づいて、前記対象プロジェクト中の不具合を修復するコードを推奨することと、
推奨されたコードを前記対象プロジェクトに実装して前記不具合を修復することにより前記対象プロジェクトを修正することとを含む、
方法。
(付記2) 修正された対象プロジェクトをテストする新しいデータを生成することと、
前記対象プロジェクト中の他の不具合を予測することと、
のうち一方または両方を含む、付記1に記載の方法。
(付記3) 所定性能標準を用いて、修正された対象プロジェクトを検証することをさらに含み、前記所定性能標準は、前記対象プロジェクトが修正される前の前記対象プロジェクトの性能に基づく、
付記1に記載の方法。
(付記4) 前記ターゲットプロジェクト候補のフィーチャと、前記対象プロジェクトのフィーチャとは、プロジェクト説明、クラス名、メソッド名、変数名、依存API名、コメント、又は外部ライブラリを含み、
前記フィーチャ情報は、前記フィーチャに対応するテキスト情報と構造情報とを含む、
付記1に記載の方法。
(付記5) 生成された類似ターゲットプロジェクトのセットは、
合計類似度スコアが上位のパーセンテージにランクされたターゲットプロジェクト候補と、
合計類似度スコアがすべての合計類似度スコアの上位にランクされたターゲットプロジェクト候補と、
合計類似度スコアが合計類似度スコア閾値以上のターゲットプロジェクト候補とを含む、
付記1に記載の方法。
(付記6) 前記ターゲットプロジェクト候補のフィーチャにアクセスすることと、前記対象プロジェクトのフィーチャにアクセスすることとは、
前記ターゲットプロジェクト候補のフィーチャのソースコード、テストケース、及びリードミーファイルのうち一以上または組み合わせを解析することと、
それからテキスト情報と構造情報とを抽出して、ドキュメントとクエリとを構成することと、
前記クエリと前記ドキュメントとをインデックスすることとを含み、
前記ドキュメントは前記ターゲットプロジェクト候補のフィーチャに対応し、前記クエリは前記対象プロジェクトのフィーチャに対応する、
付記1に記載の方法。
(付記7) 前記類似度スコアを決定することは、数式
x1’は前記ターゲットプロジェクト候補の1つのドキュメント中の言葉のBM25ベースの重みを表し、
y1’は前記対象プロジェクトのクエリ中の言葉のBM25ベースの重みを表し、
s()は類似度スコアを計算する関数を表し、
tfd(xi)は前記ターゲットプロジェクト候補の1つのドキュメント中のi番目の言葉の平滑化された語出現頻度を表し、
tfq(yi)は前記対象プロジェクトのクエリ中のi番目の言葉の平滑化された語出現頻度を表し、
idf(ti)はi番目の言葉tの逆文書頻度を表し、
xは語出現頻度を表し、
yは語出現頻度を表し、
dfベクトルはドキュメントベクトルを表し、
qfベクトルはクエリベクトルを表し、
bはスケーリング係数を表し、
ldはドキュメント長を表し、
lcは平均ドキュメント長を表し、
ntは言葉tを有するターゲットプロジェクト候補中のドキュメント数を表し、
Nはディクショナリ中の単語の総数を表し、
×はスカラー乗算である、
付記1に記載の方法。
(付記8) 各ターゲットプロジェクト候補の合計類似度スコアを決定することは、数式
s’()は合計類似度を表し、
wfは加重係数を表し、
fieldsはフィーチャと等価である、
付記7に記載の方法。
(付記9) 前記類似度スコアを決定する前に、前記フィーチャ情報を前処理することをさらに含み、前記前処理することは、
識別子名を分離することと、
ストップワードを削除することと、
一以上の残った言葉をステミングすることとを含む、
付記1に記載の方法。
(付記10) 前記類似度スコアを決定することは、
前記対象プロジェクトのフィーチャ情報から得られたクエリタームを含むクエリベクトルを構成することと、
前記ターゲットプロジェクト候補のフィーチャ情報から得られたドキュメントタームを含むドキュメントベクトルを構成することと、
ターゲットプロジェクト候補中のフィーチャを選択することであって、選択されるフィーチャは前記ドキュメントベクトル中のドキュメントタームを含む、ことと、
選択されたフィーチャに対して、前記クエリベクトルと前記ドキュメントベクトルとの間のコサイン類似度を決定することと、
選択されたフィーチャのコサイン類似度を合計スコアに加えることとを含む、
付記1に記載の方法。
(付記11) 動作を実行するように、又は動作の実行を制御するように、一以上のプロセッサにより実行可能なプログラミングコードをエンコードされた非一時的コンピュータ可読媒体であって、前記動作は、
ターゲットプロジェクト候補データベースが、一以上のターゲットプロジェクト候補のフィーチャ情報を含むフィーチャにアクセスすることと、
サーバが、対象プロジェクトのフィーチャ情報を含むフィーチャにアクセスすることであって、前記ターゲットプロジェクト候補と前記対象プロジェクトはソフトウェアプログラムである、ことと、
前記ターゲットプロジェクト候補の各々のフィーチャ情報と、前記対象プロジェクトのフィーチャ情報との間の類似度スコアを決定することであって、類似度スコアは前記ターゲットプロジェクト候補の各々の各フィーチャに対して決定される、ことと、
前記ターゲットプロジェクト候補の各フィーチャの類似度スコアを合計して、前記ターゲットプロジェクト候補の各々の合計類似度スコアを生成することと、
前記合計類似度スコアにより前記ターゲットプロジェクト候補をソートすることと、
前記合計類似度スコアが閾値より低いターゲットプロジェクト候補をフィルタすることと、
前記合計類似度スコアが前記閾値以上のターゲットプロジェクト候補を含む類似ターゲットプロジェクトのセットを生成することと、
前記類似ターゲットプロジェクトに基づいて対象プロジェクト中の不具合を特定することと、
前記類似ターゲットプロジェクトに基づいて、前記対象プロジェクト中の不具合を修復するコードを推奨することと、
推奨されたコードを前記対象プロジェクトに実装して前記不具合を修復することにより前記対象プロジェクトを修正することとを含む、
非一時的コンピュータ可読媒体。
(付記12) 前記動作は、
修正された対象プロジェクトをテストする新しいデータを生成することと、
前記対象プロジェクト中の他の不具合を予測することと、のうち一方または両方をさらに含む、
付記11に記載の非一時的コンピュータ可読媒体。
(付記13) 前記動作は、所定性能標準を用いて、修正された対象プロジェクトを検証することをさらに含み、
前記所定性能標準は、前記対象プロジェクトが修正される前の、前記対象プロジェクトの性能に基づく、
付記11に記載の非一時的コンピュータ可読媒体。
(付記14) 前記ターゲットプロジェクト候補のフィーチャと、前記対象プロジェクトのフィーチャとは、プロジェクト説明、クラス名、メソッド名、変数名、依存API名、コメント、又は外部ライブラリを含み、
前記フィーチャ情報は、前記フィーチャに対応するテキスト情報と構造情報とを含む、
付記11に記載の非一時的コンピュータ可読媒体。
(付記15) 生成された類似ターゲットプロジェクトのセットは、
合計類似度スコアが上位パーセンテージにランクされたターゲットプロジェクト候補と、
合計類似度スコアがすべての合計類似度スコアの上位にランクされたターゲットプロジェクト候補と、
合計類似度スコアが合計類似度スコア閾値以上のターゲットプロジェクト候補とを含む、
付記11に記載の非一時的コンピュータ可読媒体。
(付記16) 前記ターゲットプロジェクト候補のフィーチャにアクセスすることと、前記対象プロジェクトのフィーチャにアクセスすることとは、
前記ターゲットプロジェクト候補のフィーチャのソースコード、テストケース、及びリードミーファイルのうち一以上または組み合わせを解析することと、
それからテキスト情報と構造情報とを抽出して、ドキュメントとクエリとを構成することと、
前記クエリと前記ドキュメントとをインデックスすることとを含み、
前記ドキュメントは前記ターゲットプロジェクト候補のフィーチャに対応し、前記クエリは前記対象プロジェクトのフィーチャに対応する、
付記11に記載の非一時的コンピュータ可読媒体。
(付記17) 前記類似度スコアを決定することは、数式
x1’は前記ターゲットプロジェクト候補の1つのドキュメント中の言葉の達M25ベースの重みを表し、
y1’は前記対象プロジェクトのクエリ中の言葉のBM25ベースの重みを表し、
s()は類似度スコアを計算する関数を表し、
tfd(xi)は前記ターゲットプロジェクト候補の1つのドキュメント中のi番目の言葉の平滑化された語出現頻度を表し、
tfq(yi)は前記対象プロジェクトのクエリ中のi番目の言葉の平滑化された語出現頻度を表し、
idf(ti)はi番目の言葉tの逆文書頻度を表し、
xは語出現頻度を表し、
yは語出現頻度を表し、
dfベクトルはドキュメントベクトルを表し、
qfベクトルはクエリベクトルを表し、
bはスケーリング係数を表し、
ldはドキュメント長を表し、
lcは平均ドキュメント長を表し、
ntは言葉tを有するターゲットプロジェクト候補中のドキュメント数を表し、
Nはディクショナリ中の単語の総数を表し、
×はスカラー乗算である、
付記11に記載の非一時的コンピュータ可読媒体。
(付記18) 各ターゲットプロジェクト候補の合計類似度スコアを決定することは、数式
s’()は合計類似度を表し、
wfは加重係数を表し、
fieldsはフィーチャと等価である、
付記17に記載の非一時的コンピュータ可読媒体。
(付記19) 前記動作は、前記類似度スコアを決定する前に、前記フィーチャ情報を前処理することをさらに含み、
前記前処理することは、
識別子名を分離することと、
ストップワードを削除することと、
一以上の残った言葉をステミングすることとを含む、
付記11に記載の非一時的コンピュータ可読媒体。
(付記20) 前記類似度スコアを決定することは、
前記対象プロジェクトのフィーチャ情報から得られたクエリタームを含むクエリベクトルを構成することと、
前記ターゲットプロジェクト候補のフィーチャ情報から得られたドキュメントタームを含むドキュメントベクトルを構成することと、
ターゲットプロジェクト候補中のフィーチャを選択することであって、選択されるフィーチャは前記ドキュメントベクトル中のドキュメントタームを含む、ことと、
選択されたフィーチャに対して、前記クエリベクトルと前記ドキュメントベクトルとの間のコサイン類似度を決定することと、
選択されたフィーチャのコサイン類似度を合計スコアに加えることとを含む、
付記11に記載の非一時的コンピュータ可読媒体。
Claims (9)
- コンピュータによる、対象プロジェクトを改善するクロスプロジェクト学習の方法であって、
前記コンピュータの一以上のプロセッサが、
ターゲットプロジェクト候補データベースが、一以上のターゲットプロジェクト候補のフィーチャ情報を含むフィーチャにアクセスすることと、
サーバが、対象プロジェクトのフィーチャ情報を含むフィーチャにアクセスすることであって、前記ターゲットプロジェクト候補と前記対象プロジェクトはソフトウェアプログラムである、ことと、
前記ターゲットプロジェクト候補の各々のフィーチャ情報と、前記対象プロジェクトのフィーチャ情報との間の類似度スコアを決定することであって、類似度スコアは前記ターゲットプロジェクト候補の各々の各フィーチャに対して決定される、ことと、
前記ターゲットプロジェクト候補の各フィーチャの類似度スコアを合計して、前記ターゲットプロジェクト候補の各々の合計類似度スコアを生成することと、
前記合計類似度スコアにより前記ターゲットプロジェクト候補をソートすることと、
前記合計類似度スコアが閾値より低いターゲットプロジェクト候補をフィルタすることと、
前記合計類似度スコアが前記閾値以上のターゲットプロジェクト候補を含む類似ターゲットプロジェクトのセットを生成することと、
前記類似ターゲットプロジェクトに基づいて対象プロジェクト中の不具合を特定することと、
前記類似ターゲットプロジェクトに基づいて、前記対象プロジェクト中の不具合を修復するコードを推奨することと、
推奨されたコードを前記対象プロジェクトに実装して前記不具合を修復することにより前記対象プロジェクトを修正することとを含む、
方法。 - 前記コンピュータの一以上のプロセッサが、
修正された対象プロジェクトをテストする新しいデータを生成することと、
前記対象プロジェクト中の他の不具合を予測することと、
のうち一方または両方を含む、請求項1に記載の方法。 - 前記コンピュータの一以上のプロセッサが、
所定性能標準を用いて、修正された対象プロジェクトを検証することをさらに含み、前記所定性能標準は、前記対象プロジェクトが修正される前の前記対象プロジェクトの性能に基づく、
請求項1に記載の方法。 - 前記ターゲットプロジェクト候補のフィーチャと、前記対象プロジェクトのフィーチャとは、プロジェクト説明、クラス名、メソッド名、変数名、依存API名、コメント、又は外部ライブラリを含み、
前記フィーチャ情報は、前記フィーチャに対応するテキスト情報と構造情報とを含む、
請求項1に記載の方法。 - 生成された類似ターゲットプロジェクトのセットは、
合計類似度スコアが上位のパーセンテージにランクされたターゲットプロジェクト候補と、
合計類似度スコアがすべての合計類似度スコアの上位にランクされたターゲットプロジェクト候補と、
合計類似度スコアが合計類似度スコア閾値以上のターゲットプロジェクト候補とを含む、
請求項1に記載の方法。 - 前記コンピュータの一以上のプロセッサが、
前記ターゲットプロジェクト候補のフィーチャにアクセスすることと、前記対象プロジェクトのフィーチャにアクセスすることとは、
前記コンピュータの一以上のプロセッサが、
前記ターゲットプロジェクト候補のフィーチャのソースコード、テストケース、及びリードミーファイルのうち一以上または組み合わせを解析することと、
それからテキスト情報と構造情報とを抽出して、ドキュメントとクエリとを構成することと、
前記クエリと前記ドキュメントとをインデックスすることとを含み、
前記ドキュメントは前記ターゲットプロジェクト候補のフィーチャに対応し、前記クエリは前記対象プロジェクトのフィーチャに対応する、
請求項1に記載の方法。 - 前記コンピュータの一以上のプロセッサが、
前記類似度スコアを決定することは、数式
により実行され、
x1’は前記ターゲットプロジェクト候補の1つのドキュメント中の言葉のBM25ベースの重みを表し、
y1’は前記対象プロジェクトのクエリ中の言葉のBM25ベースの重みを表し、
s()は類似度スコアを計算する関数を表し、
tfd(xi)は前記ターゲットプロジェクト候補の1つのドキュメント中のi番目の言葉の平滑化された語出現頻度を表し、
tfq(yi)は前記対象プロジェクトのクエリ中のi番目の言葉の平滑化された語出現頻度を表し、
idf(ti)はi番目の言葉tの逆文書頻度を表し、
xは語出現頻度を表し、
yは語出現頻度を表し、
dfベクトルはドキュメントベクトルを表し、
qfベクトルはクエリベクトルを表し、
bはスケーリング係数を表し、
ldはドキュメント長を表し、
lcは平均ドキュメント長を表し、
ntは言葉tを有するターゲットプロジェクト候補中のドキュメント数を表し、
Nはディクショナリ中の単語の総数を表し、
×はスカラー乗算である、
請求項1に記載の方法。 - 前記コンピュータの一以上のプロセッサが、
前記類似度スコアを決定することは、
前記対象プロジェクトのフィーチャ情報から得られたクエリタームを含むクエリベクトルを構成することと、
前記ターゲットプロジェクト候補のフィーチャ情報から得られたドキュメントタームを含むドキュメントベクトルを構成することと、
ターゲットプロジェクト候補中のフィーチャを選択することであって、選択されるフィーチャは前記ドキュメントベクトル中のドキュメントタームを含む、ことと、
選択されたフィーチャに対して、前記クエリベクトルと前記ドキュメントベクトルとの間のコサイン類似度を決定することと、
選択されたフィーチャのコサイン類似度を合計スコアに加えることとを含む、
請求項1に記載の方法。 - コンピュータプログラムであって、コンピュータの一以上のプロセッサに、
ターゲットプロジェクト候補データベースが、一以上のターゲットプロジェクト候補のフィーチャ情報を含むフィーチャにアクセスすることと、
サーバが、対象プロジェクトのフィーチャ情報を含むフィーチャにアクセスすることであって、前記ターゲットプロジェクト候補と前記対象プロジェクトはソフトウェアプログラムである、ことと、
前記ターゲットプロジェクト候補の各々のフィーチャ情報と、前記対象プロジェクトのフィーチャ情報との間の類似度スコアを決定することであって、類似度スコアは前記ターゲットプロジェクト候補の各々の各フィーチャに対して決定される、ことと、
前記ターゲットプロジェクト候補の各フィーチャの類似度スコアを合計して、前記ターゲットプロジェクト候補の各々の合計類似度スコアを生成することと、
前記合計類似度スコアにより前記ターゲットプロジェクト候補をソートすることと、
前記合計類似度スコアが閾値より低いターゲットプロジェクト候補をフィルタすることと、
前記合計類似度スコアが前記閾値以上のターゲットプロジェクト候補を含む類似ターゲットプロジェクトのセットを生成することと、
前記類似ターゲットプロジェクトに基づいて対象プロジェクト中の不具合を特定することと、
前記類似ターゲットプロジェクトに基づいて、前記対象プロジェクト中の不具合を修復するコードを推奨することと、
推奨されたコードを前記対象プロジェクトに実装して前記不具合を修復することにより前記対象プロジェクトを修正することとを実行させる、
コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/908346 | 2018-02-28 | ||
US15/908,346 US10521224B2 (en) | 2018-02-28 | 2018-02-28 | Automatic identification of relevant software projects for cross project learning |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019153270A JP2019153270A (ja) | 2019-09-12 |
JP7131199B2 true JP7131199B2 (ja) | 2022-09-06 |
Family
ID=67684519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018156256A Active JP7131199B2 (ja) | 2018-02-28 | 2018-08-23 | クロスプロジェクト学習のための関連ソフトウェアプロジェクトの自動識別 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10521224B2 (ja) |
JP (1) | JP7131199B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200371778A1 (en) * | 2019-05-21 | 2020-11-26 | X Development Llc | Automated identification of code changes |
US10782941B1 (en) * | 2019-06-20 | 2020-09-22 | Fujitsu Limited | Refinement of repair patterns for static analysis violations in software programs |
US20210089992A1 (en) * | 2019-09-20 | 2021-03-25 | Nec Laboratories America, Inc. | Method for automated code reviewer recommendation |
CN110751186B (zh) * | 2019-09-26 | 2022-04-08 | 北京航空航天大学 | 一种基于监督式表示学习的跨项目软件缺陷预测方法 |
US11416245B2 (en) * | 2019-12-04 | 2022-08-16 | At&T Intellectual Property I, L.P. | System and method for syntax comparison and analysis of software code |
KR102156931B1 (ko) * | 2020-01-16 | 2020-09-16 | 주식회사 소프트센 | 블록 코딩된 프로그램 코드의 평가 장치, 시스템, 방법 및 기록 매체에 저장된 프로그램 |
CN111367801A (zh) * | 2020-02-29 | 2020-07-03 | 杭州电子科技大学 | 一种面向跨公司软件缺陷预测的数据变换方法 |
US11630649B2 (en) | 2020-06-02 | 2023-04-18 | International Business Machines Corporation | Intelligent application library management |
CN111966586A (zh) * | 2020-08-05 | 2020-11-20 | 南通大学 | 一种基于模块选择和权重更新的跨项目缺陷预测方法 |
US11551151B2 (en) | 2020-09-02 | 2023-01-10 | Fujitsu Limited | Automatically generating a pipeline of a new machine learning project from pipelines of existing machine learning projects stored in a corpus |
US11403304B2 (en) | 2020-09-02 | 2022-08-02 | Fujitsu Limited | Automatically curating existing machine learning projects into a corpus adaptable for use in new machine learning projects |
CN113176998A (zh) * | 2021-05-10 | 2021-07-27 | 南通大学 | 基于源选择的跨项目软件缺陷预测方法 |
CN113392184A (zh) * | 2021-06-09 | 2021-09-14 | 平安科技(深圳)有限公司 | 一种相似文本的确定方法、装置、终端设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070266367A1 (en) | 2004-01-07 | 2007-11-15 | International Business Machines Corporation | Relationship Management For Data Modeling In An Integrated Development Environment |
JP2014127036A (ja) | 2012-12-26 | 2014-07-07 | Fujitsu Ltd | 情報処理プログラム、情報処理方法及び装置 |
JP2017111486A (ja) | 2015-12-14 | 2017-06-22 | 富士通株式会社 | 予兆検知プログラム、装置、及び方法 |
JP2017151977A (ja) | 2016-02-23 | 2017-08-31 | 富士通株式会社 | ソフトウエアプログラムの修復のための方法及びプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4142881B2 (ja) * | 2002-03-07 | 2008-09-03 | 富士通株式会社 | 文書類似度算出装置、クラスタリング装置および文書抽出装置 |
US7735068B2 (en) * | 2005-12-01 | 2010-06-08 | Infosys Technologies Ltd. | Automated relationship traceability between software design artifacts |
JP2011165118A (ja) * | 2010-02-15 | 2011-08-25 | Hitachi Ltd | プロジェクト支援方法及びその装置並びにその実行プログラム |
US20120054117A1 (en) * | 2010-08-27 | 2012-03-01 | Christopher Peltz | Identifying an individual in response to a query seeking to locate personnel with particular experience |
US20120197674A1 (en) * | 2011-01-27 | 2012-08-02 | Maher Rahmouni | Estimating a future project characteristic based on the similarity of past projects |
US20130041711A1 (en) * | 2011-08-09 | 2013-02-14 | Bank Of America Corporation | Aligning project deliverables with project risks |
US8881104B2 (en) * | 2012-04-09 | 2014-11-04 | Accenture Global Services Limited | Component discovery from source code |
US20140115565A1 (en) * | 2012-10-18 | 2014-04-24 | Microsoft Corporation | Test similarity detection with method call sequence analysis |
JP2017010476A (ja) * | 2015-06-26 | 2017-01-12 | 三菱電機株式会社 | 類似判定装置、類似判定方法及び類似判定プログラム |
US10218728B2 (en) * | 2016-06-21 | 2019-02-26 | Ebay Inc. | Anomaly detection for web document revision |
US10635693B2 (en) * | 2016-11-11 | 2020-04-28 | International Business Machines Corporation | Efficiently finding potential duplicate values in data |
US10782964B2 (en) * | 2017-06-29 | 2020-09-22 | Red Hat, Inc. | Measuring similarity of software components |
-
2018
- 2018-02-28 US US15/908,346 patent/US10521224B2/en active Active
- 2018-08-23 JP JP2018156256A patent/JP7131199B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070266367A1 (en) | 2004-01-07 | 2007-11-15 | International Business Machines Corporation | Relationship Management For Data Modeling In An Integrated Development Environment |
JP2014127036A (ja) | 2012-12-26 | 2014-07-07 | Fujitsu Ltd | 情報処理プログラム、情報処理方法及び装置 |
JP2017111486A (ja) | 2015-12-14 | 2017-06-22 | 富士通株式会社 | 予兆検知プログラム、装置、及び方法 |
JP2017151977A (ja) | 2016-02-23 | 2017-08-31 | 富士通株式会社 | ソフトウエアプログラムの修復のための方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
NGUYEN, Hoan anh et al,Using Topic Model to Suggest Fine-grained Source Code Changes,2016 IEEEInternational Conference on Software Maintenance and Evolution(ICSME),米国,IEEE,2017年01月16日,pp.200-210,ISBN:978-1-5090-3806-0 |
Also Published As
Publication number | Publication date |
---|---|
JP2019153270A (ja) | 2019-09-12 |
US10521224B2 (en) | 2019-12-31 |
US20190265970A1 (en) | 2019-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7131199B2 (ja) | クロスプロジェクト学習のための関連ソフトウェアプロジェクトの自動識別 | |
Jiang et al. | Shaping program repair space with existing patches and similar code | |
US9298453B2 (en) | Source code analytics platform using program analysis and information retrieval | |
Higo et al. | Incremental code clone detection: A PDG-based approach | |
Nguyen et al. | A study of repetitiveness of code changes in software evolution | |
Kim et al. | Automatic patch generation with context-based change application | |
EP3674918B1 (en) | Column lineage and metadata propagation | |
JP2020126641A (ja) | Apiマッシュアップ探査及びリコメンデーション | |
Wu et al. | An Iterative Approach to Synthesize Data Transformation Programs. | |
Islam et al. | How bugs are fixed: Exposing bug-fix patterns with edits and nesting levels | |
Richter et al. | Tssb-3m: Mining single statement bugs at massive scale | |
Vagavolu et al. | A mocktail of source code representations | |
Di Grazia et al. | DiffSearch: A scalable and precise search engine for code changes | |
Barbosa et al. | An approach to clustering and sequencing of textual requirements | |
Hegedűs et al. | Static code analysis alarms filtering reloaded: A new real-world dataset and its ML-based utilization | |
US20230385037A1 (en) | Method and system for automated discovery of artificial intelligence (ai)/ machine learning (ml) assets in an enterprise | |
Zou et al. | SCVD: A new semantics-based approach for cloned vulnerable code detection | |
Satter et al. | A similarity-based method retrieval technique to improve effectiveness in code search | |
Misu et al. | An exploratory study on interface similarities in code clones | |
Ma et al. | Capturing the long-distance dependency in the control flow graph via structural-guided attention for bug localization | |
WO2018220688A1 (ja) | 辞書生成装置、辞書生成方法、及びプログラム | |
US8214336B2 (en) | Preservation of digital content | |
Kumar et al. | Code clone detection and analysis using software metrics and neural network-a literature review | |
Eghbali et al. | De-Hallucinator: Iterative Grounding for LLM-Based Code Completion | |
Udagawa | Source code retrieval using sequence based similarity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220506 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220726 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7131199 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |