JP2019153270A - クロスプロジェクト学習のための関連ソフトウェアプロジェクトの自動識別 - Google Patents
クロスプロジェクト学習のための関連ソフトウェアプロジェクトの自動識別 Download PDFInfo
- Publication number
- JP2019153270A JP2019153270A JP2018156256A JP2018156256A JP2019153270A JP 2019153270 A JP2019153270 A JP 2019153270A JP 2018156256 A JP2018156256 A JP 2018156256A JP 2018156256 A JP2018156256 A JP 2018156256A JP 2019153270 A JP2019153270 A JP 2019153270A
- Authority
- JP
- Japan
- Prior art keywords
- target project
- project
- target
- similarity score
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/71—Version control; Configuration management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
- G06F8/33—Intelligent editors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/75—Structural analysis for program understanding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/20—Software design
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Debugging And Monitoring (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
(外1)
と表せる。クエリベクトルは
(外2)
と表せる。クエリベクトルとドキュメントベクトルは、例示のBM25表現にしたがって、
(付記1) 対象プロジェクトを改善するクロスプロジェクト学習の方法であって、
ターゲットプロジェクト候補データベースが、一以上のターゲットプロジェクト候補のフィーチャ情報を含むフィーチャにアクセスすることと、
サーバが、対象プロジェクトのフィーチャ情報を含むフィーチャにアクセスすることであって、前記ターゲットプロジェクト候補と前記対象プロジェクトはソフトウェアプログラムである、ことと、
前記ターゲットプロジェクト候補の各々のフィーチャ情報と、前記対象プロジェクトのフィーチャ情報との間の類似度スコアを決定することであって、類似度スコアは前記ターゲットプロジェクト候補の各々の各フィーチャに対して決定される、ことと、
前記ターゲットプロジェクト候補の各フィーチャの類似度スコアを合計して、前記ターゲットプロジェクト候補の各々の合計類似度スコアを生成することと、
前記合計類似度スコアにより前記ターゲットプロジェクト候補をソートすることと、
前記合計類似度スコアが閾値より低いターゲットプロジェクト候補をフィルタすることと、
前記合計類似度スコアが前記閾値以上のターゲットプロジェクト候補を含む類似ターゲットプロジェクトのセットを生成することと、
前記類似ターゲットプロジェクトに基づいて対象プロジェクト中の不具合を特定することと、
前記類似ターゲットプロジェクトに基づいて、前記対象プロジェクト中の不具合を修復するコードを推奨することと、
推奨されたコードを前記対象プロジェクトに実装して前記不具合を修復することにより前記対象プロジェクトを修正することとを含む、
方法。
(付記2) 修正された対象プロジェクトをテストする新しいデータを生成することと、
前記対象プロジェクト中の他の不具合を予測することと、
のうち一方または両方を含む、付記1に記載の方法。
(付記3) 所定性能標準を用いて、修正された対象プロジェクトを検証することをさらに含み、前記所定性能標準は、前記対象プロジェクトが修正される前の前記対象プロジェクトの性能に基づく、
付記1に記載の方法。
(付記4) 前記ターゲットプロジェクト候補のフィーチャと、前記対象プロジェクトのフィーチャとは、プロジェクト説明、クラス名、メソッド名、変数名、依存API名、コメント、又は外部ライブラリを含み、
前記フィーチャ情報は、前記フィーチャに対応するテキスト情報と構造情報とを含む、
付記1に記載の方法。
(付記5) 生成された類似ターゲットプロジェクトのセットは、
合計類似度スコアが上位のパーセンテージにランクされたターゲットプロジェクト候補と、
合計類似度スコアがすべての合計類似度スコアの上位にランクされたターゲットプロジェクト候補と、
合計類似度スコアが合計類似度スコア閾値以上のターゲットプロジェクト候補とを含む、
付記1に記載の方法。
(付記6) 前記ターゲットプロジェクト候補のフィーチャにアクセスすることと、前記対象プロジェクトのフィーチャにアクセスすることとは、
前記ターゲットプロジェクト候補のフィーチャのソースコード、テストケース、及びリードミーファイルのうち一以上または組み合わせを解析することと、
それからテキスト情報と構造情報とを抽出して、ドキュメントとクエリとを構成することと、
前記クエリと前記ドキュメントとをインデックスすることとを含み、
前記ドキュメントは前記ターゲットプロジェクト候補のフィーチャに対応し、前記クエリは前記対象プロジェクトのフィーチャに対応する、
付記1に記載の方法。
(付記7) 前記類似度スコアを決定することは、数式
x1’は前記ターゲットプロジェクト候補の1つのドキュメント中の言葉のBM25ベースの重みを表し、
y1’は前記対象プロジェクトのクエリ中の言葉のBM25ベースの重みを表し、
s()は類似度スコアを計算する関数を表し、
tfd(xi)は前記ターゲットプロジェクト候補の1つのドキュメント中のi番目の言葉の平滑化された語出現頻度を表し、
tfq(yi)は前記対象プロジェクトのクエリ中のi番目の言葉の平滑化された語出現頻度を表し、
idf(ti)はi番目の言葉tの逆文書頻度を表し、
xは語出現頻度を表し、
yは語出現頻度を表し、
dfベクトルはドキュメントベクトルを表し、
qfベクトルはクエリベクトルを表し、
bはスケーリング係数を表し、
ldはドキュメント長を表し、
lcは平均ドキュメント長を表し、
ntは言葉tを有するターゲットプロジェクト候補中のドキュメント数を表し、
Nはディクショナリ中の単語の総数を表し、
×はスカラー乗算である、
付記1に記載の方法。
(付記8) 各ターゲットプロジェクト候補の合計類似度スコアを決定することは、数式
s’()は合計類似度を表し、
wfは加重係数を表し、
fieldsはフィーチャと等価である、
付記7に記載の方法。
(付記9) 前記類似度スコアを決定する前に、前記フィーチャ情報を前処理することをさらに含み、前記前処理することは、
識別子名を分離することと、
ストップワードを削除することと、
一以上の残った言葉をステミングすることとを含む、
付記1に記載の方法。
(付記10) 前記類似度スコアを決定することは、
前記対象プロジェクトのフィーチャ情報から得られたクエリタームを含むクエリベクトルを構成することと、
前記ターゲットプロジェクト候補のフィーチャ情報から得られたドキュメントタームを含むドキュメントベクトルを構成することと、
ターゲットプロジェクト候補中のフィーチャを選択することであって、選択されるフィーチャは前記ドキュメントベクトル中のドキュメントタームを含む、ことと、
選択されたフィーチャに対して、前記クエリベクトルと前記ドキュメントベクトルとの間のコサイン類似度を決定することと、
選択されたフィーチャのコサイン類似度を合計スコアに加えることとを含む、
付記1に記載の方法。
(付記11) 動作を実行するように、又は動作の実行を制御するように、一以上のプロセッサにより実行可能なプログラミングコードをエンコードされた非一時的コンピュータ可読媒体であって、前記動作は、
ターゲットプロジェクト候補データベースが、一以上のターゲットプロジェクト候補のフィーチャ情報を含むフィーチャにアクセスすることと、
サーバが、対象プロジェクトのフィーチャ情報を含むフィーチャにアクセスすることであって、前記ターゲットプロジェクト候補と前記対象プロジェクトはソフトウェアプログラムである、ことと、
前記ターゲットプロジェクト候補の各々のフィーチャ情報と、前記対象プロジェクトのフィーチャ情報との間の類似度スコアを決定することであって、類似度スコアは前記ターゲットプロジェクト候補の各々の各フィーチャに対して決定される、ことと、
前記ターゲットプロジェクト候補の各フィーチャの類似度スコアを合計して、前記ターゲットプロジェクト候補の各々の合計類似度スコアを生成することと、
前記合計類似度スコアにより前記ターゲットプロジェクト候補をソートすることと、
前記合計類似度スコアが閾値より低いターゲットプロジェクト候補をフィルタすることと、
前記合計類似度スコアが前記閾値以上のターゲットプロジェクト候補を含む類似ターゲットプロジェクトのセットを生成することと、
前記類似ターゲットプロジェクトに基づいて対象プロジェクト中の不具合を特定することと、
前記類似ターゲットプロジェクトに基づいて、前記対象プロジェクト中の不具合を修復するコードを推奨することと、
推奨されたコードを前記対象プロジェクトに実装して前記不具合を修復することにより前記対象プロジェクトを修正することとを含む、
非一時的コンピュータ可読媒体。
(付記12) 前記動作は、
修正された対象プロジェクトをテストする新しいデータを生成することと、
前記対象プロジェクト中の他の不具合を予測することと、のうち一方または両方をさらに含む、
付記11に記載の非一時的コンピュータ可読媒体。
(付記13) 前記動作は、所定性能標準を用いて、修正された対象プロジェクトを検証することをさらに含み、
前記所定性能標準は、前記対象プロジェクトが修正される前の、前記対象プロジェクトの性能に基づく、
付記11に記載の非一時的コンピュータ可読媒体。
(付記14) 前記ターゲットプロジェクト候補のフィーチャと、前記対象プロジェクトのフィーチャとは、プロジェクト説明、クラス名、メソッド名、変数名、依存API名、コメント、又は外部ライブラリを含み、
前記フィーチャ情報は、前記フィーチャに対応するテキスト情報と構造情報とを含む、
付記11に記載の非一時的コンピュータ可読媒体。
(付記15) 生成された類似ターゲットプロジェクトのセットは、
合計類似度スコアが上位パーセンテージにランクされたターゲットプロジェクト候補と、
合計類似度スコアがすべての合計類似度スコアの上位にランクされたターゲットプロジェクト候補と、
合計類似度スコアが合計類似度スコア閾値以上のターゲットプロジェクト候補とを含む、
付記11に記載の非一時的コンピュータ可読媒体。
(付記16) 前記ターゲットプロジェクト候補のフィーチャにアクセスすることと、前記対象プロジェクトのフィーチャにアクセスすることとは、
前記ターゲットプロジェクト候補のフィーチャのソースコード、テストケース、及びリードミーファイルのうち一以上または組み合わせを解析することと、
それからテキスト情報と構造情報とを抽出して、ドキュメントとクエリとを構成することと、
前記クエリと前記ドキュメントとをインデックスすることとを含み、
前記ドキュメントは前記ターゲットプロジェクト候補のフィーチャに対応し、前記クエリは前記対象プロジェクトのフィーチャに対応する、
付記11に記載の非一時的コンピュータ可読媒体。
(付記17) 前記類似度スコアを決定することは、数式
x1’は前記ターゲットプロジェクト候補の1つのドキュメント中の言葉の達M25ベースの重みを表し、
y1’は前記対象プロジェクトのクエリ中の言葉のBM25ベースの重みを表し、
s()は類似度スコアを計算する関数を表し、
tfd(xi)は前記ターゲットプロジェクト候補の1つのドキュメント中のi番目の言葉の平滑化された語出現頻度を表し、
tfq(yi)は前記対象プロジェクトのクエリ中のi番目の言葉の平滑化された語出現頻度を表し、
idf(ti)はi番目の言葉tの逆文書頻度を表し、
xは語出現頻度を表し、
yは語出現頻度を表し、
dfベクトルはドキュメントベクトルを表し、
qfベクトルはクエリベクトルを表し、
bはスケーリング係数を表し、
ldはドキュメント長を表し、
lcは平均ドキュメント長を表し、
ntは言葉tを有するターゲットプロジェクト候補中のドキュメント数を表し、
Nはディクショナリ中の単語の総数を表し、
×はスカラー乗算である、
付記11に記載の非一時的コンピュータ可読媒体。
(付記18) 各ターゲットプロジェクト候補の合計類似度スコアを決定することは、数式
s’()は合計類似度を表し、
wfは加重係数を表し、
fieldsはフィーチャと等価である、
付記17に記載の非一時的コンピュータ可読媒体。
(付記19) 前記動作は、前記類似度スコアを決定する前に、前記フィーチャ情報を前処理することをさらに含み、
前記前処理することは、
識別子名を分離することと、
ストップワードを削除することと、
一以上の残った言葉をステミングすることとを含む、
付記11に記載の非一時的コンピュータ可読媒体。
(付記20) 前記類似度スコアを決定することは、
前記対象プロジェクトのフィーチャ情報から得られたクエリタームを含むクエリベクトルを構成することと、
前記ターゲットプロジェクト候補のフィーチャ情報から得られたドキュメントタームを含むドキュメントベクトルを構成することと、
ターゲットプロジェクト候補中のフィーチャを選択することであって、選択されるフィーチャは前記ドキュメントベクトル中のドキュメントタームを含む、ことと、
選択されたフィーチャに対して、前記クエリベクトルと前記ドキュメントベクトルとの間のコサイン類似度を決定することと、
選択されたフィーチャのコサイン類似度を合計スコアに加えることとを含む、
付記11に記載の非一時的コンピュータ可読媒体。
Claims (9)
- 対象プロジェクトを改善するクロスプロジェクト学習の方法であって、
ターゲットプロジェクト候補データベースが、一以上のターゲットプロジェクト候補のフィーチャ情報を含むフィーチャにアクセスすることと、
サーバが、対象プロジェクトのフィーチャ情報を含むフィーチャにアクセスすることであって、前記ターゲットプロジェクト候補と前記対象プロジェクトはソフトウェアプログラムである、ことと、
前記ターゲットプロジェクト候補の各々のフィーチャ情報と、前記対象プロジェクトのフィーチャ情報との間の類似度スコアを決定することであって、類似度スコアは前記ターゲットプロジェクト候補の各々の各フィーチャに対して決定される、ことと、
前記ターゲットプロジェクト候補の各フィーチャの類似度スコアを合計して、前記ターゲットプロジェクト候補の各々の合計類似度スコアを生成することと、
前記合計類似度スコアにより前記ターゲットプロジェクト候補をソートすることと、
前記合計類似度スコアが閾値より低いターゲットプロジェクト候補をフィルタすることと、
前記合計類似度スコアが前記閾値以上のターゲットプロジェクト候補を含む類似ターゲットプロジェクトのセットを生成することと、
前記類似ターゲットプロジェクトに基づいて対象プロジェクト中の不具合を特定することと、
前記類似ターゲットプロジェクトに基づいて、前記対象プロジェクト中の不具合を修復するコードを推奨することと、
推奨されたコードを前記対象プロジェクトに実装して前記不具合を修復することにより前記対象プロジェクトを修正することとを含む、
方法。 - 修正された対象プロジェクトをテストする新しいデータを生成することと、
前記対象プロジェクト中の他の不具合を予測することと、
のうち一方または両方を含む、請求項1に記載の方法。 - 所定性能標準を用いて、修正された対象プロジェクトを検証することをさらに含み、前記所定性能標準は、前記対象プロジェクトが修正される前の前記対象プロジェクトの性能に基づく、
請求項1に記載の方法。 - 前記ターゲットプロジェクト候補のフィーチャと、前記対象プロジェクトのフィーチャとは、プロジェクト説明、クラス名、メソッド名、変数名、依存API名、コメント、又は外部ライブラリを含み、
前記フィーチャ情報は、前記フィーチャに対応するテキスト情報と構造情報とを含む、
請求項1に記載の方法。 - 生成された類似ターゲットプロジェクトのセットは、
合計類似度スコアが上位のパーセンテージにランクされたターゲットプロジェクト候補と、
合計類似度スコアがすべての合計類似度スコアの上位にランクされたターゲットプロジェクト候補と、
合計類似度スコアが合計類似度スコア閾値以上のターゲットプロジェクト候補とを含む、
請求項1に記載の方法。 - 前記ターゲットプロジェクト候補のフィーチャにアクセスすることと、前記対象プロジェクトのフィーチャにアクセスすることとは、
前記ターゲットプロジェクト候補のフィーチャのソースコード、テストケース、及びリードミーファイルのうち一以上または組み合わせを解析することと、
それからテキスト情報と構造情報とを抽出して、ドキュメントとクエリとを構成することと、
前記クエリと前記ドキュメントとをインデックスすることとを含み、
前記ドキュメントは前記ターゲットプロジェクト候補のフィーチャに対応し、前記クエリは前記対象プロジェクトのフィーチャに対応する、
請求項1に記載の方法。 - 前記類似度スコアを決定することは、数式
x1’は前記ターゲットプロジェクト候補の1つのドキュメント中の言葉のBM25ベースの重みを表し、
y1’は前記対象プロジェクトのクエリ中の言葉のBM25ベースの重みを表し、
s()は類似度スコアを計算する関数を表し、
tfd(xi)は前記ターゲットプロジェクト候補の1つのドキュメント中のi番目の言葉の平滑化された語出現頻度を表し、
tfq(yi)は前記対象プロジェクトのクエリ中のi番目の言葉の平滑化された語出現頻度を表し、
idf(ti)はi番目の言葉tの逆文書頻度を表し、
xは語出現頻度を表し、
yは語出現頻度を表し、
dfベクトルはドキュメントベクトルを表し、
qfベクトルはクエリベクトルを表し、
bはスケーリング係数を表し、
ldはドキュメント長を表し、
lcは平均ドキュメント長を表し、
ntは言葉tを有するターゲットプロジェクト候補中のドキュメント数を表し、
Nはディクショナリ中の単語の総数を表し、
×はスカラー乗算である、
請求項1に記載の方法。 - 前記類似度スコアを決定することは、
前記対象プロジェクトのフィーチャ情報から得られたクエリタームを含むクエリベクトルを構成することと、
前記ターゲットプロジェクト候補のフィーチャ情報から得られたドキュメントタームを含むドキュメントベクトルを構成することと、
ターゲットプロジェクト候補中のフィーチャを選択することであって、選択されるフィーチャは前記ドキュメントベクトル中のドキュメントタームを含む、ことと、
選択されたフィーチャに対して、前記クエリベクトルと前記ドキュメントベクトルとの間のコサイン類似度を決定することと、
選択されたフィーチャのコサイン類似度を合計スコアに加えることとを含む、
請求項1に記載の方法。 - コンピュータプログラムであって、コンピュータの一以上のプロセッサに、
ターゲットプロジェクト候補データベースが、一以上のターゲットプロジェクト候補のフィーチャ情報を含むフィーチャにアクセスすることと、
サーバが、対象プロジェクトのフィーチャ情報を含むフィーチャにアクセスすることであって、前記ターゲットプロジェクト候補と前記対象プロジェクトはソフトウェアプログラムである、ことと、
前記ターゲットプロジェクト候補の各々のフィーチャ情報と、前記対象プロジェクトのフィーチャ情報との間の類似度スコアを決定することであって、類似度スコアは前記ターゲットプロジェクト候補の各々の各フィーチャに対して決定される、ことと、
前記ターゲットプロジェクト候補の各フィーチャの類似度スコアを合計して、前記ターゲットプロジェクト候補の各々の合計類似度スコアを生成することと、
前記合計類似度スコアにより前記ターゲットプロジェクト候補をソートすることと、
前記合計類似度スコアが閾値より低いターゲットプロジェクト候補をフィルタすることと、
前記合計類似度スコアが前記閾値以上のターゲットプロジェクト候補を含む類似ターゲットプロジェクトのセットを生成することと、
前記類似ターゲットプロジェクトに基づいて対象プロジェクト中の不具合を特定することと、
前記類似ターゲットプロジェクトに基づいて、前記対象プロジェクト中の不具合を修復するコードを推奨することと、
推奨されたコードを前記対象プロジェクトに実装して前記不具合を修復することにより前記対象プロジェクトを修正することとを実行させる、
コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/908,346 US10521224B2 (en) | 2018-02-28 | 2018-02-28 | Automatic identification of relevant software projects for cross project learning |
US15/908346 | 2018-02-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019153270A true JP2019153270A (ja) | 2019-09-12 |
JP7131199B2 JP7131199B2 (ja) | 2022-09-06 |
Family
ID=67684519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018156256A Active JP7131199B2 (ja) | 2018-02-28 | 2018-08-23 | クロスプロジェクト学習のための関連ソフトウェアプロジェクトの自動識別 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10521224B2 (ja) |
JP (1) | JP7131199B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102156931B1 (ko) * | 2020-01-16 | 2020-09-16 | 주식회사 소프트센 | 블록 코딩된 프로그램 코드의 평가 장치, 시스템, 방법 및 기록 매체에 저장된 프로그램 |
JP2022544173A (ja) * | 2019-09-20 | 2022-10-17 | エヌイーシー ラボラトリーズ アメリカ インク | 自動コードレビューア推薦方法 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200371778A1 (en) * | 2019-05-21 | 2020-11-26 | X Development Llc | Automated identification of code changes |
US10782941B1 (en) * | 2019-06-20 | 2020-09-22 | Fujitsu Limited | Refinement of repair patterns for static analysis violations in software programs |
CN110751186B (zh) * | 2019-09-26 | 2022-04-08 | 北京航空航天大学 | 一种基于监督式表示学习的跨项目软件缺陷预测方法 |
US11416245B2 (en) * | 2019-12-04 | 2022-08-16 | At&T Intellectual Property I, L.P. | System and method for syntax comparison and analysis of software code |
CN111367801B (zh) * | 2020-02-29 | 2024-07-12 | 杭州电子科技大学 | 一种面向跨公司软件缺陷预测的数据变换方法 |
US11630649B2 (en) | 2020-06-02 | 2023-04-18 | International Business Machines Corporation | Intelligent application library management |
CN111966586A (zh) * | 2020-08-05 | 2020-11-20 | 南通大学 | 一种基于模块选择和权重更新的跨项目缺陷预测方法 |
US11403304B2 (en) | 2020-09-02 | 2022-08-02 | Fujitsu Limited | Automatically curating existing machine learning projects into a corpus adaptable for use in new machine learning projects |
US11551151B2 (en) | 2020-09-02 | 2023-01-10 | Fujitsu Limited | Automatically generating a pipeline of a new machine learning project from pipelines of existing machine learning projects stored in a corpus |
US12039419B2 (en) | 2020-09-02 | 2024-07-16 | Fujitsu Limited | Automatically labeling functional blocks in pipelines of existing machine learning projects in a corpus adaptable for use in new machine learning projects |
CN113176998A (zh) * | 2021-05-10 | 2021-07-27 | 南通大学 | 基于源选择的跨项目软件缺陷预测方法 |
CN113392184A (zh) * | 2021-06-09 | 2021-09-14 | 平安科技(深圳)有限公司 | 一种相似文本的确定方法、装置、终端设备及存储介质 |
EP4364062A1 (en) * | 2021-07-01 | 2024-05-08 | Google LLC | Detecting inactive projects based on usage signals and machine learning |
CN118095294B (zh) * | 2024-04-25 | 2024-07-09 | 广东汉佳信息技术有限公司 | 基于人工智能的项目文档生成方法、装置和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070266367A1 (en) * | 2004-01-07 | 2007-11-15 | International Business Machines Corporation | Relationship Management For Data Modeling In An Integrated Development Environment |
JP2014127036A (ja) * | 2012-12-26 | 2014-07-07 | Fujitsu Ltd | 情報処理プログラム、情報処理方法及び装置 |
JP2017111486A (ja) * | 2015-12-14 | 2017-06-22 | 富士通株式会社 | 予兆検知プログラム、装置、及び方法 |
JP2017151977A (ja) * | 2016-02-23 | 2017-08-31 | 富士通株式会社 | ソフトウエアプログラムの修復のための方法及びプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4142881B2 (ja) * | 2002-03-07 | 2008-09-03 | 富士通株式会社 | 文書類似度算出装置、クラスタリング装置および文書抽出装置 |
US7735068B2 (en) * | 2005-12-01 | 2010-06-08 | Infosys Technologies Ltd. | Automated relationship traceability between software design artifacts |
JP2011165118A (ja) * | 2010-02-15 | 2011-08-25 | Hitachi Ltd | プロジェクト支援方法及びその装置並びにその実行プログラム |
US20120054117A1 (en) * | 2010-08-27 | 2012-03-01 | Christopher Peltz | Identifying an individual in response to a query seeking to locate personnel with particular experience |
US20120197674A1 (en) * | 2011-01-27 | 2012-08-02 | Maher Rahmouni | Estimating a future project characteristic based on the similarity of past projects |
US20130041711A1 (en) * | 2011-08-09 | 2013-02-14 | Bank Of America Corporation | Aligning project deliverables with project risks |
US8881104B2 (en) * | 2012-04-09 | 2014-11-04 | Accenture Global Services Limited | Component discovery from source code |
US20140115565A1 (en) * | 2012-10-18 | 2014-04-24 | Microsoft Corporation | Test similarity detection with method call sequence analysis |
JP2017010476A (ja) * | 2015-06-26 | 2017-01-12 | 三菱電機株式会社 | 類似判定装置、類似判定方法及び類似判定プログラム |
US10218728B2 (en) * | 2016-06-21 | 2019-02-26 | Ebay Inc. | Anomaly detection for web document revision |
US10635693B2 (en) * | 2016-11-11 | 2020-04-28 | International Business Machines Corporation | Efficiently finding potential duplicate values in data |
US10782964B2 (en) * | 2017-06-29 | 2020-09-22 | Red Hat, Inc. | Measuring similarity of software components |
-
2018
- 2018-02-28 US US15/908,346 patent/US10521224B2/en active Active
- 2018-08-23 JP JP2018156256A patent/JP7131199B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070266367A1 (en) * | 2004-01-07 | 2007-11-15 | International Business Machines Corporation | Relationship Management For Data Modeling In An Integrated Development Environment |
JP2014127036A (ja) * | 2012-12-26 | 2014-07-07 | Fujitsu Ltd | 情報処理プログラム、情報処理方法及び装置 |
JP2017111486A (ja) * | 2015-12-14 | 2017-06-22 | 富士通株式会社 | 予兆検知プログラム、装置、及び方法 |
JP2017151977A (ja) * | 2016-02-23 | 2017-08-31 | 富士通株式会社 | ソフトウエアプログラムの修復のための方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
NGUYEN, HOAN ANH ET AL: "Using Topic Model to Suggest Fine-grained Source Code Changes", 2016 IEEEINTERNATIONAL CONFERENCE ON SOFTWARE MAINTENANCE AND EVOLUTION(ICSME), JPN6022016980, 16 January 2017 (2017-01-16), US, pages 200 - 210, ISSN: 0004766005 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022544173A (ja) * | 2019-09-20 | 2022-10-17 | エヌイーシー ラボラトリーズ アメリカ インク | 自動コードレビューア推薦方法 |
KR102156931B1 (ko) * | 2020-01-16 | 2020-09-16 | 주식회사 소프트센 | 블록 코딩된 프로그램 코드의 평가 장치, 시스템, 방법 및 기록 매체에 저장된 프로그램 |
Also Published As
Publication number | Publication date |
---|---|
US20190265970A1 (en) | 2019-08-29 |
US10521224B2 (en) | 2019-12-31 |
JP7131199B2 (ja) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7131199B2 (ja) | クロスプロジェクト学習のための関連ソフトウェアプロジェクトの自動識別 | |
US9298453B2 (en) | Source code analytics platform using program analysis and information retrieval | |
US9542176B2 (en) | Predicting software build errors | |
Roy | Detection and analysis of near-miss software clones | |
EP3674918B1 (en) | Column lineage and metadata propagation | |
CN108763091B (zh) | 用于回归测试的方法、装置及系统 | |
US9389852B2 (en) | Technique for plagiarism detection in program source code files based on design pattern | |
CN111026433A (zh) | 基于代码变更历史的软件代码质量问题自动修复方法、系统及介质 | |
Xia et al. | An effective change recommendation approach for supplementary bug fixes | |
Islam et al. | How bugs are fixed: Exposing bug-fix patterns with edits and nesting levels | |
Richter et al. | TSSB-3M: Mining single statement bugs at massive scale | |
Eghbali et al. | De-hallucinator: Iterative grounding for llm-based code completion | |
CN117851101A (zh) | 一种基于大语言模型的仓库级别代码缺陷自动修复的方法 | |
US20230385037A1 (en) | Method and system for automated discovery of artificial intelligence (ai)/ machine learning (ml) assets in an enterprise | |
Higo et al. | Identifying clone removal opportunities based on co-evolution analysis | |
Ma et al. | Capturing the Long-Distance Dependency in the Control Flow Graph via Structural-Guided Attention for Bug Localization. | |
Han et al. | Two-phase assessment approach to improve the efficiency of refactoring identification | |
Kumar et al. | Code clone detection and analysis using software metrics and neural network-a literature review | |
Biringa et al. | Automated user experience testing through multi-dimensional performance impact analysis | |
Nguyen et al. | Using topic model to suggest fine-grained source code changes | |
Cuadrado et al. | Deriving OCL optimization patterns from benchmarks | |
Cholakov et al. | Duplicate code detection algorithm | |
Asad et al. | Impact of Combining Syntactic and Semantic Similarities on Patch Prioritization. | |
Romanov et al. | Approaches for Representing Software as Graphs for Machine Learning Applications | |
Mohan et al. | Automated Refactoring of Software using Version History and a Code Element Recentness Measure. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220506 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220726 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7131199 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |