JP2022078962A

JP2022078962A - エラーに関連するコードの行の自動識別

Info

Publication number: JP2022078962A
Application number: JP2021182606A
Authority: JP
Inventors: マハジャン・ソナル; Sonal Mahajan; アールプラサド・ムクル; R Prasad Mukul
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-11-13
Filing date: 2021-11-09
Publication date: 2022-05-25
Also published as: US11366742B2; US20220156174A1

Abstract

【課題】エラーに関連するコードの行の自動識別を提供する。【解決手段】動作は、ディスカッションフォーラムの投稿に含まれる質問からバグのあるコードスニペットを取得することを含み得、バグのあるコードスニペットは、エラーとコードの複数の行とを含む。動作は、質問に対する回答からテキストを取得することと、テキストからキーワードを識別することをさらに含み得る。さらに、動作は、複数の行からの特定の行に、キーワードの１つ以上が特定の行の１つ以上の要素に対応することに基づいて、エラーに関連するものとしてマーク付けすることを含み得る。さらに、動作は、特定の行のマーク付けに基づいて１つ以上のソフトウェアプログラム修復動作を実行することを含み得る。【選択図】図１

Description

本開示で論じられる実施形態は、エラーに関連するコードの行の自動化された識別に関する。

ソフトウェア開発者フォーラムなどのディスカッションフォーラムは、ソフトウェアプログラムにおけるエラー（バグ又はエラーとも呼ばれる）を直すことなどのソフトウェアプログラムの開発に関連する自然言語記述及びコードスニペットの豊富なハイブリッド知識ベースを提示している。ソフトウェア開発ツールは、フォーラムの投稿を分析して他のソフトウェアプログラムにおけるエラーの訂正に関連する情報を識別するために、機械分析動作を実行するように構成されることがある。

本開示において請求される主題事項は、何らかの欠点を解決する、又は上記などの環境においてのみ動作する実施形態に限定されない。むしろ、この背景は、本開示に記載されるいくつかの実施形態が実施され得る１つの例示的な技術分野を示すためにのみ提供される

動作は、ディスカッションフォーラムの投稿に含まれる質問からバグのあるコードスニペットを取得することを含み得、バグのあるコードスニペットは、エラーとコードの複数の行とを含む。動作は、質問に対する回答からテキストを取得することと、テキストからキーワードを識別することをさらに含み得る。さらに、動作は、複数の行からの特定の行に、キーワードの１つ以上が特定の行の１つ以上の要素に対応することに基づいて、エラーに関連するものとしてマーク付けすることを含み得る。さらに、動作は、特定の行のマーク付けに基づいて１つ以上のソフトウェアプログラム修復動作を実行することを含み得る。

実施形態の目的及び利点は、少なくとも特許請求の範囲において特に指し示された要素、特徴、及び組み合わせにより実現され、達成される。

前述の一般的な説明及び以下の詳細な説明の双方が例として与えられており、説明的であり、請求される発明の限定ではない。

例示的な実施形態が、添付図面の使用を通してさらなる特定性及び詳細と共に記載され、説明される。
エラーに関連するコードの行の自動化された識別に関連する一例示的な環境を表す図である。エラーに関連するコード行を識別するために使用され得る一例示的なコンピューティングシステムのブロック図を示す。エラーに関連するコード行を識別する一例示的な方法のフローチャートである。エラーに関連するコード行を識別するのを助けるためのテキスト内のキーワードを識別する一例示的な方法のフローチャートである。コードスニペットの行の構造及び内容を識別する一例示的な方法のフローチャートである。バグのあるコードスニペットのエラーに関連する、バグのあるコードスニペットの行を識別する一例示的な方法のフローチャートである。

本開示に記載されるいくつかの実施形態は、開発者フォーラムの投稿からエラー（バグ又は違反とも呼ばれる）に関連するコードの行を識別する方法及びシステムに関する。特に、開発者フォーラムは、ソフトウェアプログラム及び開発されているソフトウェアプログラムに存在し得る問題を議論するために使用され得る任意のディスカッションフォーラム（例えば、オンラインディスカッションフォーラム）を含み得る。フォーラムのユーザは、バグのあるコードスニペット（「バグのあるスニペット（buggy snippet）」）で見つかったエラーを訂正する方法について質問をフォーラムに投稿することができる。次いで、１以上の他のユーザが、エラーを訂正する方法を説明する回答をフォーラムに投稿することができる。ソフトウェア開発ツールは、質問投稿及び対応する回答投稿を分析して、バグのあるスニペットに含まれるのと同じタイプのエラーに関連するソフトウェアパッチを識別及び生成するように構成され得る。しかしながら、バグのあるスニペットは、バグのあるスニペットに含まれるエラーに関連しないコードの行を含むことがある。これらの非関連行は、パッチの識別及び／又は生成において非効率性をもたらす可能性がある。さらに、非関連行は、生成されたパッチをより有効性のないものにする結果をもたらす可能性がある。本開示において、バグのあるスニペットの「関連する行」への参照は、バグのあるスニペットのエラーに関連する行を指すことができる。さらに、バグのあるスニペットの「非関連行」への参照は、バグのあるスニペットのエラーに非関連の行を指すことができる。行は、その行が何らかの方法でエラーに寄与することに応答して、エラーに「関連する」とみなされ得る。さらに、行は、その行がエラーに何ら寄与しないことに応答して、「非関連」とみなされ得る。

本開示の１つ以上の実施形態によれば、動作は、開発者フォーラムに投稿され得る質問投稿のバグのあるスニペットを抽出するために実行され得る。さらに、動作は、バグのあるスニペットのどの行がバグのあるスニペットのエラーに関連し得るかを識別するために実行され得る。特に、回答投稿は、バグのあるスニペットをそれに含まれるエラーを訂正するために変更する方法についての記述を含むことがある。回答投稿は、自然言語でその中にコード要素が含まれた状態で書かれることがある。さらに、回答投稿は、バグのあるスニペットのどの行がエラーに関連するかについての手がかりを提供することがある。

本明細書に開示される１つ以上の実施形態によれば、したがって、質問投稿に対応する１つ以上の回答投稿に対して自然言語処理が実行され得る。自然言語処理は、質問投稿のバグのあるスニペットのどの行が対応するエラーに関連するかを示す回答投稿のテキストを識別するために使用することができる。いくつかの実施形態において、バグのあるスニペットは、エラーの理解及び／又はエラーの訂正を容易にするのを助けるためにどの行が関連するかを示すために注釈付けされ（annotated）てもよい。これら又は他の実施形態において、バグのあるスニペットは、エラーに関連するものとして識別又は注釈付けされない行を除去するために切り取られ（pruned）てもよい。さらに又は代わりに、切り取られたバグのあるスニペットを使用して、バグのあるスニペット全体が使用された場合より効果的なソフトウェア修復を生成してもよい。

このように、本開示の１つ以上の実施形態によれば、ソフトウェア開発の技術分野は、コンピューティングシステムが、対応するエラーに関連するバグのあるスニペットの部分をより良く識別することができるようにコンピュータシステムを構成することにより、改善され得る。コンピュータシステムは、エラーに関連しないバグのあるスニペットの行を無視することにより、バグのあるスニペットのエラーに類似する他のエラーを修復するためのより良いパッチを生成することもできる。さらに又は代わりに、コンピュータシステムは、開発者がエラーの原因をより良く理解するのを助けるために、エラーに関連するバグのあるスニペットの行に注釈付けすることにより、開発者に役立つ情報を提供することができる。

本開示の実施形態は、添付の図面を参照して説明される。

図１は、バグのあるコードスニペットのエラーに関連する、バグのあるコードスニペットのコードの行の自動化された識別に関する一例示的な環境１００を表す図である。環境１００は、本開示に記載される少なくとも１つの実施形態に従って配置され得る。環境１００は、開発者フォーラム１０２及び分析モジュール１１２を含み得る。

開発者フォーラム１０２は、アイデアを交換するためにソフトウェアプログラム開発者により使用され得る任意の適用可能なディスカッションフォーラムを含むことができる。いくつかの実施形態において、開発者フォーラムは、インターネット上の任意の適用可能なウェブサイトを含み得る１つ以上のウェブサイト上にホストされ得る。代わりに又はさらに、いくつかの実施形態において、ウェブサイトは、内部のリポジトリ又はリソース、例えば内部イントラネットサイト上の文書のコレクションを含んでもよい。

開発者フォーラム１０２は、ユーザが質問を投稿でき、他のユーザが質問に対する対応する回答を投稿できるフォーラムであってよい。例えば、あるユーザが、ソフトウェアプログラムのバグのあるコードスニペット１０８（「バグのあるスニペット１０８」）を含み得る質問１０４（「質問投稿１０４」）を投稿することができる。バグのあるスニペット１０８は、エラーを含むソフトウェアプログラムのコードの行を含むことができ、質問投稿１０４は、エラーを修復する際の支援を求めることができる。さらに、別のユーザが、バグのあるスニペット１０８のエラーを訂正する方法を説明するテキスト１１０を含む回答１０６（「回答投稿１０６」）を投稿することができる。テキスト１１０は、自然言語（例えば、人間により使用される言語）及び／又はコードマークアップ（例えば、コードの行に含まれるテキスト）を含む、テキスト文字列を含むことができる。上述したように、いくつかの例において、バグのあるスニペット１０８は、エラーに非関連であるコードの行と、エラーに関連する他のものとを含み得る。さらに、テキスト１１０は、バグのあるスニペットのどの行がエラーに関連し得るかを示す情報を提供することができる。

分析モジュール１１２は、コンピューティングシステムがテキスト１１０からバグのあるスニペット１０８の関連する行を識別することに関連する１つ以上の動作を実行することを可能にするように構成されたコード及びルーチンを含んでもよい。さらに又は代わりに、分析モジュール１１２は、プロセッサ、マイクロプロセッサ（例えば、１つ以上の動作を実行し又はその実行を制御するため）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、又は特定用途向け集積回路（ＡＳＩＣ）を含むハードウェアを使用して実装されてもよい。いくつかの他の例において、分析モジュール１１２は、ハードウェア及びソフトウェアの組み合わせを使用して実装されてもよい。本開示において、分析モジュール１１２により実行されるものとして記載された動作は、分析モジュール１１２が実行するように構成されるか又は対応するシステムに実行するよう指示するように構成された動作を含んでもよい。

分析モジュール１１２は、開発者フォーラム１０２にアクセスし、開発者フォーラム１０２の投稿からテキストを抽出するように構成され得る。例えば、分析モジュール１１２は、質問投稿１０４からバグのあるスニペット１０８を取得し、回答投稿からテキスト１１０を取得するように構成されてもよい。いくつかの実施形態において、分析モジュール１１２は、テキストを取得するために、開発者フォーラム１０２をホストするウェブサイトにアクセスするために使用され得る任意の適切なネットワークに通信上結合され得る。

以下でさらに詳細に論じるように、分析モジュール１１２は、テキスト１１０からキーワードを識別するように構成され得る。キーワードは、バグのあるスニペット１０８の要素に対応し得る特定のタイプの単語又は句を形成する文字の文字列を含み得る。例えば、テキスト１１０の名詞及び動詞などの特定の品詞が、他の品詞より多く、バグのあるスニペット１０８の要素に対応し得る。このように、いくつかの実施形態において、キーワードは、名詞、名詞句、動詞、及び／又は動詞句を含んでもよい。さらに又は代わりに、コードに従ってフォーマットされた（formatted）テキスト１１０のテキスト文字列（「コードマークアップ（code markup）」と呼ばれる）が、テキスト１１０内の他のタイプのテキスト文字列より、バグのあるスニペット１０８の要素に対応する可能性も高い。したがって、いくつかの実施形態において、キーワードは、「コードマークアップ」として識別される１つ以上のテキスト文字列を含んでもよい。

これら又は他の実施形態において、分析モジュール１１２は、識別されたキーワードの１つ以上がバグのあるスニペット１０８の行のうち各々の１つ以上の要素に対応するかどうかを決定するように構成され得る。キーワードが行の要素に対応することに応答して、分析モジュール１１２は、対応する行をバグのあるスニペット１０８のエラーに関連するものとして識別することができる。これら又は他の実施形態において、分析モジュール１１２は、バグのあるスニペット１０８においてそのようなものとして識別された関連する行の１つ以上にマーク付けして、マーク付けされたバグのあるスニペット１１４を生成するように構成されてもよい。いくつかの実施形態において、分析モジュール１１２は、関連する行の全てをマーク付けするように構成されてもよい。図３、図４、図５、及び図６それぞれに関して以下でさらに詳細に論じられる方法３００、４００、５００、及び６００は、マーク付けされたバグのあるスニペット１１４を生成するために分析モジュール１１２により実行され得る動作の例を提供する。

本開示の範囲から逸脱することなく、図１に修正、追加、又は省略がなされ得る。例えば、環境１００は、本開示において図示及び説明されたものより多くの又は少ない要素を含んでもよい。

代わりに又はさらに、いくつかの実施形態において、分析モジュール１１２及び分析モジュール１１２に対して論じられた動作は、単一のデバイスにより実行されてもよく、あるいは異なるシステムにわたり分散されてもよい。さらに、分析モジュール１１２、又は別のシステム若しくはモジュールは、マーク付けされたバグのあるスニペット１１４に基づいて１つ以上の修復動作を実行するように構成されてもよく、いくつかの例示的な修復動作が、図３に関して以下でさらに詳細に論じられる。

図２は、本開示の少なくとも１つの実施形態による、ソフトウェアパッチを生成するために使用され得る一例示的なコンピューティングシステム２０２のブロック図を示す。コンピューティングシステム２０２は、いくつかの実施形態において、図１の分析モジュール１１２に関連づけられた１つ以上の動作を実装又は指示するように構成され得る。コンピューティングシステム２０２は、プロセッサ２５０、メモリ２５２、及びデータ記憶装置２５４を含んでもよい。プロセッサ２５０、メモリ２５２、及びデータ記憶装置２５４は、通信上結合されてもよい。

一般に、プロセッサ２５０は、様々なコンピュータハードウェア又はソフトウェアモジュールを含む、任意の適切な専用若しくは汎用コンピュータ、コンピューティングエンティティ、又は処理デバイスを含んでもよく、任意の適用可能なコンピュータ読取可能記憶媒体に記憶された命令を実行するように構成されてもよい。例えば、プロセッサ２５０は、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、又はプログラム命令を解釈及び／又は実行するよう及び／又はデータを処理するように構成された任意の他のデジタル若しくはアナログ回路を含んでもよい。図２において単一のプロセッサとして示されているが、プロセッサ２５０は、本開示に記載される任意の数の動作を個々又は集合的に実行し又はその実行を指示するように構成された、任意の数のプロセッサを含んでもよい。さらに、プロセッサの１つ以上が、異なるサーバなどの１つ以上の異なる電子デバイス上に存在してもよい。

いくつかの実施形態において、プロセッサ２５０は、メモリ２５２、データ記憶装置２５４、又はメモリ２５２及びデータ記憶装置２５４に記憶されたプログラム命令を解釈及び／又は実行し、かつ／あるいはデータを処理するように構成され得る。いくつかの実施形態において、プロセッサ２５０は、データ記憶装置２５４からプログラム命令を取り出し、プログラム命令をメモリ２５２にロードしてもよい。プログラム命令がメモリ２５２にロードされた後、プロセッサ２５０はプログラム命令を実行することができる。

例えば、いくつかの実施形態において、バグのあるコードスニペットの関連する行を識別するように構成されたモジュール（例えば、図１の分析モジュール１１２）が、プログラム命令としてデータ記憶装置２５４に含まれてもよい。プロセッサ２５０は、データ記憶装置２５４からモジュールのプログラム命令を取り出すことができ、モジュールのプログラム命令をメモリ２５２にロードすることができる。モジュールのプログラム命令がメモリ２５２にロードされた後、プロセッサ２５０はプログラム命令を実行することができ、それにより、コンピューティングシステムは、命令により指示されるとおりモジュールに関連づけられた動作を実施することができる。

メモリ２５２及びデータ記憶装置２５４は、記憶されたコンピュータ実行可能命令又はデータ構造を搬送し又は有するコンピュータ読取可能記憶媒体を含んでもよい。そのようなコンピュータ読取可能記憶媒体は、プロセッサ２５０などの汎用又は専用コンピュータによりアクセスされ得る任意の利用可能な媒体を含んでもよい。限定でなく例として、そのようなコンピュータ読取可能記憶媒体は、ランダムアクセスメモリ（ＲＡＭ）、読取専用メモリ（ＲＯＭ）、電気的消去可能プログラマブル読取専用メモリ（ＥＥＰＲＯＭ）、コンパクトディスク読取専用メモリ（ＣＤ‐ＲＯＭ）若しくは他の光ディスク記憶装置、磁気ディスク記憶装置若しくは他の磁気記憶デバイス、フラッシュメモリデバイス（例えば、ソリッドステートメモリデバイス）、又はコンピュータ実行可能命令又はデータ構造の形式で特定のプログラムコードを搬送又は記憶するために使用でき、かつ汎用又は専用コンピュータによりアクセスできる任意の他の記憶媒体を含む、有形の又は非一時的なコンピュータ読取可能記憶媒体を含んでもよい。上記の組み合わせもまた、コンピュータ読取可能記憶媒体の範囲内に含まれてもよい。コンピュータ実行可能命令は、例えば、プロセッサ２５０に特定の動作又は動作のグループを実行させるように構成された命令及びデータを含んでもよい。

本開示の範囲から逸脱することなく、コンピューティングシステム２０２に修正、追加、又は省略がなされ得る。例えば、いくつかの実施形態において、コンピューティングシステム２０２は、明示的に図示又は説明されない可能性のある任意の数の他のコンポーネントを含んでもよい。

図３は、本開示に記載される少なくとも１つの実施形態による、エラーに関連するコード行を識別する一例示的な方法３００のフローチャートである。方法３００は、任意の適切なシステム、装置、又はデバイスにより実行することができる。例として、図１の分析モジュール１１２、又は図２のコンピューティングシステム２０２（例えば、いくつかの実施形態において分析モジュールにより指示される）は、方法３００に関連づけられた動作の１つ以上を実行することができる。離散的なブロックで示されているが、方法３００のブロックの１つ以上に関連づけられたステップ及び動作は、特定の実装に依存してさらなるブロックに分割されてもよく、より少ないブロックに組み合わせられてもよく、あるいは削除されてもよい。

ブロック３０２において、バグのあるコードスニペット（「バグのあるスニペット」）が取得され得る。バグのあるスニペットは、開発者フォーラムに投稿され得る質問投稿、例えば、図１の開発者フォーラム１０２の質問投稿１０４などから取得することができる。バグのあるスニペットはエラーを含み得る。さらに、バグのあるスニペットはコードの複数の行を含み得、これにおいて、行の１つ以上はエラーに関連し得、かつ／あるいは１つ以上の行はエラーに非関連であり得る。

ブロック３０４において、質問投稿の質問に対する回答からテキストが取得され得る。図１のテキスト１１０は、取得され得るテキストの一例である。

ブロック３０６において、１つ以上のキーワードがテキストから取得され得る。上述したように、キーワードは、バグのあるスニペットの要素に対応し得る特定のタイプの単語又は句を形成する文字の文字列を含み得る。例えば、上述したように、キーワードは、テキストに含まれ得る名詞、動詞、名詞句、動詞句、及び／又はコードマークアップを含み得る。いくつかの実施形態において、キーワードは、図４の方法４００に関して以下に記載される１つ以上の動作を実行することにより取得及び／又は識別され得る。

ブロック３０８において、バグのあるスニペットのエラーに関連する、バグのあるスニペットの行が識別され得る。いくつかの実施形態において、関連する行は、キーワードに基づいて識別することができる。例えば、キーワードの１つ以上がバグのあるスニペットの行のうち各々の１つ以上の要素に対応するかどうかが決定されてもよい。キーワードが行の要素に対応することに応答して、この対応する行は、バグのあるスニペットのエラーに関連するものとして識別され得る。

いくつかの実施形態において、キーワードが１つ以上の要素に対応するかどうかの決定は、バグのあるスニペットの注釈付けされた行に対してキーワードを比較することを含んでもよい。行は、行のどの要素が行の構造に関連するか、及びどの要素が行の内容に関連するかを示すために、注釈付けすることができる。「構造（Constructs）」は、行によりどのような動作が実行されているかに関連し又はそれを示すコード要素を含むことができる。例えば、構造には、ループなどを含むことができる。「内容（Content）」には、メソッド名などの、動作を実行するために使用されるコード要素を含むことができる。いくつかの実施形態において、バグのあるスニペットの行は、図５の方法５００に関して以下に説明する１つ以上の動作を実行することにより注釈付けすることができる。さらに又は代わりに、関連する行は、図６の方法６００に関して以下に説明する１つ以上の動作を実行することにより識別することができる。

いくつかの実施形態において、方法３００はブロック３１０を含み得る。ブロック３１０において、ブロック３０８でエラーに関連するものとして識別されたバグのあるスニペットの行の１つ以上が、エラーに関連するものとしてマーク付けされ得る。これら又は他の実施形態において、ブロック３０８で識別された行の全てがマークを付けされてもよい。

さらに又は代わりに、いくつかの実施形態において、方法３００はブロック３１２を含み得る。ブロック３１２において、マーク付けされたバグのあるスニペットに基づいて１つ以上のソフトウェアプログラム修復動作が実行され得る。例えば、いくつかの実施形態において、バグのあるスニペットは、エラーに関連すると識別された行のみを含むように切り取られてもよい。次いで、切り取られたバグのあるスニペットを使用して、任意の適切な手法に従って修復パッチを生成することができる。さらに又は代わりに、修復パッチは、ソフトウェアプログラムのエラーがバグのあるスニペットのエラーと同じ又は類似であることに応答して、テスト下のソフトウェアプログラムのエラーに対する潜在的な訂正として提示されてもよい。これら又は他の実施形態において、修復パッチは、テスト下のソフトウェアプログラムで実装されてもよい。さらに又は代わりに、修復動作は、ユーザがバグのあるスニペット内の関連する行を識別することを可能にする何らかの方法で、関連する行を強調することを含むことができる。行を強調することにより、ユーザは、バグのあるスニペットのどの部分がエラーを引き起こしたのかにより良く焦点を合わせて、将来エラーを訂正及び／又は回避する方法をより良く識別することができ得る。

当業者は、本明細書に開示されるこの及び他のプロセス、動作、及び方法について、実行される機能及び／又は動作が異なる順序で実施され得ることを理解するであろう。さらに、概説された機能及び動作は例として提供されているに過ぎず、機能及び動作のいくつかが、開示される実施形態の本質を損なうことなく任意でもよく、より少ない機能及び動作に組み合わせられてもよく、あるいはさらなる機能及び動作に拡張されてもよい。いくつかの実施形態において、方法３００は、さらなるブロック又はより少ないブロックを含んでもよい。例えば、いくつかの実施形態において、方法３００は、選択された特定の投稿に基づいてテスト下のコードに対して修復動作を実行することに関連する１つ以上の動作を含んでもよい。例えば、特定の投稿の特定の例示的なコードスニペットは、バグのあるコードスニペットに適用され得るパッチを含み得る。さらに又は代わりに、特定の投稿は、バグのあるコードスニペットの特定のエラーに対する潜在的な解決策を提供するものとして、テスト下のコードの開発者に提示されてもよい。

図４は、本開示に記載される少なくとも１つの実施形態による、応答テキストのキーワードを識別する一例示的な方法４００のフローチャートである。方法４００は、任意の適切なシステム、装置、又はデバイスにより実行することができる。例として、図１の分析モジュール１１２、又は図２のコンピューティングシステム２０２（例えば、いくつかの実施形態において分析モジュールにより指示される）は、方法４００に関連づけられた動作の１つ以上を実行することができる。離散的なブロックで示されているが、方法４００のブロックの１つ以上に関連づけられたステップ及び動作は、特定の実装に依存してさらなるブロックに分割されてもよく、より少ないブロックに組み合わせられてもよく、あるいは削除されてもよい。いくつかの実施形態において、方法４００の動作の１つ以上は、図３のブロック３０６に関して実行することができる。

一般に、方法４００は、開発者フォーラム（例えば、図１の開発者フォーラム１０２）に投稿された質問に対する回答のテキスト（「回答テキスト」）に関して実行され得る。方法４００は、上述したように、質問のバグのあるスニペットの関連する行を識別するために使用され得る、回答テキストに含まれるキーワードを識別するために使用することができる。

ブロック４０２において、回答テキストが、インラインコードマークアップテキスト文字列（「コードマークアップ」）を識別するために分析され得る。コードマークアップは、ソフトウェアプログラムのソースコードに典型的に見られる方法で書かれ又はフォーマットされたテキストの文字列を含み得る。コードマークアップの識別は、任意の適切な手法に従って実行されてよい。

ブロック４０４において、自然言語処理（「ＮＬＰ」）が回答テキストに対して実行され得る。ＮＬＰは、回答テキストからのキーワードの識別を容易にするように、回答テキストを修正することができる。ＮＬＰには、任意の適切なＮＬＰ手法を含んでよい。例えば、ＮＬＰは、コードマークアップとして識別されないテキスト（「残りのテキスト」と呼ばれる）を小文字に変換することを含んでもよい。これら又は他の実施形態において、ＮＬＰは、英数字文字を除去することを含んでもよい。さらに又は代わりに、ＮＬＰは、プログラミング構造又は内容を指し示し得ない「ストップワード（stopwords）」を回答テキストから除去することを含んでもよい。例えば、ストップワードは、前置詞、冠詞、代名詞等を含んでもよい。これら又は他の実施形態において、ＮＬＰは、レンマ化（lemmatization）を実行することを含んでもよく、これは、単語の形態を正規化することを含み得る。例えば、動詞は、不定詞形態に正規化することができる。さらに又は代わりに、ＮＬＰは、回答テキストをトークン化することを含んでもよく、これは、回答テキスト内の個々の単語の識別を含み得る。

ブロック４０６において、残りのテキストの品詞（parts of speech）が識別され得る。いくつかの実施形態において、ＮＬＰは、品詞の識別を容易にするのを助け得る。例えば、動詞、名詞、形容詞、副詞などを識別することができる。いくつかの実施形態において、異なる単語は、そのそれぞれの品詞の指標で注釈付けされ得る。

ブロック４０８において、１つ以上のキーワードが回答テキストから識別され得る。上述したように、キーワードには、コードマークアップ、名詞、又は動詞を含むことができる。したがって、いくつかの実施形態において、ブロック４０２で識別されたコードマークアップは、それぞれのキーワードとして識別されてもよい。さらに又は代わりに、ブロック４０８で名詞又は動詞として識別される単語も、それぞれのキーワードとして識別されてもよい。

いくつかの実施形態において、キーワードは抽出され、保存され得る。これら又は他の実施形態において、キーワードは、そのそれぞれのキーワードタイプで注釈付けされてもよい（例えば、「マークアップ」、「名詞」、又は「動詞」として注釈付けされてもよい）。さらに又は代わりに、回答テキストが注釈付けされてもよく、これにおいて、識別されたキーワードはそのようなものとして示され得る。これら又は他の実施形態において、注釈は、それぞれのキーワードタイプを含んでもよい。

したがって、方法４００を使用して、例示的なバグのあるコードスニペットと、この例示的なバグのあるコードスニペットのエラーを訂正する対応する修復されたコードスニペットとから、具体的なパッチを決定することができる。さらに又は代わりに、方法４００は、具体的パッチを決定する際にバグパターンライブラリのバグパターンを使用してもよい。

当業者は、本明細書に開示されるこの及び他のプロセス、動作、及び方法について、方法４００の機能及び／又は動作の実行が、記載されたものと異なる順序で実施され得ることを理解するであろう。例えば、概説された機能及び動作は例として提供されているに過ぎず、機能及び動作のいくつかが、開示される実施形態の本質を損なうことなく任意でもよく、より少ない機能及び動作に組み合わせられてもよく、あるいはさらなる機能及び動作に拡張されてもよい。いくつかの実施形態において、方法４００は、さらなるブロック又はより少ないブロックを含んでもよい。

図５は、本開示に記載される少なくとも１つの実施形態による、バグのあるコードスニペット（「バグのあるスニペット」）の行の構造及び内容を識別する一例示的な方法５００のフローチャートである。方法５００は、任意の適切なシステム、装置、又はデバイスにより実行することができる。例として、図１の分析モジュール１１２、又は図２のコンピューティングシステム２０２（例えば、いくつかの実施形態において分析モジュールにより指示される）は、方法５００に関連づけられた動作の１つ以上を実行することができる。離散的なブロックで示されているが、方法５００のブロックの１つ以上に関連づけられたステップ及び動作は、特定の実装に依存してさらなるブロックに分割されてもよく、より少ないブロックに組み合わせられてもよく、あるいは削除されてもよい。

一般に、方法５００は、開発者フォーラム（例えば、図１の開発者フォーラム１０２）に投稿された質問のバグのあるスニペットに関して実行され得る。方法５００は、行の構造又は行の内容に関連する、バグのあるスニペットの行の要素を識別するために使用することができる。

ブロック５０２において、バグのあるスニペットが、各行が個々に分析され得るように別個の行に分割され得る。ブロック５０４において、訪問されていない行が選択され得る。「訪問されていない（unvisited）」行は、行の内容又は構造を識別するためにまだ分析されていない、バグのあるスニペットの任意の行であり得る。

ブロック５０６において、ブロック５０４で選択された行のプログラミング構造（「構造」）が識別され得る。上述したように、構造は、選択された行で実行されている動作のタイプに関連し及び／又は該タイプを示すコード要素を含むことができる。構造は、任意の適切な手法を使用して識別されてよい。いくつかの実施形態において、選択された行は、構造に対応するものとして識別された要素がそのようなものとして示され得るように注釈付けされ得る。

ブロック５０８において、ブロック５０４で選択された行のプログラミング内容（「内容」）が識別され得る。上述したように、内容は、選択された行の動作を実行するために使用されるコード要素を含むことができる。内容は、任意の適切な手法を使用して識別されてよい。いくつかの実施形態において、選択された行は、内容に対応するものとして識別された要素がそのようなものとして示され得るように注釈付けされ得る。

当業者は、本明細書に開示されるこの及び他のプロセス、動作、及び方法について、方法５００の機能及び／又は動作の実行が、記載されたものと異なる順序で実施され得ることを理解するであろう。例えば、概説された機能及び動作は例として提供されているに過ぎず、機能及び動作のいくつかが、開示される実施形態の本質を損なうことなく任意でもよく、より少ない機能及び動作に組み合わせられてもよく、あるいはさらなる機能及び動作に拡張されてもよい。いくつかの実施形態において、方法５００は、さらなるブロック又はより少ないブロックを含んでもよい。

図６は、本開示に記載される少なくとも１つの実施形態による、バグのあるコードスニペット（「バグのあるスニペット」）のエラーに関連する、バグのあるスニペットの行を識別する一例示的な方法６００のフローチャートである。方法６００は、任意の適切なシステム、装置、又はデバイスにより実行することができる。例として、図１の分析モジュール１１２、又は図２のコンピューティングシステム２０２（例えば、いくつかの実施形態において分析モジュールにより指示される）は、方法６００に関連づけられた動作の１つ以上を実行することができる。離散的なブロックで示されているが、方法６００のブロックの１つ以上に関連づけられたステップ及び動作は、特定の実装に依存してさらなるブロックに分割されてもよく、より少ないブロックに組み合わせられてもよく、あるいは削除されてもよい。いくつかの実施形態において、方法６００の動作の１つ以上は、図３の方法３００のブロック３０８に関して実行することができる。

ブロック６０２において、キーワード「ｔ」が選択され得る。キーワードは、開発者フォーラムに投稿された回答の回答テキストから選択することができる。いくつかの実施形態において、キーワード「ｔ」は、回答テキストから抽出されたキーワードのリストから選択されてもよい。さらに又は代わりに、キーワード「ｔ」は、キーワード「ｔ」が回答テキストの注釈付けされたバージョンにおいてそのようなものとして示されていることに基づいて回答テキストから選択されてもよく、該回答テキストは、図４の方法４００の１つ以上の動作に従って注釈され得る。

いくつかの実施形態において、キーワード「ｔ」のキーワードタイプがさらに決定されてもよい。例えば、キーワード「ｔ」がコードマークアップか、名詞か、又は動詞かが決定されてもよい。これら又は他の実施形態において、キーワードタイプは、方法４００の１つ以上の動作に従って決定されてもよい。さらに又は代わりに、キーワードは、キーワードタイプ「ｔ」を示す注釈を含んでもよい。キーワードタイプ注釈は、キーワードのリスト及び／又は回答テキストの注釈に含まれてもよい。

ブロック６０４において、コードの行「ｃ」（「行ｃ」）が選択され得る。行「ｃ」は、バグのあるスニペットから選択することができる。バグのあるスニペットは、開発者フォーラムの質問投稿に含まれ得る。キーワード「ｔ」が選択され得る回答が、バグのあるスニペットを含む質問投稿の質問に対する回答であり得る。いくつかの実施形態において、行「ｃ」は、行「ｃ」のどの要素がコード構造に対応するか、及びどれがコード内容に対応するかを示す注釈を含むことができる。いくつかの実施形態において、行「ｃ」は、図５の方法５００の１つ以上の動作に従って注釈付けされ得る。いくつかの実施形態において、ブロック６０２及び６０４の動作は、異なる順序で及び／又は同時に実行されてもよい。

ブロック６０６、６０８、６１０、６１２、６１４、６１６、及び６１８において、１つ以上の動作を実行して、キーワード「ｔ」及び行「ｃ」の要素に基づいて１つ以上の比較を実行することにより、キーワード「ｔ」が行「ｃ」に対応するかどうかを決定することができる。いくつかの実施形態において、及び以下で詳細に説明するように、ブロック６０６、６０８、６１０、６１２、６１４、６１６、及び６１８の動作は、キーワード「ｔ」のキーワードタイプ、及び／又はコード構造又はコード内容に対応するものとしての行「ｃ」の要素の指定を使用して、決定及び比較を容易にし、かつ／あるいはそれらの速度を改善することができる。しかしながら、いくつかの実施形態において、キーワードタイプ及び／又は指定の使用は、利用されなくてもよい。

例えば、ブロック６０６において、キーワード「ｔ」のキーワードタイプがコードマークアップであるかどうかが決定され得る。キーワードタイプがコードマークアップであることに応答して、方法６００はブロック６０６からブロック６０８に進み得る。

ブロック６０８において、キーワード「ｔ」が行「ｃ」に含まれるかどうかが決定され得る。例えば、キーワード「ｔ」を行「ｃ」内の要素（例えば、テキスト）に対して比較して、キーワード「ｔ」が要素のいずれかに一致又は類似するかどうかを決定することができる。キーワード「ｔ」が行「ｃ」の要素の少なくとも１つに一致又は類似することに応答して、方法６００はブロック６１０に進み得る。ブロック６１０において、行「ｃ」は、バグのあるスニペットのエラーに関連するものとしてマーク付けされ得る。ブロック６１０に続き、方法６００はブロック６０４に戻り得る。さらに、キーワード「ｔ」が行「ｃ」の要素の少なくとも１つに一致又は類似しないことに応答して、方法６００はブロック６０８からブロック６０４に進み得る。ブロック６０４では、バグのあるスニペットの別のコード行が選択されて、キーワード「ｔ」がバグのあるスニペットの該別のコード行に関連するかどうかを決定することができる。

ブロック６０６に戻り、キーワード「ｔ」のキーワードタイプがコードマークアップでないことに応答して、方法６００はブロック６０６からブロック６１２に進み得る。ブロック６１２において、キーワード「ｔ」のキーワードタイプが動詞であるかどうかが決定され得る。キーワードタイプが動詞であることに応答して、方法６００はブロック６１２からブロック６１４に進み得る。

動詞はしばしば、コード内容に対応するが、コード構造には対応しない。したがって、方法６００の効率を改善するために、行「ｃ」の要素の全てに対して動詞を比較するのでなく、動詞は、コード内容に対応する要素に対してのみ比較されてもよい。このように、いくつかの実施形態において、ブロック６１４において、行「ｃ」がコード内容を含むかどうかが決定され得る。例えば、行「ｃ」の１つ以上の要素がコード内容に対応するかどうかが決定されてもよい。いくつかの実施形態において、行「ｃ」の注釈を使用して、行「ｃ」がコード内容を含むかどうかを決定することができる。行「ｃ」がコード内容を含まないという決定に応答して、方法６００は、キーワード「ｔ」に関して比較するための別のコード行の選択のために、ブロック６１４からブロック６０４に進み得る。

行「ｃ」がコード内容を含むという決定に応答して、方法６００はブロック６１４からブロック６１６に進み得る。ブロック６１６において、キーワード「ｔ」に対応するコード要素「ｔ’」が識別され得る。コード要素「ｔ’」は、自然言語キーワード「ｔ」にしばしば関連づけられるコードの要素であり得る。いくつかの実施形態において、コード要素「ｔ’」は、自然言語の単語とコード要素との間の関連づけを含むルックアップ辞書から識別することができる。ブロック６１６に続き、方法６００はブロック６１８に進み得る。

ブロック６１８において、行「ｃ」が、ブロック６１６で識別されたコード要素「ｔ’」を含むかどうかが決定され得る。例えば、コード要素「ｔ’」を行「ｃ」の要素（例えば、テキスト）に対して比較して、コード要素「ｔ’」が行「ｃ」の要素のいずれかに一致又は類似するかどうかを決定することができる。キーワードタイプが動詞である例において、比較は、コード内容に対応する要素に限定されてもよく、これは、いくつかの例において方法６００の効率を改善し得る。

コード要素「ｔ’」が行「ｃ」の要素の少なくとも１つに一致又は類似することに応答して、方法６００はブロック６１０に進み得る。上述したように、ブロック６１０では、行「ｃ」は、バグのあるスニペットのエラーに関連するものとしてマーク付けされ得る。さらに上述したように、ブロック６１０に続き、方法６００はブロック６０４に戻り得る。さらに、コード要素「ｔ’」が行「ｃ」の要素の少なくとも１つに一致又は類似しないことに応答して、方法６００はブロック６０８からブロック６０４に進み得る。上述したように、ブロック６０４では、バグのあるスニペットの別のコード行が選択されて、キーワード「ｔ」がバグのあるスニペットの該別のコード行に関連するかどうかを決定することができる。

ブロック６１２に戻り、キーワードタイプが動詞、名詞、又はコードマークアップである例において、キーワード「ｔ」は名詞であり得る。名詞は、コード内容又はコード構造に対応し得、したがって、いくつかの実施形態において、行「ｃ」が内容を含むかどうかに関連する動作は、このような例では省略されてもよい。このように、キーワード「ｔ」のキーワードタイプがブロック６１２で動詞でない（及び、ブロック６０６から決定されたとおり、コードマークアップでない）ことに応答して、方法６００はブロック６１２からブロック６１６に進み得る。

したがって、方法６００の動作を実行して、バグのあるスニペットのどの行がキーワード「ｔ」に対応し、したがってバグのあるスニペットのエラーに関連するものとしてマーク付けされるかを決定することができる。いくつかの実施形態において、方法６００の動作の１つ以上は、回答テキストのあらゆるキーワードに関して実行されてもよく、これにおいて、各それぞれのキーワードは、バグのあるスニペットのあらゆる行に関して分析される。

当業者は、本明細書に開示されるこの及び他のプロセス、動作、及び方法について、方法６００に関して実行される機能及び／又は動作が異なる順序で実施され得ることを理解するであろう。さらに、概説された機能及び動作は例として提供されているに過ぎず、機能及び動作のいくつかが、開示される実施形態の本質を損なうことなく任意でもよく、より少ない機能及び動作に組み合わせられてもよく、あるいはさらなる機能及び動作に拡張されてもよい。さらに、いくつかの実施形態において、方法６００は、さらなるブロック又はより少ないブロックを含んでもよい。

例えば、キーワードタイプに関する方法６００の特定の順序及びフローは一例に過ぎず、キーワードタイプがマークアップか動詞か名詞かを最初に決定するかどうかに関する限り、多くの異なる実装が使用されてよい。さらに、上述したように、コード内容又はコード構造に関する注釈の使用は、いくつかの実装において省略されてもよい。さらに又は代わりに、２つ以上のキーワードタイプとそれらの使用との間の区別が省略されてもよい。例えば、名詞と動詞との間の区別は、いくつかの実施形態において省略されてもよい

上述したように、本開示に記載される実施形態は、以下でより詳細に論じられるように、様々なコンピュータハードウェア又はソフトウェアモジュールを含む専用又は汎用コンピュータ（例えば、図２のプロセッサ２５０）の使用を含んでもよい。さらに、上述したように、本開示に記載される実施形態は、記憶されたコンピュータ実行可能命令又はデータ構造を搬送し又は有するコンピュータ読取可能媒体（例えば、図２のメモリ２５２又はデータ記憶装置２５４）を使用して実施されてもよい。

本開示で用いられるとき、用語「モジュール」又は「コンポーネント」は、モジュール又はコンポーネントのアクションを実行するように構成された特定のハードウェア実装、及び／又はコンピューティングシステムの汎用ハードウェア（例えば、コンピュータ読取可能媒体、処理デバイスなど）に記憶及び／又は実行され得るソフトウェアオブジェクト又はソフトウェアルーチンを参照し得る。いくつかの実施形態において、本開示に記載される異なるコンポーネント、モジュール、エンジン、及びサービスが、コンピューティングシステム上で実行するオブジェクト又はプロセスとして（例えば、別個のスレッドとして）実現されてもよい。本開示に記載されるシステム及び方法のいくつかは、（汎用ハードウェアに記憶及び／又は実行される）ソフトウェアで実現されるものとして一般に記載されるが、特定のハードウェア実装、又はソフトウェアと特定のハードウェア実装との組み合わせもまた可能であり、企図される。本説明において、「コンピューティングエンティティ」は、本開示において前に定義された任意のコンピューティングシステム、又はコンピューティングシステム上で動作する任意のモジュール又はモジュレートの組み合わせでもよい。

本開示において、特に別記の特許請求の範囲（例えば、別記の特許請求の範囲の本文）において用いられる用語は、一般に「開放的」な用語として意図されている（例えば、用語「含んでいる」は、「含んでいるがこれに限定されない」と解釈されるべきであり、用語「有する」は、「少なくとも有する」と解釈されるべきであり、用語「含む」は、「含むがこれに限定されない」と解釈されるべきである等）。

さらに、特定数の導入された請求項記載が意図されている場合、そのような意図は請求項に明示的に記載され、そのような記載がない場合、そのような意図は存在しない。例えば、理解の助けとして、以下の別記の特許請求の範囲は、請求項記載を導入するために、導入フレーズ「少なくとも１つの」及び「１つ以上の」の使用を含むことがある。しかしながら、そのようなフレーズの使用は、不定冠詞「一の」（“a”又は“an”）による請求項記載の導入が、同じ請求項が導入フレーズ「１つ以上の」又は「少なくとも１つの」と「一の」などの不定冠詞とを含むときでも、そのような導入された請求項記載を含む任意の特定の請求項を１つのそのような記載のみ含む実施形態に限定することを暗に示すように見なされるべきではない（例えば、「一の」（“a”及び／又は“an”）は「少なくとも１つの」又は「１つ以上の」を意味するよう解釈されるべきである）。請求項記載を導入するために用いられる定冠詞の使用についても同様である。

さらに、特定数の導入された請求項記載が明示的に記載されている場合であっても、当業者は、そのような記載は少なくとも記載された数を意味するよう解釈されるべきであることを認識するであろう（例えば、他の修飾語を伴わない「２つの記載」というただそれだけの記載は、少なくとも２つの記載、又は２つ以上の記載を意味する）。さらに、「Ａ、Ｂ、及びＣ等のうち少なくとも１つ」又は「Ａ、Ｂ、及びＣ等のうち１つ以上」と類似の規定が用いられている例において、一般に、そのような構造は、Ａ単独、Ｂ単独、Ｃ単独、Ａ及びＢ共に、Ａ及びＣ共に、Ｂ及びＣ共に、又はＡ、Ｂ、及びＣ共に等を含むことが意図される。

さらに、明細書においてか、特許請求の範囲においてか、又は図面においてかにかかわらず、２つ以上の代替的な用語を提示するいかなる分離的なワード又はフレーズも、用語のうち１つ、用語のうちいずれか、又は双方の用語を含む可能性を考慮するよう理解されるべきである。例えば、フレーズ「Ａ又はＢ」は、「Ａ」又は「Ｂ」又は「Ａ及びＢ」の可能性を含むよう理解されるべきである。フレーズ「Ａ又はＢ」のこの解釈は、用語「Ａ及び／又はＢ」が「Ａ」又は「Ｂ」又は「Ａ及びＢ」の可能性を含むように時に用いられ得るとしても、依然として適用可能である。

本開示に記載される全ての例及び条件付き言語は、本開示及び発明者が当該技術分野を促進するために寄与した概念を理解する際に読者を助けるための教育的目的が意図され、このように具体的に記載された例及び条件に限定されないものとみなされるべきである。本開示の実施形態が詳細に説明されたが、本開示の主旨及び範囲から逸脱することなく様々な変更、置換、及び改変がなされ得る。

上記の実施形態につき以下の付記を残しておく。
（付記１）
ディスカッションフォーラムの投稿に含まれる質問からバグのあるコードスニペットを取得するステップであり、前記バグのあるコードスニペットは、エラーとコードの複数の行とを含む、ステップと、
前記質問に対する回答からテキストを取得するステップと、
前記テキストからキーワードを識別するステップと、
前記複数の行からの特定の行に、前記キーワードの１つ以上が前記特定の行の１つ以上の要素に対応することに基づいて、前記エラーに関連するものとしてマーク付けするステップと、
前記特定の行のマーク付けに基づいて１つ以上のソフトウェアプログラム修復動作を実行するステップと、
を含む方法。
（付記２）
特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のキーワードが前記１つ以上の要素に一致することに応答して決定するステップ、をさらに含む付記１に記載の方法。
（付記３）
特定のキーワードに関連づけられた関連づけ辞書（association dictionary）から特定のコード要素を識別するステップと、
前記特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のコード要素が前記特定の行の前記１つ以上の要素に一致することに応答して決定するステップと、
をさらに含む付記１に記載の方法。
（付記４）
前記バグのあるコードスニペットの前記複数の行の各それぞれの行に注釈付けして前記それぞれの行の要素の特徴を示すステップと、
特定のキーワードが前記特定の行の１つ以上の要素に対応するかどうかを、前記特定のキーワードのキーワードタイプと前記注釈付けにより示される前記要素の特徴との間の関係に基づいて決定するステップと、
をさらに含む付記１に記載の方法。
（付記５）
前記要素の特徴は、前記要素により実行される動作に関連する構造と、前記動作の実行に使用される要素に関連する内容とを含む、付記４に記載の方法。
（付記６）
前記キーワードの各々は、前記テキストの１つ以上の文字のテキスト文字列であり、前記テキストから特定のキーワードを識別することは、第１のキーワードとして、キーワードタイプのセットに含まれるタイプである第１のテキスト文字列を識別することを含む、付記１に記載の方法。
（付記７）
前記キーワードタイプのセットは、コードマークアップ、名詞、及び動詞を含む、付記６に記載の方法。
（付記８）
実行されることに応答してシステムに動作を実行させる命令を記憶するように構成された１つ以上の非一時的コンピュータ読取可能記憶媒体であって、前記動作は、
ディスカッションフォーラムの投稿に含まれる質問からバグのあるコードスニペットを取得することであり、前記バグのあるコードスニペットは、エラーとコードの複数の行とを含む、ことと、
前記質問に対する回答からテキストを取得することと、
前記テキストからキーワードを識別することと、
前記複数の行からの特定の行に、前記キーワードの１つ以上が前記特定の行の１つ以上の要素に対応することに基づいて、前記エラーに関連するものとしてマーク付けすることと、
前記特定の行のマーク付けに基づいて１つ以上のソフトウェアプログラム修復動作を実行することと、
を含む、１つ以上の非一時的コンピュータ読取可能記憶媒体。
（付記９）
前記動作は、特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のキーワードが前記１つ以上の要素に一致することに応答して決定することをさらに含む、付記８に記載の１つ以上の非一時的コンピュータ読取可能記憶媒体。
（付記１０）
前記動作は、
特定のキーワードに関連づけられた関連づけ辞書から特定のコード要素を識別することと、
前記特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のコード要素が前記特定の行の前記１つ以上の要素に一致することに応答して決定することと、
をさらに含む、付記８に記載の１つ以上の非一時的コンピュータ読取可能記憶媒体。
（付記１１）
前記動作は、
前記バグのあるコードスニペットの前記複数の行の各それぞれの行に注釈付けして前記それぞれの行の要素の特徴を示すことと、
特定のキーワードが前記特定の行の１つ以上の要素に対応するかどうかを、前記特定のキーワードのキーワードタイプと前記注釈付けにより示される前記要素の特徴との間の関係に基づいて決定することと、
をさらに含む、付記８に記載の１つ以上の非一時的コンピュータ読取可能記憶媒体。
（付記１２）
前記要素の特徴は、前記要素により実行される動作に関連する構造と、前記動作の実行に使用される要素に関連する内容とを含む、付記１１に記載の１つ以上の非一時的コンピュータ読取可能記憶媒体。
（付記１３）
前記キーワードの各々は、前記テキストの１つ以上の文字のテキスト文字列であり、前記テキストから特定のキーワードを識別することは、第１のキーワードとして、キーワードタイプのセットに含まれるタイプである第１のテキスト文字列を識別することを含む、付記８に記載の１つ以上の非一時的コンピュータ読取可能記憶媒体。
（付記１４）
前記キーワードタイプのセットは、コードマークアップ、名詞、及び動詞を含む、付記１３に記載の１つ以上の非一時的コンピュータ読取可能記憶媒体。
（付記１５）
システムであって、
１つ以上のプロセッサと、
前記１つ以上のプロセッサにより実行されることに応答して当該システムに動作を実行させる命令を記憶するように構成された１つ以上の非一時的コンピュータ読取可能記憶媒体と、を含み、前記動作は、
ディスカッションフォーラムの投稿に含まれる質問からバグのあるコードスニペットを取得することであり、前記バグのあるコードスニペットは、エラーとコードの複数の行とを含む、ことと、
前記質問に対する回答からテキストを取得することと、
前記テキストからキーワードを識別することと、
前記複数の行からの特定の行に、前記キーワードの１つ以上が前記特定の行の１つ以上の要素に対応することに基づいて、前記エラーに関連するものとしてマーク付けすることと、
前記特定の行のマーク付けに基づいて１つ以上のソフトウェアプログラム修復動作を実行することと、
を含む、システム。
（付記１６）
前記動作は、特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のキーワードが前記１つ以上の要素に一致することに応答して決定することをさらに含む、付記１５に記載のシステム。
（付記１７）
前記動作は、
特定のキーワードに関連づけられた関連づけ辞書から特定のコード要素を識別することと、
前記特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のコード要素が前記特定の行の前記１つ以上の要素に一致することに応答して決定することと、
をさらに含む、付記１５に記載のシステム。
（付記１８）
前記動作は、
前記バグのあるコードスニペットの前記複数の行の各それぞれの行に注釈付けして前記それぞれの行の要素の特徴を示すことと、
特定のキーワードが前記特定の行の１つ以上の要素に対応するかどうかを、前記特定のキーワードのキーワードタイプと前記注釈付けにより示される前記要素の特徴との間の関係に基づいて決定することと、
をさらに含む、付記１５に記載のシステム。
（付記１９）
前記要素の特徴は、前記要素により実行される動作に関連する構造と、前記動作の実行に使用される要素に関連する内容とを含む、付記１８に記載のシステム。
（付記２０）
前記キーワードの各々は、前記テキストの１つ以上の文字のテキスト文字列であり、前記テキストから特定のキーワードを識別することは、第１のキーワードとして、キーワードタイプのセットに含まれるタイプである第１のテキスト文字列を識別することを含む、付記１５に記載のシステム。

Claims

ディスカッションフォーラムの投稿に含まれる質問からバグのあるコードスニペットを取得するステップであり、前記バグのあるコードスニペットは、エラーとコードの複数の行とを含む、ステップと、
前記質問に対する回答からテキストを取得するステップと、
前記テキストからキーワードを識別するステップと、
前記複数の行からの特定の行に、前記キーワードの１つ以上が前記特定の行の１つ以上の要素に対応することに基づいて、前記エラーに関連するものとしてマーク付けするステップと、
前記特定の行のマーク付けに基づいて１つ以上のソフトウェアプログラム修復動作を実行するステップと、
を含む方法。
特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のキーワードが前記１つ以上の要素に一致することに応答して決定するステップ、をさらに含む請求項１に記載の方法。
特定のキーワードに関連づけられた関連づけ辞書から特定のコード要素を識別するステップと、
前記特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のコード要素が前記特定の行の前記１つ以上の要素に一致することに応答して決定するステップと、
をさらに含む請求項１に記載の方法。
前記バグのあるコードスニペットの前記複数の行の各それぞれの行に注釈付けして前記それぞれの行の要素の特徴を示すステップと、
特定のキーワードが前記特定の行の１つ以上の要素に対応するかどうかを、前記特定のキーワードのキーワードタイプと前記注釈付けにより示される前記要素の特徴との間の関係に基づいて決定するステップと、
をさらに含む請求項１に記載の方法。
前記要素の特徴は、前記要素により実行される動作に関連する構造と、前記動作の実行に使用される要素に関連する内容とを含む、請求項４に記載の方法。
前記キーワードの各々は、前記テキストの１つ以上の文字のテキスト文字列であり、前記テキストから特定のキーワードを識別することは、第１のキーワードとして、キーワードタイプのセットに含まれるタイプである第１のテキスト文字列を識別することを含む、請求項１に記載の方法。
前記キーワードタイプのセットは、コードマークアップ、名詞、及び動詞を含む、請求項６に記載の方法。
システムに動作を実行させるコンピュータプログラムであって、前記動作は、
ディスカッションフォーラムの投稿に含まれる質問からバグのあるコードスニペットを取得することであり、前記バグのあるコードスニペットは、エラーとコードの複数の行とを含む、ことと、
前記質問に対する回答からテキストを取得することと、
前記テキストからキーワードを識別することと、
前記複数の行からの特定の行に、前記キーワードの１つ以上が前記特定の行の１つ以上の要素に対応することに基づいて、前記エラーに関連するものとしてマーク付けすることと、
前記特定の行のマーク付けに基づいて１つ以上のソフトウェアプログラム修復動作を実行することと、
を含む、コンピュータプログラム。
前記動作は、特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のキーワードが前記１つ以上の要素に一致することに応答して決定することをさらに含む、請求項８に記載のコンピュータプログラム。
前記動作は、
特定のキーワードに関連づけられた関連づけ辞書から特定のコード要素を識別することと、
前記特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のコード要素が前記特定の行の前記１つ以上の要素に一致することに応答して決定することと、
をさらに含む、請求項８に記載のコンピュータプログラム。
前記動作は、
前記バグのあるコードスニペットの前記複数の行の各それぞれの行に注釈付けして前記それぞれの行の要素の特徴を示すことと、
特定のキーワードが前記特定の行の１つ以上の要素に対応するかどうかを、前記特定のキーワードのキーワードタイプと前記注釈付けにより示される前記要素の特徴との間の関係に基づいて決定することと、
をさらに含む、請求項８に記載のコンピュータプログラム。
前記要素の特徴は、前記要素により実行される動作に関連する構造と、前記動作の実行に使用される要素に関連する内容とを含む、請求項１１に記載のコンピュータプログラム。
前記キーワードの各々は、前記テキストの１つ以上の文字のテキスト文字列であり、前記テキストから特定のキーワードを識別することは、第１のキーワードとして、キーワードタイプのセットに含まれるタイプである第１のテキスト文字列を識別することを含む、請求項８に記載のコンピュータプログラム。
前記キーワードタイプのセットは、コードマークアップ、名詞、及び動詞を含む、請求項１３に記載のコンピュータプログラム。
システムであって、
１つ以上のプロセッサと、
前記１つ以上のプロセッサにより実行されることに応答して当該システムに動作を実行させる命令を記憶するように構成された１つ以上の非一時的コンピュータ読取可能記憶媒体と、を含み、前記動作は、
ディスカッションフォーラムの投稿に含まれる質問からバグのあるコードスニペットを取得することであり、前記バグのあるコードスニペットは、エラーとコードの複数の行とを含む、ことと、
前記質問に対する回答からテキストを取得することと、
前記テキストからキーワードを識別することと、
前記複数の行からの特定の行に、前記キーワードの１つ以上が前記特定の行の１つ以上の要素に対応することに基づいて、前記エラーに関連するものとしてマーク付けすることと、
前記特定の行のマーク付けに基づいて１つ以上のソフトウェアプログラム修復動作を実行することと、
を含む、システム。
前記動作は、特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のキーワードが前記１つ以上の要素に一致することに応答して決定することをさらに含む、請求項１５に記載のシステム。
前記動作は、
特定のキーワードに関連づけられた関連づけ辞書から特定のコード要素を識別することと、
前記特定のキーワードが前記特定の行の１つ以上の要素に対応することを、前記特定のコード要素が前記特定の行の前記１つ以上の要素に一致することに応答して決定することと、
をさらに含む、請求項１５に記載のシステム。
前記動作は、
前記バグのあるコードスニペットの前記複数の行の各それぞれの行に注釈付けして前記それぞれの行の要素の特徴を示すことと、
特定のキーワードが前記特定の行の１つ以上の要素に対応するかどうかを、前記特定のキーワードのキーワードタイプと前記注釈付けにより示される前記要素の特徴との間の関係に基づいて決定することと、
をさらに含む、請求項１５に記載のシステム。
前記要素の特徴は、前記要素により実行される動作に関連する構造と、前記動作の実行に使用される要素に関連する内容とを含む、請求項１８に記載のシステム。
前記キーワードの各々は、前記テキストの１つ以上の文字のテキスト文字列であり、前記テキストから特定のキーワードを識別することは、第１のキーワードとして、キーワードタイプのセットに含まれるタイプである第１のテキスト文字列を識別することを含む、請求項１５に記載のシステム。