本開示は、治療に応答するがんを有する対象の核酸における特定のタイプの一塩基多様性(SNV)の数、パーセンテージ、または比が、治療に応答しない対象のものとは異なるという決定に基づく。本開示はまた、治療に応答していた、かつ治療に応答し続けるがんを有する対象の核酸における特定のタイプのSNVの数、パーセンテージ、または比が、治療に応答していたが、次いで治療に応答するのをやめる、すなわち、治療に対する抵抗性を発生する対象のものとは異なるという決定にも基づく。SNVには、1つまたは複数の内在性デアミナーゼの活性に起因し得るもの、および、1つまたは複数の内在性デアミナーゼの活性には必ずしも起因し得ないものが含まれる。
本明細書に記載されるように、核酸分子において同定されるSNVを、複数のメトリックを決定するために用いることができ、これを次に、がん治療に応答する可能性が高い対象をがん治療に応答する可能性が低い対象から;および/または、がん治療に応答し続ける可能性が高い対象をがん治療に応答し続ける可能性が低い対象から、区別するのを手助けするために用いることができる。したがって、この複数のメトリックに基づいてプロファイルを作ることができ、そこでは、がん治療に応答する可能性が高い対象は、典型的には、がん治療に応答する可能性が低い対象とは異なるプロファイルを有し;かつがん治療に応答し続ける可能性が高い対象は、典型的には、がん治療に応答し続ける可能性が低い対象とは異なるプロファイルを有する。
1つの局面において、対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するためのシステムであって、a) 対象由来の核酸分子の配列を示す対象データを取得する;b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;c) 同定されたSNVを用いて、i) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;ii) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;iii) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;iv) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;v) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;vi) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および、vii) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群、を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する、1つまたは複数の電子処理装置を含む、システムが提供される。1つの態様において、複数のメトリックは、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む。
別の局面において、対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するためのシステムであって、a) 対象由来の核酸分子の配列を示す対象データを取得する;b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;c) 同定されたSNVを用いて、i) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;ii) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;iii) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;iv) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;v) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;vi) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;vii) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;viii) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;ix) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;x) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、xi) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群、から選択される3つ以上のメトリック群由来のメトリックを含む、複数のメトリックを決定する;ならびに、d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する、1つまたは複数の電子処理装置を含む、システムが提供される。1つの態様において、複数のメトリックは、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む。
1つの態様において、少なくとも1つの計算モデルは、決定木を含む。さらなる態様において、少なくとも1つの計算モデルは、複数の決定木を含み、治療指標は、複数の決定木由来の結果を集めることによって生成される、特定の例において、少なくとも1つのメトリックは、複数の決定木のうちの多数のものにおいて用いられる。
さらなる態様において、1つまたは複数の処理装置は、a) 各々の利用可能な群由来の少なくとも1つのメトリック;および、b) 少なくともいくつかの利用可能な群由来の少なくとも2つのメトリック、のうちの少なくとも1つを決定する。別の態様において、1つまたは複数の処理装置は、a) 少なくとも2メトリック;b) 少なくとも5メトリック;c) 少なくとも10メトリック;d) 少なくとも20メトリック;e) 少なくとも50メトリック;f) 少なくとも75メトリック;g) 少なくとも100メトリック;および、h) 少なくとも200メトリック、のうちの少なくとも1つを決定する。別の例において、1つまたは複数の処理装置は、a) メトリック群中のすべてのメトリックの少なくとも0.1%;b) メトリック群中のすべてのメトリックの少なくとも0.2%;c) メトリック群中のすべてのメトリックの少なくとも0.3%;d) メトリック群中のすべてのメトリックの少なくとも0.4%;e) メトリック群中のすべてのメトリックの少なくとも0.5%;f) メトリック群中のすべてのメトリックの少なくとも0.75%;g) メトリック群中のすべてのメトリックの少なくとも1%;h) メトリック群中のすべてのメトリックの少なくとも1.5%;および、i) メトリック群中のすべてのメトリックの少なくとも2%、のうちの少なくとも1つを決定する。
いくつかの態様において、1つまたは複数の処理装置は、a) 対象についての1つまたは複数の対象の性状を決定し;および、b) 1つまたは複数の対象の性状を用いて、少なくとも1つのメトリックが対象の性状と同様の性状を有する1つまたは複数の参照対象について導かれる参照メトリックに基づいて評価されるように、少なくとも1つの計算モデルを適用する。特定の例において、1つまたは複数の処理装置は、対象の性状を少なくとも部分的に用いて、複数のメトリックを選択する。さらなる例において、1つまたは複数の処理装置は、対象の性状、例えば、a) i) 対象の年齢;ii) 対象の身長;iii) 対象の体重;iv) 対象の性別;および、v) 対象の民族性を含む特性の群から選択される、1つまたは複数の対象の特性;b) i) 健康な身体状態;およびii) 不健康な身体状態を含む身体状態の群から選択される、1つまたは複数の身体状態;c) i) がんのタイプ;ii) がんのステージ;およびiii) 転移の存在を含む疾患状態の群から選択される、1つまたは複数の疾患状態;d) i) 免疫療法;ii) 放射線療法;およびiii) 非標的化学療法を含む医学的介入の群から選択される、1つまたは複数の医学的介入、を含む性状の群から選択されるものを少なくとも部分的に用いて、少なくとも1つの計算モデルを選択する。いくつかの態様において、1つまたは複数の処理装置は、a) 対象の病歴を質問することによる;b) 感知装置からのセンサーデータを受け取ることによる;および、c) ユーザー入力コマンドに従う、のうちの少なくとも1つで、対象の性状を決定する。
本開示のシステムのさらなる態様において、1つまたは複数の処理装置は、a) 治療指標の代表を表示する;b) その後の検索のために治療指標を保存する;および、c) 表示のためにクライアント装置に治療指標を提供する、のうちの少なくとも1つを行う。
本開示のさらなる局面は、対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のためのシステムであって、a) 複数の参照対象の各々について:i) (1) 参照対象由来の核酸分子の配列;および、(2) がん治療に対する応答性を示す参照対象データを取得する;ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;iii) 同定されたSNVを用いて、1) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;2) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;3) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;4) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;5) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;6) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および、7) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群、を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、b) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する、1つまたは複数の電子処理装置を含む、システムを提供する。いくつかの態様において、複数のメトリックは、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む。
本開示の別の局面は、対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のためのシステムであって、a) 複数の参照対象の各々について:i) (1) 参照対象由来の核酸分子の配列;および、(2) がん治療に対する応答性を示す参照対象データを取得する;ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;iii) 同定されたSNVを用いて、1) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;2) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;3) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;4) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;5) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;6) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;7) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;8) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;9) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;10) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、11) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群、から選択されるメトリック群のうちの3つ以上由来のメトリックを含む、複数のメトリックを決定する;ならびに、b) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する、1つまたは複数の電子処理装置を含む、システムを提供する。いくつかの態様において、複数のメトリックは、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む。
少なくとも1つの計算モデルの算出における使用のためのシステムのいくつかの態様において、1つまたは複数の処理装置は、少なくとも1つの計算モデルを試験して、モデルの識別性能を判定する。識別性能は、a) 受信者動作特性曲線下の面積;b) 精度;c) 感度;および、d) 特異性、のうちの少なくとも1つに基づき得る。いくつかの例において、識別性能は、少なくとも70%である。
少なくとも1つの計算モデルの算出における使用のためのシステムのさらなる態様において、1つまたは複数の処理装置は、複数の参照対象のサブセット由来の参照対象データを用いて、少なくとも1つの計算モデルを試験する。追加的な態様において、1つまたは複数の処理装置は、a) 複数の参照メトリックを選択する;b) 複数の参照メトリックを用いて、少なくとも1つの計算モデルを訓練する;c) 少なくとも1つの計算モデルを試験して、モデルの識別性能を判定する;ならびに、d) モデルの識別性能が閾値よりも下に下がる場合には、i) 異なる複数の参照メトリックを用いて、少なくとも1つの計算モデルを選択的に再訓練する;および、ii) 異なる計算モデルを訓練する、のうちの少なくとも1つを行う。
少なくとも1つの計算モデルの算出における使用のためのシステムの他の態様において、1つまたは複数の処理装置は、a) 複数の参照メトリックの組み合わせを選択する;b) 組み合わせの各々を用いて、複数の計算モデルを訓練する;c) 各々の計算モデルを試験して、モデルの識別性能を判定する;および、d) 治療指標の決定における使用のために、最高の識別性能を有する少なくとも1つの計算モデルを選択する。追加的な例において、1つまたは複数の処理装置は、a) 1つまたは複数の参照対象の性状を決定する;および、b) 1つまたは複数の参照対象の性状を用いて、少なくとも1つの計算モデルを訓練する。特定の例において、1つまたは複数の処理装置は、a) 参照対象の性状を用いてクラスタリングを行って、同様の参照対象の性状を有する参照対象のクラスターを決定する;および、b) 少なくとも部分的に参照対象のクラスターを用いて、少なくとも1つの計算モデルを訓練する。1つまたは複数の参照対象の性状は、a) i) 対象の年齢;ii) 対象の身長;iii) 対象の体重;iv) 対象の性別;および、v) 対象の民族性を含む特性の群から選択される、1つまたは複数の対象の特性;b) i) 健康な身体状態;およびii) 不健康な身体状態を含む身体状態の群から選択される、1つまたは複数の身体状態;c) i) がんのタイプ;ii) がんのステージ;およびiii) 転移の存在を含む疾患状態の群から選択される、1つまたは複数の疾患状態;d) i) 免疫療法;ii) 放射線療法;およびiii) 非標的化学療法を含む医学的介入の群から選択される、1つまたは複数の医学的介入、を含む性状の群から選択され得る。
少なくとも1つの計算モデルの算出における使用のためのシステムのさらなる態様において、少なくとも1つの計算モデルは、決定木を含む。1つの例において、少なくとも1つの計算モデルは、複数の決定木を含み、治療指標は、複数の決定木由来の結果を集めることによって生成される、特定の例において、少なくとも1つのメトリックは、複数の決定木のうちの多数のものにおいて用いられる。
少なくとも1つの計算モデルの算出における使用のためのシステムの追加的な態様において、1つまたは複数の処理装置は、a) 少なくとも1000メトリック;b) 少なくとも2000メトリック;c) 少なくとも3000メトリック;d) 少なくとも4000メトリック;および、e) 少なくとも5000メトリック、のうちの少なくとも1つを用いて、モデルを訓練する。1つの例において、結果として生じたモデルは、a) 少なくとも2メトリック;b) 少なくとも5メトリック;c) 少なくとも10メトリック;d) 少なくとも20メトリック;e) 少なくとも50メトリック;f) 少なくとも75メトリック;g) 少なくとも100メトリック;および、h) 少なくとも200メトリック、のうちの少なくとも1つを用いる。特定の例において、結果として生じたモデルは、a) メトリック群中のすべてのメトリックの少なくとも0.1%;b) メトリック群中のすべてのメトリックの少なくとも0.2%;c) メトリック群中のすべてのメトリックの少なくとも0.3%;d) メトリック群中のすべてのメトリックの少なくとも0.4%;e) メトリック群中のすべてのメトリックの少なくとも0.5%;f) メトリック群中のすべてのメトリックの少なくとも0.75%;g) メトリック群中のすべてのメトリックの少なくとも1%;g) メトリック群中のすべてのメトリックの少なくとも1.5%;および、i) メトリック群中のすべてのメトリックの少なくとも2%、のうちの少なくとも1つを用いる。
別の局面において、対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するための方法であって、1つまたは複数の電子処理装置において、a) 対象由来の核酸分子の配列を示す対象データを取得する工程;b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する工程;c) 同定されたSNVを用いて、i) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;ii) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;iii) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;iv) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;v) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;vi) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および、vii) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群、を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する工程、を含む方法が提供される。いくつかの態様において、複数のメトリックは、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む。
また、対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するための方法であって、1つまたは複数の電子処理装置において、a) 対象由来の核酸分子の配列を示す対象データを取得する工程;b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する工程;c) 同定されたSNVを用いて、i) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;ii) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;iii) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;iv) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;v) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;vi) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;vii) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;viii) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;ix) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;x) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、xi) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群、を含むメトリック群のうちの3つ以上由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する工程、を含む方法も提供される。いくつかの態様において、複数のメトリックは、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む。
さらなる局面において、対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するためのコンピュータプログラム製品であって、1つまたは複数の適切にプログラムされた電子処理装置によって実行される時に、該1つまたは複数の電子処理装置に、a) 対象由来の核酸分子の配列を示す対象データを取得する;b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;c) 同定されたSNVを用いて、i) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;ii) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;iii) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;iv) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;v) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;vi) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および、vii) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群、を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する、ようにさせるコンピュータ実行可能コードを含む、コンピュータプログラム製品が提供される。1つの態様において、複数のメトリックは、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む。
また、対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するためのコンピュータプログラム製品であって、1つまたは複数の適切にプログラムされた電子処理装置によって実行される時に、該1つまたは複数の電子処理装置に、a) 対象由来の核酸分子の配列を示す対象データを取得する;b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;c) 同定されたSNVを用いて、i) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;ii) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;iii) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;iv) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;v) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;vi) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;vii) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;viii) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;ix) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;x) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、xi) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群、を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する、ようにさせるコンピュータ実行可能コードを含む、コンピュータプログラム製品も提供される。1つの態様において、複数のメトリックは、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む。
さらなる局面において、生物学的対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のためのコンピュータプログラム製品であって、1つまたは複数の適切にプログラムされた電子処理装置によって実行される時に、該1つまたは複数の電子処理装置に、a) 複数の参照対象の各々について:i) (1) 参照対象由来の核酸分子の配列;および、(2) がん治療に対する応答性を示す参照対象データを取得する;ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;iii) 同定されたSNVを用いて、1) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;2) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;3) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;4) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;5) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;6) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および、7) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群、を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、d) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する、ようにさせるコンピュータ実行可能コードを含む、コンピュータプログラム製品が提供される。1つの態様において、複数のメトリックは、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む。
本開示の別の局面は、生物学的対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のためのコンピュータプログラム製品であって、1つまたは複数の適切にプログラムされた電子処理装置によって実行される時に、該1つまたは複数の電子処理装置に、a) 複数の参照対象の各々について:i) (1) 参照対象由来の核酸分子の配列;および、(2) がん治療に対する応答性を示す参照対象データを取得する;ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;iii) 同定されたSNVを用いて、1) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;2) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;3) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;4) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;5) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;6) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;7) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;8) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;9) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;10) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、11) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群、を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、d) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する、ようにさせるコンピュータ実行可能コードを含む、コンピュータプログラム製品を提供する。1つの態様において、複数のメトリックは、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む。
さらなる局面において、生物学的対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のための方法であって、1つまたは複数の電子処理装置において、a) 複数の参照対象の各々について:i) (1) 参照対象由来の核酸分子の配列;および、(2) がん治療に対する応答性を示す参照対象データを取得する工程;ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する工程;iii) 同定されたSNVを用いて、1) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;2) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;3) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;4) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;5) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;6) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および、7) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群、を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、b) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する工程、を含む方法が提供される。特定の態様において、複数のメトリックは、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む。
別の局面において、生物学的対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のための方法であって、1つまたは複数の電子処理装置において、a) 複数の参照対象の各々について:i) (1) 参照対象由来の核酸分子の配列;および、(2) がん治療に対する応答性を示す参照対象データを取得する工程;ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する工程;iii) 同定されたSNVを用いて、1) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;2) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;3) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;4) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;5) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;6) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;7) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;8) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;9) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;10) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、11) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群、を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、b) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する工程、を含む方法が提供される。特定の態様において、複数のメトリックは、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む。
また、がんを有する対象が、がん治療に応答するかまたはがん治療に応答し続ける可能性を判定するための方法であって、がんを有する対象由来の核酸分子の配列を解析して、核酸分子内のSNVを検出する工程;メトリックの対象プロファイルを取得するために、検出されたSNVの数および/またはタイプに基づいて、以下のメトリック群:i) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;ii) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;iii) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;iv) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;v) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;vi) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および、vii) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群、のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、メトリックの対象プロファイルと参照プロファイルとの間の比較に基づいて、がん治療に応答する対象の可能性を判定する工程、を含む方法も提供される。いくつかの態様において、複数のメトリックは、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む。
本開示の別の局面は、がんを有する対象が、がん治療に応答するかまたはがん治療に応答し続ける可能性を判定するための方法であって、がんを有する対象由来の核酸分子の配列を解析して、核酸分子内のSNVを検出する工程;メトリックの対象プロファイルを取得するために、検出されたSNVの数および/またはタイプに基づいて、以下のメトリック群:i) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;ii) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;iii) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;iv) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;v) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;vi) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;vii) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;viii) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;ix) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;x) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、xi) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群、のうちの3つ以上由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、メトリックの対象プロファイルと参照プロファイルとの間の比較に基づいて、がん治療に応答する対象の可能性を判定する工程、を含む方法を提供する。いくつかの態様において、複数のメトリックは、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む。
がんを有する対象が、がん治療に応答するかまたは応答し続ける可能性を判定するための方法の選択態様において、参照プロファイルは、計算モデルを用いて作製される。さらなる態様において、対象は、がん治療を受けていてもよく、方法は、対象ががん治療に応答し続ける可能性を判定するためである。さらに、方法は、対象ががん治療に応答する可能性が高いと判定された場合には、がん治療を始める;対象ががん治療に応答し続ける可能性が高いと判定された場合には、がん治療を続ける;対象ががん治療に応答する可能性が低いと判定された場合には、異なるがん治療を始める;または、対象ががん治療に応答し続ける可能性が低いと判定された場合には、がん治療をやめる、ように対象に推奨を提供する工程を、さらに含むことができる。
上記のおよび本明細書に記載のシステム、コンピュータプログラム製品、または方法のいずれかのいくつかの態様において、複数のメトリックは、モチーフメトリック群およびコドンコンテキストメトリック群由来のメトリックを含む。さらなる例において、複数のメトリックは、モチーフメトリック群、コドンコンテキストメトリック群、および転位/転換メトリック群由来のメトリックを含む。いくつかの例において、モチーフメトリック群は、1つまたは複数のデアミナーゼモチーフにおけるSNVに関連するデアミナーゼモチーフメトリック群を含む。例えば、デアミナーゼモチーフメトリック群は、活性化誘導シチジンデアミナーゼ(AID)、アポリポタンパク質B mRNA編集酵素触媒ポリペプチド様(APOBEC)1シトシンデアミナーゼ(APOBEC1)、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、およびRNAに作用するアデニンデアミナーゼ(ADAR)モチーフメトリック群の中から選択される群を含んでもよく、各群は、それぞれ、1つまたは複数のAID、APOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、またはADARモチーフにおけるSNVに関連している。デアミナーゼモチーフがAIDモチーフである場合、それは、
の中から選択されてもよい。デアミナーゼモチーフがADARモチーフである場合、それは、
の中から選択されてもよい。デアミナーゼモチーフがAPOBEC3Gモチーフである場合、それは、
の中から選択されてもよい。デアミナーゼモチーフがAPOBEC3Bモチーフである場合、それは、
の中から選択されてもよい。デアミナーゼモチーフがAPOBEC3Fモチーフである場合、それは、
であってもよい。デアミナーゼモチーフがAPOBEC1モチーフである場合、それは、
であってもよい。
上記のおよび本明細書に記載のシステム、コンピュータプログラム製品、または方法のさらなる例において、モチーフメトリック群は、1つまたは複数の3マーモチーフにおけるSNVを示す3マーモチーフメトリック群を含む。3マーモチーフメトリック群は、1つまたは複数の3マーモチーフの1位、2位、および/または3位でSNVを示してもよい。他の例において、モチーフメトリック群は、1つまたは複数の5マーモチーフにおけるSNVを示す5マーモチーフメトリック群を含み、5マーモチーフメトリック群は、1つまたは複数の5マーモチーフの1位、2位、3位、4位、および/または5位でSNVを示してもよい。
上記のおよび本明細書に記載のシステム、コンピュータプログラム製品、または方法の特定の例において、がん治療は、放射線療法、非標的化学療法、ホルモン療法、免疫療法、または標的療法の中から選択される。
免疫療法または標的療法は、抗体、例えば、CTLA-4、PD-1、PD-L1、CD-52、CD19、CD20、CD27、CD30、CD38、CD137、HER-2、EGFR、VEGF、VEGFR、RANKL、BAFF、Nectin-4、OX40、gpNMB、SLAM7、B4GALNT1、PDGFRα、IL-1β、IL-6、およびIL-6Rに特異的な抗体の中から選択されるものを含んでもよい。特定の態様において、抗体は、PD-1、PD-L1、CTLA-4、またはHER2に特異的である。さらなる態様において、抗体は、補体依存性細胞傷害活性(CDC)または抗体依存性細胞性細胞傷害活性(ADCC)を誘導することができる。抗体の非限定的な例には、トラスツズマブエムタンシン(Ado-trastuzumab emtansine)、アレムツズマブ、アテゾリズマブ、アベルマブ、ベリムマブ、ベリノスタット、ベバシズマブ、ブリナツモマブ、ブレンツキシマブベドチン、カナキヌマブ、セツキシマブ、ダラツムマブ、デノスマブ、ジヌツキシマブ、デュルバルマブ、エロツズマブ、エンホルツマブ、グレンバツムマブ(Glembatumumab)、GSK3174998、イブリツモマブチウキセタン、イピリムマブ、ネシツムマブ、ニボルマブ、オビヌツズマブ、オファツムマブ、オララツマブ、パニツムマブ、ペムブロリズマブ、ペルツズマブ、PF-04518600、ピディリズマブ、ポガリズマブ(Pogalizumab)、ラムシルマブ、リツキシマブ、シルツキシマブ、タボリキシズマブ(Tavolixizumab)、トシリズマブ、トシツモマブ、トラスツズマブ、トレメリムマブ、ウレルマブ、およびバルリルマブ(Varlilumab)が含まれる。
さらなる態様において、標的療法は、小分子、例えばチロシンキナーゼ阻害剤である。
上記のおよび本明細書に記載のシステム、コンピュータプログラム製品、または方法のいずれかにおいて、対象は、乳がん、前立腺がん、肝臓がん、大腸がん、胃腸がん、膵臓がん、皮膚がん、甲状腺がん、子宮頸がん、リンパ系がん、造血器がん、膀胱がん、肺がん、腎がん、卵巣がん、子宮がん、および頭頚部がんの中から選択されるがんを有し得る。
また、対象においてがんを処置するためのがん治療の使用であって、上記のおよび本明細書に記載の方法による対象ががん治療に応答する可能性が高いという判定に基づいて、該対象にがん治療を受けさせる、使用も提供される。追加的に、対象においてがんを処置するための方法であって、がんを有する対象が、がん治療に応答するかまたはがん治療に応答し続ける可能性を判定するために、上記のおよび本明細書に記載の方法を行う工程、および、対象ががん治療に応答するかまたは応答し続ける可能性が高いと判定された場合には、該対象にがん治療を受けさせる工程、を含む方法が提供される。
本開示のさらなる局面は、以下の工程を含む、対象においてがんを処置するための方法を提供する:(a) (i) がんを有する対象が、がん治療に応答するかまたはがん治療に応答し続ける可能性を判定するために、上記のおよび本明細書に記載の方法を実施する;かつ(ii) 該方法の結果を提供するために、対象から得られた生物学的試料を検査室に送る工程であって、該結果が、対象ががん治療に応答するかまたは応答し続ける可能性が高いかどうかの判定を含む、工程;(b) 工程(a)からの結果を受け取る工程;および、(c) 結果が、対象ががん治療に応答するかまたは応答し続ける可能性が高いという判定を含む場合には、該対象にがん治療を受けさせる工程。
さらなる局面において、がんを有する対象が、がん治療に応答するかまたはがん治療に応答し続ける可能性を判定するための方法であって、がんを有する対象由来の核酸分子の配列を解析して、核酸分子内のSNVを検出する工程;メトリックの対象プロファイルを取得するために、検出されたSNVの数および/またはタイプに基づいて、複数のメトリックを決定する工程;ならびに、メトリックの対象プロファイルと参照プロファイルとの間の比較に基づいて、がん治療に応答する対象の可能性を判定する工程、を含む方法が提供される。
1つの態様において、対象におけるSNVのタイプおよび数を、デアミナーゼ活性の1つまたは複数の遺伝学的指標を測定するために用いることができる。治療に応答する対象は、治療に応答しない対象と比較して、デアミナーゼ活性の遺伝学的指標の異なるプロファイルを有する。理論に束縛されることなく、治療に対する応答性に関連するデアミナーゼ活性の遺伝学的指標のプロファイルは、有効に機能しているか、または治療に応答するかもしくは治療に応答し続ける対象の能力に直接または間接的に関連する質および/もしくは量のものである、デアミナーゼ関連免疫応答を反映することが仮定される。対照的に、治療に応答しないかまたは治療に応答するのをやめる対象は、典型的には、デアミナーゼ活性の遺伝学的指標の異なるプロファイルを有し、そのようなプロファイルは、対照群の対象(すなわち、治療に応答するかまたは治療に応答し続ける対象)と比較してこれらの対象において損なわれているかまたは調節不全になっているデアミナーゼ関連免疫応答を反映することが仮定される。
1つの態様において、治療に応答するかまたは治療に応答し続ける対象は、典型的には、ある特定の範囲間隔(治療応答範囲間隔)内である、デアミナーゼ活性の1つまたは複数の遺伝学的指標の値(例えば、パーセンテージ、比、または数)を有する。理論に束縛されることなく、この治療応答範囲間隔内のデアミナーゼ活性の遺伝学的指標の存在は、有効に機能しているか、または治療に応答するかもしくは治療に応答し続ける対象の能力に直接または間接的に関連する質および/もしくは量のものである、デアミナーゼ関連免疫応答を反映することが仮定される。対照的に、治療に応答しないかまたは治療に応答するのをやめる対象は、典型的には、治療応答範囲間隔の外側である、デアミナーゼ活性の1つまたは複数の遺伝学的指標の値(例えば、パーセンテージ、比、または数)を有する。再び、理論に束縛されることなく、治療応答範囲間隔の外側のデアミナーゼ活性の遺伝学的指標の存在は、対照群の対象(すなわち、治療に応答するかもしくは治療に応答し続ける対象)と比較してこれらの対象において損なわれているかもしくは調節不全になっているデアミナーゼ関連免疫応答を反映するか、または治療に応答する対象の能力には関連しない質および/もしくは量のものであるデアミナーゼ関連免疫応答を反映することが仮定される。
デアミナーゼ活性のこれらの遺伝学的指標は、したがって、がんを有する対象が所与のがん治療に応答するか否か、および対象ががん治療に応答し続けるか否かを予測するために用いることができる。本明細書において開示される方法は、したがって、対象が治療に応答する可能性が高いかどうかまたは対象が治療に応答する可能性が低いかどうか、および対象が治療に応答し続ける可能性が高いかどうかまたは対象が治療に応答し続ける可能性が低い(すなわち、治療に対する抵抗性を発生させ、したがって治療に応答するのをやめる可能性が高い)かどうかを正確に予測するための手段を提供する。方法はまた、治療適用に拡大することもでき、それにより、治療の経過が、本明細書に記載の予測方法によって提供される情報に基づいて規定される。
1つの局面において、本開示は、がんを有する対象が、がん治療に応答するかまたはがん治療に応答し続ける可能性を判定するための方法であって、がんを有する対象由来の核酸分子の配列を解析して、一塩基多様性(SNV)を検出する工程;検出されたSNVの数および/またはタイプに基づいて、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標を測定する工程;ならびに、内在性デアミナーゼ活性の遺伝学的指標のいずれも、内在性デアミナーゼ活性の遺伝学的指標についてあらかじめ決定された治療応答範囲間隔の外側ではない場合、対象ががん治療に応答する可能性が高いかもしくはがん治療に応答し続ける可能性が高いと判定する工程;または、内在性デアミナーゼ活性の遺伝学的指標の少なくとも1つが、内在性デアミナーゼ活性の遺伝学的指標についてあらかじめ決定された治療応答範囲間隔の外側である場合、対象ががん治療に応答する可能性が低いかもしくはがん治療に応答し続ける可能性が低いと判定する工程、を含む方法を提供する。
がんを有する対象が、がん治療に応答するかまたはがん治療に応答し続ける可能性を判定するための方法であって、がんを有する対象由来の核酸分子の配列を解析して、SNVを検出する工程;検出されたSNVの数および/またはタイプに基づいて、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標を測定する工程;内在性デアミナーゼ活性の遺伝学的指標についてあらかじめ決定された治療応答範囲間隔の外側である、内在性デアミナーゼ活性の各遺伝学的指標に対してスコアを割り当てる工程および各スコアを合わせて総スコアを算出する工程;ならびに、総スコアが閾値スコアと同等であるかもしくはそれよりも小さい場合、対象ががん治療に応答する可能性が高いかもしくはがん治療に応答し続ける可能性が高いと判定する工程、または、総スコアが閾値スコアと同等であるかもしくはそれよりも大きい場合、対象ががん治療に応答する可能性が低いかもしくはがん治療に応答し続ける可能性が低いと判定する工程、を含む方法。
特定の態様において、内在性デアミナーゼは、活性化誘導シトシンデアミナーゼ(AID)、アポリポタンパク質B mRNA編集酵素触媒ポリペプチド様(APOBEC)1シトシンデアミナーゼ(APOBEC1)、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、およびRNAに作用するアデニンデアミナーゼ(ADAR)のうちのいずれか1つまたは複数である。
1つの例において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、デアミナーゼモチーフでのSNVの数もしくはパーセンテージ;特定のコドンコンテキストを有するSNVの数もしくはパーセンテージ;SNVのストランドバイアス;またはアデニン、チミジン、グアニン、もしくはシトシンを標的とするSNVの数もしくはパーセンテージの測定値である。
さらなる例において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、デアミナーゼモチーフにあるSNVのパーセンテージ;MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ;チミンヌクレオチドの変異に起因するSNVのパーセンテージ;シトシンヌクレオチドの変異に起因するSNVのパーセンテージ;グアニンヌクレオチドの変異に起因するSNVのパーセンテージ;シトシンヌクレオチドの変異に起因するSNVのパーセンテージ対グアニンヌクレオチドの変異に起因するSNVのパーセンテージの比(C:G比);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(A:T比);アデニンまたはチミンヌクレオチドの変異に起因するSNVのパーセンテージ対シトシンまたはグアニンヌクレオチドの変異に起因するSNVのパーセンテージの比(AT:GC比);MC-1部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位で起こるグアニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるグアニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるグアニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こったAIDモチーフWRC/GYWでのSNVのパーセンテージ;G>A変異を含み、かつMC-3部位で起こるAIDモチーフGYWでのSNVのパーセンテージ;C>T変異を含み、かつMC-1部位で起こるAPOBEC3BモチーフTCAでのSNVのパーセンテージ;C>T変異を含み、かつMC-3部位で起こるAPOBEC3BモチーフTCAでのSNVのパーセンテージ;グアニンの変異に起因するSNVの転位-転換比;シトシンまたはグアニンの変異に起因するSNVの転位-転換比;および、デアミナーゼモチーフWA中ではないアデニンヌクレオチドの変異に起因するSNVの数対デアミナーゼモチーフTW中ではないチミンヌクレオチドの変異に起因するSNVの数の比の中から選択される。
いくつかの態様において、デアミナーゼモチーフは、AIDモチーフ、APOBEC1モチーフ、APOBEC3Aモチーフ、APOBEC3Bモチーフ、APOBEC3Cモチーフ、APOBEC3Dモチーフ、APOBEC3Fモチーフ、APOBEC3Gモチーフ、APOBEC3Hモチーフ、およびADARモチーフから選択される。
さらなる態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標には、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;およびAPOBEC3BモチーフでのSNVのパーセンテージが含まれる。
特定の態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;APOBEC3BモチーフでのSNVのパーセンテージ;MC-3部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるグアニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(A:T比);シトシンまたはグアニンの変異に起因するSNVの転位-転換比から選択されるかまたはそれを含む。
さらなる態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;APOBEC3BモチーフでのSNVのパーセンテージ;MC-2部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;グアニンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(A:T比);シトシンまたはグアニンの変異に起因するSNVの転位-転換比から選択されるかまたはそれを含む。
別の態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;APOBEC3BモチーフでのSNVのパーセンテージ;MC-1部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ(C_MC1%);MC-2部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;チミンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(A:T比);グアニンの変異に起因するSNVの転位-転換比から選択されるかまたはそれを含む。
またさらなる態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;APOBEC3BモチーフでのSNVのパーセンテージ;MC-2部位で起こったAIDモチーフWRC/GYWでのSNVのパーセンテージ;G>A変異を含み、かつMC-3部位で起こるAIDモチーフGYWでのSNVのパーセンテージ;C>T変異を含み、かつMC-1部位で起こるAPOBEC3BモチーフTCAでのSNVのパーセンテージ;C>T変異を含み、かつMC-3部位で起こるAPOBEC3BモチーフTCAでのSNVのパーセンテージ;MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;グアニンヌクレオチドの変異に起因するSNVのパーセンテージ;シトシンヌクレオチドの変異に起因するSNVのパーセンテージ;デアミナーゼモチーフWA中ではないアデニンヌクレオチドの変異に起因するSNVの数対デアミナーゼモチーフTW中ではないチミンヌクレオチドの変異に起因するSNVの数の比;グアニンまたはシトシンの変異に起因するSNVの転位-転換比から選択されるかまたはそれを含む。
別の態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;APOBEC3BモチーフでのSNVのパーセンテージ;MC-1部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ(A_MC1%);MC-2部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ(A_MC2%);MC-3部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ(A_MC3%);MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;チミンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ;シトシンヌクレオチドの変異に起因するSNVのパーセンテージ対グアニンヌクレオチドの変異に起因するSNVのパーセンテージの比;グアニンまたはシトシンの変異に起因するSNVの転位-転換比から選択されるかまたはそれを含む。
いくつかの例において、AIDモチーフは、核酸配列
(配列中、下線を引いたヌクレオチドは変異している)を含むモチーフの中から選択され;ADARモチーフは、核酸配列
(配列中、下線を引いたヌクレオチドは変異している)を含むモチーフの中から選択され;APOBEC3Gモチーフは、核酸配列
(配列中、下線を引いたヌクレオチドは変異している)を含むモチーフの中から選択され;デアミナーゼモチーフは、核酸配列
(配列中、下線を引いたヌクレオチドは変異している)を含むモチーフの中から選択されるAPOBEC3Bモチーフであり;デアミナーゼモチーフは、核酸配列
(配列中、下線を引いたヌクレオチドは変異している)を含むAPOBEC3Hモチーフであり;デアミナーゼモチーフは、核酸配列
(配列中、下線を引いたヌクレオチドは変異している)を含むモチーフの中から選択されるAPOBEC1モチーフであり;かつ/または、デアミナーゼモチーフは、核酸配列
(配列中、下線を引いたヌクレオチドは変異している)を含むモチーフの中から選択されるAPOBEC3AまたはAPOBEC3Fモチーフである。
特定の態様において、対象は、がん治療を受けており、方法は、対象ががん治療に応答し続ける可能性を判定するためである。他の態様において、対象は、がん治療を受けておらず、方法は、対象ががん治療に応答する可能性を判定するためである。がん治療は、例えば、放射線療法、非標的化学療法、ホルモン療法、免疫療法、または標的療法から選択されてもよい。いくつかの例において、免疫療法または標的療法は、抗体、例えば、CTLA-4、PD-1、PD-L1、CD-52、CD19、CD20、CD27、CD30、CD38、CD137、HER-2、EGFR、VEGF、VEGFR、RANKL、BAFF、Nectin-4、OX40、gpNMB、SLAM7、B4GALNT1、PDGFRα、PDGFRβ、IL-1β、IL-6、およびIL-6Rに特異的な抗体の中から選択される抗体(例えば、Ado-トラスツズマブエムタンシン、アレムツズマブ、アテゾリズマブ、アベルマブ、ベリムマブ、ベリノスタット、ベバシズマブ、ブリナツモマブ、ブレンツキシマブベドチン、カナキヌマブ、セツキシマブ、ダラツムマブ、デノスマブ、ジヌツキシマブ、デュルバルマブ、エロツズマブ、エンホルツマブ)、グレンバツムマブ、GSK3174998、イブリツモマブチウキセタン、イピリムマブ、ネシツムマブ、ニボルマブ、オビヌツズマブ、オファツムマブ、オララツマブ、パニツムマブ、ペムブロリズマブ、ペルツズマブ、PF-04518600、ピディリズマブ、ポガリズマブ、ラムシルマブ、リツキシマブ、シルツキシマブ、タボリキシズマブ、トシリズマブ、トシツモマブ、トラスツズマブ、トレメリムマブ、ウレルマブ、およびバルリルマブを含む。特定の例において、抗体は、補体依存性細胞傷害活性(CDC)または抗体依存性細胞性細胞傷害活性(ADCC)を誘導することができる。他の例において、標的療法は、小分子、例えばチロシンキナーゼ阻害剤である。
いくつかの態様において、核酸分子は、腫瘍生検または液体生検から取得されている。特定の態様において、方法は、対象から(例えば、腫瘍生検または液体生検である)生物学的試料を取得する工程、および核酸分子を抽出する工程を含む。
いくつかの例において、方法は、対象ががん治療に応答する可能性が高いと判定された場合には、がん治療を始める;対象ががん治療に応答し続ける可能性が高いと判定された場合には、がん治療を続ける;対象ががん治療に応答する可能性が低いと判定された場合には、異なるがん治療を始める;または、対象ががん治療に応答し続ける可能性が低いと判定された場合には、がん治療をやめる、ように対象に推奨を提供する工程を、さらに含む。
本開示の方法は、乳がん、前立腺がん、肝臓がん、大腸がん、胃腸がん、膵臓がん、皮膚がん、甲状腺がん、子宮頸がん、リンパ系がん、造血器がん、膀胱がん、肺がん、腎がん、卵巣がん、子宮がん、および頭頚部がんを含むがそれらに限定されない任意のがんを有する対象を評価するために有用であり得る。
さらなる局面において、本開示は、対象においてがんを処置するためのがん治療の使用であって、上記のおよび本明細書に記載の方法による対象ががん治療に応答する可能性が高いという判定に基づいて、該対象にがん治療を受けさせる、使用を提供する。
特定の局面において、対象においてがんを処置するための方法であって、上記のおよび本明細書に記載の方法を行う工程、および、対象ががん治療に応答するかまたは応答し続ける可能性が高いと判定された場合には、該対象にがん治療を受けさせる工程、を含む方法が提供される。
さらなる局面において、本開示は、以下の工程を含む、対象においてがんを処置するための方法を提供する:(a) (i) 上記のおよび本明細書に記載の方法を実施する;かつ(ii) 該方法の結果を提供するために、対象から得られた生物学的試料を検査室に送る工程であって、該結果が、対象ががん治療に応答するかまたは応答し続ける可能性が高いかどうかの判定を含む、工程;(b) 工程(a)からの結果を受け取る工程;および、(c) 結果が、対象ががん治療に応答するかまたは応答し続ける可能性が高いという判定を含む場合には、該対象にがん治療を受けさせる工程。
[本発明1001]
対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するためのシステムであって、
a) 対象由来の核酸分子の配列を示す対象データを取得する;
b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;
c) 同定されたSNVを用いて、
i) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;
ii) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
iii) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
iv) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
v) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
vi) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および
vii) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群
を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;
d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する、
1つまたは複数の電子処理装置を含む、システム。
[本発明1002]
前記複数のメトリックが、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む、本発明1001のシステム。
[本発明1003]
対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するためのシステムであって、
a) 対象由来の核酸分子の配列を示す対象データを取得する;
b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;
c) 同定されたSNVを用いて、
i) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;
ii) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;
iii) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;
iv) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
v) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
vi) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
vii) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
viii) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;
ix) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;
x) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、
xi) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群
から選択される3つ以上のメトリック群由来のメトリックを含む、複数のメトリックを決定する;ならびに、
d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する、
1つまたは複数の電子処理装置を含む、システム。
[本発明1004]
前記複数のメトリックが、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む、本発明1003のシステム。
[本発明1005]
前記複数のメトリックが、モチーフメトリック群およびコドンコンテキストメトリック群由来のメトリックを含む、本発明1001~1004のいずれかのシステム。
[本発明1006]
前記複数のメトリックが、モチーフメトリック群、コドンコンテキストメトリック群、および転位/転換メトリック群由来のメトリックを含む、本発明1001~1005のいずれかのシステム。
[本発明1007]
前記モチーフメトリック群が、1つまたは複数のデアミナーゼモチーフにおけるSNVに関連するデアミナーゼモチーフメトリック群を含む、本発明1001~1006のいずれかのシステム。
[本発明1008]
前記デアミナーゼモチーフメトリック群が、活性化誘導シチジンデアミナーゼ(AID)、アポリポタンパク質B mRNA編集酵素触媒ポリペプチド様(APOBEC)1シトシンデアミナーゼ(APOBEC1)、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、およびRNAに作用するアデニンデアミナーゼ(ADAR)モチーフメトリック群の中から選択される群を含み、各群が、それぞれ、1つまたは複数のAID、APOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、またはADARモチーフにおけるSNVに関連している、本発明1007のシステム。
[本発明1009]
前記デアミナーゼモチーフが、
の中から選択されるAIDモチーフである、本発明1007または1008のシステム。
[本発明1010]
前記デアミナーゼモチーフが、
の中から選択されるADARモチーフである、本発明1007または1008のシステム。
[本発明1011]
前記デアミナーゼモチーフが、
の中から選択されるAPOBEC3Gモチーフである、本発明1007または1008のシステム。
[本発明1012]
前記デアミナーゼモチーフが、
の中から選択されるAPOBEC3Bモチーフである、本発明1007または1008のシステム。
[本発明1013]
前記デアミナーゼモチーフが、APOBEC3Fモチーフ
である、本発明1007または1008のシステム。
[本発明1014]
前記デアミナーゼモチーフが、APOBEC1モチーフ
である、本発明1007または1008のシステム。
[本発明1015]
前記モチーフメトリック群が、1つまたは複数の3マーモチーフにおけるSNVを示す3マーモチーフメトリック群を含む、本発明1001~1006のいずれかのシステム。
[本発明1016]
前記3マーモチーフメトリック群が、1つまたは複数の3マーモチーフの1位、2位、および/または3位でSNVを示す、本発明1015のシステム。
[本発明1017]
前記モチーフメトリック群が、1つまたは複数の5マーモチーフにおけるSNVを示す5マーモチーフメトリック群を含む、本発明1001~1062のいずれかのシステム。
[本発明1018]
前記5マーモチーフメトリック群が、1つまたは複数の5マーモチーフの1位、2位、3位、4位、および/または5位でSNVを示す、本発明1017のシステム。
[本発明1019]
前記少なくとも1つの計算モデルが、決定木を含む、本発明1001~1018のいずれかのシステム。
[本発明1020]
前記少なくとも1つの計算モデルが、複数の決定木を含み、前記治療指標が、複数の決定木由来の結果を集めることによって生成される、本発明1001~1019のいずれかのシステム。
[本発明1021]
少なくとも1つのメトリックが、複数の決定木のうちの多数のものにおいて用いられる、本発明1020のシステム。
[本発明1022]
前記1つまたは複数の処理装置が、
a) 各々の利用可能な群由来の少なくとも1つのメトリック;および、
b) 少なくともいくつかの利用可能な群由来の少なくとも2つのメトリック
のうちの少なくとも1つを決定する、本発明1001~1020のいずれかのシステム。
[本発明1023]
前記1つまたは複数の処理装置が、
a) 少なくとも2メトリック;
b) 少なくとも5メトリック;
c) 少なくとも10メトリック;
d) 少なくとも20メトリック;
e) 少なくとも50メトリック;
f) 少なくとも75メトリック;
g) 少なくとも100メトリック;および、
h) 少なくとも200メトリック
のうちの少なくとも1つを決定する、本発明1001~1022のいずれかのシステム。
[本発明1024]
前記1つまたは複数の処理装置が、
a) メトリック群中のすべてのメトリックの少なくとも0.1%;
b) メトリック群中のすべてのメトリックの少なくとも0.2%;
c) メトリック群中のすべてのメトリックの少なくとも0.3%;
d) メトリック群中のすべてのメトリックの少なくとも0.4%;
e) メトリック群中のすべてのメトリックの少なくとも0.5%;
f) メトリック群中のすべてのメトリックの少なくとも0.75%;
g) メトリック群中のすべてのメトリックの少なくとも1%;
h) メトリック群中のすべてのメトリックの少なくとも1.5%;および、
i) メトリック群中のすべてのメトリックの少なくとも2%
のうちの少なくとも1つを決定する、本発明1001~1023のいずれかのシステム。
[本発明1025]
前記1つまたは複数の処理装置が、
a) 対象についての1つまたは複数の対象の性状を決定する;および、
b) 1つまたは複数の対象の性状を用いて、少なくとも1つのメトリックが対象の性状と同様の性状を有する1つまたは複数の参照対象について導かれる参照メトリックに基づいて評価されるように、少なくとも1つの計算モデルを適用する、
本発明1001~1024のいずれかのシステム。
[本発明1026]
前記1つまたは複数の処理装置が、対象の性状を少なくとも部分的に用いて、複数のメトリックを選択する、本発明1025のシステム。
[本発明1027]
前記1つまたは複数の処理装置が、対象の性状を少なくとも部分的に用いて、少なくとも1つの計算モデルを選択する、本発明1025または本発明1026のシステム。
[本発明1028]
前記1つまたは複数の対象の性状が、
a) i) 対象の年齢;
ii) 対象の身長;
iii) 対象の体重;
iv) 対象の性別;および、
v) 対象の民族性
を含む特性の群から選択される、1つまたは複数の対象の特性;
b) i) 健康な身体状態;および
ii) 不健康な身体状態
を含む身体状態の群から選択される、1つまたは複数の身体状態;
c) i) がんのタイプ;
ii) がんのステージ;および
iii) 転移の存在
を含む疾患状態の群から選択される、1つまたは複数の疾患状態;
d) i) 免疫療法;
ii) 放射線療法;および
iii) 非標的化学療法
を含む医学的介入の群から選択される、1つまたは複数の医学的介入
を含む性状の群から選択される、本発明1025~1027のいずれかのシステム。
[本発明1029]
前記1つまたは複数の処理装置が、
a) 対象の病歴を質問することによる;
b) 感知装置からのセンサーデータを受け取ることによる;および、
c) ユーザー入力コマンドに従う
のうちの少なくとも1つで、対象の性状を決定する、本発明1025~1028のいずれかのシステム。
[本発明1030]
前記1つまたは複数の処理装置が、
a) 治療指標の代表を表示する;
b) その後の検索のために治療指標を保存する;および、
c) 表示のためにクライアント装置に治療指標を提供する
のうちの少なくとも1つを行う、本発明1001~1029のいずれかのシステム。
[本発明1031]
対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のためのシステムであって、
a) 複数の参照対象の各々について:
i) (1) 参照対象由来の核酸分子の配列;および、
(2) がん治療に対する応答性
を示す参照対象データを取得する;
ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;
iii) 同定されたSNVを用いて、
1) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;
2) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
3) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
4) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
5) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
6) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および
7) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群
を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、
b) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する、
1つまたは複数の電子処理装置を含む、システム。
[本発明1032]
前記複数のメトリックが、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む、本発明1031のシステム。
[本発明1033]
対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のためのシステムであって、
a) 複数の参照対象の各々について:
i) (1) 参照対象由来の核酸分子の配列;および、
(2) がん治療に対する応答性
を示す参照対象データを取得する;
ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;
iii) 同定されたSNVを用いて、
1) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;
2) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;
3) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;
4) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
5) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
6) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
7) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
8) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;
9) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;
10) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、
11) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群
を含むメトリック群のうちの3つ以上由来のメトリックを含む、複数のメトリックを決定する;ならびに、
b) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する、
1つまたは複数の電子処理装置を含む、システム。
[本発明1034]
前記複数のメトリックが、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む、本発明1033のシステム。
[本発明1035]
前記複数のメトリックが、モチーフメトリック群およびコドンコンテキストメトリック群由来のメトリックを含む、本発明1031~1034のいずれかのシステム。
[本発明1036]
前記複数のメトリックが、モチーフメトリック群、コドンコンテキストメトリック群、および転位/転換メトリック群由来のメトリックを含む、本発明1031~1035のいずれかのシステム。
[本発明1037]
前記モチーフメトリック群が、1つまたは複数のデアミナーゼモチーフにおけるSNVに関連するデアミナーゼモチーフメトリック群を含む、本発明1031~1036のいずれかのシステム。
[本発明1038]
前記デアミナーゼモチーフメトリック群が、活性化誘導シチジンデアミナーゼ(AID)、アポリポタンパク質B mRNA編集酵素触媒ポリペプチド様(APOBEC)1シトシンデアミナーゼ(APOBEC1)、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、およびRNAに作用するアデニンデアミナーゼ(ADAR)モチーフメトリック群の中から選択される群を含み、各群が、それぞれ、1つまたは複数のAID、APOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、またはADARモチーフにおけるSNVに関連している、本発明1037のシステム。
[本発明1039]
前記1つまたは複数の処理装置が、少なくとも1つの計算モデルを試験して、モデルの識別性能を判定する、本発明1031~1038のいずれかのシステム。
[本発明1040]
前記識別性能が、
a) 受信者動作特性曲線下の面積;
b) 精度;
c) 感度;および、
d) 特異性
のうちの少なくとも1つに基づく、本発明1039のシステム。
[本発明1041]
前記識別性能が、少なくとも70%である、本発明1039または本発明1040のシステム。
[本発明1042]
前記1つまたは複数の処理装置が、複数の参照対象のサブセット由来の参照対象データを用いて、少なくとも1つの計算モデルを試験する、本発明1039~1041のいずれかのシステム。
[本発明1043]
前記1つまたは複数の処理装置が、
a) 複数の参照メトリックを選択する;
b) 複数の参照メトリックを用いて、少なくとも1つの計算モデルを訓練する;
c) 少なくとも1つの計算モデルを試験して、モデルの識別性能を判定する;ならびに、
d) モデルの識別性能が閾値よりも下に下がる場合には、
i) 異なる複数の参照メトリックを用いて、少なくとも1つの計算モデルを選択的に再訓練する;および、
ii) 異なる計算モデルを訓練する
のうちの少なくとも1つを行う、
本発明1031~1042のいずれかのシステム。
[本発明1044]
前記1つまたは複数の処理装置が、
a) 複数の参照メトリックの組み合わせを選択する;
b) 組み合わせの各々を用いて、複数の計算モデルを訓練する;
c) 各々の計算モデルを試験して、モデルの識別性能を判定する;および、
d) 治療指標の決定における使用のために、最高の識別性能を有する少なくとも1つの計算モデルを選択する、
本発明1031~1043のいずれかのシステム。
[本発明1045]
前記1つまたは複数の処理装置が、
a) 1つまたは複数の参照対象の性状を決定する;および、
b) 1つまたは複数の参照対象の性状を用いて、少なくとも1つの計算モデルを訓練する、
本発明1031~1044のいずれかのシステム。
[本発明1046]
前記1つまたは複数の処理装置が、
a) 参照対象の性状を用いてクラスタリングを行って、同様の参照対象の性状を有する参照対象のクラスターを決定する;および、
b) 参照対象のクラスターを少なくとも部分的に用いて、少なくとも1つの計算モデルを訓練する、
本発明1045のシステム。
[本発明1047]
前記1つまたは複数の参照対象の性状が、
a) i) 対象の年齢;
ii) 対象の身長;
iii) 対象の体重;
iv) 対象の性別;および、
v) 対象の民族性
を含む特性の群から選択される、1つまたは複数の対象の特性;
b) i) 健康な身体状態;および
ii) 不健康な身体状態
を含む身体状態の群から選択される、1つまたは複数の身体状態;
c) i) がんのタイプ;
ii) がんのステージ;および
iii) 転移の存在
を含む疾患状態の群から選択される、1つまたは複数の疾患状態;ならびに
d) i) 免疫療法;
ii) 放射線療法;および
iii) 非標的化学療法
を含む医学的介入の群から選択される、1つまたは複数の医学的介入
を含む性状の群から選択される、本発明1045または本発明1046のいずれかのシステム。
[本発明1048]
前記少なくとも1つの計算モデルが、決定木を含む、本発明1031~1047のいずれかのシステム。
[本発明1049]
前記少なくとも1つの計算モデルが、複数の決定木を含み、前記治療指標が、複数の決定木由来の結果を集めることによって生成される、本発明1031~1048のいずれかのシステム。
[本発明1050]
少なくとも1つのメトリックが、複数の決定木のうちの多数のものにおいて用いられる、本発明1049のシステム。
[本発明1051]
前記1つまたは複数の処理装置が、
a) 少なくとも1000メトリック;
b) 少なくとも2000メトリック;
c) 少なくとも3000メトリック;
d) 少なくとも4000メトリック;および、
e) 少なくとも5000メトリック
のうちの少なくとも1つを用いて、モデルを訓練する、本発明1031~1050のいずれかのシステム。
[本発明1052]
結果として生じたモデルが、
a) 少なくとも2メトリック;
b) 少なくとも5メトリック;
c) 少なくとも10メトリック;
d) 少なくとも20メトリック;
e) 少なくとも50メトリック;
f) 少なくとも75メトリック;
g) 少なくとも100メトリック;および、
h) 少なくとも200メトリック
のうちの少なくとも1つを用いる、本発明1031~1051のいずれかのシステム。
[本発明1053]
結果として生じたモデルが、
a) メトリック群中のすべてのメトリックの少なくとも0.1%;
b) メトリック群中のすべてのメトリックの少なくとも0.2%;
c) メトリック群中のすべてのメトリックの少なくとも0.3%;
d) メトリック群中のすべてのメトリックの少なくとも0.4%;
e) メトリック群中のすべてのメトリックの少なくとも0.5%;
f) メトリック群中のすべてのメトリックの少なくとも0.75%;
g) メトリック群中のすべてのメトリックの少なくとも1%;
g) メトリック群中のすべてのメトリックの少なくとも1.5%;および、
i) メトリック群中のすべてのメトリックの少なくとも2%
のうちの少なくとも1つを用いる、本発明1031~1052のいずれかのシステム。
[本発明1054]
対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するための方法であって、1つまたは複数の電子処理装置において、
a) 対象由来の核酸分子の配列を示す対象データを取得する工程;
b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する工程;
c) 同定されたSNVを用いて、
i) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;
ii) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
iii) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
iv) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
v) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
vi) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および
vii) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群
を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、
d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する工程
を含む、方法。
[本発明1055]
前記複数のメトリックが、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む、本発明1054の方法。
[本発明1056]
対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するための方法であって、1つまたは複数の電子処理装置において、
a) 対象由来の核酸分子の配列を示す対象データを取得する工程;
b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する工程;
c) 同定されたSNVを用いて、
i) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;
ii) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;
iii) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;
iv) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
v) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
vi) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
vii) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
viii) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;
ix) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;
x) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、
xi) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群
を含むメトリック群のうちの3つ以上由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、
d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する工程
を含む、方法。
[本発明1057]
前記複数のメトリックが、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む、本発明1056の方法。
[本発明1058]
前記複数のメトリックが、モチーフメトリック群およびコドンコンテキストメトリック群由来のメトリックを含む、本発明1054~1057のいずれかの方法。
[本発明1059]
前記複数のメトリックが、モチーフメトリック群、コドンコンテキストメトリック群、および転位/転換メトリック群由来のメトリックを含む、本発明1054~1058のいずれかの方法。
[本発明1060]
対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するためのコンピュータプログラム製品であって、1つまたは複数の適切にプログラムされた電子処理装置によって実行される時に、該1つまたは複数の電子処理装置に、
a) 対象由来の核酸分子の配列を示す対象データを取得する;
b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;
c) 同定されたSNVを用いて、
i) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;
ii) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;
iii) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;
iv) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
v) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
vi) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
vii) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
viii) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;
ix) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;
x) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、
xi) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群
を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、
d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する
ようにさせるコンピュータ実行可能コードを含む、コンピュータプログラム製品。
[本発明1061]
前記複数のメトリックが、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む、本発明1060のコンピュータプログラム製品。
[本発明1062]
対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するためのコンピュータプログラム製品であって、1つまたは複数の適切にプログラムされた電子処理装置によって実行される時に、該1つまたは複数の電子処理装置に、
a) 対象由来の核酸分子の配列を示す対象データを取得する;
b) 対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;
c) 同定されたSNVを用いて、
i) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;
ii) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;
iii) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;
iv) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
v) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
vi) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
vii) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
viii) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;
ix) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;
x) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、
xi) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群
を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、
d)がん治療に対する応答性と複数のメトリックとの間の関係を具体化しかつがん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに機械学習を適用することによって導かれる少なくとも1つの計算モデルに、複数のメトリックを適用して、がん治療に対する予測される応答性を示す治療指標を決定する
ようにさせるコンピュータ実行可能コードを含む、コンピュータプログラム製品。
[本発明1063]
前記複数のメトリックが、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む、本発明1062のコンピュータプログラム製品。
[本発明1064]
生物学的対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のためのコンピュータプログラム製品であって、1つまたは複数の適切にプログラムされた電子処理装置によって実行される時に、該1つまたは複数の電子処理装置に、
a) 複数の参照対象の各々について:
i) (1) 参照対象由来の核酸分子の配列;および、
(2) がん治療に対する応答性
を示す参照対象データを取得する;
ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;
iii) 同定されたSNVを用いて、
1) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;
2) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
3) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
4) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
5) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
6) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および
7) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群
を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、
d) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する
ようにさせるコンピュータ実行可能コードを含む、コンピュータプログラム製品。
[本発明1065]
生物学的対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のためのコンピュータプログラム製品であって、1つまたは複数の適切にプログラムされた電子処理装置によって実行される時に、該1つまたは複数の電子処理装置に、
a) 複数の参照対象の各々について:
i) (1) 参照対象由来の核酸分子の配列;および、
(2) がん治療に対する応答性
を示す参照対象データを取得する;
ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する;
iii) 同定されたSNVを用いて、
1) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;
2) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;
3) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;
4) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
5) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
6) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
7) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
8) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;
9) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;
10) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、
11) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群
を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する;ならびに、
d) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する
ようにさせるコンピュータ実行可能コードを含む、コンピュータプログラム製品。
[本発明1066]
前記複数のメトリックが、モチーフメトリック群およびコドンコンテキストメトリック群由来のメトリックを含む、本発明1060~1064のいずれかのコンピュータプログラム製品。
[本発明1067]
前記複数のメトリックが、モチーフメトリック群、コドンコンテキストメトリック群、および転位/転換メトリック群由来のメトリックを含む、本発明1060~1065のいずれかのコンピュータプログラム製品。
[本発明1068]
生物学的対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のための方法であって、1つまたは複数の電子処理装置において、
a) 複数の参照対象の各々について:
i) (1) 参照対象由来の核酸分子の配列;および、
(2) がん治療に対する応答性
を示す参照対象データを取得する工程;
ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する工程;
iii) 同定されたSNVを用いて、
1) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;
2) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
3) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
4) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
5) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
6) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および
7) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群
を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、
b) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する工程
を含む、方法。
[本発明1069]
前記複数のメトリックが、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む、本発明1068の方法。
[本発明1070]
生物学的対象についてのがん治療に対する応答性の評価における使用のために治療指標を生成するのに用いられる少なくとも1つの計算モデルの算出における使用のための方法であって、1つまたは複数の電子処理装置において、
a) 複数の参照対象の各々について:
i) (1) 参照対象由来の核酸分子の配列;および、
(2) がん治療に対する応答性
を示す参照対象データを取得する工程;
ii) 参照対象データを解析して、核酸分子内の一塩基多様性(SNV)を同定する工程;
iii) 同定されたSNVを用いて、
1) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;
2) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;
3) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;
4) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
5) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
6) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
7) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
8) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;
9) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;
10) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、
11) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群
を含むメトリック群のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、
b) 複数の参照メトリックと数多くの参照対象についての既知の応答性とを用いて、がん治療に対する応答性と複数のメトリックとの間の関係を具体化する少なくとも1つの計算モデルを訓練する工程
を含む、方法。
[本発明1071]
前記複数のメトリックが、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む、本発明1070の方法。
[本発明1072]
前記複数のメトリックが、モチーフメトリック群およびコドンコンテキストメトリック群由来のメトリックを含む、本発明1068~1071のいずれかの方法。
[本発明1073]
前記複数のメトリックが、モチーフメトリック群、コドンコンテキストメトリック群、および転位/転換メトリック群由来のメトリックを含む、本発明1068~1072のいずれかの方法。
[本発明1074]
がんを有する対象が、がん治療に応答するかまたはがん治療に応答し続ける可能性を判定するための方法であって、
がんを有する対象由来の核酸分子の配列を解析して、核酸分子内のSNVを検出する工程;
メトリックの対象プロファイルを取得するために、検出されたSNVの数および/またはタイプに基づいて、以下のメトリック群:
i) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;
ii) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
iii) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
iv) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
v) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
vi) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;および
vii) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群
のうちの1つまたは複数由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、
メトリックの対象プロファイルと参照プロファイルとの間の比較に基づいて、がん治療に応答する対象の可能性を判定する工程
を含む、方法。
[本発明1075]
前記複数のメトリックが、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックを含む、本発明1074の方法。
[本発明1076]
がんを有する対象が、がん治療に応答するかまたはがん治療に応答し続ける可能性を判定するための方法であって、
がんを有する対象由来の核酸分子の配列を解析して、核酸分子内のSNVを検出する工程;
メトリックの対象プロファイルを取得するために、検出されたSNVの数および/またはタイプに基づいて、以下のメトリック群:
i) 核酸分子のコーディング領域におけるSNVに関連するメトリックを含む、コーディングメトリック群;
ii) 核酸分子のノンコーディング領域におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;
iii) 核酸分子のコーディング領域およびノンコーディング領域におけるSNVに関連するメトリックを含む、ゲノムメトリック群;
iv) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;
v) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;
vi) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;
vii) SNVのストランドバイアスに関連するメトリックを含む、ストランドバイアスメトリック群;
viii) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;
ix) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされているSNVに関連するメトリックを含む、AT/GCメトリック群;
x) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、
xi) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群
のうちの3つ以上由来のメトリックを含む、複数のメトリックを決定する工程;ならびに、
メトリックの対象プロファイルと参照プロファイルとの間の比較に基づいて、がん治療に応答する対象の可能性を判定する工程
を含む、方法。
[本発明1077]
前記複数のメトリックが、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む、本発明1076の方法。
[本発明1078]
前記複数のメトリックが、モチーフメトリック群およびコドンコンテキストメトリック群由来のメトリックを含む、本発明1074~1077のいずれかの方法。
[本発明1079]
前記複数のメトリックが、モチーフメトリック群、コドンコンテキストメトリック群、および転位/転換メトリック群由来のメトリックを含む、本発明1074~1078のいずれかの方法。
[本発明1080]
前記モチーフメトリック群が、1つまたは複数のデアミナーゼモチーフにおけるSNVに関連するデアミナーゼモチーフメトリック群を含む、本発明1074~1079のいずれかの方法。
[本発明1081]
前記デアミナーゼモチーフメトリック群が、活性化誘導シチジンデアミナーゼ(AID)、アポリポタンパク質B mRNA編集酵素触媒ポリペプチド様(APOBEC)1シトシンデアミナーゼ(APOBEC1)、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、およびRNAに作用するアデニンデアミナーゼ(ADAR)モチーフメトリック群の中から選択される群を含み、各群が、それぞれ、1つまたは複数のAID、APOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、またはADARモチーフにおけるSNVに関連している、本発明1080の方法。
[本発明1082]
前記デアミナーゼモチーフが、
の中から選択されるAIDモチーフである、本発明1080または1081の方法。
[本発明1083]
前記デアミナーゼモチーフが、
の中から選択されるADARモチーフである、本発明1080または1081の方法。
[本発明1084]
前記デアミナーゼモチーフが、
の中から選択されるAPOBEC3Gモチーフである、本発明1080または1081の方法。
[本発明1085]
前記デアミナーゼモチーフが、
の中から選択されるAPOBEC3Bモチーフである、本発明1080または1081の方法。
[本発明1086]
前記デアミナーゼモチーフが、
の中から選択されるAPOBEC3Fモチーフである、本発明1080または1081の方法。
[本発明1087]
前記デアミナーゼモチーフが、
の中から選択されるAPOBEC1モチーフである、本発明1080または1081の方法。
[本発明1088]
前記モチーフメトリック群が、1つまたは複数の3マーモチーフにおけるSNVを示す3マーモチーフメトリック群を含む、本発明1074~1079のいずれかの方法。
[本発明1089]
前記3マーモチーフメトリック群が、1つまたは複数の3マーモチーフの1位、2位、および/または3位でSNVを示す、本発明1088の方法。
[本発明1090]
前記モチーフメトリック群が、1つまたは複数の5マーモチーフにおけるSNVを示す5マーモチーフメトリック群を含む、本発明1074~1079のいずれかの方法。
[本発明1091]
前記5マーモチーフメトリック群が、1つまたは複数の5マーモチーフの1位、2位、3位、4位、および/または5位でSNVを示す、本発明1090の方法。
[本発明1092]
前記参照プロファイルが、計算モデルを用いて作製される、本発明1074~1091のいずれかの方法。
[本発明1093]
前記対象が、がん治療を受けており、前記方法が、対象ががん治療に応答し続ける可能性を判定するためである、本発明1074~1092のいずれかの方法。
[本発明1094]
対象ががん治療に応答する可能性が高いと判定された場合には、がん治療を始める;
対象ががん治療に応答し続ける可能性が高いと判定された場合には、がん治療を続ける;
対象ががん治療に応答する可能性が低いと判定された場合には、異なるがん治療を始める;または
対象ががん治療に応答し続ける可能性が低いと判定された場合には、がん治療をやめる
ように対象に推奨を提供する工程をさらに含む、本発明1074~1093のいずれかの方法。
[本発明1095]
前記がん治療が、放射線療法、非標的化学療法、ホルモン療法、免疫療法、または標的療法の中から選択される、本発明1001~1053のいずれかのシステム、本発明1060~1067のいずれかのコンピュータプログラム製品、または本発明1054~1059もしくは1068~1094のいずれかの方法。
[本発明1096]
前記免疫療法または標的療法が、抗体を含む、本発明1095のシステム、コンピュータプログラム製品、または方法。
[本発明1097]
抗体が、CTLA-4、PD-1、PD-L1、CD-52、CD19、CD20、CD27、CD30、CD38、CD137、HER-2、EGFR、VEGF、VEGFR、RANKL、BAFF、Nectin-4、OX40、gpNMB、SLAM7、B4GALNT1、PDGFRα、IL-1β、IL-6、およびIL-6Rに特異的な抗体の中から選択される、本発明1096のシステム、コンピュータプログラム製品、または方法。
[本発明1098]
前記抗体が、PD-1、PD-L1、CTLA-4、またはHER2に特異的である、本発明1096または1097のシステム、コンピュータプログラム製品、または方法。
[本発明1099]
前記抗体が、補体依存性細胞傷害活性(CDC)または抗体依存性細胞性細胞傷害活性(ADCC)を誘導することができる、本発明1096~1098のいずれかのシステム、コンピュータプログラム製品、または方法。
[本発明1100]
前記抗体が、Ado-トラスツズマブエムタンシン、アレムツズマブ、アテゾリズマブ、アベルマブ、ベリムマブ、ベリノスタット、ベバシズマブ、ブリナツモマブ、ブレンツキシマブベドチン、カナキヌマブ、セツキシマブ、ダラツムマブ、デノスマブ、ジヌツキシマブ、デュルバルマブ、エロツズマブ、エンホルツマブ、グレンバツムマブ(Glembatumumab)、GSK3174998、イブリツモマブチウキセタン、イピリムマブ、ネシツムマブ、ニボルマブ、オビヌツズマブ、オファツムマブ、オララツマブ、パニツムマブ、ペムブロリズマブ、ペルツズマブ、PF-04518600、ピディリズマブ、ポガリズマブ(Pogalizumab)、ラムシルマブ、リツキシマブ、シルツキシマブ、タボリキシズマブ(Tavolixizumab)、トシリズマブ、トシツモマブ、トラスツズマブ、トレメリムマブ、ウレルマブ、およびバルリルマブ(Varlilumab)の中から選択される、本発明1096~1099のいずれかのシステム、コンピュータプログラム製品、または方法。
[本発明1101]
前記標的療法が小分子である、本発明1095のシステム、コンピュータプログラム製品、または方法。
[本発明1102]
前記標的療法がチロシンキナーゼ阻害剤である、本発明1101のシステム、コンピュータプログラム製品、または方法。
[本発明1103]
前記対象が、乳がん、前立腺がん、肝臓がん、大腸がん、胃腸がん、膵臓がん、皮膚がん、甲状腺がん、子宮頸がん、リンパ系がん、造血器がん、膀胱がん、肺がん、腎がん、卵巣がん、子宮がん、および頭頚部がんの中から選択されるがんを有する、本発明1001~1053のいずれかのシステム、本発明1060~1067のいずれかのコンピュータプログラム製品、または本発明1054~1059もしくは1068~1094のいずれかの方法。
[本発明1104]
対象においてがんを処置するためのがん治療の使用であって、
本発明1074~1092のいずれかの方法による対象ががん治療に応答する可能性が高いという判定に基づいて、該対象にがん治療を受けさせる、
使用。
[本発明1105]
対象においてがんを処置するための方法であって、
本発明1074~1092のいずれかの方法を行う工程、および
対象ががん治療に応答するかまたは応答し続ける可能性が高いと判定された場合には、該対象にがん治療を受けさせる工程
を含む、方法。
[本発明1106]
対象においてがんを処置するための方法であって、
(a) (i) 本発明1074~1092のいずれかの方法を実施するため、および(ii) 該方法の結果を提供するために、対象から得られた生物学的試料を検査室に送る工程であって、該結果が、対象ががん治療に応答するかまたは応答し続ける可能性が高いかどうかの判定を含む、工程;
(b) 工程(a)からの結果を受け取る工程;および
(c) 結果が、対象ががん治療に応答するかまたは応答し続ける可能性が高いという判定を含む場合には、該対象にがん治療を受けさせる工程
を含む、方法。
発明の詳細な説明
1. 定義
別段の定義がない限り、本明細書において用いられるすべての技術用語および科学用語は、本発明が属する技術分野における当業者によって一般的に理解されるものと同じ意味を有する。本明細書に記載されるものと同様または等価の任意の方法および材料を、本発明の実施または試験において用いることができるが、好ましい方法および材料を説明する。本発明の目的で、以下の用語を下記に定義する。
「1つの(a)」および「1つの(an)」という冠詞は、冠詞の文法上の目的語の1つまたは1つよりも多く(すなわち、少なくとも1つ)を指すように、本明細書において用いられる。例として、「テロメア」は、1つのテロメアまたは1つよりも多いテロメアを意味する。
本明細書において用いられる場合、「および/または」とは、付随する列記された項目のうちの1つまたは複数の任意のおよびすべての可能な組み合わせ、ならびに選択的に解釈される場合(または)は組み合わせの欠如を指し、かつそれを包含する。
本明細書において用いられる「約」という用語は、およそ、ほぼ、大まかに、またはそのあたりを意味する。「約」という用語が数値範囲と共に用いられる場合、それは、示される数値の上および下の境界を拡張することによって、その範囲を改変する。概して、「約」という用語は、10%の分散によって述べられた値の上および下の数値を改変するように、本明細書において用いられる。したがって、約50%は、45%~55%の範囲を意味する。終点によって本明細書において列挙される数値範囲は、その範囲内に包摂されるすべての数および分数を含む(例えば、1~5は、1、1.5、2、2.75、3、3.90、4、および5を含む)。すべての数およびその分数は、「約」という用語によって改変されるように推定されることもまた、理解されるべきである。
本明細書において用いられる「生物学的試料」という用語は、対象または患者から抽出され、処理されず、処理され、希釈され、または濃縮され得る試料を指す。適切に、生物学的試料は、唾液または血液などの体液、組織、細胞、毛、皮膚、および爪を含むがそれらに限定されない、患者の身体の任意の部分から選択される。
本明細書において用いられる場合、本開示の方法の目的での「がん治療」は、非標的化学療法、放射線療法、ホルモン療法、標的療法、および免疫療法を含む。特定の態様において、がん治療は、標的療法または免疫療法である。がん治療は、一価療法(すなわち、単一療法)または併用療法であってもよい。
本明細書において用いられる場合、変異に関する「コドンコンテキスト」という用語は、変異が起こるコドン内のヌクレオチド位置を指す。本開示の目的で、変異したコドン(MC;すなわち、変異を含有するコドン)内のヌクレオチド位置は、MC-1、MC-2、およびMC-3と注釈をつけられ、コドンの配列を5'から3'へ読んだ場合に、それぞれ、第1、第2、および第3のヌクレオチド位置を指す。したがって、「変異のコドンコンテキストを決定する」という句または同様の句は、変異が起こる、変異したコドン内のヌクレオチド位置、すなわち、MC-1、MC-2、またはMC-3を決定することを意味する。
本明細書および添付の特許請求の範囲を通して、別段文脈が必要としない限り、「含む(comprise)」という単語、ならびに「含む(comprises)」および「含むこと(comprising)」などの変形物は、述べられた整数もしくは工程または整数もしくは工程の群の包含を含意するが、任意の他の整数もしくは工程または整数もしくは工程の群の除外を含意しないように理解される。「からなる」は、「からなる」という句に続くものは何でも、それを含み、かつそれに限定されることを意味する。したがって、「からなる」という句は、列記された要素が必要とされるかまたは必須であること、およびいかなる他の要素も存在し得ないことを示す。「本質的にそれからなる」は、句の後に列記された任意の要素を含み、かつ列記された要素についての開示において特定される活性または作用を干渉しないかまたはそれに寄与する他の要素に限定されることを意味する。
本開示の文脈において用いられる「対照対象」という用語は、がん治療に応答性であることが既知であるか、もしくはがん治療に頻繁に応答性であることが既知である対象(陽性対照)、または、がん治療に非応答性であることが既知であるか、もしくはがん治療に対する抵抗性を発生させることが既知である対象(陰性対照)を指し得る。対照対象は、多数の研究についての標準としての使用のためにデータを取得するのに用いることができ、すなわち、それは、多数の異なる対象について何度も用いることができると理解される。換言すると、例えば、対象試料を対照試料と比較する場合、対照試料由来のデータは、異なる実験のセットにおいて得られていることがあり、例えば、数多くの応答性の対象から得られた平均であり、対象についてのデータが得られた時に実際には得られていないことがある。
「相関させること」という用語は、概して、1つのタイプのデータと、別のものまたは状態との間の関係を決定することを指す。様々な態様において、デアミナーゼ活性を、対象ががん治療に応答性である(もしくは非応答性である)可能性、または対象ががん治療に応答し続けるかもしくはがん治療に対する抵抗性を発生させる可能性と相関させることは、対象におけるデアミナーゼ活性の遺伝学的指標を評価すること、および、これらの指標のレベルを、その治療法に応答性であることが既知の人におけるデアミナーゼ活性の遺伝学的指標と、またはデアミナーゼ活性の遺伝学的指標についてあらかじめ決定された治療応答範囲間隔と比較することを含む。
「遺伝子」は、ゲノム上の特定の座を占有し、転写および/もしくは翻訳制御配列ならびに/またはコーディング領域ならびに/または非翻訳配列(すなわち、イントロン、5'および3'非翻訳配列)を含む、遺伝物の単位を意味する。
本明細書において用いられる場合、「デアミナーゼ活性の遺伝学的指標」とは、1つまたは複数の内在性デアミナーゼの活性を反映し得る、一塩基多様性(SNV)の数、パーセンテージ、比、および/またはタイプを指す。デアミナーゼ活性の遺伝学的指標という用語は、本明細書において「指標」または「メトリック」と互換的に用いられてもよい。デアミナーゼ活性の遺伝学的指標は、非限定的に、デアミナーゼモチーフでのSNVの数またはパーセンテージの測定値であるもの、特定のコドンコンテキストを有するSNVの数またはパーセンテージの測定値であるもの、SNVのストランドバイアスの測定値であるもの、および特定のヌクレオチドタイプ(すなわち、アデニン、チミジン、グアニン、またはシトシン)を標的とするSNVの数またはパーセンテージの測定値であるものを含む。例示的なデアミナーゼ活性の遺伝学的指標には、デアミナーゼモチーフにあるSNVのパーセンテージ;MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ;チミンヌクレオチドの変異に起因するSNVのパーセンテージ;シトシンヌクレオチドの変異に起因するSNVのパーセンテージ;グアニンヌクレオチドの変異に起因するSNVのパーセンテージ;シトシンヌクレオチドの変異に起因するSNVのパーセンテージ対グアニンヌクレオチドの変異に起因するSNVのパーセンテージの比(C:G比);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(A:T比);アデニンまたはチミンヌクレオチドの変異に起因するSNVのパーセンテージ対シトシンまたはグアニンヌクレオチドの変異に起因するSNVのパーセンテージの比(AT:GC比);MC-1部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位で起こるグアニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるグアニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるグアニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こったAIDモチーフWRC/GYWでのSNVのパーセンテージ;G>A変異を含み、かつMC-3部位で起こるAIDモチーフGYWでのSNVのパーセンテージ;C>T変異を含み、かつMC-1部位で起こるAPOBEC3BモチーフTCAでのSNVのパーセンテージ;C>T変異を含み、かつMC-3部位で起こるAPOBEC3BモチーフTCAでのSNVのパーセンテージ;グアニンの変異に起因するSNVの転位-転換比;シトシンまたはグアニンの変異に起因するSNVの転位-転換比;および、デアミナーゼモチーフWA中ではないアデニンヌクレオチドの変異に起因するSNVの数対デアミナーゼモチーフTW中ではないチミンヌクレオチドの変異に起因するSNVの数の比が含まれるが、それらに限定されない。
本明細書において用いられる場合、「可能性」という用語または文法的変形物は、がん治療に対する応答または非応答が起こるかどうか;がん治療に対する引き続きの応答が起こるかどうか、またはがん治療に対する抵抗性の発生、およびしたがって治療中の再発が起こるかどうかの測定値として用いられる。特に、所与の数学モデルに基づいて、あらかじめ決定された治療応答範囲間隔内であるかまたはその外側であるデアミナーゼ活性の遺伝学的指標を有する対象が、がん治療に応答するかもしくはしないか、またはがん治療に応答し続けるかもしくはがん治療に対する抵抗性を発生させるか、の測定値が用いられる。可能性の増加は、例えば、相対的または絶対的であってもよく、かつ、定性的または定量的に表されてもよい。例として、対象が治療に応答する可能性の増加、または対象が治療に応答しない可能性の増加は、以前の集団研究に基づいて、任意のデアミナーゼ活性の遺伝学的指標が、(本明細書において教示されるような)正常な参照間隔の外側であると同定されるかどうかを判定すること、および、試験対象を「可能性の増加」のカテゴリーに置くことによって表されてもよい。
いくつかの態様において、方法は、あらかじめ決定された治療応答範囲間隔の外側であるデアミナーゼ活性の遺伝学的指標の数に基づくスコアを、「閾値スコア」と比較することを含む。閾値スコアは、対象における、治療に対する応答もしくは非応答の、または継続的な応答もしくは治療中の抵抗性の発生の可能性を予測するための、許容される能力を提供するものであり、任意の許容される手段を用いて、当業者が決定することができる。いくつかの例において、受信者動作特性(ROC)曲線は、第1の集団が第1の表現型またはリスクを有し、第2の集団が第2の表現型またはリスクを有する(任意に、例えば、「応答」および「非応答」、または「レスポンダー」および「ノンレスポンダー」と呼ばれる)2つの集団において、変数の値対その相対頻度をプロットすることによって算出される。
治療に応答するかまたは治療に応答し続ける対象において、および治療に応答しないかまたは治療に対する抵抗性を発生させる対象において、あらかじめ決定された治療応答範囲間隔の外側であるデアミナーゼ活性の遺伝学的指標の数の分布は、オーバーラップしてもよい。そのような条件下で、試験は、100%の精度で、応答と非応答(または継続的な応答と抵抗性)の間を絶対に区別するわけではない。閾値が選択され、その上で試験が「陽性」と考えられ、その下で試験が「陰性」と考えられる。ROC曲線下の面積(AUC)は、C統計値を提供し、これは、知覚された測定法が条件の正しい同定を可能にする見込みの測定値である(例えば、Hanley et al, Radiology 143: 29-36 (1982)を参照されたい)。「曲線下の面積」または「AUC」という用語は、受信者動作特性(ROC)曲線の曲線下面積を指し、その両方が、当技術分野において周知である。AUC測定値は、完全なデータ範囲にわたって分類子の精度を比較するために有用である。より大きなAUCを有する分類子は、未知のものを関心対象の2つの群の間で正しく分類する、より大きな能力を有する。ROC曲線は、2つの集団(例えば、治療に対するレスポンダーである対象およびノンレスポンダーである対象)の間を区別するかまたは識別する際の、特定の特徴の性能をプロットするために有用である。典型的には、集団全体にわたる特徴データ(例えば、事例および対照)は、単一の特徴の値に基づいて、昇順で選別される。次いで、その特徴の各値について、データの真陽性率および偽陽性率が算出される。感度は、その特徴の値よりも上の事例の数を計数すること、次いで事例の総数で割ることによって決定される。特異性は、その特徴の値よりも下の対照の数を計数すること、次いで対照の総数で割ることによって決定される。この定義は、特徴が対照と比較して事例において上昇しているシナリオを指すが、この定義はまた、特徴が対照と比較して事例においてより低いシナリオにも当てはまる(そのようなシナリオにおいては、その特徴の値よりも下の試料が計数される)。ROC曲線は、単一の特徴について、および他の単一のアウトプットについて生成させることができ、例えば、単一の値を生じるために、2つ以上の特徴の組み合わせを、数学的に組み合わせる(例えば、加算する、減算する、乗算するなど)ことができ、この単一の値を、ROC曲線においてプロットすることができる。追加的に、組み合わせが単一のアウトプット値を導く、多数の特徴(例えば、1つまたは複数の他のエピジェネティックマーカー)の任意の組み合わせを、ROC曲線においてプロットすることができる。これらの特徴の組み合わせは、試験を含んでもよい。ROC曲線は、試験の特異性に対する試験の感度のプロットであり、感度は、伝統的に垂直軸上に示され、特異性は、伝統的に水平軸上に示される。したがって、「AUC ROC値」は、分類子が、ランダムに選択された陽性の例を、ランダムに選択された陰性のものよりも高くにランク付けする見込みと同等である。AUC ROC値は、群が連続的データのものである場合に考えられる2つの群において得られるスコア間の差の中央値について検定する、マン・ホイットニーのU検定、またはランクのウィルコクソン検定と等価であると考えられ得る。
本明細書において用いられる場合、SNVまたはデアミナーゼ活性の遺伝学的指標に関する「レベル」とは、SNVまたはデアミナーゼ活性の遺伝学的指標の数、パーセンテージ、量、または比を指す。
本明細書において用いられる場合、「メトリック」とは、一塩基多様性(SNV)の数、パーセンテージ、比、および/またはタイプを指す。本開示のメトリックは、特定のSNV、例えば、核酸分子のコーディング領域におけるSNV(コーディングメトリック群);核酸分子のノンコーディング領域におけるSNV(ノンコーディングメトリック群);核酸分子のコーディング領域およびノンコーディング領域の両方におけるSNV(ゲノムメトリック群);SNVのコドンコンテキストが評価されているSNV(コドンコンテキストメトリック群);転位または転換であると決定されているSNV(転移/転換メトリック群);同義または非同義であると決定されているSNV(同義/非同義メトリック群);変異性ストランドバイアスに起因するかまたはそれに関連するSNV(ストランドバイアス群);アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされている/変異しているSNV(AT/GCメトリック群);特定のモチーフ(例えば、デアミナーゼ、3マーおよび/または5マーモチーフ)中に存在するSNV(モチーフメトリック群);および、モチーフ中に存在するかまたはしないかいずれかのSNV(モチーフ非依存的メトリック群)の数、パーセンテージ、または比に関連するか、それを反映するか、またはそれを示す。典型的には、メトリックはまた、デアミナーゼ活性の遺伝学的指標でもある。
本明細書において用いられる場合、「変異タイプ」とは、変異を含む特定のヌクレオチド置換を指し、CからT、CからA、CからG、GからT、GからA、GからC、AからT、AからC、AからG、TからA、TからC、およびTからGへの変異の中から選択される。このように、例えば、CからTへの変異タイプは、標的とされているかまたは変異しているヌクレオチドCが、代わりになるヌクレオチドTで置き換えられている変異を指す。
本明細書において用いられる「核酸」は、DNA、cDNA、mRNA、RNA、rRNA、またはcRNAを指定する。用語は、典型的には、長さが30ヌクレオチド残基よりも長いポリヌクレオチドを指す。
本明細書において用いられる場合、「あらかじめ決定された治療応答範囲間隔」または「治療応答範囲間隔」とは、任意で長期の期間にわたって、がん治療に応答する(すなわち、治療に応答し続ける)対象におけるデアミナーゼ活性のレベルまたは質を反映するデアミナーゼ活性の遺伝学的指標についての、上限および下限を伴う値の範囲を指す。あらかじめ決定された治療応答範囲間隔は、所与の治療法に対してそれぞれである、2人以上のがんを有する対象(例えば、特定のタイプの標的療法、免疫療法などに応答する対象)におけるデアミナーゼ活性の遺伝学的指標を評価することによって、決定することができる。次いで、遺伝学的指標についての治療応答範囲間隔を算出して、その指標についての望ましい値、例えば、治療に対する応答を反映するかまたは支持するのを手助けする、個体におけるデアミナーゼ活性を反映するであろう値と考えられるものの上限および下限を設定する。特定の例において、正常な範囲間隔は、平均±2標準偏差を測定することによって算出され、それにより、範囲間隔の下限は、平均-2標準偏差であり、範囲間隔の上限は、平均+2標準偏差である。他の例において、2よりも小さいかまたは大きい標準偏差、例えば、0、0.5、1、1.5、2.5、3、3.5、またはそれよりも大きい標準偏差を用いて、間隔の上限および下限を設定する。またさらなる例において、あらかじめ決定された治療応答範囲間隔の上限および下限は、受信者動作特性(ROC)曲線を用いて確立される。あらかじめ決定された治療応答範囲間隔を決定するために用いられる対象は、任意の年齢、性別、もしくは背景であることができ、または、特定の年齢、性別、民族的背景、もしくは他の亜集団であってもよい。したがって、いくつかの態様において、同じデアミナーゼ活性の遺伝学的指標に対して、2つ以上のあらかじめ決定された治療応答範囲間隔を算出することができ、それにより、各範囲間隔は、特定の亜集団、例えば、特定の性別、年齢群、民族的背景、および/または他の亜集団に特異的である。あらかじめ決定された治療応答範囲間隔は、手動の算出法、アルゴリズム、ニューラルネットワーク、サポートベクターマシン、深層学習、線形モデルでのロジスティック回帰、機械学習、人工知能、および/またはベイジアンネットワークを含む、当業者に公知の任意の技術を用いて決定することができる。
本明細書において用いられる場合、「再び起こる」、「再出現」、「再発」などの用語は、がんまたは腫瘍に対する治療(すなわち、処置)が施与された後の、対象における腫瘍またはがん性細胞の再成長を指す。腫瘍は、元の部位または身体の別の部分において再び起こり得る。1つの態様において、再び起こる腫瘍は、対象が治療を施与された元の腫瘍と同じタイプのものである。例えば、対象が、卵巣がん腫瘍を有し、それについて処置され、かつその後、別の卵巣がん腫瘍を発生させた場合には、腫瘍は再び起こっている。加えて、がんは、元々起こった器官または組織とは異なる器官または組織において再び起こるか、またはそこへ転移することがある。
本明細書において用いられる場合、「がん治療に対する抵抗性」、「がん治療抵抗性」、またはその文法的変形物は、がん治療に対するがんの非応答性を指す。治療は、単独療法または併用療法であってもよい。治療に対する抵抗性には、対象がその治療に応答性であったことがないように処置の最初から治療に対する非応答性がある、先天性または一次抵抗性、および、治療に対する非応答性が、その治療に対する応答性の最初の期間後に起こる、すなわち、対象が治療中に治療に対する抵抗性を発生させる、治療に対する獲得抵抗性が含まれる。したがって、対象におけるがん治療に対する抵抗性の発生への言及は、がん治療に対する獲得抵抗性への言及であり、これは、がんの進行ならびに免疫学的マーカーおよび/または応答を含む、当業者に周知のパラメータの範囲を用いて評価することができる。
本明細書において用いられる「感度」という用語は、本開示の予測方法またはキットが、例えば、予測された診断を有する、生物学的試料が陽性である場合に、陽性の結果を与える見込みを指す。感度は、真陽性および偽陰性の合計で割った、真陽性の結果の数として算出される。感度は、本質的には、本開示がいかに良好に、予測された診断を有する人々を予測された診断を有さない人々から正しく特定するかの測定値である。感度が、少なくとも約60%であり、例えば、少なくとも約65%、70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%であることができるように、統計学的方法およびモデルを選択することができる。
本明細書において用いられる場合、「一塩基多様性」とは、核酸分子(例えば、対象核酸分子)の配列において別の核酸分子(例えば、参照核酸分子または配列)と比較して起こる多様性を指し、ここで、多様性とは、単一ヌクレオチド(例えば、A、T、C、またはG)の同一性における違いである。
「体細胞変異」という用語は、受胎後に起こる、体細胞(すなわち、生殖細胞ではない)のDNAにおける変異を指す。「体細胞変異誘発」とは、したがって、それによって体細胞変異が起こるプロセスを指す。
本明細書において互換的に用いられる「対象」、「個体」、または「患者」という用語は、任意の動物対象、特に哺乳動物対象を指す。例証となる例として、適している対象は、ヒトである。典型的には、対象は、本明細書において定義されるようながんの臨床徴候を示す。本明細書において用いられる場合、「臨床徴候」、または単純に「徴候」という用語は、対象中に存在するがんの客観的証拠を指す。がんに関連する症状および/または徴候、ならびにそのような徴候の評価は、当技術分野において日常的であり、公知である。がんの徴候の例は、がんに依存して変動し得るが、腫瘍形成、転移、および血管新生を含み得る。典型的には、対象ががんを有するかどうか、および対象が処置に応答しているかどうかは、がんに関連する徴候の評価によって判定され得る。
本明細書において用いられる場合、「標的体細胞変異誘発」および「TSM」という用語は、1つまたは複数の変異誘発物質に起因する体細胞変異誘発のプロセスを指し、ここで、変異誘発は、モチーフ内の標的とされるヌクレオチドで起こり、標的とされるヌクレオチドは、コドン内の特定の位置(例えば、それぞれ、MC-1、MC-2、およびMC-3と注釈をつけられている、5'から3'への、変異したコドンリーディングの第1、第2、または第3の位置)に存在し、標的とされるヌクレオチドは、特定の代わりになるヌクレオチドに変異している(すなわち、変異は、特定の変異タイプのもの、例えば、CからTであり、CからAまたはCからGではない)。したがって、TSMが起こっているという判定は、変異のタイプ(例えば、CからT)、変異が起こるモチーフ(例えば、WRC)、および変異のコドンコンテキスト、すなわち、変異が起こるコドン内の位置(例えば、MC-1、MC-2、またはMC-3)の解析を必要とする。「標的体細胞変異原」とは、したがって、TSMに起因する変異を指す。
本明細書において用いられる「処置する(treat)」および「処置すること(treating)」という用語は、別段の指示がない限り、治療的処置および予防的もしくは防止的措置の両方を指し、ここで、目的は、標的とされる状態もしくは障害(例えば、がん)、またはそれに関連する1つもしくは複数の症状を、部分的にまたは完全にのいずれかで、抑制する、改善する、またはその再発を減速させる(少なくする)ことである。用語はまた、がんまたは腫瘍の発症を遅延させる、それを抑制する(例えば、その生長を低減させるかもしくは停止させる)、その効果を緩和する、またはそれに罹患している患者の生命を延長させることを意味するように、本明細書において用いられる。処置の必要がある人々には、がんを有すると診断された人々が含まれる。いくつかの態様において、処置とは、本開示の方法による1つまたは複数の治療剤の投与に起因する、原発、局所、または転移がん組織の根絶、除去、改変、または調節を指す。他の態様において、そのような用語は、そのような疾患を有する対象への1つまたは複数の治療剤の投与に起因する、がんの広がりの最小化または遅延を指す。他の態様において、そのような用語は、疾患を引き起こす細胞の排除を指す。本明細書において用いられる「処置」という用語は、別段の指示がない限り、処置する行為を指す。
本明細書において用いられる場合、「処置レジメン」という用語は、治療的レジメン(すなわち、がんの発症後)を指す。「処置レジメン」という用語は、天然物質および薬学的作用物質、ならびに、化学療法、放射線療法、陽子線療法、免疫療法、ホルモン療法、光線療法、凍結療法、凍結手術、毒素療法またはアポトーシス促進療法、高密度焦点式超音波療法、食事処置、理学療法または運動レジメン、外科的介入、およびそれらの組み合わせを含むがそれらに限定されない、任意の他の処置レジメンを包含する。
2. 略語
本出願を通して、以下の略語が用いられる。
ADAR=RNAに作用するアデノシンデアミナーゼ
AID=活性化誘導シチジンデアミナーゼ
APOBEC=アポリポタンパク質B mRNA編集酵素触媒ポリペプチド様(APOBEC)シチジンデアミナーゼ
ds=二本鎖
h=時間
min=分
NTS=非転写ストランド
SHM=体細胞超変異
SNV=一塩基多様性
ss=一本鎖
TS=転写ストランド
TSM=標的体細胞変異
3. メトリック
本明細書において用いられる場合、核酸分子において同定されたSNVを、複数のメトリックを決定するために用いることができ、これは次に、がん治療に応答する可能性が高い対象をがん治療に応答する可能性が低い対象から;および/または、がん治療に応答し続ける可能性が高い対象をがん治療に応答し続ける可能性が低い対象から、区別するのを手助けするために用いることができる。以下の記載から認識されるように、メトリックは、核酸分子の任意の1つまたは複数の領域におけるSNVの数またはパーセンテージに基づいて決定され、標的とされるヌクレオチド(すなわち、標的とされるかまたは変異しているヌクレオチドが、A、T、C、またはGであるかどうか)、変異タイプ(例えば、標的とされるヌクレオチドが、A、T、G、もしくはCに変異しているかどうか、変異が、転移もしくは転換変異であるかどうか、および/または変異が、同義もしくは非同義であるかどうか)、標的とされるヌクレオチドが存在するモチーフ、SNVのコドンコンテキスト、ならびに/またはSNVが起こるストランドの評価を含むことができる。したがって、任意の単一のSNVを、1つまたは複数のメトリックを生成するために用いることができ、多数のSNVを、もう2つのメトリック、典型的には、少なくとも10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500 、または6000個のメトリックを生成するために用いることができる。この複数のメトリックに基づいてプロファイルを作ることができ、そこでは、がん治療に応答する可能性が高い対象は、典型的には、がん治療に応答する可能性が低い対象とは異なるプロファイルを有し;かつがん治療に応答し続ける可能性が高い対象は、典型的には、がん治療に応答し続ける可能性が低い対象とは異なるプロファイルを有する。
本明細書における開示から明らかであるように、メトリックは、デアミナーゼ活性に関連しているか、またはそれを示すことができ、すなわち、メトリックは、1つまたは複数の内在性デアミナーゼ、例えば、ADAR、AID、またはAPOBECデアミナーゼの活性を示し得る、SNVの数、パーセンテージ、比、および/またはタイプを反映する。そのような例において、メトリックは、デアミナーゼ活性の遺伝学的指標と呼ばれ得る。
メトリックは、i) 核酸分子のコーディング領域(すなわち、ポリペプチドをコードする任意の領域)におけるSNVに関連するメトリックを含む、コーディングメトリック群;ii) 核酸分子のノンコーディング領域(例えば、イントロン、プロモーター、5'または3'非翻訳領域、遺伝子間領域)におけるSNVに関連するメトリックを含む、ノンコーディングメトリック群;iii) 核酸分子のすべての領域(すなわち、コーディング領域およびノンコーディング領域)におけるSNVに関連するメトリックを含む、ゲノムメトリック群;iv) SNVのコドンコンテキストに関連するメトリックを含む、コドンコンテキストメトリック群;v) 転位または転換であるSNVに関連するメトリックを含む、転位/転換メトリック群;vi) 同義または非同義であるSNVに関連するメトリックを含む、同義/非同義メトリック群;vii) SNVのストランドバイアスを示すかまたはそれに関連するメトリックを含む、ストランドバイアスメトリック群;viii) 特定のストランド上のSNVに関連するメトリックを含む、ストランド特異的メトリック群;ix) アデニンおよびチミン、ならびに/またはグアニンおよびシチジンが標的とされている(すなわち、変異している)SNVに関連するメトリックを含む、AT/GCメトリック群;x) 特定のモチーフにおけるSNVに関連するメトリックを含む、モチーフメトリック群;および、xi) モチーフとは無関係のSNVに関連するメトリックを含む、モチーフ非依存的メトリック群、を含む、メトリックのいくつかの群のうちの1つまたは複数に分類され得る。
メトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数を、本開示の方法のために評価することができる。典型的には、多数のメトリック、例えば、少なくとも4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100、200、300、400、500、600、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000個、またはそれよりも多くが評価される。いくつかの態様において、上記で同定された少なくとも2、3、4、5、6、7、8、9、または10個のメトリック群の各々由来の少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、100、200、300、400、500個、またはそれよりも多くのメトリックが用いられる。方法において用いられるメトリック(または指標)の特定の組み合わせは、本明細書における教示を用いて、当業者が容易に決定することができる。
3.1 モチーフ
メトリックが特定のモチーフ内で同定されたSNVを用いて決定される例(すなわち、モチーフメトリック群におけるメトリック)において、モチーフは、フォワードモチーフおよび等価のリバース相補モチーフのペアで解析されてもよい。例えば、フォワードモチーフACGは、下線を引いたCが標的とされている(または改変されている)モチーフを表し、リバースモチーフは、CGTであり、配列中、下線を引いたGが標的とされている(または改変されている)。理解されるように、リバース相補モチーフを同定することは、リバース相補DNA鎖上のフォワードモチーフを同定することと等価である。
モチーフには、公知のまたは示唆されるデアミナーゼモチーフであるものが含まれる。したがって、本開示のメトリック群はまた、1つまたは複数のデアミナーゼモチーフにおけるSNVに関連するメトリックを示す、デアミナーゼモチーフメトリック群も含む。認識されるように、そのようなメトリックはまた、デアミナーゼ活性の遺伝学的指標とも呼ばれ得る。内在性デアミナーゼは、B細胞における免疫グロブリン遺伝子の体細胞超変異およびクラススイッチ組換えを含む、体細胞変異誘発に関与していることが公知である。加えて、内在性デアミナーゼは、RNA編集および自然免疫において鍵となる因子である。例えば、数多くのデアミナーゼが、ウイルス複製を阻害するかまたは低減させる手段として、ウイルスRNAおよびDNAの編集に関与していることが示されており、ウイルス感染と戦うために自然免疫応答の他の因子を活性化することにも関係している(例えば、Samuel (2012) Curr Top Microbiol Immunol. 353;Vieira and Soares (2013) BioMed Research International, 683095;He et al. (2015) Mol Med Rep. 12(5): 6405-6414を参照されたい)。逆に、いくつかの例において、デアミナーゼは、プロウイルス機能を有するようである(例えば、Samuel (2011) Virology 411:180-193を参照されたい)。デアミナーゼはまた、発がん中に体細胞変異を引き起こし、いくつかの例においては、がんの進行およびその促進に関連している(Chan et al. (2014) Hepatology 63: 832 - 843;Leonard et al. (2013) Cancer Res. 73:7222-7231;Lindley et al. 2016 Cancer Med. 5: 2629-2640)。また、デアミナーゼ活性に起因するものなどの体細胞変異活性が、がんの早期徴候であるという増大する見解もある(Tomasetti et al. (2013) Proc. Natl. Acad. Sci. U. S. A. 110:1999-2004;Vogelstein et al. (2013) Science 339: 1456-1558)。
内在性デアミナーゼには、例えば、活性化誘導シチジンデアミナーゼ(AID)およびアポリポタンパク質B mRNA編集酵素触媒ポリペプチド様(APOBEC)シチジンデアミナーゼ、RNAに作用するアデノシンデアミナーゼなどのアデノシンデアミナーゼ、およびDNAポリメラーゼηなどのエラープローンDNAポリメラーゼが含まれる。これらの内在性デアミナーゼは、核酸における特定のモチーフを優先的に標的とする。さらに、例えば、WO 2014/066955およびLindley et al. (2016) Cancer Med. 2016 Sep; 5(9): 2629-2640に記載されているように、これらのデアミナーゼに起因する変異事象に関連するストランドバイアスおよびコドンコンテキストが両方とも存在し得る。
活性化誘導シチジンデアミナーゼ(AID)は、B細胞における免疫グロブリン遺伝子の体細胞超変異(SHM)およびクラススイッチ組換えに関与している、獲得免疫において重要な酵素である。AIDは、シチジンを脱アミノ化してウラシルにすること(CからU)によってSHMを誘因して、免疫グロブリン可変領域遺伝子(VDJ)を多様化し、新しい抗原結合部位を創出する。修復されない場合には、AIDによるCからUへの脱アミノ化は、DNAにおいてCからTへの体細胞変異を生じさせる。AIDの編集活性は、Ig遺伝子座に制限されず、B細胞にさえ制限されない。むしろ、環境および細胞型における体細胞変異誘発において、役割を果たすことが示されている。AIDは、HBVなどの様々なウイルスのDNAおよびRNAの編集を含む、抗ウイルス自然免疫応答に関与していることが示されており(例えば、He et al. (2015) Mol Med Rep. 12(5): 6405-6414、Liang et al. Proc Natl Acad Sci U S A. 110(6):2246-51)、また、がんの発生にも関係している(Okazaki et al (2007) Adv Immunol. 94:245-73)。
AIDに加えて、ヒトゲノムは、自然免疫およびRNA編集に関与していることが公知である、いくつかの相同のAPOBECシチジンデアミナーゼをコードしている(Smith et al. (2012) Semin. Cell. Dev. Biol. 23:258-268)。ヒトにおいて、少なくともAPOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、およびAPOBEC3Hが、自然免疫および/または細胞mRNA編集の提供に関与している。これらのAPOBECデアミナーゼは、抗ウイルス自然免疫応答、(HBVを含む)様々なウイルスのDNAおよびRNAの編集、およびウイルス複製の破壊に関与していることが示されている(例えば、Turelli et al. (2004) Science 303: 1829;Suspene et al. (2005) Proc Natl Acad Sci USA 102(23): 8321-8326;Nguyen et al. (2007) J. Virol. 81:4465 - 4472;Kock and Blum (2008) J Gen. Virol. 89: 1184-1191;He et al. (2015) Mol Med Rep. 12(5): 6405-6414;Willems et al. (2015) Viruses 7: 2999-3018を参照されたい)。APOBECシチジンデアミナーゼはまた、がんにも関連している(例えば、Roberts et al. (2013) Nature Genetics 45, 970-976;Harris et al. (2015) Breast Cancer Res. 17: 8;Nik-Zainal et al. (2012) Cell 149:979-993を参照されたい)。AIDと同様に、APOBECシチジンデアミナーゼは、転写および逆転写中に通常曝露される一本鎖DNA上でのそのDNA編集活性を介して、その標的DNAにおいて体細胞点変異を引き起こす。DNAにおけるシトシンのウラシルへの脱アミノ化(CからU)は、DNA修復機構によって修復されないままである場合には、CからTへのまたはリバース相補のGからAへの変異として現れる。したがって、これらのデアミナーゼは(AIDと共に)、モチーフ特異的なやり方で、それ自体の特定のCからUへの損傷および脱塩基後遺症を残すことができる。
二本鎖RNA特異的アデノシンデアミナーゼ、またはADAR酵素は、高等真核生物において最も優勢であるRNA編集のタイプ、すなわち、アデノシン残基のイノシンへの変換(AからIへの編集)を担う。ADARは、ヒトにおいてADAR遺伝子によってコードされている酵素である。ADAR1酵素は、アデノシンのイノシンへの変換を通して、dsRNAを不安定化する。ADAR1酵素は、コーディングRNAおよびノンコーディングRNAを含む、細胞RNAおよびウイルスRNAを修飾する。ADAR1は、造血に必要とされるRNA編集酵素である。制御されたレベルのADAR1発現が、肝臓における胚性赤血球生成に重要である。ADAR遺伝子における変異は、遺伝性対側性色素異常症に関連している。異なるアイソフォームをコードする、代替の転写スプライスバリアントが、特徴決定されている。他のデアミナーゼと同様に、ADARは、ウイルスに対する自然免疫応答を含む、自然免疫応答に関係している。しかし、それらの正確な役割は、多くの例において十分に定義されておらず、いくつかの例においては、ADARに抗ウイルスおよびプロウイルスの役割が両方ともあるようである(例えば、Samuel (2011) Virology 411(2):180-93を参照されたい)。ADAR活性はまた、がんにも関連しており、上昇したADARの発現および活性が、いくつかのがんにおいて実証されている(Gallo and Gallardi (2008) RNA Biol. 5:135-139;Galeano et al. (2012) Semin Cell Dev Biol. 23(3):244-50;Amin et al. (2017) Sci. Signal, 10:3941)。
表Bは、例示的なデアミナーゼモチーフを示し、モチーフのうちの任意の1つまたは複数を、本開示のメトリックを生成するために用いることができる。AIDについての一次モチーフは、WRC/GYWであり、6個の二次モチーフ(b-g)がある。ADARについての一次モチーフは、WA/TWであり、9個の二次モチーフ(b-j)がある。APOBEC3G(A3G)についての一次モチーフは、CC/GGであり、8個の二次モチーフ(b-i)がある。APOBEC3B(A3B)についての一次モチーフは、TCW/WGAであり、7個の二次モチーフ(b-i)がある。APOBEC3F(A3F)についてのモチーフはTC/GAであり、APOBEC1(A1)についてのモチーフはCA/TGである。
任意の1つまたは複数のデアミナーゼモチーフを、メトリックを生成するために、本明細書に記載されるように評価することができる。いくつかの例において、少なくとも1つのADARモチーフ(例えば、1、2、3、4、5、または6個のADARモチーフ)、少なくとも1つのAIDモチーフ(例えば、1、2、3、4、5、6、7、8、もしくは9個のAIDモチーフ)、少なくとも1つのAPOBEC3Gモチーフ(例えば、1、2、3、4、5、6、7、もしくは8個のAPOBEC3Gモチーフ)、少なくとも1つのAPOBEC3Bモチーフ(例えば、1、2、3、4、5、6、もしくは7個のAPOBEC3Bモチーフ)、少なくとも1つのAPOBEC3Fモチーフ、および/または少なくとも1つのAPOBEC1モチーフが、その特定のモチーフでのSNVの数および/またはタイプを決定するために、およびそれによってメトリックを生成するために評価される。
さらなる例において、モチーフは、必ずしもデアミナーゼモチーフではない。SNVが、3マーにおける位置:M1、M2、またはM3のうちの1つにおいて検出される一般的な3マーモチーフが、そのようなモチーフの中に含まれる。本明細書における目的で、典型的には、標的とされるヌクレオチドは、(必ずしもそうしないが)脱アミノ化事象を表し得る、AまたはCである。例えば、モチーフM1 M2 M3は、位置M1の標的とされる(下線を引いた)ヌクレオチドがAまたはCであり、位置M2およびM3のヌクレオチドが、各々独立してA、T、G、またはCであるモチーフを表す。モチーフM1 M2 M3は、位置M2の標的とされる(下線を引いた)ヌクレオチドがAまたはCであり、標的とされない位置M1およびM3のヌクレオチドが、各々独立してA、T、G、またはCであるモチーフを表す。モチーフM1 M2 M3は、位置M3の標的とされる(下線を引いた)ヌクレオチドがAまたはCであり、標的とされない位置M1およびM2のヌクレオチドが、各々独立してA、T、G、またはCであるモチーフを表す。したがって、このタイプの96個の可能な3マーフォワードモチーフがあり、各モチーフは、対応するリバース相補モチーフを伴っている。さらなる態様において、メトリックは、そのような3マーモチーフであるが、726個の可能なモチーフを結果としてもたらす、A、T、C、G、R、Y、S、W、K、M、またはNのいずれか1つである標的とされない位置のヌクレオチドを伴うものを用いて、決定することができる。
3マーモチーフの非限定的な例には、下記(例えば、表G)でGen2モチーフと時には呼ばれるもの:
;下記(例えば、表G)でADAR Gen2モチーフと時には呼ばれるもの:
;下記(例えば、表G)でADAR Gen1モチーフと時には呼ばれるもの:
;下記(例えば、表G)でADAR Gen3モチーフと時には呼ばれるもの:
;下記(例えば、表G)でGen1モチーフと時には呼ばれるもの:
;および下記(例えば、表G)でGen3モチーフと時には呼ばれるもの:
が含まれる。
他のモチーフには、SNVが、5マーにおける位置:M1、M2、M3、M4、またはM5のうちの1つにおいて検出される一般的な5マーモチーフが含まれる。本明細書における目的で、典型的には、標的とされる位置は、M2、M3、またはM4であり、ヌクレオチドは、(必ずしもそうしないが)脱アミノ化事象を表し得る、AまたはCである。例えば、モチーフM1 M2 M3 M4 M5は、位置M2の標的とされる(下線を引いた)ヌクレオチドがAまたはCであり、標的とされない位置M1、M3、M4、およびM5のヌクレオチドが、各々独立してA、T、G、またはCであるモチーフを表す。モチーフM1 M2 M3 M4 M5は、位置M3の標的とされる(下線を引いた)ヌクレオチドがAまたはCであり、標的とされない位置M1、M2、M4、およびM5のヌクレオチドが、各々独立してA、T、G、またはCであるモチーフを表す。モチーフM1 M2 M3 M4 M5は、位置M4の標的とされる(下線を引いた)ヌクレオチドがAまたはCであり、標的とされない位置M1、M2、M3、およびM5のヌクレオチドが、各々独立してA、T、G、またはCであるモチーフを表す。したがって、このタイプの1536個の可能な5マーフォワードモチーフがあり、各モチーフは、対応するリバース相補モチーフを伴っている。さらなる態様において、メトリックは、そのような5マーモチーフであるが、87,846個の可能なモチーフを結果としてもたらす、A、T、C、G、R、Y、S、W、K、M、またはNのいずれか1つである標的とされない位置のヌクレオチドを伴うものを用いて、決定することができる。
モチーフメトリックは、特定のモチーフにある核酸分子における総SNVの数またはパーセンテージを反映し得る(かつしたがって、それを評価することによって生成され得る)。さらなる態様において、モチーフメトリックは、標的とされるヌクレオチドでの変異の特定のタイプ、例えば、標的とされるGの代わりになるA、C、またはTがあるかどうかを検出することによって生成することができ、したがって、それを示すことができる。さらに、メトリックは、標的とされるヌクレオチドが、コドン内のいずれかの位置(すなわち、下記のようなMC-1、MC-2、またはMC-3)にあるかどうかを示すことができる。したがって、いくつかの例において、モチーフメトリックは、モチーフ(例えば、デアミナーゼモチーフ)において標的とされる位置でのいずれかのSNVの数、パーセンテージ、または比を表すことができ、ここで、標的とされるヌクレオチドは、コドン内のいずれかの位置にある。モチーフでのSNVのパーセンテージは、したがって、(変異のタイプまたは変異のコドンコンテキストにかかわらず)モチーフでのSNVの総数を核酸分子におけるSNVの総数で割ることによって算出される。しかし、他の例においては、モチーフでの、転移変異(すなわち、C>T、G>A、T>C、およびA>G)などの特定のタイプの変異であるSNVのみが、評価において考慮され、メトリックは、そのような変異のパーセンテージ、数、または比を反映する。またさらなる態様において、下記のように、コドンコンテキストおよび変異のタイプの両方が、評価される。
例示的なモチーフメトリックを、下記のセクション3.7.10において提供する。
3.2 コドンコンテキスト
デアミナーゼを含む変異原は、(例えば、WO 2014/066955およびLindley et al. (2016) Cancer Med. 2016 Sep; 5(9): 2629-2640に記載されているように)コドンコンテキスト様式でヌクレオチドを標的とすることができる。具体的には、変異誘発は、コドン内の特定の位置に存在する標的とされるヌクレオチドで起こることができる。本開示の目的で、変異したコドン(MC;すなわち、変異を含有するコドン)内のヌクレオチド位置は、MC-1、MC-2、およびMC-3と注釈をつけられ、コドンの配列を5'から3'へ読んだ場合に、コドンのそれぞれ、第1、第2、および第3のヌクレオチド位置を指す。
本開示のメトリックは、SNVのコドンコンテキストの決定、すなわち、SNVが変異したコドンにおいて第1、第2、または第3の位置、すなわち、MC-1、MC-2、またはMC-3部位にあるかどうかに、少なくとも部分的に基づくことができる。上記で指摘したように、多くのデアミナーゼは、変異したコドン内の特定の位置のヌクレオチドを標的とする好みを有する。よって、MC-1、MC-2、またはMC-3部位で起こるSNVの数および/またはパーセンテージは、デアミナーゼ活性の遺伝学的指標であることができる。認識されるように、コドンコンテキストメトリックは、核酸分子のコーディング領域においてのみ評価される。
SNVのコドンコンテキストの評価に基づくメトリックは、モチーフ非依存的であることができる(すなわち、標的とされるヌクレオチドが特定のモチーフ内にあるか否かにかかわらない、特定のコドンでのSNVの数および/またはパーセンテージの評価)。したがって、これらのメトリック(またはデアミナーゼ活性の遺伝学的指標)は、MC-1部位で起こる総SNVの数および/またはパーセンテージ;MC-2部位で起こる総SNVの数および/またはパーセンテージ;ならびにMC-3部位で起こる総SNVの数および/またはパーセンテージを含む。
他の態様において、SNVが、(上記のような)デアミナーゼモチーフ、3マーモチーフ、または5マーモチーフなどのモチーフにあるかどうかの同時評価もまた行われる。したがって、メトリックは、特定のモチーフ内、ならびにMC-1部位、MC-2部位、および/またはMC-3部位でのSNVの数および/またはパーセンテージに基づく、コドンコンテキスト、モチーフ依存的メトリックを含む。モチーフがデアミナーゼモチーフである場合、モチーフは、デアミナーゼ活性の遺伝学的指標とみなされることができ、MC-1部位、MC-2部位、および/またはMC-3部位で特定のモチーフに寄与し得るSNVの数および/またはパーセンテージ、例えば、AIDに寄与し得る(すなわち、AIDモチーフにある)、かつMC-1部位、MC-2部位、および/またはMC-3部位で起こるSNVの数および/またはパーセンテージ;ADARに寄与し得る(すなわち、ADARモチーフにある)、かつMC-1部位、MC-2部位、および/またはMC-3部位で起こるSNVの数および/またはパーセンテージ;APOBECデアミナーゼに寄与し得る(すなわち、APOBECモチーフ、例えば、APOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、もしくはAPOBEC3Hモチーフにある)、かつMC-1部位、MC-2部位、および/またはMC-3部位で起こるSNVの数および/またはパーセンテージを含む。
コドンコンテキストメトリックはまた、コドンコンテキストだけではなく、標的とされるヌクレオチド(すなわち、SNVを生じるために別のヌクレオチドに変異しているヌクレオチド)も考慮に入れるものも含む。したがって、メトリック(またはデアミナーゼ活性の遺伝学的指標)は、MC1位置、MC2位置、および/またはMC3位置であるアデニンの変異に起因するSNVの数またはパーセンテージを含む。例えば、アデニンの変異に起因するSNVの数を決定してもよく、MC-1部位、MC-2部位、および/またはMC-3部位にあるこれらのパーセンテージを、次いで決定して、メトリックを生成する。同様に、MC1位置、MC2位置、および/またはMC3位置で起こったチミンの変異に起因するSNVの数またはパーセンテージ;MC1位置、MC2位置、および/またはMC3位置で起こったシトシンの変異に起因するSNVの数またはパーセンテージ;MC1位置、MC2位置、および/またはMC3位置で起こったグアニンの変異に起因するSNVの数またはパーセンテージを、メトリック(またはデアミナーゼ活性の遺伝学的指標)を生成するために評価することができる。
さらなる態様において、MC-1、MC-2、またはMC-3部位での特定のタイプの変異の数またはパーセンテージを決定するために、SNVを結果としてもたらす変異のタイプ(例えば、C>A、C>T、C>G、G>C、G>T、G>A、A>T、A>G、A>C、T>A、T>C、またはT>G)およびSNVのコドンコンテキストが、両方とも評価される。再び、いくつかの態様において、これは、SNVが特定のデアミナーゼに関連するモチーフにあるかどうかの同時評価を伴わずに行われる。したがって、メトリック(またはデアミナーゼ活性の遺伝学的指標)は、例えば、(典型的にはAID、APOBEC3B、またはAPOBEC3G活性を示す)MC1部位でのC>T変異の数またはパーセンテージ;(典型的にはAID、APOBEC3B、またはAPOBEC3G活性を示す)MC2部位でのC>T変異の数またはパーセンテージ;(典型的にはAID、APOBEC3B、またはAPOBEC3G活性を示す)MC3部位でのC>T変異の数またはパーセンテージ;(典型的にはAID、APOBEC3B、またはAPOBEC3G活性を示す)MC1部位でのG>A変異の数またはパーセンテージ;(典型的にはAID、APOBEC3B、またはAPOBEC3G活性を示す)MC2部位でのG>A変異の数またはパーセンテージ;(典型的にはAID、APOBEC3B、またはAPOBEC3G活性を示す)MC3部位でのG>A変異の数またはパーセンテージ;(典型的にはADAR活性を示す)MC1部位でのT>C変異の数またはパーセンテージ;(典型的にはADAR活性を示す)MC2部位でのT>C変異の数またはパーセンテージ;(典型的にはADAR活性を示す)MC3部位でのT>C変異の数またはパーセンテージ;(典型的にはADAR活性を示す)MC1部位でのA>G変異の数またはパーセンテージ;(典型的にはADAR活性を示す)MC2部位でのA>G変異の数またはパーセンテージ;および(典型的にはADAR活性を示す)MC3部位でのA>G変異の数またはパーセンテージを含む。
他の態様において、SNVがモチーフ(例えば、デアミナーゼ、3マー、または5マーモチーフ)にあるかどうか、何のタイプの変異がSNVを結果としてもたらすか、およびまたSNVのコドンコンテキストの評価が、コドンコンテキストメトリックを生成するために行われる。非限定的な例において、AIDモチーフでのC>T、C>A、もしくはA>G変異;ADARモチーフでのA>T変異;APOBEC3GモチーフでのC>TもしくはG>A変異;APOBEC3HモチーフでのG>A変異;またはAPOBEC1モチーフでのG>AもしくはG>T変異であるSNVの数および/またはパーセンテージの評価が、メトリック(またはデアミナーゼ活性の遺伝学的指標)を生成するために決定される。
例示的なコドンコンテキストメトリックを、下記のセクション3.7.4において提供する。
3.3 転位/転換
転位(Ti)は、プリンからプリンへ、またはピリミジンからピリミジンへの任意の変異(すなわち、C>A、G>T、A>C、およびT>G)として定義され、転換(Tv)は、ピリミジンからプリンへ、またはプリンからピリミジンへの任意の変異(すなわち、C>T、C>G、G>A、G>C、A>G、A>T、T>C、およびT>A)として定義される。転位/転換メトリック群は、したがって、転位または転換であるSNVから決定されるかまたはそれに関連するメトリックを含み、例えば、転位もしくは転換であるSNVの数もしくはパーセンテージ、または転位対転換もしくは転換対転位の比を含む。
いくつかの態様において、モチーフ、コドンコンテキスト、および/または特定の変異タイプもまた、評価される。したがって、例えば、転位/転換メトリック群は、転位(もしくは転換)であるモチーフでのSNVの数もしくはパーセンテージ、転位(もしくは転換)である特定のヌクレオチド(例えば、C、G、A、またはT)を標的とするSNVの数もしくはパーセンテージを反映するか、またはモチーフおよびヌクレオチドを両方とも評価するメトリックを含むことができる。したがって、例えば、アデニンの変異に起因するすべてのSNVの転位-転換比、すなわち、アデニンの転位変異(すなわち、A>G)に起因するすべてのSNV対アデニンの転換変異(すなわち、A>TまたはC)に起因するすべてのSNVの比;チミンの変異に起因するすべてのSNVの転位-転換比、すなわち、チミンの転位変異(すなわち、T>C)に起因するすべてのSNV対チミンの転換変異(すなわち、T>GまたはA)に起因するすべてのSNVの比;シトシンの変異に起因するすべてのSNVの転位-転換比、すなわち、シトシンの転位変異(すなわち、C>T)に起因するすべてのSNV対シトシンの転換変異(すなわち、C>GまたはA)に起因するすべてのSNVの比、および、グアニンの変異に起因するすべてのSNVの転位-転換比、すなわち、グアニンの転位変異(すなわち、G>A)に起因するすべてのSNV対グアニンの転換変異(すなわち、G>CまたはT)に起因するすべてのSNVの比;アデニンまたはチミンの変異に起因するすべてのSNVの転位-転換比、すなわち、アデニンの転位変異(すなわち、A>G)またはチミンの転位変異(すなわち、T>C)に起因するすべてのSNV対アデニンの転換変異(すなわち、A>TもしくはC)またはチミンの転換変異(すなわち、T>GもしくはA)に起因するすべてのSNVの比;ならびに、シトシンまたはグアニンの変異に起因するSNVの転位-転換比、すなわち、グアニンの転位変異(すなわち、G>A)またはシトシンの転位変異(すなわち、C>T)に起因するすべてのSNV対グアニンの転換変異(すなわち、G>CもしくはT)またはシトシンの転換変異(すなわち、C>GもしくはA)に起因するすべてのSNVの比を反映するメトリックが含まれる。さらなる例において、メトリックを生成するためにSNVを評価する場合にモチーフもまた考慮され、このためパーセンテージおよび比は、1つまたは複数のデアミナーゼモチーフでのヌクレオチドの転位または転換に起因するSNVのものである。
例示的な転位/転換メトリックを、下記のセクション3.7.5において提供する。
3.4 同義/非同義変異
本開示のメトリックはまた、核酸分子において同義または非同義変異であるSNVを反映し得るか、またはそれに基づき得る。同義変異とは、コードされるポリペプチドに対していかなる影響も有さないものであり、他方、非同義変異は、コードされるポリペプチドのアミノ酸配列の改変を結果としてもたらす。同義/非同義メトリック群は、したがって、同義または非同義変異であるSNVから決定されるかまたはそれに関連する変異を含み、例えば、同義もしくは非同義であるSNVの数もしくはパーセンテージ、または同義変異対非同義変異もしくは非同義変異対同義変異の比を含む。
いくつかの態様において、モチーフ、コドンコンテキスト、および/または特定の変異タイプもまた、評価される。したがって、例えば、同義/非同義メトリック群は、同義(もしくは非同義)であるモチーフでのSNVのパーセンテージ、または同義(もしくは非同義)であり、かつ特定のヌクレオチド(例えば、C、G、A、またはT)を標的とするモチーフでのSNVのパーセンテージを反映するメトリックを含むことができる。
例示的な同義/非同義メトリックを、下記のセクション3.7.6において提供する。
3.5 ストランドバイアス
上記で指摘したように、デアミナーゼは、そのヌクレオチドのターゲティングにおいてストランドバイアスを呈し得る。したがって、変異のストランドバイアスの証拠はまた、例えば、デアミナーゼ活性の指標であることもでき、ストランドバイアスを反映するメトリック(すなわち、ストランドバイアスメトリック群におけるメトリック)が、したがって、本開示に含まれる。ストランドバイアスは、例えば、特定のヌクレオチドを標的とする変異のパーセンテージ、またはこれらの変異の様々な比を算出することによって、評価することができる。例えば、シトシンヌクレオチドの変異を含むSNVの数またはパーセンテージ対グアニンヌクレオチドの変異を含むSNVのパーセンテージ(C:G比)を決定することができる。別の例において、アデニンヌクレオチドの変異を含むSNVの数またはパーセンテージ対チミンヌクレオチドの変異を含むSNVのパーセンテージ(A:T比)が決定される。いくつかの態様において、SNVのモチーフまたはコドンコンテキストもまた、評価される。したがって、例えば、モチーフが、標的とされるフォワードモチーフにおけるシチジンヌクレオチド、およびしたがってリバースモチーフにおけるグアニンヌクレオチドを含む場合、メトリックは、(本質的に、次いでC:G比を反映する)Cを標的とするモチーフでのSNVのパーセンテージを評価することによって決定される。
例示的なストランドバイアスメトリックを、下記のセクション3.7.7において提供する。
3.6 ストランド特異性
本開示のメトリックはまた、DNAのただ1本のストランド、すなわち、非転写(または、センスもしくはコーディング)ストランド、または転写(または、アンチセンスもしくは鋳型)ストランド(または、CもしくはGの/由来の変異が評価される場合は、それぞれ、「C」もしくは「G」ストランド;またはAもしくはTの/由来の変異が評価される場合は、それぞれ、「A」もしくは「T」ストランド)上で同定されたSNVに基づくものも含むことができる。これらのストランド特異的メトリックは、典型的には、所与のストランド上の特定の標的とされる(または変異している)ヌクレオチド(例えば、A、T、C、またはG)由来の(またはその)変異の数またはパーセンテージの評価を含む。特定のデアミナーゼは、核酸分子における特定のヌクレオチドを標的とする好みを有し得るという状況から、そのようなメトリックは、デアミナーゼ活性の遺伝学的指標とみなされ得る。例えば、アデニンは、多くの場合、ADARの標的であり、他方、シトシンは、多くの場合、AIDまたはAPOBECデアミナーゼの標的である。したがって、メトリック(またはデアミナーゼ活性の遺伝学的指標)は、(例えば、A>C、A>T、およびA>Gの変異の総数を検出し、この総計を検出されるSNVの総数のパーセンテージとして表現する)アデニンヌクレオチドの変異に起因するSNVの数もしくはパーセンテージ;(例えば、T>C、T>A、およびT>Gの変異の総数を検出し、この総計を検出されるSNVの総数のパーセンテージとして表現する)チミンヌクレオチドの変異に起因するSNVの数もしくはパーセンテージ;(例えば、C>A、C>T、およびC>Gの変異の総数を検出し、この総計を検出されるSNVの総数のパーセンテージとして表現する)シトシンヌクレオチドの変異に起因するSNVの数もしくはパーセンテージ;ならびに/または(例えば、G>C、G>T、およびG>Aの変異の総数を検出し、この総計を検出されるSNVの総数のパーセンテージとして表現する)グアニンヌクレオチドの変異に起因するSNVの数またはパーセンテージを表すことができる。これらはまた、A、T、G、またはCヌクレオチドの変異の総数における不均衡を示すことができるため、ストランドバイアスの指示であることもできる。さらなる例において、標的とされるヌクレオチドがそれに変異しているヌクレオチドもまた、評価される。例えば、メトリックは、A>C変異であるAを標的とするすべてのSNVの数またはパーセンテージを表し得る。
例示的なストランド特異的メトリックを、下記のセクション3.7.8において提供する。
3.7 ATおよびGC SNV
メトリックはまた、アデニンおよびチミン(AT)を変異させるかもしくは標的とする組み合わされたSNV、ならびに/またはグアニンおよびシトシン(GC)を変異させるかもしくは標的とする組み合わされたSNVの評価を含むこともできる。ATまたはGCでのSNVの数および/またはパーセンテージを、評価することができる。さらなる例において、比が算出され、例えば、アデニンまたはチミンヌクレオチドの変異を含むSNVの数またはパーセンテージ対シトシンまたはグアニンヌクレオチドの変異を含むSNVの数またはパーセンテージの比(AT:GC比)が決定される。さらなる例において、ATまたはGC SNVのコドンコンテキストを、メトリックを生成するために考慮に入れることができる。
例示的なストランド特異的メトリックを、下記のセクション3.7.8において提供する。
3.8 例示的なメトリック
3.8.1 コーディング領域メトリック
メトリックは、核酸分子のちょうどコーディング領域(コーディング配列またはCDSとも呼ばれる)において同定されたSNVを用いて決定することができる。例示的なコーディング領域メトリックには、主として表Cにおいて提供されるモチーフ関連メトリック(コーディング領域におけるSNVの総数を表す「CDSバリアント」の例外を伴う)、および表Dにおいて提供されるモチーフ非依存的メトリックが含まれる。これらの表は、メトリック名、メトリックが表すものの簡単な説明、およびどのようにメトリックを算出/決定したかを提供する。表における「モチーフ」への言及は、デアミナーゼ、3マー、または5マーモチーフのいずれか1つを含む、セクション3.1における上記のモチーフのいずれか1つを指す。列8~19、21~25、および26~27のメトリックは、代替的に、関連性がある場合に利用される。例えば、モチーフが、標的とされるヌクレオチドでCまたはGを含む場合、これらのGまたはCヌクレオチドでSNVを評価するメトリックが用いられ、モチーフが、標的とされるヌクレオチドでAまたはTを含む場合、これらのAまたはTヌクレオチドでSNVを評価する代替のメトリック(すなわち、斜体のメトリック)が用いられる。
典型的には、多数のコーディング領域メトリック、例えば、少なくとも4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100、200、300、400、500、600、800、900、1000、1500、2000、3000、4000個、またはそれよりも多くが、本明細書に記載の方法およびシステムにおいて決定され、かつ/または用いられる。
表Cから明らかにわかり得るように、モチーフ関連メトリックは、モチーフメトリック群に分類されるだけではなく、コドンコンテキストメトリック群、転位/転換(Ti/Tv)メトリック群、同義/非同義メトリック群、ストランドバイアス群メトリック群、ストランド特異的メトリック群、およびAT/GCメトリック群の一部を形成することもできる。いくつかの態様において、表Cに示されるモチーフ関連コーディング領域メトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数が、本開示の方法およびシステムについて、ならびに表Bに示されるモチーフのうちの任意の1つまたは複数について評価される。認識されるように、多数の可能なモチーフのために、表Cには多数の可能なメトリックが表されている。例えば、29個のモチーフ関連コーディング領域メトリックおよび39個のデアミナーゼモチーフで、1044個の可能なデアミナーゼモチーフ関連コーディング領域メトリックがある。典型的には、多数のモチーフ関連コーディング領域メトリック、例えば、少なくとも4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100、200、300、400、500、600、800、900、1000、1500、2000個、またはそれよりも多くが、本明細書に記載の方法およびシステムにおいて用いられる。
(表D)モチーフ非依存的コーディング領域メトリック
表Dに示されるメトリックに加えて、表Dの列1~84に示されるメトリックに相当するが、4つの一次デアミナーゼモチーフ(すなわち、AIDモチーフWRC/GYW;ADARモチーフWA/TW、APOBEC3GモチーフCC/GG;およびAPOBEC3BモチーフTCW/WGA)のうちの1つには関連しない、モチーフ非依存的コーディング領域メトリックの追加的な対応するセットが提供される。したがって、表Dにおけるメトリックが、4つの一次デアミナーゼモチーフのうちの1つ内に、二次デアミナーゼモチーフのうちの1つ内に、3マーもしくは5マーモチーフ内に分類されるか、またはいずれのモチーフ内にも分類されないものを含む、コーディング領域における列挙されるメトリックの「すべて」を含む場合、対応する「他の」メトリックは、4つの一次デアミナーゼモチーフのうちの1つ内に分類される列1~84に示されるそれらのメトリックのみを含む。例えば、表Dの列1におけるメトリック(cds:All A total)は、A CDSバリアントの総数である。対応する「他の」メトリック(cds:Other A total)は、4つの一次デアミナーゼモチーフのうちの1つに関連しない(またはそれ内ではない)cds Aバリアントの総数である。
表Dおよび対応する「他の」メトリックの説明から明らかにわかり得るように、モチーフ非依存的メトリックはまた、コドンコンテキストメトリック群、転位/転換(Ti/Tv)メトリック群、同義/非同義メトリック群、ストランドバイアス群メトリック群、ストランド特異的メトリック群、およびAT/GCメトリック群の一部を形成することもできる。表Dに示されるモチーフ非依存的コーディング領域メトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数は、本開示の方法およびシステムに従って決定され、かつ/または用いられてもよい。典型的には、これらのメトリックの少なくとも2,3、4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、または80個が、決定され、かつ/または用いられる。
3.8.2 ノンコーディング領域メトリック
核酸分子のノンコーディング領域(例えば、5'および3' UTR、プロモーター、遺伝子間領域、イントロンなど)において同定されたSNVに基づくメトリックもまた、決定することができる。例示的なノンコーティング領域メトリックには、表Eに示されるものが含まれるが、それらに限定されない。認識されるように、これらのメトリックは、解析された核酸配列がノンコーディング領域を含有する場合にのみ、決定され、かつ/または用いられ;これらのメトリックは、核酸配列が、例えば、全エキソームシーケンシングを用いて得られた場合には、用いられない。
列11~20におけるメトリックは、本質的には、列1~10におけるメトリックに対応するが、4つの一次デアミナーゼモチーフ(すなわち、AIDモチーフWRC/GYW;ADARモチーフWA/TW、APOBEC3GモチーフCC/GG;およびAPOBEC3BモチーフTCW/WGA)のうちの1つには関連しない。したがって、表Eの列1~10におけるメトリックが、4つの一次デアミナーゼモチーフのうちの1つ内に、二次デアミナーゼモチーフのうちの1つ内に、3マーもしくは5マーモチーフ内に分類されるか、またはいずれのモチーフ内にも分類されないものを含む、ノンコーディング領域における列挙されるメトリックの「すべて」を含む場合、対応する「他の」メトリックは、4つの一次デアミナーゼモチーフのうちの1つ内に分類される列1~10に示されるそれらのメトリックのみを含む。
認識されるように、これらのノンコーディングメトリックはまた、モチーフメトリック群、モチーフ非依存的メトリック群、転位/転換メトリック群、およびAT/GCメトリック群の一部を形成することもできる。表Eに示されるノンコーディング領域メトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数は、本開示の方法およびシステムに従って決定され、かつ/または用いられてもよい。典型的には、これらのメトリックの少なくとも2,3、4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100個、またはそれよりも多くが、決定され、かつ/または用いられる。
3.8.3 ゲノムメトリック
他の例示的なメトリックには、ゲノム核酸配列のすべての領域にわたって決定され、すなわち、配列がノンコーディング領域のものであるかまたはコーディング領域のものであるかにかかわらず、評価されるものが含まれる。認識されるように、これらのメトリックは、したがって、(例えば、全エキソームシーケンシングによって)核酸の一部のみの配列が評価される場合に、または(全ゲノムシーケンシングによって)核酸全体の配列が評価されるかどうか、決定され、かつ/または用いられ得る。ゲノムメトリック群における例示的なメトリックは、表Fに示されるものを含む。列11~20におけるメトリックは、本質的には、列1~10におけるメトリックに対応するが、4つの一次デアミナーゼモチーフ(すなわち、AIDモチーフWRC/GYW;ADARモチーフWA/TW、APOBEC3GモチーフCC/GG;およびAPOBEC3BモチーフTCW/WGA)のうちの1つには関連しない。したがって、表Fの列1~10におけるメトリックが、4つの一次デアミナーゼモチーフのうちの1つ内に、二次デアミナーゼモチーフのうちの1つ内に、3マーもしくは5マーモチーフ内に分類されるか、またはいずれのモチーフ内にも分類されないものを含む、ゲノム領域における列挙されるメトリックの「すべて」を含む場合、対応する「他の」メトリックは、4つの一次デアミナーゼモチーフのうちの1つ内に分類される列1~10に示されるそれらのメトリックのみを含む。
認識されるように、これらのゲノムメトリックはまた、AT/GCメトリック群におけるメトリックも含む。表Fに示されるゲノムメトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数は、本開示の方法およびシステムに従って決定され、かつ/または用いられてもよい。典型的には、これらのメトリックの少なくとも2,3、4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、または80個が、決定され、かつ/または用いられる。
3.8.4 コドンコンテキストメトリック
本開示のメトリックは、SNVのコドンコンテキストに関連するものを含み、すなわち、メトリックを決定する時にSNVのコドンコンテキストが評価される。コドンコンテキストメトリックは、したがって、SNVが、コドンのMC-1、MC-2、またはMC-3位置にあるかどうかの評価が行われている、いずれかを含む。認識されるように、そのようなメトリックには、コーディングメトリック群におけるもののみが含まれ、ノンコーディングメトリック群またはゲノムメトリック群におけるいかなるメトリックも含まれない。
いくつかの例において、コドンコンテキストメトリックはまた、モチーフメトリックでもあり、例えば、表Cの列5~13および26~28に示されるもの、すなわち、Motif C>T at MC1 %、Motif A>G at MC1 %、Motif C>T at MC2 %、Motif A>G at MC2 %、Motif C>T at MC3 %、Motif A>G at MC3 %、Motif G>A at MC1 %、Motif T>C at MC1 %、Motif G>A at MC2 %、Motif T>C at MC2 %、Motif G>A at MC3 %、Motif T>C at MC3 %、Motif MC1 non-syn %、Motif MC2 non-syn %、およびMotif MC3 non-syn %を含む。他の例において、コドンコンテキストメトリックはまた、モチーフ非依存的メトリックでもあり、例えば、表Dの列9~35、42~56、60~68、および86~88に示されるもの、すなわち、cds:All MC1 %、cds:All MC2 %、cds:All MC3 %、cds:All A MC1 %、cds:All A MC2 %、cds:All A MC3 %、cds:All T MC1 %、cds:All T MC2 %、cds:All T MC3 %、cds:All C MC1 %、cds:All C MC2 %、cds:All C MC3 %、cds:All G MC1 %、cds:All G MC2 %、cds:All G MC3 %、cds:All MC1 A %、cds:All MC1 T %、cds:All MC1 C %、cds:All MC1 G %、cds:All MC2 A %、cds:All MC2 T %、cds:All MC2 C %、cds:All MC2 G %、cds:All MC3 A %、cds:All MC3 T %、cds:All MC3 C %、cds:All MC3 G %、cds:All MC1 Ti/Tv %、cds:All MC2 Ti/Tv %、cds:All MC3 Ti/Tv %、cds:All A MC1 Ti/Tv %、cds:All A MC2 Ti/Tv %、cds:All A MC3 Ti/Tv %、cds:All T MC1 Ti/Tv %、cds:All T MC2 Ti/Tv %、cds:All T MC3 Ti/Tv %、cds:All C MC1 Ti/Tv %、cds:All C MC2 Ti/Tv %、cds:All C MC3 Ti/Tv %、cds:All G MC1 Ti/Tv %、cds:All G MC2 Ti/Tv %、cds:All G MC3 Ti/Tv %、cds:All MC1 C:G %、cds:All MC2 C:G %、cds:All MC3 C:G %、cds:All MC1 A:T %、cds:All MC2 A:T %、cds:All MC3 A:T %、cds:All MC1 AT:GC %、cds:All MC2 AT:GC %、cds:All MC3 AT:GC %、cds:All MC1 non-syn %、cds:All MC2 non-syn %、およびcds:All MC3 non-syn %を含む。認識されるように、これらのコドンコンテキストメトリックはまた、転位/転換(Ti/Tv)メトリック群、同義/非同義メトリック群、ストランドバイアス群メトリック群、ATメトリック群、およびGCメトリック群におけるメトリックも含む。
コドンコンテキストメトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数は、本開示の方法およびシステムに従って決定され、かつ/または用いられてもよい。いくつかの例において、1つまたは複数のモチーフ関連コドンコンテキストメトリック、および/またはもう1つのモチーフ非依存的コドンコンテキストメトリックが、決定され、かつ/または用いられる。典型的には、これらのメトリックの少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100、120、140、160、180、200個が、(SNVのコドンコンテキストと共に評価され得る様々なモチーフを考慮に入れて)決定され、かつ/または用いられる。
3.8.5 転位/転換メトリック
本開示のメトリックは、転位(Ti)変異または転換(Tv)変異のいずれかであるSNVに関連する、すなわち、SNVが転位または転換のいずれかであるかどうかが判定される場合のものである。そのようなメトリックは、典型的には、コーディングメトリック群内に分類されるが、ノンコーディングメトリック群またはゲノムメトリック群にあることもできる。
いくつかの例において、転位/転換メトリックはまた、モチーフメトリックでもあり、例えば、表Cの列4、8~20、および20~22に示されるもの、すなわち、Motif Ti%、Motif C>T at MC1 %、Motif A>G at MC1 %、Motif C>T at MC2 %、Motif A>G at MC2 %、Motif C>T at MC3 %、Motif A>G at MC3 %、Motif G>A at MC1 %、Motif T>C at MC1 %、Motif G>A at MC2 %、Motif T>C at MC2 %、Motif G>A at MC3 %、Motif T>C at MC3 %、Motif C>T %,、Motif A>G %、Motif C>A %、Motif A>C %、Motif C>G %、Motif A>T %、Motif G>A %、Motif T>C %、Motif G>T %、Motif T>G %、Motif G>C %、Motif T>A %、Motif Ti/Tv %、およびMotif Ti C:G %を含む。他の例において、転位/転換メトリックはまた、モチーフ非依存的メトリックでもあり、例えば、表Dの36~52および65~76に示されるそれらのコーディング領域メトリック、すなわち、cds:All AT Ti/Tv %、cds:All CG Ti/Tv %、cds:All MC1 Ti/Tv %、cds:All MC2 Ti/Tv %、cds:All MC3 Ti/Tv %、cds:All A MC1 Ti/Tv %、cds:All A MC2 Ti/Tv %、cds:All A MC3 Ti/Tv %、cds:All T MC1 Ti/Tv %、cds:All T MC2 Ti/Tv %、cds:All T MC3 Ti/Tv %、cds:All C MC1 Ti/Tv %、cds:All C MC2 Ti/Tv %、cds:All C MC3 Ti/Tv %、cds:All G MC1 Ti/Tv %、cds:All G MC2 Ti/Tv %、and cds:All G MC3 Ti/Tv %、cds:All A>G %、cds:All A>C %、cds:All A>T %、cds:All T>C %、cds:All T>G %、cds:All T>A %、cds:All C>T %、cds:All C>A %、cds:All C>G %、cds:All G>A %、cds:All G>T %、cds:All G>C %;表Eの列5~10、15~20、および24~26に示されるそれらのノンコーディング領域メトリック、すなわち、nc:A>G + T>C %、nc:A>C + T>G %、nc:A>T + T>A %、nc:C>T + G>A %、nc:C>A + G>T %、nc:C>G + G>C %、nc:Other A>G + T>C %、nc: Other A>C + T>G %、nc: Other A>T + T>A %、nc: Other C>T + G>A %、nc: Other C>A + G>T %、nc: Other C>G + G>C %、nc:Motif C>T + G>A %、nc:Motif A>G + T>C %、nc:Motif C>A + G>T %、nc:Motif A>C + T>G %、nc:Motif C>G + G>C %、およびnc:Motif A>T + T>A %;ならびに、表Fの列5~10、15~20、および14~16に示されるそれらのゲノムメトリック、すなわち、g:A>G + T>C %、g:A>C + T>G %、g:A>T + T>A %、g:C>T + G>A %、g:C>A + G>T %、g:C>G + G>C %、g: Other A>G + T>C %、g: Other A>C + T>G %、g: Other A>T + T>A %、g: Other C>T + G>A %、g: Other C>A + G>T %、g: Other C>G + G>C %g:Motif C>T + G>A %、g:Motif A>G + T>C %、g:Motif C>A + G>T %、g:Motif A>C + T>G %、g:Motif C>G + G>C %、およびg:Motif A>T + T>A %を含む。
認識されるように、これらの転位/転換メトリックはまた、コドンコンテキストメトリック群、同義/非同義メトリック群、ストランドバイアス群メトリック群、ストランド特異的メトリック群、およびAT/GCメトリック群におけるメトリックも含む。
転位/転換メトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数は、本開示の方法およびシステムに従って決定され、かつ/または用いられてもよい。いくつかの例において、1つまたは複数のモチーフ関連転位/転換メトリック、および/またはもう1つのモチーフ非依存的転位/転換メトリックが、決定され、かつ/または用いられる。典型的には、これらのメトリックの少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100、120、140、160、180、200個が、(SNVが転位または転換であるかどうかと共に評価され得る様々なモチーフを考慮に入れて)決定され、かつ/または用いられる。
3.8.6 同義/非同義メトリック
本開示のメトリックは、同義変異または非同義変異のいずれかであるSNVに関連する、すなわち、SNVが同義変異または非同義変異のいずれかであるかどうかが判定される場合のものを含む。認識されるように、これらのメトリックは、専らコーディングメトリック群内に分類される。
いくつかの例において、同義/非同義メトリックはまた、モチーフメトリックでもあり、例えば、表Cの列23~28に示されるもの、すなわち、Motif non-syn %、Motif C non-syn %、Motif A non-syn %、Motif G non-syn %、Motif T non-syn %、Motif MC1 non-syn %、Motif MC2 non-syn %、およびMotif MC3 non-syn %を含む。他の例において、同義/非同義メトリックはまた、モチーフ非依存的メトリックでもあり、例えば、表Dの列77~84に示されるもの、すなわち、cds:All non-syn %、cds:All A non-syn %、cds:All T non-syn %、cds:All C non-syn %、cds:All G non-syn %、cds:All MC1 non-syn %、cds:All MC2 non-syn %、およびcds:All MC3 non-syn %を含む。認識されるように、これらの同義/非同義メトリックはまた、コドンコンテキストメトリック群、およびストランド特異的メトリック群におけるメトリックも含む。
同義/非同義メトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数は、本開示の方法およびシステムに従って決定され、かつ/または用いられてもよい。いくつかの例において、1つまたは複数のモチーフ関連同義/非同義メトリック、および/またはもう1つのモチーフ非依存的同義/非同義メトリックが、決定され、かつ/または用いられる。典型的には、これらのメトリックの少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100、120、140、160、180、200個が、(SNVが同義変異または非同義変異であるかどうかと共に評価され得る様々なモチーフを考慮に入れて)決定され、かつ/または用いられる。
3.8.7 ストランドバイアスメトリック
本開示のメトリックは、SNVのストランドバイアスに関連する、すなわち、SNVが、DNAの転写ストランドまたは非転写ストランド上でより優勢であるかまたは優勢でないかを推論することができる場合のものを含む。これらのメトリックは、典型的には、コーディングメトリック群内に分類されるが、ノンコーディングメトリック群またはゲノムメトリック群におけるメトリックも含むことができる。
いくつかの例において、ストランドバイアスメトリックはまた、モチーフメトリックでもあり、例えば、表Cの列21および22に示されるもの、すなわち、Motif C:G %、Motif A:T %、Motif Ti C:G %、およびMotif Ti A:T %を含む。他の例において、同義/非同義メトリックはまた、モチーフ非依存的メトリックでもあり、例えば、表Dの53、54、および56~61に示されるもの、すなわち、cds:All C:G %、cds:All A:T %、cds:All MC1 C:G %、cds:All MC2 C:G %、cds:All MC3 C:G %、cds:All MC1 A:T %、cds:All MC2 A:T %、およびcds:All MC3 A:T %を含む。認識されるように、これらのストランドバイアスメトリックはまた、コドンコンテキストメトリック群、および転位/転換メトリック群におけるメトリックも含む。
ストランドバイアスメトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数は、本開示の方法およびシステムに従って決定され、かつ/または用いられてもよい。いくつかの例において、1つまたは複数のモチーフ関連ストランドバイアスメトリック、および/またはもう1つのモチーフ非依存的ストランドバイアスメトリックが、決定され、かつ/または用いられる。典型的には、これらのメトリックの少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100、120、140、160、180、200個が、(SNVのストランドバイアスがあるかどうかと共に評価され得る様々なモチーフを考慮に入れて)決定され、かつ/または用いられる。
3.8.8 ストランド特異的メトリック
特定のストランド(すなわち、非転写ストランドまたは転写ストランド)上のSNVに関連するストランド特異的メトリック(またはデアミナーゼ活性の遺伝学的指標)もまた、提供される。これらのメトリックは、コーディング群におけるのみを含み、そこで、ストランドの性質を決定することができる。
例示的なストランド特異的メトリックには、モチーフメトリックでもあるメトリック、例えば、表Cの列8~19、24、および25に示されるもの、すなわち、Motif C>T at MC1 %、Motif A>G at MC1 %、Motif C>T at MC2 %、Motif A>G at MC2 %、Motif C>T at MC3 %、Motif A>G at MC3 %、Motif G>A at MC1 %、Motif T>C at MC1 %、Motif G>A at MC2 %、Motif T>C at MC2 %、Motif G>A at MC3 %、Motif T>C at MC3 %、Motif C>T %、Motif A>G %、Motif C>A %、Motif A>C %、Motif C>G %、Motif A>T %、Motif G>A %、Motif T>C %、Motif G>T %、Motif T>G %、Motif G>C %、Motif T>A %、Motif C non-syn %、Motif A non-syn %、Motif G non-syn %、およびMotif T non-syn %が含まれる。ストランド特異的メトリックはまた、例えば、表Dの列1~8、12~35、41~52、65~76、および878~81に示されるコーディングメトリック、すなわち、cds:All A total、cds:All T total、cds:All C total、cds:All G total、cds:All A %、cds:All T %、cds:All C %、cds:All G %、cds:All A MC1 %、cds:All A MC2 %、cds:All A MC3 %、cds:All T MC1 %、cds:All T MC2 %、cds:All T MC3 %、cds:All C MC1 %、cds:All C MC2 %、cds:All C MC3 %、cds:All G MC1 %、cds:All G MC2 %、cds:All G MC3 %、cds:All MC1 A %、cds:All MC1 T %、cds:All MC1 C %、cds:All MC1 G %、cds:All MC2 A %、cds:All MC2 T %、cds:All MC2 C %、cds:All MC2 G %、cds:All MC3 A %、cds:All MC3 T %、cds:All MC3 C %、cds:All MC3 G %、cds:All A MC1 %、cds:All A MC2 %、cds:All A MC3 %、cds:All T MC1 %、cds:All T MC2 %、cds:All T MC3 %、cds:All C MC1 %、cds:All C MC2 %、cds:All C MC3 %、cds:All G MC1 %、cds:All G MC2 %、cds:All G MC3 %、cds:All MC1 A %、cds:All MC1 T %、cds:All MC1 C %、cds:All MC1 G %、cds:All MC2 A %、cds:All MC2 T %、cds:All MC2 C %、cds:All MC2 G %、cds:All MC3 A %、cds:All MC3 T %、cds:All MC3 C %、cds:All MC3 G %、cds:All A>G %、cds:All A>C %、cds:All A>T %、cds:All T>C %、cds:All T>G %、cds:All T>A %、cds:All C>T %、cds:All C>A %、cds:All C>G %、cds:All G>A %、cds:All G>T %、cds:All G>C %、cds:All A non-syn %、cds:All T non-syn %、cds:All C non-syn %、およびcds:All G non-syn %を含む、モチーフ非依存的メトリックも含む。
ストランド特異的メトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数は、本開示の方法およびシステムに従って決定され、かつ/または用いられてもよい。いくつかの例において、1つまたは複数のモチーフ関連ストランド特異的メトリック、および/またはもう1つのモチーフ非依存的ストランド特異的メトリックが、決定され、かつ/または用いられる。典型的には、これらのメトリックの少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100、120、140、160、180、200個が、(SNVのストランド特異性と共に評価され得る様々なモチーフを考慮に入れて)決定され、かつ/または用いられる。
3.8.9 AT/GCメトリック
本開示のメトリックは、アデニンおよびチミン(AT)、ならびに/またはグアニンおよびシチジン(GC)を標的とするSNVの数、パーセンテージ、または比を帆江宇するものを含む。AT/GCメトリックは、コーディングメトリック群、ノンコーディングメトリック群、およびゲノムメトリック群におけるもののうちのいくつかを含む。
AT/GCメトリックは、モチーフ非依存的メトリックであり、例えば、表Dの列36、37、55、および62~64に示されるコーディング配列メトリック、すなわち、cds:All AT Ti/Tv %、cds:All CG Ti/Tv %、cds:All AT:GC %、cds:All MC1 AT:GC %、cds:All MC2 AT:GC %、cds:All MC3 AT:GC %;表Eの列2~4および12~14に示されるノンコーディング領域メトリック、すなわち、nc:AT total、nc:CG total、nc:AT:GC %、nc:Other AT total、nc:Other CG total、およびnc:Other AT:GC %;ならびに表Fの列2~4および12~14に示されるゲノムメトリック、すなわち、g:AT total、g:CG total、g:AT:GC %、g:Other AT total、g:Other CG total、およびg:other AT:GC %を含む。認識されるように、これらのAT/GCメトリックはまた、コドンコンテキストメトリック群、および転位/転換(Ti/Tv)メトリック群におけるメトリックも含む。
AT/GCメトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数は、本開示の方法およびシステムに従って決定され、かつ/または用いられてもよい。いくつかの例において、これらのメトリックの2、3、4、5、6、7、8、9、10、11、または12個が、決定され、かつ/または用いられる。
3.8.10 モチーフメトリック
特定の態様において、本開示のメトリックは、特定のモチーフにおけるSNVに関連する(すなわち、特定のモチーフにおけるSNVの数またはパーセンテージを反映する)。いくつかの例において、これらのモチーフは、デアミナーゼモチーフ、例えば、AID、APOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、またはADARモチーフ、例えば、上記のおよび表Bに示されるいずれかである。したがって、本明細書に記載のモチーフメトリック群は、APOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、およびADARモチーフ群を含み、ここで、各群は、それぞれのデアミナーゼモチーフにおけるSNVに関連するメトリックを表す。モチーフはまた、セクション3.1における上記のような3マーモチーフまたは5マーモチーフであってもよい。
例示的なモチーフメトリックには、表Cの列2~28に示されるコーディング領域メトリック、すなわち、Motif Hits、Motif %、Motif Ti %、Motif MC1 %、Motif MC2 %、Motif MC3 %、Motif C>T at MC1 %、Motif C>T at MC2 %、Motif C>T at MC3 %、Motif G>A at MC1 %、Motif G>A at MC2 %、Motif G>A at MC3 %、Motif C>T %、Motif C>A %、Motif C>G %、Motif G>A %、Motif G>T %、Motif G>C %、Motif Ti/Tv %、Motif C:G %、Motif Ti C:G %、Motif non-syn %、Motif C non-syn %、Motif A non-syn %、Motif G non-syn %、Motif T non-syn %、Motif MC1 non-syn %、Motif MC2 non-syn % and Motif MC3 non-syn %;表Eの列21~26に示されるノンコーディング領域メトリック、すなわち、nc:Motif Hits、nc:Motif %、nc:Motif Ti %、nc:Motif C>T + G>A %、nc:Motif C>A + G>T %、およびnc:Motif C>G + G>C %;ならびに表Fの列21~26に示されるゲノムメトリック、すなわち、g:Motif Hits、g:Motif %、g:Motif Ti %、g:Motif C>T + G>A %、g:Motif C>A + G>T %、g:Motif C>G + G>C %を含む。
認識されるように、これらのモチーフメトリックはまた、コドンコンテキストメトリック群、転位/転換(Ti/Tv)メトリック群、同義/非同義メトリック群、ストランドバイアス群メトリック群、ATメトリック群、およびGCメトリック群におけるメトリックも含む。
モチーフメトリック(またはデアミナーゼ活性の遺伝学的指標)のうちの任意の1つまたは複数は、本開示の方法およびシステムに従って決定され、かつ/または用いられてもよい。いくつかの例において、SNVがADAR、AID、APOBEC3B、APOBEC3G、APOBEC3F、またはAPOBEC1モチーフにある1つまたは複数のメトリックが、本開示の方法およびシステムにおいて決定され、かつ/または用いられる。そのようなメトリックは、それぞれ、ADAR、AID、APOBEC3B、APOBEC3G、APOBEC3F、またはAPOBEC1にあると呼ばれる。したがって、例えば、ADARメトリック群におけるメトリックは、表Cの列2~28、表Eの列21~26、および表Fの列21~26に示されるメトリックを含み、ここで、モチーフは、例えば、表Bに示されるようなADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi or ADARjのうちの任意の1つまたは複数であり;AIDメトリック群におけるメトリックは、表Cの列2~28、表Eの列21~26、および表Fの列21~26に示されるメトリックを含み、ここで、モチーフは、例えば、表Bに示されるようなAID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの任意の1つまたは複数であり;APOBEC3Gメトリック群におけるメトリックは、表Cの列2~28、表Eの列21~26、および表Fの列21~26に示されるメトリックを含み、ここで、モチーフは、例えば、表Bに示されるようなA3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの任意の1つまたは複数であり;APOBEC3Bメトリック群におけるメトリックは、表Cの列2~28、表Eの列21~26、および表Fの列21~26に示されるメトリックを含み、ここで、モチーフは、例えば、表Bに示されるようなA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの任意の1つまたは複数であり;APOBEC3Fメトリック群におけるメトリックは、表Cの列2~28、表Eの列21~26、および表Fの列21~26に示されるメトリックを含み、ここで、モチーフは、例えば、表Bに示されるようなA3Fであり;かつ、APOBEC1メトリック群におけるメトリックは、表Cの列2~28、表Eの列21~26、および表Fの列21~26に示されるメトリックを含み、ここで、モチーフは、例えば、表Bに示されるようなA1である。特定の例において、これらのデアミナーゼのうちの2、3、4、5個、またはすべてに関連するメトリックが評価される。典型的には、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100、120、140、160、180、200、300、400、500、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000個、またはそれよりも多いモチーフメトリックが、決定され、かつ/または用いられる。
3.8.11 モチーフ非依存的メトリック
本開示のメトリックはまた、SNVがモチーフにあるかどうかとは無関係のSNVに関連する、モチーフ非依存的メトリックも含む。これらのメトリックは、CDSバリアント(表Cの列1)、表Dに示されるコーディング領域メトリックの各々、表Eの列1~20に示されるノンコーディングメトリックの各々、および表Fの列1~20に示されるゲノムメトリックの各々を含む。認識されるように、これらのモチーフ非依存的メトリックはまた、コドンコンテキストメトリック群、転位/転換(Ti/Tv)メトリック群、同義/非同義メトリック群、ストランドバイアス群メトリック群、ストランド特異的メトリック群、およびAT/GCメトリック群も含む。
典型的には、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、40、60、80、100個、またはそれよりも多いモチーフ非依存的メトリックが、決定され、かつ/または用いられる。
3.8.12 メトリックの例示的な組み合わせ
典型的には、少なくとも10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1200、1400、1600、1800、2000、2200、2400、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800、5000、5200、5500、5600、5800、6000、6500、または7000個のメトリック(またはデアミナーゼ活性の遺伝学的指標)が、本開示の方法およびシステムに従って決定され、かつ/または用いられる。
いくつかの例において、i) コーディングメトリック群;ii) ノンコーディングメトリック群;iii) ゲノムメトリック群;iv) コドンコンテキストメトリック群;v) 転位/転換メトリック群;vi) 同義/非同義メトリック群;vii) ストランドバイアスメトリック群;viii) ストランド特異的メトリック群;ix) AT/GCメトリック群;x) モチーフメトリック群;およびxi) モチーフ非依存的メトリック群の中から選択される少なくとも2個(例えば、少なくとも3、4、5、6、7、8、9、または10個)のメトリック群由来の少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100個が、決定され、かつ/または用いられる。特定の例において、i)からxi)までの同定されるメトリック群の各々由来の少なくとも1、2、3、4、5、6、7、8、9、10個、またはそれよりも多くが、用いられる。
モチーフメトリック群由来のメトリックが用いられる場合、これは、少なくとも1つのデアミナーゼモチーフメトリック群(例えば、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、APOBEC3Bモチーフ群、APOBEC3Fおよび/もしくはAPOBEC1モチーフ群)由来のメトリック、3マーメトリック群由来のメトリック、ならびに/または5マーメトリック群由来のメトリックを含むことができる。さらに、各デアミナーゼモチーフメトリック群は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるモチーフを含むことができる。特定の例において、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、APOBEC3Bモチーフ群、および3マーメトリック群の各々由来のメトリックの組み合わせが、決定され、かつ/または用いられる。
いくつかの例において、モチーフメトリック群およびモチーフ非依存的メトリック群由来のメトリックの組み合わせが、本明細書に記載の方法およびシステムに従って決定され、かつ/または用いられる。各群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックが、利用されてもよい。いくつかの例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、APOBEC3Bモチーフ群、APOBEC3FおよびAPOBEC1モチーフ群の中から選択される少なくとも2つ(例えば、2、3、4、5、または6個)のデアミナーゼモチーフ群由来の、およびまた任意で、3マーメトリック群由来のメトリックを含む。さらに、各デアミナーゼモチーフメトリック群は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。特定の例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、およびAPOBEC3Bモチーフ群の各々由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、または100個のメトリックを含み、かつ任意で、これらのデアミナーゼモチーフメトリック群の各々は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。
他の例において、モチーフメトリック群およびコドンコンテキスト群由来のメトリックの組み合わせが、本明細書に記載の方法およびシステムに従って決定され、かつ/または用いられる。各群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックが、利用されてもよい。いくつかの例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、APOBEC3Bモチーフ群、APOBEC3FおよびAPOBEC1モチーフ群の中から選択される少なくとも2つ(例えば、2、3、4、5、または6個)のデアミナーゼモチーフ群由来の、およびまた任意で、3マーメトリック群由来のメトリックを含む。さらに、各デアミナーゼモチーフメトリック群は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。特定の例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、およびAPOBEC3Bモチーフ群の各々由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、または100個のメトリックを含み、かつ任意で、これらのデアミナーゼモチーフメトリック群の各々は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。いくつかの例において、これらのメトリックはまた、転位/転換、同義/非同義群、および/またはストランド特異的群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックと組み合わされる。
さらなる例において、モチーフメトリック群、コドンコンテキスト群、およびモチーフ非依存的メトリック群由来のメトリックの組み合わせが、本明細書に記載の方法およびシステムに従って決定され、かつ/または用いられる。各群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックが、利用されてもよい。いくつかの例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、APOBEC3Bモチーフ群、APOBEC3FおよびAPOBEC1モチーフ群の中から選択される少なくとも2つ(例えば、2、3、4、5、または6個)のデアミナーゼモチーフ群由来の、およびまた任意で、3マーメトリック群由来のメトリックを含む。さらに、各デアミナーゼモチーフメトリック群は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。特定の例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、およびAPOBEC3Bモチーフ群の各々由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、または100個のメトリックを含み、かつ任意で、これらのデアミナーゼモチーフメトリック群の各々は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。いくつかの例において、これらのメトリックはまた、転位/転換、同義/非同義群、および/またはストランドバイアス群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックと組み合わされる。
他の例において、モチーフメトリック群およびストランド特異的群由来のメトリックの組み合わせが、本明細書に記載の方法およびシステムに従って決定され、かつ/または用いられる。各群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックが、利用されてもよい。いくつかの例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、APOBEC3Bモチーフ群、APOBEC3FおよびAPOBEC1モチーフ群の中から選択される少なくとも2つ(例えば、2、3、4、5、または6個)のデアミナーゼモチーフ群由来の、およびまた任意で、3マーメトリック群由来のメトリックを含む。さらに、各デアミナーゼモチーフメトリック群は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。特定の例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、およびAPOBEC3Bモチーフ群の各々由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、または100個のメトリックを含み、かつ任意で、これらのデアミナーゼモチーフメトリック群の各々は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。いくつかの例において、これらのメトリックはまた、転位/転換、同義/非同義群、および/またはストランドバイアス群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックと組み合わされる。
他の例において、モチーフメトリック群、コドンコンテキスト群、およびストランド特異的群由来のメトリックの組み合わせが、本明細書に記載の方法およびシステムに従って決定され、かつ/または用いられる。各群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックが、利用されてもよい。いくつかの例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、APOBEC3Bモチーフ群、APOBEC3FおよびAPOBEC1モチーフ群の中から選択される少なくとも2つ(例えば、2、3、4、5、または6個)のデアミナーゼモチーフ群由来の、およびまた任意で、3マーメトリック群由来のメトリックを含む。さらに、各デアミナーゼモチーフメトリック群は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。特定の例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、およびAPOBEC3Bモチーフ群の各々由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、または100個のメトリックを含み、かつ任意で、これらのデアミナーゼモチーフメトリック群の各々は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。いくつかの例において、これらのメトリックはまた、ストランドバイアス、転位/転換、および/または同義/非同義群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックと組み合わされる。
さらなる例において、モチーフメトリック群および転位/転換群由来のメトリックの組み合わせが、本明細書に記載の方法およびシステムに従って決定され、かつ/または用いられる。各群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックが、利用されてもよい。いくつかの例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、APOBEC3Bモチーフ群、APOBEC3FおよびAPOBEC1モチーフ群の中から選択される少なくとも2つ(例えば、2、3、4、5、または6個)のデアミナーゼモチーフ群由来の、およびまた任意で、3マーメトリック群由来のメトリックを含む。さらに、各デアミナーゼモチーフメトリック群は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。特定の例において、モチーフメトリック群由来のメトリックは、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、およびAPOBEC3Bモチーフ群の各々由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、または100個のメトリックを含み、かつ任意で、これらのデアミナーゼモチーフメトリック群の各々は、2つ以上の特定のモチーフ、例えば、表Bに示されるような、AID、AIDb、AIDc、AIDd、AIDe、AIDf、およびAIDgのうちの2つ以上;ADAR、ADARb、ADARc、ADARd、ADARe、ADARf、ADARg、ADARh、ADARi、およびADARjのうちの2つ以上;A3G、A3Gb、A3Gc、A3Gd、A3Ge、A3Gf、A3Gg、A3Gh、およびA3Giのうちの2つ以上;ならびに/またはA3B、A3Bb、A3Bc、A3Bd、A3Be、A3Bf、A3Bg、およびA3Bhのうちの2つ以上に基づいて決定されるメトリックを含むことができる。いくつかの例において、これらのメトリックはまた、コドンコンテキスト群および/またはストランド特異的群由来の少なくとも2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100個のメトリックと組み合わされる。
特定の例において、表Gから選択される少なくとも20、50、100、200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2200、2400、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800、5000、5200、5400、もしくは5600個、またはそれよりも多いメトリックが、本開示の方法およびシステムに従って決定され、かつ/または用いられる。表Gにおけるメトリックの命名法は、本質的に上記のとおりである。例えば、「cds AID Hits」は、コーディング領域におけるWRC/GYWのAID一次モチーフでのSNVの数である。(ADAR_Gen1、ADAR_Gen2、およびADAR_Gen3への言及を含む)Gen1、Gen2、およびGen3への言及は、単純に、セクション3.1における上記のような様々な3マーモチーフを指す。
4. SNVについての核酸分子の評価
核酸分子の配列を取得しかつ評価するための当技術分野において公知の任意の方法を、本開示の方法およびシステムに従って用いることができる。本開示のシステムおよび方法を用いて解析される核酸分子は、任意の核酸分子であることができるが、概して(cDNAを含む)DNAである。典型的には、核酸は、ヒト核酸などの哺乳動物核酸であり、かつ、がんと以前に診断された対象由来である。核酸は、任意の生物学的試料から取得することができる。例えば、生物学的試料は、体液、組織、または細胞を含んでもよい。特定の例において、生物学的試料は、唾液または血液などの体液である。いくつかの例において、生物学的試料は、生検材料である。組織または細胞を含む生物学的試料は、身体の任意の部分に由来してもよく、例えば、肝臓由来の細胞などの、任意のタイプの細胞または組織を含んでもよい。
核酸分子は、1つの遺伝子の一部もしくはすべて、または2つ以上の遺伝子の一部もしくはすべてを含有することができる。最も典型的には、核酸分子は、全ゲノムまたは全エキソームを含み、本開示の方法において解析されるのは、全ゲノムまたは全エキソームの配列である。全ゲノムまたは全エキソームが解析のために用いられる例においては、コーディング領域およびノンコーディング領域の両方、または2つの領域のうちのただ1つにあるSNVが評価されてもよい。
本開示の方法を行う場合、核酸分子の配列は、あらかじめ決定されていてもよい。例えば、配列は、データベースまたは他の記憶媒体に保存されていてもよく、本開示の方法に従って解析されるのは、この配列である。他の例において、核酸分子の配列は、本開示の方法の使用の前に、最初に決定されなければならない。特定の例において、核酸分子はまた、最初に生物学的試料から単離されなければならない。
生物学的試料は、対象の核酸の解析に適している任意の試料であってもよい。典型的には、試料は、がんのタイプに合っており、例えば、生検材料であってもよい。例証として、対象が卵巣がんに罹患している場合には、試料は、卵巣組織または細胞に由来し、例えば卵巣がん由来の生検材料である。他の例において、核酸が取得される生物学的試料は、唾液試料または血液試料である。
核酸を取得するため、および/または核酸をシーケンシングするための方法は、当技術分野において周知であり、任意のそのような方法を、本明細書に記載の方法のために利用することができる。いくつかの例において、方法は、シーケンシングの前に単離された核酸の増幅を含み、適している核酸増幅技術は、当業者に周知である。核酸シーケンシング技術は、当技術分野において周知であり、単一のもしくは多数の遺伝子、または全エキソーム、トランスクリプトーム、もしくはゲノムに適用することができる。これらの技術には、例えば、「サンガーシーケンシング」(Sanger et al. (1977) Proc Natl Acad Sci USA 74: 5463-5467)(すなわち、チェーンターミネーションシーケンシングを含む方法)に依拠するキャピラリーシーケンシング法、および、数千から数百万の分子の一度でのシーケンシングを容易にする「次世代シーケンシング」技術が含まれる。そのような方法には、ルシフェラーゼの使用により、個々のヌクレオチドがDNA鋳型に付加される際のシグナルを読み取る、パイロシーケンシング;各サイクルにおいて単一のヌクレオチドをDNA鋳型に付加する可逆的ダイターミネーター技術を用いる「sequencing by synthesis」テクノロジー(Illumina);および、固定された長さのオリゴヌクレオチドの優先的ライゲーションによってシーケンシングする、SOLiD(商標)シーケンシング(Sequencing by Oligonucleotide Ligation and Detection;Life Technologies)が含まれるが、それらに限定されない。これらの次世代シーケンシング技術は、特に、全エキソームおよびゲノムをシーケンシングするために有用である。他の例示的なシーケンシングプラットフォームには、第3世代(またはロングリード)シーケンシングプラットフォーム、例えば、(Oxford Nanoporeによって開発され、DNA分子をナノスケールの孔構造に通過させること、および次いで、孔の周囲の電場における変化を測定することを含む)MiniION(商標)またはGridION(商標)シーケンサーを用いた単一分子ナノポアシーケンシング、または、例えばPacific Biosciencesによって開発された、ゼロモード導波路(ZMW)を利用する単一分子リアルタイムシーケンシング(SMRT)が含まれる。
ひとたび核酸分子の配列が取得されると、次いでSNVが同定される。SNVは、配列を参照配列と比較することによって同定されてもよい。参照配列は、データベース由来の核酸分子の配列、例えば参照ゲノムであってもよい。特定の例において、参照配列は、参照ゲノム、例えば、GRCh38(hg38)、GRCh37(hg19)、NCBI Build 36.1(hg18)、NCBI Build 35(hg17)、およびNCBI Build 34(hg16)である。いくつかの態様において、SNVは、さらなる解析から既知の一塩基多型(SNP)、例えば、公的に利用可能である様々なSNPデータベースにおいて同定されるものを除去するために検討される。さらなる態様において、ENSEMBL遺伝子のコーディング領域内にあるそれらのSNVのみが、さらなる解析のために選択される。SNVを同定することに加えて、変異を含有するコドンおよびコドン内の変異の位置(MC-1、MC-2、またはMC-3)が同定されてもよい。隣接する5'コドンおよび3'コドンにおけるヌクレオチドもまた、モチーフを同定するために同定されてもよい。本開示の方法のいくつかの例において、核酸分子の非転写ストランドの配列(cDNA配列と等価)が解析される。他の例において、転写ストランドの配列が解析される。さらなる例において、両方のストランドの配列が解析される。
核酸分子において1つまたは複数のSNVが同定されると、上記に示されるように、適切な算出を行うことによって、1つまたはメトリック(またはデアミナーゼ活性の遺伝学的指標)を決定することができる。
5. SNVを検出し、メトリックを決定するためのキットおよびシステム
SNVを検出するために必要とされる必須の材料および試薬をすべて、キットに集合させてもよい。例えば、本開示の方法が、解析されるべき核酸を単離する工程および/またはシーケンシングする工程を最初に含む場合、単離および/またはシーケンシングを容易にするための試薬を含むキットが構想される。そのような試薬には、例えば、DNAの増幅のためのプライマー、ポリメラーゼ、(標識dNTPsを含む)dNTPs、陽性および陰性対照、ならびに緩衝液および溶液が含まれ得る。そのようなキットはまた、概して、適している手段で、各個々の試薬のための別個の容器を含むであろう。キットはまた、キットを用いるための様々な装置、および/または印刷された説明書を特徴として有することもできる。
いくつかの態様において、本明細書に概して記載される方法は、少なくとも部分的に、適切にプログラムされたコンピュータシステムなどの処理システムによって行われる。例えば、処理システムを用いて、核酸配列を解析し、SNVを同定し、かつ/またはメトリックを決定することができる。上記の方法が行われることを可能にするアプリケーションソフトウェアを実行するマイクロプロセッサを有する、独立型コンピュータが、用いられてもよい。あるいは、方法を、少なくとも部分的に、分散アーキテクチャの一部として作動する1つまたは複数の処理システムによって行うことができる。例えば、本明細書に記載のメトリックを生成するために、処理システムを用いて、変異タイプ、変異のコドンコンテキスト、および/または1つもしくは複数の核酸配列内のモチーフを同定することができる。いくつかの例において、ユーザーによって処理システムに入力されるコマンドが、これらの決定を行う際に処理システムを補助する。
1つの例において、処理システムは、バスを介して相互接続される、少なくとも1つのマイクロプロセッサ、メモリー、入力/出力装置、例えばキーボードおよび/またはディスプレイ、ならびに外部インターフェイスを含む。外部インターフェイスは、処理システムを周辺装置、例えば、通信ネットワーク、データベース、または記憶装置に接続するために利用することができる。マイクロプロセッサは、本開示の方法が行われることを可能にするように、およびコンピュータシステムとの通信などの任意の他の必要とされるプロセスを行うように、メモリーに保存されたアプリケーションソフトウェアの形態で命令を実行することができる。アプリケーションソフトウェアは、1つまたは複数のソフトウェアモジュールを含んでもよく、かつ、オペレーティングシステム環境などのような適している実行環境において実行されてもよい。
6. 治療指標を生成するためのシステム
本開示は、がん治療に対する応答性の評価のために治療指標を生成するためのシステムおよびプロセスを提供する。
生物学的対象についてのがん治療に対する応答性の評価のために治療指標を生成するためのプロセスの例を、図1に関連して次に説明する。
この例の目的で、方法は、典型的には、サーバー、パーソナルコンピュータなどのような1つまたは複数の処理システムの一部を形成する、および、任意で、以下により詳細に記載されるようなネットワークアーキテクチャを介して1つまたは複数の処理システム、データソースなどに接続されてもよい、1つまたは複数の電子処理装置を少なくとも部分的に用いて行われることが想定される。
説明の目的で、「参照対象」という用語は、試料集団における1つまたは複数の個体を指すように用いられ、「参照対象データ」は、参照対象から収集されたデータを指すように用いられる。「対象」という用語は、がん治療に対する応答性を同定する目的で評価されている任意の個体を指し、「対象データ」は、対象から収集されたデータを指すように用いられる。参照対象および対象は、動物、より詳細にはヒトであるが、これは限定的であるようには意図されず、技術は、より広く、他の脊椎動物および哺乳動物に適用することができる。
この例において、工程100で、対象由来の核酸分子の配列を少なくとも部分的に示す、対象データを取得する。対象データは、例えば、対象由来の生物学的試料の全エキソームシーケンシングまたは全ゲノムシーケンシングなどの、上記のような任意の適切な様式で、取得することができる。
対象データはまた、以下により詳細に記載されるように、追加的なデータ、例えば、対象の性状または対象から測定された他の生理学的シグナル、例えば、身体活動もしくは精神活動の測定値、などに関するデータを含んでもよい。
工程110で、対象データを解析して、上記のような、核酸分子内の一塩基多様性(SNV)を決定し、同定する。
工程120で、同定されたSNVを用いて、複数のメトリックを決定する。用いられるメトリックは、以下により詳細に記載されるように、因子の範囲、例えば、用いられる計算モデル、対象の性状、評価されるがんまたはがん治療の特定のタイプなどに依存して変動するであろう。典型的には、メトリックは、上記のような、i) コーディングメトリック群;ii) ノンコーディングメトリック群;iii) ゲノムメトリック群;iv) コドンコンテキストメトリック群;v) 転位/転換メトリック群;vi) 同義/非同義メトリック群;vii) ストランドバイアスメトリック群;viii) ストランド特異的メトリック群;ix) AT/GCメトリック群;x) モチーフメトリック群;およびxi) モチーフ非依存的メトリック群を含む群から選択され、多数のメトリックが、任意で、これらの群のうちの任意の1つまたは複数中から選択される。いくつかの例において、複数のメトリックは、3、4、5、6、7、8、9、10個、またはすべてのメトリック群由来のメトリックを含む。他の例において、i) モチーフメトリック群;ii) コドンコンテキストメトリック群;iii) 転位/転換メトリック群;iv) 同義/非同義メトリック群;v) ストランドバイアスメトリック群;vi) ストランド特異的メトリック群;およびvii) AT/GCメトリック群から選択される1、2、3、4、5、6個、またはすべてのメトリック群由来のメトリックが、用いられる。
工程130で、1つまたは複数のメトリックを、1つまたは複数の計算モデルに適用する。計算モデルは、典型的には、治療に対する様々な応答性と複数のメトリックとの間の関係を具体化し、かつ、がん治療に対して既知の応答性を有する参照対象から得られた複数の参照メトリックに由来する参照メトリックに、1つまたは複数の解析技術、例えば、機械学習、従来のクラスタリング、線形回帰、もしくはベイジアン法、または当技術分野において公知のもしくは下記の他の技術のいずれかを適用することによって、取得することができる。
したがって、実際には、対象データと等価である参照対象データが、がん治療に対して様々な応答性を有する複数の参照対象について収集されることが認識される。収集された参照対象データを用いて、参照メトリックを算出し、次いでこれを用いて、計算モデルが、対象のSNVに由来するメトリックに基づいて、がん治療に対する様々な応答性の間を識別することができるように、計算モデルを訓練する。計算モデルの性質は、実装に依存して変動し、例を、以下により詳細に記載する。
計算モデルを用いて、工程140で、がん治療に対する応答性を示す治療指標を決定する。典型的には、治療指標は、対象が特定のがん治療に応答する可能性が高いか否かを示す。これにより、管理する臨床家または他の医療従事者が、治療が対象にとって改善された転帰をもたらす可能性が高いかどうかを評価することが可能になる。
1つの例において、治療指標は、例えば、対象が治療に応答する公算が60%、70%、80%、90%、または95%あることを示す、数値を含むことができる。しかし、これは必ずしも必須ではなく、任意の適している治療指標の形態が用いられ得ることが認識される。
したがって、メトリックの特定の組み合わせに関するある特定の定義されたメトリックを利用してがん治療に対する応答性を評価するために、上記の方法は、機械学習技術などの解析技術を利用することが認識される。様々な群由来の多数のメトリックの使用は、計算モデルの識別性能を改善するのを手助けすることができ、次に、がん治療に対する応答性が容易にかつ正確に同定されることを可能にする。
1つの例において、70%よりも大きい識別性能、例えば、精度、感度、特異性、または受信者動作特性曲線下の面積(AUROC)を有する計算モデルを提供するために、特定のメトリックが種々の組み合わせで用いられる。
上記のアプローチは、がん治療に応答する対象の可能性を客観的に評価するための機構を提供し、これは、最も有効な治療法を迅速に特定すること、無効の治療法を試して時間が無駄になるのを回避すること、および限定された利用可能性を有する治療法が応答する人々に提供されるのを可能にすることを補助できる。
数多くのさらなる特徴を、次に説明する。
1つの例において、モチーフメトリック群は、1つまたは複数のデアミナーゼモチーフ、例えば、活性化誘導シチジンデアミナーゼ(AID)、アポリポタンパク質B mRNA編集酵素触媒ポリペプチド様(APOBEC)1シトシンデアミナーゼ(APOBEC1)、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、およびRNAに作用するアデニンデアミナーゼ(ADAR)の中から選択されるデアミナーゼによって標的とされるモチーフにおけるSNVを示す、デアミナーゼモチーフメトリック群を含む。モチーフメトリック群は、したがって、ADARモチーフ群、AIDモチーフ群、APOBEC3Gモチーフ群、APOBEC3Bモチーフ群、APOBEC3Fおよび/またはAPOBEC1モチーフ群のうちの任意の1つまたは複数におけるメトリックを含むことができ、ここで、各群におけるメトリックは、それぞれ、1つまたは複数のADAR、AID、APOBEC3G、APOBEC3B、APOBEC3F、またはAPOBEC1モチーフ内のSNVを評価することによって決定されている。
1つの例において、デアミナーゼモチーフは、
の中から選択されるAIDモチーフである。
1つの例において、デアミナーゼモチーフは、
の中から選択されるADARモチーフである。
1つの例において、デアミナーゼモチーフは、
の中から選択されるAPOBEC3Gモチーフである。
1つの例において、デアミナーゼモチーフは、
の中から選択されるAPOBEC3Bモチーフである。
1つの例において、デアミナーゼモチーフは、
の中から選択されるAPOBEC3Fモチーフである。
1つの例において、デアミナーゼモチーフは、
の中から選択されるAPOBEC1モチーフである。
1つの例において、モチーフメトリック群は、1つまたは複数の3マーモチーフにおけるSNVを示す、かつ、任意で、1つまたは複数の3マーモチーフの1位、2位、および/または3位でSNVを示すことができる、3マーモチーフメトリック群を含む。
別の例において、モチーフメトリック群は、1つまたは複数の5マーモチーフにおけるSNVを示す、任意で、1つまたは複数の5マーモチーフの1位、2位、3位、4位、および/または5位でSNVを示すことができる、5マーモチーフメトリック群を含む。
システムは、例えば、モデルの特定の識別能力および関心対象の特定のがん治療に依存して、計算モデルの数多くの様々な組み合わせを用いることができる。
1つの例において、システムは、多数の異なる計算モデルを用い、これは、治療に対する応答性を正確に評価する能力を改善することができる。この例において、処理装置は、それぞれのメトリックをそれぞれのモデルに適用して、個々のスコアを決定し、これを次いで集めて、治療指標を決定する。
モデルの性質は、実装に依存して変動し、例では、モデルは、決定木または類似物を含むことができ、1つの好ましい例において、多数の決定木が用いられ、結果が集められる。しかし、これは必須ではなく、他のモデルが用いられ得ることが認識される。
以前に言及されたように、計算モデルの識別性能の有効性を最大にするため、多数のメトリックが、計算モデルの精度を増加させるために用いられ、これらは典型的に、群中から選択される。1つの特定の例において、少なくとも1つのメトリックが、利用可能な群の各々から選択され、任意で、少なくとも2つのメトリックが、利用可能な群のうちの少なくともいくつかについて選択される。
概して、用いられるメトリックの数は、実装および訓練の結果に依存して変動するであろう。好ましい例において、メトリック群は、5000メトリックよりも多くを含み、治療指標の生成において用いられるメトリックの数は、すべての利用可能なメトリックのサブセットである。1つの例において、用いられるメトリックの数は、少なくとも2個、少なくとも5個、少なくとも10個、少なくとも20個、少なくとも50個、少なくとも75個、少なくとも100個、または少なくとも200個を含む。別の例において、システムは、すべての利用可能なメトリックの少なくとも0.1%、少なくとも0.2%、少なくとも0.3%、少なくとも0.4%、少なくとも0.5%、少なくとも0.75%、少なくとも1%、少なくとも1.5%、または少なくとも2%を用いる。
解析はまた、典型的には、対象の性状、例えば対象の特性、可能性のある対象が罹患している医学的状態、可能性のある行われる介入などを考慮に入れるように行われる。この例において、1つまたは複数の処理装置は、1つまたは複数の対象の性状を用いて、メトリックが対象の性状と同様の性状を有する1つまたは複数の参照対象について導かれる参照メトリックに基づいて評価されるように、1つの計算モデルを適用する。これは、好ましい実装に依存して、種々のやり方で達成することができ、対象の性状に少なくとも部分的に依存して、メトリックおよび/または数多くの様々な計算モデルのうちの1つを選択することを含むことができる。いかにこれが達成されるかとは無関係に、対象の性状を考慮に入れることは、異なる性状を有する対象が、同じ治療に異なるように反応し得ることを考慮に入れることによって、識別性能をさらに改善できると、認識される。
対象の性状は、対象の年齢、身長、体重、性別、もしくは民族性などの対象の特性、健康な身体状態もしくは不健康な身体状態などの身体状態、または、対象が肥満であるかどうかなどの1つもしくは複数の疾患状態を含むことができる。対象の性状は、上昇した体温、心拍数、または血圧、対象が吐き気に苦しんでいるかどうかなどのような、1つまたは複数の医学的症状を含むことができる。最後に、対象の性状は、消費される任意の食べ物もしくは飲み物の詳細などの食事の情報、または、投薬レジメンの一部もしくは別のもののいずれかとして服用される任意の投薬の詳細を含む、投薬情報を含むことができる。
対象の性状は、数多くのやり方のうちのいずれか1つにおいて、例えば、臨床評価を介して、患者の医療記録を質問することによって、ユーザー入力コマンドに基づいて、または、体重もしくは心臓の活動のセンサーなどのセンサーからのセンサーデータを受け取ることによって、などで決定することができる。
1つの例において、1つまたは複数の処理装置は、治療指標の代表を表示し、その後の検索のために治療指標を保存し、または表示のためにクライアント装置に治療指標を提供する。したがって、好ましい実装に依存して、精神状態指標が、種々の様式で用いられ得ることが認識される。
上記のアプローチは、治療指標を決定するために1つまたは複数の計算モデルを用い、そのようなモデルを生成するためのプロセスの例を、図2に関連して次に説明する。
この例において、参照対象データを、工程200で取得し、これは、参照対象由来の核酸分子の配列、および特定のがん治療に対する応答性を示す。工程210で、参照対象データを解析して、核酸分子内のSNVを同定する。工程220で、参照対象データを解析して、参照メトリックを決定する。
工程200~220は、対象の対象データを取得することおよび解析することに関して記載された工程100~120にほとんど相似しており、したがって、これらは、ほとんど同様の様式で行われ得ることが認識され、そのため、さらに詳細には説明しない。
しかし、対象データとは対照的に、参照対象データは、計算モデルの訓練において用いられるため、メトリックのうちの選択されたただ1つよりはむしろ、すべての利用可能なメトリックについて参照メトリックを決定することが典型的であり、メトリックのうちのどれが、がん治療に応答性であるかまたは応答性ではない個体の間を区別するのに最も有用であるかを確認するために、これが用いられることを可能にする。それにもかかわらず、用いられる参照メトリックは、上記で概説された通りであり、典型的には、上記のようなi) コーディングメトリック群;ii) ノンコーディングメトリック群;iii) ゲノムメトリック群;iv) コドンコンテキストメトリック群;v) 転位/転換メトリック群;vi) 同義/非同義メトリック群;vii) ストランドバイアスメトリック群;viii) ストランド特異的メトリック群;ix) AT/GCメトリック群;x) モチーフメトリック群;およびxi) モチーフ非依存的メトリック群を含む群から選択されるメトリックを含み、多数のメトリックが、任意で、これらの群中から選択される。
工程230で、参照メトリックと1つまたは複数の総称的計算モデルとの組み合わせを選択し、参照メトリックおよび治療に対する応答性を用いて、工程240でモデルを訓練する。モデルの性質および行われる訓練は、任意の適切な形態のものであることができ、決定木学習、ランダムフォレスト、ロジスティック回帰、相関ルール学習、人工ニューラルネットワーク、深層学習、帰納的論理プログラミング、サポートベクターマシン、クラスタリング、ベイジアンネットワーク、強化学習、表現学習、類似度学習およびメトリック学習、遺伝的アルゴリズム、ルールベース機械学習、学習分類子システムなどのうちの任意の1つまたは複数を含むことができる。そのようなスキームは公知であるため、これらは、全くさらに詳細には説明しない。
したがって、上記のプロセスは、図1に関する上記のプロセスを用いた精神状態指標の生成において用いられ得る計算モデルを開発する機構を提供する。
単純にモデルを生成することに加えて、プロセスは、典型的には、工程250でモデルを試験して、訓練されたモデルの識別性能を評価することを含む。そのような試験は、典型的には、参照対象データのサブセット、および特に、モデルバイアスを回避するために、モデルを訓練するために用いられたものとは異なる参照対象データを用いて行われる。試験を用いて、計算モデルが十分な識別性能を提供することを保証する。この点に関して、識別性能は、典型的には、精度、感度、特異性、およびAUROCに基づき、モデルが用いられるためには、少なくとも70%の識別性能が必要とされる。
モデルが識別性能を満たす場合には、次いで、図1に関して上記で概説されたプロセスを用いた、治療指標の決定において用いられ得ることが認識される。さもなければ、プロセスは、工程230に戻り、異なるメトリックおよび/またはモデルが選択されることを可能にし、次いで、必要とされるように訓練および試験が繰り返される。
したがって、1つの例において、1つまたは複数の処理装置は、典型的には、上記で列記された利用可能なメトリックの各々のサブセットとして選択される、複数の参照メトリックを選択し、複数の参照メトリックを用いて、1つもしくは複数の計算モデルを訓練し、計算モデルを試験して、モデルの識別性能を判定し、モデルの識別性能が閾値よりも下に下がる場合には、次いで、異なる複数の参照メトリック、および/もしくは異なる参照対象データ由来の複数のメトリックを用いて、計算モデルを選択的に再訓練し、かつ/または異なる計算モデルを訓練する。したがって、上記のプロセスは、必要とされる程度の識別力が取得されるまで、様々なメトリックおよび/または様々な計算モデルを反復的に利用して行われ得ることが認識される。
したがって、1つの例において、1つまたは複数の処理装置は、少なくとも1000メトリック、少なくとも2000メトリック、少なくとも3000メトリック、少なくとも4000メトリック、または少なくとも5000メトリックを用いてモデルを訓練し、結果として生じたモデルは、典型的には、有意に少ないメトリック、例えば、500未満などを用いる。
追加的におよび/また代替的に、1つまたは複数の処理装置は、複数の参照メトリックの組み合わせを選択し、組み合わせの各々を用いて、複数の計算モデルを訓練し、各々の計算モデルを試験して、モデルの識別性能を判定し、および、治療指標の決定における使用のために、最高の識別性能を有する計算モデルのうちの1つまたは複数を選択することができる。
モデルを訓練するためにメトリックを用いることに加えて、訓練はまた、モデルが、それぞれの参照対象の性状に特異的であるか、または、治療応答性を判定する時に対象の性状を考慮に入れることができるように、参照対象の性状を考慮に入れて行うことができる。1つの例において、このプロセスは、例えば、k-平均クラスタリングなどのクラスタリング技術を用いて、参照対象の性状を用いてクラスタリングを行って、同様の参照対象の性状を有する参照対象のクラスターを決定する、および次いで、参照対象のクラスターを少なくとも部分的に用いて、計算モデルを訓練する、1つまたは複数の処理装置を有することを含む。例えば、特定の形態のがんに罹患している、または特定の治療を受ける参照個体のクラスターを同定することができ、これが、計算モデルを訓練して、特定のがんについての治療に対する応答性を同定するために用いられている。
したがって、上記の技術は、種々の異なるメトリックを用いて1つまたは複数の計算モデルを訓練して、がん治療に対する応答性を判定する、および次いで、モデルを用いて、可能性の高い治療の有効性を示す治療指標を生成するための機構を提供する。
モニタリングシステムの例を、図3に関連してより詳細に、次に説明する。
この例において、1つまたは複数の通信ネットワーク340、例えば、インターネットおよび/または数多くのローカルエリアネットワーク(LAN)を介して、1つまたは複数のクライアント装置330に連結された、1つまたは複数の処理システム310が提供される。数多くのシーケンシング装置320が提供され、これらは任意で、通信ネットワーク340を介して処理システム310に直接接続されており、またはより典型的には、これらはクライアント装置330に連結されている。
任意の数の処理システム310、シーケンシング装置320、およびクライアント装置330を提供することができ、現在の提示は、例証を目的とするだけである。ネットワーク340の設定もまた、例示を目的とするだけであり、実際には、処理システム310、シーケンシング装置320、およびクライアント装置330は、任意の適切な機構を介して、例えば、モバイルネットワーク、802.11ネットワークなどのプライベートネットワーク、インターネット、LAN、WANなどを含むがそれらに限定されない、有線または無線の接続を介して、および、Bluetoothなどの直接接続またはポイントツーポイント接続を介して、通信することができる。
この例において、処理システム310を、シーケンシング装置320および/またはクライアント装置330から受け取り、受け取った対象データを解析するように適合させ、このことは、計算モデルが生成され、かつ用いられて、治療指標を決定し、次いで、これがクライアント装置330を介して表示されることを可能にする。処理システム310は、単一の実体として示されるが、それらが、例えば、クラウドベースの環境の一部として、数多くの地理的に分離した場所にわたって分散された数多くの処理システムを含み得ることが認識される。したがって、上記の配置は必須ではなく、他の適している設定が用いられ得る。
適している処理システム310の例を、図4に示す。この例において、処理システム310は、示されるようにバス404を介して相互接続される、少なくとも1つのマイクロプロセッサ400、メモリー401、任意の入力/出力装置402、例えばキーボードおよび/またはディスプレイ、ならびに外部インターフェイス403を含む。この例において、外部インターフェイス403は、処理システム310を周辺装置、例えば、通信ネットワーク340、データベース411、他の記憶装置などに接続するために利用することができる。単一の外部インターフェイス403が示されているが、これは、例示を目的とするだけであり、実際には、様々な方法(例えば、Ethernet、シリアル、USB、無線など)を用いる多数のインターフェイスが提供されてもよい。
使用において、マイクロプロセッサ400は、必要とされるプロセスが行われることを可能にするために、メモリー401に保存されたアプリケーションソフトウェアの形態で命令を実行する。アプリケーションソフトウェアは、1つまたは複数のソフトウェアモジュールを含んでもよく、かつ、オペレーティングシステム環境などのような適している実行環境において実行されてもよい。
したがって、処理システム310は、任意の適している処理システム、例えば、適切にプログラムされたPC、webサーバー、ネットワークサーバーなどから形成されてもよいことが認識される。1つの特定の例において、処理システム310は、不揮発性(例えば、ハードディスク)記憶装置に保存されたソフトウェアアプリケーションを実行する、Intel Architectureベースの処理システムなどの標準的な処理システムであるが、これは必須ではない。しかし、処理システムが、任意の電子処理装置、例えば、マイクロプロセッサ、マイクロチッププロセッサ、論理ゲート設定、FPGA(Field Programmable Gate Array)などの実装論理に任意で関連するファームウェア、または任意の他の電子装置、システム、もしくは配置であり得ることもまた、理解される。
図5に示されるように、1つの例において、クライアント装置330は、示されるようにバス504を介して相互接続される、少なくとも1つのマイクロプロセッサ500、メモリー501、入力/出力装置502、例えばキーボードおよび/またはディスプレイ、外部インターフェイス503を含む。この例において、外部インターフェイス503は、クライアント装置330を周辺装置、例えば、通信ネットワーク340、データベース、他の記憶装置などに接続するために利用することができる。単一の外部インターフェイス503が示されているが、これは、例示を目的とするだけであり、実際には、様々な方法(例えば、Ethernet、シリアル、USB、無線など)を用いる多数のインターフェイスが提供されてもよい。カードリーダー504は、任意の適している形態のものであることができ、磁気カードリーダー、またはスマートカードを読むための非接触リーダーなどを含むことができる。
使用において、マイクロプロセッサ500は、メモリー501に保存され、かつ処理システム310および/またはシーケンシング装置320のうちの1つとの通信を可能にする、アプリケーションソフトウェアの形態で命令を実行する。
したがって、クライアント装置330は、任意の適切にプログラムされた処理システムから形成され、適切にプログラムされたPC、インターネット用端末、ラップトップまたはハンドヘルドPC、タブレット、スマートフォンなどを含み得ることが認識される。しかし、クライアント装置330が、任意の電子処理装置、例えば、マイクロプロセッサ、マイクロチッププロセッサ、論理ゲート設定、FPGA(Field Programmable Gate Array)などの実装論理に任意で関連するファームウェア、または任意の他の電子装置、システム、もしくは配置であり得ることもまた、理解される。
治療指標を生成するためのプロセスの例を、さらに詳細に、次に説明する。これらの例の目的で、1つまたは複数のそれぞれの処理システム310は、対象データを受け取って解析し、かつ治療指標を生成してそれに対するアクセスを提供するように適合したサーバーであることが想定される。サーバー310は、典型的には、関連性のあるアクションが行われることを可能にする、処理装置ソフトウェアを実行し、サーバー310によって行われるアクションは、アプリケーションソフトウェアとしてメモリー401に保存された命令、および/またはI/O装置402を介してユーザーから受け取った入力コマンドに従って、プロセッサ400によって行われる。クライアント装置330によって行われるアクションは、アプリケーションソフトウェアとしてメモリー501に保存された命令、および/またはI/O装置502を介してユーザーから受け取った入力コマンドに従って、プロセッサ500によって行われることもまた、仮定される。
しかし、以下の例の目的で想定される上記の設定は、必須ではなく、多数の他の設定が用いられてもよいことが認識される。様々な処理システムの間の機能性の分割は、特定の実装に依存して変動し得る。
個体についての対象データを解析するためのプロセスの例を、図6に関してより詳細に、次に説明する。
この例において、工程600で、サーバー310は、好ましい実装に依存して、任意でクライアント装置330を介して、保存された記録から検索するかまたはシーケンシング装置から受け取るかのいずれかで、対象データを取得する。
工程605で、サーバー310は、例えば、データベースから検索することまたは対象データの一部として取得することによって、対象の性状を決定する。対象の性状は、用いられる1つまたは複数の計算モデルを選択するために用いることができ、かつ/または、計算モデルが適用されることを可能にするために、メトリックと組み合わされてもよい。この点に関して、対象についてのメトリックは、典型的には、対象と同様の性状を有する参照対象についての参照メトリックに基づいて解析される。これは、様々な性状の組み合わせについて様々な計算モデルを用いることによって、または計算モデルへの入力として性状を用いることによって達成することができる。
工程610で、サーバー310は、対象が罹患しているがんのがんタイプを決定し、これを用いて、工程615で1つまたは複数の計算モデルを選択する。この点に関して、様々な計算モデルが、典型的には、様々なタイプのがんに対する応答性を評価するために用いられる。
モデルを選択すると、工程620で、サーバー310は次いで、モデルによって必要とされる関連性のあるメトリックを算出する。
工程625で、例えば、関連性のあるメトリックを、任意で1つまたは複数の対象の性状と共に用いることによって、計算モデルに適用して、決定木評価を行い、工程630での治療の有効性を示す指標の生成を結果としてもたらす。
工程635で、サーバー310は、治療指標を、典型的には対象データの一部として保存し、任意で、例えば、表示のためにクライアント装置にこれを転送することによって、治療指標が表示されることを可能にする。
機械学習アプローチの具体例を、より詳細に、次に説明する。
この例において、シーケンシングデータに上記のプロセスを通過させ、例えばデアミナーゼ活性に関連するメトリック(すなわち、デアミナーゼ活性の遺伝学的指標)を含む関心対象のメトリックを、同定し、照合された患者であるこれらと共に定量して、プロファイルを作る。
これを次いで、「正常」である患者プロファイル(例えば、がん免疫療法に応答する人々)および機能不全である患者プロファイル(例えば、応答することができない人々)を同定するために用いる。データを解析することができる多くのやり方があり、本明細書に記載の以下のアプローチを、がん免疫療法にあつらえる。これらの技術は、生じた大量のデータを解析するための有効な方法を提供し、解析により、これらの技術は最良の予測精度を提供することが示されている。
最初に、配列データを収集して用いて、利用可能な配列データのタイプ(すなわち、コーディング、ノンコーディング、ゲノム)(表Gを参照されたい)に依存して、各患者についておよそ5,500メトリックを作製する。患者を解析のために群分けする前に、生の結果を、エクスポートし、データをクリーニングする(例えば、解析に必要とされないメタデータを除去する)ことによって解析することができる。
プロセスの有効性を証明するために、異なる免疫療法についての様々な臨床治験由来の数多くのがん患者を解析し、患者を、3つのカテゴリー:訓練データ、チューニングデータ、および検証データに群分けする。訓練データセットおよびチューニングデータセットは、多数の臨床治験(「研究」)由来のたくさんの患者から構成され、患者を、各群に無作為に分け;検証データセットは、単一の研究由来の患者から構成される(これが、予測されるデータである)。
典型的な実験アプローチは、検証データセット(予測されるデータ)を「取っておく」こと、および患者の残りを互いに照合することである。照合された患者を次いで、75:25(レスポンダー/ノンレスポンダーとほぼ同等の割合)で、訓練(約75%)データセットおよびチューニング(約25%)データセットに分ける。
ひとたびデータを群分けすると、検証データセットにおける患者のための各メトリックについて、レスポンダー/ノンレスポンダーをプロットすることができる。データのプロットは、機械学習解析によって重要であると同定されたメトリックをさらに調査するための方法を提供するが、算出/解析のいずれにも直接関与しない。例示的なプロットを、図7Aおよび7Bに示す。
各ドットは、バリアントの総数について(メトリック#1;左)および特定のデアミナーゼモチーフに関連するバリアントの割合について(メトリック#4;右)の、各患者の値を表す。実際には、いくつかのグラフを、各メトリックについて構築することができ、これは、メトリックのさらなる解析が行われるのを可能にすることが認識される。例えば、メトリックが、免疫療法に対する応答を予測するために重要であると判定される場合には、そのメトリックについてのプロットを調べて用いて、潜在的な交絡因子があるかどうか、例えば、結果に影響を及ぼす外れ値があるかを評価することができる。
ひとたびデータを適正に群分けしてフォーマットすると、機械学習アルゴリズムを適用して、計算モデルを生成する。1つの例において、用いられるアルゴリズムは、大量のデータセット(数百万のデータ点)に対するスピードおよび性能のために具体的に設計されている「勾配ブースティング決定木」の実装である、XGBoostである。
アプローチは、たくさんの決定木を算出し、かつ各決定木をチェックして、訓練データセットについての予測スコアを最大にするものを見出す。予測モデルを次いで、予測目的で適用することができる。実際には、好ましいアプローチは、各々が様々なメトリックの組み合わせを用いて、予測を行い、それによって精度を増加させる、決定木の「アンサンブル」を用いる。
このアプローチは、非常に計算コストが高い場合があり、何百万もの可能な木および多くの可能なアンサンブルを結果としてもたらす場合がある。概して、このアプローチを最適化するためには、各モデルを、典型的には各事例において100個よりも多い、メトリックのサブセットを用いて訓練し、単一のメトリックが用いられ得るが、実際には、妥当なレベルの精度を有するモデルには、概して50個よりも多くが存在する。
XGBoostモデルを作る場合に調整され得る数多くのパラメータがあり、そのため、セッティングを最適化するために多数のパスを実施することができ、最適化されたセッティングを、次いで用いる。最適化は、ヒトの干渉なしで実施され(様々なセッティングの組み合わせが試験され、どのセッティングが最適であるかをコンピュータが特定する)、これが、このアプローチを一貫した、再現可能なものにし、かつ、実験者バイアスに対する感受性を最小にする。
ひとたびモデルを作り、チューニングし、データに適用すると、行われた予測のためにどのメトリックが重要であったかを判定することが可能である。各メトリックの予測全体に対する寄与は累積的であり、特定の変数についてのスコアは、予測全体に対して「重み付けされた」様式で寄与する(すなわち、1つのメトリックについてのスコアは、対象がレスポンダーであることを示してもよいが、別のメトリックについてのスコアは、対象がレスポンダーでないことを示してもよい)。これを例証するウォーターホールプロットを、図8Aおよび8Bに示し、数多くのメトリックをx軸上にプロットしているが、単純にするために、単一の強調したメトリックのみを特定する。
これらの例において、強調したメトリック(gADAR Gen1 AGT A>T + T>A%)は、各患者にとって重要であったが、スコア(40と比較して0)は、1人の患者はレスポンダーであり、1人の患者はノンレスポンダーであることを示唆する。図9Aに示したプロットの検討により、処置に応答した患者(「恩恵」)と応答しなかった患者(「恩恵なし」)との間に違いがあることが示される。
(この特定のメトリックについての)この例において、25%よりも大きいスコアを有した患者は、すべてがノンレスポンダーであった。これは、(図8Aに示されるように)スコアが25%よりも大きい場合には、患者の応答を予測するためにメトリックが重要であるが、(図8Bに示されるように)スコアが0である場合には、あまり重要ではないことを示す。0のスコアは、患者をいずれかのカテゴリーに置くことができるため、これはバイオマーカーではないが、このメトリックは、患者の間を見分けることができる。図9Bに示されるように、多数のデータセットにおいてこのメトリックを見ると、このメトリックは、全面的に免疫療法に対する患者の応答を予測するために相対的に重要である。
この機械学習アプローチを用いると、「実世界」のデータセットに適用した場合に、患者の転帰を良好な精度で予測することができる(実施例8を参照されたい)。
7. 診断および治療応用
本明細書に記載の方法およびシステムを用いて、対象の核酸分子におけるSNVを検出することは、1つもしくは複数のメトリック(もしくは内在性デアミナーゼ活性の遺伝学的指標)を生成し、かつ/または治療指標を生成し、がんを有する対象が、がん治療に応答するか、またはがん治療に応答し続ける可能性を判定することができる。したがって、本明細書に記載の方法およびシステムはまた、既にがん治療を受けている対象において、疾患の進行の可能性(すなわち、枯れたが治療に応答し続けるかどうか、またはがんが治療に対する抵抗性を発生させ、対象が治療に応答するのをやめ、それによって疾患の進行、例えば再発を結果としてもたらすかどうか)を判定するために用いることもできる。そのような判定は、対象についての管理プログラムまたは処置レジメンの規定を容易にすることができる。例えば、対象が特定の治療に応答する可能性が高いと判定された場合には、次いでその治療での対象の処置を開始することができる。逆に、対象が特定の治療に応答する可能性が低いと判定された場合には、次いでその対象のために他の治療を考えて、利用することができる。同様に、既に治療を受けている対象が、治療に応答するのをやめる可能性が高い(すなわち、その治療に対する抵抗性を発生させる可能性が高い)と判定された場合には、次いで対象をその治療からはずして、新しい処置レジメンを開始することができる。
下記の実施例において実証されるように、がん治療に応答する対象は、がん治療に応答しない対象と比較して、異なるメトリックのプロファイルを有する。したがって、対象ががん治療に応答する可能性が高いかまたは低いかを判定するために、対象についてのメトリックまたはデアミナーゼ活性の遺伝学的指標のプロファイル、すなわち、試料プロファイルを生成して、メトリックまたはデアミナーゼ活性の遺伝学的指標の参照プロファイルと比較することができる。本開示のプロファイルは、上記のような、少なくともいずれかの1、2、3、4、5、6、7、8、9、10、20、30、40個、またはそれよりも多いメトリックまたはデアミナーゼ活性の遺伝学的指標の評価を反映する。参照プロファイルは、がん治療に対する応答性の可能性と相関し、典型的にはあらかじめ決定されるが、試料プロファイルを決定する時またはその後に決定することもできる。
参照プロファイルは、がん治療に対して既知の応答性を有する個体における参照メトリック(またはデアミナーゼ活性の遺伝学的指標)の評価において取得されたデータに基づいて決定される。したがって、例えば、参照プロファイルは、がん治療に応答した個体におけるメトリックまたは指標の評価において取得されたデータに基づくことができる。したがって、参照プロファイルは、例えば、治療に対する応答性の可能性と相関し得る。他の例において、参照プロファイルは、がん治療に応答しなかった個体におけるメトリックまたは指標の評価において取得されたデータに基づく。そのような例において、参照プロファイルは、例えば、治療に治する非応答性の可能性と相関する。参照プロファイルを生成するために用いられる個体は、年齢、性別、および/または民族性が合っていてもよく、または合っていなくてもよい。
メトリックまたはデアミナーゼ活性の遺伝学的指標のプロファイルは、少なくとも2個のメトリックまたは指標(例えば、2個以上、3個以上、4個以上、5個以上、6個以上、7個以上、8個以上、9個以上、10個以上、11個以上、12個以上、13個以上、14個以上、15個以上、16個以上、17個以上、18個以上、19個以上、20個以上、25個以上、30個以上、40個以上、50個以上、60個以上、70個以上、80個以上、90個以上、100個以上、200個以上、300個以上、または400個以上)の評価を含む。指標またはメトリックは、上記のように、同じかまたは異なる群の指標またはメトリックに関連していることができる。
7.1 範囲間隔
いくつかの態様において、参照プロファイルは、評価される各々のメトリックまたは指標についてあらかじめ決定された治療応答範囲間隔に基づいて生成される。そのような態様において、いかなるメトリック(または内在性デアミナーゼ活性の遺伝学的指標)も、メトリック(または内在性デアミナーゼ活性の遺伝学的指標)についてあらかじめ決定された治療応答範囲間隔の外側ではない場合、すなわち、すべてのメトリックまたは遺伝学的指標が、メトリックまたは内在性デアミナーゼ活性の遺伝学的指標についてあらかじめ決定された治療応答範囲間隔内である場合、治療に対する応答または治療に対する継続的な応答の可能性が高い。逆に、1つまたは複数のメトリックまたは内在性デアミナーゼ活性の遺伝学的指標が、メトリックまたは内在性デアミナーゼ活性の遺伝学的指標についてあらかじめ決定された治療応答範囲間隔の外側である場合、治療に対する応答または治療に対する継続的な応答の可能性が低い(または、治療に対する非応答もしくは治療に対する抵抗性の発生の可能性が高い)。いくつかの例において、あらかじめ決定された治療応答範囲間隔の外側の、1、2、3、4、5、6、7、8、9、10、20、30、40個、またはそれよりも多いメトリックまたは内在性デアミナーゼ活性の遺伝学的指標は、治療に対する応答または治療に対する継続的な応答の可能性が低いこと(または、治療に対する非応答もしくは治療に対する抵抗性の発生の可能性が高いこと)を示す。
いくつかの例において、あらかじめ決定された範囲間隔の外側である各々のメトリックまたは内在性デアミナーゼ活性の各遺伝学的指標に対して、スコアを帰属させ、次いで、スコアのすべてを合わせることによって、総スコアを算出する。スコアが、閾値スコアと同等であるかまたはそれよりも上である場合、治療に対する応答または治療に対する継続的な応答は、可能性が高いと判定される。逆に、スコアが、閾値スコアと同等であるかまたはそれよりも下である場合、治療に対する応答または治療に対する継続的な応答は、可能性が低いと判定される(または、治療に対する非応答もしくは治療に対する抵抗性の発生の可能性が高いと判定される)。閾値スコアは、治療に応答する可能性が高いかまたは応答し続ける可能性が高い人々と、治療に応答する可能性が低いかまたは応答し続ける可能性が低い人々とを見分けるスコアを表し、対照対象(例えば、治療に応答していたかもしくは治療に応答し続けていたことが既知の陽性対照対象、および/または、治療に応答しなかったかもしくは治療への応答を中断したことが既知の陰性対照対象)を用いて取得された値およびスコアに基づいて、当業者が容易に確立することができる。各々のメトリックまたは内在性デアミナーゼ活性の遺伝学的指標についてのスコアは、同じであってもよく、または異なっていてもよい(例えば、あらかじめ決定された範囲間隔の外側である1つのメトリックまたは内在性デアミナーゼ活性の遺伝学的指標に、あらかじめ決定された範囲間隔の外側である別のメトリックまたは内在性デアミナーゼ活性の遺伝学的指標よりも大きいかまたは小さいスコアが与えられ得るように、「重み付け」されてもよい)。特定の例において、あらかじめ決定された範囲間隔の外側である各々のメトリックまたは内在性デアミナーゼ活性の遺伝学的指標に、1のスコアが与えられる。いくつかの態様において、1およびそれよりも上の任意のスコアが、治療に対する応答または治療に対する継続的な応答の可能性が低いという(または、治療に対する非応答もしくは治療に対する抵抗性の発生の可能性が高いという)判定を結果としてもたらすように、閾値スコアは1である。
メトリックまたは内在性デアミナーゼ活性の遺伝学的指標についてあらかじめ決定された治療応答範囲間隔は、特定の治療に応答することが既知であるか、または長期の時間、例えば、複数の週、月、または年にわたって治療に応答し続けることが既知である2つ以上の対象(すなわち、陽性対照対象)においてメトリックまたはデアミナーゼ活性の遺伝学的指標を評価することによって、決定することができる。メトリックまたは遺伝学的指標についての治療応答範囲間隔を、次いで算出して、そのメトリックまたは指標について標的値、すなわち、治療に対する応答に関連するかまたはそれを支持するデアミナーゼ活性のレベルまたは質を反映する値と考えられるものの上限および下限を設定する。特定の例において、治療応答範囲間隔は、間隔の上限として、対照対象において観察されるそのメトリックまたは指標の最大値、および、間隔の下限として、その指標の最小の観察される値を用いて設定される。これらの上限および下限は、例えば、限界を2.5%、5%、10%、15%、20%、またはそれよりも多く増加させるかまたは減少させることによって、調整されてもよい、さらなる例において、治療応答範囲間隔は、平均±2標準偏差を測定することによって算出され、それにより、範囲間隔の下限は、平均-2標準偏差であり、範囲間隔の上限は、平均+2標準偏差である。他の例において、2よりも小さいかまたは大きい標準偏差、例えば、1、1.5、2.5、3、3.5、またはそれよりも大きい標準偏差を用いて、間隔の上限および下限を設定する。またさらなる例において、あらかじめ決定された正常な範囲間隔の上限および下限は、受信者動作特性(ROC)曲線を用いて確立される。またさらなる例において、あらかじめ決定された正常な範囲間隔の上限および下限は、受信者動作特性(ROC)曲線を用いて確立される。あらかじめ決定された治療応答範囲間隔を決定するために用いられる対象は、任意の年齢、性別、もしくは背景であることができ、または、特定の年齢、性別、民族的背景、もしくは他の亜集団であってもよい。したがって、いくつかの態様において、同じメトリックまたはデアミナーゼ活性の遺伝学的指標に対して、2つ以上のあらかじめ決定された正常な範囲間隔を算出することができ、それにより、各範囲間隔は、特定の亜集団、例えば、特定の性別、年齢群、民族的背景、および/または他の亜集団に特異的である。認識されるように、あらかじめ決定された治療応答範囲間隔は、がんのタイプおよびがん治療に特異的であってもよい。したがって、典型的には、あらかじめ決定された治療応答範囲間隔は、本開示の方法を用いて評価される対象と同じタイプのがんを有し、かつ同じタイプのがん治療を受けている対象を用いて確立される。あらかじめ決定された治療応答範囲間隔は、手動の算出法、アルゴリズム、ニューラルネットワーク、サポートベクターマシン、深層学習、線形モデルでのロジスティック回帰、機械学習、人工知能、および/またはベイジアンネットワークを含む、当業者に公知の任意の技術を用いて決定することができる。
7.2 機械学習
特定の態様において、参照プロファイルは、計算モデル、例えば、機械学習技術などの様々な解析技術を用いて形成されるものを用いて作製され、かつそれを包含する。計算モデルは、データ中に存在する客観的パラメータに基づいてデータの本体をクラスに分離しようと試みる、任意の適している統計的分類または学習法を用いて形成され得る。分類法は、教師付きまたは教師なしのいずれかであってもよい。教師付きおよび教師なしの分類プロセスの例は、Jain, "Statistical Pattern Recognition: A Review", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, January 2000に記載されており、この教示は、参照により組み入れられる。分類moedlesを作製するために用いられ得る技術の非限定的な例には、ディープボルツマンマシン、深層信念ネットワーク、畳み込みニューラルネットワーク、積層オートエンコーダなどの深層学習技術;ランダムフォレスト、勾配ブースティングマシン、ブースティング、ブートストラップアグリゲーション、アダブースト、スタック汎化(Stacked Generalization)、勾配ブースティング回帰木などのアンサンブル技術;放射基底関数ネットワーク、パーセプトロン、誤差逆伝播法、ホップフィールドネットワークなどのニューラルネットワーク技術;リッジ回帰、LASSO(Least Absolute Shrinkage and Selection Operator)、Elastic Net、最小角回帰などの正則化法;線形回帰、最小二乗回帰、重回帰、プロビット回帰、ステップワイズ回帰、多変量適応型回帰スプライン、局所推定散布図平滑化(Locally Estimated Scatterplot Smoothing)、ロジスティック回帰、サポートベクターマシン、ポアソン回帰、負の二項回帰、多項ロジスティック回帰などの回帰法;ナイーブベイズ、AODE(Average One-Dependence Estimators)、ガウシアンナイーブベイズ、多項ナイーブベイズ、ベイジアン信念ネットワーク、ベイジアンネットワークなどのベイジアン技術;CART(Classification and Regression Tree)、ID(Iterative Dichotomiser)、C4.5、C5.0、カイ二乗自動相互作用検出、決定株、条件付き決定木、M5などの決定木;主成分分析、部分的最小二乗回帰、Sammonマッピング、多次元尺度構成法、射影追跡、主成分回帰、部分的最小二乗判別分析、混合判別分析、二次判別分析、正則化判別分析、フレキシブル判別分析、線形判別分析、t分散型確率的近傍埋め込み法などの次元削減;K近傍法、学習ベクトル量子化、自己組織化マップ、局所重み付き学習(Locally Weighted Learning)などの例に基づく技術;k-平均、k-モード、k-メジアン、DBSCAN、期待値最大化、階層的クラスタリングなどのクラスタリング法;前述のアプローチの適応、拡張、および組み合わせが含まれる。
治療に応答していたかまたは治療に応答していなかったことが既知である個体由来のデータを、上記でより詳細に説明されたような計算モデルを訓練するために用いることができる。そのようなデータは、典型的には、訓練データセットと呼ばれる。計算モデルは、ひとたび訓練されると、未知の試料を用いて生成されたデータ、例えば、試料プロファイルを生成するために用いられたがんを有する患者由来のデータにおけるパターンを認識することができる。試料プロファイルを次いで、計算モデルに適用して、試料プロファイルをクラス、例えば、がん治療に応答する可能性が高いか、またはがん治療に応答する可能性が低い、に分分類することができる。
7.3 がんおよびがん治療
本開示の方法およびシステムを、放射線、非標的化学療法、ホルモン療法、標的療法、および免疫療法を含むがそれらに限定されない、任意のがん治療に対する応答または継続的な応答の可能性(または、非応答もしくは抵抗性の発生の可能性)を判定するために用いることができる。がん治療は、一価療法(すなわち、単一療法)または併用療法であってもよい特定の態様において、方法は、抗体ベースの標的療法および免疫療法(すなわち、抗体を含む標的療法および免疫療法)に関連して用いられる。
例示的ながんには、乳がん、前立腺がん、肝臓がん、大腸がん、胃腸がん、膵臓がん、皮膚がん、甲状腺がん、子宮頸がん、リンパ系がん(例えば、非ホジキンリンパ腫、ホジキンリンパ腫、骨髄腫、およびリンパ性白血病)、造血器(すなわち、血液)がん、膀胱がん、肺がん、腎がん、卵巣がん、子宮がん、および頭頚部がんが含まれるが、それらに限定されない。
放射線療法は、DNA損傷を誘導する放射線および波、例えば、γ線照射、X線、UV照射、マイクロ波、電子放出、放射性同位体などを含む。上記の形態の放射線で局在化した腫瘍部位を照射することによって、治療が達成され得る。これらの因子のすべては、DNAの前駆体、DNAの複製および修復、ならびに染色体のアセンブリおよび維持に対して、広範な損傷DNAをもたらす可能性が最も高い。
非標的化学療法(すなわち、標的療法と比較した場合に、特定の分子または細胞型のターゲティングを含まないが、その代わりに、急速に分裂する細胞に広く影響を及ぼす、伝統的な化学療法)は、アルトレタミン、ブスルファン、カルボプラチン、カルムスチン、クロラムブシル、シスプラチン、シクロホスファミド、デカルバジン、ロムスチン、メルファラン、オキサリプラチン、テモゾロミド、およびチオテパなどのアルキル化剤;5-フルオロウラシル(5-FU)、6-メルカプトプリン(6-MP)、アペシタビン(aapecitabine)(Xeloda(登録商標))、アイタラビン(aytarabine)(Ara-C(登録商標))、フロクスウリジン、フルダラビン、ゲムシタビン(Gemzar(登録商標))、ヒドロキシ尿素、メトトレキサート、およびペメトレキセド(Alimta(登録商標))などの代謝拮抗物質;アントラサイクリン(例えば、ダウノルビシン、ドキソルビシン(Adriamycin(登録商標))、エピルビシン、およびイダルビシ(idarubici))、アクチノマイシン-D、ブレオマイシン、マイトマイシン-C、およびミトキサントロンなどの抗腫瘍抗生物質;トポイソメラーゼ阻害剤、トポテカン、イリノテカン(CPT-11)、エトポシド(VP-16)、テニポシド、およびミトキサントロン;ドセタキセル、エストラムスチン、イクサベピロン、パクリタキセル、ビンブラスチン、ビンクリスチン、ビノレルビンなどの有糸分裂阻害剤;ならびに、プレドニゾン、メチルプレドニゾロン(Solumedrol(登録商標))、およびデキサメタゾン(Decadron(登録商標))などのコルチコステロイドを含むが、それらに限定されない。
ホルモン療法は、対象において、エストロゲンおよび/またはプロゲステロンなどのホルモンを遮断するかまたはそのレベルを低下させるように働く。非限定的な例またはホルモン療法は、タモキシフェン、ラロキシフェン、アナストロゾール、レトロゾール、およびエキセメスタンを含む。
標的がん治療は、がん細胞またはがん細胞の増殖に特異的であるかまたはそれに関連する分子と相互作用する、薬物(すなわち、小分子)およびタンパク質(抗体を含む)を含む。標的療法は、典型的には、がん細胞の増殖を阻害するように細胞増殖抑制様式で作用するが、また細胞傷害性であることもできる。標的療法は、例えば、ABL、未分化リンパ腫キナーゼ(ALK)、β-1,4 N-アセチルガラクトサミニルトランスフェラーゼ1(B4GALNT1)、B細胞活性化因子(BAFF)、B-Raf、ブルトン型チロシンキナーゼ(BTK)、CD19、CD20、CD27、CD30、CD38、CD52、CD137、細胞傷害性Tリンパ球関連タンパク質4(CTLA-4)、上皮成長因子受容体(EGFR)、FMS様チロシンキナーゼ-3(FLT3)、ヒストンデアセチラーゼ(HDAC)、ヒト上皮成長因子受容体2(HER-2)、イソクエン酸デヒドロゲナーゼ1(IDH1)、IDH2、インターロイキン1β(IL-1β)、IL-6、IL-6R、c-KIT、MEK、MET、mTOR、ポリ(ADP-リボース)ポリメラーゼ(PARP)、プログラム細胞死タンパク質1(PD-1)、Nectin-4、血小板由来増殖因子受容体α(PDGFRα)、PDGFRβ、プログラム死-リガンド1(PD-L1)、ホスファチジルイノシトール-3-キナーゼδ(PI3Kδ)、核因子κ-Bリガンドの受容体活性化因子(RANKL)、RET、ROS1、シグナル伝達リンパ球活性化分子F7(SLAMF7)、血管内皮増殖因子(VEGF)、VEGF受容体(VEGFR)、およびVEGFR2に特異的な薬物(例えば、チロシンキナーゼ阻害剤)およびモノクローナル抗体(キメラ、ヒト化、または完全ヒト抗体を含み、裸かまたは毒性部分とコンジュゲートしているかのどちらか)を含む。いくつかの例において、これらの標的療法は、免疫系を標的とするかまたは活用し、したがって、がん免疫療法と考えることもできる。
がん免疫療法は、がんを処置するために患者の免疫系を活用するかまたは利用することによって機能する。これは、いくつかの機序を通し、かつ、エフェクター細胞を刺激することによる、および/または制御細胞を阻害することによる(例えば、IL-2およびIFN-αなどのサイトカイン、またはサリドマイド(Thalomid(登録商標))、イエナリドマイド(ienalidomide)(Revlimid(登録商標))、ポマリドミド(Pomalyst(登録商標))、およびミキモド(miquimod)(Zyclara(登録商標))などの薬物の投与による)免疫応答の非特異的刺激、特異的な抗がん免疫応答を刺激するかまたは増強するための能動免疫化(すなわち、子宮頸がんの予防のためのHPVワクチンであるGardasil(登録商標)およびCevarix(登録商標)、前立腺がんの処置のためのSipuleucel-T(Provenge(登録商標))、ならびに膀胱がんの処置のためのカルメット・ゲラン桿菌(BCG)ワクチンなどのがんワクチンを用いる)、ならびに、抗がん活性を有する抗体または活性化免疫細胞の受動移入(養子免疫療法(ACT);例えば、キメラ抗原受容体(CAR)T細胞療法)を含む、様々な戦略の使用によることができる。
がん免疫療法として開発されている抗体には、例えば、免疫チェックポイント阻害抗体、およびがん細胞に対する免疫応答を誘導するためにがん細胞上の分子を標的とする抗体(例えば、抗CD52抗体)が含まれる。免疫チェックポイント阻害抗体は、天然で免疫応答を阻害するかまたは弱め、かつ宿主免疫系を逃れるためにがんによって勝手に利用される、免疫チェックポイントを標的とする。これらの免疫チェックポイントは、免疫応答の負の制御物質として機能する、細胞傷害性Tリンパ球関連4(CTLA-4)およびプログラム細胞死タンパク質1(PD-1)を含む。CTLA-4は、ナイーブT細胞およびメモリーT細胞の早期活性化を減衰させ、他方、PD-1は、典型的には、そのリガンドであるPD-L1およびPD-L2との相互作用を通して、末梢組織におけるT細胞活性を調節する。免疫チェックポイント阻害抗体は、これらの分子の免疫減衰活性を阻害し、かつ、抗腫瘍免疫を刺激するかまたは増強するために、これらの分子、特に、CTLA-4、PD-1、およびPD-L1を標的とする。がん免疫療法として開発されている抗体はまた、補体依存性細胞傷害活性(CDC)または抗体依存性細胞性細胞傷害活性(ADCC)を誘導する抗体も含む。そのような抗体は、がん細胞を死滅させるために、がん細胞上に発現している分子(例えば、HER-2)を標的とし、CDCまたはADCCを誘導し得る。
特定の態様において、がん治療は、CTLA-4、PD-1、PD-L1、CD-52、CD19、CD20、CD27、CD30、CD38、CD137、HER-2、EGFR、VEGF、VEGFR、RANKL、BAFF、OX40、gpNMB、SLAM7、B4GALNT1、Nectin-4、PDGFRα、IL-1β、IL-6、およびIL-6Rに特異的な抗体などの、抗体ベースの標的療法および/または免疫療法である。これらは、キメラ、ヒト化、または完全ヒト、およびその断片であってもよい、モノクローナル抗体を含む。抗体は、任意のアイソタイプのものであってもよく、補体結合性であってもよく(例えば、IgG1、IgG2抗体)、補体依存性細胞傷害活性(CDC)または抗体依存性細胞性細胞傷害活性(ADCC)を惹起する能力を有してもよい。例示的な抗体には、トラスツズマブエムタンシン(Kadcyla(登録商標);HER2)、アレムツズマブ(Campath(登録商標);CD52)、アテゾリズマブ(Tecentriq(登録商標);PD-L1)、アベルマブ((Bavencio(登録商標);PD-L1)、ベリムマブ(Benlysta(登録商標);BAFF)、ベリノスタット(Beleodaq(登録商標);HDAC)、ベバシズマブ(Avastin(登録商標);VEGFリガンド)、ブリナツモマブ(Blincyto(登録商標);CD19/CD3)、ブレンツキシマブベドチン(Adcetris(登録商標);CD30)、カナキヌマブ(Ilaris(登録商標);IL-1β)、セツキシマブ(Erbitux(登録商標);EGFR)、ダラツムマブ(Darzalex(登録商標);CD38)、デノスマブ(Xgeva(登録商標);RANKL)、ジヌツキシマブ(Unituxin(登録商標);B4GALNT1 (GD2))、デュルバルマブ(Imfinzi(登録商標);PD-L1)、エロツズマブ(Emplicit(登録商標);SLAMF7)、エンホルツマブ(Nectin-4)、グレンバツムマブ(gpNMB)、GSK3174998(CD134/OX40)、イブリツモマブチウキセタン(Zevalin(登録商標);CD20)、イピリムマブ(Yervoy(登録商標;CTLA-4)、ネシツムマブ(Portrazza(登録商標);EGFR)、ニボルマブ(Opdivo(登録商標);PD-1)、オビヌツズマブ(Gazyva(登録商標);CD20)、オファツムマブ(Arzerra(登録商標);CD20)、オララツマブ(Lartruvo(登録商標);PDGFRα)、パニツムマブ(Vectibix(登録商標);EGFR)、ペムブロリズマブ(Keytruda(登録商標);PD-1)、ペルツズマブ(Perjeta(登録商標);HER2)、PF-04518600(CD134/OX40)、ピディリズマブ(PD-1)、ポガリズマブ(CD134/OX40)、ラムシルマブ(Cyramza(登録商標);VEGFR2)、リツキシマブ(Rituxan(登録商標);CD20)、シルツキシマブ(Sylvant(登録商標);IL-6)、タボリキシズマブ(CD134/OX40)、トシリズマブ(Actemra(登録商標);IL-6R)、トシツモマブ(Bexxar(登録商標);CD20)、トラスツズマブ(Herceptin(登録商標);HER2)、トレメリムマブ(CTLA-4)、ウレルマブ(CD137)、およびバルリルマブIgG1(CD27)が含まれるが、それらに限定されない。
いくつかの例において、抗体は、選択された少しの特異的ながんの処置に有用であり、他方、他の例においては、抗体は、広範ながんに有用である。例えば、膀胱がんは、アテゾリズマブ、アベルマブ、デュルバルマブ、ニボルマブ、またはペムブロリズマブで処置され得る;脳腫瘍は、ベバシズマブまたはジヌツキシマブで処置され得る;乳がんは、ペルツズマブ、トラスツズマブ、またはトラスツズマブエムタンシンで処置され得る;子宮頸がんは、ベバシズマブで処置され得る;大腸がんは、ベバシズマブ、セツキシマブ、ラムシルマブ、パニツムマブとニボルマブ、またはペムブロリズマブで処置され得る;食道がんは、トラスツズマブ、またはラムシルマブとペムブロリズマブで処置され得る;頭頚部がんは、ニボルマブ、またはペムブロリズマブ、またはセツキシマブで処置され得る;肺がんは、ベバシズマブ、ラムシルマブ、ネシツムマブ、アテゾリズマブ、ニボルマブ、またはペムブロリズマブで処置され得る;リンパ腫は、リツキシマブ、オビヌツズマブ、ブレンツキシマブベドチン、またはイブリツモマブチウキセタンで処置され得る;メラノーマは、イピリムマブ、ペムブロリズマブ、またはニボルマブで処置され得る;骨髄腫は、ダラツムマブまたはエロツズマブで処置され得る;卵巣がんは、ベバシズマブで処置され得る;肉腫は、デノスマブまたはオララツマブで処置され得る;および、胃がんは、トラスツズマブ、ラムシルマブ、またはペムブロリズマブで処置され得る。
7.4 診断応用のための例示的な組み合わせ
任意の所与のがん治療、がん、および/または患者の集団のために本開示のシステムおよび方法において用いられるメトリックまたはデアミナーゼ活性の遺伝学的指標の特定の組み合わせは、本明細書における教示を用いて、および実施例1~8において例証されるように、当業者が決定することができる。「レスポンダー」対象と「ノンレスポンダー」対象とを見分けるのに有効である組み合わせは、がん治療もしくはがん治療のタイプ、がんのタイプ、または患者集団に依存して異なり得ることが理解される。しかし、「レスポンダー」対象と「ノンレスポンダー」対象とを見分けるためのメトリックまたはデアミナーゼ活性の遺伝学的指標の最適な組み合わせは、本明細書に記載されるように、すなわち、特定の治療に応答することが既知であるかまたは特定の治療に非応答性であることが既知の(任意で、特定の特性(例えば、年齢、性別など)および特定のがんを有する)対象の群を評価して、どの組み合わせの指標が群の間を見分けることができるかを判定することによって、容易に決定することができる。本明細書において実証されるように、1つよりも多いメトリック(またはデアミナーゼ活性の遺伝学的指標)の組み合わせを、典型的には、本開示のシステムおよび方法において用いることができる。
いくつかの態様において、方法およびシステムは、モチーフメトリック群におけるメトリック(またはデアミナーゼ活性の遺伝学的指標)の、特に、AID、ADAR、APOBEC3G、APOBEC3B、APOBEC3F、およびAPOBEC1モチーフメトリック群のうちの1つまたは複数におけるメトリックを含む、デアミナーゼモチーフ群におけるメトリックの評価を含む。3マーメトリック群におけるメトリックがまた、用いられてもよい。典型的には、方法およびシステムは、さらに、コドンコンテキストメトリック群、および/またはモチーフ非依存的メトリック群、および/またはストランド特異的メトリック群、および/または転位/転換メトリック群、および/またはストランドバイアスメトリック群、および/またはAT/GCメトリック群におけるメトリック(またはデアミナーゼ活性の遺伝学的指標)の評価を含む。
特定の例において、方法は、AIDモチーフでのSNV(例えば、WRC/GYW)のパーセンテージ、ADARモチーフでのSNV(例えば、WA/TW)のパーセンテージ、APOBEC3GモチーフでのSNV(例えば、CC/GG)のパーセンテージ;およびAPOBEC3BモチーフでのSNV(例えば、TCA/TGA)のパーセンテージの少なくとも1つの評価を含む。
特定の態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;APOBEC3BモチーフでのSNVのパーセンテージ;MC-3部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるグアニンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(A:T比);シトシンまたはグアニンの変異に起因するSNVの転位-転換比から選択されるかまたはそれを含む。そのような指標の組み合わせを、例えば、対象が、免疫療法、例えば、抗CTLA-4抗体(例えばイピリムマブ)などの抗体ベースの免疫療法に応答する可能性が高いかどうかを判定するために用いることができる。
いくつかの態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;APOBEC3BモチーフでのSNVのパーセンテージ;MC-2部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-2部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるチミンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;グアニンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(A:T比);シトシンまたはグアニンの変異に起因するSNVの転位-転換比から選択されるかまたはそれを含む。そのような指標の組み合わせを、例えば、対象が、免疫療法または標的療法、例えば、抗PD-1抗体(例えばペムブロリズマブ)などの抗体ベースの免疫療法または標的療法に応答するかまたは応答し続ける可能性が高いかどうかを判定するために用いることができる。
他の態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;APOBEC3BモチーフでのSNVのパーセンテージ;MC-1部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ(C_MC1%);MC-2部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-3部位で起こるシトシンヌクレオチドの変異に起因するSNVのパーセンテージ;MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;チミンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(A:T比);グアニンの変異に起因するSNVの転位-転換比から選択されるかまたはそれを含む。そのような指標の組み合わせを、例えば、対象が、免疫療法または標的療法、例えば、抗PD-L1抗体(例えばアテゾリズマブ)などの抗体ベースの免疫療法または標的療法に応答するかまたは応答し続ける可能性が高いかどうかを判定するために用いることができる。
さらなる態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;APOBEC3BモチーフでのSNVのパーセンテージ;MC-2部位で起こったAIDモチーフWRC/GYWでのSNVのパーセンテージ;G>A変異を含み、かつMC-3部位で起こるAIDモチーフGYWでのSNVのパーセンテージ;C>T変異を含み、かつMC-1部位で起こるAPOBEC3BモチーフTCAでのSNVのパーセンテージ;C>T変異を含み、かつMC-3部位で起こるAPOBEC3BモチーフTCAでのSNVのパーセンテージ;MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;グアニンヌクレオチドの変異に起因するSNVのパーセンテージ;シトシンヌクレオチドの変異に起因するSNVのパーセンテージ;デアミナーゼモチーフWA中ではないアデニンヌクレオチドの変異に起因するSNVの数対デアミナーゼモチーフTW中ではないチミンヌクレオチドの変異に起因するSNVの数の比;グアニンまたはシトシンの変異に起因するSNVの転位-転換比から選択されるかまたはそれを含む。そのような指標の組み合わせを、例えば、対象が、免疫療法または標的療法、例えば、抗PD-1療法などの抗体ベースの免疫療法または標的療法に応答するかまたは応答し続ける可能性が高いかどうかを判定するために用いることができる。
特定の態様において、内在性デアミナーゼ活性の1つまたは複数の遺伝学的指標は、AIDモチーフでのSNVのパーセンテージ;ADARモチーフでのSNVのパーセンテージ;APOBEC3GモチーフでのSNVのパーセンテージ;APOBEC3BモチーフでのSNVのパーセンテージ;MC-1部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ(A_MC1%);MC-2部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ(A_MC2%);MC-3部位で起こるアデニンヌクレオチドの変異に起因するSNVのパーセンテージ(A_MC3%);MC-1部位でのSNVのパーセンテージ;MC-2部位でのSNVのパーセンテージ;MC-3部位でのSNVのパーセンテージ;チミンヌクレオチドの変異に起因するSNVのパーセンテージ;アデニンヌクレオチドの変異に起因するSNVのパーセンテージ;シトシンヌクレオチドの変異に起因するSNVのパーセンテージ対グアニンヌクレオチドの変異に起因するSNVのパーセンテージの比;グアニンまたはシトシンの変異に起因するSNVの転位-転換比から選択されるかまたはそれを含む。そのような指標の組み合わせを、例えば、対象が、標的療法、例えば、チロシンキナーゼ阻害剤(例えばアファチニブ)に応答するかまたは応答し続ける可能性が高いかどうかを判定するために用いることができる。
7.5 治療応用
本開示の方法はまた、治療プロトコールにも及ぶ。対象ががん治療に応答する可能性が高いと判定されている例において、方法は、がん治療を対象に施与することを含む。いくつかの例において、併用療法が利用され、それにより、対象は、評価の下でのがん治療、および1つまたは複数の他のがん治療、例えば、放射線療法、手術、化学療法、ホルモン療法、免疫療法、および標的療法を施与される。対象ががん治療に応答する可能性が低いと判定されている例において、方法は、異なるがん治療を対象に施与することを含んでもよい。いくつかの例において、異なるがん治療は、放射線療法、手術、化学療法、ホルモン療法、免疫療法、および標的療法のうちの1つまたは複数を含む併用療法である。本開示の方法を用いて、対象ががん治療に応答し続ける可能性が低い(すなわち、そのがん治療に対する抵抗性を発生させる可能性が高い)と判定された場合、本開示の方法は、そのがん治療での対象の処置をやめること、および新しい処置レジメンを開始すること、例えば、異なるがん治療を対象に施与することなどに及ぶ。いくつかの例において、異なるがん治療は、放射線療法、手術、化学療法、ホルモン療法、免疫療法、および標的療法のうちの1つまたは複数を含む併用療法である。
本開示が容易に理解され、実際に実行されるように、特定の好ましい態様を、以下の非限定的な例として次に説明する。
実施例1
デアミナーゼ活性の遺伝学的指標を検出するための方法
患者由来の全エキソームまたは完全ゲノム配列を解析して、一塩基多様性(SNV)を同定した。簡潔に述べると、参照としてhg38ゲノム座標を用いて、.vcfファイルにおいて配列をフォーマットした。バッチ座標変換(Batch Coordinate Conversion)(liftOver; University of California Santa Cruz)プログラムツールを用いて、異なるゲノム参照の間を変換した。
.vcfファイルにおける各々の体細胞バリアントを解析して、それが単純なSNVであった(例えば、A>TまたはG>Aであるが、G>AおよびTではない);挿入または欠失ではなかった;かつENSEMBL遺伝子のコーティング領域中であり、変異した位置のいずれかの側に3個のエクソン塩基対を有していた場合には、さらなる考察のために選択した。以下の工程を、次いで行った。
a) 変異したコドン(MC)の構造内のコドンコンテキストを決定した。すなわち、コーディングトリプレット内のSNVの位置を決定した。ここで、(5'から3'へ読んで)第1の位置をMC1(またはMC-1部位)と呼び、第2の位置をMC2(またはMC-2部位)と呼び、第3の位置をMC3(またはMC-3部位)と呼ぶ。
b) 3個の完全なコドンの配列が得られるように、周囲のゲノム配列から9塩基ウィンドウを抽出した。5'方向および3'方向を決定するため、および9塩基の正しい鎖を決定するために、遺伝子の方向を用いた。ゲノムのリバース鎖上の遺伝子におけるバリアントの周りのウィンドウ中の塩基が、ゲノムに関してリバース相補であるが、遺伝子に関してはフォワード方向であるように、9塩基ウィンドウは常に、遺伝子の方向に従って報告した。慣例により、このコンテキストは常に、遺伝子の同じ鎖において報告される。プラス鎖遺伝子は、参照ゲノムのプラス鎖由来のコドンコンテキスト塩基を有し、マイナス鎖遺伝子は、参照ゲノムのマイナス鎖由来のコドンコンテキスト塩基を有する。
c) 4つの主なデアミナーゼ(AID、ADAR、APOBEC3G(A3G)、およびAPOBEC3B(A3B))についての既知のモチーフを用いてモチーフ検索を行って、多様性がそのようなモチーフ内であったかどうかを判定した。同定した4つの主なデアミナーゼモチーフは、以下の通りであり、配列中、下線を引いた塩基は、標的とされる/変異する塩基に対応し、フォワードスラッシュの右の標的モチーフは、遺伝子のリバース鎖上での検索のために用いられるフォワード鎖モチーフのリバース相補である(ここで、フォワードモチーフおよびリバースモチーフにおける変異を同定した)。
AID - WRC/GYW
ADAR - WA/TW
APOBEC3G - CC/GG
APOBEC3B - TCA/TGA
これらのデアミナーゼについての他のモチーフを、以下の実施例に記載されるように用いた。
これらのモチーフ(フォワードモチーフおよびリバースモチーフの両方)での変異を、同定して、それぞれのデアミナーゼに寄与し得る変異として考えた。考えた各デアミナーゼモチーフについて、以下のメトリックのうちの任意の1つまたは複数を算出した。
・デアミナーゼ%(例えばAID%):患者におけるSNVの総数で割った、特定のデアミナーゼモチーフ(例えば、フォワードモチーフおよびリバースモチーフの両方におけるAIDモチーフWRC/GYW)での変異により表し、パーセンテージとして表した、デアミナーゼ(例えばAID)に寄与し得るSNVの総数。
・デアミナーゼ_True%(例えばAID_True%):患者におけるSNVの総数で割った、転位変異である、特定のデアミナーゼモチーフ(例えば、フォワードモチーフおよびリバースモチーフの両方におけるAIDモチーフWRC/GYW)での変異により表し、パーセンテージとして表した、デアミナーゼ(例えばAID)に寄与し得るSNVの総数(転移変異は、C>T、G>A、T>C、およびA>Gとして定義される)。
・デアミナーゼ_MC1%(例えばAID_MC1%):MC1部位で起こった、特定のデアミナーゼモチーフ(例えばAIDモチーフWRC/GYW)を用いたデアミナーゼ(例えばAID)に寄与し得るすべてのSNVのパーセンテージ。
・デアミナーゼ_MC2%:MC2部位で起こったデアミナーゼに寄与し得るすべてのSNVのパーセンテージ。
・デアミナーゼ_MC3%:MC3部位で起こったデアミナーゼに寄与し得るすべてのSNVのパーセンテージ。
・C>T_MC1%:MC1部位でのC>T変異のパーセンテージ(AID、A3B、またはA3Gに寄与し得るSNVについて用いたメトリック)。
・C>T_MC2%:MC2部位でのC>T変異のパーセンテージ(AID、A3B、またはA3Gに寄与し得るSNVについて用いたメトリック)。
・C>T_MC3%:MC3部位でのC>T変異のパーセンテージ(AID、A3B、またはA3Gに寄与し得るSNVについて用いたメトリック)。
・G>A_MC1%:MC1部位でのG>A変異のパーセンテージ(AID、A3B、またはA3Gに寄与し得るSNVについて用いたメトリック)。
・G>A_MC2%:MC2部位でのG>A変異のパーセンテージ(AID、A3B、またはA3Gに寄与し得るSNVについて用いたメトリック)。
・G>A_MC3%:MC3部位でのG>A変異のパーセンテージ(AID、A3B、またはA3Gに寄与し得るSNVについて用いたメトリック)。
・T>C_MC1%:MC1部位でのT>C変異のパーセンテージ(ADARに寄与し得るSNVについて用いたメトリック)。
・T>C_MC2%:MC2部位でのT>C変異のパーセンテージ(ADARに寄与し得るSNVについて用いたメトリック)。
・T>C_MC3%:MC3部位でのT>C変異のパーセンテージ(ADARに寄与し得るSNVについて用いたメトリック)。
・A>G_MC1%:MC1部位でのA>G変異のパーセンテージ(ADARに寄与し得るSNVについて用いたメトリック)。
・A>G_MC2%:MC2部位でのA>G変異のパーセンテージ(ADARに寄与し得るSNVについて用いたメトリック)。
・A>G_MC3%:MC3部位でのA>G変異のパーセンテージ(ADARに寄与し得るSNVについて用いたメトリック)。
・デアミナーゼ_Ti/Tv:転換変異であるデアミナーゼに寄与し得るSNVの総数で割った、転位変異であるデアミナーゼに寄与し得るSNVの総数によって与えられる、転位/転換比。
・デアミナーゼ_C:G:グアニンの変異であるデアミナーゼに寄与し得るSNVの数で割った、シトシンの変異であるデアミナーゼに寄与し得るSNVの数によって与えられる、ストランドバイアス比。
・デアミナーゼ_True_C:G:Gでの転位変異の総数で割った、Cでの転位変異の総計によって与えられる、ストランドバイアス比。
算出した他のデアミナーゼ関連メトリックは、以下を含んだ。
・デアミナーゼ%:パーセンテージとして表した、患者におけるSNVの総数で割った、上記のようなAID、ADAR、A3G、A3Bについての4つの一次デアミナーゼモチーフに寄与し得るSNVの総数。
・Other%:パーセンテージとして表した、患者におけるSNVの総数で割った、上記のようなAID、ADAR、A3G、A3Bについての4つの一次デアミナーゼモチーフに寄与し得ないSNVの総数。
特定のモチーフには関連しないが、異常なデアミナーゼ活性の間接的因果関係である他のメトリックは、以下を含む。
・All_A%:SNVの総数のパーセンテージとして表した、アデニンの変異(すなわち、A>T、C、またはG)に起因するSNVの総数。
・A_MC1%:MC1位置にあるアデニンの変異に起因するSNVのパーセンテージ。
・A_MC2%:MC2位置にあるアデニンの変異に起因するSNVのパーセンテージ。
・A_MC3%:MC3位置にあるアデニンの変異に起因するSNVのパーセンテージ。
すなわち、A_MC1%+A_MC2%+A_MC3%=100%
・All_T%:SNVの総数のパーセンテージとして表した、チミンの変異(すなわち、T>A、C、またはG)に起因するSNVの総数。
・T_MC1%:MC1位置で起こったチミンの変異に起因するSNVのパーセンテージ。
・T_MC2%:MC2位置で起こったチミンの変異に起因するSNVのパーセンテージ。
・T_MC3%:MC3位置で起こったチミンの変異に起因するSNVのパーセンテージ。
すなわち、T_MC1%+T_MC2%+T_MC3%=100%
・All_C%:SNVの総数のパーセンテージとして表した、シトシンの変異(すなわち、C>G、A、またはT)に起因するSNVの総数。
・C_MC1%:MC1位置で起こったシトシンの変異に起因するSNVのパーセンテージ。
・C_MC2%:MC2位置で起こったシトシンの変異に起因するSNVのパーセンテージ。
・C_MC3%:MC3位置で起こったシトシンの変異に起因するSNVのパーセンテージ。
すなわち、C_MC1%+C_MC2%+C_MC3%=100%
・All_G%:SNVの総数のパーセンテージとして表した、グアニンの変異(すなわち、G>C、A、またはT)に起因するSNVの総数。
・G_MC1%:MC1位置で起こったグアニンの変異に起因するSNVのパーセンテージ。
・G_MC2%:MC2位置で起こったグアニンの変異に起因するSNVのパーセンテージ。
・G_MC3%:MC3位置で起こったグアニンの変異に起因するSNVのパーセンテージ。
すなわち、G_MC1%+G_MC2%+G_MC3%=100%
・all_MC1%:MC1位置にあるすべてのSNVのパーセンテージ。
・all_MC2%:MC2位置にあるすべてのSNVのパーセンテージ。
・all_MC3%:MC3位置にあるすべてのSNVのパーセンテージ。
・all_A_Ti/Tv:アデニンの変異に起因するすべてのSNVの転位-転換比、すなわち、アデニンの転位変異(すなわち、A>G)に起因するすべてのSNV対アデニンの転換変異(すなわち、A>TまたはC)に起因するすべてのSNVの比。
・all_T_Ti/Tv:チミンの変異に起因するすべてのSNVの転位-転換比、すなわち、チミンの転位変異(すなわち、T>C)に起因するすべてのSNV対チミンの転換変異(すなわち、T>GまたはA)に起因するすべてのSNVの比。
・all_C_Ti/Tv:シトシンの変異に起因するすべてのSNVの転位-転換比、すなわち、シトシンの転位変異(すなわち、C>T)に起因するすべてのSNV対シトシンの転換変異(すなわち、C>GまたはA)に起因するすべてのSNVの比。
・all_G_Ti/Tv:グアニンの変異に起因するすべてのSNVの転位-転換比、すなわち、グアニンの転位変異(すなわち、G>A)に起因するすべてのSNV対グアニンの転換変異(すなわち、G>CまたはT)に起因するすべてのSNVの比。
・all_AT_Ti/Tv:アデニンまたはチミンの変異に起因するすべてのSNVの転位-転換比、すなわち、アデニンの転位変異(すなわち、A>G)またはチミンの転位変異(すなわち、T>C)に起因するすべてのSNV対アデニンの転換変異(すなわち、A>TもしくはC)またはチミンの転換変異(すなわち、T>GもしくはA)に起因するすべてのSNVの比。
・all_GC_Ti/Tv:シトシンまたはグアニンの変異に起因するSNVの転位-転換比、すなわち、グアニンの転位変異(すなわち、G>A)またはシトシンの転位変異(すなわち、C>T)に起因するすべてのSNV対グアニンの転換変異(すなわち、G>CもしくはT)またはシトシンの転換変異(すなわち、C>GもしくはA)に起因するすべてのSNVの比。
・all_C:G:シトシンの変異に起因するすべてのSNV対グアニンの変異に起因するすべてのSNVの比。
・all_A:T:アデニンの変異に起因するすべてのSNV対チミンの変異に起因するすべてのSNVの比。
・all_AT:GC:アデニンまたはチミンの変異に起因するすべてのSNV対グアニジンまたはシトシンの変異に起因するすべてのSNVの比。
実施例2
イピリムマブ処置に対する応答を予測するためのデアミナーゼ活性の遺伝学的指標
転移性メラノーマを有する患者において、細胞傷害性Tリンパ球関連抗原-4(CTLA-4)に対するモノクローナル抗体であるイピリムマブ(Yervoy(商標))の効力を評価する臨床治験により、110名の患者のうち27名(すなわち、24.5%)のみが治療に応答したことが見出された(Van Allen et al (2015) Science 350(6257): 207-211)。処置に対する患者の応答を予測するために用いられ得る、レスポンダーにしかない特徴は、何も特定されなかった。
患者の各々の全エキソーム配列を、実施例1に記載されるように解析して、デアミナーゼ活性の遺伝学的指標が、治療に対する応答または非応答に関連していたかどうかを判定した。特に、評価したデアミナーゼ活性の遺伝学的指標は、以下を含んだ:
・AIDモチーフWRC/GYWでのSNVのパーセンテージ(AID%);ADARモチーフWA/TWにあった総SNVのパーセンテージ(ADAR%);APOBEC3GモチーフCC/GGにあった総SNVのパーセンテージ(A3G%);およびAPOBEC3BモチーフTCA/TGAにあった総SNVのパーセンテージ(A3B%)を含む、デアミナーゼ活性を直接評価するそれらの指標、
・MC-3部位で起こったチミンヌクレオチドの変異に起因するSNVのパーセンテージ(T_MC3%);MC-3部位で起こったグアニンヌクレオチドの変異に起因するSNVのパーセンテージ(G_MC3%);MC-1部位で起こったシトシンヌクレオチドの変異に起因するSNVのパーセンテージ(C_MC1%);MC-2部位で起こったシトシンヌクレオチドの変異に起因するSNVのパーセンテージ(C_MC2%);MC-1部位にあったSNVのパーセンテージ(all_MC1%);MC-2部位にあったSNVのパーセンテージ(all_MC2%);およびMC-3部位にあったSNVのパーセンテージ(all_MC3%)を含む、コドンコンテキストを評価するそれらの指標、
・ならびに、アデニンヌクレオチドの変異に起因するSNVのパーセンテージ(all_A%);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(all A:T);およびシトシンまたはグアニンの変異に起因するSNVの転位-転換比 all_GC TiTvを含む、ストランドバイアスおよび/またはヌクレオチドターゲティングを評価するそれらの指標。
表1は、27名の「レスポンダー」についてのデアミナーゼ活性の遺伝学的指標の解析の結果を示す。これらのレスポンダー由来のデータを用いて、各指標についての範囲間隔(RI)を算出し、次いでそれに対して「ノンレスポンダー」由来のデータを比較した。この例において、各指標についてのRIを、その指標についての観察された最大値および観察された最小値によって設定した。例外は、APOBEC3BモチーフTCA/TGAにあった総SNVのパーセンテージ(A3B%)についてのRIであり、これは、観察された最大値-5%および観察された最小値+5%として設定した。観察されたデアミナーゼ活性の遺伝学的指標の値がRIの外側であった場合(RIと比較してH‐高いまたはL‐低い)、その指標に1のスコアを帰属させた。観察されたデアミナーゼ活性の遺伝学的指標の値がRI内であった場合、その指標に0のスコアを帰属させた。表の右側の縦列に提供されたスコアは、患者についての総スコアである。したがって、患者はRIの外側の遺伝学的指標を全く有さない場合、すなわち、「外れ値」を全く有さない場合、総スコアは0であった。この総スコアはまた、予測試験スコアとも呼ばれる。見られ得るように、イピリムマブ処置に応答する患者の2/27名のみが、1のスコアを有し(すなわち、これらの2名の患者の各々は、1つの外れ値を有していた)、他方、25/27名の患者が、0のスコアを有していた。したがって、デアミナーゼ活性の遺伝学的指標の評価を用いて、患者の25/27名(または92.6%)が、イピリムマブでの処置に適しており、治療に応答する可能性が高いであろうと予測することができた。
表2は、73名の「ノンレスポンダー」についての結果を示し、表3は、それにもかかわらず長期生存を有した10名のノンレスポンダーについての結果を示す。プールしたノンレスポンダー群についての結果は、60/83名の患者が、RIの外側であった少なくとも1つのデアミナーゼ活性の遺伝学的指標を有していたことを示す。これは、処置の前の本明細書に記載されるようなデアミナーゼ活性の遺伝学的指標の評価が、これらの患者の60/83名(72.3%)が処置に適していないであろうと予測していたことを示す。
実施例3
ペムブロリズマブ処置に対する応答を予測するためのデアミナーゼ活性の遺伝学的指標
ペムブロリズマブなどの、プログラム細胞死1受容体(PD-1)に対するモノクローナル抗体は、免疫チェックポイント活性を阻害することによって、肺がんを有する患者に対してかなりの臨床的恩恵を生じる。しかし、この免疫療法に対する患者の応答の臨床的予測因子は、欠如している。非小細胞肺がんを有する患者において、ペムブロリズマブ(Keytruda(商標))の効力を評価する臨床治験により、処置した34名の患者のうち14名の患者における臨床的恩恵が実証された(41.2%;6ヶ月よりも長く続く部分的なまたは安定な応答として定義される持続性臨床的恩恵)(Rizvi et al. (2015) Science 348 6230: 124-128)。処置に対する患者の応答を予測するために用いられ得る、レスポンダーにしかない特徴は、何も特定されなかった。
この臨床研究における患者の各々の全エキソーム配列を、実施例1に記載されるように解析して、デアミナーゼ活性の遺伝学的指標が、治療に対する応答または非応答に関連していたかどうかを判定した。特に、評価したデアミナーゼ活性の遺伝学的指標は、以下を含んだ:
・AIDモチーフWRC/GYWでのSNVのパーセンテージ(AID%);ADARモチーフWA/TWにあった総SNVのパーセンテージ(ADAR%);APOBEC3GモチーフCC/GGにあった総SNVのパーセンテージ(A3G%);およびAPOBEC3BモチーフTCA/TGAにあった総SNVのパーセンテージ(A3B%)を含む、デアミナーゼ活性を直接評価するそれらの指標、
・MC-2部位にあったシトシンヌクレオチドの変異に起因するSNVのパーセンテージ(C_MC2%);MC-1部位にあったチミンヌクレオチドの変異に起因するSNVのパーセンテージ(T_MC1%);MC-2部位にあったチミンヌクレオチドの変異に起因するSNVのパーセンテージ(T_MC2%);MC-3部位にあったチミンヌクレオチドの変異に起因するSNVのパーセンテージ(T_MC3%);MC-1部位にあったSNVのパーセンテージ(all_MC1%);MC-2部位にあったSNVのパーセンテージ(all_MC2%);およびMC-3部位にあったSNVのパーセンテージ(all_MC3%)を含む、コドンコンテキストを評価するそれらの指標、
・ならびに、グアニンヌクレオチドの変異に起因するSNVのパーセンテージ(all_G%);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ(all_A%);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(all A:T);およびシトシンまたはグアニンの変異に起因するSNVの転位-転換比(all_GC_TiTv)を含む、ストランドバイアスおよび/またはヌクレオチドターゲティングを評価するそれらの指標。
表4は、14名の「レスポンダー」についてのデアミナーゼ活性の遺伝学的指標の解析の結果を示す。これらのレスポンダー由来のデータを用いて、各指標についての範囲間隔(RI)を算出し、次いでそれに対して「ノンレスポンダー」由来のデータを比較した。この例において、各指標についてのRIを、その指標についての観察された最大値および観察された最小値によって設定した。観察されたデアミナーゼ活性の遺伝学的指標の値がRIの外側であった場合(RIと比較してH‐高いまたはL‐低い)、その指標に1のスコアを帰属させた。観察されたデアミナーゼ活性の遺伝学的指標の値がRI内であった場合、その指標に0のスコアを帰属させた。表の右側の縦列に提供されたスコアは、患者についての総スコアである。したがって、患者がRIの外側の遺伝学的指標を全く有さない場合、すなわち、「外れ値」を全く有さない場合、総スコアは0であった。この総スコアはまた、予測試験スコアとも呼ばれる。見られ得るように、ペムブロリズマブ処置に応答する患者のすべては、0のスコアを有していた。
対照的に、表5に示されるように、ノンレスポンダー群内の17名の患者はすべて、少なくとも1つのRIの外側の値を有しており、加算された外れ値の数が、各患者のスコアを構成する。これは、処置の前の本明細書に記載されるようなデアミナーゼ活性の遺伝学的指標の評価が、これらの患者のいずれも処置に適していないであろうと予測していた、すなわち、患者のすべてがノンレスポンダーであろうと予測していたことを示す。
実施例4
ペムブロリズマブ処置に対するレスポンダーにおける再発を予測するためのデアミナーゼ活性の遺伝学的指標
デアミナーゼ活性の遺伝学的指標を用いて、有効な治療を現在受けている患者において、免疫療法処置の前および後の個々の患者プロファイルにおける違いを特定することができるかどうかを判定するために、ペムブロリズマブ処置の効力を評価する臨床治験由来の患者の全エキソーム配列を評価した。
ペムブロリズマブ(Keytruda(商標))で処置されている転移性メラノーマを有する78名の患者に対して、臨床治験を実施した。Zaretsky et al. (New England Journal of Medicine (2016) 375(9): 819-829)に記載されているように、これらの患者のうちの42名は、客観的応答を有していた(53.8%)。このサブグループから、15名が、次いで続けて疾患の進行を有し、これらの患者のうちの4名は、客観的応答を有した後に腫瘍成長が再び起こった(「後期獲得抵抗性」)と考えられた。処置の前および後に取得されたこれらの4名の「再出現した」患者における皮膚生検材料に対して、全エキソームシーケンシングを行った。Zaretskyらは、JAK変異が疾患の病因に関係していたことは示唆したが、この「再出現した」処置に対する応答を予測するいかなる因子も特定しなかった。
処置の前および後に採取した試料由来の、これらの4名の「再出現した」患者からの全エキソーム配列を、実施例1に記載されるように評価して、デアミナーゼ活性の遺伝学的指標が、再発に関連していたかどうかを判定した。特に、評価したデアミナーゼ活性の遺伝学的指標は、以下を含んだ:
・AIDモチーフWRC/GYWでのSNVのパーセンテージ(AID%);ADARモチーフWA/TWにあった総SNVのパーセンテージ(ADAR%);APOBEC3GモチーフCC/GGにあった総SNVのパーセンテージ(A3G%);およびAPOBEC3BモチーフTCA/TGAにあった総SNVのパーセンテージ(A3B%)を含む、デアミナーゼ活性を直接評価するそれらの指標、
・MC-2部位にあったシトシンヌクレオチドの変異に起因するSNVのパーセンテージ(C_MC2%);MC-1部位にあったチミンヌクレオチドの変異に起因するSNVのパーセンテージ(T_MC1%);MC-2部位にあったチミンヌクレオチドの変異に起因するSNVのパーセンテージ(T_MC2%);MC-3部位にあったチミンヌクレオチドの変異に起因するSNVのパーセンテージ(T_MC3%);MC-1部位にあったSNVのパーセンテージ(all_MC1%);MC-2部位にあったSNVのパーセンテージ(all_MC2%);およびMC-3部位にあったSNVのパーセンテージ(all_MC3%)を含む、コドンコンテキストを評価するそれらの指標、
・ならびに、グアニンヌクレオチドの変異に起因するSNVのパーセンテージ(all_G%);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ(all_A%);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(all_A:T);およびシトシンまたはグアニンの変異に起因するSNVの転位-転換比(all_GCTiTv)を含む、ストランドバイアスおよび/またはヌクレオチドターゲティングを評価するそれらの指標。
表6は、再発の前の(または治療に対する抵抗性の発生の前の)4名の患者についてのデアミナーゼ活性の遺伝学的指標の解析の結果を示す。このデータを用いて、各指標についての範囲間隔(RI)を算出し、次いでそれに対して「再発後」試料由来のデータを比較した。この例において、各指標についてのRIを、その指標についての観察された最大値および観察された最小値によって設定した。観察されたデアミナーゼ活性の遺伝学的指標の値がRIの外側であった場合(RIと比較してH‐高いまたはL‐低い)、その指標に1のスコアを帰属させた。観察されたデアミナーゼ活性の遺伝学的指標の値がRI内であった場合、その指標に0のスコアを帰属させた。表の右側の縦列に提供されたスコアは、患者についての総スコアである。したがって、患者がRIの外側の遺伝学的指標を全く有さない場合、すなわち、「外れ値」を全く有さない場合、総スコアは0であった。この総スコアはまた、予測試験スコアとも呼ばれる。見られ得るように、試料が採取された時にペムブロリズマブ処置に応答していた患者のすべては、0のスコアを有していた。
対照的に、表7に示されるように、4名の患者はすべて、再発後に少なくとも1つのRIの外側の値を有しており、加算された外れ値の数が、各患者のスコアを構成する。これは、処置中の本明細書に記載されるようなデアミナーゼ活性の遺伝学的指標の評価が、これらの患者のいずれも処置に応答し続けないであろう、すなわち、すべてが処置に対する抵抗性を発生させ、再発するであろうと予測していたことを示す。
実施例5
アテゾリズマブ処置に対する応答を予測するためのデアミナーゼ活性の遺伝学的指標
アテゾリズマブでのプログラム死-リガンド1(PD-L1)の阻害は、転移性尿路上皮がんを有する患者において、持続性臨床的恩恵を誘導することができる。変異負荷およびPD-L1免疫細胞(IC)染色は、治療に対する応答に関連しているが、それらには、臨床用途のために十分な感度および特異性が欠如している。29名の患者に対して行ったアテゾリズマブ(Tecentriq(商標))の効力を評価する臨床治験において、9名の患者は、客観的応答を有し(31%)、20名は、いかなる持続性臨床的応答も有さなかった(69%)(Snyder et al. PLoS Medicine, (2017) 14(5), e1002309)。応答に関連する因子を特定するために、これらの患者由来の組織生検材料の全エキソームシーケンシングを行った。持続性臨床的恩恵を有する患者(すなわち、9名の「レスポンダー」)は、より高い腫瘍浸潤Tリンパ球(TIL)の割合を示したことが見出されたが、Snyderらは、この測定値は、バイオマーカーとして適しておらず、さらなる調査が必要とされると結論付けた。
この臨床研究における患者の各々の全エキソーム配列を、実施例1に記載されるように解析して、デアミナーゼ活性の遺伝学的指標が、アテゾリズマブ治療に対する応答または非応答に関連していたかどうか、およびしたがって、応答または非応答の予測因子として用いられ得るかどうかを判定した。特に、評価したデアミナーゼ活性の遺伝学的指標は、以下を含んだ:
・AIDモチーフWRC/GYWでのSNVのパーセンテージ(AID%);ADARモチーフWA/TWにあった総SNVのパーセンテージ(ADAR%);APOBEC3GモチーフCC/GGにあった総SNVのパーセンテージ(A3G%);およびAPOBEC3BモチーフTCA/TGAにあった総SNVのパーセンテージ(A3B%)を含む、デアミナーゼ活性を直接評価するそれらの指標、
・MC-1部位にあったシトシンヌクレオチドの変異に起因するSNVのパーセンテージ(C_MC1%);MC-2部位にあったシトシンヌクレオチドの変異に起因するSNVのパーセンテージ(C_MC2%);MC-3部位にあったシトシンヌクレオチドの変異に起因するSNVのパーセンテージ(C_MC3%);MC-1部位にあったSNVのパーセンテージ(all_MC1%);MC-2部位にあったSNVのパーセンテージ(all_MC2%);およびMC-3部位にあったSNVのパーセンテージ(all_MC3%)を含む、コドンコンテキストを評価するそれらの指標、
・ならびに、チミンヌクレオチドの変異に起因するSNVのパーセンテージ(all_T%);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ(all_A%);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ対チミンヌクレオチドの変異に起因するSNVのパーセンテージの比(all A:T);およびグアニンの変異に起因するSNVの転位-転換比(all_G_TiTv)を含む、ストランドバイアスおよび/またはヌクレオチドターゲティングを評価するそれらの指標。
表8は、9名の「レスポンダー」についてのデアミナーゼ活性の遺伝学的指標の解析の結果を示す。これらのレスポンダー由来のデータを用いて、各指標についての範囲間隔(RI)を算出し、次いでそれに対して「ノンレスポンダー」由来のデータを比較した。この例において、各指標についてのRIを、その指標についての観察された最大値および観察された最小値によって設定した。観察されたデアミナーゼ活性の遺伝学的指標の値がRIの外側であった場合(RIと比較してH‐高いまたはL‐低い)、その指標に1のスコアを帰属させた。観察されたデアミナーゼ活性の遺伝学的指標の値がRI内であった場合、その指標に0のスコアを帰属させた。表の右側の縦列に提供されたスコアは、患者についての総スコアである。したがって、患者がRIの外側の遺伝学的指標を全く有さない場合、すなわち、「外れ値」を全く有さない場合、総スコアは0であった。この総スコアはまた、予測試験スコアとも呼ばれる。見られ得るように、アテゾリズマブ処置に応答する患者のすべては、0のスコアを有していた。
対照的に、表9に示されるように、ノンレスポンダー群内の29名の患者はすべて、少なくとも1つのRIの外側の値を有しており、加算された外れ値の数が、各患者の総スコアを構成する。これは、処置の前の本明細書に記載されるようなデアミナーゼ活性の遺伝学的指標の評価が、これらの患者のいずれも処置に適していないであろうと予測していた、すなわち、患者のすべてがノンレスポンダーであろうと予測していたことを示す。
実施例6
抗PD-1療法処置に対する応答を予測するためのデアミナーゼ活性の遺伝学的指標
PD-1免疫チェックポイント遮断は、メラノーマ患者に対して有意な臨床的恩恵を提供する。抗PD-1療法に対する感度または抵抗性を調査する臨床治験において、38名の患者のうち21名(55%)は、客観的応答を有し、38名のうち17名は、いかなる客観的応答も有さなかった(45%)(Hugo et al. (2016) Cell, 165: 35-44)。応答に関連する因子を特定するために、これらの患者由来の組織生検材料の全エキソームシーケンシングがHugoらによって行われたが、転帰を予測する特異的な因子は、特定されなかった。
この臨床研究における患者の各々の全エキソーム配列を、実施例1に記載されるように解析して、デアミナーゼ活性の遺伝学的指標が、抗PD-1療法に対する応答または非応答に関連していたかどうか、およびしたがって、応答または非応答の予測因子として用いられ得るかどうかを判定した。特に、評価したデアミナーゼ活性の遺伝学的指標は、以下を含んだ:
・AIDモチーフWRC/GYWでのSNVのパーセンテージ(AID%);ADARモチーフWA/TWにあった総SNVのパーセンテージ(ADAR%);APOBEC3GモチーフCC/GGにあった総SNVのパーセンテージ(A3G%);およびAPOBEC3BモチーフTCA/TGAにあった総SNVのパーセンテージ(A3B%)を含む、デアミナーゼ活性を直接評価するそれらの指標、
・MC-1部位で起こったAIDモチーフWRC/GYWでのSNVのパーセンテージ(AID_MC1%);G>A変異を含み、かつMC-3部位で起こったAIDモチーフGYWでのSNVのパーセンテージ(AIDa_GA3%);C>T変異を含み、かつMC-1部位で起こったAPOBEC3BモチーフTCAでのSNVのパーセンテージ(A3Ba_CT1%);C>T変異を含み、かつMC-3部位で起こったAPOBEC3BモチーフTCAでのSNVのパーセンテージ(A3Ba_CT3%);MC-1部位にあったSNVのパーセンテージ(all_MC1%);MC-2部位にあったSNVのパーセンテージ(all_MC2%);およびMC-3部位にあったSNVのパーセンテージ(all_MC3%)を含む、コドンコンテキストを評価するそれらの指標、
・ならびに、シトシンヌクレオチドの変異に起因するSNVのパーセンテージ(all_C%);グアニンヌクレオチドの変異に起因するSNVのパーセンテージ(all_G%);デアミナーゼモチーフWA中ではないアデニンヌクレオチドの変異に起因するSNVの数対デアミナーゼモチーフTW中ではないチミンヌクレオチドの変異に起因するSNVの数の比(Other A:T);およびグアニンまたはシトシンの変異に起因するSNVの転位-転換比(all_GC_TiTv)を含む、ストランドバイアスおよび/またはヌクレオチドターゲティングを評価するそれらの指標。
表10は、19名の「レスポンダー」についてのデアミナーゼ活性の遺伝学的指標の解析の結果を示す。これらのレスポンダー由来のデータを用いて、各指標についての範囲間隔(RI)を算出し、次いでそれに対して「ノンレスポンダー」由来のデータを比較した。この例において、各指標についてのRIを、その指標についての観察された最大値および観察された最小値によって設定した。観察されたデアミナーゼ活性の遺伝学的指標の値がRIの外側であった場合(RIと比較してH‐高いまたはL‐低い)、その指標に1のスコアを帰属させた。観察されたデアミナーゼ活性の遺伝学的指標の値がRI内であった場合、その指標に0のスコアを帰属させた。表の右側の縦列に提供されたスコアは、患者についての総スコアである。したがって、患者がRIの外側の遺伝学的指標を全く有さない場合、すなわち、「外れ値」を全く有さない場合、総スコアは0であった。この総スコアはまた、予測試験スコアとも呼ばれる。見られ得るように、トラスツズマブ処置に応答する患者のすべては、0のスコアを有していた。
対照的に、表11に示されるように、ノンレスポンダー群内の17名の患者のうちの14名(82%)は、少なくとも1つのRIの外側の値を有しており、加算された外れ値の数が、各患者の総スコアを構成する。これは、処置の前の本明細書に記載されるようなデアミナーゼ活性の遺伝学的指標の評価が、17名の患者のうちの14名は処置に適していないであろう、すなわち、ノンレスポンダーであろうと予測していたことを示す。
実施例7
アファチニブ処置に対する応答を予測するためのデアミナーゼ活性の遺伝学的指標
炎症性乳がん(IBC)は、高い転移のリスクを有し、2.9年のみの推定中央生存期間を有する、乳がんの希少な侵襲性形態である。非可逆的ErbBファミリー阻害剤であるアファチニブの単独およびビノレルビンとの組み合わせでの効力および安全性を調査する単一群第II相臨床治験において、HER2陽性IBCを有する患者では、22名の患者試料のうちの7名(32%)は、客観的応答に関連しており(32%)、15名(68%)は、いかなる持続性臨床応答も有さなかった(Goh et al. (2017) PLoS Medicine, 13(12), e1002136)。免疫療法の前および後のこれらの患者由来の組織生検材料の全エキソームシーケンシングを行い、配列を解析して、治療に対する応答または非応答に関連したいずれかの因子があったかどうかを判定した。Gohらは、患者の間のいかなる違いも特定できなかった。
この臨床研究における患者の各々の全エキソーム配列を、実施例1に記載されるように解析して、デアミナーゼ活性の遺伝学的指標が、アファチニブ療法に対する応答または非応答に関連していたかどうか、およびしたがって、応答または非応答の予測因子として用いられ得るかどうかを判定した。特に、評価したデアミナーゼ活性の遺伝学的指標は、以下を含んだ:
・AIDモチーフWRC/GYWでのSNVのパーセンテージ(AID%);ADARモチーフWA/TWにあった総SNVのパーセンテージ(ADAR%);APOBEC3GモチーフCC/GGにあった総SNVのパーセンテージ(A3G%);およびAPOBEC3BモチーフTCA/TGAにあった総SNVのパーセンテージ(A3B%)を含む、デアミナーゼ活性を直接評価するそれらの指標、
・MC-1部位にあったアデニンヌクレオチドの変異に起因するSNVのパーセンテージ(A_MC1%);MC-2部位にあったアデニンヌクレオチドの変異に起因するSNVのパーセンテージ(A_MC2%);MC-3部位にあったアデニンヌクレオチドの変異に起因するSNVのパーセンテージ(A_MC3%);MC-1部位にあったSNVのパーセンテージ(all_MC1%);MC-2部位にあったSNVのパーセンテージ(all_MC2%);およびMC-3部位にあったSNVのパーセンテージ(all_MC3%)を含む、コドンコンテキストを評価するそれらの指標、
・ならびに、チミンヌクレオチドの変異に起因するSNVのパーセンテージ(all_T%);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ(all_A%);シトシンヌクレオチドの変異に起因するSNVのパーセンテージ対グアニンヌクレオチドの変異に起因するSNVのパーセンテージの比(all_C:G);およびグアニンまたはシトシンの変異に起因するSNVの転位-転換比(all_GC_TiTv)を含む、ストランドバイアスおよび/またはヌクレオチドターゲティングを評価するそれらの指標。
表12は、7名の「レスポンダー」についてのデアミナーゼ活性の遺伝学的指標の解析の結果を示す。これらのレスポンダー由来のデータを用いて、各指標についての範囲間隔(RI)を算出し、次いでそれに対して「ノンレスポンダー」由来のデータを比較した。この例において、各指標についてのRIを、その指標についての観察された最大値および観察された最小値によって設定した。観察されたデアミナーゼ活性の遺伝学的指標の値がRIの外側であった場合(RIと比較してH‐高いまたはL‐低い)、その指標に1のスコアを帰属させた。観察されたデアミナーゼ活性の遺伝学的指標の値がRI内であった場合、その指標に0のスコアを帰属させた。表の右側の縦列に提供されたスコアは、患者についての総スコアである。したがって、患者がRIの外側の遺伝学的指標を全く有さない場合、すなわち、「外れ値」を全く有さない場合、総スコアは0であった。この総スコアはまた、予測試験スコアとも呼ばれる。見られ得るように、アファチニブ処置に応答する患者のすべては、0のスコアを有していた。
対照的に、表13に示されるように、ノンレスポンダー群に関連する15試料はすべて、少なくとも1つのRIの外側の値を有しており、加算された外れ値の数が、各患者の総スコアを構成する。これは、アファチニブでの処置の前の本明細書に記載されるようなデアミナーゼ活性の遺伝学的指標の評価が、これらの患者のいずれも処置に適していないであろうと予測していた、すなわち、患者のすべてがノンレスポンダーであろうと予測していたことを示す。
次いで、デアミナーゼ活性の遺伝学的指標の異なる組み合わせを用いて、同じ区別(およびしたがって、予測についての潜在能力)がこの異なる組み合わせで行われ得るかどうかを判定した。この代替解析において評価したデアミナーゼ活性の遺伝学的指標は、以下を含んだ:
・AIDモチーフWRC/GYWでのSNVのパーセンテージ(AID%);ADARモチーフWA/TWにあった総SNVのパーセンテージ(ADAR%);APOBEC3GモチーフCC/GGにあった総SNVのパーセンテージ(A3G%);およびAPOBEC3BモチーフTCA/TGAにあった総SNVのパーセンテージ(A3B%)を含む、デアミナーゼ活性を直接評価するそれらの指標、
・MC-1部位で起こったAIDモチーフWRC/GYWでのSNVのパーセンテージ(AID_MC1%)、MC-2部位で起こったAIDモチーフWRC/GYWでのSNVのパーセンテージ(AID_MC2%)、MC-3部位で起こったAIDモチーフWRC/GYWでのSNVのパーセンテージ(AID_MC3%)、MC-1部位にあったグアニンヌクレオチドの変異に起因するSNVのパーセンテージ(G_MC1%);MC-2部位にあったグアニンヌクレオチドの変異に起因するSNVのパーセンテージ(G_MC2%);MC-3部位にあったグアニンヌクレオチドの変異に起因するSNVのパーセンテージ(G_MC3%)を含む、コドンコンテキストを評価するそれらの指標、
・ならびに、チミンヌクレオチドの変異に起因するSNVのパーセンテージ(all_T%);アデニンヌクレオチドの変異に起因するSNVのパーセンテージ(all_A%);アデニンまたはチミンヌクレオチドの変異に起因するSNVのパーセンテージ対グアニンまたはシトシンヌクレオチドの変異に起因するSNVのパーセンテージの比(all_AT:GC);およびシトシンの変異に起因するSNVの転位-転換比(all_C_TiTv)を含む、ストランドバイアスを評価するそれらの指標。
表14(レスポンダー)および表15(ノンレスポンダー)から見られ得るように、異なるセットのデアミナーゼ活性の遺伝学的指標を、アファチニブに応答する患者およびアファチニブに応答しない患者を同定/分類するために用いることができる。
実施例8
計算モデリングを用いたがん治療に対する応答の予測
免疫療法治験の結果を報告する刊行物の「補足」セクションから得られた患者ゲノムデータを用いて、計算モデリングを行った。報告されたバリアント、すなわち、すべてのバリアント(「全エキソーム」)、遺伝子のコーディング領域におけるバリアントのみ(「CDSのみ」)、およびアミノ酸変化に対応するバリアントのみ(「非同義」)に従ってカテゴリー分けされた研究での全エキソームシーケンシングデータから、SNVを取得した。表16は、得られたデータセットの概要を提供する。
(表16)これらの方法を用いて得られ、処理されたデータセットの概要
全エキソームシーケンシングから報告されたバリアントのタイプ:すべてのバリアント(「全エキソーム」)、遺伝子のコーディング領域において起こるバリアントのみ(「CDSのみ」)、およびアミノ酸変化に対応するバリアントのみ(「非同義」)に従って、患者をカテゴリー分けした。患者をさらに、関心対象の群に層別化して、「レスポンダー」および「ノンレスポンダー」の患者プロファイルにおける違いの調査を可能にした。群分けされた患者を、「訓練データセット」、「試験データセット」、および「検証データセット」に分離した。「検証データセット」とは、評価される患者のコホートを表し、単一研究由来の患者から構成される。「訓練」データセットおよび「試験」データセットは、互いに照合され、およそ75:25に分けられたいくつかのデータセットから構成される。
SNVを、VCFv4.1フォーマットで各患者から取得した。GRCh38を参照として用いるために、バッチ座標変換(liftOver; University of California Santa Cruz)プログラムツールを用いて、異なるゲノム参照の間を変換した。.vcfファイルにおける各々の体細胞バリアントを解析して、それが単純なSNV(例えば、A>TまたはG>A)であった場合には、さらなる考察のために選択した。G>(AおよびT)ならびに挿入または欠失などの複雑なバリアントは、解析しなかった。
訓練/試験データセット中に照合されたデータセットを、下記の各例において指定する。表G由来のメトリックを用いた。各例について、勾配ブースティング決定木アルゴリズムを用いて、機械学習モデルを作った。これは、「訓練」データに基づいて予測モデルを生じる、教師付き学習技術である。次いで、モデルを訓練するためには用いなかった患者データに、モデルを適用して、治療に対する応答を予測することができる。これらの例において、モデルは、最適化のために用いられる確率的勾配降下法を伴う弱い予測モデル(決定木)のアンサンブルである。「XGBoost」アルゴリズムを、これらの例において用いた(Chen, T., & Guestrin, C. (2016). Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining (pp. 785-794). ACM)。
XGBoostモデルを訓練するために用いるパラメータを、「MLR」ソフトウェアパッケージを使用する標準的な方法を用いて最適化した(Bischl B, Lang M, Kotthoff L, Schiffner J, Richter J, Studerus E, Casalicchio G, Jones Z (2016). "mlr: Machine Learning in R." Journal of Machine Learning Research, 17(170), 1-5. http://jmlr.org/papers/v17/15-066.html)。
下記の各訓練データセットについて最適化されたパラメータを用いて、モデルを作った。モデルを、試験データセットを用いて、精度、感度、および特異性について評価した。各例において、訓練されたモデルを用いて、対応する検証データセットにおける各患者についての免疫療法に対する応答を予測した。
A. 「Miao multi lung」データセットにおける患者の応答の予測
患者ゲノムデータを、記載されるように処理して、表G由来の様々なメトリックを定量した。追加的なメトリックが利用された場合(バリアントが、遺伝子のコーディング配列に制限されなかった場合)、メラノーマを有する患者が、訓練セットから除外された場合に、モデルの精度が改善され、特定のデータセット(Snyder_U)が除外された場合に、さらに改善された。
すべてのコーディングメトリックについての結果を、表17に、ならびに図10Aおよび10Bに示す。表G由来のすべてのコーディング(cds)メトリックを用いてこのモデルを訓練し、366メトリックを、最終モデルにおいて用いた。この訓練セットに含まれるデータセット:Hellmann、Hugo、Lauss、Miao_ccRCC、Miao_multi_bladder、Miao_multi_HNSCC、Miao_multi_melanoma、Miao_Rizvi、Miao_Snyder_M、Miao_Van_Allen、Riaz、Roh、Snyder_U。
(表17)遺伝子のコーディング領域のみに対応するメトリック
すべてのコーディングメトリックおよびノンコーディングメトリックについての結果を、表18に、ならびに図10Cおよび10Dに示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、411メトリックを、最終モデルにおいて用いた。この訓練セットに含まれるデータセット:Hellmann、Hugo、Lauss、Miao_ccRCC、Miao_multi_bladder、Miao_multi_HNSCC、Miao_multi_melanoma、Miao_Rizvi、Miao_Snyder_M、Miao_Van_Allen、Riaz、Roh、Snyder_U。
非メラノーマデータセットを訓練から除外した、すべてのコーディングメトリックおよびノンコーディングメトリックについての結果を、表19に、ならびに図10Eおよび10Fに示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、95メトリックを、最終モデルにおいて用いた。この訓練セットに含まれるデータセット:Hellmann、Miao_ccRCC、Miao_multi_bladder、Miao_multi_HNSCC、Miao_Rizvi、Snyder_U。
非メラノーマデータセットおよび外れ値を訓練から除外した、すべてのコーディングメトリックおよびノンコーディングメトリックについての結果を、表20に、ならびに図10Gおよび10Hに示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、132メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hellmann、Miao_ccRCC、Miao_multi_bladder、Miao_multi_HNSCC、Miao_Rizvi。
(表20)Snyder_Uを除外した非メラノーマデータセット
B. 「Miao multi bladder」データセットにおける患者の応答の予測
表G由来のメトリックを用いて「Miao_multi_bladder」データセットにおける患者の応答を予測するために、第2の例示的なデータセットを用いた。
外れ値を訓練から除外した結果を、表21に、ならびに図11Aおよび11Bに示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、316メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hellmann、Hugo、Lauss、Miao_ccRCC、Miao_multi_HNSCC、Miao_multi_lung、Miao_multi_melanoma、Miao_Rizvi、Miao_Snyder_M、Riaz、Roh、Snyder_U。
(表21)Miao_Van_Allenを除外したすべてのデータセット
非メラノーマデータセットおよび外れ値を訓練から除外した結果を、表22に、ならびに図11Cおよび11Dに示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、65メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hellmann、Miao_multi_HNSCC、Miao_multi_lung、Miao_Rizvi、Snyder_U。
(表22)Miao_ccRCCを除外した非メラノーマデータセット
C. 「Miao ccRCC」における患者の応答の予測
表G由来のメトリックを用いて「Miao_ccRCC」データセットにおける患者の応答を予測するために、第3の例示的なデータセットを用いた。
外れ値を訓練から除外した結果を、表23に、ならびに図12Aおよび12Bに示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、322メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hellmann、Hugo、Lauss、Miao_multi_bladder、Miao_multi_HNSCC、Miao_multi_lung、Miao_multi_melanoma、Miao_Rizvi、Miao_Snyder_M、Miao_Van_Allen、Roh、Snyder_U。
D. 「Miao multi HNSCC」データセットにおける患者の応答の予測
表G由来のメトリックを用いて「Miao_multi_HNSCC」データセットにおける患者の応答を予測するために、第4の例示的なデータセットを用いた。
結果を、表24に、ならびに図12Aおよび12Bに示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、200メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hellmann、Hugo、Lauss、Miao_ccRCC、Miao_multi_bladder、Miao_multi_lung、Miao_multi_melanoma、Miao_Rizvi、Miao_Snyder_M、Maio_Van_Allen、Riaz、Roh、Snyder_U。
非同義データセットを除外した結果を、表25に示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、318メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hellmann、Lauss、Miao_ccRCC、Miao_multi_bladder、Miao_multi_lung、Miao_multi_melanoma、Miao_Rizvi、Miao_Snyder_M、Miao_Van_Allen、Roh、Snyder_U。
(表25)非同義データセットを除外したすべてのデータセット
E. 「Miao Rizvi」データセットにおける患者の応答の予測
表G由来のメトリックを用いて「Miao_Rizvi」データセットにおける患者の応答を予測するために、第5の例示的なデータセットを用いる。
外れ値(Hugoデータセット)を除外した結果を、表26に示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、301メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hellmann、Lauss、Miao_ccRCC、Miao_multi_bladder、Miao_multi_HNSCC、Miao_multi_lung、Miao_multi_melanoma、Miao_Snyder_M、Miao_Van_Allen、Riaz、Roh、Snyder_U。
F. 「Lauss」データセットにおける患者の応答の予測
表G由来のメトリックを用いて「Lauss」データセットにおける患者の応答を予測するために、第6の例示的なデータセットを用いた。
外れ値(Miao_Van_Allenデータセット)を除外したメラノーマデータセットについての結果を、表27に示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、100メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hugo、Miao_multi_melanoma、Miao_Snyder_M、Riaz、Roh。
(表27)Miao_Van_Allenを除外したメラノーマデータセット
別の外れ値(Rohデータセット)を除外したメラノーマデータセットについての結果を、表28に示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、114メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hugo、Miao_multi_melanoma、Miao_Snyder_M、Miao_Van_Allen、Riaz。
G. 「Miao multi bladder」データセットにおける患者の応答の予測
表G由来のメトリックを用いて「Miao_multi_bladder」データセットにおける患者の応答を予測するために、第7の例示的なデータセットを用いる。
非同義および外れ値(Laussデータセット)を除外した結果を、表29に示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、241メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hellmann、Miao_ccRCC、Miao_multi_HNSCC、Miao_multi_lung、Miao_multi_melanoma、Miao_Rizvi、Miao_Snyder_M、Miao_Van_Allen、Roh、Snyder_U。
(表29)非同義データセットおよびLaussの除外
H. 「Liu」データセットにおける患者の応答の予測
表G由来のメトリックを用いて(シスプラチン療法を受けている患者から構成される)「Liu」データセットにおける患者の応答を予測するために、第8の例示的なデータセットを用いる。
結果を、表30に示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、290メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hellmann、Lauss、Hugo、Miao_ccRCC、Miao_multi_bladder、Miao_multi_lung、Miao_multi_melanoma、Miao_Snyder_M、Miao_Van_Allen、Riaz、Roh、Rizvi、Snyder_U。
I. 「Lesurf」データセットにおける患者の応答の予測
表G由来のメトリックを用いて(トラスツズマブ療法を受けている患者から構成される)「Lesurf」データセットにおける患者の応答を予測するために、第9の例示的なデータセットを用いる。
結果を、表31に示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、213メトリックを、最終モデルにおいて用いた。訓練セットに含まれるデータセット:Hellmann、Lauss、Hugo、Miao_multi_bladder、Miao_multi_HNSCC、Miao_multi_melanoma、Miao_Snyder_M、Miao_Van_Allen、Riaz、Rizvi、Roh、Snyder_U。
J. 「Ganly」データセットにおける患者の応答の予測
表G由来のメトリックを用いて「Ganly」データセット(手術を受けたことがあり、かつ放射性ヨウ素を受けている患者)における患者の応答を予測するために、第10の例示的なデータセットを用いる。
結果を、表32に示す。表G由来のすべてのコーディング(cds)メトリック、ノンコーディング(nc)メトリック、およびゲノム(g)メトリックを用いてこのモデルを訓練し、24メトリックを、最終モデルにおいて用いた。Miao_multi_melanoma、Miao_Snyder_M、Roh。
本明細書において引用されるあらゆる特許、特許出願、および刊行物の開示は、これによって、その全体が参照により本明細書に組み入れられる。
本明細書における任意の参照の引用は、そのような参照が、本出願に対する「先行技術」として利用可能であることの承認として解釈されるべきではない。
任意の先行刊行物(もしくはそれに由来する情報)に対する、または公知である任意の事柄に対する本明細書における言及は、その先行刊行物(もしくはそれに由来する情報)または公知の事柄が、本明細書が関連する努力の分野における共通の一般知識の一部を形成することの容認、または承認、または任意の形態の示唆としては受け取られず、かつ受け取られるべきではない。
本明細書を通して、目的は、本発明をいずれか1つの態様または特徴の特定の収集物に限定することなく、本発明の好ましい態様を説明することである。したがって、当業者は、本発明に照らして、様々な改変および変更を、本発明の範囲から逸脱することなく、例証される特定の態様において行えることを認識するであろう。すべてのそのような改変および変更は、添付の特許請求の範囲内に含まれることが意図される。