JP2017529855A - 遺伝子突然変異の検出のための方法およびシステム - Google Patents

遺伝子突然変異の検出のための方法およびシステム Download PDF

Info

Publication number
JP2017529855A
JP2017529855A JP2017516722A JP2017516722A JP2017529855A JP 2017529855 A JP2017529855 A JP 2017529855A JP 2017516722 A JP2017516722 A JP 2017516722A JP 2017516722 A JP2017516722 A JP 2017516722A JP 2017529855 A JP2017529855 A JP 2017529855A
Authority
JP
Japan
Prior art keywords
concentration
nucleic acid
mutation
target nucleic
tissue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017516722A
Other languages
English (en)
Inventor
キム,イル−ジン
ジャブロンズ,デイビッド
フアン,メンデス ロメロ,ペドロ
フアン,メンデス ロメロ,ペドロ
ユーン,ジュン−ヒ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of JP2017529855A publication Critical patent/JP2017529855A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Ecology (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

組織サンプル(たとえば保存組織サンプル)の遺伝子突然変異を検出するための方法およびシステムが提供される。方法は、a)組織または生物学的サンプルから核酸を抽出するステップ;b)抽出された核酸の標的核酸アンプリコンライブラリーを調製するステップ;c)組織サンプル標的核酸配列データを作成するために標的核酸アンプリコンライブラリーをシークエンシングするステップ;およびd)それが突然変異(たとえば特定の疾患についての危険性に関連する突然変異)を含有するかどうかを決定するためにサンプル標的核酸配列データを分析するステップを含む。本明細書において記載される方法は、好都合に、36時間未満で実行することができる。

Description

関連出願の相互参照
本出願は、あらゆる目的のために、その全体が参照によって本明細書において組み込まれる2014年9月26日に提出された米国仮特許出願第62/056,314号について米国特許法第119(e)条の下での利益を主張する。
技術分野
遺伝子解析の方法およびシステムが本明細書において提供される。より詳細には、組織サンプルを使用して遺伝子突然変異を検出するための方法およびシステムが本明細書において提供される。
最近、ヒト疾患の治療戦略は、ヒト癌における標的療法などのようなテーラーメイド医療に急速に移行している。ゲフィチニブおよびエルロチニブは、たとえば、肺癌患者におけるEGFR突然変異を標的にする、よく使用されている受容体チロシンキナーゼ(RTK)阻害剤である。さらに、EML4−ALK融合を有する肺癌患者は、MET−ALK阻害剤であるクリゾチニブに対して応答性であることが知られている。市販のまたは開発中の多くの抗癌薬は、標的特異的薬剤である。したがって、より速くよりロバストな技術を使用することによって臨床検体の遺伝子解析を迅速化することは非常に重要である。
ホルマリン固定パラフィン包埋(FFPE)組織は、臨床遺伝子解析において最も頻繁に使用されるサンプルタイプである。FFPE組織由来のゲノムDNAは、高度に分解されており、低品質であることが知られている。これは、臨床遺伝子解析におけるFFPE組織から抽出されたゲノムDNAの利用を制限してしまう。さらに、市販で入手可能な方法を介してのFFPE検体からのDNAの抽出は、費用のかかるまた時間のかかるプロセスとなる。多くの場合、これらのプロセスは、フェノールまたはクロロホルムなどのような有毒化学物質を含み、これらは、患者サンプルのロバストな処理を遅らせてしまう。そのため、遺伝子解析のためのFFPEサンプル由来のゲノムDNAを調製するための速く、簡単で、ロバストで、かつ対費用効果の高い方法を開発する必要性がある。
次世代シークエンシング(NGS)の出現は、多くの医学およびライフサイエンスの分野における遺伝子およびゲノムの研究のパラダイムを変えた。NGSは、ヒト、動物、微生物、および農業ゲノム(agrogenomic)サンプルのシークエンシングアプリケーションに革命を起こし、極限まで強化した。サンガーシークエンシングなどのような以前の遺伝子技術は、主として、単一遺伝子上の小さな領域しかカバーしないが、NGSは、エクソーム全体(ゲノムのすべてのエクソン)およびさらにゲノム全体をカバーすることができる。NGSアプリケーションの全ゲノムカバー率は、疾患に関する遺伝子およびゲノムの研究の範囲の広げることを可能にする。癌などのような多くのヒト疾患は、鍵となるドライバー(driver)または主な経路レギュレーターにおける遺伝子改変の蓄積によって主として引き起こされるので、新たな治療標的および診断マーカーがNGSを使用して発見されるであろうということが非常に期待される。癌などのようなヒト疾患のための治療標的または診断マーカーのいずれかに使用することができるかもしれない、以前に報告されていなかった遺伝子改変(たとえば突然変異、多型、増幅、染色体再配列、および遺伝子融合)を多くのNGSプロジェクトが同定している。
ゲノム全体またはエクソームのシークエンシングが多くの研究になお広く使用されているが、NGSの動向は、現在、標的シークエンシングの方に急速に移っている。小さいが重要な遺伝子セットまたは遺伝子領域に焦点を当てる標的シークエンシングは、疾患関連性の鍵となる遺伝子をスクリーニングするための非常に強力なアプローチである。患者(たとえば癌患者)スクリーニングのためのNGSアプリケーションのほとんどは、現在、エクソームまたはゲノム全体のシークエンシングよりも標的NGSによって行われている。標的シークエンシングの費用および実験時間の急速な低下ならびに有用性は、多くの遺伝子の利用に向けたNGSの使用を刺激している。
NGSは有望であり、また多くのライフサイエンスでの利用において、より普及したものになりつつあるが、複雑なサンプル調製、高い費用、および時間のかかるデータ解析などのようないくつかの因子が、そのアプリケーションが臨床および研究の環境においてより日常的に使用されるのを妨げている。そのため、現在の方法が改善されるまたはより速く、よりロバストで、かつより正確なNGSアプリケーションのための新たな方法が開発されることが必要不可欠である。
さらに、NGSデータ解析もまた、NGSを使用する際にハードルを与える。したがって、NGSアプリケーションを多くの生物学および臨床の分野においてより一般的な、そしてより不可欠なものにする、新たな、簡単で、かつロバストなNGSデータ解析ツールの開発の必要性がある。標的シークエンシングは、ヒト疾患における遺伝子スクリーニングにおいてより有力で、かつより普及したものになりつつあるが、データ解析は、エクソームまたはゲノム全体のシークエンシングのために開発されたプログラムまたはアルゴリズムによって主として実行されてきた。
したがって、ロバストな標的シークエンシング解析ツールの開発は、たとえば癌診断法、テーラーメイド医療、および出生前スクリーニングなどのような、標的シークエンシングの多くの利用にとって非常に重要になるであろう。
組織サンプル(たとえば保存組織サンプル)由来の標的核酸における突然変異((たとえば疾患の危険性に関連する突然変異)の存在を決定するための方法およびシステムが本明細書において提供される。第1の態様では、保存組織サンプルから核酸を抽出するための方法が本明細書において提供される。方法は、a)組織消化混合物を形成するために組織消化溶液と保存組織サンプルをインキュベートするステップ;b)1〜30分間80〜110℃で組織消化混合物を加熱するステップ;c)タンパク質分解混合物を形成するために組織消化混合物にプロテイナーゼを含むプロテアーゼ溶液を追加するステップ;d)1〜30分間50〜70℃でタンパク質分解混合物をインキュベートするステップ;およびe)1〜30分間80〜110℃でタンパク質分解混合物をインキュベートし、それによって保存組織サンプルから核酸を抽出するステップを含む。
いくつかの実施形態では、組織消化溶液が、i)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、0.1mM〜5mMの濃度のKHPO、およびTween 20を含む組織消化溶液;ii)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、0.1mM〜5mMの濃度のKHPO、およびTriton-X100を含む組織消化溶液;iii)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、および0.1mM〜5mMの濃度のKHPOを含む組織消化溶液;iv)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、および0.2mM〜200mMの濃度のKClを含む組織消化溶液;v)1mM〜100mMの濃度のHEPESバッファーを含む組織消化溶液;vi)1mM〜100mMの濃度のHEPESバッファーおよびTriton-X100を含む組織消化溶液;vii)1mM〜100mMの濃度のHEPESバッファーおよびTween 20を含む組織消化溶液;viii)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、0.2mM〜200mMの濃度のKCl、およびTriton-X100を含む組織消化溶液;ix)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、0.2mM〜200mMの濃度のKCl、およびTween 20を含む組織消化溶液;ならびにx)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.2mM〜200mMの濃度のKCl、0.1mM〜1mMの濃度のβ−メルカプトエタノール、およびTriton X-100を含む組織消化溶液から選択される。
ある実施形態では、プロテアーゼ溶液が、a)5mg/ml〜60mg/mlの濃度のプロテイナーゼK、1mM〜50mMの濃度のTris−HCl、および0.1〜10mMの濃度(concentraiton)のEDTAを含むプロテアーゼ溶液;b)5mg/ml〜60mg/mlの濃度のプロテイナーゼKを含むプロテアーゼ溶液;c)5mg/ml〜60mg/mlの濃度のプロテイナーゼKおよび1mM〜50mMの濃度のTris−HClを含むプロテアーゼ溶液;d)5mg/ml〜60mg/mlの濃度のプロテイナーゼKおよび0.1mM〜10mMの濃度のEDTAを含むプロテアーゼ溶液;e)5mg/ml〜60mg/mlの濃度のプロテイナーゼK、0.2mM〜50mMの濃度のTris−HCl、0.1mM〜10mMの濃度のCaCl、および20%〜70%の濃度のグリセロールを含むプロテアーゼ溶液からなる群から選択される。
いくつかの実施形態では、加熱するステップ(b)が、5〜30分間99℃である。ある実施形態では、タンパク質分解混合物をインキュベートするステップ(c)が、5〜30分間60℃である。いくつかの実施形態では、タンパク質分解混合物をインキュベートするステップ(d)が、5〜30分間99℃である。
別の態様では、組織サンプルから標的核酸アンプリコンライブラリーを作製するための方法であって、a)組織サンプルから抽出された核酸を増幅するステップであって、対象の核酸を標的にする5’リン酸化オリゴヌクレオチドを使用するステップ;およびb)増幅された標的核酸のそれぞれにアダプター核酸およびバーコード核酸を含むオリゴヌクレオチドを直接ライゲーションし、それによって標的核酸アンプリコンライブラリーを作製するステップを含む方法が本明細書において提供される。ある実施形態では、方法が、オリゴヌクレオチドを直接ライゲーションする(b)前に(a)の増幅された標的核酸を精製するステップをさらに含む。
別の態様では、配列データを前処理せずに組織サンプル標的核酸配列の突然変異を検出するための方法であって、(a)組織サンプル標的核酸配列データおよびデータベース標的核酸配列データを得るステップであって、データベース標的核酸配列データが突然変異データベースにあるステップ;(b)サンプル標的核酸配列データが突然変異データベースの登録突然変異を含有するかどうかを決定するために、組織サンプル標的核酸配列データをデータベース標的核酸配列データと比較するステップ;(c)突然変異データベースに登録されている突然変異の突然変異対立遺伝子頻度を決定することによって、突然変異データベースに登録されている突然変異の信頼性を決定するステップ;ならびに(d)組織サンプル標的核酸配列データが突然変異を含有するかどうかに関しての結果を生成し、それによって突然変異を検出するステップを含む方法が本明細書において提供される。
別の態様では、1つまたは複数のプロセッサ;メモリ;および1つまたは複数のプログラムを含むコンピューティングシステムが本明細書において提供される。コンピューティングシステムの1つまたは複数のプログラムは、メモリに保存されており、組織サンプル標的核酸配列の突然変異を検出するために1つまたは複数のプロセッサによって実行されるように構成されている。1つまたは複数のプログラムは、組織サンプル標的核酸配列における突然変異を検出するための命令であって、(a)組織サンプル標的核酸配列データおよびデータベース標的核酸配列データを得るステップであって、データベース標的核酸配列データが突然変異データベースにあるステップ;(b)サンプル標的核酸配列データが突然変異データベースの登録突然変異を含有するかどうかを決定するために、組織サンプル標的核酸配列データをデータベース標的核酸配列データと比較するステップ;(c)突然変異データベースに登録されている突然変異の突然変異対立遺伝子頻度を決定することによって、突然変異データベースに登録されている突然変異の信頼性を決定するステップ;ならびに(d)組織サンプル標的核酸配列データが突然変異を含有するかどうかに関しての結果を生成し、それによって突然変異を検出するステップを含む命令を含む。
別の態様では、保存組織サンプル由来の核酸が突然変異を有するかどうかを決定するための方法であって、a)組織消化混合物を形成するために組織消化溶液と保存組織サンプルをインキュベートするステップ;b)1〜30分間80〜110℃で組織消化混合物を加熱するステップ;c)タンパク質分解混合物を形成するために組織消化混合物にプロテイナーゼを含むプロテアーゼ溶液を追加するステップ;d)1〜30分間37〜70℃でタンパク質分解混合物をインキュベートするステップ;e)1〜30分間80〜110℃でタンパク質分解混合物をインキュベートし、それによって保存組織サンプルから核酸を抽出するステップ;f)組織サンプルから抽出された核酸を増幅するステップであって、対象の核酸を標的にする5’リン酸化オリゴヌクレオチドを使用するステップ;g)増幅された標的核酸のそれぞれにアダプター核酸およびバーコード核酸を含むオリゴヌクレオチドを直接ライゲーションし、それによって、組織サンプル標的核酸を含む標的核酸アンプリコンライブラリーを作製するステップ;h)ライブラリーをシークエンシングするステップ;i)組織サンプル標的核酸配列データおよびデータベース標的核酸配列データを得るステップであって、データベース標的核酸配列データが突然変異データベースにあるステップ;j)サンプル標的核酸配列データが突然変異データベースの登録突然変異を含有するかどうかを決定するために、組織サンプル標的核酸配列データをデータベース標的核酸配列データと比較するステップ;k)突然変異データベースに登録されている突然変異の突然変異対立遺伝子頻度を決定することによって、突然変異データベースに登録されている突然変異の信頼性を決定するステップ;ならびにl)組織サンプル標的核酸配列データが突然変異を含有するかどうかに関しての結果を生成し、それによって突然変異を検出するステップを含む方法が本明細書において提供される。
いくつかの実施形態では、組織消化溶液が、i)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、0.1mM〜5mMの濃度のKHPO、およびTween 20を含む組織消化溶液;ii)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、0.1mM〜5mMの濃度のKHPO、およびTriton-X100を含む組織消化溶液;iii)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、および0.1mM〜5mMの濃度のKHPOを含む組織消化溶液;iv)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、および0.2mM〜200mMの濃度のKClを含む組織消化溶液;v)1mM〜100mMの濃度のHEPESバッファーを含む組織消化溶液;vi)1mM〜100mMの濃度のHEPESバッファーおよびTriton-X100を含む組織消化溶液;vii)1mM〜100mMの濃度のHEPESバッファーおよびTween 20を含む組織消化溶液;viii)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、0.2mM〜200mMの濃度のKCl、およびTriton-X100を含む組織消化溶液;ix)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、0.2mM〜200mMの濃度のKCl、およびTween 20を含む組織消化溶液;ならびにx)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.2mM〜200mMの濃度のKCl、0.1mM〜1mMの濃度のβ−メルカプトエタノール、およびTriton X-100を含む組織消化溶液から選択される。
図1は、本明細書において提供される核酸抽出プロセスのワークフローを示す図である。方法は、速く、効率的で、対費用効果の高い手法でのFFPE組織由来のゲノムDNAの調製を可能にする。他のいくつかの核酸抽出方法と異なり、本明細書において記載される方法は、カラムも有毒化学物質も含まない。ヒートブロックまたは通常のサーマルサイクラー(PCRマシン)しか全プロセスに必要とされない。抽出されたDNAは、それ以上の精製またはステップを必要とせず、下記の実験または遺伝子解析(つまりPCR、qPCR、サンガーシークエンシング、NGSなど)のための準備ができている。 図2は、本明細書において提供される核酸抽出方法(「15分FFPE DNA」法)が、QIAGEN QIAmp(登録商標)DNA FFPE組織キットと比較して、より高い量のゲノムDNAを産出することを示す図である(Picogreenにより定量化)。13人の肺腺癌患者由来の1枚のFFPEスライド切片(5μm厚)をDNA抽出に使用した。三通りの2μlの単離DNAをPicogreen(登録商標)法によって定量化し、15分FFPE DNA法およびQIAGEN QIAmp(登録商標)DNA FFPE組織キットからの調製DNAの収量を比較するために使用した。赤色のバーは、15分FFPE DNA法からのゲノムDNA収量を示し、青色のバーは、QIAmp(登録商標)DNA FFPE組織キットのゲノムDNA収量を示す(A)。 15分FFPE DNAキット法は、QIAmp(登録商標)DNA FFPE組織キットと比較して、より高い量のゲノムDNA(平均値−3.19倍の増加、中央値−2.13倍の増加)を産生する(B)。 図3は、主題の核酸抽出方法(「15分FFPE DNA」法)およびQIAmp(登録商標)DNA FFPE組織キットについてのリアルタイム定量的PCR(qPCR)データ比較を示す図である。等しい量のFFPE組織を、ゲノムDNAを単離するために使用し、同じ容量で溶出した。肺腺癌FFPEサンプル由来の2μlの単離DNA(図2Aに示す)をqPCR解析(qPCRプローブ−RNアーゼ選択遺伝子)に使用した。15分FFPE DNA法から得られたCt(閾値サイクル)は、21〜24サイクルの範囲にわたるが、QIAmp(登録商標)DNA FFPE組織キットから得られたCtは27〜29サイクルの範囲にわたる。これは、15分FFPE DNA法由来のDNAがqPCR解析においてより効率的に増幅されることを示す。この結果は、主題の核酸抽出方法が、組織の量が非常に少ないまたは細胞の数が少ない、難易度の高い生物学的検体にとって、より適しており、かつ理想的であろうということを示す。 図4は、主題の直接増幅およびライゲーション(「NextDay Seq」)アンプリコンサンプルライブラリー調製のワークフローを示す図である。10ngのDNAを、5’リン酸化オリゴを使用して増幅し、精製する。バーコードおよび汎用アダプターを、5’リン酸化オリゴ末端に直接ライゲーションする。最終的な精製ステップにより、鋳型の調製およびシークエンシングの準備ができている標的アンプリコンライブラリーがもたらされる。アンプリコンライブラリー調製におよそ2.5時間を必要とする。 図5Aは、「NextDay Seq」プロセス全体のワークフローを示す図である。これは、FFPE DNA抽出、5’−リン酸化プローブによるサンプルライブラリー調製、ならびに最終的なシークエンシングおよびデータ解析を含む「NextDay Seq」ワークフロー全体を示す。DNA抽出から最終的なデータ解析までのプロセスは、36時間以内に終わる。第1のDNA抽出ステップは、主題の核酸抽出方法(「15分FFPE DNA」法)により実行し、最後のデータ解析ステップは、本明細書において提供される標的核酸における突然変異を検出するための主題の方法(「DanPA」)により実行することに注目されたい。 図5Bは、「NextDay Seq」プロセス全体のワークフローを示す図である。これは、FFPE DNA抽出、5’−リン酸化プローブによるサンプルライブラリー調製、ならびに最終的なシークエンシングおよびデータ解析を含む「NextDay Seq」ワークフロー全体を示す。DNA抽出から最終的なデータ解析までのプロセスは、36時間以内に終わる。第1のDNA抽出ステップは、主題の核酸抽出方法(「15分FFPE DNA」法)により実行し、最後のデータ解析ステップは、本明細書において提供される標的核酸における突然変異を検出するための主題の方法(「DanPA」)により実行することに注目されたい。 図6は、NGSシークエンシングデータの体細胞突然変異スクリーニングのための標的核酸における突然変異を検出するための主題の方法(データベース関連非前処理解析(DanPA))の概略のワークフローを示す図である。この図は、NGSデータから体細胞突然変異を検出するためのDanPAの概略のワークフローを示す。DanPAは、既知のNGS前/後処理ステップ(遺伝子の座位が決められていない配列の再アライメント、デダッピング(dedupping)、インデル再アライメント、塩基クオリティースコアリキャリブレーション、変異スコアリキャリブレーション、および機能予測)をほとんどすべて省いているが、突然変異データベースにおいて標的配列を直接検索することによって突然変異を検出する。一度、標的配列(つまり癌患者DNA配列)が突然変異データベースでマッチしたら、DanPAは、データベースにおける登録突然変異の安定性(つまり、レポート時間およびホモポリマー領域)について検討し、全リードから突然変異対立遺伝子頻度をチェックする(突然変異対立遺伝子頻度の計算)。>300カバレッジデプス(coverage-depth)を有する標的シークエンシングの場合、3%の突然変異対立遺伝子頻度を有する体細胞突然変異を、DanPAによってロバストにも検出することができる。 図7は、DanPAのワークフローについての詳細なアルゴリズムを示す図である。このワークフローは、DanPAが、患者の(または標的DNA)配列を指定されるデータベース(たとえばCOSMIC)における登録突然変異とどのように比較するかを示す。患者の配列が登録突然変異とマッチした場合、DanPAは、対立遺伝子頻度(突然変異体リード/全リード)を計算し、突然変異コールについての統計的有意性をチェックする。標的シークエンシングパネルのすべてのアンプリコンについてこのステップを繰り返すことによって、DanPAは、突然変異のタイプまたは複雑さにかかわらず、速く信頼できる体細胞突然変異データを提供する。 図8は、肺癌患者における体細胞突然変異検出のためのDanPAおよびTorrent Suiteの間の比較を示す図である。2人の肺癌患者の体細胞突然変異解析結果を示す。(A)2つの点突然変異(赤色で示すPDGFRAおよびEGFR)は両方の方法によって検出されたが、EGFR遺伝子の欠失突然変異はDanPAによってのみ検出された(青色)。60人の肺癌患者のスクリーニングでは、単一の欠失または挿入突然変異はTorrent Suiteによって検出されなかったが、すべての突然変異がDanPAによって検出された。偽陽性(FP)コールがTorrent Suiteによって検出されたことに注意されたい。(B)4つの点突然変異(赤色で示す)がDanPAおよびTorrent Suiteの両方によって検出されたが、低対立遺伝子頻度(およそ3%)を有する1つの突然変異(KIT)は、DanPAによってのみ検出され、Torrent Suiteによって見落とされた。 図9は、標的核酸配列における突然変異を検出するための電子ネットワークのブロック図を示す図である。 図10は、いくつかの実施形態によって図9に示される主題のデバイスメモリのブロック図である。 図11は、いくつかの実施形態による、標的核酸配列における突然変異を検出するための方法のフローチャートを示す図である。
組織サンプル(たとえば保存組織サンプル)の遺伝子突然変異を検出するための方法およびシステムが本明細書において提供される。いくつかの実施形態では、方法が、a)保存組織サンプルから核酸を抽出するステップ;b)抽出された核酸の標的核酸アンプリコンライブラリーを調製するステップ;c)組織サンプル標的核酸配列データを作成するために標的核酸アンプリコンライブラリーをシークエンシングするステップ;およびd)標的核酸配列データが突然変異(たとえば特定の疾患についての危険性に関連する突然変異)を含有するかどうかを決定するステップを含む。本明細書において記載される方法は、好都合に、48時間未満で、抽出a)〜決定d)を実行することができる。ある実施形態では、方法が、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、または25時間未満で実行することができる。ある実施形態では、方法が、36時間未満で実行することができる。本明細書において提供される方法およびシステムの態様は、下記に詳細に議論される。
核酸抽出
第1の態様では、組織サンプルから核酸を抽出するための方法が、本明細書において提供される。ある実施形態では、方法が、(a)組織消化混合物を形成するために組織消化溶液と組織サンプルをインキュベートするステップ;(b)1〜30分間80〜110℃で組織消化混合物を加熱するステップ;(c)タンパク質分解混合物を形成するために組織消化混合物にプロテイナーゼを含むプロテイナーゼ溶液を追加するステップ;および1〜30分間50〜70℃でタンパク質分解混合物をインキュベートするステップ;ならびに(d)1〜30分間80〜110℃でタンパク質分解混合物をインキュベートし、それによって保存組織サンプルから核酸を抽出するステップを含む。
本明細書において提供される核酸抽出方法は、組織サンプルから核酸を抽出するための速く効率的な方法を提供する。いくつかの実施形態では、核酸が、デオキシリボ核酸(DNA)である。他の実施形態では、核酸が、リボ核酸(RNA)である。いくつかの実施形態では、DNAが、ゲノムDNAである。他の実施形態では、DNAが、ミトコンドリアDNAである。
主題の方法によって使用されてもよい組織サンプルは、結合組織、筋組織(たとえば平滑筋、骨格筋、および心筋)、神経組織、ならびに上皮組織(たとえば扁平上皮、立方上皮、円柱上皮、腺上皮、および繊毛上皮)を含むが、これらに限定されない。主題の方法によって使用されてもよい組織サンプルは、凍結されたまたは新鮮な組織サンプルを含む。ある実施形態では、組織サンプルが、保存組織サンプルである。本明細書において使用されるように、「保存組織サンプル」は、サンプルの組織ならびに/または高分子(たとえばDNAおよびRNAなどのような核酸)の完全性を保存するために1つまたは複数のプロセスにかけられた対象から単離された組織サンプルである。組織保存のための技術は、ホルマリン固定および低温凍結(deep freezing)を含むが、これらに限定されない。いくつかの実施形態では、保存組織サンプルが、ホルマリン固定パラフィン包埋(FFPE)組織サンプルである。FFPE組織サンプルは、任意の適した技術、たとえばキシレンまたはパラフィン可溶化有機溶媒を使用する技術を使用して、主題の方法による使用に先立って脱パラフィンされてもよい(たとえば米国特許第6,632,598号および米国特許第8,574,868号を参照)。ある実施形態では、保存組織サンプルが、組織消化溶液においてインキュベートするステップ(a)に先立って脱パラフィンされる。特定の実施形態では、保存組織サンプルが、組織消化溶液においてインキュベートするステップ(a)に先立ってキシレン中で脱パラフィンされる。いくつかの実施形態では、保存組織サンプルが、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm厚のFFPEである。
ある実施形態では、核酸抽出方法が、90分以下、60分以下、55分以下、50分以下、45分以下、40分以下、35分以下、30分以下、25分以下、20分以下、15分以下、14分以下、13分以下、12分以下、11分以下、10分以下、9分以下、8分以下、7分以下、6分以下、または5分以下で実行することができる。ある実施形態では、核酸抽出方法が、15分以下で実行することができる。
ある実施形態では、本明細書において提供される核酸抽出方法が、組織消化混合物を形成するために組織消化溶液と保存組織サンプルをインキュベートする第1のステップを含む。組織消化溶液は、塩および/または洗浄剤を含む。主題の核酸抽出方法において使用することができる塩は、NaCl、NaHPO、KHPO、KCl、およびTAPSナトリウム塩を含むが、これらに限定されない。ある実施形態では、消化溶液が、10mM〜140mMの濃度のNaClを含む。ある実施形態では、消化溶液が、0.5mM〜10mMの濃度のNaHPOを含む。いくつかの実施形態では、消化溶液が、0.1mM〜5mMの濃度のKHPOを含む。いくつかの実施形態では、消化溶液が、0.2mM〜200mMの濃度のKClを含む。ある実施形態では、消化溶液が、0.5mM〜25mMの濃度のTAPSナトリウム塩を含む。ある実施形態では、組織消化溶液が、洗浄剤を含む。任意の適した洗浄剤が、組織消化溶液において使用されてもよい。使用されてもよい例示的な洗浄剤は、Triton-X100およびTween 20を含むが、これらに限定されない。
ある実施形態では、組織消化溶液が、10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、0.1mM〜5mMの濃度のKHPO、およびTween 20を含む。
いくつかの実施形態では、組織消化溶液が、10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、0.1mM〜5mMの濃度のKHPO、およびTriton-X100を含む。
いくつかの実施形態では、組織消化溶液が、10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、および0.1mM〜5mMの濃度のKHPOを含む。
いくつかの実施形態では、組織消化溶液が、0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、および0.2mM〜200mMの濃度のKClを含む。
他の実施形態では、組織消化溶液が、1mM〜100mMの濃度のHEPESバッファーを含む。
いくつかの実施形態では、組織消化溶液が、1mM〜100mMの濃度のHEPESバッファーおよびTriton-X100を含む。
他の実施形態では、組織消化溶液が、1mM〜100mMの濃度のHEPESバッファーおよびTween 20を含む。
他の実施形態では、組織消化溶液が、0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、0.2mM〜200mMの濃度のKCl、およびTriton-X100を含む。
他の実施形態では、組織消化溶液が、0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、0.2mM〜200mMの濃度のKCl、およびTween 20を含む。
他の実施形態では、組織消化溶液が、0.5mM〜25mMの濃度のTAPSナトリウム塩、0.2mM〜200mMの濃度のKCl、0.1mM〜1mMの濃度のβ−メルカプトエタノール、およびTriton-X100を含む。
ある実施形態では、組織消化混合物が、組織サンプルの消化を促進するための最適な温度および時間でインキュベートされる。ある実施形態では、組織消化混合物が、60℃、65℃、70℃、75℃、80℃、85℃、90℃、95℃、100℃、105℃、110℃、115℃、または120℃の温度でインキュベートされる。いくつかの実施形態では、組織消化混合物が、60℃〜65℃、65℃〜70℃、70℃〜75℃、75℃〜80℃、80℃〜85℃、85℃〜90℃、90℃〜95℃、95℃〜100℃、100℃〜105℃、105℃〜110℃、110℃〜115℃、または115℃〜120℃の温度でインキュベートされる。いくつかの実施形態では、組織消化混合物が、60℃〜80℃、65℃〜85℃、70℃〜90℃、75℃〜85℃、80℃〜90℃、85℃〜95℃、90℃〜100℃、95℃〜105℃、100℃〜110℃、105℃〜115℃、または110℃〜120℃の温度でインキュベートされる。ある実施形態では、組織消化混合物が、60℃〜90℃、70℃〜100℃、80℃〜110℃、または90℃〜120℃の温度でインキュベートされる。ある実施形態では、組織消化混合物が、80℃〜110℃の温度でインキュベートされる。ある実施形態では、組織消化混合物が、90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃でインキュベートされる。特定の実施形態では、組織消化混合物が、99℃でインキュベートされる。
いくつかの実施形態では、組織消化混合物が、0.5、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、45、または60分間インキュベートされる。ある実施形態では、組織消化混合物が、1〜3、2〜4、3〜5、4〜6、5〜7、6〜8、7〜9、または8〜10分間インキュベートされる。ある実施形態では、組織消化混合物が、1〜10分間、5〜15分間、10〜20分間、15〜25分間、20〜30分間、35〜45分間、40〜50分間、45〜55分間、または50〜60分間インキュベートされる。特定の実施形態では、組織消化混合物が、5分間インキュベートされる。
いくつかの実施形態では、組織消化混合物が、1〜30分間80℃〜110℃でインキュベートされる。いくつかの実施形態では、組織消化混合物が、4〜6分間95℃〜105℃でインキュベートされる。ある実施形態では、組織消化混合物が、5分間99℃でインキュベートされる。
組織消化混合物のインキュベーションの後に、プロテアーゼを含むプロテアーゼ溶液は、タンパク質分解混合物を形成するために組織消化混合物に追加される。タンパク質分解混合物は、タンパク質分解を促進するために所定の時間および温度でインキュベートされる。タンパク質の消化を支援する任意のプロテアーゼが、主題の核酸抽出方法のプロテイナーゼ溶液中に含まれてもよい。使用されてもよい例示的なプロテアーゼは、セリンプロテアーゼ、トレオニンプロテアーゼ、システインプロテアーゼ、アスパラギン酸プロテアーゼ、グルタミン酸プロテアーゼ、メタロプロテアーゼ、またはその組み合わせを含むが、これらに限定されない。
ある実施形態では、プロテアーゼ溶液が、セリンプロテアーゼを含む。セリンプロテアーゼは、セリンが酵素の活性部位で求核性のアミノ酸として果たすタンパク質におけるペプチド結合を切断する酵素である。セリンプロテアーゼは、たとえばトリプシン様プロテアーゼ、キモトリプシン様プロテアーゼ、エラスターゼ様プロテアーゼ、およびサブチリシン様プロテアーゼを含む。例示的なセリンプロテアーゼは、キモトリプシンA、ジペプチターゼE、サブチリシン、ヌクレオポリン、ラクトフェリン、ロンボイド1、およびプロテイナーゼKを含むが、これらに限定されない。いくつかの実施形態では、セリンプロテアーゼが、プロテイナーゼKである。プロテイナーゼKの切断の主な部位は、遮断されたアルファアミノ基を有する脂肪族および芳香族アミノ酸のカルボキシル基に隣接するペプチド結合である。ある実施形態では、プロテイナーゼKが、1〜100mg/ml、2〜90mg/ml、3〜80mg/ml、4〜70mg/ml、または5〜60mg/mlの濃度でプロテアーゼ溶液中に存在する。特定の実施形態では、プロテイナーゼKが、5〜60mg/mlの濃度でプロテアーゼ溶液中に存在する。ある実施形態では、プロテアーゼ溶液が、バッファー(たとえばTris−HCl)および/またはタンパク質変性剤(たとえばEDTA、尿素、もしくはSDS)をさらに含む。
いくつかの実施形態では、プロテアーゼ溶液が、5mg/ml〜60mg/mlの濃度のプロテイナーゼK、1mM〜50mMの濃度のTris−HCl、および0.1〜10mMの濃度のEDTAを含む。いくつかの実施形態では、プロテアーゼが、5mg/ml〜60mg/mlの濃度のプロテイナーゼKおよび1mM〜50mMの濃度のTris−HClを含む。ある実施形態では、プロテアーゼが、5mg/ml〜60mg/mlの濃度のプロテイナーゼKおよび0.1mM〜10mMの濃度のEDTAを含む。ある実施形態では、Tris−HClが、8.0のpHである。
ある実施形態では、タンパク質分解混合物が、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃、または90℃でインキュベートされる。いくつかの実施形態では、タンパク質分解混合物が、30℃〜90℃、40℃〜80℃、または50℃〜70℃の温度でインキュベートされる。いくつかの実施形態では、タンパク質分解混合物が、30℃〜35℃、35℃〜40℃、45℃〜50℃、55℃〜60℃、60℃〜65℃、65℃〜70℃、70℃〜75℃、75℃〜80℃、80℃〜85℃、または85℃〜90℃でインキュベートされる。特定の実施形態では、タンパク質分解混合物が、50℃〜70℃でインキュベートされる。ある実施形態では、タンパク質分解混合物が、60℃でインキュベートされる。
いくつかの実施形態では、タンパク質分解混合物が、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、45、または60分間インキュベートされる。ある実施形態では、タンパク質分解混合物が、1〜3、2〜4、3〜5、4〜6、5〜7、6〜8、7〜9、または8〜10分間インキュベートされる。ある実施形態では、タンパク質分解混合物が、1〜10分間、5〜15分間、10〜20分間、15〜25分間、20〜30分間、35〜45分間、40〜50分間、45〜55分間、または50〜60分間インキュベートされる。特定の実施形態では、タンパク質分解混合物が、5分間インキュベートされる。ある実施形態では、タンパク質分解混合物が、1〜10分間70℃〜50℃でインキュベートされる。ある実施形態では、タンパク質分解混合物が、5分間60℃でインキュベートされる。
タンパク質分解を促進する温度でのタンパク質分解混合物のインキュベーションの後に、タンパク質分解混合物は、タンパク質分解混合物中のプロテアーゼを不活性するために加熱され、それによって保存組織サンプルから核酸を抽出する。ある実施形態では、タンパク質分解混合物が、プロテアーゼを不活性化するために60℃、65℃、70℃、75℃、80℃、85℃、90℃、95℃、100℃、105℃、110℃、115℃、または120℃の温度まで加熱される。いくつかの実施形態では、タンパク質分解混合物が、プロテアーゼを不活性化するために60℃〜65℃、65℃〜70℃、70℃〜75℃、75℃〜80℃、80℃〜85℃、85℃〜90℃、90℃〜95℃、95℃〜100℃、100℃〜105℃、105℃〜110℃、110℃〜115℃、または115℃〜120℃の温度まで加熱される。いくつかの実施形態では、タンパク質分解混合物が、プロテアーゼを不活性化するために60℃〜80℃、65℃〜85℃、70℃〜90℃、75℃〜85℃、80℃〜90℃、85℃〜95℃、90℃〜100℃、95℃〜105℃、100℃〜110℃、105℃〜115℃、または110℃〜120℃の温度まで加熱される。ある実施形態では、タンパク質分解混合物が、プロテアーゼを不活性化するために60℃〜90℃、70℃〜100℃、80℃〜110℃、または90℃〜120℃の温度まで加熱される。ある実施形態では、タンパク質分解混合物が、プロテアーゼを不活性化するために80℃〜110℃の温度まで加熱される。ある実施形態では、タンパク質分解混合物が、プロテアーゼを不活性化するために90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃の温度まで加熱される。特定の実施形態では、タンパク質分解混合物が、99℃の温度まで加熱される。
いくつかの実施形態では、タンパク質分解混合物が、1、2、3、4、5、6、7、8、9、または10分間インキュベートされる。いくつかの実施形態では、タンパク質分解混合物が、1〜10分間、5〜15分間、または10〜20分間インキュベートされる。特定の実施形態では、タンパク質分解混合物が、1〜10分間インキュベートされる。ある実施形態では、タンパク質分解混合物が、5分間インキュベートされる。ある実施形態では、タンパク質分解混合物が、5分間80℃〜110℃でインキュベートされる。特定の実施形態では、タンパク質分解混合物が、5分間99℃でインキュベートされる。
プロテアーゼを変性させ、核酸を抽出するためにタンパク質分解混合物を加熱した後、抽出された核酸は、タンパク質分解混合物から直接使用されてもよいまたは当業者らに知られている任意の適した方法によって、たとえば遠心分離法もしくは沈殿(たとえばエタノール沈殿)の方法によってさらに単離され、精製されてもよい。
主題の方法を使用して抽出された核酸は、種々様々のアプリケーションにおいて使用することができる。ある実施形態では、抽出された核酸は、ポリメラーゼ連鎖反応(PCR)増幅に直接使用することができる(つまりプロテアーゼの変性後にさらなる精製を伴わない)DNAである。特に、主題の方法を使用して調製されるDNAは、900bpよりも大きなPCRアンプリコンを産生するために好都合に使用することができる。いくつかの実施形態では、本明細書において提供される主題の核酸抽出方法が、900bpよりも大きなPCRアンプリコンを産生することができるDNAを産出する。そのような大きなPCRアンプリコンは、たとえば、下記に記載されるものなどのようなアンプリコンライブラリーを生成するために使用することができる。
標的核酸アンプリコンライブラリー
別の態様では、標的核酸アンプリコンライブラリーを作製するための方法が、本明細書において提供される。本明細書において使用されるように、「標的核酸アンプリコンライブラリー」は、サンプルから(たとえば主題の抽出方法を使用して組織サンプルから抽出された核酸から)増幅された1つまたは複数の標的核酸を含有する複数の核酸を指し、これは、シークエンシングに使用することができる(たとえば、次世代シークエンシング(NGS)などのような高処理シークエンス)。いくつかの実施形態では、標的核酸が、疾患(たとえば癌)についての危険性に関連する1つまたは複数の突然変異体遺伝子座を含有する。いくつかの実施形態では、方法が、(a)標的核酸アンプリコンを産生するために、対象の核酸(たとえば、癌などのような疾患についての危険性に関連する1つまたは複数の突然変異遺伝子座を含む核酸)を標的にするオリゴヌクレオチドプライマーペアを使用して組織サンプルから抽出された核酸を増幅するステップならびに(b)標的核酸アンプリコンライブラリーを作製するために、標的核酸アンプリコンのそれぞれにアダプター核酸および/またはバーコード核酸を含むオリゴヌクレオチドを直接ライゲーションするステップを含む。本明細書において記載される主題の標的核酸アンプリコンライブラリー方法は、好都合に、標的核酸アンプリコンライブラリー構築のための迅速な方法を提供する。特に、主題の標的核酸アンプリコンライブラリーは、4時間未満で、3.5時間未満で、3時間未満で、2.5時間未満で、または2時間未満で組織サンプルから抽出された核酸から構築することができる。ある実施形態では、標的核酸アンプリコンライブラリーが、2.5時間未満で作製することができる。
いくつかの実施形態では、方法が、標的核酸アンプリコンを産生するために、対象の核酸を標的にするオリゴヌクレオチドプライマーペアを使用して、組織サンプルから抽出された核酸を増幅する第1のステップを含む。核酸は、SDS−プロテイナーゼK、フェノール−クロロホルム、塩析、クロマトグラフィーベース、磁気ビーズベース、デンドリマーベース、またはマトリックスミル(matrix mill)核酸抽出技術を含むが、これらに限定されない、任意の適した技術を使用して、組織サンプルから抽出することができる。ある実施形態では、核酸が、本明細書において記載される主題の核酸抽出方法を使用して、組織サンプルから抽出される。
任意の標的核酸を、本明細書において記載される主題の標的核酸アンプリコンライブラリー産生方法のために標的にすることができる。いくつかの実施形態では、標的核酸が、50bp長よりも大きい、100bp長よりも大きい、150bp長よりも大きい、200bp長よりも大きい、250bp長よりも大きい、300bp長よりも大きい、350bp長よりも大きい、400bp長よりも大きい、450bp長よりも大きい、500bp長よりも大きい、550bp長よりも大きい、600bp長よりも大きい、650bp長よりも大きい、700bp長よりも大きい、750bp長よりも大きい、800bp長よりも大きい、850bp長よりも大きい、900bp長よりも大きい、950bp長よりも大きい、または1,000bp長よりも大きい。
いくつかの実施形態では、増幅するステップ(a)が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1,000、2,000、3,000、4,000、5,000、またはそれ以上の対象の標的核酸を増幅することを含む。
ある実施形態では、対象の標的核酸が、疾患についての危険性に関連する1つまたは複数の遺伝子座を含む。いくつかの実施形態では、標的核酸が、癌についての危険性に関連する1つまたは複数の遺伝子座を含む。癌標的核酸は、膀胱癌、脳癌、乳癌、結腸癌、肝臓癌、卵巣癌、腎臓癌、肺癌、腎臓癌、結腸直腸癌、膵臓癌、および前立腺癌ならびに血液の癌(たとえば白血病)に関連するものを含むが、これらに限定されない。ある実施形態では、標的核酸が、肺癌、結腸直腸癌、および/または全癌(pan-cancer)(つまり多発癌の集まりもしくは組み合わせ)標的核酸である。
標的核酸は、下記の疾患に関連する1つまたは複数の遺伝子座を含み得る:軟骨発育不全症、X連鎖副腎白質ジストロフィー、X連鎖無ガンマグロブリン血症、アラジール症候群、アルファ−サラセミアX連鎖精神遅滞症候群、アルツハイマー病、早期発症家族性アルツハイマー病、筋萎縮性側索硬化症概説、アンドロゲン不感性症候群、アンゲルマン症候群、遺伝性運動失調症総論、毛細血管拡張性運動失調症、ベッカー型筋ジストロフィー、同じくジストロフィン異常症、ベックウィズ−ヴィーデマン症候群、ベータ−サラセミア、ビオチニダーゼ欠乏症、鰓弓耳腎症候群、BRCA1およびBRCA2遺伝性CADASIL、キャナヴァン病、癌、シャルコー−マリー−トゥース遺伝性ニューロパチー、シャルコー−マリー−トゥースニューロパチー1型、シャルコー−マリー−トゥースニューロパチー2型、シャルコー−マリー−トゥースニューロパチー4型、シャルコー−マリー−トゥースニューロパチーX型、コケーン症候群、先天性拘縮性クモ指症、頭蓋骨早期癒合症候群(FGFR関連)、嚢胞性線維症、シスチン蓄積症、聴覚障害および遺伝性難聴、DRPLA(歯状核赤核淡蒼球ルイ体萎縮症)、ディジョージ症候群(同じく22q11欠失症候群)、X連鎖拡張型心筋症、ダウン症(トリソミー21)、デュシェンヌ型筋ジストロフィー(同じくジストロフィン異常症)、早期発症原発性ジストニー(DYT1)、ジストロフィン異常症、後側弯型エーラス−ダンロス症候群、血管型エーラス−ダンロス症候群、単純型表皮水疱症、遺伝性多発性外骨腫症、顔面肩甲上腕筋ジストロフィー、第V因子ライデン栓友病(Factor V Leiden Thrombophilia)、家族性大腸腺腫症(FAP)、家族性地中海熱、脆弱X症候群、フリートライヒ運動失調、17番染色体に連鎖しパーキンソニズムを伴う前頭側頭型認知症、ガラクトース血症、ゴーシェ病、遺伝性ヘモクロマトーシス、血友病A、血友病B、遺伝性出血性毛細血管拡張、非症候性難聴および聴覚障害、DFNA(コネキシン26)、非症候性難聴および聴覚障害、DFNB 1(コネキシン26)、遺伝性痙性対麻痺、ヘルマンスキー−プドラック症候群、ヘキソサミニダーゼA欠乏症(同じくテイ−サックス)、ハンチントン病、低軟骨形成症、常染色体劣性先天性魚鱗癬、色素失調症、ケネディ病(同じく脊髄球性筋萎縮症)、クラッベ病、レーバー遺伝性視神経萎縮症、レッシュ−ナイハン症候群白血病、リー−フラウメニ症候群、肢帯筋ジストロフィー、家族性リポタンパク質リパーゼ欠乏症、滑脳症、マルファン症候群、MELAS(ミトコンドリア脳筋症、乳酸アシドーシス、および脳卒中様エピソード)、モノソミー、多発性内分泌腺腫2型、多発性外骨腫症、先天性遺伝性筋ジストロフィー、筋緊張性ジストロフィー、腎性尿崩症、神経線維腫症1、神経線維腫症2、圧迫麻痺性遺伝性ニューロパシーニーマン−ピック病C型、ナイミーヘン染色体不安定症候群、ノリー病、眼皮膚白皮症1型、眼咽頭型筋ジストロフィー、パリスター−ホール症候群、パーキン型若年性パーキンソン病、ペリツェウス−メルツバッハー病、ペンドレッド症候群、ポイツ−ジェガース症候群フェニルアラニンヒドロキシラーゼ欠乏症、プラダー−ウィリー症候群、PROP1関連複合下垂体ホルモン欠損症(CPHD)、色素性網膜炎、網膜芽細胞腫、ロートムント−トムソン症候群、スミス−レムリ−オピッツ症候群、遺伝性痙性対麻痺、脊髄球性筋萎縮症(同じくケネディ病)、脊髄筋萎縮症、脊髄小脳失調1型、脊髄小脳失調2型、脊髄小脳失調3型、脊髄小脳失調6型、脊髄小脳失調7型、スティックラー症候群(遺伝性関節眼疾患)、テイ−サックス(同じくGM2ガングリオシド症)、トリソミー、結節性硬化症、アッシャー症候群I型、アッシャー症候群II型、口蓋心顔面症候群(同じく22q11欠失症候群)、フォンヒッペル−リンダウ症候群、ウィリアムズ症候群、ウィルソン病、X連鎖副腎白質ジストロフィー、X連鎖無ガンマグロブリン血症、X連鎖拡張型心筋症(同じくジストロフィン異常症)、ならびにX連鎖低緊張顔貌精神遅滞症候群(X-Linked Hypotonic Facies Mental Retardation Syndrome)。
いくつかの実施形態では、標的核酸が、癌についての危険性に関連する1つまたは複数の遺伝子座を含む。癌標的核酸は、膀胱癌、脳癌、乳癌、結腸癌、肝臓癌、腎臓癌、肺癌、腎臓癌、結腸直腸癌、膵臓癌、および前立腺癌ならびに血液の癌(たとえば白血病)に関連するものを含むが、これらに限定されない。ある実施形態では、標的核酸が、肺癌または結腸直腸癌または全癌標的核酸である。いくつかの実施形態では、組織サンプルから抽出された核酸を増幅するステップ(a)が、下記の表1、表2、または表3に開示される、1つまたは複数のオリゴヌクレオチドプライマーペアを使用して実行される。表1、2、および3は、それぞれ、肺癌、結腸直腸癌、および2つ以上のタイプの癌(つまり「全癌」パネル)に関連する遺伝子座を含有する標的核酸のアンプリコンライブラリーの調製に有用なプライマーペアパネルを提供する。ある実施形態では、オリゴヌクレオチドプライマーペアのオリゴヌクレオチドのそれぞれが、リン酸化5’末端を含む。リン酸化5’末端を有するオリゴヌクレオチドプライマーペアは、好都合に、標的核酸アンプリコンへのオリゴヌクレオチド、バーコードオリゴヌクレオチド、アダプターオリゴヌクレオチド、またはその組み合わせの直接的なライゲーションを可能にする。標的核酸アンプリコンの5’末端にライゲーションすることができる例示的なオリゴヌクレオチドは、標的核酸アンプリコンのシークエンシングを容易にするための1つまたは複数のエレメント(たとえばバーコードおよび汎用アダプター)を含むオリゴヌクレオチドを含む。
ある実施形態では、標的核酸アンプリコンライブラリーを作製するための主題の方法が、標的核酸アンプリコンのそれぞれのリン酸化5’末端へのオリゴヌクレオチドのライゲーションに先立って、増幅された標的核酸アンプリコンを精製するステップを含む。任意の適した技術が、増幅された標的核酸アンプリコンを精製するために使用することができ、エタノール/イソプロパノール沈殿および濾過/アフィニティーカラム技術を含む。
いくつかの実施形態では、方法が、アダプター核酸および/またはバーコード核酸を含むオリゴヌクレオチドを、増幅された標的核酸のそれぞれのリン酸化5’末端に直接ライゲーションし、それによって標的核酸アンプリコンライブラリーを作製するステップをさらに含む。本明細書において使用されるように、「直接ライゲーションする」、「直接的なライゲーション」、およびその他同種のものは、酵素またはライゲーションのための増幅された標的核酸の5’末端の調製(たとえば末端ポリッシング(end-polishing))がない、オリゴヌクレオチドのライゲーションのプロセスを指す。ある実施形態では、直接ライゲーションするステップが、増幅された標的核酸のそれぞれのリン酸化5’末端への、アダプター核酸を含むオリゴヌクレオチドのライゲーションを含む。本明細書において使用されるように、「アダプター核酸」は、たとえばエマルジョンPCRによって特定の標的核酸アンプリコンのクローン増幅を可能にする核酸配列を含有するオリゴヌクレオチドである。ある実施形態では、アダプター配列が、エマルジョンPCRにおいて使用されるビーズに結合されるオリゴヌクレオチドの配列に対して相補的である。ある実施形態では、アダプター配列が、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40ヌクレオチド長である。他の実施形態では、直接ライゲーションするステップが、増幅された標的核酸のそれぞれのリン酸化5’末端への、バーコード核酸を含むオリゴヌクレオチドのライゲーションを含む。本明細書において使用されるように、「バーコード配列」は、プールされた標的核酸アンプリコンライブラリーのシークエンシング(たとえばマルチプレックスシークエンシング、たとえばSmith et al. Nucleic Acids Res., 38(13): el42 (2010)を参照)の間に、異なるサンプル(たとえば異なる組織サンプル)由来の標的核酸アンプリコンを互いに識別することを可能にする核酸配列である。ある実施形態では、バーコード配列が、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40ヌクレオチド長である。他の実施形態では、直接ライゲーションするステップが、増幅された標的核酸のそれぞれのリン酸化5’末端への、アダプター核酸およびバーコード核酸を含むオリゴヌクレオチドのライゲーションを含む。
標的核酸アンプリコンライブラリーの構築の後に、ライブラリーは、標的核酸配列データを産生するために当技術分野において知られている任意の方法を使用してシークエンシングされてもよい。ある実施形態では、標的核酸アンプリコンライブラリーが、当技術分野において知られている任意の次世代シークエンシング(NGS)方法を使用してシークエンシングされる。NGSシークエンシング法は、一分子リアルタイムシークエンシング(たとえばPacific Bio)、イオン半導体法(Ion Torrentシークエンシング)、ピロシーケンス(たとえば454 Life Sciences)、合成によるシークエンシング(たとえばIlluminaシークエンシングおよび一分子リアルタイム(たとえばSMRT)シークエンシング)、ライゲーションによるシークエンシング(たとえばSOLiDシークエンシング)、連鎖停止シークエンシング(たとえばサンガーシークエンシング)、ビーズベースのシークエンシング(たとえば超並列シグネチャシークエンシング(massively parallel signature sequencing)(MPSS))、ポロニーシークエンシング(polony sequencing)、DNAナノボール(nanoball)シークエンシング、heliscope一分子シークエンシング(たとえばHeilscope Biosciences)を含むが、これらに限定されない。
遺伝子突然変異解析
標的核酸アンプリコンライブラリーのシークエンシングの後に、標的核酸配列は、遺伝子突然変異の検出のために解析にかけることができる。本明細書において提供される別の態様では、組織サンプル標的核酸配列における突然変異を検出するための方法であって、a)組織サンプル標的核酸配列データおよびデータベース標的核酸配列データを得るステップであって、データベース標的核酸配列データが突然変異データベースにあるステップ;b)サンプル標的核酸配列データが突然変異データベースの登録突然変異を含有するかどうかを決定するために、組織サンプル標的核酸配列データをデータベース標的核酸配列データに対して比較するステップ;c)突然変異データベースに登録されている突然変異の突然変異対立遺伝子頻度を決定することによって、突然変異データベースに登録されている突然変異の信頼性を決定するステップ;ならびにd)組織サンプル標的核酸配列データが突然変異を含有するかどうかに関しての結果を生成し、それによって突然変異を検出するステップを含む方法が本明細書において提供される。
突然変異の検出のための主題の方法は、あらゆるタイプの遺伝子突然変異を決定するために使用することができる。ある実施形態では、方法が、遺伝子突然変異データベースに登録されている点突然変異、欠失、挿入、増幅、または任意の他の突然変異を検出するために使用される。いくつかの実施形態では、方法が、Catalogue of Somatic Mutations in Cancer(COSMIC、http://cancer.sanger.ac.uk/cancergenome/projects/cosmic/)、ClinVar(http://www.ncbi.nlm.nih.gov/clinvar/)、および/もしくはOnline Mendelian Inheritance in Man(OMIM、http://www.omim.org)ならびに/または任意の変異(突然変異)データベースに登録されている遺伝子突然変異の検出のためのものである。
ある実施形態では、検出のために主題の方法において使用される組織サンプル標的核酸シークエンスデータが、前処理されていないデータである。本明細書において使用されるように、「前処理されたデータ」は、遺伝子の座位が決められていない配列の再アライメント、重複排除データ処理、インデル再アライメント、塩基クオリティースコアキャリブレーション、変異スコアリキャリブレーション、および/または機能予測にかけられたデータを指す。ある実施形態では、比較するステップb)が、前処理されていない組織サンプル標的核酸配列データを使用して実行される。
ある実施形態では、主題の方法が、2日、1日、12時間、6時間、5時間未満で、4時間未満で、3時間未満で、2時間未満で、1時間未満で、または30分未満で組織サンプル標的核酸配列における突然変異の検出を可能にする。特定の実施形態では、主題の方法が、1時間未満で組織サンプル標的核酸配列における突然変異の検出を可能にする。
別の態様では、1つまたは複数のプロセッサ、メモリ、および1つまたは複数のプログラムを含むコンピューティングシステムであって、1つまたは複数のプログラムが、メモリに保存されており、組織サンプル標的核酸配列の突然変異を検出するために1つまたは複数のプロセッサによって実行されるように構成されており、1つまたは複数のプログラムが、組織サンプル標的核酸配列における突然変異を検出するための命令であって、a)組織サンプル標的核酸配列データおよびデータベース標的核酸配列データを得るステップであって、データベース標的核酸配列データが突然変異データベースにあるステップ;b)サンプル標的核酸配列データが突然変異データベースの登録突然変異を含有するかどうかを決定するために、組織サンプル標的核酸配列データをデータベース標的核酸配列データに対して比較するステップ;c)突然変異データベースに登録されている突然変異の突然変異対立遺伝子頻度を決定することによって、突然変異データベースに登録されている突然変異の信頼性を決定するステップ;ならびにd)組織サンプル標的核酸配列データが突然変異を含有するかどうかに関しての結果を生成し、それによって突然変異を検出するステップを含む命令を含むコンピューティングシステムが本明細書において提供される。
図9は、いくつかの実施形態による遺伝子突然変異の検出のための電子ネットワーク100の図である。ネットワーク100は、通信経路によって相互に接続される一連のポイントまたはノードを含む。ネットワーク100は、他のネットワークと相互に接続されてもよく、サブネットワークを含有してもよく、ローカルエリアネットワーク(LAN)、メトロポリタンエリアネットワーク(MAN)、ワイドエリアネットワーク(WAN)、またはグローバルネットワーク(インターネット)を介して具体化されてもよい。そのうえ、ネットワーク100は、WAP(無線アプリケーションプロトコル)、TCP/IP(伝送制御プロトコル/インターネットプロトコル)、NetBEUI(NetBIOS拡張ユーザインタフェース)、またはIPX/SPX(網間パケット交換/シーケンストパケットエクスチェンジ)などのような使用されるプロトコルのタイプによって特徴付けられてもよい。そのうえ、ネットワーク100は、音声、データ、または両方の種類のシグナルを伝えるかどうかによって;だれがネットワーク100を使用することができるかによって(公的なものか私的なものか);およびその接続(たとえばダイアルアップ、専用、交換、非交換、または仮想接続)の通常の性質によって特徴付けられてもよい。
ネットワーク100は、少なくとも1つの遺伝子突然変異解析サーバ102に複数のユーザデバイス110を接続する。この接続は、イントラネット、無線ネットワーク、セルラデータネットワーク、または好ましくはインターネットを含んでもよい通信ネットワークまたは電子ネットワーク106を介してなされる。接続は、通信リンク108を介してなされ、これは、たとえば同軸ケーブル、銅線(PSTN、ISDN、およびDSLを含むが、これらに限定されない)、光ファイバー、無線、マイクロ波、または衛星リンクであってもよい。デバイスおよびサーバの間の通信は、好ましくは、インターネットプロトコル(IP)または任意選択で安全な同期プロトコルを介して行われるが、その代わりに、電子メール(eメール)を介して行われてもよい。
遺伝子突然変異解析サーバ102は、図9に示され、ユーザデバイス110とは異なるものとして下記に記載される。遺伝子突然変異解析サーバ102は、少なくとも1つのデータ処理装置または中央処理装置(CPU)212、サーバメモリ220、(任意選択の)ユーザインタフェースデバイス218、通信インタフェース回路216、およびこれらのエレメントを相互に接続する少なくとも1つの母線214を含む。サーバメモリ220は、通信、データ処理、データアクセス、データ保存、データ検索などのための命令を格納するオペレーティングシステム222を含む。サーバメモリ220はさらに、リモートアクセスモジュール224および突然変異データベース226を含む。いくつかの実施形態では、リモートアクセスモジュール224が、遺伝子突然変異解析サーバ102および通信ネットワーク106の間でデータを通信する(送信および受信)ために使用される。いくつかの実施形態では、突然変異データベース226が、登録された遺伝子突然変異を含み、かつ本明細書において提供されるコンピューティングシステムの1つまたは複数のプログラム(たとえば遺伝子突然変異を検出するためのプログラム)によって使用することができる突然変異データベース標的核酸配列データを格納するために使用される。ある実施形態では、突然変異データベース226が、特定の疾患に関連する登録された遺伝子突然変異を含有する突然変異データベース標的核酸配列データを含む。いくつかの実施形態では、遺伝子突然変異データベースが、Catalogue of Somatic Mutations in Cancer(COSMIC)、ClinVar、および/もしくはOMIMならびに/または任意の変異(突然変異)データベースに登録されている遺伝子突然変異を含む。
いくつかの実施形態では、ユーザデバイス110が、標的核酸が突然変異(たとえば疾患に関連する突然変異)を有するかどうかを決定しているユーザによって使用されるデバイスである。ユーザデバイス110は、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、ハンドヘルドコンピュータ、タブレットコンピュータ、スマートフォン、またはその他同種のものなどのような遠隔のクライアントコンピューティングデバイスを介して通信ネットワーク106にアクセスする。いくつかの実施形態では、ユーザデバイス110が、遺伝子突然変異解析サーバ102に関して記載されるものと同様のデータ処理装置または中央処理装置(CPU)、ユーザインタフェースデバイス、通信インタフェース回路、および母線を含む。主題のデバイス110はさらに、下記に記載されるメモリ120を含む。メモリ220および120は、ランダムアクセスメモリ(RAM)などのような揮発性メモリおよびハードディスクまたはフラッシュメモリなどのような不揮発性メモリの両方を含んでいてもよい。
図10は、いくつかの実施形態によって図9に示されるユーザデバイスメモリ120のブロック図である。主題のデバイスメモリ120は、オペレーティングシステム122およびサーバメモリ220(図1)のリモートアクセスモジュール224(図1)と互換性があるリモートアクセスモジュール124を含む。
いくつかの実施形態では、ユーザデバイスメモリ120が、遺伝子突然変異解析モジュール126を含む。遺伝子突然変異解析モジュール126は、下記に詳述されるように、標的核酸配列における遺伝子突然変異を検出するための命令を含む。いくつかの実施形態では、遺伝子突然変異解析モジュール126が、標的核酸配列における遺伝子突然変異を検出するための1つまたは複数のモジュールを含む。たとえば、いくつかの実施形態では、ユーザデバイスメモリ120中に含まれる遺伝子突然変異解析モジュール126が、獲得モジュール128、比較モジュール130、決定モジュール132、および生成モジュール134を含む。
いくつかの実施形態では、ユーザデバイスメモリ120がさらに、突然変異データベース140を含む。ある実施形態では、突然変異データベース140が、特定の疾患に関連し、かつ下記に記載されるようなコンピューティングシステムの検出の方法において使用される登録された遺伝子突然変異を含有する突然変異データベース標的核酸配列データを含む。いくつかの実施形態では、遺伝子突然変異データベースが、Catalogue of Somatic Mutations in Cancer(COSMIC)、ClinVar、および/もしくはOMIMならびに/または任意の変異(突然変異)データベースに登録されている遺伝子突然変異を含む。
いくつかの実施形態では、ユーザデバイスメモリ120がさらに、サンプル標的核酸配列データベース142を含む。いくつかの実施形態では、サンプル標的核酸配列データベースが、本明細書において記載される主題の方法を使用して保存組織サンプルから得られた標的核酸配列データを含有する。
上記に記載される様々なデータベースが、それらの内容に容易にアクセスし、管理し、更新することができるような手法で編成されたそれらのデータを有することに注目されたい。データベースは、たとえば、フラットファイルデータベース(表の形態を取るデータベース、1つの表のみをそれぞれのデータベースに使用することができる)、関係データベース(データが、多くの異なる方法で再編成し、かつアクセスすることができるように定義される表のデータベース)、またはオブジェクト指向データベース(オブジェクトクラスおよびサブクラスで定義されるデータと適合するデータベース)を含む。データベースは、一つのサーバ上で動作してもよいまたは複数のサーバに分散していてもよい。いくつかの実施形態では、突然変異データベース226があり、突然変異データベース140はない。
図11は、主題のコンピューティングシステムのいくつかの実施形態による、標的核酸(たとえば、本明細書において記載される方法を使用して保存組織サンプルから得られ、増幅された標的核酸)における突然変異の検出のための方法300を示すフローチャートである。いくつかの実施形態では、方法が、本明細書において記載される主題のコンピュータシステムの1つまたは複数のプログラムによって実行される。
いくつかの実施形態では、方法が、(a)サンプル標的核酸配列データおよび突然変異データベース標的核酸配列データを得るステップ300;(b)サンプル標的核酸配列データが登録突然変異を含有するかどうかを確立するために、組織サンプル標的核酸配列データを突然変異データベース標的核酸配列データと比較するステップ310;(c)突然変異データベースに登録されている突然変異の突然変異対立遺伝子頻度を決定することによって、突然変異データベースに登録されている突然変異の信頼性を決定するステップ320;ならびに(d)組織サンプル標的核酸配列データが突然変異を含有するかどうかに関しての結果を生成し、それによって突然変異を検出するステップ330を含む。
いくつかの実施形態では、標的核酸における突然変異を検出するための方法が、サンプル標的核酸配列データおよび突然変異データベース標的核酸配列データを得るステップ300を含む。本明細書において提供されるコンピューティングシステムのある実施形態では、得るステップ(a)が、ユーザデバイス110のユーザデバイスメモリ120に格納される獲得モジュール128に含まれる命令によって実行される。ある実施形態では、突然変異データベース標的核酸配列データが、遺伝子突然変異解析サーバ102のサーバメモリ220に格納される突然変異データベース226から得られる。ある実施形態では、突然変異データベース標的核酸配列データが、ユーザデバイス110のユーザデバイスメモリ120に格納される突然変異データベース140から得られる。本明細書において使用されるように、「突然変異データベース標的核酸配列データ」は、突然変異データベースに格納される特定の標的核酸に関する任意の核酸配列データを指す。例示的な突然変異データベースは、Catalogue of Somatic Mutations in Cancer(COSMIC)、ClinVar、およびOnline Mendelian Inheritance in Man(OMIM,http://www.omim.org)を含むが、これらに限定されない。ある実施形態では、突然変異データベース140または226が、特定の疾患に関連する突然変異を含有する。いくつかの実施形態では、遺伝子突然変異データベースが、Catalogue of Somatic Mutations in Cancer(COSMIC)に登録される遺伝子突然変異を含む。ある実施形態では、サンプル標的核酸配列データが、遺伝子の座位が決められていない配列の再アライメント、重複排除、インデル再アライメント、塩基クオリティースコアキャリブレーション、変異スコアリキャリブレーション、および/または機能予測にかけられていない(つまり、前処理にかけられていない)。
ある実施形態では、得るステップ(a)300の後に、方法が、サンプル標的核酸配列データが登録突然変異を含有するかどうかを確立するために、組織サンプル標的核酸配列データを突然変異データベース標的核酸配列データと比較するステップ310を含む。本明細書において提供されるコンピューティングシステムのある実施形態では、比較するステップ(b)が、ユーザデバイス110のユーザデバイスメモリ120に格納される比較モジュール130に含まれる命令によって実行される。いくつかの実施形態では、組織サンプル標的核酸配列データが、遺伝子突然変異データベース140または226における10以上、20以上、30以上、40以上、50以上、60以上、70以上、80以上、90以上、100以上、150以上、200以上、250以上、300以上、350以上、400以上、450以上、500以上、600以上、700以上、800以上、900以上の個々の突然変異データベース標的核酸配列「リード」と、サンプル標的核酸配列データが遺伝子突然変異データベース140または226における登録突然変異である突然変異を含有するかどうかを決定するために、比較される。
サンプル標的核酸配列データが突然変異データベース140または226における登録突然変異である突然変異を含有することが認められる場合、登録突然変異の信頼性がさらに決定される。ある実施形態では、方法が、(c)突然変異データベースに登録されている突然変異の突然変異対立遺伝子頻度を決定することによって、突然変異データベースに登録されている突然変異の信頼性を決定するステップ320を含む。本明細書において提供されるコンピューティングシステムのある実施形態では、決定するステップ(c)が、ユーザデバイス110のユーザデバイスメモリ120に格納される決定モジュール132に含まれる命令によって実行される。ある実施形態では、登録突然変異が閾値突然変異対立遺伝子頻度を上回って存在する場合、登録突然変異が信頼できることが決定される。いくつかの実施形態では、登録突然変異が比較するステップ(b)310において突然変異データベース標的核酸配列「リード」の合計の閾値パーセンテージを上回って存在する場合、登録突然変異が信頼できることが決定される。いくつかの実施形態では、登録突然変異が比較するステップ(b)において突然変異データベース標的核酸配列「リード」の合計の1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、または70%を上回って存在する場合、登録突然変異が信頼できることが決定される。ある実施形態では、決定モジュール132が、登録突然変異を含有する突然変異データベース標的核酸配列「リード」の数を数え、静学モデルのアルゴリズムを選択し、P値を決定し、かつ結果をフィルターにかけることによって、登録突然変異が信頼できるかどうかを決定する。
ある実施形態では、方法が、決定するステップ(c)の後に、(d)組織サンプル標的核酸配列データが突然変異を含有するかどうかに関しての結果を生成し、それによって突然変異を検出するステップ330を含む。本明細書において提供されるコンピューティングシステムのある実施形態では、生成するステップ(d)が、ユーザデバイス110のユーザデバイスメモリ120に格納される生成モジュール134に含まれる命令によって実行される。
実施例1:核酸抽出方法
核酸抽出、特にDNAの速く単純な方法は、最低量のFFPE組織の収量および質を最大限にするために開発した。特に、核酸抽出方法は、15分以下での核酸の抽出を可能にする(「15分FFPE DNAキット」)。さらに、ほとんどの他の市販のFFPE核酸抽出方法と異なり、新たな方法は、2つの溶液(溶液AおよびB)以外にカラムも専用の材料も使用しない。
図1の概略のワークフローにおいて示されるように、この方法は、単純なヒートブロックまたは通常のサーマルサイクラーを備えたあらゆる実験室または設備で使用することができる。脱パラフィンFFPE組織切片を5分間99℃で溶液Aとインキュベートし、次いでさらに5分間60℃で溶液Bとインキュベートする。5分間の99℃での最終的なインキュベーションにより、高い収量および質のDNAが産生される。図2は、提供される核酸抽出方法が、市場をリードするQIAGEN QIAmp(登録商標)DNA FFPE組織キットと比較して、より高い量のDNAを産出したことを示す。13人の肺腺癌患者由来のそれぞれ1枚のFFPEスライド切片(5μm厚)をDNA抽出に使用した。Picogreen(登録商標)法を、「15分FFPE DNAキット」およびQIAGEN QIAmp(登録商標)DNA FFPE組織キットから調製したDNAを定量化するために使用した。赤色のバーは、「15分FFPE DNAキット」からのゲノムDNA収量を示し、青色のバーは、QIAmp(登録商標)DNA FFPE組織キットのゲノムDNA収量を示す(A)。「15分FFPE DNAキット」は、QIAmp(登録商標)DNA FFPE組織キットと比較して、より高い量のゲノムDNA(平均値−3.19倍の増加、中央値−2.13倍の増加)を産生する(B)。
図3は、15分FFPE DNAキットから抽出された核酸を、任意のPCRベースの(つまり定量的PCR(qPCR)、サンガーシークエンシング、および次世代シークエンシング)または遺伝子解析に使用することができることを示す。等しい量のFFPE組織を、ゲノムDNAを単離するために使用し、同じ容量で溶出した。肺腺癌FFPEサンプル由来の2μlの単離DNA(図2Aに示す)をqPCR解析(qPCRプローブ−RNアーゼ選択遺伝子)に使用した。15分FFPE DNAキットから得られたCt(閾値サイクル)は、21〜24サイクルの範囲にわたったが、QIAmp(登録商標)DNA FFPE組織キットから得られたCtは27〜29サイクルの範囲にわたる。これは、15分FFPE DNAキット由来のDNAがqPCR解析においてより効率的に増幅されることを示した。
たった1枚の5μm厚のFFPEスライドから、2ugまでのDNAを得ることができる。この方法はさらに、qPCRおよび大きなサイズのPCR(1kb超)分析に非常に効率的である。ほとんどの他の知られている市販の方法と異なり、「15分FFPE DNAキット」は、大きなアンプリコンの解析を可能にし、これは、FFPEサンプル解析をより柔軟にし、また臨床遺伝子解析において適用可能にする。
実施例2:核酸アンプリコン調製方法
「NextDay Seq」と呼ばれる単純でロバストなサンプルアンプリコン調製方法は、サンプル到着の翌日以内に標的ディープシークエンシングデータ(targeted deep sequencing data)を得るのを可能にするために開発した。手短に言えば、研究者および医学博士は、所与のサンプル(つまりホルマリン固定パラフィン包埋(FFPE)組織サンプル)のDNA抽出、ライブラリー調製、シークエンシング、およびデータ解析から始めて、36時間以内にシークエンシングデータを得ることができる。
本明細書では、5’リン酸化オリゴヌクレオチドを使用することによる標的遺伝子またはアンプリコンのマルチプレックス増幅と直接的なライゲーション方法(図4および5)。このプロトコルは、標的領域の酵素消化もハイブリダイゼーションも必要としない。本明細書において記載される直接的な増幅およびライゲーションの方法で使用するために、ヒト肺(表1)、結腸直腸(表2)、および全癌における治療フォーカスとして共通して突然変異している遺伝子を標的にするプローブ配列をデザインする標的NGSパネルを開発した。さらに、そのようなアンプリコン調製方法は、対象の遺伝子を標的にするプローブ配列を修飾することによって任意の癌または遺伝子のパネルに応用することができる。
結論:
新たなロバストな標的NGS方法は、患者の検体の鍵となる突然変異データを臨床医および研究者にできるだけ早く提供するために開発された。これは、そのような臨床医および研究者が、どの治療上の選択肢(テーラーメイド医療)またはどの生物学的アプリケーションが特異的な突然変異を有する患者を治療するのに最適かを決定するのを助けることができる。たとえば、このアプリケーションは、EGFR遺伝子における、腫瘍が動因となっている、薬剤感受性の突然変異を検出するための肺癌検体のスクリーニングとすることができ、これにより、チロシンキナーゼ阻害剤(TKI、つまりゲフィチニブまたはエルロチニブ)治療の恩恵を患者が受けることができる。本明細書において記載されるDNA抽出キットおよび突然変異体解析のためのコンピューティングシステムを組み合わせることによって、アンプリコン調製方法は、36時間(翌日)以内に患者、医学博士、および研究者に鍵となる突然変異データを提供することができるであろう。
実施例3:次世代シークエンシング(NGS)のデータベース関連非前処理解析(DanPA)
方法論/主な成果:速く、正確で、ロバストなNGSデータ解析を提供するDanPAと呼ばれる新たなデータ解析ツール。DanPAは、エクソームまたはゲノム全体のシークエンシングデータ解析にも使用することができるが、主として標的シークエンシング解析のために開発された。DanPAは、最も大きくロバストな癌突然変異データベースであるCatalogue Of Somatic Mutations In Cancer(COSMIC)などのようなデータベースに登録されたあらゆる種類の報告されている突然変異を検出する(図6および7)。COSMICには150万を超える登録突然変異があり、任意のさらなるデータベースを突然変異スクリーニングのためにDanPAに接続することができる(図6)。したがって、これらのデータベースに登録されていないいかなる遺伝的変異または突然変異も、臨床上のまたは生物学的効果が非常にわずかである、非病原性のまたは非常にまれな突然変異となるであろうと見なされる。必要であれば、さらなるまたは新たな突然変異(おそらくある疾患におけるその生物学的および臨床上の役割を証明した後で)を突然変異データベースに容易に追加することができる。
典型的なNGSデータ解析プロセスは、NGSデータ解析の「前処理」と呼ばれる数ステップ(遺伝子の座位が決められていない配列の再アライメント、重複排除、インデル再アライメント、および塩基クオリティースコアリキャリブレーション)から構成される。主として大規模のNGSデータ解析のために開発されたいくつかのNGSデータ解析ツール(つまりSAMtools、GATK、Picard、およびTorrent Suite/Reporter)がある。これらのプログラムは、各前処理ステップに異なるアルゴリズムを使用するが、それらは、一般に下記のステップに従って作動する:遺伝子の座位が決められていない配列の再アライメント、重複排除、インデル再アライメント、および塩基クオリティースコアリキャリブレーション。DanPAはこれらの前処理ステップを省き、突然変異の検出のための指定データベースに接続する。したがって、あらゆる種類の登録突然変異を、DanPAによってロバストに検出することができる。最も良い例は、EGFR遺伝子のエクソン19欠失である。この遺伝子の正確な突然変異情報は、癌患者における臨床上の決定にとって重要であり必須である。エクソン19欠失またはL858R突然変異などのようなEGFR突然変異を有する肺癌患者は、チロシンキナーゼ阻害剤(TKI)、ゲフィチニブまたはエルロチニブに応答性である。しかしながら、エクソン19欠失は、15bpを超える欠失またはさらに欠失および挿入(インデル)の両方の組み合わせとなる傾向があり、これは、他のNGS解析プログラムによって検出するのが非常に難しい。さらに、2つの主要な市販のシークエンシングプラットフォームのうちの1つであるIon Torrentシステムは、EGFRエクソン19突然変異のような(複雑な)挿入および欠失の検出に関して重大な問題を有する。しかしながら、Ion TorrentデータにDanPAを適用すると、これらの種類の複雑な突然変異を検出する問題は、それらがデータベースに登録されている限りなかった。DanPAおよびTorrent Suite(Ion Torrentによってサポートされる公認データ解析プログラム)を使用する比較データを図8に示す。突然変異の検出におけるさらにもう1つのDanPAの大きな利点は、それがデータベース登録突然変異のみを選択するので、偽陽性コールまたはシークエンシングエラーが劇的に低下することである。NGSがホモポリマー領域において高い偽陽性率を有することが知られている。DanPAが、指定のカットオフレベル(対立遺伝子頻度:つまり3%の突然変異対立遺伝子頻度)でデータベースに直接接続することによって突然変異を検出するので、それらの偽陽性突然変異コールのほとんどが取り除かれて、明確な体細胞突然変異のみが検出される。
表4および5は、本明細書において記載される、次世代シークエンシングおよびDanPAを使用するデータ解析が続く、主題の「NextDay Seq」直接増幅およびライゲーションアンプリコンサンプルライブラリー調製を利用する別の実験を要約する。表4は、実験において使用される臨床上のおよび生物学的サンプルの概要を提供し、表5は、実験において使用される866FFPEサンプルから発見された突然変異の概要を提供する。
結論:突然変異データベースに直接接続された新たなNGSデータ解析プログラム、DanPAを開発した。このツールは、1時間以内にNGSデータの突然変異解析を処理することができるが、他のプログラムは少なくとも1日を超えてしまう。速いデータ解析は、他のNGS解析プログラムにおいて日常的に使用される前処理ステップをほとんどすべて省くので、有効である。DanPAの精度もまた、試験したプログラム(GATK、Torrent SuiteおよびReporter、ならびにSAMtools)の中で最も良い。そのうえ、DanPAは、NGSアプリケーション(とりわけIon Torrentシークエンサーにおける)に関連する2つの問題を解決する:偽陰性(つまりEGFR遺伝子のインデルおよび長いbpの欠失)ならびに偽陽性(つまりホモポリマー領域における欠失または挿入)。この最も速く、最も単純で、最も正確なNGS解析プログラムは、臨床医および研究者が、ヒト疾患または任意のライフサイエンス分野において意味のある臨床マーカーおよび遺伝子メカニズムを同定するのを助けるであろう。

Claims (10)

  1. 保存組織サンプルから核酸を抽出するための方法であって、
    (a)組織消化混合物を形成するために組織消化溶液と前記保存組織サンプルをインキュベートするステップであって、前記組織消化溶液が、
    (i)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、0.1mM〜5mMの濃度のKHPO、およびTween 20を含む組織消化溶液;
    (ii)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、0.1mM〜5mMの濃度のKHPO、およびTriton-X100を含む組織消化溶液;
    (iii)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、および0.1mM〜5mMの濃度のKHPOを含む組織消化溶液;
    (iv)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、および0.2mM〜200mMの濃度のKClを含む組織消化溶液;
    (v)1mM〜100mMの濃度のHEPESバッファーを含む組織消化溶液;
    (vi)1mM〜100mMの濃度のHEPESバッファーおよびTriton-X100を含む組織消化溶液;
    (vii)1mM〜100mMの濃度のHEPESバッファーおよびTween 20を含む組織消化溶液;
    (viii)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、0.2mM〜200mMの濃度のKCl、およびTriton-X100を含む組織消化溶液;
    (ix)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、0.2mM〜200mMの濃度のKCl、およびTween 20を含む組織消化溶液;ならびに
    (x)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.2mM〜200mMの濃度のKCl、0.1mM〜1mMの濃度のβ−メルカプトエタノール、およびTriton−X−100を含む組織消化溶液
    からなる群から選択されるステップ、
    (b)1〜30分間80〜110℃で前記組織消化混合物を加熱するステップ;
    (c)タンパク質分解混合物を形成するために前記組織消化混合物にプロテイナーゼを含むプロテアーゼ溶液を追加し、1〜30分間50〜70℃で前記タンパク質分解混合物をインキュベートするステップ;ならびに
    (d)1〜30分間80〜110℃で前記タンパク質分解混合物をインキュベートし、それによって前記保存組織サンプルから核酸を抽出するステップ
    を含む方法。
  2. 前記プロテアーゼ溶液が、
    (a)5mg/ml〜60mg/mlの濃度のプロテイナーゼK、1mM〜50mMの濃度のTris−HCl(pH8.0)、および0.1〜10mMの濃度のEDTAを含むプロテアーゼ溶液;
    (b)5mg/ml〜60mg/mlの濃度のプロテイナーゼKおよび1mM〜50mMの濃度のTris−HCl(pH 8.0)を含むプロテアーゼ溶液;
    (c)5mg/ml〜60mg/mlの濃度のプロテイナーゼKおよび0.1mM〜10mMの濃度のEDTAを含むプロテアーゼ溶液;
    (d)5mg/ml〜60mg/mlの濃度のプロテイナーゼKを含むプロテアーゼ溶液;ならびに
    (e)5mg/ml〜60mg/mlの濃度のプロテイナーゼK、0.2mM〜50mMの濃度のTris−HCl(pH8.0)、0.1mM〜10mMの濃度のCaCl、および20%〜70%の濃度のグリセロールを含むプロテアーゼ溶液
    からなる群から選択される、請求項1に記載の方法。
  3. 前記加熱するステップ(b)が、5分間99℃である、請求項1に記載の方法。
  4. 前記タンパク質分解混合物をインキュベートするステップ(c)が、5分間60℃である、請求項1に記載の方法。
  5. 前記タンパク質分解混合物をインキュベートするステップ(d)が、5分間99℃である、請求項1に記載の方法。
  6. 組織サンプルから標的核酸アンプリコンライブラリーを作製するための方法であって、
    (a)組織サンプルから抽出された核酸を増幅するステップであって、対象の核酸を標的にする5’リン酸化オリゴヌクレオチドを使用するステップ;ならびに
    (b)前記増幅された標的核酸のそれぞれにアダプター核酸およびバーコード核酸を含むオリゴヌクレオチドを直接ライゲーションし、それによって標的核酸アンプリコンライブラリーを作製するステップ
    を含む方法。
  7. オリゴヌクレオチドを直接ライゲーションする(b)前に(a)の前記増幅された標的核酸を精製するステップをさらに含む、請求項6に記載の方法。
  8. 配列データを前処理せずに組織サンプル標的核酸配列の突然変異を検出するための方法であって、
    (a)組織サンプル標的核酸配列データおよびデータベース標的核酸配列データを得るステップであって、前記データベース標的核酸配列データが突然変異データベースにあるステップ;
    (b)前記サンプル標的核酸配列データが前記突然変異データベースの登録突然変異を含有するかどうかを決定するために、前記組織サンプル標的核酸配列データを前記データベース標的核酸配列データと比較するステップ;
    (c)前記突然変異データベースに登録されている前記突然変異の突然変異対立遺伝子頻度を決定することによって、前記突然変異データベースに登録されている前記突然変異の信頼性を決定するステップ;ならびに
    (d)前記組織サンプル標的核酸配列データが突然変異を含有するかどうかに関しての結果を生成し、それによって前記突然変異を検出するステップ
    を含む方法。
  9. 1つまたは複数のプロセッサ;
    メモリ;および
    1つまたは複数のプログラム
    を含むコンピューティングシステムであって、前記1つまたは複数のプログラムが、前記メモリに保存されており、組織サンプル標的核酸配列の突然変異を検出するために前記1つまたは複数のプロセッサによって実行されるように構成されており、前記1つまたは複数のプログラムが、組織サンプル標的核酸配列における突然変異を検出するための命令であって、
    (a)組織サンプル標的核酸配列データおよびデータベース標的核酸配列データを得るステップであって、前記データベース標的核酸配列データが突然変異データベースにあるステップ;
    (b)前記サンプル標的核酸配列データが前記突然変異データベースの登録突然変異を含有するかどうかを決定するために、前記組織サンプル標的核酸配列データを前記データベース標的核酸配列データと比較するステップ;
    (c)前記突然変異データベースに登録されている前記突然変異の突然変異対立遺伝子頻度を決定することによって、前記突然変異データベースに登録されている前記突然変異の信頼性を決定するステップ;ならびに
    (d)前記組織サンプル標的核酸配列データが突然変異を含有するかどうかに関しての結果を生成し、それによって前記突然変異を検出するステップ
    を含む命令を含む、コンピューティングシステム。
  10. 保存組織サンプル由来の核酸が突然変異を有するかどうかを決定するための方法であって、
    (a)組織消化混合物を形成するために組織消化溶液と前記保存組織サンプルをインキュベートするステップであって、前記組織消化溶液が、
    (i)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、0.1mM〜5mMの濃度のKHPO、およびTween 20を含む組織消化溶液;
    (ii)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、0.1mM〜5mMの濃度のKHPO、およびTriton-X100を含む組織消化溶液;
    (iii)10mM〜140mMの濃度のNaCl、0.5mM〜10mMの濃度のNaHPO、および0.1mM〜5mMの濃度のKHPOを含む組織消化溶液;
    (iv)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、および0.2mM〜200mMの濃度のKClを含む組織消化溶液;
    (v)1mM〜100mMの濃度のHEPESバッファーを含む組織消化溶液;
    (vi)1mM〜100mMの濃度のHEPESバッファーおよびTriton-X100を含む組織消化溶液;
    (vii)1mM〜100mMの濃度のHEPESバッファーおよびTween 20を含む組織消化溶液;
    (viii)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、0.2mM〜200mMの濃度のKCl、およびTriton-X100を含む組織消化溶液;
    (ix)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.05mM〜5mMの濃度のDTT、0.2mM〜200mMの濃度のKCl、およびTween 20を含む組織消化溶液;ならびに
    (x)0.5mM〜25mMの濃度のTAPSナトリウム塩、0.2mM〜200mMの濃度のKCl、0.1mM〜1mMの濃度のβ−メルカプトエタノール、およびTriton−X−100を含む組織消化溶液
    からなる群から選択されるステップ、
    (b)1〜30分間80〜110℃で前記組織消化混合物を加熱するステップ;
    (c)タンパク質分解混合物を形成するために前記組織消化混合物にプロテイナーゼを含むプロテイナーゼ溶液を追加するステップ;および1〜30分間50〜70℃で前記タンパク質分解混合物をインキュベートするステップ;
    (d)1〜30分間80〜110℃で前記タンパク質分解混合物をインキュベートし、それによって前記保存組織サンプルから核酸を抽出するステップ;
    (e)前記組織サンプルから抽出された核酸を増幅するステップであって、対象の核酸を標的にする5’リン酸化オリゴヌクレオチドを使用するステップ;
    (f)前記増幅された標的核酸のそれぞれにアダプター核酸およびバーコード核酸を含むオリゴヌクレオチドを直接ライゲーションし、それによって、組織サンプル標的核酸を含む標的核酸アンプリコンライブラリーを作製するステップ;
    (g)前記ライブラリーをシークエンシングするステップ;
    (h)組織サンプル標的核酸配列データおよびデータベース標的核酸配列データを得るステップであって、前記データベース標的核酸配列データが突然変異データベースにあるステップ;
    (i)前記サンプル標的核酸配列データが前記突然変異データベースの登録突然変異を含有するかどうかを決定するために、前記組織サンプル標的核酸配列データを前記データベース標的核酸配列データと比較するステップ;
    (j)前記突然変異データベースに登録されている前記突然変異の突然変異対立遺伝子頻度を決定することによって、前記突然変異データベースに登録されている前記突然変異の信頼性を決定するステップ;ならびに
    (k)前記組織サンプル標的核酸配列データが突然変異を含有するかどうかに関しての結果を生成し、それによって前記突然変異を検出するステップ
    を含む方法。
JP2017516722A 2014-09-26 2015-09-28 遺伝子突然変異の検出のための方法およびシステム Pending JP2017529855A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462056314P 2014-09-26 2014-09-26
US62/056,314 2014-09-26
PCT/US2015/052672 WO2016049638A1 (en) 2014-09-26 2015-09-28 Methods and systems for detection of a genetic mutation

Publications (1)

Publication Number Publication Date
JP2017529855A true JP2017529855A (ja) 2017-10-12

Family

ID=55582159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017516722A Pending JP2017529855A (ja) 2014-09-26 2015-09-28 遺伝子突然変異の検出のための方法およびシステム

Country Status (8)

Country Link
US (1) US20160098516A1 (ja)
EP (1) EP3198039A4 (ja)
JP (1) JP2017529855A (ja)
KR (1) KR20170064541A (ja)
CN (1) CN107250376A (ja)
AU (1) AU2015319806A1 (ja)
CA (1) CA2962782A1 (ja)
WO (1) WO2016049638A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106835292B (zh) 2017-04-05 2019-04-09 北京泛生子基因科技有限公司 一步法快速构建扩增子文库的方法
CN107419009B (zh) * 2017-06-27 2021-01-05 迈基诺(重庆)基因科技有限责任公司 一种检测胃肠道间质瘤相关基因突变的试剂盒及其应用
CN108342452A (zh) * 2018-02-02 2018-07-31 湖北省农业科学院畜牧兽医研究所 一种用于微量细胞中基因快速检测的方法及应用
CA3160441A1 (en) * 2019-11-15 2021-05-20 Phase Genomics Inc. Chromosome conformation capture from tissue samples
WO2022240762A1 (en) * 2021-05-10 2022-11-17 University Of Iowa Research Foundation Targeted massively parallel sequencing for screening of genetic hearing loss and congenital cytomegalovirus- associated hearing loss
CN114657243A (zh) * 2022-05-12 2022-06-24 广州知力医学诊断技术有限公司 用于检测遗传性抗凝蛋白缺乏、纤维蛋白原异常高频基因突变的引物、试剂盒

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5470722A (en) * 1993-05-06 1995-11-28 University Of Iowa Research Foundation Method for the amplification of unknown flanking DNA sequence
GB2369822A (en) * 2000-12-05 2002-06-12 Genovar Diagnostics Ltd Nucleic acid extraction method and kit
US7805253B2 (en) * 2004-08-31 2010-09-28 Dh Technologies Development Pte. Ltd. Methods and systems for discovering protein modifications and mutations
JP2008541761A (ja) * 2005-05-31 2008-11-27 インヴィトロジェン コーポレーション パラフィン含有試料からの核酸の分離及び精製
EP1777291A1 (en) * 2005-10-20 2007-04-25 Fundacion para la Investigacion Clinica y Molecular del Cancer de Pulmon Method for the isolation of mRNA from formalin fixed, paraffin-embedded tissue
EP4148142A1 (en) * 2012-05-21 2023-03-15 The Scripps Research Institute Methods of sample preparation
WO2014052551A1 (en) * 2012-09-28 2014-04-03 Cepheid Methods for dna and rna extraction from fixed paraffin-embedded tissue samples

Also Published As

Publication number Publication date
EP3198039A4 (en) 2018-03-21
WO2016049638A1 (en) 2016-03-31
AU2015319806A1 (en) 2017-04-20
KR20170064541A (ko) 2017-06-09
CN107250376A (zh) 2017-10-13
CA2962782A1 (en) 2016-03-31
US20160098516A1 (en) 2016-04-07
EP3198039A1 (en) 2017-08-02

Similar Documents

Publication Publication Date Title
Kapp et al. A fast and efficient single-stranded genomic library preparation method optimized for ancient DNA
US11667965B2 (en) Sequence assembly
Tomaszkiewicz et al. A time-and cost-effective strategy to sequence mammalian Y Chromosomes: an application to the de novo assembly of gorilla Y
Hedegaard et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue
Orlando et al. True single-molecule DNA sequencing of a pleistocene horse bone
JP2017529855A (ja) 遺伝子突然変異の検出のための方法およびシステム
CN107368705B (zh) 分析生物体的基因组dna的方法和计算机系统
US20220348906A1 (en) Methods and compositions for analyzing nucleic acid
US20140129201A1 (en) Validation of genetic tests
CN115927563A (zh) 用于分析修饰的核苷酸的组合物和方法
López-Girona et al. CRISPR-Cas9 enrichment and long read sequencing for fine mapping in plants
Cole et al. Genome-wide mapping of nucleosomes in yeast using paired-end sequencing
Langevin et al. Peregrine: a rapid and unbiased method to produce strand-specific RNA-Seq libraries from small quantities of starting material
Streva et al. Sequencing, identification and mapping of primed L1 elements (SIMPLE) reveals significant variation in full length L1 elements between individuals
Shin et al. Targeted short read sequencing and assembly of re-arrangements and candidate gene loci provide megabase diplotypes
US20180305683A1 (en) Multiplexed tagmentation
US20230235394A1 (en) Chimeric amplicon array sequencing
Wang et al. Genotyping by sequencing and data analysis: RAD and 2b‐RAD sequencing
Gao et al. HITAC-seq enables high-throughput cost-effective sequencing of plasmids and DNA fragments with identity
Aga et al. Genetic Polymorphism and Disease
WO2018026576A1 (en) Genomic analysis of cord blood
Dash et al. Sequence analysis and secondary structure prediction of autosomal STR alleles using next generation sequencing (NGS) data
KR20220106153A (ko) 표적 분석과 관련된 조성물, 세트, 및 방법
Cowley Comparison of bioinformatics tools and transcriptome sequencing methodologies for optimal annotation of fungal genomes
US20170073739A1 (en) Sample retrieval and genetic analysis thereof