JP6091613B2 - ハプロタイプの決定およびハプロタイプのフェージングのための方法およびシステム - Google Patents

ハプロタイプの決定およびハプロタイプのフェージングのための方法およびシステム Download PDF

Info

Publication number
JP6091613B2
JP6091613B2 JP2015522158A JP2015522158A JP6091613B2 JP 6091613 B2 JP6091613 B2 JP 6091613B2 JP 2015522158 A JP2015522158 A JP 2015522158A JP 2015522158 A JP2015522158 A JP 2015522158A JP 6091613 B2 JP6091613 B2 JP 6091613B2
Authority
JP
Japan
Prior art keywords
nucleic acid
modified
sequencing
sequence
synthetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015522158A
Other languages
English (en)
Other versions
JP2015522289A (ja
Inventor
リガッティ ロベルト
リガッティ ロベルト
バウテル ジョナサン
バウテル ジョナサン
Original Assignee
イルミナ ケンブリッジ リミテッド
イルミナ ケンブリッジ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イルミナ ケンブリッジ リミテッド, イルミナ ケンブリッジ リミテッド filed Critical イルミナ ケンブリッジ リミテッド
Publication of JP2015522289A publication Critical patent/JP2015522289A/ja
Application granted granted Critical
Publication of JP6091613B2 publication Critical patent/JP6091613B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L7/00Heating or cooling apparatus; Heat insulating devices
    • B01L7/52Heating or cooling apparatus; Heat insulating devices with provision for submitting samples to a predetermined sequence of different temperatures, e.g. for treating nucleic acid samples
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/125Bisulfite(s)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Wood Science & Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Computing Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Clinical Laboratory Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本出願は、2012年7月18日付け出願の米国仮特許出願第61/673052号に対する優先権を主張し、ここに参照することによってそれをそっくりそのまま組み入れる。
ヒトゲノムプロジェクトの努力はヒトゲノムに向けてより一層広い機会を開いた。さらに、ヒトゲノムを解き明かすための作業が進行中である。HapMap(ハップマップ)〔Haplotype Map(ハプロタイプマップ)〕プロジェクトは、特定の疾患のない人々からのゲノム情報を、その疾患を有する者と比較することによって、疾患につながる遺伝的変異を発見することに向けたグローバルな科学的努力である。対立遺伝子で、特定の遺伝子のためのDNA配列の一以上の形態は、一以上の異なる遺伝的変異を含むことができる。ハプロタイプ、または特定の染色体上で、異なる場所、または遺伝子座での対立遺伝子の組合せを識別することは、ハップマッププロジェクトの主要な焦点である。それらの二つのグループが異なる識別されたハプロタイプは、疾患を引き起こす遺伝子異常の場所に相関する可能性がある。このように、ハップマップの結果は、ヒトにおける遺伝的変異の共通のパターン、およびそれらの変動が潜在的に疾患と相関しているかどうかを説明するのに役立つ。ハプロタイプを決定することにおける研究努力は、ヒトでの遺伝的変異の共通のパターンおよびそれらの変異が潜在的に特定の疾患と相関しているかどうかを明らかにするのに役立つ。実際、多くの研究者は、ゲノムをハプロタイピング(ハプロタイプ決定)することが、表現型および疾患に対する遺伝的変異の関連では、必須とは言わないまでも、有利であることを認める。さらに、特定のハプロタイプは、処置計画の成功または失敗に相関することがあり、そしてそうして、それは臨床医が、特定の個体のために、その個体における疾患の根絶での成功の最も高い度合を有する可能性がある治療計画について決定することで役立たせるのに有用でありうる。
しかし、ゲノムのハプロタイピングに関連した多くの技術的課題がある。たとえば、次世代シーケンシング技術は、シーケンシングの取り組みの能力および精度を向上させながら、多くの場合、短いシーケンスリードを招き、たとえば、いくつかの商業上のプラットフォームは、現在のところ、400未満のヌクレオチド長さであるフラグメントリードあたりに出力される。染色体上に位置する二以上の遺伝的変異が、シーケンスリードの長さに比べてさらに離れている場合、たとえそのリード長が数千もの塩基対の長さであっても、不可能ではないにしても、ハプロタイプを定義することが困難な場合がある。このように、必要とされることは、ハプロタイピングを、特に、DNAの一部分のシーケンシングされた長さに比べそれらが見出される際に染色体上で遠く離れている遺伝的変異について可能にする方法および組成物である。
簡単なサマリー
次世代シーケンシングに関連したシーケンシング技術は短いシーケンスリードをもたらすことができ、それによって、興味があるシーケンスは、それらがシーケンスリードの長さによって設けられた窓の外にあるように、染色体上で十分離れて配置されるとき、ゲノムのハプロタイプフェージングを決定することが困難となる。
本開示は、ゲノムサンプルのハプロタイピングおよび/または核酸中に組み込まれる合成多形性を用いるハプロタイプのフェージングの決定のための方法および組成物を提供する。ここに記載するように、核酸フラグメントは、ネイティブなヌクレオチドを、合成または人工的な多形性に、たとえば、一塩基多型(SNPs)、または他の遺伝的異常などのようなものに変換するように修飾することができ、それによって、シーケンシングされる核酸フラグメントにおいて操作された多形性のパターンが生成される。シーケンシングの後、合成多形性のパターンは、フラグメント間で整列させることができ、およびハプロタイプはアラインメントの結果として決定することができる(例は、ハプロタイプのコンテンツまたはフェーズを決定することができる)。このようにして、ゲノムのサンプル由来の修飾されたフラグメントの集団をハプロタイピングすることは、たとえハプロタイピングのためのアレル(対立遺伝子)が異なるゲノムのフラグメント上に存在しても可能である。
核酸シーケンスにおいて人工的な多形性を作り出すためにここに提供される方法および組成物は、ハプロタイプの決定および特徴付け、および/またはハプロタイプフェージングのための特定の有用性を見出すが、しかしながら、それらはまた、他の目的のために有利でありうる。たとえば、ここに説明する方法はまた、デノボ(新規)シーケンスのアセンブリを容易にするために使用することができた。さらに、ほぼ同一であるリピート(繰り返し)領域、たとえば、リピートされるヌクレオチド領域で、たとえば、ショートタンデムリピート、インターメディエート(中間)タンデムリピートなどのようなもの等は、法医学的DNAフィンガープリンティングのために使用されるように、人工的に導入された多形性の独特なパターン、そしてこのようにして達成されたより一層正確なシーケンスアセンブリによって互いから区別することができる。たとえば、法医学的シーケンシングのために、ヌクレオチドリピート領域の長さ、混ぜられたリピート領域の順序、および/またはリピートの数(すなわち、ショートタンデムリピート、中間タンデムリピート、等)の決定は、ここに説明する方法を用いて、リピート領域が、それらを、シングルで、またはペア形成された末端(エンド)、シーケンスリードにおいて十分にシーケンシングすることができないように十分に長い場合に行うことができる。
ハプロタイプの決定および/またはハプロタイプフェージング、デノボシーケンシング、法医学的目的、等のためにここに開示される方法を実践することは、たとえば、病気および治療上のレジメンの相関のために有用な重要情報を提供することができる。具体的には、ハプロタイプおよびそれらのフェーズの決定は、個体のハプロタイプが疾患と相関しないことがあるだけでなく、また特定の個体について処置レジメンの成功およびその他の同様なものと相関することができる個別化医療(オーダーメイド医療において重要になりうる。
一具体化(一実施形態)において、本開示は、核酸サンプル(試料)のシーケンス(配列)を決定するための方法を提供し、それには、複数の合成多形性を含むように修飾された第一の長さの複数の核酸のフラグメント(断片)を提供すること、複数の合成多形性を含む前記第一の複数の核酸フラグメントからのフラグメントの第一の長さのものよりも短い第二の長さの核酸の第二の複数のフラグメントを含む核酸ライブラリーを用意すること、前記核酸ライブラリーをシーケンシング(配列決定)すること、およびアラインメント(整列化)に基づいて核酸サンプルのシーケンスを決定するために、シーケンシングされたフラグメントの間で複数の合成多形性を整列(位置合せ)させることが含まれる。ある場合には、合成多形性は、特定の位置にてネイティブ(自然)なヌクレオチドを置換する複数の修飾ヌクレオチドであり、および修飾ヌクレオチドは、8-オキソグアニン、dPTP、イソシトシンおよびイソグアニンからなる群より選ばれる。他の場合、核酸に対する修飾には、前記複数の核酸フラグメントにおけるシトシンの部分的な、および不完全なビスルフィット(亜硫酸水素塩)変換が含まれる。若干の場合、合成多形成アラインメントには、第一の核酸フラグメントシーケンスにおける合成多形性のパターンを第二の核酸フラグメントシーケンスにおける合成多形性の同様なパターンとマッチングさせること(すなわち、コンピュータ実行法によって)、および前記マッチングを複数の核酸フラグメントシーケンスにより繰り返すことが含まれ、それによって複数の核酸フラグメントにおいて複数の合成多形性に基づくシーケンスアラインメントが作り出される。若干の場合、核酸ライブラリーは、合成によるシーケンス、ハイブリダイゼーションによるシーケンス、ライゲーション、単一分子シーケンシング、ナノポアシーケンシング、ピロシーケンシングおよびポリメラーゼ連鎖反応によるシーケンスからなる群より選ばれる方法を用いてシーケンシングされる。若干の場合、シーケンスは蛍光検出によって決定される。好ましい場合、決定されたシーケンスには、一またはそれよりも多く(一以上)のハプロタイプが含まれ、およびさらに、核酸サンプルにおいて二以上のハプロタイプのフェーズ(相)を決定することが含まれる。しばしば、フェージング(位相整合)のためのハプロタイプは、異なってシーケンシングされたフラグメント上に位置する。上記に開示される方法はまた、デノボシーケンシングのために使用することができる。
別の実施形態において、本出願は、核酸サンプルの一以上のハプロタイプを特徴付けるための方法を開示し、それには、フラグメント化された核酸のプールを提供すること、前記プールのフラグメント化された核酸において複数の合成多形性、たとえば、一塩基多型のようなものを、複数の合成多形性が含まれるフラグメントを生成するために導入すること、複数の修飾された核酸が含まれるフラグメントの元のプールのものよりも長さが短い核酸フラグメントのライブラリーを用意すること、ライブラリーにおいて核酸フラグメントをシーケンシングすること、シーケンシングされた核酸フラグメントの合成多形性を整列させること、およびシーケンス決定されたフラグメントの整列させた合成多形性からの核酸サンプルの一以上のハプロタイプを特徴付けることが含まれる。若干の場合、複数の合成一塩基多型は、組込みの部位にて自然ヌクレオチドを置換し、および複数の修飾ヌクレオチドが含まれる。若干の場合、修飾ヌクレオチドは、8-オキソグアニン、イソシトシン、イソグアニンおよびdPTPからなる群より選ばれる。若干の場合、合成多形性の導入は、核酸フラグメントにおけるシトシンの部分的な、および不完全なビスルフィット変換が含まれる。若干の場合、合成多形性は、第一の核酸フラグメントシーケンスにおける合成多形性のパターンを第二の核酸フラグメントにおける合成多形性の同様なパターンとマッチングさせること(すなわち、コンピュータ実行方法によって)、および前記マッチングを複数の核酸フラグメントシーケンスにおいて繰り返すことによって整列され、それによってシーケンシングされた核酸フラグメントにおいて合成多形性からのシーケンスアラインメントが作り出される。若干の場合、シーケンシングは、合成によるシーケンス、ハイブリダイゼーションによるシーケンス、ライゲーション、単一分子シーケンシング、ナノポアシーケンシング、ピロシーケンシングおよびポリメラーゼ連鎖反応によるシーケンスの一つによって実行される。若干の場合、シーケンスは蛍光検出により決定される。若干の場合、シーケンスは、核酸サンプルにおいて二以上のハプロタイプのフェーズを決定するために用いられる。しばしば、フェージング(位相整合)のためのハプロタイプは、異なったシーケンシングされたフラグメント上に位置することが多い。他の場合、上述の方法はデノボシーケンシングのために使用することができる。
別の実施形態では、本開示は、核酸サンプルの一以上のハプロタイプを識別するための方法を説明し、それには、複数のヌクレオチドをもつ核酸分子を提供すること、複数のヌクレオチドを核酸分子において修飾すること、それにより、自然なヌクレオチドおよび修飾されたヌクレオチドを含む修飾された核酸分子が提供されること、第一の長さの複数の修飾された核酸コピーを生成させるために、修飾された核酸分子を増幅させること、第二の長さの核酸フラグメントのライブラリーを生成させるような条件下に増幅された修飾核酸コピーをフラグメント化することであり、そこでは、ライブラリーにおける個々の核酸フラグメントは、ライブラリーにおいて少なくとも一つの他の核酸フラグメントとのシーケンスオーバーラップの領域をもち、およびそこでは、シーケンスオーバーラップの領域には、少なくとも一つの修飾されたヌクレオチドが含まれること、ライブラリーの核酸フラグメントのシーケンスを決定すること、および核酸フラグメントのシーケンスを、核酸分子の一以上のハプロタイプを識別するために、シーケンスオーバーラップの領域において修飾されたヌクレオチドの位置によって整列させることが含まれる。若干の場合、核酸分子には、シーケンスの長さに従っていくつかの異なるヌクレオチドタイプが含まれ、および一つのヌクレオチドタイプは修飾された核酸において修飾されえ、または一つのタイプのヌクレオチドのすべては、修飾された核酸において修飾されうる。若干の場合、一つのタイプのヌクレオチドのサブセットだけが、修飾された核酸において修飾される。若干の場合、ハプロタイプを識別するための方法には、核酸分子において少なくとも二つのハプロタイプのためのフェーズを定めることが含まれる。しばしば、フェージングのためのハプロタイプは、異なったシーケンシングされたフラグメント上に位置することが多い。ハプロタイピング(ハプロタイプ決定)について若干の場合、核酸分子には、シーケンスの長さに従っていくつかの異なるヌクレオチドタイプが含まれ、そこでは、少なくとも二つのハプロタイプはヌクレオチドタイプの二つのための二対立遺伝子(両アレル)であり、および第三のヌクレオチドタイプは修飾された核酸において修飾される。他の場合、少なくとも二つのハプロタイプはA、TおよびGからなる群より選ばれるヌクレオチドタイプのための二対立遺伝子であり、およびCは修飾された核酸においてUに修飾される。他の場合、少なくとも二つのハプロタイプはTおよびGのための二対立遺伝子であり、およびCは修飾された核酸においてUに修飾される。追加の実施形態において、少なくとも二つのハプロタイプはA、TおよびCからなる群より選ばれるヌクレオチドタイプのための二対立遺伝子であり、およびGは修飾された核酸において8-オキソ-Gに修飾される。他の場合、少なくとも二つのハプロタイプはCおよびTのための二対立遺伝子であり、およびGは修飾された核酸において8-オキソ-Gに修飾される。
修飾ヌクレオチド8-オキソグアニン(8-オキソG)をDNAに組み込み、それによってシーケンスにおける天然のヌクレオチドがシーケンスにおける合成多形性に変換されることについての実施形態を示す。 図1-1と同様である。 DNAにおけるシトシンのウラシルへの部分的な亜硫酸水素ナトリウム変換によって合成多形性をポリヌクレオチドに組み込むための実施形態を示す。 図2-1と同様である。 自然ヌクレオチドの代わりにDNAに修飾されたヌクレオチドのイソシトシンおよびイソグアニンを組み込むことによってポリヌクレオチドに合成多型を組み込むための実施形態を描く。 図3-1と同様である。 標的DNAが亜硫酸水素ナトリウム変換方法を用いて作り出される人工的な多形性を含む実施形態を実証する。自然に発生するSNPs(太字および拡大)はA)対立遺伝子1のGおよびCおよびB)対立遺伝子2のTおよびA上で起こり、典型的なインサートライブラリーサイズよりも大きな距離によって離れ、そして従ってSNPフェージングは確かめられず、その一方で、部分的なビスルフィット変換によって核酸において組み込むことができる人工的なCのTへの多形性は、ハプロタイプが二つの対立遺伝子について決定することができるようにシーケンシングされたフラグメントを整列させるために用いることができる。 図4Aと同様である。 ハプロタイプ再構成の一例を示す。組み込まれた人工的なSNPsは、線状DNAフラグメント対立遺伝子1および対立遺伝子2上の縦線として描かれる。DNAはフラグメント化され、シーケンシングされ、およびシーケンシングリードは、組み込まれた合成SNPsのユニークなパターンに基づいて整列される(図4からの対立遺伝子2はこの図において描かれる)。重複フラグメントにおける人工SNPsのアラインメントは、元のゲノムフラグメントシーケンスの再建を可能にさせ、そして対立遺伝子2についてのハプロタイプの再構築を決定することができる。 「第一鎖伸長反応」のための実施形態が、どのようにしてDNA標的に合成多形性を組み込むために使用することができるかの例を示す。 フローセルのレーン1、2、3および4についてphi(ファイ)XテンプレートDNA伸長生成物中に組み込まれる修飾ヌクレオチドのパーセント(%エラー率)のためのシーケンシングデータを示す。 図7-1と同様である。 0、<1、<2、<3または<4の組み込まれた修飾ヌクレオチドを有するサイクルによるphiXシーケンシングリードのパーセントのためのシーケンシングデータを示す。Y軸は、Xエラーまたはそれよりも少ない0-100%での%リードであり、X軸はサイクル数0-100である。 図8-1と同様である。 図8-1と同様である。 図8-1と同様である。 第1の鎖伸長間の各フローセルレーンについてのphiXテンプレートDNA中に導入された合成多形性のタイプおよび頻度(エラー率)の合成物を示す。 A-DはphiXテンプレートDNA中に導入された人工的な多形性の分布またはカバレッジの代表的なものである。 図10-1と同様である。 三つのクローンのパネルA)クローンA、パネルB)クローンBおよびパネルC)クローンDのシーケンシングデータを表すカバレッジプロットを示す。グラフはYoruban(ヨルバ族)の雄性のDNA(NA18507)から誘導されるp53遺伝子シーケンスに組み込まれる合成の、および自然なヘテロ接合SNPsのカバレッジおよび位置を表す。各グラフは、各クローンについてp53遺伝子のおおよその同じ領域におけるシーケンスを報告し、およびスターはランダムに分布された導入合成SNPsの中で自然なヘテロ接合SNPsのおおよその位置をマークする。ピークを有する上部の水平線は、リファレンスコールを表し、および水平線下の垂直ピークを有する連続的なベースラインはノンリファレンスコールを表す。 図11-1と同様である。
一緒に受け継がれ、またはハプロタイプ決定されるゲノムにおいて密接にリンクされた対立遺伝子のグループを決定する能力は、ヒト疾患遺伝子をマッピングするために役立ちうる。疾患マップは、受動体(患者)のために疾患または疾患のリスクを判断(診断)、予測および/または識別するため、ならびに任意の一個人に固有の潜在的な処置療法を決定するために使用することができた。そのようなものはパーソナライズされたヘルスケアの目標の一つである。しかし、植物および動物の種、たとえば、経済的に関連する植物および動物の種についても同じことが言え、そこではハプロタイプ決定のようなシーケンス(配列)の知識はまた、獣医および植物科学研究において有利に使用することができた。このように、ハプロタイプの決定および/またはハプロタイプのフェージングは、生物学的および臨床的な観点の双方から重要である。サンプルのシーケシング(配列決定)は、研究者が、そのような相関を解明し、および決定し始めることができる配列情報を提供する。
ここで用いるように、用語「ハプロタイプ」は、半数体(ハプロイド)遺伝子型、対立遺伝子の組合せまたはセット、または、たとえば、組換え事象の間に、典型的にユニットとして受け継がれ、そして連絡される染色体上の異なる場所または遺伝子座で見出されるDNA配列に言及する。ハプロタイプは、区別できる個体の遺伝的パターンを提供することができる。ハプロタイプは、染色体の一部にわたって、または全体について、一つの遺伝子座、いくつかの遺伝子座を決定することができる。用語「対立遺伝子」は、生物学の技術におけるその意味と一致して使用される。対立遺伝子は、染色体上の、特定の位置、または遺伝子座に見出される遺伝子、遺伝子配列または単一ヌクレオチド(例は、一塩基多型またはSNP)の一以上の代替形態である。用語「遺伝子座」は分子生物学の技術におけるその意味と一致して使用される。遺伝子座(複数の「遺伝子座群」)は、遺伝子、遺伝子配列または単一ヌクレオチドで識別された染色体上の特定の位置または場所に言及する。そのように、特定の遺伝子のための一以上の対立遺伝子は、たとえば、染色体上の特定遺伝子座に見出すことができる。異なる遺伝子は染色体上の異なる遺伝子座で識別することができ、そこでは、各遺伝子は、たとえば、一以上の異なる対立遺伝子配列と関連しうる。対立遺伝子は、任意の特定のタイプに制限されることなく、そして、たとえば、正常な遺伝子配列または変異体の遺伝子配列が含まれうる。たとえば、一塩基多型(SNPs)、ショートタンデム反復(STRs)、等は、変異体および遺伝子配列として含まれることができる。用語「フェーズド対立遺伝子」は染色体上の特定の対立遺伝子の分布に言及する。したがって、二つの対立遺伝子の「フェーズ」は、対立遺伝子が単一の染色体または二つの別々の染色体(例は、母系性または父系性の遺伝性染色体)上に位置されているかどうかの特徴付けまたは決定に言及することができる。
配列決定技術が、非常に大量の配列リードを生産することができるとしても、リード長さは比較的短いことができる。次世代配列決定技術は、配列決定の精度を高めることができ、そして変異をコーリングする(呼び出す)ために有用でありうる一方、この技術は、フェーズ、またはハプロタイプ情報が、望まれるとき、限られた使用のものとすることができる。ショート配列リード由来のフェージング情報は、興味がある二つの多形性が、互いにそれらが、DNAの同じ配列決定された断片上に存在したように非常に接近していないなら、前もって決定することは非常に困難であり、またはおそらく、一つの多形性が第一の配列リードに由来して存在することが決定された場所であり、そして第二の多形性は、核酸断片の同じ対の第二の配列リードにおいて検出された。第二の場合から生じる事例は、平均して、ヒトゲノムがすべて1000ヌクレオチド毎に一つの多形性を有するので、稀であると考えられる。このように、多形性を含む特定のリードの確率は、およそ15%であってもよい(一方の多形性のすべての1000ヌクレオチドの配列リードの長さ/多形性の頻度)。各一つの多形性を有する配列のペアに属する双方のリードの複合確率は、個々の確率の積(15%×15%)である。したがって、断片リードペアの小さなサブセット、たとえば、約2.25%のショート断片リードペアは、ハプロタイプを形成する2つの変異体配列を含むことができると考えられる。このことは、典型的な配列決定ライブラリーの平均インサートサイズ分布、たとえば、次世代配列決定技術のために作り出されたライブラリーが、およそ<50bp(塩基対)〔例は、メイトペア配列決定(mate paired sequencing)におけるLife Technologies(ライフ・テクノロジーズ)のSOLiD配列決定〕からおよそ<400bp〔例は、454 Life Sciences(ライフ・サイエンシーズ)GS FLXチタニウム配列決定〕の範囲であることができることを考慮したとき、さらに複雑になる。そのように、二つの多形性が、たとえば、互いから>400bpの距離である場合、ライブラリーから派生するペアリードによってリンクされる可能性は、実質的にゼロである。400bpよりも長いリードについても、シークエンシング(sequenceing)リードが、将来的に長さが増加すると想定されるので、同じことが当てはまるが、しかし、開示された方法は、まだ適用でき、二つの多形性が配列リードよりも大きい距離にある場合、本方法は別々のリードに位置する多形性からのハプロタイプを決定するために利用することができた。
本開示は、ショートリード長さの配列情報を扱うとき特に有用であるゲノムハプロタイプ(例は、ハプロタイプ含量またはフェーズ)を特徴付けるための解法を提供する。本開示は、特に、関心がある対立遺伝子が異なった配列決定された核酸断片上に位置するとき、配列情報からのハプロタイプの特徴付けを可能にするための方法および組成物を提供する。
ここでは、実施形態は、「人工多形性」または「合成多形性」で、たとえば、人工または合成の一塩基多型または「人工SNPs」(「合成SNPs」)のようなものを作り出すための方法を開示し、それらは配列決定に先立ち、自然なヌクレオチドを修飾ヌクレオチドで交換することによって、または一つのヌクレオチドを亜硫酸水素塩変換して別のものに変換することによって核酸中に組み込むことができる。ここで用いるように、別段の記載がない限り、用語「合成多形性」または「人工多形性」は同義である。合成または人工の多形性は、核酸サンプルにおける配列を表し、それは核酸サンプルにおいて自然に発生しないが、代わりに核酸サンプル中に方法論的な手段によって組み込まれる。合成多形性は、ゲノムの配列中に挿入することができ、または合成多形性は、核酸サンプルの配列を置き換えることができる。合成多形性の例には、制限されないが、単一ヌクレオチド多形性(即ち、人工または合成のSNPs)、ジヌクレオチド多形性、核酸の挿入(例は、一以上の核酸、等)および核酸の欠失(例は、一以上の核酸、等)が含まれる。自然の核酸またはポリヌクレオチドサンプルに組み込むための人工的な配列には、修飾されたヌクレオチドが含まれ、それには、制限されないが、2-チオチミジン三リン酸、5-(2'-デオキシ-D-リボフラノシル)-3-メチル-2- ピリドン-5'三リン酸、8-オキソグアニン(8-ヒドロキシグアニン、8-オキソ-7,8-ジヒドログアニンまたは2-アミノ-7,9-ジヒドロ-1H-プリン-6,8-ジオン)、8-オキソ-2'-デオキシグアノシン-5'-三リン酸、2'-デオキシP-ヌクレオシド-5'三リン酸(dPTP)、d5mCTP、たとえば、m7G(5')ppp(5');P1-5'-(7-メチル)-グアノシン-P3-5”-グアノシン三リン酸、メチル5-dCTP、ヒドロキシメチルdCTP、イソシトシン、イソグアニン、およびその誘導体類、ほんの数例を挙げれば、それらが含まれる。
人工または合成の多形性は、たとえば、一定の頻度で、それらが整列し、そしてショート配列リードまたはリードのペアさえからフェージングすることができるように、組み込むことができる。一実施形態では、核酸鎖において人工的多形性を作り出すための方法には、複数の核酸類似体、たとえば、グアニン類似体で、8-オキソグアニン(8-オキソG)などのようなものを核酸鎖に組み込むことが含まれる。哺乳類DNAにおいて正常に見出される修飾ヌクレオチド8-オキソグアニン(8-ヒドロキシグアニン、8-オキソ-7,8-ジヒドログアニンまたは2-アミノ-7,9-ジヒドロ-1H-プリン-6,8-ジオン(IUPAC))の量は、DNAにおいて増加し、たとえば、それは、酸素のフリーラジカル種および/または電離放射線によって引き起こされる酸化的損傷のために損傷される〔1992、Cheng(チェン)ら、J Biol Chem(ザ・ジャーナル・オブ・バイオロジカル・ケミストリー)267:166-172、参照によりその全体をここに組み込む)。複製中に、8-オキソGは、シトシン(C)および/またはアデニン(A)、いずれかに、フーグスティーン塩基対合(Hoogsteen base pairing)を介して塩基対を形成することができる〔ルパージュ(LePage)ら、Nucl Acids Res(ヌクレイック・アシッズ・リサーチ)、1998、26:1276-1281、参照によりその全体が本明細書に組み込まれる)。8-オキソGは(8-オキソ-2'-デオキシグアノシン-5'-三リン酸または8オキソ(Oxo)dGTPの伸長反応中に組み込むことによって)、様々な手段によって、たとえば、電離放射線または別の手段、たとえば、細胞DNAを、酸化的にストレスを与えることによって、ポリヌクレオチド中に組み込むことができる。あるいはまた、修飾ヌクレオチドは、dNTP混合物に添加することができ、そして一方または双方のポリヌクレオチドの伸長反応中に、伸長DNA鎖中に正常に組み込まれ、それによって正常に組み込まれた非修飾ヌクレオチドが一定の頻度で交換される。ポリヌクレオチドの鎖中への8-オキソGの取り込みの後、アデニンミスペアリングは、親鎖中の8-オキソG反対の複製鎖におけるアデニンの対合によってDNA複製ステップの間に達成することができる。
一実施形態では、8-オキソGは、配列決定のためのライブラリー調製に先立ちポリヌクレオチド中に組み込むことができる。たとえば、ゲノムDNAサンプルは、フラグメント化することができ、断片は、末端修復され、A-テーリングを介して末端にアデニン付加され、およびたとえば、複製および増幅のために末端にプライマーアダプターは付加される。断片の複製中に8オキソdGTPを、標準的なdNTPミックス(dATP、dTTP、dGTPおよびdCTP)と一緒に追加することができ、それは、ランダムな様式で複数のグアニンをDNA断片中での複数の8-オキソGグアニン類似体による交換をもたらすであろう。8オキソdGTPのパーセントは経験的に決定することができる。若干の実施形態では、8オキソdGTPのパーセントは、グアニンの少なくとも10%、少なくとも20%、少なくとも30%、少なくとも30%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%または少なくとも100%であり(例は、dGTPの代わりとして)、断片の複製中に組み込むために利用できる。正規のdGTPと比較して、グアニン類似体のパーセンテージ、そして従って比率は、経験的に、ユーザによって望まれる置換の量として決定することができる。類似のパーセンテージまたは比率は、たとえば、人工SNPsを導入するために、ここに記載される方法および組成物を使用して核酸に組み込まれる他のヌクレオチド(または修飾ヌクレオチド)のために使用することができることが理解されるであろう。8-オキソGの例に続けて、ゲノム断片含有8-オキソGは、その後、8-オキソGを欠くそれらの断片から分離することができる。8-オキソG含有断片の分離は任意の手段によって行うことができる。たとえば、複製の間に使用されるプライマーは、分離目的のために結合パートナーと結合する結合分子と共に複合体を形成することができた。このような結合パートナー対には、制限されないが、ハプテン、小分子、色素および抗体で、たとえば、ビオチン/ストレプトアビジン、ビオチン/アビジン、ビオチン/ニュートラアビジン、DNP/抗-DNP、DIG/抗-DIG、等のようなものが含まれる。8-オキソG含有DNAの単離はまた、8-オキソG特異的抗体で、たとえば、Oxoguanine(オキソグアニン)8抗体[2Q2311]〔AbCam(アブカム社)からのab64548〕のようなものでキャプチャーすることによって分離することができる。8-オキソG含有DNAはまた、下流のハプロタイプ決定方法から、変性および洗浄または、たとえば、ホルムアミドピリミジンDNAグリコシラーゼ(Fpg)での消化(また8-オキソグアニンDNAグリコシラーゼ、NEBとして知られる)のどちらかにより排除することができる。
図1は、合成多形性をゲノムDNA中に組み込むための方法において8オキソdGTPを使用する実施形態を例示する。図1において、ゲノムDNAをランダムに大きな断片にフラグメント化することができる。初期の大きな断片のサイズは、少なくとも500bp、少なくとも750bp、少なくとも1000bp、少なくとも1500bp、少なくとも2000bp、少なくとも3000bp、少なくとも4000bp、少なくとも5000bpであることができる。初期の断片の大きさは、経験的に決定することができ、そして下流のグアニン類似体組込みの量に影響を与えるグアニンの異なる頻度を有するゲノムの異なる領域間で変化しうる。フラグメント化は、任意の手段、たとえば、超音波処理、ヒドロシェアリング(Hydroshearing)、噴霧、機械的剪断およびトランスポゾンの方法論、等によって行うことができる。断片は、末端修復、A-テイル化およびアダプター連結することができる。ヌクレオチド8-オキソGは、プライマー伸長および8オキソdGTPを含むdNTPミックスによってゲノム断片の鎖中に組み込むことができる。修飾ヌクレオチドのDNA伸長および組込みに利用されるプライマーは、その後、8-オキソG含有鎖の分離のためにストレプトアビジン分子によって捕捉することができるビオチンと複合体を形成することができる。捕捉された8-オキソG含有テンプレートは、複製することができ、8-オキソGがアデニンとミスペア(誤対合)をもたらし、それによって二本鎖DNA分子が作り出され、そこでは、鋳型がグアニン類似体を含み、そしてコピーされた鎖は誤対合アデニンを含む。8-オキソG含有鎖を除去し、それによってアデニン含有鎖を残すために、第二鎖の複製のために使用されるプライマーは、捕捉部分、たとえば、ビオチンのようなものに固定することができ、そしてストレプトアビジンによる捕捉を行うことができる。
残りのアデニン含有ポリヌクレオチドはさらに、配列決定のための断片のライブラリーを作成するために増幅および処理することができる。断片において作り出された合成アデニンのSNPsは、ランダムであり、そして8-オキソGを有するグアニン置換基のランダム性のために、導入された合成SNPsのパターンは、親の断片を独自に識別するために用いることができる。配列決定の後、人工的SNPパターンはすべての断片の間で整列させることができ、それによって断片配列が、ハプロタイプを決定するため、たとえば、ハプロタイプの含量または相の決定のようなもののために元のゲノム順に組み合わせられる。
別の実施形態では、配列決定のために、ゲノムDNAにおいて人工的な多形性を導入するための方法には、亜硫酸水素塩によりDNAを修飾することが含まれ、それによって人工的な多形性のパターンが作り出される。一例では、低濃度での、または短時間の間、核酸試料に重亜硫酸塩を適用することは、不完全に、そして部分的に非メチル化シトシン残基のサブセットをウラシルにおよびウラシルをチミンに変換することによってDNAを修飾することができ、その後、ゲノムDNAにおいて複数の位置で人工チミン多形性が作り出される。哺乳類DNAが、重亜硫酸塩で処理されるとき、メチル化シトシン(例は、5-メチルシトシン)は放置されたままである一方、メチル化されていないシトシン残基はウラシルに変換される。したがって、ゲノムDNA試料のメチル化状態を利用し、および亜硫酸水素塩でのゲノムDNAを処理することによって、人工的T SNPs(CツーUツーT)のパターンを作り出すことができ、それは、その後のハプロタイプ特性(例は、ハプロタイプの内容または相の識別)のためにゲノムDNAの染色体配列を再構築するように配列決定された後に断片の間で整列されうる。好ましい実施形態では、メチル化シトシン残基の部分的な、および不完全な変換が好ましく、それはポリヌクレオチドにおいて、合成多形性のパターンを作り出すためにここに開示する方法を実践するときである。
自然なシトシンの配列構成の例は、部分的な亜硫酸水素変換のための標的であることができ、それには、制限されないが、CGメチル化ジヌクレオチド〔1994、Clark(クラーク)ら、Nucl Acids Res、22:2990-2997、ここに参照することによりその全体を組み入れる〕、CpTおよびCpAジヌクレオチド領域〔2000、Lyko(リコ)ら、Nature(ネイチャー)408:538-540;2000、Ramsahoye(ラムサホイ)ら、Proc Nat Acad Sci(プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ)97:5237-5242;2001、Haines(ヘインズ)ら、Dev Biol(デベロップメンツ・イン・バイオロジカルズ)240:585-598、ここに参照することによりその全体を組み込む)および幹細胞におけるCHGおよびCHHで、そこではHは、アデニン(A)、シトシン(C)またはチミン(T)のいずれかであることができるもの〔2009、Lister(リスター)ら、Nature、462: 315-322、ここに参照することによりその全体を組み込む〕が含まれる。
増幅ステップは、ライブラリー準備前に新たに統合された人工的なSNPsを有する各親の断片の複数コピーを作り出すために利用することができる。このように、母系および父系染色体上に見出されるメチル化パターンの間の違いは、ここに開示される方法に従うことにより開発することができた。
他の実施形態において、DNAは、メチル化ヌクレオチド(例は、非天然のメチル化ヌクレオチドである修飾ヌクレオチド)を含むようにインビトロで修飾することができる。例えば、メチル化ヌクレオチドは、増幅、たとえば、メチル化されたdNTPで、制限されないが、d5mCTP、m7G(5')ppp(5')、P1-5'-(7-メチル)-グアノシン-P3-5”-グアノシン三リン酸〔Roche Applied Science(ロシュ・アプライド・サイエンス)、メチル5-dCTP〔Zymo Research(ザイモ・リサーチ)〕、またはヒドロキシメチルdCTP〔Bioline(バイオライン)〕が含まれるものを用いて、dNTPsの一つが全体的に、優先的に部分的に置換される標準的なdNTPの存在下での核酸の増幅などのようなものによってポリヌクレオチドにおいて複数の位置に組み込むことができる。さらに、メチル化されたdNTPsは、標準的なdNTPsのバックグラウンドにおいて増幅反応中にスパイクすることができる。部分的重亜硫酸塩変換は、次いで、核酸試料中の合成多形性のパターンを作り出すためにここに記載されるようにインビトロで修飾されたDNAに対して遂行することができる。
ゲノムDNA試料の自然なメチル化状態の使用は、ハプロタイプ決定および/またはハプロタイプフェージング決定のための人工的SNPsを作り出すために、図2において例示される。図2では、ゲノムDNAは以前に記載されるようにフラグメント化され、そして断片の端部が修復され、そして当技術分野で既知の方法を使用して以前に図1に例示したようにA-テイル化される〔たとえば、Molecular Cloning; A Laboratory Manual(分子クローニング;実験室マニュアル)、Sambrook(サンブルック)、Fritsch(フリッチュ)およびManiatus(マニアティス)編、Cold Spring Harbor Laboratory Press(コールド・スプリング・ハーバー・ラボラトリー・プレス)参照〕。調製したゲノム断片は、断片のその後の増幅のためにアダプターに連結することができる。人工的SNPsを作り出すための重亜硫酸塩変換方法で使用するためのアダプターは、それらが重亜硫酸塩処理した後に伸長可能であり、そして増幅可能なように設計することができる。たとえば、アダプターは、予めメチル化することができ(即ち、メチル化アダプター)、またはアダプターは、プライマー結合が発生するところのシトシンヌクレオチドを欠くように設計することができる。アダプター連結した断片は、ライブラリーの調製の前にウラシルを置き換えるためにdTTPを用いて増幅し、そしてコピーすることができる。ライブラリーの調製および配列決定の後、フラグメント化配列において人工SNPパターンは、その後ハプロタイプ化することができる元のゲノムDNAを再構築するために整列させることができる。亜硫酸水素塩変換によるシトシンの部分的な変換は断片において合成SNPsを作り出し、そこでは、変換のランダム性のせいで、合成のSNPsのパターンを一意に親の断片を同定するために使用することができる。
あるいはまた、いくつかの実施形態では、ウラシルへのシトシンの部分的な変換は、ゲノムDNAのフラグメント化および/またはアダプター連結に先立って行うことができ、その場合に、連結されたアダプターはメチル化または他の方法でシトシンの亜硫酸水素塩処理に耐えるように設計する必要がない。
別の実施形態では、ゲノム配列のハプロタイプを決定するための方法には、たとえば、イソCおよびイソGなどのような修飾ヌクレオチドの使用が含まれる。イソシトシン(イソC、iC)およびイソグアニン(イソG、iG)、標準的シトシンおよびグアニンヌクレオチドと比較して反転したアミンおよびケトン基を有する修飾ヌクレオチドは、人工的な多形性のランダムな配置をもたらすDNA鎖に誤って組み込まれる(misincorporated)ことがある。イソCおよびイソGの場合には、作り出された多形性は、コピーされることができ、または正しい補完的な非天然のパートナーを使用して後のステップにおいて配列決定されることができる。この実施形態では、初期のDNA複製ステップにおけるイソCおよびイソGを誤って取り込み、そしてさらに誤った取り込みを最小化または優先的に停止し〔2005、Sismour(シスモア)およびBenner(ベナー)、Nucl Acids Res、33:5640-5646、ここに参照することによりその全体を組み込む)、新たに形成された人工的な多形性を忠実にコピーするためにその後の増幅工程のための条件(すなわち、たとえば、ライブラリー調製法で使用されるもののようなもの)を変更することが有利である。
図3は、DNAにおいて人工的な多形性を作り出するための方法での修飾されたヌクレオチドの模範的な使用の例である。たとえば、ゲノムDNAは前述のようにフラグメント化することができる。アダプターはランダム断片の末端に前述のように連結することができる。例示的には、自然に発生するSNPsのAおよびTは断片の一方で示され、これらのSNPsは、ハプロタイプ決定のための一例として標的とされる。この例のiCにおいて、延長の間、修飾ヌクレオチドは、伸長鎖に組み込むことができ、それは、伸長プライマー、この例では、ビオチンに固着された結合部分で標識されるさらなる末端である。修飾ヌクレオチドデオキシイソシトシンのdiCTPは、定義された割合またはパーセンテージで伸長dNTPミックスの一部とすることができる。そのような割合またはパーセンテージは研究者によって望まれる合成多形性の取込みの量について経験的に決定することができる。修飾されたヌクレオチドを含む鎖は、結合パートナー、この場合は、ストレプトアビジンと共に捕捉することができ、およびその後の鎖の重複は、修飾ヌクレオチド、iCのために説明したように、この場合のiGにメイトを組み込むことができる。二本鎖断片は、一方の鎖上にiCをおよび他のもの上にiGを含むが、それは増幅することができ、それによってライブラリーの調製において使用するための両方の修飾ヌクレオチドを含む複数の断片が作り出される。
別の実施形態では、合成多形性は、代わりに断片ライブラリー調製物の下流のゲノムライブラリー断片に組み込むことができる。たとえば、一旦ゲノムライブラリーが作成されると(熟練した専門家に知られる任意の手段によって、たとえば、ここで説明するようにして)、合成多形性はライブラリーの調製および配列決定の間のステップに組み込むことができる。非制限的な一例では、合成多形性は、合成の方法論による配列に先立つコロニー形成の中に組み込むことができる。この場合、DNAライブラリーは、基質上に貼り付けられたプライマーにハイブリダイズすることができ、そして第一の鎖伸長反応は、断片ライブラリー中に修飾ヌクレオチドを組み込むために利用することができる。この「第一鎖伸長反応」のフォーマットは、図6に例示される。簡単に説明すると、二つのプライマー(P1およびP2)は、DNAライブラリー断片の末端に付けられたプライマーと相同であるが、それはたとえば、フローセル(例は、レーンまたはフローセル上のウェル)、ウェル、プレート、および同様の他のものなどのような基質上の位置に結合する。鋳型DNAライブラリー断片は、基質に結合したプライマーにハイブリダイズすることができ、そして相補的なDNA鎖は修飾されたヌクレオチドの存在下で合成することができる(例は、図6での第一鎖伸長)。クラスター化、配列決定および位置合わせは、組み込まれた人工的な多形性を位置合わせしてハプロタイプ決定のための有用な配列を提供するために実行することができる。
配列決定のためのゲノムDNAに人工的な多形性を組み込むためにここに記載されるすべての実施形態について、配列決定のためのライブラリーは、下流の配列決定器具(sequencing instrument)と互換性のある方法を用いて調製することができる。断片の配列は、一旦決定されると、断片に存在する合成のSNPsに基づいて整列させることができ、およびハプロタイプは、構築され、そしてそのアラインメント(整列化、位置合わせ)に基づいて決定することができ、たとえば、それは配列リードの長さがハプロタイプ決定のための二つの対立遺伝子の間の距離よりも短いときである。
図4AおよびBにおいて第一の配列は二つの例示的な対立遺伝子を示し(対立遺伝子1および2)、それには自然に発生する多形性が含まれ、この例のSNPsで、それらは400よりも多くのヌクレオチドに分離される(対立遺伝子1においてG-Cおよび対立遺伝子2においてT-A)。これらのSNPsの間の距離は平均インサートサイズよりも大きいので、二つのSNPsの配列決定、フェージングまたはハプロタイプ決定のためのライブラリーの準備の方法は非修飾ヌクレオチドを使用して決定可能ではない。図4AおよびBにおける第二の配列は、本開示の方法を実践した後、たとえば、配列決定の前に、親のゲノム断片の部分的な亜硫酸水素塩変換の方法を実践した後に、例示的な対立遺伝子1および2からの同じ領域を示す。二つの修飾された対立遺伝子の配列は、ここに開示されるような亜硫酸水素塩変換によって作り出すことができる人工多形性のユニークなパターンの一例を示す。
配列決定の後、短い長さの配列リードは、各対立遺伝子のためのユニークなパターンを再び作り出すために人工的な多形性に基づいて整列され、それによって、元のゲノムDNA断片が再構築される(図5)。2つの対立遺伝子のハプロタイプ再構築は、図5での対立遺伝子2を使用して、合成多形性パターンに基づいて断片アラインメントに従い決定される。このように、配列決定に先立ち、核酸分子へ合成多形性を組み込むことにより、ユニークな合成パターンが可能になり、それはその後に異なる配列断片の中のポスト配列決定を整列させることができ、それによって、自然に発生するSNPsの間の距離を橋渡しするための手段が提供されてそれらのハプロタイプのコンテンツまたはフェーズが決定される。
さらに、ここに開示される方法は、配列決定した断片の起源を決定するための手段を提供する。たとえば、人工多形性の創作の相対頻度およびそれらのランダムな性質は、二つのDNA配列決定集団〔例は、二以上のDNAクラスター、一つの鋳型に由来するDNAアンプリコン(増幅産物)の単離された集団、など〕が同じ元の親DNA分子から由来するか否かの決定を可能にする。二以上の集団が人工多形性の同一の重複パターンを共有する場合、それらが同じ染色体から誘導され、そしてそのため、集団に存在する自然なSNPsのすべてがハプロタイプであり、または一緒にフェーズされることができると考えられる。
したがって、標的ゲノム配列において人工的な多形性を作成する方法は、標的ゲノムDNAにおいてはるかに高い頻度(またはより近い近接)で、自然に発生するSNPsの頻度(または近接)に比べて設計され、標的配列において自然に発生するSNPsをリンクするために利用されることができ、それはそれが標的において自然に発生するSNPsの間の分離の配列リード長さに対する距離のせいで以前には不可能であったものである。また、ここに開示されるように、標的ゲノムDNAにおいて人工多型を作成するための実施形態は、ハプロタイプ配列の予備知識が必要とされない。人工的な多型の作成は評価される配列を基本的に変更しないが、領域の最終のコンセンサス配列から、人工の多型を有しない第二のライブラリーと比較することにより、または人工的な位置を無視して他の断片からの配列データを使用し、これらの拠点をカバーするかのいずれかにより、人工多型を除去することができる(たとえば、人工的な多型は、それがたとえば、特定の位置をカバーする断片の5-10%において発生する場合、識別され、そして無視することができる)。
別の実施形態では、核酸試料のハプロタイプを決定するための方法は、人工的な多型をバイアスされた(偏った)増幅によって核酸に組み込むことを含む。バイアスされた増幅を行うための例示的な方法は、たとえば、国際公開第WO2011/106368号(ここに参照することによりその全体を組み込む)で見出すことができる。バイアスされた増幅(即ち、線状または指数関数的であることができるヌクレオチドの数を増加させる処理)は、標的配列を増幅することを含み、そこでは、前記増幅は、核酸鎖に別のヌクレオチドと比較してより低い効率で組み込まれるデオキシリボヌクレオチド三リン酸(dNTP)を招く。本方法は、dNTPsのプールを使用することができ、そこでは、dNTPs(即ち、dATP、dTTP、dCTP、dGTP)は、そのすべてではないが、プールにおいて同じ濃度で存在する。ヌクレオチドのプールはまた、たとえば、前述したものなどのような修飾ヌクレオチドを含むことができ、それらは標準的なヌクレオチドよりも低い効率で(または頻度は低いものの)組み込まれる。
たとえば、dNTPsの一以上は、たとえば、増幅反応ステップのようなここに記載の方法で行うステップにおいて任意の他のヌクレオチドの組み合わせの濃度の半分未満である濃度で存在することができる。dNTPの任意の一つのタイプの濃度は、たとえば、他の組合せヌクレオチドの1/4濃度未満、他の組合せのヌクレオチドの1/5濃度未満、他の組合せヌクレオチドの1/10濃度未満、等であることができる。あるいはまた、増幅反応においてdNTPの特定のタイプの濃度は、20uM未満、10uM未満、増幅反応のために存在する残りのdNTPsの濃度(例は、200uM)と比較し、0.2uM未満であることができる。あるいはまた、ここに記載の組成物または方法でのdNTPの特定のタイプの濃度は、存在する残りのdNTPの濃度よりも、少なくとも5分の1(at least 5 fold less than)、少なくとも10分の1、少なくとも20分の1、少なくとも50分の1であることができる。このような偏った混合物において、一以上のアジュバントを添加しうる。たとえば、エチレングリコール、ポリエチレングリコール、1,2-プロパンジオール、ジメチルスルホキシド、グリセロール、ホルムアミド、7-デアザ-GTP、アセトアミド、テトラメチルアンモニウムクロライド、塩またはカルボキシメチルトリメチルアンモニウムである。一以上のアジュバントの濃度は、たとえば、2ないし5Mの間であってもよい。条件が、反応毎に異なりえ、たとえば、任意の特定のシステムのための若干の最適化などのようなものが考えられることは、熟練した専門家によって理解される(たとえば、増幅反応の条件は、WO2011/106368号に応じて最適化することができ、ここに参照することによりその全体を組み込む)。
ここに記載されたように合成多型をライブラリーの準備前に興味がある標的核酸に組み込むことは、様々な理由のために有利であることが考えられる。たとえば、ここに記載のように核酸に合成ポリヌクレオチドを組み込むための方法は、アッセイ機器に関係なく、任意のライブラリー調製法と組み合わせて実行することができる〔例は、配列決定機械類での使用のためのライブラリー準備プロトコルで、制限されないが、Illumina, Inc.(イルミナ社)、Applied Biosystems(R){アプライド・バイオシステムズ(商標)}、Ion Torrent(イオン・トレント)(R)、454 Life Sciences(ライフ・サイエンシーズ)、Complete Genomics(コンプリート・ジェノミクス)、Pacific Biosciences(パシフィック・バイオサイエンシーズ)、Oxford Nanopore Technology(オックスフォード・ナノポア・テクノロジー)、などのものが含まれる〕。さらに、ここに記載の方法をライブラリー調製の上流で実践することは、合成多型を固定させ、そしてライブラリー調製前に決定可能にさせる。加えて、ここに記載の方法を実践することは、より一層長い断片へのゲノムDNAの初期フラグメント化のために、たとえば、100bpより長い、300bpより長い、500bpより長い、1000bpより長い、2000bpより長い、10,000bpより長いもの、等を提供する。より一層長い断片は、次世代配列決定のために一般的に有利ではないが、より一層短い断片(例は、<300bp)のものよりも多くの合成多型の組込み、たとえば、合成多型のパターンを提供するなどのようなものを可能にし、それは、より一層長い断片のより一層短い断片への追加のフラグメント化の際に、配列決定後に容易に識別され、そして整列可能であることができる。より一層長い断片の別の利点は、より一層長い断片が、一よりも大きい自然なSNPを含む可能性があり、そのようにしてより一層多くのSNPを識別し、そしてより一層少ない断片を使用して整列させることができる。
若干の実施形態では、合成ヌクレオチドは、核酸のフラグメント化の前に、核酸に組み込むことができる。たとえば、修飾ヌクレオチドは、細胞培養中に細胞核酸に組み込むことができる。修飾ヌクレオチドは、たとえば、細胞DNAへの修飾ヌクレオチドの取り込みを引き起こすのに十分な濃度において修飾ヌクレオチドを含むように培地を改変することによって、細胞核酸に組み込むことができる。
他の実施形態では、ゲノムDNAは、機械的、化学的、または生物学的なフラグメント化を必要としない修飾されたヌクレオチドを含むより一層小さなゲノム分子にすることができ、次いで修飾ヌクレオチドの取り込みが続く。たとえば、機械的または生物学的方法によるゲノムDNAの最初のフラグメント化(例は、トランスポゾン関連法)の代わりに、ランダマー(randomers)(例は、ランダム配列ヘキサマー)を、ゲノムDNA鋳型由来の複数の核酸分子を作成するために利用することができる。たとえば、ランダマーはゲノムDNAにハイブリダイズし、そして伸長する(例は、ローリングサークル増幅による)ことができ、それによって、ここに開示されるフラグメント化の他の形態の同じ目的を果たすであろうDNAの長い鎖が作り出される(例は、配列決定のためのライブラリーを調製するためにより一層小さいポリヌクレオチドを作り出す)。伸長から生じた伸長産物は次に、自然ヌクレオチドを合成多型に変換するために重亜硫酸塩変換方法において用いることができる。他の実施形態では、修飾ヌクレオチド(例は、pPTP、8-オキソ-G、イソC、イソG、等)は、修飾ヌクレオチドを含む伸長産物を生じる伸長反応中に組み込むことができ、それによって修飾ヌクレオチドを含むゲノムDNAからより一層短い分子を作成するステップをつなぎ合わされ、その後それは、さらなるライブラリー調製方法のために用いることができる。
合成多型を核酸分子に組み込むための方法に関係なく、合成多型を含む得られるポリヌクレオチドは、下流アッセイのために使用することができる。たとえば、修飾された核酸分子は、配列決定のために利用することができる。合成多型を含む核酸分子は、試料のハプロタイプを決定または特徴付けるために特定の有用性を見出す。合成多型を含む核酸分子はまた、より一層短い配列リードが全長、時には新規な配列を作成するために整列および組み立てることができるデノボ配列決定について特定の有用性を見出す。合成多型を含む核酸分子は、特定の有用性を見出され、それはそれらの反復的な性質のために整列させるのが困難であることがあるリピート領域の高い発生率を含むゲノム内の領域を配列決定するときである。
ここに開示される方法を用いて合成多型を組み込むランダム性は、組み込まれた多型のパターンを有する修飾された核酸分子を提供し、そのランダムパターンは一旦決定されると、試料のハプロタイプ(例は、ハプロタイプのコンテンツまたはフェーズ)、デノボ配列、試料配列の検証、以前には困難と思われたゲノム位置の配列を決定するために整列させ、そして報告することができる。たとえば、本方法は、ここに開示される方法を実践することによって決定された配列、たとえば、決定されたハプロタイプは、診断医、臨床医、研究者および他の当事者、たとえば、疾患状態(例えば、癌、神経疾患、変性疾患、など)情報に配列を相関させるためのものによって使用することができ、それらは、次に個体が、特定の疾患または障害を有しうるか否か、あるいはそれらに対する素因を有しうるか否かどうかを診断し、そして予測するために利用することができる。さらに、一定の配列、たとえば、ハプロタイプは、特定の個体に特有の処置のレジメン(計画)を決定するために医療専門家によって使用されうる特定の疾患または障害のための優先的な処置レジメンに相関させることができる。さらに、本方法は、たとえば、法医学的目的のために、ゲノムにおいて繰り返し領域のタイプおよび数を決定するために用いることができる。
いくつかの実施形態では、合成多型を含む修飾核酸分子は、配列決定において、たとえば、ハプロタイプを決定するため、デノボ配列決定、等のために、特定の有用性を見出すことができる。合成遺伝子多型を含む修飾核酸分子は任意の手段によって配列決定することができる。標的核酸、たとえば、ゲノムDNAは、典型的には、配列決定前に試料から抽出され、そして分離(単離)される。あるいはまた、RNAは試料から採取することができ、そしてcDNAは単離されたRNAから作成され、そこではcDNAは配列決定のために使用することができる。用語「核酸」および「ポリヌクレオチド」は、デオキシリボ核酸(DNA)、リボ核酸(RNA)、相補的DNA(cDNA)またはDNA、cDNAまたはRNAの類似体に言及する。核酸は、一本鎖または二本鎖の分子でありうる。核酸またはポリヌクレオチドは、たとえば、ssDNAまたはRNAなどのような一本鎖形態で生じたものでありえ、またはそれらは、二本鎖形態(二本鎖DNA)、たとえば、ゲノムDNA、増幅産物、および/またはその断片、および同様の他のものに見られるようなものにおいて生じたものでありうる。核酸またはポリヌクレオチドは、鎖の性質に関係なく、任意の数の供給源で、制限されないが、生物の全ゲノム相補体、生物のゲノム全体の相補体の断片、これらからの試料が含まれるものから由来することができる。核酸には、イントロンおよびエキソン配列または調節および/または非調節配列の任意の数を含むことができる。
試料は、任意の供給源、たとえば、原核生物、古細菌または真核生物からのものであることができる。さらに、試料は、液体(即ち、血液、血清、血しょう、脳脊髄液、尿、等)または固形物(即ち、細胞、組織、等)であることができる。ここで使用する用語「試料(サンプル)」は、生物学および化学の分野におけるその意味と一致して使用される。ある意味では、任意の供給源、たとえば、生物学的および環境試料などのようなものから得られる標本または培養物からの核酸またはポリヌクレオチドまたはその断片を含むことが意味される。生物学的試料は、動物から得られるものであってよく、それには、制限されないが、ヒト、非ヒト霊長類、およびヒト以外の動物が含まれ、それには、制限されないが、脊椎動物、たとえば、げっ歯類、ヒツジ、ウシ、反芻動物、ウサギ目動物、ブタ、ヤギ、ウマ、イヌ、ネコ、鳥類などのようなものが含まれる。生物学的試料は、制限されるものではなく、血液生成物、組織、細胞、および他の同様なものなどのような流体が含まれる。生物学的試料は、さらに、制限されないが、植物起源、単子葉植物または双子葉植物、落葉または常緑、草本または木本であることができ、制限されないが、農業植物、観葉植物、種苗などのようなものが含まれる。環境試料は、起源が、細菌、ウイルス、真菌、および同様の他のものなどでありうる。好ましい試料は起源が真核生物である。特に有用な試料は、これらの半数体染色体の一よりも多くのセット(一以上の異なる染色体であるセット)を有する生物に由来する。たとえば、試料は、二倍体、三倍体または多倍数体である生物から由来することができる。基本的には、配列情報を決定する上で研究者に関心がある任意の生物の核酸試料の供給源は、本方法に適する。試料はまた、合成核酸またはその断片を含むことができる。また、核酸の派生体または生成物で、たとえば、増幅コピーまたは化学的に修飾された種のようなものも含まれる。好ましい実施形態では、試料は、哺乳動物、たとえば、ヒト由来である。
様々な方法およびプロトコルは、たとえば、Molecular Cloning:A Laboratory Manual (Eds., Sambrook、FritschおよびManiatus、Cold Spring Harbor Laboratory)、Current Protocols in Molecular Biology、John Wiley & Sons, Inc.〔レッド・ブック(The Red Book)〕およびShort Protocols in Molecular Biology(ショート・プロトコルズ・イン・モレキュラー・バイオロジー)、Ausubel(オースベル)ら編、John Wiley & Sons, Inc.に記載されるように、熟練した専門家に知られるような試料から核酸(たとえば、ゲノムDNAまたはRNAなどのようなもの)を分離するために使用できる。また、種々の試料タイプからDNAおよびRNAを分離するために商業上入手可能な製品およびキットも無数ある。本開示は、核酸が試料から分離される方法によって制限されるものではない。
試料からの核酸の抽出および分離に続いて、核酸は、配列決定、たとえば、次のライブラリー準備プロトコルの前にさらに処理することができる。処理は、その配列決定装置および技術が研究者によって利用されることに応じて異なる場合がある。ここに開示される方法およびシステムは、必ずしも任意の特定のライブラリーの作製方法または技術に制限されるものではない。図1-3はライブラリー調製の実践前に、開示された方法を、たとえば、いくつかの実施形態で実践することを例示する。ゲノムDNAのより一層小さな断片が所望される典型的なライブラリープロトコルに先立ち、ここに開示される方法を実行するための利点があるにもかかわらず、本方法は、典型的なライブラリーの調製方法のワークフローに組み込むことができる。たとえば、ここに開示される方法はまた、試料の配列決定前にライブラリーの調製ステップに組み込むことができる。このようにして、いくつかの実施形態では、標的DNAに合成多型を組み込むための方法は、試料のライブラリーフラグメント化の後および試料DNAの配列決定前にライブラリーワークフローに組み込むことができる。一例として、ここに記載の方法は、それに組み込み、またはSMRTbellTM(商品名)テクノロジーライブラリーフォーマットを利用するPACBIO RS DNA Template Preparation Kit(テンプレート調製キット)〔Pacific Biosciences, Inc.(パシフィック・バイオサイエンス社)、Menlo Park(メンロパーク)、CA(カリフォルニア州)〕のための試料調製のワークフローと組み合わせて使用することができ、そこでは配列決定のための挿入長さは250および6000bpの間の長さとすることができる。調査員は、ライブラリーを調製するためのPCRに関連する方法を利用することができ、または代替的に、ライブラリーを調製するための非PCRベースの方法を採用することができる。
いくつかの実施形態では、図1-3に例示されるように、相同染色体のペアとして表されるゲノムDNAをランダムに、DNA断片の長い部分に、たとえば、少なくとも300bp、少なくとも500bp、少なくとも750bp、少なくとも1000bp、少なくとも2000bp、少なくとも3000bp、少なくとも5000bpの長さにフラグメント化することができる。ランダムフラグメント化は、熟練した専門家に知られた種々の手段によって達成することができる。たとえば、いくつかの実施形態では、機械的および/または音響的剪断は、ゲノムDNAをフラグメント化するために使用することができ、たとえば、繰り返し、ゲノムDNA試料を、小口径注射器を介して押し進めることによって、噴霧によって、ハイドロシェアリング(hydroshearing)によって、または超音波処理によってのようなものである。
核酸の初期フラグメント化は、様々なライブラリーの準備のプロトコルのために利用されるものなどのように、同じか、または異なることができる。DNAの噴霧されたフラグメント化の例は、イルミナ社によるPaired-End Sample(ペアエンド試料)調製キットにおいて、および454 Life Sciences〔Branford, CT(ブランフォード、コネチカット州)〕のGS Junior(ジュニア)およびGS FLX配列決定システムによって利用されるライブラリーDNA生成のためのキットにおいて記述される。いくつかの実施形態では、DNAの剪断は、流体力学的な力によって達成され、たとえば、DIGILAB(デジラボ)(R)HydroShear(ハイドロシェア)技術機器によって提供されるものであり、SOLiDTMMate Paired(メイトペア)ライブラリーキット〔Applied Biosystems(R)Life Technologies社、Carlsbad(カールズバッド)、CA〕のためのワークフローに記載される。いくつかの実施形態では、DNAの剪断は、音響/機械的手段、たとえば、Covaris(カバリス)(R)適応集束音響(adaptive focused acoustics)(AFA)プロセスによって提供されるものなどのようなものによって達成される。いくつかの実施形態では、超音波処理はまた、ゲノムDNAをフラグメント化するために、たとえば、SOLiDTMFragment Library(断片ライブラリー)構築キット〔Applied Biosystems(R)Life Technologies社、Carlsbad、CA〕のワークフローに例示するように使用することができ、そこでは、Covaris(R)音波処理技術は、ゲノムDNAを剪断するために利用される。いくつかの実施形態では、トランスポゾンに基づく技術は、DNAをフラグメント化するために利用することができ、たとえば、Nextera(ネクステラ)TM DNA試料調製キット(イルミナ社)のワークフローに例示するようなものであり、そこではゲノムDNAは、入力DNAを同時にフラグメント化し、そしてタグ付けする操作されたトランスポゾンによってフラグメント化することができ(「タグ化(tagmentation)」)、それによって断片の末端におけるユニークなアダプター配列を含むフラグメント化された核酸分子の集団が作成される。トランスポゾンに基づく方法は、長い核酸断片が所望される場合に特に有利である。いくつかの実施形態では、酵素的フラグメント化は、ゲノムDNAをフラグメント化するために利用することができ、たとえば、Ion Plus(イオンプラス)およびIon Xpress(イオン・エックスプレス)TM Plusおよび断片ライブラリーキット〔Ion Torrent(イオン・トレント)TM Life Technologies社、Carlsbad、CA〕のワークフローにおいて採用されるようなものである。例示されるように、そこには、大きな核酸分子、たとえば、ゲノムDNAなどのようなものをフラグメント化するための無数の方法があり、そして、当業者は、その方法が、特定のアッセイ技術および機器に基づいて決定されてもよいことを理解するであろう。
いくつかの実施形態では、一旦アッセイのための核酸を、初期に長い断片にフラグメント化すれば、以前に説明したように、試料のさらなる処理を実行することができる。図1-3において例示するように、いくつかの実施形態は、付加的な配列の貼り付けで、たとえば、核酸断片の末端上のアダプター配列などのようなものを含む。アダプター配列は、追加の下流の方法、たとえば、増幅、ポリメラーゼ連鎖反応、分子捕獲方法、および同様の他のものなどのようなものを用いてもよい。そのようなアダプター配列は、下流ライブラリー調製キットおよび方法において利用されるアダプター配列と同じか、または異なることができるプライマー配列であってもよい。アダプターは、二本鎖、一本鎖、フォーク(分か)された(即ち、アダプターの一部分は、二本鎖であり、そしてアダプターの一部分は二つの一本鎖である)またはヘアピン構成であることができる(即ち、アダプターの一部分は、二本鎖であり、そして一部分は一本鎖ループ構造である)。アダプターはまた、ユニークな配列を含むことができ、たとえば、バーコードのようもので、特定の標的DNAの識別に有用である。ここに開示される方法は、アダプターの何らかの特定の用途または配列に必ずしも制限されず、熟練した専門家には、アダプターの使用を、アッセイおよび使用される機器に基づいて選定してもよいことが理解されるであろう。
図1-3は、核酸への合成多型の取り込みのために例示的な実施形態を示す。たとえば、図1-3において見られるように、修飾ヌクレオチド(例は、8-オキソG)の組込み、修飾ヌクレオチド(例は、iC)のCのUへの重亜硫酸塩変換およびの組込みのそれぞれは、核酸において合成多型を作成するために実行することができる。いくつかの実施形態では、修飾ヌクレオチド8-オキソGは、核酸断片を酸素フリーラジカル種に暴露すること、および/または電離放射線によって二本鎖DNAに組み込むことができる。あるいはまた、8-オキソGは、標準的(カノニカル)ヌクレオチドdATP、dTTP、dCTPの存在およびdGTP対アナログ8オキソdGTPの比における核酸上のプライマーのアニーリングおよび伸長によって核酸中に組み込むことができる。いくつかの実施形態では、dGTP対8オキソdGTPの比は、少なくとも1:1、1:2、1:3、1:4、1:5、1:10、1:20、1:30、1:40、1:50、1:75、1:99である。他の実施形態では、合成多型を組み込むための方法において、8オキソdGTPの割合は、100%である(即ち、dGTPは反応に添加されていない)。図3に例示するように、同じまたは類似のプロセスは、修飾されたヌクレオチド、たとえば、iCおよびiGのようなものの組み込みのために続けることができる。部分的な亜硫酸水素塩変換のために、熟練者に既知の重亜硫酸塩変換のための慣習的な方法は、図2に例示されるようにDNAにおいてシトシンのウラシルへの部分的な変換のために続けることができる。
いくつかの実施形態では、プライマーのアニーリングおよび伸長によって修飾ヌクレオチドの組込みのためにアダプター配列に結合するのに利用される一以上のプライマーはさらに、非修飾鎖からの修飾核酸鎖の捕捉および精製を行うために結合部分に関連付けることができる(即ち、組み込まれた合成多型を有さない核酸鎖)。図1および3に例示するように、ハプテンのビオチンは、その結合パートナーのストレプトアビジンによるその後の捕捉のためのプライマーに関連付けることができ、それによってそれは非修飾核酸から精製される。しかしながら、本方法は、必ずしも特定の種類または結合パートナーまたは捕捉システムのセットによって制限されない。いくつかの実施形態では、修飾ヌクレオチドを含む鎖が捕捉され、および非修飾鎖から精製されると、修飾された鎖は重複されることができ、そして、たとえば、核酸の端部に取り付けられたアダプターに結合するプライマーによって、合成多型が複製され、次いで組み込まれた合成多型を有する二本鎖核酸分子を作成するために重複が続けられる。
いくつかの実施形態では、鎖の選択的な捕捉はない。たとえば、図2は合成多型を組み込むための方法を示し、そこでは、選択的捕捉が行われない。このことは、鎖の選定が有利であっても、それは必ずしも必要ではないことを示す。いくつかの態様において、修飾ヌクレオチドを含む核酸鎖が精製され、および/またはその相補体から選定され、それが修飾ヌクレオチドを含んでいなくても、選定鎖は、たとえば、プライマー伸長法によって複製することができ、そこでは、そのような複製または重複は、親鎖における場所の反対に合成多型を組み込み、そこでは、修飾ヌクレオチドが存在する。図1に例示されるように、8-オキソGを含む鋳型核酸鎖の複製は、新しく組み込まれたアデニン(A)または鋳型鎖において8-オキソGヌクレオチドの位置の反対側の臨時的なシトシン(C)を含む相補鎖をもたらす。しかし、アデニンは、8-オキソGとの誤ったペア形成(ミスペア)をしたヌクレオチドの例示である。シトシンはまた、修飾されたヌクレオチド8-オキソGとペアを形成することができる。このように、いくつかの実施形態では、8-オキソGは修飾ヌクレオチドとして合成多型を組み込むために利用され、アデニンおよび/またはシトシンを、合成多型として組み込むことができる。他の修飾ヌクレオチドを利用するとき、組み込まれて得られた合成多型は、その特定の修飾ヌクレオチドとペア形成するヌクレオチドであることができる。
図1は、配列決定の前に模範的な修飾ヌクレオチド8-オキソGの除去を実証する。ヌクレオチド8-オキソGは、アデニンまたはシトシンのいずれかとペア形成することができ、配列決定のための断片における8-オキソGの維持のようなものは選択的でない。いくつかの態様において、修飾ヌクレオチドは、配列決定のために使用される核酸断片で維持される。たとえば、核酸断片へのイソCの組み込み(図3)は、複製の際に、ヌクレオチドパートナーのイソGがまた、組み込まれ、それによって、両方のイソCおよびイソGを合成多型として含む配列のための核酸が提供される。
本出願の実施形態において、合成多型を含む核酸断片を増幅することができる。そのような増幅は、両方の末端でアダプターを含み、ならびにライブラリー作成処理に入る断片のプールにおいてDNAの量を増加させるそれらの核酸断片だけについてライブラリーを濃縮することができる。たとえば、ポリメラーゼ連鎖反応(PCR)増幅は、プライマーを用いて核酸断片へ合成多型の組み込みの後に実行することができ、それは核酸断片の末端に連結するアダプターに対しアニールする。ここで使用されるようにアダプターは、多くの機能を果たすことができ、そのうちの一つは、基質(基板)に付けた相同配列へのハイブリダイゼーションのためのものであり、たとえば、合成方法論によって配列において使用するためのエマルジョンPCR(emPCR)またはクローンの生成を行うためのものである。
標的核酸を、複数の合成多型が含まれるように修飾した後、配列決定のためのライブラリー調製を、たとえば、特定の配列決定法および装置によって推奨される方法を実行することによって生成することができる。たとえば、任意の数の配列決定システムで使用するためのプロトコルおよびマニュアルに記載されているように、制限されないが、イルミナ社〔例は、HiSeq1000、HiSeq2000、HiSeq2500、MiSeq、Genome Analyzer systems(ゲノム・アナライザー・システム)、等〕、 454 Life Sciences〔例は、GS Junior(ジュニア)、GS FLX+、等〕、Applied Biosystems(R) Life Technologies(例は、SOLiDTM配列決定システム)およびIon TorrentTM Life Technologies(例は、Ion PGMTM Sequencer、Ion ProtonTMSequencer、等)が含まれる。DNAライブラリー試料はさらに、たとえば、マルチ鎖置換増幅(MDA)技術によって、配列決定をするために増幅することができる。熟練した専門家は、また、核酸断片に合成多型を組み込むためのここに記載の方法との組み合わせにおいて使用することができる核酸ライブラリーを生成するために付加的な方法および技術を認識するであろう。このように、ここに記載の実施形態は、必ずしもライブラリーを、特定の実施形態以外のものを作成するための任意の特定の方法、それらの方法の前またはその中での合成多型の組込みまたは作成に制限されるものではない。
合成多型を含む核酸ライブラリーは、配列決定アッセイでの使用に有利であり、たとえば、ハプロタイプ決定、デノボ配列決定および2、3例を挙げれば、法医学ヌクレオチドアプリケーションのためである(即ち、ヌクレオチド反復領域、等)。いくつかの実施形態では、合成多型を含むDNAライブラリーはフローセルに固定化することができる。固定化された核酸は単一分子解像技術を用いて配列決定することができ、または固定化された核酸は、アンサンブルに基づく検出のために、たとえば、ブリッジ増幅を介して、増幅することができる。ブリッジ増幅は、たとえば、合成手法によって配列について配列決定の前に固定化したポリヌクレオチド上で実行することができる。ブリッジ増幅において、固定化されたポリヌクレオチド(例はDNAライブラリーから)は、固定化されたオリゴヌクレオチドプライマーにハイブリダイズされる。固定化されたポリヌクレオチド分子の3'末端は、固定化されたオリゴヌクレオチドプライマーから延びるポリメラーゼ触媒、鋳型指向性伸長反応(例は、プライマー伸長)のための鋳型を提供する。得られた二本鎖生成物は二つのプライマーを「ブリッジ」し、および両方の鎖は支持体に共有結合的に結合される。次のサイクルでは、固形支持体に固定化された一本鎖の対を生じる変性に続いて(固定化された鋳型および拡張プライマー生成物)、両方の固定化された鎖は新しいプライマー伸長のための鋳型として働くことができる。これにより、第一および第二の部分は、「クラスタリング」として知られるプロセスにおいて複数のクラスターを生成するために増幅することができる。クラスターおよびコロニーは互換的に用いられ、そして複数の核酸配列のコピーおよび/または表面に付着したその相補体に言及する。典型的に、クラスターは、核酸配列の複数のコピーおよび/またはそれらの相補体を含み、それらの5'終端を介して表面に結合する。模範的なブリッジ増幅およびクラスタリング方法は、たとえば、PCT特許出願公開WO00/18957号およびWO98/44151号、米国特許第5641658号、米国特許出願公開第2002/0055100号、米国特許第7115400号、米国特許出願公開第2004/0096853号、米国特許出願公開第2005/0100900号、米国特許出願公開第2004/0002090号、米国特許出願公開第2007/0128624号および米国特許出願公開第2008/0009420号に記載され、それらの各々がここに参照することによりその全体を組み込まれる。ここに記載される組成物および方法は、クラスターを含むフローセルが利用される合成方法論によって配列では特に有用である。
配列決定の前に核酸を増幅するためのエマルジョンPCR(emPCR)の方法はまた、ここに記載のように方法および組成物と組み合わせて使用することができる。エマルジョンPCRは、油中水型エマルジョンにおいてアダプターが隣接したショットガンDNAライブラリーのPCR増幅を含む。PCRは、マルチテンプレートPCRであり、特定の実施形態において、単一のプライマー対だけを使用する。PCRプライマーの一つはマイクロビーズの表面に繋がれる(5'付着)。低鋳型濃度は、ゼロまたは一つの存在する鋳型分子を有するほとんどがビーズ含有のエマルション微小胞(マイクロベシクル)をもたらす。生産的なエマルジョンのマイクロベシクル(ビーズおよび鋳型分子の両方が存在するエマルション微小胞)において、PCRアンプリコンはビーズ表面に捕捉することができる。エマルジョンを破壊した後、増幅の生成物を有するビーズを選択的に濃縮することができる。各々のクローン的に増幅されたビーズは、鋳型ライブラリーからの単一分子の増幅に対応して、その表面のPCR生成物上に関係する。次いで、ビーズは配列決定のためのフローセルの表面上にアレイすることができる。エマルジョンPCR法の様々な実施形態は、Dressman(ドレスマン)ら、Proc. Natl. Acad. Sci. USA 100:8817-8822(2003)、PCT特許出願公開第WO 05/010145号、米国特許出願公開第2005/0130173号、第2005/0064460号および第2005/0042648号に記載され、その各々はここに参照することによりその全体を組み込まれる。
ここに記載のように、DNAナノボールはまた、本方法および組成物と組み合わせて使用することができる。ゲノム配列決定のためにDNAナノボールを作成および利用するための方法は、たとえば、米国特許および出版物、第7910354号、第2009/0264299号、第2009/0011943号、第2009/0005252号、第2009/0155781号、第2009/0118488号および、たとえば、Drmanac(ドラマナク)ら、2010、Science(サイエンス)327(5961):78-81に記載のようのもので見出すことができ、これらのすべては、ここで参照することによりその全体が組み込まれる。簡単に説明すると、次のゲノムライブラリーのDNAフラグメント化アダプターは、断片に連結され、アダプター連結した断片はサークルリガーゼによる連結によって環状化され、およびローリングサークル増幅が遂行される〔Lizardi(リサルディ)ら、1998、Nat. Genet.(ネーチャー・ジェネティックス)、19:225-232およびUS2007/0099208A1に記載されているようにされ、それらの各々がここに参照することによりその全体を組み込まれる〕。アンプリコンの伸長コンカテマー構造はコイリング(巻き)を推進し、それによって、コンパクトなDNAナノボールが作成される。DNAナノボールは基質上に捕捉することができ、好ましくは、それぞれのナノボールの間の距離が維持され、それによって別々のDNAナノボールの配列決定が可能にされるように、オーダード(順序付けられた)またはパターン化された配列を作成する。いくつかの実施形態、たとえば、Complete Genomics〔Mountain View(マウンテン・ビュー)、CA〕によって使用されるもののようなものでは、アダプター連結、増幅および消化の連続的なラウンドは、アダプター配列によって分離されたゲノムDNA断片のいくつかを有する頭-尾構築物を生成するために環状化に先立って遂行される。
ポリヌクレオチドまたはその断片への合成多型の組み込みによって、ハプロタイプ、デノボ配列、等を決定するための開示された方法は、配列決定で、たとえば、合成(SBS)技術による次世代(「nexgen」)配列決定において使用するとき、その特定の有用性を見出せる。合成による配列決定は、一般的に、ポリメラーゼを用いて5'から3'の方向に成長するポリヌクレオチド鎖への一以上のヌクレオチドの連続的付加を含む。拡張ポリヌクレオチド鎖は、基質(例は、フローセル、チップ、スライド、等);合成多型を含む標的配列上に固定された核酸鋳型に相補的である。
ポリヌクレオチドまたはその断片への合成多型の組み込みによって、ハプロタイプ、デノボ配列、等を決定するための開示された方法は、連結による配列決定、ハイブリダイゼーションによる配列決定、および他の配列決定技術において使用するとき有用性を見出せる。連結法による模範的な配列は、Applied Biosystems社のSOLiDTM配列決定システムによって利用されるジベースエンコーディング(di-base encoding)である〔例は、カラースペース配列決定(color space sequencing)である〔Voelkerding(フェルケルディング)ら、2009、Clin Chem(クリニカル・ケミストリー)55:641-658;ここに参照することによりその全体を組み込む)。ハイブリダイゼーションによる配列には、フラグメント化され、標識された標的DNAが付加される核酸プローブの短い配列のアレイの使用を含む〔Drmanacら、2002、Adv Biochem Eng Biotechnol(アドバンシーズ・イン・バイオケミカル・エンジニアリング/バイオテクノロジー)、77:75-101;Lizardiら、2008年、Nat Biotech(ネイチャー・バイオテクノロジー)、26:649-650、米国特許第7071324号;ここに参照することによりその全体が組み込まれる〕。ハイブリダイゼーションによる配列に対するさらなる改良は、たとえば、米国特許出願公開第2007/0178516号、第2010/0063264号および第2006/0287833号において見出すことができる(ここに参照することによりその全体が組み込まれる)。ハイブリダイゼーションおよび連結の生化学を組み合わせた配列決定アプローチは、開発され、および商品化されており、たとえば、Complete Genomics、Mountain View、CAによって実践されるゲノム配列決定技術のようなものである。たとえば、コンビナトリアル・プローブ・アンカーライゲーション(combinatorial probe-anchor ligation)、またはcPALTM〔Drmanacら、2010、Science、327(5961):78-81〕は、連結生化学を利用し、その一方ハイブリダイゼーションによって配列の利点を活用する。ハプロタイプ決定、デノボ配列決定、等のための方法は、ここに開示され、コンビナトリアル・プローブ-アンカー・ライゲーション配列決定技術において利用することができる。合成多型の使用のためにここに記載される方法は、ハプロタイプ、デノボ配列、等を決定するために、任意の特定の塩基配列決定法によって制限されないことが考えられる。追加の配列決定技術には、制限されないが、一以上のポロニー(polony)配列決定技術〔Dover Systems(ドーバーシステムズ)〕、それらのハイブリダイゼーション蛍光プラットフォーム(Complete Genomics)およびsTOP(ストップ)技術〔Industrial Technology Research Institute(産業技術総合研究所)〕による配列決定によって実践されるものが含まれる。
単一分子配列決定はまたここに開示されるように本方法で使用することができる。たとえば、前述のように、配列決定のための非増幅DNAライブラリーを準備することができる。ライブラリー断片は、ハイブリダイズし、および基質、たとえば、フローセルなどのようなものの上に捕捉され、たとえば、HeliScopeTM Single Molecule Sequence(単一分子配列)機器上でアッセイすることができる。単一分子配列決定のさらなる説明は、たとえば、Puchkarev(プフカレル)ら(2009、Nat Biotechnol、27:847-52、ここに参照することによりその全体が組み込まれる)、およびThompson(トンプソン)およびSteinmann(シュタインマン)〔2010、Curr. Prot. Mol. Biol.(カレント・プロトコルズ・イン・モレキュラー・バイオロジー)、Cpt 7、ユニット7.10、ここに参照することによりその全体が組み込まれる〕で見出すことができる。
ここに記載される方法は、核酸検出システムと組み合わせて使用することができ、たとえば、Illumina(イルミナ)(R)社〔HiSeq1000、HiSeq2000、HiSeq2500、Genome Analyzers(ゲノムアナライザーズ)、MiSeq、HiScan、iScan、BeadExpressシステム〕、Applied BiosystemsTM Life Technologies〔ABI PRISM(R)Sequence detection systems、SOLiDTMSystems〕、Ion TorrentTM Life Technologies(Ion PGMTM、Ion ProtonTM)454 Life Sciences(GS Junior、GS FLX+)、PacBio RS〔Pacific Biosciences(R)〕、Oxford Nanopore Technologies (R)(GridION、MinION)または他の配列決定機器によって提供されるようなものであり、さらに、たとえば、米国特許および特許出願公開の、第5888737号、第6175002号、第5695934号、第6140489号、第5863722号、第2007/007991号、第2009/0247414号、第2010/0111768号およびPCT出願国際公開WO2007/123744号、および米国特許出願番号第61/431425号、第61/431440号、第61/431439号、第61/431429号、第61/438486号に記載されるものなどであり、それらの各々はここに参照することによりその全体が組み込まれる。
配列決定機器からの出力は任意の種類のものであることができる。たとえば、いくつかの現在の技術は、たとえば、蛍光またはルミネセンス(発光)のような光生成可読出力を利用する。他の技術は、半導体を利用し、それは、配列決定中のヌクレオチドの取り込みの間に放出された水素イオンに基づいて、イオンの放出およびデジタル処理で出力配列を検出する。しかしながら、本方法は、興味がある特定の配列についての出力信号の差が潜在的に決定可能である限り、読み取り可能な出力のタイプに制限されるものではない。
ここに記載されるように方法を実践することから由来する出力を特徴付けるために、使用され、または修正することができる解析ソフトウェアの例には、制限されないが、Pipeline(パイプライン)、CASAVAおよびGenomeStudioデータ解析ソフトウェア〔イルミナ(R)社〕、SOLiDTM、DNASTAR(R)SeqMan(R)NGen(R)およびPartek(R)Genomics SuiteTMデータ解析ソフトウェア(Life Technologies)、Feature Extraction and Agilent Genomics Workbench(特徴抽出およびアジレント・ゲノミクス・ワークベンチ)データ解析ソフトウェア〔Agilent Technologies(アジレント・テクノロジー)〕、Genotyping Console(ジェノタイピング・コンソール)TM、Chromosome Analysis Suite(染色体分析スイート)データ解析ソフトウェア〔Affymetrix(アフィメトリックス)(R)〕が含まれる。ここに開示される方法および組成物で使用するための一以上のソフトウェアプログラムが、断片の配列データに存在する組み込まれた合成多型パターンを認識する能力を有し、断片配列データで識別された多型を整列させ、およびそのアラインメントに基づく配列を出力することが考えられる。いくつかの実施形態では、出力は、標的試料についてのハプロタイプ(例は、ハプロタイプのコンテンツまたはフェーズ)を含んでもよい。他の実施形態では、出力は、標的試料のデノボ配列情報を含むことができる。他の実施形態では、出力は法医学ヌクレオチド反復情報、そのようなタイプのもの(即ち、反復の配列、反復の位置、短いまたは中間のタンデムリピートの数など)を含んでもよい。
いくつかの実施形態では、配列解析およびアライメントは、参照ゲノム、または整列可能な領域のデノボアセンブリーに対する配列リードを、たとえば、熟練者に知られるような配列決定のためのライブラリー断片に導入されたバーコードによって、整列させることを含む。人工SNPsの密度に応じて、標準的なアラインメントソフトウェアツールが使用されうると考えられる。たとえば、合成SNPの密度が高い場合、その後のアラインメントプログラムは、アラインメントが適切に配列読み取りできるほど寛容であるように修飾することができる。例としては、亜硫酸水素塩配列決定のための既存の修飾されたアラインメントパイプラインは、合成SNPsが亜硫酸水素塩変換手法によって組み込まれるときに使用することができる(例は、www.bioinformatics.babraham.ac.uk/projects/bismarkで説明されるようなものである)。デノボアセンブリーについて、ビルトイン(内蔵)エラー訂正モジュールが、ここに開示された方法の実践に由来する配列の読み取りのとき、標準の短いリードアセンブラのために無効にされることがあると考えられる〔2008、Zerbino(ツェルビノ)およびBirney(ヴェルヌ)、2008、Genome Res(ゲノム・リサーチ)、18:821-829、ここに参照することによりその全体が組み込まれる〕。
短い配列からハプロタイプブロックを構築するためのアルゴリズムは、ここに開示される方法で使用することができる〔Bansal(バンサル)およびBafna(バフナ)、2008、Bioinformatics(バイオインフォマティクス)、24:i153-i159)。しかしながら、このようなアルゴリズムは、正常な二倍体ヒトDNA分子を配列決定する際に予想されるように、二つの別個のハプロタイプの標準的な仮定から離れて修飾することができる。たとえば、導入された合成SNPsは、各元の配列断片に相当する見かけのまたは人工のハプロタイプのより一層多くをもたらし、それゆえ、修飾はこの非標準情報を適合させるためのアルゴリズムで行われる。
合成SNPsは、多くの方法で正常な塩基配列から識別することができた。たとえば、修飾されていない元の配列は、参照配列として、それゆえ、合成SNPsを含まないコントロールとして役立ちうる。この方法では、元の配列には存在しない多型は識別され、そして修飾された配列におけるそれらの位置と相関することができ、それによって、合成SNPsが組み込まれた修飾された配列における位置が識別される。アラインメントは次に、識別され、修飾されたそれらのヌクレオチドを使用して行うことができる。コンセンサスコーリングのために、合成多型は、元の配列に特有であることが予測される。このように、特定のゲノム位置における元の断片を配列決定することによって、合成ハプロタイプを横切る多型の頻度を推定し、そして正常な二倍体ヒト試料において予測される頻度と比較することができる。
いくつかの実施形態では、人工的なハプロタイプのマージ(混合)は、合成多型を識別するために修飾されるアルゴリズムによって行うことができ、たとえば、HapCUTまたはそれへの改変(2009、BansalおよびBafna)などのようなものである。アルゴリズムは、非合成SNPsとして識別されるSNPsをマージするように修飾することができるが、異なる合成ハプロタイプに由来し、それによって、真の基盤となるハプロタイプ整列マップが作成される。
いくつかの実施形態では、自然な、および合成の両方の多型を含む整列された配列からの出力は、自然な多型の位置および再構築されたハプロタイプにおける合成多型の位置の両方が含まれうる。あるいはまた、出力は、選別される合成多型を伴う再構築されたハプロタイプにおける自然な多型をまさに含むことができる。視覚化は、多くの方法で達成することができ、たとえば、標準的なゲノムブラウザで、たとえば、統合的ゲノムビューア(IGV)〔2011、Robinson(ロビンソン)ら、Nat Biotech、29:24-26、ここに参照することによりその全体が組み込まれる〕を利用することができる。再構築されたハプロタイプは真の、自然な多型および/または合成の多型の位置を強調するためにゲノムブラウザで注釈を付けることができた(例は、出力において存在する場合)。しかし、熟練者に知られているように、他の視覚化ツールを使用してもよい。本発明の方法は、必ずしもここに開示される方法を実践することから由来する配列の整列化および出力化または可視化のために使用されるアルゴリズム、方法またはシステムに制限されるものではない。
以下の例は、開示される方法および組成物の特定の好ましい実施形態および態様を示し、さらに例示するために提供され、その範囲を制限するとして解釈されるべきではない。
ライブラリー調製の前に、ゲノムDNAは人工的な多型を含むように修飾することができる。ゲノムDNAは、初期に大きな小片(たとえば、数キロベース)にフラグメント化することができる。より一層大きな断片サイズは、同じ断片に二以上の人工のSNPsが発生するのを最大にする一方、より一層多くのヘテロ接合SNPsの発生を最大にする。核酸のトランスポゾン媒介フラグメント化およびハイドロシェアリングは、初期のDNA断片、たとえば、1,000-40,000bpの間のものを生成するための方法の例である。
例1- - ファイXゲノムへの合成多型の組込み
配列決定実験は、下流の塩基配列決定のためにDNA鎖に修飾ヌクレオチドの組み込む頻度を評価するように実行した。バクテリオファージ参照ゲノム、ファイX174またはファイXを使用し、ファイXは小さく、5386塩基の十分に規定されたゲノム配列を有する。二つの修飾ヌクレオシド、8オキソdGTPおよびdPTPは、通常のdNTPsとの異なる組み合わせで組み込まれた。dPTPはAおよびG両方の塩基対を形成することができ、それに対し8オキソGはAおよびC両方に塩基対を形成することができる。
標準のペアエンドイルミナフローセルを、製造者のプロトコルに従って2pMの濃度の標準ファイXライブラリーと共に播種した。フローセルに結合したオリゴヌクレオチドライブラリーのハイブリダイゼーションの後、DNA分子を、DNAポリメラーゼおよび表1に見られるような種々のヌクレオチド混合物(自然および不自然)の存在下で、1時間40℃でフローセルをインキュベートすることによって、第一鎖伸長法を用いて、フローセルのレーンにおいてコピーした。
第一の伸長反応(図6に例示される)の後、単一分子を、イルミナ・ゲノム・アナライザー上で配列決定された増幅クラスターを産生させるために、製造業者のプロトコルに従い35サイクルの等温増幅によってクローン的に増幅した。リードは100サイクルであり、そしてデータは、ペアエンド分析用PhageAlign(ファージアライン)システムソフトウェアを使用してファイX参照配列に対するアラインメントに続く標準システムソフトウェアを使用して分析した。
表2は、フローセルの各レーンについて配列決定の実行の概要を示す。レーン1は、コントロールレーンであり、そして通常のdNTPsを使用した通常の配列決定実行からの配列決定の出力を表す。レーン2-6は、配列決定実行の出力を示し、それは、一方または両方の修飾ヌクレオチドが、第一鎖伸長中、通常のdNTPsとの組合せ、または交換して組み込まれるときである(表1からのdNTP濃度)。その%エラー率(PF)は、この実験では、標的ファイXのDNAへの修飾ヌクレオチドの組込みを反映して、参照ゲノムと一致しない整列リードにおいてコールされた塩基のパーセンテージを報告する。表2に見られるように、反応条件がファイXのDNAに修飾されたヌクレオチドを組み込んだすべてのレーンは、正常対照(レーン1)よりも高いエラー率を示した。
図7は、レーン2(B)、3(C)および図4(D)に比べコントロール(A)レーンについてのサイクル対エラー率のグラフを示す(レーン6の結果はレーン4と基本的には同じであった)。図7に例示されるように、第一鎖伸長の組み込まれた修飾ヌクレオチドのレーン(レーン2,3および4)がコントロールレーン1と比較して上昇したエラー率を示す。さらに、エラー率は増加しないが、追加の合成ヌクレオチドが第一の伸長反応後に組み込まれないと思われるような一定のままであり、それによって、クラスター形成およびその後の配列決定中に予期しない合成ヌクレオチドの組込みのせいで、正確な配列決定による決定のための潜在的な変数が除去される。
ファイXの修飾されていないDNAからの配列決定データは、配列リードの大部分が、最小または無の配列決定エラーを有するが、その一方、第一鎖伸長反応の組み込まれた修飾ヌクレオチドから由来するそれらの配列リードは高エラー数を有した。図8は、第一鎖伸長中への修飾ヌクレオチドの組込みにより、1、2、3、4またはそれよりも多くの合成SNPsを含むコントロールに比較して多数の配列決定断片をもたらし、それは合成のSNPsの断片アライメントを、そしてそれゆえ、ハプロタイプ決定を可能にする。
さらに、表1に見られるように、合成SNPsのどの種類および頻度が、自然および修飾された異なる組み合わせに起因するかが決定された。図9は、配列決定リードにおいて組込みおよび有病率(prevalence)(エラー率)中にdPTPの使用から生じる変異のレーン毎の比較を示す。前述のように、dPTPは、AおよびGの両方に塩基対を形成することができ、それによって、dPTPが第一鎖伸長産物に組み込まれるとき発生する以下の変異を可能にする;A→G、G→A、T→CおよびC→T。dPTPがdCTPおよびdTTPの不存在下に組み込まれるとき(図9においてレーン3および7)、G→A変異が変異の他の種類を支配する。逆に、dCTPおよびdTTPの小量が組込み反応の間に存在するとき(レーン4、6および8)、変異の支配は最小である。
さらに、組み込まれた人工的なSNPsの分布パターンを評価した。図10に示されるように、8オキソG(レーン2)およびdPTP(レーン3および4)の両方の組込みは、全ゲノムにわたって均一であった。図において、スパイクは人為的であり、そしてこの場所では合成SNPsの不均衡な量を表さない。
レーン5の反応条件が、あまりにも極端であり、このレーンのための配列決定の障害がもたらされたことが考えられる。
例2-合成ヌクレオチドのp53遺伝子への組込み
p53遺伝子の領域は、配列決定の前に遺伝子に挿入されたPTP修飾ヌクレオチドを用いてさらに配列決定された。p53遺伝子の領域は、オリゴヌクレオチドTP53エキソン1 3.1F(テイルGAAACTTTCCACTTGATAAGAGGTC)およびTP53エキソン4 8.1R(テイルGCCCCTGTCATCTTCTGTCC)を用いて増幅した。PCRミックスは、1×Thermopol(サーモポル)バッファー(緩衝剤)、26U/mlのTaq DNAポリメラーゼ、0.52μMの各オリゴヌクレオチドから成っていた。反応1は、各天然ヌクレオチドの200μM(dATP、dCTP、dGTP、dTTP)を含んだ。反応2は、およそ200μmのdATPおよびdGTP、198μMのdCTPおよびdTTPおよび2μMのdPTPを含んだ。反応3は、およそ200μMのdATPおよびdGTP、180μMのdCTPおよびdTTPおよび20μMのdPTPを含んだ。増幅は以下の条件を用いて行った:94℃3分間、続いて94℃30秒間の38サイクル、50℃30秒間、72℃5分間である。サイクリング後、試料を72℃で5分間インキュベーションし、そして温度を4℃に低下させた。p53標的鋳型はマスターミックスにおいてPhusion(フージョン)ポリメラーゼを用いて試料NA18507(ヒト1)から増幅したPCR産物のアリコートであった(1×最終濃度)。陰性コントロール(鋳型なし)も含めた。
PCR反応1および3を、TAEにおいてSYBR(R)Safe(セーフ)事前染色1%アガロースゲル上にロードし、そして予想されるサイズのゲルバンドを、製造業者のプロトコルに従ってQIAQuick Gel(QIAクイック・ゲル)抽出キットを使用して切り出した。DNAは、30μlのElution Buffer(溶出緩衝剤)で溶出した。増幅の第二ラウンドは、前述のプライマーを伴うHiFi緩衝剤において、Phusionポリメラーゼを使用して実行した。以前の溶出DNAの1μlを、第二PCR反応(100μlの合計容量)のための鋳型として使用した。PCR条件は以下の通りであった:98℃1分間、次いで98℃10秒間の38サイクルを続け、50℃30秒間、72℃5分間である。サイクリング後、試料を72℃で5分間インキュベートし、そして4℃で貯蔵した。PCR反応は、TAEにおいてSYBR(R)Safe事前染色した1%アガロースゲル上にロードし、そして予想サイズのDNAバンドを、QIAQuick Gel抽出キットを用いて切り出した。DNAは30μlのEBにおいて溶出した。
溶出したDNAは、標準的なプロトコルに従って、試料あたり10μlの合計容量において1XのThermopolバッファーでのdATPおよびTaqにより30分間74℃でA-テイル化した(A-tailed)。A-テイルDNAの3.5μlアリコートを、Quick(クイック)リガーゼ〔New England Biolabs(ニュー・イングランド・バイオラボ社)〕を使用して、pGEM(R)T Easy(イージィー)ベクター〔Promega(プロメガ)〕中に連結した。連結物をXL10 Gold(ゴールド)コンピテント細胞に形質転換した〔Stratagene(ストラタジーン)〕。抗生物質を含む寒天プレートに37℃で一晩インキュベートした後、単一のコロニーを採取し、そしてLuria Broth(ルリア・ブロス)中に接種した。プラスミドDNAは、QIAprep Spin Miniprep(キアプレプ・スピン・ミニプレプ)キット〔QIAGEN(キアゲン社)〕を用いて、各クローンからの細菌培養物の約3mlから調製した。プラスミドDNAは、EBの50μlにおいて溶出した。クローンは、インサートの存在についてEcoRIでの制限酵素消化によってスクリーニングした。陽性クローン(自然なdNTPsでのPCRからの三つのクローンおよびdPTPの存在下でのPCRからの6つのクローン)は、pGEM(R)-T Easy(イージー)ベクター配列に相同なSP6およびT7プライマーおよびまた、修飾ヌクレオチド組込みの検証のためのp53配列挿入物に特異的な内部プライマーを伴うキャピラリー配列決定によって配列決定した。
図11は、三つのランダムクローンA、BおよびDからのSBS配列決定結果を示す。配列は、組み込まれた合成SNPsが点在する自然のSNPsを実証するp53geneの領域からの配列実行(sequence run)を表す。自然なヘテロ接合SNPsのおおよその位置は、グラフ上の星で表される。縦線はSNPsの位置を表し、そして合成SNPの組込みのランダムな、および空間的な分散性を実証する。
配列決定データに基づいて、自然に発生するSNPsが正しく識別され、そしておよそ800bpの決定可能な配列の平均配列リード長さを有するp53遺伝子からの配列決定セクションにおいて整列されたことが決定された。
本出願で言及するすべての刊行物および特許は、ここに参照することによって組み込まれる。本開示に記載された方法および組成物の種々の修飾および変形は、この技術の熟練者には本発明の範囲および精神から離れることなく明らかであろう。
数多くの実施形態を説明した。本発明は特定の好適実施形態に関連して説明したが、特許請求された本発明はそのような特定の実施形態に不当に制限されるべきではないことを理解すべきである。実際、ここに開示するようにして記載した方法の様々な修飾は、関連分野の熟練者には明らかであり、以下の請求の範囲の視野内にあることが意図される。

Claims (33)

  1. 核酸サンプルのシーケンスを決定するための方法であって、次の
    a)複数の合成多形性を含むように修飾された第一の複数の核酸フラグメントを提供すること、
    b)第二の複数の核酸フラグメントまれる核酸ライブラリーを用意することでありそこでは前記用意することには、前記第一の複数の核酸フラグメントを増幅させること、および前記第二の複数の核酸フラグメントを生成するために増幅の生成物をランダムにフラグメント化することが含まれ、そこでは、ライブラリーにおける個々のフラグメントは、(i)第一の複数のフラグメントよりも短く、および(ii)ライブラリーにおいて少なくとも一つの他のフラグメントとのシーケンスオーバーラップの領域をもち、そこでは、シーケンスオーバーラップの領域には、少なくとも一つの前記複数の合成多形性が含まれること、
    c)前記核酸ライブラリーの核酸フラグメントをシーケンシングすること、および
    d)核酸サンプルのシーケンスを決定するために、シーケンシングされたフラグメントの間で複数の合成多形性を整列させること
    を含む、方法。
  2. 前記複数の合成多形性は、特定の位置にて自然なヌクレオチドを置換する複数の修飾ヌクレオチドである、請求項1に記載の方法。
  3. 修飾ヌクレオチドは、8-オキソグアニン、dPTP、イソシトシンおよびイソグアニンからなる群より選ばれる、請求項2に記載の方法。
  4. 前記修飾には、前記第一の複数の核酸フラグメントにおけるシトシンの部分的な、および不完全なビスルフィット変換が含まれる、請求項1ないし3のいずれか一項に記載の方法。
  5. 前記整列には、第一の核酸フラグメントシーケンスにおける合成多形性のパターンを第二の核酸フラグメントシーケンスにおける合成多形性の同様なパターンとマッチングさせること、および前記マッチングを複数の核酸フラグメントシーケンスにより繰り返すことが含まれ、それによって複数の核酸フラグメントにおいて複数の合成多形性に基づくシーケンスアラインメントが作り出される、請求項1ないし4のいずれか一項に記載の方法。
  6. 前記シーケンシングは、合成によるシーケンシング、ハイブリダイゼーションによるシーケンシング、ライゲーションによるシーケンシング、単一分子シーケンシング、ナノポアシーケンシング、ピロシーケンシングおよびポリメラーゼ連鎖反応からなる群より選ばれる方法である、請求項1ないし5のいずれか一項に記載の方法。
  7. 前記決定には、蛍光検出が含まれる、請求項1ないし6のいずれか一項に記載の方法。
  8. 前記マッチングはコンピュータ実行方法によって行われる、請求項5に記載の方法。
  9. 核酸サンプルの前記シーケンスには、一以上のハプロタイプが含まれ、および方法にはさらに、核酸サンプルにおいて二以上のハプロタイプのフェーズを決定することが含まれる、請求項1ないし8のいずれか一項に記載の方法。
  10. フェージングのためのハプロタイプは、異なったシーケンシングされたフラグメント上に位置する、請求項9に記載の方法。
  11. 核酸サンプルの一以上のハプロタイプを特徴付けるための方法であって、次の、
    a)フラグメント化された核酸のプールを提供すること、
    b)前記プールのフラグメント化された核酸において複数の合成多形性を、複数の合成多形性が含まれるフラグメントを生成するために導入すること、
    c)複数の合成多形性が含まれるフラグメントよりも長さが短い核酸フラグメントのライブラリーを用意することでありそこでは前記用意することには、複数の合成多形性が含まれる前記フラグメントを増幅させること、および前記ライブラリーを生成するために増幅の生成物をランダムにフラグメント化することが含まれ、そこでは、ライブラリーにおける個々のフラグメントは、ライブラリーにおいて少なくとも一つの他のフラグメントとのシーケンスオーバーラップの領域をもち、およびそこでは、シーケンスオーバーラップの領域には、少なくとも一つの前記複数の合成多形性が含まれること、
    d)ライブラリーにおいて核酸フラグメントをシーケンシングすること、
    e)シーケンシングされた核酸フラグメントの合成多形性を整列させること、および
    f)シーケンシングされた核酸フラグメントの整列させた合成多形性からの核酸サンプルの一以上のハプロタイプを特徴付けること
    を含む、方法。
  12. 複数の合成多形性は複数の一塩基多型である、請求項11に記載の方法。
  13. 前記複数の一塩基多型は組込みの部位にて自然ヌクレオチドを置換する、請求項12に記載の方法。
  14. 前記一塩基多型には、複数の修飾ヌクレオチドが含まれる、請求項12または13に記載の方法。
  15. 修飾ヌクレオチドは、8-オキソグアニン、イソシトシン、イソグアニンおよびdPTPからなる群より選ばれる、請求項14に記載の方法。
  16. 前記導入には、フラグメント化された核酸におけるシトシンの部分的な、および不完全なビスルフィット変換が含まれる、請求項11ないし15のいずれか一項に記載の方法。
  17. 前記整列には、第一の核酸フラグメントシーケンスにおける合成多形性のパターンを第二の核酸フラグメントにおける合成多形性の同様なパターンとマッチングさせること、および前記マッチングを複数の核酸フラグメントシーケンスにおいて繰り返すことが含まれ、それによってシーケンシングされた核酸フラグメントにおいて合成多形性からのシーケンスアラインメントが作り出される、請求項11ないし16のいずれか一項に記載の方法。
  18. 前記シーケンシングは、合成によるシーケンシング、ハイブリダイゼーションによるシーケンシング、ライゲーションによるシーケンシング、単一分子シーケンシング、ナノポアシーケンシング、ピロシーケンシングおよびポリメラーゼ連鎖反応からなる群からのものである、請求項11ないし17のいずれか一項に記載の方法。
  19. 前記特徴付けることには、蛍光検出が含まれる、請求項11ないし18のいずれか一項に記載の方法。
  20. さらに、核酸サンプルにおいて二以上のハプロタイプのフェーズを決定することが含まれる、請求項11ないし19のいずれか一項に記載の方法。
  21. フェージングのためのハプロタイプは、異なったシーケンシングされたフラグメント上に位置する、請求項20に記載の方法。
  22. 核酸サンプルの一以上のハプロタイプを識別するための方法であって、次の、
    a)複数のヌクレオチドをもつ核酸分子を提供すること、
    b)複数のヌクレオチドを核酸分子において修飾すること、それにより、自然なヌクレオチドおよび修飾されたヌクレオチドを含む修飾された核酸分子が提供されること、
    c)第一の長さの複数の修飾された核酸コピーを生成させるために、修飾された核酸分子を増幅させること、
    d)第二の長さの核酸フラグメントのライブラリーを生成させるような条件下に増幅された修飾核酸コピーをフラグメント化することであり、そこでは、ライブラリーにおける個々の核酸フラグメントは、ライブラリーにおいて少なくとも一つの他の核酸フラグメントとのシーケンスオーバーラップの領域をもち、およびそこでは、シーケンスオーバーラップの領域には、少なくとも一つの修飾されたヌクレオチドが含まれること、
    e)ライブラリーの核酸フラグメントのシーケンスを決定すること、および
    f)核酸フラグメントのシーケンスを、核酸分子の一以上のハプロタイプを識別するために、シーケンスオーバーラップの領域において修飾されたヌクレオチドの位置によって整列させること
    を含む、方法。
  23. 核酸分子には、シーケンスの長さに従っていくつかの異なるヌクレオチドタイプが含まれる、請求項22に記載の方法。
  24. 唯一のいくつかの異なるヌクレオチドタイプは修飾された核酸分子において修飾される、請求項23に記載の方法。
  25. 一つのタイプのヌクレオチドのすべては、修飾された核酸分子において修飾される、請求項24に記載の方法。
  26. 一つのタイプのヌクレオチドのサブセットは、修飾された核酸分子において修飾される、請求項24に記載の方法。
  27. さらに、核酸分子において少なくとも二つのハプロタイプのためのフェーズを定めることが含まれる、請求項22ないし26のいずれか一項に記載の方法。
  28. フェージングのためのハプロタイプは、異なったシーケンシングされたフラグメント上に位置する、請求項27に記載の方法。
  29. 核酸分子には、シーケンスの長さに従っていくつかの異なるヌクレオチドタイプが含まれ、そこでは、少なくとも二つのハプロタイプはいくつかの異なるヌクレオチドタイプの二つのための二対立遺伝子であり、および第三のヌクレオチドタイプは修飾された核酸分子において修飾される、請求項27または28に記載の方法。
  30. 少なくとも二つのハプロタイプはA、TおよびGからなる群より選ばれるヌクレオチドタイプのための二対立遺伝子であり、およびCは修飾された核酸分子においてUに修飾される、請求項29に記載の方法。
  31. 少なくとも二つのハプロタイプはTおよびGのための二対立遺伝子であり、およびCは修飾された核酸分子においてUに修飾される、請求項30に記載の方法。
  32. 少なくとも二つのハプロタイプはA、TおよびCからなる群より選ばれるヌクレオチドタイプのための二対立遺伝子であり、およびGは修飾された核酸分子において8-オキソ-Gに修飾される、請求項29に記載の方法。
  33. 少なくとも二つのハプロタイプはCおよびTのための二対立遺伝子であり、およびGは修飾された核酸分子において8-オキソ-Gに修飾される、請求項32に記載の方法。
JP2015522158A 2012-07-18 2013-05-20 ハプロタイプの決定およびハプロタイプのフェージングのための方法およびシステム Active JP6091613B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261673052P 2012-07-18 2012-07-18
US61/673,052 2012-07-18
PCT/GB2013/051305 WO2014013218A1 (en) 2012-07-18 2013-05-20 Methods and systems for determining haplotypes and phasing of haplotypes

Publications (2)

Publication Number Publication Date
JP2015522289A JP2015522289A (ja) 2015-08-06
JP6091613B2 true JP6091613B2 (ja) 2017-03-08

Family

ID=48577136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015522158A Active JP6091613B2 (ja) 2012-07-18 2013-05-20 ハプロタイプの決定およびハプロタイプのフェージングのための方法およびシステム

Country Status (7)

Country Link
US (4) US9977861B2 (ja)
EP (1) EP2875150B1 (ja)
JP (1) JP6091613B2 (ja)
CN (2) CN104508144B (ja)
AU (1) AU2013291816B2 (ja)
CA (1) CA2873327C (ja)
WO (1) WO2014013218A1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9238836B2 (en) 2012-03-30 2016-01-19 Pacific Biosciences Of California, Inc. Methods and compositions for sequencing modified nucleic acids
US9977861B2 (en) * 2012-07-18 2018-05-22 Illumina Cambridge Limited Methods and systems for determining haplotypes and phasing of haplotypes
US9792405B2 (en) 2013-01-17 2017-10-17 Edico Genome, Corp. Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform
US10691775B2 (en) 2013-01-17 2020-06-23 Edico Genome, Corp. Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform
EP2994749A4 (en) 2013-01-17 2017-07-19 Edico Genome Corp. Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform
US10847251B2 (en) 2013-01-17 2020-11-24 Illumina, Inc. Genomic infrastructure for on-site or cloud-based DNA and RNA processing and analysis
US9679104B2 (en) 2013-01-17 2017-06-13 Edico Genome, Corp. Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform
US10068054B2 (en) 2013-01-17 2018-09-04 Edico Genome, Corp. Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform
GB201410646D0 (en) 2014-06-14 2014-07-30 Illumina Cambridge Ltd Methods of increasing sequencing accuracy
WO2016057947A1 (en) * 2014-10-10 2016-04-14 Cold Spring Harbor Laboratory Random nucleotide mutation for nucleotide template counting and assembly
KR20200020997A (ko) 2015-02-10 2020-02-26 일루미나, 인코포레이티드 세포 성분을 분석하기 위한 방법 및 조성물
WO2016154154A2 (en) 2015-03-23 2016-09-29 Edico Genome Corporation Method and system for genomic visualization
CA2996865A1 (en) * 2015-09-01 2017-03-09 Recombinetics, Inc. Method of identifying the presence of foreign alleles in a desired haplotype
US20170270245A1 (en) 2016-01-11 2017-09-21 Edico Genome, Corp. Bioinformatics systems, apparatuses, and methods for performing secondary and/or tertiary processing
US10068183B1 (en) 2017-02-23 2018-09-04 Edico Genome, Corp. Bioinformatics systems, apparatuses, and methods executed on a quantum processing platform
CN108241792B (zh) * 2016-12-23 2021-03-23 深圳华大基因科技服务有限公司 一种整合多平台基因分型结果的方法和装置
WO2018232580A1 (zh) * 2017-06-20 2018-12-27 深圳华大基因研究院 基于三代捕获测序对二倍体基因组单倍体分型的方法和装置
GB201802744D0 (en) 2018-02-20 2018-04-04 Longas Tech Pty Ltd Method
WO2019195268A2 (en) 2018-04-02 2019-10-10 Grail, Inc. Methylation markers and targeted methylation probe panels
ES2965194T3 (es) * 2018-08-13 2024-04-11 Illumina Singapore Pte Ltd Algoritmo de secuenciación
CN109273052B (zh) * 2018-09-13 2022-03-18 北京百迈客生物科技有限公司 一种基因组单倍体组装方法及装置
WO2020069350A1 (en) 2018-09-27 2020-04-02 Grail, Inc. Methylation markers and targeted methylation probe panel
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
CN117711488B (zh) * 2023-11-29 2024-07-02 东莞博奥木华基因科技有限公司 一种基于长读长测序的基因单倍型检测方法及其应用

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6051380A (en) 1993-11-01 2000-04-18 Nanogen, Inc. Methods and procedures for molecular biological analysis and diagnostics
US5641658A (en) 1994-08-03 1997-06-24 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid with two primers bound to a single solid support
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
JP2001517948A (ja) 1997-04-01 2001-10-09 グラクソ、グループ、リミテッド 核酸配列決定法
AU6846698A (en) 1997-04-01 1998-10-22 Glaxo Group Limited Method of nucleic acid amplification
US5888737A (en) 1997-04-15 1999-03-30 Lynx Therapeutics, Inc. Adaptor-based sequence analysis
EP1496120B1 (en) 1997-07-07 2007-03-28 Medical Research Council In vitro sorting method
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US7071324B2 (en) 1998-10-13 2006-07-04 Brown University Research Foundation Systems and methods for sequencing by hybridization
DE10055368A1 (de) 2000-11-08 2002-05-29 Agrobiogen Gmbh Biotechnologie Verfahren zur Kennzeichnung von DNA enthaltenden Proben mittels Oligonukleotiden
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
GB0115194D0 (en) 2001-06-21 2001-08-15 Leuven K U Res & Dev Novel technology for genetic mapping
GB0127564D0 (en) 2001-11-16 2002-01-09 Medical Res Council Emulsion compositions
CA2473125A1 (en) 2002-01-09 2003-07-24 Jeffrey Christopher Gladnick Chair lift accessory for accommodating snowboarders and mountain bikers
US20040005294A1 (en) * 2002-02-25 2004-01-08 Ho-Young Lee IGFBP-3 in the diagnosis and treatment of cancer
US20040002090A1 (en) 2002-03-05 2004-01-01 Pascal Mayer Methods for detecting genome-wide sequence variations associated with a phenotype
WO2004042078A1 (en) 2002-11-05 2004-05-21 The University Of Queensland Nucleotide sequence analysis by quantification of mutagenesis
US20040224331A1 (en) * 2003-01-17 2004-11-11 The Trustees Of Boston University Haplotype analysis
EP2159285B1 (en) 2003-01-29 2012-09-26 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US7041455B2 (en) 2003-03-07 2006-05-09 Illumigen Biosciences, Inc. Method and apparatus for pattern identification in diploid DNA sequence data
EP1641809B2 (en) 2003-07-05 2018-10-03 The Johns Hopkins University Method and compositions for detection and enumeration of genetic variations
US7276338B2 (en) 2003-11-17 2007-10-02 Jacobson Joseph M Nucleotide sequencing via repetitive single molecule hybridization
CA2559209C (en) * 2004-03-08 2016-06-07 Rubicon Genomics, Inc. Methods and compositions for generating and amplifying dna libraries for sensitive detection and analysis of dna methylation
GB0507835D0 (en) 2005-04-18 2005-05-25 Solexa Ltd Method and device for nucleic acid sequencing using a planar wave guide
US7709197B2 (en) 2005-06-15 2010-05-04 Callida Genomics, Inc. Nucleic acid analysis by random mixtures of non-overlapping fragments
US20060287833A1 (en) 2005-06-17 2006-12-21 Zohar Yakhini Method and system for sequencing nucleic acid molecules using sequencing by hybridization and comparison with decoration patterns
US7514952B2 (en) 2005-06-29 2009-04-07 Altera Corporation I/O circuitry for reducing ground bounce and VCC sag in integrated circuit devices
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
JP5180845B2 (ja) 2006-02-24 2013-04-10 カリダ・ジェノミックス・インコーポレイテッド Dnaアレイ上でのハイスループットゲノム配列決定
SG10201405158QA (en) 2006-02-24 2014-10-30 Callida Genomics Inc High throughput genome sequencing on dna arrays
WO2007107710A1 (en) 2006-03-17 2007-09-27 Solexa Limited Isothermal methods for creating clonal single molecule arrays
CA2648149A1 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
US8148085B2 (en) 2006-05-15 2012-04-03 Sea Lane Biotechnologies, Llc Donor specific antibody libraries
US7910302B2 (en) 2006-10-27 2011-03-22 Complete Genomics, Inc. Efficient arrays of amplified polynucleotides
US8852864B2 (en) * 2008-01-17 2014-10-07 Sequenom Inc. Methods and compositions for the analysis of nucleic acids
JP2009215171A (ja) 2008-03-07 2009-09-24 Tokyo Institute Of Technology ヌクレオシドトリホスフェート誘導体
US8759037B2 (en) 2010-02-23 2014-06-24 Illumina Cambridge Limited Amplification methods to minimise sequence specific bias
GB201010232D0 (en) 2010-06-18 2010-07-21 Univ Leuven Kath Methods for haplotyping single cells
CA3067612A1 (en) * 2011-09-22 2013-03-28 Lineage Biosciences, Inc. Compositions and methods for analyzing heterogeneous samples
US9977861B2 (en) * 2012-07-18 2018-05-22 Illumina Cambridge Limited Methods and systems for determining haplotypes and phasing of haplotypes

Also Published As

Publication number Publication date
WO2014013218A1 (en) 2014-01-23
US20180322243A1 (en) 2018-11-08
JP2015522289A (ja) 2015-08-06
CN104508144A (zh) 2015-04-08
CA2873327C (en) 2019-07-09
US9977861B2 (en) 2018-05-22
EP2875150A1 (en) 2015-05-27
AU2013291816B2 (en) 2019-01-17
CN108486236A (zh) 2018-09-04
US11257568B2 (en) 2022-02-22
CN108486236B (zh) 2022-05-03
US20140024537A1 (en) 2014-01-23
US20220180969A1 (en) 2022-06-09
EP2875150B1 (en) 2017-05-17
CN104508144B (zh) 2018-04-17
US11605446B2 (en) 2023-03-14
CA2873327A1 (en) 2014-01-23
US20220180970A1 (en) 2022-06-09
AU2013291816A1 (en) 2014-11-27

Similar Documents

Publication Publication Date Title
US11605446B2 (en) Methods and systems for determining haplotypes and phasing of haplotypes
US11999949B2 (en) Methods for targeted genomic analysis
US20210121845A1 (en) Methods of sample preparation
US20190024141A1 (en) Direct Capture, Amplification and Sequencing of Target DNA Using Immobilized Primers
US8986958B2 (en) Methods for generating target specific probes for solution based capture
WO2021178893A2 (en) Linked paired strand sequencing
WO2018045109A1 (en) Methods and compositions for phased sequencing
US20220325317A1 (en) Methods for generating a population of polynucleotide molecules

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170207

R150 Certificate of patent or registration of utility model

Ref document number: 6091613

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250