JP2004501669A - シークエンシング方法および装置 - Google Patents
シークエンシング方法および装置 Download PDFInfo
- Publication number
- JP2004501669A JP2004501669A JP2002507300A JP2002507300A JP2004501669A JP 2004501669 A JP2004501669 A JP 2004501669A JP 2002507300 A JP2002507300 A JP 2002507300A JP 2002507300 A JP2002507300 A JP 2002507300A JP 2004501669 A JP2004501669 A JP 2004501669A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- base
- unknown
- reporter
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
塩基付加を用いて未知のヌクレオチド配列を同定する方法において、塩基の配列を鋳型から得て、配列中の塩基を未知塩基として確認し、“未知”インジケーターを配列中に含み、そして未知塩基インジケーターを含有する出力配列を作製する。レポーターの評価およびそれに従って塩基を帰属することにより塩基の配列を鋳型から得る。レポーターが塩基決定の先行するサイクルからであるかどうかを決定し、そして、もしレポーターが塩基決定の先行するサイクルからであれば、この塩基帰属は廃棄される。
Description
【0001】
(技術分野)
本発明は、個別の分子のシークエンシングの間にエラー訂正を可能にする、シークエンシング方法および装置に関する。
【0002】
(背景技術)
Sanger, F., S. Nicklen, and A. Coulson (Proc Natl Acad Sci USA, 1977. 74(12); p. 5463−7)により本質的に記載されているように、シークエンシングは鎖終結およびゲル分離の方法により日常的に実施される。この方法は、配列中のそれぞれの塩基における終結を表すDNA断片の混合集団の作製に依存する。それから、これらの断片の電気泳動分離により配列を決定する。
【0003】
シークエンシングのスループットを増加させる最近の努力は、電気泳動分離ステップを除外する代替法の開発をもたらしている。数多くのこれらの方法は塩基伸長(即ち塩基付加)を利用しそして例えばWO 93/21340、US 5,302,509およびUS 5,547,839に記載されている。これらの方法においては、シークエンシング用の試薬を作用させる前に鋳型もしくはプライマーを固体表面上に固定化する。固定化した分子をヌクレオチド類似体の存在下でインキュベートするが、これらは、その位置で水酸基を可逆的に保護する、糖残渣の3’炭素において修飾を有する。このような修飾したヌクレオチドのポリメラーゼによる組込みは、塩基伸長のそれぞれのサイクル間には唯一個のヌクレオチドが付加されることを保証する。それから、付加した塩基は、3’保護基中に組込んでいる標識によって検出される。検出に引き続いて、典型的には光化学的手段によって、保護基を除去して(即ち“切断して”)、次のサイクル間で塩基付加に利用できる遊離水酸基を露出させる。
【0004】
一般的に、非−分離に基づくアプローチは、与えられた標的からコンセンサス配列を作成すべきそれぞれの標的配列に対する多数の鋳型分子の存在に依存する。かくして、例えば、核酸の離散的スポットを尋問することにより、塩基伸長反応を多重鋳型に応用し得るが、それぞれは、空間的にアドレス可能なアレイに固定化された、多重度の分子を含む。
【0005】
しかしながら、ターミネーターの組込み/切断の反応、もしくは塩基切除はエラーを起こしやすい。例えば、上述のように、塩基伸長ストラテジーはヌクレオチド類似体を一般的に利用しているが、これらは、レポーター分子、通常蛍光体、の機能を糖部分上の3’位を占めるターミネーターのそれと結合させる。この基とその位置のかさ高い性質は、これらの化合物をポリメラーゼに対して高度に非効果的な基質にさせる。加えて、次の付加を可能にするためのターミネーター基の切断はまた非効率性を招きやすい。それぞれの標的に対して数千の、もしくは好ましくは数百万の、分子の存在下では、5%以下の少なめのエラーでさえも、少数のサイクル内において、それぞれの分子を表す多重度の鎖の間で、同調性の累積的な損失をもたらす。かくして、それぞれのサイクルのシークエンシングごとに、バックグランドノイズが累進的に増加して、それぞれの付加ごとでシグナルの必然的な劣化になる。これは、入手し得る配列データを持つ塩基数は、特定のシグナルがバックグランドから区別できなくなる前に、限られることを意味する。
【0006】
単一分子検出の方法における最近の進歩は(例えば、Trabesinger, W., et al., Anal Chem.,1999. 71(1); p. 279−83およびWO 00/06770に記載されている)、シークエンシングストラテジーを単一の分子へ応用することを可能にする。しかしながら、シークエンシングは、分子のクローン集団に応用すると、他の分子が未修飾のままでいる間に幾らかな分子が反応を受けることになる、確率的プロセスである。かくして、従来のシークエンシング方法においては、組込みミスのようなエラーは、存在する多数の分子がコンセンサスシグナルを得ることを保証するので、普通には重大な意義をもたない。これらの反応を単一分子に応用するときには、結果は効率的に量子化される。
【0007】
そのような単一分子シークエンシング方法は塩基切除に基づいていて、例えば、Hawkins, G. and L. Hoffman, Nature Biotechnology, 1997. vol. 15; p. 803−804およびUS 5,674,743に記載されている。このストラテジーでは、各塩基が適当なレポーターで標識化されるように単一の鋳型分子を作製する。この鋳型分子をエキソヌクレアーゼで消化しそして切除した塩基をモニターして同定する。これらの方法は、ラムダエキソヌクレアーゼのような高度処理性の酵素を使用するので、長さが数キロ塩基の大きい鋳型を分析する潜在性がある。しかしながら、それぞれの鋳型分子から切除した塩基をリアルタイムで連続的にモニターすることは、並行して分析できる分子の数を制限する。加えて、切除した塩基を生来の光学的もしくは化学的性質に基づいて検出できるように各塩基を適当なレポーターで標識化する場合には、鋳型を作成することが困難となる。
【0008】
塩基切除に基づく方法(BASSのような)はまた単一分子アプローチに適応されている。
しかしながら、これらの技法はエラーを起こしやすい。特に、修飾したヌクレオチドの組込みは、例えば、修飾したヌクレオチドとのポリメラーゼ作用の減少した効率の結果として、失敗し得る。レポーター分子が蛍光性分子である場合には、蛍光体が無くなったり、損傷されたり、漂白されたり、もしくは切除されなかったりするために、エラーが蛍光の失敗によってまた起こり得る。単一分子レベルでは、これらのような失敗は適切な配列を得る際に失敗をもたらす。
【0009】
本発明の一つの目的は、エラーの検出を可能にするシークエンシング方法を提供することである。本発明のさらなる目的は、個別の分子の行き先をシークエンシング反応によりモニターすることによって、分析およびエラーの防止、もしくは訂正、を可能にすることである。
【0010】
(発明の概要)
種々の態様におけるこの発明は上記の個別な請求項で規定されるが、それらについての参照をこれから行わねばならない。有利な特色は付随する請求項に示されている。
【0011】
簡潔に言えば、ヌクレオチド配列を分析する方法の形態を取るこの発明の一つの好ましい実施態様において、塩基の配列を鋳型から取得し、そして配列中の塩基を未知塩基として確認する。‘未知’インジケーターは未知塩基に相当する位置において配列中に含まれ、そして未知塩基インジケーターを含む出力配列が作製される。この好ましい実施態様において、レポーターの評価およびそれに従って塩基を帰属することにより塩基の配列を鋳型から得る。レポーターが塩基決定の先行するサイクルからであるかどうかを決定し、そして、もしレポーターが塩基決定の先行するサイクルからであれば、この塩基帰属は廃棄される。
分析すべきヌクレオチド配列はRNAもしくはDNA配列であってもよい。
【0012】
(図面の簡単な説明)
ここで、付随する図面を参照して実施例によりこの発明を詳細に説明するが、そこで図1は、核酸分子のような生物分子の配列を決定するための反応の間に得られるデータを解析する方法を図示しかつこの発明の好ましい実施態様を形成する工程図である。
【0013】
(好ましい実施態様の詳細な説明)
図1は、鋳型から配列情報を得る方法を例示する流れ図を示す。この方法は、(a)先行するサイクルから持ち越される塩基を確認しそして(b)塩基の標識失敗もしくは組込みミスから起こり得る休止分子を検出することによりエラーを追及する。このデータ解析法は、以下のように実施する標準的なシークエンシング反応を使用する。第一に、配列データを必要とする核酸分子、鋳型、を顕微鏡のスライドのような固体表面に結合させる。スライドを、例えば蛍光顕微鏡スキャナーにより観察するときにその位置を決定できるように、鋳型を標識化することができる。鋳型の配列における最初の塩基もしくはヌクレオチド、即ちA、C、GもしくはT、を蛍光的に標識化した塩基もしくは塩基を表す標識を付加する化学反応により検索する。これは、A、C、GもしくはTのいずれか一つであるか、または四つの異なる区別可能な標識で標識化されたそれら四個全部であり得る。鋳型中の第一の塩基は既知の様式で相補的な塩基に結合するであろう;即ち、AはTと結合し、そしてCはGと結合し、かつ逆の場合も同様である。鋳型をポリメラーゼ酵素で伸長するかもしくは標識化したオリゴヌクレオチドをリガーゼで連結することにより、塩基組込みを引き起こすことができる。標識化した塩基の組込みを検出し、そしてその同一性を決定する。それから、その塩基から標識を除去する。それから、このシリーズのステップを鋳型中の次に続く塩基に対して繰り返す。
【0014】
塩基の付加/組込みを伴う適切な標準的シークエンシング反応としては、WO 93/21340、US 5,302,509およびUS 5,547,839に記載されているような塩基伸長反応ならびにUS 5,763,175、US 5,599,675、US 5,856,093およびUS 5,715,330に記載されているような技法が挙げられるが、そこでは連続するラウンドのシークエンシングは、引き続く塩基の組込みに先立って鋳型の塩基切除を伴う。
【0015】
このシークエンシング反応を実施するときには、エラーが起こり得る。例えば、(i)塩基が間違って組込まれ得る、即ち組込みミスされる、または(ii)次のサイクルを実施する前に一つのサイクルから標識を除去することに失敗し得る、または(iii)どれか一つのサイクルにおいて塩基の組込みが失敗し得ることである。説明されるこの発明の好ましい実施態様において、シークエンス反応からのデータは、これらのエラーの影響を減少し得るような方式で導入される。
【0016】
固相上への分子の析出および固定の方法は技術上周知である。核酸を付着させる方法は、例えば、Schena (ed.), DNA Microarrays: A practical approach, Oxford University Press (1999) ISBN: 0199637768に総説がある。典型的には、固相はガラスであろうが、非晶性もしくは結晶性シリコンまたはプラスチックのような他の材料を用いることができる。
【0017】
複数の分子を規則正しいアレイで固相に付着させ得るが、さらに好ましくは、それらをランダム様式で付着させる。分子のランダム付着は、好ましくは、配列情報の光学的分解能に適した密度で分布させると、いかなる数の分子も含み得る。
【0018】
適切なレポーター部分は種々の既知な報告システムのいずれか一つであってもよい。それは、組込まれたヌクレオシド類似体が容易に検出されるようになる放射性同位元素、例えば、ホスフェートもしくはチオホスフェートまたはH−ホスホネート基に組み込まれた32P、33P、35S、もしくは他には3Hもしくは14Cまたはヨウ素同位元素であってもよい。それは、質量分析法もしくはNMRにより検出可能な同位体であってもよい。それは、シグナル部分、例えば酵素、ハプテン、蛍光体、化学体、化学発光基、ラマン標識もしくは電気化学的標識、もしくは質量分析法による検出に適応するシグナル化合物であってもよい。
【0019】
それぞれのシークエンシングステップは、個別の鋳型へのレポーター分子の取り付けをもたらすであろうし、かつ組込まれたレポーター部分の検出は塩基の同一性を帰属させることを可能にするであろう。蛍光性のレポーターの場合には、それから、例えば、蛍光顕微鏡法(例えばPMTもしくはCCDを用いて)によりこれらの分子が同定され、そしてレポーターの蛍光性質が、シークエンシング反応で組込まれた塩基への同一性の帰属を可能にするであろう。
【0020】
一連のラウンドのシークエンシングサイクルからのデータを収集するためには鋳型の位置を特定しなければならない。これは最初のサイクルのシークエンシングで並行して達成し得るが、この場合、最初の塩基中のレポーター分子が鋳型の位置を確認するかまたは鋳型および/もしくはプライマー自体が、シークエンシングサイクリング反応に先立って固相上の位置を検出し得るように、レポーター部分で標識化されていてもよい。それぞれの鋳型分子の位置を知ることにより、シークエンシングのサイクル間に続いて起こる全てのイベントに引き続いてそれぞれの分子の状態をモニターすることが可能になる。付加の引き続く失敗は、例えば、鋳型を含むと知られた位置における蛍光の欠如により、それ自身を顕在化する。刺激の欠如、もしくは化学的損傷のどちらかによるレポーターの失敗はまた、一旦鋳型の位置が決定されていると、決定されることができる。これらの失敗した反応を追跡し、レポーターの失敗によるポテンシャルギャップとして最終配列において処理することができる。もしこれらの分子が引き続くサイクルで関与を再開するならば、これもまた追跡して意味のある配列を得ることができる。単一の塩基ギャップの個別のポイントが確認され得てかつ、複数の同一配列が固体表面上に並べられているならば、シークエンシングアレイ中における鋳型の他のコピーの配列のような参照鎖との比較によりコンセンサス配列を構築することができる。他に、既知の配列であり得る参照鎖との比較により単一の塩基ギャップを確認し得る(例えば、この技法を突然変異の検出に応用する際に)。
【0021】
かくして、エラー、特に単一分子のシークエンシングに関連するエラーをこのシステムにおいて訂正することが可能であると我々は認識している。訂正の必要なエラーは、レポーターの切断および次のサイクル前の除去の失敗、組込みの失敗、レポーターへの損傷(例えば、蛍光体への損傷)ならびに組込みミスである。
【0022】
一旦位置を特定すると、位置を特定した分子に対する全てのシークエンシングサイクルの結果は測定可能であろう。二つのセットのヌクレオチド類似体を用いることにより、先行するサイクルから持ち越されているレポーターの確認が可能になる。それ故に、先行するサイクルからのレポーターの再現を確認してモニターすることができる。
【0023】
鋳型分子の位置を知ることにより、伸長していないように見える鋳型の確認がまた可能になる。上で議論したように、レポーター分子を観察する失敗は組込みの欠如に起因し得るが、レポーター部分への損傷にも起因し得る。しかしながら、損傷した分子の存在は、分解生成物および副反応の生成物を確認して除去することができる修飾ヌクレオチド合成の間での精製プロセスにより効果的に最小化することができるので、蛍光の不在は、それ故に、修飾したヌクレオチドを組込む失敗の結果である可能性が高い。
【0024】
もし、いずれかのサイクルのシークエンシングの後で、鋳型分子がいずれのレポーターとも関連しなければ、したがってこのポイントにおいて配列をマークして“休止”と表示する。次のラウンドのシークエンシングにおいて、それから鋳型分子をレポーターと関連させ得る、即ち、“休止”分子は伸長を再開して配列データが得られるようにする。しかしながら、鋳型分子は一つ以上のサイクルに対する関連を欠き続けるであろうし、そして配列はそれぞれのサイクルに対して休止としてマークされるであろう。
【0025】
シークエンシングの間に作製される位置マーカーは、参照配列と共に作製される配列と比較するかもしくは当業者に既知のアラインメントアルゴリズムの一つを用いてシークエンシング手順間に作製される他の配列と比較するとき、アラインメント中のギャップを解釈するのに有用であろう。
【0026】
使用した適切なポリメラーゼおよびリガーゼの生来の性質を知ると、組込みミスの位置を予想することが可能である。例えば、ミスマッチした末端塩基を含むプライマー配列は、マッチした配列より102〜106−倍低い伸長効率を持って、ポリメラーゼに対してより劣った鋳型であることは当業者に既知である(Huang, M., N. Arnheim, and M. Goodman, Nucleic Acids Res, 1992. 20(17): p. 4567−73; Tindall KR, K. T., Biochemistry, 1988. 27(16): p. 6008−13; Esteban, J., M. Salas, and L. Blanco, J Biol Chem, 1993. 268(4): p. 2719−26を参照)。数回のサイクル間にもしくはシークエンシングプロトコールの最後まで休止のままである分子は、それ故に、末端ミスマッチを含む公算がはるかに高い。そのような休止を受ける鋳型は、それ故に、ミスマッチによる潜在的終結として最後の塩基呼出し位置において標識化される。それから、配列が決定された断片の同定は、参照配列もしくは同一の試料からの他の配列が決定された鋳型へのアラインメントにより達成される。マークした位置で起こるミスマッチは、真の配列を表すことよりむしろ組込みミスの結果である可能性がより高いために、それに従って解釈され得る。
【0027】
そのために鋳型分子が休止するサイクルの数は、組込まれたレポーターの欠如の連続的検出により計数することができる。偶然に起因する連続的休止の公算に対する閾値を配列データの解析の間にセットすることができる。それ以上ではミスマッチに起因すると分類され得る連続的休止の閾値は、ポリメラーゼ依存性塩基伸長かもしくは配列依存性連結反応のどちらかによる標識化の効率に依存する。例えば、偶然に起因する連続的休止の公算に対する閾値が1×10−6%にセットされるならば、休止がミスマッチとして計数される前に、標識化の異なる効率を考慮して、下記の数の休止を計数する。
【0028】
【表1】
【0029】
比較的大きい確実性をもって、閾値を適当に増加させてもよい。必要な確実性の程度はシークエンシングの応用の許容度に依存するであろう;目的が配列の差を正確に決定するよりむしろ鋳型の断片を単に確認するだけならば、あまり厳格でないカットオフを許容できる。標識組込みのより低い効率の影響はまたシークエンシングの冗長度の程度により相殺することができる。この例における、組込みミスの確率は統計的に処理される。
【0030】
主として蛍光により、単一分子を映像化して位置を特定することは当業者に既知である(Trabesinger, W., et al., Anal Chem., 1999. 71(1): p. 279−83; Harms, G., et al., Biophys. J., 1999. 177: p. 2864−2870; Deschryver, F., Pure & Appl. Chem, 1998. 70: 2147−2156; Bartko, A. and R. Dickson, J Phys Chem B, 1999. 103: p. 11237−11241を参照)。位置および標識のタイプに関する情報を含むデータファイルは、それ故に、容易に作成される。この発明の一つの実施態様において、配列データの解析は、シークエンシング手順の最後でそして全てのシークエンシングデータを得た後で実施される。一つもしくはそれ以上のファイルの中で、このデータを解析して、鋳型の位置を決定しかつこれらの位置に取り付けたいかなるレポーターも同定し得る。それから、そのようなデータを第二の解析に付して、全ての位置を確定した鋳型に対する配列を構築する。
【0031】
好ましくは、シークエンシング反応のサイクルおよびデータ解析を並行して実施する。この例では、それぞれのサイクルから作製されたデータを解析して、レポーター分子の位置を確定して、それからこれらの位置を鋳型の位置と相関させる。それから、それぞれの位置を確定した鋳型に対する配列をそれぞれの連続したサイクルで構築する。
【0032】
この発明を具体化するこの好ましい手順をこれから図1を参照して説明する。 図1に図示するシステムにおいて、配列が決定されるべき分子は技術的に記載されているような標準手順により固相上に固定されている。(Schena (ed.), DNA Microarrays: A practical approach, Oxford University Press (1999) ISBN: 0199637768に総説がある)。顕微鏡のスライドのような固体表面に結合させた鋳型を標識化し、それでスライドを、例えば蛍光顕微鏡スキャナーにより観察するときに、その位置を決定することができる。ステップ10において、適切な鋳型の位置が先ず確定される。
【0033】
今やステップ12で実施するのは、ポリメラーゼ酵素で鋳型を伸長することにより、もしくは標識化したオリゴヌクレオチドをリガーゼで連結することにより引き起される塩基組込みを伴うシークエンシング反応である。
【0034】
上述のように、シークエンシングステップは、鋳型の配列中で最初の塩基へのレポーター分子の取り付けをもたらすであろうし、そしてステップ14では、組込まれるレポーター部分の検出により帰属すべき塩基の同一性を可能にする。次のステップ、ステップ16は塩基および鋳型の位置を相関させる;最初のサイクルではこれはささいなステップである。それから、鋳型分子がレポーターと関連しているかどうかを決定する。即ち、ステップ18において、対象とする鋳型がレポーターを持つかどうかをテストする。もしもシークエンシング手順の後で鋳型がレポーターと関連するならば、ステップ20に手順を移動する。ここで、レポーターが先行するサイクルから来るかどうかを決定するテストを行う。そうでなければ、それからレポーターを確認して、そしてステップ22で新しい塩基を帰属する。かくして、塩基は正確に同定されて、全てよしとなる。
【0035】
それから、手順をステップ24へ移動し、ここではもはや鋳型はないかどうかについてテストする。もしあれば、手順をステップ18から繰り返す。
もしもステップ20で塩基に関連するレポーターが先行するサイクルからであると決定されるならば、ステップ26では何も塩基を帰属しないで、そして手順はステップ24へおよび、もしあれば次の鋳型へ、直行する。
【0036】
もしステップ18で鋳型はレポーターを持たないと見出されるならば、ステップ50でミスマッチフラグが立っているかどうかについてチェックをする。連続した休止の数が、ステップ30で行うテストに従って、予め決めた極大値を越えるときには、ミスマッチフラグが活性化される。ミスマッチフラグが立っていなければ、手順をステップ28へ移動し、休止Pを配列中に挿入する。また、起こっている連続休止の数をモニターする、休止カウンターを1個だけ追加する。テストをステップ30で行って、連続した休止の数が予め決めた閾値または極大値を越えるかどうかを決定する。もし越えていなければ、手順をステップ24へ移動し、休止を配列中に残す。もし連続した休止の数が予め決めた極大値を越えるならば、先行する塩基をミスマッチしたとして得点し、ステップ32でミスマッチフラグを活性化して、そして手順をステップ24へ進める。
【0037】
休止インジケーターは、未知塩基の表示を与える機能として働く。これは塩基A、C、GおよびTのいずれか一つであると証明するか、もしくは事実全く塩基でないと証明するかもしれない。未知塩基の可能性を与えることにより、その鋳型についての情報は完全には廃棄されない。むしろ、下記の実施例で説明するように、例えば参照配列と参照して、それをなお使用する。
【0038】
もしステップ20でレポーターが先行するサイクルからであると決定されるならば、ステップ52でミスマッチフラグが立っているかどうかについてチェックをする。もしミスマッチフラグが立っていなければ、手順をステップ22へ移動し、塩基を帰属する。それから、手順をステップ24へ移動し、処理すべきもう一つの鋳型があるかどうかを決定する。
【0039】
もしミスマッチフラグが立っているならば、ステップ54で、先に帰属した塩基は、ミスマッチした一つを除く全ての他の塩基を表すIUBコードと取り替えられる。これは、もしも先行する塩基が“C”と表示されたが今やミスマッチしたと知られるならば、この塩基はA、GもしくはTのいずれかであることが明らかであるからである。
【0040】
さらに鋳型がないときには、ステップ24におけるテストは結果NOとなり、そして手順をステップ34へ移動して、そこで完成すべきサイクルがまだあるかどうか、即ち、その分子に対する塩基がまだあるかどうかを決定する。もしあれば、手順を次のサイクルのためのデータ、ステップ36、へ移動し、その後で処理を再びステップ16から進めて塩基および鋳型の位置を相関させる。
最終的には、ステップ34におけるテストは結果NOとなるであろうが、それでステップ38においてこの手順の終了となる。
【0041】
次に続く処理は、図1のシステムにより作成したような配列に応用されるもので、例えば、この方法で見出された配列を参照配列と比較することである。この実施例を以下に説明する。
化学反応を伴うステップ10〜14に引き続く、図1に示すステップをパソコン(PC)のようなデジタルコンピュータ上に構築する。二つの実施例を、この明細書につけた付録での擬似コードを経由してさらに詳細に示す。最初の擬似コードは、ヌクレオチドが全ての四つの塩基、A、C、GおよびT、の混合物により検索されることを仮定し、そして第二の擬似コードは、四つの塩基を別々に順次用いるときに使用する。
【0042】
本発明は多くの応用を有するが、その幾らかをここに示す。例えば、この方法を用いてDNAおよびRNAのゲノムの配列を決定することができる。さらに、領域もしくは全体のゲノムにおける、領域もしくは全体のゲノムのmRNA表現における、または一つもしくはそれ以上の塩基の置換、欠失もしくは挿入から生じる、ゲノムの人工的に作製した表現(例えば、ゲノム領域のPCR生成物)における、配列変異を同定することができる。
【0043】
本発明は、ハプロタイピング(個体における染色体対間の配列差を決定する)にもまた定量的なmRNA発現分析にも、例えば異なる細胞タイプ(組織)もしくは異なって処理した細胞から誘導した試料間でmRNA発現のレベルを比較するのに、応用される。この技法はまた、病原体の検出および同定に使用するために、病原体ゲノムから誘導された配列を同定するのに応用し得る。
【0044】
ここに示す実施例は、決定された配列におけるエラーを減少させるようにこのシステムにより特定の配列を取り扱う方式に与えられる。
【0045】
実施例1
シークエンシング反応から次の配列が得られるが:
【化1】
式中、1は一個のTが組込まれていることを示す(そして2=C、3=A、4=G)。
サイクルの閾値数のため一層の伸長の失敗は、配列にマークをつけて塩基が休止の閾値数に先立って組込みミスされていることを示すことをもたらす。ここで、1(一つ)は一個のTが、予め決定された閾値レベル以上の数の休止に先立って、組込まれていることを示し、かくして組込みミスされている可能性がある。それ故に、配列は多分廃棄される。図1に関しては、YESがステップ30において出力されるまで、予め決められた数のステップに対して手順をパス28と30に進め、そして先行する塩基をステップ32でミスマッチしたとしてマークする。1の代わりに他の塩基に対して、2,3もしくは4を用いるが、2はCを示し、3はAを示し、そして4はGを示す。
【0046】
実施例2
シークエンシング反応から次の配列が得られる。一番目は新しく決定された配列であり、二番目は参照配列である:
【化2】
サイクルの閾値数より長い休止は、組込みミスとしてTの代わりに一つの1をマークする。この場合においては、シークエンシングを閾値数の配列の後で再開している。得られた配列を参照配列と比較するとき、配列アラインメントは休止した位置においてT.1アラインメントを表示する。それ故に、それは参照配列との現実の塩基差として差引くことができる。この配列アラインメントは図1に図示した処理に追加的な段階を表す。
【0047】
実施例3
シークエンシングの間に休止に遭遇すると、その位置をPとしてマークする。もし以下の新しい及び参照配列が得られると:
【化3】
Pでマークした位置におけるギャップの存在もしくは不存在下における参照配列との配列アラインメントは、それが休止であることを明らかにする。それ故に、全ての配列は隣接してかつ有用である。ここでも配列アラインメントは図1に図示した処理に追加的な段階を表す。
【0048】
実施例4
シークエンシング反応から次の配列が得られる:
【化4】
Pでマークした位置は失敗したレポーターを持つ塩基の組込みである。マークした位置におけるギャップの存在もしくは不存在下における参照配列との配列アラインメントは、これが配列中のギャップであることを明らかにする。取り出した配列は有用のままである。この例において、Pを‘N’で置換して配列中のギャップを意味することもできる。ここでも配列アラインメントは図1に図示した処理に追加的な段階を表す。
【0049】
付録
第一擬似コード
シークエンシング反応完了後の配列集合のための擬似コードの例
【0050】
第二擬似コード
一連の単一塩基シークエンシングのための擬似コード
【図面の簡単な説明】
【図1】図1は、核酸分子のような生物分子の配列を決定するための反応の間に得られるデータを解析する方法を図示しかつこの発明の好ましい実施態様を形成する工程図である。
(技術分野)
本発明は、個別の分子のシークエンシングの間にエラー訂正を可能にする、シークエンシング方法および装置に関する。
【0002】
(背景技術)
Sanger, F., S. Nicklen, and A. Coulson (Proc Natl Acad Sci USA, 1977. 74(12); p. 5463−7)により本質的に記載されているように、シークエンシングは鎖終結およびゲル分離の方法により日常的に実施される。この方法は、配列中のそれぞれの塩基における終結を表すDNA断片の混合集団の作製に依存する。それから、これらの断片の電気泳動分離により配列を決定する。
【0003】
シークエンシングのスループットを増加させる最近の努力は、電気泳動分離ステップを除外する代替法の開発をもたらしている。数多くのこれらの方法は塩基伸長(即ち塩基付加)を利用しそして例えばWO 93/21340、US 5,302,509およびUS 5,547,839に記載されている。これらの方法においては、シークエンシング用の試薬を作用させる前に鋳型もしくはプライマーを固体表面上に固定化する。固定化した分子をヌクレオチド類似体の存在下でインキュベートするが、これらは、その位置で水酸基を可逆的に保護する、糖残渣の3’炭素において修飾を有する。このような修飾したヌクレオチドのポリメラーゼによる組込みは、塩基伸長のそれぞれのサイクル間には唯一個のヌクレオチドが付加されることを保証する。それから、付加した塩基は、3’保護基中に組込んでいる標識によって検出される。検出に引き続いて、典型的には光化学的手段によって、保護基を除去して(即ち“切断して”)、次のサイクル間で塩基付加に利用できる遊離水酸基を露出させる。
【0004】
一般的に、非−分離に基づくアプローチは、与えられた標的からコンセンサス配列を作成すべきそれぞれの標的配列に対する多数の鋳型分子の存在に依存する。かくして、例えば、核酸の離散的スポットを尋問することにより、塩基伸長反応を多重鋳型に応用し得るが、それぞれは、空間的にアドレス可能なアレイに固定化された、多重度の分子を含む。
【0005】
しかしながら、ターミネーターの組込み/切断の反応、もしくは塩基切除はエラーを起こしやすい。例えば、上述のように、塩基伸長ストラテジーはヌクレオチド類似体を一般的に利用しているが、これらは、レポーター分子、通常蛍光体、の機能を糖部分上の3’位を占めるターミネーターのそれと結合させる。この基とその位置のかさ高い性質は、これらの化合物をポリメラーゼに対して高度に非効果的な基質にさせる。加えて、次の付加を可能にするためのターミネーター基の切断はまた非効率性を招きやすい。それぞれの標的に対して数千の、もしくは好ましくは数百万の、分子の存在下では、5%以下の少なめのエラーでさえも、少数のサイクル内において、それぞれの分子を表す多重度の鎖の間で、同調性の累積的な損失をもたらす。かくして、それぞれのサイクルのシークエンシングごとに、バックグランドノイズが累進的に増加して、それぞれの付加ごとでシグナルの必然的な劣化になる。これは、入手し得る配列データを持つ塩基数は、特定のシグナルがバックグランドから区別できなくなる前に、限られることを意味する。
【0006】
単一分子検出の方法における最近の進歩は(例えば、Trabesinger, W., et al., Anal Chem.,1999. 71(1); p. 279−83およびWO 00/06770に記載されている)、シークエンシングストラテジーを単一の分子へ応用することを可能にする。しかしながら、シークエンシングは、分子のクローン集団に応用すると、他の分子が未修飾のままでいる間に幾らかな分子が反応を受けることになる、確率的プロセスである。かくして、従来のシークエンシング方法においては、組込みミスのようなエラーは、存在する多数の分子がコンセンサスシグナルを得ることを保証するので、普通には重大な意義をもたない。これらの反応を単一分子に応用するときには、結果は効率的に量子化される。
【0007】
そのような単一分子シークエンシング方法は塩基切除に基づいていて、例えば、Hawkins, G. and L. Hoffman, Nature Biotechnology, 1997. vol. 15; p. 803−804およびUS 5,674,743に記載されている。このストラテジーでは、各塩基が適当なレポーターで標識化されるように単一の鋳型分子を作製する。この鋳型分子をエキソヌクレアーゼで消化しそして切除した塩基をモニターして同定する。これらの方法は、ラムダエキソヌクレアーゼのような高度処理性の酵素を使用するので、長さが数キロ塩基の大きい鋳型を分析する潜在性がある。しかしながら、それぞれの鋳型分子から切除した塩基をリアルタイムで連続的にモニターすることは、並行して分析できる分子の数を制限する。加えて、切除した塩基を生来の光学的もしくは化学的性質に基づいて検出できるように各塩基を適当なレポーターで標識化する場合には、鋳型を作成することが困難となる。
【0008】
塩基切除に基づく方法(BASSのような)はまた単一分子アプローチに適応されている。
しかしながら、これらの技法はエラーを起こしやすい。特に、修飾したヌクレオチドの組込みは、例えば、修飾したヌクレオチドとのポリメラーゼ作用の減少した効率の結果として、失敗し得る。レポーター分子が蛍光性分子である場合には、蛍光体が無くなったり、損傷されたり、漂白されたり、もしくは切除されなかったりするために、エラーが蛍光の失敗によってまた起こり得る。単一分子レベルでは、これらのような失敗は適切な配列を得る際に失敗をもたらす。
【0009】
本発明の一つの目的は、エラーの検出を可能にするシークエンシング方法を提供することである。本発明のさらなる目的は、個別の分子の行き先をシークエンシング反応によりモニターすることによって、分析およびエラーの防止、もしくは訂正、を可能にすることである。
【0010】
(発明の概要)
種々の態様におけるこの発明は上記の個別な請求項で規定されるが、それらについての参照をこれから行わねばならない。有利な特色は付随する請求項に示されている。
【0011】
簡潔に言えば、ヌクレオチド配列を分析する方法の形態を取るこの発明の一つの好ましい実施態様において、塩基の配列を鋳型から取得し、そして配列中の塩基を未知塩基として確認する。‘未知’インジケーターは未知塩基に相当する位置において配列中に含まれ、そして未知塩基インジケーターを含む出力配列が作製される。この好ましい実施態様において、レポーターの評価およびそれに従って塩基を帰属することにより塩基の配列を鋳型から得る。レポーターが塩基決定の先行するサイクルからであるかどうかを決定し、そして、もしレポーターが塩基決定の先行するサイクルからであれば、この塩基帰属は廃棄される。
分析すべきヌクレオチド配列はRNAもしくはDNA配列であってもよい。
【0012】
(図面の簡単な説明)
ここで、付随する図面を参照して実施例によりこの発明を詳細に説明するが、そこで図1は、核酸分子のような生物分子の配列を決定するための反応の間に得られるデータを解析する方法を図示しかつこの発明の好ましい実施態様を形成する工程図である。
【0013】
(好ましい実施態様の詳細な説明)
図1は、鋳型から配列情報を得る方法を例示する流れ図を示す。この方法は、(a)先行するサイクルから持ち越される塩基を確認しそして(b)塩基の標識失敗もしくは組込みミスから起こり得る休止分子を検出することによりエラーを追及する。このデータ解析法は、以下のように実施する標準的なシークエンシング反応を使用する。第一に、配列データを必要とする核酸分子、鋳型、を顕微鏡のスライドのような固体表面に結合させる。スライドを、例えば蛍光顕微鏡スキャナーにより観察するときにその位置を決定できるように、鋳型を標識化することができる。鋳型の配列における最初の塩基もしくはヌクレオチド、即ちA、C、GもしくはT、を蛍光的に標識化した塩基もしくは塩基を表す標識を付加する化学反応により検索する。これは、A、C、GもしくはTのいずれか一つであるか、または四つの異なる区別可能な標識で標識化されたそれら四個全部であり得る。鋳型中の第一の塩基は既知の様式で相補的な塩基に結合するであろう;即ち、AはTと結合し、そしてCはGと結合し、かつ逆の場合も同様である。鋳型をポリメラーゼ酵素で伸長するかもしくは標識化したオリゴヌクレオチドをリガーゼで連結することにより、塩基組込みを引き起こすことができる。標識化した塩基の組込みを検出し、そしてその同一性を決定する。それから、その塩基から標識を除去する。それから、このシリーズのステップを鋳型中の次に続く塩基に対して繰り返す。
【0014】
塩基の付加/組込みを伴う適切な標準的シークエンシング反応としては、WO 93/21340、US 5,302,509およびUS 5,547,839に記載されているような塩基伸長反応ならびにUS 5,763,175、US 5,599,675、US 5,856,093およびUS 5,715,330に記載されているような技法が挙げられるが、そこでは連続するラウンドのシークエンシングは、引き続く塩基の組込みに先立って鋳型の塩基切除を伴う。
【0015】
このシークエンシング反応を実施するときには、エラーが起こり得る。例えば、(i)塩基が間違って組込まれ得る、即ち組込みミスされる、または(ii)次のサイクルを実施する前に一つのサイクルから標識を除去することに失敗し得る、または(iii)どれか一つのサイクルにおいて塩基の組込みが失敗し得ることである。説明されるこの発明の好ましい実施態様において、シークエンス反応からのデータは、これらのエラーの影響を減少し得るような方式で導入される。
【0016】
固相上への分子の析出および固定の方法は技術上周知である。核酸を付着させる方法は、例えば、Schena (ed.), DNA Microarrays: A practical approach, Oxford University Press (1999) ISBN: 0199637768に総説がある。典型的には、固相はガラスであろうが、非晶性もしくは結晶性シリコンまたはプラスチックのような他の材料を用いることができる。
【0017】
複数の分子を規則正しいアレイで固相に付着させ得るが、さらに好ましくは、それらをランダム様式で付着させる。分子のランダム付着は、好ましくは、配列情報の光学的分解能に適した密度で分布させると、いかなる数の分子も含み得る。
【0018】
適切なレポーター部分は種々の既知な報告システムのいずれか一つであってもよい。それは、組込まれたヌクレオシド類似体が容易に検出されるようになる放射性同位元素、例えば、ホスフェートもしくはチオホスフェートまたはH−ホスホネート基に組み込まれた32P、33P、35S、もしくは他には3Hもしくは14Cまたはヨウ素同位元素であってもよい。それは、質量分析法もしくはNMRにより検出可能な同位体であってもよい。それは、シグナル部分、例えば酵素、ハプテン、蛍光体、化学体、化学発光基、ラマン標識もしくは電気化学的標識、もしくは質量分析法による検出に適応するシグナル化合物であってもよい。
【0019】
それぞれのシークエンシングステップは、個別の鋳型へのレポーター分子の取り付けをもたらすであろうし、かつ組込まれたレポーター部分の検出は塩基の同一性を帰属させることを可能にするであろう。蛍光性のレポーターの場合には、それから、例えば、蛍光顕微鏡法(例えばPMTもしくはCCDを用いて)によりこれらの分子が同定され、そしてレポーターの蛍光性質が、シークエンシング反応で組込まれた塩基への同一性の帰属を可能にするであろう。
【0020】
一連のラウンドのシークエンシングサイクルからのデータを収集するためには鋳型の位置を特定しなければならない。これは最初のサイクルのシークエンシングで並行して達成し得るが、この場合、最初の塩基中のレポーター分子が鋳型の位置を確認するかまたは鋳型および/もしくはプライマー自体が、シークエンシングサイクリング反応に先立って固相上の位置を検出し得るように、レポーター部分で標識化されていてもよい。それぞれの鋳型分子の位置を知ることにより、シークエンシングのサイクル間に続いて起こる全てのイベントに引き続いてそれぞれの分子の状態をモニターすることが可能になる。付加の引き続く失敗は、例えば、鋳型を含むと知られた位置における蛍光の欠如により、それ自身を顕在化する。刺激の欠如、もしくは化学的損傷のどちらかによるレポーターの失敗はまた、一旦鋳型の位置が決定されていると、決定されることができる。これらの失敗した反応を追跡し、レポーターの失敗によるポテンシャルギャップとして最終配列において処理することができる。もしこれらの分子が引き続くサイクルで関与を再開するならば、これもまた追跡して意味のある配列を得ることができる。単一の塩基ギャップの個別のポイントが確認され得てかつ、複数の同一配列が固体表面上に並べられているならば、シークエンシングアレイ中における鋳型の他のコピーの配列のような参照鎖との比較によりコンセンサス配列を構築することができる。他に、既知の配列であり得る参照鎖との比較により単一の塩基ギャップを確認し得る(例えば、この技法を突然変異の検出に応用する際に)。
【0021】
かくして、エラー、特に単一分子のシークエンシングに関連するエラーをこのシステムにおいて訂正することが可能であると我々は認識している。訂正の必要なエラーは、レポーターの切断および次のサイクル前の除去の失敗、組込みの失敗、レポーターへの損傷(例えば、蛍光体への損傷)ならびに組込みミスである。
【0022】
一旦位置を特定すると、位置を特定した分子に対する全てのシークエンシングサイクルの結果は測定可能であろう。二つのセットのヌクレオチド類似体を用いることにより、先行するサイクルから持ち越されているレポーターの確認が可能になる。それ故に、先行するサイクルからのレポーターの再現を確認してモニターすることができる。
【0023】
鋳型分子の位置を知ることにより、伸長していないように見える鋳型の確認がまた可能になる。上で議論したように、レポーター分子を観察する失敗は組込みの欠如に起因し得るが、レポーター部分への損傷にも起因し得る。しかしながら、損傷した分子の存在は、分解生成物および副反応の生成物を確認して除去することができる修飾ヌクレオチド合成の間での精製プロセスにより効果的に最小化することができるので、蛍光の不在は、それ故に、修飾したヌクレオチドを組込む失敗の結果である可能性が高い。
【0024】
もし、いずれかのサイクルのシークエンシングの後で、鋳型分子がいずれのレポーターとも関連しなければ、したがってこのポイントにおいて配列をマークして“休止”と表示する。次のラウンドのシークエンシングにおいて、それから鋳型分子をレポーターと関連させ得る、即ち、“休止”分子は伸長を再開して配列データが得られるようにする。しかしながら、鋳型分子は一つ以上のサイクルに対する関連を欠き続けるであろうし、そして配列はそれぞれのサイクルに対して休止としてマークされるであろう。
【0025】
シークエンシングの間に作製される位置マーカーは、参照配列と共に作製される配列と比較するかもしくは当業者に既知のアラインメントアルゴリズムの一つを用いてシークエンシング手順間に作製される他の配列と比較するとき、アラインメント中のギャップを解釈するのに有用であろう。
【0026】
使用した適切なポリメラーゼおよびリガーゼの生来の性質を知ると、組込みミスの位置を予想することが可能である。例えば、ミスマッチした末端塩基を含むプライマー配列は、マッチした配列より102〜106−倍低い伸長効率を持って、ポリメラーゼに対してより劣った鋳型であることは当業者に既知である(Huang, M., N. Arnheim, and M. Goodman, Nucleic Acids Res, 1992. 20(17): p. 4567−73; Tindall KR, K. T., Biochemistry, 1988. 27(16): p. 6008−13; Esteban, J., M. Salas, and L. Blanco, J Biol Chem, 1993. 268(4): p. 2719−26を参照)。数回のサイクル間にもしくはシークエンシングプロトコールの最後まで休止のままである分子は、それ故に、末端ミスマッチを含む公算がはるかに高い。そのような休止を受ける鋳型は、それ故に、ミスマッチによる潜在的終結として最後の塩基呼出し位置において標識化される。それから、配列が決定された断片の同定は、参照配列もしくは同一の試料からの他の配列が決定された鋳型へのアラインメントにより達成される。マークした位置で起こるミスマッチは、真の配列を表すことよりむしろ組込みミスの結果である可能性がより高いために、それに従って解釈され得る。
【0027】
そのために鋳型分子が休止するサイクルの数は、組込まれたレポーターの欠如の連続的検出により計数することができる。偶然に起因する連続的休止の公算に対する閾値を配列データの解析の間にセットすることができる。それ以上ではミスマッチに起因すると分類され得る連続的休止の閾値は、ポリメラーゼ依存性塩基伸長かもしくは配列依存性連結反応のどちらかによる標識化の効率に依存する。例えば、偶然に起因する連続的休止の公算に対する閾値が1×10−6%にセットされるならば、休止がミスマッチとして計数される前に、標識化の異なる効率を考慮して、下記の数の休止を計数する。
【0028】
【表1】
【0029】
比較的大きい確実性をもって、閾値を適当に増加させてもよい。必要な確実性の程度はシークエンシングの応用の許容度に依存するであろう;目的が配列の差を正確に決定するよりむしろ鋳型の断片を単に確認するだけならば、あまり厳格でないカットオフを許容できる。標識組込みのより低い効率の影響はまたシークエンシングの冗長度の程度により相殺することができる。この例における、組込みミスの確率は統計的に処理される。
【0030】
主として蛍光により、単一分子を映像化して位置を特定することは当業者に既知である(Trabesinger, W., et al., Anal Chem., 1999. 71(1): p. 279−83; Harms, G., et al., Biophys. J., 1999. 177: p. 2864−2870; Deschryver, F., Pure & Appl. Chem, 1998. 70: 2147−2156; Bartko, A. and R. Dickson, J Phys Chem B, 1999. 103: p. 11237−11241を参照)。位置および標識のタイプに関する情報を含むデータファイルは、それ故に、容易に作成される。この発明の一つの実施態様において、配列データの解析は、シークエンシング手順の最後でそして全てのシークエンシングデータを得た後で実施される。一つもしくはそれ以上のファイルの中で、このデータを解析して、鋳型の位置を決定しかつこれらの位置に取り付けたいかなるレポーターも同定し得る。それから、そのようなデータを第二の解析に付して、全ての位置を確定した鋳型に対する配列を構築する。
【0031】
好ましくは、シークエンシング反応のサイクルおよびデータ解析を並行して実施する。この例では、それぞれのサイクルから作製されたデータを解析して、レポーター分子の位置を確定して、それからこれらの位置を鋳型の位置と相関させる。それから、それぞれの位置を確定した鋳型に対する配列をそれぞれの連続したサイクルで構築する。
【0032】
この発明を具体化するこの好ましい手順をこれから図1を参照して説明する。 図1に図示するシステムにおいて、配列が決定されるべき分子は技術的に記載されているような標準手順により固相上に固定されている。(Schena (ed.), DNA Microarrays: A practical approach, Oxford University Press (1999) ISBN: 0199637768に総説がある)。顕微鏡のスライドのような固体表面に結合させた鋳型を標識化し、それでスライドを、例えば蛍光顕微鏡スキャナーにより観察するときに、その位置を決定することができる。ステップ10において、適切な鋳型の位置が先ず確定される。
【0033】
今やステップ12で実施するのは、ポリメラーゼ酵素で鋳型を伸長することにより、もしくは標識化したオリゴヌクレオチドをリガーゼで連結することにより引き起される塩基組込みを伴うシークエンシング反応である。
【0034】
上述のように、シークエンシングステップは、鋳型の配列中で最初の塩基へのレポーター分子の取り付けをもたらすであろうし、そしてステップ14では、組込まれるレポーター部分の検出により帰属すべき塩基の同一性を可能にする。次のステップ、ステップ16は塩基および鋳型の位置を相関させる;最初のサイクルではこれはささいなステップである。それから、鋳型分子がレポーターと関連しているかどうかを決定する。即ち、ステップ18において、対象とする鋳型がレポーターを持つかどうかをテストする。もしもシークエンシング手順の後で鋳型がレポーターと関連するならば、ステップ20に手順を移動する。ここで、レポーターが先行するサイクルから来るかどうかを決定するテストを行う。そうでなければ、それからレポーターを確認して、そしてステップ22で新しい塩基を帰属する。かくして、塩基は正確に同定されて、全てよしとなる。
【0035】
それから、手順をステップ24へ移動し、ここではもはや鋳型はないかどうかについてテストする。もしあれば、手順をステップ18から繰り返す。
もしもステップ20で塩基に関連するレポーターが先行するサイクルからであると決定されるならば、ステップ26では何も塩基を帰属しないで、そして手順はステップ24へおよび、もしあれば次の鋳型へ、直行する。
【0036】
もしステップ18で鋳型はレポーターを持たないと見出されるならば、ステップ50でミスマッチフラグが立っているかどうかについてチェックをする。連続した休止の数が、ステップ30で行うテストに従って、予め決めた極大値を越えるときには、ミスマッチフラグが活性化される。ミスマッチフラグが立っていなければ、手順をステップ28へ移動し、休止Pを配列中に挿入する。また、起こっている連続休止の数をモニターする、休止カウンターを1個だけ追加する。テストをステップ30で行って、連続した休止の数が予め決めた閾値または極大値を越えるかどうかを決定する。もし越えていなければ、手順をステップ24へ移動し、休止を配列中に残す。もし連続した休止の数が予め決めた極大値を越えるならば、先行する塩基をミスマッチしたとして得点し、ステップ32でミスマッチフラグを活性化して、そして手順をステップ24へ進める。
【0037】
休止インジケーターは、未知塩基の表示を与える機能として働く。これは塩基A、C、GおよびTのいずれか一つであると証明するか、もしくは事実全く塩基でないと証明するかもしれない。未知塩基の可能性を与えることにより、その鋳型についての情報は完全には廃棄されない。むしろ、下記の実施例で説明するように、例えば参照配列と参照して、それをなお使用する。
【0038】
もしステップ20でレポーターが先行するサイクルからであると決定されるならば、ステップ52でミスマッチフラグが立っているかどうかについてチェックをする。もしミスマッチフラグが立っていなければ、手順をステップ22へ移動し、塩基を帰属する。それから、手順をステップ24へ移動し、処理すべきもう一つの鋳型があるかどうかを決定する。
【0039】
もしミスマッチフラグが立っているならば、ステップ54で、先に帰属した塩基は、ミスマッチした一つを除く全ての他の塩基を表すIUBコードと取り替えられる。これは、もしも先行する塩基が“C”と表示されたが今やミスマッチしたと知られるならば、この塩基はA、GもしくはTのいずれかであることが明らかであるからである。
【0040】
さらに鋳型がないときには、ステップ24におけるテストは結果NOとなり、そして手順をステップ34へ移動して、そこで完成すべきサイクルがまだあるかどうか、即ち、その分子に対する塩基がまだあるかどうかを決定する。もしあれば、手順を次のサイクルのためのデータ、ステップ36、へ移動し、その後で処理を再びステップ16から進めて塩基および鋳型の位置を相関させる。
最終的には、ステップ34におけるテストは結果NOとなるであろうが、それでステップ38においてこの手順の終了となる。
【0041】
次に続く処理は、図1のシステムにより作成したような配列に応用されるもので、例えば、この方法で見出された配列を参照配列と比較することである。この実施例を以下に説明する。
化学反応を伴うステップ10〜14に引き続く、図1に示すステップをパソコン(PC)のようなデジタルコンピュータ上に構築する。二つの実施例を、この明細書につけた付録での擬似コードを経由してさらに詳細に示す。最初の擬似コードは、ヌクレオチドが全ての四つの塩基、A、C、GおよびT、の混合物により検索されることを仮定し、そして第二の擬似コードは、四つの塩基を別々に順次用いるときに使用する。
【0042】
本発明は多くの応用を有するが、その幾らかをここに示す。例えば、この方法を用いてDNAおよびRNAのゲノムの配列を決定することができる。さらに、領域もしくは全体のゲノムにおける、領域もしくは全体のゲノムのmRNA表現における、または一つもしくはそれ以上の塩基の置換、欠失もしくは挿入から生じる、ゲノムの人工的に作製した表現(例えば、ゲノム領域のPCR生成物)における、配列変異を同定することができる。
【0043】
本発明は、ハプロタイピング(個体における染色体対間の配列差を決定する)にもまた定量的なmRNA発現分析にも、例えば異なる細胞タイプ(組織)もしくは異なって処理した細胞から誘導した試料間でmRNA発現のレベルを比較するのに、応用される。この技法はまた、病原体の検出および同定に使用するために、病原体ゲノムから誘導された配列を同定するのに応用し得る。
【0044】
ここに示す実施例は、決定された配列におけるエラーを減少させるようにこのシステムにより特定の配列を取り扱う方式に与えられる。
【0045】
実施例1
シークエンシング反応から次の配列が得られるが:
【化1】
式中、1は一個のTが組込まれていることを示す(そして2=C、3=A、4=G)。
サイクルの閾値数のため一層の伸長の失敗は、配列にマークをつけて塩基が休止の閾値数に先立って組込みミスされていることを示すことをもたらす。ここで、1(一つ)は一個のTが、予め決定された閾値レベル以上の数の休止に先立って、組込まれていることを示し、かくして組込みミスされている可能性がある。それ故に、配列は多分廃棄される。図1に関しては、YESがステップ30において出力されるまで、予め決められた数のステップに対して手順をパス28と30に進め、そして先行する塩基をステップ32でミスマッチしたとしてマークする。1の代わりに他の塩基に対して、2,3もしくは4を用いるが、2はCを示し、3はAを示し、そして4はGを示す。
【0046】
実施例2
シークエンシング反応から次の配列が得られる。一番目は新しく決定された配列であり、二番目は参照配列である:
【化2】
サイクルの閾値数より長い休止は、組込みミスとしてTの代わりに一つの1をマークする。この場合においては、シークエンシングを閾値数の配列の後で再開している。得られた配列を参照配列と比較するとき、配列アラインメントは休止した位置においてT.1アラインメントを表示する。それ故に、それは参照配列との現実の塩基差として差引くことができる。この配列アラインメントは図1に図示した処理に追加的な段階を表す。
【0047】
実施例3
シークエンシングの間に休止に遭遇すると、その位置をPとしてマークする。もし以下の新しい及び参照配列が得られると:
【化3】
Pでマークした位置におけるギャップの存在もしくは不存在下における参照配列との配列アラインメントは、それが休止であることを明らかにする。それ故に、全ての配列は隣接してかつ有用である。ここでも配列アラインメントは図1に図示した処理に追加的な段階を表す。
【0048】
実施例4
シークエンシング反応から次の配列が得られる:
【化4】
Pでマークした位置は失敗したレポーターを持つ塩基の組込みである。マークした位置におけるギャップの存在もしくは不存在下における参照配列との配列アラインメントは、これが配列中のギャップであることを明らかにする。取り出した配列は有用のままである。この例において、Pを‘N’で置換して配列中のギャップを意味することもできる。ここでも配列アラインメントは図1に図示した処理に追加的な段階を表す。
【0049】
付録
第一擬似コード
シークエンシング反応完了後の配列集合のための擬似コードの例
【0050】
第二擬似コード
一連の単一塩基シークエンシングのための擬似コード
【図面の簡単な説明】
【図1】図1は、核酸分子のような生物分子の配列を決定するための反応の間に得られるデータを解析する方法を図示しかつこの発明の好ましい実施態様を形成する工程図である。
Claims (11)
- 塩基付加を用いる未知のヌクレオチド配列を同定する方法であって:
鋳型から塩基の配列を得る;
配列中の塩基を未知塩基として確認しかつ配列中に‘未知’インジケーターを含む;そして
未知塩基のインジケーターを含む出力配列を与える
ステップを含む方法。 - 連続した未知塩基の数を計数し、そして連続した未知塩基の数が予め決めた閾値を超えるときに指示を与えることをさらに含む、請求項1に記載の方法。
- 予め決めた閾値を超えるときに、先行する塩基を組込みミスしたとしてマークする、請求項2に記載の方法。
- 出力配列および参照配列の間に配列アラインメントのステップをさらに含む、請求項1に記載の方法。
- 出力配列および参照配列の間に配列アラインメントのステップをさらに含む、請求項2に記載の方法。
- 配列をレポーターの評価により決定し、そしてこのレポーターが塩基決定の先行するサイクルからであるかどうかを決定することをさらに含む、請求項1に記載の方法。
- 未知のヌクレオチド配列を同定する方法であって:
レポーターの評価により鋳型から塩基の配列を得てそしてそれに従って塩基を帰属する;
このレポーターが塩基決定の先行するサイクルからであるかどうかを決定し;もしこのレポーターが塩基決定の先行するサイクルからであれば、塩基帰属を廃棄し;そして
出力配列を与える
ステップを含む方法。 - 塩基付加を用いる未知のヌクレオチド配列を同定するための装置であって:
鋳型から塩基の配列を得るための手段;
配列中の塩基を未知塩基として確認しかつ配列中に‘未知’インジケーターを含むための手段;そして
未知塩基のインジケーターを含む出力配列を与えるための手段
を含む装置。 - 塩基付加を用いる未知のヌクレオチド配列を同定するための装置であって:
レポーターの評価により鋳型から塩基の配列を得てそしてそれに従って塩基を帰属するための手段;
このレポーターが塩基決定の先行するサイクルからであるかどうかを決定し、そしてもしこのレポーターが塩基決定の先行するサイクルからであれば、塩基帰属は廃棄されるための手段;そして
出力配列を与えるための手段
を含む装置。 - 塩基伸長を用いる未知のヌクレオチド配列を同定するためのコンピュータプログラム製品であって、コンピュータにロードしたときに、以下の:
鋳型から塩基の配列を得る;
配列中の塩基を未知塩基として確認しかつ配列中に‘未知’インジケーターを含む;そして
未知塩基のインジケーターを含む出力配列を与える
ステップを実施するようにコンピュータを制御するだろうコンピュータプログラム製品。 - コンピュータプログラムであって、該プログラムをコンピュータ上でランするとき、請求項1〜7のいずれか1項の全てのステップを実施するためのプログラムコード手段
を含むコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB0016472.3A GB0016472D0 (en) | 2000-07-05 | 2000-07-05 | Sequencing method and apparatus |
PCT/GB2001/002985 WO2002003305A2 (en) | 2000-07-05 | 2001-07-02 | Method and apparatus for sequence analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004501669A true JP2004501669A (ja) | 2004-01-22 |
Family
ID=9895041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002507300A Pending JP2004501669A (ja) | 2000-07-05 | 2001-07-02 | シークエンシング方法および装置 |
Country Status (11)
Country | Link |
---|---|
US (1) | US7133782B2 (ja) |
EP (1) | EP1297484B1 (ja) |
JP (1) | JP2004501669A (ja) |
AT (1) | ATE353455T1 (ja) |
AU (1) | AU2001270760A1 (ja) |
CA (1) | CA2412973A1 (ja) |
DE (1) | DE60126491T2 (ja) |
ES (1) | ES2281426T3 (ja) |
GB (1) | GB0016472D0 (ja) |
IL (1) | IL153472A0 (ja) |
WO (1) | WO2002003305A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013094169A (ja) * | 2011-10-31 | 2013-05-20 | Samsung Sds Co Ltd | 標的ゲノム配列内の新規配列生成装置及びその方法 |
JP2014533858A (ja) * | 2011-11-18 | 2014-12-15 | ザ・リージェンツ・オブ・ザ・ユニバーシティー・オブ・カリフォルニアThe Regents Of The University Of California | Bambam:高スループット配列決定データの並列比較分析 |
US9652587B2 (en) | 2010-05-25 | 2017-05-16 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7875440B2 (en) | 1998-05-01 | 2011-01-25 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
US6780591B2 (en) | 1998-05-01 | 2004-08-24 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
US7056661B2 (en) | 1999-05-19 | 2006-06-06 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
US7211414B2 (en) | 2000-12-01 | 2007-05-01 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
US7981604B2 (en) | 2004-02-19 | 2011-07-19 | California Institute Of Technology | Methods and kits for analyzing polynucleotide sequences |
US7170050B2 (en) | 2004-09-17 | 2007-01-30 | Pacific Biosciences Of California, Inc. | Apparatus and methods for optical analysis of molecules |
US7805081B2 (en) * | 2005-08-11 | 2010-09-28 | Pacific Biosciences Of California, Inc. | Methods and systems for monitoring multiple optical signals from a single source |
US7666593B2 (en) | 2005-08-26 | 2010-02-23 | Helicos Biosciences Corporation | Single molecule sequencing of captured nucleic acids |
US7405281B2 (en) * | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
US7763423B2 (en) * | 2005-09-30 | 2010-07-27 | Pacific Biosciences Of California, Inc. | Substrates having low density reactive groups for monitoring enzyme activity |
US7998717B2 (en) * | 2005-12-02 | 2011-08-16 | Pacific Biosciences Of California, Inc. | Mitigation of photodamage in analytical reactions |
US7995202B2 (en) * | 2006-02-13 | 2011-08-09 | Pacific Biosciences Of California, Inc. | Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources |
US7715001B2 (en) | 2006-02-13 | 2010-05-11 | Pacific Biosciences Of California, Inc. | Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources |
US7692783B2 (en) * | 2006-02-13 | 2010-04-06 | Pacific Biosciences Of California | Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources |
US8364417B2 (en) | 2007-02-15 | 2013-01-29 | 454 Life Sciences Corporation | System and method to correct out of phase errors in DNA sequencing data by use of a recursive algorithm |
CN101390101B (zh) * | 2006-02-16 | 2012-05-23 | 454生命科学公司 | 用于校正核酸序列数据中的引物延伸误差的系统和方法 |
US8975216B2 (en) * | 2006-03-30 | 2015-03-10 | Pacific Biosciences Of California | Articles having localized molecules disposed thereon and methods of producing same |
US20080050747A1 (en) * | 2006-03-30 | 2008-02-28 | Pacific Biosciences Of California, Inc. | Articles having localized molecules disposed thereon and methods of producing and using same |
US7563574B2 (en) | 2006-03-31 | 2009-07-21 | Pacific Biosciences Of California, Inc. | Methods, systems and compositions for monitoring enzyme activity and applications thereof |
WO2008027558A2 (en) | 2006-08-31 | 2008-03-06 | Codon Devices, Inc. | Iterative nucleic acid assembly using activation of vector-encoded traits |
WO2008028160A2 (en) * | 2006-09-01 | 2008-03-06 | Pacific Biosciences Of California, Inc. | Substrates, systems and methods for analyzing materials |
US8207509B2 (en) | 2006-09-01 | 2012-06-26 | Pacific Biosciences Of California, Inc. | Substrates, systems and methods for analyzing materials |
US20080080059A1 (en) * | 2006-09-28 | 2008-04-03 | Pacific Biosciences Of California, Inc. | Modular optical components and systems incorporating same |
US20080277595A1 (en) * | 2007-05-10 | 2008-11-13 | Pacific Biosciences Of California, Inc. | Highly multiplexed confocal detection systems and methods of using same |
US20100167413A1 (en) * | 2007-05-10 | 2010-07-01 | Paul Lundquist | Methods and systems for analyzing fluorescent materials with reduced autofluorescence |
US7767441B2 (en) * | 2007-10-25 | 2010-08-03 | Industrial Technology Research Institute | Bioassay system including optical detection apparatuses, and method for detecting biomolecules |
US7811810B2 (en) | 2007-10-25 | 2010-10-12 | Industrial Technology Research Institute | Bioassay system including optical detection apparatuses, and method for detecting biomolecules |
MX2010010600A (es) | 2008-03-28 | 2011-03-30 | Pacific Biosciences California Inc | Composiciones y metodos para secuenciacion de acidos nucleicos. |
WO2010025310A2 (en) | 2008-08-27 | 2010-03-04 | Westend Asset Clearinghouse Company, Llc | Methods and devices for high fidelity polynucleotide synthesis |
CA2737505C (en) | 2008-09-16 | 2017-08-29 | Pacific Biosciences Of California, Inc. | Substrates and optical systems and methods of use thereof |
US8501406B1 (en) | 2009-07-14 | 2013-08-06 | Pacific Biosciences Of California, Inc. | Selectively functionalized arrays |
WO2011056872A2 (en) | 2009-11-03 | 2011-05-12 | Gen9, Inc. | Methods and microfluidic devices for the manipulation of droplets in high fidelity polynucleotide assembly |
US9216414B2 (en) | 2009-11-25 | 2015-12-22 | Gen9, Inc. | Microfluidic devices and methods for gene synthesis |
WO2011085075A2 (en) | 2010-01-07 | 2011-07-14 | Gen9, Inc. | Assembly of high fidelity polynucleotides |
EP2952590B1 (en) | 2010-06-11 | 2017-07-26 | Life Technologies Corporation | Alternative nucleotide flows in sequencing-by-synthesis methods |
US8834847B2 (en) | 2010-08-12 | 2014-09-16 | Pacific Biosciences Of California, Inc. | Photodamage mitigation compounds and systems |
US10273540B2 (en) | 2010-10-27 | 2019-04-30 | Life Technologies Corporation | Methods and apparatuses for estimating parameters in a predictive model for use in sequencing-by-synthesis |
EP2633470B1 (en) | 2010-10-27 | 2016-10-26 | Life Technologies Corporation | Predictive model for use in sequencing-by-synthesis |
EP3360963B1 (en) | 2010-11-12 | 2019-11-06 | Gen9, Inc. | Methods and devices for nucleic acids synthesis |
EP2637780B1 (en) | 2010-11-12 | 2022-02-09 | Gen9, Inc. | Protein arrays and methods of using and making the same |
US9594870B2 (en) | 2010-12-29 | 2017-03-14 | Life Technologies Corporation | Time-warped background signal for sequencing-by-synthesis operations |
US20130060482A1 (en) | 2010-12-30 | 2013-03-07 | Life Technologies Corporation | Methods, systems, and computer readable media for making base calls in nucleic acid sequencing |
WO2012092515A2 (en) | 2010-12-30 | 2012-07-05 | Life Technologies Corporation | Methods, systems, and computer readable media for nucleic acid sequencing |
WO2012092455A2 (en) | 2010-12-30 | 2012-07-05 | Life Technologies Corporation | Models for analyzing data from sequencing-by-synthesis operations |
EP3878975A1 (en) | 2011-04-08 | 2021-09-15 | Life Technologies Corporation | Phase-protecting reagent flow orderings for use in sequencing-by-synthesis |
US9752176B2 (en) | 2011-06-15 | 2017-09-05 | Ginkgo Bioworks, Inc. | Methods for preparative in vitro cloning |
LT3594340T (lt) | 2011-08-26 | 2021-10-25 | Gen9, Inc. | Kompozicijos ir būdai, skirti nukleorūgščių didelio tikslumo sąrankai |
US10704164B2 (en) | 2011-08-31 | 2020-07-07 | Life Technologies Corporation | Methods, systems, computer readable media, and kits for sample identification |
US9150853B2 (en) | 2012-03-21 | 2015-10-06 | Gen9, Inc. | Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis |
EP2841601B1 (en) | 2012-04-24 | 2019-03-06 | Gen9, Inc. | Methods for sorting nucleic acids and multiplexed preparative in vitro cloning |
US9646132B2 (en) | 2012-05-11 | 2017-05-09 | Life Technologies Corporation | Models for analyzing data from sequencing-by-synthesis operations |
LT2864531T (lt) | 2012-06-25 | 2019-03-12 | Gen9, Inc. | Nukleorūgšties konstravimo ir aukšto produktyvumo sekvenavimo būdai |
US10329608B2 (en) | 2012-10-10 | 2019-06-25 | Life Technologies Corporation | Methods, systems, and computer readable media for repeat sequencing |
US20140296080A1 (en) | 2013-03-14 | 2014-10-02 | Life Technologies Corporation | Methods, Systems, and Computer Readable Media for Evaluating Variant Likelihood |
US9926597B2 (en) | 2013-07-26 | 2018-03-27 | Life Technologies Corporation | Control nucleic acid sequences for use in sequencing-by-synthesis and methods for designing the same |
WO2015051338A1 (en) | 2013-10-04 | 2015-04-09 | Life Technologies Corporation | Methods and systems for modeling phasing effects in sequencing using termination chemistry |
US10676787B2 (en) | 2014-10-13 | 2020-06-09 | Life Technologies Corporation | Methods, systems, and computer-readable media for accelerated base calling |
EP3295345B1 (en) | 2015-05-14 | 2023-01-25 | Life Technologies Corporation | Barcode sequences, and related systems and methods |
US10619205B2 (en) | 2016-05-06 | 2020-04-14 | Life Technologies Corporation | Combinatorial barcode sequences, and related systems and methods |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5302509A (en) * | 1989-08-14 | 1994-04-12 | Beckman Instruments, Inc. | Method for sequencing polynucleotides |
EP0450060A1 (en) * | 1989-10-26 | 1991-10-09 | Sri International | Dna sequencing |
WO1993005183A1 (en) | 1991-09-09 | 1993-03-18 | Baylor College Of Medicine | Method and device for rapid dna or rna sequencing determination by a base addition sequencing scheme |
GB9208733D0 (en) | 1992-04-22 | 1992-06-10 | Medical Res Council | Dna sequencing method |
US5552278A (en) * | 1994-04-04 | 1996-09-03 | Spectragen, Inc. | DNA sequencing by stepwise ligation and cleavage |
-
2000
- 2000-07-05 GB GBGB0016472.3A patent/GB0016472D0/en not_active Ceased
-
2001
- 2001-07-02 WO PCT/GB2001/002985 patent/WO2002003305A2/en active IP Right Grant
- 2001-07-02 IL IL15347201A patent/IL153472A0/xx unknown
- 2001-07-02 US US10/312,048 patent/US7133782B2/en not_active Expired - Fee Related
- 2001-07-02 EP EP01949637A patent/EP1297484B1/en not_active Expired - Lifetime
- 2001-07-02 AU AU2001270760A patent/AU2001270760A1/en not_active Abandoned
- 2001-07-02 JP JP2002507300A patent/JP2004501669A/ja active Pending
- 2001-07-02 AT AT01949637T patent/ATE353455T1/de not_active IP Right Cessation
- 2001-07-02 CA CA002412973A patent/CA2412973A1/en not_active Abandoned
- 2001-07-02 ES ES01949637T patent/ES2281426T3/es not_active Expired - Lifetime
- 2001-07-02 DE DE60126491T patent/DE60126491T2/de not_active Expired - Fee Related
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10268800B2 (en) | 2010-05-25 | 2019-04-23 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
US10971248B2 (en) | 2010-05-25 | 2021-04-06 | The Regents Of The University Of California | BamBam: parallel comparative analysis of high-throughput sequencing data |
US10706956B2 (en) | 2010-05-25 | 2020-07-07 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US9646134B2 (en) | 2010-05-25 | 2017-05-09 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US9652587B2 (en) | 2010-05-25 | 2017-05-16 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US9721062B2 (en) | 2010-05-25 | 2017-08-01 | The Regents Of The University Of California | BamBam: parallel comparative analysis of high-throughput sequencing data |
US9824181B2 (en) | 2010-05-25 | 2017-11-21 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US11158397B2 (en) | 2010-05-25 | 2021-10-26 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US10726945B2 (en) | 2010-05-25 | 2020-07-28 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
US10249384B2 (en) | 2010-05-25 | 2019-04-02 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US11164656B2 (en) | 2010-05-25 | 2021-11-02 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US11152080B2 (en) | 2010-05-25 | 2021-10-19 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
US10242155B2 (en) | 2010-05-25 | 2019-03-26 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
US10825551B2 (en) | 2010-05-25 | 2020-11-03 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US10825552B2 (en) | 2010-05-25 | 2020-11-03 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
US10878937B2 (en) | 2010-05-25 | 2020-12-29 | The Regents Of The University Of California | BamBam: parallel comparative analysis of high-throughput sequencing data |
US11133085B2 (en) | 2010-05-25 | 2021-09-28 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
US10991451B2 (en) | 2010-05-25 | 2021-04-27 | The Regents Of The University Of California | BamBam: parallel comparative analysis of high-throughput sequencing data |
JP2013094169A (ja) * | 2011-10-31 | 2013-05-20 | Samsung Sds Co Ltd | 標的ゲノム配列内の新規配列生成装置及びその方法 |
JP2014533858A (ja) * | 2011-11-18 | 2014-12-15 | ザ・リージェンツ・オブ・ザ・ユニバーシティー・オブ・カリフォルニアThe Regents Of The University Of California | Bambam:高スループット配列決定データの並列比較分析 |
JP2016186801A (ja) * | 2011-11-18 | 2016-10-27 | ザ・リージェンツ・オブ・ザ・ユニバーシティー・オブ・カリフォルニアThe Regents Of The University Of California | Bambam:高スループット配列決定データの並列比較分析 |
JP2018067350A (ja) * | 2011-11-18 | 2018-04-26 | ザ・リージェンツ・オブ・ザ・ユニバーシティー・オブ・カリフォルニアThe Regents Of The University Of California | Bambam:高スループット配列決定データの並列比較分析 |
Also Published As
Publication number | Publication date |
---|---|
US20030186276A1 (en) | 2003-10-02 |
WO2002003305A3 (en) | 2002-08-01 |
IL153472A0 (en) | 2003-07-06 |
GB0016472D0 (en) | 2000-08-23 |
AU2001270760A1 (en) | 2002-01-14 |
CA2412973A1 (en) | 2002-01-10 |
DE60126491D1 (de) | 2007-03-22 |
US7133782B2 (en) | 2006-11-07 |
DE60126491T2 (de) | 2007-11-15 |
EP1297484B1 (en) | 2007-02-07 |
ATE353455T1 (de) | 2007-02-15 |
WO2002003305A2 (en) | 2002-01-10 |
EP1297484A2 (en) | 2003-04-02 |
ES2281426T3 (es) | 2007-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004501669A (ja) | シークエンシング方法および装置 | |
JP4870317B2 (ja) | 配列決定方法 | |
EP3289097B2 (en) | Error suppression in sequenced dna fragments using redundant reads with unique molecular indices (umis) | |
US20150184233A1 (en) | Quantification of nucleic acids and proteins using oligonucleotide mass tags | |
US6864052B1 (en) | Enhanced sequencing by hybridization using pools of probes | |
RU2565550C2 (ru) | Прямой захват, амплификация и секвенирование днк-мишени с использованием иммобилизированных праймеров | |
US7604941B2 (en) | Nucleotide sequencing via repetitive single molecule hybridization | |
US11789906B2 (en) | Systems and methods for genomic manipulations and analysis | |
JP2007530020A (ja) | 核酸の配列決定のための方法および手段 | |
US20230416806A1 (en) | Polymorphism detection with increased accuracy | |
JP2008504819A (ja) | ポリヌクレオチド配列検出アッセイにおいて反応能力を判定するためのコントロール | |
JP2005528909A (ja) | コンビナトリアルオリゴヌクレオチドpcrの改善方法 | |
RU2799654C2 (ru) | Инструмент на основе графов последовательностей для определения вариаций в областях коротких тандемных повторов | |
Daniel et al. | Sequencing Technology in Forensic Science: Next-Generation Sequencing | |
WO2024073544A1 (en) | System and method for genotyping structural variants | |
CZ254699A3 (cs) | Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20041124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20041207 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041207 |