JP6373827B2 - 最適化されたヌクレオチドフロー順序を生成及び使用するためのシステム及び方法 - Google Patents
最適化されたヌクレオチドフロー順序を生成及び使用するためのシステム及び方法 Download PDFInfo
- Publication number
- JP6373827B2 JP6373827B2 JP2015512060A JP2015512060A JP6373827B2 JP 6373827 B2 JP6373827 B2 JP 6373827B2 JP 2015512060 A JP2015512060 A JP 2015512060A JP 2015512060 A JP2015512060 A JP 2015512060A JP 6373827 B2 JP6373827 B2 JP 6373827B2
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- flow
- sequencing
- cafie
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Physiology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
(a)k塩基長を含むヌクレオチド種の複数の配列順序付けを生成するステップであり、ここで、配列順序付けは、合成による配列決定の反応環境にヌクレオチド種を導入する順序を規定するものである;
(b)配列順序付けを用い、1つ以上の参照ゲノムからの配列データの取得をシミュレーションするステップであり、ここで、配列データは位相同期誤差の蓄積を含むものである;及び、
(c)読み取り長パラメータ及び伸長率パラメータを用いて1つ以上の配列順序付けを選択するステップ。
k塩基長は、16、24、32及び40塩基長からなる群から選択してもよい。また、k塩基長は、32〜40塩基の範囲の長さを含んでもよい。
伸長率パラメータは、1つのヌクレオチドフローが伸長させることができる鋳型分子に対して相補的な配列位置の平均数を含んでもよい。
(a)k塩基長を含むヌクレオチド種の配列順序付けを合成による配列決定の反応環境に導入するステップであり、ここで、ヌクレオチド種の配列順序付けは高読み取り長特性及び低伸長率特性を含むものである;
(b)実質的に同一の核酸鋳型分子の1つ以上の集団の伸長反応にヌクレオチド種を取り込むことに応答して合成による配列決定の反応環境から信号を取得するステップであり、ここで、信号は、伸長の位相から遅れた1つ以上の集団の核酸鋳型分子のサブセットからの一定の誤差を含むものである;及び、
(c)ヌクレオチド種の配列順序付けの導入及び反復回数の信号取得を周期的に反復するステップであり、ここで、核酸分子のサブセットは、配列順序付けの高読み取り長特性と低伸長率特性によって、前記一定の誤差を低減させる伸長の位相と再同期するものである。
(a)k塩基長、高読み取り長特性値、及び低伸長率特性値を含むヌクレオチド種の第1の配列順序付けを、合成による配列決定の反応環境に導入するステップ;
(b)実質的に同一の核酸鋳型分子の1つ以上の集団の伸長反応にヌクレオチド種を取り込むことに応答して合成による配列決定の反応環境から複数の第1の信号を取得するステップ;
(c)k塩基長、高読み取り長特性値、及び低伸長率特性値を含むヌクレオチド種の第2の配列順序付けを、合成による配列決定の反応環境に導入するステップであり、ここで、ヌクレオチド種の第2の配列順序付けは、ヌクレオチド種の第1の配列順序付けと同一ではない;及び、
(d)実質的に同一の核酸鋳型分子の1つ以上の集団の伸長反応にヌクレオチド種を取り込むことに応答して合成による配列決定の反応環境から複数の第2の信号を取得するステップ、
を含み、
第1又は第2の配列順序付けの配列組成により、1つ以上の集団の1つ以上のサブセットが伸長の位相に遅れを取り、続くフローにおける伸長の位相と再同期する方法を提供する。
a.全般
特記しない限り、本明細書で用いられるすべての技術用語及び科学用語は、本発明が属する技術分野の当業者が一般的に理解しているものと同じ意味を有する。本明細書に記載のものと類似又は同等の方法及び材料を、本発明の実施に用いることができ、適当な方法及び材料の例を以下に記載する。例えば、2つを超えるステップを含む方法を記載することができる。そのような方法において、定められた目標を達成するために必ずしもすべてのステップは必要とされない場合があり、本発明は、単独のステップの使用によってこれらの別個の目標を実現することを想定している。すべての出版物、特許出願、特許、及びその他の参考文献の内容は引用することにより、本願に援用する。また、材料、方法、及び例は例示的なものにすぎず、限定を意図するものではない。
本明細書で用いる用語「試験断片(test fragment)」又は「TF」は、一般に、品質管理、較正、又はその他の関連する目的で使用できる既知の配列組成の核酸要素を指す。
本明細書で用いる用語「ヌクレオチド種」は、一般に、典型的には新生核酸分子に取り込まれるプリン類(アデニン、グアニン)及びピリミジン類(シトシン、ウラシル、チミン)を含む核酸単量体の種類を指す。「天然」ヌクレオチド種には、例えばアデニン、グアニン、シトシン、ウラシル、及びチミンが含まれる。上記の天然ヌクレオチド種の修飾形には、α−チオ三リン酸誘導体(例えば、dATP−α−S)、ヒポキサンチン、キサンチン、7−メチルグアニン、5,6−ジヒドロウラシル、及び5−メチルシトシンが含まれるがこれらに限定されない。
本明細書で用いる用語「均質な伸長」は、一般に、実質的に同一の鋳型分子の集団の各構成員が、反応において同じ伸長ステップを均質に実施している伸長反応の関係又は位相を指す。
本明細書で用いる用語「不完全伸長率」は、一般に、すべての新生分子の数に対する適正に伸長できなかった新生分子の数の比率を指す。
本明細書で用いる用語「変異体(variant)」又は「対立遺伝子(allele)」は、一般に、類似するけれども互いにある程度の相異を有する配列組成をそれぞれコードする複数の種のうちの1つを指す。この相異には、一ヌクレオチド多型性(SNP)等の多型性、挿入又は欠失(挿入/欠失事象の組合せは「インデル」とも呼ばれる)、反復配列(縦列反復配列とも呼ばれる)の数の差、及び構造変化を含むがそれらに限定するものではない、当業者に公知の任意の型の遺伝的変異を含めることができる。
本明細書で用いる用語「鍵配列(key sequence)」又は「鍵要素(key element)」は、一般に、鋳型分子から生成された配列データの品質管理基準として用いられる既知の配列組成物を含んだ既知の部位(即ち、典型的には連結されたアダプター要素に含まれる)で、鋳型核酸分子に関連付けられた核酸配列要素(典型的には、約4つの配列位置、即ち、TGAC又はヌクレオチド種のその他の組合せ)を指す。配列データは、適正な部位で鍵要素に関連付けられた既知の配列組成物を含む場合、品質管理に合格する
本明細書で用いる用語「キーパス(keypass)」又は「キーパスウェル(keypass well)」は、一般に、反応ウェル内の既知の配列組成物の全長核酸試験配列(即ち、上述の「試験断片」又は「TF」)の配列決定を指す。この場合、TF配列及び/又はTFに関連付けられた鍵配列から得られ、又は標的核酸に関連付けられたアダプターにおける配列の精度は、TF及び/又はキーの既知の配列組成物と比較され、配列決定精度の測定及び品質管理のために使用される。典型的な態様では、配列決定実行におけるウェルの総数の割合は、いくつかの態様では分散した領域に分布したキーパスウェルになる。
処理装置には、市販の処理装置、例えばIntel Corporation製のCeleron、Core、又はPentium(登録商標)処理装置、Sun Microsystemsにより作られたSPARC処理装置、AMD corporation製のAthlon、Sempron、Phenom、又はOpteron処理装置が含まれてよく、又はそれは入手可能な、又は今後入手可能になる他の処理装置の1つであってもよい。処理装置のいくつかの態様は、マルチコア処理装置と呼ばれるもの、及び/又は単独又は多重コア構成の並列処理技術を用いることにしたものを含むことができる。例えば、マルチコアアーキテクチャは典型的には2個以上の処理装置の「実行コア」を含む。本例では、それぞれの実行コアは多重スレッドの並列実行を可能にする独立した処理装置として機能することができる。更に、処理装置は一般に32又は64ビットアーキテクチャと呼ばれるもの、又は現在知られている又は将来開発される可能性のある他のアーキテクチャ構成物で構成されていてよいことを当業者は理解している。
b.本明細書に記載された発明の態様
上述したように、本明細書に記述された発明は、一般にSBS法と呼ばれるものによって生成される核酸配列データの位相同期誤差の蓄積を最小にするように設計された位相同期フロー順序の態様を生成及び使用するシステム及び方法に関する。
方程式(1):
M(p,ε,λ)=q
ここで、
− Mは、CAFIEマッピングであり、
− pは、理論上のフローグラム[アレイとして]であり、
− λは、完了効率パラメータであり、
− εは、繰越パラメータであり、
− qは、観察されたフローグラム[アレイとして]である。
各々のヌクレオチド種のフローiについて、
(i)−ヌクレオチド種の添加により、新生分子を伸長する。
− piは、i番目のヌクレオチド種のフローで、理論上の(クリーンな)フローグラムの信号値であり、
− qiは、i番目のヌクレオチド種のフローで、観察されたフローグラムの信号値であり、
− miは、i番目のヌクレオチド種のフローのフローグラム配列位置で、取り込みに使用できるヌクレオチド種分子の画分であり、
− Niは、i番目のヌクレオチド種添加(A、C、G、又はT)であり、
− εは、繰越(CF)パラメータであり、
− λは、完了効率パラメータ(IE)であり、
− (j、j’)は対の指数であり、pj’はフローグラムのpjの次の正の値である。
方程式(2):
[Μ(p’,ε,λ)]*p=q
ここで、
− [Μ(p’,ε,λ)]は行列であり、
− *は行列アレイの乗算であり、
− p’は、理論上のフローグラムの2進コード化リストである
(例えば、図1のフローグラムp、p=[010200103012]tは、p’=[010100101011]tとしてコード化される)。
方程式(2)の逆行形から、逆マッピングが得られ、観察されたフローグラム(q)103が理論上のフローグラム(p)101に戻して変換される。
p=[Μ−1(p’,ε,λ)]*q
ここで、
− [Μ−1(p’,ε,λ)]は逆行列である。
p(n+1)=[M−1(p’(n),ε,λ)]*q
ここで、p’(1)=q’が計算の種として使用される。
方法1:
ε及び(1−λ)の小さい値で(例えば、(1−λ)≦0.001及びε≦0.0025)、行列[M]が分解され、近似されて以下の形になる。
[M(p’,ε,λ)]〜[L(p’,Δλ)]φ*[U(p’,Δε)]ω
ここで、
− Δε=0.0025及びΔλ=0.001は、各々ε軸及びλ軸における間隔である。
− [L(p’,Δλ)]は、下対角行列であり、小さい欠損ΔλでのIEの効果をモデル化する。
この分解により、方程式(5)は、検索経路に沿って一度、下対角行列L及び上対角行列Uを構成し、検索グリッド(ε,λ)での不完全及び繰越の程度が行列の累乗(ω,φ)によりモデル化される。検索間隔の小さい値、即ち、Δε=0.0025及びΔλ=0.001は、例えば、0.05、0.01、0.005、0.001、0.0005、0.0001等の他の小さい値に置き換えることができる。
方法2:
小さいε及び(1−λ)の場合における方程式(5)を受けて、下対角累乗行列及び上対角累乗行列[L]φ及び[U]ωは、以下によってさらに近似される。即ち、
方程式(6):
[L]φ≡([I]+[l])φ〜[I]+φ[l]
方程式(7):
[U]ω≡([I]+[u])ω〜[I]+ω[u]
ここで、
− [I]は、恒等行列であり、
− [l]及び[u]は、それぞれ、[L]及び[U]の非対角行列である。
方程式(8):
λ*=(1−φ*Δλ)及びε*=ω*Δε
である。
方程式(9−10):
λN(i)=λ0 Ν *exp(−δN *i)
εN(i)=ε0 Ν *exp(−βN *i)
ここで、
− λN(i)は、「i」番目のフローにおけるヌクレオチド種「N」の完了効率であり、
− εN(i)は、「i」番目のフローにおけるヌクレオチド種「N」のCFであり、
− λ0 N及びε0 Nは、初期値であり、
− δN及びβNは、減衰率である。
さらに、当業者は、上記のCAFIE機構に関連しない他のノイズ源が存在し得ることも分かっている。こうしたノイズ源としては、電子的ノイズ源、たとえば「暗電流」と呼ばれるもの、光学的ノイズ源、生物学的ノイズ源、化学的ノイズ源、又は先行技術で公知か、又は将来発見され得るその他のノイズ源が挙げられるが、これらだけに限らない。本明細書に記載する発明のいくつかの態様は、その他のノイズ源に対して様々なレベルの感受性を示す場合があり、こうした感度は、多くの場合、実質的に一定であるか、及び/又は予測可能なレベルである。例えば、既知又は未知の源に起因する予測可能及び一定レベルのノイズは、概して補正が容易である。1つの補正方法は、ノイズに関連する値(ノイズが過剰信号を追加するか、又は検出信号を減少させるかどうかによる)を、フローに関連するすべての信号値に数学的に加算するか、又はこうした検出信号から減算することである。
なお、さらに、いくつかの先に記載した態様は、観察されたフローグラム(q)中に表された配列データの過剰補正を防止するために、「安全基準」と呼ぶことができるものを含んでいた。上述したように、過剰補正は、上記のアルゴリズムが反復される際に導入される誤差の指数関数的な蓄積を引き起こす場合がある。例えば、上述した他のノイズ源は、信号データに適用される補正量を含む安全基準を決定する場合がある。例えば、いくつかの実施では、CAFIE源以外からの一定レベルのノイズを仮定し、データに対して60%補正(例えば、100%は、完全な補正を意味する)と呼ばれる場合がある安全基準を適用することができる。この見積もりは、計算されたクリーンなフローグラムpの60%、及び観察されたフローグラムqの40%を含む「ハイブリッド」フローグラム、「0.6p+0.4q」を使用する。あるいは、CAFIE以外のノイズが「低い」レベルにある場合、例えば、80%というより高い補正率を適用することができる。
方程式(11−12):
Δqλ=[Μ−1(p’,1−Δλ,0)]*q−q
Δqε=[M−1(p’,1,Δε)]*q−q
ここで、Μ(p’,λ,ε)は、上述したCAFIE行列であり、Δqλ及びΔqεは、2進コード化リストp’を用いた摂動Δλ及びΔεに応答したフローグラムの変化であり、pは、標準的CAFIE補正によって計算された理論上のフローグラムである。
方程式(14−15):
λ=1−tλΔλ
ε=tεΔε
このようにして、λ及びεは、位相不一致CAFIE誤差を最小限にする最適な対として確実になる。最後に、CAFIE補正を実施して新しいCAFIE補正された理論上のフローグラムp(1)を得る。
p(1)=[Μ−1(p’,ε,λ)]*q
上記に述べた手順を反復して繰り返す。即ち、反復n+1で、フローグラムp(n)を使用することによって2進コード化リストp’(n)を見積もり、最小化手順(13)によってCAFIE検索を再び実施し、摂動式(14〜16)によって、新しいCAFIE補正したフローグラムp(n+1)及びCAFIEパラメータ(ε(n+1),λ(n+1))を得る。
p(n+1)=[Μ−1(p’(n),ε(n+1),λ(n+1))]*q
いくつかの態様では、2進コード化リストが収束する、p’(n+1)=p’(n)まで帰納的手順を継続する。正のフローリストiは、p’(n)(i)=1である場合、正のヌクレオチド取り込みを示すフロー位置を近似する。より正確には、アルゴリズムによって見積もられる正のフローリストは、位相非同期性のより正確な補正をもたらす。従って、帰納的アルゴリズムでは、反復してCAFIE補正されたフローグラムを使用し、収束時に帰納的に補正されたフローグラムをもたらす。各反復において、アルゴリズムにより、CAFIEパラメータ(ε(n),λ(n))のより良好な見積もり値、及び次の反復において位相誤差のより正確なCAFIE補正を与える2進コード化p’(n)が得られる。
フローサイクル1回当たりのk塩基ヌクレオチド配列を有する数値的に生成したフロー順序を含むフロー順序設計のためのCAFIE誤差及び読み取り長のシミュレーションを行った。例えば、「TACG」フロー順序は、4塩基フロー順序であり、「TCGTGACGTCTA」(配列ID番号:1)循環フローは、12塩基フロー順序である。所定のフロー順序並びに所定の繰越率及び不完全伸長率に対して、SBS法を用いて大腸菌参照配列から得られると予測されるフローグラム信号のシミュレーションを生成した。このシミュレーションは、ゲノムのショットガン配列を模倣するために大腸菌参照配列から約10,000の無作為に選択された領域からのフローグラムを含んでいた。シミュレーションしたフローグラムは、フローグラム値を四捨五入して整数にすることによって塩基呼び出しを行った。信号処理におけるCAFIE補正方法の偏りを回避するためにシミュレーションしたフローグラムの信号補正は行わなかった。
Q=w1εT+w2ε0
ここで、w1及びw2は、0.5及び0.5等のそれぞれの効率に与えられた重み付けである。
ここで、Tは、次善のフロー順序が受け入れられる可能性を制御する「温度」である。全体の処理は品質スコアが最大となるまで繰り返えされ、参照ゲノムと選択パラメータw1、w2及びTに関して最適フロー順序が得られた。
配列決定データ、TACG並びにフロー順序EX1及びEX3の比較
フロー順序EX1及びEX3(表2)を標準試薬一式及び材料を用いてSBS機器で試験した。それらの読み取り長を以下の表3に要約し、(a)信号処理におけるCAFIE補正なし(CAFIE補正の偏りを避けるため)及び(b)CAFIE補正による全信号処理の結果を示す。
ゲノムの参照配列へのマッピングの結果を以下の表5に要約し、フロー順序EX1での3回の配列決定実行の結果を示す(表2)。
フロー順序A
TACGTACGTACG (12)
AGCGTACTGCATGCATCAGTATGCG (25)
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATCGC
AGCGTACTGCATGCATCAGTATGCT
AGCGTACTGCATGCATCAGTATGAC
AGCGTACTGCATGCATCAGTATGCG
AGCGTACTGCATGCATCAGTATCGC
(配列番号:No.10〜90)
フロー順序Aの特性
最初の12のフロー(4つの塩基フロー順序を3回循環)の後の25のフローごとに発生する最後の3つの位置における3つの変動位置と組み合わされた反復配列組成により、完全な順序は周期的に繰り返す25のフロー、即ち変動成分を有するフロー順序として解釈される。
反復領域
A=6、G=5、C=5、T=6
第1変動位置=G又はC
第2変動位置=A、G又はC
第3変動位置=T,G,又はC
第1〜第3変動位置の組合せ=少なくとも1つのG及び1つのC
3回反復4塩基フロー順序;80回反復繰り返し/25のフローの変動領域;2012全フロー
フロー順序B特性
TACGTACGTACG (12)
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC (全33; T=8; A=8; C=8; G=9)
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC (全33; T=9; A=8; C=8; G=8)
AGTGACTGATCGTCATCAGCTAGCATCGACTGC (全33; T=8; A=8; C=9; G=8)
ATAGATCGCATGACGATCGCATATCGTCAGTGC (全33; T=8; A=9; C=8; G=9)
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC (全33; T=8; A=8; C=8; G=9)
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC (全33; T=9; A=8; C=8; G=8)
ATAGATCGCATGACGATCGCATATCGTCAGTGC (全33; T=8; A=9; C=8; G=8)
AGTGACTGATCGTCATCAGCTAGCATCGACTGC (全33; T=8; A=8; C=9; G=8)
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC (全33; T=8; A=8; C=8; G=9)
ATAGATCGCATGACGATCGCATATCGTCAGTGC (全33; T=8; A=9; C=8; G=8)
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC (全33; T=9; A=8; C=8; G=8)
AGTGACTGATCGTCATCAGCTAGCATCGACTGC (全33; T=8; A=8; C=9; G=8)
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC (全33; T=8; A=8; C=8; G=9)
AGTGACTGATCGTCATCAGCTAGCATCGACTGC (全33; T=8; A=8; C=9; G=8)
ATAGATCGCATGACGATCGCATATCGTCAGTGC (全33; T=8; A=9; C=8; G=8)
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC (全33; T=9; A=8; C=8; G=8)
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC (全33; T=8; A=8; C=8; G=9)
ATAGATCGCATGACGATCGCATATCGTCAGTGC (全33; T=8; A=9; C=8; G=8)
AGTGACTGATCGTCATCAGCTAGCATCGACTGC (全33; T=8; A=8; C=9; G=8)
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC (全33; T=9; A=8; C=8; G=8)
AGTGACTGATCGTCATCAGCTAGCATCGACTGC
ATAGATCGCATGACGATCGCATATCGTCAGTGC
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC
ATAGATCGCATGACGATCGCATATCGTCAGTGC
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC
AGTGACTGATCGTCATCAGCTAGCATCGACTGC
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC
ATAGATCGCATGACGATCGCATATCGTCAGTGC
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC
AGTGACTGATCGTCATCAGCTAGCATCGACTGC
ATAGATCGCATGACGATCGCATATCGTCAGTGC
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC
AGTGACTGATCGTCATCAGCTAGCATCGACTGC
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC
AGTGACTGATCGTCATCAGCTAGCATCGACTGC
ATAGATCGCATGACGATCGCATATCGTCAGTGC
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC
AGTGACTGATCGTCATCAGCTAGCATCGACTGC
ATAGATCGCATGACGATCGCATATCGTCAGTGC
AGTGACTGATCGTCATCAGCTAGCATCGACTGC
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC
ATAGATCGCATGACGATCGCATATCGTCAGTGC
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC
AGTGACTGATCGTCATCAGCTAGCATCGACTGC
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC
ATAGATCGCATGACGATCGCATATCGTCAGTGC
AGTGACTGATCGTCATCAGCTAGCATCGACTGC
ATGATCTCAGTCAGCAGCTATGTCAGTGCATGC
ATAGATCGCATGACGATCGCATATCGTCAGTGC
ATGTAGTCGAGCATCATCTGACGCAGTACGTGC
(配列番号:No.91〜147)
フロー順序Bの特性
最初の12のフロー(4つの塩基フロー順序を3回循環)の後の33のフローごとに発生する29のフローの変動領域と組み合わされた最初の位置及び最後の3つの位置の反復配列組成により、完全な順序は周期的に繰り返す33のフロー、即ち実質的に変動成分を有するフロー順序として解釈される。
変動領域29個の位置=8つのフローと7つの残りを有する1つの種を常に有する(全ての種のフロー数を1だけ増やす繰り返し位置は含まない)
最後の3つの位置=常にTCG
第1及び第2の繰り返し領域の組合せ=各ヌクレオチド種を一度表す
3回反復4塩基フロー順序;55回反復繰り返し/33のフローの変動領域;1827全フロー
様々な態様及び実施について述べてきたが、当業者には明らかであるが、上記の記載は例示的なものに過ぎず、非限定的なものであり、例示目的のために記載されている。図示の態様の様々な機能要素間に機能を分配するための他の多くの構成が可能である。別の態様において、任意の要素の機能を様々な方法で実行することが可能である。
Claims (5)
- 配列データ中の位相同期誤差の蓄積を最小にするフロー順序を生成する方法であって、以下のステップを含む前記方法:
(a)合成配列決定の反応環境にヌクレオチド種を導入するための複数のフロー順序を決定するステップであり、ここで各フロー順序はヌクレオチド種を並置することによって構築されるものであり、前記各フロー順序はk塩基長のヌクレオチド種を含むものであり、前記各フロー順序に含まれるヌクレオチド種はチミン、アデニン、シトシン、及びグアニンからなる群から選択されるものである;
(b)前記各フロー順序を用いた合成配列決定による1つ以上の参照ゲノムからの配列データの取得をシミュレーションすることで、読み取り長パラメータ及び伸長率パラメータを決定するステップであり、ここで、前記配列データは、位相同期誤差の蓄積を含むものであり、前記読み取り長パラメータは、3%未満の蓄積された位相同期誤差を含む一定の読み取り長であり、前記伸長率パラメータは、鋳型分子に対して1つのヌクレオチドフローが伸長させることができる相補的な配列位置の平均数である;及び、
(c)前記読み取り長パラメータ及び伸長率パラメータに基づいて、配列データ中の位相同期誤差の蓄積を最小にするフロー順序を決定するステップ。 - 配列データのシミュレーションされた取得が、位相同期誤差の蓄積をシミュレーションする繰越パラメータ及び不完全伸長パラメータを使用することを含む、請求項1に記載の方法。
- k塩基長が16、24、32、及び40塩基長からなる群から選択される、請求項1または2に記載の方法。
- k塩基長が32〜40塩基の範囲の長さを含む、請求項1または2に記載の方法。
- 400bpを超える読み取り長パラメータ及び0.55bp/フロー以下の伸長率パラメータが、配列データ中の位相同期誤差の蓄積を最小にするフロー順序を決定するための基準である、請求項1〜4のいずれか1項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261648783P | 2012-05-18 | 2012-05-18 | |
US61/648,783 | 2012-05-18 | ||
PCT/EP2013/060152 WO2013171303A2 (en) | 2012-05-18 | 2013-05-16 | System and method for generation and use of optimal nucleotide flow orders |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015519662A JP2015519662A (ja) | 2015-07-09 |
JP6373827B2 true JP6373827B2 (ja) | 2018-08-15 |
Family
ID=48444397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015512060A Expired - Fee Related JP6373827B2 (ja) | 2012-05-18 | 2013-05-16 | 最適化されたヌクレオチドフロー順序を生成及び使用するためのシステム及び方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10192024B2 (ja) |
EP (1) | EP2850551A2 (ja) |
JP (1) | JP6373827B2 (ja) |
CN (1) | CN104364789A (ja) |
CA (1) | CA2873146A1 (ja) |
WO (1) | WO2013171303A2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8965076B2 (en) * | 2010-01-13 | 2015-02-24 | Illumina, Inc. | Data processing system and methods |
WO2015162438A1 (en) * | 2014-04-25 | 2015-10-29 | Dna Electronics Ltd | Sequencing methods |
US11151497B2 (en) * | 2016-04-27 | 2021-10-19 | Zymergen Inc. | Microbial strain design system and methods for improved large-scale production of engineered nucleotide sequences |
WO2018064311A2 (en) * | 2016-09-28 | 2018-04-05 | Life Technologies Corporation | Methods and systems for reducing phasing errors when sequencing nucleic acids using termination chemistry |
US11581064B2 (en) * | 2017-10-26 | 2023-02-14 | Zymergen Inc. | Device-agnostic system for planning and executing high-throughput genomic manufacturing operations |
CA3138862A1 (en) | 2019-05-03 | 2020-12-10 | Ultima Genomics, Inc. | Fast-forward sequencing by synthesis methods |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
JP4298912B2 (ja) | 1997-07-07 | 2009-07-22 | メディカル リサーチ カウンシル | invitro選別法 |
GB9901475D0 (en) | 1999-01-22 | 1999-03-17 | Pyrosequencing Ab | A method of DNA sequencing |
US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
US7244559B2 (en) | 1999-09-16 | 2007-07-17 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US7211390B2 (en) | 1999-09-16 | 2007-05-01 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
GB0127564D0 (en) | 2001-11-16 | 2002-01-09 | Medical Res Council | Emulsion compositions |
US6952651B2 (en) | 2002-06-17 | 2005-10-04 | Intel Corporation | Methods and apparatus for nucleic acid sequencing by signal stretching and data integration |
WO2005003375A2 (en) | 2003-01-29 | 2005-01-13 | 454 Corporation | Methods of amplifying and sequencing nucleic acids |
US7575865B2 (en) | 2003-01-29 | 2009-08-18 | 454 Life Sciences Corporation | Methods of amplifying and sequencing nucleic acids |
GB0324456D0 (en) * | 2003-10-20 | 2003-11-19 | Isis Innovation | Parallel DNA sequencing methods |
EP1735458B1 (en) | 2004-01-28 | 2013-07-24 | 454 Life Sciences Corporation | Nucleic acid amplification with continuous flow emulsion |
JP2006130685A (ja) | 2004-11-02 | 2006-05-25 | Fuji Photo Film Co Ltd | 微粒子積層基板及びその製造方法 |
US7682816B2 (en) | 2005-04-07 | 2010-03-23 | 454 Life Sciences Corporation | Thin film coated microwell arrays and methods of using same |
US20060228721A1 (en) | 2005-04-12 | 2006-10-12 | Leamon John H | Methods for determining sequence variants using ultra-deep sequencing |
EP1910537A1 (en) | 2005-06-06 | 2008-04-16 | 454 Life Sciences Corporation | Paired end sequencing |
US20090233291A1 (en) | 2005-06-06 | 2009-09-17 | 454 Life Sciences Corporation | Paired end sequencing |
US8364417B2 (en) | 2007-02-15 | 2013-01-29 | 454 Life Sciences Corporation | System and method to correct out of phase errors in DNA sequencing data by use of a recursive algorithm |
CN101390101B (zh) * | 2006-02-16 | 2012-05-23 | 454生命科学公司 | 用于校正核酸序列数据中的引物延伸误差的系统和方法 |
US8617816B2 (en) | 2007-03-16 | 2013-12-31 | 454 Life Sciences, A Roche Company | System and method for detection of HIV drug resistant variants |
US20090105959A1 (en) | 2007-06-01 | 2009-04-23 | Braverman Michael S | System and method for identification of individual samples from a multiplex mixture |
WO2009005753A2 (en) * | 2007-06-28 | 2009-01-08 | 454 Life Sciences Corporation | System and method for adaptive reagent control in nucleic acid sequencing |
US20090203086A1 (en) | 2008-02-06 | 2009-08-13 | 454 Life Sciences Corporation | System and method for improved signal detection in nucleic acid sequencing |
US20110003701A1 (en) | 2008-02-27 | 2011-01-06 | 454 Life Sciences Corporation | System and method for improved processing of nucleic acids for production of sequencable libraries |
US7888034B2 (en) | 2008-07-01 | 2011-02-15 | 454 Life Sciences Corporation | System and method for detection of HIV tropism variants |
US20100136516A1 (en) | 2008-12-01 | 2010-06-03 | 454 Life Sciences Corporation | System and method for detection of HIV integrase variants |
CN103764845B (zh) * | 2011-04-08 | 2016-02-17 | 生命科技股份有限公司 | 用于合成测序中的相保护试剂流排序 |
-
2013
- 2013-03-13 US US13/801,867 patent/US10192024B2/en active Active
- 2013-05-16 CA CA2873146A patent/CA2873146A1/en not_active Abandoned
- 2013-05-16 EP EP13722769.0A patent/EP2850551A2/en not_active Withdrawn
- 2013-05-16 CN CN201380025917.0A patent/CN104364789A/zh active Pending
- 2013-05-16 JP JP2015512060A patent/JP6373827B2/ja not_active Expired - Fee Related
- 2013-05-16 WO PCT/EP2013/060152 patent/WO2013171303A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20130311105A1 (en) | 2013-11-21 |
US10192024B2 (en) | 2019-01-29 |
EP2850551A2 (en) | 2015-03-25 |
WO2013171303A3 (en) | 2014-05-01 |
WO2013171303A2 (en) | 2013-11-21 |
CA2873146A1 (en) | 2013-11-21 |
JP2015519662A (ja) | 2015-07-09 |
CN104364789A (zh) | 2015-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kumar et al. | Next-generation sequencing and emerging technologies | |
Bleidorn | Third generation sequencing: technology and its potential impact on evolutionary biodiversity research | |
JP6373827B2 (ja) | 最適化されたヌクレオチドフロー順序を生成及び使用するためのシステム及び方法 | |
US8364417B2 (en) | System and method to correct out of phase errors in DNA sequencing data by use of a recursive algorithm | |
Shendure et al. | Next-generation DNA sequencing | |
Almeida et al. | Bioinformatics tools to assess metagenomic data for applied microbiology | |
US20150051088A1 (en) | Next-generation sequencing libraries | |
US20110287432A1 (en) | System and method for tailoring nucleotide concentration to enzymatic efficiencies in dna sequencing technologies | |
JP2010528608A5 (ja) | ||
KR20200010464A (ko) | 기지 또는 미지의 유전자형의 다수의 기여자로부터 dna 혼합물을 분해 및 정량하기 위한 방법 및 시스템 | |
Goswami et al. | RNA-Seq for revealing the function of the transcriptome | |
Shetty et al. | Introduction to nucleic acid sequencing | |
CN115867665A (zh) | 嵌合扩增子阵列测序 | |
Singh et al. | Bioinformatics in next-generation genome sequencing | |
Marri et al. | Advances in sequencing and resequencing in crop plants | |
WO2017009718A1 (en) | Automatic processing selection based on tagged genomic sequences | |
Mishra et al. | Strategies and tools for sequencing and assembly of plant genomes | |
WO2014037423A1 (en) | SYSTEM AND METHOD FOR OPERATION OF ISFET ARRAYS USING pH INERT REFERENCE SENSORS | |
Mitra et al. | Statistical analyses of next generation sequencing data: an overview | |
US9624519B2 (en) | System and method for nucleic acid amplification | |
Daniel et al. | Sequencing Technology in Forensic Science: Next-Generation Sequencing | |
Chaitanya et al. | Genome sequencing, assembly, and annotation | |
Gulati et al. | Computational and functional annotation at genomic scale: gene expression and analysis | |
Udayaraja | Personal diagnostics using DNA-sequencing | |
Asrat | Review on Mechanism of DNA Sequencing Technologies in Crop Improvement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160506 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170616 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180619 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180718 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6373827 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |