JP5808515B2 - 核酸配列データのプライマー伸長誤差を補正するためのシステムおよび方法 - Google Patents
核酸配列データのプライマー伸長誤差を補正するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP5808515B2 JP5808515B2 JP2008555390A JP2008555390A JP5808515B2 JP 5808515 B2 JP5808515 B2 JP 5808515B2 JP 2008555390 A JP2008555390 A JP 2008555390A JP 2008555390 A JP2008555390 A JP 2008555390A JP 5808515 B2 JP5808515 B2 JP 5808515B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- carry
- signal
- steps
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6848—Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Description
本願は、2006年2月16日に出願された、米国仮特許出願第60/774,354号(発明の名称「System and Method for Correcting Primer Extension Errors in Nucleic Acid Sequence Data」)に関連し、この仮特許出願の優先権を主張し、この仮特許出願は、あらゆる目的のために、その全体が本明細書中に参考として援用される。
本発明は、分子生物学の分野に関する。詳細には、本発明は、「合成による配列決定」(SBS)技術と一般に呼ばれる技術によって生成された核酸配列データの誤差の補正に関する。
合成による配列決定(SBS)は、一般に、核酸サンプル中の1つまたは複数のヌクレオチドの同一性または配列を判断するための方法であって、ヌクレオチド配列の組成が決定されるテンプレート核酸分子に対して相補的な単鎖ポリヌクレオチドの段階的な合成を含む方法を意味する。たとえば、SBS技術は、一般に、単一核酸(ヌクレオチドとも呼ばれる)種を、対応する配列位置におけるテンプレート分子の核酸種に対して相補的な新生ポリヌクレオチド分子に添加することによって機能する。新生分子に対する核酸種の添加は、一般に、先行技術で公知の多様な方法を使用して検出され、こうした方法としては、パイロシーケンシングと呼ばれる方法、または蛍光検出法、たとえば可逆的ターミネーターを使用する方法挙げられるが、これらだけに限らない。一般に、このプロセスは、完了するまで(つまり、すべての配列位置が表現されるまで)、またはテンプレートに対して相補的な所望の配列長さが合成されるまで繰り返される。SBS技術のいくつかの例は、特許文献1に記載されており、この特許は、本明細書で引用することにより、あらゆる目的で全体を本願に援用する;および米国特許出願第10/788,529号;第09/814,338号;第10/299,180号;第10/222,298号;第10/222,592号に記載されており、これらの特許出願は各々、本明細書で引用することにより、あらゆる目的で全体を本願に援用する。
本発明の実施態様は、核酸の配列決定に関する。詳細には、本発明の実施態様は、SBSによる核酸の配列決定時に得られたデータの誤差を補正する方法およびシステムに関する。
本明細書に記載する発明の実施態様は、少なくとも部分的に、理論上、つまり「完全な」フローグラムは、IEおよびCFの数学モデルによって、実際に観察される「ダーティな」フローグラムに変換することができるという発見に基づいている。本明細書で使用する「フローグラム」という用語は、一般に、たとえば配列決定データのグラフ表現を含み得る配列決定実行から生成される配列決定データの表現を意味する。たとえば、完全つまり理論上のフローグラムは、配列決定実行から生成され、上記のCAFIEメカニズムに由来する誤差、またはその他のタイプの背景誤差がないデータを表す。同様に、ダーティまたは観察されたフローグラムは、CAFIEおよび背景誤差要素を含む配列決定実行から生成されるデータを表す。本明細書の例では、誤差要素の一部または全部は、正確に概算して完全なフローグラムモデルに適用し、実際の配列決定実行から得られる実際のデータの表現を提供し得る。
方程式(1):
M(p,ε,λ)=q
ここで:
− Mは、CAFIEマッピングであり
− pは、仮定上の「完全な」フローグラム[アレイとして]であり
− λは、完了効率パラメータであり
− εは、繰越パラメータであり
− qは、「ダーティな」フローグラム[アレイとして]である。
各々のヌクレオチド種のフローiについて:
(i) − ヌクレオチド種の添加により、新生分子を伸長する:
ここで:
− piは、i番目のヌクレオチド種フローで、理論上の(クリーンな)フローグラムの信号値である
− qiは、i番目のヌクレオチド種フローで、観察された(ダーティな)フローグラムの信号値である
− miは、i番目のヌクレオチド種フローのフローグラム配列位置で、組込みに使用できるヌクレオチド種分子の画分である
− Niは、i番目のヌクレオチド種添加(A、C、G、またはT)である
− (j,j’)は対の指数であり、pj’はフローグラム上のpjの次の正の値である。
方程式(2):
[M(p’,ε,λ)]*p=q
ここで:
− [M(p’,ε,λ)]は、マトリックスである
− *は、マトリックスアレイの乗算である
− p’=sgn(p)は、理論上つまり「完全な」フローグラムの2進コード化である(たとえば、図1のフローグラムp、p=[010200103012]は、p’=[010100101011])としてコード化されるであろう)。
方程式(3):
p=[M−1(p’,ε,λ)]*q
ここで:
− [M−1(p’,ε,λ)]は、(集合論的)逆マトリックスである。
方程式(4):
p(n+1)=[M−1(p’(n),ε,λ]*q
ここで、p’(n)≡sgn(p(n)−閾値)およびp(1)≡qは、計算の種として使用される。閾値の値は、システムの信号対雑音比によって決まる。
方法1:
εおよび(1−λ)の小さい値では(たとえば、(1−λ)≦0.001およびε≦.0025)、マトリックス[M]は分解され、ある形式に近似される:
方程式(5):
[M(p’,ε,λ)]〜[L(p’,Δλ)]φ*[U(p’,Δε)]ω
ここで:
− Δε=0.0025およびΔλ=0.001は、それぞれεおよびλ軸における間隔である
− φおよびωはマトリックスパワーであり、ω〜ε/Δεおよびφ〜(1−λ)/Δλの特性を有する
− [L(p’,Δλ)]は下方の対角マトリックスであり、わずかな欠如ΔλにおけるIEの作用をモデル化する
− [U(p’,Δλ)]は、上方の対角マトリックスであり、わずかな欠如ΔεにおけるCFの作用をモデル化する。
方程式(5)により、小さいεおよび(1−λ)の事例では、下方および上方対角パワーマトリックス[L]φおよび[U]ωは、以下によってさらに概算される:
方程式(6):
[L]φ≡([I]+[l])φ〜[I]+φ[l]
方程式(7):
[U]ω≡([I]+[u])ω〜[I]+ω[u]
ここで:
− [I]は、同一性マトリックスである
− [l]および[u]は、それぞれ[L]および[U]の非対角マトリックスである。
λN(f)=λ0 N *exp(−δN *f)、
εN(f)=ε0 N *exp(−βN *f)。
ここで:
− λN(f)は、「f」番目のフローにおけるヌクレオチド種「N」の完了効率である
− εN(f)は、「f」番目のフローにおけるヌクレオチド種「N」のCFである
− λ0 Nおよびε0 Nは、初期値である
− δNおよびβNは、減衰率である。
黄色ブドウ球菌COLおよびマイコプラズマジェニタリウムのゲノムは、454 Life Sciencesのゲノムシーケンサ上にショットガン配列した(Margulies等、2005、上記で引用することにより本願に援用する)。図7は、IE補正のみの効果、ゲノム範囲に関するCAFIE補正、共通配列の正確さ、中間読込み長さ、並びに、125を超える配列位置の読込み長さのうち、100%の精度を達成したウェルの割合の具体的な例を示す。これらの各々の測定基準では、CAFIE補正は、IE補正単独より優れていた。IE補正単独では、補正を行わない場合に得られた結果より優れていた。対照配列を含むビードを別に調製し、実験サンプルと混合してからアレイを調製した。
(1)buildTransitionMatrixIEOnly.c
不完全な伸長に関する遷移マトリックスを構築する。
(2)buildTransitionMatrixCFOnly.c
繰越に関する遷移マトリックスを構築する。
(3)cafieCorrectOneNukeTraceFastTMC2.c
(1)で計算した遷移マトリックスを反転し、IE値を検索する。
(4)cafieCorrectOneNukeTraceFastCarryForwardOnly.c
(2)で計算した遷移マトリックスを反転し、CF値を検索する。
Claims (35)
- テンプレート分子の実質的に同じコピーの集団から生成された配列データの位相同期に関連する誤差を補正する方法であって、
前記位相同期に関連する誤差は、不完全な伸長要素および繰越要素を含み、前記方法は、
(a)配列決定反応における1つ以上のヌクレオチドの組込みに応答して生成される信号を検出するステップ、
(b)前記信号の値を生成するステップ、ここで、前記信号の前記値が、組み込まれたヌクレオチドの数を表す、ならびに
(c)第1パラメータおよび第2パラメータを使用して、位相同期誤差について前記値を補正するステップ
を含み、
前記第1パラメータが、前記不完全な伸長要素を表し、前記第2パラメータが前記繰越要素を表し、
前記第1パラメータの値および前記第2パラメータの値が、前記第1および第2パラメータの各々のマトリックス方程式に対するベストフィットを作成することによって概算され、
前記マトリックス方程式は、方程式:
p (n+1) =[M −1 (p’ (n) ,ε,λ) * q
(式中、
p (n) は理論的フローグラムのn番目のフローであり;
[M −1 (p’ (n) ,ε,λ)は、CAFIEマッピングの逆マトリックスであり、前記CAFIEは、繰越と不完全な伸長を組み合わせた効果であり;
p’ (n) は、sgn(p (n) −閾値)であり、前記閾値は、前記信号を検出するシステムの信号対雑音比によって決まり;
p (1) =qであり;
εは、繰越パラメータであり、前記繰越パラメータは、繰越要素の割合に対応し;
λは、完了効率パラメータであり、前記完了効率パラメータは、「1−不完全な伸長要素の割合」に対応し;
qは観察されたフローグラムである)
で表される、方法。 - (d)テンプレート分子の各配列位置についてステップ(a)〜(c)を繰り返すステップをさらに含む、請求項1に記載の方法。
- (e)各々の補正値を前記テンプレート分子の表現に組み込むステップをさらに含む、請求項2に記載の方法。
- 前記表現がフローグラムを含む、請求項3に記載の方法。
- 前記不完全な伸長要素および前記繰越要素が、前記テンプレート分子の各々の配列位置についてともに実質的に一定であるものとして処理される、請求項2に記載の方法。
- 前記繰越要素が、前記テンプレート分子の各々の配列位置について実質的に一定であるものとして処理される繰越要素を含む、請求項2に記載の方法。
- 前記信号が、前記1つ以上のヌクレオチドの前記組込みに応じて放射される光を含む、請求項1に記載の方法。
- 前記光が、前記配列決定反応からの化学発光の光を含む、請求項7に記載の方法。
- 前記配列決定反応が、ピロリン酸塩配列決定反応を含む、請求項8に記載の方法。
- 前記光が、前記配列決定反応からの蛍光の光を含む、請求項7に記載の方法。
- 前記配列決定反応が、可逆的ターミネーターを使用する配列決定反応を含む、請求項10に記載の方法。
- 前記第1および第2パラメータの前記ベストフィットの前記概算が、テスト値間の間隔を使用して作成し、1つ以上の近似値を各々のテスト値におけるマトリックス構成演算に適用することを含み、前記近似値が、前記概算の改善された計算効率を提供する、請求項1に記載の方法。
- テンプレート分子の実質的に同じコピーの集団から生成された配列データの位相同期に関連する誤差を補正する方法であって、
前記位相同期に関連する誤差は、不完全な伸長要素および繰越要素を含み、前記方法は、
(a)配列決定反応における1つ以上のヌクレオチドの組込みに応答して生成される信号を検出するステップ、
(b)前記信号の値を生成するステップ、ここで、前記信号の前記値が、組み込まれたヌクレオチドの数を表す、
(c)前記値をテンプレート分子の配列に関連する表現に組み込むステップ、
(d)前記テンプレート分子の各々の配列位置について、ステップ(a)〜(c)を繰り返すステップ、
(e)第1パラメータおよび第2パラメータを使用して、前記表現の位相同期誤差について各々の値を補正するステップ、ならびに
(f)補正値を使用して、補正された表現を生成するステップ
を含み、
前記第1パラメータが、前記不完全な伸長要素を表し、前記第2パラメータが前記繰越要素を表し、
前記第1パラメータの値および前記第2パラメータの値が、前記第1および第2パラメータの各々のマトリックス方程式に対するベストフィットを作成することによって概算され、
前記マトリックス方程式は、方程式:
p (n+1) =[M −1 (p’ (n) ,ε,λ) * q
(式中、
p (n) は理論的フローグラムのn番目のフローであり;
[M −1 (p’ (n) ,ε,λ)は、CAFIEマッピングの逆マトリックスであり、前記CAFIEは、繰越と不完全な伸長を組み合わせた効果であり;
p’ (n) は、sgn(p (n) −閾値)であり、前記閾値は、前記信号を検出するシステムの信号対雑音比によって決まり;
p (1) =qであり;
εは、繰越パラメータであり、前記繰越パラメータは、繰越要素の割合に対応し;
λは、完了効率パラメータであり、前記完了効率パラメータは、「1−不完全な伸長要素の割合」に対応し;
qは観察されたフローグラムである)
で表される、方法。 - (g)ステップ(e)の前の繰返しからの補正値を使用して、ステップ(e)〜(f)を繰返し反復するステップをさらに含み、前記補正値の一部または全部が、各々の繰返しで品質を改善する、請求項13に記載の方法。
- 前記不完全な伸長要素および前記繰越要素が、前記テンプレート分子の各々の配列位置についてともに実質的に一定であるものとして処理される、請求項13に記載の方法。
- 前記繰越要素が、前記テンプレート分子の各々の配列位置について実質的に一定であるものとして処理される、請求項13に記載の方法。
- 前記信号が、前記1つ以上のヌクレオチドの前記組込みに応じて放射される光を含む、請求項13に記載の方法。
- 前記光が、前記配列決定反応からの化学発光の光を含む、請求項17に記載の方法。
- 前記配列決定反応が、ピロリン酸塩配列決定反応を含む、請求項18に記載の方法。
- 前記光が、前記配列決定反応からの蛍光の光を含む、請求項17に記載の方法。
- 前記配列決定反応が、可逆的ターミネーターを使用する配列決定反応を含む、請求項20に記載の方法。
- 前記第1および第2パラメータの前記ベストフィットの前記概算が、テスト値間の間隔を使用して作成し、1つ以上の近似値を各々のテスト値におけるマトリックス構成演算に適用することを含み、前記近似値が、前記概算の改善された計算効率を提供する、請求項13に記載の方法。
- 前記表現および補正された表現がフローグラムを含む、請求項13に記載の方法。
- テンプレート分子の実質的に同じコピーの集団から生成された配列データの位相同期に関連する誤差を補正する方法であって、
前記位相同期に関連する誤差は、不完全な伸長要素および繰越要素を含み、前記方法は、
(a)配列決定反応における1つ以上のヌクレオチドの組込みに応答して生成される信号を検出するステップ、
(b)前記信号の値を生成するステップ、ここで、前記信号の前記値が、組み込まれたヌクレオチドの数を表す、
(c)前記値をテンプレート分子の配列に関連する表現に組み込むステップ、
(d)前記テンプレート分子の各々の配列位置について、ステップ(a)〜(c)を繰り返すステップ、
(e)前記表現を複数の部分集合に分割するステップ、ここで、各々の部分集合が前記テンプレート分子の1つ以上の配列位置を含む、
(f)各々の部分集合において第1パラメータおよび第2パラメータの同期誤差を概算するステップ、
(g)各々の個々の部分集合に関する前記第1パラメータおよび前記第2パラメータの前記同期誤差の概算を使用して、位相同期誤差について各部分集合の各々の値を補正するステップ、ならびに
(h)補正値を使用して、補正された部分集合を補正された表現に結合するステップ
を含み、
前記第1パラメータが、前記不完全な伸長要素を表し、前記第2パラメータが前記繰越要素を表し、
前記第1パラメータの値および前記第2パラメータの値が、前記第1および第2パラメータの各々のマトリックス方程式に対するベストフィットを作成することによって概算され、
前記マトリックス方程式は、方程式:
p (n+1) =[M −1 (p’ (n) ,ε,λ) * q
(式中、
p (n) は理論的フローグラムのn番目のフローであり;
[M −1 (p’ (n) ,ε,λ)は、CAFIEマッピングの逆マトリックスであり、前記CAFIEは、繰越と不完全な伸長を組み合わせた効果であり;
p’ (n) は、sgn(p (n) −閾値)であり、前記閾値は、前記信号を検出するシステムの信号対雑音比によって決まり;
p (1) =qであり;
εは、繰越パラメータであり、前記繰越パラメータは、繰越要素の割合に対応し;
λは、完了効率パラメータであり、前記完了効率パラメータは、「1−不完全な伸長要素の割合」に対応し;
qは観察されたフローグラムである)
で表される、方法。 - 前記不完全な伸長要素および前記繰越要素が、前記テンプレート分子の複数の配列位置で変動する、請求項24に記載の方法。
- 前記繰越要素が、前記テンプレート分子の複数の配列位置で変動する、請求項24に記載の方法。
- テンプレート分子の実質的に同じコピーの集団から生成された配列データの位相同期に関連する誤差を補正するためのシステムであって、
前記位相同期に関連する誤差は、不完全な伸長要素および繰越要素を含み、前記システムは、コンピュータ上で実行するために記憶されたプログラムコードを含むコンピュータを含み、前記プログラムコードが、
(a)配列決定反応における1つ以上のヌクレオチドの組込みに応答して検出された信号の値を生成するステップ、ここで、前記信号の前記値が、組み込まれたヌクレオチドの数を表す、ならびに
(b)第1パラメータおよび第2パラメータを使用して、位相同期誤差について前記値を補正するステップ
を含む方法を実行し、
前記第1パラメータが、前記不完全な伸長要素を表し、前記第2パラメータが前記繰越要素を表し、
前記第1パラメータの値および前記第2パラメータの値が、前記第1および第2パラメータの各々のマトリックス方程式に対するベストフィットを作成することによって概算され、
前記マトリックス方程式は、方程式:
p (n+1) =[M −1 (p’ (n) ,ε,λ) * q
(式中、
p (n) は理論的フローグラムのn番目のフローであり;
[M −1 (p’ (n) ,ε,λ)は、CAFIEマッピングの逆マトリックスであり、前記CAFIEは、繰越と不完全な伸長を組み合わせた効果であり;
p’ (n) は、sgn(p (n) −閾値)であり、前記閾値は、前記信号を検出するシステムの信号対雑音比によって決まり;
p (1) =qであり;
εは、繰越パラメータであり、前記繰越パラメータは、繰越要素の割合に対応し;
λは、完了効率パラメータであり、前記完了効率パラメータは、「1−不完全な伸長要素の割合」に対応し;
qは観察されたフローグラムである)
で表される、システム。 - 前記プログラムコードによって実行される前記方法が、
(c)テンプレート分子の各々の配列位置について、ステップ(a)〜(b)を繰り返すステップ
をさらに含む、請求項27に記載のシステム。 - 前記プログラムコードによって実行される前記方法が、
(d)各々の補正値を前記テンプレート分子の表現に組み込むステップ
をさらに含む、請求項28に記載のシステム。 - 前記プログラムコードによって実行される前記方法が、
(e)前記表現をユーザに提供するステップ
をさらに含む、請求項29に記載のシステム。 - テンプレート分子の実質的に同じコピーの集団から生成された配列データの位相同期に関連する誤差を補正するシステムであって、
前記位相同期に関連する誤差は、不完全な伸長要素および繰越要素を含み、前記システムは、コンピュータ上で実行するために記憶されたプログラムコードを含むコンピュータを含み、前記プログラムコードが、
(a)配列決定反応における1つ以上のヌクレオチドの組込みに応答して検出された信号の値を生成するステップ、ここで、前記信号の前記値が、組み込まれたヌクレオチドの数を表す、
(b)前記値をテンプレート分子の配列に関連する表現に組み込むステップ、
(c)前記テンプレート分子の各々の配列位置について、ステップ(a)〜(b)を繰り返すステップ、
(d)第1パラメータおよび第2パラメータを使用して、前記表現の位相同期誤差について各々の値を補正するステップ、ならびに
(e)補正値を使用して、補正された表現を生成するステップ
を含む方法を実行し、
前記第1パラメータが、前記不完全な伸長要素を表し、前記第2パラメータが前記繰越要素を表し、
前記第1パラメータの値および前記第2パラメータの値が、前記第1および第2パラメータの各々のマトリックス方程式に対するベストフィットを作成することによって概算され、
前記マトリックス方程式は、方程式:
p (n+1) =[M −1 (p’ (n) ,ε,λ) * q
(式中、
p (n) は理論的フローグラムのn番目のフローであり;
[M −1 (p’ (n) ,ε,λ)は、CAFIEマッピングの逆マトリックスであり、前記CAFIEは、繰越と不完全な伸長を組み合わせた効果であり;
p’ (n) は、sgn(p (n) −閾値)であり、前記閾値は、前記信号を検出するシステムの信号対雑音比によって決まり;
p (1) =qであり;
εは、繰越パラメータであり、前記繰越パラメータは、繰越要素の割合に対応し;
λは、完了効率パラメータであり、前記完了効率パラメータは、「1−不完全な伸長要素の割合」に対応し;
qは観察されたフローグラムである)
で表される、システム。 - 前記プログラムコードによって実行される前記方法が、
(f)ステップ(d)の前の繰返しからの補正値を使用して、ステップ(d)〜(e)を繰返し反復するステップ
をさらに含み、前記補正値の一部または全部が、各々の繰返しで品質を改善する、請求項31に記載のシステム。 - 前記繰返し反復するステップが、実行する繰返しの数に関するユーザの選択に応答する、請求項32に記載のシステム。
- 前記プログラムコードによって実行される前記方法が、
(f)前記補正された表現をユーザに提供すること
をさらに含む、請求項31に記載のシステム。 - テンプレート分子の実質的に同じコピーの集団から生成された配列データの位相同期に関連する誤差を補正するシステムであって、
前記位相同期に関連する誤差は、不完全な伸長要素および繰越要素を含み、前記システムは、コンピュータ上で実行するために記憶されたプログラムコードを含むコンピュータを含み、前記プログラムコードが、
(a)配列決定反応における1つ以上のヌクレオチドの組込みに応答して検出された信号の値を生成するステップ、ここで、前記信号の前記値が、組み込まれたヌクレオチドの数を表す、
(b)前記値をテンプレート分子の配列に関連する表現に組み込むステップ、
(c)前記テンプレート分子の各々の配列位置について、ステップ(a)〜(b)を繰り返すステップ、
(d)前記表現を複数の部分集合に分割するステップ、ここで、各々の部分集合が、前記テンプレート分子の1つ以上の配列位置を含む、
(e)各々の部分集合において第1パラメータおよび第2パラメータの同期誤差を概算するステップ、
(f)各々の個々の部分集合に関する前記第1パラメータおよび前記第2パラメータの前記同期誤差の概算を使用して、位相同期誤差について各部分集合の各々の値を補正するステップ、ならびに
(g)補正値を使用して、補正された部分集合を補正された表現に結合するステップ
を含む方法を実行し、
前記第1パラメータが、前記不完全な伸長要素を表し、前記第2パラメータが前記繰越要素を表し、
前記第1パラメータの値および前記第2パラメータの値が、前記第1および第2パラメータの各々のマトリックス方程式に対するベストフィットを作成することによって概算され、
前記マトリックス方程式は、方程式:
p (n+1) =[M −1 (p’ (n) ,ε,λ) * q
(式中、
p (n) は理論的フローグラムのn番目のフローであり;
[M −1 (p’ (n) ,ε,λ)は、CAFIEマッピングの逆マトリックスであり、前記CAFIEは、繰越と不完全な伸長を組み合わせた効果であり;
p’ (n) は、sgn(p (n) −閾値)であり、前記閾値は、前記信号を検出するシステムの信号対雑音比によって決まり;
p (1) =qであり;
εは、繰越パラメータであり、前記繰越パラメータは、繰越要素の割合に対応し;
λは、完了効率パラメータであり、前記完了効率パラメータは、「1−不完全な伸長要素の割合」に対応し;
qは観察されたフローグラムである)
で表される、システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US77435406P | 2006-02-16 | 2006-02-16 | |
US60/774,354 | 2006-02-16 | ||
PCT/US2007/004187 WO2007098049A2 (en) | 2006-02-16 | 2007-02-15 | System and method for correcting primer extension errors in nucleic acid sequence data |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013114005A Division JP5746265B2 (ja) | 2006-02-16 | 2013-05-30 | 核酸配列データのプライマー伸長誤差を補正するためのシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009527817A JP2009527817A (ja) | 2009-07-30 |
JP5808515B2 true JP5808515B2 (ja) | 2015-11-10 |
Family
ID=38437895
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008555390A Expired - Fee Related JP5808515B2 (ja) | 2006-02-16 | 2007-02-15 | 核酸配列データのプライマー伸長誤差を補正するためのシステムおよび方法 |
JP2013114005A Expired - Fee Related JP5746265B2 (ja) | 2006-02-16 | 2013-05-30 | 核酸配列データのプライマー伸長誤差を補正するためのシステムおよび方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013114005A Expired - Fee Related JP5746265B2 (ja) | 2006-02-16 | 2013-05-30 | 核酸配列データのプライマー伸長誤差を補正するためのシステムおよび方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US8301394B2 (ja) |
EP (2) | EP2578702A1 (ja) |
JP (2) | JP5808515B2 (ja) |
CN (1) | CN101390101B (ja) |
CA (1) | CA2637617C (ja) |
ES (1) | ES2626620T3 (ja) |
WO (1) | WO2007098049A2 (ja) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007525151A (ja) | 2003-01-29 | 2007-09-06 | 454 コーポレーション | 一本鎖dnaライブラリーの調製方法 |
JP5808515B2 (ja) | 2006-02-16 | 2015-11-10 | 454 ライフ サイエンシーズ コーポレイション | 核酸配列データのプライマー伸長誤差を補正するためのシステムおよび方法 |
US8364417B2 (en) | 2007-02-15 | 2013-01-29 | 454 Life Sciences Corporation | System and method to correct out of phase errors in DNA sequencing data by use of a recursive algorithm |
US8407554B2 (en) * | 2009-02-03 | 2013-03-26 | Complete Genomics, Inc. | Method and apparatus for quantification of DNA sequencing quality and construction of a characterizable model system using Reed-Solomon codes |
TWI439548B (zh) * | 2009-12-23 | 2014-06-01 | Ind Tech Res Inst | 序列校正方法與序列校正裝置 |
WO2011108540A1 (ja) | 2010-03-03 | 2011-09-09 | 国立大学法人大阪大学 | ヌクレオチドを識別する方法および装置、ならびにポリヌクレオチドのヌクレオチド配列を決定する方法および装置 |
US20120035062A1 (en) | 2010-06-11 | 2012-02-09 | Life Technologies Corporation | Alternative nucleotide flows in sequencing-by-synthesis methods |
US9184099B2 (en) | 2010-10-04 | 2015-11-10 | The Board Of Trustees Of The Leland Stanford Junior University | Biosensor devices, systems and methods therefor |
US9399217B2 (en) | 2010-10-04 | 2016-07-26 | Genapsys, Inc. | Chamber free nanoreactor system |
CN103328981B (zh) | 2010-10-04 | 2017-04-12 | 吉纳普赛斯股份有限公司 | 用于自动化可重复使用的平行生物反应的系统和方法 |
WO2012058459A2 (en) | 2010-10-27 | 2012-05-03 | Life Technologies Corporation | Predictive model for use in sequencing-by-synthesis |
US10273540B2 (en) | 2010-10-27 | 2019-04-30 | Life Technologies Corporation | Methods and apparatuses for estimating parameters in a predictive model for use in sequencing-by-synthesis |
EP2643783A2 (en) * | 2010-11-22 | 2013-10-02 | Life Technologies Corporation | Model-based residual correction of intensities |
US9594870B2 (en) | 2010-12-29 | 2017-03-14 | Life Technologies Corporation | Time-warped background signal for sequencing-by-synthesis operations |
US20130060482A1 (en) | 2010-12-30 | 2013-03-07 | Life Technologies Corporation | Methods, systems, and computer readable media for making base calls in nucleic acid sequencing |
US10241075B2 (en) | 2010-12-30 | 2019-03-26 | Life Technologies Corporation | Methods, systems, and computer readable media for nucleic acid sequencing |
US10146906B2 (en) | 2010-12-30 | 2018-12-04 | Life Technologies Corporation | Models for analyzing data from sequencing-by-synthesis operations |
CN105861645B (zh) | 2011-04-08 | 2020-02-21 | 生命科技股份有限公司 | 用于合成测序中的相保护试剂流排序 |
AU2012262364B2 (en) * | 2011-05-27 | 2016-02-11 | Sequencing Health, Inc. | Systems and methods for genetic and biological analysis |
US9926596B2 (en) | 2011-05-27 | 2018-03-27 | Genapsys, Inc. | Systems and methods for genetic and biological analysis |
US8585973B2 (en) | 2011-05-27 | 2013-11-19 | The Board Of Trustees Of The Leland Stanford Junior University | Nano-sensor array |
US10704164B2 (en) | 2011-08-31 | 2020-07-07 | Life Technologies Corporation | Methods, systems, computer readable media, and kits for sample identification |
WO2013082619A1 (en) | 2011-12-01 | 2013-06-06 | Genapsys, Inc. | Systems and methods for high efficiency electronic sequencing and detection |
US9646132B2 (en) | 2012-05-11 | 2017-05-09 | Life Technologies Corporation | Models for analyzing data from sequencing-by-synthesis operations |
US10192024B2 (en) * | 2012-05-18 | 2019-01-29 | 454 Life Sciences Corporation | System and method for generation and use of optimal nucleotide flow orders |
EP2887058B1 (en) | 2012-08-17 | 2017-11-29 | Quantum Biosystems Inc. | Sample analysis method |
US10329608B2 (en) | 2012-10-10 | 2019-06-25 | Life Technologies Corporation | Methods, systems, and computer readable media for repeat sequencing |
JP6282036B2 (ja) | 2012-12-27 | 2018-02-21 | クオンタムバイオシステムズ株式会社 | 物質の移動速度の制御方法および制御装置 |
US9146248B2 (en) | 2013-03-14 | 2015-09-29 | Intelligent Bio-Systems, Inc. | Apparatus and methods for purging flow cells in nucleic acid sequencing instruments |
US20140296080A1 (en) | 2013-03-14 | 2014-10-02 | Life Technologies Corporation | Methods, Systems, and Computer Readable Media for Evaluating Variant Likelihood |
US9591268B2 (en) | 2013-03-15 | 2017-03-07 | Qiagen Waltham, Inc. | Flow cell alignment methods and systems |
CA2896879C (en) | 2013-03-15 | 2020-09-22 | Genapsys, Inc. | Systems and methods for biological analysis |
US9926597B2 (en) | 2013-07-26 | 2018-03-27 | Life Technologies Corporation | Control nucleic acid sequences for use in sequencing-by-synthesis and methods for designing the same |
EP2840148B1 (en) | 2013-08-23 | 2019-04-03 | F. Hoffmann-La Roche AG | Methods for nucleic acid amplification |
KR20160079780A (ko) | 2013-09-18 | 2016-07-06 | 퀀텀 바이오시스템즈 가부시키가이샤 | 생체분자를 서열화하는 디바이스들, 시스템들 및 방법들 |
WO2015051338A1 (en) * | 2013-10-04 | 2015-04-09 | Life Technologies Corporation | Methods and systems for modeling phasing effects in sequencing using termination chemistry |
JP2015077652A (ja) | 2013-10-16 | 2015-04-23 | クオンタムバイオシステムズ株式会社 | ナノギャップ電極およびその製造方法 |
WO2015062184A1 (en) | 2013-11-01 | 2015-05-07 | Accurascience, Llc | Method and apparatus for calling single-nucleotide variations and other variations |
CN105849284B (zh) * | 2013-11-01 | 2021-08-10 | 奥基诺公司 | 序列数据中分离质量等级和测序较长读段的方法和设备 |
EP3792921A1 (en) | 2013-12-11 | 2021-03-17 | Genapsys, Inc. | Systems and methods for biological analysis and computation |
US10438811B1 (en) | 2014-04-15 | 2019-10-08 | Quantum Biosystems Inc. | Methods for forming nano-gap electrodes for use in nanosensors |
WO2015161054A2 (en) | 2014-04-18 | 2015-10-22 | Genapsys, Inc. | Methods and systems for nucleic acid amplification |
WO2016060974A1 (en) | 2014-10-13 | 2016-04-21 | Life Technologies Corporation | Methods, systems, and computer-readable media for accelerated base calling |
WO2016183478A1 (en) | 2015-05-14 | 2016-11-17 | Life Technologies Corporation | Barcode sequences, and related systems and methods |
CN107958138B (zh) * | 2016-10-14 | 2019-06-18 | 赛纳生物科技(北京)有限公司 | 一种从高通量dna测序的原始信号中读取序列信息的方法 |
CA3005671A1 (en) | 2015-11-19 | 2017-05-26 | Peking University | Methods for obtaining and correcting biological sequence information |
US10619205B2 (en) | 2016-05-06 | 2020-04-14 | Life Technologies Corporation | Combinatorial barcode sequences, and related systems and methods |
WO2018017884A1 (en) | 2016-07-20 | 2018-01-25 | Genapsys, Inc. | Systems and methods for nucleic acid sequencing |
JP2021500858A (ja) | 2017-09-21 | 2021-01-14 | ジナプシス インコーポレイテッド | 核酸シーケンシングのためのシステム及び方法 |
WO2020227143A1 (en) | 2019-05-03 | 2020-11-12 | Ultima Genomics, Inc. | Fast-forward sequencing by synthesis methods |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) * | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9901475D0 (en) * | 1999-01-22 | 1999-03-17 | Pyrosequencing Ab | A method of DNA sequencing |
US7244559B2 (en) * | 1999-09-16 | 2007-07-17 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US7211390B2 (en) * | 1999-09-16 | 2007-05-01 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US6274320B1 (en) * | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
US6783934B1 (en) * | 2000-05-01 | 2004-08-31 | Cepheid, Inc. | Methods for quantitative analysis of nucleic acid amplification reaction |
GB0016472D0 (en) * | 2000-07-05 | 2000-08-23 | Amersham Pharm Biotech Uk Ltd | Sequencing method and apparatus |
JP2004521407A (ja) * | 2000-09-01 | 2004-07-15 | フレッド・ハッチソン・キャンサー・リサーチ・センター | 大きなデータアレイを解析するための統計学的モデリング |
US6952651B2 (en) * | 2002-06-17 | 2005-10-04 | Intel Corporation | Methods and apparatus for nucleic acid sequencing by signal stretching and data integration |
US20040197845A1 (en) * | 2002-08-30 | 2004-10-07 | Arjang Hassibi | Methods and apparatus for pathogen detection, identification and/or quantification |
JP2007525151A (ja) * | 2003-01-29 | 2007-09-06 | 454 コーポレーション | 一本鎖dnaライブラリーの調製方法 |
US7575865B2 (en) * | 2003-01-29 | 2009-08-18 | 454 Life Sciences Corporation | Methods of amplifying and sequencing nucleic acids |
GB0324456D0 (en) | 2003-10-20 | 2003-11-19 | Isis Innovation | Parallel DNA sequencing methods |
US20070281300A1 (en) * | 2004-03-04 | 2007-12-06 | James Russell | Thrombomodulin (Thbd) Haplotypes Predict Outcome |
PT1801209E (pt) * | 2004-08-24 | 2011-05-26 | Toray Industries | Arn gen?mico do v?rus humano modificado da hepatite c com capacidade de replica??o aut?noma |
JP5808515B2 (ja) | 2006-02-16 | 2015-11-10 | 454 ライフ サイエンシーズ コーポレイション | 核酸配列データのプライマー伸長誤差を補正するためのシステムおよび方法 |
-
2007
- 2007-02-15 JP JP2008555390A patent/JP5808515B2/ja not_active Expired - Fee Related
- 2007-02-15 WO PCT/US2007/004187 patent/WO2007098049A2/en active Application Filing
- 2007-02-15 CA CA2637617A patent/CA2637617C/en not_active Expired - Fee Related
- 2007-02-15 CN CN2007800055750A patent/CN101390101B/zh not_active Expired - Fee Related
- 2007-02-15 EP EP12196383.9A patent/EP2578702A1/en not_active Withdrawn
- 2007-02-15 ES ES07750981.8T patent/ES2626620T3/es active Active
- 2007-02-15 EP EP07750981.8A patent/EP2002367B1/en not_active Not-in-force
- 2007-02-15 US US12/224,065 patent/US8301394B2/en active Active
-
2012
- 2012-09-10 US US13/608,841 patent/US9587274B2/en active Active
-
2013
- 2013-05-30 JP JP2013114005A patent/JP5746265B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP5746265B2 (ja) | 2015-07-08 |
CN101390101A (zh) | 2009-03-18 |
US20100192032A1 (en) | 2010-07-29 |
ES2626620T3 (es) | 2017-07-25 |
EP2002367A2 (en) | 2008-12-17 |
US8301394B2 (en) | 2012-10-30 |
WO2007098049A9 (en) | 2007-10-25 |
JP2013211043A (ja) | 2013-10-10 |
US20130054171A1 (en) | 2013-02-28 |
CA2637617C (en) | 2018-09-18 |
EP2002367A4 (en) | 2009-06-03 |
WO2007098049A3 (en) | 2008-08-07 |
CN101390101B (zh) | 2012-05-23 |
US9587274B2 (en) | 2017-03-07 |
CA2637617A1 (en) | 2007-08-30 |
JP2009527817A (ja) | 2009-07-30 |
EP2002367B1 (en) | 2017-03-29 |
EP2578702A1 (en) | 2013-04-10 |
WO2007098049A2 (en) | 2007-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5808515B2 (ja) | 核酸配列データのプライマー伸長誤差を補正するためのシステムおよび方法 | |
JP5465793B2 (ja) | 帰納的アルゴリズムを使用することによる、dna配列決定データにおける位相不一致エラーを補正するためのシステムおよび方法 | |
JP2010528608A5 (ja) | ||
Simon | An evolving view of phylogenetic support | |
JP6373827B2 (ja) | 最適化されたヌクレオチドフロー順序を生成及び使用するためのシステム及び方法 | |
US20230307095A1 (en) | Methods and systems for modeling phasing effects in sequencing using termination chemistry | |
US7840358B2 (en) | Hierarchical statistical framework for separating mixed data | |
Mishra et al. | Strategies and tools for sequencing and assembly of plant genomes | |
JP7272431B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
Lu | Correction of DNA Sequencing Data with Spaced Seeds | |
Zaharia et al. | Heterogeneous Graph Mining for Biological Pattern Discovery in Metabolic Pathways | |
Neumann | Genome Assembly Tutorial | |
McComish | Exploring Biological Sequence Space |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120806 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130530 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130704 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20130906 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131224 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131225 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20131224 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140123 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150609 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150909 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5808515 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |