JP2021501927A - 固有分子識別子のpcr後度数からのpcr前フラグメント数の推定 - Google Patents
固有分子識別子のpcr後度数からのpcr前フラグメント数の推定 Download PDFInfo
- Publication number
- JP2021501927A JP2021501927A JP2020516693A JP2020516693A JP2021501927A JP 2021501927 A JP2021501927 A JP 2021501927A JP 2020516693 A JP2020516693 A JP 2020516693A JP 2020516693 A JP2020516693 A JP 2020516693A JP 2021501927 A JP2021501927 A JP 2021501927A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- copy
- sample
- amplification
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000012634 fragment Substances 0.000 title description 49
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 280
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 278
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 278
- 238000000034 method Methods 0.000 claims abstract description 174
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 107
- 230000003321 amplification Effects 0.000 claims abstract description 101
- 230000010076 replication Effects 0.000 claims abstract description 64
- 238000004590 computer program Methods 0.000 claims abstract description 15
- 238000009826 distribution Methods 0.000 claims description 137
- 238000002372 labelling Methods 0.000 claims description 32
- 239000000203 mixture Substances 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 abstract 1
- 238000003752 polymerase chain reaction Methods 0.000 description 58
- 241000894007 species Species 0.000 description 43
- 239000002773 nucleotide Substances 0.000 description 28
- 125000003729 nucleotide group Chemical group 0.000 description 28
- 230000008569 process Effects 0.000 description 17
- 238000009739 binding Methods 0.000 description 13
- 238000012937 correction Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 238000002156 mixing Methods 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000005315 distribution function Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 238000003559 RNA-seq method Methods 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- YRIZYWQGELRKNT-UHFFFAOYSA-N 1,3,5-trichloro-1,3,5-triazinane-2,4,6-trione Chemical compound ClN1C(=O)N(Cl)C(=O)N(Cl)C1=O YRIZYWQGELRKNT-UHFFFAOYSA-N 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 2
- FSNCEEGOMTYXKY-JTQLQIEISA-N Lycoperodine 1 Natural products N1C2=CC=CC=C2C2=C1CN[C@H](C(=O)O)C2 FSNCEEGOMTYXKY-JTQLQIEISA-N 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000037452 priming Effects 0.000 description 2
- -1 rRNA Proteins 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- IHCCLXNEEPMSIO-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperidin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 IHCCLXNEEPMSIO-UHFFFAOYSA-N 0.000 description 1
- 241000023308 Acca Species 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000007704 wet chemistry method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6851—Quantitative amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/16—Assays for determining copy number or wherein the copy number is of special importance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/165—Mathematical modelling, e.g. logarithm, ratio
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2545/00—Reactions characterised by their quantitative nature
- C12Q2545/10—Reactions characterised by their quantitative nature the purpose being quantitative analysis
- C12Q2545/114—Reactions characterised by their quantitative nature the purpose being quantitative analysis involving a quantitation step
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Theoretical Computer Science (AREA)
- Microbiology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Physiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
a) 決定すべきコピー数の核酸を含むサンプルを提供し;
b) 前記核酸に可変的標識を取り付け;
c) 標識付き前記核酸を、核酸複製手順を用いて増幅させ;
d) 増幅された標識付き核酸コピーの量を決定し、各々の量が異なる標識付き核酸コピーについて決定され;
e) ステップd)の決定量に基づいて、ステップa)のサンプル中の核酸コピー数の推定値を提供し、これは
サンプル中の少なくとも2、好ましくは少なくとも4、少なくとも10以上の異なる核酸種について、前記標識が1つの核酸に結合する確率を概算し;この確率は、増幅後の異なる核酸種について前記標識の量を平均し;そして反復的にまたは段階的に
(A)ステップd)において検出された異なる標識の数および1つの核酸に結合する異なる標識の数の期待値(1つの核酸コピーに結合する標識の確率に従う)およびサンプル中の核酸コピーの期待数または推定増幅効率の事前反復値もしくは既定値に基づいて、サンプル中の推定核酸コピー数を精密化し;
または
(B)(i) ステップd)の決定量、1つの核酸に結合する標識の確率、推定増幅効率、またはサンプル中の核酸コピーの期待数に基づいて、そして前記推定増幅効率に依存した複製サイクルあたりの核酸増幅手順において増幅された標識付き核酸コピーの推定複製率に基づいて、増幅された所定の標識付き核酸コピーの量の確率分布をモデル化し、
(ii) 標識付き核酸コピーの決定量が、前記標識付き核酸コピーのモデル化された確率分布に従って起こる尤度を決定し、
(iii) 推定増幅効率またはサンプル中の核酸コピーの期待数を変化させることにより、ステップ(ii)の尤度を最大化し、
(iv) 前記最大化モデルに従ってまたは前記最大化モデルにおける推定増幅効率に従って、サンプル中の核酸コピー数の推定値を提供する
各ステップを含む方法を提供する。
〔発明の詳細な説明〕
次のステップを含む増幅後の〔核酸コピー数〕(K)を推定する方法であって、
a) 決定すべき〔コピー数〕(K)の核酸を含むサンプルを提供し;
b) 可変的標識を前記核酸に付着させ;
c) 前記標識付き核酸を核酸複製手順を用いて増幅させ;
d) 〔増幅された標識付き核酸コピーの量〕(nb)を決定し、その各々の量が、〔異なる〔標識〕(b)を有する核酸コピー〕について決定され(異なるbについてのnb);
e) 以下により決定された〔ステップd)の量〕(nb)に基づいてステップa)の〔サンプル中の核酸コピー数の推定値〕(Kest)を提供し、ここでKestは
サンプル中の少なくとも2、好ましくは少なくとも4、少なくとも10以上の異なる核酸種について、〔1つの核酸に結合する標識の確率〕(pb)を概算することにより決定され;前記pbは増幅後の異なる核酸種について〔前記標識の量〕(nb)を平均化し;そして反復的または段階的に
(A)
〔ステップd)において検出された異なる標識の数〕(DU)、〔核酸コピーに結合する標識の確率〕(pb)に従った核酸に結合する異なる標識の数の期待値および〔サンプル中の核酸コピーの期待数〕(Kest)または〔推定増幅効率〕(pd)の事前反復もしくは既定値に基づいて、〔サンプル中の核酸コピー数の推定または期待数〕(Kest)を精密化(改善)し;または
(B)
(i) 決定された〔ステップd)の量〕(nb)、〔1つの核酸に結合する標識の確率〕(pb)、〔推定増幅効率〕(pd)または〔サンプル中の核酸コピーの期待数〕(Kest)に基づいて、そして前記〔推定増幅効率〕(pd)に依存する複製サイクルあたりの核酸複製手順における増幅された〔標識付き核酸コピー〕(「プール」)の推定複製率に基づいて、〔所定の標識を有する増幅された核酸コピーの量の確率分布〕(p(nb))をモデル化することにより概算し、
(ii) 〔標識付き核酸コピーの決定量〕(nb)が前記〔標識付き核酸コピーのモデル化確率分布〕(p(nb))に従って生じる尤度を決定し、
(iii) 〔推定増幅効率〕(pd)または〔サンプル中の核酸コピーの期待数〕(Kest)を変化させることにより、ステップ(ii)の尤度を最大化し、
(iv) 前記最大化モデルに従ってまたは前記最大化モデルにおける〔推定増幅効率〕(pd)に従って、〔サンプル中の核酸コピー数の推定値〕(Kest)を提供する
ことにより、決定される
ステップを含む方法。
PCR前フラグメントコピー数を推定するための本項目のメソッドは、2つのカテゴリーに入る。項目2.1における第一カテゴリーは、個別観測されたUMIの数をベースにする。これはPCR前後で同じであるため、これらのメソッドはPCRプロセスに依存しない。項目2.2における第二カテゴリーのメソッドは、PCR後のUMIカウント数をベースにする。後者はPCRにより影響を受けるため、これらのメソッドはPCRプロセスについての統計モデルに依存する。項目2.1と2.2のメソッドは、PCR前のUMI分布の情報を必要とする。これは、ヌクレオチドがUMIの各位置に挿入されたことによる仕様からまたはPCR後に入手可能なデータから導き出せる。PCR前のUMI分布はヌクレオチド挿入の頻度により影響を受けるだけでなく、ライゲーションバイアスにも影響されるため、第二のアプローチが好ましいと思われる。該当するメソッドは項目2.3に説明される。
1.準備
2.1.1 観測される個別のUMIのカウント(計数)
UMIカウント数
2.1.2 観測される個別のUMIの度数補正カウント
前の項目と比較して、次のメソッドはPCR後のUMIカウント数の完全ベクトル
ポアソンモデルでは、k個のフラグメントから複製効率λでn個のフラグメントを生成する確率は、次のポアソン確率関数により与えられる:
2.2.2 二項分布複製
PCRの反復性質は、ポアソンまたは二項分布複製モデルよりもむしろ分岐プロセスによってより適切にモデル化される。よって、本発明者らはガルトン・ワトソンプロセスを選択した。本項目で展開するメソッドには、従って、ガルトン・ワトソンまたはGWの接頭辞が付けられる。子孫分布は
(25)と(24)におけるガルトン・ワトソン複製モデルの平均と分散は、それぞれ
最後の項目のモデルを使用した実験において、ガルトン・ワトソン複製モデルの分布が単一モードでは適切に記述されないことが判明した。従って、本項目では、(25)の混合形態の各成分を別々にモデル化する。PCRをn回実施後にbが検出される確率は、それがk回前に観測されると仮定すると、次の平均と分散を有するという事実を利用する。
式(33)および(34)は、k=0の場合、分布p(n|k,pd,c)はクロネッカーのδ0に等しいことを示す。よって、p(n|K,pd,c)は、小さなKの場合n=0に顕著なピークを有する。p(n|K,pd,c)を一様分布でモデル化するのではなく、2つの事例n=0およびn>0を別々にモデル化するのが妥当である。これはp(n|K,pb,pd,c)を混合形態
例えデルタ分布と単峰型分布の混合形態が小さいKと大きなKの状況を正しく記述しているとしても、本発明者らの実験において中間域Kについて系統的バイアスを発見した。これは、この領域では総和(25)が小さいk項に支配され、そのため負の二項分布またはガンマ分布によるp(n|k,pd,c)の近似値が不正確であるという事実によるものである。これは図6に見ることができ、効率pdの増加とともに近似の不正確さが増加することも示している。事実、1に近いpdについては、これらの図は、全体の形状がより小さいスケールで繰り返される、フラクタル様構造を示す。(25)の混合成分の複雑構造に適応させるために、p(n|K,pb,pd,c)が(33)と(34)によってその平均と分散が示される3つ以上の分布の混合物である、代替モデルを研究した。k=0の場合には、再びクロネッカーのδ0を利用する。k>0の場合、最初に負の二項分布を適合させた。しかしながら、これは小さなkにはうまく適合しないことが判明した。従って、kを小さい値、中程度の値、大きい値の各範囲に分割することに頼った。小さい値の場合には、p(n|k,pd,c)は(24)の助けを借りて各kについて正確に算出し、中間の値の場合には、各kについて(33)と(34)により与えられる平均と分散を有する正規分布を利用し、そして大きいkの部分和には単一の負の二項分布を利用する。kの範囲の区切りには固定境界を選択する。しかしながら、原則的には、それらの境界はモデル分布と真の分布の間の誤差を最小化するように適宜選択することができる。本発明の実験では、小さいkはk=0からk=15までに及び、中間のkはk=16からk=49までに及び、そして大きいkはk=50から始まる範囲内であった。
p(n|k,pd,c)が、n<kのときf(n)>0を有する分布f(n)によりモデル化されるならば、f(n)は範囲n≧kに制限されなければならないことに留意すべきである。これは、
(12)はポアソン、二項分布およびガルトン・ワトソン複製モデルに当てはまるので、これはそれらのモデルから作成されたデータに関して、pbはnbの分布から推定できることを示す。次のように(12)を書き直したものは
3.1 合成データの作成
当該実験では、均等および不均等分散しているB=64およびB=256 UMIを使用した。不均等データについては、UMIの各位置でのヌクレオチド分布は、ディリクレ分布から、すなわち
により、pd_GWから導出される。以下では、λとpd_Binよりもpd_GWを参照し、pd_GWを単純にpdと記すことにする。
B=64とB=256 UMIについてのUMIカウントの結果は図8に見ることができるが、それらの頻度補正したUMIカウントは図9に与えられる。別のメソッドに比較して、UMIカウントの両バージョンは、複製モデルに依存せず(独立であり)、従って複製効率に影響されない。この理由により、効率0.5を有する二項分布モデルの結果のみを含めた。他の複製モデルと効率の結果は同等である。図8は、UMIカウントが、UMIの数BがKよりも相当大きい場合にのみ、良好なKの推定値を生じることを示す。B=64に関しては、推定値がK=10についてのみ妥当な正確さを有する。B=256に関しては、K=100の推定も妥当である。しかしながら、より大きいKの値には、UMIカウントはKを少なくとも50%過小評価する。図8は更に、UMIカウントが不均等データに関してわずかに低い精度を生じる。その一方、図9に記載の頻度補正したカウントは、より広範な領域のKについて偏りのない(バイアスフリーの)より正確な結果をもたらす。しかしながら、大きなKの場合には、観測される個別のUMIの数
Claims (15)
- サンプル中の核酸コピー数を推定する方法であって、
a) 決定すべきコピー数の核酸を含むサンプルを提供し;
b) 前記核酸に可変的標識を取り付け;
c) 標識付き前記核酸を、核酸複製手順を用いて増幅させ;
d) 増幅された標識付き核酸コピーの量を決定し、各々の量が異なる標識付き核酸コピーについて決定され;
e) ステップd)の決定量に基づいて、ステップa)のサンプル中の核酸コピー数の推定値を提供し、これは
サンプル中の少なくとも2、好ましくは少なくとも4、少なくとも10以上の異なる核酸種について、前記標識が1つの核酸に結合する確率を概算し;この確率は、増幅後の異なる核酸種について前記標識の量を平均し;そして反復的にまたは段階的に
(A)ステップd)において検出された異なる標識の数および1つの核酸に結合する異なる標識の数の期待値(1つの核酸コピーに結合する標識の確率に従う)およびサンプル中の核酸コピーの期待数または推定増幅効率の事前反復値もしくは既定値に基づいて、サンプル中の推定核酸コピー数を精密化し;
または
(B)(i) ステップd)の決定量、1つの核酸に結合する標識の確率、推定増幅効率、またはサンプル中の核酸コピーの期待数に基づいて、そして前記推定増幅効率に依存した複製サイクルあたりの核酸増幅手順において増幅された標識付き核酸コピーの推定複製率に基づいて、増幅された所定の標識付き核酸コピーの量の確率分布をモデル化し、
(ii) 標識付き核酸コピーの決定量が前記標識付き核酸コピーのモデル化された確率分布に従って起こる尤度を決定し、
(iii) 推定増幅効率またはサンプル中の核酸コピーの期待数を変化させることにより、ステップ(ii)の尤度を最大化し、
(iv) 前記最大化モデルに従ってまたは前記最大化モデルにおける推定増幅効率に従って、サンプル中の核酸コピー数の推定値を提供する
ステップを含む方法。 - ステップA)において、サンプル中の核酸コピーの期待数の初回反復の既定値に基づいて、推定増幅効率がステップd)の異なる検出標識の数の数値から選択されるかまたは1から増幅核酸コピーの決定量までの範囲の整数より選択される、請求項1に記載の方法。
- ステップB)において、標識付きの増幅核酸コピーの推定複製率が、ガウス分布、負の二項分布、ガンマ分布、ディラックのデルタ分布もしくはガルトン・ワトソン分布の複製確率関数またはその混合形態でモデル化される、請求項1に記載の方法。
- 1つの核酸に結合する標識の確率が式(12)、式(45)または式(46)に従って決定され;そして/または
推定増幅効率またはサンプル中の核酸コピーの期待数が式(27)に従った変換により互換的に用いられ;そして/または
ステップA)において、増幅された所定の標識付き核酸コピーの量の確率分布が、式(5)、好ましくは式(4)と(5)に従って決定され;または
ステップB)において、増幅された所定の標識付き核酸コピーの量の確率分布が、式(25)に従って決定される、請求項1〜3のいずれか一項に記載の方法。 - 前記核酸増幅手順において前記標識付き核酸を増幅させる効率が、100%ではなく、好ましくは核酸コピーの異なる種ごとに異なる、請求項1〜4のいずれか一項に記載の方法。
- 少なくとも20、好ましくは少なくとも30、より好ましくは少なくとも40の、異なる標識が前記核酸に結合される、請求項1〜5のいずれか一項に記載の方法。
- 前記核酸がDNAまたはRNAである、請求項1〜6のいずれか一項に記載の方法。
- 前記増幅方法がPCRである、請求項1〜7のいずれか一項に記載の方法。
- 前記増幅が少なくとも1、好ましくは2,3,4,5,6,7,8またはそれ以上の複製サイクルの間行われる、請求項1〜8のいずれか一項に記載の方法。
- 前記モデル化が確率分岐モデルを使用することを含む、請求項1〜9のいずれか一項に記載の方法。
- 更なる反復が少なくとも2回前の反復に基づき、そしてその更なる反復のサンプル中の核酸コピーの期待数または推定増幅効率が区間によって選択され、前記区間は、前記標識付き核酸コピーの決定量が前記区間内の標識付き核酸コピーのモデル化確率分布に従って出現する尤度を含み、そして前記標識付き核酸コピーのモデル化確率分布に従って出現する最大尤度が、前記区間の境界線である、請求項1〜10のいずれか一項に記載の方法。
- コンピュータプログラム製品であって、請求項1のステップe)に従って標識付きの核酸の増幅後の決定量に基づいてサンプル中の核酸コピーの量の推定値を計算するためのコンピュータ可読装置を含むコンピュータプログラム製品。
- ステップe)の結果を可読媒体上に提示または表示させるのに適合した、請求項12に記載のコンピュータプログラム製品。
- 請求項1に定義されるようなステップe)をコンピュータ上で実行する方法。
- ステップe)の結果を可読媒体上に提示または表示させることを含む、請求項1〜11および14のいずれか一項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17192640.5 | 2017-09-22 | ||
EP17192640.5A EP3460071A1 (en) | 2017-09-22 | 2017-09-22 | Estimating pre-pcr fragment numbers from post-pcr frequencies of unique molecular identifiers |
PCT/EP2018/075606 WO2019057895A1 (en) | 2017-09-22 | 2018-09-21 | ESTIMATION OF NUMBER OF FRAGMENTS PRE-PCR FROM POST-PCR FREQUENCIES OF UNIQUE MOLECULAR IDENTIFIERS |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021501927A true JP2021501927A (ja) | 2021-01-21 |
JP7427583B2 JP7427583B2 (ja) | 2024-02-05 |
Family
ID=59955444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020516693A Active JP7427583B2 (ja) | 2017-09-22 | 2018-09-21 | 固有分子識別子のpcr後度数からのpcr前フラグメント数の推定 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11410747B2 (ja) |
EP (2) | EP3460071A1 (ja) |
JP (1) | JP7427583B2 (ja) |
KR (1) | KR20200055090A (ja) |
CN (1) | CN111108566B (ja) |
AU (1) | AU2018335362A1 (ja) |
CA (1) | CA3075914A1 (ja) |
WO (1) | WO2019057895A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3460071A1 (en) | 2017-09-22 | 2019-03-27 | Lexogen GmbH | Estimating pre-pcr fragment numbers from post-pcr frequencies of unique molecular identifiers |
CA3153350A1 (en) * | 2019-10-16 | 2021-04-22 | Barbara ANDRE | Determination of nucleic acid sequence concentrations |
EP4212653A1 (en) * | 2022-01-18 | 2023-07-19 | Universität Potsdam | Molecular tagging using position-oriented nucleic acid encryption |
US20230323440A1 (en) * | 2022-03-24 | 2023-10-12 | Bio-Rad Laboratories, Inc. | Method and system for sizing a population of nucleic acid fragments using a digital assay |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006505832A (ja) * | 2002-02-26 | 2006-02-16 | フアルマシア・コーポレーシヨン | 配列決定システム計算機 |
WO2017051387A1 (en) * | 2015-09-25 | 2017-03-30 | Contextual Genomics Inc. | Molecular quality assurance methods for use in sequencing |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040161741A1 (en) * | 2001-06-30 | 2004-08-19 | Elazar Rabani | Novel compositions and processes for analyte detection, quantification and amplification |
US8182994B2 (en) * | 2009-09-15 | 2012-05-22 | Illumina Cambridge Limited | Centroid markers for image analysis of high denisty clusters in complex polynucleotide sequencing |
US8835358B2 (en) * | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
US8725422B2 (en) * | 2010-10-13 | 2014-05-13 | Complete Genomics, Inc. | Methods for estimating genome-wide copy number variations |
ES2776673T3 (es) * | 2012-02-27 | 2020-07-31 | Univ North Carolina Chapel Hill | Métodos y usos para etiquetas moleculares |
US9399766B2 (en) * | 2012-10-01 | 2016-07-26 | Pacific Biosciences Of California, Inc. | Recombinant polymerases for incorporation of protein shield nucleotide analogs |
GB2528205B (en) * | 2013-03-15 | 2020-06-03 | Guardant Health Inc | Systems and methods to detect rare mutations and copy number variation |
EP2868752A1 (en) * | 2013-10-31 | 2015-05-06 | Lexogen GmbH | Nucleic acid copy number determination based on fragment estimates |
EP3957749A1 (en) * | 2014-04-21 | 2022-02-23 | Natera, Inc. | Detecting tumour specific mutations in biopsies with whole exome sequencing and in cell-free samples |
JP7046007B2 (ja) * | 2016-05-26 | 2022-04-01 | ベクトン・ディキンソン・アンド・カンパニー | 分子標識カウントの調節方法 |
US11193164B2 (en) * | 2017-05-24 | 2021-12-07 | The Regents Of The University Of California | Methods of diagnosing and treating cancer targeting extrachromosomal DNA |
EP3460071A1 (en) | 2017-09-22 | 2019-03-27 | Lexogen GmbH | Estimating pre-pcr fragment numbers from post-pcr frequencies of unique molecular identifiers |
-
2017
- 2017-09-22 EP EP17192640.5A patent/EP3460071A1/en not_active Withdrawn
-
2018
- 2018-09-21 EP EP18773445.4A patent/EP3684952B1/en active Active
- 2018-09-21 AU AU2018335362A patent/AU2018335362A1/en active Pending
- 2018-09-21 US US16/649,591 patent/US11410747B2/en active Active
- 2018-09-21 CN CN201880061221.6A patent/CN111108566B/zh active Active
- 2018-09-21 WO PCT/EP2018/075606 patent/WO2019057895A1/en active Search and Examination
- 2018-09-21 JP JP2020516693A patent/JP7427583B2/ja active Active
- 2018-09-21 KR KR1020207011713A patent/KR20200055090A/ko not_active Application Discontinuation
- 2018-09-21 CA CA3075914A patent/CA3075914A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006505832A (ja) * | 2002-02-26 | 2006-02-16 | フアルマシア・コーポレーシヨン | 配列決定システム計算機 |
WO2017051387A1 (en) * | 2015-09-25 | 2017-03-30 | Contextual Genomics Inc. | Molecular quality assurance methods for use in sequencing |
Also Published As
Publication number | Publication date |
---|---|
KR20200055090A (ko) | 2020-05-20 |
CN111108566A (zh) | 2020-05-05 |
EP3684952B1 (en) | 2024-05-01 |
CN111108566B (zh) | 2023-11-28 |
CA3075914A1 (en) | 2019-03-28 |
EP3460071A1 (en) | 2019-03-27 |
EP3684952A1 (en) | 2020-07-29 |
WO2019057895A1 (en) | 2019-03-28 |
US20200279613A1 (en) | 2020-09-03 |
US11410747B2 (en) | 2022-08-09 |
JP7427583B2 (ja) | 2024-02-05 |
AU2018335362A1 (en) | 2020-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7427583B2 (ja) | 固有分子識別子のpcr後度数からのpcr前フラグメント数の推定 | |
Trapnell et al. | Transcript assembly and abundance estimation from RNA-Seq reveals thousands of new transcripts and switching among isoforms | |
EP2459753B1 (en) | Sequence calibration method and sequence calibration device | |
CN107614697A (zh) | 用于提高突变评估准确性的方法和装置 | |
Kumar et al. | Long-read amplicon denoising | |
US20170233727A1 (en) | Methods for generating and decoding barcodes | |
DK3063293T3 (en) | Determination of the number of nucleic acid copies based on fragment estimates | |
CN110219054B (zh) | 一种核酸测序文库及其构建方法 | |
CN108136389A (zh) | 样品到ngs文库的自动制备 | |
US20180039728A1 (en) | Operating method of apparatus for analyzing genome sequences using distributed processing | |
WO2019204702A1 (en) | Error-correcting dna barcodes | |
Amman et al. | The trouble with long-range base pairs in RNA folding | |
JP6423426B2 (ja) | 転写産物判定方法 | |
WO2017009718A1 (en) | Automatic processing selection based on tagged genomic sequences | |
Wyman | Full characterization of transcriptomes using long read sequencing | |
Sun et al. | Anchor-Enhanced Bead Design for Reduced Oligonucleotide Synthesis Errors in Single-cell sequencing | |
US20230093253A1 (en) | Automatically identifying failure sources in nucleotide sequencing from base-call-error patterns | |
Olson et al. | ULTRA-Effective Labeling of Repetitive Genomic Sequence | |
Soukupová | Analýza nástrojů a pipeline pro zpracování long-read sequencing dat | |
JP2020195376A (ja) | 核酸配列の解析方法、核酸配列の解析装置、及び核酸配列の解析プログラム | |
KR20230154658A (ko) | Ngs 분석에서의 itd 분석을 위한 씨드 서열의 생성 방법 및 장치 | |
JP2020195377A (ja) | 核酸配列の解析方法、核酸配列の解析装置、及び核酸配列の解析プログラム | |
Feng et al. | ResSeq: enhancing short-read sequencing alignment by rescuing error-containing reads | |
WUCHER et al. | FEELnc: an alignment-free tool for long non-coding RNAs annotation | |
Johnson | Improved sequence-read simulation for (meta) genomics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200525 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230509 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240116 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240124 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7427583 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |