JP6664575B2 - 核酸分子数計測法 - Google Patents
核酸分子数計測法 Download PDFInfo
- Publication number
- JP6664575B2 JP6664575B2 JP2017019549A JP2017019549A JP6664575B2 JP 6664575 B2 JP6664575 B2 JP 6664575B2 JP 2017019549 A JP2017019549 A JP 2017019549A JP 2017019549 A JP2017019549 A JP 2017019549A JP 6664575 B2 JP6664575 B2 JP 6664575B2
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- barcode
- nucleic acid
- base
- reads
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108020004707 nucleic acids Proteins 0.000 title claims description 61
- 102000039446 nucleic acids Human genes 0.000 title claims description 61
- 150000007523 nucleic acids Chemical class 0.000 title claims description 61
- 238000000034 method Methods 0.000 title claims description 48
- 108091034117 Oligonucleotide Proteins 0.000 claims description 34
- 239000000203 mixture Substances 0.000 claims description 16
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 2
- 108020004414 DNA Proteins 0.000 description 34
- 238000012163 sequencing technique Methods 0.000 description 20
- 108091035707 Consensus sequence Proteins 0.000 description 10
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Substances [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 10
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 230000003321 amplification Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 7
- 230000037429 base substitution Effects 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 239000008186 active pharmaceutical agent Substances 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 230000004568 DNA-binding Effects 0.000 description 3
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 3
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 229910052697 platinum Inorganic materials 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 229930002839 ionone Natural products 0.000 description 2
- 150000002499 ionone derivatives Chemical class 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102100029768 Histone-lysine N-methyltransferase SETD1A Human genes 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 1
- 101000865038 Homo sapiens Histone-lysine N-methyltransferase SETD1A Proteins 0.000 description 1
- 101100462513 Homo sapiens TP53 gene Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 101150117538 Set2 gene Proteins 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 101150080074 TP53 gene Proteins 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 102000048958 human TP53 Human genes 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 108700025694 p53 Genes Proteins 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Plant Pathology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
図3Bは累積リード数を示すグラフである。矢印はエラーのあるタグを持つリードを除去する際の閾値を示す。解析した領域はTK102Uであり、結果は40ngのゲノムDNAを使用して得た(全リード数:2,395,763リード)。
図4Bは累積リード数を示すグラフである。矢印はエラーのあるタグを持つリードを除去する際の閾値を示す。
図4Cは、エラーを持つバーコードタグおよびエラーを持たないバーコードタグの推計割合を示すグラフである。解析した領域はTK102Uであり、結果は40ngのゲノムDNAを使用して得た(全リード数:594,719リード)。
図4D及び図4Eは、エラーをもつバーコードタグを除去した後の標的分子数の推計値である。図4Dが本願発明の一実施形態に係る方法を用いた場合の結果であり、図4Eが1リードおよび2リードのタグを除去した場合の結果である。解析は全リードからランダムに選択したリードを用いて行った(全リード数 5ng:343,932リード、10ng:404,900リード、20ng:548,809リード、40ng:594,719リード)。
本実施形態に係る核酸塩基配列を決定する際に生じるリードエラーを検出することによって高精度に核酸分子数を計測する方法は、上述したように、複数の核酸分子の混合物にバーコード配列生成オリゴヌクレオチドを加えることにより、各核酸分子を構成する塩基配列に、当該核酸分子に固有のバーコード配列を連結する工程と、前記バーコード配列を連結した核酸分子の塩基配列を決定する工程と、塩基配列を決定したバーコード配列のリードエラーを検出する工程と、前記塩基配列を決定したバーコード配列のリード数に基いて、塩基配列を決定した全バーコード配列のうち、当該バーコード配列にリードエラーが存在しないものの割合を算出する工程と、前記塩基配列を決定したバーコード配列のリード数毎に前記算出した割合をプロットする工程と、を有し、前記バーコード配列生成オリゴヌクレオチドは最多で5種類の塩基からなり、リードエラーが存在しないバーコード配列の数が前記混合物における核酸分子数を示すことを特徴とするものである。
DNAサンプルとして100人の健常白色人種の男性由来のDNAプールであるMegapool Reference male DNA(Kreatech Biotechnology社、アムステルダム、オランダ)を使用した。健常者由来およびTP53遺伝子中にR280Wの突然変異を持つMIA PaCa−2膵癌細胞株由来の白血球のゲノムDNAを標準的なフェノール/クロロホルムプロトコルを用いて抽出した。肺癌組織中に活性EGFR突然変異を有する患者については大阪府立成人病センターから、胃癌患者については大阪大学病院から集め、書面でのインフォームドコンセントを本実験に参加するすべての患者から得た。また本実験は、大阪府立成人病センターおよび大阪大学病院の倫理委員会の承認を得た。
ゲノム領域を分析するため、TP53のDNA結合ドメイン、並びにKRASおよびCTNNB1の突然変異ホットスポットをコードするアダプターおよびプライマーを設計した。
ゲノムDNA(5〜40ng)またはセルフリーDNA(全血の〜1ml)をマルチプル制限酵素(Set1:AlwNIおよびAlw26I;Set2:EarIおよびNcoI;SetKC:EarIおよびNmuCI(FastDigest enzymes、Thermo Scientific社、米国マサチューセッツ州))で処理した。大腸菌DNAリガーゼ(タカラバイオ、滋賀、日本)を用いてN12バーコード配列タグを有するアダプターのライゲーションを行った。1.2×量のAMPureXP beads(Beckman Coulter社、米国カルフォルニア州)により、ライゲーション産物を2回精製した。領域特異的プライマーミクスチャーおよびQ5 Hot Start High−Fidelity DNAポリメラーゼ(NEB)を用いて10サーマルサイクルで精製産物の線形増幅を行った。精製した線形増幅産物をPGM/ProtonプライマーおよびPlatinum Taq High Fidelity(Life Technologies社)によって増幅した。この増幅産物をAMPureXP beadsによって、またはMinElute Gel Extraction Kit(Qiagen)でアガロースゲル電気泳動することによって精製した。
Ion Torrentシーケンシングシステム用に、Ion PI Template OT2 200 Kit v2またはv3(Life Technologies社)およびIon OneTouch system(Ion OneTouch InstrumentおよびIon OneTouch ES、Life Technologies社)を用いて、説明書に従ってシーケンシングライブラリからシーケンシングテンプレート(エマルジョンPCRおよびビーズ濃縮)を用意した。この用意したテンプレートをIon PI Sequencing 200 Kit v2またはv3およびProton sequencer(Life Technologies社)を用いてシーケンスした。Torrent Suite 4.0または4.2(Life Technologies社)を使用して、生シグナルを塩基コールに変換し、FASTQファイルのシーケンシングリードを抽出した。またMiSeqシステム(Illumina社、米国カルフォルニア州)を用いて、説明書に従ってIlluminaシステムのシーケンシングデータを生成し、FASTQファイルのシングルエンドリードを抽出した。
FASTQフォーマットのリードを個々の割り当てのために5bpインデックスを用いて分類した。5bpインデックスおよびスペーサー配列間の配列をバーコードタグとした。スペーサーおよびその後に続く配列の全長が70塩基より大きい場合、整列長の長いリード用のbwaswモードと「−b5−q2−r1−z10」のパラメータを用いて、bwa(バージョン0.6.2)で標的配列(スペーサ+標的領域)にリードを整列させた。
長い未測定末端(全リード長の10%以上)をもつリードは破棄した。
(アダプターライゲーションによるバーコード配列を結合する標的配列法)
アダプターライゲーションによってバーコード配列をゲノムDNAおよびトランスクリプトームに取り付けることが可能である。標的配列決定のため、またはアンプリコン配列決定のため、バーコード配列をPCRプライマーに埋め込む方法もある。
5〜40ngのゲノムDNAを使用して、TP53の7領域のうちの4つをシーケンスした。バーコード配列タグの数と、同じバーコード配列タグによってグループ化したリード数(タグあたりのリード)との関係の例を図2Aに示した。この実験では、インプットDNAはゲノムの約10,000コピーに相当するが、タグの総数は400,000を超えた。これらのタグの大部分は単一のリードを含むリード数の小さいものであった。しかし、この対応するリード数は、得られたリード全体のごくわずかな量でしかない(図2B)。このような現象は以前の研究でも観察されている。
IlluminaシーケンサーのリードエラーはIon Torrent PGM/Protonシーケンサーのものとは異なり、Illuminaの場合には塩基置換がその主なエラーとなっている。しかし、バーコードタグの分布パターンはいずれのシーケンシングシステムを用いた場合であっても同様のものとなった(図4A)。そこでIlluminaシーケンサーに対応するため、本発明者らは、エラー検出用バーコードとして配列「BDHVBDHVBDHVBDH」を用いた。つまり、各塩基部位は4種類の塩基のうちの1つを欠いており、その存在しないはずの塩基が出現する場合にはそれはリードエラーを示すこととなる。エラーのあるタグの総数は、存在しないはずの塩基を有するタグの数を3倍することによって得られる(図5A、図4C)。そして、上述したようにエラーのないタグの分布から、エラーのあるタグを除去するための閾値を決定した。Illuminaシーケンサーで得られた結果は、Ion Protonシーケンサーを使用して得られた結果と同様のものとなった。つまり、10%のリードが除去され(図4B)、閾値は15〜65の間で変化した(図5Bのデータポイントについて)。この場合タグの数は網羅的なシーケンシングにより飽和したが(図4D)、1または2リードタグを除去する従来の基準では連続的に増加した(図4E)。標的分子数の推定値とインプットDNAの量との間に相関関係が観察された(図5B)。
バーコードタグを使用して、単一分子から生成した複数の配列のコンセンサスをグループ化および構築することにより、高精度のシーケンシングが可能となる。この方法の精度を図6に示した。2つのDNAポリメラーゼ(NEBのQ5 DNAポリメラーゼおよびLife TechnologiesのPlatinum Taq DNAポリメラーゼHigh Fidelity)を比較したが、バーコードタグを用いた場合には顕著な差異は確認できなかった(図6)。両方の鎖を同じバーコード配列でラベルする2つ目の方法では、1つの鎖をラベルする方法と比べて精度が改善することはなかった(図6)。1つ目の方法はPCRの前に線形増幅サイクルを施しており、これによりPCRサイクルの初期におけるエラーを最小化させている。1つ目の方法のほうが実験操作が単純であることから、2つ目のバーコード連結方法よりも1つ目のバーコード連結方法のほうが有用なものとなっていると考えられる。
Claims (2)
- 核酸分子数を高精度に計測するために使用するバーコード配列を生成する方法であって、
複数の核酸分子の混合物にバーコード配列生成オリゴヌクレオチドを添加する工程であって、これにより当該核酸分子に固有のバーコード配列が、各核酸分子を構成する塩基配列に連結される、前記添加する工程と、
前記バーコード配列を連結した核酸分子の塩基配列を決定する工程と、
塩基配列を決定したバーコード配列のリードエラーを検出する工程と、
リードエラーが存在するバーコード配列を除去する工程と、
を有し、前記バーコード配列生成オリゴヌクレオチドは最多で5種類の塩基からなり、前記バーコード配列生成オリゴヌクレオチド中の塩基は、塩基部位毎に独立して2つまたは3つの種類の塩基から選択される、方法。 - 前記バーコード配列生成オリゴヌクレオチドは、その配列中に1またはそれ以上の他の塩基配列を有する、請求項1記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462020210P | 2014-07-02 | 2014-07-02 | |
US62/020,210 | 2014-07-02 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016531441A Division JP6125731B2 (ja) | 2014-07-02 | 2015-07-02 | 核酸分子数計測法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017099400A JP2017099400A (ja) | 2017-06-08 |
JP6664575B2 true JP6664575B2 (ja) | 2020-03-13 |
Family
ID=55019402
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016531441A Active JP6125731B2 (ja) | 2014-07-02 | 2015-07-02 | 核酸分子数計測法 |
JP2017019549A Active JP6664575B2 (ja) | 2014-07-02 | 2017-02-06 | 核酸分子数計測法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016531441A Active JP6125731B2 (ja) | 2014-07-02 | 2015-07-02 | 核酸分子数計測法 |
Country Status (4)
Country | Link |
---|---|
US (2) | US10584331B2 (ja) |
EP (1) | EP3165612B1 (ja) |
JP (2) | JP6125731B2 (ja) |
WO (1) | WO2016002875A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10584331B2 (en) * | 2014-07-02 | 2020-03-10 | Dna Chip Research Inc. | Method for counting number of nucleic acid molecules |
WO2017205691A1 (en) | 2016-05-26 | 2017-11-30 | Cellular Research, Inc. | Molecular label counting adjustment methods |
WO2018089377A1 (en) | 2016-11-08 | 2018-05-17 | Cellular Research, Inc. | Methods for cell label classification |
EP3539035B1 (en) | 2016-11-08 | 2024-04-17 | Becton, Dickinson and Company | Methods for expression profile classification |
JP7160349B2 (ja) * | 2017-06-23 | 2022-10-25 | 国立研究開発法人理化学研究所 | 核酸をシークエンシングする方法および解析する方法 |
WO2019060804A1 (en) * | 2017-09-25 | 2019-03-28 | Cellular Research, Inc. | IMMUNE BAR CODE RECEIVER ERROR CORRECTION |
JPWO2019132010A1 (ja) * | 2017-12-28 | 2021-01-21 | タカラバイオ株式会社 | 塩基配列における塩基種を推定する方法、装置及びプログラム |
EP3670670A1 (en) | 2018-12-18 | 2020-06-24 | Ricoh Company, Ltd. | Nucleic acid analysis method, nucleic acid analysis program, and device for library preparation |
CA3104153A1 (en) * | 2019-01-24 | 2020-07-30 | Illumina, Inc. | Methods and systems for monitoring organ health and disease |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9315857B2 (en) * | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
EP3115468B1 (en) * | 2010-09-21 | 2018-07-25 | Agilent Technologies, Inc. | Increasing confidence of allele calls with molecular counting |
WO2012129363A2 (en) * | 2011-03-24 | 2012-09-27 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
US10704164B2 (en) * | 2011-08-31 | 2020-07-07 | Life Technologies Corporation | Methods, systems, computer readable media, and kits for sample identification |
WO2013033721A1 (en) * | 2011-09-02 | 2013-03-07 | Atreca, Inc. | Dna barcodes for multiplexed sequencing |
US10584331B2 (en) * | 2014-07-02 | 2020-03-10 | Dna Chip Research Inc. | Method for counting number of nucleic acid molecules |
-
2015
- 2015-07-02 US US15/322,883 patent/US10584331B2/en active Active
- 2015-07-02 WO PCT/JP2015/069114 patent/WO2016002875A1/ja active Application Filing
- 2015-07-02 JP JP2016531441A patent/JP6125731B2/ja active Active
- 2015-07-02 EP EP15815855.0A patent/EP3165612B1/en active Active
-
2017
- 2017-02-06 JP JP2017019549A patent/JP6664575B2/ja active Active
-
2020
- 2020-01-27 US US16/773,570 patent/US11332737B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2016002875A1 (ja) | 2017-05-25 |
JP6125731B2 (ja) | 2017-05-10 |
EP3165612A1 (en) | 2017-05-10 |
JP2017099400A (ja) | 2017-06-08 |
US20170204406A1 (en) | 2017-07-20 |
US11332737B2 (en) | 2022-05-17 |
EP3165612B1 (en) | 2021-08-18 |
US20200385708A1 (en) | 2020-12-10 |
EP3165612A4 (en) | 2018-01-03 |
WO2016002875A1 (ja) | 2016-01-07 |
US10584331B2 (en) | 2020-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6664575B2 (ja) | 核酸分子数計測法 | |
US11091797B2 (en) | Systems and methods to detect rare mutations and copy number variation | |
JP7256748B2 (ja) | エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法 | |
ES2769241T5 (es) | Sistemas y métodos para detectar variación en el número de copias | |
ES2877088T3 (es) | Procedimiento para detectar cáncer | |
Kivioja et al. | Counting absolute number of molecules using unique molecular identifiers | |
CN107002120B (zh) | 测序方法 | |
JP2018527928A (ja) | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ | |
WO2018144159A1 (en) | Capture probes using positive and negative strands for duplex sequencing | |
US20240026440A1 (en) | Methods of labelling nucleic acids | |
JP5926189B2 (ja) | Rna分析方法 | |
CN115867665A (zh) | 嵌合扩增子阵列测序 | |
EP3847276A2 (en) | Methods and systems for detecting allelic imbalance in cell-free nucleic acid samples | |
US20230399687A1 (en) | Quantitative Multiplex Amplicon Sequencing System | |
WO2021192395A1 (ja) | 塩基のメチル化度の算出方法及びプログラム | |
Mondal et al. | High throughput DNA sequencing and its implication in plant science research |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170925 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191008 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6664575 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |