JP2019131539A - 次世代シーケンシングにおける検体間相互汚染の検出方法 - Google Patents
次世代シーケンシングにおける検体間相互汚染の検出方法 Download PDFInfo
- Publication number
- JP2019131539A JP2019131539A JP2019006291A JP2019006291A JP2019131539A JP 2019131539 A JP2019131539 A JP 2019131539A JP 2019006291 A JP2019006291 A JP 2019006291A JP 2019006291 A JP2019006291 A JP 2019006291A JP 2019131539 A JP2019131539 A JP 2019131539A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- nucleic acid
- dna
- spike
- specimen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012864 cross contamination Methods 0.000 title claims abstract description 38
- 238000001514 detection method Methods 0.000 title claims description 15
- 238000007481 next generation sequencing Methods 0.000 title abstract description 39
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 156
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 154
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 153
- 238000000034 method Methods 0.000 claims abstract description 108
- 238000012163 sequencing technique Methods 0.000 claims abstract description 72
- 239000012634 fragment Substances 0.000 claims abstract description 60
- 238000006243 chemical reaction Methods 0.000 claims abstract description 26
- 239000000523 sample Substances 0.000 claims description 150
- 238000002360 preparation method Methods 0.000 claims description 37
- 238000007405 data analysis Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 18
- 230000000295 complement effect Effects 0.000 claims description 17
- 238000009396 hybridization Methods 0.000 claims description 10
- 238000002156 mixing Methods 0.000 claims description 9
- 230000002776 aggregation Effects 0.000 claims description 5
- 238000004220 aggregation Methods 0.000 claims description 5
- 238000013075 data extraction Methods 0.000 claims description 5
- 238000003203 nucleic acid sequencing method Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 14
- 238000004458 analytical method Methods 0.000 description 26
- 239000003153 chemical reaction reagent Substances 0.000 description 20
- 238000011109 contamination Methods 0.000 description 18
- 239000000203 mixture Substances 0.000 description 12
- 238000003199 nucleic acid amplification method Methods 0.000 description 12
- 230000003321 amplification Effects 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 210000004369 blood Anatomy 0.000 description 10
- 239000008280 blood Substances 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- JCLFHZLOKITRCE-UHFFFAOYSA-N 4-pentoxyphenol Chemical compound CCCCCOC1=CC=C(O)C=C1 JCLFHZLOKITRCE-UHFFFAOYSA-N 0.000 description 9
- 108090000623 proteins and genes Proteins 0.000 description 9
- 238000003860 storage Methods 0.000 description 9
- 238000001962 electrophoresis Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 7
- 238000012300 Sequence Analysis Methods 0.000 description 7
- 239000012472 biological sample Substances 0.000 description 7
- 238000004226 microchip electrophoresis Methods 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 238000003753 real-time PCR Methods 0.000 description 5
- KJLPSBMDOIVXSN-UHFFFAOYSA-N 4-[4-[2-[4-(3,4-dicarboxyphenoxy)phenyl]propan-2-yl]phenoxy]phthalic acid Chemical compound C=1C=C(OC=2C=C(C(C(O)=O)=CC=2)C(O)=O)C=CC=1C(C)(C)C(C=C1)=CC=C1OC1=CC=C(C(O)=O)C(C(O)=O)=C1 KJLPSBMDOIVXSN-UHFFFAOYSA-N 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 239000002096 quantum dot Substances 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 101100384865 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cot-1 gene Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 238000012252 genetic analysis Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- GPRLSGONYQIRFK-UHFFFAOYSA-N hydron Chemical compound [H+] GPRLSGONYQIRFK-UHFFFAOYSA-N 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000011222 transcriptome analysis Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
[態様1]
複数のシーケンシング反応が並行して実行される核酸塩基配列決定法に供するための、複数の検体由来の核酸分子断片を含むライブラリーの調製方法であって、
(1)各検体に由来する核酸(DNA)分子の夫々に、該検体に固有のスパイクインDNAを混入させて、各検体に対応するライブラリー用核酸試料を調製するステップ、及び
(2)上記の各検体に対応するライブラリー用核酸試料に含まれる核酸分子から調製された核酸分子断片及びスパイクインDNAの夫々に、各検体に固有の塩基配列から成るバーコード配列を付加して各検体由来のライブラリーを調製するステップ、を含み、
該スパイクインDNAが、各検体に固有の塩基配列から成るインデックス配列、及びインデックス検索配列を含むことを特徴とする、前記方法。
[態様2]
該スパイクインDNAが更にプローブ相補配列及び/又はランダム配列を含む態様1記載の調製方法。
[態様3]
前記バーコード配列を含むアダプターを該核酸分子断片及び該スパイクインDNAの末端に連結させることにより、該バーコード配列を付加する、態様1又は2に記載の調製方法。
[態様4]
更に、ハイブリダイゼーシュンキャプチャー法によってライブラリー断片からターゲット配列を濃縮するステップを含む、態様1〜3のいずれか一項に記載の調製方法。
[態様5]
PCRにより核酸分子断片が増幅されるステップを含む、態様1〜4のいずれか一項に記載の調製方法。
[態様6]
態様1〜5のいずれか一項に記載の調製方法によって複数の検体由来の核酸分子断片を含むライブラリーを調製した後に、更に、該ライブラリーを用いて複数のシーケンシング反応を並行して実行するステップを含む、核酸塩基配列決定法。
[態様7]
PCRにより増幅された核酸分子断片をシーケンシングすることを特徴とする、態様6に記載の核酸塩基配列決定法。
[態様8]
更に、該スパイクインDNAに含まれるインデックス配列及び該バーコード配列に関して得られた配列情報に基づき、各検体間の相互汚染に関するデータ解析を行うステップを含む、態様6又は7に記載の核酸塩基配列決定法。
[態様9]
データ解析が以下の処理を含むことを特徴とする態様8記載の方法:
ベースコール;
デマルチプレックス;
IDX配列データの抽出;
IDXデータのQC;
脱重複処理(ランダム配列を含む場合);及び
IDXデータの集計(カウント)。
[態様10]
態様6〜8のいずれか一項に記載の核酸塩基配列決定法により該スパイクインDNAに含まれるインデックス配列及び該バーコード配列に関して得られた配列情報の組み合わせ及びその検出割合に基づきデータ解析を行うことにより、該核酸塩基配列決定法に於ける各検体間の相互汚染を定量的に検出する方法。
[態様11]
データ解析が以下の処理を含むことを特徴とする態様10に記載の方法:
ベースコール;
デマルチプレックス;
IDX配列データの抽出;
IDXデータのQC;
脱重複処理(ランダム配列を含む場合);及び
IDXデータの集計(カウント)。
[態様12]
態様1〜11のいずれか一つに記載の方法で使用するための核酸分子のセットであって、各検体に固有の塩基配列から成るインデックス配列及びインデックス検索配列を含むスパイクインDNAから成る核酸分子、並びに、各検体に固有の塩基配列から成るバーコード配列を含む核酸分子を含む、前記セット。
[態様13]
スパイクインDNAが更にプローブ相補配列及び/又はランダム配列を含む、請求項12に記載の核酸分子のセット。
[態様14]
態様1〜5のいずれか一つに記載の調製方法で使用するためのライブラリー調製用キットであって、各検体に固有の塩基配列から成るインデックス配列及びインデックス検索配列を含むスパイクインDNAから成る核酸分子、並びに/又は、各検体に固有の塩基配列から成るバーコード配列を含む核酸分子を含む、前記キット。
[態様15]
各検体に由来する核酸(DNA)分子を取り込むための容器内に該検体に固有のスパイクインDNAが予め保持又は封入されている、態様14記載のキット。
(2)上記の各検体に対応するライブラリー用核酸試料に含まれる核酸分子から調製された核酸分子断片及びスパイクインDNAの夫々に、各検体に固有の塩基配列から成るバーコード配列を付加して各検体由来のライブラリーを調製するステップ、を含み、
該スパイクインDNAが、各検体に固有の塩基配列から成るインデックス配列、及びインデックス検索配列を含むことを特徴とする調製方法によって得られるライブラリーを用いて複数のシーケンシング反応が並行して実行される核酸塩基配列決定法を実施することによって、塩基配列解析において出力されたリード配列がどの検体に由来するかを特定・識別できる(データからサンプルの由来をトラッキングする技術)だけでなく、その純度がどの程度であったかを算定することができる。更に、シーケンシングによって得られた各種の出力データ(配列情報等)に基づくデータ解析から、既に記載したような検体間の相互汚染等の可能性を確認できるだけでなく、それがどの程度の汚染であるかを定量的に検出することも可能である。
第一に、本発明は、このような次世代シーケンシング(NGS)である、複数のシーケンシング反応が並行して実行される核酸塩基配列決定法に供するための複数の検体由来の核酸分子断片を含むライブラリーの調製方法に係る。
(2)上記の各検体に対応するライブラリー用核酸試料に含まれる核酸分子から調製された核酸分子断片及びスパイクインDNAの夫々に、各検体に固有の塩基配列から成るバーコード配列を付加して各検体由来のライブラリーを調製するステップ、を含み、
該スパイクインDNAが各検体に固有の塩基配列から成るインデックス配列、及びインデックス検索配列を含むことを特徴とする。
「各検体に由来する核酸(DNA)分子」には、任意の種類の生物又は生物由来の試料(検体)、例えば、動植物組織、体液、排泄物等の生物由来の試料(全血、唾液、バイオプシーなど遺伝子解析の材料となるもの)、細胞、原虫、真菌、細菌、ウィルス等の核酸包含体等の任意の種類の検体に由来する(含まれている)ゲノムDNA又はその転写産物から得られたcDNA等を含む。これらの核酸は各検体から当業者に公知の任意の方法・手段により分離・精製等の各種の処理によって調製され、更に、核酸塩基配列決定に際して、その具体的な用途及びシーケンシングの種類・原理等に応じて、数百〜数千塩基対程度のサイズに断片化することが出来る。
次に、ステップ(1)で調製された各検体に対応するライブラリー用核酸試料に含まれる核酸分子から調製された核酸分子断片及びスパイクインDNAの夫々に、各検体に固有の塩基配列から成るバーコード配列を付加して各検体由来のライブラリーを調製する。該バーコード配列は当業者に公知の任意の方法・手段によって付加することが出来る。尚、本発明方法に於ける複数の検体由来の核酸分子断片を含むライブラリーは、これら各検体由来のライブラリーを適宜、混合して調製することが出来る。
このような本発明方法で用いられるスパイクインDNAに含まれる各種配列及びバーコード配列の個々の長さ(塩基対数)は、相互汚染を検出する検体総数、取得するシーケンスデータ総量、及び、実験条件等、実験の規模や目的、並びに、上記の「edit distance」の概念等を考慮して当業者が適宜設定することが出来る。相互汚染を調べる必要のある検体数が多いほど、識別配列の塩基長をある程度まで長くする必要があり、更に、シーケンスで取得するデータ量が多いほど、ランダム配列をある程度まで長くする必要がある。しかしながら、余り長すぎると、各検体間の相互汚染の割合の計算に時間を要する、及び、合成コストが嵩む等の理由から好ましくない。
更に本発明は、上記の方法によって複数の検体由来の核酸分子断片を含むライブラリーを調製した後に、更に、該ライブラリーを用いて複数のシーケンシング反応を並行して実行するステップを含む、核酸塩基配列決定法(次世代シーケンシング法)に係る。このようなシーケンシングステップは、既に述べたような各種の次世代シーケンシング技術に準じて、当業者が適宜実施することが出来る。
本発明の核酸塩基配列決定法に供されるライブラリーは、複数の種類の検体から調製された各ライブラリーの混合物であるが、該核酸塩基配列決定法からの出力データとして得られる、個々の検体由来の核酸分子断片に混入された固有のスパイクインDNAに含まれるインデックス配列、及び、個々の検体に固有のバーコード配列に関する配列情報の組み合わせ及びその検出割合等に基づき、各検体間の相互汚染に関するデータ解析を行い、各検体間の相互汚染を定量分析することが出来る。
ベースコール;
デマルチプレックス;
IDX配列データの抽出;
IDXデータのQC;
脱重複処理(ランダム配列を含む場合);及び
IDXデータの集計(カウント)。
尚、各段階におけるデータ処理自体は当該技術分野において公知の方法で実施することが出来る。
機器と試薬
・ φX174 RF I DNA(タカラバイオ,3040)
・ PrimeSTAR (登録商標) GXL DNA Polymerase(タカラバイオ,R050A)
・ スパイクインDNA調製用オリゴDNA(ユーロフィン,配列は表1に示す)
・ DNA Clean & Concentrator (商標)-5(Zymo Research, D4013)
・ DNA/RNAマイクロチップ電気泳動装置MCE-202(MultiNA)(Shimadzu)
・ DNA-1000/12000キット(Shimadzu,292-27911-91/ 292-36600-91)
・ KAPA SYBR (登録商標) FAST qPCR Master Mix (2X) Kit(日本ジェネティクス, KK4600)
・ 7500 Fast & 7500リアルタイムPCRシステム(ThermoFisher Scientific)
図2に示したスパイクインDNAの調製は、プローブ相補配列のPCR合成と、これに対する各検体に固有のIDX配列付与の2段階で実施した。まず、0.2 mLチューブに1 ngφX174 RF I DNA,0.2 pmol M13F-phiX4055LオリゴDNA,0.2 pmol T7tRC-phiX4174RオリゴDNA,2.5 nmol each dNTP Mixtureを加え、ここに10 μLの5x PrimeSTAR GXL Bufferと1 μLのPrimeSTAR GXLを混合し、さらにミリQ水を合計50 μLとなるように加えた。サーマルサイクラーを利用し、98 ℃10秒、55 ℃15秒、68 ℃30秒の3ステップ、合計30サイクルの増幅反応を実施した。得られた断片をマイクロチップ泳動装置に供し、断片が想定される大きさ(158 bp)で増幅していることを確認した。最後に、DNA Clean & Concentrator(商標)-5を使って得られた、プローブ相補配列を含む増幅断片を単離した(図3)。
機器と試薬
・ Y字アダプター調製用オリゴDNA(ユーロフィン,配列は表3に示す。各P7アダプター配列に於いて、下線を付した塩基配列が各検体に固有のバーコード配列である。)
・ PCR増幅用オリゴDNA(ユーロフィン,配列は表4に示す)
・ DynaMag (商標)-96 Side Magnet(ThermoFisher Scientific, 12331D)
・ T100サーマルサイクラー(BIPRAD)
・ DNA/RNAマイクロチップ電気泳動装置MCE-202(MultiNA)(Shimadzu)
・ DNA-1000キット(Shimadzu,292-27911-91)
・ Qubit (登録商標)2.0 Fluorometer(ThermoFisher Scientific)
・ Qubit (商標) dsDNA BR Assay Kit(ThermoFisher Scientific, Q32850)
まず、10 μM Y字アダプターを調製した。まず、0.2 mLチューブに4種類のP7アダプターとP5アダプターを、それぞれ終濃度が10 μMとなるようにアニーリングバッファー(10 mM Tris-HCl [pH7.5], 100 mM NaCl, 1 mM EDTA)で希釈した。混合液をサーマルサイクラーに移し、95℃で1分間保温した。その後、95℃から65℃まで1秒ごとに0.1℃ずつ温度を下げ、65℃に達したら10分間保温し、そののち65℃から25℃まで1秒ごとに0.1℃ずつ温度を下げた。調製した4種類のY字アダプターは-20℃で保存した。
機器と試薬
・ InvitrogenTM Human Cot-1 DNA(登録商標)(Life Technologies, Cat #15279-011)
・ xGen (登録商標) Universal Blockers - TS Mix(IDT, 1075474)
・ Savant DNA 110 SpeedVac (登録商標) Concentrator
・ xGen (登録商標) Lockdown (登録商標) Reagents(IDT, 1072280)
・ xGen (登録商標) Lockdown (登録商標) Probesキャプチャープローブ(ヒト10遺伝子[43.2 kb]をターゲットとする仮想パネル)(IDT)
・ スパイクイン濃縮用キャプチャープローブ(IDT)
・ KAPA HiFi HotStart ReadyMix(Kapa Biosystems, Cat #KK2601)
・ KAPA Library Quantification Kits Illumina / Universal(日本ジェネティクス, KK4824)
・ 7500 Fast & 7500リアルタイムPCRシステム(ThermoFisher Scientific)
まず、0.2 mLチューブに4種の各種スパイクインDNAを封入したNGS用ライブラリー(サンプル1〜サンプル4)を夫々125 ngずつ分取し、さらに5 μgのCot-1 DNAと2 μLのxGen (登録商標) Universal Blockers - TS Mixを加えた。チューブをSpeedVac (登録商標) Concentratorに設置し、溶液全体を濃縮乾固した。次に、濃縮用プローブを調製した。IDXプローブの終濃度が100 amol/μLとなるように、ターゲット濃縮用のプローブ(ここではヒト10遺伝子[43.2 kb]をターゲットとする仮想パネル)に混合した。以降の反応には市販のxGen(登録商標) Lockdown (登録商標) Reagentsを利用した。作業はメーカー推奨のプロトコル(Hybridization capture of DNA libraries using xGen Lockdown Probes and Reagents, v3)に従った。なお、最終ステップのPCR反応は16サイクルで実施した。以上の操作で得られた、ライブラリープール(本発明に於ける、「複数の検体由来の核酸分子断片を含むライブラリー」に相当する)の品質をMultiNAによる電気泳動像で確認し(図6)、濃度はKAPA Library Quantification Kits Illumina / Universalで決定した(表7)。
機器と試薬
・ NextSeq 500 Mid Output v2 Kit (150 cycles)(illumina, FC-404-2001)
・ NextSeq 500シーケンシングシステム(illumina)
シーケンシングには市販のNextSeq 500 Mid Output v2 Kit (150 cycles)を使用した。作業はメーカー推奨のマニュアルに従って実施した(NextSeq 500System v2.0_QuickRefGuide_20151221)。ライブラリープールを20 pMの濃度でアプライした結果、クラスタの形成密度は240 K/mm2であり、総出力塩基数は29.2 Bbと見積もられた。また、クオリティ値Q30以上を有するシーケンスデータの占める割合は全体の92.7%であった。
解析方法の概要
図7にNextSeq (登録商標)シーケンシングシステムから出力されたデータの解析フローの概略を示す。まず、bcl形式で出力されたデータ(全シーケンシングデータのバイナリファイル)をfastq形式(リード配列+クオリティ値)にコンバートする(ベースコール)。読まれたアダプター配列を基に、各サンプルのfastq形式リード情報に脱並列化した(デマルチプレックス)。デマルチプレックスしたリードから、2つのインデックス検索配列(TAATACGACTCACTATAGGおよびGTAAAACGACGGCCAGT)に囲まれたインデックス(IDX)配列のみを抽出した(IDX配列データの抽出)。次に、IDX配列情報のPhred Score値を参照し、Q20値を下回る塩基を1つでも持つリード情報は破棄した(IDXデータのQC)。なお、シーケンシングされている配列の正確さを表わすPhred Score値とは “-10log10Perror”の数式で求められる工学的な値であり、シーケンシングされた塩基ごとに出力される。ここで、Perrorは配列決定が正しく行われない確率推定値を示す。すなわち、スコア値が高いほどエラーの確率が低い(正しく配列決定された)ことを示し、低いほど誤検出のリスクが高まることを示す。具体的には、Q10値では推定ベースコール精度が90%であり、エラー率は10%である。同様に、Q20値では精度99%、エラー率1%、Q30値では精度99.9%、エラー率0.1%の状態を表わしている。最後に、各サンプルのシーケンス情報に含まれているIDXリードのカウントを集計した(IDXデータのカウント)。
・ bcl2fastq (v2.17.1.14)
・ cutadapt (version 1.7.1)
・ fastq_masker (FASTX Toolkit 0.0.13)
下記のコマンドでベースコールならびにデマルチプレックスを実施した。
bcl2fastq \
--runfolder-dir INPUT \
--output-dir OUTPUT \
--interop-dir output/InterOP \
--sample-sheet samplesheet.csv \
--barcode-mismatches 1
cutadapt \
-b TAATACGACTCACTATAGG \
INPUT.R1.fastq \
-o OUTPUT1.R1.fastq
--discard-untrimmed
cutadapt \
-a GTAAAACGACGGCCAGT \
OUTPUT1.R1.fastq \
-o OUTPUT2.R1.fastq
--discard-untrimmed
cat \
OUTPUT2.R1.fastq \
OUTPUT2.R2.fastq \
ReverseComplement_OUTPUT2.R1.fastq \
ReverseComplement_OUTPUT2.R2.fastq \
> OUTPUT.fastq
fqmasker \
-q 20 \
-i OUTPUT.fastq \
-o QC_result.fastq \
-v -Q33
awk 'BEGIN{
OFS="\t"
}NR%4==2{
raw=$0; \
len=length(raw); \
gsub("N",""); \
len2=length($0); \
if (len-len2==0 && len==15) print $0
}' \
> CLEAN_result.txt
(1)各検体に対応するライブラリー用核酸試料の調製
機器と試薬
・ スパイクインDNA調製用IDXオリゴDNA(IDT,配列は表9に示す)。各配列に於いて、点線下線を付された配列がランダム配列、小文字で表記された塩基配列が各インデックス(IDX)配列、及び、それらの前後の大文字で表記された塩基配列が各スパイクインDNAに共通するインデックス検索配列である。)
・ その他の試薬は実施例1と同様
DNA断片の調製は、実施例1と同様の方法で行なった。マイクロチップ泳動装置による評価の結果を以下に示した。断片濃度をリアルタイムPCRで決定し、1μgゲノムDNA(あるいは〜50 μLの全血)に対して5 amolの割合で混合した。
機器と試薬
・ Y字アダプター調製用オリゴDNA(ユーロフィン,配列は表10に示す。各P7アダプター配列に於いて、下線を付した塩基配列が各検体に固有のバーコード配列である。)
Y字アダプターとNGSライブリの調製は、実施例1と同様の方法で行なった。そのMultiNAによる電気泳動像を図9に示す。また、Qubitフルオロメーターで決定した濃度も示した(表11)。
機器と試薬
・ 実施例1と同様
方法
ターゲット配列の濃縮は、実施例1と同時に行なった。従って、最終的に得られたライブラリープールの品質ならびに濃度は実施例1で示したとおりである。
機器と試薬
・ 実施例1と同様
方法
シーケンシングは、実施例1と同様の方法で行なった。クラスタの形成密度は240 K/mm2であり、総出力塩基数は29.2 Bbと見積もられた。また、クオリティ値Q30以上を有するシーケンスデータの占める割合は全体の92.7%であった。
解析方法の概要
実施例1で実施した解析方法に、更に、IDXデータの脱重複処理を追加して実施した。
・ 使用するツールは実施例1と同様
実施例1と同様にデマルチプレックスを実施し、下記のコマンドでランダム配列ならびにIDXデータを抽出した(下記のコマンドラインをR2リード情報、ならびに逆向きに読まれたR1、R2リード情報(相補鎖のデータ)にも適用する)。
cutadapt \
-b TAATACGACTCACTATAGG \
INPUT.R1.fastq \
-o OUTPUT1.R1.fastq
--discard-untrimmed
cutadapt \
-a GTAAAACGACGGCCAGT \
OUTPUT1.R1.fastq \
-o OUTPUT2.R1.fastq
--discard-untrimmed
cat \
OUTPUT2.R1.fastq \
OUTPUT2.R2.fastq \
ReverseComplement_OUTPUT2.R1.fastq \
ReverseComplement_OUTPUT2.R2.fastq \
> OUTPUT.fastq
fqmasker \
-q 20 \
-i OUTPUT.fastq \
-o QC_result.fastq \
-v -Q33
awk 'BEGIN{
OFS="\t"
}{
raw=$0; \
len=length(raw); \
gsub("N",""); \
len2=length($0); \
if (len-len2==0 && len==43) print $0,substr($0,1,28),substr($0,29,15)
}' |\
> CLEAN_result.txt
sort -k2 CLEAN_result.txt |\
awk '{
if (umi != $2) print $0; umi=$2
}’ \
> DEDUP_result.txt
・ MATRIX 2Dチューブ0.5ml (Thermo)
・ Maxwell核酸自動精製装置 (Promega)
・ Maxwell RSC Blood DNA Kit (Promega)
・ その他の試薬と装置は実施例1と同様
内面に予め100 amolのスパイクインDNAを塗布して付着させたMATRIX 2Dチューブに250 μLの全血を加えた。さらに、Maxwell RSC Blood DNA Kitで処理したのち、Maxwell核酸自動精製装置に供した。独立した実験を3回実施したところ、平均して5.7μg(1.8×106コピー)のゲノムDNAが得られた。また、定量PCRを実施したところ、抽出されたゲノムDNAには平均して60.9 amol(3.7×107分子)のスパイクインDNAが回収されていた。すなわち、ここで調整した溶液には、ゲノムDNA1分子に対し、約20倍量のスパイクインDNAが含まれていることが分かった。
Claims (15)
- 複数のシーケンシング反応が並行して実行される核酸塩基配列決定法に供するための、複数の検体由来の核酸分子断片を含むライブラリーの調製方法であって、
(1)各検体に由来する核酸(DNA)分子の夫々に、該検体に固有のスパイクインDNAを混入させて、各検体に対応するライブラリー用核酸試料を調製するステップ、及び
(2)上記の各検体に対応するライブラリー用核酸試料に含まれる核酸分子から調製された核酸分子断片及びスパイクインDNAの夫々に、各検体に固有の塩基配列から成るバーコード配列を付加して各検体由来のライブラリーを調製するステップ、を含み、
該スパイクインDNAが、各検体に固有の塩基配列から成るインデックス配列及びインデックス検索配列を含むことを特徴とする、前記方法。 - 該スパイクインDNAが更にプローブ相補配列及び/又はランダム配列を含む請求項1記載の調製方法。
- 前記バーコード配列を含むアダプターを該核酸分子断片及び該スパイクインDNAの末端に連結させることにより、該バーコード配列を付加する、請求項1又は2に記載の調製方法。
- 更に、ハイブリダイゼーシュンキャプチャー法によってライブラリーに含まれる核酸分子断片からターゲット配列を濃縮するステップを含む、請求項1〜3のいずれかに記載の調製方法。
- PCRにより核酸分子断片が増幅されるステップを含む、請求項1〜4のいずれかに記載の調製方法。
- 請求項1〜5のいずれかに記載の調製方法によって複数の検体由来の核酸分子断片を含むライブラリーを調製した後に、更に、該ライブラリーを用いて複数のシーケンシング反応を並行して実行するステップを含む、核酸塩基配列決定法。
- PCRにより増幅された核酸分子断片をシーケンシングすることを特徴とする、請求項6に記載の核酸塩基配列決定法。
- 更に、該スパイクインDNAに含まれるインデックス配列及び該バーコード配列に関して得られた配列情報に基づき、各検体間の相互汚染に関するデータ解析を行うステップを含む、請求項6又は7に記載の核酸塩基配列決定法。
- データ解析が以下の処理を含むことを特徴とする請求項8記載の方法:
ベースコール;
デマルチプレックス;
IDX配列データの抽出;
IDXデータのQC;
脱重複処理(ランダム配列を含む場合);及び
IDXデータの集計(カウント)。 - 請求項6〜8のいずれか一項に記載の核酸塩基配列決定法により該スパイクインDNAに含まれるインデックス配列及び該バーコード配列に関して得られた配列情報の組み合わせ及びその検出割合に基づきデータ解析を行うことにより、該核酸塩基配列決定法に於ける各検体間の相互汚染を定量的に検出する方法。
- データ解析が以下の処理を含むことを特徴とする請求項10に記載の方法:
ベースコール;
デマルチプレックス;
IDX配列データの抽出;
IDXデータのQC;
脱重複処理(ランダム配列を含む場合);及び
IDXデータの集計(カウント)。 - 請求項1〜11のいずれか一つに記載の調製方法で使用するための核酸分子のセットであって、各検体に固有の塩基配列から成るインデックス配列及びインデックス検索配列を含むスパイクインDNAから成る核酸分子、並びに、各検体に固有の塩基配列から成るバーコード配列を含む核酸分子を含む、前記セット。
- スパイクインDNAが更にプローブ相補配列及び/又はランダム配列を含む、請求項12に記載の核酸分子のセット。
- 請求項1〜5のいずれか一つに記載の調製方法で使用するためのライブラリー調製用キットであって、各検体に固有の塩基配列から成るインデックス配列及びインデックス検索配列を含むスパイクインDNAから成る核酸分子、並びに/又は、各検体に固有の塩基配列から成るバーコード配列を含む核酸分子を含む、前記キット。
- 各検体に由来する核酸(DNA)分子を取り込むための容器内に該検体に固有のスパイクインDNAが予め保持又は封入されている、請求項14記載のキット。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018014357 | 2018-01-31 | ||
JP2018014357 | 2018-01-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019131539A true JP2019131539A (ja) | 2019-08-08 |
JP6766191B2 JP6766191B2 (ja) | 2020-10-07 |
Family
ID=67547216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019006291A Active JP6766191B2 (ja) | 2018-01-31 | 2019-01-17 | 次世代シーケンシングにおける検体間相互汚染の検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6766191B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110656157A (zh) * | 2019-10-16 | 2020-01-07 | 重庆市人口和计划生育科学技术研究院 | 用于高通量测序样本溯源的质控品及其设计和使用方法 |
CN115717163A (zh) * | 2022-10-27 | 2023-02-28 | 迈杰转化医学研究(苏州)有限公司 | 一种用于监控及纠正测序污染的分子编码检测体系及其应用 |
CN118389511A (zh) * | 2024-05-16 | 2024-07-26 | 上海伯杰医疗科技股份有限公司 | 用于样本识别和样本内核酸物质定量的分子序列标签 |
-
2019
- 2019-01-17 JP JP2019006291A patent/JP6766191B2/ja active Active
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110656157A (zh) * | 2019-10-16 | 2020-01-07 | 重庆市人口和计划生育科学技术研究院 | 用于高通量测序样本溯源的质控品及其设计和使用方法 |
CN110656157B (zh) * | 2019-10-16 | 2023-09-08 | 重庆市人口和计划生育科学技术研究院 | 用于高通量测序样本溯源的质控品及其设计和使用方法 |
CN115717163A (zh) * | 2022-10-27 | 2023-02-28 | 迈杰转化医学研究(苏州)有限公司 | 一种用于监控及纠正测序污染的分子编码检测体系及其应用 |
CN115717163B (zh) * | 2022-10-27 | 2023-10-27 | 迈杰转化医学研究(苏州)有限公司 | 一种用于监控及纠正测序污染的分子编码检测体系及其应用 |
CN118389511A (zh) * | 2024-05-16 | 2024-07-26 | 上海伯杰医疗科技股份有限公司 | 用于样本识别和样本内核酸物质定量的分子序列标签 |
Also Published As
Publication number | Publication date |
---|---|
JP6766191B2 (ja) | 2020-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11629378B2 (en) | Non-invasive prenatal diagnosis of fetal genetic condition using cellular DNA and cell free DNA | |
US10400267B2 (en) | Generating cell-free DNA libraries directly from blood | |
US12040053B2 (en) | Methods for generating sequencer-specific nucleic acid barcodes that reduce demultiplexing errors | |
RU2704286C2 (ru) | Подавление ошибок в секвенированных фрагментах днк посредством применения избыточных прочтений с уникальными молекулярными индексами (umi) | |
Meyer et al. | Parallel tagged sequencing on the 454 platform | |
JP6766191B2 (ja) | 次世代シーケンシングにおける検体間相互汚染の検出方法 | |
Pei et al. | Targeted sequencing approach and its clinical applications for the molecular diagnosis of human diseases | |
US20150322508A1 (en) | Method for complete tracking of a set of biological samples containing dna or rna through molecular barcode identification during laboratorial workflow and kit for collecting biological samples containing dna or rna | |
EP4139482B1 (en) | Single step sample preparation for next generation sequencing | |
JP2018520706A (ja) | 試料採取からngsライブラリ調製までの自動化 | |
US12091705B2 (en) | Barcoded molecular standards | |
Shetty et al. | Introduction to nucleic acid sequencing | |
US10927405B2 (en) | Molecular tag attachment and transfer | |
US20240321395A1 (en) | Mitochondrial probes for endogenous control and contamination detection | |
CN109790587B (zh) | 从100pg以下的人类基因组DNA判别其来源的方法、识别个人的方法及分析造血干细胞的植活程度的方法 | |
WO2024018485A1 (en) | Methods and systems for detection and identification of pathogens and antibiotic resistance genes | |
Bajaj et al. | MICROBIAL GENOMICS | |
WO2024097309A1 (en) | Dynamic clinical assay pipeline for detecting a virus | |
Pal et al. | RNA Sequencing (RNA-seq) | |
Bennett | DNA sequencing and the human genome Project | |
Ferro et al. | Single-cell sequencing: a new frontier for personalized medicine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190205 |
|
AA64 | Notification of invalidation of claim of internal priority (with term) |
Free format text: JAPANESE INTERMEDIATE CODE: A241764 Effective date: 20190205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190829 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200908 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200916 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6766191 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |