JP6687605B2 - 配列決定プロセス - Google Patents
配列決定プロセス Download PDFInfo
- Publication number
- JP6687605B2 JP6687605B2 JP2017513371A JP2017513371A JP6687605B2 JP 6687605 B2 JP6687605 B2 JP 6687605B2 JP 2017513371 A JP2017513371 A JP 2017513371A JP 2017513371 A JP2017513371 A JP 2017513371A JP 6687605 B2 JP6687605 B2 JP 6687605B2
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- template nucleic
- molecular tag
- sequence
- acid molecules
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 172
- 238000012163 sequencing technique Methods 0.000 title claims description 100
- 150000007523 nucleic acids Chemical class 0.000 claims description 455
- 108020004707 nucleic acids Proteins 0.000 claims description 451
- 102000039446 nucleic acids Human genes 0.000 claims description 451
- 239000012634 fragment Substances 0.000 claims description 77
- 108091035707 Consensus sequence Proteins 0.000 claims description 67
- 238000004590 computer program Methods 0.000 claims description 16
- 230000029087 digestion Effects 0.000 claims description 6
- 230000000813 microbial effect Effects 0.000 claims description 6
- 238000010008 shearing Methods 0.000 claims description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 68
- 108090000623 proteins and genes Proteins 0.000 description 31
- 238000005215 recombination Methods 0.000 description 26
- 230000006798 recombination Effects 0.000 description 26
- 108020004414 DNA Proteins 0.000 description 24
- 108020004465 16S ribosomal RNA Proteins 0.000 description 19
- 239000011324 bead Substances 0.000 description 19
- 241000566145 Otus Species 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 16
- 239000000047 product Substances 0.000 description 16
- 230000003321 amplification Effects 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 14
- 238000003199 nucleic acid amplification method Methods 0.000 description 14
- 108091093088 Amplicon Proteins 0.000 description 13
- 239000002773 nucleotide Substances 0.000 description 11
- 125000003729 nucleotide group Chemical group 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 9
- 238000006062 fragmentation reaction Methods 0.000 description 9
- 238000010790 dilution Methods 0.000 description 8
- 239000012895 dilution Substances 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- 238000013467 fragmentation Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 241000186216 Corynebacterium Species 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 4
- 241001156739 Actinobacteria <phylum> Species 0.000 description 3
- 241000192142 Proteobacteria Species 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 238000000018 DNA microarray Methods 0.000 description 2
- 241001646716 Escherichia coli K-12 Species 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000000205 computational method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 238000012353 t test Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 241000589291 Acinetobacter Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 241001552883 Enhydrobacter Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 241000736262 Microbiota Species 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 241000425347 Phyla <beetle> Species 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 229920000297 Rayon Polymers 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 101150018420 kbp gene Proteins 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 239000002964 rayon Substances 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2565/00—Nucleic acid analysis characterised by mode or means of detection
- C12Q2565/50—Detection characterised by immobilisation to a surface
- C12Q2565/514—Detection characterised by immobilisation to a surface characterised by the use of the arrayed oligonucleotides as identifier tags, e.g. universal addressable array, anti-tag or tag complement array
Description
(a)サイズが1Kbpを超える少なくとも2つの鋳型核酸分子を含む核酸分子の少なくとも1つのサンプルを提供するステップ;
(b)該少なくとも2つの標的鋳型核酸分子のそれぞれの一端に第1の分子タグを導入し、該少なくとも2つの標的鋳型核酸分子のそれぞれの他端に第2の分子タグを導入して、少なくとも2つのタグ化鋳型核酸分子を提供するステップであって、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、固有の第1の分子タグ及び固有の第2の分子タグでタグ化される、ステップ;
(c)該少なくとも2つのタグ化鋳型核酸分子を増幅して、該少なくとも2つのタグ化鋳型核酸分子の複数コピーを提供するステップ;
(d)該少なくとも2つのタグ化鋳型核酸分子の複数コピーの一部を単離し、該一部におけるタグ化鋳型核酸分子を断片化して、複数の断片化鋳型核酸分子を提供するステップ;
(e)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域を配列決定するステップ;
(f)該複数の断片化鋳型核酸分子を配列決定するステップ; 及び
(g)ステップ(f)において生成された配列の少なくともサブセットを含む配列から、該少なくとも2つの鋳型核酸分子の少なくとも1つについてのコンセンサス配列を再構築するステップ
を含む、方法が提供される。
(a)少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含むデータを得るステップであって、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、一端に第1の分子タグ及び他端に第2の分子タグを含み、それぞれの標的鋳型核酸分子は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含む、ステップ;
(b)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の領域の配列を含むデータを分析して、互いに相同である第1の分子タグ及び互いに相同である第2の分子タグを含む配列を同じクラスターに割り当てることによって、同じ個々の標的鋳型核酸分子に対応する可能性のある配列のクラスターを同定するステップ;
(c)該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を含むデータを得るステップであって、該断片のそれぞれは、該第1の分子タグ又は該第2の分子タグのいずれかを含む、ステップ;
(d)該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を分析して、第1のクラスターの配列の第1の分子タグに相同である第1の分子タグ又は第1のクラスターの配列の第2の分子タグに相同である第2の分子タグを含む、該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を同定するステップ;
(e)ステップ(d)で同定された該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列の少なくともサブセットを含む配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の標的鋳型核酸分子の配列を再構築するステップ; 及び
(f)第2の及び/又はさらなる鋳型核酸分子に関してステップ(c)〜(e)を実施するステップ
を含む、方法が提供される。
(a)配列のクラスターを含むデータを得るステップ、ここで:
(i)それぞれのクラスターは、少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含み、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、一端に第1の分子タグ及び他端に第2の分子タグを含み、該少なくとも2つの標的鋳型核酸のそれぞれは、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含み;
(ii)それぞれのクラスターは、該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を含み、該断片のそれぞれは、該第1の分子タグ又は該第2の分子タグのいずれかを含み;
(iii)それぞれのクラスターにおける少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列は、互いに相同である第1の分子タグ及び第2の分子タグを含み;
(iv)該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列は、そのクラスターにおける少なくとも2つ標的鋳型核酸分子の複数コピーの領域の配列の第1の分子タグに相同である第1の分子タグ、又はそのクラスターにおける該少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列の第2の分子タグに相同である第2の分子タグを含む;
(b)第1のクラスターにおける該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列の少なくともサブセットを含む配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の鋳型核酸分子の配列を再構築するステップ; 及び
(c)第2の及び/又はさらなる鋳型核酸分子に関してステップ(b)を実施するステップ
を含む、方法が提供される。
(a)少なくとも2つの鋳型核酸分子を含む核酸分子の少なくとも1つのサンプルを提供するステップ;
(b)該少なくとも2つの標的鋳型核酸分子のそれぞれの一端に第1の分子タグを導入し、該少なくとも2つの標的鋳型核酸分子のそれぞれの他端に第2の分子タグを導入して、少なくとも2つのタグ化鋳型核酸分子を提供するステップであって、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、固有の第1の分子タグ及び固有の第2の分子タグでタグ化される、ステップ;
(c)該少なくとも2つのタグ化鋳型核酸分子を増幅して、該少なくとも2つのタグ化鋳型核酸分子の複数コピーを提供するステップ;
(d)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の領域を配列決定するステップ; 及び
(e)該少なくとも2つの標的鋳型核酸分子の少なくとも1つについてコンセンサス配列を再構築するステップ
を含み、ステップ(e)は、
(i)互いに相同である第1の分子タグ配列及び互いに相同である第2の分子タグ配列を含む配列を同じクラスターに割り当てることによって、同じ標的鋳型核酸分子に対応する可能性のある該少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列のクラスターを同定するステップ;
(ii)配列の少なくとも1つのクラスターを選択するステップであって、該選択されたクラスター内の配列は、異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく(commonly)関連している第1の分子タグ及び第2の分子タグを含む、ステップ;
(iii)ステップ(ii)で選択されたクラスターにおける少なくとも2つの鋳型核酸分子の配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の標的鋳型核酸分子のコンセンサス配列を再構築するステップ; 及び
(iv)第2の及び/又はさらなる鋳型核酸分子に関してステップ(ii)〜(iii)を実施するステップ
を含む、方法が提供される。
(a)少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含むデータを得るステップであって、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、一端に第1の分子タグ及び他端に第2の分子タグを含み、それぞれの標的鋳型核酸分子は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含む、ステップ;
(b)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の領域の配列を含むデータを分析して、互いに相同である第1の分子タグ及び互いに相同である第2の分子タグを含む配列を同じクラスターに割り当てることによって、同じ鋳型核酸分子に対応する可能性のある配列のクラスターを同定するステップ;
(c)配列の少なくとも1つのクラスターを選択するステップであって、選択されたクラスター内の配列は、異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく関連している第1の分子タグ及び第2の分子タグを含む、ステップ;
(d)ステップ(c)で選択されたクラスターにおける分子の配列の少なくともサブセットを整列させ、これらの配列からコンセンサス配列を定義することによって、第1の鋳型核酸分子のコンセンサス配列を再構築するステップ; 及び
(e)第2の及び/又はさらなる鋳型核酸分子に関してステップ(c)〜(d)を実施するステップ
を含む、方法が提供される。
(a)配列のクラスターを含むデータを得るステップ;
(b)選択されたクラスターにおける配列の少なくともサブセットの配列を整列させることによって、第1の鋳型核酸分子のコンセンサス配列を再構築するステップ;
を含み、選択されたクラスターにおける配列は、少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含み、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、一端に第1の分子タグ及び他端に第2の分子タグを含み、それぞれの標的鋳型核酸分子は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含み、選択されたクラスターにおけるそれぞれの配列は、
(i)そのクラスターにおける他の配列の第1の分子タグに相同である第1の分子タグ、及びそのクラスターにおける他の配列の第2の分子タグに相同である第2の分子タグを含み;
(ii)異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく関連している第1の分子タグ及び第2の分子タグを含む、方法が提供される。
(i)第1の分子タグ若しくは第2の分子タグを含む部分と、少なくとも2つの鋳型核酸分子にハイブリダイズすることができる配列を有する部分とを含むプライマー;
(ii)本発明の方法をどのように実施するのかを記載した説明書
を含む、キットが提供される。
(i)第1の分子タグ若しくは第2の分子タグを含む部分と、少なくとも2つの鋳型核酸分子にハイブリダイズすることができる配列を有する部分とを含むプライマー;
(ii)本発明のコンピュータプログラムを記憶しているコンピュータ可読媒体
を含む、キットが提供される。
また本発明は以下の態様にも関する。
[1] 少なくとも1つの個々の標的鋳型核酸分子の配列を生成する方法であって、
(a)少なくとも2つの標的鋳型核酸分子を含む核酸分子の少なくとも1つのサンプルを提供するステップ;
(b)該少なくとも2つの標的鋳型核酸分子のそれぞれの一端に第1の分子タグを導入し、該少なくとも2つの標的鋳型核酸分子のそれぞれの他端に第2の分子タグを導入して、少なくとも2つのタグ化鋳型核酸分子を提供するステップであって、それぞれのタグ化鋳型核酸分子は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化される、ステップ;
(c)該少なくとも2つのタグ化鋳型核酸分子を増幅して、該少なくとも2つのタグ化鋳型核酸分子の複数コピーを提供するステップ;
(d)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の領域を配列決定するステップ; 及び
(e)該少なくとも2つの標的鋳型核酸分子の少なくとも1つについてコンセンサス配列を再構築するステップ
を含み、ステップ(e)は、
(i)互いに相同である第1の分子タグ配列及び互いに相同である第2の分子タグ配列を含む配列を同じクラスターに割り当てることによって、同じ標的鋳型核酸分子に対応する可能性のある該少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列のクラスターを同定するステップ;
(ii)配列の少なくとも1つのクラスターを選択するステップであって、該選択されたクラスター内の配列は、異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく関連している第1の分子タグ及び第2の分子タグを含む、ステップ;
(iii)ステップ(ii)で選択されたクラスターにおける少なくとも2つの鋳型核酸分子の配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の標的鋳型核酸分子のコンセンサス配列を再構築するステップ; 及び
(iv)第2の及び/又はさらなる鋳型核酸分子に関してステップ(ii)〜(iii)を実施するステップ
を含む、方法。
[2] サイズが1Kbpを超える少なくとも1つの個々の標的鋳型核酸分子の配列を生成する方法であって、
(a)サイズが1Kbpを超える少なくとも2つの標的鋳型核酸分子を含む核酸分子の少なくとも1つのサンプルを提供するステップ;
(b)該少なくとも2つの標的鋳型核酸分子のそれぞれの一端に第1の分子タグを導入し、該少なくとも2つの標的鋳型核酸分子のそれぞれの他端に第2の分子タグを導入して、少なくとも2つのタグ化鋳型核酸分子を提供するステップであって、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、固有の第1の分子タグ及び固有の第2の分子タグでタグ化される、ステップ;
(c)該少なくとも2つのタグ化鋳型核酸分子を増幅して、該少なくとも2つのタグ化鋳型核酸分子の複数コピーを提供するステップ;
(d)該少なくとも2つのタグ化鋳型核酸分子の複数コピーの一部を単離し、該一部における該タグ化鋳型核酸分子を断片化して、複数の断片化鋳型核酸分子を提供するステップ; (e)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域を配列決定するステップ;
(f)該複数の断片化鋳型核酸分子を配列決定するステップ; 及び
(g)ステップ(f)において生成された配列の少なくともサブセットを含む配列から、該少なくとも2つの標的鋳型核酸分子の少なくとも1つについてのコンセンサス配列を再構築するステップ
を含む、方法。
[3] 前記複数の断片化鋳型分子を富化し、前記第1の分子タグ又は前記第2の分子タグを含む前記複数の断片化鋳型核酸分子の割合を増加させるステップをさらに含み、このステップは、ステップ(f)の前にある、上記[2]に記載の方法。
[4] ステップ(g)が、以下:
(i)互いに相同である第1の分子タグ配列及び互いに相同である第2の分子タグ配列を含む配列を同じクラスターに割り当てることによって、同じ個々の標的鋳型核酸分子に対応する可能性のある前記少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列のクラスターを同定するステップ;
(ii)前記複数の断片化鋳型核酸分子の配列を分析して、第1のクラスターの配列の第1の分子タグに相同である第1の分子タグ又は第1のクラスターの配列の第2の分子タグに相同である第2の分子タグを含む、複数の断片化鋳型核酸分子の配列を同定するステップ;
(iii)ステップ(ii)で同定された複数の断片化鋳型核酸分子の配列の少なくともサブセットを含む配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の鋳型核酸分子の配列を再構築するステップ; 及び
(iv)第2の及び/又はさらなる鋳型核酸分子に関してステップ(i)〜(iii)を実施するステップ
を含む、上記[2]又は[3]に記載の方法。
[5] 少なくとも1つの個々の標的鋳型核酸分子の配列を決定する方法であって、以下のステップ:
(a)少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含むデータを得るステップであって、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは一端に第1の分子タグ及び他端に第2の分子タグを含み、それぞれの標的鋳型核酸分子は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含む、ステップ;
(b)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の領域の配列を含むデータを分析して、互いに相同である第1の分子タグ及び互いに相同である第2の分子タグを含む配列を同じクラスターに割り当てることによって、同じ個々の標的鋳型核酸分子に対応する可能性のある配列のクラスターを同定するステップ;
(c)該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を含むデータを得るステップであって、該断片のそれぞれは、該第1の分子タグ又は該第2の分子タグのいずれかを含む、ステップ;
(d)該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を分析して、第1のクラスターの配列の第1の分子タグに相同である第1の分子タグ又は第1のクラスターの配列の第2の分子タグに相同である第2の分子タグを含む、該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を同定するステップ;
(e)ステップ(d)で同定された該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列の少なくともサブセットを含む配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の標的鋳型核酸分子の配列を再構築するステップ; 及び
(f)第2の及び/又はさらなる標的鋳型核酸分子に関してステップ(c)〜(e)を実施するステップ
を含む、方法。
[6] 少なくとも1つの標的鋳型核酸分子の配列を決定する方法であって、以下のステップ:
(a)配列のクラスターを含むデータを得るステップ、ここで:
(i)それぞれのクラスターは、少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含み、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、一端に第1の分子タグ及び他端に第2の分子タグを含み、それぞれの標的鋳型核酸は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含み;
(ii)それぞれのクラスターは、該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を含み、該断片のそれぞれは、該第1の分子タグ又は該第2の分子タグのいずれかを含み;
(iii)それぞれのクラスターにおける少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列は、互いに相同である第1の分子タグ及び第2の分子タグを含み;
(iv)該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列は、そのクラスターにおける少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列の第1の分子タグに相同である第1の分子タグ、又はそのクラスターにおける該少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列の第2の分子タグに相同である第2の分子タグを含む;
(b)第1のクラスターにおける該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列の少なくともサブセットを含む配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の標的鋳型核酸分子の配列を再構築するステップ; 及び
(c)第2の及び/又はさらなる鋳型核酸分子に関してステップ(b)を実施するステップ
を含む、方法。
[7] ステップ(i)が、第1のクラスターの第1の分子タグ配列についてのコンセンサス配列及び第2の分子タグ配列についてのコンセンサス配列を決定することをさらに含み、ステップ(ii)が、該第1のクラスターの該第1の分子タグについての該コンセンサス配列又は該第2の分子タグについての該コンセンサス配列に相同である第1の分子タグ又は第2の分子タグを含む、複数の断片化鋳型核酸分子の配列を同定することを含む、上記[4]に記載の方法。
[8] ステップ(b)が、第1のクラスターの第1の分子タグ配列についてのコンセンサス配列及び第2の分子タグ配列についてのコンセンサス配列を決定することをさらに含み、ステップ(d)が、該第1のクラスターの該第1の分子タグについての該コンセンサス配列又は該第2の分子タグについての該コンセンサス配列に相同である第1の分子タグ又は第2の分子タグを含む、複数の断片化鋳型核酸分子の配列を同定することを含む、上記[5]に記載の方法。
[9] 以下のステップ:
(v)互いに相同である第1の分子タグ配列及び互いに相同である第2の分子タグ配列を含む配列を同じクラスターに割り当てることによって、同じ鋳型核酸分子に対応する可能性のある前記少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列のクラスターを同定するステップ;
(vi)配列の少なくとも1つのクラスターを選択するステップであって、選択されたクラスター内の配列は、異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく関連している第1の分子タグ及び第2の分子タグを含むステップ、
をさらに含み、前記第1の標的鋳型核酸分子の配列は、ステップ(vi)で選択されたクラスターにおける配列から再構築される、上記[2]〜[8]のいずれかに記載の方法。
[10] ステップ(vi)が、前記少なくとも2つのタグ化鋳型核酸分子の配列のクラスターの群を同定するステップであって、それぞれの群のクラスター内の配列は、互いに相同である第1の分子タグを有する、ステップ、及び/又は前記少なくとも2つのタグ化鋳型核酸分子の配列のクラスターの群を同定するステップであって、それぞれの群のクラスター内の配列は、互いに相同である第2の分子タグを有する、ステップ、及び配列のクラスターの群からクラスターを選択するステップであって、選択されたクラスターは、最も大きい数の配列を含有する、ステップからなる、上記[9]に記載の方法。
[11] 少なくとも1つの個々の標的鋳型核酸分子の配列を決定する方法であって、以下のステップ:
(a)少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含むデータを得るステップであって、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは一端に第1の分子タグ及び他端に第2の分子タグを含み、それぞれの標的鋳型核酸分子は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含む、ステップ;
(b)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の領域の配列を含むデータを分析して、互いに相同である第1の分子タグ及び互いに相同である第2の分子タグを含む配列を同じクラスターに割り当てることによって、同じ鋳型核酸分子に対応する可能性のある配列のクラスターを同定するステップ;
(c)配列の少なくとも1つのクラスターを選択するステップであって、選択されたクラスター内の配列は、異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく関連している第1の分子タグ及び第2の分子タグを含む、ステップ;
(d)ステップ(c)で選択されたクラスターにおける分子の配列の少なくともサブセットを整列させ、これらの配列からコンセンサス配列を定義することによって、第1の標的鋳型核酸分子のコンセンサス配列を再構築するステップ; 及び
(e)第2の及び/又はさらなる標的鋳型核酸分子に関してステップ(c)〜(d)を実施するステップ
を含む、方法。
[12] 前記少なくとも2つのタグ化鋳型核酸分子の配列のクラスターの群を同定するステップであって、それぞれの群のクラスター内の配列は、互いに相同である5'分子タグを有する、ステップ、及び/又は前記少なくとも2つのタグ化鋳型核酸分子の配列のクラスターの群を同定するステップであって、それぞれの群のクラスター内の配列は、互いに相同である3'分子タグを有する、ステップ、及び配列のクラスターの群からクラスターを選択するステップであって、選択されたクラスターは、最も大きい数の配列を含有する、ステップからなる、上記[1](iv)の方法ステップ、又は上記[11](c)の方法ステップ。
[13] 少なくとも1つの標的鋳型核酸分子の配列を決定する方法であって、
(a)配列のクラスターを含むデータを得るステップ;
(b)選択されたクラスターにおける配列の少なくともサブセットの配列を整列させることによって、第1の鋳型核酸分子のコンセンサス配列を再構築するステップ;
を含み、選択されたクラスターにおける配列は、少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含み、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、一端に第1の分子タグ及び他端に第2の分子タグを含み、該少なくとも2つの標的鋳型核酸分子のそれぞれは、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含み、
選択されたクラスターにおけるそれぞれの配列は、
(i)そのクラスターにおける他の配列の第1の分子タグに相同である第1の分子タグ、及びそのクラスターにおける他の配列の第2の分子タグに相同である第2の分子タグを含み; (ii)異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく関連している第1の分子タグ及び第2の分子タグを含む、方法。
[14] 同じクラスターの配列の第1の分子タグが、互いに少なくとも90%の配列同一性を有する、上記[4]〜[13]のいずれかに記載の方法。
[15] 同じクラスターの配列の第2の分子タグが、互いに少なくとも90%の配列同一性を有する、上記[4]〜[14]のいずれかに記載の方法。
[16] ステップ(g)が、コンピュータによって実行される方法ステップである、上記[2]〜[4]のいずれかに記載の方法、又はステップ(e)が、コンピュータによって実行される方法ステップである、上記[10]に記載の方法。
[17] コンピュータによって実行される方法である、上記[4]又は[10]に記載の方法。
[18] 前記領域が、前記第1の分子タグ又は前記第2の分子タグを含む25個を超える塩基対を含む、上記[1]〜[17]のいずれかに記載の方法。
[19] 前記領域が、配列決定される前記少なくとも2つのタグ化鋳型核酸分子の全長を含む、上記[1]〜[18]のいずれかに記載の方法。
[20] ステップ(e)及び/又は(f)が、ブリッジPCRのステップを含む配列決定技術を用いて実施される、上記[2]〜[4]のいずれかに記載の方法、又はステップ(d)が、ブリッジPCRのステップを含む配列決定技術を用いて実施される、上記[10]に記載の方法。
[21] ブリッジPCRのステップが、15秒を超える伸長時間を用いて実施される、上記[20]に記載の方法。
[22] ステップ(e)及び(f)が、異なる配列決定ランで実施される、上記[2]〜[4]のいずれかに記載の方法。
[23] 前記第1の分子タグ及び前記第2の分子タグが、PCR、タグメンテーション(tagmentation)、及び前記少なくとも1つの鋳型核酸分子の物理的せん断若しくは制限消化とその後の5'分子タグ若しくは3'分子タグを含む核酸のライゲーションからなる群より選択される方法を用いて、前記少なくとも2つの鋳型核酸分子に導入される、上記[1]〜[22]のいずれかに記載の方法。
[24] 前記第1の分子タグ及び前記第2の分子タグが、前記第1の分子タグ又は前記第2の分子タグを含む部分と、前記少なくとも2つの鋳型核酸分子にハイブリダイズすることができる配列を有する部分とを含むプライマーを用いたPCRによって、前記少なくとも2つの鋳型核酸分子に導入される、上記[23]に記載の方法。
[25] 前記少なくとも2つの鋳型核酸分子が、微生物リボソーム16Sをコードする、上記[1]〜[24]のいずれかに記載の方法。
[26] 前記少なくとも2つの鋳型核酸分子の少なくとも1つが、10Kbp未満のサイズである、上記[1]〜[25]のいずれかに記載の方法。
[27] 上記[5]、[6]、[11]若しくは[13]に記載の方法、上記[2]の方法ステップ(g)、又は上記[1]の方法ステップ(e)を実施するために適合されたコンピュータプログラムであって、電子デバイス上で実行される、コンピュータプログラム。
[28] 上記[23]に記載のコンピュータプログラムを記憶している、コンピュータ可読媒体。
[29] (i)第1の分子タグ若しくは第2の分子タグを含む部分と、少なくとも2つの鋳型核酸分子にハイブリダイズすることができる配列を有する部分とを含むプライマー;
(ii)上記[1]〜[26]のいずれかに記載の方法をどのように実施するのかを記載した説明書
を含む、キット。
[30] (i)第1の分子タグ若しくは第2の分子タグを含む部分と、少なくとも2つの鋳型核酸分子にハイブリダイズすることができる配列を有する部分とを含むプライマー;
(ii)上記[28]に記載の、コンピュータプログラムを記憶しているコンピュータ可読媒体
を含む、キット。
本方法は、少なくとも1つの個々の標的鋳型核酸分子の配列を生成又は決定する方法を提供する。
本発明のいくつかの態様は、少なくとも2つの標的鋳型核酸分子を含む核酸の少なくとも1つのサンプルを提供するステップを必要とする。場合により、少なくとも2つの標的鋳型核酸分子は、1Kbpを超えるサイズである。
本発明の方法のいくつかは、少なくとも2つの鋳型核酸分子のそれぞれの一端に第1の分子タグを導入し、少なくとも2つの鋳型核酸分子のそれぞれの他端に第2の分子タグを導入して、少なくとも2つのタグ化鋳型核酸分子を提供するステップを含む。本発明の方法のいくつかは、少なくとも2つのタグ化鋳型核酸分子を増幅して、少なくとも2つの鋳型核酸分子の複数コピーを提供するステップを含む。
この方法は、増幅された鋳型核酸分子の一部を単離し、該一部における増幅された鋳型核酸分子を断片化して、複数の断片化鋳型核酸分子を提供するステップを含み得る。
一般に、配列決定ステップは、任意の配列決定法を用いて実施することができる。可能な配列決定法の例としては、マキサム・ギルバート配列決定(Maxam Gilbert Sequencing)、サンガー配列決定(Sanger Sequencing)、又はブリッジPCRを含む配列決定が挙げられる。典型的な実施形態では、配列決定ステップは、ブリッジPCRを含み、場合により、ブリッジPCRステップは、5、10、15又は20秒超の伸長時間を用いて行われる。ブリッジPCRの使用例は、イルミナゲノムアナライザーシーケンサー(Illumina Genome Analyzer Sequencer)におけるものである。
本発明の方法は、少なくとも2つの鋳型核酸分子の少なくとも1つについてのコンセンサス配列を再構築するステップを含み得る。
本発明の1つの態様において、配列の少なくとも1つのクラスターを選択することを含むか又はさらに含む、配列を生成する方法が提供され、ここで、選択されたクラスター内の配列は、第1の分子及び第2の分子タグを含み、これらは、異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく(例えば、少なくとも2倍、少なくとも5倍、少なくとも8倍又は少なくとも10倍よりよく)関連している。
(a)少なくとも2つの標的鋳型核酸分子を含む核酸分子の少なくとも1つのサンプルを提供するステップ;
(b)該少なくとも2つの標的鋳型核酸分子のそれぞれの一端に第1の分子タグを導入し、該少なくとも2つの標的鋳型核酸分子のそれぞれの他端に第2の分子タグを導入して、少なくとも2つのタグ化鋳型核酸分子を提供するステップであって、それぞれのタグ化鋳型核酸分子は固有の第1の分子タグ及び固有の第2の分子タグでタグ化される、ステップ;
(c)該少なくとも2つのタグ化鋳型核酸分子を増幅して、該少なくとも2つのタグ化鋳型核酸分子の複数コピーを提供するステップ;
(d)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の領域を配列決定するステップ; 及び
(e)組換え事象の産物である配列を同定及び無視するステップ
を含み得る。
本発明はさらに、少なくとも2つの鋳型核酸分子の配列を決定する方法を提供する。
本発明の方法は、さらに長い配列について改変され得る。例えば、鋳型核酸分子を断片化することを含む方法において、さらなる分子タグ(例えば、第3及び第4の分子タグ)を断片化鋳型核酸分子に導入するさらなるステップが実施され得る。これにより、断片化された鋳型核酸分子がさらに断片化され、さらなる断片化された鋳型核酸分子が配列決定されることが可能になる。第3の分子タグ及び第4の分子タグの使用は、さらなる断片化された鋳型核酸分子からの全長配列の配列の再構築を可能にする。
本発明のいくつかの態様では、キットが提供される。場合により、これらのキットは、以下の1つ以上を含む:
(i)第1の分子タグ又は第2の分子タグを含む部分と、標的鋳型核酸分子にハイブリダイズすることができる配列を有する部分とを含むプライマーであって、場合により「スタブ領域」を含む、プライマー;
(ii)(i)のプライマーにハイブリダイズすることができる部分を含むプライマー、例えば、「スタブ領域」に相補的な領域を含むプライマー;
(iii)標的鋳型核酸分子を断片化することができる成分、例えば、トランスポザーゼ、制限酵素、又は標的鋳型核酸分子の内部領域に相補的なさらなるプライマー;
(iv)断片化された標的鋳型核酸分子にハイブリダイズすることができる部分を含むプライマー;
(v)例えばポリメラーゼ連鎖反応によって、増幅を行うための試薬;
(vi)本発明の方法をどのように実施するのかを記載した説明書; 及び/又は
(vii)本発明のコンピュータプログラムを記憶しているコンピュータ可読媒体。
足の皮膚からの微生物DNAの抽出
6人の異なる健康な個体の足から採取した皮膚スワブからDNAを抽出した。計12サンプルを採取した。皮膚スワブは、0.15M NaCl及び0.1%Tween 20の溶液中で湿らせたレーヨンスワブを用いて左足又は右足の母指球又はかかと領域を拭くことによって収集した。綿棒を約30秒間皮膚にしっかりと擦った。綿棒の頭をビーズビーティングチューブに切断し、製造業者の説明書に従ってBiOstic Bacteriemia DNA Isolation Kit(Mo-Bio)を用いてDNAをスワブから抽出した。dsDNA HSアッセイ(Life Technologies)を用いてQubit上でDNAを定量した。
イルミナシーケンシングのための短いリード16Sライブラリーの調製
以前に公表された方法(Caporaso et al, 2012, ISME 6(8))を使用して、微生物足皮膚DNAサンプルからイルミナシーケンシングのために、16S遺伝子のV4領域のライブラリーを調製した。簡潔に述べると、12bpではなく8bpサンプルバーコードを含み、フォワード及びリバースプライマーの両方にバーコードを含むように改変されたCaporasoデザインに基づくプライマーを用いてサンプルを増幅した(プライマー配列は図2に記載されている)。V4領域を、改変Caporasoプライマー(Caporaso_フォワード及びCaporaso_リバース)を用いた10サイクルのPCRを用いて、各サンプルについての異なるバーコード化プライマーを使用して、500pgの鋳型DNAから増幅した。磁気ビーズクリーンアップ(Agencourt)を介して余分なプライマーを除去した後、サンプルをプールし、プライマーイルミナ_E_1及びイルミナ_E_2を用いて、イルミナアダプターを含有するアンプリコンを富化するためにさらに20サイクルのPCRに供した(プライマーの詳細については図2を参照)。PCRは、Caporaso et al(2012, ISME 6(8))に記載の条件下で、TaqコアPCRキット(Qiagen)を用いて行った。アンプリコンは、Caporaso et al(2012, ISME 6(8))に記載される方法に従い、イルミナMiSeq上でナノフローセル及び500サイクルV2キットを用いて配列決定した。この方法は「ショートシーケンシング」と称され、この方法を用いて生成されたデータは今後「V4」データと称される。
固有の分子タグを用いたイルミナ配列決定のための全長16Sライブラリーの調製
16S遺伝子の増幅のためのプライマーは、27F(Weisberg et al, J Bacteriol. 1991 Jan;173(2):697-703)又は1391R(Turner et al, Journal of Eukaryotic Microbiology, 1999, 46: 327-338)細菌プライマー配列、8bpバーコード配列、10bpの固有の分子タグ、及び部分的イルミナPEアダプター配列を含有した。プライマー配列(ロング_フォワード及びロング_リバース)を図2に示す。フォワードプライマーとリバースプライマーの両方に10bpの固有の分子タグ(各末端に100億個の可能性のある固有のタグ)を使用することにより、Lundberg et al (Nature Methods, 2013, 10: 999-1002)と同様の方法を用いて、本発明者らは、本発明者らのプール内のそれぞれの16S分子を固有にタグ化することが可能となった。鋳型DNAを、フォワードプライマーを用いた1サイクルのPCRに供し、その後、過剰プライマーを除去するためのビーズクリーンアップが続き、次いで、リバースプライマーを用いたもう1回のサイクルのPCRに供し、その後、もう1回のビーズクリーンアップが続いた。1回目のPCRは、フォワードプライマーからの16S遺伝子の伸長を行い、これは反応物中のそれぞれの異なる16S鋳型分子に固有の分子タグを導入する。2回目のPCRは、1回目のPCRからの伸長産物を鋳型として使用し、両端に固有の分子タグを有する分子を生成する。元の16S分子はまた、2回目のPCR反応において鋳型として作用し得るが、これらの産物は一端に部分的イルミナPEアダプター配列を含有するだけであり、したがって、富化PCRでは増幅されない。富化PCR(34サイクル)は、それぞれのタグ化16S分子の末端における部分的イルミナPEアダプター配列に相補的なプライマー(イルミナプライマーPE_1及びPE_2、図2)を用いて、タグ化16S分子プールを増幅する。
全長タグ化16S PCR産物のタグメンテーション
固有にタグ化された全長16S PCRアンプリコンを、タグメンテーションに供した。タグメンテーション手順は、イルミナプラットフォームで使用するためのアダプター配列を付加しながら、DNAを同時に断片化するためのトランスポザーゼを用いる。タグメンテーションを、Nextera-XTキットを使用し、PCR増幅ステップを除いて、製造業者の説明書に従って行った。ここで、本発明者らは、1つのタグメンテーション反応につき2つのPCRを行った。それぞれは、イルミナ提供のPCRプライマーの1つと、上記の伸長PCRからのプライマーの1つとの組み合わせを用い、目的断片のみを増幅した。本発明者らは、一端にPE_1(16Sアンプリコンのコード配列の5'末端)若しくはPE_2(16Sアンプリコンのコード配列の3'末端)配列、及び他端にi7若しくはi5イルミナアダプター(タグメンテーション反応の間に付加された)をそれぞれ用いて、DNA断片のプールを生成することを目的とした(図2)。これにより、16S遺伝子にわたって断片のプールがもたらされ、これを、全長16Sアンプリコンと共に、MiSeq上でいずれかの末端から配列決定することができる。同じ鋳型分子に由来する配列は、分子のいずれかの末端における固有の分子タグを介して同定され、再構築され、全長16S配列を提供することができる。タグメンテーション反応からのPCR産物を、製造業者の説明書に従って、1.8VのAmpure SPRIビーズを用いて最初に洗浄し、続くタグメンテーション反応では0.6Vビーズを用いて洗浄し、400bpより小さい断片を除去した。
イルミナMiSeqでの全長及びタグメンテーションされた(tagmented)16Sアンプリコンの配列決定
全長16Sタグ化アンプリコン及びタグメンテーション産物の両方のモル濃度を、Bioanalyser高感度DNAチップを介して測定した。1回目の配列決定ランの間、タグメンテーション産物(1.8V Ampure SPRIビーズで洗浄された)のみを1.5pMの平均濃度でロードし、ナノフローセル上で、2×150bpペアエンドリード(paired end read)を用いて、MiSeq試薬キットv2で配列決定した。2回目の配列決定ランのために、全長16Sタグ化アンプリコンを、タグメンテーション産物(<400bpの断片を除去するために0.6V Ampure SPRIビーズで洗浄された)と1:9の比で組み合わせた。プールされたサンプルを6pMの平均モル濃度でロードし、ナノフローセル上で、2×250bpペアエンドリードを用いて、MiSeq試薬キットv2で配列決定した。
タグ化イルミナリードからの全長16S配列の再構築
配列決定は、16S遺伝子全体にわたる断片(末端+末端断片)、及び16S遺伝子の一端を16S遺伝子の中央領域と対合させる断片(末端+内部断片)の2種類の断片に由来するデータを生成する。末端+末端断片に由来する配列は、ランダムバーコードとサンプルバーコードの対合をコードする。
コンセンサス固有分子タグ及び組換え体の除去
配列決定エラーのために、同じ鋳型分子に由来するリードは、わずかに異なる10ntの固有の分子タグ配列を有し得る。タグ化鋳型分子の元の10ntランダムバーコード配列を推定するために、本発明者らは、uclust(Edgar, R. C. (2010) Search and clustering orders of magnitude faster than BLAST, Bioinformatics 26(19), 2460-2461; Edgar, R.C. (2013) UPARSE: Highly accurate OTU sequences from microbial amplicon reads, Nature methods)アルゴリズムを適用して、>89%同一性(例えば、10塩基のうち1塩基はミスマッチが許容される)でマッチするランダムバーコード配列のクラスターを同定し、これらのクラスターのコンセンサス配列を報告する。本発明者らはまず、末端+末端断片のランダムバーコードのクラスターを同定する。本発明者らは、次いで、それぞれの10ntランダムバーコードを有する最も豊富なクラスターを同定し、異なる、より豊富なクラスターにおいて見出された10ntランダムバーコードを含有する任意のクラスターを破棄する。このステップは、インビトロ組換えにより生じたランダムバーコードの組み合わせを同定し、破棄することを目的とする。組換え型は、親鋳型よりも少ない量である可能性がある(図3)。本発明者らは、任意の2Kbp断片を配列決定する場合、そのようなインビトロ組換えは、鋳型分子プールの多様性のために非常に頻繁に起こるとは予想されないことに留意する。組換え検出は、16Sについてなど、アンプリコン配列決定プロトコルへの適用にとって最も重要である。
リードクラスターのアセンブリ
リードクラスターは、同じ鋳型分子に高い確率で由来するリードを含有する。本発明者らは、可能な限り多くの元の鋳型分子を再構築するために、リードクラスター上にデノボアセンブリアルゴリズムを適用する。リードを、A5-miseqパイプライン(Tritt et al (2012) An integrated pipeline for de Novo assembly of Microbial Genomes, PLoS One)を使用してアセンブルする。A5-miseqは元のA5パイプラインの改訂版であり、それを拡張して、最大500nt長までのリードのアセンブリをサポートし、アダプター配列を含有するリードを破棄するのではなく、リードからアダプター配列を取り除く。
16Sリードの分析
12個の足サンプルを全長プロトコルを用いて配列決定し、そのうち6個を本方法で2回配列決定した。全12個のサンプルをまた、Caparoso et al(2012)の方法を用いて配列決定した。
合計296864個のペアエンドV4配列を、12個の足サンプル並びに陽性(大腸菌DNAのみ)及び陰性(綿棒のみ)対照から生成した。これらの配列のうち、11240個は、不正確なフォワード及びリバースバーコードの組み合わせのためにサンプルに割り当てることができず、このことは、少なくとも3.8%の組換え率を示した。240938個の配列を12個の足サンプルにマッピングし、これは、品質フィルタリング後に240426個に減少した(各サンプルに割り当てられた配列の数については以下の表1を参照)。QIIMEにおける閉鎖基準法を用いてクラスター化されたOTUは、2つ以上の配列を含有する97%の類似性で1177個のOTUを生じた。これらのOTUの分類学的分布は、皮膚コミュニティについて以前に報告されたものと同様であり、フィルミクテス(Firmicutes)(79.6%±25.7)、アクチノバクテリア(Actinobacteria)(9.3%±12.9)、及びプロテオバクテリア(Proteobacteria)(9.9%±22.2)が優位を占めた。
3914個の16S配列をアセンブルし、これらのうちの2030個が1000bpよりも長かった(図4)。2957個の配列を足サンプルに割り当て、一方、957個の配列は、不正確な分子タグの組み合わせのために、サンプルに割り当てることができなかった。ショートシーケンシング法で配列決定されたものに対応するV4領域を含有するリードのみを下流分析に使用し、これらの配列を、700bpより短い配列及び1500bpより長い配列を除去することによってQIIMEで品質フィルタリングした。これにより、分析に使用される2351個の配列がもたらされた(各サンプルにいくつの配列が割り当てられたかについての詳細は、表1を参照)。
OTUレベルでの比較
アセンブルされた16S配列(756から1375まで様々な長さ)を、QIIMEにおける閉鎖基準法を用いてOTUにクラスター化し、同様にクラスター化された、マッチしたサンプルV4データと平均30.1%(±6.8)のみのOTUを共有した。これは、異なる長さのデータセットを比較すること、及びOTUがQIIMEにおいてクラスター化される方法に起因し得る。配列を、97%の類似性でOTUに予めクラスター化されている配列のデータベースに対してベストマッチによってOTUに割り当てる。おそらく、データセットに由来する全長配列を用いてOTUをクラスター化し、全長16S遺伝子にわたって97%類似するクラスターは、V4領域のみでは97%類似しないかもしれない。16S遺伝子の異なる領域は異なる速度で進化するためである(Schloss PD (2010) The Effects of Alignment Quality, Distance Calculation Method, Sequence Filtering, and Region on the Analysis of 16S rRNA Gene-Based Studies. Plos Computational Biology 6)。したがって、本発明者らは、長い配列(ロング-V4配列)のV4領域のみからクラスター化されたOTUを分析した。この場合、92.2%(±12.1)のOTUが、マッチしたCaporasoサンプルOTUと共有された(表3)。ロングデータセットではより低カバレージの配列決定が得られ、続いて、全体でずっと少ないOTUであったが、このことは、得られたデータが短いV4配列を使用して得られたデータと広く一致している(concurrent)ことを示す。興味深いことに、長い配列は、ロング-V4配列よりも約50%多くのOTUにクラスター化し、このことは、16S分子あたりより多くの配列情報を用いて達成可能なより高感度の分類を実証している。
大腸菌(E. coli)K12 MG1655由来の長い断片の配列決定
大腸菌K12 MG1655由来のゲノムDNAをタグメンテーションし、アガロースゲル電気泳動を用いて1.5〜3kbpの断片をサイズ選択した。分子タギングを、ランダムバーコードを用いた2サイクルPCRを介して、これらの断片に適用した。プールの最初の配列決定は、全長鋳型の再構築が実行不可能であるほど、鋳型分子間の過剰な多様性を明らかにした。鋳型分子の集団が、全長鋳型の成功した配列決定及び再構築について妨げられる適切な程度を、希釈系列を使用して決定した(図7)。50倍希釈及び100倍希釈の両方をフィルイン(fill-in)リードで配列決定した。
Claims (14)
- 少なくとも1つの個々の標的鋳型核酸分子の配列を決定する方法であって、
(a)少なくとも2つの標的鋳型核酸分子を含む核酸分子の少なくとも1つのサンプルを提供するステップ;
(b)該少なくとも2つの標的鋳型核酸分子のそれぞれの一端に第1の分子タグを導入し、該少なくとも2つの標的鋳型核酸分子のそれぞれの他端に第2の分子タグを導入して、少なくとも2つのタグ化鋳型核酸分子を提供するステップであって、それぞれのタグ化鋳型核酸分子は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化される、ステップ;
(c)該少なくとも2つのタグ化鋳型核酸分子を増幅して、該少なくとも2つのタグ化鋳型核酸分子の複数コピーを提供するステップ;
(d)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の領域を配列決定するステップ; 及び
(e)該少なくとも2つの標的鋳型核酸分子の少なくとも1つについてコンセンサス配列を再構築するステップ
を含み、ステップ(e)は、
(i)互いに相同である第1の分子タグ配列及び互いに相同である第2の分子タグ配列を含む配列を同じクラスターに割り当てることによって、同じ標的鋳型核酸分子に対応する可能性のある該少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列のクラスターを同定するステップであって、互いに相同である第1の分子タグが、互いに少なくとも90%の配列同一性を有し、及び、互いに相同であるの第2の分子タグが、互いに少なくとも90%の配列同一性を有する、ステップ;
(ii)配列の少なくとも1つのクラスターを選択するステップであって、該選択されたクラスター内の配列は、異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく関連している第1の分子タグ及び第2の分子タグを含む、ステップ;
(iii)ステップ(ii)で選択されたクラスターにおける少なくとも2つの鋳型核酸分子の配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の標的鋳型核酸分子のコンセンサス配列を再構築するステップ; 及び
(iv)第2の及び/又はさらなる鋳型核酸分子に関してステップ(ii)〜(iii)を実施するステップ
を含む、方法。 - サイズが1Kbpを超える少なくとも1つの個々の標的鋳型核酸分子の配列を決定する方法であって、
(a)サイズが1Kbpを超える少なくとも2つの標的鋳型核酸分子を含む核酸分子の少なくとも1つのサンプルを提供するステップ;
(b)該少なくとも2つの標的鋳型核酸分子のそれぞれの一端に第1の分子タグを導入し、該少なくとも2つの標的鋳型核酸分子のそれぞれの他端に第2の分子タグを導入して、少なくとも2つのタグ化鋳型核酸分子を提供するステップであって、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、固有の第1の分子タグ及び固有の第2の分子タグでタグ化される、ステップ;
(c)該少なくとも2つのタグ化鋳型核酸分子を増幅して、該少なくとも2つのタグ化鋳型核酸分子の複数コピーを提供するステップ;
(d)該少なくとも2つのタグ化鋳型核酸分子の複数コピーの一部を単離し、該一部における該タグ化鋳型核酸分子を断片化して、複数の断片化鋳型核酸分子を提供するステップ; (e)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域を配列決定するステップ;
(f)該複数の断片化鋳型核酸分子を配列決定するステップ; 及び
(g)ステップ(f)において生成された配列の少なくともサブセットを含む配列から、該少なくとも2つの標的鋳型核酸分子の少なくとも1つについてのコンセンサス配列を再構築するステップ
を含み、
ここでステップ(g)は、
(i)互いに相同である第1の分子タグ配列及び互いに相同である第2の分子タグ配列を含む配列を同じクラスターに割り当てることによって、同じ個々の標的鋳型核酸分子に対応する可能性のある前記少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列のクラスターを同定するステップであって、互いに相同である第1の分子タグが、互いに少なくとも90%の配列同一性を有し、及び、互いに相同である第2の分子タグが、互いに少なくとも90%の配列同一性を有する、ステップ;
(ii)前記複数の断片化鋳型核酸分子の配列を分析して、第1のクラスターの配列の第1の分子タグに相同である第1の分子タグ又は第1のクラスターの配列の第2の分子タグに相同である第2の分子タグを含む、複数の断片化鋳型核酸分子の配列を同定するステップであって、互いに相同である第1の分子タグが、互いに少なくとも90%の配列同一性を有し、及び、互いに相同である第2の分子タグが、互いに少なくとも90%の配列同一性を有する、ステップ;
(iii)ステップ(ii)で同定された複数の断片化鋳型核酸分子の配列の少なくともサブセットを含む配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の鋳型核酸分子の配列を再構築するステップ; 及び
(iv)第2の及び/又はさらなる鋳型核酸分子に関してステップ(i)〜(iii)を実施するステップ;
を含む、方法。 - (A)前記複数の断片化鋳型分子を富化し、前記第1の分子タグ又は前記第2の分子タグを含む前記複数の断片化鋳型核酸分子の割合を増加させるステップをさらに含み、このステップは、ステップ(f)の前にあり、及び/又は
(B)ステップ(g)が、コンピュータによって実行されるステップであり、及び/又は
(C)ステップ(e)及び/又は(f)が、ブリッジPCRのステップを含む配列決定技術を用いて実施される、及び/又は
(D)ステップ(e)及び(f)が、異なる配列決定ランで実施される、
請求項2に記載の方法。 - 少なくとも1つの個々の標的鋳型核酸分子の配列を決定するための、コンピューターによって実行される方法であって、以下のステップ:
(a)少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含むデータを得るステップであって、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは一端に第1の分子タグ及び他端に第2の分子タグを含み、それぞれの標的鋳型核酸分子は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含む、ステップ;
(b)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の領域の配列を含むデータを分析して、互いに相同である第1の分子タグ及び互いに相同である第2の分子タグを含む配列を同じクラスターに割り当てることによって、同じ個々の標的鋳型核酸分子に対応する可能性のある配列のクラスターを同定するステップであって、互いに相同である第1の分子タグが、互いに少なくとも90%の配列同一性を有し、及び、互いに相同である第2の分子タグが、互いに少なくとも90%の配列同一性を有する、ステップ;
(c)該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を含むデータを得るステップであって、該断片のそれぞれは、該第1の分子タグ又は該第2の分子タグのいずれかを含む、ステップ;
(d)該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を分析して、第1のクラスターの配列の第1の分子タグに相同である第1の分子タグ又は第1のクラスターの配列の第2の分子タグに相同である第2の分子タグを含む、該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を同定するステップであって、互いに相同である第1の分子タグが、互いに少なくとも90%の配列同一性を有し、及び、互いに相同である第2の分子タグが、互いに少なくとも90%の配列同一性を有する、ステップ;
(e)ステップ(d)で同定された該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列の少なくともサブセットを含む配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の標的鋳型核酸分子の配列を再構築するステップ; 及び
(f)第2の及び/又はさらなる標的鋳型核酸分子に関してステップ(c)〜(e)を実施するステップであって、互いに相同である第1の分子タグが、互いに少なくとも90%の配列同一性を有し、及び、互いに相同である第2の分子タグが、互いに少なくとも90%の配列同一性を有する、ステップ
を含む、方法。 - 少なくとも1つの標的鋳型核酸分子の配列を決定するための、コンピューターによって実行される方法であって、以下のステップ:
(a)配列のクラスターを含むデータを得るステップ、ここで:
(i)それぞれのクラスターは、少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含み、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、一端に第1の分子タグ及び他端に第2の分子タグを含み、それぞれの標的鋳型核酸は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含み;
(ii)それぞれのクラスターは、該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列を含み、該断片のそれぞれは、該第1の分子タグ又は該第2の分子タグのいずれかを含み;
(iii)それぞれのクラスターにおける少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列は、互いに相同である第1の分子タグ及び第2の分子タグを含み;
(iv)該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列は、そのクラスターにおける少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列の第1の分子タグに相同である第1の分子タグ、又はそのクラスターにおける該少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列の第2の分子タグに相同である第2の分子タグを含み、ここで、互いに相同である第1の分子タグが、互いに少なくとも90%の配列同一性を有し、及び、互いに相同である第2の分子タグが、互いに少なくとも90%の配列同一性を有する;
(b)第1のクラスターにおける該少なくとも2つのタグ化鋳型核酸分子の複数断片の配列の少なくともサブセットを含む配列を整列させ、これらの配列からコンセンサス配列を定義することによって、第1の標的鋳型核酸分子の配列を再構築するステップ; 及び
(c)第2の及び/又はさらなる鋳型核酸分子に関してステップ(b)を実施するステップ
を含む、方法。 - 以下のステップ:
(v)互いに相同である第1の分子タグ配列及び互いに相同である第2の分子タグ配列を含む配列を同じクラスターに割り当てることによって、同じ鋳型核酸分子に対応する可能性のある前記少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列のクラスターを同定するステップ;
(vi)配列の少なくとも1つのクラスターを選択するステップであって、選択されたクラスター内の配列は、異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく関連している第1の分子タグ及び第2の分子タグを含むステップ、
をさらに含み、前記第1の標的鋳型核酸分子の配列は、ステップ(vi)で選択されたクラスターにおける配列から再構築される、
請求項2〜5のいずれか一項に記載の方法。 - (A)ステップe)が、コンピュータによって実行されるステップであり、及び/又は (B)ステップd)が、ブリッジPCRのステップを含む配列決定技術を用いて実施される、
請求項1に記載の方法。 - 少なくとも1つの個々の標的鋳型核酸分子の配列を決定するための、コンピュータによって実行される方法であって、以下のステップ:
(a)少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含むデータを得るステップであって、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは一端に第1の分子タグ及び他端に第2の分子タグを含み、それぞれの標的鋳型核酸分子は、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含む、ステップ;
(b)該第1の分子タグ及び該第2の分子タグを含む該少なくとも2つのタグ化鋳型核酸分子の領域の配列を含むデータを分析して、互いに相同である第1の分子タグ及び互いに相同である第2の分子タグを含む配列を同じクラスターに割り当てることによって、同じ鋳型核酸分子に対応する可能性のある配列のクラスターを同定するステップであって、互いに相同である第1の分子タグが、互いに少なくとも90%の配列同一性を有し、及び、互いに相同である第2の分子タグが、互いに少なくとも90%の配列同一性を有する、ステップ;
(c)配列の少なくとも1つのクラスターを選択するステップであって、該選択されたクラスター内の配列は、異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく関連している第1の分子タグ及び第2の分子タグを含む、ステップ;
(d)ステップ(c)で選択されたクラスターにおける分子の配列の少なくともサブセットを整列させ、これらの配列からコンセンサス配列を定義することによって、第1の標的鋳型核酸分子のコンセンサス配列を再構築するステップ; 及び
(e)第2の及び/又はさらなる標的鋳型核酸分子に関してステップ(c)〜(d)を実施するステップ
を含む、方法。 - 配列の少なくとも1つのクラスターを選択する前記ステップであって、
前記少なくとも2つのタグ化鋳型核酸分子の配列のクラスターの群を同定するステップであって、それぞれの群のクラスター内の配列は、互いに相同である第1の分子タグを有する、ステップ、及び/又は前記少なくとも2つのタグ化鋳型核酸分子の配列のクラスターの群を同定するステップであって、それぞれの群のクラスター内の配列は、互いに相同である第2の分子タグを有する、ステップと、
配列のクラスターの群からクラスターを選択するステップであって、選択されたクラスターは、最も大きい数の配列を含有する、ステップと、
からなり、
ここで、互いに相同である第1の分子タグが、互いに少なくとも90%の配列同一性を有し、及び、互いに相同である第2の分子タグが、互いに少なくとも90%の配列同一性を有する、請求項1又は請求項8の方法。 - 少なくとも1つの標的鋳型核酸分子の配列を決定するための、コンピュータによって実行される方法であって、
(a)配列のクラスターを含むデータを得るステップ;
(b)選択されたクラスターにおける配列の少なくともサブセットの配列を整列させることによって、第1の鋳型核酸分子のコンセンサス配列を再構築するステップ;
を含み、選択されたクラスターにおける配列は、少なくとも2つのタグ化鋳型核酸分子の複数コピーの領域の配列を含み、該少なくとも2つのタグ化鋳型核酸分子のそれぞれは、一端に第1の分子タグ及び他端に第2の分子タグを含み、該少なくとも2つの標的鋳型核酸分子のそれぞれは、固有の第1の分子タグ及び固有の第2の分子タグでタグ化され、該領域は、該第1の分子タグ及び該第2の分子タグを含み、
選択されたクラスターにおけるそれぞれの配列は、
(i)そのクラスターにおける他の配列の第1の分子タグに相同である第1の分子タグ、及びそのクラスターにおける他の配列の第2の分子タグに相同である第2の分子タグを含み、ここで、互いに相同である第1の分子タグが、互いに少なくとも90%の配列同一性を有し、及び、互いに相同である第2の分子タグが、互いに少なくとも90%の配列同一性を有し;
(ii)異なる第1の分子タグ又は第2の分子タグとよりも互いによりよく関連している第1の分子タグ及び第2の分子タグを含む、方法。 - コンピュータによって実行される方法である、請求項3、6又は7に記載の方法。
- (A)前記領域が、前記第1の分子タグ又は前記第2の分子タグを含む25個を超える塩基対を含む、及び/又は
(B)前記領域が、配列決定される前記少なくとも2つのタグ化鋳型核酸分子の全長を含む、及び/又は
(C)前記第1の分子タグ及び前記第2の分子タグが、PCR、タグメンテーション(tagmentation)、及び前記少なくとも1つの鋳型核酸分子の物理的せん断若しくは制限消化とその後の5'分子タグ若しくは3'分子タグを含む核酸のライゲーションからなる群より選択される方法を用いて、前記少なくとも2つの鋳型核酸分子に導入される、及び/又は
(D)前記少なくとも2つの鋳型核酸分子が、微生物リボソーム16Sをコードする、及び/又は
(E)前記少なくとも2つの鋳型核酸分子の少なくとも1つが、10Kbp未満のサイズである、請求項1〜11のいずれか一項に記載の方法。 - 請求項4、5、8、若しくは10に記載の方法を実施するために適合されたコンピュータプログラムであって、電子デバイス上で実行される、コンピュータプログラム。
- 請求項13に記載のコンピュータプログラムを記憶している、コンピュータ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1409282.9 | 2014-05-23 | ||
GBGB1409282.9A GB201409282D0 (en) | 2014-05-23 | 2014-05-23 | Sequencing process |
PCT/GB2015/051518 WO2015177570A1 (en) | 2014-05-23 | 2015-05-22 | Sequencing process |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017517282A JP2017517282A (ja) | 2017-06-29 |
JP2017517282A5 JP2017517282A5 (ja) | 2018-08-16 |
JP6687605B2 true JP6687605B2 (ja) | 2020-04-22 |
Family
ID=51177418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017513371A Active JP6687605B2 (ja) | 2014-05-23 | 2015-05-22 | 配列決定プロセス |
Country Status (12)
Country | Link |
---|---|
US (2) | US11047002B2 (ja) |
EP (1) | EP3146070B1 (ja) |
JP (1) | JP6687605B2 (ja) |
KR (3) | KR20230141873A (ja) |
CN (2) | CN107002120B (ja) |
AU (1) | AU2015263055B2 (ja) |
CA (1) | CA2949925A1 (ja) |
DK (1) | DK3146070T5 (ja) |
ES (1) | ES2697804T3 (ja) |
GB (1) | GB201409282D0 (ja) |
SG (1) | SG11201609754QA (ja) |
WO (1) | WO2015177570A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11397882B2 (en) | 2016-05-26 | 2022-07-26 | Becton, Dickinson And Company | Molecular label counting adjustment methods |
KR20190077061A (ko) * | 2016-11-08 | 2019-07-02 | 셀룰러 리서치, 인크. | 세포 표지 분류 방법 |
CN117594126A (zh) | 2016-11-08 | 2024-02-23 | 贝克顿迪金森公司 | 用于表达谱分类的方法 |
KR101798229B1 (ko) * | 2016-12-27 | 2017-12-12 | 주식회사 천랩 | 전장 리보솜 rna 서열정보를 얻는 방법 및 상기 리보솜 rna 서열정보를 이용하여 미생물을 동정하는 방법 |
JP7171709B2 (ja) | 2017-09-20 | 2022-11-15 | ライフ テクノロジーズ コーポレイション | 圧縮分子タグ付き核酸配列データを用いた融合の検出のための方法 |
CN111247589A (zh) * | 2017-09-25 | 2020-06-05 | 贝克顿迪金森公司 | 免疫受体条形码错误校正 |
AU2018348092A1 (en) * | 2017-10-09 | 2020-05-14 | Psomagen, Inc. | Single molecule sequencing and unique molecular identifiers to characterize nucleic acid sequences |
JPWO2019132010A1 (ja) * | 2017-12-28 | 2021-01-21 | タカラバイオ株式会社 | 塩基配列における塩基種を推定する方法、装置及びプログラム |
US20210174905A1 (en) * | 2018-08-13 | 2021-06-10 | Longas Technologies Pty Ltd. | Sequencing Algorithm |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006137734A1 (en) | 2005-06-23 | 2006-12-28 | Keygene N.V. | Improved strategies for sequencing complex genomes using high throughput sequencing technologies |
US8932812B2 (en) | 2009-12-17 | 2015-01-13 | Keygene N.V. | Restriction enzyme based whole genome sequencing |
BR112012032586B1 (pt) | 2010-06-30 | 2021-08-17 | Bgi Genomics Co., Ltd | Métodos para determinar a sequência nucleotídica de um ácido nucléico de interesse e para determinar o genótipo hla em uma amostra |
US9033273B2 (en) | 2010-11-02 | 2015-05-19 | Jonathan Edelson | Integrated aircraft ground navigation control system |
CN110016499B (zh) | 2011-04-15 | 2023-11-14 | 约翰·霍普金斯大学 | 安全测序系统 |
SG194745A1 (en) * | 2011-05-20 | 2013-12-30 | Fluidigm Corp | Nucleic acid encoding reactions |
EP2820174B1 (en) | 2012-02-27 | 2019-12-25 | The University of North Carolina at Chapel Hill | Methods and uses for molecular tags |
WO2013142389A1 (en) | 2012-03-20 | 2013-09-26 | University Of Washington Through Its Center For Commercialization | Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing |
US10081807B2 (en) | 2012-04-24 | 2018-09-25 | Gen9, Inc. | Methods for sorting nucleic acids and multiplexed preparative in vitro cloning |
WO2014047556A1 (en) | 2012-09-21 | 2014-03-27 | The Broad Institute, Inc. | Compositions and methods for long insert, paired end libraries of nucleic acids in emulsion droplets |
-
2014
- 2014-05-23 GB GBGB1409282.9A patent/GB201409282D0/en not_active Ceased
-
2015
- 2015-05-22 CA CA2949925A patent/CA2949925A1/en active Pending
- 2015-05-22 JP JP2017513371A patent/JP6687605B2/ja active Active
- 2015-05-22 CN CN201580039895.2A patent/CN107002120B/zh active Active
- 2015-05-22 KR KR1020237031371A patent/KR20230141873A/ko active Application Filing
- 2015-05-22 DK DK15727042.2T patent/DK3146070T5/en active
- 2015-05-22 US US15/313,705 patent/US11047002B2/en active Active
- 2015-05-22 SG SG11201609754QA patent/SG11201609754QA/en unknown
- 2015-05-22 KR KR1020167036033A patent/KR102363284B1/ko active IP Right Grant
- 2015-05-22 KR KR1020227004592A patent/KR102579902B1/ko active IP Right Grant
- 2015-05-22 CN CN202210864432.1A patent/CN116072218A/zh active Pending
- 2015-05-22 WO PCT/GB2015/051518 patent/WO2015177570A1/en active Application Filing
- 2015-05-22 ES ES15727042T patent/ES2697804T3/es active Active
- 2015-05-22 AU AU2015263055A patent/AU2015263055B2/en active Active
- 2015-05-22 EP EP15727042.2A patent/EP3146070B1/en active Active
-
2021
- 2021-05-24 US US17/329,069 patent/US20210403991A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2015177570A1 (en) | 2015-11-26 |
KR102363284B1 (ko) | 2022-02-15 |
KR20230141873A (ko) | 2023-10-10 |
US20210403991A1 (en) | 2021-12-30 |
GB201409282D0 (en) | 2014-07-09 |
KR20220025213A (ko) | 2022-03-03 |
DK3146070T5 (en) | 2019-01-21 |
ES2697804T3 (es) | 2019-01-28 |
CN107002120A (zh) | 2017-08-01 |
SG11201609754QA (en) | 2016-12-29 |
CN107002120B (zh) | 2022-08-09 |
CN116072218A (zh) | 2023-05-05 |
JP2017517282A (ja) | 2017-06-29 |
KR20170012390A (ko) | 2017-02-02 |
CA2949925A1 (en) | 2015-11-26 |
EP3146070B1 (en) | 2018-09-26 |
US11047002B2 (en) | 2021-06-29 |
EP3146070A1 (en) | 2017-03-29 |
KR102579902B1 (ko) | 2023-09-18 |
AU2015263055B2 (en) | 2020-12-03 |
AU2015263055A1 (en) | 2016-12-08 |
US20170183724A1 (en) | 2017-06-29 |
DK3146070T3 (en) | 2019-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6687605B2 (ja) | 配列決定プロセス | |
Besser et al. | Next-generation sequencing technologies and their application to the study and control of bacterial infections | |
Burke et al. | A method for high precision sequencing of near full-length 16S rRNA genes on an Illumina MiSeq | |
Van Dijk et al. | Ten years of next-generation sequencing technology | |
Di Bella et al. | High throughput sequencing methods and analysis for microbiome research | |
Shendure et al. | Next-generation DNA sequencing | |
US20130261196A1 (en) | Nucleic Acids For Multiplex Organism Detection and Methods Of Use And Making The Same | |
EP3289097A1 (en) | Error suppression in sequenced dna fragments using redundant reads with unique molecular indices (umis) | |
Thomson et al. | Developing markers for multilocus phylogenetics in non-model organisms: a test case with turtles | |
US20170357665A1 (en) | Systems and methods for genomic manipulations and analysis | |
Larson et al. | A clinician’s guide to bioinformatics for next-generation sequencing | |
AU2012316218B2 (en) | Algorithms for sequence determinations | |
Del Chierico et al. | Choice of next-generation sequencing pipelines | |
Eché et al. | A Bos taurus sequencing methods benchmark for assembly, haplotyping, and variant calling | |
Shetty et al. | Introduction to nucleic acid sequencing | |
CN115867665A (zh) | 嵌合扩增子阵列测序 | |
WO2017009718A1 (en) | Automatic processing selection based on tagged genomic sequences | |
Silva et al. | Transcriptome Analysis Using RNA-seq and scRNA-seq | |
Mitra et al. | Statistical analyses of next generation sequencing data: an overview | |
Piro | Sequencing technologies for epigenetics: From basics to applications | |
Barbaro | Overview of NGS platforms and technological advancements for forensic applications | |
Ismail | Bioinformatics: A Practical Guide to Next Generation Sequencing Data Analysis | |
Kotta-Loizou | Genome Sequencing | |
Udayaraja | Personal diagnostics using DNA-sequencing | |
Neiman | Methods for deep examination of DNA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20170524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180522 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180704 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180704 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20180720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180807 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190207 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20190328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190328 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190625 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190919 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200402 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6687605 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |