KR20240004617A - 시퀀싱 컨트롤 - Google Patents
시퀀싱 컨트롤 Download PDFInfo
- Publication number
- KR20240004617A KR20240004617A KR1020237040574A KR20237040574A KR20240004617A KR 20240004617 A KR20240004617 A KR 20240004617A KR 1020237040574 A KR1020237040574 A KR 1020237040574A KR 20237040574 A KR20237040574 A KR 20237040574A KR 20240004617 A KR20240004617 A KR 20240004617A
- Authority
- KR
- South Korea
- Prior art keywords
- dna
- sequence
- standards
- artificial
- rna
- Prior art date
Links
- 238000012163 sequencing technique Methods 0.000 title abstract description 140
- 238000000034 method Methods 0.000 claims abstract description 233
- 230000002068 genetic effect Effects 0.000 abstract description 30
- 238000007481 next generation sequencing Methods 0.000 abstract description 15
- 238000012165 high-throughput sequencing Methods 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 1510
- 210000004507 artificial chromosome Anatomy 0.000 description 357
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 313
- 102000040430 polynucleotide Human genes 0.000 description 215
- 108091033319 polynucleotide Proteins 0.000 description 215
- 239000002157 polynucleotide Substances 0.000 description 215
- 239000000203 mixture Substances 0.000 description 200
- 108090000623 proteins and genes Proteins 0.000 description 160
- 239000002773 nucleotide Substances 0.000 description 156
- 239000000523 sample Substances 0.000 description 153
- 125000003729 nucleotide group Chemical group 0.000 description 152
- 241000282414 Homo sapiens Species 0.000 description 104
- 108700028369 Alleles Proteins 0.000 description 96
- 230000000813 microbial effect Effects 0.000 description 87
- 239000012634 fragment Substances 0.000 description 77
- 230000035772 mutation Effects 0.000 description 72
- 108010029485 Protein Isoforms Proteins 0.000 description 71
- 102000001708 Protein Isoforms Human genes 0.000 description 69
- 230000004927 fusion Effects 0.000 description 69
- 108091028043 Nucleic acid sequence Proteins 0.000 description 67
- 230000035945 sensitivity Effects 0.000 description 62
- 239000013614 RNA sample Substances 0.000 description 59
- 238000004458 analytical method Methods 0.000 description 57
- 239000013615 primer Substances 0.000 description 54
- 238000003780 insertion Methods 0.000 description 49
- 230000037431 insertion Effects 0.000 description 49
- 230000007614 genetic variation Effects 0.000 description 48
- 210000004027 cell Anatomy 0.000 description 46
- 210000000349 chromosome Anatomy 0.000 description 40
- 239000013598 vector Substances 0.000 description 39
- 238000001514 detection method Methods 0.000 description 35
- 230000008569 process Effects 0.000 description 35
- 230000014509 gene expression Effects 0.000 description 34
- 108700005078 Synthetic Genes Proteins 0.000 description 33
- 238000012217 deletion Methods 0.000 description 33
- 230000037430 deletion Effects 0.000 description 33
- 238000011002 quantification Methods 0.000 description 32
- 108700024394 Exon Proteins 0.000 description 31
- 239000002689 soil Substances 0.000 description 30
- 238000005516 engineering process Methods 0.000 description 29
- 230000003321 amplification Effects 0.000 description 26
- 238000003199 nucleic acid amplification method Methods 0.000 description 26
- 108091092195 Intron Proteins 0.000 description 25
- 238000009826 distribution Methods 0.000 description 25
- 238000005259 measurement Methods 0.000 description 25
- 108020004465 16S ribosomal RNA Proteins 0.000 description 23
- 241000699666 Mus <mouse, genus> Species 0.000 description 23
- 238000012408 PCR amplification Methods 0.000 description 23
- 108091093088 Amplicon Proteins 0.000 description 22
- 230000003252 repetitive effect Effects 0.000 description 22
- 238000010790 dilution Methods 0.000 description 21
- 239000012895 dilution Substances 0.000 description 21
- 201000005249 lung adenocarcinoma Diseases 0.000 description 21
- 239000002096 quantum dot Substances 0.000 description 21
- 238000006467 substitution reaction Methods 0.000 description 21
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 19
- 239000013612 plasmid Substances 0.000 description 19
- 102200055464 rs113488022 Human genes 0.000 description 19
- 230000005945 translocation Effects 0.000 description 19
- 238000002360 preparation method Methods 0.000 description 18
- 238000011160 research Methods 0.000 description 17
- 238000003559 RNA-seq method Methods 0.000 description 15
- 201000010099 disease Diseases 0.000 description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 15
- 238000004519 manufacturing process Methods 0.000 description 15
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 14
- 206010028980 Neoplasm Diseases 0.000 description 14
- 230000008859 change Effects 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 14
- 239000012091 fetal bovine serum Substances 0.000 description 14
- 230000001605 fetal effect Effects 0.000 description 14
- 210000004072 lung Anatomy 0.000 description 14
- 208000036878 aneuploidy Diseases 0.000 description 13
- 230000001186 cumulative effect Effects 0.000 description 13
- 230000007613 environmental effect Effects 0.000 description 13
- 238000010606 normalization Methods 0.000 description 13
- 150000007523 nucleic acids Chemical class 0.000 description 13
- 102000053602 DNA Human genes 0.000 description 11
- 230000008774 maternal effect Effects 0.000 description 11
- 102000039446 nucleic acids Human genes 0.000 description 11
- 108020004707 nucleic acids Proteins 0.000 description 11
- 238000011144 upstream manufacturing Methods 0.000 description 11
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 239000002609 medium Substances 0.000 description 10
- 238000013207 serial dilution Methods 0.000 description 10
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 9
- 210000002230 centromere Anatomy 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 9
- 108091008915 immune receptors Proteins 0.000 description 9
- 102000027596 immune receptors Human genes 0.000 description 9
- 230000006798 recombination Effects 0.000 description 9
- 238000005215 recombination Methods 0.000 description 9
- 102100030960 DNA replication licensing factor MCM2 Human genes 0.000 description 8
- 101000583807 Homo sapiens DNA replication licensing factor MCM2 Proteins 0.000 description 8
- 101001018431 Homo sapiens DNA replication licensing factor MCM7 Proteins 0.000 description 8
- 108060003951 Immunoglobulin Proteins 0.000 description 8
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 8
- 230000003322 aneuploid effect Effects 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 8
- 230000002550 fecal effect Effects 0.000 description 8
- 102000018358 immunoglobulin Human genes 0.000 description 8
- 244000005700 microbiome Species 0.000 description 8
- 230000007017 scission Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 108091029523 CpG island Proteins 0.000 description 7
- 208000020584 Polyploidy Diseases 0.000 description 7
- 239000012980 RPMI-1640 medium Substances 0.000 description 7
- 201000011510 cancer Diseases 0.000 description 7
- 230000002759 chromosomal effect Effects 0.000 description 7
- 239000002131 composite material Substances 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 108091008146 restriction endonucleases Proteins 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 230000000392 somatic effect Effects 0.000 description 7
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 6
- 102000016911 Deoxyribonucleases Human genes 0.000 description 6
- 108010053770 Deoxyribonucleases Proteins 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- 102000048850 Neoplasm Genes Human genes 0.000 description 6
- 108700019961 Neoplasm Genes Proteins 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 210000004185 liver Anatomy 0.000 description 6
- 102000054765 polymorphisms of proteins Human genes 0.000 description 6
- 206010069754 Acquired gene mutation Diseases 0.000 description 5
- 238000001712 DNA sequencing Methods 0.000 description 5
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 5
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 5
- 208000009052 Precursor T-Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 5
- 208000017414 Precursor T-cell acute lymphoblastic leukemia Diseases 0.000 description 5
- 208000029052 T-cell acute lymphoblastic leukemia Diseases 0.000 description 5
- 231100001075 aneuploidy Toxicity 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000000429 assembly Methods 0.000 description 5
- 230000000712 assembly Effects 0.000 description 5
- 230000031018 biological processes and functions Effects 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 210000005260 human cell Anatomy 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 230000003278 mimic effect Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 5
- 235000018102 proteins Nutrition 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000037439 somatic mutation Effects 0.000 description 5
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 4
- 238000007702 DNA assembly Methods 0.000 description 4
- 230000006819 RNA synthesis Effects 0.000 description 4
- 208000007660 Residual Neoplasm Diseases 0.000 description 4
- 108091008874 T cell receptors Proteins 0.000 description 4
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 4
- 210000001744 T-lymphocyte Anatomy 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 230000000536 complexating effect Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 210000000265 leukocyte Anatomy 0.000 description 4
- 230000000717 retained effect Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- WEVYNIUIFUYDGI-UHFFFAOYSA-N 3-[6-[4-(trifluoromethoxy)anilino]-4-pyrimidinyl]benzamide Chemical compound NC(=O)C1=CC=CC(C=2N=CN=C(NC=3C=CC(OC(F)(F)F)=CC=3)C=2)=C1 WEVYNIUIFUYDGI-UHFFFAOYSA-N 0.000 description 3
- 101150008391 A1 gene Proteins 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical class NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 101150042514 B1 gene Proteins 0.000 description 3
- 108020005031 Concatenated DNA Proteins 0.000 description 3
- 230000006820 DNA synthesis Effects 0.000 description 3
- 201000010374 Down Syndrome Diseases 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 101150025323 SCLT1 gene Proteins 0.000 description 3
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 3
- 206010044688 Trisomy 21 Diseases 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 108010056708 bcr-abl Fusion Proteins Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000003339 best practice Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010835 comparative analysis Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 210000004602 germ cell Anatomy 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 238000007403 mPCR Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- -1 rRNA Proteins 0.000 description 3
- 230000008707 rearrangement Effects 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 108091035539 telomere Proteins 0.000 description 3
- 102000055501 telomere Human genes 0.000 description 3
- 210000003411 telomere Anatomy 0.000 description 3
- 230000005026 transcription initiation Effects 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 238000013382 DNA quantification Methods 0.000 description 2
- 238000000729 Fisher's exact test Methods 0.000 description 2
- 101000933320 Homo sapiens Breakpoint cluster region protein Proteins 0.000 description 2
- 101150028927 Hoxa1 gene Proteins 0.000 description 2
- 108020005198 Long Noncoding RNA Proteins 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 108091092878 Microsatellite Proteins 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 240000002044 Rhizophora apiculata Species 0.000 description 2
- 101100348089 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) BUR6 gene Proteins 0.000 description 2
- 108020004688 Small Nuclear RNA Proteins 0.000 description 2
- 102000039471 Small Nuclear RNA Human genes 0.000 description 2
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 2
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 108091092328 cellular RNA Proteins 0.000 description 2
- CTMZLDSMFCVUNX-VMIOUTBZSA-N cytidylyl-(3'->5')-guanosine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=C(C(N=C(N)N3)=O)N=C2)O)[C@@H](CO)O1 CTMZLDSMFCVUNX-VMIOUTBZSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000009274 differential gene expression Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 2
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 210000005228 liver tissue Anatomy 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 108091035233 repetitive DNA sequence Proteins 0.000 description 2
- 102000053632 repetitive DNA sequence Human genes 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical group CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- BSDCIRGNJKZPFV-GWOFURMSSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(2,5,6-trichlorobenzimidazol-1-yl)oxolane-3,4-diol Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=CC(Cl)=C(Cl)C=C2N=C1Cl BSDCIRGNJKZPFV-GWOFURMSSA-N 0.000 description 1
- 241000337031 Anaeromyxobacter Species 0.000 description 1
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 1
- 102100026008 Breakpoint cluster region protein Human genes 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- 108091029430 CpG site Proteins 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 101150029707 ERBB2 gene Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000495778 Escherichia faecalis Species 0.000 description 1
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 description 1
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 description 1
- 108010010285 Forkhead Box Protein L2 Proteins 0.000 description 1
- 102100035137 Forkhead box protein L2 Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 241000724709 Hepatitis delta virus Species 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 102100030309 Homeobox protein Hox-A1 Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101001083156 Homo sapiens Homeobox protein Hox-A1 Proteins 0.000 description 1
- 101000599056 Homo sapiens Interleukin-6 receptor subunit beta Proteins 0.000 description 1
- 101001043809 Homo sapiens Interleukin-7 receptor subunit alpha Proteins 0.000 description 1
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 1
- 101000634835 Homo sapiens M1-specific T cell receptor alpha chain Proteins 0.000 description 1
- 101000763322 Homo sapiens M1-specific T cell receptor beta chain Proteins 0.000 description 1
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000634836 Homo sapiens T cell receptor alpha chain MC.7.G5 Proteins 0.000 description 1
- 101000763321 Homo sapiens T cell receptor beta chain MC.7.G5 Proteins 0.000 description 1
- 101000823316 Homo sapiens Tyrosine-protein kinase ABL1 Proteins 0.000 description 1
- 102100037795 Interleukin-6 receptor subunit beta Human genes 0.000 description 1
- 102100021593 Interleukin-7 receptor subunit alpha Human genes 0.000 description 1
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 1
- 101150009057 JAK2 gene Proteins 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- 101150053046 MYD88 gene Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- 241001599018 Melanogaster Species 0.000 description 1
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 1
- 241000204641 Methanopyrus kandleri Species 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 244000294411 Mirabilis expansa Species 0.000 description 1
- 235000015429 Mirabilis expansa Nutrition 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 102100024134 Myeloid differentiation primary response protein MyD88 Human genes 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 108010024221 Proto-Oncogene Proteins c-bcr Proteins 0.000 description 1
- 108020003584 RNA Isoforms Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 101100209986 Rattus norvegicus Slc18a1 gene Proteins 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 108020004487 Satellite DNA Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 102100029454 T cell receptor alpha chain MC.7.G5 Human genes 0.000 description 1
- 102100026967 T cell receptor beta chain MC.7.G5 Human genes 0.000 description 1
- 108700042077 T-Cell Receptor beta Genes Proteins 0.000 description 1
- 101150080074 TP53 gene Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 208000037280 Trisomy Diseases 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 206010052428 Wound Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000011166 aliquoting Methods 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 210000001520 comb Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000002153 concerted effect Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 101150007818 dj gene Proteins 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000011223 gene expression profiling Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 102000048392 human ABL1 Human genes 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 201000005296 lung carcinoma Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000012775 microarray technology Methods 0.000 description 1
- 235000013536 miso Nutrition 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 108700025694 p53 Genes Proteins 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008775 paternal effect Effects 0.000 description 1
- 238000013081 phylogenetic analysis Methods 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 125000002987 valine group Chemical class [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/04—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/01—Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2545/00—Reactions characterised by their quantitative nature
- C12Q2545/10—Reactions characterised by their quantitative nature the purpose being quantitative analysis
- C12Q2545/107—Reactions characterised by their quantitative nature the purpose being quantitative analysis with a competitive internal standard/control
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 명세서는 일반적으로 광범위한 다양한 유전적 시퀀싱 방법들을 보정하는데 이용될 수 있는 유전적 시퀀싱 컨트롤에 관계한다. 예를 들면, 본 명세서에서 공개된 시퀀싱 컨트롤은 광범위한 다양한 고속대량(high throughput) 시퀀싱 방법들 (예를 들면, 이들은 차세대 시퀀싱 방법들로 지칭됨)을 측정하는데 이용될 수 있다. 본 명세서는 예를 들면, 광범위한 다양한 시퀀싱 방법들의 검증(calibration)이 포함된 광범위한 다양한 응용에 있어서 상기 시퀀싱 컨트롤의 사용에 또한 일반적으로 관계한다.
Description
본 명세서는 광범위한 다양한 시퀀싱 방법들을 측정하는데 이용될 수 있는 시퀀싱 컨트롤(또는 "표준")에 일반적으로 관계한다. 예를 들면, 본 명세서에서 공개된 시퀀싱 컨트롤은 광범위한 다양한 고속대량(high throughput) 시퀀싱 방법들 (예를 들면, 이들은 차세대 시퀀싱 방법들로 지칭됨)을 측정하는데 이용될 수 있다. 본 명세서는 예를 들면, 광범위한 다양한 시퀀싱 방법들의 보정(calibration)이 포함된 광범위한 다양한 응용에 있어서 상기 시퀀싱 컨트롤의 사용에 또한 일반적으로 관계한다.
차세대 시퀀싱 (NGS) 기술 (회사, 이를 테면, Illumina, Nanopore, PacBio, Ion Torrent, Roche 454 Pyrosequencing (가령, Bentley, D.R. et al., 2008; Clarke, J. et al., 2009; Ronaghi, M. et al., 1998; Eid, J. et al., 2009; Rothberg, J.M. et al., 2011) 및 기타 다른 회사에서 제공하는 서비스 및 상품들에 의해 구체화된)은 핵산 분자들의 고속대량의, 엄청난 수준의 병행 시퀀싱을 가능하게 한다. 이들 기술은 단일 시료 안에서 수백만의 RNA 및 DNA 분자들의 뉴클레오티드 염기 서열을 결정하는 능력을 가진다. 더욱이, 개별 RNA 또는 DNA 서열들이 결정되는 속도는 이 시료 안의 개별 RNA 또는 DNA 서열의 상대적 풍도(abundance)에 비례한다. 따라서, NGS는 시료 안에 있는 하나 또는 그 이상의 핵산 서열들의 양을 결정하는데 또한 사용될 수 있다.
NGS는 천연 출처, 이를 테면, 동물들, 식물들, 미생물들, 또는 환경 시료 안에 있는 다양한 집단의 미생물로부터 취한 시료들 안에서 발견되는 핵산의 서열 및/또는 양을 결정하는데 광범위하게 이용된다 (Edwards, R.A. et al., 2006). 이들 용도는 유기체의 전장의 게놈 서열 결정 (가령, Bentley, D.R. et al., 2008 참고), 시료 안에 존재하는 메신져 RNA의 서열 및 풍도 결정 (가령, Mortazavi, A. et al., 2008 참고), 또는 세포 특징 범위, 이를 테면, 후생적(epigenetic) 변형의 시퀸싱 및 측정 (가령, Bernstein, B.E. et al., 2005), 단백질 결합 부위 (가령, Johnson, D.S., et al., 2007 참고), 그리고 3-차원적 DNA 구조 (가령, Lieberman-Aiden, E. et al., 2009 참고)의 시퀸싱 및 측정, 그리고 기타 특징들의 측정을 포함한다.
NGS에 의해 결정되는 수백만의 개별 RNA 또는 DNA 서열들은 데노보(de novo) 어셈블리에 의해 더 긴 서열들(콘틱(contigs)로 불림)로 병합되거나, 또는 공지된 기준 서열에 일치될 수 있다. DNA 서열들의 데노보 어셈블리를 이용하여 유기체의 게놈을 어셈블리할 수 있으며; RNA 서열들의 데노보 어셈블리는 유전자 서열, 길이 및 동형(isoforms)을 나타낼 수 있다. 기준 게놈에 대한 DNA 서열의 일치 또는 정렬은 개체간의 유전적 차이의 위치 또는 개체간의 변이를 확인할 수 있다. DNA 서열과 기준 게놈 사이의 일치(matches) 위치는 후생적 특징들, 이를 테면, 히스톤 변형, 또는 단백질 결합 부위의 위치를 나타낼 수 있다. 기준 게놈에 대한 RNA 서열의 정렬은 유전자 접합(splicing) 과정에서 절제되는 인트론 서열의 존재를 나타낼 수 있다.
일부 경우들에 있어서, 이러한 시퀀싱 방법들의 운용 동안, 표준으로 불리는 핵산의 공지된 양 또는 서열이 핵산의 천연 시료에 추가되었다 (또는 "박아넣음(spiked-in)"). 상기 결과적으로 복합된 혼합물은 그 다음 마이크로어래이 기술, 정량적 중합효소연쇄반응 방법들, 및 기타 다른 것들이 포함된 일련의 유전적 기술 (이를 테면, NGS 기술)을 이용하여 분석될 수 있다. 천연 시료의 핵산의 양 또는 서열을 측정하고, 결정하는데 이용되는 기준 척도(scale)를 제공하기 위하여, 시료 핵산들의 양 또는 서열들은 추가된 핵산 표준의 공지된 양 또는 서열들과 비교될 수 있다.
현재 사용되는 RNA 및 DNA 표준은 천연 원천으로부터 파생된다. 예를 들면, 백인계(Caucasian) 여성으로부터 원래 유래된 NA12878 세포계통으로부터 추출된 DNA 서열은 광범위하게 특징화되고, 유전 변이를 확인하는 분석 도구로서의 성과를 평가하는데 사용되어 왔다(Zook, J.M. et al., 2014). 고세균류(archaea) 메타노칼도코쿠스 아나스치(Methanocaldococcus jannaschii)로부터 유도된 서열들을 포함하는 리보핵산 표준 (ERCC Spike-Ins로 공지됨)은 마이크로어래이 및 qRT-PCR 기술을 위하여 개발되었으며 (Baker, S.C. et al., 2005; Consortium, E.R.C., 2005) 그리고 RNA 시퀀싱과 함께 이용되어 왔다 (Jiang, L. et al., 2011).
그러나, 천연 원천으로부터 유도되었던 핵산 표준의 단점은 핵산 표준들이 이 시료 안에 관심 핵산 서열과 상동 서열들을 공유하기 때문에 시료에 직접적으로 추가될 수 없는 경우가 흔히 있다는 점이다. 천연 원천으로부터 유도된 핵산 표준의 사용으로 인하여 이 시료 안에 관심 대상의 상동 서열과 표준 서열이 구별되지 않는다. 따라서, 관심 대상 시료에 적용된 시퀀싱 방법을 보정하기 위한 도구로써 이러한 표준의 가치는 제한되고, 대체가능한 개선된 시퀀싱 컨트롤에 대한 필요성은 여전히 남아있다.
본 발명자들은 인공 염색체와 별도로, 또는 병용 사용될 수 있는 새로운 인공 시퀀싱 컨트롤을 개발하였다. 용어 "컨트롤(controls)"은 용어 "표준(standards)"과 본 명세서에서 호환 사용된다. 따라서, 본 명세서는 신규한 인공 시퀀싱 표준을 제공한다.
한 측면에서, 본 명세서는 인공 폴리뉴클레오티드 서열을 포함하는 인공 염색체를 제공하며, 이때 상기 인공 폴리뉴클레오티드 서열의 임의의 단편은 임의의 공지된 자연 발생적 게놈 서열과 구별가능하다. 상기 단편은 20 내지 10,000,000개중 임의의 크기의 연속 뉴클레오티드일 수 있다. 한 실시예에서, 상기 단편의 길이는 1,000개 또는 그 이상의 뉴클레오티드이다. 또 다른 실시예에서, 상기 단편의 길이는 100개 또는 그 이상의 뉴클레오티드이다. 또 다른 실시예에서, 상기 단편의 길이는 21개 또는 그 이상의 뉴클레오티드이다.
본 명세서에서 공개된 인공 염색체에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 1,000개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가질 수 있다. 또 다른 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 100개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가질 수 있다. 또 다른 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 21개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가질 수 있다. 또 다른 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 20개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가질 수 있다.
또 다른 실시예에서, 본 명세서에서 공개된 인공 염색체에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 1,000개 또는 그 이상의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가질 수 있다. 또 다른 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 100개 또는 그 이상의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가질 수 있다. 또 다른 실시예에서,상기 인공 폴리뉴클레오티드 서열의 임의의 21개 또는 그 이상의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가질 수 있다. 또 다른 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 20개 또는 그 이상의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가질 수 있다.
본 명세서에서 공개된 인공 염색체는 유전자 좌(loci), CpG 섬(islands), 이동 요소들(mobile elements), 반복적 폴리뉴클레오티드 특징들, 소규모 유전적 변이 및 대규모 유전적 변이로 구성된 군에서 선택되는 자연 발생적 진핵성 염색체의 임의의 하나 또는 그 이상의 특징들을 포함할 수 있다. 상기 인공 폴리뉴클레오티드 서열은 다수 유전자 좌를 포함할 수 있고; 상기 반복적 폴리뉴클레오티드 특징들은 임의의 하나 또는 그 이상의 말단 반복부, 텐덤(tandem) 반복부, 역 반복부 및 산재된(interspersed) 반복부를 포함할 수 있고; 상기 유전자 좌는 면역 수용체 유전자 좌를 포함할 수 있고; 상기 소규모 유전적 변이는 하나 또는 그 이상의 SNPs, 하나 또는 그 이상의 삽입, 하나 또는 그 이상의 결손, 하나 또는 그 이상의 미소부수체(microsatellities) 및/또는 다수 뉴클레오티드 다형(polymorphisms)을 포함할 수 있고; 및/또는 상기 대규모 유전적 변이는 하나 또는 그 이상의 결손, 하나 또는 그 이상의 중복(duplications), 하나 또는 그 이상의 복제-수 변이체, 하나 또는 그 이상의 삽입, 하나 또는 그 이상의 전도(inversions) 및/또는 하나 또는 그 이상의 전좌(translocations)를 포함할 수 있다.
대안으로 또는 추가적으로, 본 명세서에서 공개된 인공 염색체는 자연 발생적 원핵성 염색체들의 하나 또는 그 이상의 특징을 포함할 수 있다. 예를 들면, 상기 인공 염색체는 유전자 좌, DNA 반복부, 이동 요소들, 및 오페론으로 구성된 군에서 선택된 자연 발생적 원핵성 염색체들의 하나 또는 그 이상의 특징을 포함할 수 있다.
본 명세서는 본 명세서에서 공개된 인공 염색체의 단편을 또한 제공하는데, 상기 인공 폴리뉴클레오티드 서열의 20 내지 10,000,000개의 연속 뉴클레오티드를 포함한다. 상기 단편은 RNA 단편 또는 DNA 단편일 수 있다.
본 명세서는 연속 폴리뉴클레오티드 서열을 만들기 위하여 공동-결합된(conjoined) 본 명세서의 2개 또는 그 이상의 단편을 포함하는 인공 폴리뉴클레오티드 서열을 또한 제공한다. 상기 인공 폴리뉴클레오티드 서열은 RNA 또는 DNA 폴리뉴클레오티드 서열일 수 있다.
본 명세서는 본 명세서에서 공개된 인공 염색체의 DNA 단편을 포함하는 벡터를 또한 제공하는데, 이 단편은 상기 인공 폴리뉴클레오티드 서열의 20 내지 10,000,000개의 연속 뉴클레오티드를 포함한다.
본 명세서는 본 명세서에서 공개된 인공 폴리뉴클레오티드 서열을 포함하는 벡터를 또한 제공하는데, 이 인공 폴리뉴클레오티드 서열은 DNA 폴리뉴클레오티드 서열이다.
본 명세서는 본 명세서에서 공개된 단편을 만드는 방법을 또한 제공하는데, 상기 방법은 엔도뉴클레아제 절단에 의해 본 명세서에서 공개된 벡터로부터 상기 단편을 잘라내고, 증폭 또는 본 명세서에서 공개된 벡터 안에 포함된 DNA 단편을 전사하는 것을 포함한다. 한 실시예에서, 상기 증폭은 중합효소-사슬 증폭일 수 있다. 본 명세서는 본 명세서에서 공개된 단편을 만드는 방법을 또한 제공하는데, 상기 방법은 DNA 합성에 의해 단편을 만드는 것을 포함한다.
본 명세서는 본 명세서에서 공개된 방법에 의해 만들어진 인공 염색체의 단편을 또한 제공한다. 따라서, 본 명세서는 엔도뉴클레아제 절단에 의해 본 명세서의 벡터로부터 상기 단편을 잘라내고, 또는 본 명세서의 벡터 안에 포함된 DNA 단편을 전사하는 것을 포함하는 방법에 의해 만들어진 인공 염색체의 단편을 제공한다.
본 명세서는 본 명세서에서 공개된 인공 폴리뉴클레오티드 서열을 만드는 방법을 또한 제공하는데, 상기 방법은 본 명세서에서 공개된 벡터로부터 상기 인공 폴리뉴클레오티드 서열을 잘라내고, 증폭, 또는 본 명세서의 벡터 안에 포함된 인공 폴리뉴클레오티드 서열을 전사하는 것을 포함한다. 한 실시예에서, 상기 증폭은 중합효소-사슬 증폭일 수 있다. 본 명세서는 본 명세서에서 공개된 인공 폴리뉴클레오티드 서열을 만드는 방법을 또한 제공하는데, 상기 방법은 DNA 합성에 의해 상기 인공 폴리뉴클레오티드 서열을 만드는 것을 포함한다.
본 명세서는 본 명세서에서 공개된 방법에 의해 만들어진 인공 폴리뉴클레오티드 서열을 또한 제공한다. 따라서, 본 명세서는 엔도뉴클레아제 절단에 의해 본 명세서의 벡터로부터 인공 폴리뉴클레오티드 서열을 잘라내고, 또는 본 명세서의 벡터 안에 포함된 인공 폴리뉴클레오티드 서열을 전사하는 것을 포함하는 방법에 의해 만들어진 인공 폴리뉴클레오티드 서열을 제공한다.
본 명세서는 폴리뉴클레오티드 시퀀싱 공정을 보정하기 위하여, 본 명세서에서 공개된 인공 염색체 및/또는 상기 본 명세서에서 공개된 단편의 용도 및/또는 본 명세서에서 공개된 인공 폴리뉴클레오티드 서열의 용도를 또한 제공한다. 광범위한 다양한 시퀀싱 공정은 이 점에 대하여 보정될 수 있다.
본 명세서는 폴리뉴클레오티드 시퀀싱 공정을 보정하는 방법을 또한 제공하는데, 이 방법은 다음을 포함한다:
i) 본 명세서에서 공개된 하나 또는 그 이상의 단편 및/또는 본 명세서에서 공개된 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열을 결정되어야 하는 표적 폴리뉴클레오티드 서열이 포함된 시료에 추가하고;
ii) 상기 표적 폴리뉴클레오티드의 서열을 결정하고;
iii) 본 명세서에서 공개된 하나 또는 그 이상의 단편의 서열 및/또는 본 명세서에서 공개된 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열을 결정하고; 그리고
iv) iii)에서 결정된 서열을 상기 단편의 원래 서열 및/또는 상기 인공 폴리뉴클레오티드 서열과 비교하고, 상기 원래 서열은 본 명세서에서 공개된 인공 염색체 안에 존재하며;
이때 iii)에서 서열 결정의 정확도를 이용하여 ii)에서 서열 결정을 보정한다. 상기 폴리뉴클레오티드 시퀀싱 공정은 예를 들면, 폴리뉴클레오티드 정렬, 폴리뉴클레오티드 어셈블리, 또는 다른 공지된 시퀀싱 공정일 수 있다.
본 명세서는 폴리뉴클레오티드 정량화(quantitation) 공정을 보정하기 위하여, 본 명세서에서 공개된 인공 염색체 및/또는 상기 본 명세서에서 공개된 단편의 용도 및/또는 본 명세서에서 공개된 인공 폴리뉴클레오티드 서열의 용도를 또한 제공한다.
본 명세서는 폴리뉴클레오티드 정량화 공정을 보정하는 방법을 또한 제공하는데, 이 방법은 다음을 포함한다:
i) 본 명세서에서 공개된 하나 또는 그 이상의 단편 및/또는 본 명세서에서 공개된 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열의 공지된 양을 결정되어야 하는 표적 폴리뉴클레오티드 서열이 포함된 시료에 추가하고;
ii) 상기 표적 폴리뉴클레오티드의 양을 결정하고;
iii) 본 명세서에서 공개된 하나 또는 그 이상의 단편의 서열 및/또는 본 명세서에서 공개된 하나 또는 그 이상의 인공 폴리뉴클레오티드 양을 결정하고; 그리고
iv) iii)에서 결정된 하나 또는 그 이상의 단편 및/또는 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열의 양을 i)에서 하나 또는 그 이상의 단편 및/또는 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열의 공지된 양과 비교하고;
이때 iii)에서 양 결정의 정확도를 이용하여 ii)에서 양의 결정을 보정한다.
본 명세서는 폴리뉴클레오티드 증폭 공정을 보정하기 위하여, 본 명세서에서 공개된 인공 염색체 및/또는 상기 본 명세서에서 공개된 단편의 용도 및/또는 본 명세서에서 공개된 인공 폴리뉴클레오티드 서열의 용도를 또한 제공한다.
본 명세서는 폴리뉴클레오티드 증폭 공정을 보정하는 방법을 또한 제공하는데, 이 방법은 다음을 포함한다:
i) 본 명세서에서 공개된 하나 또는 그 이상의 단편 및/또는 본 명세서에서 공개된 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열의 공지된 양을 결정되어야 하는 표적 폴리뉴클레오티드 서열이 포함된 시료에 추가하고;
ii) 상기 표적 폴리뉴클레오티드를 증폭시키고;
iii) 본 명세서에서 공개된 하나 또는 그 이상의 단편 및/또는 본 명세서에서 공개된 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열을 증폭시키고; 그리고
iv) iii)에서 하나 또는 그 이상의 단편 및/또는 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열의 증폭된 영역을 ii)에서 증폭된 상기 표적 폴리뉴클레오티드의 증폭된 영역과 비교하고;
이때 iii)의 증폭을 이용하여 ii)의 증폭을 보정한다.
본 명세서에서 공개된 임의의 방법들에서, 본 명세서에서 공개된 2개 또는 그 이상의 단편 (또는 표준)은 동일한 또는 상이한 농도로 시료에 추가될 수 있다. 이것은 동형 접합성 (homozygosity) 또는 이형 접합성 (heterozygosity) 또는 이질성 (heterogeneity)의 자연 상태의 복제를 허용하는 이점을 갖는다(가령, 정상 세포와 종양 세포를 모두 포함하는 순수하지 않은 시료의 희귀 돌연변이 대립 유전자 빈도 복제;가령 염색체 배수체로부터 생기는 복잡한 대립 유전자 빈도 복제; 가령 순환하는 DNA에서 모계 유전자형의 배경에 대한 태아 유전자형 복제).
본 명세서는 본 명세서에서 공개된 하나 또는 그 이상의 인공 염색체 및 본 명세서에서 공개된 하나 또는 그 이상의 단편 또는 본 명세서에서 공개된 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열을 포함하는 키트를 또한 제공한다.
본 명세서는 본 명세서에서 공개된 하나 또는 그 이상의 인공 염색체가 저장된 컴퓨터 프로그램가능한 매체를 또한 제공한다.
본 명세서는 인공 폴리뉴클레오티드 서열을 포함하는 인공 염색체를 만들 수 있는 컴퓨터에 의해 실행되는 방법을 또한 제공하는데, 상기 컴퓨터에 의해 실행되는 방법은 다음을 포함한다:
시작 폴리뉴클레오티드 서열을 나타내는 시작 데이터를 만들고;
상기 시작 폴리뉴클레오티드 서열과 하나 또는 그 이상의 공지된 자연 발생적 폴리뉴클레오티드 서열 간에 유사성을 나타내는 일치 값을 결정하고;
변형된 폴리뉴클레오티드 서열을 나타내는 변형된 데이터를 결정하기 위해 상기 일치 값에 기초하여 상기 시작 데이터를 변형시키고, 상기 변형된 폴리 뉴클레오티드 서열은 임의의 공지된 자연 발생적 게놈 서열과 구별 가능하고; 그리고
수정된 데이터를 데이터 저장소에 저장한다.
본 명세서에서 공개된 컴퓨터에 의해 실행되는 방법에서, 시작 데이터를 변경하는 것은 초기 데이터를 셔플링하는(shuffling) 단계를 포함할 수 있다.
본 명세서는 컴퓨터에 의해 실행되는 폴리뉴클레오티드 시퀀싱 공정을 보정하는 방법을 또한 제공하는데, 상기 컴퓨터에 의해 실행되는 방법은 다음을 포함한다:
표적 폴리뉴클레오티드 서열과 관련된 제1 데이터를 인수하고;
본 명세서에서 공개된 인공 염색체의 하나 또는 그 이상의 단편 및/또는 본 명세서에서 공개된 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열을 나타내는 제2 데이터를 인수하고;
상기 제2 데이터를 근거하여, 하나 또는 그 이상의 단편의 성질과 관련된 정량적 값, 또는 상기 인공 염색체의 성질과 관련된 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열의 정량적 값을 결정하고, 이 정량적 값은 상기 하나 또는 그 이상의 단편 및/또는 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열의 성질을 결정하는 정확도를 나타내며; 그리고
상기 표적 폴리뉴클레오티드 서열의 보정된 성질을 결정하기 위하여 상기 정량적 값에 근거하여 제1 데이터를 조정한다.
상기 컴퓨터에 의해 실행되는 방법은 제1 및/또는 제2 데이터를 생성하고; 그리고 제1 및/또는 제2 데이터를 데이터 저장소에 보관하는 것을 더 포함할 수 있다.
본 명세서는 폴리뉴클레오티드 시퀀싱 공정을 보정하는 컴퓨터 시스템을 또한 제공하는데, 상기 컴퓨터 시스템은 다음을 포함한다:
데이터 포트 -
표적 폴리뉴클레오티드 서열과 관련된 제1 데이터,
본 명세서에서 공개된 인공 염색체의 하나 또는 그 이상의 단편 및/또는 본 명세서에서 공개된 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열을 나타내는 제2 데이터를 수용함; 그리고
프로세서-
제2 데이터에 근거하여, 하나 또는 그 이상의 단편의 성질과 관련된 및/또는 상기 인공 염색체의 성질과 관련된 하나 또는 그 이상의 인공 폴리뉴클레오티드 서열의 제1 정량 값을 결정함, 이 정량적 값은 상기 하나 또는 그 이상의 단편 및/또는 상기 인공 폴리뉴클레오티드 서열의 성질을 결정하는 정확도를 나타내며, 그리고
상기 표적 폴리뉴클레오티드 서열의 보정된 성질을 결정하기 위하여 상기 정량 값에 근거하여 제1 데이터를 조정함.
임의의 특정 측면 또는 구체예의 각각의 특징은 본 명세서의 임의의 기타 측면 또는 구체예 또는 실시예에 대해 준용적으로(mutatis mutandis) 적용될 수 있다.
본 발명의 내용 중에 포함되어 있다.
다음의 도면은 본 명세서의 특정 측면들을 추가로 설명한다. 본 명세서는 본 명세서에 제시된 특정 구체예에 대한 상세한 설명과 결합하여, 이들 도면들중 하나 이상을 참조하여 더 잘 이해될 수 있다.
도 1은 본 명세서의 인공 염색체의 잠재적 구조적 특징들을 설명한다. 예시된 인공 염색체는 유전자, 대규모 구조적 변이, 질병-연관된 변이 사건들, DNA 반복 요소들 (동원체(centromeres) 및 말단소체(telomeres)포함), 면역 수용체 좌, 소규모 변이 (가령, <50nt) 이를 테면, 단일 뉴클레오티드 다형 (SNPs), 삽입 또는 결손 (InDels); 그리고 이동 요소들-유도된 서열들이 포함된 특징들을 (위에서부터 아래로) 포함한다.
도 2는 임의의 공지된 자연 서열에 대한 상동성을 제거하기 위해 서열을 뒤섞어서(셔플링) 인공 염색체를 생성하는 것을 예시한다. HOXA1 유전자의 프로모터에서 CpG 섬 (패널 A에서 검정 상자로 나타냄)과 중첩되는 공지된 DNA 서열 (패널 A)은 50nt의 창 크기로 셔플링되었다. 이로써, 50nt 해상도에서 CpG 섬 (패널 B에서 흰 상자)을 규정한 높은 CpG 디뉴클레오티드 함량을 유지하면서, 공지된 또는 천연 서열 (패널 B)과의 상동성은 제거되었다.
도 3은 상기 인공 염색체 안에서 엑손 서열과 인트론 서열이 개재된 유전자 좌(패널A)를 예시한다. (B) 엑손들의 대체 봉입에 의해 단일 유전자 좌로부터 상이한 수의 동형이 만들어질 수 있다. 아래 패널 (C)는 연속된 엑손 서열들 (끼어있는 인트론이 제거된)을 포함하도록 만들어진 RNA 표준을 나타낸다. 표시된 바의 콘센수스(consensus) 엑손들 (음영부분)과 대체(alternative) 엑손들 (흰색부분)을 가진, 상이한 동형을 나타내도록 RNA 표준이 만들어질 수 있다. 농도 범위에서 함께 대체 동형을 나타내는 RNA 표준을 복합시킴으로써, 대체 접합의 생물학적 공정은 에뮬레이트된다(emulated).
도 4는 상기 본 명세서의 인공 염색체에 포함되는 이동 요소들의 생성을 예시한다. (A) 우선 이동 요소의 단일 복제에 대응하는 서열 (회색 상자)은 인간 게놈으로부터 삭제한다. 상동성(homology)은 인공적인 오래된 이동 요소 (흰색 상자)를 만들기 위하여 제거된다. (B) 다수의 인공 이동 요소들은 개별적 서열 일탈(divergence)을 모형화하기 위하여 동시에 추가적인 뉴클레오티드 치환, 삽입 또는 결손을 치른다. 그다음 다수의 인공 이동 요소들은 상기 인공 염색체와 어셈블리된다. (C) 이동 요소 삽입을 나타내는 DNA 표준이 만들어질 수 있다. (D) 시퀀싱, 상기 인공 염색체에 정렬 (서열화된 판독(reads) 및 서열 적용범위의 주상도(histogram)로 나타냄) 및 분석으로 이 이동 요소를 식별해낼 수 있다.
도 5는 상기 본 명세서의 인공 염색체를 포함할 수 있는 인공 DNA 반복부의 특정 예시들의 생성을 도시한다. (A) 우선적으로 관심대상 DNA 반복 (이를 테면, 미소부수체, 말단소체 또는 동원체 반복 단위)의 단일 복제에 대응하는 서열이 인간 게놈으로부터 검색된다 상동성을 배제하여, 인공 ("조상전래의") 이동 반복 요소 (흰색 상자)를 만든다. (B) 상기 인공 이동 요소는 증폭된다. (C) 증폭된 인공 이동 요소들은 동시에 다수 뉴클레오티드 변화들을 겪게 되어, 개별 서열 일탈이 모형화된다. (D) 상기 인공 이동 요소는 비대칭적으로 증폭될 수 있다. (E) 상기 인공 서열은 다중 증폭 및 뉴클레오티드 변형 사이클을 거쳐, 다양한 복제 수를 갖는 다수의 반복 하위집단(subsets)을 갖는 큰 텐덤 DNA 중복을 형성한다. (E) DNA 표준은 상이한 반복 하위집단을 제시하도록 만들어질 수 있는데, DNA 표준 풍도는 반복 복제 수에 비례한다.
도 6은 본 명세서의 인공 염색체 안에 포함될 수 있는 인공적인 소규모 유전적 변이의 생성을 설명한다. (A) 단일-뉴클레오티드 다형, 삽입, 결손 등등이 포함된 소규모 유전적 변이가 인공 염색체 안으로 도입되어, 소규모 뉴클레오티드 변이를 품고 있는 변이체 인공 염색체 변이체를 형성할 수 있다. (B) 변이체 인공 염색체 서열 각각에 일치되는 다수 DNA 표준이 만들어질 수 있고, 이로 인하여 이형접합성 또는 동형접합성 대립유전자 빈도를 에뮬레이팅한다. (C) DNA 표준의 시퀀싱, 기준 인공 염색체에 정렬, 그리고 소규모 변이를 확인하기 위한 분석을 설명한다.
도 7은 본 명세서에서 상기 인공 염색체 안에 질환 연합된 인공 유전적 변이의 생성을 설명한다. (A) BRAF 돌연변이 V600E의 부위와 중첩되는 서열이 인간 게놈으로부터 검색되었다. 상기 주변 서열은 BRAF V600E 돌연변이의 부위로부터 거리를 증가함에 따라, 창 크기가 증가되면서 셔플링되었다. BRAF V600E 돌연변이 부위의 주변 12개 뉴클레오티드 서열은 셔플링되지 않았다. 셔플링된 서열은 상기 인공 염색체 안에서 어셈블리되어, 변이체 인공 염색체 서열이 만들어진다. 야생형 및 질환 연합된 BRAF V600E 돌연변이와 모두 일치하는 DNA 표준이 생성되고, 복합되어, 동형접합성 또는 이형접합성 유전자형을 에뮬레이팅하였다. (B) 분산형-플롯은 기준 DNA 표준에 대한 변이형 DNA 표준의 상대적 희석과 비교하여, 변이에 대한 서열 판독 범위의 심도 간의 관계를 나타낸다. (C) 분산형-플롯은 기준 DNA 표준에 대한 변이형 DNA 표준의 상대적 희석과 비교하여, 할당된 유전자형 (표시된 동형접합성 및 이형접합성 유전자형)과 연합된 신뢰를 설명한다.
도 8은 본 명세서의 인공 염색체 안에 혼입될 수 있는 인공적인 대규모 유전 변이를 설명한다. (A) 삽입, (B) 결손, (C) 전도, (D) 텐덤 복제 및 (E) 이동 요소 삽입을 포함하는 상이한 유형의 대규모 변이를 측정할 수 있는 DNA 표준의 예들이 설명되며, 이때 DNA 표준의 상대적 풍도는 인공 염색체 안에, 그리고 이들 사이에 특징들 이를 테면, 복제 수 변이를 에뮬레이트할 수 있다.
도 9는 본 명세서의 인공 염색체에 혼입될 수 있는 전좌(translocation)를 설명한다. (A) 상이한 2개의 인공 염색체 간의 서열은 전좌 동안 재배열될 수 있다. 설명된 실시예에서, 전좌 중단점(breakpoint)이 2개의 인공 유전자 (A1 및 B1) 사이에서 일어날 때 융합 유전자가 생성된다. 2개의 정상적인 유전자와 융합 유전자 서열을 나타내며, 동형접합성 및 이형접합성 유전자형을 에뮬레이팅하기 위하여 상이한 상대적 농도에서 복합되는 3개의 RNA 표준이 만들어질 수 있다. (B) 분산형-플롯은 2개의 정상적인 유전자 동형 RNA 표준과 비교하여 융합 유전자 RNA 표준의 분획적 희석과 비교하여, 융합 유전자 RNA 표준의 풍도를 나타낸다 (백만당 판독(RPM)으로 융합 인트론 정션을 측정). 이 분산-플롯은 첨부된 라이브러리의 정량적 정확도와 민감도의 한계를 나타낸다. 또한 동반된 K562 RNA 시료로부터 내인성 인간 BCR-ABL 융합 유전자의 풍부 또한 표시된다(점선). K562 RNA 시료는 내인성 인간 BCR-ABL 융합 유전자를 함유하지 않은 GM12878 RNA 시료과 함께 점차적으로 희석되어 적정된다. (C) 분산형 플롯은 두 가지 정상 유전자 동형 RNA 표준에 비해 융합 유전자 RNA 표준의 증가하는 희석에서 융합 정션의 확인과 관련된 유의성 (P 값)을 설명한다.
도 10은 미생물 군집을 시뮬레이팅한(simulating) 인공 염색체를 보여주고 있다. (A) 이러한 인공 염색체의 생성에서, 크기, GC%, 및 분류군(taxa)에 이르는 광범위한 미생물 게놈의 임의의 하나 또는 그 이상이 검색되고, 서플되어 천연 서열들에 대한 상동성이 제거된다. (B) 인공 염색체 내의 대표적인 부분서열(subsequences)과 일치되는 DNA 표준이 생성될 수 있다. 다양한 농도에서 이들 DNA 표준을 복합하면, 이질적인 미생물 군집이 시뮬레이션된다.
도 11은 인공 16S rRNA 표지자를 만들기 위한 방법의 한 가지 예를 설명한다. 16S rRNA 서열은 메타게놈(metagneomic) 계통 발생 분석을 위한 표지자(marker)로 사용될 수 있다. 상기 인공 미생물 게놈에서 측면 범용 프라이머 서열들이 포함된 16s rRNA 서열과 일치되는 DNA 표준이 만들어진다. 이 DNA 표준은 메타게놈 분석 동안 PCR 증폭 및 시퀀싱을 위한 주형 역할을 할 수 있다. (B) 분산플롯은 광범위한 상이한 미생물 게놈(표시된)에 상응하는 16S DNA 표준 시퀀싱으로부터 시뮬레이션된 판독 풍도를 나타낸다. (C) 분산형-플롯은 상응하는 미생물 게놈에서 rRNA 오페론 수에 따라 16S DNA 표준 풍도의 표준화를 나타낸다.
도 12는 인공적인 TCRγ 좌를 만드는 한 가지 예시적인 방법을 설명한다. (A) TCRγ 좌는 14개의 Vγ 세그먼트와 5개의 Jγ 세그먼트를 포함한다. (B) 서열들이 서플되어, 천연 서열들에 대한 상동성이 제거된다. (C) 세그먼트는 VJ 재조합 및 체세포 과다돌연변이의 생물학적 과정을 모델로 하는 과정과 결합되어, 수많은 인공적인 TCRγ 클론형이 생성된다. (D) DNA 표준은 범용 프라이머에 상보적인 서열을 유지하는 개별적인 인공 TCRβ 클론형을 나타내도록 생성될 수 있다. DNA 표준은 동반된 인간 DNA 시료에서 천연 TCRγ 유전자 좌의 PCR 증폭과 동시에 범용 프라이머를 이용한 PCR 증폭을 위한 표적 DNA 분자로 사용될 수 있다. 이로 인하여, 각 DNA 표준은 독특한 앰플리콘을 증폭시키는데, 이의 풍도는 프라이머 결합 효율 및 DNA 표준의 풍도에 비례한다.
도 13은 인공 TCRβ 좌의 한 가지 예를 설명한다. (A) TCRβ 좌는 65개의 Vβ 세그먼트, 2개의 Dβ 세그먼트 및 13개의 Jβ를 포함한다. (B) 세그먼트는 건강한 성인 시료에서 측정한 V (D) J 재조합 및 체세포 과다돌연변이의 생물학적 과정을 모델로 한 과정을 통해 결합되어, 다수의 인공 TCRβ 클론 형이 생성된다. (C) 개별 인공 TCRβ 클론형을 나타내는 DNA 표준이 만들어질 수 있다. DNA 표준은 면역 레퍼토리 시퀀싱 동안 좌의 PCR 증폭에 이용된 프라이머에 상보적인 서열들을 보유할 수 있다. 범용 프라이머로 PCR 증폭에 앞서, 단일 연속 주형이 만들어지도록 DNA 표준이 함께 결합될 수 있다. (D) 건강한 성인 대상 안에서 확인되는 클론형의 누적 빈도 분포 및 비교용으로 인공 클론형을 측정하는 DNA 표준의 상대적 풍도. 상기 인공 클론형은 천연 클론형의 동적 범위에 걸쳐 연장되는 정량적 척도를 제공하며, 풍도의 원인을 설명하고, 탐지 한계를 결정하는데 이용될 수 있다. (E) 건강한 성인 대상 안에서 발견되는 개별 V, J 및 D 세그먼트 (검정색 선으로 나타냄)의 누적 빈도 분포 및 DNA 표준으로 표시된 개별 V, J 및 D 세그먼트의 빈도 분포 (점선으로 나타냄).
도 14는 RNA 표준을 만들 수 있는 방법의 개요를 설명한다. 관심대상의 인공 염색체 서열이 합성되고, RNA 표준을 만들기 위하여 시험관내 전사에 사용되는 발현 벡터 안으로 삽입된다. RNA 표준이 정제되고, 정량화되고, 그리고 기타 RNA 표준과 혼합되어 혼합물이 형성되기 전, 적절한 농도로 희석된다. 분석용 상이한 시료에 상이한 최종 혼합물이 첨가 될 수 있다.
도 15는 DNA 표준을 만들 수 있는 방법의 개요를 설명한다. 관심 대상의 인공 염색체 서열이 합성되고, (i) 측면 프라이머들과 함께 PCR 증폭용; 또는 (ii) 측면 부위에서 제한 엔도뉴클레아제 절단을 위한 주형으로 이용되는 벡터 안으로 삽입된다. 절단된 DNA 표준이 정제되고, 정량화되고, 그리고 기타 DNA 표준과 혼합되어 혼합물이 형성되기 전, 적절한 농도로 희석된다. 분석용 상이한 시료에 상이한 최종 혼합물이 첨가 될 수 있다.
도 16은 공동-결합된 DNA 표준을 만들기 위한 하나의 예시적인 방법을 도시한다. (A) 개략도는 여러 개별 DNA 표준들이 더 큰 공동-결합된 DNA 표준 안에 결찰되는 것을 나타낸다. (B) 개별적인 DNA 표준을 서로 다른 복제 수에서 조합함으로써, 단일 공동-연합된 DNA 표준을 포함하는 개별 표준들 사이의 차등적인 풍도를 에뮬레이트할 수 있게 한다. (C) 풍도의 배수 변화는 개별 표준에 따라 상이하기 때문에, 다른 변이 원천으로부터 피펫팅으로 인한 변이를 구별해낼 수 있다. 이 경우, 공동-결합된 표준 안에 개별 DNA 표준의 공지된 풍도에 대하여 측정된 기울기의 플로팅은 피펫팅 오류 크기를 나타낸다. (D) 이 기울기에 따라 개별 DNA 표준 풍도를 표준화하면 이 오류를 표준화하고 최소화할 수 있다.
도 17은 바코드 변이를 만드는 한 가지 예시적인 방법을 설명한다. 연속 또는 비-연속 뉴클레오티드 서열들이 RNA 또는 DNA 표준 서열 안으로 치환될 수 있다. 시퀀싱 후, 상기 바코드는 다수 동일한 DNA 또는 RNA 표준 또는 유도체 서열화된 판독을 구별하는데 이용될 수 있다.
도 18은 차세대 시퀀싱 실험 동안 상기 인공 염색체들과 동반 RNA/DNA 표준의 사용 예의 개략적 개요를 설명한다. 상기 RNA/DNA 표준은 라이브러리 준비 및 시퀀싱에 앞서, 관심 대상의 RNA/DNA 시료에 추가된다. 상기 서열화된 판독은 관심대상의 기준 게놈 뿐만 아니라 상기 인공 염색체에 동시에 배열된다. 상기 인공 염색체에 대한 서열화된 판독의 정렬 및 어셈블리는 동반 기준 게놈 분석을 보정하는데 이용될 수 있다.
도 19는 RNA 시퀀싱 실험에서 RNA 표준의 사용에 대한 개략적 개요를 설명한다. DNA 표준을 사용하여 평가할 수 있는 분석적 측면들이 표시된다(점선으로된 상자).
도 20은 게놈 시퀀싱 실험에서 DNA 표준의 사용에 대한 개략적 개요를 설명한다. DNA 표준을 사용하여 평가할 수 있는 분석적 측면들이 표시된다(점선으로된 상자).
도 21은 메타게놈 시퀀싱 실험에서 DNA 표준의 사용에 대한 개략적 개요를 설명한다. DNA 표준을 사용하여 평가할 수 있는 분석적 측면들이 표시된다(점선으로된 상자).
도 22는 RNA 표준 및 K562 전체 세포 RNA를 사용하는 RNA 시퀀싱 분석의 한 예를 설명한다. 분산플롯은 RNA 표준의 풍도에 대하여 (A) 인트론 및 (B) 엑손 발견의 감도를 나타낸다. 이것은 검출 한계를 나타내며, 그 이하에서는 전사체는 확고한 어셈블리를 가능하게 하는 범위를 충분히 보유하지 못한다. (C) 분산플롯은 RNA 표준의 공지된 풍도에 비례하여 RNA 표준의 관측된 정량적 측정과 관련된 신뢰를 나타낸다.
도 23은 RNA 표준 및 K562 전체 세포 RNA를 사용하는 RNA 시퀀싱 분석으로부터 판독의 정렬을 설명한다. (A-E) 인공 염색체 상에 코딩된 다수의 동형을 포함하는 유전자 좌의 5 가지 예가 설명된다. RNA 표준의 시퀀싱으로부터 생성된 판독은 인공 염색체에 정렬된다. 연속 정렬은 검정 막대로 표시되고, 정렬이 분열된 영역들은 가는 선으로 표시된다. 그 다음 판독 정렬의 중첩은 인트론과 엑손들 그리고 대체 접합 사건들이 포함된, 전장 유전자 좌 구조를 어셈블리하는데 이용된다. 주상도는 누적 판독 정렬의 서열 적용 범위를 나타낸다.
도 24는 인간 세포 RNA 시료를 이용한 RNA 표준의 RNA 시퀀싱 분석으로부터의 정량적 분석을 예시한다. (A, B) 분산-플롯은 (A) K562 인간 세포 RNA 시료와 혼합물 A 또는 (B) GM12878 인간 세포 RNA 시료와 혼합물 B로 복합될 때, 유전자를 나타내는 RNA 표준의 공지된 풍도와 비교하여 관찰된 풍도(RPKM에서 측정)를 나타낸다. 선형 상관관계와 기울기는 각 RNA 시퀀싱 라이브러리의 정량적 정확도를 나타낸다. (C) 분산-플롯은 혼합물 A (K562 RNA에 추가됨)과 혼합물 B (GM12878 RNA에 추가됨) 사이에서 풍도의 예상 배수-변화와 비교하여 유전자 RNA 표준 풍도에서 관찰된 배수-변화를 나타낸다. (D, E) 분산플롯은 (D) K562 RNA 시료에 추가된 혼합물 A 또는 (E) GM12878 RNA 시료에 추가된 혼합물 B로 복합될 때, 각 RNA 표준에 의해 나타나는 개별 동형의 관찰된 풍도를 나타낸다. (F) 분산-플롯은 혼합물 A와 혼합물 B 사이에 풍도에서의 예측된 배수-변화에 비교하여 동형 RNA 표준 풍도에서 관찰된 배수-변화를 나타낸다. 개별 동형 간에 배수 변화는 대체 접합을 에뮬레이트한다.
도 25는 접합된(spliced) RNA 표준의 한 가지 사용 예를 설명한다. (A) 분산-플롯은 RNA 표준에 의해 나타난 각 유전자의 변이체 및 기준 동형의 관찰된 상대적 풍도를 나타낸다. (B) 상자-위스커(whisker) 플롯 (최저-최대)은 예측된 동형 배수-변화와 비교하여, 혼합물 A (K562 RNA 시료에 추가된)와 혼합물 B (GM128787 RNA 시료에 추가된) 사이의 동형의 관찰된 배수 변화를 나타낸다. (B) 이 실시예에서, 상기 인공 염색체 상의 단일 유전자 좌는 구성적 엑손들을 공유하지만, 3' 대체 엑손들과 종료 부위에서는 상이한 2가지 독특한 동형 (R_10_2_R 및 R_10_2_V)을 인코드한다. 혼합물 A에 대한 상이한 방식 (3:1 비율)과 혼합물 B에 대한 역 방식 (1:3 비율)에서 각 동형을 나타내는 RNA 표준을 만들었다. (B) 플롯은 혼합물 A와 혼합물 B에서 R_10_2 유전자 및 R_10_2_R 및 R_10_2_V 동형의 예측된(점선) 발현과 비교하여 관찰된 발현 (최저에서 최대를 보여주는 상자-위스커 플롯 ; n=3)을 나타낸다.
도 26은 RNA 표준 및 ERCC RNA Spike-ins의 정량적 비교를 나타낸다. (A) 분산-플롯은 RNA 표준 (회색)과 비교하여, ERCC RNA Spike-Ins (검정)의 공지된 농도에 대한 관찰된 풍도(RPKM에서 측정됨)을 비교한 것을 나타낸다. 표준 편차를 나타내는 오차 막대가 있는 3 개의 복제본(replicate)을 기반으로 한다. 검출 한계는 알려진 농도의 RNA 표준을 나타내며, 그 이하에서는 표본 추출이 드물고 가변적이다. (B) RNA 표준 (회색)에 대한 ERCC RNA Spike-Ins (검정)는 유사한 선형 프로파일 및 검출 한계 이상의 상관관계를 나타낸다. (C) 분산-플롯은 ERCC RNA Spike-Ins에 대한 예측 변수-변화와 비교하여 관찰된 배수-변화(검정) 및 혼합물 A (정상적인 폐 RNA 시료에 추가된)와 혼합물 B (일치된 폐 선암 RNA 시료에 추가된) 사이에 RNA 표준 풍도(회색)를 나타내고, (D) 암 유전자 발현 (검정선)의 누적 빈도 분포. 추가된 RNA 표준의 측정된 풍도는 동반 폐 선암종 RNA 시료 내에서 내생성 암 유전자의 농도를 측정하는 중첩되는 정량적 기준 사다리(ladder)를 제공하기 위해 표시된다 (점선).
도 27은 마우스 간 RNA 시료에 추가된 (A) 유전자 또는 (B) 개별 동형을 나타내는 RNA 표준의 공지된 풍도와 비교하여 관찰된 풍도(RPKM에서 측정)를 나타내는 분산 플롯을 나타낸다. 선형 상관관계 및 기울기는 RNA 시퀀싱 라이브러리의 정량적 정확도를 나타낸다.
도 28은 DNA 표준 및 GM21878 게놈 DNA을 이용한 예시적인 DNA 시퀀싱 분석을 나타낸다. (A) 분산-플롯은 DNA 표준의 공지된 풍도와 비교하여 DNA 표준의 측정된 풍도(RPKM에서)를 비교한다. (B) 분산-플롯은 DNA 표준의 공지된 농도와 비교하여 DNA 표준에 의해 나타내는 유전적 변이체의 정렬 배수-적용범위를 나타낸다. (C) 분산-플롯은 공지된 변이체 대립유전자 빈도에 비교하여 관찰된 변이체 대립유전자 빈도를 나타낸다. 변이체 대립유전자 빈도는 기준 대립유전자 빈도에 비교하여 나타낸다. 선형 상관관계 및 기울기는 관찰된 대립유전자 빈도가 관측된 정량적 정확도를 나타낸다. (D) 분산-플롯은 마우스 게놈 DNA과 함께 분석에 이용될 때, DNA 표준의 공지된 풍도와 비교하여 DNA 표준의 측정된 풍도(RPKM에서)를 비교한다. (E) 누적 빈도 분포 플롯은 (상위 패널) PHRED 품질(quality) 점수, (중간 패널) 배수 적용범위 또는 (하위 패널) 동반 GM12878 게놈 DNA 시료 (검정선)에 비교하여 DNA 표준 (점선)의 상대적인 변이체 대립 유전자 빈도 (상단 패널)의 전체 분포를 나타낸다.
도 29는 DNA 표준을 이용한 예시적인 DNA 시퀀싱 분석, 그리고 일치된 폐 선암과 정상적인 게놈 DNA의 비교를 나타낸다. (A) 상기 인공 염색체에 대한 판독 정렬의 빈도 분포 매핑 품질 (MAPQ) 점수. (B) DNA 표준으로부터 125nt의 서열화된 판독 길이를 따라 뉴클레오티드 불일치 (서열 판독과 인공 염색체 사이)의 상대적 분포 (C,D) 분산-플롯은 (C) 일치된 정상적인 폐 게놈 DNA 시료에 추가된 혼합물 A 또는 (D) 일치된 폐 선암 게놈 DNA 시료에 추가된 혼합물 B로 복합될 때, DNA 표준의 공지된 풍도에 비교하여 관찰된 풍도를 나타낸다. 선형 상관관계 및 기울기는 정량적 정확도를 나타낸다. (E) 분산-플롯은 DNA 표준의 공지된 농도와 비교하여 DNA 표준에 의해 나타내는 유전적 변이체의 시퀀싱 적용범위를 나타낸다. 검출 한계 (점선)은 유전적 변이가 신뢰성있게 검출되지 않는 하한 경계(bound) 농도를 나타낸다.
도 30은 DNA 표준을 이용한 유전적 변이를 식별하기 위한 예시적인 DNA 시퀀싱 분석, 그리고 일치된 폐 선암과 정상적인 게놈 DNA의 비교를 나타낸다. (A) 누적 빈도 분포 플롯은 정확하게 확인된 변이체 (검정선) 또는 실수로 확인된(점선) 변이체에 할당된 품질 점수의 분포를 나타낸다. 정확하고 확인된 변이체와 부정확하게 확인된 변이체에 대한 품질 점수의 표시된 차이는 동반된 폐 선암 게놈 DNA 시료에서 정확하게 확인된 변이체와 잘못 확인된 변이체를 구별하는데 사용될 수 있다. (B) 주상도는 정확하게 확인된 변이체와 비교하여 잘못 확인된 변이체에서 특이적 뉴클레오티드 치환들 (C에서 A로, 그리고 T에서 G로)의 풍도(enrichment)를 나타낸다. (C,D) (C) 분산-플롯은 폐 선암 게놈 DNA 시료와 혼합물 A, (D) 일치된 정상적인 폐 조직 게놈 DNA 시료와 혼합물 B로 복합된, DNA 표준의 공지된 상대적 변이체 대립유전자 빈도와 비교하여 관찰된 상대적 변이체 대립유전자 빈도 (기준 대립유전자 빈도와 비교하여)를 나타낸다. 선형 상관관계 및 기울기는 측정된 대립유전자 빈도가 관측된 정량적 정확도를 나타낸다. 전체 폐 선암 시료 안에 종양 세포의 단지 소부분들만을 품고 있을 수 있는 돌연변이를 탐지하기 위하여 대립유전자 빈도의 정확하고, 민감한 측정이 요구된다.
도 31은 공동-결합된 DNA 표준을 이용한 예시적인 DNA 시퀀싱 분석을 나타낸다. (A) 분산-플롯은 기울기 1을 나타내도록 공동-결합된 DNA 표준 집단을 강제함으로써 표준화에 따른 피펫팅 오류에 대한 표준화 (하위 패널)에 앞서, 나타낸 DNA 표준의 공지된 풍도(상위 패널)와 비교하여 개별 DNA 표준의 관찰된 풍도를 비교한다. 이를 통해 피펫팅 오류로 인한 변이의 확인 및 제거가 가능하다. (B) 다수 중첩된 공동결합된 DNA 표준은 각 공지된 풍도 지점에서 적어도 3 개의 독립적인 측정치를 제공하도록 제조된다. 피펫팅 오류로 인한 공동결합된 DNA 표준 집단 열외자(outliers)는 용이하게 확인되고, 제거될 수 있다. (C) 주상도 (상위 패널)는 3가지 독립적인 측정으로부터 각 풍도 지점에 대해 결정된 95 % 신뢰 구간을 나타낸다. 피펫팅 오류를 제거하기 위하여 DNA 표준 풍도의 표준화후 정량적 정확도가 더 높아지기 때문에 상기 95% 신뢰 구간은 두드러지게 더 작다(하위 패널).
도 32는 대규모 구조적 변이를 나타내는 DNA 표준의 예들을 나타낸다. (A) 전도, (B) 결손, (C) 삽입, (D) 복제-수 변이 및 (E) 이동 요소 삽입을 나타내도록 DNA 표준이 만들어졌다. 라이브러리 준비 및 시퀀싱을 위하여 DNA 표준은 GM12878 인간 세포 게놈 DNA와 복합되었다. 개별 서열 판독 정렬의 예시들과 함께 (회색 막대), 각 예시적인 DNA 표준의 정렬 적용범위를 나타낸다(검정 막대그래프).
도 33은 인공 D4Z4 반복을 만들기 위한 한 가지 예시적인 방법을 설명한다. (A) 단일 D4Z4 반복 복제 (회색, 화살표는 상대적 방향을 나타낸다)는 인간 게놈으로부터 회수된다. 상동성은 제거되고 (흰색 상자), 증폭되어 헤드-투-테일(head-to-tail) 반복 어레이(array)가 형성된다. 반복 복제 및 측면 상류 및 하류 절반 반복 복제는 일치되지만, 바코드 변이에 의해 구별되는 다수 DNA 표준이 만들어진다. DNA 표준의 상대적 풍도는 예측된 반복 복제 수에 비례한다. (B) 분산-플롯은 예측된 복제-수와 비교하여 각 DNA 표준(백만 단위 판독)의 관찰된 풍도를 나타낸다. 정상적인 폐, 선암, K562 및 GM12878 게놈 DNA 시료에 대한 DNA 표준과 비교함으로써 결정된 D4Z4 반복 단위 복제 수를 또한 나타낸다.
도 34는 BIOMED2 범용 프라이머 (TCRγ Tube A 및 B) 프라이머를 이용하여 인공 TCRγ 클론형 DNA 표준의 성공적인 PCR 증폭에 의해 생성된 15개 앰플리콘의 크기 및 순도를 확인하는 BioAnalyser (2100 High Sensitivity DNA Assay; Agilent) 추적(traces)을 나타낸다.
도 35는 메타게놈 DNA 표준의 분석을 나타낸다. (A) 분산플롯은 DNA 표준의 예측 농도와 비교하여 어셈블리된 DNA 표준 콘틱의 관찰된 풍도(RPKM에서 측정된)를 나타낸다. (B) 세 가지 예는 DNA 표준 농도가 콘틱 어셈블리 및 적용 범위에 미치는 영향을 보여준다. 고농도 (상위 패널)의 DNA 표준은 높은 서열 판독 적용범위와 완전한 콘틱 어셈블리를 나타내지만, 대조적으로 저풍도 (하위 패널)의 DNA 표준은 낮은 서열 판독 적용범위를 나타내고, 불충분하게 어셈블리된다. (C,D) 분산플롯은 (C) 서열화된 판독 정렬 또는 (D) 데노보 어셈블리된 콘틱과 함께 DNA 표준의 분획적 적용범위와 관련된 DNA 표준의 공지된 농도 범위를 나타낸다.
도 36은 분변(fecal) 또는 토양 미생물 DNA와 함께 이용된 DNA 표준의 예시적인 메타게놈 분석을 나타낸다. (A,B) 분산플롯은 (A) 분변 시료 복제본 1 (B) 및 분변 시료 복제본 2와 함께 이용된 DNA 표준의 예측된 풍도와 비교하여 관찰된 풍도(RPKM에서 측정된)를 나타낸다. (C) 분산-플롯은 DNA 표준의 공지된 풍도와 비교하여, 데노보(de novo)로 정확하게 어셈블리된 DNA 표준의 분획을 나타낸다. (D,E) 분산플롯은 Watsons Creek (D) 복제본 1-3 (혼합물 A) 및 (E) 복제본 4-6 (혼합물 B)의 토양 시료와 함께 이용된, DNA 표준의 예측된 풍도와 비교하여 관찰된 풍도(RPKM에서 측정된)를 나타낸다. (F) 분산플롯은 혼합물 A (토양 시료 복제본 1-3)와 혼합물 B (토양 시료 복제본 4-6) 사이에서 DNA 표준 풍도에서 예측된 배수-변화와 비교하여 관찰된 배수-변화를 나타낸다. 선형 상관관계 및 기울기는 시료 간에 측정된 DNA 풍도 배수-변화의 정량적 정확도를 나타낸다.
도 37은 GC 편향을 측정하기 위하여 생성된 DNA 표준을 만드는 한 가지 예시적인 방법을 도시한다. (A) GC 메타게놈 DNA 표준 (가는 검정선)에서 그리고 동반 토양 시료 (복제본 1; 굵은 검정선)에서 서열화된 판독의 GC 함량에 대한 누적 빈도 분포 플롯. (B) DNA 표준의 시뮬레이션된 판독의 누적 분포(점선)와 비교하여, 지나친 GC 함량을 가진 선택된 DNA 표준의 실험적으로-유도된 서열화된 판독의 누적 빈도 분포(검정선). 시뮬레이션과 관련하여 지나친 GC 함량을 가진 실험적으로-유도된 서열화된 판독의 과소-표현이 관찰된다. 이것은 라이브러리 준비 및 시퀀싱 절차에서 GC 함량의 정량적 영향을 나타낸다. (C) 토양 시료 1의 시퀀싱 동안 추가되는 DNA 표준의 GC 함량의 누적 빈도 분포.
도 38은 폴리뉴클레오티드 시퀀싱 공정을 보정하기 위한 적합한 컴퓨터 시스템 3800을 나타낸다. 상기 컴퓨터 시스템 3800은 프로그램 메모리 3804, 데이터 메모리 3806, 통신포트 3808 및 사용자 포트 3810에 연결된 프로세서 3802를 포함한다.
도 39는 NGS 방법들에서 피펫팅 오류를 조정하기 위한 공동결합된 합성 표준을 만드는 한 가지 예시적인 방법을 나타낸다. (A) 공동결합된 표준의 가능한 구성을 설명하는 개략도. (B) 가중된-표준화된 측정된 풍도와 비교하여 각 개별 표준(공동결합된 표준 안에 호스팅(hosting) 공동결합된 표준과 복제수 농도 모두로부터 유도된)의 가중된 표준화된 공지된 농도의 플롯을 나타낸다. (C) 공지된 개별 표준 농도에 대한 보정 후 만들어진 조정을 나타낸다.
도 40 (A)는 정상적인 유전자 및 융합 유전자 합성 표준의 생성을 나타낸다. (B) 실험 혼합물 안에 합성 융합 유전자의 공지된 농도와 비교하여 융합 정선을 가로 지르는 위치에서 합성 융합 유전자 적용범위의 플롯을 나타낸다.
도 41 (A)는 NA12878 게놈 (점선)과 합성 염색체 (회색선) 모두에서 단일 뉴클레오티드 변이가 확인되는 민감도를 나타내는 누적 분포 플롯이다. (B) A 누적 분포 플롯는 NA12878 게놈 (점선) 및 합성 염색체 (회색선) 모두에서 작은 삽입 또는 결손(indels)이 확인되는 민감도를 나타낸다. (C) Integrated Genome Viewer (IGV)의 스크린샷은 합성 염색체에 대한 판독 정렬에서 이형접합성 변이체를 나타낸다.
도 42 (A)는 이 혼합물 안에 존재하는 변이체 대립유전자 빈도 범위를 나타내는 개략적 플롯이다. (B) 분산-플롯은 기준 (검정 원) 및 변이체 (회색 원 아웃라인) 모두에 대한 관찰된 서열 적용범위에 비교한 예측된 변이체 대립유전자 분획을 나타낸다. (C) VarScan2에 의해 기인된 p-값 역치(변이체 대립유전자 적용범위에 대한 기준의 Fishers 정확한 테스트에 의해 산출됨)에 따라 확인된 참(true) 변이와 가(false) 변이 대립유전자의 누적 분포. (D) VarScan2에 의해 기인된 p-값 역치와 관련하여 변이체 대립유전자가 검출되는 민감도 및 특이성의 비율을 나타낸다. (E) 개략적 플롯은 태아 DNA 부하 범위에 걸쳐 태아와 모계 변이체의 예측된 대립유전자 풍도를 나타낸다. 3염색체증(trisomy) 사건들을 나타내는 변이체에 대한 예측된 풍도를 또한 나타낸다(원 아웃라인).
도 1은 본 명세서의 인공 염색체의 잠재적 구조적 특징들을 설명한다. 예시된 인공 염색체는 유전자, 대규모 구조적 변이, 질병-연관된 변이 사건들, DNA 반복 요소들 (동원체(centromeres) 및 말단소체(telomeres)포함), 면역 수용체 좌, 소규모 변이 (가령, <50nt) 이를 테면, 단일 뉴클레오티드 다형 (SNPs), 삽입 또는 결손 (InDels); 그리고 이동 요소들-유도된 서열들이 포함된 특징들을 (위에서부터 아래로) 포함한다.
도 2는 임의의 공지된 자연 서열에 대한 상동성을 제거하기 위해 서열을 뒤섞어서(셔플링) 인공 염색체를 생성하는 것을 예시한다. HOXA1 유전자의 프로모터에서 CpG 섬 (패널 A에서 검정 상자로 나타냄)과 중첩되는 공지된 DNA 서열 (패널 A)은 50nt의 창 크기로 셔플링되었다. 이로써, 50nt 해상도에서 CpG 섬 (패널 B에서 흰 상자)을 규정한 높은 CpG 디뉴클레오티드 함량을 유지하면서, 공지된 또는 천연 서열 (패널 B)과의 상동성은 제거되었다.
도 3은 상기 인공 염색체 안에서 엑손 서열과 인트론 서열이 개재된 유전자 좌(패널A)를 예시한다. (B) 엑손들의 대체 봉입에 의해 단일 유전자 좌로부터 상이한 수의 동형이 만들어질 수 있다. 아래 패널 (C)는 연속된 엑손 서열들 (끼어있는 인트론이 제거된)을 포함하도록 만들어진 RNA 표준을 나타낸다. 표시된 바의 콘센수스(consensus) 엑손들 (음영부분)과 대체(alternative) 엑손들 (흰색부분)을 가진, 상이한 동형을 나타내도록 RNA 표준이 만들어질 수 있다. 농도 범위에서 함께 대체 동형을 나타내는 RNA 표준을 복합시킴으로써, 대체 접합의 생물학적 공정은 에뮬레이트된다(emulated).
도 4는 상기 본 명세서의 인공 염색체에 포함되는 이동 요소들의 생성을 예시한다. (A) 우선 이동 요소의 단일 복제에 대응하는 서열 (회색 상자)은 인간 게놈으로부터 삭제한다. 상동성(homology)은 인공적인 오래된 이동 요소 (흰색 상자)를 만들기 위하여 제거된다. (B) 다수의 인공 이동 요소들은 개별적 서열 일탈(divergence)을 모형화하기 위하여 동시에 추가적인 뉴클레오티드 치환, 삽입 또는 결손을 치른다. 그다음 다수의 인공 이동 요소들은 상기 인공 염색체와 어셈블리된다. (C) 이동 요소 삽입을 나타내는 DNA 표준이 만들어질 수 있다. (D) 시퀀싱, 상기 인공 염색체에 정렬 (서열화된 판독(reads) 및 서열 적용범위의 주상도(histogram)로 나타냄) 및 분석으로 이 이동 요소를 식별해낼 수 있다.
도 5는 상기 본 명세서의 인공 염색체를 포함할 수 있는 인공 DNA 반복부의 특정 예시들의 생성을 도시한다. (A) 우선적으로 관심대상 DNA 반복 (이를 테면, 미소부수체, 말단소체 또는 동원체 반복 단위)의 단일 복제에 대응하는 서열이 인간 게놈으로부터 검색된다 상동성을 배제하여, 인공 ("조상전래의") 이동 반복 요소 (흰색 상자)를 만든다. (B) 상기 인공 이동 요소는 증폭된다. (C) 증폭된 인공 이동 요소들은 동시에 다수 뉴클레오티드 변화들을 겪게 되어, 개별 서열 일탈이 모형화된다. (D) 상기 인공 이동 요소는 비대칭적으로 증폭될 수 있다. (E) 상기 인공 서열은 다중 증폭 및 뉴클레오티드 변형 사이클을 거쳐, 다양한 복제 수를 갖는 다수의 반복 하위집단(subsets)을 갖는 큰 텐덤 DNA 중복을 형성한다. (E) DNA 표준은 상이한 반복 하위집단을 제시하도록 만들어질 수 있는데, DNA 표준 풍도는 반복 복제 수에 비례한다.
도 6은 본 명세서의 인공 염색체 안에 포함될 수 있는 인공적인 소규모 유전적 변이의 생성을 설명한다. (A) 단일-뉴클레오티드 다형, 삽입, 결손 등등이 포함된 소규모 유전적 변이가 인공 염색체 안으로 도입되어, 소규모 뉴클레오티드 변이를 품고 있는 변이체 인공 염색체 변이체를 형성할 수 있다. (B) 변이체 인공 염색체 서열 각각에 일치되는 다수 DNA 표준이 만들어질 수 있고, 이로 인하여 이형접합성 또는 동형접합성 대립유전자 빈도를 에뮬레이팅한다. (C) DNA 표준의 시퀀싱, 기준 인공 염색체에 정렬, 그리고 소규모 변이를 확인하기 위한 분석을 설명한다.
도 7은 본 명세서에서 상기 인공 염색체 안에 질환 연합된 인공 유전적 변이의 생성을 설명한다. (A) BRAF 돌연변이 V600E의 부위와 중첩되는 서열이 인간 게놈으로부터 검색되었다. 상기 주변 서열은 BRAF V600E 돌연변이의 부위로부터 거리를 증가함에 따라, 창 크기가 증가되면서 셔플링되었다. BRAF V600E 돌연변이 부위의 주변 12개 뉴클레오티드 서열은 셔플링되지 않았다. 셔플링된 서열은 상기 인공 염색체 안에서 어셈블리되어, 변이체 인공 염색체 서열이 만들어진다. 야생형 및 질환 연합된 BRAF V600E 돌연변이와 모두 일치하는 DNA 표준이 생성되고, 복합되어, 동형접합성 또는 이형접합성 유전자형을 에뮬레이팅하였다. (B) 분산형-플롯은 기준 DNA 표준에 대한 변이형 DNA 표준의 상대적 희석과 비교하여, 변이에 대한 서열 판독 범위의 심도 간의 관계를 나타낸다. (C) 분산형-플롯은 기준 DNA 표준에 대한 변이형 DNA 표준의 상대적 희석과 비교하여, 할당된 유전자형 (표시된 동형접합성 및 이형접합성 유전자형)과 연합된 신뢰를 설명한다.
도 8은 본 명세서의 인공 염색체 안에 혼입될 수 있는 인공적인 대규모 유전 변이를 설명한다. (A) 삽입, (B) 결손, (C) 전도, (D) 텐덤 복제 및 (E) 이동 요소 삽입을 포함하는 상이한 유형의 대규모 변이를 측정할 수 있는 DNA 표준의 예들이 설명되며, 이때 DNA 표준의 상대적 풍도는 인공 염색체 안에, 그리고 이들 사이에 특징들 이를 테면, 복제 수 변이를 에뮬레이트할 수 있다.
도 9는 본 명세서의 인공 염색체에 혼입될 수 있는 전좌(translocation)를 설명한다. (A) 상이한 2개의 인공 염색체 간의 서열은 전좌 동안 재배열될 수 있다. 설명된 실시예에서, 전좌 중단점(breakpoint)이 2개의 인공 유전자 (A1 및 B1) 사이에서 일어날 때 융합 유전자가 생성된다. 2개의 정상적인 유전자와 융합 유전자 서열을 나타내며, 동형접합성 및 이형접합성 유전자형을 에뮬레이팅하기 위하여 상이한 상대적 농도에서 복합되는 3개의 RNA 표준이 만들어질 수 있다. (B) 분산형-플롯은 2개의 정상적인 유전자 동형 RNA 표준과 비교하여 융합 유전자 RNA 표준의 분획적 희석과 비교하여, 융합 유전자 RNA 표준의 풍도를 나타낸다 (백만당 판독(RPM)으로 융합 인트론 정션을 측정). 이 분산-플롯은 첨부된 라이브러리의 정량적 정확도와 민감도의 한계를 나타낸다. 또한 동반된 K562 RNA 시료로부터 내인성 인간 BCR-ABL 융합 유전자의 풍부 또한 표시된다(점선). K562 RNA 시료는 내인성 인간 BCR-ABL 융합 유전자를 함유하지 않은 GM12878 RNA 시료과 함께 점차적으로 희석되어 적정된다. (C) 분산형 플롯은 두 가지 정상 유전자 동형 RNA 표준에 비해 융합 유전자 RNA 표준의 증가하는 희석에서 융합 정션의 확인과 관련된 유의성 (P 값)을 설명한다.
도 10은 미생물 군집을 시뮬레이팅한(simulating) 인공 염색체를 보여주고 있다. (A) 이러한 인공 염색체의 생성에서, 크기, GC%, 및 분류군(taxa)에 이르는 광범위한 미생물 게놈의 임의의 하나 또는 그 이상이 검색되고, 서플되어 천연 서열들에 대한 상동성이 제거된다. (B) 인공 염색체 내의 대표적인 부분서열(subsequences)과 일치되는 DNA 표준이 생성될 수 있다. 다양한 농도에서 이들 DNA 표준을 복합하면, 이질적인 미생물 군집이 시뮬레이션된다.
도 11은 인공 16S rRNA 표지자를 만들기 위한 방법의 한 가지 예를 설명한다. 16S rRNA 서열은 메타게놈(metagneomic) 계통 발생 분석을 위한 표지자(marker)로 사용될 수 있다. 상기 인공 미생물 게놈에서 측면 범용 프라이머 서열들이 포함된 16s rRNA 서열과 일치되는 DNA 표준이 만들어진다. 이 DNA 표준은 메타게놈 분석 동안 PCR 증폭 및 시퀀싱을 위한 주형 역할을 할 수 있다. (B) 분산플롯은 광범위한 상이한 미생물 게놈(표시된)에 상응하는 16S DNA 표준 시퀀싱으로부터 시뮬레이션된 판독 풍도를 나타낸다. (C) 분산형-플롯은 상응하는 미생물 게놈에서 rRNA 오페론 수에 따라 16S DNA 표준 풍도의 표준화를 나타낸다.
도 12는 인공적인 TCRγ 좌를 만드는 한 가지 예시적인 방법을 설명한다. (A) TCRγ 좌는 14개의 Vγ 세그먼트와 5개의 Jγ 세그먼트를 포함한다. (B) 서열들이 서플되어, 천연 서열들에 대한 상동성이 제거된다. (C) 세그먼트는 VJ 재조합 및 체세포 과다돌연변이의 생물학적 과정을 모델로 하는 과정과 결합되어, 수많은 인공적인 TCRγ 클론형이 생성된다. (D) DNA 표준은 범용 프라이머에 상보적인 서열을 유지하는 개별적인 인공 TCRβ 클론형을 나타내도록 생성될 수 있다. DNA 표준은 동반된 인간 DNA 시료에서 천연 TCRγ 유전자 좌의 PCR 증폭과 동시에 범용 프라이머를 이용한 PCR 증폭을 위한 표적 DNA 분자로 사용될 수 있다. 이로 인하여, 각 DNA 표준은 독특한 앰플리콘을 증폭시키는데, 이의 풍도는 프라이머 결합 효율 및 DNA 표준의 풍도에 비례한다.
도 13은 인공 TCRβ 좌의 한 가지 예를 설명한다. (A) TCRβ 좌는 65개의 Vβ 세그먼트, 2개의 Dβ 세그먼트 및 13개의 Jβ를 포함한다. (B) 세그먼트는 건강한 성인 시료에서 측정한 V (D) J 재조합 및 체세포 과다돌연변이의 생물학적 과정을 모델로 한 과정을 통해 결합되어, 다수의 인공 TCRβ 클론 형이 생성된다. (C) 개별 인공 TCRβ 클론형을 나타내는 DNA 표준이 만들어질 수 있다. DNA 표준은 면역 레퍼토리 시퀀싱 동안 좌의 PCR 증폭에 이용된 프라이머에 상보적인 서열들을 보유할 수 있다. 범용 프라이머로 PCR 증폭에 앞서, 단일 연속 주형이 만들어지도록 DNA 표준이 함께 결합될 수 있다. (D) 건강한 성인 대상 안에서 확인되는 클론형의 누적 빈도 분포 및 비교용으로 인공 클론형을 측정하는 DNA 표준의 상대적 풍도. 상기 인공 클론형은 천연 클론형의 동적 범위에 걸쳐 연장되는 정량적 척도를 제공하며, 풍도의 원인을 설명하고, 탐지 한계를 결정하는데 이용될 수 있다. (E) 건강한 성인 대상 안에서 발견되는 개별 V, J 및 D 세그먼트 (검정색 선으로 나타냄)의 누적 빈도 분포 및 DNA 표준으로 표시된 개별 V, J 및 D 세그먼트의 빈도 분포 (점선으로 나타냄).
도 14는 RNA 표준을 만들 수 있는 방법의 개요를 설명한다. 관심대상의 인공 염색체 서열이 합성되고, RNA 표준을 만들기 위하여 시험관내 전사에 사용되는 발현 벡터 안으로 삽입된다. RNA 표준이 정제되고, 정량화되고, 그리고 기타 RNA 표준과 혼합되어 혼합물이 형성되기 전, 적절한 농도로 희석된다. 분석용 상이한 시료에 상이한 최종 혼합물이 첨가 될 수 있다.
도 15는 DNA 표준을 만들 수 있는 방법의 개요를 설명한다. 관심 대상의 인공 염색체 서열이 합성되고, (i) 측면 프라이머들과 함께 PCR 증폭용; 또는 (ii) 측면 부위에서 제한 엔도뉴클레아제 절단을 위한 주형으로 이용되는 벡터 안으로 삽입된다. 절단된 DNA 표준이 정제되고, 정량화되고, 그리고 기타 DNA 표준과 혼합되어 혼합물이 형성되기 전, 적절한 농도로 희석된다. 분석용 상이한 시료에 상이한 최종 혼합물이 첨가 될 수 있다.
도 16은 공동-결합된 DNA 표준을 만들기 위한 하나의 예시적인 방법을 도시한다. (A) 개략도는 여러 개별 DNA 표준들이 더 큰 공동-결합된 DNA 표준 안에 결찰되는 것을 나타낸다. (B) 개별적인 DNA 표준을 서로 다른 복제 수에서 조합함으로써, 단일 공동-연합된 DNA 표준을 포함하는 개별 표준들 사이의 차등적인 풍도를 에뮬레이트할 수 있게 한다. (C) 풍도의 배수 변화는 개별 표준에 따라 상이하기 때문에, 다른 변이 원천으로부터 피펫팅으로 인한 변이를 구별해낼 수 있다. 이 경우, 공동-결합된 표준 안에 개별 DNA 표준의 공지된 풍도에 대하여 측정된 기울기의 플로팅은 피펫팅 오류 크기를 나타낸다. (D) 이 기울기에 따라 개별 DNA 표준 풍도를 표준화하면 이 오류를 표준화하고 최소화할 수 있다.
도 17은 바코드 변이를 만드는 한 가지 예시적인 방법을 설명한다. 연속 또는 비-연속 뉴클레오티드 서열들이 RNA 또는 DNA 표준 서열 안으로 치환될 수 있다. 시퀀싱 후, 상기 바코드는 다수 동일한 DNA 또는 RNA 표준 또는 유도체 서열화된 판독을 구별하는데 이용될 수 있다.
도 18은 차세대 시퀀싱 실험 동안 상기 인공 염색체들과 동반 RNA/DNA 표준의 사용 예의 개략적 개요를 설명한다. 상기 RNA/DNA 표준은 라이브러리 준비 및 시퀀싱에 앞서, 관심 대상의 RNA/DNA 시료에 추가된다. 상기 서열화된 판독은 관심대상의 기준 게놈 뿐만 아니라 상기 인공 염색체에 동시에 배열된다. 상기 인공 염색체에 대한 서열화된 판독의 정렬 및 어셈블리는 동반 기준 게놈 분석을 보정하는데 이용될 수 있다.
도 19는 RNA 시퀀싱 실험에서 RNA 표준의 사용에 대한 개략적 개요를 설명한다. DNA 표준을 사용하여 평가할 수 있는 분석적 측면들이 표시된다(점선으로된 상자).
도 20은 게놈 시퀀싱 실험에서 DNA 표준의 사용에 대한 개략적 개요를 설명한다. DNA 표준을 사용하여 평가할 수 있는 분석적 측면들이 표시된다(점선으로된 상자).
도 21은 메타게놈 시퀀싱 실험에서 DNA 표준의 사용에 대한 개략적 개요를 설명한다. DNA 표준을 사용하여 평가할 수 있는 분석적 측면들이 표시된다(점선으로된 상자).
도 22는 RNA 표준 및 K562 전체 세포 RNA를 사용하는 RNA 시퀀싱 분석의 한 예를 설명한다. 분산플롯은 RNA 표준의 풍도에 대하여 (A) 인트론 및 (B) 엑손 발견의 감도를 나타낸다. 이것은 검출 한계를 나타내며, 그 이하에서는 전사체는 확고한 어셈블리를 가능하게 하는 범위를 충분히 보유하지 못한다. (C) 분산플롯은 RNA 표준의 공지된 풍도에 비례하여 RNA 표준의 관측된 정량적 측정과 관련된 신뢰를 나타낸다.
도 23은 RNA 표준 및 K562 전체 세포 RNA를 사용하는 RNA 시퀀싱 분석으로부터 판독의 정렬을 설명한다. (A-E) 인공 염색체 상에 코딩된 다수의 동형을 포함하는 유전자 좌의 5 가지 예가 설명된다. RNA 표준의 시퀀싱으로부터 생성된 판독은 인공 염색체에 정렬된다. 연속 정렬은 검정 막대로 표시되고, 정렬이 분열된 영역들은 가는 선으로 표시된다. 그 다음 판독 정렬의 중첩은 인트론과 엑손들 그리고 대체 접합 사건들이 포함된, 전장 유전자 좌 구조를 어셈블리하는데 이용된다. 주상도는 누적 판독 정렬의 서열 적용 범위를 나타낸다.
도 24는 인간 세포 RNA 시료를 이용한 RNA 표준의 RNA 시퀀싱 분석으로부터의 정량적 분석을 예시한다. (A, B) 분산-플롯은 (A) K562 인간 세포 RNA 시료와 혼합물 A 또는 (B) GM12878 인간 세포 RNA 시료와 혼합물 B로 복합될 때, 유전자를 나타내는 RNA 표준의 공지된 풍도와 비교하여 관찰된 풍도(RPKM에서 측정)를 나타낸다. 선형 상관관계와 기울기는 각 RNA 시퀀싱 라이브러리의 정량적 정확도를 나타낸다. (C) 분산-플롯은 혼합물 A (K562 RNA에 추가됨)과 혼합물 B (GM12878 RNA에 추가됨) 사이에서 풍도의 예상 배수-변화와 비교하여 유전자 RNA 표준 풍도에서 관찰된 배수-변화를 나타낸다. (D, E) 분산플롯은 (D) K562 RNA 시료에 추가된 혼합물 A 또는 (E) GM12878 RNA 시료에 추가된 혼합물 B로 복합될 때, 각 RNA 표준에 의해 나타나는 개별 동형의 관찰된 풍도를 나타낸다. (F) 분산-플롯은 혼합물 A와 혼합물 B 사이에 풍도에서의 예측된 배수-변화에 비교하여 동형 RNA 표준 풍도에서 관찰된 배수-변화를 나타낸다. 개별 동형 간에 배수 변화는 대체 접합을 에뮬레이트한다.
도 25는 접합된(spliced) RNA 표준의 한 가지 사용 예를 설명한다. (A) 분산-플롯은 RNA 표준에 의해 나타난 각 유전자의 변이체 및 기준 동형의 관찰된 상대적 풍도를 나타낸다. (B) 상자-위스커(whisker) 플롯 (최저-최대)은 예측된 동형 배수-변화와 비교하여, 혼합물 A (K562 RNA 시료에 추가된)와 혼합물 B (GM128787 RNA 시료에 추가된) 사이의 동형의 관찰된 배수 변화를 나타낸다. (B) 이 실시예에서, 상기 인공 염색체 상의 단일 유전자 좌는 구성적 엑손들을 공유하지만, 3' 대체 엑손들과 종료 부위에서는 상이한 2가지 독특한 동형 (R_10_2_R 및 R_10_2_V)을 인코드한다. 혼합물 A에 대한 상이한 방식 (3:1 비율)과 혼합물 B에 대한 역 방식 (1:3 비율)에서 각 동형을 나타내는 RNA 표준을 만들었다. (B) 플롯은 혼합물 A와 혼합물 B에서 R_10_2 유전자 및 R_10_2_R 및 R_10_2_V 동형의 예측된(점선) 발현과 비교하여 관찰된 발현 (최저에서 최대를 보여주는 상자-위스커 플롯 ; n=3)을 나타낸다.
도 26은 RNA 표준 및 ERCC RNA Spike-ins의 정량적 비교를 나타낸다. (A) 분산-플롯은 RNA 표준 (회색)과 비교하여, ERCC RNA Spike-Ins (검정)의 공지된 농도에 대한 관찰된 풍도(RPKM에서 측정됨)을 비교한 것을 나타낸다. 표준 편차를 나타내는 오차 막대가 있는 3 개의 복제본(replicate)을 기반으로 한다. 검출 한계는 알려진 농도의 RNA 표준을 나타내며, 그 이하에서는 표본 추출이 드물고 가변적이다. (B) RNA 표준 (회색)에 대한 ERCC RNA Spike-Ins (검정)는 유사한 선형 프로파일 및 검출 한계 이상의 상관관계를 나타낸다. (C) 분산-플롯은 ERCC RNA Spike-Ins에 대한 예측 변수-변화와 비교하여 관찰된 배수-변화(검정) 및 혼합물 A (정상적인 폐 RNA 시료에 추가된)와 혼합물 B (일치된 폐 선암 RNA 시료에 추가된) 사이에 RNA 표준 풍도(회색)를 나타내고, (D) 암 유전자 발현 (검정선)의 누적 빈도 분포. 추가된 RNA 표준의 측정된 풍도는 동반 폐 선암종 RNA 시료 내에서 내생성 암 유전자의 농도를 측정하는 중첩되는 정량적 기준 사다리(ladder)를 제공하기 위해 표시된다 (점선).
도 27은 마우스 간 RNA 시료에 추가된 (A) 유전자 또는 (B) 개별 동형을 나타내는 RNA 표준의 공지된 풍도와 비교하여 관찰된 풍도(RPKM에서 측정)를 나타내는 분산 플롯을 나타낸다. 선형 상관관계 및 기울기는 RNA 시퀀싱 라이브러리의 정량적 정확도를 나타낸다.
도 28은 DNA 표준 및 GM21878 게놈 DNA을 이용한 예시적인 DNA 시퀀싱 분석을 나타낸다. (A) 분산-플롯은 DNA 표준의 공지된 풍도와 비교하여 DNA 표준의 측정된 풍도(RPKM에서)를 비교한다. (B) 분산-플롯은 DNA 표준의 공지된 농도와 비교하여 DNA 표준에 의해 나타내는 유전적 변이체의 정렬 배수-적용범위를 나타낸다. (C) 분산-플롯은 공지된 변이체 대립유전자 빈도에 비교하여 관찰된 변이체 대립유전자 빈도를 나타낸다. 변이체 대립유전자 빈도는 기준 대립유전자 빈도에 비교하여 나타낸다. 선형 상관관계 및 기울기는 관찰된 대립유전자 빈도가 관측된 정량적 정확도를 나타낸다. (D) 분산-플롯은 마우스 게놈 DNA과 함께 분석에 이용될 때, DNA 표준의 공지된 풍도와 비교하여 DNA 표준의 측정된 풍도(RPKM에서)를 비교한다. (E) 누적 빈도 분포 플롯은 (상위 패널) PHRED 품질(quality) 점수, (중간 패널) 배수 적용범위 또는 (하위 패널) 동반 GM12878 게놈 DNA 시료 (검정선)에 비교하여 DNA 표준 (점선)의 상대적인 변이체 대립 유전자 빈도 (상단 패널)의 전체 분포를 나타낸다.
도 29는 DNA 표준을 이용한 예시적인 DNA 시퀀싱 분석, 그리고 일치된 폐 선암과 정상적인 게놈 DNA의 비교를 나타낸다. (A) 상기 인공 염색체에 대한 판독 정렬의 빈도 분포 매핑 품질 (MAPQ) 점수. (B) DNA 표준으로부터 125nt의 서열화된 판독 길이를 따라 뉴클레오티드 불일치 (서열 판독과 인공 염색체 사이)의 상대적 분포 (C,D) 분산-플롯은 (C) 일치된 정상적인 폐 게놈 DNA 시료에 추가된 혼합물 A 또는 (D) 일치된 폐 선암 게놈 DNA 시료에 추가된 혼합물 B로 복합될 때, DNA 표준의 공지된 풍도에 비교하여 관찰된 풍도를 나타낸다. 선형 상관관계 및 기울기는 정량적 정확도를 나타낸다. (E) 분산-플롯은 DNA 표준의 공지된 농도와 비교하여 DNA 표준에 의해 나타내는 유전적 변이체의 시퀀싱 적용범위를 나타낸다. 검출 한계 (점선)은 유전적 변이가 신뢰성있게 검출되지 않는 하한 경계(bound) 농도를 나타낸다.
도 30은 DNA 표준을 이용한 유전적 변이를 식별하기 위한 예시적인 DNA 시퀀싱 분석, 그리고 일치된 폐 선암과 정상적인 게놈 DNA의 비교를 나타낸다. (A) 누적 빈도 분포 플롯은 정확하게 확인된 변이체 (검정선) 또는 실수로 확인된(점선) 변이체에 할당된 품질 점수의 분포를 나타낸다. 정확하고 확인된 변이체와 부정확하게 확인된 변이체에 대한 품질 점수의 표시된 차이는 동반된 폐 선암 게놈 DNA 시료에서 정확하게 확인된 변이체와 잘못 확인된 변이체를 구별하는데 사용될 수 있다. (B) 주상도는 정확하게 확인된 변이체와 비교하여 잘못 확인된 변이체에서 특이적 뉴클레오티드 치환들 (C에서 A로, 그리고 T에서 G로)의 풍도(enrichment)를 나타낸다. (C,D) (C) 분산-플롯은 폐 선암 게놈 DNA 시료와 혼합물 A, (D) 일치된 정상적인 폐 조직 게놈 DNA 시료와 혼합물 B로 복합된, DNA 표준의 공지된 상대적 변이체 대립유전자 빈도와 비교하여 관찰된 상대적 변이체 대립유전자 빈도 (기준 대립유전자 빈도와 비교하여)를 나타낸다. 선형 상관관계 및 기울기는 측정된 대립유전자 빈도가 관측된 정량적 정확도를 나타낸다. 전체 폐 선암 시료 안에 종양 세포의 단지 소부분들만을 품고 있을 수 있는 돌연변이를 탐지하기 위하여 대립유전자 빈도의 정확하고, 민감한 측정이 요구된다.
도 31은 공동-결합된 DNA 표준을 이용한 예시적인 DNA 시퀀싱 분석을 나타낸다. (A) 분산-플롯은 기울기 1을 나타내도록 공동-결합된 DNA 표준 집단을 강제함으로써 표준화에 따른 피펫팅 오류에 대한 표준화 (하위 패널)에 앞서, 나타낸 DNA 표준의 공지된 풍도(상위 패널)와 비교하여 개별 DNA 표준의 관찰된 풍도를 비교한다. 이를 통해 피펫팅 오류로 인한 변이의 확인 및 제거가 가능하다. (B) 다수 중첩된 공동결합된 DNA 표준은 각 공지된 풍도 지점에서 적어도 3 개의 독립적인 측정치를 제공하도록 제조된다. 피펫팅 오류로 인한 공동결합된 DNA 표준 집단 열외자(outliers)는 용이하게 확인되고, 제거될 수 있다. (C) 주상도 (상위 패널)는 3가지 독립적인 측정으로부터 각 풍도 지점에 대해 결정된 95 % 신뢰 구간을 나타낸다. 피펫팅 오류를 제거하기 위하여 DNA 표준 풍도의 표준화후 정량적 정확도가 더 높아지기 때문에 상기 95% 신뢰 구간은 두드러지게 더 작다(하위 패널).
도 32는 대규모 구조적 변이를 나타내는 DNA 표준의 예들을 나타낸다. (A) 전도, (B) 결손, (C) 삽입, (D) 복제-수 변이 및 (E) 이동 요소 삽입을 나타내도록 DNA 표준이 만들어졌다. 라이브러리 준비 및 시퀀싱을 위하여 DNA 표준은 GM12878 인간 세포 게놈 DNA와 복합되었다. 개별 서열 판독 정렬의 예시들과 함께 (회색 막대), 각 예시적인 DNA 표준의 정렬 적용범위를 나타낸다(검정 막대그래프).
도 33은 인공 D4Z4 반복을 만들기 위한 한 가지 예시적인 방법을 설명한다. (A) 단일 D4Z4 반복 복제 (회색, 화살표는 상대적 방향을 나타낸다)는 인간 게놈으로부터 회수된다. 상동성은 제거되고 (흰색 상자), 증폭되어 헤드-투-테일(head-to-tail) 반복 어레이(array)가 형성된다. 반복 복제 및 측면 상류 및 하류 절반 반복 복제는 일치되지만, 바코드 변이에 의해 구별되는 다수 DNA 표준이 만들어진다. DNA 표준의 상대적 풍도는 예측된 반복 복제 수에 비례한다. (B) 분산-플롯은 예측된 복제-수와 비교하여 각 DNA 표준(백만 단위 판독)의 관찰된 풍도를 나타낸다. 정상적인 폐, 선암, K562 및 GM12878 게놈 DNA 시료에 대한 DNA 표준과 비교함으로써 결정된 D4Z4 반복 단위 복제 수를 또한 나타낸다.
도 34는 BIOMED2 범용 프라이머 (TCRγ Tube A 및 B) 프라이머를 이용하여 인공 TCRγ 클론형 DNA 표준의 성공적인 PCR 증폭에 의해 생성된 15개 앰플리콘의 크기 및 순도를 확인하는 BioAnalyser (2100 High Sensitivity DNA Assay; Agilent) 추적(traces)을 나타낸다.
도 35는 메타게놈 DNA 표준의 분석을 나타낸다. (A) 분산플롯은 DNA 표준의 예측 농도와 비교하여 어셈블리된 DNA 표준 콘틱의 관찰된 풍도(RPKM에서 측정된)를 나타낸다. (B) 세 가지 예는 DNA 표준 농도가 콘틱 어셈블리 및 적용 범위에 미치는 영향을 보여준다. 고농도 (상위 패널)의 DNA 표준은 높은 서열 판독 적용범위와 완전한 콘틱 어셈블리를 나타내지만, 대조적으로 저풍도 (하위 패널)의 DNA 표준은 낮은 서열 판독 적용범위를 나타내고, 불충분하게 어셈블리된다. (C,D) 분산플롯은 (C) 서열화된 판독 정렬 또는 (D) 데노보 어셈블리된 콘틱과 함께 DNA 표준의 분획적 적용범위와 관련된 DNA 표준의 공지된 농도 범위를 나타낸다.
도 36은 분변(fecal) 또는 토양 미생물 DNA와 함께 이용된 DNA 표준의 예시적인 메타게놈 분석을 나타낸다. (A,B) 분산플롯은 (A) 분변 시료 복제본 1 (B) 및 분변 시료 복제본 2와 함께 이용된 DNA 표준의 예측된 풍도와 비교하여 관찰된 풍도(RPKM에서 측정된)를 나타낸다. (C) 분산-플롯은 DNA 표준의 공지된 풍도와 비교하여, 데노보(de novo)로 정확하게 어셈블리된 DNA 표준의 분획을 나타낸다. (D,E) 분산플롯은 Watsons Creek (D) 복제본 1-3 (혼합물 A) 및 (E) 복제본 4-6 (혼합물 B)의 토양 시료와 함께 이용된, DNA 표준의 예측된 풍도와 비교하여 관찰된 풍도(RPKM에서 측정된)를 나타낸다. (F) 분산플롯은 혼합물 A (토양 시료 복제본 1-3)와 혼합물 B (토양 시료 복제본 4-6) 사이에서 DNA 표준 풍도에서 예측된 배수-변화와 비교하여 관찰된 배수-변화를 나타낸다. 선형 상관관계 및 기울기는 시료 간에 측정된 DNA 풍도 배수-변화의 정량적 정확도를 나타낸다.
도 37은 GC 편향을 측정하기 위하여 생성된 DNA 표준을 만드는 한 가지 예시적인 방법을 도시한다. (A) GC 메타게놈 DNA 표준 (가는 검정선)에서 그리고 동반 토양 시료 (복제본 1; 굵은 검정선)에서 서열화된 판독의 GC 함량에 대한 누적 빈도 분포 플롯. (B) DNA 표준의 시뮬레이션된 판독의 누적 분포(점선)와 비교하여, 지나친 GC 함량을 가진 선택된 DNA 표준의 실험적으로-유도된 서열화된 판독의 누적 빈도 분포(검정선). 시뮬레이션과 관련하여 지나친 GC 함량을 가진 실험적으로-유도된 서열화된 판독의 과소-표현이 관찰된다. 이것은 라이브러리 준비 및 시퀀싱 절차에서 GC 함량의 정량적 영향을 나타낸다. (C) 토양 시료 1의 시퀀싱 동안 추가되는 DNA 표준의 GC 함량의 누적 빈도 분포.
도 38은 폴리뉴클레오티드 시퀀싱 공정을 보정하기 위한 적합한 컴퓨터 시스템 3800을 나타낸다. 상기 컴퓨터 시스템 3800은 프로그램 메모리 3804, 데이터 메모리 3806, 통신포트 3808 및 사용자 포트 3810에 연결된 프로세서 3802를 포함한다.
도 39는 NGS 방법들에서 피펫팅 오류를 조정하기 위한 공동결합된 합성 표준을 만드는 한 가지 예시적인 방법을 나타낸다. (A) 공동결합된 표준의 가능한 구성을 설명하는 개략도. (B) 가중된-표준화된 측정된 풍도와 비교하여 각 개별 표준(공동결합된 표준 안에 호스팅(hosting) 공동결합된 표준과 복제수 농도 모두로부터 유도된)의 가중된 표준화된 공지된 농도의 플롯을 나타낸다. (C) 공지된 개별 표준 농도에 대한 보정 후 만들어진 조정을 나타낸다.
도 40 (A)는 정상적인 유전자 및 융합 유전자 합성 표준의 생성을 나타낸다. (B) 실험 혼합물 안에 합성 융합 유전자의 공지된 농도와 비교하여 융합 정선을 가로 지르는 위치에서 합성 융합 유전자 적용범위의 플롯을 나타낸다.
도 41 (A)는 NA12878 게놈 (점선)과 합성 염색체 (회색선) 모두에서 단일 뉴클레오티드 변이가 확인되는 민감도를 나타내는 누적 분포 플롯이다. (B) A 누적 분포 플롯는 NA12878 게놈 (점선) 및 합성 염색체 (회색선) 모두에서 작은 삽입 또는 결손(indels)이 확인되는 민감도를 나타낸다. (C) Integrated Genome Viewer (IGV)의 스크린샷은 합성 염색체에 대한 판독 정렬에서 이형접합성 변이체를 나타낸다.
도 42 (A)는 이 혼합물 안에 존재하는 변이체 대립유전자 빈도 범위를 나타내는 개략적 플롯이다. (B) 분산-플롯은 기준 (검정 원) 및 변이체 (회색 원 아웃라인) 모두에 대한 관찰된 서열 적용범위에 비교한 예측된 변이체 대립유전자 분획을 나타낸다. (C) VarScan2에 의해 기인된 p-값 역치(변이체 대립유전자 적용범위에 대한 기준의 Fishers 정확한 테스트에 의해 산출됨)에 따라 확인된 참(true) 변이와 가(false) 변이 대립유전자의 누적 분포. (D) VarScan2에 의해 기인된 p-값 역치와 관련하여 변이체 대립유전자가 검출되는 민감도 및 특이성의 비율을 나타낸다. (E) 개략적 플롯은 태아 DNA 부하 범위에 걸쳐 태아와 모계 변이체의 예측된 대립유전자 풍도를 나타낸다. 3염색체증(trisomy) 사건들을 나타내는 변이체에 대한 예측된 풍도를 또한 나타낸다(원 아웃라인).
일반
본 명세서 전반에 걸쳐, 달리 구체적으로 언급되거나 문맥 상 달리 요구되지 않는 한, 단일 단계, 물질의 조성, 단계의 그룹 또는 물질의 조성의 군은 하나 및 다수(가령, 하나 또는 그 이상의)의 단계, 물질의 조성, 단계 그룹, 또는 물질의 조성물의 그룹을 포함하는 것으로 간주되어야 한다.
명세서에서 사용된 바와 같이, 단수 형태("a", "and" 및 "the")는 문맥에 따라 달리 명시되지 않는 한, 이러한 단어의 복수 형태를 포함한다.
용어 "및/또는", 가령, "X 및/또는 Y"는 "X와 Y" 또는 "X 또는 Y"를 의미하는 것으로 이해될 것이며, 이들 두 의미 또는 이들중 하나의 의미에 대한 명시적 뒷받침을 제공하는 것으로 간주된다.
명세서를 통하여, 단어 "포함하다" 또는 변형, 이를 테면, "포함하다" 또는 "포함하는"은 언급된 요소, 숫자, 또는 단계, 또는 요소들, 숫자 또는 단계들의 집단을 포함하지만, 그러나, 임의의 기타 요소, 숫자, 또는 단계, 또는 요소들, 숫자들, 또는 단계들의 집단을 배제하는 것은 아니라는 것을 의미한다.
명세서에서 사용된 바와 같이, 용어 "약(about)"이란 명시된 값의 +/- 10% 범위를 지칭한다.
인공 염색체:
본 명세서에서 공개된 인공 염색체는 물리적 폴리뉴클레오티드 서열로 만들어지거나 또는 컴퓨터 (가상환경(in silico))에서 만들어지고, 저장될 수 있다. 본 명세서에서 설명된 많은 응용부분의 경우, 상기 인공 염색체는 가상환경에서 유지되는 것으로 충분하다. 그러나, 상기 인공 염색체의 물리적 폴리뉴클레오티드 서열들은 폴리뉴클레오티드 생성을 위한 잘-공지된 표준 방법들을 이용하여 만들어질 수 있다.
본 명세서에서 공개된 인공 염색체는 DNA 또는 RNA 폴리뉴클레오티드 서열을 포함할 수 있다. 따라서, 폴리뉴클레오티드 서열에 대한 본 명세서에 대한 임의의 참증은 DNA 서열에 대한 참증 또는 RNA 서열에 대한 참증으로 이해될 수 있다.
상기 인공 염색체의 정확한 길이는 상기 인공 염색체가 기획되는 특정 용도에 따라 변화될 수 있다. 예를 들면, 상기 인공 염색체의 길이는 약 103 내지 109의 뉴클레오티드 길이 범위가 될 수 있다. 한 실시예에서, 상기 인공 염색체는 최소한 1,800개 길이의 뉴클레오티드인, 폴리뉴클레오티드 서열을 포함하거나, 또는 구성된다. 또다른 실시예에서, 상기 인공 염색체는 20개 미만의 메가베이스 (Mb; 이때 1 Mb는 1,000,000개 뉴클레오티드에 대등하고) 길이가 되는 폴리뉴클레오티드 서열을 포함하거나, 또는 구성된다. 따라서, 상기 인공 염색체는 예를 들면, 1,800 개 내지 20Mb 길이의 뉴클레오티드 길이일 수 있다.
상기 인공 염색체는 인공 폴리뉴클레오티드 서열을 포함하며, 이때 상기 인공 폴리뉴클레오티드 서열의 임의의 단편은 임의의 공지된 자연 발생적 게놈 서열과 구별가능하다. 상기 인공 폴리뉴클레오티드 서열의 한 가지 장점은 이러한 단편을 관심대상의 천연 폴리뉴클레오티드 표적이 포함된 시료에 직접적으로 추가할 수 있지만, 한편 이 시료 안에 존재하는 임의의 천연 폴리뉴클레오티드와 여전히 구별가능하다는 것이다. 상기 인공 염색체는 공지된 천연 게놈 서열들과 일부 상동성 (또는 서열 동일성)을 공유하는 추가 서열들을 포함할 수 있다는 것을 인지할 것이다. 임의의 이러한 추가 서열들은 상기 인공 염색체의 상기 인공 폴리뉴클레오티드 서열 안에 포함되지 않는다.
상기 인공 폴리뉴클레오티드 서열은 임의의 비율의 인공 염색체를 형성할 수 있다. 따라서, 상기 인공 폴리뉴클레오티드 서열은 1% 내지 100%의 상기 인공 염색체를 포함할 수 있다. 예를 들면, 상기 인공 폴리뉴클레오티드 서열은 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 95%의 인공 염색체를 포함할 수 있다. 한 실시예에서, 상기 인공 폴리뉴클레오티드 서열은 다수의 인공 염색체를 형성한다. 따라서, 상기 인공 폴리뉴클레오티드 서열은 50% 또는 그 이상의, 60% 또는 그 이상의, 70% 또는 그 이상의, 80% 또는 그 이상의, 90% 또는 그 이상의, 95% 또는 그 이상의, 99% 또는 그 이상의 인공 염색체를 형성할 수 있다. 또다른 특정 실시예에서, 상기 인공 폴리뉴클레오티드 서열은 100%의 인공 염색체를 형성한다.
상기 인공 폴리뉴클레오티드 서열의 길이는 변화될 수 있다. 상기 인공 폴리뉴클레오티드 서열의 길이는 전체 길이의 인공 염색체일 수 있다. 따라서, 상기 인공 폴리뉴클레오티드 서열의 길이는 약 103 내지 109개의 뉴클레오티드 길이 범위일 수 있다. 한 실시예에서, 상기 인공 폴리뉴클레오티드 서열은 최소한 1,800개 길이의 뉴클레오티드이다. 또다른 실시예에서, 상기 인공 폴리뉴클레오티드 서열은 20 Mb 미만의 길이다. 따라서, 상기 인공 폴리뉴클레오티드 서열은 예를 들면, 1,800개의 뉴클레오티드 길이 내지 20Mb 길이다. 또다른 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 길이는 상기 본 명세서에서 공개된 단편의 길이와 동일할 수 있다. 예를 들면, 상기 인공 폴리뉴클레오티드 서열의 길이는 예를 들면, 20개의 뉴클레오티드 내지 10,000,000 개의 뉴클레오티드 길이일 수 있다.
상기 인공 염색체의 인공 폴리뉴클레오티드 서열은 임의의 공지된 자연 발생적 서열 (가령, 임의의 살아있는 유기체로부터 단리된 임의의 폴리뉴클레오티드 서열과)과 상동성이 없거나 또는 거의 없다. 따라서, 본 명세서에서 공개된 염색체는 "인공(artificial)" 염색체로 설명된다. 당분야에 공지된 임의의 적합한 서열 비교 방법을 이용하여, 임의의 공지된 자연 발생적 폴리뉴클레오티드 서열과 상기 인공 염색체의 인공 폴리뉴클레오티드 서열과의 비교에 의해 상동성 정도가 결정될 수 있다. 상기 인공 염색체의 인공 폴리뉴클레오티드 서열과 임의의 공지된 자연 발생적 폴리뉴클레오티드 서열 간의 공유된 서열 동일성이 없거나 또는 거의 없다는 것은 상기 인공 폴리뉴클레오티드 서열은 임의의 공지된 자연 발생적 서열에 대하여 상동성이 없거나 또는 거의 없다는 것을 나타낸다.
상기 인공 염색체의 인공 폴리뉴클레오티드 서열은 완전히 인공적일 수 있으며, 그리고 임의의 공지된 자연 발생적 서열에 대하의 임의의 상동성을 보유하지 않을 수 있다. 따라서, 상기 인공 염색체 서열은 임의의 공지된 자연 발생적 뉴클레오티드 서열과 서열 동일성을 공유하지 않을 수 있다.
한 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 10,000,000개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가진다. 또다른 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 1,000,000개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가진다. 기타 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 500,000개, 임의의 100,000개, 임의의 50,000개, 임의의 10,000개, 임의의 1,000개, 임의의 500개, 임의의 400개, 임의의 300개, 임의의 250개, 임의의 200개, 임의의 150개, 임의의 100개, 또는 임의의 50개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 서열 동일성을 가진다. 특정 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 250개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가진다. 또다른 특정 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 150개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가진다. 특정 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 100개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의 서열 동일성을 가진다. 본 명세서에서 공개된 임의의 상기 인공 폴리뉴클레오티드 서열들에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 10,000,000개, 임의의 1,000,000개, 임의의 500,000개, 임의의 100,000개, 임의의 50,000개, 임의의 10,000개, 임의의 1,000개, 임의의 500개, 임의의 400개, 임의의 300개, 임의의 250개, 임의의 200개, 임의의 150개, 임의의 100개, 임의의 50개, 임의의 25개, 임의의 21개 또는 임의의 20개의 연속 뉴클레오티드는 임의의 조합 또는 순열(permutation)에서 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 100% 미만의, 95% 미만의, 90% 미만의, 80% 미만의, 70% 미만의, 60% 미만의, 50% 미만의, 40% 미만의, 30% 미만의, 20% 미만의, 10% 미만의, 5% 미만의, 또는 1% 미만의 서열 동일성을 갖는다. 따라서, 예를 들면, 상기 인공 폴리뉴클레오티드 서열의 임의의 21개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 50% 미만의, 40% 미만의, 30% 미만의, 20% 미만의, 10% 미만의, 5% 미만의, 또는 1% 미만의 서열 동일성을 갖는다. 하나의 특정 실시예에서, 상기 인공 폴리뉴클레오티드 서열의 임의의 21개의 연속 뉴클레오티드는 동일한 길이의 임의의 공지된 자연 발생적 게놈 서열과 50% 미만의 서열 동일성을 갖는다.
상기 인공 염색체의 작은 부분 (가령, 8, 9, 10, 11, 12, 13, 14 또는 15개의 연속 뉴클레오티드)는 동일한 길이의 임의의 공지된 자연 발생적 뉴클레오티드 서열들과 상동성일 수 있다. 예를 들면, 상기 인공 염색체의 이러한 작은 부분은 관심대상의 서열 변이를 포함하는 공지된 자연 발생적 뉴클레오티드 서열의 작은 부분을 복제할 수 있다. 예를 들면, 상기 인공 염색체의 작은 부분 (가령, 8, 9, 10, 11, 12, 13, 14 또는 15개의 연속 뉴클레오티드)은 관심대상의 서열 변이체, 이를 테면, 특정 유전자에서 돌연변이를 포함하는 공지된 자연 발생적 뉴클레오티드 서열에 대하여 이의 길이에 걸쳐 100% 동일할 수 있다. 상기 인공 염색체 서열의 대부분은 임의의 공지된 자연 발생적 뉴클레오티드 서열과 상동성을 공유하지 않거나 또는 거의 공유하지 않을 수 있고 (그리고 따라서, 인공 폴리뉴클레오티드 서열일 수 있으며), 한편 상기 인공 염색체는 관심대상의 하나 또는 그 이상의 이러한 작은 부분들 또는 특정 서열들을 추가적으로 포함할 수 있다.
상기 인공 염색체가 공지된 자연 발생적 뉴클레오티드 서열과 일부 서열 동일성을 공유하는 폴리뉴클레오티드 서열을 포함하거나, 또는 이로 구성될 때, 상기 인공 염색체는 기능적 mRNA, rRNA, tRNA, lncRNA, snRNA, snoRNA 또는 기능적 폴리펩티드 또는 단백질을 인코드하지 않을 수 있다.
본 명세서에서 공개된 인공 염색체의 인공 폴리뉴클레오티드 서열은 자연 발생적 폴리뉴클레오티드 서열들(가령, 자연 발생적 염색체들)의 하나 또는 그 이상의 일반적인 특징을 포함할 수 있지만, 임의의 공지된 자연 발생적 폴리뉴클레오티드 서열과 일차 뉴클레오티드 서열 동일성을 공유하지는 않는다. 따라서, 본 명세서에서 공개된 인공 염색체의 단편은 자연 발생적 폴리뉴클레오티드 서열들의 하나 또는 그 이상의 일반적인 특징을 포함할 수 있다. 예를 들면, 상기 인공 폴리뉴클레오티드 서열은 진핵성 및/또는 원핵성 염색체 또는 게놈에서 전형적으로 관찰되는 유전자, 반복 요소들, 이동 요소들, 소규모 유전적 변이, 대규모 유전적 변이, 등등을 포함한 (그러나, 이에 국한되지 않는), 유전적 특징들을 인코드할 수 있다. 도 1은 이러한 예시적인 특징들을 설명하는데, 이들중 임의의 하나 또는 그 이상는 본 명세서에서 공개된, 임의의 조합의 인공 폴리뉴클레오티드 서열에 포함될 수 있다.
인공 염색체의 생성:
본 명세서는 본 명세서에서 공개된 인공 염색체 또는 이의 단편을 만드는 (또는 "작제하는") 방법을 또한 제공한다. 추가적으로, 본 명세서는 본 명세서에서 공개된 임의의 하나 또는 그 이상의 방법들에 의해 만들어진 (또는 "작제된") 인공 염색체 또는 이의 단편을 제공한다. 본 명세서에서 공개된 인공 염색체는 본 명세서에서 설명된 바와 같이, 다수의 적합한 방법에 의해 작제될 수 있다. 예를 들면, 상기 인공 염색체는 연장된 연속 폴리뉴클레오티드 서열이 형성되도록 뉴클레오티드를 무작위로 추가함으로써 다른 공지된 자연 발생적 서열들에 대하여 서열 동일성이 없거나 또는 거의 없는 연속 폴리뉴클레오티드 서열을 가상환경(in silico )에서 만듦으로써 작제될 수 있다. 인공 염색체 서열을 만드는데 이용될 수 있는 적합한 소프트웨어 프로그램은 다음을 포함한다 (예로써, 그러나 이에 국한되지 않음): 무작위 DNA 서열들을 만들기 위한 소프트웨어, 이를 테면, FaBox (Villesen 2007) 또는 RANDNA(Piva and Principato 2006); DNA 서열들을 셔플하기 위한 소프트웨어, 이를 테면, uShuffle (Jiang, Anderson et al. 2008) 그리고 Shufflet (Coward 1999).
대안적으로, 천연 원천으로부터 확인된 또는 공지된 천연 뉴클레오티드 서열을 검색하고 (이는 본 명세서에서 "주형" 서열로 지칭될 수 있고), 그리고 상기 뉴클레오티드를 셔플링하여 또는 ("재배열하여") 임의의 공지된 자연 발생적 폴리뉴클레오티드 서열과 상기 주형 서열의 공유된 서열 동일성을 제거 또는 감소시킴으로써, 상기 인공 염색체가 작제될 수 있다. 한 실시예에서, 상기 인공 염색체의 모든 뉴클레오티드가 함께 셔플링되어, 뉴클레오티드 순서가 변경될 수 있다. 한 실시예에서, 주형 뉴클레오티드 서열 안에 연속 뉴클레오티드는 상기 주형 서열을 따라 별개의 뉴클레오티드 길이의 창으로 분할될 수 있고, 그리고 단일 창 안에 있는 이들 뉴클레오티드만 함께 셔플될 수 있다. 이로서 상기 창 안에 일차 뉴클레오티드 서열이 재배열되며, 상기 셔플된 (또는 "재배열된") 서열은 임의의 공지된 자연 발생적 서열과 서열 동일성을 공유하지 않거나 또는 거의 공유하지 않고, 한편 원래 공지된 또는 천연 서열의 전형적인 뉴클레오티드 조성물의 더 광범위한 특징들은 유지된다. 예를 들면, 창 안에 임의의 뉴클레오티드 편향 (이를 테면, 구아닌 또는 시토신의 높은 함량)은 상기 주형 서열에 적용된 창 안에 존재하는 동일한 뉴클레오티드가 동일한 창 안에 셔플된 서열내 유지되도록 함으로써 (도 2에서 설명으로 예시됨), 셔플된 창의 길이에 걸쳐 유지될 수 있다. 따라서, 본 명세서에서 언급된 "셔플링(shuffling)"은 폴리뉴클레오티드 서열의 고정된 길이 안에 동일한 뉴클레오티드를 재정리하는 것을 말하지만, 고정된 길이의 폴리뉴클레오티드 서열 안에 존재하는 각 특정 뉴클레오티드 수의 변경에는 관여하지 않는다.
주형 서열의 뉴클레오티드 조성물 특징들을 높은 수준으로 유지하는 것이 이익이 될 수 있는데, 그 이유는 서열-특이적 특징들이 차-세대 시퀀싱 및 분석에서 천연 유전적 특징들의 현시를 편향시킬 수 있기 때문이다. 예를 들면, 구아닌 또는 시토신 함량 (GC%)이 높은 또는 낮은 서열들은 라이브러리 준비하는 동안 PCR에 의해 잘 증폭되지 않을 수 있고, 이로써 시퀀싱 라이브러리 안에 현시가 잘 되지 않을 수 있다. 대안적으로, 반복적 서열 구조를 가진 서열들을 명확하게 배열시키는 것이 곤란할 수 있고, 분석하는 동안 현시가 잘 되지 않을 수 있다. 본 명세서에서 공개된 상기 인공 염색체 및 표준은 천연 유전적 특징들을 에뮬레이팅하도록 기획될 수 있기 때문에, 상기 인공 염색체 또는 표준의 합성된 일차 서열은 상기 주형 서열과 동일한 서열-특이적 편향을 반영하도록 만들 수 있다. 따라서, 본 명세서에서 공개된 상기 인공 염색체 또는 표준은 한편 원래 주형 서열과 같은 뉴클레오티드 조성물 및/또는 반복 구조를 유지하면서, 인공적인 일차 서열을 보유할 수 있다.
임의의 셔플링을 실행하기 위하여 선택된 창 크기는 고정된 폴리뉴클레오티드 길이 (가령, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1000개 또는 그 이상의 뉴클레오티드)에 상응할 수 있다. 대안적으로, 선택된 창 크기는 주형 서열 안에 존재하는 더 높은 수준의 유전적 특징 (가령, 인트론들, 엑손들, CpG 섬, 및 기타)의 경계에 상응할 수 있다. 예를 들면, 유전자의 일차(primary) 인트론 및 엑손 서열들은 엑손 및 인트론 특징들의 구성은 여전히 유지하면서, 셔플링될 수 있다. 따라서, 상기 인공 염색체 안의 인공 폴리뉴클레오티드 서열의 일차 서열은 공지된 또는 천연 서열들과 일치되지 않지만, 더 높은 수준의 유전적 특징들의 구조 및 구성은 유지될 수 있다.
대안적으로, 천연 원천 ("주형" 서열)로부터 확인된 공지된 또는 천연 뉴클레오티드 서열을 회수하고, 그 다음 주형 서열을 역전시킴으로써 인공 염색체가 작제될 수 있다. 자연 발생적 뉴클레오티드 서열들 (DNA 또는 RNA 서열들)은 뉴클레오티드 염기들 사이에 포스포디에스테르 결합에 의해 부여되는 고유한(intrinsic) 5'에서 3'로의 방향성을 갖는다. 상기 서열을 3'에서 5' 방향으로 역전시킴으로써 이 방향성을 거역하게 되고, 그리고 원래 주형 서열에 대하여 더 이상의 상동성 (또는 서열 동일성)을 갖지 않는 서열이 생성된다. 상기 인공 염색체를 만드는 이러한 방법의 한 가지 장점은 주형 서열에 대한 서열 동일성은 비록 제거되었지만, 원래 서열의 뉴클레오티드 조성물 및 반복은 유지된다는 점이다. 따라서, 역전된 서열은 "인공"적이며, 원래 내생성 서열 (정확한 방향성을 갖는)과 구별될 수 있다.
대안적으로, 천연 원천 ("주형" 서열)으로부터 확인된 공지된 또는 천연 뉴클레오티드 서열을 회수하고, 이 서열 안에 뉴클레오티드를 대체 뉴클레오티드로 치환시킴으로써, 상기 인공 염색체가 작제될 수 있다. 예를 들면, 구아닌 뉴클레오티드는 시토신 뉴클레오티드로 대체될 수 있고, 시토신 뉴클레오티드는 구아닌 뉴클레오티드로 대체될 수 있고, 아데닌 뉴클레오티드는 티민 뉴클레오티드로 대체될 수 있고, 및/또는 티민 뉴클레오티드는 아데닌 뉴클레오티드로 대체될 수 있다. 전체적인 방식으로 뉴클레오티드를 대체시킴으로써, 개별 뉴클레오티드 및 특징 서열은 변화될 수 있기는 하지만, 서열의 반복 구조는 유지될 수 있고, 피리미딘 및 퓨린 조성물은 유지될 수 있고, 및/또는 GC 함량도 유지될 수 있다.
셔플링, 치환 및 역전(reversing) 기술은 인공 염색체 및/또는 이의 단편의 작제 동안 임의의 조합 또는 순열로 각각 적용될 수 있음을 인지할 수 있을 것이다. 따라서, 예를 들면, 주형 서열이 역전될 수 있고, 역전된 서열의 선택된 창들이 셔플되어, 공지된 천연 서열에 대하여 상기 역전된 서열 안에 임의의 잔기 상동성이 감소되거나 또는 제거될 수 있다. 대안적으로, 주형 서열이 셔플될 수 있고, 셔플된 서열의 선택된 창들이 역전되어, 공지된 천연 서열에 대하여 상기 셔플된 서열 안에 임의의 잔기 상동성이 감소되거나 또는 제거될 수 있다.
공지된 천연 서열들에 대한 상동성이 상기 인공 염색체 뉴클레오티드 서열 안에 존재하는 지를 확인하기 위하여, 공지된 뉴클레오티드 서열 데이터베이스 (이를 테면, NCBI 뉴클레오티드 수집 (nr/nt) 데이터베이스)는 소프트웨어 프로그램, 이를 테면, BLASTn 소프트웨어 프로그램으로 질의될 수 있다(Altschul, S.F., et al., 1990). 다수 뉴클레오티드 서열들을 정렬 및 비교 실행하는 기타 적합한 소프트웨어 프로그램이 또한 이용될 수 있는데, 예를 들면 FASTA (Pearson and Lipman 1988) 또는 ENA Sequence Search (http://www.ebi.ac.uk/ena/search/)이 있다. 복합(complex) 서열들의 경우, 상동성은 공지된 서열과 일치되는 21개 또는 그 이상의 연속 뉴클레오티드 서열들 (가령, 21개 또는 그 이상의 뉴클레오티드 서열 길이에 걸쳐 100% 서열 동일성을 갖는)에 전형적으로 상응한다. 단순 서열들 (이를 테면, 반복적 또는 모노-뉴클레오티드 조성물)의 경우, 상동성은 0.01 또는 이 미만의 예측된 (E) 값(NCB1 BLAST에서 정의됨 (Altschul, S.F., et al., 1990))에 상응한다. 따라서, 본 명세서에서 공개된 인공 폴리뉴클레오티드 서열의 임의의 21개 또는 그 이상의 연속 뉴클레오티드는 0.01 또는 이 미만의 E 값을 가질 수 있다 (NCB1 BLAST에서 정의됨 (Altschul, S.F., et al., 1990)).
만일 셔플링, 치환 및/또는 역전 기술에 의해 다른 공지된 자연 발생적 서열들과의 공유되는 서열 동일성이 원하는 수준으로 충분하게 제거 또는 감소되지 않은 경우, 원하는 수준의 감소된 서열 유사성을 획득하도록 개별 뉴클레오티드 치환이 만들어질 수 있다. 따라서, 상기 셔플된, 치환된 또는 역전된 서열은 임의의 남아있는 공유된 서열 동일성을 제거하기 위하여 뉴클레오티드의 특이적 삽입, 결손 또는 치환에 의해 추가 편집(또는 "큐레이트(curated)")될 수 있다. 따라서, 본 명세서에서 공개된 인공 염색체를 만드는 방법들은 임의의 공지된 자연 발생적 서열과의 임의의 공유된 서열 동일성을 감소 또는 제거하기 위하여, 셔플된, 치환된 또는 역전된 뉴클레오티드 서열들의 편집을 더 포함할 수 있다.
상동성을 제거하기 위하여, 천연 게놈 또는 염색체 서열의 뉴클레오티드 조성물의 특징을 유지하면서, 임의의 천연 게놈 또는 염색체 서열은 셔플되거나, 치환되거나 또는 역전될 수 있다. 적합한 천연 뉴클레오티드 서열들은 임의의 하나 또는 그 이상의 공개적으로 이용가능한 뉴클레오티드 온라인 데이터베이스로부터 확인될 수 있다. 적합한 뉴클레오티드 온라인 데이터베이스의 예로는 GenBank 및 뉴클레오티드 수집 (nr/nt) 데이터베이스 (National Center for Biotechnology Information), DNA Data Bank of Japan (National Institute of Genetics) 및 EMBL-BANK (European Bioinformatics Institute)를 포함한다. 대안적으로, 천연 원천으로부터 폴리뉴클레오티드를 단리시키고, 이들 폴리뉴클레오티드를 공지된 시퀀싱 기술을 이용하여 시퀀싱함으로써, 적합한 천연 뉴클레오티드 서열들을 얻을 수 있다. 한 실시예에서, 상기 천연 게놈 또는 염색체 서열은 포유류 게놈 또는 염색체 서열, 이를 테면, 인간 또는 뮤린 게놈 또는 염색체 서열이다. 예를 들면, 상기 천연 뉴클레오티드 서열은 기준 인간 게놈 서열 (가령, 최근 주석이 달린 버젼 hg19)으로부터 선택될 수 있다. 대안적으로, 상기 천연 뉴클레오티드 서열은 임의의 포유류 서열 (가령, M.무스쿨루스(M.musculus) mm10), 임의의 척추동물 게놈 (가령, D.레리오(D.rerio) danRer7), 임의의 동물 서열 (가령, C.엘레간스(C.elegans) ce10, D.멜라노가스토르(D.melanogastor) dm3, 및 기타), 임의의 식물 서열 (가령, A.탈리아니스(A.thalianis) tair9), 임의의 곰팡이 서열 (가령, N.크라사(N. crassa)) 또는 임의의 진핵 서열 (가령, S.세레비사에(S.cerevisae) SacCer6), 또는 임의의 세균성 서열 (가령, 대장균(E.coli) eschColiK12), 또는 임의의 고세균류 서열 (가령, M.칸데리(M.kandleri) methKand1), 또는 임의의 바이러스, 파아지 및 세포기관 서열 (가령, 간염 델타 바이러스)로부터 선택될 수 있다.
본 명세서에서 공개된 인공 염색체 안에 상기 인공 폴리뉴클레오티드 서열은 단일 종으로부터 유도된 임의의 공지된 자연 발생적 게놈 서열, 또는 다수 종으로부터 유도된 임의의 공지된 자연 발생적 게놈 서열과 구별될 수 있다. 예를 들면, 본 명세서에서 공개된 인공 염색체 안에 상기 인공 폴리뉴클레오티드 서열은 임의의 공지된 자연 발생적 인간 게놈 서열과 구별될 수 있다. 또다른 실시예에서, 본 명세서에서 공개된 인공 염색체 안에 상기 인공 폴리뉴클레오티드 서열은 임의의 유기체의 모든 공지된 자연 발생적 게놈 서열들과 구별될 수 있다.
또다른 설명을 위한 실시예에서, 언에어로믹소박터 데할로겐스(Anaeromyxobacter dehalogens) 게놈은 높은 GC 함량 (75%)을 보유하며, 주형 서열로 이용될 수 있다. 언에어로믹소박터 데할로겐스 게놈 서열을 셔플링함으로써, 언에어로믹소박터 데할로겐스 게놈의 특징인 높은 GC 함량은 여전히 유지하면서, 원래 언에어로믹소박터 데할로겐스 게놈 (또는 임의의 기타 천연 또는 공지된 서열)에 대한 상동성이 없는(또는 공유된 서열 동일성이 없는) 폴리뉴클레오티드 서열을 포함하는 인공 염색체를 만들 수 있다.
본 명세서에서 설명된 공정은 임의의 공지된 또는 천연 서열에 대한 상동성이 없는(또는 공유된 서열 동일성이 없는) 다수 연속 뉴클레오티드 서열들을 만드는데 이용될 수 있다. 이들 다수 서열들은 재배열되고, 복합되어 단일 병합된 연속 서열이 형성될 수 있다. 따라서, 본 명세서에서 공개된 인공 염색체에서 모듈 방식(modular fashion)으로 작제될 수 있으며, 이로써 이의 디자인 및 구조에서 상당한 유연성이 제공된다. 예를 들면, 가능하면 상이한 유전적 특징들을 인코드하는 다수 서열들이 개별적으로 구축된 후, 집합적으로 복합 인공 염색체로 어셈블리될 수 있다. 상이한 서열 조합의 어셈블리로 인하여 특정 연구 또는 진단 요구사항에 맞춤형(custom-built) 인공 염색체를 또한 구축할 수 있다.
추가적으로, 다수 (가령, 2개 또는 그 이상의) 인공 염색체들이 만들어지고, 함께 이용될 수 있다. 따라서, 본 명세서는 2개 또는 그 이상의 인공 염색체의 라이브러리를 또한 제공한다. 상기 라이브러리를 채우기 위하여 선택되는 염색체의 수는 상기 라이브러리의 의도된 특정 용도에 따라 선택될 수 있다. 한 실시예에서, 상기 인공 염색체의 라이브러리는 다배수체 게놈을 포함하는 전체 게놈의 조직을 에뮬레이트할 수 있다. 예를 들면, 46개 독특한 염색체 서열에 걸쳐 있는 인간 게놈 조직을 에뮬레이팅하기 위하여 46개 인공 염색체를 포함하도록 인공 염색체의 라이브러리가 만들어질 수 있다. 따라서, 개별 인공 염색체 서열들은 복제되어, 다배수체 인공 게놈을 형성할 수 있다. 복사본(duplicate) 인공 염색체 사이에 서열 변이가 혼입되고, 이로 인하여 천연 접합성(zygosity)을 시뮬레이션한다. 또다른 실시예에서, 인공 염색체의 라이브러리는 미생물의 수집 또는 집단으로 존재하는 다수 미생물 게놈(이를 테면, 시퀀싱 분석을 겪게되는 환경 시료 안에 존재할 수 있는)을 에뮬레이트할 수 있다 . 예를 들면, 이러한 수집은 10개 이상, 이를 테면, 약 30개의 상이한 인공 염색체를 포함할 수 있다.
추가 인공 염색체 특징들:
상기에 명시된 바와 같이, 인공 염색체 (또는 이의 단편)은 비록 하나 또는 그 이상의 (또는 임의의) 천연 유기체에 존재하지 않고, 그리고 전체-길이 또는 기능적 mRNA, rRNA, tRNA, microRNA, piRNA, lncRNA, snRNA, snoRNA, 기능적 해독된 판독 틀, 폴리펩티드 또는 단백질을 인코드하지 않는 특징 뉴클레오티드 서열을 비록 포함하지만, 더 높은 수준의 특징들, 이를 테면, 진핵 유전자 좌, CpG 섬, 이동 요소들, 반복적 폴리뉴클레오티드 특징들, 소규모 유전적 변이 및 대규모 유전적 변이 또는 원핵성 유전자 좌, DNA 반복부, 및/또는 이동 요소들을 혼입할 수 있다. 상기 인공 염색체의 이러한 그리고 기타 추가적인 또는 대안적 특징들은 본 명세서에서 설명된다.
인공 유전자
상기 인공 염색체의 인공 폴리뉴클레오티드 서열은 하나 또는 그 이상의 인공 유전자를 포함할 수 있다. 상기 하나 또는 그 이상의 인공 유전자는 하나 또는 그 이상의 엑손들과 이 사이에 끼어있는 인트론들을 포함할 수 있다. 상기 인트론들 및/또는 엑손들은 임의의 적합한 길이를 가질 수 있다. 예를 들면, 상기 엑손들의 길이는 25개 뉴클레오티드 내지 10 킬로베이스 (kb)가 될 수 있다. 상기 인트론들의 길이는 50개 뉴클레오티드 내지 2 메가베이스 (Mb)일 수 있다. 전체 유전자 크기는 200개 뉴클레오티드 내지 4 Mb일 수 있다. 상기 인공 염색체 안에 존재하는 인공 유전자의 수는 1 내지 10,000개로 다양할 수 있다. 각 인공 유전자에서 생성된 동형의 수는 1 내지 200개로 다양할 수 있다. 인공 유전자당 엑손의 수는 1 내지 300개로 다양할 수 있다. 인공 유전자당 인트론의 수는 1 내지 300개로 다양할 수 있다.
상기 인공 유전자는 본 명세서에서 설명된 임의의 적합한 방법에 의해 만들어질 수 있다. 예를 들면, 자연 발생적 주형 뉴클레오티드 서열의 자연 발생적 인트론 및 엑손 서열에 대응하는 셔플링 창을 이용하여, 본 명세서에서 설명된 셔플링 기술에 의해 상기 인공 유전자들이 만들어질 수 있다. 일단 셔플링되면 (그리고 필요한 경우 수작업으로 추가 편집되면), 상기 인공 유전자는 원래 자연 발생적 유전자의 인트론 및 엑손 구조를 갖는 인공 염색체로 재구성될 수 있다 (도 3에서 인공 염색체의 설명에 의해 구체화됨). 추가적으로, 15개 미만의 뉴클레오티드의 작은 요소들, 이를 테면, 접합(splicing) 및 전사 시작 부위와 중단 서열 요소들은 상기 인공 염색체 안에 인코드된 인공 유전자 좌 주변에 집합될 수 있다.
인공 이동 요소들(Artificial Mobile elements)
상기 인공 염색체의 인공 폴리뉴클레오티드 서열은 하나 또는 그 이상의 이동 반복 요소들을 포함할 수 있다. 이동 반복 요소들은 상기 인공 염색체를 통하여 산재된 다수 복제(copies)로 존재하는 매우 유사한 DNA 서열들이다. 이들 길이 및 풍도는 필요에 따라 변화될 수 있다. 예를 들면, 상기 본 명세서의 인공 염색체 안에 혼입될 수 있는 인공 이동 요소들의 반복 단위의 길이는 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000개 또는 그 이상의 뉴클레오티드일 수 있다. 예를 들면, 상기 인공 이동 요소들의 반복 단위의 크기는 100개 내지 10kb 뉴클레오티드로 변화될 수 있다. 본 명세서에서 공개된 인공 염색체 안에 존재하는 반복 요소들의 수는 전체 인공 염색체 길이의 0.1-90%를 구성할 수 있다.
한 실시예에서, 이동 요소들의 길이와 풍도는 천연 이동 삽입 요소들을 에뮬레이팅하도록 맞춤화된다. 다시, 상기 이동 요소의 특징 서열은 임의의 공지된 자연 발생적 이동 요소와 서열 동일성이 없거나 또는 거의 없도록 만들어진다. 상기 본 명세서의 인공 염색체에 포함될 수 있는 적합한 이동 요소의 예는 인간 SINE 요소를 에뮬레이팅하는 이동 요소다. 이러한 이동 요소의 길이는 약 350개의 뉴클레오티드이다. 한 실시예에서, 인간 SINE 요소를 에뮬레이팅하는 다수 이동 요소들은 상기 인공 염색체 서열의 약 10% (가령, 10.7%)를 포함하도록, 상기 인공 염색체 안에 혼입될 수 있다.
예전 삽입에서 최근 삽입까지 돌연변이 축적으로 인하여 이동 반복 요소들의 계층적 사건들을 에뮬레이팅하도록 인공 이동 요소들이 만들어질 수 있다 (Lander, E.S. et al., 2001). 예를 들면, 우선, 이동 요소의 원래, 천연 ("조상전래의") 반복 서열이 셔플링되어, 공지된 천연 서열들에 대한 상동성이 제거될 수 있다. 그 다음 셔플된 이동 요소 서열이 복제되어, 다수 복제가 생성된다. 예를 들면, 상기 인공 염색체는 인공 이동 요소의 최소한 2, 최소한 3, 최소한 4, 최소한 5, 최소한 10, 최소한 20, 최소한 30, 최소한 40, 최소한 50, 최소한 60, 최소한 70, 최소한 80, 최소한 90, 최소한 100, 최소한 500, 최소한 1,000 또는 최소한 2,000개 또는 그 이상의 복제를 포함할 수 있다. 하나 또는 그 이상의 상기 복제 (또는 각 복제)는 그 다음 조상전래의 서열로부터 이동 반복 서열의 서열 축퇴(degeneration)를 복제하기 위하여 무작위 뉴클레오티드 치환, 삽입 및 결손을 겪을 수 있다 (도 4에서 설명에 의해 구체화됨). 상기 이동 요소들은 다수의 추가적인 뉴클레오티드 치환 및 증폭 주기를 겪어, 다양한 이동 요소들이 만들어질 수 있다.
반복 폴리뉴클레오티드 서열들
상기 인공 염색체의 인공 폴리뉴클레오티드 서열은 반복적 폴리뉴클레오티드 특징들, 이를 테면, 반복적 DNA 특징들, 예를 들면, 말단 반복부, 예를 들면 말단소체, 역 반복부, 및 텐덤 반복부, 예를 들면 동원체를 포함할 수 있다. 텐덤, 역전된 그리고 말단 반복 DNA는 일련의 반복 단위 증폭 사건들을 통하여 진화되어, 새로운 반복 서브패밀리로 확산될 수 있다. 인공적으로 복제된 서열 일탈 (가령, 무작위 뉴클레오티드 치환들, 결손 및/또는 삽입을 끼워넣기 위하여 반복 단위를 조작함으로써; 도 5에서 예시된 바와 같음)에 의한 연속적인 반복-단위 증폭 라운드를 이용함으로써, 인공적인 반복 DNA를 기획할 때, 반복 DNA 서열을 만드는 이 공정이 에뮬레이팅될 수 있다. 이 반복 공정은 반복 단위들의 하위집단 간에 계층적 상관관계를 유지하는 반복 DNA 텐덤 어레이를 만들 수 있다.
따라서, 상기 인공 염색체의 인공 폴리뉴클레오티드 서열은 반복적 인간 유전적 특징들, 이를 테면, 부수체(satellite) DNA를 에뮬레이팅하는 인공 반복 DNA를 포함할 수 있다. 또다른 실시예에서, 상기 인공 염색체는 하나 또는 그 이상의 동원체를 포함할 수 있다. 상기 동원체는 25-5,000개의 뉴클레오티드 길이의 DNA 서열을 갖는 텐덤 반복 단위의 큰 어레이를 구성할 수 있다. 대안으로 또는 추가적으로, 상기 인공 염색체는 반복적 말단소체 서열들을 포함할 수 있다. 상기 반복적 말단소체 서열들은 임의의 적합한 길이를 가질 수 있다. 예를 들면, 상기 반복적 말단소체 서열들은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20개 또는 그 이상의 뉴클레오티드의 단복 단위를 포함할 수 있다. 예를 들면, 상기 반복적 말단소체 서열의 길이는 4-10개의 뉴클레오티드일 수 있다. 한 실시예에서, 이러한 말단소체 서열들은 서열 말단에서 최대 10kb까지 나란히 반복되는 6개 뉴클레오티드 모티프를 포함할 수 있다. 기타 적합한 반복부는 필요에 따라 기획될 수 있다. 임의의 적합한 수의 반복부는 본 명세서에서 공개된 인공 염색체 안에 혼입될 수 있다. 한 실시예에서, 말단소체 반복부의 복제수는 5,000 - 50,000일 수 있다.
소규모 유전적 변이
소규모 유전적 변이 (예를 들면, 길이가 모두 50개 미만의 연속 뉴클레오티드인 단일-뉴클레오티드 다형, 삽입, 결손, 복제, 및 다수 뉴클레오티드 다형)가 본 명세서에서 공개된 다수 인공 염색체 안으로 혼입될 수 있다. 예를 들면, 유전적 변이를 시뮬레이션하기 위하여 인공 염색체 쌍 간에 뉴클레오티드 차이가 만들어질 수 있으며, 이때 2개 또는 그 이상의 인공 염색체 상에 존재하는 2개 또는 그 이상의 변이는 2개 또는 그 이상의 대립유전자를 나타낸다 (도 6에서 설명에 의해 예시됨). 따라서, 다수 인공 염색체는 다수 대립유전자를 나타낼 수 있다. 예를 들면, 하나의 대립유전자의 2개의 복제를 포함하도록 (이로 인하여 동종접합성을 시뮬레이션), 이배수체 게놈의 일부를 에뮬레이팅하는 인공 염색체의 2개의 일치되는 복제가 만들어질 수 있다. 대안적으로, 인공 염색체의 2개 복제 각각은 상이한 대립유전자 (이로 인하여 이형접합성을 시뮬레이션)를 포함할 수 있다. 다수 대립유전자는 필요에 따라 다수 인공 염색체 상에서 준비될 수 있음을 인지할 것이다. 따라서, 본 명세서는 자연 발생적 대립유전자의 변이를 나타내는, 다수 인공 염색체의 모집단 (또는 "라이브러리")을 제공한다. 한 실시예에서, 2, 3 또는 4개의 인공 염색체 상에 2, 3 또는 4개의 인공 대립유전자가 제공된다.
본 명세서에서 공개된 인공 염색체에 혼입을 위한 소규모 유전적 변이를 만드는 동안, 상기 소규모 변이 뉴클레오티드 서열과 측면 인공 서열들은 공지된 천연 서열들에 대한 임의의 상동성이 제거되도록 편집될 필요가 있을 수도 있다.
질병과 연합되어 있는 유전적 변이를 나타내는 폴리뉴클레오티드 서열들이 본 명세서에서 공개된 인공 염색체에 또한 혼입될 수 있다. 예를 들면, 특이적 진단적 유전적 특징들, 이를 테면, 특정 SNP가 상기 인공 염색체에 삽입되어, 이 돌연변이에 대한 일치되는 국소 서열 맥락을 제공하며, 한편 더 광범위한 수준에서 공지된 천연 서열들에 대한 상동성은 없거나 거의 없는 상태로 유지된다.
공지된 유전적 변이의 에뮬레이션(emulation)은 다수 인공 염색체를 필요로하기 때문에, "콘센수스", 또는 "기준" 서열 (콘센수스 게놈 어셈블리와 유사한, 이를 테면, hg19 인간 게놈 어셈블리, mm10 마우스 게놈 어셈블리 등등)로 간주되는 특정 인공 염색체 그리고 하나 또는 그 이상의 유전적 변이 부위에서 기존 염색체와 상이한 하나 또는 그 이상의 다수, 독특한 인공 염색체 (또는 "변이체" 인공 염색체)를 만드는 것이 가능하다. 따라서, 본 명세서에서 공개된 인공 염색체의 라이브러리는 단일 기준 인공 염색체 그리고 하나 또는 그 이상의 유전적 변이 부위에서 기존 염색체와 상이한 하나 또는 그 이상의 변이체 인공 염색체를 포함할 수 있다.
대규모 유전적 변이
대규모 유전적 변이 (예를 들면, 거대 결손, 복제, 복제-수 변이, 삽입, 전도 및 전좌를 포함하고, 이들 각각은 50개 또는 그 이상의 연속 뉴클레오티드의 뉴클레오티드 서열들을 포함)는 본 명세서에서 설명된 다수 인공 염색체 안으로 또한 혼입될 수 있다. 자연 발생적 대규모 유전적 변이는 전형적인 숏건(shotgun) 짧은 서열 판독 길이보다 더 큰 뉴클레오티드 서열에 대개 영향을 주며, 자연 발생적 시료 뉴클레오티드 서열들에서 구조적 변이의 탐지 및 해상도를 더 복잡하게 한다.
전환(transversions), 복제 수 변이 및/또는 이동-요소 삽입에 의해 영향을 받는 뉴클레오티드 서열들의 셔플링은 본 명세서에서 설명된 바와 같이, 대규모 변이의 구조적 단위 크기에 일치되는 창 크기로 실행될 수 있다. 예를 들면, 복제에 앞서, 단일 반복 단위이 셔플링될 수 있고, 이로써 셔플된 동일한 서열을 공유하는 복제된 복제본이 생성된다. 또다른 실시예에서, 상기 서열은 전환에 앞서, 셔플링될 수 있고, 단지 주형 서열에 대하여 방향 및 중단점이 상이하게된다. 또다른 실시예에서, 상기 서열은 이동 요소들의 삽입에 앞서, 셔플링될 수 있는데, 이로써 상기 삽입은 동일한 인공 염색체에서 기타 이동 요소들에 대하여 서열 상동성을 유지한다.
본 명세서에서 공개된 다수 인공 염색체 안으로 혼입될 수 있는 대규모 유전적 변이의 한 가지 예는 전좌(translocation)이다. 전좌는 2개의 인공 염색체 사이에 서열의 재배열에 의해 일어날 수 있고, 2개의 상호간 융합 인공 염색체가 생성된다 (도 9에서 설명에 의해 예시됨). 2개의 비-상동 인공 염색체 간의 전좌로 2개의 상이한 유전자가 융합되어, 키메라 유전자 융합이 일어날 수 있다. 따라서, 본 명세서에서 공개된 인공 염색체는 하나 또는 그 이상의 인공 키메라 유전자 융합을 포함할 수 있다.
인공 미생물 게놈
본 명세서에서 공개된 인공 염색체의 인공 폴리뉴클레오티드 서열은 미생물 게놈을 시뮬레이션하도록 기획될 수 있다 (이 인공 염색체 또한 본 명세서에서 "인공 미생물 게놈"으로 지칭됨). 예를 들면, 원래 미생물 게놈의 특정 특징들은 여전히 유지하면서, (이를 테면, 크기, rRNA 오페론 수, GC%, 반복 함량, 등등, 그러나 이에 한정되지 않음), 본 명세서에서 공개된 방법들에 의해 천연 서열에 대한 특징적인 서열 상동성을 제거하기 위하여 천연 미생물 게놈을 셔플링함으로써 인공 염색체가 생성될 수 있다 (도 10에서 설명에 의해 예시됨).
메타게놈 분석을 위하여 인공 미생물 집단을 시뮬레이션하도록 다수 인공 염색체가 만들어질 수 있다. 따라서, 본 명세서는 2개 또는 그 이상의 인공 미생물 게놈의 라이브러리를 또한 제공하는데, 이때 원래 자연 발생적 미생물 게놈 서열과 임의의 공유된 서열 동일성은 감소되거나 또는 제거된다. 개별 인공 미생물 게놈의 상대적 풍도는 메타게놈 시료 안에 미생물 집단의 상이한 풍도에 대응하도록 선택될 수 있다. 따라서, 인공 미생물 게놈의 라이브러리는 메타게놈 분석 동안 전형적으로 프로파일된 이질적(heterogeneous) 미생물 집단을 에뮬레이팅하기 위하여 생성될 수 있다. 본 명세서에서 공개된 임의의 적합한 수의 인공 미생물 게놈이 라이브러리 안으로 복합될 수 있다. 한 실시예에서, 상기 라이브러리는 3-3,000개의 인공 미생물 게놈을 포함할 수 있다.
본 명세서에서 공개된 인공 미생물 게놈은 하나 또는 그 이상의 유전자 좌를 인코드할 수 있다. 유전자 좌는 메타게놈 집단의 계통발생적 프로파일링에 흔히 이용되는 인공 16S rRNA 유전자를 포함할 수 있다 (가령, Edwards, R.A. et al., 2006). 16S rRNA 유전자의 가변 영역들의 PCR 증폭 및 시퀀싱은 시료 안의 미생물들의 풍도 및 다양성(diversity)을 평가하는 특정 방식이었다. 본 명세서에서 공개된 인공 미생물 게놈 안에 존재하는 인공 16S rRNA 서열은 전형적으로 셔플링되어 공지의 천연 서열들에 대한 상동성이 제거되는 한편, 앰플리콘 시퀀싱에 이용되는 범용 프라이머에 상보적인 서열은 천연 서열들에 대한 동일성이 유지되도록 맞춤화될 수 있다 (도 11에서 설명에 의해 예시화됨).
인공 면역 수용체 클론형
본 명세서에서 공개된 인공 염색체의 인공 폴리뉴클레오티드 서열은 임의의 하나 또는 그 이상의 IgA, IgH, IgL, IgK, IgM, TCRA TCRB, 및 TCRG 수용체, 또는 기타의 현시를 포함하는, 하나 또는 그 이상의 면역 세포 수용체 유전자 좌를 인코드할 수 있다. 이들 면역글로불린 및 T-세포 수용체 좌는 V(D)J 재조합 및 체세포 초돌연변이(hypermutation)를 겪게 되어 클론형이라고 불리는 다양한 범위의 서열들이 생성된다. 이들 생물학적 공정을 모델로 하여, 인공 염색체 서열을 이용하여 한 벌의 인공 클론형을 만들 수 있다.
면역글로불린 및 T-세포 수용체 서열들로부터 가변 (V) 세그먼트, 결합 (J) 세그먼트 및 다양성 (D) 세그먼트 서열들 (그리고 측면 인트론들)은 게놈 서열, 이를 테면, 인간 게놈으로부터 회수되고, 상동성을 제거하기 위하여 별도로 셔플링된다. 일부 실시예들에서, 면역 수용체들의 앰플리콘 프로파일링에 흔히 이용되는 범용 프라이머 서열에 상보적인 작은 (예를 들면, 20 뉴클레오티드 길이) 서열을 포함하도록 하는 것이 바람직할 수 있다 (가령, van Dongen, J.J. et al., 2003). 무작위로 선택된 다양성 (D) 세그먼트와 처음 복합되어 D-J 유전자 세그먼트를 형성하는 결합 (J) 세그먼트를 무작위로 선택하고, 끼어있는 서열은 제거되며, 이어서 무작위로 선택된 가변 (V) 세그먼트의 결합으로 인하여 재배열된 인공 VDJ 유전자 세그먼트가 생성됨으로써, 상기 인공 면역글로불린 및 T-세포 수용체 좌의 V(D)J 재조합이 실행될 수 있다 (도 12 및 13에서 설명에 의해 예시됨). 상이한 세그먼트의 무작위 선택은 상이한 세그먼트 조합의 거대한 레퍼토리를 만든다. 세그먼트 정션에서 또는 세그먼트 안에서 뉴클레오티드의 치환, 추가 또는 결손에 의해 추가적인 다양성이 부가 될 수 있다. 각각의 재배열된, 인공 VDJ 유전자 세그먼트는 "클론형(clonotype)"으로 본 명세서에서 지칭된다. 다수의 인공 클론형이 이 방법에 의해 만들어질 수 있는데, 이 방법은 인간 백혈구 세포의 면역-레퍼토리 시퀀싱 동안 전형적으로 관찰되는 천연 면역 수용체 클론형의 크기, 다양성, 복합성 및 프로파일을 에뮬레이팅할 수 있다.
컴퓨터 판독가능한 매체:
가상환경에서 본 명세서에서 공개된 인공 염색체가 제공될 수 있고, 따라서 컴퓨터 판독가능한 매체 상에 제공될 수 있다. 따라서, 본 명세서는 본 명세서에서 공개하는 하나 또는 그 이상의 인공 염색체를 나타내는 데이터가 포함된 컴퓨터 판독가능한 매체를 또한 제공한다. 상기 컴퓨터 판독가능한 매체는 비-일시적(non-transitory)일 수 있다.
상기 컴퓨터 판독가능한 매체는 이 컴퓨터 판독가능한 매체 상에 저장된 인공 염색체 또는 염색체들을 분석하기 위하여 채택된 컴퓨터 시스템과 함께 제공될 수 있다.
본 명세서는 이 컴퓨터 판독가능한 매체 상에 저장된 인공 염색체 또는 염색체들을 분석하는 소프트웨어를 또한 제공한다. 예를 들면, 상기 소프트웨어는 상기 인공 염색체 서열에 주어진 입력 서열의 서열을 비교하여, 서열 비교를 실행할 수 있다. 이 기능을 수행하는 임의의 공지된 소프트웨어 패키지가 이용될 수 있다.
폴리뉴클레오티드 표준:
본 명세서에서 공개된 상기 인공 염색체 서열들의 일부 또는 전부 물리적으로 RNA 또는 DNA 폴리뉴클레오티드로 만들어질 수 있다. 따라서, 본 명세서는 본 명세서에서 공개된 인공 염색체의 단편을 또한 제공하는데, 이때 상기 단편은 상기 인공 염색체의 인공 폴리뉴클레오티드 서열의 20 내지 10,000,000개의 연속 뉴클레오티드를 포함하거나, 또는 구성된다. 예를 들면, 상기 단편은 상기 인공 폴리뉴클레오티드 서열의 임의의 10,000,000개, 임의의 1,000,000개, 임의의 500,000개, 임의의 100,000개, 임의의 50,000개, 임의의 10,000개, 임의의 1,000개, 임의의 500개, 임의의 400개, 임의의 300개, 임의의 250개, 임의의 200개, 임의의 150개, 임의의 100개, 또는 임의의 50개, 임의의 25개, 임의의 21개 또는 임의의 20개의 연속 뉴클레오티드를 포함하거나, 또는 구성될 수 있다. 이러한 단편은 본 명세서에서 "표준(standard)"으로 지칭된다. 상기 폴리뉴클레오티드 표준은 상기 인공 염색체의 대응하는 인공 서열과 일치된다. 따라서, 상기 폴리뉴클레오티드 표준은 본 명세서에서 공개된 인공 염색체의 임의의 하나 또는 그 이상의 특징들을 나타낼 수 있다. 본 명세서에서 공개된 표준은 상기 인공염색체와 독립적으로 이용될 수 있음을 인지할 것이다. 예를 들면, 인공 표준은 상기 인공 염색체에 대한 기준 요구없이 폴리뉴클레오티드 정량화 공정을 보정하는데 이용될 수 있다.
명세서에서 공개된 인공 염색체에 기초된 물리적으로 실제 보이는 표준으로 광범위한 다양한 시퀀싱 방법들 (PCR 증폭 및 NGS 시퀀싱 방법들을 포함)을 보정하는 것이 허용된다. 예를 들면, 이것은 증폭 및/또는 시퀀싱 방법이 수행되기 전, 주어진 RNA 또는 DNA 시료에 공지된 양의 하나 또는 그 이상의 폴리뉴클레오티드 표준을 추가함으로써 수행될 수 있다. 상기 인공 염색체에 대한 공지된 폴리뉴클레오티드 표준의 서열 분석은 이용된 특정 증폭 및/또는 시퀀싱 방법의 강력한 보정을 제공한다.
RNA 표준 생산
상기 표준은 RNA 표준일 수 있다. RNA 표준은 상기 인공 염색체에 의해 인코드된 관심 대상의 특징과 일치되고, 이를 제공하는 RNA 분자다. 예를 들면, 상기 RNA 표준은 상기 인공 염색체에 인코드된 인공 유전자 또는 전사된 요소 또는 이의 단편을 나타낼 수 있다. 한 실시예에서, 상기 RNA 표준은 임의의 공지된 천연 서열에 임의의 상동성을 포함하지 않는다. 상기 RNA 표준 길이는 따라서 관심대상 특징에 따라 가변적일 수 있다. 한 실시예에서, 상기 RNA 표준의 길이는 200개 내지 30 kb의 뉴클레오티드가 될 수 있다.
상기 인공 염색체로부터 관심 대상 서열이 DNA 서열로 합성될 수 있다. DNA 서열은 활성 프로모터와 작동가능하도록 연결되어 벡터 안으로 삽입될 수 있다. 따라서, 본 명세서는 상기 인공 염색체의 단편을 인코드하는 DNA 분자를 또한 제공한다. 본 명세서는 인공 염색체의 단편을 인코드하는 DNA 서열을 포함하는 폴리뉴클레오티드 벡터 (이를 테면, DNA 벡터)를 또한 제공한다. 임의의 적합한 벡터가 이용될 수 있다. 한 실시예에서, 상기 벡터는 발현 벡터이다. 상기 발현 벡터는 본 명세서에서 공개된 표준의 전사를 지시할 수 있는 임의의 적합한 프로모터 및/또는 인헨서를 포함할 수 있다.
본 명세서에서 공개된 벡터는 RNA 분자를 만드는 RNA 합성 반응의 주형으로 이용될 수 있다. 따라서, 본 명세서는 본 명세서에서 공개된 폴리뉴클레오티드 표준을 만드는 방법을 또한 제공하는데, 이 방법은 본 명세서에서 공개된 벡터로부터 RNA 분자의 합성을 포함한다. 적합한 RNA 합성 방법들은 잘 공지되어 있다. 예를 들면, 이러한 합성 방법들은 무세포, 시험관내 발현 시스템에서 실행될 수 있다. 대안적으로, 이러한 방법들은 생체내 발현 시스템, 이를 테면, 숙주 세포에서 실행될 수 있다. 임의의 적합한 숙주 세포가 이용될 수 있다. 생산된 RNA 분자는 그 다음 공지된 방법들을 이용하여 정제됨으로써, 최종 RNA 폴리뉴클레오티드 표준이 만들어진다.
따라서, 본 명세서는 상기 인공 염색체 서열의 인공 서열의 일부 또는 전부와 일치되는 RNA 표준을 만드는데 이용될 수 있는 방법들을 제공한다. RNA 표준 생산에 적합한 방법의 개요는 도 14에서 설명된다.
다수 RNA 표준의 혼합물
다수 RNA 표준은 집합적으로 혼합물로 이용될 수 있다. 따라서, 본 명세서는 본 명세서에서 공개된 하나 또는 그 이상의 RNA 표준의 혼합물을 제공한다. 상기 혼합물은 상기 RNA 표준의 구조적 온전성(integrity)을 유지하기 위하여 임의의 적합한 완충액(buffer)을 포함할 수 있다.
개별 RNA 표준은 다양한 상이한 농도에서 희석될 수 있고, 그 다음 RNA 표준의 혼합물 안에 복합될 수 있다. 상이한 농도 범위에 걸쳐 있는 RNA 표준의 혼합물은 따라서 정량적 척도(quantitative scale)를 포함할 수 있다. 이 정량적 척도는 상이한 순차적 풍도에서 RNA 표준 사다리를 포함할 수 있다. 이 척도는 동반 시료 안에 천연 RNA 전사체들의 풍도를 측정하기 위한 기준으로 이용될 수 있다. 개별 RNA 표준의 상대적 농도가 상이한 대체 혼합물이 만들어질 수 있다. 이로써, 대체 혼합물의 RNA 표준을 비교함으로써 RNA 표준의 차등적 풍도를 측정할 수 있고, 이로 인하여 이를 테면, 2개 또는 그 이상의 시료 간에 유전자 발현 동안 발생할 수 있는 RNA 풍도의 변화들을 측정하는데 이용될 수 있는 기준 척도가 제공된다.
한 혼합물에 제공되는 RNA 표준의 수는 3-3000개, 이를 테면, 준비된 혼합물당 3-300개 범위로 가변적일 수 있다. 예를 들면, 약 90개의 RNA 표준을 포함하는 혼합물이 제공될 수 있다. 상기 RNA 표준이 관심 대상의 시료에 추가되어, 시료 안에 존재하는 총 RNA의 0.001-50%, 이를 테면, 약 1%를 구성할 수 있다.
인공 유전자를 나타내는 RNA 표준
RNA 표준은 상기 인공 염색체의 인공 폴리뉴클레오티드 서열 안에 인코드된 관심대상의 임의의 인공 유전자와 일치되도록 기획될 수 있다. 상기 연속 RNA 표준 서열은 상기 인공 엑손 서열들과 일치되는 한편, 끼어있는 인트론 서열들은 배제된다 (도 3에서 설명으로 예시됨). 따라서, RNA 표준은 상기 인공 염색체에 의해 인코드된 인공 유전자의 오직 엑손 서열에만 대응하는 연속 뉴클레오티드 서열을 포함하거나, 또는 이들로 구성될 수 있다. 이것은 유전자 접합의 천연 공정을 에뮬레이팅하고, 이로 인하여 인트론 서열들은 제거되고, 엑손 서열들은 함께 결합된다.
RNA 표준은 대체 접합의 생물학적 공적을 에뮬레이팅하도록 기획될 수 있고, 이때 유전자 좌의 다수 동형을 만들기 위하여 특정 엑손들이 포함되거나 또는 배제된다. 추가적으로, 단일 유전자 좌로부터 생성된 다수 동형의 각각과 일치되는 다수 RNA 표준이 생산될 수 있다. 상이한 농도에서 다수의 대체 mRNA 동형과 일치되는 다수의 RNA 표준을 복합시킴으로써, 예를 들면, 인트론 유지, 카세트 엑손들, 대체 전사 개시 및 종료, 비-정준(canonical) 접합, 및 기타 다른 것들이 포함된 교반 접합 사건들이 시뮬레이션될 수 있다. 각각의 동형을 나타내는 RNA 표준의 상대적 풍도는 나타나는 대체 접합 사건의 빈도에 상응하게 가변적이 될 수 있다.
인공 융합 유전자를 나타내는 RNA 표준
2개 인공 염색체 간에 전좌는 2개의 상이한 인공 유전자를 단일 융합 유전자 (또는 "키메라")로 결합시킬 수 있다. 인공 염색체 간의 전좌에 의해 생성된 융합 유전자와 일치되도록 RNA 표준이 만들어질 수 있다.
전좌는 염색체 쌍의 오직 하나의 염색체 (또는 더 고차원적인 배수체 유기체에서 다수의 등가 염색체중 오직 하나)에만 보통 영향을 주고, 상기 쌍에서 다른 염색체는 영향을 받지 않고 남아있다. 따라서, 상기 유전자의 2개의 정상적인 (가령, 비-융합된) 복제와 융합된 유전자의 단일 복제를 나타내고, 이로 인하여 이형접합성 유전자형 (도 9에 설명으로 예시됨)을 에뮬레이팅하는 RNA 표준을 만드는 것이 유리할 수 있다. 상기 융합 유전자에 일치되는 RNA 표준의 상대적 농도는 모델링되는 특정 융합 유전자의 연구되는 테스트 시료 안에 가능한 농도를 에뮬레이션하기 위하여 가변적일 수 있다. 예를 들면, 종양 시료 안에 오직 세포의 분획만 전좌 대립유전자를 품고 있으며, 융합 유전자를 발현시키는 최소 잔류 질환의 경우, 저농도의 인공 융합 유전자가 이용될 수 있다.
DNA 표준의 생산
상기 표준은 DNA 표준일 수 있다. DNA 표준은 상기 인공 염색체 안에 관심 대상의 인공 서열과 일치하고, 이를 나타내는 DNA 분자이다. 한 실시예에서, 상기 DNA 표준은 상기 인공 염색체 안에 특징 서열과 일치된다. 따라서, 본 명세서는 본 명세서에서 공개된 인공 염색체의 인공 서열의 DNA 단편을 또한 제공한다. 상기 인공 염색체 서열의 전부 또는 일부는 임의의 적합한 공지된 DNA 합성 방법을 이용하여 물리적으로 DNA 분자로 만들어질 수 있다. 따라서, DNA 표준을 만들기 위하여 선택된 특정 인공 염색체 단편에 따라, DNA 표준의 크기 및 함량이 가변적일 수 있다. 한 실시예에서, 상기 DNA 표준의 길이는 20개 내지 20Mb의 뉴클레오티드가 될 수 있다.
상기 인공 염색체 서열과 일치되는 DNA 분자가 벡터 안으로 삽입될 수 있다. 임의의 적합한 벡터가 이용될 수 있다. 예를 들면, 상기 벡터는 플라스미드 벡터일 수 있다. 합성된 DNA 분자는 상기 벡터 안에 있는 임의의 2개의 적합한 제한 엔도뉴클레아제 콘센수스 인지 부위 사이에 삽입될 수 있다. 예를 들면, 상기 합성된 DNA 분자는 상기 벡터 안에 있는 2개의 타입 III 제한 엔도뉴클레아제 콘센수스 인지 부위 (도 15에 설명에 의해 예시됨) 사이에 삽입될 수 있다. 이로써 하나 또는 그 이상의 제한 엔도뉴클레아제를 이용하여 벡터로부터 잘라냄으로써, DNA 표준이 생성되게된다. 따라서, 본 명세서는 DNA 표준을 만드는 방법을 제공하는데, 이 방법은 상기 인공 염색체의 서열에 대응하는 DNA 단편을 합성하고, 상기 DNA 단편을 벡터 (이를 테면, 플라스미드 벡터) 안으로 삽입하고, 후속적으로 제한 엔도뉴클레아제 절단에 의해 상기 벡터로부터 DNA 단편을 잘라내는 것을 포함한다.
DNA 표준을 만드는 대체 방법들이 이용될 수 있다. 예를 들면, 상기 DNA 표준 (이것은 예를 들면, 벡터, 이를 테면, 플라스미드 벡터 안에 존재할 수 있음)은 증폭 반응에 의해 만들어질 수 있다. 예를 들면, 상기 DNA 표준의 한 쪽 단편에서 이 서열에 상보적인 PCR 프라이머를 이용하여 DNA 표준의 다수 복제를 만드는데 PCR 증폭이 이용될 수 있다. DNA 분자의 다수 복제를 만드는 공지된 임의의 적합한 증폭 방법이 이용될 수 있다. DNA 표준 생산에 적합한 방법의 개요는 도 15에서 설명된다.
다수 DNA 표준의 혼합물
다수 DNA 표준은 집합적으로 혼합물로 이용될 수 있다. 따라서, 본 명세서는 본 명세서에서 공개된 하나 또는 그 이상의 DNA 표준의 혼합물을 제공한다. 상기 혼합물은 상기 DNA 표준의 구조적 온전성(integrity)을 유지하기 위하여 임의의 적합한 완충액을 포함할 수 있다.
개별 DNA 표준은 다양한 상이한 농도에서 희석될 수 있고, 그 다음 DNA 표준의 혼합물 안에 복합될 수 있다. 상이한 농도 범위에 걸쳐 있는 DNA 표준의 혼합물은 따라서 정량적 척도(quantitative scale)를 포함할 수 있다. 이 정량적 척도는 상이한 순차적 풍도에서 DNA 표준 사다리를 포함할 수 있다. 이 척도는 동반 시료 안에 천연 DNA 전사체들의 풍도를 측정하기 위한 기준으로 이용될 수 있다.
개별 DNA 표준의 상대적 농도가 상이한 대체 혼합물이 만들어질 수 있다. 이로써, 대체 혼합물의 DNA 표준을 비교함으로써 DNA 표준의 차등적 풍도를 측정할 수 있고, 이로 인하여 이를 테면, 2개 또는 그 이상의 동반 시료 간에 DNA 분자의 풍도 변화들을 측정하는데 이용될 수 있는 기준 척도가 제공된다. 예를 들면, 두 혼합물 간의 DNA 표준의 풍도 차이는 두 시료 간에 미생물 게놈 DNA 풍도 차이를 비교하는 척도를 제공할 수 있다.
한 혼합물에 제공되는 DNA 표준의 수는 3-3000개, 이를 테면, 준비된 혼합물당 3-300개 범위로 가변적일 수 있다. 예를 들면, 약 90개의 DNA 표준을 포함하는 혼합물이 제공될 수 있다. 상기 DNA 표준이 관심 대상의 시료에 추가되어, 시료 안에 존재하는 총 DNA의 0.001-50%, 이를 테면, 약 1%를 구성할 수 있다.
공동결합된 DNA 표준
다수 DNA 표준은 표준 분자 생물학 기술, 이를 테면, 제한 절단 및 결찰(ligation) 또는 Gibson 어셈블리를 이용하여 함께 결찰되어(또는 "공동결합되어") 하나의 연속 서열이 될 수 있다 (가령, 도 16에서 설명됨). 따라서, 본 명세서는 또한 공동결합된 DNA 표준를 제공한다. 본 명세서는 공동결합된 DNA 표준을 준비하는 방법을 또한 제공하는데, 이 방법은 본 명세서에서 공개된 2개 또는 그 이상의 DNA 표준을 함께 단일, 연속 서열로 결찰시키는 것을 포함한다.
단일 공동결합된 표준은 다수 복제 수에 반복되는 개별 DNA 표준을 포함할 수 있다. 따라서, 복제-수를 이용하여 DNA 표준의 차등적 풍도를 확립할 수 있다. 본 명세서는 다수 개별 DNA 표준을 포함하는 공동결합된 DNA 표준을 준비하는 방법을 또한 제공하는데, 이때 각 DNA 표준은 공동결합된 DNA 표준 안에 다수 복제로 존재한다.
추가적으로, 단일 공동결합된 표준은 다수의 상이한 개별 DNA 표준을 포함할 수 있고, 각 표준은 임의의 조합으로 임의의 원하는 복제 수로 복사된다.
개별 DNA 표준의 풍도에서의 변이는 피펫팅 또는 분획화(aliquoting)의 오류로 인한 것일 수 있다. 그러나, 다수 개별 DNA 표준을 거대한 공동결합된 DNA 표준에 결합시키면 피펫팅 또는 분획로 인한 임의의 개별간 변이는 제거된다 (상기 공동결합된 DNA 표준은 한번 분획되기 때문임).
공동결합된 DNA 표준을 포함하는 상이한 복제수의 다수 개별 DNA 표준의 풍도를 이용하여 피펫팅으로 인한 오류를 추정할 수 있다. 이것은 공동결합된 표준의 피펫팅에 있어서 오류가 동일하고, 공동결합된 DNA 표준에 함께 복합되는 개별적 DNA 표준간에 의존적이기 때문이다. 단일 공동결합된 DNA 표준에 결합되는 개별 DNA 표준의 공지된 풍도에 대한 관찰된 풍도간에 플롯된 가장 적합한 선의 기울기는 공동결합된 DNA 표준에 대한 피펫팅 오류의 추정치를 나타낸다. 이 추정치에 따른 DNA 표준 풍도의 후속적인 표준화는 이 변이의 원천을 최소화시킬 수 있다. 이 내부적 표준화 방법은 풍도 측정을 좀더 정확하게 한다.
임의의 적합한 타입 및 수의 개별 DNA 표준들이 공동 결합된 DNA 표준을 형성할 수 있다. 한 실시예에서, 6개의 개별 DNA 표준이 결합되어 단일 공동결합된 DNA 표준이 형성된다. 더욱이, 다양한 농도의 다수 공동결합된 DNA 표준은 복합되어 혼합물을 형성할 수 있다. 또다른 실시예에서, 30개의 공동결합된 DNA 표준이 복합되어 혼합물을 형성한다.
인공 미생물 게놈을 나타내는 DNA 표준
메타게놈은 상이한 유기체의 다수 게놈 연구를 수반하며, 이것은 미생물 게놈 집단을 프로파일하는데 적용될 수 있다. 예를 들면, 메타게놈 분석은 단일 시료 (이를 테면, 환경적 시료) 안에 미생물 게놈의 서열을 결정하고, 이의 풍도를 측정하는데 이용될 수 있다. 인공 미생물 게놈과 일치되고, 이를 나타내도록 DNA 표준을 만들 수 있고, 이로 인하여 미생물 집단 구조 및 다양성을 에뮬레이팅할 수 있다.
따라서, 본 명세서는 인공 미생물 게놈에 기초를 둔 DNA 표준을 제공한다. 이러한 DNA 표준은 전장의 인공 미생물 게놈의 오직 대표적인 부분서열 (가령, 도 10에서 설명됨)에만 일치될 수 있다. 예를 들면, 미생물 게놈 크기는 상당히 가변적이다 (보통 일반적인 분류군의 경우 0.5 내지 7 Mb). 따라서, DNA 표준은 전장의 인공 미생물 게놈에 비례하는 길이 (예를 들면, 0.5 내지 7 Kb의 1% 크기)일 수 있다.
더욱이, 미생물의 게놈은 광범위한 GC 함량 (가령, 20% - 75%)을 나타낸다. 상기 본 명세서에서 공개된 DNA 표준은 전장의 인공 미생물 게놈에 비례하는 GC 함량 (예를 들면, 20% - 75%)을 가질 수 있다. 상기 인공 미생물 게놈 안에 단지 대표적인 부분서열에만 일치되는 DNA 표준을 이용하면, 천연 시료 안에 전형적으로 존재하는 미생물 집단 구조와 유사한 표준간의 광범위한 풍도는 한편으로 유지하면서 이 미생물 집단을 프로파일하는데 요구되는 시퀀싱 심도(depth)를 줄일 수 있다.
소규모 유전적 변이를 나타내는 DNA 표준
소규모 유전적 변이는 인공 염색체 서열의 2개 또는 그 이상의 변이체 대립유전자를 구별한다 (가령, 도 6에서 설명됨). DNA 표준은 다수 인공 염색체 간에 이러한 소규모 유전적 변이를 나타내도록 기획될 수 있다. 예를 들면, "기준" 인공 염색체 안에 존재하는 대립 유전자의 서열과 일치되는 개별 DNA 표준이 만들어질 수 있고, 그리고 "변이체" 인공 염색체 안에 존재하는 대립유전자의 서열과 일치되는 개별 DNA 표준이 만들어질 수 있다.
상기 DNA 표준의 상대적 풍도는 대립유전자의 상대적 빈도와 일치될 수 있다. 예를 들면, 동일한 풍도에서 대체 변이체와 일치되는 하나의 DNA 표준과 기준 변이체와 일치되는 하나의 DNA 표준은 이배수체 게놈에서 대립유전자의 이형접합성 빈도를 에뮬레이트할 수 있다. 또다른 실시예에서, 대체 변이체와 일치되는 단일 DNA 표준은 이배수체 게놈에서 대립유전자의 이형접합성 빈도를 에뮬레이트할 수 있다. 또다른 실시예에서, 가변 풍도에서 대체 변이체와 일치되는 하나의 DNA 표준과 기준 변이체와 일치되는 하나의 DNA 표준은 이질적 빈도를 에뮬레이트할 수 있다. (비-이중-대립유전자의 비율(non-bi-allelic ratios)에 존재하는, 이를 테면, 시료의 단지 하위집단만이 돌연변이를 품고 있을 때). 따라서, 인공 염색체 간에 유전적 변이의 존재 및 빈도를 에뮬레이팅하기 위하여 DNA 표준을 만들 수 있다.
대규모 구조적 변이를 나타내는 DNA 표준
대규모 유전적 변이는 인공 염색체 서열의 2개 또는 그 이상의 변이체 대립유전자를 구별할 수 있다. DNA 표준은 다수 인공 염색체 간에 이러한 대규모 유전적 변이와 일치되고 그리고 나타내도록 기획될 수 있다 (가령, 도 8에서 설명됨). 상기 DNA 표준의 상대적 풍도는 대규모 변이의 상대적 빈도와 일치될 수 있고, 접합성을 에뮬레이트할 수 있다.
텐덤 반복 어레이 (가령, 도 5에서 설명됨)에서 하나 또는 그 이상의 반복 단위와 일치되는 DNA 표준이 제공될 수 있다. 반복 단위 복제 수를 에뮬레이팅하기 위하여, DNA 표준 농도에서 변이가 또한 선택될 수 있다. 예를 들면, 높은 복제 수 변이체에 대응하도록 풍부한 DNA 반복 표준이 준비될 수 있다. 역으로, 낮은 복제 수 변이체에 대응하도록 저풍도의 DNA 반복 표준이 준비될 수 있다. 추가적으로, 상기 DNA 표준의 상대적 표준은 원하는 대립유전자 빈도와 일치되도록 또한 보정될 수 있다.
DNA 표준을 구별하기 위한 서열 바코드
동일한 DNA 서열 (이를 테면, 동일한 반복 요소)과 일치되는 DNA 표준들을 서로 구별하기 위하여, 하나 또는 그 이상의 '바코드' 뉴클레오티드 서열들이 DNA 표준 안에 혼입될 수 있다 (가령, 도 17에서 설명됨). 바코드 뉴클레오티드 서열들은 전형적으로 작은 (가령, 4, 5, 6, 7, 8, 9, 또는 10개의 뉴클레오티드) 연속 또는 비-연속 뉴클레오티드 서열들로써, 총 DNA 표준 서열의 단지 작은 분획을 이룬다. 예를 들면, 하나 또는 그 이상의 바코드 뉴클레오티드 서열들은 상기 표준 DNA의 총 뉴클레오티드 서열의 10% 미만의, 이를 테면, 9% 미만의, 이를 테면, 8% 미만의, 이를 테면, 7% 미만의, 이를 테면, 6% 미만의, 이를 테면, 5% 미만의, 이를 테면, 4% 미만의, 이를 테면, 3% 미만의, 이를 테면, 2% 미만의, 이를 테면, 1% 미만으로 구성될 수 있다. 바코드 뉴클레오티드 서열의 존재로 인하여 DNA 표준이 식별될 수 있다. 예를 들면, 다수 DNA 표준이 동일한 인공 염색체 서열들과 일치될 때, '바코드' 뉴클레오티드 서열들은 동일한 인공 염색체 서열들과 일치되는 모든 DNA 표준 안에 특정 DNA 표준의 식별이 가능하도록 한다. 분석하는 동안 상기 바코드 서열은 제거되거나 또는 변형될 수 있기 때문에, 정렬을 간섭하지는 않는다.
면역 수용체 클론형을 나타내는 DNA 표준
상기 본 명세서에서 공개된 DNA 표준은 대응하는 인공 염색체 (가령, 도 12 및 13에서 설명됨) 안에 인코드된 면역글로불린 및 T-세포 수용체 유전자 좌로부터 생성된 인공 클론형과 일치되고, 이를 나타내도록 기획될 수 있다. 한 실시예에서, DNA 표준은 무작위로 선택된 V, D 및 J 세그먼트의 클론형 서열을 포괄한다. 상기 본 명세서에서 공개된 DNA 표준은 면역 레퍼토리 시퀀싱에서 흔히 이용되는 범용 프라이머 서열에 상보적인 작은 서열을 또한 유지할 수 있다. 예를 들면, DNA 표준은 천연 클론형 다양성을 프로파일링하기 위한 BIOMED-2 (van Dongen, Langerak et al. 2003) 연구에 설명된 프라이머 서열들을 유지할 수 있다.
각각 인공 클론형을 나타내는 다수의 DNA 표준이 이 방법에 의해 만들어질 수 있다. 이들 DNA 표준은 인간 백혈구 세포의 면역-레퍼토리 시퀀싱 하는 동안 전형적으로 관찰되는 천연 수용체 클론형의 크기, 다양성, 복합성 및 프로파일을 에뮬레이팅하도록 혼합물 안에 복합될 수 있다.
16S
표지자 유전자를 나타내는 DNA 표준
DNA 표준은 인공 미생물 게놈으로부터 인공 16S rRNA 유전자 서열들을 나타낼 수 있다 (가령, 도 11에서 설명됨). 상기 인공 16S rRNA 유전자는 앰플리콘 시퀀싱에 흔히 이용되는 범용 16S 프라이머에 대하여 2개의 상보적 서열을 유지하는 것을 제외하고, 공지된 서열에 대한 상동성을 갖지 않는다. 이로써 상기 DNA 표준은 16S 프라이머와 함께 PCR 증폭을 위한 주형으로 작용할 수 있도록 한다. 이로 인하여 상기 DNA 표준의 증폭은 미생물 집단 동일성 및 구조를 결정하는데 흔히 이용되는 16S rRNA 표지자 유전자의 시퀀싱과 PCR 증폭의 합성적, 정량적 척도를 제공한다.
사용 방법들:
상기 본 명세서에서 공개된 폴리뉴클레오티드 표준은 광범위한 다양한 시퀀싱 방법들을 보정하는데 이용될 수 있다. 이는 결정되어야 하는 표적 DNA/RNA 서열을 포함하는 시료에 상기 폴리뉴클레오티드 표준을 추가함으로써 이루어질 수 있다. 표적 DNA/RNA의 원천은 임의의 공지된 유기체 또는 환경적 시료로부터 유래될 수 있다. 예를 들면, 상기 폴리뉴클레오티드 표준은 동물 (이를 테면, 포유류, 인간, 또는 다른 것들), 식물 (이를 테면, 옥수수, 쌀, 또는 다른 것들), 미생물 (이를 테면, 박테리아, 고세균류, 또는 다른 것들) 그리고 환경적 원천 (이를 테면, 토양 시료, 인간 대변, 임상 시료 이를 테면, 감염 상처의 액체 및 다른 것들)으로부터 유도된 천연 RNA 시료에 추가 될 수 있다. 상기 본 명세서에서 공개된 폴리뉴클레오티드 표준은 결정될 표적 DNA/RNA 서열이 포함된 임의의 시료에서 실행되는 시퀀싱 방법을 보정하는데 이용될 수 있음을 인지할 것이다.
본 명세서에서 공개된 폴리뉴클레오티드 표준은 천연 폴리뉴클레오티드 서열들과 상동성 (또는 서열 동일성)이 없거나 거의 없기 때문에, 상기 폴리뉴클레오티드 표준으로부터 유도된 서열화된 판독은 시료 안에 존재하는 천연 RNA/DNA로부터 유도된 서열화 판독과 구별될 수 있다 (가령, 도 18에서 설명됨). 따라서, 본 명세서에서 공개된 상기 단편 (표준)은 폴리뉴클레오티드 표준으로부터 유도된 서열화된 판독이 시료 안에 존재하는 천연 RNA/DNA로부터 유도된 서열화 판독과 구별될 수 있도록 하기 위하여 선택된 공지된 자연 발생적 서열들에 대하여 동일성 백분율을 가질 수 있다. 이로써 시퀀싱 전에, 상기 폴리뉴클레오티드 표준은 상기 RNA/DNA 시료에 추가되고, 따라서 관심대상의 DNA/RNA 시료와 같은 동일한 라이브러리 준비, 시퀀싱, 정렬 및 분석을 거치게된다. 그러나, 시퀀싱 후, 폴리뉴클레오티드 표준과 일치되는 판독은 관심대상의 DNA/RNA 시료와 일치되는 판독과 구별될 수 있다.
따라서, 본 명세서에서 공개된 방법들은 시료 안에 관심대상의 표적 폴리뉴클레오티드 (DNA 또는 RNA)의 서열을 결정하는 단계를 포함한다. 본 명세서에서 공개된 방법들은 이 시료에 추가되었던 하나 또는 그 이상의 폴리뉴클레오티드 표준의 서열을 결정하는 단계를 또한 포함한다. 본 명세서에서 공개된 방법들은 이 시료 안에 관심 대상의 표적 폴리뉴클레오티드 (DNA 또는 RNA)의 서열 및/또는 양을 이 시료에 추가되었던 하나 또는 그 이상의 폴리뉴클레오티드 표준의 서열 및/또는 양과 비교하는 단계를 더 포함한다. 이러한 비교로 하나 또는 그 이상의 폴리뉴클레오티드 표준의 측정에서 유도된 값에 대응하여 이 시료 안에 상기 표적 폴리뉴클레오티드의 측정으로부터 유도된 값을 표준화할 수 있다. 따라서, 본 명세서에서 공개된 방법들은 하나 또는 그 이상의 폴리뉴클레오티드 표준의 측정에서 유도된 값에 대응하여 이 시료 안에 상기 표적 폴리뉴클레오티드의 측정으로부터 유도된 값을 표준화하는 단계를 더 포함할 수 있다. 이들 값을 표준화할 수 있는 임의의 적합한 수학적 알고리즘이 이용될 수 있다.
많은 경우들에 있어서, RNA/DNA 시료와 복합된 폴리뉴클레오티드 표준은 이 시료 안에 RNA/DNA의 복합된 전체 양의 단지 일부분만으로 구성된다. 이러한 분획 기여(fractional contribution) (전형적으로 이 시료 안에 전체 RNA/DNA 양의 0.1 내지 10%, 또는 전형적으로 이 시료 안에 전체 RNA/DNA 양의 10%, 이를 테면, 5% 미만의, 이를 테면, 1% 미만의, 이를 테면, 0.5% 미만)는 분석에 이용된 라이브러리 준비 타입 (가령, rRNA 제거, polyA 또는 전체 RNA 정제 준비물)에 따라 변화된다. 상기 폴리뉴클레오티드 표준의 분획 기여는 상기 RNA/DNA 시료에 기인된 시퀀싱 심도에 역 비례할 수 있다. 따라서, 상기 폴리뉴클레오티드 표준의 분석을 충분히 가능하게 하는데 필요한 최소량으로 전체 분획이 선택될 수 있다.
폴리뉴클레오티드 표준에서 시퀀싱 오류 측정
시퀀싱 오류는 뉴클레오티드가 잘못 결정되었을 때 발생되는데, 아마도 라이브러리 준비 또는 시퀀싱 과정 자체의 오류 또는 인공물에 기인한 것이다. 폴리 뉴클레오티드 표준으로부터의 서열화된 판독의 분석은 뉴클레오타이드 오류 차이를 확인하고 정량화할 수 있다. 시퀀싱 오류를 식별하는 적합한 소프트웨어는 Quake (Kelley, Schatz et al. 2010) 및 SysCall (Meacham, Boffelli et al. 2011)을 포함한다. 그런 다음 이 분석을 사용하여 서열 성능 및 품질을 측정할 수 있다. 또한 이 분석을 통해 연구자는 시료 DNA/RNA의 판독 내에서 전체적인 시퀀싱 오류를 표준화하거나 보정할 수 있고, 이 시료 안에서 표적 DNA/RNA를 좀더 정확하게 (정량적 및 품질으로) 측정할 수 있다. 상기 폴리뉴클레오티드 표준의 시퀀싱 오류 프로파일을 또한 이용하여 진짜 뉴클레오티드 차이 (이를 테면, SNPS 또는 뉴클레오티드 변형)와 시퀀싱 오류를 구별해낼 수 있다.
폴리뉴클레오티드 표준으로 서열 정렬의 평가
시퀀싱 조작 동안, 서열화된 작은 판독은 대개 기준 게놈에 우선 정렬된다. 큰 기준 게놈에 대한 판독의 정렬은 다양한 방법에서 실행될 수 있는 속도, 민감도 및 정확도에 대한 차등적 결과를 제공하는 다양한 방법에서 실행될 수 있는 계산 집약적 작업이다. 상기 본 명세서에서 공개된 폴리뉴클레오티드 표준은 서열화된 판독이 본 명세서에서 공개된 인공 염색체에 정렬되는 효율 및 정확성을 평가하는데 사용될 수 있고, 이로 인하여 상기 실행된 정렬 방법들을 보정할 수 있다. 따라서, 본 명세서에서 공개된 방법들은 상기 폴리뉴클레오티드 표준으로부터 유도된 서열화된 판독을 이들 표준이 유도된 인공 염색체에 정렬시키는 단계를 추가로 포함할 수 있다. 임의의 적합한 정렬 방법들은 이 단계를 실행하는데 이용될 수 있다. 서열 판독의 정렬을 실행하는 적합한 소프트웨어의 예로는 BWA (Li and Durbin 2009, Kelley, Schatz et al. 2010) 및 Bowtie (Langmead, Trapnell et al. 2009)을 포함한다.
서열화된 판독은 기준 게놈과 인공 염색체에 바람직하게는 동시에 정렬된다. 한 실시예에서, 상기 인공 염색체 서열은 기준 게놈과 복합되어 신속한 정렬을 용이하게 하는 지표를 만든다. 이것은 서열화된 판독이 상기 인공 염색체와 기준 게놈 모두에 동시에 정렬될 수 있도록 한다 (가령, 도 18에서 설명됨). 상기 인공 염색체에 판독이 정렬되는 정확도 및 민감도를 평가함으로써, 상기 천연 게놈에 정렬되는 판독의 병행 및 경험적 평가를 동시에 수행할 수 있다.
상기 인공 염색체에 대한 본 명세서에서 공개된 폴리뉴클레오티드 표준으로부터 유도된 판독의 정렬은 다수의 특징들에 따라 평가 될 수 있다(그러나, 이에 한정되지 않는다): 예를 들면, 정확한 판독 정렬의 민감도 및 특이성; 및/또는 조화롭게 부조화롭게 메핑된, 또는 딱 들어맞는 판독-쌍의 비율; 및/또는 정렬 불일치 및 염기-단계(base-wise)에서 정확도.
분할(split) 또는 비-연속 방식으로 기준 게놈에 정렬되도록 하기 위해서는 인트론들을 횡단하는 RNA 서열화된 판독이 필요하다. 인트론들 및 엑손들의 접합(splicing)을 에뮬레이팅하도록 기획된 RNA 표준이 본 명세서에서 공개된다. 따라서, 이러한 RNA 표준을 이용하여 인트론들에 걸쳐 판독의 분할 정렬을 평가할 수 있다. 상기 RNA 표준으로부터 유도된 분할 판독은 상기 인공 염색체와 천연 염색체 모두에 정렬될 수 있다. 서열 판독의 분열 정렬을 실행하는 적합한 소프트웨어의 예로는 Tophat2 (Kim, Pertea et al. 2013) 및 STAR (Dobin, Davis et al. 2013)을 포함한다. 그 다음 상기 인공 염색체에 대한 분할 정렬은 인공 유전자 주석(annotations)과 비교되어, 인트론들에 걸쳐 정렬된 판독의 민감도와 특이성을 평가할 수 있다.
대체 접합, 전사 개시 및 종료는 단일 유전자 좌로부터 광범위한 동형을 만든다. 접합된 정렬과 접합안된 정렬들이 전체-길이 전사체 모델로 어셈블리되는 정확도를 평가하는데 이용될 수 있는 RNA 표준이 또한 본 명세서에서 공개된다. 예를 들면, 상기 인공 염색체와 천연 염색체 모두에서 중첩되는 판독 정렬로부터 전체-길이 전사체 동형들이 어셈블리될 수 있다. 서열 판독의 어셈블리를 실행하는 적합한 소프트웨어의 예로는 Cufflinks (Trapnell, Williams et al. 2010) 및 Trinity (Haas, Papanicolaou et al. 2013)을 포함한다. 어셈블리된 RNA 전사체의 구조는 인공 유전자 주석에 비교되어, 전사체 어셈블리가 발생된 민감도와 특이성이 평가 될 수 있다 (가령, 도 3에서 설명됨). 그 다음 이 평가는 동반 천연 시료 안에 유전자 모델들의 어셈블리를 알리는데 이용될 수 있다.
폴리뉴클레오티드 표준의 정량적 정확도 평가
개별 폴리뉴클레오티드 표준은 공지된 농도로 희석될 수 있으며, 그리고 집합적으로 복합되어 이러한 표준의 정량적 척도를 제공하는 혼합물이 형성될 수 있다. 이 척도를 규정하기 위하여 선택된 특정 값들은 분석될 시료 안에 존재하는 표적 RNA/DNA의 예상 양에 기초하여 결정될 수 있다. 시퀀싱 후, 상기 폴리뉴클레오티드 표준에 정렬된 판독의 수는 풍도의 정량적 척도를 제공할 수 있다. 폴리뉴클레오티드 표준의 공지된 몰 농도와 측정된 판독 풍도 간의 비교를 이용하여 다음의 다양한 방법(이에 국한되지 않음)으로 시료내 그리고 시료간의 정량적 분석을 알릴 수 있다:
(i)
동일한 폴리뉴클레오티드 표준의 측정된 풍도에 대한 폴리뉴클레오티드 표준의 공지 농도의 비교는 상기 DNA/RNA 시퀀싱 방법의 정략적 정확도를 나타낸다.
(ii) 역동 범위(상기 폴리뉴클레오티드 표준의 최대 풍도와 최저 풍도 간의 차이)는 정량적 선형 (또는 이의 일부분)을 나타낸다. 이들 예측으로부터 출발은 정량적 표준화를 수행할 수 있다.
(iii) 더 낮은 검출 한계 (탐지된 폴리뉴클레오티드 표준의 최저 농도)는 라이브러리 크기 및 민감도를 나타낸다.
(iv) 정량화된 폴리뉴클레오티드 표준은 대응하는 풍도에서 유전자의 정량화를 위한 내부 기준을 포함한다.
(v)
시퀀싱 단위 (R/FPKM)를 몰 또는 절대 (전사체 복제 수) 단위로 변환할 수 있다.
(vi) RNA 표준의 정량적 범위는 2개 또는 그 이상의 시료의 표준화를 가능하게 하고, 유전자 발현의 비교 분석을 가능하게 한다.
RNA 표준으로 유전자 발현을 측정
유전자 발현 프로파일링은 RNA 시퀀싱 판독을 이용하여 다수 유전자의 풍도를 측정한다. 본 명세서에서 공개된 RNA 표준은 혼합물을 형성하기 위한 농도 범위에서 추가 될 수 있고, 이로 인하여 차등적 유전자 발현을 에뮬레이트할 수 있다. RNA 표준을 측정하는 정확도가 평가 될 수 있고, 이로 인하여 동반 천연 RNA 시료에서 유전자 발현 분석의 정량적 정확도를 평가할 수 있다 (가령, 도 19에서 설명됨).
다수 RNA 표준은 공지된 농도 범위에 걸쳐 복합될 수 있고, 상이한 혼합물을 형성하기 위하여 집합적으로 복합될 수 있으며, 시료 간에 유전자 발현에서 차등적 유전자 풍도, 그리고 배수 변화들을 에뮬레이트할 수 있다. RNA 표준의 풍도가 측정될 수 있다. RNA 표준의 정량화를 실행하는 적합한 소프트웨어의 예로는 EdgeR (Robinson, McCarthy et al. 2010) 및 DEseq (Anders, McCarthy et al. 2013)을 포함한다. 이들의 공지된 몰 농도에 대한 RNA 표준의 측정된 풍도의 비교로 전사체 정량화의 정확도를 나타낼 수 있다. RNA 표준에 대한 천연 유전자의 풍도를 비교하거나 또는 다수 RNA 표준을 포함하는 정량적 기준 척도의 비교는 유전자 발현의 측정을 또한 알려줄 수 있다.
유사하게, 대체 RNA 표준 동형이 상이한 농도에서 포함되어 대체 접합을 에뮬레이트할 수 있다. 적합한 소프트웨어, 이를 테면, Cufflinks (Trapnell, Williams et al. 2010) 또는 MISO (Katz, Wang et al. 2010)을 이용하여 RNAs 표준 동형의 풍도가 측정될 수 있다. 혼합물간에 RNA 표준 동형 풍도에서 관찰된 배수-변화를 결정하여, 유전자 발현의 변화와는 무관한 시료간에 측정되는 동형 전환 및 대체 접합의 정확도를 평가할 수 있다. RNA 표준에 대한 천연 동형의 풍도 비교는 또한 대체 접합의 척도를 또한 알려줄 수 있다.
DNA 표준에 의해 나타나는 소규모 유전적 변이 탐지
상기 인공 염색체에서 소규모 유전적 변이의 변이체와 기준 대립 유전자를 나타내는 본 명세서에서 공개된 DNA 표준이 만들어질 수 있다 (가령, 도 6에서 설명됨). 다음을 포함하는 다양한 변수는 변이체 식별 및 유전자형 할당에 영향을 줄 수 있지다(그러나 이에 국한되지 않는다): 변이체 접합성; 판독 정렬, 품질 및/또는 적용범위; 변이체 타입 및 복합성 (가령 SNPs, indels, 동종중합체); 기부(proximal) 서열 맥락; 그리고 소규모 유전적 변이를 식별하는데 이용된 소프트웨어. 상기 본 명세서에서 공개된 DNA 표준은 소규모 유전적 변이가 확인되는 민감도 및 특이성을 평가하는데 이용될 수 있다. DNA 표준의 서열 결정은 기준 인공 염색체 서열에 대한 소규모 변이를 확인할 수 있다. 소규모 유전적 변이를 식별하는데 적합한 소프트웨어는 GATK (McKenna, Hanna et al. 2010) 및 SAMtools (Li, Handsaker et al. 2009)을 포함한다. DNA 표준 안에서 탐지되는 소규모 유전적 변이의 정확도 및 민감도는 상기 인공 염색체에 대하여 평가 될 수 있다 (가령, 도 20에서 설명됨). 불확실성 값(이를 테면, 95% 신뢰 구간)은 정확도 추정치로 돌릴 수 있다. 상기 인공 염색체 안에서 확인되는 소규모 유전적 변이의 신뢰도 및 민감도의 비교는 동반 DNA 시료 안에 소규모 유전적 변이 식별을 또한 알릴 수 있다.
DNA 표준에 의해 나타나는 대립유전자 빈도 측정
변이체를 수반하는 (이를 테면, 종양 시료 안에 암세포의 하위집단이 유해한 변이체를 가지는 경우) 시료 안에 DNA 분획을 추정하거나 또는 유전자형을 정확하게 부여하기 위하여 대립유전자의 빈도의 정확한 정량이 필요하다 . 상기 본 명세서에서 공개된 DNA 표준은 차등적 대립유전자 빈도를 에뮬레이팅하는데 이용될 수 있고, 이로 인하여 대립유전자 빈도가 측정되는 정량적 정확도를 평가 또는 보정할 수 있다.
예를 들면, 상이한 대립유전자들을 나타내는 DNA 표준은 시퀀싱을 위하여 상기 천연 DNA 시료와 함께 복합되는 혼합물 안에 다양한 농도로 복합될 수 있다. 그 다음 변이체 대립유전자의 각각에 대한 공지된 몰 농도와 측정된 판독 풍도 (각각은 상이한 DNA 표준에 의해 나타냄)의 비교로 실행되는 대립유전자 빈도의 정량적 평가가 가능하다. 따라서, 상이한 상대적 농도에서 변이체 탐지의 민감도, 특이성 및 정밀도를 결정하고, 천연, 표적 변이체 대립유전자의 탐지 및/또는 정량화와 비교하기 위한 정량적 척도를 확립하기 위하여 본 명세서에서 공개된 DNA 표준이 이용될 수 있다. 따라서, 본 명세서에서 공개된 방법들은 변이체 대립유전자를 나타내는 DNA 표준을 준비하는 단계를 포함할 수 있으며, 이때 각 변이체 DNA 표준은 결정된 농도에서 추가된다. 상기 방법들은 또한 혼합물에 변이체 DNA 표준의 각 서열 및 양을 결정하는 것을 또한 포함할 수 있다. 본 명세서에서 공개된 방법들은 측정된 변이체 DNA 표준 빈도의 정량적 척도를 제공하는 단계를 더 포함할 수 있고, 이의 척도는 단일 DNA 시료 안에, 또는 다수 DNA 시료 간에 결정된 천연 DNA 대립유전자의 정량적 척도를 보정하는데 이용될 수 있다.
DNA 표준에 의해 나타나는 대규모 변이의 분석
대규모 또는 구조적 유전적 변이는 서열화된 판독의 길이보다 대개 더 길기 때문에 정확하게 분석하는 것이 어려울 수 있다. 본 명세서에서 공개된 DNA 표준은 대규모 변이를 나타내고, 에뮬레이팅하기 위하여 만들어질 수 있다. 예를 들면, 구조적 변이를 나타내는 DNA 표준은 구조를 정확하게 분석하는 소프트웨어 프로그램의 능력을 평가하고; 그리고 구조적 변이체의 상대적 풍도 및 복제 수를 정량화하고, 및/또는 구조적 변이를 포함하는 서열에 유전자형을 부여하는데 이용될 수 있다. 대규모 변이를 푸는 적합한 소프트웨어는 BreakDancer (Chen, Wallis et al. 2009) 및 Cortex (Iqbal, Caccamo et al. 2012)를 포함한다. 상기 본 명세서에서 공개된 DNA 표준은 기준 인공 염색체에 대한 구조적 변이로 인한 서열 판독의 재-분배하는데 또한 이용될 수 있다. DNA 표준의 측정은 동반 천연 게놈 DNA 시료 안에 대규모 변이가 확인되고, 정량화되는 정확도 평가를 알려줄 수 있다.
DNA 표준의 데노보(
de novo
) 어셈블리
자연 발생적 기준 게놈이 이용불가능한 경우, 서열 판독의 중첩으로부터 게놈 서열들은 데노보(de novo) 어셈블리되어야 한다. DNA 표준의 데노보 어셈블리의 병행은 동반 표적 게놈 DNA 시료와 동시에 실행될 수 있다. 데노보 어셈블리를 위한 적합한 소프트웨어는 Velvet (Zerbino and Birney 2008) 및 ABySS (Simpson, Wong et al. 2009)을 포함한다. 게놈 어셈블리에 영향을 주는 변수는 다음을 포함한다 (그러나 이에 국한되지 않는다): 게놈 복합성 및 반복 함량; 배수성; 시퀀싱 심도, 품질 및 오류 비율; 판독 길이 및 삽입 크기; 그리고 이용된 소프트웨어 프로그램 및 매개변수들 (k-mer 길이, 정렬 접근법, 판독 소프트-클리핑(soft-clipping), 및 기타 매개변수들 포함). DNA 표준의 데노보 어셈블리에 대한 이들 변수의 영향이 평가 될 수 있다.
상기 어셈블리된 서열은 공지된 DNA 표준과 비교되어, 데노보 어셈블리의 수행능과 상기에서 설명된 매개변수의 영향을 평가한다. 인공 염색체의 데노보 어셈블리는 임의의 하나 또는 그 이상에 따라 평가 될 수 있다: N50 값; 중앙값, 최대 및/또는 복합된 콘틱 크기; 상기 인공 염색체에 대한 콘틱 적용범위 및 갭; 상기 인공 염색체에 대한 콘틱의 불일치 또는 염기 단계 정확도; 그리고 거대한 또는 전체적 어셈블리 오류의 확인 DNA 표준의 데노보 어셈블리 평가는 동반 표적 천연 DNA 시료의 데노보 어셈블리 평가를 알려줄 수 있다.
DNA 표준으로 메타게놈 분석
메타게놈 분석은 환경적 시료로부터 다수 미생물 게놈의 어셈블리 및 정량화를 대개 포함한다. 상기 본 명세서에서 공개된 DNA 표준은 상이한 풍도에서 게놈의 이질적 수집으로 구성되는 복합 미생물 집단을 에뮬레이팅하는데 이용될 수 있다 (가령, 도 10에서 설명됨). 미생물 게놈을 나타내는 이들 DNA 표준을 이용하여 메타게놈 분석을 평가할 수 있다. 메타게놈 분석에 영향을 주는 변수는 다음을 포함한다 (그러나 이에 국한되지 않는다): 미생물 집단 게놈 크기, 복합성, 반복 및 GC 함량, 그리고 사용자-정의된 변수, 이를 테면, 시퀀싱 심도 및 적용범위, 정량적, 판독 길이 및 삽입 크기, 그리고 이용된 소프트웨어와 매개변수들. DNA 표준의 메가게놈 분석에서 이들 변수의 영향이 평가 될 수 있다.
본 명세서에서 공개된 메타게놈 DNA 표준은 데노보 어셈블리의 실행 및 분석을 평가하는데 이용될 수 있다 (가령, 도 21에서 설명됨). 상기 인공 염색체 관련하여 DNA 표준의 어셈블리는 다음을 포함하는 다수의 특징에 따라 평가 될 수 있다 (그러나 이에 국한되지 않는다): N50 값; 중앙값 및 최대 콘틱 크기; 적용범위; 어셈블리된 DNA 표준콘틱의 염기 단계 정확도는 대응하는 인공 염색체와 비교될 수 있다. DNA 표준의 메타게놈 분석의 평가는 동반 표적 천연 DNA 시료의 메타게놈 분석의 평가를 알려줄 수 있다.
NGS 시퀀싱은 표본 집단 안에 미생물의 풍도 및 다양성을 결정할 수 있다. 상기 본 명세서에서 공개된 DNA 표준이 상이한 상대적 농도에서 복합되어 정량적 기준을 포함하는 혼합물을 만들 수 있다. 본 명세서에서 공개된 방법들은 측정된 메타게놈 DNA 표준 빈도의 정량적 척도를 제공하는 단계를 더 포함할 수 있으며, 이 척도는 그 다음 동반 환경적 시료 안에서 결정된 천연 미생물 게놈의 정량적 척도를 보정하는데 이용될 수 있다.
상기 DNA 표준은 정량적 풍도에 대한 메타게놈 분석을 평가하는데 또한 이용될 수 있다. 예를 들면, 상기 DNA 표준은 다음을 평가하는데 이용될 수 있다 (이에 국한되지 않는다):효과적인 어셈블리에 필요한 최저 서열 적용범위; 더 낮은 검출 한계 (가령, 메타게놈 DNA 표준이 탐지되는 최저 농도); 그리고 라이브러리 민감도, 크기 및/또는 다양성의 척도. 본 명세서에서 공개된 메타게놈 DNA 표준은 2개 또는 그 이상의 시료 간에 정량적 비교에 또한 이용될 수 있고, 이는 미생물 집단 구조와 2개 또는 그 이상의 시료 간에 실행되는 다양성의 비교 분석을 가능하게 한다.
DNA 표준으로
16S
rRNA 프로파일링
16S rRNA 유전자는 큰 복합 미생물 집단의 프로파일링을 위한 계통발생적 표지자로 대개 이용된다. 인공 미생물 게놈으로부터 16s rRNA 유전자의 일부분을 나타내고, 일치되는 DNA 표준이 생성될 수 있다 (가령, 도 11에서 설명됨). 더욱이, 인공 16S rRNA 유전자를 나타내는 DNA 표준은 상이한 상대적 농도에서 복합되어, 미생물 집단을 에뮬레이팅하고, 실행되는 16S 프로파일링 어플리케이션의 평가도 가능하다.
상기 인공 16S rRNA 유전자와 일치되는 DNA 표준은 범용 프라이머에 상보적인 작은 서열을 보유할 수 있고, 따라서 천연 16S rRNA 유전자와 나란히 증폭될 수 있다. 상기 DNA 표준으로부터 생성된 앰플리콘은 그 다음 분석되어 다음중 임의의 하나 또는 그 이상을 평가한다: (i) 차등적 PCR 증폭 편향; 그리고 (ii) 공지된 시작 농도의 이들 DNA 표준과 비교하여 DNA 표준 앰플리콘의 측정 풍도를 비교함으로써 정량적 정확도. 추가적으로, 상기 DNA 표준으로부터 생성된 앰플리콘은 관심대상의 동반 메타게놈 시료로부터 앰플리콘을 정량화하기 위한 비교용 정량적 척도를 확립하는데 이용될 수 있다.
DNA 표준으로 GC 편향 확인
라이브러리 준비 및 시퀀싱 동안 몇 가지 반응에서 GC 함량의 영향은 어셈블리 및 정량화에서 편향을 야기하는 미생물 게놈의 왜곡된 현시를 초래한다 (Chen, Y.C., et al., 2013). 상기 본 명세서에서 공개된 DNA 표준은 시퀀싱 및 분석에서 GC 함량의 영향을 평가하는데 이용될 수 있다.
미생물 게놈에서 관찰된 광범위한 GC-함량과 일치되도록 DNA 표준이 만들어질 수 있다. 시퀀싱 및 분석에 앞서 환경적 DNA 시료 안에 DNA 표준이 복합될 수 있다. GC-함량과 관련된 DNA 표준의 정렬, 어셈블리 및/또는 정량화에서 편향이 확인될 수 있다. 예를 들면, 측정된 풍도와 DNA 표준의 공지된 농도 간의 차이는 GC-함량과 연합된 편향을 확인할 수 있고, GC-함량의 영향에 대응하기 위한 후속 정량적 표준화가 가능할 수 있다. 상기 본 명세서에서 공개된 DNA 표준은 DNA 정량화에서 GC-함량 편향을 최소화하기 위한 표준화 매개변수들을 확립하기 위한 트레이닝 세트(training set)로 또한 이용될 수 있다.
면역 수용체 시퀀싱에 DNA 표준 이용
면역 레퍼토리 시퀀싱은 백혈구 세포에 의해 발현되는 면역 수용체 서열들 세트를 증폭하기 위하여 공통적인 프라이머 세트를 이용한다. 상기 인공 염색체 상에 인공 클론형을 나타내도록 상기 본 명세서에서 공개된 DNA 표준을 기획할 수 있다 (도 12 및 13에서 설명됨). 클론형 DNA 표준의 범위 및 복합성은 백혈구 세포 시료에 의해 발현되는 천연 클론형의 복합 및 다양한 프로파일을 에뮬레이팅하기 위하여 맞출 수 있다.
상기 본 명세서에서 공개된 DNA 표준은 면역 레퍼토리 시퀀싱에 통상적으로 이용되는 각 프라이머 쌍에 상보적인 작은 서열을 또한 유지할 수 있다. 따라서, PCR 증폭은 시료 안에 관심 대상의 천연 클론형 뿐만 아니라 또한 상기 DNA 표준에 의해 나타나는 클론형을 증폭하는데 이용될 수 있다. 따라서, DNA 표준은 면역 레퍼토리 시퀀싱 동안 범용 프라이머를 이용한 증폭의 주형으로 작용할 수 있다. 증폭 및 시퀀싱 후, DNA 표준으로부터 유도된 판독은 면역 레퍼토리 시퀀싱의 수행을 평가하고, 상이한 클론형의 상대적 풍도를 정량화하기 위하여 분석될 수 있다. DNA 표준은 하이브리드 효과에서 차이로 인한 것일 수 있는 상이한 범용 프라이머의 증폭 편향을 결정하는데 또한 이용될 수 있다. 공지된 시작 농도의 DNA 표준에 대하여 DNA 표준 앰플리콘의 측정된 풍도를 비교함으로써 증폭 편향이 결정될 수 있다. 클론형 풍도는 결정된 증폭 편향을 계수하기 위하여 후속적으로 표준화될 수 있다. 상기 본 명세서에서 공개된 DNA 표준은 동반 표적 천연 DNA 시료의 클론형 탐지 및 정량화 평가를 알려줄 수 있는 인공 클론형 탐지 및 정량화를 평가하는데 또한 이용될 수 있다.
본 명세서에서 공개된 임의의 방법들은 동형접합성, 이형접합성 또는 이질성을 복제하기 위하여 본 명세서에서 공개된 2개 또는 그 이상의 단편 (또는 표준)을 추가하는 것을 포함할 수 있다. 예를 들면, 상이한 2개의 단편 (또는 표준)은 이형접합성을 복제하기 위하여 동일한 농도에서 추가 될 수 있다. 따라서, 상이한 농도로 단편 (또는 표준)을 추가하면 동형접합성, 이형접합성 또는 이질성을 복제할 수 있다.
키트:
상기로부터 인지할 수 있겠지만, 본 명세서는 하나 또는 그 이상의 본 명세서에서 공개된 폴리뉴클레오티드 표준을 포함하는 키트를 또한 제공한다. 대안으로 또는 추가적으로, 상기 키트는 본 명세서에 공개된 하나 또는 그 이상의 벡터를 포함할 수 있고, 이 벡터는 본 명세서에서 공개된 하나 또는 그 이상의 표준을 인코드하는 하나 또는 그 이상의 폴리뉴클레오티드 서열들을 포함한다. 상기 키트는 상기 폴리뉴클레오티드 표준을 만들기 위하여 상기 벡터를 발현시키는데 적합한 하나 또는 그 이상의 성분들을 또한 포함할 수 있다. 상기 키트는 본 명세서에서 공개된 본 명세서에서 공개된 폴리뉴클레오티드 표준 및 벡터를 모두 포함할 수 있다. 상기 키트는 여기에 포함된 특정 폴리뉴클레오티드 표준, 이를 테면, (그러나 이에 국한되지 않는다) 이의 서열, 농도, 관심 대상의 구조적 게놈 특징들, 등등을 설명하는 정보와 함께 제공될 수 있다. 상기 키트는 본 명세서에서 공개된 하나 또는 그 이상의 인공 염색체를 또한 포함할 수 있다.
상기 키트는 본 명세서에서 공개된 상기 폴리뉴클레오티드 표준 및/또는 벡터의 임의의 하나 또는 그 이상이 복합된 혼합물을 포함할 수 있다. 표준 및/또는 벡터의 혼합물은 단일 완충액 안에 함께 제공될 수 있고, 이는 하나 또는 그 이상의 용기에 제공될 수 있다. 대안적으로, 표준 및/또는 벡터의 혼합물은 다수의 별도 용기에 제공될 수 있으며, 각 용기는 단일 표준 및/또는 벡터, 단일 농도의 표준 및/또는 벡터를 포함한다. 별도 용기들은 키트로써 서로 함께 제공될 수 있다.
상기 키트는 본원에서 공개된 상기 컴퓨터 장치, 컴퓨터 프로그램가능한 매체, 및/또는 컴퓨터 소프트웨어를 더 포함할 수 있다. 따라서, 상기 키트는 물리적 폴리뉴클레오티드 표준은 실험적으로 이용하며, 상기 컴퓨터 장치 및 소프트웨어가 상기 인공 염색체에 실험적으로 유도된 시퀀싱 정보를 관련시키는데 이용되도록 하기 위하여 패키지로 제공될 수 있다.
컴퓨터 시스템 및 컴퓨터에 의해 실행되는 방법:
본 명세서는 컴퓨터 시스템과 컴퓨터에 의해 실행되는 방법을 또한 제공한다. 도 38은 폴리뉴클레오티드 시퀀싱 공정을 보정하기 위한 적합한 컴퓨터 시스템 3800을 설명한다. 상상기 컴퓨터 시스템 3800은 프로그램 메모리 3804, 데이터 메모리 3806, 통신포트 3808 및 사용자 포트 3810에 연결된 프로세서 3802를 포함한다. 상기 프로그램 메모리 3804는 비-일시적 컴퓨터 판독가능한 매체, 이를 테면, 하드 드라이브, 고체 상태 디스크 또는 CD-ROM과 같은 일시적이지 않은 컴퓨터 판독 가능 매체이다. 소프트웨어, 즉 프로그램 메모리 3804 상에 저장된 실행 가능한 프로그램은 프로세서 3802가 본 명세서에 개시된 방법을 수행하게한다.
그 후, 프로세서 3802는 보정된 결과를 RAM 또는 프로세서 레지스터와 같은 데이터 저장소 3806) 저장할 수 있다. 프로세서 3802는 또한 보정된 결과를 통신 포트 3808을 통해 폴리뉴클레오타이드 시퀀싱 실험을 관리하는 시료 시퀀스 데이터베이스 또는 컴퓨터 시스템과 같은 서버에 전송할 수있다.
상기 프로세서 3802는 데이터 메모리 3806 뿐만 아니라 통신 포트 3808 및 사용자 포트 3810로부터 데이터, 이를 테면, 폴리뉴클레오티드 서열을 나타내는 데이터, 인공 염색체의 단편 또는 시료의 서열들을 수용할 수 있으며, 이는 사용자 3816에게 시퀀싱 결과의 시각적 표현 3814을 보여주는 디스플레이 3812에 연결된다. 한 실시예에서, 프로세서 3802는 예를 들어 IEEE 802.11에 따라 Wi-Fi 네트워크를 사용함으로써 통신 포트 3808를 통해 시퀀싱 장치로부터 시퀀스 데이터를 수신한다. Wi-Fi 네트워크는 분산형 애드혹(ad-hoc) 네트워크일 수 있으므로 라우터(router)와 같은 전용 관리 인프라는 필요하지 않으며, 네트워크를 관리하는 라우터 또는 액세스 포인트가 있는 중앙 집중식 네트워크는 필요하지 않다.
통신 포트 3808 및 사용자 포트 3810가 별개의 엔티티(entities)로서 도시되어 있지만, 네트워크 접속, 메모리 인터페이스, 프로세서 3802의 칩 패키지의 핀 (pin)과 같은 임의의 종류의 데이터 포트, 또는 IP 소켓 또는 프로그램 메모리 3804에 저장되고 프로세서 3802에 의해 실행되는 기능 파라미터와 같은 로지컬 포트가 데이터를 수신하는데 사용될 수 있다. 이들 파라미터는 데이터 메모리 3806 상에 저장될 수 있고, 소스 코드에서 포인터(pointer)에 의해 값으로 또는 기준에 의해 처리될 수 있다.
상기 프로세서 3802는 캐시 (cache) 또는 RAM과 같은 휘발성 메모리 (volatile memory) 또는 광 디스크 드라이브, 하드 디스크 드라이브, 저장 서버 또는 클라우드(cloud) 저장 장치와 같은 비-휘발성 메모리의 메모리 액세스를 포함하는 모든 이들 인터페이스를 통해 데이터를 수신할 수 있다. 상기 컴퓨터 시스템 3800은 역학적 수의 가상 머신들을 호스팅하는 상호 접속된 서버들의 관리 그룹과 같은 클라우드 컴퓨팅 환경 내에서 구현될 수 있다.
임의의 수신 단계가 프로세서 3802에 의해 추후에 수신되는 데이터를 결정 또는 계산하기 전에 선행될 수 있다는 것을 이해해야 한다. 예를 들면, 상기 프로세서 3802는 인공 염색체의 서열 데이터를 결정할 수 있고, 서열 데이터를 RAM 또는 프로세서 레지스터와 같은 데이터 메모리 3806에 저장할 수 있다. 그 후, 프로세서 3802는 이를 테면, 메모리 어드레스와 함께 판독 신호를 제공함으로써, 데이터 메모리 3806으로 데이터를 요청할 수 있다. 데이터 메모리 3806은 데이터를 물리적 비트 라인상의 전압 신호로서 제공할 수 있고, 프로세서 3802는 메모리 인터페이스를 통해 인공 염색체의 시퀀스 데이터를 수신할 수 있다.
본원에서 달리 언급되지 않는 한, 데이터는 이를 테면, ["G", "A", "T", "C"] 문자열 또는 뉴클레오타이드를 코드화하는 이진 튜플(tuples) 의 목록과 같은 데이터 구조로 나타낼 수 있다. 데이터 구조는 물리적으로 데이터 메모리 3806에 저장되거나 프로세서 3802에 의해 처리될 수 있다.
본 명세서의 기술들은 다양한 기술을 사용하여 구현될 수 있다는 것을 이해해야 한다. 예를 들면, 여기에 설명된 방법은 적절한 컴퓨터 판독 가능 매체 상에 상주하는 일련의 컴퓨터 실행 가능 명령어에 의해 구현될 수 있다. 적합한 컴퓨터 판독가능한 매체는 휘발성 (가령 RAM) 및/또는 비-휘발성 (가령 ROM, 디스크) 메모리, 반송파(carrier waves) 및 전송 매체를 포함할 수 있다. 예시적인 반송파는 로컬 네트워크 또는 인터넷과 같은 공개적으로 액세스 가능한 네트워크를 따라 디지털 데이터 스트림을 전달하는 전기, 전자기 또는 광학 신호의 형태를 취할 수 있다.
또한, 이하의 설명으로부터 명백한 바와 같이 특별히 언급하지 않는 한, "프로세싱(processing)", "컴퓨팅(computing)" 또는 "계산(calculating)", 또는 "결정(determining)" 또는 "디스플레이(displaying)" 또는 "보정하는(calibrating)" 또는 "표준화 (normalizing)" 또는 이와 유사한 용어를 사용하는 설명은 컴퓨터 시스템의 레지스터 및 메모리 내의 물리적 (전자) 양으로 표현된 데이터를 컴퓨터 시스템 메모리 또는 레지스터 또는 다른 정보 저장, 전송 또는 디스플레이 장치 내의 물리량으로 유사하게 표현되는 다른 데이터로 처리 및 변환시킬 수 있는 컴퓨터 시스템 또는 유사한 전자 컴퓨팅 장치의 동작 및 프로세스를 지칭할 수 있다.
본 명세서는 이제 하기 비-제한적인 실시예들에서 추가로 기술된다.
실시예 1:
인공 염색체의 한 가지 예는 다음과 같이 준비되었다. 우리는 인간 chr7: 271,335,00 - 271,385,00 (hg19)로부터 5,000nt 서열을 검색하였다. 이 서열은 HOXA1 유전자의 프로모터에서 CpG 섬 (CpG 디뉴클레오티드의 밀도를 포함하는 서열)과 중첩된다. 상동성을 제공하기 위하여, 50nt의 셔플링 창 크기로 CG 디뉴클레오티드 쌍형성(pairings)이 유지되면서, 5,000nt 서열을 셔플하였다. 이 공정은 도 2에서 설명된다. 일차(primary) DNA 서열을 창 안에서 셔플링하면 서열을 재배열하여 상동성이 제거되고, 한편 이 창 크기보다 큰 해상도에서 유전적 특징들은 유지된다. 필요하다면, 추가의 뉴클레오타이드 치환, 삽입 및 결실을 수작업으로 생성하여 공지된 자연 서열에 대한 상동성을 제거 하였다. 임의의 공지된 또는 천연 서열과 21nt 이상의 연속 상동성을 가진 임의의 서열이 없다는 것을 확인하기 위하여, BLASTn 소프트웨어 프로그램 (Altschul, S.F. et al., J Mol Biol 215, 403-10 (1990))을 이용하여, 결과적으로 셔플된 서열이 뉴클레오티드 수집 (nr/nt) 데이터베이스와 비교하였다. 이 실시예 방법은 공지된 또는 천연 서열들에 상동성이 없는 5,000nt 서열을 만들었지만, HOXA1 프로모터 안에서 50nt의 분해능으로 고차원 CpG 섬 유전적 특성을 유지한다.
실시예 2:
인공 염색체 내의 인공 유전자 서열의 한 예를 다음과 같이 제조 하였다. 12개 엑손과 11개 인트론을 포함하는 인간 게놈 (hg19)에서 유전자 서열을 우선 검색하였다. 개별 엑손 서열 및 인트론 서열 뿐만 아니라 상류/하류의 1,000nt 서열들을 검색하였다. 각 유전자 엑손 서열 및 인트론 서열은 실시예 1에 기술된 바와 같은 상동성을 제거하기 위해 20nt 창 크기로 개별적으로 셔플되었다. 셔플된 엑손 서열 및 인트론 서열은 그 다음 올바른 순서로 인공 염색체 내에서 어셈블리되었고, 배향과 분포는 인간 게놈 내에서 원래의 유전자와 동일하게 유지되었다. 이 인공 유전자는 도 3에 나타낸 것과 같이 R_1_2_R 로 나타낸다. 삽입된 엑손의 바로 옆에 있는 뉴클레오티드를 수작업으로 편집하여 정본(canonical) 디뉴클레오티드 AG-CT 접합 부위 및 폴리-피리미딘 트랙 뉴클레오타이드를 삽입하였다. 따라서, 인공 유전자는 천연 인간 유전자에 존재하는 유전자 좌의 보다 높은 수준의 유전 특성을 보유하지만, 원래의 인간 유전자 또는 임의의 다른 공지된 뉴클레오타이드 서열과의 일차 서열 상동성을 유지하지 않는다.
실시예 3:
각 유전자가 다수의 동형을 포함하는 다수의 유전자를 인공 염색체에 포함시키는 한 예가 다음과 같이 수행되었다. GENCODE v19 기본 유전자 어셈블리로부터 인간 mRNA 동형 서열을 우선 검색하였다 (Harrow, Denoeud et al. 2006). 엑손 길이, 엑손 수 및 동형 수를 복합함으로써 순위를 매겼다. 2개 또는 그 이상의 대체 동형을 포함하는 30개 유전자를 이 목록으로부터 체계적으로 시료링하였다. 엑손 배제, 엑손 봉입, 대체 전사 개시, 대체 전사 종료, 인트론 유지 및 대체적 3' 및 5' 접합 부위 사용을 포함하는 대체 유전자 접합의 상이한 예를 포함하도록 이들 동형들을 큐레이트하였다. 인간 게놈 (hg19)으로부터 각 유전자 엑손 서열 및 인트론 서열을 회수하고, 실시예 1에서 기재된 바와 같이 개별적으로 셔플링하여 상동성을 제거하였다. 각 셔플된 서열은 그 다음 엑손-인트론 구조는 유지하되, 천연 서열들에 대한 상동성을 제거하기 위하여 인공 염색체에서 다시-어셈블리되었다. 인공 염색체에 삽입된 유전자 좌 사이의 거리는 가능한 한 인간 게놈의 유전자들 사이에서 관찰된 거리와 유사하게 유지되었다. 이 공정에 의해 도 1에서 설명된 바와 같이, 상기 인공 염색체에서 30개의 인공 유전자 좌를 혼입하였다.
실시예 4:
인공 염색체에 포함시키기 위한 이동 요소의 한 예는 다음과 같이 준비되었다. 우리는 공통 반복 클래스에서 이동 요소 (AluSx, MIRb, L2a 등등)의 5가지 경우에 대한 자연적 인간 DNA 시퀀스를 검색하였다 (A.F.A. Smit, R. Hubley & P. Green repeatmasker at http://repeatmasker.org). 상동성을 제거하기 위해, 상기 실시예 1에서 기술된 바와 같이 반복 서열을 셔플링하고 큐레이팅하였다. 셔플된 반복 서열들은 인간 게놈에 존재하는 것과 동일한 밀도로 인공 염색체에 삽입되도록 충분한 수로 복제되었다. 예를 들면, 8Mb의 인공 염색체 서열은 인간 게놈에서 유사한 천연 반복 요소의 밀도와 일치시키기 위하여, 788개 AluSx, 534개 MIRb, 433개 L2a, 93개 MER5B 및 166개 L1M5 반복 이동 요소들을 가질 것이다. 그 다음 개별 반복 요소들을 무작위 뉴클레오타이드 치환, 삽입 및 결실로 처리하여, 도 4에 도시된 바와 같이 조상전래의 서열로부터 개별 반복적인 이동성 요소의 서열 일탈을 일으켰다. 인간 게놈에서 유사한 천연 요소의 서열 및 길이 일탈에 일치되하도록 셔플된 반복 이동 요소들의 서열 및 길이의 일탈을 설계할 수 있다. 그 다음 셔플된 반복 모티프들은 도 1에서와 같이 인간 게놈에서 유사한 천연 이동 요소와 동일한 밀도 및 분포로 인조 염색체 서열에 삽입되었다.
인공 염색체에 포함시키기 위한 동원체의 한 예는 다음과 같이 준비되었다. 인간 게놈에서 개별 ALR/Alpha 동원체로부터 단일 171nt 텐덤 반복 DNA 서열을 검색하였다 (A.F.A. Smit, R. Hubley & P. Green Repeatmasker at http://repeatmasker.org). 이 천연 171nt 텐덤 반복 DNA 서열을 셔플하고, 큐레이팅하여 천연 서열과의 상동성을 제거하고, 조상전래의 반복을 만들었다. 이 조상전래의 반복으로부터 4회 연속 4-배 증폭을 수행한 다음, 무작위 뉴클레오티드 치환, 삽입, 및 결손에 의해 14% 서열 일탈을 수행하였다. 이 결과로 원래의 인간 서열과 유사한 내부 계층적 반복 구조를 갖는 10,944 개의 뉴클레오티드 길이의 인공 동원체 요소가 형성되었지만, 원래의 인간 서열과는 서열 동일성을 공유하지 않았다. 그 다음 상기 인공 동원체 요소는 도 1에서 설명된 바와 같이, 염색체 서열의 중앙 영역에 삽입되었다.
인공 염색체에 포함시키기 위한 말단소체의 한 예는 다음과 같이 준비되었다. 인공 6-mer 뉴클레오티드(ATTGGG) 조상전래의 반복 모티프를 수작업으로 만들었고, 다수의 증폭 라운드를 거치고, 서열 일탈을 시뮬레이션하여 10.9 및 8.3kb 길이의 2개 인공 말단소체 서열을 만들었고, 그 다음 도 1에서 설명된 바와 같이, 상기 인공 염색체 서열의 각 말단에 추가하였다.
실시예 5:
인공 염색체에 포함시키기 위한 소규모 유전적 변이의 한 예는 다음과 같이 준비되었다. SNPs, 삽입, 결손, 이형접합성, 미소부수체 및 다수 뉴클레오티드 다형이 포함된 일련의 인간 소규모 변이는 (Sherry, S.T. et al. Nucleic Acids Res 29, 308-11 (2001) 돌연변이 타입, 뉴클레오티드 함량 및 크기에 따라 등급화되었다. 이 목록에서 총 512 개의 소규모 변이체들이 체계적으로 시료링되었다. 선택된 소규모 변이체는 수작업으로 큐레이트되어 광범위한 돌연변이 타입, 뉴클레오티드 함량 및 크기를 나타내도록 한다. 인간 게놈 서열 (hg19)로부터 상류 및 하류 측면 5개 뉴클레오티드 서열들과 함께 인간 소규모 변이체의 DNA 서열이 검색되었다. 그 다음 268개 소규모 변이를 2개의 인공 염색체 안에 치환하였고, 이로 인하여 원래 '기준' 인공 염색체에 대하여 동형접합성 변이가 혼입된 변이체 인공 염색체 쌍이 만들어졌다. 그 다음 289개 소규모 변이를 오직 하나의 단일 인공 변이체 대립유전자 염색체 안으로 치환하였고, 이로 인하여 원래 '기준' 인공 염색체에 대하여 이형접합성 변이가 만들어졌다. 이 공정에 의해, 인공 염색체에서 동형- 및 이형접합성 소규모 변이를 제시할 수 있다.
실시예 6:
질환-특이적, 소규모 유전적 변이를 인공 염색체 안에 혼입시키는 한 가지 예는 다음과 같이 수행되었다. BRAF V600E 돌연변이는 BRAF 단백질의 위치 600에서 발린 (V)을 글루탐산 (E)으로 아미노산 치환된 결과이며, 그리고 흑색종의 ~85%에서 발현된다 (Davies, H. et al. Nature 417, 949-54 (2002)). 인간 게놈으로부터 야생형 (T) 또는 질병-연관된 변이체 BRAF V600E 돌연변이 (A) 및 측면 상류 및 하류 150 개 뉴클레오티드가 일치되는 DNA 서열들(hg19 어셈블리에서 chr7 : 140,452,986 - 140,453,286에 상응)이 검색되었다. BRAF V600E 돌연변이에 대하여 6개의 상류 및 하류 뉴클레오티드는 셔플되지 않았다. 그러나, 남아있는 측면 서열은 도 7에서 설명된 바와 같이, BRAF V600E 변이 부위로부터 거리가 멀어짐으로써 점차 커지는 창 크기로 셔플되었다. 예를 들면, BRAF V600E 변이의 20nt 거리 안에 있을 때 이 서열은 6nt 창 크기로 셔플되었고, BRAF V600E 변이의 100nt 거리 안에 있을 때 이 서열은 10nt 창 크기로 셔플되었고, 그리고 BRAF V600E 변이의 100nt 이상의 거리 안에 있을 때 이 서열은 20nt 창 크기로 셔플되었다. 이것은 전체 유전자 서열에 걸쳐 알려진 자연 서열과의 상동성을 제거하였지만, 변이체에 근접하여 셔플링의 윈도우 해상도를 증가시켰다. 상기 셔플된 서열은 그 다음 '기준' 인공 염색체 안으로 치환되어, BRAF V600E 돌연변이를 품고 있는 인공 변이체 염색체가 형성되었다.
또다른 실시예에서, 상기 K562 세포계통은 TP53 유전자 서열의 ch17 : 7578523 - 7578524 (hg19)에서 틀 이동(frame shift) 뉴클레오티드 삽입을 포함한다 (Law, J.C. et al., Leuk Res 17, 1045-50 (1993)). 인간 게놈으로부터 기준 (T) 또는 질병-연관된 변이체 TP53 Q136fs 돌연변이 (TG) 및 측면 상류 및 하류 150 개 뉴클레오티드 (hg19 어셈블리에서 chr17 : 7,578,374 - 7,578,674에 상응)가 일치되는 DNA 서열들이 검색되었다 TP53 Q136fs 돌연변이에 대하여 6개의 상류 및 하류 뉴클레오티드는 셔플되지 않았고, 남아있는 서열은 상기에서 설명된 바와 같이, TP53 Q136fs로부터 거리당 창 크기를 증가시키면서 셔플링되었다. 상기 서열은 그 다음 '기준' 인공 염색체 안으로 치환되어, TP53 Q136fs 돌연변이를 품고 있는 인공 변이체 염색체가 형성되었다.
실시예 7:
대규모 유전적 변이 (>50nt)를 인공 염색체 안에 혼입시키는 가지 예는 다음과 같이 수행되었다. 인간 대규모 변이의 목록은 (Sherry, Ward et al. 2001, MacDonald, Ziman et al. 2014) 돌연변이 타입, 뉴클레오티드 함량 및 크기에 따라 등급화되었다. 큰 결손, 삽입, 전도 (전환), 복제 수 변이 및 이동-요소 삽입이 포함된 상이한 유형의 대규모 변이가 광범위하게 전체적으로 제시되도록 하기 위하여 인간 대규모 변이의 목록으로부터 총 12개의 대규모 변이의 예들이 체계적으로 시료링되었고, 수작업으로 큐레이트되었다. 실시예 1에서 이미 설명된 바와 같이, 공지된 천연 서열들에 대한 상동성을 제거하기 위하여 측면 상류 및 하류 서열의 추가 1,000개 뉴클레오티드와 함께 구조적 변이 서열이 셔플링되고, 큐레이트되었다. 특히, 실시예 4에서 이미 설명된 바와 같이, 가능한 셔플링은 내부 계층적 구조를 유지할 수 있는 경우, 대규모 변이의 임의의 내부 구조 (이를 테면, 반복 또는 역 단위)에 대하여 수행되었다. 이러한 구조적 변화의 사례는 다음으로 인공 염색체 서열에 삽입되어 변형 인공 염색체를 생성한다. 이와 같은 방식으로, 도 12에서 설명된 바와 같이, 상기 인공 염색체 안에 4가지 상이한 유형의 대규모 구조적 변이의 12개 예들을 삽입하였다. 실시예 6에서 방법에 의해 설명된 바와 같이, 구조적 변이를 위한 다양한 유전자형 (동형접합성 및 이형접합성)은 '기준' 인공 염색체에 대한 다수 변이체 인공 염색체의 사용에 의해 확립될 수 있다.
또다른 실시예에서, 다음과 같이 다수 인공 염색체 간에 복제 수가 변화되는 DNA 반복부를 혼입시켰다. 도 33에서 설명된 바와 같이, 인간 게놈 (hg19)으로부터 단일 D4Z4 반복 복제에 대한 상기 DNA 서열을 검색하였고, 공지된 천연 서열들에 대한 상동성을 제거하기 위하여 상기 반복 복제 크기에 일치되는 창 크기로 셔플링하였다. 그 다음 셔플된 D4Z4 반복 복제는 복제되었고, 헤드-투-테일 방향으로 조직화되어, 10, 20, 50, 100 및 200개의 셔플된 D4Z4 반복 복제의 어레이를 만들었다. 이들 반복 복제 수는 인간에서 관찰된 D4Z4 복제 수의 대다수(99%)를 포괄한다 (Schaap, Lemmers et al. 2013). 이것은 10개 복제 (FSMD 환자의 95%에서 나타남, 20개 복제 (고위험 개인), 50개 복제 (관련 개인의 경우) 그리고 100개 이상의 복제 (영향을 받지 않은 개인의 경우)의 복제 수를 포함한다 (van der Maarel and Frants 2005). 각 반복 어레이는 그 다음 인공 염색체에 혼합되고, 이로 인하여 인공 D4Z4 반복 복제 수가 변화되는 다양한 상이한 유전자형이 만들어진다.
실시예 8:
2 개의 인공 염색체 간의 전좌에 의한 융합 유전자의 형성의 한 예는 다음과 같이 수행되었다. 먼저 실시예 2에 기술된 방법을 사용하여, 2 개의 인공 유전자 B1 및 A1 유전자를 인코드하는 2 개의 인공 염색체를 만들었다. A1 및 B1 유전자의 엑손/인트론 구조는 각각 차례로 인간 ABL1 및 BCR 유전자로부터 유도되었다. 도 9에서 설명된 바와 같이, B1 유전자는 인공 염색체 A 상에 23개 엑손/21개 인트론을 포함하며, 11개 액손을 포함하는 A1 유전자를 나타내는 서열은 인공 염색체 B에서 생성되었다. 각 인공 염색체 안에 이 유전자의 엑손/인트론 구조는 유지되었지만, 상기 실시예 1에서 설명된 방법에 의해 상동성을 제거하기 위하여 DNA 서열들은 셔플링되었다. 도 9에서 설명된 바와 같이, 상기 인공 염색체 A 및 B 서열은 그 다음 (i) B1 유전자의 엑손 4 다음, 그리고 (ii) A1 유전자의 엑손 2 앞에 전좌에 의해 재배열되었고, 이로 인하여 인공 염색체 A 상에서 B1 엑손 1-13 및 A1 엑손 2-11을 포함하는 융합 유전자와 인공 염색체 B 상에서 A1 엑손 1 및 B1 엑손 14-22에 일치되는 융합 유전자들이 생성되었다. 이 공정에 의해, 2개의 인공 염색체의 전좌를 실행하여 융합 유전자 사건을 만들었다.
실시예 9:
미생물 게놈 공동체를 시뮬레이션하기 위해, 본원에 개시된 인공 염색체의 사용의 한 예가 다음과 같이 수행되었다. 환경적 DNA 시료는 대개 다수 미생물 게놈의 복합 집단을 포함한다. 여기에서, 우리는 서로 다른 유형, 크기 및 풍도의 미생물 게놈 (여기서는 "인공 미생물 게놈"이라고 함)을 나타내는 다수 인공 염색체의 복합 집단을 시뮬레이션했다. 우선, 총 30개 미생물에 대한 고품질 초고(draft) 게놈 서열들을 검색하였다 (Chan, P.P., et al., Nucleic Acids Res 40, D646-52 (2012)). 선택된 미생물 게놈들이 다양한 분류군 (고세균 및 박테리아를 모두 포함), 크기 (0.5-10Mbp), GC 함량 (27-70%), rRNA 오페론 카운트 (1-10), 및 다양한 환경(인체, 수생, 육지 및 초극한의 물리적 또는 화학적 조건)으로부터 단리를 나타내도록 수작업으로 큐레이트되었다. 선택 (표 9에 표시)은 환경 DNA 시료 내에서 복잡한 미생물 집단에서 자주 접하게 되는 계통 발생적 및 게놈 이질성을 나타내기 위한 것이다. 게놈 서열을 셔플링하고 조작하여 공지된 자연 서열과 임의의 서열 상동성을 갖는 서열을 제거하였다. 이 과정을 통해 우리는 30 개의 인공 미생물 게놈 라이브러리를 만들었다.
미생물 게놈에 16S rRNA 유전자를 혼입하는 또 다른 예가 수행되었다. 우리는 표 9에 표시된 바와 같이, 상기 한 방법을 사용하여 이전에 생산된 미생물 게놈으로부터 30 개의 미생물 게놈 서열에 상응하는 16S rRNA 서열을 검색하였다. 16S rRNA 서열들은 실시예 1에서 이미 설명된 바와 같이, 셔플링하고 수작업으로 편집하여 공지된 천연 서열과의 상동성을 제거하였다. 그러나, 범용 16S 프라이머 (포워드 프라이머: CTACGGGAGGCAGCAG 및 역 프라이머: GACTACCAGGGTATCTAATCC)에 요구되는 서열은 유지된다. 도 11에서 설명된 바와 같이, 이들 프라이머 서열들은 16S rRNA 유전자 안에 V3 영역에 상응하는 대략 460nt의 셔플링된 서열의 측면에 있다. 끼어있는 셔플된 V3 서열은 공지된 천연 서열에 대한 상동성이 없는 인공 표지자를 포함하며, 중합효소 쇄 반응에서 범용 16S 프라이머를 이용하여 증폭될 것이다. 합성 표지자 16S rRNA 유전자는 미생물 게놈 서열이 유도된 원래 미생물의 오페론 수(1-10)를 준수하는 빈도로 상기 인공 미생물 게놈 서열 안으로 어셈블리된다.
실시예 10:
본 명세서에 개시된 인공 염색체를 사용하는 포유류 면역글로불린 서열 다양성의 시뮬레이션의 한 예가 수행되었다. 인공 면역 레퍼토리 서열의 생성으로 면역 레파토리 시퀀싱하는 동안 클론형의 정확성 및 정량화를 평가하기 위해 뉴클레오타이드 표준의 사용은 허용된다. TCRβ 좌를 인공 염색체 상에 만들었고, 한벌의 인공 TCRβ 클론형을 만들기 위하여, V(D)J 재조합 공정을 모델화하였다. 우선, 인간 게놈 (hg19)으로부터 TCRβ 유전자 서열 (65개 Vβ 세그먼트, 2개 Dβ 세그먼트 및 13개 Jβ 세그먼트를 포함)을 검색하였다. BIOMED-2 연구에 이용된 프라이머 서열에 상보적인 서열을 제외하고, 공지된 천연 서열에 대한 상동성을 제거하기 위하여 각 세그먼트 또는 인트론 서열은 별도로 셔플링되었다 (van Dongen, J.J. et al. Leukemia 17, 2257-317 (2003)). 그 다음, 도 13에서 설명된 바와 같이, 셔플된 세그먼트들과 측면 인트론 서열들은 다시-어셈블리되어 상기 인공 염색체 상에 TCRβ 좌를 혼입하였다.
그 다음 상기 인공 TCRβ 좌는 다음과 같이 TCRβ 클론을 만들기 위하여, V(D)J 재조합의 T-세포 분화 및 체세포 초돌연변이 동안에 발생하는 생물학적 공정의 간단한 시뮬레이션을 겪었다. 건강한 성인 남성에서 이미 확인된 무작위로 선택된 TCRβ 클론형에 대응하는 Vβ, Dβ 및 Jβ 세그먼트의 선택 및 결합에 의해 V(D)J 재조합이 시뮬레이션되었다(Zvyagin, I.V. et al. Proc Natl Acad Sci U S A 111, 5980-5 (2014)). 건강한 성인 남성에서 관찰된 TCRβ 클론형에서 무작위로 선택된 삽입 및 결손에 근거한 빈도에서 뉴클레오티드의 삽입 또는 결손에 의해 체세포 초돌연변이가 시뮬레이션되었다 (Zvyagin, I.V. et al. Proc Natl Acad Sci U S A 111, 5980-5 (2014)). 다음 과정에 의해 15개 인공 TCRβ 클론형을 만들었다.
또다른 실시예에서, TCRγ 좌를 인공 염색체 상에 만들었고, 한벌의 인공 TCRγ 클론형을 만들기 위하여, VJ 재조합 공정을 모델화하였다. 인간 게놈 (hg19)으로부터 우선 10개 Vγ 세그먼트, 5개 Jγ 세그먼트 그리고 2개 Cγ 세그먼트 및 측면 인트론 서열을 검색하였다. BIOMED-2 연구에 이용된 프라이머 서열에 상보적인 서열을 제외하고, 공지된 천연 서열에 대한 상동성을 제거하기 위하여 각 세그먼트 또는 인트론 서열은 별도로 셔플링되었다 ((van Dongen, Langerak et al. 2003). 도 12에서 설명된 바와 같이, 셔플된 서열들과 측면 인트론 서열들은 다시-어셈블리되어 인공 TCRγ 좌를 만들었다. 그 다음 다양한 TCRγ 클론형을 만들기 위하여 인공 Vγ 세그먼트 및 Jγ 세그먼트를 무작위로 선택 및 결합시킴으로써, T-세포 분화 동안 발생되는 VγJγ 체세포 재조합의 다양한 공정을 모델화하였다. 예를 들면, 우리는 Vγ4 세그먼트를 Jγ1 세그먼트에 결합시켜 Vγ4Jγ1 클론 (서열 번호: 203)을 만들었다. 이 과정에 따라, 15개 인공 TCRG VγJγ 클론 (서열 번호: 203-219)이 생성되었다.
실시예 11:
상기 인공 염색체 상에서 R_1_2_R 유전자를 나타내는 RNA 표준 서열의 한 예가 수행되었다. R_1_2_R 유전자 좌는 실시예 2에서 설명된 방법을 이용하여 상기 인공 염색체 안에 혼입되었다. 그 다음 도 3에서 설명된 바와 같이 R_1_2_R 유전자의 13-엑손 서열이 서로 결합되어 연속적인 1,310nt 서열 (서열 번호: 3)이 형성되었고, 한편 끼어있는 12개 인트론 서열들은 제거되었다. 추가적으로 ~100개 뉴클레오티드 폴리-아데닌 트랙이 R_1_2_R mRNA 서열의 3' 단부에 추가되었다. 시뮬레이션된 서열화된 판독을 이용하여 R_1_2_R 표준을 나타내는 RNA 표준의 성능이 평가되었다. Sherman 소프트웨어를 이용하여 R_1_2_R 서열 (서열 번호: 3)로부터 1,000개의 쌍을 이룬-단부 125-nt 판독이 시뮬레이션되었다. 그 다음 다음의 매개변수들과 함께 Tophat2 소프트웨어 (Kim, Pertea et al. 2013)를 이용하여 인공 염색체에 시뮬레이션된 판독을 정렬하였다.
>tophat2 cht_index simulated_reads.R1.fq simulated_reads.R1.fq
1,000개 판독 모두가 R_1_2_R 유전자에 독특하게 그리고 정확하게 배열되었음을 알았다. 시뮬레이션된 판독은 12개 인트론 및 13에 걸쳐 정확하게 분열 및 배열되었으며, R_1_2_R 표준의 유용성이 확인되엄을 알았다.
실시예 12:
상기 인공 R_1_2 유전자의 대체 접합된 mRNA 동형을 나타내는 RNA 표준 서열의 한 예가 수행되었다. 상기 R_1_2_V 서열은 상기 실시예 11에서 설명되며, 상기 인공 염색체 안에 포함된 R_1_2_R 서열에 대하여 대체 접합된 동형을 포함한다. 상기 R_1_2_V 동형 서열은 연속 1,310 nt 서열 (서열 번호: 4)을 형성하는 12개 엑손을 포함하며, 한편 끼어있는 11개 인트론 서열은 제거된다. 상기 R_1_2_V 표준 서열은 도 3에서 설명된 바와 같이 대체 동형 R_1_2_R 표준과 마찬가지로 11개 엑손을 갖는다. 그러나, 이것은 엑손 (4)가 빠지고, 추가적으로 2개의 엑손 (5 및 6)을 포함한다. 따라서, R_1_2_R 및 R_1_2_VRNA 표준과 비교하였을 때, R_1_2 인공 유전의 대체 접합에 의해 엑손 4의 배제와 엑손 5 및 6의 포함시키는 모델을 만든다.
실시예 13:
R_1_2_R 유전자의 성숙 mRNA 서열을 나타내는 RNA 표준을 만들기 위하여 RNA 표준 제작의 한 가지 예를 실행하였다. R_1_2_R 서열 (서열 번호: 3)은 상업적으로 이용가능한 서비스 (ThermoFisher GeneArt)를 이용하여 DNA 분자로 우선 합성되었다. 도 14에서 설명된 바와 같이, 상기 서열은 다음 요소들의 순서로 pMA 발현 플라스미드 안에 삽입되었다: (i) SP6 프로모터 (ii) R_1_2_R 유전자 서열 (iii) ~50개 뉴클레오티드 폴리-아데닌 서열 그리고 (iv) EcoR1 제한 부위. 상기 플라스미드는 형질전환되었고, 대장균과 함께 배양되었다. 상기 플라스미드는 QIAprep Spin Midiprep (Cat#12945)를 이용하여 정제되었다. 플라스미드 클론은 정확도, 삽입 및 상기 서열 요소들의 방향을 확인하기 위하여 Sanger 서열화되었다. 그 다음 상기 플라스미드는 EcoR1 제한 엔도뉴클레아제로 절단되어 선형화되었다. 그 다음, 상기 플라스미드는 합성된 RNA 폴리뉴클레오티드 표준을 만들기 위한 시험관내 RNA 합성 반응의 주형으로 이용되었으며, 이 표준은 QIAquick 컬럼 (QIAGEN)으로 정제되었다. 분획량의 RNA 표준은 BioAnalyzer RNA Chip (Agilent)을 이용하여 분석함으로써 예측된 전장의 전사 및 농도를 확인하였다. 상기 정제된 RNA 표준은 그 다음 요구되는 농도로 희석되었다.
실시예 14:
다수 RNA 표준의 상이한 혼합물을 만드는 한 가지 예시적인 방법이 실행되었다. 상기 실시예 11 및 13에서 설명된 바와 같이 인공 염색체에 인코드된 30개 유전자를 나타내는 RNA 표준을 우선 만들었다. 표 1에 나타낸 바와 같이, 30개 RNA 표준을 10개 집단 (각 집단은 3개의 RNA 표준으로 구성된다)으로 나누었다. 10개 집단 사이에 3-배 연속 적정을 실행하여, 최저 집단과 최대 집단 간의 풍도는 106-배 범위가 되도록 한다. 그 다음 상이한 상대적 풍도에서 30개 RNA 표준을 복합하여 혼합물을 만들었다. 따라서, 상기 혼합물은 RNA 풍도의 정량적 척도 또는 사다리를 포함하는 상이한 농도의 순차적 범위에서 30개의 상이한 RNA 표준을 포함한다. 이 RNA 표준 수집은 혼합물 A로 명명되었다.
그 다음 표 1에 나타낸 바와 같이, 상이한 풍도 범위를 갖는 동일한 30개 RNA 표준을 어셈블리하였고, 이를 혼합물 B로 부른다. 혼합물 B에서 상기 RNA 표준의 풍도는 RNA 표준의 풍도간의 쌍별(pairwise) 비교에서 혼합물 A와 혼합물 B의 RNA 표준의 풍도는 0, 2-배 또는 4-배 증가 또는 감소를 나타낸다. RNA 표준 유전자 발현에서 변화들을 에뮬레이팅하는데 이용될 수 있다.
실시예 15:
다수의 대체 접합된 RNA 표준의 상이한 혼합물을 만드는 한 가지 예시적인 방법이 실행되었다. 실시예 13에서 설명된 방법들을 이용하여 우선 60개의 RNA 표준 (서열 번호: 1-62)을 만들었다. 상기 실시예 12에서 설명된 바와 같이, RNA 표준은 서로 공유하지만, 엑손 함량이 다른 상이한 2개의 대체 동형을 포함하는 쌍으로 조직화되었다.
30개의 RNA 표준 쌍들을 2개의 대체 3-배 연속 희석으로 복합시켜 혼합물 A 및 B를 만들었고, 대체 동형 RNA 표준 간의 쌍별 풍도 비교는 1-, 2- 및 3-배수 변화에 대응하였다 (표 1에 나타냄). 예를 들면, 혼합물 A에 R_1_2_R은 15,000 아토몰(attomoles)/ul로 추가되고, R_1_2_V는 5,000 아토몰/ul로 추가되었고, 혼합물 B에 R_1_2_R은 1,250 아토몰/ul로 추가되고, R_1_2_V은 3,750 아토몰/ul로 추가되었다. 이는 혼합물 A와 B 사이에 R_1_2 유전자 발현에서 4-배수 변화에 상응하며, 또한 개별 R_1_2_R 및 R_1_2_V 동형 간에 상대적 농도에서 3-배수 변화에 상응하고, 이로 인하여 R_1_2 유전자의 대체 접합을 에뮬레이팅한다. 혼합물 간에 동형 풍도의 차이는 천연 유전자 집단의 대체 접합과 비교될 수 있다.
실시예 16:
융합 유전자를 나타내는 RNA 표준의 한 예는 다음과 같이 수행되었다. (i) B1 유전자 서열 (서열 번호: 136), (ii) A1 유전자 서열 (서열 번호: 135) 그리고 (iii) B1 엑손 1 내지 13 서열과 A1 엑손 2 내지 11 서열에 일치되는 B1fA1 유전자(서열 번호: 137)에 일치되는 RNA 표준들이 제작되었다. RNA 표준들은 실시예 13에서 이미 설명된 방법들을 이용하여 제작되었다.
실시예 17:
6,974,486 - 6,975,593개 뉴클레오티드 사이의 인공 염색체 서열을 나타내기 위하여 DNA 표준 제작의 한 가지 예를 실행하였다. 1,122nt DNA 표준 서열 (서열 번호: 63) 및 2개의 측면 Sap1 제한 부위 (GCTCTTC)는 상업적으로 이용가능한 서비스 (ThermoFisher GeneArt)를 이용하여 DNA 분자 안으로 우선 합성되었다. 그 다음 상기 서열은 도 14에서 설명된 바와 같이 고복제수 플라스미드 (pMA) 안으로 클론되었다. 각 플라스미드는 대장균 배양물에서 성장되었고, QIAprep Spin Midiprep (Cat#12945)를 이용하여 준비되었다. DNA 플라스미드는 QIAquick 컬럼 (QIAGEN)을 이용하여 정제되며, 스톡(stock)을 포함하도록 표준 농도로 희석된다. 플라스미드 클론은 정확한 서열 및 플라스미드 안으로의 정확한 삽입을 확인하여 위하여 Sanger-서열화된다. 상기 스톡 플라스미드는 PCR (D_1_1_R 서열의 말단에서 프라이머 쌍을 이용하여 상기 DNA를 증폭)에 의한 DNA 표준 합성 또는 제한 절단 (Sap1 제한 엔도뉴클레아제는 측면 Sap1 부위의 5/6nt 하류를 자르고, 그리고 절단 후 말단에 추가 뉴클레오티드를 남겨두지 않고 D_1_1_R 표준 DNA 분자를 잘라내는데 이용될 수 있음)을 위한 주형으로 이용되었다. 합성 후, 분획량의 D_1_1_R 표준은 Agilent 21000 Bioanalyser에서 분석되어, 상기 표준의 예측된 전장의 크기 및 농도를 확인한다. 그 다음 정제된 DNA 표준은 요구되는 농도로 희석된다.
실시예 18:
다수 DNA 표준의 상이한 혼합물을 만드는 한 가지 예시적인 방법이 실행되었다. 상기 실시예 17에서 설명된 방법들을 이용하여 인공 염색체 서열에 일치되는 30개의 DNA 표준을 제작하였다. 상기 DNA 표준은 10개 집단으로 나뉘고, 각 집단은 3개의 DNA 표준으로 구성된다. 각 집단에 3-배 연속 희석을 어셈블리하여 (가령, 3개 DNA 표준은 동일한 농도를 갖는다), 이로 인하여 DNA 표준의 최저 집단과 최대 집단 간의 농도는 106-배 범위가 되도록 한다 (표 5에 나타냄). 이 농도 범위에 걸쳐 DNA 표준의 조합은 혼합물 A로 명명된다. 이로 인하여 이 혼합물은 이로 인하여 DNA 풍도의 정량적 척도 또는 사다리를 제공한다. 그 다음 표 5에 나타낸 바와 같이, 대체 혼합물 B를 만들기 위하여 상이한 농도 범위에서 동일한 30개 DNA 표준을 어셈블리하였다. DNA 혼합물 B에서 상기 DNA 표준의 풍도는 DNA 표준의 풍도간의 쌍별 비교에서 혼합물 A와 혼합물 B의 DNA 표준의 풍도가 0, 2-배 또는 4-배 증가 또는 감소를 나타낸다. 혼합물 간에 DNA 표준 풍도에서 변화들은 천연 DNA 서열과 유사하고, DNA 풍도에서 배수 변화를 측정하는 정량적 척도 또는 사다리를 포함한다.
실시예 19:
단일의, 더 큰 또는 '공동결합된' DNA 표준을 만들기 위하여 다수 DNA 표준을 결합시키는 한 가지 예시적인 방법이 실행되었다. 공동결합된 DNA 표준은 상기 실시예 17에서 설명된 방법들을 이용하여 만들어진 다수의 개별 DNA 표준을 포함한다. 예를 들면, 공동결합된 DNA 표준 A는 1개 복제 D_1_1_R; 2개 복제 D_1_2_R; D_1_3_R의 3개 복제, D_1_4_R의 4개 복제; D_1_5_R의 5개 복제; D_1_6_R의 6개 복제를 포함한다. 1 (D_1_1_R) 와 6 (D_1_6_R) 사이의 복제 수를 변화시킴으로써 도 16에서 설명된 바와 같이, 개별 D_1_1_R 표준과 D_1_6_R 표준 간의 풍도에서 6-배 증가에 상응한다는 것을 또한 주지한다. 표 7에 나타낸 바와 같이, 이 접근법을 이용하여 총 90개의 개별 DNA 표준으로부터 어셈블리된 15개의 공동결합된 DNA 표준 (A-O)을 조직하였다. 따라서, 각 공동결합된 DNA 표준은 1- 내지 6-배의 상대적 복제 수에서 6개의 개별 DNA 표준을 포함한다.
개별 DNA 표준은 다음과 같이 상이한 복제 수(1개 복제 D_1_1_R; 2개 복제 D_1_2_R; D_1_3_R의 3개 복제)에서 공동결합된 DNA 표준으로 어셈블리되었다. 개별 DNA 표준은 우선 pUC19 벡터 안으로 클론되었다. 정션 영역에서 20-bp 중첩을 가진 올리고뉴클레오티드 프라이머를 이용하여 PCR 증폭이 실행되었다. 결과적으로 생성된 PCR 앰플리콘은 Gibson Assembly Master Mix (New England BioLabs, Ipswich, MA)를 이용하여 제조업자의 지시에 따라 서로 결찰되었다. 간략하게 설명하자면, 6-단편 Gibson 어셈블리는 0.062pmol의 벡터 단편, 0.187 pmol의 5개 삽입 단편 및 10ul의 Gibson Assembly Master Mix (2x)로 최종 20ul의 용적으로 설정되었다. 상기 최종 Gibson 어셈블리는 50℃에서 2시간 동안 항온처리되었다. 항온처리 후, 시료들은 후속적인 형질변환 및 플라스미드 정제를 위하여 -20℃에서 저장되었다. Sanger-시퀀싱을 이용하여 공동결합된 DNA 표준 삽입 서열을 확인하였다.
공동결합된 DNA 표준은 상대적 농도를 증가시키면서 적정되고, 복합되어 혼합물 C가 만들어지는데, 이 혼합물은 표 7에서 나타낸 바와 같이, 15-배 증가를 포괄한다.
실시예 20:
인공 염색체 간의 유전적 변이를 나타내는 DNA 표준의 한 예가 실행되었다. 실시예 5에서 이미 설명된 바와 같이 인공 염색체 간에 유전적 변이가 혼입될 수 있다. 상기 실시예 17에서 설명된 방법들에 의해 동일한 길이 (1000nt)의 인공 염색체 서열의 영역과 일치되는 32개 쌍의 DNA 표준 (서열 번호: 63-134)을 제작하였다. 각 쌍은 '기준' 염색체 (_R로 표시됨) 또는 변이체 인공 염색체 (_V로 표시됨)에 일치되는 2개의 DNA 표준을 포함한다. 예를 들면, 상기 실시예 20에서 설명된 바와 같이, DNA 표준 쌍을 만들었는데; 변이체 대립유전자에 일치되는 한 개 DNA 표준 (D_1_1_V 로 명명됨; 서열 번호: 64)과 기준 D_1_1_R 표준 (서열 번호: 63)에 일치되는 또다른 DNA 표준. 상기 D_1_1_V 표준 서열은 상기 D_1_1_R 표준 서열과는 4개 SNPs, 12nt 결손, 6nt 삽입 및 33nt 결손을 포함하는 7개 부위에서 상이하다(도 6에서 설명됨). 가능하다면, 시퀀싱 모서리 효과의 충격을 최소화시키기 위하여 DNA 서열 안에 또한 전환 부위들에서 상류 및 하류 측면 200nt 서열이 있다. 상기 실시예 17에서 설명된 바와 같은 방법들을 이용하여 총, 30개 DNA 표준 쌍은 50nt 미만의 252개 SNPS, 삽입 또는 결손(DNA 표준 당 5-8개 SNPS, 삽입 또는 결손)을 포함하도록 제작되었다.
실시예 21:
유전적 변이를 나타내는 DNA 표준의 상이한 혼합물을 만드는 한 가지 예시적인 방법. 실시예 20에서 설명된 바와 같이, 유전적 변이를 나타내는 DNA 표준 쌍들의 상대적 풍도를 변화시킴으로써, 상이한 다배수체 유전자형을 제시할 수 있다. 우선 표 5에 나타낸 바와 같이, 30개의 DNA 표준 쌍은 상이한 풍도에서 추가되어 혼합물 A를 만들고, DNA 표준 쌍 간의 쌍별 비교는 변이체와 기준 DNA 표준 간의 상대적 풍도에서 전체 변이체, 대등, 3-배, 9-배, 그리고 30-배 배수 변화를 나타낸다. 변이체와 기준 DNA 표준 간의 이와 같은 상대적 풍도의 변화는 다배수체 게놈에서 동형접합성, 이형접합성, 및 이질적 변이를 모델링을 가능하게 한다. 예를 들면, 기준 및 변이체 인공 염색체를 나타내는 동일한 농도의 DNA 표준은 이배수체 유기체, 이를 테면, 인간에서 이형접합성 유전자형을 나타낼 것이다. DNA 표준의 상이한 상대적 농도는 정량적 차이를 측정하기 위한 척도 또는 사다리를 확립할 수 있다. 그 다음 표 5에 나타낸 바와 같이, 상이한 풍도 범위를 갖는 동일한 30개 DNA 표준을 어셈블리하였고, 이를 혼합물 B로 부른다. 혼합물 B에서 DNA 표준의 상대적 풍도는 기준 및 변이체 DNA 표준의 상대적 풍도 간의 쌍별 비교가 혼합물 A와 혼합물 B 간의 유전적 변이 풍도에서 다양한 배수 변화를 나타낸다. 변이체 풍도에서 이러한 차등적 변화는 DNA 시료 간의 대립 유전자 빈도 변화와 유사하다.
실시예 22:
특이적 질병-연관된 유전적 변이를 나타내는 DNA 표준의 한 예가 실행되었다. 실시예 6에서 이미 설명된 바와 같이 기준 및 변이체 인공 염색체에 대응하는 2개의 DNA 표준을 만들었다. 따라서, 기준 DNA 표준은 기준 서열 (Q139fs의 경우 T, 그리고 V600E의 경우 T; 서열 번호: 138)에 일치되었고, 변이체 DNA 표준은 질병-연관된 유전적 변이 (Q139fs의 경우 TG, 그리고 V600E의 경우 A; 서열 번호: 139)에 일치되었다. DNA 표준은 실시예 17에서 이미 설명된 바와 같이 제작되었다.
DNA 표준들은 동일한 풍도로 복합되고, 이로 인하여 단일 TP53 Q136fs 및 BRAF V600E 돌연변이 그리고 단일 야생형 대립유전자를 품고 있는 이형접합성 유전자형을 에뮬레이트한다. 상기 실시예 21에서 설명된 바와 같이, 기준 DNA 표준과 관련하여 10-배 연속 희석에 의해 변이체 DNA 표준의 일련의 희석을 만들었다. 이로써 이질적 대립유전자 빈도를 에뮬레이트할 수 있고, 이때 DNA 시료의 점차적으로 더 작은 부분-집단은 변이체 대립유전자를 품고 있다.
기준 및 변이체 (돌연변이들을 포함하는) DNA 표준의 상이한 혼합물을 포함하는 라이브러리 상에서 차세대 시퀀싱 (Illumina HiSeq 4000) 을 실행하였다. 다음과 같이 서열화된 판독을 분석하였다: 1. BWA를 이용하여 인간 게놈에 서열화된 판독을 정렬하였다; 2. Picard 툴(tools)을 이용하여 정렬을 프로세싱하였다; 3. Genome Analysis Tool Kit (GATK)를 이용하여 변이체들을 확인하였다. 두개 돌연변이 (결과들은 이형접합성 혼합물로부터 예시적인 결과물 .vcf 파일로부터 취한)를 확인하였다:
p53 틀이동(Frameshift) 돌연변이
B5_R 300 . T TG 962.73 .\
AC=1;AF=0.500;AN=2;BaseQRankSum=1.780;ClippingRankSum=0.008;\
DP=60;FS=2.250;MLEAC=1;MLEAF=0.500;MQ=60.00;MQ0=0;\
MQRankSum=0.472;QD=16.05;ReadPosRankSum=-0.008;SOR=0.430\
GT:AD:DP:GQ:PL 0/1:24,32:56:99:1000,0,677 (GT 0/1은 이형접합성 대립유전자를 나타내며, 0은 기준 대립유전자이며, 그리고 1은 변이체 대립유전자이다)
BRAF V600E 돌연변이
B5_R 602 . T A130.77 .\
AC=1;AF=0.500;AN=2;BaseQRankSum=0.306;ClippingRankSum=0.184;\
DP=15;FS=0.000;MLEAC=1;MLEAF=0.500;MQ=60.00;MQ0=0;\
MQRankSum=-0.429;QD=8.72;ReadPosRankSum=0.184;SOR=1.022\
GT:AD:DP:GQ:PL 0/1:10,5:15:99:159,0,364
이 실시예는 상이한 동형접합성, 이형접합성 그리고 더 낮은 돌연변이성 대립유전자 빈도에서 합성 DNA 표준상에 나타낸 임상적으로-중요한 돌연변이들이 확인됨을 설명한다. 이것은 이배수체 인간 게놈에서 이형접합성 대립유전자를 나타내는데 이용될 수 있다는 예를 제공한다. 여기에서 모델화된 돌연변이 (BRAF V600E 돌연변이)는 상당한 임상적 관련성이 있는데, 이는 임상 진단 분야에 현재 보정 방법들의 가치를 실증한다.
실시예 23:
대규모 유전적 변이를 나타내는 DNA 표준의 한 예가 실행되었다. 실시예 7에서 설명된 바와 같이, 상기 인공 염색체 안으로 이미 혼입된 구조적 변이의 12개 예와 중첩되는 DNA 표준을 제작하였다. 각 DNA 표준의 경우 시퀀싱 및 어셈블리에 영향을 줄 수 있는 말단-효과를 방지하기 위하여 최소한 600nt의 상류 및 하류 측면 서열이 포함되었다. DNA 표준 쌍들은 실시예 17에서 이미 설명된 바와 같이 제작되었고, 상이한 상대적 풍도에서 복합되어, 실시예 21에서 설명된 방법을 이용하여 상이한 유전자형을 모델로 하는 혼합물을 형성하였다.
실시예 23.1:
복제-수 변이를 나타내는 DNA 표준의 한 예가 실행되었다. 상기 실시예 7에서 인공 염색체에 혼입된 인공 D4Z4 반복 어레이와 중첩되는 6개 DNA 표준 (서열 번호: 167-172)을 만들었다. 각 DNA 표준의 길이는 1,600nt이며, (i) 대략 800nt 길이의 단일 D4Z4 반복 복제 (ii) 절반 반복 복제와 일치되는 400nt 상류 서열 (iii) 절반 반복 복제와 일치되는 400nt 하류 서열을 포함한다(도 33에서 설명됨). 각 DNA 표준을 구별하기 위하여, 상기 DNA 서열 안에 6개의 '바코드' 뉴클레오티드 서열들 (AGCTA, CGATC, CACTG, TCAGC, TAGAC, 및 GCAGT)중 하나를 포함하였다. 각 서열은 오직 하나의 DNA 표준 상에 존재하고, 다른 5개 DNA 표준 상에 존재하지 않는다. 바코드 뉴클레오티드는 상기 DNA 표준 서열 안에 40nt의 개입 거리를 가지며, 각 100nt 창은 항상 최소한 2개 사례의 바코드 서열을 포함한다(도 17에서 설명됨).
각 DNA 표준은 실시예 17에서 설명된 방법을 이용하여 제작되었고, 그리고 도 33에서 설명된 바와 같이 다음의 상대적 농도에서 DNA 표준이 적정되었다; 10-배, 13-배, 50-배 및 150-배. 이것은 FSMD 환자의 95%에서 나타내는 10개 복제로부터 영향을 받지 않는 개체의 경우 100개 이상의 복제(van der Maarel and Frants 2005)의 인간 대상에서 관찰된 D4Z4 복제 수의 대부분을 포괄한다 (Schaap, Lemmers et al. 2013). 이 공정은 반복적 DNA 서열의 경우 상이한 복제-수를 나타내는 DNA 표준의 혼합물을 만든다.
실시예 24:
미생물 게놈 집단을 나타내는 DNA 표준의 한 예가 실행되었다. 실시예 9에서 어셈블리된 상기 인공 미생물 게놈 안에 선택된 서열들에 일치되는 12개 DNA 표준 (서열 번호: 149-160)을 만들었다. 미생물 게놈 서열들은 상기 DNA 표준의 길이 및 GC%는 상기 인공 미생물 게놈의 길이 및 GC%에 비례하고 따라서 대표가 되도록 선택된다. 이것은 표 9에 나타내고, 도 10에 설명된다. 예를 들면, 상기 인공 '엔테로코수스 파에칼-유사' 게놈은 3.2Mb 이며, 평균 38%의 GC 함량을 갖는다. 2.2kb 길이 (전장의 게놈 길이의 6.875%) 및 38% GC 함량을 갖는 'E. 파에칼리스-유사' 게놈과 일치되는 대표 DNA 표준 MG_1 (서열 번호: 149)을 비교함으로써, 이로 인하여 'E. 파에칼리스-유사' 게놈의 길이 및 GC 함량을 비례적으로 나타낸다. DNA 표준은 실시예 17에서 이미 설명된 바와 같이 제작되었다. 12개 DNA 표준은 4개 집단으로 조직화되었고, 각 집단은 10-배 일련의 희석 농도에서 복합되어, 104 배-범위의 농도를 포괄하는 혼합물이 형성되었다.
실시예 25:
포유류 면역글로불린 서열 다양성을 나타내는 DNA 표준의 한 예가 실행되었다. 실시예 10에서 설명된 방법들을 이용하여 만들어진 인공 TCRβ VDJ 클론형 서열들에 일치되는 750nt 길이의 15개 DNA 표준을 만들었다. DNA 표준은 BIOMED-2 프라이머, 뿐만 아니라 개재된 V, J 및 D 세그먼트에 상보적인 서열들과 중첩된다(도 13에서 설명됨). DNA 표준은 실시예 17에서 이미 설명된 바와 같이 제작되었다. DNA 표준은 5개 집단(가령, 한 집단에 3개 표준)으로 조직화되었고, 각 집단은 10-배 일련의 희석 농도에서 복합되어, 105 배-범위의 농도를 포괄하는 혼합물이 형성되었다. 이 역동 범위는 건강한 시료(Zvyagin, Pogorelyy et al. 2014) 및 질환 상태, 이를 테면, 최소 잔류 질환(Logan, Gao et al. 2011)에서 관찰된 인간 클론형 분포 프로파일에 걸쳐있다.
또다른 실시예에서, 실시예 10에서 설명된 인공 TCRG VJ 클론형 서열들을 나타내도록 DNA 표준을 만들었다. 실시예 10에서 만든 인공 TCRG VγJγ 클론형 서열들 에 일치되는 750nt 길이의 15개 DNA 표준(서열 번호: 186-202)을 만들었다. DNA 표준은 BIOMED-2 프라이머, 뿐만 아니라 개재된 V 및 J 세그먼트에 상보적인 서열들과 중첩된다(도 12에서 설명됨). DNA 표준은 실시예 17에서 이미 설명된 바와 같이 제작되었고, 복합되어 상기에서 설명된 혼합물을 형성하였다.
실시예 26:
시퀀싱을 위하여 천연 RNA 시료에 RNA 표준을 추가하는 한 가지 예시적인 방법을 실행하였다. 우선, K562 세포들은 Coriell Cell Repositories 성장 프로토콜 및 기준에 따라 배양되었다. 간략하게 설명하자면, K562 세포들은 37℃에서 5% CO2 하에 10% 태아 소 혈청 (FBS)이 보충된 RPMI 1640 배지 (Gibco®)에서 배양되었다. TRIzol (Invitrogen)을 이용하여 제작자의 지침에 따라 K562 세포로부터 전체 RNA를 추출하였다. TURBO DNase (Life Technologies)를 이용하여 각 시료에서 DNase 처리를 하였고, 이어서 RNA Clean 및 Concentrator Kit (Zymo Research)를 이용하여 클린업하였다. BioAnalyzer에 전체 RNA를 러닝시켜 온전성을 점검하고, 농도를 결정하였다. RNA 온전성 수 (RIN) >9.5인 RNA만 라이브러리 준비에 이용하였다.
실시예 14 및 표 1에서 이미 설명된 바와 같이, RNA 표준을 혼합물 A로 복합하였다. 그 다음 RNA 혼합물 A는 K562 전체 RNA의 전체 용적의 ~1%로 추가되었다 (NanoDrop, ThermoScientific로 측정됨). TruSeq Stranded Total RNA Sample Prep Kit (Illumina)를 이용하여 제조업자의 지침에 따라 RNA 라이브러리를 준비하였다. 준비된 라이브러리는 Qubit (Invitrogen)에서 정량화되고, Agilent 2100 Bioanalyzer (Agilent Technologies) 상에서 검증된 후, 시퀀싱을 위하여 시료를 풀링(pooled)하였다. 125nt 쌍을 이룬-단부 서열 판독과 함께, HiSeq 2500 장치 (Illumine)를 이용하여 시퀀싱이 실행된다.
실시예 27:
RNA 표준의 정렬 및 어셈블리를 위한 한 가지 예시적인 방법이 실행되었다. 상기 실시예 11 및 13에서 설명된 방법들을 이용하여 2개 대체 동형을 포함하는 30개 유전자에 일치되는 RNA 표준 (총 60개 RNA 표준)을 만들었다. RNA 표준을 동일한 풍도로 희석하고, 동일 비율로 복합하여 동일한 부분의 혼합물 C를 만들었다. TruSeq Stranded Total RNA Sample Prep Kit (Illumina)를 그 다음 이용하여 제조업자의 지침에 따라 상기 RNA 표준 혼합물 C로부터 직접적으로 라이브러리를 만들었다. 준비된 라이브러리는 Qubit (Invitrogen)에서 정량화되고, Agilent 2100 Bioanalyzer (Agilent Technologies) 상에서 검증된 후 HiSeq 2500 (Illumina) 장치 상에서 125nt 쌍을 이룬-말단 판독과 함께 서열화되었다. 상기 서열 판독 (.fastq) 파일은 실시예 28에서 설명된 방법들을 이용하여 프로세싱되었다. 그 다음 다음의 매개변수들과 함께 Tophat2를 이용하여 인공 염색체 (chrT)에 서열 판독을 정렬하였다.
>tophat2 chrT_index MixtureC.R1.fq MixtureC.R2.fq
결과적으로 생성된 정렬 (.bam) 파일로부터, 실시예 28에서 설명된 방법들을 이용하여 정렬 통계 (전체 및 분열 정렬 모두에 대한)를 결정하였다. 분명한 것은, 모든 RNA 표준은 전장의 서열 판독 배수 적용범위를 획득하는데 충분한 풍도를 가졌고, 따라서 서열 배수-적용범위가 비-제한적일 때 정렬 평가를 가능하게 한다. 이들 결과는 표 2에 요약된다. 특히, 전체 판독 정렬의 경우 98% 민감도, 그리고 RNA 표준 혼합물 C로부터 접합된 판독 정렬의 경우 0.99% 민감도를 결정한다. 더욱이, 상실된 18개 인트론과 16개 엑손을 제외하고 모든 유전자 구조를 어셈블리하였고, 이로 인하여 상기 인공 염색체에서 인코드된 유전자 좌(및 동형)와 일치되는 RNA 표준의 성능을 확인한다.
비교 목적으로, 상기에서 설명된 동일한 60개 RNA 표준의 시퀀싱으로부터 생성될 수 있는 서열화된 판독을 또한 시뮬레이션하였다. 상기에서 설명된 바와 같이 상기 RNA 표준으로부터 만들어진 실험적으로 유도된 판독에 시뮬레이션된 판독의 비교로 라이브러리 준비 및 시퀀싱으로 인한 변수로부터 (오직 실험적으로-유도된 판독에만 영향을 줄 것이며, 시뮬레이션된 판독에는 영향을 주지 않음) 정렬 및 어셈블리로 인한 변수(시뮬레이션된 판독 및 실험적으로-유도된 판독 모두에 영향을 줌)의 영향을 구별해낼 수 있다.
Illumina 시퀀싱 기술(Bolotin, Mamedov et al. 2012)에서 전형적으로 보고되었던 1% 오류 비율이 혼입된 RNA 표준으로부터 생성된 125-nt 쌍을 이룬 말단 판독을 시뮬레이션하는 RNASeqReadimulator (http://alumni.cs.ucr.edu/~liw/rnaseqreadsimulator.html) 소프트웨어를 이용하였다. 이것은 HiSeq 2500 장치 상에 표준 시퀀싱당 .fastq 파일을 만든다. 서열 판독 파일은 상기와 같이 프로세스되고, 정렬되며, 정렬 통계 (전체 및 분열 정렬 모두)는 실시예 28에서 설명된 방법들에 의해 결정되었다. 결과는 표 2에 요약된다. 구체적으로, 정렬에 대하여 98% 민감도, 그리고 접합된 정렬에 대하여 99% 민감도를 관찰하였고, 최종 어셈블리로부터 6 개 인트론과 8개 엑손이 상실되었다.
시뮬레이션된 그리고 실험적으로-유도된 서열화된 판독으로 유전자 좌에 대한 정렬 비교 및 어셈블리 결과는 시퀀싱 실험에서 RNA 표준의 용도를 입증한다. 분명한 것은, 시뮬레이션된 판독은 RNA 표준의 정렬 및 어셈블리에 대하여 실험적으로-유도된 서열화된 판독의 성능을 충분히 개괄하며, 이는 인공 염색체의 전사된 특징들과 일치되는 RNA 표준을 기획, 모델링, 그리고 분석함에 있어서 이들의 유용성을 나타낸다.
실시예 28:
인공 염색체 및 천연 기준 게놈에 RNA 표준 및 천연 RNA 시료 라이브러리로 구성된 판독을 정렬시키는 한 가지 예시적인 방법이 실행되었다. 실시예 26에서 설명된 방법을 이용하여 만들어진 서열 파일 (.fastq)은 역다중화(de-multiplexing)를 거쳤다. 낮은-정량적 판독 및 서열들 또는 어뎁터 오염 서열들은 제조업자의 지침에 따라 트림_갈로르(trim_galore)를 이용하여 서열 파일로부터 제거되었다:
(http://www.bioinformatics.babraham.ac.uk/projects/trim_galore/).
상기 인간 게놈 (hg19) 서열은 상기 인공 염색체 (chrT) 서열에 연계시켜 단일 파일 (.fasta)을 만들었다. 그 다음 우리는 제조업자의 지침에 따라 복합된 서열 파일로부터 지표 파일 (hg19_chrT_index.*)을 생성하기 위해 보타이-빌트(bowtie-build)를 이용하였다(Langmead and Salzberg 2012). 그 다음 다음의 매개변수들과 함께 Tophat2 (Kim, Pertea et al. 2013)을 이용하여 지표 파일(hg19_chrT_index.*)에 서열화된 판독(.fastq)을 정렬하였다:
>tophat2 hg19_chrT_index ./K562.R1.fq ./K562.R2.fq
이 접근법은 유도 정렬에 기존 유전자 주석을 혼입시키지 않으며, 전사체들의 새로운 유전자 및 데노보 어셈블리 발견에 흔히 요구된다. 그 다음 하기에서 설명되고, 표 2에서 요약된 다수의 메트릭스에 따라 상기 인공 염색체 및 천연 게놈에 서열화된 판독의 정렬을 평가하였다. 상기 인공 염색체 (ChrT에 대한 판독) 및 인간 게놈 (Hg19에 대한 판독)에 정렬되는 다수의 판독에 의해 게놈/인공 염색체에 대한 판독이 결정된다. K562의 경우, 상기 인공 염색체에 대한 1,091,683개의 판독과 인간 게놈 서열에 대한 65,778,796개의 판독을 정렬하였다.
분획 희석은 게놈에 대한 상대적인 인공 염색체에 정렬된 판독 분율로부터 산출되는데, 시료 라이브러리에 대한 표준의 희석을 나타낸다. K562 시료의 경우, 라이브러리의 1.63%는 상기 인공 염색체에 정렬되고, 이는 61-배 희석 인자를 나타낸다.
정렬 민감도는 정렬된 상기 인공 염색체 상에 인코드된 유전자 좌의 인공 유전자 염기수(참 양성)를 전체 인공 유전자 염기 수로 나눈 값으로 정의된다. K562 시료 1의 경우, 정렬 민감도는 0.81로 관찰되었다.
정렬 특이성은 정렬을 갖는 인공 유전자 염기들의 수를 정렬을 갖는 전체 염기 수로 나눈 값으로 정의된다. K562 시료 1의 경우, 정렬 특이성은 0.83로 관찰되었다.
접합된 정렬 민감도는 정확한 분열 정렬을 갖는 인공 유전자 인트론들의 수를 전체 인공 유전자 인트론들의 수로 나눈 값으로 정의된다. K562 시료의 경우, 정렬 민감도는 0.86이며, 도 22A에서 설명된다.
접합된 정렬 특이성은 분열 정렬에 일치되는 인공 유전자 인트론들의 수를 고유한 분열 정렬 수로 나눈 값으로 정의된다. K562 시료의 경우, 정렬 특이성은 0.85로 관찰되었다.
탐지 한계는 상기 서열화된 라이브러리 안에서 신뢰성있게 탐지되지 않고, 중첩 정렬이 없는 최대 풍도 RNA 표준에 상응하며, 이는 도 24D에서 설명된다. 0.005 아타몰/ul(탐지되지 않은 최대 풍도 RNA 표준 R_8_2 (서열 번호: 47, 48)에 희석 인자를 곱한 값)에서 검출의 하한을 결정한다. 이 농도 이하에 있는 해당 K562 RNA 시료 내의 동형은 시퀀싱 라이브러리 내에서 나타나지 않거나 검출되지 않을 수 있으며, 라이브러리 시퀀싱은 전체 포화(saturation)로 진행되지 않았다.
실시예 29:
RNA 표준의 판독을 인공 유전자에 어셈블링하는 한 가지 예시적인 방법이 실행되었다. 실시예 28에서 설명된 방법에 의해 생성된 정렬 파일 (.bam)은 다음의 디폴트 매개변수들에 따라 Cufflink2 (Trapnell, Williams et al. 2010)를 이용하여 전장의 전사체 구조로 어셈블리되었다:
>cufflinks K562_1_mixA.bam
상기 인공 염색체 상에 108개 전사체 구조를 어셈블리하였고, 도 23에 예시가 설명된다. 일부 RNA 표준이 다수의 분획된 구조로 부분적으로 어셈블리되었기 때문에 RNA 표준의 수(60개)보다 더 많다.
어셈블리 수행능을 평가하기 위하여, 디폴트 매개변수들에 따라 Cuffcompare (Trapnell, Williams et al. 2010)을 이용하여 인공 염색체 상에서 공지된 전사체 주석에 어셈블리된 전사체를 비교하였다. 우리는 모든 수준 (뉴클레오티드, 엑손, 인트론, 전사체, 유전자)에서 인공 유전자 구조 및 인공 엑손들, 인트론들 및 어셈블리에서 유실된 유전자의 분획에 비교하여 어셈블리의 민감도 및 특이성에 따라 전사체 어셈블리를 평가하였다. 유전자 구조와 관련하여 민감도 및 특이성 측정의 상세한 내용은 이미 설명되고 있다 (Burset and Guigo 1996). 본 실시예에서 K562 RNA 시료와 복합될 때 RNA 표준 어셈블리에 대한 결과는 표 2에 요약된다. 명백한 것은, 인공 염색체 상에서 유전자 어셈블리에 기반을 둔 이들 측정은 동반 K562 RNA 시료 안에 전사체들의 일치된 데노보 어셈블리 평가를 알려준다.
동형을 정확하게 어셈블리하지 못한 것은 저풍도의 RNA 표준의 불충분한 서열 적용범위로 인한 것일 수 있다. 정확하게 어셈블리되지 못한 가장 풍부한 RNA 표준은 이로 인하여 전사체 어셈블리의 하한을 나타낸다. 이는 도 22A 및 도 22B에서 엑손들, 인트론들 그리고 전장의 동형 구조가 어셈블리된 민감도에 비례하여 각 동형의 공지된 농도를 플롯팅하여 예시된다. 이 농도 이하로 존재하는 동반 K562 RNA 시료의 전사체들은 어셈블리가 잘 되지 않거나 또는 부분적으로만 어셈블리될 것으로 예상된다.
실시예 30:
RNA 표준 풍도를 정량화하는 한 가지 예시적인 방법이 실행되었다. 실시예 26에서 설명된 방법들을 이용한 라이브러리 준비 및 시퀀싱을 위하여 실시예 15에서 혼합물 A로 이미 준비된 RNA 표준을 3가지 생물학적 복제본 K562 RNA 시료에 우선 추가하였다.
우선 다음의 매개변수들과 함께 Tophat2 (Kim, Pertea et al. 2013)을 이용하여 지표 파일(hg19_chrT_index.*)에 서열화된 판독(.fastq)을 정렬하였다:
>tophat2 -G annotations.gtf hg19_chrT_index ./K562.R1.fq ./K562.R2.fq
이 접근법은 유전자 주석을 이용하여 정렬을 유도한다. 이 주석 파일 (annotation.gtf)은 인공 염색체 상에서 유전자 좌의 주석과, 인간 게놈의 GENCODE v19 (Harrow, Frankish et al. 2012) 천연 유전자 주석의 주석을 포함한다. 정렬 파일 (.bam)은 다음의 디폴트 매개변수들에 따라 Cufflink2 (Trapnell, Williams et al. 2010)를 이용하여 RNA 표준 및 인간 유전자 주석에 대하여 정량화되었다:
>cufflinks -G annotations.gtf K562_1_mixA.bam
풍도는 2가지 수준에서 정량화될 수 있는데; 각각의 인공 유전자 (가령, 복합된 모든 DNA 표준 쌍) 및 각각의 동형 (가령, 각 DNA 표준 동형)에 대한 풍도가 측정되었다. 도 24A에서 RNA 표준의 정량화를 설명하기 위하여, 각 인공 유전자에 대한 공지된 유전자 농도 (아타몰/ul)에 대하여 측정된 유전자 풍도(RPKM)를 플롯하였다. 상기 정량적 정확도는 RNA 표준의 관찰된 풍도 (NG 시퀀싱에 의해 측정됨)와 이들의 예측된 풍도 (혼합물 A에 복합될 때, 이들의 공지된 농도에 상응) 간의 상관관계(Pearson's r)에 의해 측정될 수 있다. 이 실시예의 경우 (RNA 표준 혼합물 A는 3개 복제본 K562 RNA 시료들과 복합됨), 상기 상관관계는 0.95이다. 도 24A에서 설명된 기울기는 증가 비율을 측정한다 (직선 및 1/Y2 가중치(weighting)를 이용한 비-선형 회귀 피팅으로부터 결정됨). 이것은 상기 RNA 표준의 역동 범위에 걸쳐 예측되는 풍도와 비교된 관찰된 것의 선형 비례를 나타낸다. 이 실시예의 경우, 기울기는 0.91이다. 이들 결과는 표 2에 요약된다.
RNA 표준이 정량화되는 정확도는 시퀀싱 적용범위에 의존적이며, 낮은 시퀀싱 적용범위를 가진 저풍도 RNA 표준의 정량화는 고풍도 RNA 표준보다 더 가변적이다. 이를 설명하기 위하여 도 22C에서 각 RNA 표준의 공지된 농도에 대하여 각 RNA 표준의 정량적 측정에서 변동 계수 (COV%)를 플롯팅하였다. 이것은 0.153 아타몰/ul에서의 상기 RNA 표준은 높은 변이 97.07 (CV%)를 갖지만, 한편 1,250 아타몰/ul의 유전자는 3.24 (CV%)의 낮은 변이를 나타낸다는 것을 보여준다. 이것은 유전자 풍도가 측정되는 신뢰도를 평가하는데 RNA 표준의 사용을 보여준다.
RNA 표준을 사용하여 NG 시퀀싱에 의해 백반 킬로베이스당 판독(RPKM)으로 측정되는 천연 유전자의 풍도(동반 RNA 시료 안)를 몰 단위 (아타몰/ul)의 농도로 전환시킬 수 있다(도 24A에서 설명됨). 예를 들면, 동반 K562 RNA 시료에서 중단점 클러스터 영역 유전자 (BCR)의 발현은 20.9063 RPKM이라는 것을 측정한다. 이는 유사한 풍도 RNA 표준에 비교하여 0.019 아타몰/ul 농도에 상응한다.
실시예 31:
대체 접합을 측정하기 위하여 RNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. 개별 동형의 정확한 정량화는 동일한 유전자 좌에서 대체적으로 접합된 다른 동형과 공유된 서열을 수준의 변화에 의해 복잡하게된다. 따라서, 동형 정량화의 정확도를 평가하기 위하여, 혼합물 A(실시예 15에서 준비됨)에서 RNA 표준의 공지된 동형 풍도 (아타몰/ul)에 대한 측정된 동형 풍도(RPKM)을 플롯하였다(도 24D에서 설명됨). 그 다음 K562 RNA 시료에 추가된 동형 RNA 표준에 대한 0.93 (Pearson 's r)과 0.86의 기울기의 상관관계를 결정하였고, 이로 인하여 동형 정량화의 평가가 제공되었다. 이들 결과는 표 2에 요약된다.
다음으로 대체 접합을 에뮬레이팅하는 공정에서 하나의 공유된 인공 유전자 좌로부터 생성된 다수의 개별 동형 RNA 표준 간에 상대적 풍도를 측정하였다. 도 25A에서 예시된 바와 같이, 쌍을 이룬 동형의 공지된 상대적 풍도와 비교하여 쌍을 이룬 동형의 관찰된 상대적 풍도를 플롯팅하는데, 이는 대체 접합 사건들이 측정되는 정량적 정확도를 나타낸다. 이 시료의 경우, 우리는 K562 RNA 시료에 첨가된 혼합물 A에서 RNA 동형 쌍간에 0.76 (Pearson 's r)의 상관관계와 0.84의 기울기를 관찰한다. 이 평가는 동반 K562 RNA 시료에서 천연 유전자의 대체 접합의 분석을 알려준다.
실시예 32:
다수 RNA 시료 간의 차이를 측정하기 위하여 RNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. 우선, GM12878 세포들은 Coriell Cell Repositories 성장 프로토콜 및 기준에 따라 배양되었다. 간략하게 설명하자면, GM12878 세포들은 37℃에서 5% CO2 하에 10% 태아 소 혈청 (FBS)이 보충된 RPMI 1640 배지 (Gibco)에서 배양되었다. TRIzol (Invitrogen)을 이용하여 제작자의 지침에 따라 GM12878 세포로부터 RNA를 추출하였다. 실시예 14에서 설명되고, 표 1에서 나타낸바와 같이, RNA 표준은 혼합물 A 및 혼합물 B로 준비되었다. 최종 시료의 1%의 최종 용적으로 RNA 혼합물 A는 K562 RNA 시료에 추가되었고, RNA 혼합물 B는 GM12878 RNA 시료에 추가되었다(NanoDrop, ThermoScientific에 의해 측정됨). 라이브러리가 준비되었고, 실시예 26에서 설명된 바와 같이 서열화되었다. 동반 GM12878 RNA 시료와 RNA 표준 혼합물 B에 대한 서열화된 판독 파일 (.fastq)은 실시예 28-30에서 설명된 방법을 이용하여 인공 염색체 및 기준 인간 게놈과 함께 분석되었다. 결과는 표 2에 요약되고, 도 24B, F에서 설명된다.
그 다음 혼합물 A (K562 세포 시료와 함께)와 혼합물 B (GM12878 세포 시료와 함께) 간의 RNA 표준의 풍도 차이를 비교하였다. 도 24C에서 설명되고, 표 3에서 나타낸 바와 같이, 혼합물 A와 B 간의 관찰된 배수 변화를 플롯하였고, 예측된 배수-변화와 비교하였다. 예측된 배수변화와 관찰된 배수-변화 간에 0.70 (Pearson 's r)의 상관관계와 0.88의 기울를 관찰하였는데, 이는 동반 RNA 시료 간에 차등적 RNA 풍도가 측정된 정확도를 나타낸다.
그 다음 시료간의 RNA 표준의 상대적 동형 풍도에서 차이를 측정하였다. 도 24F와 25B에서 설명된 바와 같이, 혼합물 A와 혼합물 B 간에 동형 풍도에서 예측된 배수 변화에 대하여 관찰된 배수 변화를 플롯하였다. 이 시료의 경우, 예측된 동형 배수-변화에 대하여 관찰된 동형 배수 변화는 0.73 (Pearson's r)의 상관관계와 0.75의 기울기 (표 3에 요약됨)를 갖는데, 이는 동반 RNA 시료 간에 차등적 대체 접합이 측정된 정확도를 나타낸다.
동형 풍도에서 배수-변화는 정량적 대체 접합을 에뮬레이트한다. R_10_2 유전자를 이용하여 도 25C에서 어떻게 상기 표준이 대체 접합에서 배수-변화를 에뮬레이팅하는지를 설명한다. 상기 R_10_2 유전자는 더 긴 동형 (_R) 또는 더 짧은 형태 (_V)를 만들기 위하여 5번째 엑손의 대체 접합으로 인하여 생성된 2개의 상이한 동형을 포함한다. 실시예 27에서 이미 설명된 방법에 의해 생성된 시뮬레이션된 서열 판독의 적용범위는 R_10_2 동형이 정확하게 어셈블리될 수 있음을 나타낸다. R_10_2 유전자를 나타내는 표준은 혼합물 A 및 B에 추가되어 (i) 유전자 발현은 5-배 감소되며, 그리고 (ii) 동형 발현은 R_10_2_V 동형의 상대적으로 3-배 증가와 R_10_R 동형의 동시 3-배 감소의 변화가 있다. 이는 도 25C에서 설명된 바와 같이, 엑손 5에서 대체 접합의 3-배수 변화를 에뮬레이트한다. 그 다음 혼합물 A와 함께 K562 세포와 혼합물 B와 함께 GM12878 세포 간에 R_10_2 동형 풍도에서 배수-변화를 정량화하였는데, 유전자 발현의 4-배 증가 (유전자 풍도에서 예측된 5-배 배수 변화의 과소평가임)와 상대적 동형 풍도에서 3-배수 변화가 관찰되었다(도 25C에서 설명됨). 이 실시예는 동형 RNA 표준 풍도의 다양한 변화는 RNA 시료 간의 대체 접합 차이를 에뮬레이트할 수 있음을 설명한다.
상기 분석을 RNA 표준의 특이적 하위집단로 제한시킬 수 있다. 예를 들면, 도 26B에서 설명된 바와 같이, 4.8 아타몰/ul에서 어셈블리의 사용자-정의된 역치 풍도 한계 이상으로 RNAs 표준의 대체 접합 정확도를 결정할 수 있다. RNA 표준의 이러한 하위집단은 모든 RNA 표준에 대한 평균보다 더 높은 서열 적용범위를 가지기 때문에, 동형 정량화의 좀더 정확한 측도(상관관계, 기울기)를 관찰한다.
실시예 33:
질환 시료와 정상적인 RNA 시료 간에 차이를 보정하기 위하여 RNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. 3개의 정상적인 인간 폐 시료와 3개의 폐 선암 시료의 전체 RNA 시료는 Origene (시료 식별번호: CR560142, CR559185, CR560128, CR560083, CR560135, CR561324; Rockville, MD)으로부터 구입하였다. 실시예 26에서 이미 설명된 방법들을 이용하여 RNA 표준 혼합물 A는 폐의 선암 각 시료에 전체 용적의 1%로 추가되며, RNA 혼합물 B는 폐의 각 정상적인 RNA에 1%의 전체 용적으로 추가된다. 이미 공개된 ERCC RNA Spike-Ins(Consortium 2005)와의 비교를 위하여, ERCC Spike-In 혼합물 1은 폐의 각 선암에, 그리고 ERCC Spike-In 혼합물 2는 폐의 각 정상적인 시료에 제조업자의 지침에 따라 추가하였다 (tools.lifetechnologies.com/content/sfs/manuals/cms_086340.pdf). 복합된 RNA 시료는 시퀀싱을 위한 라이브러리로 준비되었으며, 실시예 28-30에서 설명된 방법들을 이용하여 분석되었다. 결과는 표 2에 요약된다.
다음으로 본 명세서에서 설명된 RNA 표준의 수행능은 ERCC Spike-In 서열들과 비교하였다. 제조업자의 지시에 따라 결정된 ERCC Spike-Ins에 대한 정렬 및 발현 배수-변화를 결정하고, 이미 설명된 바와 같이(실시예 28-39) RNA 표준 및 ERCC Spike-Ins 모두에 대한 정렬 특이성 및 민감도, 분획 희석, 검출 한계 그리고 역동 범위 그리고 정량적 정확도 (상관 및 기울기)를 측정하였다 ERCC Spike-Ins와 RNA 표준 사이의 비교는 표 2에 요약된다.
도 26A, B에서 RNA 표준과 ERCC Spike-Ins 모두의 공지된 풍도에 대한 예측된 풍도를 플롯하였다. 또한 도 26C에서 설명된 바와 같이, RNA 표준 및 ERCC Spike-Ins 모두에 대한 혼합물 간의 배수-변화를 또한 비교한다.
ERCC 표준은 RNA 표준 (0.81)과 비교하였을 때 유사한 정렬 민감도 (0.84)를 나타내지만, RNA 표준과 비교하여 더 높은 특이성 (0.99)을 나타낸다. ERCC 정렬의 이러한 더 높은 특이성은 오직 단일 RNA 서열 만을 포함하는 ERCC Spike-Ins의 결과 때문이다. 본 명세서에서 공개된 RNA 표준 그리고 내생성 인간 유전자와 달리, ERCC Spike-Ins는 다수 엑손 및 인트론 서열을 포함하지 않고, 따라서 ERCC Spike-In 서열들에 대한 비-분열 판독을 배열하는 것만 오로지 가능하다.
그 다음으로 정상적인 폐 RNA 시료 또는 폐 선암 RNA 시료 안에 암(Wellcome Trust Sanger Cancer Census(Futreal, Coin et al. 2004)에 의해 큐레이트됨) 과 원인적으로 연관된 인간 유전자의 발현을 정량화하였다. 단일 주석 파일 (CancerGenes_RNAstandards.gtf)를 만들기 위하여, 인공 염색체 상에 464개 유전자 좌표의 게놈 좌표(GENCODE v19 주석 (Harrow, Denoeud et al. 2006))를 연결했다. 그 다음 다음의 매개변수들과 함께 Cuffdiff (Trapnell, Williams et al. 2010)를 이용하여 암 유전자와 RNA 표준의 발현을 측정하였다:
>Cuffdiff -g CancerGenes_RNAstandards.gtf\
LungCancer1.sam,LungCancer2.sam,LungCancer3.sam\
LungNormal1.sam,LungNormal2.sam,LungNormal3.sam
그 다음 실시예 28-30에서 이미 설명된 방법들을 이용하여, 혼합물 A (정상적인 폐)와 혼합물 B (폐 선암) 안에서 RNA 표준의 차등적 유전자 발현 및 대체 접합의 정량적 정확도를 평가하기 위한 비교 분석을 실행하였다. 결과는 표 3에 요약된다.
도 26D에서 상기 RNA 표준의 관찰된 풍도(RPKM)가 대응하는 암 유전자의 농도(아타몰/ul)를 추정하는데 어떻게 이용되는 지를 설명하기 위하여, RNAs 표준의 측정된 풍도에 대한 암 유전자의 측정된 풍도를 플롯하였다.
RNA 표준이 어떻게 동반 RNA 시료 안에서 개별 유전자의 분석을 알려주는 지를 설명하기 위하여, 우리는 mini-chromosome maintenance 2 (MCM2) 유전자의 발현을 고려하였다. MCM2는 세포 증식의 표지자이며 (Yang, Ramnath et al. 2006, Simon and Schwacha 2014) 그리고 폐 선암 시료에서 풍부한 MCM2 발현이 이미 보고된 바 있다(Zhang, Gong et al. 2014). 따라서, 정상적인 시료와 일치된 종양 시료 간의 MCM2 발현의 배수-변화를 정확하게 측정하는 것이 중요하다. MCM2는 복합 접합된 구조 (16개 엑손을 포함)를 가지며, 따라서 상기 RNA 표준을 이용하여 잘 모델화되었다. MCM2는 정상적인 폐 시료에서 ~63.0 RPKM의 발현을 나타내지만, 그러나 폐 선암 시료에서는 2.07-배 더 풍부하였다(170.1 RPKM를 의미함)는 것을 관찰하였다. RNA 표준과 비교하여, MCM2 발현은 19.53 아타몰/ul의 농도에 상응하는 것으로 결정한다. 특히, 유사한 농도에서 RNA 표준 (이를 테면, R_6_1 및 R_6_2)는 어셈블리가 잘 되지 않으며, 정량화도 잘 되지 않는다. 이것은 동반되는 정상 폐와 폐 선암 RNA 시퀀싱 간의 MCM2 발현 측정은 조심스럽게 해석되어야 한다는 것을 암시한다.
도 26D에서 설명된 측정된 RNA 표준 풍도의 플롯은 검출 한계가 ~0.005615 아타몰/ul임을 제시한다. 암 유전자의 42.7%는 이 검출 한계 이상이며, 추가 분석용으로 적합하다는 것을 관찰한다. 이 라이브러리는 포화도까지 서열화되지 않았기 때문에 추가 암 유전자는 이 검출 한계 이하의 농도에 존재할 수 있거나, 또는 정확하게 탐지되지 않을 수도 있는 유전자 발현에서의 변화를 겪을 수도 있다는 점이다.
실시예 34:
시퀀싱을 위하여 마우스 RNA 시료에 RNA 표준을 추가하는 한 가지 예시적인 방법을 실행하였다. 우선 4-월령의 야생형 Swiss 마우스로부터 마우스 간 조직을 구하였다. TRIzol (Invitrogen)을 이용하여 제작자의 지침에 따라 마우스 간 시료로부터 전체 RNA를 추출하였다. TURBO DNase (Life Technologies)를 이용하여 각 시료에서 DNase 처리를 하였고, 이어서 RNA Clean and Concentrator Kit (Zymo Research)를 이용하여 클린업하였다. BioAnalyzer에 전체 RNA를 러닝시켜 온전성을 점검하고, 농도를 결정하였다. RNA 온전성 수 (RIN) >9.5인 RNA만 라이브러리 준비에 이용하였다. 실시예 15에서 혼합물 A로써 이전에 준비된 RNA 표준은 1% 용적으로 마우스 간 RNA 시료 안에 첨가되었다 (NanoDrop, ThermoFischer에 의해 결정됨). 실시예 26에서 설명된 방법들을 이용하여 RNA 시료가 준비되었고, 서열화되었다.
그 다음 상기 인공 염색체 (chrT) 서열을 마우스 게놈 (mm10) 서열에 연계되어 단일 파일 (.fasta)을 만들었다. 그 다음 제조업자의 지침에 따라 복합된 서열 파일로부터 지표 파일 (mm10_chrT_index.*)을 생성하기 위해 보타이-빌트를 이용하였다(Langmead and Salzberg 2012).
그 다음, 다음의 매개변수들과 함께 Tophat2 (Kim, Pertea et al. 2013)을 이용하여 지표 파일(mm10_chrT_index.*)에 서열화된 판독(.fastq)을 정렬하여:
>tophat2 mm10_chrT_index ./MouseLiver.R1.fq ./MouseLiver.R2.fq.
정렬 파일 (.bam)을 제공하였다. 실시예 28-30에서 이미 설명된 방법들을 이용하여 마우스 간 시료에 동반된 RNAs 표준의 정렬, 어셈블리 및 정량화 분석을 실행하였다. 이 결과들은 표 2에 요약되고, 도 27 및 도 28에서 설명된다. 분명한 것은, 마우스 간 RNA 시료와 함께 추가된 혼합물 A 안에 RNA 표준 분석은 표 2에 나타낸 것과 같이 인간 RNA 시료와 함께 이용된 RNA 표준에 대하여 유사한 민감도 (0.56) 및 특이성 (0.97)을 나타내었다. 이것은 RNA 표준의 성능이 마우스 RNA 시료에 추가되거나 마우스 게놈에 대한 서열화된 판독의 수반되는 정렬에 영향을 받지 않음을 확인시켜준다.
실시예 35:
비-인간 게놈을 갖는 RNA 표준으로부터 서열화된 판독을 분석하는 한 가지 예시적인 방법이 실행되었다. RNA 표준이 다양한 생물 분기군(clades)의 범위로부터 다른 천연 게놈과 함께 사용되는 경우, 이전 실시예 28-30 및 34에서 기술된 바와 같이 비교적 잘 수행되는지 여부를 결정했다. 우선 다음의 유기체들에 대한 게놈 서열들을 다운로드하였다: H. 사피엔스 (hg19), M.무스쿨루스 (mm10), C.엘레간스 (ce10), D.멜라노가스토르 (dm3), A.탈리아니스 (tair9) 대장균 (eschColiK12) 및 M.칸데리 (methKand1) 및 S.세레비사에 (SacCer6). 각 개별 게놈 서열은 상기 인공 염색체 서열 (chrT)에 연계시켜 단일 서열 파일 (.fasta)을 만들었다. 그 다음 Bowtie2-build를 이용하여 제조업체의 지침에 따라 조합된 시퀀스 파일에 해당하는 색인을 구축했다.
다음으로, 동일한 농도로 조합된 RNA 표준으로부터 준비된 라이브러리로부터의 서열 판독을 실시예 27에 기재된 바와 같이 혼합물 C를 형성하도록 정렬하였다. 다음 매개변수들을 이용하여 유기체 게놈 (*로 표시됨)과 함께 인공 염색체를 포함하는 각 개별 지표에 서열화된 판독을 정렬하였다:
>tophat2 *_chrT_index MixtureC.R1.fq MixtureC.R2.fq
이때 *는 유기체 게놈 (가령, Dm3, hg19 등등)에 상응함.
각 생성된 정렬 (.bam)의 경우, 상기 실시예 28에서 설명된 방법들을 이용하여 정렬 통계 (전체 및 분열 정렬 모두에 대한)를 결정하였다. 게놈에 정렬된 판독 수, 전체 및 접합된 판독의 특이성과 민감성은 동반 게놈과 관계없이 크게 변하지 않는다는 것을 관찰했다. 이러한 결과는 표 4에 요약되어 있으며, RNA 표준은 동반 게놈에 관계없이 비교적 잘 수행되며, RNA 표준은 다양한 생물체의 RNA 시료과 함께 사용될 수 있음을 나타낸다.
실시예 36:
융합 유전자 발현을 측정하기 위하여 RNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. 실시예 8에서 설명된 인공 염색체의 전좌로부터 생성된 정상적인 (A1 및 B1) 유전자와 융합 유전자 (B1fA1)를 나타내는 RNA 표준에 대하여 실시예 27에서 이미 설명된 방법들을 이용하여 판독 라이브러리를 시뮬레이션하였다. 판독 풍도는 104 배 범위를 포함하도록 2개 정상적인 RNA 표준 (A1 및 B1 유전자)에 대하여 융합 RNA 표준의 10-배 연속 희석에 따라 배분된다(도 9B에서 설명됨). 이 결과는 판독의 증가되는 작은 비율로 융합 RNA 표준을 나타낸다. 상기에서 상세하게 설명된 바와 같이, K562, GM12878, 정상적인 폐 및 폐 암 RNA 시료로부터 생성된 실험적으로 유도된 RNA 시퀀싱 라이브러리로 최종 농도 1%까지 RNA 표준 서열 판독을 연결시켰다. 이로써 추가 분석을 위하여 라이브러리 파일 (.fastq)을 만들었다.
그 다음, 다음의 매개변수들과 함께 Tophat2-fusion (Kim, Pertea et al. 2013)을 이용하여 지표 파일(hg19_chrT_index.*)에 서열화된 판독(.fastq)을 정렬하여:
>tophat2-fusion hg19_chrT_index ./K562.R1.fq ./K562.R2.fq
전좌에 의해 생성된 융합 인트론과 중첩되는 판독 수(백만당; RPM)를 나타내는 정렬 파일 (.bam) 및 융합 파일 (fusions.out)을 만들었다. 도 9B에서 설명된 바와 같이, 판독 적용범위에 대하여 각 융합 RNA 표준 희석의 공지 농도를 플롯팅하였다. 상관관계 (0.982)와 기울기 (0.927)를 사용하여 융합 유전자 RNA 표준의 정량적 정확성을 평가하였고, 정상 유전자에 비해 융합 유전자 발현을 정량하는데 비교적 높은 정확성을 나타낸다. 추가적으로, 도 9C에서 설명된 바와 같이, 우리는 또한 RNA 융합 유전자의 상대적 풍도와 비교하여 융합 RNA 표준의 확인에 할당된 신뢰도를 플롯팅하였다. 이 분석은 동반 천연 RNA 시료 안에 대응하는 적용범위에서 융합 유전자가 탐지되고, 정량화되는 정확도, 민감도 및 신뢰도를 나타낸다.
동반 K562 RNA 시료는 염색체 9와 22 사이에서 BCR-ABL 유전자 융합에 대한 이형접합성이다(Grosveld, Verwoerd et al. 1986). 그 다음 K562 RNA 시료 안에 내생성 BCR-ABL1 (p210) 융합 유전자의 상대적 풍도 측정을 알리는데 RNA 표준을 이용하였다. 야생형 세포 (GM12878) 배경에 대하여 BCR-ABL1 융합 유전자를 품고 있는 증가되는 작은 하위-집단 세포(K562)들을 에뮬레이팅하기 위하여 GM12878 게놈 DNA에 대하여 10-배 연속 희석으로 K562 세포로부터 게놈 DNA를 적정하였다. 도 9B에서 설명된 바와 같이, K562 세포 분획의 연속 희석에서 BCR-ABL1 (p210) 융합 유전자의 판독 풍도(백만당)를 플롯하였다. BCR-ABL1 (p210) 융합 유전자의 풍도에 상응하는 RNA 표준은 최소 잔류 질환을 모니터하는데 불충분한 융합 유전자 탐지 민감도의 상대적으로 얕은 한계 (~1:10 희석에 상응)를 나타낸다. 따라서, 융합 유전자를 나타내는 RNA 표준을 사용하면 RNA 서열 분석 라이브러리에서 융합 유전자를 검출할 때 민감도와 정확성을 평가할 수 있으며, 최소 잔류 질환 모니터링에 유용할 수 있다(Mitterbauer, Nemeth et al. 1999).
실시예 37:
시퀀싱을 위하여 천연 DNA 시료에 DNA 표준을 추가하는 한 가지 예시적인 방법을 실행하였다. 인간 GM12878 세포계통 (Coriell Cell Repositories)은 37℃에서 5% CO2 하에 10% 태아 소 혈청 (FBS)이 보충된 RPMI 1640 배지 (Gibco®)에서 배양되었다. TRIzol (Invitrogen)을 이용하여 제작자의 지침에 따라 GM12878로부터 DNA를 추출하였다. 추출된 DNA 시료는 RNase A로 처리하고, Genomic DNA Clean & Concentrator 키트 (Zymo Research)로 클린업하였다. 정제된 DNA는 Nanodrop (Thermo Scientific) 상에서 정량화되었다. DNA 표준은 실시예 18 및 표 5에서 이미 설명된 바와 같이, 혼합물 A로 복합하였다. 그 다음 DNA 혼합물 A는 GM12878 게놈 DNA로 총 용적의 ~1%로 추가된다 (NanoDrop, ThermoScientific로 측정됨).
TruSeq Stranded DNA Sample Prep Kit (Illumina)를 이용하여 제조업자의 지침에 따라 DNA 라이브러리를 준비하였다. 준비된 라이브러리는 Qubit (Invitrogen)에서 정량화되고, Agilent 2100 Bioanalyzer (Agilent Technologies) 상에서 검증된 후, 시퀀싱을 위하여 시료를 풀링(pooled)하였다. 125nt 쌍을 이룬-단부 서열 판독과 함께, HiSeq 2500 장치 (Illumine)를 이용하여 시퀀싱이 실행된다.
실시예 38:
DNA 표준의 정렬 및 어셈블리를 위한 한 가지 예시적인 방법이 실행되었다. 상기 실시예 17 및 20에서 설명된 방법들을 이용하여 2개 대립유전자(기준 및 변이체)와 함께 인공 염색체의 30개 영역에 일치되는 DNA 표준을 만들었다. DNA 표준을 동일한 풍도로 희석하고, 동일 비율로 복합하여 동일한 부분의 혼합물 C를 만들었다. TruSeq Stranded DNA Sample Prep Kit (Illumina)를 이용하여 제조업자의 지침에 따라 상기 DNA 라이브러리를 만들었다. 준비된 라이브러리는 Qubit (Invitrogen)에서 정량화되고, Agilent 2100 Bioanalyzer (Agilent Technologies) 상에서 검증된 후 HiSeq 2500 (Illumina) 장치 상에서 125nt 쌍을 이룬-말단 판독과 함께 서열화되었다. 상기 서열 판독 (.fastq) 파일은 실시예 39에서 설명된 방법들을 이용하여 프로세싱되고, 정렬되었다. 실시예 39에서 설명된 방법들을 이용하여 정렬 (.bam) 파일로부터 정렬을 평가하였다. 분명한 것은, 모든 DNA 표준은 전장의 서열 배수-적용범위를 획득하는데 충분한 풍도였다. 서열 배수-적용범위가 비-제한적인 정렬 측정은 표 6에 요약된다. 특히, 판독 정렬에 대한 99% 민감도 및 97% 특이성을 결정하고, 이로 인하여 상기 인공 염색체의 영역들을 나타내는데 DNA 표준의 유용성이 입증된다.
비교를 목적으로, 동일한 DNA 표준으로부터 생성된 예측된 판독을 또한 시뮬레이션하였다. 상기에서 만들어진 실험적으로-유도된 판독에 시뮬레이션된 판독 비교는 정렬 및 어셈블리로 인한 가변의 영향 (시뮬레이션된 그리고 실험적으로-유도된 판독에 모두 영향을 줄 것)을 시퀀싱으로 인한 변수 (실험적으로-유도된 판독에만 오직 영향을 줄 것이고, 그리고 시뮬레이션된 판독에 영향을 주지 않을 것임)로부터 구별할 수 있다.
Sherman (http://www.bioinformatics.babraham.ac.uk/projects/sherman/)을 이용하여 제조업자의 지침에 따라 HiSeq 기기 장비에서 시퀀싱당 .fastq 파일로써 DNA 표준에 의해 생성된 125nt 쌍을 이룬 단부 판독 유전자를 시뮬레이션한다. 서열화된 판독은 일반적으로 Illumina 시퀀싱 기술에 대해 보고된 1 % 오류율을 포함한다(Bolotin, Mamedov et al. 2012). (상기와 같은 동일한 매개변수들과 함께 bwa를 이용하여 상기 인공 염색체에 시뮬레이션된 서열 판독을 정렬하고, 상기에서 설명된 바와 같이 정렬을 평가하였다. 결과는 표 6에 요약된다. 특히, DNA 표준으로부터 판독 정렬에 대하여 99% 민감도 및 100% 특이성을 관찰하고, 이로 인하여 상기 인공 염색체의 서열과 일치되는 DNA 표준의 유용성이 입증된다. 분명한 것은, 시뮬레이션된 판독은 DNA 표준의 정렬 및 어셈블리에 대하여 실험적으로-유도된 서열화된 판독의 성능을 충분히 개괄하며, 이는 인공 염색체의 전사된 특징들과 일치되는 DNA 표준을 기획, 모델링, 그리고 분석함에 있어서 이들의 유용성을 나타낸다.
실시예 39:
인공 염색체 및 천연 기준 게놈에 DNA 표준 및 천연 DNA 시료 라이브러리로 구성된 판독을 정렬시키는 한 가지 예시적인 방법이 실행되었다. 실시예 37에서 설명된 방법을 이용하여 만들어진 서열 파일 (.fastq)은 역다중화를 거쳤다. 낮은-정량적 판독 및 서열들 또는 어뎁터 오염 서열들은 제조업자의 지침에 따라 트림_갈로르(trim_galore)를 이용하여 서열 파일로부터 제거되었다:
(http://www.bioinformatics.babraham.ac.uk/projects/trim_galore/).
상기 인간 게놈 (hg19) 서열은 상기 인공 염색체 (chrT) 서열에 연계시켜 단일 파일 (.fasta)을 만들었다. 그 다음 우리는 제조업자의 지침(Langmead and Salzberg 2012)에 따라 복합된 서열 파일로부터 지표 파일(hg19_chrT_index.*)을 생성하기 위해 bwa 지표를 이용하였다. 그 다음 정렬(.bam) 파일을 만들기 위하여, 다음의 bwa를 이용하여 지표 파일에 판독을 정렬하였다 (Li and Durbin 2009):
>bwa mem-M hg19_chrt.bwa sequence.read1.fq sequence.read2.fa >alignments.sam.
시퀀싱 오류는 판독 정렬과 상기 인공 염색체 서열 사이의 염기-단계(base-wise) 불일치를 만들 수 있다. 시퀀싱 품질을 평가하기 위하여 서열 오류 정렬을 분석할 수 있다. 예를 들면, 시퀀싱 오류 비율은 서열화된 100nt 당 시퀀싱 오류의 평균 수를 나타낸다. DNA 표준이 GM12878 DNA 시료에 추가된 이 실시예에서 판독의 0.67%는 도 29A에서 설명된 오류성 불일치를 포함한다고 결정한다. 시퀀싱 오류 분포는 또한 도 29B에서 설명된 바와 같이, 판독에 걸쳐 서열 오류의 분포를 나타낸다.
그 다음 하기에서 설명되고, 표 6에서 요약된 다수의 메트릭스에 따라 상기 인공 염색체 및 천연 인간 (hg19) 게놈에 서열화된 판독의 정렬을 평가하였다.
게놈/인공 염색체에 대한 판독은 상기 인공 염색체 및 인간 게놈에 정렬되는 판독 수다. 예를 들면, GM12878 시료의 경우, 상기 인공 염색체에 2,029,597개 판독을, 그리고 인간 게놈 서열에 458,521,347개 판독을 정렬하였다.
분획 희석은 게놈에 대한 상대적인 인공 염색체에 정렬된 판독 분율이며, 시료 라이브러리에 대한 표준의 희석을 나타낸다. (Fraction Dilution). GM12878 시료의 경우, 라이브러리의 0.4%는 상기 인공 염색체에 정렬되며, 이는 250-배 희석 인자를 나타낸다.
정렬 민감도는 중첩 정렬(참 양성)을 인공 DNA 표준 염기의 총수 (참 양성 및 가 음성)로 나눈 인공 DNA 표준 염기의 크기로 정의된다. GM12878 시료의 경우, 염기-관련 정렬 민감도는 0.849로 관찰되었다.
정렬 특이성은 중첩 정렬 (참 양성)을 중첩 정렬을 갖는 염기(참 양성 및 가 양성)의 총 수로 나눈 인공 DNA 표준 염기의 수로 정의된다. GM12878 시료의 경우, 염기-관련 정렬 특이성은 0.961이다.
탐지 한계는 판독 정렬이 없고, 상기 서열화된 라이브러리 안에서 신뢰성있게 탐지되지 않는 최대 풍도의 DNA 표준에 상응한다. GM12878의 경우 탐지 한계는 0.0037 아타몰/ul이다.
실시예 40:
공동결합된 DNA 표준으로부터 피펫팅 오류를 산출하는 한 가지 예시적인 방법이 실행되었다. 여기서 우리는 공동결합된 DNA 표준으로 피펫팅 오류를 어떻게 산출하는지를 설명하고, 피펫팅 오류의 산출이 얼마나 정확한 지를 입증한다. 이것은 피펫팅 및 다른 원천으로부터의 변이로 인한 공지 수준의 변이를 요구한다. 이를 위해, 먼저 실시예 38에서 기술한 바와 같이 동일한 조합으로 복합된 DNA 표준으로부터의 서열 라이브러리를 기초하여 피펫팅 및 다른 소스로 인한 변이량을 시뮬레이션 하였다. 피펫팅 오류로 인한 변이는 모든 DNA 표준의 평균 풍도에 대한 개별 DNA 표준의 풍도의 차이로 정의되었다. 이것은 피펫팅으로 인해 예상되는 변이 (variation)로 명명되며, 공동결합된 단일 DNA 표준을 함께 포함하는 개별 DNA 표준 간에 동일하며, 의존적이다. 이를 테면, 라이브러리 준비 및 시퀀싱와 같은 다른 출처로 인한 변이는 동일한 DNA 표준 혼합물 C로부터 준비된 기술적인 복제본 서열의 분석에 의해 결정되었다. 변이는 DNA Flat 믹스(mix)의 기술적 복제 사이에 표준화된 풍도의 차이에 상응한다. 다른 출처로 인한 예측된 변이는 독립적이며, 단일 공동결합된 DNA 표준을 함께 포함하는 개별 DNA 표준간에 상이하다. DNA 표준 혼합물의 관찰된 풍도에 두 가지 출처의 변이를 다음과 같이 포함시켰다:
관찰된 풍도 = 예측된 풍도 x 피펫팅으로 인한 예측된 변이 x 기타 출처로 인한 예측된 변이
본 실시예의 경우, DNA 표준으로부터 유도된 판독은 실시예 38에서 이미 설명된 바와 같이 시뮬레이션되었다. 판독 풍도는 표 7에서 나타낸 것과 같이 공동결합된 DNA 표준의 공지된 풍도에 따라 할당되었다. 도 31A에서 설명된 바와 같이, 각 DNA 표준에 대한 예측된 풍도에 대하여 관찰된 풍도를 플롯하였다. 이것은 하나의 공동결합된 DNA 표준을 함께 포함하는 개별 DNA 표준에 의해 나타난 특징적 의존적 선형 기울기 분포를 입증한다. 분명한 것은, 도 31B에서 나타난 바와 같이, 비록 불규칙적이지만 의존적 풍도를 나타내는 함께 공동결합된 다수 DNA 표준은 피펫팅으로 인한 열외자(outliers)의 용이한 식별 및 누락을 가능하게 한다.
DNA 표준의 관찰된 풍도로부터 다음과 같이 피펫팅 변이를 산출하였고 (도 31B에서 설명됨); 각 공동결합된 DNA 표준의 경우, 6개의 개별 DNA 표준을 통하여 (Y-절편은 0으로 제한하고, 가중치는 1/Y2으로 하는 비-선형 회귀) 최상의 적합 선을 우선 플롯하였다. 하나로부터 선 기울기의 편차는 피펫팅 부정확성에 비례한다. 예를 들면, 공동결합된 DNA 표준 A의 경우, 기울기는 1.188로 관찰되는데, 이로부터 공동결합된 DNA 표준 A의 추가적인 18%는 피펫팅 오류로 인하여 추가되었다는 것을 예상한다. 모든 공동결합된 DNA 표준에 대한 산출은 표 7에 요약된다. 예측된 피펫팅 변이에 대한 산출된 피펫팅 변이의 비교는 이 접근법을 이용할 때 평균 마진 3% 이내의 피펫팅으로 인한 오류를 추정한다는 것을 나타낸다.
다음으로 다음과 같이 산출된 변이에 의해 각 공동결합된 DNA 표준 측정을 표준화함으로써, 피펫팅으로 인한 변이를 최소화시킬 수 있다. 공동결합된 DNA 표준의 선형 분포를 우선 1의 기울기로 강제한다(도 31A, B에서 설명됨). 이것은 DNA 표준의 예측된 풍도와 관찰된 풍도 간의 상관관계 (Pearson's r)를 0.99로 향상시킨다 (표준화없이 DNA 표준을 독립적으로 측정하는 경우, 상관관계 0.987과 비교하여; 도 31B). 피펫팅 오류에 대한 표준화에 의해 정량적 정확도의 개선은 공동결합된 DNA 표준간의 변이 계수가 16.13에서 0.73으로 ~10-배 감소됨으로써 입증된다 (도 31C에서 예시됨). 이를 통하여 사용자는 피펫팅 변동 및 다른 출처로인한 변이 양으로 인하여 변이 및 부정확도를 산출하고, 측정 신뢰도를 향상시킬 수 있다.
실시예 41:
DNA 표준 풍도를 정량화하는 한 가지 예시적인 방법이 실행되었다. 우선 DNA 표준에 의해 나타나는 인공 염색체의 각 영역의 빈도를 측정하였다. 길이의 표준화에 따라, 관찰된 각 DNA 표준에 킬로베이스당 백만 판독수 (RPKM)를 지정하였다. 정량적 정확도를 평가하기 위하여 각 DNA 표준의 공지 농도(아타몰/ul)과 비교하여 측정된 DNA 표준 풍도를 플롯팅하였다(도 28A에서 설명됨). 따라서, 상기 DNA 표준 정량화는 상관관계 (Pearson's r)로 측정되어, 관찰된 DNA 풍도와 예측된 풍도 간의 일치 표시를 제공한다. 예를 들면, 실시예 37에서 GM12878 게놈 DNA 시료를 이용하여 미리 준비된 DNA 표준의 상관관계는 0.94임을 관찰하였다. 이 기울기는 상기 DNA 표준의 역동 범위에 걸쳐 예측되는 풍도에 대해 관찰된 것의 선형 비례를 나타낸다. GM12878 시료와 혼합물 A로 복합된 DNA 표준의 경우, 기울기는 1.01이다. 결과는 표 6에 요약된다.
실시예 42:
DNA 표준에서 유전적 변이를 확인하는 한 가지 예시적인 방법이 실행되었다. 실시예 40에서 설명된 방법들을 이용하여 준비된 정렬 파일 (.sam)은 다음과 같이 SAMtools (Li, Handsaker et al. 2009) 및 Picard 툴을 이용하여 우선 사전-프로세싱되었다:
>java -jar CreateSequenceDictionary.jar R=hg19_chrT.fa O=hg19_chrT.dict
>samtools faidx hg19_chrT.fa >hg19_chrT.fai
>java -jar SortSam.jar INPUT=alignments.sam OUTPUT=alignments.sort.bam\
SORT_ORDER=coordinate
>java -jar ReorderSam.jar INPUT=alignments.sort.bam\
OUTPUT=alignments.sort.reorder.bam REFERENCE=hg19_chrT.fa
>java -jar BuildBamIndex.jar INPUT=alignments.sort.reorder.bam
그 다음 다음의 디폴트 매개변수들을 이용하여 유전적 변이를 확인하기 위하여, Unified Genome Haplotype caller를 포함한 공개된 최상의 행위 (http://www.broadinstitute.org/gatk/guide/best-practices)에 따라 GATK toolkit (McKenna, Hanna et al. 2010)을 이용하였다:
>java -jar GenomeAnalysisTK.jar -T HaplotypeCaller -R hg19_chrT.fa\
-I alignments.sort.reorder.bam --genotyping_mode DISCOVERY\
--defaultBaseQualities 30 -o variants.vcf
본 명세서에서 기술하는 방법은 상기 인공 염색체 상의 변이를 동시에 확인할 뿐만 아니라, GM12878 게놈 DNA와 기준 인간 게놈 간에 있는 변이도 확인해준다. 다음을 이용하여 상기 인공 염색체에서 변이체 식별 수행능을 평가할 수 있다.
묻힌 변이(Variants Covered)는 정렬 적용 범위를 갖는 유전적 변이의 비율에 상응한다. 예를 들면, 정렬은 GM12878 DNA 시료를 동반하는 DNA 표준에서 변이 경우의 490개 (88%)를 중첩한다.
변이 민감도는 정확하게 확인된 변이 수(참 양성)를 상기 DNA 표준 안에 나타나는 전체 변이 수(참 + 가 음성)으로 나눈 값으로 정의된다. 이것은 시퀀싱 심도와 변이 탐지 모두에 의존적이다. 예를 들면, GM12878 시료의 경우, 변이 민감도는 0.65이다.
변이 탐지(Variant Detection)는 변이 민감도를 묻힌 변이로 나눈 것으로 정의되며, 이것은 시퀀싱 심도 또는 적용범위에 독립적인 변이 탐지를 제공한다. 예를 들면, GM12878 시료의 경우 변이 효율은 0.73이다.
변이체 특이성은 정확하게 확인된 변이 (참 양성)의 수를 탐지된 총 변이 수 (참 양성 + 가 음성)로 나눈 것으로 정의된다. 예를 들면, GM12878 시료의 경우 변이 특이성은 0.57이다.
중간 품질 평가 점수(Median Quality Score)는 변이가 이 부위에 PHRED 확률 규모(scaled probability)로 정의되며, 각 확인된 변이에 할당될 수 있다. GM12878 시료의 경우, 정확한 변이 콜에 대한 중간 품질 평가 점수는 1,803이며, 한편 잘못된 변이 콜에 중간 품질 평가 점수는 61이다(도 28E에서 설명됨).
이들 결과는 표 6에 요약된다. 서술 통계는 상기 DNA 표준 안에 나타나는 변이의 특정 하위 세트로 제한될 수 있다. 예를 들면, 우리는 상기 DNA 표준 안에 삽입을 탐지하는 민감도를 결정할 수 있다.
도 30A에서 설명된 바와 같이 인공 염색체 상에 잘못된 변이 콜은 정확한 콜보다 더 낮은 품질 평가 점수를 나타내고, 이것은 GM12878 게놈에서 동반된 변이 식별에서 잘못된 변이 식별을 구별해내는데 있어서 품질 평가 점수의 유용성을 나타낸다. 유사하게, 특이적 뉴클레오티드 치환들 (C에서 A로 그리고 T에서 G로)은 특히 잘못된 변이에서 많다는 것을 관찰하였고, 이것은 이들 뉴클레오티드 변이는 추가 경고로 해석되어야 한다는 것을 제시한다(도 30B에서 예시됨).
변이를 정확하게 식별해내지 못하는 경우는 대개 불충분한 서열 적용범위로 인한 것일 수 있다. 변이의 확인에 대한 민감도 한계는 각 DNA 표준에 대하여 정확하게 할당된 변이 분획에 대하여 각 DNA 표준의 예측된 농도를 플롯팅함으로써, 도 28B, E에서 설명된다. 변이가 탐지되지 않는 최대 농도 DNA 표준은 동반 GM12878 게놈 시료 안에서 변이가 확실히 탐지될 수 있는 하한을 나타낸다.
다음으로 기준 및 변이 DNA 표준의 상대적 농도를 변화시킴으로써 생성된 상대적 대립유전자 빈도를 분석하였다. 상기 인공 염색체 상에서 확인된 115개 변이에 대한 관찰된 상대적 대립유전자 적용범위(GATK 결과 .vcf 파일에서 DP로 나타냄)에 예측된 상대적 대립유전자 빈도 (가령, 변이체 DNA 표준에 대한 기준 풍도 비율)를 플롯하였다. 도 28C에서 설명되는 이 플롯은 정확하게 확인된 대립유전자 최저 빈도는 1%이었으며, 정확한 변이 탐지는 0.088 아타몰/ul에 대하여 상기 풍도 이상의 DNA 풍도로 제한되었음을 나타낸다. >8 아타몰/ul의 적용 범위에 대해서만 대립 유전자를 한정시키면, 상관관계가 0.9574이며, 기울기는 0.9043으로 대립유전자 빈도 정량화가 향상되고, 이것은 희귀한 변이를 정확하게 탐지하고, 정량화하기 위하여 충분한 시퀀성 적용범위의 중요성을 반영한다.
우리는 동반 GM12878 게놈 DNA에서 변이체 식별을 유사한 서열 판독 적용범위를 갖는 DNA 표준에서 변이체 식별과 또한 비교할 수 있다. 예를 들면, 게놈 DNA 변이의 25번째-75번째 백분위수는 서열 적용범위를 3-6배까지의 적용범위로 나타낸다. 이 서열 적용범위는 평균 풍도 0.15 아타몰/ul를 갖는 5개 DNA 표준에 해당된다. 우리의 분석을 DNA 표준의 이 하위집단으로 한정시키면 GM12878 게놈에서 변이의 확인을 위한 민감도는 0.846, 특이성은 0.93이다.
실시예 43:
질환 시료와 정상적인 인간 DNA 시료 간의 DNA 표준에서 변이를 확인하는 한 가지 예시적인 방법이 실행되었다. 정상적인 폐와 선암 폐로부터 상업적 DNA는 Origene (CD563993, CR563976; Rockville, MD)에서 구입하였다 실시예 18에서 준비된 DNA 혼합물 A는 폐 선암 DNA 시료에 최종 1% 용적으로 추가되었으며, DNA 혼합물 B는 정상적인 폐 DNA 시료에 최종 1% 용적으로 추가되었다 (NanoDrop에 의해 결정됨). DNA 시료 및 라이브러리는 실시예 37에서 설명된 방법들을 이용하여 준비되었고, 서열화되었다. 실시예 41-42에서 설명된 방법들을 이용하여 판독들을 정렬하고, 분석하였다. 결과는 표 6에 요약된다.
DNA 시료는 이질적 빈도로 돌연변이를 품고 있을 수 있다 (이미 논의한 동형접합성/이형접합성 대립유전자 빈도와는 구별됨). 예를 들면, 특이적 돌연변이를 품고 있는 암 세포는 서열화된 시료의 오직 작은 비율만을 포함할 수 있다. 대립유전자 정량화의 정확도 및 민감도를 결정하기 위하여 도 30C, D에서 설명된 바와 같이, 예측된 대립유전자 빈도에 대하여 관찰된 대입유전자 빈도를 플롯하였다. 예를 들면, 폐 선암 시료는 상관관계 (Pearson's r) 0.91과 기울기 0.95를 갖는다. 이 검출 한계는 대립유전자가 확실하게 식별되는 하한 빈도를 나타낸다. 예를 들면, 이 실시예에서 검출 하한은 0.0019 아토몰/ul이다. 유사하게, 대립유전자 빈도는 시료 순도의 추정치를 제공하며, 표본 폐 선암 조직 안에서 1:100 대립유전자 빈도를 13-배 적용범위 또는 0.0082 아토몰/ul까지 분석할 수 있는 암세포의 비율을 추정할 수 있도록 한다.
실시예 44:
마우스 DNA 시료에 DNA 표준을 추가하는 예시적 방법. 마우스 간 조직은 4-월령 야생형 Swiss SWR/J 마우스로부터 얻었다. TRIzol (Invitrogen)을 이용하여 제작자의 지침에 따라 마우스 간 시료로부터 게놈 DNA를 추출하였다. 추출된 DNA 시료는 RNase A로 처리하고, Genomic DNA Clean & Concentrator 키트 (Zymo Research)로 클린업하였다. 정제된 DNA는 Nanodrop (Thermo Scientific) 상에서 정량화되었다. 실시예 18에서 준비된 DNA 혼합물 A는 마우스 DNA 시료에 최종 1% 용적으로 추가되었다 (NanoDrop에 의해 결정됨). DNA 시료 및 라이브러리는 실시예 37에서 설명된 방법들을 이용하여 준비되었고, 서열화되었다.
마우스 게놈 (mm10) 서열은 상기 인공 염색체 (chrT) 서열에 연계되어 단일 파일 (mm10_chrT.fa)을 만들었다. 그 다음 제조업자의 지침에 따라 복합된 서열 파일로부터 지표 파일 (mm10_chrT_index.*)을 생성하기 위해 보타이 지표를 이용하였다(Langmead and Salzberg 2012). 실시예 39에서 설명된 방법을 이용하여, bwa (Kim, Pertea et al. 2013)를 이용하여 지표 파일(mm10_chrT_index.*)에 서열화된 판독(.fastq)을 정렬하였다. 실시예 41에서 설명된 방법을 이용하여 DNA 표준의 정렬, 정량화 및 변이 탐지를 분석하였고, 도 28D에 설명하였다. 표 6에 요약된 결과들은 인간 및 마우스 게놈 DNA 모두에서 유사한 수준의 정렬 특이성, 민감도, 및 정량화를 나타내는데, 이것은 DNA 표준의 수행능은 마우스 DNA 시료의 추가 또는 마우스 게놈과의 동시 정렬에 영향을 받지 않음을 나타낸다.
실시예 45:
비-인간 게놈을 갖는 DNA 표준으로부터 서열화된 판독을 분석하는 한 가지 예시적인 방법이 실행되었다. DNA 표준이 다양한 생물 분기군(clades)의 범위로부터 다른 천연 게놈과 함께 사용되는 경우, 비교적 잘 수행되는지 여부를 결정했다. 동반 인공 염색체와 일련의 유기체 게놈에 대한 지표 구축은 실시예 35에서 이미 설명된 방법들에 의해 생성되었다. 그 다음 실시예 38에서 설명된 바와 같은 방법들을 이용하여 혼합물 C로 준비된 DNA 표준에 서열화된 판독을 정렬하였다. 서열 판독은 다음의 디폴트 매개변수들과 함께 보타이(bowtie) (Li and Durbin 2009)를 이용하여 각 유기체 게놈/인공 염색체 서열에 정렬되었다.
>bowtie2 -x *_chrT_index -1 MixtureC.R1.fq -2 MixtureC.R2.fq
이때 *는 유기체 게놈 (가령, Dm3, hg19 등등)에 상응함.
각 생성된 정렬 (.bam)의 경우, 상기 실시예 40에서 설명된 방법들을 이용하여 정렬 민감도 및 특이성을 결정하였다. 표 4에 요약된 이 결과는 DNA 표준 정렬이 동반 유기체 게놈에 관계없이 크게 변하지 않으며, DNA 표준이 다양한 유기체 DNA 시료 범위와 함께 사용될 때 비교적 잘 수행함을 나타낸다.
실시예 46:
DNA 표준에서 질환 연합된 유전적 변이를 확인하는 한 가지 예시적인 방법이 실행되었다. 실시예 22에 기재된 방법에 의해 만들어진 질환 관련 변이의 특정 사례를 나타내는 DNA 표준의 성능을 평가하기 위하여, 실시예 38에서 기술된 방법을 사용하여 서열화된 판독을 시뮬레이션하였다. 판독 풍도는 유전자형에 따라 비례하였다 (가령 이형접합성 또는 다양한 이질적 척도).
K562 세포계통은 TP53 Q139fs 돌연변이를 품고 있지만, BRAF V600E 돌연변이를 품고 있지는 않다. 실시예 37에서 준비된 K562 게놈 DNA로부터 라이브러리에 서열화된 판독을 부가하였다. 이형접합성을 모델링하는 DNA 표준은 동반 K562 게놈과 유사한 적용범위 (가령 10.4-배)를 갖도록 상기 판독은 총 용적의 1%로 추가된다. 서열 판독 (K562 및 DNA 표준)은 다음의 매개변수들과 함께 게놈에 정렬되었다:
>bwa mem -M hg19_chrAB K562.R1.fq K562.R2.fq >alignments.chrB5.sam
정렬은 실시예 42와 같이 준비되었으며, 다음의 매개변수들과 함께 Genome Analysis Toolkit (DePristo, Banks et al. 2011)를 이용하였다:
>java -jar ~/1000G/GenomeAnalysisTK.jar -T HaplotypeCaller -R hg19_chrAB\
-I alignments.chrB5.sam --genotyping_mode DISCOVERY
--defaultBaseQualities 30 -o variants.vcf
다음으로 변이 적용범위에 대하여 변이체 DNA 표준 및 동반 K562 게놈 DNA에서 각 변이의 심도 적용범위(GATK 결과 .vcf 파일에서 DP에 의해 나타냄)를 플롯하였다(도 7B에서 설명됨). 추가로, 도 7C에서 설명된 바와 같이 각 유전자형이 각 DNA의 공지 농도에 대하여 할당되는 신뢰도를 플롯하였고, 이로 인하여 104 배 역동 범위에 걸쳐 확인되는 신뢰도를 나타낸다.
야생형 세포 집단에 대한 돌연변이를 품고 있는 세포의 점차적으로 작은 하위-집단을 모델링하기 위하여, GM12878 게놈 DNA 라이브러리의 배경 (TP53 Q139fs 돌연변이를 포함하지 않는)에 대항하여 K562 세포계통 DNA 라이브러리 (TP53 Q139fs 돌연변이를 포함하는)를 적정하여, 105 역동 범위를 포괄하는 10-배 연속 희석을 만든다. 그 다음 실시예 39에서 설명된 방법들을 이용하여 인간 게놈/인공 염색체에 대하여 이와 같은 희석된 라이브러리를 정렬하였다. 상기 DNA 표준 및 동반 게놈 DNA 시료에서 확인된 질병-연관된 변이체의 비교는 도 7B에서 설명된다. V600E 및 Q139fs 돌연변이는 상기 변이체와 기준 DNA 표준이 동일한 풍도 (가령, 이형접합성 유전자형)에 있을 때, 정확하게 식별될 수 있고, 유사하게, 동반 K562 DNA 시료 안에서 Q139fs 돌연변이를 긴밀하게 확인할 수 있다는 것을 관찰하였다. 그러나, 변이체 DNA 표준이 기준 DNA 표준에 비해 10-배 희석되거나, 또는 동반 DNA 시료가 K562 DNA의 10-배 또는 그 이상의 희석을 포함할 때, Q139fs 돌연변이를 탐지할 수 없었다.
실시예 47:
DNA 표준에 의해 나타나는 구조적 변이체의 어셈블리를 위한 한 가지 예시적인 방법이 실행되었다. 상기 인공 염색체 (실시예 23에서 이미 설명됨) 상에 구조적 변이를 나타내는 DNA 표준은 K562 게놈 DNA 시료에 최종 1% 용적으로 추가되었다. DNA 시료 및 라이브러리는 실시예 37에서 설명된 방법들을 이용하여 준비되었고, 서열화되었고, 실시예 39에서 이미 설명된 방법을 이용하여 인공 염색체/인간 게놈에 정렬되었다.
상기 인공 염색체 상에 다음의 구조적 변이의 서열 적용범위를 프로파일하였고; 기준 인공 염색체에 대하여 635, 624 및 699 nt 길이의 역 DNA 서열을 포함하는 길이 1837, 1824 및 1899 (서열 번호: 171-173)의 3개 표준 DNA (도 32A에서 설명됨). 길이 1898, 1865 및 1896 (서열 번호: 174-176)의 3개 DNA 길이는 기준 인공 염색체에 대하여 길이 698, 665 및 696의 큰 DNA 서열 삽입을 포함하였다 (도 32B에서 설명됨). 길이 1200nt (서열 번호: 177-179)의 3개 DNA 길이는 기준 인공 염색체에 대하여 길이 651, 634 및 683nt의 큰 DNA 서열 결손을 포함하였다 (도 32C에서 설명됨). 길이 1200nt (서열 번호: 180-182)의 3개 DNA 길이는 기준 인공 염색체에 대하여 4개 반복 복제 x 96nt (380nt), 2개 복제 x 202개 (438nt) 복제 및 2개 복제 x 621nt의 큰 DNA 서열 텐덤 복제를 포함하였다 (도 32D에서 설명됨). 길이 1988, 1580 또는 1430nt (서열 번호: 183-185)의 3개 DNA 표준은 기준 인공 염색체에 대하여 이동 요소 반복 삽입을 포함하였다. 삽입된 반복 서열은 이미 설명된 바와 같이 luSx, MIRb, L2a 트랜스포존의 오래된 반복 단위에 일치되었다(도 32E에서 설명됨).
실시예 48:
복제-수 반복부의 측정을 보정하기 위하여 DNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. 실시예 23에 기재된 방법에 의해 만들어진 D4Z4 복제 수 변이를 나타내는 DNA 표준 성능을 평가하기 위하여, 실시예 38에서 기술된 방법을 사용하여 서열화된 판독을 시뮬레이션하였다. 판독 풍도는 실시예 23에서 기재된 바와 같이 복제 수 (10 - 150개 복제)에 따라 비례되었다.
실시예 37에서 설명된 방법을 이용하여 K562, GM12878, 폐 선암 및 정상적인 폐 DNA 시료의 라이브러리에 서열화된 판독을 추가하였다. 실시예 39에서 이미 설명된 바와 같이, bwa (Langmead and Salzberg 2012)를 이용하여 상기 인공 염색체 및 인간 (hg19) 게놈에 판독을 정렬하였다. 상기 DNA 표준의 관찰된 풍도 (백만개당 판독)은 도 33B에서 설명된 공지된 반복 복제 수에 대해 플롯되었고, 반복 복제 수의 정량화를 평가할 수 있다. 동반 인간 DNA 시료로부터 인간 게놈에서 D4Z4 반복 서열의 적용범위에 DNA 표본 복제 수를 비교하였다. D4Z4 반복 단위 (~3,301nt) 및 상기 DNA 표준의 크기 차이를 표준화한 후, DNA 표준에 비교함으로써 동반 환자 게놈에서 D4Z4 반복 단위의 수를 추정한다. 예를 들면, 도 33B에서 설명된 바와 같이, GM12878 게놈에서 161개 반복 복제를 추정한다.
실시예 49:
환경적 DNA 시료에 DNA 시료를 추가하는 한 가지 예시적 방법. 토양은 호주, 퀸스랜드의 왓슨 크리크(Watsons Creek)와 맹그로부 패치 부위에서 수집하였다. 화학적 분석 및 생물학적 분석 전, 토양 시료들은 4℃에 보관된다. 토양 시료의 게놈 DNA는 PowerSoil™ DNA 키트 (MoBio Laboratories, Carlsbad, CA, USA)를 이용하여 제조업자의 프토토콜에 따라 추출되었다. 모든 게놈 DNA는 Nanodrop (Thermo Scientific)에 의해 정량화되었다. 실시예 18에서 준비된 DNA 혼합물 A는 토양 DNA 시료에 최종 1% 용적으로 추가되었다 (NanoDrop에 의해 결정됨).
TruSeq DNA PCR-free Sample Prep Kit (Illumina)를 이용하여 제조업자의 지침에 따라 DNA 라이브러리를 준비하였다. 준비된 라이브러리는 Qubit (Invitrogen)에서 정량화되고, Agilent 2100 Bioanalyzer (Agilent Technologies) 상에서 검증된 후, 시료를 풀링(pooled)하였다. 125nt 쌍을 이룬-단부 서열 판독과 함께, HiSeq 2500 장치 (Illumina)를 이용하여 시퀀싱이 실행된다.
실시예 50:
미생물 게놈에 DNA 표준 판독을 정렬하는 한 가지 예시적인 방법이 실행되었다. HiSeq 2500 장치에 의해 만들어진 서열 (.fastq) 파일은 역다중화를 거쳤다. 낮은-정량적 판독 및 서열들 또는 어뎁터 오염 서열들은 제조업자의 지침에 따라 트림_갈로르(trim_galore)를 이용하여 제거되었다:
(http://www.bioinformatics.babraham.ac.uk/projects/trim_galore/)
실시예 39에서 이미 설명된 방법들을 이용하여 단일 지표 빌드를 만들기 위하여, 실시예 9에서 설명된 방법에 의해 만들어진 인공 미생물 게놈 모두를 복합하였다. 다음의 매개변수들과 함께 bwa (Li and Durbin 2009)를 이용하여 인공 미생물 게놈에 서열화된 판독을 정렬하였다:
>bwa mem -M ArtChr.bwa sequence.read1.fq sequence.read2.fa\ alignments.sam
인공 미생물 게놈에 정렬된 판독에 따라 인공 미생물 게놈에 대한 정렬 (.bam 파일)을 평가하였다. 예를 들면, 토양 시료 1에서 상기 인공 미생물 게놈에 4,317,629개 판독을 정렬하였다. 분획 희석(Fraction Dilution)은 전체 판독에 대하여 상기 인공 미생물 게놈에 정렬된 판독의 분획이다. 예를 들면, 토양 시료 1에서, 라이브러리 안에 판독의 5.6%가 상기 인공 미생물 게놈에 정렬되는데, 이는 17.1-배 희석 인자에 상응한다. 탐지 한계는 상기 서열화된 라이브러리 안에서 신뢰성있게 탐지되지 않는, 그리고 정렬 없는 최대 풍도의 DNA 표준에 상응한다. 토양 시료 1의 경우 탐지 한계는 1.0093이다. 민감도는 도 35C에서 설명된 바와 같이, 중첩 정렬을 갖는 DNA 표준 염기들의 수로 정의된다. 이것은 시퀀싱 심도와 정렬에 의존적이다. 예를 들면, 토양 시료 1에서 DNA 표준 염기의 80.2%는 중첩 정렬을 갖는다. 결과는 표 10에 요약된다.
실시예 51:
미생물 게놈 집단의 어셈블리를 보정하기 위하여 DNA 표준 판독을 이용하는 한 가지 예시적인 방법이 실행되었다. 우리는 Velvet(Zerbino and Birney 2008)을 이용하여 제조업자의 지침에 따라 데노보 서열 어셈블리를 실행하였다.
>velvet_1.2.10/velveth ./output 91 -sam soil.sam
>velvet_1.2.10/velvetg ./output -exp_cov auto -cov_cutoff 0 -scaffolding no
적용범위에 따라 콘틱 어셈블리를 평가하였고; 적용범위는 어셈블리된 콘틱에 의해 중첩되는 DNA 표준 크기의 비율이다. 이것은 시퀀싱 심도와 어셈블리 모두에 의존적이다. 예를 들면, 도 35D에서 설명된 바와 같이, 토양 시료 1에서 상기 DNA 표준의 31.9%를 커버하는 콘틱을 어셈블리하였다. 노드(Nodes)는 정확하게 어셈블리된 독특한 콘틱 (상기 DNA 표준에 일치되는)의 수다. 예를 들면, 토양 시료 1에서 20개 (36개중에서) 노드를 어셈블리하였다. N50 통계는 전체 어셈블리 (N50)에 대한 중앙 질량을 의미한다. 예를 들면, 토양 시료 1에서 508의 N50 통계를 결정하였다. 최대 콘틱 크기는 정확하게 어셈블리된 콘틱의 최대 크기다. 예를 들면, 토양 시료 1에서 상기 DNA 표준 전장의 92.1%에 상응하는 최대 904nt 까지 콘틱을 어셈블리하였다. 어셈블리에서 전체 염기 수는 DNA 표준에 정렬된 전체 판독 수에 대하여 정확하게 어셈블리된 콘틱에 대하여 정렬된 판독의 수다. 예를 들면, 토양 시료 1에서 어셈블리된 콘틱에 대하여 22.1% 판독을 정렬한다. 이들 결과는 표 10에 요약된다.
실시예 52:
미생물 게놈의 정량화를 보정하기 위하여 DNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. 정량화의 정확도를 평가하기 위하여, 각 어셈블리된 콘틱 의 공지된 농도(아타몰/ul)에 대하여 관찰된 풍도(RPKM)을 플롯하였다(도 36A, B에서 설명됨). 우선 DNA 표준에 의해 나타나는 인공 미생물 게놈의 각 영역의 빈도를 측정하였다. 길이의 표준화에 따라, 관찰된 각 DNA 표준에 킬로베이스당 백만 판독수 (RPKM)를 지정하였다. 정량적 정확도를 평가하기 위하여 각 DNA 표준의 공지 농도(아타몰/ul)과 비교하여 측정된 DNA 표준 풍도를 플롯팅하였다(도 35A에서 설명됨). 따라서, 상기 DNA 표준 정량화는 상관관계 (Pearson's r)로 측정되어, 관찰된 DNA 풍도와 예측된 풍도 간의 일치 표시를 제공한다. 예를 들면, 토양 시료 1로 준비된 DNA 표준의 경우, 상관관계는 0.96이며, 기울기는 1.061으로 관찰되었다. 결과는 표 10에 요약된다.
게놈 어셈블리는 충분한 시퀀싱 적용범위에 의존적이다(도 35A에서 설명됨). 도 35B에서 설명되는 것과 같이, 고농도의 DNA 표준은 전장의 서열 적용범위와 어셈블리를 나타내지만, 한편 예측된 낮은 농도의 DNA 표준은 대조적으로 빈약한 서열 적용범위와 저질 어셈블리를 보인다는 것을 관찰하였다. 이로써 동반 토양 시료 안에서 게놈들의 상대적 풍도에 따라 미생물 게놈의 예상 적용범위와 어셈블리를 결정할 수 있다.
실시예 53:
다수 환경적 DNA 시료 간의 차이를 측정하기 위하여 DNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. 실시예 49에서 이미 설명된 방법들을 이용하여 유기 함량이 낮은 3개 토양 시료와 비교를 위하여 유기 함량이 높은 3개 토양 시료로부터 DNA를 추출하였다. 실시예 18에서 준비된 DNA 혼합물 A는 유기 함량이 높은 3개 토양 시료에 최종 1% 용적으로 추가되었으며, DNA 혼합물 B는 유기 함량이 낮은 3개 토양 시료에 최종 1% 용적으로 추가되었다. DNA 시료 및 라이브러리는 실시예 49에서 설명된 방법들을 이용하여 준비되었고, 서열화되었다. 실시예 50-52에서 설명된 방법들을 이용하여 판독들을 정렬하고, 분석하였다. 결과는 표 10에 요약되고, 도 36A, B에서 설명된다.
도 36C에서 DNA 표준 배수-변화를 설명하기 위하여 낮은 유기 함량의 토양 시료에서 혼합물 B를 형성하는 DNA 표준의 관찰된 풍도에 대하여 높은 유기 함량의 토양 시료에서 혼합물 A를 형성하는 DNA 표준의 관찰된 풍도를 플롯하였다. 표 11에서 요약된 바와 같이, 상관관계는 0. 8328이며 (Pearson's r), 기울기는 1.149로 관찰되었는데, 이는 차등적 DNA 풍도가 측정되는 정확도를 나타낸다.
실시예 54:
환경적 DNA 시료 안에서 미생물 게놈의 정량화를 보정하기 위하여 DNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. 50 mL 폴리프로필렌 튜브에 건강한 남성의 분변 시료를 수거하였다. MoBio PowerFecal™ DNA Isolation Kit (MoBio Laboratories, Carlsbad, CA, USA)를 이용하여 제조업자의 프토토콜에 따라 분변 시료 (0.25 g)로부터 DNA가 추출되었다.
실시예 18에서 준비된 DNA 혼합물 A는 건강한 인간 대상의 2개 복제본 분변 시료에 최종 1% 용적으로 추가되었다 DNA 시료 및 라이브러리는 실시예 49에서 설명된 방법들을 이용하여 준비되었고, 서열화되었다. 실시예 50-52에서 설명된 방법들을 이용하여 판독들을 정렬하고, 분석하였다. 결과는 표 10에 요약되고, 도 36 D-F에서 설명된다.
실시예 51에서 설명된 방법들을 이용하여 DNA 표준의 어셈블리를 평가하였다. 예를 들면, 분변 시료 1에서 DNA 표준은 전체 판독의 0.89% (225 백만에서 2백만)을 포함하였다. 서열화된 판독은 상기 DNA 표준의 53.2%를 포괄하는 14개 콘틱으로 어셈블리되었다. 실시예 52에서 이미 설명된 방법을 이용하여 어셈블리된 DNA 표준 콘틱의 풍도를 측정하였다. 이것은 미생물 집단 분석에 정보를 제공하기 위하여 메타게놈의 정량화에 대한 내부 기준 시다리를 제공하며 (Singh, Behal et al. 2009) 표 10에 그 결과들을 요약한다. 예를 들면, 분변 시료 1의 경우 상관관계는 0.97, 기울기는 1.041이며, 이것은 어셈블리된 DNA 표준에 대한 높은 정량적 정확도를 나타낸다.
실시예 55:
PCR 증폭을 위한 주형으로 DNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. 포유류 면역글로불린 서열 다양성이 증폭되고, 서열화되는 이를 테면, 면역-레퍼토리 시퀀싱과 같은 앰플리콘 시퀀싱 방법에 DNA 표준이 이용될 수 있다. 실시예 25에서 설명된 방법들을 이용하여, 인공 TCRγ 클론형을 나타내는 DNA를 이미 제작하였다. DNA 표준은 제조업자의 지침에 따라 TCRγ 좌(Tube A 및 B에 존재하는)에 대한 범용 BIOMED2 프라이머 서열들 (van Dongen, Langerak et al. 2003)을 이용하여 PCR 증폭 (KAPA Biosystems)을 겪게 하였다. 증폭된 산물은 BioAnalyser (2100 High Sensitivity DNA Assay; Agilent)을 이용하여 분석되었다. BioAnalyser 추적에서 도 34에서 설명된 바와 같이, 모든 15개 TCRγ 클론형 DNA 표준으로부터 정확하게 크기의 750nt 산물의 증폭을 나타낸다. 이것은 면역-레퍼토리 시퀀싱 동안 PCR 증폭을 위한 주형으로 DNA 표준의 효용을 확인한다.
그 다음 TCRγ 클론형의 클론 집단을 모델화하기 위하여, 클론 T-ALL 세포의 10% gDNA와 건강한 성인의 PBMC에서 90% gDNA의 게놈 DNA 혼합물을 만들었다. 클론 T-ALL 세포계통, KARPAS 45 (Catalog N. 06072602, Human T-cell Leukaemia)는 Cell Bank Australia에서 구입하였다. KARPAS 45 세포는 European Collection of Cell Cultures 프로토콜 및 표준에 따라 배양되었다. 간략하게 설명하자면, KARPAS 45 세포는 37℃에서 5% CO2 하에 15% 태아 소 혈청 (FBS)이 보충된 RPMI 1640 배지 (Gibco®)에서 배양되었다. 게놈 DNA는 TRIzol (Invitrogen)을 이용하여 제작자의 지침에 따라 KARPAS로부터 추출하였다. 추출된 DNA 시료는 RNase A로 처리하고, Genomic DNA Clean & Concentrator 키트 (Zymo Research)로 클린업하였다. 정제된 DNA는 Nanodrop (Thermo Scientific) 상에서 정량화되었다. MoBio UltraClean 키트 (카탈로그 번호.12334-250)을 이용하여 건강한 성인의 PBMC로부터 게놈 DNA를 추출하였다. gDNA는 용액 TD3에 용리되었고, Nanodrop (Thermo Scientific) 상에서 분석되었다.
그 다음 상기 인공 TCRγ 클론형 DNA 표준은 혼합물의 전체 게놈 DNA 농도의 1%에서 추가되었다. 복합된 클론형 DNA 표준 및 T-ALL/PBMC 게놈 DNA 믹스 상에서 범용 BIOMED2 프라이머 서열들 (상기에서 설명된 바와 같이)을 이용하여 PCR 증폭 (KAPA Biosystems)을 실행하였다. PCR 앰플리콘은 Wizard® SV Gel 및 PCR Clean-Up System (Promega)을 이용하여 정제되었고, Nanodrop (Thermo Scientific) 상에서 정령화되었고, Agilent 2100 Bioanalyzer (Agilent Technologies)에서 확인되었다.
Nextera XT Sample Prep Kit (Illumina)를 이용하여 제조업자의 지침에 따라 PCR 앰플리콘으로부터 라이브러리를 준비하였다. 준비된 라이브러리는 Qubit (Invitrogen)에서 정량화되고, Agilent 2100 Bioanalyzer (Agilent Technologies) 상에서 검증된 후, 시료를 풀링(pooled)하였다. 125nt 쌍을 이룬-단부 서열 판독과 함께, HiSeq 2500 장치 (Illumina)를 이용하여 시퀀싱이 실행된다.
실시예 56:
포유류 면역글로불린 서열 다양성의 분석에서 DNA 표준을 이용하는 한 예가 실행되었다. 실시예 25에서 설명된 방법들에 의해 만들어진 인공 TCRβ 클론형을 나타내는 DNA 표준의 성능을 평가하기 위하여, ~750nt 앰플리콘 서열을 만들기 위하여, 우선 BIOMED-2 TCRβ 다중 프라이머 서열들 (Tubes A-C)(van Dongen, Langerak et al. 2003)을 이용하여 DNA 표준의 가상환경 PCR 증폭 (http://insilico.ehu.es/PCR/)을 실행하였다. 프라이머 결합 부위는 정확한 상보성이 요구되었고, 프라이머-특이적 증폭 편향은 없는 것으로 추정하였다. 그 다음 실시예 38에서 이미 설명된 방법들을 이용하여 앰플리콘 서열들로부터 서열화된 판독을 시뮬레이션하였다. 판독 풍도는 실시예 25에서 설명된 바와 같이 DNA 표준의 상대적 농도에 따라 할당되었다. 판독은 3명의 건강한 인간 대상에서 TCRβ 좌의 이미 공개된 실험 앰플리콘 시퀀싱 라이브러리 (.fastq)에 1% 분획으로 추가되었다 (Zvyagin, Pogorelyy et al. 2014). 이 데이터는 접속 ID: SRP028752로 NCBI Short Read Archive (SRA)로부터 검색되었다. 이들 3개 라이브러리는 건강한 성인 인간 대상에서 TCRβ 클론형 프로파일을 나타낸다. 인간 라이브러리 파일은 MiTCR을 이용하여 제작자의 권장 (Bolotin, Mamedov et al. 2012)에 따라 분석된다.
각 라이브러리의 경우, 표 8에 요약된 다음 매트릭스를 결정하였다. 인간 게놈/인공 TCRβ 클론형에 정렬된 판독 수 및 상기 DNA 표준에 정렬된 판독 수. 인간 대상 A에 대한 이 실시예에서 인공 TCRβ 클론형에 정렬된 25,191개 판독을 관찰한다. 상기 인공 TCRβ 클론형에 정렬된 판독 분획은 인간 대상 A에 대한 1%의 희석 인자를 나타낸다. 검출 한계는 라이브러리에서 서열화된 판독에 의해 탐지되지 않는 최대 풍도 DNA 표준을 나타내고, 역동 범위는 라이브러리에서 서열화된 판독에 의해 탐지되는 최대와 최저 풍도 DNA 표준 간의 배수 차이를 나타낸다. 클론 민감도(Clone Sensitivity)는 상기 인공 TCRβ 클론형이 정확하게 할당된 DNA 표준의 비율을 나타낸다. 이것은 Vβ, Dβ, Jβ 세그먼트 할당의 정확도 및 삽입/결손의 탐지를 또한 포함할 수 있다.
상관관계 및 기울기에 의한 TCRβ 클론형 풍도 측정의 정확도를 확인하기 위하여 공지된 농도에 대하여 인공 TCRβ 클론형의 관찰된 빈도를 플롯한다 (표 8에 요약된 결과). 건강한 인간 대상에서 천연 TCRβ 클론형에 대하여 인공 TCRβ 클론형의 풍도는 도 13E에 설명된다. 건강한 인간 대상에서 천연 TCRβ V, J 및 D 세그먼트에 대한 인공 TCRβ V, J 및 D 세그먼트 용도의 풍도가 도 13F에서 설명된다.
실시예 57:
16S rRNA 계통발생적 프로파일링의 분석에서 DNA 표준을 이용하는 한 예가 실행되었다. 표 9에서 나타낸 바와 같이, 다양한 분류군, 크기, GC 함량 및 rRNA 오페론 카운트를 나타내는 6개 상이한 인공 미생물 게놈으로부터 16S rRNA 유전자와 일치되는 길이 1018nt의 6개 DNA 표준 (서열 번호: 161-166)을 만들었다. 상기 DNA 표준은 16S rRNA 유전자의 V3 영역에서 추가 측면 250nt 서열과 2개의 범용 16S 프라이머가 중첩되도록 기획된다. 16S DNA 표준은 독특한 앰플리콘 서열을 만들기 위하여 PCR 증폭을 위한 주형을 만든다. 범용 16S 프라이머 서열들과 함께 가상환경 PCR 증폭 (http://insilico.ehu.es/PCR/)을 실행하였다. 이것은 각 DNA 표준으로부터 독특하고 분명한 앰플리콘을 만들었다. 도 11에서 나타낸 바와 같이, (i) 인공 집단 안에 미생물 게놈의 시작 풍도, 그리고 (ii) 인공 미생물 게놈 안에 rRNA 오페론 복제 수에 따라 각 앰플리콘 풍도가 할당되었다. 앰플리콘 풍도는 프라이머 결합 효율에 의해 또한 영향을 받을 수 있는데, 차등적 프라이머 결합 효율은 16S DNA 표준을 이용하여 확인하고, 표준화할 수 있다. 그러나, 이 분석을 위하여 PCR 증폭에서 편향이 없는 것으로 추정하였다. 그 다음 실시예 38에서 이미 설명된 방법들을 이용하여, 16S DNA 표준으로부터 서열화된 판독 라이브러리를 만들었다. 판독 풍도는 의도된 앰플리콘 농도에 따라 할당되었고, 서열화된 판독 라이브러리는 상기 인공 미생물 집단의 16S 프로파일링으로부터 생성된 서열화된 판독 라이브러리와 복합되었다. 도 11B에서 설명된 바와 같이, 의도된 농도에 대하여 16S DNA 표준의 관찰된 풍도를 플롯하였다. 도 11C에서 설명된 바와 같이, rRNA 오페론 수는 인공 미생물 게놈의 풍도를 완전하게 표준화시키는데 요구된다. 이것은 검출 한계를 나타내는데, 이 이하에서는 동반 시료에서 임의의 미생물 게놈이 확실하게 검출되지 않을 수 있다.
실시예 58:
시퀀싱에서 GC 편향을 보정하기 위하여 DNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. ~27%, 68% 및 74% GC 함량 (서열 번호: 140-148)에 상응하는 3개 상이한 집단으로 구별되는 9개 DNA 표준을 기획하고, 제작하였다. 모든 DNA 표준은 GC-Meta 표준 간에 길이-특이적 편향을 최소화하기 위하여 유사한 길이 (1,000nt)를 가진다. 실시예 38에서 이미 설명된 방법들을 이용하여 단일 혼합물을 만들기 위하여 동일한 농도에서 9개 DNA 표준을 복합하였다. 이 혼합물은 호주, 퀸스랜드의 왓슨 크리크(Watsons Creek)와 맹그로부 패치 부위에서 수집된 토양으로부터 수거된 DNA에 총 용적의 1%로 추가되었다. 복합된 DNA 시료는 실시예 49에서 설명된 방법들을 이용하여 라이브러리로 준비되었고, 서열화되었다.
우선 bwa (Li and Durbin 2009)를 이용하여 인공 미생물 게놈에 서열화된 판독을 정렬하였다:
>bwa mem -M chrt.bwa sequence.read1.fq sequence.read2.fa/>alignments.sam
도 37에서 설명되는 바와 같이, GC 함량에 대하여 정렬된 판독의 풍도를 플롯하였다. 비교를 위하여, 상기 DNA 표준으로 부터 일치된 길이 및 빈도로 시뮬레이션된 판독을 만들었다. 서열화된 그리고 시뮬레이션된 판독의 비교는 도 37A-C에서 설명된 바와 같이, 높은 GC- 및 AT-풍부한 표준의 언더-시료링을 나타낸다. 관찰된 풍도와 예측된 풍도에서 차이는 DNA 정량화에서 GC-의존적 편향의 영향을 최소화하기 위하여 표준화를 알려줄 수 있다.
실시예 59:
면역-레퍼토리 시퀀싱을 보정하기 위하여 TCRγ 클론형을 모방한 합성 DNA 표준을 이용하는 한 가지 예시적인 방법이 실행되었다. TCRγ (TCRG)는 이것이 만드는 상대적으로 제한된 클론 유형으로 인하여 클론성 분석에 우선적인 표적이다. 이 실시예에서 다중 PCR 및 면역-수용체 시퀀싱 동안 합성 TCRG 표준을 기획하고, 제작하고, 그리고 이용하였다.
기준 인간 게놈 (hg19; 도 12)에서 TCRG 좌로부터 10개 Vγ 세그먼트, 5개 Jγ 세그먼트 및 2개 Cγ 세그먼트 그리고 측면 인트론 서열을 검색하였다. 각 세그먼트 또는 인트론 서열은 Carlson et. al. 2013에서 설명된 바와 같이 포워드 및 역 프라이머 서열에 상보적인 서열을 제외하고, 별도로 역전되고, 그리고 셔플되어 공지된 천연 서열들에 대한 상동성이 제거되었다. 그 다음 모든 포워드 및 리버스 프라이머 조합에서 합성 TCRG 세그먼트를 복합하였다. PCR 증폭을 통한 판독이 지체되도록 기획된 GC 풍부한 하나의 헤어핀 서열에 각 산재된 세그먼트들이 함께 결합되었다. 그 다음 상기 서열들은 합성된 4개의 더 큰 서열들(서열 번호: 203-206)로 복합되었다. 서열들은 4부분 GeneArt (Life Technologies)에서 합성되었고, pMA-RQ 벡터 안으로 삽입되었다. TCRG 표준의 4개 부분은 NEBuilder® HiFi DNA Assembly Master Mix (New England Biolabs)를 이용하여 pUC19 안에 하나의 연속 서열로 결찰되었다. 최종 14.4kb 플라스미드는 50 mL 배양물에서 성장되었고, 정제되고, 그리고 DNA 서열 검증에 이용되었다. TCRG 표준 합성의 경우, 최종 플라스미드는 SapI로 절단되었고, 12kb 단편은 Zymoclean™ Gel DNA Recovery Kit (Zymo Research)에 의해 겔 추출되었다.
클론성 T-ALL 세포계통, KARPAS 45 (카탈로그 번호 06072602, Human T-cell Leukaemia)는 European Collection of Cell Cultures 성장 프로토콜 및 표준에 따라 배양되었다. 간략하게 설명하자면, KARPAS 45는 37℃에서 5% CO2 하에서 15% 태아 소 혈청 (FBS)이 보충된 RPMI 1640 배지(Gibco®)에서 배양되었다. 게놈 DNA (gDNA)는 TRIzol (Invitrogen)을 이용하여 제작자의 지침에 따라 KARPAS 45로부터 DNA를 추출하였다. 추출된 DNA 시료는 RNase A로 처리하고, Genomic DNA Clean & Concentrator 키트 (Zymo Research)로 클린업하였다. 정제된 DNA는 Qubit 2.0 Fluorometer (Life Technologies) 상에서 BR dsDNA Qubit Assay를 이용하여 정량화되었다. 건강한 성인 PBMC의 gDNA가 배경으로 이용되었다. 간략하게 설명하자면, gDNA는 MoBio UltraClean 키트 (Catalog No.12334-250)를 이용하여 제조업자의 지시에 따라 추출되었고, 용액 TD3에 용리되었다. 정제된 gDNA는 Nanodrop (Thermo Scientific) 상에서 분석되었고, Qubit 2.0 Fluorometer (Life Technologies) 상에서 BR dsDNA Qubit Assay을 이용하여 정량화되었다.
생물학적 배경에서 합성 TCRG 표준의 민감도, 재현성 및 정량적 정확성을 시험하기 위해, T-ALL 클론 세포 (KARPAS 45)로부터 gDNA 혼합물은 건강한 성인의 PBMC gDNA (TCRG 유전자형의 복합 배경을 포함)의 gDNA와 함께 10, 1 및 0.1% 최종 농도로 희석되었고, 그리고 표 12에서 설명된 바와 같이, 10% 합성 TCRG 표준이 만들어졌다. 개별적으로 준비된 혼합물은 VF 및 JR 프라이머 풀(pool), KAPA HiFi HotStart Ready Mix (KAPA Biosystems)의 동일한 몰 비율이 포함된 다중 PCR 반응에서 제조업자의 추전에 따라 주형으로 이용되었다. 다중 PCR 반응에서 PCR 산물은 DNA Clean & Concentrator™-5 (Zymo Research)를 이용하여 정제되었다. 상기 정제된 PCR 산물은 BR dsDNA Qubit Assay를 이용하여 Qubit 2.0 Fluorometer (Life Technologies)에서 정량화되었고, 그리고 Agilent High Sensitivity DNA Kit (Agilent Technologies)와 함께 Agilent 2100 Bioanalyzer에서 실증되었다.
Nextera XT Sample Prep Kit (Illumina®)를 이용하여 제조업자의 지침에 따라 DNA 라이브러리를 준비하였다. 준비된 라이브러리는 Qubit (Invitrogen)에서 정량화되었고, Agilent High Sensitivity DNA Kit (Agilent Technologies)와 함께 Agilent 2100 Bioanalyzer에서 실증되었다. 라이브러리는 임상 게놈을 위하여 Kinghorn Centre에서 HiSeq 2500 (Illumina®) 상에서 서열화되었다.
시퀀싱 파일 수령시, 다음 매개변수들을 이용하여 모든 가능한 실제 그리고 합성 TCRG를 포함하는 지표에 판독이 정렬되었다:
bowtie2 -p 12 -x tcrg_combs -1 10TALL_TCRGstds1.1.fq -2 10TALL_TCRGstds1.2.fq -S 10TALL_TCRGstds1.combs.sam
우선 합성 TCRG 표준을 합성하였다. 우선 정렬 빈도에 따라 각 합성 표준의 상대적 풍도를 결정하였다. 모든 프라이머 조합으로부터 산물이 생성되었고, 시퀀싱되어 이들 기능에 대한 긍정적인 제어 지표를 제공한다는 점에 주목했다.
프라이머 조합의 정량적 효율을 평가하기 위하여 서열화된 앰프리콘의 상대적 풍도를 또한 이용할 수 있다. 모든 앰플리콘 주형은 단일 서열로부터 유도되기 때문에, 시작 주형 풍도는 획일적이며, 따라서 다중 혼합물에서 차이는 프라이머 효율이나 프라이머 풍도에서 차이를 반영할 것이다. 따라서, 정렬 빈도에 따라 각 합성 표준의 상대적 풍도의 매트릭스를 어셈블리하였다 (표 12). 이 매트릭스는 PCR 반응 내에서 각 프라이머 쌍의 상대적 수행능을 나타낸다. 예를 들면, J1 역 프라이머와 조합하여 V11 포워드 프라이머는 평균보다 4.1배 더 저조하게 수행하며, 한편 JP1 역 프라이머와 조합하여 V9 포워드 프라이머는 평균보다 2.15-배 이상 더 잘 수행한다. 이것은 동반 시료에서 TCRG 클론형의 정량화를 조정하는데 이용될 수 있는 표준화 인자를 제공한다.
분명한 것은, 이 표준화 인자는 다중 프라이머 혼합물 안에서 프라이머 혼성화 및 상대적 프라이머 농도를 한정하는 온도를 포함하는 동일한 조건에 있는 내부 합성 제어로부터 산출된다. 따라서, 그 다음 동반 혼합물에서 TCRG 클론형의 상대적 풍도를 결정하였다. 일부 클론형은 이 라이브러리에 없지만, 우리는 이들이 상기 RNA 시료 안에 없었다고 결론내릴 수 있다 (그 이유는 상기 합성 표준으로 각 프라이머를 이미 실증하였기 때문이다). 그 다음 상기 합성 표준으로부터 산출된 표준화 인자에 따라 각 TCRG 클론형의 상대적 농도를 조정하였다. 따라서, 본 명세서에서 설명된 합성 DNA 표준은 면역 레퍼토리 서열들의 분석을 위한 NGS 방법의 유용한 검증을 제공한다.
실시예 60:
공동결합된 합성 표준이 정량적 DNA 사다리로 이용되는 한 가지 예시적인 방법이 다음과 같이 실행되었다. 상기에서 설명된 바와 같이, 피펫팅에서 오류는 다수 표준 풍도 간의 변이의 원인이 될 수 있다. 피펫팅 오류를 제거하기 위하여, 개별 DNA 표준은 함께 결합될 수 있다. 이러한 경우, 차등적 복제 수는 차등적 풍도를 얻는다. 개별 표준 간의 의존적 변이를 이용하여 피펫팅에서 변이로 인한 오류를 산출할 수 있고, 대체 표준 간의 정확한 빈도를 확인할 수 있다.
다음의 포멧으로 공동결합된 표준을 기획하였다(도 39에서 요약됨). 각 600nt인 다수 개별 DNA 표준 (A, B, C 및 D)을 기획하였다. 그 다음 이들 DNA 표준은 ABB 또는 CDD 포멧으로 조직화되었고, 그 다음 1개 복제 A; 2개 복제 B; C의 4개 복제 및 D의 8 복제 (서열 번호: 207-290)를 포함하는 하나의 연속 서열로 함께 결합될 수 있다. 추가적으로, 개별 DNA 표준 간에 I-Sce I 제한 절단 부위를 주관하는 작은 링커 서열을 더 추가하였다. 이것은 피펫팅 후 제한 절단에 의해 다수 표준으로부터 개별 표준을 해방시킬 수 있고, 이로 인하여 피펫팅으로 인한 변이 없이 개별 표준 혼합물을 만들 수 있도록 한다.
ABB 및 CDD 형태로 복합된 반복부를 포함하는 서열들은 Gene Art (Life Technologies)에 의해 개별적으로 합성되었다. 각 공동결합된 표준은 한 개의 ABB와 4개의 CDD로 구성된다. NEBuilder® HiFi DNA Assembly Master Mix를 이용하여 제작자의 프로토콜에 따라 pUC19-FAFB (FAFB 필러(filler) 서열을 가진 pUC19) 안에 상기 5개 단편이 결찰되었다. 각각 공동결합된 표준의 최종 플라스미드, 가령, pUC19-FAFB-GA98은 EcoRI 및 BamHI로 절단되며, 후속적으로 Zymoclean™ Gel DNA Recovery Kit (Zymo Research)로 겔 추출되어, 10.4kb의 공동결합된 DNA 표준이 획득된다.
21개의 모든 공동결합된 DNA 표준의 농도는 BR dsDNA Qubit Assay를 이용하여 Qubit 2.0 Fluorometer (Life Technologies) 상에서 측정되었다. 공동결합된 DNA 표준 혼합물은 복합되어 확실하게 최종 혼합물을 만들기 위하여 epMotion 5070 epBlue™ 소프트웨어 프로그램을 이용하여 106 -배 농도 범위에 이르는 혼합물을 만들었다.
그 다음 혼합물 A는 GM12878 세포계통에서 추출된 전체 gDNA와 함께 최종 농도 10%로 추가되었다. GM12878은 Madhavi Maddugoda (Epigenetics Research Group, Garvan Institute of Medical Research)에서 제공되었다. GM12878 세포들은 Coriell Cell Repositories 성장 프로토콜 및 기준에 따라 배양되었다. 간략하게 설명하자면, GM12878은 37℃에서 5% CO2 하에 10% 태아 소 혈청 (FBS)이 보충된 RPMI 1640 배지(Gibco®)에서 배양되었다. TRIzol (Invitrogen)을 이용하여 제작자의 지침에 따라 GM12878 및 마우스로부터 DNA를 추출하였다. 추출된 DNA 시료는 RNase A로 처리하고, Genomic DNA Clean & Concentrator 키트 (Zymo Research)로 클린업하였다. 정제된 DNA는 Nanodrop (Thermo Scientific) 상에서 정량화되었다.
Nextera XT Sample Prep Kit (Illumina®)를 이용하여 제조업자의 지침에 따라 DNA 라이브러리를 준비하였다. 준비된 라이브러리는 Qubit (Invitrogen)에서 정량화되었고, Agilent High Sensitivity DNA Kit (Agilent Technologies)와 함께 Agilent 2100 Bioanalyzer에서 실증되었다. 라이브러리는 임상 게놈을 위하여 Kinghorn Centre에서 HiSeq 2500 (Illumina®) 상에서 서열화되었다.
다음과 같이 공동결합된 합성 표준으로부터 서열화된 판독을 분석하였다. 다음의 매개변수들을 가진 지표 (각각 개별 표준을 포함)에 서열화된 판독을 우선 정렬하였다:
bowtie2 -x conjoined_sequences -1 NGSreads.1.fq -2 NGSreads.2.fq -S output.sam
그 다음 정렬 빈도에 따라 각 개별 표준의 상대적 풍도를 결정하였다. 가중된-표준화된 측정된 풍도와 비교하여 각 개별 표준(공동결합된 표준 안에 호스팅(hosting) 공동결합된 표준과 복제수 농도 모두로부터 유도된)의 가중된 표준화된 공지된 농도를 플롯하였다(도 39). 이는 피펫팅에서 변이도를 나타내었다. 예를 들면, 예상보다 더 큰 농도에서 혼합물에 복합된 눈에 띄는 열외자 공동결합된 표준을 관찰하였다 (도 39B에 나타냄). 이 열외자가 공동결합된 표준 안의 모든 표준에 균등하게 영향을 미친다고 가정한다면, 상기 열외자는 대체 기술 변수보다는 피펫팅으로 인한 것이므로, 따라서 추가 분석 전에 제거될 수 있음을 나타낸다.
표준의 공지된 농도와 측정된 풍도 간의 상관관계는 0.9451로 결정하였다. 그 다음 공동결합된 표준 안에 모든 개별 표준이 기울기 1을 나타내도록 조정하였다 (상기에서 상세하게 설명됨). 조정은 표준 분포를 개선시켰고, 열외자에 대하여 조정되었으며, 상관관계를 0.9806로 향상시켰으며 (도 39C), 이것은 상기 DNA 표준의 정량적 정확도가 개선되었음을 나타낸다.
실시예 61:
융합 유전자 사건들을 모방하는 합성 표준을 이용하는 한 가지 예시적인 방법이 다음과 같이 실행되었다. 융합 유전자 사건들은 많은 인간 암에 기여하지만, 그러나, RNA 시퀀싱 방법들을 이용하여 이를 식별해내는 것은 어려울 수 있다. 합성 RNA 표준을 사용하여 융합 유전자를 에뮬레이트할 수 있고, 이로 인하여 융합 유전자를 탐지하는 능력을 평가할 수 있다. 이 실시예에서 RNA 시퀀싱 방법을 보정하기 위하여 합성 융합 유전자 표준을 설계, 제조 및 사용했다.
24개의 정상적인 유전자 (상기 실시예 36에서 언급된 RNA 표준 목록으로부터)를 선택했다. 그 다음 각 유전자의 인트론 안에 융합 부위를 할당하고, 12개 상호간 전좌 사건들을 에뮬레이팅하기 위하여 부위들을 짝지었다. 그 다음 이들 12개 사건들은 24개 융합 유전자에 대한 서열을 만들었다 (각 전좌는 2개의 상호간 융합 유전자를 만든다;서열 번호: 291-314 및 도 40 참고).
발현 벡터 안에 관리되는 융합 유전자 서열을 만들기 위하여, 제조업자의 프로토콜에 따라 NEBuilder® HiFi DNA Assembly Master Mix (New England Biolabs)를 이용하였다. 간략하게 설명하자면, 40 μL 분획의 α-Select Silver Efficiency 화학적으로 컴피턴트 대장균(E. coli) (Bioline)은 얼음 위에서 해동시키고, 제조업자의 제안된 프로토콜에 따라 2 μL의 희석된 NEBuilder® HiFi DNA 어셈블리된 산물로 형질변환시켰다. 형질변환된 세포들은 예열된 100 μg/mL 암피실린 플레이트 상에 도말하였고, 37℃에서 하룻밤 동안(18시간) 항온처리되었다. 각 플레이트로부터 하나의 콜로니를 이용하여 100 μg/mL 암피실린이 포함된 5mL LB 브로스에 접종하였다. 항온처리된 튜브는 37℃의 교반기 안에서 하룻밤 동안 항온처리되었다. 플라스미드들은 Qiagen Spin Miniprep Kit를 이용하여 단리되었다. 정제된 플라스미드들의 서열은 Sanger 시퀀싱으로 실증되었다.
합성 RNA 표준을 만들기 위하여, 시험관내 전사 반응을 이용하였다. RNA 합성의 경우, 각 플라스미드는 EcoRI-HF (New England Biolabs)로 선형화되고, 이어서 단백질분해효소 K로 처리되었다. 상기 선형화된 플라스미드는 Zymo ChIP DCC 컬럼 (Zymo Research)을 이용하여 클린업되었다. 시험관내 전사 반응을 실행하여 RNA 전사체들을 합성하였다. 전장의 RNA 전사체들은 MEGAscript® Sp6 키트 (Life Technologies)를 이용하여 제조업자의 지침에 따라 합성되었다. 상기 RNA는 RNA Clean & Concentrator-25 컬럼 (Zymo Research) 을 이용하여 제작자의 >200nt 프로토콜에 따라 정제되었다. 정제된 RNA 전사체들은 RNA Nano 키트 (Agilent Technologies)를 사용하여 Agilent 2100 Bioanalyzer 상에서 실증되었고, 이들은 재고 목록을 구성하였다.
합성 융합-유전자 표준을 희석하여 서로 간에 그리고 정상적인 모계 유전자 간의 발현에서 역동 범위가 포함된 106 배수 농도 범위에 걸친 혼합물이 형성되었다. 모든 RNA 융합 전사체들의 농도는 Qubit 2.0 Fluorometer (Life Technologies, Carlsbad, CA, USA) 상에서 측정되었다. 상기 RNA 융합 전사체들은 epMotion 5070 epBlue™ 소프트웨어 프로그램을 이용하여 풀링하여 자동기계적으로 106 -배 농도 범위에 걸친 최종 혼합물을 어셈블리한다. 이것은 최종 혼합물 스톡을 만들었다.
융합 유전자 합성 표준 혼합물은 2개 인간 세포-타입, K562 및 GM12878로부터 유도된 천연 RNA 시료 안에 고정되었다. K562 및 GM12878 세포들은 Coriell Cell Repositories 성장 프로토콜 및 기준에 따라 배양되었다. 간략하게 설명하자면, K562 및 GM12878은 37℃, 5% CO2 하에서 10% 태아 소 혈청 (FBS)이 보충된 RPMI 1640 배지 (Gibco®)에서 배양되었다. 전체 RNA는 TRIzol (Invitrogen)을 이용하여 제작자의 지침에 따라 K562 및 GM12878로부터 전체 RNA를 추출하였다. TURBO DNase (Life Technologies)를 이용하여 각 시료에서 DNase 처리를 하였고, 이어서 RNA Clean 및 Concentrator-25 Kit (Zymo Research)를 이용하여 클린업하였다. 전체 RNA는 Agilent Bioanalyzer 2100 상에서 러닝되어 무손상(intactness)을 평가하였고, Nanodrop (Thermo Scientific) 및 Qubit (Life Technologies)를 모두 이용하여 농도를 결정하였다. RNA 온전성 수 (RIN) > 8.0인 RNA만 라이브러리 준비에 이용하였다.
K562 RNA는 공지된 BCR-ABL 융합 유전자를 포함한다. 1:1, 1:10 및 1:100 배 비율에서 GM12878에 대한 K562 RNA의 희석 비율을 만들었다. 1 μg의 복합 RNA를 각 라이브러리 준비에 이용하였다. 라이브러리 준비에 앞서, RNA 융합 표준은 K562 및 GM12878의 혼합물의 전체 RNA 농도의 10%로 추가되었다. 상기 RNA 혼합물은 Ribo-Zero™ Magnetic Kit (인간/마우스/렛) (Epicentre)을 이용하여 리보-고갈되었다(ribo-depleted). 상기 리보-고갈된 RNA를 이용하여 Illumina® platforms (KAPA Biosystems)의 KAPA Stranded RNA-Seq Library Preparation Kit를 이용하여 제작자의 프로토콜에 따라 라이브러리를 만들었다. 시퀀싱을 위하여 시료를 풀링하기 전, 준비된 라이브러리는 Qubit 2.0 Fluorometer (Life Technologies, Carlsbad, CA, USA)상에서 HS dsDNA Qubit Assay을 이용하여 정량화되며, 그리고 Agilent 2100 Bioanalyzer (Agilent Technologies)에서 실증되었다.
다음과 같이 서열화된 판독을 분석하였다: 우선, 서열화된 판독은 다음과 같이 융합-조사 옵션이 가능한 Tophat2 정렬기를 이용하여 합성 염색체와 인간 게놈 서열 (hg38)을 포함하는 지표에 정렬되었다:
tophat --fusion-search -G gencode.v23.annotation.chrT_rna.gtf hg38.chrT 100K_RFMXA.1.fq 100K_RFMXA.2.fq
그 다음 생성된 정렬 파일 (accepted_hits.bam)과 fusion.out 파일을 프로세싱하여 합성 유전자 성능을 평가하였다. 19개 (24개중) 융합 유전자를 정확하게 확인하였으며, 한편 남아있는 5개의 미확인된 융합 유전자는 7.557 아타몰/μl 이하의 풍도를 나타내었고, 이것은 이 실험에서 융합-유전자 발견에 대한 민감도 한계를 나타낸다.
그 다음 이 혼합물 안에서 융합 유전자의 공지 농도에 대한 융합 정션을 가로 지르는 적용 범위를 플롯하였다. Pearson의 상관관계는 0.9652이며, 기울기는 1.166인 선형 상관관계를 관찰하였으며, 이것은 융합 유전자 적용범위가 융합 유전자 발현의 적합한 척도를 제공한다는 것을 나타낸다 (도 40 참고). 척도로써 합성 융합 유전자를 이용하여, ~21 개 판독은 FG1_12_P2 융합 유전자에 정렬되며, 이것은 K562 RNA 시료 안에서 BCR-ABL 유전자에 정렬되는 ~16개 판독과 유사하다는 것을 알았고, 이것은 동반 시료(여기에서 K562 RNA는 ~10%로 희석됨)에서 융합 유전자의 발현이 ~1.6 아토몰/μl로 낮다는 것을 나타낸다.
실시예 62:
생식계열 변이를 모방하는 합성 표준을 이용하는 한 가지 예시적인 방법이 다음과 같이 실행되었다. 이배수체 인간 게놈에서 생식계열 변이는 대개 동형접합성 및 이형접합성 대립유전자 빈도에서 발생된다. 동형접합성 유전자형은 단일 DNA 표준으로 나타낼 수 있지만, 한편 동일한 빈도의 2개 대립유전자를 포함하는 이형접합성 변이는 2개 DNA 표준을 필요로 한다. 2개 이상의 대립유전자는 한 집단에 존재할 수 있고, 각 대립유전자를 나타내는 새로운 DNA 표준이 요구된다. 그러나, 인간 게놈은 이배수체이기 때문에 (가령, 각 상염색체의 2개 복제가 있다), 개별 인간의 이배수체 게놈을 모방하기 위하여 임의의 한 시점에서 오직 2개 표준만 요구될 것이다.
이를 설명하기 위하여, 동일한 (가령, 이형접합성) 또는 단일 (가령, 동형접합성) 농도에서 138개 대체 단일 뉴클레오티드 변이체 (SNVs)를 나타내는 DNA 표준을 복합하였다. 자동기계적으로 최종 혼합물을 만드는 epMotion 5070 epBlue™ 소프트웨어 프로그램을 이용하여 상기 DNA 표준을 풀링하였다. 그 다음 GM12878 인간 세포계통으로부터 추출된 게놈 DNA에 상기 DNA 표준을 추가하였다. TRIzol (Invitrogen)을 이용하여 제작자의 지침에 따라 GM12878 및 마우스로부터 DNA를 추출하였다. Nextera XT Sample Prep Kit (illumina®)를 이용하여 제조업자의 지침에 따라 DNA 라이브러리를 준비하였다. 준비된 라이브러리는 Qubit (Invitrogen)에서 정량화되었고, Agilent High Sensitivity DNA Kit (Agilent Technologies)와 함께 Agilent 2100 Bioanalyzer에서 실증되었다. 라이브러리는 임상 게놈을 위하여 Kinghorn Centre에서 HiSeq 2500 (illumina®) 상에서 서열화되었다. 그 다음 디폴트 매개변수들과 함께, BWA MEM (Li and Durbin 2009)를 이용하여 인간 게놈 (hg38) 및 합성 염색체에 서열화된 판독을 정렬하였다. 최상의 방법에 따라 Genome Analysis Toolkit (GATK)을 이용하여 결과적으로 생성된 정렬이 분석되었다. 30-배 적용범위에서, 합성 염색체 안에 89%의 동형접합성과 71%의 이형접합성 SNPs를 확인하였다 (도 41A). 이 변이체 탐지의 민감도는 동반 NA12878 게놈과 유사하고, 이것은 이미 설명된 변이체 주석에 대하여 비교함으로써 86%의 동형접합성과 63%의 이형접합성 SNPs 를 확인하였다(Zook, J.M. et al., 2014).
실시예 63:
체세포 돌연변이를 모방하는 합성 표준을 이용하는 한 가지 예시적인 방법이 다음과 같이 실행되었다. 체세포 돌연변이는 다수의 상태를 뒷받침할 수 있는데, 암에서 종양생성 돌연변이가 그중 가장 중요하다. 주어진 개별 모든 세포에 존재하고, 동형접합성 또는 이형접합성인 생식계 돌연변이와 달리, 체세포 돌연변이는 종양 시료 안에서 단지 세포의 일분획(하위-클론 집단)에 존재할 수 있고, 종양 게놈에서 빈번한 재배열 및 복제수 변이에 의해 또한 혼동될 수 있다. 예를 들면, 종양은 혈통에 따라 독특한 유전자형을 보유하는 다수의 클론 세포 집단을 포함할 수 있다. 그 결과, 체세포 돌연변이는 광범위한 상이한 빈도에 걸쳐 존재할 수 있다.
광범위한 범위에 걸쳐 138개 체세포 돌연변이를 나타내는 DNA 표준의 용도를 설명하기 위하여, 1:2 (가령, 이형접합성) 내지 1:4096의 대립유전자 빈도의 척도를 확립하기 위하여 기존 대립유전자에 대하여 2-배 일련 희석에 걸쳐 DNA 표준을 복합하였다 (도 42A). 실시예 62에서 설명된 방법들을 이용하여 DNA 표준이 준비되고, 혼합되고, NA12878 게놈 DNA에 추가되고, 서열화되었다. 라이브러리는 임상 게놈을 위하여 Kinghorn Centre에서 HiSeq 2500 (illumina®) 상에서 서열화되었다. 그 다음 디폴트 매개변수들과 함께, BWA MEM (Li and Durbin 2009)를 이용하여 인간 게놈 (hg38) 및 합성 염색체에 서열화된 판독을 정렬하였다. 그 다음 결과적으로 생성된 정렬은 디폴트 매개변수들과 함께 VarScan2 (Koboldt et al. 2009) 를 이용하여 분석함으로써, 상기 DNA 표준에 의해 나타나는 유전적 변이를 확인하고, 그리고 이들의 상대적 빈도 (가령, 변이체 대립유전자 빈도)를 정량화하였다.
이들의 측정된 빈도에 대하여 변이체의 공지 농도를 플롯하였다 (도 42B). 이것은 변이체가 상이한 대립유전자 빈도에서 확인되는 정확도, 예측된 농도와 측정된 풍도 간의 상관관계의 정확도를 나타내고, 이것은 우리가 변이체 대립유전자 빈도를 측정하는 정량적 정확도, 그리고 변이체를 확인하고, 이들의 빈도를 정확하게 측정할 수 있는 민감도의 한계를 나타낸다. 대립유전자 빈도의 척도는 동반 시료 안에 클론 하위-집단의 상대적 크기를 평가할 수 있는 기준을 제공한다.
높은 25,000-배 적용범위에서, 2개 변이체를 제외한 모든 것을 뒷받침하는 최소한 하나를 확인할 수 있었고, 이때 이들 두 변이체는 모두 가장 희귀한 대립유전자 분획에 속한다 (1/4096; 도 42B). 그러나, 이 적용범위에서 DNA 표준에서 시퀀싱 및 정렬 오류에 의해 만들어진 >2000의 잠재적 가-양성 변이체 콜을 또한 찾았고, 이것은 변이체 후보를 추가로 여과하기 위한 요건을 나타낸다. 그 다음 따라서, 필수적 민감도 및 특이성에 따라 p-값 (VarScan2에 의해 수행된 기준 및 변이체 대립유전자를 뒷받침하는 판독 수에 대한 Fisher's Exact Test를 포함) 역치를 실험적으로 결정하는데 DNA 표준을 이용하였다. 예를 들면, 1 x 10-6 p-값 역치는 체세포 변이체를 확인하기 위한 민감도 54%의 민감도와 82%의 특이성을 제공한다. 그러나, 이 엄격성을 적용하면 분석의 민감도를 1/128의 대립유전자 빈도로 한정시킨다 (가령, 1% 미만의 빈도; 도 42C, D).
실시예 64:
복합 유전자형을 모방하는 합성 표준을 이용하는 한 가지 예시적인 방법이 다음과 같이 실행되었다. 더 복잡한 유전자형은 염색체 이수배수체의 경우 또는 다수 개별 유전자형이 동시에 표본추출될 때 발생될 수 있다. 예를 들면, 임산부 혈액에서 순환하는 DNA를 고려한다면, 2개의 중첩되는 유전자형, 태아(모계와 부계 대립유전자 모두를 구성)와 엄마(2개의 모계 대립유전자를 구성)를 검출한다. 태아 대립유전자는 태아로부터 유래된 순환 DNA의 분획과 함께 동형접합성 및 이형접합성 대립유전자 빈도에 따른 농도 범위에 걸쳐 관찰될 수 있다 (이것은 임신 기간 동안 모계의 순환 DNA의 약 1-40%로 변화될 수 있다). 대립유전자 빈도는 염색체 이수성에 의해 더 복합해질 수 있는데, 이때 상염색체는 이를 테면, 가장 일반적인 유전적 비정상인 3염색체증 21을 이용하여 비-이수성 빈도에서 존재한다. 예를 들면, 염색체 21에서 변이를 나타내는 DNA 표준은 3염색체증 21를 에뮬레이션하기 위하여 다른 상염색체 상에 변이를 나타내는 DNA 표준보다 1.5-배 더 높은 빈도로 추가된다. 따라서, 상기 DNA 표준에 의해 제시되는 대립유전자 빈도는 (i) 유전자형 빈도 (가령, 이형접합성 또는 동형접합성) (ii) 순환하는 태아 및 모계 DNA의 상대적 풍도, 그리고 (iii) 태아 게놈안에 복제-수 변이 (이를 테면, 염색체 이수성)의 조합을 반영한다.
태아 및 모계 유전자형 ( 기준 및 변이체 모두; 서열 번호: 315-434)의 성좌(constellation)를 나타내는 120개 DNA 표준을 기획하였다. 각 표준은 일반적으로 혈액 순환에서 관찰되는 DNA 단편 크기에 상응하는 ~160nt 길이이다. 그 다음 DNA 표준은 임신한 엄마의 혈액 안에서 순환하는 태아 및 모계 DNA의 상대적 풍도를 에뮬레이팅하기 위하여 다양한 농도로 복합되었다 (도 42E). 예를 들면, 이형접합성 유전자형을 나타내도록 동일한 농도의 2개 태아 DNA 표준을 복합한 후, 모계 DNA 표준에 10% 분획 농도로 이들 두 표준을 복합하고, 혈액으로부터 남아있는 90%의 순환하는 DNA가 혈액으로부터 검색되었다.
이를 더 설명하기 위하여, 120개 상이한 변이체 사건들을 나타내는 DNA 표준 혼합물로부터 시뮬레이션된 라이브러리를 만들었다 (상기 실시예에서 설명된 방법들을 이용) 이 혼합물은 상이한 태아 DNA 부하 범위 (0, 1, 10, 25 및 50%)에 걸쳐 4개의 상이한 유전자형 조합 (태아 및 모계 동형접합성과 이형접합성) 범위를 포괄하며, DNA 표준의 하위집단은 3염색체증 21을 에뮬레이팅하기 위하여 추가 1.5-배 농축에서 추가된 인간 염색체 21의 변이를 나타낸다. 그 다음 디폴트 매개변수들과 함께, BWA MEM (Li and Durbin 2009)를 이용하여 합성 염색체에 서열화된 판독을 정렬하였다. 그 다음 결과적으로 생성된 정렬은 디폴트 매개변수들과 함께 VarScan2 (Koboldt et al. 2009) 를 이용하여 분석함으로써, 상기 DNA 표준에 의해 나타나는 유전적 변이를 확인하고, 그리고 이들의 상대적 빈도 (가령, 변이체 대립유전자 빈도)를 정량화하였다. 관찰된 유전자형 빈도에 대하여 예측된 빈도의 플롯팅은 동반 시료에서 태아 변이체가 측정될 수 있는 기준 척도를 제공하고, 태아 유전자형 및 염색체 이수성의 결정을 알려준다.
실시예 65:
주형 서열의 역전에 의해 표준을 만드는 다음과 같은 한 가지 예시적인 방법이 실행되었다. 특히, 다음 실시예는 인코드된 단백질에서 미스센스 치환 (V617E) 의 원인이 되며, 암과 연관된 JAK2 유전자 (COSM12600)의 1,849nt에서 발생되는 치환 돌연변이 (G>T)를 에뮬레이트 하기 위하여 어떻게 DNA 표준이 기획되는지를 설명한다.
DNA 표준을 만들기 위하여, ~200nt 측면 서열을 따라 기준 및 변이체 대립유전자 모두를 우선 검색하였다. 인간 게놈 안에 원래 좌에 대한 상동성을 방지하기 위하여, 우리는 상기 서열을 역전시켰다. COSM12600 기준 대립유전자를 나타내는 DNA 표준의 역전된 DNA 서열은 서열 번호: 435이며, 변이체 대립유전자는 서열 번호: 436에서 설명된다.
그 다음 우연으로 인하여 인간 게놈에 대한 상당한 상동성을 유지하는 DNA 표준 안에 있는 하위-서열을 확인하였다. 상당한 상동성 (E-값 > 0.01)을 갖는 DNA 표준 서열의 35nt의 작은 영역을 확인하였다 (TTCTGATTCCTTTTTTTTTTCATGTTTCTTAACA (서열 번호: 437)). 그 다음 이 서열은 (i) 셔플링에 의해 변형되고, 이로 인하여 뉴클레오티드는 상동성을 제거하기 위하여 새로운 순서로 셔플되고 (예를 들면 CTTATTTTTTTCATTCTGTTCCTATATTTTCGAT (서열 번호: 438)) (ii) 치환에 의해 변형되고, 이로 인하여 모든 G는 C로 치환되고, 모든 C는 G로 치환되고, 모든 A는 T로 치환되고, 모든 T는 A로 치환되었다 (예를 들면 GAATAAAAAAAGTAAGACAAGGATATAAAAGCTA (서열 번호: 439)). 이 경우에서, 셔플링은 원래 서열과 동일한 뉴클레오티드 함량을 유지시키지만, 임의의 서열 반복성을 제거하였고, 한편 치환은 서열 반복성을 유지시키지만, 뉴클레오티드 조성을 변화시킨다 (그러나, 피리미딘 및 퓨린의 상대적 함량은 유지됨). COSM12600 기준 대립유전자를 나타내는 DNA 표준의 최종 DNA 서열은 서열 번호: 440이며, 변이체 대립유전자은 서열 번호: 441에서 설명된다.
임의의 돌연변이들에 대한 DNA 표준을 기획하기 위하여 유사하게 이 방법을 이용할 수 있다. 설명을 위한 예로써, BRAF (COSM476; 서열 번호: 442, 서열 번호: 443), KRAS (COSM521; 서열 번호: 444, 서열 번호: 445), IDH1 (COSM28746; 서열 번호: 446, 서열 번호: 447), EGFR (COSM6224; 서열 번호: 448, 서열 번호: 449), FGFR3 (COSM715; 서열 번호: 450, 서열 번호: 451), PIK3CA (COSM775; 서열 번호: 452, 서열 번호: 453), MYD88 (COSM85940; 서열 번호: 454, 서열 번호: 455), KIT (COSM1314; 서열 번호: 456, 서열 번호: 457), CTNNB1 (COSM5664; 서열 번호: 458, 서열 번호: 459), NRAS (COSM584; 서열 번호: 460, 서열 번호: 461), DNMT3A (COSM52944; 서열 번호: 462, 서열 번호: 463) 및 FOXL2 (COSM33661; 서열 번호: 464, 서열 번호: 465)에 돌연변이를 포함하는, 임상적으로 중요한 다양한 돌연변이를 나타내도록 DNA 표준을 만들었다.
실시예 66:
주형 서열의 역전에 의해 소규모 또는 대규모 유전적 변이를 모방하는 표준을 만드는 다음과 같은 한 가지 예시적인 방법이 실행되었다. 더 큰 구조적 유전적 사건, 이를 테면, 결손 또는 삽입을 나타낼 때, 상기 서열 반복성 및 돌연변이 주변 구조를 유지시키는 것이 중요할 수 있는데, 그 이유는 큰 변이체의 구조 해석을 위하여 국소 판독 정렬이 상당히 중요할 수 있기 때문이다. 따라서, DNA 표준을 만들기 위하여 주형 서열의 역전 및/또는 치환은 큰 구조적 변이체를 제시하고, 천연 큰 구조적 변이에서 관찰되는 흔한 복합 구조 및 반복적 서열 구조를 유지시키는 특별히 유익한 방법을 제시한다.
이 실시예는 EGRF 유전자에서 17nt 결손 (GAATTAAGAGAAGCAA (서열 번호: 466); COSM6223)을 에뮬레이팅하기 위하여 어떻게 DNA 표준이 기획되는 지를 설명한다. 우리는 200nt의 서열 측면과 기준 및 변이체 (가령, 17nt 결손을 갖는) EGRF 서열을 우선 검색하였다. 그 다음 상기 서열을 3'에서 5'로 역전시키고, 둘째 우연히 인간 게놈에 대한 상동성을 유지하는 (서열 역전에도 불구하고) 임의의 뉴클레오티드를 치환하였다. EGRF 결손 (COSM6223)을 나타내는 최종 DNA 표준 서열은 서열 번호: 467 (기준) 및 서열 번호: 468 (변이체)에서 제시된다.
중요한 것은, 삽입 사건을 나타내는 DNA 표준은 삽입 중단점 부위의 측면에 있는 서열의 역전 (3'에서 5'로) 뿐만 아니라 중단점에 삽입된 서열의 역전도 요구한다. 이를 설명하기 위하여 ERBB2 유전자에서 발생되는 14nt 삽입 (COSM20959)을 나타내는 DNA 표준을 기획하였다. 이 경우에서, 돌연변이의 측면 200nt 서열 뿐만 아니라 변이체 삽입 서열 (CATACGTGATGGC (서열 번호: 469))을 검색하였다. 그 다음 기준 서열 및 변이체 서열 (상기 삽입을 포함하는)이 역전되었고, 우연에 의해 인간 게놈에 대한 상동성을 유지하는 임의의 부분 서열의 뉴클레오티드는 후속 치환되었다. ERBB2 삽입을 나타내는 최종 DNA 표준 서열은 서열 번호: 470 (기준) 및 서열 번호: 471 (변이체)에서 제시된다.
설명을 위한 예로써, EGFR (COSM6223; 서열 번호: 472, 서열 번호: 473), IL7R (COSM214586; 서열 번호: 474, 서열 번호: 475), IL6ST (COSM251361; 서열 번호: 476, 서열 번호: 477), KIT (COSM1326; 서열 번호: 478, 서열 번호: 479) 유전자에서 삽입 및 결손을 포함하는, 임상적으로 중요한 다양한 구조적 변이체를 나타내도록 DNA 표준을 만들었다.
당업자는 본 명세서에서 설명된 내용은 구체적으로 기술된 것 이외의 변이 및 변형이 있을 수 있음을 인지할 것이다. 명세서는 이러한 모든 변이 및 변형을 포함한다는 것을 인지할 것이다. 본 명세서는 또한 본 명세서에서 개별적으로 또는 전체적으로 언급되거나 지시된 모든 단계, 특징, 조성물 및 화합물, 및 상기 단계 또는 특징 중 임의의 것 및 모든 조합 또는 임의의 둘 또는 그 이상을 포함한다. 당업자라면, 본 명세서의 넓은 범용 범위를 벗어나지 않고 상술 한 실시예들에 대해 다양한 변형 및/또는 수정이 이루어질 수 있음을 이해할 것이다. 따라서, 본 실시예들는 모든 면에서 예시적이고 제한적이지 않은 것으로 간주되어야한다. 기능적으로 동등한 산물, 조성물 및 방법은 본원에 기재된 바와 같이 본 발명의 범위 내에 포함된다.
[표 1]
[표 2]
[표 3]
[표 4]
[표 5]
[표 6]
[표 7]
[표 8]
[표 9]
[표 10]
[표 11]
[표 12]
참고 문헌:
SEQUENCE LISTING
<110> Garvan Institute of Medical Research
<120> Sequencing controls
<130> 170111
<150> AU2014905092
<151> 2014-12-16
<150> AU2015903892
<151> 2015-09-24
<160> 479
<170> PatentIn version 3.5
<210> 1
<211> 761
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic DNA standard
<400> 1
gatttaggtg acactataga agtggtcgcg ggagggcggg tggggccctt gagtgccggc 60
gaacgggctg tgcgcggggg cgtaggttga gaagcgatgg tgaagagccc tcacggaagg 120
ggcgggggcg gacgagccac ggggccctcg agtgcccagc ggcgcgggcg caggtccgcc 180
gccacacgcc ctccctcccg agggcgggac aggcaggcca cacggattcg cgccatgtcg 240
gcgcacggag aggactcctt aggcgcacta cgggccggct ttggggtgtc tcctctggaa 300
ggacttttta cgcgcgccgc cgcgagtagg cgcagagctc ccggcaggtc tgtgtcgagg 360
tttggcacac agtcggggtt gaccggccat gcaacctcgt aacgccggcc caaggctgcc 420
cggggacttg ggtgttaagt cgtggtcctc gggcgtcgct ctcagtttcc ctcgtaggcc 480
ttccaaaggg tcggcaccgg gcagcgcaca agatagctcg ggagcacacg gacacacccc 540
cgatgagtgg ttgcgctacg gggcacgata ccattctgag atgcgcctct tgtacccgga 600
acggatccgc acagtatggc cctctgcctt gtgctcctgg tcattaccgc agatcctaac 660
cggggagccc aagtaccgat cgaacctgcc tccggtatat gcgtatccaa gtacttgatc 720
gatacaaaaa aaaaaaaaaa aaaaaaaaaa aaaaagaatt c 761
<210> 2
<211> 843
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 2
gatttaggtg acactataga aggccacacg gattcgcgcc atgtcggcgc acggagagga 60
gttatataag cgggactctg acagatggct aggtgttcag ggcgcggggt gttgacagca 120
aggttctccg gggggccgga caagcgctat ggcgcgtgac tgcgttgctg gcggcctcca 180
tcacaaggac tggacccggg gcccgtgggc ttggatcctg caggagttct cgcttgagct 240
attcgccaca atccacgccg gcttcgggct taaccgacgg cctccggact aagggccttg 300
cccccgtgtg gcccccggca cgagagctct cttgtgctcc ttaggcgcac tacgggccgg 360
ctttggggtg tctcctctgg aaggactttt tacgcgcgcc gccgcgagta ggcgcagagc 420
tcccggcagg tctgtgtcga ggtttggcac acagtcgggg ttgaccggcc atgcaacctc 480
gtaacgccgg cccaaggctg cccggggact tgggtgttaa gtcgtggtcc tcgggcgtcg 540
ctctcagttt ccctcgtagg ccttccaaag ggtcggcacc gggcagcgca caagatagct 600
cgggagcaca cggacacacc cccgatgagt ggttgcgcta cggggcacga taccattctg 660
agatgcgcct cttgtacccg gaacggatcc gcacagtatg gccctctgcc ttgtgctcct 720
ggtcattacc gcagatccta accggggagc ccaagtaccg atcgaacctg cctccggtat 780
atgcgtatcc aagtacttga tcgatacaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagaa 840
ttc 843
<210> 3
<211> 1368
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 3
gatttaggtg acactataga aggggcgggg agggtttgca ggtcgacctg cggagtccgg 60
ctctaccccg cgcttcaggc aggctcggcg gccccacttc ggcccgcggc tccacccccg 120
gctccgctcc ggcccaactg aaacgctcca cattagactg aaagatgaga actggcggat 180
acgggataaa caggtcccgg atgttttacc ttgttgtcag ggagaagaga actaggtcta 240
aatgtagggc aagaggtgtg agccttcgca gggatgtaat taagaaactc ggggttagtt 300
cgcgcggtta ctcctgtctg acgtgaagcg agcgaagtcg acaagcactg cgaaggcact 360
tctatggctg ggggcaaatt ccgggcctct ggcaggggct tcaggattat cgcaccatgt 420
aaaccccgac gccgtaccac ggcccgggac ccttgcggaa cccttcggcc ggtacggaga 480
cactcttcga cacatgactg gcccgggcgt cgcgaatatt cgagtgatat gctcttccca 540
tcctggagac gagtggtggc gggcccctat agcagagcac tatctggagc cgccgaggaa 600
tgaaacagag ctaggattca acactagtcc gacctcccac ctcgtttacg ctaatcaggt 660
cgtcgccgcc gagcgcgggc acctagtcgg gttccggggg caccgaaaat actggaatca 720
taatccgggc aggaaaggtc ctacattgga gcgctcgagt acggcgccgg ctgcccggcg 780
gcgcccatgg aacagtccca gaccgaatag gctagggaaa cgaggtcata ggatgggttg 840
gatagagtat ttgctcgcac cgttgaggga ttcgggcaat tacgctggcg aaaggcgttg 900
tgagggctcc cgatgccact agtagtgaac ttggtcgcag gggagtaacg ctgagtccgc 960
agatccgtcc taggactcgc aagcgggcac ctaatgccgt acactaaggc aaacccactc 1020
aaaacgaact gctagattgg gcgttggcac aacacgagcg tcacgcctag ggccacgcaa 1080
gaaccggcct ggctagtccc aacgcctgcg gcgcgagcgg aatggcaggc aaactaggcg 1140
ctgcggcggg gggtgtacac caggaacatg cacccaaccg acgggacggg gcggggaggg 1200
aaagcgcacc gaaatccggg ggggccttcg tacctgcgcc gaagtaagca agggggaccg 1260
atgctctcca gccgcacccc ggctcggcgc ccccgtctgc ggacggcacc gcctttggtc 1320
cctcatgctg tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aagaattc 1368
<210> 4
<211> 1640
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 4
gatttaggtg acactataga aggggcgggg agggtttgca ggtcgacctg cggagtccgg 60
ctctaccccg cgcttcaggc aggctcggcg gccccacttc ggcccgcggc tccacccccg 120
gctccgctcc ggcccaactg aaacgctcca cattagactg aaagatgaga actggcggat 180
acgggataaa caggtgttgt gtgcttcagg gtgttgcata gagtgctttc catggctgtt 240
tccagaacgt tcagcgccgg agggggggac tcagtccgtc cagttcgggc atcagtcgtg 300
gcgtcccgga tgttttacct tgttgtcagg gagaagagaa ctaggtctaa atgtagggca 360
agaggtgtga gccttcgcag ggatgtaatt aagaaactcg gggttagttc gcgcggttac 420
tcctgtctga cgtgaagcga gcgaagtcga caagcactgc gaaggcactt ctatgccggt 480
acggagacac tcttcgacac atgactggcc cgggcgtcgc gaatattcga gtgatatgct 540
cttcccatcc tggagacgag tggtggcggg cccctatagc agagcactat ctggagccgc 600
cgaggaatga aacagagcta ggattcaaca ctagtccgac ctcccacctc gtttacgcta 660
atcaggtcgt cgccgccgag cgcgggcacc tagtcgggtt ccgggggcac cgaaaatact 720
ggaatcataa tccgggcagg aaaggtccct gcccggcggc gcccatggaa cagtcccaga 780
ccgaataggc tagggaaacg aggtcatagg atgggttgga tagagtattt gctcgcaccg 840
ttgagggatt cgggcaatta cgctggcgaa aggcgttgtg agggctcccg atgccactag 900
tagtgaactt ggtcgcaggg gagtaacgct gagtccgcag atccgtccta ggactcgcaa 960
gcgggcacct aatgccgtac actaaggcaa acccactcaa aacgaactgc tagattgggc 1020
gttggcacaa cacgagcgtc acgcctaggg ccacgcaaga accggcctgg ctagtcccaa 1080
cgcctgcggc gcgagcggaa tggcaggcaa actaggcgct gcggcggggg gtgtacacca 1140
ggaacatgca cccaaccgac gggacggggc ggggagggaa agcgcaccga aatccggggg 1200
ggccttcgta cctgcgccga agtaagcaag ggggaccgat gctctccagc cgcaccccgg 1260
ctcggcgccc ccgtctgcgg acggcaccgc ctttggtccc tcatgctgtc gtcccctttt 1320
gcaactttcc ctggaatagg actttacaga caccagccgg gggtgggtga ccacaaccga 1380
aacgtcggcg ggctaggggg tcgccagcgg gggccctggt ctctgtgggg gttctgggcg 1440
cggggctggg ccggtcaggt ttcttcacac ctccgccctc cgctccgcgg actacagcgc 1500
ggttctatgc tggcctgtgc gttgcggggt gctgacgacc gagaggaggt ggcggcgtcg 1560
gctcgattcg taccgcttct acaccatgga acttcttgcg ggcgaaaaaa aaaaaaaaaa 1620
aaaaaaaaaa aaaagaattc 1640
<210> 5
<211> 1998
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 5
gatttaggtg acactataga agccggactg ccttgtgctg gactacagcg ggaaccgcgc 60
gcaaaggcgc ggcctggggc ctgagggcct actcggacgc atgtggctgc cactccgtcc 120
gcgtccgttc ccgggctctc ggaaccggtc tcaaccgggg aggcacgacc acccctgagc 180
cgccgccaga aagcggtgca aaaggatgaa agaggagacc gggtttgtgg aggagggtcc 240
ggaccatcga gtccaaccag gtaccatcta gccggcgcca gcgctttcgc ccagcttgta 300
tgttaaggag tagactttcc atgcttggga ttcgtctcga gtcgacggaa ctggttccta 360
gggcagggag cctcctggag tcaccaacct gccgcggacc tagagcggtc tagtaggggg 420
agaggttcat ctccgagttg acgccctccc acgcccatga caccattccg agactcggac 480
cgcggctacg aattggggcg agcgtcggag accggaaccc gtccttctcg ggataaccgg 540
gggctcgcgg ccgaccttag acgcgacacg gcaccccgcc cgcggtcgcg gcaagaagcc 600
ccccccggga aggacatgcg ttcagttagc gtaccgcggt cggtgcgcgt cgagtcggcg 660
acacttctca acaagacccc ggagcgtgtg gcgggtccct tacccgcgct ggggcagccg 720
ctgccctcct cccaagcgat acccgacagc ggggagaggg accacggcgc gaggggcgct 780
ggacggggac ctcattgggc acaagcgccg gctcggggct ggagccacca tagccacgcg 840
aggacgaagg gagcactagc agtccttctc tactccgtag agccttcccc atgcggacga 900
atgaggacgt gagatcgggc gctctcctgc accctgcaca gtagcttgag tagcgcttac 960
gcaatgtcgc atcactagac ctgcaatgac ttcaatgacg gacgtaccct tgagtgggct 1020
cgccgaaagt acattggaat ttccgatctg tatggccttg ttaacgtctg cctggtactt 1080
ttcgctccca cccgtgaggc aaaaacagga tcattgtgac cccggatagc gaggctaagg 1140
ccgataatag acctccgggc gtcaggcgcc cagcagtgca gtgcgcggag cagtaaggta 1200
gtagggcgag gtaggaccgg gctgcccgta tgaccctgcc cccgaacgag aatctgaggg 1260
gacaagtcgt cggcgcttta ccggacgagc atctcctggc cccaatggac gccatagtgc 1320
cagcccggcc agggctgggt gcggcgcgac ccggggccgc aagaggagat gggagattgg 1380
ccccgctgag cctacagacg cttctcctat gtatcccgca accagaaagg gatggggttc 1440
cgtccgtgga caacaaccct atcaatcatc tcgcccgaga aagggacgac ttgtttctgt 1500
tcggccgatt gtggtcggct cccctggtag cggtgcaggc ttgagtccgc ggttcatgcg 1560
ccacttgcct tctagtgcct gccctcaggt tcgacgcctg tcgtcccgtc cccgatcgtc 1620
gtgttccccc tcttaccccc ggtccccctg caaaacgcac ggctaatgtc aagccacggc 1680
tgctctgtgc tgggtcgcca ccagtctccg atctcacttc ctatacaata cgaccaacat 1740
cctcaccgcc cctcagccgt caattttcct ggctaaccgc cgttgtcttc tctgggccct 1800
atagttgcgc tggcggggct gatattcgtt tgtaacatac tggtctacgc cgggccgcgg 1860
taacagcaaa aaggacacgt accacttata cggtggcttt tctcccccgc gtgctgctcc 1920
agaggtgcag tttaattccc tctgaattat agtagtgagt aaaaaaaaaa aaaaaaaaaa 1980
aaaaaaaaaa aagaattc 1998
<210> 6
<211> 756
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 6
gatttaggtg acactataga agccggactg ccttgtgctg gactacagcg ggaaccgcgc 60
gcaaaggcgc ggcctggggc ctgagggcct actcggacgc atgtggctgc cactccgtcc 120
gcgtccgttc ccgggctctc ggaaccggtc tcaaccgggg aggcacgacc acccctgagc 180
cgccgccaga aagcggtgca aaaggatgaa agaggagacc gggacggaac ctcgactggg 240
atcaggggac cgcgccagat cgcgggaagg taggctggat gacatgaatg tcgccaccga 300
acgtgagtgg ggagcacagg tgcctgctgc tatatagcgc aaaccgccgc ttgcccggaa 360
cgcgtaaggt gtcgcctaat gtccaaatac cagcacctcc gcatcacatt tagcgaggaa 420
tcaagagaac cggcaccctc tctgaacatc aaccagaagg aaaacctctt taaaaactcc 480
tccatgtctt tgaatcatat ctagactagc tcctgaaggt cgtctatcaa cggctagctc 540
aaccaaaggg ttaaggagta ctcggacgtc tgactgttaa aagtgtgggg cactaggagg 600
gaatgatagg ttcctgggat ttgagctgag agaacaatcg atatgctaca ctcttctagc 660
aaactaccgt gagcaaataa tccctttgct gggtagcttg ctcagaatta tcagtttaaa 720
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaattc 756
<210> 7
<211> 722
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 7
gatttaggtg acactataga agggcaccct tatattacct ttgaggttgg ctcttgatca 60
tgaagagcag gtcaagtcaa cagttaccac gcgctggagg ggaccaatga aggaacgtaa 120
ggcaaaggta tgctcacgaa aaagaggtca cacacgcttg agagggggca tgtcctgact 180
taccttggtg gtggtctcgc gtacccaacc aactccgtat tctgccagga gtatttggaa 240
aatggatcgg gttcaacctc tctatcgata tacgaatgca gggcgtgaag ataagaccgg 300
gtaacttgct gttgaccgca taagcttctg aggccaacac gaaagacatc tatgtgtagt 360
agacttgttc accggatgtg gggagttatc aagatcccca atgagctgtc gcgcgcgtaa 420
catcccagct aatccttagg atctgtggag cttcactgtt cgaagatcgc ttacgtggat 480
atggcgtggt gtttcgagca ccccacgagg agaacctata gtagtagact gggtggactt 540
attgcatgcg agtgaaggta cgtcaagtga tgacttagat agaacaatca tataatctca 600
acctaatgat gcagctatgt gtctaaagag tgagtaagtt tacgaagaaa ccttaattag 660
tgttataata atatttgaac cactcaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaat 720
tc 722
<210> 8
<211> 925
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 8
gatttaggtg acactataga agcttacagt ccccggccgg cgccgcgggc accgggcagt 60
ggcaggcggc gaggaggcgg cgaagggacg ggggccacag tgctgcccag gcgaaccccg 120
ccggcctgac tcctagtagc tgggagtacg gtcgacagcg agtaggtaag cggggctgga 180
cttacgtata tagtggtttg atatgtatcg gttacctacg caacgctgct agtgtcttgt 240
gggtgtgatc ctaggaggtc gttattggga gtgatgatct gaggctgcgt aatgagccaa 300
tgtccatcac tatctttcgg gcacactcta cgttgcaata gggatatcat atcgaggagg 360
ggagaggatt atcgataaag gattagcggt agcctctctg tttttatccc gttcgaatcc 420
attcattttg gcgtattatc tacagcgtat tcggtcactc cccccttagc gtagaacgtg 480
tgccccaact gtaaccctta acgatatcat aactcgacgt ggtagggcgc tcgcgctaac 540
agcctacagt tgctacgtgg ggatatacca atcgtcccga gtgtccttga gtgttatcct 600
ggggctgtcg atttctactg gctgaataat tgaggagact ccccatacct gaatgtatca 660
agaactagat tttgtctcaa gtccttcaca gcttaatttc ccgaaagaat cttctacaac 720
ttattgtgtg tacaaatgcg ctgcttttat gcgtacaagt actctgtgaa catatgacgt 780
tttaaaatct tttacgacgg ctgccctttg cttataatat gtaagtctag acgctctgat 840
cataaatgca ctatggttct gagtttgccg acggtgcgaa taacagccta aaaaaaaaaa 900
aaaaaaaaaa aaaaaaaaag aattc 925
<210> 9
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 9
gatttaggtg acactataga agccgggcga cccctgccac gcgcagtcgg ccagccatta 60
ccgccctcgc gcggtccagc ttacagtccc cggccggcgc cgcgggcacc gggcagtggc 120
aggcggcgag gaggcggcga agggacgggg gccacagtgc tgcccaggcg aaccccgccg 180
gcctgactcc tagtagctgg gagtacggtc gacagcgagt aggtaagcgg ggctggactt 240
acgtatatag tggtttgata tgtatcggtt acctacgcaa cgctgctagt gtcttgtggg 300
tgtgatccta ggaggtcgtt attgggagtg atgatctgag gcaatccatt cattttggcg 360
tattatctac agcgtattcg gtcactcccc ccttagcgta gaacgtgtgc cccaactgta 420
acccttaacg atatcataac tcgacgtggt agggcgctcg cgctaacagc ctacagttgc 480
tacgtgggga tataccaatc gtcccgagtg tccttgagtg ttatcctggg gctgtcgatt 540
tctactggct gaataattga ggagactccc catacctgaa tgtatcaaga actagatttt 600
gtctcaagtc cttcacagct taatttcccg aaagaatctt ctacaactta ttgtgtgtac 660
aaatgcgctg cttttatgcg tacaagtact ctgtgaacat atgacgtttt aaaatctttt 720
acgacggctg ccctttgctt ataatatgta agtctagacg ctctgatcat aaatgcacta 780
tggttctgag tttgccgacg gtgcgaataa cagcctaaaa aaaaaaaaaa aaaaaaaaaa 840
aaaaaagaat tc 852
<210> 10
<211> 1227
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 10
gatttaggtg acactataga agccatcggc ggtgccctac gggcgcatcc ctcggccgct 60
ccacgcccgc ctggaccgcg gacggagctc ccgcagaccg ataccccggc gaggacctta 120
tccatacctc gtaacaatat gtggctccaa tccccggtaa tgtcgctcag attgcaatga 180
cgtcgatgcg ggttgccgag ccctcaatgg gtcggtcatg agcggttccg ggggggatag 240
gtgaaacggc gaacacgctt agtaagattg aggcgtttaa acgcggggcc gccgattact 300
cacggacatg gggggtacga ggacctacgc gaagggcctc caggagcgat ttgacaaggg 360
aagtgcccaa cggttggctc gtaccacgga ccagggagtc ccgctaggtc gttatcgctt 420
gcaaaggaaa aattagtgaa tggataaaag ggcggtggtg accatcccaa tccaggaact 480
agtccagata acaagtggat cccaacagtg agaaaccagg gtttcccgac cccattctaa 540
taaccagcgg tgggctgccg tgaggtatcg caagcatatt cccgttcttc aagcccgatt 600
tccagatgtc tcccacccta ccaggagggc ttctcaaaaa ctaatcagtt ggaaatcccg 660
ccctgccagt aaggtcttcg aggtagggaa tatggtaaag ggcggtattt cgagtcccca 720
atagaaacgc gagccgaggt tggggacggt ctccctgacg acgcgaactc attcgccccg 780
gcagctggga ttcttttctt ctgtaccaac gacagcgccc ccagcccgca cctgcccaac 840
gtacaaaatg cgccagtggt ctggagccgc gatcccggag cggcgaagaa acgcctgaat 900
gcggccgcgc gtacccgccg ggcgatgtcc gatacgatta gtctgatttg atcgcggaat 960
gcaaacgtaa ccggaactgt tgcagtcctt atattctgat caatgaacct gtactagttg 1020
aggcacggat tgccgcgatg tgtattcaga ggtaagggag gggacgtcac gatcaaaaac 1080
gaggcggtca gtgggccttt tgttcacata ttcgaatgaa tccaatgcga gttgaggaac 1140
gaacaattta ataattcctt tgttgagccc tatatgtcct ccccccttcc taaaaaaaaa 1200
aaaaaaaaaa aaaaaaaaaa agaattc 1227
<210> 11
<211> 1099
<212> DNA
<213> Artificial Sequence
<220>
<223> Artifical DNA standard
<400> 11
gatttaggtg acactataga agccatcggc ggtgccctac gggcgcatcc ctcggccgct 60
ccacgcccgc ctggaccgcg gacggagctc ccgcagaccg ataccccggc gaggacctta 120
tccatacctc gtaacaatat gtggctccaa tccccggtaa tgtcgctcag attgcaatga 180
cgtcgatgcg ggttgccgag ccctcaatgg gtcggtcatg agcggttccg ggggggatag 240
gtgaaacggc gaacacgctt agtaagattg aggcgtttaa acgcggggcc gccgattact 300
cacggacatg gggggtacga ggacctacgc gaagggcctc caggagcgat ttgacaaggg 360
aagtgcccaa cggttggctc gtaccacgga ccagggagtc ccgctaggtc gtcaggaact 420
agtccagata acaagtggat cccaacagtg agaaaccagg gtttcccgac cccattctaa 480
taaccagcgg tgggctgccg tgaggtatcg caagcatcag ttggaaatcc cgccctgcca 540
gtaaggtctt cgaggtaggg aatatggtaa agggcggtat ttcgagtccc caatagaaac 600
gcgagccgag gttggggacg gtctccctga cgacgcgaac tcattcgccc cggcagctgg 660
gattcttttc ttctgtacca acgacagcgc ccccagcccg cacctgccca acgtacaaaa 720
tgcgccagtg gtctggagcc gcgatcccgg agcggcgaag aaacgcctga atgcggccgc 780
gcgtacccgc cgggcgatgt ccgatacgat tagtctgatt tgatcgcgga atgcaaacgt 840
aaccggaact gttgcagtcc ttatattctg atcaatgaac ctgtactagt tgaggcacgg 900
attgccgcga tgtgtattca gaggtaaggg aggggacgtc acgatcaaaa acgaggcggt 960
cagtgggcct tttgttcaca tattcgaatg aatccaatgc gagttgagga acgaacaatt 1020
taataattcc tttgttgagc cctatatgtc ctcccccctt cctaaaaaaa aaaaaaaaaa 1080
aaaaaaaaaa aaagaattc 1099
<210> 12
<211> 1747
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 12
gatttaggtg acactataga agagcttgtc cctccggcgg ctctcccgtt ggcctcatgt 60
ggccgccaac gcctcccgta ccgcgacgct taccggtccc cttcgggctc aacgggtcat 120
agaaaagagt gcacaaaacg atgacacacc acgtgtttat tggctggtat ggcacatgcg 180
gagcttactg cgggtgctaa gtaaagtccc gacattatgg tataccgaga ttaacttctt 240
actcagtgag ttattcatct ccgaagcaca gctgcctttc tggcgatagt gggacggatc 300
ccccatggag cagagcagga taaggctgtc aaaagtgttc ccgtagtcgt cagtcaatat 360
tatcaagaga aaccgacata acccaaatag agctgcttaa aaaattctgc tagagtcccg 420
aggagatata cgtttataag ggtaaataag aagtattaag aagagttcct cccactactt 480
ttcctccaga gataaaactg actgcaaagg gttgcgtcgg gtgtcttgag ctagcccggc 540
ctgcgtatgc aatccctgca ccgctcacac cctttcataa cgaaccatca gcgctagagc 600
ggtcctgtta cgcgtttacg ttataaggac tagatcccgt gtacttacac taggcaggaa 660
cagaagatgc tacttatact ccggtaagta cccgctatag tatcgaaagt tgtccttagt 720
aagacaaccc aacttttgaa agtggatgtt agcaggccat accgcatatt tttgccggct 780
actctgtttc cacagactaa ccgggcccgc cagcagtgtg aaggaaagag gtaggcacgc 840
actgtgcccg atcgcagtgc ttacggaatg atcacggaca taacagtagc gtgagtttgt 900
agtggttaat gccgtcagaa aaaattaaat aatctggcgt agcggatgtg acaaattagg 960
aagtgcctgg aaagccgggg agatttaata aggtctagag cggctctata gagacgtcag 1020
caacagtcat gccctactgt gctgcgaccc agtgtcgtct tacgaaccgc cacttaacgc 1080
tggaatcgcg accgacgcat tcaaagctat gcgataccca tctcctaaaa ttttgagtag 1140
tgatgttcat tattctggct taaagattaa aggcacgtgg acgtacgtat attatgggga 1200
aatgaaacaa aagctcggcg aattgataca aatgattaat ggtccggtca tatttagtga 1260
actgtttgtt agaagacaaa gaaaggagta gggtacaagt agctacaagg gcggagaaaa 1320
aaccttacaa tatcacatgt tacacctagc aaccaaaagg gcttttgttc acggtttgga 1380
gtcaaacttg taataaaact ttccgtgtga atccgaatgg aactcggatc gaaagataaa 1440
ataatgtgga tttacagggc ggagataatt ttgtttgttt ttgttttgcg ggcatcaact 1500
ggcattcgac ctacgagcat cctttagtta tatatctctc catcctgtta aaagaaatcg 1560
cacgatagaa aatcctaagc taaactagtg ctaattacta ctttagcctc gctttaaact 1620
gcgagttatg tcgtgtttta tacctttgga gcccgcgatt ccgagatcat ttggactgct 1680
tgtgcaatgg ttctaatttt gtgctgcgta taaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740
agaattc 1747
<210> 13
<211> 1240
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 13
gatttaggtg acactataga agtagaggcg ttaacgacta gtacagcttc taacgacgct 60
gggttattag gaagctaaag tcatagcgga ggcggtcctg ttacgcgttt acgttataag 120
gactagatcc cgtgtactta cactaggcag gaacagaaga tgctacttat actccggtaa 180
gtacccgcta tagtatcgaa agttgtcctt agtaagacaa cccaactttt gaaagtggat 240
gttagcaggc cataccgcat atttttgccg gctactctgt ttccacagac taaccgggcc 300
cgccagcagt gtgaaggaaa gaggtaggca cgcactgtgc ccgatcgcag tgcttacgga 360
atgatcacgg acataacagt agcgtgagtt tgtagtggtt aatgccgtca gaaaaaatta 420
aataatctgg cgtagcggat gtgacaaatt aggaagtgcc tggaaagccg gggagattta 480
ataaggtcta gagcggctct atagagacgt cagcaacagt catgccctac tgtgctgcga 540
cccagtgtcg tcttacgaac cgccacttaa cgctggaatc gcgaccgacg cattcaaagc 600
tatgcgatac ccatctccta aaattttgag tagtgatgtt cattattctg gcttaaagat 660
taaaggcacg tggacgtacg tatattatgg ggaaatgaaa caaaagctcg gcgaattgat 720
acaaatgatt aatggtccgg tcatatttag tgaactgttt gttagaagac aaagaaagga 780
gtagggtaca agtagctaca agggcggaga aaaaacctta caatatcaca tgttacacct 840
agcaaccaaa agggcttttg ttcacggttt ggagtcaaac ttgtaataaa actttccgtg 900
tgaatccgaa tggaactcgg atcgaaagat aaaataatgt ggatttacag ggcggagata 960
attttgtttg tttttgtttt gcgggcatca actggcattc gacctacgag catcctttag 1020
ttatatatct ctccatcctg ttaaaagaaa tcgcacgata gaaaatccta agctaaacta 1080
gtgctaatta ctactttagc ctcgctttaa actgcgagtt atgtcgtgtt ttataccttt 1140
ggagcccgcg attccgagat catttggact gcttgtgcaa tggttctaat tttgtgctgc 1200
gtataaaaaa aaaaaaaaaa aaaaaaaaaa aaaagaattc 1240
<210> 14
<211> 4635
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 14
gatttaggtg acactataga aggtcgcggt acgaatgcgc gaacccagaa gaacaaggcg 60
tgggaccggg ggtggatcac ggggtgcaat cccccggctc ggctcgaggc tgttcccgac 120
cggtgacaac agcgggaggc cggcggatgg tggagggagt tttcccgagc tggccaagtc 180
tcccccttct ggtgagggcg gacaaggagg cgcatgacgt cataggccct cttggtgcta 240
tgagtggaga atgcaatcat gcgtaggcac gcggagcgca ccactcattt ttcggcccaa 300
ccagggctca tgaagttgta cttttgtgat cggggtacgc caagccggct atcacccagc 360
gcttacttcc tcacgcgtcc gccctctgca aggtagacta gatagttatg tgagcaaagc 420
gtagcttgct ctcctagacc cgctcaaacc gacggtacta taaacgcacg tctatcgtca 480
aacggaaggt cggcatagaa acgtggcata tggggaagct actaccaacc agggggtcga 540
ggcgcgtgcg ttcggaacct tcgccgaaca ccttgctccc aggcggcact cctggcccat 600
aagagggcag cagggatggc acgctagagg ctggggtcta tgctctcagc cgttcggagg 660
tacggtccta gcccccttga agtatacctc cggggcgtgc caaccagtac caacgtcatg 720
acccttaatt ccgtcggaat cgacacgcac attgccctaa accaactacg tctatccacg 780
caggcgctac ccttgtgtga gttcggcgcg ggagcagccc gctattcgtc cgggaaatag 840
tagaagacag gcaagtcact cctaaacggg aatgcgaaac cgctcatata tggtgacatt 900
cttaggtggc ttgctccaat agcgcaaaag taccgtgaag gaagaccagc aactgatgtc 960
acatgccctc ggcagaccgg actgagaggc tgcataagga aggacaagcc gcgcttgtac 1020
ctcatggctc ctcggaggga acgtgacacc ccaaattcta tgctaaatca ccgaacgtcg 1080
ttaccggttt aagatgcgat cataacccca acagaggggg aacatcgggc tagtactagt 1140
gtgaaccttc aggtaccaga cggactagag aaatgtaggg tgaccagtcc ctcctcttaa 1200
catcgcacag tgtcgttgga cggtcacgta ggaaggctgc gtgtaaccga agcgagagcc 1260
aaacgccagc gcttgccgcg agggtacccc ggaaacggca ggctccgccc gaccctaaaa 1320
cggtggtgac cgaggaggaa aatggctaac tagcggtcgt gccaacgtgt tgcggctgcg 1380
gctttagatc tacgggcgcc aagcgcttga cgggaggatc aacggcacga cggtcttttg 1440
ccctcaagtt ttaggggtac agtaagcccg ctctaaacac tgttgtgcgg acacccgacc 1500
agcacgggat accgttaccc aggctggcca acacggtcga actgcagatt gctgcggtaa 1560
aggtcggcgc cggcaactta ctgaagctct tgccgcggtt tataaggtct cctcctggca 1620
ggccgagcgc catggcgcta cgaggaggtc cggcatcatg atgccctatc tagttcgacg 1680
tagcaccaga cgggacgggg cgttccacgc agttttgacg accgctcggg cagaaaacac 1740
ggcgatggcg ggagtacggt gctgatcact caccgtgccc gcggtaatgt cacggcgagc 1800
cgctgccgga atgcccctcc taacgccctc ttgcggccgt ccgcggcatc cgtcctctgt 1860
gggtaattga caccgttggc caactcctct ccttgtcggc accaaccagg acatcaacac 1920
ttgggtttgc gcagatgggc gcaaccccgt gccgcagcca aggcgcctgt ggtttacgga 1980
tgaacccacg gctcgatgtg ttacttgcct ggaccgtggt agcggtgcct gagcggtcgg 2040
ctcctgcgac aacctattgt cgccattcct tggtccctcg actccacaac ttgtgttgcg 2100
gaggcgtggc gctagattag gtgacatggc cccagcgcga ttgaggacgg cggcgtcgta 2160
ctggggtaga gtgacgcaaa gccccgggat ctatcctaag ctactatacc ttcgaagcgc 2220
cgccatcgcc ggcgtgtgtc cgtgcgcttg ggcccctccc gaaatggcgg gcgcgccgat 2280
actgggtacc gtgggccaat tcaatcggac gtggggcgcg gctcatggtc tccacctagg 2340
cccgagccat gccgccaccc ggagctgagt ccttctgtct atcagtacgg ggaggaagtg 2400
actggacgag ccggtggggg gggtttgctt cggagccctt gagcgggacg ccggtacagg 2460
gcccagagaa cgccgtaccg ttgggacggg gctcgttaag cgcccacacc agccttggtg 2520
ttacaggcct tgacccatac gtcgcgcgtg caaagttccc tcgcgccgct tgctccacgg 2580
acccagggac agatgcttgc gtttcctgat ggcatagact ctaccttatc gtccggcatc 2640
gcgcgtgggg cccactatag tcagaccgcc gggctgcgcg cccgctattc aggacgacgg 2700
cccgtgaaac tgcgaaggcc tgggactgtt ctctccctgc aatgtccgcg ccgtgacaaa 2760
gagatcacat cacgctcagc acggcgtctc tcgtaagacg ccgggcataa ccccgggagt 2820
gccctggcca gctgtggagg gtagggacct tgaggaggac cctcttcgat ggtaaggcct 2880
gaccagggcg ggagcccgca accggggacc cctgggcctc gcggagagcg tgagggccag 2940
caagccaggg ggccgctccc gtacccgcat tcagataggc gccgctcgta gccctaggcg 3000
agaggccggg gaacagaagc catggatgaa cgtagcagga gcccccgagc gggctcatcc 3060
cgggagtgga gtgcacagga atgtcccgaa cgctgcgcgg ggggaactaa agtgcatgtg 3120
ccgaactaac ctcgataggg caccccatcc gtcgtcacga aatactcccc gtcgttaggt 3180
ctcggctgtt cgcccccccg ggcggcgcct ttatccgtcc ccgaacacac gaccatcgaa 3240
tgcacagttc gacctgcgcg ttaggcttcg tcgaatcaac agaggatccc tggtcggcca 3300
tgcgtactat agacgagcgg agcttcttcg ggacgaagtc cgtcgccaac gatggacgcg 3360
cacccgtgac gggggtacct cccagaccaa tgaagccccg agacacgcgg gcagccgaat 3420
cgcgggctcc ttaaaggcca cgagccctcc cggcggtccc acacggaccc aagaggccgc 3480
cgccccgcct caacctagag ccacaaccgc cgaccagata gaccgcaggg tccgggggtg 3540
gacatctgaa aaaggcgagc cggcggcgca gaggaatccc ctggcgctgc gtctggcgca 3600
tgcccggcgg gtccctgctg tcccgagcga gcgttagcaa ttgagcacta gggccacaca 3660
gcaggcgaca gcacatcggt agggctctgg ccctcgcatt gtgcacaccg tgagatcaca 3720
gtacgcccgc aatcccgctg cttggttatt tcggcaggtc ccctcgaaac atccactcga 3780
gcaaccccaa gtgagggacg acctcccact ggaggcgtcc gccggaccgg acgcgcaagc 3840
cgaaccgggt gggccgtggg ctcccatttc ccttcacgcc acagcccagc catgaaccac 3900
cgcccgttac gcagagggga gacagaaaca gccgtcagct ccgcacgcta taggactttc 3960
gggtgggtgg gacaccggag cggctgcgag cggactacga gcggttcaga ccctccgcac 4020
cacgtgctag aggcgggcct agggctctgg tgggcgcaga cagaatcttc agaacgggga 4080
cccgctgggg acgccgcatc cctgtcgccg ggcgcctgtg acggtggcag tgtgtgcggt 4140
tcgggcgggg cagcgatacg ttcgccctct cacgtactgt gacggcgagg cgccaccctt 4200
tgcgacaccc gcgtatcagg ctaacctatc gtgccggtcc ctagcccccg gcgaaccacg 4260
aatcatgggg ccggcatcgg tattcgacca ccacggtcgc cagggagacg cgtaagaacc 4320
gcgcctggtg gcggttgcgg cgtccctgtc gggttggtcg tccgctcccc ggtgtcgttg 4380
ggccagggac agcgctcgcg aaacaccgcg atccgggctg cacagactgg gcgggaattg 4440
gcggagcgac caggcccagc cgctgcaccc cccctgtggc ctgggctagc ctgggccgct 4500
gggtcacaca aggcaccatc ccccccgcaa ctgggctgcc agtcataggt gaccatactc 4560
gctcgccgat acgatcctga gcatggtggt accccgggga aaaaaaaaaa aaaaaaaaaa 4620
aaaaaaaaag aattc 4635
<210> 15
<211> 719
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 15
gatttaggtg acactataga aggcccggct gtgggcaccc cctcgccctg gcggcgcctt 60
cgtttctcgg cgcttcccgc tccccggtcc ccgttcgtcg gcctaggcgc caaagcgcac 120
caccgatgtc ccccggcggc acgcgaagcc agtggggcac cgcggggctg ggcctcgagc 180
gcgcgcgcct gttatggtat ttgaacaagt taatacgcaa ctgtaagcga acctttatct 240
cttataattc agctccatcc acctcagaac aagtcccgca atgcgtcttt gagacgtaca 300
tcctgatcag attcgagtta cacgagatct atcaaaacag actcatcagt catcaaaaac 360
acgcaatgac acggtgccta agagtggtct agatacgtag gaagaaggaa gataactgtt 420
cagtacacgg cgtataaggt cgtcattacc atgctgtttt gtgataacta aaaaaaacta 480
aggtaaatgc gagcccgatt gcatcgaact tgtcgatgaa cactcgaacg cagttgaaac 540
ttactaagca aatctgaaag atggaaatgc gttaagaaac cacagatgaa gagatagcac 600
aaatagttac attaatgttc ggatcatgct gttattagtt tacgccggtc tgagtcttcc 660
ggcgtgctct caaacagatg ccgaaaaaaa aaaaaaaaaa aaaaaaaaaa aaagaattc 719
<210> 16
<211> 1524
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 16
gatttaggtg acactataga aggcccggct gtgggcaccc cctcgccctg gcggcgcctt 60
cgtttctcgg cgcttcccgc tccccggtcc ccgttcgtcg gcctaggcgc caaagcgcac 120
caccgatgtc ccccggcggc acgcgaagcc agtggggcac cgcggggctg ggcctcgagc 180
gcgcgcgcct gttcatagca gcttgaatcc aggcaatcac aggacggaaa gctactatga 240
taagaaataa atatttcgga aagaaatcta aacgtggcga cggtaatagt actagatcgc 300
cattttgact gtcattcgca agtagggaac accgacatta taagcattat tttggcatat 360
aggaggatag gcatgaaatt cagttatggt gaaatatagt gtgagtacga gattcattta 420
catctggtaa tattctcagg aatgaagttt atgtacaaaa gatccaaaca cgctgtaaag 480
ggacgctttg ctgcagcgga gaatgatttg ttcctgcggc accgagcact gtttgaacta 540
gaaaaatgct acaagtgggt cgtgaaaaac agaagactgc gcatatttga ggcgaagaaa 600
ccaacgatat agatccgaac cggatgacaa cagctcagct agagacctaa gaacggttag 660
tataaggcgg tatttaagac taagatgtgt ggcttagcag gctgatggta tttgaacaag 720
ttaatacgca actgtaagcg aacctttatc tcttataatt cagctccatc cacctcagaa 780
caagtcccgc aatgcgtctt tgagacgtac atcctgatca gattcgagtt acacgagatc 840
tatcaaaaca gactcatcag tcatcaaaaa cacgcaatga cacggtgcct aagagtggtc 900
tagatacgta ggaagaagga agataactgt tcagtacacg gcgtataagg tcgtcattac 960
catttcagtg gacattcgcc aggacgaaca gaaaaaccat tatattgccc ccattccgat 1020
gtaagccgtc tggcaagata cgaacgggtc cacccacata agtatccccg ggctcccttt 1080
cgaactgcat gtagtgaagc ttagtgtgca tttttgtctc tcgcccgttc ttcttaacct 1140
tgacttgcta acgcccagca tgagatgtgc atggccgtaa ggggtaattt atacgcgggt 1200
gtgcggctag gcgtttcttc cccctgtgca tctccgtaat caaagctcca gatcagtgct 1260
gttttgtgat aactaaaaaa aactaaggta aatgcgagcc cgattgcatc gaacttgtcg 1320
atgaacactc gaacgcagtt gaaacttact aagcaaatct gaaagatgga aatgcgttaa 1380
gaaaccacag atgaagagat agcacaaata gttacattaa tgttcggatc atgctgttat 1440
tagtttacgc cggtctgagt cttccggcgt gctctcaaac agatgccgaa aaaaaaaaaa 1500
aaaaaaaaaa aaaaaaaaga attc 1524
<210> 17
<211> 1002
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 17
gatttaggtg acactataga agagccatcg cgcccgcacg ctgcggcgtg ctcggcccac 60
accagccacc ccgcggtgcc aaaccgcaac ccgttcgcca caaacgagca cgcgcccgca 120
caaccagaag agcagtgcgt cgccaacggg cccaagaaaa accaacccgg ctcaagcaag 180
accgcgacat ttggatgccc cgagtcttta tgaaacgttc tggcagcaca tgcataaatt 240
atttgccggc agcaggtaat acttagtatc gccgcgaagc tcaggtgcgc acgcagaatc 300
tgctgcggcg aagctcacgg gacccagaaa aaggagccgt tgaacgaggg gatcacgatc 360
ctacccccgg actcggtctt cagatcaccc ggtgttctgg acggggaacg caaacactgg 420
catgagttgc ctgaagaccc ggacctgcgc ctcagtctgg tgtacagact gctcggttag 480
aacctagtac cctcgcccac gcatccgagt agcgtgatcc cgcagtggat agatcggtaa 540
ggccagcgtg aagggagatc tcagatgcga cgaaacgata gcatgcttaa acctgtatgc 600
aaggcaatca atcggccccc acgctgaggc ggaacgtcac aaaaatccca cagaatcccc 660
gcaccccccc ctacgtcccc caccgccccc gaacgcacgc ccagcctcct caagaccccc 720
ttcgtactcg ctccctggac ggacttccgg cactggtgat cctagttctg gacgcggacg 780
gaggataggc aacagacgaa ctgtggcgcc agggtaagtg taccgacgca aagcgccccc 840
ccttactcac cggggcgcct attatctaac caacgtcgat cggggcaatg gccgagaggc 900
ggaacagtgt gagggtcagc cagaacggga acccggggtg ccctcccatc ctatggggag 960
gagagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaat tc 1002
<210> 18
<211> 841
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 18
gatttaggtg acactataga agagccatcg cgcccgcacg ctgcggcgtg ctcggcccac 60
accagccacc ccgcggtgcc aaaccgcaac ccgttcgcca caaacgagca cgcgcccgca 120
caaccagaag agcagtgcgt cgccaacggg cccaagaaaa accaacccgg ctcaagcaag 180
accgcgacat ttggatgccc cgagtcttta tgaaacgttc tggcagcaca tgcataaatt 240
atttgccggc agcaggtaat acttagtatc gccgcgaagc tcaggtgcgc acgcagaatc 300
tgctgcggcg ctcggttaga acctagtacc ctcgcccacg catccgagta gcgtgatccc 360
gcagtggata gatcggtaag gccagcgtga agggagatct cagatgcgac gaaacgatag 420
catgcttaaa cctgtatgca aggcaatcaa tcggccccca cgctgaggcg gaacgtcaca 480
aaaatcccac agaatccccg cacccccccc tacgtccccc accgcccccg aacgcacgcc 540
cagcctcctc aagaccccct tcgtactcgc tccctggacg gacttccggc actggtgatc 600
ctagttctgg acgcggacgg aggataggca acagacgaac tgtggcgcca gggtaagtgt 660
accgacgcaa agcgcccccc cttactcacc ggggcgccta ttatctaacc aacgtcgatc 720
ggggcaatgg ccgagaggcg gaacagtgtg agggtcagcc agaacgggaa cccggggtgc 780
cctcccatcc tatggggagg agagaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaagaatt 840
c 841
<210> 19
<211> 2419
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 19
gatttaggtg acactataga agtgcgagtt taggtgcgtg actaagtttc ctatacgtgt 60
ccgattgaca ttctatttta tttattagac tggtgatata gtcgacagta gtagattgag 120
tggacgaata aactaccaaa ctaaaaatcg ctaacccagc catgaaagag ctagacagaa 180
ctgcccgcgt tgtacctgcg ctctcctctc cgcgattatt catccatgtt gcaccatgga 240
acgatgcgca tctaaacgat ggcttataaa tgtagtagtc accacagaaa tatgtcgtga 300
tctcgtccca aaaacgtcat ggcctttgat cgcaacagcc gagtctatca gtaactttat 360
atcggtatag gggctacgga gatacggctt agcacgtcct acacctccta gagtttgtct 420
cgaaatccta agcgtagtca tagataatga gaatttggaa taagcaccca agcctaacta 480
tatagaactg gtagtaacgg atgtacacgt aggacgagtt aaaaatgtaa tctgattaaa 540
tttggtcggt gctaagacgg aaaaatctct atatcaagcg catcgaagct ccgggtacca 600
gtaagtgagt agaaacagcc aggtaaacat atagaacgta atgagcaggc ctatagttct 660
acctctttga gactaatgaa gagcaagaaa attagatatc atgagtgttc attgattttt 720
actgggtaat attgttaaca tatagcacat agtttcttcc aatcgaggca cagccttcct 780
ctgtctttat agagaactat cataggcttc gaagaagtaa attcgaatta atgtgaccgg 840
ttgattgttc gcattactta tgtgggaggt aaggagctta cagattagca attaactacc 900
gcctgacagt atgctagtat ataagtgaat aagtgactgc ataagaagag atataaaaaa 960
gggttcgccc tcatagacta tgaagctcgc attaatgtca tccgaaaaaa cggattgtcc 1020
gaaatactat attcctgcat caaaataaga tacgggagta tacagtgtca tgtccgcatt 1080
aactggaact cctaatgtaa taatgaaagt acagtgatat ttaagtttag tgatgatcct 1140
tagtggaaca taccatataa tatgacatct taaatcgtta tcctccacta gcgcactacc 1200
tatttgagta caaaattaaa tgtaaacggt gttgtgtctt accactacca gcataagggc 1260
cccaaatcga tgtaaggtga tccacggcaa atttcacccg ctcgcattga ggaaaattct 1320
cgagaaggca gctatagaaa ggccgtacta attgtatgat gggctgaagg tacggagacg 1380
gcgtatggtt ttgaaatctg aggaactaga tatagtggga cggttggcac atatatggat 1440
gtggtcccat tattcaatgt aagattgatg cgtcctgttt caaaagaaat agaaacacag 1500
acggggaaag gagtcaaaag gaaaacaacc gattgtgatg tattaggcct ttcggtccat 1560
aaaaatacta tcgcaattaa taggactgat ctagaagctg aacaaggata ataaattcag 1620
aaactatgta aacgacaatc atttgaatag aataaccact atgaaacttg ggcaaaagac 1680
gaaaccgaaa gagggaagta ctaccggtgg tagtagtgat agagtgcgac atcagttcct 1740
ttatataaag tcgagaatga agagcctcct gtctacccgt tcaccccttt tgccgagacc 1800
gtcctactaa gtgttaccat tgccaaccgg gttcgaggta ggatgccgaa acgtcactcc 1860
gaccataacg tctgatagag acaagaggat atcaagaata tgccggctag tgtatgccag 1920
acttggctat gccatgcaaa tatactaaca cggataccag ggtttgagct atcttacgaa 1980
atggtgtatc ccgaacatgt ggggcgtgga cgccatgcgc tgaaaattta caatagtcaa 2040
ggtgcataga gtaatatgag ctcgtacaat acagtaggag ttgaaaatca agtcattata 2100
cataaagtat cagaagataa tcaggcctaa ataatcgccc ttgtcgaaat tacatgatta 2160
tcttcctaaa ctcaggttac aaggttgtgg gtccgtaggc ctgtaggtaa atccatgacg 2220
tcgatgaggc ccatataaat caaggattat cgcactgttg aacggttaac gtgtaatgct 2280
agctttccga tatcaaggcc taaataccgc gatttagtac agtgccgaaa tagataacaa 2340
gctccggtgg tttcaaaaag tggtgatctc gatgtcagcc gcaaaaaaaa aaaaaaaaaa 2400
aaaaaaaaaa aaagaattc 2419
<210> 20
<211> 1080
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 20
gatttaggtg acactataga agcgtggggt cgcgaaagaa gcgtatccct ttgagggctc 60
ctggatatgt ccacaccgtt ccgtttttgg cctatgcacg tcggttgtgt tctacgacct 120
tcgggttgta gcatgcttag cgggatcacg agccagtgcg agtttaggtg cgtgactaag 180
tttcctatac gtgtccgatt gacattctat tttatttatt agactggtga tatagtcgac 240
agtagtagat tgagtggacg aataaactac caaactaaaa atcgctaacc cagccatgaa 300
agagctagac agaactgccc gcgttgtacc tgcgctctcc tctccgcgat tattcatcca 360
tgttgcacca tggaacgatg cgcatctaaa cgatggctta taaatgtagt agtcaccaca 420
gaaatatgtc gcacgtagtg ccaactgaac gtgagagtga cgcgtaggtc taacaccgag 480
ggtcggagag gtcatagcga gcatccaaac acatgggaaa ccaacggact ccggagtgct 540
aatatgaata caaccgctcc acgctcagga aaaaagaaaa aaaatatgcg agcatatgag 600
atcgggataa cgttgttacg agtgtgtaaa agcgaccgat gcaacaggac aaaaatcgat 660
gccgtgtcta agtgggacag cactcggaaa taaaagactc gcgtcgactt ccttaaactt 720
ggcgtctgtg taatcattgt aaggcgcgca gagtcactac tgctatagat catcgaagga 780
cgtactcagc gacttatccc aaagtctttt acttaactct tagctatagc ccattaaaag 840
tataactcta ctatatatta acagatattt gtgatgatgg tttgacgaca gcaaagggaa 900
tcttagtttc atttaccggg ctcagttaac gaagcttcta tcactcccga cgtgctttga 960
atcgtgtctg ctcccgagaa ttgaataccc cactaaagga cttctcttat tagtttatac 1020
agttacgaag ttttaaaaat ttctaaaaaa aaaaaaaaaa aaaaaaaaaa aaaagaattc 1080
<210> 21
<211> 497
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 21
gatttaggtg acactataga aggccgggcc cctcgcccgc gagtacgacc ggcgagatca 60
ccgctacggc gccgatacgc gtaagacgtg cgcggacggg tacgctcagt atgaaaccta 120
gtcgctctcc agccattccc aacgccgacg caatgggaag gacgcgctaa gcgcggtatg 180
gactgtgctg atatacgaac atgcccgggt acttattttc gttaaacact gggagagggg 240
tactggtggc attatggtct ccttcttcga acatagtaag cctactgcgg ttaccagggg 300
gggcccaggt atgagactta tgatgagtgt gatagcgatg gcgatctgat gccagtgggg 360
ccacgatttg ctccccgtct ttatactggc ttgactctat ggtatctgta aaagaagcgg 420
cgggttgata aatgataatt tcataaagat ttaatccaaa aaaaaaaaaa aaaaaaaaaa 480
aaaaaaaaaa agaattc 497
<210> 22
<211> 1059
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 22
gatttaggtg acactataga aggccgggcc cctcgcccgc gagtacgacc ggcgagatca 60
ccgctacggc gccgatacgc gtaagacgtg cgcggacggg tacgctcagt atgaaaccta 120
gtcgctctcc agccattccc aacgccgacg caatgggaag gacgcgctaa gcgcggtagt 180
cgcggacagc gggtcggggg gatagatgct ggaggtagat gtgtccacat tgttgagagt 240
ccaggggcac gcggaagtgg atcgggggaa ggacgcgtta gcaggtgtct cgacgatgcc 300
gttttttaca ggagagcgtt gggtggtttc tgccttccat aattagtgga ctgtgctgat 360
atacgaacat gcccgggtac ttattttcgt taaacactgg gagaggggta ctggtggcag 420
ttttgggccg ctcttctctt tgagttctaa gcacgtcggt gaccgtacgg gcctagtggg 480
tctatgttcg tggagggtga tatctacgtt cggaggagtg atacgtcctg tacggcggcc 540
gttgccatcg gctgagtggg gtcttggtaa gggcaccata cgacctgagg acgtatggct 600
acgtcacctt agcgtgcacc ccccggacac gagtcggccg ccctctcacc agagtggtca 660
ccaggcggct cccgggcggg gtctaatttc ctgacccctt ggcctctcca cgcggggggg 720
cattggacga tgggacatcc catctgggcg gtggatctgt ccggccccca aggagggttt 780
atttttcaat cataggtcgt ttgtttatgt tagttatggt ctccttcttc gaacatagta 840
agcctactgc ggttaccagg gggggcccag gtatgagact tatgatgagt gtgatagcga 900
tggcgatctg atgccagtgg ggccacgatt tgctccccgt ctttatactg gcttgactct 960
atggtatctg taaaagaagc ggcgggttga taaatgataa tttcataaag atttaatcca 1020
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaagaattc 1059
<210> 23
<211> 1033
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 23
gatttaggtg acactataga agtcctgcct gtcggtgttg cgcagactct cgttagcggg 60
gtgtgctggg taaggtaaca tctttataac cgtggcaatt agtctatcag gaaacaatga 120
cgaacagagg aatcactcac tgtatacctc gatagcagaa cggccttccg aagtgaccgg 180
ctgacgtcca gggttagcag atatctcatt caacaggaaa tgacgggtgg tagctgaaat 240
tttgactata attttctgat agctaaacct attatacaaa gatacgtatg gtaggcacat 300
ttccgtactt aaaaatgtag gagtactagc tgttatgcat aaaaaattta gaccgagtaa 360
tcctattcag gatcagcgta agaacttgac cagtgacttc ggaatgattg aaaataccaa 420
attgggtaat ttcgtgttcg aacaatgtta gcgttgggca acaataatgt gttaggttgg 480
ctgtaatata aagtctaagg tagaggtgta acaaaagatt accaggtctg caacgtgata 540
taatgctttc accgacaaga attacaagtt acaagggcac gctcttatat cgatcataga 600
agtacattaa gctcagtgaa atcaaggctg cgactatgtg tcgggttctt cctcttaact 660
cgtttacctt ggatcgtttt cacaaagtaa cagaaggaaa agaaatactg agagttagac 720
atagcagaca ttaacccgtt ggtagggacc caaacccgga gacgctatat aacccgtgga 780
caacctctaa tatcggctgt ctcgcgctct ctgcagctat cagaaaccga tttaggtaac 840
tctatcacgc tgcccaaaaa atgaatagac gacgattaac tctggagagg accccacccc 900
cttccattct cgccagttct gtaagacgct tggttgaagc ttgaatagtc cgcactcgaa 960
gccagctgaa tttgggggta ttggtaaaca agtcatgaaa aaaaaaaaaa aaaaaaaaaa 1020
aaaaaaagaa ttc 1033
<210> 24
<211> 662
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 24
gatttaggtg acactataga agtcctgcct gtcggtgttg cgcagactct cgttagcggg 60
gtgtgctggg taaggtaaca tctttataac cgtggcaatt agtctatcag gaaacaatga 120
cgaacagagg aatcactcac tgtatacctc gatagcagaa cggccttccg aagtgaccgg 180
ctgacgtcca gggttagcag atatctcatt caacaggaaa tgacgggtgg tagctgaaat 240
tttgactata attttctgat agctaaacct attatacaaa gatacgtatg gtaggcacat 300
ttccgtactt aaaaatgtag gagtactagc tgttatgcat aaaaaattta gaccgagtaa 360
tcctattcag gatcagcgta agaacttgac cagtgacttc ggaatgattg aaaataccaa 420
attgggtaat ttcgtgttaa cccgttggta gggacccaaa cccggagacg ctatataacc 480
cgtggacaac ctctaatatc ggctgtctcg cgctctctgc agctatcaga aaccgattta 540
ggtaactcta tcacgctgcc caaaaaatga atagacgacg attaactctg gagaggaccc 600
cacccccttc cattctcgcc agttctaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaat 660
tc 662
<210> 25
<211> 2675
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 25
gatttaggtg acactataga aggagattat gcgtctaggt ttgggaagga tactcggaga 60
tggacatacg agaaaagctc ctcccgtgga actctagagg gcatcacgaa cggtgcggta 120
gagaaagata tagcacctct ggagcggagc gactggcccg gagcagccac atctcgacag 180
agcccgaaga aaccaatagg aaagacgaac cagattcttg ggtccctgcg tacagtccag 240
aatcggtttg cgtgtgcatc gagggttgga gcggtcctac gcgggaggag aacagtgtcg 300
cttcatagta ctggtcacgg acacctatag acagtccggg ctagtgatcc cttttcctca 360
gacgccaaga atcggtggtc cacctcagcg agaagctctc aagatggaga ccgaaacagc 420
ttgatcttgg ctccgatatc gcattgtaca ccgctcctac cagacgcaag tgccagccta 480
ggatcctcaa aagcagggtc tcgcaatccg taatctcaac ggagacctcc cgaggcctgc 540
cagccccttt tatcgtgcgg tcttcccgat gcgactctcc ggagtgggcg ggttactcgg 600
cgtagtagag ctcgattgag ggcaattgat cactggacct acagggcgtc catcccccaa 660
tgacccggct caaagaagca gtgcgtgggg tggagaacgc gcgagtatat taagcccgag 720
cgggatagag caagggatcc cgagtagtat catgtaaagc aataggccta agcatctcgt 780
caataacact cggcgctaga cgtcaggaat agcggttgcc aaccggtgtc gtgtgtgtat 840
agcatcgagc cgcttcccgg cctctgaaga cttctagctc actgaactcg agatcgctcc 900
atatagccac gcgatttctc gagactatag acaaagacgc tgacggggtt agaccttcgg 960
aaatgacgca tataaagatc cttacgcatc tagcagatcc tagcgcgcca tgagtggaca 1020
gtcaaacgaa tttgcagggc catgtctcca ttcttgcccc cgtcagccgc acgtgaaagg 1080
cgctcgtgct ctggcgttgg gggtcgaaac ctttgaccca cccccaaggg aaggcctgag 1140
cactgaagcc caggccctcc tcggcatatg cccgcctcct ttgggcgacc ttccaccatg 1200
acagatttaa gatgtaccgg ctgccggctg ctccccgtcc cctcgcgata actcagaggt 1260
cacctgagag aagggtagca cgagccgagg ggcgtctggg tagggagggg gcattagagt 1320
cggccgtggg aggaacgaag tcgaccagaa cccgatggga agatatcagc aagagaagac 1380
aactagaggg taattagtcc tgcgtgagag ccttacccaa gctcacgtat acacgcagaa 1440
agcaagcctc aaaaacgaga gacgccgtcc aatgcgcccg ttacgagaga gggcctcgcc 1500
gcagggaacg ctctcccctc ccctgccccc ccgacaggac gccctcagcg aaacgcgata 1560
agaaaagacc ccgaagttaa accagaagcg tcatcgccgt gtttcagata gagagacagc 1620
cggagctctc gtaaacgtcg cacgggcatg ctactaacag gactcacgtg aatcgcagcg 1680
attggggttg gtaggattag gcgaccggaa gcagtcacca atcagtcccc ccaacaatac 1740
cgcattgccc gagcgagcac caagcattta ggctacagcc ccgggtgcag ggatggagcg 1800
cgtcccaagc gaagcccctc atgtccaact cgttgttgac ataatcattg atgacgcgcc 1860
tcgccaagct acgggcccac ccagccctac cgtaccaact ccacccaatc ctcgaacaaa 1920
caatagttgc gcatttgggt gagagctgaa agaaccgaat ggagagtgcg cgtaatgtag 1980
caattaaaaa cggattgcca gcagacttgc ttcggtgcac gccgccgtaa cgacaatagg 2040
ctcgcagcag agatctcata cgttacgttc catcgtggaa acaacaagaa gcaggccgag 2100
aagaaccgag aagacccgaa agcgacaggt cgccttgtat aggcccttgt tacttatgca 2160
accacaaata cactagggac acacgtggct tcccagcttg ttgaagtgca tcctcccaag 2220
aaccgcgact gttgacgcct tcaggagcca tgaggaggca atagaagggg caagttaaat 2280
aagataattg aattaaaaat atagtgatta acaagatcta ctggctgacc tcccgcatcg 2340
gtgcgatcgg tctcggggaa gaccatcccc gaaagagtag atccttctac tatcggcaat 2400
cctaatgagg ggtaaattga agcacaacaa gattttaaaa ataatattta tttaaacctt 2460
ctcataatca gttcccctac actcctcacg accccaaagc agacgagcga aacacgttat 2520
ttcgtagcag accccagact agggattctg tcgcttccca tcgatcttac ggaccagtaa 2580
tactgtcgat atcgttaccc tctcaggccg caactgagaa atatacaaac ctagcgctaa 2640
aaaaaaaaaa aaaaaaaaaa aaaaaaaaag aattc 2675
<210> 26
<211> 2965
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 26
gatttaggtg acactataga agcggcgagc ccgtggttgg agcgagcccg atcaccggca 60
ggtgcagccc cgtcgaccgc cccgccgccc cccccgcggc acacgggccg gtcggagcct 120
ggccgccgca ggctcgcccg gaatcgccgc gacacgccca agcacggcgg ctgggaccgt 180
atacatcgcc agttaagccg cggaccaaac cggcggacgg agggagagaa attaggccaa 240
ccgagcgccc cgccgtgagg tccgtctccg gacttccgcg cccgaccccc gtacacgcca 300
gcaataacac ggcaaagagc ctgtgcccca caagccacta cggagttagg cccgcagcga 360
cgaacggtgc ggtagagaaa gatatagcac ctctggagcg gagcgactgg cccggagcag 420
ccacatctcg acagagcccg aagaaaccaa taggaaagac gaaccagatt cttgggtccc 480
tgcgtacagt ccagaatcgg tttgcgtgtg catcgagggt tggagcggtc ctacgcggga 540
ggagaacagt gtcgcttcat agtactggtc acggacacct atagacagtc cgggctagtg 600
atcccttttc ctcagacgcc aagaatcggt ggtccacctc agcgagaagc tctcaagatg 660
gagaccgaaa cagcttgatc ttggctccga tatcgcattg tacaccgctc ctaccagacg 720
caagtgccag cctaggatcc tcaaaagcag ggtctcgcaa tccgtaatct caacggagac 780
ctcccgaggc ctgccagccc cttttatcgt gcggtcttcc cgatgcgact ctccggagtg 840
ggcgggttac tcggcgtagt agagctcgat tgagggcaat tgatcactgg acctacaggg 900
cgtccatccc ccaatgaccc ggctcaaaga agcagtgcgt ggggtggaga acgcgcgagt 960
atattaagcc cgagcgggat agagcaaggg atcccgagta gtatcatgta aagcaatagg 1020
cctaagcatc tcgtcaataa cactcggcgc tagacgtcag gaatagcggt tgccaaccgg 1080
tgtcgtgtgt gtatagcatc gagccgcttc ccggcctctg aagacttcta gctcactgaa 1140
ctcgagatcg ctccatatag ccacgcgatt tctcgagact atagacaaag acgctgacgg 1200
ggttagacct tcggaaatga cgcatataaa gatccttacg catctagcag atcctagcgc 1260
gccatgagtg gacagtcaaa cgaatttgca gggccatgtc tccattcttg cccccgtcag 1320
ccgcacgtga aaggcgctcg tgctctggcg ttgggggtcg aaacctttga cccaccccca 1380
agggaaggcc tgagcactga agcccaggcc ctcctcggca tatgcccgcc tcctttgggc 1440
gaccttccac catgacagat ttaagatgta ccggctgccg gctgctcccc gtcccctcgc 1500
gataactcag aggtcacctg agagaagggt agcacgagcc gaggggcgtc tgggtaggga 1560
gggggcatta gagtcggccg tgggaggaac gaagtcgacc agaacccgat gggaagatat 1620
cagcaagaga agggagcaaa ccgcaaggcc cacggccagg agcagaaaac aactagaggg 1680
taattagtcc tgcgtgagag ccttacccaa gctcacgtat acacgcagaa agcaagcctc 1740
aaaaacgaga gacgccgtcc aatgcgcccg ttacgagaga gggcctcgcc gcagggaacg 1800
ctctcccctc ccctgccccc ccgacaggac gccctcagcg aaacgcgata agaaaagacc 1860
ccgaagttaa accagaagcg tcatcgccgt gtttcagata gagagacagc cggagctctc 1920
gtaaacgtcg cacgggcatg ctactaacag gactcacgtg aatcgcagcg attggggttg 1980
gtaggattag gcgaccggaa gcagtcacca atcagtcccc ccaacaatac cgcattgccc 2040
gagcgagcac caagcattta ggctacagcc ccgggtgcag ggatggagcg cgtcccaagc 2100
gaagcccctc atgtccaact cgttgttgac ataatcattg atgacgcgcc tcgccaagct 2160
acgggcccac ccagccctac cgtaccaact ccacccaatc ctcgaacaaa caatagttgc 2220
gcatttgggt gagagctgaa agaaccgaat ggagagtgcg cgtaatgtag caattaaaaa 2280
cggattgcca gcagacttgc ttcggtgcac gccgccgtaa cgacaatagg ctcgcagcag 2340
agatctcata cgttacgttc catcgtggaa acaacaagaa gcaggccgag aagaaccgag 2400
aagacccgaa agcgacaggt cgccttgtat aggcccttgt tacttatgca accacaaata 2460
cactagggac acacgtggct tcccagcttg ttgaagtgca tcctcccaag aaccgcgact 2520
gttgacgcct tcaggagcca tgaggaggca atagaagggg caagttaaat aagataattg 2580
aattaaaaat atagtgatta acaagatcta ctggctgacc tcccgcatcg gtgcgatcgg 2640
tctcggggaa gaccatcccc gaaagagtag atccttctac tatcggcaat cctaatgagg 2700
ggtaaattga agcacaacaa gattttaaaa ataatattta tttaaacctt ctcataatca 2760
gttcccctac actcctcacg accccaaagc agacgagcga aacacgttat ttcgtagcag 2820
accccagact agggattctg tcgcttccca tcgatcttac ggaccagtaa tactgtcgat 2880
atcgttaccc tctcaggccg caactgagaa atatacaaac ctagcgctaa aaaaaaaaaa 2940
aaaaaaaaaa aaaaaaaaag aattc 2965
<210> 27
<211> 942
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 27
gatttaggtg acactataga agcctgcaac gcccctctat cacgcgagtg agggacaagg 60
aacgtcaatg tggggagaag taggtgacgc tgtacccatt gctcggtacc ccaatccgga 120
gcctctagta ttcctcagtg tgggttctaa ccaatatgga agttgttaca ggttgtatga 180
aattattcgc cggacgtcag cacgcggtac agacctgagc atggtccggc aacggcgcac 240
acacacccgc ctagaatcga cagccacgaa caccgagttg gagacgttac ccgccctagg 300
cagtggattg gacaagttga gttagcttga cccccctggg gagaaccaat gatcaccgga 360
acttgtgttc aagccgacac tgccgctccc cggaggagct ctcccggtac tctgctggga 420
cacgaaatgc agacctggtc ctctctgacc ggatgagcgc cgagccaaga aaatggcagt 480
gcatacgttc cagagtgatt ccggtcctcg acacaactcc atgtcgcggt gtggtccagc 540
agtcgacagt gtgcgtgggc ggggccgagc cctcggcgca cggccgtcgc cactgcaggg 600
atgacgcctt tctacccttg gcgtagcagg cgtgctggcg catcgcaggc ccttcctggc 660
tagcccgaac caggaaccag ccgcggttgg gtcccatatt cccatgcggg tcgtttgggc 720
gtggtcggtt ccggcttgtg cgttggcgtg gggggagggg aacgtagggc accgtcccgt 780
ccgcttggct agttttcgat tcttgctctc taggttgccc cctacggccc tccttcctcc 840
cccccgactc tacggagccg gaagccccca cctgtcccct ggagaatgac tctcgcgccc 900
cccgccaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaat tc 942
<210> 28
<211> 948
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 28
gatttaggtg acactataga aggcgactct tcgccgcacc agcggcgcct gcgcacaggt 60
ccccgacagt cagcgccccg ccggagtggg gcgcgaccgc cgcgagcgga aaagcccacc 120
ccagaccatc ccagtcgccg agcccccccc cgcgccccga ccggcgccgg gccggccctc 180
cccaggtcac agtgtgtcca gataggagtg cgccggagac ctgagcatgg tccggcaacg 240
gcgcacacac acccgcctag aatcgacagc cacgaacacc gagttggaga cgttacccgc 300
cctaggcagt ggattggaca agttgagtta gcttgacccc cctggggaga accaatgatc 360
accggaactt gtgttcaagc cgacactgcc gctccccgga ggagctctcc cggtactctg 420
ctgggacacg aaatgcagac ctggtcctct ctgaccggat gagcgccgag ccaagaaaat 480
ggcagtgcat acgttccaga gtgattccgg tcctcgacac aactccatgt cgcggtgtgg 540
tccagcagtc gacagtgtgc gtgggcgggg ccgagccctc ggcgcacggc cgtcgccact 600
gcagggatga cgcctttcta cccttggcgt agcaggcgtg ctggcgcatc gcaggccctt 660
cctggctagc ccgaaccagg aaccagccgc ggttgggtcc catattccca tgcgggtcgt 720
ttgggcgtgg tcggttccgg cttgtgcgtt ggcgtggggg gaggggaacg tagggcaccg 780
tcccgtccgc ttggctagtt ttcgattctt gctctctagg ttgcccccta cggccctcct 840
tcctcccccc cgactctacg gagccggaag cccccacctg tcccctggag aatgactctc 900
gcgccccccg ccaaaaaaaa aaaaaaaaaa aaaaaaaaaa aagaattc 948
<210> 29
<211> 1176
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 29
gatttaggtg acactataga agccgtccca agggcgcccg ccgcgaccgt gagccggcac 60
ccccgaccgg ggcggcgccg cgtccgtcgt gctggtcctc cgccacgagt ccgcattcgg 120
tgaaagagcg gcggcggacc ggggggcgat actgcttacc gcgccgtcgc acttggtcct 180
cgtttccgtg ttccgcaagt gttatagacg gcataaacct tgcggaaggg cgaactggga 240
cacactgacc gtcccccgag caatacgtca accaagacgc gctgagaggc accgtatgcg 300
gaatggacga cgggcggcct cagagcatga taaggcatag aggccaacat ggacacccgt 360
cgcgtcctcc ccacagtccg aggacggtcg ggggtttcag gctgcgaagg acccttcacc 420
gcagtgtcga tggcacggtt cgacggcagg agagctgtgg ggtgcatgtc cgctgtgtcg 480
agcttctgca cgactatcct ccctccaaat tacaaactat agaccccaac taccgacaca 540
cattcatctc actcaggcgg ccacaatcgc cacgaacacg cgttcgagga tgcgagaccc 600
acaggtcatg gcctcgcccc ttgttccacc cagatctgtc accgtgaggt ggaagatcct 660
ggtctggcgg tacacaccgg acggttaggg accgaacaat gttggcctga ggtttggaca 720
gggaatggtt ctccggatag cacctcgact tatcggcgcg gcacacccct agaactcgtc 780
gtaccgggac gcattcgctc tgccaccagg acaagtcctc gacacgtctt tcaagagtca 840
tacctaaatg ctccaacgcc ctaccgccac aggacaatgg acgcgcaggt ccacttacgt 900
gaaacggtcc tatggtttgc aactcgtgat cgccgaggta ctgccattgt actcgcttca 960
caacacgcgt gttggtttga cgcccgaccc atttggcgca cgagcgttgt gactctttag 1020
atataaatta ccagacgaac agtataaata aagacagcct atcacacatc cacatgcgtg 1080
cggggacacc ttccgctccc cccagctcaa tacaaacacc ggcaccgtaa cctttagccg 1140
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaattc 1176
<210> 30
<211> 1562
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 30
gatttaggtg acactataga agccgtccca agggcgcccg ccgcgaccgt gagccggcac 60
ccccgaccgg ggcggcgccg cgtccgtcgt gctggtcctc cgccacgagt ccgcattcgg 120
tgaaagagcg gcggcggacc ggggggcgat actgcttacc gcgccgtcgc acttggtcct 180
cgtttccgtg ttccgcaagt gttatagacg gcataaacct tgcggaaggg cgaactggga 240
cacactgacc gtcccccgag caatacgtca accaagacgc gctgagaggc accgtatgcg 300
gaatggacga cgggcggcct cagagcatga taaggcgcgc agcgggttag acgtgactcg 360
cagcctcgct acaagccgag gaacccgcgg tgcacccatc cacaggcata gaggccaaca 420
tggacacccg tcgcgtcctc cccacagtcc gaggacggtc gggggtttca ggctgcgaag 480
gaccaggctc tagctggcgc ggtggtacca ttgcggccag cttcaccgca gtgtcgatgg 540
cacggttcga cggcaggaga gctgtggggt gcatgtccgc tgtgtcgagc ttctgcacga 600
ctatcctccc tccaaattac aaactataga ccccaactac cgacacacat tcatctcact 660
caggcggcca caatcgccac gaacacgcgt tcgaggatgc gagacccaca ggtcatggcc 720
tcgccccttg ttccacccag atctgtcacc gtgaggtgga agatcctggt ctggcggtac 780
acaccggacg gttagggacc gaacaatgtt ggcctgaggt ttggacaggg aatggttctc 840
cggatagcac ctcgacttat cggcgcggca cacccctaga actcgtcgta ccgggacgca 900
ttcgctctgc caccaggaca agtcctcgac acgtctttca agagtcatac ctaaatgctc 960
caacgcccta ccgccacagg acaatggacg cgcaggtcca cttacgtgaa acggtcctat 1020
ggtttgcaac tcgtgatcgc cgaggtactg ccattgtact cgcttcacaa cacgcgtgtt 1080
ggtttgacgc ccgagtaccg gtgggtcgta tcactaacca gcccgggggt tgcggggcgt 1140
catcccccta tacgcgccag cggctcccgc agcccatttg gcgcacgagc gttgtgactc 1200
tttagatata aattaccaga cgaacagtat aaataaagac agcctatcac gtcccacttg 1260
ggccgaagct tggcctgcgc gcagatatgc ctgagtgacc tgcctttggt cgcgaccagc 1320
acctccgcgc gcccccccca gcaaacggac gtcccccgca gcacagctcg gcgctgcgca 1380
acgtgggcac cacagagatg ggcctccccg agtggcgctc ctccctcgat ttgcccgctc 1440
ctctcctaga gacatccaca tgcgtgcggg gacaccttcc gctcccccca gctcaataca 1500
aacaccggca ccgtaacctt tagccgaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaat 1560
tc 1562
<210> 31
<211> 2044
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 31
gatttaggtg acactataga agccggcgca cgccagggtc gccccgcgcc tccgccgccg 60
ggcgcacaag ccgcgtctcc ctccctgggg gtggcggccg cccgccggcc cggcgcgcct 120
agggcgcggc ggtccatgaa cggctcgcta ccaggcaggc acttaggcag cctgatgttg 180
tagcgttaag aatggccgag cggaagcggt taacagcctc cagccgcgaa ccaaacccca 240
agggatgaga acggccaatt acccaaatgt acacaacact cccacccccg tgctcccacc 300
accggccctc taggaccggg cgacaacgag ttagcaccgt tgtctccgcc ccacggcttt 360
gcccagcaca cctcgcgcct ctacactgac cgactaggcc tgaccacctg tcagcctgct 420
cctaagaccg cacgaatagc ccgtagtttc cccgccgcgt caggacgagc cggccactgg 480
gggcataatc atcaggccgt agacgagctt tcgtggcccc tcggccggtc cgggtgcaac 540
ggccccggtc cctggccgac tggacaacca atcccctggt gtgatcggca ccgaacttgc 600
gccagccacg tgccctcaag agcacgggac tgccctgcac cgacccgcat ccctcacccc 660
gtagacgccg cactccaacc tgtagcggga aaaattggca gagtactgtg ccatcgcaac 720
gatgattaag gagaaagagc agcaacgccc aggcaaagaa aaagggacga caaaaccact 780
caagcaccga gcggaacagc ctaatcgcgg actggcgcgt atcgtaactc cggcctaaca 840
tattcgaagc atgagcaggc acccccgcag cttcgaccgt tatcgtgata ctgtgagccc 900
tctggcacag gtaccagcag aagcagggtg gaaagagcga agaagaagct accgcgagaa 960
gaagatgaaa ataagaccgt caggctttgc agcgcaggcg ccccggccct agacacttcg 1020
ccatagggat ccgaacgctg aaacaaagga ccgagcactc cacccacgcc gactcccaca 1080
atcacacgta gatgtccgca atgacccacg cgtcctccag tcgtccgcta gtgcagcccc 1140
tcggagttcc cgcactccgt tcggacccgc gcgggctact gggccgtccc cgcggcggct 1200
ccgtgcgata atcctcccag gcccgttccc cgccgcacgc tgctccccct cgcatccacc 1260
ccgcgcctca agtcgaaatc cgctcccgga ctgacgcccc cgccccccct ggttccacgt 1320
attatcacgc acgactcccc ctccccgccc cactctaacg gccctcgccg cctgatcgtc 1380
aggcgggatg cacgcgacgc ccccacacgt tccgacccta ggctgatacc cgtcttcatc 1440
gctatcgtcg ccgcccgaga tagcccaacc cacctccctc cgcgccagat gggcccagga 1500
gagaataggg tgcaccgatc gcgggcccga atcagcgttc caggtcaaga gcactccgcc 1560
ctacgggcac taccccattc cttcccaccc cctcgttact agtccgacgc agacgttcac 1620
tggcgcccag aggtagggga gccaataaac ggaagaacgt ggccgaggga cgtgccagct 1680
acgggcatga gcgcaaggac cctcgggcag ggctctcacg ctccccaacc ttctctccgt 1740
aaagtccgcc aagcgctggc caaagaacta cccagcacag ccaccccccc atgcgtaagc 1800
ccccgagtta acggtggagt cgcttccctc gtcccgccgc cgttaccctg tatgattcac 1860
cccgtggcct agtgcaacgt accacgcggc ccgccctcgc cgccccgaag ccccgggcgg 1920
ccggtcgtca gcatgagtgc ccatagaccg ccacgcgcgt aaacaccggc cgagccgccg 1980
ctggcttttg cgtgtcgacg aacaattgaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaga 2040
attc 2044
<210> 32
<211> 2027
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 32
gatttaggtg acactataga agggcagtag atcagctgaa gtagtatcag tggttattgt 60
cacgaactat cttttttcgt ctttcgctcc attttaaagc gggcatgtcc gtggccggcc 120
agacctgcgg agttggtctc ctcctctcgg ggtctgctcc ggtggcgatc ggtaaattgg 180
attacgtctc aggactcatc tattgcgggc tcgtcatgag agaagcttag gcagcctgat 240
gttgtagcgt taagaatggc cgagcggaag cggttaacag cctccagccg cgaaccaaac 300
cccaagggat gagaacggcc aattacccaa atgtacacaa cactcccacc cccgtgctcc 360
caccaccggc cctctaggac cgggcgacaa cgagttagca ccgttgtctc cgccccacgg 420
ctttgcccag cacacctcgc gcctctacac tgaccgacta ggcctgacca cctgtcagcc 480
tgctcctaag accgcacgaa tagcccgtag tttccccgcc gcgtcaggac gagccggcca 540
ctgggggcat aatcatcagg ccgtagacga gctttcgtgg cccctcggcc ggtccgggtg 600
caacggcccc ggtccctggc cgactggaca accaatcccc tggtgtgatc ggcaccgaac 660
ttgcgccagc cacgtgccct caagagcacg ggactgccct gcaccgaccc gcatccctca 720
ccccgtagac gccgcactcc aacctgtagc gggaaaaatt ggcagagtac tgtgccatcg 780
caacgatgat taaggagaaa gagcagcaac gcccaggcaa agaaaaaggg acgacaaaac 840
cactcaagca ccgagcggaa cagcctaatc gcggactggc gcgtatcgta actccggcct 900
aacatattcg aagcatgagc aggcaccccc gcagcttcga ccgttatcgt gatactgtga 960
gccctctggc acaggtacca gcagaagcag ggtggaaaga gcgccatagg gatccgaacg 1020
ctgaaacaaa ggaccgagca ctccacccac gccgactccc acaatcacac gtagatgtcc 1080
gcaatgaccc acgcgtcctc cagtcgtccg ctagtgcagc ccctcggagt tcccgcactc 1140
cgttcggacc cgcgcgggct actgggccgt ccccgcggcg gctccgtgcg ataatcctcc 1200
caggcccgtt ccccgccgca cgctgctccc cctcgcatcc accccgcgcc tcaagtcgaa 1260
atccgctccc ggactgacgc ccccgccccc cctggttcca cgtattatca cgcacgactc 1320
cccctccccg ccccactcta acggccctcg ccgcctgatc gtcaggcggg atgcacgcga 1380
cgcccccaca cgttccgacc ctaggctgat acccgtcttc atcgctatcg tcgccgcccg 1440
agatagccca acccacctcc ctccgcgcca gatgggccca ggagagaata gggtgcaccg 1500
atcgcgggcc cgaatcagcg ttccaggtca agagcactcc gccctacggg cactacccca 1560
ttccttccca ccccctcgtt actagtccga cgcagacgtt cactggcgcc cagaggtagg 1620
ggagccaata aacggaagaa cgtggccgag ggacgtgcca gctacgggca tgagcgcaag 1680
gaccctcggg cagggctctc acgctcccca accttctctc cgtaaagtcc gccaagcgct 1740
ggccaaagaa ctacccagca cagccacccc cccatgcgta agcccccgag ttaacggtgg 1800
agtcgcttcc ctcgtcccgc cgccgttacc ctgtatgatt caccccgtgg cctagtgcaa 1860
cgtaccacgc ggcccgccct cgccgccccg aagccccggg cggccggtcg tcagcatgag 1920
tgcccataga ccgccacgcg cgtaaacacc ggccgagccg ccgctggctt ttgcgtgtcg 1980
acgaacaatt gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa agaattc 2027
<210> 33
<211> 721
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 33
gatttaggtg acactataga agggattggc ccctccgcaa cgattgggca ccgccccccc 60
tctacgctct cggtctcgaa tgttcttggt ctttcttatg gcggacagct cctgggtaac 120
gcagccttac tacccggcga atagtagtgg atgtcagagt ggttcatctc aagtggagcg 180
gcatggcacc attaggcggg gcggcgcgca agagacgcca gcgtgtaagt gaaccactca 240
cgcgccagcc cagtgcgcat cgaacgggca cacagtccgt ggcgggctcc ctcgaaaacg 300
accgcgatcg gatggtgatt gcagcatgcc tcggccggct taaactcggc ccatccgcag 360
gactctgcac atagccccat ctcgctcgag caacctagcc acatcgcccg ccccctgggg 420
cctcgagtcg accgtgctcc ggctcctcct ccgtccgcca accacagtag tatcgtgcct 480
caggacctac cccgcgcgcg ttcacaccaa cgaccgcagc tctggacccc acgcccctgt 540
tgcgggtgcc ttggctgcgc ataccgcccc ccgctcagct tcggccatag acggcactcc 600
gacccccgcc actctacagg gttgccggcc caaggtccgc tagcagccgg cgcagatcgg 660
catgtggaag gggccgtccc ccttgaaaaa aaaaaaaaaa aaaaaaaaaa aaaaagaatt 720
c 721
<210> 34
<211> 593
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 34
gatttaggtg acactataga aggccccgtc cagcggctcc gtaccattcg gcgcgctgct 60
cagcatatgc atcgcccccc tggccgccgc ggggcctggg tccaaaaccc tcaaatgacg 120
acagctcgac acccgtcgtc ttgggcgacg ccgtcgagac tccccaccca ctgctatcag 180
tgggtggacc agatgtgcgg ggtgctccgg agagactcca accctgacga acccagcggc 240
gagtgaccct tagcgcgctc cgccattagg cggggcggcg cgcaagagac gccagcgtgt 300
aagtgaacca ctcacgcgcc agcccagtgc gcatcgaacg ggcacacagt ccgtggcggg 360
ctccctcgaa aacgaccgcg atcggacaca tagccccatc tcgctcgagc aacctagcca 420
catcgcccgc cccctggggc ctcgagtcga ccgtgctccg gctcctcctc cgtccgccaa 480
ccacagtagt atcgtgcctc aggacctacc ccgcgcgcgt tcacaccaac gaccgcagct 540
ctggacccca cgcccctaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagaa ttc 593
<210> 35
<211> 1013
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 35
gatttaggtg acactataga aggagccggc atacttagcg gcccggttgc cgccgcgcgc 60
cggcacgcgc tagcgtctgt ccgcgtcgcc cggcgctcgc tctgtggctt ctaccgcgaa 120
gcttgtgcgt cgccagacct ccgcccccgg cccctgggcc gcggcccatc gcgatgcgac 180
ggcggcccgg agtacagccc ccacactaac ggataagata ccgccacccg ctcgtcgcgt 240
ctgtgcgggc acccgcaccc aacagtccgc gtcgcctgtg tccgacactc cgtcgatgga 300
gctcccccaa ccatcgacga acggccgagc tatgtgcgcg gaccatccag ctcaggcccc 360
aagcgcctag cggtgtgcaa ctttggcttc cgggtccacc ggttgttacc cctacatgag 420
tgccgagttt gtcgggccga tccgacggcc cgttaaccac gctcaggcga cacccacctg 480
agtgcctcgg gccccgatcg gtgagcgcgc ccgcgacgga cgacgcgcga gccaatagct 540
gccacgctac cgtcgtcgac ccggtgcgca taccgggccc tgcgaccacc ccacgtgccg 600
gttaagcccg ccctccccgc accacgctac ttcccgctcc ccctcggtcc cccccacccc 660
cgcgcccaac cccctccctt gcgcggccga attactagca ggcgtctaac aaactgacac 720
cacgtacaga cggaaaaaca ccaacctcgg ccgtacctcc ggcacccttc ggacctctgt 780
gccaccacct ctaattcgca agcccacggg cacaagctaa cacaagcgga atgaggcctc 840
ggaaacgccc ataccgccgg ggtgtgaggt tcgttttaat tgtctcgcgg ttccggatga 900
ccagttgctc acatacggcg acgtatgtca ggtccggctg cgctctcctg acgccctcgg 960
gcttcgcggc tctccataaa aaaaaaaaaa aaaaaaaaaa aaaaaaagaa ttc 1013
<210> 36
<211> 685
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 36
gatttaggtg acactataga agcgtctgtc cgcgtcgccc ggcgctcgct ctgtggcttc 60
taccgcgaag cttgtgcgtc gccagacctc cgcccccggc ccctgggccg cggcccatcg 120
cgatgcgacg gcggcccgga gtacagcccc cacactaacg gataagatac cgccacccgc 180
tcgtcgcgtc tgtgcgggca cccgcaccca acagtccgcg tcgcctgtgt ccgacactcc 240
gtcgatggag ctcccccaac catcgacgaa cggccgagct atgtgcgcgg accatccagc 300
gtgtcgcacc gcccctctct tcagtccccc cgtggaccgc tcactgaacg ctcgcactgc 360
cctcctaagc catcttagtc aggccccaag cgcctagcgg tgtgcaactt tggcttccgg 420
gtccaccggt tgttacccct acatgagtgc cgagtttgtc gggccgatcc gacggcccgt 480
taaccacgct caggcgacac ccacctgagt gcctcgggcc ccgatcggtg agcgcgcccg 540
cgacggacga cgcgcgagcc aatagctgcc acgctaccgt cgtcgacccg gtgcgcatac 600
cgggccctgc gaccacccca cgtgccggtt aagcccgccc tccccgcaca aaaaaaaaaa 660
aaaaaaaaaa aaaaaaaaag aattc 685
<210> 37
<211> 2394
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 37
gatttaggtg acactataga aggtggccta cggggaacca gtagggacgg ccacgcggga 60
aaaggcgatc agacccacct ggcctagaga cagaccaggc tataaccagg aactccggtg 120
gaggctcggc gcagctttgg tccacgcgta tctgaaaagc ttacacgacc ggctttgaaa 180
ccaccgcaat caaaaaggga gaatgtcaaa ccctccgcaa caggtgaaaa actagcagag 240
tttaaacatt gtgtcgagac taaaaacagc ccagaaagca aaaggaacga ccctccagca 300
cggaaaaaca acgaaggaat aaaccccaag attggaaatt caacttcgcg aaaaagtgct 360
ccacaccaga aaattcgggc aaagaaagac ctactcacaa gagaaggtcc tatagttacg 420
gtgctggttg ttaatggaat taatagccag atagaacaca gagaggaaat cggttaacaa 480
atgcaacgta aacctaaagt tgactcctac acatagcgaa atgcctgtag gtgaaagtaa 540
aggatgaaat atcctaatcc atacatacag cgaaagcgtg attgttgaac gaagaaggga 600
aacaggcccc ggctctttga atccaggagt aaccaggctt caagcatggc aatcttgacg 660
ttcactcaag catgtctggc cttgtacccc aaaaggaata cactcaaggt ggggaaatat 720
tgagaagata gacaatatcc atgaggctca gccagggata cacactccaa cacggcggtg 780
atcgaagagg tagaaaaaaa agggtaatgg aatatcaaca gcgacgctgc tcttgggatt 840
cccgcgatcg cgcgaggcac ccctaaaagg atcagtcgac atgtctccac gctgagcaga 900
aaggtgaaaa aaagagcaca acgaaatgga taggaggatt gtaaggggat caggaactta 960
tcacagactc atcgaaatag tagcaaccac agaaaaccat atatgaaagg tcaaagtacg 1020
gaaccccgct gaaagcaaag aagcgcataa cttgcgcact tttgagttat gaataaactg 1080
tcgctgtcag gagtaaacga tgtaaatgca accaaattag cacacaaaga agacacggtc 1140
gagatccgcc tgtacaggtg ggggcgattc gcctctttgc actttgataa ttacctcggg 1200
aggtcggccc actccaggac ccactttcgc ctaagtgcaa aaggcggtag gctggtgagt 1260
gacaccaatt gcgtaataag agcgactgga gaggcacgga gatcaacggt aaagaatcat 1320
aaattgagga cgacgggaac aagaacaacg gaagaataga ataatggagt acgaggaagt 1380
tctaactcaa tcgttcaaga caggaagatg agattaacgg gtctgcagca aacaataaat 1440
ggccacaaaa taggtgcaaa actccgttac gcgaaccgtc tacttatcgt tatcctgcga 1500
ggtattttgg gccgtaacat accgtacttt cagctttcta gagttactac attaagagat 1560
taggtgtcgt ccatgtctta gccacagttc taccaacgat cccccccccc cggatcgccc 1620
aaaacgcact actggcgtga acaataaacg gatgcgcctg cctcgtactg gcatttaaat 1680
agtcgacctc agtgccgaaa agagcgtaga gacaacacac acaaaggaag aaaataggaa 1740
gttatagaat acacctaaag aaaggaggca ggaatagaat gcaaagggtg cataaccacc 1800
taaccttcat agctgtgaaa tagcattgac caggcacgac cagaacaatc taaaccggaa 1860
aaaggttaag atcaacagac ggacaacacg acaattggca cacgtgagta tcacatccag 1920
gtctcgactg tctccctgac agccttcata acgcagcccc aaaaagcaaa aagcggataa 1980
tcagtaatcg cgagtgaaca aatcgcaaac cccatgcgag ggggcaagct tagaatatga 2040
gacgaagagt aaccgaacat acgcacaaaa aagtctaaca aaataaacgg tggaactata 2100
gtgtataaat ctgttaaata cgcgcttctt tgaagggtat cgtggtgtgg ataaggcgca 2160
caaaataatg ctgtcgattc gagttggaaa ataggtgtta tatctgtatt taggtgatat 2220
cgctttaaat attacccgtt ccatgttttt aaattgtcat cgtagtctag aagatatgta 2280
atggttaaaa ctgtacttga tcgtttttat ttattgcact gctaagaaca ggatatttgg 2340
tgacattata tagtatgtaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaga attc 2394
<210> 38
<211> 1564
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 38
gatttaggtg acactataga agctgttcgc acacagtcct agagtcctca ttccagctgt 60
ttgcccgtcg atcaaggggc gagtagttat gcccaccgcc cttgaactat tactaggatc 120
tggcgctgtc actcgagttg cctgatcggc aagtgttatg atctcctacg tctggtcgtg 180
aagctcccgg tgcgccaaca gatagggctc attgttagag ggagaacaag agggaggacc 240
cacttcgccg agtatctaaa tcaaaaaaag agcacaacga aatggatagg aggattgtaa 300
ggggatcagg aacttatcac agactcatcg aaatagtagc aaccacagaa aaccatatat 360
gaaaggtcaa agtacggaac cccgctgaaa gcaaagaagc gcataacttg cgcacttttg 420
agttatgaat aaactgtcgc tgtcaggagt aaacgatgta aatgcaacca aattagcaca 480
caaagaagac acggtcgaga tccgcctgta caggtggggg cgattcgcct ctttgcactt 540
tgataattac ctcgggaggt cggcccactc caggacccac tttcgcctaa gtgcaaaagg 600
cggtaggctg gtgagtgaca ccaattgcgt aataagagcg actggagagg cacggagatc 660
aacggtaaag aatcataaat tgaggacgac gggaacaaga acaacggaag aatagaataa 720
tggagtacga ggaagttcta actcaatcgt tcaagacagg aagatgagat taacgggtct 780
gcagcaaaca ataaatggcc acaaaatagg tgcaaaactc cgttacgcga accgtctact 840
tatcgttatc ctgcgaggta ttttgggccg taacataccg tactttcagc tttctagagt 900
tactacatta agagattagg tgtcgtccat gtcttagcca cagttctacc aacgatcccc 960
cccccccgga tcgcccaaaa cgcactactg gcgtgaacaa taaacggatg cgcctgcctc 1020
gtactggcat ttaaatagtc gacctcagtg ccgaaaagag cgtagagaca acacacacaa 1080
aggaagaaaa taggaagtta tagaatacac ctaaagaaag gaggcaggaa tagaatgcaa 1140
agggtgcata accacctaac cttcatagct gtgaaatagc attgaccagg cacgaccaga 1200
acaatctaaa ccggaaaaag gttaagatca acagacggac aacacgacaa ttggcacacg 1260
tgagtatcac atccaggtct cgactgtctc cctgacagcc ttcataacgc agccccaaaa 1320
agcaaaaagc ggataatcag taatcgcgag tgaacaaatc gcaaacccca tgcgaggggg 1380
caagcttaga atatgagacg aagagtaacc gaacatacgc acaaaaaagt ctaacaaaat 1440
aaacggtgga actatagtgt ataaatctgt taaatacgcg cttctttgaa gggtatcgtg 1500
gtgtggataa ggcgcacaaa ataatgctaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaga 1560
attc 1564
<210> 39
<211> 883
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 39
gatttaggtg acactataga agatggatgg gtgtgggaat ggcatccggc caactgtagt 60
cgggttctct tgactcggag gaaatgctta gcctgtgtga cgaggtttgc gcccgagcgc 120
gatctccgta cggagatggt agtcgcgaca taggccatgt gcgagccgta ggctcgggcc 180
aatcacagca ccctcatcga tactccgttg tacttagatc gtacctacag cgagccgatc 240
gagatttggt gtacagtttg tggaacaagc agtttccaat ctaccgcaca gtgacgatgc 300
gccagattat ctcatcagca gcggatcgat agagctggaa aaatatcgtt aagtgacgaa 360
tacccggctg cttcgtcgtt cacaacttct gccgaccgct acccactcac tgtcgtgaca 420
gagacgcctc tacaacgtca cgctgtagac ctcacaaggg ctacggatag gataataccg 480
gggcattcgt atttgattac caggccacgc ctttcctcca agtcttccga gagtcaggct 540
acccgaacga tacttactta gataacctag tcccggccac gacaaagacg accgaacttc 600
tgttaagacc ttaaaggaac tacaaacgac cccctaagga tccgcggaca agccggcgcc 660
tcaattttct tccccggtgg cccgagtttt cttattatgc cttatattat ttttgtccgt 720
tgtggtctct gtatggttac tgttaatatc tctggtattt tggttcgttt gtttattctg 780
taaagttccc tatttttgtt actaatgatt actgacggct tgtatttatt atatgtcctt 840
aaaagctaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagaa ttc 883
<210> 40
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 40
gatttaggtg acactataga agcttcgttc ttcggccctt cgatgcccac gcggctagtc 60
cctggaacac ccagaggact gcccccacgg accccccgac tgtccgcccg acgggcaaac 120
ggcgttggaa ggcccggtcg gtggggcgcc ggcgagcaga aatcgtacct acagcgagcc 180
gatcgagatc tacccgaacg atacttactt agataaccta gtcccggcca cgacaaagac 240
gaccgaactt ctgttaagac cttaaaggaa ctacaaacga ccccctaagg atccgcggac 300
aagccggcgc ctcaattttc ttccccggtg gcccgagttt tcttattatg ccttatatta 360
tttttgtccg ttgtggtctc tgtatggtta ctgttaatat ctctggtatt ttggttcgtt 420
tgtttattct gtaaagttcc ctatttttgt tactaatgat tactgacggc ttgtatttat 480
tatatgtcct taaaagctaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaga attc 534
<210> 41
<211> 1046
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 41
gatttaggtg acactataga agttacttca atgtcccatc tcgttacgtc cattgtctgt 60
cgtcgttttc tgtttcctac cctttactct ttgtatgttc cgaaccgctc tgcgatcacg 120
aacatacaag gcccaacgcg ccgcgcagcc tgaccccgtg cggcggcacc gggccccgaa 180
acgacgggcg gcaaatgggc gggcggcctg tcgggggatg atggcactag ggggtccttg 240
tgagtcgccg cggcgccctc ggtgcccccc tgctggccgg ggggccacga gccaaggagt 300
ctgcgtagac gcatgactag tatcactggc cgttccgtgc cagttaccaa cgcgcaccct 360
cgcgccgtgc ctgaaagtca gcaggcgaag agtgcacgga tagtcgcact tccatcgaca 420
ggttgttgaa caccactagc tcaatgcgcg aagggtctgc aaaggggacc tacgccggtc 480
aggcgcccgc ggcgcgcggc tggtctcaca cggcgagttc acatcgcagg gccacgcccg 540
acggctgcat gggtagcccg gctgcagtcc tgtgacgggc cttattgctg tccatcgacg 600
accccggcga cgccacgcgc cacgggagcg ataggagagc aatggtcgtt ccgccggtct 660
tctaccccgg cccgatgtag ctcgccggcg aagacatgcc ggaagatatc ctacgggact 720
gcgacacccc ggcctgggcg gagattcagc tgagcgcagc tgggggacgg gacactcgtt 780
gttctcccaa actccgcgtt tacgagatgg cacggagcct gtatagagtt ccttctttga 840
gtcattgtaa gattacaatt tatggtgctt ggatatcatc aaggtgttcg acgataaatt 900
gttactttaa tttagttatg cagattctga aagttacccg taacattatt ttgggggggc 960
tatatcactt aattttatta actagattat tatgattatt atatggagag aaaaaaaaaa 1020
aaaaaaaaaa aaaaaaaaaa gaattc 1046
<210> 42
<211> 1285
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 42
gatttaggtg acactataga agttacttca atgtcccatc tcgttacgtc cattgtctgt 60
cgtcgttttc tgtttcctac cctttactct ttgtatgttc cgaaccgctc tgcgatcacg 120
aacatacaag gcccaacgcg ccgcgcagcc tgaccccgtg cggcggcacc gggccccgaa 180
acgacgggcg gcaaatgggc gggcggcctg tcgggggatg atggcactag ggggtccttg 240
tgagtcgccg cggcgccctc ggtgcccccc tgctggccgg ggggccacga gccaaggagt 300
ctgcgtagac gcatgactag tatcactggc cgttccgtgc cagttaccaa cgcgcaccct 360
cgcgccgtgc ctgaaagtca gcaggcgaag agtgcacgga tagtcgcact tccatcgaca 420
ggttgttgaa caccactagc tcaatgcgcg aagggtctgc aaaggggacc tacgccggtc 480
aggcgcccgc ggcgcgcggc tggtctcaca cggcgagttc acatcgcagg gccacgcccg 540
acggctggtt aacaatgtca acggcgtaac ccacagaggg acagcccttc atttgtcggg 600
aggccgggaa cagggaccct catcctcatg gcgccctgtt agacgcaggt ttgcctgctc 660
ggcgccagtg ggctatgcag ggtgcgcgac tactacggga ccacgacgtt ccgtgtgggg 720
tgccgagcgg cgacgcctgg ttcccggcct tgtcaactga ccttgtcccc atcccgttac 780
ttcgagcatg ggtagcccgg ctgcagtcct gtgacgggcc ttattgctgt ccatcgacga 840
ccccggcgac gccacgcgcc acgggagcga taggagagca atggtcgttc cgccggtctt 900
ctaccccggc ccgatgtagc tcgccggcga agacatgccg gaagatatcc tacgggactg 960
cgacaccccg gcctgggcgg agattcagct gagcgcagct gggggacggg acactcgttg 1020
ttctcccaaa ctccgcgttt acgagatggc acggagcctg tatagagttc cttctttgag 1080
tcattgtaag attacaattt atggtgcttg gatatcatca aggtgttcga cgataaattg 1140
ttactttaat ttagttatgc agattctgaa agttacccgt aacattattt tgggggggct 1200
atatcactta attttattaa ctagattatt atgattatta tatggagaga aaaaaaaaaa 1260
aaaaaaaaaa aaaaaaaaag aattc 1285
<210> 43
<211> 1972
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 43
gatttaggtg acactataga agcccctggt agaacatctg ctattccttg ttaaatccga 60
ctatttaggc ctaacgggaa tgatggtctc tactcccttg tagagggtag ggtcctttta 120
taggtgagta cagcatgatt ttgagcgaat caaatatatg attacgaacc taccaacctt 180
gagggcccca aagaaggtac ttatccttgc tatacaggca gttctcacgc atcagtctca 240
cggtgctaaa caccaagtgc catcaggagt tatggccatg atatgcggcg agaagaaaaa 300
gagtaagtcc gcagagcgta gaaacatagg ggaaggcagc caaagacgtc cattaaaggg 360
tggcgaaccg cagagatgag ggcggcgacg ccgccgccac tagaccgcag gaagaggacg 420
gcaacatcac gtgaggggtg aaggggataa atgccggcag gctggacagg tcgcaaagac 480
gagagaaacg ggtccgtggt ccaaaccaaa acacatccac gacccaggag ggataggctg 540
tgcgaggggg gctagctccc aggtcttcaa ccgtacgacg aagacaggaa ctggcgttct 600
aacgccgggg agaggaaaac tccctggaaa ggccccgaac gattaacagt agttcgacgt 660
acaacaagac cgtaaagagc agatacgcaa caatgaaata ggacaaagga aacgaagaga 720
attacgaaat agaaaaacgg acgcaaaact gagggatgaa aaccgacgga tacctctgac 780
tgccgctcgg cgtaccgtta gaatgaggga gagaaaaaga aagacagaaa gcggaatgtc 840
atgctacgtc aaaggaggta cggggaagca aatcgaagag tggaaaacaa aagaaattga 900
gtagcttcat ctgccataaa aaacagcatg ctgcgatgtt aaacgatgaa atgttacaag 960
gtgagaaaat gaagaaggtg actcacggat atttacgaaa attaccccac aactataatc 1020
gtcgaatgaa cgcgtggggc aacggggccc ccggcgaggt gaacgagatg agccgggagc 1080
ccagtggccg cgcacaagga ggctggtaga cactgtccag gggatacggc tacgccggga 1140
gaaagggtct tcacacgaga gcgaagaccc cagggaaggg tgaccgagca tgtgaaaagg 1200
taggtgaaga ccgcaggggt gcacggtata ccgtaggggg aaatagagca agaaaggatt 1260
aaaatggggg aaaggaacgc ccaagaaggg gggcacggag aaaaatggga ggagcagaag 1320
tgaaagagaa agagaagatg gtgaatccac acacgggatc taaagccggt gttgagaaga 1380
aaaacatacc ctatagagac ggatgtttac cgcttgtcca taaaacgctt tcattactaa 1440
tgaacggagg aagtgctcat tagtaatagg agaagatcaa aagtggtacg ttcacgccca 1500
aactactccc gaaagagtga aataggacgt gggatcaatg ccatattcag tgcagcagga 1560
gacacaaata cacgacagaa tcggacacct cgcgagatga ccgttggccc tgagtatttc 1620
tacgtctaac gagggtgaag aacgtcgtgt gagtattgtc acagtaaagc agccacgaac 1680
catcgacccc ataagatggg ggaatatagg gtatcacccc atcagcgtat ctagtgggat 1740
acactaacta aaacagttgg cccctctcca aaagtacaac gcggcttaac ctaggcttga 1800
tgaggctaca acgaggcagt cagccgcaag gaactctgta cgcgtatcaa agaagtgact 1860
cacctatcag accctagggg actggaataa tcaatcgtcg aaaccaccac gagcagagag 1920
tggtcatgaa ggtacgaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaat tc 1972
<210> 44
<211> 2923
<212> DNA
<213> artificial
<220>
<223> Artificial DNA standard
<400> 44
gatttaggtg acactataga aggctccccg ttgctcggcc ccttccgcct tgatctgtct 60
agtgtcgtca tcataaccta tttgccgctt ggagaataag tcccggattc cacacgagat 120
atcatgattt tgagcgaatc aaatatatga ttacgaacct accaaccttg agggccccaa 180
agaaggtact tatccttgct atacaggcag ttctcacgca tcagtctcac ggtgctaaac 240
accaagtgcc atcaggagtt atggccatga tatgcggcga gaagaaaaag agtaagtccg 300
cagagcgtag aaacataggg gaaggcagcc aaagacgtcc attaaagggt ggcgaaccgc 360
agagatgagg gcggcgacgc cgccgccact agaccgcagg aagaggacgg caacatcacg 420
tgaggggtga aggggataaa tgccggcagg ctggacaggt cgcaaagacg agagaaacgg 480
gtccgtggtc caaaccaaaa cacatccacg acccaggagg gataggctgt gcgagggggg 540
ctagctccca ggtcttcaac cgtacgacga agacaggaac tggcgttcta acgccgggga 600
gaggaaaact ccctggaaag gccccgaacg attaacagta gttcgacgta caacaagacc 660
gtaaagagca gatacgcaac aatgaaatag gacaaaggaa acgaagagaa ttacgaaata 720
gaaaaacgga cgcaaaactg agggatgaaa accgacggat acctctgact gccgctcggc 780
gtaccgttag aatgagggag agaaaaagaa agacagaaag cggaatgtca tgctacgtca 840
aaggaggtac ggggaagcaa atcgaagagt ggagttgatt agagcggaac ggacaataag 900
gcgcaaaaag agattagctc ggaggaaaag tacggttgga aaaaaagatt tacacaagca 960
aaaggaaggc tgatcggaaa agtataaggg gcgacgattt aaacccaatg tcatgaggat 1020
aaggagcaaa aagggaaaag gagcggagga ggaggaactg agcgggaaag agaaaatatg 1080
ggacagcgaa aatgaaacgt aagcaactat gaaggtgcgg attacgatcg gagatataag 1140
accaagagtg ggaggaggaa agggaaggaa tggaaagaga agcagggaga agggaaaaga 1200
ccgagaaacg gccaagaacg tctgctgcat tgttagggaa gcgggacaga atctaagatc 1260
cggaagaagg acaaaaagga gaaatagagg ggaacacaaa aggaagagaa agcagaaaag 1320
cggaaaaacg aatcgcaaaa aagagagagg ggatcatctg cgcttacttg aggggacaaa 1380
aaaaggagtg gaagatagag ggaaggaaga aacacgcgag cggaggatgg agacggaaga 1440
gggaagaaaa aaggagaaga gataagagaa aagaaaccac agaagaaagg agaagaaggg 1500
caagggcaaa ggagaacggg aaaacgattc atcgcgtgaa ctaaaacaca gacaatgaag 1560
ggagggggaa aagcataaaa aacaaactaa gagatggtaa acgataccga acatcgatca 1620
agcccgagaa aaaagaaaac aaaagaaatt gagtagcttc atctgccata aaaaacagca 1680
tgctgcgatg ttaaacgatg aaatgttaca aggtgagaaa atgaagaagg tgactcacgg 1740
atatttacga aaattacccc acaactataa tcgtcgaatg aggcacggag aaaaatggga 1800
ggagcagaag tgaaagagaa agagaagatg gtgaatccac acacgggatc taaagccggt 1860
gttgagaaga aaaacatacc ctatagagac ggatgtttac cgcttgtcca taaaacgctt 1920
tcattactaa tgaacggagg aagtgctcat tagtaatagg agaagatcaa aagtggtacg 1980
ttcacgccca aactactccc gaaagagtga aataggacgt gggatcaatg ccatattcag 2040
tgcagcagtg ggggaatata gggtatcacc ccatcagcgt atctagtggg atacactaac 2100
taaaacagtt ggcccctctc caaaagtaca acgcggctta acctaggctt gatgaggcta 2160
caacgaggca gtcagccgca aggaactctg tacgcgtatc aaagaagtga ctcacctatc 2220
agaccctagg ggactggaat aatcaatcgt cgaaaccacc acgagcagag agtggtcatg 2280
aaggtacggt cttttgtatt gtttgcctca tgtgttgatt actatgctta gaattttttt 2340
aattatccta catttttatc aaacatttac tatatgccga aactacgatt tttatcaaat 2400
cactaattta gttggaagag gcaatgcatg cccgcgtctt tcaaggccaa attatgtatc 2460
ctacaggcta atagtcttaa tcatgggata aacagtagtc cttttaattc ctccctagag 2520
aaagaccttc cgaataaccc aagtaatatc aggaggccgt tattaagtat cgggaataac 2580
gataagtgta accaagctat tttttatatt tatttagggt agaatggttc cgcttgatta 2640
ctaaaaggaa tgtttatgct aacaattaca gatgtgtcaa tgttatactc taacctcaag 2700
aaataattgg atagcgtcat tatcaattat aaatttttaa aatggcatta aagataaaaa 2760
tgctttaggg agatagtttc acaattcgtt tgttattcaa tttacacata taatttattg 2820
catttcctgg tagtgatgat agttttttgt tgattaggtg ttttattttg gtggctatga 2880
tatgatgaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagaa ttc 2923
<210> 45
<211> 947
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 45
gatttaggtg acactataga agacgtaagg gctatagact tcgacgattc ggacagctcc 60
gtgtgtgagc aaggtagaat agagagggta tagtgtaaaa aggctaaatg tggagctaga 120
gactcgaaag gggccggtta atgtggcaat cagtggcagt taatagccca cggaaaggtc 180
gctaaccggg ttcggtaacg attccgagac gcccggggtg cgcggagcag cgtccgtccg 240
tggacccatc cgcgcattcg aggattacag gtccggcgcc taaatggtgc gaagtcccgc 300
tctttcgggg tgctgatcgc gccttgatac ctctccacgc tcgccaccga gcgaaaggaa 360
ctcacgtgac cgtgttgcga gtcgcaaccg cgaccaggcc aaacgctagc gattatcggt 420
tgcgatccac cgacccgtaa gcggggggtt cgacgcggtc cccggccaat gccgtgcacc 480
gcccatgtat tcgtggagcg ctgttggatg ccggggggtc aatgggccca gcgctacccg 540
tagtgttgtg gtccgcaggc accaacttca cgtaagaacc cttaattgtc ctttggcccg 600
tcccaggcca gcgcagcgcc gtgactttca atgtgtggac ccgttttcac ccgggtaccg 660
tttcccagac gccccgcaat tacggcgtcc atatcggatg ggtctatcta gtgtgttccg 720
cgccgagcac ggggcggcaa gtccggaccg tcgcggatga cgcgattgtg ggcaactacg 780
gctagcgtga ggtggaccta agtgacccgc gcgcaaagaa gggttaggct aagtcaactc 840
cgcgctcccc gcactcgtta ttggcagcgc gtcttcaatt acgggccggg ggagtaattg 900
tatatgcata caaaaaaaaa aaaaaaaaaa aaaaaaaaaa agaattc 947
<210> 46
<211> 1709
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 46
gatttaggtg acactataga aggcaggtct gcacggatac ggcggggacg taggggtata 60
cgcggccttg gccccgccaa ggccttcgtc cattccgcgg ccccctggcg tgttgcccga 120
ggctccccag ctagcacacc gggggtcgcc cttgccgagg ctaggtgtgc accagagctg 180
tgattcgtga gtgcgatgcc gccggggcgg acttgcgtca gcggattcac acatctcgcc 240
gttgcgggtc ggaaccacgt tcgaatagca gggaactggc cttgggacac atggacattc 300
gccagaccga ctgggttgcg tgttagtgcg gtccctggcc ggaaaggttt ggggacacac 360
agtgggcgct ctaagtttgc agctcgctgt gaggagcatc gtggcctccg tgcaacggga 420
gatgacagca tcggggccgt ggcagttaat agcccacgga aaggtcgcta accgggttcg 480
gtaacgattc cgagacgccc ggggtgcgcg gagcagcgtc cgtccgtgga cccatccgcg 540
cattcgagga ttacaggtcc ggcgcctaaa tggtgcgaag tcccgctctt tcggggtgct 600
gatcgcgcct tgatacctct ccacgctcgc caccgagcga aaggaactca cgtgaccgtg 660
ttgcgagtcg caaccgcgac caggccaaac gctagcgatt atcggttgcg atccaccgac 720
ccgtaagcgg ggggttcgac gcggtccccg gccaatgccg tgcaccgccc atgtattcgt 780
ggagcgctgt tggatgccgg ggggtcaatg ggcccagcgc tacccgtagt gttgtggtcc 840
gcaggcacca acttcacgta agaaccctta attgtccttt ggcccgtccc aggccagcgc 900
agcgccgtga ctttcaatgt gtggacccgt tttcacccgg gtaccgtttc ccagacgccc 960
cgcaattacg gcgtccatat cggatgggtc tatctagtgt gttccgcgcc gagcacgggg 1020
cggcaagtcc ggaccgtcgc ggatgacgcg attgtgggca actacggcta gcgtgagtag 1080
gtggagcttg aaaaattacg gcgcgtgtcg acctcctgcg gcgatccgac ttcatgacac 1140
gcgcctctga acgctccgtt tggggcgctc tacaagcggg taaactacag tgatggtgga 1200
accctgactg gacaggtccg ggcaatccgc tcgcgaacca gtggtggtaa ggtcagggga 1260
cgtcgggcta ccgtgggggt cacacggccc agctctgatg cgggaccgcc agggatggga 1320
atgtggagga ccaggcccca gcggggggtc ggtatcagct ggttagaacg cggtcggcgg 1380
tggatgttta gggattttgt acgcggaggg ccgcgttcta ggagcatcgg ggggtccagg 1440
ggccaacgcc tgaccactcc tggtagcgtg cttcggccga gggacgacgc agtcccaaca 1500
cgtgcagctc ttgaacttcc actagtccct aacaacgccc gtctttgccg agggtggacc 1560
taagtgaccc gcgcgcaaag aagggttagg ctaagtcaac tccgcgctcc ccgcactcgt 1620
tattggcagc gcgtcttcaa ttacgggccg ggggagtaat tgtatatgca tacaaaaaaa 1680
aaaaaaaaaa aaaaaaaaaa aaagaattc 1709
<210> 47
<211> 1458
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 47
gatttaggtg acactataga agaccgcgcc ttctctgccc cgtgcggggg ctctggtgct 60
ggccccgggc ccacgtccag gggcctggcg gtctggctcc gtcaggctga cccttgtctc 120
ttgtcgcgct gcacgcggtc tcgcccggcg cggttgtcag cggcggccgc tgcatcctga 180
actcccgcgg tttcgggacc gtccaaaggg ctcggtacgc atcctggcct tcgttttgtg 240
agtaagaaat ctcgttccac tgggtactgc tcctcgtctt ccctctccta actacggcga 300
gaaatcctca ccactaccat actcacgact ttgatggcgt ccgagcccct aaacgttcac 360
tcgcatgacg tgctagtccc gatggtttag gagacaaatg ggctcgcctc cgccccgcac 420
gacctaggta agcgatatgg agcctcgggg tggctgcaaa ggtaccatcg actcacgaag 480
cgatgacgcc aggacatgat caccgacaat cgggtactac ggctggagag gttattgtca 540
tctaattcta gtttggtctt gaaccgaaga tcccttatgg cctctttcga cggaaccaat 600
aagactacga ggtaaccaca cattgatgct cgtaagttgt ccccccaggc ggctgcgcct 660
gctaggtcac ccaaccctgg taccaaccac aggacgaaag aatggattcg ctaaaatgga 720
gcggaggtgt gggcaaaagc gcacgagcgt gtcctctcaa ctgtccacct ccacttgtgg 780
agttgcctgg ccggggtttc tacattctag accaggccgg tctagaacga tatggcaagg 840
cgccggagct gtcgtcgcgc atattccgcc tctactggaa ggccagcgcc ggacgcgccc 900
ctgaaatcca cgcttgatcg taggcatgcc gccaggtaca aggctctttg tgcggcaaga 960
gtcctcggtg gcactggagg gtgtctttgg atagcacgct gtcccgggag ttcctatgga 1020
tatcggagcc gccagataac tcaaattgcg agaagattgg ggctggatcg ttgccccgtg 1080
agcggggtaa ccttcccgac tggcccacca aggaaccatt tgttttgcgc ttgacacatc 1140
ccgacttctt gcgcatttcg gccgtgaggg ggcaccaggg tgcctattta cctggggctt 1200
ccgccagcct agcgtcccgg agtagtacct gagctgttcg cgtgagctaa ctacccccga 1260
tggtcagcga acgacatgtt cggcgggagg tcctagctct gcgcccgaga cgacggtcgc 1320
gagtgcgtca gtcggtctat acactctcac tccaccggga gcaaatgagg ggtgacaaag 1380
tcaaaggccg agccccatgg agcgcataat atctagcgcg ccaaaaaaaa aaaaaaaaaa 1440
aaaaaaaaaa aagaattc 1458
<210> 48
<211> 1040
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 48
gatttaggtg acactataga agaccgcgcc ttctctgccc cgtgcggggg ctctggtgct 60
ggccccgggc ccacgtccag gggcctggcg gtctggctcc gtcaggctga cccttgtctc 120
ttgtcgcgct gcacgcggtc tcgcccggcg cggttgtcag cggcggccgc tgcatcctga 180
actcccgcgg tttctaacca cacattgatg ctcgtaagtt gtccccccag gcggctgcgc 240
ctgctaggtc acccaaccct ggtaccaacc acaggacgaa agaatggatt cgctaaaatg 300
gagcggaggt gtgggcaaaa gcgcacgagc gtgtcctctc aactgtccac ctccacttgt 360
ggagttgcct ggccggggtt tctacattct agaccaggcc ggtctagaac gatatggcaa 420
ggcgccggag ctgtcgtcgc gcatattccg cctctactgg aaggccagcg ccggacgcgc 480
ccctgaaatc cacgcttgat cgtaggcatg ccgccaggta caaggctctt tgtgcggcaa 540
gagtcctcgg tggcactgga gggtgtcttt ggatagcacg ctgtcccggg agttcctatg 600
gatatcggag ccgccagata actcaaattg cgagaagatt ggggctggat cgttgccccg 660
tgagcggggt aaccttcccg actggcccac caaggaacca tttgttttgc gcttgacaca 720
tcccgacttc ttgcgcattt cggccgtgag ggggcaccag ggtgcctatt tacctggggc 780
ttccgccagc ctagcgtccc ggagtagtac ctgagctgtt cgcgtgagct aactaccccc 840
gatggtcagc gaacgacatg ttcggcggga ggtcctagct ctgcgcccga gacgacggtc 900
gcgagtgcgt cagtcggtct atacactctc actccaccgg gagcaaatga ggggtgacaa 960
agtcaaaggc cgagccccat ggagcgcata atatctagcg cgccaaaaaa aaaaaaaaaa 1020
aaaaaaaaaa aaaagaattc 1040
<210> 49
<211> 1706
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 49
gatttaggtg acactataga agacggtctg ctgccgcccc cgggctaggc ccggggaggg 60
agtgcgggtg ggaaccctcc ttggcgggga ggggcgcgta gcccaggtgc tcagacctgg 120
ccgtcactat cgtgctccat ggtcccagcg ccttagtaac gcgtagggac atatgcaggc 180
tcttccgggc agcgccctgc gtccgcgccg tcccccctgg gtccagccgc ggccccgccc 240
acccccgccc agtgacgtcc gcacgcaccg ggcgagcaag gccagcagcg gcccgcggca 300
cccccagtgg cgagcctgac ccgctgcctg ggggaaggct gaacgtgggc cggccctcgg 360
ccgggtcgac agctcctcgc acttagggct ggaaactgtg tcgcaagctg ttccctgcac 420
tgactggccg cggtggggtt ctcgcccggg gcgtttgccg tcaaggtgtt cccgggtggg 480
gggaggcgcc accggagtac tggggggtct cgtgtgcgcc ggcaacaccc cctcgacccc 540
gcgtttggtt cgtgcccgcc ctggtctggc ggagacggag gtcctctcgc cgggggggag 600
ggacgcccgc ccagagagct gctgtgtagg gaggtaccgg aattggcgag taacttgctg 660
aagcgtccgc cggtatccgt cgctagtgtg taaaatatgt tgacatcccg cagtatgcga 720
tatcaactaa gtcgcatcga gttgcccctt aggccgcacc ttacttttaa gaaaagtacg 780
atgtgattct tccactcatc tgcaacgcca cagcgtccta catcacgatg ggaaggtttt 840
tcattagcgt tttagtggga tataggctaa ctaatgaatg ctaggtgagg caagagaggg 900
ttcggagcta aaacgttcgg ggctacgctg acctaccgta tgttcccacc gtctgaacgt 960
gtttgcgttt agataccagt acgaaagttt ggatcaattg ggagaattta gtggtgtagt 1020
taagtgagca ttttctatag accgacttga tcccttagaa aatatggtaa gactatgggg 1080
gatcagtgat atctacgtag cagagttcta gtatgagacg ccgagcaagg gcgagctctg 1140
ggtcttggca aagctgattc acgataaagc gatagacgaa gtaatcgtat caacgatgct 1200
acattacact acttcacgat cgccggtcaa catgtagaaa gggtcggtat tgacagtcgt 1260
cgtctacggt tatagaagtt tccatttatt atatgggact atatatatgt aagattctag 1320
cagcgagtag atttaactta aagttcatgt taaaaaccag gtaagtaatc gtcttaattt 1380
actatatttc atattaggta attcaatact tccgtaaagc tattcttgtg taacttcaaa 1440
caagaaacta tgcaaataca cgtaaacata gaaggagccg atcatctgtt tattccaaag 1500
ctgtggttct gctaagtaga aatagcttcc acactagtcc ttctgccgat tacccctacc 1560
ggcgtagatg gatttattta atctttacga tatcgtttga aagtttttct tttagtaaag 1620
attaggtaaa ttaagcgaat gatagtaata ttcatatata agtagttaca aaaaaaaaaa 1680
aaaaaaaaaa aaaaaaaaaa gaattc 1706
<210> 50
<211> 1003
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 50
gatttaggtg acactataga agacggtctg ctgccgcccc cgggctaggc ccggggaggg 60
agtgcgggtg ggaaccctcc ttggcgggga ggggcgcgta gcccaggtgc tcagacctgg 120
ccgtcactat cgtgctccat ggtcccagcg ccttagtaac gccgcacctt acttttaaga 180
aaagtacgat gtgattcttc cactcatctg caacgccaca gcgtcctaca tcacgatggg 240
aaggtttttc attagcgttt tagtgggata taggctaact aatgaatgct aggtgaggca 300
agagagggtt cggagctaaa acgttcgggg ctacgctgac ctaccgtatg ttcccaccgt 360
ctgaacgtgt ttgcgtttag ataccagtac gaaagtttgg atcaattggg agaagctgat 420
tcacgataaa gcgatagacg aagtaatcgt atcaacgatg ctacattaca ctacttcacg 480
atcgccggtc aacatgtaga aagggtcggt attgacagtc gtcgtctacg gttatagaag 540
tttccattta ttatatggga ctatatatat gtaagattct agcagcgagt agatttaact 600
taaagttcat gttaaaaacc aggtaagtaa tcgtcttaat ttactatatt tcatattagg 660
taattcaata cttccgtaaa gctattcttg tgtaacttca aacaagaaac tatgcaaata 720
cacgtaaaca tagaaggagc cgatcatctg tttattccaa agctgtggtt ctgctaagta 780
gaaatagctt ccacactagt ccttctgccg attaccccta ccggcgtaga tggatttatt 840
taatctttac gatatcgttt gaaagttttt cttttagtaa agattaggta aattaagcga 900
atgatagtaa tattcatata taagtagtta cagtttctca ataacttttt tgttggcgat 960
ttgtttaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagaa ttc 1003
<210> 51
<211> 663
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 51
gatttaggtg acactataga agaggcagtg ggagtcccgc cagggaggca ggtgaccaat 60
gctcttccga gctcctggga ccaaccactg agacgtcgtt gcgctcaccg gacccgatgc 120
tacaaacccg aggtgcagcg ttgacagctc gtggatagcc gggctggagt tgcgtgtgag 180
tgtaagaggt acccgattgc gagagcggat cacaccctac cgttgcccga tggaacgctg 240
gcgcggtcta ccgctcgctg aacggctccg tgaacggtac ttccgtcccc ttaatgtatg 300
ggcccacgct gtcttagagc gcgctaaggt gatttgtcga ggtggaggag acgggcgact 360
gcgggaagag aagtccctga gccatgtacc ttgcggtgag gaaggcgcga gggggacggg 420
cggttcttcc gtactgtgga ggggccgcgc ccaataatgg tcgtgtctga atgtttactg 480
cgcctccgta acgcggccgc ctcttgacac cgcggctccc tacccgcctc gggcgagtga 540
gcaggtttca gagagagtct aacaagaggg ttctcttatc tcgccgcagc tcgtacaaca 600
tccccaggta actatgtgca tcattctaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagaa 660
ttc 663
<210> 52
<211> 1012
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 52
gatttaggtg acactataga agaggcagtg ggagtcccgc cagggaggca ggtgaccaat 60
gctcttccga gctcctggga ccaaccactg agacgtcgtt gcgctcaccg gacccgatgc 120
tacaaacccg aggtgcagcg ttgacagctc gtggatagcc gggctggagt tgcgtgtgag 180
tgtaagaggt acccgattgc gagagcggat cacaccctac cgttgcccga tggaacgctg 240
gcgcggtcta ccgctcgctg aacggctccg tgaacggtac ttccgtcccc gttgctgccg 300
tactctcggg actttgggtg cttgcggcgg cgggcgggtt atacgagctt tcctttcccc 360
tgtcgttcgc ttagaggctt caggcctccc cctttctcgg ctcgctcgac ttctacgctt 420
tttcgcctgc tcgacggaga actggagaga tgtaaaatag ggggaagata agcgaaagtc 480
tctaccaaac gttctatact ccaggtttcg atatatcgca cacttttaac ggatacctgt 540
ctgccgtacc gccttggggg cgcgaccctc tattctcagg ctccgaccat gcgtgccctt 600
gctctcgcct ctaggctcgg tcgttggctc ggagtcaagt taatgtatgg gcccacgctg 660
tcttagagcg cgctaaggtg atttgtcgag gtggaggaga cgggcgactg cgggaagaga 720
agtccctgag ccatgtacct tgcggtgagg aaggcgcgag ggggacgggc ggttcttccg 780
tactgtggag gggccgcgcc caataatggt cgtgtctgaa tgtttactgc gcctccgtaa 840
cgcggccgcc tcttgacacc gcggctccct acccgcctcg ggcgagtgag caggtttcag 900
agagagtcta acaagagggt tctcttatct cgccgcagct cgtacaacat ccccaggtaa 960
ctatgtgcat cattctaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaat tc 1012
<210> 53
<211> 1695
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 53
gatttaggtg acactataga agaaggggga agggggactg gcgcgcggca aaccggggcg 60
gcgacgaggc cattgacgct catttccttc cttttgcctc ggcgccccac ccaacccata 120
caccccccct cagcgaccgc ggcttccgtt cttgcaaagg cctattccag gaggtaccca 180
taccacagcc agtccagcac aacgaaacgg agagaccaaa gggatgagga aaagtgagat 240
aaattcagtc gacggttatt gaaagagaaa atcgaacgac agatccacat gatggctaac 300
acttatccaa ctcagaaagt gagtgtaaag agggcaacgg cgaagggtta gaatgaacaa 360
catgccagaa agattaagaa tgcgtagaac ttgaatcgag cgtatctaaa gtagaatact 420
tcgaaactag cgacttaggt gtttgagtac gcgagtctac aatagaagca gcatgcgttc 480
ctgttggtaa gggagctgga tgctgattct gatgactttc gactccccgg gtcgagttgt 540
ttaagggaac tcgagtaccc agataaggcc agaatgttta actctgaagc tctcgtctgc 600
taaatagcaa ttgcgtcgca cagtttcgca aataacatat aaatcgacgg ctggatctcg 660
tagcaccaag gtgcgatatc atcaatgcta accttaatta gctaagaaag aagtgcaaca 720
atctcagagc tttcttttta gacacccgaa cccgaacgtt tgtttaccct cagcctcgtg 780
ccaggcctgc tcatcaatac tcctagattc agacaggaat acaacggtgg accgaatatc 840
ggttaggctt gtctgattgt ttctttagac cactaatggt aagagtccaa aaatataaaa 900
ataatttcct gttcggagtg aaaagtaaat agagaaagct atggaatgaa gaattgagtg 960
aaacagtcga aactgagaag gaacgggatg aagaagagtg agcaatgatg aagcaactgg 1020
ggacaacgag gaatggttta gtacatctgc cccctcgtga agccgggacg tcacaggaga 1080
agatgttcgt gcataagaag gaatattaca atataatggt aggcgggcta gaagtaataa 1140
caaattgtgg ctaaacctcg ggctaaccgg aacttcctac gtaaaaggaa aagtgaacaa 1200
ggaaaaatta atgcaaataa attacggact tggcgcagta aaaaaacagg atatcaatcc 1260
aaagaaatcg aacctgtcga tcgaccagag ggatttgtgc cataagaaat agtagcgaga 1320
aaaagtacaa cggagaaaga gaaaggcaaa ctaccgcagt gaccgcgaag cagactaagg 1380
cggggattaa ctagctctga agatcaccat gggctatagc ctcagaaatc gggaaacggg 1440
gaagaaaaga agaattagca agactacccc cagaccagac cggtaattcg gcttcgtggc 1500
tttgaccgcg acatcggtac aggaaggcca gggggggtga tgggtggggg ggagcgtgca 1560
cgagcggaag gaaatatctt attagccact aacggttggt tattgctatg cccctttccg 1620
agaaatgttc gcgaagttga gtagcttagc tggtccagta aaaaaaaaaa aaaaaaaaaa 1680
aaaaaaaaag aattc 1695
<210> 54
<211> 785
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 54
gatttaggtg acactataga agacatacac caggatccta acgtgctttt ttctaagaga 60
aggaggtagg gagcacccga ttagaggcct tgaccgccag tcactctaac tttcacaact 120
gtcaacgtcc taacattgag acaataccgg acttcaggct aattaatgag gttcggtcat 180
caggggtaga taggatgcta cgtaaaagga aaagtgaaca aggaaaaatt aatgcaaata 240
aattacggac ttggcgcagt aaaaaaacag gatatcaatc caaagaaatc gaacctgtcg 300
atcgaccaga gggatttgtg ccataagaaa tagtagcgag aaaaagtaca acggagaaag 360
agaaaggcaa actaccgcag tgaccgcgaa gcagactaag gcggggatta actagctctg 420
aagatcacca tgggctatag cctgcaatgt tgattaaagg ttagaacaca gaaagggaat 480
cgatccaaaa cgattccatc aaaagaaaga gtcagaaatc gggaaacggg gaagaaaaga 540
agaattagca agactacccc cagaccagac cggtaattcg gcttcgtggc tttgaccgcg 600
acatcggtac aggaaggcca gggggggtga tgggtggggg ggagcgtgca cgagcggaag 660
gaaatatctt attagccact aacggttggt tattgctatg cccctttccg agaaatgttc 720
gcgaagttga gtagcttagc tggtccagta aaaaaaaaaa aaaaaaaaaa aaaaaaaaag 780
aattc 785
<210> 55
<211> 1783
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 55
gatttaggtg acactataga agaagtctac gaccgggccc ggtccgtccc agggctgcgg 60
cttgcccgct gcccccgggt cgcctgggcc ccctggtctc ccggcaccgc gccttcggcc 120
ggtcccgccc tgccccggcg cccccccatt gccgttgtcg cccctctgcg catcataaag 180
atatcgtttg accgaattga gatatgttgg gtgctcgcta aatttgcgtc gagttccctt 240
ttcctgtgag ttccgccaac ttagtgttgt gtgctttttc gactataacc tgctgagatg 300
cggtataaga gcgggtataa gggacgtttg ctttccggtc cttcgaactt taggacacat 360
tcgcacgata tgtacaccac ggcacaagaa taggtggtcg atctatcctt gtgcgtcagt 420
gacccttcat cccttgatgt cgcgcagacc cgcccagggt cctctgaacc aacctgttca 480
tcactccttt gctacggcgg aaaaaggttt ggtgtgcgct tgtcgacctc ggttgaagca 540
ctaagcggta tacgcactac gtctaactaa aatccgtcac ggccacgaag attggcgccg 600
actcgaccta tctcgtccgc cggtccccac gcctgtgtcc atcgggacaa gttgggatac 660
ggcgtccttg agcatcgtta aataatcgca gtacgtagct gattggggaa aagtacgtta 720
acctaccagg ggagcgggat gtagatccgt agaatgccgt cccaagcagc aacagcggcg 780
acggtatccc gaccacgcgg ccaccgcagg gacgtgatct ccttcacgct ttgtctgctg 840
acctgatgct cattataggg gaagggcgat atcctatatc atatggtaag gggaagattt 900
aagggcctgg acggttctct ggcgcggcca attatcgcac cccagactag agaggcatcg 960
tcatcatact ctaccaattc ctcgtcctgg ctccactcga ccagatcaga ggcctcggtt 1020
cacatccgct cgggatggcg gcgccacttg catctcgacg taacctgaaa tcctcaggat 1080
ccgggacttg gcgggttgac caaggggctc gatgattgag acagggtact gcaccacgac 1140
cagccaaccc tcacgaactg tccatgctgc gtatgaacgc tagcgaaaca ccaaaccagc 1200
tcgtcatggc tcaacgattg aagtagagga gtgcaattcg agtcgtggcg atgcccaatc 1260
tcaattatgc tggcggaggg gacactcacg tcccgaggaa gagccatccg cggcaaagcg 1320
ccgaccagct ccacaaccga agccgcgacg acgtgccagt aaatagcacg tcgaggagca 1380
cgcagcatgg ggaaggccag ggtgagctca gcgtccgccg caatggcttc ggtgaggtag 1440
acccgacaca ccatccacca ttggcctaag ccgatgggga ccttcgacgt agcgatcgcg 1500
ccgtacctgg agctcgctct ctggcaggag acgtgccgag gggtaactgg cgctgagcga 1560
acccctcaat catagcaagt gtcccagttt tttgatgttg agctttttgg agtagttggg 1620
ggatggaggg aatatgtata gttataatgt tttgatgatg gaactgtatg gagatgtagt 1680
gaatgcaccg ccgtgaagat ccggctcgag aagccccttt cgacgggtct tactgacgcg 1740
cgggtgtaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagaa ttc 1783
<210> 56
<211> 1235
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 56
gatttaggtg acactataga agaagtctac gaccgggccc ggtccgtccc agggctgcgg 60
cttgcccgct gcccccgggt cgcctgggcc ccctggtctc ccggcaccgc gccttcggcc 120
ggtcccgccc tgccccggcg cccccccatt gccgttgtcg cccctctgcg catcataaag 180
atatcgtttg accgaattga gatatgttgg gtgctcgcta aatttgcgtc gagttccctt 240
ttcctgtgag ttccgccaac ttagtgttgt gtgctttttc gactataacc tgctgagatg 300
cggtataaga gcgggtagtc catgcaccat taacccaatc cttgcagggt atcgtggcac 360
agttgactcg cctttttgta tatgaacgcc tcgggaagta ccacctgatc taagggacgt 420
ttgctttccg gtccttcgaa ctttaggaca cattcgcacg atatgtacac cacggcacaa 480
gaataggtgg tcgatctatc cttgtgcgtc agtgaccctt catcccttga tgtcgcgcag 540
acccgcccag ggtcctctga accaacctgt tcatcactcc tttgctacgg cggaaaaagg 600
tttggtgtgc gcttgtcgac ctcggttgaa gcactaagcg gaccaaacca gctcgtcatg 660
gctcaacgat tgaagtagag gagtgcaatt cgagtcgtgg cgatgcccaa tctcaattat 720
gctggcggag gggacactca cgtcccgagg aagagccatc cgcggcaaag cgccgaccag 780
ctccacaacc gaagccgcga cgacgtgcca gtaaatagca cgtcgaggag cacgcagcat 840
ggggaaggcc agggtgagct cagcgtccgc cgcaatggct tcggtgaggt agacccgaca 900
caccatccac cattggccta agccgatggg gaccttcgac gtagcgatcg cgccgtacct 960
ggagctcgct ctctggcagg agacgtgccg aggggtaact ggcgctgagc gaacccctca 1020
atcatagcaa gtgtcccagt tttttgatgt tgagcttttt ggagtagttg ggggatggag 1080
ggaatatgta tagttataat gttttgatga tggaactgta tggagatgta gtgaatgcac 1140
cgccgtgaag atccggctcg agaagcccct ttcgacgggt cttactgacg cgcgggtgta 1200
aaaaaaaaaa aaaaaaaaaa aaaaaaaaag aattc 1235
<210> 57
<211> 777
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 57
gatttaggtg acactataga agggaaatat tttgcgtctc acacgatcgc gagggagtta 60
cgggtaacac ctagcgggcc cgtcgtccga cgccaggcgc ccaggccatc ggcccccacc 120
gcaaaggctg ttaatctgca cgtatacccg actggcgcag ttttgagacc tggaccttga 180
tccttttatc tctgtcctgc ttcttgttct tgtcggggcc gttttagtca cgcttttggt 240
tatacacggc catacttatc ttgcgcgcta gcagacatat tgaagaagca tgtgtcgctg 300
tgatcggtgt aagcgcggat aaagccgtgc gatcttccag caggtgaagg tcgaggaagc 360
aggacgcgcc caggagctgt cgattgcatc gggcgttatt ttcaagggga gttcggtgca 420
ggaaactggg atcggcaggt gagaggtaca agagttggag gaccgtacgg tctccccagc 480
ctacggtccg tcacacgatt acaccttctc gcgacgcgtg gacccatgaa tataccctca 540
cccctcgtga accactattc tggggcaaac gaccgcccgg gagcaggcgt tcatcggacg 600
ggctcaccgc tgggagcaaa ggtcgttacg gaagaatatg gatgtagggt accaatacta 660
agggtaggac tggcggggcg tgtgggggcg aacgtactaa gaaagttgta accctcgagg 720
cggcctccac tcaaatcgac caaaaaaaaa aaaaaaaaaa aaaaaaaaaa agaattc 777
<210> 58
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 58
gatttaggtg acactataga aggcgcccag gccatcggcc cccaccgcaa aggctgttaa 60
tctgcacgta tacccgactg gcgcagtttt gagacctgga ccttgatcct tttatctctg 120
tcctgcttct tgttcttgtc ggggccgttt tagtcacgct tttggttata cacggccata 180
cttatcttgc gtgagtatac atcaactgaa agttgttacc ataataagat agatccaacc 240
aggaaccttc tcgaatagtc gcgcgggcgt cgaaattgca ctctacggta gtgccgtcgt 300
cgcaaatgtc atccccgttc gatactactg tgtctggata gctggtgctt ggactctgtg 360
ttttagtttg actagtgact agccactaac ggataggaga gtctggcatt tcagttctct 420
ttcatgggtt atgagagata aggattgata tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa 480
aagaattc 488
<210> 59
<211> 1548
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 59
gatttaggtg acactataga agaggggcgg gggatgggcg tcaagtgttg gccccgcagg 60
gggttgcccc cacggggggg cccccacgaa cagaggggtg acggggccgg aactccggcc 120
gccactaagg cgcgggcctc cggccagtgg aatcttggtt aactattgta cttgccgcgg 180
tgagagggtc tgagagggat tcgatgctag gataaaaatg atcaaaatga agtgactgaa 240
atgtacctct gtgcggatgg gatcctaagc cagtcggtta agcttagacc attggtgcta 300
attctaaatg gatgaattaa aataacgaga aaactgtaga gttcatgcca ccccctggtc 360
atgcaaaatg tggtgtacac ttccgagtgc aggggcgatt cctcaaccaa cgtagctttg 420
gagtcctcat gtgccgctgt ggagacacgg gattctcagt tcgctttggc tccgtccaag 480
atttgcgtgg ctgtgtcaca gttcgattga cagatgtcgg acgtcaacgg aagttgtaaa 540
gaaacaatca aattgtaagt ctgcgcacct taaatgtaat ggttctatgt cgctggtaac 600
tccttttttg tgatgtgacc gcggattaat tgtccgcgta ttttacgctt ttgatcgtgg 660
gtacgggtat agtgcagtga gagcatgcga acggatcatg tcaatataca ggatagccaa 720
ttggaagggg tcgatctgcg aacgatgaca taggagaaac aatctgagac tgccatatta 780
aacggcaatg ccccggattc taattgtacg tgttatcttt tcctatctgg gtccagtacc 840
cgcgcatcga tagtcagaat gaaaattacg gttccacatc cggtctgtca ctttgtccta 900
gtggaatggc gaatcttgtt gcgacctgcc acagtagcct ccatggcgac cccccgttca 960
ctgtgaatgg tcgagaccta ctcatccttt acatcgaaca acctctgcgg tatgatgata 1020
cctgccacat tatttgtgaa agtcagtttg cacgtaggcc tgagaagacg tattaggacg 1080
gcctacacaa gcaattcata ttgagcaagg aaaggagtgg aagacctgag gagaaagaaa 1140
gtcaaagaaa aacaaggaaa aataaatttg attgtattca gagtaatgcc ctgccaaggt 1200
ccatatcgat ccaaaggcgc tacaatagaa aaagaaacgc aagtcacttc acatttatat 1260
cttgcgatca cgcggtttta atcttaatca gagcttacga gcttctttcc ctctatcttt 1320
tgtagtattc taaatatcat ttagtatcga atgtctctgt tacgtcttta acgtttttgt 1380
acaatccaaa cgacattcgc tacgggcttg gcggtcggcg catagctata gcagcgtgtt 1440
aggcgcggtt agctcgacct gcagggacgc ttgacaagga ctcgggaggg aagaggacca 1500
ttcctaaatc taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aagaattc 1548
<210> 60
<211> 1420
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 60
gatttaggtg acactataga agccgccgga gggctgggga aggcgcccgg tggccagagg 60
ggcgggggat gggcgtcaag tgttggcccc gcagggggtt gcccccacgg gggggccccc 120
acgaacagag gggtgacggg gccggaactc cggccgccac taaggcgcgg gcctccggcc 180
agtggaatct tggttaacta ttgtacttgc cgcggtgaga gggtctgaga gggattcgat 240
gctaggataa aaatgatcaa aatgaagtga ctgaaatgta cctctgtgcg gatgggatcc 300
taagccagtc ggttaagctt agaccattgg tgctaattct aaatggatga attaaaataa 360
cgagaaaact gtagagttca tgccaccccc tggtcatgca aaatgtggtg tacacttccg 420
agtgcagggg cgattcctca accaacgtag ctttggagtc ctcatgtgcc gctgtggaga 480
cacgggattc tcagttcgct ttggctccgt ccaagatttg cgtggctgtg tcacagttcg 540
attgacagat gtcggacgtc aacggaagtt gtaaagaaac aatcaaattg taagtctgcg 600
caccttaaat gtaatggttc tatgtcgctg gtaactcctt ttttgtgatg tgaccgcgga 660
ttaattgtcc gcgtatttta cgcttttgat cgtgggtacg ggtatagtgc agtgagagca 720
tgcgaacgga tcatgtcaat atacaggata gccaattgga aggggtcgat ctgcgaacga 780
tgacatagga tacccgcgca tcgatagtca gaatgaaaat tacggttcca catcgcttcc 840
gtaacggagt ccgcaatatc gccctgcgca ccgggtcacc aattgaaaag aacgctcgga 900
tataggcgtt tgcatcgtaa acgaaaatac aggaagacaa cgatgccgaa aaaacacacc 960
tgatcttggc gctgaaagag cgccgcttag actgtattcg ggtatatgcg ttatgcgagt 1020
gtaacaaacc gctacaacgc caccattaac ttggtggaaa ttagcgggaa cagtcgagga 1080
aggaagcaag gagagaagca ccacgcccac aaacgaaggc accccacatg attaagcccg 1140
tactctcggc cgcgcaacct agggcctctc aagattcagt accacggaat gttatctatc 1200
atactcacta aaatttttac gaagtgagcg gtaaaggagt gggaataaga ccgatgagcg 1260
tgtgtcttag tgggtcatgg cttgagtggt ctcaggacct agtcggtgtg aggcgggagc 1320
tgcgcatccc atagtgaggg atcattttgg ctcccttatt aatttaatac acctagcgct 1380
ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaagaattc 1420
<210> 61
<211> 1812
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 61
gatttaggtg acactataga agcacctctg cgcaaaggcg cgggtactga aaaacatagg 60
gtctcatata tcttgtagtt gttcgtgtat gatattatta tgatttttta tacacatctt 120
ctagattttt gtaacagaga tccatgagag aaatatacta ggtccacata attctgagcg 180
agactacatg ggcatccgac gagccacaat agagacatca ggctcgctgg gctcccccgt 240
ccgccaccct tcaacgagga ccggacttgc tggatcgcac ccctccttgt atttcccgcc 300
gtagtaagcc cgatgttcca tggcctcaag ctcttccatc gtggcccccg ccttccacta 360
ggagagaagc cgattcaaga acccgacgag gtcgtgtgcc tgacgacgaa cacattcgag 420
attgccccac gggcaatgta cttcatcccg gtgtcccccg gtgataggag ccggtgcaca 480
atcctcgacg cgtacacgcc atcgggcccc cggccggaga gcagacaggg acgtggaggg 540
gtgccggtga cgtgggacac acgcatgaaa aggaacagtt atagaggtgt gctacttaac 600
tacccgacaa actccggcga gcgcaccgtt ccgcctgcaa tgcccggtac taacagggcc 660
gggcactgct acaccaggcg ggtccgcttc cccagagcct tagaagcagc tcgggtctac 720
gccgaagcat tggtgcgggc aaatcctggt gcgccgcctt ttccgataag aggccggctt 780
caggccagtc gagattttga gagtaggtga gcagagatcg tcaaactgtt gaagccaaca 840
cgattatgtt gcgcactcgt cgtgctagcc cccccgtcgt ccttgccacg tcacaggtgg 900
cggtgcggcc tacccgctaa agagcgcaag agccgacgcc cagaaggggg atgctacccg 960
gagcaccagt atgcggccga gcgcgctgga gcaggccacg cgataaggat cacagctagc 1020
gccgaatcct ccatctaacc atatggggat agtcgcgccg tagaaaactc tgccagggca 1080
gagggattcg cctatatact gaatacccac catgcctgta tgagcctacg aacagtcaac 1140
acaaaagcgc aagtcgtgcc ctacacaaac taaggcgtcg gtgactcgga tcataatgga 1200
tgagttaacc agcggatatc cttggggatg attatcagac gatcagggaa tttacctaca 1260
gaggactcgg gatccctggg ccactgtcat acgacccaag gttggcctcg acgtcgcgcc 1320
ctaagaagac ccccaaggat tagatcgatc gaccggatct ttccacgatc ctgttttacg 1380
cctctctgaa cgccgtggcg tagcttgggc gacattcagg aactcagcta acggccacat 1440
gtccgtttag caacctccct aagtgcccat ggtatccaat gacgctgcga cccgtcattg 1500
ggttcaacac acgcccagca ccattatagc ggttacgtcc agagccccca cagcggaacg 1560
gagcctctaa atgctagaaa actcaactcc ctcctgtcga ggggccgggg gcggcagcgg 1620
ggattctgca tcaggtcgcg cggagggaca ctggcgtggg ccccgaagcc gtcctgcgtt 1680
tctctcactc cgaacggacc cgaccgctgg ttcggagtcg gtcggtagtg gccccggtgc 1740
actcgactgg cggcgtggtg attggggcta tcagtgaaaa aaaaaaaaaa aaaaaaaaaa 1800
aaaaaagaat tc 1812
<210> 62
<211> 1914
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial DNA standard
<400> 62
gatttaggtg acactataga agcactcccg gtccggcggg atccgcgcca gacttgtcgg 60
gggtgcggct gcgcgcccct cacgcacctg gggcgttctc catcccgagc ccgctgctgg 120
cgttcgggcc gttgcggccg cgcggtcctg cccgccccca ccctaccaca acgttatccc 180
cgctcaagcg cgcggggcga atccgacgag ccacaataga gacatcaggc tcgctgggct 240
cccccgtccg ccacccttca acgaggaccg gacttgctgg atcgcacccc tccttgtatt 300
tcccgccgta gtaagcccga tgttccatgg cctcaagctc ttccatcgtg gcccccgcct 360
tccactagga gagaagccga ttcaagaacc cgacgaggtc gtgtgcctga cgacgaacac 420
attcgagatt gccccacggg caatgtactt catcccggtg cagttataga ggtgtgctac 480
ttaactaccc gacaaactcc ggcgagcgca ccgttccgcc tgcaatgccc ggtactaaca 540
gggccgggca ctgctacacc aggcgggtcc gcttccccag agccttagaa gcagctcggg 600
tctacgccga agcattggtg cgggcaaatc ctggtgcgcc gccttttccg ataagaggcc 660
ggcttcaggc cagtcgagat tttgagagta ggtgagcaga gatcgtcaaa ctgttgaaac 720
aatcggtact gccaacttgg ggatgtgagt acgcatgact gtcacatcag cgagcatcag 780
gcttcaaagg ggaaaagaag ccaacacgat tatgttgcgc actcgtcgtg ctagcccccc 840
cgtcgtcctt gccacgtcac aggtggcggt gcggcctacc cgctaaagag cgcaagagcc 900
gacgcccaga agggggatgc tacccggagc accagtatgc ggccgagcgc gctggagcag 960
gccacgcgat aaggatcaca gctagcgccg aatcctccat ctaaccatat ggggatagtc 1020
gcgccgtaga aaactctgcc agggcagagg gattcgccta tatactgaat acccaccatg 1080
cctgtatgag cctacgaaca gtcaacacaa aagcgcaagt cgtgccctac acaaactaag 1140
gcgtcggtga ctcggatcat aatggatgag ttaaccagcg gatatccttg gggatgatta 1200
tcagacgatc agggaattta cctacagagg actcgggatc cctgggccac tgtcatacga 1260
cccaaggttg gcctcgacgt cgcgccctaa gaagaccccc aaggattaga tcgatcgacc 1320
ggatctttcc acgatcctgt tttacgcctc tctgaacgcc gtggcgtagc ttgggcgaca 1380
ttcaggaact cagctaacgg ccacatgtcc gtttagcaac ctccctaagt gcccatggta 1440
tccaatgacg ctgcgacccg tcattgggtt caacacacgc ccagcaccat tatagcggtt 1500
acgtccagag cccccacagc ggaacggagc ctctaaatgc tagaaaactc aactccctcc 1560
tgtcgagggg ccgggggcgg cagcggggat tctgcatcag gtcgcgcgga gggacactgg 1620
cgtgggcccc gaagccgtcc tgcgtttctc tcactccgaa cggacccgac cgctggttcg 1680
gagtcggtcg gtagtggccc cggtgcactc gactggcggc gtggtgattg gggctatcag 1740
tggtccctac gggcggtgtt tctccctctt ctcgccccat gcagtgacac cactatctgc 1800
tttctactgt gccagcccca cgcccaccga gtacatgtgg cgtttataga tttgacgaga 1860
cggttgtcaa ttgataacaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaga attc 1914
<210> 63
<211> 1121
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 63
gctcttctta ttataaataa atgcattttg tgacatattt atagtttaac tggaggtccc 60
ttgcatctga aaaattaaaa tgatgcctac agacacgcat attcacagtc tctagactaa 120
atggggttag cgatatatga gcaagatctt tggtatagtt ccgttcattt cctgatttac 180
agccgtttta cttttacatc gttgcctgaa tttcaattct aaaagtatac ataatatgtt 240
atgcgcgctc tgttatctac gtttattgtt tatcaaaata tcattgaatc tatttaggaa 300
ggtggcccag cactactgcg cggtggcaga cgcgccgaga ggctaggtgg gagtccgcgg 360
tcatctcagg tccgagtgga gtaccacaga tggcgtgcgg ccggaacggg ctacgctctg 420
tgtgcgacta agccacggtt ctatattctt cttacctact agcatcaata ctcttagccg 480
cagtttgtga gagcatgtca cttgcccgaa agcccaccaa actttataat cttcaaataa 540
cctaactacc ctcattttat aaagaaatat ggcatgtaga taaaaaattt ccaaatgcta 600
gacaaaaata aatgttgata ataaataata attgcgtaat gttccacaat gtcaagaggg 660
tcaaggccag tctcttcccc tttcccgttt cgggtgtttg tggttggttg tgtgtggtgt 720
tggttgtttc ccgcgttcgg cttttctgta tttgacagtg cataccaaga gatcattaaa 780
cgtttatccg aaatctatac actacagaag taattaataa atcctctgac agaaaaagcc 840
cttttaacat atcctatcta gtgcgaagtt gggcgtggag taaagcttga gtaactagct 900
ggtccgaaca tgccaacgag tcgatggggt aacaggaaaa agggcgaata ccataatcat 960
ggctacgcca gagtacatga cttgacgata caacaggatg gaactaagtc acctaaatgg 1020
gcacgaggaa catgcaagca gacgcagttg ccgaaagttg gcaaaagacg atagcaattc 1080
aagggttggt ggacagccca catggataag gttggaagag c 1121
<210> 64
<211> 1147
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 64
gctcttctta ttataaataa atgcattttg tgacatattt atagtttaac tggaggtccc 60
ttgcatctga aaaattaaaa tgatgcctac agacacgcat attcacagtc tctagactaa 120
atggggttag cgatatatga gcaagatctt tggtatagtt ccgttcattt cctgatttac 180
agccgtttta cttttacatc gttgcctgac gttaatttca attctaaaag tatacataat 240
atgttatgcg cgctctgtta tctacgttta ttgtttatca aaatatcatt gaatctattt 300
aggaaggtgg cccagcacta ctgcgcggtg gcagacgcgc cgagaggcta ggtgggagtc 360
cgcggtcatc tcaggtccga gtggagtacc acagatggcg gggttatgcc cgcggacgta 420
gtcacgatcc gtgcggccgg aacgggctac gctctgtgtt cgactaagcc acggttctat 480
attcttctta cctactagca tcaatactct tagccgcagt ttgtgagagc atgtcacttg 540
cccgaaagcc caccaaactt tataatcttc aaataaccta actaccctca ttttataaag 600
aaatttggca tgtagataaa aaatttccaa atgctagaca aaaataaatg ttgataataa 660
ataataattg cgtaatgttc cacaatgtca agagggtcaa ggccagtctc ttccccttgg 720
tgtttgtggt tggttgtgtg tggtgttggt tgtttcccgc gttcggcttt tctgtatttg 780
acagtgcata ccaagagatc attaaacgtt tatccgaaat ctatacacta tagaagtaat 840
taataaatcc tctgacagaa aaagcccttt taacatatcc tatctagtgc gaagttgggc 900
gtggagtaaa gcttgagtaa ctagctggtc cgaacatgct aacgagtcga tggggtaaca 960
ggaaaaaggg cgaataccat aatcatggct acgccagagt acatgacttg acgatacaac 1020
aggatggaac taagtcacct aaatgggcac gaggaacatg caagcagacg cagttgccga 1080
aagttggcaa aagacgatag caattcaagg gttggtggac agcccacatg gataaggttg 1140
gaagagc 1147
<210> 65
<211> 1136
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 65
gctcttctgg gtacattcca tcggctcaac ccgatgccgt tacccgggct ccctcccccc 60
cagctttcac cccctccctc gcgcgcttcg ccgcgccaaa ccgcccggag ccaaccccct 120
tccgacctct acggctccgt gccgctcacc ctccatatgc tggcgttgcg ttggcccggc 180
gtcaccccaa ttcccggccc ctttccggtg cttatccgga gtcggggatg tggcacgggg 240
gcgcgccgaa ctcacccgct tgagccacgg gttacaccca gctcgtcgga accattcccc 300
gttggttatt gcatctctgt cttcccgtcc tgcagagtcc actcccccct atctatcagt 360
actctagatg tccgatgcac cgagagtggg gtcacaaact atccgggcgg ccagacgaca 420
caagactact acgaatcttc cagcgaaaga gaccaaatca actagcgcag cctcctaccc 480
cttttctcta tcgcgtccac ccatctttgt ttattgattg tgacttcctg atctgctgtt 540
tatagcctga ctctaaccgt agcagtcatt gcacgaagaa ggatgaatgc tgaatcccag 600
tcccggggca tattagccca ataaaggggc attaaaacta aagaatatta tagtaccacc 660
aacaagaaaa agaacaagtt tgctaaaata gaaccgatta gccagaaggg ttgttcggag 720
agtcggtacg caggccgagg gaccactttt actaaattcc attttgggag cggcgtgcat 780
ataactaccc gcactcgatg cttgccgaag gaaggtggac agctaaggtt cggcatcaag 840
tccacgtggt acgcagaaaa cagctcggga atagataaca ccatgtacgc cagcgcggtt 900
cacgatgatg cgacttaaat tagaacgacg tgtcccccag gccttgaggt cgtaacctgg 960
taacgaaggg gtcagatacc ttcctgcaag gagttattat tcgttgtagc atgtcccttg 1020
ctactcaaag ttggcctatg tcttaacagt atgttcagaa cttccctttc ttcaagttaa 1080
aataaaatgt ccctataaac gtatacgtaa tgaagaatga cattaaattg aagagc 1136
<210> 66
<211> 1148
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 66
gctcttctgg gtacattcca tcggctcaac ccgatgccgt tacccgggct ccctcccccc 60
cagctttcac cccctccctc gcgcgcttcg ccgcgccaaa ccgcccggag ccaaccccct 120
tccgacctct acggctccgt gccgctcacc ctccatatgc tggcgttgcg ttggcccggc 180
gtcaccccaa ttcccggccc ctttccgctg cttatccgga gtcggggatg tggcacgggg 240
gcgcgccgaa ctcacccgct tgagccacgg gttacaccca gctcgtcgga accattcccc 300
gttggttatt gcatctctgt cttcccgtcc tgcagagtcc actcccccct atctatcagt 360
actctagatg tccgatgcgc cgagagtggg gtcacaaact atccgggcgg ccagacgaca 420
caagactact acgaatcttc cagcgaaaga gaccaaatca actagcgcag cctcctaccc 480
cttttctcta tcgcgtccac ccatctttgt ttattgattg tgacttcctg atctgctgtt 540
tatagcctga ctctaaccgt agcagtcggt tggtgctaaa atggacgcat tgcacgaagg 600
aggatgaatg ctgaatccca gtcccggggc atattagccc aataaagggg cattaaaact 660
aaagaatatt atagtaccac caacaagaaa aagaacaagt ttgctaaaat agaacttagc 720
cagaagggtt gttcggagag tcggtacgca ggccgaggga ccacttttac taaattccat 780
tttgggagcg gcgtgcatat aactacccgc actcgaccga aggaaggtgg acagctaagg 840
ttcggcatca agtccacgtg gtacgcagaa aacagctcgg gaatagataa caccatgtac 900
gccagcgcgg ttcacgatga tgcgacttaa attagaacga tgtgtccccc aggccttgag 960
gtcgtaacct ggtaacgaag gggtcagata ccttcctgca aggagttatt attcgttgta 1020
gcatgtccct tgctactcaa agttggccta tgtcttaaca gtatgttcag aacttccctt 1080
tcttcaagtt aaaataaaat gtccctataa acgtatacgt aatgaagaat gacattaaat 1140
tgaagagc 1148
<210> 67
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 67
gctcttcagg ttctggggtg cccttgagtc accgccggcc agcgatgctg gagttcattc 60
tccagtggac cgcgaggcag ggagcacagt gaggctgtgg cagcgacccc gttacgagag 120
gtgcccaagc acccaaagca cttgtgagga ttcggaggct tcggtattgg cgaacggtct 180
tagcctgatg gggcgggggg agggggctgg ttaatactaa cacgacgtgc acacaaaagt 240
aaattgaagc caaccacaac acaacaacac taactataat aggactataa ttgtcgttat 300
aaagactcaa aagatatagg tttgtaacga tatcctcctt gctgctccca taggccacgc 360
agacgcaccc tccagcgcgg agagttgacc agcgctatgt gcagtagtga gccgaactat 420
atactcgctt caaaaaggcg ttgagatgga cgaccacaga gctaagatct aaggttaaaa 480
aacccttcta gagcagcatt gcagaaatag ttttcgcccc ggtagagatg tgggagacaa 540
agacaaataa aacatagtta gaacaagtat caaatacata cactttagcc acatcgaata 600
tccgttcaaa taagaaaatt cgaagcatct atatatggaa aatgataaga gcttcatcaa 660
cgtttaattc gctttcataa ggtttacaaa aaagccaaat caccattgaa ctaaggttta 720
aagatcattt gacatcaaat gtttaagata ctatcttatc aaacgataac tgattcggag 780
tttacaaatt gggtggattg gtacaatttt tctaataact tctatgatcg ataatcgggg 840
tgttcacatg atctagaccc atatttgttt gctaaatccg taacataagt ataatagctt 900
gtaagctcag tgcatcggct ataagcaacg agttaagcaa tgaaatactc cgttcgacat 960
ttttttgcaa tcagaattgc acatagttgt ttcgaagagc 1000
<210> 68
<211> 997
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 68
gctcttcagg ttctggggtg cccttgagtc accgccggcc agcgatgctg gagttcattc 60
tccagtggac cgcgaggcag ggagcacagt gaggctgtgg cagcgacccc gttacgagag 120
gtgcccaagc acccaaagca cttgtgagga ttcggaggct tcggtattgg cgaacggtct 180
tagcctgatg gggcgggggg agggggccgg ttaatacaca aaagtaaatt gaagcaccaa 240
ccacaacaca acaacactaa ctataatagg cctataattg tcgttataaa gactcaaaag 300
atataggttt gtaacgatat cctccttgct gctcccatag gccacgcaga cgcaccctcc 360
agcgcggaga gttgaccagc gctatgtgca gtagtgagcc gactctcatt caactatata 420
ctcgcttcaa aaaggcgttg agatggacga ccacagagct aagatctaag gttaaaaaac 480
ccttctagag cagcattgca gaaatagttt tcgccccggt agagatgtgg gagacaaaga 540
caaataaaac atagttagaa caagtatcaa atacatacac tttagccaca tcgaatatcc 600
gttcaaataa gaaaattcga agcatctata gatggaaaat gataagagct tcatcaacgt 660
ttaattcgct ttcataaggt ttacaaaaaa gccaaatcac cattgaacta aggtttaaag 720
atcatttgac atcaaatgtt taagatacta tcttatcaaa cgataactga ttcggagttt 780
acaaattgga tggattggta caatttttct aataacttct atgatcgata atcggggtgt 840
tcacatgatc tagacccata tttgtttgct aaatccgtaa cataagtata atagcttgta 900
agctcagtgc atcggctata agcaacgagt taagcaatga aatactccgt tcgacatttt 960
tttgcaatca gaattgcaca tagttgtttc gaagagc 997
<210> 69
<211> 1135
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 69
gctcttctgg aaacagaagt ttaataagta gtttctccag taaaacctta agttatcaac 60
gtaaattgtc actctatgca tgagcttacg gcgactacct agatcccaac catttgacgg 120
gacttcccct cgtcatacat tcgcaccagt tttcaaaata aaagcgttac tactcttata 180
gttggagcaa ctcgagatcc ctctcctgta gcttttttat tagttctgga agatacaaag 240
tgcaacgcct cttaagtgac ccctattagt gcagaatcca ttcaaaacat tttccctatt 300
cggcagataa taagcatgtc tcttcacatc tcgaagataa gaataaagct gtcaacttta 360
atttacatct ttcgataaaa gttgagcact tttcatctat attaagaaga atgagccgtg 420
aggtaaatct ctgctccgag tctcataatg tcacgcaacc gcgtgtcagc agctggccac 480
caacaagagt gaatatgact ttaaccgttt catatttgtt ttaggtctca ttttataact 540
aaattcaata gtctagtata taacacttgc gttctttacg aatgtaacat gtacttttaa 600
aacctaagag agagacagaa tactagatct cttgccctcc acctatataa ttaagatata 660
cgtgattatc tataatgatc gtgttcatta gtttatttgt ctaaagtctg aaattgccca 720
ttatcaacga aagtacacag tatcctcctc cacgctctcc taaagaacaa gtgcagtacc 780
ggggcaatac aatctcaaat cacgttcttt aggccgcggg ccttggaatt agaacaatta 840
ttcgctctgc gattcctatg tttacttaat cctgcacggg ctacacttcg cgctcttaga 900
atgttacaac ttaagtatat ctcgcctatc gattcagcct cttttgtgtc tacaattttt 960
gaatgctgga atggcggaag tgaggtaacc tagtggggac ttgcttgatg ggggcgatga 1020
cgctttctgg tgaacggcta gcttaactca gcggtgttct agttagattg ataccctaca 1080
cgcgttctcg ctgtgtttta gcttttgaaa gcagctaagt cgttgcagga agagc 1135
<210> 70
<211> 1123
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 70
gctcttctgg aaacagaagt ttaataagta gtttctccag taaaacctta agttatcaac 60
gtaaattgtc actctatgca tgagcttacg gcgactacct agatcccaac catttgacgg 120
gacttcccct cgtcatacat tcgcaccagt tttcaaaata aaagcgttac tactcttata 180
gttggagcaa ctcgagatcc ctctcctata gcttttttat tagttctgga agatacaaag 240
tgcaacgcct cttaagtgac ccctattagt gcagaatcca ttcaaaacat tttccctatt 300
cggcagataa taagcatgtc tcttcacatc tcgaagataa gaataaagct gtcaacttta 360
atttacatct ttcgataaaa gttgagcact tttcatctat attaagaaga atgagccgtg 420
aggtaaatct ctgctccgag tctcataatg tcacgcaacc gcgtgtcagc agctggccac 480
caacaagagt gaatatgact ttaaccgttt catatttgtt ttacattggt ctcattttat 540
aactaaattc aatagtctag tatataacac ttgcgttctt tacgaatgta acatgtactt 600
ttaaaaccta agagagagac agaatactag atctcttgct ctccaccttt ataattaaga 660
tatacgtgat tatctataat gatcgtgttc attagtttat ttgtctaaag tctgaaattg 720
cccattatca acgaaagtac acagtatcct cctccacgct ctcctaaaga acaagtgcag 780
taccggggca atagaatctc aaatcacgtt ctttaggccg cgggccttgg aattagaaca 840
attattcgct ctgcgattcc tatgtttact taatcctgca cgggctacac ttcgcgctct 900
tagaatgttt cgcctctcga ttcagcctct tttgtgtcta caatttttga atgctggaat 960
ggcggaagtg aggtaaccta gtggggactt gcttgatggg ggcgatgacg ctttctggtg 1020
aacggctagc ttaactcagc ggtgttctag ttagattgat accctacacg cgttctcgct 1080
gtgttttagc ttttgaaagc agctaagtcg ttgcaggaag agc 1123
<210> 71
<211> 964
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 71
gctcttcaat tcgctaaggc gcgaagttat tatttaatga ttagagtcca ggatttccac 60
ttttgagttt cattcccata ttttcgcgat tagttcttaa tggctgaagc gttccgataa 120
gacggatgga gataaagaat ggcgcaatgc gaagaagagg agagaggtct aataactaaa 180
tattcacgct aagacatcat aatcaatccc ctgacataat aaattatcag atcaaaacag 240
atgagattca tattagaacg ttgaacttat aggatttaaa aaccgtccgc ttaacaatca 300
gaggcgttat atctatattc ggtgctaaag ttccttcgta gaacatatcc tgaccccccc 360
ccgccatccc ataattcaga atcgaagttg tgctgcggta ccgccgcatt atgttttgtg 420
gacctggggc actcttcttt tggatcatac ctcctatgcc tcctgatctt tccagccagg 480
ctgtcccttc cccatactgt cttggcgctt ctcaggagaa cattctcaaa tgaaatcgtc 540
aaatgatagg tcgcggaccg ttagtcggtc gtagcaatat tacgtaggcc agaacgctac 600
taggtactct cgcagtataa agttcttcat tcattgaaat cctatgactg tcatagagtt 660
atttatggaa gaatagttac acgcgttgca tcaatattat cttagttaga ggttaaagaa 720
acatcataat ttccggcaaa gcagccgtat atctaccttc tagtgcctca cacctgttta 780
gcttgatgta agaaataaat taaatagtcc tctcaccaaa taactattta gaatgtgttc 840
ctacacaact gctgctctgg aaaaagtatt ttttggggtg tcacagcggt gaaacgggcg 900
ttagtgcggc atcgataaga gggatagggt atgcaacaga atgggtaaac cgtggaagaa 960
gagc 964
<210> 72
<211> 960
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 72
gctcttcaat tcgctaaggc gcgaagttat tatttaatga ttagagtcca ggatttccac 60
ttttgagttt cattcccata ttttcgcgat tagttcttaa tggctgaagc gttccgataa 120
gacggatgga gataaagaat ggcgcaatgc gaagaagagg agagaggtct aataactaaa 180
tattcacgct aagacatcat aatcaattcc ctgacataat aaaacagatg agattcatat 240
tagaacgttg aacttatagg atttaaaaac cgtccgctta acaatcagag gcgttatatc 300
tatattcggt gctaaagttc cttcgtagaa catatcctga cccccccccg ccatcccata 360
attcagaatc gaagttgtgc tgcggtaccg ccgcattatg ttttgtgaac ctggggcact 420
cttcttttgg atcatacctc ctatgcctcc tgatctttcc agccaggctg tcccttcccc 480
atactgtctt ggcgcttctc aggagaacat tctcaaatga aatcgtcaaa tgataggtcg 540
cggaccgtta gtcggtcgta gcactagtat attacgtagg ccagaacgct actaggtact 600
ctcgcagtat aaagttcttc attcattgaa atcctatgac tgtcatagag ttatttatgg 660
aagaatagtt acacgcgttg catcaatagt atcttagtta gaggttaaag aaacatcata 720
atttccggca aatagtgcag ccgtatatct actttctagt gcctcacacc tgtttagctt 780
gatgtaagaa ataaattaaa tagtcctctc accaaataac tatttagaat gtgttcctac 840
acaactgctg ctctggaaaa agtatttttt ggggtgtcac agcggtgaaa cgggcgttag 900
tgcggcatcg ataagaggga tagggtatgc aacagaatgg gtaaaccgtg gaagaagagc 960
<210> 73
<211> 1038
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 73
gctcttcgtt tgccattatt tccgacgcca ttcatggtag ggtactaaag gttaaattac 60
actagagatt ttctaaggaa aggagaatat gagtattagg ttatgaaaaa ttcattgata 120
tttgtgttct ctttaaattt tcgaatgttt gttgttagta aatcatctaa tacaaataat 180
aatatagaag aagtatatgt gtgtattatc taccggttct tttattggag cgtttgaccc 240
ataagtggga agcgatgtct tagtaaaagc aaccagctat tttcgtgata atacacctag 300
tcatagttgg actagaagag acataaaaaa gcataagtaa agagaagaca cctttcgtgt 360
tagggtactt gccattgcgt ttccgaccgt ctcttcattt tcttctcata tctgtgaaat 420
cggttctcag ctgactagct aaatgtggtg tggtttcaag gcttagtttt atcttgcggt 480
tagtggtcgt cgtttcatca ttgtccttgg aatagtttct gcagtcccta ggggcatgtc 540
tatagtaccc agatctgttt cgcttgcctc gttctctagt acattcgaca aagatactat 600
aagttgactg tattgggtta gttccataaa ctcgactttt tttcgtttca tatggagttt 660
ggactgatcc ggcggactga acagtataaa tagaagcctc gatgaaaggt gggaatcgtt 720
ggtcccccgt tagccactcc cttgatgagg ataaaaagta acaaactaaa taaatcgtgt 780
attttggtat tatttaataa gaattagcaa aaatagtttg gacccaaatt agtcaaataa 840
agcacaatgc tttttggttg ctttccgata ttctacgact tatactaacg aaagcaaatc 900
caaagcgaat acgatgttcc tccacggagt tatatcgatg gagaaactta tttgtattat 960
attatcgatc atcgccaaca acaatctcta aatctaggct atttttgtgc ctggaatact 1020
attcattttt cgaagagc 1038
<210> 74
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 74
gctcttcgtt tgccattatt tccgacgcca ttcatggtag ggtactaaag gttaaattac 60
actagagatt ttctaaggaa aggagaatat gagtattagg ttatgaaaaa ttcattgata 120
tttgtgttct ctttaaattt tcgaatgttt gttgttagta aatcatctaa tacaaataat 180
aatatagaag aagtatatgt gtgtattgtc taccggttct tttattggag cgtttgaccc 240
ataagtggga agtgatgtct tagtaaaagc aaccagctat tttcgtgata atacacctag 300
tcatagttgg actagaagag acataaaaaa gcataagtaa agagaagaca cctttcgtgt 360
tagggtactt gccattgcgt ttccgaccgt ctcttcattt tcttctcata tctgtgaaat 420
cggttctcag ctgactagct aaattcttgc ggttagtggt cgtcgtttca tcattgtcct 480
tggaatagtt tctgcagtcc ctaggggcat gtctatagta cccagatctg tttcgcttgc 540
ctcgttcttt agtacattcg acaaagatac tataagttga ctgtattggg ttagttccat 600
aaactcgact ttttttcgtt tcatatggag tttggactga tccggcggac tgaacagtat 660
aaatagaagc ctcgatgaaa ggtgggaatc gttggtcccc cgttagccac tcccttgatg 720
aggataaaaa gtaacaaact aaataaatcg tgtattttgg atttattatt taataagaac 780
tagcaaaaat agtttggacc caaattggtc aaataaagca caatgctttt tggttgcttt 840
ccgatattct acgacttata ctaacgaaag caaatccaaa gcgaatacga tgttcctcca 900
cggagttata tcgatggaga aacttatttg tattatatta tcgatcatcg ccaacaacaa 960
tctctaaatc taggctattt ttgtgcctgg aatactattc atttttcgaa gagc 1014
<210> 75
<211> 1071
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 75
gctcttcgga agataccccc ataggcaagt gtcgtctacg tcgccgctgc acggcctttt 60
atgattatga aatgatcgag ttatggtata agaaaggata aggttacaca attgtgaact 120
aattgtcgtt gcttttattt gtttatattc atggttttct agccccaaat ctatccccaa 180
tagttatagg tttaatgtaa accatataag agatcgttca cactatatct tggagataga 240
tcacctaatc catgcgttct gacgtgttga ggaattgttc taaacataag acctaggggg 300
attataaggc acgctaacgc gtcttactcg atcacgtaca ttagggtgat ccggtaatgc 360
agaatcttga aaataagacc gcatttactg gctcaaactc taccatctat ttttatttac 420
gtttagtttt ctaccctcca gcatttttag ctgtttggga ctttctgagt aagtggagtt 480
tcacatgcag aagcagtaac atgagacata ttgaccaccc cctggtgaac gaatttcgtc 540
tgatattaat ctctagattt atgaacatta tacactcaat ttgtgaatcc tctacaatat 600
attatccatt cactttttaa cataatttaa atatacggga aaatgtagac agtcatcctc 660
tttaccgttt ctcggcaacc agtttggttg tgatttaaac gtttctctgt ctatgcgttt 720
ctgttgttgc atttttttct ggcgtgtaac ttattctctc ttttgttagt gtgatgctac 780
tatcctatct tgtgttgtta ggtcgaccta ctattttgcc aatcctccca ccctccctta 840
ccaaccaaga accccatttt accgcaccat cggaccgaca atccggtaac tctgccccga 900
tctgcagatt aggttactgt gaaaggtggt gaggagaagt aggctccctc cagggtatcg 960
gcaacgcagc cccgggacct tgctctgcaa gcatcagcgt ggccggtgat gcaccattgg 1020
gctcaccttc tctcgctcgt accgactgca gcttaaacgt agtcgaagag c 1071
<210> 76
<211> 1076
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 76
gctcttcgga agataccccc ataggcaagt gtcgtctacg tcgccgctgc acggcctttt 60
atgattatga aatgatcgag ttatggtata agaaaggata aggttacaca attgtgaact 120
aattgtcgtt gcttttattt gtttatattc atggttttct agccccaaat ctatccccaa 180
tagttatagg tttaatgtaa accatataag atcgttcaca ctctatcttg gagatagatc 240
acctaatcca tgcgttctga cgtgttgagg aattgttcta aacataagac ctagggggat 300
tataaggcac gctaacgcgt cttactcgat cacgtacatt agggtgatcc ggtaatgcag 360
aatcttgaaa ataagaccgc atttactggc tcaaactcta ccatctattt ttatttacgt 420
ttagttttct accctccagc atttttagtt tttggcccgc actgtttggg aatttctgag 480
taagtggagt ttcacatgca gaagcagtaa catgagacat attgaccacc ccctggtgaa 540
cgaatttcgt ctgatattaa tctctagatt tatgaacatt atacactcaa tttgtgaatc 600
catattatcc attcactttt taacataatt taaatatacg ggaaaatgta gacagtcatc 660
ctctttaccg tttctcggca accagtttgg ttgtgattta aacgtttctc tgtctatgcg 720
tttctgttgt tgttcatttt tttctggcgt gtaacttatt ctctcttttg ttagtgtgat 780
gctactatcc tatcttgtgt tgttaggtcg acctactatt ttgccaatcc tcccaccctc 840
ccttaccaac caagaacccc attttaccac accatcggac cgacaatccg gtaactctgc 900
cccgatctgc agattaggtt actgtgaaag gtggtgagga gaagtaggct ccctccaggg 960
tatcggcaac gcagccccgg gaccttgctc tgcaagcatc agcgtggccg gtgatgcacc 1020
attgggctca ccttctctcg ctcgtaccga ctgcagctta aacgtagtcg aagagc 1076
<210> 77
<211> 1138
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 77
gctcttcaga gaggaaataa atcctgaact gtaagacccc aggatttgtg atcagtaaca 60
caaccacaag gcttaagtcc gtttcctcag taacgaaata atgtaaggaa gattcaacac 120
acatcctcca ctagatgcac atcgcacgat tgacgactga atctgaaatg aagagtaagc 180
gaaaccgtgt ggcatacaaa agggtaaaac cgtgctctcc ctctcaaacg tgctaaataa 240
acgatggccg tagttcagat gagaagtgag aatttcaatg agatagaaaa aggaagatat 300
gggaaaccgg tacctggggg gaaaatattg gccaaatttt atgatgaatt attgtgcagg 360
aagatttata gagaaataca aagattatta ttgtagtatt cttgttcaca cataactatt 420
attagacttt aagatagtag ttatgagact gtttaataga aagtagaggt tcctctcccg 480
tagctatatg agactatgac atgtgactcc catattgggc taagtcgctt cggggtatct 540
gttttccaat cgggtcgtga ctatacattt ttttttgttg tggtattttt tagctcataa 600
cagcaaatat agagtcaccc cgaactattg ctattgtagt aaccagccat tatcctgcag 660
cctatttagc gtggttccgg actgtgcatt tccttttgca atatttgagt cagaatccta 720
tacactctgt tcatagtatg tgtcgtttct ctacttcacg attatgattt tatccctttt 780
ttgcttctgc ggcgtgaatt ggtatgatgt gttggtatgg gtgtgcctat ttagaattgt 840
acgtaaaggt ccttgggtct caatgattgt ctcgtgattt tccatccctg gactgttcat 900
aatgtacatg acttagttcg tgggcacaat gaatcgtagg agtgggcgag gagtcttccc 960
agacgccgtc ccgcctaggg ccctaagaaa cctcccgtgt atcccgttcg caggtgatta 1020
aaggcatcgg aggataaggt aagcggttat gcctgtgggt agctcggtag tagcgagggt 1080
ggtatcaggt aaggttgaag atcgctggac gtttatctgt tagactcaca cgaagagc 1138
<210> 78
<211> 1145
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 78
gctcttcaga gaggaaataa atcctgaact gtaagacccc aggatttgtg atcagtaaca 60
caaccacaag gcttaagtcc gtttcctcag taacgaaata atgtaaggaa gattcaacac 120
acatcctcca ctagatgcac atcgcacgat tgacgactga atctgaaatg aagagtaagc 180
gaaaccgtgt ggcatacaaa agggtaacac cgtgctctcc ctctcaaacg tgctaaataa 240
acgatggccg tagttcagat gagaagtgag aatttcaatg agatagaaaa aggaagatat 300
gggaaaccgg tacctggggg gaaaatattg gccaaatttt atgatgaatt attgtgcagg 360
aagatttata gagaaataca aagattatta ttgtagtatt cttgttcaca cataactatt 420
attagacttt aagttatgag actgtttaat agaaagtaga ggttcctctc ccgtagctat 480
atgagactat gacatgtgac tcccatattg ggctaagtcg cttcggggta tctgttttcc 540
aatcgggtcg tgactataca tttgtgtttt tttttttgtt gtggtatttt ttagctcata 600
acagcaaata tagagttacc cagaactatt gctattgtag taaccagcca ttatcctgca 660
gcctatttag cgtggttccg gactgtgcat ttccttttgc aatatttgag tcagaatcct 720
atacactctg ttcttcttta tagtatgtgt cgtttctcta cttcacgatt atgattttat 780
cccttttttg cttctgcggc gtgaattggt atgatgtgtt ggtatgggtg tgcctattta 840
gaattgtacg taaaggtcct tgggtctcaa tgattgtctc gtgattttcc atccctggac 900
tgttcataat gtacatgact tagttcgtgg gcacaataaa tcgtaggagt gggcgaggag 960
tcttcccaga cgccgtcccg cctagggccc taagaaacct cccgtgtatc ccgttcgcag 1020
gtgattaaag gcatcggagg ataaggtaag cggttatgcc tgtgggtagc tcggtagtag 1080
cgagggtggt atcaggtaag gttgaagatc gctggacgtt tatctgttag actcacacga 1140
agagc 1145
<210> 79
<211> 1113
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 79
gctcttcctt tacaaccgat ctgttacttt acctcttttt atccggagaa tatacacgaa 60
ttattaaaat tccgtgtgct aacagcgatt actatataat aaatatatcc ttggatggcc 120
ttagaaacca ttgtattgtc ttagcagccc tccacaagga ctctcaataa ggttcctatc 180
tactgtacct gacaattcac aacattgttg ctcctcaaga taattggtaa tgacggtcat 240
ccccgggtac gtggttaatg ctcgagatga aacgatcaat cgcgagaaga tagaaaacga 300
gacaaaccaa acaaaaaata ctaattcagg gtcggcgctc aggccaatcc cgacaccttt 360
ttaaacggtc tattgacaca tggcatggac tagagcaagt tgataataga atttatccaa 420
ctgcgacaca acacaaaatg tactactcac gtctacaccc gtattttacg acttcctatc 480
tctttacttg gtgatgtagg atatggacta tgaagaagga ggggccgggg ttcttcggcc 540
cggagagata gcaagggcaa agagaagggt ggaacgagtg gagaagacgg aggaaagtgg 600
gagcggaggg gaaggggtag gaagcaagac gagcgcggca tttagtttca ttgataaaca 660
ttatttaacc atgataatag agtatagttc ttacgatcat cttaaagcag ttagtacata 720
ggaaactgtt gaaagctaac agcatagtca actacaaaaa taaatacatt cggacttaag 780
ttcacgggaa gcatcgttat atatttttat tcacggcgtg tgtactctaa tagcagggcg 840
ccggacagct agagaaaaac taaaccctgg tttggtgagg cgtatcgcca ggtagcagcc 900
ccactaaggg tgtagccggc gggaagtatc agttgcgctg gtgggtttgc tgcctactat 960
ctctacccct ctagtttagt cttatgtaca ctaactaagc tttccaattg atcgtccgct 1020
agaagtgaag tgacaacaat actgtcgata tatcttgcac acgataagat aatcgccatc 1080
tcggaataaa tgaagatgcc agcaaagaag agc 1113
<210> 80
<211> 1091
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 80
gctcttcctt tacaaccgat ctgttacttt acctcttttt atccggagaa tatacacgaa 60
ttattaaaat tccgtgtgct aacagcgatt actatataat aaatatatcc ttggatggcc 120
ttagaaacca ttgtattgtc ttagcagccc tccacaagga ctctcaataa ggttcctatc 180
tactgtacct gacaattcac aacattggtg ctcctcaaga taattggtaa tgacggtcat 240
ccccgggtac gtggttaatg ctcgagatga aacgatcaat cgcgagaaga tagaaaacga 300
gacaaaccaa acaaaaaata ctaattcagg gtcggcgctc aggccaatcc cgacaccttt 360
ttaaacggtc tattgacaca tggcatggac tagagcaagt tgataataga atttatccaa 420
ctggacacaa cacaaaatgt actactcacg tctacacccg tattttacga cttcctatct 480
ctttacttgg tgatgtagga tatggactat gaagaaggag gggccggggt tcttcggccc 540
ggagagatag caagggcaaa aggaaagtgg gagcggaggg gaaggggtag gaagcaagac 600
gagcgcggca tttagtttca ttgataaaca ttatttaacc atgataatag agtatagttc 660
ttacgatcat cttaaagcag ttagtacata ggaaactgtt gaaagctaac agcacagtca 720
actacaaaaa taaatacatt cggacttaag ttcacgggaa gtatctttct tttgttatat 780
atttttattc acggcgtgtg tactctaata gcagggcgcc ggacagctag agaaaaacta 840
aaccctggtt tggtgaggcg tatcgccagg tagcagcccc actgagggtg tagccggcgg 900
gaagtatcag ttgcgctggt gggtttgctg cctactatct ctacccctct agtttagtct 960
tatgtacact aactaagctt tccaattgat cgtccgctag aagtgaagtg acaacaatac 1020
tgtcgatata tcttgcacac gataagataa tcgccatctc ggaataaatg aagatgccag 1080
caaagaagag c 1091
<210> 81
<211> 951
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 81
gctcttcatc tggtgcatcc cctgcttcct cgcttggcgt cgatgggcca ccctctcgag 60
cgttgaggcc gtcggggtgt tcaccgccgg ggttccgcag gggacagcca cagcgtcaca 120
actggtccac cggcccgtgc ttcacatcat tgggcttcgt ggtgtctgtg tccgcggttg 180
ttcgtcacct gctcaatgga cgcctatgcg acccgcgcct atccctccta agcatgaatc 240
acaaatcatc cgaagttctc cgttctggcc atgaacctat ctgcgtgctt tgggagatca 300
ggataacact aaaatcccat tttcagttgc gtattcctgt aaacgcccga agagttttgt 360
tggtagagaa tacccaaatt gccgagattg aggcttaaca tcaaggaggc aggaactagc 420
aggatgcggc ctcggtggag agatggcagc cgtcatttca gtccgctcga caaaggcaac 480
gagcttacaa cgacaaaaaa aacaaaaaat gaaaaaacat taactagttt tccgttactt 540
cggaatacaa aacctaagtg cctcgtgcaa aacggaggtg gaacggaacg ggagatgccg 600
cacccaaaac aaacccaccc acaacaacac acccccaaaa aactttgcgc cctacgatag 660
atactatcca ggcggacttt cgccgggtac tcacaaacat tataagtttt ctattcttaa 720
aacagatgac gggagtgttt catggacaga acactaaact gatatatggt caataaaatg 780
aataggtgaa gatgagtgaa gacagaaaga ccgtccatct acgatttcgg ggctagaaga 840
cgagctgcta aaataagcag cctacaacat agtcgtaaca tgtttcttca atgactacca 900
caaattggtg ctctattgta tggggaaaga cctggctaaa caccgaagag c 951
<210> 82
<211> 924
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 82
gctcttcatc tggtgcatcc cctgcttcct cgcttggcgt cgatgggcca ccctctcgag 60
cgttgaggcc gtcggggtgt tcaccgccgg ggttccgcag gggacagcca cagcgtcaca 120
actggtccac cggcccgtgc ttcacatcat tgggcttcgt ggtgtctgtg tccgcggttg 180
ttcgtcacct gctcaatgga cgcctatacg acccacgcct atccctccta agcatgaatc 240
acaaatcatc cgaagttctc cgttctggcc atgaacctat ctgcgtgctt tgggagatca 300
ggataacact aaaatcccat tttcagttgc gtattcctgt aaacgcccga agagttttgt 360
ttgtagagaa tacccaaatt gccgagattg aggcttaaca tcaaggaggc aggaactagc 420
aggatgcggc ctcggtggag agatggcagc cgtcatttca gtccgctcga caaaggcaac 480
gaaaaaaaac aaaaaatgaa aaaacattaa ctagttttcc gttacttcgg aatacaaaac 540
ctaagtgcct cgtgcaaaac ggaggtggaa cggaacggga gatgaaccca cccacaacaa 600
cacaccccca aaaaactttg cgccctacga tagatactat ccaggcggac tttcgccggg 660
tactcacaaa cattataagt tttctattct taaaacagat gacgggagtg tttcattgac 720
agaacactaa actgatatat ggtcaataaa atgaataggt gaagatgagt gaagacagaa 780
agaccgtcca tctacgattt cggggctaga agacgagctg ctaaaataag cagcctacaa 840
catagtcgta acatgtttct tcaatgacta ccacaaattg gtgctctatt gtatggggaa 900
agacctggct aaacaccgaa gagc 924
<210> 83
<211> 1129
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 83
gctcttccgg tttagatcct taatttgtcg ggtaataatc agaagaggga aagattttga 60
tctggtatac catctagact taggtgaccc agagattatt ggccttctaa catctgcgct 120
accttgatcc ccctcggggc taactagatg ggctactcgg atgaagtctg ccgacctaga 180
gcgcaaaaca agcacccccg gggaggtaaa gcaaccctaa ttataaatca actcaagatg 240
atattatatt ttaattcact attatcggtt cgattgtaat gtgcgggatt ctcttttagg 300
gacacgaggt cacaccgact attcgaggtc gcgggtagcc aatcccatcg ttggtcatct 360
aaagaatgca gaagtacttg tagctacgag cttgttactc tgctctatgg tgccgagttg 420
cactcggtag ataagggggc agggatagca atcgtgagaa aaaacgagtt aatactggtt 480
caaggctgga taaatatgga gataagggta tgggatggca tgaacagtgc tacagtgtgt 540
aggaatggat gaggcaaaaa aaaggggata aatgtaagga agcgctgaag taggaggaaa 600
tgagtgggtt acttacatat cgcatttaaa tgctaattcc tcatacgtcc cctttattcc 660
aacgagctgt tttttagtag attcagatag ttggtccata caataactat attttgtaac 720
aaacaaacga gacagcaatt acacagcata ctttcataat cacattagct agttatatta 780
gggcgtttat cccgtacgcg acggcctact gcgaaagcat agcgtttgca atgacgtacc 840
accctgtgtg atccgaccat ggcggaagct cattagcgta gcgaaagttt gtgtttacgg 900
atcgcatatt taagaagtgt tggtgtggtt ggtggtttgt gttggtggtt ttggtgggca 960
gcgttacggt tagttaacct ccctagttct tctcgaaggt tcggtttcct tatccgtacg 1020
cctacggctt cctcagacaa agacactaca tccttccctc cttgccttca cctctcttgg 1080
ctcgcataca gctttatcgg cgataactca aaacaaccta gtgaagagc 1129
<210> 84
<211> 1135
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 84
gctcttccgg tttagatcct taatttgtcg ggtaataatc agaagaggga aagattttga 60
tctggtatac catctagact taggtgaccc agagattatt ggccttctaa catctgcgct 120
accttgatcc ccctcggggc taactagatg ggctactcgg atgaagtctg ccgacctaga 180
gcgcaaaaca agcacccccg gggaggtgaa gcaacataac ttcgcttact aaagattcct 240
aattataaat caactcaaga tgatattata ttttaattca ctattatcgg ttcgattgta 300
atgtgcggga ttctctttta gggacacgag gtcacaccga ctattcgagg tcgcgggtag 360
ccaatcccat cgttggtcat ctaaagaatg cagaaatact tgtagctacg agcttgttac 420
tctgctctat ggtgccgagt tgcactcggt agataagggg gcagggatag caatcgtgag 480
aaaaaacgag ttaatactgg ttcaaggctg gataaatatg gagatgatgg catgaacagt 540
gctacagtgt gtaggaatgg atgaggcaaa aaaaagggga taaatgtaag gaagcgctga 600
agtaggagga aatgagtggg ttacttacat atcgcattta aatgctaatt cctcatacgt 660
cccctttatt ccaacgagct gttttttagt agattcagat agttggtcca tacaataact 720
atattttgta agaaacaaac gagacagcaa ttacacagca tactttcata atcacattag 780
ctagttatat tagggcgttt atcccgtacg cgacggccta ctgcgaaagc atagtgtttg 840
caatgacgta ccaccctgtg tgatccgacc atggcggaag ctcattagcg tagcgaaagt 900
ttgtgtttac ggatcgcata tttaagaagt gtggttggtg gtttgtgttg gtggttttgg 960
tgggcagcgt tacggttagt taacctccct agttcttctc gaaggttcgg tttccttatc 1020
cgtacgccta cggcttcctc agacaaagac actacatcct tccctccttg ccttcacctc 1080
tcttggctcg catacagctt tatcggcgat aactcaaaac aacctagtga agagc 1135
<210> 85
<211> 993
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 85
gctcttcaat tgtactttcg tatatttttg gattggctgt agaaagtata aaggggaggg 60
cggtaaagtt tatttggttt tagtcattta tttttttaac agcgtcttca cattagttga 120
agtataataa cataattcga gtttcattaa aagaaacatt gataacctaa agtttattat 180
ccagtcgtta ttataatcaa cttgatctca ggataatggt cgacttaaag tcagtagaag 240
gtttttagga gtcgagatca gttactgatg ttcttttttc attgagttta cttcaccata 300
caccaaattt tctaagcatt gtgatttaat ccagtgtcct ttacttctgc atagatttaa 360
tgtataggtg tgagtgcaat gcaggccgga gttcatgaag aaaaaaaaaa atagctcata 420
aacaaccgca aaagctcgat ctttaattaa gtcataacta accattcgat tccctttatg 480
tcactgctca caaccgctta ggatgtctct catcttaatg taaatacaac ccaagtttcg 540
atacggaccg ccggtggcgg ccgcgcagca ggccgcgcgc tctcccgagc agcatggcgg 600
ggacgtgagt aacaagtggg cggggacggg gggcgcgggg cgggcggggc cgcaacgagg 660
gcggggcggg gtggcgcagg cggcgacggg ggcgcgcagc ggcgctcagt gcccatgtcc 720
tctgcccgac gacacgtact ccatgtcgga tctcgcaaaa gagcagagtc ttccgcgcat 780
atcgcctacg agaactgcac taaagagagg gaaggagggg gcgcgggaaa ggaagcaccc 840
gaggactttc gccttggagg ggctgagagc ggtgcgcagt gccgcatagc gctcgaactc 900
cgactagggc ctaagggcgc tgggcacagc ctgcggcgtt gtggctgaca tgaagggggg 960
tggcggtgtg gcgtcgttgc aaaggagaag agc 993
<210> 86
<211> 1011
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 86
gctcttcaat tgtactttcg tatatttttg gattggctgt agaaagtata aaggggaggg 60
cggtaaagtt tatttggttt tagtcattta tttttttaac agcgtcttca cattagttga 120
agtataataa cataattcga gtttcattaa aagaaacatt gataacctaa agtttattat 180
ccagtcgtta ttataatcaa cttgatccca ggataatggt cgacttaaag tcagtagaag 240
gtttttagga gtcgagatca gttactgatg ttcttttttc attgagttta cttcaccata 300
caccaaattt tctaagcatt gtgatttaat ccagtgccct ttacttctgc atagatttaa 360
tgtataggtg tgagtgcaat gcaggccgga gttcatgaag aaaaaaaaaa atagaataaa 420
aaaaaaaata ttatagtact cataaacaac cgcaaaagct cgatctttaa ttaaatcata 480
actaaccatt caattccctt tatgtcactg ctcacaaccg cttaggatgt ctctcatctt 540
aatgtaaata caacccaagt ttcgatacgg accgccggtg gcggccgcgc agcaggccgc 600
gcgctctccc gagcagcatg gcggggacgt gagtaacaag tggacggggg gcgcggggcg 660
ggcggggccg caacgagggc ggggcggggt ggcgcaggcg gcgacggggg cgcgcagcgg 720
cgctcagtgc ccatgtcctc tgcccgacga cacgtactcc atgtcggatc tcgcaaaaga 780
gcagagtctt ccgcgcatat cgcttacgag aactgcacta aagagaggga aggagggggc 840
gcgggaaagg aagcacccga ggactttcgc cttggagggg ctgagagcgg tgcgcagtgc 900
cgcatagcgc tcgaactccg actagggcct aagggcgctg ggcacagcct gcggcgttgt 960
ggctgacatg aaggggggtg gcggtgtggc gtcgttgcaa aggagaagag c 1011
<210> 87
<211> 949
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 87
gctcttctat ccacatcgtt cgactcttag gcgagtttcc cgatctggta aaattaacag 60
tatctgtggc ttttcgtact tccggtcacg gatagagcag ggtaggagag ggaaagaggc 120
gggggaagta tggatggaag ttgcattaac caatttttcc tttatctata tataagctta 180
atagattgat aaactacaat atcggttttg cgggaggtcc ccggcctcga tcggtgacgc 240
tgacgtacaa aatcatccct atcactctgt cgcctctttt gttttataat gaaataactt 300
gcctaattga catttaaaat gaggaaatca gacgttaata attactgtag aatatcacca 360
ctcacatcta tgactggaaa cacggaaaaa ccgcagaggg agcccatcga tattagcgaa 420
tgttatataa atgggatccc ggcaaccagc ggaaaaaagc aaggttcgta cttcgacgat 480
tttcgagtct agaaggtgct cccctatttc ctccgatatc cctacttgta catcattctt 540
tcaaacgatt tctttagata gtatagctac taatagcgca tttataattt tttaacttct 600
atatctaagt tcgattgtat gaatacagac catttaagga aactccaata tcaattaaag 660
gggagtaaga agaaaaaata atatggaaac gggcgacact ccgccaccga ttcagggaca 720
cgcccggtgc aggtgcagcc gtagttcaca ctcaggggga cgttggtcat cggaggactg 780
gcccaggtgt cgggcctcgg ccacggccta gcgccctact cgactcttag ctccaactga 840
gaggtgcttc ctccctagct cgtagaacac gaatagcccc tatgcgttag ggcgccaaag 900
acaccatggt accgaacggc cctaaaccgc gcacgtagtc ttgaagagc 949
<210> 88
<211> 972
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 88
gctcttctat ccacatcgtt cgactcttag gcgagtttcc cgatctggta aaattaacag 60
tatctgtggc ttttcgtact tccggtcacg gatagagcag ggtaggagag ggaaagaggc 120
gggggaagta tggatggaag ttgcattaac caatttttcc tttatctata tataagctta 180
atagattgat aaactacaat atcggttctg cgggagtgcc aggggccacc tctgggtccc 240
cggcctcgat cggtgacgct gacgtacaaa atcatcccta tcactccgtc gcctcttttg 300
ttttataatg aaataacttg cctaattgac atttaaaatg aggaaatcag acgttaataa 360
ttactgtaga atatcaccac tcacatctat gactggaaac acggaaaaac cgcagaggga 420
gcccatcgat attagcgaat gttatataaa tgggatcccg gcaaccagcg gaaaaaagca 480
aggttcgtac ttcgacgatt ttcgagtcta gaaggtgttc ccctatttcc tccgatatcc 540
ctacttgtac atcattcttt caaacgattt ctttagatag tatagctact aatagcgcat 600
ttataatttt ttaacttcta tatctaagtg gtcctgtatg aatacagacc atttaaggca 660
ataaactcca atatcaatta aaggggagta agaagaaaaa ataatatgga aacgggcgac 720
actccgccac cgattcaggg acacgcccgg tgcaggtgca gccgaagttc acactcaggg 780
ggacgttggt catcggagga ctggcccagg tgtcgggcct cggccacggc ctagcgccct 840
actcgactct tagctccaac tgagaggtgc ttcctcccta gctcgtagaa cacgaatagc 900
ccctatgcgt tagggcgcca aagacaccat ggtaccgaac ggccctaaac cgcgcacgta 960
gtcttgaaga gc 972
<210> 89
<211> 987
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 89
gctcttctca catcccaagt cgctcgagac ctccctacca cttggagttt gcccggctgt 60
gaaacaaacg atcgttaact aacgctgatt atagtgagag ctacaaccct tccatttgat 120
tgcttaagtg tgtattaaag tttataccgt tcagaaacac cttaaattgc acctgcgggt 180
tcttaagttt cggcatactc aaagtaacct ttcactccat ttccagctgg gttcgccagg 240
tcccggcgct tgcttcgggc agtttgacgt ataaattttt ttcctcttgc ttctatgtag 300
tccgccatat actctcctta tttcaagtcc atcacacagc tcattgcacg ttcttcccga 360
tcaacatgtc gcctacccag ttcgaaatgg acccattccc tatctcccag gacaaaaaca 420
gtattcattt tggtctgcat tatgtgagga aggagtcata attatttctt aatctgatgc 480
ttgctgtttt caaagtcaat agttcgactt aaatccacta gtgctttatg gtgagttaac 540
tttattgaac gcgacaagga tttatgatca tttttaagaa attttaattc acctcccatg 600
gttttttatt gtattattct ttctcccttt tctacttggg gtcaatacga ttttataagc 660
taataaggaa gaacgataag gaccgatgat gttatctcat cgtagttacc gttatccaag 720
ttacaatatt cttttcccgc tccgcgagaa gcggtgggtg taaggcggcg ggtgggttag 780
ccaatttaat tcatacactt gccgaggcaa agccggaccc caaaggtgct aggtctgtga 840
ttcgtaagta tgtcgatgag ctcccgagct atattacggc aaagagcaag attaacgttt 900
cgttgatgca tgtctctgtt agttgcgttt atggggtgtg gcccactgga tacctaccgc 960
ttgtcggggt gcgcgtgctt gaagagc 987
<210> 90
<211> 1006
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 90
gctcttctca catcccaagt cgctcgagac ctccctacca cttggagttt gcccggctgt 60
gaaacaaacg atcgttaact aacgctgatt atagtgagag ctacaaccct tccatttgat 120
tgcttaagtg tgtattaaag tttataccgt tcagaaacac cttaaattgc acctgcgggt 180
tcttaagttt cggcatactc aaagtaatct ttcactccat ttccagctgg gttcgccagg 240
tcccggcgct tgcttcgggc agtttgacgt ataaattttt ttcctcttgc ttctatgtag 300
tccgccatat actctctcct tatttcaagt ccatcacaca gctcattgca cgttcttccc 360
gatcaacatg tcgcctaccc agttcgaaat ggacccattc cctatctccc aggacaaaaa 420
cagtattcat tttggtctgc attatgtgag gaaggagtca taattatttc ttaatctgat 480
gcttgctgtt ttcaaagtca atagttcgac ttaaatccac tagtgcttta tggtgagtta 540
acttcaagga tttatgatca tttttaagaa attttaattc acctcccatg gttttttatt 600
gtattattct ttctcccttt tctacttggg gtcaatacga ttttataagc taataaggaa 660
gaacgataag gaccgatgat gttatctcat cgtagtcacc ggtatccaag ttacaatatt 720
cttttcccgc tccgcgagaa gcggtgggtg taaggcggcg ggtcgtgggc gggtggttga 780
gagtgagacg gggggttaac caatttaatt catacacttg ccgaggcaaa gccggacccc 840
aaaggtgcta ggtctgtgat tcgtaagtat gtcgatgagc tcccgagcta tattacggca 900
aagagcaaga ttaacgtttc gttgatgcat gtctctgtta gttgcgttta tggggtgtgg 960
cccactggat acctaccgct tgtcggggtg cgcgtgcttg aagagc 1006
<210> 91
<211> 957
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 91
gctcttcctt tctcgcatat gcgctcattt aattatgctc acggcgtagt ttgttattat 60
tctattccct tgagaatcct tatttctctt tgaatcacca tctattttag taactctatg 120
tcacactttt cttttgccgg atgggttaga tatctccatg aaggaatggg ccgatgtcta 180
ccttccttta ccgttgacgt acgcacaaac gttccttttt ctcttcttct ctctcttctt 240
ctctcttcct tctgcaacac agaatttaca agtgtaccct cctctttttt tcctttttcc 300
gctaccatgc atttcttttt ccttcttctt ttttttcaca aaatctttgt gatattttag 360
gacagtatta atatgtaata cgttctttaa gggacatata aatttactaa cacccctaat 420
atgtgaacga atttattaga tagaatttgt aattcattta gatataaagt gataattatt 480
agacacagtt acggaatttc tagcatcacg acagaaactc ctcataggct ctcatactta 540
tattatattc aaatactgat caatagtact taacaataaa tagatggtac caatataaac 600
taaattacta aatagtactt ttaggtagta atggagtatg ttaagatcac attatatttt 660
gtttcagaga ctctatttct ggtaattgcc ttattggtat caaggtaggg gaataagcga 720
ccacggagaa agctagaaac aacaattgac tgcggcgtgg gtccagtgat gcggatacca 780
gctagagtaa gttgaaattg gcacatgaat gtattcttga aatcagtgaa agacgttacg 840
aaggtgggcc aataatatat gagaggcctt caatccaaaa agcgtacctt actaatcaca 900
aatttttgat attgagaaac atactgagag gatacgattc ggttggttgg gaagagc 957
<210> 92
<211> 959
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 92
gctcttcctt tctcgcatat gcgctcattt aattatgctc acggcgtagt ttgttattat 60
tctattccct tgagaatcct tatttctctt tgaatcacca tctattttag taactctatg 120
tcacactttt cttttgccgg atgggttaga tatctccatg aaggaatggg ccgatgtcta 180
ccttccttta ccgttgacgt acgcacagac gttccttctt ctctcttcct tctgcaacac 240
agaatttaca agtgtaccct cctctttttt tcctttttcc gctaccatgc atttcttttt 300
ccttcttctt ttttttcaca aaatctttgt gatattttag gacagtatta atatgtaata 360
cgttctttaa gggacatata aatttactaa cacccctaat atgtgaatga atttattaga 420
tagaatttgt aattcattta gatataaagt gataattatt agacacagtt acggaatttc 480
tagcatcacg acagaaactc ctcataggct ctactactat aaatacggcg ttccacttca 540
tacttatatt atattcatat actgatcaat agtacttaac cataaataga tggtaccaat 600
ataaactaaa ttactaaata gtacttttag gtagtaatgg agtatgttaa gatcacatta 660
tattttgttt cagagactct atttctggta attgccttat tggtatcaag gtaggggaat 720
aagcgaccac ggagaaagct agaaacaaca attgcggcgt gggtccagtg atgcggatac 780
cagctagagt aagttgaaat tggcacatga atgtattctt gaaatcagtg aaagacgtta 840
cgaaggtggg ccaataatat atgagaggcc ttcaatccaa aaagcgtacc ttactaatca 900
caaatttttg atattgagaa acatactgag aggatacgat tcggttggtt gggaagagc 959
<210> 93
<211> 994
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 93
gctcttctac cccctttttt tttgtcttag gcttcgtagt ttacatatta gattgccttt 60
ggttgattta catatttaat ataatttggc tatccagctt gtaatcgatt tacaagttga 120
cggaacgtac gaataaacaa agaagatatc aatggttgcc aggacttatt tctttagata 180
atgatatatt gttattcaga gattgtggta tcacaacacc aaacaccaca accgcttaaa 240
caaaaccgtc gaggagtgaa tacaccgaaa aacaaaaccc tcaccataaa tgaacacaaa 300
ctcactcaaa ggcgcaatct aatcaataaa ccgattaaaa agtgtgaact tgtgcgtatt 360
tagataagtt tgaggtatct tgttttagga aattgagcca ggatcaaact gtacgatttc 420
acttaaaggt taagacggga gttaaggaat ttggcgggga gacaccctaa tgagatacga 480
cttctttata ctaaattacc taccggaacg aatataaaac aggaagaacc tctagggaaa 540
aaagaaggac agcttgtgta agggggaaaa aaatcctgcc gcttcctctt tcctttccgt 600
ctgcctcctc gccttctcct ttccctcgtt cccccgttct ctccctgtct ccttgtcgtc 660
cccctctcct tcctctgtct tcgtttcccc cccgccccag acgacgacgg gctcaatatg 720
tgcacgaagc cggaagcaaa agctcgcgcg aggtctttgc aaattgatat ttcggtcgta 780
ttgctggtgg cctgttcggg cgacttctta aggaagaact tagtgatgtc cagtagccag 840
ggtatcagcc ggcgctggga ggctgggggg gacgggagat aaactttagg catgtcagtg 900
gaccaggtgg gaccacagga cagggtcaag catggggcgt cggagtggcc ctccccccgt 960
gtcacgcagt gacctttagg cggggtggaa gagc 994
<210> 94
<211> 994
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 94
gctcttctac cccctttttt tttgtcttag gcttcgtagt ttacatatta gattgccttt 60
ggttgattta catatttaat ataatttggc tatccagctt gtaatcgatt tacaagttga 120
cggaacgtac gaataaacaa agaagatatc aatggttgcc aggacttatt tctttagata 180
atgatatatt gttattcaga gattgtggtt atataaataa acacaccacc aaacaccaca 240
accgcttaaa caaaaccgtc gaggagtgaa tacaccgaaa aacaaaaccc tcaccataaa 300
tgaacacaaa ctcactcaaa ggcgcaatct aatcaataaa ccgattaaaa agtgtgaact 360
tgtgcgtatt tagataagtt tgaggtatct tgttttagga aattgagcca ggatcaaact 420
gtacgatttc acttaaaggt taagacggga gttaaggaat ttggcgggga aacaccctaa 480
tgagatacga cttctttata ctaaattacc taccggaacg aatataaaac aggaagaacc 540
tctagggaaa aaagaaggac agcttgtgta agggggaaaa aaaatcctgc cgctttccgt 600
ctgcctcctc gccttctcct ttccctcgtt cccccgttct ctccctgtct ccttgtcgtc 660
cccctctcct tcctctgtct tcgtttcccc cccgccccag acgacgacgg gctcaatatg 720
tgcacgaagc cggaagcaaa agctcgcgcg aggtctttgc aaattgatat ttcggtcgta 780
ttgctgatgg cctgttcggg cgacttctta aggaagaact tagtgatgtc cagtagccag 840
ggtatcagcc ggcgctggga ggctgggggg gacgggagat aaactttagg catgtcagtg 900
gaccaggtgg gaccacagga cagggtcaag catggggcgt cggagtggcc ctccccccgt 960
gtcacgcagt gacctttagg cggggtggaa gagc 994
<210> 95
<211> 1141
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 95
gctcttccgg ctatgttgtc gcgagcaaca ggcgaatcga aaagggggcc cagaatcaaa 60
cgaaacctct tcggttgaaa aacactcggg gcgcaagtcc agagggcagc atcgagccgc 120
caacccatct tcaccacatt ggtgcgtggg tagttatggc accatttcct gagaccgacc 180
cttcccgttg tagagcgaat aaaccgtgta ttgaatttgc actatgacat ctccgcctat 240
ggttttgaaa cccagcttgg tcgctgatgt agtaatttga cgagcgtaga cttagaaatg 300
cattagcgcc agtgttggaa tacctcagac cctagtcgga actttgggta gcagggctga 360
gggtgggaaa cggctcatgt ggaacgcact tggtctgaat agaagggtaa aaaggcgtat 420
gactacaaaa atccgtctcc atgcacacac aatcgttaat cccatcgtat ccagggttcc 480
gaagaggaac cgacaggtat aacctctgat atcccggatg atacgataga gacagcgtga 540
gctgcgtttg cacgtcgcta acgctcaaaa cttaaaaata ttgagatcag cgaagggaac 600
ttcaaaatta acttgtagaa aaaaaaaaag cgaaagtttt ataaattagg aaggaagaat 660
aataatatag ctaaaattct ttgaggatac ggatcattgg gctacaagcc aatgtctttg 720
aataataagc taaccctatg caattaccga ggtatacagc aagcgataac cagttttgcc 780
gaaaccaatt aattcgagac tgggagacag aaagaaggtg atcgaaaacg aataaccctg 840
acgctcacgg gcatagacag cgtatgaatc cctccatttc ccttcggcac ccaaccctat 900
cccttcgcct cccgatcacc aactaccttg ttgcttccac caaacgtaca gcctgtccca 960
tatcctcctt ttttccttaa gccgggtact ttcccacatc cctgctcctc tcccccgcct 1020
gccttgtaag cttgcccgtt acttaccagc ccatctgctt actcacgcgc cccaccgacg 1080
tccggttttg gtccacaatt aatgccaagc tgtactttag gagcgccctt tggcgaagag 1140
c 1141
<210> 96
<211> 1139
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 96
gctcttccgg ctatgttgtc gcgagcaaca ggcgaatcga aaagggggcc cagaatcaaa 60
cgaaacctct tcggttgaaa aacactcggg gcgcaagtcc agagggcagc atcgagccgc 120
caacccatct tcaccacatt ggtgcgtggg tagttatggc accatttcct gagaccgacc 180
cttcccgttg tagagcgaat aaaccgtata ttgaatttgc actatgacat ctccgcctat 240
ggttttgaaa cccagcttgg tcgctgatgt agtaatttga cgagcgtaga cttagaaatg 300
cattagcgcc agtgttggaa tacctcagac cctagtcgga actttgggta gcagggctga 360
gggtgggaaa cggctcatgt ggaacgcact tggtctgaat agaagggtaa aaaggcgtat 420
gactacaaaa atccgtctcc atgcacacac aatcgttaat cccatcatat ccagggttcc 480
gaagaggaac cgacaggtat aacctctgat atcccggatg atacgataga gacagcgtga 540
gctgcgtttg cacgtcgcta acgctcaaaa cttaaaaata ttgagatcag cgaagggaac 600
ttcaaaatta acttgtagaa aaaaaaaaag cgaaagtttt ataaattagg aaggaagaat 660
aataatttga ggatacagat cacgtcggta ataattgggc tacaagccaa tgtctttgaa 720
taataagcta accctatgca attaccgagg tatacagcaa gcgataacca gttttgccga 780
aaccaattaa ttcgagacgg ggagacagaa agaaggtgat cgaaaacgaa taaccctgac 840
gctcacgggc atagacagcg tatgaatccc tccatttccc ttcggcaccc aaccctatcc 900
cttcgcctcc cgatcaccaa ctaccttgtt gtttccacca aacgtacagc ctgtcccata 960
tcctcctttt ttccttaagc cgggtacttt cccacatccc tgctcctctc ccccgcctgc 1020
cttgtaagct tgcccgttac ttaccagccc atctgcttac tcacgcgccc caccgacgtc 1080
cggttttggt ccacaattaa tgccaagctg tactttagga gcgccctttg gcgaagagc 1139
<210> 97
<211> 995
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 97
gctcttctta agtccttata tttgacgaaa ttgtgttggt atagtaattg atattgtcct 60
attttttaga tcaatatcta tttactgatg taaatgaata tgttatatga gggtattagg 120
gggcagtata attgctgtct tacagataat aagaactgga acaatttatt aaatccatga 180
tattcatgaa gtgtgatatg cctacgaaga aataaaagag aagggaaatc gttgtagtag 240
acctagcgta tacttgatcc acccagcagt aaagtcaaat ttaagtgtac tttagtccaa 300
aaaaaataaa tctgagttat gacttcaaac attgatctta gtgttagaag caggagtaac 360
gacttatgta tctcatacac ttccagattg gtagtaagag agtttagtgt tgagtttaat 420
acctcgactg gatattttct ttttttcctg tttatctttt tatggatgtt ccatgtgccc 480
ccgcgctagg acgagtatgg ggtcaatctc agctcgtgca cttttaagag gcaatactag 540
attctagcct aattagaaga aatctctaaa gacctaaact acattttact acatggatca 600
tacagaacga aacaccactc cgacaaatgg ttaagccctt taaacgtatt ttgttcttta 660
ttattaagac cacttatgac gcaaataagt agattgtagg atactgttta aagcgctgaa 720
tgcgtaccta aaaaatacgc aggaagggtg agtgttaccc tgttgatcat ccatctaaac 780
cgtaactata tctaggagca tcaagggacc aaaaacccgc ggcgttggga ccaacggcgg 840
agagtagcta ctttctccta tctactccag gcggggttgg cctcgctcca cattcgcaga 900
ggcccgacta cggttatata gacgcaactt tcagcccaaa acctaacgag atatagaaga 960
tcgccactag gttaccgaat tactcgttga agagc 995
<210> 98
<211> 986
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 98
gctcttctta agtccttata tttgacgaaa ttgtgttggt atagtaattg atattgtcct 60
attttttaga tcaatatcta tttactgatg taaatgaata tgttatatga gggtattagg 120
gggcagtata attgctgtct tacagataat aagaactgga acaatttatt aaatccatga 180
tattcatgaa gtgtgatatg cctacgaaaa ataaaagaga agggaaatcg ttgtagtaga 240
cctagcgtat acttgatcca cccagcagta aagtcaaatt taagtgtact ttagtccaaa 300
aaaaataaat ctgagttatg acttcaaaca ttgatcttag tgttagaagc aggagtaacg 360
acttatgtat ctcatacact tccagattgg tagtaagaga gtttataata ccttgactgg 420
atattttctt tttttccttt tttttctgtt tatcttttta tggatgttcc atgtgccccc 480
gcgctaggac gagtatgggg tcaatctcag ctcgtgcact tttaagaggc aatactagat 540
tctagcctaa ttagaagaaa tctctaaaga cctaaactac attttactac atagatcata 600
cagaacgaaa caccactccg taagcccttt aaacgtattt tgttctttat tattaagacc 660
acttatgacg caaataagta gattgtagga tactgtttaa agcgctgaat gcgtacctaa 720
aaaatacgca ggaagggtga gtgttaccct gttgatcatc catctaaacc gtaactaact 780
atctaggagc atcaagggac caaaaacccg cggcgttggg accaacggcg gagagtagct 840
actttctcct atctactcca ggcggggttg gcctcgctcc acattcgcag aggcccgact 900
acggttatat agacgcaact ttcagcccaa aacctaacga gatatagaag atcgccacta 960
ggttaccgaa ttactcgttg aagagc 986
<210> 99
<211> 973
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 99
gctcttcatt gtgcgttgat gtcatttcgc cgacctttac tgtgggtgta gtattctgat 60
tatccttctc tgaggaaaaa cagactgaaa cgttgtttaa atgtgacgcg ggcccaacaa 120
atcgcacaac agcagtactg tgtaatctgc gaggggacta accaacactt atactttatg 180
cgtacccaca cacaggtttt atctcaactg attcgcagat ttcgtctgcc agtttcaagg 240
gtctcgaacc ggtccgccca tgttagaaaa taatggaata aagaactggt aatcaaacat 300
tttctataat gggaaaagaa taagtaactt ttcccttttt tctattaatg ataagaagaa 360
gtatattgaa taaaactacg caacttcaca cttttccttt aaaatatcca tattattatt 420
agtcttatgc gaaagtgttg catgttagaa tgctcacaaa aagtgcaaac agctgctctc 480
aagtaagcgc actaggatac actgggtaaa ctttgtggag ttcgttcctc tatggtgcat 540
aagccgaaat caatgatttt aacatctgtt agattggaac tggtcaaatt agggtgcgtg 600
tgcttatagg accccctgcc tcatcttaac aatatcgcga ttcatcgaca gattttccat 660
ccgcagttct cgtaagggag atttcctcaa agtttttaaa ggtgacgaat atcgagaaac 720
aacgggactg ggcttagacc tccttgcgtt tctcggggta aaacgcacgt gaagatctct 780
gaggagcagg ctggcaagcc cgctcgttac tggaagggca gcgaatgtga ggagtcgtgg 840
gcagagtccc gctgggattg agaggcacga aaaagggggc cgagatcaaa agcgctaact 900
tgagtcaacc gattactcgg gcaatattgc gggtattcgt gagggtacgc ggacgggagc 960
agcagggaag agc 973
<210> 100
<211> 977
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 100
gctcttcatt gtgcgttgat gtcatttcgc cgacctttac tgtgggtgta gtattctgat 60
tatccttctc tgaggaaaaa cagactgaaa cgttgtttaa atgtgacgcg ggcccaacaa 120
atcgcacaac agcagtactg tgtaatctgc gaggggacta accaacactt atactttatg 180
cgtacccaca cacaggtttt atctcaattg attcgcagat ttcgtctgcc agtaagcagg 240
tctctcgaac cggtccgccc gtgttagaaa ataatggaat aaagaactgg taatcaaaca 300
ttttctatgg aaaagaataa gtaacttttc ccttttttct attaatgata agaagaagta 360
tattgaataa aactacgcaa cttcacactt ttcctttaaa atatccatat tattattagt 420
cttatgcgaa agtgttgcat gttagaatac tcacaaaaag tgcaaacagc tgctctcaag 480
taagcgcact aggatacact gggtaaactt tgtggagttc gttcctctat ggtgcataag 540
ccgaaatcaa tgattttaac atctgttaga ttggaactgg ctaggattca aattagggtg 600
cgtgtgctta taggaccccc tgcctcatct taacaatatc gcgattcatc gacagatttt 660
ccatccgcag ttctcgtaag ggagatttcc tcaaagtttt taaaggtgac gaatatcgag 720
aaacaacggg actgggctta gacctccttg cgtttctcgg ggtaaaacgt acgtgaagat 780
ctctgaggag caggctggca agcccgctcg ttactggaag ggcagcgaat gtgaggagtc 840
gtgggcagag tcccgctggg attgagaggc acgaaaaagg gggccgagat caaaagcgct 900
aacttgagtc aaccgattac tcgggcaata ttgcgggtat tcgtgagggt acgcggacgg 960
gagcagcagg gaagagc 977
<210> 101
<211> 1070
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 101
gctcttcgcc gtcctccggt gcgccgtacc agggtaacgc tgtctggtgt ttagcaaatt 60
attacatctc actagaattt gctctataat tgtatcggta ctaccttata tttttcggtg 120
tttttattct ctatcactag ggaactttaa cgtacttgct ctttcttaac ttcctttagg 180
acgcgctgcg ctcgatagtg aatgattttt ttttttgttt ttttgatatt ttgttgtttt 240
taagggttca tatgtcgtct tacagagtat agatgagata cgaactgttt caagacctat 300
gcattttttg gaaacagaaa cgctacgttt aatctcctat cacggaagat agtggacgta 360
taagggacac gattagttct cacagccgca gcggatcctt atgtgtcccc caatccatgg 420
cagtctacta caatatctta gcgggtcagc acgcttcttg gtgggaccgg cttaactcgc 480
ggttaatagt tcctgggacc gacagacagt taaggctaag gaacaaatta agaaccgctt 540
taatgctcgt taacttaaag cataaacgta ctgttagtat attcatagtt tcctaggaaa 600
gttctgccca ttcgagtaac tctcatgaaa acacaatttc taccaccaaa tttattcgtg 660
atatcatcag gacatgccta cgtagacgaa gacacagcgg agggttctag agccctcaag 720
gaccagcttc aggtgattgg aacgtgacta gtactattag aagagaaact aaattaaaga 780
gttcggtgtt agggacctgc acttaaaaga taacaaatta aaaaagtata ggtttactta 840
atccgcccgt tgatctcttt tttactattt aggattaact taggacgctc aatcccccgt 900
tgtacccagc cgtatcacca tgacttccga tctacttgct ccgcaatttc gccaattgag 960
tataattggc tcgttcactt gaaagaagag ttccgtcaca cttatcgcat actcttgcga 1020
ttcttctagt catcttacta aagtctactt ctcgacccat cccgaagagc 1070
<210> 102
<211> 1075
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 102
gctcttcgcc gtcctccggt gcgccgtacc agggtaacgc tgtctggtgt ttagcaaatt 60
attacatctc actagaattt gctctataat tgtatcggta ctaccttata tttttcggtg 120
tttttattct ctatcactag ggaactttaa cgtacttgct ctttcttaac ttcctttagg 180
acgcgctgcg ctcgatagtg aatgatttgt tttttttgtt tttttgatat tttgttgttt 240
ttaagggttc atatgtcgtc ttacagagta tagatgagat acgaactgtt tcaagaccta 300
tgcatttttt ggaaacagaa ttacaaggct aagtaacgct acgtttaatc tcctatcacg 360
gaagatagtg gacgtataag ggacacgatt agttctcaca gccacagcgg atccttatgt 420
gtcccccaat ccatggcagt ttactacaat atcttagcgg gtcagcacgc ttcttggtgg 480
gaccggctta actcgcggtt aatagttcct gggaccgaca gacagttaag gctaaggaac 540
aaattaagaa ccgctttaat gctcgttaac ttaaagcata aacgtactgt tagtatattc 600
atagtttcct aggaaggttc tgcccattcg agtaactctc atgaaaacac aatttctacc 660
accaaattta ttcgtgatat catcaggaca tgcctacgta gacgaagaca cagcggaggg 720
ttctagagcc ctcaaggacc agcttcaggt gactagtact attagaagag aaactaaatt 780
aaagagttcg gtgttaggga cctgcactta aaagataaca aattaaaaaa gtataggttt 840
acttaatccg cccgttgatc tctttttgac tatttaggat taacttagga cgctcaatcc 900
cccgttgtac ccagccgtat caccatgact tccgatctac ttgctccgca atttcgccaa 960
ttgagtataa ttggctcgtt cacttgaaag aagagttccg tcacacttat cgcatactct 1020
tgcgattctt ctagtcatct tactaaagtc tacttctcga cccatcccga agagc 1075
<210> 103
<211> 1007
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 103
gctcttcttt atagggaaga caaatttaca taattataat taaacaattt tgaatggtat 60
gaattagggg caaagcgaac cttatgaaca ttttccgcgg tagtacgaaa acaaatagac 120
ccacataacg gttgacacct gaaacgcaag ggccttcgct ccactcattc gcaacgtctg 180
tggcgtagca ttcgggttgc cccccggtgc aaagagatta taaaagatat cagacggatt 240
atagaagagg aaagaggagt catctgacat gcggtgtgtg ccagggggga attctggaaa 300
atgtagctat agagcaggac aaggctaaga tgagtttgaa cggtagacta gaaaagaggt 360
ttaagaagat aggcaaggtg taattacggg agaggtagta aaatggaaat tagaagatcc 420
atagtaaggg tagagtcgcg gtggaatgat tgtcgagagt gttgaagtcg accgttttat 480
aacttattga ctcccctacg cgctgttgtc gggttcttac cggccatacc aagcaaagtg 540
ttttttagtt atcaatttca tcgtgtgaga tgcgtagaca ttttacctat aatataacat 600
cataataggt aaagtacgca cagacctact ttcaatcacg cactggaaac tggaactttt 660
ataagaaggt gctcgttagt gttttaataa aacaaaaaaa taccttttct tagttaacgc 720
gaattgctga tccaaatccc ggacaagtct caaattattg accgcaggca agcagacccc 780
caaacgtagc tttgcctaag cagcgtacag cattaatttc ctctgcacac ataagatgag 840
agatcgactt aggcttcaaa ccaaagacaa ttctttcctc taacgcaagt ttagtataag 900
attttgtatc aaatcgctat taaaatcgct tctagttgat ctgcgaatag aaagtattaa 960
tataagtaca ttatctaact tattagatta tctatgataa gaagagc 1007
<210> 104
<211> 1023
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 104
gctcttcttt atagggaaga caaatttaca taattataat taaacaattt tgaatggtat 60
gaattagggg caaagcgaac cttatgaaca ttttccgcgg tagtacgaaa acaaatagac 120
ccacataacg gttgacacct gaaacgcaag ggccttcgct ccactcattc gcaacgtctg 180
tggcgtagca ttcgggttgc cccccggcgc aaagcgatta taaaagatat cagacggatt 240
atagaagagg aaagaggagt catctgacat gcggtgtgtg ccagggggga attctggaaa 300
atgtagctat agagcaggac aaggctaaga tgagtttgaa cggtagacta gaaaagaggt 360
ttaagaagat aggcaaggtg taattacgca ggatattgat aaactagagg gggggagagg 420
tagtaaaatg gaaattagaa gatccatagt aagggtagag tcgcggtgga atgattgtcg 480
agagtgttga agtcgaccgt tttataactt attgactccc ctacgcgctg ttgccgggtt 540
cttaccggcc ataccaagca aagtgttttt tagttatcaa tttcatcgtg tgagatgcgt 600
agacatttta cctataatat aacatcataa taggtaaagt acgcacagac ctactttcaa 660
tcaactggaa cttttataag aaggtgctcg ttagtgtttt aaataaaaca aaaaaatacc 720
ttttcttagt taacgcgaat tgctgatcca aatcccggac aagtctcaaa ttattgaccg 780
caggcaagca gacccccaaa cgtagctttg cctaaacagc gtacagcatt aatttcctct 840
gcacacataa gatgagagat cgacttaggc ttcaaaccaa agacaattct ttcctctaac 900
gcaagtttag tataagattt tgtatcaaat cgctattaaa atcgcttcta gttgatctgc 960
gaatagaaag tattaatata agtacattat ctaacttatt agattatcta tgataagaag 1020
agc 1023
<210> 105
<211> 1018
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 105
gctcttcgcg aaaacaccgg taaggcttga tccaatggtg gctttgaaca atcggagagt 60
gtgtgattct gaatatataa gctaaggggt tctgcgaggt tagacggggt agacgactta 120
ccgtgaacag cggtgccatc ggtcgtttca atttcattga gtttgcctat gtcaaactca 180
gcaattttta aaaaagcaaa aaaaaaatat ttgagtcctt aggggggtaa ggttccagtc 240
tatttcgcgt taatggtatg ggtgtgatca gaccatcact atataaatct ccatgtccca 300
aacctcggat atagcattta gaaagactat ttgcacagta gcgtgaaagc tcataattca 360
gtaacagcaa ttaatttatt aattgttaaa tctagacact ggaaattgtg agtacttgtc 420
gttgtccttg ttagaaagaa ggagtgtgtc ctatgataaa atgaagatca atgggaggat 480
aacgtacgga ttttttcgta tacagtgcat ctatcactca aaagctttcg gacttttatg 540
ttaggtccat gtgcctcagt gtgtagtcag cacgctgcca caaatggact gcctcacatg 600
ctactataga tacaatatcc ctaaggccaa atagtagcta tttgatccgg caagtagcct 660
tcaaagcatc ctaaccagca agcatcgacg caatccgtca cttgtaaggc ttcaggggct 720
catatagcac caacgttgcg caggaataaa aacataacca ttctcatcct ctatcgtgta 780
atccatcgtc catttatccg attcttcaaa gggaaaaagc actgcattca attgtctcat 840
caacaaaatg acgaagtcct caacttgtat attgcttatt taagagatcg tctgcgtatt 900
ccgagcaatt ttttataggc ctgatgtaag attaatgata agatagcact tttatgtatg 960
tctaagtgtg ttctgggggt caaagagtac tcagtttgtt gaattagggg agaagagc 1018
<210> 106
<211> 1043
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 106
gctcttcgcg aaaacaccgg taaggcttga tccaatggtg gctttgaaca atcggagagt 60
gtgtgattct gaatatataa gctaaggggt tctgcgaggt tagacggggt agacgactta 120
ccgtgaacag cggtgccatc ggtcgtttca atttcattga gtttgcctat gtcaaactca 180
gcaattttta aaaaagcaaa aaaaaaaaat ttgactcctt aggggggtaa ggttccagtc 240
tatttcgcgt taatggtatg ggtgtgatca gaccatcact atataaatct ccatgtccca 300
aacctcggat atagcattta gaaagactat ttgcacagta gcgtgaaagc tcataattca 360
gtaacagcaa ttaatttatt aattgttaaa tctagacacg ggaaattgtg agtacttgtc 420
gttgtccttg ttagaaagaa ggagtgtgtc ctatgataaa atgaagatca atgggaggat 480
aacgtacgga ttttttcgta tacagtgcat ctatcaccta aggtaattgt cctaaacaca 540
taagttgact caaaagcctt cggactttta tgttaggtcc atgtgcctca gtgagcacgc 600
tgccacaaat ggactgcctc acatgctact atagatacaa tatccctaag gccaaatagt 660
agctatttga tccggcaagt agccttcaaa gcatcctaac cagcaagcat cgacgcaatc 720
cgtcacttgt aaggcttcag gggctcatat agcaccaacg ttgcgcagga ataaaaacat 780
aaccattctc atcctctatc gtgtaatcca tcgtccattt atccgattct tcaaaaggaa 840
aaagcactgc attcaattgt ctcatcaaca aaatgacgaa gtcctcaact tgtatattgc 900
ttatttaaga gatcgtctgc gtattccgag caatttttta taggcctgat gtaagattaa 960
tgataagata gcacttttat gtatgtctaa gtgtgttctg ggggtcaaag agtactcagt 1020
ttgttgaatt aggggagaag agc 1043
<210> 107
<211> 1053
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 107
gctcttcaat tctaggcacg aacatacaag atgaagtcat cctgcctaat tttaatggta 60
taggaaaaaa ttttaataac ttatgcaatt aaacataatt actttttaag gtcgatatag 120
gttttttttc agtacttttt tggtttggtt taggataagg gtattttcct tatcggatag 180
aggaattatt gttattgaca gggagttgaa tagaagtcca cgctttagac gctaatgctg 240
gaacatgact accgtactac acaaatcgtt aaactgttaa ttggaaactt tagctacaac 300
ttatatgtaa tttgcctatc ttatcgtatt gttaactaaa gtatagtact caatggcttt 360
ctgattaatg tcacttattg gtttgcaatt cagtcaatca tcttatgaac tttttagact 420
acgctcgtag gcaattccag ttggaataag ataactcgca tacaaaataa aatattagat 480
ctgcgctaac tggatagaaa tactagtata aatagtattg tgaataaata tgatgtaata 540
aaagtaagaa tatgtaatat ttatcaacta taaatggtcg tgggcaatgt tcgtttaaat 600
attaatttaa ataaaatata tttattatta aaatttttaa tattttaagt gtgttaaaat 660
caagcagccc aataataata ctccattgtc tagcaaatta aagatgtgca ggtagtgtaa 720
taatcgggct gatggggtgc ttttaggtgt agttggaatt acgtaattga aaaaaatgtt 780
cacttcaacg tatgaaggac gttgaaacta gtaagatagg ctggccatgc tgccgacacg 840
aatacgagag cgagaggcat ccagatggag agcggcgtga agaagcgaga ggaagaagcg 900
gatgcctgaa caactcatgt cacgatctat tcatccattc tgcgtataag caatcatgaa 960
gatttgaggc attactcatg gatattgtcg tttttgcgag gtatttagtg cgcccataag 1020
caagttaatt tcagaagatg ctataggaag agc 1053
<210> 108
<211> 1041
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 108
gctcttcaat tctaggcacg aacatacaag atgaagtcat cctgcctaat tttaatggta 60
taggaaaaaa ttttaataac ttatgcaatt aaacataatt actttttaag gtcgatatag 120
gttttttttc agtacttttt tggtttggtt taggataagg gtattttcct tatcggatag 180
aggaattatt gttattgaca gggagttaaa tagaagtcca cgctctagac gctaatgctg 240
gaacatgact accgtactac acaaatcgtt aaactgttaa ttggaaactt tagctacaac 300
ttatatgtaa tttgcctatc ttatcgtatt gttaactaaa gtatagtact caatggcttt 360
ctgattaatg tcacttattg gttagcaatt cagtcaatca tcttatgaac tttttagact 420
acgctcgtag gcaattccag ttggaataag ataactcgca tacaaaataa aatattagat 480
ctgcgctaac tggatagaaa tactaatgat gtaataaaag taagaatatg taatatttat 540
caactataaa tggtcgtggg caatgttctt aaatattaat ttaaataaaa tatatttatt 600
attaaaattt ttaatatttt aagtgtgtta aaatcaagca gcccaataat aatactccat 660
tgtctagcaa attaaagatg tgcaggtagt gtaataatcg gtgctggggt tagttgctga 720
tggggtgctt ttaggtgtag ttggaattac gtaattgaaa aaaatgttca cttcaacgta 780
tgaaggacgt tgaaactagt aagataggct ggccatgctg ccgacacgaa tacaagagcg 840
agaggcatcc agatggagag cggcgtgaag aagcgagagg aagaagcgga tgcctgaaca 900
actcatgtca cgatctattc atccattctg cgtataagca atcatgaaga tttgaggcat 960
tactcatgga tattgtcgtt tttgcgaggt atttagtgcg cccataagca agttaatttc 1020
agaagatgct ataggaagag c 1041
<210> 109
<211> 1008
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 109
gctcttctga gccttattct ttctgatgtg ttgtaagatc ctaccacctt gaatcataca 60
cggccgtgct cgtcgtttaa cagaaggtga gccacttcgt agttaaccgt attgttcggc 120
gaacctgata aggaatttaa atctgcccgt ccaagaagtc tccttgagtc gtaacggctc 180
gagcgagcat ctttcgagct cgcatgtaat tcggtgcttg atgtgaggag aggtcaatct 240
tgggtctgga gcctcgtgcc atccgtacgg acacgcggta ctctagaggg tcagacgagt 300
agacgaaacg cgtggcggag ggtccctgag tcgcctggaa gacaaccgcc tcacctatgc 360
ggcgaactcg agggcagtat acaactggaa caaacaagaa aagaagaaaa aagaagtgaa 420
ggtttgacca agccaaattg aaagtgcgtc ctagatcaat gtcttacccg tgaaatgcga 480
gaccacacaa agcactaatt tccacaccga taggtaccgt taagcgccga tcttacacct 540
catccttaca ggaaacaaca cgatgcaaat tctggtcctg cgtagcttgc tccgggtctg 600
caattacacc acctctctac tcggagcgtc aagtcgtacc gccctggtgg ctacgaggtg 660
agcaatccct gcgaatagtc gtcttcctcg tagtctacta agagaatatt cttatgtttc 720
gcctacagac ttccatcttc tctaatcttt gtacattact gtcattctcc cactaggata 780
gatagcttat cgcaacaagt ccagctagta aactaataag gcaggtgaga tcggacgtct 840
tcagcaaggc actaagaatc agctgggtgg aagttaatca acggggcttc tatgggttat 900
caccacactg ttatgttagc ccggtaggtc tagtgggata tgtggcgggc gaggaagctt 960
tactgagctg accacaatca cagagcgtat caacattcac tgaagagc 1008
<210> 110
<211> 987
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 110
gctcttctga gccttattct ttctgatgtg ttgtaagatc ctaccacctt gaatcataca 60
cggccgtgct cgtcgtttaa cagaaggtga gccacttcgt agttaaccgt attgttcggc 120
gaacctgata aggaatttaa atctgcccgt ccaagaagtc tccttgagtc gtaacggctc 180
gagcgagcat ctttcgagct cgcatgtgat tcggtgcttg atgtgaggag aggtcaatct 240
tgggtctgga gcctcgtgcc atccgtacgg acacgcggta ctctagaggg tcagacgagt 300
agacgaaacg cgtggcggag ggtccctgag taggcgcaca cggacctcgc ctggaagaca 360
accgcctcac ctatgcggcg aactcgaggg cagtatacaa ctggaacaaa caagaaaaga 420
agaaaaaaga agtgaaggtt tgaccaagcc aaattgaaag tgcgtcctag atcaatgtct 480
tacccgtgaa atgcgagacc acacaaagca ctaatttcca caccgataga taccgttaag 540
cgccgatctt acacctcatc cttacaggaa acaacacgat gcaaattctg gtcctgcgta 600
gcttgctccg ggtctgcaat tacaccacct ctctactcgg agcgtcaagt cgtaccgccc 660
tggtgttcct cgtagtctac taagagaata ttcttatgtt tcgcctacag atttccatct 720
tctctaattg tacattactg tcattctccc actaggatag atagcttatc gcaacaagtg 780
cagctagtaa actaataagg caggtgagat cggacgtctt cagcaaggca ctaagaatca 840
gctgggtgga agttaatcaa cggggcttct atgggttatc accacactgt tatgttagcc 900
cggtaggtct agtgggatat gtggcgggcg aggaagcttt actgagctga ccacaatcac 960
agagcgtatc aacattcact gaagagc 987
<210> 111
<211> 958
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 111
gctcttccat tataagactg tagactcctc tctcaatgta gtcctttaat gaattaaaaa 60
ttaagaatga tttgtatagt tatttggaaa aggaggaggt gaaccgttat gcatttacgg 120
acaaacacaa aagaataact cggactcata ctcttttctg gtgcagctgt ttgacttgct 180
gtcttcggct ggtcactttc tcactcagta acgccagccg cagaaacttt gatattactg 240
tagagacctc tatcactact gagatagatg tggctgccag agacacgttg ttcaaaccta 300
tatacaagtc tgaaatttat ggttattcgt taaaaaatta tttctaatag gcttaatttt 360
attatttaga ttagagggga accccaagct aagagccgtc cggcgactct ggcgctcttt 420
ggctggccca ttaacgtccc gacatccacc gaaatgcaca cgtccatccg tcccagacga 480
cggctagcga tggcacgtgc gagatacgtc aacggaccac acggattgga tatccaggaa 540
ggtctctctc cataaactca gaaaaaaatt acactgtatt tgctgccgga ctggatcata 600
cggatctccc agagcgccag acatattttt ggactttgcc aaccctcaca agtcaactac 660
gagcgactct tcgagttctc aaagcaacaa aataaatgcg caggactgtt acacggcagt 720
ccccaccccc tccgggtctc atgcgtcgaa gaattatgag cgctgcactg agacatcgaa 780
acccggatct atgacttgct accaccaagt cagttagtac gaacccgcaa cgggacacgg 840
aatgtctaag gtaagagata gtatggagaa agtaagaact atactcatcc caaagggata 900
ggagcaaatt aaccagcctc cataacaccg tgtactaacc gccccctcat tgaagagc 958
<210> 112
<211> 969
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 112
gctcttccat tataagactg tagactcctc tctcaatgta gtcctttaat gaattaaaaa 60
ttaagaatga tttgtatagt tatttggaaa aggaggaggt gaaccgttat gcatttacgg 120
acaaacacaa aagaataact cggactcata ctcttttctg gtgcagctgt ttgacttgct 180
gtcttcggct ggtcactttc tcactcatta acgccagccg cagaaacttt gatattactg 240
tagagacctc tatcactact gagatagatg tggctgccag agacacgttg ttcaaaccta 300
tatacaagtc tgaaatttat ggttattcgt taaaaaatta tttctaatag gcttaatttt 360
attatgatag tatttaaatt ttattttacg tagttttttt agattagagg ggaacgccca 420
agctaagagc cgtccggcga ctctggcgct ctttggctgg cccattaacg tcccgacatc 480
caccgaaatg cacacgtcca tctgtccctg cgagatacgt caacggacca cacggattgg 540
atatccagga aggtctctct ccataaactc agaaaaaaat tacactgtat ttgctgccgg 600
actggatcat acggatctcc cagagcgcca gacatatttt tggactttgc caaccctcgc 660
aagtcaacta cgagcgactc ttcgagttct caaagcaaca aaataaatgc gcaggactgt 720
tacacggcag tccccacccc ctccgggtct catgcgtcga aaaattatga gcgctgcact 780
gagacatcga aacccggatc tatgacttgc taccaccaag tcagttagta cgaacccgca 840
acgggacacg gaatgtctaa ggtaagagat agtatggaga aagtaagaac tatactcatc 900
ccaaagggat aggagcaaat taaccagcct ccataacacc gtgtactaac cgccccctca 960
ttgaagagc 969
<210> 113
<211> 807
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 113
gctcttctat acaacaggac cagcgtccgg caaaaggcgt aaccggaacc ggctgagaaa 60
aatcatcggt tgaataaggt agaattgtat aataagtcgt aaggttaaac aacgctaatt 120
aacaaaaaga caagcccaac acagccatca ggcaacggct ctagtggaag ttgaaggtat 180
aatgagatag ctgtcgttgc aagtaagaat tcacttgttt gcatattcca gtaaacaagg 240
tccttctgaa ttaattttct tgccgtcgtg tttaagcgtc gactccgtat tgatgggaac 300
tagtcaatgt acacggccgt tgtaagatgt taacccattc ctgaaaaggg ccaggggaat 360
gatagcaggc aatacatggc acacgataga agtctgcttg atgcttggtc tctgctgacc 420
tttacagtct gccagctgag aactttgtta ttaagtgtta gcgatcttgt atacgcccgt 480
ataagaggtt gacaatgcgt gcggaaacga cgctagacgg tttgatggcg ggtcgtaacg 540
gcctcatttt ccaccattac tgtgacattt ctttttattg atttgactct tccattgtcg 600
tctaatcata agtcgaatca gtttcgagag cttcctgtcg aaagtttttc tgtagtaccc 660
ctaactgtgc gtcactaaag cttcgtactt tatactgtat cactgattga acctactcgc 720
tctcgtattt ttttcacatg tcgtgagtat aattaatatt aaactaaatc aattttatta 780
aatttcatgc caagatatac gaagagc 807
<210> 114
<211> 797
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 114
gctcttctat acaacaggac cagcgtccgg caaaaggcgt aaccggaacc ggctgagaaa 60
aatcatcggt tgaataaggt agaattgtat aataagtcgt aaggttaaac aacgctaatt 120
aacaaaaaga caagcccaac acagccatca ggcaacggct ctagtggaag ttgaaggtat 180
aatgagatag ctgtcgttgc aagtaagatc acttgtttgc atattccagt aaacaaggtc 240
cttctgaatt aattttcttg ccgtcgtgtt attaagcgtc gactccgtat tgatgggaac 300
tagtcaatgt acacggccgt tgtaagatgt taacccatct cctaaaaagg gccaggggaa 360
tgatagcagg caatacatgg cacacgatag aagtctgctt gatgcttggt ctctgctgac 420
ctttacagtc tgccagctga gaactttgtt attaagtgtt agcgatcttg tatacgcgtt 480
gacaatgcgt gcggaaacga cgctagacgg tttgatggcg ggtcgtaacg gcctcatttt 540
ccaccattac tgtgacattt ctttttattg atttgactct tccattgtca tctaatcata 600
agtcgaatca gtttcgagag cttcctgtcg aaagtttttc tgtagtaccc ctaactgtgc 660
gtcactaaag cttcgtactt tatactgtat cactgattga acctactcgc tctcgtattt 720
ttttcacatg tcgtgagtat aattaatatt aaactaaatc aattttatta aatttcatgc 780
caagatatac gaagagc 797
<210> 115
<211> 1043
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 115
gctcttctgt tagggtaatg gcaacactgg acctccaaaa ctgagcctat tataagtctt 60
aatttagtag aattatgctc atttataacc gcgtcaagtc ttcaaagatt atataaacgt 120
gggtagtgct attccgttca tataccctac tccttgtaac aactattcat aattactcct 180
tggtctaata ttattaattg aaaaaagcaa tacagtctat ctactccgct cccggataca 240
tatgctgctg agaggggtgc acctcatggt aatcaaaatc aagtttggtg ttgttaagtt 300
atttttgtat tggcgtcgtg ggtgttcccc ctgtgtgttt cggattatag gcgttgggac 360
ggtaacaccg ctctctttcg cctacagagg atccgaaatt cgtttcgtag caatgcgtac 420
tccagctcac ccatagtctg cacgaagaca gatagaaata ttggaggttg gatgcctctc 480
tgaggggact tgctcacttt gtggccaagg cgcatatagg taaaagttcg gtagttgttt 540
gcatccgtaa gggcagcaga taaatagcat cttgggaaca tgcgaaacca agtacctgcc 600
ggtacgcacg tttaacgaat tgaggtcttg cctgtggggt aaaaaaaatg ttccttcagt 660
ttatagattg cctaaaagat tcctagattg cttaatttgc ttaagtaata ctccttatca 720
cagctagtat ttcgtccacg ttactattat aaccgttcca tcttgtagag ctttttcttc 780
actcctttga attaatagta tttgtaatac tattacattc gaatcgccgt aattatggaa 840
tcttacggca tcatataagg gcagtttaaa agagattggg tatattactt cttcacgctc 900
aacacataaa actaagacta gagagtcgac tgaaccgtaa ataggattta ttgcttactc 960
tgtatatagg ctgggcattt tgattttaca ttctgctcgc aaacggcttt atacttaatc 1020
cttagtccat aaagcggaag agc 1043
<210> 116
<211> 1059
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 116
gctcttctgt tagggtaatg gcaacactgg acctccaaaa ctgagcctat tataagtctt 60
aatttagtag aattatgctc atttataacc gcgtcaagtc ttcaaagatt atataaacgt 120
gggtagtgct attccgttca tataccctac tccttgtaac aactattcat aattactcct 180
tggtctaata ttattaattg aaaaaagaaa tacagctccg ctcccggata catatgctgc 240
tgagaggggt gcacctcatg gtaatcaaaa tcaagtttgg tgttgtagtt aagttatttt 300
tgtattggcg tcgtgggtgt tccccctgtg tgtttcggat tataggcgtt gggacggtaa 360
caccgctctc tttcgcctac agaggatccg aaattcgttt cgtagcaatg cgtactccag 420
ctcacccata gtctgcgaag acagatagaa atattggagg ttggatgcct ctctgagggg 480
acttgctcac tttgtggcca aggcgcatat aggtaaaagt tcggtagttg tttgcatccg 540
taagggcagc agataaatag tatcttggga acatgcgaaa ccaagtacct gccggtacgc 600
acgtttaacg aattgaggtc ttgcctgtgg ggtaaaaaaa atgttccttc agtttataga 660
ttgcctaaaa gattcctaga ttgcttaatt tgcttaagta atactcctta tcacagctag 720
tatttcccta ctcgttgtaa tactgatgtg tccacgttac tattataacc gttccatctt 780
gtagagcttt ttcttcactc ctttgaatta atagtatttg taatactatt acattcgaat 840
cgccgtaatt acggaatctt acggcatcat ataagggcag tttaaaagag attgggtata 900
ttacttcttc acgctcaaca cataaaacta agactagaga gtcgactgaa ccgtaaatag 960
gatttattgc ttactctgta tataggctgg gcattttgat tttacattct gctcgcaaac 1020
ggctttatac ttaatcctta gtccataaag cggaagagc 1059
<210> 117
<211> 1123
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 117
gctcttcttc cgctaatctt acgaatttat agaaggtagg aaccgattat aaatttacga 60
aacaatttga ccagtactac agctctgccg actaagtgta attaataaac acaattacgc 120
tatatctacg tcaagaatcc tagattttgg gtaacgtgcg tccagatagc ttggttcgca 180
caaaaataaa ttctgcacgt ctatttctgt gtggattctt cttaaggaga ccaatcgtct 240
tgaatttgga acagtcttac ttgcactgta ttagcactag tcttttaatc ttgtaggtgc 300
gctataaaag ccctgccata aaactaacat tgtaagacaa catgatatag atgtctccat 360
atatctctca ccgtgtgtct tagttatttc cctcccaaag tacattaatt agaaagaacg 420
tgtgtaagag ttgtaatgat ttccgtaaga gccaaaatcg tgaaaaggat ggttatggac 480
attgagtaag aaagagtgaa attatgtgaa gatggacctt ttagctcggc tccattccta 540
tcgttttctt acaaacgttg ccaagaagat aactagagaa gtgactacca aacgatgtca 600
gtgaggatac acgcttggaa taaagtcaca taagaaacat gaaaaagaag aatagctcat 660
atttcgagtc aaaggggaat agaaaggcta tcggaagaaa gatgaggatg aactgcaagt 720
agctggaata gacgtacgta gcataacaca cgtagctaaa tctcttaaat cgccgtttta 780
tttttatgat acgtgaagat acactgaagt aattaatagc ctcgactgag tactcaatca 840
tggaaacaag ccagggtttg cataaggaaa gccgtcttta acataaaaga ggaaacgcgt 900
actaaacagg tgttcgaata gtacaatttg cgctattgca ttttggcgga ttccgttggg 960
gttattaatc gaacggagtg cctgcgtaaa cccctcggta ttgcaccaag tgatggtggg 1020
aaagagtgca atagtacagt catgaaggaa accggaatcg ctaaaatgaa cgcactacac 1080
tatttcttct tgaaggtgat tcatagatat ttagttgaag agc 1123
<210> 118
<211> 1126
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 118
gctcttcttc cgctaatctt acgaatttat agaaggtagg aaccgattat aaatttacga 60
aacaatttga ccagtactac agctctgccg actaagtgta attaataaac acaattacgc 120
tatatctacg tcaagaatcc tagattttgg gtaacgtgcg tccagatagc ttggttcgca 180
caaaaataaa ttctgcacgt ctatttcttg gtgtggattc ttcttaagga gaccaatcgt 240
cttgaatttg gaacagtctt acttgcactg tattagcact agtcttttaa tcttgtaggt 300
gcgctataaa agcccataaa actaacattg taagacaaca tgatatagat gtctccatat 360
atctctcacc gtgtgtctta gttatttccc tcccaaagta cattaattag aaagaacgtg 420
tgtaagagtt gtaatgattt ccgtaagagc caaaatcgtg aaaaggatgg ttatggaaag 480
agtgaaatta tgtgaagatg gaccttttgg ctcggctcca ttcctatcgt tttcttacaa 540
acgttgccaa gaagataact agagaagtga ctaccaaacg atgtcagtga ggatacacgc 600
ttggaataaa gtcacataag aaacatgaaa aagaagaata gctcatattt cgagtcaaag 660
gggaatagaa aggctatcgg aagaaagatg aggatgaaca attatagggg gctgcctgca 720
agtagctgga atagacgtac gtagcataac acacgtagct aaatctctta aatcgccgtt 780
ttatttttat gatacgtgaa gatacactga actaattaat agcctcgact gagtactcaa 840
tcatggaaac aagccagggt ttgcataagg aaagccgtct ttaacataaa agaggaaacg 900
cgtactaaac aggtgttcaa atagtacaat ttgcgctatt gcattttggc ggattccgtt 960
ggggttatta atcgaacgga gtgcctgcgt aaacccctcg gtattgcacc aagtgatggt 1020
gggaaagagt gcaatagtac agtcatgaag gaaaccggaa tcgctaaaat gaacgcacta 1080
cactatttct tcttgaaggt gattcataga tatttagttg aagagc 1126
<210> 119
<211> 1154
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 119
gctcttcatg aaattaaaac tattaaggaa tataaagcca tctacttgat tagtcgaaaa 60
tacacaacat aacattgaaa aaaaaaccct tcaaaaaagt gtttcaaacc atacaaatta 120
ctaatcatga tgaaacgcaa acactaaatt caacatgaat taatttactc ttagaaaaca 180
tccgagttga gacgaagaat aggataaagt tggtgtttgt tgtgggatcc tgtggcccgg 240
gaatatccga atgcagacga agacaacgac tgagtaaggt gaggtatgcg tgtggtttct 300
ttacttaatg tattctggtc gtttgtgacg tatgtactta aagaaccata ttagcgttac 360
attgaatagc gctctttgga tggtagcagg tttttgtagg ttacttgttg tctttggtaa 420
tatcattcta ataatttttg tgatgaaatt tattttcgct atatggcaac taaggaataa 480
tttcacctac ctttctccaa tactacatca cgtgatgggc gtgcataaaa gatgcccctt 540
gtgggtgttt gcagtgagaa ttgtagccgg aggaaggaga ggagtataaa ggtgtgggct 600
aagaaagaaa ttgagcaaac gactggcact gcttaatgtt tcattcggag gtggttacac 660
aatcacccat cattatttat gcgtaacaaa cgtgcgactt gttcgattta ttgacgacat 720
ttctgcctcg cacaataaac gagggacgat cctataaata caatccgttt ctgtgtactt 780
tcaagacaag aaatactagt aaagagtaat atataagacg tgaattgtag tcaaacttca 840
ttttggcgat tatgatctta cctgacctgg caacaaacaa catattgggg caatgatgct 900
aaagaaggag accgtatcgt actacaagta tcgcgaggag ttaagtattg tatacataaa 960
aagataatta aagttgtact taatatatct taatatgaat tggtagctga cgtcagacga 1020
ttaaggattt tgacacgatt tttataggaa tattaggtaa agttccttct tattttggaa 1080
aatattacga ctatgccaat gtacaaaaat taaagtcatt tgtattatcg ttatggaatt 1140
ctatgaagaa gagc 1154
<210> 120
<211> 1159
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 120
gctcttcatg aaattaaaac tattaaggaa tataaagcca tctacttgat tagtcgaaaa 60
tacacaacat aacattgaaa aaaaaaccct tcaaaaaagt gtttcaaacc atacaaatta 120
ctaatcatga tgaaacgcaa acactaaatt caacatgaat taatttactc ttagaaaaca 180
tccgagttga gacgaagaat aggataaatg gtgtttgttg tgggatcctg tggcccggga 240
atatccgaat gcagacgaag acaacgactg agtaaggtga ggtatgcgtg tggtttcttt 300
acttaatgta ttctggtcgt ttgtgacgta tgtacttaaa gaaccatatt agcgttacat 360
tgaatagcgc tctttggatg gtagcaggtt tttgtgttct ggaaagtttt ttctaaggtt 420
acttgttgtc tttggtaata tcattctaat aatttttgtg atgaaattta ttttcgctat 480
atggcaacta aggaataatt tcacctacct ttctccaata ctacatcacg tgatgggcgt 540
gcataaaaga tgccccttgt gggtgtttgc agtgaaaatt ggaaggagag gagtataaag 600
gtgtgggcta agaaagaaat tgagcaaacg actggcactg cttaatgttt cattcggagg 660
tggttacaca atcacccatc attatttatg cgtaacaaac gtgcgacttg ttcgatttat 720
tgacgacatt tctgcctcgc acaataaacg agggacgatc ctataaatac aattcgtttc 780
tgtgtacttt caagacaaga aatactagta gtaatatata agacgtgaat tgtagtcaaa 840
cttcattttg gcgattatga tcttacctga cctggcaaca aacaacatat tggggcaatg 900
atgctaaaga aggagaccgt atcgtactac aagtatcgcg aggagttaag tgttgtatac 960
ataaaaagat aattaaagtt gtacttaata tatcttaata tgaattggta gctgacgtca 1020
gacgattaag gattttgaca cgatttttat aggaatatta ggtaaagttc cttcttattt 1080
tggaaaatat tacgactatg ccaatgtaca aaaattaaag tcatttgtat tatcgttatg 1140
gaattctatg aagaagagc 1159
<210> 121
<211> 1093
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 121
gctcttctga tcttaagaag ttattagata gggcactgta aattctaggc taaaaatttt 60
cccctcctcg caacctaacc aatatagggc tcaaaaagaa acggaacatg aaatttgagt 120
caaaatggaa attaatgcat gctgtgcaaa gtaataaggg atatgaaaca acgtactata 180
cctcacgaga accggaatag tcagcgcaag cagcgcggca ggagtgcaag ttgaacggac 240
gccttactac cacgggaaac gatttcatga tacttagaat taggcatgga gaagtatact 300
tcataagggt aattccaatg tctggaacga cttgtttcag taaatcaaat ataacagcaa 360
tttatagtgt aaatttcgta aggtataaaa cgtaagatga aatttccaaa gccatctaac 420
caaccatttc acctgctagg taatcccata aagaaaataa gtacacaata gcaataacgc 480
atcaattgtg aattcagtgc gaaggagaac agcagagaaa aacatcgttg tattacaaat 540
cgaaataaag ctttgaattt atccatctta gtcatcaaca tttttagtga aaattaatat 600
attattaggt atttttgcag cgcgctccga cctacgtggc tatggagtag ttatggtttc 660
ggtaattgtc acaatcggac ggacgcagct ctgctgccat ggaatgatta accttgccta 720
gccgacgaaa cctgcctcta taggaaggcg agggtctggg agagcgggga ggtaagtaag 780
tgtgctaaat attatcaatg atcatccaat cctcaacatc caacaaccag gtagcaataa 840
agcgaaattc aatttgcatt ctatatgatt ctacattgag attattatag tacaaaaacg 900
ggggaatatt ggcgataaaa aaaaaagaag aaactataag ttctaaggaa tccaccatgg 960
tcaactgctt atctcagcgt tttcataaag aggtgggacc tataaaacat ttcacggtaa 1020
aagaaataaa caatcatagg gcagtcaaca gcaaaaatag ctacggtaag cgtgaataac 1080
aggcaggaag agc 1093
<210> 122
<211> 1118
<212> DNA
<213> artificial
<220>
<223> DNA standard
<400> 122
gctcttctga tcttaagaag ttattagata gggcactgta aattctaggc taaaaatttt 60
cccctcctcg caacctaacc aatatagggc tcaaaaagaa acggaacatg aaatttgagt 120
caaaatggaa attaatgcat gctgtgcaaa gtaataaggg atatgaaaca acgtactata 180
cctcacgaga accggaatag tcagcgctag cagcgcggca ggagtgcaag ttgaacggac 240
gccttactac cacgggaaac gatttcatga tacttagaat taggcatgga gaagtatact 300
tcataagggt aatttcaatg tctggaacga cttgtttcag taaatcaaat ataacagcaa 360
tttatagtgt aaatttcgta aggtataaaa cgtaagatga aatttccaaa gccatctaac 420
caaccatttc acctgctagg taatcccata aagaaaataa cacaatagca ataacgcatc 480
aattgtgaat tcagtgcgaa ggagaacagc agagaaaaac atcgttgtat tacttcttat 540
atacttattt actacacgtt atcacttaaa atcgaaataa agctttgaat ttatccatct 600
tagtcatcaa catttttagt gaaaattaat atattattag gtatttttgc agcgcgctcc 660
gacctacgtg gctatggagt agttatggtt tcggtaattg tcacaatcgg acggacgcag 720
ctctactgcc atggaatgat taaccttgcc tagccgacga aacctgcctc tataggaagg 780
cgagggtctg ggagagcggg gaggtaagta agtgtgctaa atattatcaa tgatcatcca 840
atcctcaaca tccaacaacc aggtagcaat aaagcgaaat tcaatttgca ttctatatga 900
ttctgattat gatagtacaa aaacggggga atattggcga taaaaaaaaa agaagaaact 960
ataagttcta aggaatccac catggtcaac tgcttatctc agcgttttca taaagaggtg 1020
ggacctataa aacatttcac ggtaaaagaa ataaacaatc atagggcagt caacagcaaa 1080
aatagctacg gtaagcgtga ataacaggca ggaagagc 1118
<210> 123
<211> 907
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 123
gctcttcgtt gatgcagtcc acggagacga gagtcaagaa aagtcgtgat tcaatatctg 60
gaattttttg gcttcttttt taactgcctt ccaggttttt tcctcgcgta gaataaatct 120
tacaaggcgt atactcttaa tagccgtcca aattcatcct agttgcgaac tcttggtaac 180
ctatttttgc ttttttacag aaagagattg accctttttc ggtacaattt agcgaatagg 240
agctacgcac acacatgaaa gggggtaaag tgcacttgtt tattgtttaa tagatctgta 300
cctcatataa cttgagatgc tttgttgtgt ttggggaggt gtttttatcc ggggcgcccg 360
gtctgggtgg cgtcgttgtg ggttgttgga tattgcccta gagtgaatgt tcagccgaaa 420
gcaccgcgag tgatgagggc gctggtcggg cgtgtgaggt gtgggaggga ggtggcactt 480
aaatgaaagt ttaaacacta ggaaatatag taggttatta gaataaaaca aatatggtat 540
tggatagtat actttgtgtt cttaaaaaag tctatggata tctgattttt gtttctagtg 600
ttttccttag ttgacggatt gaataataag aagacgccaa tgctaggtaa gctatagata 660
gaagcttatt caacaagagt gacaaaaact caggactgat tatttaattt ttttatattg 720
gggtaatttg ttattgcccc tactgcttgt ggctaacgta gttacggtcc tgagcctcag 780
aaaactcctc tcgcccaccc tccccagtat cgtcattgcg tgcaactgca ttgctccttc 840
acccggggtc atcggaatcc gctccccact ggagcaccac ctaaatccat gttaattttt 900
gaagagc 907
<210> 124
<211> 919
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 124
gctcttcgtt gatgcagtcc acggagacga gagtcaagaa aagtcgtgat tcaatatctg 60
gaattttttg gcttcttttt taactgcctt ccaggttttt tcctcgcgta gaataaatct 120
tacaaggcgt atactcttaa tagccgtcca aattcatcct agttgcgaac tcttggtaac 180
ctatttttgc ttttttacag aaagagagtg accctttttc ggtacatttt agcgaatagg 240
agctacgcac acacatgaaa gggggtaaag tgcacttgtt tattgtttaa tagatctgta 300
cctcatataa cttgagatgc tttgttgtgt ttggggaggt gtttttatcc gtctgggtgg 360
cgtcgttgtg ggttgttgga tattgcccta gagtgaatgt tcagcctaaa gcaccgcgag 420
tgatgagggc gctggtcggg cgtgtgaggt gtgggaggga ggtggcactt aaatgaaagt 480
ttaaacacta ggaaatatag taggttatta gaataaaaca taggtgatct taatatgaaa 540
tatggtattg gatagtatac gttgtgttct taaaaaagtc tatggatatc tgatttttgt 600
ttctagtgtt ttccttagtt gacggattga ataataagaa gacgccaatg ctaggtaagc 660
tatagataga agcttattca acaagagtga caaaaactca ggactgattt tatatttaat 720
ttttttatat tggggtaatt tgttattgcc cctactgctt gtggctaacg tagttacggt 780
cctgagcctc agaaaactcc tctcgcccac cctccccagt atcgtcattg cgtgcaactg 840
cattgctcct tcacccgggg tcatcggaat ccgctcccca ctggagcacc acctaaatcc 900
atgttaattt ttgaagagc 919
<210> 125
<211> 1089
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 125
gctcttctaa ttaatatttg tacattttat gttacggtcc attattttga gggtctcttg 60
tactccataa tagttactcc tatattcggt tcctactatc agagtcacaa ctgtccgggt 120
ttgtcagatg aacatctctt tttataataa aaaaattttt ccagacatcg gaaacccata 180
agcttattcg taaagtagaa aagtggaata acttttataa tcttcgtttt agtataccat 240
agaactagtg tgaaactcat aatattgtca tcacctatta tacgtgtatt ttatacggta 300
gggtagagga gtacactaat aactctttat ataaaacgaa aagggtgcta ttccccttcg 360
gttctgcgac atgtgttgct cagtagaccg gggcatagaa tcatatattc gttcatctcg 420
tagatgaatg ttaggtgttc gccggtgcta agtcgctctg cataagcttc agttcattgt 480
taaatgttcg cagatggtgt tcaacaactc taattatctt actccttttt tatttataat 540
ctcaccccgc tatctaaaaa aaagaggaca gatatgacct gctttctatt ttcctaattc 600
gaatagcttc ctaatcgagt aattacaaga acaaactatc aaaccatact aacttcttac 660
acttcaacaa atcttaatac tttattttaa tttttccaat tctttcttac atccttctag 720
taccatgcat tggccattct acttatttac aatacttcca ttatcacaga atttttactg 780
gtaattgtaa gttgacaaga acatcaacct catctattcc aagtaatgga tgctacaacc 840
cacaaattcg tataactagc gcctctagtc catttttttg tgcctagggt taatataaca 900
aaggagtcaa gcgtttggtt caagttctcc attgtaacca tagattgtca ccgcaggtgt 960
cacggggacg aggatatgat gaatcttaag ttgttattgg tttctcccac ccatatcttc 1020
gtcgggtcaa ccgtaggaca cggattatct ggagaacagg acaagcttag cgtcggaaga 1080
tcgaagagc 1089
<210> 126
<211> 1111
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 126
gctcttctaa ttaatatttg tacattttat gttacggtcc attattttga gggtctcttg 60
tactccataa tagttactcc tatattcggt tcctactatc agagtcacaa ctgtccgggt 120
ttgtcagatg aacatctctt tttataataa aaaaattttt ccagacatcg gaaacccata 180
agcttattcg taaagtagaa aagtggagta acttttataa tcttcgtttt agtataccat 240
agaactagtg tgaaactcat aatattgtca tcacctatta tacgtgtatt ttatacggta 300
gggtagagga gtacactaat aactctttat ataaaacgaa aagggtgcta ttccccttcg 360
gttctgcgac atgtgttgct cagtagaccc ttaggtgccg ggaaatctat gggacggggg 420
catagaatca tatattcgtt catctcgtgg atgaatgtta ggtgttcgcc ggtgctaagt 480
cgctctgcat aagcttcagt tcattgttaa atgttcgcag atggtgttca acaactctaa 540
ttatcttact ccttttattt tatttataat ctcaccccgc tatttaaaaa aaagaggaca 600
gatatgacct gctttctatt ttcctaattc gaatagcttc ctaatcgagt aattacaaga 660
acaaactatc aaaccatact aacttcttac acttcaacaa atcttaatac tttattttaa 720
tttttccaat tctttcttac atccttctag taccatgcat tggccattct acaatacttc 780
cattatcaca gaatttttac tggtaattgt aagttgacaa gaacatcaac ctcatctatt 840
ccaagtaatg gatgctacaa cccacaaatt cgtataacta gcgcctctag tccatttttt 900
tgtacctagg gttaatataa caaaggagtc aagcgtttgg ttcaagttct ccattgtaac 960
catagattgt caccgcaggt gtcacgggga cgaggatatg atgaatctta agttgttatt 1020
ggtttctccc acccatatct tcgtcgggtc aaccgtagga cacggattat ctggagaaca 1080
ggacaagctt agcgtcggaa gatcgaagag c 1111
<210> 127
<211> 1021
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 127
gctcttctaa aaacacattc attcaagcat tttacatagt ttgaacttcc ttaatttgag 60
aatcatgtac ggtacaccct ttgcgatgtt gctataaaat gaccataact agtgattata 120
tcaatcacat aagaaaagga aaccaaagca cggtggggag attgtaaatg taatactttc 180
aaacacgact ctacatttat tttagaatta tacaaccacc ctactttgct ttagcctcac 240
ttcaagaaga taggcaagaa ataaaacgaa aaaacatgta caacaaaata atagattaaa 300
atatcggctt gggggtcgcg caccgatggt ttaatgatca tcatggctta gttgactggc 360
ttttttcgga atatggctct aatgaatgat aggtactctg gtttaattgg atactacatc 420
gatttatttt cgtaggtata atctatcggg attagcagtc acgagtgttg agagtaattc 480
ccctaatctc tcgccggcct gcattggcgc gctctattgt gtcggcatct ttttgtgttt 540
atgtgtgtta aaaatagcca tattaacgcc caatatgaac tgatcattgg ggctatctat 600
aaatatcctc tagggcaatt ccttgtaagg tatttattaa taattttttt atatataaat 660
tataaatttt ttaattaata tatatgctag tcgttattta taaatattta atttttaata 720
atatattttt aatattgact actgaccgct aatggaatca tttaggtacc taattaaatt 780
catgaataac ctaaggaata aaaaaatttt aagggtagct tacctttgct tgcagtccca 840
actctttctg aactcaacaa agagccacag ggaacccttg tcgtcttgtt agttcgacca 900
cactcggctg atcacttaat tgttcggcta gtccgtaaca cctttgcgtt atatctagga 960
ctgcacttcc tcggtacagt tcccctaaat ccgggttaag gccctaaagt accggaagag 1020
c 1021
<210> 128
<211> 1041
<212> DNA
<213> artificial
<220>
<223> DNA standard
<400> 128
gctcttctaa aaacacattc attcaagcat tttacatagt ttgaacttcc ttaatttgag 60
aatcatgtac ggtacaccct ttgcgatgtt gctataaaat gaccataact agtgattata 120
tcaatcacat aagaaaagga aaccaaagca cggtggggag attgtaaatg taatactttc 180
aaacacgact ctacatttat tttagaattc tatacaacca ccctactttg ctttagcctc 240
acttcaagaa gataggcaag aaataaaacg aaaaaacatg tacaacaaaa taatagatta 300
aaatatcggc ttgggggtcg cgcaccgatg gtttaatgat catcatggct tagttgactg 360
gcttttttcg gaatatggct ctaatgaatg ataggtactc tggtttaatt ggatactaca 420
tcgatttatt ttcgtaggta taatctatcc gagtgttgag agtaattccc ctagtctctc 480
gggcctgcat tggcgcgctc tattgtgtcg gcatcttttt gtgtttatgt gtgttaaaaa 540
tagccatatt aacgcccaat atgaactgat cattggggct atctatatat atcctctagg 600
gcaattcctt gtaaggtatt tattaataat ttttttatat ataaaaatta taatattttt 660
taaatataaa attttttttt tataaatttt ttaattaata tatatgctag tcgttattta 720
taaatattta atttttaata atatattttt aatattgact actgaccgct aatggaatca 780
tttaggtacc taattaaatt catgaataac ctaaggaata aaaaaatttt aagagtagct 840
tacctttgct tgcagtccca actctttctg aactcaacaa agagccacag ggaacccttg 900
tcgtcttgtt agttcgacca cactcggctg atcacttaat tgttcggcta gtccgtaaca 960
cctttgcgtt atatctagga ctgcacttcc tcggtacagt tcccctaaat ccgggttaag 1020
gccctaaagt accggaagag c 1041
<210> 129
<211> 957
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 129
gctcttcgag tctatcgtcg gggggtcgat ggtgcccagg ctcagcgaca cggtgttagc 60
ccctccatcc ctagtctcga cggcggtcat tacgccgggc ggacgacgta tccgaaccga 120
ccaccaaaac ccagatacga gccggccccc actccggctg ttctgtcgtt gtctcctcct 180
gttcctgcct agcctcatca tccactccgt ccacgtgtgt ccgcctagag gttatccata 240
caaaggtgcg tgatcccgca gggaattcga ctccaaacta aacaagaaac cattatacta 300
gagataaaat ctaaaagatt ttgatttgta atttttaacc ttaattataa taatataaat 360
tacgcgacaa ttgggtggta tatcggcata taaaagtgca cagaatgctg agagcggtta 420
gagataaggc agacgatgtt ggcggcgggt ggcagaccta atactctcag aagctcagta 480
aagccactcg taattataaa tggttatttt ttatgacttt agactgtaat aaaatgcaat 540
agacgatcta ggaaataatt aacattttta tagtttttta acttctctag aattattggg 600
aaagatgtat caaaagcttg attgtgtata gtttcgactt tggaagatta cgtgattctg 660
ggaaccacag cggagctccc gtgccttcgt tcactgtggc atgcgtggtc tcccacccgc 720
cttgcacccg tctccgcggc gatgggtacc gccgacatga cactcgctcc agggtgggac 780
tcccgtacaa cggcgaccca tatacggctc cccaggcgcc gtgatgtacg cggtacgctc 840
cagagggaac acggacgccg caccaccgct gacccgatcg ctgcggaggg agcaattagg 900
tcgcgggggc ctgcactgcc cgcaactccg cgccagtaca tcgtgtgcgc gaagagc 957
<210> 130
<211> 973
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 130
gctcttcgag tctatcgtcg gggggtcgat ggtgcccagg ctcagcgaca cggtgttagc 60
ccctccatcc ctagtctcga cggcggtcat tacgccgggc ggacgacgta tccgaaccga 120
ccaccaaaac ccagatacga gccggccccc actccggctg ttctgtcgtt gtctcctcct 180
gttcctgcct agcctcatca tccactcccc acgtgtgtcc gcctagaggt tatccataca 240
aaggtgcgtg atcccgcagg gaattcgact ccaaaaaacc attatactag gataaaatct 300
aaaagatttt gatttgtaat ttttaacctt aattataata atataaatta cgcgacaatt 360
gggtggtata tcggcatata aaagtgcaca gaatgctgag agcggttaga aataaggcag 420
acgatgttgg cggcgggtgg cagacctaat actctcagaa gctcagtaaa gccactcgta 480
attataaatg gttatttttt atgactttag actggtaatt ttatatttaa ttaatatatg 540
ctcagcttaa aatgcaatag acgatctagg aaataattaa cttttatagt tttttaactt 600
ctctagaatt attgggaaag atgtatcaaa agcttgattg tgtatagttt cgactttgga 660
agattacgtg attctgggaa ccacagcgga gctcccgtgc cttcgttcac tgtggcatgc 720
gtggtctccc acccgccttg cacccgtctc cgcggcgatg ggtactgccg acatgacact 780
cgctccaggg tgggactccc gtacaacggc gacccatata cggctcccca ggcgccgtga 840
tgtacgcggt acgctccaga gggaacacgg acgccgcacc accgctgacc cgatcgctgc 900
ggagggagca attaggtcgc gggggcctgc actgcccgca actccgcgcc agtacatcgt 960
gtgcgcgaag agc 973
<210> 131
<211> 967
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 131
gctcttccta tactgttgaa taggtggatc atagtctaat atcaaactag gaatatctta 60
cgactatcga taggctgggg aggccgggaa accgtactat tcggaggctg atgaattgcc 120
tatagttctg tccattggct gtctgctgct tcgcttggcc cttcgtcgtc ggcatctcgg 180
agctgtccga cgtcacggtt ctcgtcgcac acatgtgctg tccctactcc agggtagccg 240
attatacgtt cctgttgagg aagggacgag agacggaggc cgtagcttgg gaccataatg 300
ttagagaagt cctggcggga acagttgcga gcaggcttcg caggtcgtta agtacactca 360
tctacaacgt agcgggacgg cgggtgctcc gtcttaatac atccccctaa tgtggagtat 420
cgaagtacta ttcacatatt tgacggttct tattggtatt catttgttcg ctccattatg 480
atataaactg gcaatattaa taattcagta cgtgttatgt ctttggcctc gacggtaccg 540
gctccgtcac catgtcccca caccgtccgc ccgtggtagc gccccagcac gcaaaagtgc 600
tgtggcgtag ggagttggtc gctttccgat catttgtgga caacctggta gccctaaccc 660
cttctatata atggacttaa aaatcctccc gagcctcctt cacctatggg agcgaggggc 720
aagtccttgt gatttgccgc tgaattggcg cacctcgatg cagtattttt tgcagcattc 780
atatataatt attaaatgta agtcgttcac atattccgta tcagatctca ctaacaagag 840
atttgagtat gataatatta gttgacaatt tcagtataac ctgtgctgat ctgctctcca 900
aagttaatac aatgtaagat ttggattact aaaggtttta tattgaaagc ctttccattt 960
gaagagc 967
<210> 132
<211> 983
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 132
gctcttccta tactgttgaa taggtggatc atagtctaat atcaaactag gaatatctta 60
cgactatcga taggctgggg aggccgggaa accgtactat tcggaggctg atgaattgcc 120
tatagttctg tccattggct gtctgctgct tcgcttggcc cttcgtcgtc ggcatctcgg 180
agctgtccga cgtcacggtt ctcgtcgtac acatgtgctg tccctactcc agggtagccg 240
attatacgtt cctgttgagg aagggacgag agacggaggc cgtagcttgg gaccataatg 300
ttagagaagt cctggcggga acagttgcga gcaggcttcg taggtcgtta agtacactca 360
tctacaacgt agcgggacgg cgggtgctcc gtcttaatac atccccctaa tgtggagtat 420
cgaagtacta ttcacatatt tgacggttct tattggtatt catttgttcg ctccattatg 480
atataagttt tcttatatat tgtaatcttt gagaactggc aatattaata attcagtacg 540
tgttatgtct ttggcctcga cggtaccggc tccgtcacca tgtccccaca ccatccgccc 600
gtggtagcgc cccagcacgc aaaagtgctg tggcgtaggg agttggtctt tgtggacaac 660
ctggtagccc taaccccttc tatataatgg acttaaaaat cctcccgagc ctccttcacc 720
tatgggagcg aggggcaagt ccttgtgatt tgccgctgaa ttggcggacc tcgatacagt 780
attttttgca gcattcatat ataattatta aatgtaagtc gttcacatat tccgtatcag 840
atctcactaa caagagattt gagtatgata atattagttg acaatttcag tataacctgt 900
gctgatctgc tctccaaagt taatacaatg taagatttgg attactaaag gttttatatt 960
gaaagccttt ccatttgaag agc 983
<210> 133
<211> 1016
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 133
gctcttcatc cgcattaatt ctaataatag taaacgcgaa taaatcaact tacctgggga 60
ctcgatcgac ttagaatgcg gaaaatggtc atcctcaaga tcaatgctcg ccagggagga 120
aagcaaattg gcggggactt aaggctaaca ctacggtcca gatggatcga ggcggaggta 180
aacgttgctt gtagctgatg atcgagaact tatttgccga gaggcttgaa aaatggctgc 240
atgggtgcag cccagacttt ttcttcgttc cgacgtcacc gaccgcgatt accacaatac 300
tgacgtagcg ggcctactct cctggtttaa actgacaatt taggagggtg gtatacaaaa 360
gtgtatcaac attacttacg ataattacca tactattgtg gtattgtaca tagagcaata 420
gtttgtcaca cgactcattt aattattaca aatataacgt atctttaatt atagattgtt 480
ttaaattcga acgctatctt atctctatat aaaaaatctg aatttttttt ccattcatcc 540
acagcaccat ctaatttata tcagtatatg ggattgcaat aaaatattcc tataaaaaca 600
aaagaacaaa tcaatcccaa gaaaacgaat tcctggatat acttcttgga tcccttctgt 660
atcctatcga gttacctctt ctaccctaac gagacaatac taccacctta gccacccagc 720
tgtcaaaggg agcgcgctcc aggatggtga cctgtcacat tccttcagcc cggcgaatct 780
cgggccaagc tcgtccccgt tgcaggcctc ttgttctttc gctcccacat ccgagcgagt 840
aaagctgcca accgaagtta cacaagttat acatcacccg gcctttaggg tttattatca 900
catctagagc aagtgaccag atatttaggt gttaagattt ttctggcagt caggcagtaa 960
agggccgcgg aacccaaaaa gtccttaatt aaatagggtg gcatgtgagg aagagc 1016
<210> 134
<211> 994
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 134
gctcttcatc cgcattaatt ctaataatag taaacgcgaa taaatcaact tacctgggga 60
ctcgatcgac ttagaatgcg gaaaatggtc atcctcaaga tcaatgctcg ccagggagga 120
aagcaaattg gcggggactt aaggctaaca ctacggtcca gatggatcga ggcggaggta 180
aacgttgctt gtagctgatg atcgagaata tttgccgaga ggcttgaaaa atggctgcat 240
gggtgcagcc cagacttttt cttcgttccg acgtcaccga ccgcgattac cacaatactg 300
acgtagcggg cctactctcc tggtttaaac tgacaattta ggagggtggt atacaaaagt 360
gtatcaacat tacttacgat aattaccata ctattgtggt attgtacata gagcaatagt 420
ttgtcagacg actcatttaa ttattacaaa tataacgtat ctttaattat agattgtttt 480
aaattcgaac gctatcttat ctctatataa aaaatctgaa ttttttttcc attcatccac 540
agcaccatct aatttatatc agtatatggg attgcgataa aatattccta taaaaacaaa 600
agaacaaatc aatcccaaga aaacgaattc ctggatatac ttcttggatc ccttctgtat 660
cctatcgagt tacctcttct accctaacga gccacccagc tatcaaaggg agcgcgctcc 720
aggatggtga cctgtcacat tccttcagcc cggcgaatct cgggccaagc tcgtccccgt 780
tgcaggcctt gttctttcgc tcccacatcc gagcgagtaa agctgccaac cgaagttaca 840
caagttatac atcacccggc ctttagggtt tattatcaca tctagagcaa gtgaccagat 900
atttaggtgt taagattttt ctggcagtca ggcagtaaag ggccgcggaa cccaaaaagt 960
ccttaattaa atagggtggc atgtgaggaa gagc 994
<210> 135
<211> 2939
<212> DNA
<213> Artificial Sequence
<220>
<223> RNA standard
<400> 135
gatttaggtg acactataga agccagcacc gggaccacgc actgtccacc cgcgcagcac 60
gaaggcgcgc ggcagaacgc agccccctca ggcgcttgcc cccgcgctaa ggacccacgc 120
acattgtaga tgaggccctg agacagctaa tccttgacgc acgaggtcac gggcctcatt 180
ctcaccggaa gaagagacgc accccgggct tgttggtcgt ccaagagagg ccccgaacgc 240
agtgggacag cctccaacaa tcgggcaccc gtcctgacgc accccgcccc accggagcgg 300
gtgcaccctg accgttacgc accccatccg cagctctcca ccctagaggc gaggtgacgc 360
atgccatcac gacccatgct cctacaaagc cggtgcacgc agccacctca gtcatcggag 420
cgccgccgac aggcggacgc aggctcacct gggcgcagga ctggccagac aaccagacgc 480
agatggcttg ctaggctcgg cccggagcaa gcgataacgc atctcaggcc cagagactct 540
ggaaagactg ctggttacgc aatgcaggcc gatggtgggg atgaggcctc tgggctacgc 600
aggaggcgga gactgaagtt tgaacctgaa gccctaacgc atcctgctga gatagagacc 660
cctcaagggc actcgcacgc agtgagactc ttcgctagtg ggcgaacagg cccgtcacgc 720
acccctcaag gctcagcttg agtgactcaa ttgacaacgc acaatcaggt gcttgctcag 780
atgagattcc cagaacacgc actcaccaga gcccttgctt gcaggaagtc tcgtccacgc 840
agggcacatt gagcctgcca tgtggtccgt gcaaagacgc acagccgcag ggctagcgct 900
gaaaattgtg gaggggacgc atgacagatg agatcagact ggcaacccaa agaaacacgc 960
acagcgacac ctcctgagaa agaaagatgg aaaccaacgc acctcgcgag tgtgtgatgg 1020
cctggctctg gagaacacgc acagctgctc cacctgcgac agcgggctgc cagaagacgc 1080
acacatctct gtgactgacc cttgtcagac cactccacgc atgttgcaga cccagatcca 1140
tcgccctggg agccagacgc agcccgacat tggcatgcac aaggaagcag cgctgtacgc 1200
attctccgag gaagaacttt tgcaccgtgc cacagcacgc agggaagagc tgctctccag 1260
gcaaggtgcc agcggtacgc aactctgcgc tgcgagcacc ctccaagggc ccctcgacgc 1320
agcagggtga gagagagatc tctagaacac cagaaaacgc acctgtgaca ttcttccaat 1380
cccttcagca gcatgaacgc agccactaat gcaagagaag catgtgaatg gtgcacacgc 1440
accaggggtg ccggatccaa tctctgagga tgccggacgc atgctgcagg caagtcagaa 1500
gctaatgaga cggcgcacgc atggctcaga gaaagagggc cacttacaat gcacgaacgc 1560
aggctgggtc caagaaccgt gctctcaggg ggcagcacgc agatatgaga actcaaggtc 1620
agtcggagac tagacaacgc aagtgaggtt ctgcgccgac ccatgagtgc ttctgtacgc 1680
actggagaac aaaactctga ccgagcagtc acaaacacgc atgctgccat tgatctgcca 1740
tccagcgaca agttttacgc agtctctgag tgactctcga ggcatcctga gggaggacgc 1800
atggacgtgc atttatcagg tctgtctgcc atttcaacgc aaagacgtct tgaaaattcg 1860
aaaggggcag gtttaaacgc acatgactag caaggctgtg agctaaccga cctgccacgc 1920
agagttcttg acgtcgctgg gactaaccaa tgggcgacgc atgagggagg ttatagggat 1980
gaggtgatat ctcccaacgc aggagaagaa tgaaccagca agctcccgaa acaccaacgc 2040
accacaccac tttgaggagc tgaggagacg ccggggacgc atagcagccc agcacgagag 2100
catggcaacc gggcagacgc agcatgcctg accggactga tgggagccag caagttacgc 2160
acctcatttc cttctcgcag gaggaaaggg aacaggacgc acgttctgtc actggtgtca 2220
gcaatcaaga cgtatcacgc aaggagcaag aaaaggacgc ctcagtcagc aggaagacgc 2280
aggagagaag tgcatgatgg acgcccgggg catgcgacgc aggaggcgtg tgtgagacct 2340
ctgcagccac agcttgacgc agcaggcgtc caagcgtgga taggacctgt gccaacacgc 2400
aggatgtact tcgcccgaac ccatcgctga ttgcatacgc actggtccaa gacctgctcc 2460
gaggaacacc taggcgacgc atgtccagtc aaagctgccg accgagtgac tgcagaacgc 2520
acggtcgcgc actgcctcca agaagacttg cccggcacgc aggcaaccgg agtggcttgc 2580
tcaaccttct tgcttgacgc aagccccaga gttgacctgt ccatcaaatt ccctggacgc 2640
acctcagggc ccatcctcaa agtggatgca ggccccacgc aaaagcggca ccactccgcc 2700
cacttgagag ttctgaacgc atgcagaagc catctctggc cagccgttgc tagaccacgc 2760
atcagccctg gcccatgacg taacgtccac tcacagacgc acagcagagg cagtccctca 2820
gggtgaatca gtgcatacgc agagcctgac actatctctg gataccagtg cctcccacgc 2880
agtcttcccg ttcccccaag tgcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaagaattc 2939
<210> 136
<211> 2201
<212> DNA
<213> Artificial Sequence
<220>
<223> RNA standard
<400> 136
gatttaggtg acactataga agctcaatgc atggaaacgc aattgctaga cgagaaatca 60
aaatcaccat tgatgaacgc acacctagaa tatctctggg ttagctttag accaaaacgc 120
agggattact ccctttgctt agagaatttt tggttcacgc agctgtgagc tcctcagcca 180
aaaagtgcca cgaactacgc atgcattgtg atctccgttt gccccacacc ttatctacgc 240
acaaatatat catttttaag tggggatttg atctctacgc aaaatgctgt gaactttggt 300
caattgcttg gttgaaacgc atggaaatga gaggaacaat cctatttttc cagcctacgc 360
accgtggtgc tgagacaaga aagttctcct cagtcgacgc actttctgcg atgacaaaac 420
ccatgttaac cctgagacgc aggtttgatg gaacctgact caagcctaaa agcattacgc 480
acagccggtc tgctggcacc tactggccat ctgctcacgc aactccatga gctcagacac 540
gggtgcagga agttgtacgc aaggaagggg accaatgccc accaggggca agaggtacgc 600
acatgccctg gagtgcgctg accatctgca tggtgaacgc aatgaagtga ggcctgtatc 660
aggtctgagt tgggtgacgc aagaaggcca agcaggggtg tcacgctcta aagtagacgc 720
accaaaaacc gtcctggctc aataaaaggc ttgtccacgc agctataagc ctcagaccat 780
aaacatgaat ggcactacgc acaaacagca taccacgcca gtcgccgaca cacggtacgc 840
agctgaaccc tgacgtacca ccattcccgc tatgaaacgc atatccacgg acatgcaaaa 900
cagaacgaat gggtcaacgc aagaccagtt gccagggggg gtggggcatc tgggggacgc 960
agtgtgtgtc aaggagccga gctcgctcct tccgtgacgc agtcctaacc gggaggggca 1020
gccgtccgag agccatacgc aactgacaaa atgggcgagc gactctcttg tgaggaacgc 1080
atgagacctg aagagaatga ctgggaaaca ctgccaacgc agggccaatc ctgtcaacat 1140
gagtgtccaa gcagctacgc acccctgggt gctgggtagc cgtcagaaga taccccacgc 1200
agggactctt cagagctctg tgtgtccccc tatcagacgc aggcacaaag acatcgcaca 1260
tgaggacgtt tcactaacgc agagaactct gtaccaaagt ggtgggcacg aagccaacgc 1320
acgctgtcca ccgaaagacg actcaagtac agtgcaacgc acaaccctca tgagcattgg 1380
aggacgaaac tggtttacgc aaggctgtag caggaaaatt tgacctccac accgtgacgc 1440
agccaggtga ttgcctgccc taaggggccc aggtcgacgc acccagaaga gctccagcta 1500
gctgatcagt ggacctacgc agcggggact ttagggatgc tacataatta tgctaaacgc 1560
aagcgacgtc agactgttat tgccgtaagc ccagacacgc agagcactct gcttgaatct 1620
tggatgctgc tgagatacgc accattatga agtggagtga aaggggcatg gcagtgacgc 1680
aagctcgaaa tgtaaatgag tgacaagatc tggcacacgc attgtccttg ctgatccccc 1740
tccagatttt cacaaaacgc accagagatg gccctgaagt tcccgtcact ggcaggacgc 1800
acagactggg ggagggcaac ccacagccga cctaccacgc aagagcaggc tgactgagag 1860
agctgcgctg agaggaacgc aaactggaag tccagccgaa acccagcaag agtgtgacgc 1920
actgagcacg agaagctccc gcgcccaccc ttgtgtacgc atgaggaatc cttgcctccc 1980
agaaggcctc caagaaacgc atcgccttgg ggtccgaagg gaagagcgcc gaggggacgc 2040
accaacatcc attggagacc tgtgaggtga tccaagacgc aagcaaactt gggggcagaa 2100
gcagcccagt tgggaaacgc agtcgtttct ccacacccag gaagaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaagaatt c 2201
<210> 137
<211> 3705
<212> DNA
<213> Artificial Sequence
<220>
<223> RNA standard
<400> 137
gatttaggtg acactataga agccagcacc gggaccacgc actgtccacc cgcgcagcac 60
gaaggcgcgc ggcagaacgc agccccctca ggcgcttgcc cccgcgctaa ggacccacgc 120
acattgtaga tgaggccctg agacagctaa tccttgacgc acgaggtcac gggcctcatt 180
ctcaccggaa gaagagacgc accccgggct tgttggtcgt ccaagagagg ccccgaacgc 240
agtgggacag cctccaacaa tcgggcaccc gtcctgacgc accccgcccc accggagcgg 300
gtgcaccctg accgttacgc accccatccg cagctctcca ccctagaggc gaggtgacgc 360
atgccatcac gacccatgct cctacaaagc cggtgcacgc agccacctca gtcatcggag 420
cgccgccgac aggcggacgc aggctcacct gggcgcagga ctggccagac aaccagacgc 480
agatggcttg ctaggctcgg cccggagcaa gcgataacgc atctcaggcc cagagactct 540
ggaaagactg ctggttacgc aatgcaggcc gatggtgggg atgaggcctc tgggctacgc 600
aggaggcgga gactgaagtt tgaacctgaa gccctaacgc atcctgctga gatagagacc 660
cctcaagggc actcgcacgc agtgagactc ttcgctagtg ggcgaacagg cccgtcacgc 720
acccctcaag gctcagcttg agtgactcaa ttgacaacgc acaatcaggt gcttgctcag 780
atgagattcc cagaacacgc actcaccaga gcccttgctt gcaggaagtc tcgtccacgc 840
agggcacatt gagcctgcca tgtggtccgt gcaaagacgc acagccgcag ggctagcgct 900
gaaaattgtg gaggggacgc atgacagatg agatcagact ggcaacccaa agaaacacgc 960
acagcgacac ctcctgagaa agaaagatgg aaaccaacgc acctcgcgag tgtgtgatgg 1020
cctggctctg gagaacacgc acagctgctc cacctgcgac agcgggctgc cagaagacgc 1080
acacatctct gtgactgacc cttgtcagac cactccacgc atgttgcaga cccagatcca 1140
tcgccctggg agccagacgc agcccgacat tggcatgcac aaggaagcag cgctgtacgc 1200
attctccgag gaagaacttt tgcaccgtgc cacagcacgc agggaagagc tgctctccag 1260
gcaaggtgcc agcggtacgc aactctgcgc tgcgagcacc ctccaagggc ccctcgacgc 1320
agcagggtga gagagagatc tctagaacac cagaaaacgc acctgtgaca ttcttccaat 1380
cccttcagca gcatgaacgc agccactaat gcaagagaag catgtgaatg gtgcacacgc 1440
accaggggtg ccggatccaa tctctgagga tgccggacgc atgctgcagg caagtcagaa 1500
gctaatgaga cggcgcacgc atggctcaga gaaagagggc cacttacaat gcacgaacgc 1560
aggctgggtc caagaaccgt gctctcaggg ggcagcacgc agatatgaga actcaaggtc 1620
agtcggagac tagacaacgc aagtgaggtt ctgcgccgac ccatgagtgc ttctgtacgc 1680
actggagaac aaaactctga ccgagcagtc acaaacacgc atgctgccat tgatctgcca 1740
tccagcgaca agttttacgc agtctctgag tgactctcga ggcatcctga gggaggacgc 1800
atggacgtgc atttatcagg tctgtctgcc atttcaacgc aaagacgtct tgaaaggaac 1860
aatcctattt ttccagccta cgcaccgtgg tgctgagaca agaaagttct cctcagtcga 1920
cgcactttct gcgatgacaa aacccatgtt aaccctgaga cgcaggtttg atggaacctg 1980
actcaagcct aaaagcatta cgcacagccg gtctgctggc acctactggc catctgctca 2040
cgcaactcca tgagctcaga cacgggtgca ggaagttgta cgcaaggaag gggaccaatg 2100
cccaccaggg gcaagaggta cgcacatgcc ctggagtgcg ctgaccatct gcatggtgaa 2160
cgcaatgaag tgaggcctgt atcaggtctg agttgggtga cgcaagaagg ccaagcaggg 2220
gtgtcacgct ctaaagtaga cgcaccaaaa accgtcctgg ctcaataaaa ggcttgtcca 2280
cgcagctata agcctcagac cataaacatg aatggcacta cgcacaaaca gcataccacg 2340
ccagtcgccg acacacggta cgcagctgaa ccctgacgta ccaccattcc cgctatgaaa 2400
cgcatatcca cggacatgca aaacagaacg aatgggtcaa cgcaagacca gttgccaggg 2460
ggggtggggc atctggggga cgcagtgtgt gtcaaggagc cgagctcgct ccttccgtga 2520
cgcagtccta accgggaggg gcagccgtcc gagagccata cgcaactgac aaaatgggcg 2580
agcgactctc ttgtgaggaa cgcatgagac ctgaagagaa tgactgggaa acactgccaa 2640
cgcagggcca atcctgtcaa catgagtgtc caagcagcta cgcacccctg ggtgctgggt 2700
agccgtcaga agatacccca cgcagggact cttcagagct ctgtgtgtcc ccctatcaga 2760
cgcaggcaca aagacatcgc acatgaggac gtttcactaa cgcagagaac tctgtaccaa 2820
agtggtgggc acgaagccaa cgcacgctgt ccaccgaaag acgactcaag tacagtgcaa 2880
cgcacaaccc tcatgagcat tggaggacga aactggttta cgcaaggctg tagcaggaaa 2940
atttgacctc cacaccgtga cgcagccagg tgattgcctg ccctaagggg cccaggtcga 3000
cgcacccaga agagctccag ctagctgatc agtggaccta cgcagcgggg actttaggga 3060
tgctacataa ttatgctaaa cgcaagcgac gtcagactgt tattgccgta agcccagaca 3120
cgcagagcac tctgcttgaa tcttggatgc tgctgagata cgcaccatta tgaagtggag 3180
tgaaaggggc atggcagtga cgcaagctcg aaatgtaaat gagtgacaag atctggcaca 3240
cgcattgtcc ttgctgatcc ccctccagat tttcacaaaa cgcaccagag atggccctga 3300
agttcccgtc actggcagga cgcacagact gggggagggc aacccacagc cgacctacca 3360
cgcaagagca ggctgactga gagagctgcg ctgagaggaa cgcaaactgg aagtccagcc 3420
gaaacccagc aagagtgtga cgcactgagc acgagaagct cccgcgccca cccttgtgta 3480
cgcatgagga atccttgcct cccagaaggc ctccaagaaa cgcatcgcct tggggtccga 3540
agggaagagc gccgagggga cgcaccaaca tccattggag acctgtgagg tgatccaaga 3600
cgcaagcaaa cttgggggca gaagcagccc agttgggaaa cgcagtcgtt tctccacacc 3660
caggaagaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaag aattc 3705
<210> 138
<211> 917
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 138
gctcttccag tcaatactca ccccaatatc acttcagagg tctccctaac tggttaacgg 60
gaaggggcgc taaacagaag cctaatgaga tcggagagcg gagggtcggc ccaacgtcgc 120
actcagcgct ctctcctgcc tccacgacct accagctaat gtgcgtccgc atccgtagtt 180
cgccccatca ttatccgctg acccactcag tgggtttcta ttactagtac agattcaggg 240
gcccgacggg cggcgcttgt gggggggaca tccaaaccta cgaccggatg actgctgtca 300
gacagttggc aaattatgtc gctaatgcga cagagggtgg tgtgaaaaag cgaagggaat 360
accacttccc agcatggcag taaaggcacc taaagaaaca gaggagtgca aagcgaaaaa 420
atcaaccgat cgcgctaaac ccccgtaccg catgagagat gaatatgaac ctgatctttt 480
gctcaattcg aagcccatca tggcagcaaa atctagttac aacgaactcg catacaatat 540
ccacattaaa caatcacgct gaaagtctac caatcgttcg gtgaaagttc aatatcgcct 600
agctacagtg aaatcttgac gtattccata tacatttctt gcgtcttagg tatgaagtac 660
tagttaatca gtaatgggta atgagaaaga gaaattgaac catccttctt tcagactaag 720
tagatatgac aggtggttaa ataagttgac gcacggatat gaattcgcgg atcggaataa 780
tccgaccagt tacacttcac ccttacttct cagggtacga ttgatatcag gaattctaaa 840
tttatatgtc acctaatgat ctttcttgac tagtatgtta agatggagtc atgtggtatg 900
ggatgagtga gaagagc 917
<210> 139
<211> 918
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 139
gctcttccag tcaatactca ccccaatatc acttcagagg tctccctaac tggttaacgg 60
gaaggggcgc taaacagaag cctaatgaga tcggagagcg gagggtcggc ccaacgtcgc 120
actcagcgct ctctcctgcc tccacgacct accagctaat gtgcgtccgc atccgtagtt 180
cgccccatca ttatccgctg acccactcag tgggtttcta ttactagtac agattcaggg 240
gcccgacggg cggcgcttgt gggggggaca tccaaaccta cgaccggatg actgctgtca 300
gacagttggg caaattatgt cgctaatgcg acagagggtg gtgtgaaaaa gcgaagggaa 360
taccacttcc cagcatggca gtaaaggcac ctaaagaaac agaggagtgc aaagcgaaaa 420
aatcaaccga tcgcgctaaa cccccgtacc gcatgagaga tgaatatgaa cctgatcttt 480
tgctcaattc gaagcccatc atggcagcaa aatctagtta caacgaactc gcatacaata 540
tccacattaa acaatcacgc tgaaagtcta ccaatcgttc ggtgaaagtt caatatcgcc 600
tagctacaga gaaatcttga cgtattccat atacatttct tgcgtcttag gtatgaagta 660
ctagttaatc agtaatgggt aatgagaaag agaaattgaa ccatccttct ttcagactaa 720
gtagatatga caggtggtta aataagttga cgcacggata tgaattcgcg gatcggaata 780
atccgaccag ttacacttca cccttacttc tcagggtacg attgatatca ggaattctaa 840
atttatatgt cacctaatga tctttcttga ctagtatgtt aagatggagt catgtggtat 900
gggatgagtg agaagagc 918
<210> 140
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 140
gctcttcgca cagatgcctg tgtaagctat ttcattaaga tcttatataa atgtagcatt 60
atttctactt tagatacaag gttttcttta atttttatat tcctatcaaa cataatagta 120
gattcttttt tctacataat tttgaaataa cttttattca ttttcatata agtactacta 180
tttgaagtaa tttgtaattg gaaaaagtat tttcgtctat aataataaat ttcgtatata 240
gtaggactat taataaaatg gattacataa tactcaatca ttttaactgt taatatttat 300
catagtaata aacttgccat tgagaaattg aaagtcgtat aaaaagttta gtactggttc 360
cggaacaatt cacagtttaa agatataata ttacaaattt ttctactcgt ttaaacataa 420
gtgaataata attggatata gagtagcacc acattttagg acatatagtt tttactattg 480
aaagataaaa tatgtatctc aatatcttat tatttagtat tctttttatt acgtaatttg 540
gattctagac taagacaaat tagtaaaaga cagtaaattg ttattattaa atagaaaatt 600
cctgaaaagt ctatagttaa ctctttattt cgcaacagat accctatgaa atttataatt 660
ctaattatac taattattct acaagtttta aagtgaattc ttgaaaaagt atcacaatat 720
ataataaatg atttattaga gagatttatt tggttatgct tgatcctata ccttaagcta 780
caaacaaaga gcaatcgaca atattctagt atagtttata ataatcaaat tatcgaatga 840
ttattaaaaa cagatatcgt tactatctaa tagtaatttt taagctcctt atatccttag 900
tataaacttg ccgtaaaata aaatatttaa gattttctta tcagatataa tcttcactga 960
taataataaa ataacttatc atgacaatga ttgtcctggt gagaatggaa gagc 1014
<210> 141
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 141
gctcttcatg aacttatata ttatcatgta tattctcaca ccaatctaaa gtaataaaaa 60
acaaaatcaa atattacaat cagctaactt tgtgccttgg agctttgact gttacctaac 120
atttaatata atataaattc tgtctcaaat taaaagagac tacttgcaat gtatgaagta 180
taggaatata tgtttctgat gtcctataaa aatcataact taaatttact ttatatctta 240
ttagtataaa aagattacat ttagaataag aaaataaatt aattaatttg caaattttga 300
aatttattat cgctctaaac tactaaaaga tttgattttc atttaaagat aaagagttta 360
ttaggttttt tttttaatgt cgaaattaaa cttaagggtg tatttaatat caaaaaccat 420
cataagattc tataatttta ttcaatttaa ctattgttgt tatacttgta tgacgtatca 480
acgctaatag ttatttatta tactttaatg aatgaatagt acacacataa ctcgtattat 540
aatacattat atattaatct atatttgatc ctcaatgtta atcgactcta tgtcaaggta 600
attaacttta ataatggaca tatcaaatgt tcgtagggaa gatacttgac ataaaatact 660
cagtacgttt agaacttgca cccattattc ttataaatac caaaaaaact gctgccaaaa 720
taattcttca taaatatagt ttccattgtc tgacaatcct gatgaattag cagaattctg 780
ttaaaataaa caacaatatc atatgttaga agttaatttt tatttacttt aatatatgct 840
cgtccctgaa cgacaattct taaaattatt tagttaggac actctcttaa tatttttcag 900
cgaatccgaa attaatttaa atttataggt gtttgcatga tttaaactaa aaatgcgcga 960
tatgcattta atagaccaac taccacatca attgatatta attagaggaa gagc 1014
<210> 142
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 142
gctcttcgct tcaaacatta ctctcgttga aacactgaga tcctttctgc accattattc 60
ccacaatata tgacatattt tgaggtacaa ttttatagtt aaatatataa ttttataacc 120
aatgagtttt aaaaattcat caataaatca ccttgtagat atagaataag atactatttt 180
ttttatatat taatcattat aatatttatc acagaggtag aaagtatatc tactcataaa 240
cttccttcta taggattaag gatatattat tgccgttaga atagacatac ttaataatag 300
aactacaaaa attttatgat gttgttttta tgcacttatg gtagttaatg attatcacta 360
aagaaatata aatagataac aaatcatata aagattgtaa atacattgtg aatcagccga 420
ttaaatataa accgcgacag taagaaaata ttttatggaa accgcgctaa atagtgtaac 480
cctcttagcg gaacctagat tctaaccatt atacttccag tgatttaata tttaataata 540
tttttacccg caaacccaaa attaattatc taaatttact gatgtaatgt tctaatgttg 600
acggttagtc atgtagacta tttaggtatg aatataacaa tatatatata ctgcaaagtt 660
ctagtttaga catataaagt ctgttttgaa tatgaatatt ttgaattcga agaaaatttc 720
ctctcaacat atacattatt aactatgtat acgtatgtgc gagtaacttc ttttataata 780
ttacaaatac aatgtatcct atatactcga gaatattgac gtatcttaaa actattttta 840
ttcataaagc tatgatcatc aattcaagtg caataagtaa cttttaaaat agtttttccg 900
gagaattatt tgtctaaata ttgttccaaa gcgaagtatg agtctaaatc ggggatgaaa 960
tagataataa ttgtattcat aagtttattt ttcaaataag agtatccgaa gagc 1014
<210> 143
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 143
gctcttcctg gagcgtcaga gcctccccag ctgtcccgag cccacactca cgcgccgccc 60
cccagtagag cgccctggcc tcaggacatc gacccgcgtt cgctccggtc agtaggaggg 120
gaccaccagc ccggtcgtgt tcggacagtc cgcctcgctc cccccgcgag agagctcatc 180
aaccctcctc gctcccccca gctccagtcc tcaaagacca tgaaccgtgc cggtgcggct 240
cagcgcggac cccagaggtc ctacccgcgc ggactaccgt gttagcgacc attgttgtcc 300
cgccccgacg agaccgccgt ccaccggcgg tggctgttgg ggtgcgtacg ccaaccccga 360
cgccttggcg accccaaccc ggctacccgg ttcggtcgta gcgaatctcg cgtgagaccg 420
gaggtagggc ttccaggctc ggggtggcgg gctcacccat ggcaatgtcg ccgccacatt 480
gagctgcagg ccggcgttga ccgtctgcct ccacgctgcg ccaatagaag gattgtcgcg 540
aggcccccga cgccgatgac gggggccggg tctgtatggc tcccctgaag aaggcgcctt 600
ctgccacgcc ccctccgtgt cggctcttgt ccccgcacca ctccgtgggc acggttcggg 660
ggatggggtt catcgacccc cggctgacga gcgagcaaac aaacgggagc ctacctaaca 720
ggcacccgcc tcgctggccc tccctcgtga agtgaacctc cattatgtcg ccccagtgcg 780
cacccccggc accacaagga agcccatcgg tcaccgggcc accctccgac ggagaccgcg 840
ctccctgggc tgtatagccg gggaaaatgc gccagactcg ggacggcgcc gatccccgcc 900
ggtctggcta cgagggaaga cggggttccg ccaaattgca gcaaaccata agggtgctgt 960
ggctgaaggg acagatgtcg acgcggacgg cccaccgggg aacccgggaa gagc 1014
<210> 144
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 144
gctcttccga gcccaagatc ctcctccagt ggtacgttga actcgcctgc ccctccttgg 60
gcgcaaccct ctagaacgcc gggcgtggcc acgcggcccc atccccccca gcggtaccac 120
ccggctggcc ccggtgcccg cccactatac gcgcgggcga gtacttggcg aaggttaagc 180
tgagtattcc gctgcggggc caagacggtc ggcgacgccg cactgtcccg gcgtaattca 240
cgcttgggtc ggcagtcgcg ctaacacgcg cttcccgtcc ggagccgacg gccggagcaa 300
cggtcggggg aggggcctat ggacgtcgac ctgccggggg tcctgatcgt acccgcaatc 360
ccgacgcgcg ccgcggcaag ttcatgcccc ggtagccggg ctccgtcgtt ccgtgtggcg 420
ttagggtcct cgccgaaggc gagttcccaa gggcactgcc gtgcgtgtag gactggggcc 480
ccgcgccccc ccgggcgaat ccctggggac tctccacggc ggggtcgact gtcaccccgt 540
cgcgcacccg tgtgggcttg agccgcccac cggacgtgcg gcgccgttct tatcagccgc 600
tagtggttgc ctccgcgggc tagcgcccaa cccgagccgg aacggccccg ccggccagcg 660
catcccctat ttcacgtgcc ccggagcagc aagcagaaag cttctgctcg ggccgcgcgc 720
cggtcaacct gggcggtggc gcagaaccta accaatgctt gcgccctcca agacgccaac 780
tgcgggttat tcgcccgtgc gagtcgcgcc cgttcggcgg gcggggcgcg cgcctcgtcg 840
cacgggcggc cggctgtgat tgctcccgtc ggcgtcccgc accctcgccg cccctcgctt 900
gtcccccttc gcgcactgcg tgattagtcc cccggcatgg ggttcccggc ccggcacggt 960
tataaactcc tcaacccctg tgtaggggat cgggtccgtg agaggctgaa gagc 1014
<210> 145
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 145
gctcttccac acgcctgggt aatggtccca gttccgtaca ggggtccacc gcttcagggt 60
acgggagtcc cagtacggct taacgtcgct ccacgtgcga cccaggcctc tccgcgagct 120
ccgcaccgcc cctgtttctg cgggcgtggc ccccttcttg tgccgacgat ctggccctaa 180
cttaggccgg ccccagccag gccctttacg ctccatgcgc atcgcgtgac gtccttccca 240
gtcagaccag cgaagcgggg gaagggcgta agccctgcag gtgcataccc tggcgggcga 300
tgtcgtcggg ggtcactggc gagaggggac ccgccgttcc cctaccgtct tcctcaacgg 360
ggcgggaacg gcctcccccg aggggggcgg ggctttggtc atctcgcgga cgccgccatg 420
gagtacggcc cggatgcaga agtccacagt gtatgcaatg tggtccgcga cggagtcccg 480
gccacgggta gcgctccatt ttcccgccaa cagcgtgctg cttgtgcggg cttctgggcc 540
gtaggggctt gagcggagcg cgtccagtag ccacgacctt ggtagggtcg gcgtcgatga 600
caagcccgga ctgccccaca cgccccggta cctgcagaag ggcgtgaccg cttagcgtaa 660
tgctccgacg tgacggtagc cgattggagg ggccctccga ccgtgtgcgg cctagcacgg 720
gaattccgcg tccggaggac aagactgcta gccgacagca gcgccgaggg aaggttgccg 780
cggacccgcg cccacttgtc tctcgagggg accggggcgg cgctcggctc ggacccagag 840
ggctctcacc actagaccct ccgcccagga tcgctgctgg gcctgtcgtg cgacacctca 900
ggctagggtg cggcccagat caaggaacgc cccggtgggc cgaagatccc agtgcgcgac 960
gcctcgtccc cccacgaggt cgttgcggcg aacttgatga ggccgcagaa gagc 1014
<210> 146
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 146
gctcttcacc gccaagcgaa cccgttcaca acggccaatt cggtgggagc cccgccggcc 60
tagcgccgtc gcgcaccgcg cgttgcgttg cgttgcagcc gtgcgggggg cagcacgtgc 120
ctccccccca tcgggtgcag gggaggccca ttccacgcgg gggccgaccc gctgccttcc 180
tgtccggcac ggcggtggcc gtcgaccgcg aacgtgccca cgctcctcgc taactcgggc 240
cttggctctc gatccgttcg tgcccccgga cttccgagcg cgctggcgat gctacaccat 300
ttccaccaag gcaccacgca ttgaggaagc ccagacaagg gcgatggcca tctgtgccgt 360
gttacgcacg gaacctcgcc cgatgctggc gccgcaaggc cagccctcga catgcgcgac 420
acccggggtc tgccccccga ggcccggcgc gagcgatggc agcgtctgcg agtatccccc 480
tgctgccagt gctggtgccc ccccgcggcg aagtgggggc gggcgatagg gcccttctgc 540
cgccacggga caccaagggc cgctcccccc ccccgggcat aaagcaccag ggactcgtcg 600
acgtcgatac atactgattc ggagtgtgga gcgctaaccc cggccccagg accacgcatc 660
tgtgccctgg tgggccactg tgcctggcac cccgcgggag cacggcaccg ggcaaacgcg 720
taacccccgc gcagctgcac gttaggagtc cggcgcctcc caccccggcg ccctatcctc 780
cagggtggga gtgcggcctc gggccccgct cctactcggg cgtcacgtgc gtgcgccaag 840
gacattcacc ccgctccgcg ccgagcccgt gcgcgccctc acgccctccc cggcagacga 900
gtgatccgtg cgtaccaaga cgacagcgtg tccgacagcc tcaggcccca acagcgcggg 960
agagccctgg cagcaggacg aagggccgga gctcgcagtc ctgaggggaa gagc 1014
<210> 147
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 147
gctcttcagc gggtccggct tttaggcctt cgcaggggct tgcgccccgg cgtgtgaccg 60
actggtcgcc tctgccacca cgaactcgca tcccgggtcc ttgggccggc ccattcgccc 120
aggccggcag ctccgcgggt accgtcaggc ggccggaggg gagagcgccc cgcccacccg 180
cgacggtaac gtcgcgcgcc cgtgcgaagc gtcacccgac ggggtcgagg gaacgccaag 240
tgtcccgccg ccgcctaagc agaggatctg ggtcccgccg cggcccgttt ccgtagtggg 300
ctcttagggc catccgcagc agacggacgg ccgaccgacc taagtccagc ctgctaaccc 360
cgggtagccg cgctggcggc aatgccgacg agccgggacg ccggacgctc aagcccgcac 420
gtcggatgac gcgcccaacg tgcgtcgcac ggccgcccct ggcgccgtcg gccgctcgag 480
cttgcatcag ggatgagacc gctcacgcca cgggcttcct taacggcggc ccgcacgtgc 540
gtacgccccg gaagggtgca cctatgggcg cgcccgggcc ccaagccgca gaaagtgtcc 600
gcttgccgtt atgaattgcg gcaaaaaggt ggcgccccgg gtagcaccga ggggggtggg 660
gcaacgctcc cctgccagcg caccgcgccg gtagcgcgac cgcgataacc gtaaaggaca 720
ccacgcgctt caagcggcac agggccgtag atctcccggt gaccgtgatt cgaggctctc 780
tggggcaaaa ctgtgcctgc cacctgcgcc ggccccgccc ccagccccct accaccggcg 840
acccgcgatc cggctgcctt tggcagcgct attgcagccg gccggcggcg acggaggccc 900
gggcccgtgg cacacacttg cggcccccgc gggctcgcgc cgccgttgag tgcgcttgct 960
ggggcccccg tcgacccagc gcgctcacag tatgcggact gactatagaa gagc 1014
<210> 148
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 148
gctcttcaac cggctcacga ggagacgctc gtccctcgag cgggggcgag ccggctcttg 60
cacgcccccg atctgccaaa cagacaccgc ggtgaatcgc gaaaccgctg ggaacgcgaa 120
ggccggcccc gcgtgaagca tccgccctgc gtcccaccct cacgtggcgg cgcgcacccc 180
tcgactgtgg ccggagtgga gggcccaccg acgcgtctgc ccgtggctag tgaccctcgc 240
gggggaagga aggcgcccca catggcctca tcgccccctc tgggcagtcc agcccccccg 300
cgccgccaga cgccgcagcg ccggcctgtt aagaccaacc acttcgtagt gccttccgca 360
caacgcggac ctctccgctg gtgacaccgg ccgaggcctg cagaggaggt gaccgcttcc 420
tgtacgccat gcccccccga atgcaggctg ggggccctca cgtggccccc cggcaccggt 480
ccctgcgtgt ctggcccgcg aagaagggtc gccctgctcg gcccgcaaac aaggacggca 540
acctggctgc gagtcgtacg caactaatca tgccgacggc cgccctccgc ccatgcagcg 600
cccccgccca gagctgactc acccggccgt cgccgtgtag atgcacccct caccctcttc 660
acacagttaa acccgccggg gccccgggcc acctatgttg atgacgccgc accggtcgcg 720
gggcgagcgt tgccctgaga ctcggaaacc cccggccccc acactgccag tacccccagc 780
cacgggggca ccagcgcgcc tttgtagtgc gcgccaccca ggggttccgg gaggtgaccc 840
agaccacccc gtcgcccccg gttgcgcgct cgccgccgcc gccagacgcc ggcagaggcc 900
cagcgctcgc cgccgccaac gccgcaaccg tcccggcgaa gaccccaccc cacacgacac 960
gccctctcct ggtgggccgc gggacaatgg ggagggtgcg ccgtcgcgaa gagc 1014
<210> 149
<211> 3232
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 149
gctcttcccc gcttaaacta taaatattat aaacactcgg cacgataagg tggtatctta 60
acacaactat ttggaatggg cgtaagacgg tataaagttt ccacaatttc gaatttgatc 120
taggttaagc aatatgtatg atttgatcgt cacaatgaca taatagagag attgatttag 180
tgactcggac aatagattat aaatgcgttg tgagattagt tagtattaat aactaatagc 240
tttcaatcaa gttgttaata atgtagatta ggagtggggc ccgcagagat aaactcaatt 300
gatagagtat tgaagcagaa tttatagata tcatgttatg tacgaattta attcgtttcg 360
cactcccaca tggcctgaat tagggtctcg cttgctgact tcgtagtaaa tatggctggt 420
aggagctatg ctaggttgcg attgatacaa gtaataaccg aatagtacgc ggacgaagca 480
tacagatgtg ataacccttg gcaccaaatg aaaatgtggg gataggcaaa gcacgcgtgg 540
ccgagactgt ctggtaaggg gctgatgttg atactactaa ggtacttata ctggggactg 600
agggacgaaa gattagaaag aacatatcgt caagactgac gcaatatcac taatagagct 660
aaactgaata ctgccctata aaacctgaaa attcaagaag gaagtagagc cagggagata 720
aagcctactc tattaggttt gaagcaaatg ttggattacg attgacagtc gacatgagtg 780
tccttactat tactcggtat ttgcgtataa ttgacccgaa agaagcctac aatcataggt 840
ttaacaatga agagtcggat gcggtgttaa aagaaaaaag agaatgctgt tctttggagt 900
taatagtaga cagataggat cagtcataac tgattgaaag gaatagaaac aagttattct 960
agcgaacgta aaacttttaa aaatatatca agctaactaa cagcaattta attgagcccg 1020
gaaacgttgg atttgatttc gtaattatgg tgactggtaa tgagtactag ccaccttaca 1080
actaactaaa taatagcagg ctccgcctga ctcgacttta gttcttatga ccttagtcct 1140
gttgtttaat gtgacaacta aattgaagta cgttttcaac acggtcccaa taaatcaaaa 1200
gccaaggggt actaagaatg aaacggttct aatcttatga cgtaggatcg taaatagagt 1260
agttcggact ttcaaggtca gagcgactgc ggtgtgagtg aatttttagc atataggggt 1320
tcattctttc tcgtgattga tgagcacaca acaggttatt ccatatcttt gtacaatgat 1380
ttagtctata cgcaaagaag gttgaggaat ttgagttaca tcagtctaca gaaacaattc 1440
gaggcaagag acgaaatgct tgattgactc accgcagcat aattatgtgc gacaactccg 1500
accttcaggt atgtaaggat cttggaccct atcagtccaa tcaaattcaa tggtgatgtt 1560
tgtacgcttc aagtgaaata tgccgcagtt gatggacgct tgctttttta gatttgatag 1620
ggggaagtaa gccgaatgta ataatattcg cacgatacaa tatagtgtaa tttagtactt 1680
tcgttttgag taggatataa agtaactatt acaataatct tcaaattcat tgggtagatt 1740
attctgttgg gcttctttct acaatagtat aagagtcaaa gattcgtagt ggtctaagat 1800
actatatttc ctgatgtcga cttgctatga ggacttcgaa cgcagacatg tacgaaaagg 1860
aacatatgcg gttgacgtac ttactggtaa atatacgatg ttgtgaatca agagtcaatg 1920
ctgtttaaag tagccctaag tatccgggac atagtcagca taaaggtctt aaatataaaa 1980
caaactggac atatatttca gaaggtcact cggatcatta ataattgaac aggcacttct 2040
agtttagatg taaaacgcgt agttaaggag ttatatatga acggcttcgc aactatgaag 2100
tagctgaagg tttaagatat taggccgcat tgtttcaaag cgaatgccaa ctgctattag 2160
tcgatgcatt aagtttatag acaagtttta ttgactggga agcgataaac gtttgctaaa 2220
aacaagtctg aggcgaaaac taagactaac gaatgttacg ctatatagat atcctccttt 2280
cggtaagttc atcggggttg agggaaaact taggtgggat aggagatgta agcagtcact 2340
agaagcaaaa aaagctacaa gtaaggtcgg agttttgaca gtacagcaca gtaagatcgc 2400
acaatccgaa aaccttgaac acatgtattg atctaaataa gaacgtaagg tgaagatttg 2460
tcagaatcat atctaaaact aactgagtaa ctgcacgcat aggcgtggtt tttgacttaa 2520
attcatgaag atttaaagaa ggcctaacag atacactcaa aacaaaatat tcccttttaa 2580
aacgtgtcac aaaaaaaatc tataatggat aaaacatact atactccact ctaatcactg 2640
tctgggttta gttaataaca ttacagttgc gaaagtccga gtgtgttctg gtagaaagag 2700
gggtaatctc gtatactgtt gttaggagac tgaacaaagc gacagtgtag gtatataagc 2760
taatggcgtt gccacaattc ttttttggct tggttttgga ttatccgcca gaacctcaat 2820
tagttctaat taaccgtcga cgatgtcatg attatgaaga gaatgaggtt gaacgctcag 2880
ctactatgtt aatcaggggt agcttccatt tgttagataa cctgaataaa atatataagt 2940
cgtatgatgg actgggcgag agacatagtt agtgagactc atagaagacg ttggagctgg 3000
gttgggtata aataaatgtt catgttaata actaatagcc catgagacgc gtccgggata 3060
ttgtacccta atgaccgagt taatgtgaac gacgacactg taccctagaa cttaattttg 3120
cagtcaagat cgagaatata agccgggaaa tagagactcg tttagctacg tacggtatct 3180
gaaggaggtt gataatcgcg gttatgaacg aatatcacaa acaaagaaga gc 3232
<210> 150
<211> 4653
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 150
gctcttcact tatggaatca aagcgcgagg taggtatgag cggggattgc cgttaataaa 60
cgaacaagct gccctaattg aaatttctca ggtatgcgca acgtcattgt gaaacttggg 120
ttgagggttc aaggtccgta ctcacggtaa aagcacaaac atgcaaggca ggcggataat 180
aacatttagc acgatcgttg tatcttcggc gtttggttgg aatcagccct gtctagtatg 240
cgacaacgag ctatcaaaga cgacaagtta gagtcggatc atcgtggaag agataacaag 300
cgaaaacgcc ctcggaccga tgcctgcctt ggcacaggag ggcaacatag actgaggagc 360
acaggtgtac gatcacccgg tgcctctcga ggagtgcgac gcgcaagaag gtgacgtcac 420
tgtcagaaag tcccggtcgc gtaacatggc aaaaagtact cccctgtagc tggcatgagt 480
catcgattgt tggcagagaa gtgcactagg caacattggg cgagtccccg ccgcagccat 540
cggacacgag gccgtcctac tgagcactat ggggccacag cttcggaagc actacgaggg 600
agcctataca tgtaagagcc gtaagcaata ggtgggcaca atcatgatag aatcgcatca 660
tcgaacaacg gcggttgaaa gggataaggg acattgttgg accttacagg gcggtccata 720
aggagagaag gtccatcgct tggccagtga tggtgcacga ctgagagcac atttctggcg 780
ccattcgcgg gcgtgacccc atagtacgtt cgcaaaaaga ggactcacca gaccacatcc 840
gaaaccaggg cttgcgtggg gggccgttga tactgtgttg cataaatcag gctgagagat 900
gatgaagtcc caaatcgtaa aaagcgggaa aaggggtatc ggagctaaga cagctaacca 960
ctatggcgat atctacagct cctgagtacc ggcaaatagg agagatgctt aaggtcaccg 1020
cttagaggaa agatacacca cccaaagaca tgtctggcta ataacccagt ggaaaggagt 1080
tactacccca tccgaggagt gtgtatcgac tatttctctt tgtactaact agctcttttc 1140
ttggacttaa tgggcacttt aacagcgagc ttcacaatag tgattaatga tacgaaaaga 1200
tagcaacgac gatccatgtc cccaatacga cctttacgat ctgtactggg tccggtacgg 1260
ccggattcgg tcctgggctg ggccagacat gacccagggg gaaaccaaag aactgtaagg 1320
cgcaccaatg ccaatacagc ggaccaaacc agcgaggtgg ccgcaacaaa agcaggggag 1380
gtcccgaggc tgaacaaagc gcattttagt ttaggcctaa gccgggcagg gcgcaccgtg 1440
cgtgcaggaa aaatagtgcc gccaggcttg ttgcgtggtt aaaaacgtaa gttcagaaag 1500
gggaactatc tgtatgggag gcgagtcgcc gtggaagcgt ttatggcgaa ccttgaatga 1560
agaagttgtt acttttcatc gagcattcgg atcatgttgg tatgcaaact cgttttcgac 1620
acgttatttc aaactaaata ataccggtcg ctgacatagt aaatacatcc aagagtcacg 1680
gagagtctct acaggcgaca aattcacttg cctccaaaac gcggactata ccctcgtggg 1740
tcgcatacgg aactttgact caatggaatc ggatttggtc aagaccacgg attggccgtc 1800
catagagacc tctgttcttg caaaatttag tagattcaag acaaatgggc ttgccctcgg 1860
cgtaatctac gcttatcaaa cttgacgagt gatacggttt gaaacaaaca ttagcaatga 1920
tcccacgact tgtcggatac cggggggcgg tgaggacgat accgagtttt tgtttgatgc 1980
gattgcaaat gttgacaatc gtaattaaca aggacctggg ggaggaatta tgccatagat 2040
taaagggtga cgtacaaggt ggctttacgt tgcaccgtga tgggccgcac gaacgatcag 2100
gtaaccgcca cctttcttcc cccagtttga ttgcatcgtc ctatatgcac cgttgcgcta 2160
gacattaagc atctccgtcg gaatacccat ccgagaacag tgtcaagtgc tcgtatgtac 2220
taaagacgcg ccccccgtct ataaaaggct tgttcgttgg acgttatcac ttaaacgcac 2280
gagtgctgcc agctgacaat tcggcccttc aaaccctgat gcggtactat ccttttatga 2340
tccagtaaac catttccaga ctctcagcga gtggtagcag actttctgca caccttgtct 2400
caagacacat ctgcgagcta ggtcaggtga cacgctctgg agatttgcgc aactacagcc 2460
gttttcaact atgactttcc gtaacgttgt gaaaaacgaa aactagcccc aggagtcagg 2520
cgtccaaggc ttaccttatg gtaaagccac atcgtttccg ctcctgaaaa gcggtgccgc 2580
gtaccctggc cacgagtaac gtgctgtacc cagggcagtt attacacgtg agccgttcga 2640
ctggcccacc gccgtcgccg tacgtatccc gttttgcgtg gacccaatga cccgagcgac 2700
gatgctcgta tcacctaatc tgtcaatacg cggttagtcg tgcagaacta cctcggtgac 2760
atactcacgg atgtgcattg agccatcgat accactatat cacaaggcga agtaatcttc 2820
caagaataga ctgcgacggt tcctacgaag ccttatgcat cagcaaggct tcagtgccgt 2880
agtcgactgc gaacctaaga ggtggcttat ggtcgccaca gacagggccc gtactcgcgg 2940
gccgggagac tatcgaccca agagttattg catcaaatag cgggtcgtcc ctggggtgct 3000
acaatcgatg acatcacggt tagacggaca ccttgattct taactattac ttatgggcca 3060
gccctatttt ggggttacac actggtaagg cttgttcgta tgtggacagc acaacgtaag 3120
gggaaagtgc cgtccacgcg accggtctag cgcgcatata tcgttatgtc tatcgcatca 3180
ctagcaaacc tgtttgtcgg ggctcctgct ttgggctcct cgtgctagtg cgcggtatca 3240
aatttagatt ttaatgtagt cttagctacc gccctcatgt gcggttgagt ggcctacctg 3300
ctgtcggacg tattgtcaat ttgctggggt gagataactg ctggcagaga tttgcatact 3360
cgacccctta agttattcgt gcgcgcggcg gacagcatag tccttacaga aggagtgtcg 3420
atggctgcaa gttctaagtt ctttgttttc accttccagt taatatatag taaagggagg 3480
caaccccgtc gttcctcagc gaagggtatg ccgagtaggc ttcgcatgtg gaaggtaaca 3540
atattaataa cgacaaacca cgtccttggc ctctcgcggg caacccgggt ctcaggtttg 3600
gtcactgcca ccacgtaatt tacgctgggc gtgacgagac ttagactgtt attacatccg 3660
cgtatgatag agctacagcc tgccgagcga cctggaaaat ttatgtgcaa atggtatgtc 3720
cgaaacttgc tcgcagcgag ttgttatcgc gtcctaattc ggacgaaccg aggttacagc 3780
gcaataaggg ggtcctagca ggtgtaggcg ggaacccccc tggatacctt cggggcagaa 3840
tgccagtgtg ctaaagcaag tgaggcacca agtagaagta gcagtgatct gaagcgcatc 3900
cttcatacaa caggatttat taaccggtac ggtaaaatta atcattcagc tgggccgtat 3960
tttggacgta gcgttgatgt aatctcgtga gacctgcgag ggtattgtct gtacaaaaac 4020
cggaaaccac taggtggagc tttggtgccg tctaaccaat gcagctggca agcgcagtcc 4080
tagcagaagc ggtttacgag agcattgtta cgtgacccgg ctaatgacgt acaggtcaga 4140
cggtggccca gcagccagat ggagtgctgc gcccgtgtga gtggacggta ctaggggcgg 4200
aatgataacc cccttttttc gataggtgtc gtcgtcactg gagaaagcga gccgtaatcc 4260
gtgtgcagcg tcacgcaacg ctcgctgctc ctcccgacag tttaccgttc cccttgatta 4320
tggtctgtga ctccttgctg gtatggagac ggactcccgt gcacgatgtt ctacaggccg 4380
caatcgctgc ccggcgcgct ttcctacacc tccccgtact cttctcgcgc gcacctgggc 4440
gtgcacagaa gaaagcaccc ggtacagcct catccgagtg ctaaatagtc ctagtggggc 4500
tgtggcgtcg cagcgcgcca tctggttaat gggcgggaag gaagagttat tcccttgttt 4560
gaacaaaacg tcaccgtaag aacctaatta caatatactt tctcttaatc atatagtact 4620
gcttcctaaa gtgtaactag atagtcgaag agc 4653
<210> 151
<211> 1838
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 151
gctcttcgat gcaagtatta aaaggaagac ttacgtaagt gtgcttatgt tctaggacga 60
tgaaccgtcg ttcgccgctt attggcagtt atacactgga ggcagagagt cgaaagaagg 120
gtcagggatg gtgggtaaca taacaaagag ggatttcaat acaccagcag ggcgttacca 180
atgtaattcc accttgccgt acaactgcta gattcttgtt tagttaatcc tgcgtgcccg 240
cggagtgaga atgactgggg ttgggtcccc gcttcattcc gggtggagtg ctgttaggaa 300
taggtaatat gagaacgtgt gaaatttata gccggaagag acagaacttt gtaaacgggg 360
acgatattac caaatatagc acaaggataa cccaagaata cagttagctt acggcacgaa 420
aagaagactc aaaatagaac tgaaggtggg gtagcatcgt tcgcagggat gtcaatgttc 480
tccgtaaagt caacagaaag tgaagagtaa tcgttatgaa aacggaatga actaagcaat 540
aaatcatgtt ccctgctagt taatagagtc aggggaaaaa gctgctgtgc tcataaaata 600
caaaattctt cggtacttgg ccattggttg gtttgcggac ttcttgactt ccgacgactg 660
aagaactaac gcgtaccgcc agagcattgg aagcggaaaa gtcgatagca agactggatg 720
gcttgcataa tttttccccc atgtcgcgat tgtcgcaaat ccttacggct gcttctaatc 780
agtggggttt gtttctttgc ccctgagtgc ccgcgtattc cgattgggag tttttctacc 840
acacggcgtc tcaagtggtg agagaaacgg aagtatagga tttttaccca cgctgggtct 900
ttcggattgg cccgcttgca catagtttcg ttaaaattac acgcagtcgt gaagttgttg 960
cttcgatcct gaaatgtcgc ctagttccac ggggccttgg gaatgtattg tcgcgcctga 1020
tggaagccta caatgtggcg aacccgcatt gataccagag taagtgactt tcgtacaata 1080
ctctcttgcg tcttctgagt ttcgcccttg tatgcctggc tatacgcgtt tttcctcttt 1140
ctttcccatt gggccaatcg gctaaggtac ggtactcgca gagattgggt gtgagtcgcg 1200
aatgccactg ccttttcctg aggtcttggt gacatgtgac agtgtaggtt agggccaggt 1260
cggtactgat gtctggctta ggatttgata gtgctctggc cttgccaaag taatttatat 1320
tttcgagcgg ctaagaccta cggcaacggg gattccgcgg ggatggttac ttactgcaat 1380
agtaaggctt agtgtacgag gccctttttt agtgtatcac gtaaaacaag ctgttttacg 1440
tacagaggta gtgataacaa gcaagattaa taccagtgct gtggctgtgt taatcagtag 1500
gagttggtac ggacagggat tcacttttac gaaatggggc gggatcacat agagtctatc 1560
gcgtagtgta tggaaaacaa tacaattacc ctcaatcggc atattattga agtcatatac 1620
gtaagctaca gttggcggga tgtaagagac cggtgattat tgatttctcg atagcgtccc 1680
gtaggattat cagatgcact aggaccttaa cttctcactc ctagaattag gctgaggata 1740
aatggacgtg ttgattttat ctcataccca gtcatttggg aaccttatgg catataagtg 1800
attaagtgta cggggataca agctattgat ggaagagc 1838
<210> 152
<211> 2188
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 152
gctcttcatg agtaattaag cgtattttct aggaatgtta cgtgttggat tacgaaatca 60
aagggtttct taatatagcc tacagtgaat aagacgttaa agtatgaaaa taagagaaat 120
gatttgatgc gtccggacaa gtaaagatga aaaaagttaa aagattgtct gttacactaa 180
ataagaagaa gttgatagta atttgtgtga taaatgaaaa agttgagcgt agtgaattaa 240
attgtatgaa ggaatattaa agtgttaaga aagaaatcca gtgagtaatg tagaaaataa 300
aagtataaaa gataaaagag agtgttaaaa tttgtcctag aattagaatt tatctcgcga 360
taaattaata taagaatatg tattgatagg atatattaca atgagattaa agttgattta 420
aagtacataa agtatataga aaagttaaaa tgaatttaaa ggtaattaaa tattaaaaat 480
gtagtggagt tttaatttga ggcattaaat tgtaaacgaa tagaaacggt aatatgataa 540
gataaggaaa taaattgggg gtagtaataa attaccaaaa agaattaata cgttagagaa 600
tgaaaaaaaa aaagtaagaa atgattcgaa tcagagaggt atttgaattg tggtgaaaaa 660
tctatacatt atataatggg aaataacagg acaaaccagt tgaaatagaa gaaagaatca 720
taactaaaaa aagaataatg agttttttgc taaagggagc tttcggattt taaaagaaga 780
cgatatgata agaaataact gatgatacga atatataagc aatatgtatc aagtgtatta 840
gttgacatat agaagaggta aataaaaaac atagaataaa ggaagtaaat aaaacgtgta 900
tatatacact taataaaaaa gaagttgcga gataaaggcc aaagtaaaaa ttaaaattgt 960
agctaaataa cggagaaaaa aataaattca aaaattttca atatatttag actcaatgtt 1020
cattttttta tactatttgt tgatttgcag acagtcttcc taaacatcag ttaccgacat 1080
gcttttagaa gtaatattag ataagatcag ttaaactcta tatataatca agatttaaat 1140
cgtagatgag agttagtgca tgttaattta ttgttaggaa ttgttaagtt atgaataaca 1200
tagcgaaacc tgagcatcgt gggatagatt ttagattata gattactatt aatataaatg 1260
aaccagtgat tattaagtat cgattacatc tttatataac tcattactat tctgaataga 1320
tggaaatcag atttccttgg aaacttgtac aagtacattt agacttaaga ggcgaaaaaa 1380
gagctacgtc gtaaaataaa atgtaaggat ttaaaacaat agactttact atataagttt 1440
aagagagaac gataaaaata acgagaggta aaaagtatat aagattgcaa gctagaattt 1500
gtcgtaagtg catattgcgt gagtaaaatt taaaatgaag tgaccagttt tcgaactatg 1560
aggagatgaa gcatagataa actaaatatc ttaaaccggt agaaaaaaag gtgagggtct 1620
aaataatgat ttataaaata ggtcaggaac gaagtcagga ataagttaag tacagacaga 1680
taaacagata tatacaatag ccatcggaaa actagaggac aagtatccta acttcaacag 1740
gaagcaatac gaatgccagt atgtttcata atgaatcgtt cgcatcttct tatagttatg 1800
gttgttgtag gtatacttag tatatttatt acatgaattg aacaatatgc ataggtatta 1860
atttttcaga gatattgctt gccatttaac tctttaaatt tatttttgag tacgccttgg 1920
tctacttgcc aaggaacaaa cggaattttc gccttgaagg gtaaaagaga ggttgcctga 1980
gatgcctaga taattttgta aagatcaata gaaaacaata atatatacta tttaagactg 2040
ttaatctgta cgatttgggt aaagagacta aaaactgaca aagatataaa tgtatggtat 2100
agttaaatct gaaaatataa ttaataatgg caaggtgccg ataatatctg taatcagaac 2160
gttacctagt aaaaccagaa agaagagc 2188
<210> 153
<211> 1152
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 153
gctcttcagc gaggggtaaa tttagcatag gttggctgac gctgcgtgtg tcggctagag 60
cgcggctcac gccccagttg tgccctgaaa gccgttacac ttattgccgt cgtggcaacg 120
taacctggct tgcattgcag cctctaggct gtgtatgtta gaccttcgtt gcgttgtggg 180
ctctcgcgta acaggaagac atgttcacgt acccaataaa ctcgcatcgt ttcggtccct 240
cccgaggatc ggtatcattg gtcggagcgt ggctatcaca gtagtcgcag ggtatgactg 300
gtaaacctag cgaagcacct tccatggaag tgccgggtgt cttaaaagcg gtgtccgctt 360
tatgaggcaa cgattggccc ttcgactctg aaaggttgaa gtactggtcg ctaatggcac 420
ttgcctcata gttctacccg aggatggtga cgccgttccg agacgcttac tttggtactt 480
ggtgcagctg gctggtgctt aatacgggcg catgttgggc cgtaatttgc gcgttggagc 540
ccaagcctaa cttggaatgg aatatgaggg ggcttgtccg ggtttagagg cgtgcggtgg 600
tgacccaggg gctcccccgt atcgtgccca caagacttgt gattcgagct tatatcccaa 660
tttttttcct cccatcaggt cttggtcgga ctcaagcggg aatttgattc cgcgtcatag 720
tgctttggag tagtacaaaa acaaaaggaa gtggcggaag acagccggaa gggttcatct 780
tcataagagc gctacaccca gcacccttgt ggtccgcagt ttactgctgg gggccgtact 840
tttgaggtct ggcaaactag cctgtgggag agggtcttgg cgttactgta gtcttaggtt 900
ttcaccggca ggtctagtag cgtgtaccgg ctcagggata atgccttccg ctgaggtatg 960
tgaaaacctg aggggtcaac tccctgtgct gggtgacctt acgagtgatg gggactgact 1020
gtcgtccgag atcgataacc accgtcagag ctatacggta tagggcgtgc tgacctacca 1080
tagcgggttg agtctacgcc tagaaagccc tggcggctga tttctagctc gttcttgatt 1140
ttgctgaaga gc 1152
<210> 154
<211> 5197
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 154
gctcttcgcg ctcgtgagcg ccctgaggac taggcgtccg ccgtagttgg gcgcgtacga 60
ggcgctcgcc tcccgtgttg tcccgccgtc agcggatggc cccgcgggct cgcccgcgga 120
cggcgttctc gaggggctcc tgtctctcgc aactcagacc gtccgggtcc gcgcctgtgt 180
ccctccttac gtgatccacc cggcaacgcg tagggcggga tggcggtcgg cggcatcgga 240
cggtggcata catgctgggg gttgcggtct agtgctctgg aactaccgcc aggtgtgtta 300
ggccccgctg gcgtttcccc cctgtgtatg tctgtacccc gtcgaccatc tacccacccc 360
tcgactgccg cgcagcaggg gacgcgccct tcgtgtgggt gccgcccgat cacgctacga 420
gccgcaccgc gaggagagcg aaatgggccg ccgcggaagt tagcggggcg ccggcccctg 480
ctctttggtc gcgggagccc gagactcgcg gcggccgcgg gcaggaatgc cccgccccgg 540
gacgggaagc cctgtggggg cgtcaggctc gtcaactagc tcccgccggg ggcagcggag 600
aacgactggc ctgcgggaca tctacctcct gccgccggga atcggcgcca gtccggggcc 660
cgctttgatg gcctccccgc gacgcggcca cgacaccccc cggccgcctt gaagtttcgg 720
cggaccgggc ggccgaccgc cgcctccccc ctggactgac gatggccagc gggcgacagg 780
ggcagtctgg cccgcgcttt gctcggaccg accacggggt ctgcgtcggg accccagagg 840
catcggcact acgggtcgcg aggggtggca gccgcgactg acgccgtctg gggcccaggc 900
gggttgcagt cgttaaccgc caagttcgct gacacggtgg ataataggca ggcccgtcgg 960
gtcatcgtca ggcccgccgc cctcgcggcg ccggaggatg acgtgcggct cgggcgcgcg 1020
ctgggtcgga ccccggggct ctagggtcgg gcgacccccc ttcgggatga tccggattta 1080
cgtccacagc agggccccgg gctcggcact ggcggcgggc gactgcccaa ccacccctgc 1140
gcgtacgcgc agcaccgtcg tttgcgggag gccgctggaa gggtgcttcg gaggggccgc 1200
cggctgcccc ccgggacctg gcgggccgtg ccgagctggg tccggatggc gggcggggac 1260
gaacagtaag aggatgcctc ccgagcgacg cgggatcgtg cctgtgcgca tcgcagcgac 1320
ccggcgccag cggcgcgctt gaccgccgac cctcctttgc ctgagccggg cgcggcgagc 1380
cgattcagca tggcaacatc gtgtccagca tggccggggc cggcgcccgg tgcaccggcg 1440
ggacggctga tgtgcagggg tcgcgtcagt cggccttcag ccccgctggt atacatggac 1500
tgcacgcgct gagggaagac gattaggcct ggcctgtcga cgccctctac gagggtggcc 1560
gcatccggat cggggacgac gagcgtcgct cggcgcgcgg agtggggcct tagagacccc 1620
gcgcctcttc ccgcggtccc caggctcccc gatacgggcg ccaggcagga actattgccc 1680
ggaggggtgc cccggcgccc cgccccgcgc atcgattcaa gtcgctgagt gatgcgcact 1740
tgatggggtg gcaaggcgag gcggtcgcgc tcagcgtgga cgtgagtttg atgtccccgc 1800
gaggggtcgt gccgctgccg ccttgtacga gcgttatgcg cgtgccccac cccagttaca 1860
ggtggttgga gggcacctat cgcgttacgc tcgcggtcgt tatacgtcgg ggactccccg 1920
gcgagggcag ggcgcgctgc gccggggctg tttaaaggct gggtaggggg gggctcacgg 1980
cagcggaaag ctggggctcg gtcacgcccc gcttaggcct gtggggacag cgcaacggct 2040
tctcgtaaac tacaccagtc agacacgacg ggccggctcg cgccggcgtc ggactggtcg 2100
atgcttcacc cgccggcgga tctagtcgcc cgcacatccg ccgagtcctc ccgggggttg 2160
gcggctcctg catcccgtaa tccgcatagg ttcgtttcga ccgcccgttt tctacgtttc 2220
cggagccaac gagatgcctc gtgcttgtgg gtgggtcggg ggtgcagcga gttgtcgcgc 2280
ccagtaactc ctgtcggggg gtcggtgcag cggtcgagaa tgtacatagt gtataccgcg 2340
ttttcttgtg ggcgggtctt agtggcgagt cgcctcaggg gggaggggac aagtcgatgt 2400
atggtccgcg tcgcgtacag ggcggttgca gggctcactc gcggccgggg ttgaataaca 2460
gcaggagccg ctggccgggg tatcgctcat cgagggcttc acccggtgtt cggcggtctg 2520
gttcatcccg cgctcgcacc gagcggttag tgactgatgt ccatgcgcgc ttgccggggc 2580
ccaacgcgag ggtctgaatg ttcgcggccc tctgactaag gcaggggggc gatgcgcgcg 2640
ttcatatggg agtaacctac ggcgcaggtg gtggcgtgtc ggcgctgggt gcttcggcgt 2700
caccaaccga cgggcgacgg ccggggttca ggggcggcgt acagtgcgga tagtaacgtt 2760
cgtcgccggg gggcacaaga tccgactcct atggcccgtc ggggtggtcc cttgcgacgt 2820
agtctcgagg caggaagggc gtggcccgac ttctgtccgt gcgctcgcct ggcggggagg 2880
atcggtgcga cgaggaacgc gtgtgctggt ggagcgcgcg ggaaagatcg cacaacgggg 2940
tgctggagcg acggggagcc tggaagctct cgaacatgtt ggagccagcg cacactaaat 3000
cgatggttag gcgtagttgt cgcacatggc cgcagcggct cggggggtga gacagataca 3060
gtgagcgggg cgcgcgcgac ccagggagcg gcgggcctgg gaaggcggcg tcgtggatca 3120
gctgtggcgt acagcgacct gctggacccg gtggtgctgt cctatctggg ttccccgggt 3180
tgccttgtgt tcaccggtcc gtgccagctg taaaccgcga agaccaggtg ggagaggcgg 3240
aggcaaagca ggtggtgtga ggagacttga ggcgcgggag tacgccgccg tcccgcgccg 3300
ggggcatcag gtaacggagc cctatacttc ggtgtactgc accggaaggg tgtggtcccg 3360
cccgatgtta acgagaggct ggcgtggtcc tggccgctcg ccacatcagc atctccgtca 3420
aggagagaat ggagaccggt gaaaccacgt caacagaagc tgagtggtaa gggtttctat 3480
aaaagggagg tgctgctaac gtcgcgggtt gtgcgcccgt tgctccgggg gagggacggc 3540
tgctcggggc cgacaaagta cggaccgaga tggccttaag gcgttgcgac agctcaagac 3600
cgtggcttcg gtttggggcc gagggcgccc tgccgccagg gcccgcggcc cgtatgcggc 3660
tcaggggatt ccccggcgcc tcaggctacc cgtgcgcagg ccaagcgagt gccgcccctg 3720
ggcaccacca cccgagcaga acgataggtc caccttcacg gaggtccctc gggagcgatt 3780
ccgcccgagc gggtgagttg gcggtcggcg taaccgccac cggctaaggt ccccctgctt 3840
ctaggccgcc ggctagacgg cgaattgtcg tgccgcacgt gtccgcagcg gctcggatgt 3900
ccacggggat cgaccgtggt gcccggctta gttgcccatg cagaaagagg gcgggagaat 3960
tggaggctca gccctgcacc cgcgaccgcc agtcgaccag cgagcggctc gatcctgcct 4020
gatggtggcc gtcgccgctc atgccgacgg cccacgctgt aattgctcga cccccactcg 4080
gtctcctcag gatcggacgc ccctctccga catcccagcc gcccggtagg attccccggc 4140
ggcggtcacg gggcaagtcg cggggattcg tggagggccc tccagcgtgc tcggccgagg 4200
gtcggcgact cgcgcacctg agccctttcc ctggcgccga ccctggcagt cgtcgggccg 4260
ggagccggta ggtaaatgac gcaagggcgc gggctgtatg cccctccgta agacgttttg 4320
tcgccttcct ccgccgcgcc cgtcgaaacg gggccaaagc ggcctgaagc gaggcgtcgt 4380
ccggccactc atgtcgggct tcgcagccat taacgatgtg cccgcgatcc ggatctctcc 4440
gtcgggggct acgtgcggaa cgggctatgc gtcgtcggcg ccggtcccct gaaagaccat 4500
aatgtttcac cgctggccgt tcctggctga agcgtagatg cgcccctggc gacccggtgg 4560
cccaggcccg ggagacgccc cggtccccgc tagtccccaa tgtggcccgc ggcagcgggt 4620
gctggcgcgt tgcgacgatg ccgtggcagg ccttggggca cgcctccttg actgtgagac 4680
cgactgcctg atgcgccgcg ggtctcgtgg cggggccgcg cgaggcaagc gcgctcggag 4740
gccgtacatt ggtagtgtcc cccccctcca cgccgattgc ggcacggcgg cgggtggcgc 4800
ccagcaccag ggcgggacat gccgacgctg cgggttggtt gctcgcgacc cgcgccgggc 4860
cggagtggca ggcgtcagat aagagggcag gcccctcacg tcggccgtac cgcggtgccg 4920
ctgcgttcgc ggccagggcg accacaggcc cggtacactt gcgggtgggt gcccatagcc 4980
gtaagttacc gcggcgccac gacctgtcgg cggcgcggac agctggccaa ggcccatcac 5040
atcctccggc gagggcccat gggtcggacg gcgggttaga cctggagcgg gaggccgctc 5100
ccggagtccg agtggtgatg cccccggaca atgcgccccg cggcggtagc gggggccggg 5160
gggggactcc cgcggggcca ggtggatcga gaagagc 5197
<210> 155
<211> 1709
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 155
gctcttccgg catcgcagtt cctgttaacg gcatcgaagc gcccgccccc gagcaattga 60
tgctaggcca gatcctggtg cgtgcgccta actgccgcgg aactggtctg tgatgccctg 120
attaatcgtc agtgagtctt ggcgcaaggg ataggagggc tggacacgta acgtggggag 180
gcgcctggta cttgttgttc accgcccgac tccggccata cttaccggac gaatctgaag 240
tcggagggat gccgcatatc atccatgcac ggagacggtc tctccggaca ctctacggac 300
gctgggtcca ccggtgacgc cgagtcgtat atcaggaccc ggaggtttcc agtctccagg 360
tcccagggca ctaagcgatt cgcccgcgct cagggcggat tggactgcca aatcaccgac 420
cggaagacgc gacatggcgt gacaggtcct ggtcgaggcg gaacggtcaa taggactaag 480
cgttccagca cgatccgagg tcaaagcaga ggttgtgtgt cgtacgactc cgaacgcgac 540
ccctgggatc ggcaaggcgt gcaatgtgag gataagactg gcttgtcgtg gaatccaagg 600
gatcggaggc ggcggggcga aacgaggtaa ttgtttgtag ttgcgtcacc gaaggggtat 660
cctgctcaaa ggtgcagaca gggtgcgtta gagtagcgtg gggatttgaa gccgggcagg 720
tggccgtgga aagtcttacg cctccattaa acggcaaagg cgccccggtg gtcaaagccg 780
ggggacttca acctttctgg ggctctcgcg cctgcgtgga gaagcccttc gatgacgtaa 840
gtgcgcgaca aacgacaggt gggctggaaa ctggggcaag acaagggaac gggcggacat 900
gcacacgatg tgacgactat aagctaggtg gacggccgag aatgagtcga ttcctgagcg 960
gaggcaagcg gccaccgagg accatggtct cgttcagcca ccctcgtatc ggggcttgag 1020
tgagtcccgt gccgccgtgc gatttcagca acggcacact cccgaagcca ggtcgagccc 1080
cgccttgagc tacttgtgcc aatagccgga ctcaccagtt tgtccgatct attcgccggg 1140
ggggctaaac cgtatggagg ccccctacga tgtttcggac gaagccgtcg ctcggcgtag 1200
acgcccgctg atcggcagat gccagaaccc actcgttgtc gtgccattgg accacatgtt 1260
ttcgtaccaa cgttccgggg gcgcattcgg atattgatag gcctttgcga ctgcgaccta 1320
tgcgctggtc tcccccgata cccatgtccg tccttcccgc gagacgttag aaggcgtcgt 1380
gcctcgcgcc tgcgacgggt tctgactcgt cgcagacgac gtttgaaacc caccatacta 1440
gccccctggc caacttcttt ctgtcgctac ctgcgcgggg cagactcaac cttaacgccg 1500
cccgcctatt ggtctagctc gttgacctga gtcccgttgg gcctaagctc acgggctgag 1560
cctctgcctc cgggttgccg ggtcttcgat ccctctgaag ccgacttagg tatctatagg 1620
atatccgctg cacggcggtg taccggggtc agttcgggac tcagtcgtcc agtgaggcgc 1680
ctcggcggag aaacagtcac gggaagagc 1709
<210> 156
<211> 1944
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 156
gctcttcgtc tgtacttgga gaaatgtcag tcctctgatc ttgtttcatt tcgttttgtt 60
tcggcttcga tgttttttac agttggtgtt cacttcaata ttggtttatg agcttttaag 120
agtgttgtac accacttacc cacagtaacg tgtttcctat cagcttgagc ccccattata 180
gccatgcaat cacatactat ctgctggttc ggtggcacag acaacgtgaa aaaaaaagga 240
aacatagata gtcggttttt cccgtcagtc gtacaagatt ggcagaaggc acgtagttat 300
tccttattaa gccttgggca gttcgttatg gagttaccgt tcactaaggt aaaaaaagcc 360
aggttagcgc tttgtactct cacagccttt ttattatttt atagtccctg gtcgcgggtt 420
gcttatccct aaacggttag tgcgaaggtt atcttccctg tatggtcgta tgttggtaac 480
ataatgacct gtttaagtga tgcccattca ggtttgtcga atttctgcca tcgagagtgt 540
aaaagaggca aaagtcttat attaggaatg aattaataag tcgggctgag ggtatattaa 600
tttcttggat ttcatctacg tctggattta ctgtcttata tcgtcaagca tgttttaggg 660
ggtaataaca attaaagtaa tttaatgcct cccgtttctt ctatccttat tagtaaacct 720
agtccatctg tatacttata tgttgaacta acaattaaat gttagagttc ttgatttggt 780
gcattagcgg aatctatccc gaaaaatttt agttttctct tggatagaag aagtcagtta 840
tttggagtac ctcgggcatt tctttttaca gatttgacgt tcagacatta gagtacattc 900
agtccgtgtc tttccttata tagaatgggt gttctacagc catggaaata gttcttctgg 960
gaattgagct attctgtgta ctttcttccc cctactttat tttctccatt ttatatcctc 1020
ataatcaacc aggttaaggg gagaagcact tttaaattta taatatgaaa ggacaccttg 1080
gtggacttat cctctttcat ggtataatta caatttatta tatgcttttc ctactgtgtt 1140
tggctgacct atatggagac ataaggtttt aggtcctctt tgagccttgt atcccttcat 1200
aggtgcatct tagaattatt tattagtgag gttagaaaaa tcgggcgcag aatatatatc 1260
gtttaatagg actttatctg ttctttcaat gctgactatt caatattcat cgtcgtttaa 1320
ttggccctta ttatatttta tgggatctcc aaatttttcg catggttaac cggatttggt 1380
cttaccagaa cagtatcgat tgtttcgcgt gttttggcga actaatgatt tgtgcgtttg 1440
caaattatta ctgtcggttt aataatctta aaatttctat tattctgata ctctaacgta 1500
aggtagattg gcaagaagaa ggattgatag tgattgaatg tggtcaagag tctaagagtc 1560
gtgttagcgt cataaagcaa gatgttgagt caatggctga tcgggttacg aattatctta 1620
cgatatgagc taagtaagtt taggtcgttt tacaggagag atagtaaacg acgactgcat 1680
gtctaatgag ttcctatcta aaaaagccct aagtgaacta gagatgtcgg aagtgaacgg 1740
gatgaatatc agtctgataa aaaaggggac gtttgggaat caaaaatagg ttagttgggc 1800
atttgagatt taaattaagt ctggacagcc aaatcatgta ggatcttaat ctatgaatgt 1860
caatgttaag tgataagata acaccactcg cattgttgtt gacgtcgtat aaactcatat 1920
agatgtacag tcatggagaa gagc 1944
<210> 157
<211> 2586
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 157
gctcttctac cctctaacat ctgacgtagt gctaaaccct tgttagctaa cctcacgaac 60
ctatcctcac cttcttaatt cttcattagt tgccacaaag agtattttgc ttcattttct 120
agtcgctggc gctgatcgcg tagattggaa gaggtgcatt ttgccttatt ctttggtgtt 180
taggcccaag accgactaca acgcagctta tgccaattgt ggcagaatat ttacgggtcc 240
ttattagtaa tcttctatat tttgtggcgc ggatagtaag ggagtactaa ttgtcgtgct 300
ttttttctca attcttaagc tacggcctct gctatgcttg tacggacacg cgttcaatgt 360
acgtcgaacg gtaggtttta aaagtgttga tataaaagga accaatagga ggaaaggtca 420
gaatcgcaca taaagtaaaa gaagacatgt gtgttacata ttctccggag attttagtag 480
aacatgtgaa gtgtcagaat tagccgtgaa cttgttgggt atcgtcccct acccacgtgc 540
atttttagtc catgacttat cccttttatt ctttttatct ttcaagcagg tgccagataa 600
ggttaggtga ttcacctctg actttgataa actaattaat ttgcttgcta ccgtctcctc 660
tcatagcgtg tcctactttt acaccacaaa aacagaacgt gaaagatcgt tagaaatccc 720
agtataaagc agctccccgc attccaacta ctatcgtcct cgagtgctgg taatgcgcat 780
cggatcttca ggtaacctag ctaagggtat ccatactcgg tggatctatt ataagatgag 840
gatacacatc caatgccaaa cagaaataca tgcctcagat tgtggctcat cgttcgcgcg 900
caattagtaa cataaaagat tagtccagca agcaagacga agccctactc tagtcattgc 960
tcatcacaaa catgtaaacg tgaaccttta cccaacctaa cggaacaaat acagaaagga 1020
tcttagcctg aatatactgt actattcgct gtaggctaat tataaacaga cacgctcgca 1080
gcaagatata atcgaatcaa tcagtcatta atatagaaaa actttcggac ctcgttggac 1140
taaacatgtt ctcaacggaa gtccatgcct tcgggatact aatatctccc agccgcatac 1200
ggacagttta gtaagtcatg gcaagcatat tcgaacaact acgccagata taaacctggt 1260
gctcggtcaa catcgagcta attaggttag cgcaacgtac aagcaatgga tatttaacct 1320
aagtccctcc ggcattttgc taagatcaaa gacacctggc cgacgatacg tgaccattaa 1380
cgagctgcct tttaatgatg gcaatcgcca ggatagctta acgcccacgg atatatgcaa 1440
tctgagcccg actcaaagat tcccacagag caggtacgtt tttctccaag aaatagaacc 1500
agatacaagg tcccaagttc caaacgctcg gatgaatctc catatgtatg ctaagccgtg 1560
gtacacgtct gacagagtct gagttgcaca taaaatacac gtcaggacac ttcaaatact 1620
tgtcgccgca ggctccgtca tcagacggaa aagtaccacg acatgttcaa aagcctgcca 1680
tctctacagc ctaaagagtc gctgggctta taaagcccac gtcacctcgg ttgaaaattc 1740
cgaaaatacg acattacgat aaatagaagt acatgtgttc acccgcagag ttaccaagtg 1800
cacgtatcga cacaaatgaa acacctagag tccgaacaat accaactgga tttgaggagc 1860
cgcgtaaaga gcagatggaa tgagaaaggt gtatccctaa gctcaaacaa cttcttaacg 1920
agagaaacag tttaggtatt tagtttcaca atacctccag tcgaaagggc accagtccat 1980
acatatgccc ccccatgaaa ttgacattta ctcaccagac gagaaaaaaa aaacgcgaaa 2040
caaaaaccat acgcctatcg aatctctact acatcatgaa aatcctgtgc gtttctacgc 2100
cgtcgttgtt gggtctgtgc actcatctta tggcgcccgg ccgaatgtct taggtccgct 2160
gcctcttaga cattgatttg cacccgttac tttattccat gttaccgaac cggtgacacc 2220
tataggaaaa gataccctac ctcaactgct gcacaatgca gatgctaggc catctaacct 2280
tctcacgtgt aataaccccc ggtccaaccc ccgttcctcc gccttccaat tcctttacag 2340
ggtaaaaccg gaatcagtct gacccgctta aattcgtgat ctataacagg gatcatggtc 2400
ggactccagt tgtcaattcc cctgatggtt tcctcccacc ggaagggtcc catcttcgcg 2460
agaacctatc agcatcacgt cccgggaatg ttaggcctgg taagctactt caagaaagat 2520
gtaaatgtgt ggtgcgagac atatcccttt gtacagtaga ctacgagact gcctcctagg 2580
aagagc 2586
<210> 158
<211> 6274
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 158
gctcttcggg gagcttacat gaacaatcaa aggggctttg caaccaagtt tacagggtgc 60
ctttaaaata tgatggggta ataggcaatt cctacagatt gaaggatatt caagattgga 120
aaaactgaat caaaaggccc tcctattgat gaaactcatg ctgcctgacg gggacaaaga 180
gaagacgaac tagccaatgg agacgttgaa tactcatgca tgggaatacg ctgtctgccc 240
aaggagtaac accactaccc tcgtatgcgt gtgtactggc acgtaccgga aagtttatgt 300
ctaaactata gttgactaac aaatcagagt ctatgaatct agtgatctat tgcgataaat 360
gagctgcgtg tacaagatgt ccgatatgat gagagcaaga tcgtccctag agtcatgtct 420
gatttccgcg tcagtattgc agtacattaa gtatgggaag gagcatgttt ttgatgatcg 480
atcattttgc caggcgtgtg tctgctaaat gatttcgaac ccggggttca attaccacgg 540
ttaggtaaaa tatagaattt ctcaagttgt tatgaacggg gagaaccaat tgtatctgcc 600
ctaaccgtca agcgctcgct ttataggcat tccagttaat gagcaaaggt gatgccctct 660
cagtgtggtg agctgtagtt agttaggctg cgaccgttta atgattagta atatggaaga 720
ttctccttac actggagtgt gctaccagtt cggcataaat agtaggccct ttaatgtggt 780
aaaagacatg attagcgtac tgtcatctct acgagcatag aacttagggt tggcgttcgt 840
ccattcgtaa gagtgaaaag ggtagggtta tataatgacg cgtgtacata aggctaactc 900
atagagcata agtagaagag atgaggctag tatacgaaat tgtatgctaa ggagccaatc 960
ataacaaaag ttgactcaga taactctggg tcaaagccca gacctggata gagtacgaga 1020
tagaatgaag atcacaggga ggaatagggt cataacgcaa tatacaaact atagacttct 1080
ggcgaagttg cacaagtgta agagtatcct ctaagtggga gtttcatagt agagagttgg 1140
atagatagct gagacaatat tacttcctca tagtgtaaag aaacaacaaa caagacaaag 1200
attgaatgga cgcttagctt gcggtggtct accgtatttg ccctttcttg cggggagtcc 1260
agccatagtt cagggctagt agacagccga gagtagaacc acaactggag aacaaccagt 1320
agcataaaaa tcataaaaat cagggactga agcggacaaa aggaacacga agtaaaatcc 1380
agttgtcgca tagatgttct cagcgcgtgc atccgccagg acacagaggt agtatcagca 1440
gtggattttg gagtaggtat ctatcaacgc tatgacatgt agattggtgt tgttctttca 1500
aatgaaaaca gcactaggcg gtaatgcaac actgagccaa agtgttttag gagaatttgg 1560
ttgtttatgg gccctatatc tggtaagatt ggtgtaccca cagtaagggg ctcaggacaa 1620
tcttaatcca taagggcaat gaccaaagcg ttacaatcac ctatttgcgg ggtcattcct 1680
agtaattcat aggctctgtg tgtgacttgt ttaggatgca gtctgacggg gactcttaag 1740
aggggtaatt gtatcaaaag tagtccgtcg cgggaactta acatgtttgg cacatacgaa 1800
aacgttatta ctgggggtac tgatactccg ggaattgtaa ttccacgaaa tgtcttaacc 1860
ataacctatt tagtccagtt ttcagcatct acgagcttta caggcgaatt tttagccaaa 1920
tatcatgacc ctgaaactta agcgtaccat tacgttggca gttatcggac gagtaaagga 1980
tatcgcagaa ggcatctgaa tggatattcg gtgttgattt ttatgatggc gaaaagggca 2040
gcatggatgg ttgaaactta ggagggatca catactcacg atgttacaat caaatgacat 2100
gagcttagca atattttcag gtatttatcg tcaagctact ccgctgctgt gagaacttat 2160
acttccgttc attggatagc agtaatttcg actggctacg cttaatgact ccttacagga 2220
ttgtgctcct tattaaaggt ttattcgcga ccgggaaaat gtcacggatt atctaacacg 2280
caggttagtt aactgcgagt ggctgctggt gatatgatcg tatttataaa tacatactta 2340
accggtcgtc ctcttcgtta tcttgggacg aaatactgca cttggagagg actgatggac 2400
gagtattaag gaacaatatc attgacgtta gtcagtcgca actaatatcc agaagttcgt 2460
agcaaggagg tcgcctcaat ggagacttat acaatacatt tcaaagattg cttaaggggc 2520
gaaacgctta ttgcgtggaa agtcaaattt atttatggag ttataatgaa gagggatata 2580
cggcgaagta tcccgcacaa gtattagatt gcagtacaat cacagaagtc ggatgcgttt 2640
ctgaggtctg aaaaaggaag taagtaagga gtaaagtggt gagtaaaacc gacagtcgtt 2700
aataatgcag cttgcggatg ataacacggg cgctcgattc cacatctctc taagtttatt 2760
ctggaccgct ctgttgaaat aagacttaac atcaatcttg atgggcagag tagacagaaa 2820
aggcgcagca gccgaaatcg acaacaacca gagaagaaca cctgagacac gaagatgata 2880
aaatgttatt aagatgttag ttagggaatt gtcatttaac aatgacgtga tttataagac 2940
aaccaccttc ctaagaagag tactggaata acagaagggc gtgaaaggga gacaggaatt 3000
gatggactac gcggcgtgat agatcaaaat gcctgtcgaa gaaatcgtaa atgtatcagc 3060
tgtggtgtag cagctcgcgc caagcagggg aagataaacc agctcttgtt ggtaggctat 3120
cctagagtta tttcagataa ttgctctaat cagttgtcat aattttattg ttttccgggc 3180
tgtcaggatc ttcgataaga acttacatac ttaataggaa taagagggaa ctgtggtctt 3240
ttatctatct gcgattagcc attgcggaat ctgatacgat cgatgcattg tatatccgac 3300
tgaccgtggt agcgtggtag aaaaaagagt cagcacatca aaggttatat ccatgattgt 3360
tccagcagga gaggtttccg gataagagta aaagtcatcg gcgaaggcca ccgcgagagg 3420
tgatagcccc ttattttcct aaagagccgt ggaatgacat ggcgttactc aggtagttgg 3480
agcttgtcga gcgtttttgt aatgctgatt tgccctgagg tccagtgggg cactaggtta 3540
cgccagtagg cgaaagttag atagcaagta gcgacatgcg tggggggaca acctagtaaa 3600
taaacgtgac gccaggaaag gtcatttaga ctgtaatctt agtgtcagcc gcccctaatt 3660
gttaactctt agatggaccc gatgcgcgct ttgccgcatc aatagggaaa atacacctaa 3720
acataggcct tcatttaaag tatgattggt ggcctttgag ccctaagttc agctttctca 3780
cacgagtgaa ctttcgttat acccaattga tttccttctt cggttggccg tccgttttct 3840
aacagtttta attgctcagc aggaatggac acataggtac acacgagaga agtagtttta 3900
aaactaatca cgtgtgatgg tgcaacaaca gataaggtgc gagccacagc tttctcgtag 3960
aatcctactg ttgactcccg aagtctagcg atggcttact gatatactta cggttgagca 4020
gtaggactgt tgttaccctt gactgaagtg ggctacctat ttattttgta acattgcggg 4080
taatagatgc tgattactca taatttccaa taatccaacc gatggtggta aagaggaact 4140
ggataaacat ttgcagcaca cgtttttact atgactgtgt cttggaagga tagagacgac 4200
ctgatccgat ctctcgcctt tgatactcag taagagcctg agatgatcta gctcgtacca 4260
tgacagcatt tctcgttagc actattacac gactgttaca tcatgccctt tagaacgtca 4320
aatgttgcga tgagtcggat ggcgcgtgac ttgggatgaa cggtcgacag ctggacgtat 4380
agatgggact ggaagatact gacagcataa atggtccgta agagggagta aggagcaata 4440
agcggagcta acttgattac aggcgagact ccagttaaat ctgataacag gtggtatcgt 4500
ggcctctttg actccgtcct cgtcacttct tgcaattttc atccctagct aagtatgtac 4560
gatgcttcaa gaggagatat ctcacgtgtg ggagaatact cttttgtctg tgatattaca 4620
cggtgggcgc tagactgtat taaggctcat gcgacatctt acctccattg gttgcgactg 4680
aatgctgatg gaattgatta ctaacgggta aaaaaatgac cggtgcaagt ttagcttggt 4740
tcagccatcc gccgcgtggg ttttactatc cagccctgat ggtcgaagat gtgcgttaaa 4800
gacggttgtt gtgaacgctt ttagggacgg agtttgtcgg tgtctgaaac ccggaggatg 4860
atggaccaat tgtatagtat gatggctgta agtgcgttcg gatactgaaa cttctggaac 4920
aaaatgaaaa gcgataatat ggggtgagag gacacattcg gtatgtcact aatatagttg 4980
cgcttctgag gggctatgcc catgtttgat tgaaatggaa agaggtactg atatgttatg 5040
ttcttgaggc cctcatctat acatcacgac cttcccagaa aagagttacg catcgagtac 5100
aaacgttagg caggtaaagg aaaacaacta attataaaaa aaacttactt ttaactgata 5160
atattccact taatctactt tattaaagta agtcgttcgt aattaagcat taaatactaa 5220
cagaaataat tgatggatat cattaaaaag ttgcttccct ttgggagggc cttaggatga 5280
cctcctcgcg tcttcggtgt gccacgacat ggaacatatg ttgaattgca cgatgcaaac 5340
aatttagaat ttccaaaaag gtcgtagacc attaaggcag ctgattatag gtttccgtcc 5400
tagatttgat gcgggttcaa atgtaaaatt gcacatcaca tcggaggaaa tggtatgtgc 5460
ttacctgact agcatcgtga tgaaagcgta tgctcatcga tgcacttaga aattttgggc 5520
tatggactga acatgtaacg cacccggact cgcaattaat tactgaagca gattatcgta 5580
caggcaggta gcgcctggga agatcgggaa attaacacga cagttttact gtgtgccacg 5640
ttaaatactg ctgccattat ggtattcgtg aattgtggca cgtacattca gtagttcaga 5700
gggtattcag tatcggtgcg tcctgctatc cactcgattt tatttcccaa ctaccctctg 5760
gatacggaca tatagctcta tgaatctctt gtatcactga agtgaccgtt catcagtata 5820
gtatcgaaat cgtgggacta gaggggcaaa taaataggcg gctgtatgca gtgtaaggtg 5880
ttcaaggttt ggatctccat gtatgttctc accttgattc tacgtccgca gttatgaccc 5940
tggccagtcc gcagtatcac acgattaagt ctccttagag cacgttttag gacgaaatgg 6000
ccgttagacg ttcccaagat aaaggaagat gcaactttca agcgtcgacg ggcgcggcag 6060
atattgaatc gaacaaccat ggacagcaag gagtgtttca atttatgcgc aaactcttct 6120
ccgtgaatct gaaatcctta cgagagtgtc gcataataga accaaactgt catagtgtag 6180
gttacacgaa aatcagaact agacacctca cagcccaact atataatgac aagatcgccg 6240
ccattgggat tcaacctatg ctatacagaa gagc 6274
<210> 159
<211> 1659
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 159
gctcttccga ttactatgta ctaagagtct aatcttattt ctccatgttt gcgaaaattt 60
tgaagattta ctcatcgcat ttattgtgtt atgctgttat taattataaa ctaactccat 120
cccaataaca aacagctcaa attgaaaact taaaaccaga gtcatctcag attatcttga 180
atttttagtg ttaagctctc cagtattaat actgaatttg agactcgaag gagtggctgc 240
atcacgccgg tactcgctag aaactctcgg cgccaccggc ctgcaagcga agaccttact 300
agagagtcta agcctaaagc aggaactttg attgcgtctc atatatatga aaatagagga 360
ttaggagaaa gctaacggtt aaaatttgga gttgtgatgc taccaataaa acaagaaatc 420
gcgaaaaatg agtgacgttt tagagcttac tcatcgatcc atacttcctc tatcacgagt 480
tgcatgataa aaatattttg cttggacaga catagcagta tcaaataatt ggtgcaatta 540
tgatccattc ttgctcaata gagctatcgt acgaaacaga gttggccaag aataattaac 600
aaagaaagag tacctttgtg atttagcctt taagggaata cttgaagtgt atgcctatgt 660
ttgaagtagt ttcatgcaaa gttcggacca tgatgatgtg atgacaaatg tatcattcat 720
actctcctct ccttggctta gtaatggatc tagcgggtat tgcctgcgat ttgaggaata 780
tgtttctgtt gtaacagaca tttaacttac aataaaccaa acagaatctt aatcttgcgt 840
ttttgcggac ttacctatcg ttgattgcga atttacacaa ttaaaagacg ttcactacag 900
aatgaatata ctaaacttga gattttcaca aacgtttgtt caatgtttaa attaaagtat 960
gctaatacta aaggtagtat gtgataggtg catgtattta ggtggtatag tctgctatac 1020
tcacattcat gatagtcgca cttgattatt agtcgtttta cccttgattg gagggagttg 1080
ataacactaa ttactctatt agatacaaac aagttcagaa taattaatgc actgcatggg 1140
gcatcatgag actaatgctt aattaccggt acggcccctt ctgcttaatg ccatatagcg 1200
ccaacgatta atactatctt atattatagc gtactactcg aaggatgtaa agaagttgac 1260
aacatcagga cgtgctaata aagaatttct tcccaaaaac tactcggtcc aagttttatt 1320
acatattaac agtgatagag atataacagg gcaaaacaat tattgataat cggtcatatc 1380
atgacagaag gcattttgta actagagatg attaacaggt gagtaatagt cgttgctact 1440
taggataagt ttcgcttttt tcttcaattt ggcaatcata gtacatttgg ataagaatga 1500
cggaagtaac actaacttag taagtgccac catataatta tagttcgctt aaattacata 1560
ttacccttcc aattcatgtg tattttaatc ttttgttagc ttttcggtta tgagatttca 1620
aaataattca tttttttttc taattatttg cagaagagc 1659
<210> 160
<211> 3585
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 160
gctcttcttt cgacgctgag tgagtcgaag aactctgggt ctagtaatgg ggccagacgt 60
gtccctagct ctcgcatttg gaaaagtaaa tgacgcgtac cccacgaaaa gggatttagc 120
tcgacgggca aactggacca agagggtact tccgggccgt ggtccgcctc aactcaacca 180
gcttgcgtac ctgcgccctg gccgccggaa cgcgagcgca cgtggccagg aagcgccggg 240
gccggcacta gcgcgaggct cgtatcgggt tcgcgtcact gccgctcatc gccgatgcat 300
cgctcggaac gggctggttc acaggagtcc gtagacatcg ctgggctgga agcaaacacg 360
gaggttgcgt ggataccggc agccacctcc gtctccgttg ttgctaagcg ggtggatgtc 420
tcccgctaag gactgcccga gaccgatgtc ccgactgata cgtcaactcc tgatgaacat 480
ccactccccg ctactggctc cacactcgtc aggggttagg tccaggcggg gctgcacttc 540
tttcacgcag tccgtcgcgt ggagagagcg gcggccttcg atccccaacg gttgaagggt 600
gcgcgtacgg taggcttacc ccttgcgacc ccgtttttgc ggcgtgggac gtcggggcgg 660
ccagtaccgc aacgtccgct aacctcgtgg gtgacccaca gcttcggcgc gtccgatgcc 720
cgcagggcaa tgcccggcct ggaagtcgtt gctgctaagg gtggggaagg tgcgcctccc 780
gagactcagt ccgagacggg cggcctggcg tttcgggacc tcatggcggt ttaccgagcg 840
gcaccgtgag cgtgggcccc cagattcaat taccggtggt tgggtaggcg atgacgggac 900
cgagacctct cgtcttacca gcggcctccc gcggtcaaac tatatctcgc gcgcatctcc 960
gggtcacgtg gagagcgggc gccggctccg ggttcccgcc gttttgatcg cgcgcagctc 1020
cgccacactt gcataggttt tcgcccgaat gcgggatcgg caacagagcg cctttgtgac 1080
gttccgtggc cgccttccgc ccccgcgaca tgttcgggac tgcggagagg tgccccgcgg 1140
ggagtcggac cggacaacct ggcggagccg ggtcgcgcct tagcgtcgcg atgacatggc 1200
gcagcggagt gctcctcaag gcaatggagc cctggaccac ctcgcactct tgaggtggcg 1260
ttttcatatt tggcgtggcc tcccaaatgg ggcagttccg gggcggcggg atctcgcccg 1320
gagcgcggca gtggccccca ctgtgatctg gccgcgtggc gcctggcgga aagacacgcg 1380
cactacgtcg gcagccccag ctctgtcgac gtgatacccc ccagcgcacc cggaccgtgt 1440
gggccgccgt tcgcgatggg gtcgcccgac tcgtgctgta ggtggcctcg cgacaagtgg 1500
cggggacgat gctagggtga gccgccatgt cccccgtagt tcccgcttac gacgcgccct 1560
ggcccaatgc ttaaccccgc tcgccctgtg gctcagggaa gtgttccggc ggctggggtc 1620
tgtggtcagg tcgctgctag gtccaagtag tccttcgcag caggtacgcg gtgtccttgg 1680
gccgttcgtg tccagttggg ggccaggaat aacaggagac aggtcccgaa gctctcgtgt 1740
gtgcgtgggg gcagccgggg cgcaaagctg cgcaaacgcg cccctagagt agccggacca 1800
ccgcccgctg tgccccggca tcttttaccg tagctcaggg gtgagttatg gccctgcgcg 1860
gtgagccagc gcgccgggtg aaggtcggcg tcggcggcac ctatcttcag gtccgcggcg 1920
agcatgtctc agtcggttgc ggccggtcgg gccctgtcag tgtttccgga tggcccggcg 1980
ctcgggcccg cgcctgcgta gacctgggag agcacactcc ctccgccgcg taagggagga 2040
gccgaagacg gctcgctccc ctgtgatgca ctgttcccgc aatccccggt agcccctgct 2100
gatgccaccg gtggggacgc tttttgtcga cacctgggca cgagcgcgcg cgctggtgct 2160
tacacccctc gcctgattgt aggcccctcg ctcccctgtc cttttcgctc cacctccccc 2220
gggacccgag accctgacgg tcgctgcccc tagcgtctgg cagccccttc ttctatggat 2280
cgagcttggc gggcccccta ctttacccgg tggaggaact gagcccattt actgatctca 2340
gccgcccgga ctgatatttt attatgtttt tattgaggaa ggctatttta aaacgcgtat 2400
agtagaagtt cgctatgttg ctttgtcgat ctgtaacggt gatggcagca gctggcttgg 2460
ggatgtgtgg aagtgcgtga aaacgcgtac ttggcgtaat cagtaccgat gtgaagtgac 2520
aggcgggagc tttacttggt cctcatatac aagacgcaat gggctctcag ttatctaaaa 2580
tggattcaag tgtgaaaact aggtgttttt agggggcgtt aatgtataaa tcctcctggg 2640
atactgtgaa accggtcgta taaccctcgg tgtaagttta gtggtccttg catatcagga 2700
ctattcacag agcttcgagt ggatgtagag gcgctcgagg gtacaaattc ctttgtgtac 2760
agactgagcc gcagcgtctc aggtgagtta gagctatggc ggttgactgt tgggccgacg 2820
cgctgccata ttagccgggt gggagtgtca acgcttttcg ccgtattagc tgaatatgag 2880
cgaaaatgtg aaacgcgctc caggttctcg gccacaacgg tggggccatc gctagtgaca 2940
gcctgactcc tatcgagtgg gctctccgac gagatatgcc cttggttgcc ctgtctgggc 3000
cggcaggggt agcgcagggt aacagaccaa aaattgccga cctcactcct cagcacgcaa 3060
caggatgtgt tagttactca gccacgcgct ctcgacgggt ttgcgtaaca tagttgcccc 3120
gacgcccgaa ggagagcctc atggttccgc tcgcgcgctt ggtaggggcc gcgtccggga 3180
tggaggattc attcggcgaa ctgccagcgc tgttgtgaca tcgattcgcg cgtcatagtg 3240
aacggtacga gggggggaat ctgtttcaac gccggagcgc tgcgcgtccg gcgcttgcac 3300
cttgaccacg cctttactcc agaacagctt ctcgggccct tgtgagagtg gaggagggag 3360
ggtagcgggt ggagttcccc gcacgatagg attggcaggg ctaagtagtc ggtactcgtt 3420
gtactcccgc gggggtggac gcgaccggtg attcggtatg cggccagtta taccgagaac 3480
ctacttgcgc gaggaaagcc catctccgtt gggctggtct gttcgtcccg ggcggttgcg 3540
ctcttgttct ggaggggtaa ggcagttccc cggtcgccga agagc 3585
<210> 161
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 161
gctcttccgt gtgcgaatat aggcgggagg gtgaggactg atcctactgc catgacaagg 60
gagagattat agaactcagg aagcaggaac gtgaacaact tcgagtgctt acagaagcat 120
aagatgcatt cggatgctgg agcgctggta tctggggctg tctcctagta caccttgtgg 180
ctggaggagc cgtccacacc tagtagaggg ggaacccgtg tgcgagagga atacggcccg 240
tgctgcggtc gaccacgatg ccctccgtcg tcaggacgga cttttaaagc ctctctcctc 300
ttcgcctggc attagtgttt gaggcgtcac cgacgcttca tgcggccgat cttacgctcg 360
cggatctccc tgtataattc cctgacgttc tcctcacgtg acacaccctg cacccgtcta 420
acccaggatc tctgccaata ttagacgtgt aaggattggg aaatcgttca ctgttctaca 480
tccttaccat cctccctgtt ccgacgcgcg caacacataa gactgttcct tgctacgcga 540
ctgtatcacc cttggagtcc ctgctatggg agtttgtcag ctcggtcgac tgcggacagt 600
caatctgaat gcgtttatcg tgtttcgcct cccgactgtg tcatatcaac caacgtccca 660
ctgctcaaca gggtcgaaag gggtggctcc caatcccctt gaaggcgcct tgcacttcac 720
tacctccgtc ataataagga ttagataccc tggtagtcta gtgtagtctg gtcttacccg 780
cttagggact cgaagagtaa accggcctca gtaggaaccg ggcacacggt gctcactatg 840
acacatggga caatgtggag agtgagacgg cgtcgggatc gcacgtcaga gggctacagc 900
aactttagat aagctgttca acatcgttac ctgttccaag atcgataacc agacgtgttt 960
cccaacggac gcgggggagt ttattcagcc ctttcggagt ggtcggtgaa gagc 1014
<210> 162
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 162
gctcttcaca ggatgacttt actgattggc ctcgtgtggg tacactatag tcctagcggg 60
ctaaaaggtc caagtcggtt cagttgaatg cagttctccg tgtattggac accagttggt 120
gtccgcgggc ttgtttccgt tagctcgggg ttcgttcgtc cgggaaaagt agaggacaat 180
aggttaataa ttgaggcgta accatggaga cgcgcctcat gatgggtgct gccagtctct 240
gttgcgtctc ggtgtcccta gtcggcgcga tgccctccgt cgtcgactca aagacgtgcg 300
tattcctcgc gcgctccttt tcacacgcac ttaggctgtc tgtctacccc gcgcgcgtac 360
tgcgtgttcg ccagttacgg cccctctcat tctcccatct aaggcttccg atacgccgcc 420
aaggaccgtc aacctctcta tgccgtgcct tacaattcag gcaatatcgt gcagtgagtg 480
tatccagaac catcatcgcg ttccatgcca ttccccccgt gaccctcaca cttggcaatg 540
cgaataatct cccgcaccgt cacgttgcgt gggggtcaca agctgatctt aagggtggct 600
tccttccctc ttccccttca ttacctggtc catccaatcg aaagggtcca ctaccagctc 660
tagcccctgc cggtaggtgg cgcggttctc aggcctacgc atacctctcc cccccggcgt 720
gtttgcggat tagataccct ggtagtctcg atgacgtaga cagctttgcg gacgtgttgt 780
ccaaaaagca cacatcagag aatttctagg aaacaatctc aaaacgacca aaaaatcagc 840
gactacagtt atctaagagg gtcccaggtg tgcaatggct taccggccag atttccgggt 900
tcgtccaaag ccagagaaaa aggcacggaa aggacaaaaa tcgcaagaat aggggacaga 960
gcgccgtgaa caacagaggt gatcgacgac gttaagaccg aaccatcgaa gagc 1014
<210> 163
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 163
gctcttcggc gggagtcttc cgcccacgac gcccttaccg gcactatccg tcttccggag 60
acgtcacgga cagcacggca tagggcggac ttgtttactg cgaccgggaa tcttctgacg 120
gaacctctaa ctcccaccac attcctttgc cgccagattt cgccgcgttc tgttgccgca 180
aggctacctg tggacgctgc ccctgccgga atacctcttg gccccctgag aggacatagc 240
agaggcactg gtccccgatg ccctccgtcg tcccgaccgc gggatcatgt agaatctgaa 300
gtcagaactg cgggcaaaac aagcagctgg cgtgggtaga gagtcgcacg gcaattatgg 360
gttaaagtta ctcgtaatgc agggccgaaa gatcagtagg gaattggggg ccaggagtgc 420
aaagtcgttc tgtggcgact gcccatgaat ccagcctgga cgatgacccc gatcggtcgt 480
aagcggtgag ggggatatgt ttgccgaaag agcgtgcagg gagtcgacga atccactagg 540
tccggcgtgt aagcgcgcac taatgattga ctggatcagg atcgctttta gctgaggata 600
aggccgaaag cggcggcctg tggtatgaga aaaaagattt agtctgagga atgagtgtcg 660
ccggtgtgag cggcaaggag ggcctccttg tttgaggggg gggatcggaa gtactggaac 720
tacacaaccg tacttgatgg attagatacc ctggtagtcg tctcggtgtc cataccgcgg 780
tcccggcgtc cagccttgtg gttcggtgcg acgccccggg ggccgccaac cactccccat 840
attaacgcgg agtcccctag ccatacgcat actcaacgcc accccctcgc tttaatagtg 900
gtatatgtga gctggggtgc tatccctatg ggtcctctcc gcgctaaggt ccggggtctc 960
cacgcagtgc ctcttgccca cccggcgagt tcaggtctgc ccgtagggaa gagc 1014
<210> 164
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 164
gctcttctta agttagtgtg cgcgtatttg tgcgaggtaa ctcgggaagc gtgtagagta 60
cgatccacag ctaagacggt tcctctgaga atataatagg acacattatg ttagcaaggc 120
tttatgtaat cgagtactat atggaacatg acgtatagaa tagtgcgtcc gcggtacttc 180
tggcgaggaa tgattagagt cctccagagg ggttgagact gaccgcgcta ggcggcagca 240
tataaccgag ggtacgatgc cctccgtcgt ccgcaggctt gcgggataac gagcaccatg 300
tatgtggcgc agcgatgtga gaaccaagca gcggcaacga ggccgcctat ggatctttcg 360
taagtatggg taggggtagg gcagtcacac cataagttac ttagttctaa gtatcggggg 420
tgaacaagca ggcttctcgc caaacgacgc gcgtcgtcaa ggtcgaaacg caggcgcact 480
agggcgtggt gtagtcgacg taaggtcgag agaggtagtg atgacgtcta ggggacatac 540
tgcgggttac agaaactact cgctggtgcc ctgtggagac attggttcaa atggataaag 600
cgggaggata agagtgcgtg aagaatcgct cagtagaaga cggattgtgc acgacgtatt 660
caatgggccg ggcaaggcgc tgacgtttac ttgagaggcg gagacgcgga gcataccatc 720
gacaaatcaa tcatcatgga ttagataccc tggtagtcgc gcgttggctg ttgaagatat 780
gcacctacga gactaccaaa cgcagccttc ggtttaaagc gcaggggcga aaacataacg 840
tacgtttaag gagaacgcac gggggcacgg ggcaactcag ggcgagctac ttggttattc 900
aacgaataag ggctccgatc aatgcctatc tagtaaagta tacaggttgc gtgaaaacac 960
ttggaaccgg agtcagttcg gccgagtgca tgtttacgcg gggcttggaa gagc 1014
<210> 165
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 165
gctcttcgga gtagagacta atcgtcgcat tgttctaggt gtatgtgtgg agggtcccag 60
gtggagcatc gagttacgga cttgagtagt gacagatagg atgtaacgta atgcacgccc 120
tccaaggtat attgcttgtt ttgacgtgga ggcctgggcc caggaagggc cacgcacaca 180
tagttgggca tatattgaag gccctgttcg tgttggggag acgtaagcct ggcttcgacc 240
tgggagaagc ggtcccagcg taggggaacg atgccctccg tcgtcctaca tgacgattta 300
gagcgcccgt ccccactggt tttctcaaat tgccaggcct tcgcatgtgg ctcgcgactc 360
atctccactg catgtatagt tcgacacctc tattccttgg ttcactccaa gcagcccatt 420
ccaaaccttt ctatatccgc ctaccaagac gtgctgcttt actaaatatt gagtggacgt 480
tctcgctgca caggctcacc aattgcgacc gtgttctccc gttactactc atggttgcca 540
caggattaca tcatggctcc ccccgcctgt ggggacagcg ttcggtagta gttcctgtct 600
gaccagaact ctttcatttc cactatacgg ccgtagaaga ttaaaacccc tctggtcaaa 660
cccatttgga cggccgtgtg ttctccgatc aacccatgtc atttgtgacg cccacttcgc 720
tgtctggatt agataccctg gtagtcggaa gcgaatagtt ctgttgtgcc ctgcgaccca 780
gtaatcgagg gacggcacct tggcgattgt gcaggtgcag taaataaaac gtcagaaggc 840
agtagggagg ggcagctgcc ccgaggcctc actgttctag taaggatttg ggagcccgac 900
gtaatcgttg tcgcaaatga tgagaaacag ggccgcttga ggaacgagtc gtgccacgca 960
agctgttggt agcttgtttc ggcactgggc cgctctaatt tctgggggaa gagc 1014
<210> 166
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 166
gctcttccag agacatcagg gacactgaga gatcagaggc gattgaccgc gggtcgactg 60
cccgggtagc aagagcatac gtagatcccg gcggcgcccc tgtgaataat ctcttacagg 120
cagggcttaa aaggcgatcg tatcgggtcg gtggtcgtgc gaaagtggtg ttgtaagttg 180
gactggtgtt cagtccgtcc aggggttcgc ttatgaccgg gggcgcgggc attagcgggt 240
aacaggcacg ggcgccaggg tgccaaggag gccccctcga tgccctccgt cgtccgtaca 300
gagatgctca tctgtctcgc cccccggcgt gtgtgtcgtg ccgccccctt aaccttacgc 360
gcccatcatg ctagtagtgc ttagccggac atcgtacaat ctgcctatcg acacacctcc 420
ctgctattgc caagctcata ccccccacgt tcggagcgcc ctacctcttc gatgtatgtc 480
ggcaggcaga gtctcggaac tactatcaac ggaaagtcgg ttgagcgccc ctagtagcca 540
aacactaact aggtccgggg acccgcctgg tgtcgctcat gtcgacagtg gcgcccctcg 600
ttacagccca tatctattag tgctaaacgt tacattcgac gcccctgcaa gtgatatgcg 660
ctctcgccca ccggctggcg ggtcttgtta tagtgcgccc gtcccgcgcg tactgcggat 720
tagataccct ggtagtctcc gctctgactc gtacacatct cctggcacgt cacatctagc 780
cgtatggtag ccggcgcgct gaggcccgcc aggtcggaaa agataagaat ccgatacatc 840
aaccagcgag ggcccgaggg ggcgctcact agaggaccag attgactggt ccgacttcag 900
agatgttgat agctcagctc ggaacggtct ggactaggga gtcgctgctt acaggggggg 960
gcttctgtcg ttgaagggct gccgtgtccc tagatgtcga ttaccgggaa gagc 1014
<210> 167
<211> 1610
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 167
gctcttccgc gcagctaccg ggaccctctt cgggggagcg gttggggggg cgagctatcc 60
gcacggccgg gggggtccca ccgagagcgg gaagctatac cgctcccccc gcacgccccg 120
cgccagctgc cgagctacgc cggacgcgcg aggggacctc cagtacgccg ccagctacgc 180
acggtcccgc ggcaagggcg cccctgtcca caagctaatt ggcggccgga gatttcggtg 240
tcgcccgcgg caagctaaca cactttgcca gggcctaacg acacaatcca gaagctacgg 300
ggtcaggggc ggtgcacaga ccaggcgtga cgagctaaac gcccctcggg gaaagcatgg 360
acgcctagtc agagctacag tatagtgtcg tggggcggct gaggggttgg gagctactgg 420
tgcgggggag gcgggtctct tcccttggac cagctatcgc tggccggggc atggagtcgg 480
ctgtcccgcc cagctacccc gtgcgatggc atgccccggg ttatgcgaca aagctacgct 540
ggcgcagcca agtgtagcgg accacccacg cagctatctg cttcttgtcg ccgcgaacgg 600
aatccggcgc gagctaacga aaccgtgcgc cgcggtcgtc agctcactgg cagctatcga 660
cgccggtgcg ggctcgcgaa tgggcgggaa cagctatccc cctctggact ctcacccacc 720
cccccgcacg cagctacccc cccatcccca cccccacgcc acccccaagg cagctaccct 780
gtccggggcg tagtggccgt ccacgcgcgc agctaccggg accctcttcg ggggagcggt 840
tgggggggcg agctatccgc acggccgggg gggtcccacc gagagcggga agctataccg 900
ctccccccgc acgccccgcg ccagctgccg agctacgccg gacgcgcgag gggacctcca 960
gtacgccgcc agctacgcac ggtcccgcgg caagggcgcc cctgtccaca agctaattgg 1020
cggccggaga tttcggtgtc gcccgcggca agctaacaca ctttgccagg gcctaacgac 1080
acaatccaga agctacgggg tcaggggcgg tgcacagacc aggcgtgacg agctaaacgc 1140
ccctcgggga aagcatggac gcctagtcag agctacagta tagtgtcgtg gggcggctga 1200
ggggttggga gctactggtg cgggggaggc gggtctcttc ccttggacca gctatcgctg 1260
gccggggcat ggagtcggct gtcccgccca gctaccccgt gcgatggcat gccccgggtt 1320
atgcgacaaa gctacgctgg cgcagccaag tgtagcggac cacccacgca gctatctgct 1380
tcttgtcgcc gcgaacggaa tccggcgcga gctaacgaaa ccgtgcgccg cggtcgtcag 1440
ctcactggca gctatcgacg ccggtgcggg ctcgcgaatg ggcgggaaca gctatccccc 1500
tctggactct cacccacccc cccgcacgca gctacccccc catccccacc cccacgccac 1560
ccccaaggca gctaccctgt ccggggcgta gtggccgtcc acggaagagc 1610
<210> 168
<211> 1610
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 168
gctcttccgc gccgatcccg ggaccctctt cgggggagcg gttggggggg cgcgatctcc 60
gcacggccgg gggggtccca ccgagagcgg gacgatctac cgctcccccc gcacgccccg 120
cgccagctgc cgcgatccgc cggacgcgcg aggggacctc cagtacgccg cccgatccgc 180
acggtcccgc ggcaagggcg cccctgtcca cacgatcatt ggcggccgga gatttcggtg 240
tcgcccgcgg cacgatcaca cactttgcca gggcctaacg acacaatcca gacgatccgg 300
ggtcaggggc ggtgcacaga ccaggcgtga cgcgatcaac gcccctcggg gaaagcatgg 360
acgcctagtc agcgatccag tatagtgtcg tggggcggct gaggggttgg gcgatcctgg 420
tgcgggggag gcgggtctct tcccttggac ccgatctcgc tggccggggc atggagtcgg 480
ctgtcccgcc ccgatccccc gtgcgatggc atgccccggg ttatgcgaca acgatccgct 540
ggcgcagcca agtgtagcgg accacccacg ccgatctctg cttcttgtcg ccgcgaacgg 600
aatccggcgc gcgatcacga aaccgtgcgc cgcggtcgtc agctcactgg ccgatctcga 660
cgccggtgcg ggctcgcgaa tgggcgggaa ccgatctccc cctctggact ctcacccacc 720
cccccgcacg ccgatccccc cccatcccca cccccacgcc acccccaagg ccgatcccct 780
gtccggggcg tagtggccgt ccacgcgcgc cgatcccggg accctcttcg ggggagcggt 840
tgggggggcg cgatctccgc acggccgggg gggtcccacc gagagcggga cgatctaccg 900
ctccccccgc acgccccgcg ccagctgccg cgatccgccg gacgcgcgag gggacctcca 960
gtacgccgcc cgatccgcac ggtcccgcgg caagggcgcc cctgtccaca cgatcattgg 1020
cggccggaga tttcggtgtc gcccgcggca cgatcacaca ctttgccagg gcctaacgac 1080
acaatccaga cgatccgggg tcaggggcgg tgcacagacc aggcgtgacg cgatcaacgc 1140
ccctcgggga aagcatggac gcctagtcag cgatccagta tagtgtcgtg gggcggctga 1200
ggggttgggc gatcctggtg cgggggaggc gggtctcttc ccttggaccc gatctcgctg 1260
gccggggcat ggagtcggct gtcccgcccc gatcccccgt gcgatggcat gccccgggtt 1320
atgcgacaac gatccgctgg cgcagccaag tgtagcggac cacccacgcc gatctctgct 1380
tcttgtcgcc gcgaacggaa tccggcgcgc gatcacgaaa ccgtgcgccg cggtcgtcag 1440
ctcactggcc gatctcgacg ccggtgcggg ctcgcgaatg ggcgggaacc gatctccccc 1500
tctggactct cacccacccc cccgcacgcc gatccccccc catccccacc cccacgccac 1560
ccccaaggcc gatcccctgt ccggggcgta gtggccgtcc acggaagagc 1610
<210> 169
<211> 1610
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 169
gctcttccgc gctagacccg ggaccctctt cgggggagcg gttggggggg cgtagactcc 60
gcacggccgg gggggtccca ccgagagcgg gatagactac cgctcccccc gcacgccccg 120
cgccagctgc cgtagaccgc cggacgcgcg aggggacctc cagtacgccg cctagaccgc 180
acggtcccgc ggcaagggcg cccctgtcca catagacatt ggcggccgga gatttcggtg 240
tcgcccgcgg catagacaca cactttgcca gggcctaacg acacaatcca gatagaccgg 300
ggtcaggggc ggtgcacaga ccaggcgtga cgtagacaac gcccctcggg gaaagcatgg 360
acgcctagtc agtagaccag tatagtgtcg tggggcggct gaggggttgg gtagacctgg 420
tgcgggggag gcgggtctct tcccttggac ctagactcgc tggccggggc atggagtcgg 480
ctgtcccgcc ctagaccccc gtgcgatggc atgccccggg ttatgcgaca atagaccgct 540
ggcgcagcca agtgtagcgg accacccacg ctagactctg cttcttgtcg ccgcgaacgg 600
aatccggcgc gtagacacga aaccgtgcgc cgcggtcgtc agctcactgg ctagactcga 660
cgccggtgcg ggctcgcgaa tgggcgggaa ctagactccc cctctggact ctcacccacc 720
cccccgcacg ctagaccccc cccatcccca cccccacgcc acccccaagg ctagacccct 780
gtccggggcg tagtggccgt ccacgcgcgc tagacccggg accctcttcg ggggagcggt 840
tgggggggcg tagactccgc acggccgggg gggtcccacc gagagcggga tagactaccg 900
ctccccccgc acgccccgcg ccagctgccg tagaccgccg gacgcgcgag gggacctcca 960
gtacgccgcc tagaccgcac ggtcccgcgg caagggcgcc cctgtccaca tagacattgg 1020
cggccggaga tttcggtgtc gcccgcggca tagacacaca ctttgccagg gcctaacgac 1080
acaatccaga tagaccgggg tcaggggcgg tgcacagacc aggcgtgacg tagacaacgc 1140
ccctcgggga aagcatggac gcctagtcag tagaccagta tagtgtcgtg gggcggctga 1200
ggggttgggt agacctggtg cgggggaggc gggtctcttc ccttggacct agactcgctg 1260
gccggggcat ggagtcggct gtcccgccct agacccccgt gcgatggcat gccccgggtt 1320
atgcgacaat agaccgctgg cgcagccaag tgtagcggac cacccacgct agactctgct 1380
tcttgtcgcc gcgaacggaa tccggcgcgt agacacgaaa ccgtgcgccg cggtcgtcag 1440
ctcactggct agactcgacg ccggtgcggg ctcgcgaatg ggcgggaact agactccccc 1500
tctggactct cacccacccc cccgcacgct agaccccccc catccccacc cccacgccac 1560
ccccaaggct agacccctgt ccggggcgta gtggccgtcc acggaagagc 1610
<210> 170
<211> 1610
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 170
gctcttccgc gcgcagtccg ggaccctctt cgggggagcg gttggggggg cggcagttcc 60
gcacggccgg gggggtccca ccgagagcgg gagcagttac cgctcccccc gcacgccccg 120
cgccagctgc cggcagtcgc cggacgcgcg aggggacctc cagtacgccg ccgcagtcgc 180
acggtcccgc ggcaagggcg cccctgtcca cagcagtatt ggcggccgga gatttcggtg 240
tcgcccgcgg cagcagtaca cactttgcca gggcctaacg acacaatcca gagcagtcgg 300
ggtcaggggc ggtgcacaga ccaggcgtga cggcagtaac gcccctcggg gaaagcatgg 360
acgcctagtc aggcagtcag tatagtgtcg tggggcggct gaggggttgg ggcagtctgg 420
tgcgggggag gcgggtctct tcccttggac cgcagttcgc tggccggggc atggagtcgg 480
ctgtcccgcc cgcagtcccc gtgcgatggc atgccccggg ttatgcgaca agcagtcgct 540
ggcgcagcca agtgtagcgg accacccacg cgcagttctg cttcttgtcg ccgcgaacgg 600
aatccggcgc ggcagtacga aaccgtgcgc cgcggtcgtc agctcactgg cgcagttcga 660
cgccggtgcg ggctcgcgaa tgggcgggaa cgcagttccc cctctggact ctcacccacc 720
cccccgcacg cgcagtcccc cccatcccca cccccacgcc acccccaagg cgcagtccct 780
gtccggggcg tagtggccgt ccacgcgcgc gcagtccggg accctcttcg ggggagcggt 840
tgggggggcg gcagttccgc acggccgggg gggtcccacc gagagcggga gcagttaccg 900
ctccccccgc acgccccgcg ccagctgccg gcagtcgccg gacgcgcgag gggacctcca 960
gtacgccgcc gcagtcgcac ggtcccgcgg caagggcgcc cctgtccaca gcagtattgg 1020
cggccggaga tttcggtgtc gcccgcggca gcagtacaca ctttgccagg gcctaacgac 1080
acaatccaga gcagtcgggg tcaggggcgg tgcacagacc aggcgtgacg gcagtaacgc 1140
ccctcgggga aagcatggac gcctagtcag gcagtcagta tagtgtcgtg gggcggctga 1200
ggggttgggg cagtctggtg cgggggaggc gggtctcttc ccttggaccg cagttcgctg 1260
gccggggcat ggagtcggct gtcccgcccg cagtccccgt gcgatggcat gccccgggtt 1320
atgcgacaag cagtcgctgg cgcagccaag tgtagcggac cacccacgcg cagttctgct 1380
tcttgtcgcc gcgaacggaa tccggcgcgg cagtacgaaa ccgtgcgccg cggtcgtcag 1440
ctcactggcg cagttcgacg ccggtgcggg ctcgcgaatg ggcgggaacg cagttccccc 1500
tctggactct cacccacccc cccgcacgcg cagtcccccc catccccacc cccacgccac 1560
ccccaaggcg cagtccctgt ccggggcgta gtggccgtcc acggaagagc 1610
<210> 171
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 171
gctcttccta taagaattca tagtactaat gagaagaatg tactattttg tacggaaact 60
gaataactaa tcggtctgaa gtacagagtt cactaaattt tggatagcat cctttgttta 120
aataatatct ggatgaacag ctggataatt gaaacccata caataaaatt ggagctaagt 180
cagatattct tgttacatat tgaataagct attagttgaa tatttgttct ttcaaattgc 240
taaatccgat acagaaaagg aacaacagtt ggaaaaaaga ctgtaaacaa atttacagta 300
cataggtcaa taaagagttt atacttagaa cttttcgcat ctccggtaat aagctagtgg 360
catattgata attgtatgag ttaggtagtt tcattcttac tagtgttgat caagttatgg 420
tcgtcatctg aatcgtttta gcctcagtaa aatgtgggtc atcctatgaa gtatagcggt 480
gaaatcaaaa aattacatca gtttccatat tatgttttaa gctaatttag tgttacttat 540
taaataatat tataacagat ttctggggca ttattggtaa aaaatagcgc gaaatttgcg 600
gcgcagccga cggagccgaa tgcccgtcaa gaaacccaac aaaacaaaaa acacaaacta 660
agcgaaaata aacagagtaa aggtaggata atgctcgata aaaggagatt ggaaatcaac 720
taaagggaaa attgctaggc gatagcttca accatctcaa actcctttca ttcctatact 780
gcaatagcat atttatcttt ctctctaccg ctaatttata gccacttatt tcatttgtac 840
ccctaaatga gaggcacggc tagtaacacc cacgccgtgt gcaactaaaa taacaatgga 900
ataaccctct caatagaatt tgtaccggtt tttagaatga taagaacaga ttcctacatg 960
aatttcagac tcatcttact gtagggatga ctgggaatac ttcgctcatt ttgcacaatg 1020
tttcgctcaa aggcgtcacc ctgcgatcac acctctctaa acctgtcgtc catcacccca 1080
tgtgttctcg cgaaggaccc cccatcacgc gacgacacgc atgttatatt tttagttttt 1140
gctaaggata gagtacgaat tggaactttc gcgggggatc tttgactctg agctcccacc 1200
aaacaccggc cccttactcc cgccgcctta gaggagttgc gaagtagaac gcatggaccg 1260
ggtgattccg tacacctagc ccctcatctt agactgggta tcatgtcagt cccgtgttcc 1320
tcactccgtg acggagcttt cgtaactaga ttaactgccc gctacgtact tcaataggtt 1380
tgtttaggtg acgggccttc tatgattgag gcctccgtct gtcgaagcct ctaggaggtc 1440
gtggtcttgc ccccctgagg taagatccct tcagtagacc cgccgtcgct agacacgcgt 1500
gcttattttt cgttgtttat atattaagct ttttgtagct attttctttt atcgttgttg 1560
acacgttcgt tagcgtttgg ctcctaatca acacataaac actacacatg aagacataca 1620
ttcggagaat caatgtaggt gtttcggatc gcttatctag agggtgacac tacgcaaatt 1680
aacagtacca ctacagtcct tagtctagtt cgtggatcta tcctatttct caccttctca 1740
atttaccatt gtgcccctgc ctttgcgttt gcacatttac aaatatgact tcgtactatt 1800
aaatgcttag ctgaaaattc ggaacccctg tacgatcctg gaatgaagag c 1851
<210> 172
<211> 1838
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 172
gctcttcgca cttgatttag cgtatagatt cgagttagcc atactctttg ttatgttcat 60
ttaatgtatt ggattgtata ttcatcatta aacacagaag cgtctaaagt aacttcaatt 120
ttttttgata aaatattata catgcttgtt ttatgaaaca tagtaattat aaatgtatat 180
tatttttcac attcaagata cagttgtggt tgttttgatt gaggtccaaa tgtttagatt 240
tgatagattt tatctaagaa caagtgatat tttgcatagc aatatgcgtt gcgtccgtgt 300
gtctaaggta tttttaatct tttcttttta gtttctttaa ttttttacgt ttgttattaa 360
ctcacaaaca gtaatagcac cttatcatat aaacatagag acacttctaa tgcttttgcc 420
aatccgacgg gatctaccga ttagcgagag cacaaagtct gccttggaca actcgggtta 480
ctgaggtaag caagattgac cccagggcca taaaaaacga ggccagcagg tatgacaatg 540
aaatataaat tcatttcctc ttcgttcttg tagttgtgct ctcgtatgcg ggaaacaaat 600
agaataacgt tcttccttct acaaagttga atggctgaaa tgtgtttagt tatggctacg 660
tttcctataa gtcaaggttt tcggaattaa atcttccatc acttagtcta actgtcttct 720
aagcgtctat gtattttaat tctaattgtg tattatcaat gttttgactt tcgttattgc 780
atttagcttt agacactact tgtttgcccc tgtgtctttt attcagaaga taattagtgt 840
ttctcgtaga tgatgtttag ttttcactgg gctcgtaaat tgtagttctt atctgtttta 900
gggttcgtct aatattgctc aaacccggca gcttcgggag tctttccaac aaacccttaa 960
ctttatgtag gtaaggatct tggtacatga caaaacggag ataatagtta aaccatagtt 1020
ataggtggtc tggcaacaga ttgatgactc ggtgcatcta cgaactatta tgaaaatcag 1080
cgtgaatcac gaaaaggcgc ctcactcaag tttttgcgtt caggtacata tatgggagct 1140
cccagacttg atctgtggga aatattgcgt gtaaagcaat gagcaagcct cttcatctga 1200
aaacttaact gcttcacaag ttagcttgtg aaaaaagtca accaaaaaaa attgtaaagt 1260
gaaacgtgaa ggaaacatga aaacctgaaa ttttgtatat aagaaagaaa aataggcaag 1320
caaatagcat taaaaatagg attaaaaagt ttaatacaat tccttaggtc aaatttacca 1380
aggaaaaaat tcaaattaat ctgctaaaaa aaaaagaaat tcactaatag aatctccaga 1440
tctactaaaa gctgctaatc attagttttt ttgttgtgta ttgattgtaa ctcaacttgt 1500
ataacccata ctttcgttaa caaccgataa tttaagaact atatgtttac attactccac 1560
ttatacaaaa tatctgtgaa aaaattctct aactaaacag tatgctcttt ccgaaattag 1620
ttaatgtaag ttcccattat atttactaga aattatcttt ttttgctttt ttgaaaatgt 1680
tcttcggata aatacttcga ggctagtacg gaatcttttt taatcttcat tctttaataa 1740
ttcataaact caataacact atcgtcatat aagcgaaatc atatgaactt gcaaaaaatt 1800
tattttttta ccacataatt aacatattct agaagagc 1838
<210> 173
<211> 1913
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 173
gctcttctct ttacagttcc cttttgatgc cggacgagag ttaaaggtac gttaggaagt 60
gttcaagtct ggattaatag tgttttttct acaactattt ttactcattt gcgcctgcgc 120
taatacataa ttctataggc accagcagcg ccaaatcatt agtacaatat gcaacacaaa 180
ttgttatatt gatcacgaag tactatattc cacccaataa aattgtcgta ggacataatg 240
cggagtttaa gtgctaattg ccttaataaa aggtcaacat aaagtatttc taatagagta 300
ctttagaaat tcgatacgat aaagaacttg gtgaaaaagg taatgttata aaaagacatt 360
taagttcaca tttttctagg taggcctagc ctccgttatg cgatatgata acagggacca 420
gctgggcggg gtttacacga gattgcggta gtgagctcag ggctaagtca tatcacgaag 480
actaaattaa gaattaaaga gataacttgt taagacgcat tctttgtata gagatagaag 540
gcacggcggg cacttgcgta ccgtataaca gtatgtcctg cagtgtagca taatctgggt 600
tttcaagttt cttccacatc gattgtttcc gtttaagttt ttatcttttc ctattctact 660
aaccttgttt cgatattgtt agtaatctac tgcgtaccat agcagacatt cagacgaagt 720
cgggcagtct gggagagctc attctgcaag aatttatttt ttttcttata ttcgtacttg 780
ttcgtggtat tgaaagcgtc tgcttgtatg ttcttgtgag gttattaaac ttctggtttc 840
gccccaacca aacaataata acaaacactc tcttctccat aatttctctg taacccctac 900
ttttatttat tcaaaaacag gaatacaatg ctttgttagc tagctaaaag gactcagaac 960
ttgcatttgt gtaaccggct gcatggatgg taagctgtgt agcctatgca ttctatgcgc 1020
aactggcaca ttgcgatccc catttcaatt gtatatgttg caagagagaa gctgaacatg 1080
attgacgtca aaacatcata cctgaacata atattaatgt atgacgagta ttcacaaaat 1140
tttacctatc ggtcatattt cggctagttt agattatcat gctaattttc tacgtaattt 1200
gtgaacgaag caggatagcg cagggtgaca gctaatagaa gtctaggctg tgactttcca 1260
ttgcagatgg tttctattct gttagaaatt cggggttgtc tttactttta gcaagagtcg 1320
ctaaaaataa tatacaagtc tatatctatc tttgcccaag tttaaatgtg tctccacact 1380
gttatttgcg aaagagggag tcagagaacg ggccaaggag gaagtgggta ggttagtagt 1440
cataggattc atagggcccg atattgtcat tcccgaatag tttataggag ttttactagt 1500
ataccctcct agtcttgggt accaatctag gtagctaaag taaagaatcg ctacgtccct 1560
tagctgctct ccccctgtca tgctattaat ggtccgaata agttactcgt atattcgtag 1620
atgtccaatt caatacttta tcattcgggg cgcattattt atgccacctt gacgtcgttc 1680
accccttccc tcgttgggta cagatgtcag agggaacctt agatggttta gcatcaaaaa 1740
cgagcttagt tctattcatg cacaaatttt acctcagatt ttcatatcgt attggaccca 1800
acgatcgcgc tcgggaagca aattgatggc aaccccggtt cctcaaccct cccaagatac 1860
cgtcgccgat acacgagggt taagggtgta agcgaacccc ccattagaag agc 1913
<210> 174
<211> 1912
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 174
gctcttccgc cgaccatgga aaaagctgga atgcgctcaa ctacggggga gtaggaggaa 60
aacggattgg cgaacgggaa cgtgtgtttt ttacttgggt ggtgaaatcg gaccgggtca 120
actgatacac ggaccgtctt gaacgccggt ttctgaaata aggcgttgga cattcctggg 180
ttgccaagcc ggaggcagag gttagggcac gtcaggattg caaatagcac catgagtgac 240
tagcacacaa aagatccaac cgcatccgac ggttcattgt gattcgcgac aaggaagcac 300
ggagtctgcc ccacactcgt gtgcgcaggt agtaggctgg tcaggaggat tctacaggcc 360
cggggggtgg aggtacagct gtatgatggc ctaaggcgtc ttaaaacgtg gaagggacta 420
ggtattatta cacccgttct tctagcctcg ggctctatat tgtgttctta agcgcatata 480
acaaaacaca ccgggcaatg gcgactttcg agccaggcct tgataggaca ccccgccgaa 540
gaacgtcgtt gcgggacccg tgaatggaat cgagatgcgg gacgcactag gggtgggata 600
cgtgatgcaa agggcccggt gcaggtgtca gccataacgt agggcgtaga cactgaagaa 660
caaacagggg caaactcgag cgtcggacag agccatttct taccaaataa tcatcggtga 720
aggtaagcga cggtgattgg aaagggaagc gaggaggagg attgcgaaga tacggaacgg 780
gagggtagca tcgtaggcta tgtgcctccg cgaggggggc cacgccgggc cgctgttcac 840
ttcgagcttg gcagggatgg ggcctcggtc gacggggcag gggcatcgag caccgcctac 900
tgggacaaca gggagagtac aagcaaaaaa aggcagtcgt aatagaacca tgtactaccg 960
agcacaaaag atgccggagt agatatccgc agcgactaga ggacggtgaa acctcaacaa 1020
aaagtaccac gtctggctat gatttgaaag ataatcagga actgttggtg gcggcctgga 1080
gcacgttgct taggggtttg gtgggcgggg tgggcggaag cggattaatt ctctctagca 1140
ccccccacag cagcatcgga agatctaaat gccgatagtg tgtccttctg ctggggctca 1200
atttaagtta cctcgtcagc ggttacgtcg tatggatata gcatcgatgg atctaacaat 1260
taaaaccgct tcctataaaa tcgcacaagc gattctggtg tagcattgtg gtcggggccc 1320
gaaaccagcg gagctcgaag ttggcttaca cctaataaga ctcgttttta tggtaaccta 1380
ccatgtcttt cctcgtgcct aggtcatttt acggggccag aaaaacattg gctccactaa 1440
cgtgcgcaag tgcgcttggc gtgttccggg cggacaatgg gcgcctggcc ccctcttcca 1500
ttccgggttc tgtttggcgg tgggtcccag cctgaagact gtcccttaca tagaccaccc 1560
tggaagcgtt agaggatgag aacttgagac actccggtct tactgggtga cttgcgtctg 1620
gaccacgtcg gcgccggtgc cgtgccgctc aggacagctg ttcgcgtaca cggtatcaat 1680
accatagggc ggctgacagg gcacgcgcgc gtcagagtac gcgtggacgt ggacggaatc 1740
tactaccctc ccatgagccg atacgcggtg tcacattgtc ctcctacacc caatagacta 1800
cactcggacg cgcccaccgt ggaacctccc gcgcgtacat cggcccccgg ccactgtgcg 1860
gaacagttgg ctaggtgatc ctcgggttct ctcttgccca tcagcgaaga gc 1912
<210> 175
<211> 1879
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 175
gctcttccca ggcctatgcg ctcgggcctt cactaccgtt cggacgcttc caccgttctg 60
aagcactgga ggggtccaag tcggacgccg gattatgcaa ggcttcgatg aggcaaagtg 120
tcgtcgatgc ggggctggcc aacacctaag attggagcgc gcgcttcagg gactcaatac 180
agccaagtac ccatttgcct tgtcctagtc ccctcgcaag cgccggctgt gtcccacacc 240
ggatgtactc gtgtcggcgt ctaggccgcc tagcaagcct gtgcttgacg ggcaggcgtg 300
ggaaacccgt tctgtatcgg gctgtttcca gagaacggct ttgagtgata attagttcgc 360
cagagtcggt tagcgttttc gtaggaaagg caccgatatg aacaaagttc gagatatgac 420
gtgctcggtg aacacaaccg gtataagttt tcatcctatt ctagaacctc cagattagta 480
tcaccaaccg tagtggtaca gggggccccg aaacacgact acttcgggca accgttcgct 540
acgtgacgtg tgatggcgca taacgtactg gctatctcct ttgtaaattg cctcaaccct 600
agatattgag aaaattataa attttagaat tataccacta tattagtgcg gactatttgt 660
caactatctc tacccggctt atctgtggtt ggaggccctt ggacggcaaa gatatgctgc 720
gtgctctcgc cgtgacgaat ccggaatacg ccgcccttgg agcagacaca tcgccaagga 780
gagcgtgcgt gggcaaaacg aaaaacaata ccttcctaac acaccccatc actacctcct 840
agtcaaatat aagtgctttc ctacttacgc atttctgaag tatagtattc cacagccagg 900
gagttcaggc ggattgttta cagaaattga ccttaaaagt aaaggatgta ttaatatttt 960
ttttttacta cagaaattga gcacggatca gtaagtccca gaagtcagga tgtttttaag 1020
tcgattcatt ggatggtgag ttggcgctgc ccagtaagcc gacgagggct gcgttcatca 1080
ggggccgtga ctggtggagc ctaccggcta agtttggtaa tttcttgtca gcccctttct 1140
gaccctcgtg actcttttaa aaatgagatg gtactgcaat ttgtcattgc tgacgggatc 1200
gagtcaacgc aggggtacaa aatggtgacc aaatcctatt tgataaactc gactacacga 1260
cacacatgga agtgccgaat tcgttaggac gacgacagac ggtaggttgg gaagtggtga 1320
gggcgagcat agctcattaa cggacaagca catacccctt tcgtcaatct cagacgtagc 1380
acattctcta agagcctgtg ctgtcggtgt gagcctctac agtctggggg tcggggcgat 1440
caccgctggg cgtacgcctt tgccgcccgg aagttcctgt cgatctctcc agggctgatc 1500
ggaacggcgt ttagacggaa ccgccccggt tcacatcaag cgcccttgcg tctgtgctct 1560
cacggattgt atccggccgt cgttgctgcg cggcgcacct aattattaac cagggtctgt 1620
gggccacgaa cgagtcctta gatttgcgta tcctacccga cgctctgcta ggaagaaggg 1680
gctctcggtt accgtttgaa gaaagcgccg gtgggccgcg aaggatttcg cgacgggtgc 1740
cgccttctga tacccggtgt gttgacacat atgcgttcgt cagattcggc tgccgctttc 1800
tagcgcaccc ctctgcaacg gcctactcag aagggggttc tcggggaggc agagttattg 1860
ggacgaagac ttgaagagc 1879
<210> 176
<211> 1910
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 176
gctcttcggc cacaacacca ggttaatcga ggaaataccc aacgattcgt tggctgttaa 60
acttattctg cctgcgctta ctgcacgtaa aaattttctc ttacattaca actccaattt 120
ccagaacgat tagcgaatgt tatggctctg agacacgaca tatgactcta agtttcttat 180
tgaaatccct tgtatttatg cccgggatca ttttatgtgc ttcaccacaa catcttcttt 240
tggacttaac catcatgtgt aaatgagaac gtagttgcat tataaatatt aaatgagtat 300
atgagaatgt ttaggatgtc aagtttaacc ccaataccac tatttatctt attaaacaaa 360
ctgcactgta gaccagatat tgaaccgaga tttgctactc taataatagt atgcttcaaa 420
attgtttata agtcctgtaa accatagaga aagttcatct tcgagagtaa gacgaagaaa 480
ggatgtgata gccatagttg tatagaattt gggaacatat agaggcaagg gcgcgggact 540
gagaagtaga ctgcatcggc cttctcggcg catccccccc tcttactttt tgttgacgca 600
agcgtctctg cttatcggtt cccattttcg gccctttatc atggtcatgt atgagataac 660
cgtaaaaaat cggttaccgt cccgctcaaa tgattattct gacccatacc tggagccccc 720
ccaataagtc gctctataat atgctcgcac aagcgggccg gatagctaag tgcagaccaa 780
cgatcgtgca cgcaacgacg cataccgcag tatgtggcaa gaaactcgat ggtggcaatc 840
aaacgctcgg ccgagccctc aaacgatcgc gataacaggc agtcatctca gtgaacggcc 900
gagctgtaac tgctaactaa acgagagggc cgctaggtgt gagccccgaa ccgttactag 960
ccggacacag agagccgatt tcggacagaa gcttgaggca acgcctcagc ggacccgtcg 1020
aatgatgccg atagacacca ggtatacaga cgcagatcgg attagtccgc agacgatctg 1080
cccggcagaa tttatatgcc aaataggtga cacgaaagat gcgcggtcct tggtagccac 1140
ggctcaataa cgggagatgc gtgaggaatc ccacacttat aggccgaagc cgtgccttaa 1200
gtgggcgtcc aggcaaaaga acaacgagct gctcccatga accagaatcc tacagtacaa 1260
gtcatggatc tggtagcgaa agtgcaggct tgcgccaaaa tggcgggtca aagcgttacc 1320
ccggcggatg gataggtggc ctatggaacc aagaccacta ccagaacgcg gagtccatac 1380
ggaggacgca tgtttccttg tctgcacaca cataatcaca atagtaatac ccaataaaga 1440
gagagatgaa aaataaaggg atgtctatta tgcagtaaga aatagtaata ggaagatggt 1500
tactattctt caccacctct agtctatgta gtgtgcacat cccatttcgt ggtctggtaa 1560
tgctttaagg atgataacac ttcttttagt aatggtgggg ttctggggga ctggagagcg 1620
gagcgcggtt aatgaacagg gatatctttg ccgactcaac tgttttacca ggatacattt 1680
taccttaatc agctcccgag ggttagaatt ctgactagtt tcggtgctga cccttatgat 1740
gccactaagt ttggtcccgt agtacatcag cttatgttac tctttggggc gcattaatgt 1800
atgttggagt atttgcaaat cattttgctc caatacatat gacgtctagt ataagatcac 1860
taaatttagc aaactgctgt cttaacaaac ttggtcgttc tttgaagagc 1910
<210> 177
<211> 1214
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 177
gctcttcttc cctatatggt tctctgtcgt tccatccata ttctgtcgct ttcgaacagg 60
atatttacgt ttctataggc gtaagtgata gactcgtgcg tcttctcggg tgatgaggtg 120
tatgtgctgt acgcccctgc atttcagctt acggtcccac gcccttacca ccctgcactc 180
gcccaaaaaa aggaagaaaa taccttctcc cgtatcaggg agagcacgag caagaagctc 240
gaagccattt tattgcagat cagtgttgcc acccagatat gacctgaggc agactatttg 300
aagccgatcc tacatctagc ggagtagtca ggtagttttg gcatctagat tgacctgaac 360
taacagaaag gaacggaaga agacgaagtg ctagagcatt aaataagttg ttacaaatag 420
tcagtagctt ccactttaaa cagagtgatt gccttatttg tccttggcca actgatgagg 480
gggataccgt caacgtccat cgctcctgtt catgtctcta tgggagaatt tatcacccac 540
ggagcacagt acaatagccc ccacgcggga acgtgatagg gtgatgcaag gtttaccacc 600
ggagcgctcc gctcgacaaa gttcagtcac gcgcttccga tgtccagaaa gaatacagac 660
tctggccatg gtcaaggtct acaagtgccc gtcaataaac atacgggccg gcatccgacg 720
caaatgccca atatgtcgga attatggccg attgcgcggc cattatttac ggcctctggc 780
gtttggggtt acatacaata tttacaccca agcactacta atacctttta ggaccctagg 840
actagataag taaattgaat gagcaataaa ctatgagtag gatctgaagt tcttgcaata 900
ccactctttc agatttatgt gagtgaagag taacaactaa cacctactat aacaattaag 960
acgataacga aaagatagaa tcctatcctc aaaactaaga gttaaataat acatgtctat 1020
tggggacgca agtatagaca attcaagtat actatatatt acagacctcc tgtcagccgc 1080
agtgatataa ccagaccgcc cagtgaccgt tgtgacccga tgaccggcga acatgttgcc 1140
ttgagtggag atgcgatcag cccaactggg tgcactaagc cccagcgaac aacctcacgc 1200
ctccgtagaa gagc 1214
<210> 178
<211> 1214
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 178
gctcttccac tctatactgc tcgcgttctt cataaaccac gagagatcgg ttaggtctat 60
ccaattcgga tatgcataag gtcaacgtcg agttctcgcc ctgcctattt cctgaacccc 120
attcacgttc ccattggacg cacaagtata tccttttctc atgctgccta atgcaccttt 180
tgctatccaa acactaccta gcaaacgcat actagtttta ggtagcaacg gggtacgcaa 240
ttcagagtgc accaaaacgt ccacgtcttt acacacattc tccttcttcc gtcagtctcg 300
ttcctcttcc cccaattctt ttccctacca atcccacccc attaccccta gacctctggg 360
ttttaattgt ctttgaagat tgcgtccctc aagagaagta aaacaataga ctatgggagt 420
gcgttgaaag atgtaaaaag taatagagta ggtggagatt tagaattacg acggaaaaat 480
atggtctgct ctgtgccgcg gatgtggcga agagacatgt ccgtccgacg ggatttaagg 540
ccgtttcgtt tgcgagtgta ggtcacgtcg ttgtatcaag tatttgagat gatcggagtc 600
tgcaatgaga ccatgaggaa attacagaat ctcgcttaac tcaaacactt gccttttggt 660
aaagagccgt gaaagattat aaccatccca taccaattac ttaagttaac tctaggtact 720
atttcagccg cattcgctaa agtttaattt ttcaatttga taacatttca tatctaatat 780
agagaaggat ataccgttcc tgtcttctgt tagacctggt accgacgtta cactccaccc 840
ttgttctttc gagaaaaatt ggaggcaagt aaaaaactgc ggtactaatc ctacgcctca 900
ccaaccgcaa gctccgtcta aggggtgggt actcagcaaa agattgggcc acagtgggtt 960
tcatactcag cgcattacct ctctgttctc catctgttcc acccgtttat tatggtttcg 1020
tctattgaca aggtgaccac gcctcctacc tcgcaatcta gtgttccact tcgacccccc 1080
atacttccct accatcccgt actccctcat gctaacactt acgacaacca cccccccacc 1140
tgcgacgata aacatcctct cacacctcca ccacacattt cgctttgctc cggttagcca 1200
ttattatgaa gagc 1214
<210> 179
<211> 1214
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 179
gctcttcaca cgatcacaga ggggaccaag agcgaaaaca gaaaatcacg atgaggggac 60
tccacgcgtc gcacggtggg atttagtaac cgcgctgcct gccggccgat ggtcaacctc 120
ttggtctatt cgatcaccgt gaatgtaata taaccgggtt ggccgaccac ggaatggagc 180
agacctagat ccctaatgac aggggcatgt ttcctcatat ggcccggaaa gttgtgcggg 240
tgccgagtta ctgcaggcgc cagagccgct tagagaggaa agtcgtgagg gggtcgcgct 300
tgtgacttga ctgctaagcg aggttgggcc gccgagtccg tccctctagg gaagtgtgcg 360
aatggcctgg gaaaatttat ctgccgtttg tggacaaaag gaaaacatag ggtcgtggac 420
agtaaaatag gcggaggtga ggactatggt tgtgctgtgc agccacgtag gggcgggtgt 480
atggccgcga gggggtcgag attatgaccc tgcccggcta gcgtgtatag atcacacgac 540
ccgcatgtgc ctcacgtgac tcctcatcct cctagtccag gacggcctcg tagccggagc 600
gcctacgcat ccgttagcgg caaggagaat tcgcagggca tcccaacatg gtcgcttagc 660
acacaaaccg gggggtgtac agggcagtcg tgcacttccc aggcaccggg atacctatcg 720
acgccgtagc gcgtcctctc agggtctatt gacagtgcat gtccttcagt catggtatcg 780
cccactctcg ctttatcttc cctcttcagg tctccatcga tcgtggcgta cagtcgatca 840
gaaaacaact tgttgtgctc tcatcctgtg gacggtggag tctagataga ggccatggcg 900
gcaacgagtc ggaggtttct gtcttccgcc gcattcgtca atcccttcaa gtactggggc 960
acacggacaa ttcccgaatc gtgtgcgacg cacccaagtc tcaagcatat gtttccactt 1020
cccgcgcccg ctctatgcca ccctcctccg tatgacttgg gactcccctc ctgccgtaaa 1080
ctattacgcc ccccttgaat ccgtttcgct tcgcctcgat tcgttggcta gcccgttgtt 1140
gtctttctcg cctcttgtga tctcccacgc attagtctct ccggtcatgc tggtggcgac 1200
agattgcgaa gagc 1214
<210> 180
<211> 1974
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 180
gctcttcaat ggtttagtta atggtggtaa atattaaatt gattgatcct tgtccgccct 60
gaggttatta ttatttttta ttatttttta aattcggacg ttactttata tggagctcct 120
ctaccgttgg ggcggtttgc cgatgaattg caggtcggtt cccccttgga tgactgacac 180
acccgtccgt ccatcctcga cgttcgacgg caatatgacg ggctccggca caacacgctc 240
gtcctcggtt tttagtgagt ttcgttttaa agccttctgg gcgttaaata cgtccgtcgt 300
gatgcctttg accatccgct ggttgcccgg ttgcttcaaa cttacgtatg tggcagcgct 360
acagtcgccg gcccctggac atatttgttt aactcattaa actggttaag gatactatgc 420
aattgatgga atcacacaga cctatcgttt acccgcgctt tttgttactc attcatttaa 480
ctgccgtaga cctcgccggc actctgacat ataacgtaac actgaagact ggcttgccat 540
acaaagaata attgaagatt aggtcacctg tcttcttgct ctgtgcgttt tcgtgatttt 600
aggtgtgagg acgtgtcgaa tctagcacgc tcatttgtct tccacgctgt agtgccgtta 660
gtcgactaat aaaccctaat tctacttgcc aacaccaccg ataggacgtg tcgaatctag 720
cacgctcatt tgtcttccac gctgtagtgc cgttagtcga ctaataaacc ctaattctac 780
ttgccaacac caccgatagg acgtgtcgaa tctagcacgc tcatttgtct tccacgctgt 840
agtgccgtta gtcgactaat aaaccctaat tctacttgcc aacaccaccg ataggacgtg 900
tcgaatctag cacgctcatt tgtcttccac gctgtagtgc cgttagtcga ctaataaacc 960
ctaattctac ttgccaacac caccgatagg acgtgtcgaa tctagcacgc tcatttgtct 1020
tccacgctgt agtgccgtta gtcgactaat aaaccctaat tctacttgcc aacaccaccg 1080
ataggacgtg tcgaatctag cacgctcatt tgtcttccac gctgtagtgc cgttagtcga 1140
ctaataaacc ctaattctac ttgccaacac caccgatagg acgtgtcgaa tctagcacgc 1200
tcatttgtct tccacgctgt agtgccgtta gtcgactaat aaaccctaat tctacttgcc 1260
aacaccaccg ataggacgtg tcgaatctag cacgctcatt tgtcttccac gctgtagtgc 1320
cgttagtcga ctaataaacc ctaattctac ttgccaacac caccgattct tatgtgtgta 1380
actgaaaaac aagcccctga tagtagaatc agagactata tcccgaaaag tcggtacttt 1440
ctccttcagg acctctccgt attccggcca gggtgtcgaa gttgaccaag tcgtactttt 1500
ccccttattt gtgtcccctc aactaccctt gcagtcgttt gggagatgtt ttcgacttac 1560
tcgtacccat agatagatag atccatttcg cacggaatgg tgtacttgcc accccaattg 1620
ggtaactcca tgaaggggcc gtgtgatggt gtgagggcta taggtgactc ctcagtacgc 1680
atcgtaaaag gcgaaataag ttctaagatc acctataatg ggtagaaatg ctacaatcta 1740
tctctcttgc gaggcatacc gggtgaagta cgtaggagag acatgaaact tgatgtccag 1800
gcggggccat agcctgtagc tgagtgaaat gagcgctaac caccagcctt caaggagcac 1860
cttgggagca gttgacataa aaacaaacca cagaaccatc ataacaccca catcaggcca 1920
cagggctttg agagaactat tgtcggccgt gtttgctttt aatacaagaa gagc 1974
<210> 181
<211> 2090
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 181
gctcttcgcc aacatagtta cttccagaat ttggtacgca atataattca tggcctggct 60
acttatcttg aaacgaaatc accagataga ggcggatgta tgacgaggct tagttaaccg 120
accaatctcg gtggacaaaa aggtgcgcta tttccgtaag caatctcgaa atttaagagt 180
gtactatcaa gataaacgag tcacagcgaa ctctgaaagg tattaaaaga acctgtccgc 240
tttatacttt ttatattaat ttttaccaaa cattatagtt gataacgttt agttttagta 300
attgatgacg aaactaatat agatctggct aatttatctt ttattctata cttacttaag 360
atctaatttc ttgatacgtc gtcatgacga taattttgcg cagataccaa tcaaatattt 420
ccacttgccc tgtatgctgt agtgatatca tgtagcagtc aagccgattt ctggctaagg 480
atcaataatg tatcaaacat tacgaaataa tcaaagacga gcaatcagtc gcgattacta 540
tcagctggtg aggtggaacg aattcccacg agtatttgcc atttatggtg agaaaggatg 600
tcaccagagt tgttactcct accccgaggt cagaacgttc ttattactag agctattgta 660
tttagcagtg acatcattac cctaaagacc taatttgaaa agtataatcg tactcacggt 720
atgatatctg tgctgataca tgactaaaga atctaaaatt aagagcatcg cggttatttt 780
gggtggaata gactagaaag catatgccca caatacaggc ctagctagtt gttactccta 840
ccccgaggtc agaacgttct tattactaga gctattgtat ttagcagtga catcattacc 900
ctaaagacct aatttgaaaa gtataatcgt actcacggta tgatatctgt gctgatacat 960
gactaaagaa tctaaaatta agagcatcgc ggttattttg ggtggaatag actagaaagc 1020
atatgcccac aatacaggcc tagctagttg ttactcctac cccgaggtca gaacgttctt 1080
attactagag ctattgtatt tagcagtgac atcattaccc taaagaccta atttgaaaag 1140
tataatcgta ctcacggtat gatatctgtg ctgatacatg actaaagaat ctaaaattaa 1200
gagcatcgcg gttattttgg gtggaataga ctagaaagca tatgcccaca atacaggcct 1260
agctagttgt tactcctacc ccgaggtcag aacgttctta ttactagagc tattgtattt 1320
agcagtgaca tcattaccct aaagacctaa tttgaaaagt ataatcgtac tcacggtatg 1380
atatctgtgc tgatacatga ctaaagaatc taaaattaag agcatcgcgg ttattttggg 1440
tggaatagac tagaaagcat atgcccacaa tacaggccta gctcgtccga acattttact 1500
actatttgac tcgtactttg tctcaaaatc ataattaaat catcggggaa ccgaaactaa 1560
ccctattagt tacggtgtca ttcatagcgg gtggcagatg tgaactagcc ttctgtccat 1620
tcatcaacac cccactgacg gtttgtccta aagcatgcac gtgattacat acacatctaa 1680
atatatttgc tttgcccatc actccctcaa agtccctacg taggcgcggg gcacgcagta 1740
aaaacctgga ccgcatattt cctcaatgtg attatgctgt tggaagatct ttacagtgtt 1800
tattttttca taatttaatt tcaaatcaaa tagtttggta tagtattttt aaaatcgtaa 1860
gtttcacaat gttcataaaa acgtttaagg tcttggccgt catagtagga tgaattaagg 1920
agtaataatt taatagaaat ataaaatgac gtattgaacg ggatcaatag tatttgtaaa 1980
aagaaagaaa tctatggtaa agttgtactt ggagtaaaat aaaatttcgt ataagctaga 2040
gttttaaatc gattatttgg atatttttat tcgtattttc tttgaagagc 2090
<210> 182
<211> 2456
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 182
gctcttcagt tagtaccact cgacgattgt aaaaaaggag aggcccggaa gaacagaaat 60
ccgcgcccgc tcgctcgcca cacctggttc ctcctctaag agctcctcgc tgccgactga 120
actccccccc gccctacgcg atgcgttccc cctcgtgttt atcgatgttt cgaacgatgg 180
gcttattagc agcctggccg ttaatgcgga aatacgggat ggtgaccgac gcgcgctccg 240
gtgagtgaac atggaacatg tccgttaacc ctacccgatt gaaacacatt gctggtcgaa 300
accgccgaca gccaggcttc ctcgactgac acttcccttt ctgcatagaa atgctcccgg 360
gatccttact cccgtcgtat gtcccctggc cgatcagtct cgagtacggg ggccccggca 420
cgtcatttct acttaacgcg cagtcctctc ctggcgattt aattgttaag ccgcgataaa 480
cacgcgattc cctgtcacac agggctcctc tcggcacgag agattcttac acttctttag 540
tagctagccc ataaacgcta tcgcccacaa cctggtctcc ttgcggactc ttgacttctg 600
ccgggcgttt tggtggtagg ctgcactgct tccgggttgg tcgggcggac tttgctaggg 660
ttgtcggctc ggtgcccgcc agttagtgtt ggtttggctg ggttcattgg gtgtgttgtc 720
gggtgacggt gcggcttctt tctgcttggg attctcggga cgcttgtggg gctgagctgg 780
ctgtcctcta gcggtgtgcg gggcggatcc gtctctgctt aggtgtgttt gggtgtcggt 840
tgcagcgttt gcgattgtgg tcttggtggg ttgctggatt tcgctcttta cggtctggga 900
tgggtgtttg cgcgactgtg gcagtgttgt tttggggttc cgcgttgggt tcggtgactg 960
cgagttgggt agtcgcttct tggtgttggt tagcggtgtt ctgggtgcgg ctttgtccgt 1020
agttgggtcg tctgcatgca gttctgtcct tgggttcggg taggcggcta gtggggtgtg 1080
gtctggttct cggtatttcg ctaggggatc tactatggcg tcggtacttg gggtgtcggt 1140
tcgatttgaa ccactctcct taccaattca ctctccgctg gacttacctg cgcacgccct 1200
acagccgggc gcaatctaag cttcaaggtt ttggtggtag gctgcactgc ttccgggttg 1260
gtcgggcgga ctttgctagg gttgtcggct cggtgcccgc cagttagtgt tggtttggct 1320
gggttcattg ggtgtgttgt cgggtgacgg tgcggcttct ttctgcttgg gattctcggg 1380
acgcttgtgg ggctgagctg gctgtcctct agcggtgtgc ggggcggatc cgtctctgct 1440
taggtgtgtt tgggtgtcgg ttgcagcgtt tgcgattgtg gtcttggtgg gttgctggat 1500
ttcgctcttt acggtctggg atgggtgttt gcgcgactgt ggcagtgttg ttttggggtt 1560
ccgcgttggg ttcggtgact gcgagttggg tagtcgcttc ttggtgttgg ttagcggtgt 1620
tctgggtgcg gctttgtccg tagttgggtc gtctgcatgc agttctgtcc ttgggttcgg 1680
gtaggcggct agtggggtgt ggtctggttc tcggtatttc gctaggggat ctactatggc 1740
gtcggtactt ggggtgtcgg ttcgatttga accactctcc ttaccaattc actctccgct 1800
ggacttacct gcgcacgccc tacagccggg cgcaatctaa gcttcaaggc gctgtcaact 1860
tttccccgac tgatcactcg ccgggcctgg ctgatccatt cgaagtcgga tgctcactac 1920
ctgataatgg gtaggtcaaa ggcgtggcac cctcgccaac cggatccaac catagcgcga 1980
gtgcgcggcc cccaggagcc gacggctggt attaaggcgg tggtggtatc ttaggagaag 2040
gttggagtat tgccgggatg gttacgaaaa aggacctggt acggttttct ctgagatgtc 2100
cgctggtatc ggtaagggga aggctgaggt agtgggtggc aagcattcac gtcaccggcg 2160
agtctcatca accaccccac ataagacggg gtttatggtg accaaataaa ccgtgcctcc 2220
caggaacggt cttttggggc tgtgtattcc ttacaccgac cttttacgcc acgtcgagat 2280
cctctcccag ttactcgccc ggtggggtgc tacgttatgc ttacttcgcg gctgtctgcc 2340
cgcgtcgacg ctcacgaata cctgcccctc gccgctactg ccgcccagct agtcccgtcg 2400
cttgggaatt tcagaaggct agggggtcca ctgattcagc cgaaccttcg aagagc 2456
<210> 183
<211> 2002
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 183
gctcttcttc gaatactgct ggtactttat taaacgtgaa ttcctcgtct tacactttga 60
atgctatacc ctaagtggag tttcacatac gtgccttgtg aactctggtc ttgactgatc 120
aacgcttctg gtatgggatg tgcatattgc tgaaagccct gtacagggtt tgcagagagg 180
gctcatcgta tcggaattat gaacgattca aagttactaa ataggttctt cagtcttatt 240
gaaactactt aatgttcatc acactgatca ggataaagta aattaacata ctttaaatct 300
actttcgtga aggttacgac taaaaaaagt agaatctaat ttatggcgga gtgaaattaa 360
ctcattaaaa ctgtcgctat agcgcacaca acttcaagaa agaaatcctc aatcagggag 420
catataacct atatatatca gataaatcta atcccagtaa gacctagatc ccgacattga 480
ggcaatacat agcctcgtct ttgttacacc gaagcgtgtc catagaatcg tatatttagt 540
ctgttccatg atatcagatt tggttgaata ttaacaataa gaacttcctt ttatttaagc 600
attatttcct tcggtgtctc ctaagtctcc gacttagccc acttcctact aaactaagca 660
agttatcccc agactaaacg tccccccata atcgccatcg cgaagtgttc tgcattgctc 720
gcttaccaac atctctgcga cattctcgcc cgcttagctc gcttcgcagc tttcgacgcc 780
atccctgtag ctgttatttc ccgctaccag atcgttcatc acggcgccca ctctgccttc 840
tctccgaggt ctaacgcgcg gttgcgtacg cggctaaaca cgatagtcca gaggattttt 900
gacaattttc ttccctattc atatcggccc tactaatcct cttctttgtc gacgcactca 960
gtcgcacccc gttcaaatgc aaacccctcg ctccaacacc ggcaagtaac tcgtaccctt 1020
tatcgcactc cacactgctg cgcaccatta cccggttact tgtccagacc atcccctaac 1080
ccccaccaaa attactctta tgactaatac gcctcacaat tctgtacccc aatctcactc 1140
ctatttgcct cgtatccgcc gcctttaaac ggcctcaccg tcccgccgca gtgtcgtccc 1200
gtatagatct cgtgcttgcg cagatgaaac aaataatgtt tatacttgat ttccttatct 1260
tcaacccgtg gcctaatctc cctcgcaacc tgacgacctc cataaccctt gtctaccccg 1320
catcatactc taccctgtac tcacacaatc aatctgcatt actgtcccgg ccccactacg 1380
cccgaacccc gtttgaggac gagtccccga gaaactactg ttttaagcaa ggctccacca 1440
tttgtgtaat gtccttgatc attgattaaa aataaaagta gcacagtaca cacggaaata 1500
tgtgtatgtg caaagcaatt agccgaaaat ttatagaaac ctgttttata actaccgacc 1560
gtgtgactgg ccaatggagt tcccaaccag tggtatgtgc gtattaatat tcaggcacct 1620
aagccataga ttttccgtat acgactccta atcccgaact ctgcttacct cactcaacga 1680
ttatgctacg taagattggt ttttattgag ataaatgtga gttgaaactt tgataaaagg 1740
gactctccgg ttcaaacaag tccgatcctt tcgcaatcag gggctactga gtcttaccgc 1800
ctggtccgtt tccgtaattt atcacctgtg cacttgtttt tacaaaagaa cagagctttt 1860
taaacaaagc caaagcctca gctttcggat tattaacgac atagacatca caattcaaaa 1920
caagctcacg agtatcctgt ttaagtgtac tggcggcttt ggatgtatca tcattcctaa 1980
gtatgaaatg tgaaagaaga gc 2002
<210> 184
<211> 1594
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 184
gctcttccag gagcaagaga tcgaatgggc agaatgccgt atgctaatgc tacacgcttt 60
tacaagcttg agcgaataga aatagtttta aatatctaac ctgctaggga acagaaggtc 120
ctagcccaac gccagacgcc gatatgtcca atggagatat aagattaacg gtcatcgtac 180
gtgaccggta gtttctgact gaaagtatcc gaggctcaga gagtagacaa catcgtcagc 240
ggaatgatca accgaatata gtataggact tgtgttgaag catactcctg tcggttcatc 300
tgaatagact ctaaatggct agtctgacgg ctcttttgaa cataatgcta aaattaaaaa 360
tagtatgaac tcttggaaaa tggcaaccaa ggacgtccat tgatagttca aatgtatatt 420
ttacctatat gacaagagtt gagcaccaat ttgaaattag ttgcaactgt gtagtcacgg 480
tgtggttgag aggagcttta agacttgcat atgattgagc tatgcgaatt atatgaatat 540
aataaggcct tcaggtctca aattaaaata caagatcaaa ggcgttgaat cgtccttgcg 600
tggtttgtcg gtcggatgcg tcgaattctg taacgagggc gatcctcgga tagatgacag 660
gccggctacc ccccatgaaa atcggcggta tttcgacggg aaacgcgacg tcagatcgtt 720
aaatatatgg gctctttcca ccatcgagtt attaattgaa gggacggcac gatttaacag 780
ttgtgatcac ggaaagcgct tggaaccgaa gacagtcgac gggtcgtggt aggtcgcgtc 840
taagctcgta tagggagaca aaatccgggc ggagtaattt taataaggga cctaacagga 900
tcgaccataa catcatggta acgcacgcgg tggcgcataa tggtcagcgg gaccgcatga 960
agcacaagcg ataaacccgg taacccggcg cgttgtcacc ctgctatgta tatttaccca 1020
gtcccttcgc gtatcgagga cgtatttctt tataccgcga aacgcaaagt tacctttggt 1080
tccaatcgct agaactcagg ggtaaaacaa caaaaccccg gaaggctgcg tggtcacttg 1140
ggcaggatac tgtatataat cttttattag tatttgtatc ggctcctcta actatcatgc 1200
ttactggttt ataaacgggg ttctgaattt agcactgcaa tgtgtgccag ttccatgtcc 1260
acagctgtcg tagtgatgca cctatgtatt atcctagcat cgaagtatgc cccgcttagg 1320
tgttaaaata tttaaatgag tctaagtggc gtcgataggt tcggtagact gttgtggcag 1380
ttaagaatcg agttagttaa tgtgttgtgc cagaagtacc tataggtcgc tccctttaaa 1440
cggtaactat ggtggcgcta ttaacttcaa ggcgaatagt taggttgtct ggttggggat 1500
cctaggcact gattcgtatc ctatagcgct atgcatcccg cgataagctt caccatccat 1560
ccaacaggag cgtattttat cattcacgaa gagc 1594
<210> 185
<211> 1444
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 185
gctcttcgta ggtaacgtcg ctgctaggta agtgttgccc atagcaacct atgtccctcg 60
cttaacttcg attacagtaa tttttttagc tcgccttcag cgccgacttg gaacgattcc 120
tccgggtatc gattaatgtg cgtcgtgttt aatttatagc gactggctct caaagggcta 180
gagccacctc atgtaggcgc gactagtgcg cccactatcc atggcgccgg ggcctcctgc 240
ccatacgtgg tatgtagcat tttgttccac ccggattacg tagggccact tctttcgatc 300
cgatcctagc gttactatgt tagttcaagc tctcgatctt ctggctacga agaagccgtc 360
atagaccatt cagattgtct ttgttatgag tttgattccg acggtgtcat gttccctttg 420
gcgtatgcta tgcgacggcg cctacttcac agcagaacca cctagccatt cccgccgtac 480
gtccgaggat ggcgtacgtg cgctctgttt atctcaggcg taatttccac tcgagcactg 540
ttcagtcgtt gatttttcct cccactgacg aaatatcttg gggtcctcga tcccctggcg 600
gctgcataag tcttttatcc ttatcaatag acaatgtata tttaaggagt gaagactctc 660
ttcccagcgt ggctagcact tcctgccatg tccaggttct ccggtccttt ctatagtgat 720
gtaagaaagt ttgggtgacc gcagattcgc tcaccgtgat agggatcaga tatgcataag 780
caattttcta cctgcagaat ccggagttta agaaaaccta tcaggactgc ctgggtcatg 840
ccgggtctgg tatatctctt gttgtggcat cccaaacgtc tccattgctg tcagagtccg 900
gcagttcatc gtatgcacac gcgttggtga cacgggtctc tcggcactat tcataaaatc 960
cgtggaaaac ccccttactc aaacgcttcg gtgtaccacc atggcatgtg tcgagcttct 1020
tatgttgtgc ctgctttggt aagacaccag ctcaggaccg ccatcaccgc ttcagtgaat 1080
cgggttcagt gctatcttca ttgtgtccaa atgtgatgcc tttactgggt taacgggtta 1140
ggcatcagtt gtctgaacct agctagctgg cccttgggtt acacccgtga cacttagccc 1200
ctgattaaac accctagttt tcaaatgcac tcccatagtc cactatcggc gttgtgtctt 1260
tgagagaggg cgtgaaatgc gcgcacttgc attgaagcgt gtaagggaat tcgcgttcac 1320
tgctggaaca cgctgcggat tttcccggaa cgtttcacac tgtcttagcc ggcacgatgg 1380
gcgatatatg gccgttgaaa cccgcagatg aaggcgatcg ataataggaa cagatgagaa 1440
gagc 1444
<210> 186
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 186
gctcttcctt cgtatcgctg tggtctggcg cgtaatcgtt tccacgctga tcctcgccta 60
caagaacgcg cttagtgggg cgtgatgggc gtattagcgt ctgcaagccg ccactagtat 120
aacgtttcgt ggcttaacct ggtcgcgggt ggtccgtcgg atcctcctcc caccacaatc 180
tatctgcccc tattcgaggg ccgatctact cgttttccca ctagcctttg cagcggtctg 240
ttgtaaacga tgcctcggca ctcctgctct cggaacttcc agctggcagt agtataactg 300
acaggtggtc gatactggta tgggggccag cttcttggca acttgggggc gaggaacgtt 360
tgacgcccca cgcagggtct caataatgag ctccgaccac tccagagtag tgatcccaca 420
tggactggtt cgctctggca taaagaccgg tctctcttgc agtatagcat accccccagc 480
cgattagacg agagtcttta atcgcaagca ctgtatggga ggggaaggcc ccacagcgtc 540
ttctgtgggc tgcgagaaca gatcgttata cgacgactac ttaccgttag acggtattaa 600
actcaacgaa cctgcgctgg atgtaagcaa acatgtagct accagtgcca gaggaaattg 660
cacttgtcta ctccttctca ttggagtgca aattggcgac gtaatactca aagaatttga 720
tttggcagtg gaacaacact tgttgtcagc accttgcgaa gagc 764
<210> 187
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 187
gctcttcgcc cctattccgc gacgacaagc ccgtcgttat tggagttagt ccgtggctcc 60
atgacgagtc gcgttacata gtccttaccc cggcaacgtc atgtatgagc tagaggcctc 120
acgccgcccc cactagcagc cgtatgtgct ccgcgatgat gtgccttttc accatctcgc 180
cttaaggctg cctgtcttta tcagttgcag tgcggtacgt acgtaagcac agactcagtc 240
tggttgtcag tcccaaaatg cgacttcttc cctcattgtc tacctgggag aagattgcga 300
cgaaagcact tggcattgtc aagtgcgcga accaagacgc tatttaggta cttcaaacat 360
ctccttttat cgcagtaggt atcctcacgc cataaaaggt tcttaccttg tttccaacgt 420
aatgcgtgga cgacggcgcc ggaggggaag gccccacagc gtcttcgtcg cgggaaggaa 480
tccagatctg tggtcatgtg tgtcatcgtt tgctaacgaa gtatcattaa cggcacaaag 540
tatggaagca caacccggct ggatggcagc gcataagttt aagtaggaac ctcattttat 600
ctagtataat taaactcgca tgaaattacc aagtgtgaac gcattgtttt gctgaaggga 660
ctaagctcat agtaacttca ccgttaaaaa ctagaacagc gttgtatacc atgatagatc 720
tatcaatatc gtaagcttcc cgtattaagc atcgtgagaa gagc 764
<210> 188
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 188
gctcttctga tccaggatgc ccgcccgtcc ttacgatatt tcgagcgtct tccgttcatt 60
cgtccgataa ccccgagctc tgaatggttt acgtaccggg ctccttaaga ctccatccga 120
ctcacgaatc atccccgtat aaaacttctc gcgtagggaa ccggtccttc cagcacggct 180
cgcctgcccg tagtatgtaa gatgcactta gagatctcca gtcgggtgca tatctggcac 240
tcatatacta cacgtcagaa ctctaaccac tagctacctc tacatcgagt cgctagtcca 300
taataggcgt ctgagtgcag gaagagatgg aggggaaggc cccacagcgt cttcctacag 360
agagtatagt atcgctgcaa tgctcaaatg tctgatctga tagtcttcaa ctgaagtact 420
cgatatcctc ttacattttg cgttagcgat gggtggatag gagcactgtc aataggtgtt 480
ctagaggcta gaactacgac tgcggaacta aataatgcaa aaagatatct ttttggcagt 540
ggaacaacac ttgttgtcaa cgctccctgc taagatctct tgtaccattt tacacagtcg 600
aggtatgatt tatctaaccc atgttttctc tccgttgggt cctcccaaag tggtgagaag 660
gataagcggg gttagtgcag catcagataa ttgatctacg ccaagtatac aagatctcgg 720
tgatccggct accctacaaa actttcatag attctaagaa gagc 764
<210> 189
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 189
gctcttcgtt gtcccctatc tactattccc gcccgggatc gccgctttaa cttttgacaa 60
tctcccctca ttcagggggg agtcccgccc acatcaattc cgcggacatc tcatcgctcc 120
cggtctgggc cactcgtgtg tttcccggca gctctcgcac atacaaaagt aaatgtgtag 180
gacatgcgtt ctgttgtttc agttgggtct tatcgactga tttcaaacgt atacgggagt 240
tctgtgcact cctgcgcgga acagttgtca acttaatcat tcacgtagtg atataggtaa 300
cgagcttcag cttttcggcc attagtgttc cagagcctgg ccgtgagacc ttacggggca 360
acttatcacg ctttggcctt caacgtatac actgggttca gtcgccaccc gtgcgtcgct 420
tgaccagctt gtcctgacca atctggaggg gaaggcccca cagcgtcttc catactacac 480
ccgaagtgag gggatgaaat cctggtcctg tttgtatttc cgaaaactcg cacgagggct 540
gagggactgg gtctcgctag aaaataaagt tcagtaccat ggctagctct ggtagtgaca 600
cagctactgc atcgataaaa gtcagttggc aatgattagt aaaagcgtgg ttttgcaaaa 660
gggactaggc tcatagtaac ttcgtcgcca acaatactat tagggtcacc ctttggtctc 720
tgcggaacca acacggactt aaagtctttc gtccgcggaa gagc 764
<210> 190
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 190
gctcttcttt caccactttt gccgaccgtg aagagagtga tctctagtac atcgatcgac 60
aaccgcccca tgcatctgcc ggatatctgt acaatagcca tagaaaatac ttattagcga 120
gctattaacg ggtcccgcgg tttgtaaagt acggttccgc tgcaatcaac gaatacccgt 180
ggtacgcatc cagtttcata ctatacgcga gcctgcccgg ccaacggcgt ttgtagttat 240
ggccccgacg tcagcctctg gtattttccg tagtcgacta gatctagcta cgctgaccga 300
cgcagctctg cgagctacat tacagtactc ataggaacgg ccattgctcc aattttcacc 360
cgagtctgct gcacctttcc agtttgcagt accccgcggt aactagcaac gaacctattt 420
tggtaggact gctgaaggag gggaaggccc cacagcgtct tcgtctagat acgcacgacc 480
aacatgtata gtataacaac ttggtgtaaa aatccgggga catggttaaa tgtgcccaga 540
gttaaggtag gcaaagcact tcgtttgcct agcactgtct atgttcgcgt agtcaacgga 600
acctacgttg tagggtcttg tgatgaccga gaacaaagag tagtaggaga tttggtcccg 660
gaacaaagct tatcattaca gtaaatgtta gctttaacat ctaattggga ttgtgaatcg 720
atcgatcgat gcatcatcac acaatctcga ttcattagaa gagc 764
<210> 191
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 191
gctcttcgcc ctatgctcga gcgttatgcc cggggccttc agccctggtt tttacgatat 60
gctccgcgag tgcgggtcgc gcctctaaac gatgaagcga cccgcctggg cgatggattc 120
aatttctgtc cttctcggag tcccttgctt gcatgcagaa agctgcgttc atattacgat 180
gcgctattag cgcttagagt ttgcaagttg ctcagatgta taagcattgc gatcatctac 240
tcgtatccct ctccggcctc ccgcgttacc cacaccctta gatattattt ccttccgcgc 300
cttgtacctt tccctaggcg ttgacagtta ttgccgcggg gatcaaagac tagatcgcac 360
tctagtacag cagtgcgcga agaggctcac acagttcggc cgtgagacgg aggggaaggc 420
cccacagtgt cttctgacaa attccatgag accgtcaaaa acaattcgag ccatttaaaa 480
ctaatgacta gggcgaccag ttgctattgg gaaagtatgt tttcgcggtc gtcaataggt 540
gtcgaactct tgctggcatc aagaagtgtt aacgagtgat gatcacgcct aatgcaaaaa 600
gatatctttt tggcagtgga acaacacttg ttgtcaacgc tccctgctaa gatctcttgt 660
accattttac acagtcgagg tatgatttat ctaacccatg ttttctctcc gttgggtcct 720
cccaaagtgg tgagaaggat aagcggggtt agtgcaggaa gagc 764
<210> 192
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 192
gctcttcccg acaagatgag gtactgcttg tttttttcgc ctccatgata acttaatcca 60
gggcgctgtc tctcaaaccg tgaccataac ggaacaccgc acgcagtctt agctttcgct 120
tcgcataacc taagacccgc ttaaaggaat cacaatttat tctaactacg gctttcacca 180
ttccgcttca cctctagagg ttttacacga agcgttacta tgatcaaatg tgcgcctgtt 240
atccacgtcg tgtgtagtaa atattcccac atgtgcgatc atgtcctctc ttcgcaacga 300
ctgtcgtagt aggcctaact tcatggagac cgttatgggc tggggtccga taggatccgt 360
tagtgtggtc agaacctcgc ccctgtctaa tatgacatta gtaccaatgt ttgcgcaaat 420
ccttaactcc aaatcaggct ttggagcacc tgatcttgag caatgcaata taagcaggga 480
ttaatacaca aatagaatcc gcgctgacag ctatagctgg tgcttacttg cgccacagct 540
agcgggaagg tatcaaacac cggtcgtaag tacaaaatta aacatcacaa cgtgtgccca 600
atcgatattc aggtaatact caaagaattt gatttggcag tggaacaaca cttgttgtca 660
gcaccttgcc cagcgtgtcg tcagctgcat gaaagtttca caccgatgct tattggctaa 720
tttggagatg ctgcatgctc gcttgtaggg gaatatcgaa gagc 764
<210> 193
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 193
gctcttcgtg ccacaacgat cggagctttc gcttcaagat gtaaagagac ctatactcac 60
cgcactagct acatcaccgg ttaataccat aaatggactg ctcgaatgca tggtaaatgt 120
agccgttgca ttttcactct gcagaaaacg ggatccgtca ctaagtaacg ctactttcaa 180
cacatgtggg ttgcggcatg tttgtccctt gacaacacgt ctggttttat ggtccgttct 240
gaccaccatt ttgcgttaga ggcctactag gatatggtaa cctaatgaac gccgttatgg 300
ttcgatataa cttgacaaat ccataggcag taatatagcg gctagttgag ctctgacaga 360
tcgtatgctc aatactgatc actgtacaca cttttactgc tgcaaaggct tagaatattt 420
attacatgtg aaccaaggat agagatagct caacgtcacc cttggtgaat gactagtcac 480
acacattaaa tatcctgtag tgttaagcta tatagtcgta actactaggt gctgttcgag 540
gtagaccgaa tctatgatat aaagtcgcga gtcaatcggc tgtgcaatga ttagtaaaag 600
cgtggttttg caaaagggac taggctcata gtaacttcgt cgccaacaat actattaggg 660
tcaccctttg gtctctgcgg aaccaacacg gacttaaagt ctttcgtccg cgtagcatct 720
cttgtatatt tcggaagatc aaccacttta tattatagaa gagc 764
<210> 194
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 194
gctcttccgg gagattccac aacgtgtatg cacgatataa tagtgccgat gaaaacatcc 60
aacgatcaac ctgacatcgg gatcctttct gaccttagtc tgtttcaagg caacgacgtg 120
agccgttgca ttttcactct gcagaaaacg ggatccgtca ctaagtaacg ctactttcaa 180
cacatgtggg ttgcggcatg tttgtccctt gacaacacgt ctggttttat ggtccgttct 240
gaccaccatt ttgcgttaga ggcctactag gatatggtaa cctaatgaac gccgttatgg 300
ttcgatataa cttgacaaat ccataggcag taatatagcg gctagttgag ctctgacaga 360
tcgtatgctc aatactgatc actgtacaca cttttactgc tgcaaaggct tagaatattt 420
attacatgtg aaccaaggat agagatagct caacgtcacc cttggtgaat gactagtcac 480
acacattaaa tatcctgtag tgttaagcta tatagtcgta actactaggt gctgttcgag 540
gtagaccgaa tctatgatat aaagtcgcga gtcaatcggc tgtattacca agtgtgaacg 600
cattgttttg ctgaagggac taagctcata gtaacttcac cgttaaaaac tagaacagcg 660
ttgtatacca tgatagatct atcaatatcg taagcttccc gtattaagca tcgtgaacta 720
ttttgaacat taactcttgt gcttctctag tttaaaggaa gagc 764
<210> 195
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 195
gctcttccag gatgcccgcc cgtccttacg atatttcgag cgtcttccgt tcattcgtcc 60
gataaccccg agctctgaat ggtttacgta ccgggctcct taagactcca tccgactcac 120
gaatcatccc cgtataaaac ttctcgcgta gggaaccggt ccttccagca cggctcgcct 180
gcccgtagta tgtaagatgc acttagagat ctccagtcgg gtgcatatct ggcactcata 240
tactacacgt cagaactcta accactagct acctctacat cgagtcgcta gtccataata 300
ggcgtctgag tgcaggaaga gatggagggg aaggccccac agcgtcttcc tacagagagt 360
atagtatcgc tgcaatgctc aaatgtctga tctgatagtc ttcaactgaa gtactcgata 420
tcctcttaca ttttgcgtta gcgatgggtg gataggagca ctgtcaatag gtgttctaga 480
ggctagaact acgactgcgg aactaaagca atgattagta aaagcgtggt tttgcaaaag 540
ggactaggct catagtaact tcgtcgccaa caatactatt agggtcaccc tttggtctct 600
gcggaaccaa cacggactta aagtctttcg tccgcgtagc atctcttgta tatttcggaa 660
gatcaaccac tttatattat agagtcttat aaaaactcga gcaccgcggt tccaggaatt 720
gcttctggaa tgaagatcat aaccttcttc ctctgctgaa gagc 764
<210> 196
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 196
gctcttcgca tgtcgggaga ttccacaacg tgtatgcacg atataatagt gccgatgaaa 60
acatccaacg atcaacctga catcgggatc ctttctgacc ttagtctgtt tcaaggcaac 120
gacgtgagcc gttgcatttt cactctgcag aaaacgggat ccgtcactaa gtaacgctac 180
tttcaacaca tgtgggttgc ggcatgtttg tcccttgaca acacgtctgg ttttatggtc 240
cgttctgacc accattttgc gttagaggcc tactaggata tggtaaccta atgaacgccg 300
ttatggttcg atataacttg acaaatccat aggcagtaat atagcggcta gttgagctct 360
gacagatcgt atgctcaata ctgatcactg tacacacttt tactgctgca aaggcttaga 420
atatttatta catgtgaacc aaggatagag atagctcaac gtcacccttg gtgaatgact 480
agtcacacac attaaatatc ctgtagtgtt aagctatata gtcgtaacta ctaggtgctg 540
ttcgaggtag accgaatcta tgatataaag tcgcgagtca atcggctgtt aatgcaaaaa 600
gatatctttt tggcagtgga acaacacttg ttgtcaacgc tccctgctaa gatctcttgt 660
accattttac acagtcgagg tatgatttat ctaacccatg ttttctctcc gttgggtcct 720
cccaaagtgg tgagaaggat aagcggggtt agtgcaggaa gagc 764
<210> 197
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 197
gctcttcgag actgccccta ttccgcgacg acaagcccgt cgttattgga gttagtccgt 60
ggctccatga cgagtcgcgt tacatagtcc ttaccccggc aacgtcatgt atgagctaga 120
ggcctcacgc cgcccccact agcagccgta tgtgctccgc gatgatgtgc cttttcacca 180
tctcgcctta aggctgcctg tctttatcag ttgcagtgcg gtacgtacgt aagcacagac 240
tcagtctggt tgtcagtccc aaaatgcgac ttcttccctc attgtctacc tgggagaaga 300
ttgcgacgaa agcacttggc attgtcaagt gcgcgaacca agacgctatt taggtacttc 360
aaacatctcc ttttatcgca gtaggtatcc tcacgccata aaaggttctt accttgtttc 420
caacgtaatg cgtggacgac ggcgccggag gggaaggccc cacagcgtct tcgtcgcggg 480
aaggaatcca gatctgtggt catgtgtgtc atcgtttgct aacgaagtat cattaacggc 540
acaaagtatg gaagcacaac ccggctggat ggcagcgcat aagtttaagt aggaacctca 600
ttttatctag tataattaaa ctcgcatgaa taatactcaa agaatttgat ttggcagtgg 660
aacaacactt gttgtcagca ccttgcccag cgtgtcgtca gctgcatgaa agtttcacac 720
cgatgcttat tggctaattt ggagatgctg catgctcgaa gagc 764
<210> 198
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 198
gctcttcgcg ctgtttcacc acttttgccg accgtgaaga gagtgatctc tagtacatcg 60
atcgacaacc gccccatgca tctgccggat atctgtacaa tagccataga aaatacttat 120
tagcgagcta ttaacgggtc ccgcggtttg taaagtacgg ttccgctgca atcaacgaat 180
acccgtggta cgcatccagt ttcatactat acgcgagcct gcccggccaa cggcgtttgt 240
agttatggcc ccgacgtcag cctctggtat tttccgtagt cgactagatc tagctacgct 300
gaccgacgca gctctgcgag ctacattaca gtactcatag gaacggccat tgctccaatt 360
ttcacccgag tctgctgcac ctttccagtt tgcagtaccc cgcggtaact agcaacgaac 420
ctattttggt aggactgctg aaggagggga aggccccaca gcgtcttcgt ctagatacgc 480
acgaccaaca tgtatagtat aacaacttgg tgtaaaaatc cggggacatg gttaaatgtg 540
cccagagtta aggtaggcaa agcacttcgt ttgcctagca ctgtctatgt tcgcgtagtc 600
aacggaacct acgttgtagg gtcttgtaat actcaaagaa tttgatttgg cagtggaaca 660
acacttgttg tcagcacctt gcccagcgtg tcgtcagctg catgaaagtt tcacaccgat 720
gcttattggc taatttggag atgctgcatg ctcgcttgaa gagc 764
<210> 199
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 199
gctcttcgtg atccaggatg cccgcccgtc cttacgatat ttcgagcgtc ttccgttcat 60
tcgtccgata accccgagct ctgaatggtt tacgtaccgg gctccttaag actccatccg 120
actcacgaat catccccgta taaaacttct cgcgtaggga accggtcctt ccagcacggc 180
tcgcctgccc gtagtatgta agatgcactt agagatctcc agtcgggtgc atatctggca 240
ctcatatact acacgtcaga actctaacca ctagctacct ctacatcgag tcgctagtcc 300
ataataggcg tctgagtgca ggaagagatg gaggggaagg ccccacagcg tcttcctaca 360
gagagtatag tatcgctgca atgctcaaat gtctgatctg atagtcttca actgaagtac 420
tcgatatcct cttacatttt gcgttagcga tgggtggata ggagcactgt caataggtgt 480
tctagaggct agaactacga ctgcggaact aaataatact caaagaattt gatttggcag 540
tggaacaaca cttgttgtca gcaccttgcc cagcgtgtcg tcagctgcat gaaagtttca 600
caccgatgct tattggctaa tttggagatg ctgcatgctc gcttgtaggg gaatatcttt 660
aaatacttga catcacgtac cgatgatata ggctatgccg tcccgatgtt actagacgat 720
ctaaccaaac aacatgtgtg gacgactgat aatgatagaa gagc 764
<210> 200
<211> 764
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 200
gctcttcagt gctcgagcgt tatgcccggg gccttcagcc ctggttttta cgatatgctc 60
cgcgagtgcg ggtcgcgcct ctaaacgatg aagcgacccg cctgggcgat ggattcaatt 120
tctgtccttc tcggagtccc ttgcttgcat gcagaaagct gcgttcatat tacgatgcgc 180
tattagcgct tagagtttgc aagttgctca gatgtataag cattgcgatc atctactcgt 240
atccctctcc ggcctcccgc gttacccaca cccttagata ttatttcctt ccgcgccttg 300
tacctttccc taggcgttga cagttattgc cgcggggatc aaagactaga tcgcactcta 360
gtacagcagt gcgcgaagag gctcacacag ttcggccgtg agacggaggg gaaggcccca 420
cagtgtcttc tgacaaattc catgagaccg tcaaaaacaa ttcgagccat ttaaaactaa 480
tgactagggc gaccagttgc tattgggaaa gtatgttttc gcggtcgtca ataggtgtcg 540
aactcttgct ggcatcaaga agtgttaacg agtgatgatc acgccattac caagtgtgaa 600
cgcattgttt tgctgaaggg actaagctca tagtaacttc accgttaaaa actagaacag 660
cgttgtatac catgatagat ctatcaatat cgtaagcttc ccgtattaag catcgtgaac 720
tattttgaac attaactctt gtgcttctct agtttaagaa gagc 764
<210> 201
<211> 749
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 201
catgtcggga gattccacaa cgtgtatgca cgatataata gtgccgatga aaacatccaa 60
cgatcaacct gacatcggga tcctttctga ccttagtctg tttcaaggca acgacgtgag 120
ccgttgcatt ttcactctgc agaaaacggg atccgtcact aagtaacgct actttcaaca 180
catgtgggtt gcggcatgtt tgtcccttga caacacgtct ggttttatgg tccgttctga 240
ccaccatttt gcgttagagg cctactagga tatggtaacc taatgaacgc cgttatggtt 300
cgatataact tgacaaatcc ataggcagta atatagcggc tagttgagct ctgacagatc 360
gtatgctcaa tactgatcac tgtacacact tttactgctg caaaggctta gaatatttat 420
tacatgtgaa ccaaggatag agatagctca acgtcaccct tggtgaatga ctagtcacac 480
acattaaata tcctgtagtg ttaagctata tagtcgtaac tactaggtgc tgttcgaggt 540
agaccgaatc tatgatataa agtcgcgagt caatcggctg ttaatactca aagaatttga 600
tttggcagtg gaacaacact tgttgtcagc accttgccca gcgtgtcgtc agctgcatga 660
aagtttcaca ccgatgctta ttggctaatt tggagatgct gcatgctcgc ttgtagggga 720
atatctttaa atacttgaca tcacgtacc 749
<210> 202
<211> 750
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 202
cgggagattc cacaacgtgt atgcacgata taatagtgcc gatgaaaaca tccaacgatc 60
aacctgacat cgggatcctt tctgacctta gtctgtttca aggcaacgac gtgagccgtt 120
gcattttcac tctgcagaaa acgggatccg tcactaagta acgctacttt caacacatgt 180
gggttgcggc atgtttgtcc cttgacaaca cgtctggttt tatggtccgt tctgaccacc 240
attttgcgtt agaggcctac taggatatgg taacctaatg aacgccgtta tggttcgata 300
taacttgaca aatccatagg cagtaatata gcggctagtt gagctctgac agatcgtatg 360
ctcaatactg atcactgtac acacttttac tgctgcaaag gcttagaata tttattacat 420
gtgaaccaag gatagagata gctcaacgtc acccttggtg aatgactagt cacacacatt 480
aaatatcctg tagtgttaag ctatatagtc gtaactacta ggtgctgttc gaggtagacc 540
gaatctatga tataaagtcg cgagtcaatc ggctgtatta ccaagtgtga acgcattgtt 600
ttgctgaagg gactaagctc atagtaactt caccgttaaa aactagaaca gcgttgtata 660
ccatgataga tctatcaata tcgtaagctt cccgtattaa gcatcgtgaa ctattttgaa 720
cattaactct tgtgcttctc tagtttaaag 750
<210> 203
<211> 2940
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic TCRG 1
<400> 203
gctcttcgat cagcgactac taggattata atgtacgtgc gcgacacgga ggggaaggcc 60
ccacagtgtc ttcacatgat acttgggatg atgaggtccc aacacgacct tagtccttag 120
tgaggtcctt tcatactgtg accttcgtgt tcctcgttaa ccttaaactc tgacgtttta 180
gattaatttt tactaagacc caagataatg acacggtgga ccctgtccct taataatatt 240
ctttgagttt ggcagtggaa caacacttgt tgtcagtacg tgcgcgacac cggtcgctcg 300
agctagctcg agcaccaagc ccagccctag ataccaaatc aggctttgga gcacctgatc 360
ttataacaga gttgttttag gcgtcgagct gcgtcgtacc cattctgttc gttgtttcac 420
ctccgttctt tcttaagagt ttgagagtga agttaggaat ggtagttcag gcatctcttt 480
cttctgtacc ggcaaatgat gacacgacgc accctaatct taataatatt ctttgagttt 540
ggcagtggaa caacacttgt tgtcagccca gccctagata tgagcgctcg agctagctcg 600
agctgcgtgt tacgaccatc aggggagggg aaggccccac agcatcttca catgatactg 660
tagacgttga ggtccctata caaccttagt cctcagtcag tcctttcgta ctatgaatac 720
cttcatcttc ctattcgacc tttaaatatg gaggttttga tttactttta cggagacccc 780
agataatgac acggtggatc ctgtcccccg ttctcaaccc gtttttttag ttccattttg 840
gtcccggaac aaagcttatc attacaggtt acgaccatca ggtgcttgct cgagctagct 900
cgagctatac gggctaacgt ttgacggagg ggaaggcccc acagcgtctt cacatgatac 960
tgaggatgtt gaggtcccaa cacaacctta gtccttagtc agctcttttc atagtatgaa 1020
tacgttcgtg tcccttctcg gaatttaaat atgacctttt agattaactt gcactgagac 1080
cccagataat gacacggtgg accctatcct atggtgacca accaagttct attttgctga 1140
agggactaag ctcatagtaa cttcacgggc taacgtttga ctgcaagctc gagctagctc 1200
gagcctgggt cggaggatat acaatgaagt catacagttc ctggtgtcca taagtatact 1260
gccgtgacag tctttcctta ggccgtaagg cagtccgttt aaactccacc tatcctatgg 1320
actttgcaga tgtaggtgag agtggtaagt gttacatctc tttgtcctgt atcgatggat 1380
gatgacacgg aacaccctcc actatcatca ctaacctagt tctgctttgc aaaagggact 1440
aggctcatag taacttcgtc ggaggatata caacagccgc tcgagctagc tcgagcgtgt 1500
tagacctcta gctcgttgaa gtcatacagt tcctggtgtc cataagtata ctgccgtgac 1560
agtctttcct taggccgtaa ggcagtccgt ttaaactcca cctatcctat ggactttgca 1620
gatgtaggtg agagtggtaa gtgttacatc tctttgtcct gtatcgatgg atgatgacac 1680
ggaacaccct ccaccttaat aatattcttt gagtttggca gtggaacaac acttgttgtc 1740
aagacctcta gctcgttggc ggctcgagct agctcgagct atttgatccc tctgcttgag 1800
gaggggaagg ccccacagtg tcttcacatg atacttggga tgatgaggtc ccaacacgac 1860
cttagtcctt agtgaggtcc tttcatactg tgaccttcgt gttcctcgtt aaccttaaac 1920
tctgacgttt tagattaatt tttactaaga cccaagataa tgacacggtg gaccctgtcc 1980
cttaataata ttctttgagt ttggcagtgg aacaacactt gttgtcagat ccctctgctt 2040
gaaaggggct cgagctagct cgagctaatg tactcctacg atccaccagg tccctgaggc 2100
actccaccag ctccggtaca ggttcaacct acacgtcacc ctaaggtagg actttcgtct 2160
attttagtat cggttcctac cgtcgtcgag atagaaccgt catgacttca acctctgtcc 2220
gtagctcccg tacttgatga cgtgttggac ccgggacccc gttctcaacc cgttttttta 2280
gttccatttt ggtcccggaa caaagcttat cattacagta ctcctacgat ccatgtcggc 2340
tcgagctagc tcgagctggg tgaatttatg gcgcacctga atctaaatta tgagccatct 2400
gacattatag tgaagttatt gttcggggtc aagctcaaac gaatccactc tttttgttct 2460
ttgaactccg ttcttgttta aaagtttaca gatgaagtca gaaatggtat ttgaagtatc 2520
ctttccttct actccggtaa atgatgacgt gacgaatcct ggtatggtga ccaaccaagt 2580
tctattttgc tgaagggact aagctcatag taacttcacg aatttatggc gcaccctgtg 2640
ctcgagctag ctcgagcatg ttgcacgccg tttcttttcc aaacaaaggc ttagaatatt 2700
tattacatgt caagaactgt tagagacgag ttctaacgag tccacccttc tgattctttg 2760
aactccattc atttttacga gtgtgaaggt gaaggtgaaa cttttatttc aagaatctct 2820
ttcttctact ccaccacatg gtgacacgga cgacctaatc cgtgtatcat cactaaccta 2880
gttctgcttt gcaaaaggga ctaggctcat agtaacttcg gcacgccgtt tctttgaacc 2940
<210> 204
<211> 2925
<212> DNA
<213> Artificial Sequence
<220>
<223> TCRG 2
<400> 204
tgctgtctgc ctatacatgt ctgaatctaa attatgagcc atctgacatt atagtgaagt 60
tattgttcgg ggtcaagctc aaacgaatcc actctttttg ttctttgaac tccgttcttg 120
tttaaaagtt tacagatgaa gtcagaaatg gtatttgaag tatcctttcc ttctactccg 180
gtaaatgatg acgtgacgaa tcctggctta ataatattct ttgagtttgg cagtggaaca 240
acacttgttg tcatctgcct atacatgtgc agggctcgag ctagctcgag ctaaccgacc 300
aggatttcgt atgaagtcat acagttcctg gtgtccataa gtatactgcc gtgacagtct 360
ttccttaggc cgtaaggcag tccgtttaaa ctccacctat cctatggact ttgcagatgt 420
aggtgagagt ggtaagtgtt acatctcttt gtcctgtatc gatggatgat gacacggaac 480
accctccacc ttaataatat tctttgagtt tggcagtgga acaacacttg ttgtcagacc 540
aggatttcgt accgatgctc gagctagctc gagcgaaact agcttgtccg aagcggaggg 600
gaaggcccca cagtgtcttc acatgatact tgggatgatg aggtcccaac acgaccttag 660
tccttagtga ggtcctttca tactgtgacc ttcgtgttcc tcgttaacct taaactctga 720
cgttttagat taatttttac taagacccaa gataatgaca cggtggaccc tgtcccccgt 780
tctcaacccg tttttttagt tccattttgg tcccggaaca aagcttatca ttacagtagc 840
ttgtccgaag ccgggagctc gagctagctc gagccatcta ccataacgtc cacttccaaa 900
caaaggctta gaatatttat tacatgtcaa gaactgttag agacgagttc taacgagtcc 960
acccttctga ttctttgaac tccattcatt tttacgagtg tgaaggtgaa ggtgaaactt 1020
ttatttcaag aatctctttc ttctactcca ccacatggtg acacggacga cctaatccgt 1080
gtatggtgac caaccaagtt ctattttgct gaagggacta agctcatagt aacttcacac 1140
cataacgtcc actgacacgc tcgagctagc tcgagcgctt gggttctgac tcgaatccaa 1200
atcaggcttt ggagcacctg atcttataac agagttgttt taggcgtcga gctgcgtcgt 1260
acccattctg ttcgttgttt cacctccgtt ctttcttaag agtttgagag tgaagttagg 1320
aatggtagtt caggcatctc tttcttctgt accggcaaat gatgacacga cgcaccctaa 1380
ttatcatcac taacctagtt ctgctttgca aaagggacta ggctcatagt aacttcgggt 1440
tctgactcga attaccagct cgagctagct cgagccgatc cccagagctt agacgggagg 1500
ggaaggcccc acagcgtctt cacatgatac tgaggatgtt gaggtcccaa cacaacctta 1560
gtccttagtc agctcttttc atagtatgaa tacgttcgtg tcccttctcg gaatttaaat 1620
atgacctttt agattaactt gcactgagac cccagataat gacacggtgg accctatccc 1680
ttaataatat tctttgagtt tggcagtgga acaacacttg ttgtcaccca gagcttagac 1740
gtagacgctc gagctagctc gagcctgatt acggcactag tttgctgaat ctaaattatg 1800
agccatctga cattatagtg aagttattgt tcggggtcaa gctcaaacga atccactctt 1860
tttgttcttt gaactccgtt cttgtttaaa agtttacaga tgaagtcaga aatggtattt 1920
gaagtatcct ttccttctac tccggtaaat gatgacgtga cgaatcctgg cttaataata 1980
ttctttgagt ttggcagtgg aacaacactt gttgtcatac ggcactagtt tgtcaaggct 2040
cgagctagct cgagcttgta ttttcgtggg gtactccaaa tcaggctttg gagcacctga 2100
tcttataaca gagttgtttt aggcgtcgag ctgcgtcgta cccattctgt tcgttgtttc 2160
acctccgttc tttcttaaga gtttgagagt gaagttagga atggtagttc aggcatctct 2220
ttcttctgta ccggcaaatg atgacacgac gcaccctaat cccgttctca acccgttttt 2280
ttagttccat tttggtcccg gaacaaagct tatcattaca gttttcgtgg ggtactctcc 2340
agctcgagct agctcgagcc cctgcttagt gccgtaagcc caggtccctg aggcactcca 2400
ccagctccgg tacaggttca acctacacgt caccctaagg taggactttc gtctatttta 2460
gtatcggttc ctaccgtcgt cgagatagaa ccgtcatgac ttcaacctct gtccgtagct 2520
cccgtacttg atgacgtgtt ggacccggga ctatggtgac caaccaagtt ctattttgct 2580
gaagggacta agctcatagt aacttcacct tagtgccgta agcaattagc tcgagctagc 2640
tcgagccagt gtatttcgac caagacggag gggaaggccc cacagcatct tcacatgata 2700
ctgtagacgt tgaggtccct atacaacctt agtcctcagt cagtcctttc gtactatgaa 2760
taccttcatc ttcctattcg acctttaaat atggaggttt tgatttactt ttacggagac 2820
cccagataat gacacggtgg atcctgtcct atcatcacta acctagttct gctttgcaaa 2880
agggactagg ctcatagtaa cttcgtattt cgaccaagac tcgcc 2925
<210> 205
<211> 2922
<212> DNA
<213> Artificial Sequence
<220>
<223> TCRG 3
<400> 205
gcatcgtgtt agtctaaaca ggaggggaag gccccacagc atcttcacat gatactgtag 60
acgttgaggt ccctatacaa ccttagtcct cagtcagtcc tttcgtacta tgaatacctt 120
catcttccta ttcgaccttt aaatatggag gttttgattt acttttacgg agaccccaga 180
taatgacacg gtggatcctg tcccttaata atattctttg agtttggcag tggaacaaca 240
cttgttgtca gtgttagtct aaacagggct gctcgagcta gctcgagcat cgtgcggacg 300
agacagcagg aggggaaggc cccacagcgt cttcacatga tactgaggat gttgaggtcc 360
caacacaacc ttagtcctta gtcagctctt ttcatagtat gaatacgttc gtgtcccttc 420
tcggaattta aatatgacct tttagattaa cttgcactga gaccccagat aatgacacgg 480
tggaccctat cccttaataa tattctttga gtttggcagt ggaacaacac ttgttgtcag 540
cggacgagac agcatagatg ctcgagctag ctcgagctac gctgctgtcc gtcctgttcc 600
aaacaaaggc ttagaatatt tattacatgt caagaactgt tagagacgag ttctaacgag 660
tccacccttc tgattctttg aactccattc atttttacga gtgtgaaggt gaaggtgaaa 720
cttttatttc aagaatctct ttcttctact ccaccacatg gtgacacgga cgacctaatc 780
cgtgcccgtt ctcaacccgt ttttttagtt ccattttggt cccggaacaa agcttatcat 840
tacagtgctg tccgtcctgt actacgctcg agctagctcg agcaatttgc agtccgcagt 900
gatccaaatc aggctttgga gcacctgatc ttataacaga gttgttttag gcgtcgagct 960
gcgtcgtacc cattctgttc gttgtttcac ctccgttctt tcttaagagt ttgagagtga 1020
agttaggaat ggtagttcag gcatctcttt cttctgtacc ggcaaatgat gacacgacgc 1080
accctaatta tggtgaccaa ccaagttcta ttttgctgaa gggactaagc tcatagtaac 1140
ttcacgcagt ccgcagtgat ctaccgctcg agctagctcg agcggcatgc ggtgcaacgt 1200
ttaccaggtc cctgaggcac tccaccagct ccggtacagg ttcaacctac acgtcaccct 1260
aaggtaggac tttcgtctat tttagtatcg gttcctaccg tcgtcgagat agaaccgtca 1320
tgacttcaac ctctgtccgt agctcccgta cttgatgacg tgttggaccc gggactatca 1380
tcactaacct agttctgctt tgcaaaaggg actaggctca tagtaacttc ggcggtgcaa 1440
cgtttatcga tgctcgagct agctcgagct gagcagtaat tgcaccccac caaatcaggc 1500
tttggagcac ctgatcttat aacagagttg ttttaggcgt cgagctgcgt cgtacccatt 1560
ctgttcgttg tttcacctcc gttctttctt aagagtttga gagtgaagtt aggaatggta 1620
gttcaggcat ctctttcttc tgtaccggca aatgatgaca cgacgcaccc taatcttaat 1680
aatattcttt gagtttggca gtggaacaac acttgttgtc aagtaattgc accccactta 1740
ggctcgagct agctcgagca atccgcagca gtgttactag gaggggaagg ccccacagca 1800
tcttcacatg atactgtaga cgttgaggtc cctatacaac cttagtcctc agtcagtcct 1860
ttcgtactat gaataccttc atcttcctat tcgaccttta aatatggagg ttttgattta 1920
cttttacgga gaccccagat aatgacacgg tggatcctgt cccttaataa tattctttga 1980
gtttggcagt ggaacaacac ttgttgtcag cagcagtgtt actatctacg ctcgagctag 2040
ctcgagcctc tagtggattg ggctttctga agtcatacag ttcctggtgt ccataagtat 2100
actgccgtga cagtctttcc ttaggccgta aggcagtccg tttaaactcc acctatccta 2160
tggactttgc agatgtaggt gagagtggta agtgttacat ctctttgtcc tgtatcgatg 2220
gatgatgaca cggaacaccc tccaccccgt tctcaacccg tttttttagt tccattttgg 2280
tcccggaaca aagcttatca ttacaggtgg attgggcttt ccgtgcgctc gagctagctc 2340
gagcatgctt accacttggt gagtggaggg gaaggcccca cagtgtcttc acatgatact 2400
tgggatgatg aggtcccaac acgaccttag tccttagtga ggtcctttca tactgtgacc 2460
ttcgtgttcc tcgttaacct taaactctga cgttttagat taatttttac taagacccaa 2520
gataatgaca cggtggaccc tgtcctatgg tgaccaacca agttctattt tgctgaaggg 2580
actaagctca tagtaacttc actaccactt ggtgagtcat gagctcgagc tagctcgagc 2640
gggctagatt tgcggtggaa ctgaatctaa attatgagcc atctgacatt atagtgaagt 2700
tattgttcgg ggtcaagctc aaacgaatcc actctttttg ttctttgaac tccgttcttg 2760
tttaaaagtt tacagatgaa gtcagaaatg gtatttgaag tatcctttcc ttctactccg 2820
gtaaatgatg acgtgacgaa tcctggtatc atcactaacc tagttctgct ttgcaaaagg 2880
gactaggctc atagtaactt cgagatttgc ggtggaaagt ag 2922
<210> 206
<211> 2939
<212> DNA
<213> Artificial Sequence
<220>
<223> TCRG 4
<400> 206
caggaagccg ggtcgtcaca tccaaacaaa ggcttagaat atttattaca tgtcaagaac 60
tgttagagac gagttctaac gagtccaccc ttctgattct ttgaactcca ttcattttta 120
cgagtgtgaa ggtgaaggtg aaacttttat ttcaagaatc tctttcttct actccaccac 180
atggtgacac ggacgaccta atccgtgctt aataatattc tttgagtttg gcagtggaac 240
aacacttgtt gtcaagccgg gtcgtcacac tatagctcga gctagctcga gcgtcccgtt 300
gtccgtaatt ggccaggtcc ctgaggcact ccaccagctc cggtacaggt tcaacctaca 360
cgtcacccta aggtaggact ttcgtctatt ttagtatcgg ttcctaccgt cgtcgagata 420
gaaccgtcat gacttcaacc tctgtccgta gctcccgtac ttgatgacgt gttggacccg 480
ggaccttaat aatattcttt gagtttggca gtggaacaac acttgttgtc agttgtccgt 540
aattggattt cgctcgagct agctcgagct taatagttga agtgccttcc tgaatctaaa 600
ttatgagcca tctgacatta tagtgaagtt attgttcggg gtcaagctca aacgaatcca 660
ctctttttgt tctttgaact ccgttcttgt ttaaaagttt acagatgaag tcagaaatgg 720
tatttgaagt atcctttcct tctactccgg taaatgatga cgtgacgaat cctggcccgt 780
tctcaacccg tttttttagt tccattttgg tcccggaaca aagcttatca ttacagagtt 840
gaagtgcctt ccgcccgctc gagctagctc gagcgccaaa taatagctac gcagtgaagt 900
catacagttc ctggtgtcca taagtatact gccgtgacag tctttcctta ggccgtaagg 960
cagtccgttt aaactccacc tatcctatgg actttgcaga tgtaggtgag agtggtaagt 1020
gttacatctc tttgtcctgt atcgatggat gatgacacgg aacaccctcc actatggtga 1080
ccaaccaagt tctattttgc tgaagggact aagctcatag taacttcaca taatagctac 1140
gcagggtccg ctcgagctag ctcgagcact ggataacctt atgccgggga ggggaaggcc 1200
ccacagcgtc ttcacatgat actgaggatg ttgaggtccc aacacaacct tagtccttag 1260
tcagctcttt tcatagtatg aatacgttcg tgtcccttct cggaatttaa atatgacctt 1320
ttagattaac ttgcactgag accccagata atgacacggt ggaccctatc ctatcatcac 1380
taacctagtt ctgctttgca aaagggacta ggctcatagt aacttcgata accttatgcc 1440
ggcgtttgct cgagctagct cgagcgataa tgcatttctt acgccccagg tccctgaggc 1500
actccaccag ctccggtaca ggttcaacct acacgtcacc ctaaggtagg actttcgtct 1560
attttagtat cggttcctac cgtcgtcgag atagaaccgt catgacttca acctctgtcc 1620
gtagctcccg tacttgatga cgtgttggac ccgggacctt aataatattc tttgagtttg 1680
gcagtggaac aacacttgtt gtcatgcatt tcttacgcct agatgctcga gctagctcga 1740
gcagggttct gaagtgtgta attccaaaca aaggcttaga atatttatta catgtcaaga 1800
actgttagag acgagttcta acgagtccac ccttctgatt ctttgaactc cattcatttt 1860
tacgagtgtg aaggtgaagg tgaaactttt atttcaagaa tctctttctt ctactccacc 1920
acatggtgac acggacgacc taatccgtgc ttaataatat tctttgagtt tggcagtgga 1980
acaacacttg ttgtcatctg aagtgtgtaa tgacttgctc gagctagctc gagctgtacc 2040
taccctatac gcatggaggg gaaggcccca cagcgtcttc acatgatact gaggatgttg 2100
aggtcccaac acaaccttag tccttagtca gctcttttca tagtatgaat acgttcgtgt 2160
cccttctcgg aatttaaata tgacctttta gattaacttg cactgagacc ccagataatg 2220
acacggtgga ccctatcccc cgttctcaac ccgttttttt agttccattt tggtcccgga 2280
acaaagctta tcattacagc taccctatac gcatgtctcg ctcgagctag ctcgagcaat 2340
agccctctgg cttcgccgga ggggaaggcc ccacagcatc ttcacatgat actgtagacg 2400
ttgaggtccc tatacaacct tagtcctcag tcagtccttt cgtactatga ataccttcat 2460
cttcctattc gacctttaaa tatggaggtt ttgatttact tttacggaga ccccagataa 2520
tgacacggtg gatcctgtcc tatggtgacc aaccaagttc tattttgctg aagggactaa 2580
gctcatagta acttcacccc tctggcttcg cccattagct cgagctagct cgagcgtccg 2640
ggatcgagac gacttggagg ggaaggcccc acagtgtctt cacatgatac ttgggatgat 2700
gaggtcccaa cacgacctta gtccttagtg aggtcctttc atactgtgac cttcgtgttc 2760
ctcgttaacc ttaaactctg acgttttaga ttaattttta ctaagaccca agataatgac 2820
acggtggacc ctgtcctatc atcactaacc tagttctgct ttgcaaaagg gactaggctc 2880
atagtaactt cgggatcgag acgacttacc tgccgtgttg gtccgtaggc acgaagagc 2939
<210> 207
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 1
<400> 207
gtgcctattg ctactaaaaa gtttaatact acctactagc caactctctt gctagaaaaa 60
caaagcgcta ttcgattcat gtagttgccc ggtaaatagt aggttcatgt gaaacaatgc 120
cttgcttatt atggacgttt cgatttcagc catacattaa accataaacg gcgcctatct 180
aaccggattg tttctgctta cctagtttgg acgtagttaa ggactatatc acgcaatggt 240
ttctataagg ttgtgtcgcc cgggagacac ttttaattcc aggcttccgg cattgagaag 300
gacgtctaca gtcgccagtg gcagtactat tgctattcac ttacatgacg tgttagctga 360
ttgataggta aagatgccca gaaatgtaat actgaactcc ctagagaaat agccgacctg 420
aataactgca tatctcgata ttgggtctat catcgtacga ccaattcggt acttgctgta 480
tacccatgcc aagactatcg ttcagtatag aagcgctgca acctcgaagt tcctcggtca 540
cggtaaaaag ttatgtcagt ccgctgagcg gtagaggata ttatttatta agtcgtgatt 600
tagggataac agggtaat 618
<210> 208
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 2
<400> 208
gcaatgcaag gaagtgatgg cggaaatagc gttagatgta tgtgtagcgg tccctagagt 60
tagtaattta agtcagtatg tttgtggctt tccgtaggcg atttgagtgg ccctgacgat 120
ctccccgact gtagtcgttc tctgtcaaga tcaacagata caacgataaa gggtccggaa 180
taggggccgg cagtaatgaa ctctgctcta gcttgtagat ctacctaact aattatttaa 240
aagttagcat tcagaaacaa tagcggatat tcttgttaac aacaagcggc aaaacttgag 300
aacagccaga tttagagtaa acggaaaaga cttgagggtc aaagtggcgg acagtttttt 360
tcggttgcct ttatttatgg ataccagtgg caattaaggt atccactaaa atcatattag 420
tggtttctta cgtcatcatg caaatcagta aaaaagtttt gcagactttc ggtctggaaa 480
atcgccattt tcagacaatc tgttaactaa cgcaagtctg ttcgcgctgc ttaagctata 540
atcatgttga gaacaaaaaa gcatcaattt attataatag ggtgataatg cttagcgtta 600
tagggataac agggtaat 618
<210> 209
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 3
<400> 209
gtaatgggta taatcaatta tgttttggcg aatttccact ataaggctat aattgcatga 60
ttgttccggc tgccactctg ataatagggg cctaagttat cttctatata ttatccaatc 120
tgctaatgct caaaagaaat tagatcaagt gtatgaccga gttggccaac tcaatgatac 180
acgttggaca gctataggtg catgtcaatg aatgaatcgg agtggtattg cccggttgta 240
ctgatgtgac tctgtaatgt agtaatagtc aaatctgata gtttacgtta accttcccgc 300
caggggactc taaccaactg ttcccatggg aattgtcagc aaagagtatt gaggtagtca 360
gcagagcccg atgtataatc atggcagcat tgctgcaata ctccgctttt ttacattagc 420
tgaagtatta ataacctggg cttagatgag gatttcttac tcgggaactt atgacgagca 480
cgagggaaaa accgtaagca ttccgttagc tataagggct ataaaacaca ttactgtgta 540
gaaggataac tttgtcatca cgataagcgc cgcttgatca gacatactta caacagtttg 600
tagggataac agggtaat 618
<210> 210
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 4
<400> 210
tcctaaactc caccaggagt tttgttgcta ccagttacgc ctttattgaa aagaaaatat 60
atggttctct actgattaaa gagagtcacg gatgattata tctccatata ggacaagtaa 120
tgaagcacta aaagaggtta aacaaatata aactctatgg tagatcagcg gactaccaag 180
ctatcatgag actttgtgca taagaatata caaccaaacg tcttaacgta ttggtcctca 240
ctcattaatt cttagtataa tatctgaccc gggaaatttt aattttaact acggtactaa 300
tgttcgatga acacaataag aagtgaagta ataattcctg ataagtagta gcattaatgc 360
tggatgtcga gtacactacc tataaggcat gtgaagttcg cacatctgga caatccatgg 420
agtaacgaac gcgtctacta gggtaactat tgctaaagat gtgaaacggt cctgtttcct 480
attgagcagc gcgatactca tatcttaagc cacctttatt ttattatggg cactgtaagt 540
ctgtacctgt attatgtttg taagcggtcg aaaccgtgaa atacctggta cacacgttgc 600
tagggataac agggtaat 618
<210> 211
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 5
<400> 211
ccacgggctc cttgccatcg gtcgcgatac ctcagatagc atatgcgacc ctgaacatag 60
tgcgatggcg caacgtattg gatggtaatc acggttcttg aaacatatgt gtggggattc 120
tcagaactgc ttatccgtaa tcgacggatc taaatttcct gctgacgaca gtactcttaa 180
aaatctacgg gagttcggta ttatgaagag agctggtgac gacacgacgc agtaggacaa 240
actccttata agttctgtct gcaaattgtg atagatgggg tgcttgcttg atccttctac 300
aattagattc actctcgaat ccgtgaataa ttaaaagcac ttagcgacag tcacgaagat 360
aaatcactct tgacaacaac caactatgat tgtaactccg gtttggacag tcttagggtc 420
aataaagact gctttaaaca cgaccttcgg ggatgtatta tataacgatg acaccaccac 480
cgcttatgtg gtgaaggatt gtagagagtg tattgcgatg ttaccggatc ttacgttcct 540
tgcagtcatt ttaacaagcg gacatagaga ttcccgtcac tacgagacaa gacccgcgag 600
tagggataac agggtaat 618
<210> 212
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 6
<400> 212
tgtcacttac ctcgtttata aaattcccat cctacgtact ctaactgcgg gtctttcgta 60
tattgcgacc ctataatact aggcgggtct aaatcggacc ttaaccagtg cagttgatcc 120
cgccaattag gtgaggatta ttattatgtt aactaacatc ccctcacatt ctagtcgcgg 180
ataattattg aggattacca agataatgta tatcgtcctt gtttattaac gattaagatt 240
ttttatactc tttgatcaca aaaactcctt gcatggacac tttcttaagc gcgttattaa 300
aatcctcatc taattgttgg gcgacactcc atcgtctatt tgtggcttct gtaatcgacg 360
gcgtacgcat ttgaacatat aacattcttt aaaggagtgt aaaataacac acgagactgt 420
tgcgtactac ctaattatgt aacttgtggt taggagtatg ccgaaccaaa cgccttaact 480
aattagctat caaaacataa ctatatattg tggccctgaa gattggaaga atgagtcgaa 540
atgttaaatt aaaacctttt atactttact ctccccgcct tgtatcgttt agacattttc 600
tagggataac agggtaat 618
<210> 213
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 7
<400> 213
attaaactta aactctttta cgttgtctta catatgtcga gcttatgcat tattgaattg 60
tgcacgtctg tagttattta agcctacctc ataacatctt acaaagtaga tgggagtaac 120
gcattcacac tcttgcagat atatctctaa gtcaaaggtt gccgtcagtt ggttttcgga 180
gctttcagat gatattaaaa acacatagaa ttagatcctg ttctgtatgc tgctttaaag 240
cagtaggctg tttagtaatc aaaatagact tagtatgatg cggtaatgtt ttattgtaaa 300
tacaagggat accataccaa ggttctattt acgatcttct gtcacccaat gaatagtttg 360
aggtcttgat taaataggag gataaagata tttccccaag gacgcggtgc tgttcaagag 420
acagcctaca aagaaaaaat ttgcacagaa gcagattcag agcaattcta aaagacatgt 480
cgcctgaatt aaagtagaat ctccgaaaag ctatcccaat accattaaaa catcatgtaa 540
caggtcacct ttcggttgcg gggcagctat ggtggccacc aacacagtat cgcttgtgca 600
tagggataac agggtaat 618
<210> 214
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 8
<400> 214
aaatttgaac cgttcgcact tttgagaaag tcgggggctc tgtgtttaga cctaatattt 60
ttgcaaacgg aagttgaaat tattgctgtt actccggaca tagtctgagt aatttacata 120
tagggtgatc cagtaactcg tagttctcca agagtcggtc aaggcgggaa ttagggtact 180
gggccaaagg cgaaagttta tgctaaaata agcccaatga cggcagttgc aaacctccag 240
caaacagatt ccttaggcta cacaagaatt gggagtgcca aacttaggaa tatttaattc 300
tgaatcatta tagtgaataa taagtatgta tgagtatagt aacgatgtga aaacagtgat 360
gggccaactt acacaagtat aatgactctg ctcgtttaag agataccact tatttaagat 420
actagtagaa ctttagcgag gcttagtaag atatatatat taatctaact agagggtccg 480
catttcctag ccatcccttg caaaatgtga tttggagcgt cgcaaaactg ccatgtttct 540
aacggagcgc actatatagg attagtctac ttctagggat atggacggta aatttcgtcc 600
tagggataac agggtaat 618
<210> 215
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 9
<400> 215
cattcgacaa tgttccaagg ttttccgcat gatgccaatg tcaagaatcg agcgtacggc 60
atacttagat tcgatcgtac gcatctttaa ggtcgcctat ttagttaata ttctgcactg 120
acagttgggt tcgctagtgt aggcgatata actaaccgcg gttaaagacg ttaaactttt 180
gaggagagct ggacgcattg aatttatcac attccgaaac ttggaagggt tattgcacac 240
tgcgacacaa accatcacag ttgtacaaac tccttccgta aaatttttac ctttctcaac 300
atgtcacgcg gagataccta ccttcctcac agtatctcgg gagggattta tgcgacgatg 360
cagcgcatca agggtaagat accacatatc taatatatca ataatgtaga taccctagat 420
aactgcaagg ggtgtattgt gtctggaatt ttttggcgtg gatatatgct ataggcggcg 480
ttaagtaagg aaagtattct tcgatatgtg gattgtaacg ctatctttcg acgaactaaa 540
gcatcacgtc actgtccata gctaagagtc cattatagtt tgttaccgca tgttaagcat 600
tagggataac agggtaat 618
<210> 216
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 10
<400> 216
gggacgtttc aataaagcta tgatttttca cttcacaata caatgcgtta ttataagtta 60
atctgacgct tcggggccta agatctatga acttttaatt agatattggg acggaacgaa 120
ctgcatgtac atttaacaat gttatgggtc aagcagcgaa tctcaatatt acagttaatg 180
tgaacggata aagaggtcca ccatccagta ggaaggagtc cgatatgttt gggccaatgt 240
tgatgggcgc acaaacttac gatcgatttt tttaataaaa gtacttcata atccccttca 300
atgtggcggt ctatcgagga ctttatggtc caatggtaga taggttgtgt tccgtcctcc 360
tgatgaggag tgcgtcaatc ctgcattctc tgcatacgga tttcaatgtg gggtgagcca 420
tcccaaagca gtgttactag aacgtaaaac ctcgcttaca cccatttgga cccctgcttc 480
gcccccacca aattgtttgc agagtcagtt aacactctac gcatagatgt ctcattgctt 540
aaagccagta agcataacta tagatcctct tccatcgcaa gtttacatat atactagaga 600
tagggataac agggtaat 618
<210> 217
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 11
<400> 217
atgctcgaaa aaaccttgta gttcaatcgg aaaaagatgt ggctaaaata ccttcattgt 60
gactttaggg aacaactctt acacgatcct gtaatgcagc catcagaacg tgactcgcgg 120
cacgccgcaa gaccagaata tataccagta gcacggatac acacacgaga aataaggacg 180
agttattagt attaccctca atatatgcag ggactcatac ctaagatcca gatatcgcgc 240
tgttatgcgt cggcggaccg ttgttatacc taatagctgg ctacgtatcc ctcggtcaac 300
gttacttgct tcaaagaacc ataataagga caagacctat aatgtgagcc gagcatctca 360
attcgtttga tagctctagg tatttcttta atgagccggc gtcttgaagt cactaaaagg 420
gaccgctgag gaacctatgt gccctttcat attcataatg acataatcat ttcaagatca 480
attgttattg tacatataac tttttgtgtg aagaatgtag agtaaaatta atgtaataga 540
aaagtactat tagtgagttt cctctgatac atggtttccg ttctctgtat accaatatcc 600
tagggataac agggtaat 618
<210> 218
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 12
<400> 218
ctaataggcg atgcaccgat attagagttg ttaggacgac gttgagtttt ttatctcacg 60
tacacctaca gatcgtattt ctaataatga ccccttaaaa actataagct aacttgtgca 120
ggagggacat cttttacgta catatagcag tgttaggcgc ccaacacata tcgatcctgt 180
ttccgtaaag tcactacatg gtcggtatag gactagcctt ccatgatcag tataacatta 240
ccacttatat atcatgcgtc aatctgtgga acaaatataa ttagtctcac aaccacccac 300
agaacgtaaa tcaataaggt tacagatttc cacccttttt tttatattaa ccctacaagt 360
ttaattctac cctagagagg taaatgagtt tacaattttt tgtgacatag tcacggtaga 420
gttcgtcgca tttcttcatg attaagacgt tatcgattat acgaggtggt gagattgcca 480
aattcacgtc ccacgcccgg atataattat gaatctccct gtctaagcgc cgtccctcat 540
aaatatttcg atatccttgc ttcgccaaga tatgatagta agaacactgt tatggttacc 600
tagggataac agggtaat 618
<210> 219
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 13
<400> 219
ctacctgttt atctttacaa ccgctttccc acataccgat actccaaact aattgtgact 60
agacgagtgt gagttcttag atataacgtt aactagttac tgaagataag cgcctgaact 120
ttagacgcca acatgtcctc atatagttac acggattaca agatacgatg gcatagcgca 180
tctgtagata aacctctttc cgcgctgtat tgcatgtcaa atcaaggtaa catgcactac 240
gtgatgtgtg cgtttcttat tactaatggg aacgcgacaa ctgaactatg catttggttt 300
atttagcata tcaaaagcat ggatcacatt gtctgcaaac caccctgatg acctggtagg 360
tgataatcaa tttattgtct acgctgatcc gccaattgga tgaagagtga gatcttcagc 420
gaggcagctt gaggtgaacg taacacatat atgcttctcg tgattgttaa ttatgagcct 480
atgtgctccc tacaaggata tttatatcaa atggtacttg tttatataag aagcgaacta 540
gctattgcaa gattaatgta acataggcac gtcgtatcaa ctgatttgga ggcggctttc 600
tagggataac agggtaat 618
<210> 220
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 14
<400> 220
ttttatggta tcgtgatatc aatgtcgcgt atcatggtcg tttcagcatc tcactactag 60
cattaattct tcattattta ggtcgcctta tgacattcag cgaaccatta tacctaaggt 120
tagctatagc gacggatagc actcattcga cttgtacaaa gctaccttgc tagtgggggt 180
atcgtagcaa ggaggacttg ctgtagttcg ccatcgttac cttggtagct ggttcgcgtt 240
ttaatgtaac ttccagcatt tttaatacag aatccgagac tctctataat gattagggac 300
gaaagtatta gagtacctgg cctgaattgt tttgtggcat gatatcgtat tcagtcatct 360
agtaaatagg cgggattgac aaaatccaaa gagattgaca ttaataatat cagaactact 420
gtcaccactt acttacaagc aggactaatt acagttccta aagcctcgcg attcagacat 480
tgcacgaatt taagcacaaa ctggtacagt ataaaaacct atctcataaa cgatttcgtg 540
ttttgatttc ggacattgac tgagtcaagc aatacggcta agaactcgca atataaatga 600
tagggataac agggtaat 618
<210> 221
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 15
<400> 221
catttccgtt taaacgttaa cagccgaccc aatatgctat catgcttctc ttataagttc 60
cgtatcaagt catataaaat cataacttca tcctaaccag gtaatctctc acttcgtact 120
taagttagca agttaaccta gcatggctaa gtcccggacc gcacttttat ctaaaaattc 180
gtgtgaggaa gatagtaacg tgctggatat acttatgggc ctggtataga taagttttat 240
actaccttgt acacacagaa atttgaataa aacagcgtag acaacgacta ggctaaaagc 300
ccaagttgac gagaaatttt tcagtatgag ggccattcga attttcatag aaaggaatcc 360
ttgccgtgat agttcatatt tcaagtaatt aatgcccttt tataggggtg cctatacgga 420
gtagtgaaaa gttcctaaac aacgggatga ctgtcgtaaa ttttgtaaga ggtctatcga 480
taagtaccac ctaagcacat aaaagttggg actggactga gatatagcgc gaaattgaat 540
aattttgaca gatgcttcca cagctatcat catcacgact ttgattataa tatttgtcca 600
tagggataac agggtaat 618
<210> 222
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 16
<400> 222
gttctagctt tgatggtatc aattcttggg ctacgtgaga gccccgtcat ttcactaaac 60
aggtatctct attatgatac acaagcccgt ttccgcacgc atacggttca tgtcagattt 120
ttaaattagg tatatgtcgt ccctctcgaa tgatgggcta gataacacta gtgcctttct 180
gaaacgatat ttaagtgacc acatgcaagt caaactaccc tttgtcaaac tcctccagat 240
caaaagactt caatagcgtg gatataccct acactgactg cggttaatga actcatcgcg 300
tatatatcaa ttcctctaca tttcgtaggc gaatcttagc cctaattcgc tatttacggg 360
caaatacaaa taaagggtga caggtttcgc atgtatacat ctagcaatga atcgataatt 420
aggtcatcct tctatctgta ttctaggata cctacgttgg agtaagggtt atcgcgtact 480
agtgcataga tagatgcgtt aaggtagaag tcttgtcagc aattggttta ctgtagacta 540
aacaatagat gcggaattta tagtctgttg accgtttcgt tacaactgtc agtcagccgg 600
tagggataac agggtaat 618
<210> 223
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 17
<400> 223
cgataatttg gggatgcatg aaaagagaat gcccggcatc atgtagtaac tccgccgtca 60
cattttagac caattactct attgtattct aacgcgtact ctttgttttg aatatgatga 120
aaaaaggcat atttattgca aactatttaa gtcatacctc aataagaata tgtgttgtct 180
acatttatag cggtccagag cgatgaccaa atcgctttaa atcctgacga gtcaaaataa 240
tcaccccgtc ataggggttt gatggtgtag taacgctaga caataagccc ttctaaacat 300
acgatcgtaa cgtttttaac agaggtccta cgacgttata atatgtcaaa accttcacct 360
atatcattct cagaccaatt ggtatcgtgt aggtattatg aagtagtcgt gataatctta 420
atttaacaaa cattgacgga aacatgtgag ggtagtctcc acaactctct accataagtc 480
tatttcttaa gtatgtgtag ttgaacaagc catgttgccc agaatcgaat cgaacgattg 540
ggacgctaag aatcagacaa taaggagctg cactgaatta tgaaagttgt cctattcata 600
tagggataac agggtaat 618
<210> 224
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 18
<400> 224
tgatacctat tagtcgattt atcggtgtag ttatatccca ttggcgtaaa tattttcggg 60
gatatctgtc taagaccgaa accgactaaa aatggtttgc gagctttacc acttaaaccg 120
actgtatgtt tagttacact tctgcttaat gtcactagat aaaactcttt atcggcaagt 180
gcgatcagag ctggataata caatgagagt gtctactctt acacatgaca ttcgttttgg 240
gcatagtacc aactcaattt acggtacgtg tttgcggtag acaatcccaa aagatataat 300
tttaattttg ttcacattcc ttataactaa ctatttggcg atactttagt aatttctgat 360
cgttaggaca atggaagaat cagactacga atattgcttc tggtaattta aggggagtcg 420
tggtctatgt gctcgcctta gttaatatta gtttttggag caagctagcg tatcacctga 480
acaggtaggt catcagtaat ttcatacgct gaatgtggcg agtacttcag caacaaacca 540
acttctacgc tataacgata ttctgcttct gtgtgtttgg gcagacactt taaggactca 600
tagggataac agggtaat 618
<210> 225
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 19
<400> 225
aacgtaaagg tcttttaatt tgtatcacga ctaaaagttt gtcatgaggc agacttaagt 60
ggttacactt atgcgactgc tggctcaaac cgattgttgt caactatcga caccttttat 120
taggcactct tagagcgtaa gggaactcct aattcacttt gtttagaggt tttacatcag 180
tactttggag cgtttagata ttcgtgaagg tgattcaatc cttcatttca tgctaacatg 240
ctaaataaac tagaactcat ttactcaatg atttatatca aagctccttg agcagtacat 300
gtagctcaac acctgggacg atctatggaa gaggtcgatg tcaggagata cttacgctta 360
agatgttcag aataatgaag gagcttgtcc taatgtatat cgcgcagccg gaggcggctc 420
ataagccaat ctcctgtatt cagggttggc aaggagcttt ctgttgcctg acactttgct 480
aaactttgac ttatatctgg tatggctttt gaaaagtggc ctatttaacc ggtccccagt 540
ttgaacttta accacagact gttcacggtt aaattagaat ttgggccaca cggatgacat 600
tagggataac agggtaat 618
<210> 226
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 20
<400> 226
tgatctcgcc aagtcgcata aaactttgta atgggcacag aacatactgc aattctacat 60
ataatactgt atatcctcaa ttaatgacct ctgacttcat cgcgaagtta tttgtaggga 120
attatcagcc ttttaattaa gggcacgcga tttcatttta gcgtcggcat cgatatcctc 180
atggcaactc tgctggtggc aactttacat taacatttgt cagctaagaa cttataaaac 240
ggagtcggat tcgttaggaa cagaacctta ctttacagca cgaagctagt ctttatcggt 300
acgagtacat gtgagacaat ctatcattgg gtctttgaat catcacgttt acgtaacaac 360
attagagagt ccaccgtcaa tgatggggtg gttagtaatc gtacttcaat tatccgttgg 420
ttatagagtt aagagatact gttttcaatt tggccttctc aggagtatga cgttgcgcca 480
agcagtgtgg cgtactatca atctgtgaat aaaccctatg tctgttatct attgactgga 540
gactgtgtaa attacaattg gaatattggc gctttaccac taacgagaat ggctaatact 600
tagggataac agggtaat 618
<210> 227
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 21
<400> 227
tgtttatagt tgaggaatgc caagagctgt gacttcgtat aggcatggca taaattaatc 60
ggctcaattc tagcccgtga tcactatcgc ctagttcact ttcgacttgt aatatcattg 120
gtaaagacgt tttgactgca tgacgcatga ataccaggga tcagatttcg caaactgcaa 180
cttatgctat tttaagagtc agctcaacat ccgcatgtac tcttacgaaa cctaagggtt 240
caatacggac aatcggtcta gtcacaacct ttgccgggtt gcgacattat atctcttaac 300
atacgcctat tttcgaaatt aaacggagta tggtgcattg aaatatctta cgcacaggac 360
cgcggtgcat gattacggtg aggatgtttt cgcctaaacg tcagtcttag cagctgaaac 420
tcgggtgcgc cttagtcata ggtgctctta cgtgagagca gatactttta aatcctattt 480
ccggtccccg tggcgattcc atgagccatg attatagcgt atttccttta aggctaatac 540
cgcaatgata ccttgaaaca atgggcacta atcatcgcaa gtagcaacag taagtaaatc 600
tagggataac agggtaat 618
<210> 228
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 01
<400> 228
gctaaggcta tgtgggatct ccattctcca taagtctgtt tcctggcttg atccaggctg 60
tcaaccatcg agagcatgcc aacatgaaca cataggttag tacatcttcg tagttggatt 120
taaaatgcgg tggtaacatt agcgcacttc atacctgcaa taatccacga cgatcgtgaa 180
ccataacgtt actcaaatgg caccggtagt ataactggtt gccccctaac acagctgcaa 240
agatttacat attttcgtcc attgcattta acattaatct gtcatcatgc ttctagcgaa 300
attaacttga agcgccgacc ttcgattctt ttaggtgctc ttaaacatac cggttagcta 360
agtatgttct caacgagcac tatacaccca ccacatacat ggtagaaatt tctatggtaa 420
ttgaataggg ttgtactggg agcacgtgga gtgaaccagg ctctgatgca gttatttgaa 480
aagcataatt gggactgaca ttagttcaga tgccttggaa agtttatcca cggaacgcca 540
cgactaagga ccgtgccact acccctattc tgcgtttcat caaaatcctc agtgtcgagc 600
tagggataac agggtaat 618
<210> 229
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 02
<400> 229
atcccacagt caaggtcatg gcacataacg cagctaattg tttatctctg caacaatctc 60
ctttaagtta gacttatccg ggatataaag aatgacttta acctcccccc gggacgggaa 120
gcaataaaag gcgggttaaa acaaatgaag ggttactgtg aatctatatc aagaactcgt 180
attcatgttg acctcctagt atctcgtagg gatagagcat tacccggcta cggtctcatg 240
cacccgttcc ttaaatgcta acctgtgttt cgagatgcaa acatgctagt gtgcagccag 300
gtcttaggtt tctgaattac tggaccgttt cttctcttta aatcaataac cctaatcgag 360
tacgagtagt aacgacaggt tacttaatga gaaaacaatc gatgtcaaac atcaccttcg 420
attagttaac gtaaagagaa catacgatcg aatgcaggac gggataggct ggcttcgttt 480
cgtatgcaat ttccactaca cgttactata cgcactaaac acacaaagat gatctgagac 540
taaagtattg tgcttaaaac ctccagacaa acaatctaaa taacgcccta gtgaaagacc 600
tagggataac agggtaat 618
<210> 230
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 03
<400> 230
aactggactc atgattaagg tctcgaccct gctggcctca accttatttt attaagtttt 60
cgcgtgtaaa taggtcctga ctcttacata ctcatattcc tatatatagt gatggtggtc 120
acggacttca gcctccttta ataatcagag tcggagtaaa atcataaccc gctgtgttca 180
tctttaaagg cttaaagttt gtgtaggtgt gcggctaaag acatatgtgc atccatgaaa 240
cttatgaata ttgatttata atacggtgca aactttcgta gtgacgacat ctcttcatca 300
ttaagaggtc tctatggatc tccgagccag accaggataa ttaccatagg aaatcttgat 360
aatctctagg aactttccat agtagggaga gatatctacc agacgcatca taccatatag 420
ggtttcagat tattttcagc atgcactttg tcgttatact tcgtattttc gatcctcaca 480
atcgattcct cacagcagct taatatggga cgccgctata attctgtacg ttcacaagaa 540
attcgctaac gtagtaatga cgccctcgga aaagcaacat acgtagatga cggttctaag 600
tagggataac agggtaat 618
<210> 231
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 04
<400> 231
atgtaaaatc gagaagaagt cagttcttga gctgattatt acatatcact ggctgcatgc 60
agagcgaagc ccgatcgtcc ttgtgtcgca gattatacct tagggccgca aataaattac 120
aggttattag taaatatatt gagatgctgc ttcactgttt ataatgcgaa taacatgagc 180
gctaggattc ttcggccatt gttacatctg tccaggttgt cattcttaac caatttccta 240
tgctacatat atgtcatgag atataatgaa agacgtttta gtcacaccct tgaattgctc 300
ctctactgga taatagccac gttctcgcta acactcgcat tccaggcttc actctgtgga 360
gaatcggtac gaaagggtac gggcggtata taacatctat taatttacac gcggtcaaaa 420
cgtctgtgtt actctctatt agttttaaac actctcaaaa gcacttccct atgcgatata 480
cgcttaccgc gggagaaatg agcaacctag aacattaata ggaaaataca ccttctgagg 540
aaccaataag gttcgactta attaaacccg tgccgacgtt gtactataag ttatctcata 600
tagggataac agggtaat 618
<210> 232
<211> 560
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 05
<400> 232
ctttaatctt gaacttaaac acgaaatact acagaaagga atttcgcgaa catttccatg 60
tcaatatgca gaactgagct taagtgctgt cgagccccct tttttgcgtt gaacctgatt 120
ctaccatact tattttgttc gtgtaccaaa aaggtcccat actcatctcc tacttgcgtt 180
tcgattgcct tgctgatttt tagtgaatgt gggcgagtcg ggtcgagaat actgattgat 240
ttcagtagct tgttagcctg tggtcgctcc ttgaaggtcc aaccgcaact ttggggcaga 300
cgttatatta tatattttgc tattggatag gtgtctgttt catgtacaac ttaccgtaaa 360
tctatataat tctgtgaact tcgcgatatt gacattatga cgtcggctct gcattgccgg 420
aaggtgcaat gatgtattac cataatttac cgataataac caacccaacc ctacaaatgt 480
cttataagtg cggagtttaa cagcttgcct tgatggaccc ctctatgcag tatcaggaac 540
tcagaaatct tagccacatc 560
<210> 233
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 06
<400> 233
acgtaactaa tctattaagc gaactttaga aacgcggtaa caagtataga tgcatcttcg 60
aaccttaatc gaactgaaac aaacgaagta gaagttaggt ccgagttgaa atagcgcagt 120
cagtcccaaa cagaacattc aaggcaaagt agagcggtgc tggcaaagaa tcctaatact 180
acacacaatt ccatttaatg tagccagttc atgtctcggc gccactgaca gtacccacag 240
gtgtcactca agtatctatc acgcgtctca aaaacaatat atattaagat agactcactg 300
ttattagacg gattaactaa agtagggaac gagggttata tcacaaggta tctcattgaa 360
tgtaccatat atctctattg cagacatgaa tctgccggag cgacatcaaa atagtatatc 420
ctcccatttg agtgaatgac gtagcaagca cgtaaaccga ttttaaaatt cgtgctaatc 480
gatattaact ttagcggcga gtttgacgaa ggccgtcgat ccgtgtatta atacgcgagg 540
tgcagatgat tatatggtgc caaaacaaat atatcttttc attccgtttt ttaacttgat 600
tagggataac agggtaat 618
<210> 234
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 07
<400> 234
catctttgat ctccagagct tattgtagtt tactcttagt gaagtctggg acggtaactt 60
ataatggact agtgtaacga atagttataa cagacggtaa gtggtaagaa gaggtttaag 120
aaaccggttc tagtagcctt taatttgggt atctatagcg agcaataagc taggcacgat 180
cgcttaatca attgacaata tagtagccga aagattatga agtcatggta ttttgtgcat 240
ataatagtta ctaggactcc atgccaacta tgcaagctca caagcattag atttaagaac 300
acggatctat ggtactgccg cccatcttga gcctcttact acgcctaacc tttatttcac 360
tagtacaaaa tatgggagga agatacttat gccaagcatt cgttatagac aggtctttgc 420
gtcataacca atggctctgc gtgctgtctg ctcttttcaa ggcgtctcat cgatacactg 480
ctcatgaacc gcaggatagc gttatctctt cgaagttgac gcaatatagt gcaaagctat 540
cgacataggt ctatgttatg acactaccga cgacacggtt ttcagactgc gtgaagagga 600
tagggataac agggtaat 618
<210> 235
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 08
<400> 235
gagtcctcag agcatctgat gcattgcaat tgatatgtct aagagggtac aagtcaagtg 60
aatttaacgt cataccctat gaatgtaggt acgaataatt aataactaaa catttagggc 120
agcaggtcta tctgactcag tggcgataac agatcagacg acctaagttg actagtgaga 180
gccgtaaata aagggcagaa atcaagatta tttcaatttt agggaattag atgcataagg 240
cctccttgct tacggtaacg actacacgca cgtcagtcac aatctttata ggtcacgtgt 300
tactgagaag tggatcaaca tacaggtagc caatggggcg gtaaaggtcc ttttatgtct 360
tttggtgcca atattaccgt ctatataaat aagatataag atgcattcta ctcggagaca 420
aatacttaaa tccctcgaat ttagcattta taagtagatc taccaaataa tgaaaagccg 480
tccgcgagtc tgatgggttt aaggttatca atctgcgata caaggaggag atagggcact 540
cgttcgttct aattgactaa ttcaccctca ttaaattaaa ataagaatat atcatacggt 600
tagggataac agggtaat 618
<210> 236
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 09
<400> 236
acaatgacaa gatcgtgcaa ttgggtacgt atatcacgga tctgttgcac gaggtaaaat 60
agtactcctc ctctctgcgt cttatgaata ttaaacgtat cacagagaaa atacagtata 120
acattccaca ccctttgctt ttcaggctca gaatgtcaaa taaatttatt caaaattatt 180
gaacctttat gaacactact ggactcaaca ctctcaaaat attttgacca ggagagatat 240
gtacaggcta tgaaaactac ctttataacg ttaaggttcg gctcgggtgg agtaattgtg 300
aaaccacaat aatgaaatca tacatcttcg atactgatcg gatatttttt tatgaaaaag 360
aaaaccggtt acatctaaca tatgttttac tccacgccaa cataaacaca gaaagacctt 420
aattaggata atttctcggt ataacaatgt cagtggctga cgtcttatca tggaaaaggg 480
ggcttcatcg aacatcggtc tctaatcttc agatgttaac ttgattcgta tgagcggact 540
tttttttgta tctacaccta ctcaccttaa ataatctaaa gcgggagtga tatttaaagg 600
tagggataac agggtaat 618
<210> 237
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 10
<400> 237
atccagtttt ttgatgacac agatcggcat gtttgtcact tctgacttcg attaactgta 60
aatcccctaa caatatgtcg cttgggaaac tgtgcttaca atgaagaagt gcaatactgt 120
tgccggatca cgcgaaccac ataaaatcag ccgacgagaa tttggctaag tatagcataa 180
tggcgcgcaa aagcgagtcg gaacctaacc gttctattgt cgaggttgga gcgtaagcct 240
gtttccattt aaacattaaa tctgcatttc aaaaaatcat tatttaagat ccagcgtaaa 300
cgaaactaat agtagccatg atatggttca actggtaagg tacagggtgc tataccaatt 360
ccattgaggt tcatttcacc tagcacggct caaaatttag gttgggagta tcttatacaa 420
cgtttaattc caggcccatc aaacaccaat agtagaagac ttggtataaa tccgatcatc 480
gtcattcgaa ggctatttct cgggctgact gttgtatcct cccatttggc ttaactgagt 540
ggcaggctat agcagggttc taggtactct ctgataaaaa tacacactca cttgtccgcg 600
tagggataac agggtaat 618
<210> 238
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 011
<400> 238
gaactgatgt cgtttatgat cataaaagca gaatcagtca cgaaaaggtt agtagccctc 60
aaggcagttc cgtgctttgg ttttggatta tagggtataa gctggcttat taaagttcgt 120
gattcatgcc ctatcaggga agcatgtcaa ccgattcgaa cgggttatac gggcttcgaa 180
atatcaaggg gaatataccg aatacagagt catacttata gtgtgtggat ggtttgataa 240
cgacctcccc tgggatatca ggttgattga taggcgattt tagccagtat tgaaataaat 300
aacgatgata atgcatcaga ccgttctcgc tctggataca cgttgtcacc tttaagctgt 360
tatatatagt gagtctacaa tctatcccgc gactttacta ggtagtttgt ttagacatgc 420
tctggcctgc aaggagccac ttacatctcc aattctaggt attacatctt tgcgatcatg 480
taagacatcg tcggcaaatc aattagatag ctttatcacc gaccctttca tcgcgagatt 540
attatcccgc ttagataaag gatcagttag aaagcatttt acgcgacatc ccgtaggaat 600
tagggataac agggtaat 618
<210> 239
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 012
<400> 239
tgcccccttc ttctatatga aaactactga agtgactgtt agcatgttta gtggggtccc 60
cactgccgta gatatgttcc atgaccctct acatcctcca gtgaggaatt ttgctgggaa 120
ggaaatgttc gaaatccttc cagaactagt caagtcgcat gctattctgt gaaacagaaa 180
aactatccca gtaatgagac agtaaaagag taagatcggg cctgtagatc actggtatcg 240
tcgagcgata acgcattaat ttatgattcc cataataacc cgaactgcgc gcaatttgca 300
aatagatctg cttatgtagc cgcaagtcaa aaacagccat gcacattgtt taagaataat 360
cgtcccctat gatttgggaa attagctgat acttgaatct ctattaggcg gatctatacc 420
tgattttgta tcttaaggca tgatacgaaa ctatctggcc aacattaact ggacaaatta 480
tcaaaataac cgccattgtt gagtatcagt atgttacagg tactggcgaa gttgattgtt 540
ttttatctaa catcttgtca tgtttgatta gactcagtaa aaggtggtta gcagccttaa 600
tagggataac agggtaat 618
<210> 240
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 013
<400> 240
ccatgatcct atcatcagta cattctacgc taaatgtagt cgaataaatg ccttgataat 60
cagtgttaga gcaggatact gaacgtacac cgcgaataac aatttcccga gctgacagaa 120
gttgttccta aagttttaaa tgcagtgtat ctgggggtgt acatggcctt ggcggaacta 180
gagtagtgtc agtatatatt attgtccgct taaaataagc agttaccgat taatcgagct 240
aggtcaattt caagtactag gattaaaaac atcaattttg cagattacat ctcctatacc 300
ccctagcaaa gtctgttaca cgtataagtc ttggtagagt ctctcactga cttcaaatcc 360
tttcggctcg gtaatcattt gcgctcaata tgtaccgtcg gtcaactaac ctggcgctta 420
gaactgagca ccatggctat gtggacatag gaggaattta gtgttcgtta aaactgagca 480
atgaactgtg aatttagtta ttaaacccca cagctttaca gctagattat ggagatgata 540
gtaaaaagtt tacgtaagcg gtttatataa gcgaagacgt tagtaccaac ctatacttga 600
tagggataac agggtaat 618
<210> 241
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 014
<400> 241
aagctcgtgt agacgattat cttgtttaga cttcgtacat atgcaatgta ggtctcgaat 60
agtataggca tttgaactcc aactcccagg ctagttgttg atcgctttct ggatttttgg 120
gcttaatgtt tgggcactat aagatctaat tgattttttt agccgacatc aattgcttag 180
attatatcct ggatcgacag tttcctatcg atagactcct gaaattaata aacttcaatt 240
accttgccgt agaagctaca caagaatcgg tatcccatcc tcacgattat caacccttcg 300
gagatccttt agaagtttac accccgacgt tcccaccgga ccttacatag gggttttgcg 360
acgcatgttt aggttttgaa ggtaaatgac acataagcac gaaggcatag tcatgtatcg 420
aggtaaaagt acgaggtcaa gattcacttc ttaacgggcc ccggtatatc actgaatgga 480
taattcgacg aaattttccc ttgggagtac acgacagata agaatctacc tctactaaag 540
tgttaagttc ttccgtatat cggccggttg atttggagtc aaggattctt ctcttagtca 600
tagggataac agggtaat 618
<210> 242
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 015
<400> 242
cggattttag acgtggatgt atatcgtttt ccaagtatgt ttggtatact gtctgtccta 60
agagaacgga taggctgtac tgctttgatt acgtactata aatttatatg catattcgtg 120
ggcacctgtc tacgcgttaa cattccgtat acggttagtt gctacgaagg gctaaatggg 180
ttggagcttc agtataatac aaaaattcaa taacgctttc aggatttagc cgagcgcttt 240
gcaaaaaatg tcaagttttt aggcaatgcc agagtttcca accttcttac tatatatcat 300
acagtacatt cgggggtgtg agacttcgta cagtattgtt atttagtcct atttttccaa 360
attaactgtc gatctctata aacacagtgc catgaggaag aacacggatt atgaaactgg 420
cgagccagag caacttccag aaggcgcggc aagaacgctc gtcacgtcat atcggcgtaa 480
acgtttatag gcggtgcata acgacagaca cagggagtga agacatagat ggcatcggtg 540
ttaactgtaa agtgtgatta actattagtc catatagagc actcaaatca ttgtcagatg 600
tagggataac agggtaat 618
<210> 243
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 016
<400> 243
tatttaatcg caaggctatt atggttaaca atacgatacg ttacctcaca aatctcgtca 60
ttctcaggga ataatagaat acttgctcta aatggacagg catattactt acaatcttca 120
caatcctgtt taacaagcgc gtccctcact tatagttttc accatgaata atatccatct 180
caacagaaac ggatgattat tagcaacgcg ctatgtataa aacggtaaac gtacgatgtc 240
tctggcgagt atatagctat ttatgacgta tatgtattga tcaggttccc aaagacccct 300
tcaggagcaa ttggtttaat agattttaat aataaatcca gcaactttcg gctggggaac 360
actcccatgg cacaagtctt cataaaactt tattgacacg ttcaatccat agacctagtt 420
cgctcgatct tacgcagtga catagaatgc atggcacttt ctgtcagttt tcggcgatat 480
aatgggggtc gcctggcgtc ttagcactta ctcattaatg tgtgcctttg atcctctatc 540
gaaaggtgtg aaaaaagtcc ctttgagaac catggttatt ccaccgattc ccttatttca 600
tagggataac agggtaat 618
<210> 244
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 017
<400> 244
cttgggtgag tcggccatgt taggcgtgta ctgagtgcac aacatagcta gcaaacctcc 60
ggataccata gttggtaaaa agagaacttt caggtcacac taacatcgtt gaaaattacg 120
cactgaacag gtaggaattt gagctgctga tctgtgcaag aagtgtgcga gggcctctcg 180
ctacgatgac aaatgttact tgaattaatt tttatccgct tcctgcgtct gaacctttat 240
ataagaagat tgggagcata aggagcattg cgctaaaaac ttaaagccga aatcctaagt 300
tccaaatgaa tatcgttaaa accagcgaaa ctagaatgaa atactatcaa actgcgtatg 360
gtataatgac tcgtgggtct tttagcattg ctgttcaaag ttctttttgc acatattata 420
gaaaagtcat ggtctatctt ttgacactgg attgcggcta ctgttgcagc accgtatcca 480
cgtaaccgta ggctgtatcg gggaagccat gaaccgccag gaaacgacac accacaccaa 540
aggttttgca ggatgtcatg tcgagtcgtc tatgtatatg taacgtaaac tctaattgcg 600
tagggataac agggtaat 618
<210> 245
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 018
<400> 245
tcgagtcaaa ttatgactta atggatatgg tagtttataa tgtcgagtag tctgtacgtg 60
tacttgtaag tgactatgat ccaaaatgca tggattggtt gattaaccga ataaacaaag 120
gggtttctac ccttcgtagt tttgctatag accacttttg ggagtcccag atatatgccc 180
tgtagcaaaa tactcgcagt atacacttct caactgcgta acattggttg caagaagggg 240
aggtattctt gatcttacga actgcgagat gaaatgggga tggtagtcac caaaaccact 300
ccatcgtagg aaggtcttat atctccagtc caccatatgc catcgaatgt tcgagttgag 360
cggttgttgt aagtagatga taaataaaat tgcttcaaaa gccatgaccc acctggtttt 420
gatttccgtc tttccagtta ggtgtcaatc ccctcatgca acctatctga gatatagtag 480
cgccaatagg tcttgtctca gttgcttttg tgttatctat ataataaggc aagcaaagaa 540
acattggcgt ccgataaatc acggtccctc atatggttag ctacccctta caacctaatt 600
tagggataac agggtaat 618
<210> 246
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 019
<400> 246
tttatgtttt atgaactagt gggatctagt atatagccaa agagtagtgt acttctttag 60
aacgtattgt gacgaacgag ctggaggaca gtagttgcag tcatgaaaga aaaaactaca 120
gatcagtatg tctaacacaa gagtttcatc aaagcgcctg tacaggagtc gtttaattcc 180
gctgtaaata agattagcaa agttagacgg ggtgcggagg ttataccggt ggtattaagt 240
tgctataacc tatcgatgta cttatcatgg tcgaggactc ctacatggtt ttgcaaataa 300
tacactatgg ctttactact aaatgtttag agtccaattc tctttaataa ccacatagat 360
tctattttag tttcaaccat attatttcta tgaattgggg ggggctgcgg taattctagt 420
gaattacact gccaagatat tatgctgtaa aaatccgacc tagtcttaag tctcaagatt 480
cgtctcatgt ttataaattc actgggttta caacgaactc tatctgctct atacgaaagt 540
ttgagtaaat ctgtacatat tactacttgg gcttaaatat atttgattag tattaatgat 600
tagggataac agggtaat 618
<210> 247
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 020
<400> 247
atattccaga tagctgagac aattctatgt ttaagctgta tgcagatgta tcttttcaga 60
agaacatttc ccggttacca caatgttgcc taagctagcg ttaattctgg gggttaagct 120
gcgctcttac gcccccagtg attaaatgta ccacccttaa cgtataatat tgcgcaccgc 180
agaaatcatg ctaaaaactg tactggaggg ggcaaatttc tttaaattta aactttacat 240
aactcccaaa aagctacgta ccactctgga atagagtaca aacaggtttt aagatgaacc 300
tggacattat tacattagta acccaagcat tgcgcgcttt gcgtgccacg ttattaacag 360
cgtaatagga aagaagttgg gctataccaa tgttgtctgt tctgtttgag cacaaaagca 420
atcacttact cgttaggtcg ccacagcaaa gtatccggga gattgtttta gactacttgt 480
attaacttcc cacctaagct atatctagca ttactatcag tatccattat tatagaacat 540
atagcacgta cagacctctc gatcagaagt catttttgaa tctgccagcg ttaccttttg 600
tagggataac agggtaat 618
<210> 248
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> Conjoined 021
<400> 248
tagctataaa gtccgacgtc cgcggcgccc tcgtaatctt ttcactcata ccacgtgaat 60
tattatagtc ccatgaaaga acaaactacg ttaactagtg gcacaatgta aaagtccagc 120
agtcaatgac tgcttcgcat ggtagcgtga acgattatgt cattccatgc tcacatgcca 180
agttcaatag ccaataagcg acgaccgggc ctggtccaat gtattcatca ttgagttgga 240
ttgacgcagg agagtataat atatgtgaca cttgtttcat agtctggact attttgggat 300
acacacccca ccgtttcttc ggaaccgtaa gatctacaag agaccacgtt attaattctt 360
atttcatagt caagaggagc accccaattt acgcaaatct cgtgtttgtc ggaaattctg 420
ttccaagtga ggctccgatt aggttggcca tacatagagc caggtctact gagtaaatat 480
gtcatagcac atgagttgta taagatccta gcagcggtgc gcccaagcat tggccgttag 540
tgtacattat aatattcagc tacactatgc actataaact gtctgagaca aaagatgtgg 600
tagggataac agggtaat 618
<210> 249
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C1
<400> 249
aaacaaattg gcgtgtaagt acgcggtagg tcacatctct aaattagtcc aacagaagat 60
ccccaagtaa tggggagcgc cacaaaaacg tgcataaatt gtcagcgcga atactataga 120
tgtaaaccca gactacagag taaaggaaat agtatttgtg tatttctcaa acaaacgata 180
ttagcacttg taatgctgac gagggagcgc ttatattact tggtataact catcgatctc 240
aaatagaaca accatcccta tgttcaattt gattggagta tttaacatgt gagaaacaat 300
ggaaatctca agtctcagtg caactataaa gttatctgta catgacaatc gtagactact 360
ctaatatact gcttgtggcg aacaggaatt gccggaaaca tcttagtact gaaattgttc 420
ttctgtagtc tttatgggtg cggataatcg tacggaagcc ctgttagaag ggagcgctta 480
atatgaaatc taacggccgg gatcgactgt aggctttcac aagggctata attagtggca 540
actgcgtccc cgcctaggta caggtcctcc agattgagcc ccgttttagg acgatgatcc 600
tagggataac agggtaat 618
<210> 250
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C2
<400> 250
ttttcagcag tcaataatga atccgcaatg tacatttaca acgttacata gatttagact 60
tgagccgggg ggtaagtaaa ggttttatat tcagtctacg cttggttatc atagactaat 120
agtgcaatat ccagctgatc aaaacaagtt caatgagcaa ccctaccggt acatttactg 180
agaattgttt ctaactccct actgcaacca aaccatttgg tattgtttcc tcaagtaatc 240
gagtttattg aatgttgtgg acaattagcc acgcggaaat cttagtagtg tctacaaccc 300
tcatatgatt cagggagagt ccccgtggcg cagtgataag caatattgac aaatgtttca 360
acgaatttta tattacccga ggcaactgtt tacttccgcc tttagcaaac aagcgcttca 420
gttgtggtcc tagtgtggcc attgaaatta gcgcggaact gagcagtata catgttaaaa 480
gacgagttaa tgtcacgtat caacccttag atagaggtgt ttaacttatg gtgtgccatg 540
gagggattat taaaatccgc gtgaattttg tattgggacc attcgcggta gcatccaggc 600
tagggataac agggtaat 618
<210> 251
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C3
<400> 251
acgttagctg cattagcgta tggtgcccaa ctgtaaacag caatgaaatt agccaataat 60
atatctgggt ggcttggatt tcatgctccc aataaatcgt tttaatgccc atcattattg 120
aatatatctg ctagtatcaa aggtaataga tggtaattat attcaacatc actatcatgc 180
cccccgggca cgtctattgc aggacagctt gtaatcctta gatttgggaa tgacaggcat 240
ggatctcgat atatctcatg cttacagaat ggcttgtgta ttcgtaagat aaactatgca 300
atggcgaaat aggctctgaa acccgagaaa gtgatgagtg actttttatc cattagcaat 360
taatcaagta tacggaaata aggtccggtt gtcggagctg tgaagaataa cttaagtgaa 420
ggcactagcg ctcgagcgtg atcctttgta tacttgagtg agaatttagt gataggagtt 480
ctgacatggt cgtgaagtgg tgacctgtaa attcgatatt agcaacaatc caatataaca 540
aacagatgcg tatactttgg taaagcgtaa tatcttcacc gtctagtcaa gctagttatt 600
tagggataac agggtaat 618
<210> 252
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C4
<400> 252
ccacaacgat agaggtatcg tgtgatgtgg gccaaaccct ttcagttacg tgctattata 60
tgggtcgtat cgaattgagc ttacagtata aaggattagc aaatcaaacc tacatagaat 120
acagaagaat gtgctgagtc tatcgacgta ttaccaaagg tgtaagaaag atctctctaa 180
tgtataacac atcatatttg ttaggagtcc agtggaccat atcccccaca gtgtggttgg 240
ccgcgtattg accctagaaa tcgtggccgt atgtggtgaa ggattgctct agtctaccgc 300
ccactaggag agatcatcaa aatagcgcga tgtaacgttg ttataccaat agttgttttc 360
tacttcattc tgacgttatt gtaaatcacg tttaccttag ttattgacct tctgtaggca 420
tacctaggga acttatcagt ttgaaaccgc tggcgaccag cattagcgta gtaagtaacg 480
ttttattgtt ggattttcat aaatatcggt ctaacttctg ccagggcatg aaatatccca 540
gtctatatat aaaccgtagg agtgagagct aattatagat ccaaattaga ccattctaat 600
tagggataac agggtaat 618
<210> 253
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C5
<400> 253
ggcaactgtg cagtacatac tagtagattg tccacaagcg atcgacctga acctacacgg 60
tctataattc gtcggagaat tgtttgtaac atggattcag gtcgtcgccc gcgttaatca 120
gtgagttaac tttaatgcga attatgaggc ggaaaataga aacatttaca tctaaggtat 180
tccgtttcca acgcttataa taagataaga tgtgacactc agcagtaggc aaggcgagtc 240
agaaacgaag ttaaggtaga tacttgtata cagtagtaga tactagcgca agagactaag 300
gcctttcgta atatgaatct ttagtttttg tgctaaatta ctcaacgcac atcatgtttt 360
tcatgtgtgc tttgtaaggc tgtgacctaa tatccagtcc aaatcgtgtt ctgtgttcag 420
tacctacgtt attgtgagaa agacggtctt gctcattctc tgccccgaaa ggaagtctgg 480
ttataggtga tcaacatcat gcgacatcta ctctccttaa attagaggat gggaataaat 540
ttgtgctttt aacgagtttt cataagacaa gtgctgggta gatgtggaca ctttacacac 600
tagggataac agggtaat 618
<210> 254
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C6
<400> 254
aacataagct atgacaatag gtatcgtatc actttagtct acatcatagc atagcccacg 60
tattcagact agtttaacag tgggatataa ttgtgcttcc cttaacatat gcaaagatct 120
attccaagag ggatatagtc tattaaagat ttcgtctact aactttcgac gtaatcaata 180
tttccaatac ttacagccta ttcggggttt taagaagaac tgacaagtta ctaaggaacg 240
agaaacacat tcaccatctt gagcagaatc gatacatgtc acttaccata acaacaacgt 300
agatcttgct gggcggatat ggtaagtaca cgagtagtcc agatctgcgt cgtgacactt 360
taacctccat tttttggaca atgcttctat ggaaaactat tcacgaccaa tgtagttaaa 420
agcaaagcaa tatcatgtac ttcctgtaat ctgttagaga actttagcac taatttatca 480
agcgtacatg tttacattta tggcaaaatg gttaaataat tcagttatat agctagattc 540
taggatttat ctgtccaata taaacaccgt aaatatcatg atgttcactt ttgctaggcc 600
tagggataac agggtaat 618
<210> 255
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C7
<400> 255
accctttatg atattgtcgg aggtacagta aaggtgtact tcatactaaa ttcctgttta 60
tagatcgacc agacctatat ctattcagat agaggccttc cgccatggac ctttatgggt 120
ttattacgag ttccctcaat cactattatc ttattatgac tcattactaa gacacaatga 180
tttttccaca attaagactg tgacttacac acagatatct aattaagaga gaaagttgtt 240
caggtcgatt tttgaatcca tagtaatata ttctaacgtt ctgttcttga atgaacaact 300
acctttagcc gcaaaacata gttggtcgga tcaataaagt aggtgatatg agtcatgagc 360
aatatcggag aattgcccaa tatctaggta tttatgctac atagtcaatt tttaatttga 420
atggtattgg taagggatct ctttatgaca gaagcggctt cgcgcgaacg acacacaatt 480
atacgtgact ggcggtttca tgactacaat accgggtaaa gccgattgat agccctatat 540
cagtcgaaga aagacgcttc accatattaa aagtataact tcattaatcg tgcttgcaat 600
tagggataac agggtaat 618
<210> 256
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C8
<400> 256
aggggaattg gaatgatatg acgttgaggg gcccaggcaa tcgtagattg tgcatagcac 60
taagcgaagc acaaatccac cgcaactacc tcgcaagtat tttaatcttc aggttctttt 120
gtacgtgcga atcaaaagtt caatattata tttaacttct gcggagtgct gaatcgggct 180
gctagaatac cgcaggtcct tgtttcacat cgacggatgg tgggatgtac agggagattc 240
ggattgatgg cgataataaa tgtcccgctt gagttcacta ctgttttacg tagtttaaag 300
tttttcattt gagtagatga aacaaggaca tcaccgggct acagtctgaa gttatactaa 360
tcgcctgatt tacaaggcat gtatacgagt cagactgtat aaattcggca tcaccctgta 420
cgcttattgc agttcaaaca cgctaagcag cgtggtccga cacctagcat tagatcgaga 480
ttgtaacata aggttccatt gtctacggtt gaggtttagc actattaaag tcagttgaaa 540
atgcctacga gacaattgtt acgttttatt cactggagag tcactagtat ctatgaaagt 600
tagggataac agggtaat 618
<210> 257
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C9
<400> 257
ttatgatggc taccccttcc ggtactcttt tgtgtcaggg ataatgaaac caaaagcatt 60
gccttagcct gacagaccca ccccagttct gggaatcatt taacatctta catgctctca 120
acggatttta agtggtcata taactagcgt tcgcccttct gatgacgtta gtagtaaagc 180
aacgaggagt ggatttcatg tacctggcgt cgagctattt gcaaaataac agtgttcctt 240
ctcaaagtcc tgattgttta cgcataaatt gaaattttag gagaatgaat aattgaatga 300
tctatatatt attggatcgc tttaaggttt gcgattgttg attactattt tcctcgtggg 360
acgttcgttg aaggagtata acgagattcc tccgttctac ctaaactcta cccgatgctg 420
acaaaacgat taacgatact gagatggagc ggatagagct tttgaagtgt ggttagatgt 480
ggcgttcgct catcgcagta ggtttctacc tcttatacta cgatatacac cgcagagata 540
ggtggccatc attttgaggc tcacctggga ttcatatgga tgatcatagc tcttgagtta 600
tagggataac agggtaat 618
<210> 258
<211> 525
<212> DNA
<213> Artificial Sequence
<220>
<223> C10
<400> 258
atgatattca taaataacgt aagcggtata gatttatatt gttgatcgag cttatgggga 60
actgagtgta gatataatcc ggatattgaa tcatatcgac agtgatttgc gacgcgaccg 120
tggatattta tatctttatc aatcggtccc aagaatcact aactacaaca attattcatg 180
cctgttgaat ctacgtgttt ggcgatatat attaccgttc gcgcattttt tttactttta 240
ttttaccata aaagttgctc ctacgtccgt cttttactta tattaatgcg cattaccctg 300
tcatgaggga aggaggaaat agacggtagt cagtgaccta tctaagtgtc tgttactttg 360
ccaggtcaca gcaagataaa attattgcct cggttgactc gctgttacat gaccttgatt 420
tcgatgtttg cgatggccaa gcgtattgta atttcatccg cacggtgact aaaatcaata 480
aaattctgtc gctgtgttat aaggaactag ggataacagg gtaat 525
<210> 259
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C11
<400> 259
gtctttaggt gtagtgtcct ttgcattcat cttcccccgc cgtggctaac gatctttgaa 60
tacctagtaa tattgtaatg acgagatgat tcactatgta ccccgagtta cgtgtttttt 120
gaaatgtctt gatgctagtc acggactcaa gctgtgatag catacaacgt gcttaggcac 180
aatccatcgc tacaaagaac gataattctg ttatttgata caatgggtat gcttacggac 240
ataattcata aacgagcact aaaacttaca ttccgtggct aggaggttct ggaaactagc 300
cagcgaatat taacatacgg agaatattca gctcaaaata atactcggga atgattacat 360
ggtaatctca gtagtgctaa attacacaaa gtagtcttgt taacacgcat ctaatctgca 420
tactaactac agtaagagta tgtgtgatta gctctaagac tcaatcaaca gtaacttaaa 480
aacatatcct accaatctcg atatctgatt ctggatggtt gttacgggaa aggggttaac 540
taacagtcct tgaagccgaa cattgtgatt ggctactaat gtcgccgtgt cctgtgtgga 600
tagggataac agggtaat 618
<210> 260
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C12
<400> 260
acagatcgat ctgcttaagt cgtctggcga ctttgtacca aagaaggcac tatccgcctc 60
taaaaatcgc actagagtcg ttatagtaaa taaatttatc gctttatgtc gcatcacgat 120
ataaacttca atactcttcg atcgatataa tgccactgga tcaagagtat atttgccaaa 180
acgctagtag tttcggctat tatcgaattg tatccataag gaatagatac aaaagaagta 240
atgctcccgt aactttgagc cggggaatag gacgttcgat aggcgactta taaatatttt 300
tgcatctatt tattctaatc ccacatatta tgtacccctc ttctttcttg gatcagtcga 360
gtctaaacga tgttttagct ttttgtattt attctgcacc ctacagtatt gtgatcgcaa 420
ttcgactcaa tctttagaaa aaaatgtaag caggtatatc gttccagaga gggtggagac 480
aacttggggg taatcttatt atactgaggc tcttgtctag gtatttcgta tgagtttatt 540
gctgattctt caatcctcac ctaattctta aatgagaagt gttaaatatt tcaccatcga 600
tagggataac agggtaat 618
<210> 261
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C13
<400> 261
ttaaagtccg caacgcaata cttgtctgta gccaggaata acgaatatag tcattggtgt 60
cgtttagctt gtgataattc aaatatgtga gtgcgcgatg acccgaaaaa ttgtcctgaa 120
tcgagcattc acaacaaggg gggggcgcaa cttgctatta ctgtgtgcca ataatagtct 180
ccgctacaca gtaaggtgca tgaggaataa ggtaattcat tagtctttgt tgtagactct 240
aaacatcata ggctcaccgt tccttttagg tttgatattc agttctttaa gtttcatgtt 300
ggctatccaa ctgctgattg tctctaggat tttataggac cgagagttct tagcggctga 360
tagcctcgaa gaatgagtta gcgacatcgt caagtccgtg aatcctctgt agttagagta 420
tgttgaatga gatgacccaa ctactcagca acccaacgtg tccgaagtcc aaaatagtta 480
actagactaa tattaagcgt tttatgtaat tagagtaacg gttggtgact cactgattaa 540
agcagatgtt aggacaatca ctaatttcta aagagctaat tctaaccgta caccttatca 600
tagggataac agggtaat 618
<210> 262
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C14
<400> 262
aatacgtacc caaaatccat cagcagggta gaagtacagt ggataatacg taatcatgtt 60
tgtcgatgag ccccgactac ttactggggc acatcttaat ttgctaaatc atctatttgg 120
ctaaatagat caagtacgcc aaggactcat ttgggccgcg gaggtcgcgg ctactagtct 180
ccattcgttt taagacagcc tatacttccg tgacatcaat cgtatttgat aatggtaaat 240
gcaggcggcc acttacgatt agatagatat ttagggacgc gcccaatcta atattacctc 300
tgcactcagg cagttatgaa atcagcttta ccaggaacac tatggtttcg caaggctccg 360
cccaacaatt tgcatactgt attcaggaac gcggtcacat agctgggaga aggcactaac 420
gccagacccg cagattagct tttagtgtac gtatgttggc ttgctttatg taattatgga 480
ctttctgcta tcatatgcta gttgcgtatt gttgagggtg caaaggcgtt ttgacgggat 540
gggcaacaaa caccgtagat gaactaaagg gacattttaa ttaaaggggt gaagtcttat 600
tagggataac agggtaat 618
<210> 263
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C15
<400> 263
caaatcatgc aacgaagaaa aagcacatcg tggccctcca taacattatt tagttaatca 60
tatatcggat gggtcgagaa aaaatacgtt aagtagagat tcttctatgg tttagacgag 120
ttcctgttcg aaagcatata cttgaagcgc atggtgttga tgtgatgtgg taacactagc 180
tccgcatcag aatatataaa gggttcgttt ccataacaac ctttaagtta ccagagcctt 240
aggtagatta tcattagtgc tctaatcagg taagcgattt acgctgttca gacgttaccc 300
cttcccatta caattacgcc tactcataat attctggtgt tttattgaaa attcctagga 360
agatcttaac acatgtaaat aagaaaaaat aagtttcgag cccaagtaga atatccaagc 420
aatcagacta tatgacccca tcataaatga cactgtcgat gcaacgctcc cggtcctgtg 480
cgattaccca accagcactt tttaaagtat tatcagtgtt taatccaaag cagaattgaa 540
cttggtaatt tttaggacgt agacccttta tatattctac gtaatattac tctaacgacg 600
tagggataac agggtaat 618
<210> 264
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C16
<400> 264
ttgcatgaca actctatggc ttccgacaac cctatggatt ctagtcagtg tgtatcacta 60
tattgactgt tgtcagaaca caggtgtgtt tctgattcgt ctgtacatat ctgcgaactt 120
gaaaaccaga tagatatacc gatttagctc caacgacact gctgtgccaa tttacgttaa 180
actagtgatc tataacagcc atgggatgac ttagagtttc tagcacgaga gtcagtcagt 240
tcagatgaaa ccttgaataa tagcatcttg gtcgcaactt ccaaaacgca atctcggaat 300
caaaaattcc aacatacgtg ataacagctg atcgagcctg aatgcagttg gcatattgtc 360
agatgcaccg actccatcat atagggtttt ggtgtattat tacacgtgca gtcttaaccc 420
cacaaatcaa gaggttatat catacaacat ctattggtgt attgaaagat ttcatgttgc 480
acacggatac acggttggta tcgcggatgc tgccgggtgt tgcaaaaaga ggtggtaatg 540
aaagataaca gacataatca ctttttgtca agtaccatcg ttggacatta actcaagaga 600
tagggataac agggtaat 618
<210> 265
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C17
<400> 265
tcatagcacc tccaaaccta ctgatatttg taaaccacgt ctaggcaccc catcaattcg 60
tgcgcccaag actgcgtgat tgttattgtt tgagtctact gccgagcgcg ggtatccgtg 120
agagcttgct cctgatttgg tgattactat tactaaaacg tggtatattc cgaatctcgg 180
atttcccagc atacttcgaa tgagggcaga agtcgccgga ttttgctttt ccctttagtt 240
acatgttcct gctcggactc tactcaattg taatattacg agataacagg taacgaatgt 300
ctacttgaac tatggctaac gttagaaata atacccaacc gattcttaaa tcatgtctga 360
agttcatgct atgttggagt gaacaggctc gaaattcact gttgttttac aaattatgcg 420
ggtaacccaa tatgagtgct agcaaattgg gaaattgaat agtggtttaa tctttactca 480
aggcaaatct acaacggatt gcgagtttcg cttggatctg caccccatgg ttgtcgaata 540
tctcaagaag gagtgcttac tccttattat ttatccgtat tccagtaatt tgttgttaga 600
tagggataac agggtaat 618
<210> 266
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C18
<400> 266
gggcgaatat aataactccg agatagatct tacagatgat atatctaaac aatctataat 60
cagtcgagaa cgaatatcat aaagggttaa ttttaatctt taacagtgaa actgaaaaac 120
tacgaagaga acggcagaga aagcaggata ctgtctacct taattctact tgagctgcca 180
atactttgca tatgttacag atttgtttgc gaacatccgt ttcaacaggc tccagtcctt 240
atatagcaga ggaactaacg cttggacgct ctcttgatct atccgtgatc tgtcactgta 300
acagcgacaa tgtgatataa actgcctata agagcctcag aaagaaagag tttgagttaa 360
gagcaaactt acgtcatgta tcgaagaaat aagtttggat ctcatactaa gtagagcacg 420
tagcaaacta taaacgccag tttgatagtt cgtcatctga ccctgcccca gaggacattc 480
aagaacccca tatggccatt agttactgaa tgcaaaaatt catggtgtgg gtttactcga 540
aataataagc aataatgtga caatccataa gtgaacttaa cgccgtattc attaggattg 600
tagggataac agggtaat 618
<210> 267
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C19
<400> 267
gagtctcaac tttcttctag cggacgaaag catttacctt agattttgca aggtcacata 60
catcaaggac caaggccgag atgagagtcg atggagattc gactgcttgc gtgaaagtac 120
aaatgtgtgg taaatcatga ccgagggcaa gagtcgtcgc agaagttatc cgttttccgt 180
gtaacagagt cttggtttct tttgacagta caacgtaacg ggacgttgtt ttgcggctct 240
aagcacagct gttaagccga ctatacaaca tatgcacgtg ttgcaaaaga agccttcatc 300
cttcccagat cgaactctta tcgctctatt agatgggcta aatatatgca ggatgagttt 360
gaacctgact gctttgtacc ctggttgaat tgctctctat gtcttatgac tttcacatga 420
acacttaagc gcaaccaaac ttcgaaatag tgcttgcata ttgattatct attagtatta 480
cgtcgtcgta gcgatacgtc attcaatgaa aaaagattgg aaatagttgg gtgagaacat 540
gtgattggat cagcaaactc ttaatcatac ttataagcag aaaccgtgtt gcgctccaaa 600
tagggataac agggtaat 618
<210> 268
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C20
<400> 268
aatgtaacca cccaaagtaa aagactttga ttactgagag tgggattagt agatgtataa 60
gataaacttg tagagctggc tgcttcttgc aaaccttggg cgctgactaa acactactat 120
gattgtctct ggctttttta aacggtgaaa atgtatcgtt gctgtgccca ctatgggtaa 180
tgacttagca cttccggcca gtttacacct agtgttactc aaaagttctt tcgaccgacc 240
tacgagggca aaggatgcct tactcaatgc gtaaaaatcg cgtgagtaaa atcttattat 300
gaagataaat gtccatacga gtccagcgac acaatacagt cactccatgc tgcctgcttc 360
gtatgcaaat ggcacatagt gcatagccaa ttaagcctgt ttaactatga gttaccgaac 420
ggtagcttca caatactaaa ttctatggat tcatgtcacg ataggtccag tgacccaagc 480
agtggtaaac atctgctata tatttggtct ttgaataaat ctttgcagca atcccaagat 540
aggtctatat tacttacaag acagaagcat gtgttaaata gtctgtcttt caatgcaatc 600
tagggataac agggtaat 618
<210> 269
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C21
<400> 269
caaagaatta ctggatacat gatgcaccta ctcgtttacc ctacaaaaac aatactcgtc 60
tggatataga tataagataa tggctataat taaagcaagt acatatgccc caaatgatgc 120
cagtaggagg gggatcatgt agtttgtgca aaatcacgaa cgaacttctg atctctatgt 180
tacaaaagta tcataatcat acgaaaactg atttaagcaa ttagatatat acgggattat 240
tttatggggg aatgtccatg taagcactgt cagttggagt gatgaaaaga atgcgtataa 300
tatcatgaaa atttttattt ccccacggtt cgaattgcca tcatgtcgta gcatgatgct 360
gtaaaggagg tttaaatcgt gcaattcatt gacagaatca taggttattc catgtcacct 420
tacccggata ccatagttcc caactcagac aagacccaaa cctaattgtc tatcgtaact 480
cggccgccgt ttgcgtggga actaccgact tccgcttaaa agtttcatac aaattcttgg 540
tcttatacac ggattaattg ttctgaacgg tgttaataga tcccacagta aagatgcggt 600
tagggataac agggtaat 618
<210> 270
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C01
<400> 270
ttatttattt ttgagggtta cgatggtgaa cctgaccacg gatatcttat cgtgctccag 60
ctcgggctga cgtacgcatg ttctcggtac tacacgtata gtgtcgaggc tcctgtgtcc 120
aatttcaaca gtaatataaa tctatgtgcg gataggaaag actcccaacg cgtgaccctg 180
tgaacgttgc tttcgctaaa tacgtccata ctttacacag aacgcagttg atcgaacaac 240
ggacgccggt tgctcctact tctaaaatta gctgtgttaa tcttaatacg atatttgttt 300
tcaaatatta aacagcaaat ctttacatat gaaaagctcg tttctcttcc cagcgtgagg 360
gtcttttgaa gtttagggga caggaaaaat tcattaaata gtgaccttca tatgagtacc 420
cttgtgatgg ctgtgccagg attataccct ttgtgaacac acggatttca tgtgagttta 480
tgcgaatcca agtaataata ctgcacgaga agtaaaccca cgtataaatc ttatgccatt 540
ggctactgat gtacagctta atcattaacg catctacacc tacaagcagt tgaattacct 600
tagggataac agggtaat 618
<210> 271
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C02
<400> 271
tttttgtgac aataaatagc taatacgcgt cggcatggca gagaagtagg tttaaaaata 60
aagacactta atcatgtttt taccagtact tatattcacc tagtgatagg tctgtatgta 120
ttggtattta ttcttctgcc tatcatgtca cactgtagaa acggattaga gtgaacttag 180
gatgtgtcag tcatatatct tattaggttc cttaggcgta tcaagtcaat tggggaccat 240
tttcatttag tggtattagc gatctcatta aataaagact ggccccgttg gtcacatcca 300
acttataaat cttgtcaact gaatacaatg tgacgccgtg cgtgttcgac atgcctaacc 360
acaggagatt tcgcgaatta aatgtagaat acccgtataa gagcttacgt tctgttcccg 420
tacactttta tcggtcagat caatacttag cggagtcata gactatacct aatcgatcgc 480
ccatactaaa gtctcgttaa tgttcagcgg attgggctcc tatagggaca agcattcaga 540
agttatacca cttagtcacc ggctaagctc gctagggcag acggtcctac ctgctatatt 600
tagggataac agggtaat 618
<210> 272
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C03
<400> 272
cgaattgccg ccaagcaacg gttcaaagca tacttaaggc atcagttatt tttatagtgt 60
agtcgtttag ataaaaccgt cgcctaatag gtaaatgtgg ggaggaaatt aaatgtcgag 120
ggagggttgc gaatatggat aatccctgct taacgaccta agagtttatt tcagggactc 180
aacgaaattc cactactgag atacctgttt ttaaagcatc gacgtgggat acaaaacctt 240
gtactatctt cttctcttca ggagccgtct aactgaatta atagttaaat gcatcctcta 300
catagatgtg acctggatgc gcattgggta tcagaagtgg acctatggta taagtctttt 360
gcacacgttt tggctatcat aggttgtaga atgcgacagt gagaaatttt ttccccccgt 420
atgatcaaga gcggcggtct aacatcgtca tatctaacat atgttcatct cccattacag 480
aaaaaatctg gtgtgaaata atggatctac acctaacgta gcctccggaa gtactggggc 540
ttgaaaagtt ttcaccaata cgagccaaat gagaggatgt tcaagtcttg ggagtccgca 600
tagggataac agggtaat 618
<210> 273
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C04
<400> 273
aattcgcata gcgaattgag tttttgtgag ctataaattg cttcatatat attataattg 60
ccgccattgc tacttcgtga atattatgag ccctacaaag ttacgtcggc gagaaaaaag 120
accaccacac cttattgcca ctgggtttag agccatcgat agataacgaa ggatcaatct 180
tacattacaa tagcgtcctt atcatcatct tttaagaaca tttatatctg aggaacttag 240
gtcttgtcga aacttgaact tgatgcacgt atacataact ccgatttagt tcgcgaggtt 300
aaatataact aaatgtcaca aactgctttc tgaacttcta gtcatgggat tcgatgttcc 360
acttgcgaac actccacacc attcgggatg gactcactcc agatcaacgg tcctttattc 420
acctagcgat ctataaaaag gaatcactat agtccaaatt tggagatgct ggtataagcc 480
aaaaacaatc attatgccct gtttcctagc taagtcgtaa cctggaaact gtcccgttac 540
ttgattttac gtttgtaggc catattaatt agttactatc tgagtctatt ggtcatagct 600
tagggataac agggtaat 618
<210> 274
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C05
<400> 274
actgcaaagt ctggtcttac ggattcaact ctaaaaattt actctccatc taacataact 60
aatgtgattc tttactgcaa gatcgagtcg gctgatgaag aatattttgg ctacattgcc 120
taatgaagcg tctttatagt atcgatagca ggcagaactg agcctcttga gtactaatca 180
gttaatacgg attagttctt gaattaacgt atttcactgt tatttccgga gtagtcgtta 240
gtttgtgtgc gtaagcgacc cctttaacaa tcataagtat gatactaaga cactgctcat 300
ggggggagca ataaacgagt cctaaaagga cgaagcgatc actaggatta ttttcaagtc 360
atacgcctat ggaaccgatc aaaccagggt atagtaacag aaaacactac tacctgaccc 420
aaattctatg gccataaact cgatgctatg tttagatgtc tatcagatat aacagggcat 480
gtgatactgc cggctaacaa aatttacgca ctaccttctg aaacgagcct agcaactatg 540
ctaacaatta cctaccccgg gttgatactc acttgtatga cagcgactcc aagctgtagc 600
tagggataac agggtaat 618
<210> 275
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C06
<400> 275
tcgtgaggga caagcccata ctttttggct tcttcccact tgaagtaagg tggcgttcga 60
acaattttca gccaactaga tggttatcct ctataggttt tatgcaaata gcggcgatgt 120
taaaggttat tcaatctcaa tatgagtata aatgatcctt cctaacttct tacgtcttgc 180
ccagtcgcag attttacaca cgctaagtaa cctggtatta gggtataatt cactcctccc 240
cacggtgcag atctcaccaa ctgctcaaat atgacgcaat tcaggggcgc aataacacca 300
atcggcccaa ttacggacat atgtaagggc ggcctctatg tgtatgttcc atatcaggta 360
tgtttgacga agggagggat acgaaaattc attcttaact ttaaggatac ataatgtttt 420
tattagtgat aataaattca gcatgtctgt aatacggatg acataactct gtccacaaca 480
agaaagcgtg tgaaataaaa ggttaccgtg gctattgctt tccttagagc catatatggg 540
gccgcgggca tgctacgtac gtttgacaat ttgagtgatt tgctctccta ccgttttgag 600
tagggataac agggtaat 618
<210> 276
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C07
<400> 276
cttcgccatt ttagcgtctg actcctatgg aaagagagtg tattcaattt gataagggga 60
acaatcaaaa aggctagagt atgatgacgg tttaaagcga ttcagtgcag cggtgtctca 120
gctatataat ggaacaatgt gtcccgctgg aacgaactac ccaaatgaag ttttattcct 180
tgacaccgcg ataatttatg ttatcactag tggcacacta ataaagctgc aaacttatcc 240
acggatctaa gataaatttt taacttacgg atcgaccagg tggcagtcag aagctgtaaa 300
cagaattaaa attctcgata ggatcattgt aataagtcaa cttagtaatc catagacgca 360
ttccacgcgc ctaatttctt gcgtgctttt acggtgtcat tttactggat tgttagagtc 420
cgtgacgaac gacttcgttg ttccgtacca aatcgcattg tgcagcatag tgcctagatc 480
tacctattaa tgttacaaga tatcatctga tgacacgcaa aagacatttg cataaagtga 540
aagcctctct ggtatcggct cagtcgagtt actcaccggg tagtccttta gattgtacgc 600
tagggataac agggtaat 618
<210> 277
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C08
<400> 277
taaatgtacc aatcaccagc gccatacgtg caaacgaata accacctcac tgccatataa 60
agcggattaa aaattattat gaatcatgca acgtttattt gagttattcg catagcccca 120
ggcgcgaact acaatatccg acgttcgctg cgaatgcact tatttatcat tccatgctcc 180
caactggaca tcgaattaag ctataatgcg atttaagatc gactaactac gctttccccc 240
tatatgaaac atcgctcatc gctatttagt cggaacgtga tctattctat ctttaagcgg 300
ataagggagg gctacctctt aacttgcgaa gggtccagct atctcgattg gagtaaatat 360
atcaaccgta caacgccaat tcgtaagttt ggttaggcaa ttatttggac ataatccaca 420
gctctctatt taagcgatga cgagattaac gaataagcgg atctacccaa tcaccaatgt 480
gaacgatgca gcgacccaaa tcatttctat gagccaaaca cgttttaatt accctcgaag 540
atgcttgttt ttacaaaccc catctattcc ctttctccta ccaaggtaaa tttatatatc 600
tagggataac agggtaat 618
<210> 278
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C09
<400> 278
catgacgaat taaacgtgtc taacttatgc aactctttgt agattttaac tttaacgttc 60
actaactgtg atcattatgg ctctgttatt gagcagcttg tcaacagaag ctctacttcc 120
aagtgcagta gtacgatcat cctcataggt cctatcacgg ttacgttaag accagccagt 180
atgtgctatt ctatgattct gtatctaaac gcgaaaaaat aagcaattaa gtgatatact 240
tcgggtgttt aaaatggata aagactcatt tacaccggca cttgttgacc ggtctggcta 300
gtgttgttgg ttagcgcaac tttggggcgc gtataagctc tataccgggg ggaattatat 360
tttataagag gtctactctt tttgattatg ataaacggca actttaggac tgtagtagag 420
tatgcctcac cgctacgatg ccacagtgga aaatgttaag attagcccac tcctcttatg 480
ggttaacggc cgatttttga ctacgtattt ccggtttttt gtagggttac atcgaaagta 540
tagggtctac gacgtttaac gtagtcatat aaatgatgac gtgtaaccga ttattgtcaa 600
tagggataac agggtaat 618
<210> 279
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C010\
<400> 279
gctaatttgg acaactacca aagaggctga tagactggtg gtaatcccca tttattggta 60
ttgccatgac atcccctgct gttccccgta cttctacaat ggagactact attcagagct 120
tggcctcgcc gccttttatt tgctgaggtg agctataaca gcatggccgg aaatgttcac 180
acttaatacg tatggggtaa ttagggcttg tgcgtgcaag acgctttacc caagttagag 240
gtttcacata cccatttgtg tcgcagattg aagtaatata ggcaaaacca ttgattcaaa 300
ataaaaacgt tacaattcgt agggtggtgg cgatagtggg ttaccgtggc attcagtcta 360
tacatctact gccgttgtct ctgtacagga tttctatatg atagaggtag acagtcagga 420
cggtagaaag tggagtttta tcaatgtatt tctcaggatt tcgctatggg aaataactat 480
tcgaaagggg taaatcatgc caggccatca aacttactga ttagtcacat cgttcgtagg 540
aataagcact cctcatgccc tagtgcgttt ggtgatcgaa tacggcaggg tatcaacggt 600
tagggataac agggtaat 618
<210> 280
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C011
<400> 280
aaatcattgc gtatagtttt ccagaccatc gattaggata ccccgctgcg ttctggattt 60
tttatataca gacacgataa tgggtggcaa attctatttc cttagtggac atatcgcaca 120
ttggtttaaa atgtcgcgcc aaggcacccg aacagagcga ctatgaagtc gtagaactat 180
ttccatgcag aacgtacact taaagatgac cgacaagcca ccgaaggtta tcaatctgca 240
aaggcggcca aaattaagaa taagttctaa tatagccttt gacgaaaatt ggtacgtgtt 300
ggctgagcgt aatcaaacct tttcgtatat tgtaccggcg tacctctcat tatcttgccc 360
ttacaacttc agtgaaattt taattaattt ttgaccgtag ttaatgccac taggatacgt 420
agcaatatgt aatataatga agcgttatat tctgtaaaat aagggacgct tttggttgag 480
cactcctgtt gaaagattta agcggtcgct ttaaagcgtg cattaagaaa gacagcgcaa 540
aatttttgaa gctggatcta ttaacgaggg tcctagtgaa tgtcctttct tcttatgact 600
tagggataac agggtaat 618
<210> 281
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C012
<400> 281
gctatcgtga agtgacagac aacacattac aacagttggt atggctatct actttgttgg 60
gagcttaaga tgagagtaac agctcatgag caatttaaga aaccaaagta cgggcgagtt 120
taattggtca ttgtgttgtc agaacggatg ggtatagaaa cctagtactt cgacttatcc 180
catgcatctt cgcgtggggt cattcacgag ttttgctatc tgcatcaggg gtacaaggac 240
gctatcatag gctcctggcg atgctcgtta tgagagtaac aatagtgctc acagagagct 300
tccctattct tattagaatt attcttagca actcaccctt gagtttatgc cacatggctg 360
gtacacgttt cgatttatta tgattaatgt cagaacgcga acttcatata ttgtccagta 420
attcgagagg tcctcacgta ttaggatttc gacatgaaga acatataaat catgtactgt 480
agctaactca gcgagaatac gctcgtgact ctctgcctgc atttatacca attttcgtca 540
cggaagccaa acgtgcggca ttgttgcgca attttatgga ttaagaacat aatagtgata 600
tagggataac agggtaat 618
<210> 282
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C013
<400> 282
taaccttatc gcactaaatt tgaagatata ccacgctgtt gatacttcct acttaaacaa 60
atacgactag tggcatcgca cggagcagtc cccaagacaa catatcctac acttatataa 120
atcaccaaat cgtagtccag tgtagtgttt tcaatgtgca atctcgcatg tgtaatgagg 180
agcactagtc caatggcaca tactaactta tgctggatgc tggttcctaa atcttggcat 240
aacggtctgg ctttggactg gagtatcgat aataatgagc aacgaaatat ttgggcttta 300
accaacttca cataattgta ccgcgggtta tattatcgat tagctgttta taaaattatg 360
taaatatggg cgacaattac gaataaatat agttctcaat cagaatctga ttcgaacatt 420
actttagacg taggacatct gcattcatgt taagctgaat ttaggtgaaa tgcattacct 480
tcgttcgatc ctatagacgc tatccttaaa tattgttaaa caagagaacc gcatatttca 540
gtctgacgtt ttttaggaag ggctagttcc tgcactttcc cccataaaaa tttgtcgagt 600
tagggataac agggtaat 618
<210> 283
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C014
<400> 283
tccattaatt aaatgtaatt ttatgcaact aacgaaaacc aaacgggggg aggttgattc 60
gcctcgaatt tatatgaaaa cgtgccatag gccagatctt gatctgtaca cagctgactt 120
cggatgaata ttataagagg ctgtttagat ataacgagcg cattggcgta cgatcttcac 180
tccatcgcgc aaattaatcg tagaattttt ttcgatttca ttagttgact ttatcgtgtg 240
cttgaaaaag taagcgtgcc actatatata gcgtttcata cggtattcag aggaagctgt 300
tgctgcttat tccaatagcg gatacatcat tctgagttgt agttgcactc tgacctactt 360
agagaaacat ggttatactt gcttaacgtt taagtttctc gagaatatca actcaggcgt 420
atcctctagc cgtcgagatt tgattactca tgctgatgtt aactataata cacatttaat 480
cccatgtcaa actttgcaat acacttttac aaagttacca catctgagtg agcaatccat 540
gtattcgtcg tttcattagg tctgaggtac atgaggtttt ccattatgca ttatgtacct 600
tagggataac agggtaat 618
<210> 284
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C015
<400> 284
ttctactcgc agtgcaatta gaattagtaa aaccgatagc agctgtctac atcatatagt 60
caacccgcca ttcttagata aactgggatt ccccttcttg tcgtacatta acgccaattg 120
tgtcaccctc ggccatgaac taggagtcag tctccacaaa cttatcccat actaatgtct 180
gaacctgtac ctcctctcac tactgattag ggtcataatc caagtttggt atatgtatag 240
ttacggaaat gattaatacc ctgacgttcc atgtcaaccg tggacttggc ttggcgagga 300
aagtataata ctagttatcg attagtctgg ctcggtccgt cacttcaata aggcatcaaa 360
gtctgtactc taacacagaa ggttatagtt tgtaagttac tttcgtacgg atgattgccc 420
tctataacca tatgcggatg actgaggtat agggtgtaat gtacaaacat aatgtggtat 480
gtttgaaaac ctacactgga tgagtcttgg ttaggatgtg cgatcataca gagaagtaca 540
agtgagcctt agattggtcc atgaacaaca gcgtagaggt agctataaac cttggagagt 600
tagggataac agggtaat 618
<210> 285
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C016
<400> 285
tgttgccact catatagttt cgtatctgat aatgagttgt tggcatgctg tgagagccaa 60
tacaacgagg cttgactgga aggtagtcat acaccaggtt cagctagatt aacgatttta 120
ttcactcaag catttggtct actgtacgac ggtgcggata actttgattt acgtctgtga 180
aatgaattat tcgagaaatg cgttcaggta ctcatgccct tcgcaaccgc gagtacggtg 240
cacggggagt gtacggatat gaaacatctc agtatatcca tacgggtaat attaacgcag 300
aatcgatctt aagcaagata caaaccaacg gatcagaaat atattatctt atgttgccag 360
agaatagtca cgatatatcg ggaagtctct aaaaatcaaa ttggcggtgt taggtatatg 420
agcagacata gtcgttcgag agggccgatg gatattatgc aacgttcaca aacttagaca 480
ggtttgtctc ttattcaaca gacaatttgc gattcaacac gatgctcagg cagacaataa 540
ttacaatagc tagttatttg gtctgacctt taaggaaggc tgtaaaatta gcttacgaga 600
tagggataac agggtaat 618
<210> 286
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C017
<400> 286
tgtactatca tggggcatca actttccaac agaaatcaac attccatagg tatttagtac 60
tcgtcattcg catgcaatga gttactcgta ggtaggggct tacttgccga tgatccgtat 120
acgtgctcag aatgattcag caccgccgag agttatttat ggcacgtgca ctagtgatct 180
ttaaccttta attgcgtttc ctttggatga cctatcgcgt tccactttgc aagattatat 240
ttattattgg actatttatt aatgatctca aacttgctga tatgcgcaac ttatcagctt 300
agaatctagc cagtcccttg ccagagttgt cgaatcctgg acttgtctac gcgatgattc 360
ttacattgat ttagggattg gctacattaa ctggggtact taatacgaat tatgtctgtt 420
gagtttctca gaataatgta actgcatgca aaaatcacct ttcatatctt ggctgatgtc 480
atgttgaata cgcgtcagat gaacaagcca tcagggagca cgtgccccag tccagcactg 540
gtattttttg cctcgaacaa tgtattagca aagaatattt cagtttatcc ggctgtgcaa 600
tagggataac agggtaat 618
<210> 287
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C018
<400> 287
ttttcctaga ttcgcattga aagagaggtg ataattttgc caactgcgcg atttggctgc 60
tataaataaa atattcagat gttaatctag gatggttggt gataaacgcg gatatagtgt 120
aatctcccca actcttatgc tagcgggtat actcttttgt aagaatattg aattgtaaac 180
tcgtagataa atgggttcga ggccctgatg gaggtcgcat agtatcgatt cttatgacat 240
atatccccta gacgtacaaa cgagtaccta gttctagttg agtagggtcc agaaggatat 300
tatgcttcct tcaaatctga acacaaataa tttacgagta ccaatcttat cagttaagac 360
ttattccaaa ccggtatgca ggggagattc ctttttgtat aaaagaactt atgtatgccg 420
ctcttaccag cacgccgaca ccattaatct ataattttgt aattacttat agagaagtag 480
catatacaat ctacgtatag gaagatggtg ttttgcagta tggcaatttc taagtttatt 540
atgatgaaca acaagagtaa attggcgaca gtgatttaaa tgtagaaata gacgcattgt 600
tagggataac agggtaat 618
<210> 288
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C019
<400> 288
taagaatttc acggaacgtt tatttgcttc gcactactac aagccattat aagtactggc 60
agtcgttgtt cctatatcta gtattattat atcggtaatg caaccatatc tgagttcgct 120
acccccaccg agatacaaag ttgcatagtt aaactcgccg attaaatcaa agactgtagg 180
aagatggccg ttattcttta atggggtcaa caagcggaga aacgatcctt cgaacattct 240
gatttgcata tttagaaata tgctatcttg tacagaatcc cttgctaatg atagtgatga 300
ttgcagcgat ggaggggtaa aacatgtgtc agaatccaaa taactatggt actgggattt 360
gacgtatcta caatttcttc agttaatgtt agtttcatgt atcatttacc aaactagaat 420
actagcacta gtatattcta ctgaacaact tcataccatg gtcctactat actactctag 480
tgactaaatt gtagaactgt atatgactga tcgccaaagg aatacgtcca cgtcagcggc 540
aatcgatgtg cgtggacagt ttctgcattt aattttacta gtcgctagtg ctgtgggtgg 600
tagggataac agggtaat 618
<210> 289
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C020
<400> 289
tcataatgca ccgatcatat taatccttag taaaattaga atagaaacag gaacaactgg 60
gcaactagcc cggacttcta atggccaggg caaaggttgg aacgaacgcg cgacccctcg 120
tacgctaccg tcatggtatg gtaaaatgac ctcgaccttc gcaccattat gatcaccgac 180
gtttcaaatg acttgtgacc aggtctaggt ctttcgcgcg actgagtgtc ttgatattca 240
ttgttctagt caaggcctgt caaccagaca gtacggtaca ccgtagttga tctgcgaccc 300
gggataatct cctctatacg tcgttttcct gcgatgtctt tgtattatat acgtacctgg 360
tgtaagtgct atatatcccc attgcgtgtt attgttttaa cggctccaga aaatagtgac 420
tttgatataa cgtttgatgg gacatttttt ccacccaatg gtatcaccta gaattaccat 480
acagtttcga atagctgaat accagtatct tatcactgtc aaaagagcgt cactgaaaag 540
attaatctac tttctcagta gaatatttcg ccattgatgc ctgaccgaat taaatatata 600
tagggataac agggtaat 618
<210> 290
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> C021
<400> 290
tacctaattg ttatagaaat cttaaaaggt tcgggtgaag tcgtattaat acttaggact 60
atatggggct cgagtaagag cgttaggttc ttcatccgca cctaaatgaa tattgagtgc 120
acagagcgcg atagcacgga tgtatcttcc attgcttgta taacaagcaa gtagggtcaa 180
gccagctgca ttacattaaa agttcggtat aaaagggcgt actctgtttt atttacatcc 240
cactcgcaca tttacatctc gccatattca cgatacaaat ttttttacta ttagtcagag 300
tgacctggtt gaaatttatg tcgatccttg aactagctgc accagatcat tagtcacata 360
tcggcgccga agctctgtat gttcgctcca cgaccatgtg ctcgacctag ggtcatccag 420
acaaaatagt aaaacgatta acctaatcgt gttctcccac gacattcaca taatggtaca 480
caagactttc tgggatttaa gacatgacgc ttattaacat cgccacgtga tgttctagca 540
ctcataccag ctgagttagt ttatattaac agtcatgtct cagctgggga ccctctcaac 600
tagggataac agggtaat 618
<210> 291
<211> 1453
<212> DNA
<213> Artificial Sequence
<220>
<223> FG1-1
<400> 291
gcccggctgt gggcaccccc tcgccctggc ggcgccttcg tttctcggcg cttcccgctc 60
cccggtcccc gttcgtcggc ctaggcgcca aagcgcacca ccgatgtccc ccggcggcac 120
gcgaagccag tggggcaccg cggggctggg cctcgagcgc gcgcgcctgt tatggtattt 180
gaacaagtta atacgcaact gtaagcgaac ctttatctct tataattcag ctccatccac 240
ctcagaacaa gtcccgcaat gcgtctttga gacgtacatc ctgatcagat tcgagttaca 300
cgagatctat caaaacagac tcatcagtca tcaaaaacac gcggtcctgt tacgcgttta 360
cgttataagg actagatccc gtgtacttac actaggcagg aacagaagat gctacttata 420
ctccggtaag tacccgctat agtatcgaaa gttgtcctta gtaagacaac ccaacttttg 480
aaagtggatg ttagcaggcc ataccgcata tttttgccgg ctactctgtt tccacagact 540
aaccgggccc gccagcagtg tgaaggaaag aggtaggcac gcactgtgcc cgatcgcagt 600
gcttacggaa tgatcacgga cataacagta gcgtgagttt gtagtggtta atgccgtcag 660
aaaaaattaa ataatctggc gtagcggatg tgacaaatta ggaagtgcct ggaaagccgg 720
ggagatttaa taaggtctag agcggctcta tagagacgtc agcaacagtc atgccctact 780
gtgctgcgac ccagtgtcgt cttacgaacc gccacttaac gctggaatcg cgaccgacgc 840
attcaaagct atgcgatacc catctcctaa aattttgagt agtgatgttc attattctgg 900
cttaaagatt aaaggcacgt ggacgtacgt atattatggg gaaatgaaac aaaagctcgg 960
cgaattgata caaatgatta atggtccggt catatttagt gaactgtttg ttagaagaca 1020
aagaaaggag tagggtacaa gtagctacaa gggcggagaa aaaaccttac aatatcacat 1080
gttacaccta gcaaccaaaa gggcttttgt tcacggtttg gagtcaaact tgtaataaaa 1140
ctttccgtgt gaatccgaat ggaactcgga tcgaaagata aaataatgtg gatttacagg 1200
gcggagataa ttttgtttgt ttttgttttg cgggcatcaa ctggcattcg acctacgagc 1260
atcctttagt tatatatctc tccatcctgt taaaagaaat cgcacgatag aaaatcctaa 1320
gctaaactag tgctaattac tactttagcc tcgctttaaa ctgcgagtta tgtcgtgttt 1380
tatacctttg gagcccgcga ttccgagatc atttggactg cttgtgcaat ggttctaatt 1440
ttgtgctgcg tat 1453
<210> 292
<211> 897
<212> DNA
<213> Artificial Sequence
<220>
<223> FG1-2
<400> 292
agcttgtccc tccggcggct ctcccgttgg cctcatgtgg ccgccaacgc ctcccgtacc 60
gcgacgctta ccggtcccct tcgggctcaa cgggtcatag aaaagagtgc acaaaacgat 120
gacacaccac gtgtttattg gctggtatgg cacatgcgga gcttactgcg ggtgctaagt 180
aaagtcccga cattatggta taccgagatt aacttcttac tcagtgagtt attcatctcc 240
gaagcacagc tgcctttctg gcgatagtgg gacggatccc ccatggagca gagcaggata 300
aggctgtcaa aagtgttccc gtagtcgtca gtcaatatta tcaagagaaa ccgacataac 360
ccaaatagag ctgcttaaaa aattctgcta gagtcccgag gagatatacg tttataaggg 420
taaataagaa gtattaagaa gagttcctcc cactactttt cctccagaga taaaactgac 480
tgcaaagggt tgcgtcgggt gtcttgagct agcccggcct gcgtatgcaa tccctgcacc 540
gctcacaccc tttcataacg aaccatcagc gctagagcaa tgacacggtg cctaagagtg 600
gtctagatac gtaggaagaa ggaagataac tgttcagtac acggcgtata aggtcgtcat 660
taccatgctg ttttgtgata actaaaaaaa actaaggtaa atgcgagccc gattgcatcg 720
aacttgtcga tgaacactcg aacgcagttg aaacttacta agcaaatctg aaagatggaa 780
atgcgttaag aaaccacaga tgaagagata gcacaaatag ttacattaat gttcggatca 840
tgctgttatt agtttacgcc ggtctgagtc ttccggcgtg ctctcaaaca gatgccg 897
<210> 293
<211> 506
<212> DNA
<213> Artificial Sequence
<220>
<223> FG2-1
<400> 293
ctagcgatta tcggttgcga tccaccgacc cgtaagcggg gggttcgacg cggtccccgg 60
ccaatgccgt gcaccgccca tgtattcgtg gagcgctgtt ggatgccggg gggtcaatgg 120
gcccagcgct acccgtagtg ttgtggtccg caggcaccaa cttcacgtaa gaacccttaa 180
ttgtcctttg gcccgtccca ggccagcgca gcgccgtgac tttcaatgtg tggacccgtt 240
ttcacccggg taccgtttcc cagacgcccc gcaattacgg cgtccatatc ggatgggtct 300
atctagtgtg ttccgcgccg agcacggggc ggcaagtccg gaccgtcgcg gatgacgcga 360
ttgtgggcaa ctacggctag cgtgaggtgg acctaagtga cccgcgcgca aagaagggtt 420
aggctaagtc aactccgcgc tccccgcact cgttattggc agcgcgtctt caattacggg 480
ccgggggagt aattgtatat gcatac 506
<210> 294
<211> 886
<212> DNA
<213> Artificial Sequence
<220>
<223> FG2-2
<400> 294
acgtaagggc tatagacttc gacgattcgg acagctccgt gtgtgagcaa ggtagaatag 60
agagggtata gtgtaaaaag gctaaatgtg gagctagaga ctcgaaaggg gccggttaat 120
gtggcaatca gtggcagtta atagcccacg gaaaggtcgc taaccgggtt cggtaacgat 180
tccgagacgc ccggggtgcg cggagcagcg tccgtccgtg gacccatccg cgcattcgag 240
gattacaggt ccggcgccta aatggtgcga agtcccgctc tttgcgtaat gagccaatgt 300
ccatcactat ctttcgggca cactctacgt tgcaataggg atatcatatc gaggagggga 360
gaggattatc gataaaggat tagcggtagc ctctctgttt ttatcccgtt cgaatccatt 420
cattttggcg tattatctac agcgtattcg gtcactcccc ccttagcgta gaacgtgtgc 480
cccaactgta acccttaacg atatcataac tcgacgtggt agggcgctcg cgctaacagc 540
ctacagttgc tacgtgggga tataccaatc gtcccgagtg tccttgagtg ttatcctggg 600
gctgtcgatt tctactggct gaataattga ggagactccc catacctgaa tgtatcaaga 660
actagatttt gtctcaagtc cttcacagct taatttcccg aaagaatctt ctacaactta 720
ttgtgtgtac aaatgcgctg cttttatgcg tacaagtact ctgtgaacat atgacgtttt 780
aaaatctttt acgacggctg ccctttgctt ataatatgta agtctagacg ctctgatcat 840
aaatgcacta tggttctgag tttgccgacg gtgcgaataa cagcct 886
<210> 295
<211> 2530
<212> DNA
<213> Artificial Sequence
<220>
<223> FG3-1
<400> 295
tgcgagttta ggtgcgtgac taagtttcct atacgtgtcc gattgacatt ctattttatt 60
tattagactg gtgatatagt cgacagtagt agattgagtg gacgaataaa ctaccaaact 120
aaaaatcgct aacccagcca tgaaagagct agacagaact gcccgcgttg tacctgcgct 180
ctcctctccg cgattattca tccatgttgc accatggaac gatgcgcatc taaacgatgg 240
cttataaatg tagtagtcac cacagaaata tgtcgtgatc tcgtcccaaa aacgtcatgg 300
cctttgatcg caacagccga gtctatcagt aactttatat cggtataggg gctacggaga 360
tacggcttag cacgtcctac acctcctaga gtttgtctcg aaatcctaag cgtagtcata 420
gataatgaga atttggaata agcacccaag cctaactata tagaactggt agtaacggat 480
gtacacgtag gacgagttaa aaatgtaatc tgattaaatt tggtcggtgc taagacggaa 540
aaatctctat atcaagcgca tcgaagctcc gggtaccagt aagtgagtag aaacagccag 600
gtaaacatat agaacgtaat gagcaggcct atagttctac ctctttgaga ctaatgaaga 660
gcaagaaaat tagatatcat gagtgttcat tgatttttac tgggtaatat tgttaacata 720
tagcacatag tttcttccaa tcgaggcaca gccttcctct gtctttatag agaactatca 780
taggcttcga agaagtaaat tcgaattaat gtgaccggtt gattgttcgc attacttatg 840
tgggaggtaa ggagcttaca gattagcaat taactaccgc ctgacagtat gctagtatat 900
aagtgaataa gtgactgcat aagaagagat ataaaaaagg gttcgccctc atagactatg 960
aagctcgcat taatgtcatc cgaaaaaacg gattgtccga aatactatat tcctgcatca 1020
aaataagata cgggagtata cagtgtcatg tccgcattaa ctggaactcc taatgtaata 1080
atgaaagtac agtgatattt aagtttagtg atgatcctta gtggaacata ccatataata 1140
tgacatctta aatcgttatc ctccactagc gcactaccta tttgagtaca aaattaaatg 1200
taaacggtgt tgtgtcttac cactaccagc ataagggccc caaatcgatg taaggtgatc 1260
cacggcaaat ttcacccgct cgcattgagg aaaattctcg agaaggcagc tatagaaagg 1320
ccgtactaat tgtatgatgg gctgaaggta cggagacggc gtatggtttt gaaatctgag 1380
gaactagata tagtgggacg gttggcacat atatggatgt ggtcccatta ttcaatgtaa 1440
gattgatgcg tcctgtttca aaagaaatag aaacacagac ggggaaagga gtcaaaagga 1500
aaacaaccga ttgtgatgta ttaggccttt cggtccataa aaatactatc gcaattaata 1560
ggactgatct agaagctgaa caaggataat aaattcagaa actatgtaaa cgacaatcat 1620
ttgaatagaa taaccactat gaaacttggg caaaagacga aaccgaaaga gggaagtaga 1680
tttaagggcc tggacggttc tctggcgcgg ccaattatcg caccccagac tagagaggca 1740
tcgtcatcat actctaccaa ttcctcgtcc tggctccact cgaccagatc agaggcctcg 1800
gttcacatcc gctcgggatg gcggcgccac ttgcatctcg acgtaacctg aaatcctcag 1860
gatccgggac ttggcgggtt gaccaagggg ctcgatgatt gagacagggt actgcaccac 1920
gaccagccaa ccctcacgaa ctgtccatgc tgcgtatgaa cgctagcgaa acaccaaacc 1980
agctcgtcat ggctcaacga ttgaagtaga ggagtgcaat tcgagtcgtg gcgatgccca 2040
atctcaatta tgctggcgga ggggacactc acgtcccgag gaagagccat ccgcggcaaa 2100
gcgccgacca gctccacaac cgaagccgcg acgacgtgcc agtaaatagc acgtcgagga 2160
gcacgcagca tggggaaggc cagggtgagc tcagcgtccg ccgcaatggc ttcggtgagg 2220
tagacccgac acaccatcca ccattggcct aagccgatgg ggaccttcga cgtagcgatc 2280
gcgccgtacc tggagctcgc tctctggcag gagacgtgcc gaggggtaac tggcgctgag 2340
cgaacccctc aatcatagca agtgtcccag ttttttgatg ttgagctttt tggagtagtt 2400
gggggatgga gggaatatgt atagttataa tgttttgatg atggaactgt atggagatgt 2460
agtgaatgca ccgccgtgaa gatccggctc gagaagcccc tttcgacggg tcttactgac 2520
gcgcgggtgt 2530
<210> 296
<211> 1556
<212> DNA
<213> Artificial Sequence
<220>
<223> FG3-2
<400> 296
aagtctacga ccgggcccgg tccgtcccag ggctgcggct tgcccgctgc ccccgggtcg 60
cctgggcccc ctggtctccc ggcaccgcgc cttcggccgg tcccgccctg ccccggcgcc 120
cccccattgc cgttgtcgcc cctctgcgca tcataaagat atcgtttgac cgaattgaga 180
tatgttgggt gctcgctaaa tttgcgtcga gttccctttt cctgtgagtt ccgccaactt 240
agtgttgtgt gctttttcga ctataacctg ctgagatgcg gtataagagc gggtataagg 300
gacgtttgct ttccggtcct tcgaacttta ggacacattc gcacgatatg tacaccacgg 360
cacaagaata ggtggtcgat ctatccttgt gcgtcagtga cccttcatcc cttgatgtcg 420
cgcagacccg cccagggtcc tctgaaccaa cctgttcatc actcctttgc tacggcggaa 480
aaaggtttgg tgtgcgcttg tcgacctcgg ttgaagcact aagcggtata cgcactacgt 540
ctaactaaaa tccgtcacgg ccacgaagat tggcgccgac tcgacctatc tcgtccgccg 600
gtccccacgc ctgtgtccat cgggacaagt tgggatacgg cgtccttgag catcgttaaa 660
taatcgcagt acgtagctga ttagggaaaa gtacgttaac ctaccagggg agcgggatgt 720
agatccgtag aatgccgtcc caagcagcaa cagcggcgac ggtatcccga ccacgcggcc 780
accgcaggga cgtgatctcc ttcacgcttt gtctgctgac ctgatgctca ttatagggga 840
agggcgatat cctatatcat atggtaaggg gaactaccgg tggtagtagt gatagagtgc 900
gacatcagtt cctttatata aagtcgagaa tgaagagcct cctgtctacc cgttcacccc 960
ttttgccgag accgtcctac taagtgttac cattgccaac cgggttcgag gtaggatgcc 1020
gaaacgtcac tccgaccata acgtctgata gagacaagag gatatcaaga atatgccggc 1080
tagtgtatgc cagacttggc tatgccatgc aaatatacta acacggatac cagggtttga 1140
gctatcttac gaaatggtgt atcccgaaca tgtggggcgt ggacgccatg cgctgaaaat 1200
ttacaatagt caaggtgcat agagtaatat gagctcgtac aatacagtag gagttgaaaa 1260
tcaagtcatt atacataaag tatcagaaga taatcaggcc taaataatcg cccttgtcga 1320
aattacatga ttatcttcct aaactcaggt tacaaggttg tgggtccgta ggcctgtagg 1380
taaatccatg acgtcgatga ggcccatata aatcaaggat tatcgcactg ttgaacggtt 1440
aacgtgtaat gctagctttc cgatatcaag gcctaaatac cgcgatttag tacagtgccg 1500
aaatagataa caagctccgg tggtttcaaa aagtggtgat ctcgatgtca gccgca 1556
<210> 297
<211> 1357
<212> DNA
<213> Artificial Sequence
<220>
<223> FG4-1
<400> 297
cccctggtag aacatctgct attccttgtt aaatccgact atttaggcct aacgggaatg 60
atggtctcta ctcccttgta gagggtaggg tccttttata ggtgagtaca gcatgatttt 120
gagcgaatca aatatatgat tacgaaccta ccaaccttga gggccccaaa gaaggtactt 180
atccttgcta tacaggcagt tctcacgcat cagtctcacg gtgctaaaca ccaagtgcca 240
tcaggagtta tggccatgat atgcggcgag aagaaaaaga gtaagtccgc agagcgtaga 300
aacatagggg aaggcagcca aagacgtcca ttaaagggtg gcgaaccgca gagatgaggg 360
cggcgacgcc gccgccacta gaccgcagga agaggacggc aacatcacgt gaggggtgaa 420
ggggataaat gccggcaggc tggacaggtc gcaaagacga gagaaacggg tccgtggtcc 480
aaaccaaaac acatccacga cccaggaggg ataggctgtg cgaggggggc tagctcccag 540
gtcttcaacc gtacgacgaa gacaggaact ggcgttctaa cgccggggag aggaaaactc 600
cctggaaagg ccccgaacga ttaacagtag ttcgacgtac aacaagaccg taaagagcag 660
atacgcaaca atgaaatagg acaaaggaaa cgaagagaat tacgaaatag aaaaacggac 720
gcaaaactga gggatgaaaa ccgacggata cctctgactg ccgctcggcg taccgttaga 780
atgagggaga gaaaaagaaa gacagaaagc ggaatgtcat gctacgtcaa aggaggtacg 840
gggaagcaaa tcgaagagtg gactcggtta gaacctagta ccctcgccca cgcatccgag 900
tagcgtgatc ccgcagtgga tagatcggta aggccagcgt gaagggagat ctcagatgcg 960
acgaaacgat agcatgctta aacctgtatg caaggcaatc aatcggcccc cacgctgagg 1020
cggaacgtca caaaaatccc acagaatccc cgcacccccc cctacgtccc ccaccgcccc 1080
cgaacgcacg cccagcctcc tcaagacccc cttcgtactc gctccctgga cggacttccg 1140
gcactggtga tcctagttct ggacgcggac ggaggatagg caacagacga actgtggcgc 1200
cagggtaagt gtaccgacgc aaagcgcccc cccttactca ccggggcgcc tattatctaa 1260
ccaacgtcga tcggggcaat ggccgagagg cggaacagtg tgagggtcag ccagaacggg 1320
aacccggggt gccctcccat cctatgggga ggagaga 1357
<210> 298
<211> 1501
<212> DNA
<213> Artificial Sequence
<220>
<223> FG4-2
<400> 298
agccatcgcg cccgcacgct gcggcgtgct cggcccacac cagccacccc gcggtgccaa 60
accgcaaccc gttcgccaca aacgagcacg cgcccgcaca accagaagag cagtgcgtcg 120
ccaacgggcc caagaaaaac caacccggct caagcaagac cgcgacattt ggatgccccg 180
agtctttatg aaacgttctg gcagcacatg cataaattat ttgccggcag caggtaatac 240
ttagtatcgc cgcgaagctc aggtgcgcac gcagaatctg ctgcggcgaa gctcacggga 300
cccagaaaaa ggagccgttg aacgagggga tcacgatcct acccccggac tcggtcttca 360
gatcacccgg tgttctggac ggggaacgca aacactggca tgagttgcct gaagacccgg 420
acctgcgcct cagtctggtg tacagactga aacaaaagaa attgagtagc ttcatctgcc 480
ataaaaaaca gcatgctgcg atgttaaacg atgaaatgtt acaaggtgag aaaatgaaga 540
aggtgactca cggatattta cgaaaattac cccacaacta taatcgtcga atgaacgcgt 600
ggggcaacgg ggcccccggc gaggtgaacg agatgagccg ggagcccagt ggccgcgcac 660
aaggaggctg gtagacactg tccaggggat acggctacgc cgggagaaag ggtcttcaca 720
cgagagcgaa gaccccaggg aagggtgacc gagcatgtga aaaggtaggt gaagaccgca 780
ggggtgcacg gtataccgta gggggaaata gagcaagaaa ggattaaaat gggggaaagg 840
aacgcccaag aaggggggca cggagaaaaa tgggaggagc agaagtgaaa gagaaagaga 900
agatggtgaa tccacacacg ggatctaaag ccggtgttga gaagaaaaac ataccctata 960
gagacggatg tttaccgctt gtccataaaa cgctttcatt actaatgaac ggaggaagtg 1020
ctcattagta ataggagaag atcaaaagtg gtacgttcac gcccaaacta ctcccgaaag 1080
agtgaaatag gacgtgggat caatgccata ttcagtgcag caggagacac aaatacacga 1140
cagaatcgga cacctcgcga gatgaccgtt ggccctgagt atttctacgt ctaacgaggg 1200
tgaagaacgt cgtgtgagta ttgtcacagt aaagcagcca cgaaccatcg accccataag 1260
atgggggaat atagggtatc accccatcag cgtatctagt gggatacact aactaaaaca 1320
gttggcccct ctccaaaagt acaacgcggc ttaacctagg cttgatgagg ctacaacgag 1380
gcagtcagcc gcaaggaact ctgtacgcgt atcaaagaag tgactcacct atcagaccct 1440
aggggactgg aataatcaat cgtcgaaacc accacgagca gagagtggtc atgaaggtac 1500
g 1501
<210> 299
<211> 1558
<212> DNA
<213> Artificial Sequence
<220>
<223> FG5-1
<400> 299
gtggcctacg gggaaccagt agggacggcc acgcgggaaa aggcgatcag acccacctgg 60
cctagagaca gaccaggcta taaccaggaa ctccggtgga ggctcggcgc agctttggtc 120
cacgcgtatc tgaaaagctt acacgaccgg ctttgaaacc accgcaatca aaaagggaga 180
atgtcaaacc ctccgcaaca ggtgaaaaac tagcagagtt taaacattgt gtcgagacta 240
aaaacagccc agaaagcaaa aggaacgacc ctccagcacg gaaaaacaac gaaggaataa 300
accccaagat tggaaattca acttcgcgaa aaagtgctcc acaccagaaa attcgggcaa 360
agaaagacct actcacaaga gaaggtccta tagttacggt gctggttgtt aatggaatta 420
atagccagat agaacacaga gaggaaatcg gttaacaaat gcaacgtaaa cctaaagttg 480
actcctacac atagcgaaat gcctgtaggt gaaagtaaag gatgaaatat cctaatccat 540
acatacagcg aaagcgtgat tgttgaacga agaagggaaa caggccccgg ctctttgaat 600
ccaggagtaa ccaggcttca agcatggcaa tcttgacgtt cactcaagca tgtctggcct 660
tgtaccccaa aaggaataca ctcaaggtgg ggaaatattg agaagataga caatatccat 720
gaggctcagc cagggataca cactccaaca cggcggtgat cgaagaggta gaaaaaaaag 780
ggtaatggaa tatcaacagc gacgctgctc ttgggattcc cgcgatcgcg cgaggcaccc 840
ctaaaaggat cagtcgacat gtctccacgc tgagcagaaa ggtgaaaaaa agagcacaac 900
gaaatggata ggaggattgt aaggggatca ggaacttatc acagactcat cgaaatagta 960
gcaaccaccc agatgtctcc caccctacca ggagggcttc tcaaaaacta atcagttgga 1020
aatcccgccc tgccagtaag gtcttcgagg tagggaatat ggtaaagggc ggtatttcga 1080
gtccccaata gaaacgcgag ccgaggttgg ggacggtctc cctgacgacg cgaactcatt 1140
cgccccggca gctgggattc ttttcttctg taccaacgac agcgccccca gcccgcacct 1200
gcccaacgta caaaatgcgc cagtggtctg gagccgcgat cccggagcgg cgaagaaacg 1260
cctgaatgcg gccgcgcgta cccgccgggc gatgtccgat acgattagtc tgatttgatc 1320
gcggaatgca aacgtaaccg gaactgttgc agtccttata ttctgatcaa tgaacctgta 1380
ctagttgagg cacggattgc cgcgatgtgt attcagaggt aagggagggg acgtcacgat 1440
caaaaacgag gcggtcagtg ggccttttgt tcacatattc gaatgaatcc aatgcgagtt 1500
gaggaacgaa caatttaata attcctttgt tgagccctat atgtcctccc cccttcct 1558
<210> 300
<211> 1947
<212> DNA
<213> Artificial Sequence
<220>
<223> FG5-2
<400> 300
ccatcggcgg tgccctacgg gcgcatccct cggccgctcc acgcccgcct ggaccgcgga 60
cggagctccc gcagaccgat accccggcga ggaccttatc catacctcgt aacaatatgt 120
ggctccaatc cccggtaatg tcgctcagat tgcaatgacg tcgatgcggg ttgccgagcc 180
ctcaatgggt cggtcatgag cggttccggg ggggataggt gaaacggcga acacgcttag 240
taagattgag gcgtttaaac gcggggccgc cgattactca cggacatggg gggtacgagg 300
acctacgcga agggcctcca ggagcgattt gacaagggaa gtgcccaacg gttggctcgt 360
accacggacc agggagtccc gctaggtcgt tatcgcttgc aaaggaaaaa ttagtgaatg 420
gataaaaggg cggtggtgac catcccaatc caggaactag tccagataac aagtggatcc 480
caacagtgag aaaccagggt ttcccgaccc cattctaata accagcggtg ggctgccgtg 540
aggtatcgca agcatattcc cgttcttcaa gcccgattta gaaaaccata tatgaaaggt 600
caaagtacgg aaccccgctg aaagcaaaga agcgcataac ttgcgcactt ttgagttatg 660
aataaactgt cgctgtcagg agtaaacgat gtaaatgcaa ccaaattagc acacaaagaa 720
gacacggtcg agatccgcct gtacaggtgg gggcgattcg cctctttgca ctttgataat 780
tacctcggga ggtcggccca ctccaggacc cactttcgcc taagtgcaaa aggcggtagg 840
ctggtgagtg acaccaattg cgtaataaga gcgactggag aggcacggag atcaacggta 900
aagaatcata aattgaggac gacgggaaca agaacaacgg aagaatagaa taatggagta 960
cgaggaagtt ctaactcaat cgttcaagac aggaagatga gattaacggg tctgcagcaa 1020
acaataaatg gccacaaaat aggtgcaaaa ctccgttacg cgaaccgtct acttatcgtt 1080
atcctgcgag gtattttggg ccgtaacata ccgtactttc agctttctag agttactaca 1140
ttaagagatt aggtgtcgtc catgtcttag ccacagttct accaacgatc cccccccccc 1200
ggatcgccca aaacgcacta ctggcgtgaa caataaacgg atgcgcctgc ctcgtactgg 1260
catttaaata gtcgacctca gtgccgaaaa gagcgtagag acaacacaca caaaggaaga 1320
aaataggaag ttatagaata cacctaaaga aaggaggcag gaatagaatg caaagggtgc 1380
ataaccacct aaccttcata gctgtgaaat agcattgacc aggcacgacc agaacaatct 1440
aaaccggaaa aaggttaaga tcaacagacg gacaacacga caattggcac acgtgagtat 1500
cacatccagg tctcgactgt ctccctgaca gccttcataa cgcagcccca aaaagcaaaa 1560
agcggataat cagtaatcgc gagtgaacaa atcgcaaacc ccatgcgagg gggcaagctt 1620
agaatatgag acgaagagta accgaacata cgcacaaaaa agtctaacaa aataaacggt 1680
ggaactatag tgtataaatc tgttaaatac gcgcttcttt gaagggtatc gtggtgtgga 1740
taaggcgcac aaaataatgc tgtcgattcg agttggaaaa taggtgttat atctgtattt 1800
aggtgatatc gctttaaata ttacccgttc catgttttta aattgtcatc gtagtctaga 1860
agatatgtaa tggttaaaac tgtacttgat cgtttttatt tattgcactg ctaagaacag 1920
gatatttggt gacattatat agtatgt 1947
<210> 301
<211> 1489
<212> DNA
<213> Artificial Sequence
<220>
<223> FG6-1
<400> 301
ccggcgcacg ccagggtcgc cccgcgcctc cgccgccggg cgcacaagcc gcgtctccct 60
ccctgggggt ggcggccgcc cgccggcccg gcgcgcctag ggcgcggcgg tccatgaacg 120
gctcgctacc aggcaggcac ttaggcagcc tgatgttgta gcgttaagaa tggccgagcg 180
gaagcggtta acagcctcca gccgcgaacc aaaccccaag ggatgagaac ggccaattac 240
ccaaatgtac acaacactcc cacccccgtg ctcccaccac cggccctcta ggaccgggcg 300
acaacgagtt agcaccgttg tctccgcccc acggctttgc ccagcacacc tcgcgcctct 360
acactgaccg actaggcctg accacctgtc agcctgctcc taagaccgca cgaatagccc 420
gtagtttccc cgccgcgtca ggacgagccg gccactgggg gcataatcat caggccgtag 480
acgagctttc gtggcccctc ggccggtccg ggtgcaacgg ccccggtccc tggccgactg 540
gacaaccaat cccctggtgt gatcggcacc gaacttgcgc cagccacgtg ccctcaagag 600
cacgggactg ccctgcaccg acccgcatcc ctcaccccgt agacgccgca ctccaacctg 660
tagcgggaaa aattggcaga gtactgtgcc taatgaatgc taggtgaggc aagagagggt 720
tcggagctaa aacgttcggg gctacgctga cctaccgtat gttcccaccg tctgaacgtg 780
tttgcgttta gataccagta cgaaagtttg gatcaattgg gagaatttag tggtgtagtt 840
aagtgagcat tttctataga ccgacttgat cccttagaaa atatggtaag actatggggg 900
atcagtgata tctacgtagc agagttctag tatgagacgc cgagcaaggg cgagctctgg 960
gtcttggcaa agctgattca cgataaagcg atagacgaag taatcgtatc aacgatgcta 1020
cattacacta cttcacgatc gccggtcaac atgtagaaag ggtcggtatt gacagtcgtc 1080
gtctacggtt atagaagttt ccatttatta tatgggacta tatatatgta agattctagc 1140
agcgagtaga tttaacttaa agttcatgtt aaaaaccagg taagtaatcg tcttaattta 1200
ctatatttca tattaggtaa ttcaatactt ccgtaaagct attcttgtgt aacttcaaac 1260
aagaaactat gcaaatacac gtaaacatag aaggagccga tcatctgttt attccaaagc 1320
tgtggttctg ctaagtagaa atagcttcca cactagtcct tctgccgatt acccctaccg 1380
gcgtagatgg atttatttaa tctttacgat atcgtttgaa agtttttctt ttagtaaaga 1440
ttaggtaaat taagcgaatg atagtaatat tcatatataa gtagttaca 1489
<210> 302
<211> 2145
<212> DNA
<213> Artificial Sequence
<220>
<223> FG6-2
<400> 302
acggtctgct gccgcccccg ggctaggccc ggggagggag tgcgggtggg aaccctcctt 60
ggcggggagg ggcgcgtagc ccaggtgctc agacctggcc gtcactatcg tgctccatgg 120
tcccagcgcc ttagtaacgc gtagggacat atgcaggctc ttccgggcag cgccctgcgt 180
ccgcgccgtc ccccctgggt ccagccgcgg ccccgcccac ccccgcccag tgacgtccgc 240
acgcaccggg cgagcaaggc cagcagcggc ccgcggcacc cccagtggcg agcctgaccc 300
gctgcctggg ggaaggctga acgtgggccg gccctcggcc gggtcgacag ctcctcgcac 360
ttagggctgg aaactgtgtc gcaagctgtt ccctgcactg actggccgcg gtggggttct 420
cgcccggggc gtttgccgtc aaggtgttcc cgggtggggg gaggcgccac cggagtactg 480
gggggtctcg tgtgcgccgg caacaccccc tcgaccccgc gtttggttcg tgcccgccct 540
ggtctggcgg agacggaggt cctctcgccg ggggggaggg acgcccgccc agagagctgc 600
tgtgtaggga ggtaccggaa ttggcgagta acttgctgaa gcgtccgccg gtatccgtcg 660
ctagtgtgta aaatatgttg acatcccgca gtatgcgata tcaactaagt cgcatcgagt 720
tgccccttag gccgcacctt acttttaaga aaagtacgat gtgattcttc cactcatctg 780
caacgccaca gcgtcctaca tcacgatggg aaggtttttc attagcgttt tagtgggata 840
taggctaaca tcgcaacgat gattaaggag aaagagcagc aacgcccagg caaagaaaaa 900
gggacgacaa aaccactcaa gcaccgagcg gaacagccta atcgcggact ggcgcgtatc 960
gtaactccgg cctaacatat tcgaagcatg agcaggcacc cccgcagctt cgaccgttat 1020
cgtgatactg tgagccctct ggcacaggta ccagcagaag cagggtggaa agagcgaaga 1080
agaagctacc gcgagaagaa gatgaaaata agaccgtcag gctttgcagc gcaggcgccc 1140
cggccctaga cacttcgcca tagggatccg aacgctgaaa caaaggaccg agcactccac 1200
ccacgccgac tcccacaatc acacgtagat gtccgcaatg acccacgcgt cctccagtcg 1260
tccgctagtg cagcccctcg gagttcccgc actccgttcg gacccgcgcg ggctactggg 1320
ccgtccccgc ggcggctccg tgcgataatc ctcccaggcc cgttccccgc cgcacgctgc 1380
tccccctcgc atccaccccg cgcctcaagt cgaaatccgc tcccggactg acgcccccgc 1440
cccccctggt tccacgtatt atcacgcacg actccccctc cccgccccac tctaacggcc 1500
ctcgccgcct gatcgtcagg cgggatgcac gcgacgcccc cacacgttcc gaccctaggc 1560
tgatacccgt cttcatcgct atcgtcgccg cccgagatag cccaacccac ctccctccgc 1620
gccagatggg cccaggagag aatagggtgc accgatcgcg ggcccgaatc agcgttccag 1680
gtcaagagca ctccgcccta cgggcactac cccattcctt cccaccccct cgttactagt 1740
ccgacgcaga cgttcactgg cgcccagagg taggggagcc aataaacgga agaacgtggc 1800
cgagggacgt gccagctacg ggcatgagcg caaggaccct cgggcagggc tctcacgctc 1860
cccaaccttc tctccgtaaa gtccgccaag cgctggccaa agaactaccc agcacagcca 1920
cccccccatg cgtaagcccc cgagttaacg gtggagtcgc ttccctcgtc ccgccgccgt 1980
taccctgtat gattcacccc gtggcctagt gcaacgtacc acgcggcccg ccctcgccgc 2040
cccgaagccc cgggcggccg gtcgtcagca tgagtgccca tagaccgcca cgcgcgtaaa 2100
caccggccga gccgccgctg gcttttgcgt gtcgacgaac aattg 2145
<210> 303
<211> 1173
<212> DNA
<213> Artificial Sequence
<220>
<223> FG7-1
<400> 303
cctgcaacgc ccctctatca cgcgagtgag ggacaaggaa cgtcaatgtg gggagaagta 60
ggtgacgctg tacccattgc tcggtacccc aatccggagc ctctagtatt cctcagtgtg 120
ggttctaacc aatatggaag ttgttacagg ttgtatgaaa ttattcgccg gacgtcagca 180
cgcggtacag acctgagcat ggtccggcaa cggcgcacac acacccgcct agaatcgaca 240
gccatctatg tcgctggtaa ctcctttttt gtgatgtgac cgcggattaa ttgtccgcgt 300
attttacgct tttgatcgtg ggtacgggta tagtgcagtg agagcatgcg aacggatcat 360
gtcaatatac aggatagcca attggaaggg gtcgatctgc gaacgatgac ataggagaaa 420
caatctgaga ctgccatatt aaacggcaat gccccggatt ctaattgtac gtgttatctt 480
ttcctatctg ggtccagtac ccgcgcatcg atagtcagaa tgaaaattac ggttccacat 540
ccggtctgtc actttgtcct agtggaatgg cgaatcttgt tgcgacctgc cacagtagcc 600
tccatggcga ccccccgttc actgtgaatg gtcgagacct actcatcctt tacatcgaac 660
aacctctgcg gtatgatgat acctgccaca ttatttgtga aagtcagttt gcacgtaggc 720
ctgagaagac gtattaggac ggcctacaca agcaattcat attgagcaag gaaaggagtg 780
gaagacctga ggagaaagaa agtcaaagaa aaacaaggaa aaataaattt gattgtattc 840
agagtaatgc cctgccaagg tccatatcga tccaaaggcg ctacaataga aaaagaaacg 900
caagtcactt cacatttata tcttgcgatc acgcggtttt aatcttaatc agagcttacg 960
agcttctttc cctctatctt ttgtagtatt ctaaatatca tttagtatcg aatgtctctg 1020
ttacgtcttt aacgtttttg tacaatccaa acgacattcg ctacgggctt ggcggtcggc 1080
gcatagctat agcagcgtgt taggcgcggt tagctcgacc tgcagggacg cttgacaagg 1140
actcgggagg gaagaggacc attcctaaat cta 1173
<210> 304
<211> 1201
<212> DNA
<213> Artificial Sequence
<220>
<223> FG7-2
<400> 304
aggggcgggg gatgggcgtc aagtgttggc cccgcagggg gttgccccca cgggggggcc 60
cccacgaaca gaggggtgac ggggccggaa ctccggccgc cactaaggcg cgggcctccg 120
gccagtggaa tcttggttaa ctattgtact tgccgcggtg agagggtctg agagggattc 180
gatgctagga taaaaatgat caaaatgaag tgactgaaat gtacctctgt gcggatggga 240
tcctaagcca gtcggttaag cttagaccat tggtgctaat tctaaatgga tgaattaaaa 300
taacgagaaa actgtagagt tcatgccacc ccctggtcat gcaaaatgtg gtgtacactt 360
ccgagtgcag gggcgattcc tcaaccaacg tagctttgga gtcctcatgt gccgctgtgg 420
agacacggga ttctcagttc gctttggctc cgtccaagat ttgcgtggct gtgtcacagt 480
tcgattgaca gatgtcggac gtcaacggaa gttgtaaaga aacaatcaaa ttgtaagtct 540
gcgcacctta aatgtaatgg tcgaacaccg agttggagac gttacccgcc ctaggcagtg 600
gattggacaa gttgagttag cttgaccccc ctggggagaa ccaatgatca ccggaacttg 660
tgttcaagcc gacactgccg ctccccggag gagctctccc ggtactctgc tgggacacga 720
aatgcagacc tggtcctctc tgaccggatg agcgccgagc caagaaaatg gcagtgcata 780
cgttccagag tgattccggt cctcgacaca actccatgtc gcggtgtggt ccagcagtcg 840
acagtgtgcg tgggcggggc cgagccctcg gcgcacggcc gtcgccactg cagggatgac 900
gcctttctac ccttggcgta gcaggcgtgc tggcgcatcg caggcccttc ctggctagcc 960
cgaaccagga accagccgcg gttgggtccc atattcccat gcgggtcgtt tgggcgtggt 1020
cggttccggc ttgtgcgttg gcgtgggggg aggggaacgt agggcaccgt cccgtccgct 1080
tggctagttt tcgattcttg ctctctaggt tgccccctac ggccctcctt cctccccccc 1140
gactctacgg agccggaagc ccccacctgt cccctggaga atgactctcg cgccccccgc 1200
c 1201
<210> 305
<211> 1192
<212> DNA
<213> Artificial Sequence
<220>
<223> FG8-1
<400> 305
ccggactgcc ttgtgctgga ctacagcggg aaccgcgcgc aaaggcgcgg cctggggcct 60
gagggcctac tcggacgcat gtggctgcca ctccgtccgc gtccgttccc gggctctcgg 120
aaccggtctc aaccggggag gcacgaccac ccctgagccg ccgccagaaa gcggtgcaaa 180
aggatgaaag aggagaccgg gtttgtggag gagggtccgg accatcgagt ccaaccaggt 240
accatctagc cggcgccagc gctttcgccc agcttgtatg ttaaggagta gactttccat 300
gcttgggatt cgtctcgagt cgacggaact ggttcctagg gcagggagcc tcctggagtc 360
accaacctgc cgcggaccta gagcggtcta gtagggggag aggttcatct ccgagttgac 420
gccctcccac gcccatgaca ccattccgag actcggaccg cggctacgaa ttggggcgag 480
cgtcggagac cggaacccgt ccttctcggg ataaccgggg gctcgcggcc gaccttagac 540
gcgacacggc accccgcccg cggtcgcggc aagaagcccc ccccgggaag gacatgcgtt 600
cagttagcgt accgcggtcg gtgcgcgtcg agtcggcgac acttctcaac aagaccccgg 660
agcgtgtggc gggtccctta cccgcgctgg ggcagccgct gccctcctcc caagcgatac 720
ccgacagcgg ggagagggac cacggcgcga ggggcgctgg acggggacct cattgggcac 780
aagcgccggc atagaagtac attaagctca gtgaaatcaa ggctgcgact atgtgtcggg 840
ttcttcctct taactcgttt accttggatc gttttcacaa agtaacagaa ggaaaagaaa 900
tactgagagt tagacatagc agacattaac ccgttggtag ggacccaaac ccggagacgc 960
tatataaccc gtggacaacc tctaatatcg gctgtctcgc gctctctgca gctatcagaa 1020
accgatttag gtaactctat cacgctgccc aaaaaatgaa tagacgacga ttaactctgg 1080
agaggacccc acccccttcc attctcgcca gttctgtaag acgcttggtt gaagcttgaa 1140
tagtccgcac tcgaagccag ctgaatttgg gggtattggt aaacaagtca tg 1192
<210> 306
<211> 1723
<212> DNA
<213> Artificial Sequence
<220>
<223> FG8-2
<400> 306
tcctgcctgt cggtgttgcg cagactctcg ttagcggggt gtgctgggta aggtaacatc 60
tttataaccg tggcaattag tctatcagga aacaatgacg aacagaggaa tcactcactg 120
tatacctcga tagcagaacg gccttccgaa gtgaccggct gacgtccagg gttagcagat 180
atctcattca acaggaaatg acgggtggta gctgaaattt tgactataat tttctgatag 240
ctaaacctat tatacaaaga tacgtatggt aggcacattt ccgtacttaa aaatgtagga 300
gtactagctg ttatgcataa aaaatttaga ccgagtaatc ctattcagga tcagcgtaag 360
aacttgacca gtgacttcgg aatgattgaa aataccaaat tgggtaattt cgtgttcgaa 420
caatgttagc gttgggcaac aataatgtgt taggttggct gtaatataaa gtctaaggta 480
gaggtgtaac aaaagattac caggtctgca acgtgatata atgctttcac cgacaagaat 540
tacaagttac aagggcacgc tcttatatcg atctcggggc tggagccacc atagccacgc 600
gaggacgaag ggagcactag cagtccttct ctactccgta gagccttccc catgcggacg 660
aatgaggacg tgagatcggg cgctctcctg caccctgcac agtagcttga gtagcgctta 720
cgcaatgtcg catcactaga cctgcaatga cttcaatgac ggacgtaccc ttgagtgggc 780
tcgccgaaag tacattggaa tttccgatct gtatggcctt gttaacgtct gcctggtact 840
tttcgctccc acccgtgagg caaaaacagg atcattgtga ccccggatag cgaggctaag 900
gccgataata gacctccggg cgtcaggcgc ccagcagtgc agtgcgcgga gcagtaaggt 960
agtagggcga ggtaggaccg ggctgcccgt atgaccctgc ccccgaacga gaatctgagg 1020
ggacaagtcg tcggcgcttt accggacgag catctcctgg ccccaatgga cgccatagtg 1080
ccagcccggc cagggctggg tgcggcgcga cccggggccg caagaggaga tgggagattg 1140
gccccgctga gcctacagac gcttctccta tgtatcccgc aaccagaaag ggatggggtt 1200
ccgtccgtgg acaacaaccc tatcaatcat ctcgcccgag aaagggacga cttgtttctg 1260
ttcggccgat tgtggtcggc tcccctggta gcggtgcagg cttgagtccg cggttcatgc 1320
gccacttgcc ttctagtgcc tgccctcagg ttcgacgcct gtcgtcccgt ccccgatcgt 1380
cgtgttcccc ctcttacccc cggtccccct gcaaaacgca cggctaatgt caagccacgg 1440
ctgctctgtg ctgggtcgcc accagtctcc gatctcactt cctatacaat acgaccaaca 1500
tcctcaccgc ccctcagccg tcaattttcc tggctaaccg ccgttgtctt ctctgggccc 1560
tatagttgcg ctggcggggc tgatattcgt ttgtaacata ctggtctacg ccgggccgcg 1620
gtaacagcaa aaaggacacg taccacttat acggtggctt ttctcccccg cgtgctgctc 1680
cagaggtgca gtttaattcc ctctgaatta tagtagtgag taa 1723
<210> 307
<211> 3069
<212> DNA
<213> Artificial Sequence
<220>
<223> FG9-1
<400> 307
aagggggaag ggggactggc gcgcggcaaa ccggggcggc gacgaggcca ttgacgctca 60
tttccttcct tttgcctcgg cgccccaccc aacccataca ccccccctca gcgaccgcgg 120
cttccgttct tgcaaaggcc tattccagga ggtacccata ccacagccag tccagcacaa 180
cgaaacggag agaccaaagg gatgaggaaa agtgagataa attcagtcga cggttattga 240
aagagaaaat cgaacgacag atccacatga tggctaacac ttatccaact cagaaagtga 300
gtgtaaagag ggcaacggcg aagggttaga atgaacaaca tgccagaaag attaagaatg 360
cgtagaactt gaatcgagcg tatctaaagt agaatacttc gaaactagcg acttaggtgt 420
ttgagtacgc gagtctacaa tagaagcagc atgcgttcct gttggtaagg gagctggatg 480
ctgattctga tgactttcga ctccccgggt cgagttgttt aagggaactc gagtacccag 540
ataaggccag aatgtttaac tctgaagctc tcgtctgcta aatagcaatt gcgtcgcaca 600
gtttcgcaaa taacatataa atcgacggct ggatctcgta gcaccaaggt gcgatatcat 660
caatgctaac cttaattagc taagaaagaa gtgcaacaat ctcagagctt tctttttaga 720
cacccgaacc cgaacgtttg tttaccctca gcctcgtgcc aggcctgctc atcaatactc 780
ctagattcag acaggaatac aacggtggac cgaatatcgg ttaggcttgt ctgattgttt 840
ctttagacca ctaatggtaa gagtccaaaa atataaaaat aatttcctgt tcggagtgaa 900
aagtaaatag agaaagctat ggaatgaaga attgagtgaa acagtcgaaa ctgagaagga 960
acgggatgaa gaagagtgag caatgatgaa gcaactgggg acaacgatac gtcgcgcgtg 1020
caaagttccc tcgcgccgct tgctccacgg acccagggac agatgcttgc gtttcctgat 1080
ggcatagact ctaccttatc gtccggcatc gcgcgtgggg cccactatag tcagaccgcc 1140
gggctgcgcg cccgctattc aggacgacgg cccgtgaaac tgcgaaggcc tgggactgtt 1200
ctctccctgc aatgtccgcg ccgtgacaaa gagatcacat cacgctcagc acggcgtctc 1260
tcgtaagacg ccgggcataa ccccgggagt gccctggcca gctgtggagg gtagggacct 1320
tgaggaggac cctcttcgat ggtaaggcct gaccagggcg ggagcccgca accggggacc 1380
cctgggcctc gcggagagcg tgagggccag caagccaggg ggccgctccc gtacccgcat 1440
tcagataggc gccgctcgta gccctaggcg agaggccggg gaacagaagc catggatgaa 1500
cgtagcagga gcccccgagc gggctcatcc cgggagtgga gtgcacagga atgtcccgaa 1560
cgctgcgcgg ggggaactaa agtgcatgtg ccgaactaac ctcgataggg caccccatcc 1620
gtcgtcacga aatactcccc gtcgttaggt ctcggctgtt cgcccccccg ggcggcgcct 1680
ttatccgtcc ccgaacacac gaccatcgaa tgcacagttc gacctgcgcg ttaggcttcg 1740
tcgaatcaac agaggatccc tggtcggcca tgcgtactat agacgagcgg agcttcttcg 1800
ggacgaagtc cgtcgccaac gatggacgcg cacccgtgac gggggtacct cccagaccaa 1860
tgaagccccg agacacgcgg gcagccgaat cgcgggctcc ttaaaggcca cgagccctcc 1920
cggcggtccc acacggaccc aagaggccgc cgccccgcct caacctagag ccacaaccgc 1980
cgaccagata gaccgcaggg tccgggggtg gacatctgaa aaaggcgagc cggcggcgca 2040
gaggaatccc ctggcgctgc gtctggcgca tgcccggcgg gtccctgctg tcccgagcga 2100
gcgttagcaa ttgagcacta gggccacaca gcaggcgaca gcacatcggt agggctctgg 2160
ccctcgcatt gtgcacaccg tgagatcaca gtacgcccgc aatcccgctg cttggttatt 2220
tcggcaggtc ccctcgaaac atccactcga gcaaccccaa gtgagggacg acctcccact 2280
ggaggcgtcc gccggaccgg acgcgcaagc cgaaccgggt gggccgtggg ctcccatttc 2340
ccttcacgcc acagcccagc catgaaccac cgcccgttac gcagagggga gacagaaaca 2400
gccgtcagct ccgcacgcta taggactttc gggtgggtgg gacaccggag cggctgcgag 2460
cggactacga gcggttcaga ccctccgcac cacgtgctag aggcgggcct agggctctgg 2520
tgggcgcaga cagaatcttc agaacgggga cccgctgggg acgccgcatc cctgtcgccg 2580
ggcgcctgtg acggtggcag tgtgtgcggt tcgggcgggg cagcgatacg ttcgccctct 2640
cacgtactgt gacggcgagg cgccaccctt tgcgacaccc gcgtatcagg ctaacctatc 2700
gtgccggtcc ctagcccccg gcgaaccacg aatcatgggg ccggcatcgg tattcgacca 2760
ccacggtcgc cagggagacg cgtaagaacc gcgcctggtg gcggttgcgg cgtccctgtc 2820
gggttggtcg tccgctcccc ggtgtcgttg ggccagggac agcgctcgcg aaacaccgcg 2880
atccgggctg cacagactgg gcgggaattg gcggagcgac caggcccagc cgctgcaccc 2940
cccctgtggc ctgggctagc ctgggccgct gggtcacaca aggcaccatc ccccccgcaa 3000
ctgggctgcc agtcataggt gaccatactc gctcgccgat acgatcctga gcatggtggt 3060
accccgggg 3069
<210> 308
<211> 3145
<212> DNA
<213> Artificial Sequence
<220>
<223> FG9-2
<400> 308
gtcgcggtac gaatgcgcga acccagaaga acaaggcgtg ggaccggggg tggatcacgg 60
ggtgcaatcc cccggctcgg ctcgaggctg ttcccgaccg gtgacaacag cgggaggccg 120
gcggatggtg gagggagttt tcccgagctg gccaagtctc ccccttctgg tgagggcgga 180
caaggaggcg catgacgtca taggccctct tggtgctatg agtggagaat gcaatcatgc 240
gtaggcacgc ggagcgcacc actcattttt cggcccaacc agggctcatg aagttgtact 300
tttgtgatcg gggtacgcca agccggctat cacccagcgc ttacttcctc acgcgtccgc 360
cctctgcaag gtagactaga tagttatgtg agcaaagcgt agcttgctct cctagacccg 420
ctcaaaccga cggtactata aacgcacgtc tatcgtcaaa cggaaggtcg gcatagaaac 480
gtggcatatg gggaagctac taccaaccag ggggtcgagg cgcgtgcgtt cggaaccttc 540
gccgaacacc ttgctcccag gcggcactcc tggcccataa gagggcagca gggatggcac 600
gctagaggct ggggtctatg ctctcagccg ttcggaggta cggtcctagc ccccttgaag 660
tatacctccg gggcgtgcca accagtacca acgtcatgac ccttaattcc gtcggaatcg 720
acacgcacat tgccctaaac caactacgtc tatccacgca ggcgctaccc ttgtgtgagt 780
tcggcgcggg agcagcccgc tattcgtccg ggaaatagta gaagacaggc aagtcactcc 840
taaacgggaa tgcgaaaccg ctcatatatg gtgacattct taggtggctt gctccaatag 900
cgcaaaagta ccgtgaagga agaccagcaa ctgatgtcac atgccctcgg cagaccggac 960
tgagaggctg cataaggaag gacaagccgc gcttgtacct catggctcct cggagggaac 1020
gtgacacccc aaattctatg ctaaatcacc gaacgtcgtt accggtttaa gatgcgatca 1080
taaccccaac agagggggaa catcgggcta gtactagtgt gaaccttcag gtaccagacg 1140
gactagagaa atgtagggtg accagtccct cctcttaaca tcgcacagtg tcgttggacg 1200
gtcacgtagg aaggctgcgt gtaaccgaag cgagagccaa acgccagcgc ttgccgcgag 1260
ggtaccccgg aaacggcagg ctccgcccga ccctaaaacg gtggtgaccg aggaggaaaa 1320
tggctaacta gcggtcgtgc caacgtgttg cggctgcggc tttagatcta cgggcgccaa 1380
gcgcttgacg ggaggatcaa cggcacgacg gtcttttgcc ctcaagtttt aggggtacag 1440
taagcccgct ctaaacactg ttgtgcggac acccgaccag cacgggatac cgttacccag 1500
gctggccaac acggtcgaac tgcagattgc tgcggtaaag gtcggcgccg gcaacttact 1560
gaagctcttg ccgcggttta taaggtctcc tcctggcagg ccgagcgcca tggcgctacg 1620
aggaggtccg gcatcatgat gccctatcta gttcgacgta gcaccagacg ggacggggcg 1680
ttccacgcag ttttgacgac cgctcgggca gaaaacacgg cgatggcggg agtacggtgc 1740
tgatcactca ccgtgcccgc ggtaatgtca cggcgagccg ctgccggaat gcccctccta 1800
acgccctctt gcggccgtcc gcggcatccg tcctctgtgg gtaattgaca ccgttggcca 1860
actcctctcc ttgtcggcac caaccaggac atcaacactt gggtttgcgc agatgggcgc 1920
aaccccgtgc cgcagccaag gcgcctgtgg tttacggatg aacccacggc tcgatgtgtt 1980
acttgcctgg accgtggtag cggtgcctga gcggtcggct cctgcgacaa cctattgtcg 2040
ccattccttg gtccctcgac tccacaactt gtgttgcgga ggcgtggcgc tagattaggt 2100
gacatggccc cagcgcgatt gaggacggcg gcgtcgtact ggggtagagt gacgcaaagc 2160
cccgggatct atcctaagct actatacctt cgaagcgccg ccatcgccgg cgtgtgtccg 2220
tgcgcttggg cccctcccga aatggcgggc gcgccgatac tgggtaccgt gggccaattc 2280
aatcggacgt ggggcgcggc tcatggtctc cacctaggcc cgagccatgc cgccacccgg 2340
agctgagtcc ttctgtctat cagtacgggg aggaagtgac tggacgagcc ggtggggggg 2400
gtttgcttcg gagcccttga gcgggacgcc ggtacagggc ccagagaacg ccgtaccgtt 2460
gggacggggc tcgttaagcg cccacaccag ccttggtgtt acaggccttg acccaggaat 2520
ggtttagtac atctgccccc tcgtgaagcc gggacgtcac aggagaagat gttcgtgcat 2580
aagaaggaat attacaatat aatggtaggc gggctagaag taataacaaa ttgtggctaa 2640
acctcgggct aaccggaact tcctacgtaa aaggaaaagt gaacaaggaa aaattaatgc 2700
aaataaatta cggacttggc gcagtaaaaa aacaggatat caatccaaag aaatcgaacc 2760
tgtcgatcga ccagagggat ttgtgccata agaaatagta gcgagaaaaa gtacaacgga 2820
gaaagagaaa ggcaaactac cgcagtgacc gcgaagcaga ctaaggcggg gattaactag 2880
ctctgaagat caccatgggc tatagcctca gaaatcggga aacggggaag aaaagaagaa 2940
ttagcaagac tacccccaga ccagaccggt aattcggctt cgtggctttg accgcgacat 3000
cggtacagga aggccagggg gggtgatggg tgggggggag cgtgcacgag cggaaggaaa 3060
tatcttatta gccactaacg gttggttatt gctatgcccc tttccgagaa atgttcgcga 3120
agttgagtag cttagctggt ccagt 3145
<210> 309
<211> 1104
<212> DNA
<213> Artificial Sequence
<220>
<223> FG10-1
<400> 309
accgcgcctt ctctgccccg tgcgggggct ctggtgctgg ccccgggccc acgtccaggg 60
gcctggcggt ctggctccgt caggctgacc cttgtctctt gtcgcgctgc acgcggtctc 120
gcccggcgcg gttgtcagcg gcggccgctg catcctgaac tcccgcggtt tcgggaccgt 180
ccaaagggct cggtacgcat cctggccttc gttttgtgag taagaaatct cgttccactg 240
ggtactgctc ctcgtcttcc ctctcctaac tacggcgaga aatcctcacc actaccatac 300
tcacgacttt gatggcgtcc gagcccctaa acgttcactc gcatgacgtg ctagtcccga 360
tggtttagga gacaaatggg ctcgcctccg ccccgcacga cctaggtaag cgatatggag 420
cctcggggtg gctgcaaagg taccatcgac tcacgaagcg atgacgccag gacatgatca 480
ccgacaatcg ggtactacgg ctggagaggt tattgtcatc taattctagt ttggtcttga 540
accgaagatc ccttatggcc tctttcgacg gaaccaataa gactacgagg gctggaaaaa 600
tatcgttaag tgacgaatac ccggctgctt cgtcgttcac aacttctgcc gaccgctacc 660
cactcactgt cgtgacagag acgcctctac aacgtcacgc tgtagacctc acaagggcta 720
cggataggat aataccgggg cattcgtatt tgattaccag gccacgcctt tcctccaagt 780
cttccgagag tcaggctacc cgaacgatac ttacttagat aacctagtcc cggccacgac 840
aaagacgacc gaacttctgt taagacctta aaggaactac aaacgacccc ctaaggatcc 900
gcggacaagc cggcgcctca attttcttcc ccggtggccc gagttttctt attatgcctt 960
atattatttt tgtccgttgt ggtctctgta tggttactgt taatatctct ggtattttgg 1020
ttcgtttgtt tattctgtaa agttccctat ttttgttact aatgattact gacggcttgt 1080
atttattata tgtccttaaa agct 1104
<210> 310
<211> 1121
<212> DNA
<213> Artificial Sequence
<220>
<223> FG10-2
<400> 310
atggatgggt gtgggaatgg catccggcca actgtagtcg ggttctcttg actcggagga 60
aatgcttagc ctgtgtgacg aggtttgcgc ccgagcgcga tctccgtacg gagatggtag 120
tcgcgacata ggccatgtgc gagccgtagg ctcgggccaa tcacagcacc ctcatcgata 180
ctccgttgta cttagatcgt acctacagcg agccgatcga gatttggtgt acagtttgtg 240
gaacaagcag tttccaatct accgcacagt gacgatgcgc cagattatct catcagcagc 300
ggatcgatag ataaccacac attgatgctc gtaagttgtc cccccaggcg gctgcgcctg 360
ctaggtcacc caaccctggt accaaccaca ggacgaaaga atggattcgc taaaatggag 420
cggaggtgtg ggcaaaagcg cacgagcgtg tcctctcaac tgtccacctc cacttgtgga 480
gttgcctggc cggggtttct acattctaga ccaggccggt ctagaacgat atggcaaggc 540
gccggagctg tcgtcgcgca tattccgcct ctactggaag gccagcgccg gacgcgcccc 600
tgaaatccac gcttgatcgt aggcatgccg ccaggtacaa ggctctttgt gcggcaagag 660
tcctcggtgg cactggaggg tgtctttgga tagcacgctg tcccgggagt tcctatggat 720
atcggagccg ccagataact caaattgcga gaagattggg gctggatcgt tgccccgtga 780
gcggggtaac cttcccgact ggcccaccaa ggaaccattt gttttgcgct tgacacatcc 840
cgacttcttg cgcatttcgg ccgtgagggg gcaccagggt gcctatttac ctggggcttc 900
cgccagccta gcgtcccgga gtagtacctg agctgttcgc gtgagctaac tacccccgat 960
ggtcagcgaa cgacatgttc ggcgggaggt cctagctctg cgcccgagac gacggtcgcg 1020
agtgcgtcag tcggtctata cactctcact ccaccgggag caaatgaggg gtgacaaagt 1080
caaaggccga gccccatgga gcgcataata tctagcgcgc c 1121
<210> 311
<211> 881
<212> DNA
<213> Artificial Sequence
<220>
<223> FG11-1
<400> 311
ggattggccc ctccgcaacg attgggcacc gccccccctc tacgctctcg gtctcgaatg 60
ttcttggtct ttcttatggc ggacagctcc tgggtaacgc agccttacta cccggcgaat 120
agtagtggat gtcagagtgg ttcatctcaa gtggagcggc atggcaccat taggcggggc 180
ggcgcgcaag agacgccagc gtgtaagtga accactcacg cgccagccca gtgcgcatcg 240
aacgggcaca cagtccgtgg cgggctccct cgaaaacgac cgcgatcgga tacattggag 300
cgctcgagta cggcgccggc tgcccggcgg cgcccatgga acagtcccag accgaatagg 360
ctagggaaac gaggtcatag gatgggttgg atagagtatt tgctcgcacc gttgagggat 420
tcgggcaatt acgctggcga aaggcgttgt gagggctccc gatgccacta gtagtgaact 480
tggtcgcagg ggagtaacgc tgagtccgca gatccgtcct aggactcgca agcgggcacc 540
taatgccgta cactaaggca aacccactca aaacgaactg ctagattggg cgttggcaca 600
acacgagcgt cacgcctagg gccacgcaag aaccggcctg gctagtccca acgcctgcgg 660
cgcgagcgga atggcaggca aactaggcgc tgcggcgggg ggtgtacacc aggaacatgc 720
acccaaccga cgggacgggg cggggaggga aagcgcaccg aaatccgggg gggccttcgt 780
acctgcgccg aagtaagcaa gggggaccga tgctctccag ccgcaccccg gctcggcgcc 840
cccgtctgcg gacggcaccg cctttggtcc ctcatgctgt c 881
<210> 312
<211> 1092
<212> DNA
<213> Artificial Sequence
<220>
<223> FG11-2
<400> 312
gggcggggag ggtttgcagg tcgacctgcg gagtccggct ctaccccgcg cttcaggcag 60
gctcggcggc cccacttcgg cccgcggctc cacccccggc tccgctccgg cccaactgaa 120
acgctccaca ttagactgaa agatgagaac tggcggatac gggataaaca ggtcccggat 180
gttttacctt gttgtcaggg agaagagaac taggtctaaa tgtagggcaa gaggtgtgag 240
ccttcgcagg gatgtaatta agaaactcgg ggttagttcg cgcggttact cctgtctgac 300
gtgaagcgag cgaagtcgac aagcactgcg aaggcacttc tatggctggg ggcaaattcc 360
gggcctctgg caggggcttc aggattatcg caccatgtaa accccgacgc cgtaccacgg 420
cccgggaccc ttgcggaacc cttcggccgg tacggagaca ctcttcgaca catgactggc 480
ccgggcgtcg cgaatattcg agtgatatgc tcttcccatc ctggagacga gtggtggcgg 540
gcccctatag cagagcacta tctggagccg ccgaggaatg aaacagagct aggattcaac 600
actagtccga cctcccacct cgtttacgct aatcaggtcg tcgccgccga gcgcgggcac 660
ctagtcgggt tccgggggca ccgaaaatac tggaatcata atccgggcag gaaaggtcct 720
ggtgattgca gcatgcctcg gccggcttaa actcggccca tccgcaggac tctgcacata 780
gccccatctc gctcgagcaa cctagccaca tcgcccgccc cctggggcct cgagtcgacc 840
gtgctccggc tcctcctccg tccgccaacc acagtagtat cgtgcctcag gacctacccc 900
gcgcgcgttc acaccaacga ccgcagctct ggaccccacg cccctgttgc gggtgccttg 960
gctgcgcata ccgccccccg ctcagcttcg gccatagacg gcactccgac ccccgccact 1020
ctacagggtt gccggcccaa ggtccgctag cagccggcgc agatcggcat gtggaagggg 1080
ccgtccccct tg 1092
<210> 313
<211> 510
<212> DNA
<213> Artificial Sequence
<220>
<223> FG12-1
<400> 313
aggcagtggg agtcccgcca gggaggcagg tgaccaatgc tcttccgagc tcctgggacc 60
aaccactgag acgtcgttgc gctcaccgga cccgatgcta caaacccgag gtgcagcgtt 120
gacagctcgt ggatagccgg gctggagttg gattgcatcg ggcgttattt tcaaggggag 180
ttcggtgcag gaaactggga tcggcaggtg agaggtacaa gagttggagg accgtacggt 240
ctccccagcc tacggtccgt cacacgatta caccttctcg cgacgcgtgg acccatgaat 300
ataccctcac ccctcgtgaa ccactattct ggggcaaacg accgcccggg agcaggcgtt 360
catcggacgg gctcaccgct gggagcaaag gtcgttacgg aagaatatgg atgtagggta 420
ccaatactaa gggtaggact ggcggggcgt gtgggggcga acgtactaag aaagttgtaa 480
ccctcgaggc ggcctccact caaatcgacc 510
<210> 314
<211> 814
<212> DNA
<213> Artificial Sequence
<220>
<223> FG12-2
<400> 314
ggaaatattt tgcgtctcac acgatcgcga gggagttacg ggtaacacct agcgggcccg 60
tcgtccgacg ccaggcgccc aggccatcgg cccccaccgc aaaggctgtt aatctgcacg 120
tatacccgac tggcgcagtt ttgagacctg gaccttgatc cttttatctc tgtcctgctt 180
cttgttcttg tcggggccgt tttagtcacg cttttggtta tacacggcca tacttatctt 240
gcgcgctagc agacatattg aagaagcatg tgtcgctgtg atcggtgtaa gcgcggataa 300
agccgtgcga tcttccagca ggtgaaggtc gaggaagcag gacgcgccca ggagctgtcc 360
gtgtgagtgt aagaggtacc cgattgcgag agcggatcac accctaccgt tgcccgatgg 420
aacgctggcg cggtctaccg ctcgctgaac ggctccgtga acggtacttc cgtcccctta 480
atgtatgggc ccacgctgtc ttagagcgcg ctaaggtgat ttgtcgaggt ggaggagacg 540
ggcgactgcg ggaagagaag tccctgagcc atgtaccttg cggtgaggaa ggcgcgaggg 600
ggacgggcgg ttcttccgta ctgtggaggg gccgcgccca ataatggtcg tgtctgaatg 660
tttactgcgc ctccgtaacg cggccgcctc ttgacaccgc ggctccctac ccgcctcggg 720
cgagtgagca ggtttcagag agagtctaac aagagggttc tcttatctcg ccgcagctcg 780
tacaacatcc ccaggtaact atgtgcatca ttct 814
<210> 315
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 315
gccgcagaaa gatttctctc tactgtccat tcacactaaa aaggaagtaa gggaacaact 60
gccacgggat ctcaggtcga gtggtgttca ggatgagaca tgaaacgtgg aaactgggga 120
ctggggctcc tttggtccct tctggaggtc ttatttccgg 160
<210> 316
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 316
gccgcagaaa gatttctctc tactgtccat tcacactaaa aaggaagtaa gggaacaact 60
gccacgggat ctcaggtcga gtggtgttca ggatgagaca tgaaacgtgg aaactgggga 120
ctggggctcc tttggtccct tctggaggtc ttatttccgg 160
<210> 317
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 317
acacagccat taagaaaaaa aaggaaagaa acacccatta tacgttacaa tcaaaacaaa 60
aacttcattt tctaccttga accttttaga cgaaaaacaa tggacaacaa aggaataatt 120
tgaatactct acaccagaga taagacatac tgattacaac 160
<210> 318
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 318
acacagccat taagaaaaaa aaggaaagaa acacccatta tacgttacaa tcaaaacaaa 60
aacttcattt tctaccttga accttttaga cgaaaaacaa tggacaacaa aggaataatt 120
tgaatactct acaccagaga taagacatac tgattacaac 160
<210> 319
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 319
caatatcata gactacctca ggaagggctc cttcagtttg agatggtgta taaggactgg 60
taggttgaga cccacatcta actacacgag gtgtgcttca ctcgtcgtcg ggtgtcacag 120
gcgacaaaga ggaaggagga aaagtaacgg acgagagtct 160
<210> 320
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 320
caatatcata gactacctca ggaagggctc cttcagtttg agatggtgta taaggactgg 60
taggttgaga cccacatcta actacacgag gtgtgcttca ctcgtcgtcg ggtgtcacag 120
gcgacaaaga ggaaggagga aaagtaacgg acgagagtct 160
<210> 321
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 321
gagatccgaa aaagaactag tcccctcgta ccccacttta gactcgcgac tgtgggagca 60
caccagtctt gaccggagct actaactcag gagagaacgg tgtgacttct cgactacagg 120
acacccctcc ttctcttggg ggagaggtac aaggagacct 160
<210> 322
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 322
aaggagatcc gaaaaagaac tagtcccctc gtaccccact ttagactcgc gactgtggga 60
gcacaccagt cttgaccgga gctactaact caggagagaa cggtgtgact tctcgactac 120
aggacacccc tccttctctt gggggagagg tacaaggaga 160
<210> 323
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 323
agttactgtt acaagacttt aaactacagg tactaccgac gatgacaaag aaggactccg 60
gagtcgtctc acccaggttt gtggtgtggt tccaaacggt ggcagtagtt taagacgaac 120
accaacaatc gttgtgaccc tccttccttt tcttttccat 160
<210> 324
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 324
agttactgtt acaagacttt aaactacagg tactaccgac gatgacaaag aaggactccg 60
gagtcgtctc acccaggttt gtggtgtggt tccaaacggt ggcagtagtt taagacgaac 120
accaacaatc gttgtgaccc tccttccttt tcttttccat 160
<210> 325
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 325
agtctatcgc taccactcgt cgaccccgac ctctctgctg tcccgaccaa cgggtcccag 60
gggtccggag actaaggagt gactaacgag aatccagacc ggggaggagt cgtagaatag 120
gctcaccttc ctttaaacgc acacctcata aacctactgt 160
<210> 326
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 326
agtctatcgc taccactcgt cgaccccgac ctctctgctg tcccgaccaa cgggtcccag 60
gggtccggag actaaggagt gactaacgag aatccagacc ggggaggagt cgtagaatag 120
gctcaccttc ctttaaacgc acacctcata aacctactgt 160
<210> 327
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 327
acgagtctat cgctaccact cgtcgacccc gacctctctg ctgtcccgac caacgggtcc 60
caggggtccg gagactaagg agtgactaac gagaatccag accggggagg agtcgtagaa 120
taggctcacc ttcctttaaa cgcacacctc ataaacctac 160
<210> 328
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 328
acgagtctat cgctaccact cgtcgacccc gacctctctg ctgtcccgac caacgggtcc 60
caggggtccg gagactaagg agtgactaac gagaatccag accggggagg agtcgtagaa 120
taggctcacc ttcctttaaa cgcacacctc ataaacctac 160
<210> 329
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 329
gatactcggc ggactccaga ccaaacgttg accccagaga ccctcctccc caattcccac 60
caacagtcac cgggaggtcc actcgtcatc cccccgaaag aggacgacga ataaactgga 120
gggatattgg ggtactctac acgtttcatt tacccaaatt 160
<210> 330
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 330
gatactcggc ggactccaga ccaaacgttg accccagaga ccctcctccc caattcccac 60
caacagtcac cgggaggtcc actcgtcatc cccccgaaag aggacgacga ataaactgga 120
gggatattgg ggtactctac acgtttcatt tacccaaatt 160
<210> 331
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 331
gtagtgtgac cttctgaggt ccagtcctcg gtgaacggtg ggacgtgtga ccggacgaca 60
cggggtcgga gacgaacgga gactggggac ccgggtggag aatggctaaa gaaggtatga 120
tgatgggtag gtggagagta gtgtaggggc cgccccttag 160
<210> 332
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 332
gtagtgtgac cttctgaggt ccagtcctcg gtgaacggtg ggacgtgtga ccggacgaca 60
cggggtcgga gacgaacgga gactggggac ccgggtggag aatggctaaa gaaggtatga 120
tgatgggtag gtggagagta gtgtaggggc cgccccttag 160
<210> 333
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 333
ctctctggcc gcgtgtctcc ttctcttaga ggcgttcttt cccctcggag tggtgctcga 60
cgggggtccc tcgtgattcg ctccattcgt tcgtcctgtt cttcgccacc tcctctggtt 120
cccacgtcaa tacggagtct aagtgaaaat agtggaaagg 160
<210> 334
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 334
ctctctggcc gcgtgtctcc ttctcttaga ggcgttcttt cccctcggag tggtgctcga 60
cgggggtccc tcgtgattcg ctccattcgt tcgtcctgtt cttcgccacc tcctctggtt 120
cccacgtcaa tacggagtct aagtgaaaat agtggaaagg 160
<210> 335
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 335
tcttcgccac ctcctctggt tcccacgtca atacggagtc taagtgaaaa tagtggaaag 60
gaacggagaa aggatcgtga cgggttgttg tggtcgagga gaggggtcgg tttcttcttt 120
ggtgacctac ctcttataaa gtgggaagtc catgattcag 160
<210> 336
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 336
tcttcgccac ctcctctggt tcccacgtca atacggagtc taagtgaaaa tagtggaaag 60
gaacggagaa aggatcgtga cgggttgttg tggtcgagga gaggggtcgg tttcttcttt 120
ggtgacctac ctcttataaa gtgggaagtc catgattcag 160
<210> 337
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 337
gttcgtcagt gtcgtgtact gcctccaaca ctccgcgacg ggggtggtac tcgcgacgag 60
tctatcgcta ccactcgtcg accccgacct ctctgctgtc ccgaccaacg ggtcccaggg 120
gtccggagac taaggagtga ctaacgagaa tccagaccgg 160
<210> 338
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 338
gttcgtcagt gtcgtgtact gcctccaaca ctccgcgacg ggggtggtac tcgcgacgag 60
tctatcgcta ccactcgtcg accccgacct ctctgctgtc ccgaccaacg ggtcccaggg 120
gtccggagac taaggagtga ctaacgagaa tccagaccgg 160
<210> 339
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 339
agaggcgttc tttcccctcg gagtggtgct cgacgggggt ccctcgtgat tcgctccatt 60
cgttcgtcct gttcttcgcc acctcctctg gttcccacgt caatacggag tctaagtgaa 120
aatagtggaa aggaacggag aaaggatcgt gacgggttgt 160
<210> 340
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 340
agaggcgttc tttcccctcg gagtggtgct cgacgggggt ccctcgtgat tcgctccatt 60
cgttcgtcct gttcttcgcc acctcctctg gttcccacgt caatacggag tctaagtgaa 120
aatagtggaa aggaacggag aaaggatcgt gacgggttgt 160
<210> 341
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 341
acacctcata aacctactgt ctttgtgaaa agctgtatca caccaccacg ggatactcgg 60
cggactccag accaaacgtt gaccccagag accctcctcc ccaattccca ccaacagtca 120
ccgggaggtc cactcgtcat ccccccgaaa gaggacgacg 160
<210> 342
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 342
acacctcata aacctactgt ctttgtgaaa agctgtatca caccaccacg ggatactcgg 60
cggactccag accaaacgtt gaccccagag accctcctcc ccaattccca ccaacagtca 120
ccgggaggtc cactcgtcat ccccccgaaa gaggacgacg 160
<210> 343
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 343
gtcagtgtcg tgtactgcct ccaacactcc gcgacggggg tggtactcgc gacgagtcta 60
tcgctaccac tcgtcgaccc cgacctctct gctgtcccga ccaacgggtc ccaggggtcc 120
ggagactaag gagtgactaa cgagaatcca gaccggggag 160
<210> 344
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 344
gtcagtgtcg tgtactgcct ccaacactcc gcgacggggg tggtactcgc gacgagtcta 60
tcgctaccac tcgtcgaccc cgacctctct gctgtcccga ccaacgggtc ccaggggtcc 120
ggagactaag gagtgactaa cgagaatcca gaccggggag 160
<210> 345
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 345
ctttcccctc ggagtggtgc tcgacggggg tccctcgtga ttcgctccat tcgttcgtcc 60
tgttcttcgc cacctcctct ggttcccacg tcaatacgga gtctaagtga aaatagtgga 120
aaggaacgga gaaaggatcg tgacgggttg ttgtggtcga 160
<210> 346
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 346
ctttcccctc ggagtggtgc tcgacggggg tccctcgtga ttcgctccat tcgttcgtcc 60
tgttcttcgc cacctcctct ggttcccacg tcaatacgga gtctaagtga aaatagtgga 120
aaggaacgga gaaaggatcg tgacgggttg ttgtggtcga 160
<210> 347
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 347
ctcttagagg cgttctttcc cctcggagtg gtgctcgacg ggggtccctc gtgattcgct 60
ccattcgttc gtcctgttct tcgccacctc ctctggttcc cacgtcaata cggagtctaa 120
gtgaaaatag tggaaaggaa cggagaaagg atcgtgacgg 160
<210> 348
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 348
ctcttagagg cgttctttcc cctcggagtg gtgctcgacg ggggtccctc gtgattcgct 60
ccattcgttc gtcctgttct tcgccacctc ctctggttcc cacgtcaata cggagtctaa 120
gtgaaaatag tggaaaggaa cggagaaagg atcgtgacgg 160
<210> 349
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 349
gaacttgtcg aactccatgt ccaacctctc gaggtgcaac ctcgggtaaa gaccgtccgc 60
tagttcctct ataaggtggt cttagcatcg tttgtctcgt ctccatcatc ctaaacggtt 120
cttccttaac cgttgttaga cagttatgtt ctttgtgtac 160
<210> 350
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 350
gaacttgtcg aactccatgt ccaacctctc gaggtgcaac ctcgggtaaa gaccgtccgc 60
tagttcctct ataaggtggt cttagcatcg tttgtctcgt ctccatcatc ctaaacggtt 120
cttccttaac cgttgttaga cagttatgtt ctttgtgtac 160
<210> 351
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 351
aaacgttgac cccagagacc ctcctcccca attcccacca acagtcaccg ggaggtccac 60
tcgtcatccc cccgaaagag gacgacgaat aaactggagg gatattgggg tactctacac 120
gtttcattta cccaaattga taacgtgtca acttttttga 160
<210> 352
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 352
aaacgttgac cccagagacc ctcctcccca attcccacca acagtcaccg ggaggtccac 60
tcgtcatccc cccgaaagag gacgacgaat aaactggagg gatattgggg tactctacac 120
gtttcattta cccaaattga taacgtgtca acttttttga 160
<210> 353
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 353
tctctggccg cgtgtctcct tctcttagag gcgttctttc ccctcggagt ggtgctcgac 60
gggggtccct cgtgattcgc tccattcgtt cgtcctgttc ttcgccacct cctctggttc 120
ccacgtcaat acggagtcta agtgaaaata gtggaaagga 160
<210> 354
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 354
tctctggccg cgtgtctcct tctcttagag gcgttctttc ccctcggagt ggtgctcgac 60
gggggtccct cgtgattcgc tccattcgtt cgtcctgttc ttcgccacct cctctggttc 120
ccacgtcaat acggagtcta agtgaaaata gtggaaagga 160
<210> 355
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 355
tggtccagga attgacggaa tagtaagaac agccggagtc ggaagacggc gtcgcagagg 60
tgttacccca ccagtcccaa ctagaggtcc acgaaaaacc ggtagtatat cgggtaccac 120
ctcaacaggg cttcacggac ccgaaagtac taggcgaggt 160
<210> 356
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 356
tggtccagga attgacggaa tagtaagaac agccggagtc ggaagacggc gtcgcagagg 60
tgttacccca ccagtcccaa ctagaggtcc acgaaaaacc ggtagtatat cgggtaccac 120
ctcaacaggg cttcacggac ccgaaagtac taggcgaggt 160
<210> 357
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 357
tgcctccaac actccgcgac gggggtggta ctcgcgacga gtctatcgct accactcgtc 60
gaccccgacc tctctgctgt cccgaccaac gggtcccagg ggtccggaga ctaaggagtg 120
actaacgaga atccagaccg gggaggagtc gtagaatagg 160
<210> 358
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 358
tgcctccaac actccgcgac gggggtggta ctcgcgacga gtctatcgct accactcgtc 60
gaccccgacc tctctgctgt cccgaccaac gggtcccagg ggtccggaga ctaaggagtg 120
actaacgaga atccagaccg gggaggagtc gtagaatagg 160
<210> 359
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 359
gtgaccttct gaggtccagt cctcggtgaa cggtgggacg tgtgaccgga cgacacgggg 60
tcggagacga acggagactg gggacccggg tggagaatgg ctaaagaagg tatgatgatg 120
ggtaggtgga gagtagtgta ggggccgccc cttagaggaa 160
<210> 360
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 360
gtgaccttct gaggtccagt cctcggtgaa cggtgggacg tgtgaccgga cgacacgggg 60
tcggagacga acggagactg gggacccggg tggagaatgg ctaaagaagg tatgatgatg 120
ggtaggtgga gagtagtgta ggggccgccc cttagaggaa 160
<210> 361
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 361
ctaccactcg tcgaccccga cctctctgct gtcccgacca acgggtccca ggggtccgga 60
gactaaggag tgactaacga gaatccagac cggggaggag tcgtagaata ggctcacctt 120
cctttaaacg cacacctcat aaacctactg tctttgtgaa 160
<210> 362
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 362
ctaccactcg tcgaccccga cctctctgct gtcccgacca acgggtccca ggggtccgga 60
gactaaggag tgactaacga gaatccagac cggggaggag tcgtagaata ggctcacctt 120
cctttaaacg cacacctcat aaacctactg tctttgtgaa 160
<210> 363
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 363
ctcgaagtag acggtttcac cagtcaagta gtaagacaac ggcttcaagt ctctagagga 60
aaagattgag aagtgttgca taagctatta gtagaaaccg acgaagatca gacattggct 120
atattttatc tggttctttc gtgataaatg acggaggagt 160
<210> 364
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 364
ctcgaagtag acggtttcac cagtcaagta gtaagacaac ggcttcaagt ctctagagga 60
aaagattgag aagtgttgca taagctatta gtagaaaccg acgaagatca gacattggct 120
atattttatc tggttctttc gtgataaatg acggaggagt 160
<210> 365
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 365
ctttccggtt gtactctttc ttcgtcgtct agcttttgcg ttcgttctcc ttgtttacct 60
ttgactcgtc attcataaaa aaaaaaagat ttaaaaccca agaaaaattt ccgatcgtac 120
cttaaaaatt tattatctga aagtaaaagg tctgaaatac 160
<210> 366
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 366
ctttccggtt gtactctttc ttcgtcgtct agcttttgcg ttcgttctcc ttgtttacct 60
ttgactcgtc attcataaaa aaaaaaagat ttaaaaccca agaaaaattt ccgatcgtac 120
cttaaaaatt tattatctga aagtaaaagg tctgaaatac 160
<210> 367
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 367
gcacacctca taaacctact gtctttgtga aaagctgtat cacaccacca cgggatactc 60
ggcggactcc agaccaaacg ttgaccccag agaccctcct ccccaattcc caccaacagt 120
caccgggagg tccactcgtc atccccccga aagaggacga 160
<210> 368
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 368
gcacacctca taaacctact gtctttgtga aaagctgtat cacaccacca cgggatactc 60
ggcggactcc agaccaaacg ttgaccccag agaccctcct ccccaattcc caccaacagt 120
caccgggagg tccactcgtc atccccccga aagaggacga 160
<210> 369
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 369
agtttatcaa aggagtaaag aaggagtcac tacagccctc cttctaaagg gtgtttttct 60
gccgaagcaa cccacttcca gaagagagga ccaaaagatt ttaagaagtc cagttatcag 120
ttcggaagta gactctcttc tgtgtgtcag tgaattttct 160
<210> 370
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 370
agtttatcaa aggagtaaag aaggagtcac tacagccctc cttctaaagg gtgtttttct 60
gccgaagcaa cccacttcca gaagagagga ccaaaagatt ttaagaagtc cagttatcag 120
ttcggaagta gactctcttc tgtgtgtcag tgaattttct 160
<210> 371
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 371
cagaggtgac cagatagaga taggactgta agggttcctc ctccgtaagc ctttcataac 60
agccggtctc tcggtcctcg taggacttcg actgggtcca tcaacaacta aaaggtacaa 120
ggaccgtaaa ttaaaaaccc ttttcaacct ttaaaaccct 160
<210> 372
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 372
cagaggtgac cagatagaga taggactgta agggttcctc ctccgtaagc ctttcataac 60
agccggtctc tcggtcctcg taggacttcg actgggtcca tcaacaacta aaaggtacaa 120
ggaccgtaaa ttaaaaaccc ttttcaacct ttaaaaccct 160
<210> 373
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 373
ttgtacagta aacgacttta gtagtacccg atattctagt acctacgatg gttataggac 60
cacagaggtg accagataga gataggactg taagggttcc tcctccgtaa gcctttcata 120
acagccggtc tctcggtcct cgtaggactt cgactgggtc 160
<210> 374
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 374
ttgtacagta aacgacttta gtagtacccg atattctagt acctacgatg gttataggac 60
cacagaggtg accagataga gataggactg taagggttcc tcctccgtaa gcctttcata 120
acagccggtc tctcggtcct cgtaggactt cgactgggtc 160
<210> 375
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 375
tcccgagcac aggggtcggc agcagagaac ctcgagacag gggggtttgg accctccacc 60
ggggtctcga aaaggtccta ggtaccgagg agggtcctcc tcctcgatgt ccaaccccgt 120
ccacccgaag gacgacacgg acctcgggtc tacagtccac 160
<210> 376
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 376
tcccgagcac aggggtcggc agcagagaac ctcgagacag gggggtttgg accctccacc 60
ggggtctcga aaaggtccta ggtaccgagg agggtcctcc tcctcgatgt ccaaccccgt 120
ccacccgaag gacgacacgg acctcgggtc tacagtccac 160
<210> 377
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 377
cgactaacta aacaagaacg gtaacaagaa agagaagatg cattctctcg agactgtggg 60
ttgcttccaa aagaacggca acgtacgact ataagacaac ggaacagaac cgatttcctg 120
ctattaaaag tagacggctt tttcccgtta acaagaaggt 160
<210> 378
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 378
aactaaacaa gaacggtaac aagaaagaga agatgcattc tctcgagact gtgggttgct 60
tccaaaagaa cggcaacgta cgactataag acaacggaac agaaccgatt tcctgctatt 120
aaaagtagac ggctttttcc cgttaacaag aaggtggatt 160
<210> 379
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 379
gacctactac tacaaaaact acttccagag cagcaggccc agcgtctact ttgagaccaa 60
gtggtacaga ggagggtcgt cgagccagtg gtagaggtcg accagccggc acctcttcga 120
gggcggtggc ggcagcaaca gaggggcttc cctcttccca 160
<210> 380
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 380
gacctactac tacaaaaact acttccagag cagcaggccc agcgtctact ttgagaccaa 60
gtggtacaga ggagggtcgt cgagccagtg gtagaggtcg accagccggc acctcttcga 120
gggcggtggc ggcagcaaca gaggggcttc cctcttccca 160
<210> 381
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 381
ttttccattc ccttttagaa cagtaccaac cctgaagaag gagataataa ccacttaaac 60
ccgggaaaga cacatctcaa tgactttatc actgtcacac gagaatttaa tctaaattaa 120
taatgtgaag tctacaaaga taagatcctt tcggtatcgc 160
<210> 382
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 382
ttttccattc ccttttagaa cagtaccaac cctgaagaag gagataataa ccacttaaac 60
ccgggaaaga cacatctcaa tgactttatc actgtcacac gagaatttaa tctaaattaa 120
taatgtgaag tctacaaaga taagatcctt tcggtatcgc 160
<210> 383
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 383
ttcttcattt taaggaaacg ggagaaacat acgccagagc ttccgggtcc gatctctgat 60
aagacagtga ggaccatagg gaagtcttca acgggcatgc caacggactt cctctccggg 120
acgtcacaaa ctgtcttgca cgatactcaa ccgttctatc 160
<210> 384
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 384
tcttcatttt aaggaaacgg gagaaacata cgccagagct tccgggtccg atctctgata 60
agacagtgag gaccataggg aagtcttcaa cgggcatgcc aacggacttc ctctccggga 120
cgtcacaaac tgtcttgcac gatactcaac cgttctatct 160
<210> 385
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 385
cgcaggtcac cggacccgta cctcccagta tcgacgccag ggccatcgga ccccgccttc 60
accctcactg actccgagtt aaatggggac acgccaaagt gtgagcggat gaagatcgcc 120
tctgctgttg ggacgggagg ggcccggaaa acagacgggg 160
<210> 386
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 386
cgcaggtcac cggacccgta cctcccagta tcgacgccag ggccatcgga ccccgccttc 60
accctcactg actccgagtt aaatggggac acgccaaagt gtgagcggat gaagatcgcc 120
tctgctgttg ggacgggagg ggcccggaaa acagacgggg 160
<210> 387
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 387
gacttactcc tcctctggag tggggtcacg gtctacctgg cgtactaaca ggctctctac 60
acgttcctta aggaccacga ccccctccga gggtcgatcg tggaacgaca ggagggaagg 120
gacgtcgagg tcagtcacac gtcccctgag tccccgaacc 160
<210> 388
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 388
gacttactcc tcctctggag tggggtcacg gtctacctgg cgtactaaca ggctctctac 60
acgttcctta aggaccacga ccccctccga gggtcgatcg tggaacgaca ggagggaagg 120
gacgtcgagg tcagtcacac gtcccctgag tccccgaacc 160
<210> 389
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 389
gacctctctt atgtaagaca gggaacttct tgaacactta ccgtacatgt cttagatact 60
gtacctcttg catgacgaac cagagaaaag ttgttaggta ctaagatagg tcatacaggt 120
cttcttacgt cctttcgact ggtggtgaca ctcatggtca 160
<210> 390
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 390
gacctctctt atgtaagaca gggaacttct tgaacactta ccgtacatgt cttagatact 60
gtacctcttg catgacgaac cagagaaaag ttgttaggta ctaagatagg tcatacaggt 120
cttcttacgt cctttcgact ggtggtgaca ctcatggtca 160
<210> 391
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 391
cgtcatagac attggctcca ttagacgggt gacaaaggag tgaaggtctc ctacccggac 60
tcgcacatac cctccggatc cccacagagt tagtgggacg gagtctgagg tgagaaacgt 120
gtcggtgggg gatgaagggt gacttactat ttgtggaagt 160
<210> 392
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 392
cgtcatagac attggctcca ttagacgggt gacaaaggag tgaaggtctc ctacccggac 60
tcgcacatac cctccggatc cccacagagt tagtgggacg gagtctgagg tgagaaacgt 120
gtcggtgggg gatgaagggt gacttactat ttgtggaagt 160
<210> 393
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 393
tcatacctca agtctggacg ggtttttttc ccttttcaga cctcacgaac gactacccgt 60
cagtatggtc gttgttctct tctgtcgacg tctgttgtct catgtcttct cctccgtgca 120
actagaattt atccatattt ttatggaggg tacgcctgca 160
<210> 394
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 394
tcatacctca agtctggacg ggtttttttc ccttttcaga cctcacgaac gactacccgt 60
cagtatggtc gttgttctct tctgtcgacg tctgttgtct catgtcttct cctccgtgca 120
actagaattt atccatattt ttatggaggg tacgcctgca 160
<210> 395
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 395
acccaaagac acccctcttt ccctttttat ctagtggaaa attattaata acagagtcag 60
taatctcgtg agacctctct cttgtttatt taccaatgga catttataaa catccagtct 120
tagtagtgtt attacgtgta gtacggtcga tgctaatgct 160
<210> 396
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 396
agacacccct ctttcccttt ttatctagtg gaaaattatt aataacagag tcagtaatct 60
cgtgagacct ctctcttgtt tatttaccaa tggacattta taaacatcca gtcttagtag 120
tgttattacg tgtagtacgg tcgatgctaa tgctttggtt 160
<210> 397
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 397
aagacacccc tctttccctt tttatctagt ggaaaattat taataacaga gtcagtaatc 60
tcgtgagacc tctctcttgt ttatttacca atggacattt ataaacatcc agtcttagta 120
gtgttattac gtgtagtacg gtcgatgcta atgctttggt 160
<210> 398
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 398
aagacacccc tctttccctt tttatctagt ggaaaattat taataacaga gtcagtaatc 60
tcgtgagacc tctctcttgt ttatttacca atggacattt ataaacatcc agtcttagta 120
gtgttattac gtgtagtacg gtcgatgcta atgctttggt 160
<210> 399
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 399
atagaagaca agtcccaagt ttaggagtag aagtaatcat gacgatcttt tatttcattg 60
ttgttccaga taatccaaag gatatttcat tctatacgac taacacgtgt taatatttcg 120
catttctacc tttacttttg gtggatattt agaacatttg 160
<210> 400
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 400
atagaagaca agtcccaagt ttaggagtag aagtaatcat gacgatcttt tatttcattg 60
ttgttccaga taatccaaag gatatttcat tctatacgac taacacgtgt taatatttcg 120
catttctacc tttacttttg gtggatattt agaacatttg 160
<210> 401
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 401
aggagtgaca ccctgagcga gtgtcccctg tcgcactaaa ggaaatccct cggttagagc 60
gtgtccacac ttcccctcaa ccggtagtca gacccacctc tgtcgaaggt ccaaggtgac 120
acataaggga aaacccaaaa ccaaccttct cgtgactacc 160
<210> 402
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 402
aggagtgaca ccctgagcga gtgtcccctg tcgcactaaa ggaaatccct cggttagagc 60
gtgtccacac ttcccctcaa ccggtagtca gacccacctc tgtcgaaggt ccaaggtgac 120
acataaggga aaacccaaaa ccaaccttct cgtgactacc 160
<210> 403
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 403
cgggccgcgt cgcggtcgga gggcgcgacg gtcgcacggg gcgacaggta cctccggagc 60
agccggtccg acatcgcgtc gtggcggagg aagtcgcgga gcccaccgcc gagggcccgg 120
tccgaggtcc cgtccttgaa gaaccggtcc ggtccggccc 160
<210> 404
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 404
cgggccgcgt cgcggtcgga gggcgcgacg gtcgcacggg gcgacaggta cctccggagc 60
agccggtccg acatcgcgtc gtggcggagg aagtcgcgga gcccaccgcc gagggcccgg 120
tccgaggtcc cgtccttgaa gaaccggtcc ggtccggccc 160
<210> 405
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 405
gagtatcttc ttttctaacc acactcatat gaaatttgaa aattaaaaat cacatctggg 60
aatctgacat caatttaatt ctgcaaataa gtttatgtag tttcctttta catagtaatg 120
atcagtcgta aatatctaaa gtactataca tattatctat 160
<210> 406
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 406
atcttctttt ctaaccacac tcatatgaaa tttgaaaatt aaaaatcaca tctgggaatc 60
tgacatcaat ttaattctgc aaataagttt atgtagtttc cttttacata gtaatgatca 120
gtcgtaaata tctaaagtac tatacatatt atctatgttg 160
<210> 407
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 407
gagtttctgc tactgaagct ttcctagagt ctcgacccgc gcccgttgcc gccccaccag 60
tggtttcagg tcgtgtctgg gagcccggag tagtaccggt ccttccactc gtgacgcccc 120
agcccctcca gcccctcacc accccttcca gggggacctt 160
<210> 408
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 408
gagtttctgc tactgaagct ttcctagagt ctcgacccgc gcccgttgcc gccccaccag 60
tggtttcagg tcgtgtctgg gagcccggag tagtaccggt ccttccactc gtgacgcccc 120
agcccctcca gcccctcacc accccttcca gggggacctt 160
<210> 409
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 409
aactatcgct gcccttaaaa ttgaaagagt ggaagaccct aggtctcagg gatactgtct 60
ctctcttcct tctgcaattg accgttaaca ctctaccacg gtgtacgacg ggtcactaga 120
cccacctaca atggtcgcta cgtggggctt ccactccctg 160
<210> 410
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 410
taaaattgaa agagtggaag accctaggtc tcagggatac tgtctctctc ttccttctgc 60
aattgaccgt taacactcta ccacggtgta cgacgggtca ctagacccac ctacaatggt 120
cgctacgtgg ggcttccact ccctgtgacc ccgacacctc 160
<210> 411
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 411
aggaactatc gctgccctta aaattgaaag agtggaagac cctaggtctc agggatactg 60
tctctctctt ccttctgcaa ttgaccgtta acactctacc acggtgtacg acgggtcact 120
agacccacct acaatggtcg ctacgtgggg cttccactcc 160
<210> 412
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 412
taaaattgaa agagtggaag accctaggtc tcagggatac tgtctctctc ttccttctgc 60
aattgaccgt taacactcta ccacggtgta cgacgggtca ctagacccac ctacaatggt 120
cgctacgtgg ggcttccact ccctgtgacc ccgacacctc 160
<210> 413
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 413
cgctgccctt aaaattgaaa gagtggaaga ccctaggtct cagggatact gtctctctct 60
tccttctgca attgaccgtt aacactctac cacggtgtac gacgggtcac tagacccacc 120
tacaatggtc gctacgtggg gcttccactc cctgtgaccc 160
<210> 414
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 414
taaaattgaa agagtggaag accctaggtc tcagggatac tgtctctctc ttccttctgc 60
aattgaccgt taacactcta ccacggtgta cgacgggtca ctagacccac ctacaatggt 120
cgctacgtgg ggcttccact ccctgtgacc ccgacacctc 160
<210> 415
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 415
tatcgctgcc cttaaaattg aaagagtgga agaccctagg tctcagggat actgtctctc 60
tcttccttct gcaattgacc gttaacactc taccacggtg tacgacgggt cactagaccc 120
acctacaatg gtcgctacgt ggggcttcca ctccctgtga 160
<210> 416
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 416
taaaattgaa agagtggaag accctaggtc tcagggatac tgtctctctc ttccttctgc 60
aattgaccgt taacactcta ccacggtgta cgacgggtca ctagacccac ctacaatggt 120
cgctacgtgg ggcttccact ccctgtgacc ccgacacctc 160
<210> 417
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 417
gaactatcgc tgcccttaaa attgaaagag tggaagaccc taggtctcag ggatactgtc 60
tctctcttcc ttctgcaatt gaccgttaac actctaccac ggtgtacgac gggtcactag 120
acccacctac aatggtcgct acgtggggct tccactccct 160
<210> 418
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 418
aaattgaaag agtggaagac cctaggtctc agggatactg tctctctctt ccttctgcaa 60
ttgaccgtta acactctacc acggtgtacg acgggtcact agacccacct acaatggtcg 120
ctacgtgggg cttccactcc ctgtgacccc gacacctcgg 160
<210> 419
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 419
actaagttac tgggaggtcg cttaaagtat ggagccaaag atatttactg gtcctgtcca 60
ttgaccactt aatggtttca gggtcacgtg gtctcgaagt gacttcgtcg tgtcactgac 120
ctgtgtcatc tcaggttgtt gcaagtgagg tgtacattaa 160
<210> 420
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 420
ggtcgcttaa agtatggagc caaagatatt tactggtcct gtccattgac cacttaatgg 60
tttcagggtc acgtggtctc gaagtgactt cgtcgtgtca ctgacctgtg tcatctcagg 120
ttgttgcaag tgaggtgtac attaacgact cgaggaagag 160
<210> 421
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 421
cgaggtgccg cgcctcgggt tgacgcggct ggggcggtga gagtgggctg ggcacgtgct 60
gcgacgggcc ctcccgaagg acctgtgcga ccaccacgac gtggcccggc cccgcgccga 120
cctgcacgcg ctacggaccc cggcagacgg gcacctggac 160
<210> 422
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 422
cgaggtgccg cgcctcgggt tgacgcggct ggggcggtga gagtgggctg ggcacgtgct 60
gcgacgggcc ctcccgaagg acctgtgcga ccaccacgac gtggcccggc cccgcgccga 120
cctgcacgcg ctacggaccc cggcagacgg gcacctggac 160
<210> 423
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 423
ggccctcccg aaggacctgt gcgaccacca cgacgtggcc cggccccgcg ccgacctgca 60
cgcgctacgg accccggcag acgggcacct ggaccgactc ctcgacccgg tagcgctaca 120
gcgtgccatg gacgcgcgcc gacgcccccc gtggtctccg 160
<210> 424
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 424
ggccctcccg aaggacctgt gcgaccacca cgacgtggcc cggccccgcg ccgacctgca 60
cgcgctacgg accccggcag acgggcacct ggaccgactc ctcgacccgg tagcgctaca 120
gcgtgccatg gacgcgcgcc gacgcccccc gtggtctccg 160
<210> 425
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 425
gtacccaaag acacccctct ttcccttttt atctagtgga aaattattaa taacagagtc 60
agtaatctcg tgagacctct ctcttgttta tttaccaatg gacatttata aacatccagt 120
cttagtagtg ttattacgtg tagtacggtc gatgctaatg 160
<210> 426
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 426
gtacccaaag acacccctct ttcccttttt atctagtgga aaattattaa taacagagtc 60
agtaatctcg tgagacctct ctcttgttta tttaccaatg gacatttata aacatccagt 120
cttagtagtg ttattacgtg tagtacggtc gatgctaatg 160
<210> 427
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 427
gagggcccac gtctggggac ggttgttctg ttgctcctga agttgtgcac cgaggcgagg 60
gttgacttgt ttgttgacag atttcttttt cggaagactt cctaagactg agacgaggag 120
tcaggacccg ggttgaaggt tgtaccaggg ttcgtggacg 160
<210> 428
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 428
gagggcccac gtctggggac ggttgttctg ttgctcctga agttgtgcac cgaggcgagg 60
gttgacttgt ttgttgacag atttcttttt cggaagactt cctaagactg agacgaggag 120
tcaggacccg ggttgaaggt tgtaccaggg ttcgtggacg 160
<210> 429
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 429
tatgtaccca aagacacccc tctttccctt tttatctagt ggaaaattat taataacaga 60
gtcagtaatc tcgtgagacc tctctcttgt ttatttacca atggacattt ataaacatcc 120
agtcttagta gtgttattac gtgtagtacg gtcgatgcta 160
<210> 430
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 430
tatgtaccca aagacacccc tctttccctt tttatctagt ggaaaattat taataacaga 60
gtcagtaatc tcgtgagacc tctctcttgt ttatttacca atggacattt ataaacatcc 120
agtcttagta gtgttattac gtgtagtacg gtcgatgcta 160
<210> 431
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 431
tcgaacacga agtaccacta caggcacgca aggtagaggg tgaacagcat caaccccctg 60
tgtggtatct gtcacccgaa caacgcgaaa ccccgaccta ttacctcgca ccactactcg 120
ggcagccggt ggcaacttac tactacttgg ttgagccggt 160
<210> 432
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 432
tcgaacacga agtaccacta caggcacgca aggtagaggg tgaacagcat caaccccctg 60
tgtggtatct gtcacccgaa caacgcgaaa ccccgaccta ttacctcgca ccactactcg 120
ggcagccggt ggcaacttac tactacttgg ttgagccggt 160
<210> 433
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 433
gactagtcat ccgttcaaaa tggatgtcga gatttctctt tctctttttt ccaacgaatc 60
agttgtactt acattagaat cgaaagtgat aattcaattt tattaaagat ctcttttttt 120
tagttccgta tatgtagtgt atgaatcgta atttctttta 160
<210> 434
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA standard
<400> 434
gactagtcat ccgttcaaaa tggatgtcga gatttctctt tctctttttt ccaacgaatc 60
agttgtactt acattagaat cgaaagtgat aattcaattt tattaaagat ctcttttttt 120
tagttccgta tatgtagtgt atgaatcgta atttctttta 160
<210> 435
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Reversed DNA standard
<400> 435
taacgaaagg aaaaagtgtt ctatattgac ttatcaggat gtcacaaaag tcaaagtttt 60
tatgaattga ggacaattta atatcaaatg tgactgtgga tcgacactag gactttgact 120
taaaagatat atttgttttt gtctacgaga ctctttccgt aatctttcgg acatcaaaat 180
gaatgagagc agaggtgtct gtgtatgagg tattaaattt tggtttacga acactctttc 240
gaacgagtag tatgaacgac gaagtttctc ttattttttt cattctgttc ctatattttc 300
gatacaaact gacaacaggt atttatcaag tcttttaaga gagacggtat tatttctacg 360
tgaaagagga tgaaagtcgt actgatatct actcctatgt t 401
<210> 436
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Reversed DNA standard
<400> 436
taacgaaagg aaaaagtgtt ctatattgac ttatcaggat gtcacaaaag tcaaagtttt 60
tatgaattga ggacaattta atatcaaatg tgactgtgga tcgacactag gactttgact 120
taaaagatat atttgttttt gtctacgaga ctctttccgt aatctttcgg acatcaaaat 180
gaatgagagc agaggtgtct ttgtatgagg tattaaattt tggtttacga acactctttc 240
gaacgagtag tatgaacgac gaagtttctc ttattttttt cattctgttc ctatattttc 300
gatacaaact gacaacaggt atttatcaag tcttttaaga gagacggtat tatttctacg 360
tgaaagagga tgaaagtcgt actgatatct actcctatgt t 401
<210> 437
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Reversed and shuffled sequence
<400> 437
ttctgattcc tttttttttt catgtttctt aaca 34
<210> 438
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Reversed and shuffled standard
<400> 438
cttatttttt tcattctgtt cctatatttt cgat 34
<210> 439
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Reversed and shuffled sequence
<400> 439
gaataaaaaa agtaagacaa ggatataaaa gcta 34
<210> 440
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Final reversed standard
<400> 440
taacgaaagg aaaaagtgtt ctatattgac ttatcaggat gtcacaaaag tcaaagtttt 60
tatgaattga ggacaattta atatcaaatg tgactgtgga tcgacactag gactttgact 120
taaaagatat atttgttttt gtctacgaga ctctttccgt aatctttcgg acatcaaaat 180
gaatgagagc agaggtgtct gtgtatgagg tattaaattt tggtttacga acactctttc 240
gaacgagtag tatgaacgac gaagtttctt tctgattcct tttttttttc atgtttctta 300
acaacaaact gacaacaggt atttatcaag tcttttaaga gagacggtat tatttctacg 360
tgaaagagga tgaaagtcgt actgatatct actcctatgt t 401
<210> 441
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Final reversed standard
<400> 441
taacgaaagg aaaaagtgtt ctatattgac ttatcaggat gtcacaaaag tcaaagtttt 60
tatgaattga ggacaattta atatcaaatg tgactgtgga tcgacactag gactttgact 120
taaaagatat atttgttttt gtctacgaga ctctttccgt aatctttcgg acatcaaaat 180
gaatgagagc agaggtgtct ttgtatgagg tattaaattt tggtttacga acactctttc 240
gaacgagtag tatgaacgac gaagtttctt tctgattcct tttttttttc atgtttctta 300
acaacaaact gacaacaggt atttatcaag tcttttaaga gagacggtat tatttctacg 360
tgaaagagga tgaaagtcgt actgatatct actcctatgt t 401
<210> 442
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 442
attctccttt ctacttcatg atacaaaatt tcttataata taatgtctta atatctttaa 60
tctagagaat ggatttgaga agtattacga acgacattct ctacttcaat attgatgaaa 120
acagaaggga atgatgtgga gtctatataa agaagtactt ctggagtgtc atttttatcc 180
actaaaacca gatcgatgtc actttagagc tacctcaccc agggtagtca aacttgtcaa 240
cagacctagg taaaacacct accattctta actccgataa aaaggtgact aatttaaaaa 300
ccgggactct acgacgactc aatgatcttt cagtaacttc cagagttgat atcataaaag 360
tatcaagggt cataagtgtt tttagtcaca agaataaaaa a 401
<210> 443
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 443
attctccttt ctacttcatg atacaaaatt tcttataata taatgtctta atatctttaa 60
tctagagaat ggatttgaga agtattacga acgacattct ctacttcaat attgatgaaa 120
acagaaggga atgatgtgga gtctatataa agaagtactt ctggagtgtc atttttatcc 180
actaaaacca gatcgatgtc tctttagagc tacctcaccc agggtagtca aacttgtcaa 240
cagacctagg taaaacacct accattctta actccgataa aaaggtgact aatttaaaaa 300
ccgggactct acgacgactc aatgatcttt cagtaacttc cagagttgat atcataaaag 360
tatcaagggt cataagtgtt tttagtcaca agaataaaaa a 401
<210> 444
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 444
ttaaaagtac taacttaaaa cataataccc aattattaat aaatgtatat ttccactcaa 60
acataatttt ccatgaccac ctcataaact atcacataat tggaatacac actgtacaag 120
attatatcaa atttgtaaaa taattagtaa aaagccggac gacttttact gacttatatt 180
tgaacaccat caacctcgac caccgcatcc gttctcacgg aactgctatg tcgattaagt 240
cttagtaaaa cacctgctta tactaggttg ttatctccat ttagaacaaa attatacgta 300
taatgaccac gtcctggtaa gaaactatgt ctatttccaa agagactggt aaaagtactc 360
atgaataatg ttctattaat acgactttca attcaataga c 401
<210> 445
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 445
ttaaaagtac taacttaaaa cataataccc aattattaat aaatgtatat ttccactcaa 60
acataatttt ccatgaccac ctcataaact atcacataat tggaatacac actgtacaag 120
attatatcaa atttgtaaaa taattagtaa aaagccggac gacttttact gacttatatt 180
tgaacaccat caacctcgac taccgcatcc gttctcacgg aactgctatg tcgattaagt 240
cttagtaaaa cacctgctta tactaggttg ttatctccat ttagaacaaa attatacgta 300
taatgaccac gtcctggtaa gaaactatgt ctatttccaa agagactggt aaaagtactc 360
atgaataatg ttctattaat acgactttca attcaataga c 401
<210> 446
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 446
cttcgtatta caaccgcagt ttacacggtg atagtgagga ctactcttct cccaactcct 60
caagttcaac tttgtttaca cctttagtgg tttaccgtgg tatgctttat aagacccacc 120
gtgccagaag tctcttcggt aatagacgtt tttatagggg gccgaacact cacctaccca 180
ttttggatag tagtatccag cagtacgaat acccctagtt cattcagtac aaccgttatt 240
acactaaaac gtacaaaaaa aaaagtaccg ggtctttaaa ggttgaacat acacaaaata 300
agaatagaaa accatagatg tgggtaattc gttccatact ttaactcttt acgtatatac 360
atattgacat ataaatgtgt gtaaatcgat ttccgtttat g 401
<210> 447
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 447
cttcgtatta caaccgcagt ttacacggtg atagtgagga ctactcttct cccaactcct 60
caagttcaac tttgtttaca cctttagtgg tttaccgtgg tatgctttat aagacccacc 120
gtgccagaag tctcttcggt aatagacgtt tttatagggg gccgaacact cacctaccca 180
ttttggatag tagtatccag tagtacgaat acccctagtt cattcagtac aaccgttatt 240
acactaaaac gtacaaaaaa aaaagtaccg ggtctttaaa ggttgaacat acacaaaata 300
agaatagaaa accatagatg tgggtaattc gttccatact ttaactcttt acgtatatac 360
atattgacat ataaatgtgt gtaaatcgat ttccgtttat g 401
<210> 448
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 448
gggtcgacgg tcgtcgtcga cgacgctcga gtgggtctta cagacctctc gtaggagggg 60
acgtacacaa tttgttatgt cgatcaccct tccgtcggac cagggaccac agtcctttta 120
cgaccgactg gatttcggtg gaggaatgaa acggaggaag acgtaccata agaaagagaa 180
ggcgtgggtc gtcaaaccgg tcgggtttta gacactagaa ctgtacgacg ccacaaaagt 240
ggtcatgcaa ggaccgacgg tccagcgcca cgtggttcgc tgccaggagg ttcatcaagt 300
acgggacttt gtctcttctg tacctgtgac cccgaactgg tagtaccctt cttcgagacg 360
taggcttaag tcccagtaca agtacggtcc gagactcgga g 401
<210> 449
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 449
gggtcgacgg tcgtcgtcga cgacgctcga gtgggtctta cagacctctc gtaggagggg 60
acgtacacaa tttgttatgt cgatcaccct tccgtcggac cagggaccac agtcctttta 120
cgaccgactg gatttcggtg gaggaatgaa acggaggaag acgtaccata agaaagagaa 180
ggcgtgggtc gtcaaaccgg gcgggtttta gacactagaa ctgtacgacg ccacaaaagt 240
ggtcatgcaa ggaccgacgg tccagcgcca cgtggttcgc tgccaggagg ttcatcaagt 300
acgggacttt gtctcttctg tacctgtgac cccgaactgg tagtaccctt cttcgagacg 360
taggcttaag tcccagtaca agtacggtcc gagactcgga g 401
<210> 450
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 450
cgtgtgccac cgggtggaac tcgtgccatt gcatcccaca cggcaggccc gggtggaacg 60
acggtaagtg gaggtgcacg aactcggtga cctacacccc gacacgcagt gacatgtgga 120
acgtcacctt gaggtgcagc gacgggtcgt ggcggcagac caaccggccg tcggggcgga 180
cgtcctaccc ggccacgccc ctcgcgagac acccccgtct actgcgagtc cccggtgggg 240
gagggagtgg tggtggcggt gacggcgggg gtgggggcgc ggcggggtcc cgggagtggg 300
tcgtgcaggt cgcacatgca gacggcctac gacggtttga acaagaggtg ctgcgtccac 360
atcaacggcg ccaggctccc gtggtgcgaa aggtactggt c 401
<210> 451
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 451
cgtgtgccac cgggtggaac tcgtgccatt gcatcccaca cggcaggccc gggtggaacg 60
acggtaagtg gaggtgcacg aactcggtga cctacacccc gacacgcagt gacatgtgga 120
acgtcacctt gaggtgcagc gacgggtcgt ggcggcagac caaccggccg tcggggcgga 180
cgtcctaccc ggccacgccc gtcgcgagac acccccgtct actgcgagtc cccggtgggg 240
gagggagtgg tggtggcggt gacggcgggg gtgggggcgc ggcggggtcc cgggagtggg 300
tcgtgcaggt cgcacatgca gacggcctac gacggtttga acaagaggtg ctgcgtccac 360
atcaacggcg ccaggctccc gtggtgcgaa aggtactggt c 401
<210> 452
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 452
aagacaagaa cgacatttaa gattacgaca agtacctaac acgttaagga tacgttagcc 60
agaaacggac gactctcaat aattgtcacg tcacacctta ggtctcactc gaaagtaaaa 120
gagtcaatag aaaagtcaag ttacgtacga caaattaaca caccttctag gttaggtaaa 180
aacaacaggt cggtggtact acacgtagta agtaaacaaa gtactttatg aggtttcgga 240
gaacgagtca aaatagattc cgatcccaga aagcttacat acgttacagt agttttctaa 300
catcaagacc gtaaggtctc ggttcgtagt aactcttttc taaatacttc tctaaccgta 360
cgacagctta tcgatctatt cggaacattg tgtagaggac t 401
<210> 453
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 453
aagacaagaa cgacatttaa gattacgaca agtacctaac acgttaagga tacgttagcc 60
agaaacggac gactctcaat aattgtcacg tcacacctta ggtctcactc gaaagtaaaa 120
gagtcaatag aaaagtcaag ttacgtacga caaattaaca caccttctag gttaggtaaa 180
aacaacaggt cggtggtact gcacgtagta agtaaacaaa gtactttatg aggtttcgga 240
gaacgagtca aaatagattc cgatcccaga aagcttacat acgttacagt agttttctaa 300
catcaagacc gtaaggtctc ggttcgtagt aactcttttc taaatacttc tctaaccgta 360
cgacagctta tcgatctatt cggaacattg tgtagaggac t 401
<210> 454
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 454
ccgtcccgtc ttcatgtacc tgtccgtctg tctatgtgtg tgtgggtccc ggagtcttgt 60
cagaagtccc gtccctgttc cggaaccgtt ccgctcaggt ctcactgccg ctctttaaag 120
ccaaccacat cagcgtctgt cactacttgg agtcctacga ccccttgaga aagaagtaac 180
ggaacatgaa ctacccctag tcagcgaaga ctacccgtgg acgttcggtt ccccacggta 240
cgaccgtagt ccgggaacgg ggtaccaccc tgttcgggtc agaagttggg gtcccaattg 300
ttgtcggtag ggggtagatt catggggacc ggtttgaatt ggtgtttatg gtccgtgtgt 360
gtacgtgtgt acgagtccac acgtctctag aagtcgtcaa g 401
<210> 455
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 455
ccgtcccgtc ttcatgtacc tgtccgtctg tctatgtgtg tgtgggtccc ggagtcttgt 60
cagaagtccc gtccctgttc cggaaccgtt ccgctcaggt ctcactgccg ctctttaaag 120
ccaaccacat cagcgtctgt cactacttgg agtcctacga ccccttgaga aagaagtaac 180
ggaacatgaa ctacccctag ccagcgaaga ctacccgtgg acgttcggtt ccccacggta 240
cgaccgtagt ccgggaacgg ggtaccaccc tgttcgggtc agaagttggg gtcccaattg 300
ttgtcggtag ggggtagatt catggggacc ggtttgaatt ggtgtttatg gtccgtgtgt 360
gtacgtgtgt acgagtccac acgtctctag aagtcgtcaa g 401
<210> 456
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 456
tcgtatggta cgtttaaaac gacttcatat gaattaaact gacgatttta cacactatag 60
ggatctgtcc taaatgtaat acttttagtg tcctttgtta aaaatagctt tcaactttga 120
tttttaggaa acgtcctgac agttcgtctc ttacccatga gtgcaaagga aattggtgta 180
ttaatcttag taagaactac agagaccgat ctggttttag tgtttagaaa cactaggctg 240
gtactcattc ctcctataaa gaccgacggt tcagagacac ttatgtgata atccaacctc 300
ctctttttaa attagtattt gcgatttatt cagattaaac tcacttttga ttgaaaaatt 360
atgatatcac aacgaatata atatttttta ggttatgaaa a 401
<210> 457
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 457
tcgtatggta cgtttaaaac gacttcatat gaattaaact gacgatttta cacactatag 60
ggatctgtcc taaatgtaat acttttagtg tcctttgtta aaaatagctt tcaactttga 120
tttttaggaa acgtcctgac agttcgtctc ttacccatga gtgcaaagga aattggtgta 180
ttaatcttag taagaactac tgagaccgat ctggttttag tgtttagaaa cactaggctg 240
gtactcattc ctcctataaa gaccgacggt tcagagacac ttatgtgata atccaacctc 300
ctctttttaa attagtattt gcgatttatt cagattaaac tcacttttga ttgaaaaatt 360
atgatatcac aacgaatata atatttttta ggttatgaaa a 401
<210> 458
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 458
atttgataat atgtgattga aaaatcaaga gttttgacgt aagactgaaa gtcattccgt 60
taagatttat ggatttctat gtcgatgaac aagaactcac ttcctgactc ttttagggac 120
aagggtgagt atgtcctgaa ccctccatag gtgtaggaga aggagtccta acggaaatgg 180
tgagtctctt cctcgacacc atcaccgtgg tcttacctaa ggtctcaggt ccattctgac 240
aacgacggtc actgattgtc ggcgaaaaga cagaccaagg taccggtaca ggttgaggta 300
gtttagtcga tatttatgct ttgtcataat cgtaatcatc taacctttac acttaatata 360
ttatagtttt ttatagacac tatactgggt aactttataa a 401
<210> 459
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 459
atttgataat atgtgattga aaaatcaaga gttttgacgt aagactgaaa gtcattccgt 60
taagatttat ggatttctat gtcgatgaac aagaactcac ttcctgactc ttttagggac 120
aagggtgagt atgtcctgaa ccctccatag gtgtaggaga aggagtccta acggaaatgg 180
tgagtctctt cctcgacacc gtcaccgtgg tcttacctaa ggtctcaggt ccattctgac 240
aacgacggtc actgattgtc ggcgaaaaga cagaccaagg taccggtaca ggttgaggta 300
gtttagtcga tatttatgct ttgtcataat cgtaatcatc taacctttac acttaatata 360
ttatagtttt ttatagacac tatactgggt aactttataa a 401
<210> 460
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 460
gtctatccgt ctttacccga acttatcaat ctacgaataa attggaaccg ttatcgtaac 60
gtaagggaca ccaaaaatta tttttaactt gaagggaggg agggacgggt gtaggtaggg 120
ggggagggtc ctaagaatgt cttttgttca ccaatatcta ccactttgga caaacaacct 180
gtatgaccta tgtcgacctg ttcttctcat gtcacggtac tctctggtta tgtactcctg 240
tccgcttccg aaggagacac ataaacggta gttattatcg ttcagtaaac gcctataatt 300
ggagatgtcc atgatcctcg taataaaaga gactttccta ctagaaacac aagacttaga 360
aatacccctt tactccaatg gtgtgatccc ttctatctcg a 401
<210> 461
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 461
gtctatccgt ctttacccga acttatcaat ctacgaataa attggaaccg ttatcgtaac 60
gtaagggaca ccaaaaatta tttttaactt gaagggaggg agggacgggt gtaggtaggg 120
ggggagggtc ctaagaatgt cttttgttca ccaatatcta ccactttgga caaacaacct 180
gtatgaccta tgtcgacctg ctcttctcat gtcacggtac tctctggtta tgtactcctg 240
tccgcttccg aaggagacac ataaacggta gttattatcg ttcagtaaac gcctataatt 300
ggagatgtcc atgatcctcg taataaaaga gactttccta ctagaaacac aagacttaga 360
aatacccctt tactccaatg gtgtgatccc ttctatctcg a 401
<210> 462
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 462
cgtccgcagt ctcctcaacc acccacactc acggggacag ggacgtgaag cccaccgacg 60
accaggaggc ccaggacgac acaccaatct gccgaaggcc cgtcggacca gaccggtcgt 120
gagtgggacg ggagagacgg aaaagagggg gtcccataaa ccaaagggtc aggtgatatg 180
actgcagagg ttgtactcgg cgaaccgctc cgtctctgac gacccggcca gtacctcgca 240
cggtcagtag gcggtggaga agcgaggcga cttcctcata aaacgcacac acattccctg 300
tacccccgtt tgactccatc gcttatttgt ttttatgtgt tttttgtgtt ggctttaggg 360
tattttgtct tttttttgac tcctacctct cttcatagtc g 401
<210> 463
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 463
cgtccgcagt ctcctcaacc acccacactc acggggacag ggacgtgaag cccaccgacg 60
accaggaggc ccaggacgac acaccaatct gccgaaggcc cgtcggacca gaccggtcgt 120
gagtgggacg ggagagacgg aaaagagggg gtcccataaa ccaaagggtc aggtgatatg 180
actgcagagg ttgtactcgg tgaaccgctc cgtctctgac gacccggcca gtacctcgca 240
cggtcagtag gcggtggaga agcgaggcga cttcctcata aaacgcacac acattccctg 300
tacccccgtt tgactccatc gcttatttgt ttttatgtgt tttttgtgtt ggctttaggg 360
tattttgtct tttttttgac tcctacctct cttcatagtc g 401
<210> 464
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 464
gcgctctcgc gcctcttctc cgagtgcgac aggccgtaga tggtcatgta gtagcgcttc 60
aagggcaaga tgctcttctt attcttcccg accgttttat cgtaggcggt gttggagtcg 120
gagttgctca cgaagtagtt ccacggcgcg ctcccgccgc cgctcgcgtt cccgttgatg 180
acctgcgacc tgggccggac gcttctgtac aagctcttcc cgttgatggc cgcggcggcg 240
gcgtacttct ccgggaaggc cggcggcggg cgcgtgaagg tcgggccgtt ccccgagaag 300
ccccggcctc cgcggcgtcc gcccacgccg caccgcccgc ggccccggct gccgatgccg 360
atggaccgcg gggggttcat ggacgtcaga ccgaaggagt t 401
<210> 465
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 465
gcgctctcgc gcctcttctc cgagtgcgac aggccgtaga tggtcatgta gtagcgcttc 60
aagggcaaga tgctcttctt attcttcccg accgttttat cgtaggcggt gttggagtcg 120
gagttgctca cgaagtagtt ccacggcgcg ctcccgccgc cgctcgcgtt cccgttgatg 180
acctgcgacc tgggccggac ccttctgtac aagctcttcc cgttgatggc cgcggcggcg 240
gcgtacttct ccgggaaggc cggcggcggg cgcgtgaagg tcgggccgtt ccccgagaag 300
ccccggcctc cgcggcgtcc gcccacgccg caccgcccgc ggccccggct gccgatgccg 360
atggaccgcg gggggttcat ggacgtcaga ccgaaggagt t 401
<210> 466
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Deletion sequence
<400> 466
gaattaagag aagcaa 16
<210> 467
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 467
aaatttaccc tgtccatcct ggactaaagg aatgacggag aacgaagaga aaaggatagg 60
actcatcacc attagatgac cctgccttgt cgaaactcca cgcacaaaca cggacaggac 120
cctctctggc cgcgtgtctc cttctcttag aggcgttctt tcccctcgga gtggtgctcg 180
acgggggtcc ctcgtgattc gctccattcg ttcgtcctgt tcttcgccac ctcctctggt 240
tcccacgtca atacggagtc taagtgaaaa tagtggaaag gaacggagaa aggatcgtga 300
cgggttgttg tggtcgagga gaggggtcgg tttcttcttt ggtgacctac ctcttataaa 360
ggtgaacagc cttggtaata gaccctggag aatagttcac c 401
<210> 468
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 468
aaatttaccc tgtccatcct ggactaaagg aatgacggag aacgaagaga aaaggatagg 60
actcatcacc attagatgac cctgccttgt cgaaactcca cgcacaaaca cggacaggac 120
cctctctggc cgcgtgtctc cttctcttag aggcgttctt tcccctcgga gtggtgctcg 180
acgggggtcc ctcgtgattc actccattcg ttcgtcctgt tcttcgccac ctcctctggt 240
tcccacgtca atacggagtc taagtgaaaa tagtggaaag gaacggagaa aggatcgtga 300
cgggttgttg tggtcgagga gaggggtcgg tttcttcttt ggtgacctac ctcttataaa 360
ggtgaacagc cttggtaata gaccctggag aatagttcac c 401
<210> 469
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> Insertion sequence
<400> 469
catacgtgat ggc 13
<210> 470
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 470
cctctctgga cgtttctcgg gtccacgtat ggaaccgtta gacgtatgtg gtcaagtcgt 60
ccaggaccct cgggtccgca ggcgccaaaa gggcctgtac cagattctcc gtcggtatcc 120
cgtattcgac acagtggtcg acgtggcacc tacagtccgt ctacgggtct tccgccctct 180
gtatacccct cgggtgtggt cggtagtgca tacgaaggac ccctgttccc atgcgactct 240
cccataccct ctggtgtgtg ggggtttgtg gtgtgtcgga gggttggtag tgtttggtgt 300
cggtaccggg tgtcggacac ttccgagttt catggtcgga cctgttgtac cactttggga 360
cagagatgat ttttatgttt ctaatccggc ccgtgccacc g 401
<210> 471
<211> 413
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 471
cctctctgga cgtttctcgg gtccacgtat ggaaccgtta gacgtatgtg gtcaagtcgt 60
ccaggaccct cgggtccgca ggcgccaaaa gggcctgtac cagattctcc gtcggtatcc 120
cgtattcgac acagtggtcg acgtggcacc tacagtccgt ctacgggtct tccgccctct 180
gtatacccct cgggtgtggt cggtagtgca tacggtagtg catacgaagg acccctgttc 240
ccatgcgact ctcccatacc ctctggtgtg tgggggtttg tggtgtgtcg gagggttggt 300
agtgtttggt gtcggtaccg ggtgtcggac acttccgagt ttcatggtcg gacctgttgt 360
accactttgg gacagagatg atttttatgt ttctaatccg gcccgtgcca ccg 413
<210> 472
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 472
aaatttaccc tgtccatcct ggactaaagg aatgacggag aacgaagaga aaaggatagg 60
actcatcacc attagatgac cctgccttgt cgaaactcca cgcacaaaca cggacaggac 120
cctctctggc cgcgtgtctc cttctcttag aggcgttctt tcccctcgga gtggtgctcg 180
acgggggtcc ctcgtgattc gctccattcg ttcgtcctgt tcttcgccac ctcctctggt 240
tcccacgtca atacggagtc taagtgaaaa tagtggaaag gaacggagaa aggatcgtga 300
cgggttgttg tggtcgagga gaggggtcgg tttcttcttt ggtgacctac ctcttataaa 360
ggtgaacagc cttggtaata gaccctggag aatagttcac c 401
<210> 473
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 473
aaatttaccc tgtccatcct ggactaaagg aatgacggag aacgaagaga aaaggatagg 60
actcatcacc attagatgac cctgccttgt cgaaactcca cgcacaaaca cggacaggac 120
cctctctggc cgcgtgtctc cttctcttag aggcgttctt tcccctcgga gtggtgctcg 180
acgggggtcc ctcgtgattc actccattcg ttcgtcctgt tcttcgccac ctcctctggt 240
tcccacgtca atacggagtc taagtgaaaa tagtggaaag gaacggagaa aggatcgtga 300
cgggttgttg tggtcgagga gaggggtcgg tttcttcttt ggtgacctac ctcttataaa 360
ggtgaacagc cttggtaata gaccctggag aatagttcac c 401
<210> 474
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 474
aactttctat aaacacaatg attactgaca cgatattgaa aaaaaagaaa gggtctcttg 60
tttaattttc tcaattcctg agacttctac atggatacca ggatcatcct ttatttacac 120
taaacggaag atcttgtcat ctgtgttttg tccgagtcct gaatcgttct tcaatctaca 180
taaagatgct ttaaagtagt cgtttctgtt ctgtccattc attgtgactt tatttatgtc 240
tagacaaaag acgttttagt attgacaata cagtaaatta tatagtcaaa aagagagtta 300
atacgatatg atcctttatt ttgttataaa tcatttacaa aaacagagaa ctctcccgta 360
acgaagaatt aggtcacagg taccatgacg aaaaccgaaa c 401
<210> 475
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 475
aactttctat aaacacaatg attactgaca cgatattgaa aaaaaagaaa gggtctcttg 60
tttaattttc tcaattcctg agacttctac atggatacca ggatcatcct ttatttacac 120
taaacggaag atcttgtcat ctgtgttttg tccgagtcct gaatcgttct tcaatctaca 180
taaagatgct ttaaagtagt tgtttctgtt ctgtccattc attgtgactt tatttatgtc 240
tagacaaaag acgttttagt attgacaata cagtaaatta tatagtcaaa aagagagtta 300
atacgatatg atcctttatt ttgttataaa tcatttacaa aaacagagaa ctctcccgta 360
acgaagaatt aggtcacagg taccatgacg aaaaccgaaa c 401
<210> 476
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 476
ttttctaaag gagagttatt gaaccctttt tgtgacctca aagggtttgt gagtcacttt 60
gtttctcatt tcatctacta cctttatatg tcgaacgttc ctgagacccg aggggtggtc 120
tggtactctc cgggacgccg ggtcgggtct ccggacacgg tccctggaat ggaatatgtg 180
gcacggcttg cgtggcctcg ggtcgtgaaa ctagaaaaac ttaagtcaaa ggaagttcta 240
ggagttctct cgaaccaacc ctcgaagagg tgacccacat tctccgaggt gttcgacccc 300
ccctgttctt gtgtctctgt tcccagtgga gtcgggagtg gtacgacctt tcgtcacggt 360
ctgtaccggg tcgtccccct ggtcgtcggt gccgtacccg a 401
<210> 477
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 477
ttttctaaag gagagttatt gaaccctttt tgtgacctca aagggtttgt gagtcacttt 60
gtttctcatt tcatctacta cctttatatg tcgaacgttc ctgagacccg aggggtggtc 120
tggtactctc cgggacgccg ggtcgggtct ccggacacgg tccctggaat ggaatatgtg 180
gcacggcttg cgtggcctcg agtcgtgaaa ctagaaaaac ttaagtcaaa ggaagttcta 240
ggagttctct cgaaccaacc ctcgaagagg tgacccacat tctccgaggt gttcgacccc 300
ccctgttctt gtgtctctgt tcccagtgga gtcgggagtg gtacgacctt tcgtcacggt 360
ctgtaccggg tcgtccccct ggtcgtcggt gccgtacccg a 401
<210> 478
<211> 401
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 478
atgaattgtt cgatcatgtt ttactttgaa tcactcaaac tactgtcata ccacactacg 60
tacataatgg tctttactgt accagttaca accttacttg aattttagta ctgactatac 120
catctgtctc ggatttgtag gggaatttaa cctaattttt ctttatatgg aaacaacaat 180
ggaaatttac gtttcaattt tatccgtctt cagaacgggt gtagcaacat tcggaatgta 240
agttggcacg gtaacacgaa cttacgtgat cttagatatc ttgagacttg gtgatcgaaa 300
ggtttgccac cgggtctact caaatcacag acgtgtaggt gaccgtcatg tcttcgtctc 360
gtagatttcc cttcttttgt tttcgggacc gaatgagatc c 401
<210> 479
<211> 407
<212> DNA
<213> Artificial Sequence
<220>
<223> Standard
<400> 479
atgaattgtt cgatcatgtt ttactttgaa tcactcaaac tactgtcata ccacactacg 60
tacataatgg tctttactgt accagttaca accttacttg aattttagta ctgactatac 120
catctgtctc ggatttgtag gggaatttaa cctaattttt ctttatatgg aaacaacaat 180
ggaaatttac gtttcaattt tatccgtatc cgtcttcaga acgggtgtag caacattcgg 240
aatgtaagtt ggcacggtaa cacgaactta cgtgatctta gatatcttga gacttggtga 300
tcgaaaggtt tgccaccggg tctactcaaa tcacagacgt gtaggtgacc gtcatgtctt 360
cgtctcgtag atttcccttc ttttgttttc gggaccgaat gagatcc 407
Claims (1)
- 발명의 설명에 기재되거나 도면에 도시된 물건 및/또는 방법.
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2014905092A AU2014905092A0 (en) | 2014-12-16 | Sequencing controls | |
AU2014905092 | 2014-12-16 | ||
AU2015903892A AU2015903892A0 (en) | 2015-09-24 | Sequencing controls | |
AU2015903892 | 2015-09-24 | ||
PCT/AU2015/050797 WO2016094947A1 (en) | 2014-12-16 | 2015-12-15 | Sequencing controls |
KR1020177019204A KR20170099939A (ko) | 2014-12-16 | 2015-12-15 | 시퀀싱 컨트롤 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177019204A Division KR20170099939A (ko) | 2014-12-16 | 2015-12-15 | 시퀀싱 컨트롤 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240004617A true KR20240004617A (ko) | 2024-01-11 |
Family
ID=56125446
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237040574A KR20240004617A (ko) | 2014-12-16 | 2015-12-15 | 시퀀싱 컨트롤 |
KR1020177019204A KR20170099939A (ko) | 2014-12-16 | 2015-12-15 | 시퀀싱 컨트롤 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177019204A KR20170099939A (ko) | 2014-12-16 | 2015-12-15 | 시퀀싱 컨트롤 |
Country Status (9)
Country | Link |
---|---|
US (3) | US20180148778A1 (ko) |
EP (1) | EP3234128A4 (ko) |
JP (1) | JP2017537646A (ko) |
KR (2) | KR20240004617A (ko) |
CN (2) | CN107250356A (ko) |
AU (2) | AU2015367290A1 (ko) |
CA (1) | CA2965849A1 (ko) |
HK (1) | HK1245830A1 (ko) |
WO (1) | WO2016094947A1 (ko) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11514289B1 (en) * | 2016-03-09 | 2022-11-29 | Freenome Holdings, Inc. | Generating machine learning models using genetic data |
KR102326769B1 (ko) * | 2016-03-25 | 2021-11-17 | 카리우스, 인코포레이티드 | 합성 핵산 스파이크-인 |
US10796000B2 (en) * | 2016-06-11 | 2020-10-06 | Intel Corporation | Blockchain system with nucleobase sequencing as proof of work |
AU2018312117B2 (en) * | 2017-08-04 | 2022-05-12 | Billiontoone, Inc. | Sequencing output determination and analysis with target-associated molecules in quantification associated with biological targets |
EP3681996B1 (en) * | 2017-09-15 | 2024-08-07 | King's College London | Compositions and methods for enhancing gamma delta t cells in the gut |
WO2019060716A1 (en) | 2017-09-25 | 2019-03-28 | Freenome Holdings, Inc. | SAMPLE EXTRACTION METHODS AND SYSTEMS |
WO2019147663A1 (en) * | 2018-01-24 | 2019-08-01 | Freenome Holdings, Inc. | Methods and systems for abnormality detection in the patterns of nucleic acids |
CN110211636A (zh) * | 2018-02-23 | 2019-09-06 | 暨南大学 | 优化基因组测序结果的分类方法 |
CA3097745A1 (en) * | 2018-04-20 | 2019-10-24 | Biofire Diagnostics, Llc | Methods for normalization and quantification of sequencing data |
KR102123922B1 (ko) * | 2018-06-05 | 2020-06-24 | 연세대학교 산학협력단 | 차세대 염기서열 분석법의 정확도를 분석하는 방법 |
KR102191034B1 (ko) * | 2018-06-05 | 2020-12-15 | 연세대학교 산학협력단 | 차세대 염기서열 분석법의 정확도 측정용 조성물 |
WO2020041449A1 (en) * | 2018-08-21 | 2020-02-27 | Zymo Research Corporation | Methods and compositions for tracking sample quality |
US11385215B2 (en) | 2019-02-25 | 2022-07-12 | Trace Genomics, Inc. | Soil health indicators using microbial functional genes |
EP3931356A1 (en) * | 2019-02-28 | 2022-01-05 | Inivata Ltd. | Method for quantifying the amount of a target sequence in a nucleic acid sample |
CN112823391B (zh) * | 2019-06-03 | 2024-07-05 | Illumina公司 | 基于检测限的质量控制度量 |
WO2021159184A1 (en) * | 2020-02-13 | 2021-08-19 | Garvan Institute Of Medical Research | Reference ladders and adaptors |
CN114078568B (zh) * | 2020-09-14 | 2022-07-05 | 青岛欧易生物科技有限公司 | 基于iib型限制性内切酶特征的宏基因组测序数据处理系统及处理方法 |
CN114196744B (zh) * | 2020-09-18 | 2024-04-09 | 赛纳生物科技(北京)有限公司 | 一种多碱基基因测序中信号归一化的方法 |
CN112662795B (zh) * | 2021-01-26 | 2023-12-15 | 苏州系统医学研究所 | 用于感染性病原体检测的阳性对照品及其制备方法与应用 |
WO2022232610A2 (en) * | 2021-04-29 | 2022-11-03 | Seer, Inc. | Peptide decorated nanoparticles for enrichment of specific protein subsets |
CN113628683B (zh) * | 2021-08-24 | 2024-04-09 | 慧算医疗科技(上海)有限公司 | 一种高通量测序突变检测方法、设备、装置及可读存储介质 |
CN115810395B (zh) * | 2022-12-05 | 2023-09-26 | 武汉贝纳科技有限公司 | 一种基于高通量测序动植物基因组t2t组装方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3A (en) * | 1836-08-11 | Thomas blanchard | ||
US8A (en) * | 1836-08-10 | T Blanchard | Machine for cutting scores around ships' tackle blocks and dead eyes | |
US590703A (en) * | 1897-09-28 | Car-coupling | ||
US5457027A (en) * | 1993-05-05 | 1995-10-10 | Becton, Dickinson And Company | Internal controls for isothermal nucleic acid amplification reactions |
EP1098986B1 (en) * | 1998-07-21 | 2011-12-28 | Millipore Corporation | A polynucleotide comprising a ubiquitous chromatin opening element (ucoe) |
CA2457427A1 (en) * | 2001-08-16 | 2003-02-27 | Stratagene | Compositions and methods comprising control nucleic acid |
EP1682675A2 (en) * | 2003-10-28 | 2006-07-26 | Bayer HealthCare AG | Methods and compositions for the response prediction of malignant neoplasia to treatment |
US8825411B2 (en) * | 2004-05-04 | 2014-09-02 | Dna Twopointo, Inc. | Design, synthesis and assembly of synthetic nucleic acids |
BRPI0516264A (pt) * | 2004-10-05 | 2008-08-26 | Neuralab Ltd E Wyeth | molécula de ácido nucleico, seqüência de nucleotìdeos, cassete de expressão, vetor de expressão, célula, métodos para expressar um anticorpo recombinante ou fragmento do mesmo, para melhorar a expressão de um anticorpo recombinante ou fragmento do mesmo, para produzir um anticorpo recombinante ou fragmento do mesmo e uma preparação de anticorpos e para detectar um produto irt em uma amostra, anticorpo e composição farmacêutica |
US20070269870A1 (en) * | 2004-10-18 | 2007-11-22 | George Church | Methods for assembly of high fidelity synthetic polynucleotides |
CN101772578A (zh) * | 2007-05-25 | 2010-07-07 | 解码遗传学私营有限责任公司 | 作为标记物用在乳腺癌风险评估、诊断、预后和治疗中的在CHR 5p12和10q26上的遗传变异体 |
-
2015
- 2015-12-15 KR KR1020237040574A patent/KR20240004617A/ko active Search and Examination
- 2015-12-15 EP EP15868702.0A patent/EP3234128A4/en active Pending
- 2015-12-15 JP JP2017532128A patent/JP2017537646A/ja active Pending
- 2015-12-15 CA CA2965849A patent/CA2965849A1/en active Pending
- 2015-12-15 AU AU2015367290A patent/AU2015367290A1/en not_active Abandoned
- 2015-12-15 CN CN201580068605.7A patent/CN107250356A/zh active Pending
- 2015-12-15 US US15/535,768 patent/US20180148778A1/en not_active Abandoned
- 2015-12-15 KR KR1020177019204A patent/KR20170099939A/ko not_active Application Discontinuation
- 2015-12-15 CN CN202111427653.4A patent/CN114381455A/zh active Pending
- 2015-12-15 WO PCT/AU2015/050797 patent/WO2016094947A1/en active Application Filing
-
2018
- 2018-04-20 HK HK18105145.3A patent/HK1245830A1/zh unknown
-
2020
- 2020-12-18 US US17/127,159 patent/US20210317518A1/en active Pending
-
2022
- 2022-05-12 AU AU2022203184A patent/AU2022203184A1/en active Pending
-
2024
- 2024-01-12 US US18/412,450 patent/US20240271201A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2022203184A1 (en) | 2022-06-02 |
AU2015367290A1 (en) | 2017-05-11 |
US20210317518A1 (en) | 2021-10-14 |
EP3234128A4 (en) | 2018-06-27 |
HK1245830A1 (zh) | 2018-08-31 |
US20180148778A1 (en) | 2018-05-31 |
CA2965849A1 (en) | 2016-06-23 |
JP2017537646A (ja) | 2017-12-21 |
US20240271201A1 (en) | 2024-08-15 |
CN107250356A (zh) | 2017-10-13 |
EP3234128A1 (en) | 2017-10-25 |
CN114381455A (zh) | 2022-04-22 |
WO2016094947A1 (en) | 2016-06-23 |
KR20170099939A (ko) | 2017-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022203184A1 (en) | Sequencing controls | |
AU2021273631B2 (en) | Methods and processes for non-invasive assessment of genetic variations | |
KR102114412B1 (ko) | 위장관췌장 신경내분비 신생물 (GEP-NENs)의 예측 방법 | |
DK2644713T3 (en) | A Method for Diagnosing Neoplasms II | |
Frazer et al. | Computational and biological analysis of 680 kb of DNA sequence from the human 5q31 cytokine gene cluster region | |
CN106471134B (zh) | 用于定量rna转录物变体的方法和产物 | |
AU2016334225A1 (en) | Novel RNA-guided nucleases and uses thereof | |
KR20140140069A (ko) | 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법 | |
CN113889187B (zh) | 单样本等位基因拷贝数变异检测方法、探针组和试剂盒 | |
CN109837273A (zh) | 一种crispr辅助dna靶向富集方法及其应用 | |
CN110628894A (zh) | 用于帕金森病基因突变检测的靶向捕获测序试剂盒及其应用 | |
CN106636344A (zh) | 一种基于二代高通量测序技术的地中海贫血症的基因检测试剂盒 | |
WO2019023291A2 (en) | COMPOSITIONS AND METHODS FOR PRODUCTION AND DECODING OF GUIDE RNA LIBRARIES AND USES THEREOF | |
CN107338292A (zh) | 基于高通量测序检测人类基因组突变负荷的方法及试剂盒 | |
CN106471008B (zh) | 棕榈Mantle表型检测 | |
CN111575379B (zh) | 甲状腺癌相关58基因检测试剂盒及其使用方法 | |
KR102250063B1 (ko) | 뚜렛증후군의 원인 유전자를 동정하는 방법 | |
KR101985864B1 (ko) | 유방암 및 난소암 등 암 진단용 조성물 및 이의 용도 | |
DK2707497T3 (en) | DETECTION OF THE BRACHYSPINA MUTATION | |
CN113151447A (zh) | 原发性特应性疾病相关基因的捕获探针、试剂盒及其应用 | |
CN108913761B (zh) | 一种用于筛查遗传性肝病的试剂盒 | |
KR102480124B1 (ko) | 생식능 강화 소 African Humped Cattle (AFH) 품종 특이적 단일염기다형성 및 그의 용도 | |
KR102480121B1 (ko) | 수면병 저항성 소 African taurine cattle (AFT) 품종 특이적 단일염기다형성 및 그의 용도 | |
KR102458471B1 (ko) | Snp를 검출 또는 증폭할 수 있는 제제를 포함하는 소의 도체중 판별용 조성물 및 이를 포함하는 키트 | |
KR102480128B1 (ko) | 면역력 강화 소 African Humped Cattle (AFH) 품종 특이적 단일염기다형성 및 그의 용도 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination |