DE19914808A1 - Informationstragende Polymere - Google Patents
Informationstragende PolymereInfo
- Publication number
- DE19914808A1 DE19914808A1 DE1999114808 DE19914808A DE19914808A1 DE 19914808 A1 DE19914808 A1 DE 19914808A1 DE 1999114808 DE1999114808 DE 1999114808 DE 19914808 A DE19914808 A DE 19914808A DE 19914808 A1 DE19914808 A1 DE 19914808A1
- Authority
- DE
- Germany
- Prior art keywords
- information
- polymers
- sequences
- logomers
- carrying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 229920000642 polymer Polymers 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 claims abstract description 264
- 230000001070 adhesive effect Effects 0.000 claims abstract description 11
- 239000000853 adhesive Substances 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims description 82
- 238000002372 labelling Methods 0.000 claims description 52
- 238000004519 manufacturing process Methods 0.000 claims description 48
- 239000000178 monomer Substances 0.000 claims description 48
- 239000000126 substance Substances 0.000 claims description 35
- 239000012634 fragment Substances 0.000 claims description 27
- 108090000623 proteins and genes Proteins 0.000 claims description 26
- 238000010367 cloning Methods 0.000 claims description 25
- 235000013305 food Nutrition 0.000 claims description 20
- 239000000243 solution Substances 0.000 claims description 19
- 108091034117 Oligonucleotide Proteins 0.000 claims description 17
- 102000004169 proteins and genes Human genes 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 15
- 238000002955 isolation Methods 0.000 claims description 14
- 238000000338 in vitro Methods 0.000 claims description 12
- 241000894006 Bacteria Species 0.000 claims description 11
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 11
- 238000001962 electrophoresis Methods 0.000 claims description 10
- 239000000825 pharmaceutical preparation Substances 0.000 claims description 10
- 229940127557 pharmaceutical product Drugs 0.000 claims description 10
- 238000010353 genetic engineering Methods 0.000 claims description 8
- 239000002773 nucleotide Substances 0.000 claims description 8
- 125000003729 nucleotide group Chemical group 0.000 claims description 8
- 238000013500 data storage Methods 0.000 claims description 7
- 108020004705 Codon Proteins 0.000 claims description 6
- 229940127554 medical product Drugs 0.000 claims description 6
- 230000027455 binding Effects 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 239000000839 emulsion Substances 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 4
- 238000000275 quality assurance Methods 0.000 claims description 4
- 238000003908 quality control method Methods 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 239000007788 liquid Substances 0.000 claims description 3
- 239000000725 suspension Substances 0.000 claims description 3
- 108091028664 Ribonucleotide Proteins 0.000 claims description 2
- 239000005547 deoxyribonucleotide Substances 0.000 claims description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 claims description 2
- 239000002336 ribonucleotide Substances 0.000 claims description 2
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 2
- 229920000728 polyester Polymers 0.000 claims 1
- 230000015654 memory Effects 0.000 abstract description 7
- 108020004414 DNA Proteins 0.000 description 87
- 239000000047 product Substances 0.000 description 72
- 238000003752 polymerase chain reaction Methods 0.000 description 69
- 238000006116 polymerization reaction Methods 0.000 description 33
- 238000004422 calculation algorithm Methods 0.000 description 28
- 150000007523 nucleic acids Chemical class 0.000 description 27
- 238000013459 approach Methods 0.000 description 24
- 108020004707 nucleic acids Proteins 0.000 description 24
- 102000039446 nucleic acids Human genes 0.000 description 24
- 238000009396 hybridization Methods 0.000 description 23
- 238000010790 dilution Methods 0.000 description 19
- 239000012895 dilution Substances 0.000 description 19
- 230000000295 complement effect Effects 0.000 description 17
- 238000001502 gel electrophoresis Methods 0.000 description 15
- 108091008146 restriction endonucleases Proteins 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 12
- 239000000203 mixture Substances 0.000 description 12
- 239000000499 gel Substances 0.000 description 11
- 239000003446 ligand Substances 0.000 description 11
- 230000000704 physical effect Effects 0.000 description 11
- 230000008901 benefit Effects 0.000 description 10
- 239000013599 cloning vector Substances 0.000 description 10
- 230000010365 information processing Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 210000004027 cell Anatomy 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 238000007792 addition Methods 0.000 description 8
- 239000004020 conductor Substances 0.000 description 8
- 238000011109 contamination Methods 0.000 description 8
- 230000029087 digestion Effects 0.000 description 8
- 239000003973 paint Substances 0.000 description 8
- 238000000926 separation method Methods 0.000 description 8
- 239000007787 solid Substances 0.000 description 8
- 239000012528 membrane Substances 0.000 description 7
- 238000010369 molecular cloning Methods 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 230000006399 behavior Effects 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000002844 melting Methods 0.000 description 6
- 230000008018 melting Effects 0.000 description 6
- 230000037452 priming Effects 0.000 description 6
- 239000007864 aqueous solution Substances 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000001338 self-assembly Methods 0.000 description 5
- 239000007858 starting material Substances 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 4
- 238000010170 biological method Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 241000283690 Bos taurus Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108091092919 Minisatellite Proteins 0.000 description 3
- 238000004026 adhesive bonding Methods 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 3
- 229960005542 ethidium bromide Drugs 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 230000001788 irregular Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000010188 recombinant method Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 206010017914 Gastroenteritis salmonella Diseases 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 206010037660 Pyrexia Diseases 0.000 description 2
- 108010052160 Site-specific recombinase Proteins 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000012411 cloning technique Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 239000003292 glue Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 238000002649 immunization Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000006193 liquid solution Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000002086 nanomaterial Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 210000000352 storage cell Anatomy 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 208000031295 Animal disease Diseases 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- CPELXLSAUQHCOX-UHFFFAOYSA-M Bromide Chemical compound [Br-] CPELXLSAUQHCOX-UHFFFAOYSA-M 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- BPQQTUXANYXVAA-UHFFFAOYSA-N Orthosilicate Chemical compound [O-][Si]([O-])([O-])[O-] BPQQTUXANYXVAA-UHFFFAOYSA-N 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 101100057143 Schizosaccharomyces pombe (strain 972 / ATCC 24843) cta3 gene Proteins 0.000 description 1
- 241000779819 Syncarpia glomulifera Species 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- 239000010836 blood and blood product Substances 0.000 description 1
- 229940125691 blood product Drugs 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 150000001722 carbon compounds Chemical class 0.000 description 1
- 239000012876 carrier material Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 229910052588 hydroxylapatite Inorganic materials 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 239000000976 ink Substances 0.000 description 1
- 238000009830 intercalation Methods 0.000 description 1
- 239000004922 lacquer Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011344 liquid material Substances 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
- 238000002406 microsurgery Methods 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 231100000956 nontoxicity Toxicity 0.000 description 1
- 102000044158 nucleic acid binding protein Human genes 0.000 description 1
- 108700020942 nucleic acid binding protein Proteins 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000001739 pinus spp. Substances 0.000 description 1
- 229920000767 polyaniline Polymers 0.000 description 1
- 230000000379 polymerizing effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000009419 refurbishment Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 229940036248 turpentine Drugs 0.000 description 1
- 239000002966 varnish Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000010626 work up procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C13/00—Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
- G11C13/0002—Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
- G11C13/0009—RRAM elements whose operation depends upon chemical change
- G11C13/0014—RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
- G11C13/0019—RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising bio-molecules
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B82—NANOTECHNOLOGY
- B82Y—SPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
- B82Y10/00—Nanotechnology for information processing, storage or transmission, e.g. quantum computing or single electron logic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/123—DNA computing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C13/00—Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
- G11C13/0002—Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
- G11C13/0009—RRAM elements whose operation depends upon chemical change
- G11C13/0014—RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biochemistry (AREA)
- Evolutionary Biology (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Mathematical Physics (AREA)
- Microbiology (AREA)
- Nanotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Saccharide Compounds (AREA)
Abstract
Die Erfindung betrifft Verfahren zur Herstellung informationstragender Polymere, nach diesen Verfahren erhältliche informationstragende Polymere; Verfahren zur Isolierung, zur Vervielfältigung und zum Auslesen solcher informationstragender Polymere; polymere Datenspeicher und DNA-Computer, die informationstragende Polymere umfassen sowie die Verwendung informationstragender Polymere zur Herstellung von Molekulargewichtsstandards, als Marker oder Signaturen, zur Verschlüsselung von Information, als molekulare Kleber oder zur Herstellung oder Bearbeitung kleinster molekularer Strukturen.
Description
Die Erfindung betrifft Verfahren zur Herstellung informationstragender Polymere, nach diesen
Verfahren erhältliche informationstragende Polymere; Verfahren zur Isolierung, zur
Vervielfältigung und zum Auslesen solcher informationstragender Polymere; polymere
Datenspeicher und DNA-Computer, die informationstragende Polymere umfassen sowie die
Verwendung informationstragender Polymere zur Herstellung von
Molekulargewichtsstandards, als Marker oder Signaturen, zur Verschlüsselung von
Information, als molekulare Kleber oder zur Herstellung oder Bearbeitung kleinster
molekularer Strukturen.
Es ist bekannt, Nukleinsäuren wie DNA (Deoxiribonucleic Acid = Desoxyribonukleinsäure) und
RNA (Ribonucleic Acid = Ribonukleinsäure) auch außerhalb von Organismen zur
Informationsverarbeitung zu verwenden. Es wurden bisher verschiedene Ansätze, DNA
Moleküle zur Informationsverarbeitung zu verwenden, vorgestellt.
Die WO 97/07 440 und [L. M. Adleman, Molecular Computation of Solutions to Combinatorial
Problems, Science, 266, 1021-1024, (1994)] beschreiben ein Verfahren, einen Graphen-
Algorithmus ("Hamiltonian-Pfad-Problem") als Entscheidungsproblem mit Hilfe von DNA
Molekülen zu berechnen. Der Algorithmus wird implementiert, indem die Kanten und Knoten
des Graphen als DNA Sequenzen repräsentiert werden. Die Berechnung des Algorithmus wird
dadurch vorgenommen, daß durch die Hybridisierung komplementärer DNA Sequenzen eine
Menge von Pfaden des Graphen erzeugt werden.
Aus dieser Menge von Pfaden werden dann mit Hilfe molekularbiologischer Verfahren alle
Pfade entfernt, die eine falsche oder keine Lösung des Algorithmus sind. Wurden alle Schritte
erfolgreich ausgeführt, so muß am Ende entweder mindestens ein DNA Strang übrigbleiben,
der die richtige Lösung des Problems enthält, oder es bleibt kein DNA Strang übrig, was
bedeutet, daß der Algorithmus keine Lösung hat.
Das beschriebene Verfahren setzt voraus, daß genügend viele Moleküle zur Verfügung
stehen, damit jede mögliche Lösung der jeweiligen Probleminstanz statistisch mindestens
einmal in der Ausgangsmenge von Pfaden vorkommt. Dies kann aufgrund der statistischen
Natur der Hybridisierungsvorgänge jedoch nicht garantiert werden. Außerdem können im
ersten Schritt auch zyklische Graphen entstehen, was von vorneherein die Menge falscher
Lösungen vergrößert.
Der in WO 97/07 440 beschriebene Ansatz zeigt, daß Symbolverarbeitung überhaupt in vitro
mit DNA Molekülen vorgenommen werden kann. Jedoch ist der beschriebene Ansatz in der
Praxis kaum verwendbar: Ein Problem ist, daß der Algorithmus nicht deterministisch, sondern
nur stochastisch ist, das gefundene Ergebnis ist damit nur mit einer bestimmten
Wahrscheinlichkeit korrekt. Ein weiteres Problem ist, daß die Implementierung des
Algorithmus nicht effizient (Laufzeit-optimal) ist, dadurch wird die Berechnung langsam.
Es wird dargelegt, daß das verwendete Verfahren zur Lösung NP-vollständiger Probleme
(einer Klasse von Problemen, für die nur deterministische Lösungsalgorithmen mit
exponentieller Laufzeit bekannt sind und von der vermutet wird, daß es keine effizienten
deterministischen Lösungsalgorithmen gibt) besonders gut geeignet sei, weil der Algorithmus
aufgrund der Parallelität der ausgeführten Operationen nur lineare Laufzeit benötige. Diese
Argumentation ist jedoch insofern fehlerhaft, als die lineare Laufzeit durch eine exponentielle
Anzahl von Molekülen kompensiert wird. Die exponentielle Problemgröße bleibt also
unverändert bestehen.
Insgesamt ist das in der WO 97/07 440 beschriebene Verfahren zu sehr eingeschränkt, um für
molekulare Informationsverarbeitung über den beschriebenen Algorithmus hinaus verwendbar
zu sein: Das Hamiltonian-Pfad-Problem ist fest kodiert, andere Algorithmen können damit
nicht berechnet werden, jede Probleminstanz muß neu kodiert werden. Programmierung ist
nicht vorgesehen, alle Schritte des Algorithmus werden von Hand ausgeführt. Ein Input-
/Output-System ist nicht vorgesehen. Insgesamt ist das Verfahren zur Programmierung von
Algorithmen oder zur Implementierung eines Computers nicht geeignet.
Die WO 97/29 117 und [Frank Guarnieri, Makiko Fliss, Carter Bancroft, Making DNA Add,
Science, 273, 220-223, (1996)] beschreiben ein Verfahren, Additionen mit Hilfe von DNA
Molekülen auszuführen. Die Addition erfolgt als Schiebeoperation mit Überlauf-Übertrag in
vitro mit DNA Molekülen und Primer-Elongation.
Das beschriebene Verfahren beschreibt ausschließlich Additionen. Jedoch ist selbst die
Verwendung als Addierer aus mindestens zwei Gründen ungünstig: Zum einen ist Addition mit
dem beschriebenen Verfahren nicht effizient (Laufzeit-optimal) implementiert. Zum anderen ist
das verwendete System formal unvollständig, weil die durch Addition erzeugten Ergebnisse
ihrerseits nicht mehr als Zahlen für Berechnungen verwendet werden können. Über die
Addition hinausgehende Konzepte fehlen. Insgesamt ist das Verfahren zur Programmierung
von Algorithmen oder zur Implementierung eines Computers nicht geeignet.
In [Qi Ouyang, Peter D. Kaplan, Shumao Liu, Albert Libchaber, DNA Solution of the Maximal
Clique Problem, Science, 278, 446-449, (1997)] wird ein Verfahren beschrieben, einen
Algorithmus zur Lösung des "Max-Clique-Problem"s zu implementieren. Der Algorithmus
stammt aus der Graphentheorie und fällt unter die NP-vollständigen Probleme. Wie in [L. M.
Adleman, Molecular Computation of Solutions to Combinatorial Problems, Science, 266,
1021-1024, (1994)] ist das Verfahren nur in der Lage, einen fest kodierten
Lösungsalgorithmus zu berechnen. Auch hier wird das Ergebnis nur mit einer bestimmten
Wahrscheinlichkeit erhalten. Das von den Autoren beschriebene Verfahren enthält keine
weiterführenden Konzepte (etwa in Hinsicht der Implementierung auch anderer Algorithmen).
Insgesamt ist das Verfahren zur Programmierung von Algorithmen oder zur Implementierung
eines Computers nicht geeignet.
In [Erik Winfree, Xiaoping Yang, Nadrian C. Seeman, Universal Computation via Self
assembly of DNA: Some Theory and Experiments, Proceedings of the 2nd DIMACS Meeting
on DNA Based Computers, Princeton University, June 20-12, (1996)] wird erörtert, reguläre
Grammatiken in DNA durch Verknüpfung von Oligonukleotiden mit "sticky ends" zu
implementieren. Die Ausführungen sind jedoch rein theoretischer Natur und scheitern an
wesentlichen, bisher ungelösten Problemen. Insbesondere wird nicht dargelegt, wie die zur
Implementierung von Grammatiken benötigten Sequenzen konstruiert werden müssen.
Gerade dies ist aber das entscheidende Problem, ohne dessen Lösung Grammatiken nicht
implementiert werden können. Der Grund dafür liegt darin, daß die Sequenzen, die die
Variablen und Terminale einer Grammatik repräsentieren, sowohl eindeutig, als auch
untereinander hinreichend unähnlich sein müssen. Außerdem müssen sie bestimmte
strukturelle, chemische und physikalische Eigenschaften erfüllen. Andernfalls sind
Fehlhybridisierungen zwischen Sequenzen zwangsläufig, die bei der Polymerisierung zu
ungewollten Kettenverlängerungen und Kettenabbrüchen führen und damit das Funktionieren
des Verfahrens unmöglich machen. Dieses Problem verschärft sich mit der Anzahl der
benötigten Sequenzen exponentiell.
Das beschriebene Verfahren wird von den Autoren selbst wieder verworfen, bzw. insofern als
unzureichend bezeichnet, als es keine sonderlich interessanten Berechnungen erlaube (Erik
Winfree, Xiaoping Yang, Nadrian C. Seeman, Universal Computation via Self-assembly of
DNA: Some Theory and Experiments, Proceedinsrs of the 2nd DIMACS Meeting on DNA
Based Computers, Princeton University, June 20-12, (1996), S. 8, 2. Absatz, 1. Zeile).
Weiterführende Experimente der Autoren stützen sich entsprechend auch nicht weiter auf
reguläre Grammatiken und lineare Polymere, sondern auf kontextsensitive Grammatiken zur
Erzeugung von DNA Gitterstrukturen [Erik Winfree, Furong Liu, Lisa A. Wenzler & Nadrian C.
Seeman, Design and self-assembly of two-dimensional DNA crystals, Nature, 394, 539-544,
(1998)]. Der von den Autoren beschriebene Ansatz ist womöglich zur Erzeugung DNA
basierter Nanostrukturen (Herstellung von Katalysatoren usw.) geeignet. Zur
Informationsverarbeitung eignet er sich hingegen nicht, hier sind die erzeugten
Gitterstrukturen eher hinderlich.
Zwar sprechen die Autoren von der Möglichkeit, das mathematische Konzept der "Wang tiles"
durch die erzeugten Gitterstrukturen zu realisieren und damit potentiell auch für
Berechnungen zu verwenden, sie bleiben aber bei der bloßen Erwähnung einer solchen
Möglichkeit, ohne zu beschreiben, wie dies im Sinne einer Informationsverarbeitung genutzt
werden kann.
Es ist überhaupt zweifelhaft, ob der von den Autoren beschriebene Ansatz überhaupt zu einer
Informationsverarbeitung geeignet ist: Die Gitterstrukturen verhindern die Vervielfältigung
informationstragender Sequenzen (z. B. durch Klonierung oder PCR = Polymerase Chain
Reaction = Polymerase Kettenreaktion) und machen es unmöglich, die erzeugten Strukturen
als Daten zu verwenden, weil diese nicht mehr, etwa durch PCR, ausgelesen werden können.
Entsprechend sieht der gewählte Ansatz in der jetzigen Form konzeptionell gar keine
Möglichkeit vor, die erzeugten Strukturen im Sinne einer Informationsverarbeitung, etwa als
Daten, zu nutzen.
Aus dem Stand der Technik ist bisher kein Verfahren bekannt, das es erlaubt, DNA Moleküle
für die Implementierung effizienter Algorithmen zu verwenden. Es ist kein Verfahren bekannt,
Berechnungen automatisch (etwa in Art eines molekularen Computers) durchzuführen. Es ist
auch kein Verfahren bekannt, Programme in Form von regulären Grammatiken mit
molekularen Verfahren so zu implementieren, daß damit
- a) unterschiedliche (im Idealfall beliebige) reguläre Grammatiken implementiert werden können
- b) die mit regulären Grammatiken erzeugten Wörter einer Sprache ausgelesen werden können
- c) die mit regulären Grammatiken erzeugten Wörter einer Sprache für technische Zwecke (z. B. Informationsverarbeitung, Polymerchemie) weiterverwendet werden können.
Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren bereitzustellen,
das es erlaubt, Informationsverarbeitung auf molekularer Basis mithilfe regulärer
Grammatiken vorzunehmen, ohne dabei auf eine oder wenige Grammatiken eingeschränkt zu
sein. Das Verfahren soll kompatibel zu herkömmlichen Computern sein und eine
Informationsverarbeitung erlauben, die teilweise auf molekularer Basis und teilweise auf der
Basis herkömmlicher Computer stattfindet. Das Verfahren soll programmierbar und
weitgehend automatisierbar sein. Die innerhalb des Verfahrens erzeugten Polymere sollen
lesbar und für weiterführende Anwendungen und Verfahren verwendbar sein.
Diese Aufgabe wird gelöst durch ein Verfahren zur Herstellung informationstragender
Polymere, das umfaßt,
- A) eine reguläre Grammatik G = (Σ, V, R, S) mit einem endlichen Terminalalphabet Σ, einer endlichen Variablenmenge V, einer endlichen Regelmenge R und einem Startsymbol S zu definieren;
- B) das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) zur Herstellung von Monomersequenzen (Oligo- oder Polymere);
- C) mit dem NFR-Verfahren eine in Schritt I definierte Grammatik zu implementieren, indem damit Monomersequenzen hergestellt werden, die die Regelmenge R einer Grammatik G eindeutig darstellen;
- D) aus den in Schritt III hergestellten Monomersequenzen für jede Regel der Regelmenge R von G ein die Regel repräsentierendes Oligomer (Algomer) zusammenzusetzen (Algomer-Assemblierung);
- E) die in Schritt IV zusammengesetzten Oligomere (Algomere) zu informationstragenden Polymeren zu verknüpfen (Symbolpolymerisation).
Im Rahmen der vorliegenden Erfindung werden folgende Definitionen und Abkürzungen
verwendet:
Algomer: Doppelsträngiges Oligomer, das eine Regel einer gegebenen Grammatik repräsentiert. Algomere können miteinander zu Logomeren verknüpft werden.
Auslese-PCR: PCR, die zum Auslesen der in Logomeren enthaltenen Information verwendet wird.
Bitpolymerisation: Prozeß des Verkettens von Algomeren zu Logomeren, wenn es nur zwei verschiedene Elongatoren gibt.
Elongator: Algomer mit zwei Überhangsequenzen; kann mit Terminator oder Elongator ligieren und führt zu einer Kettenverlängerung.
Grammatik: Formalismus, der Sprachen beschreibt. Er basiert auf der formalen Theorie von Sprachen [Chomsky, N., Three models for the description of language, JACM, 2 : 3, 113-124, (1956)], [Chomsky, N., On certain formal properties of grammars, lnf. and Control, 2 : 2, 137-167, (1959)], [Chomsky, N., Formal properties of grammars, Handbook of Math. Psych., 2, 323-418, (1963)].
Eine Grammatik G beschreibt eine Sprache L (G), das Alphabet dieser Sprache und deren Syntax. Nach einer Grammatik G können alle Wörter dieser Sprache erzeugt werden.
Eine Grammatik G ist ein Quadrupel (Σ, V, R, S) mit Terminalalphabet Z, Variablenmenge V, Startsymbol S und Regelmenge R.
Logomer: Polymer, das symbolische Informationen trägt und durch die Verkettung von Algomeren erzeugt wurde. Entsprechend besteht ein Logomer aus sich wiederholenden Einheiten von Algomeren. Ein Logomer repräsentiert ein Wort einer Sprache L (G), die von der entsprechenden Grammatik G erzeugt wird.
Monomer: Einzelmolekül. Mehrere Monomere können zu längeren Ketten verknüpft werden und so Oligomere und Polymere bilden.
Monomere sind im Fall von Desoxyribonukleinsäure die Nukleotide (Adenin, Cytosin, Guanin, Thymin wie auch sog. Basenanaloga wie Hypoxanthin etc.).
Oligomer: Kurzkettiges Molekül aus sich wiederholenden Einheiten (Monomeren). Auch kurze doppelsträngige Moleküle werden als Oligomere bezeichnet.
PCR: Polymerase Chain Reaction = Polymerase Kettenreaktion; Verfahren zur exponentiellen Vervielfältigung von DNA.
Die PCR benötigt ein DNA Template, das vervielfältigt wird, und zwei Primer, die jeweils gegenläufig im Template ansetzen und als Startpunkte einer DNA Polymerisation fungieren. Durch iterative Wiederholung von Schmelzen-Hybridisierung-Polymerisations-Zyklen wird das DNA Template vervielfältigt.
Polymer: Langkettiges Molekül aus sich wiederholenden Einheiten (Monomeren).
Regel: auch: Produktionsregel, Ersetzungsregel oder Ableitungsregel.
Beschreibt die Ersetzung von Symbolen durch andere. Durch die wiederholte Anwendung von Regeln können Symbolketten erzeugt werden.
Sequenz: Informatik: Abfolge von Zeichen;
Chemie: Abfolge kovalent verbundener Monomere;
Molekularbiologie: Abfolge kovalent verbundener Nukleotide.
Komplementarität: Zwei Sequenzen sind dann komplementär, wenn sie miteinander hybridisieren können. Im Falle von DNA sind z. B. die Sequenzen 5'attt3' und 5'aaat3' komplementär, die Sequenz 5'acgt3' ist zu sich selbst komplementär.
Startsymbol: Variable innerhalb einer Grammatik, von der ausgehend, durch Anwendung der Regeln der Grammatik, eine Symbolkette erzeugt werden kann.
Symbolpolymerisation: Prozeß des Verkettens von Algomeren zu Logomeren.
Terminal: Symbol einer Grammatik. Ein Terminal kann nicht weiter ersetzt (substituiert) werden. Terminale sind die "Buchstaben" der Worte einer Sprache L (G).
Terminator: Algomer mit einer Überhangsequenz. Kann nur mit Elongator ligieren. Führt zum Kettenabbruch bei einer Symbolpolymerisation.
Variable: Symbol einer Grammatik. Eine Variable kann gemäß der Regel einer Grammatik von Terminalen, Variablen oder Kombinationen von Terminalen und Variablen ersetzt werden.
Algomer: Doppelsträngiges Oligomer, das eine Regel einer gegebenen Grammatik repräsentiert. Algomere können miteinander zu Logomeren verknüpft werden.
Auslese-PCR: PCR, die zum Auslesen der in Logomeren enthaltenen Information verwendet wird.
Bitpolymerisation: Prozeß des Verkettens von Algomeren zu Logomeren, wenn es nur zwei verschiedene Elongatoren gibt.
Elongator: Algomer mit zwei Überhangsequenzen; kann mit Terminator oder Elongator ligieren und führt zu einer Kettenverlängerung.
Grammatik: Formalismus, der Sprachen beschreibt. Er basiert auf der formalen Theorie von Sprachen [Chomsky, N., Three models for the description of language, JACM, 2 : 3, 113-124, (1956)], [Chomsky, N., On certain formal properties of grammars, lnf. and Control, 2 : 2, 137-167, (1959)], [Chomsky, N., Formal properties of grammars, Handbook of Math. Psych., 2, 323-418, (1963)].
Eine Grammatik G beschreibt eine Sprache L (G), das Alphabet dieser Sprache und deren Syntax. Nach einer Grammatik G können alle Wörter dieser Sprache erzeugt werden.
Eine Grammatik G ist ein Quadrupel (Σ, V, R, S) mit Terminalalphabet Z, Variablenmenge V, Startsymbol S und Regelmenge R.
Logomer: Polymer, das symbolische Informationen trägt und durch die Verkettung von Algomeren erzeugt wurde. Entsprechend besteht ein Logomer aus sich wiederholenden Einheiten von Algomeren. Ein Logomer repräsentiert ein Wort einer Sprache L (G), die von der entsprechenden Grammatik G erzeugt wird.
Monomer: Einzelmolekül. Mehrere Monomere können zu längeren Ketten verknüpft werden und so Oligomere und Polymere bilden.
Monomere sind im Fall von Desoxyribonukleinsäure die Nukleotide (Adenin, Cytosin, Guanin, Thymin wie auch sog. Basenanaloga wie Hypoxanthin etc.).
Oligomer: Kurzkettiges Molekül aus sich wiederholenden Einheiten (Monomeren). Auch kurze doppelsträngige Moleküle werden als Oligomere bezeichnet.
PCR: Polymerase Chain Reaction = Polymerase Kettenreaktion; Verfahren zur exponentiellen Vervielfältigung von DNA.
Die PCR benötigt ein DNA Template, das vervielfältigt wird, und zwei Primer, die jeweils gegenläufig im Template ansetzen und als Startpunkte einer DNA Polymerisation fungieren. Durch iterative Wiederholung von Schmelzen-Hybridisierung-Polymerisations-Zyklen wird das DNA Template vervielfältigt.
Polymer: Langkettiges Molekül aus sich wiederholenden Einheiten (Monomeren).
Regel: auch: Produktionsregel, Ersetzungsregel oder Ableitungsregel.
Beschreibt die Ersetzung von Symbolen durch andere. Durch die wiederholte Anwendung von Regeln können Symbolketten erzeugt werden.
Sequenz: Informatik: Abfolge von Zeichen;
Chemie: Abfolge kovalent verbundener Monomere;
Molekularbiologie: Abfolge kovalent verbundener Nukleotide.
Komplementarität: Zwei Sequenzen sind dann komplementär, wenn sie miteinander hybridisieren können. Im Falle von DNA sind z. B. die Sequenzen 5'attt3' und 5'aaat3' komplementär, die Sequenz 5'acgt3' ist zu sich selbst komplementär.
Startsymbol: Variable innerhalb einer Grammatik, von der ausgehend, durch Anwendung der Regeln der Grammatik, eine Symbolkette erzeugt werden kann.
Symbolpolymerisation: Prozeß des Verkettens von Algomeren zu Logomeren.
Terminal: Symbol einer Grammatik. Ein Terminal kann nicht weiter ersetzt (substituiert) werden. Terminale sind die "Buchstaben" der Worte einer Sprache L (G).
Terminator: Algomer mit einer Überhangsequenz. Kann nur mit Elongator ligieren. Führt zum Kettenabbruch bei einer Symbolpolymerisation.
Variable: Symbol einer Grammatik. Eine Variable kann gemäß der Regel einer Grammatik von Terminalen, Variablen oder Kombinationen von Terminalen und Variablen ersetzt werden.
Abb. 1: Algomere, wie in der Erläuterung zu Schritt IV des erfindungsgemäßen
Verfahrens beschrieben. Die Algomere besitzen jeweils eine doppelsträngige Kernsequenz,
die ein Terminal einer gegebenen Grammatik darstellt und mindestens eine einzelsträngige
Überhangsequenz, die eine Variable der gegebenen Grammatik darstellt, so daß jeweils ein
Algomer genau eine Regel der gegebenen Grammatik repräsentiert. X und Y sind keine
Variablen, sondern Überhangsequenzen, die z. B. für eine Klonierung benutzt werden können.
Mit Überstrichen dargestellte Buchstaben kennzeichnen Komplementarität. Gemäß der
Definition sind A0A und A1A Elongatoren, XsA und AeY Terminatoren. Die hier dargestellten
Algomere repräsentieren die im Folgenden beschriebenen Grammatik zur Erzeugung binärer
Zufallszahlen.
Abb. 2: Symbolpolymerisation, wie in der Erläuterung zum erfindungsgemäßen Schritt V
beschrieben. Algomere werden durch Verkettung (im Falle von DNA: Hybridisierung und
Ligation) zu Logomeren verknüpft. Das Logomer Xs01010101eY beinhaltet eine terminierte
Bitfolge, die durch die Überhänge X und Y in einer definierten Orientierung vervielfältigt
werden kann.
Abb. 3: Muster, das die Symbolpolymerisation für binäre Zufallszahlen nach
Gelelektrophorese und Färbung zeigt (Spuren 1-3). Aufgrund der zufälligen Länge der binären
Zufallszahlen ergibt sich ein regelmäßiges Leitermuster. Spur 4 zeigt einen 50 bp
Molekulargewichtsstandard (Gibco BRL, Life Technologies, Katalog Nr. 10416-014).
Abb. 4: Klonierung eines durch Symbolpolymerisation erhaltenen Logomers in einem
Vektor, wie zu Vervielfältigung und Isolierung von Logomeren im Folgenden beschrieben.
Abb. 5: Schematische Darstellung eines Bandenmusters, das durch Auslesen eines
binären Logomers durch PCR und nachfolgende Gelelektrophorese erhalten wird (im
Folgenden beschrieben). Im gezeigten Beispiel haben die Algomere eine Länge von 30 bp
(Überhangsequenzen nur ½ gerechnet). Bei bekannter Länge des Logomers reicht es,
jeweils nur 0en oder nur 1en auszulesen. Beide Bits auszulesen dient der Kontrolle. Das
Verfahren kann auch für mehrwertige Logomere (mehr als 2 Elongatoren) verwendet werden.
Abb. 6: Bandenmuster einer Gelelektrophorese nach PCR zum Auslesen von drei
verschiedenen Logomeren. Die Logomere wurden nach der im Folgenden beschriebenen
Grammatik für Zufallszahlen beliebiger Länge erhalten. Als Zufallszahlen von unten nach
oben gelesen ist a = 262, b = 97, c = 329. M (Spur 5) ist ein 50 bp Molekulargewichtsstandard
(Gibco BRL, Life Technologies, Katalog Nr. 10416-014).
Abb. 7: Schematische Darstellung des Auslesens von Logomeren durch
Restriktionsverdau wie im Folgenden beschrieben. Die Elongatoren tragen
Restriktionsschnittstellen, die derart asymmetrisch angeordnet sind, daß der
Restriktionsverdau von Logomeren in einem eindeutigen Schnittmuster von Fragmenten
resultiert. Das Schnittmuster entspricht Banden verschiedener Länge, und kann durch
Gelelektrophorese sichtbar gemacht werden. R1 und R2 sind unterschiedliche
Restriktionsenzyme, x und y bezeichnen die Länge der nach Restriktionsverdau erhaltenen
Fragmente. Zweckmäßig ist z. B. ein Verhältnis x : y von 1 : 2.
Abb. 8: Bandenmuster, die durch Gelelektrophorese nach dem Auslesen von
Logomeren durch Restriktionsverdau erhalten werden. Spur 7 und 8 enthalten
Molekulargewichtsstandards (Spur 7: 50 pb Leiter, Gibco BRL, Life Technologies, Katalog Nr.
10416-014; Spur 8: 10 bp Leiter)
Abb. 9: Schematische Darstellung eines polymeren Datenspeichers auf der Basis von
Algomeren und Symbolpolymerisation wie im Nachfolgenden beschrieben. Algomere können
an Ankermoleküle (AM), die an einem festen Träger (C) gebunden ist, polymerisieren. Das
Schreiben (W) erfolgt durch die wiederholte Abfolge (ReW) von Hybridisierungs-Ligations-
Restriktionszyklen (Hyb, Lig, Res). Durch Denaturieren oder Restriktion (Den/Dig) können die
erhaltenen Logomere abgetrennt und ausgelesen werden.
Abb. 10: Vereinfachte Darstellung der Bestandteile eines DNA Desktop Computers wie
im Nachfolgenden beschrieben. Im Einzelnen sind:
A: Oligo-Synthesizer, B: Thermozykler, C: Reaktionskammern, D: Pipettiervorrichtung, E: Gel,
F: Scanner, G: Steuerungscomputer
A: Oligo-Synthesizer, B: Thermozykler, C: Reaktionskammern, D: Pipettiervorrichtung, E: Gel,
F: Scanner, G: Steuerungscomputer
Es kennzeichnen:
1: Zugabe von Oligonukleotiden, 2: Zugabe synthetisierter Oligomere in Reaktionskammern des Thermozyklers, 3: Zugabe von Lösungen und Molekülen, die zur Algomer-Assemblierung, Symbolpolymerisation, zur Isolierung von Logomeren und zum Auslesen benötigt werden.
1: Zugabe von Oligonukleotiden, 2: Zugabe synthetisierter Oligomere in Reaktionskammern des Thermozyklers, 3: Zugabe von Lösungen und Molekülen, die zur Algomer-Assemblierung, Symbolpolymerisation, zur Isolierung von Logomeren und zum Auslesen benötigt werden.
Abb. 11: Verschlüsselung von Logomeren wie im Folgenden beschrieben. Sind die
Terminatoren und die darin primenden Primer unbekannt, so ist das jeweilige Logomer
verschlüsselt und kann nicht ausgelesen werden (A). Ist dagegen ein in einem Terminator
primender Primer verfügbar oder die Sequenz eines Terminators bekannt, so kann das
jeweilige Logomer gelesen werden (B).
Abb. 12: Y-förmiges Molekül, das als Terminator bei der asymmetrischen
Verschlüsselung von Logomeren verwendet werden kann. Elongatoren können an das mit 2
markierte Ende angeknüpft werden, weitere, z. B. Y-förmige, Moleküle an die mit 1 und 3
bezeichneten Enden. Werden mehrere Y-förmige Moleküle miteinander verknüpft, so erhält
man baumartige Strukturen.
Abb. 13: Logomer mit Terminatoren s und e, die als baumartige Strukturen realisiert
sind.
Abb. 14: Mit einem Vektor V verknüpftes Logomer L mit baumartigen Terminatoren. Die
Terminatoren sind so konstruiert, daß jeweils nur ein Ast des Terminators mit dem Vektor
verknüpft werden kann.
Abb. 15: Markierung von Nukleinsäuren mit Logomeren wie im Nachfolgenden
beschrieben: Um gentechnisch hergestellte oder veränderte Produkte zu markieren, wird ein
Logomer mithilfe rekombinativer Techniken in einen nicht-transkribierten Bereich, z. B. vor den
Promotor (P) eines zu markierenden Genes (G), eingesetzt.
Abb. 16: Markierung von Dokumenten mit Logomeren wie im Nachfolgenden
beschrieben. Spur 1 zeigt den verwendeten Molekulargewichtsstandard (50 bp, Gibco BRL,
Life Technologies, Katalog Nr. 10416-014), Spur 2 (0-Bits) und Spur 3 (1-Bits) das
Bandenmuster des Auslesens von Logomer Nr. 330 durch PCR aus wässriger Lösung, die
Spuren 4 und 5 dasselbe wie die Spuren 2 und 3, wobei hierbei jedoch das Logomer Nr. 330
nicht aus wässriger Lösung, sondern in ca. 109 Molekülen/µl getrocknet auf Papier (3M Post-
lt, 1 Stunde getrocknet) als Papierschnipsel (ca. 1 mm2) in die Auslese-PCR einging.
Abb. 17: Herstellung von Molekulargewichtsstandards durch Auslese-PCR, die ein
unäres Logomer als Template enthält, wie im Nachfolgenden beschrieben. 1 zeigt die
Anordnung verschachtelter Primer in der Auslese-PCR, 2 das nach Gelelektrophorese der
PCR-Fragmente erhaltene Bandenmuster.
Abb. 18: Verkleben von Flächen mit Nukleinsäuren wie im Nachfolgenden beschrieben.
C bezeichnet die zu verklebende Fläche, Log die Logomere, die zum Verkleben an die
Flächen gebunden werden. 1 zeigt das Verhalten von Flächen mit nicht-komplementären, 2
das Verhalten von Flächen mit komplementären Logomeren.
Abb. 19: Verkleben von Flächen mit Logomeren, Antikörpern und Liganden wie im
Nachfolgenden beschrieben: C0 und C1 bezeichnen die zu verklebenden Flächen, die aus
gleichem oder unterschiedlichem Material bestehen können. Die zu verklebenden Flächen
sind mit Logomeren (Log) versetzt. An die Logomere können Proteine, z. B. Antikörper vom
Typ Ab A und Ab B binden, wobei Ab A und Ab B gleich oder verschieden sein können. Ab A
und Ab B sind ihrerseits durch einen Liganden (Li) miteinander verbunden.
Abb. 20: Verkleben von Flächen mit Proteinen z. B. Antikörpern ohne Verwendung von
Logomeren. C0 und C1 bezeichnen die zu verklebenden Flächen, die aus gleichem oder
unterschiedlichem Material bestehen können. Die Proteine vom Typ Ab A und Ab B binden
direkt an die zu verklebenden Flächen und sind ihrerseits durch einen Liganden (Li)
miteinander verbunden.
Eine Grammatik ist ein Quadrupel G = (Σ, V, R, S) mit einem endlichen Terminalalphabet Σ,
einer endlichen Variablenmenge V, einer endlichen Regelmenge R und einem Startsymbol S.
Für eine Sprache L (G), die durch G beschrieben wird, können alle Wörter aus L als Wörter
über dem Terminalalphabet Σ gebildet werden, indem man das Startsymbol S entsprechend
den Regeln aus R ableitet.
Die Definition einer Grammatik G nach Schritt I des erfindungsgemäßen Verfahrens ist
insofern frei, als beliebige, endliche Mengen von Terminalen und Variablen kodiert werden
können. Erfindungsgemäß bevorzugt ist jedoch die Definition von Grammatiken, die die
Binärdarstellung von Daten gestattet, insbesondere von Grammatiken mit
Σ: = {0, 1, s0, s1, s2, . . ., sn-1, sn, e0, e1, e2, . . ., em-1, em} mit n, m ∈ N und n, m ≧ 0.
Diese ermöglichen die Herstellung binärer Logomere.
Zur Veranschaulichung wird im Folgenden eine erfindungsgemäß definierte reguläre
Grammatik zur Erzeugung von Zufallszahlen beliebiger endlicher Länge in Binärdarstellung
gezeigt:
Es sei eine Grammatik G = (Z, V, R, S) mit Terminalalphabet Σ: = {0, 1, s, e}, Variablenmenge V: = {A}, Startsymbol S und Regelmenge) R: =
{
S: = sA
A → 0A
A → 1A
A → e
},
wobei
s: = Start
e: = Ende
sind.
Es sei eine Grammatik G = (Z, V, R, S) mit Terminalalphabet Σ: = {0, 1, s, e}, Variablenmenge V: = {A}, Startsymbol S und Regelmenge) R: =
{
S: = sA
A → 0A
A → 1A
A → e
},
wobei
s: = Start
e: = Ende
sind.
Mit dieser Grammatik können Wörter über dem Terminalalphabet
Σ: = {0, 1, s, e}
gebildet werden. Alle Wörter der Sprache L beginnen mit "s" und hören mit "e" auf,
dazwischen befindet sich eine zufällige Anzahl (auch 0) zufälliger Bits ("0" und "1").
Wörter aus der Sprache L, die nach R gebildet werden, sind beispielsweise:
- a) S → sA → se
- b) S → sA → s1A → s1e
- c) S → sA → s0A → s00A → s001A → s0010A → s0010e
- d) S → sA → s1A → s10A → s100A → s1000A → s10000A → s100000A → s100000e
Die als Wörter der Spache L erzeugten Binärmuster können als beliebige jedoch eindeutige
Darstellung von Datentypen, z. B. als Buchstaben, Zahlen, alphanumerische Zeichen oder
Zeichenketten gelesen werden. Liest man sie als die Binärdarstellung von Zahlen, so sind die
obigen Wörter in Dezimaldarstellung:
- a) ∅ (leer)
- b) 1
- c) 2
- d) 32.
Das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) ist ein Verfahren zur Herstellung
von Monomersequenzen (Oligo- und Polymeren, z. B. Nukleinsäuren), das gewährleistet, daß
die mithilfe des Verfahrens hergestellten Monomersequenzen:
- a) eine eindeutige und einzigartige Abfolge von Monomeren haben;
- b) zueinander möglichst unähnlich sind und daher möglichst keine Fehlhybridisierungen untereinander eingehen;
- c) bestimmte strukturelle Eigenschaften aufweisen, z. B. ein bestimmtes Verhältnis der verschiedenen Monomere zueinander, das Enthaltensein oder Nicht-Enthaltensein bestimmter Teilsequenzen und eine maximale Übereinstimmung (Homologie) untereinander;
- d) bestimmte chemische Eigenschaften aufweisen, z. B. das Vorkommen bestimmter chemisch aktiver Teilsequenzen, die Einfluß auf chemische Reaktionen, im Falle von Nukleinsäuren insbesondere die Wechselwirkung mit Proteinen haben (Proteinbindungsstellen, Restriktionsschnittstellen, Stopcodons);
- e) bestimmte physikalische Eigenschaften aufweisen, z. B. eine bestimmte Schmelztemperatur.
Das NFR-Verfahren erlaubt die Herstellung eindeutiger, möglichst unähnlicher
Monomersequenzen mit vordefinierbaren strukturellen, chemischen und physikalischen
Eigenschaften. Es eignet sich zur Herstellung von Monomersequenzen für kontrollierte
chemische Reaktionen, wie sie z. B. für eine molekularen Informationsverarbeitung benötigt
werden. Es wird in Schritt III des erfindungsgemäßen Verfahrens für die Implementierung
regulärer Grammatiken verwendet.
Das NFR-Verfahren ist eine erfindungsgemäße Fortbildung des Niehaus-Verfahrens zur
Erzeugung eindeutiger, möglichst unähnlicher Sequenzen, das in [Jens Niehaus, DNA
Computing: Bewertung und Simulation, Diplomarbeit am Fachbereich Informatik der
Universität Dortmund, Lehrstuhl XI, 116-123, (1998)] beschrieben ist, und worauf hiermit in
vollem Umfang Bezug genommen wird.
Das NFR-Verfahren ist insofern eine erfindungsgemäße Fortbildung des Niehaus-Verfahrens,
als erst das NFR-Verfahren die Herstellung von Monomersequenzen erlaubt, wie sie für eine
Herstellung in vitro, z. B. zur Implementierung von Grammatiken, benötigt werden. Die Gründe
sind im Einzelnen:
- a) Das Niehaus-Verfahren beschreibt nur die Konstruktion von Sequenzen aus Basissequenzen der Länge 6. Da die Länge von Basissequenzen die maximal zwischen verschiedenen Monomersequenzen möglichen Überlappungen beschreibt, daher unmittelbaren Einfluß auf das Hybridisierungsverhalten von Sequenzen und das Funktionieren der erfindungsgemäßen Schritte IV und V hat, muß das Verfahren jedoch für Basissequenzen beliebiger Länge verallgemeinert werden, was im NFR-Verfahren vorgenommen wurde.
- b) Das Niehaus-Verfahren erlaubt nur die Erzeugung von Sequenzen gleicher Länge, wohingegen das NFR-Verfahren Sequenzen unterschiedlicher Länge und unterschiedlicher Anzahl erzeugen kann. Letzteres ist für ein korrektes Hybridisierungsverhalten von Sequenzen und das Funktionieren der erfindungsgemäßen Schritte IV und V unerläßlich.
- c) Das Niehaus-Verfahren gewährleistet Eindeutigkeit und maximale Unähnlichkeit von Sequenzen nur für Sequenzen, die durch eine einmalige Anwendung des Verfahrens erzeugt wurden. Zwingend erforderlich ist jedoch, auch zu schon existierenden Sequenzen jeweils kompatible, d. h. eindeutige und maximal unähnliche Sequenzen erzeugen zu können. Das NFR-Verfahren kann im Gegensatz zum Niehaus-Verfahren zu beliebig vorgegebenen Sequenzen kompatible (d. h. eindeutige und maximal unähnliche) neue Sequenzen erzeugen. Dabei kann das Verfahren beliebig oft auf dieselbe Menge von Sequenzen angewendet werden.
- d) Das Niehaus-Verfahren beschränkt zwar die maximale Länge gemeinsamer Teilsequenzen, jedoch nicht deren Anzahl. Daher können 2 beliebige nach dem Niehaus- Verfahren konstruierte Sequenzen mehrere gemeinsame Teilsequenzen beinhalten, was ungewollt zu einer hohen Homologie (Sequenzübereinstimmung) führen kann. Die Homolgie hat ihrerseits unmittelbaren Einfluß auf das Hybridisierungsverhalten von Sequenzen und das Funktionieren der erfindungsgemäßen Schritte IV und V. Das NFR- Verfahren dagegen führt bei der Konstruktion von Sequenzen auch einen Homologievergleich durch und vermeidet dadurch ungewollte Fehlhybridisierungen.
- e) Das Niehaus-Verfahren erlaubt nicht die Integration bestimmter, vorgebbarer Sequenzen und Teilsequenzen. Solche Sequenzen sind jedoch für die Ausführung und Kontrolle bestimmter chemischer Reaktionen, z. B. kontrollierter enzymatischer Wechselwirkungen, zwingend notwendig. Beispiele für solche Sequenzen sind im Falle von Nukleinsäuren Proteinbindungsstellen, Restriktionsschnittstellen und Stopcodons. Dagegen erlaubt das NFR-Verfahren die Integration beliebiger Sequenzen und Teilsequenzen in die Herstellung von Monomersequenzen und gewährleistet gleichzeitig Eindeutigkeit und maximale Unähnlichkeit.
- f) Das Niehaus-Verfahren sieht keine Möglichkeit vor, Sequenzen mit bestimmten strukturellen, chemischen oder physikalischen Eigenschaften zu erzeugen. Dagegen enthält das NFR-Verfahren die Möglichkeit, Sequenzen mit bestimmten strukturellen, chemischen und physikalischen Eigenschaften herzustellen. Dazu zählen u. a. das Verhältnis verschiedener Monomere zueinander und die Schmelztemperatur. Auch dies ist für die Implementierung von Grammatiken in vitro eine unbedingte Voraussetzung.
- g) Das Niehaus-Verfahren erlaubt keine direkte Erzeugung regelrepräsentierender Sequenzen, wie sie zur Implementierung von Grammatiken benötigt werden. Dagegen ermöglicht das NFR-Verfahren die Erzeugung symbolrepräsentierender Sequenzen, die zu den für die Implementierung einer Grammatik benötigten regelrepräsentierenden Sequenzen verknüpft werden können.
- h) Nur mithilfe des NFR-Verfahrens können Sequenzen auch so konstruiert werden, daß die Eigenschaften der Eindeutigkeit, maximalen Unähnlichkeit sowie strukturelle, chemische und physikalische Eigenschaften auch für Teilsequenzen gelten. Z. B. lassen sich im Falle von Nukleinsäuren Monomersequenzen so herstellen, daß sowohl die Gesamtsequenz, als auch z. B. das erste Drittel der Sequenz einen 50%igen GC-Anteil haben. Diese Eigenschaft ist z. B. für das Funktionieren der Verkettung von Sequenzen, die pro Molekül für mehrere Hybridisierungsereignisse vorgesehen sind (wie z. B. die im Folgenden beschriebenen Algomere), eine unbedingte Voraussetzung. Nur so lassen sich z. B. Sequenzen so konstruieren, daß unterschiedliche Hybridisierungsereignisse pro Molekül gleichwahrscheinlich sind.
- i) Nur das NFR-Verfahren erlaubt die unmittelbare, automatische Herstellung von Monomersequenzen, z. B. duch einen Oligonukleotidsynthesizer.
Zur Herstellung von Monomersequenzen werden diese durch das NFR-Verfahren konstruiert
und synthetisiert. Zur Herstellung von n Monomersequenzen wird das NFR-Verfahren, wie im
Folgenden beschrieben, durchgeführt, wobei zur Beschreibung des Verfahrens folgende
Abkürzungen benutzt werden:
A: = Alphabet der Mächtigkeit a ∈ N;
Im Falle von DNA ist A: = {a, c, g, t} und a = 4.
Si: = Sequenz.
Folge von Elementen des Alphabets A, das einer Sequenz aus Monomeren entspricht.
Iseq: = Länge der pro Verfahrenszyklus zu konstruierenden Sequenzen.
Sseq: = Sequenz der Länge Iseq.
Sseq.k: = (k-1)-tes Monomer der Sequenz Sseq (k ∈ N k < = Iseq).
Ibas: = Länge der pro Verfahrenszyklus zur Konstruktion von Sequenzen verwendeten Basissequenzen.
Es gilt: 0 < Ibas < = Iseq.
Sbas: = Sequenz der Länge Ibas Basissequenz; Sequenzen der Länge Iseq werden aus Basissequenzen konstruiert.
Iov: = maximale Länge der Kette aufeinanderfolgender Monomere, die jeweils zwei durch das Verfahren erzeugte Sequenzen gemeinsam haben ("overlap").
Ibas - 1.
Iov/Iseq = Verhältnis von maximal erlaubter Sequenzwiederholung zu Sequenzgesamtlänge;
1. Maß für die Fehlhybridisierungswahrscheinlichkeit.
Ibas/Iseq = Verhältnis von Basissequenzlänge zu Sequenzgesamtlänge;
2. Maß für die Fehlhybridisierungswahrscheinlichkeit.
Mseq: = Menge von Sequenzen.
Mbas: = Menge aller Basissequenzen der Länge Ibas.
Mnobas: = Teilmenge der Menge von Basissequenzen der Länge Ibas, die durch Dekomposition aus Mseq erhalten würd.
|Mnobas|: = Mächtigkeit von Mnobas = Anzahl der Basissequenzen in Mnobas.
n: = Anzahl pro Verfahrenszyklus zu konstruierender Sequenzen.
ntot: = Anzahl insgesamt in allen Verfahrernszyklen hergestellter Sequenzen.
nmax: = maximale Anzahl pro Verfahrenszyklus konstruierbarer Sequenzen.
h: = Homologie. Ein Maß für die Übereinstimmung zwischen zwei Sequenzen.
Es gilt:0 < = h < = 1.
tm: = Schmelztemperatur. Für eine DNA-Sequenz wird die Schmelztemperatur nach dem Nearest Neighbour Verfahren (siehe Breslauer, K. J., Frank, R., Blocker, H., Marky, L. A., Proc. Natl. Acad. Sci., 83, 3746-3750, 1989) bestimmt:
tm = ΔH / (ΔS + R × In(C/4)) - 273,15°C
Dabei sind ΔH und ΔS Enthalpie und Entropie der DNA-Helix, R die molare Gaskonstante und C die Konzentraition der DNA-Sequenz.
A: = Alphabet der Mächtigkeit a ∈ N;
Im Falle von DNA ist A: = {a, c, g, t} und a = 4.
Si: = Sequenz.
Folge von Elementen des Alphabets A, das einer Sequenz aus Monomeren entspricht.
Iseq: = Länge der pro Verfahrenszyklus zu konstruierenden Sequenzen.
Sseq: = Sequenz der Länge Iseq.
Sseq.k: = (k-1)-tes Monomer der Sequenz Sseq (k ∈ N k < = Iseq).
Ibas: = Länge der pro Verfahrenszyklus zur Konstruktion von Sequenzen verwendeten Basissequenzen.
Es gilt: 0 < Ibas < = Iseq.
Sbas: = Sequenz der Länge Ibas Basissequenz; Sequenzen der Länge Iseq werden aus Basissequenzen konstruiert.
Iov: = maximale Länge der Kette aufeinanderfolgender Monomere, die jeweils zwei durch das Verfahren erzeugte Sequenzen gemeinsam haben ("overlap").
Ibas - 1.
Iov/Iseq = Verhältnis von maximal erlaubter Sequenzwiederholung zu Sequenzgesamtlänge;
1. Maß für die Fehlhybridisierungswahrscheinlichkeit.
Ibas/Iseq = Verhältnis von Basissequenzlänge zu Sequenzgesamtlänge;
2. Maß für die Fehlhybridisierungswahrscheinlichkeit.
Mseq: = Menge von Sequenzen.
Mbas: = Menge aller Basissequenzen der Länge Ibas.
Mnobas: = Teilmenge der Menge von Basissequenzen der Länge Ibas, die durch Dekomposition aus Mseq erhalten würd.
|Mnobas|: = Mächtigkeit von Mnobas = Anzahl der Basissequenzen in Mnobas.
n: = Anzahl pro Verfahrenszyklus zu konstruierender Sequenzen.
ntot: = Anzahl insgesamt in allen Verfahrernszyklen hergestellter Sequenzen.
nmax: = maximale Anzahl pro Verfahrenszyklus konstruierbarer Sequenzen.
h: = Homologie. Ein Maß für die Übereinstimmung zwischen zwei Sequenzen.
Es gilt:0 < = h < = 1.
tm: = Schmelztemperatur. Für eine DNA-Sequenz wird die Schmelztemperatur nach dem Nearest Neighbour Verfahren (siehe Breslauer, K. J., Frank, R., Blocker, H., Marky, L. A., Proc. Natl. Acad. Sci., 83, 3746-3750, 1989) bestimmt:
tm = ΔH / (ΔS + R × In(C/4)) - 273,15°C
Dabei sind ΔH und ΔS Enthalpie und Entropie der DNA-Helix, R die molare Gaskonstante und C die Konzentraition der DNA-Sequenz.
Das Herstellungverfahren erfolgt als ein Abfolge beliebig, jedoch endlich vieler
Verfahrensryklen, in denen ntot Sequenzen konstruiert werden, und einer nachfolgenden
Synthese, in der alle ntot Sequenzen in vitro erzeugt werden.
Die maximale Anzahl nmax der pro Verfahrenszyklus konstruierbaren Sequenzen errechnet
sich entsprechend den oben gegebenen Definitionen nach
nmax = (a, Ibas, Iseq): = ∟(½.((aIbas - (aIbas/2 - |Mnobas|))/(Iseq - Iov)┘.
D. h. es lassen sich maximal nmax Sequenzen der Länge Iseq aus Elementen eines Alphabetes
A der Größe a (im Falle von DNA ist a:- 4) konstruieren, die in maximal Iov
zusammenhängenden Ketten von Monomeren übereinstimmen. Die Anzahl der tatsächlich
pro Verfahrenszyklus erhaltenen Sequenzen kann geringer sein, wenn diese bestimmte
physikalische, chemische oder strukturelle Eigenschaften aufweisen sollen, oder wenn
zusätzlich zu bereits vorhandenen Sequenzen weitere Sequenzen hergestellt werden.
Im Einzelnen sind folgende Verfahrensschritte nötig:
- 1. Es werden ntot Sequenzen in z Verfahrenszyklen konstruiert und in einer Menge Mseq gesammelt. Man beginnt mit der leeren Sequenzmenge Mseq.
- 2. Zur Sequenzmenge Mseq können einmalig, vor Beginn des Verfahrenszyklus, beliebige, jedoch eindeutige, Sequenzen hinzugefügt werden. Dies kann nützlich sein, um bestimmte Sequenzen hinzuzufügen, die aus Gründen der weiteren Anwendung in der Menge der hergestellten Monomersequenzen enthalten sein sollen. Es empfiehlt sich dabei, nicht zu viele und nicht zu lange Sequenzen hinzuzufügen, da das Verfahren für diese Sequenzen nicht dieselben Eigenschatten garantiert wie für die im Folgenden konstruierten Sequenzen.
- 3. Beginn des Verfahrenszyklus: Es werden die strukturellen, chemischen und physikalischen Eigenschaften festgelegt, die die herzustellenden Sequenzen erfüllen müssen. Strukturelle Eigenschaften sind zumindest das Enthaltensein oder Nicht- Enthaltensein bestimmter Teilsequenzen (ggfs. auch die Positionen, an denen die Teilsequenzen in den zu erzeugenden Sequenzen enthalten oder nicht enthalten sein sollen) und das Verhältnis der Anzahl der verschiedenen Monomere zueinander (im Falle von DNA: Verhältnis GC/AT). Chemische Eigenschaften sind mindestens das Vorkommen bestimmter Teilsequenzen, die Einfluß auf die chemische Wechselwirkung mit eigenen oder anderen Substanzen haben (im Falle von DNA z. B. bestimmte Proteinbindungsstellen, Restriktionsschnittstellen wie z. B. 5'gatatc3' für EcoRV, die Stopcodons 5'tca3', 5'tta3', 5'cta3' usw.). Zu den festzulegenden physikalischen Eigenschaften zählt zumindest die Schmelztemperatur tm der herzustellenden Sequenzen.
- 4. Es werden jetzt die Anzahl der pro Zyklus gewünschten Sequenzen n < = nmax, nach obiger Formel Iseq der zu konstruierenden Sequenzen und Ibas der zur Konstruktion benötigten Basissequenzen festgelegt. Iseq und Ibas werden nach der oben angegebenen Formel so gewählt, daß die gewünschte Anzahl n zu konstruierender Sequenzen erreicht werden kann. Da Ibas/Iseq proportional zur Fehlhybridisierungswahrscheinlichkeit ist, werden Ibas und Iseq so gewählt, daß das Verhältnis Ibas/Iseq möglichst gering ist (Werte unter 0,3 sind empfehlenswert) und Werte für Iseq gute Hybridisierungsbedingungen garantieren. Für DNA sind temperaturabhängig beliebige Werte für Iseq < 0 möglich.
- 5. Es wird die Menge Mbas aller Sequenzen des Alphabetes A der Länge Ibas erzeugt. Die solcherart erzeugten Sequenzen werden als Basissequenzen bezeichnet. Es gibt dabei immer aIbas Basissequenzen. Diese Basissequenzen dienen der Konstruktion der herzustellenden Sequenzen. Jede Basissequenz bekommt einen Status "benutzt" oder "unbenutzt" zugewiesen. Es werden zunächst alle als unbenutzt markiert.
- 6. Selbst-komplementäre Basissequenzen aus Mbas werden nun als benutzt markiert. Dabei gibt es genau aIbas/2 zu sich selbst komplementäre Basissequenzen.
- 7. Sollten bereits Sequenzen in der Menge Mseq vorhanden sein, so können entweder dazu
kompatible neue Sequenzen konstruiert werden oder die Sequenzen einer Teilmenge
von Mseq kompatibel verlängert wenden. Dazu wird innerhalb eines
Dekompositionsverfahrens aus den bereits vorhandenen Sequenzen aus Mseq eine
Menge Mnobas aller Teilsequenzen der in Schritt 4 vorgegebenen Länge Ibas der
Sequenzen aus Mseq gebildet:
Setze Mnobas = {}.
Jede Sequenz Sseq aus Mseq wird nun in (Iseq - Iov) Dekompositionsschritten zerlegt:
Beginne mit i = 0 mit dem Dekompositionsschritt:
Solange i < (Iseq - Iov):
Bilde als neue Sequenz Sneu als Sequenz der Länge Ibas bestehend aus den Monomeren Sseg.i bis Sseq,i+Ibas: Sneu: = Sseq,i, . . ., Sseq.i+Ibas. Füge Sneu der Menge Mnobas hinzu.
Setze i: = i + 1. - 8. Die auf diese Weise erhaltene Menge Mnobas ist definitionsgemäß eine Teilmenge von Mbas.
- 9. Alle Basissequenzen der Menge Mbas, die auch in Mnobas vorkommen, werden als benutzt
markiert, so daß für die Konstruktion von Sequenzen genau (aIbas - aIbas/2 - |Mnobas|)
unbenutzte Basissequenzen übrig bleiben, aus denen nun maximal
verschiedene neue Sequenzen konstruiert werden können, die untereinander und zu den bereits vorhandenen Sequenzen keine Basissequenzen bzw. deren Komplemente gemeinsam haben. - 10. Aus den Basissequenzen wird ein gerichteter Graph konstruiert, dessen Knoten
bestimmte Basissequenzen repräsentieren: Der Graph enthält genau aIbas Knoten, von
denen bereits (aIbas/2 + |Mnobas|) Knoten als benutzt markiert sind. Jeder Knoten ist mit
einer Basissequenz Sb(i) assoziiert, die nicht zu sich selbst komplementär ist (im weiteren
wird es keine Unterscheidung von Knoten und assoziierter Basissequenz geben).
Es existiert eine Kante von Sb(i) nach Sb(k), wenn die Iov letzten Buchstaben von Sb(i) den
Iov ersten Buchstaben von Sb(k) entsprechen, wenn also gilt:
Sb(i),2, . . ., Sb(i),Ibas = Sb(k),1, . . ., Sb(k),Ibas-1. Der Knoten Sb~(k) wird Nachfolgeknoten von Sb(i) genannt. Der Knoten, der mit dem Komplement der Basissequenz assoziiert ist, die durch den Knoten Sb(i) kodiert wird, wird Komplementknoten zu Knoten Sb(i) genannt. Sequenzen der Länge Iseq werden gefunden, indem ein Pfad mit (Iseq - Iov) Knoten gesucht wird. Jeder Knoten darf maximal einmal benutzt werden. Außerdem darf für jeden Knoten, der in einem der Pfade liegt, der Komplementknoten in keinem Pfad vorkommen. Der Anfangsknoten des Pfades trägt wie die Sequenz einen Status "benutzt" bzw. "unbenutzt". - 11. Aus dem Graphen konstruiert man Sequenzen nach folgendem Verfahren:
Kennzeichne alle unbenutzten Knoten des Graphen als unbenutzte Anfangsknoten. Für jedes s zwischen 1 und n:
Solange Knoten Sb(k) existiert, der noch nicht als benutzter Anfangsknoten markiert ist:
Wähle einen unbenutzten Knoten Sb(k) aus.
Markiere Knoten Sb(k) als benutzten Anfangsknoten; außerdem:
Markiere Sequenz Sb(k) und sein Komplement als benutzt.
Nun wird eine neue Sequenz Sneu konstruiert, die neues Element für Mseq ist oder eine bestehenden Sequenz Ssub aus Mseq verlängert:
Setze Sneu,o: = Sb(k),1.
Falls sie als neue Sequenz konstruiert wird, setze i: = 0.
Falls sie als Verlängerung einer bereits bestehenden Sequenz Ssub konstruiert wird, setze i: = Isub.
Solange i < Iseq - (Iov-1) und i < = 0 gilt:
Existiert kein unbenutzter Nachfolgeknoten Sb(m) von Knoten Sb(k), so markiere Knoten Sb(k) und dessen Komplementknoten als unbenutzt und setze i: = i-1.
Sonst wähle per Zufall einen unbenutzten Nachfolgeknoten Sb(m) von Knoten Sb(k) aus und markiere bm und dessen Komplementknoten als benutzt. Setze zusätzlich: i: = i+1, k: = m, Sneu,i := Sb(m),1.
Wenn i = Iseq - (Iov-1) ist, ist die Sequenz Sneu fertig: sie besteht aus den Buchstaben Sneu,0 bis Sneu,(Iseq - Iov). - 12. Zu jeder der in Schritt 10 erhaltenen Sequenzen werden die jeweiligen strukturellen, chemischen und physikalischen Eigenschaften im Vergleich zu den in Schritt 3 festgelegten Bedingungen ermittelt. Genügt die jeweilige Sequenz nicht den vorgegebenen Bedingungen, so wird sie gelöscht und die von ihr benutzten Knoten und Komplementknoten wieder als unbenutzt markiert.
- 13. Wenn die Anzahl der konstruierten Sequenzen nicht ausreicht, kann der Verfahrenszyklus von Schritt 3 oder 4 an beliebig oft wiederholt werden. Insbesondere ist es möglich, die strukturellen, chemischen und physikalischen Kriterien und die Werte für n, Iseq, Ibas pro Verfahrenszyklus jeweils neu zu setzen. So ist es möglich, Sequenzen mit unterschiedlichen strukturellen, chemischen und physikalischen Eigenschaften, sowie unterschiedlicher Länge zu konstruieren, die trotzdem kompatibel, also eindeutig und maximal unähnlich sind. Ansonsten geht man zum nächsten Schritt, der in vitro Synthese.
- 14. Die konstruierten Sequenzen werden in vitro, im Falle von Nukleinsäuren vorzugsweise mittels eines Oligonukleotidsynthezisers (z. B. ABI 392, ABI 398, ABI 3948 von Perkin- Elmer Applied Biosystems), synthetisiert. Dazu werden die Sequenzdaten der Steuerungseinheit des Oligonukleotidsynthesizers übermittelt und die Sequenzen als einzelsträngige Nukleinsäuren hergestellt. Die Sequenzen können auch kommerziell bestellt werden. Zweckmäßig sind PAGE-gereinigte Oligonukleotide (z. B. von ARK Scientific GmbH Biosystems, 64293 Darmstadt, erhältlich).
Die Herstellung von Monomersequenzen zur Darstellung der Regelmenge von Grammatiken
in Schritt III des erfindungsgemäßen Verfahrens erfolgt mit Hilfe des NFR-Verfahrens
(Niehaus-Feldkamp-Rauhe-Verfahren) nach Schritt II des erfindungsgemäßen Verfahrens.
Zur Implementierung von Grammatiken werden nach dem NFR-Verfahren für r Regeln einer
Grammatik G genau 2r Monomersequenzen hergestellt, so daß die Monomersequenzen für
die s dargestellten Symbole (Terminale und Variaiblen) und die Regeln R der Grammatik G
eindeutig und. zueinander möglichst unähnlich sind, sowie die geforderten strukturellen,
chemischen und physikalischen Eigenschaften aufweisen.
Die Monomersequenzen werden dazu nach dem INFR-Verfahren so hergestellt, daß sie wie
im Folgenden beschrieben zu Algomeren zusammengesetzt werden können. Es werden dabei
jeweils 2 Monomersequenzen zu einem Algomer zusammengesetzt, das genau eine Regel R
einer Grammatik G repräsentiert. Dabei enthalten beide Monomersequenzen jeweils
Sequenzen, die die nach der Regel R erforderlichen zusammengehörenden Symbole
(Terminale oder Variablen) enthalten.
Der Entwurf der Oligomere nach Schritt III des erfindungsgemäßen Verfahrens ist abhängig
von der chemischen Natur der eingesetzten Monomere. Im bevorzugten Fall der aus
Nukleotiden aufgebauten Oligomere wird folgendermaßen vorgegangen:
Algomere sind doppelsträngig und haben einen 5"-Strang (Oberstrang) und einen 3'-Strang (Unterstrang). Oberstrang und Unterstrang können die Verknüpfung jeweils einer Terminal- und einer Variablensequenz sein.
Algomere sind doppelsträngig und haben einen 5"-Strang (Oberstrang) und einen 3'-Strang (Unterstrang). Oberstrang und Unterstrang können die Verknüpfung jeweils einer Terminal- und einer Variablensequenz sein.
Es seien X, Z beliebige Variablen, S eine Variable, die als Startsymbol fungiert, y, z beliebige
Terminalsymbole. Dann wird für jede Regel der Form:
- a) S: = yX ein Algomer konstruiert, das eine eindeutige doppelsträngige Kernsequenz y enthält, an die am 3'-Ende eine eindeutige einzelsträngige Überhangsequenz X angehängt ist; ": =" bedeutet in diesem Fall, daß S und yX identisch sind, d. h. yX als Startermolekül fungiert.
- b) X → yZ ein Algomer konstruiert, das eine eindeutige doppelsträngige Kernsequenz y enthält, an die am 5'-Ende eine eindeutige einzelsträngige Überhangsequenz X und am 3'-Ende eine eindeutige einzelsträngige Überhangsequenz Z angehängt ist. X kann dabei identisch mit Z sein.
- c) X → z ein Algomer konstruiert, das eine eindeutige doppelsträngige Kernsequenz z enthält, an die am 5'-Ende eine eindeutige einzelsträngige Überhangsequenz X angehängt ist.
Algomere der Form S: = yX und X → z heißen Terminaforen ("Start", "Ende"), da sie zum
Kettenabbruch während der Polymerisation im erfindungsgemäßen Verknüpfungsschritt V
führen, der im Folgenden beschrieben wird; Algomere der Form X → yZ heißen Elongatoren,
weil sie zu einer Kettenverlängerung während der Polymerisation im erfindungsgemäßen
Verknüpfungsschritt V führen.
Vorzugsweise umfassen die in den Schritten II und III des erfindungsgemäßen Verfahrens
hergestellten Monomersequenzen Nukleotide, insbesondere Ribonukleotide, besonders
bevorzugt Desoxyribonukleotide. Die in Schritt II des erfindungsgemäßen Verfahrens
konstruierten Monomersequenzen können vorteillhafterweise bestimmte Sequenzen, z. B.
Stopcodons, Erkennungssequenzen für Nukleinsäuren spaltende Enzyme
(Restriktionsnukleasen), Erkennungssequenzen für Nukleinsäure-bindende Proteine u. a.
enthalten, wie sie beispielsweise in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular
Cloning, A Laboratory Manual, (1989)], [Rolf Knippers, Molekulare Genetik, Georg Thieme
Verlag, (1997)] und [Benjamin Lewin, Genes V, Oxford University Press, (1994)] beschrieben
werden.
Das Assemblieren der in Schritt III synthetisierten Sequenzen erfolgt in Schritt IV des
erfindungsgemäßen Verfahrens. Im Rahmen der vorliegenden Erfindung sind zur
Durchführung des Schrittes IV alle dem Fachmann bekannten Techniken,
Oligomersequenzen zusammenzusetzen, einsetzbar. Im erfindungsgemäß bevorzugten Fall
des Einsatzes von Nukleotidsequenzen ist es zweckmäßig folgendermaßen vorzugehen:
- a) Die zu Elongatoren gehörenden einzelsträngigen Sequenzen werden phosphoryliert. Dazu
sind verschiedene dem Fachmann bekannte Protokolle möglich, z. B. das Folgende:
In einem 20 µl Ansatz werden 16 µl einer synthetisierten 100 µM Sequenz, 2 µl Ligationspuffer (z. B. 50 mM Tris-HCl pH 7.5, 10 mM MgCl2, 10 mM Dithiothreitol, 1 mM ATP, 25 µg/ml BSA Bovine Serum Albumin, New England Biolabs) und 2 µ1 PNK (Polynukleotidkinase, z. B. von New England Biolabs, Katalognr. #201 S oder #201 L) 1 Stunde bei 37°C inkubiert. Volumina, Inkubationszeit und -temperatur können in dem Fachmann bekannter Weise variiert werden. - b) Jeweils in einem Ansatz werden die zu einem Algomer gehörenden Einzelstränge (Ober-
und Unterstrang) zu einem fertigen Algomer hybridisiert. Für Elongatoren können einfach die
Phosphorylierungsansätze von Ober- und Unilerstrang verwendet werden. Für die
Hybridisierung sind mehrere Protokolle möglich; bevorzugt ist ein Denaturierungsschrift bei
etwa 95°C zu Anfang (dieser deaktiviert gleiclhzeitig die PNK in den Ansätzen der
Elongatoren) und eine langsame Hybridisierung. Z. B. kann für Oligomere der Länge 30
folgendes Protokoll verwendet werden, das gemäß den Kenntnissen des Fachmanns variiert
werden kann:
In einem 40 µl Ansatz werden jeweils 20 µl des Oberstranges (100 µM) und 20 µl des Unterstranges (100 µM) in einem Thermozykler 5 Minuten auf 95°C erhitzt, 5 Minuten auf 72°C inkubiert und dann 25 Minuten jeweils 1°C pro Minute abgekühlt.
In Schritt V des erfindungsgemäßen Verfahrens werden die Algomere zu längerkettigen,
informationstragenden Polymeren (Logomeren) verknüpft. Da Algomere die Regelmenge R
einer Grammatik G darstellen, entsprechen alle dabei erzeugten Logomere Wörtern der
Sprache L(G), die durch die Grammatik G beschrieben wird.
Der geregelte Prozeß der Verkettung von Algomeren zu Logomeren wird als
"Symbolpolymerisation" bezeichnet, im Falle, daß die Terminalsymbole Bits repräsentieren,
das heißt, im Falle, daß gilt:
Σ: = {0, 1, s0, s1, s2, . . .,sn-1, sn, e0, e1, e2, . . .,em-1, em} mit n,m ∈ e N und n, m < 0
wird der Prozeß als "Bitpolymerisation" bezeichnet.
Im Rahmen der vorliegenden Erfindung sind zur Durchführung des Schrittes V alle dem
Fachmann bekannten Techniken, Oligomere zu Polymeren zu verknüpfen, einsetzbar. Im
erfindungsgemäß bevorzugten Fall des Einsatzes von Oligonukleotiden ist es zweckmäßig,
die zu verknüpfenden Algomere in Gegenwart von Ligase zu inkubieren. Beispielsweise kann
nach folgendem Protokoll vorgegangen werden, das gemäß den Kenntnissen des Fachmanns
variiert werden kann:
In einem 27 µl Ansatz werden 1 µl 50 µM "Start"-Algomer, 1 µl 50 µM "Ende"-Algomer und 2× jeweils 10 µl 40 µM Elongator-Algomere (aus Schritt IV des erfindungsgemäßen Verfahrens erhalten), 1,5 µl 10 mM rATP und 3,5 µl T4 DNA Ligase mit 400 NEB Units/µl (z. B. Katalognr. #202S und #202L NEB) zwischen 4°C und 25°C für 2 bis 24 Stunden inkubiert. Andere Reaktionsvolumina funktionieren analog. Inkubationszeit und -temperatur können in dem Fachmann bekannter Weise variiert werden.
In einem 27 µl Ansatz werden 1 µl 50 µM "Start"-Algomer, 1 µl 50 µM "Ende"-Algomer und 2× jeweils 10 µl 40 µM Elongator-Algomere (aus Schritt IV des erfindungsgemäßen Verfahrens erhalten), 1,5 µl 10 mM rATP und 3,5 µl T4 DNA Ligase mit 400 NEB Units/µl (z. B. Katalognr. #202S und #202L NEB) zwischen 4°C und 25°C für 2 bis 24 Stunden inkubiert. Andere Reaktionsvolumina funktionieren analog. Inkubationszeit und -temperatur können in dem Fachmann bekannter Weise variiert werden.
Abb. 3 zeigt das Resultat einer solchen Symbolpolymerisation.
Es können dabei grundsätzlich beliebig viele Algomere, die keine Terminatoren sind,
verknüpft werden. Der Polymerisationsvorgang kommt für jedes einzelne Logomer dann zu
einem Stillstand, wenn das entsprechende Molekül an seinen Enden jeweils ein Algomer trägt,
das als Terminatormolekül ("Start", "Ende") fungiert.
Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Isolierung und
Vervielfältigung von informationstragenden Polymeren, die nach einem der vorhergehenden
Ansprüche erhalten wurden, das dadurch gekennzeichnet ist, daß man in Schritt V erhaltene
informationstragende Polymere in Klonierungsvektoren ligiert, kompetente Zellen mit diesen
Vektoren transformiert und die erfolgreich transformierten Bakterien anhand von
Selektionsmarkern selektioniert.
Die aus Schritt V des oben beschriebenen erfindungsgemäßen Verfahrens
(Symbolpolymerisation) erhaltenen Logomere können zum Zwecke der Vereinzelung und
Vervielfältigung kloniert werden.
Dazu wird der verwendete Klonierungsvektor mit Restriktionsenzymen aufgeschnitten und ein
Logomer hineinligiert. Das Verfahren stellt sicher, daß nur fertig polymerisierte (mit
Terminatoren versehene) Logomere mit dem Zielvektor ligiert werden können. Korrekt in den
Zielvektor ligierte Logomere bilden ein wieder ringförmiges Molekül. Die Vereinzelung von
Logomeren erfolgt durch die Transformation von Bakterien mit dem Molekülgemisch, das das
Resultat der Ligation ist. Die Vektoren tragen Selektionsmarker (vorzugsweise Antibiotika-
Resistenz z. B. Ampicillin-Resistenz), mit denen erfolgreich transformierte Bakterien
ausgewählt werden können. Da jedes Bakterium nur ein Plasmid exprimiert, ist jedes
erfolgreich transformierte Bakterium Träger genau eines Logomers. Solcherart klonierte
Logomere können dann zur weiteren Verwendung einfach und in großen Mengen (auf Fest-
oder in Flüssigmedium, Fermentern) vervielfältigt werden.
Die aus Schritt V des erfindungsgemäßen Verfalhrens erhaltenen Logomere werden zum
Zwecke der Vereinzelung und Vervielfältigung in einem beliebigen Klonierungsvektor
(Plasmid) kloniert, der Restriktionsschnittstellen trägt, die zu den Sequenzüberhängen der
Terminatoren der Logomere kompatibel sind (z. B. HindIII, BamHI Erkennungssequenzen im
Klonierungsvektor pBluescript II KS +/-, Stratagene, Katalog Nr. #212207). Die Klonierung
erfolgt nach üblichen Laborprotokollen, wie z. B. in [J. Sambrook, E. F. Fritsch, T. Maniatis,
Molecular Cloning, A Laboratory Manual, (1989)] beschrieben. Z. B. kann folgendes Protokoll
verwendet werden, das gemäß den Kenntnissen des Fachmanns variiert werden kann:
Zur Klonierung können beliebige Klonierungsvektoren verwendet werden, wie sie für
molekularbiologische Verfahren üblich sind. (Geeignet ist z. B. das Plasmid pBluescript II KS
+/-, Stratagene, Katalog Nr. #212207). Das Plasmid wird einem Restriktionsverdau mit zwei
Restriktionsenzymen unterworfen, die Überhänge erzeugen, die zu den Terminatoren der
Logomere kompatibel sind. Als Restriktionsenzyme können z. B. BamHI und HindIII (z. B. von
NEB, New England Biolabs, Katalog Nr.: #136S und #104S) verwendet werden. Dazu kann
ein übliches Restriktionsprotokoll verwendet werden, das gemäß den Kenntnissen des
Fachmanns variiert werden kann, z. B. das Folgende:
In einem 50 µl Ansatz werden 30 µl Plasmid (0,7 µg/µl), 5 µl 10× Puffer (z. B. NEB2, New England Biolabs), 5 µl BamHI (100 units), 5 µl HindIII (100 units) und Spl BSA 10× für 1-2 Stunden bei 37°C inkubiert. Zur Kontrolle wird 1 µl des Ansatzes, sowie eine entsprechende Menge ungeschnittenes Plasmid auf einem 1% Agarose Gel (z. B. UItraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-027) elektrophoretisch aufgetrennt. Zur Präparation der DNA wird der Restriktionsansatz phenolisiert, die DNA gefällt und wiederaufgenommen:
In einem 50 µl Ansatz werden 30 µl Plasmid (0,7 µg/µl), 5 µl 10× Puffer (z. B. NEB2, New England Biolabs), 5 µl BamHI (100 units), 5 µl HindIII (100 units) und Spl BSA 10× für 1-2 Stunden bei 37°C inkubiert. Zur Kontrolle wird 1 µl des Ansatzes, sowie eine entsprechende Menge ungeschnittenes Plasmid auf einem 1% Agarose Gel (z. B. UItraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-027) elektrophoretisch aufgetrennt. Zur Präparation der DNA wird der Restriktionsansatz phenolisiert, die DNA gefällt und wiederaufgenommen:
- - Ansatz auf 200 µl mit Aqua dest. auffüllen
- - 200 µl Phenol zugeben, vortexen, bei 10000 g 3 Minuten zentrifugieren
- - Überstand aufnehmen und 200 µl Chloroform zugeben, vortexen, bei 10000 g 3 Minuten zentrifugieren
- - Überstand aufnehmen, mit 1/10 Vol. 3M NaAc ansäuern und mit 2,5× Volumen 100% EtOH versetzen, vortexen, für mindestens 15 Minuten auf -70°C
- - mindestens 15 Minuten auf 10000 g zentrifugieren, Überstand abnehmen und verwerfen
- - mit ca. 500 µl 70% EtOH waschen, für 5-10 Minuten auf 10000 g zentrifugieren, Überstand abnehmen und verwerfen
- - Pellet trocknen und in Aqua dest. wiederaufnehmen, so daß das geschnittene Plasmid mit 100 ng/µl bis 1 µg/µl vorliegt (höhere Konzentrationen sind auch möglich). Plasmid kann für weitere Ligationen nötigenfalls verdünnt werden.
Die in Schritt V des erfindungsgemäßen Verfahrens erhaltenen Logomere und die
präparierten Klonierungsvektoren werden ligiert. Durch die Art und Weise der Präparation ist
gewährleistet, daß möglichst nur die gewünschten Ligationen stattfinden: Die Terminatoren
der Logomere tragen zwei verschiedene Überhangsequenzen, die zu den durch Restriktion
entstandenen Überhangsequenzen des Klonierungsvektors kompatibel sind. Dadurch können
die Logomere nur in einer definierten Richtung in clen Klonierungsvektor ligieren. Außerdem
sind die Terminatoren der Logomere nicht phosphoryliert, weshalb Logomere ausschließlich
mit den Überhangsequenzen des Klonierungsvektors ligieren können. Die Ligation erfolgt
nach einem üblichen Ligationsprotokoll wie z. B. in [J. Sambrook, E. F. Fritsch, T. Maniatis,
Molecular Cloning, A Laboratory Manual, (1989)] beschrieben, das gemäß den Kenntnissen
des Fachmanns variiert werden kann, beispielsweise wie folgt:
Das molare Verhältnis Logomere/Klonierungsvektor kann z. B. 500 betragen, in 10 µl Gesamtvolumen werden:
Das molare Verhältnis Logomere/Klonierungsvektor kann z. B. 500 betragen, in 10 µl Gesamtvolumen werden:
1 µl Plasmid (10 ng/µl = 5 nM)
0,5 µl 4 µM Logomere aus Schritt V des erfindungsgemäßen Verfahrens
1 µl 10× Ligationspuffer
0,5 µl T4 DNA Ligase (400 u/µl)
7 µl H2O
0,5 µl 4 µM Logomere aus Schritt V des erfindungsgemäßen Verfahrens
1 µl 10× Ligationspuffer
0,5 µl T4 DNA Ligase (400 u/µl)
7 µl H2O
für 12 Stunden auf 16°C ligiert.
Das Protokoll kann gemäß den Kenntnissen des Fachmanns variiert werden. Z. B. ist es
möglich, ein Protokoll zur TCL (Temperature Cycle Ligation, [Lund, A. H., Duch, M., Pedersen,
F. S. Increased cloning efficency by temperature-cycle ligation, Nucleic Acids Research, 24:
(4), 800-801, (1996)]) zu verwenden.
Der erhaltene Ligationsansatz wird nun für die Transformation kompetenter Zellen verwendet,
wie nachfolgend beispielhaft gezeigt:
Die Transformation von Bakterien (kompetente Zelllen, Hoststamm z. B. dH5α, GIBCO BRL,
Katalog Nr.: 18258-012) mit dem Ligationsansatz aus b) erfolgt nach einem der üblichen
Protokolle, wie z. B. in [J. Sambrook, E. F, Fritsch, T. Maniatis, Molecular Cloning, A
Laboratory Manual, (1989)] beschrieben wird und das gemäß den Kenntnissen des
Fachmanns variiert werden kann, z. B. wie folgt:
- - 200 µl kompetenter Zellen (∿ 5×107 CFU = Colony Forming Units, bei -70°C gelagert) werden aufgetaut und auf Eis gestellt
- - Etwa 1 ng des Ligationsansatzes aus b) wird dazu pipettiert und 20-30 Minuten auf Eis stehen gelassen, alle 5 Minuten vorsichtig mixen
- - Hitzeschock: Ansatz 2 Minuten auf 42°C, zurück auf Eis
- - 0,8 ml LB-Medium (+ 0,02 M MgSO4 + 0,01 M KCl) zugeben
- - Ansatz 20-60 Minuten im Reagenzglas auf 37°C rollen
- - 0,1-1 ml auf Agarplatte (mit Antibiotikum, z. B. Ampicillin) ausplattieren und über Nacht auf 37°C
Die Transformation fungiert dabei als Selektionsverfahren auf erfolgreich klonierte Logomere
und als Isolationsverfahren einzelner Logomere, weil jede Bakterienzelle genau ein Plasmid
exprimiert.
Außer dem genannten Verfahren der Klonierung, das erfindungsgemäß bevorzugt ist, können
die in Schritt V des erfindungsgemäßen Verfahrens erhaltenen informationstragenden
Polymere (Logomere) mit folgenden Verfahren isoliert und vervielfältigt werden:
Hierbei wird das aus einer Symbolpolymerisation erhaltene Molekülgemisch über ein
Trägermaterial gegeben, an das Oligomere ("Ankersequenzen") gebunden sind, die ihrerseits
an die Terminatoren der Logomere binden können. Die gebundenen Logomere werden dann
einzeln aufgenommen und können nach Bedarf vervielfältigt werden.
Es sind hierzu verschiedene Verfahren einsetzbar:
- a) Affinitätschromatographie; dabei werden Ankersequenzen, die zu den überhängenden Enden der Terminatoren kompatible Enden besitzen, z. B. an eine Hydroxylapatit-Säule gebunden. Die aus Schritt V des erfindungsgemäßen Verfahrens erhaltenen Logomere werden über die Säule gegeben, wodurch die Logomere durch Hybridisierung an die Ankersequenzen binden können. Die solcherart gebundenen Logomere werden dann einzeln aufgenommen.
- b) Ankersequenzen werden an eine Membran (z. B. Gene Screen Plus, DuPont, Biotechnology Systems; Hybond-N, Amersharn Life Sciences) kovalent gebunden. Die Membran ist gerastert, d. h. in einzelne Felder unterteilt. Pro Feld wird genau eine Ankersequenz kovalent an die Membran gebunden. Danach werden die aus Schritt V des erfindungsgemäßen Verfahrens erhaltenen Logomere über die Membran gegeben und mit den Ankersequenzen hybridisiert. Die Membran wird daraufhin in die einzelnen Felder des Rasters zerschnitten. Die einzelnen Felder, die nun maximal ein an die jeweilige Ankersequenz gebundenes Logomer enthalten, können jetzt in separate Gefäße (z. B. Eppendorf Tubes) überführt werden. Sodann Ikönnen die Logomere durch Denaturieren von der Membran getrennt werden. Beim Denaturieren ist zu beachten, daß die Denaturierungstemperatur so gewählt ist, daß sie hoch genug ist, um Logomer und Ankersequenz zu trennen, jedoch nicht so hoch, daß das Logomer selbst vollständig aufschmilzt.
Bei der Isolation durch Verdünnung werden die Logomere, die als Gemisch aus einer
Symbolpolymerisation erhalten werden, soweit verdünnt, daß in einem jeweiligen Zielvolumen
statistisch genau ein Molekül enthalten ist. Dieses kann dann mit Hilfe der PCR aufgespürt
und vervielfältigt werden. Die Verdünnung des Ausgangsvolumens in Zielvolumina kann dabei
gleichzeitig geschehen, so daß ein Ausgangsvolumen auf n Zielvolumina verdünnt wird.
Dazu wird erfindungsgemäß wie folgt vorgegangen:
Zu einem, aus Schritt V des erfindungsgemäßen Verfahrens erhaltenen, Gemisch von Logomeren in einem Ausgangsvolumen Va wird ein Verdünnungsfaktor ermittelt, der n in Va enthaltene Logomere so auf n Zielvolumina Vz verdünnt, daß in jedem Zielvolumen Vz statistisch genau ein Logomer enthalten ist. Um den Verdünnungsfaktor zu ermitteln wird ein Aliquot des Ausgangsvolumens (z. B. 1 µl) in einer Verdünnungsreihe austitriert. Von jeder Verdünnung der Reihe wird dann ein Aliquot (z. B. 1 µl) als Template einer PCR-Reaktion verwendet, um zu ermitteln, in welchen Verdünnungen noch Logomere detektierbar sind. Erhält man solcherart die letzte Verdünnung, die noch Logomere enthält, und die Verdünnung, die schon keine mehr enthält, läßt sich ein ungefährer Verdünnungsfaktor angeben, der gerade noch ungefähr ein Logomer enthält. Gegebenenfalls kann dieser Verdünnungsfaktor durch Austitrieren der letzten Verdünnung, die noch Logomere enthält, genauer bestimmt werden. Dabei verwendet man entsprechend kleinere Verdünnungsschritte (verdünnt man z. B. in der ersten Verdünnungsreihe immer 1 : 10, so kann man in der 2. Verdünnungsreihe z. B. 1 : 2 verdünnen; das Verfahren der genaueren Bestimmung des Verdünnungsfaktors kann dabei prinzipiell mit beliebiger Genauigkeit angewendet werden).
Zu einem, aus Schritt V des erfindungsgemäßen Verfahrens erhaltenen, Gemisch von Logomeren in einem Ausgangsvolumen Va wird ein Verdünnungsfaktor ermittelt, der n in Va enthaltene Logomere so auf n Zielvolumina Vz verdünnt, daß in jedem Zielvolumen Vz statistisch genau ein Logomer enthalten ist. Um den Verdünnungsfaktor zu ermitteln wird ein Aliquot des Ausgangsvolumens (z. B. 1 µl) in einer Verdünnungsreihe austitriert. Von jeder Verdünnung der Reihe wird dann ein Aliquot (z. B. 1 µl) als Template einer PCR-Reaktion verwendet, um zu ermitteln, in welchen Verdünnungen noch Logomere detektierbar sind. Erhält man solcherart die letzte Verdünnung, die noch Logomere enthält, und die Verdünnung, die schon keine mehr enthält, läßt sich ein ungefährer Verdünnungsfaktor angeben, der gerade noch ungefähr ein Logomer enthält. Gegebenenfalls kann dieser Verdünnungsfaktor durch Austitrieren der letzten Verdünnung, die noch Logomere enthält, genauer bestimmt werden. Dabei verwendet man entsprechend kleinere Verdünnungsschritte (verdünnt man z. B. in der ersten Verdünnungsreihe immer 1 : 10, so kann man in der 2. Verdünnungsreihe z. B. 1 : 2 verdünnen; das Verfahren der genaueren Bestimmung des Verdünnungsfaktors kann dabei prinzipiell mit beliebiger Genauigkeit angewendet werden).
Da die PCR der Verdünnungen dazu dient, festzustellen, ob sich überhaupt noch Logomere in
der Verdünnung befinden, kann die PCR auf mindestens zweierlei Weise durchgeführt
werden:
- a) Als Primer dienen zwei gegenläufige, in den Terminatoren primende Primer, z. B. der 5'- Strang des Start-Terminators und der 3-Strancfdes Ende-Terminators. Ansonsten sind die PCR-Bedingungen wie weiter unten unter Vervielfältigung von Logomeren durch PCR beschrieben.
- b) Die PCR wird wie die zum Auslesen der Logomere durchgeführt, es reicht jedoch ein Ansatz mit einem Paar von Primern wie unter Auslesen von Logomeren mittels PCR im Folgenden beschrieben.
Zur Kontrolle werden die durch PCR erhaltenen DNA Fragmente durch Gelelektrophorese
sichtbar gemacht. Dazu wird z. B. ein 2-4%iges Agarose-Gel (z. B. UltraPure™ von Gibco BRL,
Life Technologies, Katalog Nr.: 15510-027) und als Molekulargewichtsstandard z. B. eine
50 bp-Leiter (Gibco BRL, Life Technologies, Katalog INr. 10416-014) verwendet. Das erhaltene
Gel wird 5 Minuten in 0,001% Ethidiumbromid gefärbt und unter UV sichtbar gemacht.
Die aus einer Symbolpolymerisation erhaltenen Logomere können - je nach ihrer
beabsichtigten Verwendung - vervielfältigt werden. Dies ist beispielsweise für die
Visualisierung der gespeicherten Information oder die Weiterverwendung der Logomere als
Marker zur Kennzeichnung von Stoffen und Gegenständen nötig.
Bei diesem Verfahren werden Logomere durch FCR vervielfältigt. Das zu vervielfältigende
Logomer dient als Template, die benötigten Primer primen jeweils gegenläufig in den
Terminatoren (entweder 5'-Start und 3'-Ende, oder 5'-Ende und 3-Start), so daß das Logomer
vollständig vervielfältigt wird. Alternativ können die Primer, sofern das zu vervielfältigende
Logomer von weiterer DNA umgeben ist, auch weiter außerhalb des Logomers primen.
Für die PCR-Ansätze, die in dem Fachmann bekannter Weise variiert werden können,
werden z. B. folgende Reagentien und Bedingungen verwendet:
dNTPs (z. B. Pharmacia Biotech, Katalog Nr.: 27-2035-01/2/3), Taq-Polymerase (z. B. Gibco- BRL, Katalog Nr.: 18038-034, 18038-042, 18038-067), PCR-Puffer, MgCl2 (z. B. GIBCO- BRL, Katalog Nr.: 18067-017)
dNTPs (z. B. Pharmacia Biotech, Katalog Nr.: 27-2035-01/2/3), Taq-Polymerase (z. B. Gibco- BRL, Katalog Nr.: 18038-034, 18038-042, 18038-067), PCR-Puffer, MgCl2 (z. B. GIBCO- BRL, Katalog Nr.: 18067-017)
Als PCR-Programm kann beispielsweise folgendes Protokoll (Primer: 30-mere) verwendet
werden:
Ein weiterer Gegenstand der Erfindung sind informationstragende Polymere, die gemäß den
oben beschriebenen erfindungsgemäßen Verfahren erhältlich sind.
Fertige Logomere können entweder mittels PCR (Polymerase Chain Reaction =
Polymerasekettenreaktion), was erfindungsgemäß bevorzugt ist, oder mittels
Restriktionsverdau gelesen werden. Dabei hat die PCR-Methode den Vorzug, bereits
geringste Mengen DNA solcherart vervielfältigen zu können, daß die Logomere direkt nach
der PCR und einer Gel-Auftrennung gelesen werden können. Im Falle von binären Logomeren
kann das durch die PCR-Methode auf einem Gel erhaltene Bandenmuster unmittelbar als
Binärcode gelesen werden.
Ein weiterer Gegenstand der Erfindung ist daher ein Verfahren zum Auslesen von Information
aus informationstragenden Polymeren, die wie oben beschrieben erhalten und/oder isoliert
und vervielfältigt wurden, dadurch gekennzeichnet, daß man
- a) n das informationstragende Polymer enthaltende Lösungen mit jeweils einem Paar gegenläufiger Primer versetzt, wobei n für die Zahl der als Elongatoren in dem Polymer enthaltenen Oligomere steht;
- b) mindestens n-1 PCR-Ansätze durchführt, wobei n für die Zahl der als Elongatoren in dem Polymer enthaltenen Oligomere steht Lind jeweils ein Primer eines jeden Paares in dem dem Elongator gegenüberliegenden Terminator primt und der andere Primer in dem Elongator selbst primt;
- c) die aus der PCR erhaltenen Polymer-Fragmente nach ihrer Länge durch Elektrophorese auftrennt und d) das aus der Elektrophorese erhaltene Muster optisch ausliest.
Das Verfahren kann auch unter Verwendung verschiedenfarbiger fluoreszenzmarkierter
Primer oder Nukleotide durchgeführt werden. Dadurch wird es möglich, mehrere Ansätze
verschiedenfarbig zu markieren und mehrere Ansätze in einer Spur gelelektrophoretisch zu
lesen. Überdies kann der Ausleseprozeß dadurch mit modernen Sequenziermaschinen (z. B.
von ABI erhältlich) automatisiert werden.
Um die in Logomeren enthaltenen Informationen sichtbar zu machen, können die Logomere
mithilfe der PCR ausgelesen werden.
Die Methode des Auslesens binärer Muster mit PCR wurde als DNA Typing bereits von
[Jeffreys, Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-
209, (1991)] beschrieben. Die dort beschriebene Methode wird hier in einer abgewandelten
Form als Auslese-PCR zum Auslesen der Logomere benutzt. Unterschiede zu der in [Jeffreys,
Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-209, (1991)]
beschriebenen Methode bestehen darin, daß hier synthetisch erzeugte Templates verwendet
werden, die nicht notwendig binäre Muster enthallen. Außerdem werden PCR- und Gel-
Elektrophorese-Bedingungen so gewählt, daß das Ergebnis direkt vom Gel gelesen werden
kann, ohne daß die als Bandenmuster erhaltenen Signale zusätzlich durch Blotting verstärkt
werden müssen.
Für das Auslesen eines Logomers werden für n Elongatoren der zugrundeliegenden
Grammatik mindestens n-1, meistens aber n PCR-Ansätze gebraucht. Jeder PCR-Ansatz
enthält das zu lesende Logomer als Template und außerdem ein Paar gegenläufiger Primer,
von denen einer im Elongator, der andere im, dem Elongator gegenüberliegenden, Terminator
primt (z. B. 5'-"Start" und 3'-0, siehe Abb. 5). Für die PCR kann jeder handelsübliche
Thermozykler (z. B. PTC-100, MJ Research) verwendet werden. Als zweckmäßig für die
Länge der Primer haben sich 20-30 bp erwiesen, jedoch sind auch andere Längen
verwendbar. Je nach Primerlänge muß die Annealing-Temperatur entsprechend gewählt
werden (kann z. B. mithilfe des Programmes Oligo 5.0 bestimmt werden). Zweckmäßige
Annealingtemperaturen sind für 20-mere ca. 55°C, für 30-mere etwa 65°C bis 74°C.
Für die PCR-Ansätze werden z. B. folgende Reagentien und Protokolle verwendet, die in dem
Fachmann bekannter Weise variiert werden können:
dNTPs (Pharmacia Biotech, Katalog Nr.: 27-2035-01/213), Taq-Polymerase (Gibco-BRL, Katalog Nr.: 18038-034, 18038-042, 18038-067), PCR-Puffer, MgCl2 (GIBCO-BRL, Katalog Nr.: 18067-017)
dNTPs (Pharmacia Biotech, Katalog Nr.: 27-2035-01/213), Taq-Polymerase (Gibco-BRL, Katalog Nr.: 18038-034, 18038-042, 18038-067), PCR-Puffer, MgCl2 (GIBCO-BRL, Katalog Nr.: 18067-017)
Um genügend DNA zu erhalten, so daß das erhaltene Bandenmuster nach der
Gelelektrophorese direkt vom Gel gelesen werden kann, kann jeder PCR-Ansatz m mal
angesetzt werden. Z. B. kann m = 4 sein.
Als PCR-Programm kann folgendes Protokoll (Primer: 30-mere) verwendet werden:
Nach durchgeführter PCR ist es für die Lesbarkeit der Bandenmuster der nachfolgenden
Gelelektrophorese evtl. zweckmäßig, möglichst viel amplifizierte DNA in möglichst geringem
Volumen zu halten, das dann auf ein Gel geladen werden kann. Dazu können die Volumina
auf geeignete Weise (z. B. mit einer SpeedVac, z. B. SpeedVac Concentrator, Savant)
eingeengt werden.
Die für jeden Elongator aus der PCR erhaltenen DNA Fragmente haben verschiedene Länge.
Werden sie durch Elektrophorese aufgetrennt, so ergeben die unterschiedlichen
Längenfragmente ein spezifisches Muster, anhand dessen sich das zu lesende Logomer
identifizieren läßt (siehe Abb. 5 und Abb. 6). Für die Gelelektrophorese kann ein
4% Agarose-Gel (z. B. UltraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-
027), als Molekulargewichtsstandard z. B. eine 50 bp-Leiter (Gibco BRL, Life Technologies,
Katalog Nr.: 10416-014) verwendet werden. Die Auftrennung der DNA erfolgt in einer
Gelkammer in geeigneter Weise, z. B. 1 : 45 Stunden bei 60 V. Hier sind die Parameter jedoch
relativ frei wählbar, insbesondere kann die Gel-Laufzeit weiter verkürzt werden.
Das erhaltene Gel wird 5 Minuten in 0,001% Ethidliumbromid gefärbt und unter UV sichtbar
gemacht.
Ein Beispiel für ein solcherart erhaltenes Gel findet sich exemplarisch unter Abb. 6.
Logomere können durch Restriktionsverdau ausgelesen werden. Dazu müssen die
Elongatoren so konstruiert sein, daß sie asymmetrisch versetzte Restriktionsschnittstellen
tragen. Jeder Elongator trägt dabei eine spezifische Restriktionsschnittstelle. Beispielsweise
kann das Restriktionsenrym EcoRV (z. B. NEB, Katalog Nr. #195S) für 0-Elongatoren und
Smal (z. B. NEB, Katalog Nr. #141S) für 1-Elongatoren verwendet werden.
Zum Lesen wird das zu lesende Logomer in verschiedenen Restriktionsansätzen geschnitten.
Dazu wird pro Elongator ein Restriktionsansatz mit dem jeweiligen Restriktionsenzym gebildet.
Die aus der Restriktion erhaltenen DNA Fragmente sind von verschiedener Länge. Werden
sie durch Elektrophorese aufgetrennt, so ergeben clie unterschiedlichen Längenfragmente ein
spezifisches Muster, anhand dessen sich das zu lesende Logomer identifizieren läßt.
Das folgende Beispiel zeigt die DNA-Fragmentlängen aller binären Logomere mit 4 Bit ohne
Terminatoren mit Elongatorlänge = 30 bp; Restriktionsschnittstelle pro Elongator nach 10 bp.
Im obigen Beispiel (4 Bits) erkennt man, daß die Längenmuster der Zahlen 0010 und 0100 bei
Restriktion des 0-Bits nicht eindeutig ist. 0010 und 0100 lassen sich jedoch anhand der
Längenmuster bei Restriktion des 1-Bits unterscheiden.
Im Einzelnen wurde zur Durchführung des obigen Beispiels folgendermaßen vorgegangen,
wobei sich die Protokolle gemäß den Kenntnissen des Fachmanns variieren lassen:
Eine z. B. durch Vereinzelung und Vervielfältigung von Logomeren durch Klonierung erhaltene
Bakterienkolonie wird zum Animpfen von 2-5 ml einer 37°C Übernachtkultur verwendet (z. B.
LB-Medium mit 10 µg/l Ampicillin wie in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular
Cloning, A Laboratory Manual, (1989)] beschrieben). Als Klonierungsvektor können hier z. B.
pGEM-T Easy (Promega, Katalog Nr. A1360) und binäre Logomere auch ohne Terminatoren
verwendet werden. Aus der Übernachtkultur wird die das Logomer enthaltende Plasmid-DNA
isoliert (z. B. mithilfe des Qiagen Plasmid Miniprep Kit, Qiagen, Katalog Nr. 12123, oder durch
alkalische Lyse wie in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A
Laboratory Manual, (1989)] beschrieben).
Die aus a) erhaltene Plasmid DNA wird für n Elongatoren in n Restriktionsansätzen
geschnitten. Jeder Restriktionsansatz enthält ein Restriktionsenzym, das in einem
spezifischen Elongator schneidet und ein Restriktlionsenzym, das das Logomer aus der
Klonierungssite ausschneidet. Im verwendeten Beispiel wurden folgende Ansätze verwendet:
Die angegebenen Ansätze werden 1 Stunde auf 37°C inkubiert.
Die aus b) erhaltenen DNA Fragmente werden elektrophoretisch aufgetrennt (z. B. 4%
Agarose UltraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-027), mit
Ethidiumbromid (0,001%) gefärbt und unter UV sichtlbar gemacht (siehe Abb. 8).
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Implementierung
binärer Logomere:
Binäre Logomere werden mit Grammatiken erzeugt, in denen gilt:
Binäre Logomere werden mit Grammatiken erzeugt, in denen gilt:
Σ: = {0, 1, s0, s1, s2, . . ., sn-1, sn, e0, e1, e2, . . ., em-1, em} mit n, m ∈ e N und n, m ≧ 0.
Sie ermöglichen die einfachste und universellste Darstellung von Daten, wie sie auch von
herkömmlichen Datenverarbeitungsmaschinen eingesetzt wird. Binäre Logomere sind
Resultat einer Bitpolymerisation. Da abhängig von der jeweils gewählten Grammatik nahezu
beliebige Symbole und Regeln kodiert werden können, können damit ebenso beliebige Daten
und Datentypen erzeugt werden.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Implementierung
von Zeichenalphabeten:
Logomere können eingesetzt werden, um die Zeichen eines gewählten Alphabetes zu kodieren. Die Zeichenlänge kann dabei unterschiedlich gewählt werden, sinnvoll ist es jedoch, die auch für herkömmliche Datenverarbeitungsanlagen benutzten Zeichenlängen (Halbbyte, 1-Byte, 2-Byte, 4-Byte, 8-Byte usw.) zu verwenden. Ebenso ist die Konvention für die Interpretation der dargestellten Zeichen wahlfrei. Gie Zeichen können Zahlen, Buchstaben, alphanumerische Zeichen oder beliebige andere Datenstrukturen sein.
Logomere können eingesetzt werden, um die Zeichen eines gewählten Alphabetes zu kodieren. Die Zeichenlänge kann dabei unterschiedlich gewählt werden, sinnvoll ist es jedoch, die auch für herkömmliche Datenverarbeitungsanlagen benutzten Zeichenlängen (Halbbyte, 1-Byte, 2-Byte, 4-Byte, 8-Byte usw.) zu verwenden. Ebenso ist die Konvention für die Interpretation der dargestellten Zeichen wahlfrei. Gie Zeichen können Zahlen, Buchstaben, alphanumerische Zeichen oder beliebige andere Datenstrukturen sein.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Implementierung
eines 1-Byte Alphabetes:
Es sei eine Grammatik G = (Σ, V, R, S) mit Terminalalphabet Σ: = {0, 1, s, e}, Variablenmenge
Es sei eine Grammatik G = (Σ, V, R, S) mit Terminalalphabet Σ: = {0, 1, s, e}, Variablenmenge
V: = { S0, S1, S2, S3, S4, S5, S6, S7, S8}, Startsymbol S und Regelmenge) R: =
{
S: = sS0
S0 → 0S1
S0 → 1S1
S1 → 0S2
S1 → 1S2
S2 → 0S3
S2 → 1S3
S3 → 0S4
S3 → 1S4
S4 → 0S5
S4 → 1S5
S5 → 0S6
S5 → 1S6
S6 → 0S7
S6 → 1S7
S7 → 0S8
S7 → 1S8
S8 → e
}
S: = sS0
S0 → 0S1
S0 → 1S1
S1 → 0S2
S1 → 1S2
S2 → 0S3
S2 → 1S3
S3 → 0S4
S3 → 1S4
S4 → 0S5
S4 → 1S5
S5 → 0S6
S5 → 1S6
S6 → 0S7
S6 → 1S7
S7 → 0S8
S7 → 1S8
S8 → e
}
wobei:
s := Start
e := Ende Beispiel:
nach den Regeln der angegebenen Grammatik können alle 8-Bit Zeichen erzeugt werden:
z. B.: Erzeugung der 8-Bit 0, 00000000:
s := Start
e := Ende Beispiel:
nach den Regeln der angegebenen Grammatik können alle 8-Bit Zeichen erzeugt werden:
z. B.: Erzeugung der 8-Bit 0, 00000000:
S → sS0 → s0S1 → s00S2 → s000S3 → s0000S4 → s00000S5 → s000000S6 → s0000000S7 →
s00000000S8 → s00000000e
z. B.: Erzeugung der 8-Bit 255, 11111111:
S → sS1 → s1S1 → s11S2 → s111S3 → s1111S4 → s11111S5 → s111111S6 → s1111111S7 →
s11111111S8 -< s11111111e
z. B.: Erzeugung der 8-Bit 85, 01010101:
S → sS0 → s0S1 → s01S2 → s010S3 → s0101S4 → s01010S5 → s010101S6 → s0101010S7 →
s01010101S8 → s01010101e
Die für die Implementierung in vitro benötigten Sequenzen werden nach dem NFR-Verfahren,
wie in den erfindungsgemäßen Schritten II und III beschrieben, hergestellt. Algomere und
Logomere werden, wie in den erfindungsgemäßen Schritten IV-V beschrieben, hergestellt
und die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und
Vervielfältigung von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und
vervielfältigt. Die solcherart erzeugten alphanumerischen Zeichen können jetzt für
verschiedene technische Zwecke (z. B. die Markierung und Identifizierung von Stoffen)
eingesetzt werden und, evtl. nach zusätzlichen technischen Schritten, gemäß dem
erfindungsgemäßen Verfahren zum Auslesen von Information aus informationstragenden
Polymeren (wie oben beschrieben) ausgelesen werden.
Da die hier erzeugten Binärmuster wahlfrei als Daten und Symbole gelesen werden können,
können sie z. B. als alphanumerische Zeichen interpretiert werden. Werden sie als Zahlen
interpretiert, so erzeugt die angegebene Grammatik 3-Bit Zufallszahlen.
Aus einer genügend großen Menge zufälliger 8-Bit Binärmuster können alle 8-Bit Muster
isoliert und als Bibliothek (z. B. zur Darstellung aller alphanumerischen Zeichen) angelegt
werden.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Darstellung von
Zeichenketten:
Da Algomere so hergestellt werden können, daß sich unterschiedlich lange Logomere erzeugen lassen, ist es möglich, auch Zeichenketten darzustellen. Aus praktischen Gründen ist es jedoch zweckmäßig, nur wenige Zeichen pro Logomer vorzusehen. Z. B. kann ein einzelnes Logomer 4 Bit (Halbbyte) oder 8 Bit (1 Byte) enthalten. (Falls mehr Bit erforderlich sind, sollten zweckmäßigerweise immer Vielfache von 8 Bit = 1 Byte verwendet werden.) In Binärdarstellung können dann beliebige alphanumerische Zeichen in beliebiger Kodierung (z. B. ASCII, ANSI, ISO 8859-x, Unicode) dargestelltt werden. Dabei kann sich ein Zeichen auch über mehrere Logomere erstrecken (Bsp.: Halbbyte-Darstellung, bei der sich jeweils ein 1-Byte Zeichen über zwei Logomere erstreckt, oder Unicode, bei der sich ein 16-Bit Zeichen über zwei 8-Bit oder vier 4-Bit Logomere erstreckt). Für die Darstellung von Zeichenketten ist es dann nötig, die einzelnen Zeichen mit Positionsinformation zu versehen. Dazu reicht es, in den jeweiligen Grammatiken verschiedene Terminatoren (z. B. verschiedene "Start"- Terminatoren) zu verwenden, deren Sequenzen jeweils die Positionsinformation repräsentieren. Beispiel: Es sei eine Grammatik G = (Σ, V, R, S) mit Terminalalphabet Σ: = (0, 1, e, s0, s1, s2, . . ., sn-1, sn}, Variablenmenge V: = (S0, S1, S2, S3, S4, S5, S6, S7, S8}, Startsymbol S und Regelmenge R: =
Da Algomere so hergestellt werden können, daß sich unterschiedlich lange Logomere erzeugen lassen, ist es möglich, auch Zeichenketten darzustellen. Aus praktischen Gründen ist es jedoch zweckmäßig, nur wenige Zeichen pro Logomer vorzusehen. Z. B. kann ein einzelnes Logomer 4 Bit (Halbbyte) oder 8 Bit (1 Byte) enthalten. (Falls mehr Bit erforderlich sind, sollten zweckmäßigerweise immer Vielfache von 8 Bit = 1 Byte verwendet werden.) In Binärdarstellung können dann beliebige alphanumerische Zeichen in beliebiger Kodierung (z. B. ASCII, ANSI, ISO 8859-x, Unicode) dargestelltt werden. Dabei kann sich ein Zeichen auch über mehrere Logomere erstrecken (Bsp.: Halbbyte-Darstellung, bei der sich jeweils ein 1-Byte Zeichen über zwei Logomere erstreckt, oder Unicode, bei der sich ein 16-Bit Zeichen über zwei 8-Bit oder vier 4-Bit Logomere erstreckt). Für die Darstellung von Zeichenketten ist es dann nötig, die einzelnen Zeichen mit Positionsinformation zu versehen. Dazu reicht es, in den jeweiligen Grammatiken verschiedene Terminatoren (z. B. verschiedene "Start"- Terminatoren) zu verwenden, deren Sequenzen jeweils die Positionsinformation repräsentieren. Beispiel: Es sei eine Grammatik G = (Σ, V, R, S) mit Terminalalphabet Σ: = (0, 1, e, s0, s1, s2, . . ., sn-1, sn}, Variablenmenge V: = (S0, S1, S2, S3, S4, S5, S6, S7, S8}, Startsymbol S und Regelmenge R: =
{
S := siS0
S0 → 0S1
S0 → 1S1
S1 → 0S2
S1 → 1S2
S2 → 0S3
S2 → 1S3
S3 → 0S4
S3 → 154
S4 → 0S5
S4 → 1S5
S5 → 0S6
S5 → 1S6
S6 → 0S7
S6 → 1S7
S7 → 0S8
S7 → 1S8
S8 → e
}
S := siS0
S0 → 0S1
S0 → 1S1
S1 → 0S2
S1 → 1S2
S2 → 0S3
S2 → 1S3
S3 → 0S4
S3 → 154
S4 → 0S5
S4 → 1S5
S5 → 0S6
S5 → 1S6
S6 → 0S7
S6 → 1S7
S7 → 0S8
S7 → 1S8
S8 → e
}
wobei:
s; : = Start, mit i = {0, . . ., n}
e: = Ende.
s; : = Start, mit i = {0, . . ., n}
e: = Ende.
Das mit dieser Grammatik erzeugte 1-Byte Alphabet reicht z. B. für alle alphanumerischen
Zeichen des ASCII, ANSI oder ISO 8859-x Standards. Für eine Zeichenkette der Längen
werden n verschiedene Terminatoren benötigt, so daß die mit dieser Grammatik erzeugten
Zeichenketten wie folgt aufgebaut sind:
s0xe, s1xe, . . ., sn-1xe, snxe
wobei x eine beliebige Binärdarstellung mit, in diesem Fall, 8 Bit ist.
s0xe, s1xe, . . ., sn-1xe, snxe
wobei x eine beliebige Binärdarstellung mit, in diesem Fall, 8 Bit ist.
Es bedeutet dann:
s0xe: = Zeichen x an Position 0 (0.tes Zeichen)
s1xe: = Zeichen x an Position 1 (1.tes Zeichen)
s2xe: = Zeichen x an Position 2 (2.tes Zeichen)
usw.
s0xe: = Zeichen x an Position 0 (0.tes Zeichen)
s1xe: = Zeichen x an Position 1 (1.tes Zeichen)
s2xe: = Zeichen x an Position 2 (2.tes Zeichen)
usw.
Mit der Grammatik läßt sich beispielsweise die Zeichenkette "Elisabeth" im ASCII-Code
darstellen:
s001000101e, s101101100e, s201101001e, s301110011e, s401100001e, s501100010e,
s601100101e, s701110100e, s801101000e
Alternativ kann auch Σ: = {0, 1, s, e0, e1, e2, . . ., en-1, en} gewählt werden, wodurch die
Zeichenkette "Elisabeth" im ASCII-Code als:
s01000101e0, s01101100e1, s01101001e2, s01110011e3, s01100001e4, s01100010e5,
s01100101e6, s01110100e7, s01101000e8
dargestellt wird. Eine weitere Möglichkeit ist Σ: = {0, 1, s0, s1, s2, . . ., sn-1, sn, e0, e1, e2, . . ., en-1,
en}, womit die Zeichenkette "Elisabeth" im ASCII-Cade als:
s001000101e0, s101101100e0, s201101001e2, s301110011e3, s401100001e4, s501100010e5,
s601100101e6, s701110100e7, s801101000e8
dargestellt wird.
In Halbbyte-Darstellung mit Positionsinformation würde die Zeichenkette "Elisabeth" im ASCII-
Code dargestellt als:
s0100e, s10101e, s20110e, s31100e, s40110e, s51001e, s60111e, s70011e, s80110e, s90001e,
s100110e, s110010e, s120110e, s130101e, s140111e, s150100e, s160110e, s171000e
Aufgrund der Positionsinformation, die durch die Sequenz der Terminatoren repräsentiert
wird, können die einzelnen Zeichen völlig unabhängig voneinander verarbeitet werden und
z. B. getrennt voneinander gelesen werden.
Mit einem solchen Alphabet ist die Darstellung beliebiger Datentypen möglich. Z. B. können
z. B. jeweils zwei Byte (0. + 1., 2. + 3., . . ., n. + n+1.) zu einem 2-Bytecode (z. B. Unicode)
zusammengefaßt werden. Alphanumerische Zeichenketten können verwendet werden, um
beliebige Bezeichner (Namen, Zahlen, Datum usw.) darzustellen.
Die für die Implementierung in vitro benötigten Sequenzen werden nach dem NFR-Verfahren,
wie in den erfindungsgemäßen Schritten II und III beschrieben, hergestellt. Algomere und
Logomere werden, wie in den erfindungsgemäßen Schriften IV-V beschrieben, hergestellt,
die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und Vervielfältigung
von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfältigt. Die
solcherart erzeugten alphanumerischen Zeichen und Zeichenketten können jetzt für
verschiedene technische Zwecke (z. B. die Markierung und Identifizierung von Stoffen)
eingesetzt werden und, evtl. nach zusätzlichen technischen Schritten, gemäß dem
erfindungsgemäßen Verfahren zum Auslesen von Information aus informationstragenden
Polymeren (wie oben beschrieben) ausgelesen werden.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Implementierung
eines Zufallszahlengenerators:
Für bestimmte Probleme der Informatik (z. B. Simulationen) und der Mathematik werden Zufallszahlen benötigt. Diese werden im allgemeinen rechnergestützt durch Algorithmen erzeugt. Da diese Algorithmen jedoch deterministisch sind, handelt es sich bei den erzeugten Zufallszahlen nur um Pseudo-Zufallszahlen. Überdies sind die erzeugten Zahlenreihen aufgrund der unterschiedlichen Güte der Algorithmen unterschiedlich gut randomisiert. Für manche Anwendungen werden daher echte Zufallszahlen benötigt. Ist dies der Fall, muß ein physikalischer Prozeß in die Erzeugung von Zufallszahlen einbezogen werden. Ein solcher Prozeß ist etwa das Rauschen der Soundkarte in einem PC, das von entsprechender Software verarbeitet wird.
Mithilfe der hier beschriebenen Verfahren kann ein echter Zufallszahlengenerator implementiert werden, der Zufallszahlen sehr viel schneller erzeugt, als es mit herkömmlichen Verfahren möglich ist.
Der Zufallszahlengenerator wird mit folgender Grammatik implementiert (Grammatik für binäre Zufallszahlen beliebiger Länge):
Für bestimmte Probleme der Informatik (z. B. Simulationen) und der Mathematik werden Zufallszahlen benötigt. Diese werden im allgemeinen rechnergestützt durch Algorithmen erzeugt. Da diese Algorithmen jedoch deterministisch sind, handelt es sich bei den erzeugten Zufallszahlen nur um Pseudo-Zufallszahlen. Überdies sind die erzeugten Zahlenreihen aufgrund der unterschiedlichen Güte der Algorithmen unterschiedlich gut randomisiert. Für manche Anwendungen werden daher echte Zufallszahlen benötigt. Ist dies der Fall, muß ein physikalischer Prozeß in die Erzeugung von Zufallszahlen einbezogen werden. Ein solcher Prozeß ist etwa das Rauschen der Soundkarte in einem PC, das von entsprechender Software verarbeitet wird.
Mithilfe der hier beschriebenen Verfahren kann ein echter Zufallszahlengenerator implementiert werden, der Zufallszahlen sehr viel schneller erzeugt, als es mit herkömmlichen Verfahren möglich ist.
Der Zufallszahlengenerator wird mit folgender Grammatik implementiert (Grammatik für binäre Zufallszahlen beliebiger Länge):
G = (Σ, V, R, S) mit Σ: = {0, 1, s, e}, V: = {S},
R: =
{
S: = sA
A → 0A
A → 1A
A → e
}
R: =
{
S: = sA
A → 0A
A → 1A
A → e
}
wobei
s: = Start
e: = Ende
s: = Start
e: = Ende
Mit dieser Grammatik können Wörter über dem oben angegebenen Terminalalphabet
L = {0, 1, s, e}
gebildet werden. Alle Wörter der Sprache L beginnen mit "s" und hören mit "e" auf,
dazwischen befindet sich eine zufällige Anzahl (auch 0) zufälliger Bits ("0" und "1").
Beispiel: Wörter aus der Sprache L, die nach R gebildet werden:
S → sA → se
S → sA → s1A → s1e
S → sA → s0A → s00A → s001A → s0010A → s0010e
S → sA → s1A → s10 62137 00070 552 001000280000000200012000285916202600040 0002019914808 00004 62018A → s100A → s1000A → s10000A → s100000A → s100000e
S → sA → s1A → s1e
S → sA → s0A → s00A → s001A → s0010A → s0010e
S → sA → s1A → s10 62137 00070 552 001000280000000200012000285916202600040 0002019914808 00004 62018A → s100A → s1000A → s10000A → s100000A → s100000e
Die als Wörter der Spache L erzeugten Binärmuster können als Buchstaben, Zahlen,
alphanumerische Zeichen oder Zeichenketten gelesen werden. Liest man sie als die
Binärdarstellung von Zahlen, so sind diese Binärmuster in Dezimaldarstellung:
∅3 (leer)
1
2
32
1
2
32
und können als Zufallszahlen verwendet werden. Zur in vitro Implementierung eignen sich
prinzipiell beliebige Sequenzen, solange sie eindeutig und zueinander maximal unähnlich sind.
Z. B. können folgende Algomere verwendet werden:
Die dazu benötigten Sequenzen sind handelsüblich. Sie können z. B. bestellt werden als
40 nmol, PAGE gereinigt (ARK-Scientific, Darmstadt) und z. B. 100 µM in Aqua dest.
aufgenommen werden (empfohlene Lagerung bei -20°C). Aus den Sequenzen werden, wie
im erfindungsgemäßen Schritt IV beschrieben, Algomere hergestellt. Diese Algomere werden,
wie im erfindungsgemäßen Schritt V beschrieben, zu Logomeren polymerisiert und können
gemäß dem erfindungsgemäßen Verfahren zum Auslesen von Information aus
informationstragenden Polymeren (wie oben beschrieben) ausgelesen werden. Derart
erzeugte Zufallszahlen sind in Abb. 6 zu sehen.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Verschlüsselung
von Logomeren:
Die in Logomeren enthaltene Information kann verschlüsselt werden. Dazu fungiert mindestens einer der für die Auslese-PCR benötigten Primer als geheimer Schlüssel (siehe Abb. 11). Bevorzugt ist dies einer der in den Terminatoren primenden Primer. Ist die Sequenz dieses Primers (Schlüsselsequenz) und der Primer selbst nur autorisierten Zugreifern bekannt, so ist die in den derart verschlüsselten Logomeren enthaltene Information auch nur autorisierten Zugriffen zugänglich.
Die in Logomeren enthaltene Information kann verschlüsselt werden. Dazu fungiert mindestens einer der für die Auslese-PCR benötigten Primer als geheimer Schlüssel (siehe Abb. 11). Bevorzugt ist dies einer der in den Terminatoren primenden Primer. Ist die Sequenz dieses Primers (Schlüsselsequenz) und der Primer selbst nur autorisierten Zugreifern bekannt, so ist die in den derart verschlüsselten Logomeren enthaltene Information auch nur autorisierten Zugriffen zugänglich.
Um ein Auslesen der in den Logomeren enthaltenen Information ohne diesen Schlüssel zu
verhindern, müssen weitere Vorkehrungen getroffen werden. Versuche, die Verschlüsselung
zu brechen, können darauf beruhen, über die Vervielfältigung nicht-geheimer Sequenzen auch
die Logomere zu lesen. Sofern bakterielle Vektoren zur Klonierung von Logomeren verwendet
werden, könnte ein potentieller Angreifer z. B. versuchen, die gesamte Klonierungssite mit
PCR zu vervielfältigen und dann mit Sequenzierung zu lesen oder über die zur Selektion
benötigten Resistenzgene in die Klonierungssite "hineinzulesen". Auch könnten die
Elongatoren selbst als Ansatzpunkte für ein PCR-basiertes Lesen der geheimen Sequenz(en)
dienen.
Solchen Angriffsversuchen ist gemein, daß sie über nicht-geheime Sequenzen versuchen
könnten, die Schlüsselsequenz zu entschlüsseln und darüber die verschlüsselte Sequenz zu
lesen. Eine Abwehr derartiger Angriffsversuche kann dadurch erfolgen, daß zum
Informationstransport über Logomere immer nur vollständig geheime Sequenzen verwendet
werden. Jedoch ist dies evtl. zu aufwendig und kostenträchtig. Stattdessen oder ergänzend
dazu können die informationstragenden Logomere mit Sequenzen (Scheinsequenzen)
versetzt werden, die dieselben potentiellen Angriffspunkte (z. B. Bits, Resistenzgene)
enthalten, jedoch jeweils andere Schlüsselsequenzen. Durch diese Scheinsequenzen laufen
potentielle Angiffsversuche ins Leere, weil für den nicht-autorisierten Zugreifer alle
Einzelsequenzen ununterscheidbar und dadurch die verschlüsselten Informationen verborgen
sind. Mit je mehr Scheinsequenzen ein Logomer versetzt ist, um so schwieriger wird es, die
Schlüsselsequenz zu brechen.
Das Verfahren entspricht einer molekularen Steganografie und wird exemplarisch anhand der
Verschlüsselung von Zeichen eines 1-Byte Alphabetes gezeigt:
Es sei die verwendete Grammatik G = (Σ, V, R, S) nmt Terminalalphabet Σ: = {0, 1, skey, s0, s1, s2, . . ., sf-1, sf, e}, wobei f ∈ N, f ≧ 1. skey ist der geheime Schlüssel. Für eine Schlüssellänge von I ist dann die maximale theoretische Verschlüsselung Keymax = aI, die maximal verwendbare Verschlüsselung Keyeff = aI-d, wobei d die Anzahl der Basen angibt, in der sich ein Scheinschlüssel von dem richtigen Schlüssel unterscheiden muß, damit in der Auslese- PCR kein Scheinschlüssel die richtige Sequenz lesen und umgekehrt der richtige Schlüssel kein Scheinlogomer (sondern nur das Ziellogomer) auslesen kann. Für hochspezifische PCR Konditionen kann d ≧ 1 werden. Weiterhin gibt Keyimp = Anzahl Scheinschlüssel + 1 die tatsächlich verwendete Verschlüsselung und Keymin = 1 + x die minimale Verschlüsselung an. Dabei ist x die zu einer minimalen Verschlüsselung nötige Anzahl von Scheinlogomeren. Diese kann im Falle der Verwendung von n Logomeren als Informationsträger größer als n gewählt werden.
Es sei die verwendete Grammatik G = (Σ, V, R, S) nmt Terminalalphabet Σ: = {0, 1, skey, s0, s1, s2, . . ., sf-1, sf, e}, wobei f ∈ N, f ≧ 1. skey ist der geheime Schlüssel. Für eine Schlüssellänge von I ist dann die maximale theoretische Verschlüsselung Keymax = aI, die maximal verwendbare Verschlüsselung Keyeff = aI-d, wobei d die Anzahl der Basen angibt, in der sich ein Scheinschlüssel von dem richtigen Schlüssel unterscheiden muß, damit in der Auslese- PCR kein Scheinschlüssel die richtige Sequenz lesen und umgekehrt der richtige Schlüssel kein Scheinlogomer (sondern nur das Ziellogomer) auslesen kann. Für hochspezifische PCR Konditionen kann d ≧ 1 werden. Weiterhin gibt Keyimp = Anzahl Scheinschlüssel + 1 die tatsächlich verwendete Verschlüsselung und Keymin = 1 + x die minimale Verschlüsselung an. Dabei ist x die zu einer minimalen Verschlüsselung nötige Anzahl von Scheinlogomeren. Diese kann im Falle der Verwendung von n Logomeren als Informationsträger größer als n gewählt werden.
Für Zeichenketten ergibt sich automatisch eine zusätzliche Verschlüsselung, weil hier die für
einen potentiellen Angreifer unbekannte Reihenfolge der Zeichen zusätzlich verschlüsselnd
wirkt.
Beispiel: Für eine Grammatik mit Zeichenketten von n 1-Byte Zeichen wird folgende
Grammatik G verwendet:
Es sei G = (Σ, V, R, S) mit Terminalalphabet Σ: = {0, 1, skey0, skey1, skey2, . . ., skeyn-1, skeyn, s0, s1, s2, . . ., sf-1, sf, e}, wobei n, f ∈ N, n ≧ 1. n gibt dabei die Anzahl der verwendeten echten Schlüssel, f die Anzahl der verwendeten Scheinschlüssel an; die verwendete Variablenmenge V und die verwendete Regelmenge R sind dabei wahlfrei und abhängig von der zu kodierenden Information.
Es sei G = (Σ, V, R, S) mit Terminalalphabet Σ: = {0, 1, skey0, skey1, skey2, . . ., skeyn-1, skeyn, s0, s1, s2, . . ., sf-1, sf, e}, wobei n, f ∈ N, n ≧ 1. n gibt dabei die Anzahl der verwendeten echten Schlüssel, f die Anzahl der verwendeten Scheinschlüssel an; die verwendete Variablenmenge V und die verwendete Regelmenge R sind dabei wahlfrei und abhängig von der zu kodierenden Information.
Grammatiken mit anderer Zeichenkodierung funktionieren analog.
Die für die Implementierung in vitro benötigten Sequenzen werden nach dem NFR-Verfahren,
wie in den erfindungsgemäßen Schritten II und III beschrieben, hergestellt. Algomere und
Logomere werden, wie in den erfindungsgemäßen Schritten IV-V beschrieben, hergestellt,
die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und Vervielfältigung
von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfältigt. Die
solcherart erzeugten Logomere können, wie bereits als Auslese-PCR beschrieben,
ausgelesen werden, wobei - wie beschrieben - einer der zum Auslesen benötigten Primer,
bevorzugt einer der in den Terminatoren primenden Primer, als geheimer Schlüssel fungiert.
Mit der oben beschriebenen Grammatik werden zusätzlich zu den informationstragenden
Logomeren "Scheinsequenzen" ("Scheinlogomere") erzeugt, die einen nicht-autorisierten
Auslese-Zugriff auf die in den Logomeren enthaltenen Informationen verhindern sollen. Das
Verfahren kann für alle Anwendungen von Logomeren benutzt werden und hat u. a. den
Vorzug, durch die Spezifität des als geheimer Schlüssel benutzten Primers sehr effektiv zu
sein.
Basierend auf der beschriebenen Methode können symmetrische und asymmetrische
Verschlüsselungsverfahren implementiert werden. Für ein symmetrisches
Verschlüsselungsverfahren reicht es, daß sich die Teilnehmer A und B einer Kommunikation
auf eine geheimgehaltene Schlüsselsequenz einigen. Teilnehmer B verschlüsselt eine als
Logomer gespeicherte Nachricht an A, indem B Logomere nur mit den geheimen
Terminatoren herstellt und seine Nachricht mit zusätzlichen Logomeren versetzt, die andere
Terminatoren tragen. Nur A ist es dann möglich, das zum Auslesen benötigte Primerpaar
bereitzustellen, da nur A die benötigte Terminatorsequenz kennt.
Ein asymmetrisches Verschlüsselungsverfahren erfordert dagegen zusätzlichen Aufwand, z. B.
den Einsatz von Molekülen mit irregulären Formen (siehe z. B. Abb. 12 und Abb.
13): Will ein Kommunikationsteilnehmer B eine verschlüsselte Nachricht an A schicken, so
bekommt er von A einen öffentlichen Schlüssel, den er zur Verschlüsselung der als Logomer
repräsentierten Nachricht verwenden kann. Der öffentliche Schlüssel von A besteht aus einem
Paar von Terminatoren und einem Pool zusätzlicher Scheinterminatoren mit ähnlichen
Eigenschaften, jedoch abweichenden Sequenzen und anderen 3'-Überhangsequenzen. Von
den echten Terminatoren ist lediglich die 3' Überhangsequenz bekannt, mit der sie an die -
öffentlich bekannten - Elongatoren verknüpft werden kann. Zur Verschlüsselung einer
Nachricht erzeugt B Logomere, wobei er in der Symbolpolymerisationsreaktion den von A
öffentlich bereitgestellten Schlüssel (enthaltend Terminatoren und Scheinterminatoren)
verwendet. Die Art und Weise der Terminatoren gewährleistet nun, daß lediglich A in der Lage
ist, die solcherart verschlüsselte Nachricht wieder zu lesen: Da nur A die tatsächliche Sequenz
der echten Terminatoren kennt, ist nur A in der Lage, die als Logomere verschlüsselte
Nachricht über Auslese-PCR wieder zu lesen.
Weil der öffentliche Schlüssel potentiell über die bekannte Überhangsequenz zu den
Elongatoren angreifbar ist (weil die Scheinterminatoren diese Überhangsequenz nicht
besitzen dürfen, kann ein potentieller Angreifer eine beliebige Sequenz an die echten
Terminatoren knüpfen, wodurch die Sequenz der Terminatoren identifiziert werden kann),
werden als Terminatoren Moleküle auf der Basis irregulärer Formen, z. B. auf der Basis der in
Abb. 12 gezeigten Y-förmigen Moleküle verwendet. Die gezeigten Y-förmigen Moleküle
lassen sich zu weiter verzweigten baumartigen Molekülen zusammensetzen. Die Wurzel eines
solchen als Baum realisierten Terminatormoleküls enthält dann die zu den Elongatoren
kompatible Überhangsequenz, während nur eine der Äste des Baumes die echte
Terminatorsequenz enthält. Da die verschlüsselte Nachricht wie oben beschrieben zusätzlich
mit Scheinlogomeren versetzt ist, kann dann nur A, der die echte Terminatorsequenz kennt,
aus der Menge der Moleküle die richtige Nachricht durch Verknüpfen mit dem kompatiblen
Vektor herausfiltern, wohingegen ein potentieller Angreifer ohne Kenntnis der echten
Terminatorsequenz dies nicht kann.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Verschlüsselung
mit Echtzeit-Identifizierung:
Ohne das Auslesen der in verschlüsselten Logomeren enthaltenen Informationen kann das Vorhandensein der Schlüsselsequenz selbst Auskunft darüber geben, ob ein gekennzeichnetes Produkt echt ist, oder nicht. Die Information über die Authentizität des gekennzeichneten Produktes kann dabei über einen Prozeß, bei dem der Schlüsselprimer als Hybridisierungssonde einer Fluoreszenz-Nachweisreaktion dient, verifiziert oder falsifiziert werden.
Ohne das Auslesen der in verschlüsselten Logomeren enthaltenen Informationen kann das Vorhandensein der Schlüsselsequenz selbst Auskunft darüber geben, ob ein gekennzeichnetes Produkt echt ist, oder nicht. Die Information über die Authentizität des gekennzeichneten Produktes kann dabei über einen Prozeß, bei dem der Schlüsselprimer als Hybridisierungssonde einer Fluoreszenz-Nachweisreaktion dient, verifiziert oder falsifiziert werden.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung
informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen
informationstragenden Polymere, zur Verschlüsselung von Information.
Die oben beschriebenen Verfahren ermöglichen beispielsweise einen Test der
Qualität von Oligonukleotiden:
Ein typisches Problem bei der Herstellung von Oligonukleotiden, z. B. für molekularbiologische Zwecke, ist die Qualitätskontrolle derselben, die aufgrund des Herstellungsprozesses und der schwankenden Qualität der verwendeten Chemikalien problematisch ist.
Ein typisches Problem bei der Herstellung von Oligonukleotiden, z. B. für molekularbiologische Zwecke, ist die Qualitätskontrolle derselben, die aufgrund des Herstellungsprozesses und der schwankenden Qualität der verwendeten Chemikalien problematisch ist.
Das in den erfindungsgemäßen Schritten I-V beschriebene Verfahren kann benutzt werden,
die Qualität von Oligonukleotiden zu testen. Dazu wird eine binäre Grammatik wie die für den
Zufallszahlengenerator (s. o.) oder eine unäre Grammatik wie die zur Herstellung von
Molekulargewichtsstandards (s. u.) zur Erzeugung beliebig langer Logomere verwendet. Bei
ansonsten identischen Bedingungen ist dann die Länge der aus einer Symbolpolymerisation
(Schritt V des erfindungsgemäßen Verfahrens) erhaltenen Logomere direkt proportional zur
Qualität der verwendeten Oligonukleotide: Je länger die elektrophoretisch sichtbar gemachten
Logomere sind, desto besser ist die Qualität der verwendeten Oligonukleotide. Ein Beispiel für
die aus einer Symbolpolymerisation erhaltene Leiter unterschiedlich langer Logomere findet
sich unter Abb. 3.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung
informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen
informationstragenden Polymere, zur Qualitätskontrolle synthetisch hergestellter
Oligonukleotide.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Herstellung von
Logomeren als Marker und Signaturen:
Aufgrund der Fähigkeit, prinzipiell beliebige Informationen darzustellen, lassen sich die hier beschriebenen Logomere als Marker verwenden, um Erzeugnisse, Produkte, Stoffe und Geräte zu kennzeichnen.
Aufgrund der Fähigkeit, prinzipiell beliebige Informationen darzustellen, lassen sich die hier beschriebenen Logomere als Marker verwenden, um Erzeugnisse, Produkte, Stoffe und Geräte zu kennzeichnen.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung
informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen
informationstragenden Polymere, als Marker oder Signaturen.
Die Logomere können als "binäres Etikett" verwendet werden, das einem Erzeugnis
hinzugefügt wird und Informationen über das derart gekennzeichnete Erzeugnis enthält. Die
Logomere können dabei z. B. Informationen über
- a) Hersteller
- b) Produkt (z. B. Seriennummer)
- c) Verwendungszweck
- d) Stoffklasse
- e) Gefahrenklasse
- f) Qualität
- g) Reinheit
- h) Produktions- und Verfallsdatum
enthalten. Es lassen sich damit nahezu beliebige Produkte und Erzeugnisse mit nahezu
beliebigen Informationen versehen. Da die Logomere ungiftig und biologisch abbaubar sind,
können sie auch für hochsensible Produkte wie Nahrungsmittel, Medikamente und
pharmazeutische Erzeugnisse eingesetzt werden.
Gekennzeichnete Erzeugnisse können z. B. sein:
- a) chemische Erzeugnisse, z. B. Lacke, Farben, Öle, Schmier- und Treibstoffe, Lösungsmittel, Tinte usw.
- b) flüssige Materialien: Lösungen, Suspensionen, Emulsionen
- c) gentechnische Erzeugnisse
- d) Nahrungsmittel, z. B. zur Kennzeichnung gentechnisch veränderter Bestandteile oder dem Monitoring von Nahrungsmitteln während des Produktionsprozesses
- e) Medikamente und pharmazeutische Erzeugnisse
- f) Papiererzeugnisse, Dokumente, Geld
- g) Geräte
Der Bedarf zur Kennzeichnung von Produkten besteht in den unterschiedlichsten Bereichen
und aufgrund unterschiedlicher Anforderungen. Gründe für eine Kennzeichnung können z. B.
sein: Qualitätssicherung beim Produktionsprozeß, Überwachung der Produktreinheit und
Vermeidung von Kontaminationen, Schutz vor Fälschung und Produktpiraterie, Nachweis
bestimmter Produktbestandteile, Produktkennzeichnung mit beliebigen Produktinformationen.
Dieser Bedarf stellt sich auch in besonders sensiblen Bereichen, etwa bei der Kennzeichnung
von Nahrungsmitteln, medizinischen und pharmazeutischen Erzeugnissen und gentechnisch
hergestellten oder veränderten Erzeugnissen. Hier ist es wünschenswert, daß Informationen
über das jeweilige Produkt direkt am Produkt verfügbar sind, insbesondere wenn
Verwechselungen oder Fälschungen vermieden werden sollen und auch die Identifikation
unterschiedlicher Bestandteile eines Erzeugnisses gewünscht ist.
Es gibt zahlreiche Beispiele für den Bedarf von Produktkennzeichnungen. Z. B. können
Logomere als Seriennummern eingesetzt werden, die in Autolacke gemischt werden, wodurch
der Fahrzeughalter im Versicherungsfall (z. B. Unfall oder Diebstahl) identifiziert werden kann.
Durch Produktkennzeichnungen könnte die Qualität und Reinheit chemischer Erzeugnisse
überwacht und Kontaminationen vermieden werden. Ein permanentes Problem ist die
Fälschung von Dokumenten, Unterschriften und Geld, die hochentwickelte
Kennzeichnungsverfahren nötig macht.
Vor allem vor dem Hintergrund von Tierkrankheiten und -seuchen (BSE, Schweinepest,
Salmonellenvergiftungen usw.) stellt sich das Problem der Qualitätssicherung von
Nahrungsmitteln und der Kennzeichnung von Endprodukten, um kontaminierte Produkte vom
Verbrauch fernzuhalten. Ein weiteres Problem sind Nahrungsmittel, die gentechnisch
hergestellte Bestandteile enthalten. Diese Bestandteile können ohne ein
Kennzeichnungsverfahren im Endprodukt überhaupt nicht oder nur sehr schwer
nachgewiesen werden. Das Problem stellt sich insbesondere dadurch, daß viele
Nahrungsmittel Bestandteile unterschiedlicher Herkunft enthalten und die Produktionswege
teilweise undurchschaubar sind.
Das Problem der Kennzeichnung stellt sich z. B. auch im Bereich von Blutprodukten, wo z. B.
durch Pooling Kontaminationen auftreten können. Auch wäre es hier z. T. wünschenswert,
Informationen über Identität, Herkunft, Produktions- und Verfallsdatum direkt mit dem Produkt
verfügbar zu haben. Ähnliches gilt auch für Medikamente und pharmazeutische Produkte.
Bisher verwendet man zur Kennzeichnung und Markierung von Farben, Lacken, Treibstoffen,
usw. verschiedene Kohlenstoffverbindungen, Polyaniline, Flüssigkristalle oder andere
chemische Verbindungen. Diese Stoffe und Verbindungen haben unterschiedliche
Schwächen: sie sind z. T. toxisch, nur schwer biologisch abbaubar, die verfügbare
Informationskapazität ist stark eingeschränkt, sie wechselwirken chemisch mit bestimmten
Stoffen oder sind nur teuer und aufwendig herzustellen.
Für den Einsatz zur Kennzeichnung von sensiblen und hochsensiblen Erzeugnissen wie
Nahrungsmitteln oder Medikamenten sind die genannten Stoffe und Verbindungen aufgrund
der genannten Nachteile überhaupt nicht geeignet.
Die Anforderungen, die sich für ein Kennzeichnungsverfahren von beliebigen Erzeugnissen
stellen umfassen zumindest:
- - Die Kennzeichnung sollte direkt im oder am Erzeugnis verfügbar sein;
- - die Kennzeichnung sollte gut nachweisbar sein;
- - die Kennzeichnung muß gesundheitlich unbedenklich sein.
Gegenüber den bisher verwendeten Verbindungen haben die hier beschriebenen Logomere
folgende Vorzüge:
- - Kodierung beliebiger Informationen,
- - hohe Speicherkapazität,
- - gesundheitlich unbedenklich,
- - chemisch, biologisch, pharmakologisch und genetisch neutral,
- - leicht biologisch abbaubar (Biomoleküle),
- - keine Umweltbelastung,
- - sehr gute Nachweisbarkeit,
- - hohe Kompatibilität zu bestehenden Techniken der Informatik und Molekularbiologie (PCR),
- - Informationen können verschlüsselt werden und eignen sich auch zu Authentifizierung und Verschlüsselung,
- - Identifikation einzelner Bestandteile in Produktmischungen,
- - billig in großen Mengen herzustellen (Klonierung, Vervielfältigung mit Bakterien in Fermentern).
Diese Eigenschaften machen Logomere für die genannten Aufgaben sehr viel besser
geeignet als die bestehenden Techniken. Überdies erschließen sich Einsatzbereiche, die mit
den bisherigen Techniken nicht möglich waren.
Aufgrund der Eigenschaften nukleinsäurebasierler Logomere können diese auch zur
Kennzeichnung von besonders sensiblen Produkten wie Nahrungsmitteln und
pharmazeutischen Erzeugnissen verwendet werden.
Die Gründe dafür liegen zum einen in der chemischen Beschaffenheit nukleinsäurebasierter
Logomere und zum anderen in der Kodierung von Informationen in Logomeren:
- 1. Als Grundbausteine des Lebens" sind Nukleinsäuren Elementarbausteine aller bisher bekannten biologischen Lebensformen. Daher können sie aufgrund ihrer chemischen Beschaffenheit für keinen bekannten biologischen Organismus schädlich sein ("biochemische Kompatibilität"). Aufgrund der enthaltenen genetischen Informationen (des enthaltenen Programmes) können Nukleinsäuren jedoch sehr wohl potentiell schädlich sein, wenn sie in einem Organismus abgelesen werden: Falls sie etwa für giftige Proteine kodieren oder (wie im Falle viralen Erbgutes) einen jeweiligen Zielorganismus "umprogrammieren" können. Die hier verwendeten Logomere können jedoch aus den im Folgenden genannten Gründen keine für einen Organismus schädlichen Informationen enthalten.
- 2. Logomere enthalten keine genetischen, d. h. biologisch relevanten Informationen ("semantische Inkompatibilität"): Bezüglich der enthaltenen Informationen entsprechen Logomere Buchstaben, Zahlen oder Folgen von Buchstaben und Zahlen in Binärkodierung, die für uns oder einen Computer, jedoch nicht für den genetischen Apparat eines Organismus lesbar sind. Für einen biologischen Organismus sind sie schlicht "Unsinnscode".
- 3. Logomere, insbesondere die Algomere, aus denen sie aufgebaut sind, sind zu kurz um auch nur zufällig biologisch relevante Informationen zu enthalten.
- 4. Um jede Eventualität (der unwahrscheinliche Fall, daß die Binärinformationen der Logomere auf irgendeine Weise von irgendeinem Organismus als genetisch relevante Information interpretiert wird) auszuschließen, werden die zur Kodierung von Symbolen verwendeten Sequenzen im Falle sensibler Anwendungsbereiche mit Stopcodons versehen, so daß sie niemals von einem biologischen Organismus abgelesen werden können.
- 5. Als elementare Bestandteile aller biologischen Organismen sind Nukleinsäuren in unserer Umwelt allgegenwärtig. Sie werden in kürzester Zeit abgebaut.
Um als Marker eingesetzt zu werden, können Logomere nach den in den erfindungsgemäßen
Schritten I-V beschriebenen Verfahren erzeugt und nach den erfindungsgemäßen oben
beschriebenen Verfahren vervielfältigt werden. Je nach Einsatzbereich können zur
Vervielfältigung der Logomere verschiedene Verfahren und verschiedene
Aufarbeitungsprozesse vorgenommen werden. Zur Kennzeichnung petrochemischer
Erzeugnisse z. B. können Logomere durch Klonierung in Bakterien vervielfältigt werden. Um
unnötige Kontaminationen zu vermeiden, können die erhaltenen Bakterien lysiert werden.
Eine spezielle Aufreinigung der Logomer-DNA ist im Allgemeinen nicht nötig.
Zur Herstellung von Logomeren für sensible und hochsensible Produkte ist dagegen ein
aufwendigeres Vervielfältigungs- und Aufreinigungsverfahren nötig. Ziel ist dabei der Erhalt
möglichst reiner Logomere. Um biologische Zwischenschritte zu vermeiden, kann die
Vervielfältigung - wie erfindungsgemäß beschrieben - mit PCR vorgenommen werden. Sollte
eine Vervielfältigung durch Klonierung vorgenommen werden, so ist die Aufreinigung der
erhaltenen DNA aus Bakterien nötig. Sind die Logomere in bakteriellen Vektoren kloniert, so
ist ein gezielter Abbau dieser Resistenzgene (z. B. durch Restriktionsenzyme) Bestandteil
einer weiteren Aufarbeitung.
Logomere können zur Kennzeichnung eines Produktes unmittelbar mit diesem verbunden
werden. Sie können z. B. in flüssige Stoffe gemischt werden oder auf feste Stoffe aufgebracht
werden. Im Falle gentechnischer Erzeugnisse können die Logomere mithilfe von
Rekombinations- und Klonierungstechniken kovalent mit dem zu kennzeichnenden Produkt
verbunden werden.
Die Kennzeichnung von Stoffen und Produkten durch Logomere ermöglichen u. a. das
Monitoring von Produktionsprozessen, die Qualitätskontrolle, die Identifikation einzelner
Bestandteile und den quantitativen und qualitativen Nachweis von Kontaminationen.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Kennzeichnung
gentechnisch hergestellter oder veränderter Erzeugnisse:
Die hier beschriebenen Logomere können zur Kennzeichnung gentechnisch hergestellter oder veränderter Erzeugnisse verwendet werden.
Die hier beschriebenen Logomere können zur Kennzeichnung gentechnisch hergestellter oder veränderter Erzeugnisse verwendet werden.
Bisher werden insbesondere zur Identifikation gentechnisch hergestellter oder veränderter
Erzeugnisse in Nahrungsmitteln "klassische" melekularbiologische Methoden wie PCR,
Restriktionsverdau, Southernblot-Hybridisierung und Sequenzierung verwendet. Mit diesen
Methoden ist jedoch eine Charakterisierung gentechnischer Erzeugnisse und Bestandteile
noch sehr aufwendig und erfordert für jedes zu charakterisierende Erzeugnis eigene
Methoden und Verfahren.
Insgesamt gibt es bisher kein universelles Kennzeichnungsverfahren für gentechnisch
hergestellte Erzeugnisse. Ein solches Kennzeichnungsverfahren muß mehrere Kriterien
erfüllen:
- - die Kennzeichnung muß gesundheitlich absolut unbedenklich sein,
- - die Kennzeichnung sollte untrennbar mit dem gekennzeichneten Produkt verbunden sein,
- - die Kennzeichnung sollte fälschungssicher sein,
- - die Kennzeichnung sollte genügend Informationen speichern können,
- - die Kennzeichnung sollte in geringen Mengen nachweisbar und lesbar sein.
Der Einsatz nukleinsäurebasierter Logomere zur Kennzeichnung gentechnischer Erzeugnisse
erfüllt diese Kriterien und hat darüber hinaus folgende Vorzüge:
- - Logomere können nahezu beliebige Informationen speichern;
- - einzelne Bestandteile können schnell und hochempfindlich nachgewiesen werden;
- - zum Auslesen der Informationen kann eine bis ins Detail standardisierte Methode eingesetzt werden (Ausleseverfahren nach dem erfindungsgemäßen Verfahrens, dabei können standardisierte Primer verwendet werden);
- - die Sequenz der gesuchten Gene kann vollkommen unbekannt sein;
- - die Sequenz der nachgewiesenen Gene kann geheim sein, ohne daß die Identifizierung oder Authentifizierung eingeschränkt ist;
- - zusätzliche Sicherheitsmechanismen können zusätzlich durch Verschlüsselung implementiert werden.
Im Einzelnen geht man zur Kennzeichnung von gentechnisch erzeugten oder veränderten
Erzeugnissen beispielsweise folgendermaßen vor:
Zur Herstellung von Markern wird eine beliebige geeignete Grammatik, z. B. wie die für den Zufallszahlengenerator, das 1-Byte Alphabet oder für Zeichenketten bereits beschriebene, verwendet. Aus den mit der Grammatik erzeugten Zeichen werden die zur Darstellung von Markern benötigten Zeichen entnommen und dem zu kennzeichnenden Erzeugnis hinzugefügt. Dazu können die als Logomere hergestellten Zeichen auf folgende Weise in das zu kennzeichnende Erzeugnis eingebracht werden:
Zur Herstellung von Markern wird eine beliebige geeignete Grammatik, z. B. wie die für den Zufallszahlengenerator, das 1-Byte Alphabet oder für Zeichenketten bereits beschriebene, verwendet. Aus den mit der Grammatik erzeugten Zeichen werden die zur Darstellung von Markern benötigten Zeichen entnommen und dem zu kennzeichnenden Erzeugnis hinzugefügt. Dazu können die als Logomere hergestellten Zeichen auf folgende Weise in das zu kennzeichnende Erzeugnis eingebracht werden:
- a) durch Beimischung; hierbei werden Logomere, wie in den erfindungsgemäßen Verfahren beschrieben, hergestellt, isoliert und vervielfältigt.
- b) durch Klonierung, wie im erfindungsgemäßen Verfahren beschrieben; Abb. 6 zeigt z. B. die Kennzeichnung bakterieller Klone durch Logomere, die durch Verwendung der bereits beschriebenen Grammatik für den Zufallszahlengenerator hergestellt wurden.
- c) durch den Einsatz rekombinativer Techniken; hierbei werden Logomere erfindungsgemäß hergestellt, isoliert und vervielfältigt. Die solcherart gewonnenen Logomere werden jetzt durch den Einsatz rekombinativer Techniken in das zu kennzeichnende Erzeugnis eingebracht. Dazu kann z. B. die Methoden des Gene-Targeting durch homologe Rekombination [Capecchi M. R., Altering the genome by homologous recombination. Science, 244(4910), 1288-1292, (1989)] oder z. B. das Cre-loxP System [Kilby, N. J., Snaith, M. R. & Murray, J. A., Site-specific recombinases: tools for genome engineering, Trends Genet., 9, 413-421, (1993)] verwendet werden. Z. B. können erfindungsgemäß erhaltene Logomere mit Hilfe dieser Techniken vor oder hinter eine bestimmte Nukleinsäuresequenz (Gen) gesetzt werden, die sie bezeichnen sollen. In diesem Falle wird ein Logomer gewissermaßen als "Etikett" an ein gentechnisches Produkt "angeheftet" und kann Auskunft über Hersteller, Produktgruppe, Gefahrenklasse, Verfallsdatum o. ä. geben (siehe Abb. 15).
Das Verfahren eignet sich z. B. für alle Organismen (Mikroorganismen, Pflanzen, Tiere). Z. B.
lassen sich Klone von Mikroorganismen oder Pflanzen kennzeichnen. Das Verfahren eignet
sich z. B. auch für die Kennzeichnung von Rindern zur Bekämpfung der Rinderseuche BSE.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Kennzeichnung
von Nahrungsmitteln:
Aufgrund von Krankheiten, Seuchen oder Kontaminationen können Nahrungsmittel gesundheitsschädlich oder gefährlich sein. Beispiele sind Krankheiten wie BSE, Schweinepest, Salmonellenvergiftungen. Es kann wünschenswert sein, Produkt und Hersteller identifizieren zu können, um notfalls bestimmte Produkte und Produktreihen umgehend aus dem Handel zu nehmen, untersuchen zu können und geeignete Gegenmaßnahmen zu ergreifen.
Aufgrund von Krankheiten, Seuchen oder Kontaminationen können Nahrungsmittel gesundheitsschädlich oder gefährlich sein. Beispiele sind Krankheiten wie BSE, Schweinepest, Salmonellenvergiftungen. Es kann wünschenswert sein, Produkt und Hersteller identifizieren zu können, um notfalls bestimmte Produkte und Produktreihen umgehend aus dem Handel zu nehmen, untersuchen zu können und geeignete Gegenmaßnahmen zu ergreifen.
Für hochsensible Erzeugnisse wie Nahrungsmittel gelten dabei die Kriterien für die
Kennzeichnung gentechnischer Erzeugnisse insbesondere (siehe: Die oben beschriebenen
Verfahren ermöglichen beispielsweise die Kennzeichnung gentechnisch hergestellter oder
veränderter Erzeugnisse).
Insgesamt gibt es auch für gentechnisch hergestellte Nahrungsmittel bisher kein universelles
Kennzeichnungsverfahren. Bisher ist die Identifikation gentechnisch hergestellter oder
veränderter Bestandteile in Nahrungsmitteln daher roch schwierig und aufwendig. Es werden
dazu "klassische" molekularbiologische Methoden wie PCR, Restriktionsverdau, Southernblot-
Hybridisierung und Sequenzierung verwendet, um diese Erzeugnisse zu charakterisieren.
Aufgrund der Rinderseuche BSE wurde speziell für dlie Kennzeichnung von Rindern und deren
Produkten (Rindfleisch und Milch) ein immunologisches Kennzeichnungsverfahren
vorgeschlagen, das auf der Immunisierung der zu markierenden Tiere mit spezifischen
Proteinen basiert ("Ohrmarke im Blut soll BSE Rinder aufspüren", Süddeutsche Zeitung Nr.
283, 08.12.1998, Seite v2/9). Durch die dadurch verursachte Produktion spezifischer
Antikörper im jeweils gekennzeichneten Zieltier, die mutmaßlich in allen Geweben
nachzuweisen ist, kann die Kennzeichnung über einen Immun-Assay (ELISA) wieder gelesen
werden. Ein solches Verfahren ist jedoch prinzipiell auf höhere Wirbeltiere beschränkt.
Außerdem ist die für das Verfahren verfügbare Informationsmenge sehr begrenzt, die
informationstragenden Proteine sind nicht hitzebeständig und das Verfahren erfordert
vergleichsweise hohe Mengen Substanz für Immunisierung und Nachweisreaktion.
Auch im Fall von Nahrungsmitteln können Logomere auf Nukleinsäurebasis, wie bereits unter
"Die oben beschriebenen Verfahren ermöglichen beispielsweise die Kennzeichnung
gentechnisch hergestellter oder veränderter Erzeugnisse" beschrieben, zur Kennzeichnung
eingesetzt werden. Logomere können dabei Informationen über Hersteller, Verfallsdatum,
Seriennummer u. a. enthalten. Das Verfahren zur Kennzeichnung von Nahrungsmitteln ist
dabei dasselbe, wie bereits unter "Die oben beschriebenen Verfahren ermöglichen
beispielsweise die Kennzeichnung gentechnisch hergestellter oder veränderter Erzeugnisse"
beschrieben. Mithilfe der dort aufgeführten gentechnischen Rekombinations- und
Klonierungstechniken können einzelne Organismen gekennzeichnet werden, sodaß ein
einzelner Organismus sowie alle seine Nachfahren identifizierbar sind.
Das Kennzeichnungsverfahren durch Logomere ermöglicht dadurch:
- - ein Monitoring des Zielproduktes über den gesamten Herstellungs- und Verarbeitungsprozesses bis zum Endverbraucher,
- - eine einheitliche, schnelle und einfache Identifikation einzelner Bestandteile.
Als Beimischung eignen sich Logomere auf Nukleinsäurebasis zur Kennzeichnung von
Getränken.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Kennzeichnung
medizinischer und pharmazeutischer Produkte:
Aufgrund der Nichttoxizität eignen sich Logomere auf Nukleinsäurebasis zur Kennzeichnung sensibler und hochsensibler Erzeugnisse. Neben Nahrungsmitteln sind dies auch medizinische und pharmazeutische Produkte. Um Verwechselungen, Kontaminationen und Fälschungen ausschließen zu können, können Logomere z. B. medizinischen und pharmazeutischen Produkten beigemischt werden.
Aufgrund der Nichttoxizität eignen sich Logomere auf Nukleinsäurebasis zur Kennzeichnung sensibler und hochsensibler Erzeugnisse. Neben Nahrungsmitteln sind dies auch medizinische und pharmazeutische Produkte. Um Verwechselungen, Kontaminationen und Fälschungen ausschließen zu können, können Logomere z. B. medizinischen und pharmazeutischen Produkten beigemischt werden.
Der Vorteil der Kennzeichnung durch Logomere ist dabei, daß die Kennzeichnung unmittelbar
mit dem gekennzeichneten Erzeugnis verbunden ist und daß sich Erzeugnisse z. B. individuell
kennzeichnen lassen. Auf diese Weise ist ein Monitoring des Herstellungsprozesses möglich,
Erzeugnisse lassen sich auch nach mehrmaligem Umfüllen eindeutig identifizieren und
Kontaminationen sowie das Poolen von Proben können nachgewiesen werden. Mithilfe von
Logomeren läßt sich z. B. im Falle von Blutkonserven Herstellungs- und Verfallsdatum,
Blutgruppe und Hersteller kennzeichnen.
Die oben beschriebenen Verfahren ermöglichen beispielsweise Authentifizierung und
Fälschungssicherung:
Logomere können zur Authentifizierung von Erzeugnissen, Gegenständen und Geräten verwendet werden. Dazu werden Logomere vorzugsweise erfindungsgemäß erzeugt und vervielfältigt.
Logomere können zur Authentifizierung von Erzeugnissen, Gegenständen und Geräten verwendet werden. Dazu werden Logomere vorzugsweise erfindungsgemäß erzeugt und vervielfältigt.
Werden solcherart erhaltene Logomere auf Erzeugnisse, Gegenstände und Geräte an-/
aufgebracht oder zugemischt, so können die in Logomeren enthaltenen erfindungsgemäß
jederzeit wieder ausgelesen werden. Sollten zur Erzeugung der Logomere
Verschlüsselungstechniken verwendet werden, wie bereits beschrieben, so erfordert das
Auslesen autorisierten Zugriff.
Beispielsweise können erfindungsgemäß erhaltene Logomere in wässriger Lösung
(vorzugsweise zu 103 bis 1018 Molekülen/µl) unmittelbar zur Kennzeichnung auf Dokumente
aufgebracht werden. Als solches können sie als Echtheitszertifikat des solcherart markierten
Dokumentes dienen. Zum Auslesen der als Kennzeichner dienenden Logomere wird einfach
ein kleines Schnipsel des Papiers (1 mm2 ist ausreichend) als Template einer
erfindungsgemäßen PCR-Auslesereaktion verwendet. Ein Beispiel findet sich in Abb. 16.
In dem zugrundeliegenden Ausleseexperiment wurde zum Test des Prinzips ein Logomer in
wässriger Lösung in ca. 109 Molekülen/µl auf 3M Postlt Papier ca. 1 Stunde getrocknet und
1 mm2 des Post-lts als Template einer Auslese-PCR verwendet. Es können Dokumente
beliebiger Papierqualität verwendet werden, z. B. 80 g/m2 Standardkopierpapier.
Dasselbe Verfahren eignet sich auch zur Kennzeichnung von Geld oder Geldscheinen, wobei
hier Vorteile darin bestehen,
- - auch bereits gedruckte Scheine markieren zu können,
- - Seriennummern vergeben zu können,
- - Verschlüsselung einzusetzen.
Um Dokumente möglichst in Echtzeit auf Authentizität prüfen zu können, kann einer der zum
Auslesen in der PCR benutzten Primer auch als Hybridisierungsonde für eine nachfolgende
Färbe-Nachweisreaktion (z. B. mit einem interkalierenden Farbstoff, z. B. Ethidiumbromid)
verwendet werden.
Ein weiteres Beispiel ist die Authentifizierung flüssiger Lösungen, Suspensionen und
Emulsionen mit Logomeren. So kann etwa Tinte mit Logomeren individuell markiert werden,
so daß Unterschriften damit auf Echtheit überprüft werden können.
Ein weiteres Beispiel ist die Kennzeichnung von Automobilen durch das Versetzen des
Autolackes mit Logomeren. Dabei werden Logomere dem Autolack (oder anderen
Bestandteilen des KFZ) als Beimischung zugesetzt. Die zugesetzten Logomere können dabei
Informationen über Seriennummer, Hersteller, Fahrzeugtyp o. a. Angaben enthalten. Aufgrund
dieser Informationen kann im Falle von Unfall, Diebstahl oder illegaler Entsorgung ein
Fahrzeug identifiziert werden. Ein Vorteil der hier beschriebenen Methode liegt darin, daß
schon Lackspuren zur Identifikation des Fahrzeuges ausreichen, was insbesondere bei
Unfällen von Interesse sein kann. Ein weiterer Vorteil ist, daß die Identität eines Fahrzeuges
nur sehr aufwendig zu fälschen ist. Dazu müßten erstens alle gekennzeichneten Bestandteile
entfernt, zweitens eine gefälschte Identität eingerichtet werden. Dieses Unterfangen ist alleine
durch den mechanischen Aufwand sehr schwierig, außerdem läßt sich durch den Einsatz
kryptografischer Methoden das Nachmachen und Nachahmen von Kennungen beliebig
erschweren. Zum Auslesen der als Logomere enthaltenen Informationen, werden die
Logomere aus dem Lack isoliert und können dann wie in der Beschreibung zum Auslesen der
in Logomeren enthaltenen Information, vorzugsweise durch PCR, ausgelesen werden. Dazu
wird eine Probe des Lackes entnommen, mit einem geeigneten Lösungsmittel (Terpentin o. ä.)
gelöst und mit gleichem Volumen Wasser versetzt. Durch nachfolgende Zentrifugation werden
hydrophile und hydrophobe Bestandteile getrennt. Daraufhin nimmt man die wässrige Phase
auf (worin sich die hydrophilen nukleinsäurebasierten Logomere befinden) und fällt die
enthaltenen Logomere nach den üblichen Methoden (z. B. wie in [J. Sambrook, E. F. Fritsch,
T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben). Nach der Fällung
können die erhaltenen Logomere nach den erfindungsgemäßen Verfahren, z. B. durch
Auslese-PCR, ausgelesen werden.
Daher sind weitere Gegenstände der vorliegenden Erfindung die Verwendungen
informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen
informationstragenden Polymere, zum Zwecke der Qualitätssicherung, der
Fälschungssicherung, der Kennzeichnung von Lebensmitteln, der Kennzeichnung
gentechnischer, chemischer, medizinischer und pharmazeutischer Erzeugnisse, der
Kennzeichnung von Organismen, der Kennzeichnung von Dokumenten, der Kennzeichnung
von Geld, der Kennzeichnung von Gegenständen und Maschinen, der Kennzeichnung von
Lösungen, Suspensionen und Emulsionen sowie der Authentifizierung von Personen und
Gegenständen.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Herstellung von
Molekulargewichtsstandards:
Zu den typischen Verfahren der molekularbiologischen Analytik gehört die elektrophoretische Längenauftrennung von DNA- und RNA-Fragmenten. Um die Länge solcher Fragmenten bei der Elektrophorese zu bestimmen, verwendet man üblicherweise einen Molekulargewichtsstandard ("Leiter"), der Fragmente bekannter Länge enthält und zum Vergleich mit den Fragmenten der zu analysierenden Proben dient.
Zu den typischen Verfahren der molekularbiologischen Analytik gehört die elektrophoretische Längenauftrennung von DNA- und RNA-Fragmenten. Um die Länge solcher Fragmenten bei der Elektrophorese zu bestimmen, verwendet man üblicherweise einen Molekulargewichtsstandard ("Leiter"), der Fragmente bekannter Länge enthält und zum Vergleich mit den Fragmenten der zu analysierenden Proben dient.
Bisher gibt es Molekulargewichtsstandards, die entweder unregelmäßige Leitern enthalten
(z. B. Boehringer V, Boehringer Mannheim, Katalog Nr.: 821 705) oder regelmäßige Leitern mit
regelmäßigen Fragment-Längenabständen (z. B. 50 bp Leiter Gibco BRL, Life Technologies,
Katalog Nr. 10416-014). Keine der bisherigen Leitern hat dabei kürzere Längenabstände als
10 bp (z. B. 10 bp Leiter Gibco BRL, Life Technologies, Katalog Nr. 10821-015).
Mit den hier beschriebenen Verfahren können gezielt DNA Fragmente verschiedener Länge
und definierter Längenabstände hergestellt werden. Diese Fragmente können als
Molekulargewichtsstandards genutzt werden, wobei das Verfahren erlaubt, prinzipiell beliebige
Längen und beliebige Längenabstände zu realisieren. Insbesondere sind Längenabstände bis
hinab zu 1 bp Abstand, also Molekulargewichtsstandards höchster Auflösung, möglich.
Das Verfahren beruht darauf, Logomere als Template einer Auslese-PCR zu verwenden,
deren Resultat ein Gemisch von DNA Fragmenten definierter Länge und definierter
Längenabstände ist. Es basiert auf den bereits beschriebenen erfindungsgemäßen Verfahren
zur Erzeugung und dem Auslesen von Logomeren.
DNA Fragmente verschiedener Länge in sehr kurzen, regelmäßigen Abständen können
erhalten werden, wenn ein unäres Polymer als Template einer Auslese-PCR mit
verschachtelten Primern fungiert. Der 5'-Primer primt in der Start-Sequenz des Polymers. Als
gegenläufige 3' Primer fungiert eine Gruppe von Primern, die verschachtelt in dem Elongator
ansetzt (in Abb. 17 dargestellt als 3 Ebenen gegeneinander versetzter Primer). Da das
Polymer aus Wiederholungen nur eines Elongator-Moleküls besteht, erhält man für n
Wiederholungen und m verschachtelte 3' Primer n.m Banden. Das Verfahren funktioniert
auch spiegelbildlich mit einem im Ende-Terminator primenden Primer und dementsprechen
gegenläufigen 5' Primern. Die erhaltenen Banden können als Molekulargewichtsstandards
z. B. in Elektrophoresen eingesetzt werden.
Für hochauflösende Molekulargewichtsstandards ist die Verwendung unärer Logomere und
verschachtelter Primer am zweckmäßigsten. Jedoch ist das Verfahren nicht darauf
beschränkt, da im Prinzip alle im erfindungsgemäßen Schritt I beschriebenen Grammatiken
verwendet werden können.
Unäre Logomere beliebiger Länge können mit einer Grammatik G = (Σ, V, R, S) mit
Terminalalphabet Σ: = {0, s, e}, Variablenmenge V: = {A}, Startsymbol S und Regelmenge
R: =
{
S: = sA
A → aA
A → e
}
hergestellt werden. Sollte es nötig sein, unäre Logomere definierter Länge herzustellen, muß dementsprechend die Variablenmenge und damit auch die Zahl der Elongatoren größer gewählt werden (wie z. B. in der Grammatik zur Implementierung eines 1-Byte Alphabets bereits beschrieben). Je nach gewünschter Länge der zu erzeugenden DNA Fragmente kann außerdem die Länge der Algomere variiert werden.
R: =
{
S: = sA
A → aA
A → e
}
hergestellt werden. Sollte es nötig sein, unäre Logomere definierter Länge herzustellen, muß dementsprechend die Variablenmenge und damit auch die Zahl der Elongatoren größer gewählt werden (wie z. B. in der Grammatik zur Implementierung eines 1-Byte Alphabets bereits beschrieben). Je nach gewünschter Länge der zu erzeugenden DNA Fragmente kann außerdem die Länge der Algomere variiert werden.
Die so erzeugten Logomere können nach den erfindungsgemäßen Verfahren vereinzelt und
vervielfältigt werden.
Das Erzeugen von DNA-Fragmenten definierter Länge und definierter Längenabstände erfolgt
vorzugsweise mit PCR analog dem erfindungsgemäßen Verfahren zum Auslesen von
Logomeren. Für hochauflösende Molekulargewichtsstandards wird pro Elongator mindestens
ein Primer, meistens sogar eine Anzahl mehrerer Primer verwendet, die gegeneinander
verschoben sind. Die Anzahl der Primer pro Elongator ist abhängig von den gewünschten
Längenabständen. Ist etwa gewünscht, Algomere der Länge 30 bp zu verwenden und sollen
die Längen der erzeugten DNA Fragmente jeweils 10 bp Unterschied haben, so sind pro
Elongator drei Primer, die jeweils genau 10 bp gegeneinander verschoben sind, eingesetzt
werden.
Für die Synthese von Sequenzen zur Herstellung von Algomeren und Logomeren müssen die
Anforderungen erfüllt werden, die bereits unter Schritt II des erfindungsgemäßen Verfahrens
beschrieben wurden. Insbesondere gewährleistet das verwendete NFR-Verfahren dadurch,
daß die jeweils als Template dienenden Teilsequenzen einen gleichen GC-Anteil besitzen
können, den Einsatz verschachtelter Primer und die Ausgewogenheit des AT/GC
Verhältnisses der erzeugten DNA Fragmente. Letzteres ist insbesondere angesichts dessen
entscheidend, daß das Laufverhalten von DNA Fragmenten in der Elektrophorese nicht nur
von der Länge, sondern auch von der Zusammensetzung der Fragmente abhängt. Dies gilt
insbesondere für hochauflösende Molekulargewichtsstandards in denen es nur sehr geringe
Längenabstände gibt.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung
informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen
informationstragenden Polymere, zur Herstellung von Molekulargewichtsstandards.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Herstellung
polymerer Datenspeicher:
Die beschriebenen Logomere können als RAM (Lesen und Schreiben) und ROM (nur Lesen) Datenspeicher hoher Kapazität und niedrigen Energieverbrauchs genutzt werden. Um eine möglichst hohe Informationsdichte zu gewährleisten und die Handhabung des Speichers möglichst einfach zu machen, werden die Logomere an einen festen Träger gebunden. Dies gewährleistet, daß die Logomere einzeln adressiert, d. h. einzeln geschrieben, gelesen und gelöscht werden können (siehe Abb. 9).
Die beschriebenen Logomere können als RAM (Lesen und Schreiben) und ROM (nur Lesen) Datenspeicher hoher Kapazität und niedrigen Energieverbrauchs genutzt werden. Um eine möglichst hohe Informationsdichte zu gewährleisten und die Handhabung des Speichers möglichst einfach zu machen, werden die Logomere an einen festen Träger gebunden. Dies gewährleistet, daß die Logomere einzeln adressiert, d. h. einzeln geschrieben, gelesen und gelöscht werden können (siehe Abb. 9).
Die benötigten Schreib- und Leseoperationen werden auf der Basis der im
erfindungsgemäßen Schritt V und der unter Auslesen der in Logomeren enthaltenen
Information beschriebenen enzymatischen Reaktionen durchgeführt, die ihrerseits durch
Temperaturänderungen gesteuert werden. Die Temperaturänderungen können entweder per
Laser oder durch Erhitzen und Abkühlen des festen Trägers z. B. in einem Thermozykler
durchgeführt werden.
Zum Schreiben wird eine Modifikation des oben beschriebenen Verfahrens der
Symbolpolymerisation verwendet. Die Polymerisation findet an einem festen Träger statt, die
Algomere werden durch wiederholte Restriktions-Ligationszyklen miteinander verkettet.
Um einzelne, adressierbare Speicherzellen herzustellen, werden in bestimmten Abständen
einzelsträngige "Ankermoleküle" irreversibel (durch UV-Bestrahlung oder im Ofen) an den
Träger gebunden. Der solcherart mit Ankermolekülen versehene Träger kann nun reversibel
mit Logomeren beschrieben werden, die in einem Löschvorgang wieder davon entfernt
werden können.
Bei einem Schreibvorgang werden zuerst spezifische Algomere ("Starter-Algomere") durch
Hybridisierung an die Ankermoleküle gebunden. Diese Starter-Algomere sind ihrerseits
Ausgangspunkt einer Symbolpolymerisation, bei der weitere Algomere miteinander verkettet
werden. Die Verkettung der Algomere erfolgt dabei, abweichend von dem im Schritt V des
erfindungsgemäßen Verfahrens beschriebenen Vorgehen, durch wiederholte Zyklen von
Restriktion und Ligation. Bei jedem Zyklus wird das jeweils letzte Algomer einer
polymerisierenden Kette mit einem Restriktionsenzym geschnitten, so daß eine
einzelsträngige Überhangsequenz (Elongationspunkt) entsteht, an die seinerseits das
nächstfolgende Algomer durch Ligation gebunden werden kann.
Für den solcherart beschriebenen Schreibvorgang müssen die Algomere ein spezifisches
Design aufweisen:
- a) Jedes zu schreibende Algomer besitzt eine einzelsträngige Überhangsequenz, mit der es an den Elongationspunkt eines Logomers binden kann.
- b) Ein Algomer, das nur eine einzelsträngige Überhangsequenz besitzt mit der es an einen Elongationspunkt binden kann, selbst aber keine Restriktionsschnittstelle besitzt, durch die es von Restriktionsenzymen erkannt werden kann und damit nicht als Elongationspunkt dienen kann, heißt Ende-Algomer.
- c) Jedes zu schreibende Algomer, das nicht das Ende-Algomer ist, besitzt ein doppelsträngiges Ende, worin sich die Erkennungssequenz für das jeweils gewählte Restriktionsenzym befindet. Bei einer Restriktion spaltet das Enzym das Algomer, so daß eine einzelsträngige Überhangsequenz entsteht, die ihrerseits selbst wieder als Elongationspunkt dienen kann.
- d) Jedes fertige Logomer besitzt genau ein Starter- und ein Ende-Algomer. Starter- und Ende-Algomere sind, entsprechend der oben gegebenen Definition, Terminatoren.
- e) Die Überhangsequenzen der Algomere sind kompatibel zu einem jeweils gewählten Restriktionsenzym, so daß ein zu verkettendes Algomer an den Elongationspunkt eines Logomers binden kann und der nachfolgend durch Restriktion entstehende Elongationspunkt identisch zu seinem Vorläufer ist.
- f) Die im Algomer auf die Überhangsequenz folgende Sequenz ist solcherart gewählt, daß ein verkettetes Algomer durch einen nachfolgenden Restriktionsvorgang nicht wieder abgespalten werden kann.
Als fester Träger eignen sich Membranen wie Gene Screen Plus (DuPont, Biotechnology
Systems, Katalog Nr.: NEF-986 oder NEF-987), Hybond-N (Amersham Life Sciences, Katalog
Nr.: RPN 82N oder RPN 137 N), Silizium-, Silicat-Oberflächen oder Glas. Die Ankermoleküle
werden jeweils kovalent daran gebunden (UV-Bestrahlung oder Hitze).
Damit die Moleküle einzeln adressierbar sind, müssen sie in regelmäßigen Abständen auf
dem Träger angebracht werden.
Als Restriktionsenzyme eignen sich handelsübliche Enzyme, vorzugsweise solche, die nicht
bei 65°C deaktiviert werden (z. B. HindIII).
Die Schreiboperationen basieren darauf, daß die zum Schreiben verwendeten Enzyme
unterschiedliche Temperaturoptima haben. So liegt das Temperaturoptimum der zum
Verketten von Symbolen verwendeten Ligase bei 16°C, wohingegen die benötigten
Restriktionsenzyme nur bei 37°C funktionieren. Dadurch ist das getaktete Schreiben von
Symbolen in Zyklen von Restriktion und Ligation möglich.
Da alle Lese- und Schreiboperationen mithilfe von Enzymen durchgeführt werden, ist es nötig,
den Träger temperieren zu können. Dabei können, bei der Verwendung eines Thermozyklers
und thermomanipulierbaren Materials, alle Speicherzellen simultan derselben Operation
unterworfen werden. Alternativ können Speicherzelllen einzeln und unabhängig voneinander
zugegriffen werden, wenn ein entsprechend kleiner Schreib-/Lesekopf eingesetzt wird. Dieser
Schreib-/Lesekopf muß einerseits als Pipettiervorrichtung für die benötigten Moleküle
(Enzyme, Algomere) dienen und andererseits die für eine bestimmte Manipulation benötigte
Temperatur erzeugen (z. B. mit Hilfe eines Lasers).
Beim Löschvorgang wird ein Logomer durch Denaturierung vom jeweiligen Ankermolekül
gelöst. Das Ankermolekül steht danach wieder für einen Schreibvorgang zur Verfügung. Für
einen Lesevorgang wird ein Logomer durch Denaturierung von einem Ankermolekül gelöst.
Es kann dann nach den erfindungsgemäßen Verfahren ausgelesen werden.
Die beschriebenen Operationen Schreiben, Löschen, Lesen werden durch Enzyme bei
verschiedenen Temperaturen durchgeführt. Dabei können, bei der Verwendung eines
thermomanipulierbaren Materials, alle Speicherzellen simultan derselben Operation
unterworfen werden. Alternativ können Speicherzelllen einzeln und unabhängig voneinander
zugegriffen werden, wenn ein entsprechend kleiner Schreib-/Lesekopf eingesetzt wird. Dieser
Schreib-/Lesekopf muß einerseits als Pipettiervorrichtung dienen und andererseits die für eine
bestimmte Manipulation benötigte Temperatur erzeugen.
Der Vorteil des hier vorgestellten Polymerspeichers besteht gegenüber den bisher
verwendeten Materialien in einer höheren Speichendichte (DNA Moleküle haben eine Größe,
die bei 10-10 m liegt), und einem sehr viel geringeren Energieverbrauch (zur Berechnung der in
enzymatischen Reaktionen benötigten Energie siehe [L. M. Adleman, Molecular Computation
of Solutions to Combinatorial Problems, Science, 266, 1021-1024, (1994)]). Außerdem ergibt
sich eine erheblich verbesserte Umweltverträglichkeit, weil die hier beschriebenen Polymere
Biomoleküle ohne jegliche Toxizität sind.
Der hier beschriebene Ansatz hat gegenüber den bisher für das DNA Computing verwendeten
wässrigen Lösungen den Vorzug höherer Speichendichte und der Adressierbarkeit einzelner
Polymere.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein polymerer Datenspeicher,
umfassend erfindungsgemäße informationstragende Polymere, erfindungsgemäße Verfahren
zur Verknüpfung von Molekülen, erfindungsgemäße Ausleseverfahren oder
erfindungsgemäße Isolierungs- und Vervielfältigungsverfahren.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Herstellung eines
DNA Computers:
Mithilfe der bereits beschriebenen Informationsdarstellung durch Algomere und Logomere kann ein DNA Computer konstruiert werden. Der DNA Computer umfaßt (s. Abb. 10):
Mithilfe der bereits beschriebenen Informationsdarstellung durch Algomere und Logomere kann ein DNA Computer konstruiert werden. Der DNA Computer umfaßt (s. Abb. 10):
- a) Oligonukleotidsynthesizer
- b) Thermozykler
- c) Pipettiervorrichtung
- d) Vorrichtung zur Isolation von Polymeren
- e) Vorrichtung zur Auftrennung von Nukleinsäuren, z. B. Elektrophoresesystem
- f) Scanner
- g) Steuerungsrechner (Workstation, z. B. PC)
Der DNA Computer ist konstruiert als ein Hybridsystem, bei dem einfache, rechenintensive
Algorithmen oder die Speicherung von Daten mithilfe von DNA und den dazu benötigten
Geräten (Geräte a) bis e)) vorgenommen werden und ein herkömmlicher Computer
(vorzugsweise Workstation, z. B. PC) als Host und Steuerungsrechner dient.
Der DNA Computers beinhaltet mindestens einen Thermozykler, der als "Informationsreaktor"
dient und über den Steuerungsrechner gesteuert werden kann (z. B. MJ Research PTC-100,
Eppendorf Mastercycler). In den Tubes oder Mikrotiterplatten des Thermozyklers befinden
sich Molekülgemische aus Nukleinsäuren, Enzymean und weiteren chemischen Substanzen
(z. B. Puffer, Nukleotide), die für die Algomer-Assemblierung (Schritt IV des
erfindungsgemäßen Verfahrens) und die Symbolpolymerisation (Schritt V des
erfindungsgemäßen Verfahrens) benötigt werden. Programmiert wird der DNA Computer
durch die Implementierung von Algorithmen als Grammatiken (Schritt I des
erfindungsgemäßen Verfahrens). Die für dlie Grammatiken jeweils benötigten
Monomersequenzen werden durch das NFR-Verfahren und die Benutzung eines
Oligonukleotidsynthesizers (z. B. ABI 392, ABI 398, ABI 3948 von Perkin-Elmer Applied
Biosystems) hergestellt (Schritte II und III des erfindungsgemäßen Verfahrens). Diese
Monomersequenzen gehen als Input in den Thermozykler ein, in dem die Algomer-
Assemblierung (Schritt IV des erfindungsgemäßen Verfahrens) stattfindet.
Die so gewonnenen Algomere werden in eine oder mehrere Reaktionskammern des
Thermozyklers überführt, wo sie zu Logomeren verknüpft werden (Symbolpolymerisation,
Schritt V des erfindungsgemäßen Verfahrens). Die so gewonnen Logomere werden in einer
eigenen Vorrichtung isoliert und vervielfältigt. Diese Vorrichtung kann nach den Prinzipien
arbeiten, die in dem erfindungsgemäßen Verfahren beschrieben worden sind. Nach Isolierung
und Vervielfältigung können die Logomere gelesen werden. Dazu werden sie wiederum in
einem Thermozykler erfindungsgemäß ausgelesen. Die aus dem Ausleseverfahren
resultierenden Nukleinsäurefragmente können, wie bereits beschrieben, durch
Gelelektrophorese gelesen werden. Hier dient das Gelelektrophoresegerät als Ausgabegerät
des DNA Computers, die solcherart erhaltenen Bandenmuster werden von einem Scanner in
den Steuerungsrechner eingelesen.
Der Steuerungsrechner nimmt jetzt seinerseits aufgrund der solcherart erhaltenen Ergebnisse
weitere Berechnungen und Steuerungen vor und setzt ggfs. weitere molekulare Reaktionen in
Gang. Z. B. kann der Steuerungscomputer aufgrund erhaltener Ergebnisse die
Neuimplementierung von Grammatiken (Herstellung von Oligomeren mit dem NFR-
Verfahren) veranlassen. Auf diese Weise können die durch molekulare Verfahren als
Logomere erhaltenen Informationen nicht nur als passive Daten sondern auch als
Instruktionen (und Adressen) dienen. Dadurch ist ein sich selbst steuernder Prozeß
verschiedener Algorithmen möglich, der für eine universelle Datenverarbeitung nötig ist.
Der DNA Computer verarbeitet dabei Informationen als Oligo- und Polymere. Als
Speicherzellen der Daten dienen Klonierungsvektonen (Plasmide), die sich in flüssiger Lösung
oder auf einem festen, adressierbaren Träger befinden.
Der DNA Computer ist wie oben beschrieben mittels Grammatiken programmierbar und kann
von einem herkömmlichen Computer, der als Steuerungsrechner und Host-System fungiert,
gesteuert werden.
Da der DNA Computer bestimmte Operationen in molaren Größenordnungen (z. B. die
Symbolpolymerisation, wie in Schritt V des erfindungsgemäßen Verfahrens beschrieben, in
1012-1020 Elementaroperationen pro Sekunde) vornehmen kann, ist eine mögliche
Anwendung die Berechnung einfacher, rechenintensiver Algorithmen. Jedoch kann der DNA
Computer auch für andere Anwendungen, z. B. die Erzeugung bestimmter, regelmäßiger DNA
Strukturen, die z. B. innerhalb der Nanotechnologie interessant sind, verwendet werden.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein DNA-Computer, umfassend
erfindungsgemäße informationstragende Polymere. Ein weiterer Gegenstand der
vorliegenden Erfindung ist ein DNA-Computer, in dem ein erfindungsgemäßes
Ausleseverfahren und/oder erfindungsgemäße Isolierungs- und Vervielfältigungsverfahren
eingesetzt werden.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Herstellung
kleinster molekularer Strukturen mit Logomeren:
Mit den hier beschriebenen Logomeren lassen sich kleinste molekulare Strukturen (Nanostrukturen) herstellen. Bausteine solcher Strukturen sind Algomere, die zu regelmäßigen Mustern von Logomeren zusammengefügt werden können. Z. B. können verschiedene Algomere mit unterschiedlichen Fremdmolekülen (Liganden) dotiert werden, um regelmäßige, höhermolekulare Muster der jeweiligen Liganden zu erhalten. Die Logomere fungieren dabei als "Skelett" molekularer Baugruppen von Liganden.
Mit den hier beschriebenen Logomeren lassen sich kleinste molekulare Strukturen (Nanostrukturen) herstellen. Bausteine solcher Strukturen sind Algomere, die zu regelmäßigen Mustern von Logomeren zusammengefügt werden können. Z. B. können verschiedene Algomere mit unterschiedlichen Fremdmolekülen (Liganden) dotiert werden, um regelmäßige, höhermolekulare Muster der jeweiligen Liganden zu erhalten. Die Logomere fungieren dabei als "Skelett" molekularer Baugruppen von Liganden.
Z. B. könnte ein binäres Logomer alternierende Muster leitfähiger und nicht-leitfähiger
Liganden enthalten. Durch die Anordnung vieler Logomere auf einem festen Träger können
so Leiterbahnen im Nanometerbereich entstehen.
Als Liganden können aber auch Biomoleküle, Antikörper, optisch aktive Moleküle o.a.
verwendet werden.
Logomere können als "intelligenter" Klebstoff eingesetzt werden (siehe Abb. 18). Dabei
macht man sich die Hybridisierung komplementärer Nukleotide zunutze. Bringt man auf die zu
verklebenden Flächen Logomere auf, die etwa kovalent an die zu verklebenden Flächen
gebunden werden, so können ansonsten völlig identische Flächen nur dann verkleben, wenn
sie komplementäre Sequenzen aufweisen, da nur jeweils Flächen komplementärer
Nukleinsäuren Wasserstoffbrückenbindungen ausbilden. Die "Intelligenz" des Klebstoffes
besteht also in einer durch die jeweils verwendeten Sequenzen hochselektiven
Adhäsionswirkung. Dabei kann auch die Adhäsionsstärke für zu verklebende Flächen genau
eingestellt werden: Zum einen kann über die Dichte der Logomere auf den jeweiligen Flächen
deren Adhäsionsstärke eingestellt werden, zum anderen kann über das AT/GC Verhältnis der
Logomere deren Schmelzpunkt variiert werden, so daß verklebte Flächen bei
unterschiedlichen Temperaturen ihre Adhäsion verlieren. Aufgrund der Tatsache, daß hier
unschädliche, leicht abbaubare Biomoleküle als Klebstoff verwendet werden, können derartige
Klebstoffe auch zur medizinische Verwendung (z. B. Chirurgie, Mikrochirugie) eingesetzt
werden. Eine andere Verwendung ist die Nutzung des beschriebenen Verfahrens in
Hochpräzisions- und Authentifizierungsanwendungen.
Versetzt man die zur Herstellung von Logomeren verwendeten Algomeren mit Sequenzen zur
Bindung von Liganden, so können stärkere Adhäsionswirkungen erreicht werden. Solche
Liganden können im Falle von DNA DNA-bindenden Proteinen, z. B. spezifische, gegen DNA-
Sequenzen gerichtete Antikörper sein. Diese können z. B. jeweils über einen weiteren
Liganden untereinander verbunden werden (siehe Abb. 19). Eine einfache, nicht
programmierbare Adhäsionswirkung kann auch ohne Logomere erreicht werden, wenn die
verwendeten Proteine (z. B. Antikörper) ihrerseits an die zu verklebenden Flächen binden
können (wie z. B. Antikörper, wenn die zu verklebende Fläche ihr Antigen ist). Siehe dazu auch
Abb. 20. Einfachere Klebstoffe sind möglich, wenn, an bestimmte Flächen spezifisch
bindende, Proteine gentechnisch hergestellt werden.
Mit Logomeren können Oberflächen unterschiedlichster Struktur und unterschiedlichster
physikalischer Eigenschaften hergestellt werden. Den Anwendungen ist gemein, daß sich mit
den Logomeren nahezu beliebige Muster im Nanometerbereich bilden lassen, die das Skelett
kleinster molekularer Bauelemente sein können.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung
informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen
informationstragenden Polymere, zur Herstellung oder Bearbeitung kleinster molekularer
Strukturen oder als molekularer Kleber.
L. M. Adleman, Molecular Computation of Solutions to Combinatorial Problems, Science, 266,
1021-1024, (1994)
Breslauer, K. J., Frank, R., Blocker, H., Marky, L. A., Proc. Natl. Acad. Sci., 83, 3746-3750, 1989
Capecchi M. R., Altering the genome by homologous recombination. Science, 244(4910), 1288- 1292, (1989)
Chomsky, N., Three models for the description of language, JACM, 2 : 3, 113-124, (1956)
Chomsky, N., On certain formal properties of grammars, Inf. and Control, 2 : 2, 137-167, (1959)
Chomsky, N., Formal properties of grammars, Handbook of Math. Psych., 2, 323-418, (1963)
Frank Guarnieri, Makiko Fliss, Carter Bancroft, Making DNA Add, Science, 273, 220-223, (1996)
John E. Hopcroft, Formal Languages And Their Relation To Automata, (1969)
Jeffreys, Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-209, (1991)
Kilby, N. J., Snaith, M. R. & Murray, J. A., Site-specific recombinases: tools for genome engineering, Trends Genet., 9, 413-421, (1993)
Rolf Knippers, Molekulare Genetik, Georg Thieme Verlag, (1997)
Benjamin Lewin, Genes V, Oxford University Press, (1994)
Lund, A. H., Duch, M., Pedersen, F. S. Increased cloning efficency by temperature-cycle ligation, Nucleic Acids Research, 24: (4), 800-801, (1996)
J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)
Jens Niehaus, DNA Computing: Bewertung und Simulation, Diplomarbeit am Fachbereich Informatik der Universität Dortmund, Lehrstuhl XI, 116-123, (1998)
Qi Ouyang, Peter D. Kaplan, Shumao Liu, Albert Libchaber, DNA Solution of the Maximal Clique Problem, Science, 278, 446-449, (1997)
Erik Winfree, Xiaoping Yang, Nadrian C. Seeman, Universal Computation via Self-assembly of DNA: Some Theory and Experiments, Proceedings of the 2nd DIMACS Meeting on DNA Based Computers, Princeton University, June 20-12, (1996)
Erik Winfree, Furong Liu, Lisa A. Wenzler & Nadrian C. Seeman, Design and self-assembly of two-dimensional DNA crystals, Nature, 394, 539-544, (1998)
Breslauer, K. J., Frank, R., Blocker, H., Marky, L. A., Proc. Natl. Acad. Sci., 83, 3746-3750, 1989
Capecchi M. R., Altering the genome by homologous recombination. Science, 244(4910), 1288- 1292, (1989)
Chomsky, N., Three models for the description of language, JACM, 2 : 3, 113-124, (1956)
Chomsky, N., On certain formal properties of grammars, Inf. and Control, 2 : 2, 137-167, (1959)
Chomsky, N., Formal properties of grammars, Handbook of Math. Psych., 2, 323-418, (1963)
Frank Guarnieri, Makiko Fliss, Carter Bancroft, Making DNA Add, Science, 273, 220-223, (1996)
John E. Hopcroft, Formal Languages And Their Relation To Automata, (1969)
Jeffreys, Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-209, (1991)
Kilby, N. J., Snaith, M. R. & Murray, J. A., Site-specific recombinases: tools for genome engineering, Trends Genet., 9, 413-421, (1993)
Rolf Knippers, Molekulare Genetik, Georg Thieme Verlag, (1997)
Benjamin Lewin, Genes V, Oxford University Press, (1994)
Lund, A. H., Duch, M., Pedersen, F. S. Increased cloning efficency by temperature-cycle ligation, Nucleic Acids Research, 24: (4), 800-801, (1996)
J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)
Jens Niehaus, DNA Computing: Bewertung und Simulation, Diplomarbeit am Fachbereich Informatik der Universität Dortmund, Lehrstuhl XI, 116-123, (1998)
Qi Ouyang, Peter D. Kaplan, Shumao Liu, Albert Libchaber, DNA Solution of the Maximal Clique Problem, Science, 278, 446-449, (1997)
Erik Winfree, Xiaoping Yang, Nadrian C. Seeman, Universal Computation via Self-assembly of DNA: Some Theory and Experiments, Proceedings of the 2nd DIMACS Meeting on DNA Based Computers, Princeton University, June 20-12, (1996)
Erik Winfree, Furong Liu, Lisa A. Wenzler & Nadrian C. Seeman, Design and self-assembly of two-dimensional DNA crystals, Nature, 394, 539-544, (1998)
Claims (31)
1. Verfahren zur Herstellung von informationstragenden Polymeren, das umfaßt,
- A) eine reguläre Grammatik G = (Σ, V, R, S) mit einem endlichen Terminalalphabet Σ, einer endlichen Variablenmenge V, einer endlichen Regelmenge R und einem Startsymbol S zu definieren;
- B) das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) zur Herstellung von Monomersequenzen;
- C) mit dem NFR-Verfahren eine in Schritt I definierte Grammatik zu implementieren, indem damit Monomersequenzen hergestellt werden, die die Regelmenge R einer Grammatik G eindeutig darstellen;
- D) aus den in Schritt III hergestellten Monomersequenzen für jede Regel der Regelmenge R von G ein die Regel repräsentierendes Oligomer zusammenzusetzen;
- E) die in Schritt IV zusammengesetzten Oligomere zu informationstragenden Polymeren zu verknüpfen.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Terminalalphabet Σ einer
Grammatik G die Terminale 0, 1, n Startterminale s (s0, s1, . . ., sn) und m Endterminale e (e0,
e1, . . ., em), enthält, wobei n und m jeweils größer oder gleich 0 sind und eine natürliche Zahl
darstellen.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die in Schritt III
konstruierte Monomersequenz Nukleotide, insbesondere Ribonukleotide, besonders
bevorzugt Desoxyribonukleotide umfaßt.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die in Schritt III konstruierte
Monomersequenz Proteinerkennungssequenzen (z. B. Restriktionsschnittstellen,
Proteinbindungsstellen, Stopcodons) umfaßt.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß man
die Synthese der Monomersequenzen in Schritt II und III in vitro, vorzugsweise mittels eines
Oligonukleotid-Synthezisers vornimmt.
6. Verfahren zur Isolierung und Vervielfältigung von informationstragenden Polymeren, die
nach einem der vorhergehenden Ansprüche erhalten wurden, dadurch gekennzeichnet, daß
man in Schritt V erhaltene informationstragende Polymere in Klonierungsvektoren ligiert,
kompetente Zellen mit diesen Vektoren transformiert und die erfolgreich transformierten
Bakterien anhand von Selektionsmarkern selektioniert.
7. Verfahren zum Auslesen von Information aus informationstragenden Polymeren, die nach
einem der vorhergehenden Ansprüche erhalten oder isoliert und vervielfältigt wurden,
dadurch gekennzeichnet, daß man
- a) mindestens n-1 das informationstragende Polymer enthaltende Lösungen mit jeweils einem Paar gegenläufiger Primer versetzt, wobei n für die Zahl der als Elongatoren in dem Polymer enthaltenen Oligomere steht;
- b) mindestens n-1 PCR-Ansätze durchführt, wobei n für die Zahl der als Elongatoren in dem Polymer enthaltenen Oligomere steht und jeweils ein Primer eines jeden Paares in dem dem Elongator gegenüberliegenden Terminator primt und der andere Primer in dem Elongator selbst primt;
- c) die aus der PCR erhaltenen Polymer-Fragmente nach ihrer Länge durch Elektrophorese auftrennt und
- d) das aus der Elektrophorese erhaltene Muster optisch ausliest.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß das Auslesen in Schritt d)
automatisiert durch einen Scanner oder eine Sequenziermaschine erfolgt.
9. Informationstragendes Polymer, erhältlich nach einem der Ansprüche 1 bis 6.
10. Zufallszahlengenerator, umfassend informationstragende Polymere, insbesondere
Polymere nach Anspruch 9.
11. Polymerer Datenspeicher, umfassend informationstragende Polymere nach Anspruch 9.
12. DNA-Computer, umfassend informationstragende Polymere nach Anspruch 9.
13. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Herstellung von
Molekulargewichtsstandards.
14. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Darstellung von
Datenstrukturen.
15. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 als Marker oder Signaturen.
16. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Qualitätssicherung.
17. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Fälschungssicherung.
18. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Kennzeichnung gentechnischer Erzeugnisse.
19. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Kennzeichnung von Lebensmitteln.
20. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Kennzeichnung von Organismen.
21. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Kennzeichnung chemischer Erzeugnisse.
22. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Kennzeichnung medizinischer und pharmazeutischer
Erzeugnisse.
23. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Kennzeichnung von Dokumenten.
24. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Kennzeichnung von Geld.
25. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Kennzeichnung von Gegenständen und Maschinen.
26. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Kennzeichnung von Flüssigkeiten, Lösungen, Suspensionen
oder Emulsionen.
27. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zur Verschlüsselung von Information.
28. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach
Anspruch 9 zum Zwecke der Authentisierung von Personen und Gegenständen.
29. Verwendung von informationstragenden Polymeeren, insbesondere von Polymeren nach
Anspruch 9 als molekulare Kleber.
30. Verwendung von informationstragenden Polynneren nach Anspruch 9 zur Herstellung
oder Bearbeitung kleinster molekularer Strukturen.
31. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur
Qualitätskontrolle synthetisch hergestellter Oligonukleotide.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1999114808 DE19914808A1 (de) | 1999-03-31 | 1999-03-31 | Informationstragende Polymere |
JP2000609427A JP2002541539A (ja) | 1999-03-31 | 2000-03-31 | 情報伝達及び情報処理ポリマー |
PCT/EP2000/002893 WO2000059917A2 (de) | 1999-03-31 | 2000-03-31 | Informationstragende und informationsverarbeitende polymere |
EP00925150A EP1169330A2 (de) | 1999-03-31 | 2000-03-31 | Informationstragende und informationsverarbeitende polymere |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1999114808 DE19914808A1 (de) | 1999-03-31 | 1999-03-31 | Informationstragende Polymere |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19914808A1 true DE19914808A1 (de) | 2000-10-19 |
Family
ID=7903204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1999114808 Withdrawn DE19914808A1 (de) | 1999-03-31 | 1999-03-31 | Informationstragende Polymere |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP1169330A2 (de) |
JP (1) | JP2002541539A (de) |
DE (1) | DE19914808A1 (de) |
WO (1) | WO2000059917A2 (de) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10120349A1 (de) * | 2001-04-21 | 2002-10-31 | Michael Schwertner | Verfahren zur Erfassung molekularer Bindungsereignisse auf Affinitätssensoren |
DE10236034A1 (de) * | 2002-08-06 | 2004-02-19 | Hilmar Rauhe | Markierungssubstanz |
DE10260805A1 (de) * | 2002-12-23 | 2004-07-22 | Geneart Gmbh | Verfahren und Vorrichtung zum Optimieren einer Nucleotidsequenz zur Expression eines Proteins |
DE102008008193A1 (de) | 2008-02-08 | 2009-08-13 | Schaeffler Kg | Lager mit Markierung |
DE102009060836A1 (de) | 2009-12-29 | 2011-06-30 | 3mach GmbH, 72414 | Anschmutzung |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0103364D0 (en) * | 2001-02-10 | 2001-03-28 | Nat Inst Of Agricultural Botan | Storage of encoded information within biological macromolecules |
US20050053968A1 (en) * | 2003-03-31 | 2005-03-10 | Council Of Scientific And Industrial Research | Method for storing information in DNA |
JP2004329014A (ja) * | 2003-04-30 | 2004-11-25 | Id Technica:Kk | 偽造行為防止機能を備えた識別手段を付加する識別添加物質及び識別情報保持物並びに識別情報保持物の不正使用検出方法 |
JP4752041B2 (ja) * | 2004-02-12 | 2011-08-17 | 独立行政法人 国立印刷局 | 偽造防止用紙、該用紙の製造方法及び該用紙の識別方法 |
JP4619012B2 (ja) * | 2004-02-19 | 2011-01-26 | トヨタ自動車株式会社 | 三次元dnaネットワークの構築方法 |
JP2006094807A (ja) * | 2004-09-30 | 2006-04-13 | Nissan Motor Co Ltd | 情報化核酸担持微粒子及びその製造方法 |
JP2006094814A (ja) * | 2004-09-30 | 2006-04-13 | Nissan Motor Co Ltd | 情報化核酸及びこれを用いた情報化核酸組成物 |
JP2007237299A (ja) * | 2006-03-06 | 2007-09-20 | Osaka Industrial Promotion Organization | Dnaを用いた部品組付方法、部品組付基材、組付部品 |
JP5200069B2 (ja) * | 2010-07-27 | 2013-05-15 | トヨタ自動車株式会社 | 三次元dnaネットワーク |
WO2016149296A1 (en) * | 2015-03-17 | 2016-09-22 | Apdn (B.V.I.) Inc. | Method for authenticating active pharmaceutical ingredients |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5843661A (en) * | 1996-04-24 | 1998-12-01 | California Institute Of Technology | Method for construction universal DNA based molecular turing machine |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2649518B1 (fr) * | 1989-07-07 | 1991-10-18 | Bioprobe Systems Sa | Procede et dispositif de marquage crypte de haute securite pour la protection d'objets de valeur |
US6652808B1 (en) * | 1991-11-07 | 2003-11-25 | Nanotronics, Inc. | Methods for the electronic assembly and fabrication of devices |
US5804373A (en) * | 1995-03-31 | 1998-09-08 | Nec Research Institute, Inc. | Molecular automata utilizing single- or double-strand oligonucleotides |
WO1997024699A1 (en) * | 1995-12-29 | 1997-07-10 | S. E. Axis Limited | Authentication of articles |
EP0976060B1 (de) * | 1997-04-15 | 2001-12-19 | Gmd - Forschungszentrum Informationstechnik Gmbh | Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen |
-
1999
- 1999-03-31 DE DE1999114808 patent/DE19914808A1/de not_active Withdrawn
-
2000
- 2000-03-31 EP EP00925150A patent/EP1169330A2/de not_active Withdrawn
- 2000-03-31 JP JP2000609427A patent/JP2002541539A/ja active Pending
- 2000-03-31 WO PCT/EP2000/002893 patent/WO2000059917A2/de not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5843661A (en) * | 1996-04-24 | 1998-12-01 | California Institute Of Technology | Method for construction universal DNA based molecular turing machine |
Non-Patent Citations (1)
Title |
---|
Chem. Abstr. 125(1996)194609y * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10120349A1 (de) * | 2001-04-21 | 2002-10-31 | Michael Schwertner | Verfahren zur Erfassung molekularer Bindungsereignisse auf Affinitätssensoren |
DE10120349B4 (de) * | 2001-04-21 | 2004-10-28 | Michael Schwertner | Verfahren zur Erfassung molekularer Bindungsereignisse auf Affinitätssensoren |
DE10236034A1 (de) * | 2002-08-06 | 2004-02-19 | Hilmar Rauhe | Markierungssubstanz |
DE10260805A1 (de) * | 2002-12-23 | 2004-07-22 | Geneart Gmbh | Verfahren und Vorrichtung zum Optimieren einer Nucleotidsequenz zur Expression eines Proteins |
US8224578B2 (en) | 2002-12-23 | 2012-07-17 | Geneart Ag | Method and device for optimizing a nucleotide sequence for the purpose of expression of a protein |
DE102008008193A1 (de) | 2008-02-08 | 2009-08-13 | Schaeffler Kg | Lager mit Markierung |
DE102009060836A1 (de) | 2009-12-29 | 2011-06-30 | 3mach GmbH, 72414 | Anschmutzung |
WO2011079839A2 (de) | 2009-12-29 | 2011-07-07 | 3Mach Gmbh | Anschmutzung |
Also Published As
Publication number | Publication date |
---|---|
WO2000059917A2 (de) | 2000-10-12 |
WO2000059917A3 (de) | 2001-02-01 |
JP2002541539A (ja) | 2002-12-03 |
EP1169330A2 (de) | 2002-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19914808A1 (de) | Informationstragende Polymere | |
Chen et al. | Nanopore-based DNA hard drives for rewritable and secure data storage | |
Wang et al. | Paranemic crossover DNA: there and back again | |
Shapiro | Evolution: a view from the 21st century | |
Shapiro | How life changes itself: The Read–Write (RW) genome | |
Zahradka et al. | Reassembly of shattered chromosomes in Deinococcus radiodurans | |
CA2395874C (en) | Dna-based steganography | |
Kim et al. | Self-replication of DNA rings | |
CN109477130A (zh) | 通过迭代dna编辑的存储 | |
Zhu et al. | Image Encoding Using Multi‐Level DNA Barcodes with Nanopore Readout | |
Shapiro et al. | What prevents mainstream evolutionists teaching the whole truth about how genomes evolve? | |
Charles et al. | Design of abiological digital poly (phosphodiester) s | |
US7056724B2 (en) | Storing data encoded DNA in living organisms | |
Stoltzfus | Mutation, randomness, and evolution | |
CN107002069A (zh) | 环状dna的扩增方法 | |
US20230175078A1 (en) | Rna detection and transcription-dependent editing with reprogrammed tracrrnas | |
Gogolok et al. | STAR: a simple TAL effector assembly reaction using isothermal assembly | |
Patel | A molecular propeller | |
Park et al. | Emerging strategies in infohybrid systems | |
EP1865070A1 (de) | Verfahren zur Markierung von Produkten mit Nukleinsäuren für den Identitäts- und Herkunftsnachweis der Produkte | |
Jernigan et al. | Capillary electrophoresis single‐strand conformational polymorphisms as a method to differentiate algal species | |
Rauhe et al. | Digital DNA molecules | |
Holden et al. | Encrypted oligonucleotide arrays for molecular authentication | |
Danilevich et al. | New insight into formation of DNA-containing microparticles during PCR: the scaffolding role of magnesium pyrophosphate crystals | |
Danilevich et al. | The structural peculiarities of condensed DNA micro-and nanoparticles formed in PCR |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8127 | New person/name/address of the applicant |
Owner name: RAUHE, HILMAR, 50739 KOELN, DE |
|
8139 | Disposal/non-payment of the annual fee |