CN114787929A - 使用分子混合物的信息存储 - Google Patents
使用分子混合物的信息存储 Download PDFInfo
- Publication number
- CN114787929A CN114787929A CN202080067672.8A CN202080067672A CN114787929A CN 114787929 A CN114787929 A CN 114787929A CN 202080067672 A CN202080067672 A CN 202080067672A CN 114787929 A CN114787929 A CN 114787929A
- Authority
- CN
- China
- Prior art keywords
- molecule
- molecules
- readable medium
- machine
- substrate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title description 47
- 239000000203 mixture Substances 0.000 title description 38
- 238000000034 method Methods 0.000 claims abstract description 120
- 239000000758 substrate Substances 0.000 claims abstract description 69
- 229910052799 carbon Inorganic materials 0.000 claims description 766
- 108010038807 Oligopeptides Proteins 0.000 claims description 64
- 102000015636 Oligopeptides Human genes 0.000 claims description 64
- 239000002096 quantum dot Substances 0.000 claims description 45
- QWCKQJZIFLGMSD-UHFFFAOYSA-N alpha-aminobutyric acid Chemical compound CCC(N)C(O)=O QWCKQJZIFLGMSD-UHFFFAOYSA-N 0.000 claims description 38
- 230000000704 physical effect Effects 0.000 claims description 22
- 229920000642 polymer Polymers 0.000 claims description 19
- 239000004593 Epoxy Substances 0.000 claims description 8
- WUPHOULIZUERAE-UHFFFAOYSA-N 3-(oxolan-2-yl)propanoic acid Chemical compound OC(=O)CCC1CCCO1 WUPHOULIZUERAE-UHFFFAOYSA-N 0.000 claims description 7
- 229910052980 cadmium sulfide Inorganic materials 0.000 claims description 7
- PFNQVRZLDWYSCW-UHFFFAOYSA-N (fluoren-9-ylideneamino) n-naphthalen-1-ylcarbamate Chemical compound C12=CC=CC=C2C2=CC=CC=C2C1=NOC(=O)NC1=CC=CC2=CC=CC=C12 PFNQVRZLDWYSCW-UHFFFAOYSA-N 0.000 claims description 6
- 229910000673 Indium arsenide Inorganic materials 0.000 claims description 6
- GPXJNWSHGFTCBW-UHFFFAOYSA-N Indium phosphide Chemical compound [In]#P GPXJNWSHGFTCBW-UHFFFAOYSA-N 0.000 claims description 6
- JLATXDOZXBEBJX-UHFFFAOYSA-N cadmium(2+);selenium(2-);sulfide Chemical class [S-2].[Se-2].[Cd+2].[Cd+2] JLATXDOZXBEBJX-UHFFFAOYSA-N 0.000 claims description 6
- RPQDHPTXJYYUPQ-UHFFFAOYSA-N indium arsenide Chemical compound [In]#[As] RPQDHPTXJYYUPQ-UHFFFAOYSA-N 0.000 claims description 6
- MARUHZGHZWCEQU-UHFFFAOYSA-N 5-phenyl-2h-tetrazole Chemical compound C1=CC=CC=C1C1=NNN=N1 MARUHZGHZWCEQU-UHFFFAOYSA-N 0.000 claims description 5
- 108010016626 Dipeptides Proteins 0.000 claims description 5
- 239000005083 Zinc sulfide Substances 0.000 claims description 5
- KGTHTMORTMBFAJ-UHFFFAOYSA-N dizinc selenium(2-) sulfide Chemical class [S--].[Zn++].[Zn++].[Se--] KGTHTMORTMBFAJ-UHFFFAOYSA-N 0.000 claims description 5
- 229910052981 lead sulfide Inorganic materials 0.000 claims description 5
- 229940056932 lead sulfide Drugs 0.000 claims description 5
- GGYFMLJDMAMTAB-UHFFFAOYSA-N selanylidenelead Chemical compound [Pb]=[Se] GGYFMLJDMAMTAB-UHFFFAOYSA-N 0.000 claims description 5
- 229910052984 zinc sulfide Inorganic materials 0.000 claims description 5
- DRDVZXDWVBGGMH-UHFFFAOYSA-N zinc;sulfide Chemical compound [S-2].[Zn+2] DRDVZXDWVBGGMH-UHFFFAOYSA-N 0.000 claims description 5
- 150000001408 amides Chemical class 0.000 claims description 2
- 125000000218 acetic acid group Chemical group C(C)(=O)* 0.000 claims 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 3
- 150000001413 amino acids Chemical class 0.000 description 21
- 230000003287 optical effect Effects 0.000 description 20
- 108090000765 processed proteins & peptides Proteins 0.000 description 20
- 238000010586 diagram Methods 0.000 description 19
- 235000001014 amino acid Nutrition 0.000 description 16
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 239000000975 dye Substances 0.000 description 12
- -1 methylene, ethylene, propylene, butylene, pentylene Chemical group 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 12
- 239000000463 material Substances 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 239000000243 solution Substances 0.000 description 10
- 125000004432 carbon atom Chemical group C* 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 9
- 125000005842 heteroatom Chemical group 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 102000004196 processed proteins & peptides Human genes 0.000 description 9
- 239000002356 single layer Substances 0.000 description 9
- 125000000623 heterocyclic group Chemical group 0.000 description 8
- 239000007788 liquid Substances 0.000 description 8
- 125000000217 alkyl group Chemical group 0.000 description 7
- 125000002947 alkylene group Chemical group 0.000 description 7
- 125000003277 amino group Chemical group 0.000 description 7
- 125000003118 aryl group Chemical group 0.000 description 7
- 125000002619 bicyclic group Chemical group 0.000 description 7
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- 238000007641 inkjet printing Methods 0.000 description 6
- 238000004949 mass spectrometry Methods 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 5
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 5
- 125000002950 monocyclic group Chemical group 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 239000013545 self-assembled monolayer Substances 0.000 description 5
- 150000003384 small molecules Chemical class 0.000 description 5
- 239000011550 stock solution Substances 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 4
- 229910052736 halogen Inorganic materials 0.000 description 4
- 125000005439 maleimidyl group Chemical group C1(C=CC(N1*)=O)=O 0.000 description 4
- 238000007639 printing Methods 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 229920006395 saturated elastomer Polymers 0.000 description 4
- 239000002094 self assembled monolayer Substances 0.000 description 4
- 229910052717 sulfur Inorganic materials 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- XLEYFDVVXLMULC-UHFFFAOYSA-N 2',4',6'-trihydroxyacetophenone Chemical compound CC(=O)C1=C(O)C=C(O)C=C1O XLEYFDVVXLMULC-UHFFFAOYSA-N 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 125000001931 aliphatic group Chemical group 0.000 description 3
- 125000004452 carbocyclyl group Chemical group 0.000 description 3
- 238000000151 deposition Methods 0.000 description 3
- 238000003795 desorption Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 150000002367 halogens Chemical class 0.000 description 3
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 229920002521 macromolecule Polymers 0.000 description 3
- 238000001819 mass spectrum Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- 125000001147 pentyl group Chemical group C(CCCC)* 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 125000003367 polycyclic group Chemical group 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- YZCKVEUIGOORGS-OUBTZVSYSA-N Deuterium Chemical compound [2H] YZCKVEUIGOORGS-OUBTZVSYSA-N 0.000 description 2
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical compound C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 description 2
- MXNRLFUSFKVQSK-QMMMGPOBSA-O N(6),N(6),N(6)-trimethyl-L-lysine Chemical compound C[N+](C)(C)CCCC[C@H]([NH3+])C([O-])=O MXNRLFUSFKVQSK-QMMMGPOBSA-O 0.000 description 2
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- GLUUGHFHXGJENI-UHFFFAOYSA-N Piperazine Chemical compound C1CNCCN1 GLUUGHFHXGJENI-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 238000000026 X-ray photoelectron spectrum Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000008021 deposition Effects 0.000 description 2
- 229910052805 deuterium Inorganic materials 0.000 description 2
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical compound [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 125000003187 heptyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- JDPSFRXPDJVJMV-UHFFFAOYSA-N hexadecylphosphonic acid Chemical compound CCCCCCCCCCCCCCCCP(O)(O)=O JDPSFRXPDJVJMV-UHFFFAOYSA-N 0.000 description 2
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 125000001624 naphthyl group Chemical group 0.000 description 2
- 125000004433 nitrogen atom Chemical group N* 0.000 description 2
- 125000002347 octyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 229920000307 polymer substrate Polymers 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RRONHWAVOYADJL-HNNXBMFYSA-N (2s)-3-phenyl-2-(phenylmethoxycarbonylamino)propanoic acid Chemical compound C([C@@H](C(=O)O)NC(=O)OCC=1C=CC=CC=1)C1=CC=CC=C1 RRONHWAVOYADJL-HNNXBMFYSA-N 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 1
- VXNZUUAINFGPBY-UHFFFAOYSA-N 1-Butene Chemical group CCC=C VXNZUUAINFGPBY-UHFFFAOYSA-N 0.000 description 1
- YBYIRNPNPLQARY-UHFFFAOYSA-N 1H-indene Natural products C1=CC=C2CC=CC2=C1 YBYIRNPNPLQARY-UHFFFAOYSA-N 0.000 description 1
- VILCJCGEZXAXTO-UHFFFAOYSA-N 2,2,2-tetramine Chemical compound NCCNCCNCCN VILCJCGEZXAXTO-UHFFFAOYSA-N 0.000 description 1
- FZTIWOBQQYPTCJ-UHFFFAOYSA-N 4-[4-(4-carboxyphenyl)phenyl]benzoic acid Chemical compound C1=CC(C(=O)O)=CC=C1C1=CC=C(C=2C=CC(=CC=2)C(O)=O)C=C1 FZTIWOBQQYPTCJ-UHFFFAOYSA-N 0.000 description 1
- 229910001316 Ag alloy Inorganic materials 0.000 description 1
- 229910000763 AgInSbTe Inorganic materials 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- LCFVJGUPQDGYKZ-UHFFFAOYSA-N Bisphenol A diglycidyl ether Chemical compound C=1C=C(OCC2OC2)C=CC=1C(C)(C)C(C=C1)=CC=C1OCC1CO1 LCFVJGUPQDGYKZ-UHFFFAOYSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000007035 DNA breakage Effects 0.000 description 1
- SNRUBQQJIBEYMU-UHFFFAOYSA-N Dodecane Natural products CCCCCCCCCCCC SNRUBQQJIBEYMU-UHFFFAOYSA-N 0.000 description 1
- 101100377506 Drosophila melanogaster 14-3-3zeta gene Proteins 0.000 description 1
- 229910001218 Gallium arsenide Inorganic materials 0.000 description 1
- 229910000530 Gallium indium arsenide Inorganic materials 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 229910000846 In alloy Inorganic materials 0.000 description 1
- VQTUBCCKSQIDNK-UHFFFAOYSA-N Isobutene Chemical group CC(C)=C VQTUBCCKSQIDNK-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 238000006845 Michael addition reaction Methods 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 238000001237 Raman spectrum Methods 0.000 description 1
- 229910001245 Sb alloy Inorganic materials 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 229910001215 Te alloy Inorganic materials 0.000 description 1
- DHXVGJBLRPWPCS-UHFFFAOYSA-N Tetrahydropyran Chemical compound C1CCOCC1 DHXVGJBLRPWPCS-UHFFFAOYSA-N 0.000 description 1
- HATRDXDCPOXQJX-UHFFFAOYSA-N Thapsigargin Natural products CCCCCCCC(=O)OC1C(OC(O)C(=C/C)C)C(=C2C3OC(=O)C(C)(O)C3(O)C(CC(C)(OC(=O)C)C12)OC(=O)CCC)C HATRDXDCPOXQJX-UHFFFAOYSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- YZCKVEUIGOORGS-NJFSPNSNSA-N Tritium Chemical compound [3H] YZCKVEUIGOORGS-NJFSPNSNSA-N 0.000 description 1
- 101150110932 US19 gene Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 229910052946 acanthite Inorganic materials 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 125000005210 alkyl ammonium group Chemical group 0.000 description 1
- IYABWNGZIDDRAK-UHFFFAOYSA-N allene Chemical group C=C=C IYABWNGZIDDRAK-UHFFFAOYSA-N 0.000 description 1
- 239000000956 alloy Substances 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 125000002178 anthracenyl group Chemical group C1(=CC=CC2=CC3=CC=CC=C3C=C12)* 0.000 description 1
- WATWJIUSRGPENY-UHFFFAOYSA-N antimony atom Chemical compound [Sb] WATWJIUSRGPENY-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 150000004945 aromatic hydrocarbons Chemical class 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 125000003828 azulenyl group Chemical group 0.000 description 1
- QPLAKKKWUXRITA-UHFFFAOYSA-N benzoic acid;phenol Chemical class OC1=CC=CC=C1.OC(=O)C1=CC=CC=C1 QPLAKKKWUXRITA-UHFFFAOYSA-N 0.000 description 1
- 125000001584 benzyloxycarbonyl group Chemical group C(=O)(OCC1=CC=CC=C1)* 0.000 description 1
- 238000004061 bleaching Methods 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- UHYPYGJEEGLRJD-UHFFFAOYSA-N cadmium(2+);selenium(2-) Chemical compound [Se-2].[Cd+2] UHYPYGJEEGLRJD-UHFFFAOYSA-N 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- LCUOIYYHNRBAFS-UHFFFAOYSA-N copper;sulfanylideneindium Chemical compound [Cu].[In]=S LCUOIYYHNRBAFS-UHFFFAOYSA-N 0.000 description 1
- 239000011258 core-shell material Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 150000007973 cyanuric acids Chemical class 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 125000002704 decyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000000113 differential scanning calorimetry Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 150000002019 disulfides Chemical class 0.000 description 1
- 125000003438 dodecyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 239000003822 epoxy resin Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000005281 excited state Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 125000003983 fluorenyl group Chemical group C1(=CC=CC=2C3=CC=CC=C3CC12)* 0.000 description 1
- 238000002189 fluorescence spectrum Methods 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- ZHNUHDYFZUAESO-UHFFFAOYSA-N formamide Substances NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 125000004836 hexamethylene group Chemical group [H]C([H])([*:2])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[*:1] 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000007731 hot pressing Methods 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical group 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 125000003454 indenyl group Chemical group C1(C=CC2=CC=CC=C12)* 0.000 description 1
- APFVFJFRJDLVQX-UHFFFAOYSA-N indium atom Chemical compound [In] APFVFJFRJDLVQX-UHFFFAOYSA-N 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 230000005865 ionizing radiation Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 238000002898 library design Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052961 molybdenite Inorganic materials 0.000 description 1
- 229910052982 molybdenum disulfide Inorganic materials 0.000 description 1
- CWQXQMHSOZUFJS-UHFFFAOYSA-N molybdenum disulfide Chemical compound S=[Mo]=S CWQXQMHSOZUFJS-UHFFFAOYSA-N 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 239000002073 nanorod Substances 0.000 description 1
- 239000002135 nanosheet Substances 0.000 description 1
- 125000001400 nonyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- UYWQUFXKFGHYNT-UHFFFAOYSA-N phenylmethyl ester of formic acid Natural products O=COCC1=CC=CC=C1 UYWQUFXKFGHYNT-UHFFFAOYSA-N 0.000 description 1
- 238000002186 photoelectron spectrum Methods 0.000 description 1
- 238000005424 photoluminescence Methods 0.000 description 1
- 229920000647 polyepoxide Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 125000004805 propylene group Chemical group [H]C([H])([H])C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 125000006413 ring segment Chemical group 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 150000003376 silicon Chemical class 0.000 description 1
- 229940056910 silver sulfide Drugs 0.000 description 1
- XUARKZBEFFVFRG-UHFFFAOYSA-N silver sulfide Chemical compound [S-2].[Ag+].[Ag+] XUARKZBEFFVFRG-UHFFFAOYSA-N 0.000 description 1
- 238000007711 solidification Methods 0.000 description 1
- 230000008023 solidification Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- PORWMNRCUJJQNO-UHFFFAOYSA-N tellurium atom Chemical compound [Te] PORWMNRCUJJQNO-UHFFFAOYSA-N 0.000 description 1
- 150000003505 terpenes Chemical class 0.000 description 1
- 235000007586 terpenes Nutrition 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000001196 time-of-flight mass spectrum Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 229960001124 trientine Drugs 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 229910052722 tritium Inorganic materials 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 125000002948 undecyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 238000004876 x-ray fluorescence Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C13/00—Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
- G11C13/0002—Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
- G11C13/0009—RRAM elements whose operation depends upon chemical change
- G11C13/0014—RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
- G11C13/0019—RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising bio-molecules
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41M—PRINTING, DUPLICATING, MARKING, OR COPYING PROCESSES; COLOUR PRINTING
- B41M3/00—Printing processes to produce particular kinds of printed work, e.g. patterns
- B41M3/006—Patterns of chemical products used for a specific purpose, e.g. pesticides, perfumes, adhesive patterns; use of microencapsulated material; Printing on smoking articles
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Pest Control & Pesticides (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Optical Recording Or Reproduction (AREA)
Abstract
公开了一种机器可读介质及其读取和写入方法。所述机器可读介质包括其上具有可寻址位置阵列的基板。每个可寻址位置适合与k个分子的集合物理关联。k是0或者小于或等于n的整数。n是整数。每个集合中的所述分子选自n个明确可鉴定的分子的组。每个集合是所述n个分子的组中的k‑组合。每个集合与小于或等于n位的数值唯一地相关联。所述集合的存在指示所述数值。
Description
相关申请
本申请要求于2019年9月27日提交的美国临时申请号62/907,341的权益,其全部内容通过引用并入本文。下述申请的全部内容也通过引用并入本文:2018年9月28日提交的美国临时申请号62/738,792;2019年5月10日提交的美国临时申请号62/846,367;以及2019年9月27日提交的国际申请号PCT/US19/53521。
政府支持
本发明在由美国陆军授予的W911NF-18-2-0030的政府支持下完成。政府享有本发明的某些权利。
背景技术
尽管信息和信息技术无处不在,但其的无处不在也带来了新的问题。涉及信息存储(而不是计算)的三个方面包括能源的使用、长时间存储信息的稳健性以及抵御黑客攻击破坏的能力。使用现有存储方法解决这些问题的困难激发了人们对通过根本不同策略获得的可能性的兴趣,包括将信息存储在分子中。
从用墨水在纸上印刷到非常复杂的电子、光学和磁性方法,各种技术都用于存储信息。重要性(跨越一系列参数:成本、空间、能量使用、读和写的速率、存储的降级速率、通过黑客攻击破坏的可能性、用于读的协议和硬件的独立性)使得这些方法中的每一种除了其优势之外还具有弱点,并且仍然需要评价可能的备选方案。新的信息存储方法将规避现有技术的一些弱点,并可能开启新应用。
发明内容
在一个实例性实施方式中,本发明是一种机器可读介质,其包括其上具有可寻址位置阵列的基板,每个可寻址位置适合与k个分子的集合物理关联,其中k是0或者小于或等于n的整数,其中n是整数,其中每个集合中的所述分子选自n个明确可鉴定的分子的组,其中每个集合是所述n个分子的组中的k-组合,每个集合与小于或等于n位的数值唯一地相关联,其中所述集合的存在指示所述数值。
在另一个示例性实施方式中,本发明是一种向机器可读介质写入数据的方法,所述方法包括接收具有小于或等于n位的数值,其中n是整数;接收数值与k个分子的集合之间的一对一关联,其中k是0或者小于或等于n的整数,其中所述集合是所述n个分子的组中的k-组合;根据所述一对一关联确定对应于所述数值的所述集合;将所述集合的所述分子与所述机器可读介质的基板在其上的可寻址位置处物理关联。
在另一个示例性实施方式中,本发明是一种从机器可读介质读取数据的方法,所述方法包括接收数值与k个分子的集合之间的一对一关联,其中k是0或者小于或等于n的整数,其中n是整数,其中所述集合是所述n个分子的组中的k-组合;确定与所述机器可读介质的基板在其可寻址位置处物理关联的所述分子的集合;和根据所述一对一关联从所述分子的集合确定数值。
本发明有利地提供信息的存档、长期存储,其是防篡改的并且不需要或需要低能量存储设备。本文描述的发明能够长期(超过100年)、无电源、WORM(一次写入多次读取)存储信息,这对于当前可用的电子、磁性或光学存储介质而言是不可能的。可以对其进行设计,以实现有用的写入和读取速率,用于存档目的和产品标签(认证、条形码)。其他使用序列依赖性聚合分子(例如,DNA)的分子方法要慢很多数量级。
附图说明
如附图中所示,从以下对本发明示例性实施例的更具体的描述,前述内容将变得显而易见,在附图中,相同的附图标记在不同视图中指代相同的部分。附图不一定按比例绘制,而是强调说明本发明的实施方式。
图1提供了总结使用根据本发明示例性实施方式的多肽编码字母“K”的策略的表格。
图2提供了总结根据本发明示例性实施方式的足以在单个混合物中编码四个字节的寡肽的完整赋值,以及将其赋值给二进制分子表示。
图3(A)是根据本发明示例性实施方式的寡肽分子字节的图示,所述寡肽包含不同区域。
图3(B)是显示根据本发明示例性实施方式的两个固化的寡肽的实例的示意图。
图3(C)显示了根据本发明示例性实施方式的包含由多肽编码的32个分子字节的SAMDI点的光谱。、
图4是可用于使用本文所述的32个肽的组合作为本发明的示例性实施方式来“写入”、“存储”和“读取”文本的过程的示意图。
图5是显示根据本公开的实施方式的用于使用量子点写入数字信息的模式生成方案的流程图。
图6A是由根据本公开的实施方式的编码方案生成的示例性图案的图像。
图6B是图6A的印刷图案的数字图像。
图7是根据本公开的实施方式的示例性读取的示意图。
图8A-H是根据本公开的实施方式的八种染料编码信息中的每种染料图案的数字图像。
图9是根据本公开的实施方式的示例性印刷图案的时间序列图像。
图10是根据本公开的实施方式在已沉淀多种染料之后提供的示例性图案的数字图像。
图11是显示根据本公开的实施方式的示例性稀疏编码的表格。
图12是显示根据本公开的实施方式写入数据的方法的流程图。
图13是显示根据本公开的实施方式读取数据的方法的流程图。
图14是显示根据本公开的实施方式写入数据的方法的流程图。
图15是显示根据本公开的实施方式读取数据的方法的流程图。
图16是根据本公开的实施方式的计算节点的示意图。
本发明的具体实施方式
以下是本发明的示例性实施方式的描述。
本发明解决了以下困难:降低用于信息存储的能量使用,长时间提高所存储信息的稳健性,以及所存储信息包括在分子中存储的信息抵抗黑客攻击破坏的能力。本文公开了可以将信息存储在容易获得的稳定分子的混合物中的装置和方法。所公开的方法使用常见的小的分子组(也称为文库)(在一个示例性实施方式中,为8至32个寡肽的文库,在另一个示例性实施方式中,为分子量例如小于或等于约1,500Da的小分子文库)来写入信息(在一个示例性实施方式中,二进制信息)。所公开的方法使合成新分子的时间和难度最小化。其还规避了在线性序列依赖性大分子(例如,DNA)中编码和读取信息的挑战。在一个示例性实施方式中,总共大约400千比特(文本和图像)被编码、写入、存储和读取为分子的混合物,具有大于99%的信息恢复,以8比特/秒的平均速率写入,并且以20比特/秒的速率读取。
在第一个示例性实施方式中,本发明是一种机器可读介质,其包括:其上具有可寻址位置阵列的基板,每个可寻址位置适合与非聚合分子的集合物理关联,其中每个集合中的所述分子选自明确可鉴定的分子的组,每个分子与数值中的预测位置唯一地相关联,其中在所述集合中所述分子的存在指示在所述关联位置处的预定数字,并且在所述集合中不存在所述分子指示在所述关联位置处为零。
本领域普通技术人员将理解的是,在替代实施方式中,分子的存在可以指示在关联位置处的零,而分子的不存在可以指示预定的非零数字。
在第二个示例性实施方式中,本发明是一种机器可读介质,其包括:其上具有可寻址位置阵列的基板,每个可寻址位置适合与分子的集合物理关联,其中所述集合中的每个分子都是不依赖于序列的聚合物,并且其中每个集合中的所述分子选自明确可鉴定的分子的组,每个分子与数值中的预测位置唯一地相关联,其中在所述集合中所述分子的存在指示在所述关联位置处的预定数字,并且在所述集合中不存在所述分子指示在所述关联位置处为零。
本领域普通技术人员将理解的是,在替代实施方式中,分子的存在可以指示在关联位置处的零,而分子的不存在可以指示预定的非零数字。
定义
用于定义肽的命名法是本领域中通常使用的命名法,其中N末端的氨基出现在左侧,C末端的羧基出现在右侧。
术语“氨基酸”包括天然存在的氨基酸和非天然存在的氨基酸两者。除非另有说明,否则术语“氨基酸”包括分离的氨基酸分子(即,同时包括氨基连接的氢和羰基碳连接的羟基的分子)和氨基酸残基(即,其中一个或两个氨基连接的氢或羰基碳连接的羟基都被去除)。氨基可以是α-氨基、β-氨基等。例如,术语“氨基酸丙氨酸”可以指分离的丙氨酸H-Ala-OH,或者指任一个丙氨酸残基H-Ala-、-Ala OH或-Ala-。除非另有说明,否则在本文所述的化合物中存在的所有氨基酸都可以是D构型或L构型。术语“氨基酸”包括其盐。任何氨基酸都可以是保护的或未保护的。保护基团可以附接到氨基(例如α-氨基)、骨架羧基或者侧链的任何官能团上。例如,由α-氨基上的苄氧羰基(Z)保护的苯丙氨酸将表示为Z-Phe-OH。
如本文所用,术语“寡肽”指通过至少一个酰胺键(即,一个氨基酸的氨基与选自肽片段氨基酸的另一个氨基酸的羧基之间的键)共价连接的两个或更多个氨基酸。
如本文所用,“物理关联”指位于或包含在某个位置中。分子可以通过连接(即,共价或非共价键合)到基板而与基板物理关联,或者化学/物理吸附到基板,或者存在于包含在基板上可寻址位置内的溶液中,如在多孔板的孔中。
如本文所用,术语“连接”指共价或非共价键合。
如本文所用,术语“不依赖于序列的聚合物”指如本文所定义的明确可鉴定的聚合物,并且其中此类聚合物的单体残基的顺序排列不影响明确可鉴定的性质。术语“不依赖于序列的聚合物”包括包含作为不依赖于序列的聚合物的部分的分子。
如本文所用,当涉及分子时,术语“明确可鉴定的”指在包含该分子的集合中是唯一可鉴定的。
如本文所用,“物理性质”是指可读取的输出,通过该输出可以使用物理化学技术鉴定分子的集合中的每个分子。可读输出的实例包括光谱信号(例如,质谱,核磁共振(NMR),拉曼光谱,荧光光谱,吸收光谱(紫外(UV)、可见、近红外(NIR)、红外(IR)),X射线光电子光谱(XPS),UV光电子光谱(UPS),X射线荧光(XRF)光谱),相变(例如挥发性)检测,和影响电泳或色谱迁移率的性质(挥发性、极性、质量、分配系数、疏水性、分子大小、离子配对、电化学电势(例如溶液pH和电荷)、分子结构和局部偶极矩),以及差示扫描量热法和声学方法。
如本文所用,“酰胺”或“酰胺键”指由结构式–NR*-C(O)-表示的二价部分,其中R*是氢或如上文所定义的烷基。
示例性实施方式
在第一个和第二个示例性实施方式的第一个方面中,明确可鉴定的分子的组中的每个分子都与一个二进制数字相关联。
在第一个和第二个示例性实施方式的第二个方面中,所述数值具有基数(radix)和预定数量的位置。例如,所述数值是具有预定数量的N个位的二进制值。例如,数字N可以是32。在第一个和第二个示例性实施方式的第三个方面的一个实例中,每个集合编码位串,如ASCII值。
在另一个实例中,基数是八,将其称为八进制。在另一个实例中,基数是十,将其称为十进制。在另一个实例中,基数是十二,将其称为十二进制。在另一个实例中,基数是十六,将其称为十六进制。在另一个实例中,基数是二十,将其称为二十进制。在另一个实例中,基数是六十,将其称为六十进制。应当理解的是,本公开适用于数值中的任何基数和任何数量的位置。
在第一个和第二个示例性实施方式的第三个方面中,所述组中的每个分子通过物理性质可鉴定。
在第一个和第二个示例性实施方式的第四个方面的示例性实施方式中,物理性质是质荷比。
在第一个和第二个示例性实施方式的第四个方面中,所述集合中的每个分子在各自的可寻址位置处与基板连接。
在第一个示例性实施方式的第一个方面中,每个非聚合分子是小分子。
在第二个示例性实施方式的第五个方面中,所述组中的每个分子是聚合物或低聚物。例如,每个分子都是寡肽。例如,每个分子在其C末端包含Nε,Nε,Nε-三甲基赖氨酸-半胱氨酸(K(Me3)C)二肽。
在第二个示例性实施方式的第六个方面中,所述数值是具有32位的二进制值;以及所述分子的组包含由以下氨基酸序列表示的所述寡肽:Ac-AK(me3)C、Ac-(abu)K(me3)C、Ac-VK(me3)C、Ac-GGK(me3)C、Ac-GVK(me3)C、Ac-GLK(me3)C、Ac-ALK(me3)C、Ac-GFK(me3)C、Ac-GVGK(me3)C、Ac-GLGK(me3)C、Ac-GAGGK(me3)C、Ac-GL(abu)K(me3)C、Ac-GFGK(me3)C、Ac-GRGK(me3)C、Ac-GPAGK(me3)C、Ac-AYGK(me3)C、Ac-GPFK(me3)C、Ac-GVVGK(me3)C、Ac-G(abu)FGK(me3)C、Ac-GVFGK(me3)C、Ac-GVYGK(me3)C、Ac-GARGGK(me3)C、Ac-GAVV(abu)K(me3)C、Ac-GFYGK(me3)C、Ac-GYYGK(me3)C、Ac-GYYAK(me3)C、Ac-GPYFK(me3)C、Ac-GRGFGK(me3)C、Ac-GYFGGK(me3)C、Ac-GYYGGK(me3)C、Ac-AYYGGK(me3)C和Ac-GYY(abu)GK(me3)C,其中每个Ac是乙酰基和每个Abu是2-氨基丁酸。
在第三个示例性实施方式中,本发明提供了一种向机器可读介质写入数据的方法。所述方法包括接收包括多个位的二进制值,每个位具有一个位置;接收多个位位置和明确可鉴定的分子的组之间的一对一关联;确定对应于二进制值的分子的集合,其中确定所述集合包括:在所述集合中包括与其中位具有值1的每个位置相关联的分子;并省略与其中位具有值0的每个位置相关联的分子;将所述集合的分子与机器可读介质的基板在其上的可寻址位置处物理关联。本领域普通技术人员将理解的是,在替代实施方式中,如果位值是1,则省略该分子;如果位值是0,则包括该分子。
在第四个示例性实施方式中,本发明是一种从机器可读介质读取数据的方法。所述方法包括接收多个位位置中的每一个与明确可鉴定的分子的组之间的一对一关联;确定在其上的可寻址位置处与机器可读介质的基板物理关联的分子的集合;从分子的集合中确定二进制值,其中确定所述二进制值包括:将二进制值中与其相关联的分子存在于集合中的位置处的位设置为1,并且将在该集合中的位置处的每个位设置为0,其中其关联分子不存在于所述集合中。本领域普通技术人员将理解的是,在替代实施方式中,如果位值是1则省略该分子,如果位值是0则包括该分子。
在第五个示例性实施方式中,本发明是一种向机器可读介质写入数据的方法。所述方法包括接收包括多个数字的数值,每个数字具有一个位置;接收多个数字/位置对和明确可鉴定的分子的组之间的一对一关联;确定对应于数值的分子的集合,其中确定所述集合包括:在所述集合中包括与在数值中具有相关的数字的每个位置相关联的分子;将所述集合的分子与机器可读介质的基板在其上的可寻址位置处物理关联。本领域普通技术人员将理解的是,在替代实施方式中,如果位值是1则省略该分子,如果位值是0则包括该分子。
在第六个示例性实施方式中,本发明是一种从机器可读介质读取数据的方法。所述方法包括接收多个数字/位置对和明确可鉴定的分子的组之间的一对一关联;确定在其上的可寻址位置处与机器可读介质的基板物理关联的分子的集合;从分子的集合中确定数值,其中确定所述数值包括:将数值的每个位置设置为其关联分子存在于集合中的数字。本领域普通技术人员将理解的是,在替代实施方式中,如果位值是1,则省略该分子;如果位值是0,则包括该分子。
在第三个至第六个示例性实施方式的第一个方面中,接收关联包括读取查找表。
在第三个至第六个示例性实施方式的第二个方面中,数值是具有预定位数N的二进制值。例如,数字N可以是32。
在第三个至第六个示例性实施方式的第三个方面中,每个集合编码位串。位串可以编码例如ASCII值。
在第三个至第六个示例性实施方式的第四个方面中,所述组中的每个分子通过物理性质可鉴定。例如,所述集合中的每个分子通过质荷比鉴定。
在第三个至第六个示例性实施方式的第五个方面中,所述集合中的每个分子在各自的可寻址位置处与基板连接。
在第四个或第六个示例性实施方式的第六个方面中,确定所述分子的集合包括确定所述集合中所述分子的物理性质。
在第四个或第六个示例性实施方式的第七个方面中,确定所述分子的集合包括确定所述集合中所述分子的质荷比。
在第三个至第六个示例性实施方式的一个方面中,所述数值是具有32位的二进制值;以及所述分子的组包含由以下氨基酸序列表示的所述寡肽:Ac-AK(me3)C、Ac-(abu)K(me3)C、Ac-VK(me3)C、Ac-GGK(me3)C、Ac-GVK(me3)C、Ac-GLK(me3)C、Ac-ALK(me3)C、Ac-GFK(me3)C、Ac-GVGK(me3)C、Ac-GLGK(me3)C、Ac-GAGGK(me3)C、Ac-GL(abu)K(me3)C、Ac-GFGK(me3)C、Ac-GRGK(me3)C、Ac-GPAGK(me3)C、Ac-AYGK(me3)C、Ac-GPFK(me3)C、Ac-GVVGK(me3)C、Ac-G(abu)FGK(me3)C、Ac-GVFGK(me3)C、Ac-GVYGK(me3)C、Ac-GARGGK(me3)C、Ac-GAVV(abu)K(me3)C、Ac-GFYGK(me3)C、Ac-GYYGK(me3)C、Ac-GYYAK(me3)C、Ac-GPYFK(me3)C、Ac-GRGFGK(me3)C、Ac-GYFGGK(me3)C、Ac-GYYGGK(me3)C、Ac-AYYGGK(me3)C和Ac-GYY(abu)GK(me3)C,其中每个Ac是乙酰基和每个Abu是2-氨基丁酸。
在第七个示例性实施方式中,本发明是一种机器可读介质,其包括其上具有可寻址位置阵列的基板,每个可寻址位置适合与k个分子的集合物理关联,其中k是0或者小于或等于n的整数,其中n是整数,其中每个集合中的所述分子选自n个明确可鉴定的分子的组,其中每个集合是所述n个分子的组中的k-组合,每个集合与小于或等于n位的数值唯一地相关联,其中所述集合的存在指示所述数值。
在第八个示例性实施方式中,本发明是一种向机器可读介质写入数据的方法,所述方法包括接收具有小于或等于n位的数值,其中n是整数;接收数值与k个分子的集合之间的一对一关联,其中k是0或者小于或等于n的整数,其中所述集合是所述n个分子的组中的k-组合;根据所述一对一关联确定对应于所述数值的所述集合;将所述集合的所述分子与所述机器可读介质的基板在其上的可寻址位置处物理关联。
在第九个示例性实施方式中,本发明是一种从机器可读介质读取数据的方法,所述方法包括接收数值与k个分子的集合之间的一对一关联,其中k是0或者小于或等于n的整数,其中n是整数,其中所述集合是所述n个分子的组中的k-组合;确定与所述机器可读介质的基板在其可寻址位置处物理关联的所述分子的集合;和根据所述一对一关联从所述分子的集合确定数值。
在第七个和第九个示例性实施方式的第一个方面中,所述集合中的每个分子在各自的可寻址位置处与基板连接。
在第八个示例性实施方式的第二个方面中,将所述集合的所述分子与基板物理关联的步骤包括,针对所述集合中的每个分子,将所述分子与所述基板连接。
在第九个实施方式的第三个方面中,确定与基板物理关联的所述分子的集合的步骤包括,对于每个物理位置,同时确定所述物理位置处至少两个分子的物理性质,从而鉴定所述分子。
在第九个实施方式的第四个方面中,同时确定所述集合中至少两个分子的物理性质的步骤包括,对于每个分子,确定其相应的荧光发射波长。
在第七个、第八个和第九个示例性实施方式的第五个方面中,数值是二进制。
在第七个、第八个和第九个示例性实施方式的第六个方面中,n=32。
在第七个、第八个和第九个示例性实施方式的第七个方面中,数值编码ASCII值。
在第七个、第八个和第九个示例性实施方式的第八个方面中,所述组中的每个分子通过物理性质可鉴定。
在第七个、第八个和第九个示例性实施方式的第九个方面中,物理性质是荧光发射波长。
在第七个、第八个和第九个示例性实施方式的第十个方面中,所述集合中的每个分子是量子点。
在第七个、第八个和第九个示例性实施方式的第十一个方面中,所述组中的至少一个分子包含硒化镉-硫化镉量子点。
在第七个、第八个和第九个示例性实施方式的第十二个方面中,所述组中的至少一个分子包含硒化锌-硫化锌量子点。
在第七个、第八个和第九个示例性实施方式的第十三个方面中,所述组中的至少一个分子包含硫化铅、硒化铅、硒化镉、硫化镉、碲化镉、砷化铟、磷化铟、硒化锌或硫化锌。
在第七个、第八个和第九个示例性实施方式的第十四个方面中,所述集合中的每个分子通过酰胺键与所述基板连接。
在第七个、第八个和第九个示例性实施方式的第十五个方面中,所述基板包含环氧树脂。
在第七个、第八个和第九个示例性实施方式的第十六个方面中,所述物理性质是质荷比。
在第七个、第八个和第九个示例性实施方式的第十七个方面中,所述组中的每个分子是聚合物或低聚物。
在第七个、第八个和第九个示例性实施方式的第十八个方面中,每个分子是寡肽。
在第七个、第八个和第九个示例性实施方式的第十九个方面中,每个分子在其C末端包含Nε,Nε,Nε-三甲基赖氨酸-半胱氨酸(K(Me3)C)二肽。
在第七个、第八个和第九个示例性实施方式的第二十个方面中,所述分子的组包含由以下氨基酸序列表示的所述寡肽:Ac-AK(me3)C、Ac-(abu)K(me3)C、Ac-VK(me3)C、Ac-GGK(me3)C、Ac-GVK(me3)C、Ac-GLK(me3)C、Ac-ALK(me3)C、Ac-GFK(me3)C、Ac-GVGK(me3)C、Ac-GLGK(me3)C、Ac-GAGGK(me3)C、Ac-GL(abu)K(me3)C、Ac-GFGK(me3)C、Ac-GRGK(me3)C、Ac-GPAGK(me3)C、Ac-AYGK(me3)C、Ac-GPFK(me3)C、Ac-GVVGK(me3)C、Ac-G(abu)FGK(me3)C、Ac-GVFGK(me3)C、Ac-GVYGK(me3)C、Ac-GARGGK(me3)C、Ac-GAVV(abu)K(me3)C、Ac-GFYGK(me3)C、Ac-GYYGK(me3)C、Ac-GYYAK(me3)C、Ac-GPYFK(me3)C、Ac-GRGFGK(me3)C、Ac-GYFGGK(me3)C、Ac-GYYGGK(me3)C、Ac-AYYGGK(me3)C和Ac-GYY(abu)GK(me3)C,其中每个Ac是乙酰基和每个Abu是2-氨基丁酸。
在各种示例性实施方式中,本发明使用的分子的集合可以选自以下讨论的文库。
表1描述了适于实施本发明的化学文库的示例性实施方式。
表1
在一个示例性实施方式中,可以将可以通过CE区分的表2中显示的肽用于实施本发明:
表2
Trp-Asp-Asp-Asp-Phe
Trp-Asp-Asp-Asp-Leu
Trp-Asp-Asp-Asp-Val
Trp-Asp-Asp-Asp-Pro
Trp-Asp-Asp-Asp-abu
Trp-Asp-Asp-Asp-Ala
Trp-Asp-Asp-Asp-Gly
Trp-Asp-Asp-Asp
Trp-Asp-Asp-Asn
Trp-Asp-Asp-lys
Trp-Asp-Asp-Asp-Asn
Trp-Asp-Asp-Asp-lys
Trp-Asp-Asp-Asp-Asp-Asn
Trp-Asp-Asp-Asp-Asp-lys
Trp-Asp-Asp-Asp-Asp-Asp-Asn
Trp-Asp-Asp-Asp-Asp-Asp-lys
Trp-Asp-Asp-Asp-Asp-Asp-Asp-Asn
Trp-Asp-Asp-Asp-Asp-Asp-Asp-lys
Trp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asn
Trp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-lys
Trp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asn
Trp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-lys
Trp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asn
Trp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-lys
在另一个示例性实施方式中,可以将可以通过CE区分的苯甲酸酯酚用于实施本发明:
在另一个示例性实施方式中,可以将可以通过CE区分的下述氰脲酸盐用于实施本发明:
在另一个示例性实施方式中,可以将可以通过荧光发射区分的下述荧光染料用于实施本发明:
在另一个示例性实施方式中,可以将可以通过SAMDI质谱仪区分的下述肽用于实施本发明:
在又一个示例性实施方式中,可以在实施本发明中使用的分子是可以通过GC区别的分子。此类分子的示例性文库是下述反应方案的产物:
在方案1中,R是C1-C24烷基,R1是C1-C8烷基,R2和R3各自独立地是C1-C6烷基,或R2和R3与其所连接的氮原子一起形成包含1、2或3个选自N,O或S的另外的杂原子的4-7元杂环基。
“烷基”指具有指定碳原子数的任选取代的饱和脂族支链或直链单价烃基。因此,例如,“(C1-C6)烷基”指具有以直链或支链排布的1-6个碳原子的基团。“(C1-C6)烷基”包括甲基、乙基、丙基、丁基、戊基和己基。“(C1-C12)烷基”指具有以直链或支链排布的1-12个碳原子的基团。(C1-C12)烷基”包括甲基、乙基、丙基、丁基、戊基、己基、庚基、辛基、壬基、癸基、十一烷基和十二烷基。除非另有说明,否则“取代的烷基”的适宜取代基包括卤素、-OH、-O-C1-C4烷基、C1-C4烷基、卤素取代的-C1-C4烷基、-O-C1-C4卤代烷基、-NH2、-NH(C1-C4烷基)、-N(C1-C4烷基)2、C3-C12碳环基(例如,环丙基、环丁基、环戊基、环己基、苯基或萘基)、(4-13元)杂环基(例如,吡咯烷、哌啶、哌嗪、四氢呋喃、四氢吡喃或吗啉)或-N(RX)(RX’),其中RX和RX'独立地为氢或C1-C4烷基,或与其所结合的氮原子一起形成任选包含一个选自N、S和O的另外的杂原子的(4-7元)杂环,其中(4-7元)杂环任选地被卤素、OH、卤素取代的C1-C4烷基、C1-C4烷基或-C0-C4亚烷基-O-C1-C4烷基取代。
术语“卤素”指Br、I、Cl或F。
“烷撑基(alkylene)”或“亚烷基(alkylenyl)”(可互换使用)指具有指定碳原子数的任选取代的饱和脂肪族支链或直链二价烃基。亚烷基的烷基部分可以是较大部分如烷氧基、烷基铵等的一部分。因此,“(C1-C6)亚烷基”指具有呈线性排列的1-6个碳原子的二价饱和脂族基团,例如,-[(CH2)n]-,其中n为1至6的整数,“(C1-C6)亚烷基”包括亚甲基,亚乙基,亚丙基,亚丁基,亚戊基和亚己基。或者,“(C1-C6)亚烷基”指具有1-6个碳原子的直链排列的二价饱和基团,例如:-[(CH2CH2CH2CH2CH(CH3)]-、-[(CH2CH2CH2CH2C(CH3)2]-、-[(CH2C(CH3)2CH(CH3))]-等。“(C1-C12)亚烷基”包括甲基、乙基、正丙基、异丙基、正丁基、仲丁基、叔丁基、戊基、己基、庚基或辛基。特定的支链C3-亚烷基是和特定的C4-亚烷基是二价C1-6烷基的其他实例包括,例如,亚甲基、乙撑基、亚乙基、正亚丙基、异亚丙基、异亚丁基、仲亚丁基、正亚丁基和叔亚丁基。
“C0亚烷基”是共价键。
“碳环基”指具有特定原子数的环状基团,其中与化合物其余部分(也称为“第一环”)结合的环中的所有环原子都是碳原子。“碳环基”的实例包括3-18(例如,3、4、5、6、7、8、9、10、11、12、12、1、14、15、16、17或17或者其中的任何范围,如3-12或3-10)元饱和或不饱和脂族环烃环,或者6-18元芳基环。碳环基部分可以是单环、稠合双环、桥联双环、螺双环或多环。
“杂”指环系统中的至少一个碳原子成员被至少一个选自N、S和O的杂原子取代。“杂”也指在无环系统中至少一个碳原子成员的取代。当一个杂原子是S时,其可以任选地是单或二氧化的(即,-S(O)-或-S(O)2-)。杂环系统或杂无环系统可以具有1、2、3或4个被杂原子取代的碳原子成员。
“杂环基”指环状3-18元,例如,3-13元、3-15、5-18、5-12、3-12、5-6或5-7元饱和或不饱和脂肪族或芳香族环系统,所述环系统中含有独立地选自N、O和S的1、2、3、4或5个杂原子。当一个杂原子是S时,其可以任选地是单或二氧化的(即,-S(O)-或-S(O)2-)。杂环基可以是单环、稠合双环、桥联双环、螺双环或多环。非限制性实例包括(4-7原)单环、(6-13元)稠合双环、(6-13元)桥联双环或(6-13元)螺双环。
“芳基”或“芳香族”指芳香族7-18元单环或多环(例如,双环或三环)碳环系统。在一个实施方式中,“芳基”是6-18元单环或双环系统。芳基系统包括但不限于苯基、萘基、芴基、茚基、薁基和蒽基。
关于方案(1)中使用的化合物,本申请旨在包括本化合物中存在的所有原子同位素。同位素包括原子序数相同但质量数不同的原子。作为一般示例但不限于此,氢的同位素包括氚和氘,碳的同位素包括C-13和C-14。
可以在方案1中使用的通式结构式R-COOH的示例性化合物是由以下结构式表示的那些:
或其可接受的盐。
可以在方案1中使用的通式结构式R1-OH的示例性化合物是由以下结构式表示的那些:
可以在方案1中使用的通式结构式HNR2R3的示例性化合物是由以下结构式表示的那些:
或其可接受的盐。
在示例性实施方式中,数字信息存储在荧光量子点的混合物中。量子点具有非常尖锐的发射带,有助于分辨混合物中是否存在量子点。荧光共聚焦显微镜中的多通道荧光检测器能够同时且独立地分辨在基板上给定位置的混合物中各个量子点的存在与否。在以下实例中,量子点使用喷墨打印打印到聚合物基板上,光学读取提供存储的数字信息的并行读取。然而,将意识到的是,可以使用多种其他方法将可读量子点沉积在基板上。
如上文所讨论的,为了长期保存信息,减少能源消耗和防止篡改,需要新的方法和材料来存储信息。包括光和磁介质(如硬盘和闪存)在内的替代设备的使用寿命不足以进行长期存储(通常少于20年)和/或需要能量来维持信息。无机晶体(例如,量子点)可用于在没有电力的情况下以高密度存储信息,并且可以稳定数千年或更长时间。
量子点(QD)是几纳米尺寸的半导体粒子,具有特殊的光学和电子性质。当量子点被紫外光照射时,量子点中的电子可以被激发到更高能量的状态。在半导体量子点的情况下,该过程对应于电子从价带跃迁到电导带。被激发的电子可以通过光的发射回落到价带中释放其能量。这种光发射(光致发光)的颜色取决于电导带和价带之间的能量差。其光电性质随尺寸和形状的变化而变化。例如,直径为5-6mm的示例性量子点发射更长的波长,具有橙色或红色等颜色。2-3mm的较小示例性量子点发射较短的波长,产生蓝色和绿色等颜色。然而,具体的颜色取决于量子点的确切组成。将意识到的是,各种量子点均是本领域公知的。适于实施本发明的量子点的实例包括:
1.核/壳量子点,其中核的实例包括硒化镉、硫化镉、磷化铟、砷化铟、硫化铜铟、硒化锌、硫化银。这些量子点的外壳可以包括硫化锌、硒化锌、硫化镉或上述这些材料的任何组合(称为合金量子点)。
2.单元素荧光材料,例如:碳量子点、石墨烯量子点、硅量子点。
3.钙钛矿量子点,例如:铯铅卤化物、甲基铵铅卤化物等。这些材料也可以使用有机/无机配体和其他表面化学物质进行钝化(使其对环境条件更稳定)。
4.层状材料,如MoS2、MoSe2、WS2等。
5.外延生长的量子材料,如GaAs、InGaAs等。
术语“量子点”不限于准零维几何形状。这些荧光颗粒的几何形状可以是纳米棒(一维)、纳米片(二维)等。
实施例
实施例1:使用寡肽集合储存信息
材料和方法
寡肽(分子比特)溶液的制备:使用标准Fmoc化学在rink-amide树脂上合成寡肽并通过HPLC纯化。在含0.1%TFA的DI水中制备每种寡肽的储备液,并在-20℃下储存。为了制备用于固化的寡肽和寡肽混合物,将每种寡肽储备溶液分配到源板中。使用这些寡肽储备溶液和555(Labcyte Inc.)流体处理器进行寡肽的混合以形成二元数据集,当存在时,每种寡肽的最终浓度为20μM(一些序列必须进一步稀释以保持与其他分析物相当的电离)。将内部编写的Python程序用于从字母数字字符输入(转换为ASCII)和位串中对寡肽进行赋值。
生成用于自动编码文本的输入表:为了生成555液体处理器的字母数字文本输入表,首先将给定文本分成6,144个字符的部分(SAMDI 1,536点目标板上的最大字符数)。这些文本块随后通过程序运行,该程序进一步将每个块的6,144个字符分成四个部分,每部分1,536个字符。然后将1,536个字符的每个部分分配给384孔板,每个孔有4个字符(字节),并生成一个文本文件(扩展名.txt),其中包含每个孔板的字符串。然后将该文件用于名为“Molbit Encoding”的程序中。该程序还需要输入要转移的每个寡肽储备溶液的体积(以nL为单位),每个源孔的总容量(要转移的给定寡肽的位置),目标板的名称以及所使用的每个字符的ASCII二进制组合列表。一旦收到所需输入,则程序会将.txt文件中的每个字符与适当的二进制ASCII组合进行匹配,并为Echo仪器生成一个输入表,包括源孔、转移体积、目标孔和目标板名称的信息。
为任意比特流的自动编码生成输入表:为了为555流体处理器生成非ASCII数据的输入表,首先生成一个比特流。然后这些位按顺序编号为1到32。在此过程之后,将excel中的“Vlookup”功能用于为每个数字分配预定义的源孔。接下来为每组32位分配一个1,536孔目标板的孔。比特流,以及每个条目的相关位号、源孔和目标孔,然后被缩减为仅包含比特流值为1的条目。接下来,将“Vlookup”功能用于根据源孔为每个条目分配传输量。最后,将这些条目转移到Echo输入表中,其中包含有关源孔、转移体积、目标孔和目标板名称的信息。
通过液体转移自动编码:在555液体处理机器人上初始化运行之前,制备源板(Labcyte Echo合格的384孔板,目录号:PP-0200),其中包含要转移的所需寡肽。源板的每个孔都含有65μL32种储备溶液中的每种溶液(在寡肽中2mM)。每种寡肽所需的孔数由通过编码程序生成的输入表确定。将源板和目标板(Greiner Bio-One 384孔板,目录号784201)放置在与液体处理器相连的访问实验室工作站的存储塔中。为了启动运行,导入输入表,该表定义了源板和目标板的位置,并执行协议。转移寡肽后,用盖子(LabcyteMicroClime环境微孔板盖,目录号LL-0310)盖住目标板和源板,以确保板中的内容物不会干燥。
单层阵列的制备:在室温下,将钢板上具有384个和1536个金点的阵列板浸泡在EG3封端的烷烃二硫化物和EG3封端的烷硫醇和马来酰亚胺末端的EG3封端烷硫醇的混合二硫化物的混合物溶液中24小时,以允许在金表面上形成自组装单层。二硫化物溶液以化学计量比(2比3)包含总浓度为1mM的两种单层化合物以产生其中马来酰亚胺基团以20%的密度存在的单层。形成单层后,将板浸泡在十六烷基膦酸(10mM)溶液中5分钟,用乙醇、水、乙醇冲洗,用氮气干燥并在真空下干燥储存。SAMDI板在形成单层后一周内使用。
将肽固化到板上:在固化之前,用4μL 100mM Tris缓冲液(pH8.0)和ThermoFisherMultidrop Combi填充由555流体处理器产生的混肽合板,以确保混合寡肽的溶液处于用于缀合到单层的正确的pH和适当的浓度。然后将每组四个384孔板转移到1,536点SAMDI板,其用20%马来酰亚胺进行官能化,并在点之间显示十六烷基膦酸本底。使用TECANFluent/Freedom Evo仪器将来自384孔板的每个孔的样品(0.75μL)转移到1536点SAMDI板上,MCA 384头使用15μL吸头,这样每个384孔板被转移到1536点SAMDI板的一个象限。以这种方式,从左到右和从上到下读取点,并允许读取原始编码文本。一旦转移,肽溶液与板表面上的马来酰亚胺基团在加湿室中反应10-30分钟,以共价固定肽混合物。固化后,将板用乙醇、水、乙醇洗涤并在氮气流下干燥。
MALDI-TOF MS分析:具有固定化寡肽的SAMDI板首先用2’,4’,6’-三羟基苯乙酮基质溶液(THAP,丙酮中12mg/ml)处理,然后装入ABSciex TOF-TOF 5800仪器。以正模式收集每个斑点的基质辅助激光解吸/电离飞行时间质谱,仪器设置为700次发射/光谱,5300激光强度,1500μm/s的工作台速度,0.61的数字化仪设置和400Hz的激光脉冲速率。
用程序的谱分析:在分析SAMDI光谱之间,生成一个输入表,其中包含用于4个字节中的每一个的95个可打印ASCII字符中的每一个的肽质量组合。然后将该输入表划分为每个仅包含对应字节的肽组合。这种划分是使用“Molbit Decoding”程序完成的,同时输入一式四份的95个ASCII字符,每个字节一次,以及每个字符和字节的肽列表。
SAMDI光谱从仪器计算机中导出,并使用“new profiler”程序进行分析。该程序需要以下输入才能运行;质谱文件的位置、生成文件的输出位置、正在分析的字节(1-4)的输入表以及背景阈值。背景阈值是用户确定的值;其基于相对于光谱中最高峰的绝对峰强度,通常设置在20-30%这些之间。背景阈值有助于避免由于光谱中的噪声而在检测分子比特时出现误报。
该程序以下列方式运行。其首先扫描光谱并确定最大强度值(任意单位)并将该值设置为1。然后其根据这个父值将其他每个强度转换为相对强度单位。然后,软件会删除低于用户设置的阈值的任何值,并产生一个新列表,其中仅包含那些高于阈值的峰值。在生成新列表之后,其通过四舍五入到最接近的整数质量值来对强度值求和。然后其尝试根据两个最高的连续强度单位生成质量组,之后是无法组合的单个质量强度组。此时,程序扫描输入表以根据存在的质量组找到提供最高强度总和的条目。一旦找到该条目,其就会返回已解码的字符的值。如果其未能匹配输入表中的条目,则其会返回“FAILED”响应并移动到下一个光谱。软件完成整个数据集的运行后,其会生成一个文件,其中列出了数据点的标签、解码的字符(如果适用)以及已为该字符识别的质量。信息的恢复由通过光谱分析正确识别的分子比特的数量除以最初编码的分子比特的总数乘以100来确定。
图像压缩、编码、存储、检索和重构:首先,如果图像的原始副本大于一个SAMDI 1,536点板(6,144字节)上的可用存储空间,则通过JPEG算法对该图像进行压缩以适合一个孔板。JPEG算法是用Adobe Photoshop CS4 11.0版实现的,JPEG质量和模糊设置在补充信息表2中使用“保存为Web和设备”功能指示。
压缩后,JPEG文件使用名为“图像编码”的程序编码为比特流(参见源代码的补充信息),在Matlab R2015b中运行。该代码读取存储在本地计算机硬盘驱动器上的包含JPEG文件的字节,并将这些位转换为比特流。包含在比特流中的数据长度(以比特为单位)也由代码读取并附加(作为16位段)到比特流前面,然后使用上述自动分子编码过程将其编码到孔板上。
如上所述从孔板检索数据,其中读取SAMDI板的输出是比特流。该比特流以“1”和“0”的文本(.txt)文件的形式,没有其他字符,由名为“图像提取”的程序读取,其从比特流的前16位提取图像文件的长度,然后从比特流中检索该数量的位,懂第17位开始(在记录文件长度的位串之后)。该图像数据被重构为JPEG格式的图像文件,可由计算机解释和显示。计算每幅图像检索和重构过程中的错误率。
结果和讨论
本研究的目的是探索使用低分子量分子存储信息。特别避免了需要有机合成步骤来制造并且通常每个分子编码单独信息的大分子。相反,使用具有可区分分子量的寡肽组来存储信息。相反,使用具有可区分分子量的寡肽组来存储信息。总体而言,测试系统需要最多8个寡肽的组作为混合物,在微孔中存储一个字节,并需要32个寡肽的混合物来存储四个字节。这些系统还能够使用同一小分子的组写入任意二进制信息。通过使用质谱(MS)鉴定固定在自组装单层(主要是激光解吸过程中的二硫化物)上的分子质量来完成读取。MS提供高精度(能够准确测定固定阵列的单个亚毫米点中的寡肽混合物的组成,无需分离且几乎没有错误)和高读取率。
最初的演示是以8位ASCII代码编写消息,将其转换为等效的分子代码,将其存储在阵列板上(每个点四个字节),然后使用SAMDI(用于基质辅助激光解吸/电离的自组装单分子层)质谱。ASCII(美国信息交换标准代码)是一个查找表,包括字母、数字、标点符号和特殊字符(最多256个字符),主要用于字母数字文本。
图1提供了总结使用字母“K”的策略的表1。
图2提供了扩展数据表1,该表总结了足以在单个混合物中编码四个字节的寡肽的完整赋值,以及其对二进制分子表示的赋值。
为了区分布尔代数中电子存储及其理论基础和分子存储,相当于位和八位字节的信息,以分子混合物的形式,将其称为“分子比特”和“分子字节”。为了在分子中存储信息,设计了一种方法,其允许在质谱可区分的分子中编码ASCII。例如,在ASCII中的字母“K”用二进制的一个字节(01001011)表示。通过将寡肽分配给字节中的八位中的每一位,将这种二进制表示转换为分子表示,如果位值为“1”,则在该点包含该寡肽,如果位值为“0”,则将其省略(图1,表1)。
所选择的这些寡肽具有四个特征:i)所有这些都可以使用SAMDI作为常见混合物的组分进行质量解析(图1)。每个寡肽中的不同氨基酸共价键合,但其顺序不相关,仅有总质量。寡肽彼此没有共价检核,也没有形成大分子。因此,信息作为低分子量(MW<1,000gmol-1)分子的混合物存储在阵列中,以二进制表示形成指定“1”和“0”,而不是作为线性聚合物中的基因序列。ii)所有寡肽都以半胱氨酸终止,以便通过迈克尔加成到SAMDI板直径为1.25-mm的点中的反应性马来酰亚胺基团进行有效固定。iii)每个寡肽都包含一个带有固定正电荷的三甲基赖氨酸(KMe3),以帮助质谱分析(正模式)。通过使用图2(扩展数据表1)中列出的32个肽的集合,其每一个都可以在包含其他的混合物中被区分,信息可以在一个点存储四个分子比特(例如,在ASCII中的四个字母)。
使用这种方法,混合物中特定肽的存在表明了三个参数:i)其提供信息的字节;ii)其在该字节的位串中的位置;和iii)其值(“1”)。该肽的缺失表明该位置在分子字节中为“0”。因此,将在图1,表1中列出的四种寡肽的存在赋值给值为1的位,而将混合物中不存在的四种寡肽赋值给值为0的位。剩下的一个要定义的参数是该字母在文本序列中的位置:此信息由SAMDI阵列板上的点序列中点的位置提供。这种方法的吸引人的特点是只有八个寡肽允许指定一个字节的所有字符,因此可以用ASCII(或任何256个成员的字符集)编写任意消息;通过使用32个可区分的寡肽,可以在一个点指定四个字节。
测试设计的示意图显示在图3中。图3(A)是包含由1到5个氨基酸(选自2-氨基丁酸、丙氨酸、精氨酸、甘氨酸、亮氨酸、苯丙氨酸、脯氨酸、酪氨酸、缬氨酸)组成的信息区的寡肽分子比特的图示,其提供了每个肽的可区分质荷比(差异6-42a.m.u.)、电荷残基(三甲基赖氨酸)和锚定残基(末端半胱氨酸)。为了化学稳定性,将N末端用乙酰基封端。图3(B)表示将两种固化寡肽(对应于图3的(C)图中的分子比特1和分子比特2)与马来酰亚胺封端的单分子层进行储存的示意图。在寡肽缀合之前,单层由终止于醇或马来酰亚胺的三甘醇十一硫醇(EG3-封端的烷硫醇)的混合物组成。图3(C)是包含全部32个分子比特的SAMDI点的光谱;强度归一化为最高信号。将寡肽按分子量分组为八组,代表一个信息字节(总共4个字节)。信息区域中残基的单字母代码列在质谱中每个峰的上方(见图2,扩展数据表1中肽序列和相应质量的完整列表)。观察到的质量是混合的衍生自EG3-封端的烷硫醇的二硫化物和与马来酰亚胺封端的EG3封端的烷硫醇缀合的寡肽。
图4概述了使用这组32个肽“写入”、“存储”和“读取”本文的过程。对于特定字节,使用555液体处理器在384孔板的孔中沉积和混合表示位串中“1”的适当寡肽组。然后,液体处理器将这些混合物转移到具有1,536个金岛(“点”)的阵列板上,每个金岛呈现自组装单层。肽与阵列板单层上存在的末端马来酰亚胺基团共价反应。共价偶联可防止混合物的成分在表面扩散,并运行使用SAMDI质谱对其进行分析。将具有完整文本编码为在板上排序的点中的寡肽混合物的板进行储存。SAMDI的读取如前所述完成。
特别地,并且参考图4,“写入”是通过首先将信息(这里是费曼讲座“底部有很多空间”的字母数字字符)翻译成二进制来进行的。将二进制信息转化为固化在自组装单层上的寡肽,用于存储。用MALDI-TOF质谱仪分析(“读取”)这些板。一个程序解码了光谱中的信息并生成了用于重新生成原始文本的位串。通过(正确识别的分子比特数)/(分子比特总数)×100确定信息的恢复。
这种写入和读取字节的策略允许少量低分子量分子编码多种形式的信息,并且一旦合成,就无需进一步合成来存储新信息。(在此演示中,为了排序这些分子比特,使用了传统微孔板形式的阵列板。)可以放在板上的信息密度(D)取决于呈现形式,但在这里由D=(分子比特/cm2)=(孔/cm2)/板)(分子比特/孔)给出。对于检测的系统=该数字是D=64字节/cm2。
本文描述的系统用于存储文本和JPEG图像。该程序操作简单。所需的少量分子(在给定集合内,如寡肽)只需合成一次,并用于编码非常广泛的信息。将费曼著名的演讲“底部有足够的空间”的文字用来展示当前的能力。将其写入、存储和读取的信息回复率为99.9%。该文本(38,313字节或字母数字字符)是使用设备组(见图4)在20小时内写入和读取的。“写入”的速度为8位/秒,和“读取”的速度为20位/秒,没有并行化。这个过程适用于简单的线性并行化,特别是因为每行仪器可以同时写入不同的信息,使用共享的分子的组进行存储:因此速度可以轻松提高十倍或更多,尽管是资本成本的十倍。阵列中更高密度的点和更快的液体转移(可以通过喷墨打印实现)也可以增加写入信息的密度和速率。
本文所述的实例使用寡肽,但也可以使用许多其他类别的有机分子(其他非天然氨基酸、脂肪酸、包括杂环的芳烃、饱和萜烯等):因此所述方法具有广泛的范围。
寡肽在合适的条件下具有数百年或数千年的稳定性;即,在没有光(或电离辐射)、氧气或其他氧化剂以及高温和可能没有水的情况下,在惰性容器中。重要的是,个别分子的偶尔断裂(与DNA断裂不同)不会显著损害读取的保真度,因为其会出现在不是由分子比特编码的质量上。信息的分子存储应该特别能抵抗电、磁或光学的黑客攻击,因为读取或重写入以分子方式存储的信息组成的唯一方法是物理访问分子,然后执行化学过程。
对于需要归档大量数据的组织而言,所公开的用于在分子混合物中存储信息的方法和设备可以实现几乎无限期地持续存在并消耗很少或不消耗能量的稳定存档。与DNA等基于序列的基于聚合物的方法不同,以稳定分子混合物形式存储的优势在于,写入信息不涉及耗时的长分子链合成,长分子链合成导致写入时间比公开的方法慢1000倍。此外,快速的写入和读取时间以及低廉的材料成本使这种方法非常适合对国际供应链上的产品进行打条形码和验证,从而保护公司、政府和消费者免受欺诈、伪造和盗窃。
将意识到的是,本公开不闲鱼本文提供的基于聚合物的实例。包括小分子在内的非聚合分子的混合物可用于使用本公开中描述的介质和方法来存储和检索信息。
实施例2:荧光量子点混合物中的信息存储
本公开提供了使用混合量子点的数字信息存储,同时解决了对足够读/写速度、信息保留、信息密度和成本的要求。在下述实例中,喷墨打印机能够以127位/秒的速率写入,共聚焦显微镜中的多通道荧光检测器允许以121字节/秒的速率读取。使用这种方法,下面的实例演示了在7.5mm x 7.5mm表面上写入14,075字节的数字信息,随后读取超过1,000次,而不会损失荧光信号强度。使用量子点和喷墨打印,可以获得高信息密度和快速读/写速度,同时可以对存储的数据进行多次读取。
光盘、闪存驱动器和硬盘驱动器等设备的使用寿命约为数十年。因此,维护数字档案需要不断复制存储在这些设备上的信息。使用基于COMS的设备的另一种方法是将信息存储在分子中。如本文所述,基于分子的存储系统可以具有非常高的存储密度和可以延长数百万年的半衰期。
在该实例中,显示了量子点光学性质中信息的存储。具体而言,将量子点的荧光用于光信息存储系统。信息是通过在聚合物基板上喷墨打印量子点的稀释溶液来写入的。信息的读取是使用配备多通道检测器的共聚焦显微镜进行的,该检测器可以同时和独立地解析基板上点的荧光特征的任何组合。这种光学读取利用并行读取的优势,与其他光学存储方法有着根本的不同。
替代的光学存储介质使用激光束来记录和检索数字(二进制)数据。激光束将数据编码到凹坑中的基板上并落在磁盘表面上。一次性写入光盘使用有机染料记录层,而可重写光盘使用相变合金材料(例如,AgInSbTe,一种银、铟、锑和碲的合金)。在这种介质中,只有二进制0或1被记录在一个位置。而相比之下,本实例使用8种有机荧光染料来写入信息。相应的读取技术可以同时独立地区分每个染料分子在一个位置的存在与否,从而可以在同一位置同时记录0、1、2、3、4、5、6和7的任意组合。
在该实例中,基板是含有反应性氨基的环氧聚合物。n-羟基琥珀酰亚胺(NHS)官能化的量子点在基底上反应形成稳定的酰胺键。这些共价固定的染料在超过1000次读取时保持稳定,而不会损失强度。光漂白不会显著影响存储的信息。
与替代的长期存储技术相比,这种技术有几个优点。这些有点包括:(1)无需电源的存储持久性;(2)信息密度高;(3)化学加密系统的可用性。例如,由于打印的图案不需要重叠,因而图案可以错位或打印在完全不同的位置。通过这种方式,可以将信息混淆,读取图案的顺序提供了解密信息的密钥。
结果和讨论
染料的选择:选择了七个荧光核壳量子点(硒化镉-硫化镉和硒化锌-硫化锌量子点的混合物)来演示该策略。这种技术可以扩展为在混合物中加入任何数量的量子点。这种点溶解在溶剂(己烷)中并插入喷墨打印机的墨盒中。
量子点可以由诸如硫化铅、硒化铅、硒化镉、硫化镉、碲化镉、砷化铟和磷化铟的二元化合物制成。量子点也可以由三元化合物如硒化镉硫化物制成。
写入信息:喷墨打印机和气溶胶喷射打印等材料沉积技术可实现高通量微细加工。在该实例中,喷墨打印用于在基板上以30μm的点尺寸打印1pL墨滴。为了证明高密度信息存储,写入了人类科学史上开创性研究论文之一“电中的实验研究”的第一部分,MichaelFaraday,Phil.Trans.R.Soc.Lond.1832,122,125-162。该文本包含14075个字符(即,14075字节)。
基板的选择:长期存储需要形成具有很长半衰期的热力学稳定键。酰胺键是有机化学家可用的热力学上最稳定的键之一。在该策略中,使用了携带n-羟基琥珀酰亚胺配体的量子点,该配体将自发与基板上的氨基反应形成酰胺键。合成交联的环氧聚合物,其中使用了稍微过量的胺固化剂,这在基板中赋予了反应性氨基。环氧聚合物是通过将双酚-A-二缩水甘油醚和三乙烯四胺的混合物在90℃下在醋酸纤维素片材上热压合成的。压制以获得10μm厚薄膜。
图案生成方案:现参考图5,提供了流程图,其示出了根据本公开的实施方式的用于使用量子点写入数字信息的图案生成方案。例如,如果需要写入单词“Arts”,则ASCII文本在501处转换为二进制数字。然后,对于DOT 2,在502选择每个二进制表示的第二个位置。这些二进制数字的字符串分布在503处的网格中(例如,4个字母的2x 2正方形)。使用0表示不存在染料,使用1表示存在染料,通过将该图案印刷到基板上来写入该信息。对二进制表示的所有8个位置重复此过程。总共生成了8个图案,并在同一位置打印到基板上。
这些图案不需要完全对齐,因为一个DOT的图案中存在的信息独立于另一个DOT的图案中存在的信息。因此,这些图案甚至可以打印在完全不同的位置(例如,这些图案甚至可以分布在不同的物理位置,并且可以通过仅知道图案堆叠顺序的知识来解码信息)。
ASCII字符的二进制表示包含8个数字,但对于可打印字符,第一个数字始终为0。因此,第一个DOT图案始终是空白图案。
写入参数:在该实例中,在7.5mm x 7.5mm的基板区域上以30μm的分辨率写入“电学实验研究”的7个图案中的每一个平均需要116秒。
参考图6A,显示了由上述编码方案生成的示例性图案。每个黑色方块表示基板上存在给定的量子点材料。尽管在该实例中,编码材料沉积在网格图案上,但是将意识到的是,可以使用替代图案。
参考图6B,提供了根据本公开的印刷图案的图像。此图像是在打印后立即捕获的。
参考图7,提供了示例性阅读器的示意图。在各种实施方式中,使用能够检测具有重叠光谱的多重发射的荧光检测器。采用点照明,并将在检测器前面的光学共轭平面701中的针孔用于消除离焦信号。由于只能检测到非常接近焦平面的荧光产生的光,因此图像的光学分辨率优于宽视场显微镜。在各种实施方式中,将衍射光栅702用于光谱色散光。然后,由诸如多通道光电倍增管703、光电倍增管(PMT)或雪崩光电二极管的检测器检测光强度。
如上所述,喷墨打印机和多通道荧光检测器能够使用荧光量子点的混合物以快速、更高密度和简单的方法来长时间、低成本地存储信息。
参考图8A-H,提供了上述实例中使用的八种染料中每种染料的染料图案的数字图像。
参考图9,提供了示例性图案的时间序列图像。将观察到印刷的液体图案由于吸收而随着时间的推移从基材表面消失。尽管在可见波长下不一定可见,但是仍可通过本文所述的方法读取数据。
参考图10,在沉积了多种染料之后,提供了示例性图案的数字图像。在该实例中,以25微米分辨率打印时,染料之间存在轻微的错位。然而,如上所述,尽管存在这种错位,数据仍然可读,允许使用具有成本效益的快速技术(如喷墨打印)进行沉积。
实施例3:明确可鉴定的分子与数值找那个多个预定位置的唯一关联
当从N个明确可鉴定的对象(分子)的组中进行选择时,最多N/2个对象的所有子集的综合等于2N-1。换言之,对于由最多可明确鉴定的分子总数的一半组成的混合物,可以明确存储N-1位。
这是一种进行稀疏编码的方法,并且依赖于这样一个事实,即给定集合中的子集(超集)的数量由二项分布描述,该分布在n/2周围对称。
参考图11,举例说明了稀疏编码。在该实例中,使用任意、明确可鉴定的分子A、B、C和D。将意识到的是,本文阐述的各种分子的集合或检测方法中的任何一个都适用于稀疏编码。如图所示,由三个二进制位描述的信息可以由最多一半的组合表示——在该实例中,四个分子中的两个。这导致在质量和质量运输方面的努力较低。特别是,实施这个概念提高了写入效率(通过省略复合),但没有提高密度或阅读速度。对于压缩或未知数据,其平均会带来两倍的改进。然而,这种改进可以转化为成本效率的显著提高。
与相应的非稀疏编码方案相比,用于稀疏编码的库需要多于一个分子才能区分。这通常不会对库设计构成挑战。然而,在某些情况下存在挑战,例如,当分析特性的技术的分辨率很低或当分子类别产生广泛的信号时。
现代质谱仪(~1a.m.u.)的分辨率足以区分氢/氘同位素。假设将使用有机分子库,则在没有可用设备范围的情况下,添加一个额外的分子以移动到稀疏编码将是容易的。
而相比之下,在可见光范围内,逐渐增加的以吸收或荧光区分分子文库的能力可能会受到限制。在这种情况下,限制不在于检测器,而在于激发态的激发和衰减的物理性质,这导致在小波长范围(400-800nm)中相对较宽且通常为多个波段(最小29nm)。将可区分的分子添加到三种混合物中很容易。将分子添加到10种混合物中更具挑战性。
因此,将理解稀疏和非稀疏编码之间的选择在各种实施方式中将取决于分子文库。
参考图12,提供了流程图,示出了根据本公开的实施方式的用于写入数据的方法。1201中,接收包括多个数字的数值,每个数字具有一个位置。在1202中,接收多个数字/位置对与明确可鉴定的分子的组之间的一对一关联。在1203中,确定对应于数值的分子的集合。确定所述集合包括:在结合中包括与在数值中具有相关数字的每个位置相关联的分子。在1204中,所述集合的分子在其上的可寻址位置处与机器可读介质的基板物理关联。物理关联包括与所述基板连接。
参考图13,提供了流程图,示出了根据本公开的实施方式的用于读取数据的方法。在1301中,接收多个数字/位置对与明确可鉴定的分子的组之间的一对一关联。在1302中,确定在其上可寻址位置处与机器可读介质的基板物理关联的分子的集合。集合中的每个分子在各自的可寻址位置处与基板相连。在1303中,从分子的集合中确定数值。确定数值包括:将数值的每个位置设置为集合中存在相关分子的数字。
参考图14,提供了流程图,示出了根据本公开的实施方式的用于写入数据的方法。在1401中,接收小于或等于n位的数值。n是整数。在1402中,接收数值与k个分子的集合之间的一对一关联。k是0或者小于或等于n的整数。所述集合是所述n个分子的组中的k-组合。在1403中,根据一对一关联确定数值对应的集合。在1404中,集合的分子在其上的可寻址位置处与机器可读介质的基板物理关联。
参考图15,提供了流程图,示出了根据本公开的实施方式的用于读取数据的方法。在1501中,接收数值和k个分子的集合之间的一对一关联。k是0或者小于或等于n的整数。n是整数。所述集合是所述n个分子的组中的k-组合。在1502中,确定在其上可寻址位置处与机器可读介质的基板物理关联的分子的集合。在1503中,根据一对一关联,从分子的集合确定数值。
现参考图16,显示了计算节点的实例的示意图。计算节点10只是合适的计算节点的一个实例并且不旨在暗示对本文描述的实施方式的使用范围或功能的任何限制。无论如何,计算节点10能够实现和/或执行上文所述的任何功能。
在计算节点10中存在计算系统/服务器12,其可以与很多其他通用或专用计算机系统环境或配置一起操作。可能适用于计算机系统/服务器12的众所周知的计算系统、环境和/或配置的实例包括但不限于个人计算机系统、服务器计算机系统、瘦客户端、胖客户端、手持或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品、网络PC、小型计算机系统、大型计算机系统和包括任何上述系统或设备的分布式云计算环境等。
计算机系统/服务器12可以在由计算机系统执行的计算机系统可执行指令(如程序模块)的一般上下文中描述。通常,程序模块可以包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、逻辑、数据结构等。计算机系统/服务器12可以在分布式云计算环境中实施,其中任务由通过通信网络链接的远程处理设备执行。在分布式云计算环境中,程序模块可以位于本地和远程计算机系统存储介质中,包括内存存储设备。
如图14所示,计算节点10中的计算机系统/服务器12以通用计算设备的形式示出。计算机系统/服务器12的组件可以包括但不限于一个或多个处理器或处理单元16、系统存储器28和将包括系统存储器28在内的各种系统组件耦合到处理器16的总线18。
总线18代表多种类型的总线结构中的任何一种或多种,包括存储器总线或存储器控制器、外围总线、加速图形端口以及使用多种总线架构中的任何一种的处理器或本地总线。作为实例而非限制,此类架构包括工业标准架构(ISA)总线、微通道架构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)本地总线、外围组件互连(PCI)总线、外围组件互连高速(PCIe)和高级微控制器总线架构(AMBA)。
计算机系统/服务器12通常包括各种计算机系统可读介质。此类介质可以是计算机系统/服务器12可访问的任何可用介质,并且其包括易失性和非易失性介质、可移动和不可移动介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,如随机存取存储器(RAM)30和/或高速缓冲存储器32。计算机系统/服务器12还可以包括其他可移动/不可移动、易失性/非易失性计算机系统存储介质。仅作为实例,可以提供存储系统34用于从不可移动、非易失性磁介质(未示出并且通常称为“硬盘驱动器”)中读取和写入。尽管未示出,可以提供用于读取和写入可移动、非易失性磁盘(例如,“软盘”)的磁盘驱动器,以及用于读取或写入可移动、非易失性光盘(例如,CD-ROM、DVD-ROM或其他光学介质)的光盘驱动器。在这种情况下,每个都可以通过一个或多个数据媒体接口连接到总线18。如以下将进一步描绘和描述的,存储器28可以包括至少一个程序产品,该程序产品具有被配置为执行本公开的实施方式的功能的程序模块的组(例如,至少一个)。
作为实例而非限制,具有程序模块42的组(至少一个)的程序/实用程序40以及操作系统、一个或多个应用程序、其他程序模块和程序数据可以存储在存储器28中。操作系统、一个或多个应用程序、其他程序模块和程序数据或其某种组合中的每一个可以包括网络环境的执行。程序模块42通常执行如本文所述的实施方式的功能和/或方法。
计算机系统/服务器12还可以与一个或多个外部设备14通信,如键盘、定点设备、显示器24等;使用户能够与计算机系统/服务器12交互的一个或多个设备;和/或使计算机系统/服务器12能够与一个或多个其他计算设备通信的任何设备(例如,网卡、调制解调器等)。这种通信可以通过输入/输出(I/O)接口22进行。仍然,计算机系统/服务器12可以通过网络适配器20与一个或多个网络通信,如局域网(LAN)、通用广域网(WAN)和/或公共网络(例如,互联网)。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其他组件通信。应当理解的是,尽管未示出,其他硬件和/或软件组件可以与计算机系统/服务器12结合使用。实例包括但不限于:微码、设备驱动程序、冗余处理单元、外部磁盘驱动器阵列、RAID系统、磁带驱动器和数据归档存储系统等。
本公开可以体现为系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质(或介质),其上具有计算机可读程序指令,用于使处理器执行本公开的各方面。
计算机可读存储介质可以是可以保留和存储指令以供指令执行装置使用的有形装置。计算机可读存储介质可以是,例如,但不限于,电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或上述的任何适宜的组合。计算机可读存储介质的更具体实例的非详尽列表包括以下内容:便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式光盘只读存储器(CD-ROM)、数字多功能磁盘(DVD)、记忆棒、软盘、机械编码装置,如穿孔卡或凹槽中的凸起结构,其上记录有指令,以及前述的任何适宜组合。如本文所用,计算机可读存储介质不应被解释为本身的瞬态信号,如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如,通过光纤电缆的光脉冲),或通过电线传输的电信号。
本文描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理设备,或者通过网络,例如,互联网、局域网、广域网和/或无线网络。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或网络接口从网络接收计算机可读程序指令并且转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。
用于执行本公开的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据,或者源代码或对象代码,其以一种或多种程序语言的任何组合编写,包括面向对象的编程语言,如Smalltalk、C++等,以及传统的过程编程语言,例如“C”编程语言或类似的编程语言。计算机可读程序指令可以完全在用户计算机上、部分在用户计算机上、作为独立软件包、部分在用户计算机上和部分在远程计算机上或完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络连接到用户的计算机,包括局域网(LAN)或广域网(WAN),或者可以连接到外部计算机(例如,使用互联网服务提供商,通过互联网)。在一些实施方式中,电路包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),可以通过利用计算机可读程序指令的状态信息来个性化电子电路来执行计算机可读程序指令,以便执行本公开的各个方面。
本文参考根据本公开的实施方式的方法、装置(系统)和计算机程序产品的流程图和/或框图来描述本公开的各个方面。应当理解的是,流程图和/或框图的每个块,以及流程图和/或框图中的块的组合,可以通过计算机可读程序指令来实现。
这些计算机可读程序指令可以被提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器,以使得经由计算机的处理器或其他可编程数据处理设备执行的指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。这些计算机可读程序指令也可以存储在计算机可读存储介质中,该存储介质可以指导计算机、可编程数据处理装置和/或其他设备以特定方式运行,以使得其中存储有指令的计算机可读存储介质包括制造物品,该制造物品包括执行流程图和/或框图块或多个块中指定的功能/动作的方面的指令。
计算机可读程序指令也可以加载到计算机、其他可编程数据处理设备或其他设备上,以使一系列操作步骤在计算机、其他可编程设备或其他设备上执行以产生计算机实现的过程,例如在计算机、其他可编程设备或其他设备上执行的指令实现流程图和/或框图块或块中指定的功能/动作。
附图中的流程图和框图示出了根据本公开的各种实施方式的系统、方法和计算机程序产品的可能实现的架构、功能和操作。就这一点而言,流程图或框图中的每个块可以表示模块、区段或指令的一部分,其包括用于实现指示逻辑功能的一个或多个可执行指令。在一些替代实施方式中,框中标注的功能可能不按附图中标注的顺序出现。例如,实际上,连续显示的两个块可以基板上同时执行,或者这些块有时可以以相反顺序执行,这取决于所涉及的功能。还应注意的是,框图和/或流程图说明的每个块,以及框图和/或流程图说明中块的组合,可以通过执行特定功能或行为或执行专用硬件和计算机指令的组合的基于专用硬件的系统来实现。
在各种示例性实施方式中,本发明可以被定义为以下编号的实例。
1.一种机器可读介质,其包括:其上具有可寻址位置阵列的基板,每个可寻址位置适合与非聚合分子的集合物理关联,其中每个集合中的所述分子选自明确可鉴定的分子的组,每个分子与数值中的预定位置唯一地相关联,其中在所述集合中所述分子的存在指示在所述关联位置处的预定数字,并且在所述集合中不存在所述分子指示在所述关联位置处为零。
2.一种机器可读介质,其包括:其上具有可寻址位置阵列的基板,每个可寻址位置适合与分子的集合物理关联,其中所述集合中的每个分子都是不依赖于序列的聚合物,并且其中每个集合中的所述分子选自明确可鉴定的分子的组,每个分子与数值中的预测位置唯一地相关联,其中在所述集合中所述分子的存在指示在所述关联位置处的预定数字,并且在所述集合中不存在所述分子指示在所述关联位置处为零。
3.1或2所述的机器可读介质,其中明确可鉴定的分子的组中的每个分子都与一个二进制数字相关联。
4.1或2所述的机器可读介质,其中所述数值具有基数(radix)和预定数量的位置。
5.4所述的机器可读介质,其中所述数值是具有预定数量的N个位的二进制值。
6.6所述的机器可读介质,其中所述数值是具有32位的二进制值。
7.5所述的机器可读介质,其中每个集合编码位串。
8.7所述的机器可读介质,其中所述位串编码ASCII值。
9.1-8中任一项所述的机器可读介质,其中所述组中的每个分子通过物理性质可鉴定。
10.9所述的机器可读介质,其中所述物理性质是质荷比。
11.1-10中任一项所述的机器可读介质,其中所述集合中的每个分子在各自的可寻址位置处与基板连接。
12.2或者3-10中任一项所述的机器可读介质,其中所述组中的每个分子是聚合物或低聚物。
13.12所述的机器可读介质,其中每个分子是寡肽。
14.13所述的机器可读介质,其中每个分子在其C末端包含Nε,Nε,Nε-三甲基赖氨酸-半胱氨酸(K(Me3)C)二肽。
15.1或2所述的机器可读介质,其中所述数值是具有32位的二进制值;以及所述分子的组包含由以下氨基酸序列表示的所述寡肽:Ac-AK(me3)C、Ac-(abu)K(me3)C、Ac-VK(me3)C、Ac-GGK(me3)C、Ac-GVK(me3)C、Ac-GLK(me3)C、Ac-ALK(me3)C、Ac-GFK(me3)C、Ac-GVGK(me3)C、Ac-GLGK(me3)C、Ac-GAGGK(me3)C、Ac-GL(abu)K(me3)C、Ac-GFGK(me3)C、Ac-GRGK(me3)C、Ac-GPAGK(me3)C、Ac-AYGK(me3)C、Ac-GPFK(me3)C、Ac-GVVGK(me3)C、Ac-G(abu)FGK(me3)C、Ac-GVFGK(me3)C、Ac-GVYGK(me3)C、Ac-GARGGK(me3)C、Ac-GAVV(abu)K(me3)C、Ac-GFYGK(me3)C、Ac-GYYGK(me3)C、Ac-GYYAK(me3)C、Ac-GPYFK(me3)C、Ac-GRGFGK(me3)C、Ac-GYFGGK(me3)C、Ac-GYYGGK(me3)C、Ac-AYYGGK(me3)C和Ac-GYY(abu)GK(me3)C,其中每个Ac是乙酰基和每个Abu是2-氨基丁酸。
16.一种向机器可读介质写入数据的方法,所述方法包括接收包括多个位的二进制值,每个位具有一个位置;接收多个位位置和明确可鉴定的分子的组之间的一对一关联;确定对应于二进制值的分子的集合,其中确定所述集合包括:在所述集合中包括与其中位具有值1的每个位置相关联的分子;并省略与其中位具有值0的每个位置相关联的分子;将所述集合的分子与机器可读介质的基板在其上的可寻址位置处物理关联。
17.一种从机器可读介质读取数据的方法,所述方法包括接收多个位位置中的每一个与明确可鉴定的分子的组之间的一对一关联;确定在其上的可寻址位置处与机器可读介质的基板物理关联的分子的集合;从分子的集合中确定二进制值,其中确定所述二进制值包括:将二进制值中与其相关联的分子存在于集合中的位置处的位设置为1,并且将在该集合中的位置处的每个位设置为0,其中其关联分子不存在于所述集合中。
18.一种向机器可读介质写入数据的方法,所述方法包括接收包括多个数字的数值,每个数字具有一个位置;接收多个数字/位置对和明确可鉴定的分子的组之间的一对一关联;确定对应于数值的分子的集合,其中确定所述集合包括:在所述集合中包括与在数值中具有相关的数字的每个位置相关联的分子;将所述集合的分子与机器可读介质的基板在其上的可寻址位置处物理关联。
19.一种从机器可读介质读取数据的方法,所述方法包括接收多个数字/位置对和明确可鉴定的分子的组之间的一对一关联;确定在其上的可寻址位置处与机器可读介质的基板物理关联的分子的集合;从分子的集合中确定数值,其中确定所述数值包括:将数值的每个位置设置为其关联分子存在于集合中的数字。
20.16-19中任一项所述的方法,其中接收关联包括读取查找表。
21.16-19中任一项所述的方法,其中所述数值是具有预定位数N的二进制值。
22.21所述的方法,其中所述数值是具有32位的二进制值。
23.16-22中任一项所述的方法,其中每个集合编码位串。
24.23所述的方法,其中所述位串编码ASCII值。
25.16-24中任一项所述的方法,其中所述组中的每个分子通过物理性质可鉴定。
26.25所述的方法,其中所述集合中的每个分子通过质荷比鉴定。
27.16-26中任一项所述的方法,其中所述集合中的每个分子在各自的可寻址位置处与基板连接。
28.17或19所述的方法,其中确定所述分子的集合包括确定所述集合中所述分子的物理性质。
29.17或19所述的方法,其中确定所述分子的集合包括确定所述集合中所述分子的质荷比。
30.16-29中任一项所述的方法,其中所述数值是具有32位的二进制值;以及所述分子的组包含由以下氨基酸序列表示的所述寡肽:Ac-AK(me3)C、Ac-(abu)K(me3)C、Ac-VK(me3)C、Ac-GGK(me3)C、Ac-GVK(me3)C、Ac-GLK(me3)C、Ac-ALK(me3)C、Ac-GFK(me3)C、Ac-GVGK(me3)C、Ac-GLGK(me3)C、Ac-GAGGK(me3)C、Ac-GL(abu)K(me3)C、Ac-GFGK(me3)C、Ac-GRGK(me3)C、Ac-GPAGK(me3)C、Ac-AYGK(me3)C、Ac-GPFK(me3)C、Ac-GVVGK(me3)C、Ac-G(abu)FGK(me3)C、Ac-GVFGK(me3)C、Ac-GVYGK(me3)C、Ac-GARGGK(me3)C、Ac-GAVV(abu)K(me3)C、Ac-GFYGK(me3)C、Ac-GYYGK(me3)C、Ac-GYYAK(me3)C、Ac-GPYFK(me3)C、Ac-GRGFGK(me3)C、Ac-GYFGGK(me3)C、Ac-GYYGGK(me3)C、Ac-AYYGGK(me3)C和Ac-GYY(abu)GK(me3)C,其中每个Ac是乙酰基和每个Abu是2-氨基丁酸。
本公开的各种实施方式的描述是为了说明的目的而呈现的,但并不旨在穷举或限制于所公开的实施方式。在不脱离所描述实施方式的范围和精神的情况下,很多修改和变化对于本领域普通技术人员而言将是显而易见的。选择本文使用的术语是为了最好地解释实施例的原理、实际应用或对市场中发现的技术的技术改进,或者使本领域的其他普通技术人员能够理解本文公开的实施方式。
本文引用的所有专利、公开申请和参考文献的教导通过引用的方式整体并入。
尽管本发明已经参照其示例性实施方式进行了具体展示和描述,但本领域技术人员将理解,在不背离所附权利要求所涵盖的本发明范围的情况下,可以对其中的形式和细节进行各种改变。
Claims (52)
1.一种机器可读介质,其包括:
其上具有可寻址位置阵列的基板,每个可寻址位置适合与k个分子的集合物理关联,其中k是0或者小于或等于n的整数,其中n是整数,
其中每个集合中的所述分子选自n个明确可鉴定的分子的组,其中每个集合是所述n个分子的组中的k-组合,每个集合与小于或等于n位的数值唯一地相关联,其中所述集合的存在指示所述数值。
2.根据权利要求1所述的机器可读介质,进一步地其中所述集合中的每个分子在各自的可寻址位置处与所述基板连接。
3.根据权利要求1或权利要求2所述的机器可读介质,其中所述数值是二进制。
4.根据权利要求3所述的机器可读介质,其中n=32。
5.根据权利要求1所述的机器可读介质,其中所述数值编码ASCII值。
6.根据权利要求1-5中任一项所述的机器可读介质,其中所述组中的每个分子通过物理性质可鉴定。
7.根据权利要求6所述的机器可读介质,其中所述物理性质是荧光发射波长。
8.根据权利要求7所述的机器可读介质,其中所述组中的每个分子包含量子点。
9.根据权利要求8所述的机器可读介质,其中所述组中的至少一个分子包含硒化镉-硫化镉量子点。
10.根据权利要求9所述的机器可读介质,其中所述组中的至少一个分子包含硒化锌-硫化锌量子点。
11.根据权利要求8所述的机器可读介质,其中所述组中的至少一个分子包含硫化铅、硒化铅、硒化镉、硫化镉、碲化镉、砷化铟、磷化铟、硒化锌或硫化锌。
12.根据权利要求8所述的机器可读介质,其中所述集合中的每个分子通过酰胺键与所述基板连接。
13.根据权利要求12所述的机器可读介质,其中所述基板包含环氧树脂。
14.根据权利要求6所述的机器可读介质,其中所述物理性质是质荷比。
15.根据前述任一项权利要求所述的机器可读介质,其中所述组中的每个分子是聚合物或低聚物。
16.根据权利要求15所述的机器可读介质,其中每个分子是寡肽。
17.根据权利要求16所述的机器可读介质,其中每个分子在其C末端包含Nε,Nε,Nε-三甲基赖氨酸-半胱氨酸(K(Me3)C)二肽。
18.根据权利要求1或权利要求2所述的机器可读介质,其中:
所述分子的组包含由以下氨基酸序列表示的所述寡肽:Ac-AK(me3)C、Ac-(abu)K(me3)C、Ac-VK(me3)C、Ac-GGK(me3)C、Ac-GVK(me3)C、Ac-GLK(me3)C、Ac-ALK(me3)C、Ac-GFK(me3)C、Ac-GVGK(me3)C、Ac-GLGK(me3)C、Ac-GAGGK(me3)C、Ac-GL(abu)K(me3)C、Ac-GFGK(me3)C、Ac-GRGK(me3)C、Ac-GPAGK(me3)C、Ac-AYGK(me3)C、Ac-GPFK(me3)C、Ac-GVVGK(me3)C、Ac-G(abu)FGK(me3)C、Ac-GVFGK(me3)C、Ac-GVYGK(me3)C、Ac-GARGGK(me3)C、Ac-GAVV(abu)K(me3)C、Ac-GFYGK(me3)C、Ac-GYYGK(me3)C、Ac-GYYAK(me3)C、Ac-GPYFK(me3)C、Ac-GRGFGK(me3)C、Ac-GYFGGK(me3)C、Ac-GYYGGK(me3)C、Ac-AYYGGK(me3)C和Ac-GYY(abu)GK(me3)C,其中每个Ac是乙酰基和每个Abu是2-氨基丁酸。
19.一种向机器可读介质写入数据的方法,所述方法包括:
接收具有小于或等于n位的数值,其中n是整数;
接收数值与k个分子的集合之间的一对一关联,其中k是0或者小于或等于n的整数,其中所述集合是n个分子的组中的k-组合;
根据所述一对一关联确定对应于所述数值的所述集合;
将所述集合的所述分子与所述机器可读介质的基板在其上的可寻址位置处物理关联。
20.根据权利要求19所述的方法,其中将所述集合的所述分子与基板物理关联的步骤包括,针对所述集合中的每个分子,将所述分子与所述基板连接。
21.根据权利要求19或权利要求20所述的方法,其中所述数值是二进制。
22.根据权利要求21所述的方法,其中n=32。
23.根据权利要求19所述的方法,其中所述数值编码ASCII值。
24.根据权利要求19-23中任一项所述的方法,其中所述组中的每个分子通过物理性质可鉴定。
25.根据权利要求24所述的方法,其中所述物理性质是荧光发射波长。
26.根据权利要求25所述的方法,其中所述组中的每个分子包含量子点。
27.根据权利要求26所述的方法,其中所述组中的至少一个分子包含硒化镉-硫化镉量子点。
28.根据权利要求26所述的方法,其中所述组中的至少一个分子包含硒化锌-硫化锌量子点。
29.根据权利要求26所述的方法,其中所述组中的至少一个分子包含硫化铅、硒化铅、硒化镉、硫化镉、碲化镉、砷化铟、磷化铟、硒化锌或硫化锌。
30.根据权利要求20所述的方法,其中所述集合中的每个分子通过酰胺键与所述基板连接。
31.根据权利要求30所述的方法,其中所述基板包含环氧树脂。
32.根据权利要求24所述的方法,其中所述物理性质是质荷比。
33.根据前述任一项权利要求所述的方法,其中所述组中的每个分子是聚合物或低聚物。
34.根据权利要求33所述的方法,其中每个分子是寡肽。
35.根据权利要求34所述的方法,其中每个分子在其C末端包含Nε,Nε,Nε-三甲基赖氨酸-半胱氨酸(K(Me3)C)二肽。
36.根据权利要求19或权利要求20所述的方法,其中:
所述分子的组包含由以下氨基酸序列表示的所述寡肽:Ac-AK(me3)C、Ac-(abu)K(me3)C、Ac-VK(me3)C、Ac-GGK(me3)C、Ac-GVK(me3)C、Ac-GLK(me3)C、Ac-ALK(me3)C、Ac-GFK(me3)C、Ac-GVGK(me3)C、Ac-GLGK(me3)C、Ac-GAGGK(me3)C、Ac-GL(abu)K(me3)C、Ac-GFGK(me3)C、Ac-GRGK(me3)C、Ac-GPAGK(me3)C、Ac-AYGK(me3)C、Ac-GPFK(me3)C、Ac-GVVGK(me3)C、Ac-G(abu)FGK(me3)C、Ac-GVFGK(me3)C、Ac-GVYGK(me3)C、Ac-GARGGK(me3)C、Ac-GAVV(abu)K(me3)C、Ac-GFYGK(me3)C、Ac-GYYGK(me3)C、Ac-GYYAK(me3)C、Ac-GPYFK(me3)C、Ac-GRGFGK(me3)C、Ac-GYFGGK(me3)C、Ac-GYYGGK(me3)C、Ac-AYYGGK(me3)C和Ac-GYY(abu)GK(me3)C,其中每个Ac是乙酰基和每个Abu是2-氨基丁酸。
37.一种从机器可读介质读取数据的方法,所述方法包括:
接收数值与k个分子的集合之间的一对一关联,其中k是0或者小于或等于n的整数,其中n是整数,其中所述集合是n个分子的组中的k-组合;
确定与所述机器可读介质的基板在其可寻址位置处物理关联的所述分子的集合;和
根据所述一对一关联从所述分子的集合确定数值。
38.根据权利要求37所述的方法,其中确定与基板物理关联的所述分子的集合的步骤包括,对于每个物理位置,同时确定所述物理位置处至少两个分子的物理性质,从而鉴定所述分子。
39.根据权利要求38所述的方法,其中同时确定所述集合中至少两个分子的物理性质的步骤包括,对于每个分子,确定其相应的荧光发射波长。
40.根据权利要求37-39中任一项所述的方法,其中所述集合中的每个分子在各自的可寻址位置处与所述基板连接。
41.根据权利要求37-40中任一项所述的方法,其中接收所述关联包括读取查找表。
42.根据权利要求37-41中任一项所述的方法,其中所述数值是二进制。
43.根据权利要求42所述的方法,其中n=32。
44.根据权利要求37所述的方法,其中所述数值编码ASCII值。
45.根据权利要求37-44中任一项所述的方法,其中确定与基板物理关联的所述分子的集合的步骤包括鉴定至少一个分子的质荷比。
46.根据权利要求37-38中任一项所述的方法,其中:
所述分子的组包含由以下氨基酸序列表示的所述寡肽:Ac-AK(me3)C、Ac-(abu)K(me3)C、Ac-VK(me3)C、Ac-GGK(me3)C、Ac-GVK(me3)C、Ac-GLK(me3)C、Ac-ALK(me3)C、Ac-GFK(me3)C、Ac-GVGK(me3)C、Ac-GLGK(me3)C、Ac-GAGGK(me3)C、Ac-GL(abu)K(me3)C、Ac-GFGK(me3)C、Ac-GRGK(me3)C、Ac-GPAGK(me3)C、Ac-AYGK(me3)C、Ac-GPFK(me3)C、Ac-GVVGK(me3)C、Ac-G(abu)FGK(me3)C、Ac-GVFGK(me3)C、Ac-GVYGK(me3)C、Ac-GARGGK(me3)C、Ac-GAVV(abu)K(me3)C、Ac-GFYGK(me3)C、Ac-GYYGK(me3)C、Ac-GYYAK(me3)C、Ac-GPYFK(me3)C、Ac-GRGFGK(me3)C、Ac-GYFGGK(me3)C、Ac-GYYGGK(me3)C、Ac-AYYGGK(me3)C和Ac-GYY(abu)GK(me3)C,其中每个Ac是乙酰基和每个Abu是2-氨基丁酸。
47.根据权利要求39所述的方法,其中所述组中的每个分子包含量子点。
48.根据权利要求47所述的方法,其中所述组中的至少一个分子包含硒化镉-硫化镉量子点。
49.根据权利要求47所述的方法,其中所述组中的至少一个分子包含硒化锌-硫化锌量子点。
50.根据权利要求47所述的方法,其中所述组中的至少一个分子包含硫化铅、硒化铅、硒化镉、硫化镉、碲化镉、砷化铟、磷化铟、硒化锌或硫化锌。
51.根据权利要求47所述的方法,其中所述集合中的每个分子通过酰胺键与所述基板连接。
52.根据权利要求51所述的方法,其中所述基板包含环氧树脂。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962907341P | 2019-09-27 | 2019-09-27 | |
US62/907,341 | 2019-09-27 | ||
PCT/US2020/052814 WO2021062220A1 (en) | 2019-09-27 | 2020-09-25 | Storage of information using mixtures of molecules |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114787929A true CN114787929A (zh) | 2022-07-22 |
Family
ID=72827016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080067672.8A Pending CN114787929A (zh) | 2019-09-27 | 2020-09-25 | 使用分子混合物的信息存储 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220301624A1 (zh) |
EP (1) | EP4035155A1 (zh) |
JP (1) | JP2022549498A (zh) |
CN (1) | CN114787929A (zh) |
WO (1) | WO2021062220A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112771215A (zh) * | 2018-09-28 | 2021-05-07 | 哈佛学院院长等 | 使用分子混合物存储信息 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021041667A1 (en) | 2019-08-27 | 2021-03-04 | President And Fellows Of Harvard College | Modifying messages stored in mixtures of molecules using thin-layer chromatography |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040114491A1 (en) * | 2002-09-19 | 2004-06-17 | Demetri Psaltis | High density optical data storage |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2875458A2 (en) * | 2012-07-19 | 2015-05-27 | President and Fellows of Harvard College | Methods of storing information using nucleic acids |
WO2018081566A1 (en) * | 2016-10-28 | 2018-05-03 | Integrated Dna Technologies, Inc. | Dna data storage using reusable nucleic acids |
EP3856958A2 (en) * | 2018-09-28 | 2021-08-04 | President and Fellows of Harvard College | Storage of information using mixtures of molecules |
-
2020
- 2020-09-25 CN CN202080067672.8A patent/CN114787929A/zh active Pending
- 2020-09-25 EP EP20789781.0A patent/EP4035155A1/en not_active Withdrawn
- 2020-09-25 JP JP2022519255A patent/JP2022549498A/ja active Pending
- 2020-09-25 WO PCT/US2020/052814 patent/WO2021062220A1/en active Application Filing
-
2022
- 2022-03-25 US US17/704,607 patent/US20220301624A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040114491A1 (en) * | 2002-09-19 | 2004-06-17 | Demetri Psaltis | High density optical data storage |
Non-Patent Citations (1)
Title |
---|
GEORGE M. WHITESIDES ETAL.: "Storage of Information Using Small Organic Molecules", ACS CENTRAL SCIENCE, 1 May 2019 (2019-05-01), pages 911 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112771215A (zh) * | 2018-09-28 | 2021-05-07 | 哈佛学院院长等 | 使用分子混合物存储信息 |
Also Published As
Publication number | Publication date |
---|---|
EP4035155A1 (en) | 2022-08-03 |
JP2022549498A (ja) | 2022-11-25 |
WO2021062220A1 (en) | 2021-04-01 |
US20220301624A1 (en) | 2022-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210217474A1 (en) | Storage of information using mixtures of molecules | |
US20220301624A1 (en) | Storage of information using mixtures of molecules | |
Wang et al. | Selective synthesis of conjugated chiral macrocycles: sidewall segments of (−)/(+)‐(12, 4) carbon nanotubes with strong circularly polarized luminescence | |
Al Ouahabi et al. | Mass spectrometry sequencing of long digital polymers facilitated by programmed inter-byte fragmentation | |
Nagarkar et al. | Storing and reading information in mixtures of fluorescent molecules | |
Wang et al. | Fluorescent materials-based information storage | |
Quick et al. | Preparation of reactive three‐dimensional microstructures via direct laser writing and thiol‐ene chemistry | |
US7077329B2 (en) | Spectral coding by fluorescent semiconductor nanocrystals for document identification and security applications | |
CA3108400A1 (en) | Systems and methods for storing and reading nucleic acid-based data with error protection | |
Fan et al. | ATP‐induced emergent circularly polarized luminescence and encryption | |
Bossi et al. | Reversible red fluorescent molecular switches | |
Kondratuk et al. | Two vernier‐templated routes to a 24‐porphyrin nanoring | |
Amalian et al. | Controlling the structure of sequence‐defined poly (phosphodiester) s for optimal MS/MS reading of digital information | |
Yang et al. | Versatile application of fluorescent quantum dot labels in super-resolution fluorescence microscopy | |
Tuten et al. | Visible‐Light‐Induced Passerini Multicomponent Polymerization | |
Liu et al. | Highly plasticized lanthanide luminescence for information storage and encryption applications | |
Dahlhauser et al. | Efficient molecular encoding in multifunctional self-immolative urethanes | |
Steinkoenig et al. | Molecular access to multi-dimensionally encoded information | |
CA3194071A1 (en) | Systems and methods for writing by sequencing of nucleic acids | |
CN112683874B (zh) | 一种超容量信息编码系统及其应用 | |
Shi et al. | Dendritic Quaternary‐Encoded Oligourethanes for Data Encryption | |
Tanaka et al. | Ring‐Opened Hemiporphyrazines: Helical Molecules Exhibiting Circularly Polarized Luminescence | |
Qiu et al. | Nanographene with multiple embedded heptagons: cascade radical photocyclization | |
Gon et al. | Highly emissive optically active conjugated dimers consisting of a planar chiral [2.2] paracyclophane showing circularly polarized luminescence | |
JP2007524071A (ja) | 立体的高解像度結像 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |