JP2022531790A - Dnaに基づくデータ記憶における探索、算出、および索引付けのためのデータ構造および動作 - Google Patents
Dnaに基づくデータ記憶における探索、算出、および索引付けのためのデータ構造および動作 Download PDFInfo
- Publication number
- JP2022531790A JP2022531790A JP2021566244A JP2021566244A JP2022531790A JP 2022531790 A JP2022531790 A JP 2022531790A JP 2021566244 A JP2021566244 A JP 2021566244A JP 2021566244 A JP2021566244 A JP 2021566244A JP 2022531790 A JP2022531790 A JP 2022531790A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- pool
- symbol
- identifier
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013500 data storage Methods 0.000 title description 15
- 238000004364 calculation method Methods 0.000 title description 12
- 230000006399 behavior Effects 0.000 title description 3
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 539
- 238000000034 method Methods 0.000 claims abstract description 453
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 407
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 407
- 239000000523 sample Substances 0.000 claims description 137
- 238000006243 chemical reaction Methods 0.000 claims description 81
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 70
- 238000003752 polymerase chain reaction Methods 0.000 claims description 49
- 239000011159 matrix material Substances 0.000 claims description 43
- 238000003860 storage Methods 0.000 claims description 41
- 230000009466 transformation Effects 0.000 claims description 39
- 230000008569 process Effects 0.000 claims description 36
- 239000007788 liquid Substances 0.000 claims description 21
- 230000010076 replication Effects 0.000 claims description 21
- 238000013507 mapping Methods 0.000 claims description 20
- 239000007787 solid Substances 0.000 claims description 20
- 108091034117 Oligonucleotide Proteins 0.000 claims description 18
- 239000000843 powder Substances 0.000 claims description 14
- 230000008685 targeting Effects 0.000 claims description 12
- 238000010379 pull-down assay Methods 0.000 claims description 10
- 230000003287 optical effect Effects 0.000 claims description 3
- 230000003362 replicative effect Effects 0.000 claims 3
- 230000006870 function Effects 0.000 abstract description 31
- 238000000605 extraction Methods 0.000 abstract description 6
- 239000010410 layer Substances 0.000 description 158
- 108020004414 DNA Proteins 0.000 description 67
- 102000053602 DNA Human genes 0.000 description 67
- 238000003491 array Methods 0.000 description 27
- 238000009396 hybridization Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 22
- 239000000047 product Substances 0.000 description 20
- 238000009739 binding Methods 0.000 description 17
- 230000015572 biosynthetic process Effects 0.000 description 14
- 239000000126 substance Substances 0.000 description 14
- 230000008901 benefit Effects 0.000 description 13
- 239000002777 nucleoside Substances 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- 125000003835 nucleoside group Chemical group 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 9
- 238000013461 design Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 102000018120 Recombinases Human genes 0.000 description 7
- 108010091086 Recombinases Proteins 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000005192 partition Methods 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 102000003960 Ligases Human genes 0.000 description 5
- 108090000364 Ligases Proteins 0.000 description 5
- 239000008186 active pharmaceutical agent Substances 0.000 description 5
- 239000004615 ingredient Substances 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 238000000844 transformation Methods 0.000 description 5
- 238000001712 DNA sequencing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- -1 cyclic nucleic acid Chemical class 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 150000003833 nucleoside derivatives Chemical class 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000013138 pruning Methods 0.000 description 4
- 229920002477 rna polymer Polymers 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000000018 DNA microarray Methods 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000000704 physical effect Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- RFLVMTUMFYRZCB-UHFFFAOYSA-N 1-methylguanine Chemical compound O=C1N(C)C(N)=NC2=C1N=CN2 RFLVMTUMFYRZCB-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N Hypoxanthine Natural products O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 108010001244 Tli polymerase Proteins 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000007847 digital PCR Methods 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 238000001668 nucleic acid synthesis Methods 0.000 description 2
- NMHMNPHRMNGLLB-UHFFFAOYSA-N phloretic acid Chemical group OC(=O)CCC1=CC=C(O)C=C1 NMHMNPHRMNGLLB-UHFFFAOYSA-N 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- HLYBTPMYFWWNJN-UHFFFAOYSA-N 2-(2,4-dioxo-1h-pyrimidin-5-yl)-2-hydroxyacetic acid Chemical compound OC(=O)C(O)C1=CNC(=O)NC1=O HLYBTPMYFWWNJN-UHFFFAOYSA-N 0.000 description 1
- SGAKLDIYNFXTCK-UHFFFAOYSA-N 2-[(2,4-dioxo-1h-pyrimidin-5-yl)methylamino]acetic acid Chemical compound OC(=O)CNCC1=CNC(=O)NC1=O SGAKLDIYNFXTCK-UHFFFAOYSA-N 0.000 description 1
- YSAJFXWTVFGPAX-UHFFFAOYSA-N 2-[(2,4-dioxo-1h-pyrimidin-5-yl)oxy]acetic acid Chemical compound OC(=O)COC1=CNC(=O)NC1=O YSAJFXWTVFGPAX-UHFFFAOYSA-N 0.000 description 1
- VLEIUWBSEKKKFX-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid Chemical compound OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O VLEIUWBSEKKKFX-UHFFFAOYSA-N 0.000 description 1
- RNXLHFQYBINJSN-UHFFFAOYSA-N 2-amino-2-methyl-1h-purin-6-one Chemical compound CC1(N)NC(=O)C2=NC=NC2=N1 RNXLHFQYBINJSN-UHFFFAOYSA-N 0.000 description 1
- XMSMHKMPBNTBOD-UHFFFAOYSA-N 2-dimethylamino-6-hydroxypurine Chemical compound N1C(N(C)C)=NC(=O)C2=C1N=CN2 XMSMHKMPBNTBOD-UHFFFAOYSA-N 0.000 description 1
- SMADWRYCYBUIKH-UHFFFAOYSA-N 2-methyl-7h-purin-6-amine Chemical compound CC1=NC(N)=C2NC=NC2=N1 SMADWRYCYBUIKH-UHFFFAOYSA-N 0.000 description 1
- MQJSSLBGAQJNER-UHFFFAOYSA-N 5-(methylaminomethyl)-1h-pyrimidine-2,4-dione Chemical compound CNCC1=CNC(=O)NC1=O MQJSSLBGAQJNER-UHFFFAOYSA-N 0.000 description 1
- WPYRHVXCOQLYLY-UHFFFAOYSA-N 5-[(methoxyamino)methyl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CONCC1=CNC(=S)NC1=O WPYRHVXCOQLYLY-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- ZFTBZKVVGZNMJR-UHFFFAOYSA-N 5-chlorouracil Chemical compound ClC1=CNC(=O)NC1=O ZFTBZKVVGZNMJR-UHFFFAOYSA-N 0.000 description 1
- KSNXJLQDQOIRIP-UHFFFAOYSA-N 5-iodouracil Chemical compound IC1=CNC(=O)NC1=O KSNXJLQDQOIRIP-UHFFFAOYSA-N 0.000 description 1
- KELXHQACBIUYSE-UHFFFAOYSA-N 5-methoxy-1h-pyrimidine-2,4-dione Chemical compound COC1=CNC(=O)NC1=O KELXHQACBIUYSE-UHFFFAOYSA-N 0.000 description 1
- VKKXEIQIGGPMHT-UHFFFAOYSA-N 7h-purine-2,8-diamine Chemical compound NC1=NC=C2NC(N)=NC2=N1 VKKXEIQIGGPMHT-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 241000517645 Abra Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 241000544061 Cuculus canorus Species 0.000 description 1
- 108050009160 DNA polymerase 1 Proteins 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102000005717 Myeloma Proteins Human genes 0.000 description 1
- 108010045503 Myeloma Proteins Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108010019653 Pwo polymerase Proteins 0.000 description 1
- 108010020713 Tth polymerase Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000007641 inkjet printing Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000002346 layers by function Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- IZAGSTRIDUNNOY-UHFFFAOYSA-N methyl 2-[(2,4-dioxo-1h-pyrimidin-5-yl)oxy]acetate Chemical compound COC(=O)COC1=CNC(=O)NC1=O IZAGSTRIDUNNOY-UHFFFAOYSA-N 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005580 one pot reaction Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 230000006886 spatial memory Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/50—Compression of genetic data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
本出願は、2019年5月9日出願の"NUCLEIC ACID-BASED DATA STORAGE: SEARCH AND COMPUTE"という名称の米国仮特許出願第62/845,638号、2019年6月11日出願の"DATA STRUCTURES FOR DNA STORAGE"という名称の米国仮特許出願第62/860,117号、および2019年8月22日出願の"INDEX AND SEARCH OF INFORMATION STORED IN DNA"という名称の米国仮特許出願第62/890,243号に対する優先権および利益を主張する。上記に参照した出願の内容全体が、参照により本明細書に組み込まれている。
(1)コーデック:ライタ特有の最適化を伴うエンコーダ/デコーダパイプライン
(2)化学インターフェース:ビット演算から化学動作への変換
(3)自動化インターフェース:自動化デバイスへのインターフェースおよびトランスレータ
(4)ブロック抽象化:ブロックに基づくインターフェースおよびコアデータ構造への対応
(5)探索および索引:意味注釈および索引付けのためのインフラストラクチャ
(6)アーカイブアプリケーション:OSを実証するアーカイブアプリケーション
本明細書に記載する符号化方式およびOSの利益には、書込み速度、書込みコスト、読取りコスト、またはアクセスコストに関して最適化された符号化方式を選択する能力、復号されるフットプリントを最小にするようにブロックへの索引データのマッピングを最適化する能力、大きいブロックから単一のビットおよびモデルデータ構造まですべてのスケールで情報を固有に操作する能力、ならびにデータおよび関係に関する格納、照会、および推論を可能にする現在のアーカイブ規格および慣行による緊密な統合が含まれる。
rank0(x)=x-rank1(x)+1 等式2
rank1(x)=x-rank0(x)+1 等式3
したがって、ステップ2711は、別法として、rank0を実施することができる。
Claims (165)
- 核酸分子のプールに記憶されたデジタル情報からビットストリング内の特定のビットのランクを取得する方法であって、各ビットが、ビット値およびビット位置を有し、前記方法が、
(a)前記ビットストリングを表す識別子核酸分子の第1のプールを取得することであって、前記プールが、粉末、液体、または固体の形態を有し、前記第1のプール内の各識別子核酸分子が成分核酸分子を含み、前記成分核酸分子の少なくとも一部分が、1つまたは複数のプローブに結合するように構成される、第1のプールを取得することと、
(b)前記ビットストリングから導出されたカウンタシンボルストリングを表す識別子核酸分子の第2のプールを取得することであって、各カウンタシンボルが、特有のビット値を有する前記ビットストリング内のすべてのw個のビットに対するビットの数のランニングカウントを示すb個のカウンタビットのストリングによって表される、第2のプールを取得することと、
(c)(1)前記特定のビットに先行するw個のビットのすべてのブロック、または(2)前記特定のビットを含むw個のビットの前記ブロックを含む、前記特定のビットに先行するw個のビットのすべてのブロックのいずれかに対して、所与の値の前記ビットの数の前記ランニングカウントを示す対応するカウンタシンボルを表す前記第2のプール内の前記識別子核酸分子を少なくとも標的とするように、第2の一連のプローブを有する(b)の前記第2のプールにアクセスすることによって、第1のカウントを取得することと、
(d)(1)前記特定のビットに先行しもしくは前記特定のビットを含む、(c)で計数されていないビットを表す、または(2)(c)で計数されたが前記特定のビットに先行しないもしくは前記特定のビットを含まないビットを表す、前記第1のプール内の1つまたは複数の別個の識別子核酸分子を標的とするように、第1の一連のプローブを有する(a)の前記第1のプールにアクセスすることによって、第2のカウントを取得することと、
(e)前記第1のカウントおよび前記第2のカウントから、前記ビットストリング内の前記特定のビットの前記ランクを取得することと
を含む方法。 - 前記第1のプール内の前記識別子核酸分子が、識別子の存在が、ビット位置の前記ビット値「1」を表すように前記ビットストリングを表す、請求項1に記載の方法。
- (c)の前記第1のカウントが、前記特定のビットに先行するw個のビットのすべてのブロックを表すとき、(d)の前記第1の一連のプローブが、前記特定のビットに先行するまたは前記特定のビットを含む、(c)で計数されていないビットを表す前記第1のプール内の1つまたは複数の別個の識別子核酸分子を標的とし、前記ビットストリング内の前記特定のビットの前記ランクが、(e)で前記第1および第2のカウントを合計することによって取得される、請求項1および2のいずれかに記載の方法。
- (c)の前記第1のカウントが、前記特定のビットに先行し、前記特定のビットを含むw個のビットの前記ブロックを含む、w個のビットのすべてのブロックを表すとき、前記第1の一連のプローブが、(c)で計数されたが前記特定のビットに先行しないまたは前記特定のビットを含まないビットを表す前記第1のプール内の1つまたは複数の別個の識別子核酸分子を標的とし、前記ビットストリング内の前記特定のビットの前記ランクが、(e)の前記第1のカウントから前記第2のカウントを引くことによって取得される、請求項1および2のいずれかに記載の方法。
- 前記第1のカウントが、(c)の前記標的とされた識別子核酸分子に対応するカウンタシンボル値を読み取ることによって取得される、請求項1~4のいずれかに記載の方法。
- 前記第2のカウントが、(d)からの前記標的とされた識別子核酸分子を読み取ることによって取得される、請求項1~5のいずれかに記載の方法。
- (a)の前記第1のプールが、(b)の前記第2のプールである、請求項1~6のいずれかに記載の方法。
- (a)の前記第1のプールが、(b)の前記第2のプールとは別個である、請求項1~6のいずれかに記載の方法。
- 前記第1のプール内の対応する識別子核酸分子の存在が、前記ビット値1を示し、前記第1のプール内の対応する識別子核酸分子の不在が、前記ビット値0を示す、請求項1~8のいずれかに記載の方法。
- 前記ビットストリングが、長さnを有し、bがlog2(n+1)の上限である、請求項1~9のいずれかに記載の方法。
- 前記カウンタシンボルストリングが、nをwで割った上限個のカウンタシンボルを含み、bにnをwで割った上限を掛けた値に対応する長さを有するカウンタビットストリングによって表される、請求項10に記載の方法。
- 前記特定のビットが、w個のビットの前記第1のブロックの範囲内である場合、w個のビットの前記第1のブロックに先行する前記ランニングカウントが0である、請求項1~11のいずれかに記載の方法。
- 前記特定のビットが、w個のビットの前記第1のブロックの範囲内にない場合、前記特定のビットに先行するw個のビットのすべてのブロックの前記カウンタシンボルが、0からw*B(x)-1の位置範囲内の値1を有する前記ビットストリング内のビットの数を表し、0が前記ビットストリングの第1の位置であり、xが前記ビットストリング内の前記特定のビットの位置に対応し、B(x)がxをwで割った下限である、請求項1~12のいずれかに記載の方法。
- (c)の前記第2のプール内の前記標的とされた識別子核酸分子が、位置b*B(x)およびb*(B(x)+1)-1によって画定される前記範囲内であり、0の位置が、前記ビットストリング内の前記第1の位置に対応する、請求項13に記載の方法。
- 前記第2のカウントが、前記位置の範囲w*B(x)からx内に値1を有する前記ビットストリング内のビットの数に対応し、xが前記ビットストリング内の前記特定のビットの位置に対応し、位置0が、前記第1の位置であり、B(x)が、xをwで割った下限である、請求項1~14のいずれかに記載の方法。
- wがbの値に設定される、請求項1~15のいずれかに記載の方法。
- wが1の値に設定される、請求項1~15のいずれかに記載の方法。
- 前記第1のカウントが、前記特定のビットを含むw個のビットの前記ブロックに対応する前記カウンタシンボルを表す(c)の識別子核酸分子を標的とすることによって取得され、前記ランクが前記第1のカウントと同等である、請求項17に記載の方法。
- ステップ(d)が実行されない、請求項18に記載の方法。
- 前記ビットストリング内のビットのブロックが、識別子核酸分子の前記第1のプール内の隣接して順序付けられた識別子核酸分子のブロックにマッピングされる、請求項1~19のいずれかに記載の方法。
- 前記第1のプール内の識別子核酸分子の有無が、前記ビットストリング内のいずれのビット値とも直接相関しない、請求項20に記載の方法。
- 前記ビットストリングの固定長のサブストリング(ワード)が、固定数の可能な固有の識別子核酸分子からの固定数の固有の識別子核酸分子を含むコードワードにマッピングされる、請求項20および21のいずれかに記載の方法。
- 追加の情報を使用して、前記第1および第2のプールからの識別子核酸分子の書込み、アクセス、および読取りのエラーを検出および補正することをさらに含む、請求項1~22のいずれかに記載の方法。
- 前記追加の情報が、前記第1および第2のプールの前記識別子核酸分子に記憶される、請求項23に記載の方法。
- 前記ビットストリングが、シンボルストリングを表し、前記ランクが、前記シンボルストリング内の特定のシンボルに対して取得される、請求項1~24のいずれかに記載の方法。
- 前記シンボルストリング内の前記シンボルが、シンボル値のセットから選択され、(b)の前記カウンタシンボルストリングが、前記特定のシンボル値を有するシンボルの数のランニングカウントを示す、請求項25に記載の方法。
- (b)の識別子核酸分子の異なる第2のプールが、特有のシンボル値のインスタンスの数を計数する異なるカウンタシンボルストリングを表し、異なる各カウンタシンボルストリングが、対応する特有のシンボル値のインスタンスを計数する、請求項25および26のいずれかに記載の方法。
- M個の選択された成分核酸分子を物理的に組み立てることによって、識別子核酸分子を形成することをさらに含み、前記M個の選択された成分核酸分子の各々が、M個の異なる層に分離された別個の成分核酸分子のセットから選択される、請求項1~27のいずれかに記載の方法。
- 核酸分子のプールからデジタル情報をフェッチする方法であって、
(a)識別子核酸分子の第1のプールを取得することであって、前記プールが、粉末、液体、または固体の形態を有し、前記第1のプール内の各識別子核酸分子が成分核酸分子を含み、前記成分核酸分子の少なくとも一部分が、1つまたは複数のプローブに結合するように構成され、前記識別子核酸分子が、前記シンボル値が、前記第1のプール内の前記対応する識別子核酸分子の有無によって示されるようにシンボルストリングを表す、取得することと、
(b)第1の一連のプローブを有する前記第1のプールにアクセスすることであり、前記第1の一連のプローブの各々が、前記成分核酸分子の少なくとも1つを標的として、前記第1のプールからの識別子核酸分子のサブセットを有する第2のプールを作成する、アクセスすることと、
(c)前記第2のプールからの前記識別子核酸分子のサブセットの配列を読み取ることと、
(d)前記配列を使用して、(a)からの前記シンボルストリング内のシンボルの少なくともサブセットを取得することと
を含む方法。 - 各識別子核酸分子が、M個の層の各々からの成分核酸配列を有する別個の成分核酸分子を含み、各層が、前記成分核酸配列のセットを含む、請求項29に記載の方法。
- 前記M個の層が論理的に順序付けられる、請求項30に記載の方法。
- 各層の前記成分核酸配列が論理的に順序付けられる、請求項31に記載の方法。
- 前記識別子核酸分子が、前記識別子核酸配列を第1の層内の対応する成分核酸配列によって分類し、前記識別子核酸配列を第2の層内の対応する成分核酸配列によって細分し、残りのM-2個の層の各々に対して前記細分プロセスを繰り返すことによって、論理的に順序付けられた識別子核酸配列に対応する、請求項32に記載の方法。
- 各識別子配列が、照会木内のパスとして表される一連の成分核酸配列を含み、前記照会木が、根ノードから開始し、各層に1つのインスタンスでM個のインスタンスにわたって分岐し、葉ノードで終了し、各葉ノードが、識別子核酸配列を表す、請求項33に記載の方法。
- 前記第1の一連のプローブが、前記照会木内の前記根ノードからの部分パスまたはフルパスに対応する、請求項34に記載の方法。
- 前記フルパスが、前記一連のプローブが、単一の識別子核酸分子を標的とするように、M個のプローブを含む根から葉までのパスに対応する、請求項35に記載の方法。
- 前記部分パスが、前記一連のプローブが異なる配列を有する識別子核酸分子の複数の母集団を標的とするように、M個より少ないプローブに対応する、請求項36に記載の方法。
- 異なる配列を有する識別子核酸分子の前記複数の母集団が、少なくとも前記第Mの層内の異なる成分核酸分子に対応する、請求項37に記載の方法。
- 前記第1のプールが、複数の一連のプローブによってアクセスされる、請求項29~38のいずれかに記載の方法。
- (a)の前記第1のプールを少なくとも2つの複製プールに分割することをさらに含み、(b)、(c)、および(d)が、前記一連のプローブの各々を有する前記複製プールの各々で実行される、請求項39に記載の方法。
- 前記少なくとも2つの複製プールに分割する前に、前記第1のプールを複製することをさらに含む、請求項40に記載の方法。
- プローブのサブシリーズを有する識別子核酸分子の第1のプールにアクセスして、識別子核酸分子の中間プールを作成することをさらに含む、請求項41に記載の方法。
- 識別子核酸の中間プールを少なくとも2つの複製プールに分割することをさらに含む、請求項42に記載の方法。
- 前記少なくとも2つの複製プールに分割する前に、前記中間プールを複製することをさらに含む、請求項43に記載の方法。
- 後続のプローブのサブシリーズを有する識別子核酸分子の第1の中間プールにアクセスして、識別子核酸分子の第2の中間プールまたは識別子核酸分子の第2のプールを形成することをさらに含む、請求項39~44のいずれかに記載の方法。
- 識別子核酸分子の少なくとも2つの中間プールを組み合わせて、識別子核酸分子の別の中間プールまたは識別子核酸分子の第2のプールを形成することをさらに含む、請求項39~45のいずれかに記載の方法。
- 前記複製が、ポリメラーゼ連鎖反応(PCR)によって実行される、請求項41および44のいずれかに記載の方法。
- プローブがPCRプライマーであり、アクセスがポリメラーゼ連鎖反応によって実行される、請求項29~47のいずれかに記載の方法。
- 前記プローブが親和性タグ付きオリゴヌクレオチドであり、アクセスが親和性プルダウンアッセイによって実行される、請求項29~47のいずれかに記載の方法。
- 長さnのビットストリングを含むメッセージ内の長さpの特定のビットパターンのカウントを取得する方法であって、
(a)ビットストリングLを表す識別子核酸分子の第1のプールを取得することであって、前記ビットストリングLが、前記メッセージのBurrows-Wheeler変換行列の最後の列であり、前記第1のプールが、粉末、液体、または固体の形態を有し、前記第1のプール内の各識別子核酸分子が成分核酸分子を含み、前記成分核酸分子の少なくとも一部分が、1つまたは複数のプローブに結合するように構成される、第1のプールを取得することと、
(b)前記ビットストリングLから導出されたカウンタシンボルストリングを表す識別子核酸分子の第2のプールを取得することであって、各カウンタシンボルが、特有のビット値「1」を有する前記ビットストリングL内のすべてのw個のビットに対するビットの数のランニングカウントを示すb個のカウンタビットのストリングによって表される、第2のプールを取得することと、
(c)一連のプローブを使用して、前記ビットストリングL内のビット値「1」の発生の総数に対する前記カウンタシンボルを表す前記第2のプールからの前記識別子核酸分子にアクセスすることと、
(d)(c)の前記アクセスされた識別子核酸分子を読み取って、前記ビットストリングL内のビット値「1」の発生の前記総数を計数することと、
(e)(d)からの各ビット値の発生の前記総数を使用して、前記メッセージの前記Burrows-Wheeler変換行列の第1の列Fを再構築することと、
(f)前記第1の列F内の前記第pのビット値の範囲を画定する第1の位置hおよび最後の位置zを、hおよびzを含めて判定することと、
(g)第1の一連のプローブを使用して、前記第1のプールおよび前記第2のプールからの前記識別子核酸分子にアクセスして、L内の位置h-1における前記パターンの前記第(p-i)のビット値の前記ランクrh-1を計算することであり、i=1である、計算することと、
(h)第2の一連のプローブを使用して、前記第1のプールおよび第2のプールからの前記識別子核酸分子にアクセスして、L内の位置zにおける前記パターンの前記第(p-i)のビット値の前記ランクrzを計算することと、
(i)rh-1がrzに等しい場合、前記メッセージ内の前記パターンの発生の前記カウントを0として設定することと、
(j)そうではなく、rh-1がrzに等しくない場合、
(j1)hをF内の前記第(p-i)のビット値の第(rh-1+1)のインスタンスの索引に設定し、
(j2)zをF内の前記第(p-i)のビット値の第rzのインスタンスの索引に設定し、
(j3)iを1だけ増分し、
(j4)i=p-1になるまで、ステップ(g)、(h)、(i)、(j)、(j1)、(j2)、および(j3)を複数回繰り返し、
(j5)前記メッセージ内の前記パターンの発生の前記カウントをz-h+1として計算することとを含む、方法。 - (a)の前記第1のプールが、(b)の前記第2のプールである、請求項50に記載の方法。
- (a)の前記第1のプールが、(b)の前記第2のプールとは別個である、請求項50に記載の方法。
- 前記第1のプール内の対応する識別子核酸分子の存在が、前記ビット値1を示し、前記第1のプール内の対応する識別子核酸分子の不在が、前記ビット値0を示す、請求項50~52のいずれかに記載の方法。
- bがlog2(n+1)の上限である、請求項50~53のいずれかに記載の方法。
- 前記カウンタシンボルストリングが、nをwで割った上限個のカウンタシンボルを含み、bにnをwで割った上限を掛けた値に対応する長さを有するカウンタビットストリングによって表される、請求項54に記載の方法。
- L内のw個のビットの前記第1のブロックに先行するあらゆるビット値の前記ランニングカウントが0である、請求項50~55のいずれかに記載の方法。
- wがbの値に設定される、請求項50~56のいずれかに記載の方法。
- wが1の値に設定される、請求項50~57のいずれかに記載の方法。
- 前記ビットストリングL内のビットのブロックを、前記第1のプール内の隣接して順序付けられた識別子核酸分子のブロックにマッピングすることをさらに含む、請求項50~58のいずれかに記載の方法。
- 前記ビットストリングLの固定長のサブストリングが、固有の識別子核酸分子の固定サイズのセットから選択された固定数の固有の識別子核酸分子によって表されるコードワードにマッピングされる、請求項59に記載の方法。
- 前記第1および第2のプールからの識別子核酸分子の書込み、アクセス、および読取りのエラーを検出および補正するために、追加の情報が使用される、請求項50~60のいずれかに記載の方法。
- 前記追加の情報が、前記第1および第2のプールの前記識別子核酸分子に記憶される、請求項61に記載の方法。
- 前記メッセージのBurrows-Wheeler変換から導出された接尾辞アレイSAを表す識別子核酸分子の第3のプールを取得することをさらに含み、SAの各要素が、前記メッセージ内のLの対応する要素の位置を示す少なくともlog2(n)個のビットのビットストリングによって表される、請求項50~62のいずれかに記載の方法。
- 前記カウントが0より大きいとき、hおよびzに対する最終値を含むhとzとの間の位置における前記接尾辞アレイ内の要素に対応する前記第3のプール内の前記識別子核酸分子にアクセスすることによって、前記メッセージ内の前記パターンの前記発生を位置付けることをさらに含む、請求項63に記載の方法。
- 前記メッセージを表す識別子核酸分子の第4のプールを取得することをさらに含む、請求項64に記載の方法。
- 前記第1の場所および前記第1の場所を取り囲む位置の近傍に対応する前記第4のプール内の前記識別子核酸分子にアクセスすることによって、前記パターンの前記第1の場所のコンテキストを抽出することをさらに含む、請求項65に記載の方法。
- 長さnのビットストリングを含むメッセージ内の長さpの特定のビットパターンのカウントを取得する方法であって、
(a)ビットストリングLを表す識別子核酸分子の第1のプールを取得することであって、前記ビットストリングLが、前記メッセージのBurrows-Wheeler変換行列の最後の列であり、前記第1のプールが、粉末、液体、または固体の形態を有し、前記第1のプール内の各識別子核酸分子が成分核酸分子を含み、前記成分核酸分子の少なくとも一部分が1つまたは複数のプローブに結合するように構成される、第1のプールを取得することと、
(b)特有のビット値を有するビットの数のランニングカウントを表す、前記ビットストリングLから導出されたカウンタシンボルストリングを表す識別子核酸分子の第2のプールを取得することと、
(c)前記第1のプールおよび前記第2のプールからの識別子核酸分子に選択的にアクセスすることによって、前記メッセージ内の前記特定のビットパターンの前記カウントを取得することと
を含む方法。 - ステップ(c)が、前記Burrows-Wheeler変換行列の第1の列Fを再構築することをさらに含む、請求項67に記載の方法。
- ステップ(c)が、一連のプローブを使用して、前記ビットストリングL内の前記特有のビット値の発生の総数に対する前記カウンタシンボルを表す前記第2のプールからの前記識別子核酸分子にアクセスすることと、前記特有のビット値の発生の前記総数を使用して、Fを再構築することとを含む、請求項68に記載の方法。
- ステップ(c)が、前記パターン内の第pのビット値を有するF内の位置の範囲を判定することをさらに含む、請求項68および69のいずれかに記載の方法。
- F内の位置の前記範囲が、第1の位置hおよび最後の位置zによって、hおよびzを含めて画定される、請求項70に記載の方法。
- ステップ(c)が、前記第pのビット後の前記パターン内の先行する各ビットに対して、
一連のプローブを使用して、前記第1のプールおよび前記第2のプールからの前記識別子核酸分子にアクセスして、前記範囲にすぐ先行する位置におけるL内の前記対応するビット値の第1のランク、および前記範囲の末端の位置におけるL内の前記対応するビット値の第2のランクを判定することと、
前記第1のランクおよび前記第2のランクを使用して、前記範囲を、前記パターン内の後続のビットに先行する前記対応するビットのインスタンスを有するF内の位置の範囲に更新することとをさらに含む、請求項70および71のいずれかに記載の方法。 - 前記第1のランクが、L内の位置h-1における前記パターン内のそれぞれの先行するビット値であり、前記第2のランクが、L内の位置zにおける前記パターン内のそれぞれの先行するビット値である、請求項72に記載の方法。
- 前記範囲を更新することが、前記第1のランクに基づいて、hをF内の前記パターン内の前記それぞれの先行するビット値の1つのインスタンスの位置に設定することを含む、請求項73に記載の方法。
- 前記範囲を更新することが、前記第2のランクに基づいて、zをF内の前記パターン内の前記それぞれの先行するビット値の1つのインスタンスの位置に設定することを含む、請求項73および74のいずれかに記載の方法。
- ステップ(c)が、前記第1および第2のランクの前記最終値に基づいて、前記メッセージ内の前記パターンの発生の前記カウントを設定することをさらに含む、請求項72~75のいずれかに記載の方法。
- 発生の前記カウントが、前記第1および第2のランクの前記最終値間の差である、請求項76に記載の方法。
- 前記第1および第2のランクが、前記第pのビットまたはあらゆる先行するビットに対して互いに等しい場合、発生の前記カウントが0に設定される、請求項76に記載の方法。
- 長さnsのシンボルストリングを含むメッセージ内の長さpsの特定のシンボルパターンのカウントを取得する方法であって、各シンボルが、r個のシンボル値のセットから選択され、前記方法が、
(a)前記メッセージのBurrows-Wheeler変換行列の最後の列であるシンボルストリングLを表す識別子核酸分子の第1のプールを取得することであって、前記第1のプールが、粉末、液体、または固体の形態を有し、前記第1のプール内の各識別子核酸分子が成分核酸分子を含み、前記成分核酸分子の少なくとも一部分が、1つまたは複数のプローブに結合するように構成される、第1のプールを取得することと、
(b)識別子核酸分子のr個の第2のプールを取得することであって、前記識別子核酸分子の各々が、Lから導出されたカウンタシンボルストリングCvに対応し、ここでv=1、2、...、rであり、対応するシンボル値Rvを有するL内のシンボルの数のランニングカウントを表す、r個の第2のプールを取得することと、
(c)前記第1のプールおよび前記r個の第2のプールからの識別子核酸分子に選択的にアクセスすることによって、前記メッセージ内の長さpsの特定のシンボルパターンの前記カウントを取得することとを含む方法。 - ステップ(c)が、前記Burrows-Wheeler変換行列の第1の列Fを再構築することをさらに含む、請求項79に記載の方法。
- ステップ(c)が、一連のプローブを使用して、L内の対応する各シンボル値Rvの発生の総数を表す前記r個の第2のプールの各々における前記最後のカウンタシンボルからの前記識別子核酸分子にアクセスすることと、対応する各シンボル値Rvの発生の前記総数を使用して、Fを再構築することとを含む、請求項80に記載の方法。
- ステップ(c)が、前記パターン内の第pのシンボル値を有するF内の位置の範囲を判定することをさらに含む、請求項80および81のいずれかに記載の方法。
- F内の位置の前記範囲が、第1の位置hおよび最後の位置zによって、hおよびzを含めて画定される、請求項82に記載の方法。
- ステップ(c)が、前記第pのシンボル後の前記パターン内の先行する各シンボルに対して、
一連のプローブを使用して、前記第1のプールおよび前記対応する第2のプールからの前記識別子核酸分子にアクセスして、前記範囲にすぐ先行する位置におけるL内の前記対応するシンボル値の第1のランク、および前記範囲の末端の位置におけるL内の前記対応するシンボル値の第2のランクを判定することと、
前記第1のランクおよび前記第2のランクを使用して、前記範囲を、前記パターン内の後続のシンボルに先行する前記対応するシンボルのインスタンスを有するF内の位置の範囲に更新することと
をさらに含む、請求項82および83のいずれかに記載の方法。 - 前記第1のランクrh-1が、L内の位置h-1における前記パターン内のそれぞれの先行するシンボル値であり、前記第2のランクrzが、L内の位置zにおける前記パターン内のそれぞれの先行するシンボル値である、請求項84に記載の方法。
- 前記範囲を更新することが、hをF内の前記パターン内の前記それぞれの先行するシンボル値の第(rh-1+1)のインスタンスの位置に設定することを含む、請求項85に記載の方法。
- 前記範囲を更新することが、zをF内の前記パターン内の前記それぞれの先行するシンボル値の第rzのインスタンスの索引に設定することを含む、請求項85および86のいずれかに記載の方法。
- ステップ(c)が、前記第1および第2のランクの前記最終値に基づいて、前記メッセージ内の前記パターンの発生の前記カウントを設定することをさらに含む、請求項84~87のいずれかに記載の方法。
- 発生の前記カウントが、前記第1および第2のランクの前記最終値間の差である、請求項88に記載の方法。
- 前記第1および第2のランクが、前記第pのシンボルまたはあらゆる先行するシンボルに対して互いに等しい場合、発生の前記カウントが0に設定される、請求項88に記載の方法。
- 識別子核酸分子の前記第1のプールが、r個の第1のプールのうちの1つであり、前記r個の第1のプールの各々が、ビットストリングLvに対応し、ここでv=1、2、...、rであり、したがってLvの要素が、前記シンボル値Rvに一致するLの要素に対してビット値「1」、そうでない場合はビット値「0」を有し、または逆も同様である、請求項79~90のいずれかに記載の方法。
- Lvに対応する前記第1のプールが、前記パターン内のシンボル値Rvの前記第1および第2のランクを判定するために使用される、請求項91に記載の方法。
- 前記メッセージの前記Burrows-Wheeler変換から導出された接尾辞アレイSAを表す識別子核酸分子のプールであるSAプールを取得することをさらに含み、SAの各要素が、前記メッセージ内のLの対応する要素の位置を示す少なくともlog2(n)個のビットのビットストリングによって表される、請求項79~92のいずれかに記載の方法。
- 前記カウントが0より大きいと仮定して、F内の位置の最終範囲によって与えられる位置における前記SAの要素に対応する前記SAプール内の識別子核酸分子にアクセスすることによって、前記メッセージ内の前記パターンの前記発生を位置付けることをさらに含む、請求項93に記載の方法。
- 前記メッセージを表す識別子核酸分子のメッセージプールを取得することをさらに含む、請求項94に記載の方法。
- 第1の場所および前記第1の場所を取り囲む位置の近傍に対応する前記メッセージプール内の前記識別子核酸分子にアクセスすることによって、前記パターンの前記第1の場所のコンテキストを抽出することをさらに含む、請求項95に記載の方法。
- ステップ(c)が、
(c.1)前記第1の列F内の前記第pのシンボル値の範囲を画定する第1の位置hおよび最後の位置zを、hおよびzを含めて判定することと、
(c.2)一連のプローブを使用して、第1のプールおよび第2のプールからの前記識別子核酸分子にアクセスし、L内の位置h-1における前記パターンの第(p-i)のシンボル値のランクrh-1を計算することであり、i=1である、計算することと、
(c.3)一連のプローブを使用して、第1のプールおよび第2のプールからの前記識別子核酸分子にアクセスし、L内の位置zにおける前記パターンの前記第(p-i)のシンボル値のランクrzを計算することと、
(c.4)rh-1がrzに等しい場合、前記メッセージ内の前記パターンの発生の前記カウントを0として設定することと、
(c.5)そうではなく、rh-1がrzに等しくない場合、
(c.5.A)hをF内の前記第(p-i)のシンボル値の第(rh-1+1)のインスタンスの索引に設定し、
(c.5.B)zをF内の前記第(p-i)のシンボル値の第rzのインスタンスの索引に設定し、
(c.5.C)iを1だけ増分し、
(c.5.D)i=p-1になるまで、ステップ(c.2)、(c.3)、(c.4)、(c.5)、(c.5.A)、(c.5.B)、および(c.5.C)を複数回繰り返し、
(c.5.E)前記メッセージ内の前記パターンの発生の前記カウントをz-h+1として計算することと
を含む、請求項79~96のいずれかに記載の方法。 - (c.2)の前記第1のプールおよび前記第2のプールが、前記パターンの前記第(p-i)のシンボル値に対応する、請求項97に記載の方法。
- (c.3)の前記第1のプールおよび前記第2のプールが、前記パターンの前記第(p-i)のシンボル値に対応する、請求項97および98のいずれかに記載の方法。
- 核酸分子内へデジタル情報を記憶する方法であって、
複数のブロックを取得することであって、各ブロックがシンボルストリングを含み、ブロックIDに関連付けられる、取得することと、
前記複数のブロックのうちの1つのブロックをコンテナに割り当てることと、
前記ブロックを、前記コンテナに関連付けられる複数の識別子核酸配列にマッピングすることであって、各識別子核酸配列が成分核酸配列を含み、前記成分核酸配列の少なくとも一部分が、1つまたは複数のプローブに結合するように構成される、マッピングすることと、
前記複数の識別子核酸配列の個々の識別子核酸分子を構築することと、
前記割り当てられたコンテナ内に前記個々の識別子核酸分子を記憶することと
を含み、前記コンテナおよび前記コンテナに関連付けられた前記複数の識別子核酸配列の識別情報を含む物理アドレスが、前記関連付けられたブロックIDを使用して判定されるように構成される、方法。 - 前記ブロックIDが、整数、ストリング、トリプル、属性リスト、または意味注釈である、請求項100に記載の方法。
- 前記物理アドレスが、前記関連付けられたブロックIDを使用して前記物理アドレスにアクセスすることを容易にするように設計されたデータ構造に記憶される、請求項100および101のいずれかに記載の方法。
- 前記データ構造が、B木、トライ、またはアレイのうちの1つである、請求項100~102のいずれかに記載の方法。
- 前記データ構造の少なくとも一部分が、前記デジタル情報とともに索引内に記憶される、請求項102および103のいずれかに記載の方法。
- 前記索引が、第2のコンテナに関連付けられた第2の複数の識別子核酸配列を含む、請求項104に記載の方法。
- 前記索引が、B木データ構造を含み、前記B木の各ノードが、前記第2の複数の識別子核酸配列の別個の複数の識別子核酸分子を含む、請求項105に記載の方法。
- 前記B木内の前記ブロックIDを探索することが、
第1のノードを含む前記別個の複数の識別子核酸分子にアクセスすることと、
前記第1のノードの値を読み取ることと、
ステップ(i)および(ii)のプロセスを後続のノードに対して繰り返すことと
を含み、前記後続のノードを含む前記別個の複数の識別子核酸分子の識別情報が、前記第1のノードの前記値に関連する前記ブロックIDによって判定される、請求項106に記載の方法。 - 前記第1のノードが、前記B木の根ノードであり、ステップ(i)および(ii)の前記プロセスが、前記B木の葉ノードの値が読み取られるまで継続し、前記葉ノードの前記値が、前記ブロックIDに対するブロックが存在するかどうかを通信し、前記ブロックIDが存在する場合、前記ブロックの前記物理アドレスを通信するように構成される、請求項107に記載の方法。
- 前記索引が、トライデータ構造を含み、前記トライの各ノードが、前記第2の複数の識別子核酸配列の別個の複数の識別子核酸分子を含む、請求項105に記載の方法。
- 前記ブロックIDが、シンボルストリングであり、前記トライデータ構造内の各ノードが、前記シンボルストリングの可能な接頭辞に対応する、請求項109に記載の方法。
- 前記トライデータ構造の葉ノードが、前記葉ノード内の前記トライデータ構造によって指定された前記シンボルストリングに一致する前記ブロックIDに関連付けられた前記物理アドレスを表す、請求項110に記載の方法。
- 前記データ構造が、アレイであり、前記アレイの各要素が、前記第2の複数の識別子核酸配列の別個の複数の識別子核酸分子を含む、請求項104に記載の方法。
- 前記アレイ内の各要素が、ブロックIDに対応する、請求項112に記載の方法。
- 前記アレイの各要素が、前記関連付けられたブロックIDの前記物理アドレスを記憶する、請求項113に記載の方法。
- 前記第2の複数の識別子核酸配列を含む識別子核酸分子のプールから、一連のプローブを使用して、物理アドレスにアクセスすることをさらに含む、請求項104~114のいずれかに記載の方法。
- 前記データ構造が、磁気記憶デバイス、光記憶デバイス、フラッシュメモリデバイス、またはクラウドストレージに記憶される、請求項102に記載の方法。
- 前記物理アドレスが、前記物理アドレスを追加のデータ構造に記憶することなく、前記ブロックIDが前記物理アドレスにマッピングされるように、前記ブロックIDに固有に構成される、請求項101に記載の方法。
- 前記ブロックIDが、前記物理アドレスに関連付けられた前記複数の識別子核酸配列のうちのすべての識別子核酸配列によって共用される複数の成分核酸配列にマッピングされる、請求項117に記載の方法。
- ブロックに関連付けられた複数の識別子核酸配列が、隣接して順序付けられた識別子核酸配列を含み、したがって前記複数の識別子核酸配列が、前記識別子範囲内の前記第1および最後の識別子核酸分子の識別情報を含む識別子範囲によって、対応する物理アドレスに指定される、請求項100~118のいずれかに記載の方法。
- 前記識別子範囲内の前記第1および最後の識別子核酸配列が、整数によって表される、請求項119に記載の方法。
- 一連のプローブを使用することによって、ブロックに関連付けられた複数の核酸分子にアクセスすることをさらに含む、請求項100~120のいずれかに記載の方法。
- 前記プローブがPCRプライマーであり、前記アクセスが、ポリメラーゼ連鎖反応によって実行される、請求項115および121のいずれかに記載の方法。
- 前記プローブが親和性タグ付きオリゴヌクレオチドであり、前記アクセスが、親和性プルダウンアッセイによって実行される、請求項112および121のいずれかに記載の方法。
- ブロックIDが位置である、請求項100~123のいずれかに記載の方法。
- 前記位置が、親シンボルストリングの対応するブロックによって表されるシンボルストリングの位置である、請求項124のいずれかに記載の方法。
- 前記親シンボルストリングが、別のシンボルストリングにおけるパターンの前記発生の計数または位置付けのためのデータ構造を含む、請求項125に記載の方法。
- 前記データ構造が、カウンタアレイ、Burrows-Wheeler変換(BWT)行列の列、接尾辞アレイ、接尾辞木、または転置索引のうちの1つである、請求項126に記載の方法。
- 核酸分子に記憶されたデジタル情報を演算する方法であって、
識別子核酸分子の第1のプールを取得することであって、前記プールが、粉末、液体、または固体の形態を有し、前記第1のプール内の各識別子核酸分子が成分核酸分子を含み、前記成分核酸分子の少なくとも一部分が、1つまたは複数のプローブに結合するように構成され、前記識別子核酸分子が、入力シンボルストリングを表す、取得することと、
前記第1のプール内の前記識別子核酸分子でif-then-else演算を実行することであって、前記if-then-else演算が、プローブを有する前記成分核酸分子のうちの少なくとも1つを標的とし、前記第1のプールからの識別子核酸分子のサブセットを有する中間プールを作成する、実行することと、
ステップ(b)を繰り返すことと
を含み、出力シンボルストリングの少なくとも一部分を表す識別子核酸分子の最終プールが作成されるまで、すべての後続のステップで、前記中間プールが前記第1のプールに取って代わる、方法。 - 前記第1のプール内の各識別子核酸分子が、M個の層の各々から別個の成分核酸分子を含み、各層が、成分核酸分子のセットを含む、請求項128に記載の方法。
- if-then-else演算が、特有の成分核酸分子を含むプール内の識別子核酸分子にアクセスすることを含む、請求項128および129のいずれかに記載の方法。
- プローブがPCRプライマーであり、アクセスが、ポリメラーゼ連鎖反応によって実行される、請求項130のいずれかに記載の方法。
- プローブが親和性タグ付きオリゴヌクレオチドであり、アクセスが、親和性プルダウンアッセイによって実行される、請求項130に記載の方法。
- 識別子核酸分子の1つまたは複数のプールで並列に、2つまたはそれよりも多いif-then-else演算が実行される、請求項128~132のいずれかに記載の方法。
- 前記第1のプール、前記中間プール、または前記最終プールのうちの少なくとも1つを少なくとも2つの複製プールに分割することをさらに含む、請求項128~133に記載の方法。
- 前記第1のプール、前記中間プール、または前記最終プールのうちの前記少なくとも1つを分割前に複製することをさらに含む、請求項134に記載の方法。
- 前記複製が、ポリメラーゼ連鎖反応(PCR)によって実行される、請求項135に記載の方法。
- 識別子核酸分子の少なくとも2つの中間プールを組み合わせて、識別子核酸分子の新しい中間プールまたは識別子核酸分子の第2のプールを形成することをさらに含む、請求項128~136のいずれかに記載の方法。
- 核酸分子のプールに記憶されたデジタル情報からシンボルストリング内の特定の位置における特定のシンボル値のランクを取得する方法であって、各シンボルが、シンボル値およびシンボル位置を有し、前記方法が、
(a)前記シンボルストリングを表す識別子核酸分子の第1のプールを取得することであって、前記プールが、粉末、液体、または固体の形態を有し、前記第1のプール内の各識別子核酸分子が成分核酸分子を含み、前記成分核酸分子の少なくとも一部分が、1つまたは複数のプローブに結合するように構成される、第1のプールを取得することと、
(b)前記シンボルストリングから導出されたカウンタシンボルストリングを表す識別子核酸分子の第2のプールを取得することであって、各カウンタシンボルが、前記シンボルストリングのすべてのw個のシンボル内の前記特定のシンボル値のランニングカウントを表す、第2のプールを取得することと、
(c)(1)前記特定の位置に先行するw個のシンボルのすべてのブロック、または(2)前記特定の位置を含むw個のシンボルのブロックを含む、前記特定の位置に先行するw個のシンボルのすべてのブロックのいずれかに対して、前記特定のシンボル値の前記ランニングカウントを示す対応するカウンタシンボルを表す前記第2のプール内の前記識別子核酸分子を少なくとも標的とするように、第2の一連のプローブを有する(b)の前記第2のプールにアクセスすることによって、第1のカウントを取得することと、
(d)(1)前記特定の位置に先行しもしくは前記特定の位置を含む、(c)で計数されていないシンボルを表す、または(2)(c)で計数されたが前記特定の位置に先行しないもしくは前記特定の位置を含まないシンボルを表す、前記第1のプール内の1つまたは複数の別個の識別子核酸分子を標的とするように、第1の一連のプローブを有する(a)の前記第1のプールにアクセスすることによって、第2のカウントを取得することと、
(e)前記第1のカウントおよび前記第2のカウントから、前記シンボルストリング内の前記特定の位置における前記特定のシンボル値の前記ランクを取得することと
を含む方法。 - 前記第1のプール内の前記識別子核酸分子が、識別子核酸分子の存在が、前記シンボル位置における特定のシンボル値を表すように、前記シンボルストリングにマッピングされたビットストリングを表す、請求項138に記載の方法。
- (c)の前記第1のカウントが、前記特定の位置に先行するw個のシンボルのすべてのブロックを表すとき、(d)の前記第1の一連のプローブが、前記特定の位置に先行しまたは前記特定の位置を含む、(c)で計数されていないシンボルを表す前記第1のプール内の1つまたは複数の別個の識別子核酸分子を標的とし、前記シンボルストリング内の前記特定の位置における前記特定のシンボル値の前記ランクが、(e)で前記第1および第2のカウントを合計することによって取得される、請求項138および139のいずれかに記載の方法。
- (c)の前記第1のカウントが、前記特定の位置を含むw個のシンボルの前記ブロックを含む、前記特定の位置に先行するw個のシンボルのすべてのブロックを表すとき、前記第1の一連のプローブが、(c)で計数されたが前記特定の位置に先行しないまたは前記特定の位置を含まないシンボルを表す前記第1のプール内の1つまたは複数の別個の識別子核酸分子を標的とし、前記シンボルストリング内の前記特定の位置における前記特定のシンボル値の前記ランクが、(e)で前記第1のカウントから前記第2のカウントを引くことによって取得される、請求項138および139のいずれかに記載の方法。
- 前記第1のカウントが、(c)の前記標的とされた識別子核酸分子に対応するカウンタシンボル値を読み取ることによって取得される、請求項138~141のいずれかに記載の方法。
- 前記第2のカウントが、(d)からの前記標的とされた識別子核酸分子を読み取ることによって取得される、請求項138~142のいずれかに記載の方法。
- (a)の前記第1のプールが、(b)の前記第2のプールである、請求項138~143のいずれかに記載の方法。
- (a)の前記第1のプールが、(b)の前記第2のプールとは別個である、請求項138~143のいずれかに記載の方法。
- 前記第1のプール内の対応する識別子核酸分子の存在が、第1のシンボル値を示し、前記第1のプール内の対応する識別子核酸分子の不在が、第2のシンボル値を示す、請求項138~145のいずれかに記載の方法。
- 前記シンボルストリングが、長さnを有し、前記カウンタシンボルが、bビットによって表され、ここでbがlog2(n+1)の上限である、請求項138~146のいずれかに記載の方法。
- 前記カウンタシンボルストリングが、nをwで割った上限個のカウンタシンボルを含み、bにnをwで割った上限を掛けた値に対応する長さを有するカウンタビットストリングによって表される、請求項147に記載の方法。
- 前記特定の位置が、w個のシンボルの前記第1のブロックの範囲内である場合、w個のシンボルの前記第1のブロックに先行する前記ランニングカウントが0である、請求項138~148のいずれかに記載の方法。
- 前記特定の位置が、w個のシンボルの前記第1のブロックの範囲内にない場合、前記特定の位置に先行するw個のシンボルのすべてのブロックの前記カウンタシンボルが、前記シンボルストリングの0からw*B(x)-1の位置範囲内の前記特定のシンボル値の発生の数を表し、0が前記シンボルストリングの第1の位置であり、xが前記シンボルストリング内の前記特定の位置に対応し、B(x)がxをwで割った下限である、請求項138~149のいずれかに記載の方法。
- (c)の前記第2のプール内の前記標的とされた識別子核酸分子が、位置b*B(x)およびb*(B(x)+1)-1によって画定される前記範囲内であり、0の位置が、前記シンボルストリング内の前記第1の位置に対応する、請求項150に記載の方法。
- 前記第2のカウントが、前記シンボルストリングのw*B(x)からxの前記位置範囲内の前記特定のシンボル値の発生の数に対応し、xが前記シンボルストリング内の前記特定の位置に対応し、位置0が、前記第1の位置であり、B(x)が、xをwで割った下限である、請求項138~151のいずれかに記載の方法。
- wが、前記シンボルストリングのw個のシンボルを表すビットの長さが、ビットの長さbと同等になり、前記カウンタシンボルを表すように設定される、請求項138~152のいずれかに記載の方法。
- wが1の値に設定される、請求項138~152のいずれかに記載の方法。
- 前記第1のカウントが、前記特定の位置を含むw個のシンボルの前記ブロックに対応する前記カウンタシンボルを表す(c)の識別子核酸分子を標的とすることによって取得され、前記ランクが前記第1のカウントと同等である、請求項154に記載の方法。
- ステップ(d)が実行されない、請求項155に記載の方法。
- 前記シンボルストリング内のw個のシンボルのブロックが、識別子核酸分子の前記第1のプール内の隣接して順序付けられた識別子核酸分子のブロックにマッピングされる、請求項138~156のいずれかに記載の方法。
- 前記シンボルストリング内の前記シンボルがビットであり、各ビットが識別子核酸分子にマッピングされ、したがって識別子核酸分子の前記第1のプール内の前記識別子の有無が、前記ビットの値を示す、請求項157に記載の方法。
- 前記シンボルストリングの固定長のサブストリングが、固定数の可能な固有の識別子核酸分子からの固定数の固有の識別子核酸分子を含むコードワードにマッピングされる、請求項157および158のいずれかに記載の方法。
- 追加の情報を使用して、前記第1および第2のプールからの識別子核酸分子の書込み、アクセス、および読取りのエラーを検出および補正することをさらに含む、請求項138~159のいずれかに記載の方法。
- 前記追加の情報が、前記第1および第2のプールの前記識別子核酸分子に記憶される、請求項160に記載の方法。
- 前記シンボルストリングが、ビットストリングを表す、請求項138~161のいずれかに記載の方法。
- 前記シンボルストリングの各シンボルが、固定数のビットに対応する、請求項162に記載の方法。
- (b)の識別子核酸分子の異なる第2のプールが、特有のシンボル値のインスタンスの数を計数する異なるカウンタシンボルストリングを表し、異なる各カウンタシンボルストリングが、対応する特有のシンボル値のインスタンスを計数する、請求項162および163のいずれかに記載の方法。
- M個の選択された成分核酸分子を物理的に組み立てることによって、識別子核酸分子が形成され、前記M個の選択された成分核酸分子の各々が、M個の異なる層に分離された別個の成分核酸分子のセットから選択される、請求項138~164のいずれかに記載の方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962845638P | 2019-05-09 | 2019-05-09 | |
US62/845,638 | 2019-05-09 | ||
US201962860117P | 2019-06-11 | 2019-06-11 | |
US62/860,117 | 2019-06-11 | ||
US201962890243P | 2019-08-22 | 2019-08-22 | |
US62/890,243 | 2019-08-22 | ||
PCT/US2020/032384 WO2020227718A1 (en) | 2019-05-09 | 2020-05-11 | Data structures and operations for searching, computing, and indexing in dna-based data storage |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022531790A true JP2022531790A (ja) | 2022-07-11 |
JPWO2020227718A5 JPWO2020227718A5 (ja) | 2023-05-16 |
Family
ID=70857293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021566244A Pending JP2022531790A (ja) | 2019-05-09 | 2020-05-11 | Dnaに基づくデータ記憶における探索、算出、および索引付けのためのデータ構造および動作 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11610651B2 (ja) |
EP (1) | EP3966823A1 (ja) |
JP (1) | JP2022531790A (ja) |
KR (1) | KR20220017409A (ja) |
AU (1) | AU2020268440A1 (ja) |
CA (1) | CA3139819A1 (ja) |
WO (1) | WO2020227718A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2017363146B2 (en) | 2016-11-16 | 2023-11-02 | Catalog Technologies, Inc. | Systems for nucleic acid-based data storage |
US11734231B2 (en) * | 2017-10-30 | 2023-08-22 | AtomBeam Technologies Inc. | System and methods for bandwidth-efficient encoding of genomic data |
WO2019160133A1 (ja) * | 2018-02-19 | 2019-08-22 | 日本電信電話株式会社 | 情報管理装置、情報管理方法及び情報管理プログラム |
JP7364604B2 (ja) | 2018-03-16 | 2023-10-18 | カタログ テクノロジーズ, インコーポレイテッド | 核酸ベースのデータ記憶のための化学的方法 |
GB2576304B (en) * | 2018-07-26 | 2020-09-09 | Evonetix Ltd | Accessing data storage provided using double-stranded nucleic acid molecules |
EP3966823A1 (en) | 2019-05-09 | 2022-03-16 | Catalog Technologies, Inc. | Data structures and operations for searching, computing, and indexing in dna-based data storage |
AU2021271639A1 (en) | 2020-05-11 | 2022-12-08 | Catalog Technologies, Inc. | Programs and functions in DNA-based data storage |
US11429279B2 (en) * | 2020-09-16 | 2022-08-30 | Samsung Electronics Co., Ltd. | Automatic data separation and placement for compressed data in a storage device |
WO2023056097A1 (en) * | 2021-10-01 | 2023-04-06 | Imply Data, Inc. | Iterative querying mechanism for data aggregation and visualization |
WO2023177864A1 (en) * | 2022-03-18 | 2023-09-21 | Catalog Technologies, Inc. | Combinatorial enumeration and search for nucleic acid-based data storage |
CN117669703A (zh) * | 2022-08-17 | 2024-03-08 | 密码子(杭州)科技有限公司 | 用于在分子中存储信息的方法、设备和系统 |
US12061637B2 (en) * | 2022-09-11 | 2024-08-13 | Microsoft Technology Licensing, Llc | Heuristic identification of shared substrings between text documents |
KR20240044353A (ko) | 2022-09-27 | 2024-04-04 | 서울대학교산학협력단 | 핵산 응집체를 이용한 분자 연산 가속화 방법 |
Family Cites Families (164)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050032048A1 (en) | 1988-05-03 | 2005-02-10 | Oxford Gene Technology Limited | Analyzing polynucleotide sequences |
US5821886A (en) | 1996-10-18 | 1998-10-13 | Samsung Electronics Company, Ltd. | Variable length code detection in a signal processing system |
AU751956B2 (en) | 1997-03-20 | 2002-09-05 | University Of Washington | Solvent for biopolymer synthesis, solvent microdroplets and methods of use |
US6419883B1 (en) | 1998-01-16 | 2002-07-16 | University Of Washington | Chemical synthesis using solvent microdroplets |
AU6846698A (en) | 1997-04-01 | 1998-10-22 | Glaxo Group Limited | Method of nucleic acid amplification |
US6537747B1 (en) | 1998-02-03 | 2003-03-25 | Lucent Technologies Inc. | Data transmission using DNA oligomers |
US6187537B1 (en) | 1998-04-27 | 2001-02-13 | Donald E. Zinn, Jr. | Process and apparatus for forming a dry DNA transfer film, a transfer film product formed thereby and an analyzing process using the same |
US6458583B1 (en) | 1998-09-09 | 2002-10-01 | Agilent Technologies, Inc. | Method and apparatus for making nucleic acid arrays |
US6309828B1 (en) | 1998-11-18 | 2001-10-30 | Agilent Technologies, Inc. | Method and apparatus for fabricating replicate arrays of nucleic acid molecules |
US6221653B1 (en) | 1999-04-27 | 2001-04-24 | Agilent Technologies, Inc. | Method of performing array-based hybridization assays using thermal inkjet deposition of sample fluids |
US7501245B2 (en) | 1999-06-28 | 2009-03-10 | Helicos Biosciences Corp. | Methods and apparatuses for analyzing polynucleotide sequences |
US6446642B1 (en) | 1999-11-22 | 2002-09-10 | Agilent Technologies, Inc. | Method and apparatus to clean an inkjet reagent deposition device |
CN100485032C (zh) | 2001-05-11 | 2009-05-06 | 松下电器产业株式会社 | 生物分子基底,使用它的检验和诊断方法及装置 |
WO2003025123A2 (en) | 2001-08-28 | 2003-03-27 | Mount Sinai School Of Medecine | Dna: a medium for long-term information storage specification |
EP1430462A4 (en) | 2001-09-25 | 2006-12-20 | Dnaform Kk | PRINTED MATERIALS INCLUDING AN OLIGOMERE AND / OR POLYMER-COATED MEDIA, METHOD FOR THE PREPARATION THEREOF, AND METHOD OF DISPENSING AND / OR STORAGE |
US7361310B1 (en) | 2001-11-30 | 2008-04-22 | Northwestern University | Direct write nanolithographic deposition of nucleic acids from nanoscopic tips |
US20030116630A1 (en) | 2001-12-21 | 2003-06-26 | Kba-Giori S.A. | Encrypted biometric encoded security documents |
US6773888B2 (en) | 2002-04-08 | 2004-08-10 | Affymetrix, Inc. | Photoactivatable silane compounds and methods for their synthesis and use |
WO2003101736A2 (en) | 2002-05-29 | 2003-12-11 | Arizona Board Of Regents, Acting On Behalf Of Arizona State University | Nanoscale ink-jet printing |
US20040043390A1 (en) | 2002-07-18 | 2004-03-04 | Asat Ag Applied Science & Technology | Use of nucleotide sequences as carrier of cultural information |
US8071168B2 (en) | 2002-08-26 | 2011-12-06 | Nanoink, Inc. | Micrometric direct-write methods for patterning conductive material and applications to flat panel display repair |
US7491422B2 (en) | 2002-10-21 | 2009-02-17 | Nanoink, Inc. | Direct-write nanolithography method of transporting ink with an elastomeric polymer coated nanoscopic tip to form a structure having internal hollows on a substrate |
DE10308931A1 (de) | 2003-02-28 | 2004-09-23 | Apibio Sas | System und Verfahren zur Synthese von Polymeren |
US6943417B2 (en) | 2003-05-01 | 2005-09-13 | Clemson University | DNA-based memory device and method of reading and writing same |
JP2005080523A (ja) | 2003-09-05 | 2005-03-31 | Sony Corp | 生体遺伝子に導入するdna、遺伝子導入ベクター、細胞、生体遺伝子への情報導入方法、情報処理装置および方法、記録媒体、並びにプログラム |
US9317664B2 (en) | 2003-10-14 | 2016-04-19 | Verseon Corporation | Method and device for partitioning a molecule |
WO2005042716A2 (en) | 2003-10-31 | 2005-05-12 | President And Fellows Of Harvard College | Nucleic acid binding oligonucleotides |
DE102005012567B4 (de) | 2005-03-04 | 2008-09-04 | Identif Gmbh | Markierungslösung, deren Verwendung und Verfahren zu ihrer Herstellung |
EP1752213A1 (en) | 2005-08-12 | 2007-02-14 | Samsung Electronics Co., Ltd. | Device for printing droplet or ink on substrate or paper |
WO2007042967A1 (en) | 2005-10-07 | 2007-04-19 | Koninklijke Philips Electronics N.V. | Ink jet device for the controlled positioning of droplets of a substance onto a substrate, method for the controlled positioning of droplets of a substance, and use of an ink jet device |
CN101282842B (zh) | 2005-10-07 | 2010-09-01 | 皇家飞利浦电子股份有限公司 | 用于将物质小滴受控地定位到基底上的喷墨装置和方法 |
EP1782886A1 (en) | 2005-11-02 | 2007-05-09 | Sony Deutschland GmbH | A method of patterning molecules on a substrate using a micro-contact printing process |
WO2007060634A1 (en) | 2005-11-28 | 2007-05-31 | Koninklijke Philips Electronics N. V. | Ink jet device for releasing controllably a plurality of substances onto a substrate, method of discriminating between a plurality of substances and use of an ink jet device |
EP1963105A2 (en) | 2005-12-22 | 2008-09-03 | Koninklijke Philips Electronics N.V. | Ink jet device for the positioning of a substance onto a substrate, method for the positioning of a substance onto a substrate and use of an ink jet device |
CN101370588A (zh) | 2006-01-12 | 2009-02-18 | 皇家飞利浦电子股份有限公司 | 用于在基材上释放多种物质的喷墨设备及方法 |
JP2009538123A (ja) | 2006-04-19 | 2009-11-05 | アプライド バイオシステムズ, エルエルシー | ゲル非含有ビーズベースの配列決定のための試薬、方法およびライブラリー |
RU2009114839A (ru) | 2006-09-21 | 2010-10-27 | Конинклейке Филипс Электроникс Н.В. (Nl) | Струйное устройство и способ изготовления подложки биологической пробы с использованием печатающей головки и средства для ускоренного движения |
BRPI0718223A2 (pt) | 2006-10-30 | 2013-11-12 | Koninkl Philips Electronics Nv | Substrato de ensaio biológico poroso, métodos para produzir um substrato de ensaio biológico e para examinar fluidos de analito, e, dispositivo de jato de tinta para produzir um substrato de ensaio biológico |
US20090023607A1 (en) | 2007-05-09 | 2009-01-22 | Nanolnk, Inc. | Compact nanofabrication apparatus |
US20120164396A1 (en) | 2007-06-20 | 2012-06-28 | Northwestern University | Matrix assisted ink transport |
US9061494B2 (en) | 2007-07-19 | 2015-06-23 | The Board Of Trustees Of The University Of Illinois | High resolution electrohydrodynamic jet printing for manufacturing systems |
US8452725B2 (en) | 2008-09-03 | 2013-05-28 | Hamid Hatami-Hanza | System and method of ontological subject mapping for knowledge processing applications |
US9684678B2 (en) | 2007-07-26 | 2017-06-20 | Hamid Hatami-Hanza | Methods and system for investigation of compositions of ontological subjects |
CZ301799B6 (cs) | 2007-07-30 | 2010-06-23 | Kencl@Lukáš | Zpusob úpravy datové informace v systému |
EP2190672B1 (en) | 2007-08-20 | 2011-10-26 | Moore Wallace North America, Inc. | Nanoparticle-based compositions compatible with jet printing |
DE102007057802B3 (de) | 2007-11-30 | 2009-06-10 | Geneart Ag | Steganographische Einbettung von Informationen in kodierenden Genen |
JP5171346B2 (ja) | 2008-03-28 | 2013-03-27 | 株式会社日立ハイテクノロジーズ | 文字列検索システム及び方法 |
EP2329425B1 (en) | 2008-09-10 | 2013-07-31 | DataLase Ltd | Multi-coloured codes |
WO2010029629A1 (ja) | 2008-09-11 | 2010-03-18 | 長浜バイオラボラトリー株式会社 | Dna含有インク組成物 |
US8769689B2 (en) | 2009-04-24 | 2014-07-01 | Hb Gary, Inc. | Digital DNA sequence |
US8806127B2 (en) | 2009-10-26 | 2014-08-12 | Genisyss Llc | Data storage device with integrated DNA storage media |
US20110269119A1 (en) | 2009-10-30 | 2011-11-03 | Synthetic Genomics, Inc. | Encoding text into nucleic acid sequences |
US8735327B2 (en) | 2010-01-07 | 2014-05-27 | Jeansee, Llc | Combinatorial DNA taggants and methods of preparation and use thereof |
US9187777B2 (en) | 2010-05-28 | 2015-11-17 | Gen9, Inc. | Methods and devices for in situ nucleic acid synthesis |
US20110312541A1 (en) | 2010-06-17 | 2011-12-22 | Geneasys Pty Ltd | Loc for detection of hybridization of nucleic acid sequences with primer-linked linear probes |
US9114399B2 (en) | 2010-08-31 | 2015-08-25 | Canon U.S. Life Sciences, Inc. | System and method for serial processing of multiple nucleic acid assays |
EP2630263B2 (en) | 2010-10-22 | 2021-11-10 | Cold Spring Harbor Laboratory | Varietal counting of nucleic acids for obtaining genomic copy number information |
WO2012058638A2 (en) | 2010-10-29 | 2012-05-03 | President And Fellows Of Harvard College | Nucleic acid nanostructure barcode probes |
US20120329561A1 (en) | 2010-12-09 | 2012-12-27 | Genomic Arts, LLC | System and methods for generating avatars and art |
KR101345337B1 (ko) | 2011-06-13 | 2013-12-30 | 한국생명공학연구원 | 원자간력 현미경(afm)을 이용한 딥-펜 나노리소그래피에서의 단일 또는 다중팁을 이용한 나노포지셔닝 기판 제조장치 및 제조방법 |
WO2013012881A2 (en) | 2011-07-20 | 2013-01-24 | The Regents Of The University Of California | Dual-pore device |
US20130253839A1 (en) | 2012-03-23 | 2013-09-26 | International Business Machines Corporation | Surprisal data reduction of genetic data for transmission, storage, and analysis |
US20150083797A1 (en) | 2012-05-09 | 2015-03-26 | Apdn (B.V.I.) Inc. | Verification of physical encryption taggants using digital representatives and authentications thereof |
SG11201407818PA (en) | 2012-06-01 | 2014-12-30 | European Molecular Biology Lab Embl | High-capacity storage of digital information in dna |
EP2875458A2 (en) | 2012-07-19 | 2015-05-27 | President and Fellows of Harvard College | Methods of storing information using nucleic acids |
US9266370B2 (en) | 2012-10-10 | 2016-02-23 | Apdn (B.V.I) Inc. | DNA marking of previously undistinguished items for traceability |
US8937564B2 (en) | 2013-01-10 | 2015-01-20 | Infinidat Ltd. | System, method and non-transitory computer readable medium for compressing genetic information |
GB2519255B (en) | 2013-02-01 | 2016-01-06 | Univ California | Methods for genome assembly and haplotype phasing |
EP2953524B1 (en) | 2013-02-06 | 2018-08-01 | Freenome Holdings Inc. | Systems and methods for early disease detection and real-time disease monitoring |
KR102245192B1 (ko) | 2013-05-06 | 2021-04-29 | 온테라 인크. | 나노포어를 이용한 표적 검출 |
CA2926436A1 (en) | 2013-10-07 | 2015-04-16 | Judith Murrah | Multimode image and spectral reader |
US10027347B2 (en) | 2014-03-28 | 2018-07-17 | Thomson Licensing | Methods for storing and reading digital data on a set of DNA strands |
US10020826B2 (en) | 2014-04-02 | 2018-07-10 | International Business Machines Corporation | Generating molecular encoding information for data storage |
US20150312212A1 (en) | 2014-04-24 | 2015-10-29 | David Holmes | Holistic embodiment of dna and ipv6 |
EP2958238A1 (en) | 2014-06-17 | 2015-12-23 | Thomson Licensing | Method and apparatus for encoding information units in code word sequences avoiding reverse complementarity |
KR101788673B1 (ko) | 2014-06-24 | 2017-11-15 | 싸이퍼롬, 인코퍼레이티드 | 핵산염기서열 보안 방법, 장치 및 이를 저장한 기록매체 |
US20170218228A1 (en) | 2014-07-30 | 2017-08-03 | Tufts University | Three Dimensional Printing of Bio-Ink Compositions |
WO2016015701A1 (de) | 2014-07-31 | 2016-02-04 | Schebo Biotech Ag | Vorrichtung zur bioanalytik, deren herstellung und verfahren zum nachweis von bioanalyten mittels der vorrichtung |
EP2983297A1 (en) | 2014-08-08 | 2016-02-10 | Thomson Licensing | Code generation method, code generating apparatus and computer readable storage medium |
WO2016036969A1 (en) | 2014-09-03 | 2016-03-10 | Nantomics, Llc | Synthetic genomic variant-based secure transaction devices, systems and methods |
US10860562B1 (en) | 2014-09-12 | 2020-12-08 | Amazon Technologies, Inc. | Dynamic predicate indexing for data stores |
CA2964985A1 (en) | 2014-10-18 | 2016-04-21 | Girik MALIK | A biomolecule based data storage system |
EP3215895B1 (de) | 2014-11-03 | 2022-02-23 | Universität Osnabrück | Verfahren zur durchführung eines kapillar-nanodrucks, feld von tintentropfen und feld von drähten erhältlich nach dem verfahren |
US10400028B2 (en) | 2014-11-20 | 2019-09-03 | Cytonics Corporation | Therapeutic variant alpha-2-macroglobulin compositions |
EP3067809A1 (en) | 2015-03-13 | 2016-09-14 | Thomson Licensing | Method and apparatus for storing and selectively retrieving data encoded in nucleic acid molecules |
WO2016164779A1 (en) | 2015-04-10 | 2016-10-13 | University Of Washington | Integrated system for nucleic acid-based storage of digital data |
US10385387B2 (en) | 2015-04-20 | 2019-08-20 | Pacific Biosciences Of California, Inc. | Methods for selectively amplifying and tagging nucleic acids |
US10589273B2 (en) | 2015-05-08 | 2020-03-17 | Illumina, Inc. | Cationic polymers and method of surface application |
US10423341B1 (en) | 2015-06-12 | 2019-09-24 | Bahram Ghaffarzadeh Kermani | Accurate and efficient DNA-based storage of electronic data |
US9898579B2 (en) | 2015-06-16 | 2018-02-20 | Microsoft Technology Licensing, Llc | Relational DNA operations |
WO2017011492A1 (en) | 2015-07-13 | 2017-01-19 | President And Fellows Of Harvard College | Methods for retrievable information storage using nucleic acids |
US20170060924A1 (en) | 2015-08-26 | 2017-03-02 | Exablox Corporation | B-Tree Based Data Model for File Systems |
US11512347B2 (en) | 2015-09-22 | 2022-11-29 | Twist Bioscience Corporation | Flexible substrates for nucleic acid synthesis |
US20170093851A1 (en) | 2015-09-30 | 2017-03-30 | Aetna Inc. | Biometric authentication system |
EP3160049A1 (en) | 2015-10-19 | 2017-04-26 | Thomson Licensing | Data processing method and device for recovering valid code words from a corrupted code word sequence |
WO2017082978A1 (en) | 2015-11-13 | 2017-05-18 | SoluDot LLC | Method for high throughput dispensing of biological samples |
US10566077B1 (en) | 2015-11-19 | 2020-02-18 | The Board Of Trustees Of The University Of Illinois | Re-writable DNA-based digital storage with random access |
US10047235B2 (en) | 2015-12-08 | 2018-08-14 | Xerox Corporation | Encoding liquid ink with a device specific biomarker |
WO2017142999A2 (en) | 2016-02-18 | 2017-08-24 | President And Fellows Of Harvard College | Methods and systems of molecular recording by crispr-cas system |
US10438662B2 (en) | 2016-02-29 | 2019-10-08 | Iridia, Inc. | Methods, compositions, and devices for information storage |
US10640822B2 (en) | 2016-02-29 | 2020-05-05 | Iridia, Inc. | Systems and methods for writing, reading, and controlling data stored in a polymer |
US10859562B2 (en) * | 2016-02-29 | 2020-12-08 | Iridia, Inc. | Methods, compositions, and devices for information storage |
WO2017151195A1 (en) | 2016-02-29 | 2017-09-08 | The Penn State Research Foundation | Nucleic acid molecular diagnosis |
US10883140B2 (en) | 2016-04-21 | 2021-01-05 | President And Fellows Of Harvard College | Method and system of nanopore-based information encoding |
US11514331B2 (en) | 2016-04-27 | 2022-11-29 | Massachusetts Institute Of Technology | Sequence-controlled polymer random access memory storage |
JP7120630B2 (ja) | 2016-05-02 | 2022-08-17 | エンコディア, インコーポレイテッド | 核酸エンコーディングを使用した巨大分子解析 |
EP3470997B1 (en) | 2016-05-04 | 2024-10-23 | BGI Shenzhen | Method for using dna to store text information, decoding method therefor and application thereof |
EP3478852B1 (en) | 2016-07-01 | 2020-08-12 | Microsoft Technology Licensing, LLC | Storage through iterative dna editing |
WO2018017131A1 (en) | 2016-07-22 | 2018-01-25 | Hewlett-Packard Development Company, L.P. | Method of preparing test samples |
AU2017298017A1 (en) | 2016-07-22 | 2019-02-21 | Nucleotrace Pty. Ltd. | A method for amplification of nucleic acid sequences |
US20190194484A1 (en) | 2016-09-08 | 2019-06-27 | Thomas Villwock | Methods and systems for authenticating goods using analyte encoded security fluids |
US10417457B2 (en) | 2016-09-21 | 2019-09-17 | Twist Bioscience Corporation | Nucleic acid based data storage |
US10370246B1 (en) | 2016-10-20 | 2019-08-06 | The Board Of Trustees Of The University Of Illinois | Portable and low-error DNA-based data storage |
WO2018081566A1 (en) | 2016-10-28 | 2018-05-03 | Integrated Dna Technologies, Inc. | Dna data storage using reusable nucleic acids |
AU2017363146B2 (en) | 2016-11-16 | 2023-11-02 | Catalog Technologies, Inc. | Systems for nucleic acid-based data storage |
US10650312B2 (en) * | 2016-11-16 | 2020-05-12 | Catalog Technologies, Inc. | Nucleic acid-based data storage |
US10853244B2 (en) | 2016-12-07 | 2020-12-01 | Sandisk Technologies Llc | Randomly writable memory device and method of operating thereof |
US10984029B2 (en) | 2016-12-15 | 2021-04-20 | Sap Se | Multi-level directory tree with fixed superblock and block sizes for select operations on bit vectors |
US10417208B2 (en) | 2016-12-15 | 2019-09-17 | Sap Se | Constant range minimum query |
WO2018132457A1 (en) | 2017-01-10 | 2018-07-19 | Roswell Biotechnologies, Inc. | Methods and systems for dna data storage |
CA3052962A1 (en) | 2017-02-08 | 2018-08-16 | Essenlix Corp. | Digital assay |
US10787699B2 (en) | 2017-02-08 | 2020-09-29 | Microsoft Technology Licensing, Llc | Generating pluralities of primer and payload designs for retrieval of stored nucleotides |
US10793897B2 (en) | 2017-02-08 | 2020-10-06 | Microsoft Technology Licensing, Llc | Primer and payload design for retrieval of stored polynucleotides |
WO2018148260A1 (en) | 2017-02-13 | 2018-08-16 | Thomson Licensing | Apparatus, method and system for digital information storage in deoxyribonucleic acid (dna) |
CN118116478A (zh) | 2017-02-22 | 2024-05-31 | 特韦斯特生物科学公司 | 基于核酸的数据存储 |
US10774379B2 (en) | 2017-03-15 | 2020-09-15 | Microsoft Technology Licensing, Llc | Random access of data encoded by polynucleotides |
US11341459B2 (en) | 2017-05-16 | 2022-05-24 | Artentika (Pty) Ltd | Digital data minutiae processing for the analysis of cultural artefacts |
WO2018222853A1 (en) | 2017-05-31 | 2018-12-06 | Molecular Assemblies, Inc. | Homopolymer encoded nucleic acid memory |
US11174512B2 (en) | 2017-05-31 | 2021-11-16 | Molecular Assemblies, Inc. | Homopolymer encoded nucleic acid memory |
US11612873B2 (en) | 2017-05-31 | 2023-03-28 | Molecular Assemblies, Inc. | Homopolymer encoded nucleic acid memory |
US10742233B2 (en) | 2017-07-11 | 2020-08-11 | Erlich Lab Llc | Efficient encoding of data for storage in polymers such as DNA |
WO2019046768A1 (en) | 2017-08-31 | 2019-03-07 | William Marsh Rice University | SYMBOLIC SEQUENCING OF DNA AND RNA BY SEQUENCE CODING |
US11538554B1 (en) * | 2017-09-19 | 2022-12-27 | The Board Of Trustees Of The Univ Of Illinois | Nick-based data storage in native nucleic acids |
WO2019075100A1 (en) | 2017-10-10 | 2019-04-18 | Roswell Biotechnologies, Inc. | METHODS, APPARATUS AND SYSTEMS FOR STORING DNA DATA WITHOUT AMPLIFICATION |
WO2019081145A1 (en) | 2017-10-27 | 2019-05-02 | Eth Zurich | ENCODING AND DECODING INFORMATION IN SYNTHETIC DNA WITH CRYPTOGRAPHIC KEYS GENERATED BASED ON POLYMORPHIC CHARACTERISTICS OF NUCLEIC ACIDS |
EP3707150A1 (en) | 2017-11-10 | 2020-09-16 | Massachusetts Institute Of Technology | Microbial production of pure single stranded nucleic acids |
WO2019136175A1 (en) | 2018-01-04 | 2019-07-11 | Twist Bioscience Corporation | Dna-based digital information storage |
CN111868255A (zh) | 2018-03-15 | 2020-10-30 | 特温斯特兰德生物科学有限公司 | 用于富集用于测序应用和其他核酸材料询问的核酸材料的方法和试剂 |
JP7364604B2 (ja) | 2018-03-16 | 2023-10-18 | カタログ テクノロジーズ, インコーポレイテッド | 核酸ベースのデータ記憶のための化学的方法 |
US11339423B2 (en) | 2018-03-18 | 2022-05-24 | Bryan Bishop | Systems and methods for data storage in nucleic acids |
WO2019195479A1 (en) | 2018-04-03 | 2019-10-10 | Ippsec Inc. | Systems and methods of physical infrastructure and information technology infrastructure security |
KR102138864B1 (ko) | 2018-04-11 | 2020-07-28 | 경희대학교 산학협력단 | Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법 |
US11106633B2 (en) | 2018-04-24 | 2021-08-31 | EMC IP Holding Company, LLC | DNA-based data center with deduplication capability |
AU2019270160B2 (en) | 2018-05-16 | 2024-09-19 | Catalog Technologies, Inc. | Printer-finisher system for data storage in DNA |
US20200193301A1 (en) | 2018-05-16 | 2020-06-18 | Catalog Technologies, Inc. | Compositions and methods for nucleic acid-based data storage |
US11093547B2 (en) | 2018-06-19 | 2021-08-17 | Intel Corporation | Data storage based on encoded DNA sequences |
US11093865B2 (en) | 2018-06-20 | 2021-08-17 | Brown University | Methods of chemical computation |
CN112585152A (zh) * | 2018-07-11 | 2021-03-30 | 加利福尼亚大学董事会 | 基于核酸的电学上可读的只读存储器 |
KR20210053292A (ko) | 2018-08-03 | 2021-05-11 | 카탈로그 테크놀로지스, 인크. | 오류 방지 기능을 갖춘 핵산 기반 데이터 저장 및 판독 시스템 및 방법 |
US10673847B2 (en) | 2018-08-28 | 2020-06-02 | Ofer A. LIDSKY | Systems and methods for user authentication based on a genetic sequence |
US11164190B2 (en) | 2018-11-29 | 2021-11-02 | International Business Machines Corporation | Method for product authentication using a microfluidic reader |
US11162950B2 (en) | 2018-11-29 | 2021-11-02 | International Business Machines Corporation | Zonal nanofluidic anti-tamper device for product authentication |
GB201821155D0 (en) | 2018-12-21 | 2019-02-06 | Oxford Nanopore Tech Ltd | Method |
EP3904527A4 (en) | 2018-12-26 | 2022-08-10 | BGI Shenzhen | METHOD AND APPARATUS FOR FIXED-POINT EDITING OF A DATA-STORED NUCLEOTIDE SEQUENCE |
US11507135B2 (en) | 2019-04-15 | 2022-11-22 | Government Of The United States Of America, As Represented By The Secretary Of Commerce | Molecular scrivener for reading or writing data to a macromolecule |
EP3966823A1 (en) | 2019-05-09 | 2022-03-16 | Catalog Technologies, Inc. | Data structures and operations for searching, computing, and indexing in dna-based data storage |
US10956806B2 (en) | 2019-06-10 | 2021-03-23 | International Business Machines Corporation | Efficient assembly of oligonucleotides for nucleic acid based data storage |
US11066661B2 (en) | 2019-08-20 | 2021-07-20 | Seagate Technology Llc | Methods of gene assembly and their use in DNA data storage |
US20210074380A1 (en) * | 2019-09-05 | 2021-03-11 | Microsoft Technology Licensing, Llc | Reverse concatenation of error-correcting codes in dna data storage |
US11495324B2 (en) | 2019-10-01 | 2022-11-08 | Microsoft Technology Licensing, Llc | Flexible decoding in DNA data storage based on redundancy codes |
US10917109B1 (en) | 2020-03-06 | 2021-02-09 | Centre National De La Recherche Scientifique | Methods for storing digital data as, and for transforming digital data into, synthetic DNA |
AU2021271639A1 (en) | 2020-05-11 | 2022-12-08 | Catalog Technologies, Inc. | Programs and functions in DNA-based data storage |
JP2023546315A (ja) | 2020-09-08 | 2023-11-02 | カタログ テクノロジーズ, インコーポレイテッド | 核酸の配列決定による書き込みのためのシステムおよび方法 |
US20220364991A1 (en) | 2021-03-24 | 2022-11-17 | Northeastern University | Method and System for Decoding Information Stored on a Polymer Sequence |
-
2020
- 2020-05-11 EP EP20728648.5A patent/EP3966823A1/en active Pending
- 2020-05-11 AU AU2020268440A patent/AU2020268440A1/en active Pending
- 2020-05-11 KR KR1020217040321A patent/KR20220017409A/ko unknown
- 2020-05-11 JP JP2021566244A patent/JP2022531790A/ja active Pending
- 2020-05-11 US US16/872,129 patent/US11610651B2/en active Active
- 2020-05-11 WO PCT/US2020/032384 patent/WO2020227718A1/en unknown
- 2020-05-11 CA CA3139819A patent/CA3139819A1/en active Pending
-
2023
- 2023-02-09 US US18/107,851 patent/US12002547B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US12002547B2 (en) | 2024-06-04 |
KR20220017409A (ko) | 2022-02-11 |
AU2020268440A1 (en) | 2021-12-02 |
WO2020227718A1 (en) | 2020-11-12 |
US20240055075A1 (en) | 2024-02-15 |
US20200357483A1 (en) | 2020-11-12 |
CA3139819A1 (en) | 2020-11-12 |
EP3966823A1 (en) | 2022-03-16 |
US11610651B2 (en) | 2023-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022531790A (ja) | Dnaに基づくデータ記憶における探索、算出、および索引付けのためのデータ構造および動作 | |
US20210210165A1 (en) | Systems and methods for storing and reading nucleic acid-based data with error protection | |
AU2017363146B2 (en) | Systems for nucleic acid-based data storage | |
US11306353B2 (en) | Programs and functions in DNA-based data storage | |
US20230317164A1 (en) | Systems and methods for writing by sequencing of nucleic acids | |
Karasikov et al. | Sparse binary relation representations for genome graph annotation | |
El-Shaikh et al. | Content-based filter queries on DNA data storage systems | |
JPWO2004068398A1 (ja) | Dnaコンピュータ及びそれを用いた計算方法 | |
Muggli et al. | Succinct de Bruijn graph construction for massive populations through space-efficient merging | |
JP7576536B2 (ja) | 誤り保護とともに核酸に基づくデータを記憶および読むためのシステムおよび方法 | |
Balla et al. | Approximation Algorithms for the Primer Selection, Planted Motif Search, and Related Problems | |
WO2024137794A1 (en) | Dna-based vector data structure with parallel operations | |
Garzon et al. | Sensitivity and capacity of microarray encodings | |
Behboodi et al. | Fast and Accurate Genomic Minisatellites Disclosure | |
Piccolo et al. | Coordinate-based mapping of tabular data enables fast and scalable queries | |
EP3830831A2 (en) | Systems and methods for storing and reading nucleic acid-based data with error protection | |
AU2023234435A1 (en) | Combinatorial enumeration and search for nucleic acid-based data storage | |
Heath | An optimal method for dna sequencing by hybridization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230508 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230508 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20230713 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20230816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240319 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240913 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240925 |