KR102138864B1 - Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법 - Google Patents
Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법 Download PDFInfo
- Publication number
- KR102138864B1 KR102138864B1 KR1020180042269A KR20180042269A KR102138864B1 KR 102138864 B1 KR102138864 B1 KR 102138864B1 KR 1020180042269 A KR1020180042269 A KR 1020180042269A KR 20180042269 A KR20180042269 A KR 20180042269A KR 102138864 B1 KR102138864 B1 KR 102138864B1
- Authority
- KR
- South Korea
- Prior art keywords
- base
- dna
- bases
- digital data
- data storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/02—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with ribosyl as saccharide radical
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/04—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
도 2A-도 2C는 실시 예를 설명하기 위한 제1 실험 예로서, 도 2D의 텍스트 파일을 저장하는데 있어서, 디제너레이트 염기를 추가하여 DNA 길이를 압축하는 DNA 디지털 데이터 저장 방법을 나타낸 도면이다.
도 3A-도 3D는 제1 실험 예에 따른 DNA 디지털 데이터 저장의 구조 및 디코딩 프로세스를 나타낸 도면이다.
도 4는 훈민정음 사본의 섬네일(thumbnail) 이미지이다.
도 5는 제2 실험 예에서 데이터 조각 구조(어댑터없음) 및 오류 수정 체계를 나타낸 도면이다.
도 6A 및 도 6B는 디제너레이트 염기에서 각 염기의 호출 빈도를 나타낸 그래프이다.
도 7A-7C는 실험예 및 시뮬레이션 예들을 통해 실시 예에 따른 플랫폼의 견고성 및 확장성(robustness and scalability )을 보여주는 그래프이다.
도 8은 실시 예에 따른 비용과 종래 비용을 비교한 그래프이다.
11: 메모리 셀
Claims (15)
- 적어도 하나의 디제너레이트 염기를 포함하는 복수의 염기 서열로 인코딩된 복수의 비트 데이터를 저장하는 방법에 있어서,
상기 적어도 하나의 디제너레이트 염기를 구성하는 적어도 두 종류의 염기들이 혼합 비율에 기초하여 기판 위에서 합성되는 단계를 포함하는 DNA 디지털 데이터 저장 방법. - 제1항에 있어서,
상기 복수의 염기 서열 중 단일 종류의 염기가 상기 기판 위에서 합성되는 단계를 더 포함하는 DNA 디지털 데이터 저장 방법. - 제1항에 있어서,
상기 적어도 하나의 디제너레이트 염기가 합성되는 단계는,
상기 혼합 비율에 기초한 상기 적어도 두 종류의 염기들이 상기 기판 위에 혼입되는 단계를 포함하는 DNA 디지털 데이터 저장 방법. - 제1항에 있어서,
상기 적어도 하나의 디제너레이트 염기가 합성되는 단계는,
외부에서 상기 혼합 비율에 따라 혼합된 상기 적어도 두 종류의 염기들이 상기 기판 위에 혼입되는 단계를 포함하는 DNA 디지털 데이터 저장 방법. - 제1항에 있어서,
상기 혼합 비율에서, 상기 적어도 두 종류의 염기들 간의 비율이 동일한 DNA 디지털 데이터 저장 방법. - 제1항에 있어서,
상기 혼합 비율에서, 상기 적어도 두 종류의 염기들 간의 비율이 다른 DNA 디지털 데이터 저장 방법. - 제1항에 있어서,
상기 적어도 두 종류의 염기들은 DNA 염기, RNA 염기, 및 핵산 유사체(Nucleic acid analogue) 중 적어도 하나인 DNA 디지털 데이터 저장 방법. - 복수의 비트 데이터를 인코딩한 복수의 염기 서열이 저장 기본 단위로 구분되어 저장된 DNA 디지털 데이터 저장 장치에 있어서,
상기 복수의 염기 서열 중 상기 저장 기본 단위에 대응하는 제1 염기 서열에 기초하여 복수의 염기들이 합성된 분자들을 포함하고,
상기 제1 염기 서열은 적어도 두 종류의 염기로 구성된 제1 디제너레이트 염기를 포함하며,
상기 분자들은,
상기 적어도 두 종류의 염기 중 제1 염기가 합성된 제1 분자들, 및
상기 적어도 두 종류의 염기 중 제2 염기가 합성된 제2 분자들을 포함하는 DNA 디지털 데이터 저장 장치. - 제8항에 있어서,
상기 제1 분자들과 상기 제2 분자들 간의 비율은 혼합 비율에 따르는 DNA 디지털 데이터 저장 장치. - 제9항에 있어서,
상기 혼합 비율에서, 상기 적어도 두 종류의 염기들 간의 비율이 동일한 DNA 디지털 데이터 저장 장치. - 제9항에 있어서,
상기 혼합 비율에서, 상기 적어도 두 종류의 염기들 간의 비율이 다른 DNA 디지털 데이터 저장 장치. - 제8항에 있어서,
상기 적어도 두 종류의 염기들은 DNA 염기, RNA 염기, 및 핵산 유사체(Nucleic acid analogue) 중 적어도 하나인 DNA 디지털 데이터 저장 장치. - 시퀀싱 장비에 의해 수행되는 적어도 하나의 단계를 포함하는 DNA 데이터의 디코딩 방법에 있어서,
복수의 DNA 프래그멘트를 주소에 따라 분류하는 단계;
상기 분류된 복수의 DNA 프래그멘트 각각에 대해 동일한 위치에서의 염기를 분석하는 단계;
상기 분석 결과에 기초하여 염기 비율의 산포도를 산출하는 단계;
상기 염기 비율의 산포도가 적어도 두 염기들의 혼합 비율일 때, 해당 위치의 염기를 디제너레이트 염기로 결정하는 단계; 및
상기 결정된 디제너레이트 염기를기초로 데이터를 디코딩하는 단계를 포함하는 DNA 데이터의 디코딩 방법. - 제13항에 있어서,
상기 염기를 분석하는 단계는,
상기 복수의 DNA 프래그멘트 각각의 각 위치에 대한 염기 호출이 분석되는 단계를 포함하는 DNA 데이터의 디코딩 방법. - 제13항에 있어서,
상기 염기 비율의 산포도가 적어도 두 염기의 제1 혼합 비율일 때, 해당 위치의 염기를 제1 디제너레이트 염기로 결정하고,
상기 염기 비율의 산포도가 상기 적어도 두 염기의 제2 혼합 비율일 때, 해당 위치의 염기를 제2 디제너레이트 염기로 결정하며,
상기 제1 혼합 비율과 상기 제2 혼합 비율이 서로 다르고, 상기 제1 디제너레이트 염기와 상기 제2 디제너레이트 염기가 서로 다른 DNA 데이터의 디코딩 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180042269A KR102138864B1 (ko) | 2018-04-11 | 2018-04-11 | Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법 |
US16/138,123 US10929039B2 (en) | 2018-04-11 | 2018-09-21 | DNA digital data storage device and method, and decoding method of DNA digital data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180042269A KR102138864B1 (ko) | 2018-04-11 | 2018-04-11 | Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190118853A KR20190118853A (ko) | 2019-10-21 |
KR102138864B1 true KR102138864B1 (ko) | 2020-07-28 |
Family
ID=68160274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180042269A Active KR102138864B1 (ko) | 2018-04-11 | 2018-04-11 | Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10929039B2 (ko) |
KR (1) | KR102138864B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220048831A (ko) * | 2020-10-13 | 2022-04-20 | 서울대학교산학협력단 | 염기 비율과 연속적 발생을 제한하는 dna 저장 부호화 방법, 프로그램 및 장치 |
KR20240130937A (ko) | 2023-02-23 | 2024-08-30 | 이근우 | 반도체 기반 dna 칩 및 그 제조방법, 데이터 저장 및 읽기 방법 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2017363139B2 (en) | 2016-11-16 | 2023-09-21 | Catalog Technologies, Inc. | Nucleic acid-based data storage |
US10650312B2 (en) | 2016-11-16 | 2020-05-12 | Catalog Technologies, Inc. | Nucleic acid-based data storage |
JP7364604B2 (ja) | 2018-03-16 | 2023-10-18 | カタログ テクノロジーズ, インコーポレイテッド | 核酸ベースのデータ記憶のための化学的方法 |
KR20210029147A (ko) | 2018-05-16 | 2021-03-15 | 카탈로그 테크놀로지스, 인크. | 핵산-기반 데이터를 저장하기 위한 조성물 및 방법 |
US11017170B2 (en) | 2018-09-27 | 2021-05-25 | At&T Intellectual Property I, L.P. | Encoding and storing text using DNA sequences |
US11610651B2 (en) | 2019-05-09 | 2023-03-21 | Catalog Technologies, Inc. | Data structures and operations for searching, computing, and indexing in DNA-based data storage |
EP4041920A1 (en) | 2019-10-11 | 2022-08-17 | Catalog Technologies, Inc. | Nucleic acid security and authentication |
AU2021271639A1 (en) | 2020-05-11 | 2022-12-08 | Catalog Technologies, Inc. | Programs and functions in DNA-based data storage |
CN112619614B (zh) * | 2020-12-03 | 2022-11-04 | 云南中烟工业有限责任公司 | 一种羟基磷灰石复合多孔材料、其制备方法及用途 |
WO2022120626A1 (zh) * | 2020-12-09 | 2022-06-16 | 中国科学院深圳先进技术研究院 | 基于dna的数据存储方法、数据恢复方法、装置及终端设备 |
KR102713654B1 (ko) | 2021-07-23 | 2024-10-08 | 주식회사 클리노믹스 | 유전체 정보의 암호화 및 복호화 방법 |
WO2024076044A1 (ko) * | 2022-10-06 | 2024-04-11 | 이근우 | Dna 인코딩 및 디코딩 방법 및 장치 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050053968A1 (en) * | 2003-03-31 | 2005-03-10 | Council Of Scientific And Industrial Research | Method for storing information in DNA |
US8116988B2 (en) * | 2006-05-19 | 2012-02-14 | The University Of Chicago | Method for indexing nucleic acid sequences for computer based searching |
US8806127B2 (en) * | 2009-10-26 | 2014-08-12 | Genisyss Llc | Data storage device with integrated DNA storage media |
WO2013166303A1 (en) * | 2012-05-02 | 2013-11-07 | Ibis Biosciences, Inc. | Dna sequencing |
CN107055468A (zh) * | 2012-06-01 | 2017-08-18 | 欧洲分子生物学实验室 | Dna中数字信息的高容量存储 |
CN108875312A (zh) * | 2012-07-19 | 2018-11-23 | 哈佛大学校长及研究员协会 | 利用核酸存储信息的方法 |
US20170249345A1 (en) | 2014-10-18 | 2017-08-31 | Girik Malik | A biomolecule based data storage system |
WO2016077079A1 (en) | 2014-10-29 | 2016-05-19 | Massachusetts Institute Of Technology | Dna encryption technologies |
US11789906B2 (en) | 2014-11-19 | 2023-10-17 | Arc Bio, Llc | Systems and methods for genomic manipulations and analysis |
CN108026557A (zh) | 2015-07-13 | 2018-05-11 | 哈佛学院董事及会员团体 | 使用核酸用于可检索信息储存的方法 |
LU92881B1 (en) | 2015-11-18 | 2017-06-21 | Technische Univ Hamburg Harburg | Methods for encoding and decoding a binary string and System therefore |
US20170253871A1 (en) * | 2016-03-04 | 2017-09-07 | University-Industry Foundation, Yonsei University | Method of preparing oligonucleotide pool using one oligonucleotide |
EP3513346B1 (en) * | 2016-11-30 | 2020-04-15 | Microsoft Technology Licensing, LLC | Dna random access storage system via ligation |
KR102622275B1 (ko) * | 2017-01-10 | 2024-01-05 | 로스웰 바이오테크놀로지스 인코포레이티드 | Dna 데이터 저장을 위한 방법들 및 시스템들 |
US10689684B2 (en) * | 2017-02-14 | 2020-06-23 | Microsoft Technology Licensing, Llc | Modifications to polynucleotides for sequencing |
US11845982B2 (en) * | 2017-12-27 | 2023-12-19 | Anjali CHAKRADHAR | Key-value store that harnesses live micro-organisms to store and retrieve digital information |
US11106633B2 (en) * | 2018-04-24 | 2021-08-31 | EMC IP Holding Company, LLC | DNA-based data center with deduplication capability |
-
2018
- 2018-04-11 KR KR1020180042269A patent/KR102138864B1/ko active Active
- 2018-09-21 US US16/138,123 patent/US10929039B2/en active Active
Non-Patent Citations (2)
Title |
---|
A.D. Johnson, "An extended IUPAC nomenclature code for polymorphic nucleic acids", Bioinformatics Advanced Access, 2010.03.03. |
B. Hwang 외, "Toward a new paradigm of DNA writing (후략)", Science Reports 6:37176, 2016.11.23. |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220048831A (ko) * | 2020-10-13 | 2022-04-20 | 서울대학교산학협력단 | 염기 비율과 연속적 발생을 제한하는 dna 저장 부호화 방법, 프로그램 및 장치 |
WO2022080863A1 (ko) * | 2020-10-13 | 2022-04-21 | 서울대학교 산학협력단 | 염기 비율과 연속적 발생을 제한하는 dna 저장 부호화 방법, 프로그램 및 장치 |
KR102418617B1 (ko) | 2020-10-13 | 2022-07-07 | 서울대학교산학협력단 | 염기 비율과 연속적 발생을 제한하는 dna 저장 부호화 방법, 프로그램 및 장치 |
KR20240130937A (ko) | 2023-02-23 | 2024-08-30 | 이근우 | 반도체 기반 dna 칩 및 그 제조방법, 데이터 저장 및 읽기 방법 |
Also Published As
Publication number | Publication date |
---|---|
US10929039B2 (en) | 2021-02-23 |
KR20190118853A (ko) | 2019-10-21 |
US20190317684A1 (en) | 2019-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102138864B1 (ko) | Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법 | |
US11892945B2 (en) | High-capacity storage of digital information in DNA | |
JP7586880B2 (ja) | 核酸ベースのデータ記憶 | |
Ping et al. | Carbon-based archiving: current progress and future prospects of DNA-based data storage | |
Organick et al. | Random access in large-scale DNA data storage | |
CN110945595B (zh) | 基于dna的数据存储和检索 | |
Yazdi et al. | DNA-based storage: Trends and methods | |
Borštnik et al. | Tandem repeats in protein coding regions of primate genes | |
US11177019B2 (en) | Method for biologically storing and restoring data | |
Wang et al. | Oligo design with single primer binding site for high capacity DNA-based data storage | |
Song et al. | Super-robust data storage in DNA by de Bruijn graph-based decoding | |
KR102236439B1 (ko) | 디지털 정보를 dna 분자에 저장하는 방법 및 그 장치 | |
WO2019204702A1 (en) | Error-correcting dna barcodes | |
Choi et al. | Addition of degenerate bases to DNA-based data storage for increased information capacity | |
US20070113137A1 (en) | Error Correction in Binary-encoded DNA Using Linear Feedback Shift Registers | |
최영재 | High Information Capacity and Low Cost DNA-based Data Storage through Additional Encoding Characters | |
TW202008302A (zh) | 以dna為基礎之資料存取 | |
HK1257702B (en) | High-capacity storage of digital information in dna | |
Rescheneder | Fast, accurate and user-friendly alignment of short and long read data with high mismatch rates | |
Wang et al. | DNA Digital Data Storage based on Distributed Method | |
CN117727367A (zh) | 一种纳米孔测序中条形码的设计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180411 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200121 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200713 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200722 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20200722 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230629 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20240701 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20250701 Start annual number: 6 End annual number: 6 |