CN113314187A - 一种数据存储方法、解码方法、系统、装置及存储介质 - Google Patents

一种数据存储方法、解码方法、系统、装置及存储介质 Download PDF

Info

Publication number
CN113314187A
CN113314187A CN202110583430.0A CN202110583430A CN113314187A CN 113314187 A CN113314187 A CN 113314187A CN 202110583430 A CN202110583430 A CN 202110583430A CN 113314187 A CN113314187 A CN 113314187A
Authority
CN
China
Prior art keywords
data
random
grouped
sequence
random number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110583430.0A
Other languages
English (en)
Other versions
CN113314187B (zh
Inventor
杨旭
石晓龙
强小利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Internet Service Co ltd
Ourchem Information Consulting Co ltd
Original Assignee
Guangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou University filed Critical Guangzhou University
Priority to CN202110583430.0A priority Critical patent/CN113314187B/zh
Publication of CN113314187A publication Critical patent/CN113314187A/zh
Priority to US17/469,048 priority patent/US20220382480A1/en
Priority to US17/720,641 priority patent/US20220382481A1/en
Application granted granted Critical
Publication of CN113314187B publication Critical patent/CN113314187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0679Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/40Encryption of genetic data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/58Random or pseudo-random number generators
    • G06F7/588Random number generators, i.e. based on natural stochastic processes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03KPULSE TECHNIQUE
    • H03K19/00Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits
    • H03K19/20Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits characterised by logic function, e.g. AND, OR, NOR, NOT circuits
    • H03K19/21EXCLUSIVE-OR circuits, i.e. giving output if input signal exists at only one input; COINCIDENCE circuits, i.e. giving output only if all input signals are identical

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioethics (AREA)
  • Chemical & Material Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种数据存储方法、系统、装置及存储介质。数据存储方法包括:获取第一数据;对第一数据进行分组得到K个分组子数据;将预设引物输入随机生成器,得到4T个随机数序列,4T>K;确定第i个随机数序列所对应的分组子数据,并利用确定的分组子数据进行异或运算得到数据信息DATAi,并根据数据信息DATAi、预设引物和随机生成器的生成次数容量得到DNA分子链;将若干个DNA分子链进行DNA序列合成得到目标存储数据。本发明通过对第一数据进行编码得到DNA分子链的过程中,对编码过程添加了随机生成器,使得编码过程大为简化,实现高效率且准确地对第一数据进行编码。本发明可广泛应用于数据存储技术领域内。

Description

一种数据存储方法、解码方法、系统、装置及存储介质
技术领域
本发明涉及数据存储技术领域,尤其是一种数据存储方法、系统、装置及存储介质。
背景技术
随着科学技术的发展,人们所面对和接收的数据呈快速增长,如何对海量的数据进行存储是现今面临的重要问题。其中,为了解决这一问题,出现了利用脱氧核糖核酸(DNA)进行数据存储的相关研究,以DNA链的形式存储所有的信息,这种方法从理论上说能够让信息保存较长的时间,而且不会出现任何的数据丢失。而现今的DNA存储技术,当需要获取某个特定位置的数据时,只能对DNA存储的数据进行全部读取再进行筛选,而没有办法指向特定的位置只读取其中一部分的数据,效率低,存在缺陷。
发明内容
本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
为此,本发明实施例的一个目的在于,提一种数据存储方法、解码方法、系统、装置及存储介质。
为了达到上述技术目的,本发明实施例所采取的技术方案包括:
第一方面,本发明实施例提供了一种数据存储方法,包括以下步骤:
获取第一数据;
对所述第一数据进行分组得到K个分组子数据,其中,所述K为正整数;
将预设引物输入随机生成器,得到4T个随机数序列,其中,所述T为所述随机生成器的生成次数容量,且4T>K,所述预设引物前缀中鸟嘌呤和胞嘧啶的含量占所述预设引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值;
确定第i个所述随机数序列所对应的所述分组子数据,并利用确定的所述分组子数据进行异或运算得到数据信息DATAi,其中,i为自然数,且1≤i≤4T,并根据所述数据信息DATAi、所述预设引物和所述随机生成器的生成次数容量得到DNA分子链;
将若干个所述DNA分子链进行DNA序列合成得到目标存储数据。
进一步,所述对所述第一数据进行分组得到K个分组子数据这一步骤,包括以下步骤:
确定所述第一数据的数据长度和分组长度;
根据所述数据长度和所述分组长度得到K个分组子数据。
进一步,所述将预设引物输入随机生成器,得到4T个随机数序列这一步骤,具体为:
控制循环次数j,所述随机生成器根据输入的所述预设引物,输出取值范围在[0,2K]的随机整数,并将所述随机整数转换为二进制形式的随机数序列DATAj
其中,1≤j≤4T
进一步,每一个所述随机数序列包括K位随机位,所述确定第i个所述随机数序列所对应的所述分组子数据,并利用确定的所述分组子数据进行异或运算得到数据信息DATAi这一步骤,包括以下步骤::
当判断第i个所述随机数序列的第m位所述随机位的数值为1,则选取m个随机位对应的所述分组子数据,其中,m为整数且1≤m≤K;
将选取的所述分组子数据进行异或运算,得到所述数据信息DATAi
进一步,所述存储方法还包括对所述DNA分子链的随机化处理这一步骤,包括以下步骤:
将预设引物输入随机生成器得到随机整数序列;
将所述随机整数序列转化为二进制序列或对应碱基序列,在所述随机生成器的生成次数的指引下生成度分布序列,指导所述数据信息进行异或运算。
第二方面,本发明实施例提出了一种解码方法,包括以下步骤:
对所述目标数据存储数据进行解码。
第三方面,本发明实施例提出了一种数据存储系统,包括:
数据获取模块,用于获取第一数据;
分组模块,用于对所述第一数据进行分组得到K个分组子数据,其中,所述K为正整数;
随机数序列获取模块,用于将预设引物输入随机生成器,得到4T个随机数序列,其中,T为所述随机生成器的生成次数容量,且4T>K,所述预设引物前缀中鸟嘌呤和胞嘧啶的含量占所述预设引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值;
分组确定模块,用于确定第i个所述随机数序列所对应的所述分组子数据,并利用确定的所述分组子数据进行异或运算得到数据信息DATAi,其中,i为自然数,且1≤i≤4T,并根据数据信息DATAi、所述预设引物和所述随机生成器的生成次数容量得到DNA分子链;
合成模块,用于将若干个所述DNA分子链进行DNA序列合成得到目标存储数据。
进一步,每一个所述随机数序列包括K位随机位,所述分组确定模块包括:判断单元,用于当判断第i个所述随机数序列的第m位所述随机位的数值为1,则选取m个随机位对应的所述分组子数据,其中,m为整数且1≤m≤K;
异或运算单元,用于将选取的所述分组子数据进行异或运算,得到所述数据信息DATAi。第四方面,本发明实施例提供了一种数据存储装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现所述的一种数据存储方法。
第五方面,本发明实施例提供了一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于实现所述的一种数据存储方法。
本发明的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到:
本发明实施例通过对第一数据进行编码得到DNA分子链的过程中,对所述编码过程添加了随机生成器,使得编码过程大为简化,实现高效率且准确地对第一数据进行编码,利用DNA分子链的引物作为随机生成器的种子,更是将引物的作用最大化。
附图说明
为了更清楚地说明本发明实施例或者现有技术中的技术方案,下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员来说,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1为本发明一种数据存储方法具体实施例的流程示意图;
图2为本发明一种数据存储系统具体实施例的结构示意图;
图3为本发明一种数据存储装置具体实施例的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
下面参照附图详细描述根据本发明实施例提出的一种数据存储方法和系统,首先将参照附图描述根据本发明实施例提出的一种数据存储方法。
参照图1,本发明实施例中所述的一种数据存储方法主要包括以下步骤:
S1、获取第一数据;
S2、对所述第一数据进行分组得到K个分组子数据,其中,K为正整数;
S3、将预设引物输入随机生成器,得到4T个随机数序列,其中,T为随机生成器的生成次数容量,且4T>K,预设引物前缀中鸟嘌呤和胞嘧啶的含量占预设引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值;
S4、确定第i个随机数序列所对应的分组子数据,并利用确定的分组子数据进行异或运算得到数据信息DATAi,其中,i为自然数,且1≤i≤4T,并根据数据信息DATAi、预设引物和随机生成器的生成次数容量得到DNA分子链;
S5、将若干个DNA分子链进行DNA序列合成得到目标存储数据。
具体地,DNA存储,就是将要存储的目标信息,也即是第一数据,转换为DNA碱基编码,存放在DNA链中,在需要读取的时候,再将DNA链进行测序(有时需要先对DNA链进行PCR扩增,再进行测序操作),得到相应的碱基序列,经过一系列转换,变为电子计算机能识别的信息,进行数据恢复。
首先,将第一数据进行分组,得到K个分组子数据,为:S1、S2、S3……SK,每个分组子数据的数据长度是固定的。
预设引物是为了后续的PCR扩增或测序而特殊设计的DNA序列,具有特定的碱基排列结构,该预设引物是在对第一数据编码之前就预先确定并将记录下来的。
将预设引物作为随机生成器的种子,输入到随机生成器中,可以得到多个随机数。随机生成器的生成次数容量为T,4T为随机生成器的生成次数,通过控制随机生成器的循环次数,则该随机生成器可生成4T个随机数。
例如,第一数据的数据长度为S=4200(bit),N=40(nt),其中,nt是nucleotide的缩写,即核苷酸,这里是用来表示碱基的数量的单位,1nt可拥有2bit的信息容量,K=4200/(40*2)=53(向上取整)。
K=53,也即是第一数据可以分为53个分组子数据,随机生成器的生成次数长度则必须大于53,取生成次数容量为T=3nt,因为3nt的信息存储容量是43次方(1nt拥有4种碱基表达的可能性,所以1nt的信息容量是4),也可以理解为26(1nt对应2bit,1bit对应0/1两种状态,所以是共有2种状态的3(nt)*2(bit)=6次方的信息容量)
通过控制随机生成器的循环次数,可以根据输入的预设引物,输出多个随机数。每一个随机数用来从K个分组子数据中选取部分的分组子数据,将选取的部分的分组子数据进行异或运算,得到一个数据信息DATAi,其中,i为控制循环的次数,且1≤i≤4T
将数据信息DATAi与预设引物及其随机生成器的生成次数容量进行数据拼接,得到DNA分子链,4T个DNA分子链进行DNA序列合成即可得到目标存储数据。
由上述内容可见,本申请对第一数据进行编码得到DNA分子链的过程中,对编码过程添加了随机生成器,使得编码过程大为简化,实现高效率且准确地对第一数据进行编码。利用DNA分子链的引物作为随机生成器的种子,更是将引物的作用最大化;每一DNA合成的分子链的前缀中鸟嘌呤和胞嘧啶的含量占引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值,使得在需要读取编码数据事先进行测序时,准确率高。
进一步作为可选的实施方式,步骤S2,包括以下步骤S21-S22:
S21、确定第一数据的数据长度S和分组长度N;
S22、根据数据长度S和分组长度N得到K个分组子数据。
具体地,例如,第一数据的数据长度S=4200bit,分组长度N=40nt,则可以确定分组数量K为:
Figure BDA0003087083340000051
其中,ceil(.)为向上整函数。
进一步作为可选的实施方式,步骤S3具体为:
控制循环次数j,随机生成器根据输入的预设引物,输出取值范围在[0,2K]的随机整数,并将随机整数转换为二进制形式的随机数序列DATAj
其中,1≤j≤4T
具体地,将预设引物转化为十进制整数作为种子注入随机生成器,随机生成器根据输入的引物输出取值范围在[0,2K]的十进制的随机整数,将该十进制的随机整数数转化为二进制形式的随机数序列,将随机数序列的高位进行补零,使得该随机数序列的位数为K位,该二进制是随机数序列喷泉码的度分布序列。
通过控制随机生成器的生成次数容量来控制循环次数j,可以输出4K个随机数序列,其中,1≤j≤4K
进一步作为可选的实施方式,每一个随机数序列包括K位随机位,步骤S4包括步骤S41-S42:
S41、当判断第i个随机数序列的第m位随机位的数值为1,则选取m个随机位对应的分组子数据,其中,m为整数且1≤m≤K;
S42、将选取的分组子数据进行异或运算,得到数据信息DATAi
具体地,参照表1,每一个随机数序列为K位的二进制形式的随机数序列,判断随机数序列的每一个随机位,当确定当前随机位的数字为1时,则选择与该随机位对应的分组子数据,接着将选择的多个分组子数据进行异或运算,便得到当前随机数序列所对应的数据信息。
按照上述的方式,通过控制随机数序列的循环次数,4T个随机数序列,对应有4T个数据信息。将预设引物、随机生成器生成次数容量、数据信息进行拼装,组成一条喷泉码水滴数据,也即是DNA分子链。
Figure BDA0003087083340000061
表1
进一步作为可选的实施方式,存储方法还包括步骤S6对DNA分子链的随机化处理这一步骤,步骤S6包括步骤S61-S62:
S61、将预设引物输入随机生成器得到随机整数序列;
S62、将随机整数序列转化为二进制序列或对应碱基序列,在随机生成器的生成次数的指引下生成度分布序列,指导数据信息进行异或运算。
具体地,为保证最终生成的目标存储数据的充分杂乱性,在上一步生成的DNA分子链(也即是喷泉码水滴数据)的基础上,再对其进行一次随机化处理,通过将预设引物转换为十进制整数,作为种子注入随机生成器,生成一个数值在[0,4T+N]的随机整数序列,将此随机整数序列转换为对应碱基序列(或对应的二进制序列),与随机生成次数容量和数据信息进行异或运算,对存储信息进行随机化。
由于DNA存储中,均聚物不平衡或GC含量不均衡,将会导致在DNA序列生成、PCR扩增、测序阶段会出现不可预知的错误,所以在合成DNA链时,应该对均聚物进行判断,舍弃连续4个碱基为同一碱基的情况。之后对全链进行均聚物和GC含量的检测,若不符合要求(要求连续4个碱基不为同一碱基),则删除此链。
最后,将通过筛选的DNA分子链,进行DNA序列合成得到目标存储数据,并进行存储。
此外,本申请还提供了一种解码方法,应用于上述的一种数据存储方法得到的目标存储数据,包括以下步骤:
对目标数据存储数据进行解码。
具体的解码过程如下:
进行数据编码与存储时,是预先知道DNA存储数据的预设引物信息和目标存储数据的数据长度的。同时还知道引物的DNA序列。根据引物信息,进行PCR扩增,扩增之后,对数据进行测序。
步骤一:将预设引物,转换为对应的十进制整数,作为随机生成器的种子,注入随机生成器,生成取值范围在[0,4T+N]的随机数,再将随机数转换成对应的碱基,与DNA链中(目标存储数据)除了预设引物的碱基序列之外的序列进行异或,恢复原来数据。
步骤二:根据恢复之后的数据,将预设引物转换为对应的十进制整数,作为种子,注入随机生成器,根据随机生成器生成次数信息,生成取值范围在[0,2K]的整数,将生成的整数,转变为K位的二进制形式的随机数序列,记录下次二进制序列D1,以及数据序列DATA1,继续抽取测序序列,直到抽出K个不同的序列为止,记录下K个的二进制序列D1、D2……DK,以及数据序列DATA1、DATA2……DATAK
步骤三:将K个K位的序列Di,组成K阶矩阵D。
步骤四:利用高斯消元法,进行矩阵解法。首先将K阶矩阵D(矩阵D由D1、D2……DK组成),与K行1列的DATA矩阵组合(DATA矩阵由DATA1、DATA2……DATAK组成),构建增广矩阵,接下来沿着矩阵对角线进行判断(i从0-K),若D[i][i]=1,则沿着列判断其下所有序列,若D[j][i]=1,则将第i行所有数据与第j行所有数据进行异或。若D[i][i]=0,则沿着列向下寻找,找到D[j][i]=1时,互换两行,然后再向下寻找,若还有D[j][i]=1,则用第i行同第j行进行异或,确保构建出一个上三角矩阵,矩阵对角线下方区域全部为0。
步骤五:再依照上一步,反向操作,将对角线上方为1的全部消为0,即可得到唯一的S1……SK,以及DATA1……DATAK完成译码过程。
其次,参照附图描述根据本发明实施例提出的一种数据存储系统。
图2是本发明一个实施例的一种数据存储系统结构示意图。
该系统具体包括:
数据获取模块201,用于获取第一数据;
分组模块202,用于对第一数据进行分组得到K个分组子数据,其中,K为正整数;
随机数序列获取模块203,用于将预设引物输入随机生成器,得到4T个随机数序列,其中,T为随机生成器的生成次数容量,且4T>K,预设引物前缀中鸟嘌呤和胞嘧啶的含量占预设引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值;
分组确定模块204,用于确定第i个随机数序列所对应的分组子数据,并利用确定的分组子数据进行异或运算得到数据信息DATAi,其中,i为自然数,且1≤i≤4T,并根据数据信息DATAi、预设引物和随机生成器的生成次数容量得到DNA分子链;
合成模块205,用于将若干个DNA分子链进行DNA序列合成得到目标存储数据。
进一步作为可选的实施方式,每一个随机数序列包括K位随机位,分组确定模块204包括:
判断单元2041,用于当判断第i个随机数序列的第m位随机位的数值为1,则选取m个随机位对应的分组子数据,其中,m为整数且1≤m≤K;
异或运算单元2042,用于将选取的分组子数据进行异或运算,得到数据信息DATAi
可见,上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
参照图3,本发明实施例提供了一种数据存储装置,包括:
至少一个处理器301;
至少一个存储器302,用于存储至少一个程序;
当至少一个程序被至少一个处理器301执行时,使得至少一个处理器301实现的一种数据存储方法。
同理,上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干程序用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行程序的定序列表,可以具体实现在任何计算机可读介质中,以供程序执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从程序执行系统、装置或设备取程序并执行程序的系统)使用,或结合这些程序执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供程序执行系统、装置或设备或结合这些程序执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的程序执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种数据存储方法,其特征在于,包括以下步骤:
获取第一数据;
对所述第一数据进行分组得到K个分组子数据,其中,所述K为正整数;
将预设引物输入随机生成器,得到4T个随机数序列,其中,所述T为所述随机生成器的生成次数容量,且4T>K,所述预设引物前缀中鸟嘌呤和胞嘧啶的含量占所述预设引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值;
确定第i个所述随机数序列所对应的所述分组子数据,并利用确定的所述分组子数据进行异或运算得到数据信息DATAi,其中,i为自然数,且1≤i≤4T,并根据所述数据信息DATAi、所述预设引物和所述随机生成器的生成次数容量得到DNA分子链;
将若干个所述DNA分子链进行DNA序列合成得到目标存储数据。
2.根据权利要求1所述的一种数据存储方法,其特征在于,所述对所述第一数据进行分组得到K个分组子数据这一步骤,包括以下步骤:
确定所述第一数据的数据长度和分组长度;
根据所述数据长度和所述分组长度得到K个分组子数据。
3.根据权利要求1所述的一种数据存储方法,其特征在于,将预设引物输入随机生成器,得到4T个随机数序列这一步骤,具体为:
控制循环次数j,所述随机生成器根据输入的所述预设引物,输出取值范围在[0,2K]的随机整数,并将所述随机整数转换为二进制形式的随机数序列DATAj
其中,1≤j≤4T
4.根据权利要求1所述的一种数据存储方法,其特征在于,每一个所述随机数序列包括K位随机位,所述确定第i个所述随机数序列所对应的所述分组子数据,并利用确定的所述分组子数据进行异或运算得到数据信息DATAi这一步骤,包括以下步骤:
当判断第i个所述随机数序列的第m位所述随机位的数值为1,则选取m个随机位对应的所述分组子数据,其中,m为整数且1≤m≤K;
将选取的所述分组子数据进行异或运算,得到所述数据信息DATAi
5.根据权利要求1所述的一种数据存储方法,其特征在于,所述存储方法还包括对所述DNA分子链的随机化处理这一步骤,包括以下步骤:
将预设引物输入随机生成器得到随机整数序列;
将所述随机整数序列转化为二进制序列或对应碱基序列,在所述随机生成器的生成次数的指引下生成度分布序列,指导所述数据信息进行异或运算。
6.一种解码方法,应用于权利要求5所述的一种数据存储方法得到的所述目标存储数据,其特征在于,包括以下步骤:
对所述目标数据存储数据进行解码。
7.一种数据存储系统,其特征在于,包括:
数据获取模块,用于获取第一数据;
分组模块,用于对所述第一数据进行分组得到K个分组子数据,其中,所述K为正整数;
随机数序列获取模块,用于将预设引物输入随机生成器,得到4T个随机数序列,其中,T为所述随机生成器的生成次数容量,且4T>K,所述预设引物前缀中鸟嘌呤和胞嘧啶的含量占所述预设引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值;
分组确定模块,用于确定第i个所述随机数序列所对应的所述分组子数据,并利用确定的所述分组子数据进行异或运算得到数据信息DATAi,其中,i为自然数,且1≤i≤4T,并根据数据信息DATAi、所述预设引物和所述随机生成器的生成次数容量得到DNA分子链;合成模块,用于将若干个所述DNA分子链进行DNA序列合成得到目标存储数据。
8.根据权利要求7所述的一种数据存储系统,其特征在于,每一个所述随机数序列包括K位随机位,所述分组确定模块包括:
判断单元,用于当判断第i个所述随机数序列的第m位所述随机位的数值为1,则选取m个随机位对应的所述分组子数据,其中,m为整数且1≤m≤K;
异或运算单元,用于将选取的所述分组子数据进行异或运算,得到所述数据信息DATAi
9.一种数据存储装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-6中任一项所述的一种数据存储方法。
10.一种存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于实现如权利要求1-6中任一项所述的一种数据存储方法。
CN202110583430.0A 2021-05-27 2021-05-27 一种数据存储方法、解码方法、系统、装置及存储介质 Active CN113314187B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110583430.0A CN113314187B (zh) 2021-05-27 2021-05-27 一种数据存储方法、解码方法、系统、装置及存储介质
US17/469,048 US20220382480A1 (en) 2021-05-27 2021-09-08 Method, system, apparatus for data storage, decoding method, and storage medium
US17/720,641 US20220382481A1 (en) 2021-05-27 2022-04-14 Method, system, apparatus for data storage, decoding method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110583430.0A CN113314187B (zh) 2021-05-27 2021-05-27 一种数据存储方法、解码方法、系统、装置及存储介质

Publications (2)

Publication Number Publication Date
CN113314187A true CN113314187A (zh) 2021-08-27
CN113314187B CN113314187B (zh) 2022-05-10

Family

ID=77375449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110583430.0A Active CN113314187B (zh) 2021-05-27 2021-05-27 一种数据存储方法、解码方法、系统、装置及存储介质

Country Status (2)

Country Link
US (2) US20220382480A1 (zh)
CN (1) CN113314187B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024021164A1 (zh) * 2022-07-29 2024-02-01 密码子(杭州)科技有限公司 用于分子数据存储的写入系统、写入方法和写入控制设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116226049B (zh) * 2022-12-19 2023-11-10 武汉大学 基于大小喷泉码利用dna进行信息存储的方法、系统及设备

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104520864A (zh) * 2012-06-01 2015-04-15 欧洲分子生物学实验室 Dna中数字信息的高容量存储
WO2015144858A1 (en) * 2014-03-28 2015-10-01 Thomson Licensing Methods for storing and reading digital data on a set of dna strands
US20180223341A1 (en) * 2017-02-08 2018-08-09 Microsoft Technology Licensing, Llc Primer Design for Retrieval of Stored Nucleotides
WO2019020059A1 (en) * 2017-07-25 2019-01-31 Nanjingjinsirui Science & Technology Biology Corp. STORING AND EXTRACTING DNA DATA
WO2019079802A1 (en) * 2017-10-20 2019-04-25 President And Fellows Of Harvard College METHODS OF HIGH-RATE ENCODING AND DECODING OF INFORMATION STORED IN DNA
CN110268474A (zh) * 2017-02-08 2019-09-20 微软技术许可有限责任公司 用于所存储的多核苷酸的取回的引物设计
CN110570344A (zh) * 2019-08-27 2019-12-13 河南大学 基于随机数嵌入和dna动态编码的图像加密方法
WO2020005598A1 (en) * 2018-06-29 2020-01-02 Microsoft Technology Licensing, Llc Whole pool amplification and in-sequencer random-access of data encoded by polynucleotides
CN110932736A (zh) * 2019-11-09 2020-03-27 天津大学 一种基于Raptor码及四进制RS码的DNA信息存储方法
CN111243670A (zh) * 2020-01-23 2020-06-05 天津大学 一种满足生物约束的dna信息存储编码方法
CN111858507A (zh) * 2020-06-16 2020-10-30 广州大学 基于dna的数据存储方法、解码方法、系统和装置
WO2020243073A1 (en) * 2019-05-31 2020-12-03 Illumina, Inc. Systems and methods for information storage and retrieval using flow cells
WO2021033981A1 (ko) * 2019-08-21 2021-02-25 울산대학교 산학협력단 Dna 저장 장치의 연성 정보 기반 복호화 방법, 프로그램 및 장치
CN112582030A (zh) * 2020-12-18 2021-03-30 广州大学 一种基于dna存储介质的文本存储方法
CN112735514A (zh) * 2021-01-18 2021-04-30 清华大学 神经网络提取调控dna组合模式的训练和可视化方法及系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6943417B2 (en) * 2003-05-01 2005-09-13 Clemson University DNA-based memory device and method of reading and writing same
CN107925505B (zh) * 2015-07-08 2021-01-29 华为技术有限公司 一种用户及网络侧设备、确定对数据包的处理模式的方法
US10465232B1 (en) * 2015-10-08 2019-11-05 Trace Genomics, Inc. Methods for quantifying efficiency of nucleic acid extraction and detection
DE102016220884A1 (de) * 2016-10-24 2018-04-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Variable Teilpaketlängen für Telegram Splitting in Netzwerken mit geringem Stromverbrauch
DE102016220886B3 (de) * 2016-10-24 2018-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Interleaving für die Übertragung von Telegrammen mit variabler Subpaketanzahl und sukzessiver Decodierung
US10784771B2 (en) * 2016-11-07 2020-09-22 Infineon Technologies Austria Ag Multiphase power supply and distributed phase control
DE102017204184A1 (de) * 2017-03-14 2018-09-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Authentisierte Bestätigungs- und Aktivierungsnachricht
DE102017220061A1 (de) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Datensender und Datenempfänger mit geringer Latenz für das Telegram-Splitting-Übertragungsverfahren
US20190377851A1 (en) * 2018-06-07 2019-12-12 Microsoft Technology Licensing, Llc Efficient payload extraction from polynucleotide sequence reads
JP7251164B2 (ja) * 2019-01-24 2023-04-04 富士通株式会社 乱数生成器、半導体装置、及びプログラム
US11755640B2 (en) * 2019-12-20 2023-09-12 The Board Of Trustees Of The University Of Illinois DNA-based image storage and retrieval
JP7389348B2 (ja) * 2020-03-12 2023-11-30 富士通株式会社 擬似乱数生成回路装置
JP7446923B2 (ja) * 2020-06-02 2024-03-11 キオクシア株式会社 半導体装置及び半導体記憶装置

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104520864A (zh) * 2012-06-01 2015-04-15 欧洲分子生物学实验室 Dna中数字信息的高容量存储
WO2015144858A1 (en) * 2014-03-28 2015-10-01 Thomson Licensing Methods for storing and reading digital data on a set of dna strands
US20180223341A1 (en) * 2017-02-08 2018-08-09 Microsoft Technology Licensing, Llc Primer Design for Retrieval of Stored Nucleotides
CN110268474A (zh) * 2017-02-08 2019-09-20 微软技术许可有限责任公司 用于所存储的多核苷酸的取回的引物设计
WO2019020059A1 (en) * 2017-07-25 2019-01-31 Nanjingjinsirui Science & Technology Biology Corp. STORING AND EXTRACTING DNA DATA
WO2019079802A1 (en) * 2017-10-20 2019-04-25 President And Fellows Of Harvard College METHODS OF HIGH-RATE ENCODING AND DECODING OF INFORMATION STORED IN DNA
WO2020005598A1 (en) * 2018-06-29 2020-01-02 Microsoft Technology Licensing, Llc Whole pool amplification and in-sequencer random-access of data encoded by polynucleotides
WO2020243073A1 (en) * 2019-05-31 2020-12-03 Illumina, Inc. Systems and methods for information storage and retrieval using flow cells
WO2021033981A1 (ko) * 2019-08-21 2021-02-25 울산대학교 산학협력단 Dna 저장 장치의 연성 정보 기반 복호화 방법, 프로그램 및 장치
CN110570344A (zh) * 2019-08-27 2019-12-13 河南大学 基于随机数嵌入和dna动态编码的图像加密方法
CN110932736A (zh) * 2019-11-09 2020-03-27 天津大学 一种基于Raptor码及四进制RS码的DNA信息存储方法
CN111243670A (zh) * 2020-01-23 2020-06-05 天津大学 一种满足生物约束的dna信息存储编码方法
CN111858507A (zh) * 2020-06-16 2020-10-30 广州大学 基于dna的数据存储方法、解码方法、系统和装置
CN112582030A (zh) * 2020-12-18 2021-03-30 广州大学 一种基于dna存储介质的文本存储方法
CN112735514A (zh) * 2021-01-18 2021-04-30 清华大学 神经网络提取调控dna组合模式的训练和可视化方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GEARHEART CM,ET AL.: "DNA-based random number generation in security circuitry", 《BIOSYSTEMS》 *
SHI XIAOLONG, ET AL.: "DNA Logic circuits based on accurate step function gate", 《IEEE ACCESS》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024021164A1 (zh) * 2022-07-29 2024-02-01 密码子(杭州)科技有限公司 用于分子数据存储的写入系统、写入方法和写入控制设备

Also Published As

Publication number Publication date
US20220382480A1 (en) 2022-12-01
CN113314187B (zh) 2022-05-10
US20220382481A1 (en) 2022-12-01

Similar Documents

Publication Publication Date Title
US9830553B2 (en) Code generation method, code generating apparatus and computer readable storage medium
CN113314187B (zh) 一种数据存储方法、解码方法、系统、装置及存储介质
US9774351B2 (en) Method and apparatus for encoding information units in code word sequences avoiding reverse complementarity
EP2947779A1 (en) Method and apparatus for storing information units in nucleic acid molecules and nucleic acid storage system
CN111858507B (zh) 基于dna的数据存储方法、解码方法、系统和装置
CN112582030B (zh) 一种基于dna存储介质的文本存储方法
JP2005535190A5 (zh)
Park et al. Iterative coding scheme satisfying gc balance and run-length constraints for dna storage with robustness to error propagation
CN115459781A (zh) 一种基于静态交织编码的长序列dna存储编码方法
CN116187435B (zh) 基于大小喷泉码及mrc算法利用dna进行信息存储方法及系统
CN111243670A (zh) 一种满足生物约束的dna信息存储编码方法
CN113095042B (zh) 一种字符串加密方法、系统、装置及存储介质
Preuss et al. Data storage based on combinatorial synthesis of DNA shortmers
CN116564424A (zh) 基于纠删码与组装技术的dna数据存储方法、读取方法及终端
Garzon et al. Digital information encoding on DNA
EP2947589A1 (en) Method and apparatus for controlling a decoding of information encoded in synthesized oligos
KR101953663B1 (ko) 하나의 올리고뉴클레오티드를 이용해서 올리고뉴클레오티드 풀을 생산하는 방법
Park et al. Iterative DNA Coding Scheme With GC Balance and Run-Length Constraints Using a Greedy Algorithm
Bi et al. Extended XOR Algorithm with Biotechnology Constraints for Data Security in DNA Storage
CN117880526A (zh) 视频数据dna存储的信息编解码方法、装置、设备及介质
Wang et al. Novel Interleaved Code for High-Throughput Parallel DNA-Based Molecular Communications
EP3098742A1 (en) Method and apparatus for creating a plurality of oligos with a targeted distribution of nucleotide types
CN107682121B (zh) 一种编码方法及装置
WO2016023784A1 (en) Method for generating codes, device for generating code word sequences for nucleic acid storage channel modulation, and computer readable storage medium
RU2628199C1 (ru) Способ сжатия данных

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221227

Address after: Room 301, No. 235, Kexue Avenue, Huangpu District, Guangzhou, Guangdong 510000

Patentee after: OURCHEM INFORMATION CONSULTING CO.,LTD.

Address before: 510006 No. 230 West Ring Road, University of Guangdong, Guangzhou

Patentee before: Guangzhou University

Effective date of registration: 20221227

Address after: 510000 room 606-609, compound office complex building, No. 757, Dongfeng East Road, Yuexiu District, Guangzhou City, Guangdong Province (not for plant use)

Patentee after: China Southern Power Grid Internet Service Co.,Ltd.

Address before: Room 301, No. 235, Kexue Avenue, Huangpu District, Guangzhou, Guangdong 510000

Patentee before: OURCHEM INFORMATION CONSULTING CO.,LTD.