CN115459781A - 一种基于静态交织编码的长序列dna存储编码方法 - Google Patents

一种基于静态交织编码的长序列dna存储编码方法 Download PDF

Info

Publication number
CN115459781A
CN115459781A CN202211029207.2A CN202211029207A CN115459781A CN 115459781 A CN115459781 A CN 115459781A CN 202211029207 A CN202211029207 A CN 202211029207A CN 115459781 A CN115459781 A CN 115459781A
Authority
CN
China
Prior art keywords
sequence
data
base
dna
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211029207.2A
Other languages
English (en)
Inventor
赵祥伟
毕昆
李正宇
陆祖宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202211029207.2A priority Critical patent/CN115459781A/zh
Publication of CN115459781A publication Critical patent/CN115459781A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/123DNA computing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/27Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes using interleaving techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Error Detection And Correction (AREA)

Abstract

本发明公开了一种基于静态交织编码的长序列DNA存储编码方法,包括:输入数据,进行二进制转换、压缩编码和碱基转换;将碱基序列划分为若干分块,每个分块内有若干DNA序列,并为每条序列添加地址码;对每条序列添加纠错码置于序列尾部;数据交织,将每一条数据序列随机分散到若干条DNA序列中;DNA合成、测序之后对数据进行解交织、纠错解码、碱基序列转换和解压缩,得到输入数据。针对长序列DNA存储中错误率随合成长度增加逐渐上升,通过将碱基重新排列,把连续错误转化为随机的错误,再采用常见的编码技术进行纠错,提升纠错能力,同时为不同位置的序列添加不同长度的纠错码,有效降低纠错冗余,提高存储效率。

Description

一种基于静态交织编码的长序列DNA存储编码方法
技术领域
本发明涉及DNA数据存储编解码方法,特别涉及一种基于静态交织编码的长序列DNA存储编码方法。
背景技术
DNA作为一种新型的存储介质,与传统存储介质相比,具有存储容量大、密度高、存储时间长、能耗低等优点。在DNA存储中,DNA的合成以及测序会引入DNA序列碱基上的错误。为了保证数据的无损恢复,目前,各研究团队开发新的纠正碱基错误的算法,主要采用基于通信领域里性能较好的纠错码来实现,这些纠错码包括Reed-solomon(RS)码、BCH码、Raptor Code码、汉明码、LDPC码等等,其中主流使用的是RS码。这些编码算法保证了DNA存储中对于数据的无损恢复,但随着DNA合成技术的发展,当这些技术应用于长序列DNA存储时,会存在编码效率降低的问题。
目前DNA合成的主要实现形式为基于半导体工艺的芯片合成技术,受材料、工艺、芯片布局等影响,合成DNA时不同位点合成的DNA序列质量参差不齐,部分位点合成的DNA序列会出现较多的连续错误,这种错误不是独立发生的。
现有的编码纠错技术大多数都可抵抗随机独立错误,但对于非独立连续错误,这些编码算法的性能会大大降低。此外,随着合成序列的长度逐渐增长,碱基的错误率会快速上升,连续的缺失、替换错误将会不断出现,在序列的后部将会形成固定、连续、非独立的错误。针对上述情况,传统的编码纠错算法为了保证数据的无损恢复需要为每一条序列添加大量的纠错码,形成较多的冗余,降低了编码性能。
通信领域中的比特交织编码调制技术可以很好的解决上述的问题,其由Zehavi于1992年提出。在DNA存储中,可以借鉴比特交织的思想,通过对编码后的数据序列进行交织处理,将每一条数据序列分散到若干条待合成的DNA序列中,可以降低当一条DNA序列出现较多连续错误时对于数据无损恢复带来的困难。
发明内容
发明目的:本发明目的是提供一种基于静态交织编码的长序列DNA存储编码方法。
本方法针对DNA存储中长序列合成错误率随长度逐渐上升的问题,通过将碱基重新交织排列,并针对序列不同位置的不同错误类型和数量,设置不同的纠错码,精准纠错,减少冗余,提高效率,实现了把一条序列中可能出现的连续多个碱基错误的情况转化为了若干条序列中随机出现少量错误的情况,从而可以采用常见的编码技术对序列进行纠错,提升了纠错能力,大大减少固定、连续、非独立的错误,有效降低序列中纠错冗余,提高存储效率。
技术方案:所述基于静态交织编码的长序列DNA存储编码方法,包括如下编码、解码两个部分:
编码阶段主要包含以下步骤:
(1)数据输入,读入待存储的原始数据;
(2)进制转换,将原始数据转换为二进制数据;
(3)压缩编码,对进制转换后的二进制数据进行压缩以提高存储效率,可采用霍夫曼压缩编码、喷泉码等多种压缩编码方法,对二进制数据进行划分和压缩;
(4)碱基转换,将压缩后的二进制序列转换为碱基序列,可以采用包括二进制、三进制、四进制和混合进制等多种碱基转换方式,同时避免均聚物的产生;
(5)数据分割,根据待合成的DNA序列长度L、待合成DNA序列总数目K以及DNA合成芯片阵列信息对碱基序列进行划分,将碱基序列的全部碱基,按照每{N1,N2,…,Nm}个碱基划分为一个子分块,共m个分块,其中N1,N2,…,Nm的大小根据待合成序列在芯片阵列的分布位置动态调整,之后对每个分块再进行划分,保证除最后一个分块外,每个分块内均被划分为长度相等的U条序列,其中最后一个分块序列数目为Um,Um≤U;
(6)添加纠错码,对每条序列进行编码并添加纠错码置于序列尾部,根据序列所处分块的不同,纠错码的位数分别为{R1,R2,…,Rm},可以使用不同的纠错编码方式,如RS码、LDPC码等,但需确保每一行碱基与纠错码的长度之和均为定值Ld=Ni/U+Ri,其中i的范围为1,…,m,并为每个分块按列添加纠错码,纠错码位数为E,在分块尾部构成列纠错码组成的序列。本方法采用RS码编码,选择的RS码为定义在有限域上GF(xP)上的RS码,其码长为0~xP-1共xP个符号,可以结合实际合成DNA需要更改码字长度,但需满足xP>L;
(7)添加地址码,为每条DNA序列添加独一无二的地址码用于恢复数据分块,每个分块有U+E条DNA序列,共有K=(m-1)×U+Um+mE条,为每一条DNA序列添加地址码,地址码为数字1,…,K转换后得到的碱基序列,地址码长度为
Figure BDA0003816105750000031
每条DNA序列长度为L=Lα+Ld
(8)构建基于随机数的数据交织器,生成{S1,S2,…,ST,…SK}的随机数序列,其中ST为范围1,…,K的随机数,互不相等,根据每行Ld个数据,将随机数序列划分为U+E行,构成Ld×(U+E)的交织矩阵,用于标记一个分块内每条DNA序列的每个碱基的分散位置;
(9)数据交织,根据(8)中所构建的数据交织矩阵,将(7)中得到的DNA序列除地址码外的的每个碱基按照数据交织矩阵进行交织重排,保证将每条DNA序列的每个碱基分散到同一分块内的随机位置;
(10)添加引物,对DNA序列添加引物,得到待合成的DNA序列。
解码过程为编码的反向过程,主要包含以下步骤:
(1)去除引物,根据DNA序列长度信息对测序得到的DNA序列去除位于序列首尾位置的引物;
(2)排序重构,将(1)得到的DNA序列按照地址码进行排序,重新构建DNA序列矩阵,得到数据分块;
(3)解交织,按照数据交织器对(2)中得到的DNA序列按照分块进行解交织处理,得到交织前的DNA序列;
(4)纠错解码,根据设置的纠错编码方法,对(3)中得到的序列进行纠错码检错、纠正,先根据列纠错码对分块内的每列碱基进行纠错,再根据行纠错码对每条序列的碱基进行纠错;
(5)删除纠错码,根据纠错码的长度信息,删除每条DNA序列的纠错码以及每个分块的纠错序列;
(6)数据拼接,根据地址码将每条序列拼接到一起,得到一条长的碱基序列;
(7)删除地址码,根据地址码的长度以及信息位的长度,删除(6)中得到的碱基序列中的地址码;
(8)碱基转换,根据编码过程中的碱基转换规则,对(7)中得到的序列进行碱基转换,将碱基序列转换为二进制序列;
(9)数据解压,根据编码过程中采用的压缩算法,对(8)中得到的二进制序列进行解压缩操作,得到未压缩的二进制序列;
(10)数据恢复,根据文件类型进行二进制数据到文件数据的转换,得到原始文件。
本发明方法基于比特交织思想,针对合成过程中的固定、连续、非独立的错误,将碱基分散到多个不同的合成位点中,把连续错误转化为随机的错误,从而可以采用常见的编码技术进行纠错。
有益效果:本发明与现有技术相比,具有如下优势:
1.本发明方法通过将碱基序列重新交织排列,把一条序列中可能出现的连续错误转化为若干条序列中随机出现的少量错误,从而可以采用常见的编码技术进行纠错,提升纠错能力。
2.针对序列不同合成位置的不同错误率,分别设置不同的纠错码,实现精准纠错,减少冗余,提高效率。
3.合成的DNA序列越长,越容易出现碱基错误。本方法对于长序列DNA存储,可极大的减少需要保证数据无损恢复的纠错码数目,提高了编码效率以及纠错能力,减少了序列冗余,提高了存储效率。
附图说明
图1为本发明的方法流程示意图;
图2为数据交织前DNA序列组成和分块示意图;
图3为基于随机数的数据交织器作用示意图;
图4为示例的输入图片。
具体实施方式
选择一幅大小为996KB的图片作为输入数据,文件见图4,按以下步骤进行操作:
(1)读入图片;
(2)对图片数据进行二进制转换,得到二进制序列;
(3)对转换后的二进制序列进行16位霍夫曼编码压缩,得到大小为470.3KB的二进制数据;
(4)对压缩后的二进制数据进行碱基转换,每7位二进制数进行一次碱基转换,前6位二进制数按照00=A,0i=T,10=C,11=G的对应关系进行转换,对于第7位二进制数,进行判断操作,对第5、6位的二进制数转换的碱基类别与其自身的数值进行判断,例如若第7位二进制数本身为0,且前第5、6位的二进制数转换为A,则将第7位二进制数转换为碱基C;
(5)将碱基序列划分为177个分块,前176个分块每个分块包含125条碱基序列,第177个分块内含有20条碱基序列;
(6)对每条序列进行行编码纠错,添加纠错码,置于每条序列尾部,第一个分块每条序列添加2位RS纠错码,第二个子分块每条添加4位RS纠错码,以此类推,按照芯片合成位点质量依次为不同分块的碱基序列添加不同长度的纠错码,但需保证每一条序列的碱基长度在添加纠错码后均为102bp。之后为每个分块的每列添加2位RS纠错码,至于分块尾部构成2条纠错码序列,使得前176个分块均具有127条序列,长度为102bp,全部分块共有22374条序列;
(7)对序列添加地址码,地址码为数字1,...,22374转换后得到的碱基片段,地址码长度为8bp,添加地址码后每条序列长度为110bp;
(8)构建基于随机数的数据交织器,创建基于随机数的数据交织器,用于标记一个分块内每条DNA序列的每个碱基的分散位置,数据交织器保存于计算机中用于数据恢复;
(9)数据交织,使用(8)中所构建的数据交织器处理对(7)中得到的DNA序列进行交织处理,将每条DNA序列的每个碱基分散到同一分块内的随机位置;
(10)添加引物,对(9)中得到的交织处理后的DNA序列添加引物,5’端引物长17bp,3’端引物长20bp,得到待合成的DNA序列。
对完成编码的DNA序列集进行合成、PCR和测序。
解码过程为编码的反向过程,主要包含以下步骤:
(1)去除引物,DNA序列长度为147bp,头部17bp为5’端引物,尾部20bp为3’端引物,对测序得到的DNA序列去除位于序列首尾位置的引物;
(2)排序重构,将(1)得到的DNA序列按照地址码进行排序,重新构建DNA序列矩阵,得到数据分块;
(3)解交织,按照数据交织器对(2)中得到的DNA序列按照分块进行解交织处理,得到交织前的DNA序列;
(4)纠错解码,根据设置的纠错编码方法,对(3)中得到的序列进行纠错码检错、纠正,先根据列纠错码对分块内的每列碱基进行纠错,再根据行纠错码对每条碱基序列进行验错;
(5)删除纠错码,根据纠错码的长度信息,删除每条DNA序列的纠错码以及每个分块的纠错序列;
(6)数据拼接,根据地址码将每条序列拼接到一起,得到一条长的碱基序列;
(7)删除地址码,根据地址码的长度8bp以及信息位的长度,删除(6)中碱基序列的地址码的部分;
(8)碱基转换,根据编码过程中的碱基转换规则,对(7)中得到的碱基序列进行碱基转换,每4位碱基进行一次转换,前3位碱基按照A=00,T=01,C=10,G=11的对应关系进行转换,对第4位碱基进行判断操作,对第3位碱基以及自身的碱基类别进行判断,若第4位碱基为C,第3位碱基为A或T,则第4位碱基转换为二进制数0,以此类推,将碱基序列转换为二进制序列;
(9)数据解压,根据编码过程中得到的霍夫曼树,对(8)中得到的二进制序列进行解压缩操作,得到未压缩的二进制序列;
(10)数据恢复,根据文件类型进行二进制数据到文件数据的转换,得到原始文件。
在完全恢复输入文件的前提下,交织编码方案的存储密度为1.57bits/nt,冗余度为10.53%,未进行数据交织的编码方案存储密度为1.50bits/nt,冗余度为14.11%,可以看到在序列长度较短的情况下,交织编码方案仍然可以有效提升纠错方案的存储密度,降低冗余,提升编码效率。
表1实施示例中数据交织编码方案与未进行交织的编码方案的存储密度与冗余度对比。
表1
Figure BDA0003816105750000061

Claims (5)

1.一种基于静态交织编码的长序列DNA存储编码方法,包括编码、解码两个部分,其特征在于:
编码阶段主要包含以下步骤:
(1)数据输入,读入待存储的原始数据;
(2)进制转换,将原始数据转换为二进制数据;
(3)压缩编码,对进制转换后的二进制数据进行压缩以提高存储效率,可采用霍夫曼压缩编码、喷泉码等多种压缩编码方法,对二进制数据进行划分和压缩;
(4)碱基转换,将压缩后的二进制序列转换为碱基序列,可以采用包括二进制、三进制、四进制和混合进制等多种碱基转换方式,同时避免均聚物的产生;
(5)数据分割,根据待合成的DNA序列长度L、待合成DNA序列总数目K以及DNA合成芯片阵列信息对碱基序列进行划分,将碱基序列的全部碱基,按照每{N1,N2,…,Nm}个碱基划分为一个子分块,共m个分块,其中N1,N2,…,Nm的大小根据待合成序列在芯片阵列的分布位置动态调整,之后对每个分块再进行划分,保证除最后一个分块外,每个分块内均被划分为长度相等的U条序列,其中最后一个分块序列数目为Um,Um≤U;
(6)添加纠错码,对每条序列进行编码并添加纠错码置于序列尾部,根据序列所处分块的不同,纠错码的位数分别为{R1,R2,…,Rm},可以使用不同的纠错编码方式,如RS码、LDPC码等,但需确保每一行碱基与纠错码的长度之和均为定值Ld=Ni/U+Ri,其中i的范围为1,…,m,并为每个分块按列添加纠错码,纠错码位数为E,在分块尾部构成列纠错码组成的序列,本方法采用RS码编码,选择的RS码为定义在有限域上GF(xP)上的RS码,其码长为0~xP-1共xP个符号,可以结合实际合成DNA需要更改码字长度,但需满足xP>L;
(7)添加地址码,为每条DNA序列添加独一无二的地址码用于恢复数据分块,每个分块有U+E条DNA序列,共有K=(m-1)×U+Um+mE条,为每一条DNA序列添加地址码,地址码为数字1,…,K转换后得到的碱基序列,地址码长度为
Figure FDA0003816105740000011
每条DNA序列长度为L=La+Ld
(8)构建基于随机数的数据交织器,生成{S1,S2,…,ST,…SK}的随机数序列,其中ST为范围1,…,K的随机数,互不相等,根据每行Ld个数据,将随机数序列划分为U+E行,构成Ld×(U+E)的交织矩阵,用于标记一个分块内每条DNA序列的每个碱基的分散位置;
(9)数据交织,根据(8)中所构建的数据交织矩阵,将(7)中得到的DNA序列除地址码外的的每个碱基按照数据交织矩阵进行交织重排,保证将每条DNA序列的每个碱基分散到同一分块内的随机位置;
(10)添加引物,对DNA序列添加引物,得到待合成的DNA序列,
解码过程为编码的反向过程,包含以下步骤:
(1)去除引物,根据DNA序列长度信息对测序得到的DNA序列去除位于序列首尾位置的引物;
(2)排序重构,将(1)得到的DNA序列按照地址码进行排序,重新构建DNA序列矩阵,得到数据分块;
(3)解交织,按照数据交织器对(2)中得到的DNA序列按照分块进行解交织处理,得到交织前的DNA序列;
(4)纠错解码,根据设置的纠错编码方法,对(3)中得到的序列进行纠错码检错、纠正,先根据列纠错码对分块内的每列碱基进行纠错,再根据行纠错码对每条序列的碱基进行纠错;
(5)删除纠错码,根据纠错码的长度信息,删除每条DNA序列的纠错码以及每个分块的纠错序列;
(6)数据拼接,根据地址码将每条序列拼接到一起,得到一条长的碱基序列;
(7)删除地址码,根据地址码的长度以及信息位的长度,删除(6)中得到的碱基序列中的地址码;
(8)碱基转换,根据编码过程中的碱基转换规则,对(7)中得到的序列进行碱基转换,将碱基序列转换为二进制序列;
(9)数据解压,根据编码过程中采用的压缩算法,对(8)中得到的二进制序列进行解压缩操作,得到未压缩的二进制序列;
(10)数据恢复,根据文件类型进行二进制数据到文件数据的转换,得到原始文件。
2.根据权利要求1所述的基于静态交织编码的长序列DNA存储编码方法,其特征在于:输入的数据为任何可以转换为二进制的数据。
3.根据权利要求1所述的基于静态交织编码的长序列DNA存储编码方法,其特征在于:是对输入数据的碱基序列按照随机数交织矩阵重新排列,使可能产生的错误随机化,从而可用常规编码技术纠错。
4.根据权利要求1所述的基于静态交织编码的长序列DNA存储编码方法,其特征在于:是对于待合成长度不小于300bp的DNA序列进行交织编码,当待合成的DNA序列长度越长,可供数据交织的碱基位点就越多,交织编解码方法效果越好。
5.根据权利要求1所述的基于静态交织编码的长序列DNA存储编码方法,其特征在于:是根据待合成DNA序列在电化学芯片上分布的不同位置,在编码阶段对合成位置不同的不同序列添加不同长度的纠错码。
CN202211029207.2A 2022-08-25 2022-08-25 一种基于静态交织编码的长序列dna存储编码方法 Pending CN115459781A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211029207.2A CN115459781A (zh) 2022-08-25 2022-08-25 一种基于静态交织编码的长序列dna存储编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211029207.2A CN115459781A (zh) 2022-08-25 2022-08-25 一种基于静态交织编码的长序列dna存储编码方法

Publications (1)

Publication Number Publication Date
CN115459781A true CN115459781A (zh) 2022-12-09

Family

ID=84300955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211029207.2A Pending CN115459781A (zh) 2022-08-25 2022-08-25 一种基于静态交织编码的长序列dna存储编码方法

Country Status (1)

Country Link
CN (1) CN115459781A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116757158A (zh) * 2023-08-11 2023-09-15 深圳致赢科技有限公司 基于半导体存储的数据管理方法
CN116187435B (zh) * 2022-12-19 2024-01-05 武汉大学 基于大小喷泉码及mrc算法利用dna进行信息存储方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187435B (zh) * 2022-12-19 2024-01-05 武汉大学 基于大小喷泉码及mrc算法利用dna进行信息存储方法及系统
CN116757158A (zh) * 2023-08-11 2023-09-15 深圳致赢科技有限公司 基于半导体存储的数据管理方法
CN116757158B (zh) * 2023-08-11 2024-01-23 深圳致赢科技有限公司 基于半导体存储的数据管理方法

Similar Documents

Publication Publication Date Title
CN115459781A (zh) 一种基于静态交织编码的长序列dna存储编码方法
Shomorony et al. Capacity results for the noisy shuffling channel
JP4558037B2 (ja) 良好な機能を持つ不規則な短縮ldpcコードのコード構成
JP5232013B2 (ja) フラッシュメモリにおける誤り訂正のための方法およびシステム
JP2824474B2 (ja) 誤り訂正方式及びこの誤り訂正方式を用いた復号器
Dimopoulou et al. A biologically constrained encoding solution for long-term storage of images onto synthetic DNA
CN1140060C (zh) 用于Turbo编码的交织器和交织方法
CN110708076B (zh) 一种基于混合模型的dna存储编解码方法
US7107505B2 (en) Concatenated turbo product codes for high performance satellite and terrestrial communications
CN114328000B (zh) 1型2型分段纠错内码的dna存储级联编码与解码方法
CN114974429A (zh) 一种基于十进制的dna存储编码方法、设备及可读存储介质
CN110867213A (zh) 一种dna数据的存储方法和装置
Limbachiya et al. On optimal family of codes for archival DNA storage
CN113345521A (zh) 一种采用大片段dna存储的编码与恢复方法
Park et al. Iterative coding scheme satisfying gc balance and run-length constraints for dna storage with robustness to error propagation
CN102725964B (zh) 一种编码方法、译码方法及编码装置、译码装置
KR101023536B1 (ko) 데이터 무손실 압축 방법
CN111243670A (zh) 一种满足生物约束的dna信息存储编码方法
CN1183687C (zh) Turbo码编码器及编码方法
CN116187435B (zh) 基于大小喷泉码及mrc算法利用dna进行信息存储方法及系统
CN108880748B (zh) 基于拉丁方阵的无速率Spinal码的编译码方法
Park et al. BIC codes: bit insertion-based constrained codes with error correction for DNA storage
CN101075812A (zh) 一种并行级联结构的系统形式低密度码的构造方法
Dimopoulou et al. Storing digital data into dna: A comparative study of quaternary code construction
CN1182657C (zh) 用于降低乘积码译码所需存储量和复杂度的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination