CN116258781A - 图像数据dna存储方法、系统、电子设备及存储介质 - Google Patents

图像数据dna存储方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN116258781A
CN116258781A CN202211537938.8A CN202211537938A CN116258781A CN 116258781 A CN116258781 A CN 116258781A CN 202211537938 A CN202211537938 A CN 202211537938A CN 116258781 A CN116258781 A CN 116258781A
Authority
CN
China
Prior art keywords
base
data
bit
image
quaternary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211537938.8A
Other languages
English (en)
Inventor
洪经纬
罗昌国
韩萍
姜青山
陈会
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN202211537938.8A priority Critical patent/CN116258781A/zh
Publication of CN116258781A publication Critical patent/CN116258781A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本申请实施例提供了一种图像数据DNA存储方法、系统、电子设备及存储介质,涉及数据存储技术领域。其中,该方法包括:获取所需编码的图像,对所述获取到的图像进行拆分,得到若干图像块;对所述得到的若干图像块进行二进制转换得到对应的二进制数据串;使用类四进制比特‑碱基映射规则对所述二进制数据串进行碱基转换,得到对应的第一碱基序列;所述类四进制比特‑碱基映射规则包括若干类四进制比特‑碱基映射表;使用特定碱基转换规则转换后的编号对第一碱基序列进行编号,得到包含块编号的第二碱基序列;所述块编号位于所述第二碱基序列的头部;对所述第二碱基碱基序列添加新的引物并进行DNA合成,得到DNA存储数据。本申请实施例解决了相关技术中图像数据DNA存储方式单一,存储效率低的问题。

Description

图像数据DNA存储方法、系统、电子设备及存储介质
技术领域
本申请涉及DNA数据存储数据领域,具体而言,本申请涉及一种图像数据DNA存储方法、系统、电子设备及存储介质。
背景技术
由于数据存储需求的不断增加,现代数据存储系统因高昂的基础设施成本和运行功耗而不堪重负,急需一种耐久、可扩展和经济的替代存储介质。作为遗传信息的载体,DNA本身就是一种天然的优良存储介质不仅存储了从微生物到人类的亿万生命的遗传信息,并且保证了生命现象的稳定遗传。DNA存储技术是由DNA合成与测序技术和计算机存储相融合的新领域,通过编码算法将计算机中的0、1二进制数据转换成A、T、C、G四种碱基组成的DNA序列,进而通过合成含有指定碱基序列的DNA实现数据信息的存储。
然而,现有的DNA数据存储技术方式单一,仅仅把文件转换成二进制串进行编码,解码时一旦丢失部分序列,便会导致灾难性的错误传播,而且无法适配特殊的存储应用场景。不仅如此,现有技术中很少有针对分块读取的机制,在对数据进行解码时只能解码全部序列,耗时高,存储效率低。
由上可知,如何实现分块读取提高存储效率的问题仍有待解决。
发明内容
本申请各实施例提供了一种图像数据DNA存储方法、系统、电子设备及存储介质,可以解决相关技术中存在的存储方式单一,效率低的问题。所述技术方案如下:
根据本身请实施例的一个方面,一种图像数据DNA存储方法,所述方法包括:获取所需编码的图像,对所述获取到的图像进行拆分,得到若干图像块;对所述得到的若干图像块进行二进制转换得到对应的二进制数据串;使用类四进制比特-碱基映射规则对所述二进制数据串进行碱基转换,得到对应的第一碱基序列;所述类四进制比特-碱基映射规则包括若干类四进制比特-碱基映射表;使用特定碱基转换规则转换后的编号对第一碱基序列进行编号,得到包含块编号的第二碱基序列;所述块编号位于所述第二碱基序列的头部;对所述第二碱基碱基序列添加新的引物并进行DNA合成,得到DNA存储数据。
根据本申请实施例的一个方面,一种图像数据DNA存储方法,所述方法还包括:对所述得到的DNA存储数据进行测序得到碱基序列数据,根据得到的所述碱基序列数据中头部碱基序列筛选所需进行分块解码的数据。
根据本申请实施例的一个方面,一种图像数据DNA存储编解码系统,所述系统包括:图像获取模块,用于获取所需编码的图像,对所述获取到的图像进行拆分,得到若干图像块;数据转换模块,用于对所述得到的若干图像块进行二进制转换得到对应的二进制数据串;数据编码模块,用于使用类四进制比特-碱基映射规则对所述二进制数据串进行碱基转换,得到对应的第一碱基序列;所述类四进制比特-碱基映射规则包括若干类四进制比特-碱基映射表;序列编号模块,用于使用特定碱基转换规则转换后的编号对第一碱基序列进行编号,得到包含块编号的第二碱基序列;所述块编号位于所述第二碱基序列的头部;数据合成模块,用于对所述第二碱基碱基序列添加新的引物并进行DNA合成,得到DNA存储数据;数据解码模块,用于对所述得到的DNA存储数据进行测序得到碱基序列数据,根据得到的所述碱基序列数据中头部碱基序列筛选所需进行分块解码的数据。
根据本申请实施例的一个方面,一种电子设备,包括:至少一个处理器、至少一个存储器、以及至少一条通信总线,其中,存储器上存储有计算机程序,处理器通过通信总线读取存储器中的计算机程序;计算机程序被处理器执行时实现如上所述的图像数据DNA存储方法。
根据本申请实施例的一个方面,一种存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上所述的图像数据DNA存储方法。
根据本申请实施例的一个方面,一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序存储在存储介质中,计算机设备的处理器从存储介质读取计算机程序,处理器执行计算机程序,使得计算机设备执行时实现如上所述的图像数据DNA存储方法。
本申请提供的技术方案带来的有益效果是:
在上述技术方案中,利用对图像进行分割的优势,以支持分块读取,从而能够降低读取的测序成本,并且支持并行编解码,进一步提高存储效率;所提供的类四进制比特-碱基映射规则,具有适配生化约束的快速筛选方式,相较于现有技术能够更快的完成编解码,从而能够有效地解决相关技术中存在的进行解码时只能解码全部序列,耗时高,存储效率低的问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1是根据一示例性实施例示出的一种图像数据DNA存储方法的流程图;
图2是根据一示例性实施例示出的步骤330的流程图;
图3是根据一示例性实施例示出的另一种图像数据DNA存储方法的流程图;
图4是根据一示例性实施例示出的一种图像数据DNA编解码完整流程图;
图5是根据一示例性实施例示出的一种图像数据DNA存储系统的结构框图;
图6是根据一示例性实施例示出的一种电子设备的结构框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
如前所述,由于数据存储需求的不断增加,急需一种耐久、可扩展和经济的替代存储介质。作为遗传信息的载体,DNA本身就是一种天然的优良存储介质,通过DNA存储数据的方法具有存储密度高、保存寿命长、维护成本低以及数据易备份等优点。
最常见的图像DNA编解码方法主要有两种:一、直接文件编解码,此种方法无需考虑图像文件的格式,直接将文件转换成二进制串,进行分段后编码为碱基序列,解码则为逆过程;二、频率系数编解码,此种方法只限于JPEG格式的图像文件,根据JPEG中频率系数的误差敏感性,将DC/AC频率系数分别编码成不同的DNA序列进行存储,并设计适当的内部索引将这些系数与其对应的图像相关联,解码时具有较好的容错性。
但上述图像DNA编解码方法也有不足之处,包括:1、编码方式较为单一,仅仅将文件转换成二进制串进行编码,解码时一旦丢失部分序列便会导致灾难性的错误传播,而且无法适配特殊的存储应用场景,例如只需要看图像的某个位置,而现有技术只能解码全部序列,较为耗时;2、可被编码的图像格式受限,且为了追求高质量序列大多引入了复杂的序列筛选机制,编码耗时长,编码效率低。
可见,相关技术中仍存在存储方式单一且效率低的问题。
为此,本申请提供的图像数据DNA存储方法,实现了对图像数据的分块读取,在高效编码的同时追求低成本读取,缩短编解码时间,提高编解码效率。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1为一种图像数据DNA存储方法,该方法可以包括以下步骤:
步骤310,获取所需编码的图像,对获取到的图像进行拆分,得到若干图像块。
其中,所需编码的图像为需要通过DNA数据存储技术进行保存的图像。
在一种可能的实现方式,获取所需编码的图像后,为了将图像尽可能的等分,获取图像的宽、高像素值,将两个像素值除以需要等分的块数,并向下取整,得到若干等分的第一图像块。需要等分的块数可根据实际应用场景进行自定义,在此不做特殊说明。
步骤320,对得到的若干图像块进行二进制转换得到对应的二进制数据串。
对于得到的所有图像块,根据图像中各个像素点对应的像素值,将十进制表示下的像素值通过二进制转换成二进制数据串。
步骤330,使用类四进制比特-碱基映射规则对二进制数据串进行碱基转换,得到对应的第一碱基序列;类四进制比特-碱基映射规则包括若干类四进制比特-碱基映射表。
在一种可能的实现方式,本申请提供了一种新的比特-碱基转换规则——类四进制比特-碱基映射规则。根据特定的映射规则将二进制数据串转换成包含A、T、C、G四种碱基的DNA序列。
步骤340,使用特定碱基转换规则转换后的编号对第一碱基序列进行编号,得到包含块编号的第二碱基序列;所述块编号位于所述第二碱基序列的头部。
获取用于编号的编号序列,块编号为将原始的十进制编号进行二进制转换后,并以00-A,01-T,10-C,11-G的规则进行碱基转换得到的,从而将碱基转换后的块编号添加至第二碱基序列的头部进行编号。
步骤350,对第二碱基碱基序列添加新的引物并进行DNA合成,得到DNA存储数据。
在一种可能的实现方式,如图2所示,上述步骤330包括以下步骤:
步骤331,使用类四进制比特-碱基映射表A*对二进制数据串的前4个比特进行碱基转换,得到两位初始碱基。
步骤332,若两位初始碱基为重叠形式,则后续1或2个比特先使用类四进制比特-碱基映射表A进行碱基转换,得到第三位碱基。
步骤333,基于两位初始碱基为重叠形式,若下一次遇到重叠形式,则使用类四进制比特-碱基映射表B进行碱基转换;否则使用类四进制比特-碱基映射表B*进行碱基转换。
步骤334,若上一次重叠形式使用类四进制比特-碱基映射表B进行碱基转换,则下一次重叠形式使用类四进制比特-碱基映射表A进行碱基转换;非重叠形式使用类四进制比特-碱基映射表A*进行碱基转换。
步骤335,若两位初始碱基为非重叠形式,则后续1或2个比特继续使用类四进制比特-碱基映射表A*进行碱基转换,得到第三位碱基。
在一示例性实施例中,如表1所示,本申请提供了一种新的比特-碱基映射规则——类四进制比特-碱基映射规则。
具体的,例如一串二进制数据0010 1101,使用类四进制比特-碱基映射表A*对二进制数据串的前4个比特0010进行碱基转换,得到两位初始碱基为AC,对于非重叠形式的两位初始碱基,后续两位比特11使用使用类四进制比特-碱基映射表A*进行碱基转换为G,同时对于后续需要进行碱基转换的比特来说,新的两位碱基即为CG,基于新的两位碱基为非重叠形式,最后的比特01采用类四进制比特-碱基映射表A*进行碱基转换为T,即对于二进制数据串0010 1101,进行碱基转换后为ACGT。
再比如一串二进制数据串0000 1101,先使用类四进制比特-碱基映射表A*对二进制数据串的前4个比特0000进行碱基转换,得到两位初始碱基为AA,对于重叠形式的两位初始碱基,后续两位比特11使用类四进制比特-碱基映射表A进行碱基转换为G,同时对于后续需要进行碱基转换的比特来说,新的两位碱基即为AG,同时下次遇到重叠形式时使用类四进制比特-碱基映射表B进行碱基转化,非重叠形式使用类四进制比特-碱基映射表B*进行碱基转换。基于新的两位碱基为非重叠形式,最后的比特01采用类四进制比特-碱基映射表B*进行碱基转换为C,即对于二进制数据串0000 1101,进行碱基转换后为AAGC。
在一示例性实施例中,如表二所示,所述类四进制比特-碱基映射规则还包括末端比特处理表。
当二进制数据串进行碱基转换中剩下最后的1或2个比特,使用末端比特处理表进行碱基转换。
具体的,在固定二进制串长度的情况下,可能会遇到最后剩下1个或者2个比特无法找到映射规则的问题,此时便根据末端比特处理表对其进行碱基转换。对于最后的1个或者2个比特,基于最接近的两个碱基的形式,从而选择不同的碱基进行对应。例如,当前两位碱基为AA时,若最后一个比特为0,则其对应的碱基为TC;若最后一个比特为1,则其对应的碱基为TG,从而实现对最后的1或2个比特进行碱基转换。
表一类四进制比特-碱基映射表
Figure BDA0003978509500000071
表二末端比特映射表
Figure BDA0003978509500000072
在一种可能的实现方式,如图3所示,本申请提供的图像数据DNA存储方法还包括以下步骤:
步骤410,对类四进制比特-碱基映射表A和表B进行变换,得到若干新的映射规则。
步骤430,对得到的若干新的映射规则使用如上编码流程进行编码,并记录碱基转换后的结果序列中GC的含量以及编码密度。
步骤450,选择结果序列中GC含量在40%-60%且编码密度最高的对应的映射规则作为输出。
具体的,改变类四进制比特-碱基映射表A和表B中的TT两列,对于两个表各有四种不同的变换形式,从而得到十六种新的映射规则。使用本申请提供的编码流程对十六种新的映射规则进行编码同时记录结果序列中的GC的含量以及编码密度。根据最终的结果序列中GC含量在40%-60%且编码密度最高的对应的映射规则作为最优选的比特-碱基映射规则实现数据编码。
在一种可能的实现方式,如图4所示,本申请步骤350之后还包括:
步骤360,对得到的DNA存储数据进行测序得到碱基序列数据,根据得到的碱基序列数据中头部碱基序列筛选所需进行分块解码的数据。
在一示例性实施例中,对于一串碱基序列,根据其头部碱基序列确定对应的块编号,根据块编号选择所需进行解码的碱基序列,接着使用上述编码过程的逆过程对碱基序列进行解码,得到对应的图像数据,从而实现了完整的编解码过程。
下述为本申请系统实施例,可以用于执行本申请所涉及的图像数据DNA存储方法。对于本申请装置实施例中未披露的细节,请参照本申请所涉及的图像数据DNA存储方法的方法实施例。
请参阅图5,本申请实施例中提供了一种图像数据DNA存储系统500,包括但不限于图像获取模块510、数据转换模块520、数据编码模块530、序列编号模块540、数据合成模块550、数据解码模块560。
图像获取模块510,用于获取所需编码的图像,对获取到的图像进行拆分,得到若干图像块;
数据转换模块520,用于对得到的若干图像块进行二进制转换得到对应的二进制数据串;
数据编码模块530,用于使用类四进制比特-碱基映射规则对二进制数据串进行碱基转换,得到对应的第一碱基序列;类四进制比特-碱基映射规则包括若干类四进制比特-碱基映射表;
序列编号模块540,用于使用特定碱基转换规则转换后的编号对第一碱基序列进行编号,得到包含块编号的第二碱基序列;块编号位于所述第二碱基序列的头部;
数据合成模块550,用于对第二碱基碱基序列添加新的引物并进行DNA合成,得到DNA存储数据;
数据解码模块560,用于对得到的DNA存储数据进行测序得到碱基序列数据,根据得到的碱基序列数据中头部碱基序列筛选所需进行分块解码的数据。
需要说明的是,上述实施例所提供的图像数据DNA存储系统在进行图像DNA数据存储时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即图像数据DNA存储系统的内部结构将划分为不同的功能模块,以完成以上描述的全部或者部分功能。
另外,上述实施例所提供的图像数据DNA存储系统与图像数据DNA存储方法的实施例属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
请参阅图6,本申请实施例中提供了一种电子设备4000,该电子设备4000包括至少一个处理器4001、至少一条通信总线4002以及至少一个存储器4003。
其中,处理器4001和存储器4003相连,如通过通信总线4002相连。可选地,电子设备4000还可以包括收发器4004,收发器4004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。
处理器4001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
通信总线4002可包括一通路,在上述组件之间传送信息。通信总线4002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。通信总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscReadOnly Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器4003上存储有计算机程序,处理器4001通过通信总线4002读取存储器4003中存储的计算机程序。
该计算机程序被处理器4001执行时实现上述各实施例中的图像数据DNA存储方法。
此外,本申请实施例中提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述各实施例中的图像数据DNA存储方法。
本申请实施例中提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在存储介质中。计算机设备的处理器从存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行上述各实施例中的图像DNA数据存储方法。
与相关技术相比,一方面,本申请提供的实施例利用了对图像进行分割的优势,支持分块读取,能够降低读取的测序成本,并支持并行编解码,进一步提高了编解码效率;另一方面,本申请提供的类四进制比特-碱基映射规则,具有适配生化约束的快速筛选方式,相对于现有技术能够更快地完成编解码。有效地解决了现有技术中存在的进行解码时只能解码全部序列,耗时高,编解码效率低的问题。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以按其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种图像数据DNA存储方法,其特征在于,所述方法包括:
获取所需编码的图像,对所述获取到的图像进行拆分,得到若干图像块;
对所述得到的若干图像块进行二进制转换得到对应的二进制数据串;
使用类四进制比特-碱基映射规则对所述二进制数据串进行碱基转换,得到对应的第一碱基序列;所述类四进制比特-碱基映射规则包括若干类四进制比特-碱基映射表;
使用特定碱基转换规则转换后的编号对第一碱基序列进行编号,得到包含块编号的第二碱基序列;所述块编号位于所述第二碱基序列的头部;
对所述第二碱基碱基序列添加新的引物并进行DNA合成,得到DNA存储数据。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
对所述得到的DNA存储数据进行测序得到碱基序列数据,根据得到的所述碱基序列数据中头部碱基序列筛选所需进行分块解码的数据。
3.如权利要求1所述的方法,其特征在于,所述获取所需编码的图像,对所述获取到的图像进行拆分,得到若干图像块,包括:
获取所需编码的图像的宽、高像素值,将所述像素值除以需要等分的块数并向下取整得到图像块的宽、高像素值。
4.如权利要求1所述的方法,其特征在于,对所述得到的若干图像块进行二进制转换得到对应的二进制数据串,包括:
获取拆分后的若干图像块,对所述各图像块并行二进制转换得到二进制数据串。
5.如权利要求1所述的方法,其特征在于,所述类四进制比特-碱基映射规则包括:
使用所述类四进制比特-碱基映射表A*对所述二进制数据串的前4个比特进行碱基转换,得到两位初始碱基;
若所述两位初始碱基为重叠形式,则后续1或2个比特先使用类四进制比特-碱基映射表A进行碱基转换,得到第三位碱基;
基于所述两位初始碱基为重叠形式,若下一次遇到重叠形式,则使用类四进制比特-碱基映射表B进行碱基转换;否则使用类四进制比特-碱基映射表B*进行碱基转换;
若上一次类四进制比特-碱基映射表B进行碱基转换,则下一次重叠形式使用类四进制比特-碱基映射表A进行碱基转换;非重叠形式使用类四进制比特-碱基映射表A*进行碱基转换;
若所述两位初始碱基为非重叠形式,则后续1或2个比特继续使用类四进制比特-碱基映射表A*进行碱基转换,得到第三位碱基。
6.如权利要求5所述的方法,其特征在于,所述类四进制比特-碱基映射规则还包括:
当二进制数据串进行碱基转换中剩下最后的1或2个比特,使用末端比特处理表进行碱基转换。
7.如权利要求1至6所述的方法,其特征在于,所述方法包括:
对所述类四进制比特-碱基映射表A和表B进行变换,得到若干新的映射规则;
对得到的若干个新的映射规则使用如上编码流程进行编码,并记录碱基转换后的结果序列中GC的含量以及编码密度;
选择所述结果序列中GC含量在40%-60%且编码密度最高的对应的映射规则作为输出。
8.一种图像数据DNA存储系统,其特征在于,所述系统包括:
图像获取模块,用于获取所需编码的图像,对所述获取到的图像进行拆分,得到若干图像块;
数据转换模块,用于对所述得到的若干图像块进行二进制转换得到对应的二进制数据串;
数据编码模块,用于使用类四进制比特-碱基映射规则对所述二进制数据串进行碱基转换,得到对应的第一碱基序列;所述类四进制比特-碱基映射规则包括若干类四进制比特-碱基映射表;
序列编号模块,用于使用特定碱基转换规则转换后的编号对第一碱基序列进行编号,得到包含块编号的第二碱基序列;所述块编号位于所述第二碱基序列的头部;
数据合成模块,用于对所述第二碱基碱基序列添加新的引物并进行DNA合成,得到DNA存储数据;
数据解码模块,用于对所述得到的DNA存储数据进行测序得到碱基序列数据,根据得到的所述碱基序列数据中头部碱基序列筛选所需进行分块解码的数据。
9.一种电子设备,其特征在于,包括:至少一个处理器、至少一个存储器、以及至少一条通信总线,其中,
所述存储器上存储有计算机程序,所述处理器通过所述通信总线读取所述存储器中的所述计算机程序;
所述计算机程序被所述处理器执行时实现权利要求1至7中任一项所述的图像数据DNA存储方法。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的图像数据DNA存储方法。
CN202211537938.8A 2022-12-02 2022-12-02 图像数据dna存储方法、系统、电子设备及存储介质 Pending CN116258781A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211537938.8A CN116258781A (zh) 2022-12-02 2022-12-02 图像数据dna存储方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211537938.8A CN116258781A (zh) 2022-12-02 2022-12-02 图像数据dna存储方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116258781A true CN116258781A (zh) 2023-06-13

Family

ID=86681617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211537938.8A Pending CN116258781A (zh) 2022-12-02 2022-12-02 图像数据dna存储方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116258781A (zh)

Similar Documents

Publication Publication Date Title
US10496336B2 (en) K-D tree encoding for point clouds using deviations
JP3778087B2 (ja) データ符号化装置及びデータ復号装置
JP4878262B2 (ja) エントロピー符号化装置
US10430975B2 (en) Advanced k-D tree encoding for point clouds by most significant axis selection
CN110019865B (zh) 海量图片处理方法、装置、电子设备及存储介质
KR101485339B1 (ko) 무손실 부호화/복호화 장치 및 방법
CN111510156A (zh) 一种基于分段的哈夫曼动态压缩及解压大文件的方法
US20030174076A1 (en) Huffman decoding method and apparatus
JP4547503B2 (ja) 算術符号化装置、算術符号化方法、算術符号化プログラム及びプログラムを格納したコンピュータで読み取り可能な記録媒体
US6121905A (en) Method and apparatus for decoding JPEG symbols
US20090058694A1 (en) Decompressing Dynamic Huffman Coded Bit Streams
US9413388B1 (en) Modified huffman decoding
CN102255617A (zh) 哈夫曼树的存储方法及利用数组进行数据解码的方法
CN116258781A (zh) 图像数据dna存储方法、系统、电子设备及存储介质
CN115765754A (zh) 一种数据编码方法及一种编码数据比较方法
CN104079941A (zh) 一种深度信息编解码方法、装置及视频处理播放设备
WO2024113382A1 (zh) 图像数据dna存储方法、系统、电子设备及存储介质
US8600766B2 (en) Method and apparatus for encoding and decoding data with altered bit sequence
US20120243798A1 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium storing image processing program
CN111681290B (zh) 一种基于dna编码技术的图片存储方法
CN114842108A (zh) 一种概率栅格地图的处理方法、装置及存储设备
Antonini et al. DNA-based Media Storage: State-of-the-Art, Challenges, Use Cases and Requirements
Antonini et al. DNA-Based Media Storage: State-of-the-Art, Challenges, Use Cases and Requirements Version 7.0
US20080175312A1 (en) Method and system of compressing and decompressing data
US12119847B2 (en) Noniterative entropy coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination