CN112687338A - 基因序列的存储和还原方法、计算机存储介质及电子设备 - Google Patents
基因序列的存储和还原方法、计算机存储介质及电子设备 Download PDFInfo
- Publication number
- CN112687338A CN112687338A CN202011641634.7A CN202011641634A CN112687338A CN 112687338 A CN112687338 A CN 112687338A CN 202011641634 A CN202011641634 A CN 202011641634A CN 112687338 A CN112687338 A CN 112687338A
- Authority
- CN
- China
- Prior art keywords
- gene
- code
- password
- gene sequence
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供了一种基因序列的存储和还原方法、计算机存储介质和电子设备,基因序列的存储和还原方法包括以下步骤:S1、上传基因序列,并设定还原密码;S2、将设定了所述还原密码的所述基因序列存储为图片格式的基因图片,并在存储过程中添加定位码;S3、上传所述基因图片,并从所述基因图片中查找所述定位码,以确定所述基因图片所记载的基因序列的起始位置及读取方向;S4、输入密码,并判断所述密码与所述还原密码是否匹配;S5、当所述密码与所述还原密码匹配时,将所述基因图片还原为所述基因序列。根据本发明实施例的基因序列的存储和还原方法,可以有效缩减基因图片在还原为基因序列时的试错时间,提高基因序列还原效率,提高用户体验。
Description
技术领域
本发明涉及基因传输领域,更具体地,涉及一种基因序列的存储和还原方法、计算机存储介质以及电子设备。
背景技术
随着生物技术与互联网的不断发展,通过计算机存储与传输基因序列的方法已是极为常见,用户可通过第三方平台的方式,将存有大量基因序列的文件传输到另一用户计算机中,方便且快捷。
但是目前的传输方式存在以下几个缺点:1、基因序列一般短则包含几万个碱基,长则包含几百万甚至上亿个碱基。传统的保存方法占用内存大,上传速度慢;2、传输方式是从计算机到计算机,中间经过第三方平台,信息易被截获,信息安全不被保障。
相关技术中提出了一种将基因序列通过算法转换为图片存储,需要时再上传图片进行还原与校验的方法,但是图片在存储和传输过程中,有可能会改变其方向,导致在对图片进行还原时,无法从图中判别出应当识别的基因序列的第一个像素的位置和读取的方向,导致多次还原失败,失败率高,而用户很难得知失败原因是在于图片质量还是图片识别的方向,造成还原过程中试错时间较长,不利于用户体验。
发明内容
为解决上述技术问题,本发明提供一种基因序列的存储和还原方法、计算机存储介质和电子设备,可以有效缩减基因图片在还原为基因序列时的试错时间,提高基因序列还原效率。
根据本发明第一方面实施例的基因序列的存储和还原方法,包括以下步骤:S1、上传基因序列,并设定还原密码;S2、将设定了所述还原密码的所述基因序列存储为图片格式的基因图片,并在存储过程中添加定位码;S3、上传所述基因图片,并从所述基因图片中查找所述定位码,以确定所述基因图片所记载的基因序列的起始位置及读取方向;S4、输入密码,并判断所述密码与所述还原密码是否匹配;S5、当所述密码与所述还原密码匹配时,将所述基因图片还原为所述基因序列。
根据本发明实施例的基因序列的存储和还原方法,在对基因序列进行存储时,通过将其转换成图片格式进行存储,可以大幅减少数据存储占用的空间,提高基因序列传输的速度;在基因序列转换成图片的过程中,对其进行加密,同时设定定位码,在有效提高信息安全性的基础上,还可以在将基因图片还原为基因序列时,快速识别基因序列的首个像素点和读取方向,防止用户在上传基因图片时由于其他原因造成的基因图片方向不正而导致的还原失败率高的问题,有效缩减基因图片在还原为基因序列时的试错时间,提高基因序列还原效率,提高用户体验。
根据本发明的一个实施例,步骤S2包括:S21、获取用户输入的所述还原密码,并将所述还原密码转换为RGB格式序列作为密码码;S22、将所述基因序列转换为RGB格式序列作为本体码;S23、将所述基因序列通过检验算法计算得到检验码,再将所述检验码转换为RGB格式序列作为校验码;S24、使用两个黑色像素点和两个随机像素点作为定位码;S25、将所述定位码、所述密码码、所述本体码和所述校验码组合,转为像素点生成所述基因图片。
根据本发明的一个实施例,步骤S22包括:S221、将碱基中的腺嘌呤、鸟嘌呤、胸腺嘧啶和胞嘧啶分别赋予代码0,1,2,3转为四进制,再转为十进制;S222、将三个连续的密码子转换为一个像素,得到所述本体码,其中不足三个密码子的部分用最大RGB数值补足。
根据本发明的一个实施例,步骤S23包括:S231、将所述基因序列通过md5信息摘要算法获得的结果作为所述检验码;S232、根据相同算法,将所述检验码转换为RGB格式序列作为所述校验码。
根据本发明的一个实施例,步骤S3包括:S31、上传所述基因图片,并将所述基因图片从设定方向依次查找所述定位码;S32、当找到两个连续的黑色像素点和两个所述随机像素点,则确定所述设定方向为读取方向,所述基因图片上的下一个像素点为所述基因图片所记载的基因序列的起始位置。
根据本发明的一个实施例,步骤S4包括:S41、获取输入的所述密码;S42、将输入的所述密码转换为RGB格式序列;S43、将所述密码转换成的RGB格式序列与所述密码码进行核对,判断两者是否匹配。
根据本发明的一个实施例,在步骤S5中,当所述密码转换成的RGB格式序列与所述密码码匹配时,获取所述本体码,并将所述本体码还原为所述基因序列。
根据本发明的一个实施例,所述方法还包括:S6、将还原得到的所述基因序列根据所述检验算法进行解码,得到新的校验码;S7、将所述新的校验码转换为RGB格式序列;S8、截取所述新的校验码对应的RGB格式序列,与步骤S23所得的所述校验码对应的RGB格式序列进行对比,若两者相同,则将步骤S5还原的所述基因序列作为最终基因序列。
第二方面,本发明实施例提供一种计算机存储介质,包括一条或多条计算机指令,所述一条或多条计算机指令在执行时实现如上述实施例所述的方法。
根据本发明第三方面实施例的电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令;所述处理器用于调用并执行所述一条或多条计算机指令,从而实现如上述任一实施例所述的方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的基因序列的存储和还原方法的流程图;
图2为根据本发明实施例的基因序列的存储和还原方法中基因序列的存储流程图;
图3为根据本发明实施例的基因序列的存储和还原方法中基因序列的还原与校验流程图;
图4为本发明实施例的电子设备的示意图。
附图标记:
电子设备300;
存储器310;操作系统311;应用程序312;
处理器320;网络接口330;输入设备340;硬盘350;显示设备360。
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
下面首先对本申请中所提到的专有名词进行解释。
基因序列:核酸的一级结构,使用一串字母表示的真实的或者假设的携带基因信息的DNA分子的一级结构。每个字母代表一种核碱基,两个碱基形成一个碱基对,碱基对的配对规律是固定的,A=T,C≡G。三个相邻的碱基对形成一个密码子。一种密码子对应一种氨基酸,不同的氨基酸合成不同的蛋白质。在DNA的复制及蛋白质的合成过程中,碱基配对规律是十分关键的。
RGB格式:对一种颜色进行编码的方法统称为“颜色空间”或“色域”。简单来说,世界上任何一种颜色的“颜色空间”都可定义成一个固定的数字或变量。RGB(红、绿、蓝)只是众多颜色空间的一种。采用这种编码方法,每种颜色都可用三个变量来表示红色、绿色以及蓝色的强度。记录及显示彩色图像时,RGB是最常见的一种方案。
校验码:设有校验码的代码,是由本体码与校验码两部分组成(如组织机构代码),本体码是表示编码对象的号码,校验码则是附加在本体码后边,用来校验本体码在输入过程中准确性的号码。每一个本体码只能有一个校验码,校验码通过规定的数学关系得到。
ASCII:美国信息交换标准代码是由美国国家标准学会(American NationalStandard Institute,ANSI)制定的,是一种标准的单字节字符编码方案,用于基于文本的数据。它最初是美国国家标准,供不同计算机在相互通信时用作共同遵守的西文字符编码标准,后来它被国际标准化组织(International Organization for Standardization,ISO)定为国际标准,称为ISO 646标准。
下面结合附图具体描述根据本发明实施例的基因序列的存储和还原方法。
如图1所示,根据本发明实施例的基因序列的存储和还原方法包括以下步骤:
S1、上传基因序列,并设定还原密码;
S2、将设定了所述还原密码的所述基因序列存储为图片格式的基因图片,并在存储过程中添加定位码;
S3、上传所述基因图片,并从所述基因图片中查找所述定位码,以确定所述基因图片所记载的基因序列的起始位置及读取方向;
S4、输入密码,并判断所述密码与所述还原密码是否匹配;
S5、当所述密码与所述还原密码匹配时,将所述基因图片还原为所述基因序列。
也就是说,根据本发明实施例的基因序列的存储和还原方法包括基因序列的存储和还原方法,在对基因序列进行存储时,将基因序列转换为图片格式进行存储,可以大幅缩减基因序列占用的存储空间,同时,在对基因序列进行转换的过程中,对其进行加密,在还原时需要核验密码是否匹配,从而保证基因序列在还原和传输过程中的信息安全性。
另外,在基因序列转换为基因图片时,还设定了对基因序列的起始位置进行定位和确定读取方向的定位码,在需要将基因图片还原为基因序列时,可以通过查找定位码,确定基因图片记载的基因序列的起始位置和读取方向,避免用户在上传基因图片时可能存在的基因图片的位置不正而导致的还原失败率高的问题。
由此,根据本发明实施例的基因序列的存储和还原方法,在对基因序列进行存储时,通过将其转换成图片格式进行存储,可以大幅减少数据存储占用的空间,提高基因序列传输的速度;在基因序列转换成图片的过程中,对其进行加密,同时设定定位码,在有效提高信息安全性的基础上,还可以在将基因图片还原为基因序列时,快速识别基因序列的首个像素点和读取方向,防止用户在上传基因图片时由于其他原因造成的基因图片方向不正而导致的还原失败率高的问题,有效缩减基因图片在还原为基因序列时的试错时间,提高基因序列还原效率,提高用户体验。
下面对本申请的基因序列的存储和还原方法分别进行描述。
首先如图2所示,图2示出了本申请的基因序列的存储和还原方法中基因序列的存储流程图。
具体地,根据本发明的一个实施例,步骤S2包括:
S21、获取用户输入的所述还原密码,并将所述还原密码转换为RGB格式序列作为密码码。
S22、将所述基因序列转换为RGB格式序列作为本体码。
S23、将所述基因序列通过检验算法计算得到检验码,再将所述检验码转换为RGB格式序列作为校验码。
S24、使用两个黑色像素点和两个随机像素点作为定位码。
S25、将所述定位码、所述密码码、所述本体码和所述校验码组合,转为像素点生成所述基因图片。
其中,在步骤S21中,通过解吸ASCII将所述还原密码转换为RGB格式序列。例如,设定还原密码由6位字符组成,根据ASCII转换后则变为两个像素点。
可选地,步骤S22包括:
S221、将碱基中的腺嘌呤、鸟嘌呤、胸腺嘧啶和胞嘧啶分别赋予代码0,1,2,3转为四进制,再转为十进制。
具体地,由于基因序列自身的特殊性:每三个碱基为一个密码子,且碱基类别仅包含腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和胞嘧啶(C)4中类型。分别赋予它们代码0,1,2,3转为四进制,如启动子ATG为0021(高位自动补0为4位),再转为十进制为9。GAC四进制为0103,转为十进制19。TAC四进制为0203,十进制为35。
S222、将三个连续的密码子转换为一个像素,得到所述本体码,其中不足三个密码子的部分用最大RGB数值补足。
其中,一个RGB包含三个参数。将每三个密码子作为一个像素,如ATGGACTAC可转换为一个像素RGB(9,19,35),如果密码子的个数不是3的倍数,则剩余的用255补足,如一段序列末尾片段为GATGTTCCAGATTACGCTTAA,转换为四进制为0102 0122 0330 0102 0203 01320200,转换为RGB形式为(18,26,60)(18,35,30)(32,255,255)。
由步骤S221可知,所得的十进制数不会大于64,若最后剩余的密码子个数不是3的倍数(即不能凑齐一个像素点),为使最后的像素点完整,我们使用最大RGB数值作为补充,即255,既便于识别又能区别于密码子。
在本发明的一些具体实施方式中,步骤S23包括:
S231、将所述基因序列通过md5信息摘要算法获得的结果作为所述检验码;
S232、根据相同算法,将所述检验码转换为RGB格式序列作为所述校验码。
具体地,可以将基因序列通过md5信息摘要算法(检验算法包括但不限于md5信息摘要算法)获得的结果作为32位校验数,根据相同算法转换为RGB格式序列作为检验码(转换后有11个像素点)。
由于本体码中规定RGB中的三个参数都会使用四进制模式,转换为十进制后各数值都不会大于64,故使用RGB三个参数数值均大于64的像素点作为随机像素点。然后用两个(0,0,0)像素点加上两个随机像素点作为定位码。最后将定位码,本体码,校验码,密码码组合,每个RGB作为一个像素点,计算生成最小图片的长与宽,剩余像素点随机像素点补足。
由此,根据本发明实施例的基因序列的存储方法,可以实现基因序列的输入存储,并且可以在实现将基因序列转换为图片格式的同时,实现加密处理,生成的图片大小与原来的基因序列文件(例如TXT文件等)相比,压缩率高达96%。
下面结合附图3具体描述根据本发明实施例的基因序列的存储和还原方法中的基因序列的还原与校验过程。
如图3所示,步骤S3包括:
S31、上传所述基因图片,并将所述基因图片从设定方向依次查找所述定位码;
S32、当找到两个连续的黑色像素点和两个所述随机像素点,则确定所述设定方向为读取方向,所述基因图片上的下一个像素点为所述基因图片所记载的基因序列的起始位置。
具体地,可以将获取的基因图片从左上角往右查找定位码,若能找到连续的两个(0,0,0)像素加两个随机像素点,则确定此方向正确且下一个像素点开始为本体码。若不能找到,则从右上往下的方向进行查找,以此类推从右下往左,左下往上。
由此,可以快速识别出基因图片的读取方向,减少试错时间,提高基因序列的还原时间。
根据本发明的一个实施例,步骤S4包括:
S41、获取输入的所述密码;
S42、将输入的所述密码转换为RGB格式序列;
S43、将所述密码转换成的RGB格式序列与所述密码码进行核对,判断两者是否匹配。
可选地,在步骤S5中,当所述密码转换成的RGB格式序列与所述密码码匹配时,获取所述本体码,并将所述本体码还原为所述基因序列。
具体地,将基因图片从正确方向根据像素转换成RGB格式序列,截取末尾密码码与用户输入的密码进行核对。符合则进行下一步,将本体码根据逆算法还原成DNA序列。
在本发明的一些具体实施方式中,对基因序列进行校验的方法包括:
S6、将还原得到的所述基因序列根据所述检验算法进行解码,得到新的校验码。
S7、将所述新的校验码转换为RGB格式序列。
S8、截取所述新的校验码对应的RGB格式序列,与步骤S23所得的所述校验码对应的RGB格式序列进行对比,若两者相同,则将步骤S5还原的所述基因序列作为最终基因序列。
由此,根据本发明实施例的基因序列的还原方法,可以将存储的基因图片转换成基因序列进行输出,并且在进行图片转换的过程中,对基因图片进行解密和核验,可以保证数据读取的安全性和准确性。
总而言之,本发明是用来解决现有基因序列存储为基因图片后,在还原过程中无法自行定位而导致还原失败率高,用户体验差的问题。本发明通过添加区别于基因序列可转换数的像素点作为定位码,标记基因序列的开始位置及方向,与基因序列共同存储在基因图片中,还原时通过识别定位码确定读取方向,降低还原失败率,提高用户体验。
为了解决本发明的技术问题,能让用户用较小的内存存储基因序列,在保障信息安全的同时,提高用户体验,本发明提出了一种基因序列图片存储、还原与校验的方法。该方法主要通过在将基因序列存储为基因图片的过程中添加定位码,标记程序开始读取位置及方向,在还原时自动通过识别定位码,确认真正读取位置及方向。减少单一方向读取造成的还原失败率高的问题,减少试错时间,提高体验。
此外,本发明还提供一种计算机存储介质,计算机存储介质包括一条或多条计算机指令,一条或多条计算机指令在执行时实现上述任一的基因序列的存储和还原方法。
也就是说,计算机存储介质存储有计算机程序,计算机程序被处理器运行时,使得处理器执行上述任一的基因序列的存储和还原方法。
如图4所示,本发明实施例提供了一种电子设备300,包括存储器310和处理器320,所述存储器310用于存储一条或多条计算机指令,所述处理器320用于调用并执行所述一条或多条计算机指令,从而实现上述任一所述的方法。
也就是说,电子设备300包括:处理器320和存储器310,在所述存储器310中存储有计算机程序指令,其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器320执行上述任一所述的方法。
进一步地,如图4所示,电子设备300还包括网络接口330、输入设备340、硬盘350、和显示设备360。
上述各个接口和设备之间可以通过总线架构互连。总线架构可以是可以包括任意数量的互联的总线和桥。具体由处理器320代表的一个或者多个中央处理器(CPU),以及由存储器310代表的一个或者多个存储器的各种电路连接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其它电路连接在一起。可以理解,总线架构用于实现这些组件之间的连接通信。总线架构除包括数据总线之外,还包括电源总线、控制总线和状态信号总线,这些都是本领域所公知的,因此本文不再对其进行详细描述。
所述网络接口330,可以连接至网络(如因特网、局域网等),从网络中获取相关数据,并可以保存在硬盘350中。
所述输入设备340,可以接收操作人员输入的各种指令,并发送给处理器320以供执行。所述输入设备340可以包括键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
所述显示设备360,可以将处理器320执行指令获得的结果进行显示。
所述存储器310,用于存储操作系统运行所必须的程序和数据,以及处理器320计算过程中的中间结果等数据。
可以理解,本发明实施例中的存储器310可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。易失性存储器可以是随机存取存储器(RAM),其用作外部高速缓存。本文描述的装置和方法的存储器310旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器310存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统311和应用程序312。
其中,操作系统311,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序312,包含各种应用程序,例如浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序312中。
本发明上述实施例揭示的方法可以应用于处理器320中,或者由处理器320实现。处理器320可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器320中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器320可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器310,处理器320读取存储器310中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ASIC)、数字信号处理器DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
具体地,处理器320还用于读取所述计算机程序,执行上述任一所述的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述收发方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基因序列的存储和还原方法,其特征在于,包括以下步骤:
S1、上传基因序列,并设定还原密码;
S2、将设定了所述还原密码的所述基因序列存储为图片格式的基因图片,并在存储过程中添加定位码;
S3、上传所述基因图片,并从所述基因图片中查找所述定位码,以确定所述基因图片所记载的基因序列的起始位置及读取方向;
S4、输入密码,并判断所述密码与所述还原密码是否匹配;
S5、当所述密码与所述还原密码匹配时,将所述基因图片还原为所述基因序列。
2.根据权利要求1所述的方法,其特征在于,步骤S2包括:
S21、获取用户输入的所述还原密码,并将所述还原密码转换为RGB格式序列作为密码码;
S22、将所述基因序列转换为RGB格式序列作为本体码;
S23、将所述基因序列通过检验算法计算得到检验码,再将所述检验码转换为RGB格式序列作为校验码;
S24、使用两个黑色像素点和两个随机像素点作为定位码;
S25、将所述定位码、所述密码码、所述本体码和所述校验码组合,转为像素点生成所述基因图片。
3.根据权利要求2所述的方法,其特征在于,步骤S22包括:
S221、将碱基中的腺嘌呤、鸟嘌呤、胸腺嘧啶和胞嘧啶分别赋予代码0,1,2,3转为四进制,再转为十进制;
S222、将三个连续的密码子转换为一个像素,得到所述本体码,其中不足三个密码子的部分用最大RGB数值补足。
4.根据权利要求2所述的方法,其特征在于,步骤S23包括:
S231、将所述基因序列通过md5信息摘要算法获得的结果作为所述检验码;
S232、根据相同算法,将所述检验码转换为RGB格式序列作为所述校验码。
5.根据权利要求2所述的方法,其特征在于,步骤S3包括:
S31、上传所述基因图片,并将所述基因图片从设定方向依次查找所述定位码;
S32、当找到两个连续的黑色像素点和两个所述随机像素点,则确定所述设定方向为读取方向,所述基因图片上的下一个像素点为所述基因图片所记载的基因序列的起始位置。
6.根据权利要求2所述的方法,其特征在于,步骤S4包括:
S41、获取输入的所述密码;
S42、将输入的所述密码转换为RGB格式序列;
S43、将所述密码转换成的RGB格式序列与所述密码码进行核对,判断两者是否匹配。
7.根据权利要求6所述的方法,其特征在于,在步骤S5中,当所述密码转换成的RGB格式序列与所述密码码匹配时,获取所述本体码,并将所述本体码还原为所述基因序列。
8.根据权利要求2所述的方法,其特征在于,还包括:
S6、将还原得到的所述基因序列根据所述检验算法进行解码,得到新的校验码;
S7、将所述新的校验码转换为RGB格式序列;
S8、截取所述新的校验码对应的RGB格式序列,与步骤S23所得的所述校验码对应的RGB格式序列进行对比,若两者相同,则将步骤S5还原的所述基因序列作为最终基因序列。
9.一种计算机存储介质,其特征在于,包括一条或多条计算机指令,所述一条或多条计算机指令在执行时实现如权利要求1-8中任一项所述的方法。
10.一种电子设备,包括存储器和处理器,其特征在于,
所述存储器用于存储一条或多条计算机指令;
所述处理器用于调用并执行所述一条或多条计算机指令,从而实现如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011641634.7A CN112687338B (zh) | 2020-12-31 | 2020-12-31 | 基因序列的存储和还原方法、计算机存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011641634.7A CN112687338B (zh) | 2020-12-31 | 2020-12-31 | 基因序列的存储和还原方法、计算机存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112687338A true CN112687338A (zh) | 2021-04-20 |
CN112687338B CN112687338B (zh) | 2022-01-11 |
Family
ID=75456705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011641634.7A Active CN112687338B (zh) | 2020-12-31 | 2020-12-31 | 基因序列的存储和还原方法、计算机存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112687338B (zh) |
Citations (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030046010A1 (en) * | 2001-05-18 | 2003-03-06 | International Business Machines Corporation | Pattern discovery techniques for determining maximal irredundant and redundant motifs |
CN101002217A (zh) * | 2004-05-18 | 2007-07-18 | 西尔弗布鲁克研究有限公司 | 医药产品跟踪 |
CN102663269A (zh) * | 2012-04-12 | 2012-09-12 | 北京海华鑫安生物信息技术有限责任公司 | Dna分析中使用二维码进行基因数据交换的方法及装置 |
CN105681622A (zh) * | 2015-12-31 | 2016-06-15 | 复旦大学 | 一种基于细胞神经网络超混沌和dna序列的彩色图像加密方法 |
CN106055927A (zh) * | 2016-05-31 | 2016-10-26 | 广州麦仑信息科技有限公司 | mRNA信息的二进制存储方法 |
CN107798219A (zh) * | 2016-08-30 | 2018-03-13 | 清华大学 | 将数据进行生物存储并还原的方法 |
CN107810192A (zh) * | 2015-02-23 | 2018-03-16 | 海鸥治疗简易股份公司 | 非天然的脑信号蛋白3及其医药用途 |
CN108052799A (zh) * | 2018-01-10 | 2018-05-18 | 中山大学 | 基于图像处理的多序列比对可视化的方法 |
CN108365947A (zh) * | 2018-03-05 | 2018-08-03 | 郑州轻工业学院 | 一种基于Feistel网络与动态DNA编码的图像加密方法 |
CN109072243A (zh) * | 2016-02-18 | 2018-12-21 | 哈佛学院董事及会员团体 | 通过crispr-cas系统进行的分子记录的方法和系统 |
CN109086890A (zh) * | 2017-06-14 | 2018-12-25 | Landigrad有限责任公司 | 信息编码和信息解码的方法 |
WO2019040871A1 (en) * | 2017-08-24 | 2019-02-28 | Miller Julian | DEVICE FOR ENCODING AND STORING INFORMATION USING ARTIFICIALLY EXPANDED ALPHABETS OF NUCLEIC ACIDS AND OTHER ANALOGOUS POLYMERS |
CN109575674A (zh) * | 2018-11-13 | 2019-04-05 | 郭玮强 | Dna墨水、制备方法、标记或书写工具以及签约认证方法 |
CN109735631A (zh) * | 2019-01-22 | 2019-05-10 | 湖北民族学院 | 一种对棒脉摇蚊基因16SrDNA片段序列结合其形态的分析方法 |
CN109785904A (zh) * | 2018-12-04 | 2019-05-21 | 上海点融信息科技有限责任公司 | 基于区块链网络的基因信息处理方法、录入方法 |
CN109979539A (zh) * | 2019-04-10 | 2019-07-05 | 电子科技大学 | 基因序列优化方法、装置及数据处理终端 |
CN110706751A (zh) * | 2019-09-25 | 2020-01-17 | 东南大学 | 一种dna存储加密编码方法 |
CN110879895A (zh) * | 2019-11-12 | 2020-03-13 | 安徽理工大学 | 一种基于超混沌系统以及dna序列的彩色图像分块加密算法 |
CN110977984A (zh) * | 2019-12-23 | 2020-04-10 | 上海钛米机器人科技有限公司 | 控制条带、机械臂控制方法、装置、系统及存储介质 |
CN111095423A (zh) * | 2017-08-25 | 2020-05-01 | 深圳华大生命科学研究院 | 编码/解码方法、装置和数据处理装置 |
CN111145836A (zh) * | 2019-12-30 | 2020-05-12 | 云舟生物科技(广州)有限公司 | 插入基因核酸序列的方法、计算机存储介质及电子设备 |
CN111161800A (zh) * | 2019-12-30 | 2020-05-15 | 云舟生物科技(广州)有限公司 | 基因载体的序列诊断方法、系统、存储介质及电子设备 |
CN111368132A (zh) * | 2020-02-28 | 2020-07-03 | 元码基因科技(北京)股份有限公司 | 基于dna序列存储音频或视频文件的方法及存储介质 |
CN112084514A (zh) * | 2020-09-01 | 2020-12-15 | 宁波海特技术转移有限公司 | 一种混沌序列与dna突变的图像加密方法及装置 |
-
2020
- 2020-12-31 CN CN202011641634.7A patent/CN112687338B/zh active Active
Patent Citations (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030046010A1 (en) * | 2001-05-18 | 2003-03-06 | International Business Machines Corporation | Pattern discovery techniques for determining maximal irredundant and redundant motifs |
CN101002217A (zh) * | 2004-05-18 | 2007-07-18 | 西尔弗布鲁克研究有限公司 | 医药产品跟踪 |
CN102663269A (zh) * | 2012-04-12 | 2012-09-12 | 北京海华鑫安生物信息技术有限责任公司 | Dna分析中使用二维码进行基因数据交换的方法及装置 |
CN107810192A (zh) * | 2015-02-23 | 2018-03-16 | 海鸥治疗简易股份公司 | 非天然的脑信号蛋白3及其医药用途 |
CN105681622A (zh) * | 2015-12-31 | 2016-06-15 | 复旦大学 | 一种基于细胞神经网络超混沌和dna序列的彩色图像加密方法 |
CN109072243A (zh) * | 2016-02-18 | 2018-12-21 | 哈佛学院董事及会员团体 | 通过crispr-cas系统进行的分子记录的方法和系统 |
CN106055927A (zh) * | 2016-05-31 | 2016-10-26 | 广州麦仑信息科技有限公司 | mRNA信息的二进制存储方法 |
CN107798219A (zh) * | 2016-08-30 | 2018-03-13 | 清华大学 | 将数据进行生物存储并还原的方法 |
CN109086890A (zh) * | 2017-06-14 | 2018-12-25 | Landigrad有限责任公司 | 信息编码和信息解码的方法 |
WO2019040871A1 (en) * | 2017-08-24 | 2019-02-28 | Miller Julian | DEVICE FOR ENCODING AND STORING INFORMATION USING ARTIFICIALLY EXPANDED ALPHABETS OF NUCLEIC ACIDS AND OTHER ANALOGOUS POLYMERS |
CN111095423A (zh) * | 2017-08-25 | 2020-05-01 | 深圳华大生命科学研究院 | 编码/解码方法、装置和数据处理装置 |
CN108052799A (zh) * | 2018-01-10 | 2018-05-18 | 中山大学 | 基于图像处理的多序列比对可视化的方法 |
CN108365947A (zh) * | 2018-03-05 | 2018-08-03 | 郑州轻工业学院 | 一种基于Feistel网络与动态DNA编码的图像加密方法 |
CN109575674A (zh) * | 2018-11-13 | 2019-04-05 | 郭玮强 | Dna墨水、制备方法、标记或书写工具以及签约认证方法 |
CN109785904A (zh) * | 2018-12-04 | 2019-05-21 | 上海点融信息科技有限责任公司 | 基于区块链网络的基因信息处理方法、录入方法 |
CN109735631A (zh) * | 2019-01-22 | 2019-05-10 | 湖北民族学院 | 一种对棒脉摇蚊基因16SrDNA片段序列结合其形态的分析方法 |
CN109979539A (zh) * | 2019-04-10 | 2019-07-05 | 电子科技大学 | 基因序列优化方法、装置及数据处理终端 |
CN110706751A (zh) * | 2019-09-25 | 2020-01-17 | 东南大学 | 一种dna存储加密编码方法 |
CN110879895A (zh) * | 2019-11-12 | 2020-03-13 | 安徽理工大学 | 一种基于超混沌系统以及dna序列的彩色图像分块加密算法 |
CN110977984A (zh) * | 2019-12-23 | 2020-04-10 | 上海钛米机器人科技有限公司 | 控制条带、机械臂控制方法、装置、系统及存储介质 |
CN111145836A (zh) * | 2019-12-30 | 2020-05-12 | 云舟生物科技(广州)有限公司 | 插入基因核酸序列的方法、计算机存储介质及电子设备 |
CN111161800A (zh) * | 2019-12-30 | 2020-05-15 | 云舟生物科技(广州)有限公司 | 基因载体的序列诊断方法、系统、存储介质及电子设备 |
CN111368132A (zh) * | 2020-02-28 | 2020-07-03 | 元码基因科技(北京)股份有限公司 | 基于dna序列存储音频或视频文件的方法及存储介质 |
CN112084514A (zh) * | 2020-09-01 | 2020-12-15 | 宁波海特技术转移有限公司 | 一种混沌序列与dna突变的图像加密方法及装置 |
Non-Patent Citations (11)
Title |
---|
JIAN ZHANG等: "Image Encryption Algorithm Based on DNA Encoding and Chaotic Maps", 《MATHEMATICAL PROBLEMS IN ENGINEERING》 * |
PUSHPA B R等: "A New Technique for Data Encryption using DNA Sequence", 《2017 INTERNATIONAL CONFERENCE ON INTELLIGENT COMPUTING AND CONTROL (I2C2)》 * |
XIAOPENG WEI等: "A novel color image encryption algorithm based on DNA sequence operation and hyper-chaotic system", 《THE JOURNAL OF SYSTEMS AND SOFTWARE》 * |
张慧奔: "基于混沌图像加密算法的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
张瑜等: "基于免疫和代码重定位的计算机病毒特征码提取与检测方法", 《北京理工大学学报》 * |
李宏等: "原核生物和酵母基因组中起始密码的特征分析", 《内蒙古大学学报(自然科学版)》 * |
杨才伟: "在动态过程中巧判遗传信息读取的方向", 《生物学通报》 * |
林能明: "全球抗肿瘤药研究新进展", 《中国药房》 * |
毛彦斌等: "伪DNA密码图像加密算法研究", 《西安交通大学学报》 * |
田美金等: "一种改进PSI协议的基因数据隐私保护方案", 《西安电子科技大学学报》 * |
钟健等: "琥珀蚕线粒体全基因组测序及序列分析", 《昆虫学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112687338B (zh) | 2022-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111090628B (zh) | 一种数据处理方法、装置、存储介质及电子设备 | |
US7117348B2 (en) | Method and system for detecting the validity of configuration data | |
WO2020258500A1 (zh) | 光学字符识别辅助方法、装置、计算机设备及存储介质 | |
CN108665041A (zh) | 二维码生成及识别方法、装置、计算机设备及存储介质 | |
WO2020206905A1 (zh) | 代码段保护方法、装置、计算机设备和存储介质 | |
US20140222753A1 (en) | Updating shared group information in a dispersed storage network | |
CN112700819B (zh) | 基因序列的处理方法、计算机存储介质及电子设备 | |
CN111835808B (zh) | 数据存储方法及装置、数据读取方法及装置、存储介质 | |
CN112687338B (zh) | 基因序列的存储和还原方法、计算机存储介质及电子设备 | |
Hu et al. | Using TWINSCAN to predict gene structures in genomic DNA sequences | |
CN111046393B (zh) | 漏洞信息上传方法、装置、终端设备及存储介质 | |
WO2017054182A1 (zh) | 一种数据校验方法和装置 | |
CN115858049A (zh) | Rpa流程组件化编排方法、装置、设备和介质 | |
CN114422236B (zh) | 一种智能设备的访问方法、装置和电子设备 | |
CN112417020B (zh) | 业务扩展的实现方法、装置、计算机设备和存储介质 | |
WO2021139443A1 (zh) | 数据访问控制方法及装置、数据访问设备及系统 | |
CN111435452B (zh) | 模型训练方法、装置、设备和介质 | |
CN108932171B (zh) | 嵌入式软件交互方法 | |
CN112330768A (zh) | 基于数据特征的图像快速合成方法 | |
CN111723153A (zh) | 一种数据同步处理方法、装置、设备及存储介质 | |
CN113989177A (zh) | 图像数据处理方法、装置、设备及存储介质 | |
CN117632804B (zh) | 信号传输方法、装置、计算机设备和存储介质 | |
CN115169335B (zh) | 发票数据校准方法、装置、计算机设备和存储介质 | |
CN115658351B (zh) | 2d拷贝方法、装置、电子设备和计算机可读存储介质 | |
CN115454632A (zh) | 一种服务部署方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: Room d301-d309, Zone D, Guangzhou International Business Incubator, No. 3, Juquan Road, Science City, Guangzhou, Guangdong 510663 Patentee after: Yunzhou Biotechnology (Guangzhou) Co.,Ltd. Address before: 510663 room d301-d309, 3 / F, building D, international business incubator, Science City, Huangpu District, Guangzhou, Guangdong Patentee before: YUNZHOU BIOSCIENCES (GUANGZHOU) Inc. |