CN102122371A - 一种基于迭代函数的遗传信息二维可视化加密方法 - Google Patents

一种基于迭代函数的遗传信息二维可视化加密方法 Download PDF

Info

Publication number
CN102122371A
CN102122371A CN2010105892098A CN201010589209A CN102122371A CN 102122371 A CN102122371 A CN 102122371A CN 2010105892098 A CN2010105892098 A CN 2010105892098A CN 201010589209 A CN201010589209 A CN 201010589209A CN 102122371 A CN102122371 A CN 102122371A
Authority
CN
China
Prior art keywords
grid
state
information
site
iteration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105892098A
Other languages
English (en)
Other versions
CN102122371B (zh
Inventor
吴晓明
杜建强
王旭
李慧丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201010589209.8A priority Critical patent/CN102122371B/zh
Publication of CN102122371A publication Critical patent/CN102122371A/zh
Application granted granted Critical
Publication of CN102122371B publication Critical patent/CN102122371B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明涉及一种基于迭代函数的遗传信息二维可视化加密方法,个体的遗传信息包括传统的STR位点信息和为数众多的SNP信息。通过映射,这些遗传信息可以用二维平面网格中不同坐标、不同颜色的小方格来表示。本发明提出了利用迭代函数的方法,对表示在平面网格中的遗传信息进行迭代,在迭代过程中实现原始遗传信息的隐藏,并得到有一定规律的图案,形成被加密、看得见的个体“遗传指纹”图案。该图案可方便的进行差异比较,可用于进行个体生物特征识别、生物特征密钥、遗传信息可视化等方面。

Description

一种基于迭代函数的遗传信息二维可视化加密方法
技术领域
本发明属于信息安全和生物特征识别技术领域,特别涉及一种基于迭代函数的遗传信息二维可视化加密方法。
背景技术
每个人都有两套染色体,是重要的遗传信息,同时也是一种包含有丰富信息的生物特征。不同的人遗传信息存在差别,这些差别会在DNA分子上多个不同的位置体现。遗传信息可以利用PCR技术结合凝胶电泳、质谱技术、基因芯片等技术检测,其结果是不同类型的实验数据。这些数据经过处理之后,对于STR位点,通常用短重复片段(STR)的重复次数表示;对于SNP位点,根据其等位基因的基因型,可用11,10或00来代表纯合-常见、杂合、纯合-罕见三种类型。遗传信息的检测对于进行个体身份识别、疾病诊断、个体化医疗等方面有重要的价值。
这种遗传信息虽然准确,但不便于人工分析和比较,特别是涉及较多位点的时候。当用作生物特征密钥时,也存在简单、容易被猜中的特点。当把这些信息表示成为具有唯一性的网格状态和二维图像,就不仅能够直观的看出遗传信息之间的不同,还能够作为一种特殊的“指纹”,用于信息的加密、验证等领域。
发明内容
发明的目的在于提出一个遗传信息的加密和可视化方法,直观显示出个体遗传信息之间的差异。当遗传信息有差别时,可以在图中清晰的看出差别,而不必显示具体的哪个位点发生了变化。这一可视化结果隐含有全部的遗传信息,能够被可视化的方式显示,但并不能从该结果中获得原始的遗传信息,是一种单向的数据变换。图中所包含的数据可以作为生物指纹,用于信息的加密。
本发明的技术方案是这样实现的:
本发明是个体遗传信息被数字化,经过迭代函数的多次迭代,以二维图像的方式来表示,具体包括以下步骤:
1)生物个体的DNA遗传学标记位点被映射到二维平面中,平面用水平和垂直的线分割成大小相同的正方形有边界网格,每个格子对应有多种不同的状态,状态数目大于等于2,用不同颜色的格子表示不同的状态,遗传信息由格子的起始状态表示;
2)格子对应的状态变化由迭代函数获得,迭代函数采用二维元胞自动机模型实现,利用迭代函数系统对每个格子的状态进行设定次数的迭代,所述的迭代是采用不同的迭代规则组合使用,依次获得二维平面中每个格子的下一个状态,实现遗传信息二维可视化加密。
所述的格子起始状态,由生物样本,通过位点检测分子生物学实验获得,并数字化得到。
格子起始状态根据个体遗传信息确定,具体方法分为2类,分别是根据STR短串重复序列位点(a)和SNP单核苷酸多态性位点(b),其状态初始化方法不同:
对于(a)类信息,网格状态初始化方法为:对于N个STR位点,初始化横向为2N的二维网格,横轴根据位点的序号排列,每个位点有两个等位基因,在横轴上占有两个位置,每个位置表示一个等位基因,当该等位基因对应的STR重复次数为k,设定纵向第k个格子的状态为1,对每个等位基因都应用此方法,从而形成一个起始状态;
对于(b)类信息,网格状态初始化方法为;横轴按照SNP的序号进行排列,每个SNP位点对应两个格子,当个体对应的SNP为常见的纯合子时,设定对应两个格子的状态为(1、1),当个体对应的SNP为罕见纯合子时,设定对应的两个格子的状态为(0、0),当个体的信息是杂合子时,设定对应的两个格子的状态为(0、1),形成相应的排列格式,当多个位点时候,它们依次横向排列。
本发明获得的遗传信息表示方法具有全息性。由于所有的位点在初始都占据了平面网格的不同位置,并参与了迭代过程,因此最终的结果图像会包含所有这些位点的遗传信息。由于遗传信息经过多次迭代,已经从结果图像中难以直接看出位点的等位基因形式,图像中的遗传信息处于加密状态,具有保护个人隐私的效果。遗传信息被本发明转换为平面图形,元胞自动机的迭代过程产生的结果非常美观、直观,可用于遗传信息检测结果的呈现。
结果图象对应的每个元胞的状态信息是由生物特征的到得,可以作为信息加密领域的生物特征,用于信息传输和保密工作。
附图说明
图1是本发明对STR信息初始化示意图;
图2是本发明对SNP位点初始化示意图;
图3是本发明对STR信息的可视化结果示意图;
图4是本发明对31个SNP位点可视化结果示意图。
下面结合附图对本发明的内容作进一步详细说明。
具体实施方式
例1:STR位点的可视化
个体a的遗传信息在17个位点分别为:
位点名称:D16S539;D7S820;D13S317;CSF1PO;TPOX;TH01;F13A01;FES;vWFA31;HPRTB;F13B;FABP;LPL;CYAR04;CD4;GPP3A09;D8S1179个体A在这些位点STR的重复次数为:11,11;11,10;12,9;12,9;11,8;9,8;6,3;11,11;17,16;13,13;10,10;10,9;12,10;11,7;7,7;6,6;11,10;
参照1所示,当这些位点按照本发明叙述的方法进行网格状态初始化后,可视化结果为图1。随后使用规则1迭代100次,规则2迭代100次,得到最终图像,包含536*536个方格。如图3。这个图案包含有处于隐藏状态的个体的全部遗传信息。
例2:
个体甲的SNP遗传信息如下:
位点名称:
rs7121845  rs1940094  rs1940092  rs472587   rs1789175  rs555867   rs6592199
rs6592202  rs1943707  rs7110559  rs1943696  rs1943701  rs1943705  rs4370960
rs1943699  rs3802893  rs876695   rs1943710  rs952201   rs1943715  rs2000815
rs1943725  rs1943733  rs957438   rs6592211  rs1227671  rs1940125  rs7111775
rs2155413  rs1073987  rs7108021
在每个位点,个体的SNP的形式:(0表示低频SNP,1表示常见SNP)
个体甲:
1,0,0,0,1,0,0,0,1,0,1,1,1,0,1,0,1,0,0,0,1,0,1,0,1,0,1,1,1,0,1,1,0,0,1,1,0,0,1,0,1,1,1,1,0,0,1,0,1,0,1,1,0,0,0,0,1,1,1,1,0,0
按照1所示的方法,对该数据进行网格初始化,设定网格的状态,结果为图2。依次使用2、3描述的迭代方式1、迭代方式2各100次,得到可视化后结果图4。本图像共包含460*410个方格。
具体步骤:
1遗传信息的转换。
对于STR位点信息(a类),遗传信息到二维网格初始图像的映射方法为:由于每个STR位点对应于两个不同重复次数的等位基因,对于N个位点,把它们依次排列在二维网格中的2N列,每列对应一个等位基因。当对应的STR重复次数为K时,则位于该列第K行的网格对应于这个位点,记为1,对应于平面网格中黑色方块。见图1。
对于SNP信息(b类),遗传信息到二维网格初始图像的映射方法为:对于N个SNP位点,按照SNP的序号依次排列在二维网格中一行的2N格子。对于每个SNP位点,当个体对应的SNP为常见型纯合子时,对应的两个格子标记为11,当个体对应罕见型纯合子时,对应的两个格子标记为00,当个体的信息是杂合子时,标记为01,形成图2的排列格式。图中的标记为1的方格用黑色表示。
2迭代规则1:
根据元胞自动机模型,对于平面中的每一个小格子,把它看做是上、下、左、右4个格子的中心,中心格子下一时刻的颜色根据它自己的颜色和周围4个格子的颜色确定。
具体迭代方法1:元胞以及上、右、下、左4个元胞的状态定义为X,XU,XR,XD,XL,共5个变量。5个变量的不同状态确定中心元胞下一时刻的状态。这个迭代过程是从上到下,从左到右的顺序进行。直到整个网格都迭代一遍,形成新的图形。这个过程迭代多次,每次都改变一个元胞的状态。
Figure BDA0000038365990000061
元胞的命名方法
各个元胞当前状态和对应的中间元胞下一时刻状态转换规律:
Figure BDA0000038365990000062
这些X的新状态按照5个元胞状态组合对应的10进制的从小到大依次排列,形成状态序列:01101101101101101111101011001000包含有迭代过程的全部信息。
3迭代规则2:
规则2包括3个状态,根据元胞以及上、右、下、左4个元胞的状态进行转换,共5个变量,当它们状态为0,1,2三个状态时,总共有35=243个组合,每种组合导致下一时刻中心元胞状态发生变化。当这243个状态按照10进制从0~242的顺序时,对应于中间元胞的状态为:
010112020112112222020222020112112222112102220222220202020222020222220202020202020112102222102000200222200202102000200000012020200020000222200202200020000202000200020220000220222020000020000220222020222222222020222020000020000020222020000020000该序列包含有本迭代过程的全部信息。
4.边界规则:在计算位于边界元胞的状态时,若该元胞的上、下、左、右没有元胞时,按照镜像原则,取该元胞下、上、右、左元胞,用它的状态作为不存在元胞的状态,然后利用迭代规则获得该元胞下一时刻的状态。
5图像输出:按照以上两个迭代方法进行迭代之后,根据每个元胞的状态,设定对应方格的颜色为白、灰、黑三种,最终得到包含多个不同颜色的方格,形成相应的可视化图像。该图像就是包含遗传信息的指纹图像。由于是采用迭代的方式获得的图像,图像有一定的规律。

Claims (3)

1.一种基于迭代函数的遗传信息二维可视化加密方法,其特征在于,是个体遗传信息被数字化,经过迭代函数的多次迭代,以二维图像的方式来表示,具体包括以下步骤:
1)生物个体的DNA遗传学标记位点被映射到二维平面中,平面用水平和垂直的线分割成大小相同的正方形有边界网格,每个格子对应有多种不同的状态,状态数目大于等于2,用不同颜色的格子表示不同的状态,遗传信息由格子的起始状态表示;
2)格子对应的状态变化由迭代函数获得,迭代函数采用二维元胞自动机模型实现,利用迭代函数系统对每个格子的状态进行设定次数的迭代,所述的迭代是采用不同的迭代规则组合使用,依次获得二维平面中每个格子的下一个状态,实现遗传信息二维可视化加密。
2.根据权利要求1所述的一种基于迭代函数的遗传信息二维可视化加密方法,其特征在于,所述的格子起始状态,由生物样本,通过位点检测分子生物学实验获得,并数字化得到。
3.根据权利要求1所述的一种基于迭代函数的遗传信息二维可视化加密方法,其特征在于,格子起始状态根据个体遗传信息确定,具体方法分为2类,分别是根据STR短串重复序列位点(a)和SNP单核苷酸多态性位点(b),其状态初始化方法不同:
对于(a)类信息,网格状态初始化方法为:对于N个STR位点,初始化横向为2N的二维网格,横轴根据位点的序号排列,每个位点有两个等位基因,在横轴上占有两个位置,每个位置表示一个等位基因,当该等位基因对应的STR重复次数为k,设定纵向第k个格子的状态为1,对每个等位基因都应用此方法,从而形成一个起始状态;
对于(b)类信息,网格状态初始化方法为;横轴按照SNP的序号进行排列,每个SNP位点对应两个格子,当个体对应的SNP为常见的纯合子时,设定对应两个格子的状态为(1、1),当个体对应的SNP为罕见纯合子时,设定对应的两个格子的状态为(0、0),当个体的信息是杂合子时,设定对应的两个格子的状态为(0、1),形成相应的排列格式,当多个位点时候,它们依次横向排列。
CN201010589209.8A 2010-12-15 2010-12-15 一种基于迭代函数的遗传信息二维可视化加密方法 Expired - Fee Related CN102122371B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010589209.8A CN102122371B (zh) 2010-12-15 2010-12-15 一种基于迭代函数的遗传信息二维可视化加密方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010589209.8A CN102122371B (zh) 2010-12-15 2010-12-15 一种基于迭代函数的遗传信息二维可视化加密方法

Publications (2)

Publication Number Publication Date
CN102122371A true CN102122371A (zh) 2011-07-13
CN102122371B CN102122371B (zh) 2014-08-06

Family

ID=44250924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010589209.8A Expired - Fee Related CN102122371B (zh) 2010-12-15 2010-12-15 一种基于迭代函数的遗传信息二维可视化加密方法

Country Status (1)

Country Link
CN (1) CN102122371B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102546158A (zh) * 2011-12-22 2012-07-04 河海大学 一种基于奇偶元胞自动机的分组加密方法
CN104734848A (zh) * 2015-03-02 2015-06-24 郑州轻工业学院 基于重组dna技术对信息进行加密与隐藏的方法及应用
CN105119717A (zh) * 2015-07-21 2015-12-02 郑州轻工业学院 一种基于dna编码的加密系统及加密方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1584027A (zh) * 2004-06-10 2005-02-23 上海交通大学 Rna全序列特征可视化提取方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1584027A (zh) * 2004-06-10 2005-02-23 上海交通大学 Rna全序列特征可视化提取方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
肖佳等: "基于二维元胞自动机的双向触发并行加密模型", 《计算机应用研究》 *
闫广武: "元胞自动机与人工生命研究进展", 《吉林大学学报》 *
陈惟昌等: "遗传密码和DNA序列的高维空间数字编码", 《生物物理学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102546158A (zh) * 2011-12-22 2012-07-04 河海大学 一种基于奇偶元胞自动机的分组加密方法
CN102546158B (zh) * 2011-12-22 2014-05-07 河海大学 一种基于奇偶元胞自动机的分组加密方法
CN104734848A (zh) * 2015-03-02 2015-06-24 郑州轻工业学院 基于重组dna技术对信息进行加密与隐藏的方法及应用
CN105119717A (zh) * 2015-07-21 2015-12-02 郑州轻工业学院 一种基于dna编码的加密系统及加密方法

Also Published As

Publication number Publication date
CN102122371B (zh) 2014-08-06

Similar Documents

Publication Publication Date Title
Bradburd et al. A spatial framework for understanding population structure and admixture
Burton et al. Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions
Johri et al. ‘Genome skimming’with the MinION hand-held sequencer identifies CITES-listed shark species in India’s exports market
Kolář et al. Northern glacial refugia and altitudinal niche divergence shape genome‐wide differentiation in the emerging plant model Arabidopsis arenosa
Knowles Statistical phylogeography
Twist et al. High diversity of coralline algae in New Zealand revealed: Knowledge gaps and implications for future research
Andrew et al. Recent nonhybrid origin of sunflower ecotypes in a novel habitat
Psonis et al. Resolving complex phylogeographic patterns in the Balkan Peninsula using closely related wall-lizard species as a model system
Dowle et al. Correlation between shell phenotype and local environment suggests a role for natural selection in the evolution of Placostylus snails
Singhal et al. Squamate conserved loci (Sq CL): a unified set of conserved loci for phylogenomics and population genetics of squamate reptiles
Grewe et al. Reference-based RADseq resolves robust relationships among closely related species of lichen-forming fungi using metagenomic DNA
Chase et al. Genomewide variation provides insight into evolutionary relationships in a monkeyflower species complex (Mimulus sect. Diplacus)
CN102122371B (zh) 一种基于迭代函数的遗传信息二维可视化加密方法
Farleigh et al. The effects of climate and demographic history in shaping genomic variation across populations of the Desert Horned Lizard (Phrynosoma platyrhinos)
Schmitt et al. Topography drives microgeographic adaptations of closely related species in two tropical tree species complexes
Seo et al. Chloroplast DNA insights into the phylogenetic position and anagenetic speciation of Phedimus takesimensis (Crassulaceae) on Ulleung and Dokdo Islands, Korea
Zorrilla‐Azcué et al. The DNA history of a lonely oak: Quercus humboldtii phylogeography in the Colombian Andes
Raphael et al. Reconstructing tumor amplisomes
Fenker et al. Predictors of phylogeographic structure among codistributed taxa across the complex Australian monsoonal tropics
Van Den Ende et al. Why should we compare morphological and molecular disparity?
Apodaca et al. Population structure and genetic differentiation in extant Alligator Snapping Turtles (genus Macrochelys) with implications for taxonomy and conservation
Burt et al. Integration of population genetics with oceanographic models reveals strong connectivity among coral reefs across Seychelles
Pavlek et al. Life-history traits drive spatial genetic structuring in Dinaric cave spiders
San Lucas et al. Haploscope: a tool for the graphical display of haplotype structure in populations
Coelho et al. Integration of genomic and ecological methods inform management of an undescribed, yet highly exploited, sardine species

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140806

Termination date: 20211215