CN105154544A - 基于基因检测的生物体身份认证方法及系统 - Google Patents

基于基因检测的生物体身份认证方法及系统 Download PDF

Info

Publication number
CN105154544A
CN105154544A CN201510559720.6A CN201510559720A CN105154544A CN 105154544 A CN105154544 A CN 105154544A CN 201510559720 A CN201510559720 A CN 201510559720A CN 105154544 A CN105154544 A CN 105154544A
Authority
CN
China
Prior art keywords
organism
genotype information
data
storage medium
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510559720.6A
Other languages
English (en)
Inventor
周立新
蒋峻峰
李丹
祝召虎
杨小娟
杨晓东
王大庆
孙晓磊
吴纯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jian Lu Biotechnology (suzhou) Co Ltd
Original Assignee
Jian Lu Biotechnology (suzhou) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jian Lu Biotechnology (suzhou) Co Ltd filed Critical Jian Lu Biotechnology (suzhou) Co Ltd
Priority to CN201510559720.6A priority Critical patent/CN105154544A/zh
Publication of CN105154544A publication Critical patent/CN105154544A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

本发明涉及一种基于基因检测的生物体身份认证方法及系统,认证方法包括登记生物体信息和生物体身份认证,其中登记生物体信息包括获取待检测生物体的DNA、对获得的DNA进行检测得到SNPs基因型信息、将基因型信息存入储存介质。其中生物体身份认证包括将待认证的生物体信息与储存介质中的生物数据、与基因型信息绑定的ID识别号、或基因型信息转化后的编码格式数据进行对比;当匹配对比不一致时,生物体身份认证失败结束;当匹配对比一致时,完成生物体身份认证。本发明操作方便、成本较低,尤其适用需要对人体生物样本进行多次采集的疾病检测,具有生物体样本不易混淆、不易被冒用替代、安全性好、可靠性及准确性强的特点。

Description

基于基因检测的生物体身份认证方法及系统
技术领域
本发明属于生物技术领域,具体涉及基于基因检测的生物体身份认证方法及认证系统。
背景技术
DNA测序正处在技术上天翻地覆剧变的阵痛之中,其突出特点是,测序通量(测序数据量)在大幅增长,原始数据中每个碱基的测序成本急剧下跌,并伴随着通过巨资购买仪器以引进新技术的需求。以前看似高不可攀的奢侈性研究活动,如个人基因组测序、宏基因组学研究、以及对大量重要物种的测序,在短短几年之间正以急速的步伐而变得越来越切实可行。在过去的几年里,主导第二代测序仪市场的几家公司,纷纷依靠已知的参照基因组,以更好更经济的第二代测序方法生产出了拼接好的人类全基因组序列。2014年1月14日,Illumina公司宣布,他们的最新产品HiSeqXTen测序系统可以将个人基因组测序的机器和试剂成本控制在1000美元以内。
另外,发展较为成熟的基因芯片技术,可以通过微加工技术,将数以万计、乃至百万计的特定序列的DNA片段(基因探针),有规律地排列固定于2cm2的硅片、玻片等支持物上,构成的一个二维DNA探针阵列,从而解决了传统核酸印迹杂交(SouthernBlotting和NorthernBlotting等)技术的操作繁杂、自动化程度低、操作序列数量少、检测效率低等不足。而且,通过设计不同的探针阵列、使用特定的分析方法可使该技术具有多种不同的应用价值,如基因表达谱测定、突变检测、多态性分析、基因组文库作图及杂交测序等。
自2005年Nature报道了454lifescience公司一种最新的基于微乳液PCR技术的高通量测序技术以来,全世界各大研究机构和生物公司竞相开展了高通量检测技术的研究工作。随着高通量检测技术的快速发展,使得基因检测必将会成为一项常规的检测手段进入普通人群中。
与此同时,医学界普遍认为,基因检测对于医学发展意义重大。人体内总共约有3万多个基因,除外伤,人类的疾病大多与基因相关,如基因异常、基因受损都会引起对应的蛋白质或酶的功能变化而引起疾病。基因检测就是通过血液以及其他体液或细胞中的DNA或RNA进行检测的技术,使人们能了解自己的基因信息,预知身体患疾病的风险,并通过改善生活环境和生活习惯,避免或延缓疾病的发生。医生在掌握患者的基因组序列后将能更好针对患者的个人遗传特点选择针对性的治疗方案,提高疾病治疗效率。
面对基因检测将快速影响医学发展这一趋势,寻找并研究新型的能够反映不同群体和个体多态性的遗传标记,成为基因检测结果中的身份认证标准已成为遗传学工作中的一项重任。其中,短串联重复(shorttandemrepeat,STR)是目前应用最广泛、研究较深入的遗传标记之一,STR属孟德尔共显性遗传,其具有高度多态性、高杂合度、高信息含量、检测简便、快捷等优点,然而由于STR主要位于基因组的非编码区和染色体近端粒区,其与疾病缺乏紧密的关联性,成为其难以成为下一代遗传标记的重要影响因素。
发明内容
鉴于上述现有技术存在的缺陷,本发明的目的是提供一种高精度和高速度的基因检测的生物体身份认证方法、及其认证系统,以解决现有技术认证操作复杂、成本较高、安全性差等问题。本发明采用的技术方案包括:
一种基于基因检测的生物体身份认证方法,
登记生物体信息包括下述步骤:
S1,获取待检测生物体的DNA;
S2,检测并分析后获得生物体的SNPs基因型信息,其中用于生物体身份认证的基因型信息中包括至少21个SNPs位点的基因型信息;
S3,将基因型信息作为生物体识别数据存入储存介质中,或是将基因型信息与标示的ID识别号或身份属性绑定后存入储存介质中,或是将基因型信息转化为用于提高匹配对比速度或加密的编码格式数据存入储存介质中;
生物体身份认证包括下述步骤:
与步骤S3中所述将基因型信息作为生物体识别数据存入储存介质中的方法相对应的,将待认证的基因型信息与储存介质中的基因型信息匹配对比,
或是与步骤S3中所述将基因型信息与标示的ID识别号绑定后存入储存介质中的方法相对应的,先将标示的ID识别号或身份属性与储存介质中的ID识别号或身份属性数据匹配,对比成功后再将绑定的基因型信息匹配对比;
或是与步骤S3中所述将基因型信息转化为编码格式数据存入储存介质中的方法相对应的,将待认证的编码格式数据与储存介质中编码格式数据匹配对比;
当匹配对比不一致时,生物体身份认证失败结束;当匹配对比一致时,完成生物体身份认证。
应当说明的是,SNPs是人类基因组中单个碱基的变异,整个人类基因组中共有300万以上的SNPs,其中约有20万存在于编码区。由于每个SNP位点通常仅含有2种等位基因,就单个SNPs而言只有两种变异体,变异程度低于微卫星DNA,但SNPs在整个基因组中数量巨大,分布密集,因此整体而论,SNPs的多态性要高得多,而且由于SNPs是二态的,易于自动化批量检测。另外,某些位于基因内部的SNPs有可能直接影响蛋白质结构或表达水平,可能代表疾病遗传机理中的某些作用因素,且具有更高的遗传稳定性,因而可作为新一代的遗传标记。
应当说明的是,所述步骤S2的检测方法包括但不局限于以下几类方法中的一种或多种:
a、测序方法:包括第一代测序技术、第二代测序技术、第三代测序技术;
b、杂交法:包括TaqMan探针法、芯片法;
c、引物延伸:包括基质辅助激光解吸电离飞行时间质谱(MALDI-Tof)、变性高效液相色谱分析(dHPLC);
d、以构象为基础的方法:限制性内切酶片段长度多态性(RFLP)、单链构象多态性检测(SSCP)、变性梯度凝胶电泳(DGGE);
e、溶解曲线:高分辨率溶解曲线分析技术(HRM)。
应当说明的是,本发明所要解决的技术问题为高通量基因检测结果下的遗传标记(基因指纹)问题,上述方法虽然检测通量存在差异,且各有优缺点,但均可以实现SNPs基因型信息的获得,不排除其经过发展后具备较高通量检测能力的可能性,因此在实际使用过程中应当包括但不局限于上述方法。与此同时,应当说明的是,由于用于生物体身份认证的基因型信息中包括至少21个SNPs位点的基因型信息,通量的大小对于SNPs位点个数的选择具有一定影响,因此在当前检测过程中,优选采用高通量的第二代测序或DNA芯片技术,考虑检测通量和成本问题,更优选的采用二代测序技术中的IlluminaHiSeq/MiSeq。
【测序方法】
㈠第一代测序技术(Sanger测序)
步骤包括序列比对—引物设计—DNA提取—PCR—割胶纯化—直接测序或装克隆测序。
Sanger测序和焦磷酸测序的优点是能发现已知SNP,也能发现未知SNP。但同时存在下述缺点:每个样本的每个位点均需要经PCR扩增、跑胶、然后切胶纯化后再测序。其步骤多而分散,成本较高,工作量大,周期长,价格昂贵,不适合大样本多位点检测。
㈡第二代测序技术
第二代测序技术的核心思想是边合成边测序(SequencingbySynthesis),即通过捕捉新合成的末端标记来确定DNA的序列。现有的技术平台主要包括Roche/454FLX、IlluminaHiSeq/MiSeq和AppliedBiosystemsSOLIDsystem。其中,Roche/454FLX采用焦磷酸测序法,具有读长较大的特点。IlluminaHiSeq/MiSeq采用可逆链终止物和合成测序法,具有通量较高的特点。AppliedBiosystemsSOLIDsystem采用连接测序法,具有通量较高的特点。
以Illumina测序仪说明二代测序的一般流程:
⑴文库制备,将DNA用雾化或超声波随机片段化成几百碱基或更短的小片段,用聚合酶和外切核酸酶把DNA片段切成平末端,紧接着磷酸化并增加一个核苷酸黏性末端,然后将Illumina测序接头与片段连接。
⑵簇的创建,将模板分子加入芯片用于产生克隆簇和测序循环,芯片有8个纵向泳道的硅基片,每个泳道内芯片表面有无数的被固定的单链接头,上述步骤得到的带接头的DNA片段变性成单链后,与测序通道上的接头引物结合形成桥状结构,以供后续的预扩增使用,通过不断循环获得上百万条成簇分布的双链待测片段。
⑶测序,分三步:DNA聚合酶结合荧光可逆终止子,荧光标记簇成像,在下一个循环开始前将结合的核苷酸剪切并分解。
⑷数据分析。
㈢第三代测序技术
主要包括以下几种:
⑴HelicoBioScience单分子测序技术。该测序是基于边合成边测序的思想,将待测序列随机打断成小分子片段并用末端转移酶在3'末端加上poly(A),以及在poly(A)的末端进行荧光标记和阻断,把这些小片段与带有poly(T)的平板杂交成像来获得已经杂交模板所处的位置,建立边合成边测序的位点并加入聚合酶和被Cy3荧光标记脱氧核苷酸进行DNA合成。每次只加入一种脱氧核苷酸,然后将未参与合成的dNTP和DNA聚合酶洗脱,直接对Cy3成像,观测模板位点上是否有荧光信号,然后化学裂解核苷酸上的燃料并释放,加入下一种脱氧核苷酸和聚合酶的混合物,进行下一轮反应。
⑵PacificBioscienceSMRTT技术。该测序也是基于边合成边测序的原理,这项技于使用了Zero-ModeWaveguide(ZMW)(零级波导)。测序的过程包括:被荧光标记磷酸基团的核苷酸在聚合酶活性位点上与模板链结合(每种脱氧核苷酸被不用颜色的染料标记),被激发出荧光,在荧光脉冲结束后,被标记的磷酸基团被切割并释放,聚合酶转移到下一个位置,下一个脱氧核苷酸连接到位点上开始释放荧光脉冲,进行下一个循环。
⑶OxfordNanoporeTechnologies的纳米孔单分子测序技术。大多数纳米孔测序技术的基本原理是当DNA分子或者它的组成碱基从一个孔洞经过时,检测到被影响的电流或光信号。OxfordNanopore测序技术是以α-溶血素来构建生物纳米孔,核酸外切酶依附在孔一侧的外表面,一种合成的环糊精作为传感器共价结合到纳米孔的内表面。该系统被镶嵌在一个脂双分子层内,为了提供既符合碱基区分检测又满足外切酶活性的物理条件,脂双分子层两侧为不同的盐浓度,并在适合的电压下,核酸外切酶消化单链DNA,单个碱基落入孔中,并与孔内的环糊精短暂的相互作用,影响了流过纳米孔原本的电流,腺嘌呤与胸腺嘧啶的电信号大小很相近,但胸腺嘧啶在环糊精停留是时间是其他核苷酸的2-3倍,所以每个碱基都因其产生电流干扰振幅是特有的而被区分开来。
【杂交的方法】
㈠TaqMan探针技术
步骤包括序列比对—引物和特异探针设计—DNA提取—PCR—结果分析。
采用TaqMan探针技术测序具有准确度高,适合样本多、位点数量少的检测等优点。但其缺点是价格昂贵、如探针合成费用高,仅检测已知SNP位点,不能同时发现未知SNP。
㈡Microarray芯片法
芯片(microarray)(又称DNA芯片、生物芯片)的原型是80年代中期提出的。Microarray的检测原理是杂交法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法,在一块基片表面固定了序列已知的靶核苷酸的探针。当溶液中带有荧光标记的核酸序列TATGCAATCTAG,与基因芯片上对应位置的核酸探针产生互补匹配时,通过确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列。据此可重组出靶核酸的序列。
Microarray芯片法具有可定制、高通量,适用于全基因组SNP扫描等优点,适用于多(全)SNP位点筛查。
【引物延伸】
㈠MALDI-Tof质谱分析方法
操作步骤如下:
Step1.人类基因组DNA的制备;
Step2.PCR;
Step3.PCR产物的纯化;
Step4.等位基因特异性引物延伸反应;
Step5.等位基因特异性引物延伸反应产物的纯化;
Step6.样品的制备;
Step7.检测及分析。
㈡dHPLC法
dHPLC法的流程如下:DNA提取—PCR扩增—变性后缓慢复性—检测以及分析。
【溶解曲线】
HRM技术
HRM技术步骤包括序列比对—引物设计—DNA提取—荧光染料(EvaGreen或LCgreen)PCR—结果分析。
应当说明的是,不论采用何种方法,其存在的问题就是如何有效区分检测样本的身份认证问题。为了提高样本间的区分效果,所述SNPs位点的筛选标准为:最小等位基因频率(MinorAlleleFrequency,MAF)的取值范围为0.3~0.5,并且所述SNPs位点间的连锁不平衡参数r2<0.5,较小的MAF值不利于实现生物样本的基因型、编号,而较大的连锁不平衡参数,存在浪费的问题。MAF的取值越接近于0.5,则SNPs位点的区分度越接近于3,即有效区分基因型,例如AA、Aa和aa,若选择的SNPs位点均为MAF=0.5,那么理论上需要至少21个SNPs位点信息(321=10E9),即可有效区分现有的全人类的样本,而实际使用过程中,为了更好的区分,我们往往需要选取至少50个SNPs作为身份认证位点。
前述最小等位基因频率(MinorAlleleFrequency,MAF)通常是指在给定人群中的不常见的等位基因发生频率,例如TT,TC,CC三个基因型,在人群中C的频率=0.36,T的频率=0.64,则等位基因C就为最小等位基因,MAF=0.36。从理论上来看每一个SNP位点都可以有4种不同的变异形式,但实际上发生的只有两种,即转换和颠换,二者之比为2:1。SNPs在CG序列上出现最为频繁,而且多是C转换为T,原因是CG中的胞嘧啶常被甲基化,而后自发地脱氨成为胸腺嘧啶。
应当说明的是,上述基因型信息本质上作为生物体的身份编码或基因指纹,具有包括但不限于以下其中一种或多种的用途,为方便说明,以检测方法选用二代DNA测序技术获得样本DNA、并经电脑分析获得SNPs位点的基因型信息为例,进行说明,作为基因型信息的SNPs位点个数选择50个,MAF值均大于0.45:
⑴样本间质控:对于一批生物样本的测序,若出现两个样本,其基因指纹一致,在排除是同一样本的前提下,则认为样本采样过程中出现污染的情况,需要对采样、实验过程、分析过程进行重新处理;
⑵实验过程质控:对于同一个样本不同批次或时间段的测序结果进行分析,若出现基因指纹部分信息不同的情况,则需要对实验过程进行进一步的筛查,以排出实验技术问题;
⑶样本内质控:对于同一个样本不同批次或时间段的测序结果进行分析,若出现基因指纹完全不同的情况,则需要排查是否出现样本替换或污染的问题;
⑷信息质控:对于具有相同信息的生物样本,例如姓名、年龄、身份证号等,若对不同批次测序结果进行分析,出现基因指纹完全不同的情况,则需要排查是否出现人为替换或隐藏样本的可能性,同时需进一步实验排查是否出现实验污染的问题;
⑸匿名检查:对于样本的基因检测,可赋予唯一、特定的基因指纹,隐藏该样本的其它信息,在保证检测结果准确性的基础上,保护样本的隐私权。
本发明步骤S3中,所述ID识别号包括但不限于身份证号码、自然数编号、英文字母编号或自然数与英文字母组合编号,所述身份属性包括姓名、年龄、性别、职业的一种或多种。ID识别号或身份属性与基因型信息的数据绑定,主要作用是便于后续数据匹配对比时可根据ID识别号或身份属性快速找到基因型信息数据,加速后续匹配对比速度。
本发明步骤S3中,将基因型信息转化为用于提高匹配对比速度或加密的编码格式数据是指将基因型信息的四种碱基A、C、G、T转换为编码数据,并建立编码的顺序位置序列。所述编码格式数据的是指采用编码技术转换后的用于存储在计算机内或运算、匹配对比的二进制数、十六进制数等计算机所能识别的语言。将基因检测后得到的基因型信息数据转化为编码格式数据,不仅用于提高后续匹配对比速度,而且还可以实现基因型信息的解密后的储存,满足安全性的要求。确保基因实验的参与者的身份及相关隐私被泄露的风险非常降至最低。
应当说明的是,基因型信息中包含了样本的等位基因信息,不论是通过何种方式如测序或芯片方法获得,其最终得到的均为类似于AA-AG-TC的结果,为了方便存储和分析,对于基因型信息的编码格式包括但不局限于以下方法中的一种或几种,甚至可同时采用多种方法以隐藏基因型信息,以保护样本的隐私:
①可将其中一种基因型定义为野生型,另一种定义为突变性,定义信息单独保存为基因型信息的解码表以存储,则上述基因型信息可编码为类似00-01-10的数据结构,以便进行后续分析。
②可将其中一种基因型(如显性纯合型)定义为基因型0,其它基因型(如杂合型和隐形纯合型)定义为1和2,定义信息单独保存为基因型信息的解码表以存储,则上述基因型信息可编码为类似0-1-2的数据结构,以便进行后续分析。
③可采用加密技术,如转码、替换、换位、希尔密码等,对上述基因型信息进行加密处理,将加密算法单独保存为基因型信息的解码表以存储,则上述基因型信息可经加密后保存为类似A-S-G的数据结构,以便后续分析。
④可对多个位点的基因型信息进行合并处理,以50个位点的基因型信息为例,经加密后,可加密压缩为A-B-C的25个甚至更少的数据结构,以便进行后续分析。
步骤S1中,获取DNA的方法包括CTAB法、玻璃珠法、磁珠法、超声波法、研磨法、冻融法、异硫氰酸胍法、碱裂解法或酶法。本发明优选磁珠法,能够实现DNA提取的自动化、大批量操作,符合生物学高通量的操作要求,是的检测疾病时、尤其是传染性疾病爆发时能够进行快速及时的应对,优选的磁珠法操作简单、用时短、安全无毒,完全符合现代环保理念,最主要的是,采用磁珠法提取的DNA具有纯度高、浓度大的优点。
本发明采用的技术方案还提供一种基于基因检测的生物体身份认证系统,其包括含有储存介质的数据库、进行生物体身份认证的匹配对比模块、DNA提取单元、生物传感器。
本发明所述数据库,用于保存生物体样本DNA经基因检测分析后获得的基因型信息数据、或/和用于保存用于登记所述生物样本的ID识别号或身份属性、或/和用于储存将基因型信息转化后的编码格式数据,所述ID识别号或身份属性与唯一相对应的基因型信息绑定,所述身份属性包括姓名、年龄、性别、职业的一种或多种,
本发明所述匹配对比模块,用于将待认证生物体的基因型信息数据、转化编码格式数据后的基因型信息数据、ID识别号或生物体身份属性中的一项或多项与所述数据库中所存储的数据匹配对比,匹配率≥99.99%表示匹配成功,
本发明所述DNA提取单元,用于获取样本生物体DNA并对所获得的生物体DNA进行检测、分析后获得生物体的SNPs基因型信息。
本发明所述生物传感器,用于采集所述DNA提取单元获得的数据、ID识别号或生物体身份属性数据,将得到的数据传送至所述数据库、或将得到的数据转换后传送至所述数据库。
应当说明的是,本发明所指的DNA提取单元,应当包括但不局限于采用以下几类方法中的一种或多种的相关检测设备,凡是能够实现获得生物体的SNPs基因型信息这一目的的设备,均应落入本发明的保护范围:
a、测序方法:包括第一代测序技术、第二代测序技术、第三代测序技术;
b、杂交法:包括TaqMan探针法、芯片法;
c、引物延伸:包括基质辅助激光解吸电离飞行时间质谱(MALDI-Tof)、变性高效液相色谱分析(dHPLC);
d、以构象为基础的方法:限制性内切酶片段长度多态性(RFLP)、单链构象多态性检测(SSCP)、变性梯度凝胶电泳(DGGE);
e、溶解曲线:高分辨率溶解曲线分析技术(HRM)。
较为常见的,如基于第二代测序技术的Roche/454FLX、IlluminaHiSeq/MiSeq和AppliedBiosystemsSOLIDsystem等。
应当说明的是,本发明所指的生物传感器,其目的为与DNA提取单元相互配合以最终实现将SNPs基因型信息、ID识别号或生物体身份属性数据传送至数据库,凡是能够实现这一目的的设备,均应落入本发明的保护范围;其应当包括但不限于以下设备的其中一种或多种:
a、计算机、集成电路、单片机等数据处理传输设备;
b、扫描仪、荧光检测仪、数码相机等图像采集、处理、传输设备;
c、加密器、解密器、路由器等数据处理、传输设备。
实际情况下,生物传感器应当视DNA提取单元的不同而匹配为不同的设备,例如当DNA提取单元为IlluminaHiSeq/MiSeq时,相对应的,生物传感器为计算机,需要将得到的数据转换后传送至数据库的,还可包括加密器。
应当说明的是,本发明基于基因检测的生物体身份认证系统,所述匹配对比模块中用于数据匹配对比的基因型信息为包括至少21个SNPs位点的基因型信息;其中,基因检测中所选择的SNPs位点的筛选标准为:最小等位基因频率的取值范围为0.3~0.5,并且所述SNPs位点间的连锁不平衡参数r2<0.5。
借由上述方案,本发明至少具有以下优点:①本发明将经基因检测得到的生物体基因型信息直接或转化后形成数据库,作为生物体身份认证的依据,操作方便、成本较低,尤其适用于采用需要对人体生物样本进行多次采集的疾病检测;②灵活将身份证号或生物体样本编号与生物体基因型信息绑定,加速后续生物体身份认证过程中匹配对比速度,如此方法保证生物体样本不易混淆、不易被冒用替代;③将生物体基因型信息转换为编码格式数据,不仅用于提高后续匹配对比速度,而且还可以实现基因型信息的解密后的储存,满足安全性的要求;④本发明基因检测有效对SNPs位点进行筛选,有效实现分析中质控、以及分析后质控、即使检测过程中发生混淆污染等情况,也不会影响整个检测过程准确性,从而保证了生物体样本登记的可靠性及生物体身份验证的准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
图1是本发明基于基因检测的生物体身份认证系统的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明基于基因检测的生物体身份认证方法的技术核心在于如何获取这些生物特征,保证获得的生物特征数据的可靠性,并将其转换为数字信息或直接存储于数据库中,利用处理器可靠的匹配对比来完成识别生物体身份的过程。
〖实施例1〗登记生物体信息
1)获取待检测生物体的DNA
由于DNA提取方法较多,本申请以磁珠法,如采用天隆核酸提取试剂盒,型号EX-DNA全血基因组3.0以及天隆核酸提取仪为例进行DNA提取;该方法中磁珠与核酸分子特异性地识别和高效结合,以此来从全血中分离基因组DNA。具体实验步骤在本申请中不做赘述。提取到的DNA再经常规方法进行质量检测,如利用琼脂糖电泳技术,检测基因组DNA的完整性及质量,最终得到可用于进行基因检测的DNA。
2)DNA检测
DNA检测方法包括但不局限于以下几类方法中的一种或多种:
a、测序方法:包括第一代测序技术、第二代测序技术和第三代测序技术;
b、杂交法:包括TaqMan探针法、芯片法;
c、引物延伸:包括基质辅助激光解吸电离飞行时间质谱、变性高效液相色谱分析;
d、以构象为基础的方法:限制性内切酶片段长度多态性、单链构象多态性检测、变性梯度凝胶电泳;
e、溶解曲线:高分辨率溶解曲线分析技术。
对所获得的生物体DNA进行基因检测的SNPs位点的筛选标准为:最小等位基因频率的取值范围为0.3~0.5,并且所述质控SNPs位点间的连锁不平衡参数r2<0.5。
3)基因型信息数据存储
基因型信息的数据存储可有三种方式。
方法一是将基因型信息作为生物体识别数据存入储存介质中。
方法二是将基因型信息与标示的ID识别号或身份属性信息绑定后存入储存介质中。
方法三是将基因型信息转化为用于提高匹配对比速度或加密的编码格式数据存入储存介质中。基因型信息数据及ID识别号可如表1所示。
表1生物样本的基因型信息及ID识别号
如表1所示,可将生物样本的基因型信息的碱基序列存入储存介质,或是将基因型信息的碱基序列与表1中ID识别号绑定后存如储存介质,表1中ID识别号表示为身份证号。也可将基因型信息的四种碱基A、C、G、T转换为0或1表示的编码数据,并建立编码的顺序位置序列,之后存入储存介质。
〖实施例2〗生物体身份认证
由于基因型信息数据存储有三种不同的方法,生物体身份认证也根据基因型信息数据存储的方法不同而有所区别。
将待认证生物体同样经前述方法获取待认证生物体的DNA,经DNA基因检测获得待认证基因型信息。
1)将基因型信息作为生物体识别数据存入储存介质时,将待认证的生物体基因型信息与储存介质中的生物数据,即储存介质中的基因型信息的碱基序列匹配对比,由于所取得的基因型信息的碱基序列长度较短,可进行全序列匹配对比,当匹配对比不一致时,生物体身份认证失败结束;当匹配对比一致时,完成生物体身份认证。
2)将基因型信息与标示的ID识别号绑定后存入储存介质时,先将标示的ID识别号与储存介质中的ID识别号数据匹配。如表1所示,现将待认证的生物体的ID识别号,可如表1所示的身份证号与储存介质中的身份证号集合匹配对比,对比成功后,即待认证的生物体的ID识别号在储存介质中有相同的,再将储存介质中ID识别号绑定的基因型信息生物体数据,即如表1所示的基因型信息与待认证的生物体基因型信息匹配对比,当匹配对比不一致时,生物体身份认证失败结束;当匹配对比一致时,完成生物体身份认证。
3)将基因型信息转化为编码格式数据存入储存介质时,将待认证的生物体信息转化编码格式数据后与储存介质中编码格式数据匹配对比。所述编码格式数据的是指采用编码技术转换后的用于存储在计算机内或运算、匹配对比的二进制数、十六进制数等计算机所能识别的语言,如表1所示。编码格式数据优选二进制数据,即将所述基因型信息的四种碱基A、C、G、T转换为计算机所能识别的语言,并建立编码的顺序位置序列。然后将待认证基因型信息也转化为二进制数据后与储存介质中的二进制数据集合进行匹配对比,当匹配对比不一致时,生物体身份认证失败结束;当匹配对比一致时,完成生物体身份认证。
〖实施例3〗基于基因检测的生物体身份认证系统
如图1所示,本发明提供一种基于基因检测的生物体身份认证系统,包括含有储存介质的数据库、进行生物体身份认证的匹配对比模块、DNA提取单元、生物传感器,具体实施过程如下:
首先经DNA提取单元获取样本生物体DNA,并对所获得的生物体DNA进行基因检测,得到待认证的基因型信息。其次,通过生物传感器采集所述DNA提取单元获得的数据、ID识别号或生物体身份属性数据,将得到的数据传送至所述数据库、或将得到的数据转换后传送至数据库。数据库用于保存生物体样本DNA经基因检测后的基因型信息的数据。本实施例数据库还可用于保存用于登记所述生物样本的ID识别号,该ID识别号与唯一相对应的基因型信息绑定。本实施例数据库还可以用于储存将基因型信息转化后的编码格式数据。本实施例数据库还可用于保存具有ID识别号的生物体身份属性,身份属性包括但不限于姓名、年龄、性别、职业的一种或多种组合。最后与数据库端口相互连接的CPU中的匹配对比模块,将待认证生物体的基因型信息数据、转化编码格式数据后的基因型信息数据、ID识别号或生物体身份属性中的一项或多项与所述数据库中所存储的数据匹配对比,匹配率≥99.99%表示匹配成功。
以上所述仅是本发明的优选实施方式,并不用于限制本发明,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (9)

1.一种基于基因检测的生物体身份认证方法,其特征在于:
登记生物体信息包括下述步骤:
S1,获取待检测生物体的DNA;
S2,检测并分析后获得生物体的SNPs基因型信息,其中用于生物体身份认证的基因型信息中包括至少21个SNPs位点的基因型信息;
S3,将基因型信息作为生物体识别数据存入储存介质中,或是将基因型信息与标示的ID识别号或身份属性绑定后存入储存介质中,或是将基因型信息转化为用于提高匹配对比速度或加密的编码格式数据存入储存介质中;
生物体身份认证包括下述步骤:
与步骤S3中所述将基因型信息作为生物体识别数据存入储存介质中的方法相对应的,将待认证的基因型信息与储存介质中的基因型信息匹配对比,
或是与步骤S3中所述将基因型信息与标示的ID识别号绑定后存入储存介质中的方法相对应的,先将标示的ID识别号或身份属性与储存介质中的ID识别号或身份属性数据匹配,对比成功后再将绑定的基因型信息匹配对比,
或是与步骤S3中所述将基因型信息转化为编码格式数据存入储存介质中的方法相对应的,将待认证的编码格式数据与储存介质中编码格式数据匹配对比;
当匹配对比不一致时,生物体身份认证失败结束;当匹配对比一致时,完成生物体身份认证。
2.根据权利要求1所述的基于基因检测的生物体身份认证方法,其特征在于:所述步骤S2的检测方法包括但不局限于以下几类方法中的一种或多种:
a、测序方法:包括第一代测序技术、第二代测序技术、第三代测序技术;
b、杂交法:包括TaqMan探针法、芯片法;
c、引物延伸:包括基质辅助激光解吸电离飞行时间质谱、变性高效液相色谱分析;
d、以构象为基础的方法:限制性内切酶片段长度多态性、单链构象多态性检测、变性梯度凝胶电泳;
e、溶解曲线:高分辨率溶解曲线分析技术。
3.根据权利要求1所述的基于基因检测的生物体身份认证方法,其特征在于:所述SNPs位点的筛选标准为:最小等位基因频率的取值范围为0.3~0.5,并且所述SNPs位点间的连锁不平衡参数r2<0.5。
4.根据权利要求1所述的基于基因检测的生物体身份认证方法,其特征在于:步骤S3中,所述ID识别号包括身份证号码、自然数编号、英文字母编号或自然数与英文字母组合编号,所述身份属性包括姓名、年龄、性别、职业的一种或多种。
5.根据权利要求1所述的基于基因检测的生物体身份认证方法,其特征在于:步骤S3中,将基因型信息转化为用于提高匹配对比速度或加密的编码格式数据是指:将基因型信息的四种碱基A、C、G、T转换为编码数据,并建立编码的顺序位置序列。
6.根据权利要求1所述的基于基因检测的生物体身份认证方法,其特征在于:步骤S1中,获取DNA的方法包括CTAB法、玻璃珠法、磁珠法、超声波法、研磨法、冻融法、异硫氰酸胍法、碱裂解法或酶法。
7.一种基于基因检测的生物体身份认证系统,其特征在于:包括含有储存介质的数据库、进行生物体身份认证的匹配对比模块、DNA提取单元、生物传感器,其中,
所述数据库,用于保存生物体样本DNA经基因检测分析后获得的基因型信息数据、或/和用于保存用于登记所述生物样本的ID识别号或身份属性、或/和用于储存将基因型信息转化后的编码格式数据,所述ID识别号或身份属性与唯一相对应的基因型信息绑定,所述身份属性包括姓名、年龄、性别、职业的一种或多种,
所述匹配对比模块,用于将待认证生物体的基因型信息的数据、转化编码格式数据后的基因型信息的数据、ID识别号或生物体身份属性中的一项或多项与所述数据库中所存储的数据匹配对比,匹配率≥99.99%表示匹配成功,
所述DNA提取单元,用于获取样本生物体DNA并对所获得的生物体DNA进行检测、分析后获得生物体的SNPs基因型信息,
所述生物传感器,用于采集所述DNA提取单元获得的数据、ID识别号或生物体身份属性的数据,将得到的数据传送至所述数据库、或将得到的数据转换后传送至所述数据库。
8.根据权利要求7所述的基于基因检测的生物体身份认证系统,其特征在于:所述匹配对比模块中用于数据匹配对比的基因型信息为包括至少21个SNPs位点的基因型信息。
9.根据权利要求8所述的基于基因检测的生物体身份认证系统,其特征在于:所述SNPs位点的筛选标准为:最小等位基因频率的取值范围为0.3~0.5,并且所述SNPs位点间的连锁不平衡参数r2<0.5。
CN201510559720.6A 2015-09-07 2015-09-07 基于基因检测的生物体身份认证方法及系统 Pending CN105154544A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510559720.6A CN105154544A (zh) 2015-09-07 2015-09-07 基于基因检测的生物体身份认证方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510559720.6A CN105154544A (zh) 2015-09-07 2015-09-07 基于基因检测的生物体身份认证方法及系统

Publications (1)

Publication Number Publication Date
CN105154544A true CN105154544A (zh) 2015-12-16

Family

ID=54795586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510559720.6A Pending CN105154544A (zh) 2015-09-07 2015-09-07 基于基因检测的生物体身份认证方法及系统

Country Status (1)

Country Link
CN (1) CN105154544A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599612A (zh) * 2016-10-28 2017-04-26 上海阅尔基因技术有限公司 一种基于高通量测序数据的指纹识别方法
CN108932401A (zh) * 2018-06-07 2018-12-04 江西海普洛斯生物科技有限公司 一种测序样本的标识方法及其应用
CN109306371A (zh) * 2018-10-17 2019-02-05 成都市第五人民医院 一种全自动基因检测装置
CN112758633A (zh) * 2020-12-02 2021-05-07 深圳市宏讯实业有限公司 供料控制方法、供料控制装置、供料系统及存储介质
DE112022002324T5 (de) 2021-04-28 2024-02-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein Vorrichtungen und Verfahren zur Genomsequenzierung und zum Bereitstellen von Datensicherheit unter Verwendung eines biologischen Schlüssels

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030235836A1 (en) * 2002-06-20 2003-12-25 Simonetta Ruben Antonio Labeling of objects to be identified consisting of at least one DNA fragment
CN101990578A (zh) * 2008-04-04 2011-03-23 固德基因公司 存储稳定状态的核酸的新的皮肤取样试剂盒、通过使用该试剂盒的基因测试方法及其实践应用
US8078420B2 (en) * 2006-11-15 2011-12-13 Miller Gary L Raman spectrometry authentication
WO2014019099A1 (es) * 2012-07-31 2014-02-06 Juan Carlos Jaime Procedimiento para obtener y detectar un marcador de objetos a identificar, el marcador, método para la autenticación y método para la verificación

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030235836A1 (en) * 2002-06-20 2003-12-25 Simonetta Ruben Antonio Labeling of objects to be identified consisting of at least one DNA fragment
US8078420B2 (en) * 2006-11-15 2011-12-13 Miller Gary L Raman spectrometry authentication
CN101990578A (zh) * 2008-04-04 2011-03-23 固德基因公司 存储稳定状态的核酸的新的皮肤取样试剂盒、通过使用该试剂盒的基因测试方法及其实践应用
WO2014019099A1 (es) * 2012-07-31 2014-02-06 Juan Carlos Jaime Procedimiento para obtener y detectar un marcador de objetos a identificar, el marcador, método para la autenticación y método para la verificación

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
畅晶晶等: "48个X-SNP位点的筛选及法医学应用价值分析", 《中国法医学杂志》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599612A (zh) * 2016-10-28 2017-04-26 上海阅尔基因技术有限公司 一种基于高通量测序数据的指纹识别方法
CN108932401A (zh) * 2018-06-07 2018-12-04 江西海普洛斯生物科技有限公司 一种测序样本的标识方法及其应用
CN108932401B (zh) * 2018-06-07 2021-09-24 江西海普洛斯生物科技有限公司 一种测序样本的标识方法及其应用
CN109306371A (zh) * 2018-10-17 2019-02-05 成都市第五人民医院 一种全自动基因检测装置
CN112758633A (zh) * 2020-12-02 2021-05-07 深圳市宏讯实业有限公司 供料控制方法、供料控制装置、供料系统及存储介质
DE112022002324T5 (de) 2021-04-28 2024-02-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein Vorrichtungen und Verfahren zur Genomsequenzierung und zum Bereitstellen von Datensicherheit unter Verwendung eines biologischen Schlüssels

Similar Documents

Publication Publication Date Title
RU2752700C2 (ru) Способы и композиции для днк-профилирования
US20220316010A1 (en) Methods for copy number determination
AU2021269294B2 (en) Validation methods and systems for sequence variant calls
CN105358709B (zh) 用于检测基因组拷贝数变化的系统和方法
CN107937502B (zh) 一种筛选微生物高多态性分子标记位点的方法
JP2020511966A (ja) エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法
US20210403991A1 (en) Sequencing Process
CN105154544A (zh) 基于基因检测的生物体身份认证方法及系统
R. Marcelino et al. The use of taxon-specific reference databases compromises metagenomic classification
WO2016063059A1 (en) Improved nucleic acid re-sequencing using a reduced number of identified bases
CN115198023B (zh) 一种海南黄牛液相育种芯片及其应用
CN102321752B (zh) 一种同时分析犬基因组dna 17个基因座的荧光标记检测试剂盒及其检测方法和应用
EP2971154A1 (en) Nucleic acid control panels
Mitsui et al. Multiplexed resequencing analysis to identify rare variants in pooled DNA with barcode indexing using next-generation sequencer
CN107446991A (zh) 一套适用于鉴定啤酒花品种及纯度的snp位点及其应用
CN108823327A (zh) 樟树全基因组ssr分子标记及其制备方法和应用
CN104152568B (zh) 高通量str序列核心重复数检测方法
CN113614832A (zh) 用于检测伴侣未知的基因融合的方法
CN105886497A (zh) 多态性短串联重复基因座等位基因梯、其制备方法、鉴定及应用
Kekeç et al. New generation genome sequencing methods
Ronaghi et al. Single nucleotide polymorphisms: discovery, detection and analysis
CN109852704B (zh) 一种同时检测32个y染色体基因座的复合扩增试剂盒
US20230203592A1 (en) Compositions and methods for characterizing bowel cancer
KR101967879B1 (ko) 핵산 서열분석에서 uid 핵산 서열의 순결도를 측정하는 방법
Udayaraja Personal diagnostics using DNA-sequencing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151216

RJ01 Rejection of invention patent application after publication