CN107944224B - 构建皮肤相关基因标准型别数据库的方法及应用 - Google Patents

构建皮肤相关基因标准型别数据库的方法及应用 Download PDF

Info

Publication number
CN107944224B
CN107944224B CN201711273051.1A CN201711273051A CN107944224B CN 107944224 B CN107944224 B CN 107944224B CN 201711273051 A CN201711273051 A CN 201711273051A CN 107944224 B CN107944224 B CN 107944224B
Authority
CN
China
Prior art keywords
skin
gene
sample
related gene
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711273051.1A
Other languages
English (en)
Other versions
CN107944224A (zh
Inventor
胡晶晶
刘忠军
陈祝
常雯婷
徐际超
许嘉祺
叶睿
杜乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Defurther Shanghai Biotechnology Co ltd
Inertia Biotechnology Co ltd
Original Assignee
Inertia Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inertia Biotechnology Co ltd filed Critical Inertia Biotechnology Co ltd
Priority to CN201711273051.1A priority Critical patent/CN107944224B/zh
Publication of CN107944224A publication Critical patent/CN107944224A/zh
Application granted granted Critical
Publication of CN107944224B publication Critical patent/CN107944224B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于基因检测技术领域,公开了一种构建皮肤相关基因标准型别数据库的方法及应用,包含:提取样本基因组DNA进行基因测序;对基因测序数据进行分析,得到样本基因型数据;整理公共基因数据库中皮肤相关基因位点并进行权重分配;将样本基因型数据与皮肤相关基因位点的权重分配数据比对,得到样本特有的皮肤相关基因信息;根据样本特有的皮肤相关基因信息建立打分模型,对基因位点突变导致的表型发生的概率进行打分;以基因型数据、样本特有的皮肤相关基因信息和基因位点突变导致的表型发生的概率分值,构建皮肤相关基因标准型别数据库。本发明所构建的数据库为皮肤基因研究奠定基础、促进个性化皮肤护理的发展。

Description

构建皮肤相关基因标准型别数据库的方法及应用
技术领域
本发明属于基因检测技术领域,特别涉及构建皮肤相关基因标准型别数据库的方法及应用。
背景技术
基因是指携带有遗传信息的脱氧核糖核酸或核糖核酸序列,也称为遗传因子,是控制性状的基本遗传单位。基因通过指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表现。高通量测序技术以其无以伦比的通量、扩展性和速度,让研究人员以前所未有的水平研究生物系统。
随着生物学研究的迅速发展,高通量测序技术已经成为一种常用技术,采用高通量测序技术,对生物的基因进行测序分析,已广泛应用于各种生命活动的研究工作中。高通量测序产出的海量数据,正在以几何级数增长,如何从这些数据中找到有用的信息,已经成为科研工作者面临的困扰。
由于高通量测序数据的不断增加,如何对这些数据进行深入有效的挖掘和管理,对于生物信息学工作者是一个极大的考验,特别是针对皮肤基因检测这个新兴的领域,更是加大了难度。
目前全世界范围内还没有专业的皮肤相关基因数据库,特别是中国人特有的皮肤相关基因数据库,目前全世界范围内的基因数据主要以欧美人群为主,辅以少量的亚洲人基因数据,这种现状对于中国的研究人员,特别是研究皮肤相关基因的科研人员来说,是极其不利的。通过构建中国人皮肤相关基因标准型别数据库,对基因测序得来的中国人特有的皮肤基因数据进行管理已经迫在眉睫。
发明内容
本发明的目的在于提供一种构建皮肤相关基因标准型别数据库的方法及其应用,并通过该方法构建首个中国人皮肤相关基因标准型别数据库,为后续的中国人皮肤相关基因研究奠定基础。
为解决上述技术问题,本发明的实施方式所提供的构建皮肤相关基因标准型别数据库的方法,其特征在于,包含下述步骤:
(1)提取样本基因组DNA,进行基因测序,得到样本基因测序数据;
(2)对所述基因测序数据进行数据分析,得到样本基因型数据;
(3)整理公共基因数据库中皮肤相关基因位点,并对所述皮肤相关基因位点进行权重分配,得到皮肤相关基因位点的权重分配数据;
(4)将所述样本基因型数据与所述皮肤相关基因位点的权重分配数据进行比对,得到样本特有的皮肤相关基因信息;
(5)根据所述样本特有的皮肤相关基因信息建立打分模型,对基因位点突变导致的表型发生的概率进行打分,得到基因位点突变导致的表型发生的概率分值;
(6)以所述样本基因型数据、所述样本特有的皮肤相关基因信息和所述基因位点突变导致的表型发生的概率分值,构建皮肤相关基因标准型别数据库。
相对于现有技术,本发明的实施方式所提供的构建皮肤相关基因标准型别数据库的方法,旨在用价格低廉的基因测序技术和数据分析技术,构建皮肤相关基因标准型别数据库,以所构建的皮肤相关基因标准型别数据库为皮肤基因研究奠定基础、并促进个性化皮肤护理的发展。
优选地,在本发明的实施方式所提供的构建皮肤相关基因标准型别数据库的方法中,步骤(1)中对样本基因组DNA进行测序的方法为SNP芯片测序。本发明通过快速价格低廉的SNP芯片高通量测序,以更低的价格和资金投入得到与新一代(NGS)测序技术同等的基因数据,直接捕获的是目标区域基因数据,相当于去除了无关的数据,使得得到的数据冗余度更少,这样即可节省数据分析时间,以及计算成本和人力成本,最终快速构建皮肤相关基因标准型别数据库。
优选地,本发明的实施方式所提供的构建皮肤相关基因标准型别数据库的方法中,步骤(2)中对所述基因测序数据进行数据分析的方法具体包括:(i)将所述基因测序数据导入BeadStudio芯片数据分析软件进行分析,得到样本的SNP分型数据;(ii)对所述样本的SNP分型数据进行过滤,去除低质量数据;(iii)进行数据质控,保证SNP位点检出率大于90%。
优选地,本发明的实施方式所提供的构建皮肤相关基因标准型别数据库的方法中,步骤(3)中所述的公共基因数据库包括SNPed i a、dbSNP、C l i nVar、1000G、HGMD、OMI M、bGaP中的至少一种。更进一步地,本发明的实施方式所提供的构建皮肤相关基因标准型别数据库的方法中,步骤(3)所述的皮肤相关基因位点优选包含选自C10orf71、FADS1、FADS2、FTH1、I L23R、JMJD1C、MC4R、PDXDC1、HLA-C、IL10、IL13、IL-18R、LOC643723、SELL、TRA、B4GALT1、BACH2、EXOC2、FUT8、GRM5、HERC2、I KZF1基因的至少一种。
优选地,步骤(3)中,对皮肤相关基因位点进行权重分配时的影响因素至少包含如下所述中的一种或几种:(a)所述位点是否有全基因组关联分析分类数据库重复实验;(b)所述位点是否与皮肤表观症状具有直接性状关联;(c)所述位点是否有湿实验位点验证;(d)所述位点所属个体的种族;(e)所述位点的皮肤相关论文发表的影响因子。上述权重分配的步骤校正了特殊位点对最后表型预测的概率的影响,有效地提高了预测的准确度。
具体地,本发明的实施方式所提供的构建皮肤相关基因标准型别数据库的方法中,步骤(5)中根据所述样本特有的皮肤相关基因信息建立打分模型的方法包括:单个突变位点算法模型和多个突变位点算法模型。
其中,所述的单个突变位点算法模型为:
Pr(D)=Pr(D|G1)Pr(G1)+Pr(D|G2)Pr(G2)+Pr(D|G3)Pr(G3)
Figure BDA0001495927250000041
Figure BDA0001495927250000042
其中,Pr(D)为单个位点突变导致的表型发生的概率;OR为比值比;Pr(G)为基因型频率;G1\G2\G3分别为三种基因型。
所述多个突变位点算法模型为:
Figure BDA0001495927250000043
Figure BDA0001495927250000044
Figure BDA0001495927250000045
其中,OR*m代表单个SNP的特定基因型的OR值,综合所有的变位点计算出ORc*值;
ORc*值为带有某些特定基因型组合表型特征的个体,其表型相较于该个体所在种群平均表型的比值,odds(D)通过Pr(D)求出;
Figure BDA0001495927250000046
为多个位点突变导致的表型发生的概率。
进一步地,本发明的实施方式也提供上述构建皮肤相关基因标准型别数据库的方法在皮肤个性化护理中的应用。
另外,本发明的实施方式还提供根据上述方法构建的中国人皮肤相关基因标准型别数据库。
附图说明
图1是本发明具体实施方式中的SNP芯片测序流程图;
图2是本发明具体实施方式中的数据分析流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。
1.基因组DNA提取与SNP芯片测序(SNP芯片测序流程参见附图1所示)
1.1口腔黏膜拭子DNA抽提
1.1.1取一支口腔黏膜拭子置于2mL的EP管中。
1.1.2依次加入750μl PBS、250μl BL、25μlPK,颠倒轻摇充分混匀,56℃放置30分钟,其间颠倒混匀3次。
1.1.3轻轻挑出棉签,加入450μl无水乙醇,剧烈颠倒轻摇,充分混匀。注:上述各操作步骤中适当力度充分混匀非常重要,混匀不充分严重降低产量,必要时如样品粘稠不易混匀时可以涡旋振荡15秒混匀,但不可用手剧烈振荡,以免剪切DNA。
1.1.4将上一步所得溶液分两次全部转入一个吸附柱中(吸附柱放入收集管中),12,000rpm离心60秒,倒掉收集管中的废液,将吸附柱放回收集管中。1.1.5向吸附柱中加入500μl KB Buffer,12,000rpm离心60秒,弃废液,将吸附柱放回收集管中。
1.1.6向吸附柱中加入500μl漂洗液Wash Buffer(请先检查是否已加入无水乙醇!),12,000rpm离心60秒,弃掉废液,将吸附柱放回收集管中。
1.1.7重复5.1.2.6操作一次。
1.1.8将吸附柱放回空收集管中,12,000rpm离心5分钟。
1.1.9取出吸附柱CB3,放入一个干净的离心管中,在吸附膜的中间部位加80-100μl洗脱缓冲液Elution Buffer(洗脱缓冲液事先在65-70℃水浴中预热),室温放置5分钟,12,000rpm离心2分钟。将得到的溶液重新加入离心吸附柱中,室温放置2分钟,12,000rpm离心2分钟。
注:洗脱体积越大,洗脱效率越高,如果需要DNA浓度较高,可以适当减少洗脱体积,但是最小体积不应少于80μl,体积过小降低DNA洗脱效率,减少DNA产量。
1.2采用biomate-3S检测DNA浓度.
DNA纯度:A 260/A 280的比值为1.7-1.9(DNA),A 260/A 230的比值大于2.0。按上述方法抽提200ul EDTA抗凝血液,最后的洗脱体积为100ul,得到的DNA浓度约为20-60ng/ul。
1.3SNP芯片测序
1.3.1测定DNA浓度,并统一标化成50ng/μL。进行Infinium
Figure BDA0001495927250000061
610-Quad Assay分析需要的DNA样本量为200ng。
1.3.2在样本中加入0.1N NaOH使DNA变性为单链,经中和后加入全基因组扩增试剂,在37℃恒温条件下过夜孵育,扩增后的DNA总量可达初始上样量的2000-3000倍。
1.3.3扩增后的产物,经过可控的且不需要凝胶电泳的酶解处理,成为片段化的DNA。该过程利用终点式(end-point)片段化方法,以防止样本的过度片段化。
1.3.4通过加入异丙醇沉淀DNA片段,片段化的DNA在4℃下离心富集,从而得以纯化。
1.3.5沉淀后的DNA在空气中干燥后,加入杂交缓冲试剂使DNA沉淀重新溶解。
1.3.6将重悬后的DNA样本与准备好的芯片杂交,置于杂交炉内反应过夜。在杂交过程中,片段化后的DNA经过变性,与位点特异的50个碱基退火,而这50个特异碱基连接在芯片的610,000种微珠(bead)中的一个上,一个微珠类型对应检测一个SNP或CNV位点。
1.3.7洗去未杂交的和非特异杂交的DNA,以便后续的染色和延伸。以捕获到的DNA为模板,在芯片上进行单碱基的延伸反应,在芯片上加上可检测的标签基团,从而区分样本的SNP类型。
包被芯片:将反应完成的芯片放入XC4试剂中,使其表面包裹上一层粘性透明液体,再将其放入真空环境下干燥1小时,从而将芯片包被,保护其信号稳定较长的时间。
1.3.8将处理好的芯片放入扫描仪中,利用激光激发芯片上单碱基延伸产物的荧光基团,扫描仪获取由荧光基团发出的荧光,并生成高分辨率的图片。由此所得的数据直接导入BeadStudio软件进行分析,从而就得到每个样本的SNP分型数据。
2数据分析(数据分析流程参见附图2所示)
2.1SNP芯片数据过滤,去掉低质量的数据。
2.2过滤后数据质控,保证SNP位点检出率大于90%,过滤后的数据为SNP数据,即基因型数据。
2.3对公共数据库中与皮肤相关的基因进行数据整合,公共数据库包括但不限于SNPedia、dbSNP、ClinVar、1000G、HGMD、OMIM、dbGaP;所述皮肤相关基因位点包含选自C10orf71、FADS1、FADS2、FTH1、IL23R、JMJD1C、MC4R、PDXDC1、HLA-C、IL10、IL13、IL-18R、LOC643723、SELL、TRA、B4GALT1、BACH2、EXOC2、FUT8、GRM5、HERC2、IKZF1基因的至少一种。
2.4根据以下影响因素对皮肤相关基因位点进行权重分配:
(a)所述位点是否有全基因组关联分析分类数据库重复实验:
权重+3:全基因组关联分析分类数据库,SNPedia数据库,或者文献中有重复实验,
权重+0:无重复。
(b)所述位点是否与皮肤表观症状具有直接性状关联:
权重+4分:有直接性状关联,直接性状关联指的是跟表观症状一致(如皱纹,痘痘,色斑,雀斑等),
权重+0分:间接从机制方面关联的性状(如胶原蛋白生成,油脂分泌等)或者无关联。
(c)所述位点是否有湿实验位点验证:
权重+5分:NCBI的SNP数据库中有sample ID,并且湿实验内容与皮肤机制或者功效原料相关,
权重+0分:NCBI的SNP数据库中没有Sample ID,或者湿实验内容与皮肤机制或者功效原料不相关。
(d)所述位点所属个体的种族:
权重+5分,位点所属个体为中国人,
权重+4分,位点所属个体为东亚人(包括、日本、韩国、朝鲜和蒙古共五个国家),
权重+3分,位点所属个体为亚洲人(见附录),
权重+2分,位点所属个体为其他种族。
(e)所述位点的皮肤相关论文发表的影响因子:
+2分,位点的皮肤相关论文发表在CNS上,
+1分,位点的皮肤相关论文发表在其他杂志上。
附录:
权重分配因素中的亚洲人包括:
东南亚:越南、老挝、柬埔寨、缅甸、泰国、马来西亚、新加坡、印度尼西亚、菲律宾、文莱、东帝汶等国家和地区;
南亚:包括斯里兰卡、马尔代夫、巴基斯坦、印度、孟加拉国、尼泊尔、不丹;
西亚:包括伊朗、土耳其、塞浦路斯、叙利亚、黎巴嫩、巴勒斯坦、以色列、约旦、伊拉克、科威特、沙特阿拉伯、也门、阿曼、阿拉伯联合酋长国、卡塔尔、巴林、格鲁吉亚、亚美尼亚和阿塞拜疆;
中亚:包括土库曼斯坦、乌兹别克斯坦、吉尔吉斯斯坦、塔吉克斯坦、哈萨克斯坦和阿富汗斯坦;北亚:包括土库曼斯坦、乌兹别克斯坦、吉尔吉斯斯坦、塔吉克斯坦、哈萨克斯坦和阿富汗斯坦)
2.5将样本基因型数据与皮肤相关基因位点的权重分配数据进行比对,得到样本特有的皮肤相关基因信息;。
下表1和下表2分别为对公共数据库数据中与皮肤相关的基因进行整合后,得到的皮肤美白相关基因位点数据库和皮肤痘痘相关基因位点数据库。(其中,MAF为位点人群频率,Risk Allele为高风险基因型,allele2为较低风险基因型,SNPs为基因位点名称,Weight为基因位点的权重,mean为一种位点均一化值,cov为另一种位点均一化值,Gene_name为位点所属基因,YN_ID为申请人设置的ID。)
表1皮肤美白相关基因位点数据库
Figure BDA0001495927250000101
2.6找到样本特有的皮肤相关基因信息。
经过1500份中国人基因检测,建立了小型中国人皮肤基因数据,数据库部分原型详见下表2所示:
表2中国人皮肤美白相关位点信息数据库
Figure BDA0001495927250000102
Figure BDA0001495927250000111
2.7通过找到的信息建立打分模型,对现有数据进行打分。
2.7.1单个突变位点算法模型
对于单个突变位点导致的表型,基于该表型在人群或种族中的表型比率以及突变位点在人群或种族中的基因型频率,可直接计算该突变导致的表型。
Pr(D)=Pr(D|G1)Pr(G1)+Pr(D|G2)Pr(G2)+Pr(D|G3)Pr(G3)
Figure BDA0001495927250000112
Figure BDA0001495927250000113
其中,Pr(D)为单个位点突变导致的表型发生的概率,OR为比值比,Pr(G)为基因型频率;
G1\G2\G3分别为三种基因型。
具体来说,OR值的全称是odd ratio,又称比值比,对于发病率很低的疾病来说,OR值即是相对危险度的精确估计值。logistic回归中,OR值是衡量某个因素的危险性:
OR值=1,表示该因素对疾病的发生不起作用;
OR值>1,表示该因素是危险因素;
OR值<1,表示该因素是保护因素。
2.7.2多个突变位点算法模型
Figure BDA0001495927250000114
Figure BDA0001495927250000115
Figure BDA0001495927250000116
其中,OR*m代表单个SNP的特定基因型的OR值,综合所有的变位点计算出ORc*值;
ORc*值为带有某些特定基因型组合表型特征的个体,其表型相较于该个体所在种群平均表型的比值,odds(D)通过Pr(D)求出;
Figure BDA0001495927250000121
为多个位点突变导致的表型发生的概率。
2.8将最终的基因型、打分、基因型信息存入mysql数据库。下表3为中国人皮肤美白相关样本打分数据库。
表3中国人皮肤美白相关样本打分数据库
id sample_id score type create_time
1 3844928 62 0 2017/9/27 15:56
2 3844966 58 0 2017/9/27 15:56
3 HCB800000010769 66 0 2017/9/27 15:56
4 3673286 74 0 2017/9/27 15:57
5 HCB800000010766 66 0 2017/9/27 15:57
6 3850150 66 0 2017/9/27 15:57
7 3850870 66 0 2017/9/27 15:57
8 20173311 66 0 2017/9/27 15:57
9 20160769 86 0 2017/9/27 15:57
以上表2和表3为根据本专利方法建立的中国人皮肤基因相关数据库,目前已建立了1500人的中国人相关基因标准型别数据库,随着样本量的增大,该数据库将会越来越完善,最终将构建中国首个大型中国人皮肤相关基因标准型别数据库。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (10)

1.构建皮肤相关基因标准型别数据库的方法,其特征在于,包含下述步骤:
(1)提取样本基因组DNA,进行基因测序,得到样本基因测序数据;
(2)对所述基因测序数据进行数据分析,得到样本基因型数据;
(3)整理公共基因数据库中皮肤相关基因位点,并对所述皮肤相关基因位点进行权重分配,得到皮肤相关基因位点的权重分配数据;
(4)将所述样本基因型数据与所述皮肤相关基因位点的权重分配数据进行比对,得到样本特有的皮肤相关基因信息;
(5)根据所述样本特有的皮肤相关基因信息建立打分模型,对基因位点突变导致的表型发生的概率进行打分,得到基因位点突变导致的表型发生的概率分值;
(6)以所述样本基因型数据、所述样本特有的皮肤相关基因信息和所述基因位点突变导致的表型发生的概率分值,构建皮肤相关基因标准型别数据库。
2.根据权利要求1所述的构建皮肤相关基因标准型别数据库的方法,其特征在于,步骤(1)中,对所述样本基因组DNA进行测序的方法为SNP芯片测序。
3.根据权利要求1所述的构建皮肤相关基因标准型别数据库的方法,其特征在于,步骤(2)中,对所述基因测序数据进行数据分析的方法包括:
(i)将所述基因测序数据导入BeadStudio芯片数据分析软件进行分析,得到样本的SNP分型数据;
(ii)对所述样本的SNP分型数据进行过滤,去除低质量数据;
(iii)进行数据质控,保证SNP位点检出率大于90%。
4.根据权利要求1所述的构建皮肤相关基因标准型别数据库的方法,其特征在于,步骤(3)中所述的公共基因数据库包括SNPedia、dbSNP、ClinVar、1000G、HGMD、OMIM、dbGaP中的至少一种;所述皮肤相关基因位点包含选自C10orf71、FADS1、FADS2、FTH1、IL23R、JMJD1C、MC4R、PDXDC1、HLA-C、IL10、IL13、IL-18R、LOC643723、SELL、TRA、B4GALT1、BACH2、EXOC2、FUT8、GRM5、HERC2、IKZF1基因的至少一种。
5.根据权利要求4所述的构建皮肤相关基因标准型别数据库的方法,其特征在于,步骤(3)中,对皮肤相关基因位点进行权重分配时的影响因素至少包含如下所述中的一种或几种:
(a)所述位点是否有全基因组关联分析分类数据库重复实验;
(b)所述位点是否与皮肤表观症状具有直接性状关联;
(c)所述位点是否有湿实验位点验证;
(d)所述位点所属个体的种族;
(e)所述位点的皮肤相关论文发表的影响因子。
6.根据权利要求1所述的构建皮肤相关基因标准型别数据库的方法,其特征在于,步骤(5)中,根据所述样本特有的皮肤相关基因信息建立打分模型的方法包括:单个位点突变算法模型和多个位点突变算法模型。
7.根据权利要求6所述的构建皮肤相关基因标准型别数据库的方法,其特征在于,所述单个位点突变算法模型为:
Pr(D)=Pr(D|G1)Pr(G1)+Pr(D|G2)Pr(G2)+Pr(D|G3)Pr(G3)
Figure FDA0001495927240000021
Figure FDA0001495927240000022
其中,Pr(D)为单个位点突变导致的表型发生的概率;OR为比值比;Pr(G)为基因型频率;G1\G2\G3分别为三种基因型。
8.根据权利要求6所述的构建皮肤相关基因标准型别数据库的方法,其特征在于,所述多个位点突变算法模型为:
Figure FDA0001495927240000031
Figure FDA0001495927240000032
Figure FDA0001495927240000033
其中,OR*m代表单个SNP的特定基因型的OR值,综合所有的突变位点计算出ORc*值;ORc*值为带有某些特定基因型组合表型特征的个体,其表型相较于该个体所在种群平均表型的比值,odds(D)通过Pr(D)求出;
Figure FDA0001495927240000034
即为多个位点突变导致的表型发生的概率。
9.权利要求1至8中任一项所述的构建皮肤相关基因标准型别数据库的方法在皮肤个性化护理中的应用。
10.采用权利要求1至8中任一项所述方法构建的中国人皮肤相关基因标准型别数据库。
CN201711273051.1A 2017-12-06 2017-12-06 构建皮肤相关基因标准型别数据库的方法及应用 Active CN107944224B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711273051.1A CN107944224B (zh) 2017-12-06 2017-12-06 构建皮肤相关基因标准型别数据库的方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711273051.1A CN107944224B (zh) 2017-12-06 2017-12-06 构建皮肤相关基因标准型别数据库的方法及应用

Publications (2)

Publication Number Publication Date
CN107944224A CN107944224A (zh) 2018-04-20
CN107944224B true CN107944224B (zh) 2021-04-13

Family

ID=61944870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711273051.1A Active CN107944224B (zh) 2017-12-06 2017-12-06 构建皮肤相关基因标准型别数据库的方法及应用

Country Status (1)

Country Link
CN (1) CN107944224B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108950013A (zh) * 2018-07-27 2018-12-07 江颖纯 一种皮肤相关基因位点库及其构建方法和应用
CN112795647B (zh) * 2019-11-14 2022-08-16 北京肿瘤医院(北京大学肿瘤医院) 一种肿瘤标志物及其应用
CN113314186A (zh) * 2021-07-06 2021-08-27 广州润孚创新科技有限公司 一种皮肤衰老基因信息检测及深度临床分析方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198236A (zh) * 2012-01-06 2013-07-10 深圳华大基因科技有限公司 Cyp450基因型别数据库及基因分型、酶活性鉴定方法
CN103198238A (zh) * 2012-01-06 2013-07-10 深圳华大基因科技有限公司 药物相关基因型别数据库、基因分型及药物反应检测
CN103221551A (zh) * 2010-11-23 2013-07-24 深圳华大基因科技有限公司 Hla基因型别-snp连锁数据库、其构建方法、以及hla分型方法
CN103329138A (zh) * 2011-01-19 2013-09-25 皇家飞利浦电子股份有限公司 用于处理基因组数据的方法
CN105408909A (zh) * 2013-07-09 2016-03-16 莱克斯奥根有限公司 转录本确定方法
CN105567822A (zh) * 2016-01-13 2016-05-11 深圳瑞奥康晨生物科技有限公司 一种用于肺癌风险预测的基因检测引物组和试剂盒
CN105886646A (zh) * 2016-05-27 2016-08-24 福建爱我健康生物科技有限公司 一种用于评估皮肤防晒情况的引物和探针及试剂盒
CN107345248A (zh) * 2017-06-26 2017-11-14 思畅信息科技(上海)有限公司 基于大数据的基因与位点风险评估方法及其系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103221551A (zh) * 2010-11-23 2013-07-24 深圳华大基因科技有限公司 Hla基因型别-snp连锁数据库、其构建方法、以及hla分型方法
CN103329138A (zh) * 2011-01-19 2013-09-25 皇家飞利浦电子股份有限公司 用于处理基因组数据的方法
CN103198236A (zh) * 2012-01-06 2013-07-10 深圳华大基因科技有限公司 Cyp450基因型别数据库及基因分型、酶活性鉴定方法
CN103198238A (zh) * 2012-01-06 2013-07-10 深圳华大基因科技有限公司 药物相关基因型别数据库、基因分型及药物反应检测
CN105408909A (zh) * 2013-07-09 2016-03-16 莱克斯奥根有限公司 转录本确定方法
CN105567822A (zh) * 2016-01-13 2016-05-11 深圳瑞奥康晨生物科技有限公司 一种用于肺癌风险预测的基因检测引物组和试剂盒
CN105886646A (zh) * 2016-05-27 2016-08-24 福建爱我健康生物科技有限公司 一种用于评估皮肤防晒情况的引物和探针及试剂盒
CN107345248A (zh) * 2017-06-26 2017-11-14 思畅信息科技(上海)有限公司 基于大数据的基因与位点风险评估方法及其系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"以鼠疫菌为模型的重要致病菌基因组多态性数据库的构建及应用研究";颜焱锋;《中国博士学位论文全文数据库 信息科技辑》;20150115;第I138-14页 *
"鼠疫耶尔森氏菌基因组多态性研究及快速鉴定溯源系统的建立";李艳君;《中国博士学位论文全文数据库 医药卫生科技辑》;20090915;第E059-18页 *

Also Published As

Publication number Publication date
CN107944224A (zh) 2018-04-20

Similar Documents

Publication Publication Date Title
CN107077537B (zh) 用短读测序数据检测重复扩增
KR102049191B1 (ko) 카피수 변이를 판정하기 위한 dna 단편 크기의 사용
CN107750277B (zh) 使用无细胞dna片段大小来确定拷贝数变化
CN108138227B (zh) 使用具有独特分子索引(umi)的冗余读段在测序dna片段中抑制误差
CN107708556B (zh) 诊断方法
CN106319047B (zh) 使用多态计数来解析基因组分数
CN107944224B (zh) 构建皮肤相关基因标准型别数据库的方法及应用
WO2013149385A1 (zh) 一种拷贝数变异检测方法和系统
CN108220403B (zh) 特定突变位点的检测方法、检测装置、存储介质及处理器
US10851414B2 (en) Methods for determining carrier status
JP2022514879A (ja) 無細胞dna末端特性
WO2014023076A1 (zh) 一种地中海贫血的分型方法及其应用
CN115989544A (zh) 用于在基因组的重复区域中可视化短读段的方法和系统
US11739374B2 (en) Methods and compositions for pathogen detection in plants
CN112195238B (zh) 一种扩增pkd1基因的引物组及试剂盒
JP2017528136A (ja) 異なる種属の微生物間の種類と存在比を比較するための人工外来性参照分子
CN110592185A (zh) 一种高胆固醇血症致病基因筛查探针设计方法及其基因芯片
CN112538524A (zh) 用于检测与耳聋相关的基因snp的检测产品
CN112760365B (zh) 一种适用于产前无创的poag基因检测试剂盒及其检测方法
CN114507707B (zh) 一种富集目标区域再酶切构建单倍型的方法
CN114606341B (zh) 希尔斯山羊草基于基因组重测序SNP的dCAPS分子标记及应用
JP7099984B2 (ja) 白内障のリスクを判定する方法
KR101899235B1 (ko) 한국인의 주의력결핍 과잉행동장애 진단을 위한 프라이머 세트, 이를 포함하는 진단용 키트, 및 이를 이용한 한국인의 주의력결핍 과잉행동장애 위험도 예측 방법
CN105671186B (zh) 用于评估人数学能力的基因以及检测试剂盒和检测方法
CN117721215A (zh) 一种用于选育青海藏羊毛色品系的试剂盒和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220829

Address after: Room 808, 818 Nanjing West Road, Jing'an District, Shanghai 200041

Patentee after: INERTIA BIOTECHNOLOGY CO.,LTD.

Patentee after: DeFurther (Shanghai) Biotechnology Co.,Ltd.

Address before: 201414 room 0944, building 3, 368 Qinggao Road, Fengxian District, Shanghai

Patentee before: INERTIA BIOTECHNOLOGY CO.,LTD.