CN112397200B

CN112397200B - 一种非综合征型唇腭裂遗传风险预测模型

Info

Publication number: CN112397200B
Application number: CN202011411075.0A
Authority: CN
Inventors: 孙文靖; 贾学渊; 司书涵; 焦晓辉; 宋红权; 雷常贵; 张学龙
Original assignee: Harbin Medical University
Current assignee: Harbin Medical University
Priority date: 2020-12-04
Filing date: 2020-12-04
Publication date: 2023-12-19
Anticipated expiration: 2040-12-04
Also published as: CN112397200A

Abstract

本发明公开了一种非综合征型唇腭裂遗传风险预测模型，其公式为：式中，k为SNP位点的个数；Gi表示第i个SNP位点遗传风险等位基因的个数，即为0，1，2；βi表示第i个SNP位点的权重；SNP为rs139860270、rs1883873、rs139530062、rs144415105、rs55816698、rs139860270、rs6989548、rs12952376。本发明的遗传风险评分模型将8个SNPs的微弱效应进行叠加，大大提高了对非综合征唇腭裂遗传风险的预测。本发明首次提出遗传风险评分模型评估对非综合征唇腭裂的遗风险能力。该模型准确性强，可以为我国的唇腭裂的风险评估及防控提供更加全面、准确、个体化的科学依据。

Description

一种非综合征型唇腭裂遗传风险预测模型

技术领域

本发明属于遗传病诊断技术领域，涉及一种与非综合征型唇腭相关的加权遗传风险预测模型。

背景技术

先天性唇腭裂是一种常见的出生缺陷，主要分为综合征型唇腭裂和非综合征型唇腭裂，发病率约为1/700。唇腭裂患者主要变现为单纯唇裂、单纯腭裂以及唇腭裂，患有综合征型唇腭裂的患者往往还伴随着其他方面的缺陷，比如：脑部结构畸形等。唇腭裂患者出生时，往往会出现进食困难等问题，而且随着时间的推移，唇腭裂患者还可能出现语言障碍，听力丧失等症状。即使通过手术治愈，唇腭裂患者还可能产生一些心理上的问题，为个人和家庭带来沉重的负担。

先天性唇腭裂的发病受环境和遗传的共同影响。母体在妊娠期间吸烟、饮酒或者缺乏叶酸均有可能造成胎儿唇腭裂的发生，另外，孕妇在工作生活环境中是否暴露于有毒物质中也有可能导致胎儿唇腭裂畸形。人们通过对唇腭裂家系的研究发现唇腭裂的发病具有家族聚集性，患者的家属经常伴有唇腭裂或者其他畸形，提示唇腭裂的发生受遗传因素的影响。通过家系分析，相关动物模型的构建，人们确定了一些唇腭裂的致病基因，但大多数的唇腭裂致病基因仍旧未被发现。利用GWAS、关联分析、meta分析等手段，人们锁定了一系列唇腭裂候选致病基因以及易感位点，亟需通过实验等方式进行验证。

风险评分(risk score)是流行病学研究中评价风险预测能力的重要方法之一，纳入遗传易感因素进行风险评分，从而评价遗传易感因素在风险预测模型中的效果的方法称为遗传风险评分(genetic risk score,GRS)。GRS能整合多个SNPs的综合信息来评价基因序列变异和疾病之间的联系，将每个SNPs的微弱效应进行叠加，大大提高了对疾病风险的预测。纳入遗传风险位点构建GRS模型，是评估非综合征唇腭裂遗传风险的有效手段。

然而，目前尚未见GRS模型应用于非综合征唇腭裂的遗传风险预测的研究报道。若能筛选出与非综合征唇腭裂发生密切相关的风险位点，构建GRS风险预测模型，可为我国的唇腭裂的风险评估及防控提供更加全面、准确、个体化的科学依据。

发明内容

本发明的目的是提供一种非综合征型唇腭裂遗传风险预测模型，为我国的唇腭裂的风险评估及防控提供更加全面、准确、个体化的科学依据。

本发明的目的是通过以下技术方案实现的：

一种非综合征型唇腭裂遗传风险预测模型，其公式为：

式中，k为SNP位点的个数；Gi表示第i个SNP位点遗传风险等位基因的个数，即为0，1，2；βi表示第i个SNP位点的权重；SNP为rs139860270、rs1883873、rs139530062、rs144415105、rs55816698、rs139860270、rs6989548、rs12952376。

一种上述非综合征型唇腭裂遗传风险预测模型的构建方法，包括如下步骤：

步骤一、唇腭裂样本采集

按照知情同意的原则，针对非综合征型唇腭裂患者及健康对照个体进行外周血样本的收集以及基本信息及临床资料整理；

步骤二、样本全外显子组及全基因组测序

对非综合征型唇腭裂患者进行全外显子组测序，对健康对照个体的外周血样本进行全基因组测序；

步骤三、非综合征型唇腭裂患者全外显子组数据的处理和分析

(1)突变位点的筛选：去除人群数据库频率较高的变异位点，去除病例样本中频率大于10％的变异位点；

(2)获取与唇腭裂相关基因：在NCBI Pubmed数据库和STRING数据库获得与唇腭裂相关基因；

(3)SKAT关联分析：筛选低频变异与唇腭裂表型相关的基因；

步骤四、唇腭裂遗传风险预测模型构建

(1)关联分析：将步骤三交集的唇腭裂候选基因的SNPs位点进行与唇腭裂易感性的关联分析；

(2)遗传风险预测模型构建：关联分析保留的SNP用于构建加权遗传风险预测模型。

相比于现有技术，本发明具有如下优点：

1、遗传风险评分模型将8个SNPs的微弱效应进行叠加，大大提高了对非综合征唇腭裂遗传风险的预测。

2、首次提出遗传风险评分模型评估对非综合征唇腭裂的遗风险能力。该模型准确性强，可以为我国的唇腭裂的风险评估及防控提供更加全面、准确、个体化的科学依据。

附图说明

图1为SKAT全基因组关联分析结果，A：曼哈顿图；B：Q-Q图；

图2为18个交集基因；

图3为遗传风险模型(wGRS)评分箱式图；

图4为遗传风险模型(wGRS)受试者工作曲线(ROC)及曲线下面积(AUC)图。

具体实施方式

下面结合附图对本发明的技术方案作进一步的说明，但并不局限于此，凡是对本发明技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，均应涵盖在本发明的保护范围中。

本发明提供了一种非综合征型唇腭裂遗传风险预测模型，其公式为：

一种上述非综合征型唇腭裂遗传风险预测模型的构建方法，通过围绕非综合征型唇腭裂患者基因测序结果，寻找新的可能的唇腭裂致病基因；剔除北方人群的背景变异位点，利用STRING数据库，通过已知的“唇腭裂相关基因”，确定蛋白互作网络，结合SKAT关联分析，确定唇腭裂的候选基因；利用唇腭裂的候选基因所对应的SNPS构建遗传风险预测模型。具体包括如下步骤：

1、唇腭裂样本采集

与临床医院合作，按照知情同意的原则，针对非综合征型唇腭裂患者、及健康对照个体进行外周血样本的收集，以及基本信息及临床资料整理。

2、样本全外显子组及全基因组测序

非综合征型唇腭裂患者送至北京诺禾致源有限公司进行全外显子组测序；健康对照个体的外周血样本送至北京诺禾致源有限公司进行全基因组测序。每个样本建立DNA文库需要1.0ug优质基因组DNA，这些基因组DNA会被随机片段化为180 280bp的DNA片段。在确定这些DNA片段的大小分布和浓度后，DNA文库用Illumina Hiseq 4000测序。

3、非综合征型唇腭裂患者全外显子组数据的处理和分析

(1)突变位点的筛选：去除人群数据库频率较高的变异位点；去除病例样本中频率大于10％的变异位点。

(2)获取与唇腭裂相关基因：在NCBI Pubmed数据库和STRING数据库获得与唇腭裂相关基因。

(3)SKAT关联分析：筛选低频变异与唇腭裂表型相关的基因。

4、唇腭裂遗传风险预测模型构建

(1)关联分析：将上述步骤3交集的唇腭裂候选基因的SNPs位点进行与唇腭裂易感性的关联分析。

(2)遗传风险预测模型构建：关联分析保留的SNP用于构建加权遗传风险预测模型(wGRS)，并利用箱式图和受试者工作特征曲线(ROC)曲线下的面积(AUC)判断模型的预测能力。

通过上述研究分析，本发明确认了18个唇腭裂候选致病基因包括RYK、FGFRL、OSR2、SNAII、BMPI、PRKRA、TBX18、EIF2AK2、TTC30A、RHOA、SQLE、SOX6、KRT4、SMAD6、TOP2A、KCTD2、WNK4、RGM4。

进一步提出由8个SNP(rs139860270、rs1883873、rs139530062、rs144415105、rs55816698、rs139860270、rs6989548、rs12952376)构建的wGRS。该模型在病例和对照组中评分存在差异，通过观察分组情况，唇腭裂的患病风险均会随着评分的增加而提高。

实施例：

本实施例按照如下步骤构建非综合征型唇腭裂遗传风险预测模型：

1、唇腭裂样本采集通过哈尔滨医科大学伦理委员会共纳入71例非综合征型唇腭裂患者和67例健康对照个体，以及33例不包含与发育相关疾病的个体。健康对照个体均没有与发育相关的疾病。所有纳入研究的个体均源自中国北方地区。所有研究对象均采集外周血样本，均已签署知情同意书。

2、样本全外显子组及全基因组测序

71例非综合征型唇腭裂患者以及33例不包含与发有相关疾病的个体的外周血样本送至北京诺禾致源有限公司进行全外显子组测序；67例健康对照个体中50例个体的外周血样本送至北京诺禾致源有限公司进行全基因组测序，17例个体的外周血样本送至北京诺禾致源有限公司进行全外显子组测序。每个样本建立DNA文库需要1.0μg优质基因组DNA，这些基因组DNA会被随机片段化为180～280bp的DNA片段。在确定这些DNA片段的大小分布和浓度后，DNA文库用Illumina Hiseq 4000测序。

3、非综合征型唇腭裂患者全外显子组数据的处理和分析

对51例非综合征型唇腭裂患者外周血样本全外显子组测序获得每例样本的SNP/SNV数据。①去除在人群数据库中频率大于0.05的变异位点，获得3426个基因；去除病例样本中频率大于10％的变异位点，获得3320个基因；去除对照组中频率大于10％的变异位点，获得3302个基因。②在NCBI Pubmed数据库中检索关键词“craniofacial cleft”，唇腭裂文献及动物模型，获得105个唇腭裂相关基因。通过STRING数据库的蛋白网络寻找与这105个唇腭裂相关基因表达蛋白存在功能关联的蛋白，其对应基因命名为一级基因。每个唇腭裂相关基因对应5～11个一级基因，共获得875个一级基因。③针对测序数据使用PLINK和R语言去除遗传变异MAF>0.05的位点，获得74944个低频变异位点，进行基于基因的SKAT全基因组关联分析，如图1所示。纳入低频变异分析的基因有20258个，其中有607个基因的P值小于0.05。

将步骤①中遗传背景筛选的3302个基因，步骤②中105个唇腭裂相关基因和STRING筛选的875个一级基因，和步骤③中SKAT全基因组关联分析获得P值小于0.05的607个基因取交集进行联合筛选。获得两个已报道唇腭裂相关基因RYK和FGFR1；另获得16个一级基因，为本研究唇腭裂候选致病基因，如图2所示。

4、唇腭裂遗传风险预测模型构建

为了确认上述18个唇腭裂候选致病基因在71例非综合征型唇腭裂患者中所测得的SNPs位点与唇腭裂易感性的关联，我们对这18个基因对应的695个SNPs在71例非综合征型唇腭裂患者和67例健康个体的对照组中进行了关联分析。我们剔除最小等位基因频率(minor allele frequency，MAF)小于0.01的SNPs，剔除不满足哈迪温伯格平衡的SNPs(P<0.001)，剔除连锁不平衡的SNPs，保留P<0.05的SNPs，共获得8个SNPs纳入遗传风险预测模型中，如表1所示。

表1遗传风险预测模型中包含的SNPs

用上述获得的8个SNPs建立wGRS。wGRS是8个SNPs位点的基因型加权(如表1所示)后相加所得，野生型的权重为0，杂合突变型和纯和突变型的权重基于Logistic回归分析得来。若该位点的基因型为野生型，则该位点的评分记为0×0＝0；若该位点的基因型为杂合突变型，则该位点的评分记为1×杂合突变型的权重；若该位点的基因型为纯和突变型，则该位点的评分记为2×纯和突变型的权重。对wGRS进行评估绘制箱式图，如图3所示。wGRS中对照组的评分集中在50～60之间，中位数为53.20；病例组的评分集中在60左右，中位数为60.04；病例组的评分明显高于对照组的评分(P<0.001)。为了检验遗传风险预测模型的效力，将wGRS进行分组，取wGRS评分的四分位点为界限，将病例和对照个体分为4组：0(<Q25)，1(Q25～Q50)，2(Q50～Q75)，3(>Q75)。以评分最低的一组为参照，将其OR值设为1。wGRS的后三组与参照组相比，唇腭裂发病风险均有明显的上升。wGRS的后三组患唇腭裂风险是wGRS：0(<Q25)组的2.78、8以及24倍。wGRS的趋势性P值为0.000006，表示趋势分析有统计学意义。唇腭裂患病风险会随着wGRS和评分的增加而升高，如表2所示。使用ROC曲线以及曲线下面积(AUC)评价wGRS的预测能力。如图4所示，wGRS的曲线下面积(AUC)为0.795，表示wGRS有一定准确性。

表2遗传风险预测模型的分组

Claims

1.一种非综合征型唇腭裂遗传风险预测模型的构建方法，其特征在于包括如下步骤：

步骤一、唇腭裂样本采集

步骤二、样本全外显子组及全基因组测序

(3)SKAT关联分析：筛选低频变异与唇腭裂表型相关的基因；

步骤四、唇腭裂遗传风险预测模型构建

(2)遗传风险预测模型构建：关联分析保留的SNP用于构建加权遗传风险预测模型；

所述预测模型的公式为：

式中，k为SNP位点的个数；Gi表示第i个SNP位点遗传风险等位基因的个数，即为0，1，2；βi表示第i个SNP位点的权重；

所述SNP为rs139860270、rs1883873、rs139530062、rs144415105、rs55816698、rs139860270、rs6989548、rs12952376。