CN110923310B - 用于指导肾病综合征cyp3a5表达型患儿使用他克莫司的多态性位点 - Google Patents
用于指导肾病综合征cyp3a5表达型患儿使用他克莫司的多态性位点 Download PDFInfo
- Publication number
- CN110923310B CN110923310B CN201911347453.0A CN201911347453A CN110923310B CN 110923310 B CN110923310 B CN 110923310B CN 201911347453 A CN201911347453 A CN 201911347453A CN 110923310 B CN110923310 B CN 110923310B
- Authority
- CN
- China
- Prior art keywords
- nephrotic syndrome
- tacrolimus
- patient
- genotype
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/172—Haplotypes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及生物医学领域,具体而言,用于指导肾病综合征CYP3A5表达型患儿使用他克莫司的多态性位点。所多态性位点为MAP3K11rs7946115、MYH9rs2239781以及CTLA4rs4553808位点中的至少一种。中三个位点与肾病综合征CYP3A5表达型患儿的他克莫司药动学密切相关,且其检测属于外周血指标,可方便获取,方便将来推广使用。
Description
技术领域
本发明涉及生物医学领域,具体而言,涉及用于指导肾病综合征CYP3A5表达型患儿使用他克莫司的多态性位点。
背景技术
他克莫司(FK506)是治疗儿童难治性肾病综合征的一线治疗药物。但是该药治疗窗窄(血药谷浓度需要控制在5~10ng/mL)、药动学个体差异大(口服生物利用度约为3%~77%,儿童半衰期约为8h~16.8h),给药剂量难以把握,一直是困扰FK506临床用药的关键问题。临床医生往往需要进行1~3个月的“试错型”摸索,才能使患儿的FK506谷浓度达到合适的治疗范围内,患儿的疗效才能得到保障。而在如此长的时间内,患儿可能延误治疗导致肾脏的进一步损害,甚至可能出现重症感染、肾衰等严重并发症,并蒙受经济、身体、精神损失。因此,找出影响FK506药动学个体差异大的真正原因,挖掘能够准确预测FK506稳态血药浓度的生物标志物,建立FK506的前瞻性浓度预测模型,做到患者给药前就明确合适的初始剂量,是实现FK506个体化给药急需解决的关键问题。
药物药动学个体差异产生的重要原因是编码相关药物代谢酶、转运体、药物靶点及相关表达调控因子的基因出现多态性所致。目前,国内外有关FK506个体化用药研究主要集中在器官、血液移植人群的药物代谢酶(CYP3A)、转运体(MDR1编码的P-gp)的基因多态性上。而对肾病综合征人群的研究很少,仅仅涉及到FK506的代谢酶编码基因CYP3A5*3、转运体编码基因MDR1 C3435T、MDR1 1236C>T、MDR12677 G>T/A等几个SNPs。而目前文献一致公认、且也获得器官移植指南推荐的仅是CYP3A5*3会显著影响FK506的血药浓度,其他SNPs对FK506的药动学的影响仍存在争议。而通过上述有限的几个SNPs并不能充分解释FK506的药动学个体差异。另外,肾病综合征是肾小球滤过膜通透性增加,血液中蛋白从尿中丢失从而导致血浆白蛋白降低、尿蛋白升高的综合征。而FK506是蛋白结合率约为99%的药物。因此,FK506在肾综人群中的药动学行为势必与健康人群、器官移植人群不同,FK506可能与血浆蛋白结合从损伤的肾小球滤过膜漏到尿液中,从而显著的改变了自身的药动学过程。那么肾小球滤过膜上相关蛋白的编码基因多态性是否会影响FK506的药动学呢?目前有文献报道了肾脏足细胞NPHS2 R229Q多态性可能影响FK506的血药浓度。而尚未见肾小球其他足细胞相关蛋白编码基因多态性影响FK506的药动学的研究报道,也未见报道FK506代谢酶、转运体、靶蛋白的相关转录调控因子、炎症细胞因子的编码基因多态性对肾综患儿的FK506浓度的影响。因此,有必要挖掘上述SNPs对FK506血药浓度的影响,充分明确FK506药动学个体差异大的原因。
找到可能影响FK506血药浓度的生物标志物后,建立浓度预测模型,才能给医生、药师提供一种可靠、方便的用药决策支持。目前,国内外相关研究大多仍采用传统分析方法如多重线性回归建立浓度模型,但传统方法对于多维度复杂变量模型的拟合欠佳、模型泛化性差等。仅有的群体药动学模型纳入的影响因素太少,仅仅纳入了年龄、体重及一个药动学位点(CYP3A5*3),不足以解释实际临床浓度的个体差异。已有研究只用了传统的统计方法逻辑回归法来分析建模,而该方法不适用于一些复杂、多维、有相互作用的变量的建模,因而得到的模型拟合性能较差,存在欠拟合或过拟合的现象。此外群体药动学必须采集多个时间点的血标本,才能建立性能较佳的模型。这些临床结果或模型泛化性能差,难以推广。
故而通过现有技术难以分析得到哪些基因多态性位点是主要影响FK506药物给药剂量的位点,进而无法给出准确的用药指导建议。
发明内容
传统的统计方法逻辑回归法来分析建模,而该方法不适用于一些复杂、多维、有相互作用的变量的建模。本发明首次采用机器学习算法建立并验证他克莫司稳定期稳态血药谷浓度的预测模型,该机器学习算法对数据进行更为合理的预处理和重要性排序,有效降低数据噪音;并且针对不同数据的特点将多种建模方法进行比对分析,从而找出在训练数据上表现优异(例如trainning error足够小,且模型的VC维低、自由度适中)的机器学习模型。通过该方法,本发明首次能够对莫司药动学数据进行大规模复杂数据的高通量分析,并针对CYP3A5不同表达类型更为灵活、更有针对性地调整学习模型,从而首次实现较全面、精准地分析中国肾病综合征患儿的他克莫司药动学通路蛋白、药效学通路蛋白、肾病相关蛋白、转录调控因子等相关编码基因多态性与他克莫司稳定期血药谷浓度间的相关性,进而提供了一种肾病综合征CYP3A5表达型患儿使用他克莫司的客观用药指导方法。
具体的,本发明涉及MAP3K11 rs7946115、MYH9 rs2239781以及CTLA4 rs4553808位点中的至少一种的检测剂在制备用于肾病综合征CYP3A5表达型患儿使用他克莫司的用药指导试剂盒中的应用。
MAP3K11 rs7946115、MYH9 rs2239781和CTLA4 rs4553808位点与肾病综合征CYP3A5表达型患儿的他克莫司药动学密切相关,且其检测属于外周血指标,可方便获取,方便将来推广使用。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所用模型的构建和验证的流程示意图;
图2为本发明一个实施例中CYP3A5表达型人群中MAP3K11 rs7946115不同基因型与CDR(他克莫司剂量校正谷浓度)之间的关系;
图3为本发明一个实施例中CYP3A5表达型人群中MYH9 rs2239781不同基因型与CDR之间的关系;
图4为本发明一个实施例中CYP3A5表达型人群中CTLA4 rs4553808不同基因型与CDR之间的关系;
图5为本发明一个实施例中根据训练集和测试集R2绘制的最佳特征变量图。
具体实施方式
现将详细地提供本发明实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
因此,旨在本发明覆盖落入所附权利要求的范围及其等同范围中的此类修改和变化。本发明的其它对象、特征和方面公开于以下详细描述中或从中是显而易见的。本领域普通技术人员应理解本讨论仅是示例性实施方式的描述,而非意在限制本发明更广阔的方面。
本发明涉及MAP3K11 rs7946115、MYH9 rs2239781以及CTLA4 rs4553808位点中的至少一种的检测剂在制备用于肾病综合征(NS)CYP3A5表达型患儿使用他克莫司(FK506)的用药指导试剂盒中的应用。
“用药指导”在本发明中指本领域技术人员可根据MAP3K11 rs7946115、MYH9rs2239781和CTLA4 rs4553808位点调整他克莫司在肾病综合征CYP3A5表达型患儿中的给药(给药量、给药间隔等)。在本发明所公开内容的基础上,本领域人员可以不付出创造性地获知这三个基因多态性位点与他克莫司的药物药动学密切相关。
由MAP3K11基因编码的蛋白质是丝氨酸/苏氨酸激酶家族的一个成员。这种激酶包含SH3结构域和一个亮氨酸拉链碱性基序。这种激酶优先激活MAPK8/JNK激酶,并且用作JNK信号途径的正调节。肌球蛋白重链9(MYH9)编码肌球蛋白IIA重链,它参与许多细胞功能活动,包括细胞分裂,迁移和粘附。由MYH9突变体引起的异常MYH9表达或功能改变导致细胞骨架损伤,在某些情况下导致蛋白尿或肾衰竭。细胞毒性T淋巴细胞相关蛋白4(CTLA4)是一种蛋白受体,其作为免疫检查点起作用并下调免疫应答。既往的研究中有发现CTLA-4基因的多态性与自身免疫性疾病如自身免疫性甲状腺疾病和多发性硬化症有关,尽管这种关联通常很弱。
有文献已报道过MAP3K11 rs7946115、MYH9 rs2239781和CTLA4 rs4553808位点与别的人群别的疾病之间的关系,但未发现与肾综CYP3A5表达型人群的他克莫司浓度间的关系。本发明首次发现这三个基因位点的多态性与肾病综合征患儿对他克莫司的药动学密切相关。MAP3K11、CTLA4和MYH9多态性的基因分型有助于更好地指导儿童肾综CYP3A5表达型患者的他克莫司剂量。
在一些实施方式中,所述试剂盒中还含有可用于指导他克莫司用药的其他基因多态性位点的检测剂。
在一些实施方式中,所述其他基因多态性位点为CYP3A5*3/*3以及CYP3A5*1/*1+*1/*3的基因多态性位点。
CYP3A5*3/*3以及CYP3A5*1/*1+*1/*3的基因多态性位点的检测剂可用于复核CYP3A5表达型身份。
在一些实施方式中,所述肾病综合征患儿的年龄在14岁以下。
在一些实施方式中,所述肾病综合征患儿的年龄在10岁以下。
在一些实施方式中,所述肾病综合征患儿为亚洲人种。
在一些实施方式中,所述肾病综合征患儿为中国人种。
在一些实施方式中,所述肾病综合征患儿的肝或肾功能基本正常。
在一些实施方式中,所述肾病综合征患儿为原发性肾病综合征患儿。
在一些实施方式中,所述肾病综合征患儿为难治性肾病综合征患儿。
在一些实施方式中,所述检测剂用于执行以下任一种方法:
限制性片段长度多态性法PCR-RFLP、单链构象多态性法PCR-SSCP、指竞争性等位基因特异性PCR(Kompetitive Allele Specific PCR)、变性梯度凝胶电泳、等位基因特异性PCR(allelespecific PCR,ASPCR)、DNA测序法、DNA分型芯片检测、飞行质谱仪(MALDI-TOFMS)检测、变性高效液相色谱(DHPLC)法、Snapshot法、Taqman探针法、生物质谱法以及HRM法。
上述方法均为本领域公知的基因多态性位点的检测方法,其所采用的试剂也为本领域技术人员所熟知。
在一些实施方式中,所述试剂盒中还包括DNA提取试剂。
在一些实施方式中,所述DNA提取试剂用于执行以下任一种方法:
酚氯仿法、NaOH法、树脂提取法、盐析法、十六烷基三甲基溴化胺法、硅胶膜吸附法、FTA卡法、硅珠法或磁珠提取法。
其中:
酚氯仿法通常是指通过酚氯仿混合物萃取DNA溶液中的蛋白质类有机物质,保留DNA于水相溶液中的DNA提取方法。
NaOH法一般是强碱溶解、变性蛋白质,破坏细胞膜及核膜,变性核酸酶,释放DNA,NaOH不破坏DNA一级结构。
树脂提取法常用Chelex100法,通过Chelex螯合镁、钠和钾等离子,使降解DNA的核酸酶失去活性的DNA提取方法。
盐析法通常是将细胞破碎并离心后,用约6M的饱和NaCl沉淀蛋白质,离心上清中DNA用无水乙醇沉淀,用TE溶解。
十六烷基三甲基溴化胺法通常是通过非离子型去污剂CTAB破坏细胞壁和细胞膜及硬组织,并与DNA形成复合物,分离DNA与蛋白质及多糖类物质的DNA提取方法。
硅胶膜吸附法通常指通过硅胶膜吸附细胞裂解液裂解后释放出DNA,并经蛋白酶消化、漂洗液清洗除去蛋白质、脂质以及多糖等杂质的DNA提取与纯化方法。
FTA卡法通常指通过FTA卡裂解细胞释放DNA,从血液、口腔上皮细胞中获得DNA的方法。
硅珠法通常是指在高浓度的硫氰酸胍存在的条件下,通过二氧化硅微粒特异捕获有机质溶液中DNA分子的DNA提取方法。
磁珠法通常是指在胍盐存在条件下,通过在硅胶外表涂上一层磁性树脂的磁珠,特异性的吸附细胞裂解液裂解后释放出DNA的DNA提取与纯化方法。
基于本发明,本领域技术人员容易想到本发明所提供的标记物MAP3K11rs7946115、MYH9 rs2239781以及CTLA4 rs4553808位点也可用作药代动力学标记物。这里所用的“药代动力学标记物”是一个客观的生化标记物,其特异地与药物效应相关。药代动力学标记物的存在或数量并不与给予药物的疾病状况或病症相关;因此,药代动力学标记物的存在或数量可作为受试者的药物存在或活性的指标。例如,药代动力学标记物可指示生物组织中药物浓度,因为在该组织中标记物是相关于药物水平而被表达的或转录的,或是未被表达或转录的。以这种方式,用药代动力学标记物监测药物的分布或摄取。相似地,药代动力学标记物的存在或数量可以与药物代谢产物的存在或数量相关,以便标记物的存在或数量可指示体内的药物相对分解速度。药代动力学标记物尤其可应用于增加检测药物效果的灵敏度,尤其在以低剂量给予药物的时候。而且,由于标记物本身的性质使得标记物更容易检测;例如,利用在此所述的方法,在基于探针杂交或测序等方法可对上述标记物容易地进行检测。另外,应用药代动力学标记物可以提供以机理为基础的危险预测,所述危险是由于超出可能的直接观察范围之外的药物治疗。
进一步地,本发明还涉及一种肾病综合征CYP3A5表达型患儿使用他克莫司的用药指导方法,所述方法包括:
a)获取含有患儿DNA的样品;b)测量样品中的MAP3K11 rs7946115、MYH9rs2239781以及CTLA4 rs4553808位点中的至少一种;c)使用步骤b)的测量结果来指导他克莫司的药物用量。
在一些实施方式中,所述样品为所述受试者的体液,例如是血液、血清或血浆和脑脊髓液、组织或组织裂解液、细胞培养上清、精液、唾液样品、或其它适当的包含基因组DNA的样品,优选外周血。
在一些实施方式中,步骤d可进一步包括:
d1)若所述患儿MAP3K11 rs7946115位点的基因型为GG,则相对于其他基因型(CG+CC)需要减少他克莫司用药量;
d2)若所述患儿MYH9 rs2239781位点的基因型为CC,则相对于其他基因型(TC+TT)需要减少他克莫司用药量;
d3)若所述患儿CTLA4 rs4553808位点的基因型为GG,则相对于其他基因型(GA+AA)需要减少他克莫司用药量。
下面将结合实施例对本发明的实施方案进行详细描述。
实施例
本实施例采用高级机器学习算法构建了给药前FK506在肾综患儿中的血药浓度预测模型。
一、材料与方法
1.患者与治疗
患者于2013年7月至2017年12月在广州市妇幼保健中心就诊。入选标准如下:14岁以前出现症状,临床诊断为难治性NS(包括激素依赖型NS,激素耐药性NS,频复发NS),并口服他克莫司至少三个月。排除接受除泼尼松以外影响他克莫司血药水平的药物,如维拉帕米,酮康唑,伊曲康唑,红霉素,克拉霉素,地尔硫卓或某些传统中草药。继发性NS或肝或肾功能异常的患者也被排除在外。
所有患者均接受双重免疫抑制方案,包括他克莫司(PrograftTM,Astellas,Killorglin,Ireland)和低剂量泼尼松(广东华南药业有限公司,中国东莞)。他克莫司的初始剂量以每天两次0.10~0.15mg/kg给予患者,随后调整剂量调整到他克莫司稳态浓度5~10ng/ml。
患者的信息如表1所示
表1所有小儿原发性肾病综合征患者的人口统计学和临床特征(n=84)
本发明仅针对CYP3A5表达型组进行分析。
2.数据采集
服用他克莫司三个月后,当持续达到稳态浓度时,获得体重,年龄,他克莫司剂量和全血谷浓度(C0)。在给予他克莫司早晨剂量之前收集静脉血样品。他克莫司的全血浓度通过酶联免疫分析技术(Viva-E,西门子,德国)测定。CDR(即C0/D)是他克莫司谷浓度除以mg/kg体重表示剂量校正谷浓度。此外,还获取了相应的实验室参数,包括血清肌酐,丙氨酸氨基转移酶和天冬氨酸氨基转移酶。
3.DNA提取和基因分型
在获得患者知情同意后,从患者中收集用于基因分型的静脉血样本(2ml)。使用Genome TIANGEN血液DNA提取试剂盒(DP348,北京,中国)从外周血白细胞中提取总基因组DNA。CYP3A4*1G(20230C>T),CYP3A5*3(6985A>G)和MDR1(1236C>T,2677G>T/A和3435C>T)多态性通过PCR-RFLP方法测定。75个单核苷酸多态性(SNP),包括ACTN4(rs62121818),ACTN4(rs56113315),ACTN4(rs3745859),NPHS1(rs437168),NPHS2(rs2274622),MYH9(rs2239781),ITGB4(rs871443),LAMB2(YO11987E)(rs58948844),CD2AP(rs4711880),INF2(rs12147772),TRPC6(rs10501986),PLCE1(rs17109671),WT1(rs1799925)、ANGPTL4(rs2042899)等通过Agena Bioscience Masssystem(Agena Bioscience,SanDiego,CA,USA)检测。
4.数据预处理
首先,去除缺失值占比大于10%的变量,进而采用单因素分析法分析每个变量与结局变量之间的相关性,剔除分析结果为阴性的变量(P值大于0.05);并按照是否携带CYP3A5*3分型,挑选CYP3A5*1携带者(即CYP3A5表达型),然后采用均值填补缺失的连续型变量;最后对连续型变量进行标准化,对分类变量进行哑元化。
5.特征提取
首先,对数据预处理后的变量进行单因素分析,筛选出与结局变量相关的初始特征变量(特征子集A),然后使用集成模型进一步选择恰当的特征变量子集,包括极端随机树(Extremely Randomized Trees,ET)、梯度提升决策树(Gradient Boosting DecisionTree,GBDT)、随机森林(Random Forest,RF)以及极限梯度提升(eXtreme GradientBoosting,XGBoost)四种算法:先对连续数据变量进行不同的数据变换,分别是最小-最大归一化(min-max normalization)、Z-分数标准化(z-score normalization)、L2正则化以及保持原型不变,分别结合分类变量形成四种形式的变量数据集。然后采用上述四种算法分别对这四种形式变量建模,得到16种模型。每个模型都对数据变量进行重要性排序,一共得到16个变量重要性排名序列,取中位数重要性排名作为变量的最终重要排名。最后,选用五折交叉验证和XGBoost方法,按照变量重要贡献度排名的顺序,从最重要的变量开始进行前向逐步建模,每次只添加一个变量并且重新建模和评估模型的R方,直到添加最后一个变量结束并根据R方确定最佳的变量个数,形成最终特征变量(特征子集B)。
6.模型构建
使用套索算法(least absolute shrinkage and selection operator,Lasso)分析特征子集A,实现特征选择和正则化并且构建多重线性回归模型;此外,使用Lasso、ET、GBDT、RF以及XGBoost算法分析特征子集B并构建回归预测模型。所有模型构建过程中,训练集与测试集按8:2随机划分数据集,训练集在构建模型过程中采用五折交叉验证。建模和验模的流程图如图1所示。
二、实验结果
1.初始特征变量(特征子集A)的确定
将所有检测的特征变量包括给药前的临床特征和基因型总共118个变量,与CDR进行单因素分析,得到p<0.05的变量包括:给药前血白蛋白(ALB0,p=0.032),给药前年龄(AGE0,p=0.027),MAP3K11rs7946115(p=0.013),LMX1Brs10733682(p=0.009),IL13rs20541(p=0.035),MYH9rs2239781(p=0.008),NPHS2rs2274623(p=0.003),NFKB1rs230532(p=0.044),ADIPOQrs1501299(p=0.036),IL2RArs2104286(p=0.010),IL4Rrs2107356(p=0.036),CTLA4rs4553808(p=0.022),MAP3K11rs948577(p=0.016)。进一步将这些阳性变量进一步进行哑元化,将哑元化后的变量再次进行单因素分析,得到p<0.1的阳性变量,包括MAP3K11rs7946115_CG(p=0.011),MAP3K11rs7946115_GG(p=0.029),MX1Brs10733682_GG(p=0.044),IL13rs20541_AA(p=0.0.45),IL13rs20541_AG(p=0.012),IL13rs20541_GG(p=0.024),MYH9rs2239781_CC(p=0.005),NPHS2rs2274623_TT(p=0.001),NPHS2rs2274623_TC(p=0.099),NPHS2rs2274623_CC(p=0.050),NFKB1rs230532_AT(p=0.013),ADIPOQrs1501299_GG(p=0.0.032),ADIPOQrs1501299_GT(p=0.034),ADIPOQrs1501299_TT(p=0.058),IL2RArs2104286_CC(p=0.026),IL4Rrs2107356_TC(p=0.047),CTLA4rs4553808_GG(p=0.017),CTLA4rs4553808_GA(p=0.024),CTLA4rs4553808_AA(p=0.030)以及标准化后的给药前年龄(AGE0,p=0.021),即构成了初始特征变量(特征子集A)。将特征子集A的所有变量与CDR做图,其中CYP3A5表达型人群中MAP3K11rs7946115不同基因型与CDR之间的关系如图2所示,MYH9 rs2239781不同基因型与CDR之间的关系如图3所示,CTLA4 rs4553808不同基因型与CDR之间的关系如图4所示。
2.最佳特征变量(特征子集B)的确定
将上述特征子集A进行数据转换形成的4种变量子集采用4种机器学习算法建模得到16种模型,得到每个变量的16个重要贡献度,取每个变量的重要贡献度的中位数进行最终重要贡献度的排名,中位数值越小则该变量越重要。AGE0、MYH9rs2239781_CC、MAP3K11rs7946115_CG、CTLA4rs4553808_GG等变量的重要性排在前列。进一步采用XGBoost法(5折交叉验证)按照上述变量重要贡献度排名,从最重要的变量开始进行前向逐步建模,每次添加一个变量且重建和评估模型的R2,直到添加最后一个变量结束建模,得到根据训练集和测试集R2绘制的最佳特征变量图5。从图中可以看出,在一个一个加入变量达到第4个变量时,模型的训练集R2和测试集R2达到两者最佳R2值。因此,得到这4个变量(AGE0、MYH9rs2239781_CC、MAP3K11rs7946115_CG、CTLA4rs4553808_GG)为最佳特征变量(特征子集B),进行最后浓度预测模型的建立和验证。
3.浓度预测模型的建立和验证
对上述最佳特征变量(特征子集B)采用5种机器学习算法进行建模和验证。包括XGBoost、ET、RF、GBDT和Lasso回归分别建模和验证,得到5个浓度预测模型。5个模型的训练集和测试集预测性能(包括R2、均方误差、平均绝对误差、中值绝对误差)结果见表2~3。从表中可见,各个模型的训练集预测R2值大约为21.2%~42.5%,测试集预测R2值大约为25.2%~37.9%,ET算法建模得到的R2值最高,训练集和测试集R2分别为42.5%和37.9%,模型中变量重要贡献程度见表4。各项误差值都在可接受范围之内。
表2五组模型在CYP3A5表达型人群训练集中的预测性能比较
表3五组模型在CYP3A5表达型人群测试集中的预测性能比较
表4 CYP3A5表达型人群中五个模型进行特征筛选的重要性值
注:表4中的每行是某个模型所纳入的每个变量对于整个模型的贡献度。从每个变量的值的大小可以看出每个变量对于整个模型的贡献度。
从上面几个表格可知,ET模型(ExtraTreesRegressor)最佳,因而可判断MAP3K11rs7946115、MYH9 rs2239781以及CTLA4 rs4553808位点贡献度很高,说明三者对CYP3A5表达型人群他克莫司药物药动学有重要的影响。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (8)
1.MAP3K11 rs7946115、MYH9 rs2239781以及CTLA4 rs4553808位点中的至少一种的检测试剂在制备用于肾病综合征CYP3A5表达型患儿使用他克莫司的用药指导试剂盒中的应用,所述用于肾病综合征CYP3A5表达型患儿为CYP3A5*1携带者;
若所述患儿MAP3K11 rs7946115位点的基因型为GG,则相对于CG+CC基因型需要减少他克莫司用药量;
若所述患儿MYH9 rs2239781位点的基因型为CC,则相对于TC+TT基因型需要减少他克莫司用药量;
若所述患儿CTLA4 rs4553808位点的基因型为GG,则相对于GA+AA基因型需要减少他克莫司用药量。
2.根据权利要求1所述的应用,其特征在于,所述肾病综合征患儿的年龄在14岁以下。
3.根据权利要求2所述的应用,其特征在于,所述肾病综合征患儿的年龄在10岁以下。
4.根据权利要求1所述的应用,其特征在于,所述肾病综合征患儿为原发性肾病综合征患儿。
5.根据权利要求1所述的应用,其特征在于,所述肾病综合征患儿为难治性肾病综合征患儿。
6.根据权利要求1~5任一项所述的应用,其特征在于,所述检测试剂用于执行以下任一种方法:
限制性片段长度多态性法、单链构象多态性法、竞争性等位基因特异性PCR、变性梯度凝胶电泳、等位基因特异性PCR、DNA测序法、DNA分型芯片检测、飞行质谱仪检测、变性高效液相色谱法、Snapshot法、Taqman探针法、生物质谱法以及HRM法。
7.根据权利要求1~5任一项所述的应用,其特征在于,所述试剂盒中还包括DNA提取试剂。
8.根据权利要求7所述的应用,其特征在于,所述DNA提取试剂用于执行以下任一种方法:
酚氯仿法、NaOH法、树脂提取法、盐析法、十六烷基三甲基溴化胺法、硅胶膜吸附法、FTA卡法、硅珠法或磁珠提取法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911347453.0A CN110923310B (zh) | 2019-12-24 | 2019-12-24 | 用于指导肾病综合征cyp3a5表达型患儿使用他克莫司的多态性位点 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911347453.0A CN110923310B (zh) | 2019-12-24 | 2019-12-24 | 用于指导肾病综合征cyp3a5表达型患儿使用他克莫司的多态性位点 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110923310A CN110923310A (zh) | 2020-03-27 |
CN110923310B true CN110923310B (zh) | 2023-04-18 |
Family
ID=69860809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911347453.0A Active CN110923310B (zh) | 2019-12-24 | 2019-12-24 | 用于指导肾病综合征cyp3a5表达型患儿使用他克莫司的多态性位点 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110923310B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113528661A (zh) * | 2021-02-22 | 2021-10-22 | 北京市理化分析测试中心 | 一种扩增ctla4基因snp位点用引物、检测试剂盒和应用 |
CN114150067B (zh) * | 2022-02-07 | 2022-05-17 | 元码基因科技(北京)股份有限公司 | 确定用于检测微卫星不稳定状态的位点组合的方法、系统及探针组 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101443040A (zh) * | 2006-03-16 | 2009-05-27 | 基因技术股份有限公司 | 用cd4抗体治疗狼疮的方法 |
WO2011133474A2 (en) * | 2010-04-18 | 2011-10-27 | Beth Israel Deaconess Medical Center | Methods of predicting predisposition to or risk of kidney disease |
CN103189745A (zh) * | 2010-09-24 | 2013-07-03 | 匹兹堡大学高等教育联邦体系 | 肾损伤的生物标记物 |
CN106722972A (zh) * | 2017-03-21 | 2017-05-31 | 上海中优医学检验所有限公司 | 针对免疫调控能力相关基因个体化配方食品及其制备方法 |
WO2017125402A1 (en) * | 2016-01-19 | 2017-07-27 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Methods of predicting drug responsiveness of patients suffering from autoimmune inflammatory diseases |
CN109161591A (zh) * | 2018-08-01 | 2019-01-08 | 上海交通大学医学院附属瑞金医院 | 单基因遗传性肾脏病基因联合筛查方法、试剂盒及其制备方法 |
CN109890981A (zh) * | 2016-08-26 | 2019-06-14 | 塞尔简泰克有限公司 | 用于肾病早期诊断的生物标志物sbp1及其用途 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9605317B2 (en) * | 2009-03-24 | 2017-03-28 | Janssen Pharmaceutica Nv | Biomarkers for assessing peripheral neuropathy response to cancer treatment |
-
2019
- 2019-12-24 CN CN201911347453.0A patent/CN110923310B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101443040A (zh) * | 2006-03-16 | 2009-05-27 | 基因技术股份有限公司 | 用cd4抗体治疗狼疮的方法 |
WO2011133474A2 (en) * | 2010-04-18 | 2011-10-27 | Beth Israel Deaconess Medical Center | Methods of predicting predisposition to or risk of kidney disease |
CN103189745A (zh) * | 2010-09-24 | 2013-07-03 | 匹兹堡大学高等教育联邦体系 | 肾损伤的生物标记物 |
WO2017125402A1 (en) * | 2016-01-19 | 2017-07-27 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Methods of predicting drug responsiveness of patients suffering from autoimmune inflammatory diseases |
CN109890981A (zh) * | 2016-08-26 | 2019-06-14 | 塞尔简泰克有限公司 | 用于肾病早期诊断的生物标志物sbp1及其用途 |
CN106722972A (zh) * | 2017-03-21 | 2017-05-31 | 上海中优医学检验所有限公司 | 针对免疫调控能力相关基因个体化配方食品及其制备方法 |
CN109161591A (zh) * | 2018-08-01 | 2019-01-08 | 上海交通大学医学院附属瑞金医院 | 单基因遗传性肾脏病基因联合筛查方法、试剂盒及其制备方法 |
Non-Patent Citations (3)
Title |
---|
Om P Mishra et al..Cytotoxic T- Lymphocyte Antigen-4 (CTLA4) Gene Expression and Urinary CTLA4 Levels in Idiopathic Nephrotic Syndrome.《Observational Study》.2018,第86卷(第1期),第26-31页. * |
宋尚骅 等.细胞毒T淋巴细胞相关抗原4基因多态性与儿童变应性鼻炎合并哮喘遗传易感性研究.《临床耳鼻咽喉头颈外科杂志》.2016,第30卷(第20期),第1597-1600页. * |
郭玉 等.MYH9、STAT4、uPA基因多态性与特发性膜性肾病的相关性.《实用医学杂志》.2016,第32卷(第03期),第376-381页. * |
Also Published As
Publication number | Publication date |
---|---|
CN110923310A (zh) | 2020-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qian et al. | Gut metagenomics-derived genes as potential biomarkers of Parkinson’s disease | |
Swindell et al. | ALS blood expression profiling identifies new biomarkers, patient subgroups, and evidence for neutrophilia and hypoxia | |
US20180251819A1 (en) | Gene signatures of inflammatory disorders that relate to the liver | |
Londoño et al. | Molecular profiling of subclinical inflammatory lesions in long-term surviving adult liver transplant recipients | |
Pocklington et al. | The synapse in schizophrenia | |
Yonan et al. | Bioinformatic analysis of autism positional candidate genes using biological databases and computational gene network prediction | |
CN110923310B (zh) | 用于指导肾病综合征cyp3a5表达型患儿使用他克莫司的多态性位点 | |
CA2657980A1 (en) | Biomarkers for the progression of alzheimer's disease | |
WO2015069933A1 (en) | Circulating cell-free dna for diagnosis of transplant rejection | |
Hess et al. | Transcriptomic abnormalities in peripheral blood in bipolar disorder, and discrimination of the major psychoses | |
Stapleton et al. | Using omics to explore complications of kidney transplantation | |
JP2022130525A (ja) | 気分障害検査用バイオマーカーとしてのrna編集 | |
AU2007286855A1 (en) | Biomarkers for Alzheimer's Disease progression | |
CN110904219B (zh) | Myh9及ctla4基因多态性位点在指导肾病综合征患儿使用他克莫司中的应用 | |
CN110004229A (zh) | 多基因作为egfr单克隆抗体类药物耐药标志物的应用 | |
CN107190071B (zh) | 一种用于检测RhD变异表型的SNP标记 | |
CN110923311B (zh) | 用于指导肾病综合征cyp3a5非表达型患儿使用他克莫司的多态性位点 | |
Costello et al. | Genes, environments, and developmental research: methods for a multi-site study of early substance abuse | |
Ignatieva et al. | Exome-wide search and functional annotation of genes associated in patients with severe tick-borne encephalitis in a Russian population | |
CN106701923B (zh) | 一种与抗血小板药物氯吡格雷治疗缺血性脑卒中相关的snp标志物及其应用 | |
CN116206776A (zh) | 一种多基因snp位点介导的抗精神病药物血药浓度的预测模型及其构建方法和应用 | |
CN108318573B (zh) | 检测胰岛素抵抗的质谱模型的制备方法 | |
WO2008060566A2 (en) | Biometric analysis of populations defined by homozygous marker track length | |
Zhao et al. | Quantitative mapping of genetic similarity in human heritable diseases by shared mutations | |
CN109072278A (zh) | 分离的核酸及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |