CN104395479A - 糖尿病的生物标志物 - Google Patents

糖尿病的生物标志物 Download PDF

Info

Publication number
CN104395479A
CN104395479A CN201380005681.4A CN201380005681A CN104395479A CN 104395479 A CN104395479 A CN 104395479A CN 201380005681 A CN201380005681 A CN 201380005681A CN 104395479 A CN104395479 A CN 104395479A
Authority
CN
China
Prior art keywords
diabetes
experimenter
cancer
cpe
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380005681.4A
Other languages
English (en)
Other versions
CN104395479B (zh
Inventor
陈重娥
苏咏仪
马青云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Publication of CN104395479A publication Critical patent/CN104395479A/zh
Application granted granted Critical
Publication of CN104395479B publication Critical patent/CN104395479B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种方法,通过检测一种或多种基因(例如羧肽酶E(CPE)和胰岛素降解酶(IDE))中的序列变异,来诊断2型糖尿病、所有部位癌症或心血管疾病,并可用于评估受试者患上述疾病的风险。还提供了用于实施此方法的试剂盒、阵列和装置。此外,本发明提供了一种方法,用于治疗经检测已被证明有相关遗传变异的2型糖尿病、所有部位癌症或者心血管疾病患者。

Description

糖尿病的生物标志物
相关申请的交叉引用
本申请要求2012年1月27日提交的美国临时专利申请第61/591,598号的优先权,其内容通过引用全文并入用于所有目的。
发明背景
糖尿病(diabetes mellitus),通常简称为糖尿病(diabetes)、包括多种涉及代谢紊乱的病症,其典型特征是异常高的血糖水平(高血糖症)。人体内的血糖水平由化学物质和激素所形成的一个复杂的网络控制,包括由胰腺β细胞产生的激素即胰岛素。在糖尿病患者中所见的异常高的血糖水平由遗传,后天和环境因素共同导致的胰岛素分泌或胰岛素作用缺陷所引起。大多数糖尿病为1型糖尿病(先前被称为儿童期发病型糖尿病和胰岛素依赖型糖尿病毒)或者2型糖尿病(先前被称为成人发病型糖尿病和非胰岛素依赖型糖尿病)。
1型糖尿病的特点是胰腺朗格汉斯小岛中产生胰岛素的β细胞丢失,导致胰岛素产生的缺乏。因此,这种类型糖尿病的主要治疗方法是给予人工胰岛素,通常经由注射。2型糖尿病比1型糖尿病更为常见,超过90%的受累患者为2型糖尿病。后者与特征为肥胖和胰岛素抵抗(降低胰岛素敏感性)的现代病密切相关,尽管胰岛素生成减少是发生显著高血糖症所必须的。双胞胎和家族研究均支持2型糖尿病有很强的遗传成分。最近的遗传研究涉及在2型糖尿病进展中的多个常见的基因变异,尽管这些因素仅能解释2型糖尿病遗传风险中的一小部分变异。此外,有确凿的证据显示糖尿病的分布和基因或序列变异的频率有种族之间的差异,由于不同的连锁不平衡和重组热点模式,在高加索人群中发现的这些变异多数可能不适用于亚洲人群。
已知多种因素指示个体有患2型糖尿病的风险,它们中的大多数受个人的生活方式、年龄、种族背景和家族史的极大影响。这些风险因素的存在(至少一个,通常不止一个),若不采取措施纠正,使个人有高度的可能性发展成2型糖尿病。所述风险因素例如肥胖范围内的体重指数(BMI)(特别是源于多余的内脏脂肪堆积的向心性肥胖,表现为大腰围)、升高的血糖或胰岛素水平(特别是空腹或餐后血糖或胰岛素水平升高)、和降低的胰岛素敏感性。
随着全球范围内人们生活水平的不断提高,糖尿病患病人数也迅速增加。世界卫生组织(WHO)估计到2030年,全世界糖尿病患者人数将超过3.5亿。由于糖尿病的发病率不断上升,其无法最终治愈的慢性病本质,以及与其并发症(包括但不限于心血管疾病,肾衰竭,癌症,失明,截肢)相关的严重的健康隐患,迫切需要有新的、有效的方法来评估或预测个体今后可能患有糖尿病的风险,以便可以采取预防性措施来预防或延迟这些个体中糖尿病的发生或降低糖尿病相关症状/风险的严重程度。
目前清楚的是,糖尿病使前列腺癌以外的所有部位癌症的发生风险增加30%。在美国,亚洲受试者已知比非亚洲受试者有更高的患癌风险,特别是患肝癌和胃癌。这些癌症发展的倾向可能与外界致癌物质(例如,烟草,酒精,食物,和轻度的感染,如乙型肝炎病毒感染)和由高血糖,高血脂和肾衰竭引起的异常代谢环境之间的相互作用有关。此外,有慢性肾病的受试者有极高的患心血管疾病的风险,原因是代谢环境的变化包括氧化应激、轻度炎症、血管钙化和贫血,增加了血管损伤的风险。因此,糖尿病患者或有患糖尿病风险的个体也有很高的发生这些并发症(包括但不限于癌症,心血管疾病和肾病)的风险,这些疾病是有着密切的联系的。
临床和实验室数据也显示,良好的血糖控制和使用某些药物,不仅可以降低心血管疾病和肾病的风险,也可降低癌症的发病风险,所述药物例如他汀类药物(抑制HMG辅酶A还原酶)、肾素-血管紧张素系统阻滞剂、及降血糖药物包括但不限于胰岛素、磺脲类药物、二甲双胍和格列酮类。这些预防措施对于高风险受试者尤为重要,例如那些额外拥有癌症和心血管疾病风险因素的个体,举例来说,有糖尿病阳性家族史(提示可能携带其他尚未确定的遗传因素)、慢性乙型肝炎病毒感染、慢性肾病和低BMI(反映胰岛β细胞功能较差)的个体。在这些高风险受试者中,在发生严重代谢失调之前检测遗传风险因素将有助于临床医生加强治疗,以阻止代谢恶化和优化代谢控制,从而降低癌症、心血管疾病和肾病的风险。
因为上述疾病在全球范围内带来的巨大的社会和经济影响,明确且直接地需要在未来开发出新的、有效的用于准确诊断这些疾病,或者早期评估患者患这些疾病的风险的方法,以便可以早期进行干预以减少与这些疾病和/或疾病发生风险相关的有害影响。本发明满足了这种需求以及其他相关需求。
发明概述
在一方面,本发明提供了一种用于评估受试者中2型糖尿病、癌症或心血管疾病的存在或风险的方法。该方法包括步骤如下:(a)进行分析以确定存在于受试者生物样品中的羧肽酶E(CPE)的至少一部分基因组序列的核苷酸序列,和(b)将步骤(a)中确定的序列与相应的CPE标准序列进行比较。当与标准序列相比,检测到步骤(a)中确定的序列存在变异时,表明受试者患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险。
在某些情况下,样品是血液或唾液样品。在其他情况下,受试者是亚洲血统。在某些情况下,受试者的BMI不超过25kg/m2。在其他情况下,受试者有2型糖尿病、癌症或心血管疾病家族史,但尚未被诊断为2型糖尿病、癌症或心血管疾病。
在一些实施方案中,步骤(a)中的分析包括扩增反应,如聚合酶链式反应(PCR)。在其他实施方案中,步骤(a)中的分析包括质谱分析。任何常规的或更高级的多聚核苷酸测序或基因分型分析均可在该步骤中使用。在一些实例中,当受试者被诊断患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险时,所述方法还可以包括给予受试者降胆固醇药或降血糖药的步骤。在其他实例中,所述方法还可以包括用胰岛素降解酶(IDE)重复步骤(a)和(b)。换句话说,以与步骤(a)和(b)相同的方式分析IDE基因组序列,而不是CPE基因组序列。当与相应的标准序列相比,检测到样品中获得的IDE基因组序列存在变异时,表明受试者患有2型糖尿病、癌症或心血管疾病或者有患上述疾病风险。
在另一方面,本发明提供了一种用于评估受试者中2型糖尿病、癌症或心血管疾病的存在或风险的方法。该方法包括步骤如下:(a)进行分析以确定存在于受试者生物样品中的胰岛素降解酶(IDE)的至少一部分基因组序列的核苷酸序列,和(b)将步骤(a)中确定的序列与相应的IDE标准序列进行比较。当与标准序列相比,检测到步骤(a)中确定的序列存在变异时,该变异表明受试者患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险。
在某些情况下,样品是血液或唾液样品。在其他情况下,受试者是亚洲血统。在某些情况下,受试者的BMI不超过25kg/m2。在其他情况下,受试者有2型糖尿病、癌症或心血管疾病家族史,但尚未被诊断为2型糖尿病、癌症或心血管疾病。在一些实例中,步骤(a)中的分析包括扩增反应,如聚合酶链式反应(PCR)。在其他实例中,步骤(a)中的分析包括质谱分析。任何常规的或更高级的测序或基因分型分析均可在该步骤中使用。
在所要求保护的方法的一些实施方案中,当受试者被诊断患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险时,所述方法还包括给予受试者降胆固醇药或降血糖药的步骤。在一些实施方案中,所述方法还可包括用羧肽酶E(CPE)重复步骤(a)和(b)。当与相应的标准序列相比,检测到样品中的CPE基因组序列存在变异时,表明受试者患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险。一种示例性的序列变异是CPE rs1583645多态性或IDE rs6583813多态性。在某些情况下,所要求保护的方法还包括用以下一种或多种基因重复步骤(a)和(b):例如LIPC、LPL、CETP、PPARG、GNB3、NOS3、LTA、AGTA1、ADRB2、ADRB3、NPPA、ADD1、SCNN1A、MMP3、ALR2、TNF、APOE和APOC3。当与相应的标准序列相比,检测到样品中确定的基因组序列存在变异时,其表明受试者患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险。
在另一方面,本发明提供了一种用于评估受试者中2型糖尿病、癌症或心血管疾病的存在或风险的试剂盒。所述试剂盒包含用于在扩增反应中特异性扩增以下的两种寡核苷酸引物:(1)羧肽酶E(CPE)或胰岛素降解酶(IDE)基因组序列的至少一段;或(2)(1)的互补物。在某些情况下,扩增反应是聚合酶链式反应(PCR)。在某些情况下,所述试剂盒包含两套寡核苷酸引物,一套用于特异性扩增CPE基因组序列的至少一段,另一套用于特异性扩增IDE基因组序列的至少一段。通常情况下,所述试剂盒包含说明书手册,指导用户完成扩增反应和评估受试者中2型糖尿病、癌症或心血管疾病的存在或风险。
在另一方面,本发明提供了一种用于评估受试者中2型糖尿病、癌症或心血管疾病的存在或风险的阵列。通常情况下,所述阵列是一种寡核苷酸阵列,包含一种或多种用于特异性检测以下的寡核苷酸探针:(1)羧肽酶E(CPE)或胰岛素降解酶(IDE)基因组序列的至少一段;或者(2)(1)的互补物。所述阵列可包含固体基底,在其上固定了寡核苷酸。在某些情况下,所述阵列包含至少两种寡核苷酸,一种用于特异性检测CPE基因组序列或其互补物的一段,另一种用于特异性检测IDE基因组序列或其互补物的一段。任选地,所述阵列包含其他寡核苷酸,其用于特异性地检测以下的一种或多种基因组序列的至少一段:例如LIPC、LPL、CETP、PPARG、GNB3、NOS3、LTA、AGTA1、ADRB2、ADRB3、NPPA、ADD1、SCNN1A、MMP3、ALR2、TNF、APOE和APOC3。在某些情况下,特异性检测基因组序列(或其互补物)涉及寡核苷酸探针及其靶序列之间基于沃森-克里克碱基配对的多核苷酸序列特异性杂交。
附图简述
图1.说明了某些基因组序列变异可如何导致2型糖尿病、癌症和心血管疾病的风险增加,以及利用遗传变体鉴定高风险受试者,以便进行早期干预。
图2.运用逻辑回归分析,并针对编码来自于香港中国人、上海中国人、日本人和韩国人的不同人群的“研究人群”进行调整,来分析所有亚洲受试者中2型糖尿病与遗传风险评分(来自CPE基因rs1583645和IDE基因rs6583813的风险等位基因)的关联性。。
图3.在选自以家庭为基础的人群中的85名无关的非糖尿病对照中,遗传风险评分(来自CPE基因rs1583645和IDE基因rs6583813的风险等位基因)与(A)血浆胰岛淀粉样多肽(IAPP)和(B)IAPP与胰岛素的摩尔比(IAPP/INS)之间的关联性。
图4.总的假说描述了人胰岛淀粉样多肽途径的失调在不同的阶段(包括成熟、降解、寡聚和稳定)导致β细胞功能障碍的可能致病作用。
图5.CPE rs1583645A/G多态性附近的基因结构和利用荧光素酶活性测定对这些遗传变体的功能研究。
图6.卡普兰-迈耶曲线揭示了在有阳性家族史的2型糖尿病患者中,所有部位癌症与IDE遗传变体的风险关联性(在针对混杂变量调整之后)。
图7.卡普兰-迈耶曲线揭示了在非肥胖2型糖尿病患者中,心血管疾病与CPE遗传变异的风险关联性(在针对混杂变量调整之后)。
图8.卡普兰-迈耶曲线揭示了有阳性家族史的2型糖尿病患者中,癌症与CPE和IDE的遗传风险评分的风险关联性(在针对混杂变量调整之后)。
图9-12.结构方程模型显示了基因型-表型的相互作用,其解释了可归因于肥胖、血压、血脂和血糖控制、以及它们的遗传决定因素的2型糖尿病中肾功能的巨大差异。
图13.结构方程模型显示了慢性肾病和心血管疾病之间的因果关系,以及由诊断年龄、慢性乙型肝炎感染、肾功能、血压、血糖和血脂所解释的巨大差异。
图14.流行病学研究和Meta分析中癌症风险和HbA1c的风险关联性支持了高血糖症与癌症的可能的因果作用。
图15.通过慢性乙型肝炎病毒(HBV)感染状态和HbA1c≥7.4%来分组的4200名中国2型糖尿病的10年前瞻性人群中,所有部位癌症的累积发生率。
图16.在登记前2.5年内没有使用过胰岛素的2型糖尿病患者(常规使用者被排除在外)中,胰岛素的使用和癌症的累积发生率,针对倾向评分(药物适应症)、风险因素和其他药物的使用进行调整(另请参考表8和9中的患者特征)。
图17.在登记前2.5年内没有使用过二甲双胍的2型糖尿病患者(常规使用者被排除在外)中,二甲双胍的使用和癌症的累积发生率,针对倾向评分(药物适应症)、风险因素和其他药物的使用进行调整(另请参考表8和9中的患者特征)。
图18.在登记前2.5年内没有使用过磺脲类药物的2型糖尿病患者(常规使用者被排除在外)中,磺脲类药物的使用和癌症的累积发生率,针对倾向评分(药物适应症)、风险因素和其他药物的使用进行调整(另请参考表8和9中的患者特征)。
图19.在登记前2.5年内没有使用过噻唑烷二酮(TZD)的2型糖尿病患者(常规使用者被排除在外)中,TZD的使用和癌症的累积发生率,针对倾向评分(药物适应症)、风险因素和其他药物的使用进行调整(另请参考表8和9中的患者特征)。
图20.在登记前2.5年内没有使用过他汀类药物的2型糖尿病患者(常规使用者被排除在外)中,他汀类药物的使用和癌症的累积发生率,针对倾向评分(药物适应症)、风险因素和其他药物的使用进行调整(另请参考表8和9中的患者特征)。
图21.在登记前2.5年内没有使用过血管紧张素转化酶抑制剂(ACEIs)和血管紧张素Ⅱ受体阻滞剂(ARBs)的2型糖尿病患者(常规使用者被排除在外)中,ACEIs或ARBs的使用和癌症的累积发生率,针对倾向评分(药物适应症)、风险因素和其他药物的使用进行调整(另请参考表8和9中的患者特征)。
图22.在登记前2.5年内没有使用过他汀类药物、ACEI或ARB的2型糖尿病患者(常规使用者被排除在外)中,风险因素(HbA1c≥7.0%,未使用他汀类药物,和未使用ACEI或ARB)的数量和癌症的累积发生率,针对倾向评分(药物适应症)、风险因素和其他药物的使用进行调整(另请参考表8和9中的患者特征)。
定义
术语“2型糖尿病”指一种代谢性病症,特征为胰岛素抵抗及胰岛素相对缺乏背景下的高血糖。2型糖尿病也可能由生活方式和遗传因素共同导致。风险因素包括但不限于肥胖、高血压、高血脂、代谢综合征(高甘油三酯、低密度脂蛋白胆固醇、高血糖、高血压、大腰围)、内分泌紊乱(如库欣氏综合征)、慢性胰腺炎、服用某些药物、衰老、高热量饮食(如高脂肪和高糖)和不运动的生活方式。另一方面,有患2型糖尿病的亲属(特别是一级亲属)大大增加患2型糖尿病的风险。2型糖尿病的症状常常包括多尿(尿频)、多饮(容易口渴)、多食(容易饥饿)、疲劳和体重减轻。与2型糖尿病相关的由高血糖和异常代谢环境(例如,轻度炎症、氧化应激和脂质异常)引起的并发症包括心衰、中风、截肢、视力丧失、肾衰竭、癌症,以及认知障碍的风险增加。
本申请中所使用的术语“癌症”泛指其中一组细胞表现出不受控制地生长、侵入和破坏临近组织的浸润,并且常常转移的任何疾病,其中这些不受控制生长的细胞通过淋巴系统或血流扩散到身体的其他部位。除非指明,“癌症”可发生在患者体内的任何解剖部位。癌细胞通常为具有三种将恶性肿瘤(或癌症)与良性肿瘤区分开来的恶性特征的那些细胞:癌细胞不受控制地生长、直接地局部浸润,或转移至局部淋巴结或身体远端部位如大脑、骨骼、肝脏或其他器官。
术语“心血管疾病”是指一大类涉及心脏或血管(动脉和静脉),并影响心血管系统的疾病,例如动脉粥样硬化相关的病症(动脉性疾病)。这些疾病包括但不限于中风、冠心病及周围性血管病变。已知的心血管疾病风险因素包括不健康的饮食、缺乏运动、肥胖、糖尿病管理不当、血脂异常、高血压、酒精和/或烟草的消费,以及遗传背景。
本文中使用的术语“体重指数”或“BMI”指从个人体重和身高计算出的数值,用于反映个人的“胖”或“瘦”。更具体而言,体重指数=体重(kg)/(身高(m))2,或者体重(1b)x703/(身高(in))2。通常在高加索人群中,BMI为20到25kg/m2被认为是理想体重。BMI低于20kg/m2提示个人过轻,而BMI在25kg/m2以上可表明个人过重,BMI在30kg/m2以上提示个人肥胖,而BMI在40kg/m2以上表明个人病态肥胖。相比于高加索人,亚洲人在相同程度的BMI和腰围的情况下有更多的身体脂肪。因此在亚洲人中,正常体重和肥胖分别被定义为<23kg/m2和≥25kg/m2。虽然高BMI可预测糖尿病或糖尿病前期风险,但具有与β细胞功能有关的低BMI者也有高风险,特别是当这些受试者有向心性肥胖时,向心性肥胖往往与胰岛素抵抗或胰岛素敏感性降低有关。
在本公开中,术语“生物样品”或“样品”包括采集自受试者的任意部位的组织或体液,例如活检和尸检样本,以及采集用于组织学目的的冰冻切片,或任何此类样品的处理形式。生物样品包括血液和血液成分或产物(例如血清、血浆、血小板、红细胞等)、痰或唾液、淋巴和舌组织、培养的细胞(例如原代培养物、外植体、转化细胞)、粪便、尿液、胃活检组织等。生物样品通常从真核生物体中获得,所述真核生物体可以是哺乳动物、可以是灵长类动物并且可以是人类。
在本公开中,术语“活检”指的是取出组织样本用于诊断或预后评估的过程以及组织样本本身。任何本领域已知的活检技术均可应用于本发明的方法中。采用的活检技术依赖于待评估的组织类型(例如舌、结肠、前列腺、肾、膀胱、淋巴结、肝、骨髓、血细胞、胃组织等)以及其他因素。代表性的活检技术包括但不限于切除活检、切开活检、穿刺活检、手术活检和骨髓活检,并且可以包括内窥镜检查如结肠镜检查。种类繁多的活检技术是本领域技术人员熟知的,其将从中选择,并用最少的实验完成它们。
在本公开中,术语“分离的”核酸分子是指这样的核酸分子:其从通常与该分离的核酸分子相关的其他核酸分子分离。因此,“分离的”核酸分子包括但不限于这样的核酸分子:其不含天然位于产生分离核酸分子的生物体的基因组中核酸一端或两端侧翼的核苷酸序列(例如通过聚合酶链式反应或限制性内切酶消化产生的cDNA或基因组DNA片段)。这种分离的核酸分子通常被引入载体(如克隆载体或表达载体)中,以方便操作或产生融合核酸分子。此外,分离的核酸分子可包括工程化的核酸分子,例如是重组或合成的核酸分子。存在于数百到数百万其他的核酸分子中的核酸分子不是“分离的”核酸分子,例如存在于核酸文库(如cDNA或基因组文库)或含有限制酶消化的基因组DNA的凝胶(如琼脂糖或聚丙烯酰胺凝胶)中的核酸分子不是“分离的”核酸分子。
术语“核酸”或“多核苷酸”是指脱氧核糖核酸(DNA)或核糖核酸(RNA)及其单链或双链形式的聚合物。除非特别限定,该术语包括含有已知的天然核苷酸类似物的核酸,所述天然核苷酸类似物与参考核酸有相似的结合特性,并且以类似天然存在的核苷酸的方式代谢。除非另外指出,特定的核酸序列还隐含地包括其保守修饰的变体(如简并密码子取代)、等位基因、直向同源物(ortholog)、单核苷酸多肽物(SNPs)和互补序列以及明确指明的序列。特别地,简并密码子取代可通过产生这样的序列获得:其中一个或多个选择的(或所有的)密码子的第三位被混合碱基和/或脱氧肌苷残基取代(Batzer et al.,Nucleic Acid Res.19:5081(1991);Ohtsuka et al.,J.Biol.Chem.260:2605-2608(1985);以及Rossolini et al.,Mol.Cell.Probes8:91-98(1994))。术语核酸与基因、cDNA和由基因编码mRNA可互换使用。
术语“基因”是指参与多肽链产生的DNA的区段。其包括涉及基因产物转录和/或翻译的编码区之前和之后的区域(前导序列和尾随序列),转录和/或翻译的调节区,以及各编码区段(外显子)之间的间隔序列(内含子)。
在本申请中,术语“多肽”、“肽”和“蛋白质”在本文可互换使用,是指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学模拟物的氨基酸聚合物,以及天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。本文所用的该术语涵盖任何长度的氨基酸链,包括全长蛋白质(即抗原),其中氨基酸残基通过共价肽键连接。
术语“氨基酸”是指天然存在的和合成的氨基酸,以及以与天然存在的氨基酸相似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的氨基酸,和以后经修饰的氨基酸,例如,羟脯氨酸,γ-羧基谷氨酸,和O-磷酸丝氨酸。为了本申请的目的,氨基酸类似物是指和天然存在的氨基酸具有相同基本化学结构(即,与氢、羧基、氨基以及R基连接的碳)的化合物,例如,高丝氨酸、正亮氨酸、二甲亚砜甲硫氨酸、甲硫氨酸甲基锍。这些类似物具有经修饰的R基(例如,正亮氨酸)或经修饰的肽骨架,但保留与天然存在的氨基酸相同的基本化学结构。为了本申请的目的,氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构,但以与天然存在的氨基酸相似的方式起作用的化合物。
如在WO01/12654中所披露的,氨基酸可包括具有非天然存在的D-手性的氨基酸,其可提高包含1个或多个此类D-氨基酸的多肽的稳定性(如半衰期)、生物利用度和其他特性。在某些情况下,治疗性多肽中的一个或多个氨基酸以及可能全部的氨基酸均具有D-手性。
氨基酸在此处可通过普遍已知的三字母符号表示或通过由IUPAC-IUB生物化学命名委员会(IUPAC-IUB Biochemical NomenclatureCommission)推荐的单字母符号表示。同样,核苷酸可通过其普遍接受的单字母代码表示。
术语“免疫球蛋白”或“抗体”(在本文中可互换使用)指具有基本的4条多肽链结构的抗原结合蛋白,其具有特异性结合抗原的能力,这4条多肽链由2条重链和2条轻链组成,所述链例如通过链间二硫键稳定。重链和轻链均折叠成结构域。
术语“抗体”还指可用于免疫亲和分析的抗体的抗原结合片段和表位结合片段,例如,Fab片段。有许多具有良好表征的抗体片段。因此,例如,胃蛋白酶消化抗体C-端的铰链区内的二硫键,从而产生F(ab)'2,其为Fab(其自身是通过二硫键将轻链连接至VH-CH1)的二聚体。F(ab)'2可以在温和的条件下被还原,使铰链区内的二硫键断裂,由此将F(ab)'2二聚体转变为Fab'单体。Fab'单体实质上是具有部分铰链区的Fab(对于其他抗体片段的更多详述见Fundamental Immunology, Paul, ed., RavenPress, N.Y. (1993))。虽然是根据完整抗体的消化而定义各种抗体片段,本领域技术人员应理解,抗体片段可以用化学方法从头合成或者利用重组DNA方法合成。因此,术语“抗体”也包括通过全抗体的修饰产生的或使用重组DNA方法合成的抗体片段。
当在描述特定分子与蛋白或肽的结合关系的上下文中使用时,短语“特异性结合”是指确定不均一蛋白质群体和其他生物制品中存在所述蛋白的结合反应。因此,在指定的结合实验条件下,特定的结合剂(例如抗体)以背景的至少2倍结合特定蛋白,而基本上不以显著量结合样品中存在的其他蛋白。抗体在此种条件下的特异性结合可能需要这样的抗体:针对其对一种特定的蛋白或某一蛋白而不是其相似的“姊妹”蛋白的特异性对其进行选择。多种免疫测定形式可用于选择与特定蛋白或者以特定形式发生特异性免疫反应的抗体。例如,固相ELISA免疫测定被常规地用于选择与蛋白发生特异性免疫反应的抗体(关于可用于测定特异性免疫反应性的免疫测定形式和条件的描述见,例如Harlow&Lane,Antibodies,A Laboratory Manual(1988))。通常,特异性或选择性结合反应将是本底信号或噪声的至少两倍,更通常为本底的10到100倍以上。另一方面,当术语“特异性结合”在提及多核苷酸序列与另一条多核苷酸序列形成双链复合物的背景下使用时,正如术语“多核苷酸杂交法”定义中所提供的,描述了基于沃森-克里克碱基配对的“多核苷酸杂交”。
本文所用的“多核苷酸杂交法”是指基于已确定的多核苷酸序列,在适当的杂交条件下与已知序列的多核苷酸探针形成沃森-克里克碱基配对的能力,来检测所述已确定的多核苷酸序列的存在和/或量的方法。此类杂交方法的例子包括Southern印迹,Northern印迹和原位杂交。
本文所用的“引物”是指这样的寡核苷酸:其能用于扩增方法如聚合酶链式反应(PCR)中,以基于对应于目的基因的多核苷酸序列(例如人羧肽酶E(CPE)或胰岛素降解酶(IDE)基因的cDNA或基因组序列或其一部分)扩增核苷酸序列。通常用于扩增多核苷酸序列的引物的至少一个对于该多核苷酸序列是序列特异性的。引物的精确长度将取决于多种因素,包括温度、引物的来源及所用的方法。举例来说,对于诊断和预后应用,取决于靶序列的复杂性,寡核苷酸引物通常包含至少10或15或20或25或更多个核苷酸,尽管其可含有较少的或更多的核苷酸。本领域普通技术人员容易了解确定引物适当长度所涉及的因素。在本公开中,术语“引物对”是指与靶DNA分子相反的链或与靶DNA分子的位于待扩增核苷酸序列侧翼的区域杂交的一对引物。在本公开中,术语“引物位点”是指引物与靶DNA或其他核酸杂交的区域。
“标记物”,“可检测标记物”或“可检测部分”是指通过光谱学、光化学、生物化学、免疫化学、化学或其他物理手段可检测到的一种成分。例如,有用的标记物包括32P、荧光染料、电子密度试剂、酶(如在ELISA中常用的)、生物素、地高辛,或者可制备成可检测的半抗原和蛋白质(例如,通过在肽中掺入放射性组分或者用于检测与该肽特异性反应的抗体)。通常情况下,将可检测标记物连接于探针或有确定的结合特性的分子(例如,具有已知的结合特异性的多肽或多核苷酸),从而允许探针(以及因此的其结合靶标)的存在可被容易地检测到。
本文所用的“标准序列”是指已确定的基因组DNA区段的多核苷酸序列,例如,人基因组中给定基因序列的确定部分或全长作为该特定基因的标准人基因组序列,如人羧肽酶E(CPE)或胰岛素降解酶(IDE)的基因组序列(包括2kb上游和2kb下游侧翼序列),这些序列保存在公众可访问的数据库中(例如,加州大学圣克鲁斯数据库(hg18))。当将从测试样品确定的基因组DNA序列与“标准序列”进行比较时,将测试序列与基因组序列的对应核苷酸碱基处的“标准序列”比对以揭示任何序列变异。
人羧肽酶E(CPE)基因的标准基因组序列位于4号染色体:166,298,097-166,421,482。人胰岛素降解酶(IDE)基因的标准序列位于10号染色体:94,209,441-94,259,518。
本申请中使用的术语“量”是指样品中存在的目的多核苷酸或目的多肽的量。这一量可以表示为绝对值(即,样品中多核苷酸或多肽的总量),或者相对值(即,用样品中多核苷酸或多肽的浓度)。
本文所用的术语“有效量”指的是在量上足以产生期望效果的给定物质的量。例如,在以治疗为目的而给予药物的患者中,降胆固醇药或者降血糖药的有效量是所述药物分别实现降低胆固醇或血糖水平的量。足够完成这一目标的量被定义为“治疗有效剂量”。剂量范围随所给予的治疗剂的性质和其他因素(如给药途径和患者病症的严重程度)而改变。
本文所用的术语“受试者”或“需要治疗的受试者”包括由于有患2型糖尿病、癌症或心血管疾病风险或实际罹患上述疾病而就医的个体。受试者还包括正在接受治疗,寻求治疗方案操作的个体。需要治疗的受试者或个体包括那些表现出2型糖尿病、癌症或心血管疾病症状的患者,或者有患2型糖尿病、癌症或心血管疾病或相关症状风险的个体。例如,需要治疗的受试者包括具有2型糖尿病、癌症或心血管疾病遗传倾向或家族史的个体,那些过去曾遭受相关症状的个体,那些已暴露于触发物质或事件的个体,以及那些经历病症的慢性或急性症状的个体。“需要治疗的受试者”可以处于生命的任何年龄。
发明的详细描述
Ⅰ.导言
本发明人首次发现了一种或多种特定基因(例如,羧肽酶E(CPE)和胰岛素降解酶(IDE)基因)的基因组序列变异与人类医学病症(如2型糖尿病、癌症和心血管疾病)之间的相关性。这一发现使得医学专家可以通过研究受试者的相关基因的基因组序列,随后将该受试者的序列与已被确定为标准人类基因组的一部分的标准基因组序列进行比较,来诊断患者中的2型糖尿病、癌症和心血管疾病或者评估有风险的受试者中发生2型糖尿病、癌症和心血管疾病的风险。这种序列变异的检出表明受试者患有2型糖尿病、癌症或心血管疾病或者患有上述疾病的风险增加。相关基因组序列变异的检出可以进一步指导医生在预防和治疗两方面措施上来制定或完善受试者的治疗方案。
本发明人量化了心血管病和慢性肾病之间的复杂的相互关系,以及多种遗传变体之间的相互作用,这解释了包括肥胖、血压、血脂和血糖等巨大的表型差异。因此,基因型-表型的相互关系也解释了影响心血管疾病风险的肾功能的巨大差异。
本发明人首次发现与癌症(尤其是肝细胞癌)风险有关的未达标的血糖控制(定义为糖化血红蛋白≥7%)和慢性乙型肝炎感染之间的相互关系。他们也发现了使用降血糖药的显著好处,以及达到血糖控制和使用他汀类药物和肾素-血管紧张素阻滞剂对癌症风险的益处。
Ⅱ.通用方法
本发明的实施利用分子生物学领域的常规技术。公开本发明所用一般方法的基础教科书包括Sambrook and Russell,Molecular Cloning,ALaboratory Manual(分子克隆,实验室手册)(第3版,200l);Kriegler,Gene Transfer and Expression:A Laboratory Manual(基因转移和表达:实验室手册)(1990);和Current Protocols in Molecular Biology(新编分子生物学实验指南)(Ausubel等编,1994))。
对核酸而言,大小以千碱基(kb)或碱基对(bp)计。它们是从琼脂糖或丙烯酰胺凝胶电泳、测序核酸或公开的DNA序列估算得到。对蛋白质而言,大小以千道尔顿(kDa)或氨基酸残基数计。由凝胶电泳、测序蛋白质、推导出的氨基酸序列或公开的蛋白质序列估算蛋白质大小。
没有市售的寡核苷酸可以化学合成,例如使用Van Devanter et al,Nucleic Acids Res.12:6159-6168(1984)中所述的自动合成仪按照固相亚磷酰胺三酯法合成,该方法首先由Beaucage and Caruthers,Tetrahedron Lett.22:1859-1862(1981)描述。寡核苷酸的纯化采用任何本领域公认策略进行,例如,天然丙烯酰胺凝胶电泳或阴离子交换高效液相色谱法(HPLC),如Pearson and Reanier,J.Chrom.255:137-149(1983)中所述。
应用在本发明中的感兴趣的序列,例如人CPE或IDE基因的多核苷酸序列以及合成的寡核苷酸(如,引物)可以使用例如Wallace et al.,Gene16:21-26(1981)的双链模板测序的链终止法来验证。
Ⅲ.生物样品采集和基因组DNA序列分析
本发明涉及在取自被测试者的生物样品中确定相关基因(如人CPE或IDE基因)的至少一部分基因组序列,作为检测该测试者中2型糖尿病、癌症或心血管疾病的存在和/或评估上述疾病风险的手段。因此,实施本发明的第一步是从测试对象中获得生物样品(如组织或体液样品)以及从样品中提取基因组DNA。
A.样品的采集和制备
生物样品是从采用本发明的方法进行测试或评估2型糖尿病、癌症或心血管疾病发病风险的个体中获得的。从个体中收集组织或体液样品按照实验室、医院或诊所通常遵循的标准方案(例如在活检过程中、抽血、唾液收集或口腔棉签)来完成。收集适量的样品,并可以在进一步制备之前根据标准程序储存。
根据本发明,本质上可以使用任何组织或体液来进行受试者样品中存在的基因组DNA的分析,只要基因组DNA预期存在于这些样品中即可。制备用于核酸提取的组织或体液样品的方法为本领域技术人员所熟知。例如,应首先处理受试者的上皮组织样品以破坏细胞膜,从而释放出细胞内所含的核酸。
B.基因组序列测定
对相关基因(如CPE或IDE)区段内的可能的序列变异进行研究,以提供关于受试者是否患有2型糖尿病、癌症和/或心血管疾病,或者受试者是否未来有发生2型糖尿病、癌症和/或心血管疾病的风险的指征。
通常适当长度的基因组序列区段被选择用于测序分析。区段可从相关基因的基因组序列中选择,所述基因组序列通过界定该基因cDNA序列的相同边界,再加上距离该边界上、下游约2000个碱基对来界定。被分析的基因组序列长度通常为至少15或20个连续核苷酸,并且可以更长,具有至少25、30、50、100、200、300、400或更多个连续核苷酸。
1.DNA提取和处理
从生物样品中提取DNA的方法是分子生物学领域所熟知并常规实施的,参见例如Sambrook and Russell,同上。应消除RNA污染以避免干扰DNA分析。任选地,可以在进一步分析基因组DNA之前,从生物样品中移除其他成分(如蛋白质和脂质)。
2.任选的扩增和序列分析
对生物样品中的DNA进行所需的处理后,则对DNA进行基于序列的分析,使得可以测定受试者中存在的一种或多种相关基因的基因组序列,然后将其与标准序列进行比较,以检测任何可能的序列变异。在序列分析之前的扩增反应是任选的。多种多核苷酸扩增方法已成功建立,并经常应用于研究中。例如,用于多核苷酸序列扩增的聚合酶链式反应(PCR)的常规方法是本领域公知的,因此本发明对其不作详细描述。关于PCR方法、方案和引物设计原则的综述参见例如Innis,et al.,PCRProtocols:A Guide to Methods and Applications(PCR方案:方法和应用指南),Academic Press,Inc.N.Y.,1990.。从诸如Roche Molecular Systems的供应商处也可获得PCR试剂和方案。
尽管PCR扩增常用于实施本发明,但本领域技术人员应认识到,可通过任何已知的方法来完成相关基因组序列的扩增,这些方法例如连接酶链式反应(LCR)、转录介导的扩增和自我持续序列复制或基于核酸序列的扩增(NASBA),这些方法中的每一种都提供了充分的扩增。
多核苷酸序列测定的技术也被成功建立,并且在相关研究领域被广泛实施。例如,多核苷酸测序的基本原理和常规技术在关于分子生物学和重组遗传学的多篇研究报告和论文中均有描述,例如Wallace et al.,同上;Sambrook and Russell,同上和Ausubel et al.,同上。研究实验室中常规实施的DNA测序方法(无论是手动还是自动化的)均可用于实施本发明。为了实施本发明的方法,适合于测定基因组DNA的多核苷酸序列的其他方法包括但不限于质谱分析、引物延伸、多核苷酸杂交、实时PCR、熔解曲线分析、高分辨率熔解分析、异源双链分析、焦磷酸测序和电泳。
IV.对应的标准序列
为了实施本发明的方法,在进行与受试者相应位置处的相应基因的基因组序列的比较前,选择一种或多种相关基因的标准基因序列,这些基因例如CPE、IDE、LIPC、LPL、CETP、PPARG、GNB3、NOS3、LTA、AGTA1、ADRB2、ADRB3、NPPA、ADD1、SCNN1A、MMP3、ALR2、TNF、APOE和APOC3。表7列出了这些基因的完整名称和基因组序列。
Ⅴ.治疗和预防
通过阐明上述一种或多种特定基因的基因组序列变异与具有这些变异的受试者(尤其是拟合某些图谱的受试者,如亚裔和/或体重指数不超过25kg/m2的受试者)存在2型糖尿病、癌症或心血管疾病或具有升高的发生这些疾病的风险的之间的相关性,本发明人为临床医生提供了有价值的工具,其通常与其他信息及诊断或预测或筛查试验结果相结合,以确定具有某基因组序列变异的受试者应如何进行针对2型糖尿病、任意部位癌症和/或心血管疾病的监测和/或治疗,以便可以预防、消除、改善这些病症症状的严重程度和/或频率,或延迟其发病。例如,对于经由本发明的方法已被认定为具有升高的发生2型糖尿病风险的受试者,医生可以采取药物和非药物治疗,例如生活方式改变(如,使体重降低5%,高纤维饮食,每周步行至少150分钟)和已知降低糖尿病发病风险的药物(例如二甲双胍、α-糖苷酶抑制剂、脂肪酶抑制剂)。被认为具有升高的发生各部位癌症风险的受试者,可以进行频繁的各种类型癌症的筛查,以便通过早期检测以及因而的及时有效的治疗(包括使用降血糖药和诸如他汀类药物和肾素-血管紧张素系统阻滞剂等能阻止高血糖不利影响的药物进行最佳的血糖控制)来提高该受试者的生存机会。对于经由本发明的方法已被认定患有心血管疾病或者有发生心血管疾病风险的受试者,主治医生可给予对抗已知的心血管疾病风险因素(如高水平的血胆固醇和甘油三酯)的药物,并对受试者冠状动脉状况进行定期检测和监控。
VI.试剂盒和装置
本发明提供用于实施本文中所描述的方法以检测受试者中某些基因可能的基因组序列变异的组合物和试剂盒,其可用于多种目的,如检测或诊断受试者中2型糖尿病、癌症和/或心血管疾病的存在,确定受试者发生2型糖尿病、癌症和心血管疾病的风险,以及为受试者中的这些病症制定治疗计划。
用于实施测定相关基因组序列核苷酸序列的分析的试剂盒,通常包括至少一种用于与相关基因组序列的已确定区段特异性杂交的寡核苷酸。任选地,寡核苷酸用可检测部分标记。在某些情况下,寡核苷酸仅与标准序列特异性杂交,而不与任何发生变异的序列杂交。在其他情况下,寡核苷酸与变异序列的一种特定版本发生特异性杂交,但不与其他版本,也不与标准序列杂交。
在某些情况下,试剂盒可以包含至少两种寡核苷酸引物,其可用于通过PCR扩增一种相关基因(如CPE或IDE基因)的至少一段基因组序列。在一些实例中,至少一种寡核苷酸引物被设计成只同标准序列退火,或者只同变异序列的特定版本退火。
另外,本发明的试剂盒可以提供使用说明以指导使用者分析测试样品和评估受试者中2型糖尿病、癌症或心血管疾病的存在或未来风险。
此外,本发明还可以在装置或包含一种或多种这样的装置的系统中体现,这些装置或系统能够实施本文所描述的所有或一些方法步骤。例如,在某些情况下,该装置或系统在接收到采自受试者的生物样品(用于检测2型糖尿病、癌症和心血管疾病,评估发生2型糖尿病、癌症或心血管疾病的风险,或为患有这些病症的任意一种或有发生这些病症的风险的受试者制定治疗)后执行以下步骤:(a)确定样品中相关基因组DNA区段的核苷酸序列;(b)将从样品确定的序列与相应的标准序列进行比较;和(c)提供输出表明受试者是否患有2型糖尿病、癌症或心血管疾病,或者受试者是否有发生2型糖尿病、癌症或心血管疾病的风险。在其他情况下,在步骤(a)已完成和由步骤(a)确定的基因组序列已被输入到该装置中后,本发明的装置或系统执行步骤(b)和(c)的任务。优选地,该装置或系统是部分或完全自动化的。
实施例
仅通过说明而非限制的方式提供以下实施例。本领域技术人员将容易地认识到,可以改变或调整多种非关键的参数以产生基本相同或相似的结果。
实施例1
目的:超过40%的2型糖尿病(T2D)尸检病例显示出胰岛淀粉样蛋白。胰淀素(Amylin)或胰岛淀粉样多肽(IAPP)是高度保守的,并与胰岛素共同分泌。由于加工、降解和稳定过程的失调,IAPP或其前体(前-IAPP)的积累可引起过度寡聚化伴随β-细胞毒性。
研究设计与方法:在多中心亚洲病例对照人群(N=9,901)和香港家族性糖尿病人群(N=472)中,筛选了参与IAPP代谢的6种候选基因中的89个标签单核苷酸多态性(SNPs)(有重复阳性信号)。还用潜在调节作用进行显著SNP的功能分析。
结果:在Meta分析中,羧肽酶E(CPE)基因中的rs1583645和胰岛素降解酶(IDE)基因中的rs6583813与T2D风险增加1.16倍(1.06-1.26)[OR:比值比(95%CI),PMeta=0.001]和1.35倍(1.01-1.81)(PMeta=0.045)相关。使用遗传风险评分(GRS),每个风险变量评分为1,GRS≥3的受试者(人群中的8.2%)相比于GRS<1者,T2D风险增加了45%。在对照受试者中,血浆IAPP增加并且β细胞功能指数与GRS均下降(分别为P=0.008和0.03)。荧光素酶活性分析显示不同细胞系中rs1583645变体间不同的转录活性(分别为P<0.001和0.005)。CPE rs1583645的生物信息学分析揭示了染色质修饰的调控元件和转录因子(TFs)的等位基因特异性结合位点,而IDE rs6583813位于胰岛细胞活性调控元件内。
结论:这些结果有力地支持了IAPP代谢失调在亚洲人群T2D中的重要作用。
引言
2型糖尿病(T2D)特征为多途径紊乱伴随β-细胞功能障碍。大规模全基因组关联研究(GWAS)已经发现40多个与T2D相关的基因座(Voight etal.,Nat Genet42:579-589,2010)。在亚洲,尽管这些风险变体的一些赋予了1.1-1.5倍的风险增加,但这在具有多个遗传变体的携带者中增加至2-3倍(Ng et al.,Diabetes57:2226-2233,2008)。胰淀素或胰岛淀粉样多肽(IAPP)是高度保守的、与胰岛素共同分泌并具有增加的对饱腹感的影响。超过40%的T2D尸检病例具有胰岛淀粉样蛋白,这提示IAPP代谢的重要的致病性作用(Zhao et al.,Diabetes52:2759-66,2003)。最近的研究表明,由于内质网应激(Gu et al.,Life Sci87:724-32,2011),IAPP或其前体(前-IAPP)的累积可导致过度寡聚化伴随β-细胞功能障碍(Hoppener et al.,NEngl J Med343:411-419,2000)。
鉴于此,多种酶参与IAPP代谢,包括加工酶类,即激素原转化酶1和2(PCSK1和PCSK2),以及将前-IAPP转化为IAPP的羧肽酶E(CPE);降解IAPP的胰岛素降解酶(IDE);和稳定淀粉样蛋白的血清淀粉样P成分(APCS)(Pepys et al.,Nature417:254-259,2002;Marzban et al.,Endocrinology146:1808-1817,2005;Bennett et al.,Diabetes52:2315-2320,2003)。这些成分的风险变体与T2D有遗传关联性(Martin et al.,Diabetes51:3568-3572,2002;Harrap et al.,Hum Genet119:541-546,2006;Leak etal.,Mol Genet Metab92:145-150,2007;Zeggini et al.,Methods Mol Biol376:235-250,2007),尽管结果并不总是一致的(Sakagashira et al.,Diabetes45:1279-1281,1996;Utsunomiya et al.,Diabetologia41:701-705,1998;Groves et al.,Diabetes52:1300-1305,2003),这可能是由于样品不足、人群异质性和基因结构的不完全询问。
在本报告中,标签单核苷酸多态性(SNP)方法用于选择参与IAPP代谢的6种候选基因(APCS、CPE、IAPP、IDE、PCSK1和PCSK2)的遗传变体(图5),并在亚洲受试者的多阶段研究中测试了它们对T2D风险和β细胞功能的独立的、联合的影响(表1-3和图2-3)。测试了风险变体的转录活性(图4),并使用生物信息学来探索其功能意义,包括染色质结构的调控元件和转录因子结合位点(TFBSs)的预测(表5)。
材料与方法
进行了两阶段的研究,包括从香港、中国、日本和韩国招募的亚裔受试者。
样本招募
第一阶段研究
所有受试者都是居住在香港的汉族中国人,其祖先中没有任何已知的其他种族来源。自从1995年,每周有30-40名糖尿病患者在香港中文大学-威尔斯亲王医院糖尿病和内分泌中心(CUHK-PWH-DMEC)进行全面评估,作为质量改进计划的一部分。所有受试者进行详细的表型分型以形成香港糖尿病登记簿(Yang et al.,Diabetes Care30:65-70,2007)。在第一阶段的研究中,459名青年发病的T2D个体入选(定义为诊断年龄≤40岁,有至少一名受影响的来自记录簿的一级亲属)。有临床的或自身免疫性T1D的患者(定义为有酮酸中毒史或在有或没有自身抗体诊断的1年内持续需要胰岛)被排除在外。另外的419名糖耐量正常(定义为空腹血糖(PG)<6.1mmol/L和无糖尿病家族史)的对照受试者是从基于社区的健康普查项目和医院志愿者中招募到的(Liu et al.,Diabetes Care29:379-384,2006)。
第二阶段研究
该第二阶段研究中包括:1)随机的无关的病例对照人群,包括3,092名香港中国人、3,388名上海中国人、1,393名韩国人和1,150名日本人;和2)利用家系关联性分析(FBAT)从香港招募的用于分析的472名相关受试者。所有被招募的受试者均为先前描述的在各个国家进行的糖尿病基因研发项目的一部分(Ng et al.,Diabetes57:2226-2233,2008;Ng et al.,Diabetes53:1609-1613,2004;Jia et al.,Diabetologia50:286-292,2007;Furukawa et al.,J Clin Endocrinol Metab93:310-314,2008)。
标签SNP的选择
利用来自北京的汉族中国人(CHB)的HapMap Phase II(www.hapmap.org),通过Haploview v4.0RC2(Barrett et al.,Bioinformatics21:263-265,2005),在r2≥0.8的成对标签模式下,在具有~2kb侧翼区的6种候选基因中,提取最小等位基因频率(MAF)≥0.05的所有SNPs用于标签SNP(tagSNP)选择。连同之前的与T2D和/或相关性状有关的SNPs(IDE的rs4646953、APCS的rs2808661和rs6689429),在第一阶段中对89个SNP进行了基因分型,并且,对T2D具有名义显著性的SNP的受试者在第二阶段的研究中得到了验证。
基因分型
所有第一阶段的SNP使用基质辅助激光解吸电离飞行时间(MALDI-TOF)MassARRAY(Sequenom,San Diego,CA)进行基因分型。只有通过了质量控制(QC)标准[击中率(call rates)≥0.8,MAF≥0.05,一致率>99%,并且没有展现出违背对照受试者中的哈代-温伯格平衡(P>0.001)]的SNP被纳入分析。使用Sequenom’s MassARRAY System(Sequenom,San Diego,CA)或MGB TaqMan Assay(Applied Biosystems,USA)进行第二阶段基因分型。
临床评估和代谢谱分析
临床评估之前已被描述(Yang et al.,Diabetes Care30:65-70,2007;Nget al.,Diabetes53:1609-1613,2004;Li et al.,Diabetes Metab Res Rev22:46-52,2006)。所有参加CUHK-PWH-DMEC的患者均基于欧洲糖尿病护理方案进行了结构化的评估(Piwernetz et al.,Diabet Med10:371-377,1993)。对照受试者进行全面的身体检查,记录血压及人体测量数据(包括禁食过夜后的体重指数(BMI))。空腹血液样品被收集用于遗传分析和生化检测,包括空腹PG和胰岛素。对照受试者的子集进行了75克口服葡萄糖耐量试验(OGTT),在多个时间点收集血液样品用于葡萄糖和胰岛素测量。在FBAT分析中,在无糖尿病一级亲属中,85个受试者的随机亚群具有采用放射免疫测定法在Garth JS Cooper教授的实验室中测定的空腹血浆IAPP的测量结果(Bai et al.,Biochem J343Pt1:53-61,1999)。
计算
通过梯形法则计算OGTT过程中PG和胰岛素的曲线下面积(AUC)。采用方程[空腹胰岛素(mU/l)x空腹PG(mmol/l)÷22.5]计算胰岛素抵抗(HOMA-IR),而β-细胞功能用两种算法估算:1)HOMA-β=[空腹胰岛素(mU/l)x20÷(空腹PG(mmol/l)-3.5)]和2)β细胞功能(x10-6)=[胰岛素AUC30min(min.pmol/l)÷葡萄糖AUC30min(min.mmol/l)](Stumvoll et al.,Diabetes Care23:295-301,2000)。
CPE基因rs1583645的功能研究
生物信息学分析
rs1583645及其侧翼序列(NCBI Build-36.1CHR4:166517861-166517941)的跨物种比对用加州大学圣克鲁斯分校(UCSC)的基因组浏览器(http://genome.cse.ucsc.edu/cgi-bin/hgGateway)显现。此外,根据UCSC基因组浏览器上跟踪的基因调控注释(包括CpG岛、染色质结构和编码组蛋白修饰),检查了该CPE多态性可能的调节功能。
转录因子结合位点(TFBS)预测
为了预测rs1583645区域的TFBS,在矩阵和核心相似性的截止评分为0.8的情况下,使用与7.0数据库(Wingender et al.,Nucleic Acids Res24:238-241,1996)互连的MATCHTM程序(Kel et al.,Nucleic Acids Res31:3576-3579,2003)。然后在相同的矩阵评分阈值下,通过用于分析TFBS的基于网络的rVISTA2.0工具(http://rvista.dcode.org/)验证该预测。
瞬时转染研究
简单地说,通过PCR克隆和QuickChange定点诱变试剂盒(Stratagene,La Jolla,CA,USA),利用以下引物,产生两个具有相同序列除在rs1583645处存在[A/G]变异的克隆,这两个克隆处于具有最小启动子的pGL4.23荧光素酶载体(Promega)中:正向:5’-TAAGAGCTC(SacI)CAGACCTGATGAATTC-3’;反向:5’-CTACTCGAG(XhoI)TAGCTGTCTCTTTGAAC-3’;M1-5’-CCTATGAAGCCACAAACAAGTAATACATGTGCCAGTAAAGTTGG-3’和M2-5’-CCAACTTTACTGGCACATGTATTACTTGTTTGTGGCTTCATAGG-3(下划线标示的为所需的突变)。确定克隆序列后,通过LipofectamineTM2000(Invitrogen)将这些克隆和海肾荧光素酶载体[pGL4.73(hRluc/SV40)]独立地转染入HepG2和大鼠INS-1E细胞中,并通过双荧光素酶报告基因检测试剂盒(Promega),按生产商说明书,在至少3次独立的实验中一式三份检测其在具有不同变体的细胞中的荧光素酶活性。
统计分析
所有数据视情况表示为平均值±标准偏差或中位数(四分位数间距)。偏斜数据利用自然对数转换用于统计分析。排除定义为偏离平均值≥或≤4个标准偏差的离群数据。除非注明,所有统计检验均通过PLINK(v.0.99http://pngu.mgh.harvard.edu/~purcell/plink)或Windows的SPSS15.0(SPSSInc.,Chicago,IL,USA)进行。等位基因模型的研究能力用PASS2008(NCSS,LLC.Kaysville,Utah)评估。假设了等位基因模型,对于具有0.1MAF的SNP,样本大小具有90%以上的能力来检测T2D风险增加至少20%。对于遗传模型(有或没有调整)下的分类数据,通过χ2检验和逻辑回归(LR)分析分析了每个研究人群中通过QC检验的SNP。为了调整第一阶段研究中的多个检测,经验P值由PLINK执行的遗传模型中最显著模型下的10,000次排列呈现。除非注明,P或P经验值≤0.05被认为是显著的(双尾检验)。风险关联表示为比值比(OR)和95%置信区间(CI)。
根据P值选择遗传模型中的最佳模型用于组合人群中T2D的Meta分析。后者由9.6.0.4版的Windows PLINK和MedCalc(MedCalc Software,Mariakerke,Belgium)执行的固定效应Cochran-Mantel-Haenszel(CMH)检验完成,利用研究人群作为一阶层来评估组合OR、95%CI和显著性水平。研究人群中OR的异质性用Cochran Q统计量评估,Cochran Q统计量被计算为个别研究效果和跨研究的合并效果之间方差的加权和。有显著异质性时(Q统计量P<0.05),从随机效应模型计算出的效应量也被报道(DerSimonian and Laird,Control Clin Trials7:177-188,1986)。为了检验显著性SNP和假设加性模型的联合效应,每个风险等位基因被分配1分,从而生成最大为4分的遗传风险评分(GRS)。应用LR分析,并针对“研究人群”的虚拟变量进行调整,以检验GRS与T2D的风险关联性,所述“研究人群”用代表来自香港(第一阶段和第二阶段)、上海、日本和韩国的5个无关-病例对照人群的1-5编码。线性回归分析也在加性模型下应用,以测试有或没有按需要调整的对照受试者中GRS的效应与β-细胞功能。
对于家族性遗传数据,孟德尔错误和潜在的基因分型错误通过PEDCHECK(v.1.1;http://watson.hgen.pitt.edu)检查,并相应地被去除。FBAT(v.2.0.3;http://www.biostat.harvard.edu/~fbat)基于传递不平衡检验(TDT)被使用,但通常允许使用-e选项来检测“无连锁且无关联”的零假设在遗传加性模型中进行分析。关联强度(power)通过FBAT(Lange et al.,Am J Hum Genet71:575-584,2002)估算,假设疾病盛行率为10%,加性模型SNP(MAF为0.1)的等位基因OR为1.2。对于双荧光素酶报告基因分析,所有实验利用由3次独立测试组成的一式三份的设置完成。所有结果以平均值±标准误表示,并且曼-惠特尼U检验用于比较各组之间的差异。
结果
表1显示了研究人群的临床特征。在第一阶段研究中,包括459名无关的中国T2D患者和419名年龄和性别匹配的对照。在第二阶段研究中重复了阳性信号,包括3,092名香港中国人(1,114名病例和1,978名对照),3,388名上海中国人(1,716名病例和1,672名对照),1,393名韩国人(761名病例和632名对照)和1,150名日本人(568名病例和582名对照)。包括由472名相关的受试者组成的基于家族的香港中国人人群,其中在75克OGTT过程中的多个时间点测量PG和胰岛素,用于分析β-细胞功能。
第一阶段实验
在第一阶段研究中,878名无关的病例和对照的6种基因中的89个SNP被成功进行基因分型。这些SNPs包括了这些靶基因中所有常见SNP(MAF≥0.05)的79%。被纳入分析的包括符合QC标准的大多数SNP,除了4种SNP[rs2808661(APCS),rs12306305和rs1056007(IAPP),以及rs4646953(IDE)]。表4列出了所有SNP对于T2D的等位基因P和P经验值。这些SNP中的6个与CPE基因中的4个SNP(rs1583645,rs6841638,rs10021007和rs17046561),IDE基因中的1个SNP(rs6583813),和PCSK2基因中的1个SNP(rs8117664)有名义相关性,OR(95%CI)的范围为1.24(1.01-1.51)至1.34(1.02-1.75))(P经验=0.013-0.05)。
第二阶段重复和Meta分析
这6个SNP在9,023名来自香港、上海、日本和韩国的亚洲受试者中进行重复,在5%显著性水平时具有90%以上的能力来检测范围为1.24-1.34的OR。在上海中国人中,因为小组优化不成功而弃去rs6583813,并由rs2149632替代,后者与rs6583813有高度的连锁不平衡(LD)[使用HapMap CHB,r2=0.94;D’=1]。表2汇总了每个病例-对照人群的结果,以及每个关联SNP的遗传模型下组合人群的Meta分析。在由于亚种族和其他疾病改性物而具有一些人群异质性的至少在一个遗传模型中,T2D与CPE基因的rs1583645和rs10021007以及IDE基因的rs6583813有名义相关性。对于每个SNP,选择最有效的遗传模型,并将固定的效应模型应用于没有显示出OR异质性的SNP(Q统计数量P>0.05)。否则采用随机效应模型。在这6个SNP之中,只有CPE基因的rs1583645和rs17046561以及PCSK2基因的rs8117664没有表现出OR异质性。使用第一和第二阶段实验中组合的数据,CPE和IDE基因的rs1583645和rs6583813与T2D显著相关(分别为PMeta=0.001和0.045)。
IDE和CPE变体的联合效应
随后,在亚洲病例-对照人群中测试这2个SNP对T2D风险的联合效应和香港中国人对照受试者的子集中的β-细胞功能,其中在75克OGTT过程中可得到其PG和胰岛素水平。假设加性模型,每个风险变体被随意分配1分,从而生成遗传风险评分(GRS),产生的最高得分为4分。使用LR分析并针对5个研究人群(编码:1-5)的每一组进行调整,GRS与T2D风险线性相关(P调整后的<0.001,图2)。具有最高GRS的受试者占研究人群的8.2%,相比具有最低GRS的受试者患T2D的风险高45%(P调整 后的=0.02)。对照受试者也按GRS≤1,2和≥3划分,每组人数相似,用于进行定量性状分析。随着GRS的增加,β细胞功能指数和30分钟时胰岛素AUC逐渐下降(分别为P=0.03和0.05)(表3)。
在FBAT分析中,由于样本有限,这些SNP没有一个与T2D相关,对于MAF为0.1,其在加性模型下只有10%的能力来检测风险增加20%(数据未显示)。在这些相关受试者的子集中,85名非糖尿病受试者具有血浆IAPP水平的测量结果。在这些受试者中,GRS与血浆IAPP水平的增加和IAPP与胰岛素的摩尔比相关联(分别P=0.008和0.006)(图3A和3B)。
表6显示了在有糖尿病家族史的患者中IDE的遗传变体与癌症的风险关联性,以及在非肥胖型受试者中CPE的遗传变体与心血管疾病的风险关联性。在有阳性家族史的受试者中,具有高IDE和CPE遗传变体GRS的受试者癌症风险也有增加。图6和图7显示在具有糖尿病家族史的患者亚组中的癌症累积发生率,所述患者是IDE或CPE遗传变体的携带者。
功能分析
由于CPE基因的rs1583645位于可调节基因表达的启动子区附近,所以运用功能学和生物信息学分析来探索该SNP的功能。CPE rs1583645的侧翼区在物种之间轻度保守(胰岛开放染色质和淋巴母细胞样细胞系组蛋白H3赖氨酸27的三甲基化(H3K27me3)的可能位点)。这些发现表明,在此区域中的遗传变体可以调节CPE基因的基础转录表达。TFBSs也被用于rs1583645多态性[A/G]预测(表5),并揭示了11种转录因子(TF),其可以特异性结合这些变体(A等位基因的Oct1,Hand1/E47;G等位基因的E47,USF,MyoD,N-Myc,c-Myc/Max,AREB6;两个等位基因的S8,CCAAT,NF-Y)的一个或两个变体。虽然其中一些转录因子的功能是未知的,但其中有几个转录因子涉及与疾病相关的免疫、中间代谢和细胞周期,这些疾病包括T2D、血脂异常和癌症。这些结果表明,rs1583645中的单核苷酸取代或其紧密联锁的未确定变体通过染色质修饰和结合TF网络(取决于组织特异性和这些表观遗传学模型的刺激因子)可能修饰基因表达(Relton et al.,PLoS Med7:e1000356,2010)。
然后检测CPE基因rs1583645的功能活性,扩增CPE-A/G变体的PCR片段,并将其克隆入pGL4.23载体中。使用直接测序并证实其与基因库中的参考序列(登录号GL000046.1)有100%的同源性。rs1583645[A/G]多态性对CPE基因转录活性的影响利用在HepG2和大鼠INS-1E细胞中瞬时转染的双荧光素酶报告基因测定进行测试。在转染了携带rs1583645G-风险等位基因的构建体的两种细胞系中,基础荧光素酶活性比转染了rs1583645A-等位基因的细胞高50-66.7%(分别P<0.001和P=0.005,曼-惠特尼U检验),提示该多态性的调节作用。
讨论
在该多阶段的实验中,标签SNP方法和遗传统计、生物信息学和功能分析用来研究IAPP途径的成分对T2D风险和β细胞功能的独立和联合的影响。在Meta分析中,证实了CPE和IDE基因中的2个SNP与T2D,增加的IAPP以及降低的β细胞功能的风险关联性。这些发现被生物信息学和功能分析所证实,提示该区域可能含有通过染色质修饰和结合TF的基因表达调控元件。
在本研究中,HapMap计划最近公布的数据用来选择标签SNP,其对于这6种候选基因的每一种捕获了90%以上的常见SNP(MAF>5%)。由9,901名受试者组成的病例-对照组合人群,对于具有10%MAF的SNP,具有90%以上的能力来检测T2D风险增加至少20%。在第一阶段的研究中,选择了CPE、IDE和PCSK2基因中的6个SNP,其对于重复表现出名义显著性。虽然这些SNP在亚洲人群之间在其效应量上显示出一些异质性,这可能是由于基因架构以及其他混杂因素如生活方式、文化和环境因素的细微差别(He et al.,PLoS One4:e4684,2009),但是meta分析揭示了T2D分别与rs1583645(CPE基因)和rs6583813(IDE基因)一致的关联性。重要的是,对照受试者中具有≥3个风险变体的受试者(占研究人群的8.2%),有增加45%的T2D风险和降低的β细胞功能。在有多个风险变体的非糖尿病受试者中,血浆IAPP水平的上升与功能和生物信息学分析结果相符。鉴于组织表达不同,需要实验研究来证明这些风险变体是否能够引起IAPP合成增加和β细胞毒性,尤其是存在生产过剩应激物(例如,胰岛素抵抗,肥胖)和/或清除率降低的情况下。由于rs6583813远离IDE基因的启动子区,其功能仅利用生物信息学分析进行推测。
功能分析
CPE在包括脑和胰腺的组织中广泛表达,且负责在各种前体蛋白(包括前-IAPP)的加工过程中切割两个碱性氨基酸残基。R283W突变和棕榈酸盐(酯)处理引起的CPE活性减弱导致激素原的累积(施加内质网应激)和β-细胞凋亡(Chen et al.,Hum Mutat18:120-131,2001;Jeffrey et al.,ProcNatl Acad Sci U S A105:8452-8457,2008)。在实验研究中,CPE基因上游区域的缺失导致其在不同细胞系中的转录活性降低(Jung et al.,MolEndocrinol6:2027-2037,1992)。在转染了弗林蛋白酶可切割的人胰岛素原cDNA的垂体GH3细胞中,由于膜形式CPE的差异表达,过表达CPE与胰岛素合成的增加有关,而不是与可变的基础胰岛素分泌相关(Polastri et al.,Cell Transplant11:803-811,2002)。综上所述,CPE基因启动子区中的基因变体可导致CPE活性失调和β-细胞功能障碍。
相比其他的顺式调控元件,rs1583645距离转录起始位点(TSS)相对较远,这提示可能的远端的基因调控效应。由于CPE基因的启动子区适度地保守,貌似T2D与rs1583645的风险关联性可能是通过改变CPE基因的转录活性来介导的。其他的研究表明了CPE基因的TSS位点的远端区对转录活性的适度影响,尽管表达是组织依赖性的(Jung et al.,1992,同上)。在HepG2和大鼠INS-1E细胞系中,相比空的pGL4.23载体,两个构建体均表现出转录活性降低,在风险(G-等位基因)和非风险(A-等位基因)变体间效应有差异,后者比前者被更多地抑制。众所周知,胰岛素和IAPP分泌以固定的比例被严格调控。CPE活性的降低可以导致低胰岛素应答,伴随前-IAPP的累积或继发于β-细胞应激的IAPP增加。可选择地,高CPE活性可使IAPP水平增高伴随β-细胞毒性,这是由于过度寡聚化尤其伴随降低的清除率。没有测量CPE活性,这些功能性SNP的最终效果仍不确定。肯定地说,这些变体的差异效应及其在对照组受试者中与IAPP:胰岛素亚型的关系这些发现支持了它们的功能相关性。
生物信息学分析
通过生物信息学分析,已确定CPE基因rs1583645的侧翼区序列在物种之间中度保守。染色质和组蛋白修饰在胰岛细胞结构和功能的调节中发挥重要作用(Bhandare et al.,Genome Res20:428-433,2010;Gaulton etal.,Nat Genet42:255-259,2010;Stitzel et al.,Cell Metab12:443-455,2010)。CPE基因是已报道的在胰岛细胞中功能已知的基因之一,位于胰岛选择性开放染色质内(Gaulton et al.,2010,同上),所述胰岛选择性开放染色质包括多种基因调控元件。后者招募TF形成DNA环,其与启动子间接作用以调节基因表达,尽管其位于TSS的上游位置(Noonan andMcCallion,Annu Rev Genomics Hum Genet11:1-23,2010)。为此目的,预期11种转录因子或者与任一[A/G]变体特异性结合或者与两者均结合。尽管这些预测结果需要实验验证,但这些TF中的两种定位于染色体1q区,这一区域是多个人群中T2D的重复最多的基因座(Prokopenko et al.,Diabetes58:1704-1709,2009)。这些基因的遗传变体,能结合CPE基因的G-等位基因的上游刺激因子(USF)和能结合CPE基因的A-等位基因且已知与组蛋白相互作用从而改变染色质组织和炎症反应的八聚体结合因子1(Oct1,也被称为POU2F1)(Kim et al.,Mol Cell Biol16:4366-4377,1996)),均与中国人群的T2D有关联(Ng et al.,Diabet Med27:1443-1449,2010)。
一些研究人员已经报道了T2D与IDE基因的遗传变体的风险关联性(Kwak et al.,Diabetes Res Clin Pract79:284-290,2008;Rudovich et al.,JMol Med,87:1145-115;2009)。在本研究中,对于第一阶段实验的基因分型,除了标签SNP(rs4304670代替rs4646957;rs6583813代替rs2149632)外,本发明人还包括这些SNP(rs4646953,rs4646958和rs1887922)。仅选择了rs6583813用于重复,其他的SNP由于质量控制失败(rs4646953)或者没有显著性而被排除在外,后者可能是由于样本大小不足而引起的。除了T2D风险增加之外,在非糖尿病受试者中,CPE和IDE基因在降低β-细胞功能上有联合作用。最近的一项欧洲的研究显示胰岛素分泌减少与rs2149632(与rs6583813高度连锁不平衡)的关联性(Kwak et al.,2008,同上;Rudovich et al.,2009,同上)。
在与deCODE(其采用GWAS调查了冰岛人中多种疾病的风险变体)的一项合作研究中,在HHEX-IDE LD中重复了T2D与3个SNP(rs1111875、rs5015480和rs7923837)的风险相关性(Ng et al.,Diabetes57:2226-2233,2008)。发现大多数的SNP在HHEX基因附近,IDE基因的上游。在本分析中,rs6583813位于IDE基因3’端附近,与上述GWAS中发现的3个SNP有低度或中度的连锁不平衡(在香港中国人中,分别r2=0.67,0.36和0.29)。尽管HHEX基因在此方面是倍受青睐的基因,关于TCF7L2、HHEX和IDE SNPs对T2D风险的联合效应的最新报道支持了所有这些基因的重要性(Nordman et al.,Exp Clin Endocrinol Diabetes117:186-190,2009)。在一项调查人类胰岛表观基因组的新研究中,rs6583813位于推测的调控元件中(NCBI Build36.1CHR10:94199479-94203011),该调控元件是表观遗传调控的可能位点(Stitzel et al.,2010,同上)。
IDE和CPE遗传变异的联合效应
胰岛淀粉样变性是T2D的标志(Hoppener et al.,2000,同上)。在亚洲人群中,遗传变体(S20G突变)与T2D风险增加有关(Lee et al.,JEndocrinol54:541-6;2001),突变型肽具有增加的淀粉样变性特性(Sakagashira et al.,Am J Pathol157:2101-2109,2000)。最近的研究表明,IAPP聚集形成寡聚体从而引起β细胞毒性而不是原纤维形成(Zhao et al.,Transl Res153:24-32,2009)。
由于以家庭为基础的人群中样本大小不足和年龄较轻的原因,IDE或CPE基因中没有SNP表现出与T2D风险关联性。然而,在这个以家庭为基础的人群中,具有高GRS的非糖尿病受试者表现出IAPP水平增高和高IAPP:INS比值。连同功能研究结果一起,全部证据都支持这样一种假设,即IAPP的异常加工可能损害β细胞功能尤其伴随清除率降低。以这个角度来看,高水平的IAPP,无论是原发性或代偿性的,均能够诱导ER应激和触发凋亡信号转导通路,伴随C/EBP同源蛋白(CHOP)和半胱天冬酶-3的表达增高(Zhao et al.,2009,同上;Huang et al.,Diabetes56:2016-2027,2007;Gu et al.,Life Sci87:724-32,2011)。IAPP诱导β细胞毒性的其他机制包括线粒体功能障碍、氧化应激以及JNK/p38促分裂原活化蛋白激酶途径的活化(Li et al.,Int J Biochem Cell Biol43:525-341,2011;Li et al.,Int J Biochem Cell Biol,41:1526-35;2009)。
虽然IDE基因rs6583813的功能意义还未被证明,但是胰岛素和IAPP二者共享相似的转录调节因子和成熟及降解的酶促途径(German et al.,Mol Cell Biol12:1777-1788,1992;Kurochkin,Trends Biochem Sci26:421-425,2001;Steiner et al.,Diabetes Obes Metab11Suppl4:189-196,2009)。一般来说,IAPP和胰岛素水平保持在稳定的比例,从而在分泌颗粒中形成恒定比例的IAPP-胰岛素复合物,虽然这些肽对刺激物或条件表现出不同的动力学和反应。在实验研究中,暴露于脂肪酸诱导IAPP水平的过表达,从而导致胰岛素分泌受损(Hoppener et al.,2000,同上;Qi et al.,Am J Physiol Endocrinol Metab,298:E99-E107,2010)。因此,扰乱这些加工酶和降解酶的活性的遗传或后天的因素理论上可以改变IAPP:胰岛素比值,从而增加IAPP寡聚化、原纤维形成、β-细胞功能障碍和T2D的风险(Jaikaran et al.,Biochem J377:709-716,2004)。
局限性
对于整个人群中MAP>0.05的SNP,本研究有90%以上的能力来检测至少20%的风险增加。然而,在涉及有家族性T2D的459名年轻患者和419名对照的第一阶段实验中,排除具有低MAF或效应量的一些SNP,可能引入2型错误。在较大的样本大小中分析这些SNP将有助于研究它们与T2D风险的关联性。尽管CPE rs1583645中的变体对基础转录活性有不同的影响,相邻的变体通过具有较强因果关系的LD结构的影响不能被排除。
结论
在该多阶段的实验中,将对IAPP代谢的了解与在多个人群中的遗传分析相结合,以证明与T2D和β细胞功能相关的基因型-表型相关性。利用推理性的假设,证实T2D与CPE和IDE基因中的SNP的风险关联性。在具有受累家族成员的高风险非糖尿病受试者中,这些风险变体与β细胞功能降低有关,而不是与IAPP水平和IAPP:胰岛素比值增加有关。同时,生物信息学分析表明,这些SNPs位于染色质修饰和DNA-蛋白结合的调控位点内。虽然这些SNP的效应量平均为15-20%,但其群体频率范围为5%-50%。在此背景下,常见复杂疾病例如T2D的高达50%的人群归因危险度可用20个或更少的易感基因(有10-20%的效应量)来解释(Yang et al.,Int J Epidemiol34:1129-1137,2005)。综上所述,这些发现支持IAPP代谢在T2D中的重要作用,并且利用代谢途径中候选基因的标签SNP可以预测高风险受试者,用于预防T2D。
本申请中引用的所有专利、专利申请以及其他出版物,包括GenBank登录号,都通过引用整体并入用于所有目的。
表3.香港中国人无关对照(N=419)中,遗传风险评分(GRS)与β细胞功能的关联性,CPE基因rs1583645和IDE基因rs6583813的1个风险等位基因各获1分。
数据显示为平均值±标准偏差或者a中位数(四分位数间距),并且在经对数变换后在加性模型下通过用年龄、性别和BMI调整的线性回归进行分析。粗体的P值表明表型显著性。AUC:曲线下面积。
表7.相互作用以解释2型糖尿病肾功能巨大差异(以肾功能作为心血管疾病的主要预测指标)的基因的名称和序列。
表8.在5年的中位随访期过程中,通过癌症状况分组的中国2型糖尿病患者的前瞻性人群中临床、生化特征和药物使用。一些数据已由Yang et al.Diab ResClin Pract,90:343-51,2010报道。
缩略语:IQR,四分位数间距;BP:血压;LDL-C,低密度脂蛋白胆固醇;HDL-C,高密度脂蛋白胆固醇;ACR,新鲜尿白蛋白:肌酐比值;eGFR,估算的肾小球滤过率;ACEIs,血管紧张素转换酶抑制剂;ARBs,管紧张素Ⅱ受体阻滞剂,RAS,肾素-血管紧张素系统;TZD,噻唑烷二酮;来自Wilcoxon双样本检验;来自卡方检验;来自Fisher精确检验;§,包括在登记时开始使用或在登记前已经使用并在随访期持续使用。
表9.香港糖尿病登记簿登记的中国2型糖尿病患者的5年前瞻性人群中药物使用对癌症的危险比。对于香港糖尿病登记簿的背景和数据结构可参阅Chan et al Curr Cardiovasc Risk Rep;5:230-9,2011。
模型1针对倾向评分(对于ACEIs或ARBs,c-统计量=0.80;对于他汀类药物为0.80;对于胰岛素为0.79;对于二甲双胍为0.73;对于磺脲类药物为0.66;和对于TZDs为0.74)进行调整,采用逻辑回归程序进行估算,以年龄、性别、BMI、LDL-C、HDL-C、甘油三酯、吸烟情况、饮酒、HbA1c、SBP、Ln_ACR、估算的GFR、病程、PAD、视网膜病变、神经病变、既往心肌梗死和中风作为独立变量。
模型2针对LDL-C相关风险指标进行调整,HDL-C与下列因素无线性相关性:甘油三酯、BMI(<24,≥27.6kg/m2)、年龄、性别、职业、饮酒和吸烟、病程、SBP、在随访期间使用他汀类药物、ACEIs/ARBs、贝特类药物、磺脲类药物、二甲双胍和TZDs以及这些药物的倾向评分。

Claims (29)

1.评估受试者中2型糖尿病、癌症或心血管疾病的存在或风险的方法,所述方法包括以下步骤:
(a)进行分析以确定所述受试者生物样品中存在的羧肽酶E(CPE)的至少一部分基因组序列的核苷酸序列,和
(b)将步骤(a)中确定的所述序列与相应的CPE标准序列进行比较,
其中当与所述标准序列相比,步骤(a)中确定的所述序列中存在变异,表明所述受试者患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险。
2.如权利要求1所述的方法,其中所述样品是血液或唾液样品。
3.如权利要求1所述的方法,其中所述受试者是亚州血统。
4.如权利要求1所述的方法,其中所述受试者的BMI不超过25kg/m2
5.如权利要求1所述的方法,其中所述受试者有2型糖尿病、癌症或心血管疾病的家族史,但尚未被诊断为2型糖尿病、癌症或心血管疾病。
6.如权利要求1所述的方法,其中步骤(a)中的所述分析包括扩增反应。
7.如权利要求6所述的方法,其中扩增反应是聚合酶链式反应(PCR)。
8.如权利要求1所述的方法,其中步骤(a)中的所述分析包括质谱分析。
9.如权利要求1所述的方法,其中当所述受试者被诊断患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险时,其还包括给予所述受试者降胆固醇药或降血糖药的步骤。
10.如权利要求1所述的方法,其还包括用胰岛素降解酶(IDE)重复步骤(a)和(b),其中当与相应的标准序列比较时,获自所述样品的IDE基因组序列中存在变异,表明所述受试者患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险。
11.评估受试者中2型糖尿病、癌症或心血管疾病的存在或风险的方法,所述方法包括以下步骤:
(a)进行分析以确定所述受试者生物样品中存在的胰岛素降解酶(IDE)的至少一部分基因组序列的核苷酸序列,和
(b)将步骤(a)中确定的所述序列与相应的IDE标准序列进行比较,
其中当与所述标准序列相比,步骤(a)中确定的所述序列中存在变异,表明所述受试者患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险。
12.如权利要求11所述的方法,其中所述样品是血液或唾液样品。
13.如权利要求11所述的方法,其中所述受试者是亚州血统。
14.如权利要求11所述的方法,其中所述受试者的BMI不超过25kg/m2
15.如权利要求11所述的方法,其中所述受试者有2型糖尿病、癌症或心血管疾病的家族史,但尚未被诊断为2型糖尿病、癌症或心血管疾病。
16.如权利要求11所述的方法,其中步骤(a)中的所述分析包括扩增反应。
17.如权利要求16所述的方法,其中所述扩增反应是聚合酶链式反应(PCR)。
18.如权利要求11所述的方法,其中步骤(a)中的所述分析包括质谱分析。
19.如权利要求11所述的方法,其中当所述受试者被诊断患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险时,其还包括给予所述受试者降胆固醇药或降血糖药的步骤。
20.如权利要求11所述的方法,其还包括用羧肽酶E(CPE)重复步骤(a)和(b),其中当与相应的标准序列比较时,获自所述样品的CPE基因组序列中存在变异,表明所述受试者患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险。
21.如权利要求1或11所述的方法,其中所述序列变异是CPE的rs1583645多态性或者IDE的rs6583813多态性。
22.如权利要求1或11所述的方法,其还包括用下述一种或多种基因重复步骤(a)和(b):LIPC、LPL、CETP、PPARG、GNB3、NOS3、LTA、AGTA1、ADRB2、ADRB3、NPPA、ADD1、SCNN1A、MMP3、ALR2、TNF、APOE和APOC3基因,其中当与相应的标准序列比较时,所述样品中确定的基因组序列存在变异,表明所述受试者患有2型糖尿病、癌症或心血管疾病或者有患上述疾病的风险。
23.用于评估受试者中2型糖尿病、癌症或心血管疾病的存在或风险的试剂盒,其包含用于在扩增反应中特异性地扩增以下的两种寡核苷酸引物:(1)羧肽酶E(CPE)或胰岛素降解酶(IDE)基因组序列的至少一段;或(2)(1)的互补物。
24.如权利要求23所述的试剂盒,其包含用于特异性地扩增羧肽酶E(CPE)基因组序列的至少一段和胰岛素降解酶(IDE)基因组序列的至少一段的两套寡核苷酸引物。
25.如权利要求23所述的试剂盒,其中扩增反应是聚合酶链式反应(PCR)。
26.如权利要求23所述的试剂盒,其还包含说明书手册。
27.用于评估受试者中2型糖尿病、癌症或心血管疾病的存在或风险的阵列,其包含用于特异性检测以下的至少一种寡核苷酸探针:(1)羧肽酶E(CPE)或胰岛素降解酶(IDE)基因组序列的至少一段;或(2)(1)的互补物。
28.如权利要求27所述的阵列,其包含固体基底。
29.如权利要求27所述的阵列,其包含至少两种寡核苷酸探针,一种用于特异性检测CPE基因组序列或其互补物的一段,另一种用于特异性检测IDE基因组序列或其互补物的一段。
CN201380005681.4A 2012-01-27 2013-01-28 糖尿病的生物标志物 Active CN104395479B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261591598P 2012-01-27 2012-01-27
US61/591,598 2012-01-27
PCT/CN2013/071053 WO2013110245A1 (en) 2012-01-27 2013-01-28 Biomarkers for diabetes

Publications (2)

Publication Number Publication Date
CN104395479A true CN104395479A (zh) 2015-03-04
CN104395479B CN104395479B (zh) 2019-03-15

Family

ID=48872882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380005681.4A Active CN104395479B (zh) 2012-01-27 2013-01-28 糖尿病的生物标志物

Country Status (4)

Country Link
US (1) US10689702B2 (zh)
CN (1) CN104395479B (zh)
HK (1) HK1202899A1 (zh)
WO (1) WO2013110245A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019149247A1 (zh) * 2018-01-31 2019-08-08 完美(中国)有限公司 用于2型糖尿病的生物标志物及其用途
CN111065749A (zh) * 2017-06-28 2020-04-24 德国亥姆霍兹慕尼黑中心健康与环境研究中心(有限公司) 用于确定发展1型糖尿病的风险的方法
CN112513295A (zh) * 2018-06-15 2021-03-16 Opti 西拉公司 用于预测疾病并发症和/或对治疗的反应的多基因风险评分
CN112635049A (zh) * 2020-12-23 2021-04-09 无锡市第二人民医院 一种研究HSD17B13 rs72613567基因变异和肾功能损伤之间关系的方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11064942B1 (en) 2018-05-04 2021-07-20 Optum Labs, Llc Methods and systems to detect eating
US11185260B1 (en) 2018-08-14 2021-11-30 Optum Labs, Llc State-based methods and systems using continuous glucose monitors and accelerometers to regulate glucose levels

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000023784A2 (en) * 1998-10-21 2000-04-27 Chen, Hong Method of detecting risk of type ii diabetes based on mutations found in carboxypeptidase e

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100540678C (zh) * 2004-04-15 2009-09-16 香港中文大学 应用遗传标记和芯片预测糖尿病肾病危险的方法
WO2008065544A2 (en) * 2006-09-11 2008-06-05 Mcgill University Genetic predictors of risk for type 2 diabetes mellitus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000023784A2 (en) * 1998-10-21 2000-04-27 Chen, Hong Method of detecting risk of type ii diabetes based on mutations found in carboxypeptidase e

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
EN-ZHI JIA ET AL: "Association of the mutation for the human carboxypeptide E gene exon 4 with the severty of coronary atherosclerosis", 《MOL BIOL REP》 *
KWAK S H ET AL: "Association of polymorphisms in the insulin-degrading enzyme gene with type 2 diabets in the korean population", 《DIABETES RESEARCH AND CLINICAL PRACTICE》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111065749A (zh) * 2017-06-28 2020-04-24 德国亥姆霍兹慕尼黑中心健康与环境研究中心(有限公司) 用于确定发展1型糖尿病的风险的方法
WO2019149247A1 (zh) * 2018-01-31 2019-08-08 完美(中国)有限公司 用于2型糖尿病的生物标志物及其用途
CN112513295A (zh) * 2018-06-15 2021-03-16 Opti 西拉公司 用于预测疾病并发症和/或对治疗的反应的多基因风险评分
CN112635049A (zh) * 2020-12-23 2021-04-09 无锡市第二人民医院 一种研究HSD17B13 rs72613567基因变异和肾功能损伤之间关系的方法

Also Published As

Publication number Publication date
US10689702B2 (en) 2020-06-23
WO2013110245A1 (en) 2013-08-01
HK1202899A1 (zh) 2015-10-09
CN104395479B (zh) 2019-03-15
US20150045238A1 (en) 2015-02-12

Similar Documents

Publication Publication Date Title
Qi et al. Genetic variants at 2q24 are associated with susceptibility to type 2 diabetes
Abdullah et al. The architecture of risk for type 2 diabetes: understanding Asia in the context of global findings
Al-Attar et al. Association between the FTO rs9939609 polymorphism and the metabolic syndrome in a non-Caucasian multi-ethnic sample
Kato Insights into the genetic basis of type 2 diabetes
Imamura et al. A single-nucleotide polymorphism in ANK1 is associated with susceptibility to type 2 diabetes in Japanese populations
Wu et al. Association and interaction analyses of genetic variants in ADIPOQ, ENPP1, GHSR, PPARγ and TCF7L2 genes for diabetic nephropathy in a Taiwanese population with type 2 diabetes
Sandrim et al. Endothelial nitric oxide synthase haplotypes affect the susceptibility to hypertension in patients with type 2 diabetes mellitus
CN104395479A (zh) 糖尿病的生物标志物
Matharoo et al. Association of adiponectin (AdipoQ) and sulphonylurea receptor (ABCC8) gene polymorphisms with Type 2 Diabetes in North Indian population of Punjab
de Melo et al. Polymorphisms in FTO and TCF7L2 genes of Euro-Brazilian women with gestational diabetes
CA2781074A1 (en) Genetic markers for weight management and methods of use thereof
Du et al. Genetic variants in ADIPOQ gene and the risk of type 2 diabetes: a case–control study of Chinese Han population
CN103154272B (zh) 利用遗传标志物和阵列预测糖尿病相关并发症风险的方法和试剂盒
Li et al. A novel plasma lncRNA ENST00000416361 is upregulated in coronary artery disease and is related to inflammation and lipid metabolism
Kim et al. DNA methylation changes associated with type 2 diabetes and diabetic kidney disease in an East Asian population
Joung et al. Haplotype analysis of prostate stem cell antigen and association with prostate cancer risk
Gusti et al. Glutathione s-transferase (GSTT1 rs17856199) and nitric oxide synthase (nos2 rs2297518) genotype combination as potential oxidative stress-related molecular markers for type 2 diabetes mellitus
Zeggini A new era for Type 2 diabetes genetics
El-Shal et al. Adiponectin gene polymorphisms in Egyptian type 2 diabetes mellitus patients with and without diabetic nephropathy
Miao et al. Circulating miR-3659 may be a potential biomarker of dyslipidemia in patients with obesity
Hou et al. UCP2–866G/A polymorphism is associated with prediabetes and type 2 diabetes
Sohrabifar et al. MicroRNA-copy number variations in coronary artery disease patients with or without type 2 diabetes mellitus
Song et al. The genetic side of diabetic kidney disease: a review
CN105431552A (zh) 多组学标记在预测糖尿病中的用途
Pu et al. Identification of novel genetic variants, including PIM1 and LINC01491, with ICD-10 based diagnosis of pulmonary arterial hypertension in the UK Biobank cohort

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1202899

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant