CN101056990A - 表皮生长因子受体基因启动子的多态性 - Google Patents

表皮生长因子受体基因启动子的多态性 Download PDF

Info

Publication number
CN101056990A
CN101056990A CNA2005800064657A CN200580006465A CN101056990A CN 101056990 A CN101056990 A CN 101056990A CN A2005800064657 A CNA2005800064657 A CN A2005800064657A CN 200580006465 A CN200580006465 A CN 200580006465A CN 101056990 A CN101056990 A CN 101056990A
Authority
CN
China
Prior art keywords
egfr
polymorphism
sequence
patient
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800064657A
Other languages
English (en)
Inventor
M·J·拉泰恩
W·刘
F·伊诺桑蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Chicago
Original Assignee
University of Chicago
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Chicago filed Critical University of Chicago
Publication of CN101056990A publication Critical patent/CN101056990A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/142Toxicological screening, e.g. expression profiles which identify toxicity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及表皮生长因子受体(EGFR)基因的多态性。在某些实施方案中,本发明是关于EGFR基因启动子中影响EGFR表达的单核苷酸多态性(SNP)的组合物和方法。鉴定与EGFR表达或活性相关的多态性,可为评价EGFR靶向治疗药物的潜能和毒性,预测病人的临床预后,和为评价病人发生EGFR失调相关疾病的风险提供新的方法和组合物。

Description

表皮生长因子受体基因启动子的多态性
                              发明背景
本发明要求2004年3月1日提交的美国临时专利申请系列号60/549,069的优先权,此专利内容纳入本文作参考。由于在国立卫生研究院基金号U01GM61393支持下,政府对本发明拥有权利。
1.发明领域
本发明一般涉及分子生物学和肿瘤学领域。更具体说,本发明涉及表皮生长因子受体(EGFR)基因中与EGFR表达和活性相关的多态性。在某些实施方案中,本发明是关于涉及EGFR基因启动子中影响EGFR表达的单核苷酸多态性(SNP)的组合物和方法。
2.相关技术描述
人表皮生长因子受体(EGFR)在细胞增殖、分化和存活的信号传导通路中起着重要作用。发现约30%的人原发肿瘤中EGFR有过度表达。在这些肿瘤中其活性似乎可通过提高细胞增殖、移动、粘附、入侵能力和阻断凋亡而促进肿瘤生长(Tysnes等,1997)。EGFR过度表达和调节失常与病人预后差、肿瘤转移、疾病晚期和对化疗、激素疗法及放疗的抗药性相关(Salomon等,1995;Akimoto等,1999;Wosikowski等,2000)。
EGFR的5’调控区长约4kb,覆盖外显子1的2kb上游和2kb下游。调控元件包括启动子区和两个分开的增强子区。EGFR启动子和增强子的功能已研究得很清楚和见诸文献(Ishii等,1985;Haley等,1987;Johnson等,1988;Kageyama等,1988;Maekawa等,1989)。简而言之,其启动子中没有发现TATA或CAAT盒。而有多个转录起始位点(Ishii等,1985;Haley等,1987;Johnson等,1988;Kageyama等,1988)。已发现了许多顺式和反式调节子。这些调节子包括:EGF反应性DNA结合蛋白(ERDBP-1)、p53、p63、Sp1、维生素D-反应元件(VDRE)和雌激素反应元件,它们反映了对EGFR调控认识的困惑。
脱氧核糖核酸酶I的足迹试验显示,Sp1能结合EGFR启动子中的4个CCGCCC序列(-457至-440,-365至-286,-214至-200,和-110至-84),因而可能在基因调控中起着关键作用(Johnson等,1998)。Gebhardt及同事的研究(1999)证明EGFR内含子1中(接近下游增强子)有14-21个重复性的似乎是调节EGFR表达的二核苷酸(CA)n重复序列多态性。含有21个重复序列的较长等位基因与较短的含16个重复序列的等位基因相比,显示基因表达减少了80%(Gebhardt等,1999;Buerger等,2000)。关于多态性CA重复序列的研究资料提示该多态性位点对易患癌症可能具有作用(Brandt等,2004)。
鉴于EGFR在肿瘤生物学中的重要性,近年来几种以EGFR为靶标的癌症治疗药物正在开发。EGFR靶向药物的作用通常是抑制EGFR磷酸化或阻抑EGF结合。近年批准的治疗转移性非小细胞肺癌的一种药物是吉非替尼。吉非替尼是一种选择性EGFR-酪氨酸激酶抑制剂,能抑制EGF激活的EGFR自身磷酸化。
由于EGFR是许多抗癌药物的直接靶标,EGFR的不同表达可能直接影响到药物的反应和毒性。因此,EGFR基因中与基因表达或活性相关的多态性对进一步了解细胞信号转导和阐明药物的反应/毒性均很重要。EGFR基因多态性的研究也可用于进一步的药物设计。
EGFR表达还与癌症以外的疾病有关。例如,据报道EGFR微卫星多态性与常染色体显性多囊性肾病(ADPKD)的发展速度之间存在相关性(Magistroni等,2003)。已提出影响EGFR功能或表达的突变可能易患炎性大肠疾病(Martin等,2002)。因此,鉴定EGFR基因中与其表达或活性相关的多态性,对进一步了解各种EGFR失调相关疾病的进展将会很重要。
                            发明概述
本发明公开了EGFR 5’调控区中的12个多态性位点。更具体说,本发明人证明了-216 G>T多态性与EGFR启动子区的表达增加相关。鉴定与EGFR表达相关的多态性能为评价EGFR-靶向治疗药物的潜在效力和/或毒性,预测病人的临床预后,和评价病人发生EGFR失调相关疾病的风险提供新的方法和组合物。
本发明公开了EGFR基因座中位于以下核苷酸位置的多态性位点:-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。EGFR基因座的核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034是指它们相对于翻译起点的位置,翻译起点指定为+1。没有指定为0的核苷酸位置。根据此命名法,紧靠+1 5’的核苷酸是-1,紧靠+1 3’的核苷酸是2。翻译起始位点(+1)对应于EGFR基因座的核苷酸9,385(GenBank登录号AF288738,纳入本文作为参考)和SEQ ID NO:1的核苷酸505。SEQ ID NO:1包含AF288738的核苷酸8,881-9,405。
本发明人发现的独特多态性是-1435 C>T、-1300 G>A、-1249 G>A、-1227 G>A、-761 C>A、-650 G>A、-544 G>A、-486 C>A、-216 G>T、-191 C>A、169 G>T和2034G>A。由于这些多态性位于EGFR基因的5’调控区中,它们可能与基因调控有关。
因此在一种实施方案中,本发明提供预测细胞中EGFR表达水平的方法,该方法包括确定细胞中一个或两个EGFR基因上核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034中一个或多个的序列。因此可预测含有这种细胞的病人可能具有一般水平的EGFR表达。在一优选实施方案中,该方法包括测定细胞中EGFR基因的一种或两种等位基因。在一种或两种等位基因的-216位存在T,表明表达水平较高。“表达水平较高”是其表达水平比EGFR基因的两个等位基因-216位为G的细胞表达水平更高。术语“测定”按其单纯和普通的含义使用;指通过调查、推理或计算找出或作出决定。
本发明方法也可利用与位于EGFR基因座以下核苷酸位置上的多态性连锁不平衡的多态性:-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。“连锁不平衡”(本文使用的“LD”在本领域也称为“LED”)按本领域技术人员所知的其单纯和普通含义使用。LD指两个基因座的等位基因(即某给定基因的变体形式)或多态性的特定组合比预计的更经常出现的情况。关于连锁不平衡,如本领域技术人员所测定,有显著性用于指统计学的p或α值可为0.25或0.1,可为0.1、0.05、0.001、0.00001或更低。可利用EGFR单倍型与EGFR蛋白表达水平之间的相关性将其基因型(即生物体的基因组成)与表型(即生物体或细胞显示的物理性状)相关连。“单倍型”按本领域技术人员所知的其单纯和普通含义使用,指沿一条同源染色体分布的两个或多个等位基因,或多态性的基因型。
可采用本领域技术人员已知的任何方法测定位于EGFR基因座以下核苷酸位置的序列或与EGFR基因座以下核苷酸位置的序列连锁不平衡的序列:-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。可直接或间接测定该序列。感兴趣核苷酸位置的序列可用间接方法测定,例如通过测定与感兴趣位置的特定核酸连锁不平衡的位置上的核苷酸序列。测定特定核苷酸位置的序列的方法包括:例如,杂交试验、等位基因特异性扩增试验、测序试验、微量测序试验、侵染性切割试验和限制性酶试验。在一具体实施方案中,采用限制性酶BseR1消化测定是否存在-216 G>T多态性。-216位含有T的等位基因可用BseR1切割,而-216位含有G的等位基因用此酶不可切割。
在其它实施方案中,本发明提供评价EGFR靶向治疗药物治疗病人的EGFR失调相关疾病潜在效力的方法,包括测定该病人一种或两种EGFR基因中核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034的序列。
EGFR失调相关疾病可以是与相当的正常细胞相比,EGFR过度表达、低表达、表达时间不适当所致的疾病。EGFR调节不当相关疾病的例子包括:癌症、常染色体显性多囊肾病和炎症疾病如炎性肠病。
EGFR靶向治疗药物可以是能直接或间接调节EGFR活性的任何药物。本领域已知的EGFR靶向治疗药物通常指抑制EGFR磷酸化或阻抑EGF结合的药物。两种已得到FDA批准的EGFR靶向治疗药物为:Iressa(吉非替尼)和Erbitux(西妥昔单抗)。另一种EGFR靶向治疗药物,Tarceva(埃罗替尼)正在III期临床试验中。Iressa和Tarceva是小分子,而Erbitux是单克隆抗体。其它EGFR靶向药物通过调节其转录调节EGFR活性。例如,用EGF、地塞米松、甲状腺素、视黄酸、干扰素α或野生型p53处理细胞来直接或间接刺激EGFR mRNA产生。
在某些方面,本发明提供评价EGFR靶向治疗药物治疗病人癌症的潜在效力的方法,包括测定该病人一种或两种EGFR基因中核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034的序列。在某些实施方案中,EGFR靶向治疗药物是吉非替尼(gefitinib)、埃罗替尼(erlotinib)或西妥昔单抗(cetuximab)。在一优选方式中,测定-216位的序列。在某些实施方案中,病人的EGFR基因的一种或两种等位基因在-216位含有T时,表明该病人用EGFR靶向治疗药物的疗效与二等位基因-216位含有G的病人相比会降低。
在某些实施方案中,本发明的方法还包括获得样品。样品可以是含有可测定其基因组DNA中一种或两种EGFR基因核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034的序列的样品。可通过,例如活检、静脉穿刺、抽吸或擦拭获得这种样品。该样品可获自任何组织或体液。在某些实施方案中,样品可含有口腔细胞、单核细胞或癌细胞。
在某些方面,本发明的方法还包括给予病人EGFR靶向治疗药物。
在其它实施方案中,本发明提供预测患EGFR失调相关疾病病人临床预后的方法,该方法包括测定该病人一种或两种EGFR基因中一个或多个以下核苷酸位置的序列或与一个或多个以下核苷酸位置连锁不平衡的序列:-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。在某些实施方案中,多态性是-216 G>T。某等位基因-216位存在T,表明EGFR蛋白表达升高。在某些方面,EGFR蛋白表达升高预示预后不良。在某些实施方案中,EGFR失调相关疾病是癌症。对癌症病人而言,预后不良表示,例如对化疗、激素疗法或放疗的抗药性提高。预后不良也表示转移风险升高或生存时间减少。
在一实施方案中,本发明提供评价EGFR靶向治疗药物对病人毒性风险的方法,包括测定该病人一种或两种EGFR基因的一个或多个核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034是否存在多态性。在一方面,所述多态性是-216 G>T。在一实施方案中,一种或两种等位基因的-216位存在T,表明EGFR靶向治疗药物的毒性低。
在其它实施方案中,本发明提供评价病人发生癌症风险的方法,包括测定该病人一种或两种EGFR基因的一个或多个核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034是否存在多态性。在一实施方案中,所述多态性是-216 G>T。
在本发明的某些方面,所示方法还包括采集病人的病史,以确定该病人是否处在发生癌症的风险中,或是否需要EGFR靶向治疗药物。
本发明还提供试剂盒。一实施方案中,本发明提供了检测核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034中一个或多个上的多态性的试剂盒。在某些实施方案中,该试剂盒装有能检测所述多态性存在的核酸。所述核酸是引物或探针。在某些实施方案中,所示探针包含在寡核苷酸阵列或微阵列中。在其它实施方案中,该试剂盒装有用于测定是否存在多态性的限制性酶。在某些实施方案中,该试剂盒装有核酸酶和限制性酶二者。可将对照核酸装入此试剂盒中。
在某些实施方案中,该试剂盒的核酸包含SEQ ID NO:2的7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100、200、300、400、500或更多个连续核苷酸。
在某些方面,本发明提供了评价EGFR靶向治疗药物在病人中的潜在效力的试剂盒,该试剂盒装有用于测定EGFR基因座中核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034上是否存在多态性的核酸。在其它方面,本发明提供评价EGFR靶向治疗药物在某病人中潜在效力的试剂盒,该试剂盒装有用于测定EGFR基因座中核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034是否存在多态性的限制性酶。
考虑可采用本文所述的任何一种方法或组合物来实施本文所述的其它方法或组合物。
权利要求书中所用的术语“或”用于指“和/或”,除非清楚地表明只指另一些,或另一些相互排斥,虽然该揭示支持的定义只指另一些和“和/或”。
此申请书中,术语“大约”表示一种数值,包括测定该值所用仪器或方法产生的标准差。
按常务专利法,词语“一种”当在权利要求书或说明书中与词“包括”联用时,指一种或多种,除非另有专门示出。
本发明的其它目的、特征和优点将通过以下描述变得更为清晰。然而应理解以下详述和具体实施例虽然表明了本发明的具体实施方案,但只是为了阐明本发明,因为本领域技术人员知道根据这种详述作出的各种变化和修饰都属于本发明的思路和范围内。
                            附图简述
以下附图组成了本说明书的一部分,包括这些附图以进一步显示本发明的某些方面内容。通过参见一幅或多幅这些附图,结合本文提供的详述和具体实施可更好地理解本发明。
图1图1是EGFR基因座图。伸展的EGFR调控区显示有启动子、增强子和外显子1。如箭头所指显示该调控区中的12个核苷酸多态性位置。
图2图2显示EGFR启动子区的核苷酸序列。该核苷酸序列从-505至+21,其中+1为翻译起始密码子的第一个核苷酸,没有0位核苷酸。也示出了-216 G>T多态性、-191 C>A多态性、Sp1结合位点、转录起始位点、ScaI切割位点的位置以及正向引物的位置。
图3图3显示构建用于荧光素酶活性试验的载体图。EGFR启动子的405bpKpnI-ScaI片段克隆在到荧光素酶基因上游的多克隆位点中。也示出了用于测定这些克隆片段序列的引物RVP3和GLP2的位置。
图4图4显示在采用荧光素酶报告构建物的瞬时转染试验中,EGFR多态性-216 G>T和-191 C>A的4个单倍型的表达活性。荧光素酶基因的有关表达已用PRL-TK载体中的renilla基因水平标准化。
图5图5显示测定核蛋白与-216G和-216T等位基因结合效力的电泳迁移试验(EMSA)。采用SpI共有序列探针作为对照。EMSA中所用的探针和竞争序列见表4所列。观察到与-216G等位基因(泳道1)相比,-216T等位基因(泳道3)的结合效力高得多。
图6A-B在MDA-MB-231、MCF-7、HEK-293和SL-2细胞中瞬时转染pG3EGFRluc(*1至*4)。对于人细胞系,用160ng pRL-TK载体共转染1.6μgpGL3EGFRluc。对于SL-2细胞,用100ng pPac-SpI载体共转染300ng pGL3EGFRluc,将200光单位的荧光素酶活性相对表达量按每微克总蛋白/ml设定为1。-216G/T-191C/A的G-C和T-C单倍型之间启动子活性有显著差异(所有p值小于0.04)。数据以平均值±标准差表示。MDA-MB-231、MCF-7、和HEK-293细胞系中的EGFR相对表达量,和-216G/T与-191C/A多态性的相应基因型见图B。将EGFRmRNA水平按1000拷贝的β肌动蛋白基因标准化。实验重复三次数据以平均值±标准差表示。
                    阐述性实施方案的描述
A.表皮生长因子受体
人表皮生长因子受体(EGFR)是一种跨膜蛋白。其配体如表皮生长因子和TGF-α与其胞外表面的N-末端结合诱导了二聚体化和激活了其胞内功能域的酪氨酸激酶活性。EGFR活化导致细胞级联反应,最终导致DNA合成和细胞增殖、成熟、存活和凋亡。
EGFR的表达主要在转录水平上受到调节(Xu等,1984)。业已证明,用EGF、地塞米松、甲状腺素、视黄酸、干扰素α或野生型p53处理可直接或间接激活EGFRmRNA的产生(Deb等,1994;Grandis等,1996;Hudson等,1989;Subler等,1994;Xu等,1993)。
EGFR的5’调控区长约4kb,覆盖外显子1的2kb上游和2kb下游。调控元件包括启动子区和两个分开的增强子区。EGFR启动子和增强子的功能已研究得很清楚和见诸文献(Ishii等,1985;Haley等,1987;Johnson等,1988;Kageyama等,1988;Maekawa等,1989,各自纳入作为参考)。简而言之,其启动子中没有发现TATA或CAAT盒。而有多个转录起始位点(Ishii等,1985;Haley等,1987;Johnson等,1988;Kageyama等,1988)。已发现了许多顺式和反式调节子。这些调节子包括:EGF反应性DNA结合蛋白(ERDBP-1)、p53、p63、Sp1、维生素D-反应元件(VDRE)和雌激素反应元件,它们反映了对EGFR调控认识的困惑。
脱氧核糖核酸酶I的足迹试验显示,Sp1能结合EGFR启动子中的4个CCGCCC序列(-457至-440,-365至-286,-214至-200,和-110至-84),因而可能在基因调控中趁着关键作用(Johnson等,1998)。Gebhardt及同事的研究(1999)证明EGFR内含子1中(靠近下游增强子)有14-21个重复性的似乎是调节EGFR表达的二核苷酸(CA)n重复序列多态性。含有21个重复序列的较长等位基因与较短的含16个重复序列的等位基因相比,显示基因表达减少了80%(Gebhardt等,1999;Buerger等,2000)。关于多态性CA重复序列的研究资料提示该多态性位点对易患癌症可能具有作用(Brandt等,2004)。
发现约30%的人原发肿瘤中EGFR有过度表达。在这些肿瘤中其活性似乎可通过提高细胞增殖、移动、粘附、入侵能力和阻断凋亡而促进肿瘤生长(Tysnes等,1997)。EGFR过度表达和调节失常与病人预后差、肿瘤转移、疾病晚期和对化疗、激素疗法及放疗的抗性相关(Salomon等,1995;Akimoto等,1999;Wosikowski等,2000)。
根据EGFR过度表达与某些癌症有关似乎其促进了肿瘤生长的观察,鉴定EGFR基因中与基因表达相关的多态性,对预测个体发生癌症的风险和预测癌症病人的预后可能很重要。此外,也可利用EGFR表达相关的多态性来评价EGFR靶向治疗药物的毒性、剂量和潜在效力。
几种EGFR靶向治疗药物目前正在开发中。EGFR靶向治疗药物通常指抑制EGFR磷酸化或阻抑EGF结合的药物。两种已得到批准的EGFR靶向治疗药物为:Iressa(吉非替尼)和Erbitux(西妥昔单抗),Tarceva(埃罗替尼)正在III期临床试验中。由于EGFR是许多抗癌药物的直接靶标,EGFR的不同表达可能直接影响到药物的反应和毒性。因此,EGFR基因中与基因表达或活性相关的多态性对进一步了解细胞信号转导和阐明药物的反应/毒性二者均很重要。EGFR基因多态性的研究也可用于进一步的药物设计。
EGFR表达还与癌症以外的疾病有关。EGFR是肾小管增生中的关键因素。近年来,据报道EGFR微卫星多态性与常染色体显性多囊性肾病(ADPKD)的发展速度之间存在相关性(Magistroni等,2003)。也已证明用特异性酪氨酸激酶抑制剂(EKI-785)抑制EGFR,可减缓ADPKD小鼠模型的疾病发展(Sweeney等,1999)。
人EGFR作图位于染色体7p12中,该区域与炎性肠病连锁(Satsangi等,1996)。此外,已在结肠炎动物模型中EGFR免疫反应性的显著升高(Reinshagen等,1993)。已提出影响EGFR功能或表达的突变可能易患炎性大肠疾病(Martin等,2002)。
鉴于EGFR在调节细胞增殖中的重要性,EGFR基因中与其表达或活性相关的多态性对进一步了解EGFR失调相关疾病的发展很重要。本发明在EGFR基因的5’调节区中鉴定到12种多态性:1435 C>T、-1300 G>A、-1249 G>A、-1227 G>A、-761C>A、-650 G>A、-544 G>A、-486 C>A、-216 G>T、-191 C>A、169 G>T和2034 G>A。根据它们的位置与翻译起始位点的关系鉴定这些多态性,翻译起点指定为+1。根据此命名法,紧靠+1 5’的核苷酸是-1,紧靠+1 3’的核苷酸是2。翻译起始位点(+1)对应于EGFR基因座的核苷酸9,385(GenBank登录号AF288738)和SEQ ID NO:1的核苷酸505。SEQ ID NO:1包含AF288738的核苷酸8,881-9,405。
一种SNP,-1249 G>A在上游增强子中,而-216 G>T和-191 C>A在启动子区中。令人感兴趣的是,-216 G>T位于Sp1结合位点,T置换G可改变Sp1结合。-191 C>A靠近转录起始位点。因此,这些SNP可能对EGFR转录有显著影响。
B.核酸
本发明某些实施方案涉及各种核酸,包括启动子、扩增引物、寡核苷酸探针和涉及基因组DNA分析用的其它核酸元件。在某些方面,核酸包括野生型、突变或多态性核酸。
术语“核酸”是本领域熟知的。本文中“核酸”一般用于指DNA、RNA分子(即链)或其衍生物或同类物,包括核苷碱基。核苷碱基包括,例如DNA中发现的天然产生的嘌呤或嘧啶碱基(如腺嘌呤“A”,鸟嘌呤“G”,胸腺嘧啶“T”或胞嘧啶“C”)或RNA中的碱基(如A,G,尿嘧啶“U”或C)。术语“核酸”包括“寡核苷酸”和“多核苷酸”,它们是术语“核酸”的亚属。术语“寡核苷酸”指长约3-100个核苷碱基的分子。术语“多核苷酸”指长度至少大于100个核苷碱基的分子。“基因”指基因产物的编码序列,以及该基因产物的内含子和启动子。除EGFR基因外,认为其它调控区如EGFR的启动子和增强子也是本发明权利要求所述组合物和方法要用的核酸。
这些定义通常指单链分子,但在具体实施方案中也包括与该单链分子部分、基本上或完全互补的其它链。因此,核酸可包括双链分子或三链分子,它们含有与某分子特定序列互补的一条或多条链或“互补物”。如本文所用,单链核酸可用前缀“ss”表示,双链核酸可用前缀“ds”表示,三链核酸用前缀“ts”表示。
术语“基因”指涉及产生多肽链的DNA区段;它包括编码区之前和之后的区域,及各编码区段(外显子)之间的间插序列(内含子)。“启动子”是核酸序列中控制转录起始和速度的区域。启动子可包含能结合例如RNA聚合酶和其它转录因子以启动核酸序列特异性转录的调节性蛋白质和分子的元件。术语“增强子”指涉及核酸序列转录活性的顺式作用调节序列。增强子可按两种取向之一发挥功能,可位于启动子上游或下游。
1.核酸的制备
核酸可按本领域普通技术人员已知的技术,如化学合成、酶促产生或生物学方法产生来制备。合成核酸(如合成寡核苷酸)的非限制性例子包括用磷酸三酯、亚磷酸酯或亚磷酰胺化学试剂和欧洲专利266,032(纳入本文作参考)所述的固相技术,或通过Froehler等,1986和美国专利5,705,629(纳入本文作参考)中所述的脱氧核苷H-膦酸酯中间物体外化学合成来制备核酸。在本发明的方法中,采用一种或多种寡核苷酸。在例如美国专利4,659,774;4,816,571;5,141,813;5,264,566;4,959,463;5,428,148;5,554,744;5,574,146;5,602,244中披露了寡核苷酸合成的各种不同机制,其各自内容纳入本文作参考。
酶促产生核酸的非限制性例子包括在扩增反应,如PCRTM(见例如美国专利4,683,202和4,682,195,各纳入本文作参考)或美国专利5,645,897(纳入本文作参考)中所述的寡核苷酸合成方法中产生核酸。生物学方法产生核酸的非限制性例子包括在活细胞中产生重组核酸(即复制),例如在细菌中复制重组DNA载体(见例如Sambrook等,2001,纳入本文作参考)。
2.核酸的纯化
核酸可用聚丙烯酰胺凝胶、氯化铯梯度离心、层析柱或本领域普通技术人员已知的其它方法纯化(见例如Sambrook等,2001,纳入本文作参考)。
在某些方面,本发明涉及的核酸是分离的核酸。如本文所用,术语“分离的核酸”指经过分离不含有一种或多种细胞其它成分,或没有大量总基因组和转录核酸的核酸分子。在某些实施方案中,“分离的核酸”指经过分离不含有其它细胞组分或体外反应组分,如脂质或蛋白质大分子、小的生物分子等的核酸。
3.核酸区段
在某些实施方案中,所述核酸是核酸区段。如本文所用,术语“核酸区段”是核酸的片段,非限制性例子如只编码EGFR基因序列部分的核酸。因此,“核酸区段”可包含某基因序列的任何部分,包括约2个核苷酸至全长基因,包括调控区至聚腺苷酸信号,和任何长度,包括所有的编码区。
可根据某特定核酸序列设计各种核酸区段,可以是任何长度。通过给某序列按排序号,例如第1个残基为1,第两个残基为2等等;可产生定义所有核酸区段的算法:
n至n+y
其中,n是该序列1至最后编号之间的一个整数,y是核酸区段减1的长度,n+y不超过该序列的最后编号。因此,对于10聚体,核酸区段对应于碱基1-10、2-11、3-12等等。对于15聚体,核酸区段对应于碱基1-15、2-16、3-17等等。对于20聚体,核酸区段对应于碱基1-20、2-21、3-22等等。在某些实施方案中,所述核酸区段可以是探针或引物。“探针”本文一般用于指在检测方法或组合物中所用的核酸。“引物”本文一般指延伸或扩增方法或组合物中所用的核酸。
4.核酸互补物
本发明也包括与核酸互补的核酸。核酸“互补物”或“与另一核酸互补”指其碱基能与另一核酸按标准的Watson-Crick、Hoogsteen或反向Hoogsteen结合互补规律配对。另一核酸本文用于指不同的分子,或与同一分子部分不同的序列。在优选实施方案中,互补物是用于检测核酸多态性的杂交探针或扩增引物。
术语“互补的”或“互补物”本文也用于指即使在不是所有的核苷碱基都与对应核苷碱基配对时也能与另一核酸链或双链体杂交的连续核苷碱基或半连续核苷碱基(如该分子中不存在一个或多个核苷碱基)序列组成的核酸。然而,在某些诊断或检测实施方案中,优选完全互补的核酸。
C.核酸检测
本发明的某些实施方案涉及鉴定EGFR中的多态性、相关基因型或单倍型与表型,其中,所述基因型是EGFR活性或表达降低的或改变的表型,然后鉴定已给予或将给予EGFR靶向治疗药物或化合物的病人的多态性。因此,本发明涉及鉴定多态性的多种试验和其它核酸检测方法。因此核酸的用途是在涉及核酸杂交的实施方案中用作探针或引物。它们可用于本发明的诊断或筛选方法。检测编码EGFR的核酸及参与EGFR多肽或转录物表达或稳定性的核酸也包括在本发明中。以下提供核酸检测的通用方法,通过以下具体实施例来检测多态性,包括单核苷酸多态性(SNP)。
1.杂交
采用的探针或引物在3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、60、70、80、90或100个核苷酸之间,优选长17-100个核苷酸,或在本发明某些方面,长达1-2kb碱基可更长,以使稳定地和选择性地形成双链体分子。通常优选长20个碱基的连续的互补序列来提高所得杂交分子的稳定性和选择性。通常宜设计用于杂交的含有20-30个核苷酸,若需要甚至更长的一种或多种互补序列的核酸分子。可通过,例如用化学方法直接合成片段,或在重组载体中导入选择的序列来重组产生而不难制备这种片段。
在某些实施方案中,所述探针或引物含有SEQ ID NO:1的7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、60、70、80、90或100个连续核苷酸。在某些实施方案中,所述探针或引物含有SEQ ID NO:2的7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、60、70、80、90或100个连续核苷酸。
因此,可利用本发明的核苷酸序列与DNA和/或RNA的互补延伸段选择性形成双链体分子,或提供用于扩增DNA或RNA的引物。取决于应用,可能需要采用不同杂交条件来获得所述探针或引物对靶序列的不同程度选择性。
对于需要高度选择性的应用,通常需要采用较高严谨性条件来形成杂交。例如,较低的盐浓度和/或较高温度条件,如约0.02M-0.10M NaCl,温度约50-70℃。如果探针或引物与模板或靶链之间有任何错配,对这种高严谨条件耐受受差,特别适合分离特定基因或检测特定多态性。一般可理解通过加入增加量的甲酰胺可赋予杂交条件更高的严谨性。例如,在高严谨性条件下,与滤膜结合的DNA杂交可在65℃在0.5M NaHPO4,7%十二烷基硫酸钠(SDS),1mM EDTA中进行,及68℃用0.1xSSC/0.1%SDS洗涤(Ausubel等,1996)。
提高盐浓度和/或降低温度可赋予严谨性较低的条件。例如,采用约0.1-0.25MNaCl和约37-55℃温度可提供中等严谨条件,而约0.15-0.9M的盐和约20-55℃温度可提供低严谨条件。在低严谨条件下,如温和的严谨条件下,可用0.2xSSC/0.1%SDS和42℃进行洗涤(Ausubel等,1996)。根据所需结果不难操纵杂交条件。
在其它实施方案中,杂交是在例如50mM Tris-HCl(pH8.3),75mM KCl,3mMMgCl2,1.0mM二硫苏糖醇和温度约20-37℃的条件下完成的。采用的其它杂交条件可包括约10mM Tris-HCl(pH8.3),50mM KCl,1.5mM MgCl2,温度约40-72℃。
在某些实施方案中,优选采用本发明定义的核酸序列与适当的方法,如标记,联用以测定杂交。各种各样的适当指示物是本领域已知的,包括荧光、放射活性标记、酶标记或能补检测的其它配体,如亲和素/生物素。在优选实施方案中,可能需要采用荧光标记或酶标记,如脲酶、碱性磷酸酶或过氧化物酶,而不是放射活性标记或其它对环境不利的试剂。就酶标记而言,可采用已知能显色的底物来提供可观察的或用分光光度法可检测的检测物质,来鉴定与含有互补核酸样品的特异性杂交。在其它方面,可提供特定的核酸酶切割位点,通过是否存在切割的核酸来检测特定的核苷酸序列。
一般而言,本文所述探针或引物在杂交溶液中例如在PCRTM中以及在固相实施方案中,将用作试剂,来检测相应基因的表达或基因型。在涉及固相的实施方案中,测试的DNA(或RNA)吸附于或结合于选择的基质或表面上。然后使这种固定的单链核酸与所选的探针在所需条件下杂交。条件的选择取决于具体环境(如取决于G+C含量、靶核酸的类型。核酸的来源、杂交探针的大小等)。具体应用时的最佳杂交条件是本领域技术人员熟知的。洗涤杂交分子除去非特异性结合探针分子后,通过测定结合的标记物量来检测和/或定量测定杂交。代表性的固相杂交方法见美国专利5,843,663;5,900,481和5,919,626中所述。实施本发明可采用的其它杂交方法见美国专利5,849,481;5,849,486和5,851,772。本说明书此章节中引用的这些和其它参考文献的有关部分内容纳入本文作参考。
2.核酸扩增
可按照标准方法从细胞、组织或其它样品中分离得到用作扩增模板的核酸(Sambrook等,2001)。在某些实施方案中,用或不用基本纯的模板核酸对全细胞或组织均浆或生物液体样品进行分析。所述核酸可以是基因组DNA或片段化的或全细胞RNA。当采用RNA时,可能需要先将RNA转变为互补的DNA。
术语“引物”本文用于指包含的核酸,其能以模板依赖方式引导新生核酸的合成。通常引物是长10-12个和/或30个碱基对的寡核苷酸,但可采用更长的序列。可提供双链和/或单链形式的引物,虽然优选单链形式。
在允许选择性杂交的条件下,使设计的能与EGFR基因座相应核酸(Genbank登录号AF288738)或其变体和片段选择性杂交的引物对与模板核酸接触。SEQ ID NO:1包括EGFR基因座的核苷酸8,881-9,405,SEQ ID NO:1的核苷酸505对应于EGFR基因的翻译起始位点,因此该翻译起始位点位于AF288738的核苷酸9,385处。取决于所需的应用,可选择高严谨性杂交条件使其只与引物完全互补的序列杂交。在其它实施方案中,可降低严谨性进行杂交,以扩增含有与引物序列一个或多个错配(碱基)的核酸。一旦杂交后,使模板-引物复合物与一种或多种酶接触以促进模板依赖性核酸的合成。可进行多轮扩增,也称为“循环”直到产生了足够量的扩增产物。
可检测、分析或定量测定扩增产物。在某些应用中,可通过肉眼观察检测。在某些应用中,检测可包括通过化学发光法、掺入了放射标记或荧光标记的放射活性闪烁图象法、或甚至采用电子和/或温度脉冲信号的系统(Affymax technology;Bellus,1994),间接鉴定该产物。
可利用许多模板依赖方式来扩增某给定模板样品中存在的该寡核苷酸序列。最佳的已知扩增方法之一是聚合酶链式反应(称为PCRTM),其详述见美国专利4,683,195;4,683,202和4,800,159和Innis等,1988,各文献内容纳入本文作参考。
另一种扩增方法是连接酶链式反应(“LCR”),见欧洲专利申请No,320308,其内容纳入本文作参考。美国专利4,883,750描述了与LCR相似的方法,使探针对与靶序列结合。也可采用以PCRTM为基础的方法和寡核苷酸连接酶试验(OLA)(以下作进一步描述)见美国专利5,912,148。
可用于实施本发明扩增靶核酸序列的其它方法见美国专利:5,843,650;5,846,709;5,846,783;5,849,546;5,849,497;5,849,547;5,858,652;5,866,366;5,916,776;5,922,574;5,928,905;5,928,906;5,932,451;5,935,825;5,939,291和5,942,391,英国专利申请2 202 328和PCT/US89/01025,各自内容纳入本文作参考。也可在本发明的扩增方法中采用PCT申请PCT/US87/00880中描述的Qβ复制酶。
也可在扩增本发明核酸中采用恒温扩增方法,此方法利用限制性内切酶和连接酶来扩增一条链含有核苷酸5’-[α-巯基]-三磷酸限制位点的靶分子(Walker等,1992)。美国专利5,916,779所述的链置换扩增(SDA)是另一种进行核酸恒温扩增的方法,包括多轮链置换和合成,即缺口翻译。
其它的核酸扩增方法包括转录为基础的扩增系统(TAS),基包括核酸序列为基础的扩增(NASBA)和3SR(Kwoh等,1989;PCT申请WO 88/10315,其内容纳入本文作参考)。欧洲专利申请329 822披露了一种涉及循环合成单链RNA(“ssRNA”),ssDNA和双链DNA(dsDNA)的核酸扩增方法,可用于本发明。
PCT申请WO 89/06700(其内容纳入本文作参考)披露了一种基于启动子区/引物序列与靶单链DNA(“ssDNA”)杂交,然后转录该序列的许多RNA拷贝的核酸序列扩增方案。此方案不用循环,即新模板不从所得RNA转录物产生。其它扩增方法包括“RACE”和“一侧PCR”(Frohman,1994;Ohara等,1989)。
3.核酸检测
任何扩增后,可能需要分离扩增产物与模板和/或过量的引物。一实施方案中,用琼脂糖、琼脂糖-丙烯酰胺凝胶电泳以标准技术分离扩增产物(Sambrook等,2001)。可切下分离的扩增产物并从凝胶上洗脱供进一步操作。利用低熔点琼脂糖凝胶,通过加热凝胶取得分离的条带,然后抽提该核酸。
也可用旋转柱和/或本领域已知的层析技术进行核酸分离。有许多种层析可用于实施本发明,包括吸附、分配、离子交换、羟基磷灰石、分子筛、反相层析、柱层析、纸层析、薄层层析和气相层析及HPLC。
在某些实施方案中,可用肉眼观察分离或未分离的扩增产物。典型的观察方法包括用溴乙锭染色凝胶在UV光下观察条带。或者,如果扩增产物用放射或荧光标记的核苷酸整合标记,可使分离的扩增产物暴露x光胶片,在适当的激发光下观察。
在一实施方案中,分离扩增产物后,使标记的核酸探针与扩增的标记序列接触。优选将探针偶联于生色团而不作放射标记。在另一实施方案中,将探针偶联于结合伴侣,如抗体或生物素,或其它载有可检测成分的结合伴侣。
在具体实施方案中,用Southern印迹法与标记的探针杂交来检测。Southern印迹法涉及的技术是本领域技术人员熟知的(见Sambrook等,2001)。上述技术的一个例子(见美国专利5,279,721所述,其内容纳入本文作参考)披露了自动化电泳和转移核酸的装置和方法。这些装置允许不用外部操作凝胶而进行电泳和印迹,理想地适合于进行本发明的方法。
其它可用于实施本发明的核酸检测方法见美国专利:5,840,873;5,843,640;5,843,651;5,846,708;5,846,717;5,846,726;5,846,729;5,849,487;5,853,990;5,853,992;5,854,993;5,956,092;5,861,244;5,863,732;5,863,753;5,866,331;5,905,024;5,910,407;5,912,124;5,912,145;5,919,630;5,925,517;5,928,862;5,938,869;5,929,227;5,932,413和5,935,791,其各自内容纳入本文作参考。
4.其它试验
本发明范围中可采用其它基因筛选方法,例如来检测基因组DNA、cDNA和/或RNA样品中的突变。用于检测点突变的方法包括变性梯度凝胶电泳(“DGGE”)、限制性片段长度多态性分析(“RFLP”)、化学或酶切割法、直接测序PCRTM扩增的靶区域(见上)、单链构型多态性分析(“SSCP”)和本领域熟知的其它方法。
筛选点突变的一种方法依据RNA/DNA或RNA/RNA异质双链体中碱基错配的RNA酶切割。术语“错配”本文定义为双链RNA/RNA、RNA/DNA或DNA/DNA分子中含有一个或多个不配对的或错配的核苷酸有区域。此定义包括由于插入/缺失突变,及单个或多个碱基点突变所至的错配。
美国专利4,946,773描述了一种RNA酶A错配切割试验,其包括使单链DNA或RNA测试样品与RNA探针退火,随后用RNA酶A处理该核酸双链体。为检测错配,将RNA酶A处理的单链产物按大小电泳分离,与相似处理的对照双链体作比较。含有在对照双链体中看不见的较小片段(切割产物)的样品评为阳性。
其它学者描述了在错配试验中采用RNA酶I。在Promega Biotech的文献中描述了错配检测采用了RNA酶I。Promega销售的试剂盒装有RNA酶I,报告说能切除4个已知错配的三个。其它学者描述了采用MutS蛋白或其它DNA-修复酶来检测单碱基错配。
可用于实施本发明的其它检测缺失、插入或置换突变的方法见美国专利5,849,483;5,851,770;5,866,337;5,925,525和5,928,870,其各自内容纳入本文作参考。
5.SNP筛选方法的具体例子
进化过程中生物体基因组发生的自发性突变常不会立即传递给该种族的所有成员。从而产生多态性等位基因,它们共同存在于该种族群体中。多态性常常是遗传疾病的原因。已鉴定到几种多态性。例如,核苷酸的双或三核苷酸重复基序自发形成的串联复制会发生各种核苷酸类型的多态性(VNTR)。如果这种变化改变了限制性内切核酸酶切割所产生的DNA片段长度,这种变化就称为限制性长度多态性(RFLP),RFLP广泛用于人和动物的遗传分析。
另一类多态性由于单个核苷酸置换而产生。这种单核苷酸多态性(SNP)罕见可导致限制性内切核酸酶位点的改变。因此,SNP用限制性片段长度分析很难检测。SNP是最见的变化,平均每100-300碱基中发生一个,已发现几种SNP突变影响了蛋白质-编码基因中的单个核苷酸,其方式足够真正引起遗传疾病。SNP疾病的例子有:血友病、镰状细胞贫血、先天性血色素沉着症、晚期发作早老性痴呆等。
本发明的内容中,通过一系列筛选方法测定影响EGFR基因产物活性和水平的多态性突变。一组筛选方法目标是在体外或体内试验中鉴定影响EGFR基因产物R可诱导性、活性和/或水平的SNP。然后进行另一组筛选方法来筛选某个体是否存在以上鉴定的SNP。为了这样做,采集病人的样品(如血液或其它体液或组织样品)用于基因型分析。SNP的存在与否将决定EGFR的表达和/或活性水平。按照本发明提供的方法,可利用这些结果来调整和/或改变给予某个体的EGFR靶向药物的剂量以减少药物的副作用。
SNP可能是缺失、点突变和插入所致。通常任何一个碱基的改变。不论其原因如何,可能导致SNP。SNP的频率越高意味着它们比其它类型的多态性更易鉴定。它们分布的一贯性越高得以鉴定“最接近”感兴趣特定性状的SNP。这两种贡献的联合作用使SNP极有价值。例如,如果某特定性状(如EGFR过度表达)反映了特定基因座处的突变,那么可利用与该特定基因座联锁的任何多态性来预测显示该性状个体的(患病)可能性。在某些病例中,SNP可能是该性状的原因。例如,EGFR调控区Sp1结合位点中的SNP可能改变其Sp1结合从而影响EGFR转录。
已开发了几种方法来筛检多态性,某些例子见下所述。参见Kwok和Chen(2003)及Kwok(2001)提供的这些方法的一些综述,此二文专门纳入作参考。
可采用这些方法中的任何一种或其适当的改良方法特征鉴定涉及EGFR基因表达调节的SNP。这类方法包括直接或间接测定该位点的序列,采用能在该位点的等位基因中产生或破坏限制性位点的限制性酶,或采用等位基因特异性杂交探针。
可在美国专利6,472,157和美国专利申请公布号20020016293,20030099960,20040203034;WO 0180896(其内容纳入作参考)中找到鉴定多态性和应用信息的方法,对病人产生有用信息的例子。
a)DNA测序
特征鉴定多态性的最常用方法是对侧接并包括该多态性的基因座进行DNA测序。这种分析可用“双脱氧介导的链终止法”,也称为“Sanger方法”(Sanger等,1975)或“化学降解法”也称为“Maxam-Gilbert法”(Maxam等,1977)进行。可采用测序联合基因组序列特异性扩增技术,如聚合酶链式反应来促进所需基因的发现(Mullis等,1986;欧洲专利申请50,424;84,796;258,017;237,362;201,184;美国专利4,683,202;4,582,788和4,683,194),所有上述专利纳入本文作参考)。
b)外切核酸酶抗性
可用于测定多态性位点核苷酸身份的其它方法采用专门化的外切核酸酶抗性核苷酸衍生物(美国专利4,656,127)。使与某等位基因从立即3’端至该多态性位点序列相互补的引物,在研究条件下与DNA杂交。如果此DNA的多态性位点含有与特定外切核酸酶抗性核苷酸衍生物互补的核苷酸,那么该聚合酶将把此衍生物掺入到杂交引物的末端。这种掺入使该引物能抵抗外切核酸酶的切割,从而使其能被检测到。由于该外切核苷酸抗性衍生物是已知的,因此可确定该DNA的多态性位点中存在此特异性核苷酸。
c)微量测序方法
已描述了测定DNA中多态性位点的几种其它引物指导的核苷酸掺入方法(Komher等,1989;Sokolov,1990;Syvanen,1990;Kuppuswamy等,1991;prezant等,1992;Ugozzoll等,1992;Nyren等,1993)。这些方法依赖于掺入标记的脱氧核苷酸以区分多态性位点的碱基。由于信号与掺入的脱氧核苷酸量成比例,运作同样核苷酸产生的多态性导致与运作的长度成比例(Syvanen等,1990)。
d)在溶液中延伸
法国专利2,650,840和PCT申请专利WO 91/02087描述了测定多态性位点核苷酸身份的方法。按照这些方法,采用了与等位基因从紧靠3’端至多态性位点序列相互补的引物。该位点的核苷酸身份可用标记的双脱氧核苷酸衍生物(如果其与该多态性位点互补即能掺入到该引物的末端)测定。
e)基因小段分析或固相延伸
PCT申请专利WO 92/15712描述了一种采用标记的终止子混合物和与从3’端至多态性位点序列相互补的引物的方法。掺入的标记终止子与待评价的靶分子的多态性位点中的核苷酸相互补,因而得以鉴定。此时引物或靶分子固定在固相中。
f)寡核苷酸连接试验(OLA)
这是另一种固相方法,采用了不同的方法学(Landegren等,1988)。采用能与靶DNA单链的毗连序列杂交的两个寡核苷酸。生物素化这些寡核苷酸之一,而另一个为可检测标记。如果在靶分子中存在精确的互补序列,该寡核苷酸将杂交,它们的末端毗连并产生连接底物。用亲和素连接得以发现该标记的寡核苷酸。根据此法,其它的核酸检测试验与PCR联用也已有描述(Nickerson等,1990)。此时用PCR可实现靶DNA的指数扩增,然后用OLA检测。
g)连接酶/聚合酶-介导的基因小段分析
美国专利5,952,174描述了一种方法也包括两种能与靶分子毗连序列杂交的引物。在固定有靶分子的固相支持物上形成杂交产物。此时发生的杂交使二引物被一个核苷酸间隔彼此分开。在存在聚合酶、连接酶和核苷三磷酸混合物(含有至少一种脱氧核苷三磷酸)时培育此杂交产物,使毗连杂交的寡核苷酸对连接。此法比单用延伸或连接的方法,提供了较高的特异性和较低的“嘈声”,不象聚合酶试验,此法通过与二次杂交和使信号附着于固相的连接步骤联用,提高了聚合酶步骤的特异性。
h)侵入性切割反应
可利用侵入性切割反应来评价细胞DNA的特定多态性。一种称为INVADER的技术采用了这类反应(如de Arruda等,2002;Stevens等,2003,纳入作参考)。通常有三种核酸分子:1)靶位点上游艺室的寡核苷酸(“上游寡”),2)覆盖该靶位点的探针寡核苷酸(“探针”),和3)含该靶位点的单链DNA(“靶”)。所述探针含有供者荧光团,如荧光素,和受者染料,如Dabcyl。上游寡核苷酸3’末端的核苷酸重叠(“侵入了”)了探针-靶分子双链体的第一对碱基。因此探针被结构特异性的5’核酸酶切断,导致荧光团/淬灭剂对分离,从而提高可检测的荧光量。见Lu等,2004。
在某些病例中,在固相表面或以阵列格式进行该试验。
h)检测SNP的其它方法
以下提供的SNP检测和鉴定的几种其它特异性方法,可经适当改进与鉴定本发明EGFR基因多态性的方法联用。在纳入本文作参考的网站www.ncbi.nlm.nib.gov/SNP的NCBI的SNP网点上也有其它几种方法的描述。
在一具体实施方案中,可测定某群体中任何给定基因座的推广的单倍型,使我们得以精确鉴定那个SNP将会丰余,那个将是相关性研所必须。后者称为“单倍型标记SNP(htSNP)”,这些标记能捕获基因或连锁不平衡区域的单倍型。见Johnson等(2001)以及Ke和Cardon(2003),各自内容纳入本文作示范性方法的参考。
VDA-试验通过利用TaKaRa LA Taq试剂和其它标准反应条件进行长时间PCR法,用PCR扩增基因组区段。长时间扩增可扩增约2000-12000bp大小的DNA。Affymetrix高通量筛选中心可进行产物与各种探测阵列(VDA)的杂交,并用计算机软件分析。
一种称为芯片试验的方法采用标准或长时间PCR方案来扩增基因组区段。用VDA分析杂交产物,Halushka等,1999,纳入本文作参考。SNO通常根据杂交模式的计算机分析,分类为“确定”或“类似”。通过与其它检测方法,如核苷酸测序相比较,“确定”的SNP经100%次证实;和“类似”的SNP经此法70%次证实。
其它方法方法简单地包括PCR扩增后用相关的限制性酶消化。还有其它方法包括对纯化的PCR产物已知基因组区域测序。
在另一种方法中,用PCR扩增大外显子的各个外显子或重叠片段。根据发表的序列或数据库序列设计引物,用以下条件进行基因组DNA的PCR扩增:200ng DNA模板、0.5μM的各引物、80μM的各dCTP、dATP、dTTP和dGTP、5%甲酰胺、1.5mMMgCl2、0.5U Taq聚合酶、和0.1体积的Taq缓冲液。进行温度循环,用PCR-单链验证多态性(PCR-SSCP)分析法,在不同条件,如5%或10%聚丙烯酰胺凝胶和15%尿素,加或不加5%甘油时分析所产生的PCR产物。进行电泳过夜。再扩增显示迁移的PCR产物并测序以鉴定核苷酸变异。
在称为CGAP-GAI(DEMIGLACE)的方法中,将序列和排列对比数据(得自PHRAP.ace file)、序列碱基访问的质量评分(得自PHRED质量文件(PHRED qualityfile))、距离信息(得自PHYLIP DNA距离和邻居程序(PHYLIP dnadist and neighbourprogram))和碱基访问数据(得自PHRED‘-d’转换)加载到存贮器中。排列对比诸序列并检查产生的装配不一致的各个垂直的信息块(‘薄片’)。认为任何这种薄片是候选的SNP(DEMIGLACE)。DEMIGLACE利用许多过滤器来消除不可能提供真实多态性的薄片。这些过滤器包括:(i)当邻近序列质量评分下降40%或更多时排除任何给定薄片的SNP序列;(ii)排除该核苷酸类型所有碱基访问峰幅度低于15%的访问;(iii)取消序列中具有大量与参与SNP计算的共有序列不一致的序列区域;(iv)考虑去除含有峰值高于访问峰区域25%或更多的交替访问的任何碱基访问;(v)排除只发生在一种阅读取向的变异。将PHRED质量评分转变成该薄片中各核苷酸的误差可能性值(probability-of-error value)。采用标准的Bayesian法来计算后验概率,这是某给定部位核苷酸异质性的证据。
在一种称为CU-RDF(RESEQ)的方法中,用每种SNP的特异性引物从分离自血液的DNA进行PCR扩增,并在典型的除去未使用的引物和游离核苷酸的提纯步骤之后用相同或嵌套引物直接测序。
在称为DEBNICK(方法-B)的方法中,用荧光DNA测序法进行簇集EST序列的比较性分析并验证。在一相关的称为DEBNICK(方法-C)的方法中,比较性分析了错配位点含有phred质量>20簇集EST序列,其5个碱基的5’-端FLANK和3’端至SNP上平均phred质量>=20,5个碱基的5’端和3’端至SNP中无错配,通过跟踪检测进行了各等位基因发生的至少两个SNP并得以证实。
在鉴定为ERO的方法(RESEQ)中,设计了新的引物组来电泳检测发表的STS,用于扩增10种不同品系小鼠的DNA。然后凝胶纯化各品系的扩增产物并用标准的双脱氧循环测序技术以33P-标记的终止子测序。所有的ddGTP反应后将所有的ddATP终止反应物加载到测序凝胶的毗邻泳道中等等。观察扫描放射图象鉴定SNP。
在鉴定为ERO的另一方法(RESEQ-HT)中,设计了新的引物组来电泳检测发表的小鼠DNA序列,用于扩增10种不同品系小鼠的DNA。制备各品系的扩增产物用外切核酸酶I和虾碱性磷酸酶处理进行测序。用ABI Prism Big Dye TerminatorReady ReactionKit(Perkin-Elmer)进行测序,序列样品在3700 DNA分析仪(96毛细管测序仪)上运作。
FGU-CBT(SCA2-SNP)鉴定一种方法,其中含有SNP的区域用引物SCA2-FP3和SCA2-RP3作PCR扩增。在含有最终浓度5mM Tris、25mM KCl、0.75mM MgCl2、0.05%明胶、20pmol各引物和0.5U Taq DNA聚合酶的50ml反应体积中扩增大约100ng的基因组DNA。使样品变性、退火和延伸,用例如QIAquick凝胶抽提试剂盒(Qiagen)从切下的琼脂糖凝胶条带纯化PCR产物。并用染料终止化学试剂在ABIPrism 377自动化DNA测序仪上用PCR引物测序。
在鉴定为JBLACK(SEQ/RESTRICT)的方法中,用基因组DNA进行了二次独立的PCR反应。测序分析第一次反应的产物,表明有一个独特的FspI限制位点。用FspI消化证实第二次PCR反应产物中有突变。
在描述为KWOK(1)的方法中,通过用染料终止化学试剂直接测定PCR产物的DNA序列,比较4名随机选择个体的高质量基因组序列数据来鉴定其SNP(见Kwok等,1996)。在一相关的鉴定为KWOK(2)的方法中,通过比较重叠的大插入克隆,如细菌的人造染色体(BAC)或P1-人造染色体(PAC)的高质量基因组序列数据来鉴定其SNP。然后产生含此SNP的STS,用合并的DNA测序验证不同人群中该SNP的存在(见Taillon-Miller等,1998)。在另一类似的称为KWOK(3)方法中,通过比较重叠的大插入克隆BAC或PAC的高质量基因组序列数据来鉴定SNP。此法发现的SNP代表了该二供者染色体之间的DNA序列差异,但沿没确定该总体人群中的此等位基因频率。在KWOK(5)方法中,通过用染料终止化学试剂直接测定PCR产物的DNA序列,比较纯合型DNA样品与一种或多种合并的DNA样品的高质量基因组序列数据来鉴定SNP。从公众可得到的数据库中找到的序列数据产生了所用的STS。具体说,用PCR扩增完全性葡萄胎(Complete hydatidiform mole,CHM)(已证明在所有基因座均为纯合型)和80名CEPH病人的合并DNA样品的这些STS(见Kwok等,1994)。
在另一种此类KWOK(OverlapSnpDetectionWithPolyBayes)方法中,通过计算机的自动化分析人基因组大插入克隆序列的重叠区域发现了SNP。为获得数据,直接从大规模测序中心获得克隆序列。这是必须的,因为GenBank不提供/不能从其得到碱基质量序列。初步数据加工包括分析克隆序列与伴随的碱基质量信息的一致性。指定含有无关碱基质量序列的完成(‘碱基偏爱’,错误率低于1/10,000bp)序列的统一碱基质量值为40(1/10,000bp错误率)。拒绝无碱基质量值的草图序列。将经加工的序列输入局部数据库。也存贮含掩盖的已知人重复序列的各序列版本。用程序“MASKERAID”进行重复序列的掩盖。重叠检测:用程序“WUBLAST”检测推定的重叠(序列)。随后进行几次过滤步骤以消除假重叠检测结果,即消除由于序列复制与与重叠相反而产生的一对克隆序列之间的相似性。重叠的总长度、相似性总百分比、含高质量碱基值“高质量错配”的核苷酸之间的序列差异数量。也将结果与华盛顿大学基因组测序中心(Washington University Genome Sequencing Center)的基因组克隆限制性片段作图结果、关于重叠的最终报告以及NCBI上的序列连续构建工作的结果进行比较。SNP检测:用‘POLYBAYES’SNP检测软件分析候选SNP位点的克隆序列重叠对。给序列对之间的序列差异评分其代表与测序误差相反的真实序列不同的可能性。此法要求提供二序列的碱基质量值。抽出高评分候选序列。检索限制于取代类型的单碱基对不同。用POLYBAYES软件给SNP作计算机可信限平分。
在KWOK(TaqMan试验)鉴定的方法中,用TaqMan试验测定90名随机个体的基因型。在KYUGEN(Q1)鉴定的方法中,合并指定人群的DNA样品用PLACE-SSCP分析。用杂合子的数据纠正合并分析中各等位基因的峰高度,随后用于计算等位基因频率。此法可靠地量化了高于10%的等位基因频率。等位基因频率=0(零)意味个体中可找到该等位基因,但在合并物检查中看不见相应的峰。等位基因频率=0-0.1表示在合并物中可检测到微量等位基因但峰太低不能可靠地量化。
在另一鉴定为KYUGEN的方法(方法1)中,用荧光染料后标记PCR产物和在SSCP条件(PLACE-SSCP)下用自动化毛细管电泳系统分析。在一系列实验中用或不用两种合并的DNA(日本合并物和CEPH合并物)分析4名或多名个体的DNA。肉眼观察鉴定等位基因。测定含有不同基因型的个体的DNA序列,鉴定SNP。用杂合子峰高度纠正信号偏差后从合并样品的峰高度估计等位基因频率。PCR引物经标记后其二条链的末端具有5’-ATT或5’-GTT尾。扩增DNA(10ng/μl)样品,反应混合物含缓冲液(10mM Tris-HCl,pH8.3或9.3,50mM KCl,2.0mM MgCl2)0.25μM的各引物、200μM各dNTP、0.025U/μl Taq DNA聚合酶,预先与抗-Taq抗体混合。通过DNA聚合酶I的Klenow片段的交换反应用经R110和R6G修饰的核苷酸差别性标记PCR产物的二条链。加入EDTA终止反应,加入牛小肠碱性磷酸酶使未掺入的核苷酸去磷酸化。对于SSCP:将等量的荧光素标记的PCR产物和TAMRA标记的内部标志加入到去离子的甲酰胺中变性。用ABI Primer 310基因分析仪进行毛细管电泳。用Genescan软件(P-E Biosystems)收集数据作数据加工。用big-dye终止化学试剂在ABI Primer 310测序仪上,对在SSCP上显示基因型不同的个体的DNA进行直接测序。从ABI Primer 310获得多个序列的跟踪文件,用Phred/Phrap校正,用Consed viewer观察。用PolyPhred软件和肉眼观察鉴定SNP。
在另一鉴定为KYUGEN的方法(方法2)中,通过变性HPLC(DHPLC)或PLACE-SSCP(Inazuka等,1997)搜寻具有不同基因型的个体,测定它们的序列来鉴定SNP。用经标记后其二条链的末端具有5’-ATT或5’-GTT尾的引物进行PCR。用WAVE DNA片段分析系统(Transgenomic)进行DHPLC分析。将PCR产物注射入DNASep柱中,用WAVEMaker程序(Transgenomic)在确定的条件下分离该产物。通过DNA聚合酶I的Klenow片段的交换反应用经R110和R6G修饰的核苷酸差别性标记PCR产物的二条链。加入EDTA终止反应,加入牛小肠碱性磷酸酶使未掺入的核苷酸去磷酸化。SSCP随后用ABI Primer 310基因分析仪进行毛细管电泳。Genescan软件(P-E Biosystems)。用big-dye终止化学试剂在ABI Primer 310测序仪上,对在DHPLC或SSCP上显示基因型不同的个体的DNA进行直接测序。从ABIPrimer 310获得多个序列的跟踪文件,用Phred/Phrap校正,用Consed viewer观察。用PolyPhred软件和肉眼观察鉴定SNP。用PHRED加工Unigene中的EST序列的跟踪层析谙数据。为鉴定可能的SNP,对每个Unigene簇,报告了从程序PHRAP、BRO和POA产生的多个序列排列对比后的单个碱基错配。BRO纠正了可能错报的EST取向‘而POA鉴定和分析了非线性排列对比结构,其可表明基因的混合/嵌合,可能产生假SNP。利用Bayesian参比品权衡真实多态性与测序错误、错排列对比、或模棱两可、错簇集或嵌合性EST序列的证据,评估数据,如初步层析谱高度、锐度、重叠和间隔;测序错误几率;内容灵敏度;cDNA文库来源等。
在鉴定为MARSHFIELD的方法(方法-B)中,通过搜寻公众数据库鉴定含有推定的插入/缺失多态性的重叠人DNA序列。从共有序列中选出侧接各多态性位点的PCR引物。利用此引物来扩增个体的或合并的人基因组DNA。在变性聚丙烯酰胺凝胶上分辨得到的PCR产物,用PhosphorImager估计DNA合并物的等位基因频率。
6.连锁不平衡
本发明方法也可利用与EGFR基因座-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169或2034位的多态性连锁不平衡的多态性。“连锁不平衡”(本文使用的“LD”在本领域也称为“LED”)指一种情况,此时两个基因座的等位基因(即某给定基因的变化形式)的特定组合或多态性看来比碰巧预期的更频繁。如该领域技术人员所测定,当“显著”用于连锁不平衡时,认为统计学的p或α值是0.25或0.1,可以是0.1、0.05、0.001、0.0001或更小。可利用EGFR单倍型与EGFR蛋白表达水平之间的关系来使基因型(即生物体的基因组成)与表型(即生物体或细胞显示的物理性状)相关联。“单倍型”按该领域技术人员所知的其单纯和普通含义使用,指沿同源染色体之一分布的两个或多个等位基因或多态性的集合基因型。
D.试剂盒
试剂盒中可装有本文所述的任何组合物。非限制性例子中,试剂盒装有测定一种或两种EGFR基因的基因型的试剂。该盒也可装有可扩增和/或检测EGFR基因的特定核酸序列的各种核酸。在具体实施方案中,其装有一种或多种引物和/或探针。装有含标记的核酸分子、染料或其它信号传导分子,如荧光团。也可装有一种或多种缓冲液,如DNA分离缓冲液、扩增缓冲液或杂交缓冲液。该试剂盒也可装有用于制备DNA模板和分离样品DNA的化合物和试剂。试剂盒还可装有各种标记试剂和化合物。
可以含水介质或冻干形式包装试剂盒的诸成分。试剂盒的容器通常包括至少一个小瓶、试管、烧瓶、大瓶子、针筒或其它容器,其中各装有一种组分,优选适当地分成等份。当盒中装有一种以上组分(标记试剂与标记物一起包装)时,该试剂盒通常也装有第两个、第三个或更多个容器,其中各组分分开放置。然而小瓶中可含有各组分的各种组合。本发明的试剂盒通常包括供商品销售的装有核酸和其它试剂的密封容器。这类容器可装有注塑或吹塑容器,其中装有所需数目的小瓶。
当试剂盒的各组分以一种或多种液体溶液提供时,该液体溶液是水溶液,特别优选灭菌水溶液。然而试剂盒组分也可以干粉提供。当试剂和/或组分以干粉提供时,可加入适当的溶剂来重建此干粉。预想溶剂可在其它容器中提供。
试剂盒也装有如何使用试剂盒诸组分和该盒中没有的其它试剂的说明书。说明书可包括如何执行的各种变化。
认为这类试剂是本发明试剂盒的实施方案。然而昆试剂盒不限于上述特定条款,可包括直接或间接用于检测EGFR基因中多态性或EGFR基因表达水平的任何试剂。
E.实施例
包括以下实施例来显示本发明的优选实施方案。本领域技术人员应理解实施例中所披露的技术,代表了本发明人所公开的实施本发明性能良好的技,可认为构成了其实施的优选模式。然而本领域技术人员借助本文公开的内容,应理解可对所公开的具体实施方案做出许多修改,仍能获得同样或类似的结果,但这些都属于本发明的思路和范围。
                         实施例1
           EGFR调控区中发现的单核苷酸多态性(SNP)
利用Coriell Cell Repository的DNA样品重测序。样品包括22名高加索人、23名非洲美国人和23名亚洲人。对于SNP发现,用表1的引物通过PCR扩增大约4.5kb的片段,该片段含有上游和下游增强子、启动子、外显子1和部分内含子1。从两端直接测序纯化的PCR产物。用ABI-3700毛细管测序仪和phred/phrap/polyphred/consed管线(pipeline)(万维网地位为phrap.org/)鉴定多态性。
                   表1
SEQ ID NO:
3456789101112131415161718192021222324   EGFR1L-FEGFR1L-REGFR1L-AFEGFR1L-AREGFR1L-1FEGFR1L-1REGFR1L-2FEGFR1L-2REGF11L-3FEGF11L-3REGFR1L-4FEGFR2L-FEGFR2L-REGFR2L-1REGFR2L-2FEGFR2L-2REGFR2L-3FEGFR2L-3REGFR2L-4FEGFR2L-4REGFR2L-5FEGFR2L-5R     GTTCCACTGTTGTGCTTCCCAAGAAAGTTGGGAGCGGTTCGGGTGGACTTGCCAAAGGACTTAGAGCCAGCGTCGGATAGCATGACTTCAACGCACAGTGAGGCTAAGTGTCCCACTGCTCGGACTTTAGAGCACCACCGAGGAGGAGAATGCGAGGAGAAATTAACTCCTCAGGGCACCCGCCCTTACCTTTCTTTTCCCCCTGACTCCGTCCAGTATTCGTCCTTTCCTGTTTCCTTGACCAGCTGTGGGAAAGTCACAGACGAGTTCTCCCAGCTCCGCGCAGGTCTCAAACTGAAGGGAGAAGTTTGCTGTGAGCCCCCTCGTCTTGCCTATCCAAGTGATCCCCAAATCTGGCTGGCATAGAACAGTGGTTCCCGAACACCAATGGAGGGAGAATGAAGGAACTGGTGGAAAGGCATGTCCCAGAACCAAACAA
通过重测序包括启动子和增强子在内的4kb的EGFR5’调控区,从包括22名高加索人、23名非洲美国人和23名亚洲人的68份DNA样品中鉴定到12个单核苷酸多态性(图1和表2)。与其它7个罕见的SNP相比,5个SNP显示至少在一个群体中有较高的出现率(罕见等位基因频率>10%)。在启动子和增强子区中观察到9个SNP,其中3个常见。一个SNP,-1249 G>A(在非洲美国人中占10%)位于上游增强子中,而-216 G>T(在非洲美国人中占29%,高加索人中占34%)和-191 C>A位于启动子区(高加索人中占18%)(图1和表2)。令人感兴趣的是,-216 G>T位于Sp1结合位点(-216)中,用T置换G可改变Sp1结合。同时,-191 C>A靠近转录起始位点(图2)(Ishii等,1985;Haley等,1987;Johnson等,1988;Kageyama等,1988)。因此,这些SNP可能对EGFR转录具有显著影响。
表2在EGFR调控区发现的SNP罕见等位基因的数目和频率。
非洲美国人(AA),高加索人(CA)亚洲人(AA)
    -1435       -1300    -1249     -1227     -761       -650     -544      -486      -216      -191       169        2034
C   T   G   A  G  A  G   A  C   A   G     A  G   A  C   A  G   T  C     A  G   T   G    A
AACAASAACAAS 464442   2000.0400   464442   2000.0400  434442  5000.100  484342   01000.020  413842   7600.150.140   464442     2000.0400  484441   001000.02  454442   3000.0600  343039   141430.290.320.07  483842     06000.140  423942   6500.130.110   464338    2140.040.020.09
                        实施例2
        两个启动子SNP(-216 G>T和-191 C>A)的功能特征鉴定
在体外瞬时转染试验和电泳迁移试验(ENSA)特征鉴定了EGFR启动子区中两个SNP(-216 G>T和-191 C>A)的潜在功能。
单倍型当本发明人测定了得自不同种族的68份样品时,发现SNP-216 G>T在非洲美国人(29%)和高加索人(34%)中频率高,但在亚洲人中较为罕见(9%);而-191 C>A只见于高加索人(18%)(表3)。连锁不平衡和单倍型分析显示-216 G>T和-191 C>A在强LD中不存在(D’=0.5562,P>0.05),在样品中观察到3种单倍型:G-C、G-A和T-C,见下表3。扩增含有这3种单倍型的DNA片段并克隆,同时将用DraIII消化的G-A和T-C单倍型的T片段和A片段相连接,构建T-A单倍型(图3)。
表3高加索人、非洲美国人和亚洲人中-216 G>T和-191 C>A单倍型的频率
    单倍型     高加索人     非洲美国人     亚洲人
    G-C     0.48     0.71     0.92
    G-A     0.18     0.00     0.00
    T-C     0.34     0.29     0.08
    T-A     0.00     0.00     0.00
载体和检测系统  将载有4个靶DNA片段中每一个的PGL3-luc+基础报告载体(Promega)和含有受单纯疱疹病毒胸苷激酶(HSV-TK)启动子驱动的renilla基因的pRL-TK报告载体(Promega)共转染到MDA-MB-231细胞中,比较荧光素酶基因的相对表达。采用双荧光素酶报告试验系统(Promega)检测荧光素酶的表达水平。PGL3-luc+基础载体和PGL3-luc+SV40-启动子载体分别作为阴性和阳性对照。
缺失图谱研究显示,含有这两种SNP的外显子1上游384bp片段具有基本的启动子功能(图2)(Johnson等,1988)。因此用Proofstart DNA聚合酶(Qiagen)通过PCR从具有特定单倍型的个体扩增此片段,作改进的高保真DNA扩增。设计引物来扩增图2所示515bp扩增子。引物序列是:
正向引物5’-CCACCGGTACCGGCGGCCGCTGGCCTTG-3’(SEQ ID NO:25)和
反向引物5’-CGGCGAGACACGCCCTTACCTTT-3’(SEQ ID NO:26)。此515bp扩增子含有3’-端的ScaI切割位点(图2)。为方便亚克隆,设计的正向引物含有KpnI位点。用KpnI和ScaI消化该片段,将405bp的产物克隆到pGL3-luc+基础载体的KpnI/ScaI位点。为验证插入了DNA片段,对所有质粒测序以PCR错误,核对片段的取向确保单倍型(正确)然后转染。
瞬时转染  将MDA-MB-231细胞系维持在含10%FBS和2Mm L-谷氨酰胺的RPMI1640培养基(Invitrogen)中。用转染胺2000(Invitrogen)按厂商说明书进行瞬时转染。所有转染一式三份进行并重复三次。用pRL-TK载体共转染细胞以标准化转染效率。转染后,培养细胞24小时,洗涤、裂解,用双荧光素酶试剂盒(Promega)按厂商说明书进行分析。
比较4种单倍型驱动的体外荧光素酶转录效率。观察到T-C单倍型载体的荧光素酶活性明显高于G-C单倍型载体(图4,p<0.01)。在高加索人、非洲美国人和亚洲人中T-C和G-C单倍型是最常见的单倍型(表3)。此外,-216 G>T多态性对荧光素酶活性影响比-191 C>A多态性高(图4;图6A,所有比较的p<0.04)。这种作用不依赖细胞的EGFR表达水平(图6B)。平均而言,用T等位基因置换G等位基因显示荧光素酶基因表达提高约30%。
为进一步验证DNA改变和Sp1对启动子活性的可能协同作用,还在果蝇(Drosophila melanogaster)Schneider细胞系2(SL-2,其Sp1缺陷)中进行了瞬时转染(Courey等,1988)。结果,与pGL3EGFRluc单独转染相比,用Sp1表达载体共转染pGL3EGFRluc导致启动子活性诱导增高约100倍。与T-C单倍型相比,pPac-Sp1和4种pGL3EGFRluc构建物之一共转染显示受G-C单倍型驱动的启动子活性显著降低(p<0.03,图6A)。
电泳迁移试验(EMSA)用EMSA评价-216 G>T多态性位点的核蛋白结合。用NE-PER胞核和胞质提取试剂按厂商(Pierce,Rockford,USA)方案提取MDA-MB-231细胞的核蛋白。表4列出了对应于G等位基因、T等位基因和Sp1结合共有序列的探针和竞争物。
表4 EMSA所用的探针和竞争物。多态性核苷酸的位置用粗体和下划线标出
Figure A20058000646500331
合成的探针为单链,末端用生物素标记。含有相同序列的未标记寡核苷酸用作竞争物。使二互补寡核苷酸退火制备双链DNA。用LightShift化学发光EMSA试剂盒(Pierce,Rockford,USA)按厂商说明书进行EMSA。
简而言之,室温培育核抽取物与结合缓冲液(100mM Tris-HCl,pH 7.5;500mMNaCl,25mM MgCl2和5mM二硫苏糖醇)、1μg poly(dI-dC)和0.2pmol(200,000cpm)标记探针20分钟进行结合反应。对于竞争试验,在结合反应中100倍摩尔过量的未标记寡核苷酸(特异性、非特异性或Sp1特异性)。结合后在4℃在5%非变性聚丙烯酰胺凝胶中以0.5xTBE分离样品2小时。在0.5xTBE中100V电泳40分钟,将结合反应物转移到尼龙膜(Amersham Pharmacia Biotech)上。转移后,在254nm UV灯下以120mJ/cm2交联DNA。在ChemiDoc系统(Bio-Rad)中用化学发光检测方法检测生物素标记的DNA。
进行EMSA来测定核蛋白与各等位基因特异性探针的结合效率。用Sp1共有序列探针作为对照来显示结合与迁移位置。与G等位基因探针相比,用T等位基因探针检测观察到的MDA-MB-231细胞核蛋白结合效率显著为高(图5)。
-216 G>T-191 C>A单倍型与体内EGFR mRNA表达相关选择人成纤维细胞(表达EGFR)来评价-216 G>T-191 C>A单倍型与EGFR转录之间的相关性。按先前报导,EGFR启动子中有多个转录起始位点(Johnson等,1988;Kageyama等,1988),而体内转录的主要位点在-260位(Kageyama等,1988)。因此,-216和-191位存在于大多数EGFR mRNA序列中。选择含有二倍型(diplotype)G-C/T-C两种多态性的10个细胞系,它们具有检测同一细胞中载有T-C单倍型和G-C单倍型的mRNA之间表达水平差异的能力。结果,观察到平均相对比例距离假设的比例1∶1有显著偏差(R的均值=1.39±0.12,95%CI 1.11-1.67,p<0.02,证明T-C单倍型产生的EGFR mRNA高于G-C单倍型约40%。此发现表明,-216G/T变化对EGFR的体内转录也有很强的影响。
除了等位基因不平衡,通过实时PCR还评估了上述三种人细胞系之间EGFR的相对表达。有趣的是,这些细胞间的EGFR水平与它们的二倍型一致,MDA-MBA-231细胞的EGFR水平非常高,但在HEK293中低约6倍,在MCF-7中最低(图6B)。
本文披露的和权利要求书要求的所有组合物和方法借助本文所公开的内容,无须过多实验即可制备和实施。虽然已通过优选实施方案描述了本发明的组合物和方法,但本领域技术人员知道可对这些组合物和方法及所述方法的步骤或步骤的顺序作出许多变化而不背离本发明的概念、思路和范围。更具体说,显然可用化学上和生理学上相关的某些试剂来替代本文所述的试剂,仍可获得同样或类似的结果。本领域技术人员应知道所有这些类似的替代和修饰均属于本发明权利要求书所定义的本发明的思路、范围和概念内。
参考文献
以下参考文献的内容提供了对本文所述内容的示范性方法或其它详细说明,而纳入本文参考文献。
美国专利4,582,788
美国专利4,656,127
美国专利4,659,774
美国专利4,682,195
美国专利4,683,194
美国专利4,683,195
美国专利4,683,202
美国专利4,683,202
美国专利4,683,202
美国专利4,800,159
美国专利4,816,571
美国专利4,883,750
美国专利4,946,773
美国专利4,959,463
美国专利5,141,813
美国专利5,264,566
美国专利5,279,721
美国专利5,428,148
美国专利5,554,744
美国专利5,574,146
美国专利5,602,244
美国专利5,645,897
美国专利5,705,629
美国专利5,840,873
美国专利5,843,640
美国专利5,843,650
美国专利5,843,651
美国专利5,843,663
美国专利5,846,708
美国专利5,846,709
美国专利5,846,717
美国专利5,846,726
美国专利5,846,729
美国专利5,846,783
美国专利5,849,481
美国专利5,849,483
美国专利5,849,486
美国专利5,849,487
美国专利5,849,497
美国专利5,849,546
美国专利5,849,547
美国专利5,851,770
美国专利5,851,772
美国专利5,853,990
美国专利5,853,992
美国专利5,853,993
美国专利5,856,092
美国专利5,858,652
美国专利5,861,244
美国专利5,863,732
美国专利5,863,753
美国专利5,866,331
美国专利5,866,337
美国专利5,866,366
美国专利5,900,481
美国专利5,905,024
美国专利5,910,407
美国专利5,912,124
美国专利5,912,145
美国专利5,912,148
美国专利5,916,776
美国专利5,916,779
美国专利5,919,626
美国专利5,919,630
美国专利5,922,574
美国专利5,925,517
美国专利5,925,525
美国专利5,928,862
美国专利5,928,869
美国专利5,928,870
美国专利5,928,905
美国专利5,928,906
美国专利5,929,227
美国专利5,932,413
美国专利5,932,451
美国专利5,935,791
美国专利5,935,825
美国专利5,939,291
美国专利5,942,391
美国专利5,952,174
Akimoto等,Clin.Cancer Res.5:2884-2890,1999.
Ausubel等,选自《新编分子生物学实验指南》(Current Protocols in MolecularBiology),John,Wiley & Sons,Inc,纽约,1996.
Brandt等,Cancer Res.,64:7-12,2004.
Buerger等,Cancer Res.,60(4):854-857,2000.
Courey等,Cell,55:887-98,1988.
Deb等,Oncogene,9:1341-1349,1994.
欧洲专利申请201,184
欧洲专利申请237,362
欧洲专利申请258,017
欧洲专利申请329 822
欧洲专利申请50,424
欧洲专利申请84,796
欧洲专利266,032
法国专利2,650,840
Froehler等,Nucleic Acids Res.,14(13):5399-5407,1986.
Frohman,选自《PCR实验方法:方法和应用指南》(PCR Protocols:A Guide ToMethods And Applications),学术出版社(Academic Press),纽约,1994.
Gebhardt等,J.Biol.Chem.,274(19):13176-13180,1999.
Grandis等,Nature Med.,2:237-240,1996.
英国专利申请2 202 328
Haley等,Oncogene Res.,1(4):375-396,1987.
Halushka等,Nat.Genet.,22(3):239-247,1999.
Hudson等,Mol.Endocrinol.,3:400-408,1989.
Inazuka等,Genome Res,7(11):1094-1103,1997.
Innis等,Proc.Natl.Acad.Sci.USA,85(24):9436-9440,1988.
Ishii等,Proc.Natl.Acad.Sci.USA,82(15):4920-4924,1985.
Johnson等,Nat.Genet.,29(2):233-237,2001.
Johnson等,J.Biol.Chem.,263(12):5693-5699,1988.
Johnson等,Front Biosci.3:d447-d4488,1998.
Kageyama等,J.Biol.Chem.,263(13):6329-6336,1988.
Ke和Cardon,Bioinformatics,19(2):287-288,2003.
Komher等,Nucl.Acids.Res.17:7779-7784,1989.
Kuppuswamy等,Proc.Natl.Acad.Sci.(U.S.A.)88:1143-1147,1991.
Kwoh等,Proc.Natl.Acad.Sci.USA,86:1173,1989.
Kwok,Annu.Rev.Genomics Hum.Genet.,2:235-58,2001.
Kwok and Chen,Curr.Issues Mol.Biol.,5(2):43-60,2003.
Kwok等,J Med Genet.,33(6):465-468,1996.
Kwok等,Genomics,23(1):138-144,1994.
Landegren等,Science 241:1077-1080,1988.
Maekawa等,J.Biol.Chem.,264(10):5488-5494,1989.
Magistroni等,J.Nephrology,16:110-115,2003.
Martin等,Digestion,66:121-126,2002.
Maxam等,Proc.Natl.Acad.Sci.USA,74:560,1977。
Mullis等,Cold Spring Harbor Symp.Quant.Biol.51:263-273,1986.
Nickerson等,Proc.Natl.Acad.Sci.USA,87:8923-8927,1990.
Nyren等,Anal.Biochem.208:171-175,1993.
Ohara等,Proc.Natl.Acad.Sci.USA,86:5673-5677,1989.
PCT申请WO91/02087
PCT申请PCT/US87/00880
PCT申请PCT/US89/01025
PCT申请WO 88/10315
PCT申请WO 89/06700
PCT申请WO 92/15712
Prezant等,Hum.Mutat.,1:159-164,1992.
Reinshagen等,Gastroenterology,104:A642,1993.
Salomon等,Crit.Rev.Oncol.Hematol.19:183-232,1995.
Sambrook等,选自《分子克隆》(Molecular cloning),冷泉港实验室出版社,冷泉港,纽约,2001.
Sanger等,J.Molec.Biol.,94:441,1975.
Satsangi等,Nat.Genet.,14:199-202,1996.
Sokolov,Nucl.Acids Res.18:3671,1990.
Subler等,Oncogene,9:1351-1359,1994.
Sweeney等,Kidney Int.,55:1187-1197,1999.
Syvanen等,Genomics 8:684-692,1990.
Taillon-Miller等,Genome Res,8(7):748-754,1998.
Tysnes等,Invasion Metastasis,17:270-280,1997.
Ugozzoll等,GATA 9:107-112,1992.
Walker等,Proc.Natl.Acad.Sci.USA,89:392-396 1992.
Wosikowski等,Biochim.Biophys.Acta,1497:215-226,2000.
Xu等Proc.Natl.Acad.Sci.USA,81:7308-7312,1984.
Xu等,J.Biol.Chem.,268:16065-16073,1993.
                        序列表
<110>M.J.拉泰恩(RATAIN,MARK J.)
     W.刘(LIU,WANQING)
     F.伊诺桑蒂(INNOCENTI,FEDERICO)
<120>表皮生长因子受体基因启动子的多态性
<130>ARCD:404WO
<140>未知
<141>2005-03-01
<150>60/549,069
<151>2004-03-01
<160>38
<170>PatentIn Ver.2.1
<210>1
<211>525
<212>DNA
<213>智人(Homo sapiens)
<400>1
gaaattaact cctcagggca cccgctcccc tcccatgcgc cgccccactc ccgccggaga    60
ctaggtcccg cgggggccac cgctgtccac cgcctccggc ggccgctggc cttgggtccc    120
cgctgctggt tctcctccct cctcctcgca ttctcctcct cctctgctcc tcccgatccc    180
tcctccgccg cctggtccct cctcctcccg ccctgcctcc ccgcgcctcg gcccgcgcga    240
gctagacgtc cgggcagccc ccggcgcagc gcggccgcag cagcctccgc cccccgcacg    300
gtgtgagcgc ccgacgcggc cgaggcggcc ggagtcccga gctagccccg gcggccgccg    360
ccgcccagac cggacgacag gccacctcgt cggcgtccgc ccgagtcccc gcctcgccgc    420
caacgccaca accaccgcgc acggccccct gactccgtcc agtattgatc gggagagccg    480
gagcgagctc ttcggggagc agcgatgcga ccctccggga cggcc                    525
<210>2
<211>4990
<212>DNA
<213>智人(Homo sapiens)
<400>2
ctccacagag gctgtgagct agagccctaa ctgtgcaggg ccctaactat gccaggctac    60
ttatctctct taagaggact tcattagtgc ctgctcggcc atacagtttt ttacttacca    120
agtaacacag ttatcagcac actccaggta ctagccaagg actacaaaat caacgtgaat    180
gtcagctttt gtatcaaaag ctcaaaggag aaactcaaac tttacataga tgtcccatga    240
agatgttcag caaacccatt cttctctgtt ccctggaatc catcccagta ttgtgctatg    300
tgtgtgtcta gtaattcttt acaaaaagct ctgtttcttg tgatgctatc agatcacatt    360
gaagaatata caagccgtac tatgaaggct gttgtctcat atagtcctaa cgtagtgaga    420
actgatgttc ttacatgctg tctttttggg cactcaaaga aattcctgta cagtcttaca    480
aatcagttgt agcttaaatt gatttgtgtt gtgacttgta cacacaggtc acattccctt    540
gacagaaaat atagtttaaa accaaatttg cagcccttgt taagtgaatg cacaggactt    600
tattgtattc aggtctttta ttgtaagact cactcctgtc ttcattttat gttccactgt    660
tgtgcttccc atttgccttt ctctagtttt gttttctgtg tttctacgga ctgctctcag    720
cccaggtgtg caggaagcac acacatgcct gcagagcctt catggcctct gcattcaggg    780
catgacttca acgcacagtg gctgtactga tttgttaaaa caaaggaaca gattacttct    840
cctaattcac agggaagttc caggttgtgc gggcagtgag cagacctgtg tctgtctgcg    900
cttgccctgg tgaaaaaccc caccgttcag gctgcagggt gcgagaccca ggcacaaaca    960
ttttgctgga tgaggaggaa agatgtaagg ttgctcccct tcagagacag caaagggcag    1020
gtctgtagct tcacttactt caggattgtg atttttgaca gagccgagag atcagggttg    1080
ttgaaccagg cctgaaggtc ctagtgaatc tcgtgaagag aggaggggtc tggctgtaac    1140
atggacctag aggacatttt tactgcagga gaaggaacag tggggatggg gtggacttgc    1200
caaaggaata tagctcaagt tcctgcagcc caaaaaagct cagtttcttt tggccaaagc    1260
ttccgcgagt ttccctggca tttctcctgc gggagctaca ggggcagtgg gacacttagc    1320
ctctctaaaa gcacctccac ggctgtttgt gtcaagcctt tattccaaga gcttcacttt    1380
tgcgaagtaa tgtgcttcac acattggctt caaagtaccc atggctggtt gcaataaaca    1440
ttaaggaggc ctgtctctgc acccggagtt gggtgccctc atttcagatg atttcgaggg    1500
tgcttgacaa gatctgaagg accctcggac tttagagcac cacctcggac gcctggcacc    1560
cctgccgcgc gggcacggcg acctcctcag ctgccaggcc agcctctgat ccccgagagg    1620
gtcccgtagt gctgcagggg aggtggggac ccgaataaag gagcagtttc cccgtcggtg    1680
ccattatccg acgctggctc taaggctcgg ccagtctgtc taaagctggt acaagtttgc    1740
tttgtaaaac aaaagaaggg aaagggggaa ggggaccctg gcacagattt ggctcgacct    1800
ggacataggc tgggcctgca agtccgcggg gaccgggtcc agaggggcag tgctgggaac    1860
gcccctctcg gaaattaact cctcagggca cccgctcccc tcccatgcgc cgccccactc    1920
ccgccggaga ctaggtcccg cgggggccac cgctgtccac cgcctccggc ggccgctggc    1980
cttgggtccc cgctgctggt tctcctccct cctcctcgca ttctcctcct cctctgctcc    2040
tcccgatccc tcctccgccg cctggtccct cctcctcccg ccctgcctcc ccgcgcctcg    2100
gcccgcgcga gctagacgtc cgggcagccc ccggcgcagc gcggccgcag cagcctccgc    2160
cccccgcacg gtgtgagcgc ccgacgcggc cgaggcggcc ggagtcccga gctagccccg    2220
gcggccgccg ccgcccagac cggacgacag gccacctcgt cggcgtccgc ccgagtcccc    2280
gcctcgccgc caacgccaca accaccgcgc acggccccct gactccgtcc agtattgatc    2340
gggagagccg gagcgagctc ttcggggagc agcgatgcga ccctccggga cggccggggc    2400
agcgctcctg gcgctgctgg ctgcgctctg cccggcgagt cgggctctgg aggaaaagaa    2460
aggtaagggc gtgtctcgcc ggctcccgcg ccgcccccgg atcgcgcccc ggaccccgca    2520
gcccgcccaa ccgcgcaccg gcgcaccggc tcggcgcccg cgcccccgcc cgtcctttcc    2580
tgtttccttg agatcagctg cgccgccgac cgggaccgcg ggaggaacgg gacgtttcgt    2640
tcttcggccg ggagagtctg gggcgggcgg aggaggagac gcgtgggaca ccgggctgca    2700
ggccaggcgg ggaacggccg ccgggacctc cggcgccccg aaccgctccc aactttcttc    2760
cctcactttc cccgcccagc tgcgcaggat cggcgtcagt gggcgaaagc cgggtgctgg    2820
tgggcgcctg gggccggggt cccgcacgtg cgccccgcgc tgtcttccca gggcgcgacg    2880
gggtcctggc gcgcacccga ggggcgggcg ctgcccaccc gccgagactg cactgtttag    2940
ggaagctgag gaaggaaccc aaaaatacag cctcccctcg gaccccgcgg gacaggcggc    3000
tttctgagag gacctccccg cctccgccct ccgcgcaggt ctcaaactga agccggcgcc    3060
cgccagcctg gccccggccc ctctccaggt ccccgcgatc ctcgttcccc agtgtggagt    3120
cgcagcctcg acctgggagc tgggagaact cgtctaccac cacctgcggc tcccggggag    3180
gggtggtgct ggcggcggtt agtttcctcg ttggcaaaag gcaggtgggg tccgacccgc    3240
cccttgggcg cagaccccgg ccgctcgcct cgcccggtgc gccctcgtct tgcctatcca    3300
agagtgcccc ccacctcccg gggaccccag ctccctcctg ggcgcccgcg ccgaaagccc    3360
caggctctcc ttcgatggcc gcctcgcgga gacgtccggg tctgctccac ctgcagccct    3420
tcggtcgcgc ctgggcttcg cggtggagcg ggacgcggct gtccggccac tgcagggggg    3480
gatcgcggga ctcttgagcg gaagccccgg aagcagagct catcctggcc aacaccatgg    3540
tgtttcaaaa tggggctcac agcaaacttc tcctcaaaac ccggagactt tctttcttgg    3600
atgtctcttt ttgctgtttg aagaatttga gccaaccaaa atattaaacc tgtcttacac    3660
acacacacac acacacacac acacacacac cggattgctg tccctggttc aagtgtgcca    3720
agtgtgcaga cagaacatga gcgagtctgg cttcgtgact accgaccata aacccacttg    3780
acaggggaaa catgccttgg aaggtttaat tgcacaattc caaccttgag ctgcgcgggt    3840
tccaagagcc aggcccgtac ttgctgttga tgtcattggc ttggggagtt ggggtttggt    3900
gcccagcgcg gtcgttgggg gaggggcaag gcatagaaca gtggttccca gaccttgctg    3960
cacattggaa ttacctggga ttaaaaaaaa aaaaatcaaa acaaaaacca gtgtctggct    4020
cccgccccca gacattctga tttaattggc atggggcaag acctggactt gggatttttt    4080
ttaatgctct tcatgtgatc tgttgggcag ccagatttgg ggatcactag acggaagaag    4140
gattgttaaa gtctccggag atgttacttg ccaatgctaa gagctctttg aggacatctg    4200
gaattgttac aatattgcca aatataggaa agagggaaaa ggtagagtgt gattccaata    4260
ataaaggatt ccgcttttca ttgaaggaac tggtggaaag gtttcttctc tgctgagcct    4320
gcaggcccgt cctgcctgcc tggggtgccc gggagacgcg ggcctgctcc ggagactgct    4380
gactgccggt cctgttagtc aggtgtcagc cctgtctctg ccgaagagac tcttctcttt    4440
attttaaatt aaaccctcag agcaccacca aagcatcact tttctccctc cattggtgtt    4500
ctcattcttt gatgttactt gtttgaacac cactattagt agttggagat ttgttcctga    4560
gaaaaatata aataccactt aatttgcctg tttgtcccgc attcactcaa aacagaatgc    4620
tcctgaagac aagagagaga gtaggagaac agacgctatt ccattacagt aacataaaag    4680
actggatttt caggggcaaa ttattaaaat aggagatgag ctcttttaac agaaatttgt    4740
ttaaggcctg tgtctatcaa attcagtgga ttttattcaa gatgcacttt gtttagtggg    4800
agttttgttt ggttctggga catgctaact tctagacttg ctgctcttag aggtaatgac    4860
tgccagacac catttcatga gtcctaatcc ccacattaag cataagaggt gcacactctc    4920
ctcctatggg ggaaactgag gtacgaagaa ctaaagtgac tttcccacag ctggtgggag    4980
gcagacggga                                                           4990
<210>3
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>3
gttccactgt tgtgcttccc                                                 20
<210>4
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>4
aagaaagttg ggagcggttc                                                 20
<210>5
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>5
gggtggactt gccaaagga                                                19
<210>6
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>6
cttagagcca gcgtcggata                                               20
<210>7
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>7
gcatgacttc aacgcacagt                                               20
<210>8
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>8
gaggctaagt gtcccactgc                                               20
<210>9
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>9
tcggacttta gagcaccacc                                               20
<210>10
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>10
gaggaggaga atgcgaggag                                               20
<210>11
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>11
aaattaactc ctcagggcac c                                             21
<210>12
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>12
cgcccttacc tttcttttcc                                               20
<210>13
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>13
ccctgactcc gtccagtatt                                               20
<210>14
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>14
cgtcctttcc tgtttccttg                                               20
<210>15
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>15
accagctgtg ggaaagtcac                                               20
<210>16
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>16
agacgagttc tcccagctcc                                               20
<210>17
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>17
gcgcaggtct caaactgaag                                               20
<210>18
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>18
ggagaagttt gctgtgagcc                                                20
<210>19
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>19
ccctcgtctt gcctatcca                                                 19
<210>20
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>20
agtgatcccc aaatctggct                                                20
<210>21
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>21
ggcatagaac agtggttccc                                                20
<210>22
<211>20
<212> DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>22
gaacaccaat ggagggagaa                                                20
<210>23
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>23
tgaaggaact ggtggaaagg                                                20
<210>24
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>24
catgtcccag aaccaaacaa                                                20
<210>25
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>25
ccaccggtac cggcggccgc tggccttg                                       28
<210>26
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>26
cggcgagaca cgcccttacc ttt                                            23
<210>27
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>27
gcagcctccg ccccccgcac ggtgt                                          25
<210>28
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>28
acaccgtgcg gggggcggag gctgc                                         25
<210>29
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>29
gcagcctccg ccccccgcac ggtgt                                         25
<210>30
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>30
acaccgtgcg gggggcggag gctgc                                         25
<210>31
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>31
gcagcctcct ccccccgcac ggtgt                                          25
<210>32
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>32
acaccgtgcg gggggaggag gctgc                                         25
<210>33
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>33
gcagcctcct ccccccgcac ggtgt                                         25
<210>34
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>34
acaccgtgcg gggggaggag gctgc                                         25
<210>35
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>35
attcgatcgg ggcggggcga gc                                             22
<210>36
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>36
gctcgccccg ccccgatcga at                                             22
<210>37
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>37
attcgatcgg ggcggggcga gc                                             22
<210>38
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成引物
<400>38
gctcgccccg ccccgatcga at                                             22

Claims (40)

1.一种评价EGFR靶向治疗药物治疗癌症病人潜在效力的方法,其特征在于,所述方法包括测定病人一种或两种EGFR基因中的多态性序列。
2.如权利要求1所述的方法,其特征在于,所述多态性位于选自以下的核苷酸位置或与选自以下的核苷酸位置连锁不平衡:核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。
3.如权利要求2所述的方法,其特征在于,所述多态性是选自以下的多态性或与选自以下的多态性连锁不平衡:-1435 C>T、-1300 G>A、-1249 G>A、-1227 G>A、-761 C>A、-650 G>A、-544 G>A、-486 C>A、-216 G>T、-191 C>A、169 G>T和2034G>A。
4.如权利要求1所述的方法,其特征在于,所述方法还包括测定病人一种或两种EGFR基因中的至少两种多态性序列。
5.如权利要求1所述的方法,其特征在于,所述EGFR靶向治疗药物是EGFR酪氨酸激酶抑制剂。
6.如权利要求5所述的方法,其特征在于,所述EGFR酪氨酸激酶抑制剂是吉非替尼或埃罗替尼。
7.如权利要求1所述的方法,其特征在于,所述EGFR靶向治疗药物是单克隆抗体。
8.如权利要求7所述的方法,其特征在于,所述单克隆抗体是西妥昔单抗。
9.如权利要求3所述的方法,其特征在于,所述多态性是-216 G>T。
10.如权利要求9所述的方法,其特征在于,某等位基因-216位为T表示EGFR蛋白表达较高,而EGFR蛋白表达较高表示EGFR靶向治疗药物的疗效降低。
11.如权利要求1所述的方法,其特征在于,所述方法还包括测定病人两种EGFR基因中的多态性序列。
12.如权利要求1所述的方法,其特征在于,用杂交试验测定多态性序列。
13.如权利要求1所述的方法,其特征在于,用等位基因特异性扩增试验测定多态性序列。
14.如权利要求1所述的方法,其特征在于,用测序或微量测序试验测定多态性序列。
15.如权利要求1所述的方法,其特征在于,用限制性酶消化测定多态性序列。
16.如权利要求1所述的方法,其特征在于,所述方法还包括获得样品。
17.如权利要求16所述的方法,其特征在于,所述样品包括口腔细胞、单核细胞或癌细胞。
18.如权利要求1所述的方法,其特征在于,所述方法还包括给予病人EGFR靶向治疗药物。
19.一种预测癌症病人临床预后的方法,其特征在于,所述方法包括测定病人一种或两种EGFR基因中的多态性序列。
20.如权利要求19所述的方法,其特征在于,所述方法还包括测定病人两种EGFR基因中的多态性序列。
21.如权利要求19所述的方法,其特征在于,所述多态性位于选自以下的核苷酸位置或与选自以下的核苷酸位置连锁不平衡:核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。
22.如权利要求21所述的方法,其特征在于,所述多态性是选自以下的多态性或与选自以下的多态性连锁不平衡:-1435 C>T、-1300 G>A、-1249 G>A、-1227 G>A、-761 C>A、-650 G>A、-544 G>A、-486 C>A、-216 G>T、-191 C>A、169 G>T和2034G>A。
23.如权利要求22所述的方法,其特征在于,所述多态性是-216 G>T。
24.如权利要求23所述的方法,其特征在于,等位基因-216位为T表示EGFR蛋白表达增加。
25.如权利要求24所述的方法,其特征在于,EGFR蛋白表达增加预示预后不良。
26.如权利要求25所述的方法,其特征在于,预后不良表示对化疗、激素疗法或放疗的抗药性增强。
27.如权利要求25所述的方法,其特征在于,预后不良表示转移风险增加。
28.一种评价病人对EGFR靶向治疗药物毒性风险的方法,其特征在于,所述方法包括测定病人一种或两种EGFR基因中的多态性序列。
29.如权利要求28所述的方法,其特征在于,所述多态性位于选自以下的核苷酸位置或与选自以下的核苷酸位置连锁不平衡:核苷酸位置-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。
30.如权利要求29所述的方法,其特征在于,所述多态性是选自以下的多态性或与选自以下的多态性连锁不平衡:-1435 C>T、-1300 G>A、-1249 G>A、-1227 G>A、-761 C>A、-650 G>A、-544 G>A、-486 C>A、-216 G>T、-191 C>A、169 G>T和2034G>A。
31.如权利要求30所述的方法,其特征在于,所述多态性是-216 G>T。
32.如权利要求31所述的方法,其特征在于,一种或多种等位基因-216位为T表示EGFR靶向治疗药物的毒性降低。
33.如权利要求28所述的方法,其特征在于,所述方法还包括测定病人两种EGFR基因中的多态性序列。
34.一种预测细胞中EGFR表达水平的方法,其特征在于,所述方法包括测定细胞EGFR基因的一种或两种等位基因中-216位的序列,其中,一种或两种等位基因-216位为T表示表达水平较高。
35.一种评价EGFR靶向治疗药物治疗EGFR失调相关疾病病人的潜在效力的方法,其特征在于,所述方法包括测定病人一种或两种EGFR基因中的多态性序列。
36.一种评价EGFR靶向治疗药物在病人中的潜在效力的试剂盒,其特征在于,所述试剂盒装有用于测定EGFR基因座中多态性序列的核酸。
37.如权利要求36所述的试剂盒,其特征在于,所述核酸是用来扩增位于选自以下氨基酸位置的多态性的引物:-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。
38.如权利要求36所述的试剂盒,其特征在于,所述核酸是设计用来检测选自以下核苷酸位置的多态性的特异性杂交探针:-1435、-1300、-1249、-1227、-761、-650、-544、-486、-216、-191、169和2034。
39.如权利要求38所述的试剂盒,其特征在于,所述特异性杂交探针包含在寡核苷酸阵列或微阵列中。
40.一种评价EGFR靶向治疗药物在病人中潜在效力的试剂盒,其特征在于,所述试剂盒装有用于测定EGFR基因座中多态性序列的限制性酶。
CNA2005800064657A 2004-03-01 2005-03-01 表皮生长因子受体基因启动子的多态性 Pending CN101056990A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US54906904P 2004-03-01 2004-03-01
US60/549,069 2004-03-01

Publications (1)

Publication Number Publication Date
CN101056990A true CN101056990A (zh) 2007-10-17

Family

ID=34919431

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800064657A Pending CN101056990A (zh) 2004-03-01 2005-03-01 表皮生长因子受体基因启动子的多态性

Country Status (7)

Country Link
US (1) US20070275386A1 (zh)
EP (1) EP1730306A2 (zh)
JP (1) JP2007527241A (zh)
KR (1) KR20070048645A (zh)
CN (1) CN101056990A (zh)
CA (1) CA2558753A1 (zh)
WO (1) WO2005085473A2 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ566387A (en) * 2005-10-05 2010-05-28 Astrazeneca Uk Ltd Method to predict or monitor the response of a patient to an ErbB receptor drug by screening for mutations in an ErbB receptor
US8583380B2 (en) 2008-09-05 2013-11-12 Aueon, Inc. Methods for stratifying and annotating cancer drug treatment options
WO2011014811A1 (en) * 2009-07-31 2011-02-03 Ibis Biosciences, Inc. Capture primers and capture sequence linked solid supports for molecular diagnostic tests
KR20130079303A (ko) * 2009-08-04 2013-07-10 에프. 호프만-라 로슈 아게 혈관형성저해제에 대한 반응성
CN102134275B (zh) * 2010-01-26 2013-12-04 上海市肿瘤研究所 表皮生长因子受体变异体
US9309556B2 (en) 2010-09-24 2016-04-12 The Board Of Trustees Of The Leland Stanford Junior University Direct capture, amplification and sequencing of target DNA using immobilized primers
EP2554551A1 (en) 2011-08-03 2013-02-06 Fundacio Institut mar d'Investigacions Médiques (IMIM) Mutations in the epidermal growth factor receptor gene
CN103045746A (zh) * 2012-12-31 2013-04-17 上海市胸科医院 Egfr基因突变检测的扩增引物、检测探针和液相芯片
US9873908B2 (en) * 2013-11-27 2018-01-23 Roche Molecular Systems, Inc. Methods for the enrichment of mutated nucleic acid from a mixture

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5786344A (en) * 1994-07-05 1998-07-28 Arch Development Corporation Camptothecin drug combinations and methods with reduced side effects
US6395481B1 (en) * 1999-02-16 2002-05-28 Arch Development Corp. Methods for detection of promoter polymorphism in a UGT gene promoter
US20020016293A1 (en) * 2000-04-21 2002-02-07 Ratain Mark J. Flavopiridol drug combinations and methods with reduced side effects
US20030099960A1 (en) * 2001-01-26 2003-05-29 The University Of Chicago Compositions and methods for optimizing UGT2B7 substrate dosings and for predicting UGT2B7 substrate toxicity
EP2385139A1 (en) * 2002-07-31 2011-11-09 University of Southern California Polymorphisms for predicting disease and treatment outcome
US20040203034A1 (en) * 2003-01-03 2004-10-14 The University Of Chicago Optimization of cancer treatment with irinotecan

Also Published As

Publication number Publication date
CA2558753A1 (en) 2005-09-15
KR20070048645A (ko) 2007-05-09
US20070275386A1 (en) 2007-11-29
EP1730306A2 (en) 2006-12-13
WO2005085473A3 (en) 2006-03-02
WO2005085473A2 (en) 2005-09-15
JP2007527241A (ja) 2007-09-27

Similar Documents

Publication Publication Date Title
CN101056990A (zh) 表皮生长因子受体基因启动子的多态性
CN1177059C (zh) 与il-1基因座多态性相关之炎性疾病的预测方法
CN1034673C (zh) 检测核苷酸顺序的方法
CN1602361A (zh) 杂交部分控制寡核苷酸及其应用
CN1890384A (zh) 与炎性疾病的治疗功效相关的遗传多态性的用途
CN1930306A (zh) 发展用于血栓形成倾向识别的方法(mert)
CN1497049A (zh) 雄激素受体复合物-相关蛋白
CN1849400A (zh) 红细胞生成素基因的新的多核苷酸和多肽
CN1547613A (zh) 评估施用自身或者其代谢中间物被ugt1a1酶代谢的化合物引起严重毒性的方法
CN1169824C (zh) M×a蛋白质的多型基因及其应用
CN1942480A (zh) 与高脂血症、血脂障碍和糖代谢缺陷相关的SNPs的鉴别
CN1671841A (zh) 基因多态性分型方法
CN101048504A (zh) 对干扰素治疗肾细胞癌反应的鉴定标记
CN1712543A (zh) Leber’s遗传性视神经病的定量检测方法
CN1678741A (zh) 用于检测基因多态性的方法
CN1711361A (zh) 预测药物治疗副效应水肿的方法
CN1890387A (zh) 用于乳腺癌的诊断/预后的方法
CN1635142A (zh) 用于预测偏执型精神分裂症易感性的试剂盒及所用引物
CN1503847A (zh) 用于鉴定牛脊椎畸形综合征携带者的遗传试验
CN1891822A (zh) 具有特定单核苷酸多态性的th基因及其检测方法和用途
CN1496402A (zh) 表达基因鉴定用cDNA标记物的制备方法和基因表达分析方法
CN1295331C (zh) 新的癌基因、从其衍生的重组蛋白及其应用
CN1526111A (zh) 可用于评估干扰素疗效的多态标记
CN1833023A (zh) 药物性粒细胞过少症发病几率判定法
CN1281621C (zh) 利用nipa1基因突变热点诊断、治疗遗传性痉挛性截瘫的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20071017