CN101421409A - 补体调控基因中预测年龄相关性黄斑变性的变体 - Google Patents

补体调控基因中预测年龄相关性黄斑变性的变体 Download PDF

Info

Publication number
CN101421409A
CN101421409A CN200780012906.3A CN200780012906A CN101421409A CN 101421409 A CN101421409 A CN 101421409A CN 200780012906 A CN200780012906 A CN 200780012906A CN 101421409 A CN101421409 A CN 101421409A
Authority
CN
China
Prior art keywords
gene
polymorphism
experimenter
cfh
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200780012906.3A
Other languages
English (en)
Inventor
R·L·阿利科麦茨
G·S·哈格曼
M·C·迪安
A·M·戈尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Iowa Research Foundation UIRF
Columbia University in the City of New York
National Institutes of Health NIH
Original Assignee
University of Iowa Research Foundation UIRF
Columbia University in the City of New York
National Institutes of Health NIH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Iowa Research Foundation UIRF, Columbia University in the City of New York, National Institutes of Health NIH filed Critical University of Iowa Research Foundation UIRF
Publication of CN101421409A publication Critical patent/CN101421409A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了用于鉴定受试者发生AMD危险的方法,以及可用于实施所述方法的试剂盒。该方法包括在受试者遗传物质中鉴定特异的保护性多态性或基因型、或危险多态性或基因型,包括鉴定BF、C2和/或CFH基因中的多态性。本发明还提供用于这些方法中的微阵列和试剂盒。

Description

补体调控基因中预测年龄相关性黄斑变性的变体
相关文献的交叉参考
本申请要求2006年2月13日提交的美国临时申请60/772,989号的权益,所述文献以其全部内容引入本文为参考。
技术领域
本申请涉及预测年龄相关性黄斑变性的个体遗传易感性的方法。
对政府资助的致谢
本发明受美国政府资助、依据国立卫生研究院授权号EY 13435(RA)和EY 11515(GSH),并在来自国立癌症研究所、国立卫生研究院的联邦基金(合约号NO1-CO-124000)协助下部分由美国政府机构完成。美国政府拥有本发明的某些权利。
背景技术
年龄相关性黄斑变性(AMD)是影响黄斑的退化性眼疾病,所述黄斑为提供精确视觉的中央视网膜的光感受器富集区。AMD导致通常仅维持周边视觉完整的中央视觉突然恶化。AMD是发达国家中不可逆失明的最常见形式。该疾病通常表现为一只眼睛的中央视觉下降,随后在数月或数年内另一只眼睛的中央视觉类似地丧失。该疾病的临床病征包括黄斑中存在沉积物(玻璃疣)。
尽管是主要的公共卫生负担,但对AMD病原学和发病机理的了解仍很少。许多研究已指出在AMD的病理生物学中具有炎症(Anderson等(2002)Am.J.Ophthalmol.134:411-31;Hageman等(2001)Prog.Retin.Eye Res.20:705-32;Mullins等(2000)Faseb J.14:835-46;Johnson等(2001)Exp.Eye Res.73:887-96;Crabb等(2002)Proc.Natl.Acad.Sci.美国99:14682-7;Bok,D.(2005)Proc.Natl.Acad.Sci.美国102:7053-4)。补体途径的功能异常可诱导对黄斑细胞的重大旁观损伤,导致萎缩、变性和脉络膜新生血管膜的复杂化,与在其他补体介导的疾病过程中发生的损伤类似(Hageman等(2005)Proc.Natl.Acad.Sci.美国102:7227-32;Morgan和Walport(1991)Immunol.Today 12:301-6;Kinoshita(1991)Immunol.Today 12:291-5;Holers和Thurman(2004)Mol.Immunol.41:147-52)。该疾病可能具有强大的遗传贡献。例如,FBLN6、ABCA4和APOE基因的变体已显示为危险因子。近来,发现补体因子H基因(CFH)的变体与发生AMD的危险增加相关,所述补体因子H基因编码补体旁路的主要抑制因子(Haines等(2005)Science308:419-21;Klein等(2005)Science 308:385-9;Edwards等(2005)Science 308:421-4;Hageman等(2005)Proc.Natl.Acad.Sci.美国102:7227-32)。
由于该疾病的患病率和可得到的有限治疗,需要鉴定发生AMD危险的受试者的方法。
概述
已鉴定了对年龄相关性黄斑变性(AMD)呈保护性的多态性和基因型。提供方法用于鉴定发生AMD危险增加的受试者。这些方法包括但不局限于,分析受试者的因子B(BF)和/或补体组分2(C2)基因,并确定所述受试者是否具有至少一种保护性多态性。此类保护性多态性的实例包括(a)BF(rs641153)中的R32Q;(b)BF(rs4151667)中的L9H;(c)C2(rs547154)中的IVS10;和(d)C2(rs9332739)中的E318D。或者,可以通过在受试者中检测蛋白质变体来实施方法。如果受试者不具有至少一种保护性多态性,所述受试者发生AMD的危险增加。在该方面的一个实施方案中,对受试者CFH基因进行进一步的分析。在一些实施方案中,可以在CFH基因座处分析受试者的基因型来确定所述受试者是否具有至少一种保护性基因型。在一个实施方案中,可以在BF或C2基因座处和CFH基因座处分析受试者的基因型来确定所述受试者是否具有至少一种保护性基因型。如此后公开的,在若干实例中,知道受试者的多态性是纯合的还是杂合的将是有益的。
保护性基因型的实例包括:(a)BF(rs641153)中杂合的R32Q多态性;(b)BF(rs4151667)中杂合的L9H多态性;(c)C2(rs547154)中杂合的IVS10多态性;(d)C2(rs9332739)中杂合的E318D多态性;(e)CFH中纯合的delTT多态性;(f)BF(rs1048709)中纯合的R150R多态性;和(g)CFH中纯合的Y402。如果受试者不具有至少一种保护性基因型,所述受试者发生AMD的危险增加。
本发明提供评估人受试者中黄斑变性或其他补体介导疾病发生或可能进展的危险的方法。本方法的基础是某些遗传特征与补体相关疾病(在该情况下是年龄相关性黄斑变性)的危险或保护性表型的遗传联合研究得到的发现。本发明的方法包括步骤:从人受试者中获得生物学样品,并通过本领域已知的任何有效技术分析样品以确定所述受试者是否携带一种或多种:
BF基因rs641153处的A或G,其翻译成人BF蛋白质第32位的R或Q;
BF基因rs4151667处的A或T,其翻译成人BF蛋白质第9位的L或H;
C2基因rs547154处的G或T,其位于内含子10内;
C2基因rs9332379处的C或G,其翻译成人C2蛋白质第318位的E或D;
BF基因rs1048709处的A或G,其翻译成第150位的R;
CFH基因中的delTT;和
CFH基因rs1061170处的C或T,其翻译成人CFH蛋白质第402位的Y或H。
在某些实施方案中,分析样品以确定受试者是否携带一种或多种:
BF基因rs641153处的A或G,其翻译成人BF蛋白质第32位的R或Q;
BF基因rs4151667处的A或T,其翻译成人BF蛋白质第9位的L或H;
C2基因rs547154处的G或T,其位于内含子10内;和
C2基因rs9332379处的C或G,其翻译成人C2蛋白质第318位的E或D。
在一些实施方案中,样品是易得到的体液,如血液或血液成分,或尿。当在DNA或mRNA水平上完成评估时,需要微孔材料以能够从受试者细胞中检测基因型。
在一些实施方案中,受试者可能已诊断为患有包括AMD、早期AMD、脉络膜新生血管形成(CNV)或地图样萎缩(GA)的疾病。在一个实施方案中,受试者具有所述疾病的症状,例如早期黄斑变性症状如玻璃疣的发生。一些受试者可能呈现玻璃疣的发生。受试者可能无黄斑变性或其他补体相关疾病的症状,在该情况下,分析基本上提供筛选方法,其通常可以在全体群体或在认为处于危险增加的某一部分群体上(如具有补体相关疾病家族史的个体)完成。然而,其他受试者可能处于获得AMD高危险中。在一个实施方案中,受试者具有Y402H SNP。
因此,在另一方面,本发明提供用于评估人受试者中黄斑变性或其他补体介导疾病发生或可能进展的危险的试剂盒。试剂盒包括用于在来自受试者的样品中检测的试剂集合,所述受试者具有一种或多种,优选两种或多种上面列出的多态性或等位变体。它可能包含设计为使用本领域已知的任何方法检测变体的寡核苷酸,通常为标记的寡核苷酸。试剂盒可能包括,例如当靶标是多态性或特异结合蛋白质(例如,单克隆抗体,其特异性识别并结合目的蛋白质的等位变体,作为从样品中获得相关遗传/蛋白质组学信息的基础)时,用于扩增目的多核苷酸序列的PCR引物。在优选的实施方案中,试剂盒包含固定在固体支持物上的寡核苷酸。
根据方式,试剂盒(用于鉴定发生年龄相关性黄斑变性(AMD)的危险增加的受试者)中的组分将包括用于检测受试者中至少一种保护性多态性的一种或多种试剂。此类试剂允许检测至少一种保护性多态性,所述保护性多态性包括:(a)BF(rs641153)中的R32Q;(b)BF(rs4151667)中的L9H;(c)C2(rs547154)中的IVS10;和(d)C2(rs9332739)中的E318D。此类试剂盒中的试剂可包括检测保护性多态性的一种或多种寡核苷酸。试剂盒的其他组分可包括用于扩增靶序列的一种或多种试剂,其中所述靶序列包含一种或多种保护性多态性。在一些版本的试剂盒中,一种或多种寡核苷酸固定在固体支持物上。
在相关方面,本发明提供用于鉴定发生AMD的危险增加的受试者的微阵列。在其他方面,本发明提供包含寡核苷酸探针的微阵列,所述寡核苷酸探针能够在严格条件下与一个或多个具有保护性多态性的核酸分子杂交。此类保护性多态性的实例包括:(a)BF(rs641153)中的R32Q;(b)BF(rs4151667)中的L9H;(c)C2(rs547154)中的IVS 10;和(d)C2(rs9332739)中的E318D。此类微阵列还可包含能够在严格条件下与一个或多个具有保护性多态性的其他核酸分子杂交的寡核苷酸探针,所述多态性包括,例如(a)CFH中的delTT多态性;(b)BF中的R150R多态性;和(c)CFH中的Y402H多态性。
公开的上述内容,以及其他特征和优点将通过以下几个实施方案的详细描述变得更明显。
序列
使用核苷酸碱基的标准字母缩写和如在37 C.F.R.1.822中定义的氨基酸三字母密码表示所附序列表中列出的核酸序列和氨基酸序列。显示了每一核酸序列的仅一条链,但应当明白通过参考所示链也包括互补链。此处引用的所有序列数据库登录号应理解为意指在指定日期通过可得到的所述登录号鉴定的序列版本。在所附序列表中:
SEQ ID NO:1基于具有refSNP ID:rs641153的SNP,于2006年1月30日(2006年1月5日校订)通过NCBI可得到所述refSNP ID:rs641153。该SNP在核苷酸第22位具有A或G,在BF基因中产生R32Q变体(在氨基酸第32位谷氨酰胺取代精氨酸)。R32Q提供的序列为CCACTCCATGGTCTTTGGCCCRGCCCCAGGGATCCTGCTCTCT,其中R=A或G(SEQ ID NO:1)。
SEQ ID NO:2显示具有refSNP ID:rs4151667的SNP,于2006年1月30日(2006年1月5日校订)通过NCBI可得到所述refSNPID:rs4151667。该SNP在核苷酸第26位具有A或T,在BF基因中产生L9H变体(在氨基酸第9位组氨酸取代亮氨酸)。rs4151667提供的序列为ATGGGGAGCAATCTCAGCCCCCAACRCTGCCTGATGCCCTTTATCTTGGGC,其中R=A或T(SEQ ID NO:2)。
SEQ ID NO:3基于具有refSNP ID:rs547154的SNP,于2006年1月30日(2006年1月5日校订)通过NCBI可得到所述refSNP ID:rs547154。该SNP在C2基因的内含子10中核苷酸第23位具有G或T。rs547154提供的序列为GAGGAGCCCGCCAGAGGCCCGTRTTGGGAACCTGGACACAGTGCCC,其中R为G或T。(SEQ ID NO:3)。
SEQ ID NO:4显示具有refSNP ID:rs9332739的SNP,于2006年1月30日(2006年1月5日校订)通过NCBI可得到所述refSNP ID:rs9332739。该SNP在核苷酸第26位具有C或G,在C2基因中产生E318D变体(在氨基酸第318位天冬氨酸取代谷氨酸)。rs9332739提供的序列为ACGACAACTCCCGGGATATGACTGARGTGATCAGCAGCCTGGAAAATGCCA,其中R为C或G(SEQ ID NO:4)。
SEQ ID NO:5显示具有refSNP ID:rs1048709的SNP,于2006年1月30日(2006年1月5日校订)通过NCBI可得到所述refSNP ID:rs1048709。该SNP在BF基因中核苷酸第26位具有A或G。该SNP不引起第150位的氨基酸改变(R150R)。rs1048709提供的序列为ATCGCACCTGCCAAGTGAATGGCCGRTGGAGTGGGCAGACAGCGATCTGTG,其中R为A或G(SEQ ID NO:5)。
SEQ ID NO:6和7显示delTT多态性序列。所述delTT多态性是2bp插入/缺失多态性。序列如下:CCTTGCTATTACATACTAATTCATAACTTTTTTTTTCGTTTTAGAAAGGCCCTGTGGACA(SEQ ID NO:6);和CCTTGCTATTACATACTAATTCATAACTTTTTTTTTTTCGTTTTAGAAAGGCCCTGTGGACA(SEQ ID NO:7)。
SEQ ID NO:8显示具有refSNP ID:rs1061170的SNP,于2006年1月30日(2006年1月5日校订)通过NCBI可得到所述refSNP ID:rs1061170。该SNP在内含子9的核苷酸第1277位(以下序列中核苷酸第26位)具有C或T,在CFH基因产生Y402H变体(在氨基酸第402位组氨酸取代酪氨酸)。rs1061170提供的序列为TTTGGAAAATGGATATAATCAAAATRATGGAAGAAAGTTTGTACAGGGTAA,其中R为C或T(SEQ ID NO:8)。
SEQ ID NO:9显示具有9H & 32R的完整BF氨基酸序列:
mgsnlspqhc lmpfilglls ggvtttpwsl arpqgscsle gveikggsfr llqegqaley
vcpsgfypyp vqtrtcrstg swstlktqdq ktvrkaecra ihcprphdfe ngeywprspy
ynvsdeisfh cydgytlrgs anrtcqvngr wsgqtaicdn gagycsnpgi pigtrkvgsq
yrledsvtyh csrgltlrgs qrrtcqeggs wsgtepscqd sfmydtpqev aeaflsslte
tiegvdaedg hgpgeqqkr↓k ivldpsgsmn iylvldgsds igasnftgak kclvnliekv
asygvkpryg lvtyatypki wvkvseadss nadwvtkqln einyedhklk sgtntkkalq
avysmmswpd dvppegwnrt rhviilmtdg lhnmggdpit videirdlly igkdrknpre
dyldvyvfgv gplvnqvnin alaskkdneq hvfkvkdmen ledvfyqmid esqslslcgm
vwehrkgtdy hkqpwqakis virpskghes cmgavvseyf vltaahcftv ddkehsikvs
vggekrdlei evvlfhpnyn ingkkeagip efydydvali klknklkygq tirpiclpct
egttralrlp ptttcqqqke ellpaqdika lfvseeekkl trkevyikngdkkgscerda
qyapgydkvk disevvtprf lctggvspya dpntcrgdsg gplivhkrsr fiqvgviswg
vvdvcknqkr qkqvpahard fhinlfqvlp wlkeklqded lgfl(SEQ ID NO:9)
SEQ ID NO:10显示具有9L & 32Q的完整BF氨基酸序列:
mgsnlspqlc lmpfilgl ls ggvtttpwsl aqpqgscsle gveikggsfr llqegqaley
vcpsgfypyp vqtrtcrstg swstlktqdq ktvrkaecra ihcprphdfe ngeywprspy
ynvsdeisfh cydgytlrgs anrtcqvngr wsgqtaicdn gagycsnpgi pigtrkvgsq
yrledsvtyh csrgltlrgs qrrtcqeggs wsgtepscqd sfmydtpqev aeaflsslte
tiegvdaedg hgpgeqqkr↓k ivldpsgsmn iylvldgsds igasnftgak kclvnliekv
asygvkpryg lvtyatypki wvkvseadss nadwvtkqln einyedhklk sgtntkkalq
avysmmswpd dvppegwnrt rhviilmtdg lhnmggdpit videirdlly igkdrknpre
dyldvyvfgv gplvnqvnin alaskkdneq hvfkvkdmen ledvfyqmid esqslslcgm
vwehrkgtdy hkqpwqakis virpskghes cmgavvseyf vltaahcftv ddkehsikvs
vggekrdlei evvlfhpnyn ingkkeagip efydydvali klknklkygq tirpiclpct
egttralrlp ptttcqqqke ellpaqdika lfvseeekkl trkevyikng dkkgscerda
qyapgydkvk disevvtprfl ctggvspya dpntcrgdsg gplivhkrsrfi qvgviswg
vvdvcknqkr qkqvpahard fhinlfqvlp wlkeklqdedlgfl(SEQ ID NO:10)
SEQ ID NO:11显示具有9H&32Q的完整BF氨基酸序列:
mgsnlspqhc lmpfilglls ggvtttpwsl aqpqgscsle gveikggsfr llqegqaley
vcpsgfypyp vqtrtcrstg swstlktqdq ktvrkaecra ihcprphdfe ngeywprspy
ynvsdeisfh cydgytlrgs anrtcqvngr wsgqtaicdn gagycsnpgi pigtrkvgsq
yrledsvtyh csrgltlrgs qrrtcqeggs wsgtepscqd sfmydtpqev aeaflsslte
tiegvdaedg hgpgeqqkr↓k ivldpsgsmn iylvldgsds igasnftgak kclvnliekv
asygvkpryg lvtyatypki wvkvseadss nadwvtkqln einyedhklk sgtntkkalq
avysmmswpd dvppegwnrt rhviilmtdg lhnmggdpit videirdlly igkdrknpre
dyldvyvfgv gplvnqvnin alaskkdneq hvfkvkdmen ledvfyqmid esqslslcgm
vwehrkgtdy hkqpwqakis virpskghes cmgavvseyf vltaahcftv ddkehsikvs
vggekrdlei evvlfhpnyn ingkkeagip efydydvali klknklkygq tirpiclpct
egttralrlp ptttcqqqke ellpaqdika lfvseeekkl trkevyikng dkkgscerda
qyapgydkvk disevvtprf lctggvspya dpntcrgdsg gplivhkrsr fiqvgviswg
vvdvcknqkr qkqvpahard fhinlfqvlp wlkeklqded lgfl(SEQ ID NO:11)
SEQ ID NO:12显示具有318D的完整C2氨基酸序列:
mgplmvlfcl lflypglads apscpqnvni sggtftlshg wapgslltys cpqglypspa
srlckssgqw qtpgatrsls kavckpvrcp apvsfengiy tprlgsypvg gnvsfecedg
filrgspvrq crpngmwdge tavcdngagh cpnpgislga vrtgfrfghg dkvryrcssn
lvltgssere cqgngvwsgt epicrqpysy dfpedvapal gtsfshmlga tnptqktkes
lgrkiqiqrs ghlnlyllld csqsvsendf lifkesaslm vdrifsfein vsvaiitfas
epkvlmsvln dnsrdmtdvi sslenanykd hengtgtnty aalnsvylmm nnqmrllgme
tmawqeirha iilltdgksn mggspktavd hireilninq krndyldiya igvgkldvdw
relnelgskk dgerhafilq dtkalhqvfe hmldvskltd ticgvgnmsa nasdqertpw
hvtikpksqe tcrgalisdq wvltaahcfr dgndhslwrv nvgdpksqwg kefliekavi
spgfdvfakk nqgilefygd diallklaqk vkmstharpi clpctmeanl alrrpqgstc
rdhenellnk qsvpahfval ngsklninlk mgvewtscae vvsqektmfp nltdvrevvt
dqflcsgtqe despckgesg gavflerrfr ffqvglvswg lynpclgsad knsrkraprs
kvppprdfhi nlfrmqpwlr qhlgdvlnfl pl(SEQ ID NO:12)
SEQ ID NO:13显示具有32Q的9BF氨基酸序列:wslaqpqgs(SEQ IDNO:13)。
SEQ ID NO:14显示具有9H的9BF氨基酸序列:lspqhclmp(SEQ IDNO:14)。
SEQ ID NO:15显示具有318D的7 C2氨基酸序列:dmtdvis(SEQ IDNO:15)。
附图简述
图1是BF和C2中SNP的简图和单元型分析。本研究中所用的SNP与组合病例(CAS)和对照(CON)中的预测单元型、让步比(OR)、P值(P)和频率一同显示。对于H7,95%的置信区间为(0.33-0.61)并且对于H10为(0.23-0.56)。遗传(黑猩猩)单元型命名为Anc。已对具有单元型H2(NCBI登录号AL662849,如2006年2月8日获得)、H5(NCBI登录号AL645922和NCBI登录号NG_004658,如2006年2月8日获得)和H7(NCBI登录号NG_000013,如2006年2月8日获得)的样品进行测序,并且在C2或BF基因中无额外的非同义变体存在(Stewart等(2004)Genome Res.14:1176-87)。
图2显示组合的补体基因分析。个体SNP分析揭示了SNP的几种可能组合,其保护个体免于发生AMD。为了检测这些,首次使用了经验模型。图2A显示图解模型,解释为给出将保护免于AMD的基因型的四种可能组合。这些是:(1)rs641153(R32Q)为G/A并且rs1061170(Y402H)为C/T;(2)rs547154为G/A并且rs1061170为C/C;(3)rs4151667(L9H)为T/A并且rs1061170为C/T;(4)rs4151667是T/A并且rs1061170是C/C。该模型的应用引起图2B中显示的Iowa、Columbia和组合组各自的分布。这些分布进行Fisher精确检测并显示P值为P=0.00237、P=4.28 x10-8和P=7.90 x 10-10。为了比较目的,Exemplar软件生成了保护性模型,其使用称为Genetic Algorithms的机器研究方法为数据提供“最佳拟合”。在图2C中描述了得到的最佳表现模型。该模型描述了保护免于AMD的基因型的四种可能的单个基因型或基因型组合;即,导致模型“真实”的组合。这些基因型是:(1)rs1048709(R150R)为G/G并且rs1061170为C/C;或(2)rs547154为G/A;或(3)rs4151667为T/A;或(4)CFH内含子1变体为delTT。图2D中显示Iowa、Columbia和组合组的模型表现。这些分布分别显示P值为P=0.00237、P=4.28 x 10-8和P=7.90 x 10-10
图3显示BF(图3A)、Ba(全长因子B的片段)(图3B)和沿视网膜色素上皮(RPE)-脉络膜(CH)复合物(处于来自患有早期AMD的72岁供体不固定眼的切片中)的C3(图3C)的免疫定位。抗BF抗体(Quidel;反应产物为红色)标记玻璃疣(D),特别是沿它们的边缘、玻璃膜和脉络膜基质。抗Ba抗体(Quidel;反应产物为紫色)标记玻璃膜和RPE伴随斑点。注意BF的分布与C3的分布相似。RPE细胞质和脉络膜中的棕色填色是因为黑色素的缘故。玻璃膜(BM);视网膜(R)。
发明详述
此处提供的是序列多态性,发现其赋予针对年龄相关性黄斑变性(AMD)的保护性效应。这些多态性包括在因子B(BF)和补体组分2(C2)基因中发现的那些多态性。保护性多态性也包括CFH基因中的delTT多态性。鉴定具有这些多态性的受试者及具有近期发现的危险单元型(补体因子H(CFH)基因中的Y402H)的受试者将帮助诊断处于AMD遗传危险中的那些受试者。
术语
提供术语和方法的以下解释以更好地描述本公开内容并在本公开内容的实践过程中指导本领域的普通技术人员。单数形式“一个”和“该”指一个或多于一个,除非本文清楚地另有说明。例如,术语“包括核酸”包括单个或两个以上核酸并认为等同于短语“包括至少一个核酸”。术语“或”指确定的备选元素的单一元素或两个或更多个元素的组合,除非本文清楚地另有说明。如此处所用,“包含”意为“包括”。因此,“包含A或B”意为“包括A、B或A和B”,不排除其他元素。例如,短语“突变或多态性”或“一种或多种突变或多态性”意为突变、多态性或其组合,其中“一种”可以指多于一种。
虽然与此处描述的那些方法和材料相似或等同的方法和材料可以用于本公开内容的实践或检测中,但是下文描述了合适的方法和材料。该材料、方法和实施例仅用作说明并不旨在限制。
除非另行指出,根据常规用法使用技术术语。可以在Benjamin Lewin,Genes V,Oxford University Press出版,1994(ISBN 0-19-854287-9);Kendrew等(编辑),The Encyclopedia of Molecular Biology,BlackwellScience Ltd.出版,1994(ISBN 0-632-02182-9);和Robert A.Meyers(编辑),Molecular Biology and Biotechnology:a Comprehensive Desk Reference,VCH Publishers,Inc.出版,1995(ISBN 1-56081-569-8)中发现分子生物学中常见术语的定义。
年龄相关性黄斑变性:医学病症,其中黄斑中的光感觉细胞功能异常并随时间停止工作。在黄斑变性中疾病的最终形式导致中央(视力读出部分)的视力丧失或模糊。视力的外部外周部分保持完好。AMD进一步分为“干涩的”或非渗出性形式,和“湿润的”或渗出性形式。85到90%的病例分类为“干涩”黄斑变性,其中脂肪组织(已知如玻璃疣)将在视网膜后慢慢积累。干涩黄斑变性中的典型损伤是地图样萎缩。10到15%的病例涉及视网膜下的异常血管生长。这些病例由于血液和其他流体从视网膜后面渗漏到眼睛里而被称为“湿润”黄斑变性。湿润黄斑变性通常以干涩形式开始。如果允许继续而不加以治疗,它通常会彻底破坏黄斑的结构和功能。脉络膜新生血管形成是视网膜的视网膜色素上皮(RPE)层下面的异常血管发生。
对湿润黄斑变性的医学、光动力、激光凝固和激光治疗是可利用的。AMD的危险因素包括衰老、吸烟、家族史、对日光尤其是蓝光的暴露、高血压、心血管危险因素如高胆固醇和肥胖症、高脂摄入、氧化应激和种族。
AMD是特征为补体旁路级联失调的疾病的实例,其也包括膜性增生性肾小球肾炎(MPGN)和发生主动脉动脉瘤的倾向。此处描述用于检测发生AMD危险增加的方法也可用于检测特征为补体旁路级联失调的其他疾病(例如,MPGN)的增加危险。
等位基因:占据染色体上指定基因座(位置)的相同基因许多可变DNA编码中的任何一个(有时术语指非基因序列)。该基因的个体基因型将是它恰巧具有的一组等位基因。在每一条染色体具有两拷贝的生物(二倍体生物)中,两个等位基因组成个体的基因型。在二倍体生物中,当基因的两个拷贝相同时-即,具有相同的等位基因-说它们对那个基因而言是纯合的。具有基因的两个不同等位基因的二倍体生物称为杂合的。
如此处所用,“检测等位基因”的方法可称作“基因分型、确定或鉴定等位基因或多态性”,或任何类似的短语。实际检测的等位基因将在受试者基因组DNA中是明显的,但也可以从RNA或蛋白质序列(从该区域转录或翻译的)检测得到。
扩增:增加样品中核酸分子拷贝数的技术的使用。体外扩增的实例是聚合酶链式反应(PCR),其中从受试者中获得的生物学样品与一对寡核苷酸引物在允许引物与样品中核酸分子杂交的条件下接触。引物在适当条件下延伸,从模板上解离并然后重退火、延伸并解离来增加核酸分子的拷贝数。可以通过此类技术如电泳、限制性核酸内切酶切割模式、寡核苷酸杂交或连接,和/或核酸测序对扩增产物进行表征。
扩增方法的其他实例包括如美国专利号5,744,311中公开的链置换扩增;如美国专利号6,033,881中公开的无转录等温扩增;如PCT公开号WO 90/01069中公开的修复链式反应扩增;如EP-A-320,308中公开的连接酶链式反应扩增;如美国专利号5,427,930中公开的缺口填充酶链式反应扩增;和如美国专利号No.6,025,134中公开的NASBATM无RNA转录扩增。可以修改扩增方法,包括例如通过额外步骤或将扩增与另一方案偶联。
阵列:分子,特别是生物大分子(如多肽或核酸)或细胞或组织样品在基质上或基质中可寻址位置上的排列。“微阵列”是小型化以要求或通过显微镜检查辅助用于评估或分析的阵列。这些阵列有时称作DNA芯片,或通常称作生物芯片;虽然更正式地它们称作微阵列,并且检测个体基因类型的方法有时称作微阵列谱(profiling)。DNA阵列装配(fabrication)化学和结构是变化的,通常由400,000个不同的特征组成,每一特征具有来自不同人基因的DNA,但一些阵列使用固态化学来模仿多达780,000个个体特征。
分子(“特征”)阵列使得可能在样品上同时进行非常大量的分析。在某些实例阵列中,一个或多个分子(如寡核苷酸探针)将在阵列上出现多次(如两次),例如以提供内部对照。阵列上可寻址位置的数目可变化,例如从少数(如3个)到至少50个、至少100个、至少200个、至少250个、至少300个、至少500个、至少600个、至少1000个、至少10,000个或更多。在特定实例中,阵列包括核酸分子,如寡核苷酸序列,其长度为至少15个核苷酸,如长度约15-40个核苷酸,如长度为至少18个核苷酸,长度为至少21个核苷酸,或甚至长度为至少25个核苷酸。在一个实施例中,所述分子包括通过它们的5′或3′末端附着到阵列上的寡核苷酸。
在阵列中,每一排列样品是可寻址的,其中可以在阵列的至少二维空间内可靠并稳定地确定它的位置。阵列上的特征应用位置可以呈现不同的形状。例如,阵列可以是规则的(如排列在统一的行和列中)或不规则的。因此,在有序阵列中将每一样品的位置在其应用到阵列时指定给样品,并可以提供检索表以将每一位置与适当靶标或特征位置联系起来。经常,有序阵列排列为对称网格图形,但样品可以排列成其他图形(如放射分布线、螺旋线、或有序簇)。可寻址阵列通常是计算机可辨认的,其中计算机可按程序将阵列上特定的地址与该位置上有关样品的信息(如杂交或结合数据,包括例如信号强度)联系起来。在计算机可辨认形式的一些样品中,阵列中的个体特征排列规则,例如排列为Cartesian网格图形,其可通过计算机与地址信息相联系。
此处也涵盖的是基于蛋白质的阵列,其中探针分子是或包括蛋白质,或其中靶分子是或包括蛋白质,和包括结合蛋白质/肽的核酸分子的阵列,反之亦然。
结合或稳定结合:两种物质或分子间的联系,如一个核酸分子与另一个(或其自身)的杂交和抗体与肽的联系。如果足够量的寡核苷酸分子形成碱基对或与它的靶核酸分子杂交,寡核苷酸分子结合或稳定结合到靶核酸分子上来允许检测该结合。结合可以通过本领域技术人员已知的任何方法检测,如通过靶寡核苷酸复合物的物理或功能性质。例如,可以通过确定结合在生物合成过程如基因表达、DNA复制、转录、翻译等等上是否具有可见效应来在功能上检测结合。
检测核酸分子互补链结合的物理方法包括但不局限于此类方法,如DNaseI或化学足迹法、凝胶移位和亲和切割测定、RNA印迹法、斑点印迹法和光吸收检测法。例如,一种方法涉及观察含寡核苷酸(或类似物)和靶核酸的溶液在220到300nm处的光吸收变化随温度慢慢增加。如果寡核苷酸或类似物已结合到它的靶标上,因为寡核苷酸(或类似物)和靶标彼此解离或熔解,在特征温度上吸收会骤增。在另一实施例中,所述方法涉及检测信号,如呈现在一条或两条互补链上的可检测标记物。
寡聚体与它的靶核酸的结合通常表征为50%的寡聚体从其靶标上解离的温度(Tm)。更高(Tm)指相对于具有更低(Tm)的复合物而言更坚固或更稳定的复合物。
补体因子2(C2):补体系统经典途径的部分。活化的C1切割C2成为C2a和C2b。C2a导致C3的激活。已报道C2的缺乏与某些自身免疫疾病相关,所述某些自身免疫疾病包括全身性红斑狼疮、Henoch-Schonlein紫癜或多发性肌炎。C2是EC 3.4.21.43的成员。也称为经典补体途径C3/C5转化酶。
补体因子H:另外称为beta-1H;控制补体旁路的功能并作为因子I(C3b灭活剂)的辅助因子起作用的血清糖蛋白。它调控C3转化酶如C4b2a的活性。
互补性和百分比互补性:当链通过形成Watson-Crick、Hoogsteen或反义Hoogsteen碱基对彼此结合(杂交)时,具有互补核酸的分子形成稳定的二链体或三链体。当寡核苷酸分子在需要的条件下保持可检测地结合到靶核酸序列上时,稳定结合会发生。
互补性是一条核酸链中的碱基与第二条核酸链中的碱基配对的程度。通过百分比方便地描述互补性,即,在两条链间或在两条链的特定区域或结构域内形成碱基对的核苷酸的比例。例如,如果15核苷酸的寡核苷酸中的10个核苷酸与DNA分子的靶区域形成碱基对,就说该寡核苷酸与靶DNA区域具有66.67%的互补性。
在本公开内容中,“足够的互补性”指足够数量的碱基对存在于寡核苷酸分子和靶核酸序列(如CFH、BF或C2序列)间以实现可检测的结合。当通过形成碱基对的百分比表示或测定时,达到该目的的百分比互补性可以从低至约50%的互补性变化至完全(100%)互补性。通常,足够的互补性为至少约50%,例如至少约75%的互补性,至少约90%的互补性,至少约95%的互补性,至少约98%的互补性,或甚至至少约100%的互补性。
Beltz等(1983)Methods Enzymol 100:266-285;和Sambrook等(编辑),Molecular Cloning:A Laboratory Manual,第二版,卷1-3,ColdSpring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989提供了参与确定结合条件(所述条件允许本领域技术人员设计适当寡核苷酸,以在期望条件下使用)的定性和定量考虑的完整处理。
DNA(脱氧核糖核酸):长链聚合物,其包括大多数活生物的遗传物质(一些病毒具有包括核糖核酸,RNA的基因)。DNA聚合物中的重复单位是四个不同的核苷酸,每一核苷酸包括结合到磷酸基团附着的脱氧核糖上的四种碱基(腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶)中的一种碱基。DNA分子中的核苷酸三联体(称作密码子)编码多肽中的氨基酸。术语密码子也用于DNA序列转录成的mRNA中三核苷酸的对应(和互补)序列。
玻璃疣:在RPE基底层和玻璃膜内部胶原层之间积累的沉积物(见,例如van der Schaft等(1992)Ophthalmol.99:278-86;Spraul等(1997)Arch.Ophthalmol.115:267-73;和Mullins等,Histochemical comparisonof ocular"drusen"in monkey and human,In M.LaVail,J.Hollyfield,和R.Anderson(编辑),in Degenerative Retinal Diseases(1-10页).New York:Plenum Press,1997)。硬玻璃疣是包含均质嗜酸性物质的小沉积物并通常为球形或半球形,没有斜面边缘。软玻璃疣更大,通常不均质,并且通常含有内含物和球形剖面。一些玻璃疣可以进行钙化。术语“弥散玻璃疣”或“基底线状沉积物”用于描述无定形物质,其在玻璃膜的内部胶原层与视网膜色素上皮(RPE)之间形成层。该物质在组织学上可呈现为与软玻璃疣类似,除它不隆起外。
因子B(BF):在补体激活替代途径中补体3的激活剂前体。因子b通过因子d转化成c3转化酶。BF是EC 3.4.21.47的成员。因子B作为单链多肽在血液中循环。旁路途径激活后,补体因子d切割因子B产生非催化链Ba和催化亚基Bb。活化亚基Bb是丝氨酸蛋白酶,其与C3b结合形成旁路途径C3转化酶。BF也称为补体旁路C3/C5转化酶。
遗传倾向或危险:受试者对遗传疾病,如AMD的易感性。然而,此类易感性可能或可能不导致疾病的实际发生。
单元型:个体染色体的遗传组成。在二倍体生物中,单元型包含每一位点上一对等位基因的一个成员。单元型可以指仅一个基因座或指全基因组。单元型也可指一组单核苷酸多态性(SNP),在统计学上发现所述单核苷酸多态性与单条染色体连锁。
杂交:寡核苷酸和它们的类似物通过氢键杂交,所述氢键包括互补碱基间的Watson-Crick、Hoogsleen或反义Hoogsteen氢键。通常,核酸由含氮碱基(嘧啶(胞嘧啶(C)、尿嘧啶(U)和胸腺嘧啶(T))或嘌呤(腺嘌呤(A)和鸟嘌呤(G)))组成。这些含氮碱基在嘧啶与嘌呤间形成氢键,并且嘧啶与嘌呤的成键称为“碱基配对”。更具体而言,A将通过氢键结合T或U,且G将结合C。“互补的”指不同的核酸序列间或相同核酸序列的两个不同区域间发生的碱基配对。
“特异性杂交的”和“特异性互补的”是说明互补性充分程度的术语,使得在寡核苷酸(或它的类似物)与DNA或RNA靶标之间发生稳定且特异的结合。寡核苷酸或寡核苷酸类似物不需要与其待特异性杂交的靶序列100%互补。当寡核苷酸或类似物与其靶DNA或RNA分子的结合干扰靶DNA或RNA的正常功能,并且具有足够程度的互补性以避免寡核苷酸或类似物与非靶序列在想要特异的结合的条件下(例如在体内测定或体系的情况下的生理条件下)非特异的结合时,寡核苷酸或类似物就是特异性杂交的。此类结合称为特异的杂交。
引起特定严紧性程度的杂交条件将根据所选杂交方法的性质和杂交核酸序列的组成及长度而变化。通常,杂交的温度和杂交缓冲液的离子强度(尤其是Na+和/或Mg++浓度)将决定杂交的严紧性,虽然洗涤时间也影响严紧性。Sambrook等(编辑),Molecular Cloning:A Laboratory Manual,第二版,卷1-3,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,1989,9和11章,和Ausubel等Short Protocols in MolecularBiology,第四版,John Wiley & Sons,Inc.,1999讨论了关于获得特定严紧性程度所需要的杂交条件的计算。
为了本公开的目的,“严紧条件”包括仅当杂交分子与其靶序列间具有低于25%的错配时才发生杂交的条件。“严紧条件”可以分成特定程度的严紧性以用于更精确的定义。因此,如此处所用,“中等严紧”条件是具有高于25%序列错配的分子将不能杂交的那些条件;“中间严紧”的条件是具有高于15%错配的分子将不能杂交的那些条件,并且“高度严紧”的条件是具有高于20%错配的序列将不能杂交的那些条件。“非常高度严紧”的条件是具有高于10%错配的序列将不能杂交的那些条件。
以下是一组示例性杂交条件并不意在限制:
非常高度严紧性(检测具有90%同一性的序列)
杂交:5x SSC,65℃,16小时
洗涤两次:2x SSC,室温(RT),每次15分钟
洗涤两次:0.5x SSC,65℃,每次20分钟
高度严紧性(检测具有80%同一性或更高同一性的序列)
杂交:5x-6x SSC,65℃-70℃,16-20小时
洗涤两次:2x SSC,RT,每次5-20分钟
洗涤两次:1x SSC,55℃-70℃,每次30分钟
低度严紧性(检测具有高于50%同一性的序列)
杂交:6x SSC,RT至55℃,16-20小时
洗涤至少两次:2x-3x SSC,RT至55℃,每次20-30分钟
分离的:从生物体的细胞(在其中天然出现的组分,如其他染色体和染色体外DNA和RNA、蛋白质和细胞器)中其他生物学组分已基本上分离或纯化的“分离的”生物学组分(如核酸分子、蛋白质或细胞器)。已“分离的”核酸分子和蛋白质包括通过标准纯化方法纯化的核酸分子和蛋白质。本术语也包含在宿主细胞中通过重组表达制备的核酸分子和蛋白质,以及化学合成的核酸分子和蛋白质。
连锁不平衡(LD):等位基因在两个或更多基因座处(不需要在同一染色体上)的非随机联合。LD描述了这样的情形,其中等位基因或遗传标记的一些组合在群体中比基于它们的频率从单元型的随机形成中期望的更频繁或更不频繁地出现。独立遗传的两个等位基因出现的期望频率是第一个等位基因的频率乘以第二个等位基因的频率。以期望的频率共同出现的等位基因称为处于连锁平衡。
基因座:基因(或其他重要序列)在染色体上的位置。
突变:基因或染色体内DNA序列的任何改变。在一些实例中,突变将改变特征或性状(表型),但并不总是这种情况。突变类型包括碱基取代点突变(例如,转换或颠换)、缺失和插入。错义突变是向编码蛋白质的序列中引入不同氨基酸的那些突变;无义突变是引入新终止密码子的那些突变。在插入或缺失的情况下,突变可以是符合读框的(不改变全部序列的读框)或移码突变,其可导致大量密码子的错读(并由于备选读框中终止密码子的存在而经常导致编码产物的异常终止)。
该术语特别包括通过体细胞突变产生的变异,例如在指定个体中仅疾病细胞中发现的那些变异(并不是组成型的)。此类体细胞获得的变异的实例包括经常导致参与癌症发生的多种基因功能改变的点突变。本术语也包括组成型存在的DNA改变,其以易于证实的方式改变编码蛋白质的功能,并且其可通过受影响个体的孩子进行遗传。在该方面,本术语与如下定义的“多态性”重叠,但通常指组成型改变的亚类。
核酸分子:核苷酸的聚合形式,其可包括RNA、cDNA、基因组DNA和以上的合成形式和混合聚合物的正义链和反义链。核苷酸指核糖核苷酸、脱氧核苷酸或任一类型核苷酸的修饰形式。如此处所用的“核酸分子”与“核酸”和“多核苷酸”同义。核酸分子长度通常为至少10碱基,除非另外明确说明。本术语包括DNA的单链和双链形式。多核苷酸可包括通过天然发生的核苷酸和修饰的核苷酸两者或其中一种,所述修饰的核苷酸与天然发生的核苷酸和/或非天然发生核苷酸的连接在一起。
核苷酸:包括但不局限于单体,其包括连接糖的碱基,如嘧啶、嘌呤或其合成类似物,或连接氨基酸的碱基,如在肽核酸(PNA)中。核苷酸是多核苷酸的一个单体。核苷酸序列指多核苷酸中的碱基序列。
寡核苷酸:通常包含300碱基或更少碱基长度的核酸分子。本术语经常指单链脱氧核糖核苷酸,但其中它也可指单链或双链核糖核苷酸、RNA:DNA杂交体和双链DNA。术语“寡核苷酸”也包括寡核苷(即,寡核苷酸减去磷酸)和任何其他有机碱聚合物。在一些实例中,寡核苷酸长度为约10到约90个碱基,例如长度为12、13、14、15、16、17、18、19或20个碱基。其他寡核苷酸长度为约25、约30、约35、约40、约50、约55、约60个碱基、约65个碱基、约70个碱基或约80个碱基。例如用作探针或引物的寡核苷酸可以是单链的,或者例如用于突变基因的构建的可以是双链的。寡核苷酸可以是正义的或反义的寡核苷酸。寡核苷酸可以参照核酸分子如上讨论进行修饰。寡核苷酸可以从现存核酸来源(例如,基因组或cDNA)中获得,但也可以是合成的(例如,通过实验室或体外寡核苷酸合成而产生)。
多态性:基因序列中的变异。多态性可以是那些变异(DNA序列差异),其通常见于具有不同序列的个体或不同人种群和地理位置的种群间,其产生功能等同的基因产物。本术语也指序列中的变体,其可产生功能上不等同的基因产物。多态性也包括可以分类为等位基因和/或突变的变异,所述等位基因和/或突变可产生可能具有改变功能的基因产物。多态性也可包括可以分类为等位基因和/或突变的变异,所述等位基因和/或突变不产生基因产物或产生灭活的基因产物,或以异常速率或在不适当组织中或响应不适当刺激的活化基因产物。此外,本术语适当时也可与等位基因互换使用。
多态性可以指,例如变异存在的核苷酸位置、由核苷酸变异引起的氨基酸序列的改变、或与变异连锁的核酸分子或蛋白质的一些其他特性上的改变。
探针和引物:探针包含识别靶核酸序列的可鉴定的、分离的核酸。探针包括附着到可寻址位置的可检测标记物或其他报道分子上的核酸并且其与靶序列杂交。典型的标记物包括放射性同位素、酶底物、辅助因子、配体、化学发光剂或荧光剂、半抗原和酶。例如在Sambrook等(编辑),Molecular Cloning:A Laboratory Manual,第二版,卷1-3,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,1989和Ausubel等Short Protocols in Molecular Biology,第四版,John Wiley & Sons,Inc.,1999中讨论了标记的方法和在适合于多种目的的标记物中选择的指导。
引物是短的核酸分子,例如长度为10个核苷酸或更多核苷酸的DNA寡核苷酸,例如其与相邻的互补核苷酸或待扩增的序列杂交。更长的DNA寡核苷酸长度可以为约15、20、25、30或50个核苷酸或更多核苷酸。引物可以通过核酸杂交与互补靶DNA链退火,以在引物和靶DNA链之间形成杂交体,然后引物沿靶DNA链通过DNA聚合酶延伸。引物对可以例如如下描述,通过PCR或本领域已知的其他核酸扩增方法用于核酸序列的扩增。
例如在Sambrook等(编辑),Molecular Cloning:A LaboratoryManual,第二版,卷1-3,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1989;Ausubel等Short Protocols in MolecularBiology,第四版,John Wiley & Sons,Inc.,1999;和Innis等PCR Protocols,A Guide to Methods and Applications,Academic Press,Inc.,San Diego,CA,1990中描述了制备和使用核酸探针和引物的方法。扩增引物对可来自已知序列,例如通过使用旨在该目的的计算机程序如Primer(版本0.5,
Figure A200780012906D0024153021QIETU
 1991,Whitehead Institute for Biomedical Research,Cambridge,MA)。本领域的普通技术人员将理解特定探针或引物的特异性随它的长度增加而增加。因此,为了获得更高的特异性,可以选择包括靶核苷酸序列的至少20、25、30、35、40、45、50或更多个连续核苷酸的探针或引物。
样品:从人或非人哺乳动物受试者中获得的样品。如此处所用,生物学样品包括用于在受试者中进行遗传分析的所有样品,包括但不局限于:细胞、组织和体液,如血液;血液的衍生物和级分(如血清或血浆);提取的胆汁;活体解剖或外科手术摘除的组织,包括例如福尔马林中未固定、冰冻、固定的组织和/或石蜡中包埋的组织;眼泪;乳;皮肤刮拭物;表面洗出物;尿;痰;脑脊液;前列腺液体;脓;骨髓抽吸物;BAL;唾液;宫颈拭子;阴道拭子和口咽洗涤物。
单核苷酸多态性或SNP:物种成员间基因组中的单核苷酸:腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)或鸟嘌呤(G)存在不相同的DNA序列变异。如此处所用,术语“单核苷酸多态性”(或SNP)包括突变和多态性。SNP可以在基因的编码序列(CDS)内或在基因间(基因间隔域)。CDS中的SNP改变密码子,其可能或可能不改变蛋白质序列中的氨基酸。前者可能构成不同的等位基因。后者称为沉默突变并通常发生在密码子的第三个位置(称为摆动位置)中。
受试者:人和非人哺乳动物(如兽医受试者)
鉴定AMD危险增加的受试者的方法
提供方法用于鉴定发生年龄相关性黄斑变性(AMD)的危险增加的受试者。这些方法包括分析受试者的因子B(BF)和/或补体组分2(C2)基因,并确定所述受试者是否具有至少一种保护性多态性,其中所述保护性多态性选自:a)BF(rs641153)中的R32Q;b)BF(rs4151667)中的L9H;c)C2(rs547154)中的IVS 10;d)C2(rs9332739)中的E318D。如果受试者不具有至少一种保护性多态性,所述受试者发生AMD的危险增加。本方法还可包括分析受试者的CFH基因,或其他任何想要的基因。如此处描述,已经鉴定CFH基因中的delTT多态性(对AMD呈保护性)。
本方法也可包括在BF或C2基因座和在CFH基因座处分析受试者的基因型,并确定所述受试者是否具有至少一种保护性基因型,所述保护性基因型选自:a)BF(rs641153)中杂合的R32Q多态性;b)BF(rs4151667)中杂合的L9H多态性;c)C2(rs547154)中杂合的IVS 10多态性;d)C2(rs9332739)中杂合的E318D多态性;e)CFH中纯合的delTT多态性;和f)BF(rs1048709)中纯合的R150R多态性和CFH中纯化的Y402;其中如果所述受试者不具有至少一种保护性基因型,该受试者发生AMD的危险增加。备选地,本方法或者包括在BF和C2基因座,及CFH基因座处分析受试者的基因型。此处提供的方法也可用于通过确定受试者是否具有至少一种上面鉴定的多态性或基因鉴定发生AMD的危险增加的受试者。
通过从受试者中获得样品进行对存在或缺少特定多态性的受试者遗传物质的分析。该样品可以来自受试者身体的任何部分(可从其中分离DNA或RNA)。分析也可在从样品分离的蛋白质上进行。下面对此类样品的实例进行了更详细的讨论。受试者可能已诊断患有AMD,包括早期AMD、脉络膜新生血管形成或地图样萎缩。受试者可能具有AMD的症状,如玻璃疣、色素改变、渗出性改变如出血、硬性渗出物或视网膜下/RPE下/视网膜内流体、视敏度降低、视力模糊、视物变形症(视物变形症)、中心暗点或颜色识别障碍。或者,受试者没有诊断患有AMD,但基于家族史、年龄、种族或生活方式的选择其可能处于高危险群体中。这些生活方式的选择包括但不局限于吸烟、暴露于日光(尤其是蓝光)、高血压、心血管危险因素如高胆固醇和肥胖、高脂摄入和氧化应激。发生AMD危险的受试者也包括CFH基因中危险单元型Y402H杂合或纯合的那些受试者。
确定特定的目的多态性或基因型存在或不存在的技术为本领域所熟知。这些方法的实例讨论于下,并且所用的特定方法不旨在限制。此外,分析受试者BF、C2或CFH基因的此处公开的特定多态性也旨在包括如见于多态性中赋予相同氨基酸改变的任何突变的检测。例如,BF中L9H多态性将第九个氨基酸的核苷酸密码子从CTC变为CAC,产生了组氨酸而非亮氨酸。该改变也可以为核苷酸密码子CAT。C2中的E318D多态性将第318个氨基酸的核苷酸密码子从GAG变为GAC,产生了天冬氨酸而非谷氨酸。该改变也可以为核苷酸密码子GAT。BF中的R150R多态性将第150个氨基酸的核苷酸密码子从CGG变为CGA。该改变没有改变编码的氨基酸(精氨酸)。精氨酸也可以由CGT或CGC编码。此外,精氨酸可以由AGA或AGG编码。CFH中Y402H多态性将第402个氨基酸的核苷酸密码子从TAT变为CAT,产生了组氨酸而非酪氨酸。该改变也可以为核苷酸密码子CAC。可以在受试者中检测这些核苷酸密码子中任何一个密码子或本领域技术人员能够鉴定的其他密码子。
本发明的方法可以鉴定将至少约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%的发生AMD的受试者。
AMD的预防治疗
本公开也提供在确定具有发生AMD遗传倾向的受试者中避免或降低AMD发病率的方法。例如,如果使用上述方法,在处于AMD危险(基于上述危险因素中的任何一种危险因素)的受试者中没有鉴定到BF、C2和/或CFH基因中的突变或保护性多态性,受试者可以进行生活方式的选择以避免或降低AMD的发病率或延迟AMD的发病。例如,受试者可以戒烟;改变饮食以包含更少脂肪的摄入;增加抗氧化剂的摄取,包括维生素C和E、β胡萝卜素和锌;或接受预防剂量的试剂,其延迟视网膜新生血管形成的发生。对此类个体的治疗可涉及针对某些病原体的疫苗,或抗生素,或抗病毒或真菌药物。治疗还可涉及抗炎药物或补体抑制剂。在一些实施例中,所选的治疗基于该受试者遗传图谱的分析对受试者是特异且特定的。
检测已知多态性的方法
检测已知多态性的方法包括但不局限于,限制性片段长度多态性(RFLP)、单链构象多态性(SSCP)作图、核酸测序、杂交、荧光原位杂交(FISH)、PFGE分析、核糖核酸酶保护测定、等位基因特异的寡核苷酸(ASO)、斑点印迹分析、等位基因特异的PCR扩增(ARMS)、寡核苷酸连接测定(OLA)和PCR-SSCP。也可用的是最近发展的质谱技术(如衬质辅助激光解吸/电离(MALDI)或MALDI-飞行时间(MALDI-TOF);和用于突变检测的DNA微芯片技术。见,例如HumanMolecular Genetics 2中第6和17章,Tom Strachan和Andrew Read编辑,NewYork:John Wiley & Sons Inc.,1999。
这些技术可包括分析前扩增核酸。扩增技术为本领域技术人员已知并在下面进行讨论。
当多态性引起核苷酸改变时(其产生或消除限制酶的识别位点),该限制酶可以用于鉴定多态性。可以通过跨越多态位点的PCR扩增并用相关的限制性内切酶消化PCR产物来辨别多态等位基因。可使用大小分级法,如凝胶电泳来检测不同的产物。或者,可以使用限制性片段长度多态性(RFLP)。在多态性不能产生限制位点不同的情况下,可以通过扩增产生限制位点PCR检测等位基因间的差异。在该方法中,从紧密接近但不包括限制位点的序列上设计引物。有意设计引物以在非临界位置中具有单碱基错配,其不抑制两条多肽序列的杂交和扩增。该核苷酸错配与多肽位点的序列一起产生了在等位基因的一个基因中不存在的限制位点。
单链构象多态性(SSCP)作图检测条带,所述条带因为序列改变引起单链的分子内碱基配对差异从而迁移不同。仅一个碱基不同的单链DNA分子在非变性凝胶中经常显示不同的电泳迁移率。通过与标记的探针进行杂交揭示正常DNA和突变DNA迁移率之间的差异。该方法不检测所有的序列改变,尤其是如果DNA片段大小大于约500bp时,但可以优化该方法以检测大多数的DNA序列变异。降低的检测灵敏度是个缺点,但SSCP的产量可能增加,使得它成为在研究基础上,相对于直接测序,称为用于检测突变的有吸引力的选择。然后将在SSCP凝胶上具有改变迁移率的片段测序以确定DNA序列变异的精确性质。
直接DNA测序、人工测序或自动荧光测序可以检测序列变异。
也可以使用Taq聚合酶进行特异性等位基因的检测(Holland等(1991)Proc.Natl.Acad.Sci.美国88:7276-80;Lee等(1999)J.Mol.Biol.285:73-83)。这基于这样的事实,Taq聚合酶不具有3′到5′外切核酸酶的校正活性,但具有5′到3′外切核酸酶活性。该测定涉及对靶序列特异的两条常规PCR引物(正向和反向)和第三条引物(将其设计为特异性结合到正向引物结合位点下游靶序列的位点上)的使用。第三条引物通常用两种荧光探针(5′末端的报道染料,和与报道染料相比具有不同的发射波长的3′末端的淬灭剂染料)标记。第三条引物在3′端核苷酸处也携带封闭基,使得它不能通过自身指导任何新的DNA合成。在PCR反应过程中,TaqDNA聚合酶通过正向引物指导合成新的DNA链并当酶接近第三条引物时,其5′到3′外切核酸酶活性从它的5′末端开始持续降解第三条引物。最后结果是新生DNA链延伸越过第三条引物的结合位点并且报道染料和淬灭剂染料不再结合到相同的分子上。因为报道染料不再靠近淬灭剂染料,可检测到所获的报道分子发射强度的增加。
可以通过使用一个或多个杂交探针鉴定多态性,所述探针设计用来与想要的基因中的特定多态性杂交。用于杂交检测方法的探针应以某种方式进行标记以能够检测成功的杂交事件。这可以通过体外方法如切口平移(用放射性标记的核苷酸取代探针中的核苷酸),或通过随机引物延伸(其中非标记的分子作为标记拷贝合成的模板)来完成。标记探针以检测杂交的其他标准方法为本领域技术人员已知。
对于长度高达约2kb的DNA片段,可以在突变体-正常异源双链体的错配碱基处通过化学切割检测单碱基改变。例如,不包括目的多态性的DNA链在一个末端进行放射性标记,然后与受试者DNA的链杂交。用羟胺和四氧化锇处理所获异源双链体DNA,所述羟胺和四氧化锇在错配单链区域分别修饰任何C或C和T;被修饰的主链对于哌啶切割是敏感的。通过凝胶电泳和放射自显影与不包括目的多态性的DNA比较来检测变短的标记片段。
错配是杂交的核酸双链体,其中两条链不是100%互补。全部同源性的缺失可能是因为缺失、插入、倒置或取代。错配检测可以用于检测基因或其mRNA产物中的点突变。虽然这些技术比测序灵敏度低,但它们更易于在大量样品上进行。错配切割技术的实例是RNA酶保护技术。该方法涉及标记核糖核酸探针的使用,所述核糖核酸探针与正在检测的多态性的一种变异互补(通常所述多态性与保护免于AMD不相关)。核糖核酸探针与从受试者中分离的mRNA或DNA一起退火(杂交)并随后用酶RNaseA(其能够检测双链体RNA结构中的一些错配)消化。如果通过RNase A检测到错配,它在错配位点进行切割。因此,当退火的RNA制备物在电泳凝胶基质上进行分离时,如果已检测到错配并通过RNase A进行了切割,将会看到RNA产物,其比核糖核酸探针和mRNA或DNA的全长双链RNA小。核糖核酸探针不需要是全长mRNA或全长基因,但可以是任何一个的区段。或者,可以通过错配双链体的电泳迁移率的变化相对于配对双链体的电泳迁移率的变化检测错配。
也可以使用等位基因特异的探针或寡核苷酸(ASO)筛选已通过使用PCR扩增的BF、C2或CFH基因的DNA序列。这些探针是核酸寡聚体,每一个寡聚体包含携带已知突变或多态性的基因序列区域。例如,一个寡聚体的长度可以为约30个核苷酸,对应BF、C2或CFH基因序列的一部分。通过一组此类等位基因特异探针的使用,可以筛选PCR扩增产物以鉴定此处提供的一种或多种多态性的存在。等位基因特异探针与扩增的BF、C2或CFH序列间的杂交例如可以在尼龙滤膜上进行。也可以使用反向斑点杂交。例如,可以使用对每一个多态等位基因特异的一系列ASO(印迹到单个膜上,其然后与标记的PCR扩增试验DNA杂交)进行多于一种多态性的筛选。这些测定可以从小数目的人工印迹阵列变化至“基因芯片”上的非常大的ASO阵列,所述“基因芯片”可检测大量的多态性。在高度严紧的杂交条件下与特定探针的杂交表明与在等位基因特异探针中一样,相同多态性存在于在组织中。此类技术可以利用金纳米颗粒标记的探针来产生视觉颜色效果(Elghanian等(1997)Science 277:1078-81)。
等位基因特异的PCR扩增基于称为扩增受阻突变体系(amplificationrefractory mutation system,ARMS)的方法(Newton等(1989)NucleicAcids Res.17:2503-16)。在该方法中,具有错配3′残基的寡核苷酸将不能在适当条件下的PCR中行使引物的功能。使用两条引物进行配对PCR反应,两条引物中的一条是普通引物,并且另一条以两种稍微不同的形式存在,每一种对每一种多态性特异。将等位基因特异的引物设计为与跨越(over)变体核苷酸位置前面,直至并终止在变体核苷酸自身的区域的两个等位基因的序列相同。因此,如果不存在特定多态性或突变,就观察不到扩增产物。通常,额外的对照引物用于扩增不相关序列。可以设计普通引物的位置以产生对于不同的多态性大小不同的产物,使得来自多重反应的PCR产物在凝胶上形成梯状。可以用不同的荧光标记物或其他标记物标记多态性特异的引物,或可以产生大小不同的5′延伸。该方法可适用于实时PCR。
在寡核苷酸连接测定(OLA)中,设计两种寡核苷酸与靶标中的相邻序列杂交。它们连接的位点是多态性的位点。DNA连接酶仅当它们完全杂交时连接寡核苷酸(Nickerson等(1990)Proc.Natl.Acad.Sci.美国87:8923-7)。该测定可以使用多种方式,包括ELISA分析或荧光测序。
使用微芯片技术的核酸分析技术也可以使用。在该技术中,数千不同的寡核苷酸探针可累积在硅片上的阵列中。待分析的核酸进行荧光标记并与芯片上的探针杂交。使用这些核酸微芯片研究核酸-蛋白质的相互作用也是可能的。使用该技术可确定突变的存在或甚至测序正在分析的核酸,或可测定目的基因的表达水平。所述方法是许多探针,甚至数千探针平行处理中的一种并可以显著提高分析的速度。
可以通过本领域已知的任何技术检测BF、C2或CFH mRNA表达的改变。这些包括RNA印迹分析、PCR扩增和RNA酶保护技术。减少的mRNA表达表明野生型基因的改变。如果特定等位基因产生具有氨基酸变体的蛋白质,等位基因的检测技术可以基于蛋白质。例如,可以用单克隆抗体检测对氨基酸变体特异的表位。或者,与BF、C2或CFH免疫反应的单克隆抗体可用于筛选组织。关联抗原的缺失表明突变。对突变等位基因的产物特异的抗体也可用于检测突变基因产物。可以以本领域已知的任何合适的方式完成此类免疫测定。这些包括蛋白质印迹、免疫组织化学测定和ELISA测定。用于检测改变的蛋白质的任何手段可用于检测野生型BF、C2或CFH基因的改变。可以使用功能测定,如蛋白质结合测定。此外,可以使用检测BF、C2或CFH的生物化学功能的测定。发现突变的BF、C2或CFH基因产物表明野生型BF、C2或CFH基因的改变。
核酸分子的扩增
可以在检测前从临床样品中扩增从受试者中获得的核酸样品。在一个实施方案中,扩增DNA序列。在另一个实施方案中,扩增RNA序列。
可以使用任何核酸扩增方法。在一个特异的非限制性实施例中,聚合酶链式反应(PCR)用于扩增与AMD相关的核酸序列。其他示例性方法包括但不局限于,RT-PCR和转录介导的扩增(TMA)、克隆、特异等位基因的聚合酶链式反应(PASA)、连接酶链式反应和嵌套聚合酶链式反应。
扩增反应中可使用一对引物。例如可以用可检测的放射标记、荧光团或生物素分子标记一条引物或两条引物。一对引物可以包括上游引物(其5′结合到下游引物上)和下游引物(其3′结合到上游引物上)。扩增反应中所用的引物对可以是选择性引物,其允许扩增与AMD相关的核酸。
扩增反应中可以包括另一对引物作为内部对照。例如,这些引物可用于扩增“管家”核酸分子,并用于提供适当扩增的证据。在另一个实施例中,可以构建包括引物杂交位点的靶核酸分子并包括在扩增反应器中。本领域技术人员将能够容易地鉴定引物对以用作内部对照引物。
可以以多种方式,包括大小分析、大小分析后限制性消化、在反应产物中检测特异标记的寡核苷酸引物、等位基因特异的寡核苷酸(ASO)杂交、测序、杂交等等来测定扩增产物。
基于PCR的检测测定包括多个多态性同时多重扩增。例如,选择PCR引物以产生大小不重叠并可以同时分析的PCR产物为本领域所熟知。或者,可能用差别标记的引物(因此每一条均可被检测到)扩增不同的多态性。允许多个多态性进行多重分析的其他技术为本领域已知。可以扩增基因的片段以产生拷贝,并且可以确定片段的拷贝是否包含特定的保护性多态性或基因型。
保护性蛋白质的免疫检测
在本发明的一个实施方案中,进行蛋白质测定以表征受试者C2或BF基因中的多态性,例如来检测或鉴定保护性蛋白质。可适于检测变体蛋白质的方法是众所周知的,包括分析生物化学方法,如电泳(包括毛细管电泳和双向电泳),层析法如高效液相层析(HPLC)、薄层层析(TLC)、超扩散层析、质谱法以及多种免疫学方法如液体或凝胶沉淀素反应、免疫扩散(单或双)、免疫电泳、放射免疫测定(RIA)、酶联免疫吸附测定(ELISA)、免疫荧光测定、蛋白质印迹等。
例如,适用于实行本发明的大量成熟的免疫结合测定形式是已知的(见,例如,Harlow,E.;Lane,D.Antibodies:a laboratory manual.ColdSpring Harbor,N.Y:Cold Spring Harbor Laboratory;1988和Ausubel等,(2004)Current Protocols in Molecular Biology,John Wiley & Sons,NewYork NY)。例如,所述测定可以是竞争性或非竞争性的。免疫结合测定(或免疫测定)一般使用“捕捉剂”与分析物特异性结合,并经常固定分析物。在一个实施方案中,捕捉剂为与变体C2或BF多肽或亚序列特异性结合的部分。可以使用例如可检测标记的抗C2/BF抗体检测结合的蛋白质。在一个实施方案中,至少一种抗体对变体形式具有特异性(例如不与野生型C2或BF多肽结合)。
因此,在本方法的一个方面中涉及从受试者中获得生物学样品(例如,血液、血清、血浆或尿);使所述样品与辨别C2或BF的保护性和非保护性形式的结合剂接触,并检测结合剂与C2或BF的非保护性形式间复合物的形成(如果存在)。将理解一组抗体可以用于检测患者样品中的保护性蛋白质。
本发明也提供特异性结合保护性C2或BF蛋白质但不特异性结合野生型多肽(即与保护性无关的C2或BF蛋白质)的抗体。抗体结合仅以保护性形式被发现的表位。例如,抗体可能不结合野生型BF(由Genbank登录号NM_001710;AAB67977编码)或C2(由Genbank登录号NM_000063;NP_000054编码),但结合如上述的BF或C2变体(即,具有如此处描述的对AMD有保护性的多态性中的一种多态性的蛋白质)。例如,所述抗体可以识别在第32位具有谷氨酰胺或在第9位具有组氨酸的BF蛋白质或在第318位具有天冬氨酸的C2。
抗体可以是多克隆抗体或单克隆抗体,并根据标准方法制备。可以通过用保护性蛋白质或其片段注射适当的动物来制备抗体。可以按照标准方法筛选单克隆抗体(Koehler和Milstein 1975,Nature256:495;Dower等,WO 91/17271;McCafferty等,WO 92/01047;和Vaughan等,1996,NatureBiotechnology,14:309;以及下文提供的参考文献)。使用本领域已知的方法可测定单克隆抗体对保护性多肽的特异性免疫活性,而对相应野生型多肽无特异性免疫活性。就方法(包括抗体筛选和消减法)而言,见Harlow& Lane,Antibodies,A Laboratory Manual,Cold Spring Harbor Press,New York(1988);Current Protocols in Immunology(J.E.Coligan等编著,1999,包括整个2005年的增刊);Goding,Monoclonal Antibodies,Principles and Practice(2版)Academic Press,New York(1986);Burioni等,1998,"A new subtraction technique for molecular cloning of rare antiviralantibody specificities from phage display libraries"Res Virol.149(5):327-30;Ames等,1994,Isolation of neutralizing anti-C5amonoclonal antibodies from a filamentous phage monovalent Fab displaylibrary.J Immunol.152(9):4572-81;Shinohara等,2002,Isolation ofmonoclonal antibodies recognizing rare and dominant epitopes in plantvascular cell walls by phage display subtraction.J Immunol Methods264(1-2):187-94。免疫或筛选可以针对全长保护性蛋白质,或者备选地(经常更方便)针对包含已知在变体和野生型形式之间不同的表位的肽或多肽片段。抗体可以表达为包含两条轻链和两条重链的四聚体,分离的重链、轻链,Fab、Fab′F(ab′)2和Fv,或其中重链和轻链可变域通过间隔区连接的单链抗体。
核酸分子的扩增
可以在检测前从临床样品中扩增从受试者中获得的核酸样品。在一个实施方案中,扩增DNA序列。在另一个实施方案中,扩增RNA序列。
可以使用任何核酸扩增方法。在一个特异的非限制性实施例中,聚合酶链式反应(PCR)用于扩增与AMD相关的核酸序列。其他示例性方法包括但不局限于,RT-PCR和转录介导的扩增(TMA)、克隆、特异等位基因的聚合酶链式反应(PASA)、连接酶链式反应和嵌套聚合酶链式反应。
扩增反应中可使用一对引物。例如可以用可检测的放射标记、荧光团或生物素分子标记一条引物或两条引物。一对引物可以包括上游引物(其5′结合到下游引物上)和下游引物(其3′结合到上游引物上)。扩增反应中使用的引物对可以是选择性引物,其允许扩增与AMD相关的核酸。
扩增反应中可以包括另一对引物作为内部对照。例如,这些引物可用于扩增“管家”核酸分子,并用于提供适当扩增的证据。在另一个实施例中,可以构建包括引物杂交位点的靶核酸分子并包括在扩增反应器中。本领域技术人员将能够容易地鉴定引物对以用作内部对照引物。
可以以多种方式,包括大小分析、大小分析后限制性消化、检测反应产物中特异标记的寡核苷酸引物、等位基因特异的寡核苷酸(ASO)杂交、测序、杂交等等来测定扩增产物。
基于PCR的检测测定包括多个多态性同时多重扩增。例如,选择PCR引物以产生大小不重叠并可以同时分析的PCR产物为本领域所熟知。或者,可能用差别标记的引物(因此每一条均可被检测到)扩增不同的多态性。允许多个多态性进行多重分析的其他技术为本领域已知。可以扩增基因的片段以产生拷贝,并且可以确定片段的拷贝是否包含特定的保护性多态性或基因型。
补体因子H(CFH)
CFH基因定位在染色体Iq上与AMD重复连锁(基于家族研究)的区域中。近来,三次独立研究已揭示外显子9中核苷酸第1277位T→C取代的多态性(其导致补体因子H基因中酪氨酸到组氨酸的改变(Y402H))对AMD易感性的重大贡献(Klein等(2005)Science 308:385-389;Haines等(2005)Science.308:419-421;Edwards等(2005)Science.308:421-424)。这些研究报道了AMD让步比对于C等位基因的携带者在3.3到4.6间变化,并且对于CC纯合子而言该让步比在3.3到7.4间变化。随后,该联系由其他两组研究证实(Zareparsi等(2005)Am.J.Hum.Genet.77:149-153;Hageman等(2005)Proc.Natl.Acad.Sci.美国102:7227-7232)。在一个研究中发现除了Y402多态性外,7种其他常见SNP与AMD相关(Hageman等(2005)Proc.Natl.Acad.Sci.美国102:7227-7232)。
配对连锁分析显示这7种多态性连锁不平衡,并且具有一组这些多态性的一种常见危险单元型在50%的病例中被检测到,而对照为29%[OR=2.46,95% CI(1.95-3.11)]。该单元型的纯合子见于24.2%的病例和8.3%的对照中。两种常见保护性单元型也可见于34%的对照和18%的病例中[OR=0.48,95% CI(0.33-0.69)和OR=0.54,95% CI(0.33-0.69)]。
因子B和补体组分2
旁路途径的激活起始于因子D催化的C3b结合因子B(BF)切割,导致C3Bb复合物(C3转化酶)的形成。该复合物通过调控蛋白备解素得以稳定,然而它的解离通过包括CFH的调节蛋白而加速。BF和C2是人染色体6p21上定位相距仅500bp的平行基因。C2在经典补体途径中起作用。这两个基因与编码补体组分4A(C4A)和4B(C4B)的基因一起包含“补体单元型”(补体单元型),其占据主要组织相容性复合物(MHC)III型区域中HLA-B与HLA-DR/DQ间约100-120kb。
临床样品
用于当前公开内容确定受试者对AMD的遗传倾向的适当样品包括任何常规的临床样品,包括但不局限于,血液或血液级分(如血清或血浆)、漱口剂或口腔刮拭物、绒毛膜绒毛活组织检查样品、精液、Guthrie card、眼眼睛液体、痰、淋巴液、尿和组织。最简单地,可以抽提血液并且从血液细胞中提取DNA(或RNA)。例如通过点突变或缺失而造成的野生型BF、C2和/或CFH等位基因的改变可以通过此处讨论的任何方法进行检测。
获得此类样品的技术为本领域所熟知(例如见Schluger等(1992)J.Exp.Med.176:1327-33,关于血清样品的收集)。可以以常规方式制备血清或血液级分。例如,约200μL的血清可用于提取用于扩增反应中的DNA。
一旦获得了样品,样品可以直接使用、浓缩(例如通过离心或过滤)、纯化或其组合,并进行扩增反应。例如,可以使用市售试剂盒(如InstaGeneMatrix,BioRad,Hercules,CA;the NucliSens分离试剂盒,OrganonTeknika,Netherlands)进行快速的DNA制备。在一个实施例中,DNA制备方法产生核酸制剂,其易于并可处理用于核酸扩增。
微阵列
在特定实施例中,检测BF、C2和/或CFH基因多态性的方法使用此处讨论的阵列。此类阵列可包括核酸分子。在一个实施例中,所述阵列包括核酸寡核苷酸探针,其能与多态BF、C2和/或CFH基因序列(如此处讨论的那些多态性)杂交。此类阵列中的某些(及此处讨论的方法)可包括与发生AMD危险或保护免于AMD相关的其他多态性,及其他序列如识别一种或多种管家基因的一种或多种探针。
此处称作“AMD检测测定”的阵列用于确定受试者发生AMD的遗传易感性。在一个实施例中,一组寡核苷酸探针附着在固体支持物的表面,用于检测BF、C2和/或CFH基因(如从受试者中获得的那些扩增的核酸序列)中的多态性。此外,如果在扩增反应中(见上文)扩增内部对照核酸序列,可以包括寡核苷酸探针以检测该扩增核酸分子的存在。
结合到阵列上的寡核苷酸探针可特异性结合扩增反应中扩增的序列(如在高度严紧条件下)。可以使用包含BF、C2和/或CFH基因至少15、20、25、30、35、40或更多连续核苷酸的寡核苷酸。
依据本公开的方法和装置利用这样的事实,在适当条件下寡核苷酸与具有互补碱基序列的核酸分子形成碱基配对的双链体。双链体的稳定性依赖于许多因素,包括寡核苷酸的长度、碱基组成和影响杂交的溶液组成。碱基组成对双链体稳定性的影响可以通过在特定溶液中(例如在高浓度叔胺或季胺存在下)进行杂交来减小。
双链体的热稳定性也依赖于序列间序列相似性的程度。通过在接近预期Tm的温度下进行杂交(所述Tm是在靶序列与结合到阵列上的寡核苷酸间形成期望类型双链体的Tm),错配双链体的形成速率可以有很大程度地降低。
可以对阵列中使用的每一寡核苷酸序列的长度进行选择以优化靶BF、C2和/或CFH核酸序列的结合。可以根据经验来确定在特异的筛选条件下用于特定BF、C2和/或CFH核酸序列的最适长度。因此,可以优化包括在阵列中的一组寡核苷酸序列的每一个元件的长度。在一个实施例中,寡核苷酸探针的长度为约20到约35个核苷酸,或约25到约40个核苷酸。
形成阵列的寡核苷酸探针序列例如通过探针的5′或3′末端可以直接连接到支持物上。在一个实施例中,寡核苷酸通过5′末端结合到固体支持物上。然而,本领域的技术人员可以确定寡核苷酸3′末端或5′末端的使用是否适合于结合到固体支持物上。通常,寡核苷酸探针在3′末端和5′末端区域中的内部互补性决定与支持物的结合。或者,寡核苷酸探针可以通过非BF、C2和/或CFH序列(如寡核苷酸,或作为与固体支持物的间隔区或接头的其他分子)附着到支持物上。
在另一个实施例中,阵列包括蛋白质序列,其包括至少一种BF、C2和/或CFH蛋白质(或基因、cDNA或包括列出序列中的一种的其他多核苷酸分子,或其片段),或此类蛋白质的片段,或此类蛋白质或蛋白质片段的特异性抗体。形成阵列的蛋白质或抗体可以直接连接到支持物上。或者,蛋白质或抗体可以通过固体支持物的间隔区或接头附着到支持物上。
可以使用例如BF、C2和/或CFH蛋白质特异的结合剂(其在一些实例中将被可检测地标记)检测BF、C2和/或CFH蛋白质中的异常。因此在某些实施例中,检测异常包括使来自受试者的样品与BF、C2和/或CFH蛋白质特异的结合剂接触;并检测结合剂是否被样品结合并因此测定存在于样品中的BF、C2和/或CFH蛋白质的水平,其中样品中BF、C2和/或CFH蛋白质的水平相对于来自不易于发生AMD的患者的类似样品中发现的BF、C2和/或CFH蛋白质的水平的差异,或相对于来自不具有发生AMD倾向的患者的类似样品中标准BF、C2和/或CFH蛋白质的水平的差异是该BF、C2和/或CFH分子中的异常。
在特定实施例中,微阵列材料由玻璃(二氧化硅)形成。固体支持物的合适二氧化硅类型包括但不局限于:铝铝酸盐、硼硅酸盐、二氧化硅、碱石灰、二氧化钛锌(zinc titania)和熔融的二氧化硅(例如见Schena,Microarray Analysis.John Wiley & Sons,Inc,Hoboken,New Jersey,2003)。核酸到玻璃表面的附着可以通过本领域已知的方法完成,例如通过形成有机聚合物的表面处理。特定实例包括但不局限于:聚丙烯、聚乙烯、聚丁烯、聚异丁烯、聚丁二烯、聚异戊二烯、聚乙烯吡咯烷酮、聚四氟乙烯、聚偏二氟乙烯、聚氟乙丙烯、聚乙烯乙烯醇、polymethylpentene、聚氯三氟乙烯、聚砜类(polysulfornes)、羟基化的双向拉伸聚丙烯、胺化的双向拉伸聚丙烯、硫醇化的双向拉伸聚丙烯、乙烯丙烯酸(etyleneacrylicacid)、thylene methacrylic acid和其共聚物的掺合物(见美国专利号5,985,567,此处引入作为参考),提供化学活性胺或醛基的有机硅烷化合物,环氧或多聚赖氨酸处理微阵列。固体支持物表面的另一个实例是聚丙烯。
通常,可以用于形成固体支持物表面的材料的合适特征包括:易于表面激活,使得一旦激活,支持物的表面能够共价连接生物分子,如将寡核苷酸连接至那里;“原位”合成生物分子的可处理性;是化学惰性的,这使得支持物上没有被占据的区域不易于非特异的结合,或当非特异的结合发生时,可方便地从表面去除此类物质而不去除寡核苷酸。
在一个实施例中,表面处理是包含胺的硅烷衍生物。核酸与胺表面的附着通过DNA主链上的负电荷磷酸基团和正电荷氨基基团的相互作用而发生(Schena,Microarray Analysis.John Wiley & Sons,Inc,Hoboken,New Jersey,2003,此处引入作为参考)。在另一个实施例中,反应性的醛基用作表面处理。到醛表面的附着通过向目的DNA添加5′胺基基团或氨基接头来完成。当胺接头上的非结合电子对作为亲核体(其攻击醛基的正电碳原子)起作用时,结合发生。
可依据本公开内容使用多种阵列形式。一个实例包括寡核苷酸条带的线性阵列,在本领域中通常称作试纸条(dipstick)。另一种适当形式包括独立单元的二维模式(如64乘64阵列中4096个正方形)。如本领域技术人员理解,包括但不局限于狭线(矩形)和环状阵列的其他阵列形式同样适于使用(见美国专利号5,981,185,此处引入作为参考)。在一个实施例中,阵列在聚合物介质(线、膜或薄膜)上形成。有机聚合物介质的实例是具有从约1mm(0.001英寸)到约20mm厚度的聚丙烯片,虽然薄膜的厚度不是至关重要的并且可以在相当宽的范围内变化。此时具体公开的阵列制品是双向拉伸聚丙烯(BOPP)膜;除了它们的耐用性,BOPP膜显示出低背景荧光。在特定实施例中,阵列是基于固相等位基因特异寡核苷酸(ASO)的核酸阵列。
本公开的阵列形式可以包括在多种不同类型的形式中。“形式”包括可以固定的固体支持物的任何形式,如微量滴定板、试管、无机薄片、试纸条等等。例如,当所述固体支持物是聚丙烯线时,可将一条或多条聚丙烯线固定在塑料试纸条类型的装置上;可以将聚丙烯膜固定到载玻片上。其中的特定形式或形式本身并不重要。所有必需的是可以固定固体支持物而不影响固体支持物或其上吸附的任何生物多聚物的功能行为,并且形式(如试纸条或载玻片)对引入的装置的任何物质(如临床样品和杂交溶液)是稳定的。
可以通过多种方法制备本公开的阵列。在一个实施例中,独立合成寡核苷酸或蛋白质序列,然后附着到固体支持物上(见美国专利号6,013,789,此处引入作为参考)。在另一个实施例中,将序列直接合成至支持物上以提供想要的阵列(见美国专利号5,554,501,此处引入作为参考)。用于共价偶联寡核苷酸和蛋白质至固体支持物以及直接合成寡核苷酸或蛋白质至支持物的合适方法为本领域工作人员已知;适当方法的综述可见于Matson等(1994)Anal.Biochem.217:306-10。在一个实施例中,使用在固体支持物上制备寡核苷酸的常规化学技术合成寡核苷酸至支持物上(如见PCT公开号WO 85/01051和WO 89/10977,或美国专利号5,554,501,每一文献此处引入作为参考)。
可使用自动手段,通过预定模式将四个碱基前体放置在阵列单元中来合成寡核苷酸,以产生合适阵列。简单而言,使用多通道自动化学递送系统以产生跨越基质的并排寡核苷酸探针群(对应递送系统中通道的数目)。在第一方向完成寡核苷酸合成后,然后可以将基质旋转90°来允许合成在此时与第一种放置的行垂直的第二种放置的行上(2°)进行。该方法产生多通道阵列,其交叉产生多数独立单元。
在特定实施例中,阵列上的寡核苷酸探针包括一种或多种标记物,其允许检测寡核苷酸探针:靶序列杂交复合物。
试剂盒
本公开提供试剂盒,其可用于确定受试者,如不同于健康人受试者的受试者是否对AMD具有遗传倾向。此类试剂盒允许确定受试者是否具有一种或多种BF、C2或CFH基因序列遗传突变或多态性。
所述试剂盒包含用于确定受试者BF、C2或CFH基因中至少一种多态性存在或缺少的试剂,如与此处鉴定的BF、C2或CFH多态序列选择性杂交的探针或引物。可用此处描述的方法使用此类试剂盒来确定受试者的BF、C2或CFH基因型或单元型。
可以以试剂盒形式提供寡核苷酸探针和/或引物用于检测特异的BF、C2或CFH序列,如受试者中此处描述的SNP或单元型。在此试剂盒中,在一个或多个容器中提供适当量的一种或多种寡核苷酸引物。可以提供例如悬浮在水溶液中的寡核苷酸引物或作为冷冻干燥或低压冻干粉末的寡核苷酸引物。提供一种或多种寡核苷酸的一个或多个容器可以是任何常规容器,其能够保存供应形式,例如microfuge管、安瓿或瓶。在一些应用中,可以在通常可处理的管或等同容器中以个体中预测的单次使用量提供多对引物。利用此准备,可向各管中加入待检测存在BF、C2或CFH多态性的样品并直接进行扩增。
根据例如产品面向的市场,试剂盒中提供的每一寡核苷酸引物的量可以是任何适当的量。例如,如果所述试剂盒适用于研究或临床使用,提供的每一寡核苷酸引物的量将可能是足以引导若干PCR扩增反应的量。本领域技术人员知道适合用于单次扩增反应的寡核苷酸引物的量。一般指导方针例如可见于Innis等(PCR Protocols,A Guide to Methods andApplications,Academic Press,Inc.,San Diego,CA,1990)、Sarnbrook等(于Molecular Cloning:A Laboratory Manual,Cold Spring Harbor,NewYork,1989中)和Aus υ bel等(于Current Protocols in Molecular Biology,Greene Publ.Assoc,和Wiley-Intersciences,1992中)。
为了便于BF、C2或CFH编码序列(例如特异的靶BF、C2或CFH基因或其5′或3′侧翼区)的体外扩增,试剂盒可包括多于两种引物。
在一些实施方案中,试剂盒也可包括进行核苷酸扩增反应必需的试剂,例如,包括DNA样品制备试剂、适当缓冲液(例如,聚合酶缓冲液)、盐(例如,氯化镁)和脱氧核糖核苷酸(dNTP)。
试剂盒还可包括用于检测BF、C2或CFH多态性或单元型的标记的寡核苷酸探针或未标记的寡核苷酸探针。在某些实施方案中,这些探针对靶扩增序列中可能存在的潜在多态位点是特异的。此探针的适当序列可以是任何序列,其包括一个或多个鉴定的多态位点,使得探针序列与多态位点及周围的BF、C2或CFH序列互补。作为实例,此类探针长度为至少6个核苷酸,并且多态位点出现在探针长度中任何位置处。为了保证特异性,使用更长的探针常常是有益的。因此,在一些实施方案中,探针为至少8个、至少10个、至少12个、至少15个、至少20个、至少30个核苷酸或更长。
在试剂盒中提供一种或多种用于扩增反应的对照序列也是有益的。适当阳性对照序列的设计为适当领域中普通技术人员所熟知。作为实例,对照序列可在一个或多个靶SNP位置上包含具有已知序列的一种或多种人(或非人)BF、C2或CFH核酸分子,如此处描述的那些。对照也可包含非BF、C2或CFH核酸分子。
在一些实施方案中,试剂盒也可包括进行RT-PCR体外扩增反应所必需的一些或所有试剂,例如,包括RNA样品制备试剂(包括例如,RNA酶抑制剂),适当缓冲液(例如,聚合酶缓冲液)、盐(例如,氯化镁)和脱氧核糖核苷酸(dNTP)。
此类试剂盒还可包括用于检测体外扩增靶序列的标记寡核苷酸探针或未标记的寡核苷酸探针。此类探针的适当序列将是两条提供的寡核苷酸引物退火位点间的任何序列,使得探针序列与PCR反应过程中扩增的(序列)互补。在某些实施方案中,这些探针对可能在靶扩增序列中存在的潜在多态性将是特异的。
在试剂盒中提供一种或多种用于RT-PCR反应的对照序列也是有益的。适当阳性对照序列的设计为适当领域中普通技术人员所熟知。
也包含用于检测或分析BF、C2或CFH蛋白质表达(如过表达或表达不足,或特异同种型的表达)的试剂盒。此类试剂盒可包括至少一种靶蛋白质特异结合物质(例如,特异性识别BF、C2或CFH蛋白质或BF、C2或CFH蛋白质特异多态性形式的多克隆抗体或单克隆抗体或抗体片段)并可包括至少一种对照(如确定量的靶BF、C2或CFH蛋白质,或包含确定量BF、C2或CFH蛋白质的样品)。BF、C2或CFH蛋白质特异结合物质和对照可包含在独立的容器中。抗体可能具有区别BF、CD和/或CFH蛋白质的多态形式的能力。
BF、C2或CFH蛋白质或同种型表达检测试剂盒也可包括检测BF、C2或CFH:结合剂复合物的方法,例如物质可以进行可检测地标记。如果可检测的物质未被标记,可以通过第二抗体或蛋白A(例如在一些试剂盒中其也可提供于一个或更多单独的容器中)检测到。此类技术是众所周知的。
特定试剂盒中的其他组分可包括进行测定的说明书。说明书将允许试验者测定BF、C2或CFH表达水平。反应容器和附属物质(如色原、缓冲液、酶等等)也可包括在试剂盒中。说明书可提供标准曲线或图以与测定值(例如,实验测定的)比较。
也提供有试剂盒,其可区分如此处描述的BF、C2或CFH基因的特异SNP(或单元型)纯合的个体与杂合的个体。此类试剂盒的实例提供进行寡核苷酸连接测定(OLA)所必需的材料,如在Nickerson等(1990)Proc.Natl.Acad.Sci美国87:8923-8927中描述。在具体实施方案中,这些试剂盒包含一种或多种微量滴定板测定,设计所述测定以检测如此处描述的受试者的BF、C2或CFH序列的一种或多种多态性。这些试剂盒中的说明书将允许实验者测定是否存在特定的BF、C2或CFH等位基因,并测定其是纯合的还是杂合的。在试剂盒中提供一种或多种用于OLA反应的对照序列也是有益的。适当阳性对照序列的设计为适当领域的普通技术人员所熟知。
试剂盒可涉及许多测定形式的使用,包括涉及核酸结合(此类结合到滤膜、小珠或微量滴定板等等)的使用。该技术可包括斑点印迹、RNA印迹、DNA印迹、PCR、RFLP等等。
也提供基于微阵列的试剂盒。这些微阵列试剂盒可用于基因分型分析。通常,这些试剂盒包括所提供的固定在基质例如在可寻址位置上的一种或多种寡核苷酸。所述试剂盒也包括说明书,通常是书面说明书以协助用户探测阵列。任选在计算机可读媒介上提供此类说明书。
试剂盒还可包括在提供阵列的测定中使用的一种或多种缓冲液。例如,此类缓冲液可包括低严紧度洗涤,高严紧度洗涤和/或去除(stripping)溶液。可以大批量提供这些缓冲液,其中每一缓冲液容器大到足以保存充足的缓冲液用于若干次探测或洗涤或去除过程。或者,以预先测定的等分试样提供缓冲液,其将适应于试剂盒中包括的阵列大小和类型。某些试剂盒也可提供进行阵列探测反应的一个或多个容器。
试剂盒还可包括一个或多个探测分子如抗体或探针(或抗体混合物、探针混合物、或抗体和探针混合物)的容器,用于检测阵列上捕获的生物分子。所述试剂盒也可包括标记的或未标记的对照探针分子来为内部试验提供标记方法或阵列探测,或标记方法及阵列探针。可以提供例如悬浮在水溶液中或作为冷冻干燥的或低压冻干的粉末的对照探针分子。提供对照的一个或多个容器可以是任何一个或多个常规容器,其能够保存供应形式,例如microfuge管、安瓿或瓶。在一些应用中,可以在通常单独的一次性管或等同容器中以个体中预先测定的单次使用量提供对照探针。
根据例如产品面向的市场,试剂盒中提供的每一对照探针的量可以是任何特定的量。例如,如果所述试剂盒适合于研究或临床使用,将可能提供足够的对照探针来进行阵列的若干受控分析。同样,若一种试剂盒提供大量对照探针,所提供的特异探针将适应市场及相应的试剂盒。在某些实施方案中,将在单个试剂盒中提供大量不同的对照探针,每一对照探针来自相关阵列上发现的不同类型的样品(例如,可以提供试剂盒,其提供真核和原核样品、原核生物特异的对照探针和独立的真核生物特异的对照探针)。
在本发明的一些实施方案中,试剂盒也包括进行一次或更多探针标记反应所必需的试剂。将根据探针分子的类型(例如,DNA或RNA)和标记方法(例如,探针合成过程中掺入的放射标记、附着的荧光标签等等)选择包括的具体试剂以满足终端用户的需要。
提供另外的试剂盒用于标记此处提供的测定阵列中使用的探针分子。此类试剂盒任选地包括由如此标记的探针分子测定的阵列。
通过以下非限制性实施例阐明本公开内容。
实施例
实施例1
材料和方法
受试者:本研究中使用两组独立的欧裔美洲人血统、年龄大于60岁的AMD病例和年龄匹配的对照。这些组由以下组成:来自Iowa大学的350名患有临床证明的AMD的无关联的受试者(平均年龄79.5+/-7.8)和114名无关联的对照个体(平均年龄78.4+/-7.4;通过年龄和人种匹配),和来自Columbia大学的548名患有临床证明的AMD的无关联的受试者(平均年龄71.32+/-8.9岁)和275名无关联的、通过年龄和人种匹配的对照(平均年龄68.84+/-8.6岁)。由专门训练的眼科医师检查受试者。
立体眼底照片根据如Hageman,2005,上文;Bird等(1995)Surv.Ophthalmol.39:367-74;和Klaver等(2001)Invest.Ophthalmol.Vis.Sci42:2237-41中描述的标准化的分类体系分级。对照未显示任何可辨别的黄斑疾病病征或不具有已知的AMD家族史(阶段0和1a)。AMD受试者根据他们募集时最严重的眼分类被细分为表型类别。使用QIAamp DNABlood Maxi试剂盒(Qiagen,Valencia,CA)从外周血白细胞中产生基因组DNA。
研究在Columbia大学和Iowa大学的伦理委员会批准的方案下进行。参与前从所有研究受试者获得知情同意。
免疫组织化学:如Anderson等(2002)Am.J.Ophthalmol.134:411-31中描述,将后极处理、切片并用针对因子Ba的抗体(Quidel)标记。使用仅与二抗一起孵育的临近切片作为对照。制备一些经免疫标记的标本,并通过共焦激光扫描显微镜观察,如所述(Anderson等,2002,上文)。
突变筛选和分析:使用SSCP分析、变性高效液相层析(DHPLC)和直接测序检查BF和C2编码区和相邻的内含子区中的变体。使用MacVector软件(San Diego,CA)设计用于SSCP、DHPLC和DNA测序分析的引物,以扩增每个外显子及其相邻的内含子区。如Allikmets等(1997)Science 277:1805-1807和Hayashi等(2004)Ophthalmic Genet.25:111-9中所述在PCR产生的扩增子中筛选序列变异。按照标准操作通过双向测序确认SSCP和DHPLC检测到的所有变化。
基因分型:通过数据采掘(Ensembl数据库,dbSNP;Cetera DiscoverySystem)和测序发现单核苷酸多态性(SNP)。受试群体中具有大于10%频率的变体的测定作为Validated,Inventoried SNP Assays-On-Demand购自Applied Biosystems,或呈交于Applied Biosystems Assays-By-Design流水线。所用的技术与上文Hagema等,2005中描述的相同。简言之,5ng DNA在ABI 9700 384-孔热循环仪上进行50个循环,并且平板在AppliedBiosystems 7900 HT Sequence Detection System中进行读数。
统计学分析:如上文Hageman等,2005和Klaver等,2001中所述,将基因型在Microsoft EXCEL中列表并呈递至SPSS(SPSS,Inc.)用于进行列联表分析。使用SAS/Genetics(SAS Institute,Inc.,Cary,NC)检查Hardy7 Weinberg Equilibrium的顺应性,且病例和对照中的所有SNP以p<0.05为截断得以保留。对于单元型评估,我们使用snphap(由DavidClayton编写;Cambridge Institute for Medical Research,Cambridge,United Kingdom),下载自Cambridge Institute for Medical Research网址http://www-gene.cimr.cam.ac.uk/clayton/software/)、SNPEM(由NicholasSchork博士和M.Daniele Fallin编写并从D.Fallin处获得)、和PHASE版本2.11(由Matthew Stephens编写;Washington大学,Seattle,WA,且可从他的网址www.stat.washington.edu/stephens/software.html获得)。所用的单元型分析策略先使用Expectation Maximization(EM)或Gibbs抽样算法用于获得单元型评估,其次,用于在连锁不平衡区域内鉴定代表最小信息化组的htSNP,并且最后,用于评估这些与AMD的显著相关。使用Innate Immunity PGA网站上(www.innateimmunity.net)可用的图像工具评估连锁不平衡(未显示)。所有p值为双尾且X2值表现为渐近显著性。使用如在Innate Immunity PGA网址上(https://innateimmunity.net/IIPGA2/Bioinformatics/multipletestfdrform)实施的Benjamini和Hochberg(1995)J.R.Stat.Soc.Ser.B 57:289-300的方法追溯计算总体I型错误率(α),且其低于2×10-3。
显著的单元型在SNPEM和PHASE中进行排列测验。绘于图2A中的保护性SNP模型呈递至Exemplar 2.2(在Sapio sciences网址http://www.sapiosciences.com上可得)并通过与呈现于图2B中的三组数据组(Iowa、Columbia和组合)符合的那个软件在统计学上进行评估。遗传算法(GA)衍生模型的产生(如图2C所示)包含Exemplar软件。GA选项设定为:每15次重复,1500AND/OR模型,模型大小不超过5(其允许16种可能的基因型)。实施例2中包括遗传算法实施和显著性检验的进一步细节。
使用具有Columbia、Iowa和组合数据(记录为具有(+)或无(-)的次要等位基因)适当模板的SPSS版本14.0统计软件包进行分类和退化树分析。模型通过使用三组数据组中的每一组而自动生成,所述三组数据组引入CFH和C2/BF基因座作为相关结果的贡献者。
结果
首先在来自Columbia大学确定组的约90个AMD病例和90个对照中通过变性HPLC分析所有18个BF外显子,其中包括侧翼内含子区的50-80bp。鉴定到17个序列变体,包括8个错义改变,并且L9H(rs4151667)和R32Q(rs641153)等位基因在对照中比病例中出现更为频繁(表1)。在由548个AMD病例和275个对照组成的Columbia大学组中鉴定到BF及其相邻同源物C2中的单元型标签SNP(htSNP)并对其进行基因分型。这些分析揭示与AMD显著相关的四个变体。BF中的L9H变体(其与C2(rs9332739)中的E318D变体几乎完全连锁不平衡(LD))对AMD是高度保护性的(X2=13.8 P=0.00020,OR=0.37[95%CI=0.18-0.60])。BF中的R32Q等位基因与C2的内含子10中的rs547154 SNP几乎完全LD,且也为高度保护性的(X2=33.7,P=6.43X 10-9,OR=0.32[95%CI=0.21-0.48])。
来自Iowa大学的350个案例和114个对照的独立组的基因分型确认了这些发现。例如,在该组中C2E318D/BF L9H SNP对与AMD显著相关(X2=10.6,P=0.0012,OR=0.34[95%CI=0.18-0.67])。为分析跨越C2和BF基因座的单元型,将来自两组的数据组合(表2)。普通单元型(H1,图1)赋予AMD显著的危险(X2=10.3,P=0.0013,OR=1.32[95%CI=1.1-1.6])。与所有其他单元型相比,由BF R32Q SNP(H7)标记的单元型对AMD是高度保护性的(X2=26.9,P=2.1X10-7,OR=0.45[95%CI=0.33-0.61])且包含C2 E318D/BF L9H的单元型(H10)也是显著保护性的(X2=21.6,P=3.4X10-6,OR=0.36[95%CI=0.23-0.56])(图1)。当用作参考单元型时,H1单元型对H7(X2=29.6,OR=0.42[0.32-0.58])和H10(X2=24.9 OR=0.33[0.21-0.52])产生稍微更为显著的结果。用SNPEM程序分析也表明相同单元型与该疾病显著相关,证实了C2和/或BF基因的等位基因是AMD危险的预兆的假设。在3.4%的对照中发现具有两种保护性单元型(H7、H10纯合,或7/10化合物杂合子)的个体,而仅在0.77%的病例中发现(X2=12.2,P=0.00048,OR=0.22[0.087-0.56])。与共显性模型相一致,具有两种保护性等位基因的受试者其让步比约为具有一种保护性等位基因的受试者的一半。
当整个AMD受试者组与对照相比时,或当独立分析AMD的主要亚型(包括早期AMD(eAMD)、脉络膜新生血管形成(CNV)和地图样萎缩(GA))时,观测到的相关性是高度显著的。与我们关于CFH的观察(Hageman等,2005,上文)相似,在某些病例中GA组(来自2组中总计133名受试者)偏离一般趋势。特别地,经R32Q等位基因标记的单元型表明当GA组与对照相比时针对疾病-OR的最强保护为0.22,相对于当其余AMD样品用于相同分析时该保护为0.45。尽管这一偏差就疾病的变化病因学而言是显著的,但其未达到统计学显著性(置信区间重叠),很可能是由于GA病例数较小。
最初按照CFH Y402H等位基因上的情况,通过对受试者分类进行组合分析。由C2/BF赋予的保护性在CFH 402H纯合子中最强(OR=0.27),在402H/Y杂合子中为中等(OR=0.36),并在402Y纯合子中最弱(OR=0.44)。然而,所有这些评估的置信区间重叠。该效应主要由于一种趋势,在该趋势中402H纯合子(“危险”基因型)中的C2/BF保护性等位基因的频率最高;对照组中40%的这些受试者携带至少一个保护性等位基因。相反,对照402H/Y或402Y具有C2/BF保护性渐进性更低的频率(分别为32%和26%)。换言之,具有高危险的个体由于他们的CFH基因型(其不发生AMD)而在C2/BF基因座处具有高频率的保护性等位基因。
为鉴定对AMD呈保护性的CFH和C2/BF SNP的可能的组合,如个体SNP分析所提示,通过两种方法进行可获得数据的分析;首先通过基于经验的手建模型并然后通过使用Exemplar软件的机器研究模型(图2)。第一种模型是假设(手建)模型,如将通过对数据的经验检验产生(图2A)。模型描述如A图提供,并解释为给出将保护免于AMD的四种可能的基因型组合(导致模型为“真实的”的组合)。当针对样品应用此模型时,对于每一组及组合组分别获得B图中显示的分布(图2B)。病例百分比是模型错误时的病例百分比;换言之,它们不具有如通过模型描述的保护性。对照百分比是的确具有通过模型描述的保护性因子的对照百分比,意为模型是真实的。通过Fisher精确检验将这些分布用于显著性检验并证明p值分别为P=0.00237、P=4.28X10-8和P=7.90X10-10。此后,Exemplar软件按任务生成保护性模型,其通过使用被称为Genetic Algorithms的机器研究方法提供对数据的“最佳拟合”;即,我们检测了机器研究软件可优于手建模型的假设。在Columbia组中研究模型;保留获得的最适模型并然后应用于Iowa组作为独立组中的验证试验(样品外验证)。最后,将模型应用于组合样品组中。在图2C中描述了获得的最佳表现模型。该模型描述了将保护免于AMD的四种可能的单个基因型(或基因型的组合)(即导致模型为“真实的”的组合)。分别对于Iowa、Columbia和组合组的模型表现显示于图2D中。通过Fisher精确检验将这些分布用于显著性检验并证明p值分别为P=7.49 X 10-5、P=2.97 X 10-22和P=1.69 X 10-23。进一步通过将病例和对照名称随机化和执行数据组的3000种排列来验证该方法。实际数据比这些排列中的任何一种更为显著。
总之,通过Exemplar软件对CFH中具有变异的这些单元型的组合分析揭示56%的未受影响的对照包含至少一种保护性的CFH或C2/BF单元型,而74%的AMD受试者在这些基因座处缺少任何保护性的单元型。对数据的检查显示病例中约60%的危险和对照65%的保护性是由于CFH基因座的效应,且其余部分(分别为40%和35%)是由于C2/BF基因座的效应。机器研究模型优于手建模型,这允许显著改进对临床结果的预测。分类和退化树(C&RT)分析提供结果,其支持C2/BF在AMD中的作用,产生与Genetic Algorithm分析类似的树。单独使用Columbia数据组,C&RT模型由于C2/BF等位基因的存在而占病例的37%,使用Iowa数据组占36%,且组合分析产生27%的轻度较弱效应。这些评估均与来自遗传算法分析的C2/BF基因座中35-40%的估计贡献相一致。在实施例2中提供关于方法和具体分析的详尽描述。
BF和C2表达于神经视网膜、RPE和脉络膜中。从患有AMD(年龄为67和94的两位供体)和未患有AMD(年龄为69和82的两位供体)的人供体眼中的分离的RPE、RPE/脉络膜复合物、和神经视网膜中检测到BF和C2基因产物适当大小的PCR扩增子(数据未显示)。BF蛋白质存在于玻璃膜内的眼玻璃疣中,且在脉络膜基质中更不显著(图3A)。Ba(BF衍生肽)免疫反应性更不显著,但明显地存在于与RPE细胞相关的斑中且遍及玻璃膜(图3B)。BF的分布与C3的分布相似(图3C),两者基本上与CFH和C5b-9的分布相同(Hageman等,2005,上文)。
总之,这些数据显示补体途径相关基因C2和BF的变体与AMD显著相关。C2/BF基因座上的保护性单元型在BF基因上包括非同义SNP,其为补体旁路的重要激活子。可得的数据证实了可能通过异常BF活性调控AMD表型的假设。的确,与更常见的精氨酸32形式相比,在32位上含谷氨酰胺的BF蛋白质(来自标记有保护性单元型的两个BF SNP中的一个)已显示具有降低的溶血活性(Lokki和Koskimies(1991)lmmunogenetics 34:242-6)。相同研究未证明R32W变体的功能效应,其在目前研究中与AMD无关。基于这些数据,我们提出酶活性降低的激活剂提供了可导致玻璃疣形成和AMD慢性补体应答的更低危险。该假设与我们之前的提议相一致,我们之前的提议阐述了由于CFH的变异产生的补体旁路级联的不充分抑制导致了视网膜色素上皮/玻璃膜界面上的慢性损伤(Hageman等,2005,上文;Anderson,2002,上文;Hageman,2001,上文)。另一个BF htSNP,L9H位于信号肽。尽管还未直接证明该变体的功能性后果,但该变体可调控BF的分泌。
遗传学和功能性数据暗示BF上的变异可能是所观测到与AMD的关联的原因。这基于以下事实:BF中两个单元型标记变体是非保守的且证明两者中的一个具有直接功能性关联(降低的溶血活性),而C2中的变体是保守改变且为内含子SNP。此外,BF直接参与旁路途径,该途径也包括CFH。不排除C2的直接作用,然而,具体而言是由于C2和BF均调控C3的产生。C2和BF具有几乎相同的模块结构,包括在其羧基端的丝氨酸蛋白酶结构域和在其氨基端的三个CCP组件。对BF是与AMD致病有关的基因的额外支持来自玻璃疣组成的研究。尽管在玻璃疣中发现了大部分参与旁路途径的蛋白质(CFH、BF等),但未发现经典途径中它们的类似物,如C2和C4(Mullins等(2000)Faseb J.14:835-46;Crabb等(2002)Proc.Natl.Acad.Sci.美国99:14682-7)。这些数据进一步暗示由于BF的广泛LD,C2基因中的SNP与AMD相关。
尽管已描述在C2和BF中均存在几个常见功能性变体(Davis和Forristal(1980)J.Lab.Clin.Med.96:633-9;Raum等(1979)Am.J.Hum.Genet.31:35-41.;Alper等(2003)J.Clin.Immunol.23:297-305),但其中大部分是罕见的。已分析欧裔群体中频率高于2%的所有错义等位基因,其判定自SeattleSNPs项目网址(www.pga.mbt.washington.edu/)上可获得的两个基因的重测序数据。此外,对包括我们的单元型H2、H5和H7的实例在内的几个HLA单元型完整测序后,还未发现在任何基因中的额外非同义变体(Stewart等(2004)Genome Res.14:1176-87)。
因为位于HLA基因座处的C2和BF与许多其他基因一起参与炎症,必须考虑到该研究中观察到的相关性是由于相邻基因座的LD的可能性(Larsen和Alper(2004)Curr.Opin.Immunol.16:660-7)。然而,5点证据暗示C2/BF基因座是观察到的相关性的主要贡献者。第一,在HapMap数据中仅观察到C2/BF和相邻的III类基因座间适度的LD。第二,MHC II类基因座和BF单元型H7及H10未显示强烈的LD。第三,在由Klein等(2005)Science 308:385-9进行的全基因组扫描中,MHC基因座未证明与AMD在统计学上显著相关。他们用Affymetrix Mapping 100K Array进行的分析包括跨越MHC基因座的80个SNP;然而,该阵列未包括该研究中所分类的8个SNP中的任何一个(https://www.affymetrix.com/analysis/netaffx/index.affx)。第四,来自HapMap数据的估计重组率显示C2/BF基因座两侧的高度重组区域(Myers等(2005)Science 310:321-324)。最后,关于MHC在AMD中的单独发表的研究证明对I类基因座B*4001(P=0.027)和II类基因座DRBI*1301(P=0.009)的适度保护性(Govcrdhan等(2005)Invest.Ophthalmol.Vis.Sci.46:1726-34)。因为该研究中鉴定到的保护性等位基因以基本上更高的统计显著性与AMD相关,非常可能C2/BF相关是由于MHC中这些和/或其他基因座的LD。
表1.通过DHPLC筛选检测到的BF基因中的序列变
Figure A200780012906D00521
表2.Columbia和Iowa的组合组中C2/BF变体的关联分析
 
基因 dbSNP# 位置 #病例 #对照 X2 P OR 95%Cl
C2 rs9332739 E318D 897 381 21.2 4.14E-06 0.36 0.23-0.56
C2 rs547154 IVS10 894 382 28.7 8.45E-08 0.44 0.33-0.60
BF rs4151667 L9H 903 383 21.3 3.93E-06 0.36 0.23-0.56
BF rs641153 R32Q 551 269 33.7 6.43E-09 0.32 0.21-0.48
BF rs1048709 R150R 892 381 0.12 NS
BF rs4151659 K565E 902 384 1.1 NS
BF rs2072633 IVS17 893 379 4.05 0.044 0.84 0.70-0.99
实施例2.Exemplar统计方法
Sapio Sciences与NCI合作分析基因分型数据。NCI提供10个双等位基因SNP基因分型的总计~1360个样品。该数据以等位基因的数值表示法呈现于Sapio。写一个脚本通过将等位基因转换为基因型数值表示法(“11”变为“1”表示AA,“12”变为“2”表示AB并且“22”变为“3”表示BB,“00”变为不叫(nocall)且转换为“0”)和dedup样品,来把数据转化为Exemplar友好的格式。表型为年龄相关性黄斑变性(AMD)。存在鉴定到的AMD的几个亚类,但对于此分析将数据作为整体使用来确定是否在基于多种AMD表型的一种常见基因型。
Sapio Sciences利用其Exemplar Genotyping Analysis Suite来分析提供的数据。Exemplar进行病例-对照研究的若干基于关联的分析。用于分析的模块为:
·Genetic Algorithm Module(GA Module)—该模块执行机器研究方法来发现基于SNP(模型)研究的逻辑组合。
·Association Study Module(AS Module)-该模块计算许多有用的统计数据如卡方、Yates、Fisher精确度、让步比、相对危险性、连锁不平衡、D′、r2和单元型评估。
Exemplar通常寻找与表现型相关的模型。换言之,模型预测促进获得表现型的因子,而不是保护免于表现型,尽管可从模型中推断出保护性因子。例如,如果模型显示具有...RS001为BB或RS001为AB...的样品与具有表现型相关,则可推断RS001为AA的那些受保护免于该基因型。
Exemplar模型是SNP的逻辑组合。该模型可为手建的以检测假设,或可使用Genetic Algorithm来尝试寻找具有高效用的模型。GeneticAlgorithm是机器研究方法,其优于在大量数据范围内寻找模式。GA使用三分之二、三分之一验证方法。这通过随机分配2/3的病例和对照至训练组中来完成。然后GA在此训练组中研究模型。当它完成研究阶段时,它向试验组应用最佳表现的模型(其余1/3的数据)。向用户返回经过试验和训练的最佳表现模型。在此研究中,尽管查询仅少量的SNP,但大量的样品使得人们很难有效地分辨出对所有数据均适用的模式。为此,利用GA来寻找具有更高效的更复杂的模式。这些类型的模型优于传统方法的优点在于其在进行预测时参与整个基因组上多个基因座的能力。这使得一种模型可鉴定什么是经常与结果相关联的多态性间复杂的相互作用。
该研究独特之处在于它的关注点是发现针对AMD具保护性的模型。由于它偏离寻找附加模型的正常Exemplar方法,需要进行改变来输入数据。经简单的指示Exemplar:病例为对照,且反之亦然,它然后将研究证明为何样品不获得表型的模型。换言之,将发现赋予保护性的SNP的组合。
研究组信息:提供来自两个独立组的数据,Iowa组和Columbia组。Columbia数据是较大的组,总计约830份样品,其中560份为病例且270份为对照。Iowa组具有总计约529份样品,414份病例和115份对照。拥有两个样品组允许建模,以在一组中用GA Module完成且可在另一组中检测样品外所得模型的效率。
研究结果:在输入数据组中生成每一SNP/基因型的多重统计数据。通过建立2x2列联表并对基因型进行适合计数来产生统计数据(注意这不是等位基因计数,但未计算的两种基因型的基因型计数合成为一个值)。2 x 2表中每一单元的值以标题Case True、Case False、Control True、ControlFalse列于表中。所有统计结果为双尾计算结果。
表3至表6依次显示Iowa和Columbia组中的统计数据。注意:“Category”列是基因型,其中:1对应AA,2对应AB且3对应BB。表7显示组合组中的统计数据。
表3.Columbia和Iowa的并排卡方统计
表4.Columbia和Iowa的并排卡方Yates统计
Figure A200780012906D00552
表5.Columbia和Iowa的并排Fishers精确统计
Figure A200780012906D00561
表6.Columbia和Iowa的并排让步比统计
表7.组合组卡方统计
Figure A200780012906D00571
表8.组合组卡方Yates统计
Figure A200780012906D00581
表9.组合组Fishers精确统计
表10.组合组让步比统计
Figure A200780012906D00601
显然这些SNP中的许多在两组中都是在统计学高度显著的。这主要由于先前的信息,其导致它们为本研究的选择。尤其值得注意的是RS1061170为3(BB a.k.a T/T)且fishers p<4.81E-20,说明它作为保护性基因型的强烈可能性。在并排比较中,Iowa和Columbia组间存在一些差异变得明显。
为进一步评估哪一个SNP/基因型是保护性的或起作用的,使用Fishers作为基因型渗透方差(genotype penetration variance)的基础。为此目的计算病例和对照的基因型百分比并计算它们差异的绝对值。表11提供该信息并按最高频率差异的顺序排序。
表11.基因型渗透方差
Figure A200780012906D00611
假设保护性模型:在该研究中,初步工作显示将保护免于AMD的SNP可能的组合。为验证该假设,每一NCI说明构建一个手建模型。模型图显示于图2A中。可将该模型编写为IF语句,如下:
如果RS547154为G/A并且RS1061170为T/T或
RS547154为G/A并且RS 1061170为C/C或
RS4151667为T/A并且RS 1061170为C/T或
RS4151667为T/A并且RS 1061170为C/C
那么此人受保护免于AMD。
因此,该模型给出将保护免于AMD的基因型的四种可能组合(导致模型为“真实的”的组合):
1.RS547154为G/A并且RS1061170为T/T
·对照8.82%,病例5.45%
2.RS547154为G/A并且RS 1061170为CIC
·对照7.22%,病例1.93%
3.RS4151667为T/A并且RS 1061170为CIT
·对照4.8%,病例2.02%
4.RS4151667为T/A并且RS 1061170为C/C
·对照3.47%,病例.79%
当针对样品应用该模型时,组合的Iowa和Columbia组产生以下结果:
·794份病例不具有保护性因子(模型为错误的)...90.12%
·88份对照的确具有保护性因子(模型为正确的)...23.52%
·病例中的87份的确具有保护性因子...9.88%
·对照中的286份不具有保护性因子...76.47
注意:通过针对组合组应用模型并追踪其真正(TP)率、假负(FN)率、假正(FP)率和真负(TN)率以计算所有模型的统计数据。然后将这些数字置于2 x 2表中,从中生成所有统计数据。表12显示每一组的统计数据。
表12.NCI假设的保护性模型统计数据
Figure A200780012906D00621
遗传算法(GA)衍生模型:在查看是否GA Module可发现更好的SNP组合的尝试中,设定GA模块任务为在倒置数据中研究模型(来研究保护性模型)。使用多种参数设定,包括:
·模型类型:表明模型是否具有“和”和“或”、仅“和”、或仅“或”。
·模型大小:表明模型中可含有多少SNP的上限。
·GA特殊参数:如代(generation)、模型数等。
一般而言,小尺寸的AND唯一模型是优选的。为此,原因有两重。第一,AND唯一模型要求对模型真实的其所有SNP是真实的,那么它的解释因而不含糊,然而具有OR的模型不要求为模型存在的所有SNP是真实的,其引入了不确定性。第二,因为具有更少的SNP用来评估,所以更小的模型更易于解释。
Exemplar利用三分之二、三分之一验证方法以避免输入数据与想要的结果(具有更广泛应用的结果)过匹配。
另外,假设有两个不同的研究组,这允许模型仅建立在Columbia数据上并允许针对Iowa组检测所得模型。如果模型表现在两组上是一致的,这就强有力说明了模型的广泛应用性。考虑到上文统计数据部分中讨论的两组间的有趣统计数据差异,这将是特别有挑战的。假设有如此变异,非常可能GA将找到Columbia数据上具有非常高适合度的模型,但将在Iowa数据上表现性差。
GA的确找到了在Columbia、Iowa和组合数据组上表现良好的模型。Columbia数据上的模型表型优于Iowa数据上的模型表现,因为期望假设模型是在Columbia数据上训练(train)过的。但是,假设GA没有Iowa数据的先验知识并且两组间关键SNP间具有显著统计学差异,模型表现是值得注意的。所得的最佳模型优于组合组(RS1061170)上的手建假设模型。起初,所述模型包括具有“INDELTT是纯合的以及RS547154是GG”的额外部分,但根据进一步检查,确定该部分对模型解释是无关的并因此将其去除以产生具有相同表现的模型。最终模型的图可见于图2C。
该任务的GA特异选项如下:
模型:1500-这是GA内部建立作为发展新一代模型的基础的模型数目。
重复:25-这是模型仔细检查以发现解决办法的进化重复的数目。
模型大小:5-这允许模型在单个模型中出现具有最多16个基因型。
模型类型:和/或-这使GA建立可以使用“和”以及“或”的模型。
该模型可以编写为IF语句,如下:
如果RS1048709是G/G并且RS1061170是TAT或
RS547154是G/A或
RS4151667是T/A或
INDELTT是+/+
那么此人受保护免于AMD。
该模型给出了四种可能的个体基因型或基因型组合,其将保护免于AMD(导致模型为“真实的”的组合):
1.RS1048709为G/G且RS1061170为T/T
·发生于14.20%病例中,34.31%对照中
2.RS547154为G/A
·发生于9.6%%病例中,18.32%对照中
3.RS4151667为T/A
·发生于4.2%病例中,9.92%对照中
4.INDELTT为+/+
·发生于1.45%病例中,6.86%对照中
当针对样品应用该模型时,组合的Iowa和Columbia组产生以下结果:
·病例的682例不具有保护性因子(74.78%),230例具有。
·对照的204例具有保护性因子(55.74%),162例不具有。
表13显示每一组的统计数据。GA在该表(board)上表现良好。总之,具有由模型描述的保护性因子的那些组患有AMD的可能性比没有保护性因子的那些组低3.6581倍。
表13.来自模型统计数据的遗传算法
Figure A200780012906D00641
假设两组间若干关键SNP具有明确的统计学差异,发现将更精密地预测结果/保护性的单个模型对人和机器研究一样是个挑战。手建模型表现优良,并且有趣的是鉴定了SNP的相同杂合配对,如GA所为(RS547154为AB,RS4151667为AB),包括与这些SNP一起的相同让步比(OR)。
尽管任务困难,GA在样品检测结果上表现良好(Fishers Iowap<0.0000749)。GA在所有组上优于手建模型。但是,手建模型做了十分充分的预测结果的工作。检测了该模型的其他变体,但不能改进它的表现。假设有SNP/基因型/逻辑操纵基因的许多可能组合,因此期望机器研究方法的值,其在合理的时间段内可检测数万模型变体。
给定单SNP的高统计学显著性(RS 1061170作为T/T:x2=97.25),可推断通过其自身可以预测AMD的危险。为了检测是单SNP还是多基因座模型具有预测一般群体中保护性的潜在适用性,在数据上进行排列(permutation)测验。排列测验显示单SNP比GA或手建模型更可能产生具有数据随机混合的在统计学上显著的结果,3000次排列后所述单SNP具有4.8153的平均卡方分数;相对的,GA为3.3157且手建模型为1.2207。在让步比评估中,单SNP具有625次排列,OR>1.5;相对的,GA模型为133且手建模型为46。手建模型简单地代表在任何样品中很少出现的基因型组合。总而言之,GA模型显示最真实的病例对照表现和排列结果。
当一起看模型统计学、ROC曲线和排列测验时,呈现出预测结果的多基因座模型方法优于不同组上任何单个基因座。
结论
最后,该研究延伸并精练了补体旁路在AMD病理学中的用途,并进一步加强了提出的感染和/或炎症在该常见疾病中起主要作用的模型(Hageman等,2005,上文;Anderson等,2002,上文;Hageman等,2001,上文)。
实施例3 施用保护性BF或C2蛋白质以预防AMD的发生
受试者呈现AMD的病征和/或症状,包括玻璃疣。所述受试者检验为BF中保护性多态性R32Q和L9H,和C2中IVS 10和E318D阴性。推荐用保护性BF蛋白质(具有R32Q多态性)处理该受试者。经静脉内向受试者施用足以产生9到31mg/dL的BF血清浓度的保护性BF(在盐水中)的量,一月一次,进行6个月。这时,监测所述受试者的玻璃疣及AMD的其他病征和/或症状的存在。如果AMD的病征和/或症状没有发展,不确定地一月一次继续施用保护性BF,如指出的频繁地监测患者的临床情况,但至少每6个月一次。
在其他临床方案中,经鼻内每天一次施用保护性BF蛋白质以提供对蛋白质的保护性效应更持久的效果(exposure)。
本说明书中提及的所有出版物和专利申请指示本发明属于的领域中那些技术人员的技术水平。所有出版物和专利申请都在此处以相同程度引用作为参考,就如同每一单个出版物或专利申请明确和单独地指出被引用作为参考一样。
考虑到许多可能实施方案(其中可应用我们发明的原则),应认识到有举例说明的实施方案仅是本发明的优选实施例并不应认为是在本发明范围上的限制。相反地,本发明的范围通过以下权利要求进行定义。我们因此请求保护这些权利要求的范围和精神内的全部发明。

Claims (18)

1.评估特征为补体旁路级联失调的疾病发生或可能进展的危险的方法,所述疾病包括人受试者中的黄斑变性,所述方法包括以下步骤:
i)从人受试者中获得生物学样品;
ii)分析所述样品以测定所述受试者是否携带一种或多种:
a)补体因子B(BF)基因rs641153处的A或G,或BF蛋白质第32位的R或Q;
b)BF基因rs4151667处的A或T,或BF蛋白质第9位的L或H;
c)C2基因rs547154处的G或T;和,
d)C2基因rs9332379处的C或G,或C2蛋白质第318位的E或D。
2.权利要求1的方法,其还包含确定所述受试者是否携带一种或多种:
a)补体因子H(CFH)基因中的delTT;和,
b)CFH基因rs1061170处的C或T,或CFH蛋白质第402位的Y或H。
3.权利要求1的方法,其中所述受试者无黄斑变性的症状。
4.权利要求1的方法,其中所述受试者具有黄斑变性的症状。
5.权利要求1的方法,其中所述样品是易得到的体液。
6.权利要求1的方法,其包括检测所述受试者细胞的基因型。
7.权利要求1的方法,其包括检测所述受试者中的蛋白质变体。
8.权利要求1的方法,其包括检测来自所述受试者细胞的mRNA。
9.权利要求6的方法,其还包括确定所述受试者对所述多态性是纯合的还是杂合的。
10.评估特征为补体旁路级联失调的疾病发生或可能进展危险的试剂盒,所述疾病包括人受试者中的黄斑变性,所述试剂盒包含用于在来自所述受试者的样品中检测以下一种或多种多态性、或一种或多种等位基因变体的试剂:
a)补体因子B(BF)基因rs641153处的A或G,或BF蛋白质第32位的R或Q;
b)BF基因rs4151667处的A或T,或BF蛋白质第9位的L或H;
c)C2基因rs547154处的G或T;和,
d)C2基因rs9332379处的C或G,或C2蛋白质第318位的E或D。
11.权利要求10的试剂盒,其包含用于在来自所述受试者的样品中检测以下一种或多种多态性、或一种或多种等位基因变体的试剂:
a)补体因子H(CFH)基因中的delTT;
b)CFH基因rs1061170处的C或T,或CFH蛋白质第402位的Y或H。
12.权利要求10的试剂盒,其包含用于检测两种或多种多态性、或两种或多种等位基因变体的试剂。
13.权利要求10的试剂盒,其包含检测所述多态性的寡核苷酸。
14.权利要求10的试剂盒,其还包含用于扩增靶多核苷酸序列的试剂,其中所述靶序列包含所述多态性。
15.权利要求10的试剂盒,其包含固定在固体支持物上的寡核苷酸。
16.权利要求10的试剂盒,其包含特异性识别并结合所述等位基因变体的特异结合蛋白质。
17.微阵列,其包含能够与一个或多个具有保护性多态性的核酸分子在严格条件下杂交的寡核苷酸探针,所述保护性多态性选自:
a)BF(rs641153)中的R32Q;
b)BF(rs4151667)中的L9H;
c)C2(rs547154)中的IVS10;和,
d)C2(rs9332739)中的E318D。
18.权利要求17的微阵列,其还包含能够与一个或多个具有多态性的核酸分子在严格条件下杂交的寡核苷酸探针,所述多态性选自:
a)CFH中的delTT多态性;
b)BF中的R150R多态性;和,
c)CFH中的Y402H多态性。
CN200780012906.3A 2006-02-13 2007-02-13 补体调控基因中预测年龄相关性黄斑变性的变体 Pending CN101421409A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US77298906P 2006-02-13 2006-02-13
US60/772,989 2006-02-13

Publications (1)

Publication Number Publication Date
CN101421409A true CN101421409A (zh) 2009-04-29

Family

ID=38372062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780012906.3A Pending CN101421409A (zh) 2006-02-13 2007-02-13 补体调控基因中预测年龄相关性黄斑变性的变体

Country Status (8)

Country Link
EP (1) EP1989319A4 (zh)
JP (1) JP5290772B2 (zh)
CN (1) CN101421409A (zh)
AU (1) AU2007215218B2 (zh)
CA (1) CA2638916A1 (zh)
IL (1) IL193396A (zh)
NZ (1) NZ570431A (zh)
WO (1) WO2007095185A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102707068A (zh) * 2012-05-31 2012-10-03 北京大学 补体h因子用作甲基苯丙胺成瘾患者的基因表达产物中的应用
CN106999559A (zh) * 2014-12-19 2017-08-01 儿童医院医疗中心 与移植相关血栓性微血管病相关的方法和组合物
CN109082460A (zh) * 2018-09-27 2018-12-25 领航基因科技(杭州)有限公司 应用于snp分型的非竞争性探针设计方法、检测方法及应用

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8012683B2 (en) 2006-02-13 2011-09-06 University Of Iowa Research Foundation Variants in complement regulatory genes predict age-related macular degeneration
US20120141994A1 (en) * 2009-04-29 2012-06-07 Deangelis Margaret M Methods and compositions for prognosing and detecting age-related macular degeneration
WO2011006161A2 (en) 2009-07-10 2011-01-13 The Regents Of The University Of Michigan Compositions and methods for diagnosing and treating macular degeneration
US20110104154A1 (en) * 2009-10-30 2011-05-05 Alcon Research, Ltd. Single nucleotide polymorphisms and genes associated with age-related macular degeneration
US9056874B2 (en) 2012-05-04 2015-06-16 Novartis Ag Complement pathway modulators and uses thereof
EP2970269B1 (en) 2013-03-14 2017-04-19 Novartis AG 2-(1h-indol-4-ylmethyl)-3h-imidazo[4,5-b]pyridine-6-carbonitrile derivatives as complement factor b inhibitors useful for the treatment of ophthalmic diseases
EP3089963A1 (en) 2013-10-30 2016-11-09 Novartis AG 2-benzyl-benzimidazole complement factor b inhibitors and uses thereof
WO2015120130A1 (en) * 2014-02-07 2015-08-13 Novartis Ag Impact of genetic factors on disease progression and response to anti-c5 antibody in geographic atrophy

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2548112B2 (ja) 1983-09-02 1996-10-30 シンジェン,インコーポレイテッド 担体およびオリゴヌクレオチドの合成
GB8810400D0 (en) 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
US5474796A (en) * 1991-09-04 1995-12-12 Protogene Laboratories, Inc. Method and apparatus for conducting an array of chemical reactions on a support surface
US5554501A (en) 1992-10-29 1996-09-10 Beckman Instruments, Inc. Biopolymer synthesis using surface activated biaxially oriented polypropylene
EP0758403B1 (en) 1994-05-05 1998-06-24 Beckman Instruments, Inc. Oligonucleotide repeat arrays
US5985567A (en) 1997-08-15 1999-11-16 Beckman Coulter, Inc. Hybridization detection by pretreating bound single-stranded probes
US6013789A (en) 1998-02-20 2000-01-11 Beckman Coulter, Inc. Covalent attachment of biomolecules to derivatized polypropylene supports
JP2008520242A (ja) * 2004-11-18 2008-06-19 イェール ユニバーシティ 視覚障害を処置するための方法および組成物

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102707068A (zh) * 2012-05-31 2012-10-03 北京大学 补体h因子用作甲基苯丙胺成瘾患者的基因表达产物中的应用
CN106999559A (zh) * 2014-12-19 2017-08-01 儿童医院医疗中心 与移植相关血栓性微血管病相关的方法和组合物
CN109082460A (zh) * 2018-09-27 2018-12-25 领航基因科技(杭州)有限公司 应用于snp分型的非竞争性探针设计方法、检测方法及应用
CN109082460B (zh) * 2018-09-27 2021-07-13 领航基因科技(杭州)有限公司 应用于snp分型的非竞争性探针设计方法、检测方法及应用

Also Published As

Publication number Publication date
JP2009526524A (ja) 2009-07-23
WO2007095185A3 (en) 2008-09-25
IL193396A (en) 2013-03-24
EP1989319A2 (en) 2008-11-12
AU2007215218A1 (en) 2007-08-23
EP1989319A4 (en) 2009-11-11
IL193396A0 (en) 2009-05-04
AU2007215218B2 (en) 2013-09-19
NZ570431A (en) 2011-12-22
JP5290772B2 (ja) 2013-09-18
WO2007095185A2 (en) 2007-08-23
CA2638916A1 (en) 2007-08-23

Similar Documents

Publication Publication Date Title
CN101421409A (zh) 补体调控基因中预测年龄相关性黄斑变性的变体
US9063139B2 (en) Variants in complement regulatory genes predict age-related macular degeneration
US20100273720A1 (en) Protective Complement Proteins and Age-Related Macular Degeneration
Baird et al. Analysis of the Y402H variant of the complement factor H gene in age-related macular degeneration
Zhou et al. Variation atNOD2/CARD15in Familial and Sporadic Cases of Crohn's Disease in the Ashkenazi Jewish Population
US20080305967A1 (en) Genetic Markers Associated with Endometriosis and Use Thereof
JP2008534009A (ja) 大腸癌診断用の多重snp、それを含むマイクロアレイ及びキット、並びにそれを利用した大腸癌の診断方法
EP1996214B1 (en) Complement proteins for protection against age-related macular degeneration
Castilho et al. High frequency of partial DIIIa and DAR alleles found in sickle cell disease patients suggests increased risk of alloimmunization to RhD
US20200087728A1 (en) Genetic markers associated with endometriosis and use thereof
JP2005524388A (ja) パクリタキセル応答性予測の一塩基多型及びそれらの組合せ
Sundaramurthy et al. Homozygosity mapping guided next generation sequencing to identify the causative genetic variation in inherited retinal degenerative diseases
Braig et al. Linkage of autosomal dominant common variable immunodeficiency to chromosome 5p and evidence for locus heterogeneity
US20090035781A1 (en) Methods and compositions for identifying a subject with an increased risk of gram negative bacterial infection
EP2707497B1 (en) Detecting the brachyspina mutation
US6656691B2 (en) TCF-1 nucleotide sequence variation
CA2547033A1 (en) Ntrk1 genetic markers associated with progression of alzheimer&#39;s disease
KR102141607B1 (ko) 개의 망막위축증 조기 예측 또는 진단용 조성물
Murray Utility of Gene Sequencing in Detecting Monogenic Disorders in Patients with Chronic Kidney Disease
KR20190102674A (ko) 위 변연부 림프종의 진단용 마커 및 이의 용도
Pyatt Microsatellite instability and large, genomic alterations of DNA mismatch repair genes in the etiology of HNPCC and sporadic tumors
JP2007503806A (ja) ヒト肥満感受性遺伝子およびその使用
JP2011239697A (ja) パーキンソン病発症リスクマーカー

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication