发明背景
本发明是一种测定单个个体内或同时被测试的多个个体的每一个内天然杀伤细胞免疫球蛋白样受体或“KIR”基因的序列的方法。
天然杀伤细胞
天然杀伤(NK)细胞是先天免疫系统的一部分,是为了针对感染以及肿瘤的早期防卫而特化的。作为它们杀伤肿瘤细胞靶点的能力的结果首次发现了NK细胞。不同于细胞溶解性T细胞,NK细胞可以以非主要组织相容性复合体(非-MHC)限制性的方式杀伤靶点。作为先天免疫系统的重要部分,NK细胞占人体中总循环淋巴细胞的约10%。
由于它们杀伤其他细胞的能力,NK细胞通常处于紧密的控制之下。身体中的所有正常细胞在它们的表面表达MHC I类分子。这些分子保护正常细胞免于被NK细胞杀伤,因为它们充当NK细胞上存在的许多受体的配体。在它们的表面缺乏足够的I类MHC的细胞被NK细胞识别为“异常的”并被杀伤。与杀伤异常细胞同时地,NK细胞也引发细胞因子应答。
天然杀伤细胞构成了对抗癌症和病毒感染的快速响应力量。这些特化的白细胞起源于骨髓,在血液中循环,在脾脏和其他淋巴组织中浓缩。NK细胞的活性关键在于人类白细胞抗原(HLA)蛋白质的子集,所述蛋白质在健康细胞的表面上出现,但是在病毒和癌症削弱的细胞上脱落。HLA蛋白质由主要组织相容性复合体(MHC)基因编码。当NK细胞遭遇缺乏HLA蛋白质的细胞时,它们攻击并破坏这些细胞,从而防止细胞进一步传播病毒或癌症。NK细胞通过它们的保护性应答的迅速性和广度不同于其他免疫系统细胞。其他白细胞更慢地起作用,并且靶向特定的病原体——癌症、病毒或细菌,而不是一般受损的细胞。
KIR
基因
天然杀伤细胞免疫球蛋白样受体(KIR)基因家族是编码天然杀伤(NK)细胞上存在的重要蛋白质的几种受体家族之一。KIR基因的子集,即抑制性KIR与I类HLA分子相互作用,I类HLA分子是在人类MHC内编码的。这样的相互作用容许NK细胞与身体的其他细胞之间的通信,所述其他细胞包括正常的、病毒感染的或癌性的细胞。NK细胞上的KIR分子与所有其他细胞上的I类HLA分子之间的这种通信帮助确定身体内的细胞是否被NK细胞识别为自身的或是非自身的。被认为“非自身的”细胞被NK细胞靶向杀伤。
KIR
基因和蛋白质结构
KIR基因家族由16种基因组成(KIR2DL1 、 KIR2DL2 、 KIR2DL3 、 KIR2DL4 、 KIR2DL5A 、 KIR2DL5B 、 KIR2DS1 、 KIR2DS2 、 KIR2DS3 、 KIR2DS4 、 KIR2DS5 、 KIR3DL1/S1 、 KIR3DL2 、 KIR3DL3 、 KIR2DP1
和KIR3DP1)。KIR基因簇位于染色体19上定位的白细胞受体复合体(LRC)的100-200kb区域内(19q13.4)(Trowsdale J.(2001)Genetic and functional
relationships between MHC and NK receptor genes. Immunity, Sep;15(3):363-374)。基因复合体被认为是通过哺乳动物和啮齿动物之间的进化分离之后发生的基因多重化(duplication)事件而出现(Barten R., et al.(2001)Divergent and convergent evolution of NK-cell receptors. Trends
Immunol., Jan;22(1):52-57)。KIR基因以头对尾的方式排列,除了3DP1和2DL4之间的一个14 kb序列之外,仅2.4 kb的序列来分隔基因。由于KIR基因通过基因多重化而出现,它们在序列上是非常相似的,相互显示了90-95%的同一性。人类个体在他们所遗传的KIR基因的数量和类型方面不同;个体和种群内的KIR基因型可以是十分不同的(Parham P.(2005)Immunogenetics of killer cell immunoglobulin-like
receptors. Molecular immunology, Feb;42(4):459-462;和Single RM, et al.(2007)Global diversity and evidence for coevolution of KIR and
HLA, Nature genetics, Sep;39(9):1114-1119)。在染色体水平上,存在着两种截然不同的KIR单元型(参见附图1,改编自Martin et al. Immunogenetics.(2008)Dec;60(12):767-774)。A单元型除了2DS4之外不含有刺激基因(2DS和3DS1),没有2DL5基因并且没有2DL2基因。B单元型在基因内容上是更为可变的,不同的B单元型含有不同数量的刺激基因,一个或两个2DL5基因,等等(Martin MP, et al.(2008)KIR haplotypes defined by segregation analysis in 59
Centre d'Etude Polymorphisme Humain(CEPH)families. Immunogenetics, Dec;60(12):767-774.)。
所有的KIR蛋白质都锚定在细胞膜上,具有两个或三个细胞外免疫球蛋白样结构域和细胞质的尾部。九种KIR基因(KIR2DL和KIR3DL)编码具有长的细胞质尾部的蛋白质,其含有基于酪氨酸的免疫抑制性基序(ITIM)。当细胞外结构域与它的配体接触时,这些KIR蛋白质可以向天然杀伤细胞发送抑制性信号。其余KIR基因编码具有短的细胞质尾部的蛋白质。这些蛋白质通过衔接分子样DAP12发送激活信号。(Snyder MR et al. (2004)Stimulatory killer Ig-like receptors modulate T cell activation
through DAP12-dependent and DAP12-independent mechanisms. J Immunol. Sep
15;173(6):3725-3731;和Carr
WH et al.(2007)Cutting Edge: KIR3DS1, a gene implicated in resistance to
progression to AIDS, encodes a DAP12-associated receptor expressed on NK cells
that triggers NK cell activation. J Immunol. Jan 15;178(2):647-651)。
在附图2中显示了KIR受体结构和每种KIR受体的I类HLA配体的同一性。(改编自Parham P. et
al., Alloreactive killer cells: hindrance and help for hematopoietic
transplants. Nature Rev. Immunology.(2003)3:108-122)。杀伤细胞免疫球蛋白样受体(KIR)的命名描述了细胞外免疫球蛋白样结构域的数量(2D或3D)以及细胞质尾部的长度(L是长的,S是短的)。每种免疫球蛋白样结构域用圆圈表示,细胞质尾部中每个基于免疫受体酪氨酸的抑制性基序(ITIM)用长方形表示,并且跨膜区域中每个带正电的残基用菱形表示。刺激性KIR用斜体表示(Parham
P. et al., Alloreactive killer cells: hindrance and help for hematopoietic
transplants. Nature Rev. Immunology.(2003)3:108-122)。
KIR和它们的I类HLA配体之间相互作用的强度可以取决于KIR序列和HLA序列两者。虽然HLA区域已经被研究了超过40年,KIR分子在1990年代中期才被首次描述(作为NKB1)(Lanier et al.(1995)The NKB1 and
HP-3E4 NK cells receptors are structurally distinct glycoproteins and
independently recognize polymorphic HLA-B and HLA-C molecules. J Immunol.
Apr 1;154(7):3320-3327 以及
Litwin V. et al.(1994)NKB1: a natural killer cell receptor involved in the
recognition of polymorphic HLA-B molecules. J Exp Med. Aug 1;180(2):537-543)。发现的第一年主要致力于描述不同的KIR基因,并且开发了一些方法来测定个体的KIR基因型。利用这些方法,已经显示了KIR基因与自身免疫性疾病和同种异体造血细胞移植之后接受者存活之间的相关性(Parham P.(2005)MHC class I
molecules and KIRs in human history, health and survival. Nature reviews, Mar;5(3):201-214)。现在清楚的是,每种KIR基因具有超过一种序列;也就是说,由于单核苷酸多态性(SNP)、以及某些情况下编码序列内的插入或删除,每种KIR基因具有可变的序列。研究显示,KIR3DL1多态性可能不仅影响KIR3DL1在天然杀伤细胞上的表达水平,还影响KIR3DL1与它的配体的结合亲和性(Gardiner
CM et al.(2001)Different
NK cell surface phenotypes defined by the DX9 antibody are due to KIR3DL1 gene
polymorphism. J Immunol. Mar 1;166(5):2992-3001;Pando MJ et al.(2003)The protein made from a common allele of KIR3DL1(3DL1*004)is poorly
expressed at cell surfaces due to substitution at positions 86 in Ig domain 0
and 182 in Ig domain 1. J Immunol. Dec 15;171(12):6640-6649;O'Connor GM, et al.(2007)Functional polymorphism of the KIR3DL1/S1 receptor on
human NK cells. J Immunol. Jan 1;178(1):235-241;以及Thananchai H et al.(2007)Cutting Edge: Allele-specific and peptide-dependent
interactions between KIR3DL1 and HLA-A and HLA-B. J Immunol Jan 1;178(1):33-37)。
KIR
与疾病的相关性
设计以研究KIR在人类疾病中的作用的研究显示了各种KIR基因与病毒感染例如CMV、HCV和HIV、自体免疫疾病、癌症和先兆子痫的相关性(Parham
P.(2005)MHC
class I molecules and KIRs in human history, health and survival. Nature
reviews, Mar;5(3):201-214)。在关于对炎症性自体免疫性肠病克罗恩病的遗传易感性的新近研究中发现,KIR2DL2与KIR2DL3杂合以及C2配体纯合的患者对疾病敏感,而C1配体是保护性的。(Hollenbach JA et
al.(2009)Susceptibility
to Crohn's Disease is mediated by KIR2DL2/KIR2DL3 heterozygosity and the HLAC
ligand. Immunogenetics. Oct;61(10):663-71)。关于KIR和急性骨髓性白血病(AML)的非亲缘造血细胞移植(HCT)的其他研究显示了与A/A供体相比,B/x供体的显著更高3年的总体存活率以及无复发风险存活方面30%的总体改善(Cooley
S, et al.(2009)Donors with group B KIR haplotypes improve relapse-free
survival after unrelated hematopoietic cell transplantation for acute
myelogenous leukemia. Blood. Jan 15;113(3):726-732;和Miller JS, et al.(2007)Missing KIR-ligands is associated with less relapse and
increased graft versus host disease(GVHD)following unrelated donor allogeneic HCT. Blood,
109(11):5058-5061)。已经根据对患者与对照的KIR基因型的认识进行了这样的研究,但是没有对等位基因水平的KIR进行该研究。已经显示了许多特定的HLA等位基因在人类疾病中是重要的(例如,HLA-DR3和HLA-DR4与I型糖尿病相关,HLA-DR8与青年类风湿性关节炎相关),在等位基因水平上分型KIR的能力将细化将KIR与人类疾病相关的研究。
附图简述
图1是KIR单元型的示意图。
图2是KIR受体的结构以及它们的I类HLA配体的同一性的示意图。
图3图示了所有KIR基因的外显子5的前半序列的核苷酸比对。
图4图示了所有KIR基因的外显子5的后半序列的核苷酸比对。
发明详述
I.
定义
术语“等位基因”是指基因的序列变体。至少一个遗传学的差异可以构成等位基因。对于KIR基因,一般多个遗传学差异构成等位基因。
术语“扩增子”是指核酸分子,其含有目标核酸序列的全部或片段,并且其是作为任何适合的扩增方法的体外扩增的产物形成的。
术语“多态性”是指一种情况,其中特定核苷酸序列、或编码的氨基酸序列的两种或更多种变体可以在群体中找到。多态性位置是指在核酸中发生区分变体的多态性核苷酸的位置。“单核苷酸多态性”或SNP是指由单个核苷酸组成的多态性位点。
术语“单元型”是指在个体中同一染色体上不同位置(座位或基因)处的等位基因的组合。
对于特定的基因,术语“基因型”是指个体或样品中含有的基因的等位基因的总和。
术语“测定”KIR基因的“基因型”是指测定受试者中存在的KIR基因的个体等位基因中存在的多态性。
术语“目标区域”或“目标序列”是指样品中要研究的多核苷酸序列。在本发明的上下文中,目标序列是来自个体的样品中含有的KIR基因序列。
术语“寡核苷酸”是指短核酸,一般长度十个或更多个核苷酸。寡核苷酸通过本领域已知的任何适合的方法来制备,例如,在Narang
et al.(1979)Meth.
Enzymol. 68:90-99;Brown et al.(1979)Meth. Enzymol.
68:109-151;Beaucage et al.(1981)Tetrahedron
Lett. 22:1859-1862;Matteucci
et al.(1981)J.
Am. Chem. Soc. 103:3185-3191中描述的直接化学合成;或本领域已知的任何其他方法。
术语“引物”是指寡核苷酸,其能够作为沿着模板核酸的互补链的核酸合成的起始点。与模板核酸的子序列至少部分互补的引物一般足以与模板核酸杂交和发生延伸。虽然任选地使用其他的引物长度,引物一般包含长度约6到约100个核苷酸范围的杂交区域,最通常地长度在15到35个核苷酸之间。用于给定目标序列扩增的适合引物的设计是本领域公知的,并且在此处引用的文献中描述。用于平行克隆扩增和测序的适合引物的设计在例如美国申请公开号
20100086914中描述。
“热稳定核酸聚合酶”或“热稳定聚合酶”是一种聚合酶,当与例如来自大肠杆菌的聚合酶比较时,其在高温下是相对稳定的。如在此使用的,热稳定的聚合酶适合在聚合酶链式反应(“PCR”)典型的温度循环条件下使用。
术语引物的“衔接子区域”是指处在5'端的引物序列的区域,其对于在本发明的方法中获得的KIR扩增子是通用的,并且提供了与用于乳剂PCR的微粒(即,珠子)或其他固体表面上存在的寡核苷酸退火的序列。衔接子区域可以进一步充当测序引物结合的位点。衔接子区域一般长度从15到30个核苷酸。
术语“库关键标签”是指引物序列内衔接子区域的部分,其用来区分KIR特异性引物和对照引物。
术语“多通道识别标签(multiplex
identification tag)”、“个体识别标签”或“MID”可互换地使用,是指引物中存在的核苷酸序列,充当获自特定受试者或样品的DNA的标志物。
术语“核酸”是指核苷酸(例如,核糖核苷酸和脱氧核糖核苷酸,天然的和非天然的)的聚合物,这样的聚合物是DNA、RNA和它们的子类,例如,cDNA、mRNA,等等。核酸可以是单链的或双链的,并且一般含有5'-3'磷酸二酯键,尽管在某些情况下,核苷酸类似物可以具有其他键。核酸可以包括天然发生的碱基(腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶和胸腺嘧啶)以及非天然的碱基。非天然碱基的实例包括在例如Seela
et al.(1999)Helv.
Chim. Acta 82:1640中描述的那些。在核苷酸类似物中使用的某些碱基作为解链温度(Tm)修饰物。例如,其中一些包括 7-脱氮嘌呤(例如,7-脱氮鸟嘌呤、7-脱氮腺嘌呤,等等)、吡唑并[3,4-d] 嘧啶、丙炔基-dN(例如,丙炔基-dU、丙炔基-dC,等等)等(参见,例如,美国专利号
5,990,303)。其他代表性的杂环碱基包括,例如,次黄嘌呤、肌苷、黄嘌呤;2-氨基嘌呤、2,6-二氨基嘌呤、2-氨基-6-氯嘌呤、次黄嘌呤、肌苷和黄嘌呤的8-氮杂衍生物;腺嘌呤、鸟嘌呤、2-氨基嘌呤、2,6-二氨基嘌呤、2-氨基-6-氯嘌呤、次黄嘌呤、肌苷和黄嘌呤的7-脱氮-8-氮杂衍生物;6-氮杂胞嘧啶;5-氟胞嘧啶;5-氯胞嘧啶;5-碘胞嘧啶;5-溴胞嘧啶;5-甲基胞嘧啶;5-丙炔胞嘧啶;5-溴乙烯尿嘧啶;5-氟尿嘧啶;5-氯尿嘧啶;5-碘尿嘧啶;5-溴尿嘧啶;5-三氟甲基尿嘧啶;5-甲氧基甲基尿嘧啶;5-乙烯基尿嘧啶;5-丙炔基尿嘧啶,等等。
术语“天然核苷酸”是指在细胞的DNA和RNA中天然存在的含有嘌呤和嘧啶的核苷酸:胞嘧啶(C)、腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)。
术语“非天然核苷酸”或“修饰的核苷酸”是指含有修饰的碱基、糖或磷酸基团的,或在其结构中包括非天然部分的核苷酸。非天然的核苷酸可以作为核酸聚合物的部分或在将修饰的核苷酸掺入到核酸聚合物中之前通过核苷酸的化学修饰来产生。在另一种方法中,非天然的核苷酸可以通过在核酸的酶或化学合成期间将修饰的核苷三磷酸掺入到聚合物链中来产生。非天然核苷酸的实例包括双脱氧核苷酸、生物素化的、胺化的、脱氨基的、烷基化的、苄化的和荧光团标记的核苷酸。
术语“核酸聚合酶”或简称“聚合酶”是指酶,例如,DNA聚合酶,其催化核苷酸向核酸中的掺入。示范性的热稳定的DNA聚合酶包括来自嗜热栖热菌(Thermus thermophilus), Thermus caldophilus, 栖热菌物种(Thermus sp.)ZO5的那些(参见,例如,美国专利号 5,674,738)以及栖热菌物种ZO5聚合酶(参见,例如,2007年10月17日提交的美国专利申请号 11/873,896),水生栖热菌(Thermus aquaticus)、黄栖热菌(Thermus
flavus)、丝状栖热菌(Thermus filiformis)、栖热菌物种17(Thermussp.
sps17)、耐辐射球菌(Deinococcus radiodurans)、温泉家族B/克隆7(Hot Spring family B/clone 7)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、热坚芽孢杆菌(Bacillus caldotenax)、大肠杆菌(Escherichia coli)、海栖热袍菌(Thermotoga maritima)、新阿波罗栖热袍菌(Thermotoga neapolitana)和非洲栖热腔菌(Thermosipho africanus)的突变体。许多热稳定的DNA聚合酶的完全核酸和氨基酸序列是公众数据库中可获得的。
术语“聚合酶链式反应扩增条件”或“PCR条件”是指条件,在这些条件下与模板核酸杂交的引物通过聚合酶在聚合酶链式反应(PCR)期间延伸。本领域技术人员将理解的是,这样的条件可以改变,并且一般受到引物和模板的性质的影响。在PCR
Strategies(M. A. Innis, D. H. Gelfand, and J. J.
Sninsky eds., 1995, Academic Press, San Diego, CA)第14章;PCR Protocols : A Guide to Methods and Applications(M. A. Innis, D. H. Gelfand, J. J. Sninsky, and T. J.
White eds., Academic Press, NY, 1990)中描述了各种PCR条件。
术语“样品”是指含有或假定含有来自个体的核酸的任何组合物。样品可以通过本领域技术人员已知的任何方式获得。这样的样品可以是分离自一个个体或多个个体的一定量的组织或液体,或其纯化的级分,包括组织或液体,例如,皮肤、血浆、血清、全血和血液成分、脊髓液、唾液、腹膜液、淋巴液、水性或玻璃体液、滑液、尿液、泪液、精液、阴道液、肺渗出物、浆膜液、器官、肺泡细支气管灌洗液、肿瘤和石蜡包埋的组织。样品还可以包括获自个体的细胞的体外培养物的组分和成分,包括但不限于,来自细胞培养基中细胞生长的条件培养基、重组细胞和细胞成分。
II.
引言
尽管通过一次测序一个单独的KIR基因的方法已经描述了一大组KIR基因等位基因(表1:335种等位基因),还没有开发出方法可以以时间上高效的方式测定患者样品中存在的全部KIR等位基因。
表1. 迄今为止鉴定的KIR多态性的数目
KIR基因 |
2DL1 |
2DL2 |
2DL3 |
2DL4 |
2DL5 |
2DS1 |
2DS2 |
2DS3 |
等位基因 |
25 |
11 |
9 |
25 |
21 |
12 |
12 |
9 |
蛋白质
|
18 |
7 |
8 |
12 |
11 |
8 |
6 |
3 |
无效(nulls) |
1 |
0 |
1 |
0 |
0 |
0 |
0 |
|
KIR基因 |
2DS4 |
2DS5 |
3DL1 |
3DS1 |
3DL2 |
3DL3 |
2DP1 |
3DP1 |
等位基因 |
20 |
12 |
52 |
14 |
45 |
55 |
5 |
8 |
蛋白质
|
13 |
9 |
46 |
12 |
40 |
31 |
0 |
0 |
无效(nulls) |
|
0 |
1 |
1 |
0 |
0 |
0 |
0 |
本发明提供了基于下述发现的KIR基因分型方法,多通道的、平行的克隆测序分析可以用于同时在多个个体中分型所有16种KIR基因的至少一个外显子。称为“高度多通道扩增子测序”的下一代的测序方法能够克隆地并行增殖数百万核酸分子,其然后也被并行地测序。近来,利用Titanium化学作用,可通过这样的下一代测序方法获得的阅读长度已经提高到>400个核苷酸。这些克隆阅读长度使得设置KIR基因的外显子之内联系的多态性的相位,因而鉴定每个KIR基因的每个等位基因成为可能。在本发明中,系统足够高通量以允许在单个测序运行中对多达10个个体分型16种KIR基因的每一种的9种外显子(各自具有多种多态性)的每一种。
本发明的方法利用能够产生长的读出的高通量测序技术。特别有益的是利用了焦磷酸测序技术的高度多通道化的扩增子测序的运用。这种技术是基于通过焦磷酸盐的释放和同时的酶促核苷酸降解来检测碱基掺入,如在美国专利号
6,274,320、6,258,568和6,210,891中描述的。在某些实施方式中,该技术涉及使用乳剂PCR(emPCR™),如在美国专利申请公开号 20100086914中描述的。
KIR分型的技术挑战之一是设置许多联系的多态性的相位方面的困难。本发明通过使用克隆测序解决了相位模糊的难题。克隆地获得的长测序反应能够独特地将“KIR基因标志基序”联系于含有多态性位点的更长的序列,从而区分特定的KIR等位基因和其他KIR序列。从克隆测序反应中获得的序列越长,越容易鉴定属于每种KIR基因的序列。下一代测序提供了在短时间内可获得的连续序列的读出数的数量级提高。在配对末端测序中,克隆测序的大多数平台实现仅25-60个碱基对(bp)的阅读长度。仅有由454 Life
Sciences(Branford, Conn.)开发并描述于Margulies M.
et al., (2005) (Genome sequencing in microfabricated high-density picolitre
reactors. Nature. Sep 15;437(7057):376-380)的基于克隆焦磷酸测序的方法利用454
GS FLX Titanium系统(454 Life
Sciences, Branford, Conn.)实现了>400 bp的阅读长度。
I. 引物
在本发明的方法中,来自个体的每个样品在每个KIR外显子上扩增。本发明的方法中使用的引物含有KIR引导区域(也称为KIR特异性区域)。KIR特异性区域与感兴趣的KIR序列杂交,例如,外显子、外显子的部分、或外显子和内含子的部分。在某些实施方式中,引物特异于单个KIR基因,即,引物特异性地靶向扩增单个KIR基因的外显子或外显子的多态性区域。在其他实施方式中,引物对于所有KIR基因是通用的,即,能够杂交和支持所有KIR基因中相同外显子的扩增。在某些实施方式中,引物可以含有内含子的序列的部分。在某些情况下,内含子的序列在确定应当对该序列指定的KIR基因的身份方面是有用的。在某些实施方式中,可以添加单独的引物组以扩增KIR基因的外显子,其具有与所有其他KIR基因实质上不同的内含子序列,例如,基因KIR2DL4。
例如,如表2中所示,在某些实施方式中,靶向KIR基因的外显子1和2的引物是通用的。在某些实施方式中,在靶向KIR基因的外显子3的引物中,某些引物对于所有KIR基因是通用的,而其他引物对于KIR基因的子集是通用的,尽管某些引物是基因特异性的。选择引物,从而测试的每个KIR基因中的每个外显子以足够的特异性被扩增,以容许来自序列的KIR基因型的明确鉴定。
在扩增反应中采用的引物包括其他序列:用于乳剂PCR的衔接子序列和充当来自单个个体的DNA的标记物的识别序列。克隆焦磷酸测序中使用的功能元件例如引物的标签和衔接子的描述可以在美国专利申请系列号10/767,894(2004年1月28日提交)、12/156,242(2008年5月29日提交)、12/245,666(2008年10月3日提交)和12/380,139(2009年2月23日提交)中找到。
引物序列的衔接子部分存在于引物的5'末端。衔接子充当测序引物的退火的位点、以及还相应于乳剂PCR中使用的固相支持物(例如,珠子)上存在的序列,从而扩增子可以与固相支持物退火。
本发明的方法中使用的引物进一步包含个体识别标签或MID标签。MID标签存在于引物中衔接子区域和KIR引导区域之间。这些标签被用于标记来自被测试的每个个体的KIR扩增子。结果,获自同一受试者的全部KIR扩增子用相同的MID标签标记。MID标签也在测序反应中被测序。
MID标签一般长度是至少4个核苷酸,但更长的MID标签,例如,长度6、7或10个或更多个核苷酸也是有用的。这样的序列的使用是本领域公知的(参见,Thomas,
et al.(2006)Nat.
Med., 12:852-855;Parameswaran et
al,.(2007)Nucl.
Acids Res., 35:e130;和Hofmann et al.,(2007)Nucl. Acids Res.
35:e91)。
II. 扩增和测序
KIR扩增子可以使用任何类型的扩增反应获得。在本发明中,KIR扩增子一般使用如上所述的引物对通过PCR来产生。一般希望的是使用“高保真”核酸聚合酶,即具有低差错率的聚合酶,例如,高保真Taq聚合酶(Roche Diagnostics)。
进行基因分型的每个受试者的扩增单独地进行。来自单独的受试者的扩增子然后被合并用于随后的乳剂PCR和序列分析。
产生的KIR扩增子的库附着到珠子上并进行乳剂PCR。乳剂PCR是本领域已知的(参见美国申请公开号
20100086914和其中引用的参考文件)。在乳剂PCR中,要扩增的模板(在这种情况下是KIR扩增子)附着到固相支持物,优选球形珠子,这通过与偶联到所述珠子的引物杂交来进行。
在乳剂PCR扩增之后,分离具有扩增子的珠子。通过焦磷酸盐的释放和同时的酶学核苷酸降解,根据碱基掺入的检测,利用DNA测序技术测序扩增子(如在美国专利号 6,274,320、6,258,568和6,210,891中描述的)。
III. 测定基因序列
一旦获得个体DNA分子的测序数据,确定了明确的外显子序列。对于某些已知的基因,例如HLA,等位基因序列可以通过比较序列文件和HLA序列数据库来建立。然而,对于KIR基因来说,序列数据库是不完全的。
本发明描述了一种方法,通过所述方法,来自多个患者的KIR基因的一个或更多个外显子被同时测序,并且通过软件程序测定存在的KIR基因等位基因。
用于本发明的方法的示范性的软件由Conexio Genomics Pty. Ltd.(Fremantle, Western Australia)开发。该软件能够明确地确定这个基因家族中的序列身份。本发明中有用的典型的软件将从克隆测序设备中输入序列数据。在某些实施方式中,flow
grams也可以被输入,以改善碱基调用准确性。在某些实施方式中,有益的是整理序列读出以压缩数据集。软件然后鉴定样品标签(MID标签)和引物。标签的运用容许多个样品在单个平板上一起运行。软件可以被设计以允许标签位点内的碱基省略或碱基插入,以确保这不会引起不正确的标记指定。
软件能够评估与目标座位和可能被共同扩增的相关基因的序列同源性,以为每个克隆序列指定合适的参考。由于来自所有目标的DNA的克隆和共同扩增的座位在乳剂PCR中混合在一起,必需通过针对可能被扩增的每一个座位测试它们来鉴定序列,以获得唯一的指定。可以通过检查内含子序列以区分座位来辅助这个过程。
软件进一步能够产生每个目标座位的共有序列。这个序列含有来自每个座位中两个等位基因的每一个的碱基的组合。在开始的匹配阶段,不考虑序列之间的相位关系。
在本发明的某些实施方式中,初步的分型可以根据来自每个座位的序列来进行。当基因组参考库不完整时这个步骤是需要的,并且对基因组序列进行完全匹配将使结果偏向非编码区域中未被参照的等位基因。在本发明的某些实施方式中,根据内含子中的信息,可以进行第二水平的分型。这允许精修初步分型结果,以提供更好的分辨。
在本发明的某些实施方式中,来自克隆序列的相位信息可以用于提供测序的区域内完整的和明确的等位基因匹配。软件将自动地处理杂合序列位置间隔太远的情况,以允许完全一致的完全相位分辨。
本发明所教导的KIR复合体的高通量等位基因测序的开发在疾病相关性的研究中是有用的。在某些实施方式中,根据个体的样品中存在的KIR基因等位基因的身份,KIR复合体的高通量等位基因测序容许个体的疾病或状况的预后,或预测个体对治疗的应答。
IV. 组和试剂盒
在一个实施方式中,本发明包含用于KIR测序的寡核苷酸引物的组。所述组包括扩增KIR基因的特定部分的引物。更具体地,所述组包括适合于扩增KIR基因中外显子或外显子的部分的一个或更多个引物对。在某些实施方式中,所述组包括用于扩增患者中存在的每个KIR基因的每个外显子(或每个外显子的部分)的引物对。所述组中的引物优选地(但不必然地)对于所有KIR基因是通用的,即,可以扩增所有KIR基因中相同的外显子。所述引物进一步含有对于乳剂PCR和高通量克隆测序有用的另外的序列。所述另外的序列包括个体识别标签(MID标签)和衔接子,其包括文库标签。
在某些实施方式中,本发明是用于扩增和测序KIR基因的试剂盒。本发明的试剂盒一般包含适合于扩增KIR基因的外显子或外显子的部分的多个引物对。所述引物对包括正向引物,其包含衔接子区域、个体识别标签(MID)和KIR杂交区域;以及反向引物,其包含衔接子区域、个体识别标签(MID标签)和KIR杂交区域。本发明的试剂盒常常包含引物对,其在来自多个受试者的超过一个KIR基因中扩增超过一个外显子。通常,本发明的试剂盒包含足够数量的引物对,以测定多个个体,例如12个或更多个个体中所有KIR基因的KIR基因型。所述引物可以是基因特异性的,或对于超过一种KIR基因通用的,如表2中例举的。
在某些实施方式中,试剂盒可以另外包含可以在乳剂PCR中使用的一种或更多种珠子群体。每个珠子偶联到引物,所述引物能够与扩增引物的衔接子区域杂交。在某些实施方式中,试剂盒可以包含具有反应成分的一个或更多个容器,所述反应成分例如酶、缓冲液、核苷酸、对照多核苷酸,等等。试剂盒还可以包括例如在美国申请公开号
20100086914和其中引用的参考文献中所描述的乳剂PCR和焦磷酸测序所需的其他试剂。
V. 反应混合物
在一个实施方式中,本发明是用于KIR测序的反应混合物。所述反应混合物包含扩增KIR基因的特定部分的引物的组。反应混合物中的引物可以含有对于乳剂PCR和高通量克隆测序有用的其他序列。所述其他序列可以包括MID标签、衔接子和文库标签。
在某些实施方式中,反应混合物可以另外包含一种或更多种珠子群体,每个珠子与能够与扩增引物的衔接子区域杂交的引物偶联。在某些实施方式中,反应混合物可以包含一种酶、缓冲液和核苷酸。反应混合物还可以包括例如在美国申请公开号
20100086914和其中引用的参考文献中所描述的乳剂PCR和焦磷酸测序所需的其他试剂。
VI.
KIR基因分型评估疾病状况的用途
在某些实施方式中,本发明包括通过检测个体的KIR基因型来检测个体对疾病或状况的倾向的方法。
在某些实施方式中,所述方法进一步包括测定个体的HLA基因型,即,测定哪种HLA等位基因存在于所述个体中。HLA基因型可以通过本领域已知的任何方法来测定,非限制性地包括,利用下一代测序来测定HLA基因型,如在Bentley et al.,(2009)Tissue Antigens, 74:393-403中描述的。
在某些实施方式中,所述方法包括如在此描述的测定女性的KIR基因型,并且如果已经确定了存在KIR2DL1等位基因,确定所述女性是否倾向于发生先兆子痫。
在其他实施方式中,所述方法包括如在此描述的测定个体的KIR基因型,以及如果已经确定了存在KIR2DL3等位基因,确定所述个体可能清除HCV感染。在某些实施方式中,所述方法进一步包括测定个体的HLA-C基因型,以及如果已经确定了存在KIR2DL3等位基因和HLA-C1等位基因的组合,确定所述个体可能清除HCV感染。
在其他实施方式中,所述方法包括如在此描述的测定个体的KIR基因型,以及如果已经确定了存在KIR3DS1等位基因,确定所述个体较少可能从HIV感染发展到AIDS。在某些实施方式中,所述方法进一步包括测定个体的HLA基因型,以及如果已经确定了存在KIR3DS1等位基因和HLA-Bw4等位基因的组合,确定所述个体较少可能从HIV感染发展到AIDS。
在又其他的实施方式中,所述方法包括如在此描述的测定个体的KIR基因型,以及如果已经确定了存在KIR2DS1等位基因,确定所述个体倾向于发生自身免疫性疾病。
在又其他的实施方式中,所述方法包括如在此描述的测定个体的KIR基因型,以及如果已经确定了存在KIR2DL2/KIR2DL3杂合性,确定所述个体倾向于发生克罗恩病。在某些实施方式中,所述方法进一步包括测定个体的HLA基因型,以及如果已经确定了存在KIR2DL2/KIR2DL3杂合性与HLA-C2等位基因的组合,确定所述个体倾向于发生克罗恩病。
在又其他的实施方式中,所述方法包括如在此描述的测定个体的KIR基因型,以及如果已经确定了存在B组KIR单元型,确定所述个体是否是非亲缘造血细胞移植中供体的适合候选者。
VII. 实施例