CN106029903A - 用于鉴定基因的等位基因的方法和探针 - Google Patents

用于鉴定基因的等位基因的方法和探针 Download PDF

Info

Publication number
CN106029903A
CN106029903A CN201480072955.6A CN201480072955A CN106029903A CN 106029903 A CN106029903 A CN 106029903A CN 201480072955 A CN201480072955 A CN 201480072955A CN 106029903 A CN106029903 A CN 106029903A
Authority
CN
China
Prior art keywords
nucleic acid
gene
hla
oligonucleotide probe
methods
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480072955.6A
Other languages
English (en)
Other versions
CN106029903B (zh
Inventor
D·C·塞伊尔
D·德桑蒂斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Conexio Genomics Pty Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2013904801A external-priority patent/AU2013904801A0/en
Application filed by Conexio Genomics Pty Ltd filed Critical Conexio Genomics Pty Ltd
Priority to CN202210490044.1A priority Critical patent/CN114807335A/zh
Publication of CN106029903A publication Critical patent/CN106029903A/zh
Application granted granted Critical
Publication of CN106029903B publication Critical patent/CN106029903B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/28Bone marrow; Haematopoietic stem cells; Mesenchymal stem cells of any origin, e.g. adipose-derived stem cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61LMETHODS OR APPARATUS FOR STERILISING MATERIALS OR OBJECTS IN GENERAL; DISINFECTION, STERILISATION OR DEODORISATION OF AIR; CHEMICAL ASPECTS OF BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES; MATERIALS FOR BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES
    • A61L27/00Materials for grafts or prostheses or for coating grafts or prostheses
    • A61L27/36Materials for grafts or prostheses or for coating grafts or prostheses containing ingredients of undetermined constitution or reaction products thereof, e.g. transplant tissue, natural bone, extracellular matrix
    • A61L27/38Materials for grafts or prostheses or for coating grafts or prostheses containing ingredients of undetermined constitution or reaction products thereof, e.g. transplant tissue, natural bone, extracellular matrix containing added animal cells
    • A61L27/3804Materials for grafts or prostheses or for coating grafts or prostheses containing ingredients of undetermined constitution or reaction products thereof, e.g. transplant tissue, natural bone, extracellular matrix containing added animal cells characterised by specific cells or progenitors thereof, e.g. fibroblasts, connective tissue cells, kidney cells
    • A61L27/3834Cells able to produce different cell types, e.g. hematopoietic stem cells, mesenchymal stem cells, marrow stromal cells, embryonic stem cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K2035/124Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells the cells being hematopoietic, bone marrow derived or blood cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Cell Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Developmental Biology & Embryology (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Hematology (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Virology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Urology & Nephrology (AREA)
  • Botany (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Dermatology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Transplantation (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Developing Agents For Electrophotography (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明涉及一种高多态性核酸的基因分型方法。特别是,本公开涉及使用高通量测序技术对高多态性等位基因(如HLA等位基因)进行基因分型的方法。更特别的是,本发明涉及一种捕获探针方法,其适合于通过将捕获探针靶向到到非编码序列来鉴定高多态性基因中的等位基因。

Description

用于鉴定基因的等位基因的方法和探针
技术领域
本发明涉及一种高多态性核酸的基因分型方法。特别是,本公开涉及使用高通量测序技术对高多态性等位基因(例如HLA等位基因)进行基因分型的方法。
发明背景
所谓的下一代测序(NGS)技术加速了遗传研究并使得先前未确诊的遗传缺陷能够得到快速表征,从而产生早期疾病诊断和改善的健康结果。下一代测序技术的关键特征是能够同时对数百万个单个DNA分子序列进行测序。该测序的并行性和速度使得现在可以在短短几天内对完整的人类基因组进行测序。除了通过NGS能够对整个复杂的基因组进行测序外,许多应用还关注NGS的临床潜力及对特定靶区域中的遗传变异的检测。
一种靶向型基因测序方法涉及使用结合靶区域的带标记的探针,然后其可以从基因组DNA中提取出。
使用的探针可以是天然的RNA或DNA,且通常长度为大约100个核苷酸。
捕获探针的使用对于在健康个体中多态性不会很高的遗传区域是有用的。即,健康个体间遗传序列的差异大约<1%。使用高冗余度的重叠探针以确保当探针和靶标DNA之间的序列差异阻止探针与靶标序列复性结合时,在与该基因差异相邻之处会有其它探针使得能够对变异的DNA片段进行提取和测序。
虽然捕获探针的使用已经具有广泛的应用,但其使用并不是通用的,且认为其不适合于高度多态性基因(例如HLA系统的基因)的基因分型。HLA对我们对病原体的免疫应答非常重要。HLA分子位于细胞的表面且向免疫系统提呈片段化的病原体肽。大多数个体具有使物种能够抵御几乎任何病原攻击的独特HLA型。
虽然HLA多态性对我们物种的优势明显,但另一方面移植器官(包括造血干细胞(HSC))上的HLA抗原被受体的免疫系统视为“外来的”,从而导致器官排斥。在HSC移植的情况下,移植的干细胞靶向新的宿主,从而导致移植物抗宿主病(GvHD),其为HSC移植的潜在致命的后果。
因此,要求进行HLA的基因分型以确保HSC供体与患者之间的相容性。有数个HLA基因,其全部位于人类6号染色体的短臂上的被称为主要组织相容性复合体(MHC)的大约4Mb的区域内。这些基因可被分为2组。I类基因包括HLA-A、HLA-B和HLA-C,2类基因包括HLA-DRB1、HLA-DQB1和HLA-DPB1。这些基因正是通常用于移植目的而被分型的基因,但MHC还包含额外的I类HLA基因,其多态性不是很高,并且其功能并非是提呈病原体衍生肽。这种基因包括HLA-E、HLA-F和HLA-G。此外,有很多类似I类和2类的假基因和基因片段。
经典的I类基因在序列上类似。它们全部为大约3,200个碱基对的相对小的基因,以7-8个外显子和小内含子为特征。2类基因具有更大的内含子,且某些为大约20,000个碱基对。
高水平的HLA多态性是通过来自相同和不同基因座的等位基因的序列基序的“共享”产生。独特的多态性和SNP是相对较少的。换句话说,新鉴定的等位基因会包含基序的独特组合,这些基序见于相同基因座的其它等位基因中或来自其他相关基因座的等位基因。基序共享是多态性快速进化的有效机制并且当遭遇病原体时良好地服务物种。等位基因和基因座之间共享的基序的大小是变化的。在一些情况下,所述基序可能小于20bp,但另一些等位基因可包含整个基因的一半。高水平多态性的结果是在一些情况下不可能鉴别HLA匹配的HSC供体。
用于HLA的NGS与基于传统Sanger的测序技术相比提供了显著益处。传统HLA测序技术要求对通过聚合酶链式反应扩增的DNA进行测序。扩增的DNA作为多个序列分子被测序,其中不能确定相邻核苷酸是来自相同还是不同(母本或父本)的染色体。这种无法进行相位定序的能力缺乏常常导致不准确的分型,且要求随后的实验来解析不明确的类型。
NGS产生单分子序列数据,使用可用序列分析软件(例如Assign MPS)编译的相位信息来完成,以潜在地产生明确的HLA类型。然而,当对PCR产物进行测序时,PCR所包含的错误和嵌合分子也被测序,造成序列分析困难。
然而,传统的基于外显子的探针捕获技术可能是不可靠的,因为HLA类型主要是通过基序重排产生,且一个等位基因与下一个的序列差异程度可以是巨大的。
因此,仍需要能够对高多态性基因(例如HLA基因)进行高通量测序的方法。
发明内容
本发明的发明人描述了一种捕获探针方法,其适合于通过使捕获探针靶向到非编码序列上来鉴定高多态性基因中的等位基因。通常分型的HLA I类和II类分子的非编码区与多态性外显子相比多态性较低,而且除了因正常变异产生过程而出现的随机SNP之外,在不同HLA类型中的可能的替代序列的数量似乎是相对有限的。因此,可以在单区域设计出能够捕获全部等位基因(包括可能在未来描述的那些)的少量探针。所述捕获探针将会捕获包括多态性外显子的DNA片段,且对捕获的DNA片段的测序将会产生多态性片段的序列,这使得能够推导出HLA类型。
因此,一方面,本发明提供一种鉴定受试对象中的基因的等位基因的方法,所述方法包括:
a)使来自受试对象的核酸样品接触寡核苷酸探针,其中,所述寡核苷酸探针与所述核酸样品中的基因靶序列杂交;
b)通过将杂交到寡核苷酸探针的核酸与未结合寡核苷酸探针的核酸分离,富集杂交到寡核苷酸探针的核酸;及
c)对核酸进行测序以鉴定基因的一种或多种等位基因;
其中,所述基因靶序列在所述基因的非编码区域内。
本发明的方法对于鉴定高多态性基因中的等位基因是特别有用的。因此,在一个实施方式中,所述基因是高多态性基因。在一个特定实施方式中,所述基因是HLA基因。
技术人员将会理解在制备用于测序的被捕获的核酸时,扩增被捕获的核酸可能是期望的。因此,在一个实施方式中,所述方法包括:扩增结合到寡核苷酸探针的核酸。
在一个实施方式中,所述方法包括对HLA基因外显子进行测序。
在另一个实施方式中,所述方法包括对整个HLA基因进行测序。
为了促进所感兴趣的核酸的富集,在一个实施方式中,寡核苷酸探针包含捕获标签。
在一个实施方式中,捕获标签为杂交标签。
在另一个实施方式中,捕获标签为生物素或抗生蛋白链菌素。
在另一个实施方式中,所述方法包括用结合试剂接触所述捕获标签。
在一个实施方式中,所述结合试剂为生物素或抗生蛋白链菌素。
在另一个实施方式中,所述结合试剂与基体偶联。在一个特殊的实施方式中,所述结合试剂与诸如磁珠等磁性基体偶联。
在一个实施方式中,与寡核苷酸探针接触的核酸样品包含单链核酸。
在另一个实施方式中,所述核酸样品在与寡核苷酸探针接触之前被片段化。
在一个实施方式中,所述方法包括使寡核苷酸探针接触平均长度大于约100bp的核酸片段。
在另一个实施方式中,所述方法包括使寡核苷酸探针接触平均长度大于约2kb的核酸片段。
作为另一选择,所述核酸样品在与寡核苷酸探针接触之后被片段化。
所述寡核苷酸探针靶向基因的非编码区,例如内含子和基因间隔区。在一个实施方式中,诸如HLA基因等基因的非编码区为内含子。
在另一个实施方式中,所述方法进一步包括检测非HLA基因的一种或多种等位基因。
在另一个实施方式中,所述测序为高通量测序。
在一个实施方式中,所述高通量测序为下一代测序技术。
第二方面,本发明提供一种鉴定受试对象中的基因的等位基因的方法,所述方法包括:
a)从受试对象中获得核酸样品;
b)片段化所述核酸样品以获得长度为至少约2kb的核酸片段;
c)使单链核酸与包含捕获标签的寡核苷酸探针接触,其中,所述寡核苷酸探针与所述核酸样品中的HLA靶序列杂交;
d)通过使结合试剂接触捕获标签,富集杂交到寡核苷酸探针的核酸;及
e)对核酸进行测序以鉴定一种或多种等位基因;
其中,所述HLA靶序列在所述基因的非编码区内。
虽然本发明方法中使用的核酸可来自预先获得的样品,但在一个实施方式中,所述方法包括从获自受试对象的生物样品中分离出核酸。
在一个实施方式中,所述核酸样品在与寡核苷酸探针接触之前被片段化。
在另一个实施方式中,所述核酸样品在与寡核苷酸探针接触之后被片段化。
在另一个实施方式中,所述基因的等位基因是HLA基因的等位基因。
在第一或第二方面的一个实施方式中,一种或多种寡核苷酸探针包含与SEQ IDNo:1至8或10至71中的任意一个具有至少95%同一性的核酸序列。
在另一个实施方式中,一种或多种寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个具有至少98%同一性的核酸序列。
在一个特殊的实施方式中,一种或多种寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个相同的核酸序列。
第三方面,本发明提供一种为需要移植的受体鉴定移植供体的方法,所述方法包括:
a)进行本发明的方法以在需要移植的受体中鉴定一种或多种HLA基因等位基因;及
b)基于同时在移植供体和移植受体的HLA基因中一种或多种等位基因的存在,鉴定移植供体。
本发明进一步提供降低移植受体发展移植物抗宿主病的可能性的方法,所述方法包括:
a)进行本发明的方法以在需要移植的受体中鉴定一种或多种HLA基因等位基因;及
b)基于同时在移植供体和移植受体中一种或多种HLA基因等位基因的存在,鉴定移植供体;
其中,同时在移植供体和移植受体中一种或多种HLA基因等位基因的存在表明所述移植受体在从所述移植供体移植了移植物后发展移植物抗宿主病的可能性降低。
在一个实施方式中,所述方法包括在所述移植供体中鉴定一种或多种HLA基因等位基因。
第四方面,本发明提供一种将同种异基因移植物移植到受体中的方法,所述方法包括:
a)进行本发明的方法;及
b)从所述移植供体中移出供体移植物;及
c)将所述移植物移植到受体中。
第五方面,本发明提供一种用于鉴定受试对象中的基因的等位基因的试剂盒,所述试剂盒包含与所述基因的非编码区中的基因靶序列杂交的寡核苷酸探针。
在一个实施方式中,所述基因是高多态性基因。
在一个特定实施方式中,所述基因是HLA基因。
在另一个实施方式中,HLA基因的非编码区为内含子。
在一个实施方式中,所述寡核苷酸探针包含捕获标签。
在一个实施方式中,所述捕获标签为生物素或抗生蛋白链菌素。
在另一个实施方式中,所述试剂盒包含结合试剂。
在一个特定实施方式中,所述结合试剂为生物素或抗生蛋白链菌素。
在另一个实施方式中,所述结合试剂与基体偶联。在一个特定实施方式中,所述基体为磁性基体。在一个特定实施方式中,所述基体为磁珠。
在另一个实施方式中,一种或多种寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个具有至少98%同一性的核酸序列。
在另一个实施方式中,一种或多种寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个具有至少98%同一性的核酸序列。
在一个特定实施方式中,一种或多种寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个相同的核酸。
可明显看出本发明一个方面的优选特征或特点可应用于本发明的许多其它方面。
整个说明书中的词语“包括”或其变化形式应被理解为意味着包含所描述的要素、整体或步骤、或要素、整体或步骤的组,但不排除任何其它要素、整体或步骤或要素、整体或步骤的组。
下文通过下面的非限制性实施例并参考附图对本发明进行描述。
附图说明
图1.HLA-A内含子1的序列比对,表明了不同的HLA等位基因具有相同的可预测的HLA序列。HLA等位基因的命名使用了至多4个用冒号分开的字段(例如A*01:01:01:01)。第一字段表示可通过抗体检测到的一般氨基酸序列差异。第二字段表示导致氨基酸变化但可能用抗体无法检测到的核苷酸差异。第三字段表示同义变化,第四字段表示非编码区中的变化。字母代码后缀(例如A*01:01:01:02N中的N)的使用表明该等位基因是表达变异基因。例如,N=零或不表达。可以看出,除了与A*30等位基因共享核苷酸的2个(A*01:02和A*01:20)外,所有的A*01等位基因具有相同的序列,并且A*03和A*11等位基因也与大多数A*01等位基因相同。由于探针会平等地捕获具有单碱基对错配的DNA,单探针应该捕获所有的A*01、A03、A*11和A*30等位基因。
图2.对低多态性非编码区使用捕获探针以对多态性编码区进行捕获和测序。
图3.HLA-A基因结构,显示了在原理实验的证据中外显子和捕获探针的位置。
图4.对使用靶向型捕获测序方案产生的序列数据的分析(颜色未显示)。
1:显示了在白色至红色渐变色调区之上的HLA基因结构,其总结了跨基因的序列深度。白色区域表明序列读出深度<50,而且距离红色色调越近,序列读出深度越小。黑块表明没有序列文件跨越此区。
2:其显示了样品名称(样品01)和被分析的基因座(HLA-A=gA)
3:该区总结了数据。每个灰色垂直条表示在此位置处序列的量。此比例尺显示的最大覆盖度为100。彩块的水平线为共有序列,其中红色=T,黑色=G,蓝色=C且绿色=A。下方的彩块表示在此位置处看到的其它序列,并且它们位于垂直灰色条上的地点表明以此位置上的该碱基读出的百分比。这些序列通常表示碱基识别(call)错误,但能够表明杂合序列。黑色水平线表明碱基识别结果的百分比,所以在第一水平线上的蓝色块表明在此位点上1%的碱基识别结果为C。比例尺是对数的,因此第二水平线表明10%的读出结果。
4:软件界面内的该区表明在共有序列和HLA-A文库之间的最佳匹配的基因型。前2列表明基因型。第3列表明与HLA-A编码序列错配的序列数量。下一列表明与HLA-A非编码序列错配的数量,第5列和第6列表明在序列数据的相位确定时的序列错配。正确的基因型在第3至6列会具有0个错配。在此情况下,最佳匹配的基因型是具有HLA-A*02:01:01:01+A*02:01:01:01。
图5.在3个样品的捕获探针富集后的下一代测序结果,也进行了Sanger测序。
序列表注释
SEQ ID NO:1至8–寡核苷酸捕获探针
SEQ ID NO:9–HLA A内含子1
SEQ ID NO:10至71–HLA捕获探针序列
具体实施方式
一般技术与定义
除非另外特别限定,本文使用的所有技术与科学术语应该认为与本领域(例如,在分子遗传学、生物化学和免疫学领域)普通技术人员通常理解的具有相同含义。
除非另外指出,本发明使用的分子遗传学、生物化学和免疫学技术为本领域技术人员熟知的标准程序。这些技术在以下来源的文献中有所描述和解释:例如J,Perbal,A Practical Guide to Molecular Cloning,John Wiley和Sons(1984),J.Sambrook和Russell.,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring HarbourLaboratory Press(2001),R.Scopes,Protein Purification-Principals and Practice,第三版,Springer(1994),T.A.Brown(编),Essential Molecular Biology:A Practical Approach,第1和2卷,IRL Press(1991),D.M.Glover和B.D.Hames(编),DNA Cloning:APractical Approach,第1-4卷,IRL Press(1995和1996),及F.M.Ausubel等(编),CurrentProtocols in Molecular Biology,Greene Pub.Associates and Wiley-Interscience(1988,包括直至目前的所有更新),Ed Harlow和David Lane(编)Antibodies:A LaboratoryManual,Cold Spring Harbour Laboratory,(1988),及J.E.Coligan等(编)Current Protocolsin Immunology,John Wiley&Sons(包括直至目前的所有更新)。
术语“核酸”或“核酸序列”或“核酸分子”指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及它们的聚合物。术语核酸与基因、互补DNA(cDNA)、信使RNA(mRNA)、寡核苷酸及多核苷酸可互换使用。
“分离的核酸分子”指总体已从其在天然状态下(如果其以任何形式存在于自然中)所结合或连接的核苷酸序列中分离出的核酸分子。优选地,所述分离的核酸至少60%脱离、更优选至少75%脱离、更优选至少90%脱离其通常所结合的其它组分。核酸可以使用任何适合的已知技术从生物样品中分离。例如,总基因组DNA可以使用本领域已知的方法和/或商业可得的试剂盒来从细胞中提取,例如,通过使用QIAGEN提供的QIAamp DNA血液Mini试剂盒或DNeasy Blood&Tissue试剂盒,或通过使用诸如酚/氯仿提取和乙醇沉淀等方法。
除非另有说明,本文使用的术语“约”指指定值的+/-20%,更优选+/-10%,或更优选+/-5%。
鉴定基因的等位基因的方法
本发明的发明人目前开发出了一种鉴定基因的等位基因的方法,其特别适合于靶向捕获和高通量测序技术。本发明的方法包括用寡核苷酸探针接触来自受试对象的核酸样品,以从所述DNA样品中分离出感兴趣的基因组区域。由于靶向捕获的现有技术方法依赖于捕获感兴趣的基因的编码区的寡核苷酸,这些方法不适合对高多态性基因的基因分型,因为设计出能够鉴定所有目前描述的等位基因并鉴定新等位基因的基于外显子的捕获探针是困难的。与此相反,本发明使用与位于非编码区的基因靶序列杂交的寡核苷酸捕获探针,因此能够进行高多态性基因等位基因的高通量测序。
图1显示了HLA-A内含子1的序列比对,其表明不同的HLA等位基因具有相同的和可预见的HLA内含子序列。可以看出,除了与A*30等位基因共享核苷酸的2个(A*01:02和A*01:20)外,所有的A*01等位基因具有相同的序列,并且A*03和A*11等位基因也与大多数A*01等位基因相同。由于探针会平等地捕获具有单碱基对错配的DNA,单探针应该捕获所有的A*01、A03、A*11和A*30等位基因。
图2提供了显示与所述捕获探针互补的序列的捕获DNA片段的位置及其相对于多态性外显子的相对位置的图。图3显示了如何设计捕获探针和设定捕获探针的位置以捕获用于测序的多态性外显子。
此处使用的术语“非编码序列”或“非编码区”指不属于包含所要鉴定的等位基因的基因的蛋白编码序列的核酸序列。因此,此术语包括内含子、5′和3′非翻译区、启动子、转录调控元件和/或基因间DNA。因此,所述非编码区可以在感兴趣的基因内部,或在感兴趣的基因外部,例如,在基因间区域。在一个实施方式中,所述寡核苷酸探针与感兴趣的基因的内含子内的基因靶序列杂交。
核酸的制备
本发明的方法可以对已使用本领域已知的任何适合的技术从受试对象获得的核酸样品进行。作为另一选择,在一个实施方式中,所述方法包括从获自受试对象的生物样品中获得核酸样品。此处使用的“生物样品”可以是例如淋巴细胞、全血、颊粘膜拭子、活检样本或冷冻组织或包含基因组DNA的任何其它样品。尽管对于分子基因分型而言可以使用几乎任何组织来源,但最常使用的是例如来自外周血的淋巴细胞。也可以使用通过非侵入性方法获得的样品,例如通过基于脸颊拭子或唾液的DNA收集。从这些来源提取DNA的多种适合的方法是本领域已知的。这些方法的范围从有机溶剂提取到二氧化硅包覆的珠及阳离子交换柱的吸附。DNA自动提取系统也是商业可得的且可提供高品质、高纯度的DNA。
本发明方法中使用的核酸可以是单链和/或双链基因组DNA。在某些实施方式中,核酸可包括长度为至少约1kb、至少约2kb、至少约5kb、至少约10kb或至少约20kb或更长的长核酸。长核酸可以用本领域众所周知的多种方法从来源制备。保持核酸分子完整性(即断裂和剪切最小化)的获得生物样品及随后从所述样品中分离核酸的方法是优选的。示例性方法包括但不限于:不进行进一步纯化的裂解方法(例如,使用去垢剂、有机溶剂、碱和/或蛋白酶的化学或酶裂解方法),进行或不进行进一步核酸纯化的核酸分离,使用沉淀步骤的分离方法,使用固体基质的核酸分离方法(例如硅类膜、珠或结合核酸分子的修饰表面),凝胶状基质(例如,琼脂糖)或粘性溶液,及用密度梯度富集核酸分子的方法。
在一个实施方式中,为了获得所需的平均片段大小,将本发明方法中使用的核酸片段化。技术人员会理解,核酸片段的所需长度将依赖于所使用的测序技术。例如,离子激流(Ion Torrent)和MisSeq平台使用长度大约为100bp–200bp的片段,而PacificBiosciences NGS平台可以使用长度至多为20kb的片段。核酸可以通过物理剪切、超声处理、限制性酶切或本领域已知的其它适合的技术来片段化。可以进行核酸片段化,以产生具有所需平均长度的核酸片段。核酸片段的长度或平均长度例如可以为至少约100bp、至少约200bp、至少约300bp、至少约400bp、至少约500bp、至少约600bp、至少约700bp、至少约800bp、至少约900bp、至少约1kb、至少约2kb、至少约3kb、至少约4kb、至少约5kb、至少约6kb、至少约7kb、至少约8kb、至少约9kb、至少约10kb、至少约11kb、至少约12kb、至少约15kb或至少约20kb。
在一个实施方式中,在用寡核苷酸探针接触样品前,为了产生单链核酸或产生包含单链区域的核酸而处理核酸样品。可以使用本领域已知的技术产生单链核酸,例如,包括已知的杂交技术和诸如ReadyAmpTM基因组DNA纯化系统(Promega)的商购可得的试剂盒。作为另一选择,可以使用适合的切口酶与核酸外切酶结合将单链区域引入核酸。
寡核苷酸探针
本发明的术语“探针”或“寡核苷酸探针”指被设计为与感兴趣的核酸特异性地杂交的寡核苷酸。优选地,探针适合用于制备使用靶标捕获技术的高通量(下一代)测序所用的核酸。因此,在一个实施方式中,探针可适合于靶标捕获,并且长度为约60-120个核苷酸。作为另一选择,探针可以为约10-25个核苷酸。在某些实施方式中,探针长度为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸。用于本发明的核苷酸可以是核糖核苷酸、脱氧核糖核苷酸及修饰的核苷酸(例如肌苷)或包含基本不改变其杂交特性的经修饰的基团的核苷酸。
作为另一选择,所述寡核苷酸探针可包含核苷酸类似物。术语“核苷酸类似物”指具有经修饰的核苷酸碱基部分、经修饰的戊糖部分和/或经修饰的磷酸酯部分的合成类似物,并且在多核苷酸的情况下,还具有经修饰的核苷酸间连接,如在别处概述的(例如,Scheit,Nucleotide Analogs,John Wiley,New York,(1980);Agarwal,Protocolsfor Polynucleotides and Analogs,Humana Press,(1994))。通常,修饰的磷酸酯部分包括磷酸酯类似物,其中磷原子在+5氧化态,且一个或多个氧原子被非氧部分替换,例如,硫。示例性磷酸酯类似物包括但不限于硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯、二硒代磷酸酯、苯胺硫代磷酸酯(phosphoroanilothioate)、苯胺磷酸酯(phosphoranilidate)、氨基磷酸酯、硼磷酸酯(boronophosphate),包括相关的平衡离子,如H+、NH4 +、Na+(如果所述平衡离子存在)。示例性的修饰的核苷酸碱基部分包括但不限于:5-甲基胞嘧啶(5mC);C-5-丙炔类似物(包括但不限于C-5丙炔基-C和C-5丙炔基-U);2,6-二氨基嘌呤(也被称为2-氨基腺嘌呤或2-氨基-dA);次黄嘌呤、假尿苷、2-巯基嘧啶、异胞嘧啶(isoC)、5-甲基异胞嘧啶及异鸟嘌呤(isoG;例如参见美国专利5,432,272)。示例性修饰的戊糖部分包括但不限于,锁核酸(locked nucleic acid,LNA)类似物(其包括但不限于Bz-A-LNA、5-Me-Bz-C-LNA、dmf-G-LNA及T-LNA),及2'-或3'-修饰,其中2'-或3'-位置为氢、羟基、烷氧基(如甲氧基、乙氧基、烯丙氧基、异丙氧基、丁氧基、异丁氧基和苯氧基)、叠氮基、氨基、烷基氨基、氟、氯或溴。修饰的核苷酸间连接包括磷酸酯类似物,具有手性的和不带电的亚基间连接的类似物,及具有手性亚基间连接的不带电的吗啉类聚合物(例如参见美国专利5,034,506)。一些核苷酸间连接的类似物包括吗啉基、缩醛及聚酰胺连接的杂环。在被称为肽核酸的一类核苷酸类似物中(其中包括伪互补肽核酸(“PNA”)),其用2-氨基乙基甘氨酸酰胺骨架聚合物替换了常规的糖和核苷酸间连接。
杂交
本文使用的术语“杂交”指寡核苷酸探针与靶核酸非共价结合以形成稳定的双链多核苷酸的过程。杂交条件通常包括低于约1M的盐浓度,更通常的为低于约500mM且可能为低于约200mM的盐浓度。杂交缓冲液包括诸如5%SSPE等缓冲盐溶液,或本领域已知的其它这种缓冲液。杂交温度可以是低至5℃,但其通常高于22℃,更通常的为高于约30℃,且通常超过37℃。通常在严格的条件下进行杂交,即在探针会杂交到与其互补的靶序列但不会杂交到其它非互补序列的条件下。
本文使用的术语“互补”及其语法等价形式指一条核酸与另一条核酸(包括修饰的核酸和核酸类似物)的核苷酸碱基配对相互作用,其导致双螺旋、三螺旋或其它更高级的有序结构的形成。主要的相互作用通常因Watson-Crick和Hoogsteen型氢键结合而是核苷酸碱基特异性的,例如A:T、A:U和G:C。使寡核苷酸探针与靶核酸的互补或基本互补区复性结合的条件是本领域众所周知的。
如本领域中所理解的,严格杂交条件是序列依赖性的,且在不同的场合下是有区别的。例如,对于特异性杂交,更长的片段可能比短片段要求更高的杂交温度。因为其他因素可能影响杂交的严格性(其包括碱基组成和互补链的长度,有机溶剂的存在,及碱基错配的程度),参数的组合比单独任意一个参数的绝对测量值更重要。一般来说,对于在限定的离子强度和pH下的特定序列,将严格条件选择为低于Tm约5℃。严格条件的实例包括:在pH为约7.0至约8.3及约至少25℃的温度下盐浓度为至少0.01M至不超过1M的钠离子浓度(或其它盐)。例如,条件为5×SSPE(750mM NaCl,50mM磷酸钠,5mM EDTA,pH 7.4)和30℃的温度适合于等位基因特异性探针杂交。
捕获标签和结合试剂
在一个实施方式中,本发明方法中使用的寡核苷酸探针包含捕获标签,从而便于从样品中的其他核酸序列中富集出结合到寡核苷酸探针上的所感兴趣的核酸。为了从其它核酸序列中富集出感兴趣的核酸,将捕获标签结合到适合的结合试剂上。如本领域所理解的,短语“核酸的富集”指相对于未结合到寡核苷酸探针的核酸在样品中增加靶核酸序列的量。因此,增加了样品中靶序列相对于相应的非靶核酸的比率。
在一个实施方式中,捕获标签为“杂交标签”。本文使用的术语“杂交标签”及其语法等价形式可以指包含与作为结合试剂(即,“结合标签”)的另一核酸序列的至少一部分互补的序列的核酸。杂交标签和相应的结合标签序列之间的互补程度可根据应用而变化。在某些实施方式中,杂交标签可以与结合标签或其部分互补或基本互补。例如,杂交标签可包含具有与相应的结合标签至少约50%、至少约60%、至少约70%、至少约80%、至少约90%及至少约99%互补的序列。在某些实施方式中,杂交标签可包含与相应的结合标签100%互补的序列。
在某些实施方式中,捕获探针可包括多个杂交标签,其相应的结合标签位于相同的核酸或不同的核酸中。在某些实施方式中,包含RNA的杂交标签可能对有效移除过量水平的该标签是有利的。
在某些实施方式中,杂交标签可包含至少约5个核苷酸、至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸和至少约100个核苷酸。
在另一个实施方式中,所述捕获标签可包含“亲和标签”。本文使用的术语“亲和标签”及其语法等价形式可指多组分复合体的组分,其中所述多组分复合体的各组分彼此特异性相互作用或相互结合。例如,亲和标签可包括可结合抗生蛋白链菌素的生物素。多组分亲和标签复合物的其他实例包括:配体及其受体,例如抗生物素蛋白-生物素,抗生蛋白链菌素-生物素,生物素的衍生物,抗生蛋白链菌素,或抗生物素蛋白,其包括但不限于2-亚氨基生物素、脱硫生物素、NeutrAvidin(分子探针,Eugene,Oreg.)、CaptAvidin(分子探针)等;结合蛋白/肽,包括麦芽糖-麦芽糖结合蛋白(MBP)、钙-钙结合蛋白/肽(CBP));抗原-抗体,包括表位标签(包括c-MYC、HA和FLAG TagTM)及其相应的抗表位抗体;半抗原,例如二硝基苯基和异羟基洋地黄毒苷,及其相应的抗体;适体及其相应的靶标;荧光基团及抗荧光基团抗体;等等。在一个实施方式中,亲和标签用于将包含杂交标签的靶核酸整体分离。
因此,本发明的方法中使用的结合试剂能够结合本文描述的亲和标签以便于从样品中的其它核酸序列中分离出感兴趣的核酸。例如,在一个实施方式中,亲和标签包含生物素且结合试剂包含抗生蛋白链菌素。结合试剂通常在基体上。基体的实例包括珠、微球、平面表面、柱、孔等。术语“微球”或“珠”或“颗粒”或其语法等价形式是本领域所了解的,并指小的离散颗粒。基体的组成会根据应用而变化。适合的组成包括用于肽、核酸和有机部分合成的那些,其包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸系聚合物、顺磁材料、氧化钍溶胶、碳石墨、二氧化钛、乳胶或交联葡聚糖(如琼脂糖)、纤维素、尼龙、交联胶束和特氟龙,其全部可以使用,来自Fishers Ind.的Bangs实验室的“微球检测指南”是有用的指南。珠不是必须为球形;可以使用不规则的颗粒。在某些实施方式中,基体可包含金属组成,例如含铁的,也可能包含磁性。使用磁珠的示例性实施方式包括包含抗生蛋白链菌素包覆的磁珠的捕获探针。此外,珠可以为多孔的,从而增加可用于与捕获探针相连的珠的表面积。珠的大小在纳米(即100nm)至毫米(即1mm)范围内,珠为约0.2μm至约200μm,或为0.5μm至约5μm,但在某些实施方式中可以使用更小的珠。
高通量测序
本发明的方法特别适合于制备使用高通量测序技术(例如下一代测序技术)进行测序所用的核酸。下一代测序(NGS)技术包括能够在每次仪器运行中对超过1014个碱基对(kbp)的DNA进行测序的仪器。通常,测序产生大量的独立读出序列,每个代表核酸的10至1000个碱基之间的任何位置。通常为了置信度而对核酸进行冗余测序,将每单位区域的复制称为覆盖度(即,“10×覆盖度”或“100×覆盖度”)。下一代测序方法是本领域已知的,并且描述于例如Metzker(2010)中。
因此,本文使用的术语“下一代测序”或“NGS”或“NG测序”指以高通量模式确定个体核酸分子(例如,在单个分子测序中)或克隆扩增的个体核酸分子的代替物(例如,同时测序多于103、104、105或更多分子)的核苷酸序列的任何测序方法。
用于下一代测序的平台包括但不限于Roche/454基因组测序仪(GS)FLX系统、Illumina/Solexa基因组分析仪(GA)、Life/APG的支持寡核苷酸连接检测(SOLiD)系统、Polonator的G.007系统、Helicos BioSciences的HeliScope基因测序系统及PacificBiosciences的PacBio RS系统。
高多态性基因和HLA分型
本发明的方法特别适合于鉴定高多态性基因中的等位基因。本文使用的术语“高多态性基因”包括指在基因的编码区中具有比非编码区中更高水平的多态性的基因。例如,与基因的非编码序列的每kb的多态性的数量相比,高多态性基因的编码序列的每kb可具有更多数量的多态性。高多态性基因的众所周知的实例为人白细胞抗原(HLA)基因。
因此,本发明的方法适合于HLA基因等位基因的鉴定和HLA分型。HLA分子的编码区是高多态性的,因为认为其处在进化的正向选择压力下以响应于病原威胁。HLA的非编码区不在此选择压力下,且不共享相同程度的多态性。虽然I类HLA的非编码区是多态性的,但该多态性在这些区域上不是随机分布的,而且是紧密相关的,通过编码序列相似性而具有相同的非编码序列。
I类HLA的非编码区的序列比对分析揭示出了有限的一组独特序列。本发明的发明人确定了可以对该组独特序列中的每一个都设计出探针以捕获DNA片段,而后可用于下一代测序测定。
因此,代替使用来自外显子组的重叠探针(即在外显子区设计的探针)的方法,本发明的发明人描述了明确针对HLA的非编码区而设计的探针的应用。图1显示了HLA-A内含子1的序列比对,其示出了具有相同的可预测的HLA序列的不同HLA等位基因。HLA等位基因的命名使用了至多4个用冒号分开的字段(例如A*01:01:01:01)。第一字段表示可通过抗体检测到的一般氨基酸序列差异。第二字段表示导致氨基酸变化但可能用抗体无法检测到的核苷酸差异。第三字段表示同义变化,第四字段表示非编码区中的变化。字母代码后缀(例如A*01:01:01:02N中的N)的使用表明该等位基因是表达变异基因。例如N=零或不表达。可以看出,除了与A*30等位基因共享核苷酸的2个(A*01:02和A*01:20)外,所有的A*01等位基因具有相同的序列,并且A*03和A*11等位基因也与大多数A*01等位基因相同。由于探针会平等地捕获具有单碱基对错配的DNA,单探针应该捕获所有的A*01、A03、A*11和A*30等位基因。
在一个实施方式中,本发明的方法包括在HLA-A、HLA-B、HLA-C、HLA-DPA1、HLA-DPB1、HLA-DQA1、HLA-DQB1、HLA-DRA和/或HLA-DRB1基因中的一个或多个中鉴定等位基因。
在某些实施方式中,本发明的方法可用于通过同时在移植供体和受体中匹配基因的等位基因(例如HLA基因的等位基因)来确定移植受体的合适供体和/或确定患者发展移植物抗宿主病(GVHD)或急性GVHD(aGVHD)的可能性。
另外,确定移植候选者发展aGVHD的可能性可影响确定是否移植确实是治疗他们的病情最适合的形式。在某些情况下,可能有替代形式的治疗,其提供给患者更好的预后。同时,aGVHD可能性的预测将指示治疗方案的必要性,或者指示可能比推荐方案更具侵袭性(aggressive)的治疗方案。这种侵袭性疗法通常具有不期望的副作用,因此优选不使用,除非预后表明需要。例如,用中和性抗TNF-α单克隆抗体治疗患者可导致aGVHD的改善,但是可增加感染风险。也可使用多种侵袭性抗炎疗法。
本文使用的术语“移植”指将获自一个个体(供体)的组织或细胞移植或引入到另一个个体(受体)的身体中或身体上。从供体移除并移植到受体中的细胞或组织称为“移植物(graft)”。通常移植的组织的实例为骨髓、造血干细胞、器官(例如肝脏、心脏、皮肤、膀胱、肺、肾、角膜、胰腺、胰岛、脑组织、骨和肠)。
本领域技术人员将会理解,术语“单倍型”指在染色体上位置靠近或位于相邻基因座的一起遗传的等位基因的组合,或是在染色体对的单个染色体上的统计学相关联的一组单核苷酸多态性。
试剂盒
本发明进一步提供用于根据本发明的方法鉴定基因的等位基因的试剂盒。所述试剂盒包含寡核苷酸探针,其能够与感兴趣的基因的非编码区中的基因靶序列杂交。在一个实施方式中,所述寡核苷酸探针包含捕获标签,例如生物素或抗生蛋白链菌素。所述试剂盒可进一步包含能够结合捕获标签的结合试剂。所述结合试剂可以被涂覆在或连接到适合的基体上,所述基体为例如微球或珠。在某些实施方式中,所述基体可以是磁性的以便于富集所感兴趣的靶核酸。
实施例
实施例1.DNA文库的制备
使用Illumina TruSeq DNA Nano操作规程,从200ng基因组DNA中制备Illumina文库,以选择大小为550bp的靶标插入序列。
实施例2.使用内含子特异性探针捕获HLA
作为概念验证,将靶向内含子序列的定制寡核苷酸探针池(SEQ ID NO:1至8)稀释到1.5pmol/μl的浓度。对于第一杂交过程,将人Cot DNA、扩增的文库(如上制备)、通用阻断寡TS-p7(6nt)及通用阻断寡TS-p7(8nt)添加至管中,并在设为60℃的真空浓缩器中干燥大约1小时。然后在Nimblegen 2X杂交缓冲液、Nimblegen杂交组分A和无核酶水中重悬干燥的样品。然后涡旋所述重悬样品并在95℃变性10分钟。变性后,添加2μl探针(3pmol)至样品中并且在72℃温育4小时。
为了清洗和回收探针杂交的DNA,根据制造商的操作规程稀释来自Nimblegen清洗试剂盒的清洗溶液。将杂交的样品与抗生蛋白链菌素珠合并,涡旋混合,并在72℃温育45分钟。温育后,在72℃用洗液I和严格洗液清洗结合的DNA,随后在室温下使用洗液II和III清洗。然后将结合到抗生蛋白链菌素珠上的杂交样品放置到磁铁上,并使用0.125N NaOH洗脱结合的DNA。然后使用Ampure XP珠纯化杂交的样品,而后用KAPA HiFi HotStart ReadyMix进行12个循环的扩增。PCR中使用的引物与连接的DNA中的Illumina接头序列和条码序列(Illumina P5和P7)互补。使用Ampure XP珠纯化样品。
实施例3.杂交的DNA的测序
经扩增的杂交样品使用Illumina 2x300bp测序操作规程在MiSeq或HiSeq上进行测序。
实施例4.结果
所产生的序列数据使用Assign MPS v1.0序列分析软件进行分析(ConexioGenomics,Fremantle,澳大利亚)。对使用靶标捕获测序操作规程产生的序列数据的分析显示在图4中。使用Assign MPS v 1.0软件,确定样品的最佳匹配基因型为HLA-A*02:01:01:01+A*02:01:01:01。
实施例5.在3个样品的捕获探针富集后的下一代测序结果,还进行了Sanger测序
Sanger测定扩增了扩增子中的HLA-A、HLA-B和HLA-C序列,对于HLA-A和HLA-B其跨度为5′非翻译区至内含子4的末端,对于HLA-C其跨度为5′非翻译区至至3′非翻译区。使用等位基因特异性测序引物,解决了所有的杂合性歧义。
使用图3描述的作为SEQ ID NO:10至71提供的探针并使用上文描述的操作规程来进行捕获探针测定。对于所述3个样品,与报告的基因型完全一致。测定结果显示在图5中。
样品1的HLA-B包含一种等位基因,其参考序列未被报道过。与B*15:01:01:01的序列比较,此等位基因在位于内含子1的碱基444处具有单个错配。通过使用Sanger进行基因座特异性扩增,此样品要求使用B*08:01:01和B*15:01:01等位基因特异性测序引物的额外实验来确定该新等位基因为B*15:01:01:01等位基因的未描述过的B*08:01:01等位基因。NGS能够对整个基因的多态性进行相位确定,并能够迅速鉴定该新等位基因为B*15:01:01亚型。此样品也包含新的C*04:01:01等位基因。此多态性位于内含子5中。使用等位基因特异性测序引物在此区域是不常用的,且通过Sanger测序进行表征会要求通过PCR分离等位基因,而后进行Sanger测序。然而,NGS正确地鉴定了该新等位基因为C*04:01:01亚型。
此数据表明使用捕获探针能够鉴定新等位基因,也表明NGS能够确定序列多态性的相位关系,因此能够对新等位基因进行精确表征。
本领域技术人员会知晓,在不脱离广泛描述的本发明的范围的情况下,可以对具体实施方式中所显示的发明进行多种修改和/或变化。因此,本发明的实施方式仅是说明性的且非限制性的。
本文讨论和/或参考的所有出版物都以其整体并入本文。
本申请要求AU 2013904801的优先权,将其全部内容作为参考并入本文。
对本说明书中所包括的文件、法案、材料、设备、物品等的任意讨论仅是为了为本发明提供语境。不应认为这是承认它们中的任何一个或全部因存在于本申请每个权利要求的优先权日之前而构成部分现有技术基础或本发明相关领域的公知常识。
参考文献
Metzker(2010)Nat Rev Genet,11(1):31-46

Claims (37)

1.一种鉴定受试对象中的基因的等位基因的方法,所述方法包括:
a)使来自受试对象的核酸样品接触寡核苷酸探针,其中,所述寡核苷酸探针与所述核酸样品中的基因靶序列杂交;
b)通过将杂交到寡核苷酸探针上的核酸与未结合寡核苷酸探针的核酸分离,富集杂交到寡核苷酸探针上的核酸;及
c)对富集的核酸进行测序以鉴定基因的一种或多种等位基因;
其中,所述基因靶序列在所述基因的非编码区内。
2.如权利要求1所述的方法,其中,所述基因是高多态性基因。
3.如权利要求2所述的方法,其中,所述基因是HLA基因。
4.如权利要求1~3中任一项所述的方法,其中,所述方法包括扩增结合到所述寡核苷酸探针上的核酸。
5.如权利要求3或4所述的方法,其中,所述方法包括对HLA基因外显子进行测序。
6.如权利要求5所述的方法,其中,所述方法包括对整个HLA基因进行测序。
7.如权利要求1~6中任一项所述的方法,其中,所述寡核苷酸探针包含捕获标签。
8.如权利要求7所述的方法,其中,所述捕获标签为生物素或抗生蛋白链菌素。
9.如权利要求7或8所述的方法,其中,所述方法包括使所述捕获标签与结合试剂接触。
10.如权利要求9所述的方法,其中,所述结合试剂为生物素或抗生蛋白链菌素。
11.如前述任一项权利要求所述的方法,其中,与所述寡核苷酸探针接触的核酸样品包含单链核酸。
12.如权利要求1~11中任一项所述的方法,其中,在使所述核酸样品与所述寡核苷酸探针接触之前将所述核酸样品片段化。
13.如权利要求12所述的方法,其中,所述方法包括使平均长度大于约100bp的核酸片段与所述寡核苷酸探针接触。
14.如权利要求1~11中任一项所述的方法,其中,在所述核酸样品与所述寡核苷酸探针接触之后将所述核酸样品片段化。
15.如权利要求3~14中任一项所述的方法,其中,所述HLA基因的非编码区为内含子。
16.如权利要求3~15中任一项所述的方法,其中,所述方法进一步包括检测非HLA基因的一种或多种等位基因。
17.如权利要求1~16中任一项所述的方法,其中,所述测序为高通量测序。
18.如权利要求17所述的方法,其中,所述高通量测序为下一代测序技术。
19.一种鉴定受试对象中的基因的等位基因的方法,所述方法包括:
a)从受试对象中获得核酸样品;
b)将所述核酸样品片段化以获得长度为至少约2kb的核酸片段;
c)使所述核酸样品与包含捕获标签的寡核苷酸探针接触,其中,所述寡核苷酸探针与所述核酸样品中的基因靶序列杂交;
d)使所述捕获标签与结合试剂接触,富集杂交到寡核苷酸的核酸;及
e)对核酸进行测序以鉴定基因的一种或多种等位基因;
其中,所述基因靶序列在所述基因的非编码区内。
20.如权利要求19所述的方法,其中,在使所述核酸样品与所述寡核苷酸探针接触之前将所述核酸样品片段化。
21.如权利要求19所述的方法,其中,在使所述核酸样品与所述寡核苷酸探针接触之后将所述核酸样品片段化。
22.如权利要求19~21中任一项所述的方法,其中,所述基因的等位基因是HLA基因的等位基因。
23.如权利要求3~33中任一项所述的方法,其中,一种或多种所述寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个具有至少95%同一性的核酸序列。
24.一种为需要移植的受体鉴定移植供体的方法,所述方法包括:
a)进行权利要求3~23中任一项所述的方法,以在需要移植的受体中鉴定一种或多种HLA基因等位基因;及
b)基于同时在移植供体和移植受体的HLA基因中一种或多种等位基因的存在,鉴定移植供体。
25.一种降低移植受体发展移植物抗宿主病的可能性的方法,所述方法包括:
a)进行权利要求3~24中任一项所述的方法,以在需要移植的受体中鉴定一种或多种HLA基因等位基因;及
b)基于同时在移植供体和移植受体中一种或多种HLA基因等位基因的存在,鉴定移植供体;
其中,同时在移植供体和移植受体中一种或多种HLA基因等位基因的存在表明所述移植受体在从所述移植供体移植了移植物后发展移植物抗宿主病的可能性降低。
26.如权利要求24或25所述的方法,其中,所述方法包括鉴定所述移植供体中的一种或多种HLA基因等位基因。
27.一种将同种异基因移植物移植到受体中的方法,所述方法包括:
a)进行权利要求24~26中任一项所述的方法;及
b)从所述移植供体中移出供体移植物;及
c)将所述移植物移植到所述受体中。
28.一种用于鉴定受试对象中的基因的等位基因的试剂盒,所述试剂盒包含与所述基因的非编码区中的基因靶序列杂交的寡核苷酸探针。
29.如权利要求28所述的试剂盒,其中,所述基因是高多态性基因。
30.如权利要求29所述的试剂盒,其中,所述基因是HLA基因。
31.如权利要求30所述的试剂盒,其中,所述HLA基因的非编码区为内含子。
32.如权利要求28~31中任一项所述的试剂盒,其中,所述寡核苷酸探针包含捕获标签。
33.如权利要求32所述的试剂盒,其中,所述捕获标签为生物素或抗生蛋白链菌素。
34.如权利要求33所述的试剂盒,其中,所述试剂盒包含结合试剂。
35.如权利要求34所述的试剂盒,其中,所述结合试剂与基体偶联。
36.如权利要求35所述的试剂盒,其中,所述基体为磁性基体。
37.如权利要求28~36中任一项所述的试剂盒,其中,一种或多种所述寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个具有至少95%同一性的核酸序列。
CN201480072955.6A 2013-12-10 2014-12-10 用于鉴定基因的等位基因的方法和探针 Active CN106029903B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210490044.1A CN114807335A (zh) 2013-12-10 2014-12-10 用于鉴定基因的等位基因的试剂盒和探针

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2013904801 2013-12-10
AU2013904801A AU2013904801A0 (en) 2013-12-10 Methods and probes for identifying gene alleles
PCT/AU2014/001114 WO2015085350A1 (en) 2013-12-10 2014-12-10 Methods and probes for identifying gene alleles

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210490044.1A Division CN114807335A (zh) 2013-12-10 2014-12-10 用于鉴定基因的等位基因的试剂盒和探针

Publications (2)

Publication Number Publication Date
CN106029903A true CN106029903A (zh) 2016-10-12
CN106029903B CN106029903B (zh) 2022-05-27

Family

ID=53370359

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201480072955.6A Active CN106029903B (zh) 2013-12-10 2014-12-10 用于鉴定基因的等位基因的方法和探针
CN202210490044.1A Pending CN114807335A (zh) 2013-12-10 2014-12-10 用于鉴定基因的等位基因的试剂盒和探针

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202210490044.1A Pending CN114807335A (zh) 2013-12-10 2014-12-10 用于鉴定基因的等位基因的试剂盒和探针

Country Status (9)

Country Link
US (2) US20160312281A1 (zh)
EP (2) EP3080302B1 (zh)
JP (3) JP2017506500A (zh)
CN (2) CN106029903B (zh)
AU (3) AU2014361730B2 (zh)
CA (1) CA2933252A1 (zh)
DK (1) DK3080302T3 (zh)
ES (1) ES2827227T3 (zh)
WO (1) WO2015085350A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3533882B1 (en) 2013-10-15 2022-11-30 Illumina, Inc. Major histocompatibility complex single nucleotide polymorphisms
US20160312281A1 (en) * 2013-12-10 2016-10-27 Conexio Genomics Pty Ltd Methods and probes for identifying gene alleles
JP2019058071A (ja) * 2016-02-03 2019-04-18 ジェノダイブファーマ株式会社 Pcrを用いないキャプチャー法によるhla遺伝子タイピング用プローブセット及びそれを用いたタイピング方法
WO2017160686A1 (en) * 2016-03-15 2017-09-21 Georgetown University Next-generation sequencing to identify abo blood group
CN111378749A (zh) * 2018-12-28 2020-07-07 北京福安华生物科技有限公司 检测DYNC2H1基因rs716274位点多态性的人工模拟核酸分子信标与试剂盒
CN111378748A (zh) * 2018-12-28 2020-07-07 北京福安华生物科技有限公司 检测UMPS基因rs1801019位点多态性的人工模拟核酸分子信标与试剂盒
CN111378750A (zh) * 2018-12-29 2020-07-07 北京福安华生物科技有限公司 检测SLC28A3基因rs885004位点多态性的人工模拟核酸分子信标与试剂盒
CN111575370A (zh) * 2019-02-19 2020-08-25 北京福安华生物科技有限公司 检测SLC28A3基因rs7853758位点多态性的人工模拟核酸分子信标与试剂盒
CN111575371A (zh) * 2019-02-19 2020-08-25 北京福安华生物科技有限公司 检测CBR3基因rs1056892位点多态性的人工模拟核酸分子信标与试剂盒
CN111593122A (zh) * 2019-02-20 2020-08-28 北京福安华生物科技有限公司 检测XPC基因rs2228001位点多态性的人工模拟核酸分子信标与试剂盒
CN110938681A (zh) * 2019-12-27 2020-03-31 上海韦翰斯生物医药科技有限公司 等位基因核酸富集和检测方法

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US5192659A (en) * 1989-08-25 1993-03-09 Genetype Ag Intron sequence analysis method for detection of adjacent and remote locus alleles as haplotypes
US20040197775A1 (en) * 1989-08-25 2004-10-07 Genetype A.G. Intron sequence analysis method for detection of adjacent and remote locus alleles as haplotypes
US6503707B1 (en) * 1990-06-27 2003-01-07 The Blood Center Research Foundation, Inc. Method for genetic typing
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
GB9524381D0 (en) * 1995-11-29 1996-01-31 Anthony Nolan Bone Marrow Trus Method for identifying an unknown allele
US6030775A (en) * 1995-12-22 2000-02-29 Yang; Soo Young Methods and reagents for typing HLA Class I genes
WO1997023645A1 (en) * 1996-01-04 1997-07-03 Sloan-Kettering Institute For Cancer Research Methods and reagents for typing hla class i genes
US6051378A (en) * 1996-03-04 2000-04-18 Genetrace Systems Inc. Methods of screening nucleic acids using mass spectrometry
WO1998026091A2 (en) * 1996-12-12 1998-06-18 Visible Genetics, Inc. Method and kit for hla class i typing
EP0892069B1 (en) * 1997-06-26 2010-07-28 BIO-Rad Medical Diagnostics GmbH A method for determinig the histocompatibility locus antigen class II
US6030778A (en) * 1997-07-10 2000-02-29 Millennium Pharmaceuticals, Inc. Diagnostic assays and kits for body mass disorders associated with a polymorphism in an intron sequence of the SR-BI gene
EP1003917A1 (en) * 1997-08-11 2000-05-31 Visible Genetics Inc. Method and kit for hla class i typing dna
CN1255552C (zh) * 2000-08-25 2006-05-10 中国科学院上海生命科学研究院 体外检测crygs基因及其编码产物是否存在突变的方法
US20030148273A1 (en) * 2000-08-26 2003-08-07 Shoulian Dong Target enrichment and amplification
CA2442820A1 (en) * 2001-03-29 2002-10-10 Van Andel Institute Microarray gene expression profiling in clear cell renal cell carcinoma: prognosis and drug target identification
US20030054388A1 (en) * 2001-06-27 2003-03-20 Garner Harold R. Devices, methods and systems for high-resolution, high-throughput genetic analysis
CN100494399C (zh) * 2003-06-30 2009-06-03 清华大学 一种基于dna芯片的基因分型方法及其应用
US20060078930A1 (en) * 2004-10-01 2006-04-13 Dynal Biotech Inc. Primers, methods and kits for amplifying or detecting human leukocyte antigen alleles
WO2005059505A2 (es) * 2003-12-17 2005-06-30 Universitat Autònoma De Barcelona Método y kit para genotipificación de hla-b27 basados en la pcr en tiempo real
WO2005108624A2 (en) * 2004-05-06 2005-11-17 University Of Chicago, Uctech Use of hla-g genotyping in immune-mediated conditions
WO2006076641A2 (en) * 2005-01-14 2006-07-20 Monosol Rx, Llc Methods and compositions for preventing and treating a disease related to glycan dysregulation
US20080242560A1 (en) * 2006-11-21 2008-10-02 Gunderson Kevin L Methods for generating amplified nucleic acid arrays
EP2053132A1 (en) * 2007-10-23 2009-04-29 Roche Diagnostics GmbH Enrichment and sequence analysis of geomic regions
US20100280056A1 (en) * 2007-11-05 2010-11-04 The Govt. of the U. S. as Represented by the Secretary of the Dept. of Health and Human Svcs. Identification of subjects likely to benefit from statin therapy
RU2014144463A (ru) * 2009-06-25 2015-06-20 Фред Хатчинсон Кансэр Рисёч Сентер Способ измерения адаптивного иммунитета
US20120252682A1 (en) * 2011-04-01 2012-10-04 Maples Corporate Services Limited Methods and systems for sequencing nucleic acids
RU2603265C2 (ru) * 2011-04-05 2016-11-27 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Высокопроизводительный анализ трансгенных границ
US10373705B2 (en) * 2011-06-07 2019-08-06 Koninklijke Philips N.V. Providing nucleotide sequence data
EP2721171A1 (en) * 2011-06-17 2014-04-23 Progenika Biopharma, S.A. Discrimination of blood type variants
CN103890190B (zh) * 2011-07-21 2016-08-17 吉诺戴夫制药株式会社 Hla基因的dna分型方法和试剂盒
WO2013033627A2 (en) * 2011-09-01 2013-03-07 The Regents Of The University Of California Diagnosis and treatment of arthritis using epigenetics
WO2014116729A2 (en) * 2013-01-22 2014-07-31 The Board Of Trustees Of The Leland Stanford Junior University Haplotying of hla loci with ultra-deep shotgun sequencing
CN106103736B (zh) * 2013-10-15 2020-03-03 瑞泽恩制药公司 高分辨率等位基因鉴定
US20160312281A1 (en) 2013-12-10 2016-10-27 Conexio Genomics Pty Ltd Methods and probes for identifying gene alleles

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHRISTIAN GABRIEL: "Rapid high-throughput human leukocyte antigen typing by massively parallel pyrosequencing for high-resolution allele identification", 《HUMAN IMMUNOLOGY》 *

Also Published As

Publication number Publication date
AU2014361730A1 (en) 2016-07-07
JP2022116047A (ja) 2022-08-09
AU2024200796A1 (en) 2024-03-14
DK3080302T3 (da) 2020-10-26
JP2020202843A (ja) 2020-12-24
JP7113870B2 (ja) 2022-08-05
EP3080302B1 (en) 2020-09-16
US20210147935A1 (en) 2021-05-20
CN114807335A (zh) 2022-07-29
CA2933252A1 (en) 2015-06-18
EP3080302A4 (en) 2017-10-25
CN106029903B (zh) 2022-05-27
AU2014361730B2 (en) 2021-02-25
JP7407227B2 (ja) 2023-12-28
AU2021203239A1 (en) 2021-06-10
US20160312281A1 (en) 2016-10-27
AU2021203239B2 (en) 2023-11-09
EP3739066A1 (en) 2020-11-18
JP2017506500A (ja) 2017-03-09
EP3080302A1 (en) 2016-10-19
ES2827227T3 (es) 2021-05-20
WO2015085350A1 (en) 2015-06-18

Similar Documents

Publication Publication Date Title
CN106029903A (zh) 用于鉴定基因的等位基因的方法和探针
US20230340590A1 (en) Method for verifying bioassay samples
CN103298955B (zh) 用于构建血浆dna测序文库的方法和试剂盒
US9567633B2 (en) Method for detecting hydroxylmethylation modification in nucleic acid and use thereof
CN109563541A (zh) 用于制备无细胞dna/rna定序库的rna差异性标记方法
CN108753954B (zh) 痴呆相关基因的捕获探针组、试剂盒、文库构建方法和用途
CN110914449B (zh) 构建测序文库
ES2877205T3 (es) Preparación de muestras para la amplificación de ácido nucleico
ES2972684T3 (es) Procedimiento de detección de anomalías genéticas somáticas, combinación de sondas de captura y kit de detección
US20220064720A1 (en) Isolation of target nucleic acids
EP2609219A2 (en) Defining diagnostic and therapeutic targets of conserved free floating fetal dna in maternal circulating blood
CN109097467A (zh) 基于illumina平台的乳腺癌分型检测试剂盒及应用
WO2015196752A1 (en) A method and a kit for quickly constructing a plasma dna sequencing library
TW201300528A (zh) Hla-dqb1基因分型的方法及其相關引子
EP4159873A1 (en) Method for treating cell population and method for analyzing genes included in cell population
CN105899675A (zh) 主要组织相容性复合体单核苷酸多态性
RU2607031C1 (ru) Способ выявления кандидатных генов для проведения популяционных исследований генетического полиморфизма у детей, проживающих в условиях стронциевой геохимической провинции
CN104099349A (zh) 枫糖尿病相关基因突变、其检测方法及其用途
WO2024076484A1 (en) Methods for determination and monitoring of xenotransplant rejection by measuring nucleic acids or proteins derived from the xenotransplant
Loucks Unraveling the Genetic Complexity of Ciliopathies in the Hutterite Population
Neiman Methods for deep examination of DNA

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220224

Address after: California, USA

Applicant after: ILLUMINA, Inc.

Address before: Western Australia, Australia

Applicant before: Conexio Genomics Pty Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant