CN102127819B - Mhc区域核酸文库的构建方法及用途 - Google Patents

Mhc区域核酸文库的构建方法及用途 Download PDF

Info

Publication number
CN102127819B
CN102127819B CN201010555724.4A CN201010555724A CN102127819B CN 102127819 B CN102127819 B CN 102127819B CN 201010555724 A CN201010555724 A CN 201010555724A CN 102127819 B CN102127819 B CN 102127819B
Authority
CN
China
Prior art keywords
sequence
mhc
nucleic acid
region
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010555724.4A
Other languages
English (en)
Other versions
CN102127819A (zh
Inventor
田埂
蒋慧
刘晓
曹红志
武靖华
赵美茹
吴仁花
欧阳伟汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN201010555724.4A priority Critical patent/CN102127819B/zh
Publication of CN102127819A publication Critical patent/CN102127819A/zh
Priority to HK11111242.0A priority patent/HK1156988A1/zh
Priority to PCT/CN2011/081956 priority patent/WO2012068955A1/zh
Application granted granted Critical
Publication of CN102127819B publication Critical patent/CN102127819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70539MHC-molecules, e.g. HLA-molecules

Abstract

本发明涉及核酸文库的构建方法,具体涉及一种MHC区域核酸文库的构建方法及用途。该方法是首先获得包含基因组片段的基因组文库;将MHC区域的核酸序列信息作为参考序列,根据参考序列设计覆盖整个或部分MHC区域的核酸探针,然后利用液相或者固相杂交的方法富集包含探针序列的互补序列的基因组片段。通过构建本发明的核酸文库,可以针对MHC整个区域进行高通量的测序分析,有利于MHC区域分型及遗传变异的检测。

Description

MHC区域核酸文库的构建方法及用途
技术领域
本发明涉及核酸文库的构建方法,具体涉及一种目标文库,特别是MHC区域核酸文库的构建方法及用途。
背景技术
Major Histocompatibility Complex(MHC)指脊椎动物某一染色体上编码主要组织相容性抗原、控制细胞间相互识别、调节免疫应答的一组紧密连锁基因群。这一发现于1936年在老鼠体内发现之后成为脊椎动物基因组中最为关注的区域之一。
人类主要组织相容性抗原首先在白细胞表面被发现,故称其为人类白细胞抗原(human leucoyte antigen,HLA)[1]。HLA复合体位于人第6号染色体短臂6P21.31,总长约为4MB,从着丝点一侧起依次为II类基因、III类基因和I类基因区域所在,分别编码了HLA-A,B,C等经典抗原或编码LMP(low molecular mass polypeptide or large m ultifunctional protease)和TAP(transporter of antigenic peptides)等与抗原相关蛋白,另外还编码了部分免疫无关基因.根据1999年完成的该区域序列分析和基因定位,认为该区域中包含224个基因,其中128个为具有基因表达的功能性基因,在此之后又陆续完成了7个人MHC区域单体型测序,这8个人MHC区域单体型以及人MHC等位基因型别信息见下表[2]
人MHC区域一致被认为是人类基因组中最关键的一个区域,之前的研究已经证明该区域在免疫应答以及免疫识别,T细胞分化等等重要生理技能中有着重要作用[3,4,5]。这使得人MHC类型在移植配型中起着关键作用,人MHC相符程度越高,移植成功率越高,另一方面,人MHC区域与一些疾病的发生有着较高的相关性,目前已经发现的人MHC相关疾病见下列表(来自http://www.stfrancishospitals.org/Labs/),随着对人MHC区域序列信息进一步了解,更多疾病相关基因在这个区域被发现和验证。
尽管人MHC区域已经被证明在免疫应答和疾病发生方面已经证明具有重要决定作用,但是该区域序列也是人基因组中最复杂区域之一,其序列呈现高度多态性,比如至2010年7月IMGT/HLA数据库已经发现了5302个等位基因而数量在不断增加,下表展示了自1998年以来逐年HLA区域等位基因数量的增加。其他研究也标明这一区域的单核苷酸多肽(SNP)分布频率远高于其他基因组区域,在大约4MB区域发现了超过20000个SNP位点,远远高于基因组中平均每kb一个SNP位点分布频率。
目前对于人MHC区域研究主要方法有下面几种,在效率和覆盖度,准确度等方面还存在缺陷。
1)基于测序的方法
对整个人MHC区域序列进行分析,该方法大概流程为:使用高质量基因组DNA构建BAC文库,根据之前人MHC区域信息设计探针通过杂交选择人MHC区域内或者附近的BAC克隆,将挑选出来的BAC克隆使用散弹法构建文库使用Sanger法测序,将测序的结果进行拼接后得到人MHC区域信息,该方法虽然能获取较完整的人MHC区域信息,但是过程非常复杂,成本昂贵。
在移植配型之前对人MHC区域分析也常使用测序方法,在临床检测中称为HLA-SBT(HLA sequencing-based typing)。这个方法通常针对HLA-A,HLA-B,HLA-C,HLA-DRB1基因保守区域设计引物,对HLA基因多态性的区域进行PCR扩增,然后对扩增产物进行DNA测序后与数据库中核酸序列进行比对,从而判断人MHC型别的方法,也是最直观、最准确的方法。该方法主要关注非常有限的几个基因,不能获得人MHC区域其他基因区域信息。
2)基于芯片杂交的方法
该方法也是基于已知序列信息设计探针,目的DNA与芯片杂交后扫描检测获得SNP型别信息的方法,该方法是基于已知信息的检测,对于含有众多未知型别信息的人MHC区域可能会造成大量信息丢失。
发明内容
本发明针对目前MHC区域研究方法的缺陷,结合高通量测序技术和序列捕获技术提供了一种MHC区域的研究策略,具体是MHC区域核酸文库的构建方法及用途。
本发明首先提供了一种MHC区域核酸文库的构建方法,其整体策略是通过序列捕获技术对基因组的MHC区域进行选择性富集,具体步骤是首先获得包含基因组片段的基因组文库;再用杂交的方法富集MHC区域的核酸片段得到目标文库;
所述用杂交的方法富集是指将MHC区域的核酸序列信息作为参考序列,根据参考序列设计覆盖整个或部分MHC区域的核酸探针,然后利用液相或者固相杂交的方法富集包含探针序列的互补序列的基因组片段。
其中,基因组文库构建步骤中:需要将样品基因组DNA打断成为适合大小的片段。基于文库的用途不同,DNA打断片段的大小也相应调整。
例如,如果目标文库的目的是用于第二代的高通量测序,则基因组一般打断为200~800bp大小的片段,这个片段大小可以跨过较小的重复区域,比100-200bp短片段在序列分析比对和组装中更具优势。
根据文库的不同用途,例如用于高通量的测序,打断的片段一般还需要通过末端修复、加“A”、连接等过程为DNA片段加上接头,然后通过PCR方法扩增富集带有接头的片段。
其中,杂交富集的步骤主要分为芯片杂交和液相杂交两种。芯片杂交是将设计好的探针合成在芯片上,并在芯片上通过序列互补杂交的原理对目标序列实现捕获。目前普遍应用的液相杂交首先是根据目标区域设计探针,在探针上标记好生物素之类的标记,标记探针与目的片段杂交后,通过对标记的筛选(例如新和素对生物素的筛选)富集目的片段。液相杂交在动力学上相对固相杂交更具优势,能降低对于样品起始量要求。
本发明探针设计的基本原则是将已知的MHC序列信息作为作为芯片设计的参考序列,根据覆盖度的要求,针对参考序列的部分或全部区域设计探针。
作为一种优选,所述参考序列为已知的一种或几种MHC单体型序列。选择多种单体型序列作为参考序列的一个因素就是考虑到探针覆盖MHC区域的完整性,例如可将不同单体型上的SNP考虑在内,分别设计不同的探针。所述参考序列也可以使已知的MHC单体型序列经过比对后得到的特征序列。特征序列是指一致性区域或高度保守性区域。
在本发明的一个具体实施例中,选择8个人类MHC区域的单体型作为参考序列(http://genome.ucsc.edu/cgi-bin/)具体信息如下表所示。
  细胞系   染色体位置   区域大小
  PGF   chr6:28,702,185-33,451,429   4749245bp
  COX   chr6_cox_hap2:1-4,795,371   4795371bp
  APD   chr6_apd_hap1:1-4,622,290   4622290bp
  DBB   chr6_dbb_hap3:1-4,610,396   4610396bp
  MANN   chr6_mann_hap4:1-4,683,263   4683263bp
  SSTO   chr6_ssto_hap7:1-4,928,567   4928567bp
  QBL   chr6_qbl_hap6:1-4,611,984   4611984bp
  MCF   chr6_mcf_hap5:1-4,833,398   4833398bp
探针的设计方面,目前存在一些免费的工具可供选择,例如AgilenteArray网站(https://earray.chem.agilent.com/earray/),Array Designer(http://www.premierbiosoft.com/dnamicroarray/index.html)等。或者,通过设计一个计算机程序,将探针的要求作为筛选条件,自动筛选MHC区域的探针。
本发明的一个具体实施例中,探针的长度优选60-120个碱基。
本发明还提供了一种MHC区域核酸文库,就是通过上述的方法构建得到的。
本发明还提供了上述MHC区域核酸文库在测序中的用途。
本发明还提供了一种MHC区域的测序方法,包括构建所述文库和测定核酸序列的步骤。
所述测定核酸序列可通过任何测序方法进行,包括但不限于双脱氧链终止法;优选高通量的测序方法,包括但不限于第二代测序技术或者是单分子测序技术。
所述第二代测序技术(Metzker ML.Sequencingtechnologies-the next generation.Nat Rev Genet.2010Jan;11(1):31-46)包括但不限于SOLEXA、SOLID和454(焦磷酸测序)测序技术(平台);所述单分子测序技术(单分子测序平台)包括但不限于Helicos公司的True Single Molecule DNA sequencing技术,Pacific Biosciences公司的the single molecule,real-time(SMRT.TM.)技术,以及Oxford Nanopore Technologies公司的纳米孔测序技术等(Rusk,Nicole(2009-04-01).CheapThird-Generation Sequencing.Nature Methods 6(4):244-245)。
本发明还提供了上述测序方法在基因变异检测中的用途,所述基因变异包括但不限于SNP、CNV、插入、缺失。
该应用基于对于测序所得原始数据的分析。对于测序所得的原始数据,尤其是第二代测序技术所得的测序数据,进行分析时是采用比对分析和组装分析相结合的方法。
本发明所指比对分析是:将测序所得的标签序列与基因组参考序列进行比较分析,获得标签序列在基因组中的位置以及测序准确度等信息。
本发明所指组装分析是指:直接从已测序的标签序列中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸获得尽可能长的基因组序列信息。
例如,首先通过SOAP(http://soap.genomics.org.cn/)比对至人MHC参考序列上,将能正确比对的序列挑选出来通过SOAPsnp(http://soap.genomics.org.cn/soapsnp.html)进行SNP分析,寻找确定检测样品人MHC区域SNP信息。另外通过SOAP组装软件将数据进行组装,将组装结果与参考序列进行比较寻找确定插入缺失位点。
本发明也提供了上述测序方法在MHC分型中的用途。
本发明将序列捕获技术应用于人MHC区域的研究,构建了MHC区域的核酸文库,对该文库进行高通量的测序即可获得MHC区域的序列信息,这些信息可用于MHC的分型,SNP、插入、缺失、拷贝数变异(copy number variation,CNV)等基因变异的发掘。对比之前的常规分析方法,不仅仅简便易操作,而且能覆盖到所有人MHC区域,鉴于MHC区域与人类健康的密切关系,将促进疾病相关检测手段和治疗手段的研发进程和应用。
对MHC区域核酸文库进行高通量测序,得到的序列信息需要进行进一步加工和分析。本发明在信息分析策略上将比对分析和组装分析相结合,不仅仅能发现已知SNP型别信息,同时也能发现新的SNP位点或者插入、缺失、CNV等基因变异信息。
附图说明
图1样品1目标区域测序深度分布图,X坐标为测序深度,Y坐标为测序DNA片段数量。
图2样品1在人MHC区域深度覆盖图,X坐标为基因组上MHC区域坐标,Y坐标为测序深度。
图3样品2在人MHC区域深度覆盖图,X坐标为基因组上MHC区域坐标,,Y坐标为测序深度。
图4两个样品捕获测序SNP分析结果与之前SNP数据比较结果,白色条纹为样品1,黑色为样品2;X坐标分别为之前项目[6]中发现SNP数量(已知SNP数量),位置一致数量,位置和型别都一致的数量,Y坐标为SNP数量。
图5两个样品捕获测序SNP分析结果与dbSNP131比较结果,竖条纹为样品1,黑色为样品2。X坐标分别为dbSNP数据库(http://www.ncbi.nlm.nih.gov/projects/SNP/)中发现SNP比例,一致数量,位置和型别都一致的数量,Y坐标为SNP比例。
图6样品1插入缺失片段大小分布图,X坐标为插入缺失片段大小,分别是1bp,2bp,3bp,4bp;Y坐标为发生插入缺失数量。
图7芯片探针设计覆盖度,显示在6号染色体区域芯片设计覆盖度(黑色区域为有探针覆盖,间隔白色区域为没有覆盖区域)。
具体实施方式
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。以下括号内为各个试剂或试剂盒的厂家货号。
本发明实施例部分用到的仪器列表:
主要试剂列表
引物序列信息如下表:
步骤一探针设计。
同时选择下表中单体型信息作为参考序列:
  细胞系   染色体位置   区域大小
  PGF   chr6:28,702,185-33,451,429   4749245bp
在Agilent eArray网站(https://earray.chem.agilent.com/earray/)上使用PGF信息进行选择富集芯片流程进行设计,选择应用类型为SureSelect Capture Array,进入Probe界面,选择Genomic tiling设计方式,输入设计项目名称,确认探针长度为60mer,选择探针之间间距,在本次设计中直接采用默认方式,然后选择设计物种H.sapiens,确认参考序列信息为H.sapiens,hg19,GRCh37,February 2009,输入目标区域信息chr6:28,702,185-33,451,429,选择Skip RepeatMarketed Regions,提交设计方案。本实施例在4.7Mb目标区域共设计了663278个探针,探针平均长度为60bp。
探针交Roche NimbleGen公司合成到杂交芯片上。选择杂交芯片类型为2.1M芯片,芯片上可合成2.1M条探针进行捕获实验。
步骤二基因组文库构建
基因组文库构建流程参考Multiplexing Sample Preparation Guide,Part# 11328095 Rev.B,Illumina,使用Illumina公司Multiplexing SamplePreparation Oligonucleotide Kit。取3ug基因组DNA(从人外周血中提取)打断至片段大小为200~800bp,末端补平,加“A”,加接头并进行PCR扩增。
基因组打断使用Covaris打碎仪,打断条件如下:
PCR反应体系:
反应条件:
(a).98℃    30s
(b).98℃    15s
(c).65℃    30s
(d).72℃    30s
(e).重复(b)-(d)步骤3-9次(共4-10循环)
(f).72℃    5min
(g).4℃     静置
使用Ampure beads按照Agencourt AMPure protocol(美国Beckman公司)纯化PCR产物,溶解至25ul纯水中,使用NanoDrop 1000检测PCR产物浓度。
步骤三 杂交筛选目标文库:
a.样品准备:
b.将准备好的样品置于SpeedVac(Thermo公司)中60℃蒸干,然后加入11.2μL的超纯水溶解样品。
c.全速离心样品30秒,分别加入以下两种试剂:18.5μL的2×SCHybridiation Buffer(Roche NimbleGen公司)和7.3μL的SCHybridiation Component A(Roche NimbleGen公司)。震荡混匀后置于离心机上全速离心30秒,然后于95℃使DNA变性10分钟。
d.将带有相应探针的芯片按要求固定在杂交仪(Roche NimbleGen公司)上,将变性后的样品加入芯片中并封闭芯片,然后设定杂交程序,于42℃杂交64-72小时。
e.芯片洗涤与样品洗脱:使用NimbleGen洗脱试剂盒参数如下
f.将NaOH洗脱液回收,并用32μL的20%冰醋酸中和。
g.将上述中和液用Qiagen MinElute PCR Purification Kit纯化,捕获后的样品最后溶解于138μL纯水中。
h.PCR扩增捕获的DNA文库,分为6管50μL反应进行PCR:
反应条件:
(a).98℃    30s
(b).98℃    15s
(c).62℃    30s
(d).72℃    30s
(e).重复(b)-(d)步骤11-19次(共12-20次)
(f).72℃    5min
(g).4℃     静置
i.PCR产物用Qiagen QIAquick PCR Purification Kit纯化,最后溶于30μL纯水中。
3、测序与数据分析:
将样品于Illumina GA II测序平台,按照标准流程进行双末端测序。通过数据分析测序数据的样品来源,并对样品的捕获效果进行分析统计。
(二)结果:
根据图7Agilent earray芯片设计分析图可以看到Agilent芯片探针能覆盖绝大部分MHC区域。
两个样品进行全MHC区域测序,根据表一结果表明总数据中能比对回基因组的比例均大于85%,与其他人重测序文库比对比例接近。而该方法在总MHC区域中覆盖率大于98%以上,说明该方法能说明能覆盖绝大部分MHC区域。图1说明整个区域平均测序深度在500X左右,而且数据分布呈现正态分布趋势,标明本次实验均一性较好。在图2和图3测序深度覆盖图也同样能说明绝大部分区域都能被捕获并测序检测到。
根据图4可知使用捕获方法获得测序数据分析得到SNP信息与样品基因组信息一致度较高,图4中第一项为之前基因组研究[6]获得SNP信息,第二项为基因组研究结果与本次捕获结果一致数量,第三项为基因组研究与本次捕获结果以及SNP型别一致SNP数量。而根据图5与dbSNP数据比较结果可知两个样品中90%以上SNP位点在本次测序中都被覆盖到,充分说明该方法在SNP分析中能覆盖绝大部分区域且准确性较高。图6展示了通过这个数据同时可以分析样品MHC区域插入缺失的情况和比例,在这个方法中能发现一些小片段的插入和缺失。
根据表1至表6组装和拼接的结果,拼接结果能覆盖超过78%区域,在后续插入缺失区域分析中两个样品分别找到了大约1000个位点,其中绝大部分发生在非基因区,发生在基因区的插入缺失位点也主要集中在内含子区域。而插入缺失片段大小也以1个碱基为主。说明除了SNP位点之外,该方法在寻找未知位点插入缺失方面简单迅速,是一种有效对MHC区域进行研究的技术。
表1 两个样品在人MHC区域杂交结果,测序数据基本比对结果.
表2 SOAP de novo组装Contig结果
表3 SOAP de novo组装Scaffold结果
表4 组装结果在基因组目标区域覆盖比例
表5 组装结果分析获得插入缺失分析位点结果
表6 缺失分析位点位置信息详细分析结果
尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解。根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
参考文献
1.Complete sequence and gene map of a human majorhistocompatibility complex.The MHC sequencing consortium.Nature.1999 Oct 28;401(6756):921-3.
2.Horton R,Gibson R,Coggill P,Miretti M,Allcock RJ,Almeida J,Forbes S,Gilbert JG,Halls K,Harrow JL,Hart E,Howe K,Jackson DK,Palmer S,Roberts AN,Sims S,StewartCA,Traherne JA,Trevanion S,Wilming L,Rogers J,de JongPJ,Elliott JF,Sawcer S,Todd JA,Trowsdale J,Beck S.Variationanalysis and gene annotation of eight MHC haplotypes:the MHCHaplotype Project.Immunogenetics.2008 Jan;60(1):1-18.Epub 2008Jan 10.
3.Stewart CA,Horton R,Allcock RJ,Ashurst JL,AtrazhevAM,Coggill P,Dunham I,Forbes S,Halls K,Howson JM,Humphray SJ,Hunt S,Mungall AJ,Osoegawa K,Palmer S,Roberts AN,Rogers J,Sims S,Wang Y,Wilming LG,Elliott JF,de Jong PJ,Sawcer S,Todd JA,Trowsdale J,Beck S.CompleteMHC haplotype sequencing for common disease gene mapping.GenomeRes.2004 Jun;14(6):1176-87.Epub 2004 May 12.
4.Barcellos LF,May SL,Ramsay PP,Quach HL,Lane JA,Nititham J,Noble JA,Taylor KE,Quach DL,Chung SA,KellyJA,Moser KL,Behrens TW,Seldin MF,Thomson G,HarleyJB,Gaffney PM,Criswell LA.High-density SNP screening of themajor histocompatibility complex in systemic lupus erythematosusdemonstrates strong evidence for independent susceptibility regions.PLoS Genet.2009 Oct;5(10):e1000696.Epub 2009 Oct 23.
5.Traherne JA,Horton R,Roberts AN,Miretti MM,HurlesME,Stewart CA,Ashurst JL,Atrazhev AM,Coggill P,PalmerS,Almeida J,Sims S,Wilming LG,Rogers J,de Jong PJ,Carrington M,Elliott JF,Sawcer S,Todd JA,Trowsdale J,BeckS.Genetic analysis of completely sequenced disease-associated MHChaplotypes identifies shuffling of segments in recent humanhistory.PLoS Genet.2006 Jan;2(1):e9.
6.Wang J,Wang W,Li R,Li Y,Tian G,Goodman L,Fan W,Zhang J,Li J,Zhang J,Guo Y,Feng B,Li H,Lu Y,Fang X,Liang H,Du Z,Li D,Zhao Y,Hu Y,Yang Z,Zheng H,Hellmann I,Inouye M,Pool J,Yi X,Zhao J,Duan J,Zhou Y,Qin J,Ma L,Li G,Yang Z,Zhang G,Yang B,Yu C,Liang F,Li W,Li S,Li D,Ni P,Ruan J,Li Q,Zhu H,Liu D,Lu Z,Li N,Guo G,Zhang J,Ye J,Fang L,Hao Q,ChenQ,Liang Y,Su Y,San A,Ping C,Yang S,Chen F,Li L,Zhou K,ZhengH,Ren Y,Yang L,Gao Y,Yang G,Li Z,Feng X,Kristiansen K,WongGK,Nielsen R,Durbin R,Bolund L,Zhang X,Li S,Yang H,Wang J.The diploid genome sequence of an Asian individual.Nature 2008 Nov 6;456(7218):60-5.

Claims (8)

1.一种MHC区域核酸文库的构建方法,是首先获得包含基因组片段的基因组文库;再用杂交的方法富集MHC区域的核酸片段得到目标文库; 
所述基因组文库由基因组DNA打断后经过PCR扩增获得; 
所述用杂交的方法富集是指将MHC区域的核酸序列信息作为参考序列,根据参考序列设计覆盖整个或部分MHC区域的核酸探针,然后利用液相或者固相杂交的方法富集包含探针序列的互补序列的基因组片段; 
所述参考序列为已知的两种以上的MHC单体型序列经过比对后得到的特征序列,所述特征序列是指一致性区域或高度保守性区域。 
2.根据权利要求1的方法,其特征在于:所述探针的长度为60-120个碱基;所述基因组片段的大小在200-800个碱基。 
3.一种MHC区域核酸文库,就是通过权利要求1-2所述的方法构建得到的。 
4.一种权利要求3所述MHC区域核酸文库在测序中的用途,所述用途为非疾病诊断目的。 
5.一种MHC区域的测序方法,包括构建权利要求3所述文库和测定核酸序列和数据分析的步骤,所述方法为非疾病诊断目的。 
6.根据权利要求5所述的方法,其特征在于:所述测定核酸序列使用高通量测序方法,包括但不限于第二代测序方法和单分子测序方法;其中所述第二代测序技术包括但不限于SOLEXA、SOLID和454测序技术;所述单分子测序技术包括但不限于True Single Molecule DNA sequencing技术,the single molecule real-time(SMRT.TM.)技术,以及纳米孔测序技术; 
所述数据分析的步骤包括比对分析和/或组装分析的步骤。 
7.权利要求5或6所述测序方法在基因变异检测中的用途,所述基因变异包括但不限于SNP、CNV、插入和缺失变异,所述用途为非疾病诊断目的。 
8.权利要求5或6所述测序方法在MHC分型中的用途,所述用途为非疾病诊断目的。 
CN201010555724.4A 2010-11-22 2010-11-22 Mhc区域核酸文库的构建方法及用途 Active CN102127819B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201010555724.4A CN102127819B (zh) 2010-11-22 2010-11-22 Mhc区域核酸文库的构建方法及用途
HK11111242.0A HK1156988A1 (zh) 2010-11-22 2011-10-19 區域核酸文庫的構建方法及用途
PCT/CN2011/081956 WO2012068955A1 (zh) 2010-11-22 2011-11-08 Mhc区域核酸文库及其构建方法和用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010555724.4A CN102127819B (zh) 2010-11-22 2010-11-22 Mhc区域核酸文库的构建方法及用途

Publications (2)

Publication Number Publication Date
CN102127819A CN102127819A (zh) 2011-07-20
CN102127819B true CN102127819B (zh) 2014-08-27

Family

ID=44266074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010555724.4A Active CN102127819B (zh) 2010-11-22 2010-11-22 Mhc区域核酸文库的构建方法及用途

Country Status (3)

Country Link
CN (1) CN102127819B (zh)
HK (1) HK1156988A1 (zh)
WO (1) WO2012068955A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140249038A1 (en) * 2011-10-14 2014-09-04 BGI Diagnosis Co., Ltd Method of detecting a pre-determined event in a nucleic acid sample and system thereof

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102127819B (zh) * 2010-11-22 2014-08-27 深圳华大基因科技有限公司 Mhc区域核酸文库的构建方法及用途
CN102533985B (zh) * 2011-12-19 2014-08-06 深圳华大基因科技有限公司 一种检测dmd基因外显子缺失和/或重复的方法
WO2014075274A2 (zh) * 2012-11-15 2014-05-22 深圳华大基因科技有限公司 一种主要组织相容性复合体mhc分型方法及其应用
CN103555846B (zh) * 2013-11-07 2015-12-30 中国海洋大学 一种基于液相分子杂交原理的高通量低成本snp分型方法
WO2016000267A1 (zh) * 2014-07-04 2016-01-07 深圳华大基因股份有限公司 确定探针序列的方法和基因组结构变异的检测方法
CN105512514B (zh) * 2014-09-23 2018-05-01 深圳华大基因股份有限公司 一种mhc补全数据库、其构建方法和应用
CN105779435A (zh) * 2014-12-15 2016-07-20 天津华大基因科技有限公司 试剂盒及其用途
CN106951731B (zh) * 2017-03-28 2019-04-12 至本医疗科技(上海)有限公司 一种大片段插入或缺失的预测方法及系统
CN114277107A (zh) * 2021-09-29 2022-04-05 北京希望组生物科技有限公司 Mhc区域的探针组合物、试剂盒及测序方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7867703B2 (en) * 2004-08-26 2011-01-11 Agilent Technologies, Inc. Element defined sequence complexity reduction
EP2053132A1 (en) * 2007-10-23 2009-04-29 Roche Diagnostics GmbH Enrichment and sequence analysis of geomic regions
CN102127819B (zh) * 2010-11-22 2014-08-27 深圳华大基因科技有限公司 Mhc区域核酸文库的构建方法及用途

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
David T Okou et al,.microarray-based genomic selection for high throughput resequencing.《BRIEF COMMUNICATIONS》.2007,第4卷(第11期),907-909.
DNA序列捕获重测序服务;上海伯豪;《上海伯豪生物技术有限公司》;20100705;全文 *
microarray-based genomic selection for high throughput resequencing;David T Okou et al,;《BRIEF COMMUNICATIONS》;20071130;第4卷(第11期);907-909 *
上海伯豪.DNA序列捕获重测序服务.《上海伯豪生物技术有限公司》.2010,全文.

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140249038A1 (en) * 2011-10-14 2014-09-04 BGI Diagnosis Co., Ltd Method of detecting a pre-determined event in a nucleic acid sample and system thereof

Also Published As

Publication number Publication date
CN102127819A (zh) 2011-07-20
WO2012068955A1 (zh) 2012-05-31
HK1156988A1 (zh) 2012-06-22

Similar Documents

Publication Publication Date Title
CN102127819B (zh) Mhc区域核酸文库的构建方法及用途
Baudhuin et al. Confirming variants in next-generation sequencing panel testing by Sanger sequencing
Rossetti et al. Identification of gene mutations in autosomal dominant polycystic kidney disease through targeted resequencing
Zhan et al. Global assessment of genomic variation in cattle by genome resequencing and high-throughput genotyping
ES2934941T3 (es) Análisis genómico fetal a partir de una muestra biológica materna
CN109797212B (zh) 一种检测肺动脉高压的致病/易感基因的方法
CN106834502A (zh) 一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法
CN110541025B (zh) 杜氏肌营养不良基因缺陷的检测方法、引物组合物及试剂盒
CN106011224A (zh) 神经系统遗传性疾病基因联合筛查方法、试剂盒及其制备方法
WO2013102442A1 (zh) 药物相关基因型别数据库、基因分型及药物反应检测方法
Onsongo et al. CNV-RF is a random forest–based copy number variation detection method using next-generation sequencing
CN105177160B (zh) 检测多种新生儿遗传代谢病致病基因的引物及试剂盒
CN106480170B (zh) 确定供体和受体差异snp的方法及应用
US20170321270A1 (en) Noninvasive prenatal diagnostic methods
TR201815541T4 (tr) Fetüslü gebe bir dişi denekten alınan bir biyolojik numunenin analiz yöntemi.
WO2022105629A1 (zh) 一种用于检测样本污染水平的snp位点的筛选方法及样本污染水平的检测方法
WO2015043278A1 (zh) 同时进行单体型分析和染色体非整倍性检测的方法和系统
Yin et al. Challenges in the application of NGS in the clinical laboratory
Ruiz et al. Genetic testing in hereditary breast and ovarian cancer using massive parallel sequencing
Mei et al. Targeted next-generation sequencing identifies novel compound heterozygous mutations of DYNC2H1 in a fetus with short rib-polydactyly syndrome, type III
CN106282195A (zh) 基因突变体及其应用
CN105803054A (zh) 试剂盒及其在检测唇腭裂相关基因中的用途
Wang et al. Introduction to deep sequencing and its application to drug addiction research with a focus on rare variants
Valencia et al. Next generation sequencing technologies in medical genetics
CN104232649A (zh) 基因突变体及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1156988

Country of ref document: HK

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1156988

Country of ref document: HK

ASS Succession or assignment of patent right

Free format text: FORMER OWNER: BGI-SHENZHEN

Effective date: 20150804

Owner name: SHENZHEN BGI CORPORATION

Free format text: FORMER OWNER: BGI-SHENZHEN CO., LTD.

Effective date: 20150804

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150804

Address after: Yantian District of Shenzhen City, Guangdong province 518083 Hongan street No. 21 China Comprehensive Park 7 Building 7 layer -14 layer

Patentee after: BGI SHENZHEN CO LTD

Address before: 518083, Beishan Industrial Zone, Yantian District, Guangdong, Shenzhen, 11

Patentee before: BGI-Shenzhen Co., Ltd.

Patentee before: BGI-Shenzhen