CN111154840A - 杂交捕获效率评估模型、其构建方法及应用 - Google Patents

杂交捕获效率评估模型、其构建方法及应用 Download PDF

Info

Publication number
CN111154840A
CN111154840A CN201911425465.0A CN201911425465A CN111154840A CN 111154840 A CN111154840 A CN 111154840A CN 201911425465 A CN201911425465 A CN 201911425465A CN 111154840 A CN111154840 A CN 111154840A
Authority
CN
China
Prior art keywords
capture
sequence
capture efficiency
target
hybrid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911425465.0A
Other languages
English (en)
Other versions
CN111154840B (zh
Inventor
赵静波
王晓璐
李伟伟
方楠
伍启熹
王建伟
刘倩
唐宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Usci Medical Laboratory Co ltd
Original Assignee
Beijing Usci Medical Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Usci Medical Laboratory Co ltd filed Critical Beijing Usci Medical Laboratory Co ltd
Priority to CN201911425465.0A priority Critical patent/CN111154840B/zh
Publication of CN111154840A publication Critical patent/CN111154840A/zh
Application granted granted Critical
Publication of CN111154840B publication Critical patent/CN111154840B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种杂交捕获效率评估模型、其构建方法及应用。其中,构建评估模型的方法包括:对多个已知捕获效率的杂交捕获文库中的非目标捕获序列的模板进行定量,得到多个定量结果;根据多个定量结果与多个杂交捕获文库的已知捕获效率,建立定量结果与杂交捕获效率之间的关系模型,该关系模型即为杂交捕获效率评估模型。利用捕获后文库中非目标捕获序列的量来反向推导目标捕获序列的捕获效率的思想,建立已知捕获效率的杂交捕获文库中非目标捕获序列的模板量与测序获得的真实的目标捕获序列的捕获效率之间的关系模型,从而获得评估模型。该模型既可在捕获文库上机测序之前评估出该文库的捕获效率,也有助于研发文库杂交捕获相关试剂。

Description

杂交捕获效率评估模型、其构建方法及应用
技术领域
本发明涉及高通量测序文库杂交捕获领域,具体而言,涉及一种杂交捕获效率评估模型、其构建方法及应用。
背景技术
近些年,探针捕获法在医学检测领域得到了大范围的应用,但配套的杂交捕获试剂却一直被国外Agilent、IDT等公司垄断,国产杂交捕获试剂的研发尚处于起步阶段。在此类试剂的研发过程中,捕获效率是一个非常重要的评估指标。
然而,现有技术中,对高通量测序的杂交捕获文库的捕获效率的评估,均是通过对杂交捕获后的文库进行二代测序,并利用所得到的测序数据进行生物信息学分析流程(数据拆分、质控)对目标区域reads数量进行统计,进而得出目标区域reads占总reads的比例,来计算得到捕获效率。
该方法的主要缺点在于:(1)速度慢。常见的采用PE100或PE150策略的二代测序过程耗时约2~3天,生物信息分析流程(数据拆分、质控)需3-5h;(2)成本高。以目前二代测序单价最低的Illumina Novaseq 6000平台为例,1G数据的成本约60-70元人民币。
目前,尚未发现在进行测序之前,就对杂交捕获文库的杂交捕获效率进行评估的报道。
发明内容
本发明的主要目的在于提供一种杂交捕获效率评估模型、其构建方法及应用,以解决现有技术中尚无在测序之前对杂交捕获文库的杂交捕获效率进行评估的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种构建杂交捕获效率评估模型的方法,该方法包括:对多个已知捕获效率的杂交捕获文库中的非目标捕获序列的模板进行定量,得到多个定量结果;根据多个定量结果与多个杂交捕获文库的已知捕获效率,建立定量结果与杂交捕获效率之间的关系模型,关系模型即为杂交捕获效率评估模型。
进一步地,在对多个已知捕获效率的杂交捕获文库中的非目标捕获序列的模板进行定量之前,方法还包括筛选非目标捕获序列。
进一步地,筛选非目标捕获序列包括:A)选择多个候选非目标序列,对每个候选非目标序列进行如下步骤a)和b),得到多个关系模型:a)在多个已知捕获效率的杂交捕获文库中,对非目标序列的模板进行定量,得到多个定量结果;b)根据多个定量结果与多个杂交捕获文库的已知捕获效率,建立定量结果与杂交捕获效率之间的关系模型;B)选择多个关系模型中定量结果与杂交捕获效率之间相关性最强的一个所对应的候选非目标序列,作为非目标捕获序列。
进一步地,采用PCR、qPCR或数字PCR的方法对非目标捕获序列的模板进行定量。
进一步地,采用qPCR的方法对非目标捕获序列的模板进行定量,得到多个Ct值;根据多个Ct值与多个杂交捕获文库的已知捕获效率,建立Ct值与杂交捕获效率之间的关系模型。
进一步地,非目标捕获序列选自看家基因的序列;优选地,看家基因选自ACTB、GAPDH、GUSB、RPLPO、TFRC、CTNNB1、NONO及ALDOA中的一个或多个;优选地,对RPLPO基因的序列进行定量时采用的引物序列为SEQ ID NO:1和SEQ ID NO:2;对ACTB基因的序列进行定量时采用的引物序列为SEQ ID NO:3和SEQ ID NO:4;对GAPDH基因的序列进行定量时采用的引物序列为SEQ ID NO:5和SEQ ID NO:6;对GUSB基因的序列进行定量时采用的引物序列为SEQ ID NO:7和SEQ ID NO:8;对TFRC基因的序列进行定量时采用的引物序列为SEQ ID NO:9和SEQ ID NO:10。
进一步地,非目标捕获序列的长度为60-150bp,优选为80~120bp。
根据本申请的第二个方面,提供了一种杂交捕获评估模型,该杂交捕获效率评估模型为上述任一种方法构建而成。
根据本申请的第三个方面,提供了一种评估杂交捕获效率的方法,该方法包括:对待评估的杂交捕获文库中的非目标捕获序列的模板进行定量,得到定量结果;将定量结果代入杂交捕获效率评估模型,得到杂交捕获效率;其中,杂交捕获效率评估模型为上述任一种构建方法构建而成。
根据本申请的第四个方面,提供了上述任一种评估杂交捕获效率的方法在杂交捕获文库构建或文库杂交捕获相关试剂研发中的应用。
应用本发明的技术方案,利用捕获后的文库中非目标捕获序列的量来反向推导目标捕获序列的捕获效率的思想,从而根据已知捕获效率的杂交捕获文库中非目标捕获序列的模板量与测序获得的真实的目标捕获序列的捕获效率之间建立相关性,而两者之间的相关性模型即可作为评估捕获文库的捕获效率的评估模型。利用这样的方法建立的评估模型即可在捕获文库上机测序之前评估出该文库的捕获效率,从而一方面可以根据捕获效率的高低决定该捕获文库是否值得进行上机测序,另一方面也有助于研发文库杂交捕获相关试剂。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1A至图1D示出了根据本发明的一个优选实施例中文库捕获效率与目标基因qPCR定量结果存在相关性,其中,图1A示出的是ACTB,图1B示出的是GAPDH,图1C示出的是GUSB,图1D示出的是RPLPO;
图2示出了本申请实施例1中文库的实际捕获效率与RPLPO基因序列的定量结果之间的拟合曲线;
上述图1和图2中的横坐标为捕获效率(%),纵坐标为Ct值。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
如背景技术所提到的,目前对于捕获效率的评估,基本是通过对捕获后的文库进行二代测序,并进一步对测序数据进行分析计算,得出捕获效率。这种方法不但耗时长,所花费的成本也较高,严重影响了杂交捕获试剂的研发效率。因此,目前急需找到一种简易且成本低的方法,在测序之前来快速评估杂交捕获的性能。
通过对整个捕获流程的分析,我们发现捕获后文库的产量与捕获效率存在一定的正相关性。进而设计了基于qPCR等方法定量检测捕获前后文库中特定DNA片段含量的方法,可以对捕获效率做出快速、准确的评估,整个过程无需进行二代测序和生物信息分析,大大加快了研发进度。
为了实现上述目标,我们将整个评估方案的建立分为了以下几个步骤:
(一)从人基因组中选择适合的DNA片段作为qPCR检测的目标区域。
为了评估捕获前后文库中靶序列的富集程度,有两种方法:一种是直接检测靶序列在捕获后的含量增加的倍数,另一种是检测非靶序列在捕获后减少的倍数。第一种方法最为直接,但适用范围受限,即对于不同的捕获panel(基因组合)需要选择不同的DNA片段用于检测,通用性较差;第二种方法是从反向角度思考,可以从一般捕获panel都不会选择的区域中挑选DNA片段用于检测,来达到广泛适用的特性。
除了片段所处区域之外,待检测DNA片段的选择还应该考虑到该片段是否稳定的存在于不同人的不同样本类型中,在人基因组中是否存在大量的相似序列(如大量同源基因或重复序列)。待检测DNA片段如果不能稳定的存在不同的样本中,就会有样本的特异性,不利于评估捕获效率;如果存在大量的相似序列,就可能造成扩增的非特异性增加,进而影响结果的准确性。
综合上述原则,我们从人基因组中选取了数个常被用来作为qPCR实验内参的看家基因(house-keeping gene),作为候选的待测DNA片段,包括了ACTB、GAPDH、GUSB、RPLPO和TFRC等。
(二)为选定的目标区域设计引物,实现qPCR定量检测。
选择好候选的DNA片段后,如何确定qPCR扩增需要的引物和片段大小等信息也至关重要。首先,我们检测的是捕获后的DNA文库,而DNA文库的插入片段的大小因样本类型和基因组打断条件而异,一般在140-350bp之间,结合荧光染料法qPCR实验本身的需求,扩增片段大小设为80-120bp较为合适,太短了容易造成非特异扩增,太长则可能因为文库插入片段断裂位置的原因而造成目标片段的漏检。其次,引物序列不得跨内含子设计,ACTB、GAPDH、GUSB、RPLPO和TFRC等基因通常用做基因表达检测的内参,为了排除基因组DNA污染,引物设计一般需要跨内含子,而我们检测的样本为DNA文库,需要选取上述基因序列较为保守的外显子或内含子区域进行连续设计;最后,为了尽可能减少引物设计位置对结果的影响,我们选取等量的多个DNA文库进行qPCR预实验,观察该引物的扩增结果是否受到样本类型、断裂位置和实验操作的影响,选取较为稳定的引物。
选择已知捕获效率的文库进行初步验证,寻找qPCR定量结果与捕获效率之间的相关性;
我们前期的实验证实,捕获后文库的产量和捕获效率存在一定的相关性,但这种判断方式极易受到样本质量和实验误差(包括系统误差和操作误差)的影响。为了初步验证本发明中基于qPCR定量评估捕获效率的方法,我们选取三个已知捕获效率(72.4%、62.4%和40.2%)的捕获后的文库进行qPCR定量实验。
为了简化实验流程,我们选取了ACTB、GAPDH、GUSB和RPLPO四个基因各一对引物进行扩增,具体序列如下:
表1:
引物名称 SEQ ID NO: 序列
RPLPO-F 1 CCATTCTATCATCAACGGGTACAA
RPLPO-R 2 TCAGCAAGTGGGAAGGTGTAATC
ACTB-F 3 CAGCAGATGTGGATCAGCAAG
ACTB-R 4 GCATTTGCGGTGGACGAT
GAPDH-F 5 ATTCCACCCATGGCAAATTC
GAPDH-R 6 GATGGGATTTCCATTGATGACA
GUSB-F 7 CCCACTCAGTAGCCAAGTCA
GUSB-R 8 CACGCAGGTGGTATCAGTCT
TFRC-F 9 GCCAACTGCTTTCATTTGTG
TFRC-R 10 ACTCAGGCCCATTTCCTTTA
结果显示:除GUSB之外,其余三个基因的定量结果与捕获效率之间存在非常强的正相关性(见图1及表2),初步证实我们的方法的可行性。
表2:
Figure BDA0002353451450000051
上述实验结果证实了该方法的可行性,接下来我们在上述实验方法的基础上做了以下改进:
1)根据多次实验结果,选取相关性最强RPLPO作为最终的目标基因;
2)对RPLPO的多对引物进行测试,选取较为稳定的一对引物作为最终的扩增引物,具体引物序列信息见表1。
3)选取DNA文库的一部分进行捕获,在捕获后使用另一部分未捕获的DNA文库对捕获后的文库进行稀释,共5个梯度,具体设计为:原始捕获后文库、稀释1.2倍、稀释1.5倍、稀释1.8倍和稀释2倍;
4)对上述5个文库进行二代测序,得到捕获效率真值;
5)对上述5个文库进行qPCR定量,根据定量结果和二代测序结果来制作拟合曲线;
6)对使用同一panel捕获的其他文库进行qPCR定量检测,根据上述拟合曲线算出对应的捕获效率;
上述步骤中的qPCR定量检测的条件如下:
(1)qPCR反应体系
表3:
Figure BDA0002353451450000052
(2)qPCR反应条件
表4:
Figure BDA0002353451450000061
7)比较qPCR定量和二代测序两种捕获效率评估方法的差异。
结果表明qPCR定量方法所评估的捕获效率与二代测序后计算得到的捕获效率的真值非常接近。
因此,在上述研究结果的基础上,申请人提出了本申请的技术方案。在一种典型的实施方式中,提供了一种构建杂交捕获效率评估模型的方法,该方法包括:对多个已知捕获效率的杂交捕获文库中的非目标捕获序列的模板进行定量,得到多个定量结果;根据多个定量结果与多个杂交捕获文库的已知捕获效率,建立定量结果与杂交捕获效率之间的关系模型,关系模型即为杂交捕获效率评估模型。
根据本申请前述的研究结果,采用捕获后的文库中非目标捕获序列的量来反向推导目标捕获序列的捕获效率,从而可以根据已知捕获效率的杂交捕获文库中非目标捕获序列的模板量与测序获得的真实的目标捕获序列的捕获效率之间建立相关性,而两者之间的相关性模型即可作为评估捕获文库的捕获效率的评估模型。利用这样的方法建立的评估模型即可在捕获文库上机测序之前评估出该文库的捕获效率,从而一方面可以根据捕获效率的高低决定该捕获文库是否值得进行上机测序,另一方面也有助于研发文库杂交捕获相关试剂。
上述非目标捕获序列是相对于捕获panel中的目标捕获序列而言的,根据捕获文库的捕获panel的不同,可以选择合适的非目标捕获序列。
为了使所构建的评估模型的评估结果更准确,在一种优选的实施例中,在对多个已知捕获效率的杂交捕获文库中的非目标捕获序列的模板进行定量之前,该方法还包括筛选非目标捕获序列。任何能够筛选到能够使评估模型的评估结果更准确的筛选方法均适用于本申请。
在一种优选的实施例中,筛选非目标捕获序列包括:A)选择多个看家基因的序列,对每个看家基因的序列进行如下步骤a)和b),得到多个关系模型:a)在多个已知捕获效率的杂交捕获文库中,对看家基因的序列的模板进行定量,得到多个定量结果;b)根据多个定量结果与多个杂交捕获文库的已知捕获效率,建立定量结果与杂交捕获效率之间的关系模型;B)选择多个关系模型中定量结果与杂交捕获效率之间相关性最强的一个所对应的看家基因的序列,作为非目标捕获序列。该筛选方法筛选相关性最强的一个非目标捕获序列,从而使得所构建的杂交捕获效率的评估模型的评估结果更准确。
上述对非目标捕获序列的模板进行定量的具体方式,可以采用qPCR或数字PCR进行精确定量,同样可以采用普通PCR或半定量PCR等方法来完成,其中普通PCR、半定量PCR结果精确度较差,数字PCR精确度最高,但成本较高,因此,本申请中优先推荐使用qPCR的方法进行定量。具体的qPCR的定量方法可以采用荧光染料法进行qPCR定量实验,也可以使用TaqMan探针法来完成。
因此,在一种优选的实施例中,采用PCR、qPCR或数字PCR的方法对非目标捕获序列的模板进行定量。此处的PCR指的是与qPCR和数字PCR相对的普通PCR。在一种优选的实施例中,采用qPCR的方法对非目标捕获序列的模板进行定量,得到多个Ct值;根据多个Ct值与多个杂交捕获文库的已知捕获效率,建立Ct值与杂交捕获效率之间的关系模型。
如前述,该非目标捕获序列在基因组上的分布或者该目标序列的扩增受各种因素影响越小越好。在一种优选的实施例中,非目标捕获序列选自看家基因的序列(看家基因不属于基因组重复序列,一般情况下也不属于捕获panel范围内的目标捕获区域,因此更具有代表性)。在一种优选的实施例中,看家基因选自ACTB、GAPDH、GUSB、RPLPO、TFRC、CTNNB1、NONO及ALDOA中的一个或多个。在一种优选的实施例中,对RPLPO基因的序列进行定量时采用的引物序列为SEQ ID NO:1和SEQ ID NO:2;在一种优选的实施例中,对ACTB基因的序列进行定量时采用的引物序列为SEQ ID NO:3和SEQ ID NO:4;在一种优选的实施例中,对GAPDH基因的序列进行定量时采用的引物序列为SEQ ID NO:5和SEQ ID NO:6;对GUSB基因的序列进行定量时采用的引物序列为SEQ ID NO:7和SEQ ID NO:8;对TFRC基因的序列进行定量时采用的引物序列为SEQ ID NO:9和SEQ ID NO:10。
在一种优选的实施例中,非目标捕获序列的长度为60~150bp,更优选80~120bp。经试验验证,长度在80~120bp范围内进行定量检测,得到结果受文库断裂位置和样本类型的影响相对最小,因而定量结果也相对更准确。对于某些特殊位点引物不好设计的情况下,也可以将长度放宽至60~150bp。
在第二种典型的实施方式中,提供了一种杂交捕获评估模型,该杂交捕获效率评估模型为上述任一种方法构建而成。
在第三种典型的实施方式中,提供了一种评估杂交捕获效率的方法,该方法包括:对待评估的杂交捕获文库中的非目标捕获序列的模板进行定量,得到定量结果;将定量结果代入杂交捕获效率评估模型,得到杂交捕获效率;其中,杂交捕获效率评估模型为上述任一种方法构建而成。
在第四种典型的实施方式中,提供了上述任一种评估杂交捕获效率的方法在杂交捕获文库构建或文库杂交捕获相关试剂研发中的应用。
下面将结合具体的实施例进一步说明本申请的有益效果。
实施例1
1.选取人白细胞基因组建库,将得到的DNA文库标记为D1(具体信息见下表5);使用本公司研发人员设计并在IDT公司合成的捕获Panel(标记为P1)对文库D1进行捕获,得到捕获后的文库,标记为H1(见表6)。使用D1文库对H1文库进行稀释,分别稀释1.2倍、1.5倍、1.8倍和2倍,所得到的文库分别标记为H2、H3、H4和H5(见表7)。
表5:
DNA文库名称 样本类型 建库起始量 接头 扩增循环数 文库产量
D1 白细胞基因组 500ng IDT UDI_A6 7 2236ng
表6:
Figure BDA0002353451450000081
2.对H1~H5文库进行二代测序,分析捕获效率,结果如表7所示:5个文库的捕获效率随着稀释梯度增加呈递减趋势。
表7:
Figure BDA0002353451450000082
3.选取RPLPO作为qPCR定量检测的目标基因,分别取H1~H5文库进行定量,每个文库做3个复孔,每个复孔文库投入量为4ng,扩增体系和条件见前文所述,定量结果如下表所示:
表8:
Figure BDA0002353451450000083
Figure BDA0002353451450000091
4.根据捕获效率和qPCR结果做相关性分析并制作拟合曲线,具体如图2所示。
实施例2
1.重复实施例1中的建库和杂交捕获操作,选取白细胞基因组和FFPE样本各一个进行建库,标记为D2和D3,使用P1捕获后的文库分别标记为H6和H7,其中H7使用D3文库做1.5倍稀释后标记为H8(40ng H7+20ng D3),具体建库、捕获、稀释见表9和表10所示;
表9:
Figure BDA0002353451450000092
表10:
Figure BDA0002353451450000093
2.使用实施例1中步骤3的实验体系和条件对H6、H7和H8进行qPCR定量,结果如下表11所示:
Figure BDA0002353451450000094
3.根据实施例1中步骤4的拟合曲线公式,计算捕获效率并与测序结果比较,结果如下:
表12:
文库 qPCR定量结果 估算捕获效率 实际捕获效率
H6 30.31537338 71.67% 70.25%
H7 30.06286049 68.85% 69.36%
H8 28.55563988 52.03% 53.40%
可见,使用本发明的方法首先对杂交捕获Panel进行拟合曲线绘制后,再根据qPCR定量结果估算的捕获效率与真值非常接近,用于杂交捕获相关试剂研发时,是一种评估捕获效率的成本低、快速和有效的方法。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:
1.效率高,现有评估捕获效率的方法采用二代测序的方案并对测序结果进行生物信息学分析,耗时较长(>2天),上述实施例中基于qPCR定量的方法,对捕获前后的文库分别进行定量,可以快速(<3h)得到结果,利于提高以捕获效率高低为标准的杂交捕获相关试剂的测试效率,提高生产力;
2.成本低,使用现有评估捕获效率的方案,预期单个样本的成本约为60-70元,其中主要是二代测序的测序费用;而上述实施例中基于qPCR定量的方法,整个流程使用的均是常规实验室试剂,其成本可控制在每个样本3-5元,约为现有方案的1/10;
3.灵活性高,对于现有基于二代测序的评估方案,不同的捕获panel的评估需要使用不同的探针,生物信息学分析的时候也需要选择不同的bed区域。而本发明从反向角度思考,选择的目标基因通常不会被选为靶向区域,基本可以满足所有捕获panel的捕获效率的评估。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 北京优迅医学检验实验室有限公司
<120> 杂交捕获效率评估模型、其构建方法及应用
<130> PN120524YXYX
<160> 10
<170> SIPOSequenceListing 1.0
<210> 1
<211> 24
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
ccattctatc atcaacgggt acaa 24
<210> 2
<211> 23
<212> DNA
<213> 智人(Homo sapiens)
<400> 2
tcagcaagtg ggaaggtgta atc 23
<210> 3
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 3
cagcagatgt ggatcagcaa g 21
<210> 4
<211> 18
<212> DNA
<213> 智人(Homo sapiens)
<400> 4
gcatttgcgg tggacgat 18
<210> 5
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 5
attccaccca tggcaaattc 20
<210> 6
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 6
gatgggattt ccattgatga ca 22
<210> 7
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 7
cccactcagt agccaagtca 20
<210> 8
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 8
cacgcaggtg gtatcagtct 20
<210> 9
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 9
gccaactgct ttcatttgtg 20
<210> 10
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 10
actcaggccc atttccttta 20

Claims (10)

1.一种构建杂交捕获效率评估模型的方法,其特征在于,所述方法包括:
对多个已知捕获效率的杂交捕获文库中的非目标捕获序列的模板进行定量,得到多个定量结果;
根据多个所述定量结果与多个所述杂交捕获文库的已知捕获效率,建立定量结果与杂交捕获效率之间的关系模型,所述关系模型即为杂交捕获效率评估模型。
2.根据权利要求1所述的方法,其特征在于,在对多个已知捕获效率的杂交捕获文库中的非目标捕获序列的模板进行定量之前,所述方法还包括筛选所述非目标捕获序列。
3.根据权利要求2所述的方法,其特征在于,筛选所述非目标捕获序列包括:
A)选择多个候选非目标序列,对每个所述候选非目标序列进行如下步骤a)和b),得到多个关系模型:
a)在多个所述已知捕获效率的杂交捕获文库中,对所述非目标序列的模板进行定量,得到多个定量结果;
b)根据多个所述定量结果与多个所述杂交捕获文库的已知捕获效率,建立定量结果与杂交捕获效率之间的关系模型;
B)选择多个所述关系模型中定量结果与杂交捕获效率之间相关性最强的一个所对应的所述候选非目标序列,作为所述非目标捕获序列。
4.根据权利要求1至3中任一项所述的方法,其特征在于,采用PCR、qPCR或数字PCR的方法对所述非目标捕获序列的模板进行定量。
5.根据权利要求4所述的方法,其特征在于,
采用qPCR的方法对所述非目标捕获序列的模板进行定量,得到多个Ct值;
根据多个所述Ct值与多个所述杂交捕获文库的已知捕获效率,建立Ct值与杂交捕获效率之间的关系模型。
6.根据权利要求1至3中任一项所述的方法,其特征在于,所述非目标捕获序列选自看家基因的序列;
优选地,所述看家基因选自ACTB、GAPDH、GUSB、RPLPO、TFRC、CTNNB1、NONO及ALDOA中的一个或多个;
优选地,对RPLPO基因的序列进行定量时采用的引物序列为SEQ ID NO:1和SEQ ID NO:2;
对ACTB基因的序列进行定量时采用的引物序列为SEQ ID NO:3和SEQ ID NO:4;
对GAPDH基因的序列进行定量时采用的引物序列为SEQ ID NO:5和SEQ ID NO:6;
对GUSB基因的序列进行定量时采用的引物序列为SEQ ID NO:7和SEQ ID NO:8;
对TFRC基因的序列进行定量时采用的引物序列为SEQ ID NO:9和SEQ ID NO:10。
7.根据权利要求6所述的方法,其特征在于,所述非目标捕获序列的长度为60-150bp,优选为80~120bp。
8.一种杂交捕获评估模型,其特征在于,所述杂交捕获效率评估模型为权利要求1至7中任一项所述的方法构建而成。
9.一种评估杂交捕获效率的方法,其特征在于,所述方法包括:
对待评估的杂交捕获文库中的非目标捕获序列的模板进行定量,得到定量结果;
将所述定量结果代入杂交捕获效率评估模型,得到所述杂交捕获效率;
其中,所述杂交捕获效率评估模型为权利要求1至7中任一项所述的方法构建而成。
10.权利要求9所述的评估杂交捕获效率的方法在杂交捕获文库构建或文库杂交捕获相关试剂研发中的应用。
CN201911425465.0A 2019-12-31 2019-12-31 杂交捕获效率评估模型、其构建方法及应用 Active CN111154840B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911425465.0A CN111154840B (zh) 2019-12-31 2019-12-31 杂交捕获效率评估模型、其构建方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911425465.0A CN111154840B (zh) 2019-12-31 2019-12-31 杂交捕获效率评估模型、其构建方法及应用

Publications (2)

Publication Number Publication Date
CN111154840A true CN111154840A (zh) 2020-05-15
CN111154840B CN111154840B (zh) 2022-07-12

Family

ID=70560740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911425465.0A Active CN111154840B (zh) 2019-12-31 2019-12-31 杂交捕获效率评估模型、其构建方法及应用

Country Status (1)

Country Link
CN (1) CN111154840B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107304448A (zh) * 2016-04-22 2017-10-31 张彦伟 一种基因组目标区域测序的杂交捕获方法
CN109234356A (zh) * 2018-09-18 2019-01-18 南京迪康金诺生物技术有限公司 一种构建杂交捕获测序文库的方法及应用
CN110352252A (zh) * 2016-09-22 2019-10-18 威廉马歇莱思大学 用于复杂序列捕获和分析的分子杂交探针

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107304448A (zh) * 2016-04-22 2017-10-31 张彦伟 一种基因组目标区域测序的杂交捕获方法
CN110352252A (zh) * 2016-09-22 2019-10-18 威廉马歇莱思大学 用于复杂序列捕获和分析的分子杂交探针
CN109234356A (zh) * 2018-09-18 2019-01-18 南京迪康金诺生物技术有限公司 一种构建杂交捕获测序文库的方法及应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ETHAN B. LINCK等: "Evaluating hybridization capture with RAD probes as a tool for museum genomics with historical bird specimens", 《ECOLOGY AND EVOLUTION》, vol. 7, 31 December 2017 (2017-12-31), pages 4755 - 4767 *

Also Published As

Publication number Publication date
CN111154840B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
US20220282303A1 (en) Methods for standardized sequencing of nucleic acids and uses thereof
Tam et al. Robust global microRNA expression profiling using next-generation sequencing technologies
Ravo et al. Quantitative expression profiling of highly degraded RNA from formalin-fixed, paraffin-embedded breast tumor biopsies by oligonucleotide microarrays
US20060281108A1 (en) Compositions and methods for the analysis of degraded nucleic acids
WO2004097051A2 (en) Methods for diagnosing aml and mds differential gene expression
Jacobson et al. Gene expression analysis using long-term preserved formalin-fixed and paraffin-embedded tissue of non-small cell lung cancer
CN111424091A (zh) 一组鉴别诊断甲状腺滤泡性肿瘤良恶性的标志物及其应用
US20120004127A1 (en) Gene expression markers for colorectal cancer prognosis
Talebi et al. Fusion transcript discovery using RNA sequencing in formalin-fixed paraffin-embedded specimen
Erickson et al. Assessment of normalization strategies for quantitative RT-PCR using microdissected tissue samples
Park et al. Forensic body fluid identification by analysis of multiple RNA markers using NanoString technology
CN112795654A (zh) 用于生物体融合基因检测与融合丰度定量的方法及试剂盒
CN111154840B (zh) 杂交捕获效率评估模型、其构建方法及应用
Mussack et al. MIQE-compliant validation of microRNA biomarker signatures established by small RNA sequencing
Bartlett Approaches to the analysis of gene expression using mRNA: a technical overview
CN116064818A (zh) 检测igh基因重排及超突变的引物组、方法和系统
Delmonico et al. Expression concordance of 325 novel RNA biomarkers between data generated by NanoString nCounter and Affymetrix GeneChip
KR20110138341A (ko) 비암호화 rna 발현 검정법을 이용한 방법
WO2006119996A1 (en) Method of normalizing gene expression data
WO2018174862A1 (en) Methods and compositions for detecting early stage bladder cancer with rna-seq expression profiling
WO2018174863A1 (en) Methods and composition for detecting early stage colon cancer with rna-seq expression profiling
CN108707663B (zh) 用于癌症样本miRNA测序定量结果评价的试剂、制备方法和应用
CN113186262B (zh) 用于mgi平台高通量测序文库快速定量的方法及试剂盒
CN111718979B (zh) 基因扩增参考品及其应用
Suryavanshi et al. Droplet digital polymerase chain reaction offers an improvisation over conventional immunohistochemistry and fluorescent in situ hybridization for ascertaining Her2 status of breast cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant