CN112322716A - 基于tcr/bcr高通量测序的特定淋巴细胞含量分析方法及装置 - Google Patents

基于tcr/bcr高通量测序的特定淋巴细胞含量分析方法及装置 Download PDF

Info

Publication number
CN112322716A
CN112322716A CN202011336900.5A CN202011336900A CN112322716A CN 112322716 A CN112322716 A CN 112322716A CN 202011336900 A CN202011336900 A CN 202011336900A CN 112322716 A CN112322716 A CN 112322716A
Authority
CN
China
Prior art keywords
sequence
gene
sequences
tcr
bcr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011336900.5A
Other languages
English (en)
Other versions
CN112322716B (zh
Inventor
王谢
苏政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Fanyin Medical Co Ltd
Original Assignee
Shenzhen Fanyin Medical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Fanyin Medical Co Ltd filed Critical Shenzhen Fanyin Medical Co Ltd
Priority to CN202011336900.5A priority Critical patent/CN112322716B/zh
Publication of CN112322716A publication Critical patent/CN112322716A/zh
Application granted granted Critical
Publication of CN112322716B publication Critical patent/CN112322716B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法及装置,属于基因检测技术领域。该分析方法包括以下步骤:高通量测序:提取待测生物样品的基因组DNA,投入预定量人工合成的TCR/BCR编码基因内标序列,进行高通量测序;数据分析:获取上述高通量测序数据,分析得到的TCR/BCR基因序列,根据投入的内标序列计算扩增倍数;将待测样本TCR/BCR基因序列与目标淋巴细胞抗原受体基因序列A进行对比,得到与目标淋巴细胞抗原受体基因序列A一致的原始抗原受体基因序列数量、发生测序错误的序列数量、发生二次重排的序列数量、发生突变的序列数量,得到目标淋巴序列总数;通过目标淋巴序列总数和扩增倍数计算得到含有目标淋巴细胞数量,可精确确定每个T/B细胞的含量。

Description

基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法及 装置
技术领域
本发明涉及基因检测技术领域,特别是涉及一种基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法及装置。
背景技术
适应性免疫又称获得性免疫,特异性免疫细胞主要包括参与细胞免疫的T淋巴细胞和参与体液免疫的B淋巴细胞。适应性免疫具有抗原特异性和免疫记忆的特点,其抗原特异性是指不同的抗原需要由不同的淋巴细胞进行识别和应答。在临床实践中,经常需要对生物样品中特定淋巴细胞的含量进行测定(生物样品中各成分组成如图1所示),例如可通过检测是否有特定疫苗特异性的免疫细胞,来确定疫苗的免疫效果;或者对血液肿瘤的治疗后残留肿瘤细胞的检测等。
而对于淋巴细胞含量测定,目前一般有两种方法可以定量生物标本中特定淋巴细胞的含量。第一种方法是流式细胞术,由于不同的血细胞表面的分化抗原不同,例如干细胞表面表达CD34分子,髓系细胞表达CD14、CD13,B细胞表达CD10、CD20、CD19,T细胞系表达CD2、CD5等。流式细胞术可以根据抗淋巴细胞表面的细胞表面分化抗原(CD)的单克隆抗体,通过荧光染色,测定淋巴细胞的表面抗原的表达情况,从而判断出待检测细胞的属性。
第二种方法是针对淋巴细胞表面抗原受体,用特异性引物进行实时定量PCR检测(RQ-PCR)。淋巴细胞的抗原特异性是由T淋巴细胞表面的T细胞受体(T cell receptor,TCR)和细胞表面的B细胞受体(B cell receptor,BCR)或称抗体(immunoglubin,IG)的抗原识别特异性决定的。TCR/BCR是由T/B细胞基因组上的TCR/BCR基因所编码的。在T/B细胞发育过程中,TCR和BCR的基因会进行VDJ的重排,这种重排机制导致每个T/B淋巴细胞都具有不同的TCR和BCR,因而可以用TCR/BCR作为不同T/B细胞的标志物,来准确的区分每一个T/B细胞。
然而,通过流式细胞术检测,检测的是表面分化抗原相同的一类细胞的含量,并不能准确的区分每个细胞。且目前常见的流式细胞术的检测灵敏度只可达到到1/10000,对于含量低于1/10000的样品,会给出假阴性的检测结果。而在流式细胞术中,数据解读依赖于操作者和实验室,标准化程度低。最为重要的是,对于发生癌变的淋巴细胞,其表面抗原的表达在癌症发生和治疗的不同时间会发生变化,会严重影响癌细胞检测的准确性。
通过RQ-PCR进行检测,又需针对不同的目标细胞的TCR/BCR基因,设计特异性引物和定量探针,具有操作繁琐,耗时长,成本高的缺陷,且如果目标细胞TCR/BCR基因的定量探针结合区域发生了突变或者二次重排,则会发生漏检。
据此,科学家们也采用通过高通量测序的方式,针对目标细胞TCR/BCR基因进行检测,但是,目前针对TCR/BCR的高通量测序,又往往由于基因产生突变而导致具有检测偏差。并且,基于多重PCR方法的TCR/BCR研究会由于多重PCR引物体系中引物的结合效率差异及引物之间的相互作用的影响造成很大的扩增偏好,如果不对体系进行优化校正则不能准确反映出样本克隆的真实水平。且基于RACE方法的TCR/BCR研究由于只适用于RNA样本,对样本采集及运输条件较为严苛。
发明内容
基于此,有必要针对上述问题,提供一种基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法,采用该分析方法,能够精准定量检测特定目标淋巴细胞,真实反映样本克隆水平。
一种基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法,包括以下步骤:
高通量测序:提取待测生物样品的基因组DNA,获得所提取的DNA的总质量X,向其中投入预定量R条人工合成的TCR/BCR编码基因内标序列,得加标样本,将此加标样本进行高通量测序;
数据分析:获取上述高通量测序数据,分析得到的TCR/BCR基因序列,拆分得到内标序列数量Nr和待测样本TCR/BCR基因序列数量Ns;根据投入的内标序列R与测序后检出内标序列数量Nr,计算扩增倍数Mn;将所述待测样本TCR/BCR基因序列与目标淋巴细胞抗原受体基因序列A进行对比,得到与目标淋巴细胞抗原受体基因序列A一致的原始抗原受体基因序列数量Na1、目标淋巴细胞抗原受体基因发生测序错误的序列数量Na2、目标淋巴细胞抗原受体基因发生二次重排的序列数量Na3、目标淋巴细胞抗原受体基因发生突变的序列数量Na4,以Na1、Na2、Na3和Na4的总和作为目标淋巴序列总数Na;通过目标淋巴序列总数Na和扩增倍数Mn计算得到含有目标淋巴细胞数量M,即得。
上述分析方法,使用扩增体系对TCR/BCR编码基因扩增后进行文库构建,经测序后数据分析,可以精确确定每个T/B细胞的含量。
可以理解的,上述目标淋巴细胞抗原受体基因序列A中的字母“A”仅是为了便于描述,而对该序列给定的代号,并不对序列产生实际意义上的限制。
在其中一个实施例中,所述扩增倍数Mn通过以下公式计算得到:Mn=Nr/R。
在其中一个实施例中,所述目标淋巴细胞抗原受体基因发生测序错误的序列通过以下方法确定:
通过序列比对,得到与序列A具有相同V和J基因的VJ一致序列,将上述VJ一致序列的CDR3区域与序列A进行两两碱基比对,当所述VJ一致序列CDR3区域与序列A的差异碱基数小于等于差异阈值,且不一致的碱基测序质量值小于等于测序质量阈值,则将该VJ一致序列判定为目标淋巴细胞抗原受体基因发生测序错误的序列,数量计为Na2;
所述目标淋巴细胞抗原受体基因发生二次重排的序列通过以下方法确定:
通过序列比对,得到与序列A具有相同J基因的J一致序列,确定此J一致序列的CDR3区域的V基因部分和非V基因部分,分析该J一致序列上CDR3区非V基因序列与序列A上CDR3区非V基因序列的一致性,当该J一致序列的非V基因部分序列与序列A的非V基因序列一致,且该J一致序列的V基因是序列A的V基因的上游基因片段,则将该J一致序列判定为目标淋巴细胞抗原受体基因发生二次重排的序列,数量计为Na3;
所述目标淋巴细胞抗原受体基因发生突变的序列通过以下方法确定:
通过序列比对,得到与序列A具有相同V基因、J基因且CDR3长度一致的TCR/BCR基因序列,将其与序列A上的CDR3序列进行两两比对,选取与序列A上的CDR3序列相似度超过预定阈值的序列集,将此序列集中各序列进行多序列比对,构建进化树;并且将此序列集中的序列与序列A的V,D,J基因序列比对,确定每条序列的突变位点,将突变率最少的序列作为进化树的根,确定序列A在进化树上的位置,进化树中序列A之后的进化分支的序列即为目标淋巴细胞抗原受体基因发生突变的序列,数量计为Na4。
在其中一个实施例中,所述含有目标淋巴细胞数量M通过以下公式计算得到:M=Na/Mn。
在其中一个实施例中,以所提取的DNA的总质量X除以单个细胞的基因组平均重量,得到样品总细胞数N,待测生物样本中目标淋巴细胞的相对含量y通过以下公式计算得到:y=M/N×100%。
上述基因组平均重量可根据常规现有技术确定,如6±2pg,或在此范围进行调整,如6±1pg,6±0.5pg等。
在其中一个实施例中,所述高通量测序步骤中,通过以下方法对加标样本进行高通量测序:
TCR/BCR基因片段富集:向提取的DNA中加入多重PCR扩增引物,以及预定量R条人工合成的TCR/BCR编码基因内标序列,对TCR/BCR基因片段进行扩增,富集TCR/BCR基因片段;
文库构建:取上述反应产物,构建文库;
高通量测序:对上述文库进行高通量测序。
在其中一个实施例中,所述多重PCR扩增引物序列如SEQ ID NO.1-SEQ ID NO.56所示。
本发明还公开了上述的基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法在制备用于检测淋巴造血细胞肿瘤微小残留含量的试剂盒或装置中的应用。
本发明还公开了一种基于TCR/BCR高通量测序的特定淋巴细胞含量分析装置,包括:
高通量测序模块:用于提取待测生物样品的基因组DNA,获得所提取的DNA的总质量X,向其中投入预定量R条人工合成的TCR/BCR编码基因内标序列,得加标样本,将此加标样本进行高通量测序;
数据分析模块:用于获取上述高通量测序数据,分析得到的TCR/BCR基因序列,拆分得到内标序列数量Nr和待测样本TCR/BCR基因序列数量Ns;根据投入的内标序列R与测序后检出内标序列数量Nr,计算扩增倍数Mn;将所述待测样本TCR/BCR基因序列与目标淋巴细胞抗原受体基因序列A进行对比,得到与目标淋巴细胞抗原受体基因序列A完全一致的原始抗原受体基因序列数量Na1、目标淋巴细胞抗原受体基因发生测序错误的序列数量Na2、目标淋巴细胞抗原受体基因发生二次重排的序列数量Na3、目标淋巴细胞抗原受体基因发生突变的序列数量Na4,以Na1、Na2、Na3和Na4的总和作为目标淋巴序列总数Na;通过目标淋巴序列总数Na和扩增倍数Mn计算得到含有目标淋巴细胞数量M,即得。
本发明还公开了一种基于TCR/BCR高通量测序的特定淋巴细胞含量分析试剂盒,包括:
内标序列:人工合成TCR/BCR的编码基因内标序列;
多重PCR扩增引物:TCR/BCR基因扩增引物。
在其中一个实施例中,所述多重PCR扩增引物序列如SEQ ID NO.1-SEQ ID NO.56所示。
与现有技术相比,本发明具有以下有益效果:
本发明的一种基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法,使用扩增体系对TCR/BCR编码基因扩增后进行文库构建,经测序后数据分析,将各种TCR/BCR基因序列可能发生的情况纳入考虑,计算发生测序错误的序列、发生二次重排的序列以及发生突变的序列数量,与初始确定的目标淋巴细胞抗原受体基因序列进行合并,得到总目标淋巴细胞数,能够真实反映样本中目标淋巴细胞情况,找出TCR/BCR发生二次重排的细胞,以及在T/B细胞增殖过程中,发生了突变的T/B细胞;可以精确确定每个T/B细胞的含量,且可以准确区分每个具体的T/B淋巴细胞,克服了流式细胞术不能准确的区分每个细胞的问题。
并且,本发明以TCR/BCR的编码基因作为标志物,同时通过高通量测序进行数据分析,不受细胞表面抗原的表达的影响,也不需要特异性定量探针,解决了流式细胞术由于细胞表面抗原表达变化和实时定量PCR由于基因突变造成的漏检问题。
进一步的,本发明使用精心设计合成的TCR/BCR模板序列多次调整后确定的引物体系,能更精确反映样本的真实克隆水平,调整后对低频克隆检出表现良好,低至1/1000000频率的克隆都可被检测到。
同时,本发明以高通量测序方式进行分析,采用标准化流程,具有操作简便,稳定性好的优势,解决了实时定量PCR操作繁琐的问题。
附图说明
图1为背景技术中待测生物样品的组成示意图;
图2为实施例1中分析方法流程图;
图3为B细胞重链等比混合内标序列引物体系调整前V基因分布;
图4为B细胞重链等比混合内标序列引物体系调整前J基因分布;
图5为B细胞重链等比混合内标序列引物体系调整后V基因分布;
图6为B细胞重链等比混合内标序列引物体系调整后J基因分布;
图7为实施例7中内标序列8个频率最低克隆引物体系调整前、后和真实比例示意图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
以下实施例所用试剂和方法,除非特别说明,均为市售试剂和常规技术。
实施例1
淋巴造血细胞肿瘤是由淋巴细胞恶性克隆性增值引起的严重危害人体健康的恶性疾病,其中包括淋巴细胞白血病,骨髓瘤及各种淋巴瘤。
随着诊疗技术水平的增高,淋巴细胞肿瘤的诊疗水平方面得到了质的飞跃。微小残留病(MRD,Minimal residual disease)是指经诱导化疗获得完全缓解(CR,CompleteRemission)后或是骨髓移植治疗后体内残留的微量肿瘤细胞。随着化疗、特异靶向治疗、造血干细胞移植技术的不断提高,淋巴细胞肿瘤的治疗效果日益改善,然而复发仍是困扰这类疾病治愈的一个难题,微小残留病是复发的主要根源。对患者进行定期MRD检测,具有重要临床意义。
本实施例基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法,检测白血病病人化疗后骨髓样品中残留的白血病细胞,其流程如图2所述,包括以下步骤:
一、高通量测序。
1、生物样品准备
临床医生抽取白血病患者治疗前(用于确定白血病细胞的TCR/BCR标志物)和治疗后(用于检测微小残留病)的骨髓或外周血,提取基因组DNA,测定治疗后样本中所提取的DNA的总质量(X pg)。
2、TCR/BCR基因片段富集
采用多重PCR(Multiplex polymerase chain reaction)方式,向提取的基因组DNA中加入多重PCR扩增引物,对TCR/BCR基因片段进行扩增,富集TCR/BCR基因片段。
具体的,多重PCR扩增引物的5’末端有一段测序平台对应的接头序列,以便于在多重PCR后引入完整的测序接头。
同时,取300000-5000000pg DNA(相当于50000~800000个白细胞),加入2000-20000条(即R=2000-20000)人工合成的TCR/BCR基因,用QIAGEN公司的Multiplex PCRplus试剂盒(Qiagen,206152),配置如下的反应体系进行PCR:
表1.PCR扩增体系
Figure BDA0002797522760000051
Figure BDA0002797522760000061
注:X指根据所需模板量和DNA浓度所计算出的模板DNA的体积;Y指将反应体系补充到50μL所需要的纯水。
针对TCR beta链(TRB)的V基因(TRBV)引物序列及比例见表2,J基因(TRBJ)引物及比例见表3;针对BCR重链(IGH)的V基因(IGHV)引物及比例见表4,J基因(IGHJ)引物及比例见表5。
本发明人在前期试验中发现,如将扩增引物序列按照同等投入量(即质量比均为1:1)加入反应体系中,其对等量混合内标序列进行扩增后发现有较大的扩增偏差,对引物体系进行优化后可将绝大部分偏差调整至一倍以内,且对低频序列有更好的检出率。经调整后的投入量如下表所示。
表2.TRBV引物序列
Figure BDA0002797522760000062
Figure BDA0002797522760000071
上述引物序列中,在每条引物的5’端加上GACCGCTTGGCCTCCGACTT,则可用于华大智造测序平台测序,在每条引物的5’端加上ACACGACGCTCTTCCGATCT,则可用于Illumina平台测序。
表3.TRBJ引物序列
Figure BDA0002797522760000072
上述引物序列中,在每条引物的5’端加上ACATGGCTACGATCCGACTT,则可用于华大智造测序平台测序,在每条引物的5’端加上AGACGTGTGCTCTTCCGATCT,则可用于Illumina平台测序。
表4.IGHV引物序列
Figure BDA0002797522760000073
上述引物序列中,在每条引物的5’端加上GACCGCTTGGCCTCCGACTT,则可用于华大智造测序平台测序,在每条引物的5’端加上ACACGACGCTCTTCCGATCT,则可用于Illumina平台测序。
表5.IGHJ引物序列
Figure BDA0002797522760000081
上述引物序列中,在每条引物的5’端加上ACATGGCTACGATCCGACTT,则可用于华大智造测序平台测序,在每条引物的5’端加上AGACGTGTGCTCTTCCGATCT,则可用于Illumina平台测序。
以上述引物进行多重PCR扩增,对TCR/BCR基因片段进行富集,PCR反应条件如下:
Figure BDA0002797522760000082
PCR完成后使用1.0X磁珠(50μL)纯化和回收多重PCR产物,磁珠推荐使用AMPureXP(Beckman Coulter,A63882)磁珠或诺唯赞磁珠(Vazyme,N411-03)。
3、高通量测序文库构建
文库构建主要是将用于特定测序平台的测序接头引入待测序的核酸片段中,由于多重PCR引物5’末端有一段测序平台对应的部分接头序列,可以在此步使用Phusion高保真酶(NEB,M0531S)进行公用引物PCR将完整测序接头引入,反应体系如下:
表6.文库构建反应体系
DNA 23μL
公用引物1(10μM) 1μL
公用引物2(10μM) 1μL
2×Phusion Master Mix 25μL
总体积 50μL
注:其中公用引物序列见表7。
表7.公用引物序列
Figure BDA0002797522760000083
Figure BDA0002797522760000091
注:上述XXXXXX和XXXXXXXXXX为样品标签序列,上述“-”为连接符,表示序列相互连接。
上述文库构建PCR反应条件如下:
Figure BDA0002797522760000092
PCR完成后使用1.0X磁珠(50μL)纯化和回收多重测序文库。如果使用华大智造平台测序则需要对纯化文库进行环化,使用MGIEasy环化试剂盒(MGI,1000005259)进行环化,环化后使用QubitTM ssDNA Assay Kit(INVITROGEN,Q10212)对单链环化产物进行定量。
4、文库质量检测
使用Bioanalyzer 2100 analysis system(Agilent,Santa Clara,USA)检测文库插入片段大小及含量;用QPCR精确定量文库的浓度。
5、高通量测序
测序平台适用于illumina旗下Hiseq、Miseq、NextSeq、Miniseq、NovaSeq各系列,同时也适用华大智造旗下BGISEQ-500、MGISEQ-2000、MGISEQ-200、DNBSEQ-T7。根据各测序平台的使用说明书进行测序。
二、数据分析。
1、数据准备。
1)质量值过滤。
为了保证序列的准确性,需要根据碱基的质量值对序列进行质量过滤,去除质量较差的数据。
2)VDJ基因的比对和重比对。
采用BLAST软件,比对到V/D/J参考序列,在V/D/J基因的接合区域,由于基因重排时的碱基随机插入和删除,V/D/J基因末端的比对较差,因此在用BLAST比对完成之后,需对V/D/J基因的末端进行重新比对。
重新比对的原则是尽可能多地延伸比对结果,允许有错配,对末端的比对重新打分,最后分值最高的V基因,认为该序列是来自于该V基因的重排。
3)CDR3的确定和过滤。
根据V/J基因的比对方向、比对长度和比对的一致性,把重比对到VJ基因上的序列进行过滤,选取比对可信的序列,根据IMGT上的CDR3位置信息,确定CDR3在该序列的起点和终点,过滤掉起点和终点相互矛盾的序列,将对应的序列的起点和终点之间序列截取下来,即得到该序列的CDR3序列。
2、数据分析。
1)确定目标淋巴细胞的抗原受体基因序列A。
对白血病患者治疗前的样本进行检测,通过上述免疫组库技术分析,确定目标淋巴细胞的TCR/BCR基因序列(即TCR/BCR标志物),以下称为序列A。
2)检测白血病患者治疗后的样本,进行如下分析。
(1)计算样品总细胞数N
根据一个细胞的基因组的平均重量6pg,计算待测样品的总细胞数量,计算公式为:样品总细胞数N=X/6;
(2)计算扩增倍数Mn
在Xpg的基因组中加入R条人工合成TCR或BCR的编码基因(相当于R个T细胞或B细胞),这些人工合成的TCR/BCR基因序列是经过设计,在真实生物样品中不存在,因此可作为内标使用。
以混合了人工合成TCR/BCR基因的待测样品作为实验材料,通过无偏差的多重PCR扩增TCR或BCR的可变区,并进行高通量测序和数据分析,得到每个细胞的TCR/BCR基因序列共Nt条。
从Nt条TCR/BCR基因拆分出人工合成基因的序列共Nr条,其余为原待测样品的TCR/BCR基因NS条,Ns=Nt-Nr。
计算人工合成的TCR/BCR基因的扩增倍数Mn,Mn=Nr/R。
(3)计算目标淋巴序列总数Na
原始目标序列:在Ns条序列中检查目标序列A是否存在,如果存在,计算其总序列数Na1。值得注意的是,此Na1序列为与目标序列A完全一致的序列。
基因A发生测序错误的序列:搜索与序列A具有相同的V和J基因的序列,记为VJ一致序列,将这些序列的CDR3区域与序列A进行两两之间的碱基比对,如果上述VJ一致序列在CDR3区域与序列A的差异只有少数碱基(如设定差异阈值为3,即3个碱基以下),且不一致的碱基的测序质量值都很低(如测序质量值低于质量阈值15),那么这些序列被认为是由序列A产生测序错误导致的,这些序列个数计为Na2,判定为目标淋巴细胞抗原受体基因发生测序错误的序列。
基因A发生二次重排的细胞:首先确定序列A的CDR3区域的V基因部分和非V基因部分,之后寻找与序列A具有相同J基因的序列,并且CDR3的非V基因部分与序列A上非V基因部分的完全一致,只有V基因不同的J一致序列,确定序列A和J一致序列中两个V基因在染色体上的位置,如果该序列上的V基因是序列A的V基因的上游基因片段,则认为这些序列是由于序列A进行了二次的V基因重排导致的,这些序列的个数计为Na3。
增殖过程中发生突变的B细胞:寻找与序列A具有相同V和J基因、相同CDR3长度的序列,将其与序列A上的CDR3序列进行两两比对,挑选与序列A的CDR3有一定相似性的序列(如90%),将这些序列进行多序列比对(如用ClustalW2、MUSCLE等软件进行),再用构建进化树的软件将这些序列构建好进化树。同时,将各序列与重排前的V,D,J基因序列比对,确定每条序列的突变位点。在构建进化树时,将突变率最少的序列作为进化树的根。之后,确定序列A在进化树上的位置,进化树中序列A之后的进化分支的序列数即为增殖过程中发生突变的B细胞,计为Na4。
通过以上数据,计算拥有目标淋巴细胞基因A序列序列总数Na=Na1+Na2+Na3+Na4,也即目标淋巴细胞总数为Na。
(4)计算含有目标淋巴细胞数量M。
由于待测样品中的TCR/BCR基因和人工合成的TCR/BCR基因通过同样的多重PCR方法进行免疫组库测序分析,所以二者的扩增倍数是相同的,根据扩增倍数计算目标基因的原始数量,即含有目标基因A的淋巴细胞数量M=Na/Mn。
同时,还可通过下式计算待测样品中目标细胞的相对含量y,y=M/N×100%。
实施例2
一种基于TCR/BCR高通量测序的特定淋巴细胞含量分析试剂盒,包括:内标序列、多重PCR扩增引物和常规高通量测序所需试剂成分。
所述内标序列为人工合成TCR/BCR的编码基因内标序列;所述多重PCR扩增引物用于TCR/BCR基因的扩增,具体序列如实施例1中SEQ ID NO.1-SEQ ID NO.56所示。
实施例3
一种基于TCR/BCR高通量测序的特定淋巴细胞含量分析装置,包括高通量测序模块和数据分析模块。其中,高通量测序模块采用实施例2中的试剂盒,按照实施例1中高通量测序步骤进行;数据分析模块按照实施例1中数据分析步骤进行。
实施例4
按照实施例1中的方法,对一例B细胞急性淋巴白血病病人P1诊疗33天的骨髓样品进行MRD检测,具体如下:
一、高通量测序。
按照实施例1中得到方法进行测序。
二、数据分析。
1、确定目标淋巴细胞的抗原受体基因序列A。
对治疗前的骨髓样品进行IGH测序分析发现,该患者治疗前的IGH CDR3序列为TGTGCGAAAGGGGTGGGATACAGCTATGGTTTTTCTCCAAACCCCAAAAACTACTACGGTATGGACGTCTGG(SEQ IDNO.64),V基因为V1-18(按照常规定义),J基因为J3(记为S序列)的克隆,确定为白血病细胞的克隆,确定目标淋巴细胞的TCR/BCR基因序列,以下称为序列A。
2、检测白血病患者治疗后的样本。
(1)计算样品总细胞数N
对患者治疗后33天的样品用1800000pg DNA进行检测,投入序列R=10000条,根据一个细胞的基因组的平均重量6pg,计算待测样品的总细胞数量,计算公式为:样品总细胞数N=X/6=1800000/6=300000;
(2)计算扩增倍数Mn
在治疗后33天的IGH测序数据中总共检测到4124930(Nt)条IGH的序列,其中有人工合成的基因序列为106588(Nr)条,原样品中的IGH序列为4018342条(Ns)。
据此,可计算人工合成的IGH基因的扩增倍数Mn=Nr/R=106588/10000=10.6588。
(3)计算目标淋巴序列总数Na
原始目标序列分析:
经分析得知,在4018342(Ns)条序列中有160736条序列为TGTGCGAAAGGGGTGGGATACAGCTATGGTTTTTCTCCAAACCCCAAAAACTACTACGGTATGGACGTCTGG(SEQ ID NO.64),V基因V1-18和J基因J3的目标序列,即为序列A,为原始目标序列,确定为白血病细胞的克隆,该序列总数为160736条(Na1)。
测序错误的序列:搜索与序列S具有相同的V基因(V1-18)、相同J基因(J3)和相同长度的CDR3的序列,将这些序列的CDR3与S序列进行一一比较,如果在CDR3区域与序列S有错配(mismatch)碱基小于等于3个,且不一致的碱基的测序质量值均低于Q15,则认为这些序列是由序列S测序错误导致的,这些序列总数为165(Na2)。
二次重排的序列:寻找与序列S具有相同J基因(J3)的序列、CDR3的非V基因部分与序列A完全一致,并且该序列的V基因是序列S的V1-18的上游基因,比如V3-20、V3-21,这些序列被认为是由于序列S发生二次重排导致的,这些序列的个数有为345(Na3)。
发生突变的B细胞序列:寻找与序列S具有相同V(V1-18)和J基因(J3)、CDR3长度一致、CDR3的碱基相似性小于等于90%,并且序列的突变率(与重排前的V和J基因序列相比得到)比序列S的突变率更高,这些序列被认为是B细胞增殖过程中发生突变且来源于序列S的,总计为356(Na4)。
拥有基因A序列及相关序列的目标淋巴序列总数Na=Na1+Na2+Na3+Na4,通过计算得到Na=160736+165+345+356=161602。
(4)计算含有目标淋巴细胞数量M。
样品中目标基因(白血病细胞)的数量M=Na/Mn=161602/10.6588=15161.4。
样品中白血病细胞的比例(MRD)y=M/N×100%=15161.4/300000=5.05%。
该样品在流式细胞仪的检测结果为4.8%,该发明的检测结果与流式细胞仪的检测结果一致,且本发明的方法能够精准定量检测特定目标淋巴细胞,可更为真实的反应样本中白血病细胞含量。
实施例5
按照实施例1中的方法,对同一例B细胞急性淋巴白血病病人P1诊疗90天的骨髓样品进行MRD检测,具体如下:
一、高通量测序。
按照实施例1中得到方法进行测序。
二、数据分析。
1、确定目标淋巴细胞的抗原受体基因序列A。
对治疗前的骨髓样品进行IGH测序分析发现,该患者治疗前的IGH CDR3序列为TGTGCGAAAGGGGTGGGATACAGCTATGGTTTTTCTCCAAACCCCAAAAACTACTACGGTATGGACGTCTGG(SEQ IDNO.64),V基因为V1-18,J基因为J3(记为S序列)的克隆,确定为白血病细胞的克隆,确定目标淋巴细胞的TCR/BCR基因序列,以下称为序列A。
2、检测白血病患者治疗后的样本。
(1)计算样品总细胞数N
对患者治疗后90天的样品用1800000pg DNA进行检测,投入序列R=10000条,根据一个细胞的基因组的平均重量6pg,计算待测样品的总细胞数量,计算公式为:样品总细胞数N=X/6=1800000/6=300000。
(2)计算扩增倍数Mn
在治疗后90天的IGH测序数据中总共检测到3309870(Nt)条IGH的序列,其中有人工合成的基因序列为101946(Nr)条,原样品中的IGH序列为3207924条(Ns)。
据此,可计算人工合成的IGH基因的扩增倍数Mn=Nr/R=101946/10000=10.1946。
(3)计算目标淋巴序列总数Na
原始目标序列分析:
经分析得知,在3207924(Ns)条序列中,频率最高IGH序列的CDR3为TGTGCGAAAGGGGTGGGATACAGCTATGGTTTTTCTCCAAACCCCAAAAACTACTACGGTATGGACGTCTGG(SEQ ID NO.64),V基因为V1-18,J基因为J3(记为S序列)的克隆,即为序列A,为原始目标序列,确定为白血病细胞的克隆,该序列总数为22548(Na1)。
测序错误的序列:搜索与序列S具有相同的V基因(V1-18)、相同J基因(J3)和相同长度的CDR3的序列,将这些序列的CDR3与S序列进行一一比较,如果在CDR3区域与序列S有错配(mismatch)碱基小于等于3个,且不一致的碱基的测序质量值均低于Q15,则认为这些序列是由序列S测序错误导致的,这些序列总数为57(Na2)。
二次重排的的序列:寻找与序列S具有相同J基因(J3)的序列、CDR3的非V基因部分与序列A完全一致,并且该序列的V基因是序列S的V1-18的上游基因,比如V3-20、V3-21,这些序列被认为是由于序列S发生二次重排导致的,这些序列的个数有为50(Na3)
发生突变的B细胞序列:寻找与序列S具有相同V(V1-18)和J基因(J3)、CDR3长度一致、CDR3的碱基相似性小于等于90%,确定每条序列的突变率(与重排前的V和J基因序列相比得到),用MUSCLE软件对这些进行多序列比对,之后将比对结果导入Interactive Tree,得到进化树,确定序列S在进化树的位置,序列S之后的进化树分支的序列被认为是B细胞增殖过程中发生突变且来源于序列S的,总计为48(Na4)。
拥有基因A序列及相关序列的目标淋巴序列总数Na=Na1+Na2+Na3+Na4,通过计算得到Na=22548+57+50+48=22703。
(4)计算含有目标淋巴细胞数量M。
样品中目标基因(白血病细胞)的数量M=Na/Mn=22703/10.1946=2226.9。
样品中白血病细胞的比例(MRD)y=M/N×100%=2226.9/300000=0.74%
该样品在流式细胞仪的检测结果为0.7%,该发明的检测结果与流式细胞仪的检测结果一致,且本发明的方法能够精准定量检测特定目标淋巴细胞,可更为真实的反应样本中白血病细胞含量。
实施例6
按照实施例1中的方法,对一例T细胞急性淋巴白血病病人P15诊疗33天的骨髓样品进行MRD检测,具体如下:
一、高通量测序。
按照实施例1中得到方法进行测序。
二、数据分析。
1、确定目标淋巴细胞的抗原受体基因序列A’。
对治疗前的骨髓样品进行TRB测序分析发现,该患者治疗前的TRB CDR3序列为TGCAGTGCCTCGCCTCCTCCTAGCGGGAGGGGGAATGAGCAGTTCTTC(SEQ ID NO.65),V基因为V20-1,J基因为J2-7(记为K序列)的克隆,确定为白血病细胞的克隆,确定目标淋巴细胞的TCR/BCR基因序列,以下称为序列A’。
2、检测白血病患者治疗后的样本。
(1)计算样品总细胞数N
对患者治疗后33天的样品用1200000pg DNA进行检测,投入序列R=15000条,根据一个细胞的基因组的平均重量6pg,计算待测样品的总细胞数量,计算公式为:样品总细胞数N=X/6=1200000/6=200000。
(2)计算扩增倍数Mn
在治疗后33天的TRB测序数据中总共检测到4322332(Nt)条TRB的序列,其中有人工合成的基因序列为247356(Nr)条,原样品中的TRB序列为4074976条(Ns)。
据此,可计算人工合成的TRB基因的扩增倍数Mn=Nr/R=247356/15000=16.4904。
(3)计算目标淋巴序列总数Na
原始目标序列分析:
经分析得知,在4074976(Ns)条序列中,频率最高TRB序列的CDR3为TGCAGTGCCTCGCCTCCTCCTAGCGGGAGGGGGAATGAGCAGTTCTTC(SEQ ID NO.65),V基因为V20-1,J基因为J2-7(记为K序列)的克隆,即为序列A’,为原始目标序列,确定为白血病细胞的克隆,该序列总数为124385(Na1)。
测序错误的序列:搜索与序列S具有相同的V基因(V20-1)、相同J基因(J2-7)和相同长度的CDR3的序列,将这些序列的CDR3与K序列进行一一比较,如果在CDR3区域与序列K有错配(mismatch)碱基小于等于3个,且不一致的碱基的测序质量值均低于Q15,则认为这些序列是由序列K测序错误导致的,这些序列总数为257(Na2)。
二次重排的的序列:寻找与序列K具有相同J基因(J3)的序列、CDR3的非V基因部分与序列A’完全一致,并且该序列的V基因是序列K的V20-1的上游基因,比如V19、V18,这些序列被认为是由于序列K发生二次重排导致的,这些序列的个数有为213(Na3)
发生突变的T细胞序列:寻找与序列K具有相同V(V20-1)和J基因(J2-7)、CDR3长度一致、CDR3的碱基相似性小于等于90%,确定每条序列的突变率(与重排前的V和J基因序列相比得到),用MUSCLE软件对这些进行多序列比对,之后将比对结果导入InteractiveTree,得到进化树,确定序列K在进化树的位置,序列K之后的进化树分支的序列被认为是T细胞增殖过程中发生突变且来源于序列K的,总计为184(Na4)。
拥有基因A’序列及相关序列的目标淋巴序列总数Na=Na1+Na2+Na3+Na4,通过计算得到Na=124385+257+213+184=125039。
(4)计算含有目标淋巴细胞数量M。
样品中目标基因(白血病细胞)的数量M=Na/Mn=125039/16.4904=7582.5。
样品中白血病细胞的比例(MRD)y=M/N×100%=7582.5/200000=3.8%
该样品在流式细胞仪的检测结果为3.45%,该发明的检测结果与流式细胞仪的检测结果一致,且本发明的方法能够精准定量检测特定目标淋巴细胞,可更为真实的反应样本中白血病细胞含量。
实施例7
对TCR/BCR基因片段进行扩增多重PCR条件优化。
多重PCR可以在一管反应中使用多对引物对多个目标区域同时进行PCR扩增,其高效性使得多重PCR在各领域得到广泛的应用,但是由于反应体系中存在多对引物,不同对引物的扩增效率差异以及引物间的相互作用使得多重PCR存在较为严重的扩增偏差。
本实施例对实施例1中的多种PCR进行优化,具体如下:
一、以内标序列优化引物投入量。
1、内标序列真实比例分布判定
对合成内标序列两端保守序列区域设计一对PCR引物(表7),对等比混合内标序列进行单引物低循环数PCR(表8):
表8.内标序列PCR引物
Primer-F CCGCAGTGTCTTGCGTCTC(SEQ ID NO.66)
Primer-R GTTGGCAGTGACTCCGTCTC(SEQ ID NO.67)
上述引物序列中,在Primer-F的5’端加上GACCGCTTGGCCTCCGACTT,则可用于华大智造测序平台测序,在Primer-F的5’端加上ACACGACGCTCTTCCGATCT,则可用于Illumina平台测序;在Primer-R的5’端加上ACATGGCTACGATCCGACTT,则可用于华大智造测序平台测序,在Primer-R的5’端加上AGACGTGTGCTCTTCCGATCT,则可用于Illumina平台测序。
表9.PCR扩增体系
DNA XμL(5-100ng)
ddH<sub>2</sub>O YμL
5×Q5 Reaction Buffer 10μL
25mM dNTP 0.4μL
Q5 High-Fidelity DNA Polymerase 0.5μL
Primer-F(10μM) 1μL
Primer-R(10μM) 1μL
总体积 50μL
使用Q5 High-Fidelity DNA Polymerase(NEB,M0491L),配置如下的反应体系进行PCR:
Figure BDA0002797522760000161
PCR完成后使用1.0X磁珠(50μL)纯化和回收多重PCR产物,磁珠推荐使用AMPureXP(Beckman Coulter,A63882)磁珠或诺唯赞磁珠(Vazyme,N411-03)。
投入纯化后第一轮PCR产物进行第二轮PCR,引物参照表6根据所选测序平台选择合适公用引物,参照表8配置PCR反应体系,运行以下程序:
Figure BDA0002797522760000162
Figure BDA0002797522760000171
PCR完成后使用1.0X磁珠(50μL)纯化和回收多重PCR产物,磁珠推荐使用AMPureXP(Beckman Coulter,A63882)磁珠或诺唯赞磁珠(Vazyme,N411-03)。后续操作参考实施例1进行文库质检和高通量测序。
以合成内标序列集为参考序列,对下机数据进行BWA比对,确定各内标序列所占比例,设为内标序列真实比例分布。
2、引物体系调整
参考实施例1文库构建体系进行引物体系调整,对下机数据进行BWA比对,确定各内标序列引物比例调整前及调整后所占比例。图3-4分别为B细胞重链IGH引物比例调整前V、J基因比例分布示例,图5-6分别为B细胞重链IGH引物比例调整前后V、J基因比例分布示例。
将扩增引物按照质量比均为1:1的方式等量投入,在多重PCR过程中存在较为严重的扩增偏差,如图3-4所示,图中横坐标分别为不同IGHV和IGHJ扩增序列编号,纵坐标为扩增量与真实投入量的比值,从图3-4中可以看出,如按照等量投入的方式,存在较为严重的扩增偏差。
通过使用内标序列对引物体系进行不断的优化调整,按照实施例1中表4、表5所示优化比例投入引物,最终使得绝大部分扩增偏差下降至一倍以内,如图5-6所示,更为精确的反应样本的真实克隆分布情况。
二、检出率对比。
以上述优化后的多重PCR条件,对内标序列进行检测实验对比,结果如图7所示。
图7为8个检出频率最低内标序列引物体系调整前、后和真实比例示意图,该内标序列针对实际检测时检出频率最低的VJ基因组合所设计,可从该内标的检出情况反馈真实样本中相应基因检出情况;从图中可以看出,在引物比例调整后对低频序列的检出率有明显提升且扩增偏好有明显减少。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 深圳泛因医学有限公司
<120> 基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法及装置
<160> 67
<170> SIPOSequenceListing 1.0
<210> 1
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
atttcactct gaagatccgg tccac 25
<210> 2
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gcttggtgac tctgctgtgt atttc 25
<210> 3
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
caagtcgctt ctcacctgaa tg 22
<210> 4
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gccagttctc taactctcgc tct 23
<210> 5
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tcaggtcgcc agttccctaa ctat 24
<210> 6
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
cacgttggcg tctgctgtac cct 23
<210> 7
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
caggctggtg tcggctgctc cct 23
<210> 8
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gggatccgtc tccactctga cgat 24
<210> 9
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gggatccgtc tctactctga agat 24
<210> 10
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gggatctttc tccaccttgg agat 24
<210> 11
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
cctgacttgc actctgaact aaacct 26
<210> 12
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
cctcactctg gagtctgctg cc 22
<210> 13
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
cctcactctg gagtcagcta cc 22
<210> 14
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gcagagaggc tcaaaggagt agact 25
<210> 15
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gaagatccag ccctcagaac ccag 24
<210> 16
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tcgattctca gctcaacagt tc 22
<210> 17
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ggagggacgt attctactct gaagg 25
<210> 18
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ttcttgacat ccgctcacca gg 22
<210> 19
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ctgtagcctt gagatccagg ctacga 26
<210> 20
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tagatgagtc aggaatgcca aag 23
<210> 21
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ctgtgacatc ggcccaaaag aac 23
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
aaccatgcaa gcctgacctt 20
<210> 23
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ctccctgtcc ctagagtctg ccat 24
<210> 24
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gccctcacat acctctcagt acctc 25
<210> 25
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gatcctggag tcgcccagc 19
<210> 26
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
attctggagt ccgccagc 18
<210> 27
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
aactctgact gtgagcaaca tgag 24
<210> 28
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
tccttctcag tgactctggc ttctatc 27
<210> 29
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
cttacctaca actgtgagtc tggtg 25
<210> 30
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
acccccagcc ttacctaca 19
<210> 31
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
cttacctaca acagtgagcc aactt 25
<210> 32
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
aagacagaga gctgggttcc act 23
<210> 33
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
cttacctagg atggagagtc gagtc 25
<210> 34
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
cgagtcaaga gtggagccc 19
<210> 35
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ccttcttacc tagcacggtg a 21
<210> 36
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
cttacccagt acggtcagcc t 21
<210> 37
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
ccgcttaccg agcactgtca g 21
<210> 38
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
agcactgaga gccgggtcc 19
<210> 39
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
cgagcaccag gagccgcgt 19
<210> 40
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
ctcgcccagc acggtcagcc t 21
<210> 41
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
cttacctgtg accgtgagcc tg 22
<210> 42
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
cgcagaccct ctcactcac 19
<210> 43
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
tggagctgag gtgaagaagc 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
tgcaatctgg gtctgagttg 20
<210> 45
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
ggctcaggac tggtgaagc 19
<210> 46
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
tggagcagag gtgaaaaagc 20
<210> 47
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
ggtgcagctg ttggagtct 19
<210> 48
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
actgttgaag ccttcggaga 20
<210> 49
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
gtctggtcct acgctggtga aaccc 25
<210> 50
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
agtctggggc tgaggtgaag 20
<210> 51
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
ggcccaggac tggtgaag 18
<210> 52
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
ggtgcagctg gtggagtc 18
<210> 53
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
ctgaggagac agtgaccagg gt 22
<210> 54
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
ctgaggagac ggtgaccagg gt 22
<210> 55
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
ctgaagagac ggtgaccatt gt 22
<210> 56
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
ctgaggagac ggtgaccgtg gt 22
<210> 57
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
aatgatacgg cgaccaccga gatctacac 29
<210> 58
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
acactctttc cctacacgac gctcttccga tct 33
<210> 59
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
caagcagaag acggcatacg agat 24
<210> 60
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
gtgactggag ttcagacgtg tgctcttccg atct 34
<210> 61
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
gaacgacatg gctacgatcc gactt 25
<210> 62
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
tgtgagccaa ggagttg 17
<210> 63
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
ttgtcttcct aagaccgctt ggcctccgac tt 32
<210> 64
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
tgtgcgaaag gggtgggata cagctatggt ttttctccaa accccaaaaa ctactacggt 60
atggacgtct gg 72
<210> 65
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
tgcagtgcct cgcctcctcc tagcgggagg gggaatgagc agttcttc 48
<210> 66
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
ccgcagtgtc ttgcgtctc 19
<210> 67
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
gttggcagtg actccgtctc 20

Claims (10)

1.一种基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法,其特征在于,包括以下步骤:
高通量测序:提取待测生物样品的基因组DNA,获得所提取的DNA的总质量X,向其中投入预定量R条人工合成的TCR/BCR编码基因内标序列,得加标样本,将此加标样本进行高通量测序;
数据分析:获取上述高通量测序数据,分析得到的TCR/BCR基因序列,拆分得到内标序列数量Nr和待测样本TCR/BCR基因序列数量Ns;根据投入的内标序列R与测序后检出内标序列数量Nr,计算扩增倍数Mn;将所述待测样本TCR/BCR基因序列与目标淋巴细胞抗原受体基因序列A进行对比,得到与目标淋巴细胞抗原受体基因序列A一致的原始抗原受体基因序列数量Na1、目标淋巴细胞抗原受体基因发生测序错误的序列数量Na2、目标淋巴细胞抗原受体基因发生二次重排的序列数量Na3、目标淋巴细胞抗原受体基因发生突变的序列数量Na4,以Na1、Na2、Na3和Na4的总和作为目标淋巴序列总数Na;通过目标淋巴序列总数Na和扩增倍数Mn计算得到含有目标淋巴细胞数量M,即得。
2.根据权利要求1所述的基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法,其特征在于,所述目标淋巴细胞抗原受体基因发生测序错误的序列通过以下方法确定:
通过序列比对,得到与序列A具有相同V和J基因的VJ一致序列,将上述VJ一致序列的CDR3区域与序列A进行两两碱基比对,当所述VJ一致序列CDR3区域与序列A的差异碱基数小于等于差异阈值,且不一致的碱基测序质量值小于等于测序质量阈值,则将该VJ一致序列判定为目标淋巴细胞抗原受体基因发生测序错误的序列,数量计为Na2;
所述目标淋巴细胞抗原受体基因发生二次重排的序列通过以下方法确定:
通过序列比对,得到与序列A具有相同J基因的J一致序列,确定此J一致序列的CDR3区域的V基因部分和非V基因部分,分析该J一致序列上CDR3区非V基因序列与序列A上CDR3区非V基因序列的一致性,当该J一致序列的非V基因部分序列与序列A的非V基因序列一致,且该J一致序列的V基因是序列A的V基因的上游基因片段,则将该J一致序列判定为目标淋巴细胞抗原受体基因发生二次重排的序列,数量计为Na3;
所述目标淋巴细胞抗原受体基因发生突变的序列通过以下方法确定:
通过序列比对,得到与序列A具有相同V基因、J基因且CDR3长度一致的TCR/BCR基因序列,将其与序列A上的CDR3序列进行两两比对,选取与序列A上的CDR3序列相似度超过预定阈值的序列集,将此序列集中各序列进行多序列比对,构建进化树;并且将此序列集中的序列与序列A的V,D,J基因序列比对,确定每条序列的突变位点,将突变率最少的序列作为进化树的根,确定序列A在进化树上的位置,进化树中序列A之后的进化分支的序列即为目标淋巴细胞抗原受体基因发生突变的序列,数量计为Na4。
3.根据权利要求1-2任一项所述的基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法,其特征在于,所述含有目标淋巴细胞数量M通过以下公式计算得到:M=Na/Mn。
4.根据权利要求3所述的基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法,其特征在于,以所提取的DNA的总质量X除以单个细胞的基因组平均重量,得到样品总细胞数N,待测生物样本中目标淋巴细胞的相对含量y通过以下公式计算得到:y=M/N×100%。
5.根据权利要求1-2任一项所述的基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法,其特征在于,所述高通量测序步骤中,通过以下方法对加标样本进行高通量测序:
TCR/BCR基因片段富集:向提取的DNA中加入多重PCR扩增引物,以及预定量R条人工合成的TCR/BCR编码基因内标序列,对TCR/BCR基因片段进行扩增,富集TCR/BCR基因片段;
文库构建:取上述反应产物,构建文库;
高通量测序:对上述文库进行高通量测序。
6.根据权利要求5所述的基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法,其特征在于,所述多重PCR扩增引物序列如SEQ ID NO.1-SEQ ID NO.56所示。
7.权利要求1-6任一项所述的基于TCR/BCR高通量测序的特定淋巴细胞含量分析方法在制备用于检测淋巴造血细胞肿瘤微小残留含量的试剂盒或装置中的应用。
8.一种基于TCR/BCR高通量测序的特定淋巴细胞含量检测装置,包括:
高通量测序模块:用于提取待测生物样品的基因组DNA,获得所提取的DNA的总质量X,向其中投入预定量R条人工合成的TCR/BCR编码基因内标序列,得加标样本,将此加标样本进行高通量测序;
数据分析模块:用于获取上述高通量测序数据,分析得到的TCR/BCR基因序列,拆分得到内标序列数量Nr和待测样本TCR/BCR基因序列数量Ns;根据投入的内标序列R与测序后检出内标序列数量Nr,计算扩增倍数Mn;将所述待测样本TCR/BCR基因序列与目标淋巴细胞抗原受体基因序列A进行对比,得到与目标淋巴细胞抗原受体基因序列A一致的原始抗原受体基因序列数量Na1、目标淋巴细胞抗原受体基因发生测序错误的序列数量Na2、目标淋巴细胞抗原受体基因发生二次重排的序列数量Na3、目标淋巴细胞抗原受体基因发生突变的序列数量Na4,以Na1、Na2、Na3和Na4的总和作为目标淋巴序列总数Na;通过目标淋巴序列总数Na和扩增倍数Mn计算得到含有目标淋巴细胞数量M,即得。
9.一种基于TCR/BCR高通量测序的特定淋巴细胞含量检测试剂盒,包括:
内标序列:人工合成TCR/BCR的编码基因内标序列;
多重PCR扩增引物:TCR/BCR基因扩增引物。
10.根据权利要求9所示的基于TCR/BCR高通量测序的特定淋巴细胞含量检测试剂盒,其特征在于,所述多重PCR扩增引物序列如SEQ ID NO.1-SEQ ID NO.56所示。
CN202011336900.5A 2020-11-25 2020-11-25 基于tcr/bcr高通量测序的特定淋巴细胞含量分析方法及装置 Active CN112322716B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011336900.5A CN112322716B (zh) 2020-11-25 2020-11-25 基于tcr/bcr高通量测序的特定淋巴细胞含量分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011336900.5A CN112322716B (zh) 2020-11-25 2020-11-25 基于tcr/bcr高通量测序的特定淋巴细胞含量分析方法及装置

Publications (2)

Publication Number Publication Date
CN112322716A true CN112322716A (zh) 2021-02-05
CN112322716B CN112322716B (zh) 2021-07-30

Family

ID=74309472

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011336900.5A Active CN112322716B (zh) 2020-11-25 2020-11-25 基于tcr/bcr高通量测序的特定淋巴细胞含量分析方法及装置

Country Status (1)

Country Link
CN (1) CN112322716B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113736849A (zh) * 2021-08-11 2021-12-03 深圳泛因医学有限公司 同时检测tcr和hla基因分型的方法及应用
CN116042769A (zh) * 2022-08-04 2023-05-02 迈杰转化医学研究(苏州)有限公司 一种用于bcr基因重排检测的参考品及其制备方法和应用

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103710454A (zh) * 2013-12-31 2014-04-09 南方科技大学 Tcr或bcr高通量测序的方法及利用标签序列矫正多重pcr引物偏差的方法
CN104520440A (zh) * 2012-05-08 2015-04-15 适应生物技术公司 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法
WO2016090273A1 (en) * 2014-12-05 2016-06-09 Foundation Medicine, Inc. Multigene analysis of tumor samples
CN106103711A (zh) * 2013-11-21 2016-11-09 组库创世纪株式会社 T细胞受体和b细胞受体库分析系统及其在治疗和诊断中的应用
CN107038349A (zh) * 2016-02-03 2017-08-11 深圳华大基因研究院 确定重排前v/j基因序列的方法和装置
CN108624667A (zh) * 2018-05-15 2018-10-09 佛山市第人民医院(中山大学附属佛山医院) 一种基于二代测序的t细胞受体库分析方法及装置
CN111599411A (zh) * 2020-06-08 2020-08-28 谱天(天津)生物科技有限公司 一种检测血液bcr重链和轻链的引物及免疫组库方法、应用
US10774382B2 (en) * 2010-05-07 2020-09-15 The Board of Trustees of the Leland Stanford University Junior University Measurement and comparison of immune diversity by high-throughput sequencing

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10774382B2 (en) * 2010-05-07 2020-09-15 The Board of Trustees of the Leland Stanford University Junior University Measurement and comparison of immune diversity by high-throughput sequencing
CN104520440A (zh) * 2012-05-08 2015-04-15 适应生物技术公司 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法
CN106103711A (zh) * 2013-11-21 2016-11-09 组库创世纪株式会社 T细胞受体和b细胞受体库分析系统及其在治疗和诊断中的应用
CN103710454A (zh) * 2013-12-31 2014-04-09 南方科技大学 Tcr或bcr高通量测序的方法及利用标签序列矫正多重pcr引物偏差的方法
WO2016090273A1 (en) * 2014-12-05 2016-06-09 Foundation Medicine, Inc. Multigene analysis of tumor samples
CN107038349A (zh) * 2016-02-03 2017-08-11 深圳华大基因研究院 确定重排前v/j基因序列的方法和装置
CN108624667A (zh) * 2018-05-15 2018-10-09 佛山市第人民医院(中山大学附属佛山医院) 一种基于二代测序的t细胞受体库分析方法及装置
CN111599411A (zh) * 2020-06-08 2020-08-28 谱天(天津)生物科技有限公司 一种检测血液bcr重链和轻链的引物及免疫组库方法、应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YAXUAN YU等: "LymAnalyzer: a tool for comprehensive analysis of next generation sequencing data of T cell receptors and immunoglobulins", 《NUCLEIC ACIDS RES》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113736849A (zh) * 2021-08-11 2021-12-03 深圳泛因医学有限公司 同时检测tcr和hla基因分型的方法及应用
CN113736849B (zh) * 2021-08-11 2024-03-26 深圳泛因医学有限公司 同时检测tcr和hla基因分型的方法及应用
CN116042769A (zh) * 2022-08-04 2023-05-02 迈杰转化医学研究(苏州)有限公司 一种用于bcr基因重排检测的参考品及其制备方法和应用

Also Published As

Publication number Publication date
CN112322716B (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
CN104630368B (zh) 一种人运动神经元基因拷贝数相对定量检测方法及试剂盒
CN109680062B (zh) 一种检测微小残留病mrd的方法
CN112322716B (zh) 基于tcr/bcr高通量测序的特定淋巴细胞含量分析方法及装置
CN112852936A (zh) 一种应用免疫组库测序方法分析样本淋巴细胞或浆细胞的方法及其应用及其试剂盒
CN109825586A (zh) 用于肺癌检测的DNA甲基化qPCR试剂盒及使用方法
CN114657254B (zh) 用于bcr/tcr基因重排检测的试剂盒和装置
CN106957906A (zh) 一种应用于高通量测序检测t细胞白血病微小残留病的引物组合及试剂盒
Javaugue et al. RNA-based immunoglobulin repertoire sequencing is a new tool for the management of monoclonal gammopathy of renal (kidney) significance
CN108342464A (zh) 一步法检测HER2/neu基因表达量的试剂盒及其检测方法
CN114107441B (zh) 高通量测序标准物质及其制备方法和应用
CN109680054A (zh) 一种低频dna突变的检测方法
CN114480659B (zh) 一种基于多重扩增测序测定微小残留病变水平的方法
CN109652518B (zh) 一种检测微小残留病mrd的试剂盒
CN114438210B (zh) 一种基于高通量测序子宫内膜癌分子分型的文库构建方法
CN101457254B (zh) 用于肝癌预后的基因芯片和试剂盒
CN110423835A (zh) 用于下呼吸道病原微生物检测的引物组合物
CN112266963B (zh) 一种联合检测慢性粒细胞白血病检测试剂盒
CN111500749B (zh) 一种用于母猪早期妊娠诊断的外泌体miRNA标志物及其应用
CN106978479A (zh) 一种基于高通量测序检测t细胞白血病微小残留病的方法
CN114424291A (zh) 免疫组库健康评估系统和方法
CN103667270A (zh) 用于与egfr基因杂交的dna探针库及采用其富集egfr基因片段的方法
Petrova-Drus et al. Clonal characterization and somatic hypermutation assessment by next-generation sequencing in chronic lymphocytic leukemia/small lymphocytic lymphoma: a detailed description of the technical performance, clinical utility, and platform comparison
CN113736849B (zh) 同时检测tcr和hla基因分型的方法及应用
CN114480616B (zh) 一种smn2基因拷贝数变异检测试剂盒
CN116121245B (zh) 小分子rna及其在子宫内膜异位症早期诊断中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant