CN113122618B - 一种基于高通量测序精准检测t细胞免疫组库的方法及其引物体系 - Google Patents
一种基于高通量测序精准检测t细胞免疫组库的方法及其引物体系 Download PDFInfo
- Publication number
- CN113122618B CN113122618B CN202110254663.6A CN202110254663A CN113122618B CN 113122618 B CN113122618 B CN 113122618B CN 202110254663 A CN202110254663 A CN 202110254663A CN 113122618 B CN113122618 B CN 113122618B
- Authority
- CN
- China
- Prior art keywords
- primer
- sequence
- sequencing
- pcr1
- gene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提出了一种基于高通量测序精准检测T细胞免疫组库的方法及其引物体系,其中引物体系包括PCR1引物和PCR2引物,所述PCR1和PCR2引物序列包括上游V引物和下游J引物,测序接头序列和分子标签序列分别插入到所述PCR1上、下游引物的目标区域;所述PCR2引物以PCR1产物为模板,引入测序引物序列和index标签。本发明的高通量测序精准检测T细胞免疫组库的引物体系和方法,具有样品处理简便,实验操作快捷以及可实现TCR克隆簇的精准定量的特点。
Description
技术领域
本发明涉及分子生物学检测领域,尤其涉及一种基于高通量测序精准检测T细胞免疫组库的方法及其引物体系。
背景技术
T细胞受体(T cell receptor,TCR)是T细胞表面特异性识别抗原和介导免疫应答的分子,是人类基因组中多态性最高的区域之一,决定着人的免疫系统如何适应环境的变化。T细胞受体库的多样性(包括基因重组以及选择性表达)直接反映了机体免疫应答的状态。在T细胞发育过程中CDR1,2和FR区域相对保守,CDR3区由V、D和J进行重排而形成具有功能的TCR编码基因(T细胞克隆),由于V(65-100种)、D(2种)、J(13种)基因片段本身具有多样性,此外,由于在重排的过程中,在VD及D-J的连接区经常有非模板的核苷酸的随机插入或删除,进一步增加了CDR3区的多样性(连接形成的多样性约为2×1011)。这种基因片段连接的不准确性使TCR的表达呈多样性,以识别各种不同的抗原。
目前常规的T细胞受体的免疫组库测序,主要基于2大策略,第一:基于细胞DNA通过TCR基因重排规律,通过CDR3区两端的保守区设计一组引物,并在引物5’端添加部分Adaper序列,采用多重PCR的方法将CDR3区捕获下来,从而获得靶区域产物,再通过PCR将靶区域产物构建成适合高通量测序仪测序的文库。但通过PCR扩增出目的链的PCR产物,其往往存在扩增时的不均一性,从而影响结果的准确性。第二:基于细胞RNA,采用5’RACE技术及分子标签技术对逆转录形成的cDNA给予数字标签,之后引入Adaper序列进行第二次无偏好(bias)的PCR扩增,构建成适合高通量测序仪测序的文库。该方法可以对TCR免疫组库进行精准定量和检测,但是由于RNA样品处理复杂,以及受RNA表达的波动性,其重复性及特异性并不如DNA检测结果,并不是一种理想的原材料。
因此需要研发一种能够有效降低PCR扩增不均一性,从而实现DNA样本TCR克隆簇的精准定量的高通量测序精准检测T细胞免疫组库的方法。
发明内容
有鉴于此,本发明提出了一种样品处理简便、实验操作快捷,能有效消除PCR扩增的不均一性问题,实现DNA样本TCR克隆簇的精准定量的一种基于高通量测序精准检测T细胞免疫组库的方法及其引物体系。
本发明的技术方案是这样实现的:本发明提供了一种基于高通量测序精准检测T细胞免疫组库的引物体系,包括PCR1引物和PCR2引物。
在以上技术方案的基础上,优选的,所述PCR1包括上游V引物和下游J引物,测序接头序列和分子标签序列分别插入到所述PCR1上、下游引物的目标区域。
在以上技术方案的基础上,优选的,所述PCR2引物以PCR1产物为模板,引入测序引物序列和index标签。
在以上技术方案的基础上,优选的,所述PCR1引物序列的上游V基因引物和下游J基因引物的测序接头序列为长度为22个核苷酸序列组成的序列条码,其碱基序列为CTACACGACGCTCTTCCGATCT,如SEQ ID NO.1所示。
在以上技术方案的基础上,优选的,所述PCR1引物序列的上游V基因引物的分子标签序列为含有4个随机碱基的NNCCCNN序列。
在以上技术方案的基础上,优选的,下游J基因引物的分子标签序列为含有4个随机碱基的NNGGGNN序列。
在以上技术方案的基础上,优选的,N表示A、T、C和G中任意一种碱基,不同位置的N为相同或不同的碱基。
在以上技术方案的基础上,优选的,所述PCR1上游V基因引物结构从5’端到3’端均依次为:长臂段目标区域捕获引物+测序接头序列+分子标签+短臂目标区域捕获引物。
在以上技术方案的基础上,优选的,所述PCR1下游J基因引物结构从5’端到3’端均依次为:长臂段目标区域捕获引物+测序接头序列+分子标签+短臂目标区域捕获引物。
在以上技术方案的基础上,优选的,所述PCR1上游V基因引物包括:P1-TRBV2、P1-TRBV3-1、P1-TRBV4-1、P1-TRBV4-2,3、P1-TRBV5-1、P1-TRBV5-3、P1-TRBV5-4,5,6,7,8、P1-TRBV6-1、P1-TRBV6-2,3、P1-TRBV6-4、P1-TRBV6-5、P1-TRBV6-6、P1-TRBV6-7、P1-TRBV6-8、P1-TRBV6-9、P1-TRBV7-1、P1-TRBV7-2、P1-TRBV7-3、P1-TRBV7-4、P1-TRBV7-6、P1-TRBV7-7、P1-TRBV7-8、P1-TRBV7-9、P1-TRBV9、P1-TRBV10-1、P1-TRBV10-2、P1-TRBV10-3、P1-TRBV11-1,3、P1-TRBV11-2、P1-TRBV12-3,4,5、P1-TRBV13、P1-TRBV14、P1-TRBV15、P1-TRBV16、P1-TRBV17、P1-TRBV18、P1-TRBV19、P1-TRBV20-1、P1-TRBV23-1、P1-TRBV24-1、P1-TRBV25-1、P1-TRBV27、P1-TRBV28、P1-TRBV29-1和P1-TRBV30。
在以上技术方案的基础上,优选的,所述PCR1下游J基因引物包括:P1-TRBJ1.1、P1-TRBJ1.2、P1-TRBJ1.3、P1-TRBJ1-4、P1-TRBJ1.5、P1-TRBJ1.6、P1-TRBJ2.1、P1-TRBJ2.2、P1-TRBJ2.3、P1-TRBJ2.4、P1-TRBJ2.5和P1-TRBJ2.6。
在以上技术方案的基础上,优选的,所述PCR2引物中引入的index标签序列为8个碱基组成的标签序列。
在以上技术方案的基础上,优选的,所述PCR2上游引物结构从5’端到3’端均依次为:测序引物序列+接头序列,碱基序列为AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,如SEQ ID NO.2所示。
在以上技术方案的基础上,优选的,所述PCR2下游引物结构从5’端到3’端均依次为:测序引物序列+index标签+接头序列,碱基序列为CAAGCAGAAGACGGCATACGAGATXXXXXXXXGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT。
在以上技术方案的基础上,优选的,所述PCR1上游V基因引物和下游J基因引物的测序接头序列分别和PCR2上、下游引物的接头序列互补。
更进一步优选的,还包括一种基于高通量测序精准检测T细胞免疫组库的方法,PCR引物选自上述引物体系,包括以下步骤:
S1,外周血DNA提取,并用Qubit定量;
S2,PCR扩增,包括PCR1扩增和PCR2扩增,所述PCR1扩增和PCR2扩增在同一个反应体系中进行;PCR1扩增:选取PCR1引物序列中的1条上游V基因引物与至少1条下游J基因引物随机组合配对引物,进行扩增,扩增程序为:98℃变性15sec,72℃退火2min,68℃退火2min,72℃延伸15sec,68℃延伸1min,72℃延伸15sec,变性-退火-延伸程序重复循环1次;PCR2扩增:PCR1产物添加index标签序列,同时扩增,扩增程序为:98℃变性15sec,60℃退火30sec,72℃延伸45sec,变性-退火-延伸程序重复循环34次,72℃2min,4℃永久;PCR扩增结束后,利用磁珠进行PCR产物分选与纯化;
S3,高通量测序:将所得的DNA文库通过测序平台进行测序;
S4,TCR免疫组库精准信息分析,步骤如下:
S41,基于已知接头序列和分子标签中固定的CCC/GGG,确定4个随机碱基(N)的位置,将paired reads的reads1和reads2的唯一标签序列首尾相连,形成8bp的一条索引,可组成44*44=65536种组合,基于这8bp pairedreads的索引进行外部排序,以达到将来源于同一个DNA模板的测序重复reads(dup)聚集到一起的目的;
S42,对聚集起来的拥有相同索引的reads进行中心聚类,根据插入序列之间的汉明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对paired reads的汉明距离不超过3,以达到区分开拥有相同索引却来自不同DNA模板的reads的目的;
S43,对于每个DNA模板的dup簇中的reads的每一个测序碱基进行互相比对,若某种碱基型在reads中的一致率达到80%,则记新reads的这个碱基为此碱基型,否则记为N,这样便得到了代表原始DNA模板序列的新reads,通过这种方法矫正,可以有效去除测序和PCR中随机引入的错误,提高检测的准确性;
S44,基于新reads进行数据过滤,去除接头序列以及比对质量小于30的reads;
S45根据S44中得到的reads与IMGT数据库中V、D和J区基因片段的胚系参考序列进行比对注释,同时根据唯一标签对每个模板的唯一标记,对各免疫亚克隆进行统计定量。
在以上技术方案的基础上,优选的,所述PCR引物体系中PCR1引物插入的测序接头序列和PCR2引物选自IlluminaMiSeq测序平台、BGI-Seq测序平台和Life测序平台中的一种,步骤S3所述高通量测序平台与PCR引物体系所选序列平台对应。
本发明的一种基于高通量测序精准检测T细胞免疫组库的方法及其引物体系相对于现有技术具有以下有益效果:
本发明利用外周血样品开发了一种基于高通量测序精准检测T细胞免疫组库的方法,该方法具有样品处理简便,实验操作快捷以及可实现TCR克隆簇的精准定量的特点。
(1)样品处理简便:基于外周血中的淋巴细胞DNA进行免疫组库扩增,样品取样方便,获取的DNA稳定、易存储,波动小,能更真实反映患者的免疫样貌。
(2)实验操作快捷:本发明通过将接头序列和分子标签插入到PCR1引物的目标区域捕获引物中间,形成长短目标区域引物结构,从而改变PCR1引物的TM值。通过设计PCR1和PCR2引物体系间TM值的显著差异(PCR1平均TM值比PCR2 TM值大5-6度),以实现PCR1和PCR2引物和样品在一个反应管,一个扩增体系程序下分步有序的进行,实验操作简便快捷,消除多个纯化步骤,尽可能避免了捕获模板的损失。
(3)可实现TCR克隆簇的精准定量:本发明引入分子标签,通过分子标签中固定的CCC/GGG,可实现对每个原始模板进行标记,有效降低了扩增时的偏好性及扩增错误,能精准对每个TCR克隆簇定量分析。
(4)本发明扩增产物几乎囊括了所有TCR Beta链CDR3区的免疫多态性,从而可以更全面准确的进行免疫状态的评估,此外基于本发明的原理也能设计BCR相似的扩增体系,从而实现TCR/BCR综合性的免疫状态评估。
(5)本发明引物体系以及高通量测序精准检测T细胞免疫组库的方法,不限于Illumina测序平台,PCR1引物插入的测序接头序列和PCR2引物也可选自BGI-Seq测序平台和Life测序平台,高通量测序平台与PCR引物体系所选序列平台对应,实现多平台精准测序。
(6)本发明所涉及的PCR引物体系以及建库方法流程,还可以制备相关疾病(恶性肿瘤,自身免疫病、干细胞和器官移植等)相关的诊断检测试剂盒的应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明TCR测序分析结果图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
1.DNA提取与打断
取1例外周血样品,按照QIAamp DNABLoodMini Kit(Qiagen)提取试剂盒说明书,进行外周血DNA提取,之后采用Qubit定量,要求血液DNA至少大于600ng。
2.TCRBeta链CDR3区特异性带有分子标签的多重PCR引物的扩增
TCRBeta链CDR3区特异性带有分子标签的多重PCR引物体系:该引物体系总共由2组引物构成,PCR1引物和PCR2引物,PCR1引物是基于TCR Beta链CDR3区进行设计,带有分子标签,该引物的作用是一方面将TCR Beta链CDR3区全部扩增出(TCR CDR3区刚好覆盖TRBV-Junction-TRBD-Junction-TRBJ区域,由于变异最大,从而直接决定了TCR的抗原特异性),另一方面在扩增时实现对每个原始分子模板实现数字标记,为后续精准定量奠定基础。PCR2引物为测序通用引物,其基于PCR1产物为模板,通过PCR2引物引入测序index标签以及测序序列,以实现完整测序文库的构建。
2.1TCRPCR1扩增引物上下游引物体系设计原理及引物结构
人TCR Beta链CDR3区V基因家族包含45个功能性基因家族和13种J区基因片段,因此根据基因的同源性总共设计46条上游引物和13条下游引物;通过上下游引物的随机配对从而实现人TCR Beta链CDR3区(VDJ)区域的全面捕获扩增。为实现分子标签技术以及实验操作的简便性以保证扩增成功,本发明设计的TCR PCR1上下游引物具有一定的特异性:
(1)TCR PCR2扩增引物上下游引物体系设计原理及引物结构
PCR1引物结构:上游V基因引物结构:从5’端到3’端均依次为,长臂段目标区域捕获引物+测序接头序列+NNCCCNN分子标签+短臂目标区域捕获引物。下游J基因引物结构:从5’端到3’端均依次为,长臂段目标区域捕获引物+测序接头序列+NNGGGNN分子标签+短臂目标区域捕获引物,其中为N表示A、T、C和G中任意一种碱基,不同位置的N为相同或不同的碱基,PCR1上游引物序列如SEQ ID NO.4-48所示;下游引物如SEQ ID NO.49-64所示。
本发明以现有成熟的Illumina平台的接头序列(Adapter)作为参考设计,本发明也同样可以根据其他测序平台的接头序列设计对应平台的TCR PCR1扩增体系引物,接头序列设计为22bp可有效满足PCR2扩增时引物的互补结合与实验稳定,其碱基序列为CTACACGACGCTCTTCCGATCT,如SEQ ID NO.1所示。
分子标签序列设计为上下游均为4个N的随机碱基,因此PCR1扩增后可形成44*44=65536种组合,足够对应600ng外周血DNA中免疫细胞的多态性检测(600ng*20%淋巴细胞*330copy/ng=36000)。分子标签中固定插入的CCC/GGG是用于进一步增大PCR1引物与PCR2引物的TM值差异以及数据分析时的分子标签位置定位。
本发明测序接头序列+NNCCCNN分子标签序列分别插入到上下游目标区域引物中,通过控制插入替换部分目标区域引物序列位置,以实现有效PCR1引物与PCR2引物间的TM值差异以及PCR1目标区域捕获引物与DNA结合的TM值统一的平衡。
表1 TCR-PCR1上游引物体系
表2 TCR-PCR1下游引物体系
引物名称 | 引物序列(5’→3’) | SEQ ID NO |
P1-TRBJ1.1 | cttacctacaactgtgacagacgtgtgctcttccgatctnngggnngtctggtg | 49 |
P1-TRBJ1.2 | cttacctacaacggttacagacgtgtgctcttccgatctnngggnnacctggtc | 50 |
P1-TRBJ1.3 | cttacctacaacagtgcagacgtgtgctcttccgatctnngggnnagccaactt | 51 |
P1-TRBJ1-4 | aagacagagagctgcagacgtgtgctcttccgatctnngggnnggttccact | 52 |
P1-TRBJ1.5 | cttacctaggatggagacagacgtgtgctcttccgatctnngggnngtcgagtc | 53 |
P1-TRBJ1.6 | catacctgtcacagcagacgtgtgctcttccgatctnngggnntgagcctg | 54 |
P1-TRBJ2.1 | ccttcttacctagccagacgtgtgctcttccgatctnngggnnacggtga | 55 |
P1-TRBJ2.2 | cttacccagtacgcagacgtgtgctcttccgatctnngggnngtcagcct | 56 |
P1-TRBJ2.3 | ccgcttaccgagcacagacgtgtgctcttccgatctnngggnnctgtcag | 57 |
P1-TRBJ2.4 | agcactgagagcagacgtgtgctcttccgatctnngggnnccgggtcc | 58 |
P1-TRBJ2.5 | cgagcaccaggacagacgtgtgctcttccgatctnngggnngccgcgt | 59 |
P1-TRBJ2.6 | ctcgcccagcacggcagacgtgtgctcttccgatctnngggnntcagcct | 60 |
P1-TRBJ1.1 | cttacctacaactgtgacagacgtgtgctcttccgatctnngggnngtctggtg | 61 |
P1-TRBJ1.2 | cttacctacaacggttacagacgtgtgctcttccgatctnngggnnacctggtc | 62 |
P1-TRBJ1.3 | cttacctacaacagtgcagacgtgtgctcttccgatctnngggnnagccaactt | 63 |
P1-TRBJ1-4 | aagacagagagctgcagacgtgtgctcttccgatctnngggnnggttccact | 64 |
(2)TCR PCR2扩增引物上下游引物体系设计原理及引物结构
PCR2上下游引物是参照Illumina测序平台的通用扩增引物进行设计,本发明也同样可以根据其他测序平台的接头序列设计对应平台的TCR PCR1扩增体系引物。引物结构为:上游引物结构:从5’端到3’端均依次为,测序引物序列+接头序列,碱基序列为AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,如SEQ ID NO.2所示;下游引物结构:从5’端到3’端均依次为,测序引物序列+8个已知固定碱基(index)+接头序列,碱基序列为CAAGCAGAAGACGGCATACGAGATXXXXXXXXGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT;PCR2引物体系中的接头序列与PCR1上下游引物中的接头序列互补,同时8个已知固定碱基(index)序列,是作为测序标签序列,用于混合测序时样品间的区分,index标签序列以Illumina平台序列的ATCTATCG为例,PCR2下游引物序列如SEQ ID NO.3所示。
表3 TCR PCR2引物体系
引物名称 | 引物序列(5’→3’) | SEQ ID NO |
上游引物 | aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct | 2 |
下游引物 | caagcagaagacggcatacgagatatctatcggtgactggagttcagacgtgtgctcttccgatct | 3 |
(3)TCR Beta链CDR3区简易扩增程序
由于外周血中只有20%左右淋巴细胞代表着相关免疫细胞,同时为保证分子标签能有效进行原始分子的标记,PCR1多重扩增捕获时,只能进行2个cycle的扩增循环,因而基于多重PCR扩增时捕获的原始TCR目的片段极其微量,需尽可能减少纯化等损失。因此本发明通过设计PCR1和PCR2引物体系间TM值的显著差异(PCR1平均TM值比PCR2 TM值大5-6度),合理的扩增程序设置,以实现所有引物和样品在一个反应管,一个扩增体系程序下分步有序的进行,极大的减少了有效扩增产物的损失,同时也简化了实验操作流程。
TCRBeta链CDR3区简易扩增程序如下:
S1,TCR PCR1上下游引物分别进行混合,形成TCR PCR1上下游引物MIX,且下游单个引物浓度为上游单个引物浓度的20倍左右。
S2,样品扩增准备,于无菌1.5ml PCR管中,按照表4配置扩增反应试剂。
表4扩增反应试剂
名称 | 体积(μL) |
2x KAPA PCR ReadyMix | 12.5 |
PCR1上游引物MIX | 1 |
PCR1下游引物MIX | 1 |
PCR2上游引物 | 0.5 |
PCR2上游引物 | 0.5 |
样品DNA | 600ng(X) |
ddH2O | Up to 25μL |
S3,使用移液器轻轻吹打或振荡混匀,并短暂离心将反应液离心至管底,之后置于PCR仪上,设置TCR Beta链CDR3区简易扩增程序,扩增程序见表5。
表5 TCR Beta链CDR3区简易扩增程序
阶段 | 步骤 | 温度(℃)设置 | 时间 |
激活准备 | 1 | 98 | 5min |
变性 | 2 | 98 | 15sec |
PCR1引物退火1 | 3 | 72 | 2min |
PCR1引物退火2 | 4 | 68 | 2min |
PCR1引物延伸1 | 5 | 72 | Ramp up0.2℃/s |
PCR1引物延伸2 | 6 | 72 | 15sec |
PCR1引物延伸3 | 7 | 68 | Ramp up0.2℃/s |
PCR1引物延伸4 | 8 | 68 | 1min |
PCR1引物延伸5 | 9 | 72 | Ramp up0.2℃/s |
PCR1引物延伸6 | 10 | 72 | 15sec |
GOTO步骤2重复1次 | 11 | ||
PCR2引物变性 | 12 | 98 | 15sec |
PCR2引物退火 | 13 | 60 | 30sec |
PCR2引物延伸 | 14 | 72 | 45sec |
GOTO步骤12重复34次 | 15 | ||
扩增结束准备1 | 16 | 72 | 2min |
扩增结束准备2 | 17 | 4 | forever |
S4,PCR产物纯化,对S3步骤的产物进行片段分选与纯化,吸取20μL DNASelection Beads(0.6×,Beads:DNA=0.8:1)至PCR产物中进行磁珠PCR产物分选与纯化流程。
纯化产物需进行Qubit-BR定量和2100质控。通常合格的文库产物要求浓度大于20ng/μL,目标片段主峰约380bp。
3高通量测序
文库质控合格后,基于Illumina测序仪进行PE150上机测序,测序模式为PE150,文库变性浓度为2nM,上机浓度为25pM,测序实验操作按照制造商提供的操作说明书进行上机测序操作。
4TCR Beta链CDR3区精准信息分析
TCRBeta链CDR3区精准信息分析步骤如下:
S1,基于已知接头序列及分子标签中固定的CCC/GGG,确定4个随机碱基(N)的位置,将paired reads的reads1和reads2的唯一标签序列首尾相连,形成8bp的一条索引,可组成44*44=65536种组合,基于这8bp paired reads的索引进行外部排序,以达到将来源于同一个DNA模板的测序重复reads(dup)聚集到一起的目的。
S2,对聚集起来的拥有相同索引的reads进行中心聚类,根据插入序列之间的汉明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对paired reads的汉明距离不超过3,以达到区分开拥有相同索引却来自不同DNA模板的reads的目的。
S3,对于每个DNA模板的dup簇中的reads的每一个测序碱基进行互相比对,若某种碱基型在reads中的一致率达到80%,则记新reads的这个碱基为此碱基型,否则记为N,这样便得到了代表原始DNA模板序列的新reads,通过这种方法矫正,可以有效去除测序和PCR中随机引入的错误,提高检测的准确性。
S4,基于新reads进行数据过滤,去除接头序列以及比对质量小于30的reads。
S5,根据S4中得到的reads与IMGT数据库中V、D和J区基因片段的胚系参考序列进行比对注释,同时根据唯一标签对每个模板的唯一标记,对各免疫亚克隆进行统计定量。
S6,基于S5的结果进行其他相关分析,如序列结构分析,免疫组库表达谱分析、Biomarker分析等。
5测序结果分析
通过1例乳腺癌术后患者的血浆样品,基于以上方法步骤进行检测:
图1为一个样本的Beta链CDR3区V-J基因图,反映了免疫系统免疫细胞的多样性,多样性越高,系统越稳定,对抗原的抵抗力也越强。图1表明本发明提供的引物组覆盖了大部分VJ基因片段,患者T淋巴细胞V、J基因亚型分布均一,T淋巴细胞组库多样性好,患者术后总体免疫状态良好。
本发明引物体系以及高通量测序精准检测T细胞免疫组库的方法,不限于Illumina平台,PCR1引物插入的测序接头序列和PCR2引物也可选自BGI-Seq测序平台和Life测序平台,高通量测序平台与PCR引物体系所选序列平台对应。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 武汉弘康医学检验实验室股份有限公司
<120> 一种基于高通量测序精准检测T细胞免疫组库的方法及其引物体系
<130> 2021
<160> 64
<170> SIPOSequenceListing 1.0
<210> 1
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ctacacgacg ctcttccgat ct 22
<210> 2
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 3
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
caagcagaag acggcatacg agatatctat cggtgactgg agttcagacg tgtgctcttc 60
cgatct 66
<210> 4
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (32)..(38)
<223> n is a,c,g,or t
<400> 4
tctgaagatc tacacgacgc tcttccgatc tnncccnncc ggtccacaa 49
<210> 5
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (33)..(39)
<223> n is a,c,g,or t
<400> 5
tcttcacatc ctacacgacg ctcttccgat ctnncccnna attccctgg 49
<210> 6
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 6
tcacctacct acacgacgct cttccgatct nncccnnacg ccctgc 46
<210> 7
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (32)..(38)
<223> n is a,c,g,or t
<400> 7
tcacctacac tacacgacgc tcttccgatc tnncccnnca ccctgc 46
<210> 8
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 8
atgaatgtct acacgacgct cttccgatct nncccnngag caccttg 47
<210> 9
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (32)..(38)
<223> n is a,c,g,or t
<400> 9
gatgaatgtc tacacgacgc tcttccgatc tnncccnnga gtgccttg 48
<210> 10
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (32)..(38)
<223> n is a,c,g,or t
<400> 10
tgaatgtgac tacacgacgc tcttccgatc tnncccnnac gccttg 46
<210> 11
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 11
caggctgcta cacgacgctc ttccgatctn ncccnngagt cggctg 46
<210> 12
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 12
gttggagtct acacgacgct cttccgatct nncccnncgg ctg 43
<210> 13
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 13
cgttggcgct acacgacgct cttccgatct nncccnntct gctg 44
<210> 14
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 14
ggctgctcta cacgacgctc ttccgatctn ncccnngtcg gctg 44
<210> 15
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 15
aggctggact acacgacgct cttccgatct nncccnngtt ggctg 45
<210> 16
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 16
caagctgcta cacgacgctc ttccgatctn ncccnngagt cagctg 46
<210> 17
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 17
aggctggtct acacgacgct cttccgatct nncccnngtc ggctg 45
<210> 18
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 18
aggctggact acacgacgct cttccgatct nncccnngtc agctg 45
<210> 19
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 19
tgaagttcct acacgacgct cttccgatct nncccnncag cgcacac 47
<210> 20
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (32)..(38)
<223> n is a,c,g,or t
<400> 20
gacgatccac tacacgacgc tcttccgatc tnncccnngc gcacac 46
<210> 21
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (32)..(38)
<223> n is a,c,g,or t
<400> 21
ctgaagatcc tacacgacgc tcttccgatc tnncccnnca gcgcacag 48
<210> 22
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 22
gaagatccta cacgacgctc ttccgatctn ncccnncagc gcacag 46
<210> 23
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (29)..(35)
<223> n is a,c,g,or t
<400> 23
gacgatctac acgacgctct tccgatctnn cccnnccagc gcacag 46
<210> 24
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 24
gacgattcta cacgacgctc ttccgatctn ncccnncagc gcacag 46
<210> 25
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 25
gaagatccct acacgacgct cttccgatct nncccnnagc gcacac 46
<210> 26
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (32)..(38)
<223> n is a,c,g,or t
<400> 26
agatccagcc tacacgacgc tcttccgatc tnncccnngc acag 44
<210> 27
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 27
taaacctcta cacgacgctc ttccgatctn ncccnngagc tctctg 46
<210> 28
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 28
ctctggacta cacgacgctc ttccgatctn ncccnngtct gctg 44
<210> 29
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 29
cactctggct acacgacgct cttccgatct nncccnnagt cagcta 46
<210> 30
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 30
actctggcta cacgacgctc ttccgatctn ncccnnagtc cgcta 45
<210> 31
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 31
caagatccct acacgacgct cttccgatct nncccnnagc ctgcag 46
<210> 32
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 32
tcaagatcct acacgacgct cttccgatct nncccnncag cctgcaa 47
<210> 33
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 33
gatccagcta cacgacgctc ttccgatctn ncccnnccct cag 43
<210> 34
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 34
gaacatgcta cacgacgctc ttccgatctn ncccnnagct ccttgg 46
<210> 35
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (32)..(38)
<223> n is a,c,g,or t
<400> 35
gaaggtgcac tacacgacgc tcttccgatc tnncccnngc ctgcag 46
<210> 36
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 36
atccaggact acacgacgct cttccgatct nncccnnggc cgaaca 46
<210> 37
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 37
gagatcccta cacgacgctc ttccgatctn ncccnnaggc tacga 45
<210> 38
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (32)..(38)
<223> n is a,c,g,or t
<400> 38
tgaagatccc tacacgacgc tcttccgatc tnncccnnat cccg 44
<210> 39
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 39
ggatccacta cacgacgctc ttccgatctn ncccnngcag gtag 44
<210> 40
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 40
cactgtgcta cacgacgctc ttccgatctn ncccnnacat cggccc 46
<210> 41
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 41
ctctgaccta cacgacgctc ttccgatctn ncccnnagtg accagtg 47
<210> 42
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 42
gcaatcccta cacgacgctc ttccgatctn ncccnntgtc ctcag 45
<210> 43
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 43
tccctagcta cacgacgctc ttccgatctn ncccnnagtc tgccat 46
<210> 44
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (30)..(36)
<223> n is a,c,g,or t
<400> 44
accctggcta cacgacgctc ttccgatctn ncccnnagtc tgccat 46
<210> 45
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 45
atcctggact acacgacgct cttccgatct nncccnngtc gccca 45
<210> 46
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 46
tgattctgct acacgacgct cttccgatct nncccnngag tccgcca 47
<210> 47
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 47
actctgacct acacgacgct cttccgatct nncccnntgt gagcaaca 48
<210> 48
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (31)..(37)
<223> n is a,c,g,or t
<400> 48
tcctgagtct acacgacgct cttccgatct nncccnntct aagaagc 47
<210> 49
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (40)..(46)
<223> n is a,c,g,or t
<400> 49
cttacctaca actgtgacag acgtgtgctc ttccgatctn ngggnngtct ggtg 54
<210> 50
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (40)..(46)
<223> n is a,c,g,or t
<400> 50
cttacctaca acggttacag acgtgtgctc ttccgatctn ngggnnacct ggtc 54
<210> 51
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (39)..(45)
<223> n is a,c,g,or t
<400> 51
cttacctaca acagtgcaga cgtgtgctct tccgatctnn gggnnagcca actt 54
<210> 52
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (37)..(43)
<223> n is a,c,g,or t
<400> 52
aagacagaga gctgcagacg tgtgctcttc cgatctnngg gnnggttcca ct 52
<210> 53
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (40)..(46)
<223> n is a,c,g,or t
<400> 53
cttacctagg atggagacag acgtgtgctc ttccgatctn ngggnngtcg agtc 54
<210> 54
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (37)..(43)
<223> n is a,c,g,or t
<400> 54
catacctgtc acagcagacg tgtgctcttc cgatctnngg gnntgagcct g 51
<210> 55
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (37)..(43)
<223> n is a,c,g,or t
<400> 55
ccttcttacc tagccagacg tgtgctcttc cgatctnngg gnnacggtga 50
<210> 56
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (36)..(42)
<223> n is a,c,g,or t
<400> 56
cttacccagt acgcagacgt gtgctcttcc gatctnnggg nngtcagcct 50
<210> 57
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (37)..(43)
<223> n is a,c,g,or t
<400> 57
ccgcttaccg agcacagacg tgtgctcttc cgatctnngg gnnctgtcag 50
<210> 58
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (34)..(40)
<223> n is a,c,g,or t
<400> 58
agcactgaga gcagacgtgt gctcttccga tctnngggnn ccgggtcc 48
<210> 59
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (35)..(41)
<223> n is a,c,g,or t
<400> 59
cgagcaccag gacagacgtg tgctcttccg atctnngggn ngccgcgt 48
<210> 60
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (37)..(43)
<223> n is a,c,g,or t
<400> 60
ctcgcccagc acggcagacg tgtgctcttc cgatctnngg gnntcagcct 50
<210> 61
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (40)..(46)
<223> n is a,c,g,or t
<400> 61
cttacctaca actgtgacag acgtgtgctc ttccgatctn ngggnngtct ggtg 54
<210> 62
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (40)..(46)
<223> n is a,c,g,or t
<400> 62
cttacctaca acggttacag acgtgtgctc ttccgatctn ngggnnacct ggtc 54
<210> 63
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (39)..(45)
<223> n is a,c,g,or t
<400> 63
cttacctaca acagtgcaga cgtgtgctct tccgatctnn gggnnagcca actt 54
<210> 64
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (37)..(43)
<223> n is a,c,g,or t
<400> 64
aagacagaga gctgcagacg tgtgctcttc cgatctnngg gnnggttcca ct 52
Claims (7)
1.一种基于高通量测序精准检测T细胞免疫组库的引物体系,其特征在于,包括PCR1引物和PCR2引物,所述PCR1包括上游V引物和下游J引物,测序接头序列和分子标签序列分别插入到所述PCR1上、下游引物的目标区域;所述PCR2引物以PCR1产物为模板,引入测序引物序列和index标签;
所述PCR1引物序列的上游V基因引物和下游J基因引物的测序接头序列为长度为22个核苷酸序列组成的序列条码,其碱基序列为CTACACGACGCTCTTCCGATCT,如SEQ ID NO.1所示;
所述PCR1引物序列的上游V基因引物的分子标签序列为含有4个随机碱基的NNCCCNN序列;下游J基因引物的分子标签序列为含有4个随机碱基的NNGGGNN序列;N表示A、T、C和G中任意一种碱基,不同位置的N为相同或不同的碱基;
所述PCR1上游V基因引物结构从5’端到3’端均依次为:长臂段目标区域捕获引物+测序接头序列+分子标签+短臂目标区域捕获引物;所述PCR1下游J基因引物结构从5’端到3’端均依次为:长臂段目标区域捕获引物+测序接头序列+分子标签+短臂目标区域捕获引物;
所述PCR1上游V基因引物有45条,其核苷酸序列如SEQ ID NO.4-48所示,所述PCR1下游J基因引物有16条,其核苷酸序列如SEQ ID NO.49-64所示。
2.如权利要求1所述一种基于高通量测序精准检测T细胞免疫组库的引物体系,其特征在于,所述PCR1上游V基因引物包括:P1-TRBV2、P1-TRBV3-1、P1-TRBV4-1、P1-TRBV4-2,3、P1-TRBV5-1、P1-TRBV5-3、P1-TRBV5-4,5,6,7,8、P1-TRBV6-1、P1-TRBV6-2,3、P1-TRBV6-4、P1-TRBV6-5、P1-TRBV6-6、P1-TRBV6-7、P1-TRBV6-8、P1-TRBV6-9、P1-TRBV7-1、P1-TRBV7-2、P1-TRBV7-3、P1-TRBV7-4、P1-TRBV7-6、P1-TRBV7-7、P1-TRBV7-8、P1-TRBV7-9、P1-TRBV9、P1-TRBV10-1、P1-TRBV10-2、P1-TRBV10-3、P1-TRBV11-1,3、P1-TRBV11-2、P1-TRBV12-3,4,5、P1-TRBV13、P1-TRBV14、P1-TRBV15、P1-TRBV16、P1-TRBV17、P1-TRBV18、P1-TRBV19、P1-TRBV20-1、P1-TRBV23-1、P1-TRBV24-1、P1-TRBV25-1、P1-TRBV27、P1-TRBV28、P1-TRBV29-1和P1-TRBV30;所述PCR1下游J基因引物包括:P1-TRBJ1.1、P1-TRBJ1.2、P1-TRBJ1.3、P1-TRBJ1-4、P1-TRBJ1.5、P1-TRBJ1.6、P1-TRBJ2.1、P1-TRBJ2.2、P1-TRBJ2.3、P1-TRBJ2.4、P1-TRBJ2.5和P1-TRBJ2.6。
3.如权利要求1所述一种基于高通量测序精准检测T细胞免疫组库的引物体系,其特征在于,所述PCR2引物中引入的index标签序列为8个碱基组成的标签序列。
4.如权利要求3所述一种基于高通量测序精准检测T细胞免疫组库的引物体系,其特征在于,所述PCR2上游引物结构从5’端到3’端均依次为:测序引物序列+接头序列,碱基序列为AATGATACGGCGACCACCGAGATCTACACT CTTTCCCTACACGACGCTCTTCCGATCT,如SEQ ID NO.2所示;所述PCR2下游引物结构从5’端到3’端均依次为:测序引物序列+index标签+接头序列,碱基序列为CAAGCAGAAGACGGCATACGAGATXXXXXXXXGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT。
5.如权利要求4所述一种基于高通量测序精准检测T细胞免疫组库的引物体系,其特征在于,所述PCR1上游V基因引物和下游J基因引物的测序接头序列分别与PCR2上、下游引物的接头序列互补。
6.一种基于高通量测序精准检测T细胞免疫组库的方法,其特征在于,PCR引物为权利要求5所述的引物体系,包括以下步骤:
S1,外周血DNA提取,并用Qubit定量;
S2,PCR扩增,包括PCR1扩增和PCR2扩增,所述PCR1扩增和PCR2扩增在同一个反应体系中进行;PCR1扩增:选取PCR1引物序列中的1条上游V基因引物与至少1条下游J基因引物随机组合配对引物,进行扩增,扩增程序为:98℃变性15sec,72℃退火2min,68℃退火2min,72℃延伸15sec,68℃延伸1min,72℃延伸15sec,变性-退火-延伸程序重复循环1次;PCR2扩增:PCR1产物添加index标签序列,同时扩增,扩增程序为:98℃变性15sec,60℃退火30sec,72℃延伸45sec,变性-退火-延伸程序重复循环34次,72℃ 2min,4℃永久;PCR扩增结束后,利用磁珠进行PCR产物分选;
S3,高通量测序:将所得的DNA文库通过测序平台进行测序;
S4,TCR免疫组库精准信息分析,步骤如下:
S41,基于已知接头序列和分子标签中固定的CCC/GGG,确定4个随机碱基N的位置,将paired reads的reads1和reads2的唯一标签序列首尾相连,形成8bp的一条索引,可组成44*44=65536种组合,基于这8bp paired reads的索引进行外部排序,以达到将来源于同一个DNA模板的测序重复reads聚集到一起的目的;
S42,对聚集起来的拥有相同索引的reads进行中心聚类,根据插入序列之间的汉明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对paired reads的汉明距离不超过3,以达到区分开拥有相同索引却来自不同DNA模板的reads的目的;
S43,对于每个DNA模板的dup簇中的reads的每一个测序碱基进行互相比对,若某种碱基型在reads中的一致率达到80%,则记新reads的这个碱基为此碱基型,否则记为N,这样便得到了代表原始DNA模板序列的新reads,通过这种方法矫正,可以有效去除测序和PCR中随机引入的错误,提高检测的准确性;
S44,基于新reads进行数据过滤,去除接头序列以及比对质量小于30的reads;
S45,根据S44中得到的reads与IMGT数据库中V、D和J区基因片段的胚系参考序列进行比对注释,同时根据唯一标签对每个模板的唯一标记,对各免疫亚克隆进行统计定量。
7.如权利要求6所述一种基于高通量测序精准检测T细胞免疫组库的方法,其特征在于,所述PCR引物体系中PCR1引物插入的测序接头序列和PCR2引物选自Illumina MiSeq测序平台、BGI-Seq测序平台和Life测序平台中的一种,步骤S3所述高通量测序平台与PCR引物体系所选序列平台对应。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110254663.6A CN113122618B (zh) | 2021-03-09 | 2021-03-09 | 一种基于高通量测序精准检测t细胞免疫组库的方法及其引物体系 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110254663.6A CN113122618B (zh) | 2021-03-09 | 2021-03-09 | 一种基于高通量测序精准检测t细胞免疫组库的方法及其引物体系 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113122618A CN113122618A (zh) | 2021-07-16 |
CN113122618B true CN113122618B (zh) | 2023-07-14 |
Family
ID=76772957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110254663.6A Active CN113122618B (zh) | 2021-03-09 | 2021-03-09 | 一种基于高通量测序精准检测t细胞免疫组库的方法及其引物体系 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113122618B (zh) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9528160B2 (en) * | 2008-11-07 | 2016-12-27 | Adaptive Biotechnolgies Corp. | Rare clonotypes and uses thereof |
US9394567B2 (en) * | 2008-11-07 | 2016-07-19 | Adaptive Biotechnologies Corporation | Detection and quantification of sample contamination in immune repertoire analysis |
CN117106868A (zh) * | 2013-11-26 | 2023-11-24 | 杭州联川基因诊断技术有限公司 | 一种扩增靶核酸的试剂盒和方法 |
CN105087789B (zh) * | 2015-08-10 | 2018-08-03 | 北京吉因加科技有限公司 | 一种检测血浆cfDNA中BCR和TCR免疫组库的方法 |
CN109415768B (zh) * | 2018-05-30 | 2021-11-16 | 广州合谐医疗科技有限公司 | 可变区序列文库构建方法、测序方法及其试剂盒 |
CN109554440A (zh) * | 2018-12-26 | 2019-04-02 | 山东艾克韦生物技术有限公司 | 多重引物组及利用该引物组基于高通量测序构建人类t细胞免疫组库的方法 |
CN111363783B (zh) * | 2018-12-26 | 2024-01-02 | 武汉康测科技有限公司 | 一种基于特有识别序列的t细胞受体库高通量测序文库构建及测序数据分析方法 |
CN109486926A (zh) * | 2018-12-27 | 2019-03-19 | 北京迈基诺基因科技股份有限公司 | 一种基于高通量测序检测人DNA TCR beta链免疫组库的方法及其专用引物组 |
CN112143777B (zh) * | 2020-08-18 | 2022-07-01 | 北京臻知医学科技有限责任公司 | 一种构建人源TCRβ的CDR3区高通量测序文库的引物组及其应用 |
-
2021
- 2021-03-09 CN CN202110254663.6A patent/CN113122618B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113122618A (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105087789B (zh) | 一种检测血浆cfDNA中BCR和TCR免疫组库的方法 | |
CN111363783B (zh) | 一种基于特有识别序列的t细胞受体库高通量测序文库构建及测序数据分析方法 | |
CN109486923B (zh) | 多重扩增子测序用引物系统、其应用以及测序文库的构建方法 | |
CN107779495B (zh) | T细胞抗原受体多样性测序文库的构建方法以及试剂盒 | |
CN111599411B (zh) | 一种检测血液bcr重链和轻链的引物及免疫组库方法、应用 | |
CN109971846A (zh) | 使用双等位基因snp靶向下一代测序的非侵入性产前测定非整倍体的方法 | |
CN110656157B (zh) | 用于高通量测序样本溯源的质控品及其设计和使用方法 | |
CN111748637A (zh) | 一种用于亲缘关系分析鉴定的snp分子标记组合、多重复合扩增引物组、试剂盒及方法 | |
CN109929924A (zh) | 一种基于高通量测序的igh基因重排检测方法 | |
CN113811618A (zh) | 基于甲基化dna目标区域构建测序文库及系统和应用 | |
CN108531475A (zh) | 一种高通量转录组文库构建方法 | |
CN110603327A (zh) | Pcr引物对及其应用 | |
CN111961713A (zh) | 用于遗传病致病基因携带者筛查的探针组合物、试剂盒及其制备方法 | |
CN109337956B (zh) | 基于ngs技术富集多基因茎环探针设计方法及试剂盒 | |
CN111440846A (zh) | 一种用于纳米孔测序建库的位置锚定条码系统 | |
CN116515955B (zh) | 一种多基因靶向分型方法 | |
CN113122618B (zh) | 一种基于高通量测序精准检测t细胞免疫组库的方法及其引物体系 | |
CN113564266A (zh) | Snp分型遗传标记组合、检测试剂盒及用途 | |
CN117106877A (zh) | 一种rhd基因引物、引物混合体系、引物混合体系扩增方法、扩增产物质检方法、测序文库构建方法及测序方法 | |
CN116463408A (zh) | 一种abo基因扩增引物、扩增体系、扩增方法、测序文库构建方法及测序方法 | |
US20050026176A1 (en) | DNA probe design device and information processing method for DNA probe design | |
CN115961007A (zh) | 一种利用简并引物扩增进行全基因组分子标记开发的方法 | |
CN112266963B (zh) | 一种联合检测慢性粒细胞白血病检测试剂盒 | |
CN111471755B (zh) | 用于微卫星不稳定性检测的生物标志物组合、试剂盒及其用途 | |
CN115011695A (zh) | 基于游离环状dna基因的多癌种识别标志物、试剂盒及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |