CN115491423A - 一种用于b细胞淋巴瘤mrd监测的基因组合、试剂盒与应用 - Google Patents

一种用于b细胞淋巴瘤mrd监测的基因组合、试剂盒与应用 Download PDF

Info

Publication number
CN115491423A
CN115491423A CN202211165698.3A CN202211165698A CN115491423A CN 115491423 A CN115491423 A CN 115491423A CN 202211165698 A CN202211165698 A CN 202211165698A CN 115491423 A CN115491423 A CN 115491423A
Authority
CN
China
Prior art keywords
mutation
sequencing
diagnosis
library
frameshift
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211165698.3A
Other languages
English (en)
Inventor
朱洲杰
周健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ezhou Bohua Biological Products Co ltd
Zhuhai Hengqin Bohua Medical Laboratory Co ltd
Original Assignee
Zhuhai Hengqin Bohua Medical Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Hengqin Bohua Medical Laboratory Co ltd filed Critical Zhuhai Hengqin Bohua Medical Laboratory Co ltd
Priority to CN202211165698.3A priority Critical patent/CN115491423A/zh
Publication of CN115491423A publication Critical patent/CN115491423A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Ecology (AREA)
  • Physiology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种用于B细胞淋巴瘤MRD监测的基因组合、试剂盒与应用,涉及生物医学技术领域。该基因组合能够在初诊阶段不过度依赖于疾病诊断进行基因组合的选择,并且可在MRD监测时达到足够的检测灵敏度,从而实现B细胞淋巴瘤患者的MRD早期复发监测。

Description

一种用于B细胞淋巴瘤MRD监测的基因组合、试剂盒与应用
技术领域
本发明涉及生物医学技术领域,尤其是涉及一种用于B细胞淋巴瘤MRD监测的基因组合、试剂盒与应用。
背景技术
淋巴瘤是一种起源于淋巴细胞的肿瘤,包括霍奇金淋巴瘤(Hodgkin lymphoma,HL)和非霍奇金淋巴瘤(non-Hodgkin lymphoma,NHL)两大类。NHL又可分为B细胞起源淋巴瘤及NK/T细胞起源淋巴瘤两类。其中,最常见的NHL为B细胞起源淋巴瘤,约占70%,包括弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、慢性淋巴细胞白血病、套细胞淋巴瘤、边缘区淋巴瘤、多发性骨髓瘤等多种亚型。不同亚型的淋巴瘤细胞分化阶段不同,治疗方案及疾病预后也不相同。
常规淋巴瘤在进行化疗、免疫治疗等治疗后需进行微小残留病(minimalresidual disease,MRD)监测,以此评估肿瘤病灶的残留情况以及患者是否达到完全缓解(complete response,CR)。淋巴瘤目前常用的MRD监测手段包括正电子发射断层成像-X线计算机断层成像仪技术(PET-CT)、流式细胞术、数字PCR技术等,但各有其局限性。PET-CT依赖于肿瘤病灶的代谢强度进行疾病残留判断,具有误判的风险,且对人体而言具有一定的放射伤害;流式细胞术仅能针对活细胞进行测定,而多数非骨髓灶的淋巴瘤治疗后无法获取到样本进行流式细胞术的测定,淋巴瘤大部分均为非骨髓灶疾病,极大限制了流式细胞术在MRD监测中的应用;数字PCR技术虽然具有超高灵敏度和特异性,而且仅需采集患者外周血循环游离DNA(cfDNA)进行监测,但数字PCR通常仅监测单一位点,容易存在单一位点监测阴性但肿瘤仍然存在的情况。
基于近年兴起的利用二代测序(Next generation sequencing,NGS)对外周血肿瘤循环游离DNA(ctDNA)进行MRD监测相对上述方法而言具有多种优势:①无放射性伤害;②可一次性监测多个突变位点;③无创性,无需从患者身上采样;④便捷性,患者仅需于门诊开单抽血即可,而如PET-CT则需办理住院进行检测。目前,如肺癌、结直肠癌等肿瘤领域已经具有相对成熟的该类产品,但淋巴瘤领域此类产品尚为空白。基于此类方法进行淋巴瘤MRD监测时主要存在下述问题:
1.目前类似产品目前均是基于突变位点而进行的MRD监测,即检测结果为各个初诊突变位点在MRD监测时的阴性或者阳性,无法有效去除cfDNA中的背景突变所导致的假阳性干扰,从而使得检测下限只能稳定达到0.5%,大大限制了其在MRD监测时的实用性。MRD监测追求足够低的灵敏度,灵敏度越低则可越早监测到患者体内肿瘤复发,即可越早进行临床干预治疗,提高患者长期生存期。
2.基于淋巴瘤的特殊性,患者初诊时送检NGS进行MRD基线测定时往往会存在淋巴瘤亚型不明确的情况,导致了针对某一种淋巴瘤亚型(如弥漫性大B细胞淋巴瘤)的NGS引物组合(panel)无法很好地适用于患者从初诊基线建立到MRD监测整个过程,而如果将所有常见淋巴瘤基因组合成一个panel,由于MRD监测需要大量测序数据量,故会导致测序成本大量增加,使得临床实用性显著降低。
因此,需要提供一种可以有效在初诊阶段不过度依赖于疾病诊断进行基因panel选择,并且可在MRD监测时达到足够的检测灵敏度,从而实现淋巴瘤患者的MRD早期复发监测的淋巴瘤MRD监测NGS方法。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基因组合,能够在初诊阶段不过度依赖于疾病诊断进行基因panel选择,并且可在MRD监测时达到足够的检测灵敏度,从而实现B细胞淋巴瘤患者的MRD早期复发监测。
本发明还提出一种用于B细胞淋巴瘤MRD监测的试剂盒。
本发明还提出一种检测上述基因组合的试剂在制备B细胞淋巴瘤MRD监测产品中的应用。
本发明还提出一种用于B细胞淋巴瘤MRD监测的系统。
根据本发明的第一方面实施例的一种基因组合,包括如下基因:
ABL1,ACTB,ARID1A,ATM,ATP6AP1,ATP6V1B2,B2M,BCL10,BCL2,BCL6,BCL7A,BIRC3,BMP7,BRAF,BTG1,BTG2,BTK,CARD11,CCND1,CCND3,CD19,CD22,CD58,CD70,CD79A,CD79B,CD83,CDKN2A,CIITA,CNOT3,CREBBP,CRLF2,CXCR4,DAZAP1,DDX3X,DTX1,DUSP2,EGFR,EGR1,EGR2,EIF2A,EP300,ETS1,ETV6,EZH2,FAS,FBXW7,FOXO1,GNA13,HIST1H1B,HIST1H1C,HIST1H1D,HIST1H1E,HNRNPH1,HVCN1,ID3,IDH1,IDH2,IGLL5,IKBKB,IKZF3,IL4R,IRF2BP2,IRF4,IRF8,ITPKB,KIT,KLF2,KLHL6,KMT2D,KRAS,LTB,MAP2K1,MAP3K14,MED12,MEF2B,MS4A1,MYC,MYD88,NFKBIA,NFKBIE,NOTCH1,NOTCH2,NRAS,OSBPL10,P2RY8,PAX5,PCBP1,PIK3CA,PIK3CD,PIK3R1,PIM1,PLCG2,POT1,POU2AF1,POU2F2,PRDM1,PRKCB,PTEN,PTPN1,PTPRD,RHOA,RPS15,RRAGC,SF3B1,SGK1,SMARCA4,SOCS1,STAT3,STAT5B,STAT6,TBL1XR1,TCF3,TMEM30A,TMSB4X,TNFAIP3,TNFRSF14,TNFRSF17,TP53,TRRAP,UBR5,VMA21,WHSC1,XPO1,ZFP36L1,ALK,IGK,IGL,IGH。
根据本发明实施例的一种基因组合在制备B细胞淋巴瘤MRD监测产品中的应用,至少具有如下有益效果:
实施例的基因组合(129panel)适用于所有B细胞淋巴瘤MRD监测,相比于现有主流MRD监测panel(通常是针对某一种淋巴瘤亚型),可解决初诊时具体淋巴瘤亚型不明这一临床常见问题出现时,panel选择困难的问题,可简单、有效地帮助临床医生在患者初诊时即可进行从初诊到MRD的全程监控。
根据本发明的一些实施例,所述基因组合由如表1所示的检测区域组成。
通过针对选择的检测区域进行分析监测,显著降低了panel的大小,能够大大缩减临床检测的费用。相近检测下限时,不同检测方法所需成本对比表如下:
- 129panel 全外显子测序(WES) 全基因组测序(WGS)
大小 270kb 50Mb 3000Mb
测序深度 10000乘 1000乘 120乘
数据量 4G 约90G 约400G
费用倍率 22× 100×
根据本发明的第二方面实施例的一种用于B细胞淋巴瘤MRD监测的试剂盒,试剂盒包括对本发明第一方面所述的基因组合进行检测的试剂。
根据本发明的一些实施例,所述试剂包括对本发明第一方面所述的基因组合进行检测的引物和/或探针。
根据本发明的第三方面实施例的检测本发明第一方面所述的基因组合的试剂在制备B细胞淋巴瘤MRD监测产品中的应用。
根据本发明的一些实施例,所述B细胞淋巴瘤MRD监测产品的使用方法包括以下步骤:
S1、获得针对上述基因组合的初诊样本的初诊测序结果;
S2、获得针对上述基因组合的cfDNA测序结果,即复诊测序结果;
S3、通过生物信息学方法对所述初诊测序结果和所述复诊测序结果进行数据分析。
可以理解的是,所述初诊测序结果和所述复诊测序结果可以为二代测序结果。用于二代测序的测序仪可以是illUMIna测序仪。例如Nextseq550。
一般通过二代测序的方法监测MRD时,其检测下限在0.1%以上(一般肿瘤突变丰度0.5%以上能稳定检出),该检测性能相对于淋巴瘤缓解及复发评估的金标准(PET-CT)而言并未有较大优势,时常出现panel监测阴性而PET-CT仍提示肿瘤残留/复发的情况,使得利用NGS进行MRD监测的临床应用受限。已有研究证实,经过1~2个疗程的化学免疫疗法后,某些B细胞淋巴瘤(如弥漫性大B细胞淋巴瘤)患者的外周血ctDNA含量较初诊下降2~2.5个LOG值,提示疗效显著、患者具有较好的预后及更佳的5年生存率。而通常初诊时外周血肿瘤突变丰度在10%~30%左右,每毫升血浆单倍体染色体当量(hGE/ml)在100~1000个单位之间,对标外周血ctDNA含量较初诊下降2.5个LOG值,肿瘤突变丰度为0.03%,每毫升血浆单倍体染色体当量为0.32hGE/mL。但在0.1%突变丰度以下,相关技术已无法准确监测到突变或者计算得到准确的突变比例。而该使用方法的检测限低至0.0025%,能够比PET-CT更早发现肿瘤的复发,从而可以使临床尽早干预,提升治疗效果,从而达到延长患者的生存期的目的,还可对该比例以上的肿瘤丰度进行精确定量,解决了目前利用ctDNA精准判定预后情况的这一难点。
根据本发明的一些实施例,所述步骤S1具体包括如S11a至S14a,或S11b至S14b所示的步骤;
所述S11a至S14a所示的步骤为:
S11a、提取用于获取所述初诊测序结果的样本的DNA;
S12a、构建第一初诊DNA文库;
S13a、利用二代测序对所述第一初诊DNA文库进行测序,得到第一初诊测序数据;
S14a、将所述第一初诊测序数据的序列与参考序列进行比对,得到所述初诊测序结果;
所述S11b至S14b所示的步骤为:
S11b、提取用于获取所述初诊测序结果的样本的cfDNA;
S12b、构建第二初诊DNA文库;
S13b、利用二代测序对所述第二初诊DNA文库进行测序,得到第二初诊测序数据;
S14b、将所述第二初诊测序数据的序列与参考序列进行比对,得到所述初诊测序结果。
可以理解的是,将所述第一初诊测序数据或所述第二初诊测序数据的序列与参考序列进行比对通过数据比对软件进行。所述数据比对软件包括BWA、MAQ、SOAP2和Bowtie2中的至少一种。所述参考序列包括人类基因组数据库Hg19参考序列或人类基因组hg38参考序列。
根据本发明的一些实施例,所述步骤S14a包括:预处理,以获得具有期望质量的处理后初诊测序数据;识别得到第六突变位点;对所述第六突变位点进行进下分析;获得所述第六突变位点的基因重排信息;对所述第六突变位点进行突变注释;筛除群体遗传数据库中人群频率大于第三人群频率阈值的所述第六突变位点。可以理解的是,所述群体遗传数据库包括1000G、ESP6500、KMTD、ExAC、gnomAD和EVS中的至少一种。所述群体遗传数据库为1000G、ExAC和gnomAD,所述第三人群频率阈值为0.5%。
可以理解的是,所述进下分析同通过分析软件进行。所述分析软件包括Samtools及VarDict。所述进下分析用于获取SNP及indel信息。
可以理解的是,所述基因重排信息通过Gridss软件分析获得。所述突变注释通过annovar软件进行。
根据本发明的一些实施例,所述步骤S14b包括:预处理,以获得具有期望质量的处理后初诊测序数据;识别得到第七突变位点;提取UMI标签;将所述处理后初诊测序数据与参考序列进行比对,获取第七突变位点;根据UMI标签对所述处理后复诊测序结果的序列进行分组;过滤分组后的所述序列,获得具有期望质量的过滤后第七突变位点;对所述过滤后第七突变位点进行突变注释;筛除群体遗传数据库中人群频率大于第四人群频率阈值的所述过滤后第七突变位点。可以理解的是,所述群体遗传数据库包括1000G、ESP6500、KMTD、ExAC、gnomAD和EVS中的至少一种。所述群体遗传数据库为1000G、ExAC和gnomAD,所述第四人群频率阈值为0.5%。
根据本发明的一些实施例,所述步骤S2具体包括如下步骤:
S21、提取用于获取所述复诊测序结果的样本的cfDNA;
S22、构建复诊DNA文库;
S23、利用二代测序对所述复诊DNA文库进行测序,得到复诊测序数据;
S24、将所述复诊测序数据的序列与参考序列进行比对,得到所述复诊测序结果。
根据本发明的一些实施例,所述步骤S24包括:预处理,以获得具有期望质量的处理后复诊测序数据;识别得到第八突变位点;提取UMI标签;将所述处理后复诊测序数据与参考序列进行比对,获取第八突变位点;根据UMI标签对所述处理后复诊测序结果的序列进行分组;过滤分组后的所述序列,获得具有期望质量的过滤后第八突变位点;对所述过滤后第八突变位点进行突变注释;筛除群体遗传数据库中人群频率大于第五人群频率阈值的所述过滤后第八突变位点。可以理解的是,所述群体遗传数据库包括1000G、ESP6500、KMTD、ExAC、gnomAD和EVS中的至少一种。所述群体遗传数据库为1000G、ExAC和gnomAD,所述第五人群频率阈值为0.5%。所述参考序列包括人类基因组数据库Hg19参考序列或人类基因组hg38参考序列。
可以理解的是,如果UMI标签相同,则为同一组;否则为不同组。
根据本发明的一些实施例,所述步骤S3中,所述数据分析包括以下步骤:
S31、对所述初诊测序结果进行过滤,得到由k个第一突变位点组成的初诊突变集合;
S32、对所述复诊测序结果进行过滤,得到由m个可信突变组成的复诊突变集合;
S33、获取所述复诊突变集合中的m个所述可信突变的第一平均突变比例;
S34、从所述基因组合中随机抽取k个基因组位置,从k个位置中选取至多m个第二突变位点,获取m个第二突变位点在所述初诊突变集合中的第二平均突变比例;
S35、重复步骤S34共n次,获得由第二平均突变比例组成的第二平均突变比例集合;
所述n为10000-1000000;
S35、计算所述第一平均突变比例在所述第二平均突变比例集合中的显著性,如果显著性不大于显著性阈值时,则MRD判定为阳性。
根据本发明的一些实施例,所述k为1~500。
根据本发明的一些实施例,所述m为1~500。
根据本发明的一些实施例,计算所述第一平均突变比例在所述第二平均突变比例集合中的显著性通过高斯分布或韦布分布模型进行。
根据本发明的一些实施例,所述步骤S3中,所述数据分析还包括计算每毫升血浆单倍体染色体当量,以判断外周血肿瘤负荷。
根据本发明的一些实施例,所述步骤S31中,对所述初诊测序结果进行过滤具体为:去除所述初诊测序结果中的外周血有核细胞的突变位点。
根据本发明的一些实施例,获取所述外周血有核细胞的突变位点的方法包括以下步骤:
A1、提取所述外周血有核细胞的DNA;
A2、构建外周血有核细胞DNA文库;
A3、利用二代测序对所述外周血有核细胞DNA文库进行测序,得到所述外周血有核细胞测序数据;
A4、将所述外周血有核细胞测序数据的序列与参考序列进行比对,获取所述外周血有核细胞的突变位点。
根据本发明的一些实施例,所述步骤A4中,将所述外周血有核细胞测序数据的序列与参考序列进行比对包括:
识别得到第五突变位点;
对所述第五突变位点进行进下分析;
获得所述第五突变位点的基因重排信息;
对所述第五突变位点进行突变注释;
筛除群体遗传数据库中人群频率大于第二人群频率阈值的所述第五突变位点。
可以理解的是,所述进下分析同通过分析软件进行。所述分析软件包括Samtools及VarDict。所述进下分析用于获取SNP及indel信息。
可以理解的是,所述基因重排信息通过Gridss软件分析获得。所述突变注释通过annovar软件进行。
可以理解的是,将所述有核细胞测序数据与参考序列进行比对通过数据比对软件进行。所述数据比对软件包括BWA、MAQ、SOAP2和Bowtie2中的至少一种。所述参考序列包括人类基因组数据库Hg19参考序列或人类基因组hg38参考序列。
可以理解的是,所述群体遗传数据库包括1000G、ESP6500、KMTD、ExAC、gnomAD和EVS中的至少一种。所述群体遗传数据库为1000G、ExAC和gnomAD,所述第二人群频率阈值为0.5%。
根据本发明的一些实施例,所述步骤S32中,对所述复诊测序结果进行过滤包括:错义突变抛光、移码突变抛光和突变比例抛光;
所述错义突变抛光包括以下步骤:获取所述复诊测序结果中的错义突变位点,以所述错义突变位点的基因组位置作为x轴坐标,碱基变异类型作为y轴坐标,定位到错义背景抛光库中;将所述x轴坐标扩增第一碱基范围,所述y轴坐标扩增至所述错义突变位点在所述错义背景抛光库中的所有错义突变类型,截取所述错义背景抛光库中该范围内的所有错义突变位点的突变比例;计算所述错义突变位点的第一可信度,获得具有期望第一可信度的可信错义突变位点;
所述移码突变抛光包括以下步骤:获取所述复诊测序结果中的移码突变位点,以所述移码突变位点的基因组位置作为x轴坐标,移码碱基数作为y轴坐标,定位到移码背景抛光库中;将所述x轴坐标扩增第二碱基范围,所述y轴坐标扩增至所述移码突变位点的移码碱基数所对应的坐标处的所有突变,截取所述移码背景抛光库中该范围内所有移码突变位点的突变比例;计算所述移码突变位点的第二可信度,获得具有期望第二可信度的可信移码突变位点;
所述突变比例抛光包括以下步骤:计算可信突变位点的矫正后突变比例;
所述可信突变位点包括所述可信错义突变位点和所述可信移码突变位点;
所述矫正后突变比例=所述可信突变位点在所述初诊突变集合中的突变比例-所述可信突变位点在所述错义背景抛光库或所述移码背景抛光库中的平均突变比例。
可以理解的是,本领域技术人员可以按需对第一可信度和第二可信度的期望值进行调整。如第一可信度或第二可信度≤0.05%,第一可信度或第二可信度≤0.01%等。所述第一可信度或所述第二可信度通过韦布分布模型进行计算。
根据本发明的一些实施例,所述错义背景抛光库的制备方法包括以下步骤:获取健康志愿者的cfDNA,并针对上述基因组合进行测序,得到第一背景测序结果;获取所述第一背景测序结果中的第三突变位点的基因组位置、碱基变异类型和突变比例,以所述第三突变位点的基因组位置作为x轴坐标、碱基变异类型作为y轴坐标、突变比例为z轴坐标,得到所述错义背景抛光库。
根据本发明的一些实施例,所述错义背景抛光库的制备方法中,所述健康志愿者的数量>20。
根据本发明的一些实施例,所述移码背景抛光库的制备方法包括以下步骤:获取健康志愿者的cfDNA,并针对上述基因组合进行测序,得到第二背景测序结果;获取所述第二背景测序结果中的第四突变位点的基因组位置、移码碱基数和突变比例,以所述第四突变位点的基因组位置作为x轴坐标、移码碱基数作为y轴坐标、突变比例为z轴坐标,得到所述移码背景抛光库。
根据本发明的一些实施例,所述移码背景抛光库的制备方法中,所述健康志愿者的数量>20。。
通过利用与患者同样的129panel建立健康人的突变向量库(包括错义背景抛光库和移码背景抛光库),根据韦布分布模型统计可信度,对于真实突变与测序误差的区分的准确性远高于利用大数据进行机器学习区分真实突变与测序误差的准确性,能够使检测到的肿瘤负荷的残留突变比例更低。
根据本发明的一些实施例,用于获取所述初诊测序结果的样本包括血浆、活检物、切片中的至少一种。活检物可包括例如肿瘤的切除样品、通过内窥镜手段或针刺活检制备的组织样品。例如:脊髓、穿刺物等。
根据本发明的一些实施例,用于获取所述复诊测序结果的样本为血浆。
根据本发明的第四方面实施例的一种用于B细胞淋巴瘤MRD监测的系统,包括:
测序模块,用于对初诊的样本在第一方面实施例的基因组合进行测序,获得初诊测序数据,以及对复诊的样本的cfDNA在第一方面实施例的基因组合进行测序,获得复诊测序数据;
比对模块,用于将所述初诊测序数据的序列与参考序列进行比对,获得所述初诊测序结果,以及将所述复诊测序数据与参考序列进行比对,获得所述复诊测序结果;
分析模块,用于对所述初诊测序结果和所述复诊测序结果进行数据分析,获取B细胞淋巴瘤MRD的阳性或阴性结果。
根据本发明的一些实施例,所述测序模块还包括用于对初诊的样本提取DNA或cfDNA,并构建初诊DNA文库,以及对复诊的样本提取cfDNA,并构建复诊DNA文库。
根据本发明的一些实施例,所述比对模块还用于对所述初诊测序数据和/或所述复诊测序数据进行质控处理和/或突变注释。
根据本发明的一些实施例,所述比对模块还用于筛除所述初诊测序数据和/或所述复诊测序数据中的在群体遗传数据库中不具有期望人群频率的突变位点。
根据本发明的一些实施例,所述分析模块还用于计算每毫升血浆单倍体染色体当量。
根据本发明的一些实施例,所述分析模块还用于对突变位点进行过滤和/或校正。
根据本发明的一些实施例,所述分析模块还用于对所述复诊测序结果进行过滤,所述过滤包括:错义突变抛光、移码突变抛光和突变比例抛光。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
附图说明
图1是本发明一实施例提供的患者MRD监测流程;
图2是本发明测试例3的预期突变比例与实测突变比例的线性回归曲线图。
具体实施方式
以下将结合实施例对本发明的构思及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。
实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
在本发明的描述中,如果有描述到第一、第二、第三、第四、第五、第六、第七、第八等只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
在本发明的描述中,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
本实施例提供一种用于B细胞淋巴瘤MRD监测的基因组合及其应用方法,应用方法流程如图1所示。
(1)设计基因组合及其检测区域
该基因组合的获取方法的步骤如下:
A1、选取TCGA国际公共肿瘤数据库中的所有B细胞淋巴瘤测序分析结果,记为数据库A;
A2、选取国际癌症基因组协会(ICGC)中的所有B细胞淋巴瘤的全基因组测序结果数据,记为数据库B;
A3、将数据库A和数据库B的中的数据按B细胞淋巴瘤的亚型进行分类;
其中,数据库A和数据库B用于突变位点的选取,数据库B的数据还用于重排范围的选取;
A4、针对某一种淋巴瘤亚型(如DLBCL)基因范围选定:设x为某基因最终选取范围(即最终获得的基因的检测区间),x0为该基因全长,z为所选范围x中该基因在数据库中的突变检出数,z0为该基因全长在数据库中的突变检出数;利用迭代算法,获得一个相对x0而言最小的范围x,且此时z最大限度接近z0。
A5、panel范围选定:依据步骤A4中获得的所有基因的范围,将不同淋巴瘤亚型的不同基因范围整合至一起,进一步采用迭代算法计算,去除掉发病率低的淋巴瘤亚型中的变异检出率低的基因选取范围,得到如表1所示的基因组合及其检测区域(以下简称129panel)。
其中,MYC,BCL2,BCL6,CCND1,ALK,BIRC3,IRF4,IGK,IGL,IGH为重排相关基因,含有内含子检测区间和基因间区检测区间,用于扩展检测的突变集。
表1
Figure BDA0003861901160000071
Figure BDA0003861901160000081
Figure BDA0003861901160000091
Figure BDA0003861901160000101
Figure BDA0003861901160000111
Figure BDA0003861901160000121
Figure BDA0003861901160000131
Figure BDA0003861901160000141
Figure BDA0003861901160000151
注:括号内为括号外基因的别称。
(2)构建背景突变存储装置
背景突变存储装置用于存储panel中的假阳性背景突变。在二代测序过程中,核酸提取环节的氧化损伤、后续PCR过程的PCR错误以及测序过程中碱基的荧光信号误读会导致实际测序结果会产生大量的基因变异假阳性结果,这些变异的突变比例在1%以下的范围开始逐步显著,干扰了常规MRD时真阳性突变的检测。
本实施例建立了一种能有效去除背景干扰的装置,该装置包含2个三维突变向量库,具体实施方法如下:
B1、采集20个健康志愿者的cfDNA进行129panel的建库及测序实验,获取各样本的突变位点,集成一个健康人突变数据库。
B2、错义背景抛光库的建立:
以129panel的设计范围,按基因组坐标顺序作为x轴坐标,以碱基变异类型(按G→A、G→T、G→C、C→A、C→T、C→C、A→T、A→G、A→C、T→A、T→G、T→C的突变类型顺序)作为y轴坐标,以突变比例为z轴坐标,构建第一3维数据空间向量库,将健康人突变数据库中的错义突变放入到第一3维数据空间向量库中,形成错义背景抛光库。
B3、移码背景抛光库的建立:
以129panel的设计范围,按基因组坐标顺序作为x轴坐标,以移码碱基数(1个bp的移码/插入突变、2个bp的移码/插入突变、3个bp的移码/插入突变、>3个bp的移码/插入突变的顺序)作为y轴坐标、以突变比例为z轴坐标,构建第二3维数据空间向量库,将健康人突变数据库中的移码突变放入到第二3维数据空间向量库中,形成移码背景抛光库。
B4、将第一3维数据空间向量库和第二3维数据空间向量库以数据的形式存放于计算机中,得到背景突变存储装置。
(3)MRD监测方法
C1、患者初诊时,送检组织活检或者切片样本或者外周血样本,进行129panel初诊基线测定,获取初诊测序数据,并获取初诊测序数据中的突变位点。
C2、患者经过治疗后,复诊送检外周血样本,分别对外周血血浆及外周血有核细胞DNA进行129panel液体活检检测(血浆样本测序基于常规的分子标签建库测序方法),获取有核细胞DNA的DNA复诊测序数据和血浆中cfDNA的cfDNA复诊测序数据,并分别获取DNA复诊测序结果和cfDNA复诊测序结果。
C3、基于步骤C1和C2中的突变结果数据,计算获得患者MRD结果。
具体计算方法如下:
C31、胚系突变的滤除。对步骤C1的初诊测序数据中的突变位点进行过滤,以去除步骤C2中有核细胞测序所获得的所有突变位点,得到患者初诊突变库。
C32、将步骤C2中获得的患者血浆129panel检测的cfDNA复诊测序结果中的突变位点代入到步骤(2)建立的背景突变存储装置中进行三重背景抛光处理。
具体实施方法如下:
C321、第一重抛光:错义突变抛光
将患者cfDNA中的错义突变位点的基因组位置作为x轴坐标,碱基变异类型作为y轴坐标,在错义背景抛光库中用上述x、y轴坐标定位到对应位置,然后x轴坐标扩增±5个碱基范围、y轴坐标扩增至该错义突变位点所有突变的范围(如果错义背景抛光库中不包括该错义突变位点的突变信息,则将所有可能发生的错义突变都纳入),截取该范围内的所有错义背景抛光库中的突变比例(如果错义背景抛光库中不包括该错义突变位点,截取到的突变比例为0%),利用韦布分布(Weibull distribution)模型计算患者所有cfDNA中的错义突变的可信度(P),如果P≤0.05,则保留,记为可信突变;否则去除掉该错义突变。得到错义突变库。
C322、第二重抛光:移码突变抛光
将患者cfDNA中的移码突变位点的基因组位置作为x轴坐标,移码碱基数(包括1bp、2bp、3bp、>3bp)作为y轴坐标,在移码背景抛光库中用x、y轴坐标定位到对应位置,然后x轴坐标扩增±10个碱基范围、y轴坐标定位到该移码突变位点的移码碱基数所对应的坐标处所有突变(如果移码背景抛光库中不包括该移码突变位点的突变信息,则将所有可能发生的移码突变都纳入),截取该范围内的移码背景抛光库中的突变比例(如果移码背景抛光库中不包括该移码突变位点,截取到的突变比例为0%)。利用韦布分布模型计算患者所有cfDNA中的移码突变的可信度,如果P≤0.05,则保留,记为可信突变;否则去除掉该突变。得到移码突变库。
C323、第三重抛光:突变比例抛光
对步骤C321得到的错义突变库和C322得到的移码突变库进行突变比例抛光处理,具体实施方案如下:
假设通过步骤C321和C322处理得到某个可信突变,其在患者初诊突变库中的突变比例记为a,该可信突变在突变背景抛光库或移码背景抛光库中的平均突变比例记为b,该可信突变的矫正后突变比例记为c,其中c=a-b;计算获得患者cfDNA样本中处理后得到的各可信突变对应的矫正后突变比例。
C33、判定患者MRD的阳性/阴性。将步骤C32获得的所有可信突变及其矫正后突变比例进行如下处理:
步骤C31的患者初诊突变库中包括共计有k个初诊突变,患者复诊血浆中cfDNA的复诊测序结果经过背景抛光后剩余m个可信突变,m个可信突变经抛光后计算得到平均校正后突变比例μ。从129panel中随机抽取k个基因组位置,从k个基因组位置中选取至多m个突变位点,m个突变位点在患者初诊突变库中的突变比例平均值记为μi,重复该步骤10000次,获得一个突变比例集合A={μ012……μ10000},利用高斯分布或韦布分布模型计算μ在集合A中的显著性。当P≤0.05时,MRD判定为阳性,否则判断为阴性。
并以患者每毫升血浆单倍体染色体当量(hGE/mL)为依据计算患者外周血肿瘤负荷,用于判断患者外周血中残留肿瘤突变丰度。计算方法如下。
hGE/ml=λ×外周血cfDNA浓度×提取得到的含外周血cfDNA的溶液体积/提取所用的外周血血浆体积;
其中,外周血cfDNA浓度以ng/μL计;提取得到的含外周血cfDNA的溶液体积以μL计;提取所用的外周血血浆体积以mL计;外周血血浆肿瘤负荷比例λ=m个可信突变的矫正后突变比例之和/初诊突变数k。
实施例2
本实施例提供一种患者的MRD监测方法,具体实施过程如下:
S1.患者初诊时送检组织活检或者切片样本,进行129panel初诊基线测定,获取初诊测序结果。具体实验过程如下:
(1)利用商业化DNA提取试剂盒(凯杰公司的GeneRead DNA FFPE KIT)提取组织或切片样本中的DNA,得DNA溶液。具体步骤按照试剂盒的说明书进行。
(2)质控:利用Qubit荧光定量仪测定步骤(1)的DNA溶液的浓度(要求浓度不低于10ng/μL,提取DNA总量不低于100ng);利用NanoDrop微量紫外分光光度计检测步骤1)的DNA溶液的纯度(要求260/280比值在1.7~2.0之间)。
(3)利用商业化的建库及捕获试剂盒(纳昂达公司的NadPrep DNA libraryPreparation Kit和IDT公司的xGen Hybridization and Wash Kit)构建测序文库。具体步骤按照试剂盒的说明书进行。
(4)将步骤(3)构建的测序文库进行二代测序(测序仪型号为Nextseq550,测序读长为双端150bp,数据量要求为1Gb以上),得到初诊测序数据。
(5)分析初诊测序数据,获取初诊测序数据中的突变位点。
①利用BWA软件对测序数据进行比对,比对到人类基因组数据库Hg19参考序列上,同时筛除低于Q30质量的数据;
②利用Samtools及VarDict分析软件对步骤①处理后的数据进行进下分析得到所需的SNP及indel信息,利用Gridss软件分析获得基因重排信息。
(6)将步骤(5)的分析结果文件导入到annovar软件进行突变注释,获得突变位点氨基酸改变信息及突变位点在三个数据库(1000G、ExAC、gnomAD)中的人群频率数据,去除掉上述三个数据库中任一数据库人群频率大于0.5%的突变位点。得到初诊测序数据中的突变位点。
S2.患者经过治疗后,送检外周血样本,对外周血有核细胞及血浆ctDNA分别进行129panel液体活检检测,获取复诊测序结果及配对样本数据。具体实施方法如下:
(1)将患者的外周血样本12000r/min离心5min,分离血浆,并保留有核细胞;
(2)对血浆的处理:
1)利用商业化循环游离DNA提取试剂盒(凯杰公司的QIAamp CirculatingNucleic Acid Kit)提取步骤1)的血浆中的cfDNA;利用Qubit荧光定量仪进测定cfDNA的浓度,要求cfDNA浓度不低于0.5ng/μL,总量不低于25ng。具体步骤按照试剂盒的说明书进行。
2)将步骤1)中质控合格的cfDNA进行分子标签法(UMI)杂交捕获建库,利用商业化的建库及捕获试剂盒(纳昂达公司的NadPrep DNA library Preparation Kit和IDT公司的xGen Hybridization and Wash Kit以及Duplex Seq Adapter Kit set A)进行测序文库的构建。具体步骤按照试剂盒的说明书进行。
3)将步骤2)构建的测序文库进行二代测序(测序仪型号为Nextseq550,测序读长为双端150bp,数据量要求为5Gb以上),得到复诊测序数据。
4)将步骤3)得到的复诊测序数据按如下步骤进行数据分析:
a)利用fastp对原始测序数据进行过滤以及质控处理;
b)利用fgbio将过滤后的数据由fastq格式文件转化为ubam格式文件,以提取UMI标签序列;
c)利用BWA将测序reads比对到hg19参考基因组上,并利用fgbio根据UMI标签对比对后的序列进行分组;
d)对于上述分组的带UMI标签的序列,利用fgbio软件默认参数和设置进行突变分析,并增加/修订了如下原则:①去除掉质量值低于20的reads;②同一个起始、终止位置且UMI标签相同的一组reads中,如某一个位点在30%以上的reads中碱基不一致,则去除该位点;③如果某一个突变位点在2条以上起始及终止位置不同的reads中存在,则保留该突变;④对于不同的reads中的相同的基因组位置部分,如其在各个reads中平均位点质量值均小于30%,则该段在所有相关reads中均删除。
e)将步骤d)得到的分析结果文件导入到annovar软件进行突变注释,获得突变位点氨基酸改变信息及数据库(1000G、ExAC、gnomAD)中的人群频率数据,去除掉上述3个数据库中,任意数据库人群频率大于0.5%的突变。得到复诊测序数据中的突变位点。
(3)对有核细胞的处理:
利用商业化DNA提取试剂盒(凯杰公司的QIAamp DNA blood Mini kit)提取步骤(1)的有核细胞的DNA,参照上述步骤S1中的步骤2)至6),进行建库测序及分析,获得配对样本数据。得到有核细胞测序数据的所有突变位点。
S3.基于步骤S1和S2中得到的突变结果数据,经过计算获得患者MRD结果。具体实施方法如下:
(1)胚系突变的滤除。对步骤S1中获取的患者初诊测序结果中的突变位点进行过滤,以去除步骤S2中有核细胞测序所分析获得的所有突变,得到患者初诊突变库。
(2)参考实施例1的步骤C32对上述步骤S2中获得的复诊测序数据中的突变位点进行三重背景抛光处理。区别仅在于:C321、第一重抛光中,x轴坐标扩增±50个碱基范围;C322、第二重抛光中,x轴坐标扩增±100个碱基范围。
(3)参考实施例1的步骤C33判断患者MRD的阳性或阴性,并计算每毫升血浆单倍体染色体当量(hGE/mL)。
实施例3
本实施例提供一种患者的MRD监测方法,具体实施过程如下:
S1.患者初诊时送检外周血样本,进行129panel初诊基线测定,获取初诊测序结果及配对样本数据。具体实验过程如下:
(1)将患者的外周血样本进行12000r/min离心5min,分离血浆,并保留有核细胞。
(2)对血浆的处理:
1)利用商业化循环游离DNA提取试剂盒(凯杰公司的QIAamp CirculatingNucleic Acid Kit)提取步骤(1)的血浆中的cfDNA;利用Qubit荧光定量仪进测定cfDNA的浓度,要求cfDNA浓度不低于0.5ng/μL,总量不低于25ng。具体步骤按照试剂盒的说明书进行。
2)将步骤1)中质控合格的cfDNA进行分子标签法(UMI)杂交捕获建库,利用商业化的建库及捕获试剂盒(纳昂达公司的NadPrep DNA library Preparation Kit和IDT公司的xGen Hybridization and Wash Kit以及Duplex Seq Adapter Kit set A)进行测序文库的构建。具体步骤按照试剂盒的说明书进行。
3)将步骤2)构建的测序文库进行二代测序(测序仪型号为Nextseq550,测序读长为双端150bp,数据量要求为5Gb以上),得到测序数据。
4)将步骤3)得到的测序数据按如下步骤进行数据分析:
a)利用fastp对原始测序数据进行过滤以及质控处理;
b)利用fgbio将过滤后的数据由fastq格式文件转化为ubam格式文件,以提取UMI标签序列;
c)利用BWA将测序reads比对到hg19参考基因组上,并利用fgbio根据UMI标签对比对后的序列进行分组;
d)对于上述分组的带UMI标签的序列,利用fgbio软件默认参数和设置进行突变分析,并增加/修订了如下原则:①去除掉质量值低于20的reads;②同一个起始、终止位置且UMI标签相同的一组reads中,如某一个位点在30%以上的reads中碱基不一致,则去除该位点;③如果某一个突变位点在2条以上起始及终止位置不同的reads中存在,则保留该突变;④对于不同的reads中的相同的基因组位置部分,如其在各个reads中平均位点质量值均小于30%,则该段在所有相关reads中均删除。获得外周血样本cfDNA测序数据中的突变位点。
(3)对有核细胞的处理:
1)利用商业化DNA提取试剂盒(凯杰公司的QIAamp DNA blood Mini kit)提取步骤1)的有核细胞的DNA;利用Qubit荧光定量仪测定步骤1)的DNA溶液的浓度(要求浓度不低于10ng/μL,提取DNA总量不低于100ng);利用NanoDrop微量紫外分光光度计检测步骤1)的DNA溶液的纯度(要求260/280比值在1.7~2.0之间)。
2)利用商业化的建库及捕获试剂盒(纳昂达公司的NadPrep DNA libraryPreparation Kit和IDT公司的xGen Hybridization and Wash Kit)将步骤1)质控合格的DNA进行杂交捕获建库,构建得到测序文库。具体步骤按照试剂盒的说明书进行。
3)将步骤2)构建的测序文库进行二代测序(测序仪型号为Nextseq550,测序读长为双端150bp,数据量要求为1Gb以上),得到测序数据。
4)数据分析,得到突变位点集合。
①利用BWA软件对测序数据进行比对,比对到人类基因组数据库Hg19参考序列上,同时筛除低于Q30质量的数据;
②利用Samtools及VarDict分析软件对步骤①处理后的数据进行进下分析得到所需的SNP及indel信息;利用Gridss软件分析获得基因重排信息。
5)将步骤4)的分析结果文件导入到annovar软件进行突变注释,获得突变位点氨基酸改变信息及突变位点在三个数据库(1000G、ExAC、gnomAD)中的人群频率数据,去除掉上述3个数据库中任一数据库人群频率大于0.5%的突变位点,获得配对样本的数据。
(4)将步骤(3)的配对样本的数据与步骤(2)的外周血样本cfDNA测序数据中的突变位点进行配对分析,去除掉外周血样本cfDNA测序数据中与配对样本相同的突变位点,获得最终的初诊突变数据。
S2.患者经过治疗后,复诊送检外周血样本,对外周血血浆cfDNA进行129panel液体活检检测,获取复诊测序结果。具体实施方法如下:
(1)参考上述步骤S1的步骤(1)至(2)的方法处理外周血血浆,获得外周血样本cfDNA测序数据中的突变位点。
(2)将外周血样本cfDNA测序数据中的突变位点导入到annovar软件进行突变注释,获得突变位点氨基酸改变信息及数据库(1000G、ExAC、gnomAD)中的人群频率数据,去除掉上述3个数据库中任一数据库人群频率大于0.5%的突变,获得复诊测序结果。
S3.基于步骤S1和S2中得到的突变结果数据,经过计算获得患者MRD结果。具体实施方法如下:
(1)参考实施例1的步骤C32对上述步骤S2中获得的复诊测序结果进行三重背景抛光处理。区别仅在于:C321、第一重抛光中,x轴坐标扩增±50个碱基范围;C322、第二重抛光中,x轴坐标扩增±100个碱基范围。
(2)参考实施例1的步骤C33判断患者MRD的阳性或阴性,并计算每毫升血浆单倍体染色体当量(hGE/mL)。
测试例1
基于实施例1提供的129panel的检测区域及实施例2或3提供的应用方法,针对多个数据来源的B细胞淋巴瘤的数据进行分析。
分析结果如表2所示。
表2
Figure BDA0003861901160000191
注:BL:伯基特淋巴瘤;DLBCL:弥漫性大B细胞淋巴瘤;FL:滤泡性淋巴瘤;MCL:套细胞淋巴瘤;MZL:边缘区淋巴瘤;LPL:淋巴浆细胞淋巴瘤;WGS:全基因组测序;WES:全外显子测序。阳性率=检测为阳性的样本个数/文献中总样本数×100%,每个样本平均突变个数=所有样本检测到的可信突变的总数/样本总数。
常规的基因组合通常只针对基因的外显子区域,或者连带部分基因UTR区域,并不会涉及到基因的内含子区以及基因间区。实施例1提供的129panel的检测区域仅占对应基因组合的全外显子区域的0.5%。由表2可见,实施例1提供的129panel的检测区域及其应用方法能够对多种B细胞淋巴瘤进行超高阳性率的编码区基因突变检测以及突变覆盖,而检测成本远低于WGS或WES。
测试例2
基于实施例1提供的129panel的检测区域及实施例2或3提供的应用方法,针对35例经临床合作获得的B细胞淋巴瘤科研样本进行分析。
分析结果如表3所示。
表3
Figure BDA0003861901160000201
由表3可知,常规基因panel仅针对外显子区域进行突变检测,35例B细胞淋巴瘤样本所获取到的突变数目平均值为11个,远低于实施例1的129panel获取得到的突变数平均值128.3。
测试例3
基于实施例1的129panel的检测区域及实施例2提供的应用方法,测试其灵敏度。本测试例的测试对象为:提取3例经临床合作获得的B细胞淋巴瘤科研标本(均为FFPE切片标本)的核酸,按一定比例与健康人gDNA混合后,进行超声波打断,以模拟不同检测限的cfDNA样本。
测试分析结果如表4所示。预期突变比例与实测突变比例的线性回归曲线如图2所示。
表4
Figure BDA0003861901160000202
Figure BDA0003861901160000211
由表4可知,针对不同梯度浓度的24个检测样本,所有检测限处均能显著检测到预期突变,可实现对低至0.0025%肿瘤ctDNA突变比例的样本的有效监测。
由图2可知,突变比例在0.5%~0.0025%范围内,预期突变比例(x)与实测突变比例(y)的线性方程为y=0.8345x-4×10-5,R2=0.9822,线性定量效果良好。实施例1的129panel的检测区域及其应用方法即便在肿瘤突变丰度(即突变比例)低于1%,甚至低至0.0025%时,仍能够精确计算出各个样本中的突变丰度,且与样本的真实突变丰度具有高的符合度。
上面结合附图对本发明实施例作了详细说明,但本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (10)

1.一种基因组合,其特征在于,所述基因组合包括如下基因:
ABL1,ACTB,ARID1A,ATM,ATP6AP1,ATP6V1B2,B2M,BCL10,BCL2,BCL6,BCL7A,BIRC3,BMP7,BRAF,BTG1,BTG2,BTK,CARD11,CCND1,CCND3,CD19,CD22,CD58,CD70,CD79A,CD79B,CD83,CDKN2A,CIITA,CNOT3,CREBBP,CRLF2,CXCR4,DAZAP1,DDX3X,DTX1,DUSP2,EGFR,EGR1,EGR2,EIF2A,EP300,ETS1,ETV6,EZH2,FAS,FBXW7,FOXO1,GNA13,HIST1H1B,HIST1H1C,HIST1H1D,HIST1H1E,HNRNPH1,HVCN1,ID3,IDH1,IDH2,IGLL5,IKBKB,IKZF3,IL4R,IRF2BP2,IRF4,IRF8,ITPKB,KIT,KLF2,KLHL6,KMT2D,KRAS,LTB,MAP2K1,MAP3K14,MED12,MEF2B,MS4A1,MYC,MYD88,NFKBIA,NFKBIE,NOTCH1,NOTCH2,NRAS,OSBPL10,P2RY8,PAX5,PCBP1,PIK3CA,PIK3CD,PIK3R1,PIM1,PLCG2,POT1,POU2AF1,POU2F2,PRDM1,PRKCB,PTEN,PTPN1,PTPRD,RHOA,RPS15,RRAGC,SF3B1,SGK1,SMARCA4,SOCS1,STAT3,STAT5B,STAT6,TBL1XR1,TCF3,TMEM30A,TMSB4X,TNFAIP3,TNFRSF14,TNFRSF17,TP53,TRRAP,UBR5,VMA21,WHSC1,XPO1,ZFP36L1,ALK,IGK,IGL,IGH。
2.一种用于B细胞淋巴瘤MRD监测的试剂盒,其特征在于,试剂盒包括对权利要求1所述的基因组合进行检测的试剂。
3.检测权利要求1所述的基因组合的试剂在制备B细胞淋巴瘤MRD监测产品中的应用。
4.根据权利要求3所述的应用,其特征在于,所述B细胞淋巴瘤MRD监测产品的使用方法包括以下步骤:
S1、获得针对权利要求1所述的基因组合的初诊测序结果;
S2、获得针对权利要求1所述的基因组合的cfDNA测序结果,即复诊测序结果;
S3、通过生物信息学方法对所述初诊测序结果和所述复诊测序结果进行数据分析;
优选地,用于获取所述初诊测序结果的样本包括血浆、活检物、切片中的至少一种;
优选地,用于获取所述复诊测序结果的样本为血浆。
5.根据权利要求4所述的应用,其特征在于,所述步骤S3中,所述数据分析包括以下步骤:
S31、对所述初诊测序结果进行过滤,得到由k个第一突变位点组成的初诊突变集合;
S32、对所述复诊测序结果进行过滤,得到由m个可信突变组成的复诊突变集合;
S33、获取所述复诊突变集合中的m个所述可信突变的第一平均突变比例;
S34、从所述基因组合中随机抽取k个基因组位置,从k个位置中选取至多m个第二突变位点,获取m个第二突变位点在所述初诊突变集合中的第二平均突变比例;
S35、重复步骤S34共n次,获得由第二平均突变比例组成的第二平均突变比例集合;
所述n为10000-1000000;
S36、计算所述第一平均突变比例在所述第二平均突变比例集合中的显著性,如果显著性不大于显著性阈值时,则MRD判定为阳性;
优选地,所述步骤S32中,对所述复诊测序结果进行过滤包括:错义突变抛光、移码突变抛光和突变比例抛光;
所述错义突变抛光包括以下步骤:获取所述复诊测序结果中的错义突变位点,以所述错义突变位点的基因组位置作为x轴坐标,碱基变异类型作为y轴坐标,定位到错义背景抛光库中;将所述x轴坐标扩增第一碱基范围,所述y轴坐标扩增至所述错义突变位点在所述错义背景抛光库中的所有错义突变类型,截取所述错义背景抛光库中该范围内的所有错义突变位点的突变比例;计算所述错义突变位点的第一可信度,获得具有期望第一可信度的可信错义突变位点;
所述移码突变抛光包括以下步骤:获取所述复诊测序结果中的移码突变位点,以所述移码突变位点的基因组位置作为x轴坐标,移码碱基数作为y轴坐标,定位到移码背景抛光库中;将所述x轴坐标扩增第二碱基范围,所述y轴坐标扩增至所述移码突变位点的移码碱基数所对应的坐标处的所有突变,截取所述移码背景抛光库中该范围内所有移码突变位点的突变比例;计算所述移码突变位点的第二可信度,获得具有期望第二可信度的可信移码突变位点;
所述突变比例抛光包括以下步骤:计算可信突变位点的矫正后突变比例;
所述可信突变位点包括所述可信错义突变位点和所述可信移码突变位点;
所述矫正后突变比例=所述可信突变位点在所述初诊突变集合中的突变比例-所述可信突变位点在所述错义背景抛光库或所述移码背景抛光库中的平均突变比例;
优选地,所述错义背景抛光库的制备方法包括以下步骤:获取健康志愿者的cfDNA,并针对权利要求1所述的基因组合进行测序,得到第一背景测序结果;获取所述第一背景测序结果中的第三突变位点的基因组位置、碱基变异类型和突变比例,以所述第三突变位点的基因组位置作为x轴坐标、碱基变异类型作为y轴坐标、突变比例为z轴坐标,得到所述错义背景抛光库;
优选地,所述移码背景抛光库的制备方法包括以下步骤:获取健康志愿者的cfDNA,并针对权利要求1所述的基因组合进行测序,得到第二背景测序结果;获取所述第二背景测序结果中的第四突变位点的基因组位置、移码碱基数和突变比例,以所述第四突变位点的基因组位置作为x轴坐标、移码碱基数作为y轴坐标、突变比例为z轴坐标,得到所述移码背景抛光库;
优选地,所述步骤S36还包括计算每毫升血浆单倍体染色体当量,以判断外周血肿瘤负荷。
6.根据权利要求5所述的应用,其特征在于,所述步骤S31中,对所述初诊测序结果进行过滤具体为:去除所述初诊测序结果中的外周血有核细胞的突变位点;
优选地,获取所述外周血有核细胞的突变位点的方法包括以下步骤:
A1、提取所述外周血有核细胞的DNA;
A2、构建外周血有核细胞DNA文库;
A3、利用二代测序对所述外周血有核细胞DNA文库进行测序,得到所述外周血有核细胞测序数据;
A4、将所述外周血有核细胞测序数据的序列与参考序列进行比对,获取所述外周血有核细胞的突变位点;
优选地,所述步骤A4中,将所述外周血有核细胞测序数据的序列与参考序列进行比对包括:
识别得到第五突变位点;
对所述第五突变位点进行进下分析;
获得所述第五突变位点的基因重排信息;
对所述第五突变位点进行突变注释;
筛除群体遗传数据库中人群频率大于第二人群频率阈值的所述第五突变位点。
7.根据权利要求4所述的应用,其特征在于,所述步骤S2具体包括如下步骤:
S21、提取用于获取所述复诊测序结果的样本的cfDNA;
S22、构建复诊DNA文库;
S23、利用二代测序对所述复诊DNA文库进行测序,得到复诊测序数据;
S24、将所述复诊测序数据的序列与参考序列进行比对,得到所述复诊测序结果;
优选地,所述步骤S24包括:预处理,以获得具有期望质量的处理后复诊测序数据;识别得到第八突变位点;提取UMI标签;将所述处理后复诊测序数据与参考序列进行比对,获取第八突变位点;根据UMI标签对所述处理后复诊测序结果的序列进行分组;过滤分组后的所述序列,获得具有期望质量的过滤后第八突变位点;对所述过滤后第八突变位点进行突变注释;筛除群体遗传数据库中人群频率大于第五人群频率阈值的所述过滤后第八突变位点。
8.一种用于B细胞淋巴瘤MRD监测的系统,其特征在于,包括:
测序模块,用于对初诊的样本在权利要求1所述的基因组合进行测序,获得初诊测序数据,以及对复诊的样本的cfDNA在权利要求1所述的基因组合进行测序,获得复诊测序数据;
比对模块,用于将所述初诊测序数据的序列与参考序列进行比对,获得所述初诊测序结果,以及将所述复诊测序数据与参考序列进行比对,获得所述复诊测序结果;
分析模块,用于对所述初诊测序结果和所述复诊测序结果进行数据分析,获取B细胞淋巴瘤MRD的阳性或阴性结果。
9.根据权利要求8所述的系统,其特征在于,所述比对模块还用于对所述初诊测序数据和/或所述复诊测序数据进行质控处理和/或突变注释;
优选地,所述比对模块还用于筛除所述初诊测序数据和/或所述复诊测序数据中的在群体遗传数据库中不具有期望人群频率的突变位点。
10.根据权利要求8所述的系统,其特征在于,所述分析模块还用于对突变位点进行过滤和/或校正;
优选地,所述分析模块还用于计算每毫升血浆单倍体染色体当量。
CN202211165698.3A 2022-09-23 2022-09-23 一种用于b细胞淋巴瘤mrd监测的基因组合、试剂盒与应用 Pending CN115491423A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211165698.3A CN115491423A (zh) 2022-09-23 2022-09-23 一种用于b细胞淋巴瘤mrd监测的基因组合、试剂盒与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211165698.3A CN115491423A (zh) 2022-09-23 2022-09-23 一种用于b细胞淋巴瘤mrd监测的基因组合、试剂盒与应用

Publications (1)

Publication Number Publication Date
CN115491423A true CN115491423A (zh) 2022-12-20

Family

ID=84469846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211165698.3A Pending CN115491423A (zh) 2022-09-23 2022-09-23 一种用于b细胞淋巴瘤mrd监测的基因组合、试剂盒与应用

Country Status (1)

Country Link
CN (1) CN115491423A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116064755A (zh) * 2023-01-12 2023-05-05 华中科技大学同济医学院附属同济医院 一种基于连锁基因突变检测mrd标志物的装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160122819A1 (en) * 2014-11-05 2016-05-05 Fundación De Investigación Hospital 12 De Octubre Method for quantifying the level of minimal residual disease in a subject
CN107422122A (zh) * 2012-06-14 2017-12-01 鹿特丹伊拉斯姆斯大学医疗中心 用于检测微小残留病的方法、试剂以及试剂盒
CN108823640A (zh) * 2018-06-06 2018-11-16 珠海铂华生物工程有限公司 一种构建基于淋巴瘤基因检测的高通量测序文库的方法及其应用
CN110819710A (zh) * 2018-08-10 2020-02-21 珠海铂华生物工程有限公司 髓系肿瘤的高通量测序检测
CN111020710A (zh) * 2018-10-10 2020-04-17 珠海铂华生物工程有限公司 造血及淋巴组织肿瘤的ctDNA高通量检测
CN111662983A (zh) * 2020-07-06 2020-09-15 北京吉因加科技有限公司 一种用于检测淋巴瘤基因变异的试剂盒及其应用
CN114752672A (zh) * 2022-04-02 2022-07-15 广州医科大学附属肿瘤医院 基于循环游离DNA突变进行滤泡性淋巴瘤预后评估的检测panel、试剂盒及应用
CN114867870A (zh) * 2019-08-27 2022-08-05 10月12日大学医院生物医学研究基金会 用于确定疾病已被治疗的受试者中微小残留病(mrd)存在或缺失的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107422122A (zh) * 2012-06-14 2017-12-01 鹿特丹伊拉斯姆斯大学医疗中心 用于检测微小残留病的方法、试剂以及试剂盒
US20160122819A1 (en) * 2014-11-05 2016-05-05 Fundación De Investigación Hospital 12 De Octubre Method for quantifying the level of minimal residual disease in a subject
CN108823640A (zh) * 2018-06-06 2018-11-16 珠海铂华生物工程有限公司 一种构建基于淋巴瘤基因检测的高通量测序文库的方法及其应用
CN110819710A (zh) * 2018-08-10 2020-02-21 珠海铂华生物工程有限公司 髓系肿瘤的高通量测序检测
CN111020710A (zh) * 2018-10-10 2020-04-17 珠海铂华生物工程有限公司 造血及淋巴组织肿瘤的ctDNA高通量检测
CN114867870A (zh) * 2019-08-27 2022-08-05 10月12日大学医院生物医学研究基金会 用于确定疾病已被治疗的受试者中微小残留病(mrd)存在或缺失的方法
CN111662983A (zh) * 2020-07-06 2020-09-15 北京吉因加科技有限公司 一种用于检测淋巴瘤基因变异的试剂盒及其应用
CN114752672A (zh) * 2022-04-02 2022-07-15 广州医科大学附属肿瘤医院 基于循环游离DNA突变进行滤泡性淋巴瘤预后评估的检测panel、试剂盒及应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
IRENE DOGLIOTTI等: "New Molecular Technologies for Minimal Residual Disease Evaluation in B-Cell Lymphoid Malignancies" *
M LADETTO等: "Next-generation sequencing and real-time quantitative PCR for minimal residual disease detection in B-cell disorders" *
刘树茂等: "B细胞淋巴瘤肿瘤细胞克隆及微小残留病检测" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116064755A (zh) * 2023-01-12 2023-05-05 华中科技大学同济医学院附属同济医院 一种基于连锁基因突变检测mrd标志物的装置
CN116064755B (zh) * 2023-01-12 2023-10-20 华中科技大学同济医学院附属同济医院 一种基于连锁基因突变检测mrd标志物的装置

Similar Documents

Publication Publication Date Title
JP7119014B2 (ja) まれな変異およびコピー数多型を検出するためのシステムおよび方法
JP6817259B2 (ja) 癌の検出のための血漿dna中のサイズ及び数異常の使用
CN109880910A (zh) 一种肿瘤突变负荷的检测位点组合、检测方法、检测试剂盒及系统
CN106650312B (zh) 一种用于循环肿瘤dna拷贝数变异检测的装置
CN108753967A (zh) 一种用于肝癌检测的基因集及其panel检测设计方法
CN112805563A (zh) 用于评估和/或治疗癌症的无细胞dna
CN113151474A (zh) 用于癌症检测的血浆dna突变分析
CN109637587B (zh) 检测基因融合突变的方法、装置、存储介质、处理器及转录组数据表达量标准化的方法
EP3249051B1 (en) Use of methylation sites in y chromosome as prostate cancer diagnosis marker
CN111647648A (zh) 一种用于检测乳腺癌基因突变的基因panel及其检测方法与应用
CN108595918B (zh) 循环肿瘤dna重复序列的处理方法及装置
CN105925665A (zh) 试剂盒、建库方法以及检测目标区域变异的方法及系统
CN116580768B (zh) 一种基于定制化策略的肿瘤微小残留病灶检测方法
CN115443341A (zh) 分析无细胞核酸的方法及其应用
AU2020364225B2 (en) Fragment size characterization of cell-free DNA mutations from clonal hematopoiesis
CN116356001B (zh) 一种基于血液循环肿瘤dna的双重背景噪声突变去除方法
US20220228221A1 (en) Diagnostics and Treatments Based Upon Molecular Characterization of Colorectal Cancer
CN105779435A (zh) 试剂盒及其用途
WO2019046804A1 (en) IDENTIFICATION OF FALSE POSITIVE VARIANTS USING A MODEL OF IMPORTANCE
CN115820860A (zh) 基于增强子甲基化差异的非小细胞肺癌标志物筛选方法及其标志物和应用
CN115491423A (zh) 一种用于b细胞淋巴瘤mrd监测的基因组合、试剂盒与应用
CN111979327A (zh) 用于人甲状腺免提取癌基因突变检测试剂盒及检测方法
CN112592976B (zh) 一种检测met基因扩增的方法及装置
CN105950709A (zh) 试剂盒、建库方法以及检测目标区域变异的方法及系统
Del Portillo et al. Evaluation of mutational testing of preneoplastic Barrett's mucosa by next-generation sequencing of formalin-fixed, paraffin-embedded endoscopic samples for detection of concurrent dysplasia and adenocarcinoma in Barrett's esophagus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240129

Address after: Room 302-2, Building 3, No. 100 Feipeng Road, Guangdong Macao Cooperation Traditional Chinese Medicine Technology Industrial Park, Hengqin New Area, Zhuhai City, Guangdong Province, 510000

Applicant after: Zhuhai Hengqin Bohua Medical Laboratory Co.,Ltd.

Country or region after: China

Applicant after: Ezhou Bohua Biological Products Co.,Ltd.

Address before: Room 302-2, Building 3, No. 100, Feipeng Road, Guangdong Macao Cooperative Traditional Chinese Medicine Science and Technology Industrial Park, Hengqin New District, Zhuhai, Guangdong Province, 519000

Applicant before: Zhuhai Hengqin Bohua Medical Laboratory Co.,Ltd.

Country or region before: China