CN112509638A - 人类hla染色体区域杂合性缺失的分析方法和分析处理装置 - Google Patents

人类hla染色体区域杂合性缺失的分析方法和分析处理装置 Download PDF

Info

Publication number
CN112509638A
CN112509638A CN202011404354.4A CN202011404354A CN112509638A CN 112509638 A CN112509638 A CN 112509638A CN 202011404354 A CN202011404354 A CN 202011404354A CN 112509638 A CN112509638 A CN 112509638A
Authority
CN
China
Prior art keywords
hla
gene
percentage
recipient
transplantation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011404354.4A
Other languages
English (en)
Other versions
CN112509638B (zh
Inventor
郑仲征
贺青青
廖宽镇
涂小年
袁志阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dishuobeiken Gene Technology Co ltd
Shanghai Tissuebank Biotechnology Co ltd
Shanghai Tissuebank Medical Inspection Co ltd
Shenzhen Tissuebank Precision Medicine Co ltd
Original Assignee
Shanghai Dishuobeiken Gene Technology Co ltd
Shanghai Tissuebank Biotechnology Co ltd
Shanghai Tissuebank Medical Inspection Co ltd
Shenzhen Tissuebank Precision Medicine Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dishuobeiken Gene Technology Co ltd, Shanghai Tissuebank Biotechnology Co ltd, Shanghai Tissuebank Medical Inspection Co ltd, Shenzhen Tissuebank Precision Medicine Co ltd filed Critical Shanghai Dishuobeiken Gene Technology Co ltd
Priority to CN202011404354.4A priority Critical patent/CN112509638B/zh
Publication of CN112509638A publication Critical patent/CN112509638A/zh
Priority to PCT/CN2021/085090 priority patent/WO2022116456A1/zh
Priority to US17/522,841 priority patent/US20220180965A1/en
Application granted granted Critical
Publication of CN112509638B publication Critical patent/CN112509638B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于生物信息分析领域,公开了一种人类HLA染色体区域杂合性缺失的分析方法和分析处理装置。本发明针对HLA Loss导致的移植后复发的检测需求,基于二代测序数据,提供了人类HLA染色体区域杂合性缺失的分析方法和分析处理装置,能够方便地进行流程化和批量化操作,人工解读工作量小,能够准确地检测样本中是否发生HLA染色体区域杂合性缺失,对检测HLA Loss导致的移植后复发具有重要的意义。

Description

人类HLA染色体区域杂合性缺失的分析方法和分析处理装置
技术领域
本发明涉及生物信息分析领域,具体涉及一种人类HLA染色体区域杂合性缺失的分析方法和分析处理装置。
背景技术
染色体杂合性缺失(Loss Of Heterozygosity,LOH)在恶性肿瘤中是一种常见的染色体畸变。发生于HLA(人类白细胞抗原)染色体区域的LOH称为HLA Loss,发生HLA Loss后会影响HLA的正常表达,使肿瘤细胞逃避机体免疫细胞的杀伤,导致肿瘤细胞的免疫逃逸。HLA Loss在实体瘤如非小细胞肺癌中常见,也可发生在血液肿瘤中,在造血干细胞移植手术后若肿瘤细胞发生HLA Loss则会导致该肿瘤细胞不被免疫细胞杀伤,导致该种血液病复发。至2017年为止,在半相合造血干细胞移植案例中,由于HLA Loss导致的移植后复发占所有复发病例的33%。HLA Loss国际多中心协作组的结果显示,在396例有效入组病例中,HLA Loss导致的复发共51例,其中35例来自半相合移植,12例来自HLA错配的无关供者移植,4例来自全相合无关供者移植,脐血移植HLA Loss为0。多中心研究的结果显示,HLALoss是造血干细胞移植后免疫逃逸和复发的主要机制之一,且HLA Loss的比例与供患之间HLA的错配位点数量有关。
移植后HLA Loss的检测对于明确复发原因,指导复发治疗有非常重要的意义。由于错配位点的丢失,常规的复发治疗手段,如减少免疫抑制剂使用量及供者淋巴细胞输注(DLI),在HLA Loss复发中并不适用并需严格禁止,因为HLA Loss的复发中,DLI输注不会产生移植物抗白血病效应,但会产生严重的移植物抗宿主病反应。基于此,移植复发后HLALoss是否存在,应该成为常规临床开展项目,甚至,在复发前应该进行HLA Loss动态监测,以尽早的预测复发,对复发的治疗方案的制定也至关重要。
HLA Loss导致的移植后复发是近年新发现的现象,目前国际范围内可对其进行检测的移植中心屈指可数,有部分机构尝试采用荧光定量PCR方法对其检测,然而该方法仅能覆盖约70%人群的HLA型别。国内更是一片空白,尚无一种高效、精准、成熟可靠的检测方法和系统可对其进行检测和分析。基于以上原因,目前亟需一种高效、精准、成熟可靠且适合所有人群的HLA Loss检测方法和系统。
发明内容
本发明针对检测HLA Loss导致的移植后复发的需求,提供了一种高效、精准、成熟可靠且适合所有人群的HLA Loss分析方法和分析处理装置。
为此,本发明一方面提供了一种HLA染色体区域的杂合性缺失的分析方法,包括以下步骤:
1、对样本数据进行拆分和过滤,得到过滤后的样本序列;
2、获得各HLA基因测序数据文件,所述测序数据文件包含各HLA基因的样本数据;
3、生成受者移植术前HLA基因型的第一个等位基因序列作为参考基因;
4、获得各HLA基因中受者移植术后所占百分比;
5、获得受者移植术后HLA基因染色体区域的百分比,以HLA%表示;
6、获得受者移植术后细胞中各染色体总体百分比,以STR%表示;
7、受者移植术后HLA Loss阴阳性判断。
在本发明优选的实施方案中,各步骤具体为:
1、对测序完成后的样本下机数据进行拆分和过滤,得到过滤后的样本序列;
2、根据设定的比对参数,将过滤后的样本序列比对至各HLA基因参考基因序列,将比对上的测序序列拆分至各HLA测序数据文件,所述测序数据文件包含测序完成后各HLA基因的样本下机数据;
3、获取移植术前受者和供者各HLA等位基因型别,比对后,获得受者与供者之间各HLA基因的SNP差异,生成受者移植术前HLA基因型的第一个等位基因序列作为参考基因;
4、将步骤2所述测序数据文件比对至步骤3的参考基因,统计步骤3中各HLA基因SNP位置的受者及供者分别的测序深度,将各HLA基因全部SNP位置受者的深度频率取平均值,得到各HLA基因中受者移植术后所占百分比;
5、取各HLA基因受者百分比的平均值,即为受者移植术后HLA染色体区域的百分比,以HLA%表示;
6、获得受者移植术后细胞中各染色体总体百分比,以STR%表示;
7、阴阳性判断:当HLA%≤0.5%,且STR%≥3%时,判断为HLA Loss阳性;当HLA%≥3%时,判断为HLA Loss阴性;当0.5%≤HLA%<3%时提示无法判断,受者移植术后细胞HLA染色体可能处于正在缺失时期。
在本发明优选的实施方案中,所述分析方法还包括以下步骤:
8、将HLA各基因百分比、平均百分比、阴阳性判断结果输出至报告文件。
在本发明优选的实施方案中,各HLA基因分别为HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1和HLA-DPB1基因。
在本发明优选的实施方案中,HLA-A基因比对至A*01:01:01:01、HLA-B基因比对至B*07:02:01:01、HLA-C基因比对至C*01:02:01:01、HLA-DRB1基因比对至DRB1*01:02:01:01、HLA-DQB1基因比对至DQB1*05:01:01:01、HLA-DPB1基因比对至DPB1*01:01:01:01。
本发明另一方面提供了一种HLA染色体区域的杂合性缺失的分析处理装置,其包括以下模块:
1、拆分和过滤模块,其对样本数据进行拆分和过滤,得到过滤后的样本序列;
2、基因测序数据文件获取模块,用于获得各HLA基因测序数据文件,所述测序数据文件包含各HLA基因的样本数据;
3、参考基因生成模块,用于生成受者移植术前HLA基因型的第一个等位基因序列作为参考基因;
4、各HLA基因所占百分比计算模块,用于获得各HLA基因中受者移植术后所占百分比;
5、HLA基因染色体区域百分比计算模块,用于获得受者移植术后HLA基因染色体区域的百分比,以HLA%表示;
6、HLA基因各染色体总体百分比计算模块,用于获得受者移植术后细胞中各染色体总体百分比,以STR%表示;
7、阴阳性判断模块,用于进行受者移植术后HLA Loss阴阳性判断。
所述分析处理装置中,各模块之间的相互关系如附图2所示。
在本发明优选的实施方案中,各模块具体为:
1、拆分和过滤模块,其对测序完成后的样本下机数据进行拆分和过滤,得到过滤后的样本序列;
2、基因测序数据文件获取模块,其根据设定的比对参数,将过滤后的样本序列比对至各HLA基因参考基因序列,将比对上的测序序列拆分至各HLA测序数据文件,所述测序数据文件包含测序完成后各HLA基因的样本下机数据;
3、参考基因生成模块,用于获取移植术前受者和供者各HLA等位基因型别,比对后,获得受者与供者之间各HLA基因的SNP差异,生成受者移植术前HLA基因型的第一个等位基因序列作为参考基因;
4、各HLA基因所占百分比计算模块,用于将步骤2所述测序数据文件比对至步骤3的参考基因,统计步骤3中各HLA基因SNP位置的受者及供者分别的测序深度,将各HLA基因全部SNP位置受者的深度频率取平均值,得到各HLA基因中受者移植术后所占百分比;
5、HLA基因染色体区域百分比计算模块,用于取各HLA基因受者百分比的平均值,即为受者移植术后HLA染色体区域的百分比,以HLA%表示;
6、HLA基因各染色体总体百分比计算模块,用于获得受者移植术后细胞中各染色体总体百分比,以STR%表示;
7、阴阳性判断模块,用于进行受者移植术后HLA Loss阴阳性判断,当HLA%≤0.5%,且STR%≥3%时,判断为HLA Loss阳性;当HLA%≥3%时,判断为HLA Loss阴性;当0.5%≤HLA%<3%时提示无法判断,受者移植术后细胞HLA染色体可能处于正在缺失时期。
在本发明优选的实施方案中,所述分析处理装置还包括以下模块:
8、报告文件生成模块,用于将HLA各基因百分比、平均百分比、阴阳性判断结果输出至报告文件。
在本发明优选的实施方案中,各HLA基因分别为HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1和HLA-DPB1基因。
在本发明优选的实施方案中,HLA-A基因比对至A*01:01:01:01、HLA-B基因比对至B*07:02:01:01、HLA-C基因比对至C*01:02:01:01、HLA-DRB1基因比对至DRB1*01:02:01:01、HLA-DQB1基因比对至DQB1*05:01:01:01、HLA-DPB1基因比对至DPB1*01:01:01:01。
由上述描述可知,本发明基于二代测序数据,提供的分析方法和分析处理装置能够方便地进行流程化和批量化操作,人工解读工作量小,能够准确地检测样本中是否发生HLA染色体区域杂合性缺失,对检测HLA Loss导致的移植后复发具有重要的意义。
附图说明
图1:本发明分析方法流程图。
图2:本发明分析处理装置中各模块相互关系显示图。
图3:实施例1中原始数据整体数据质量显示图。
图4:实施例1中过滤后数据整体数据质量显示图。
图5:实施例2中原始数据整体数据质量显示图。
图6:实施例2中过滤后数据整体数据质量显示图。
图7:实施例3的线性拟合曲线图。
具体实施方式
下面通过实施例对本发明作进一步的详细说明,旨在用于说明本发明而非限定本发明。应当指出,对于本领域技术人员而言,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也同样落入本发明的保护范围之内。
实施例1:造血干细胞移植术后HLA染色体区域的杂合性缺失阴性受者的检测
1、对造血干细胞移植受者术后进行靶向测序检测,获取配型和嵌合结果
本实施例采用造血干细胞移植受者术后血液标本,提取其基因组DNA为模板,进行二代靶向测序检测,检测结果采用本发明分析方法进行分析。
由移植前配型报告获取移植前受者HLA配型结果为:A*02:10,A*24:02,B*15:01,B*40:01,C*03:03,C*07:02,DRB1*09:01,DRB1*14:05,DQB1*05:03,DQB1*03:03;供者HLA配型结果为:A*24:02,A*26:01,B*15:01,B*40:01,C*03:03,C*07:02,DRB1*14:05,DRB1*15:02,DQB1*05:03,DQB1*06:01。供者和受者的B基因和C基因相合,本发明方法只分析计算A基因、DRB1基因和DQB1基因三个基因。由移植后嵌合率报告获取血液中受者细胞占比STR%为41.27%。
2、对测序获得的序列进行拆分和过滤,获得高质量的样本序列
参照附图1所示的流程图,使用bcl2fastq软件(网址为https://support.illumina.com/sequencing/sequencing_software/bcl2fastq-conversion-software.html)对二代测序下机数据进行拆分,并用Trimmomatic软件(网址为http://www.usadellab.org/cms/?page=trimmomatic)对数据进行过滤。过滤参数如下:过滤平均质量阈值:30;滑窗剪切
(Slidingwindow):5;得到过滤后的样本序列;开头及结尾切除质量值低于阈值的碱基数(Leading,Trailing):5;长度阈值(Minlen):50,过滤后得到高质量的样本序列。数据过滤前后对比情况参见附图3和附图4,可以明显看出原始数据在参考基因第1位以及第51至第75位碱基有部分reads,数据质量下降,而经过数据过滤之后这些位置质量差的部分均被删去。
3、将过滤后的样本序列比对至HLA基因参考基因,获得测序数据文件
由IMGT-HLA公共数据库(网址为https://www.ebi.ac.uk/ipd/imgt/hla/)查询获得A*01:01:01:01,DRB1*01:02:01:01,DQB1*05:01:01:01序列,使用bwa软件(网址为https://sourceforge.net/projects/bio-bwa/)将上一步过滤后的样本序列比对至各HLA基因参考基因(使用默认参数进行比对),将比对上的测序序列拆分至HLA-A、HLA-DRB1和HLA-DQB1共3个测序数据文件。
4、对比受者与供者各基因中不同型别之间的SNP差异,获得snp文件
使用MUSCLE软件(网址为http://www.drive5.com/muscle/)对比供者与受者A基因中3个型别A*02:10,A*24:02,A*26:01的SNP差异(使用默认参数进行比对),共有4个SNP,保存为A.snp文件;对比供者与受者DRB1基因中3个型别DRB1*09:01,DRB1*14:05,DRB1*15:02的SNP差异,共有37个SNP,保存为DRB1.snp文件;对比供者与受者DQB1基因中3个型别DQB1*05:03,DQB1*03:03,DQB1*06:01的SNP差异,共有19个SNP,保存为DQB1.snp文件。
5、将测序数据文件分别与对应基因的参考序列进行比对,生成各基因的比对文件
由IMGT-HLA公共数据库(网址为https://www.ebi.ac.uk/ipd/imgt/hla/)查询获得A*02:10,DRB1*09:01:02:01,DQB1*05:03:01:01参考序列,使用bwa软件(网址为https://sourceforge.net/projects/bio-bwa/)的mem算法将3个测序数据文件中序列按基因分别比对至A*02:10,DRB1*09:01:02:01,DQB1*05:03:01:01参考序列,生成各基因比对文件A.bam、DRB1.bam、DQB1.bam。
6、获得基因比对文件中各SNP位置测序深度,计算各基因深度占比的平均值
进一步,调取snp文件,使用bamreadcount软件(网址为https://github.com/genome/bam-readcount)调取bam文件中各SNP位置测序深度,计算各位置属于受者的型别的深度占比。A基因4个SNP占比分别为47.88%,38.11%,51.75%,46.32%,平均数46.02%;DRB1基因37个SNP中共有18个SNP被检测,占比分别为23.64%,31.60%,52.81%,41.32%,48.04%,64.69%,46.54%,43.59%,58.48%,36.23%,70.02%,75.06%,30.40%,48.29%,46.99%,25.18%,56.42%,40.23%,平均数46.64%;DQB1基因19个SNP中共有7个SNP被检测,占比分别为46.23%,44.99%,38.79%,36.90%,37.59%,32.15%,36.68%,平均数39.05%。
7、获得全部基因的平均值,判断移植受者术后HLA染色体区域是否发生杂合性缺失
进一步,取3个基因平均值43.90%。根据本发明阴阳性判断方法移植受者术后HLA染色体区域占比43.90%大于3%,判断该检测者为HLA Loss阴性,结果表明该检测者术后HLA染色体区域未发生杂合性缺失。
实施例2:造血干细胞移植术后HLA染色体区域的杂合性缺失阳性受者的检测
1、对造血干细胞移植术后受者进行靶向测序检测、获取配型和嵌合结果
本实施例采用造血干细胞移植术后受者血液标本,提取其基因组DNA为模板,进行二代靶向测序检测,检测结果采用本发明分析方法进行分析。
由移植前配型报告获取移植前受者HLA配型结果为:A*02:03,A*30:01,B*13:02,B*18:01,C*06:02,C*07:04,DRB1*07:01,DRB1*14:04,DQB1*05:03,DQB1*02:02;供者HLA配型结果为:A*11:01,A*30:01,B*13:02,B*15:02,C*06:02,C*08:01,DRB1*07:01,DRB1*13:02,DQB1*06:04,DQB1*02:02。由移植后嵌合率报告获取血液中受者细胞占比STR%为6.85%。
2、对测序获得的序列进行拆分和过滤,获得高质量的样本序列
参照附图1流程图,使用bcl2fastq软件(网址为https://support.illumina.com/sequencing/sequencing_software/bcl2fastq-conversion-software.html)对二代测序下机数据进行拆分,并用Trimmomatic软件(网址为http://www.usadellab.org/cms/?page=trimmomatic)对数据进行过滤,参数如下:过滤平均质量阈值:30;滑窗剪切(Slidingwindow):5;得到过滤后的样本序列;开头及结尾切除质量值低于阈值的碱基数(Leading,Trailing):5;长度阈值(Minlen):50,过滤后得到高质量的样本序列。数据过滤前后对比情况参见附图5和附图6,可以明显看出原始数据在参考基因第61至第75位碱基有部分reads,数据质量下降,而经过数据过滤之后这些位置质量差的部分均被删去。
3、将过滤后的样本序列比对至HLA基因参考基因,获得测序数据文件
由IMGT-HLA公共数据库(网址为https://www.ebi.ac.uk/ipd/imgt/hla/)查询获得A*01:01:01:01,B*07:02:01:01,C*01:02:01:01,DRB1*01:02:01:01,DQB1*05:01:01:01序列,使用bwa软件(网址为https://sourceforge.net/projects/bio-bwa/)将上一步过滤后的样本序列比对至各HLA基因参考基因(使用默认参数进行比对),将比对上的测序序列拆分至HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1共5个测序数据文件。
4、对比供者与受者各基因中不同型别之间的SNP差异,获得snp文件
使用MUSCLE软件(网址为http://www.drive5.com/muscle/)对比供者与受者A基因中3个型别A*02:03,A*30:01,A*11:01的SNP差异(使用默认参数进行比对),共有6个SNP,保存为A.snp文件;对比供者与受者B基因中3个型别B*13:02,B*18:01,B*15:02的SNP差异,共有6个SNP,保存为B.snp文件;对比供者与受者C基因中3个型别C*06:02,C*07:04,C*08:01的SNP差异,共有2个SNP,保存为C.snp文件;对比供者与受者DRB1基因中3个型别DRB1*07:01,DRB1*14:04,DRB1*13:02的SNP差异,共有9个SNP,保存为DRB1.snp文件;对比供者与受者DQB1基因中3个型别DQB1*05:03,DQB1*02:02,DQB1*06:04的SNP差异,共有14个SNP,保存为DQB1.snp文件。
5、将测序数据文件分别与对应基因的参考序列进行比对,生成各基因比对文件
由IMGT-HLA公共数据库(网址为https://www.ebi.ac.uk/ipd/imgt/hla/)查询获得A*02:03:01,B*13:02:01:01,C*06:02:01:01,DRB1*07:01:01:01,DQB1*05:03:01:01参考序列,使用bwa软件(网址为https://sourceforge.net/projects/bio-bwa/)的mem算法默认参数将5个测序数据文件中序列按基因分别比对至A*02:03:01,B*13:02:01:01,C*06:02:01:01,DRB1*07:01:01:01,DQB1*05:03:01:01参考序列,生成各基因比对文件A.bam、B.bam、C.bam、DRB1.bam、DQB1.bam。
6、获得基因比对文件中各SNP位置测序深度,计算各基因深度占比的平均值
进一步,调取snp文件,使用bamreadcount软件(网址为https://github.com/genome/bam-readcount)查看bam文件中各SNP位置测序深度,计算各位置属于受者的型别的深度占比,A基因6个SNP占比分别为0.53%,0.52%,0.35%,0.35%,0.52%,0.38%,平均数0.44%;B基因6个SNP中共有5个SNP被检测,占比分别为0.11%,0.16%,0.41%,0.44%,0.29%,平均数0.28%;C基因2个SNP占比分别为0.21%,0.45%,平均数0.33%;DRB1基因9个SNP中共有2个SNP被检测,占比分别为0.00%,0.43%,平均数0.22%;DQB1基因14个SNP中共有7个SNP被检测,占比分别为0.37%,0.13%,0.14%,0.24%,0.14%,0.08%,0.24%,平均数0.19%。
7、获得全部基因的平均值,判断移植受者术后HLA染色体区域是否发生杂合性缺失
进一步,取5个基因平均值0.29%。根据本发明阴阳性判断方法移植受者术后HLA染色体区域占比0.29%小于0.5%,且嵌合率百分比6.85%大于3%,判断该移植受者为HLALoss阳性,结果表明该检测者移植术后HLA染色体区域已发生杂合性缺失。
实施例3:验证本发明算法灵敏度与特异性
本实施例通过人为地等比例混合两个健康人样本,模拟不同的供者与受者嵌合率,采用本发明算法检测在各浓度梯度时两个样本测序结果占比,通过线性拟合验证本发明算法灵敏度与特异性。
本实施例随机挑选了两例健康人血液标本,样本一的HLA配型结果为A*26:01,A*31:01,B*40:06,B*40:06,C*08:01,C*15:02,DRB1*09:01,DRB1*15:02,DQB1*06:02,DQB1*03:03,样本二的HLA配型结果为A*24:02,A*24:02,B*40:01,B*40:03,C*03:04,C*07:02,DRB1*12:01,DRB1*15:01,DQB1*06:02,DQB1*03:01,采用分光光度计检测样本DNA浓度后,根据DNA浓度采用浓度梯度稀释法将两个样本混合成1:1、1:4、1:8、1:16、1:32、1:64六个不同比例的样本,再进行二代建库及测序。
混合样本中样本一理论比例分别为50.00%,25.00%,12.50%,6.25%,3.12%,1.57%。应当指出该比例仅为参考值,由分光光度计检测吸光度后换算,非实际比例,仅作为混合样品参考,不作为本发明算法有效性的参考值。
采用本发明分析方法对各比例样本下机测序数据进行分析,各比例各基因样本一占比参见表1,进一步对结果平均值进行线性拟合,结果参见附图7,拟合结果显示利用本发明算法进行HLA染色体区域的杂合性缺失检测具有非常高的灵敏度与特异性。
表1:实施例3梯度混合结果表
Figure BDA0002818144330000101
Figure BDA0002818144330000111

Claims (10)

1.一种HLA染色体区域的杂合性缺失的分析方法,包括以下步骤:
(1)对样本数据进行拆分和过滤,得到过滤后的样本序列;
(2)获得各HLA基因测序数据文件,所述测序数据文件包含各HLA基因的样本数据;
(3)生成受者移植术前第一个等位基因序列作为参考基因;
(4)获得各HLA基因中受者移植术后所占百分比;
(5)获得受者移植术后HLA基因染色体区域的百分比,以HLA%表示;
(6)获得受者移植术后细胞中各染色体总体百分比,以STR%表示;
(7)受者移植术后HLA Loss阴阳性判断。
2.根据权利要求1所述的分析方法,各步骤具体为:
(1)对测序完成后的样本下机数据进行拆分和过滤,得到过滤后的样本序列;
(2)根据设定的比对参数,将过滤后的样本序列比对至各HLA基因参考基因序列,将比对上的测序序列拆分至各HLA测序数据文件,所述测序数据文件包含测序完成后各HLA基因的样本下机数据;
(3)获取移植术前受者和供者各HLA等位基因型别,比对后,获得受者与供者之间各HLA基因的SNP差异,生成受者移植术前HLA基因型的第一个等位基因序列作为参考基因;
(4)将步骤(2)所述测序数据文件比对至步骤(3)的参考基因,统计步骤(3)中各HLA基因SNP位置的受者及供者分别的测序深度,将各HLA基因全部SNP位置受者的深度频率取平均值,得到各HLA基因中受者移植术后所占百分比;
(5)取各HLA基因受者百分比的平均值,即为受者移植术后HLA染色体区域的百分比,以HLA%表示;
(6)获得受者移植术后细胞中各染色体总体百分比,以STR%表示;
(7)阴阳性判断:当HLA%≤0.5%,且STR%≥3%时,判断为HLA Loss阳性;当HLA%≥3%时,判断为HLA Loss阴性;当0.5%≤HLA%<3%时提示无法判断,受者移植术后细胞HLA染色体可能处于正在缺失时期。
3.根据权利要求1或2所述的分析方法,其还包括以下步骤:
(8)将HLA各基因百分比、平均百分比、阴阳性判断结果输出至报告文件。
4.根据权利要求1-3中任一项所述的分析方法,其中各HLA基因分别为HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1和HLA-DPB1基因。
5.根据权利要求1-4中任一项所述的分析方法,其中HLA-A基因比对至A*01:01:01:01、HLA-B基因比对至B*07:02:01:01、HLA-C基因比对至C*01:02:01:01、HLA-DRB1基因比对至DRB1*01:02:01:01、HLA-DQB1基因比对至DQB1*05:01:01:01、HLA-DPB1基因比对至DPB1*01:01:01:01。
6.一种HLA染色体区域的杂合性缺失的分析处理装置,包括以下模块:
(1)拆分和过滤模块,其对样本数据进行拆分和过滤,得到过滤后的样本序列;
(2)基因测序数据文件获取模块,用于获得各HLA基因测序数据文件,所述测序数据文件包含各HLA基因的样本数据;
(3)参考基因生成模块,用于生成受者移植术前第一个等位基因序列作为参考基因;
(4)各HLA基因所占百分比计算模块,用于获得各HLA基因中受者移植术后所占百分比;
(5)HLA基因染色体区域百分比计算模块,用于获得受者移植术后HLA基因染色体区域的百分比,以HLA%表示;
(6)HLA基因各染色体总体百分比计算模块,用于获得受者移植术后细胞中各染色体总体百分比,以STR%表示;
(7)阴阳性判断模块,用于进行受者移植术后HLA Loss阴阳性判断。
7.根据权利要求6所述的分析处理装置,各模块具体为:
(1)拆分和过滤模块,其对测序完成后的样本下机数据进行拆分和过滤,得到过滤后的样本序列;
(2)基因测序数据文件获取模块,其根据设定的比对参数,将过滤后的样本序列比对至各HLA基因参考基因序列,将比对上的测序序列拆分至各HLA测序数据文件,所述测序数据文件包含测序完成后各HLA基因的样本下机数据;
(3)参考基因生成模块,用于获取移植术前受者和供者各HLA等位基因型别,比对后,获得受者与供者之间各HLA基因的SNP差异,生成受者移植术前HLA基因型第一个等位基因序列作为参考基因;
(4)各HLA基因所占百分比计算模块,用于将步骤(2)所述测序数据文件比对至步骤(3)的参考基因,统计步骤(3)中各HLA基因SNP位置的受者及供者分别的测序深度,将各HLA基因全部SNP位置受者的深度频率取平均值,得到各HLA基因中受者移植术后所占百分比;
(5)HLA基因染色体区域百分比计算模块,用于取各HLA基因受者百分比的平均值,即为受者移植术后HLA染色体区域的百分比,以HLA%表示;
(6)HLA基因各染色体总体百分比计算模块,用于获得受者移植术后细胞中各染色体总体百分比,以STR%表示;
(7)阴阳性判断模块,用于进行受者移植术后HLA Loss阴阳性判断,当HLA%≤0.5%,且STR%≥3%时,判断为HLA Loss阳性;当HLA%≥3%时,判断为HLA Loss阴性;当0.5%≤HLA%<3%时提示无法判断,受者移植术后细胞HLA染色体可能处于正在缺失时期。
8.根据权利要求6或7所述的分析处理装置,其还包括以下模块:
(8)报告文件生成模块,用于将HLA各基因百分比、平均百分比、阴阳性判断结果输出至报告文件。
9.根据权利要求6-8中任一项所述的分析处理装置,其中各HLA基因分别为HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1和HLA-DPB1基因。
10.根据权利要求6-9中任一项所述的分析处理装置,其中HLA-A基因比对至A*01:01:01:01、HLA-B基因比对至B*07:02:01:01、HLA-C基因比对至C*01:02:01:01、HLA-DRB1基因比对至DRB1*01:02:01:01、HLA-DQB1基因比对至DQB1*05:01:01:01、HLA-DPB1基因比对至DPB1*01:01:01:01。
CN202011404354.4A 2020-12-04 2020-12-04 人类hla染色体区域杂合性缺失的分析方法和分析处理装置 Active CN112509638B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202011404354.4A CN112509638B (zh) 2020-12-04 2020-12-04 人类hla染色体区域杂合性缺失的分析方法和分析处理装置
PCT/CN2021/085090 WO2022116456A1 (zh) 2020-12-04 2021-04-01 人类hla染色体区域杂合性缺失的分析方法和分析处理装置
US17/522,841 US20220180965A1 (en) 2020-12-04 2021-11-09 Analysis method and analysis processing apparatus for loss of heterozygosity (loh) of human leukocyte antigen (hla)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011404354.4A CN112509638B (zh) 2020-12-04 2020-12-04 人类hla染色体区域杂合性缺失的分析方法和分析处理装置

Publications (2)

Publication Number Publication Date
CN112509638A true CN112509638A (zh) 2021-03-16
CN112509638B CN112509638B (zh) 2021-12-03

Family

ID=74969875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011404354.4A Active CN112509638B (zh) 2020-12-04 2020-12-04 人类hla染色体区域杂合性缺失的分析方法和分析处理装置

Country Status (2)

Country Link
CN (1) CN112509638B (zh)
WO (1) WO2022116456A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022116456A1 (zh) * 2020-12-04 2022-06-09 深圳荻硕贝肯精准医学有限公司 人类hla染色体区域杂合性缺失的分析方法和分析处理装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090177487A1 (en) * 2008-01-07 2009-07-09 Tera Eerkes Methods for Assessing Genetic Compatibility
CN101575643A (zh) * 2009-05-31 2009-11-11 中国人民解放军第二军医大学 一种检测异基因造血干细胞移植后供受嵌合率的方法
CN103074444A (zh) * 2013-02-25 2013-05-01 苏州晶因生物科技有限公司 组织相容性抗原决定簇基因高通量测序的hla基因分型方法
CN104004817A (zh) * 2013-02-22 2014-08-27 哈佛大学 利用极体或胚胎的单细胞基因组测序来选择试管婴儿的胚胎
CN105986011A (zh) * 2015-01-30 2016-10-05 深圳华大基因研究院 一种杂合性缺失的检测方法
CN106755535A (zh) * 2017-03-01 2017-05-31 上海荻硕贝肯医学检验所有限公司 用于检测人类cyp2c19基因多态性的引物、探针、试剂盒及方法
WO2019014667A1 (en) * 2017-07-14 2019-01-17 The Regents Of The University Of California NEW METHODS FOR PREDICTING THE RISK OF GRAFT REJECTION
CN110100014A (zh) * 2016-10-31 2019-08-06 香港科技大学 用于检测阿尔茨海默病基因变体的组合物、方法和试剂盒
CN110913896A (zh) * 2017-07-14 2020-03-24 弗朗西斯.克里克研究所 肿瘤中hla等位基因的分析及其用途
CN111091868A (zh) * 2019-12-23 2020-05-01 江苏先声医学诊断有限公司 一种染色体非整倍体的分析方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6302048B2 (ja) * 2013-05-08 2018-03-28 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 次世代システムを用いるhla遺伝子アンプリコンのディープシーケンシングにより混合物を定量解析することによる固形臓器移植片拒絶の非侵襲的早期検出
CN110551803A (zh) * 2019-06-18 2019-12-10 华夏源(上海)细胞基因工程股份有限公司 一种人类hla基因多态性引物插入或缺失的测序方法
CN112509638B (zh) * 2020-12-04 2021-12-03 深圳荻硕贝肯精准医学有限公司 人类hla染色体区域杂合性缺失的分析方法和分析处理装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090177487A1 (en) * 2008-01-07 2009-07-09 Tera Eerkes Methods for Assessing Genetic Compatibility
CN101575643A (zh) * 2009-05-31 2009-11-11 中国人民解放军第二军医大学 一种检测异基因造血干细胞移植后供受嵌合率的方法
CN104004817A (zh) * 2013-02-22 2014-08-27 哈佛大学 利用极体或胚胎的单细胞基因组测序来选择试管婴儿的胚胎
CN103074444A (zh) * 2013-02-25 2013-05-01 苏州晶因生物科技有限公司 组织相容性抗原决定簇基因高通量测序的hla基因分型方法
CN105986011A (zh) * 2015-01-30 2016-10-05 深圳华大基因研究院 一种杂合性缺失的检测方法
CN110100014A (zh) * 2016-10-31 2019-08-06 香港科技大学 用于检测阿尔茨海默病基因变体的组合物、方法和试剂盒
CN106755535A (zh) * 2017-03-01 2017-05-31 上海荻硕贝肯医学检验所有限公司 用于检测人类cyp2c19基因多态性的引物、探针、试剂盒及方法
WO2019014667A1 (en) * 2017-07-14 2019-01-17 The Regents Of The University Of California NEW METHODS FOR PREDICTING THE RISK OF GRAFT REJECTION
CN110913896A (zh) * 2017-07-14 2020-03-24 弗朗西斯.克里克研究所 肿瘤中hla等位基因的分析及其用途
CN111091868A (zh) * 2019-12-23 2020-05-01 江苏先声医学诊断有限公司 一种染色体非整倍体的分析方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
KUANZHEN LIAO 等: "Analysis of high-resolution human leucocyte antigen allele polymorphism in 3788 Han Chinese patients with leukaemia", 《BRITISH JOURNAL OF HAEMATOLOGY》 *
LUCA VAGO 等: "Genomic Loss of Mismatched Human Leukocyte Antigen and Leukemia Immune Escape From Haploidentical Graft-Versus-Leukemia", 《SEMINARS IN ONCOLOGY》 *
SHANNON R. MCCURDY 等: "Loss of the Mismatched Human Leukocyte Antigen Haplotype in Two Acute Myelogenous Leukemia Relapses after Haploidentical Bone Marrow Transplantation with Posttransplantation Cyclophosphamide", 《LEUKEMIA》 *
王季石: "CAR_T和PD_1单克隆抗体在急性髓系白血病治疗中的进展和趋势", 《中国实验血液学杂志》 *
陈晓晴 等: "高分辨熔解曲线技术检测HLA-G14bp插入/缺失突变方法的建立及初步应用", 《中国卫生检验杂志》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022116456A1 (zh) * 2020-12-04 2022-06-09 深圳荻硕贝肯精准医学有限公司 人类hla染色体区域杂合性缺失的分析方法和分析处理装置

Also Published As

Publication number Publication date
CN112509638B (zh) 2021-12-03
WO2022116456A1 (zh) 2022-06-09

Similar Documents

Publication Publication Date Title
Langefeld et al. Transancestral mapping and genetic load in systemic lupus erythematosus
Park et al. Genome sequencing of the extinct Eurasian wild aurochs, Bos primigenius, illuminates the phylogeography and evolution of cattle
Parson et al. Evaluation of next generation mtGenome sequencing using the Ion Torrent Personal Genome Machine (PGM)
Yamamoto et al. Capturing differential allele-level expression and genotypes of all classical HLA loci and haplotypes by a new capture RNA-seq method
CN104254618A (zh) 母体血浆中胎儿dna分数的基于大小的分析
CN103221551A (zh) Hla基因型别-snp连锁数据库、其构建方法、以及hla分型方法
Riman et al. Characterization of NIST human mitochondrial DNA SRM-2392 and SRM-2392-I standard reference materials by next generation sequencing
Tigano et al. Chromosome-level assembly of the Atlantic silverside genome reveals extreme levels of sequence diversity and structural genetic variation
Karimi et al. Comparison of linkage disequilibrium levels in Iranian indigenous cattle using whole genome SNPs data
CN112088220A (zh) 替代标志物及用于肿瘤突变负荷测定的方法
CN112885406B (zh) 检测hla杂合性缺失的方法及系统
CN112509638B (zh) 人类hla染色体区域杂合性缺失的分析方法和分析处理装置
Lee et al. Genome‐defined African ancestry is associated with distinct mutations and worse survival in patients with diffuse large B‐cell lymphoma
Li et al. Comparative sequence alignment reveals River Buffalo genomic structural differences compared with cattle
Berger et al. Forensic characterization and statistical considerations of the CaDNAP 13-STR panel in 1,184 domestic dogs from Germany, Austria, and Switzerland
Martin et al. Adaptive evolution of major histocompatibility complex class I immune genes and disease associations in coastal juvenile sea turtles
KR101770962B1 (ko) 유전자 서열 기반 개인 마커에 관한 정보를 제공하는 방법 및 이를 이용한 장치
Ryu et al. Genetic association of marbling score with intragenic nucleotide variants at selection signals of the bovine genome
RU2535157C1 (ru) Способ выявления рецессивных факторов наследственной предрасположенности к раку молочной железы
Wang et al. Identification of homozygous regions with adverse effects on the five economic traits of Duroc pigs
CN106119406B (zh) 多发性肉芽肿血管炎及微小动脉炎的基因分型诊断试剂盒及使用方法
Pierini et al. Targeted analysis of polymorphic loci from low-coverage shotgun sequence data allows accurate genotyping of HLA genes in historical human populations
US20220180965A1 (en) Analysis method and analysis processing apparatus for loss of heterozygosity (loh) of human leukocyte antigen (hla)
CN105838720A (zh) Ptprq基因突变体及其应用
Parker et al. Fixation effects on variant calling in a clinical resequencing panel

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Huang Xiaojun

Inventor after: Zheng Zhongzheng

Inventor after: Liao Kuanzhen

Inventor after: Du Keming

Inventor after: Yuan Zhiyang

Inventor before: Zheng Zhongzheng

Inventor before: He Qingqing

Inventor before: Liao Kuanzhen

Inventor before: Tu Xiaonian

Inventor before: Yuan Zhiyang

GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Analysis methods and processing devices for loss of heterozygosity in human HLA chromosome regions

Effective date of registration: 20230719

Granted publication date: 20211203

Pledgee: Industrial Bank Co.,Ltd. Shanghai Nanhui Branch

Pledgor: SHANGHAI TISSUEBANK MEDICAL LABORATORY Co.,Ltd.|SHENZHEN TISSUEBANK PRECISION MEDICINE CO.,LTD.|SHANGHAI TISSUEBANK BIOTECHNOLOGY Co.,Ltd.|Shanghai dishuobeiken Gene Technology Co.,Ltd.|SHANGHAI TISSUEBANK BIOTECHNOLOGY CO.,LTD.

Registration number: Y2023310000384

PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20211203

Pledgee: Industrial Bank Co.,Ltd. Shanghai Nanhui Branch

Pledgor: SHANGHAI TISSUEBANK MEDICAL LABORATORY Co.,Ltd.|SHENZHEN TISSUEBANK PRECISION MEDICINE CO.,LTD.|SHANGHAI TISSUEBANK BIOTECHNOLOGY Co.,Ltd.|Shanghai dishuobeiken Gene Technology Co.,Ltd.|SHANGHAI TISSUEBANK BIOTECHNOLOGY CO.,LTD.

Registration number: Y2023310000384

PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Analysis methods and processing devices for loss of heterozygosity in human HLA chromosome regions

Granted publication date: 20211203

Pledgee: Industrial Bank Co.,Ltd. Shanghai Nanhui Branch

Pledgor: SHANGHAI TISSUEBANK MEDICAL LABORATORY Co.,Ltd.|SHENZHEN TISSUEBANK PRECISION MEDICINE CO.,LTD.|SHANGHAI TISSUEBANK BIOTECHNOLOGY Co.,Ltd.|Shanghai dishuobeiken Gene Technology Co.,Ltd.|SHANGHAI TISSUEBANK BIOTECHNOLOGY CO.,LTD.

Registration number: Y2024310000533