CN113035276A - 人类hla染色体区域杂合性缺失的分析方法和系统 - Google Patents

人类hla染色体区域杂合性缺失的分析方法和系统 Download PDF

Info

Publication number
CN113035276A
CN113035276A CN202110267249.9A CN202110267249A CN113035276A CN 113035276 A CN113035276 A CN 113035276A CN 202110267249 A CN202110267249 A CN 202110267249A CN 113035276 A CN113035276 A CN 113035276A
Authority
CN
China
Prior art keywords
hla
sequencing
type
sample
reads
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110267249.9A
Other languages
English (en)
Other versions
CN113035276B (zh
Inventor
郑仲征
廖宽镇
杜可明
袁志阳
李岱阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dishuobeiken Gene Technology Co ltd
Shanghai Tissuebank Biotechnology Co ltd
Shanghai Tissuebank Medical Inspection Co ltd
Shenzhen Tissuebank Precision Medicine Co ltd
Original Assignee
Shanghai Dishuobeiken Gene Technology Co ltd
Shanghai Tissuebank Biotechnology Co ltd
Shanghai Tissuebank Medical Inspection Co ltd
Shenzhen Tissuebank Precision Medicine Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dishuobeiken Gene Technology Co ltd, Shanghai Tissuebank Biotechnology Co ltd, Shanghai Tissuebank Medical Inspection Co ltd, Shenzhen Tissuebank Precision Medicine Co ltd filed Critical Shanghai Dishuobeiken Gene Technology Co ltd
Priority to CN202110267249.9A priority Critical patent/CN113035276B/zh
Publication of CN113035276A publication Critical patent/CN113035276A/zh
Application granted granted Critical
Publication of CN113035276B publication Critical patent/CN113035276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis

Abstract

本发明属于生物信息分析领域,公开了一种人类HLA染色体区域杂合性缺失的分析方法和系统。本发明针对分析HLA Loss的需求,提供了一种能够方便进行流程化和批量化操作、无需人工干预、准确性高的HLA Loss分析方法和系统。

Description

人类HLA染色体区域杂合性缺失的分析方法和系统
技术领域
本发明涉及生物信息分析领域,具体涉及一种人类HLA染色体区域杂合性缺失的分析方法和系统。
背景技术
目前我国的白血病患者有400万左右,发病率为3/10万,且有逐年增长的趋势。白血病缓解后的治疗通常采用放化疗或造血干细胞移植等方法,但常规放化疗等治疗手段的3年生存率仅为40-60%,且难以完全治愈。移植的治愈率虽可达80%左右,但移植后引起的感染和相关并发症很高。异基因造血干细胞移植(allo-HSCT)仍然是长期控制和治疗白血病的有效手段之一,这主要归功于移植免疫系统的抗肿瘤作用,即供者的淋巴细胞识别受者人类白细胞抗原(HLA)错配的白血病细胞,从而达到移植物抗白血病(Gvl)效应。移植后复发是allo-HSCT失败的主要原因之一,根据HLA是否发生丢失,将复发分为“经典”复发和HLALOSS复发。其中,染色体杂合性缺失(Loss Of Heterozygosity,LOH)在恶性肿瘤中是一种常见的染色体畸变。发生于HLA(人类白细胞抗原)染色体区域的LOH称为HLA Loss,发生HLALoss后会影响HLA的正常表达,使肿瘤细胞逃避机体免疫细胞的杀伤,导致肿瘤细胞的免疫逃逸。HLA Loss在实体瘤如非小细胞肺癌中常见,也可发生在血液肿瘤中,在造血干细胞移植手术后若肿瘤细胞发生HLA Loss则会导致该肿瘤细胞不被免疫细胞杀伤,导致该种血液病复发。据文献报道,至2017年为止,在半相合造血干细胞移植案例中,由于HLA Loss导致的移植后复发占所有复发病例的33%。2018年发表在《Blood》杂志上的关于HLA Loss国际多中心协作组结果显示,在396例有效入组病例中,HLA Loss导致的复发共51例,其中35例来自半相合移植,12例来自HLA错配的无关供者移植,4例来自全相合无关供者移植,脐血移植HLA Loss为0。多中心研究的结果显示,HLA Loss是造血干细胞移植后免疫逃逸和复发的主要机制之一,且HLA Loss的比例与供患之间HLA的错配位点数量有关。
HLA-LOSS的临床意义非常重要,但目前临床中对其检测和分析非常困难。一方面,现有HLA分型方法的金标准——Sanger测序无法发现比例很低的型别;另一方面,由于几个重要的HLA基因的多样性极高,采取qPCR方式需要预先设计非常多的引物或探针,在临床中应用成本很高,无法推广。
采用新一代高通量测序方法,基于其在各个区域上都有很高的测序深度,可以发现比例很低的HLA基因来源的读段(read),从而为分析HLA-LOSS提供了可能性。但同样由于HLA各基因极高的多样性,对高通量测序数据中的HLA各基因进行高分辨率分型依然是非常复杂的过程,正确确定测序读段的HLA基因来源尚无权威简便的方法。
发明内容
本发明针对分析HLA Loss的需求,提供了一种能够方便进行流程化和批量化操作、无需人工干预、准确性高的HLA Loss分析方法和系统。
为此,本发明一方面提供了一种HLA染色体区域的杂合性缺失(HLA-LOSS)的分析方法,包括以下步骤:
1、对样本数据进行质控和过滤,得到高质量的测序数据;
2、用高质量测序数据对HLA所有可能型别进行完全匹配比对;
3、按测序范围和外显子范围中的覆盖度和深度差异,得到各基因的具体型别;
4、针对各8位型别对应的具体读段,统计得到样本来源的HLA读段比例,从而分析得到HLA-LOSS发生与否以及阴性的比例。
在本发明优选的实施方案中,各步骤具体为:
1、对测序完成后的样本下机数据进行质控和过滤,得到高质量的测序数据;
2、根据样本的4位HLA基因型别,将过滤后的测序读段比对到所有可能的8位HLA基因型别序列上,对每一个型别,均过滤掉双端序列不能完全和模板序列对比上的读段,从而得到和每一个可能型别完全匹配的测序读段;
3、检查每个可能的8位型别测序范围内的测序深度,若某个型别存在低于默认深度的阈值的情况,将此型别排除,对于剩余所有可能的8位型别,比较不同型别之间的差异位点和差异位点上的测序深度差别,再综合比较外显子区域覆盖度、外显子区域深度、测序范围全长覆盖度和测序范围全长深度,分析得到测序样本中各HLA基因的各8位HLA基因的具体型别;
4、在得到各HLA具体型别后,分别统计比对到每个型别的读段数量,以便计算样本来源的HLA读段比例,对不同型别的读段进行取交集或取并集的操作,并根据样本基因型别的具体情况,计算样本来源的HLA型别。
可以采用表1所示的方法计算样本来源的HLA型别。
表1 不同供患HLA型别组合中患者HLA型别计算方法
Figure BDA0002972616530000031
*字母代表该型别所比对上的读段数
在本发明进一步优选的实施方案中,在进行步骤1之前,还包括对样本数据进行拆分和格式转换,转换为标准格式的步骤。
在实际检测过程中,由于扩增偏好性、实际测序质量等原因,在得到阳性结果后,需要对假阳性的可能性进行评估。假阳性的主要原因是,不同HLA型别的扩增偏好性存在差异,对于比例很低的HLA型别可能存在测序范围内的某些区域测序深度很低甚至无法测到,在数据分析时则会被认为是HLA-LOSS阳性。这种假阳性的主要特征是,虽然存在深度很低的区域,但此型别也有一部分测序区域存在超过阈值的深度,且这些区域覆盖了这个型别区别其他型别的特有位点。当评估出现假阳性时,需要将样本该型别的各区域具体深度交由有HLA测序和分析经验的研发人员具体评估,以确定阳性的真假或者是否需要加做实验。
因此,在本发明进一步优选的实施方案中,在进行步骤4之后,还包括对HLA-LOSS阳性结果进行假阳性分析,并给出信息以判断下一步操作的步骤。
在本发明进一步优选的实施方案中,在进行步骤1之后,在进行步骤2之前,还包括进行任务分配的步骤;在进行步骤2之前,还包括对HLA基因数据库进行更新,与国际免疫多态性数据库保持一致的步骤;在全部分析过程中,还包括实时进行可视化展示、提示和分析的步骤。
在本发明优选的实施方案中,各HLA基因分别为HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1和HLA-DPB1基因。
本发明另一方面提供了一种HLA染色体区域的杂合性缺失(HLA-LOSS)的分析系统,其包括以下模块:
1、测序数据预处理模块,用于对样本数据进行质控和过滤,得到高质量的测序数据;
2、比对模块,用于将高质量测序数据完全匹配到HLA所有可能的型别上,并记录比对文件;
3、分型模块,用于分析所有完全匹配的读段在各型别测序范围和外显子区域的覆盖度和深度差异,并得到各HLA基因最有可能的具体型别;
4、比例计算模块,用于通过各8位HLA型别对应的具体读段,统计得到样本来源的HLA读段比例,从而分析得到HLA-LOSS发生与否以及阴性的比例。
在本发明优选的实施方案中,各模块具体为:
1、测序数据预处理模块,用于对样本数据进行质控和过滤,得到高质量的测序数据;
2、比对模块,用于根据样本的4位HLA基因型别,将过滤后的测序读段比对到所有可能的8位HLA基因型别序列上,对每一个型别,均过滤掉双端序列不能完全和模板序列对比上的读段,从而得到和每一个可能型别完全匹配的测序读段;
3、分型模块,用于检查每个可能的8位型别测序范围内的测序深度,若某个型别存在低于默认深度的阈值的情况,将此型别排除,对于剩余所有可能的8位型别,比较不同型别之间的差异位点和差异位点上的测序深度差别,再综合比较外显子区域覆盖度、外显子区域深度、测序范围全长覆盖度和测序范围全长深度,分析得到测序样本中各HLA基因的各8位HLA基因的具体型别;
4、比例计算模块,用于在得到各HLA具体型别后,分别统计比对到每个型别的读段数量,以便计算样本来源的HLA读段比例,对不同型别的读段进行取交集或取并集的操作,并根据样本基因型别的具体情况,计算样本来源的HLA型别。
在本发明进一步优选的实施方案中,还包括以下模块:
拆分和格式转换模块,用于在对样本数据进行质控和过滤之前,对样本数据进行拆分和格式转换,转换为标准格式;
假阳性分析模块,用于在得到HLA-LOSS阳性结果之后,对HLA-LOSS阳性结果进行假阳性分析,并给出信息以判断下一步操作。
在本发明进一步优选的实施方案中,还包括以下模块:
任务分配模块,用于在对样本数据进行质控和过滤之后,在进行测序数据与HLA所有可能型别进行完全匹配比对之前,将所有比对和分型任务分配到不同计算节点,通过高并发缩短计算时间,同时也支持常规工作站或PC直接串行计算模式;
数据库更新模块,用于使所采用的HLA基因参考序列与国际免疫多态性数据库(IPD)保持一致;
可视化模块,用于实时展示各样本任务进展,并可视化地展示数据质量、比对质量、分型中间过程和深度等统计,并对分析过程中的各类异常进行提示,自动分析样本继续往下进行计算的可行性与合理性。
在本发明优选的实施方案中,各HLA基因分别为HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1和HLA-DPB1基因。
由上述描述可知,本发明的分析方法首次直接分析出异基因造血干细胞移植术后样本体内是否存在HLA-LOSS,并首次将术后样本(嵌合体)的HLA分型至最高精度,特别是在某些HLA型别的比例非常低的情况下。
此外,本发明的分析系统包括对数据进行质控和过滤的模块、比对模块、分型模块、比例计算模块,并用任务分配模块将各模块整合在一起,让使用者可以一键完成分析,节省了很多中间手动操作。同时,可视化模块自动生成结果和重要中间信息的可视化展示,可以自动检测到运行中异常,并可以对这些异常(主要是假阳性)进行自动分析,减少人工干预和生物信息专业人员查找问题的工作量。并且,本发明还开发了数据库更新模块,专门用于与国际免疫多态性数据库(IPD)保持一致。
附图说明
图1:本发明分析方法的整体流程图。
图2:本发明分析系统的整体结构图。
图3:实施例1中样本体内HLA-LOSS分析的具体流程图。
图4:实施例1中HLA具体型别的读段完全匹配信息示例图。
图5:实施例1中各基因HLA-LOSS情况的具体计算过程图。
具体实施方式
下面通过实施例对本发明作进一步的详细说明,旨在用于说明本发明而非限定本发明。应当指出,对于本领域技术人员而言,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也同样落入本发明的保护范围之内。
实施例1:一种异基因造血干细胞移植术后样本体内HLA-LOSS的具体分析方法示例
本示例中供患双方的HLA分型如下:
Figure BDA0002972616530000061
5个基因的供患型别组合均为A/B和A/C型,因此适用表1中的类型编号6。
使用的具体方法和步骤如下:
1、使用bcl2fastq软件(https://support.illumina.com/sequencing/sequencing_software/bcl2fastq-conversion-software.html)对二代测序下机数据进行拆分和格式转换,由原始测序格式(*.bcl)转换为二代测序数据格式(*.fastq)。
2、使用Trimmomatic软件(http://www.usadellab.org/cms/?page=trimmomatic)对原始二代测序数据进行质控和过滤,得到高质量测序数据,文件格式为双端*.fastq或其gzip压缩格式(*.fastq.gz)。
若总体测序数据量过少或测序质量过低,则直接通过可视化模块报告异常,分析流程虽继续进行,但会提示结果可能不准确。
3、从IMGT-HLA公共数据库(https://www.ebi.ac.uk/ipd/imgt/hla/)获取和更新各HLA基因8位型别的参考序列,文件格式为*.fasta或*.fa。本方法目前使用版本号为2020-01-20更新的IPD-IMGT/HLA3.39.0。
在此基础上,以4位型别为A*24:02的基因型为例,其下共有包括A*24:02:01:01、A*24:02:40:01等8位型别在内的共计204个高分辨率型别。
4、将质控后的测序读段比对到每一个可能型别上,使用bwa软件(http://bio-bwa.sourceforge.net/)的mem模式进行比对,标准输出使用samtools view模块去除没有比对上的读段(-F 4);标准输出中模板恢复碱基数为0(即附加信息中出现NM:i:0)的读段即为完全比对的读段。挑出所有双端读段均完全比对的读段并保存为格式*.seqmatch,每一行为一对读段,第一列为读段标识,其后每一列为这对读段在参考序列上匹配的第一个位置和最后一个位置。文件示例如附图4所示。
5、针对每个HLA基因的每个可能型别,计算所有完全匹配的读段在其测序范围全长和外显子的覆盖度和深度。对于每个位置,低于深度阈值5则认为没有覆盖。对于测序范围内的首个外显子的5’端和最后一个外显子的3’端,需要给予20nt的宽容。首先排除无法完整覆盖外显子区域的型别。
6、一些型别仅有外显子序列而未有全长序列,其内含子部分序列由与其相近的型别的内含子区域代替。因此,在实际分型过程中,可能存在外显子范围有匹配型别而全长范围内无法找到匹配型别的情况。在这种情况下,只通过外显子区域情况确定型别。
7、对于同一个4位型别,若有多个8位型别均有全覆盖,则通过clustalo软件(http://www.clustal.org/omega/)进行序列比对,得到不同型别之间的差异位点。再分别比较这些位置的覆盖深度,从而排除不可能的型别。
8、在上述分型过程中,若存在无法区分的型别(即测序范围内无差异位点或虽有差异位点,但不同型别均被完整匹配且深度差异不大),则通过如下原则依次比较并确定最终型别:(1)外显子区域覆盖比例高;(2)外显子区域深度高;(3)测序范围全长读段数量多。
9、通过5至8四个步骤,将得到各基因每一个4位型别的精确8位型别,或得知某个4位型别下没有任何8位型别被全覆盖。
10、确定型别后,分别统计各型别包含的读段,并按照表1计算得到患者来源HLA比例和HLA-LOSS发生与否的结论。
计算过程中,以下两点是本发明特别考虑的:
(1)同一个基因(具体指A/B/C/DRB1/DQB1/DPB1六个基因中的某一个),因不同型别的外显子个数和长短不一,应对该基因分型得到的型别之间做多序列比对,确定共有区域,计算比例时,仅统计共有区域内的读段。这样可以避免因某些型别偏长或偏短而导致的结果偏差。
(2)对于表1中类型编号6(A/B和A/C型),这种供患类型组合是半相合移植中的典型组合,在本发明的应用场景中非常普遍。若供患双方均有的A型别和B型别或C型别非常相似(CDS区域差异位点少于3个),在B型别或C型别中减去和A型别的交集会造成剩余读段数量过少,造成很大的误差(但不影响阴阳性)。因此,在这种情况下,本发明将采用同时两次计算的平均值作为HLA-LOSS阴性的患者比例。
在本例中,五个基因的具体分型和各型别的交集数量如附图5所示。其中,A、C和DQB1基因得到HLA-LOSS阳性。B和DRB1基因的分型中没有出现非常相似的型别,直接使用各型别独立匹配的读段数量进行计算。具体情况为:
表2 B基因和DRB1基因的分型计算表
Figure BDA0002972616530000081
Figure BDA0002972616530000091
11、上述分型过程中,将记录的每个HLA基因的每个型别的每个外显子的深度进行统计,并对假阳性可能性进行评估,有假阳性可能的基因和样本将会提示给使用者。本发明会自动对深度统计结果调用R进行绘图,方便用户查看比较。
12、若某基因来源于供患的所有HLA型别均无法得到,则报“测序失败”错误,提示用户该基因测序前建库可能存在问题,需要排查。

Claims (10)

1.一种HLA染色体区域的杂合性缺失(HLA-LOSS)的分析方法,包括以下步骤:
(1)对样本数据进行质控和过滤,得到高质量的测序数据;
(2)用高质量测序数据对HLA所有可能型别进行完全匹配比对;
(3)按测序范围和外显子范围中的覆盖度和深度差异,得到各基因的具体型别;
(4)针对各8位型别对应的具体读段,统计得到样本来源的HLA读段比例,从而分析得到HLA-LOSS发生与否以及阴性的比例。
2.根据权利要求1所述的分析方法,各步骤具体为:
(1)对测序完成后的样本下机数据进行质控和过滤,得到高质量的测序数据;
(2)根据样本的4位HLA基因型别,将过滤后的测序读段比对到所有可能的8位HLA基因型别序列上,对每一个型别,均过滤掉双端序列不能完全和模板序列对比上的读段,从而得到和每一个可能型别完全匹配的测序读段;
(3)检查每个可能的8位型别测序范围内的测序深度,若某个型别存在低于默认深度的阈值的情况,将此型别排除,对于剩余所有可能的8位型别,比较不同型别之间的差异位点和差异位点上的测序深度差别,再综合比较外显子区域覆盖度、外显子区域深度、测序范围全长覆盖度和测序范围全长深度,分析得到测序样本中各HLA基因的各8位HLA基因的具体型别;
(4)在得到各HLA具体型别后,分别统计比对到每个型别的读段数量,以便计算样本来源的HLA读段比例,对不同型别的读段进行取交集或取并集的操作,并根据样本基因型别的具体情况,计算样本来源的HLA型别。
3.根据权利要求1或2所述的分析方法,在进行步骤(1)之前,还包括对样本数据进行拆分和格式转换,转换为标准格式的步骤;在进行步骤(4)之后,还包括对HLA-LOSS阳性结果进行假阳性分析,并给出信息以判断下一步操作的步骤。
4.根据权利要求1至3中任一项所述的分析方法,在进行步骤(1)之后,在进行步骤(2)之前,还包括进行任务分配的步骤;在进行步骤(2)之前,还包括对HLA基因数据库进行更新,与国际免疫多态性数据库保持一致的步骤;在全部分析过程中,还包括实时进行可视化展示、提示和分析的步骤。
5.根据权利要求1至6中任一项所述的分析方法,其中各HLA基因分别为HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1和HLA-DPB1基因。
6.一种HLA染色体区域的杂合性缺失(HLA-LOSS)的分析系统,其包括以下模块:
(1)测序数据预处理模块,用于对样本数据进行质控和过滤,得到高质量的测序数据;
(2)比对模块,用于将高质量测序数据完全匹配到HLA所有可能的型别上,并记录比对文件;
(3)分型模块,用于分析所有完全匹配的读段在各型别测序范围和外显子区域的覆盖度和深度差异,并得到各HLA基因最有可能的具体型别;
(4)比例计算模块,用于通过各8位HLA型别对应的具体读段,统计得到样本来源的HLA读段比例,从而分析得到HLA-LOSS发生与否以及阴性的比例。
7.根据权利要求6中所述的分析系统,各模块具体为:
(1)测序数据预处理模块,用于对样本数据进行质控和过滤,得到高质量的测序数据;
(2)比对模块,用于根据样本的4位HLA基因型别,将过滤后的测序读段比对到所有可能的8位HLA基因型别序列上,对每一个型别,均过滤掉双端序列不能完全和模板序列对比上的读段,从而得到和每一个可能型别完全匹配的测序读段;
(3)分型模块,用于检查每个可能的8位型别测序范围内的测序深度,若某个型别存在低于默认深度的阈值的情况,将此型别排除,对于剩余所有可能的8位型别,比较不同型别之间的差异位点和差异位点上的测序深度差别,再综合比较外显子区域覆盖度、外显子区域深度、测序范围全长覆盖度和测序范围全长深度,分析得到测序样本中各HLA基因的各8位HLA基因的具体型别;
(4)比例计算模块,用于在得到各HLA具体型别后,分别统计比对到每个型别的读段数量,以便计算样本来源的HLA读段比例,对不同型别的读段进行取交集或取并集的操作,并根据样本基因型别的具体情况,计算样本来源的HLA型别。
8.根据权利要求6或7所述的分析系统,还包括以下模块:
拆分和格式转换模块,用于在对样本数据进行质控和过滤之前,对样本数据进行拆分和格式转换,转换为标准格式;
假阳性分析模块,用于在得到HLA-LOSS阳性结果之后,对HLA-LOSS阳性结果进行假阳性分析,并给出信息以判断下一步操作。
9.根据权利要求6至8中任一项所述的分析系统,还包括以下模块:
任务分配模块,用于在对样本数据进行质控和过滤之后,在进行测序数据与HLA所有可能型别进行完全匹配比对之前,将所有比对和分型任务分配到不同计算节点,通过高并发缩短计算时间,同时也支持常规工作站或PC直接串行计算模式;
数据库更新模块,用于使所采用的HLA基因参考序列与国际免疫多态性数据库(IPD)保持一致;
可视化模块,用于实时展示各样本任务进展,并可视化地展示数据质量、比对质量、分型中间过程和深度等统计,并对分析过程中的各类异常进行提示,自动分析样本继续往下进行计算的可行性与合理性。
10.根据权利要求6至9中任一项所述的分析系统,其中各HLA基因分别为HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1和HLA-DPB1基因。
CN202110267249.9A 2021-03-11 2021-03-11 人类hla染色体区域杂合性缺失的分析方法和系统 Active CN113035276B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110267249.9A CN113035276B (zh) 2021-03-11 2021-03-11 人类hla染色体区域杂合性缺失的分析方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110267249.9A CN113035276B (zh) 2021-03-11 2021-03-11 人类hla染色体区域杂合性缺失的分析方法和系统

Publications (2)

Publication Number Publication Date
CN113035276A true CN113035276A (zh) 2021-06-25
CN113035276B CN113035276B (zh) 2021-12-03

Family

ID=76469748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110267249.9A Active CN113035276B (zh) 2021-03-11 2021-03-11 人类hla染色体区域杂合性缺失的分析方法和系统

Country Status (1)

Country Link
CN (1) CN113035276B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101914628A (zh) * 2010-09-02 2010-12-15 深圳华大基因科技有限公司 检测基因组目标区域多态性位点的方法及 系统
CN108388773A (zh) * 2018-02-01 2018-08-10 杭州纽安津生物科技有限公司 一种肿瘤新生抗原的鉴定方法
CN108460246A (zh) * 2018-03-08 2018-08-28 北京希望组生物科技有限公司 一种基于三代测序平台的hla基因分型方法
CN108920899A (zh) * 2018-06-10 2018-11-30 杭州迈迪科生物科技有限公司 一种基于目标区域测序的单个外显子拷贝数变异预测方法
CN109637581A (zh) * 2018-12-10 2019-04-16 江苏医联生物科技有限公司 一种dna二代测序全流程质量分析方法
CN110033827A (zh) * 2019-01-18 2019-07-19 臻悦生物科技江苏有限公司 Hla基因分型的方法、装置、存储介质及处理器
CN110400602A (zh) * 2018-04-23 2019-11-01 深圳华大生命科学研究院 一种基于测序数据的abo血型系统分型方法及其应用
CN110853708A (zh) * 2019-11-13 2020-02-28 上海仁东医学检验所有限公司 用于hla分型的核酸捕获探针的设计方法
CN111091868A (zh) * 2019-12-23 2020-05-01 江苏先声医学诊断有限公司 一种染色体非整倍体的分析方法及系统
CN111370057A (zh) * 2019-07-31 2020-07-03 深圳思勤医疗科技有限公司 确定样本染色体结构变异信号强度以及插入片段长度分布特征的方法及应用
CN111798924A (zh) * 2020-07-07 2020-10-20 博奥生物集团有限公司 一种人类白细胞抗原分型方法及装置
CN112102944A (zh) * 2020-10-09 2020-12-18 阔然生物医药科技(上海)有限公司 一种基于ngs的脑肿瘤分子诊断的分析方法
CN112126687A (zh) * 2020-11-06 2020-12-25 深圳荻硕贝肯精准医学有限公司 用于检测患者hla缺失型复发的引物、探针、试剂盒及方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101914628B (zh) * 2010-09-02 2013-01-09 深圳华大基因科技有限公司 检测基因组目标区域多态性位点的方法
CN101914628A (zh) * 2010-09-02 2010-12-15 深圳华大基因科技有限公司 检测基因组目标区域多态性位点的方法及 系统
CN108388773A (zh) * 2018-02-01 2018-08-10 杭州纽安津生物科技有限公司 一种肿瘤新生抗原的鉴定方法
CN108460246A (zh) * 2018-03-08 2018-08-28 北京希望组生物科技有限公司 一种基于三代测序平台的hla基因分型方法
CN110400602A (zh) * 2018-04-23 2019-11-01 深圳华大生命科学研究院 一种基于测序数据的abo血型系统分型方法及其应用
CN108920899A (zh) * 2018-06-10 2018-11-30 杭州迈迪科生物科技有限公司 一种基于目标区域测序的单个外显子拷贝数变异预测方法
CN109637581A (zh) * 2018-12-10 2019-04-16 江苏医联生物科技有限公司 一种dna二代测序全流程质量分析方法
CN110033827A (zh) * 2019-01-18 2019-07-19 臻悦生物科技江苏有限公司 Hla基因分型的方法、装置、存储介质及处理器
CN111370057A (zh) * 2019-07-31 2020-07-03 深圳思勤医疗科技有限公司 确定样本染色体结构变异信号强度以及插入片段长度分布特征的方法及应用
CN110853708A (zh) * 2019-11-13 2020-02-28 上海仁东医学检验所有限公司 用于hla分型的核酸捕获探针的设计方法
CN111091868A (zh) * 2019-12-23 2020-05-01 江苏先声医学诊断有限公司 一种染色体非整倍体的分析方法及系统
CN111798924A (zh) * 2020-07-07 2020-10-20 博奥生物集团有限公司 一种人类白细胞抗原分型方法及装置
CN112102944A (zh) * 2020-10-09 2020-12-18 阔然生物医药科技(上海)有限公司 一种基于ngs的脑肿瘤分子诊断的分析方法
CN112126687A (zh) * 2020-11-06 2020-12-25 深圳荻硕贝肯精准医学有限公司 用于检测患者hla缺失型复发的引物、探针、试剂盒及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NICHOLAS MCGRANAHAN 等: "Allele-Specific HLA Loss and Immune Escape in Lung Cancer Evolution", 《CELL》 *
王晓静: "移植前白血病患者HLA区域杂合性缺失对HLA分型的影响", 《中国綸血杂志》 *

Also Published As

Publication number Publication date
CN113035276B (zh) 2021-12-03

Similar Documents

Publication Publication Date Title
CN107423578B (zh) 检测体细胞突变的装置
US20220130488A1 (en) Methods for detecting copy-number variations in next-generation sequencing
KR101542529B1 (ko) 대립유전자의 바이오마커 발굴방법
CN103221551B (zh) Hla基因型别-snp连锁数据库、其构建方法、以及hla分型方法
Halman et al. Accuracy of short tandem repeats genotyping tools in whole exome sequencing data
KR20140061223A (ko) 차세대 시퀀싱 데이터의 질병변이마커 검출 방법
CN109584957B (zh) 用于捕获α地中海贫血相关基因拷贝数检测试剂盒
CN110400602A (zh) 一种基于测序数据的abo血型系统分型方法及其应用
CN112735599A (zh) 一种判断罕见遗传性疾病的评估方法
JP2015089364A (ja) 体細胞多重変異によるがん診断方法、がん医薬開発方法及びがん診断装置
KR20150024232A (ko) 질병에 대한 약물 내성 유전체로부터 내성 원인 마커의 발굴 방법
CN112885406A (zh) 检测hla杂合性缺失的方法及系统
CN106906220A (zh) 一种突变的col4a5基因及其应用
KR20180069651A (ko) 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
CN113035276B (zh) 人类hla染色体区域杂合性缺失的分析方法和系统
Narasimhan et al. A direct multi-generational estimate of the human mutation rate from autozygous segments seen in thousands of parentally related individuals
CN105838720A (zh) Ptprq基因突变体及其应用
KR20190000341A (ko) 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
US10540324B2 (en) Human haplotyping system and method
CN114373548A (zh) 一种基于代谢基因建立的胰腺癌预后风险预测方法和装置
CN114678071A (zh) 一种基于高通量测序数据的hla基因综合分析方法
CN109979534B (zh) 一种c位点提取方法及装置
KR20210120782A (ko) 피검 대상 맞춤형 변이체 기반 레퍼런스 데이터 세트의 구축 방법
CN113195741A (zh) 从循环核酸中鉴定全基因组序列数据中的全局序列特征
US20170226588A1 (en) Systems and methods for dna amplification with post-sequencing data filtering and cell isolation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Huang Xiaojun

Inventor after: Zheng Zhongzheng

Inventor after: Liao Kuanzhen

Inventor after: Tu Xiaonian

Inventor after: Yuan Zhiyang

Inventor before: Zheng Zhongzheng

Inventor before: Liao Kuanzhen

Inventor before: Du Keming

Inventor before: Yuan Zhiyang

Inventor before: Li Daiyang

GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Analysis methods and systems for loss of heterozygosity in human HLA chromosome regions

Effective date of registration: 20230719

Granted publication date: 20211203

Pledgee: Industrial Bank Co.,Ltd. Shanghai Nanhui Branch

Pledgor: SHANGHAI TISSUEBANK MEDICAL LABORATORY Co.,Ltd.|SHENZHEN TISSUEBANK PRECISION MEDICINE CO.,LTD.|SHANGHAI TISSUEBANK BIOTECHNOLOGY Co.,Ltd.|Shanghai dishuobeiken Gene Technology Co.,Ltd.|SHANGHAI TISSUEBANK BIOTECHNOLOGY CO.,LTD.

Registration number: Y2023310000384