CN112908413A

CN112908413A - 一种基于abo基因的血型分型方法

Info

Publication number: CN112908413A
Application number: CN202110303928.7A
Authority: CN
Inventors: 梁爽; 徐筠娉; 洪文旭; 苏宇清; 梁延连; 吴凡; 彭龙
Original assignee: Shenzhen Blood Center Shenzhen Institute Of Transfusion Medicine
Current assignee: Shenzhen Blood Center Shenzhen Institute Of Transfusion Medicine
Priority date: 2021-03-22
Filing date: 2021-03-22
Publication date: 2021-06-04
Also published as: NL2030603A; NL2030603B1

Abstract

本发明公开了一种基于ABO基因的血型分型方法，属于血液分型领域。所述方法包括构建ABO分型数据库、高通量测序、比对、变异分析注释以及分析注释信息和比对结果，得出样本的变异位点的候选单倍型分型结果的步骤。本发明的方法操作过程简单，即时分析，无需海量搜寻ABO血型分型数据库，无需单一维度逐层单层逐步单步操作分析，即可即时分析高通量测序的原始数据，提升效率。

Description

一种基于ABO基因的血型分型方法

技术领域

本发明属于血液分型领域，具体地，涉及一种基于ABO基因的血型分型方法。

背景技术

随着二代测序技术的高速发展，与费时费力的传统ABO血型检测及分析方法相比，现有高通量二代测序技术进行多基因多位点的数据库比对，快速分析ABO血型分型，实现传统分析数据检索操作复杂，速度慢，效率低，实现多方面展现基因位点展示。从数据过滤、比对、捕获分析、变异分析以及变异结果注释的全流程功能，对基因分型的测序数据进行质检和变异分析。

然而，目前进行ABO血型分析时，缺少可用于即时分析的ABO血型数据库。每一例样本在ABO血型分析、选型时检索操作复杂，速度慢，效率低。此外，分型人员无法同步可视化染色体与样本编号、位点坐标、测序深度、参考基因序列；缺少关于ABO血型分析的捕获、变异、变异结果注释分析的流程，无法实现数据结果的备份和恢复，容易造成数据的丢失。

发明内容

为了解决上述技术问题，本发明旨在提供基于高通量二代测序数据的基因位点的ABO血型的快速分型方法，可以提高分型速度和效率。本发明采用的技术方案如下：

一种基于ABO基因的血型分型方法，其特征在于，包括以下步骤：

构建ABO分型数据库：获得ABO基因各个分型的分型位点，获得所述分型位点在基因组上的坐标，并建立数据库；

测序：对样本的核酸样本进行高通量测序，获得测序数据；

比对：将测序数据与人类参考基因组进行比对，获得ABO基因上的突变位点；

变异分析注释：利用变异分析软件，分析样本中存在的变异类型，并为变异位点增加注释信息；

分型：分析注释信息和比对结果，得出样本的变异位点的候选单倍型分型结果，在该步骤中，部分位点由于扩增子间在基因组上位置差距太远，不能得出明确的单倍型分型结果，该方法会输出候选的所有可能单倍型结果。通过与ABO分型数据库进行对比，得到最终的单倍型分型结果。

进一步地，在所述构建ABO分型数据库的步骤中，通过收集包括但不限于dbRBC和ISBT的数据库以及文献报告获得ABO基因各个分型的分型位点。

在本发明的一些实施方案中，在获得测序数据后，进一步包括对测序数据进行质检的步骤：

原始数据质检：检测原始测序数据质量；

数据过滤：过滤低质量测序数据，处理接头序列数据

进一步地，在本发明中，所述人类参考基因组是指hg19参考基因组。

进一步地，利用BWA软件进行比对。

进一步地，利用SnpEff v4.2软件进行变异分析。更进一步地，所述变异类型包括但不限于indel、snv。

进一步地，利用Annovar软件进行注释。

在本发明中，因二代测序读长短，上述步骤直接准确的得出唯一的单倍型分型结果，因此进一步可包括分析获得的单倍型分型结果的人群频率，得到可能性最高的分型结果的步骤。

本发明的有益效果

实现多方面展现基因位点展示。从数据过滤、比对、捕获分析、变异分析以及变异结果注释的全流程功能，对基因分型的测序数据进行质检和变异分析。该样本的分型结果，会同步可视化染色体与样本编号、位点坐标、测序深度、参考基因序列，展现出现该分型在数据库中的突变位点以及其他位点，分析过程集合，集成多层分析与结果展现。所有操作过程简单，即时分析，无需海量搜寻ABO血型分型数据库，无需单一维度逐层单层逐步单步操作分析，即可即时分析高通量测序的原始数据，提升效率。

附图说明

图1示出了二代测序数据分析流程图。

图2示出了ABO血型分型流程图。

图3示出了一个样本的ABO血型分析结果。

图4示出了一个样本的ABO血型分析结果。

图5示出了一个样本的ABO血型分析结果。

具体实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。

以下例子在此用于示范本发明的优选实施方案。本领域内的技术人员会明白，下述例子中披露的技术代表发明人发现的可以用于实施本发明的技术，因此可以视为实施本发明的优选方案。但是本领域内的技术人员根据本说明书应该明白，这里所公开的特定实施例可以做很多修改，仍然能得到相同的或者类似的结果，而非背离本发明的精神或范围。

除非另有定义，所有在此使用的技术和科学的术语，和本发明所属领域内的技术人员所通常理解的意思相同，在此公开引用及他们引用的材料都将以引用的方式被并入。

那些本领域内的技术人员将意识到或者通过常规试验就能了解许多这里所描述的发明的特定实施方案的许多等同技术。这些等同将被包含在权利要求书中。

下述实施例中的实验方法，如无特殊说明，均为常规方法。下述实施例中所用的仪器设备，如无特殊说明，均为实验室常规仪器设备；下述实施例中所用的试验材料，如无特殊说明，均为自常规生化试剂商店购买得到的。

实施例

本实施例提供一种基于高通量二代测序的ABO血型的快速分型方法，可以提高分型速度和效率。具体步骤如下：

建立数据库：收集ABO基因各个分型的分型位点，整理成分型数据库，获得这些位点在基因组上的坐标。在该步骤中，数据库的数据来自dbRBC和ISBT数据库，进一步还包括文献公开的数据；

测序：使用奇辉生物的试剂盒进行建库测序并获得测序数据；

对比：利用BWA软件将数据和hg19参考基因组进行比对，获得ABO基因上的突变位点；

分型：和分型数据库进行比较，获得分型。

其中，在测序步骤中，进一步包括对测序数据进行质检和变异分析的步骤，如图1所示，具体如下：

•原始数据质检：检测原始测序数据质量；

•数据过滤：过滤低质量测序数据，处理接头序列数据；

•比对：将测序序列比对到人类参考基因组上；

•捕获分析：分析数据的均一性、特异性、覆盖度、测序深度等。

•变异分析：利用变异分析软件SnpEff v4.2，分析样本中存在的indel，snv等变异类型；

•变异结果注释：通过注释软件Annovar，为变异位点增加注释信息。

进一步，ABO基因分型分析流程如下（图2）：

将Annovar软件注释文件（.txt）和BWA软件的比对结果文件（.bam）作为输入文件，通过分别解析两个文件信息，可以得出样本的变异位点的单倍型结果。在该步骤中，部分位点由于扩增子间在基因组上位置差距太远，不能得出明确的单倍型分型结果，该方法会输出候选的所有可能单倍型结果。

变异位点的单倍型分析结果与ABO血型系统数据库进行比对分析，得到候选的ABO基因单倍型分型结果。

因二代测序读长短，本方法无法直接准确的得出唯一的单倍型分型结果，进一步通过分析候选分型的人群频率，得出可能性最高的分型结果，最后输出一对唯一的单倍型分型结果。

将本发明的方法开发成ABO血型分析软件，可方便、快速对ABO血型进行分型，其中一个样本的检测结果如图3所示，由此可知，对样本的分型结果，会同步可视化染色体与样本编号、位点坐标、测序深度、参考基因序列，展现出现该分型在数据库中的突变位点以及其他位点，分析过程集合，集成多层分析与结果展现。所有操作过程简单，即时分析，无需海量搜寻ABO血型分型数据库，无需单一维度逐层单层逐步单步操作分析，即可即时分析高通量测序的原始数据，提升效率。

另一个样本的分型结果如图4所示，其关键分型位点为467，突变类型为C.467T，最终获得其分型类型为：A₁₀₂A₁₀₂。

另一个样本的分型结果如图5所示，其关键分型位点为640，突变类型为C.640G，最终获得其分型类型为：B(A₎₀₄O₀₂。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims

1.一种基于ABO基因的血型分型方法，其特征在于，包括以下步骤：

测序：对样本的核酸样本进行高通量测序，获得测序数据；

分型：分析注释信息和比对结果，得出样本的变异位点的候选单倍型分型结果，通过与ABO分型数据库进行对比，得到最终的单倍型分型结果。

2.根据权利要求1所述的方法，其特征在于，在所述构建ABO分型数据库的步骤中，通过收集包括dbRBC和ISBT的数据库组以及文献报告获得ABO基因各个分型的分型位点。

3.根据权利要求1所述的方法，其特征在于，在获得测序数据后，进一步包括对测序数据进行质检的步骤：

原始数据质检：检测原始测序数据质量；

数据过滤：过滤低质量测序数据，处理接头序列数据。

4.根据权利要求1所述的方法，其特征在于，所述人类参考基因组是指hg19参考基因组。

5.根据权利要求1所述的方法，其特征在于，利用BWA软件进行比对。

6.根据权利要求1所述的方法，其特征在于，利用SnpEff v4.2软件进行变异分析。

7.根据权利要求1所述的方法，其特征在于，所述变异类型包括indel、snv。

8.根据权利要求1所述的方法，其特征在于，利用Annovar软件进行注释。

9.根据权利要求1所述的方法，其特征在于，进一步包括分析获得的单倍型分型结果的人群频率，得到可能性最高的分型结果的步骤。