CN113393904B

CN113393904B - 低分子肝素糖链序列检测方法、系统及测序试剂盒

Info

Publication number: CN113393904B
Application number: CN202110691317.4A
Authority: CN
Inventors: 迟连利; 石德玲; 张彬; 陈晴晴
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2021-06-22
Filing date: 2021-06-22
Publication date: 2022-10-18
Anticipated expiration: 2041-06-22
Also published as: US20220404379A1; CN113393904A

Abstract

本发明公开了一种低分子肝素糖链序列检测方法、系统及测序试剂盒，检测方法包括：样品制备步骤：根据实验需求分离或制备一组低分子肝素寡糖混合物样品；样品处理步骤：对低分子肝素寡糖混合物样品进行完全酶解和亚硝酸降解，分别获得酶解的8种基本组成单元数组和3‑O‑硫酸数组及内醚数组、亚硝酸降解数组等；数据处理步骤：根据酶解的8种基本组成单元数组及亚硝酸降解数组获得二糖异构单元数组；数据库构建步骤：根据寡糖聚合度、二糖异构单元数组、3‑O‑硫酸数组及内醚数组构建序列数据库；检测结果输出步骤：根据输入的限定条件信息通过序列数据库进行筛选，输出结果文件。通过本发明可实现一组肝素寡糖混合物的快速序列测定。

Description

低分子肝素糖链序列检测方法、系统及测序试剂盒

技术领域

本发明涉及低分子肝素糖链检测，具体地说，尤其涉及一种计算机软件辅助用于低分子肝素类药物的糖链序列测定的低分子肝素糖链序列检测方法、系统及测序试剂盒。

背景技术

在药物化学领域，糖类药物越来越受到重视，结构表征是其中重要的环节。然而天然多糖因其结构的复杂性及异质性，缺乏有效的序列分析方法，严重限制其构效关系研究和药物质量控制。糖链序列的鉴定一直是糖类药物研究的重难点，这在低分子肝素类药物的研究中尤其明显。

肝素(Heparin)是一种由L-艾杜糖醛酸或D-葡萄糖醛酸(1→4)D-葡萄糖胺二糖单元组成的具有多分散性的线性多糖，因其具有和抗凝血酶III特异性结合的序列而具有促进抗凝血活性的生物功能。低分子肝素(Low molecular weight heparins,LMWHs)是由肝素通过不同的降解条件得到的一类具有较低分子量的抗凝血药物，根据工艺和结构不同，包括依诺肝素钠(Enoxaparin sodium)、那屈肝素钙(Nadroparin calcium)、达肝素钠(Dalteparin sodium)等品种，与肝素相比，LMWHs具有生物利用度高、抗血栓作用强、血浆半衰期长、降低出血风险优点，是临床上广泛使用的一类抗凝血药物。肝素的二糖重复单元在糖醛酸残基上可能发生2-O-硫酸基取代，在葡萄糖胺残基上可能发生N-乙酰基取代、N-硫酸基取代、6-O-硫酸基取代和3-O-硫酸基取代。肝素的降解过程也会使糖链末端发生改变，因此低分子肝素是高度异质性的混合物，具有复杂的分子结构，其寡糖序列的鉴定是低分子肝素类药物研究的重难点。

现有的低分子肝素类药物糖链测定方法，主要是利用质谱及核磁技术，对低分子肝素药物进行单糖组成分析、二糖及基本组成单元分析、部分酶解的寡糖片段分析、完整糖链分析等。这些分析方法主要针对低分子肝素混合物进行分析，对其进行整体表征，并不能获得各糖链的序列信息。

针对肝素及低分子肝素的糖链序列测定，研究方法主要包括从天然混合糖链中通过复杂的分离方法获得单一糖链，或者通过合成的方法获得纯品，然后用质谱或者核磁等方法进行结构解析。

常用的糖链分离纯化方法包括：尺寸排阻色谱(size exclusionchromatography，SEC)，亲和色谱(affinity chromatography)、强阴离子交换色谱(stronganion exchange，SAX)，反相离子对色谱(reversed-phase ion pair，RPIP),亲水相互作用色谱(hydrophilic interaction chromatography，HILIC)和毛细管电泳(and capillaryelectrophoresis，CE)等。通过上述一种或多种分离技术，对复杂混合肝素糖链进行分离，获得相对较纯的糖链，然后使用多种分析方法，如质谱和核磁，对糖链序列进行测定。由于低分子肝素糖链结构的复杂性和异质性，通常对肝素糖链的分离需要复杂的操作步骤，耗费大量科研人员的时间和精力，但是即使如此，也依然难以获得足够的纯品用于糖链序列的分析。现有的肝素糖链合成研究进展缓慢，目前依然难以实现肝素类糖链的化学或生物合成。

综上，目前的技术手段难以实现低分子肝素类药物的糖链序列解析，尤其是随着糖链的延长，其同分异构体的数量呈指数上升，使得解析一组结构和组成相似的寡糖混合物的序列变得异常困难。目前还没有一种技术能够方便快捷地获得一组组成和结构相近的低分子肝素混合糖链的序列信息。因此，迫切需要一种简便快速、省时省力的方法来解释这些复杂分子所代表的结构信息。

发明内容

针对上述问题，本发明提供一种低分子肝素糖链序列检测方法，其特征在于，包括：

样品制备步骤：根据实验需求分离或制备一组低分子肝素寡糖混合物样品；

样品处理步骤：对低分子肝素寡糖混合物样品进行完全酶解和亚硝酸降解，分别获得酶解的8种基本组成单元数组和3-O-硫酸数组及内醚数组、亚硝酸降解数组；

数据处理步骤：根据所述基本组成单元数组及所述亚硝酸降解数组通过对不同二糖的IdoA/GlcA进行计算获得二糖异构单元数组；

数据库构建步骤：根据寡糖聚合度、所述二糖异构单元数组、所述3-O-硫酸数组及所述内醚数组构建序列数据库；

检测结果输出步骤：根据输入的限定条件信息通过所述序列数据库进行筛选输出结果文件。

上述的低分子肝素糖链序列检测方法，其中，所述样品处理步骤包括：

酶解处理步骤：通过肝素酶Ⅰ、Ⅱ和Ⅲ混合酶对所述低分子肝素寡糖混合物样品进行完全酶解获得所述酶解的8种基本组成单元数组、所述3-O-硫酸数组及所述内醚数组；

亚硝酸降解处理步骤：通过亚硝酸对所述低分子肝素寡糖混合物样品进行降解获得所述亚硝酸降解数组。

上述的低分子肝素糖链序列检测方法，其中，所述数据库构建步骤包括：

无内醚结构理论结构数据库构建步骤：根据所述3-O-硫酸数组及所述二糖异构单元数组构建无内醚结构理论结构数据库；

含内醚结构理论结构数据库构建步骤：据所述3-O-硫酸数组、所述内醚数组及所述二糖异构单元数组构建含内醚结构理论结构数据库；

合并步骤：对所述无内醚结构理论结构数据库及所述含内醚结构理论结构数据库进行关联合并获得所述序列数据库。

上述的低分子肝素糖链序列检测方法，其中，所述合并步骤中，将所述无内醚结构理论结构数据库的结果和所述含内醚结构理论结构数据库的结果合并，并根据数值的大小进行排序后，获得所述序列数据库。

上述的低分子肝素糖链序列检测方法，其中，所述结果文件包括：有内醚部分结构的序列-生成时间、无内醚部分结构的序列-生成时间、全量数据的序列-按照含量倒序排列-生成时间、筛选序列-生成时间及日志文件中的至少一者，所述日志文件包括计算序列的总数、二糖异构数组的种类及数值、全量数据的总记录数、无内醚数据的总记录数、有内醚数据的总记录数中的至少一者。

上述的低分子肝素糖链序列检测方法，其中，所述无内醚结构理论结构数据库构建步骤包括：若所述3-O-硫酸数组中所有元素均为0时，设置选取的元素个数为dp/2，从所述二糖异构单元数组中选择个数为dp/2个元素，将选出的所有元素按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积；若所述3-O-硫酸数组中所有元素不为0时，设置选取的元素个数为(dp-4)/2，从所述3-O-硫酸数组中取至少1个元素，从所述二糖异构单元数组中取个(dp-4)/2个元素，将选取的其余元素按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积，其中dp为寡糖聚合度。

上述的低分子肝素糖链序列检测方法，其中，所述含内醚结构理论结构数据库构建步骤包括：

当所述内醚数组的IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro组大于0且所述3-O-硫酸数组中所有元素均为0时，设置选取的元素个数为(dp-4)/2，从所述内醚数组中取1个元素IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro，从所述二糖异构单元数组中取个(dp-4)/2个元素，设置元素IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro作为该字符串的最右端元素，其左侧从所述二糖异构单元数组中选择的(dp-4)/2个元素，按顺序排列成一排，计算并输出各元素字符串的连接及各元素值的乘积；

当所述内醚数组的IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro组大于0且所述3-O-硫酸数组中所有元素不为0时，设置选取的元素个数为(dp-4-4)/2，从所述3-O-硫酸数组中取1个元素，从所述内醚数组中取1个元素IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro，从所述二糖异构单元数组中取(dp-4-4)/2个元素，设置IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro作为该字符串的最右端元素，其余选取的元素按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积；

当所述内醚数组的GlcA-GlcNS/ManNS-1,6-anhydro组>0或IdoA2S-GlcNS-1,6-anhydro组>0且所述3-O-硫酸数组中所有元素均为0时，设置选取的元素个数为(dp-2)/2，从所述内醚数组选取1个元素GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro，从所述二糖异构单元数组中取(dp-2)/2个元素，设置GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro作为该字符串的最右端元素，其左侧从所述二糖异构单元数组中选择的(dp-2)/2个元素，按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积；

当所述内醚数组的GlcA-GlcNS/ManNS-1,6-anhydro组>0或IdoA2S-GlcNS-1,6-anhydro组>0且所述3-O-硫酸数组中所有元素不为0时，设置选取的元素个数为(dp-4-2)/2，从所述3-O-硫酸数组中取1个元素IdoA-GlcNAc6S-GlcA-GlcNS3S6S或IdoA-GlcNS6S-GlcA-GlcNS3S6S或IdoA-GlcNAc6S-GlcA-GlcNS3S，从所述内醚数组中取1个元素GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro；从所述二糖异构单元数组中取个(dp-4-2)/2个元素，设置GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro作为该字符串的最右端元素，其余选取的元素，按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积。

本发明还提供一种低分子肝素糖链序列检测系统，其中，包括：

样品制备单元，根据实验需求分离或制备一组低分子肝素寡糖混合物样品；

样品处理单元，对低分子肝素寡糖混合物样品进行完全酶解和亚硝酸降解，分别获得酶解的8种基本组成单元数组和3-O-硫酸数组及内醚数组、亚硝酸降解数组；

数据处理单元，根据所述基本组成单元数组及所述亚硝酸降解数组通过对不同二糖的IdoA/GlcA进行计算获得二糖异构单元数组；

数据库构建单元，根据寡糖聚合度、所述二糖异构单元数组、所述3-O-硫酸数组及所述内醚数组构建序列数据库；

检测结果输出单元，根据输入的限定条件信息通过所述序列数据库进行筛选输出结果文件。

本发明还提供一种测序试剂盒，用于测定低分子肝素类药物的混合糖链的序列，其中，包括H₂SO₄、Ba(NO₂)₂、NaNO₂、Na₂CO₃、醋酸、氨水、NaBH₄、肝素酶I、肝素酶II、肝素酶III以及酶解缓冲液。

上述的测序试剂盒，其中，具体包括：

浓度为0.5moL，含量为1mL的所述H₂SO₄；浓度为0.5moL，含量为1mL的所述Ba(NO₂)₂的；浓度为5.5moL，含量为1mL的所述NaNO₂的；浓度为1.0moL，含量为1mL的所述Na₂CO₃的；浓度为0.1moL，含量为1mL的所述醋酸的；浓度为0.1moL，含量为1mL的所述氨水的；1g所述NaBH₄；20mIU 50μL*10的所述肝素酶I；20mIU 50μL*10的所述肝素酶II；20mIU 50μL*10的所述肝素酶III；以及1mL所述酶解缓冲液。

上述的测序试剂盒，其中，利用所述测序试剂盒对所述低分子肝素类药物进行亚硝酸降解得到亚硝酸降解产物，及利用所述测序试剂盒对所述低分子肝素类药物进行完全酶解得到完全酶解产物。

上述的测序试剂盒，其中，还包括2根液相色谱柱，所述2根色谱柱包括1根用于对所述亚硝酸降解产物进行分析的Hypercarb Column,5um,150mm×4.6mm，以及1根用于对所述完全酶解产物分析的Phenomenex Luna 3μm HILIC

本发明针对现有低分子肝素类药物糖链测序的技术不足，旨在提供一种简便高效的低分子肝素类药物的高通量测序方法、系统及测序试剂盒产品。尤其适用于复杂的肝素寡糖混合物的序列测定。通过本发明的测序试剂盒进行样品处理，和以计算机软件为主的数据处理分析，即利用测序试剂盒及计算机软件辅助数据处理技术相结合，不需对寡糖分离纯化，可实现混合肝素寡糖的高通量测序，从而极大减轻分析人员的工作量，降低成本，提高工作效率，为科研工作者和和企业研发人员提供强有力的序列分析产品及技术支持。

需要说明的是，本发明强调的是对序列的检测，而不是糖链的其他信息，如长度、分子量、硫酸化程度等其他理化性质的检测，因此通过本发明可以快速获得一组低分子肝素寡糖混合物的全部理论序列及含量，不需对肝素糖链进行纯化，可实现一组肝素寡糖混合物的快速序列测定。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的低分子肝素糖链序列检测方法的流程图；

图2为图1中步骤S2的分步骤流程图；

图3为图1中步骤S3的分步骤流程图；

图4为结果文件输出流程图；

图5为结果文件的效果示意图；

图6为本发明的应用流程图；

图7序列数据库构建示意图；

图8为本发明的低分子肝素糖链序列检测系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地说明，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。另外，在附图及实施方式中所使用相同或类似标号的元件/构件是用来代表相同或类似部分。

关于本文中所使用的“第一”、“第二”、“S1”、“S2”、…等，并非特别指称次序或顺位的意思，也非用以限定本发明，其仅为了区别以相同技术用语描述的元件或操作。

关于本文中所使用的方向用语，例如：上、下、左、右、前或后等，仅是参考附图的方向。因此，使用的方向用语是用来说明并非用来限制本创作。

关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等，均为开放性的用语，即意指包含但不限于。

关于本文中所使用的“及/或”，包括所述事物的任一或全部组合。

关于本文中的“多个”包括“两个”及“两个以上”；关于本文中的“多组”包括“两组”及“两组以上”。

关于本文中所使用的用语“大致”、“约”等，用以修饰任何可以微变化的数量或误差，但这些微变化或误差并不会改变其本质。一般而言，此类用语所修饰的微变化或误差的范围在部分实施例中可为20％，在部分实施例中可为10％，在部分实施例中可为5％或是其他数值。本领域技术人员应当了解，前述提及的数值可依实际需求而调整，并不以此为限。

某些用以描述本申请的用词将于下或在此说明书的别处讨论，以提供本领域技术人员在有关本申请的描述上额外的引导。

首先本发明公开了一种测序试剂盒，测序试剂盒包括：0.5moL H₂SO₄、0.5moL Ba(NO₂)₂、5.5moL NaNO₂、1moL Na₂CO₃、0.1moL醋酸、0.1moL氨水、NaBH₄、肝素酶Ⅰ、肝素酶Ⅱ、肝素酶Ⅲ、酶解缓冲液、Superdex 30column(16/60m)、Phenomenex Luna 3μm HILIC

(150×2.0mm)，其中各部分的具体组成参见下表

试剂盒组成

其中，如果用户本身有该色谱柱的话，可以不选择该色谱柱。

需要说明的是，本试剂盒用于测定低分子肝素类药物的混合糖链的序列测定，有效期：12个月，保存条件：-20℃避光保存，试剂盒进行长途运输时，需使用干冰作为冷冻剂。测试时，请提前将试剂盒从-20℃冰箱中取出，放于4℃，轻摇混匀；准备冰盒，实验操作均在冰盒上进行。

参照图1-图3，图1为本发明的低分子肝素糖链序列检测方法的流程图；图2为图1中步骤S2的分步骤流程图；图3为图1中步骤S3的分步骤流程图。如图1-图3所示，本发明的低分子肝素糖链序列检测方法包括：

样品制备步骤S1：根据实验需求分离或制备一组低分子肝素寡糖混合物样品；

样品处理步骤S2：对低分子肝素寡糖混合物样品进行完全酶解和亚硝酸降解，分别获得酶解的8种基本组成单元数组和3-O-硫酸数组及内醚数组、亚硝酸降解数组；

数据处理步骤S3：根据所述基本组成单元数组及所述亚硝酸降解数组通过对不同二糖的IdoA/GlcA进行计算获得二糖异构单元数组；

数据库构建步骤S4：根据寡糖聚合度、所述二糖异构单元数组、所述3-O-硫酸数组及所述内醚数组构建序列数据库；

检测结果输出步骤S5：根据输入的限定条件信息通过所述序列数据库进行筛选输出结果文件。

使用低分子肝素类药物序列测定的辅助软件对实验数据进行分析。每种低聚糖都有其独特的基本组成单元的类型和比例，这是计算机辅助结构分析的理论基础。通过对低分子肝素组成单元及其含量的测定，获得不同组成单元在寡糖序列中可能出现的概率，按照低分子肝素结构规律，通过计算模拟建立可能的寡糖序列数据库，该寡糖序列出现的概率即可反映其在寡糖混合物中真实存在的比例，以此获得一组寡糖片段的序列及其含量。通过与现有的色谱分离技术结合，可以快速推断各组分的糖链序列，辅助科研人员对复杂的肝素寡糖结构实现快速解析。

其中，所述样品处理步骤S2包括：

酶解处理步骤S21：通过肝素酶Ⅰ、Ⅱ和Ⅲ混合酶对所述低分子肝素寡糖混合物样品进行完全酶解获得所述酶解的8种基本组成单元数组、所述3-O-硫酸数组及所述内醚数组，具体地说，取肝素酶Ⅰ、Ⅱ和Ⅲ各一支混匀；配置样品溶液20μg/μL，取2.5μL；加入8.75μL酶解缓冲液及12.5μL肝素酶混合液，25℃孵育36小时后再加入12.5μL肝素酶混继续孵育36小时；100℃水浴加热10min以灭活肝素酶，取上清然后冻干；脱盐，冻干后获得肝素酶完全酶解产物；使用高效液相色谱与高分辨质谱联用技术(LC-MS)对样品中的二糖和基本组成单元进行测定获得所述酶解的8种基本组成单元数组、所述3-O-硫酸数组及所述内醚数组。

亚硝酸降解处理步骤S22：通过亚硝酸对所述低分子肝素寡糖混合物样品进行降解获得亚硝酸降解数组，具体地说，取0.5moL H₂SO₄和0.5moL Ba(NO₂)₂放置在冰上预冷；准备样品10-15μg；将预冷的0.5moL H₂SO₄和0.5moL Ba(NO₂)₂各取10μL混合均匀，加入到样品中涡旋混匀，静置10min；用1moL Na₂CO₃调节pH值到4，加入20μL pH 4的HONO溶液(5.5moLNaNO₂:0.5moL H₂SO₄＝5:2)涡旋混匀，静置15min；用1moL Na₂CO₃调节pH值到8.5，0.5moLNaBH₄ 55℃还原8小时；还原完成后，样品用0.1moL醋酸调节pH值到4，再用0.1moL氨水调节pH值到7；脱盐，冻干获得亚硝酸降解产物，使用高效液相色谱与高分辨质谱联用技术(LC-MS)对样品中的二糖和基本组成单元进行测定获得亚硝酸降解数组。

举例来说，对低分子肝素样品经过亚硝酸降解和肝素酶完全酶解产物，使用高效液相色谱与高分辨质谱联用技术(LC-MS)对样品中的二糖和基本组成单元进行测定。

(1)亚硝酸降解产物分析

1、液相参数：色谱柱PGC column(Hypercarb Column,5um,150mm×4.6mm)；流动相A相：0.1％甲酸水溶液(pH5.5)，B相：90％乙腈溶液；流速0.5mL/min，分流100μL进质谱；洗脱梯度：0-10min，0％B；10-14min，0-15％B；14-64min，15％B；64.01-75min，100％B；75.01-90min，0％B。

2、质谱参数：采集范围150-1000；负离子模式；喷雾电压-4kV；毛细管温度275℃；分辨率60,000。

(2)完全酶解产物分析

1、液相参数：色谱柱Phenomenex Luna 3μm HILIC

(150×2.0mm)；流动相A相：5mmol/L醋酸铵水溶液；B相：5mmol/L醋酸铵，98％乙腈溶液；流速：0.15mL/min；洗脱梯度：0-20min，95％B；20-122min，95-77％B；122-127min，77-50％B；127-150min，50％B；150-151min，50-95％B；151-170min，95％B。

2、质谱参数：喷雾电压：-3.8kV；扫描范围：240-800；离子模式：负离子模式；毛细管温度：275℃；分辨率：60,000。

通过给定的完全酶解及亚硝酸降解获得的基本组成单元及其含量的信息，计算所有基本组成单元及其异构体的含量，通过不同组成单元的所有排列形式获得所有可能的序列结构及其可能性。在给定的限定条件下，获得所有合理的理论结构数据库，并输出所有可能的序列及含量。

将完全酶解获得的二糖单元及其比例的数据定义为酶解的8种基本组成单元数组A，输入软件中，酶解的8种基本组成单元数组A包括所有酶解获得的8种基本组成单元，主要包括：ΔⅣA、ΔⅢA、ΔⅡA、ΔⅠA、ΔⅣS、ΔⅢS、ΔⅡS、ΔⅠS。使用肝素酶Ⅰ、Ⅱ和Ⅲ的混合物可以将低分子肝素完全降解为基本组成单元，除8种常见二糖外，还包括来源于活性五糖结构酶解产生的3-O-硫酸四糖(该部分数据作为3-O-硫酸数组)及末端含有内醚结构的二糖和寡糖(这部分数据主要组成内醚数组)。二糖谱和基本组成单元的种类和含量可以反映低分子肝素的糖链组成和结构特征。但是酶解使得糖醛酸4，5位形成不饱和双键，失去了艾杜糖醛酸和葡萄糖醛酸的异构信息，需要亚硝酸降解进一步完善。

将亚硝酸降解获得的二糖单元及比例定义为亚硝酸数组B，输入软件中，亚硝酸降解数组B：IM、GM、I2SM、G2SM、GM6S、IM6S、I2SM6S、GM3S6S、GM3S、IdoA-GlcNAc(3S/6S)-GlcA-M(3S/6S)、G-GlcNAc(6S)-G-M(3,6S)等。亚硝酸降解得到的组成单元包含不同二糖单元的艾杜糖醛酸(IdoA)和葡萄糖醛酸(GlcA)异构体的比例，可以补充酶解缺失的异构信息。

需要说明的是，亚硝酸降解数组B实际上的组成单元会更多，如果有更多组分，用户可以按实际数据进行添加。在本实施例中主要的组分将用于计算IdoA/GlcA比例，并生成二糖异构单元数组。

二糖异构单元数组C包括：IdoA-GlcNAc、GlcA-GlcNAc、IdoA2S-GlcNAc、GlcA2S-GlcNAc、IdoA-GlcNAc6S、GlcA-GlcNAc6S、IdoA2S-GlcNAc6S、GlcA2S-GlcNAc6S、IdoA-GlcNS、GlcA-GlcNS、IdoA2S-GlcNS、GlcA2S-GlcNS、IdoA-GlcNS6S、GlcA-GlcNS6S、IdoA2S-GlcNS6S、GlcA2S-GlcNS6S。该数组的值通过对数组A和数组B进行计算后获得。

具体地说，数组C的值通过对数组A和数组B用下列公式计算处理获得：

IdoA-GlcNAc＝ⅣA*IM/(IM+GM)

GlcA-GlcNAc＝ⅣA*GM/(IM+GM)

IdoA2S-GlcNAc＝ⅢA*I2SM/(I2SM+G2SM)

GlcA2S-GlcNAc＝ⅢA*G2SM/(I2SM+G2SM)

IdoA-GlcNAc6S＝ⅡA*IM6S/(IM6S+GM6S)

GlcA-GlcNAc6S＝ⅡA*GM6S/(IM6S+GM6S)

IdoA2S-GlcNAc6S＝ⅠA*I2SM6S/(I2SM6S+GM3S6S)

GlcA2S-GlcNAc6S＝ⅠA*GM3S6S/(I2SM6S+GM3S6S)

IdoA-GlcNS＝ⅣS*IM/(IM+GM)

GlcA-GlcNS＝ⅣS*GM/(IM+GM)

IdoA2S-GlcNS＝ⅢS*I2SM/(I2SM+G2SM)

GlcA2S-GlcNS＝ⅢS*G2SM/(I2SM+G2SM)

IdoA-GlcNS6S＝ⅡS*IM6S/(IM6S+GM6S)

GlcA-GlcNS6S＝ⅡS*GM6S/(IM6S+GM6S)

IdoA2S-GlcNS6S＝ⅠS*I2SM6S/(I2SM6S+G2SM6S)(默认数值为1)

GlcA2S-GlcNS6S＝ⅠS*G2SM6S/(I2SM6S+G2SM6S)(默认数值为0)

将寡糖聚合度及低分子肝素的特殊结构如1,6-内醚(即内醚数组)、3-O-硫酸四糖(即3-O-硫酸数组)、甘露糖醇、饱和末端结构等特殊结构及其比例输入软件中。本说明书中介绍了含1,6-内醚、3-O-硫酸四糖序列的计算方法，需要说明的是，低分子肝素的末端特殊结构种类很多，本发明所公开的是其中主要的组分，其他组分含量较低。在实际实验中，如果检测到末端的其他结构，如甘露糖醇、末端饱和寡糖等其他特殊结构，其计算方式与1,6-内醚(即内醚数组)相似，即将末端结构固定于序列末端，其余序列生成方式相同，在此不做详细说明。

3-O-硫酸数组D：低分子肝素抗凝血活性的结构基础是一类含有3-O-硫酸基的五糖序列，经肝素酶完全酶解后会生成不饱和的含3-O-硫酸的四糖。该部分组分单元将构成3-O-硫酸数组D：IdoA-GlcNAc6S-GlcA-GlcNS3S6S、IdoA-GlcNS6S-GlcA-GlcNS3S6S、IdoA-GlcNAc6S-GlcA-GlcNS3S、GlcA-GlcNAc6S-GlcA-GlcNS3S6S，通过输入方式对数组赋值。

内醚数组E：低分子肝素中的依诺肝素钠末端的特殊结构，该部分组成单元将构成数组内醚数组E：IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro、GlcA-GlcNS/ManNS-1,6-anhydro、IdoA2S-GlcNS-1,6-anhydro，通过输入方式对数组赋值。

寡糖聚合度dp：寡糖链的长度，即组成该寡糖的单糖个数。定义变量寡糖聚合度dp、个数Number、无内醚系数d1，正常结构比例Percent_normal，右端为GlcA-GlcNS/ManNS-1,6-anhydro的结构的比例Percent_GlcA-GlcNS/ManNS-1,6-anhydro，右端为Percent_IdoA2S-GlcNS-1,6-anhydro的结构的比例Percent_IdoA2S-GlcNS-1,6-anhydro，右端为Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro的结构的比例Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro，通过输入方式对寡糖聚合度dp赋值。

进一步地，所述数据库构建步骤S3包括：

无内醚结构理论结构数据库构建步骤S31：根据所述3-O-硫酸数组及所述二糖异构单元数组构建无内醚结构理论结构数据库，其中，所述无内醚结构理论结构数据库构建步骤包括：若所述3-O-硫酸数组中所有元素均为0时，设置选取的元素个数为dp/2，从所述二糖异构单元数组中选择个数为dp/2个元素，将选出的所有元素按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积；若所述3-O-硫酸数组中所有元素不为0时，设置选取的元素个数为(dp-4)/2，从所述3-O-硫酸数组中取至少1个元素，从所述二糖异构单元数组中取个(dp-4)/2个元素，将选取的其余元素按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积，其中dp为寡糖聚合度；

具体地说，在本发明的一实施例中，一般dp<10时，默认设定为从3-O-硫酸数组中取1个元素。在本发明的一实施例中，若用户对3-O-硫酸数组的个数有特殊要求，此处也可从3-O-硫酸数组中选择多个元素，且元素可重复选择。当选择个数为n时，则后续从所述异构单元数组中取个(dp-4n)/2个元素。

含内醚结构理论结构数据库构建步骤S32：据所述3-O-硫酸数组、所述内醚数组及所述二糖异构单元数组构建含内醚结构理论结构数据库，其中所述含内醚结构理论结构数据库构建步骤包括：当所述内醚数组的IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro组大于0且所述3-O-硫酸数组中所有元素均为0时，设置选取的元素个数为(dp-4)/2，从所述内醚数组中取1个元素IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro，从所述二糖异构单元数组中取个(dp-4)/2个元素，设置元素IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro作为该字符串的最右端元素，其左侧从所述二糖异构单元数组中选择的(dp-4)/2个元素，按顺序排列成一排，计算并输出各元素字符串的连接及各元素值的乘积；当所述内醚数组的IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro组大于0且所述3-O-硫酸数组中所有元素不为0时，设置选取的元素个数为(dp-4-4)/2，从所述3-O-硫酸数组中取1个元素，从所述内醚数组中取1个元素IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro，从所述二糖异构单元数组中取(dp-4-4)/2个元素，设置IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro作为该字符串的最右端元素，其余选取的元素按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积；当所述内醚数组的GlcA-GlcNS/ManNS-1,6-anhydro组>0或IdoA2S-GlcNS-1,6-anhydro组>0且所述3-O-硫酸数组中所有元素均为0时，设置选取的元素个数为(dp-2)/2，从所述内醚数组选取1个元素GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro，从所述二糖异构单元数组中取(dp-2)/2个元素，设置GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro作为该字符串的最右端元素，其左侧从所述二糖异构单元数组中选择的(dp-2)/2个元素，按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积；当所述内醚数组的GlcA-GlcNS/ManNS-1,6-anhydro组>0或IdoA2S-GlcNS-1,6-anhydro组>0且所述3-O-硫酸数组中所有元素不为0时，设置选取的元素个数为(dp-4-2)/2，从所述3-O-硫酸数组中取1个元素IdoA-GlcNAc6S-GlcA-GlcNS3S6S或IdoA-GlcNS6S-GlcA-GlcNS3S6S或IdoA-GlcNAc6S-GlcA-GlcNS3S，从所述内醚数组中取1个元素GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro；从所述二糖异构单元数组中取个(dp-4-2)/2个元素，设置GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro作为该字符串的最右端元素，其余选取的元素，按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积；

合并步骤S33：对所述无内醚结构理论结构数据库及所述含内醚结构理论结构数据库进行关联合并获得所述序列数据库；其中所述合并步骤S33中，将所述无内醚结构理论结构数据库的结果和所述含内醚结构理论结构数据库的结果合并，并根据数值的大小进行排序后，获得所述序列数据库。

具体地说，序列数据库由(1)无内醚结构理论数据库和(2)含内醚结构理论数据库合并构成，两个数据库合并后为完整的理论结构数据库。

两部分的生成方式分别如下：

计算前，设定比例系数，该部分为不同类型结构的校正系数，由实验人员根据实验结果进行输入，用以校正不同类型结构的含量。数据类型为整数或小数，软件默认数值为1。

#正常结构比例(手动输入)

Percent_normal＝[1.0]

#右端为IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro的结构的比例E[0](手动输入)

Percent_E0＝[1.0]

#右端为GlcA-GlcNS/ManNS-1,6-anhydro的结构的比例E[1](手动输入)

Percent_E1＝[1.0]

#右端为IdoA2S-GlcNS-1,6-anhydro的结构的比例E[2](手动输入)

Percent_E2＝[1.0]

(1)无内醚结构理论结构数据库

·如果3-O-硫酸数组D中所有元素均为0，

那么，Number＝dp/2，从二糖异构单元数组C中选择Number个元素，元素可重复，按顺序排列成一排，输出各元素字符串的连接及各元素值的乘积，所有结果均乘Percent_normal。

示例：假如若数组C中仅含有IdoA-GlcNAc，GlcA-GlcNAc，IdoA2S-GlcNAc共3种元素，其数值分别为1，2，3，内醚数组E中所有元素数值均为0，Percent_normal＝1

当dp＝4时，Number＝2，输出结果如下：

[IdoA-GlcNAc-IdoA-GlcNAc]＝1*1*Percent_normal＝1

[IdoA-GlcNAc-GlcA-GlcNAc]＝1*2*Percent_normal＝2

[IdoA-GlcNAc-IdoA2S-GlcNAc]＝1*3*Percent_normal＝3

[GlcA-GlcNAc-IdoA-GlcNAc]＝2*1*Percent_normal＝2

[GlcA-GlcNAc-GlcA-GlcNAc]＝2*2*Percent_normal＝4

[GlcA-GlcNAc-IdoA2S-GlcNAc]＝2*3*Percent_normal＝6

[IdoA2S-GlcNAc-IdoA-GlcNAc]＝3*1*Percent_normal＝3

[IdoA2S-GlcNAc-GlcA-GlcNAc]＝3*2*Percent_normal＝6

[IdoA2S-GlcNAc-IdoA2S-GlcNAc]＝3*3*Percent_normal＝9

否则，Number＝(dp-4)/2，从3-O-硫酸数组D中取1个元素

(IdoA-GlcNAc6S-GlcA-GlcNS3S6S或

IdoA-GlcNS6S-GlcA-GlcNS3S6S或IdoA-GlcNAc6S-GlcA-GlcNS3S)，从二糖异构单元数组C中取个Number个元素，元素可重复。将选出的Number+1个元素按顺序排列成一排。输出各元素字符串的连接及各元素值的乘积，所有乘积结果均乘Percent_normal。

示例：假如若数组C中仅含有IdoA-GlcNAc，GlcA-GlcNAc共2种元素，其数值分别为1，2；3-O-硫酸数组D中仅有IdoA-GlcNAc6S-GlcA-GlcNS3S6S不为0，其值为3；内醚数组E中所有元素数值均为0

当dp＝8时，Number＝2，输出结果如下：

[IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA-GlcNAc-IdoA-GlcNAc]＝3*1*1*Percent_normal＝3

[IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA-GlcNAc]＝1*3*1*Percent_normal＝3

[IdoA-GlcNAc-IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S]＝1*1*3*Percent_normal＝3

[IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA-GlcNAc-GlcA-GlcNAc]＝3*1*2*Percent_normal＝6

[IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-GlcA-GlcNAc]＝1*3*2*Percent_normal＝6

[IdoA-GlcNAc-GlcA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S]＝1*2*3*Percent_normal＝6

[IdoA-GlcNAc6S-GlcA-GlcNS3S6S-GlcA-GlcNAc-IdoA-GlcNAc]＝3*2*1*Percent_normal＝6

[GlcA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA-GlcNAc]＝2*3*1*Percent_normal＝6

[GlcA-GlcNAc-IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S]＝2*1*3*Percent_normal＝6

[IdoA-GlcNAc6S-GlcA-GlcNS3S6S-GlcA-GlcNAc-GlcA-GlcNAc]＝3*2*2*Percent_normal＝12

[GlcA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-GlcA-GlcNAc]＝2*3*2*Percent_normal＝12

[GlcA-GlcNAc-GlcA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S]＝2*2*3*Percent_normal＝12

……

(2)含内醚结构数据库，由IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro组和GlcA-GlcNS/ManNS-1,6-anhydro和IdoA2S-GlcNS-1,6-anhydro组数据库合并构成，两组数据库生成方式如下：

1、IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro组，判断标准：IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro>0则执行下面的步骤，如果IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro＝0，则不执行本部分的内容。

·如果3-O-硫酸数组D中所有元素均为0，

那么，Number＝(dp-4)/2，从内醚数组E中取元素

IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro，从二糖异构单元数组C中取个Number个元素，元素可重复。

设置IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro作为该字符串的最右端元素，其左侧从二糖异构单元数组C中选择的Number个元素，按顺序排列成一排。输出各元素字符串的连接及各元素值的乘积，所有乘积乘Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro。

示例：

[IdoA-GlcNAc-……GlcA-GlcNAc-IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro

[GlcA-GlcNAc-……IdoA-GlcNAc-IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro

[GlcA-GlcNAc-……GlcA-GlcNAc-IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro

[IdoA-GlcNAc-……IdoA-GlcNAc-IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro

……

·否则，Number＝(dp-4-4)/2，从3-O-硫酸数组D中取1个元素(IdoA-GlcNAc6S-GlcA-GlcNS3S6S或IdoA-GlcNS6S-GlcA-GlcNS3S6S或IdoA-GlcNAc6S-GlcA-GlcNS3S)；从内醚数组E中取元素IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro；从二糖异构单元数组C中取个Number个元素，元素可重复。

设置IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro作为该字符串的最右端元素，其余Number+1个元素，按顺序排列成一排。输出各元素字符串的连接及各元素值的乘积，所有乘积乘

Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro。

示例：

[IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA-GlcNAc-IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro[IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA-GlcNAc-IdoA-GlcNAc-IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro[IdoA-GlcNAc-IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro[IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-GlcA-GlcNAc-IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro[IdoA-GlcNAc6S-GlcA-GlcNS3S6S-GlcA-GlcNAc-IdoA-GlcNAc-IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro[GlcA-GlcNAc-IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro

……

2、GlcA-GlcNS/ManNS-1,6-anhydro和IdoA2S-GlcNS-1,6-anhydro组，判断标准：GlcA-GlcNS/ManNS-1,6-anhydro>0或IdoA2S-GlcNS-1,6-anhydro>0则执行下面的步骤，如果GlcA-GlcNS/ManNS-1,6-anhydro＝0且IdoA2S-GlcNS-1,6-anhydro＝0，则不执行本部分的内容。

·如果3-O-硫酸数组D中所有元素均为0，

那么，Number＝(dp-2)/2，从内醚数组E中取1个元素(GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro)，从二糖异构单元数组C中取个Number个元素，元素可重复。

设置GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro作为该字符串的最右端元素，其左侧从二糖异构单元数组C中选择的Number个元素，按顺序排列成一排。输出各元素字符串的连接及各元素值的乘积，各乘积分别乘Percent_GlcA-GlcNS/ManNS-1,6-anhydro，或者Percent_IdoA2S-GlcNS-1,6-anhydro(最右端元素是哪个就乘哪个对应的比例)。

示例：

[IdoA-GlcNAc-……GlcA-GlcNAc-GlcA-GlcNS/ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_GlcA-GlcNS/ManNS-1,6-anhydro

[GlcA-GlcNAc-……IdoA-GlcNAc-GlcA-GlcNS/ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_GlcA-GlcNS/ManNS-1,6-anhydro

[GlcA-GlcNAc-……GlcA-GlcNAc-GlcA-GlcNS/ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_GlcA-GlcNS/ManNS-1,6-anhydro

[IdoA-GlcNAc-……IdoA-GlcNAc-GlcA-GlcNS/ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_GlcA-GlcNS/ManNS-1,6-anhydro

……

[IdoA-GlcNAc-……GlcA-GlcNAc-IdoA2S-GlcNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS-1,6-anhydro

[GlcA-GlcNAc-……IdoA-GlcNAc-IdoA2S-GlcNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS-1,6-anhydro

[GlcA-GlcNAc-……GlcA-GlcNAc-IdoA2S-GlcNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS-1,6-anhydro

[IdoA-GlcNAc-……IdoA-GlcNAc-IdoA2S-GlcNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS-1,6-anhydro

……

·否则，Number＝(dp-4-2)/2，从3-O-硫酸数组D中取1个元素(IdoA-GlcNAc6S-GlcA-GlcNS3S6S或IdoA-GlcNS6S-GlcA-GlcNS3S6S或IdoA-GlcNAc6S-GlcA-GlcNS3S)；从内醚数组E中取1个元素(GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro)；从二糖异构单元数组C中取个Number个元素，元素可重复。

设置GlcA-GlcNS/ManNS-1,6-anhydro或IdoA2S-GlcNS-1,6-anhydro作为该字符串的最右端元素，其余Number+1个元素，按顺序排列成一排。输出各元素字符串的连接及各元素值的乘积，各乘积分别乘Percent_GlcA-GlcNS/ManNS-1,6-anhydro，或者Percent_IdoA2S-GlcNS-1,6-anhydro(最右端元素是哪个就乘哪个对应的比例)。

示例：

[IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA-GlcNAc-GlcA-GlcNS/ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_GlcA-GlcNS/ManNS-1,6-anhydro[IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA-GlcNAc-IdoA-GlcNAc-GlcA-GlcNS/ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_GlcA-GlcNS/ManNS-1,6-anhydro

[IdoA-GlcNAc-IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-GlcA-GlcNS/ManNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS-1,6-anhydro

……

[IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA-GlcNAc-IdoA2S-GlcNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS-1,6-anhydro

[IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA-GlcNAc-IdoA-GlcNAc-IdoA2S-GlcNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS-1,6-anhydro[IdoA-GlcNAc-IdoA-GlcNAc-IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA2S-GlcNS-1,6-anhydro]＝每个元素数值乘积*Percent_IdoA2S-GlcNS-1,6-anhydro

……

最后将第一组无内醚部分结构的结果和第二组有内醚部分结构的结果合并，按照数值从高到低排序，输出到基础理论结构数据库文件中获得序列数据库。

需要说明的是，在本发明的一实施例中，可以不进行比例系数的乘积运算，即默认比例系数均为1。

更进一步地，所述结果文件包括：有内醚部分结构的序列-生成时间、无内醚部分结构的序列-生成时间、全量数据的序列-按照含量倒序排列-生成时间、筛选序列-生成时间及日志文件中的至少一者，所述日志文件包括计算序列的总数、二糖异构数组的种类及数值、全量数据的总记录数、无内醚数据的总记录数、有内醚数据的总记录数中的至少一者。

具体地说，请参照图4，根据输入的限定条件信息通过所述序列数据库进行筛选输出结果文件，限定条件信息包括：设定导出结果时的个数，如导出全部序列，或导出数值最高的前n条序列以及筛选序列，所述结果文件包括：有内醚部分结构的序列-生成时间、无内醚部分结构的序列-生成时间、全量数据的序列-按照含量倒序排列-生成时间、筛选序列-生成时间及日志文件中的至少一者，所述日志文件包括计算序列的总数、二糖异构数组的种类及数值、全量数据的总记录数、无内醚数据的总记录数、有内醚数据的总记录数中的至少一者。

举例来说，A全量数据的序列

(1)统计并在日志文件中输出计算序列的总的个数。比如一共生成了50000个序列，则输出：生成的理论结构数据库含有50000个序列

(2)按照倒序排列后取前q个，输出Excel表。(q由用户设置，少于q个时，则有多少显示多少)。

B无内醚部分结构的序列生成后，单独导出一个无内醚部分结构的序列Excel，要求按含量倒序排列后取前n个。(n由用户设置，少于n个时，则有多少显示多少)。

C有内醚部分结构的序列生成后，单独导出一个有内醚部分的序列Excel。要求按含量倒序排列后取前m个。(m由用户设置，少于m个时，则有多少显示多少)。

D筛选结构时，筛选到的序列按照含量的倒序排列后取前p个导出到Excel表中。每个文件命名时可用以时间加筛选条件作为文件名。(p由用户设置，少于p个时，则有多少显示多少)。

其中结果文件的形式请参照图5，具体为：第一列为结构的序列，第二列为该序列的含量，即对应的组成单元的值的乘积。

在本发明的一实施例中，数据库筛选，输入筛选条件，对序列数据库中的结果进行筛选。抗凝血活性肝素寡糖的筛选条件示例：选择含有IdoA-GlcNAc6S-GlcA-GlcNS3S6S-IdoA2S-GlcNS(6S)，IdoA-GlcNS6S-GlcA-GlcNS3S6S-IdoA2S-GlcNS(6S)，IdoA-GlcNS6S-GlcA-GlcNS3S-IdoA2S-GlcNS(6S)的结果并输出结果文件为特殊结构理论数据库。

请参照图6，图6为本发明的应用流程图。如图6所示，本发明的检测方法包括：

1、按实验需要分离或制备一组低分子肝素寡糖混合物样品。

2、通过肝素酶Ⅰ、Ⅱ和Ⅲ混合酶对样品进行完全酶解，获得酶解基本组成单元及其比例，将该数据定义为酶解的8种基本组成单元数组A，输入软件中。

3、对样品进行亚硝酸降解，获得所有降解后的基本组成单元及比例，将该组数据定义为亚硝酸数组B，并输入软件。

4、软件对第2步和第3步输入的数据进行处理，软件通过对不同二糖的IdoA/GlcA进行计算，获得所有基本组成单元及其异构体的种类及比例，作为二糖异构单元数组C，该数据作为建立结构数据库的基础。

5、将寡糖聚合度(根据试验需求)、基本组成单元及其异构比例，以及低分子肝素的特殊结构如内醚即对应的内醚数组、3-O-硫酸四糖(即对应的3-O-硫酸数组)等特殊结构及其比例输入In silico sequencing(ISS)软件中，建立初始序列数据库。数据库建立过程的示意图见图7。

6、如果有特殊结构要求，输入结构限定条件，对符合结构特点的序列进行筛选，建立所有符合要求的序列及其比例的理论数据库。

7、将序列数据库与现有分离方式获得组分出峰的顺序及其含量进行对比，可以对各组分进行序列推断，辅助科研人员对一组复杂寡糖混合物的结构解析。

请参照图8，图8为本发明的低分子肝素糖链序列检测系统的结构示意图。如图8所示，本发明的低分子肝素糖链序列检测系统包括：

样品制备单元11，根据实验需求分离或制备一组低分子肝素寡糖混合物样品；

样品处理单元12，对低分子肝素寡糖混合物样品进行完全酶解和亚硝酸降解，分别获得酶解的8种基本组成单元数组和3-O-硫酸数组及内醚数组、亚硝酸降解数组；

数据处理单元13，根据所述基本组成单元数组及所述亚硝酸降解数组通过对不同二糖的IdoA/GlcA进行计算获得二糖异构单元数组；

数据库构建单元14，根据寡糖聚合度、所述二糖异构单元数组、所述3-O-硫酸数组及所述内醚数组构建序列数据库；

检测结果输出单元15，根据输入的限定条件信息通过所述序列数据库进行筛选输出结果文件。

综上所述，本发明具有以下优点：

1、目前对于低分子肝素类药物，常用的分析手段中包括二糖和基本组成单元的分析，且一般以酶解为主，但是，目前并没有用于测定低分子肝素类药物的二糖和基本组成单元的试剂盒。本发明的试剂盒可以为科研工作者和企业研发人员提供简便快捷的检测手段，该试剂盒可以同时进行样品的亚硝酸降解和肝素酶Ⅰ、Ⅱ、Ⅲ的完全酶解，极大提高了分析效率，同时获得更加完整的基本组成单元的结构信息，尤其是基本组成单元中IdoA和GlcA的差向异构信息。

2、目前低分子肝素的序列测定仍然存在技术局限，对于一组复杂的肝素糖链混合物，目前没有高效便捷的方法对其序列进行一一测定，通过发明解决结构、组成相似的一组低分子肝素寡糖混合物的快速、高通量序列分析，可以快速获得任一组混合肝素寡糖糖链的序列组成及含量信息。

尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种低分子肝素糖链序列检测方法，其特征在于，包括：

检测结果输出步骤：根据输入的限定条件信息通过所述序列数据库进行筛选，输出结果文件；

其中，所述数据库构建步骤包括：

含内醚结构理论结构数据库构建步骤：根据所述3-O-硫酸数组、所述内醚数组及所述二糖异构单元数组构建含内醚结构理论结构数据库；

2.如权利要求1所述的低分子肝素糖链序列检测方法，其特征在于，所述样品处理步骤包括：

3.如权利要求1所述的低分子肝素糖链序列检测方法，其特征在于，所述结果文件包括：有内醚部分结构的序列-生成时间、无内醚部分结构的序列-生成时间、全量数据的序列-按照含量倒序排列-生成时间、筛选序列-生成时间及日志文件中的至少一者，所述日志文件包括计算序列的总数、二糖异构数组的种类及数值、全量数据的总记录数、无内醚数据的总记录数、有内醚数据的总记录数中的至少一者。

4.如权利要求2所述的低分子肝素糖链序列检测方法，其特征在于，所述无内醚结构理论结构数据库构建步骤包括：若所述3-O-硫酸数组中所有元素均为0时，设置选取的元素个数为dp/2，从所述二糖异构单元数组中选择个数为dp/2个元素，将选出的所有元素按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积；若所述3-O-硫酸数组中所有元素不为0时，设置选取的元素个数为(dp-4)/2，从所述3-O-硫酸数组中取至少1个元素，从所述二糖异构单元数组中取个(dp-4)/2个元素，将选取的其余元素按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积，其中dp为寡糖聚合度。

5.如权利要求2所述的低分子肝素糖链序列检测方法，其特征在于，所述含内醚结构理论结构数据库构建步骤包括：

当所述内醚数组的IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro组大于0且所述3-O-硫酸数组中所有元素不为0时，设置选取的元素个数为(dp-4-4)/2，从所述3-O-硫酸数组中取至少1个元素，从所述内醚数组中取1个元素IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro，从所述二糖异构单元数组中取(dp-4-4)/2个元素，设置IdoA2S-GlcNS6S-IdoA2S-ManNS-1,6-anhydro作为该字符串的最右端元素，其余选取的元素按顺序排列成一排后，计算并输出各元素字符串的连接及各元素值的乘积；

6.如权利要求1所述的低分子肝素糖链序列检测方法，其特征在于，所述样品处理步骤包括：

利用测序试剂盒对低分子肝素类药物进行亚硝酸降解得到亚硝酸降解产物，及利用所述测序试剂盒对低分子肝素类药物进行完全酶解得到完全酶解产物。

7.如权利要求6所述的低分子肝素糖链序列检测方法，其特征在于，所述测序试剂盒包括：H₂SO₄、Ba(NO₂)₂、NaNO₂、Na₂CO₃、醋酸、氨水、NaBH₄、肝素酶I、肝素酶II、肝素酶III以及酶解缓冲液。

8.如权利要求7所述的低分子肝素糖链序列检测方法，其特征在于，所述测序试剂盒包括：

9.一种低分子肝素糖链序列检测系统，其特征在于，包括：

检测结果输出单元，根据输入的限定条件信息通过所述序列数据库进行筛选输出结果文件；

其中，数据库构建单元根据所述3-O-硫酸数组及所述二糖异构单元数组构建无内醚结构理论结构数据库；根据所述3-O-硫酸数组、所述内醚数组及所述二糖异构单元数组构建含内醚结构理论结构数据库；数据库构建单元对所述无内醚结构理论结构数据库及所述含内醚结构理论结构数据库进行关联合并获得所述序列数据库。