CN113012762A - 基于分子分类器的样本分类系统、试剂盒、方法及应用 - Google Patents

基于分子分类器的样本分类系统、试剂盒、方法及应用 Download PDF

Info

Publication number
CN113012762A
CN113012762A CN202110384489.7A CN202110384489A CN113012762A CN 113012762 A CN113012762 A CN 113012762A CN 202110384489 A CN202110384489 A CN 202110384489A CN 113012762 A CN113012762 A CN 113012762A
Authority
CN
China
Prior art keywords
seq
dna
probe
mrna
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110384489.7A
Other languages
English (en)
Other versions
CN113012762B (zh
Inventor
韩达
马倩
张朝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renji Hospital Shanghai Jiaotong University School of Medicine
Original Assignee
Renji Hospital Shanghai Jiaotong University School of Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renji Hospital Shanghai Jiaotong University School of Medicine filed Critical Renji Hospital Shanghai Jiaotong University School of Medicine
Priority to CN202110384489.7A priority Critical patent/CN113012762B/zh
Publication of CN113012762A publication Critical patent/CN113012762A/zh
Application granted granted Critical
Publication of CN113012762B publication Critical patent/CN113012762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/682Signal amplification

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Public Health (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Epidemiology (AREA)
  • Analytical Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请公开了一种基于分子分类器的样本分类系统。所述系统包括分类器构建模块、样本处理模块、分子分类器处理模块和结果报告模块。本申请还公开了基于分子分类器的样本分类方法和试剂盒,以及所述系统在呼吸系统感染类型分类中的应用,利用该样本分类系统能够快速且准确地对样本进行分类。

Description

基于分子分类器的样本分类系统、试剂盒、方法及应用
技术领域
本申请涉及分子检测技术领域,具体涉及一种基于分子分类器的样本分类系统、试剂盒、方法及应用。
背景技术
基因表达的变化与每一种人类疾病都有关联。监测这些变化使医生能够进行诊断、评估治疗效果和预测疾病复发。现有的高通量核糖核酸检测方法,如定量逆转录PCR(RT-qPCR)、微阵列或RNA测序,原则上可用于定量监测诊断应用中的基因表达变化,但在需要反复监测或定期筛查的情况下成本过高。且单独的标志物通常特异性较低,需要联合分析多种标志物以提高准确性。为了克服这些限制问题,有必要开发可在联合多种标志物的快速廉价基因表达诊断测试方法。
细菌或病毒引起的急性呼吸道感染是医院常见病因。现有方法难以快速准确地区分呼吸系统疾病的感染类型,往往导致抗生素的过度使用。然而,传统的基于病原体的诊断方法灵敏度有限,报告时间长(如细菌培养等),成本高,并且不能区分感染和定殖。血液中单一的生物标志物只表现出一定的准确度,如血清中性粒细胞载脂蛋白含量、炎性指标降钙素原、C-反应蛋白和白细胞计数等,在判断细菌性感染及严重程度具有一定临床价值,但是仍无法进行准确判定病毒感染。
合成生物学和DNA纳米技术在低成本RNA诊断方法方面取得了一定的进展。为了使检测不再局限于单个标志物,就必须开发“联合计算”技术,将多个标志物(特征基因)表达谱中的信息转换为可直接判读的“是/否”答案。计算基因表达分类器通常使用逻辑回归、支持向量机(SVMs)或神经网络方法来构建模型,这些方法可以更好地利用多生物标志物分子水平的数量特征,通过基于DNA链置换反应的DNA分子电路,将不同输入信号转换为设计的短的核苷酸序列,进行逻辑和数学运算。
发明内容
本申请提供一种基于分子分类器的样本分类系统、试剂盒、方法及应用,可以高灵敏地对样本进行分类。
相应的,本申请提供一种基于分子分类器的样本分类系统,包括:分类器构建模块、样本处理模块、分子分类器处理模块和结果报告模块,其中,所述分类器构建模块,通过机器学习训练筛选输入样本的特征mRNA,并基于所述特征mRNA构建数学运算模型;所述样本处理模块,从离体的全血样本中提取mRNA;所述分子分类器处理模块,基于所述数学运算模型构建DNA链置换反应体系,在DNA纳米芯片上实现所述数学运算;所述结果报告模块,将基于DNA链置换反应的循环信号放大后,与荧光报告探针杂交反应,释放荧光信号,输出分类结果。
可选的,在本申请的一些实施例中,所述机器学习的模型是使用支持向量机分类模型,也可以采用逻辑回归或神经网络方法来构建模型。
可选的,在本申请的一些实施例中,所述数学运算模型为赋予所述特征mRNA以权重值,通过累加所述特征mRNA表达量与所述权重值的乘积获得单个输出数值,根据数值大小判断分类结果;权重值可以是正数,也可以是负数;最终输出数值可以是正数,也可以是负数。
可选的,在本申请的一些实施例中,所述数学运算模型为:结果=特征1×权重1+特征2×权重2+特征3×权重3+……+特征n×权重n,其中n为正整数。
可选的,在本申请的一些实施例中,所述分类器构建模块中,在机器学习训练过程中,通过施加一些约束条件,以找到最优的特征mRNA组合并赋予权重,达到最佳分类精确度;所述约束条件为限制权重,使-10≤权重≤10,将数学运算限制为加法、乘法和减法。
可选的,在本申请的一些实施例中,将所述特征mRNA表达量数据对数化处理。
可选的,在本申请的一些实施例中,所述样本处理模块中,获取全血样本,从所述全血样本中通过TRIZOL法或试剂盒提取总RNA;由于RNA化学性质活泼,结构不稳定,并且内外源RNA酶无所不在,因此本申请采取TRIZOL法或试剂盒从而提取高质量的总RNA。
可选的,在本申请的一些实施例中,所述分子分类器处理模块包括设计不对称引物,将所述特征mRNA线性放大并转化为单链DNA,设计计算探针,经过DNA链置换反应实现所述数学运算。
可选的,在本申请的一些实施例中,所述分子分类器处理模块中,针对每一个筛选获得的特征mRNA,设计不对称PCR引物,得到单链DNA,基于引物设计的特异性实现不同特征mRNA的线性扩增,将每一个特征mRNA线性放大并转化为单链DNA;也可以采用大量人工合成获得单链DNA。从全血样本中抽提得到的总RNA,除靶标特征mRNA外还含有大量的非靶标RNA,本申请通过特异识别和放大的方法将总RNA中的靶标mRNA识别并线性等比放大,使后续DNA计算结果不受总RNA中的其它RNA干扰。
可选的,在本申请的一些实施例中,所述不对称PCR引物分别为限制引物和过量引物,通过调节所述限制引物和过量引物的长度、核苷酸组成以及限制引物和过量引物的浓度比,使在PCR过程中限制引物耗尽后(少于10个循环),PCR反应能从指数扩增阶段转为线性扩增阶段。
可选的,在本申请的一些实施例中,所述分子分类器处理模块中,通过控制扩增循环数量,使单链DNA浓度适于后续的分子计算。
可选的,在本申请的一些实施例中,所述分子分类器处理模块中,把所述计算探针修饰在所述DNA纳米芯片的表面,将线性放大后的样本与所述DNA纳米芯片接触,实现所述数学运算;采用DNA纳米芯片为DNA分子计算元件的精确可寻址排列提供了可编程支架,并且可以防止计算元件扩散,增加其局部浓度,从而进一步提高所述分类系统的效率。
可选的,在本申请的一些实施例中,所述DNA纳米芯片尺寸为60nm×90nm。
可选的,在本申请的一些实施例中,基于DNA链置换反应实现数学运算模型的乘法运算为:在每个转化的单链DNA序列中选择一个或多个区域,区域的个数与该特征mRNA的权重值的绝对值相对应。针对每个区域设计杂交探针,经过一步DNA链置换反应后,一个单链DNA可以置换出一条或多条单链DNA,实现乘法运算。
可选的,在本申请的一些实施例中,基于DNA链置换反应实现模型计算公式中的加法运算为:设计两组杂交探针,通过一步DNA链置换反应,分别对权重值为正数的特征mRNA乘法结果和权重值为负数的特征mRNA乘法结果累加,获得两个加法和(“正和”和“负和”)。
可选的,在本申请的一些实施例中,基于DNA链置换反应实现模型计算公式中的减法运算为:设计一种减法探针,通过将上述两个加法和同时与减法探针杂交,将其中一个加法和完全消耗尽,只留下绝对值较大的一个加法和,实现减法运算,只保留两个加法和中的一个。
可选的,在本申请的一些实施例中,所述DNA链置换反应可以在无酶催化的条件下进行,也可以在有酶催化的条件下进行。
可选的,在本申请的一些实施例中,所述结果报告模块中,设计一组放大探针,将上述分子计算结果中剩下的一个加法和进行扩增放大,再分别设计针对两个加法和的两种荧光报告探针,两个加法和中任意一个经过减法、信号放大后,可以与荧光报告探针杂交反应,释放荧光信号。两种荧光信号分别代表一种分类结果。所述荧光报告探针的荧光标记,可以是任意FAM、Alexa Fluor、VIC、HEX、Cy3、ROX等常用荧光标记的任意两种。
相应地,本申请还提供一种基于分子分类器的样本分类试剂盒,所述试剂盒包括不对称引物、mRNA提取试剂盒、计算探针、DNA纳米芯片、荧光报告探针,其中所述计算探针包括:乘法探针、加法探针以及减法探针。
可选的,在本申请的一些实施例中,利用所述计算探针进行数学运算的步骤包括:加入所述乘法探针,经过一步DNA链置换反应实现乘法运算,加入所述加法探针,分别对权重值为正数的特征mRNA乘法结果和权重值为负数的特征mRNA乘法结果累加,获得两个加法和,利用所述减法探针,进行减法运算,保留绝对值较大的一个加法和。
可选的,在本申请的一些实施例中,所述试剂盒能够特异性检测如下一种或多种mRNA表达量:SIGLEC1(Gene ID:6614)、JUND(Gene ID:3727)、LY6E(Gene ID:4061)、RPS21(Gene ID:6227)、TRDV3(Gene ID:28516)、MRPS18B(Gene ID:28973)、IFIT1(Gene ID:3434)、EXOC7(Gene ID:23265)、VNN1(Gene ID:8876)、ARPC3(Gene ID:10094)、LAPTM4B(Gene ID:55353)、CD177(Gene ID:57126)、KIAA1324(Gene ID:57535)、CYP27A1(Gene ID:1593)、或ARG1(Gene ID:383)。
可选的,在本申请的一些实施例中,所述试剂盒能够特异性检测SEQ ID NO:1至SEQ ID NO:7任一所示核苷酸序列的表达量。
可选的,在本申请的一些实施例中,所述不对称PCR引物包括如下所述的PCR引物对:
(a)SEQ ID NO:8和SEQ ID NO:9所示的引物;
(b)SEQ ID NO:10和SEQ ID NO:11所示的引物;
(c)SEQ ID NO:12和SEQ ID NO:13所示的引物;
(d)SEQ ID NO:14和SEQ ID NO:15所示的引物;
(e)SEQ ID NO:16和SEQ ID NO:17所示的引物;
(f)SEQ ID NO:18和SEQ ID NO:19所示的引物;和/或
(g)SEQ ID NO:20和SEQ ID NO:21所示的引物。
此外,本申请还提供一种基于分子分类器的样本分类方法,所述荧光检测方法包括:通过机器学习训练筛选输入样本的特征mRNA,并基于所述特征mRNA构建数学运算模型;获取全血样本,从所述全血样本中通过TRIZOL法或试剂盒提取mRNA;设计不对称引物,将所述特征mRNA线性放大并转化为单链DNA,设计计算探针,把所述计算探针修饰在所述DNA纳米芯片的表面,经过DNA链置换反应实现所述数学运算;将基于DNA链置换反应的循环信号放大后,与荧光报告探针杂交反应,释放荧光信号,输出分类结果,不同荧光信号分别代表不同的分类结果,其中,所述荧光为FAM、Alexa Fluor、VIC、HEX、Cy3、ROX中的任意两种。
另外,本申请还提供一种所述系统在呼吸系统感染类型分类中的应用。
本申请具有如下有益效果:
1)通过特异识别和放大方法将总RNA样本中的靶标RNA识别并线性等比例放大,使后续DNA计算结果不受总RNA中的其他RNA干扰。
2)本申请中所用的寡核苷酸探针链制备条件和步骤简单,易于操作和改造,成本低廉,具有应用前景;
3)本申请中所使用的DNA分子计算链置换过程反应迅速,可用于快速诊断;
4)本申请中所使用的多基因分子分类器,检测准确率较高。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是在DNA纳米芯片上进行分子计算的示意图;
图2是基于DNA链置换反应实现数学运算模型的示意图,图2A为实现乘法运算的示意图,图2B为实现加法运算的示意图,图2C为实现减法运算的示意图;
图3是基于DNA链置换反应的循环信号放大和报告的示意图;
图4是采用不同引物比例对不同初始浓度的mRNA进行PCR扩增后得到的单链DNA荧光检测图;
图5是XX在溶液中和在DNA纳米芯片上的反应结果;
图6是未修饰的DNA纳米芯片和修饰DNA计算探针的DNA纳米芯片的AFM表征图;
图7是基于DNA链置换反应的乘法及加法运算的荧光报告检测图;
图8是基于DNA链置换反应的减法运算及信号放大荧光报告检测图;
图9是新鲜全血样本的检测结果。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种基于分子分类器的样本分类系统、试剂盒、方法及应用。以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本发明所述的“分类器”是指能够执行输入样本中多个特征信号之间的逻辑运算和数学运算,最终输出一种单一信号,实现样本分类目的。
本发明所述的“DNA链置换”是指一条单链DNA置换出部分复合物中原绑定链的反应过程。
本发明所述的“支持向量机”是指按监督学习方式对数据进行二元分类的线性分类器。所述监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到所要求的性能的过程。
本发明所述的PCR为聚合酶链式反应,是一种用于放大扩增特定的DNA片段的分子生物学技术。DNA在体外95℃高温时变性会变成单链,低温(60℃左右)时引物与单链按碱基互补配对的原则结合,再调温度至DNA聚合酶最适反应温度(72℃左右),DNA聚合酶沿着磷酸到五碳糖(5'-3')的方向合成互补链。
本发明所述的mRNA为信使RNA,是由DNA的一条链作为模板转录而来的、携带遗传信息能指导蛋白质合成的一类单链核糖核酸。
本发明所述的AFM是指原子力显微镜,是一种具有原子级高分辨的新型仪器,可以在大气和液体环境下对各种材料和样品进行纳米区域的物理性质包括形貌进行探测,或者直接进行纳米操纵。
实施例一、运用基于分子分类器的系统检测呼吸系统感染类型
(1)分类器构建模块
使用公开的基因表达数据通过机器学习训练计算机线性分类模型。用基于急性呼吸系统疾病的病人基因测序数据库(GSE6269,GSE42026,GSE40396,GSE20346,GSE42834,GSE60244),筛选病毒与细菌感染相关特征信使RNA(mRNA)标志物,使用支持向量机分类模型,对所筛选的特征信使RNA(mRNA)组合进行优化并赋予权重,得到分类数学公式:结果=特征1×权重1+特征2×权重2+特征3×权重3+……+特征n×权重n。所筛选的特征mRNA由SIGLEC1、JUND、LY6E、RPS21、TRDV3、MPRS18B、IFIT1、EXOC7、VNN1、APRC3、LAPTM4B、CD177、KIAA1324、CYP27A1、ARG1中的几种组合而成,其中部分特征mRNA高表达提示可能是细菌感染,部分特征mRNA高表达提示可能是病毒感染,部分特征mRNA高表达提示可能是非感染疾病。
在一个包含7个特征mRNA的最优组合中,SIGLEC1、LY6E、TRDV3、IFIT1高表达提示可能是病毒感染,VNN1、CD177、ARG1高表达提示可能是细菌感染,训练获得分类机器学习模型,其数学计算公式为:结果=M(SEQ ID NO:1)×(-4)+M(SEQ ID NO:2)×(-4)+M(SEQ IDNO:3)×(-1)+M(SEQ ID NO:4)×(-1)+M(SEQ ID NO:5)×(5)+M(SEQ ID NO:6)×(4)+M(SEQ ID NO:7)×(1),其中,M为基因表达水平。特征mRNA序列见序列表SEQ ID NO:1至SEQID NO:7。
(2)样本处理模块
获取全血样本,从所述全血样本中通过试剂盒提取mRNA。
(3)分子分类器处理模块
针对每一个筛选获得的特征mRNA,设计不对称PCR引物,将特征mRNA转为单链DNA,基于引物设计的特异性实现不同特征mRNA的线性扩增,将每一个特征mRNA线性放大并转化为单链DNA。以上述7个最优特征mRNA组合为例,所设计的不对称PCR引物如表1所示:
表1
Figure BDA0003014266140000081
Figure BDA0003014266140000091
把分子计算的加、减、乘法的运算分子精确修饰在DNA纳米芯片(60nm x 90nm)的表面,如图1所示,当芯片接触到经线性放大后的样本后,会开展自动的计算(加法、减法和乘法),最终通过报告不同颜色的荧光来实现疾病样本类型的区分。
基于DNA链置换反应实现模型计算公式中的乘法运算:在每个转化的单链DNA序列中选择一个或多个区域,区域的个数与该特征mRNA的权重值的绝对值相对应。针对每个区域设计杂交探针,如图2A所示,经过一步DNA链置换反应后,一个单链DNA可以置换出一条或多条单链DNA,实现乘法运算。
基于DNA链置换反应实现模型计算公式中的加法运算:设计两组杂交探针,如图2B所示,通过一步DNA链置换反应,分别对权重值为正数的特征mRNA乘法结果和权重值为负数的特征mRNA乘法结果累加,获得两个加法和(“正和”和“负和”)。
基于DNA链置换反应实现模型计算公式中的减法运算:设计一种减法探针,如图2C所示,通过将上述两个加法和同时与减法探针杂交,将其中一个加法和完全消耗尽,只留下绝对值较大的一个加法和,实现减法运算,只保留两个加法和中的一个。
(4)结果报告模块
基于DNA链置换反应的循环信号放大和报告:设计一组放大探针,如图3所示,将剩下的一个加法和进行扩增放大。再分别设计针对两个加法和的两种荧光报告探针,两个加法和中任意一个经过减法、信号放大后,可以与荧光报告探针杂交反应,释放荧光信号。两种荧光信号分别代表一种分类结果。所述荧光,可以是任意FAM、Alexa Fluor、VIC、HEX、Cy3、ROX等常用荧光标记的任意两种。
实施例二、检测验证
(1)不对称引物设计与比例分析
采用Taqman探针法检测不同引物比例下各浓度mRNA扩增得到的单链DNA产物量。如图4所示,在正向引物:反向引物为50:1的条件下,在50个循环时,扩增后单链DNA量与mRNA浓度的对数呈线性放大关系。PCR扩增反应条件为:95℃预变性5min;变性、退火、延伸(95℃,10s;60℃、10s,72℃,20s)×50个循环;最后72℃,延伸5min。
(2)在DNA纳米芯片上的反应结果
将不同浓度的探针E(经过加法后释放的探针为E)样本分别置于溶液中及DNA纳米芯片上进行链置换反应,所得结果如图5所示,其中图5A为在溶液中的反应结果,图5B为在DNA纳米芯片上的反应结果。可见,在DNA纳米芯片上,荧光值与样本浓度成正比,说明在DNA纳米芯片上和溶液中的反应结果具有一致性。如图6所示为未修饰的DNA纳米芯片(图6A)和修饰DNA计算探针的DNA纳米芯片(图6B)的AFM表征。
(3)基于链置换反应的DNA分子计算的分步验证
将合成的探针加入反应后的DNA中,在37℃反应1小时,实时监测反应体系中荧光信号的变化,验证DNA分子计算的乘法、加法及减法。加入探针的浓度及反应条件见表2。如图7可见荧光值反映了分子乘法和加法运算结果;加入FAM和ROX荧光报告探针分别报告减法计算反应后的正负两个加法和的输出结果,如图8可见荧光值反映了分子减法运算结果及信号放大结果,即权重求和更高的加法和产生更高的荧光信号。
表2
Figure BDA0003014266140000101
Figure BDA0003014266140000111
(4)样本检测结果
利用本申请基于分子分类器的呼吸系统疾病感染类型的检测系统检测10个新鲜全血样本,提取样本中mRNA,加入SEQ ID NO:8至SEQ ID NO:21所示的引物,将mRNA转化为单链DNA,根据公式:结果=M(SEQ ID NO:1)×(-4)+M(SEQ ID NO:2)×(-4)+M(SEQ ID NO:3)×(-1)+M(SEQ ID NO:4)×(-1)+M(SEQ ID NO:5)×(5)+M(SEQ ID NO:6)×(4)+M(SEQID NO:7)×(1),添加DNA计算探针以及荧光报告探针(探针具体序列见表3),从而得到病毒和细菌分类结果。如图9所示,蓝色值更大的为病毒感染,黄色值更大的为细菌感染。
Figure BDA0003014266140000112
Figure BDA0003014266140000121
Figure BDA0003014266140000131
以上对本申请实施例所提供的一种一种基于分子分类器的样本分类系统、试剂盒、方法及应用进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
序列表
<110> 上海交通大学医学院附属仁济医院
<120> 基于分子分类器的呼吸系统感染类型的检测试剂盒和系统
<141> 2021-03-04
<160> 37
<170> SIPOSequenceListing 1.0
<210> 1
<211> 5130
<212> DNA
<213> Homo sapiens
<400> 1
atgggcttct tgcccaagct tctcctcctg gcctcattct tcccagcagg ccaggcctca 60
tggggcgtct ccagtcccca ggacgtgcag ggtgtgaagg ggtcttgcct gcttatcccc 120
tgcatcttca gcttccctgc cgacgtggag gtgcccgacg gcatcacggc catctggtac 180
tacgactact cgggccagcg gcaggtggtg agccactcgg cggaccccaa gctggtggag 240
gcccgcttcc gcggccgcac cgagttcatg gggaaccccg agcacagggt gtgcaacctg 300
ctgctgaagg acctgcagcc cgaggactct ggttcctaca acttccgctt cgagatcagt 360
gaggtcaacc gctggtcaga tgtgaaaggc accttggtca cagtaacaga ggagcccagg 420
gtgcccacca ttgcctcccc ggtggagctt ctcgagggca cagaggtgga cttcaactgc 480
tccactccct acgtatgcct gcaggagcag gtcagactgc agtggcaagg ccaggaccct 540
gctcgctctg tcaccttcaa cagccagaag tttgagccca ccggcgtcgg ccacctggag 600
accctccaca tggccatgtc ctggcaggac cacggccgga tcctgcgctg ccagctctcc 660
gtggccaatc acagggctca gagcgagatt cacctccaag tgaagtatgc ccccaagggt 720
gtgaagatcc tcctcagccc ctcggggagg aacatccttc caggtgagct ggtcacactc 780
acctgccagg tgaacagcag ctaccctgca gtcagttcca ttaagtggct caaggatggg 840
gtacgcctcc aaaccaagac tggtgtgctg cacctgcccc aggcagcctg gagcgatgct 900
ggcgtctaca cctgccaagc tgagaacggc gtgggctctt tggtctcacc ccccatcagc 960
ctccacatct tcatggctga ggtccaggtg agcccagcag gtcccatcct ggagaaccag 1020
acagtgacac tagtctgcaa cacacccaat gaggcaccca gtgatctccg ctacagctgg 1080
tacaagaacc atgtcctgct ggaggatgcc cactcccata ccctccggct gcacttggcc 1140
actagggctg atactggctt ctacttctgt gaggtgcaga acgtccatgg cagcgagcgc 1200
tcgggccctg tcagcgtggt agtcaaccac ccgcctctca ctccagtcct gacagccttc 1260
ctggagaccc aggcgggact tgtgggcatc cttcactgct ctgtggtcag tgagcccctg 1320
gccacactgg tgctgtcaca tgggggtcat atcctggcct ccacctccgg ggacagtgat 1380
cacagcccac gcttcagtgg tacctctggt cccaactccc tgcgcctgga gatccgagac 1440
ctggaggaaa ctgacagtgg ggagtacaag tgctcagcca ccaactccct tggaaatgca 1500
acctccaccc tggacttcca tgccaatgcc gcccgtctcc tcatcagccc ggcagccgag 1560
gtggtggaag gacaggcagt gacactgagc tgcagaagcg gcctaagccc cacacctgat 1620
gcccgcttct cctggtacct gaatggagcc ctgcttcacg agggtcccgg cagcagcctc 1680
ctgctccccg cggcctccag cactgacgcc ggctcatacc actgccgggc ccgggacggc 1740
cacagtgcca gtggcccctc ttcgccagct gttctcactg tgctctaccc ccctcgacaa 1800
ccaacattca ccaccaggct ggaccttgat gccgctgggg ccggggctgg acggcgaggc 1860
ctccttttgt gccgtgtgga cagcgacccc cccgccaggc tgcagctgct ccacaaggac 1920
cgtgttgtgg ccacttccct gccatcaggg ggtggctgca gcacctgtgg gggctgttcc 1980
ccacgcatga aggtcaccaa agcccccaac ttgctgcgtg tggagattca caaccctttg 2040
ctggaagagg agggcttgta cctctgtgag gccagcaatg ccctgggcaa cgcctccacc 2100
tcagccacct tcaatggcca ggccactgtc ctggccattg caccatcaca cacacttcag 2160
gagggcacag aagccaactt gacttgcaac gtgagccggg aagctgctgg cagccctgct 2220
aacttctcct ggttccgaaa tggggtgctg tgggcccagg gtcccctgga gaccgtgaca 2280
ctgctgcccg tggccagaac tgatgctgcc ctttacgcct gccgcatcct gactgaggct 2340
ggtgcccagc tctccactcc cgtgctcctg agtgtactct atcccccgga ccgtccaaag 2400
ctgtcagccc tcctagacat gggccagggc cacatggctc tgttcatctg cactgtggac 2460
agccgccccc tggccttgct ggccttgttc catggggagc acctcctggc caccagcctg 2520
ggtccccagg tcccatccca tggtcggttc caggctaaag ctgaggccaa ctccctgaag 2580
ttagaggtcc gagaactggg ccttggggac tctggcagct accgctgtga ggccacaaat 2640
gttcttggat catccaacac ctcactcttc ttccaggtcc gaggagcctg ggtccaggtg 2700
tcaccatcac ctgagctcca agagggccag gctgtggtcc tgagctgcca ggtacacaca 2760
ggagtcccag aggggacctc atatcgttgg tatcgggatg gccagcccct ccaggagtcg 2820
acctcggcca cgctccgctt tgcagccata actttgacac aagctggggc ctatcattgc 2880
caagcccagg ccccaggctc agccaccacg agcctagctg cacccatcag cctccacgtg 2940
tcctatgccc cacgccacgt cacactcact accctgatgg acacaggccc tggacgactg 3000
ggcctcctcc tgtgccgtgt ggacagtgac cctccggccc agctgcggct gctccacggg 3060
gatcgccttg tggcctccac cctacaaggt gtggggggac ccgaaggcag ctctcccagg 3120
ctgcatgtgg ctgtggcccc caacacactg cgtctggaga tccacggggc tatgctggag 3180
gatgagggtg tctatatctg tgaggcctcc aacaccctgg gccaggcctc ggcctcagct 3240
gacttcgacg ctcaagctgt gaatgtgcag gtgtggcccg gggctaccgt gcgggagggg 3300
cagctggtga acctgacctg ccttgtgtgg accactcacc cggcccagct cacctacaca 3360
tggtaccagg atgggcagca gcgcctggat gcccactcca tccccctgcc caacgtcaca 3420
gtcagggatg ccacctccta ccgctgcggt gtgggccccc ctggtcgggc accccgcctc 3480
tccagaccta tcaccttgga cgtcctctac gcgccccgca acctgcgcct gacctacctc 3540
ctggagagcc atggcgggca gctggccctg gtactgtgca ctgtggacag ccgcccgccc 3600
gcccagctgg ccctcagcca cgccggtcgc ctcttggcct cctcgacagc agcctctgtc 3660
cccaacaccc tgcgcctgga gctgcgaggg ccacagccca gggatgaggg tttctacagc 3720
tgctctgccc gcagccctct gggccaggcc aacacgtccc tggagctgcg gctggagggt 3780
gtgcgggtga tcctggctcc ggaggctgcc gtgcctgaag gtgcccccat cacagtgacc 3840
tgtgcggacc ctgctgccca cgcacccaca ctctatactt ggtaccacaa cggtcgttgg 3900
ctgcaggagg gtccagctgc ctcactctca ttcctggtgg ccacgcgggc tcatgcaggc 3960
gcctactctt gccaggccca ggatgcccag ggcacccgca gctcccgtcc tgctgccctg 4020
caagtcctct atgcccctca ggacgctgtc ctgtcctcct tccgggactc cagggccaga 4080
tccatggctg tgatacagtg cactgtggac agtgagccac ctgctgagct ggccctatct 4140
catgatggca aggtgctggc cacgagcagc ggggtccaca gcttggcatc agggacaggc 4200
catgtccagg tggcccgaaa cgccctacgg ctgcaggtgc aagatgtgcc tgcaggtgat 4260
gacacctatg tttgcacagc ccaaaacttg ctgggctcaa tcagcaccat cgggcggttg 4320
caggtagaag gtgcacgcgt ggtggcagag cctggcctgg acgtgcctga gggcgctgcc 4380
ctgaacctca gctgccgcct cctgggtggc cctgggcctg tgggcaactc cacctttgca 4440
tggttctgga atgaccggcg gctgcacgcg gagcctgtgc ccactctcgc cttcacccac 4500
gtggctcgtg ctcaagctgg gatgtaccac tgcctggctg agctccccac tggggctgct 4560
gcctctgctc cagtcatgct ccgtgtgctc taccctccca agacgcccac catgatggtc 4620
ttcgtggagc ctgagggtgg cctccggggc atcctggatt gccgagtgga cagcgagccg 4680
ctcgccagcc tgactctcca ccttggcagt cgactggtgg cctccagtca gccccagggt 4740
gctcctgcag agccacacat ccatgtcctg gcttccccca atgccctgag ggtggacatc 4800
gaggcgctga ggcccagcga ccaaggggaa tacatctgtt ctgcctcaaa tgtcctgggc 4860
tctgcctcta cctccaccta ctttggggtc agagccctgc accgcctgca tcagttccag 4920
cagctgctct gggtcctggg actgctggtg ggcctcctgc tcctgctgtt gggcctgggg 4980
gcctgctaca cctggagaag gaggcgtgtt tgtaagcaga gcatgggcga gaattcggtg 5040
gagatggctt ttcagaaaga gaccacgcag ctcattgatc ctgatgcagc cacatgtgag 5100
acctcaacct gtgccccacc cctgggctga 5130
<210> 2
<211> 396
<212> DNA
<213> Homo sapiens
<400> 2
atgaagatct tcttgccagt gctgctggct gcccttctgg gtgtggagcg agccagctcg 60
ctgatgtgct tctcctgctt gaaccagaag agcaatctgt actgcctgaa gccgaccatc 120
tgctccgacc aggacaacta ctgcgtgact gtgtctgcta gtgccggcat tgggaatctc 180
gtgacatttg gccacagcct gagcaagacc tgttccccgg cctgccccat cccagaaggc 240
gtcaatgttg gtgtggcttc catgggcatc agctgctgcc agagctttct gtgcaatttc 300
agtgcggccg atggcgggct gcgggcaagc gtcaccctgc tgggtgccgg gctgctgctg 360
agcctgctgc cggccctgct gcggtttggc ccctga 396
<210> 3
<211> 425
<212> DNA
<213> Homo sapiens
<400> 3
tctttcatta gaaccgtcag atagtctctg agatcttagg aaccctgttt tgttgtatat 60
cctctgccct gatatgaaga aaagatgatt cttactgtgg gctttagctt tttgtttttc 120
tacaggggca cgctgtgtga caaagtaacc cagagttccc cggaccagac ggtggcgagt 180
ggcagtgagg tggtactgct ctgcacttac gacactgtat attcaaatcc agatttattc 240
tggtaccgga taaggccaga ttattccttt cagtttgtct tttatgggga taacagcaga 300
tcagaaggtg cagattttac tcaaggacgg ttttctgtga aacacattct gacccagaaa 360
gcctttcact tggtgatctc tccagtaagg actgaagaca gtgccactta ctactgtgcc 420
tttag 425
<210> 4
<211> 1344
<212> DNA
<213> Homo sapiens
<400> 4
atgcctgatt tagaaaacag agtcttggat cagattgaat tcctagacac caaatacagt 60
gtgggaatac acaacctact agcctatgtg aaacacctga aaggccagaa tgaggaagcc 120
ctgaagagct taaaagaagc tgaaaactta atgcaggaag aacatgacaa ccaagcaaat 180
gtgaggagtc tggtgacctg gggcaacttt gcctggatgt attaccacat gggcagactg 240
gcagaagccc agacttacct ggacaaggtg gagaacattt gcaagaagct ttcaaatccc 300
ttccgctata gaatggagtg tccagaaata gactgtgagg aaggatgggc cttgctgaag 360
tgtggaggaa aaaattatga acgggccaag gcctgctttg aaaaggtgct tgaagtggac 420
cctgaaaacc ctgaatccag cgctgggtat gcgatctctg cctatcgcct ggatggcttt 480
aaattagcca caaaaaatca caagccattt tctttgcttc ccctaaggca ggctgtccgc 540
ttaaatccag acaatggata tattaaggtt ctccttgccc tgaagcttca ggatgaagga 600
caggaagctg aaggagaaaa gtacattgaa gaagctctag ccaacatgtc ctcacagacc 660
tatgtctttc gatatgcagc caagttttac cgaagaaaag gctctgtgga taaagctctt 720
gagttattaa aaaaggcctt gcaggaaaca cccacttctg tcttactgca tcaccagata 780
gggctttgct acaaggcaca aatgatccaa atcaaggagg ctacaaaagg gcagcctaga 840
gggcagaaca gagaaaagct agacaaaatg ataagatcag ccatatttca ttttgaatct 900
gcagtggaaa aaaagcccac atttgaggtg gctcatctag acctggcaag aatgtatata 960
gaagcaggca atcacagaaa agctgaagag aattttcaaa aattgttatg catgaaacca 1020
gtggtagaag aaacaatgca agacatacat ttccactatg gtcggtttca ggaatttcaa 1080
aagaaatctg acgtcaatgc aattatccat tatttaaaag ctataaaaat agaacaggca 1140
tcattaacaa gggataaaag tatcaattct ttgaagaaat tggttttaag gaaacttcgg 1200
agaaaggcat tagatctgga aagcttgagc ctccttgggt tcgtctacaa attggaagga 1260
aatatgaatg aagccctgga gtactatgag cgggccctga gactggctgc tgactttgag 1320
aactctgtga gacaaggtcc ttag 1344
<210> 5
<211> 1542
<212> DNA
<213> Homo sapiens
<400> 5
atgactactc agttgccagc ttacgtggca attttgcttt tctatgtctc aagagccagc 60
tgccaggaca ctttcactgc agctgtttat gagcatgcag cgatattgcc caatgccacc 120
ctaacaccag tgtctcgtga ggaggctttg gcattaatga atcggaatct ggacattttg 180
gaaggagcga tcacatcagc agcagatcag ggtgcgcata ttattgtgac tccagaagat 240
gctatttatg gctggaactt caacagggac tctctctacc catatttgga ggacatccca 300
gaccctgaag taaactggat cccctgtaat aatcgtaaca gatttggcca gaccccagta 360
caagaaagac tcagctgcct ggccaagaac aactctatct atgttgtggc aaatattggg 420
gacaagaagc catgcgatac cagtgatcct cagtgtcccc ctgatggccg ttaccaatac 480
aacactgatg tggtatttga ttctcaagga aaactggtgg cacgctacca taagcaaaac 540
cttttcatgg gtgaaaatca attcaatgta cccaaggagc ctgagattgt gactttcaat 600
accacctttg gaagttttgg cattttcaca tgctttgata tactcttcca tgatcctgct 660
gttaccttgg tgaaagattt ccacgtggac accatagtat tcccaacagc ttggatgaat 720
gttttgccac atttgtcagc tgttgaattc cactcagctt gggctatggg catgagggtc 780
aatttccttg catccaacat acattacccc tcaaagaaaa tgacaggaag tggcatctat 840
gcacccaatt cttcaagagc atttcattat gatatgaaga cagaagaggg aaaactcctc 900
ctctcgcaac tggattccca cccatcccat tctgcagtgg tgaactggac ttcctatgcc 960
agcagtatag aagcgctctc atcaggaaac aaggaattta aaggcactgt ctttttcgat 1020
gaattcactt ttgtgaagct cacaggagtt gcaggaaatt atacagtttg tcagaaagat 1080
ctctgctgtc atttaagcta caaaatgtct gagaacatac caaatgaagt gtacgctcta 1140
ggggcatttg acggactgca cactgtggaa gggcgctatt atctacagat ttgtaccctg 1200
ttgaaatgta aaacgactaa tttaaacact tgcggtgact cagctgaaac agcttctacc 1260
aggtttgaaa tgttctccct cagtggcact ttcggaaccc agtatgtctt tcctgaggtg 1320
ttgctgagtg aaaatcagct tgcacctgga gaatttcagg tgtcaactga cggacgcttg 1380
tttagtctga agccaacatc cggacctgtc ttaacagtaa ctctgtttgg gaggttgtat 1440
gagaaggact gggcatcaaa tgcttcatca ggcctcacag cacaagcaag aataataatg 1500
ctaatagtta tagcacctat tgtatgctca ttaagttggt ag 1542
<210> 6
<211> 1314
<212> DNA
<213> Homo sapiens
<400> 6
atgagcgcgg tattactgct ggccctcctg gggttcatcc tcccactgcc aggagtgcag 60
gcgctgctct gccagtttgg gacagttcag catgtgtgga aggtgtccga cctgccccgg 120
caatggaccc ctaagaacac cagctgcgac agcggcttgg ggtgccagga cacgttgatg 180
ctcattgaga gcggacccca agtgagcctg gtgctctcca agggctgcac ggaggccaag 240
gaccaggagc cccgcgtcac tgagcaccgg atgggccccg gcctctccct gatctcctac 300
accttcgtgt gccgccagga ggacttctgc aacaacctcg ttaactccct cccgctttgg 360
gccccacagc ccccagcaga cccaggatcc ttgaggtgcc cagtctgctt gtctatggaa 420
ggctgtctgg aggggacaac agaagagatc tgccccaagg ggaccacaca ctgttatgat 480
ggcctcctca ggctcagggg aggaggcatc ttctccaatc tgagagtcca gggatgcatg 540
ccccagccag tttgcaacct gctcaatggg acacaggaaa ttgggcccgt gggtatgact 600
gagaactgcg atatgaaaga ttttctgacc tgtcatcggg ggaccaccat tatgacacac 660
ggaaacttgg ctcaagaacc cactgattgg accacatcga ataccgagat gtgcgaggtg 720
gggcaggtgt gtcaggagac gctgctgctc ctagatgtag gactcacatc aaccctggtg 780
gggacaaaag gctgcagcac tgttggggct caaaattccc agaagaccac catccactca 840
gcccctcctg gggtgcttgt ggcctcctat acccacttct gctcctcgga cctgtgcaat 900
agtgccagca gcagcagcgt tctgctgaac tccctccctc ctcaagctgc ccctgtccca 960
ggagaccggc agtgtcctac ctgtgtgcag ccccttggaa cctgttcaag tggctccccc 1020
cgaatgacct gccccagggg cgccactcat tgttatgatg ggtacattca tctctcagga 1080
ggtgggctgt ccaccaaaat gagcattcag ggctgcgtgg cccaaccttc cagcttcttg 1140
ttgaaccaca ccagacaaat cgggatcttc tctgcgcgtg agaagcgtga tgtgcagcct 1200
cctgcctctc agcatgaggg aggtggggct gagggcctgg agtctctcac ttggggggtg 1260
gggctggcac tggccccagc gctgtggtgg ggagtggttt gcccttcctg ctaa 1314
<210> 7
<211> 993
<212> DNA
<213> Homo sapiens
<400> 7
atgagcgcca agtccagaac catagggatt attggagctc ctttctcaaa gggacagcca 60
cgaggagggg tggaagaagg ccctacagta ttgagaaagg ctggtctgct tgagaaactt 120
aaagaacaag taactcaaaa ctttttaatt ttagagtgtg atgtgaagga ttatggggac 180
ctgccctttg ctgacatccc taatgacagt ccctttcaaa ttgtgaagaa tccaaggtct 240
gtgggaaaag caagcgagca gctggctggc aaggtggcag aagtcaagaa gaacggaaga 300
atcagcctgg tgctgggcgg agaccacagt ttggcaattg gaagcatctc tggccatgcc 360
agggtccacc ctgatcttgg agtcatctgg gtggatgctc acactgatat caacactcca 420
ctgacaacca caagtggaaa cttgcatgga caacctgtat ctttcctcct gaaggaacta 480
aaaggaaaga ttcccgatgt gccaggattc tcctgggtga ctccctgtat atctgccaag 540
gatattgtgt atattggctt gagagacgtg gaccctgggg aacactacat tttgaaaact 600
ctaggcatta aatacttttc aatgactgaa gtggacagac taggaattgg caaggtgatg 660
gaagaaacac tcagctatct actaggaaga aagaaaaggc caattcatct aagttttgat 720
gttgacggac tggacccatc tttcacacca gctactggca caccagtcgt gggaggtctg 780
acatacagag aaggtctcta catcacagaa gaaatctaca aaacagggct actctcagga 840
ttagatataa tggaagtgaa cccatccctg gggaagacac cagaagaagt aactcgaaca 900
gtgaacacag cagttgcaat aaccttggct tgtttcggac ttgctcggga gggtaatcac 960
aagcctattg actaccttaa cccacctaag taa 993
<210> 8
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 8
tgcctctacc tccacctact t 21
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 9
gcccatgctc tgcttacaaa 20
<210> 10
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 10
atctgtactg cctgaagcc 19
<210> 11
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 11
ggaagccaca ccaacattga c 21
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 12
tgctctgcac ttacgacact 20
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 13
tgaggtgagt gaggtagagg 20
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 14
atgggccttg ctgaagtgtg 20
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 15
tcagggtttt cagggtccac 20
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 16
aagccatgcg ataccagtga 20
<210> 17
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 17
tgccaaaact tccaaaggtg g 21
<210> 18
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 18
ccacaccaga caaatcgg 18
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 19
gcaggaaggg caaaccactc 20
<210> 20
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 20
tggacagact aggaattggc a 21
<210> 21
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 21
ccagtccgtc aacatcaaaa ct 22
<210> 22
<211> 26
<212> DNA
<213> Artificial Sequence
<400> 22
gggtgtagag gtggaggtgg atagat 26
<210> 23
<211> 38
<212> DNA
<213> Artificial Sequence
<400> 23
acaaccactt acttcttcat ctatccacct ccacctct 38
<210> 24
<211> 26
<212> DNA
<213> Artificial Sequence
<400> 24
tagtgatgag gtgagtgagg tagagg 26
<210> 25
<211> 38
<212> DNA
<213> Artificial Sequence
<400> 25
cctcactcac ctcatcacta ctatcatcac acatctat 38
<210> 26
<211> 36
<212> DNA
<213> Artificial Sequence
<400> 26
ctatcatcac acatctatac aaccacttac ttcttc 36
<210> 27
<211> 52
<212> DNA
<213> Artificial Sequence
<400> 27
ggatagatga agaagtaagt ggttgtatag atgtgtgatg atagtagtga tg 52
<210> 28
<211> 30
<212> DNA
<213> Artificial Sequence
<400> 28
atagatgaag aagtaagtgg ttgttgagat 30
<210> 29
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 29
catccaatca catacatctc aacaaccact tacttcttc 39
<210> 30
<211> 30
<212> DNA
<213> Artificial Sequence
<400> 30
tacataatag atgtgtgatg atagtagtga 30
<210> 31
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 31
ctatcatcac acatctatta tgtacataac acaatcaca 39
<210> 32
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 32
tctcaacaac cacttacttc ttc 23
<210> 33
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 33
ctatcatcac acatctatta tgt 23
<210> 34
<211> 15
<212> DNA
<213> Artificial Sequence
<400> 34
catccaatca catac 15
<210> 35
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 35
tgagatgtat gtgattggat g 21
<210> 36
<211> 15
<212> DNA
<213> Artificial Sequence
<400> 36
cataacacaa tcaca 15
<210> 37
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 37
tgtgattgtg ttatgtacat a 21

Claims (12)

1.一种基于分子分类器的样本分类系统,其特征在于,所述系统包括分类器构建模块、样本处理模块、分子分类器处理模块和结果报告模块,其中,
所述分类器构建模块,通过机器学习训练筛选输入样本的特征mRNA,并基于所述特征mRNA构建数学运算模型;
所述样本处理模块,从离体的全血样本中提取总RNA;
所述分子分类器处理模块,设计不对称引物,将所述特征mRNA线性放大并转化为单链DNA,设计计算探针,基于所述数学运算模型构建DNA链置换反应体系,在DNA纳米芯片上实现所述数学运算模型中的数学运算;
所述结果报告模块,将基于DNA链置换反应的循环信号放大后,与荧光报告探针杂交反应,释放荧光信号,输出分类结果。
2.根据权利要求1所述的系统,其特征在于,所述数学运算模型为赋予所述特征mRNA以权重值,通过累加所述特征mRNA表达量与所述权重值的乘积获得单个输出数值。
3.根据权利要求1所述的系统,其特征在于,所述样本处理模块中,所述全血样本中通过TRIZOL法或试剂盒提取总RNA。
4.根据权利要求1所述的系统,其特征在于,所述分子分类器处理模块中,把所述计算探针修饰在所述DNA纳米芯片的表面,将经线性放大后的样本与所述DNA纳米芯片接触,实现所述数学运算。
5.根据权利要求4所述的系统,其特征在于,所述分子分类器处理模块中,分别对权重值为正数的特征mRNA乘法结果和权重值为负数的特征mRNA乘法结果累加,获得两个加法和后进行减法运算,保留绝对值较大的一个加法和。
6.根据权利要求1所述的系统,其特征在于,所述荧光报告探针的荧光标记为FAM、Alexa Fluor、VIC、HEX、Cy3、ROX中的任意两种。
7.一种基于分子分类器的样本分类试剂盒,其特征在于,所述试剂盒包括不对称引物、mRNA提取试剂、计算探针、DNA纳米芯片、荧光报告探针,其中所述计算探针包括:乘法探针、加法探针以及减法探针。
8.根据权利要求7所述的试剂盒,其特征在于,利用所述计算探针进行数学运算的步骤包括:加入所述乘法探针,经过一步DNA链置换反应实现乘法运算,加入所述加法探针,分别对权重值为正数的特征mRNA乘法结果和权重值为负数的特征mRNA乘法结果累加,获得两个加法和,利用所述减法探针,进行减法运算,保留绝对值较大的一个加法和。
9.根据权利要求7所述的试剂盒,其特征在于,所述试剂盒能够特异性检测如下一种或多种mRNA的表达量:SIGLEC1、JUND、LY6E、RPS21、TRDV3、MPRS18B、IFIT1、EXOC7、VNN1、APRC3、LAPTM4B、CD177、KIAA1324、CYP27A1、或ARG1。
10.根据权利要求7所述的试剂盒,其特征在于,所述不对称引物包括如下所述的PCR引物对:
(a)SEQ ID NO:8和SEQ ID NO:9所示的引物;
(b)SEQ ID NO:10和SEQ ID NO:11所示的引物;
(c)SEQ ID NO:12和SEQ ID NO:13所示的引物;
(d)SEQ ID NO:14和SEQ ID NO:15所示的引物;
(e)SEQ ID NO:16和SEQ ID NO:17所示的引物;
(f)SEQ ID NO:18和SEQ ID NO:19所示的引物;和/或
(g)SEQ ID NO:20和SEQ ID NO:21所示的引物。
11.一种基于分子分类器的样本分类方法,其特征在于,所述方法包括:
通过机器学习训练筛选输入样本的特征mRNA,并基于所述特征mRNA构建数学运算模型;
获取全血样本,从所述全血样本中通过TRIZOL法或试剂盒提取总RNA;
设计不对称引物,将所述特征mRNA线性放大并转化为单链DNA,设计计算探针,把所述计算探针修饰在所述DNA纳米芯片的表面,经过DNA链置换反应实现所述数学运算;
将基于DNA链置换反应的循环信号放大后,与荧光报告探针杂交反应,释放荧光信号,输出分类结果,不同荧光信号分别代表不同的分类结果,其中,所述荧光为FAM、AlexaFluor、VIC、HEX、Cy3、ROX中的任意两种。
12.一种如权利要求1-6所述的系统在呼吸系统感染类型分类中的应用。
CN202110384489.7A 2021-04-09 2021-04-09 基于分子分类器的样本分类系统、试剂盒、方法及应用 Active CN113012762B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110384489.7A CN113012762B (zh) 2021-04-09 2021-04-09 基于分子分类器的样本分类系统、试剂盒、方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110384489.7A CN113012762B (zh) 2021-04-09 2021-04-09 基于分子分类器的样本分类系统、试剂盒、方法及应用

Publications (2)

Publication Number Publication Date
CN113012762A true CN113012762A (zh) 2021-06-22
CN113012762B CN113012762B (zh) 2023-06-16

Family

ID=76388458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110384489.7A Active CN113012762B (zh) 2021-04-09 2021-04-09 基于分子分类器的样本分类系统、试剂盒、方法及应用

Country Status (1)

Country Link
CN (1) CN113012762B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114250224A (zh) * 2021-12-16 2022-03-29 福建和瑞基因科技有限公司 一种用于提取或检测样本中小分子rna的核酸组合物及其试剂盒和方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1118800A (ja) * 1997-07-04 1999-01-26 Takara Shuzo Co Ltd ラットチトクロームp−450分子種分別定量用キット
CN107488711A (zh) * 2017-07-27 2017-12-19 北京宏微特斯生物科技有限公司 点突变的基因型检测的方法及其试剂盒
CN111954720A (zh) * 2018-01-12 2020-11-17 克拉雷特生物科学有限责任公司 用于分析核酸的方法和组合物

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1118800A (ja) * 1997-07-04 1999-01-26 Takara Shuzo Co Ltd ラットチトクロームp−450分子種分別定量用キット
CN107488711A (zh) * 2017-07-27 2017-12-19 北京宏微特斯生物科技有限公司 点突变的基因型检测的方法及其试剂盒
CN111954720A (zh) * 2018-01-12 2020-11-17 克拉雷特生物科学有限责任公司 用于分析核酸的方法和组合物

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MICHEL A. SALMON: "Rapid and homogenous detection of Apple stem pitting virus by RT-PCR and a fluorogenic 3", 《SPRINGER》 *
MICHEL A. SALMON: "Rapid and homogenous detection of Apple stem pitting virus by RT-PCR and a fluorogenic 3", 《SPRINGER》, 15 December 2002 (2002-12-15), pages 755 - 762 *
任伟成: "荧光实时定量PCR技术及其在水产养殖研究中的应用", 《海洋水产研究》 *
任伟成: "荧光实时定量PCR技术及其在水产养殖研究中的应用", 《海洋水产研究》, 15 December 2007 (2007-12-15), pages 97 - 103 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114250224A (zh) * 2021-12-16 2022-03-29 福建和瑞基因科技有限公司 一种用于提取或检测样本中小分子rna的核酸组合物及其试剂盒和方法
CN114250224B (zh) * 2021-12-16 2024-02-27 福建和瑞基因科技有限公司 一种用于提取或检测样本中小分子rna的核酸组合物及其试剂盒和方法

Also Published As

Publication number Publication date
CN113012762B (zh) 2023-06-16

Similar Documents

Publication Publication Date Title
AU2017200433B2 (en) Multivariate diagnostic assays and methods for using same
Ehricht et al. Optimized DNA microarray assay allows detection and genotyping of single PCR-amplifiable target copies
CN105339503B (zh) 用于个人表观基因组学的至天然染色质的转座
Wilson et al. Amplification protocols introduce systematic but reproducible errors into gene expression studies
JP2003527867A (ja) ポリヌクレオチド配列改変のマイクロアレイベースの分析
US7732138B2 (en) Rapid genotyping analysis and the device thereof
WO2011001496A1 (ja) 検体解析方法およびそれに用いるアッセイキット
US20070148690A1 (en) Analysis of gene expression profiles using sequential hybridization
JP2004313181A (ja) 感染症起炎菌検出用プローブ及びプローブセット、ならびに担体及び遺伝子検査方法
JP2005502346A (ja) 核酸配列の非特異的ハイブリダイゼーションをブロックするための方法
JP5128941B2 (ja) 標的特異的コンポマー及び使用法
EP1721991B1 (en) Method of detecting nucleic acid and utilization thereof
Spoto et al. Detection of non-amplified genomic DNA
JP2022145606A (ja) 核酸の正確な並行定量のための高感度な方法
CN113012762B (zh) 基于分子分类器的样本分类系统、试剂盒、方法及应用
Singh Genomic techniques used to investigate the human gut microbiota
Hager [7] Making and Using Spotted DNA Microarrays in an Academic Core Laboratory
JP2016535596A (ja) オリゴヌクレオチドを用いた生体分子分析方法及び装置
Möller et al. Electrical DNA-chip-based identification of different species of the genus Kitasatospora
CN106414775A (zh) 用于宏基因组生物标志检测的组合物和方法
WO2021039777A1 (ja) 関節リウマチを検査する方法
Zhang et al. Oligonucleotide microarray for HLA‐DRB1 genotyping: preparation and clinical evaluation
JP2004532034A (ja) 遺伝子発現分析システムでコントロールとして使用するための人工遺伝子のデザイン
JPH0690798A (ja) 黄色ブドウ球菌検出用プローブ及び検出方法
Dahlhausen Future veterinary diagnostics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant