CN113853657A - 用于检测对生物测定的抑制的系统和方法 - Google Patents

用于检测对生物测定的抑制的系统和方法 Download PDF

Info

Publication number
CN113853657A
CN113853657A CN202080035535.6A CN202080035535A CN113853657A CN 113853657 A CN113853657 A CN 113853657A CN 202080035535 A CN202080035535 A CN 202080035535A CN 113853657 A CN113853657 A CN 113853657A
Authority
CN
China
Prior art keywords
nucleic acid
sample
machine learning
data set
acid amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080035535.6A
Other languages
English (en)
Inventor
维尔弗雷多·多明格斯-努内兹
拉杰·拉贾戈帕尔
尼古拉斯·A·阿森多夫
萨贝·塔格维扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
3M Innovative Properties Co
Original Assignee
3M Innovative Properties Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 3M Innovative Properties Co filed Critical 3M Innovative Properties Co
Publication of CN113853657A publication Critical patent/CN113853657A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/142Toxicological screening, e.g. expression profiles which identify toxicity

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

在一些示例中,用于检测对生物测定的抑制的系统包括被配置为扩增和检测靶核酸的检测设备。该检测设备被配置为接收包含基质和一定量的靶核酸的样本,并且在核酸扩增循环中扩增该样本内的该靶核酸。该检测设备被配置为捕获包括在扩增循环期间收集的核酸的测量结果的数据集。该系统还包括计算设备,该计算设备被配置为接收该数据集并且将机器学习系统应用于该数据集以检测由于基质抑制而被测试为所述靶核酸阴性的受抑制生物测定。

Description

用于检测对生物测定的抑制的系统和方法
技术领域
本公开涉及用于检测对生物测定的抑制的系统和方法,并且具体地涉及用于检测生物测定是否被抑制的系统和方法。
背景技术
食源性细菌感染和食源性疾病持续对公共卫生造成威胁。监管机构(诸如美国农业部食品安全检验局)通过发布针对食品、饲料、水和相应加工环境中的病原体(例如,沙门氏菌属(Salmonella)和弯曲杆菌属(Campylobacter))的病原体减少性能标准来应对该威胁。
食品、饲料和水的生产者使用定量技术和/或定性技术测定食品、饲料(例如动物饲料)、水和相应加工环境中的微生物(诸如细菌病原体)的量和/或存在。此类生产者可例如对总细菌和指示细菌进行定量,以评估病原体干预过程(诸如基于危害分析与关键控制点(HACCP)的食品安全程序以及其他卫生控制措施)的有效性。这些相同的生产者可以在该过程的其他时间点对靶生物体进行阈值测试,从而发出样本被测试为靶生物体阳性还是阴性的指示。
通常,寻求测定病原体数量的人依赖于定量的传统方法,诸如基于连续培养稀释的最大可能数(MPN)估计值。此类方法通常是耗时、繁琐且容易出错的。另一方面,使用报道分子(诸如生物发光或荧光)的生物测定(诸如DNA/RNA扩增)用于确定样本被测试为靶生物体阳性还是阴性。
发明内容
本公开提供了用于检测对生物测定(例如,食品、饲料、水或相应环境样本的特定样本)的抑制的系统,该生物测定被评估以使用核酸扩增测定来检测一种或多种靶生物体的存在以及/或者对一种或多种靶生物体进行定量。本公开还提供了用于训练机器学习系统以检测被抑制的生物测定并且发出指示生物测定是否被抑制的结果的系统和方法。
一种用于检测对生物测定的抑制的示例性系统包括检测设备,所述检测设备被配置为在所述生物测定期间扩增和检测与靶生物体相关联的靶核酸,所述检测设备包括反应室,所述反应室被配置为接收包含基质和一定量的所述靶核酸的样本并且在核酸扩增循环中扩增所述样本内的所述靶核酸;和检测器,所述检测器被配置为在核酸扩增循环期间捕获代表样本中存在的靶核酸的量的测量结果,并且将所述测量结果存储在数据集中。所述检测设备还包括被配置为接收所述数据集的机器学习系统,其中所述机器学习系统包括处理电路,其经训练以检测由于基质抑制而受抑制的生物测定。
在一个示例中,方法包括接收多个数据集,其中每个数据集与生物测定相关联,每个数据集包括在相关联的生物测定内检测到的靶核酸的测量结果,这些测量结果是由指定类型的核酸扩增设备执行相关联的生物测定所获得的并且在核酸扩增循环的至少一部分内收集,其中靶核酸与靶生物体相关联。该方法还包括将来自所述多个数据集的与由于基质抑制而被测试为靶核酸阴性以及如果不存在基质抑制则将被测试为阳性的生物测定相关联的那些数据集标记为假阴性数据集,并且将来自所述多个数据集的与被正确地测试为靶核酸阴性的生物测定相关联的那些数据集标记为真阴性数据集。该方法还包括用真阴性数据集和假阴性数据集训练机器学习系统,以检测由于基质抑制而被测试为靶核酸阴性的生物测定。
一种存储指令的示例性非暂态计算机可读介质,所述指令在被处理电路执行时,使得所述处理电路接收数据集,所述数据集是通过在核酸扩增循环中扩增和检测与包含基质和一定量的靶核酸的样本中的靶生物体相关联的所述靶核酸而生成的,所述数据集包括代表样本中存在的靶核酸的量的测量结果,以及将所述测量结果存储在数据集中,其中所述数据集包括;以及将机器学习系统应用于所述数据集。训练机器学习技术,以检测受抑制的生物测定,并且发出指示生物测定是否由于基质抑制而被测试为靶核酸阴性的结果。
一种示例性非暂态计算机可读介质存储下述指令:这些指令在被处理电路执行时,使得所述处理电路建立经训练以检测受基质抑制的生物测定的机器学习系统;接收数据集,所述数据集是通过在核酸扩增循环中扩增和检测与包含基质和一定量的靶核酸的样本中的靶生物体相关联的所述靶核酸而生成的,所述数据集包括代表所述样本中存在的所述靶核酸的量的测量结果;通过将所述机器学习系统应用于所述数据集来确定所述数据集是否来自受基质抑制的样本;以及相应地标记数据集。
因此,在本文所述的系统和方法中,可以使用机器学习系统(诸如支持向量机、增强型决策树、系统和/或其他系统)来收集和分析由生物测定产生的数据。这种数据可以用于训练和构建用于特定病原体和/或基质的机器学习系统。用一个或多个适当的数据集训练的机器学习系统可以在分子诊断测定(例如,qPCR和/或LAMP)中检查信号响应的大部分或全部。用适当的数据集训练的此类机器学习系统可以检查基于核酸的分子诊断测定的背景响应,并且计算背景信号对应于使得测定不能产生阳性反应(即,被抑制)的基质的概率。相对于不包括应用此类受过训练的机器学习系统的分子方法,使得能够识别假阴性结果可以有助于提高在食品生产期间使用的病原体干预过程的有效性。
在附图和下文的描述中将示出一个或多个示例的细节。根据说明书和附图以及权利要求书,本公开的其他特征、目标和优点将显而易见。
附图说明
图1是展示根据本公开的多个方面的示例性系统的框图,该示例性系统包括被配置为扩增和检测靶核酸的核酸扩增设备,以及被配置为从核酸扩增设备接收数据并且将机器学习系统应用于该数据的用户设备。
图2是示出根据本公开的一个方面的示例性系统的框图,该系统包括诸如服务器的外部设备,以及经由网络耦接到图1的核酸扩增设备的接入点。
图3是示出根据本公开的一个方面的图1的示例性用户设备的示意性概念图。
图4是展示根据本公开的一个方面的在食品、饲料或水的生产之前、期间和/或之后用于病原体测试的示例点的流程图。
图5A是展示根据本公开的一个方面的用于估计样本中的靶生物体的量的示例性技术的流程图。
图5B是展示根据本公开的一个方面的用于检测对生物测定的抑制的示例性技术的流程图。
图6示出了根据本公开的一个方面的基于生物发光强度随时间的测量结果的LAMP扩增循环期间核酸扩增的实时检测。
图7是示出根据本公开的一个方面的示例性qPCR技术的代表性特征的示意图。
图8A是展示根据本公开的多个方面的用于训练机器学习系统的示例性方法的流程图。
图8B是展示根据本公开的多个方面的使用图8A的受过训练的机器学习系统来估计靶生物体的量的示例性方法的流程图。
图9展示了根据本公开的一个方面的来自示例性病原体检测系统的测试结果,这些测试结果指示测定出错、测定受抑制却有效,以及测定有效。
图10A和图10B是展示使用被测试为靶生物体阴性的数据集来训练机器学习系统检测受抑制的生物测定的示例性技术的流程图。
图10C是展示根据本公开的一个方面的使用受过训练的机器学习系统来检测受抑制的生物测定的示例性技术的流程图。
图11是展示根据本公开的一个方面的设备训练系统的框图。
图12展示了根据本公开的一个方面的由示例性病原体检测系统产生的环境样本的分析报告。
图13展示了根据本公开的一个方面的工作流程,该工作流程描绘了对图12的分析报告中所示的样本应用基质控制和稀释。
图14展示了根据本公开的一个方面的将受过训练的双类决策森林算法应用于数据集集合的结果。
图15展示了根据本公开的一个方面的将受过训练的双类决策森林算法应用于训练数据集的结果。
图16展示了根据本公开的一个方面的数据集集合的示例,其中每个数据集由代表在一个或多个核酸扩增循环期间随时间推移的光强度的曲线表示,每条曲线对应于一个样本。
图17展示了根据本公开的一个方面的将图10A至图10C的受过训练的机器学习技术(例如,根据图10A的示例性技术训练)应用于图16的数据集的结果。
图18展示了根据本公开的一个方面的由示例性病原体检测系统产生的针对从与已知是抑制性的基质成分相关联的样本取得的数据集集合的分析报告。
图19展示了根据本公开的一个方面的将受过训练的机器学习系统应用于图18的数据集的结果。
图20展示了根据本公开的一个方面的受过训练的机器学习系统对质量保证(QA)实验室阴性对照运行的数据集的示例性应用。
图21展示了数据集集合的示例,其中每个数据集由代表在一个或多个核酸扩增循环期间随时间推移的光强度的曲线表示,每条曲线对应于已知包含导致假阴性结果的抑制性基质的样本。
图22展示了根据本公开的一个方面的受过训练的机器学习系统(例如,根据图10C的示例性技术训练)对图21的数据集的示例性应用。
图23至图25展示了根据本公开的一个方面的机器学习系统对来自包含6,7-二羟基香豆素的样本的数据集的应用。
具体实施方式
分子方法越来越多地用于检测样本中靶生物体的存在和数量。基于诸如核酸扩增(例如,LAMP或PCR)的分子方法的测定是高效的。然而,它们可受到基质衍生物质的存在的影响,该基质衍生物质可干扰或阻止反应正确地进行,这一过程称为抑制。在食品生产中,基质衍生物质(诸如香料和环境样本)可充当可干扰核苷酸扩增测定(诸如PCR和LAMP)的抑制剂,从而导致假阴性结果。
可能难以消除抑制。小心的样本处理可用于例如移除抑制物质。然而,不能依赖样本处理来完全移除抑制物质。
扩增对照也可用于控制抑制。此类对照可用于例如验证测定是否已正确执行。通常,内部扩增对照(IAC)是存在于与样本或靶核酸提取物完全相同的反应中的非靶DNA序列。如果其被成功地扩增以产生信号,则认为反应中靶信号的任何不产生表示样本不包含靶病原体或生物体。然而,如果反应既不产生来自靶的信号也不产生来自IAC的信号,则其表示反应已失败,这表明当事实上靶生物体存在时不存在靶生物体(即,“假阴性”)。因此,在扩增循环期间检测假阴性对于可靠的测试可能是关键的。
扩增对照的添加增加了分子方法的复杂性和成本。当应用分子方法检测或定量样本中的靶生物体时,甚至在面对抑制的情况下,消除扩增对照的使用将是有利的。因此,下文给出了用于检测受抑制样本中的假阴性的方法。这些方法可以例如用于检测核苷酸扩增中的假阴性,而无需内部扩增对照或外部扩增对照。
在以下讨论中,术语“食品”还包括饮料。术语“水”包括饮用水,但术语“水”也包括在需要对水中的一种或多种微生物进行检测或定量测量的其他情况下使用的水。
如上文所指出的,食品、饲料和水的生产者使用定量技术和/或定性技术测定食品、饲料(例如动物饲料)、水和相应加工环境中的微生物(诸如细菌病原体)的量和/或存在。定量技术用于例如评估在食品生产期间使用的病原体干预过程的有效性。此类分析可导致更有效的风险分析,并导致开发更有效的方式来降低食品、饲料和水供应中病原体的水平。
分子方法(例如LAMP或PCR)可以用于检测样本中靶生物体的存在和数量。这些方法常规地用于检测病原体的存在/不存在(定性),并且比传统的基于培养的方法(3天至5天)更快地提供结果(1天)。如下文所讨论的,此类方法也可以用于定量从样本中提取的病原体。病原体定量的分子方法比更传统的方法更快地提供结果(例如,在数小时内而不是一天或更多天)。这些方法不限于对总细菌和指示细菌进行定量,而且还可以用于对特定的细菌、酵母、霉菌或其他病原体进行定量。
分子方法的优点在于,在给定的适当条件下,扩增以能够预测的速率发生。例如,qPCR被广泛用作检测多种细菌的分子方法。qPCR也可用于对给定量的样本中存在的病原体进行绝对量化。包含已知量的靶DNA(质粒、基因组DNA或其他核酸分子)的标准曲线与未知样本平行运行。基于标准曲线、用于核酸提取和分析的反应效率和稀释步骤,可估计未知样本中病原体的绝对数目。在这些类型的分析中,使用线性回归模型,扩增效率变得关键,并且每次运行需要运行标准,从而增加成本、时间、可能的样本污染。此外,当使用细胞计数(而不是DNA)时,标准曲线方法的使用有限。出于这些原因,测定样本中的病原体数量的传统方法仍在使用。
然而,为了提高检测灵敏度,可能有利的是进行单靶检测而不是多分析物检测,因为试剂可能竞争,从而导致靶的不完全扩增并因此导致不准确的结果。一些新开发的技术(诸如LAMP)是稳健的,使用了简单的检测技术,从而允许使用更方便并且使得仪器更简单。
如下文所讨论的病原体检测包括定性和定量这两种检测。以下公开内容还描述了用于在病原体检测的分子方法中训练和使用机器学习系统,从而提高病原体检测和定量测定的准确性、减少或消除每次运行制备和使用标准曲线的需要的系统和方法。在本文所述的一些示例性方法中,LAMP生物发光测定和/或PCR测定(例如,qPCR测定)可用于训练运行中,以扩增以已知初始量存在于样本中的靶核酸(例如,与靶生物体相关联的核酸)并检测在靶核酸扩增期间在样本内生成的光。在本文所述的其他示例性方法中,可以在训练运行中使用诸如切口酶扩增反应(NEAR)、解旋酶依赖性扩增(HDA)、基于核酸序列的扩增(NASBA)或转录介导扩增(TMA)测定之类的测定来扩增样本中存在的已知初始量的靶核酸(例如,与靶生物体相关联的核酸),并且提供对应于已知初始量的靶生物体的扩增的测量结果。
可使用此类测定的任何合适的变型。可使用的传统LAMP测定的变型可包括比色LAMP(cLAMP)测定,其中经由观察随核酸扩增发生的pH敏感性比色染料的颜色变化,可使由LAMP期间质子积聚驱动的pH变化可视化。其他此类变型可包括浊度-LAMP测定,其中焦磷酸镁在LAMP期间的形成导致浊度,该浊度与核酸收率相关联地增加并且可实时定量。在传统LAMP测定和/或PCR测定的此类变型中使用的材料和方法可为本领域的技术人员所理解的,因此在此不再详细描述。应当理解,本文所述的示例性核酸扩增技术及其变型并非旨在进行限制。相反,任何合适的核酸扩增技术可用于本文所述的技术中,诸如在用于扩增靶核酸的训练运行中。
可将来自训练运行的数据馈送到机器学习系统中以训练机器学习系统。然后,可以使用受过训练的机器学习系统来检测靶生物体的存在/不存在以及/或者估计样本(诸如食品样本、饲料样本、水或者来自食品或饲料加工环境的环境样本)中存在的靶生物体的未知初始量。
在本文所述的示例性方法中,LAMP生物发光测定和/或PCR测定(例如qPCR测定)可以用于训练运行中,以扩增具有核酸扩增测定的已知抑制剂/基质的一系列样本中存在的靶核酸(例如,与靶生物体相关联的核酸)、使用样本的稀释来确定抑制,以及/或者使用内部或外部扩增对照。该方法收集每个样本的代表在靶核酸扩增期间在样本内生成的光的数据,并且将所收集的数据与靶生物体和/或已知量的靶核酸的存在/不存在相关联,或者与已知量的检测到的生物体相关联。
在本文所述的其他示例性方法中,LAMP生物发光测定和/或PCR测定(例如,qPCR测定)可用于扩增存在于具有已知初始量的靶生物体的一系列样本中的靶核酸(例如,与靶生物体相关联的核酸)的训练运行中。该方法收集每个样本的表示在靶核酸扩增期间在样本内生成的光的数据,并且将所收集的数据与已知量的靶核酸或与已知量的检测到的生物体相关联。
然后将来自训练运行的数据馈送到机器学习系统中以训练机器学习系统。然后可以使用受过训练的机器学习系统来确定样本(诸如食品样本、饲料样本、水或者来自食品或饲料加工环境的环境样本)中存在的靶生物体的抑制与否。
在本文所述的其他示例性方法中,LAMP生物发光测定和/或PCR测定(例如,qPCR测定)可用于获得对应于从特定环境(例如,家禽加工工厂或干酪工厂)收集的样本的数据。使用传统的存在/不存在方法和/或定量方法来审查样本,并且用经由一种或多种传统方法确定的值来标记每个样本。然后将来自标记样本的数据馈送到机器学习系统中,以针对该特定环境训练机器学习系统。然后,可以使用受过训练的机器学习系统来更好地确定样本(诸如食品样本、饲料样本、水或来自特定环境的环境样本)中存在的靶生物体和/或核酸的存在/不存在以及/或者估计所述靶生物体和/或核酸的未知初始量。
应当指出的是,虽然在一些示例中,与靶生物体相关联的核酸在本文中可被描述为DNA,但在其他示例中,与靶生物体相关联的核酸可为RNA。在此类其他示例中,在样本的总RNA或mRNA上的扩增技术(诸如定量逆转录PCR(RT-qPCR)和逆转录LAMP(RT-LAMP))可用于训练机器学习系统以估计样本中靶生物体的初始量的方法和/或用于应用此类受过训练的机器学习系统。
每个机器学习系统基于至少一个模型。该模型可以是基于诸如支持向量回归、随机森林回归、线性回归、岭回归、逻辑回归、拉索回归或最近邻回归的技术的回归模型。或者该模型可以是基于诸如支持向量机、决策树和随机森林、线性判别分析、神经网络、最近邻分类器、随机梯度下降分类器、高斯过程分类或原始贝叶斯的技术的分类模型。这两种类型的模型依赖于使用标记的数据集来训练模型。
来自食品、饲料、水和相应加工环境的样本可以包括基质,所述基质包括原料,诸如碳水化合物、脂质、蛋白质、色素、香料,以及/或者食品、饲料、水或获得样本的环境的其他组分。一些此类基质抑制或阻止靶核酸扩增,诸如通过阻止聚合酶在允许的时间内将核酸延伸,从而产生不完全的扩增产物并且妨碍靶生物体的准确检测和/或定量。该问题称为“基质抑制”。
在具有包含一种或多种抑制剂的基质的样本中,核酸扩增和检测测定可能提供假阴性结果,即使该样本确实包括应当导致检测到靶生物体的一定量的靶生物体。虽然稀释样本可以有助于缓解包含一种或多种抑制剂的基质的抑制作用,但如果样本中存在的核酸的初始量相对低,则稀释也可能引起与靶核酸相关联的信号损失。
因此,以下公开内容还描述了用于检测生物测定的基质抑制的系统和方法,以及用于训练和使用机器学习系统来检测生物测定的基质抑制的系统和方法。所述的系统和方法提高了病原体检测和定量的准确性(例如,通过减少或消除此类生物测定的假阴性结果的发生)。
在一些示例中,用于训练和使用机器学习系统来检测生物测定的基质抑制的系统和方法包括区分被正确地测试为靶核酸阴性的生物测定(即,“真阴性”生物测定)和由于基质抑制而被测试为靶核酸阴性但如果不存在基质抑制则将被测试为阳性的生物测定(即,“假阴性”生物测定)的系统和方法。这种方法可以减少或消除使用内部对照和/或外部对照与核酸扩增和检测方法来检测这种抑制的需要。在一些此类示例性方法中,专家审查在核酸扩增循环期间被识别为靶生物体阴性的生物测定,将每个生物测定标记为真阴性或假阴性。然后,使用在核酸扩增循环期间针对每个生物测定记录的测量结果来训练机器学习系统,以区分真正阴性的生物测定和如果没有基质抑制将被测试为阳性的那些生物测定。
如上文所指出的,食品样本、环境样本、血液、粪便样本中的基质可以包含阻止分析物扩增/结合的抑制剂。通常采用内部对照来监测抑制。在使用单一报道分子的测定和不能实现多重能力的测定中,可以使用外部对照来监测这种抑制。生物测定(诸如DNA/RNA扩增、免疫测定、使用报道分子诸如生物发光、荧光或比色法)通常具有固有背景。固有背景可以用于校准所述测定。在基于核酸的分子诊断测定中,报道分子信号的背景或基线部分可以是例如未结合的荧光探针、游离染料、探针裂解、对信号的基质干扰、仪器校准和其他因素的产物。因此,这些背景或基线信号通常从核酸扩增测定期间提供给用户的报道分子信号中减去或以其他方式被抑制,因为它们几乎不包含与靶生物体的检测或定量相关的信息。然而,在一些示例中,用于训练机器学习系统的系统和方法使用报道分子信号的固有背景和/或基线部分来检测基质抑制。
下文提供LAMP-生物发光测定的示例。LAMP-生物发光测定使用单一波长的生物发光,并且不允许多重能力。然而,所述测定具有固有的生物发光背景,并且在一些示例中,该背景用于训练机器学习系统来预测所述测定的基质抑制。这种方法提供了用于检测基质是否具有抑制作用并因此用于防止假阴性结果的机制。
因此,本文所述的系统和方法可以利用报道分子信号的原本未使用的固有背景或基线部分来训练和使用机器学习系统,以在可能无法使用抑制的内部对照的核酸扩增和检测技术中将受抑制的生物测定与未受抑制的生物测定区分开。例如,可以将来自一次或多次相应训练运行的一个或多个数据集馈送到机器学习系统中以训练该机器学习系统。在一些示例中,在此类训练运行中包括被确定为假阴性结果的样本和被正确地确定为阴性结果的样本可能就足够了。可能不需要用被确定为阳性结果的样本来训练该机器学习系统,这可以简化训练该机器学习系统的方法。在一些此类示例中,可以训练该机器学习系统以检测由于基质抑制而被测试为靶核酸阴性并且如果不存在基质抑制则将被测试为靶核酸阳性的生物测定。
然后,可以使用该受过训练的机器学习系统来检测受抑制的生物测定,并且发出指示生物测定是否由于基质抑制而被测试为靶核酸阴性的结果。与依赖于内部对照或外部对照来检测抑制的系统和方法相比,本文所述的示例性系统和方法可以通过使用报道分子信号的原本未使用的固有背景或基线部分来解决抑制检测的问题,这可以减少病原体检测或定量所需的成本和/或时间,以及/或者增加此类测定的通量。
图1是展示根据本公开的多个方面的示例性系统的框图,该示例性系统包括被配置为扩增和检测与靶生物体相关联的靶核酸的核酸扩增设备,以及被配置为从核酸扩增设备接收数据并且将机器学习系统应用于该数据的用户设备。根据本公开的一个方面,核酸扩增设备8被配置为扩增和检测靶核酸。核酸扩增设备8包括被配置为扩增靶核酸的反应室10。在一个示例性方法中,如图1所示,反应室10包括可经由热源(诸如Peltier系统)加热和/或冷却的块体12。如图1所示,块体12限定多个凹陷部14,该多个凹陷部中的每个凹陷部的尺寸可被设计为接收反应容器,该反应容器可以是被配置用于核酸扩增测定的任何合适的塑料管。核酸扩增设备8还包括检测器16和控制单元18。检测器16可被配置为在控制单元18的控制下捕获反应室10内的光。例如,检测器16可被配置为捕获数据集,该数据集包括在一个或多个核酸扩增循环期间由接收在凹陷部14中的一个凹陷部内的反应容器内包含的样本内的发光物质发射的光的时间序列测量样本。在一些示例中,样本可包含靶核酸和发光物质,后者可发射与靶核酸呈化学计量关系的光,使得由发光物质发射的光随着样本中复制的靶核酸的量的增加而增加。
在一些示例中,核酸扩增设备8可以是被配置用于LAMP(例如,传统LAMP测定或cLAMP、浊度LAMP或传统LAMP测定的其他变型)的任何合适的核酸扩增设备。在光由检测器16捕获的发光物质发射的示例中,光可以是生物发光、荧光或任何可见颜色的光。在使用浊度LAMP技术的示例中,检测器可测量吸光度、透射率或反射率中的至少一者。除此之外或另选地,核酸扩增设备8可以是被配置用于qPCR或任何其他核酸扩增技术(例如,NEAR、HDA、NASBA、TMA或其他)的任何合适的核酸扩增设备。在一些此类其他示例中,由发光物质发射并由检测器16捕获的光可为荧光。
在本文所述的用于训练机器学习系统的一些示例性方法中,核酸扩增设备8可以是指定类型的核酸扩增设备。例如,核酸扩增设备8可以包括一个或多个特定特征和/或可以是来自特定制造商的核酸扩增设备的特定模型。在一些此类示例中,由此类方法产生的受过训练的机器学习系统可针对指定类型的核酸扩增设备进行定制,这可增强受过训练的机器学习系统的准确性。可使用具有任何合适配置的核酸扩增设备。例如,核酸扩增设备可包括被配置为接收反应容器而不是块体的支架(例如,旋转支架)。在一些此类示例中,反应容器可以是毛细管或更常规配置的管。在一些示例中,核酸扩增设备的检测器16可以定位在反应容器上方或任何合适的位置。因此,本文所述的核酸扩增设备的配置并非旨在进行限制,而是示出示例。
图1的示例性系统还包括用户设备20,该用户设备可包括处理器23和用于存储表示一个或多个受过训练的机器学习系统25的参数的存储器22。在一个示例性方法中,用户设备20从控制单元18接收所测试的每个样本的数据集。在一些此类示例性方法中,每个数据集包括代表在给定样本的扩增循环期间由设备8捕获的报道分子信号的测量结果的数据。在一些示例性方法中,测量结果包括在给定样本的扩增循环期间的特定时间处由检测器16接收的光量的测量结果。如下面相对于图3进一步讨论的,用户设备20可以是诸如计算机工作站、平板电脑或在用户的实验室中与核酸扩增设备8协同定位的其他此类用户设备的设备。核酸扩增设备8可被配置为将数据集从控制单元18传输到用户设备20,诸如经由任何合适的有线连接(例如,金属迹线、光纤、以太网等)、无线连接(例如,个人局域网、局域网、城域网、广域网、基于云的系统等)或两者的组合。例如,用户设备20可包括通信单元,该通信单元包括网络接口卡诸如以太网卡、光收发器、射频收发器、
Figure BDA0003351051280000151
接口卡、WiFiTM无线电部件、USB或者可向/从核酸扩增设备8发送和接收信息的任何其他类型的设备。
在一些示例性方法中,处理器23可以被配置为将存储在存储器22中的受过训练的机器学习系统25应用于数据集,以检测受抑制的生物测定,并且发出指示生物测定是否由于基质抑制而被测试为靶核酸阴性的结果。除此之外或替代性地,处理器23可以被配置为将受过训练的机器学习系统(即,受过训练的学习系统25或者存储在存储器22中的另一个受过训练的机器学习系统)应用于数据集,以根据该数据集来估计生物测定中存在的靶生物体的量。在一些示例中,处理器23可以存储指示生物测定是否由于基质抑制而被测试为靶核酸阴性的结果和/或靶生物体的估计量,诸如与有关生物测定的其他数据相关联。在其中处理器23被配置为将受过训练的机器学习系统应用于数据集以估计靶生物体的量的示例中,可以将估计的量与极限测试中的对应阈值进行比较,以确定样本是通过了该极限测试还是未通过。在一些此类示例性方法中,阈值可以是与一个或多个监管标准、行业惯例或相关联的干预过程相关联的值。例如,样本中靶生物体的估计量可有助于使得能够评估设计用于提高过程效率和/或降低食品产品、饲料产品、水和/或相应制备环境中病原体水平的干预程序的有效性。
在其中处理器(例如处理器23)被配置为将受过训练的机器学习系统应用于与靶核酸的扩增样本相关联的数据集以估计样本中靶生物体的量的示例中,可以有助于解决与病原体相关联的公共卫生问题。例如,由于本文所述的用于核酸定量的系统和方法比用于病原体定量的传统方法提供更快的量值,因此此类系统和方法可使病原体定量更易于被食品工业获取。这种增加的可及性可被食品工业用于例如获得与简单地通过检测病原体的存在与否而获得相比对病原体存在的更细微的理解。增加的可及性还可用于支持病原体分析中的极限测试,因为极限测试的一个目标是检测满足或超过阈值浓度的食源性病原体浓度并限制可能不利地影响公共卫生的产品的释放。
这样,本文所述的系统和方法包括将受过训练的机器学习系统应用于与靶核酸的扩增样本相关联的数据集,以检测和/或定量受抑制的生物测定,并且发出指示生物测定是否由于基质抑制而被测试为靶核酸阴性的结果,可以有助于解决与病原体相关联的公共卫生问题。如本文所述检测由于基质抑制而受抑制的生物测定的假阴性结果(例如,不正确地指示靶核酸不存在或不以阈值水平存在的结果)可以有助于保护消费者健康,诸如通过限制消费者暴露于可能被污染的产品。
图2是展示根据本公开的一个方面的示例性系统6的框图,该系统包括外部设备28(诸如服务器),以及经由网络26耦接到图1的核酸扩增设备8的接入点24。在一个示例中,如图2所示,系统6可以包括接入点24、网络26以及一个或多个外部设备,诸如外部设备28(例如,服务器),该外部设备可以包括存储器32和/或处理电路30。在图2所示的该示例中,核酸扩增设备8可以使用用于经由无线连接与接入点24通信的通信电路系统(未示出)。接入点24然后将从核酸扩增设备8接收的信息经由有线连接通过网络26传送到外部设备28,并且将从外部设备28接收的信息经由无线连接通过网络26传送到核酸扩增设备8。
接入点24可包括经由多种连接(诸如电话拨号、数字用户线路(DSL)或电缆调制解调器或其他合适的连接)中的任一种连接到网络26的处理器。在其他示例中,接入点24可通过不同形式的连接(包括有线或无线连接)耦接到网络26。在一些示例中,接入点24可以是用户设备,诸如可以与核酸扩增设备8和用户协同定位的计算机工作站或平板电脑。核酸扩增设备8可以被配置为将数据传输到接入点24,诸如上文相对于图1所述的数据集。此外,接入点24可以询问核酸扩增设备8,诸如周期性地或者响应于来自用户或来自网络26的命令,以便检索与一个或多个生物测定有关的数据集或者检索在核酸扩增设备8的存储器(未示出)中存储的其他信息。接入点24然后可经由网络26将所检索的数据传送至外部设备28。
在一些示例中,外部设备28的存储器32可被配置为为从接入点24和/或核酸扩增设备8收集的数据提供安全存储位点。在一些示例中,存储器32存储表示一个或多个受过训练的机器学习系统35的参数。在一些示例中,外部设备28可将数据聚集在网页或其他文档中,以供用户经由接入点24或图2的系统的一个或多个其他计算设备查看。这样,图2的系统可实现与用户对食品或饲料产品和/或对应生产环境的测试相关联的数据的远程(例如,基于云的)存储和访问。此类系统可被定制为满足特定用户的数据存储和/或访问需要。
在一些示例中,外部设备28的存储器32可被配置为为从接入点24和/或核酸扩增设备8收集的数据提供安全存储位点。在一些示例中,外部设备28可以将数据聚集在网页或其他文档中,以供用户经由接入点24或者图2系统的一个或多个其他计算设备查看。这样,图2的系统可实现与用户对食品或饲料产品和/或对应生产环境的测试相关联的数据的远程(例如,基于云的)存储和访问。此类系统可被定制为满足特定用户的数据存储和/或访问需要。
图3是示出根据本公开的一个方面的图1的用户设备20的特征的示意性概念图。尽管相对于图1的用户设备20描述了图3,但本文所述的用户设备20的一个或多个部件可在功能和/或结构上类似于图2中所示的接入点24和/或外部设备28的一个或多个部件。在一个示例性方法中,用户设备20包括用户界面40和计算设备42。用户界面40可包括显示器38、图形用户界面(GUI)、键盘、触摸屏、扬声器、麦克风等。
计算设备42的一个或多个处理器23被配置为实现用于在计算设备42内执行的功能、处理指令或两者。例如,处理器23可以能够处理存储在存储器22内的指令,诸如用于将受过训练的机器学习系统应用于数据集以检测受抑制的生物测定并且发出指示生物测定是否由于基质抑制而被测试为靶核酸阴性的结果以及/或者将受过训练的机器学习系统应用于数据集以估计样本中存在的靶核酸或靶生物体的初始量的指令。一个或多个处理器23的示例可包括微处理器、控制器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或等效的分立或集成逻辑电路中的任何一者或多者。
在一些示例中,计算设备42可以利用一个或多个通信单元48经由一个或多个网络(诸如一个或多个有线或无线网络)与一个或多个外部设备(例如,图2的外部设备28和/或核酸扩增设备8)通信。通信单元48可包括网络接口卡,诸如以太网卡、光收发器、射频收发器或者被配置为发送和接收信息的任何其他类型的设备。通信单元48还可包括WiFiTM无线电部件或通用串行总线(USB)接口。
在一些示例中,计算设备42的一个或多个输出设备50可被配置为使用例如音频、视频或触觉介质向用户提供输出。例如,输出设备50可包括用户界面40的显示器38、声卡、视频图形适配器卡或者用于将信号(诸如与关于由受过训练的机器学习系统分析的核酸扩增设备8执行的扩增循环产生的一个或多个数据集的状态、结果或其他方面的信息相关联的信号)转换成人类或机器可理解的适当形式的任何其他类型的设备。在一些示例性方法中,用户界面40包括由计算设备42采用的输出设备50中的一个或多个输出设备。
计算设备42的存储器22可被配置为在操作期间将信息存储在计算设备42内。在一些示例中,存储器22可包括计算机可读存储介质或计算机可读存储设备。存储器22可包括临时存储器,这意味着存储器22的一个或多个部件的主要目的可能不一定是长期存储。存储器22可包括易失性存储器,这意味着存储器22在未向其提供电力时不保持存储的内容。易失性存储器的示例包括随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)以及本领域已知的其他形式的易失性存储器。在一些示例中,存储器22可以用于存储供处理器23执行的程序指令,诸如用于将受过训练的机器学习系统应用于经由一个或多个通信单元48从核酸扩增设备8接收的数据集的指令。在一些示例中,存储器22可由在计算设备42上运行的软件或应用使用以在程序执行期间暂时地存储信息。
在一些示例中,存储器22还可包括信号处理模块52、训练模块54和检测模块56。在一些此类示例中,检测模块56包括机器学习系统(诸如图1的机器学习系统25和图2的机器学习系统35),当被训练并且应用于数据集时,该机器学习系统检测受抑制的生物测定并且发出指示生物测定是否由于基质抑制而被测试为靶核酸阴性的结果以及/或者估计样本中的靶生物体的浓度。在一个此类示例性方法中,训练模块54接收由核酸扩增设备8在一个或多个扩增循环内收集的具有已知细胞浓度的测定的数据集,并使用该数据集来训练检测模块56以估计样本中靶生物体的浓度。
在一些示例中,存储器22可包括非易失性存储元件。此类非易失性存储元件的示例包括磁性硬盘、光盘、软盘、闪存或电可编程存储器(EPROM)或电可擦可编程(EEPROM)存储器的形式。在一个这样的示例性方法中,信号处理模块52可以被配置为分析从核酸扩增设备8接收的数据,诸如由检测器16捕获并且包括由扩增循环期间样本内的发光物质发射的光的时间序列测量结果样本的数据集,并且处理该数据以改善传感器数据的质量。
计算设备42还可包括为清楚起见在图3中未示出的附加部件。例如,计算设备42可包括用于向计算设备42的部件提供电力的电源。类似地,在计算设备42的每个示例中,图3所示的计算设备42的部件可以不是必需的。
图4是示出根据本公开的一个方面的在食品或饲料生产之前、期间和/或之后用于病原体测试的示例性点的流程图。如图4所示,食品生产环境60可包括原材料62。加工原材料62并生产最终产品66的食品生产过程64可在食品生产环境60内发生。在一些示例中,生产过程64可完全在食品生产环境60内发生,而原材料62可在图4所示的过程开始时从食品生产环境60的外部进入食品生产环境60。在一些示例中,食品生产环境60可以是收获食品或饲料材料的环境,诸如生长此类材料的温室或田地。在一些示例中,来自食品生产环境60的样本可以是来自食品生产环境60内的水源(诸如用于洗涤和/或烹饪的水源)的水样本。
原材料62可从食品生产环境60外部获取病原体,并且在原材料62被引入食品生产环境60时或之后将此类病原体引入食品生产环境60中。因此,为了帮助减少由病原体引起的食源性疾病,在原材料(例如原材料62)和食品生产环境(例如食品生产环境60)的病原体测试中存在增加的趋势。此外,原材料62的病原体测试可有助于通过在原材料进入食品生产环境60之前识别污染来防止最终产品66(或其他最终产品)的病原体污染,使得可避免污染的原材料进入食品生产环境60。
最终产品66可在装运出环境60之前,诸如在封装之前、期间和之后,在环境60内定位一段时间。最终产品66可从食品生产环境60或食品生产环境60内的其他来源获取病原体,诸如由原材料62引入的病原体。然而,如上文所讨论的,病原体检测和/或定量的传统方法可能相当耗时,需要一天或更多天来产生结果,并且病原体检测和/或定量的分子方法尚未获得广泛的应用。在一些情况下,传统方法所需的时间可能限制食品加工速率。此外,由于时间要求,此类传统方法仅提供与获取样本的时间一样的当前病原体评估,这可能不提供对材料、环境或产品的当前状态的准确评估。因此,至少由于本文所述的用于病原体检测、定量和/或抑制检测的分子方法的时间优势,根据此类方法对原材料62、食品生产环境和/或最终产品66进行病原体测试(例如,作为释放测试的一部分)(诸如在测试点68处)可以提供最新的评价,这最终可以有助于防止受污染的最终产品向公众释放。
图5A是展示根据本公开的一个方面的用于估计样本中的靶生物体的量的示例性技术的流程图。图5A的示例性方法可以使用核酸扩增设备(诸如图1和图2的系统的核酸扩增设备8)来执行。如上文结合图1所述,核酸扩增设备8可以是任何合适类型的核酸扩增设备,并且可被配置为执行任何合适的核酸扩增技术,诸如LAMP或PCR。虽然在图1的系统的上下文中进行了描述,但图5A的示例性技术可以使用任何合适的核酸扩增设备和计算设备来执行。用于估计样本中靶生物体的量的系统和方法在与本文一起提交的“使用核酸扩增测定对靶生物体进行机器学习定量(MACHINE LEARNING QUANTIFICATION OF TARGETORGANISMS USING NUCLEIC ACID AMPLIFICATION ASSAYS)”中进一步详细描述,该专利的说明书以引用方式并入本文。
在图5A的该示例性方法中,核酸扩增设备8扩增反应室10内的富集样本内的靶核酸(70)。在一些示例中,样本可以源自食品生产环境60、原材料62或最终产品66,如上文相对于图4所述。可以将从样本提取的核酸连同发射与靶核酸呈化学计量关系的光的发光物质一起置于反应容器(例如PCR管)内,该靶核酸可以是与靶生物体(例如,细菌属或细菌种)相关联的DNA序列。在一些示例中,样本可以是来源于食品或饲料原材料、最终产品、水或生产环境的样本的富集样本。例如,置于反应容器中的样本可以是来自源于初始样本的培养物的富集样本。在一些此类示例中,生物体的估计量可为生物体的估计初始量。在一些示例中,装有样本和发光物质的反应容器在本文中可以统称为“生物测定”。核酸扩增设备的检测器16捕获包括在一个或多个扩增循环中由发光物质发射的光的时间序列测量结果样本的数据集,并且将该数据集传输到用户设备20的计算设备42、接入点24的计算设备或任何其他合适的计算设备(72)。
在用户设备20的该示例中,处理器23、信号处理模块52和/或计算设备42的其他部件中的一者或多者可以将受过训练的机器学习系统应用于数据集,以估计样本中靶生物体的量(74)。在一些示例中,数据集可以包括与扩增循环的一个或多个不同部分或阶段(诸如在扩增循环上发射的光的峰值振幅之前、期间和/或之后的一个或多个部分或阶段)相关联的一个或多个数据子集。包括来自扩增循环的此类不同部分或阶段的数据子集可有助于受过训练的机器学习系统可估计样本中靶生物体的量的准确性,如下文相对于图11和图12进一步所述。
图5B是展示根据本公开的一个方面的用于检测受抑制的生物测定的示例性技术的流程图。图5B的示例性方法可以使用核酸扩增设备(诸如图1和图2的系统的核酸扩增设备8)来执行。如上文结合图1所述,核酸扩增设备8可以是任何合适类型的核酸扩增设备,并且可被配置为执行任何合适的核酸扩增技术,诸如LAMP或PCR。虽然在图1的系统的上下文中进行了描述,但图5B的示例性技术可以使用任何合适的核酸扩增设备和计算设备来执行。图5B中一般性展示的技术的更具体的方面和示例将在下文中相对于图10A至图10C进行描述。
在图5B的该示例性方法中,核酸扩增设备8扩增反应室10内的富集样本中的靶核酸,并且检测器16获得包括代表(80)的测量结果的数据集。在一些示例中,样本可来源于食品生产环境60、原材料62或最终产品66,如上文相对于图4所述。可以将从样本提取的核酸连同发射与靶核酸呈化学计量关系的光的发光物质一起置于反应容器(例如PCR管)内,该靶核酸可以是与靶生物体(例如,细菌属或细菌种)相关联的DNA序列。在一些示例中,样本可以是来源于食品或饲料原材料、最终产品、水或生产环境的样本的富集样本。例如,置于反应容器中的样本可以是来自源于初始样本的培养物的富集样本。
核酸扩增设备8的检测器16捕获包括在一个或多个扩增循环中由发光物质发射的光的时间序列测量结果样本的数据集,并且将该数据集传输到用户设备20的计算设备42、接入点24的计算设备或任何其他合适的计算设备(82)。在一些示例中,该数据集可以对应于扩增循环的特定部分或阶段,诸如发生在扩增循环的开始的初始部分或阶段,以及后续的阶段。在一些示例性核酸扩增技术(例如,LAMP技术)中,当核酸检测设备8加热至进行扩增循环的温度时,发光物质(诸如荧光素)可以发射光。
在用户设备20的该示例中,处理器23、信号处理模块52和/或计算设备42的其他部件中的一者或多者可以将受过训练的机器学习系统应用于数据集,以确定生物测定是由于基质抑制而被测试为靶核酸阴性但如果不存在基质抑制则将被测试为靶核酸阳性(84),还是真阴性。在一些示例中,该数据集可以与在生物测定的第一部分期间(例如,在生物测定的约前五分钟内)出现的背景或基线信号相关联,如下文相对于图8、图9及其他附图进一步所述。应当指出的是,描述了基于样本中的抑制性物质的抑制。所描述的技术可以应用于其他形式的抑制,以及应用于核酸扩增测定中样本错误分类的其他原因。
图6和图7是示出可以与本文所述的系统和方法一起使用的示例性核酸扩增技术的代表性特征的概念图。下文相对于图6描述示例性LAMP技术的技术方面,诸如到此类技术方面可能与到达图6的示例相关的程度。图7示出可用于本文所述的系统和方法的示例性qPCR技术的方面。下文相对于图7讨论示例性qPCR技术的技术方面,诸如到此类技术方面可能与到达图7的示例相关的程度。然而,应当理解,本文所述的系统和方法可以与任何合适的核酸扩增技术一起使用,并且不限于相对于图6和图7所述的具体示例。
LAMP使用链置换Bst DNA聚合酶和四至六个引物以在恒定温度下(即,在等温条件下)产生连续的DNA扩增。在LAMP技术中,通过在恒定温度(约65℃)处温育样本、引物、具有链置换活性的DNA聚合酶和底物的混合物,可以在单个步骤中完成靶核酸的扩增和检测。在一些示例中,LAMP可提供高扩增效率,其中DNA在15分钟-60分钟内扩增109次–1010次。由于其高特异性,扩增产物的存在可指示靶基因的存在。
在LAMP中,四种不同的引物识别模板(即,靶)DNA序列中的六个不同区域,并且两种环引物在LAMP期间识别相应单链环区域中的两个附加位点。识别靶DNA的六个不同区域的四种不同引物可包括正向内部引物(FIP)、正向外部引物(F3;aka FOP)、反向内部引物(BIP)和反向外部引物(B3;aka BOP)。两种环引物包括正向环引物(FLP)和反向环引物(BLP)。相比之下,PCR和qPCR各自使用非链置换Taq DNA聚合酶和两个相应的引物(正向引物和反向引物)来识别两个不同的区域。此外,qPCR使用对第三不同区域具有特异性的探针(例如,荧光发射分子信标探针、荧光发射水解探针、携带荧光发射探针元件的引物或包含荧光部分的另一种合适探针)。
两种环引物FL和BL可在LAMP期间结合至附加位点并加速反应。例如,含有与LAMP期间形成的哑铃状结构的5'端上的单链环区域(B1与B2区域之间或F1与F2区域之间)互补的序列的引物可在LAMP技术期间为DNA合成提供增加数量的起点。例如,包含六个环(未示出)的扩增产物可在LAMP期间形成。在不使用环引物FL和BL的示例性技术中,将不使用此类环中的六个中的四个。通过使用环引物,所有单链环均可用作DNA合成的起点,从而减少扩增时间。例如,用环引物扩增所需的时间可以是不使用环引物的示例中扩增所需的时间的约三分之一至约二分之一。在一些示例中,在使用环引物的情况下,扩增可在30分钟内实现。
图6示出了根据本公开的一个方面的基于生物发光强度随时间的测量结果的LAMP扩增循环期间核酸扩增的实时检测。在示例性LAMP技术中,等温DNA扩增释放焦磷酸盐(PPi)作为副产物。然后在存在腺苷5'-磷酸硫酸盐的情况下通过酶ATP-硫酸化酶将副产物PPi转化为腺苷三磷酸(ATP)。在一个此类示例性方法中,具有被分析靶核酸的样本的生物测定可适于包含荧光素酶及其底物荧光素,后者可用作本文所述的示例性系统和方法中的发光物质。由于ATP是荧光素酶与产生生物发光的荧光素反应的辅因子,所以在LAMP技术的扩增循环期间PPi向ATP的转化驱动生物发光的发射。生物发光的这种发射可通过被配置用于LAMP的核酸扩增设备的检测器(诸如图1和图2的核酸扩增设备8的检测器16)来检测,并且将表示生物发光的时间序列测量结果的数据存储为数据集。在一些示例中,用于在图6所示的LAMP技术期间生成光的机制可提供一个或多个其他益处,诸如使得能够实时检测在相对短的时间段(诸如约15分钟)内在LAMP扩增循环期间发生的核酸扩增。
在包含靶核酸的生物测定中由发光物质(例如,荧光素)发射的相对光单位(RLU)的时间序列测量结果在曲线90中示出。由不含靶核酸的对照中的发光物质(例如,荧光素)发射的相对光单位(RLU)的时间序列测量结果在基线曲线92中示出。如曲线90所示,在LAMP扩增循环期间靶核酸的指数扩增产生具有RLU快速增加和RLU快速降低两者的生物发光信号。曲线90的在峰值之前和/或之后的部分可以与光信号的背景或基线部分相关联,并且可以在本文所述的系统和方法中用于训练和使用机器学习系统来确定样本是否被基质抑制。在一些示例中,达到峰值RLU发射的时间对应于靶生物体的量。例如,相对较大量的靶生物体可产生较短的达到峰值RLU发射的时间。因此,曲线90的一个或多个方面(诸如达峰时间或振幅)可以用于训练机器学习系统,来估计其中可能期望对靶生物体进行定量的示例中的该靶生物体的量。
在一些示例中,用于训练机器学习系统(诸如系统)的数据集包括作为在整个扩增循环中所捕获的生物发光的一组时间序列测量结果样本被捕获的数据。在一个此类示例中,大约每5秒获取发光测量结果,其可作为跨扩增循环的10秒、15秒、20秒和/或25秒间隔处的测量结果累积以用于报告目的。
在一些示例性方法中,用于训练机器学习系统(诸如网络)的数据集包括在整个核酸扩增循环中获取的生物发光的时间序列测量结果样本。在其他示例性方法中,训练数据集包括在扩增循环的第一阶段94、扩增循环的第二阶段96和扩增循环的第三阶段98中的一者或多者期间取得的测量结果。在一些此类示例中,可训练机器学习系统以基于第一数据子集、第二数据子集和第三数据子集中的每个中的样本,基于在整个扩增循环内采集的样本的数据集或仅基于第二子集中的样本,来估计样本中存在的靶生物体的量。在一个此类示例性方法中,来自第二子集的样本包括在Tmax处获取的样本,其中Tmax是在核酸扩增循环期间检测到靶核酸的最大振幅的时间。同样,可大约每5秒采集一次样本,其可累积至跨扩增循环的约10秒、15秒、20秒和/或25秒的测量结果以用于报告目的。部分地基于不与峰值扩增相关联的数据子集训练机器学习系统可以提供比仅基于与峰值扩增相关联的一个或多个数据子集的训练更稳健的训练,这继而可以增强受过训练的机器学习系统准确地估计其中可能期望对靶生物体进行定量的示例中的该靶生物体的未知量的能力。
检测器(诸如核酸扩增设备8的检测器16)可以捕获包括在扩增循环期间由发光物质发射的光的时间序列测量结果样本的数据集(如曲线90所描绘),并且将该数据集传输到计算设备(例如,计算设备42)。在一些示例中,该数据集可以包括与曲线90的在峰值之前和/或之后的部分相关联的时间序列测量结果样本,这些部分可以与光信号的背景或基线部分相关联并且可以在本文所述的系统和方法中用于训练和使用机器学习系统来确定样本是否被基质抑制。这样,在相对于图6所述的LAMP技术期间用于产生光的机制可以使得用户能够以比通过稀释样本并且进行重新分析可以实现的准确度更高的准确度获得生物测定是否被抑制的指示,因为如果样本中存在的核酸的初始量相对低,则稀释可能引起与靶核酸相关联的信号损失。该机制还可以使得用户能够以比使用传统病原体定量方法可能实践的快得多的速度获得样本中的靶生物体的估计量。
在PCR中,DNA延伸限于每个热循环的特定时段(即,扩增循环)。在PCR中,抑制剂的存在可能阻止聚合酶在允许的时间内延伸DNA,这可能导致不完全的扩增产物并且可能增加由抑制性基质引起的抑制,从而妨碍靶生物体的检测。PCR的温度循环以及变性步骤期间聚合酶与DNA模板的缔合和解离为抑制剂提供了许多干扰的机会。与基于PCR和免疫测定的系统相比,在LAMP技术中抑制可能不太可能发生。另外,PCR可能更有可能受到一些食品样本和富集培养基的天然荧光的干扰。因此,在本文所述的系统和方法中使用LAMP技术可提供优于使用PCR技术的一种或多种有益效果。然而,如上文所讨论的,在其他示例中,结合本文所述的系统和方法使用PCR技术可以提供优于传统的病原体检测方法和/或定量方法的一种或多种有益效果。
图7示出了根据本公开的一个方面的基于荧光强度随时间的测量结果的跨多个PCR循环的示例性qPCR技术期间核酸扩增的检测。在一些此类示例中,发光物质可为荧光发射水解探针,诸如TaqMan水解探针(购自赛默飞世尔科技公司(Thermo FisherScientific))。在PCR期间,Taq聚合酶的5'-3'外切核酸酶活性在与互补靶DNA序列杂交期间将探针裂解成两部分100A和100B。水解探针的裂解产生荧光信号,在图7中由曲线102表示。
如曲线102所示,在包括多个扩增循环的PCR运行期间靶核酸的扩增产生荧光信号。曲线102可包括反映靶核酸扩增的对应部分或阶段的若干部分或阶段。例如,曲线102可以包括对应于扩增的起始阶段的第一部分,在该阶段期间荧光信号可以保持低于阈值。曲线102还可以包括对应于扩增的指数阶段的第二部分,在该阶段期间荧光超过阈值并且以指数方式增加。最后,曲线102可以包括对应于扩增的平台阶段的第三部分,在该阶段期间荧光保持高于阈值并且在附加的扩增循环中缓慢增加。类似于图6的示例性LAMP技术,曲线102的在指数阶段之前和/或之后的部分可以与光信号的背景或基线部分相关联,并且可以在本文所述的系统和方法中用于训练和使用机器学习系统来检测生物测定的基质抑制。
此外,并且与图6的示例性LAMP技术一样,可以训练机器学习系统,以基于对应于如上文所指出的荧光信号的第一阶段、第二阶段和第三阶段中的相应阶段的第一数据子集、第二数据子集和第三数据子集中的每一者来估计样本中存在的靶生物体的量。还可训练机器学习系统以基于在整个扩增循环内收集的荧光信号测量结果的数据集来估计样本中存在的靶生物体的量。部分地基于不与PCR运行的指数扩增阶段相关联的数据子集(例如,在扩增循环开始时产生的背景荧光)训练机器学习系统可以提供比仅基于与峰值扩增相关联的一个或多个数据子集(例如,至少包含指数阶段的子集)更稳健的训练,这继而可增强受过训练的机器学习系统准确估计未知量的靶生物体的能力。
图8A是展示根据本公开的多个方面的用于训练机器学习系统的示例性方法的流程图。在图8A的该示例性方法中,核酸扩增设备8(诸如图1或图2中所示)用于测试具有已知细胞浓度的靶生物体的测定,以获得每个测定的数据集(412)。这些测定可以来自培养物、来自基质(包括抑制性基质),或来自这两者。然后用反映由核酸扩增设备在每个相应阵列中检测到的靶生物体的量的量标记每个数据集(414)。然后系统6使用经标记的数据集来训练机器学习系统(416),以估计测定中的靶生物体的量。在一些示例性方法中,该方法还包括使用受过训练的机器学习系统来估计测定中的靶生物体的量(418)。在一些示例性方法中,与每个测定相关联的靶生物体的量基于样本的先验知识(例如,来自具有已知细胞浓度的样本)。因此,基于先验知识来标记每个数据集。在其他示例性方法中,与每个测定相关联的量基于样本的定量测试,诸如通过使用替代性的定量方法(诸如MPN),并且每个数据集基于由该替代性的定量方法提供的结果来标记。
在一些示例性方法中,使用高质量DNA和来自DNA扩增报告基因的单个响应值执行基于DNA的测定的量化。该响应值(通常为荧光或生物发光)可基于超过预设阈值的信号或基于峰值振幅值。在一些示例中,可能期望的是估计样本中靶生物体的不止一种菌株或菌种(例如属内)的初始量,因为此类菌株或菌种中的不止一种菌株或菌种可能是病原性的。
在一个示例性方法中,培养物制备包括用来自对应于每种菌株的琼脂平板的单一菌落接种10mL缓冲蛋白胨水(BPW,3M公司,圣保罗市(3M Company,St.Paul))(表1)。将接种的液体培养基在37℃下温育18小时。
表1:
Figure BDA0003351051280000291
1美国模式培养物保藏中心和TecraTM保藏中心。
为了计数,将培养物在Butterfields缓冲液中连续稀释,并按照生产商的说明铺板于3MTM品牌PetrifilmTM Aerobic Count(AC)平板(3M公司)(下文称为“Petrifilm AC平板”)上。将培养物保持在4℃-8℃下,直到获得平板计数结果。获得的计数用于使用3MTM品牌分子检测测定2–沙门氏菌属(Molecular Detection Assay 2–Salmonella)(3M公司)(下文称为“MDA2-Sal”)来估计用于检测的细胞数。在进行检测测定时,使用Petrifilm AC平板进行最终平板计数。这些最终平板计数用于报告细胞浓度。
在一个示例方法中,将每个菌株在Butterfield缓冲液中连续稀释至大约102个、103个、104个、105个和106个菌落形成单位(CFU)/毫升。使用MDA2-Sal按照制造商的说明分析来自每种稀释液的等分试样。然后使用3M公司提供的MDS软件来确定达峰时间-对靶序列扩增的响应。然后使用已知浓度的细胞的达峰时间的数据集来训练决策森林回归模型和增强型决策树模型。这两种方法产生大约0.75的确定系数。用于训练线性回归模型的相同数据集产生大约0.2912的确定系数R2。诸如支持向量回归、随机森林回归、岭回归、逻辑回归、拉索和最近邻回归的其他回归技术也可用于基于已知浓度的细胞的达峰时间的数据集来训练模型。
达峰时间响应并不总是细胞计数的最佳量度。不同的基质(即,除样本中的纯培养物之外的物质或食品样本中的分子组分)可妨碍达峰时间响应与实际细胞计数之间的良好一致性。沙门氏菌属菌株的细胞计数可以例如根据细胞所在的基质产生不同的达峰时间测量结果。例如,不同的达峰时间测量结果可以由鲑鱼基质对贝类基质中或其他此类基质中沙门氏菌属菌株的细胞特定计数引起。在一些示例性方法中,跨越核酸扩增循环随时间推移的参数(诸如光强度)的测量结果提供对初始细胞计数的更好表示。即便如此,可能有利的是训练具有不同基质的机器学习系统以更准确地估计特定基质内靶生物体的量。
在一些示例性方法中,每个数据集包括由检测器16在扩增循环期间检测到的光强度的时间序列测量样本。每个数据集标记有其相应测定的已知细胞浓度,然后标记的数据集用于训练机器学习系统25或35,如下文所详述。然后使用机器学习系统25或35来估计每次测定中靶生物体的量。在一些示例性方法中,针对每个基质或基质类型使用不同的数据集。表示干酪中的靶生物体的基质可用于例如训练机器学习系统25或35以用于在干酪工厂中定量靶生物体。
在一些示例性方法中,每个数据集包括在一个或多个扩增循环期间随时间推移进行的光强度测量结果。在一些此类示例性方法中,每个数据集包括跨整个扩增循环捕获的光强度的时间序列测量结果。在一些示例性方法中,此类数据集还包括在扩增循环开始时的时段期间进行的测量结果,其中数据通常不被核酸扩增设备8捕获、丢弃或以其他方式抑制。在一些示例性方法中,每个数据集包括在Tmax之前的第一时段中进行的光强度测量结果、在包括Tmax的第二时间段中进行的光强度测量结果以及在Tmax之后的第三时段中进行的光强度测量结果。
图8B是展示根据本公开的多个方面的使用图8A的受过训练的机器学习系统来估计靶生物体的量的示例性方法的流程图。在图8B的该示例性方法中,该方法包括接收基质的样本(422),诸如由实验室工作人员或自动化设备接收。基质可以是例如其中可以找到靶生物体的基质,诸如家禽淋洗液基质,或者食品产品的原材料的一部分或食品产品的最终产品。在接收到基质时,实验室工作人员或设备添加适当的富集培养基,该富集培养基被配置为使得含有靶生物体和基质的样本内的靶生物体能够生长至可检测限度(424)。在一些示例中,诸如其中PCR技术用于扩增靶核酸的示例,适当的富集培养基可具有比一种或多种其他适当的富集培养基(诸如通过相对于其他适当的培养基发射较少的背景荧光)更不可能干扰在PCR期间发射的荧光的特性。接下来,在一些示例性方法中,工作人员或设备制备所得富集溶液的1:10稀释液(426)。使用1:10稀释液可以增加受过训练的机器学习系统对靶生物体的特异性。可以使用其他合适的稀释液,诸如1:100或1:1000。在一些示例性方法中,稀释液的量将取决于系统特性,诸如靶向生物体的类型和特定扩增技术。
接下来,温育富集溶液内的样本以允许富集靶生物体(428)。在一些示例中,可将样本在约35℃-42℃下温育约4小时-24小时或者在可使靶生物体能够适当生长的任何其他合适的温度和时间段下温育。在其他示例中,可以不使用富集步骤,而是可以在不富集的情况下从样本中提取核酸。在温育(如果使用的话)之后,在一些示例方法中,经由扩增和检测与靶生物体相关联的靶核酸来分析样本(430)。例如,可以使用具有光检测器16(诸如购自美国明尼苏达州圣保罗市3M公司的分子检测系统(Molecular Detection System(MDS)))的核酸扩增设备8来扩增和检测靶核酸。例如,MDS可被配置为通过执行LAMP技术来扩增靶核酸,然后可使用检测器16检测由样本内的发光物质(例如,荧光素)发射的生物发光。通过将LAMP与生物发光检测相结合,核酸扩增设备(诸如MDS)可以使食源性病原体的分子检测更快更简单,从而使用户能够快速便捷地同时识别食品样本和/或环境样本中的一种或多种靶生物体(例如,沙门氏菌属、李斯特菌属(Listeria)、单核细胞增多性李斯特菌(Listeria monocytogenes)、大肠杆菌(E.coli)O157(包括H7)、弯曲杆菌属、克罗诺杆菌属(Cronobacter)和/或其他靶生物体中的一种或多种菌种或菌株)。在其他示例性方法中,使用不同的LAMP平台或者使用PCR平台或不同的核酸扩增平台来执行图8A和图8B的技术。
在一些示例性方法中,可抑制(例如,不记录)扩增循环早期(例如,在阶段94或阶段104之前)生成的光的振幅,以便不使用户混淆背景活性。然而,已经发现,此类信息可有助于训练机器学习系统。因此,在一个示例性方法中,数据集包括在图6中的阶段94之前进行的时间序列测量结果。在类似的示例性方法中,数据集包括在图7中的阶段104之前进行的时间序列测量结果。
在一些示例性方法中,标记的数据集通过专家检查已经对其进行核酸扩增的各个样本而产生。在一个此类示例性方法中,专家接收与样本相关联的数据集,确定样本中生物体和/或靶核酸的量(经由例如上述传统量化技术中的一种量化技术,诸如MPN),并且用确定的数值标记每个数据集。然后使用经标记的数据集来训练机器学习系统,如图8A所描绘。
在一些示例性方法中,数据集包括在整个扩增循环上以预定间隔(例如25秒)取得的时间序列测量结果。在其他示例性方法中,数据集包括选自扩增循环的某些阶段的数据。例如,数据集可包括来自图6中的阶段94、96和98中的一者或多者或来自图7中的阶段104、106和108中的一者或多者的数据。例如,在(430)包括LAMP技术的情况下,数据集可以包括一个或多个数据子集,如相对于图6所述。例如,数据集可包括:第一数据子集,表示在扩增循环中直至第一时间点发射的光的时间序列测量样本,第一时间点发生在扩增循环中发射的光的峰值振幅之前;第二数据子集,表示在扩增循环中的第一时间点之后但在第二时间点之前发射的光的时间序列测量样本,第二时间点发生在峰值振幅之后;以及第三数据子集,表示在扩增循环中的第二时间点之后发射的光的时间序列测量样本。然后计算设备(例如,图2的外部设备28的处理电路30,或任何其他合适的计算设备)训练机器学习系统,以预测感兴趣的靶生物体的初始浓度(即,量)(参见图8A)。
在一个示例中,该计算设备可以将数据集和/或该数据集的一个或多个子集用与相应数据集或数据子集相关联的生物测定内靶生物体的量的估计值来标记。然后,计算设备用标记的数据集(或数据子集)和/或基质标识训练机器学习系统,以估计样本内靶生物体的量,从而得到受过训练的模型。然后,计算设备可将受过训练的机器学习系统的参数存储到系统的一个或多个存储部件,诸如计算设备的存储器、用户设备20、接入点24的计算设备的存储器和/或任何其他合适的位置。
在与使用受过训练的机器学习系统来计算感兴趣的生物体的量相关联的工作流程技术中,图8B的技术包括以与收集数据集来训练机器学习系统时基本上相同的方式来执行步骤422至436。(422)处的基质可以是以下物质的样本:食品原材料、最终食品产品,或者可以包含感兴趣的靶生物体而非已知量的靶生物体的环境样本。在此类示例中,核酸扩增和检测系统(诸如MDS)或者被配置为在一个或多个扩增循环期间进行LAMP或PCR并且检测由发光物质发射的光的另一种系统可以捕获数据集,该数据集包括在扩增循环期间由发光物质发射的光的时间序列测量结果样本,并且分析该数据集(430)。然后基于受过训练的机器学习模型来分析数据集,以得到基质中靶生物体的量的估计值(436)。
在一些此类示例中,数据集可包括对应于扩增循环的一个或多个部分的一个或多个数据子集,诸如以类似于机器学习系统用其训练的数据子集的方式。例如,对应于含有未知量的靶生物体的样本的数据集可包括:第一数据子集,表示在扩增循环中直至第一时间点发射的光的时间序列测量样本,第一时间点发生在扩增循环内发发射的光的峰值振幅之前;第二数据子集,表示在扩增循环中的第一时间点之后但在第二时间点之前发射的光的时间序列测量样本,第二时间点发生在峰值振幅之后;以及第三数据子集,表示在扩增循环中的第二时间点之后发射的光的时间序列测量样本。被配置为接收第一数据子集、第二数据子集和第三数据子集的计算设备(例如,用户设备20的计算设备42、接入点24的计算设备,或任何其他合适的计算设备)将受过训练的机器学习系统应用于这些数据子集(436)并且计算样本中感兴趣的靶生物体的浓度(例如,量)。在一些示例中,计算设备然后可将一个或多个此类估计量存储到系统的一个或多个存储部件,诸如MDS的存储器、计算设备用户设备20的存储器、接入点24的计算设备的存储器和/或任何其他合适的位置。
在一些示例性方法中,根据所测试的基质类型来训练单独的机器学习系统。例如,可训练单独的系统用于测试干酪或用于测试饲料,其中每个机器语言机器学习系统的参数基于被测试基质类型来在存储器中存储。
如上文所指出的,在测试样本中靶生物体的存在时减少或消除假阴性可能至关重要。图9展示了根据本公开的一个方面的来自示例性病原体检测系统的测试结果,这些测试结果指示生物测定出错110、生物测定受抑制且无效112、生物测定受抑制却有效114,以及生物测定有效且未受抑制116。一些核酸扩增和检测系统被配置为在生物测定的前五分钟分析背景或基线信号(以RLU计)。在此期间,以RLU计的峰值作为在反应中工程化的生物化学的一部分被检测到,并且认为生物测定对于分析是可接受的。如果峰值不存在,则可以向用户报告出错消息。然而,基质可以抑制生物测定并且仍产生有效信号,因此假阴性结果可以被报告给用户,如在生物测定受抑制却有效114的示例中那样。生成高基线信号的基质可能存在另外的挑战,诸如包含高浓度无机磷的基质,以及将生成低基线的那些基质,诸如深色或浑浊基质。在这两种情况下,初始峰值高度或者单独的平均值或者说统计组合值并不是生物测定有效或受抑制的可靠指标(即,高背景或低背景可能产生真阴性(或阳性)结果或者假阴性结果)。
报告信号(此处,在扩增循环的初始部分处由发光物质发射的光)可以在输出曲线中呈现为尖峰或峰值,如图9所展示,并且进一步如下文相对于该图所讨论。这种尖峰或峰值可以被认为是代表扩增循环期间样本内的光的信号的背景或基线的一部分,因为对应于这种初始尖峰或峰值的光不一定与靶核酸的扩增相关联。输出曲线中的初始尖峰或峰值可以指示生物测定的有效性,但不一定指示生物测定是否被抑制。例如,在扩增循环的初始部分处输出曲线中可能不出现尖峰或峰值,这可能表明生物测定无效或受抑制。然而,即使在受抑制的生物测定中也可能出现输出曲线中的初始尖峰或峰值,但在此类示例中,尖峰可能不够大到足以(例如,宽度和/或振幅不足以)指示生物测定未受抑制。
因此,初始尖峰的存在与否可能不是用于检测对生物测定的抑制的充分标准。此外,输出曲线的后续背景或基线值可能不是可以确定对生物测定的抑制的充分标准。因此,在一些示例中,用于训练机器学习系统或由受过训练的机器学习系统使用的数据集可以对应于在扩增循环开始时出现的初始部分或阶段以及在初始尖峰或峰值之后出现的后续阶段。
图10A和图10B是展示使用被测试为靶生物体阴性的数据集来训练机器学习系统检测受抑制的生物测定的示例性技术的流程图。在其他示例性方法中,这些数据集捕获每个测定的达峰时间测量结果。在一些示例性方法中,在扩增循环的一部分上或基本上全部上提供报道分子信号强度的时间序列测量结果。在其他示例性方法中,这些数据集在两个或更多个扩增循环的多个部分上提供报道分子信号强度的时间序列测量结果。在其他示例性方法中,这些数据集在两个或更多个扩增循环的基本上全部上提供报道分子信号强度的时间序列测量结果。在一些示例性方法中,这些数据集包括与由核酸扩增设备捕获的背景或基线信号相关联的数据。
在图10A和图10B的一些示例性方法中,经标记的数据集通过专家检查已对其进行核酸扩增的各个样本而产生。在一个这样的示例性方法中,专家接收与被测试为靶生物体阴性的样本相关联的数据集、确定样本是否为假阴性,并且相应地将每个数据集标记为真阴性或假阴性。然后使用经标记的数据集来训练机器学习系统,如图10A和图10B所描绘。
在图10A的该示例性流程图中,使用来自被测试为靶生物体阴性的测定的数据集训练机器学习系统,以检测受抑制的生物测定。在一个示例性方法中,训练机器学习系统以估计生物测定的背景信号对应于受基质抑制的生物测定(即,使生物测定不能产生阳性反应)的概率。在一个示例性方法中,所述多个数据集包括2,186个单独的数据集,每个数据集包括原始数据(随时间推移的RLU)的分析结果。在一个示例性方法中,所述多个数据集取自22个不同的制造批次,并且包括701个受抑制(假阴性)样本和1,485个真阴性样本。
一般来讲,用于训练机器学习系统以检测假阴性的数据集来自已被测试为靶核酸阴性的生物测定。如上文所指出的,此类阴性结果可以包括真阴性结果和假阴性结果两者。在一些情况下,假阴性结果可以与由于基质抑制而被测试为靶核酸阴性并且如果不存在基质抑制则将被测试为阳性的生物测定相关联。
接下来将讨论代表性数据集。在一些示例性方法中,设备8捕获指示报告信号的数据,作为该报告信号的原始数据(随时间推移的RLU)时间序列测量结果。在一种LAMP相关方法中,该原始数据表示在由核酸扩增设备对相应生物测定执行的扩增循环期间,检测器对相应生物测定内发射的光的测量结果。
在一个示例性方法中,该原始数据作为数据集被接收(130)。在一些示例性方法中,将来自不同来源的数据集修剪为共同的运行时间(诸如59分钟)(132)。对数据集进行log10变换(134)。在一个示例性方法中,所述多个数据集中的数据集利用分层分割进行随机划分,以确保在每个分区中存在代表性数量的受抑制(即假阴性)样本,因为它们在多个数据集中可能未被充分表示(136)。然后使用训练平台(诸如Microsoft AzureTM平台)来使用由调谐模型找到的最佳参数来训练一个或多个机器学习系统(138)。然而,应当理解,任何合适的训练平台都可以用于执行如本文在其他示例中所述的用于训练机器学习系统的方法。
在一些示例中,训练机器学习系统可以包括将来自所述多个数据集的与由于基质抑制而被测试为靶核酸阴性以及如果不存在基质抑制则将被测试为阳性的生物测定相关联的那些数据集标记为假阴性数据集,并且将来自所述多个数据集的与被测试为靶核酸阴性并且未受抑制的生物测定相关联的那些数据集标记为真阴性数据集,使得用真阴性数据集和假阴性数据集训练机器学习系统使得该机器学习系统能够区分被真实地测试为靶核酸阴性的靶核酸生物测定和由于基质抑制而被错误地测试为靶核酸阴性的靶核酸生物测定(140)。
在图10A的该示例中,通过将数据集划分为单独用作验证集的10个切片来交叉验证受过训练的模型,同时使用另外九个切片来训练模型(142)。下表2中呈现了各种模型的10个分区的性能的平均值。最后,可以用表现最好的模型来评估所述多个数据集以测试这些训练方法,其中的一个或多个训练方法可以被存储到算法存储装置(下文相对于图11描述)和/或用户设备(144)。应当理解,在上述图10A的示例性技术的迭代中使用的所述多个数据集的各方面在本质上是说明性的,并且不应被认为是对图10A的技术的限制。在图10A的技术中可以使用任何合适的多个数据集,包括来自任何合适来源的受抑制(假阴性)数据集和真阴性数据集。除此之外或替代性地,图10A的示例性技术的一个或多个步骤可以是任选的(例如,修剪运行时间(132)或其他)。在一些示例中,用于训练机器学习系统的示例性技术可以包括图10A中未展示的一个或多个附加步骤。
表2:数据集中的测定的靶分析物
Figure BDA0003351051280000381
在图10B的该示例性方法中,系统6中的核酸扩增设备8用于测试样本的生物测定。专家检查与被测试为靶生物体阴性的样本相关联的数据集,以确定测试结果是真阴性还是假阴性,并且相应地标记每个数据集(150)。每个数据集可以包括在相关联的生物测定内检测到的并且与靶生物体相关联的靶核酸的测量结果,这些测量结果是由指定类型的核酸扩增设备执行相关联的生物测定所获得的并且在核酸扩增循环的至少一部分内收集。然后系统6使用经标记的数据集来训练机器学习系统(152)。在一些示例性方法中,该方法还包括检测受抑制的生物测定并且使用受过训练的机器学习系统发出指示生物测定是否由于基质抑制而被测试为靶核酸阴性的结果(154)。
图10C是展示根据本公开的一个方面的使用受过训练的机器学习系统来检测受抑制的生物测定的示例性技术的流程图。在使用机器学习系统来检测受抑制的生物测定并且发出指示生物测定是否由于基质抑制而被测试为靶核酸阴性的结果的一个这样的示例性方法中,图10C的技术包括接收包含基质和一定量的靶核酸的样本(160),诸如由实验室工作人员或自动化设备接收。基质可以是例如其中可以找到与靶核酸相关联的靶生物体的基质,诸如食品产品的原材料的一部分或者食品产品的最终产品。在接收到样本时,实验室工作人员或设备添加适当的富集培养基,该富集培养基被配置为使得含有靶生物体和基质的样本内的靶生物体能够生长至可检测限度(162)。在一些示例中,诸如其中PCR技术用于扩增靶核酸的示例,适当的富集培养基可以具有对在PCR期间发射的荧光造成干扰的可能性相比一种或多种其他适当的富集培养基更小的特性(诸如相对于其他适当的培养基发射较少的背景荧光),这可以有助于实现准确地检测生物测定是否由于基质抑制而受到抑制。接下来,在一些示例性方法中,工作人员或设备制备所得富集溶液的1:10稀释液(164)。
接下来,温育富集溶液内的样本以允许富集靶生物体(166)。在一些示例中,可将样本在约35℃-42℃下温育约4小时-24小时或者在可使靶生物体能够适当生长的任何其他合适的温度和时间段下温育。在其他示例中,可以不使用富集步骤,而是可以在不富集的情况下从样本中提取核酸。在温育(如果使用的话)之后,在一些示例方法中,经由扩增和检测与靶生物体相关联的靶核酸来分析样本(168)。例如,可使用具有光检测器16(诸如MDS)的核酸扩增设备8来扩增和检测靶核酸。例如,MDS可被配置为通过执行LAMP技术来扩增靶核酸,然后可使用检测器16检测由样本内的发光物质(例如,荧光素)发射的生物发光。接下来,系统6应用受过训练的机器学习系统来检测受抑制的生物测定,并且发出指示生物测定是否由于基质抑制而被测试为靶核酸阴性(即,产生假阴性结果)的结果。通过将LAMP与生物发光检测相结合,核酸扩增设备(诸如MDS)可以经由检测受抑制的生物测定和/或对靶生物体定量使食源性病原体的分子检测更快更简单,从而使用户能够快速便捷地同时识别食品样本和/或环境样本中的一种或多种靶生物体(例如,沙门氏菌属、李斯特菌属、单核细胞增多性李斯特菌、大肠杆菌O157(包括H7)、弯曲杆菌属、克罗诺杆菌属和/或其他靶生物体中的一种或多种菌种或菌株)。在其他示例性方法中,使用不同的LAMP平台或者使用PCR平台或不同的核酸扩增和检测平台来执行图9和图10A至图10C的技术。
在一些示例性方法中,每个数据集包括在一个或多个扩增循环期间随时间推移进行的光强度测量结果。在一些此类示例性方法中,每个数据集包括跨整个扩增循环捕获的光强度的时间序列测量结果。在一些示例性方法中,此类数据集还包括在扩增循环开始时的时段期间进行的测量结果,其中数据通常不被核酸扩增设备8捕获、丢弃或以其他方式抑制。在一些示例性方法中,每个数据集包括在Tmax之前的第一时段中进行的光强度测量结果、在包括Tmax的第二时间段中进行的光强度测量结果以及在Tmax之后的第三时段中进行的光强度测量结果。
在图10C的一些示例性方法中,数据集包括在整个扩增循环上以预定间隔(例如25秒)获取的时间序列测量结果。在其他示例性方法中,数据集包括选自扩增循环的某些阶段的数据。例如,数据集可包括来自图6中的阶段94、96和98中的一者或多者或来自图7中的阶段104、106和108中的一者或多者的数据。例如,在(152)包括LAMP技术的情况下,数据集可以包括一个或多个数据子集,如相对于图6所述。例如,数据集可包括:第一数据子集,表示在扩增循环中直至第一时间点发射的光的时间序列测量样本,第一时间点发生在扩增循环中发射的光的峰值振幅之前;第二数据子集,表示在扩增循环中的第一时间点之后但在第二时间点之前发射的光的时间序列测量样本,第二时间点发生在峰值振幅之后;以及第三数据子集,表示在扩增循环中的第二时间点之后发射的光的时间序列测量样本。然后计算设备(例如,图2的外部设备28的处理电路30,或任何其他合适的计算设备)训练机器学习系统,以预测感兴趣的靶生物体的初始浓度(即,量)(154)。例如,计算设备可用与相应数据集或数据子集相关联的生物测定内靶生物体的量的估计值来标记数据集和/或数据集的一个或多个子集。然后,计算设备用标记的数据集(或数据子集)和/或基质标识训练机器学习系统,以估计样本内靶生物体的量,从而得到受过训练的模型。然后,计算设备可将受过训练的机器学习系统的参数存储到系统的一个或多个存储部件,诸如计算设备的存储器、用户设备20、接入点24的计算设备的存储器和/或任何其他合适的位置。
在与使用受过训练的机器学习系统来确定阴性结果是否为假阴性相关联的工作流程技术中,图10C的技术包括执行基本上如上文相对于用于训练机器学习系统的示例性技术所述的步骤160至172,然而(160)处的基质可以是以下物质的样本:食品原材料、最终食品产品,或者可以包含感兴趣的靶生物体而非已知量的靶生物体的环境样本。在此类示例中,核酸扩增和检测系统(诸如MDS)或者被配置为在一个或多个扩增循环期间进行LAMP或PCR并且检测由发光物质发射的光的另一种系统可以捕获数据集,该数据集包括在扩增循环期间由发光物质发射的光的时间序列测量结果样本,并且分析该数据集(168)。然后基于在上面的图8A和图8B的上下文中讨论的受过训练的机器学习模型来分析数据集,以获得基质中的靶生物体的量的估计值,或者是否存在阈值量的靶生物体的指示。如果样本被测试为靶生物体阴性,则在(172)处进行检查以确定结果是否为假阴性(例如,通过应用在图10A的(138)处训练的机器学习系统)。在一个这样的示例性方法中,假阴性被加标记并且经由用户设备20报告给用户。
在一些此类示例中,数据集可以包括对应于扩增循环的一个或多个部分的一个或多个数据子集,诸如以类似于机器学习系统用其进行训练的数据子集的方式。例如,对应于含有未知量的靶生物体的样本的数据集可包括:第一数据子集,表示在扩增循环中直至第一时间点发射的光的时间序列测量样本,第一时间点发生在扩增循环内发发射的光的峰值振幅之前;第二数据子集,表示在扩增循环中的第一时间点之后但在第二时间点之前发射的光的时间序列测量样本,第二时间点发生在峰值振幅之后;以及第三数据子集,表示在扩增循环中的第二时间点之后发射的光的时间序列测量样本。被配置为接收第一数据子集、第二数据子集和第三数据子集的计算设备(例如,用户设备20的计算设备42、接入点24的计算设备或任何其他合适的计算设备)将受过训练的机器学习系统应用于数据子集(136)并计算样本中所关注的靶生物体的浓度(例如,量)。在一些示例中,计算设备然后可将一个或多个此类估计量存储到系统的一个或多个存储部件,诸如MDS的存储器、计算设备用户设备20的存储器、接入点24的计算设备的存储器和/或任何其他合适的位置。
在一些示例性方法中,可抑制(例如,不记录)扩增循环早期(例如,在阶段94或阶段104之前)生成的光的振幅,以便不使用户混淆背景活性。然而,已经发现,此类信息可有助于训练机器学习系统。因此,在一个示例性方法中,数据集包括在图6中的阶段94之前进行的时间序列测量结果。在类似的示例性方法中,数据集包括在图7中的阶段104之前进行的时间序列测量结果。
在图10C的一些示例性方法中,根据所测试的基质类型来训练单独的机器学习系统。例如,可训练单独的系统用于测试干酪或用于测试饲料,其中每个机器语言机器学习系统的参数基于被测试基质类型来在存储器中存储。
图11是展示根据本公开的一个方面的设备训练系统的框图。在图11所示的该示例中,设备训练系统200包括经由链路206连接到经标记的数据集模块204的训练模块202。在一些示例性方法中,设备训练系统200经由链路208连接到用户设备210。在一个示例性方法中,训练模块202包括计算设备、一个或多个存储部件,以及用户界面。例如,设备训练系统200可以包括图2的外部设备28的计算设备,以及存储器32。在一个示例性方法中,训练模块202从经标记的数据集模块204接收经标记的数据集。在一些此类示例性方法中,每个经标记的数据集被标记为假阴性数据集或真阴性数据集,所述假阴性数据集与由于基质抑制而被测试为靶核酸阴性的生物测定相关联,所述真阴性数据集与被正确地测试为靶核酸阴性的生物测定相关联。在其中对靶生物体进行定量的示例中,数据集包括与样本相关联的靶生物体量以及在样本的扩增循环期间由核酸扩增设备8检测到的光的测量结果。训练模块202用经标记的数据集训练机器学习系统,并且将与机器学习系统相关联的参数存储在存储装置212中,该存储装置经由链路214连接到训练模块202。
图12至图25展示了示例性数据集、将受过训练的机器学习系统应用于此类示例性数据集以检测假阴性,以及将受过训练的机器学习系统这样应用于此类示例性数据集的结果。图12至图15展示了环境样本的测试批次针对与李斯特菌属菌种相关联的一种或多种靶核酸进行测试的示例性分析,包括初始结果、将基质对照应用于初始结果、将受过训练的机器学习系统应用于样本的测试批次,以及将应用于样本的测试批次的受过训练的机器学习系统应用于训练数据集。图16至图25展示了用于训练机器学习系统的多个数据集中的数据集,所述机器学习系统诸如图12至图15的应用于环境样本的测试批次的受过训练的机器学习系统。
图12展示了根据本公开的一个方面的由示例性病原体检测系统产生的环境样本的分析报告。在图12所示的示例性方法中,示例性分析报告与针对与李斯特菌属菌种相关联的一种或多种靶核酸进行测试的一批十个环境样本相关联。这种分析报告可以根据本公开的一个方面例如由示例性病原体检测系统(诸如图1和/或图2的系统)产生。在图12的该示例中,使用添加到合适的裂解管中的10μL或20μL富集液体培养基,一式两份地分析十个样本。使用外部基质对照来额外一式两份地分析每个样本,以确定样本对测定的抑制性特性。从A1开始将样本加载到图12所展示的网格中,并且继续沿列向下加载。图12的网格中的第一组对应于与李斯特菌属菌种相关联的靶核酸的测定,其中将20μL富集样本加载到测定。图12的网格中的第二组对应于来自相同富集样本的李斯特菌属菌种测定,其中加载了10μL富集样本。将这些组一式两份地加载到第三组和第四组的外部对照中。
在分析图12的这批十个环境样本期间,发现样本#1对测定有抑制性。使用外部基质对照(在图12中标记为“MC”)进行样本#1受抑制的测定,其中样本抑制由图12中的穿过与样本#1相关联的“MC”标记的斜线指示。
检测软件(诸如产生图12的分析报告的MDS检测软件)可以被设计成当受抑制的基质对照与样本ID#关联时,将样本识别为受抑制。然而,这种方法需要将每个新样本与外部基质对照MC相关联并且相应地进行标记。由于环境样本多样化,所以该方法可能难以应用于实验室。
表3:图12的环境样本的李斯特菌属检测结果
Figure BDA0003351051280000451
如在以上的沙门氏菌属示例中,在该示例性方法中,将培养物在巴特菲尔德公司(Butterfield)缓冲液中连续稀释,并且按照制造商的说明铺板到Petrifilm AC平板上。将培养物保持在4℃-8℃下,直到获得平板计数结果。获得的计数用于使用3MTM品牌分子检测测定2–李斯特菌属(Molecular Detection Assay 2–Listeria)(3M公司)(下文称为“MDA2-Lis”)来估计用于检测的细胞数。在进行检测测定时,使用Petrifilm AC平板进行最终平板计数。这些最终平板计数用于报告细胞浓度。
在该示例性运行中,外部基质对照没有与样本#1关联,并且检测软件由于样本的基质抑制而错误地将样本#1标记为对于与李斯特菌属菌种相关联的靶核酸是阴性的。该结果说明了仅依赖于外部基质对照来检测样本抑制存在的一个问题。
图13展示了根据本公开的一个方面的工作流程,该工作流程描绘了对图12的分析报告中所示的样本应用基质控制和稀释。如上文所讨论的,用户可以选择对确定受抑制的样本(例如,图12的样本#1)进行进一步分析,诸如以确定样本中是否存在靶核酸。例如,可以将样本稀释并且进行重新分析。虽然样本的稀释可以有助于缓解基质的抑制作用,但如果样本中存在的核酸的初始量相对低,则稀释也可能引起与靶核酸相关联的信号损失。在图13的该示例中,样本#1(在虚线框220中画出轮廓)对于每个平行测定,用对应的外部基质对照(222)一式两份地稀释(1:10和1:100)。对样本#1的稀释液运行的核酸扩增和检测测定的结果对于李斯特菌属菌种是阳性的,如图13中的224处所示。
图14展示了根据本公开的一个方面的将受过训练的双类决策森林算法应用于数据集集合的结果。为了获得图14所展示的结果,使用受过训练的机器学习系统来进一步分析图12和图13的样本。如图14所展示,受过训练的机器学习系统能够将来自被正确地识别为靶核酸测试阴性的生物测定的真阴性结果230与由受抑制的生物测定232引起的假阴性结果区分开。在该示例中,所使用的受过训练的机器学习系统是根据图10A的示例性技术训练的受过训练的双类决策森林算法。
图15展示了在图14的示例中应用于相对于图10A的示例性技术所述的多个训练数据集的受过训练的双类决策森林算法的应用结果。该受过训练的机器学习系统对所述多个训练数据集的性能在图15中示出。如上文在表2中所指出的,受过训练的双类决策森林算法在应用于所述多个训练数据集时,提供97.6%的准确度、97.4%的精确度和99.1%的召回率,从而将被确定为真阴性的数据集聚类在集群240中,如图表顶部附近所示。该算法将被确定为与由于基质抑制而被测试为靶核酸阴性的生物测定相关联的数据集聚类在集群242和244中,如图表底部附近所示。
图16至图25展示了将图10A至图10C的机器学习系统应用于不同的数据集集合。图16展示了根据本公开的一个方面的数据集集合的示例,其中每个数据集由代表在一个或多个核酸扩增循环期间随时间推移的光强度的曲线表示,每条曲线对应于一个样本。在图16所示的该示例中,每个数据集都遵循在接近光强度的稳态值之前达到峰值的曲线。
图17展示了根据本公开的一个方面的将图10A至图10C的受过训练的机器学习技术(例如,根据图10A的示例性技术训练)应用于图16的数据集的结果。如图17所示,受过训练的机器学习算法以相对高的概率将图16的所有数据集分类为真阴性(即,对应于其中靶核酸不存在或不以高于阈值水平存在的生物测定)。
图18展示了根据本公开的一个方面的由示例性病原体检测系统产生的针对从与已知是抑制性的基质成分相关联的样本取得的数据集集合的分析报告。此类基质成分可以包括化合物诸如油脂、消毒剂、香料、颜料、酶,以及可以存在于待测试靶核酸的食物、饲料或环境样本内的其他成分。图18的分析报告展示了已知为抑制性的未稀释样本的结果(第2列至第6列),以及第1列中的对应外部基质对照的结果(示出了对第2列至第6列的测定的抑制)。图18的分析报告还在第8列至第12列展示了样本稀释液的结果,并且在第7列展示了对应的外部基质对照的结果,示出除了对应于D行样本的测定之外,测定抑制减轻。
图19展示了根据本公开的一个方面的将受过训练的机器学习系统(例如,根据图10A的示例性技术训练)应用于图18的数据集的结果。被确定为真阴性(即,对应于其中靶核酸不存在或不以阈值水平存在的生物测定)的数据集集群250、252在图表顶部附近示出。被确定为与由于基质抑制而被测试为靶核酸阴性的生物测定相关联的数据集集群254、256在图表底部附近示出。
图20展示了根据本公开的一个方面的受过训练的机器学习系统对质量保证(QA)实验室阴性对照运行的数据集的示例性应用。在一些示例性方法中,所应用的机器学习系统根据针对上面的图10A和图10B所讨论的方法进行训练。从图20中可以看出,受过训练的机器学习算法以相对高的概率将QA实验室阴性对照运行中的每一次运行分类为真阴性。
图21展示了数据集集合的示例,其中每个数据集由代表在一个或多个核酸扩增循环期间随时间推移的光强度的曲线表示,每条曲线对应于已知包含导致假阴性结果的抑制性基质的样本。图22展示了根据本公开的一个方面的受过训练的机器学习系统(例如,根据图10C的示例性技术训练)对图21的数据集的示例性应用。如图22所展示,受过训练的机器学习系统以相对高的概率验证受抑制样本中的大多数不是真阴性结果(即,是假阴性结果,并且因此对应于由于基质抑制而被测试为靶核酸阴性的生物测定)。
图23至图25展示了根据本公开的一个方面的机器学习系统对来自包含6,7-二羟基香豆素的样本的数据集的应用。例如,图23展示了由示例性病原体检测系统针对表示关于含有6,7-二羟基香豆素的样本进行的核酸扩增循环的数据集集合产生的分析报告。如图23的报告所示,基于对应的核酸扩增和检测测定的结果,包含6,7-二羟基香豆素的样本均未被识别为包括抑制性基质,从而导致假阴性结果。
图24展示了图23的数据集集合,其中每个数据集包括图23所示样本的曲线之一的时间序列测量结果集,每条曲线代表在一个或多个核酸扩增循环期间随时间推移的光强度,每条曲线对应于含有6,7-二羟基香豆素的样本之一。图25展示了根据本公开的一个方面的将受过训练的机器学习系统(例如,根据图10C的示例性技术训练)应用于图23的数据集的结果。如图25所展示,受过训练的机器学习算法以相对高的概率将含有6,7-二羟基香豆素的样本中的大多数分类为真阴性结果(即,对应于其中靶核酸不存在或不以阈值水平存在的生物测定)。
如图14至图25中大致所展示,本文所述的用于训练和使用机器学习系统的系统和方法可以使得此类受过训练的机器学习系统能够通常以高水平的准确度、精确度和召回率区分被真实地测试为靶核酸阴性的生物测定和由于基质抑制而被错误地测试为靶核酸阴性的生物测定。因此,本文所述的受过训练的机器学习系统可以有助于减少或消除使用内部对照或外部对照与核酸扩增和检测方法(诸如LAMP)的需要。此外,用于训练和使用本文所述的机器学习系统的方法可以利用分子方法中的报道分子(例如,光)信号的背景或基线部分来扩增和检测靶核酸。在除本文所述的那些方法之外的方法中,通常从DNA扩增技术期间的总报道分子信号处理中减去背景或基线信号,并且从其几乎没有获得信息。因此,本文所述的系统和方法可以利用报道分子信号的原本未使用的固有背景或基线部分来改善检测生物测定是否由于在病原体检测和/或定量方法中对靶核酸进行测试的对应样本中的基质抑制而被测试为靶核酸阴性的方法。最终,此类系统和方法可以减少用于病原体检测和/或定量的生物测定的时间、成本和/或复杂度,并且可以通过限制可能受病原体污染的产品的释放来帮助保护消费者健康。
已描述了各种示例。这些示例以及其他示例均在以下权利要求书的范围内。

Claims (21)

1.一种用于检测对生物测定的抑制的系统,所述系统包括:
检测设备,所述检测设备被配置为在所述生物测定期间扩增和检测与靶生物体相关联的靶核酸,所述检测设备包括:
反应室,所述反应室被配置为接收包含基质和一定量的所述靶核酸的样本并且在核酸扩增循环中扩增所述样本内的所述靶核酸;
检测器,所述检测器被配置为在所述核酸扩增循环期间捕获代表所述样本中存在的所述靶核酸的量的测量结果,并且将所述测量结果存储在数据集中;以及
机器学习系统,所述机器学习系统被配置为接收所述数据集,其中所述机器学习系统包括处理电路,所述处理电路经训练以检测由于基质抑制而受抑制的生物测定。
2.根据权利要求1所述的系统,其中所述检测器测量生物发光、荧光、吸光度、透射率或反射率中的至少一者。
3.根据权利要求1所述的系统,其中所述检测器被配置为检测来自活细胞、受伤细胞、受胁迫细胞或活的但不可培养的细胞中的至少一者的核酸。
4.根据权利要求1所述的系统,其中所述反应室被配置为执行扩增技术,所述扩增技术包括LAMP、PCR、基于核酸序列的扩增或转录介导扩增中的一者或多者。
5.根据权利要求1所述的系统,其中所述样本选自食品、饲料、水或原材料中的一者。
6.根据权利要求1所述的系统,其中所述样本是来自收获、处理、封装或使用食品、饲料、水或原材料中的至少一者的环境的环境样本。
7.根据权利要求1所述的系统,其中所述机器学习系统还经训练以基于以下各项中存在的测量结果来估计所述样本中存在的所述靶生物体的量:
第一数据子集,所述第一数据子集包括在时间Tmax之前取得的测量结果,其中所述时间Tmax对应于当所述测量结果达到最大振幅时所述核酸扩增循环中的时间;
第二数据子集,所述第二数据子集包括在所述核酸扩增循环中的第一时间点之后但在第二时间点之前取得的测量结果,所述第二时间点发生在Tmax之后;以及
第三数据子集,所述第三数据子集包括在所述核酸扩增循环中的所述第二时间点之后取得的测量结果。
8.根据权利要求1所述的系统,其中所述靶生物体是一种或多种沙门氏菌属(Salmonella)菌种、一种或多种李斯特氏菌属(Listeria)菌种、一种或多种弯曲杆菌属(Campylobacter)菌种、一种或多种克罗诺杆菌属(Cronobacter)菌种、一种或多种大肠杆菌(E.coli)菌株、一种或多种弧菌属(Vibrio)菌种、一种或多种志贺氏菌属(Shigella)菌种、一种或多种军团菌属(Legionella)菌种、一种或多种蜡样芽孢杆菌(B.cereus)菌株或者一种或多种金黄色葡萄球菌(S.aureus)菌株的微生物,一种或多种类型的病毒或者一种或多种经基因修饰的生物体。
9.根据权利要求1所述的系统,其中所述反应室还被配置为在多个核酸扩增循环内扩增所述样本中的所述靶核酸,并且
其中所述检测器还被配置为跨所述多个核酸扩增循环捕获所述测量结果。
10.根据权利要求1所述的系统,其中所述机器学习系统基于回归模型。
11.根据权利要求1所述的系统,其中所述反应室还被配置为接收模块,其中所述模块包括:
多个第一反应容器,所述多个第一反应容器中的每个容器包含一定量的裂解缓冲溶液;以及
多个第二反应容器,所述多个第二反应容器中的每个容器包含一定量的被配置用于核酸扩增反应的一种或多种试剂。
12.一种方法,所述方法包括:
接收多个数据集,其中每个数据集与生物测定相关联,每个数据集包括在相关联的生物测定内检测到的靶核酸的测量结果,所述测量结果由指定类型的核酸扩增设备在所述相关联的生物测定上执行并且在核酸扩增循环的至少一部分内收集,其中所述靶核酸与靶生物体相关联;
将来自所述多个数据集的与由于基质抑制而被测试为所述靶核酸阴性以及如果不存在基质抑制则将被测试为阳性的生物测定相关联的那些数据集标记为假阴性数据集;
将来自所述多个数据集的与被正确地测试为所述靶核酸阴性的生物测定相关联的那些数据集标记为真阴性数据集;以及
用所述真阴性数据集和所述假阴性数据集训练机器学习系统,以检测由于基质抑制而被测试为所述靶核酸阴性的生物测定。
13.根据权利要求12所述的方法,其中所述测量结果是在所述核酸扩增循环的至少一部分内收集的光强度的时间序列测量结果。
14.根据权利要求13所述的方法,所述方法还包括将所述机器学习系统训练成基于以下各项中存在的测量结果来估计所述样本中存在的所述靶生物体的量:
第一数据子集,所述第一数据子集包括在时间Tmax之前取得的测量结果,其中所述时间Tmax对应于当所述测量结果达到最大振幅时所述核酸扩增循环中的时间;
第二数据子集,所述第二数据子集包括在所述核酸扩增循环中的第一时间点之后但在第二时间点之前取得的测量结果,所述第二时间点发生在Tmax之后;以及
第三数据子集,所述第三数据子集包括在所述核酸扩增循环中的所述第二时间点之后取得的测量结果。
15.根据权利要求12所述的方法,其中所述测量结果是在整个所述核酸扩增循环中收集的光强度的时间序列测量结果。
16.根据权利要求12所述的方法,其中所述测量结果包括收集的但通常不包括在由所述核酸扩增设备呈现的测试结果中的测量结果。
17.根据权利要求12所述的方法,其中所述核酸扩增设备执行扩增技术,所述扩增技术包括LAMP、PCR、切口酶扩增反应(NEAR)、解旋酶依赖性扩增(HDA)、基于核酸序列的扩增(NASBA)或转录介导扩增(TMA)中的一者或多者。
18.根据权利要求12所述的方法,其中所述生物测定来自用两种或更多种水平的生物体接种的基质,并且其中用所述靶生物体的量的估计值标记每个数据集包括根据接种水平来设定所述量。
19.根据权利要求12所述的方法,其中所述生物测定来自多个基质类型,并且其中训练机器学习系统包括训练所述机器学习模型以区分基质类型。
20.一种存储指令的非暂态计算机可读介质,所述指令在由处理电路执行时使得所述处理电路:
建立经训练以检测受基质抑制的生物测定的机器学习系统;
接收数据集,所述数据集是通过在核酸扩增循环中扩增和检测与包含基质和一定量的靶核酸的样本中的靶生物体相关联的所述靶核酸而生成的,所述数据集包括代表所述样本中存在的所述靶核酸的量的测量结果;
通过将所述机器学习系统应用于所述数据集来确定所述数据集是否来自受基质抑制的样本;以及
相应地标记所述数据集。
21.根据权利要求20所述的计算机可读介质,其中所述测量结果是在所述核酸扩增循环的至少一部分内收集的光强度的时间序列测量结果。
CN202080035535.6A 2019-05-20 2020-05-15 用于检测对生物测定的抑制的系统和方法 Pending CN113853657A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962850198P 2019-05-20 2019-05-20
US62/850,198 2019-05-20
PCT/IB2020/054617 WO2020234718A1 (en) 2019-05-20 2020-05-15 System and method for detecting inhibition of a biological assay

Publications (1)

Publication Number Publication Date
CN113853657A true CN113853657A (zh) 2021-12-28

Family

ID=70779820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080035535.6A Pending CN113853657A (zh) 2019-05-20 2020-05-15 用于检测对生物测定的抑制的系统和方法

Country Status (4)

Country Link
US (1) US20220220547A1 (zh)
EP (1) EP3973531A1 (zh)
CN (1) CN113853657A (zh)
WO (1) WO2020234718A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018119443A1 (en) * 2016-12-23 2018-06-28 The Regents Of The University Of California Method and device for digital high resolution melt
US20200075129A1 (en) * 2018-08-30 2020-03-05 Life Technologies Corporation Machine learning system for genotyping pcr assays

Also Published As

Publication number Publication date
WO2020234718A1 (en) 2020-11-26
US20220220547A1 (en) 2022-07-14
EP3973531A1 (en) 2022-03-30

Similar Documents

Publication Publication Date Title
Maukonen et al. Methodologies for the characterization of microbes in industrial environments: a review
CN113474841A (zh) 使用核酸扩增测定的靶生物体的机器学习量化
US9506112B2 (en) Increasing multiplex level by externalization of passive reference in polymerase chain reactions
Cocolin et al. The challenge of merging food safety diagnostic needs with quantitative PCR platforms
Papić et al. New approaches on quantification of Campylobacter jejuni in poultry samples: the use of digital PCR and real-time PCR against the ISO standard plate count method
CN104685062A (zh) 使用非干扰性噪音消除性多核苷酸鉴定标签的多重焦磷酸测序
Sauget et al. Matrix-assisted laser desorption ionization-time of flight mass spectrometry assigns Escherichia coli to the phylogroups A, B1, B2 and D
Alemu Real-time PCR and its application in plant disease diagnostics
Osek et al. Listeria monocytogenes in foods—From culture identification to whole‐genome characteristics
KR20180122481A (ko) 둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출
JP2004028984A (ja) リアルタイム核酸増幅多数試験分析法
CN113853657A (zh) 用于检测对生物测定的抑制的系统和方法
Cunha et al. ATP-Bioluminescence as a method to evaluated microbiological quality of UHT milk
US20030175687A1 (en) Methods for the detection and identification of microorganisms
EP4299714A1 (en) Measurement method and measurement system
Rathnayaka et al. Rapid Detection of Food Pathogens Using Molecular Methods
Athira Krishnan Real-time PCR in plant disease diagnosis
RU2716115C1 (ru) Способ идентификации и количественной оценки патогенных и условно-патогенных бактерий в пищевых субстратах с использованием высокопроизводительного секвенирования
WO2015170362A1 (ja) 微生物の検査方法
CN106701966A (zh) 基于分析pcr副产物焦磷酸的病原微生物快速检测方法
Yan et al. Molecular methods to characterize foodborne microbial pathogens
Degefu Molecular diagnostic technologies and end user applications: potentials and challenges
Hernández et al. Real-time PCR methods for detection of foodborne bacterial pathogens in meat and meat products
US20190292608A1 (en) Methods To Quantify Bioburden In Substances
Earnshaw Can microbe analysis of effluent be used as a proxy for bovine herd health?: a thesis presented in partial fulfilment of the requirements for the degree of Master of Science in Genetics at Massey University, Albany, New Zealand

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination