CN117813655A

CN117813655A - 宏基因组过滤和使用微生物特征认证食品原材料

Info

Publication number: CN117813655A
Application number: CN202280055544.0A
Authority: CN
Inventors: B·加内桑; R·C·贝克; D·F·克林
Original assignee: Mars Co Japan
Current assignee: Mars Co Japan
Priority date: 2021-08-17
Filing date: 2022-08-15
Publication date: 2024-04-02
Also published as: CA3227394A1; WO2023023479A1

Abstract

本文公开了用于认证或识别食品的食物来源的方法和系统。本文还公开了用于检测食品中的污染物的方法和系统。该方法包括获得食品中存在的多个核酸序列的序列数据，识别一种或多种微生物特征，其中一种或多种微生物特征对应食品中存在的一种或多种微生物，以及确定一种或多种微生物特征是否对应与特定食物来源或特定污染物相关的一种或多种微生物。

Description

宏基因组过滤和使用微生物特征认证食品原材料

相关申请的交叉引用

本申请要求2021年8月17日提交的美国临时专利申请第63/234,093号的优先权，其内容通过引用整体并入本文。

技术领域

本公开涉及使用微生物组分析和宏基因组过滤认证食物原材料和检测食物污染物的方法。

背景技术

食物生产所用原材料的可靠性是食物生产者、消费者和食物主管部门都非常关心的问题。特定食品的质量和成本可能因其来源或供应商而有很大差异。例如，基于地理起源、生长条件、品种或种类、生产方法或作为来源使用的动物饲养方式，特定原材料可能具有截然不同的质量、风味和/或成本。对于食物生产者来说，正确认证其产品中使用的原材料对于保持其食品的一致性和信心非常重要。

缺乏食物真实性可能会导致经济和公共安全问题。食品中存在污染物或错误标记食品来源可能会损害公司产品的质量、安全性和信心。由于有意或无意的食品掺假或贴错标签而造成的食品真实性缺乏受到食品主管部门的密切监控，因为这可能代表商业欺诈或食物安全性受损。因此，食物认证，特别是食品成分的识别对于控制食品质量和安全性以及保护消费者非常重要。

需要有效且可靠的技术来确定食物的真实性。一些现有的食物认证方法依赖于通过化学或生物手段对食物原材料进行靶向检测，诸如通过qPCR、色谱法或酶分析。也已经开发了用于分析食物原材料中的核酸或蛋白质以进行直接认证的高通量方法，例如使用测序或蛋白质组学。然而，这些方法要求分析时存在具体的成分或来源。因此，如果具体的成分或来源材料被去除，则可能无法检测出来源。

因此，需要用于食物来源认证和追溯的高通量端到端方法，其不唯一依赖于食物原材料的直接识别。

发明内容

本文公开了用于认证或识别食品来源的系统和方法。这些方法还可用于检测食物生产链中的污染物。

一方面，本文公开了一种用于认证食品来源的方法，包括：获得食品中存在的多个核酸序列的序列数据；识别序列数据中的一种或多种微生物特征；以及通过确定一种或多种微生物特征是否对应与食品的特定来源相关的一种或多种微生物特征来认证食品的来源，其中如果一种或多种微生物特征对应与食品的特定来源相关的一种或多种微生物特征，则认证食品。

另一方面，本文公开了一种用于识别食品来源的方法，包括：获得食品中存在的多个核酸序列的序列数据；识别序列数据中的一种或多种微生物特征；以及通过确定一种或多种微生物特征是否对应与食品的特定来源相关的一种或多种微生物特征来识别食品的来源，其中如果一种或多种微生物特征对应与食品的特定来源相关的一种或多种微生物特征，则识别出食物来源。

另又一方面，本文公开了一种用于检测食物生产链中的污染物的方法，包括：获得食品中存在的多个核酸序列的序列数据；识别序列数据中的一种或多种微生物特征；以及通过确定一种或多种微生物特征是否对应与特定污染物相关的一种或多种微生物特征来检测食品中的污染物，其中如果一种或多种微生物特征对应与特定污染物相关的一种或多种微生物特征，则检测到污染物。

一种或多种微生物特征可对应食品中存在的一种或多种微生物。一种或多种微生物特征可对应食品中存在的一种或多种微生物的属分类。一种或多种微生物特征可对应食品中存在的一种或多种微生物的物种、血清型或菌株分类。一种或多种微生物特征可对应食品中存在的一种或多种微生物的界、门或纲分类。在一些情况下，一种或多种微生物特征可对应食品中存在的一种或多种微生物的量化或相对水平。

一种或多种微生物特征(microbial signatures)可以对应与单个来源或单种污染物相关的一种或多种微生物。一种或多种微生物特征可以对应与两个或更多个来源或两种或更多种污染物相关的一种或多种微生物。

来源或污染物可能是动物起源。动物起源可以是蛋、家禽粉、鱼粉或骨粉。动物起源还可以是各种动物的肉，诸如犬、猫、马、猪、牛、羊或类似来源，包括野味肉(game meat)。来源或污染物可以是植物或真菌起源。植物起源可以是玉米、水稻、小麦、坚果(groundnut)或花生(peanut)，或其任何品种，或等效的驯化或野生作物。真菌起源可以是各种酵母和霉菌，包括各种蘑菇。来源或污染物可以对应特定的地理区域。

一种或多种微生物可以选自由细菌、病毒、古细菌和真核微生物组成的组。一种或多种微生物可以属于选自由以下组成的组的属分类：副地芽孢杆菌属(Parageobacillus)、布劳特氏菌属(Blautia)、另类弧菌属(Aliivibrio)、产卟啉杆菌属(Porphyrobacter)、志贺氏菌属(Shigella)、解硫胺素芽孢杆菌属(Aneurinibacillus)、厌氧棒状菌属(Anaerostipes)、发光杆菌属(Photobacterium)、红色杆菌属(Erythrobacter)、拉氏杆菌属(Rathayibacter)、丁酸弧菌属(Butyrivibrio)、泰泽雷拉菌属(Tyzzerella)、格里蒙特氏菌属(Grimontia)、脱氯单胞菌属(Dechloromonas)、雷夫松氏菌属(Leifsonia)、粪热杆菌属(Coprothermobacter)、鼠肠单胞菌属(Intestinimonas)、假交替单胞菌属(Pseudoalteromonas)、假节杆菌属(Pseudarthrobacter)、节杆菌属(Arthrobacter)、巨球形菌属(Megasphaera)、产乙醇菌属(Ethanoligenens)、交替单胞菌属(Alteromonas)、栖白蚁菌属(Isoptericola)、微球菌属(Micrococcus)、真杆菌属(Eubacterium)、科维尔氏菌属(Colwellia)、纤维单胞菌属(Cellulomonas)、栖热菌属(Thermus)、震颤杆菌属(Oscillibacter)、耶尔森氏菌属(Yersinia)、诺卡氏菌属(Nocardia)、栖微热菌属(Meiothermus)、魏斯氏菌属(Weissella)、爱德华氏菌属(Edwardsiella)、戈登氏菌属(Gordonia)、拉恩氏菌属(Rahnella)、默多克氏菌属(Murdochiella)、大洋单胞菌属(Oceanimonas)、丙酸杆菌属(Propionibacterium)、固氮菌属(Azotobacter)、爱格士氏菌属(Eggerthella)、海单胞菌属(Marinomonas)、四合球菌属(Tessaracoccus)、柄杆菌属(Caulobacter)、阿德勒氏菌属(Adlercreutzia)、盐单胞菌属(Halomonas)、脂肪杆菌属(Pimelobacter)、丝状杆菌属(Fibrobacter)、戈登氏杆菌属(Gordonibacter)、噬甲基菌属(Methylophaga)、游动放线菌属(Actinoplanes)、高温杆菌属(Fervidobacterium)、肥杆菌属(Obesumbacterium)、布鲁氏菌属(Brucella)、李斯特氏菌属(Listeria)、甲烷短杆菌属(Methanobrevibacter)、邻单胞菌属(Plesiomonas)、热厌氧杆形菌属(Caldanaerobacter)、奇异球菌属(Deinococcus)、甲烷八叠球菌属(Methanosarcina)、鸡杆菌属(Gallibacterium)、聚球藻属(Synechococcus)、螺状菌属(Spirosoma)、辫硫菌属(Thioploca)、眉藻属(Calothrix)、螺杆菌属(Helicobacter)、热袍菌属(Thermotoga)、紫色杆菌属(Janthinobacterium)、不滑动菌属(Nonlabens)、巴恩斯氏菌属(Barnesiella)、梭杆菌属(Fusobacterium)、鸟杆状菌属(Ornithobacterium)、泥杆菌属(Ilyobacter)、阿克曼氏菌属(Akkermansia)、热脱硫杆菌属(Thermodesulfobacterium)、下水道菌属(Cloacibacillus)、泰勒虫属(Theileria)、环病毒属(Gyrovirus)、T7病毒属(T7virus)、T4病毒属(T4virus)、α逆转录病毒属(Alpharetrovirus)、Sp18病毒属(Sp18virus)、氨基酸球菌属(Acidaminococcus)、交替红色杆菌属(Altererythrobacter)、丛毛单胞菌属(Comamonas)、弓形菌属(Arcobacter)、气微菌属(Aeromicrobium)、片球菌属(Pediococcus)、变形菌属(Proteus)、别样杆菌属(Alistipes)、固氮螺形菌属(Azospira)、地芽孢杆菌属(Geobacillus)、碱土菌属(Geoalkalibacter)、土壤杆菌属(Agrobacterium)、弧菌属(Vibrio)、克里斯滕森氏菌属(Christensenella)、博斯氏菌属(Bosea)、库特氏菌属(Kurthia)、哈夫尼菌属(Hafnia)、产碱菌属(Alcaligenes)、拟梭菌属(Clostridioides)、新鞘氨醇菌属(Novosphingobium)、遗忘单胞菌属(Oblitimonas)、摩根氏菌属(Morganella)、拟无枝酸菌属(Amycolatopsis)、臭气杆菌属(Odoribacter)、假黄单胞菌属(Pseudoxanthomonas)、阴性球菌属(Negativicoccus)、金色单胞菌属(Aureimonas)、欧尔森氏菌属(Olsenella)、嗜冷杆菌属(Psychrobacter)、类芽孢杆菌属(Paenibacillus)、小短杆菌属(Brachybacterium)、副拟杆菌属(Parabacteroides)、希瓦氏菌属(Shewanella)、普罗威登斯菌属(Providencia)、短杆菌属(Brevibacterium)、罗斯拜瑞氏菌属(Roseburia)、念珠菌属(Candida)、瘤胃球菌属(Ruminococcus)、花椰菜花叶病毒属(Caulimovirus)、月形单胞菌属(Selenomonas)、棍状杆菌属(Clavibacter)、密螺旋体属(Treponema)、短小杆菌属(Curtobacterium)、苏黎世杆菌属(Turicibacter)、欧文氏菌属(Erwinia)、栖叶菌属(Frondihabitans)、薄层杆菌属(Hymenobacter)、动球菌属(Kineococcus)、克鲁维酵母属(Kluyveromyces)、马赛菌属(Massilia)、甲基杆菌属(Methylobacterium)、微杆菌属(Microbacterium)、类诺卡氏菌属(Nocardioides)、苍白杆菌属(Ochrobactrum)、假诺卡氏菌属(Pseudonocardia)、根瘤菌属(Rhizobium)、糖多孢菌属(Saccharopolyspora)、血杆菌属(Sanguibacter)、申氏菌属(Shinella)、鞘氨醇杆菌属(Sphingobacterium)、Sugiyamaella属、金黄杆菌属(Chryseobacterium)、气单胞菌属(Aeromonas)、无色杆菌属(Achromobacter)、芽殖单胞菌属(Blastomonas)、泛菌属(Pantoea)、代尔夫特菌属(Delftia)、无氧芽孢杆菌属(Anoxybacillus)、鲍特氏菌属(Bordetella)、分枝杆菌属(Mycobacterium)、拟杆菌属(Bacteroides)、短波单胞菌属(Brevundimonas)、红球菌属(Rhodococcus)、双歧杆菌属(Bifidobacterium)、小浴氏菌属(Kosakonia)、链霉菌属(Streptomyces)、脱硫弧菌属(Desulfovibrio)、鞘氨醇菌属(Sphingobium)、Thermothelomyces属、解黄酮菌属(Flavonifractor)、鞘氨醇单胞菌属(Sphingomonas)、梭孢壳属(Thielavia)、Lachnoclostridium属、鞘氨醇盒菌属(Sphingopyxis)、巨大球菌属(Macrococcus)、贪铜菌属(Cupriavidus)、莫拉氏菌属(Moraxella)、普雷沃氏菌属(Prevotella)、瘤胃梭菌属(Ruminiclostridium)、慢生根瘤菌属(Bradyrhizobium)、弯曲杆菌属(Campylobacter)、梭菌属(Clostridium)、寡养单胞菌属(Stenotrophomonas)、伯克霍尔德氏菌属(Burkholderia)、表皮杆状菌属(Cutibacterium)、黄单胞菌属(Xanthomonas)、沙雷氏菌属(Serratia)、埃希氏菌属(Escherichia)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)、贪噬菌属(Variovorax)、食酸菌属(Acidovorax)、不动杆菌属(Acinetobacter)、芽孢杆菌属(Bacillus)、柠檬酸杆菌属(Citrobacter)、棒杆菌属(Corynebacterium)、肠杆菌属(Enterobacter)、肠球菌属(Enterococcus)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、假单胞菌属(Pseudomonas)、柔武氏菌属(Raoultella)和沙门氏菌属(Salmonella)。

获得序列数据的步骤可以包括制备测序文库。获得序列数据可以包括下一代测序或微阵列分析。多个核酸序列可以是DNA或RNA序列。在识别一种或多种微生物特征之前，可以从序列数据中过滤出对应食品的序列。

识别一种或多种微生物特征的步骤可包括将序列数据与微生物核酸序列的一个或多个数据库进行比较。

确定一种或多种微生物特征是否对应与食品的特定来源或特定污染物相关的一种或多种微生物特征的步骤可以包括将一种或多种微生物特征与特定来源相关的微生物特征的一个或多个数据库进行比较；或者将一种或多种微生物特征与特定污染物相关的微生物特征的一个或多个数据库进行比较。

本文公开的任何方法可以在食品的食物生产链中的两个或更多个点处进行。方法还包括将来源或污染物追踪至食品的特定供应商。

另一方面，本文公开了一种用于认证食品来源的系统，包括一个或多个处理器和存储器，该存储器包括可由一个或多个处理器执行的指令，当由一个或多个处理器执行时，使系统：获得食品中存在的多个核酸序列的序列数据；识别序列数据中的一种或多种微生物特征，其中一种或多种微生物特征对应食品中存在的一种或多种微生物；以及通过确定一种或多种微生物特征是否对应与食品的特定来源相关的一种或多种微生物特征来认证食品的来源，其中如果一种或多种微生物特征对应与食品的特定来源相关的一种或多种微生物特征，则食品被认证。

另一方面，本文公开了一种用于检测食物生产链中污染物的存在的系统，包括：一个或多个处理器；和存储器，其包含可由一个或多个处理器执行的指令，当由一个或多个处理器执行时，使系统：获得食品中存在的多个核酸序列的序列数据；识别序列数据中的一种或多种微生物特征，其中一种或多种微生物特征对应食品中存在的一种或多种微生物；以及通过确定一种或多种微生物特征是否对应与特定污染物相关的一种或多种微生物特征来检测食品中的污染物，其中如果一种或多种微生物特征对应与特定污染物相关的一种或多种微生物特征，则污染物被检测到。

另一方面，本文公开了一种用于识别食品来源的系统，包括：一个或多个处理器；和存储器，其包含可由一个或多个处理器执行的指令，当由一个或多个处理器执行时，使系统：获得食品中存在的多个核酸序列的序列数据；识别序列数据中的一种或多种微生物特征，其中一种或多种微生物特征对应食品中存在的一种或多种微生物；以及通过确定一种或多种微生物特征是否对应与食品的特定来源相关的一种或多种微生物特征来识别食品的来源，其中如果一种或多种微生物特征对应与食品的特定来源相关的一种或多种微生物特征，则食物来源被识别出。

附图说明

图1是描绘认证食品来源的方法的流程图。

图2是描绘用于识别食品的微生物特征的示例性数据分析过程的流程图。虚线表示可以使用对应与特定食物来源相关的微生物的核酸序列数据库直接进行微生物识别。

图3是用于用一种微生物认证食物来源的示例性决策树。

图4是用于用一种微生物进行食物来源认证的工作示例的决策树。

图5是用与多种食物来源相关的多种微生物进行食物来源认证的示例性决策树。每个阶段不考虑相同的食物来源。g、g-1、g-2对应不同的食物来源。

图6是用于用与多种食物来源相关的多种微生物进行食物来源认证方法的工作示例的决策树。每个阶段不考虑相同的食物来源。除了迭代减少之外，物种的存在与否或相对水平的组合特征也可以应用于相同的过程。表1-5显示了在各种材料中发现的细菌数据库的示例。

具体实施方式

以下描述阐述了示例性方法、条件等，并且不旨在限制本公开的范围。相反，其被提供作为示例性实施方式的描述。

I.概述

本文公开了用于认证食品、识别食物来源和/或检测食品中的污染物的方法和系统。本文公开的方法和系统基于对对应食物样品中存在的一种或多种微生物的微生物特征的分析。不同来源的食品具有不同的微生物特征，其可用于识别食品的来源、识别可能的污染物，甚至识别用于交付产品的供应链。

尽管以下描述使用术语第一、第二等来描述各种要素，但是这些要素不应受这些术语限制。这些术语仅用于区分一个要素与另一个要素。

在本文描述的各种实施方式的描述中使用的术语仅是为了描述特定实施方式的目的并且不旨在进行限制。如在各种描述的实施方式和所附权利要求的描述中使用的，单数形式“一个”、“一种”和“该”也旨在包括复数形式，除非上下文清楚地另有说明。还应当理解，本文所使用的术语“和/或”是指并涵盖相关列出项目中的一个或多个的任何和所有可能的组合。还应当理解，当在本说明书中使用时，术语“包括(includes、including)”和/或“包含(comprises、comprising)”指定所陈述的特征、整数、有理数、步骤、操作、要素和/或组件的存在，但不排除一个或多个其他特征、整数、有理数、步骤、操作、要素、组件和/或其组的存在或添加。

根据上下文，术语“如果”可以被解释为表示“在...时”或“当...时”或“响应于确定”或“响应于检测到”。类似地，根据上下文，短语“如果确定”或“如果检测到[所陈述条件或事件]”可以被解释为意指“当确定”或“响应于确定”或“在检测到[所陈述条件或事件]”或“响应检测到[所陈述条件或事件]”。

术语“微生物组”或“微生物群”可以以本领域中的含义和/或意图来使用，但是如本说明书中所使用的，这些术语可以被解释为涵盖本领域技术人员所使用的任何含义和/或意图，除非另有说明。

宏基因组学通常涉及从环境(如食品或食物工厂表面或食物加工设备表面)获得的遗传物质的研究，并允许分析样品，而无需从样品中存在的单个物种中分离遗传物质。宏基因组学允许以公正、高通量和全面的方式对食物样品进行分析。然而，用于食物认证的目前大多数基于核酸的方法依赖于通过直接分析对应原材料的序列来认证食物原材料的来源，如果在认证之前去除来源，则可能无法正确认证食物。

给定的原材料可以来自多个不同的来源。例如，动物粉，例如鸡肉粉，可能来源自不同的地理区域、品系或品种、饲养和居住条件等。特定的食物来源可以与特定的微生物组组成相关联，并可用于识别食物来源的来源。

“微生物组”或“微生物群”通常涉及环境中存在的微生物的群落。特定食品的微生物组组成的转变(shift)将反映用于生产食品的原材料的变化。例如，来自不同地理来源的鸡肉的存在会导致微生物组的变化。

此外，鸡肉产品中猪肉来源的存在会导致食物来源中存在的微生物发生变化，并可能表明供应链中存在污染。即使污染物在食物生产的后续步骤中被去除，微生物组的这种转变仍然存在。因此，对特定食物样品中存在的微生物的分析可用于间接识别和认证食物来源、供应链问题以及供应链内可能的污染。

本文公开的方法和系统提供用于食物来源识别和认证的端到端追溯。本文描述的方法不依赖于食物来源或原材料的直接识别，而是依赖于基于食品中存在的微生物组特征的食品的间接认证。分析来自食物样品中存在的核酸的序列数据以识别一种或多种微生物特征。微生物特征可以代表针对特定食品获得的宏基因组数据的子集。可以通过分析数据以靶向方式确定微生物特征，以识别与具体感兴趣的来源相关的特定的微生物集。可选地，可以以公正的方式分析序列数据，以识别对应检测微生物组组成中的偏差的微生物特征，其然后可以追踪到特定来源。微生物特征的识别及其认证食品来源的用途可不依赖于对应食物原材料本身的序列数据。

此外，一旦已识别出或认证了来源，本文公开的方法可用于将食品的来源追溯到特定供应商。例如，如果识别出优选的食物来源，测试生产者可以将来源追踪到特定供应商。生产者随后可以使用本文公开的方法基于与食物来源相关的微生物来认证食品来源自相同的食物来源。此外，如果识别出不期望的微生物特征或食物来源，则可以追溯到供应商，此时生产商可以寻求纠正措施或寻找不同的供应商。

因此，该方法和系统允许提高识别和认证食品来源的准确性和可靠性。

图1-6提供了用于认证食品的食物来源的方法的示例性实施方式，其中食品的序列数据用于识别一种或多种微生物特征，所述微生物特征可用于基于食品中存在的微生物来确定食物来源。

图1描绘了用于食品认证的方法100的示例性流程图。在102，方法可以响应于事件或调查活动而启动。事件或调查活动可以作为食物生产线的任何点期间的定期监控过程的一部分实施，或者被实施来认证从新供应商收到的原材料。在104，事件或调查活动提示在例如工厂水平、供应商水平或出于产品测试目的实施认证方法。方法可以在食物生产链的每一级期间的一个或多个特定点实施。此外，在食物生产链的每级，可以评估一种或多种食品。

在106，以指定的测试水平从食品生成样品。样品生成可能涉及食物矩阵核酸(food matrix nucleic acid)的制备。样品在指定地点制备，例如内部或外部实验室(108)。一旦内部或外部实验室收到物理样本，在步骤110对样品进行处理。在样品处理期间中，从物理样本中提取核酸(如，DNA)，制备测序文库(如，DNA文库)，分析文库(如，通过将文库加载到微阵列或测序仪上)，并生成数据。可以使用本领域已知的任何已知的核酸提取和文库制备方法。例如但不限于，可以对新鲜收集的或冷冻的样品进行核酸提取，并使用任何可用的提取技术例如苯酚：氯仿：异戊醇提取或通过使用任何适当的市售试剂盒。可以使用提供核酸序列数据的任何可用技术来分析测序文库，诸如但不限于下一代测序、qPCR、质谱法、色谱法、微阵列、原位测序、探针杂交及其任意组合。测序文库的制备将取决于所使用的分析技术，并且可以根据制造商的说明进行制备。

生成的数据在112处作为输入数据(如，DNA序列数据)传输到组织(114)的中央位置。中央位置可以是用户可访问的，诸如笔记本电脑、外部硬盘驱动器、数据湖(data lake)或云、或组织中的任何其他本地或集中式系统、或可作为组织的服务使用的数据存储位置。传输的数据可以从内部实验室或外部来源提供，并且可以存储在中央位置直到进一步的下游分析。在116，分析平台访问来自中央位置的数据。分析平台将包含能够分析序列数据的一个或多个数据库或软件。核酸序列的分析可以包括但不限于将序列与一个或多个数据库进行比较；按大小、质量或起源过滤序列读数；对样品进行去多重检测(de-multiplexing)；序列映射；读数量化；或其任意组合。可以使用任何合适的分析平台，诸如包括公开可用的软件或数据库的平台，或者内部软件或数据库。

使用分析平台对数据进行分析会产生一个或多个来源确定结果(118)。一个或多个来源确定结果可以被包括在内部或外部报告中，其可以被报告为物理报告，或者被显示在用户界面中。例如，用户界面可以显示一个或多个来源确定结果并允许用户导航和细化结果。另外，用户界面可允许用户比较对应不同食品、不同批次的相同食品、食物生产链中不同批次的相同产品批次或其任意组合的一个或多个来源确定结果。在一些情况下，序列数据分析可以包括确定对应食品中的一种或多种微生物的一种或多种微生物特征。

图2描绘了用于识别对应食品中的一种或多种微生物的一种或多种微生物特征的示例性分析方法(方法200)。一种或多种微生物特征对应食物样品中存在的所有微生物，或部分列表。例如，一种或多种微生物特征可以对应食品中存在的仅一种微生物。已知食物中存在的微生物包括但不限于属于以下属的那些：副地芽孢杆菌属、布劳特氏菌属、另类弧菌属、产卟啉杆菌属、志贺氏菌属、解硫胺素芽孢杆菌属、厌氧棒状菌属、发光杆菌属、红色杆菌属、拉氏杆菌属、丁酸弧菌属、泰泽雷拉菌属、格里蒙特氏菌属、脱氯单胞菌属、雷夫松氏菌属、粪热杆菌属、鼠肠单胞菌属、假交替单胞菌属、假节杆菌属、节杆菌属、巨球形菌属、产乙醇菌属、交替单胞菌属、栖白蚁菌属、微球菌属、真杆菌属、科维尔氏菌属、纤维单胞菌属、栖热菌属、震颤杆菌属、耶尔森氏菌属、诺卡氏菌属、栖微热菌属、魏斯氏菌属、爱德华氏菌属、戈登氏菌属、拉恩氏菌属、默多克氏菌属、大洋单胞菌属、丙酸杆菌属、固氮菌属、爱格士氏菌属、海单胞菌属、四合球菌属、柄杆菌属、阿德勒氏菌属、盐单胞菌属、脂肪杆菌属、丝状杆菌属、戈登氏杆菌属、噬甲基菌属、游动放线菌属、高温杆菌属、肥杆菌属、布鲁氏菌属、李斯特氏菌属、甲烷短杆菌属、邻单胞菌属、热厌氧杆形菌属、奇异球菌属、甲烷八叠球菌属、鸡杆菌属、聚球藻属、螺状菌属、辫硫菌属、眉藻属、螺杆菌属、热袍菌属、紫色杆菌属、不滑动菌属、巴恩斯氏菌属、梭杆菌属、鸟杆状菌属、泥杆菌属、阿克曼氏菌属、热脱硫杆菌属、下水道菌属、泰勒虫属、环病毒属、T7病毒属、T4病毒属、α逆转录病毒属、Sp18病毒属、氨基酸球菌属、交替红色杆菌属、丛毛单胞菌属、弓形菌属、气微菌属、片球菌属、变形菌属、别样杆菌属、固氮螺形菌属、地芽孢杆菌属、碱土菌属、土壤杆菌属、弧菌属、克里斯滕森氏菌属、博斯氏菌属、库特氏菌属、哈夫尼菌属、产碱菌属、拟梭菌属、新鞘氨醇菌属、遗忘单胞菌属、摩根氏菌属、拟无枝酸菌属、臭气杆菌属、假黄单胞菌属、阴性球菌属、金色单胞菌属、欧尔森氏菌属、嗜冷杆菌属、类芽孢杆菌属、小短杆菌属、副拟杆菌属、希瓦氏菌属、普罗威登斯菌属、短杆菌属、罗斯拜瑞氏菌属、念珠菌属、瘤胃球菌属、花椰菜花叶病毒属、月形单胞菌属、棍状杆菌属、密螺旋体属、短小杆菌属、苏黎世杆菌属、欧文氏菌属、栖叶菌属、薄层杆菌属、动球菌属、克鲁维酵母属、马赛菌属、甲基杆菌属、微杆菌属、类诺卡氏菌属、苍白杆菌属、假诺卡氏菌属、根瘤菌属、糖多孢菌属、血杆菌属、申氏菌属、鞘氨醇杆菌属、Sugiyamaella属、金黄杆菌属、气单胞菌属、无色杆菌属、芽殖单胞菌属、泛菌属、代尔夫特菌属、无氧芽孢杆菌属、鲍特氏菌属、分枝杆菌属、拟杆菌属、短波单胞菌属、红球菌属、双歧杆菌属、小浴氏菌属、链霉菌属、脱硫弧菌属、鞘氨醇菌属、Thermothelomyces属、解黄酮菌属、鞘氨醇单胞菌属、梭孢壳属、Lachnoclostridium属、鞘氨醇盒菌属、巨大球菌属、贪铜菌属、莫拉氏菌属、普雷沃氏菌属、瘤胃梭菌属、慢生根瘤菌属、弯曲杆菌属、梭菌属、寡养单胞菌属、伯克霍尔德氏菌属、表皮杆状菌属、黄单胞菌属、沙雷氏菌属、埃希氏菌属、葡萄球菌属、链球菌属、贪噬菌属、食酸菌属、不动杆菌属、芽孢杆菌属、柠檬酸杆菌属、棒杆菌属、肠杆菌属、肠球菌属、克雷伯氏菌属、乳杆菌属、乳球菌属、假单胞菌属、柔武氏菌属和沙门氏菌属。

在确定一种或多种微生物特征的示例性方法中，在202接收核酸序列。核酸序列可以对应DNA序列、RNA序列、或DNA和RNA序列两者。核酸序列可以以任何合适的格式提供。在204，可以在适用时实施序列质量控制。序列质量控制可以包括但不限于修剪、长度过滤、测序接头去除、序列分箱或其任何组合。然后分析核酸序列进行微生物识别(206)，其中识别对应一种或多种微生物的一种或多种微生物特征。微生物识别可包括对微生物数据库的分类(如，内部微生物数据库)。微生物数据库可以对特定类别的微生物，诸如病毒数据库或真菌数据库是特有的，或者可以对应大范围的微生物。微生物数据库还可以对应特定食物源或食物来源集中存在的微生物。对应微生物序列的任何合适的数据库可用于微生物识别。数据库可以对应由核苷酸(如，A、T、G或C)的组合构成的核酸序列，或者它们可以对应与微生物核酸编码的一种或多种蛋白质或蛋白质同工型相对应的并且可以包括本领域已知的任何天然和非天然存在的氨基酸残基的氨基酸序列。在微生物识别之后，可以基于一种或多种微生物特征来确认来源(208)。在微生物识别之前，可以执行预过滤步骤以去除对应来源材料的序列(210)。预过滤步骤可以包括使用真菌、植物或动物数据库对序列进行分类。在某些情况下，预过滤可以识别不对应食品中存在的任何微生物的序列读数(如，未映射的序列)。预过滤还可用于识别对应食物原材料的序列读数。在212，然后可以从序列数据中去除预过滤的序列读数。

还可以进行微生物量化(214)。微生物量化可以被确定作为一种或多种微生物的分类单位水平相对丰度，或者作为存在与否确定。微生物量化可以基于对应特定微生物的读数的数量。例如，对应特定微生物的序列的较高读数计数将表明食品中该微生物的较高水平。量化可以基于内部或外部对照样品。在一些情况下，微生物量化可以包括设置阈值。例如，可以基于对应该样品的序列读数是否超过预定阈值来确定微生物的存在与否，预定阈值诸如与参考数据库中的至少一个序列的至少90％、至少95％或100％序列同一性匹配。在微生物量化之后，生成含有独有微生物的矢量数据(216)。该矢量数据用于在218的二次微生物识别。二次微生物识别可以包括例如微生物特征至一个或多个微生物数据库的分类或匹配。例如，对应具体来源材料的内部微生物数据库可用于二次微生物识别。

本文描述的方法可以包括确定一种或多种微生物特征是否对应与特定食物来源或特定污染物相关的一种或多种微生物特征。图3显示了确定微生物特征是否对应与特定食物来源相关的一种或多种微生物的示例性方法(方法300)。方法对应二次微生物分类，并且可涉及针对具体来源材料k(整数k+1……n)的微生物特征至内部微生物数据库的分类或匹配。确定作为迭代过程执行，其中在该过程的每个阶段或步骤仅考虑一种食物来源。在302接收对应样品中发现的任何微生物的微生物特征。在304，分析微生物特征以确定微生物是否存在于食物源k中。如果食物来源k中存在微生物，则在306确认食物来源。可选地，如果食物来源k中不存在微生物，则剔除食物来源(308)。迭代分析以确定食物来源k+1中是否存在微生物。如果食物来源k+1中存在微生物，则确认食物来源(306)，但是如果食物来源k+1中不存在微生物，则剔除食物来源(308)。针对食物来源n进一步迭代分析(312)，其中如果食物来源n中存在微生物，则确认来源(306)，但是如果食物来源n中不存在微生物，则剔除来源(308)。来源确认步骤306可以用于食品的认证。然后将确认的来源追踪到特定供应商(314)。

图4描述了用于食品认证的二次微生物识别的示例(方法400)。二次微生物识别可以通过分类或匹配至具体来源材料的内部微生物数据库来进行。确定作为迭代过程执行，其中在该过程的每个阶段或步骤仅考虑一种食物来源。在此示例中，在样品中发现属于普雷沃氏菌属的微生物(402)。在404，分析微生物特征以确定在马来源中是否存中微生物。基于在马来源中不存在属于普雷沃氏菌属的微生物的确定，在步骤406剔除马作为来源。然后分析微生物特征以确定在对应鸡来源的第二来源中是否存在微生物(408)。基于在鸡来源中不存在属于普雷沃氏菌属的微生物的确定，在步骤406剔除鸡作为食品来源。在410，然后分析微生物特征以确定在对应猪来源的第三来源中是否存在微生物。基于在猪来源中存在属于普雷沃氏菌属的微生物的确定，确认食物来源是猪(412)。在414，经确认的猪来源然后可追踪至供应商。

可以分析多个微生物特征，每个特征对应食品中存在的一种或多种微生物，以识别或认证食物来源。图5显示了使用对应与特定食物来源相关的一种或多种微生物的多个微生物特征来进行食物来源认证的二次微生物识别的示例性方法(方法500)。方法可以涉及分类或匹配至具体来源材料的内部微生物数据库。在该方法中，并行考虑多种微生物特征，但在每个阶段仅考虑一种特定的食物来源或污染物。在每个阶段，如果微生物特征不对应与该阶段所考虑的食物来源或污染物相关的一种或多种微生物，则剔除该食物来源作为可能的来源。与每种食物来源或污染物g、g-1、g-2等相关的一种或多种微生物是不同的。可以重复该方法，直到所有食物来源或污染物n都已经被考虑。可以以迭代方式执行确定，其中在该方法的每一个不同步骤处考虑特定来源。可以首先考虑对应多种来源的微生物，或者可以在首先考虑特定来源特有的微生物之后考虑对应多个来源的微生物。可选地，可以并行地执行确定，其中并行地考虑多种来源。

在步骤502接收对应样品中存在的任意j微生物的微生物特征。在504、508、510和512中的每一步骤，分析在502获得的一种或多种微生物特征以确定它们是否对应与食物来源g(整数1…n)相关的任意微生物j(整数1…n)。例如，在504，分析微生物特征以确定在g来源中是否存在任意j微生物。如果在g来源中不存在j微生物，则剔除g来源(506)。可选地，如果在g来源中存在j微生物中的一种或多种，则确认g来源。在504之后，分析一种或多种微生物特征以确定在g-1来源中是否存在任意j微生物(508)。如果在g-1来源中不存在j微生物，则在506剔除g-1来源。如果在g-1来源中存在j微生物中的一种或多种，则确认g-1来源。类似地，在510，分析微生物特征以确定在g-2来源中是否存在任意j微生物。如果在g-2来源中存在j微生物中的一种或多种，则确认g-2来源。在512针对n来源迭代该方法，其中分析微生物特征以确定在n来源中是否存在任意j微生物。如果在n来源中不存在j微生物，则在506剔除n来源。如果在n来源中存在j微生物中的一种或多种，则确认n来源。在516，任何经确认的来源都被追踪至供应商。

图6显示了用于使用多种微生物特征进行食品来源认证的二次微生物识别的示例(方法600)。二次微生物分类可以通过将微生物特征分类或匹配至具体来源材料的内部微生物数据库来进行。在602接收对应食物样品中发现的总共90种微生物的微生物特征。在604，识别了属于柠檬酸杆菌属、乳杆菌属和乳球菌属的微生物。已知在该示例性实施方式中分析的所有五种来源(骨粉、玉米粉、蛋、鱼粉和家禽粉)中均存在这些微生物。在606，识别了来自寡养单胞菌属和黄单胞菌属(Xanthomnas)的微生物。已知这些微生物存在于骨粉、玉米粉、蛋和鱼粉来源中，但已知不存在于鸡肉粉中。在608，剔除鸡肉粉作为可能的来源。在610，识别了属于脱硫弧菌属、解黄酮菌属和莫拉氏菌属的微生物。已知来自这些属的微生物存在于骨粉、家禽粉和鱼粉中。在步骤612，剔除家禽粉、蛋和玉米粉作为可能的来源。在步骤614，识别了属于丛毛单胞菌属和库特氏菌属的微生物。已知这些微生物存在于骨粉、家禽粉和鱼粉中。在616，剔除家禽粉、蛋和玉米粉作为可能的来源。识别了属于固氮菌属、丁酸弧菌属(Butyrivbio)、柄杆菌属和拉恩氏菌属的微生物。已知这些属的微生物存在于骨粉中。因此，在步骤618，来源被确认为骨粉，而在620剔除家禽粉和鱼粉作为来源。在622，随后追踪来源至骨粉供应商。

对于特定食品，可以认证或识别一种或多种不同的食物来源。来源可以对应食品的已知食物来源，例如标签上成分的来源，或者对应原材料的优选供应商。食品来源的认证或识别也可以在食物生产链的多个步骤中进行。

与本文公开的方法类似的方法可用于检测食品中污染食物来源的存在。微生物特征可以对应与特定污染物相关的微生物。然后可以通过与特定污染物食物来源相关的微生物数据库进行比较来分析微生物特征，从而允许检测污染物。

特定食物来源或污染物也可以追溯到特定的供应商。在对食物来源进行认证或识别之后，食物来源或污染物也可以追溯到特定的供应商。例如，可以检测在食物生产期间食品的污染并追溯到特定供应商。对来自鸡肉食品的微生物特征进行分析后，可以在食物生产链的一个点期间识别猪肉来源。猪肉来源可以对应例如污染的食物来源。然后，猪肉来源可以与特定供应商为食物生产链的该步骤提供的来源进行匹配。然后识别猪肉食物来源的供应商，并在一番调查后，供应商可能发现，例如，鸡肉原材料与猪肉原材料储存在同一运输单元中。猪肉来源的存在会导致可检测到的食品微生物组的偏差，即使鸡肉来源不再靠近食物来源之后也是如此。食品生产商可能会认为特定的鸡肉来源受到了损害。然后，生产商可能决定实施纠正措施，诸如向供应商发出警告或完全更换为不同的供应商。以此方式，本文公开的方法可用于在食物生产过程期间食物来源或污染物的端到端追溯。通过在食物生产链的一个或多个步骤认证食物来源，生产商可以确保食品中没有掺假，并证明其真实性。

II.核酸序列数据

本文公开的方法包括获得食品中存在的多种核酸序列的序列数据。序列数据可以对应食物样品中存在的任何核酸。例如，序列数据可以对应多个DNA和/或RNA序列。多个核酸序列可以对应来自食物样品中存在的一种或多种微生物的核酸，或者对应来自食品的核酸。

获得序列数据可以包括从食品中提取核酸。可以使用本领域已知的提取核酸的方法。不受限制地，可以使用TrizolLS试剂、苯酚：氯仿：异戊醇提取或等同物来提取核酸。也可以使用市售试剂盒进行核酸提取，诸如Ambion RNA分离试剂盒(如，Purelink RNA Mini试剂盒或DynaBeads mRNA直接微试剂盒)、MAgmax FFPE总核酸分离试剂盒、Pall DNA和RNA纯化试剂盒、Qiagen Allprep、PowerViral、Powersoil或PowerMag试剂盒、NEBNext微生物组DNA富集试剂盒或等效产品。可以使用冷冻或新鲜样品进行核酸提取。例如，可以在核酸提取之前固定食品。核酸提取还可以包括细胞裂解的步骤。细胞裂解可以通过本领域技术人员已知的任何方法进行，包括但不限于使用裂解酶(诸如溶菌酶、溶葡萄球菌素、变溶菌素、蛋白酶K、枯草杆菌蛋白酶或其任意组合)的酶裂解；物理剪切，例如利用玻璃珠、超声处理、超声波或高压；以及本领域技术人员已知的任何其他细胞裂解方法。

应当理解，本教导考虑了可以使用所有可用的各种技术、平台或技术获得的序列数据，包括但不限于：毛细管电泳、微阵列、基于连接的系统、基于聚合酶的系统、基于杂交的系统，原位测序、直接或间接核苷酸识别系统、焦磷酸测序、基于离子或pH的检测系统、基于电子特征的系统等。

可以通过本领域可用的任何方法获得序列数据，诸如通过核酸测序(如，下一代测序)或微阵列分析。本文公开的方法不依赖于特定的下一个测序技术，并且用户需要根据制造商的方案对预期的下游测序平台做出适当的选择。可用于根据本文公开的方法获得序列数据的示例性测序平台包括但不限于由Oxford Nanopore^TM、Ion Torrent^TM、Roche^TM、Pacific Biosciences^TM和Life Technologies^TM生产的那些测序平台。

根据与方法一起使用的测序技术，可以制备测序文库。测序文库将代表食品中存在的核酸，并且可与下一代测序平台一起使用。测序文库制备可包括核酸片段化、样品索引、接头连接和文库标准化。样本索引或条形码化允许同时运行多个样本，充分利用当前测序平台的高通量特性。接头连接是对制造商协议特有并且标准的测序平台。接头可以包含测序平台特有的末端序列和索引序列，以允许序列数据被样品去卷积(de-convolution)。条形码化和接头连接可通过本领域技术人员已知的任何方法进行，并且可适用于利用特定测序平台分析测序文库。文库制备还可以包括测序文库的扩增、浓缩或稀释。文库可以以平台特异性的DNA浓度进行制备，并且通常需要扩增、浓缩或稀释以达到所需的浓度。测序文库中核酸的浓度可以通过使用本领域已知的平台具体制造商方案或基于荧光的测量的量化实时测定来确定。在一些情况下，制备测序文库包括选择性富集特异性靶核酸或区域。

以平台特异性的方式确定单个分子的核苷酸序列以产生原始数据集。原始数据集可以转换为对应测序文库中每个分子的核苷酸测序信息。所得产品是整个“读数”，其可以被处理以确定有关食品的信息。序列数据可以以任何格式生成，诸如BAM文件，其独立于测序平台并可准备用于生物信息学分析。额外的文件类型可以包括FASTA和FASTQ文件格式，或可以转换为BAM、VCF、FASTQ或FASTA格式的其他制造商特有格式。

一旦获得，序列数据的总碱基对达到足够的大小以供分析，就可以实时将序列数据从用于生成序列数据的仪器传输，或者可以将其存储在数据库中直到进一步分析。

然后可以准备序列数据用于进一步分析。准备可以包括进行序列质量控制、修剪、长度过滤、测序接头去除和/或通过来自测序读数的分子条形码对读数进行装箱(bin)。具体地，可以对代表来自食品的多个核酸序列的读数进行质量控制，以去除接头序列、由于PCR扩增导致的克隆读数以及平台特异性序列错误，并进行过滤以实现可接受的错误率。测序数据中的测序读数可以被解构为，例如，特定大小的k-mer。还可以对序列数据中的测序读数进行序列组装、映射或成对比较。在一些情况下，在进一步分析之前，可以从序列数据中过滤或去除对应食品或另一种试剂的核酸序列。

III.微生物特征

本文描述的方法可以包括识别序列数据中的一种或多种微生物特征。一种或多种微生物特征可对应食品中存在的一种或多种微生物。微生物特征可以对应特定的分类水平，诸如界、门、纲、属、物种、血清型或菌株。食物来源中存在的微生物可以是微生物真核生物、细菌、古细菌、真菌或病毒。

识别一种或多种微生物特征可以包括将序列数据与一个或多个数据库进行比较。数据库可以包含来自微生物的特定组的序列(如，核酸序列或氨基酸序列)。例如，数据库可以对应来自与特定食物来源或特定污染物相关的微生物的核酸序列。这些数据库可对应具体的微生物分类单元、特定的属或微生物物种的集合。可以使用适合微生物识别的任何公开可用的数据库。可选地，可以生成内部数据库并用于识别微生物特征。

识别一种或多种微生物特征可以包括确定对应食品中的特定微生物的序列数据中的核酸的相对水平。微生物特征中核酸的相对水平可以指示微生物的相对水平并且可以用于确定食品中食物来源或污染物的相对丰度。可以设置阈值，并且对应高于预定阈值的微生物的相对水平的任何微生物特征将指示特定食物来源或污染物的存在。阈值可以根据例如Ct值、核酸拷贝数、浓度(如，以mg/mL或mg/L为单位)等设置。

食物样品中存在的微生物可与特定的食品来源或污染物有关。食物来源可以是真菌、植物或动物起源的。植物起源的来源可包括但不限于玉米、稻、小麦、大豆、花生、树坚果(tree nut)或其任何品种，或可用于食品生产的任何其他植物来源，例如驯化或野生植物作物。玉米粉是常用的植物起源的食物来源。真菌起源的来源可对应酵母、霉菌或蘑菇。动物起源的食物来源可以来自但不限于鱼肉、牛肉、山羊、蛋、猪肉、家禽肉或贝类。动物起源可对应各种肉类，例如犬科动物、猫科动物、马科动物、牛科动物或羊科动物的肉，或来自任何其他来源的肉，例如来自野味动物的肉。蛋、家禽粉、鱼粉和骨粉是常用的动物起源的原材料的示例。还可以识别适合食物生产的任何其他动物食物来源。

在一些情况下，一种或多种微生物特征对应与特定地理区域相关的一种或多种微生物。不受理论的限制，由于某些有利条件(如，土壤组成、气候、温度、海拔、地形、人类管理等)的存在，特定的微生物可能存在于特定的区域中。然而，相同的微生物在该地理区域之外可能不存在或很少观察到，并因此将主要在来自该地理区域的食物来源中检测到。例如，可以在来自一个特定区域的植物品种中检测到特定微生物或该微生物的特定物种，但不会从不同区域的类似品种中检测到。食品中存在微生物或特定物种将表明原材料来自可以发现微生物的特定区域。地理区域可仅限于特定的农场或田地，或者可以扩展到共享相同地形和气候的更大地理区域。

微生物特征可以对应细菌、病毒、古细菌或真核微生物中的一种或多种。可在食物中存在的示例性微生物包括但不限于属于选自由以下组成的组的属分类的微生物：副地芽孢杆菌属、布劳特氏菌属、另类弧菌属、产卟啉杆菌属、志贺氏菌属、解硫胺素芽孢杆菌属、厌氧棒状菌属、发光杆菌属、红色杆菌属、拉氏杆菌属、丁酸弧菌属、泰泽雷拉菌属、格里蒙特氏菌属、脱氯单胞菌属、雷夫松氏菌属、粪热杆菌属、鼠肠单胞菌属、假交替单胞菌属、假节杆菌属、节杆菌属、巨球形菌属、产乙醇菌属、交替单胞菌属、栖白蚁菌属、微球菌属、真杆菌属、科维尔氏菌属、纤维单胞菌属、栖热菌属、震颤杆菌属、耶尔森氏菌属、诺卡氏菌属、栖微热菌属、魏斯氏菌属、爱德华氏菌属、戈登氏菌属、拉恩氏菌属、默多克氏菌属、大洋单胞菌属、丙酸杆菌属、固氮菌属、爱格士氏菌属、海单胞菌属、四合球菌属、柄杆菌属、阿德勒氏菌属、盐单胞菌属、脂肪杆菌属、丝状杆菌属、戈登氏杆菌属、噬甲基菌属、游动放线菌属、高温杆菌属、肥杆菌属、布鲁氏菌属、李斯特氏菌属、甲烷短杆菌属、邻单胞菌属、热厌氧杆形菌属、奇异球菌属、甲烷八叠球菌属、鸡杆菌属、聚球藻属、螺状菌属、辫硫菌属、眉藻属、螺杆菌属、热袍菌属、紫色杆菌属、不滑动菌属、巴恩斯氏菌属、梭杆菌属、鸟杆状菌属、泥杆菌属、阿克曼氏菌属、热脱硫杆菌属、下水道菌属、泰勒虫属、环病毒属、T7病毒属、T4病毒属、α逆转录病毒属、Sp18病毒属、氨基酸球菌属、交替红色杆菌属、丛毛单胞菌属、弓形菌属、气微菌属、片球菌属、变形菌属、别样杆菌属、固氮螺形菌属、地芽孢杆菌属、碱土菌属、土壤杆菌属、弧菌属、克里斯滕森氏菌属、博斯氏菌属、库特氏菌属、哈夫尼菌属、产碱菌属、拟梭菌属、新鞘氨醇菌属、遗忘单胞菌属、摩根氏菌属、拟无枝酸菌属、臭气杆菌属、假黄单胞菌属、阴性球菌属、金色单胞菌属、欧尔森氏菌属、嗜冷杆菌属、类芽孢杆菌属、小短杆菌属、副拟杆菌属、希瓦氏菌属、普罗威登斯菌属、短杆菌属、罗斯拜瑞氏菌属、念珠菌属、瘤胃球菌属、花椰菜花叶病毒属、月形单胞菌属、棍状杆菌属、密螺旋体属、短小杆菌属、苏黎世杆菌属、欧文氏菌属、栖叶菌属、薄层杆菌属、动球菌属、克鲁维酵母属、马赛菌属、甲基杆菌属、微杆菌属、类诺卡氏菌属、苍白杆菌属、假诺卡氏菌属、根瘤菌属、糖多孢菌属、血杆菌属、申氏菌属、鞘氨醇杆菌属、Sugiyamaella属、金黄杆菌属、气单胞菌属、无色杆菌属、芽殖单胞菌属、泛菌属、代尔夫特菌属、无氧芽孢杆菌属、鲍特氏菌属、分枝杆菌属、拟杆菌属、短波单胞菌属、红球菌属、双歧杆菌属、小浴氏菌属、链霉菌属、脱硫弧菌属、鞘氨醇菌属、Thermothelomyces属、解黄酮菌属、鞘氨醇单胞菌属、梭孢壳属、Lachnoclostridium属、鞘氨醇盒菌属、巨大球菌属、贪铜菌属、莫拉氏菌属、普雷沃氏菌属、瘤胃梭菌属、慢生根瘤菌属、弯曲杆菌属、梭菌属、寡养单胞菌属、伯克霍尔德氏菌属、表皮杆状菌属、黄单胞菌属、沙雷氏菌属、埃希氏菌属、葡萄球菌属、链球菌属、贪噬菌属、食酸菌属、不动杆菌属、芽孢杆菌属、柠檬酸杆菌属、棒杆菌属、肠杆菌属、肠球菌属、克雷伯氏菌属、乳杆菌属、乳球菌属、假单胞菌属、柔武氏菌属和沙门氏菌属。

微生物特征可以对应与一种食物源或污染物相关的一种或多种微生物。与一种食物来源或污染物相关的微生物包括但不限于实施例的表1中列出的微生物。在一些情况下，微生物特征可以对应与两种或更多种食物来源或污染物相关的一种或多种微生物。与两种或更多种食物源或污染物相关的微生物包括但不限于实施例的表2-5中列出的那些。微生物可以与至少两种食物来源或污染物相关，或者它们可以与多于两种食物来源相关，例如三种或四种食物来源或污染物。

IV.系统

一方面，本公开提供了用于执行本文描述的任何方法的系统。

该系统可以被配置为认证食品的来源。例如，系统可以包括一个或多个处理器以及包括可由该一个或多个处理器执行的指令的存储器。当由一个或多个处理器执行时，指令可以使系统获得食品中存在的核酸序列的序列数据；识别序列数据中的一种或多种微生物特征；并认证食品的来源。系统还可以被配置为确定一种或多种微生物特征是否对应与特定来源相关的微生物，并且如果微生物特征对应与产品的已知来源相关的微生物，则认证食物来源。

系统还可以被配置用于识别食品的食物来源，或者用于检测食品中污染物的存在。

V.计算机可读存储设备中的方法

本文描述的任何方法可以通过存储在一个或多个计算机可读介质(如，存储器、磁存储器、光存储器等)中的计算机可执行指令或代码来实现。这样的指令可以使一个或多个处理器实现方法。

实施例

实施例1：

该实施例描述了用于食物来源认证的微生物来源端到端追溯方法。方法利用来自原材料的微生物组数据，通过使用食物样品中存在的核酸的高通量测序数据来认证原材料的内容物(contents)。

图1显示了食物来源认证的方法的概述。样品是在工厂中食物制造过程的任何可识别部分收集的，并且可以包括任何性质的原材料或成品。然后使用商业试剂盒或使用其他方法提取核酸(DNA或RNA)，例如苯酚-氯仿-异戊醇试剂、Trizol LS或涉及使用与苯酚组合的硫氰酸胍的其他试剂。提取的核酸经由RNALater、β-巯基乙醇或等效化学试剂等保护剂进行保存。核酸立即使用或储存以供以后分析。在RNA样品的情况下，样品在进一步使用之前进行逆转录。提取的核酸可以进行选择性扩增以富集具体区域，或者可以进行基因组规模扩增以用于进一步分析。然后通过商业试剂盒或制备测序文库的特异性试剂的整理(collation)的一种或多种手段来制备测序文库。然后将测序文库应用到芯片上，使用高通量测序仪(诸如Illumina、Oxford Nanopore、ThermoFisher的Ion Torrent、PacBio平台或等效平台)进行测序。

可选地，通过剪切和用于荧光或化学发光检测的分子检测试剂标记来制备用于微阵列应用的核酸。质谱、毛细管凝胶电泳和高效液相色谱法也可用于生成核酸内容物的具体模式。随后对具体分子进行详细分析，无论是来自分离技术的输出、来自微阵列还是来自其他固体表面捕获技术。在使用或不使用高通量测序的情况下，这些方法中的任何一种都可以组合使用来生成核酸序列数据。

然后，通过应用几个步骤，借助生物信息学对序列数据进行分析，包括数据质量检查和过滤、创建对应已知物种的核酸序列的数据库、去除数据中不感兴趣的任何具体部分(诸如其他真核生物)或具体的微生物物种，然后从序列数据中识别微生物特征。图2描述了序列数据分析过程的概述。

将识别出的微生物特征与具体来源的已知微生物特征相匹配，以确定微生物的来源。对具体来源独有的任何微生物都可以确认具体原材料的污染(图3)。例如，在家禽粉中猪独有的细菌物种的存在表明猪肉污染(图4)。还可以使用对应与多于一个来源相关的多种微生物的微生物特征来进行认证(图5和图6)。食物来源也可以在不完全识别食品中存在的所有微生物的情况下进行认证。表1-5中总结了与特定食物来源相关的微生物属。

表1：各种食物原材料独有的属分类水平下的细菌特征。

/>

表2：任意两种食物原材料共有的属分类水平下的细菌特征

/>

表3：任意三种食物原材料共有的属分类水平下的细菌特征。

表4：任意四种食物原材料共有的属分类水平下的细菌特征。

表5：所有五种食物原材料共有的属分类水平下的细菌特征。

骨、鸡、玉米、鱼和蛋
	食酸菌属
不动杆菌属
	芽孢杆菌属
柠檬酸杆菌属
	棒杆菌属
肠杆菌属
	肠球菌属
克雷伯氏菌属
	乳杆菌属
乳球菌属
	假单胞菌属
柔武氏菌属
	沙门氏菌属

实施例2：

该实施例描述了使用宏基因组过滤和微生物特征来认证食物样品。

材料和方法

从序列数据中识别微生物特征可以按照以下描述，或者按照2021年Beck,K.L.等人，《NPJ食品科学》，5(1):3(Beck,K.L.,et al.(2021)NPJ Sci Food,5(1):3)描述进行。这些步骤根据用于获取序列数据的特定平台的要求进行修改。基于对任意DNA或RNA序列的分析，可以使用等效方法来获取有关微生物物种存在与否或相对水平的信息。

样品收集、制备和测序

动物粉、玉米粉或蛋粉样品是从美国当地市场收集的。2019年，Haiminen,N.等人，《NPJ食品科学》，3:24(Haiminen,N.,et al.(2019)NPJ Sci Food 3:24)先前描述了这些样品的样品制备、总RNA提取和完整性确认、cDNA构建和文库构建。

这些样品被用于根据2017年Chen,P.等人，《病原体》，6:68(Chen,P.,et al.(2017)Pathogens 6:68)的描述提取总RNA，以及根据以下的描述提取总DNA(2016年，Weis,A.M.等人，《应用和环境微生物学》，82:7165-7175(Weis,A.M.,et al.(2016).Appl.Environ.Microbiol82:7165-7175)；2017年，Emond-Rheault,J.-G.等人，《微生物学前言》，8:996(Emond-Rheault,J.-G.,et al.(2017)Front.Microbiol.8:996)；2015年，Miller,B.等人，《Kapa Biosyst.Appl.Note》，1-8(2015)(Miller,B.,et al.(2015)KapaBiosyst.Appl.Note 1-8(2015))；2015年，Lüdeke,C.H.M.等人，《基因组通告》，3:2-3(Lüdeke,C.H.M.,et al.(2015)Genome Announc.3:2-3)；2015年Jeannotte,R.等人，《Agil.Appl.Note》，1-8(Jeannotte,R.,et al.(2015)Agil.Appl.Note 1-8)；2016年，Arabyan,N.等人，《科学报告》，6:29525(Arabyan,N.,et al.(2016)Sci Rep 6:29525))。利用Nanodrop(Nanodrop Technologies,Wilmington,DE,USA)和BioAnalyzer RNA试剂盒(Agilent Technologies Inc.,Santa Clara,CA,USA)(2017年，Chen,P.等人，《病原体》6:68(Chen,P.,etal.(2017)Pathogens 6:68))确认DNA和RNA纯度(A_260/230和A_260/280比率≥1.8)和完整性。随后，无论何处使用RNA，都使用RNA(4至15μg总输入)和SuperScript双链cDNA合成试剂盒(Invitrogen,目录号11917-020,Life Technology Carlsbad,CA)构建cDNA。DNA处理不需要该特定步骤。

使用HyperPrep Plus(Kapa BioSystems,Wilmington,MA,USA)cDNA/DNA的测序文库根据之前描述进行构建(2017年，Chen,P.等人，《病原体》，6:68(Chen,P.,et al.(2017)Pathogens 6:68)；2017年，Chen,P.等人，《应用和环境微生物学》，83(Chen,P.,et al.(2017)Appl Env.Microbiol83)；2014年，Kol,A.等人，《干细胞与发育》，23:1831-1843(Kol,A.,et al.(2014)Stem Cells Dev 23:1831-1843))，其中插入片段大小在300-400bp之间。在提交测序之前，使用qPCR(文库量化试剂盒，目录号KK4824，Illumina,San Diego,CA)进行文库量化。对于除以下样本之外的每个样本，使用具有150个双末端化学的Illumina HiSeq 4000(San Diego,CA)：对于四个初步样品，使用具有100个双末端化学的HiSeq 2000，以及对于两个其他样品(MFMB-04和MFMB-17)，使用具有150个双末端化学的HiSeq 3000。

序列数据质量控制

去除Illumina通用接头并使用Trim Galore(2006年，Morgulis,A.等人，《计算生物学杂志》，13:1028-1040(Morgulis,A.,et al.(2006)J.Comput.Biol.13:1028-1040))修剪读数，其中最小读数长度参数为50个碱基对(bp)。如下所述，使用Kraken软件，使用从PhiX基因组构建的定制数据库(NCBI参考序列：NC_001422.1)过滤得到的读数。经修剪的非PhiX读数用于后续的矩阵过滤和微生物识别步骤。

矩阵过滤过程和验证

利用31bp的k-mer大小，使用Kraken(2014年，Wood,D.E.和Salzberg,S.L.，《基因组生物学》，15:R46(Wood,D.E.,and Salzberg,S.L.(2014)Genome Biol.15:R46))识别和去除与31种常见食物矩阵和潜在污染物真核基因组的预定列表相匹配的读数。这些食物矩阵生物体是基于家禽粉样品以及供应链中大量食物成分的初步真核读数比对实验选择的。由于定制Kraken数据库中的真核基因组大小较大，应用随机k-mer缩减将数据库大小减少58％(使用具有选项“--max-db-size”的Kraken-build)，以便使数据库适合188GB，以进行内存中处理。应用0.1的保守Kraken评分阈值以避免过滤微生物读数。矩阵过滤数据库包括真核基因组的低复杂性和重复区域，以捕获所有可能的矩阵读数。该过滤数据库和评分阈值也用于矩阵过滤，以进行如下所述的计算机上测试。

微生物识别。

利用31bp的k-mer大小，使用Kraken(2014年，Wood,D.E.和Salzberg,S.L.，《基因组生物学》(Genome Biol.)，15:R46)对照微生物数据库对质量控制和矩阵过滤后的剩余读数进行分类，以确定每个样品中的微生物组成。获得了细菌、古菌、病毒和真核微生物的NCBI RefSeq完整基因组(2017年4月检索到～7,800个基因组)。使用具有默认参数的Dustmasker(2006年，Morgulis,A.等人，《计算生物学杂志》，13:1028-1040(Morgulis,A.,et al.(2006)J.Comput.Biol.13:1028-1040))遮蔽基因组的低复杂性区域。将0.05的阈值应用至Kraken评分，旨在最大化结果的F-评分。分类群特异性序列读数用于识别微生物物种的存在与否，其中需要最少10个读数作为阳性存在确定的阈值。

Claims

1.一种用于认证食品来源的方法，所述方法包括：

获得食品中存在的多个核酸序列的序列数据；

识别所述序列数据中的一种或多种微生物特征，其中所述一种或多种微生物特征对应所述食品中存在的一种或多种微生物；和

通过以下认证所述食品的来源：

确定所述一种或多种微生物特征是否对应与所述食品的特定来源相关的一种或多种微生物特征，

其中如果所述一种或多种微生物特征对应与所述食品的特定来源相关的一种或多种微生物特征，则认证所述食品。

2.一种用于识别食品来源的方法，所述方法包括：

获得食品中存在的多个核酸序列的序列数据；

通过以下识别所述食品的来源：

确定所述一种或多种微生物特征是否对应与食品的特定来源相关的一种或多种微生物特征，

其中如果所述一种或多种微生物特征对应与食品的特定来源相关的一种或多种微生物特征，则识别出所述来源。

3.一种检测食物生产链中污染物的方法，所述方法包括：

获得食品中存在的多个核酸序列的序列数据；

通过以下检测所述食品中的污染物：

确定所述一种或多种微生物特征是否对应与特定污染物相关的一种或多种微生物特征，

其中如果所述一种或多种微生物特征对应与特定污染物相关的一种或多种微生物特征，则检测到所述污染物。

4.根据权利要求1-3中任一项所述的方法，其中所述一种或多种微生物特征对应所述食品中存在的一种或多种微生物的属分类。

5.根据权利要求1-4中任一项所述的方法，其中所述一种或多种微生物特征对应所述食品中存在的一种或多种微生物的物种或血清型分类。

6.根据权利要求1-5中任一项所述的方法，其中所述一种或多种微生物特征对应所述食品中存在的一种或多种微生物的相对水平。

7.根据权利要求1-6中任一项所述的方法，其中所述一种或多种微生物特征对应与单个来源或单种污染物相关的一种或多种微生物。

8.根据权利要求1-6中任一项所述的方法，其中所述一种或多种微生物特征对应与两个或更多个来源或两种或更多种污染物相关的一种或多种微生物。

9.根据权利要求1-7中任一项所述的方法，其中所述来源或所述污染物是动物起源的。

10.根据权利要求9所述的方法，其中所述动物起源的来源或污染物是蛋、家禽粉、鱼粉或骨粉。

11.根据权利要求1-7中任一项所述的方法，其中所述来源或污染物是植物或真菌起源的。

12.根据权利要求11所述的方法，其中植物或真菌起源的所述来源或所述污染物是玉米粉。

13.根据权利要求1-12中任一项所述的方法，其中所述来源或所述污染物对应特定地理区域。

14.根据权利要求1-13中任一项所述的方法，其中所述一种或多种微生物选自由细菌、病毒、古细菌和真核微生物所组成的组。

15.根据权利要求1-14中任一项所述的方法，其中所述一种或多种微生物属于选自由以下所组成的组中的属分类：副地芽孢杆菌属、布劳特氏菌属、另类弧菌属、产卟啉杆菌属、志贺氏菌属、解硫胺素芽孢杆菌属、厌氧棒状菌属、发光杆菌属、红色杆菌属、拉氏杆菌属、丁酸弧菌属、泰泽雷拉菌属、格里蒙特氏菌属、脱氯单胞菌属、雷夫松氏菌属、粪热杆菌属、鼠肠单胞菌属、假交替单胞菌属、假节杆菌属、节杆菌属、巨球形菌属、产乙醇菌属、交替单胞菌属、栖白蚁菌属、微球菌属、真杆菌属、科维尔氏菌属、纤维单胞菌属、栖热菌属、震颤杆菌属、耶尔森氏菌属、诺卡氏菌属、栖微热菌属、魏斯氏菌属、爱德华氏菌属、戈登氏菌属、拉恩氏菌属、默多克氏菌属、大洋单胞菌属、丙酸杆菌属、固氮菌属、爱格士氏菌属、海单胞菌属、四合球菌属、柄杆菌属、阿德勒氏菌属、盐单胞菌属、脂肪杆菌属、丝状杆菌属、戈登氏杆菌属、噬甲基菌属、游动放线菌属、高温杆菌属、肥杆菌属、布鲁氏菌属、李斯特氏菌属、甲烷短杆菌属、邻单胞菌属、热厌氧杆形菌属、奇异球菌属、甲烷八叠球菌属、鸡杆菌属、聚球藻属、螺状菌属、辫硫菌属、眉藻属、螺杆菌属、热袍菌属、紫色杆菌属、不滑动菌属、巴恩斯氏菌属、梭杆菌属、鸟杆状菌属、泥杆菌属、阿克曼氏菌属、热脱硫杆菌属、下水道菌属、泰勒虫属、环病毒属、T7病毒属、T4病毒属、α逆转录病毒属、Sp18病毒属、氨基酸球菌属、交替红色杆菌属、丛毛单胞菌属、弓形菌属、气微菌属、片球菌属、变形菌属、别样杆菌属、固氮螺形菌属、地芽孢杆菌属、碱土菌属、土壤杆菌属、弧菌属、克里斯滕森氏菌属、博斯氏菌属、库特氏菌属、哈夫尼菌属、产碱菌属、拟梭菌属、新鞘氨醇菌属、遗忘单胞菌属、摩根氏菌属、拟无枝酸菌属、臭气杆菌属、假黄单胞菌属、阴性球菌属、金色单胞菌属、欧尔森氏菌属、嗜冷杆菌属、类芽孢杆菌属、小短杆菌属、副拟杆菌属、希瓦氏菌属、普罗威登斯菌属、短杆菌属、罗斯拜瑞氏菌属、念珠菌属、瘤胃球菌属、花椰菜花叶病毒属、月形单胞菌属、棍状杆菌属、密螺旋体属、短小杆菌属、苏黎世杆菌属、欧文氏菌属、栖叶菌属、薄层杆菌属、动球菌属、克鲁维酵母属、马赛菌属、甲基杆菌属、微杆菌属、类诺卡氏菌属、苍白杆菌属、假诺卡氏菌属、根瘤菌属、糖多孢菌属、血杆菌属、申氏菌属、鞘氨醇杆菌属、Sugiyamaella属、金黄杆菌属、气单胞菌属、无色杆菌属、芽殖单胞菌属、泛菌属、代尔夫特菌属、无氧芽孢杆菌属、鲍特氏菌属、分枝杆菌属、拟杆菌属、短波单胞菌属、红球菌属、双歧杆菌属、小浴氏菌属、链霉菌属、脱硫弧菌属、鞘氨醇菌属、Thermothelomyces属、解黄酮菌属、鞘氨醇单胞菌属、梭孢壳属、Lachnoclostridium属、鞘氨醇盒菌属、巨大球菌属、贪铜菌属、莫拉氏菌属、普雷沃氏菌属、瘤胃梭菌属、慢生根瘤菌属、弯曲杆菌属、梭菌属、寡养单胞菌属、伯克霍尔德氏菌属、表皮杆状菌属、黄单胞菌属、沙雷氏菌属、埃希氏菌属、葡萄球菌属、链球菌属、贪噬菌属、食酸菌属、不动杆菌属、芽孢杆菌属、柠檬酸杆菌属、棒杆菌属、肠杆菌属、肠球菌属、克雷伯氏菌属、乳杆菌属、乳球菌属、假单胞菌属、柔武氏菌属和沙门氏菌属。

16.根据权利要求1-15中任一项所述的方法，其中获得所述序列数据包括制备测序文库。

17.根据权利要求1-16中任一项所述的方法，其中获得所述序列数据包括下一代测序或微阵列分析。

18.根据权利要求1-17中任一项所述的方法，其中所述多个核酸序列是DNA序列。

19.根据权利要求1-17中任一项所述的方法，其中所述多个核酸序列是RNA序列。

20.根据权利要求1-19中任一项所述的方法，其中在识别所述一种或多种微生物特征之前，从所述序列数据中过滤出对应所述食品的序列。

21.根据权利要求1-20中任一项所述的方法，其中识别所述一种或多种微生物特征包括将所述序列数据与微生物核酸序列的一个或多个数据库进行比较。

22.根据权利要求1-21中任一项所述的方法，其中确定所述一种或多种微生物特征是否对应与所述食品的特定来源相关的一种或多种微生物特征包括将所述一种或多种微生物特征与特定来源相关的微生物特征的一个或多个数据库进行比较；或者其中确定所述一种或多种微生物特征是否对应与特定污染物相关的一种或多种微生物特征包括将一种或多种微生物特征与特定污染物相关的微生物特征的一个或多个数据库进行比较。

23.根据权利要求1-22中任一项所述的方法，其中所述方法在所述食品的食物生产链中的两个或更多个点处进行。

24.根据权利要求1-23中任一项所述的方法，所述方法还包括将所述来源或所述污染物追踪至所述食品的特定供应商。

25.一种用于认证食品的来源的系统，所述系统包括：

一个或多个处理器；和

存储器，其包括可由所述一个或多个处理器执行的指令，当由所述一个或多个处理器执行时，使系统：

获得食品中存在的多个核酸序列的序列数据；

通过以下认证所述食品的来源：

26.一种用于检测食物生产链中污染物存在的系统，

所述系统包括：

一个或多个处理器；和

获得食品中存在的多个核酸序列的序列数据；

通过以下检测所述食品中的污染物：

27.一种用于识别食品的来源的系统，所述系统包括：

一个或多个处理器；和

获得食品中存在的多个核酸序列的序列数据；

通过以下识别所述食品的来源：