CN115087748A - 用于提供生物材料的标识和/或可追溯性的方法和组合物 - Google Patents

用于提供生物材料的标识和/或可追溯性的方法和组合物 Download PDF

Info

Publication number
CN115087748A
CN115087748A CN202080093112.XA CN202080093112A CN115087748A CN 115087748 A CN115087748 A CN 115087748A CN 202080093112 A CN202080093112 A CN 202080093112A CN 115087748 A CN115087748 A CN 115087748A
Authority
CN
China
Prior art keywords
unique identifier
dna
sequence
duid
identifier sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080093112.XA
Other languages
English (en)
Inventor
M·博格
J·N·弗里德贝格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Index Biosystems Inc
Original Assignee
Index Biosystems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Index Biosystems Inc filed Critical Index Biosystems Inc
Publication of CN115087748A publication Critical patent/CN115087748A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/514Detection characterised by immobilisation to a surface characterised by the use of the arrayed oligonucleotides as identifier tags, e.g. universal addressable array, anti-tag or tag complement array
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

本文提供了用于提供生物材料的标识和/或可追溯性的方法和组合物。在某些实施方式中,提供了包括以下步骤的方法:确定生物实体的基因组DNA中至少一种独特标识符序列的序列;通过验证所述基因组DNA中所述独特标识符序列的存在并将所述独特标识符序列的序列与数据库相比较以确认独特性来证实所述生物实体的标识;提供从所述生物实体产生生物材料的可接受性的指示;并将所述独特标识符序列输入数据库的数据库条目并将所述独特标识符序列与标识和/或追溯信息相关联;借此通过读取所述独特标识符序列并检索相应数据库条目以获得标识和/或追溯信息来提供可追溯性。还提供了用于提供生物材料的标识和/或可追溯性的寡核苷酸、盒和组合物。

Description

用于提供生物材料的标识和/或可追溯性的方法和组合物
技术领域
本发明一般地涉及生物材料的标识和/或追溯。更具体地,本发明涉及使用核酸标识和/或追溯生物材料的方法和试剂。
背景技术
食品系统已达到前所未有的分布效率水平和生产量。这种发展以成本降低和多样化形式为公众提供了极大益处;然而,仍存在将风险暴露给公共卫生、行业和创新的严重缺陷。可追溯性是这些挑战的有效管理和控制的主要技术之一。
主要通过污染事件暴露了当前食品和饮料可追溯性系统的限制。当发生这些事件时,它可能需要花费数月来追溯受影响的产品的来源。由于它们缺少基因变化,克隆增殖产品可以为来源标识增加额外的困难。转化和混合-物品产品对于来源标识也可以是成问题的,因为它们需要对整个供应链进行现有的可追溯性最优实践。快速且可负担地追溯这些产品的能力的缺陷对消费者的安全性造成了显著风险;对风险承担者造成材料经济损失;并且对受影响行业的声誉造成极大损害。
在2015年,世界卫生组织(WHO)完成了估计全球食品传播疾病负担的10年期计划。该计划发现“……全球食品传播疾病负担……在2010年为3300(95%UI 25-46)万DALY;40%的食品传播疾病负担发生在不到5岁的儿童中。”(p.11)。DALY代表失能调整生命年。它可以被认为是健康生命损失一年。通过该研究所做出的估计受限于数据空缺。由于更准确的估计的需要,注意到了改善的监管和实验室能力。通过来源归属特别小组(sourceattribution task force,SATF)进一步标识了监管需要。
SATF是受该计划委托的多个特别小组之一。他们的委托是估计特定归属点对疾病传播的影响。图1(由WHO,2015,p.101改编)显示了主要归属点。作为该研究的参照组,FERG确定出于研究的目的,大部分简单的归属点位于传播链的末端——即人接触。这种简单性是现有可追溯性实践的限制的性质。FERG还注意到(p.100)对于风险管理,其它归属点可能更适合-例如,初级生产。如所期望的,FERG标识了对于贮存水平归属(reservoir levelattribution)的监管。
食品和饮料供应-链中的食品可追溯性的现代技术通常开始于种植户的收获或处于生产机构中。通常在箱级水平追溯产品——一个箱含有多个物品。偶尔,将物理条型码应用于每个物品。理想地,将全球交易品项识别代码(GTIN)和全球位置码(GLN)与箱相关联。可以对托盘—一系列的箱—产生系列货运包装箱代码(SSCC)。这些可追溯性技术通常受标准规定,并且对于新鲜食品,该标准通常是GS1标准。由于托盘通过供应链进行,因此结合对于关键追溯事件(CTE)记录的关键数据元素(KDE)使用基于条型码的上述标识符。CTE可以描述从种植户到包装员/运输员的产品处置。存在常用的格言,其表明每个供应-链风险承担者应能够“向前一步和向后一步”追溯产品。不幸地,该要求已证实在多个方面是不足的。
一旦食品物品到达销售点,则它可能已转化或与来自不同生产者的其它物品相互混合——例如,水果沙拉。通常,一旦物品与其原始箱或物品-水平标识符分离,则通常无法将该物品追溯回生产商。如通过最近的罗马莴苣爆发可见,因为它们不具有来源信息,因此研究者需要花费超过一个月来精确定位污染来源(FDA,2019,p.1),尽管绝大多数生产发生在美国西南部。因此,FDA已推动“整个绿叶菜供应链采取可追溯性最佳实践和当前技术水平以确保在绿叶菜涉及潜在召回或爆发时快速、准确和便于访问从农场到餐桌的主要数据元素”(FDA,2019,p.8)。与这种爆发相关的成本仍未揭晓。然而,其它污染事件是熟知的。
2006年的菠菜召回与26个州中的5例死亡和约200例危重疾病相联系。它造成了约$5亿的经济损失(GS1,2013,p.3)。更一般地,“……政府部门已对于近期食品召回的健康和经济影响表示担忧,因为食品传播疾病每年影响4800万人并且每年造成美国$1520亿的保健成本(GS1,2013,p.2)。据发现对于Frontera Produce的芫荽叶召回,可以被理解为种子-至-销售追溯的完整-链可追溯性将产品召回总量降低至箱数的12%。McKinsey发现召回精确度中25%的改善可以每年为新鲜食品行业节约$2.5-$2.75亿(GS1,2013,p.10)。
完整-链可追溯性缺乏物品-水平标识的有效形式并且缺乏有关来源的保证。物品-水平标识的现有方法通常依赖于物理商标(激光)、无线电频率标识符(RFID)和条型码—即外部物理标识符。还存在与这些技术相关的放大困难。每个物品需要物理标识符并且具有与其生产相关的成本。另外,在它们的使用中存在固有的错误读取风险和/或恶意篡改风险——例如,揭掉或除去粘贴的标签。
影响食品供应的食品污染,如大肠杆菌(E.coli)和/或沙门氏菌(salmonella)污染对公共卫生具有威胁并且高度期望对污染源进行标识和追溯的快速动作。在本领域中,对于提高食品供应中产品的可追溯性的可靠、成本-有效和/或快速的策略存在长期未满足的需要。生物实体和/或生物材料的可追溯性不仅在农业和食品行业中是所期望的,而且也是涉及生物实体和/或由此包含或获得的生物材料的多个行业和领域中所追求的。
期望用于提供生物实体和/或生物材料的标识和/或可追溯性的替代、其它和/或改善的方法和/或组合物。
发明内容
本文提供了用于提供生物材料的标识和/或可追溯性的方法和组合物。在某些实施方式中,如本文所描述的方法可以利用独特标识符序列(在本文中也称为DNA独特标识符序列),将其外源引入生物实体的基因组,以提供生物实体和/或包含所述生物实体的生物材料和/或由所述生物实体产生并且包含由此获得的基因组DNA的生物材料的标识和/或可追溯性。在某些实施方式中,所述独特标识符序列可以来自序列的随机混合池。在某些实施方式中,可以维持数据库以将独特标识符序列与相应的标识和/或追溯信息相联系。本文还提供了包含一个或多个独特标识符序列的寡核苷酸构建体和盒以用于提供生物材料的标识和/或可追溯性。在某些实施方式中,寡核苷酸构建体和/或盒可以包含引物退火序列(其可以用于独特标识符序列的扩增)的具体布置、独特标识符序列的测序或两者。在某些实施方式中,如本文所描述的方法和组合物可以用于提供食品的可追溯性并且可以(例如)就污染的情况允许快速反应和/或食品召回。
在一个实施方式中,本文提供了用于标识生物材料的方法,所述方法包括:
接受或提供包含来自所述生物材料的基因组DNA的样品;
扩增来自所述生物材料的基因组DNA内的至少一种DNA独特标识符序列并对所述独特标识符序列测序;和
在数据库中搜索所述DNA独特标识符序列并检索对应于所述DNA独特标识符序列的数据库条目,所述数据库条目提供了所述生物材料的标识和/或追溯信息。
在以上方法的另一个实施方式中,所述生物材料可以包含植物基材料、真菌基材料、动物基材料、病毒基材料或者细菌基材料。
在某些实施方式中,所述生物材料可以包含真菌基材料。在某些实施方式中,所述生物材料可以包含酵母。在某些实施方式中,所述酵母可以(任选地)形成孢子(即所述生物材料可以包含酵母孢子)。在某些实施方式中,可以将酵母添加至期望标识和/或追溯的产品,如食品成分或食品产品中,与它们混合或另外与它们相关联。
在另一个实施方式中,本文提供了用于提供生物材料的可追溯性的方法,所述方法包括:
确定生物实体的基因组DNA内的至少一种DNA独特标识符序列的序列;
通过以下方法证实生物实体的标识:验证所述基因组DNA中DNA独特标识符序列的存在;和将所述DNA独特标识符序列的序列与数据库相比较以确认在数据库中尚未使用的DNA独特标识符序列;
提供从生物实体产生生物材料的可接受性的指示,所述生物材料包含来自所述生物实体的基因组DNA;和
将所述至少一种DNA独特标识符序列的序列输入数据库的数据库条目中,并将DNA独特标识符序列与所述生物材料的标识和/或追溯信息相关联;
借此通过读取所述生物材料中的DNA独特标识符序列并检索相应数据库条目,从而提供所述生物材料的标识和/或追溯信息,提供生物材料的可追溯性。
在以上方法的另一个实施方式中,所述方法还可以包括在生物实体的基因组DNA内插入至少一种DNA独特标识符序列或者通过基因编辑修饰生物实体的基因组DNA内预先存在的标识符序列,从而在所述生物实体的基因组DNA内创建DNA独特标识符序列,借此提供它的标识。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括提供用于在所述生物实体的基因组DNA内插入的至少一种DNA独特标识符序列。
在上述任何一种或多种方法的另一个实施方式中,所述生物材料可以包含植物基材料、真菌基材料、动物基材料、病毒基材料或者细菌基材料。
在上述任何一种或多种方法的另一个实施方式中,所述生物实体可以包括植物细胞、真菌细胞、动物细胞、病毒或细菌细胞。
在上述任何一种或多种方法的另一个实施方式中,所述生物材料、所述生物实体或两者可以包含真菌基材料或真菌细胞。在某些实施方式中,所述生物材料、所述生物实体或两者可以包含酵母。在某些实施方式中,所述酵母可以(任选地)形成孢子(即可以包含酵母孢子)。
在上述任何一种或多种方法的另一个实施方式中,从所述生物实体产生生物材料可以包括增殖所述生物实体。
在上述任何一种或多种方法的另一个实施方式中,所述DNA独特标识符序列可以来自DNA独特标识符序列的随机混合池。
在上述任何一种或多种方法的另一个实施方式中,读取所述生物材料中的DNA独特标识符序列并检索相应数据库条目可以包括:
接受或提供包含来自所述生物材料的基因组DNA的样品;
扩增来自所述生物材料的基因组DNA内的至少一种DNA独特标识符序列并对所述DNA独特标识符序列测序;和
将所述DNA独特标识符序列与数据库相比较,并检索与所述DNA独特标识符序列对应的数据库条目,所述数据库条目提供了所述生物材料的标识和/或追溯信息。
在上述任何一种或多种方法的另一个实施方式中,所述DNA独特标识符序列可以包括插入所述基因组DNA的基因间区中的独特核苷酸序列。
在上述任何一种或多种方法的另一个实施方式中,所述DNA独特标识符序列可以包含长度多至约1500nt;长度多至约1000nt;长度约200nt至约600nt;长度约200nt至约400nt;或者长度约400nt至约600nt的序列。
在上述任何一种或多种方法的另一个实施方式中,所述DNA独特标识符序列可以侧接一个或多个引物退火序列以用于DNA独特标识符序列的PCR扩增、DNA独特标识符序列的测序或两者。
在上述任何一种或多种方法的另一个实施方式中,所述生物材料可以包括食品。
在上述任何一种或多种方法的另一个实施方式中,所述数据库条目的标识和/或追溯信息可以包括所述生物材料的供应链信息。在某些实施方式中,所述供应链信息可以包括食品、农业、药物、零售、纺织品、商品、化学品或所述生物材料可能与之相关联的其它供应链物品的供应链信息。
在上述任何一种或多种方法的另一个实施方式中,所述数据库条目的标识和/或追溯信息可以包括所述生物材料的来源信息。
在上述任何一种或多种方法的另一个实施方式中,所述数据库条目的标识和/或追溯信息可以包括种植户、地区、批(batch)、批次(lot)、日期或其它相关供应链信息或它们的任意组合。
在上述任何一种或多种方法的另一个实施方式中,可以将盒引入基因组DNA,其中所述盒可以包含侧接一个或多个引物退火序列以用于所述DNA独特标识符序列的PCR扩增、所述DNA独特标识符序列的测序或两者的DNA独特标识符序列。
在上述任何一种或多种方法的另一个实施方式中,所述DNA独特标识符序列可以是来源于长度多至约1500nt;长度多至约1000nt;长度约200nt至约600nt;长度约200nt至约400nt;或者长度约400nt至约600nt的核酸序列的随机混合池的随机序列。
在另一个实施方式中,本文提供了寡核苷酸,其包含侧接一个或多个引物退火序列以用于DNA独特标识符序列的PCR扩增、DNA独特标识符序列的测序或两者的DNA独特标识符序列。
在以上寡核苷酸的另一个实施方式中,所述DNA独特标识符序列可以包含长度多至约1500nt;长度多至约1000nt;长度约200nt至约600nt;长度约200nt至约400nt;或者长度约400nt至约600nt的随机序列。
在另一个实施方式中,本文提供了盒,其包含如本文所描述的任何一种或多种寡核苷酸。
在另一个实施方式中,本文提供了包含引入所述细胞或病毒的基因组中的如本文所描述的任何一种或多种寡核苷酸或者如本文所描述的任何一种或多种盒的细胞或病毒。
在另一个实施方式中,本文提供了包含引入细胞或病毒的基因组的DNA独特标识符序列的细胞或病毒。
在任何以上细胞或病毒的另一个实施方式中,可以将所述DNA独特标识符序列引入所述细胞或病毒的基因组DNA的基因间区。
在任何以上细胞或病毒的另一个实施方式中,所述细胞可以是植物细胞、真菌细胞、动物细胞或者细菌细胞。
在另一个实施方式中,所述细胞可以是真菌细胞,如酵母细胞。
在另一个实施方式中,本文提供了试剂盒,其包含以下中的任何一个或多个:
DNA独特标识符序列;
DNA独特标识符序列的随机混合池;
如本文所描述的任何一种或多种寡核苷酸;
如本文所描述的任何一种或多种盒;
用于DNA独特标识符序列的扩增和/或测序的一个或多个引物对;
缓冲液;
聚合酶;或
用于实施如本文所描述的任何一种或多种方法的说明书。
在另一个实施方式中,本文提供了标识生物材料的方法,所述方法包括:
在计算装置处接收提取自已知生物材料的DNA独特标识符序列(DUID);
在所述计算装置处搜索储存了与各个生物材料信息相关联的多个DUID的DUID数据库以用于匹配所接收的DUID;
如果DUID数据库的搜索不能提供与所接收的DUID的匹配,则在所述DUID数据库中储存与已知生物材料相关联生物材料信息相关联的所接收的DUID;
在储存所接收的DUID并具有与DUID数据库中的已知生物材料相关联的信息之后,在所述计算装置接收提取自未知生物材料的查询DUID;
在所述计算装置处搜索所述DUID数据库中与所接收的查询DUID的匹配;且
如果DUID的搜索提供了与所接收的查询DUID的匹配,则响应于所接收的查询DUID,返回关联于所述DUID匹配所述查询DUID所储存的生物信息。
在上述方法的另一个实施方式中,搜索DUID数据库中与所接收的DUID的匹配可以包括:
搜索DUID数据库中与所接收的DUID的完全匹配;和
如果未找到完全匹配,则对DUID数据库中储存的与所接收的DUID密切匹配的多个DUID实施比对/同一性搜索。
在上述任何一种或多种方法的另一个实施方式中,搜索所述DUID数据库中与查询DUID的匹配可以包括:
搜索所述DUID数据库中与所述查询DUID的完全匹配;且
如果未找到完全匹配,则对所述DUID数据库中储存的与所述查询DUID密切匹配的多个DUID实施比对/同一性搜索。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括:
如果所述搜索提供了与所述查询DUID的密切匹配,则储存与所述查询DUID密切匹配的DUID相关联的查询DUID。
在另一个实施方式中,本文提供了用于标识生物材料的计算系统,所述系统包括:
能够执行指令的处理单元;和
存储指令的存储单元,当通过处理单元执行时,该指令配置所述计算系统执行如本文所描述的任何一种或多种方法。
在另一个实施方式中,本文提供了计算机可读存储器,其具有在其上存储的指令,当通过计算系统的处理单元执行时,其配置所述系统执行本文所描述的任何一种或多种方法。
在另一个实施方式中,本文提供了用于标识生物材料的方法,所述方法包括:
接受或提供包含来自所述生物材料的基因组DNA的样品;
扩增来自所述生物材料的基因组DNA内的至少一种DNA独特标识符序列并对所述独特标识符序列测序;和
将DNA独特标识符序列中储存的生物材料的标识和/或追溯信息解码或解密。
在另一个实施方式中,本文提供了用于提供生物材料的可追溯性的方法,所述方法包括:
确定生物实体的基因组DNA内的至少一种DNA独特标识符序列的序列;
通过以下方法证实生物实体的标识:验证基因组DNA中DNA独特标识符序列的存在;和将DNA独特标识符序列中储存的标识和/或追溯信息解码或解密以验证所述DNA独特标识符序列;和
提供从生物实体产生生物材料的可接受性的指示,所述生物材料包含来自所述生物实体的基因组DNA;
借此通过读取所述生物材料中的DNA独特标识符序列并对DNA独特标识符序列中储存的信息解码或解密,从而提供所述生物材料的标识和/或追溯信息,提供生物材料的可追溯性。
在另一个实施方式中,本文提供了标识生物材料的方法,所述方法包括:
在计算装置处接收提取自未知生物材料的DNA独特标识符序列(DUID);和
将DNA独特标识符序列中储存的未知生物材料的标识和/或追溯信息解码或解密。
在另一个实施方式中,本文提供了包含DNA独特标识符序列的盒,所述DNA独特标识符序列侧接至少一个5'引物退火序列和至少一个3'引物退火序列以用于所述DNA独特标识符序列的扩增、所述DNA独特标识符序列的测序或两者。
在上述盒的另一个实施方式中,所述DNA独特标识符序列可以侧接两个5'引物退火序列和两个3'引物退火序列以允许通过巢式PCR扩增DNA独特标识符序列。
在上述任何一种或多种盒的另一个实施方式中,所述两个5'引物退火序列可以部分重叠;所述两个3'引物退火序列可以部分重叠;或两者。
在上述任何一种或多种盒的另一个实施方式中,所述盒还可以包含位于所述DNA独特标识符序列5'端的测序引物退火序列以用于所述DNA独特标识符序列的测序。
在上述任何一种或多种盒的另一个实施方式中,所述测序引物退火序列可以位于两个5'引物退火序列之间。
在上述任何一种或多种盒的另一个实施方式中,所述测序引物退火序列可以与所述两个5'引物退火序列之一或两者至少部分重叠。
在上述任何一种或多种盒的另一个实施方式中,所述两个5'引物退火序列可以部分重叠并且所述测序引物退火序列的至少一部分可以定位在所述重叠。
在上述任何一种或多种盒的另一个实施方式中,所述盒序列可以长度多至约1500nt;长度多至约1000nt;长度为约200nt至约600nt;长度为约200nt至约400nt;或者长度为约400nt至约600nt。
在上述任何一种或多种盒的另一个实施方式中,所述引物退火序列可以不是靶标生物实体的基因组中天然存在的。
在另一个实施方式中,本文提供了包含多个如本文所描述的任何一种或多种盒的组合物,每个盒包含相同的引物退火序列并且每个盒包含随机DNA独特标识符序列。
在另一个实施方式中,本文提供了包含多个如本文所描述的任何一种或多种盒的组合物,每个盒包含相同的引物退火序列和相同的测序引物退火序列,并且每个盒包含随机DNA独特标识符序列。
在另一个实施方式中,本文提供了用于提供生物材料的可追溯性的方法,所述方法包括:
将至少一种DNA独特标识符序列插入生物实体的基因组DNA内以用于制备所述生物材料。
在上述方法的另一个实施方式中,可以作为如本文所描述的任何一种或多种盒插入所述DNA独特标识符序列。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括确定所述生物实体的基因组DNA内的至少一个DNA独特标识符序列的序列的步骤。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括通过以下方法证实生物实体的标识的步骤:验证基因组DNA中DNA独特标识符序列的存在;并且将所述DNA独特标识符序列的序列与数据库相比较以确认已不在所述数据库中使用所述DNA独特标识符序列。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括以下步骤:
从生物实体产生生物材料,所述生物材料包含来自所述生物实体的基因组DNA;和/或
提供从生物实体产生生物材料的可接受性的指示,所述生物材料包含来自所述生物实体的基因组DNA。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括以下步骤:将至少一种DNA独特标识符序列的序列输入到数据库条目,并且将所述DNA独特标识符序列与所述生物实体和/或生物材料的标识和/或追溯信息相关联。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括以下步骤:
通过读取生物实体和/或生物材料中的DNA独特标识符序列并检索提供所述生物实体和/或生物材料的标识和/或追溯信息的相应数据库条目来提供所述生物实体和/或生物材料的可追溯性。
在另一个实施方式中,本文提供了包含如本文所描述的任何一种或多种寡核苷酸或一种或多种盒的质粒或表达载体。
在另一个实施方式中,本文提供了用于提供感兴趣的产品的可追溯性的方法,所述方法包括:
接收或提供来自感兴趣的产品的样品,所述样品包含来自感兴趣的产品的生物材料部分,与感兴趣的产品混合或另外与感兴趣的产品相关联的基因组DNA;
扩增来自所述生物材料的基因组DNA内的至少一种DNA独特标识符序列并对所述独特标识符序列测序;和
在数据库中搜索所述DNA独特标识符序列并检索对应于所述DNA独特标识符序列的数据库条目,所述数据库条目提供了感兴趣的产品的标识和/或追溯信息。
在上述方法的另一个实施方式中,所述方法可以包括将如本文所描述的任何一种或多种生物材料或者一种或多种生物实体引入或添加至感兴趣的产品,所述生物材料或实体包含作为其基因组材料的一部分的如本文所描述的至少一种DNA独特标识符序列。
在上述任何一种或多种方法的另一个实施方式中,所述数据库条目的标识和/或追溯信息可以包括感兴趣的产品的供应链信息。
在上述任何一种或多种方法的另一个实施方式中,感兴趣的产品可以包括食品、农产品、药物、零售产品、纺织品、日用品、化学品或者另一种供应链物品。
附图说明
参考以下描述和附图,将进一步理解这些及其它特征,其中:
图1显示了世界卫生组织(WHO)在他们2015的报告(根据WHO,2015,p.101改编)中所标识的传输途径;
图2显示了如实施例1所述,包括DUID序列的如本文所描述的盒的实施例及其产生。所示序列为SEQ ID NO:1;
图3显示了实施例1中所述的DUID系统的示例性方法的全局视图;
图4显示了如实施例1所述的DUID系统方法的标识阶段的实施例;
图5显示了如实施例1所述的DUID系统方法的验证阶段的实施例;
图6显示了如实施例1所述的DUID系统方法的读取阶段的实施例;
图7显示了如本文所描述的DUID系统和方法的另一个实施例;
图8显示了如本文所描述的DUID系统和方法的另一个实施例,其中使用DUID和数据库/登记表提供了生物实体的可追溯性;
图9也显示了如本文所描述的DUID系统和方法的另一个实施例,其中使用DUID序列和数据库/登记表从数据库获得了生物材料的标识和/或追溯信息;
图10显示了如本文所描述的DUID系统和方法的另一个实施例,其中使用DUID存储追溯和/或标识信息提供了生物实体的可追溯性;
图11显示了如本文所描述的DUID系统和方法的另一个实施例,其中使用DUID序列存储追溯和/或标识信息获得了生物材料的标识和/或追溯信息;
图12显示了如本文所描述的DUID系统和方法的另一个实施例,其中使用DUID序列存储追溯和/或标识信息获得了生物材料的标识和/或追溯信息;
图13显示了如本文所描述的包括UID(独特标识符)序列的盒设计的其它实施例。图13(a)显示了双重引物设计,13(b)显示了单一引物设计并且13(c)显示了独立设计;
图14显示了如实施例2所述的两种370pb DUID构建体的图谱。A)用于PCR和qPCR扩增的DUID构建体设计。构建体为370pb。该DUID构建体含有2个正向引物和2个反向引物。存在两个标识符(ID1和ID2)。ID1对于PCR扩增是理想的。ID2对于qPCR扩增是理想的。B)用于环介导等温扩增(LAMP)和PCR的DUID构建体设计。该图谱包括PCR和LAMP两者的引物;
图15显示了如实施例2所述,通过终点PCR对酵母基因组DNA中YCp-DUID的检测。使用(A)YCp-DUID载体和(B)提取自BY4743的gDNA和(C)用DUID召回引物,用YCp-DUID载体作为模板转化的酵母菌株BY4743进行PCR扩增。使用(1)100ng、(2)10ng、(3)1ng、(4)100pg、(5)10pg、(6)1pg、(7)100fg和(8)10fg的输入量,使用系列稀释的DNA模板进行反应,并且使用GeneRulerTM100bp Plus Ready-to-use Ladder作为标准物在1%琼脂糖凝胶上分离;
图16显示了如实施例2所述,酵母总DNA提取物内DUID的检测。对范围在50ng-500ag的YCp载体的10-倍连续稀释实施实时定量PCR并用于使用MS Excel产生标准曲线(蓝线)。将使用来源于用YCp-DUID载体转化的BY4743的DNA的类似的qPCR实验结果作图(橙色柱)并与标准曲线值相比较以定量酵母生物质内DUID的检测;和
图17显示了如实施例2中进一步描述的,整个标识符序列的同源性的实施例,其起到标识DUID版本、其来源以及与DUID相互作用的子序列规程的方式的作用。
具体实施方式
本文描述了用于提供生物材料的标识和/或可追溯性的方法和组合物。将理解出于旨在对于本领域技术人员说明性的目的提供实施方式和实施例,并且这些实施方式和实施例不旨在以任何方式进行限制。
本文提供了用于提供生物材料的标识和/或可追溯性的方法和组合物。在某些实施方式中,如本文所描述的方法可以利用独特标识符序列(在本文中也称为DNA独特标识符序列),可以将其外源引入(即插入/整合)生物实体的基因组,以提供生物实体和/或包含所述生物实体的生物材料和/或由所述生物实体产生并且包含由此获得的基因组DNA的生物材料的标识和/或可追溯性。在某些实施方式中,如本文所描述的策略可以受益于核酸,如DNA的耐久性和可复制能力以提供标识和/或可追溯性。在某些实施方式中,所述独特标识符序列可以来自序列的随机混合池。在某些实施方式中,可以维持数据库以将独特标识符序列与相应的标识和/或追溯信息相联系。
本文还提供了包含一个或多个独特标识符序列的寡核苷酸构建体和盒以用于提供生物材料的标识和/或可追溯性。在某些实施方式中,寡核苷酸构建体和/或盒可以包含引物退火序列(其可以用于独特标识符序列的扩增)的具体布置、独特标识符序列的测序或两者。在某些实施方式中,可以如本文所描述的设计引物退火序列的布置以减少非故意和/或脱靶扩增和/或测序事件,其(例如)可以提供提高的保真度和/或减少的标识事件误差。
在某些实施方式中,如本文所描述的方法和组合物可以用于提供食品的可追溯性并且可以(例如)就污染的情况允许快速反应和/或食品召回。影响食品供应的食品污染,如大肠杆菌(E.coli)和/或沙门氏菌(salmonella)污染对公共卫生具有威胁并且高度期望对污染源进行标识和追溯的快速动作。在本领域中,对于提高食品供应中产品的可追溯性的可靠、成本-有效和/或快速的策略存在长期未满足的需要。如本文所描述的策略可以在食物系统中提供从来源到消化及其之后的可追溯性。生物实体和/或生物材料的可追溯性不仅在农业和食品行业中是所期望的,而且也是涉及生物实体和/或由此包含或获得的生物材料的多个行业和领域中所追求的。因此,除食品安全外,本文还考虑了在食品/种子安全、IP追溯、认证(例如,种子协会、Kosher、Halal等……)、GMO标识和/或表征和/或贸易融资风险降低中的应用。
在某些实施方式中,食品产品或成分(如,例如,水果和蔬菜,或者含有细胞的其它这些食品)可以作为其至少一些细胞中的基因组的一部分包含如本文所描述的独特标识符序列以提供标识和/或可追溯性。在其它实施方式中,如本文所描述的独特标识符序列可以是包含细胞的一种或多种生物实体或生物材料的基因组的一部分,并且可以将所述生物实体或生物材料添加至期望标识和/或追溯的一种或多种产品,与之混合或另外与之相关联。举例来说,在某些实施方式中,可以将作为一种或多种稳定引入的人工染色体的一部分含有如本文所描述的一种或多种独特标识符序列的食品-安全酵母细胞添加至一种或多种食品产品或食品成分或与之混合以提供其标识和/或可追溯性。
标识和/或提供可追溯性的方法
在某些实施方式中,本文提供了生物材料或生物实体的标识和/或提供可追溯性的方法。这些方法可以使用独特标识符序列以实现这种标识和/或可追溯性。通常,可以将所关心的生物实体,如农作物(例如,菠菜)基因修饰,从而在其基因组中引入独特序列标识符。通过非限制性和说明性实例,可以基因修饰菠菜植物的细胞,从而将盒在基因组的基因间或其它无害位点引入菠菜细胞的基因组中,所述盒包含侧接一个或多个用于所述独特标识符序列随后扩增和/或测序的引物退火序列的独特标识符序列。所述独特标识符序列的序列可以是已知的,或者可以来自随机混合池并且随后在整合后进行确定,并且可以输入并记录在数据库或登记表中。然后,可以将细胞用于生长/扩增一种或多种菠菜作物,并且可以将菠菜作物的相关标识和/或追溯信息(如来源、批/批次信息、种植户/生产商、位置、日期、厂家和/或所关心的任何其它供应链信息)记录在与相应独特标识符序列相关联的数据库或登记表中。任选地,可以随着供应链事件进行(即收获、运往厂家、销售、等……)来更新所述数据库条目。所述菠菜作物可以用于生产生物材料,如在杂货店销售的袋装菠菜或色拉。在污染或食源性疾病的情况下或者怀疑污染或食源性疾病时,可以获得可疑菠菜或色拉样品,从中获得基因组DNA,并且可以分析所述基因组DNA以确定是否存在独特标识符序列(即菠菜是否是通过本系统追溯的菠菜),并且如果是,则可以对独特标识符序列测序以确定核苷酸序列并且这种核苷酸序列可以用于提供数据库或登记表查询以检索相关数据库条目,从而提供标识和/或追溯信息以帮助污染菠菜或色拉的召回。如将理解的,出于说明性的目的提供了以上菠菜实例,并且如本文所描述的方法可以用于在多种应用中为多种生物实体和/或生物材料提供多种标识和/或可追溯性选择。
在一个实施方式中,本文提供了用于标识生物材料的方法,所述方法包括:
接受或提供包含来自所述生物材料的基因组DNA的样品;
扩增来自所述生物材料的基因组DNA内的至少一种DNA独特标识符序列并对所述独特标识符序列测序;和
在数据库中搜索所述DNA独特标识符序列并检索对应于所述DNA独特标识符序列的数据库条目,所述数据库条目提供了所述生物材料的标识和/或追溯信息。
图9显示了显示该方法的实施方式的流程图。
如将理解的,所述生物材料可以一般地包含所关心的任何适合的生物材料。所述生物材料可以包含材料或由其组成,所述材料包含生物实体或其组成,或者所述生物材料可以包含由生物实体制备或来源于生物实体的材料或者包含来自生物实体的基因组核酸(即基因组DNA)的所关心的任何其它适合的材料或由其组成。在某些实施方式中,所述生物材料可以包含植物基材料、真菌基材料、动物基材料、病毒基材料或者细菌基材料或由其组成。举例来说,在某些实施方式中,生物材料可以包含食品或饮料或由其组成,所述食品或饮料包含植物或其它生物实体或者由其组成或者由其制备,其中所述食品或饮料包含来自所述生物实体的基因组DNA。在某些实施方式中,例如,所述生物材料可以包含莴苣、菠菜或者其它绿叶菜,或者包含它或由其组成或由此制备的食品产品,或由其组成。
在本文所描述的方法的某些实施方式中,可以接收或提供包含来自所关心的生物材料(例如,期望对其进行标识的生物材料)的基因组核酸(即基因组DNA,其中所述生物实体具有DNA基基因组)的样品。可以以纯化或部分纯化的形式接收或提供样品,从而可以容易地使用基因组DNA,或者可以基本照原来的样子提供(即作为食品产品的样品)或者作为另一种粗或前体形式提供,可以对其进行一种或多种处理或纯化步骤,从而可以在后续步骤中容易地使用其中所含的基因组DNA。在某些实施方式中,据考虑可以将用于基因组核酸纯化和/或分离的任何适合的标准技术用于样品制备。
在某些实施方式中,并且举例来说,可以作为用于后续步骤的样品制备的一部分实施一个或多个核酸(例如,基因组)分离、纯化和/或提取步骤。DNA分离或提取可以包括(例如)从样品获得DNA的一个或多个步骤。在某些实施方式中,DNA分离或提取可以包括打开细胞(例如,溶胞)(例如,通过物理步骤、超声处理或化学处理);使用去污剂除去膜;任选地,用蛋白酶除去蛋白;并使用醇(如乙醇(冷)或异丙醇)沉淀DNA。因此,可以通过离心获得DNA颗粒。在某些实施方式中,如技术人员将认识到的,可以通过使用螯合剂阻碍DNA酶。在某些实施方式中,可以使用蛋白酶,或者用乙酸钠或乙酸铵沉淀,或者在DNA沉淀之前通过酚-氯仿提取除去细胞和组蛋白蛋白。当期望时,技术人员通过考虑本文中的教导内容将认识到多种技术将对于样品制备和/或分离、纯化和/或提取基因组核酸可用。
在如本文所描述的方法的某些实施方式中,可以任选地扩增插入或整合到生物实体/生物材料的基因组内的独特标识符序列(在本文中称为DNA独特标识符序列,为了方便起见DUID,尽管将理解在某些实例中,如其中生物实体具有RNA-基基因组时,所述独特标识符序列可以是RNA而不是DNA)。
在某些实施方式中,基因组内的整合可以包括天然染色体内的整合。在某些实施方式中,基因组内的整合可以包括将人工染色体稳定引入基因组,所述人工染色体具有着丝粒序列并且与天然基因组材料一起是可遗传的。例如,以下实施例2描述了在酵母中使用人工染色体的实例。
通过考虑本文中的教导内容,可以一般地使用本领域技术人员已知的任何适合的扩增技术来实施这种扩增,如通过聚合酶链反应(PCR)。在某些实施方式中,如本文中进一步详细描述的,要扩增的独特标识符序列在基因组中可以与用于扩增和/或测序的引物退火序列相伴。在某些实施方式中,可以选择和布置引物退火序列,从而允许通过巢式PCR扩增以减少非故意或脱靶扩增的可能性,如本文中进一步详细描述的。
在某些实施方式中,PCR-基方法可以用于扩增。PCR扩增可以包括正反向引物,其中所述引物可以与要扩增的所关心的核酸序列末端的5'和3'区域互补(或基本互补)。可以通过技术人员已知的任何适合的方法产生特异性引物退火序列的正反向引物。这些方法的实例可见于,例如,Dieffenbach CW,Dveksler GS.1995.PCR primer:a laboratorymanual,New York,NY:Cold Spring Harbor Laboratory Press;New England BiolabsInc.,2007-08Catalog&Technical Reference,其作为参考并入本文。在某些实施方式中,为了读取生物信息,PCR引物可以包含多组正反向引物,所述引物可以彼此独立操作。在某些实施方式中,可以提供或分布一些引物的身份,同时可以控制其它人的访问,从而根据需要,不同当事人可以能够容易地访问不同区域和/或核酸序列信息。
在如本文所描述的方法的某些实施方式中,出于标识的目的,独特标识符序列,如DNA独特标识符序列(DUID)可以包含已外源引入生物实体的基因组内的任何适合的核酸序列。一般地,独特标识符序列可以是DNA或RNA,从而它与生物实体的基因组类型(DNA或RNA)匹配。如将理解的,例如,多种生物实体,如植物的基因组是双链的,并因此,所述独特标识符序列通常将以双链形式存在于基因组中。因此,将理解在某些实施方式中,根据需要或当适合时,本文中对独特标识符序列的提及(如,例如,当描述标识符序列的测序时)可以被理解为提及双链构建体的任一条链或两条链。
在某些实施方式中,可以将所述独特标识符序列引入盒或者除所述独特标识符序列之外含有一种或多种功能元件的其它这种构建体。在某些实施方式中,所述盒可以包含侧接一个或多个引物退火序列以用于所述DNA独特标识符序列的PCR扩增、所述DNA独特标识符序列的测序或两者的独特标识符序列。如将理解的,例如,引物退火序列可以是指具有已知核苷酸序列的预定核酸序列或区域,从而可以设计或选择用于退火至该引物退火序列的一个或多个引物,从而引发通过聚合酶的聚合反应。通常,将选择所述引物退火序列,从而它们在所关心的生物实体的基因组内是独特的,以减少或消除非故意或脱靶扩增。在某些实施方式中,例如,所述独特标识符序列可以是选择用于特定应用的已知的预定序列,或者可以是来源于核酸序列的随机混合池的随机序列,其随后可以确定并记录在如本文详细描述的数据库中。在某些实施方式中,所述独特标识符序列或者包含所述独特标识符序列的盒可以具有长度多至约1500nt;长度多至约1000nt;长度约200nt至约600nt;长度约200nt至约400nt;或者长度约400nt至约600nt的尺寸;或者覆盖这些尺寸中的任何两个之间的任何尺寸或子范围。如将理解的,更长的独特标识符序列可以在混合池内允许更多的独特序列,并且可以允许降低重复风险。此外,例如,在其中期望对所述独特标识符序列内的标识信息编码或加密的实施方式中,更长的长度可以允许储存相对更多的信息和/或使用更精巧的加密或编码方案。也就是说,通过维持合理的长度,如本文所提及的那些,可以实施更可靠和/或快速的扩增和/或测序,和/或可以相对减少成本。
在某些实施方式中,所述独特标识符序列可以包含长度多至约1500nt;长度多至约1000nt;长度约200nt至约600nt;长度约200nt至约400nt;或者长度约400nt至约600nt的序列。在某些实施方式中,所述独特标识符序列可以是相对短的,如(例如)长度约20bp。如将理解的,在某些实施方式中,可以选择所述独特标识符序列的尺寸以适合特定实施及其所期望的参数。在某些实施方式中,所述独特标识符序列可以具有约20nt至约1500nt的尺寸或者它们之间的任何尺寸或者其中所包含的任何子范围。
在某些实施方式中,例如,所述独特标识符序列可以随机得自混合池,并且可以任选地对于可接受性筛选所述独特标识符序列(例如,对于独特性进行筛选,筛选以避免不希望的序列基序)或者可以理性设计所述独特标识符序列(例如,对于独特性进行设计,设计以避免不希望的序列基序)。
在某些实施方式中,所述DNA独特标识符序列可以侧接一个或多个引物退火序列以用于所述DNA独特标识符序列的PCR扩增、所述DNA独特标识符序列的测序或两者。
在某些实施方式中,据考虑可以在盒中提供所述独特标识符序列或另外将其引入或插入基因组核酸,从而使其侧接一个或多个引物退火序列以用于所述DNA独特标识符序列的PCR扩增、所述DNA独特标识符序列的测序或两者。在本文中进一步详细描述了适合的盒和配置的实例。在某些实施方式中,可以将所述盒引入质粒、载体或适合于在将所述盒插入/引入/整合到生物实体的基因组中使用的其它这些载体。
如将理解的,通过考虑本文中的教导内容,本领域技术人员已知的任何适合的基因修饰技术可以用于将所述独特标识符序列或者包含所述独特标识符序列的盒/载体引入/插入/引入/整合到生物实体的基因组中。如还将理解的,可以基于正在使用的独特标识符序列或盒/载体并且基于正在修饰的特定生物实体选择基因修饰技术。用于多种生物实体,包括植物、动物、真菌、细菌和病毒的基因组修饰的技术是熟知的并且可以容易地修改用于外源引入如本文所描述的独特标识符序列。
举例来说,技术人员通过考虑本文中的教导内容将知晓用于将DNA引入生物的载体,其可以根据已知的分子生物学原理设计。可以(例如)设计这些载体以将所关心的DNA序列稳定引入生物的基因组中。在某些实施方式中,例如,载体可以是病毒来源的或由此获得的。当所述生物是植物时,据考虑(例如)根癌农杆菌-介导的所关心的DNA的引入可以用于向植物的引入。技术人员通过考虑本文中的教导内容将知晓几种其它转化方法,如弹道或粒子枪法等,其可以基于所关心的具体应用,根据需要或根据适合性进行修改。在某些实施方式中,可以基于基因工程原理使用基因递送系统,从而可以将所关心的序列引入或插入宿主生物的基因组。举例来说,在一个实施方式中,转座子系统可以用于向宿主基因组的插入,例如,所述宿主可以是微生物、动物细胞或植物细胞(Insect Molecular Biology(2007),16(1),37-47,Plant Physiology Preview.2007,DOI:10.1104/pp.107.111427,the American Society of Plant Biologists;research on production oflactoferrin from transformed silkworms and functionality thereof,the Ministryof Agriculture and Forestry,2005)。在某些实施方式中,可以使用分子生物学和/或基因工程领域中的任何适合的方法,其能够将所关心的一个或多个DNA片段或组件插入到宿主的基因组中(参见,例如,Transgenic Plants Methods and Protocols.,Methods inMolecular Biology 2019,主编:Kumar,Sandeep,Barone,Pierluigi,Smith,Michelle,ISBN 978-1-4939-8778-8,该文献以其全部内容作为参考并入本文)。
在某些实施方式中,当期望标识包含独特标识符序列的生物材料或生物实体时,可以通过测序确定所述独特标识符序列的序列。如将理解的,通过考虑本文中的教导内容,可以一般地通过本领域技术人员已知的任何适合的测序技术对所述独特标识符序列测序。在某些实施方式中,可以通过在基因组核酸内包括或使用与所述独特标识符序列相关联的测序引物退火序列来辅助测序。例如,在本文中详细描述了这些测序引物退火序列的实例,其可以引入包含所述独特标识符序列的盒中。
在某些实施方式中,通过考虑本文中的教导内容,可以使用本领域技术人员已知的任何适合的测序技术进行测序,可以基于正在使用的具体应用和/或配置来选择所述技术。在某些实施方式中,可以通过用于确定DNA(或RNA)分子中核苷酸碱基顺序的任何适合的测序方法进行测序。例如,测序方法的实例可以包括(例如)马克萨姆-吉尔伯特测序、链终止法、染料-终止子测序、自动DNA测序、体外克隆扩增、通过合成的平行测序、通过连接测序、Sanger测序,如微流体Sanger测序和通过杂交测序。
在某些实施方式中,一旦确定生物材料的独特标识符测序的序列,则所述序列可以用于提供在包含一系列与相关标识和/或追溯信息成对或另外相关联的独特标识符序列的数据库(在本文中也称为登记表)中搜索的查询。如果发现匹配数据库条目,则可以检索数据库条目以提供所关心的生物材料的标识和/或追溯信息。以这种方式,可以确定生物材料的相关标识和/或追溯信息,并且可以将其用于(例如)告知事件,如(例如)食品召回或其它动作。
在另一个实施方式中,本文提供了用于提供生物材料的可追溯性的方法,所述方法包括:
确定生物实体的基因组DNA内的至少一种DNA独特标识符序列的序列;
通过以下方法证实生物实体的标识:验证所述基因组DNA中DNA独特标识符序列的存在;和将所述DNA独特标识符序列的序列与数据库相比较以确认在数据库中尚未使用的DNA独特标识符序列;
提供从生物实体产生生物材料的可接受性的指示,所述生物材料包含来自所述生物实体的基因组DNA;和
将所述至少一种DNA独特标识符序列的序列输入数据库的数据库条目中,并将DNA独特标识符序列与所述生物材料的标识和/或追溯信息相关联;
借此通过读取所述生物材料中的DNA独特标识符序列并检索相应数据库条目,从而提供所述生物材料的标识和/或追溯信息,提供生物材料的可追溯性。
图8显示了显示该方法的实施方式的流程图。
如将理解的,所述生物实体可以一般地包含所关心的任何适合的生物实体。所述生物实体可以包含细胞(即植物细胞、真菌细胞、动物细胞或细菌细胞)或者包含一个或多个细胞的种子或组织,或者病毒,或者生物,如植物、动物或真菌或其任何部分或者由它们组成。在某些实施方式中,所述生物实体可以包括植物细胞、真菌细胞、动物细胞、病毒或细菌细胞。当将生物实体基因修饰以引入独特标识符序列时,所述生物实体通常可以包含在基因修饰后可以增殖以产生分别包含所插入的独特标识符序列的更多生物实体的细胞或病毒。
在某些实施方式中,可以实施证实步骤以验证生物实体的基因组DNA内独特标识符序列的存在,和/或确定其序列,和/或确定是否尚未在数据库中使用所述独特标识符序列(即是先前尚未与数据库条目相关联的新序列)。如果验证成功(即正确插入所述独特标识符序列并且所述独特标识符序列对数据库唯一),则在某些实施方式中,可以在数据库中产生独特标识符序列的数据库条目(其可以与相关标识和/或追溯信息相关联,并且可以任选地在持续进行的基础上更新),并且可以将从生物实体产生生物材料的可接受性的指示提供给有关的当事人,如种植户、农民或者可能然后生产或种植所述生物材料的其它农业实体。
以这种方式,可以通过读取生物材料的独特标识符序列(即测序)提供生物材料的可追溯性,其可以用于检索相应数据库条目以获得标识和/或追溯信息。
在某些实施方式中,本文所描述的方法还可以包括在生物实体的基因组DNA内插入至少一种DNA独特标识符序列或者通过基因编辑修饰生物实体的基因组DNA内预先存在的标识符序列,从而在所述生物实体的基因组DNA内创建DNA独特标识符序列,借此提供它的标识。
在另一个实施方式中,本文所描述的方法还可以包括提供用于在生物实体的基因组DNA内的插入的至少一种DNA独特标识符序列。在某些实施方式中,可以作为如本文进一步描述的序列的随机混合池提供DNA独特标识符序列。
如将理解的,据考虑在某些实施方式中,如本文所描述的方法可以使用单个独特标识符序列,或者可以使用引入基因组的两种或更多种标识符序列以提供标识和/或可追溯性。
在某些实施方式中,所述独特标识符序列可以来自独特标识符序列的随机混合池。可以不确定所插入的独特标识符序列的身份直至已实现插入(即转化或基因修饰)。以这种方式,据考虑可以向有关的当事人提供独特标识符序列的随机混合池,并且可以实施所关心的生物实体的基因修饰,从而使1、2或更多个独特标识符序列插入基因组。在基因修饰过程后,可以对所插入的独特标识符序列测序以确定所插入的独特标识符序列的核苷酸序列。考虑到通常可以将独特标识符序列的典型长度选择为足够长度,从而在随机混合池内提供多种不同序列,两位不同当事人插入相同独特标识符序列的统计学可能性可以是极低的。因此,以这种方式,据考虑在某些实施方式中,均可以向设法从如本文所描述的方法的标识和/或可追溯性受益的多位不同当事人提供来自相同类似的序列随机混合池的样品以用于在他们的所关心的生物实体中插入。以这种方式,据考虑可以使方法流水线和/或可以在某些实施方式中降低成本。
在如本文所描述的方法的另一个实施方式中,读取所述生物材料中的DNA独特标识符序列并检索相应数据库条目可以包括:
接受或提供包含来自所述生物材料的基因组DNA的样品;
扩增来自所述生物材料的基因组DNA内的至少一种DNA独特标识符序列并对所述DNA独特标识符序列测序;和
将所述DNA独特标识符序列与数据库相比较,并检索与所述DNA独特标识符序列对应的数据库条目,所述数据库条目提供了所述生物材料的标识和/或追溯信息。
在某些实施方式中,据考虑可以在基本无害(即可以不显著影响基因表达或表型)的位点将所述独特标识符序列插入生物实体的基因组。例如,在某些实施方式中,据考虑可以在基因组DNA的一个或多个基因间区插入所述独特标识符序列。
在某些实施方式中,在数据库或登记表所提供的标识和/或追溯信息可以包括所述生物材料的供应链信息。在某些实施方式中,所述数据库的标识和/或追溯信息可以包括所述生物材料的来源信息。在某些实施方式中,所述数据库的标识和/或追溯信息可以包括种植户、地区、批(batch)、批次(lot)、日期或其它相关供应链信息或它们的任意组合。通过考虑本文的教导内容,本领域的技术人员将认识到可以包括在数据库中的多种标识和/或追溯信息,并且可以根据需要进行选择或者以适合特定应用。在某些实施方式中,例如,现有的供应链追溯特征,如条型码或者批次号或批号可以包括在数据库中。在某些实施方式中,信息,如地理区域、日期、购买者、农民、批次、子批次、收获、批、其它DUID-有效产品、生物、合同义务、认证、邻近行业和商业、传感器数据、气象数据或它们的任意组合可以包括/储存在数据库中。
在另一个实施方式中,本文提供了标识生物材料的方法,所述方法包括:
在计算装置处接收提取自已知生物材料的DNA独特标识符序列(DUID);
在所述计算装置处搜索储存了与各个生物材料信息相关联的多个DUID的DUID数据库以用于匹配所接收的DUID;
如果DUID数据库的搜索不能提供与所接收的DUID的匹配,则在所述DUID数据库中储存与已知生物材料相关联生物材料信息相关联的所接收的DUID;
在储存所接收的DUID并具有与DUID数据库中的已知生物材料相关联的信息之后,在所述计算装置接收提取自未知生物材料的查询DUID;
在所述计算装置处搜索所述DUID数据库中与所接收的查询DUID的匹配;且
如果DUID的搜索提供了与所接收的查询DUID的匹配,则对所接收的查询DUID响应,返回与匹配所述查询DUID的DUID相关联的所储存的生物信息。
图7显示了显示该方法的实施方式的流程图。在该图中,从已知生物材料提取(即读取、确定或测序)DNA独特标识符序列(所示实施例中的DUID-DuID 4)并提供给计算装置。将所述计算装置用于搜索存储与各个生物材料信息相关联的多个DUID的DUID数据库(即DuID数据存储)中与所接收的DUID 4的匹配。如果DUID数据库的搜索不能提供与所接收的DUID的匹配,则将所接收的DUID(DuID 4)存储在与已知生物材料相关联生物材料信息(即生产商4信息(Producer 4info))相关联的DUID数据库中,借此提供DUID和生物材料在所述数据库中的登记。然后,可以向有关的当事人提供成功登记的通知,并批准继续增殖所述生物实体/材料以生产生物材料,如食品产品。在DUID数据库中存储所接收的DUID并具有与已知生物材料相关联的信息后,可以在计算装置处接收从未知生物材料(即所关心的生物材料,如怀疑污染的食品产品)所提取(即读取,例如,通过测序)的查询DUID,并且可以实施DUID数据库搜索与所接收的查询DUID的匹配。如果DUID数据库搜索提供了与所接收的查询DUID的匹配,则可以对所接收的查询DUID响应返回所存储的与匹配所述查询DUID的DUID相关联的生物信息,因此提供生物材料的追踪和/或标识信息,其可以用于采取响应,如(例如)食品召回。
在另一个实施方式中,搜索所述DUID数据库中与所接收的DUID的匹配可以包括:
搜索DUID数据库中与所接收的DUID的完全匹配;和
如果未找到完全匹配,则对DUID数据库中储存的与所接收的DUID密切匹配的DUID实施比对/同一性搜索。
在另一个实施方式中,搜索所述DUID数据库中与查询DUID的匹配可以包括:
搜索所述DUID数据库中与所述查询DUID的完全匹配;且
如果未找到完全匹配,则对所述DUID数据库中储存的与所述查询DUID密切匹配的DUID实施比对/同一性搜索。
如将理解的,由于正在使用核酸序列,则在可能发生增殖和/或扩增和/或测序错误期间,可以存在独特标识符序列的序列突变的可能性。因此,在某些实施方式中,可以实施这种比对/同一性搜索以标识是否可能存在密切或高度类似匹配的条目。对于实施这种比对/同一性/相似性评价存在多种序列比较算法(参见,例如,得自NCBI的BLAST工具),并且技术人员考虑本文的教导内容将能够根据需要选择或修改适当算法以适合具体应用。
在另一个实施方式中,本文所描述的方法还可以包括:
如果所述搜索提供了与所述查询DUID的密切匹配,则储存与所述查询DUID密切匹配的DUID相关联的查询DUID。
例如,以这种方式,可以更新数据库,其中(例如)标识了序列突变。
在另一个实施方式中,本文提供了用于标识生物材料的计算系统,所述系统包括:
能够执行指令的处理单元;和
存储指令的存储单元,当通过处理单元执行时,该指令配置所述计算系统执行如本文所描述的任何一种或多种方法。
在另一个实施方式中,本文提供了计算机可读存储器,其具有在其上存储的指令,当通过计算系统的处理单元执行时,其配置所述系统执行本文所描述的任何一种或多种方法。
在另一个实施方式中,本文提供了用于标识生物材料的方法,所述方法包括:
接受或提供包含来自所述生物材料的基因组DNA的样品;
扩增来自所述生物材料的基因组DNA内的至少一种DNA独特标识符序列并对所述独特标识符序列测序;和
将DNA独特标识符序列中储存的生物材料的标识和/或追溯信息解码或解密。
这些方法实施方式可以类似于本文所描述的使用数据库或登记表(registry)的那些,但例外是不在数据库中存储标识和/或追溯信息,而是作为替代可以在独特标识符序列本身内编码(加密或不加密)信息。在核酸序列中存储信息的方法在本领域中是已知的,并且通常可以包括使用类似于数字数据存储中的0和1二进制数字的A、T、G、C核苷酸。用于存储/编码/加密信息的方法的实例可见于(例如)Clelland,C.,Risca,V.&Bancroft,C.Hiding messages in DNA microdots.Nature 399,533–534(1999)doi:10.1038/21092(其作为参考并入本文)。
图11显示了显示该方法的实施方式的流程图。
在某些实施方式中,据考虑所述独特标识符序列可以用于编码关键词,并且正是存储在数据库中的关键词与追溯和/或标识信息相关联。因此,将理解在本文中提及在数据库中存储DUID和在数据库中搜索DUID可以被认为涵盖了直接(即存储和搜索独特标识符序列本身的一级核酸序列)和间接(即从独特标识符序列的一级核酸序列获得关键词并使用关键词以在数据库中存储和搜索数据库)选择两者。技术人员通过考虑本文中的教导内容将认识到可以使用的多种组合,所有这些组合旨在涵盖在本文中。
在另一个实施方式中,本文提供了用于提供生物材料的可追溯性的方法,所述方法包括:
确定生物实体的基因组DNA内的至少一种DNA独特标识符序列的序列;
通过以下方法证实生物实体的标识:验证基因组DNA中DNA独特标识符序列的存在;和将DNA独特标识符序列中储存的标识和/或追溯信息解码或解密以验证所述DNA独特标识符序列;和
提供从生物实体产生生物材料的可接受性的指示,所述生物材料包含来自所述生物实体的基因组DNA;
借此通过读取所述生物材料中的DNA独特标识符序列并对DNA独特标识符序列中储存的信息解码或解密,从而提供所述生物材料的标识和/或追溯信息,提供生物材料的可追溯性。
图10显示了显示该方法的实施方式的流程图。
这些方法实施方式可以类似于本文所描述的使用数据库或登记表(registry)的那些,但例外是不在数据库中存储标识和/或追溯信息,而是作为替代可以在独特标识符序列本身内编码(加密或不加密)信息。在核酸序列中存储信息的方法在本领域中是已知的,并且通常可以包括使用类似于数字数据存储中的0和1二进制数字的A、T、G、C核苷酸。用于存储/编码/加密信息的方法的实例可见于(例如)Clelland,C.,Risca,V.&Bancroft,C.Hiding messages in DNA microdots.Nature 399,533–534(1999)doi:10.1038/21092(其作为参考并入本文)。
在另一个实施方式中,本文提供了标识生物材料的方法,所述方法包括:
在计算装置处接收提取自未知生物材料的DNA独特标识符序列(DUID);和
将DNA独特标识符序列中储存的未知生物材料的标识和/或追溯信息解码或解密。
图12显示了显示该方法的实施方式的流程图。
在另一个实施方式中,本文提供了用于提供生物材料的可追溯性的方法,所述方法包括:
将至少一种DNA独特标识符序列插入生物实体的基因组DNA内以用于制备所述生物材料。
在上述方法的另一个实施方式中,可以作为如本文所描述的任何一种或多种盒插入所述DNA独特标识符序列。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括确定所述生物实体的基因组DNA内的至少一个DNA独特标识符序列的序列的步骤。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括通过以下方法证实生物实体的标识的步骤:验证基因组DNA中DNA独特标识符序列的存在;并且将所述DNA独特标识符序列的序列与数据库相比较以确认已不在所述数据库中使用所述DNA独特标识符序列。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括以下步骤:
从生物实体产生生物材料,所述生物材料包含来自所述生物实体的基因组DNA;和/或
提供从生物实体产生生物材料的可接受性的指示,所述生物材料包含来自所述生物实体的基因组DNA。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括以下步骤:将至少一种DNA独特标识符序列的序列输入到数据库条目,并且将所述DNA独特标识符序列与所述生物实体和/或生物材料的标识和/或追溯信息相关联。
在上述任何一种或多种方法的另一个实施方式中,所述方法还可以包括以下步骤:
通过读取生物实体和/或生物材料中的DNA独特标识符序列并检索提供所述生物实体和/或生物材料的标识和/或追溯信息的相应数据库条目来提供所述生物实体和/或生物材料的可追溯性。
寡核苷酸构建体、盒、质粒、载体、细胞和试剂盒
在另一个实施方式中,本文提供了包含独特标识符序列的盒,所述独特标识符序列侧接至少一个5'引物退火序列和至少一个3'引物退火序列以用于所述DNA独特标识符序列的扩增、所述DNA独特标识符序列的测序或两者。
如将理解的,在某些实施方式中,这些盒可以用于如本文所描述的任何一种或多种方法。
在所述盒的某些实施方式中,所述DNA独特标识符序列可以侧接两个5'引物退火序列和两个3'引物退火序列以允许通过巢式PCR扩增所述DNA独特标识符序列。在某些实施方式中,例如,巢式设计可以用于改善召回保真度。在所述盒的其它实施方式中,所述两个5'引物退火序列可以部分重叠;所述两个3'引物退火序列可以部分重叠;或两者。在所述盒的其它实施方式中,所述盒还可以包括位于所述DNA独特标识符序列的5'端的测序引物退火序列以用于所述DNA独特标识符序列的测序。在所述盒的其它实施方式中,所述测序引物退火序列可以位于两个5'引物退火序列之间。在所述盒的其它实施方式中,所述测序引物退火序列可以与所述两个5'引物退火序列之一或两者至少部分重叠。在所述盒的其它实施方式中,所述两个5'引物退火序列可以部分重叠并且所述测序引物退火序列的至少一部分可以位于所述重叠处。在所述盒的其它实施方式中,所述盒序列可以长度多至约1500nt;长度多至约1000nt;长度为约200nt至约600nt;长度为约200nt至约400nt;或者长度为约400nt至约600nt。
图2显示了如本文所描述的盒的实施方式及其生产方法的实例,其中可以使用随机序列的寡核苷酸混合池生产盒。根据需要,寡核苷酸的随机混合池可以是可商购获得的或者可以是合成的。例如,可以通过酶促聚合或连接来组装它们或者化学合成它们。可以纯化,例如,通过柱分离纯化随机寡核苷酸片段以分离具有大致相同或类似尺寸的片段(例如,所示实例中约300nt-400nt的尺寸),并且可以将它们插入盒中。可以产生含有多种不同独特标识符序列的盒的混合池(即在一些实例中,约107)。所述盒可以以适当布置包含引物退火序列(即引物结合位点)和至少一个测序引物退火序列(即测序引物结合位点)以允许DUID的扩增和/或测序,如图2所示的配置。可以对宿主基因组证实引物和测序位点以验证不存在天然扩增。如果需要,可以将具有不同引物的盒用于不同生物或不同基因组。例如,所述盒可以包括限制性内切酶阵列位点,并且可以以插入盒载体质粒或载体的形式提供所述盒。在某些实施方式中,所述盒的长度可以为约500bp,并且例如,可以在尺寸约1200bp的质粒或载体内提供所述盒。
如将理解的,例如,盒的引物退火序列可以是指具有已知核苷酸序列的预定核酸序列或区域,从而可以设计或选择用于退火至该引物退火序列的一个或多个引物,从而引发通过聚合酶的聚合反应。引物退火序列可以用于所述独特标识符序列的扩增、所述独特标识符序列的测序或两者。
图13显示了如本文所描述的包括UID(独特标识符)序列的盒设计的其它实例。图13(a)显示了双重引物设计,13(b)显示了单一引物设计并且13(c)显示了独立设计。在图13(a)的双重引物插入盒设计中,所示的实施方式包括限制性内切酶阵列,5'“引物A”区和5'“引物B”区(其中5'测序引物可以在“引物A”和“引物B”之间的区域退火),之后是钝端连接位点。然后,提供UID区(例如,可变bp随机DNA或另一个标识符序列),并且如所示的,可以任选地提供CAS 9 PAM位点。之后是钝端连接位点,并且然后提供了3'“引物B”区和3'“引物A”区,然后是限制性内切酶阵列。在图13(b)的单一引物插入盒设计中,所示的实施方式包括限制性内切酶阵列,5'“引物A”区(在此5'测序引物可以退火),之后是钝端连接位点。然后,提供UID区(例如,可变bp随机DNA或另一个标识符序列),并且如所示的,可以任选地提供CAS 9 PAM位点。之后是钝端连接位点,并且然后提供了3'“引物B”区,然后是限制性内切酶阵列。在图13(c)中,显示了独立插入盒设计的实施方式,其包括限制性内切酶阵列、UID区(例如,可变bp随机DNA或另一个标识符序列),如所示的,可以任选地提供CAS 9 PAM位点和限制性内切酶阵列。
如图13所示,考虑了多种不同的盒设计。例如,就所存在的元件而言,就尺寸而言并且就扩增效率而言,盒可以是不同的。基于是否存在引物对(参见图13(A)-(C)),可以改变总的盒尺寸。例如,因为消除了单个引物对,因此可以减小总的盒尺寸(例如,在某些实施方式中,减小约40bp)。如将理解的,在某些实施方式中,可以由于引物对消除而降低UID的扩增效率。例如,对于双重引物设计,任何引物排列可以用于扩增,从而提供了4种可能变化,而不是如将对于单一引物对设计可见的一种。如还将理解的,在某些实施方式中,例如,减小盒尺寸可以提供非故意作用潜力的降低。在某些实施方式中,例如,任选的CAS 9 PAM位点可以用于允许UID序列在转化的生物子代中有效CRISPR-基编辑。在其中从盒设计消除所有引物的某些实施方式中,据考虑可以任选地提供CAS 9 PAM,其中在某些实施方式中,CAS 9 PAM位点可以允许完全由宿主基因组DNA构建独立的盒,例如,如当使用DNA消化/连接技术时。在某些实施方式中,所述UID序列的长度可以是可变的。据考虑在某些实施方式中,可以安全使用更短的UID序列,例如,特别是当实施包括检查登记表中已有的UID和新插入的UID之间的任何冲突的验证步骤时。
在本文所描述的盒的另一个实施方式中,所述引物退火序列可以不是靶标生物实体的基因组中天然存在的。以这种方式,可以减少或避免非故意和/或脱靶扩增和/或测序。
在另一个实施方式中,本文提供了包含多个如本文所描述的任何一种或多种盒的组合物,每个盒包含相同的引物退火序列并且每个盒包含随机DNA独特标识符序列。这些组合物可以代表如本文所描述的序列的随机混合池的实例。
在另一个实施方式中,本文提供了包含多个如本文所描述的任何一种或多种盒的组合物,每个盒包含相同的引物退火序列和相同的测序引物退火序列,并且每个盒包含随机DNA独特标识符序列。这些组合物可以代表如本文所描述的序列的随机混合池的实例。
在另一个实施方式中,本文提供了包含如本文所描述的任何一种或多种寡核苷酸或者如本文所描述的任何一种或多种盒的质粒、表达载体或者其它单链或双链寡核苷酸构建体。
在另一个实施方式中,本文提供了盒,其包含如本文所描述的任何一种或多种寡核苷酸。
在另一个实施方式中,本文提供了包含引入所述细胞或病毒的基因组中的如本文所描述的任何一种或多种寡核苷酸或者如本文所描述的任何一种或多种盒的细胞或病毒。在另一个实施方式中,本文提供了包含引入细胞或病毒的基因组的独特标识符序列的细胞或病毒。在本文所描述的任何细胞或病毒的另一个实施方式中,可以将所述独特标识符序列引入所述细胞或病毒的基因组核酸的基因间区中。在任何细胞或病毒的另一个实施方式中,所述细胞可以是植物细胞、真菌细胞、动物细胞或细菌细胞。
在另一个实施方式中,本文提供了试剂盒,其包含以下中的任何一个或多个:
DNA独特标识符序列;
DNA独特标识符序列的随机混合池;
如本文所描述的任何一种或多种寡核苷酸;
如本文所描述的任何一种或多种盒;
用于DNA独特标识符序列的扩增和/或测序的一个或多个引物或引物对;
缓冲液;
聚合酶;或
用于实施如本文所描述的任何一种或多种方法的说明书;
或它们的任意组合。
在另一个实施方式中,本文提供了用于提供感兴趣的产品的可追溯性的方法,所述方法包括:
接收或提供来自感兴趣的产品的样品,所述样品包含来自感兴趣的产品的生物材料部分,与感兴趣的产品混合或另外与感兴趣的产品相关联的基因组DNA;
扩增来自所述生物材料的基因组DNA内的至少一种DNA独特标识符序列并对所述独特标识符序列测序;和
在数据库中搜索所述DNA独特标识符序列并检索对应于所述DNA独特标识符序列的数据库条目,所述数据库条目提供了感兴趣的产品的标识和/或追溯信息。
在上述方法的另一个实施方式中,所述方法可以包括将如本文所描述的任何一种或多种生物材料或者一种或多种生物实体引入或添加至感兴趣的产品,所述生物材料或实体包含作为其基因组材料的一部分的如本文所描述的至少一种DNA独特标识符序列。
在上述任何一种或多种方法的另一个实施方式中,所述数据库条目的标识和/或追溯信息可以包括感兴趣的产品的供应链信息。
在上述任何一种或多种方法的另一个实施方式中,感兴趣的产品可以包括食品、农产品、药物、零售产品、纺织品、日用品、化学品或者另一种供应链物品。
实施例1-用于提供食品可追溯性的示例性DUID系统
本实施例描述了在本文中称为DNA独特标识符(DUID)系统的示例性食品可追溯性系统的实施方式。本实施例利用DNA序列的耐久性和可复制能力在生物的核基因组内安全编码独特标识符。将标识信息以本发明所述的方式编码到生物DNA中可以在整个供应链的可追溯性方面提供粒度(granularity)。具体地,所述DUID系统可以具有以下能力:
1.在不影响靶标生物的可遗传性状的情况下,安全实现DNA水平的群体标识;
2.在DUID和参考信息之间产生逻辑关系;
3.将追溯产品来源所花的时间从数月缩短至约1天;
4.提供对产品来源及其通过供应链的确定途径两者的快速标识;
5.为专业医护人员和行业管理者提供有价值的信息;
6.在食品供应-链的稳定性、透明度和效力方面培育消费者和行业信心;和/或
7.支持增强成员关联义务和食品产品的知识产权的机制。
据考虑在某些实施方式中,例如,所述DUID系统可以用于显著增强食品系统风险承担者的监管能力。除提供可追溯性之外,如本文所描述的DUID系统可以完全改变有关归属点(point of attribution)的传统想法——自下而上而不是自上而下。如本文所描述的,考虑到供应-链整合增加成为标准,这些方法可以是特别期望的。如果需要,如本文所描述的DUID系统可以在约一天内提供一般地来自整个供应-链的任何地方的几乎确保的来源可追溯性。系统可以受益于生物的可复制和稳定的细胞性质,并因此随着子代产生,边际成本可以接近于零。传统追溯系统的篡改和/或掺假的财务费用和风险相当高,并且恶意活动的法律含义可以是显著的。例如,可以以使人感兴趣的方式编辑如本文所描述的DUID系统,从而子代群体维持原始标识符部分。例如,可能想要测试人排泄物的专业医护人员也可以使用DUID来标识最近消耗的食品。
据考虑上述群体-水平的标识可以任选地包括对法律协议的其它参考。举例来说,据考虑产品的IP持有人可以有目的地将增殖材料与(例如)特定种植户和/或区域相联系。群体-水平的基因标识结合传统的完整-链可追溯性技术可以使得能够对产品移动具有显著控制水平。例如,考虑已进行基因工程来耐受多种害虫的菠菜植物品种。使用DUID系统,可以显著降低检测成本。除成本降低之外,例如,所述DUID系统可以作为登记表起作用以提供IP追溯的中心接触点。
多种生物受到管理。例如,植物品种可以是麻醉剂的前体。例如,在某些实施方式中,这些生物可以受益于与批准的法律实体无法解除的关联。因此,据考虑这些实例可以受益于如本文所描述的策略。
在一个实施例中,考虑加拿大对大麻的管控。大麻植物及其增殖材料的生产和分销受到管控。据考虑在某些实施方式中,许可的大麻生产者可以将DUID包括到他们的产品中,例如,其可以用于帮助管控。在某些实施方式中,这种DUID可以有助于通过标识和/或追溯大麻,甚至在其中大麻与其它东西混合的复杂实例中。
在另一个实施例中,考虑菠菜种植户协会。在某些实施例中,可能需要协会成员来种植和销售菠菜。在某些实施方式中,据考虑这些增殖材料可以来源于DUID-就绪的植物。然后,可以在零售水平进行任意审查以确保所有正在销售的菠菜是经授权的,例如。
DUID系统:
DUID系统可以涵盖(例如)产品标识、DUID验证、DUID读取和后续产品群体的追溯。它还可以起到所有DUID数据的中心登记表的作用。
在以下实施例中,DUID平台可以包括一些列参与者、商业业务、任务、事件和系统。参与者可以执行或启动商业业务和任务。可以就他们所产生的事件来理解系统和商业业务。事件可以直接与食品产品的追溯状态相联系。
参与者:举例来说,来自FDA(参与者)的消费者安全员(参与者)可以要求DUID平台(参与者)尝试从所提供的所关心的有机材料读取(商业业务)DUID。参与者是DUID平台的引擎。参与者可以是系统、组织和/或个体。他们可以启动事件并请求商业业务。参与者还可以执行任务。以下列表提供了参与者的一些实施例;然而,这是出于说明性目的的非彻底清单:
·DUID平台
DUID登记表
DUID API
分析化学家
微生物学家
·生产者
植物学家
CFO
可追溯性软件
·种植户
食品安全主管
企业资源规划系统
·包装员/运输员
货车驾驶员
经理
CEO
·零售员
食品安全主管
CFO
总顾问
·政府管理人员
消费者安全员
管理官员
·保险商
承保人
理赔理算人
商业业务:举例来说,一旦消费者安全员(参与者)认证/授权并且成功完成读取(商业业务),可以将读取(事件)登记在登记表(系统)中。商业业务可以涵盖关键过程和任务,其最终可以产生事件。这些业务可以设计为无状态的(stateless),其中它们不需要存在任何特定在先状况以使其启动。他们可以决定为了成功完成使某些事件发生。在任何情况下,商业业务可以使用系统,但最通常包括一些人的参与。举例来说,在某些实施方式中,应由参与者请求或启动。商业业务还可以类似地命名它们所产生的事件——例如,验证(Validation)(商业业务)→证实(Validated)(事件)。
系统:举例来说,一旦将读取(事件)登记到登记表(系统)、流处理器(系统)可以从登记表读取新创建的读取(事件)并且可以将其广播给认证/授权听众(系统)。听众之一可以更新产品商标所有者(参与者)所使用的通知主页(notification dashboard)。另一方面,系统可以仅与其它系统相互作用,或者另外可以是人操作的客户端。换言之,系统通常可以是数字系统。DUID平台内的系统的实例可以是API。API可以将界面暴露给在平台边界外操作的授权参与者。系统的另一个实施例可以是DUID登记表(即数据库),其可以起到用于所有DUID数据永久数据存储的作用。登记表可以不直接暴露于外部参与者。
事件:举例来说,可以由来自FDA(参与者)的消费者安全员(参与者)请求读取(商业业务)。在授权/认证后,商业业务可以导致成功读取(事件)。事件可以表示商业业务和系统的结果。事件通常相对于DUID进行登记。也就是说,可以通过商业业务标识;证实或读取生物;并通过内部或外部系统追溯。下表列出了每个事件,及其在本实施例中与多种商业业务、参与者、系统和任务的关系。
表1:事件及其在本实施例中与多种商业业务、参与者、系统和任务的关系。
Figure GDA0003801688640000381
Figure GDA0003801688640000391
如所述的,本实施例中的DUID平台可以涵盖多个参与者、商业业务、事件、系统和/或任务。所有这些组分可以遵守具体工艺流程。本节将详细描述示例性流程。用于显示这些过程的图表使用了BPMN 2.0表示法(BPMN 2.0-https://www.omg.org/spec/BPMN/2.0/PDF;该文献以其全部内容作为参考并入本文)。这些图表在附图中可用,其将在下文中进一步详细描述。
过程概述:
图3描述了用于本实施例的DUID生态系统的示例性过程的全局视图。
过程开始:
在示例性方法开始前,可以预期就业务而言,相关一致性已落实到位。这可以包括了解客户(know-your-customer,KYC)验证,如所有权证据、法律实体标识和付款。除KYC要求之外,顾客可以能够通过行政主页(administrative dashboard)来指明用户访问角色及其它系统/账户设置。
引物和测序位点产生:
这可以是独立于所述过程发生的正在进行/正在运行的任务。例如,DUID引物的开发可以基于常规宿主生物要求或者R&D工作或两者。可用的引物的存在可以用于标识商业业务。
标识:
可以在图4中详细查看所述标识商业业务。该商业业务的物理产出可以是DNA序列-基盒,其可以在生物转化期间由生产者使用。可以存在两种情况,它们可以在该活动内完成。
首先,据考虑如果存在已有的盒,则可以使用标准CRISPR和/或相关技术来修改已有标识符部分。例如,如果将已有的标识符定位至地理区,则可以在序列末端编辑少量碱基。可以将这种编辑定位至更具体的信息——例如,处理后的预期转化状态。一旦完成,可以引发标识事件。
如果不存在已有的盒,则可以将其产生。有关该过程的详细信息,参见图2。如图2所示,可以使用随机序列的寡核苷酸的混合池产生盒。根据需要,寡核苷酸的随机混合池可以是可商购获得的或者可以是合成的。例如,可以通过酶促聚合或连接来组装它们。可以纯化,例如,通过柱分离纯化随机寡核苷酸片段以分离具有大致相同或类似尺寸的片段(例如,所示实施例中约300nt-400nt的尺寸),并且可以将它们插入盒中。可以产生含有多种不同独特标识符序列的盒的混合池(即在一些实施例中,约107)。所述盒可以以适当布置包含引物退火序列(即引物位点)和至少一个测序引物退火序列(即测序位点)以允许DUID的扩增和/或测序,如图2所示的配置。可以对宿主基因组证实引物和测序位点以验证不存在天然扩增。如果需要,可以将具有不同引物的盒用于不同生物或不同基因组。例如,所述盒可以包括限制性内切酶阵列位点,并且可以以插入盒载体质粒的形式提供所述盒。在某些实施方式中,所述盒的长度可以为约500bp,并且例如,可以在尺寸约1200bp的质粒或载体内提供所述盒。
一旦完成盒,则可以引发标识的事件,并且可以将盒发送给顾客。顾客通常将是生产者,如农业行业中的种植户。生产者可以使用适合的转化和再生技术来再生目前包含插入基因组的盒的所关心的生物。然后,他们可以产生含有至少来自转化的生物实体的基因组DNA的样品的验证包,然后可以将所述验证包送回。
验证:
在接收所述验证包,验证请求者身份并检查授权后,可以开始验证过程。图5列出了用于验证的方法实施例。可以对于下列验证DUID:
·宿主核基因组中的稳定整合。
可以容易地从完整DNA提取物扩增DUID。
DUID序列可以是从DUID盒可收回的并且在可预测的技术规范内。
·独特价值有效性。
如果该值已存在于登记表中,则可以丢弃转化事件。
·整合的拷贝数。
其中可以丢弃不止一个DUID拷贝的转化事件(尽管还考虑在一些实施例中,可以使用不止一种DUID)。
·整合位置
可以将DUID靶向非编码/基因间区以减少影响天然编码区的插入的可能。
DUID的位置也可以定位至具体染色体和染色体臂。
·无表达评价。
如果存在任何DUID的RNA表达,则可以丢弃转化事件。
可以使用两组引物独立扩增DUID(其中使用不止一组,如图2实施例中,例如),并对随机ID测序。在某些实施方式中,可以将该过程重复三次以减轻测序误差。验证商业业务可以对每个盒验证步骤使用成功或失败的逐步流程。在某些实施方式中,这可以降低验证成本。如果发生失败,则可以登记结果。如果每个序列验证成功,则可以登记结果并可以开始召回测试。
在某些实施方式中,这些召回模拟可以包括将所关心的有机材料引入多种环境状态。这些环境可以导致产生不同的有机材料,其随后可以被送至读取商业业务。在本实施例中,可以存在任何全部下列4个可以发生的平行测试:
·完整新鲜环境
·完整干燥环境
·模拟GI酸性环境
这可以模拟材料的消化。
可以模拟从粪便物的潜在召回。
·UV电离辐射环境
这可以模拟有机材料对日光或其它食品加工灭菌技术,如γ辐射或e-束灭菌的暴露。
一旦完成这些测试,则可以将所产生的有机材料独立送至读取商业业务并引发所述读取商业业务。在读取商业业务后,可以登记所有结果。并不必须成功读取所有来源于这些环境状态测试的有机材料以用于成功完成验证,并且例如,可以逐例进行这些确定。
验证后:
基于验证结果,可能存在一些潜在流失(outflows)。如果验证未授权,则可以终止DUID业务,并且可以通知有关当事人。如果序列验证测试之一失败,则可以进入事后审查(post-mortem review)。事后审查可以尝试标识失败原因。基于该原因—可能存在两个结果(盒误差或转化误差)—所述流程可以引发标识商业业务重试或者生产者请求转化重试。
如果验证商业业务结果是证实事件,则可以用相关信息更新DUID登记表(即数据库)。该事件还可以引发增殖批准信息或通知,其可以由生产者收到。他们然后可以继续为种植户产生增殖材料,反过来种植户可以照常进行业务。
读取前供应-链活动:
如本文所描述的,其余的供应链可以照常继续业务。尽管如此,供应链风险承担者可以具有将DUID整合到他们现有过程中的选择。如果他们选择不,则DUID的存在可以提供至少来源的可追溯性。在某些实施方式中,据考虑可以将DUID整合到现有的条型码中。注意,在某些实施方式中,DUID的独特标识符(UID)部分在本质上可以是一串字符,所述字符的特征为其核苷酸(A、T、G、C)。在某些实施方式中,如果不需要明确读取,则他们可以使用其自身数据捕获技术(例如,条型码)来独立追溯该DUID-就绪生物。这可以导致未经确认的追溯事件。
如果需要读取事件,则所讨论的风险承担者可以向读取商业业务提交请求。在本实施例中,可以存在两种类型的请求。一种可以是命令式的,而另一种可以是自愿式的。读取包的内容可以取决于类型。例如,如果读取请求是命令式的,则可以存在要达到的具体要求以满足风险承担者的要求-例如,来自特定日期的有机材料样品。
读取:
图6详细显示了读取商业业务。如其它商业业务一样,可以立即检查授权。通常,读取包可以含有多种类型的有机材料。基于该材料,可以进行纯化和/或扩增。如果检测到引物,则可以开始测序(并且在一些情况下,UID解码步骤)。如果未检测到引物,则登记结果并失败。
一旦已对UID测序和/或解码,则可以进行尝试以找到DUID登记表内的所有相关数据。可以想像在某些实例中,在登记表中可能找不到DUID,此时可以实施事后审查。这种审查可以尝试找出误差原因。另一方面,如果存在DUID,则可以登记结果并且可以创建读取事件。
还可能的是在某些实施方式中,批准的整合合作者—例如,FDA—可以请求读取商业业务。一些司法管辖区可能具有法规,其可能要求共享可追溯性数据,例如。
读取后:
在读取商业业务完成后,可以产生读出数据包并将其返回请求风险承担者。读取包可以含有所有先前的追溯事件、验证结果和引物数据。它还可以含有首先需要使用DUID的合同义务。这可以包括所涉及的每位当事人的KYC信息。
支持系统:
可以在本实施例的DUID全局视图图表上注明两种支持系统。这两种无一可以在整个过程中起到完整作用,但是作为替代可以起到DUID登记表的界面和处理器的作用。
API:API可以起到DUID登记表的界面的作用。这可以允许批准的整合合作者访问批准的数据。在一些情况下,他们可能能够修改该数据——参见以上所描述的用户访问角色。
流处理器:流处理器可以从登记表实时读取并因此引发功能性。例如,如果未授权的参与者请求读取商业业务,则可以自动通知DUID所有者,例如。
因此,本实施例详细描述了可以根据本文所提供的教导内容使用的DUID系统、方法和组合物的实施方式。如将理解的,出于针对本领域技术人员的说明性目的提供了本实施例,并且本实施例不意欲限制。
实施例2-酵母种中的稳定DUID整合
向酵母种的稳定DUID整合:
在本实施例中,描述了向酵母种的稳定DUID整合。
用于向酵母种的稳定DUID整合的方法和材料。
概述:
本实施例描述了设计DNA序列-基独特标识符(DUID),将其向模型生物酵母整合并证实的方法。这些技术包括实验室酵母株和工业用酵母株两者的使用。本文中的方法证实了用于可追溯性活动的DUID向基因组的整合的应用和效力。这些分子生物学实验室方法包括:
1.DUID、DUID载体和DUID引物的计算机设计。
2.通过酵母着丝点质粒(YCp)的稳定基因组整合的方法。
3.通过插入天然酵母染色体的稳定基因组整合的方法。
4.DUID整合验证方法。
5.DUID信号检测和信号检测限的方法。
据考虑这些方法适用于广泛的研究和工业用酵母株,包括原养型株。YCp方法允许通过作为独立染色体的DUID构建体的细胞和核控制,通过构建成载体主链的着丝粒序列的纺缍体结合的基因组整合。对于向天然酵母染色体的插入,出于最小干扰,选择基因在基因组内具有常规编码能力和表达的4个基因组位点。这些位点包括通常被认为是异染色质的亚端粒区(在此基因通常沉默)和具有低编码能力以用作阳性对照的常染色质区。插入天然酵母染色体的方法集中在:1)具有用于转化体选择的抗生素抗性的质粒与含有侧接了侧接所选靶标位点的同源区域的DUID的线性化片段的共转化;和2)CRISPR-基方法,其使用特异性向导RNA(gRNA)和用作Cas9-消化的靶标PAM位点的模板的特异性同源修复模板(HRT)靶向整合位点。
构建体和载体设计和开发:
DUID构建体设计
图14显示了两种370pb DUID构建体的图谱。A)用于PCR和qPCR扩增的DUID构建体。构建体为370pb。该DUID构建体含有2个正向引物和2个反向引物。存在两个标识符(ID1和ID2)。ID1对于PCR扩增是理想的。ID2对于qPCR扩增是理想的。B)用于环介导等温扩增(LAMP)和PCR的DUID构建体设计。该图谱包括PCR和LAMP两者的引物。除了传统扩增设计决策外,注意用粉红色显示的特征,它是允许使用CRISPR-基系统编辑和检测DUID构建体序列的任选的CAS PAM位点。该PAM位点可以允许编辑已整合的DUID构建体。
图17显示了如本文所描述的登记表定位实施例的ID。注意该图显示了简化实施例,并且据考虑完整的DUID序列通常将不像表中所示那些一样短。
在本实施例中,数据库内将不存在多于一种ID序列的比对。在本实施例中,ID序列始终对于单一DUID构建体是独特的,但是单一DUID构建体可以具有多个ID序列。然而,ID序列可以具有一个或多个部分,在所述部分内它可以与其它DUID序列同源。据考虑可以在DUID构建体内存在可以对整个DUID构建体使用的序列;然而,ID本身应是独特的并且通过延伸,DUID也将是独特的。这种在多个DUID之间在ID序列内具有同源性部分的设计决策可以允许在多个方面更新DUID形式。
同源ID部分的实施例——3个DUID之间的一个同源部分:
—存在几个可以期望在多个标识符间具有同源序列的原因。在一些情况下,出于提供与该标识符相关联的形式的目的,所述标识符可以具有同源序列。更新标识符形式的能力可以允许用户参考相关规程,该规程将告知他们可以如何与DUID相互作用。例如,在加密的背景中,DUID标识符的特定形式可以含有公开密钥,其可以以一些有意义的方式告知与DUID的后续相互作用。在其它情况下,同源序列可以参考初始创建所述标识符的系统或实体,例如。下表显示了具有该同源部分的3个DUID——在这些示例性DUID实施例中,1:10是同源的,11:50是独特的。
Figure GDA0003801688640000451
Figure GDA0003801688640000461
YCp和共转化
用于共转化程序的质粒是酵母着丝粒载体,YCp41K(Taxis&Knop,2006)。标识了用于整合的4个靶标位点:Chr6的亚端粒区和染色体2的常染色质区(附录C)。靶向这些位点的线性化片段含有侧接与侧接各个整合位点的区域同源的75nt区的DUID(图14)。附录D中列出了每个整合位点的准确线性化片段序列。这些片段是通过Twist Bioscience(https://www.twistbioscience.com/)作为两个线性化片段合成的,并且插入pRS41K载体(https://bip.weizmann.ac.il/plasmid/pics/106.jpg)和pRS42K(https://bip.weizmann.ac.il/plasmid/pics/109.jpg)。
产生用于共转化的线性化DUID片段
使用通过Twist Bioscience产生的线性化片段作为模板,通过PCR产生了用于同源重组(HR)的线性化DNA片段。对于所产生的具体片段,参见以下附录A中的“共转化”。使用了通过Twist Bioscience支持的pRS41K-Chr6和pRS41K-Euch。用于产生Chr6靶标区的HR片段的引物为Chr6_DUID正向引物和DUID-synth R,并且对于Euch靶标区,引物为Euch DUIDF和DUID-synth R(附录A)。以下详细描述了PCR反应组合物(表2)和反应条件(表3)。
表2:使用Phusion高保真度聚合酶产生DUID模板的PCR反应混合物
组分 体积(20μL) 体积(50μL) 最终浓度
5×Phusion缓冲液 4μL 10μL 1X
10mM dNTP 0.4μL 1μL 各200μM
正向引物 1μL 2.5μL 0.5μM
反向引物 1μL 2.5μL 0.5μM
模板 1μL 1μL 25ng
Phusion聚合酶 0.2μL 0.5μL 0.02U/μL
12.4μL 32.5μL
表3:扩增参数
步骤 温度 时间 循环
初始变性 98 30s 1
变性 98 10s 30
退火 60 20s 30
延伸 72 15s 30
最终延伸 72 10min 1
保持 4 保持 保持
证实引物并在20μL反应体积中优化退火温度。对于产生HR线性化整合片段,实施2×50μL反应并使用Qiagen PCR纯化试剂盒(https://www.qiagen.com/ie/shop/pcr/qiaquick-pcr-purification-kit/)纯化产物。在50μL洗脱缓冲液(10mM Tris-Cl,pH 8.5)中洗脱纯化的DNA片段。通过在1%琼脂糖凝胶上运行5μL来验证产物。
CRISPR载体和HRT产生:
如Krogerus等人,2019中所述,使用含有通过TDH3p表达的CAS9、驱动gRNA的表达的SNR52p和用于在潮霉素上选择的hygR的质粒pCC-036进行CRISPR实验。使用Benchling软件(https://www.benchling.com/),对每个靶向整合位点设计3个gRNA。在使用pCC-036作为模板的PCR反应中使用含有gRNA序列的引物(附录B)。以下(表3和表4)中列出了反应组合物和条件。将这些PCR反应转化到大肠杆菌(E.coli)中。从转化体分离质粒并通过测序筛选以确认正确克隆(图14和附录B)。我们对Chr6构建了1个gRNA克隆(Chr6_2)并且对Euch构建了两个(Euch_1;Euch_2)。设计引物以与两个引物中间的突变部分重叠(每侧~8-10bp不重叠),并根据Zheng等人,2004中的规程进行PCR。
表4:插入gRNA并且用于PAM位点突变-Phusion高保真度聚合酶的PCR反应混合物
Figure GDA0003801688640000471
Figure GDA0003801688640000481
表5:扩增条件
步骤 温度 时间 循环
初始变性 98 30s 1
变性 98 10s 16
退火 55 20s 16
延伸 68 24min 16
最终延伸 68 1小时 1
保持 4 保持 保持
证实引物并使用20μL反应体积优化退火温度;对于整合,运行5×50μL反应,然后用HindIII和BamHI(NEB)消化载体。使用苯酚/氯仿/异戊醇纯化DNA,然后在存在0.1M乙酸铵和糖原的情况下乙醇沉淀。将DNA在30μL无核酸酶的水中再混悬。通过在1%琼脂糖凝胶上运行5μL来验证扩增。
表6:用于gRNA序列插入的反应混合物
组分 体积/反应
HF缓冲液 10μL
模板DNA 1μL
正向引物 2.5μL
反向引物 2.5μL
dNTP 1μL
Phusion聚合酶 1μL
32μL
表7:PCR扩增条件
Figure GDA0003801688640000482
Figure GDA0003801688640000491
*16个变性/退火/延伸循环
在PCR后,将10μL在1%琼脂糖凝胶上运行(使用Phusion时,SDM DNA的得率较低)。将10μL PCR扩增子在30μL反应体积中的DpnI(NEB)消化在37℃实施过夜以使甲基化模板DNA线性化。将另外10μL在凝胶上分离,然后将5μL转化至大肠杆菌(E.coli)。对12个集落和序列进行Minipreps。
酵母转化:
YCp-DUID载体的转化
将如Mertenes等人2017所述的标准醋酸锂-基酵母转化规程用于将两种CRISPR质粒以及修复模板转化到靶标株中并如下所述完成。
1.使酵母在100mL YPD 2%生长培养基中在30℃生长过夜至OD~0.7-0.8。
2.然后,将酵母细胞培养物离心(以3000rpm离心3分钟),在无菌水中清洗一次并将细胞在200μL 0.1M醋酸锂溶液中再混悬。
3.在室温下培育10分钟后,将50μL细胞培养物与500ng质粒、300μL PLI(142M聚乙二醇、0.12M醋酸锂、0.01M Tris(pH 7.5)和0.001M EDTA)和5μL鲑鱼精液DNA(1mg.mL-1)混合。同时进行不包含DNA(无菌水)的阴性对照转化。
4.将酵母混悬液在42℃下培育30分钟。
5.将细胞离心(以3000rpm离心3分钟)并在新鲜YPD2%中再混悬,然后使细胞在30℃过夜培育一次进行恢复。
6.将200μL酵母混悬液铺板至YPD+G418 300μg/mL上,然后在30℃培育2天。还将200μL铺板到不包含抗生素的YPD上以确认在这些处理后的细胞存活力。
共转化
如Bernardi等人,2019所述,该方法包括用醋酸锂产生感受态细胞,然后使用电穿孔进行DNA转化。
表8:转化总结
Figure GDA0003801688640000492
Figure GDA0003801688640000501
共转化步骤:
1.使细胞在100mL YPD中边振荡边生长至所期望的生长期(基于生长曲线或OD)。
2.在对数生长中期收获细胞(OD600=0.7-0.8)。将培养物旋转沉淀,并且弃去上清液。
3.用无菌水清洗颗粒一次。将培养物旋转沉淀并弃去上清液,并在25mL 0.1M醋酸锂/10mM DTT/10mM TE溶液(Tris HCl:EDTA=10:1)中再混悬。在室温下培育培养物1h。将培养物旋转沉淀,并且弃去上清液。
4.注意:如果使用絮凝株,确保每10min反转管几次以防止细胞沉降至管的底部。
5.用25mL冰冷的无菌蒸馏水清洗颗粒,并将培养物在4℃旋转沉淀,并弃去上清液。重复步骤(总计清洗两次)。
6.用10mL冰冷的山梨糖醇清洗颗粒,在4℃旋转沉淀并除去上清液。将颗粒在100μL冰冷的山梨糖醇中再混悬。
7.使用100μL细胞混悬液用于转化。
8.将15μL(1μg pRS41K[YCp质粒]+1μg线性化DUID片段;1:10摩尔比;和1:20摩尔比)转化DNA与细胞混悬液混合并在冰上培育5min。
9.以1.8kV,在0.1cm比色皿中使细胞混悬液电穿孔。
10.将1mL冷山梨糖醇加入至电穿孔比色皿并与细胞混悬液混合。将混悬液转移至具有300μL YPD的管中。
11.注意:如果使用抗生素标志物,将混悬液在30℃培育3h以使得能够发生抗生素表达。*不要向该培养物中添加抗生素。它将杀死所有你的细胞,因为它们尚未表达向它们提供抗生素抗性的质粒。*
12.将100μL转化的培养物在选择性(YPD+300mg/L G418)平板上铺板并在30℃培育5天以出现集落。
13.还将转化的培养物在无任何标志物/抗生素的YPD平板上铺板以确保细胞是活的。
用CRISPR载体和HRT转化:
将标准醋酸锂-基酵母转化规程用于将两种CRISPR质粒以及修复模板转化到靶标株中,如Mertenes等人,2019中所述。以下所描述的这种规程基于标准转化程序,其中通过用LiOAc溶液处理使细胞成为感受态,然后将细胞与DNA分子(质粒和修复模板)以及载体DNA(鲑鱼精液DNA)培育,接着进行热冲击以吸收DNA。在恢复后,将细胞在潮霉素上铺板以针对所有未转化的细胞进行选择。在无潮霉素的YPD上铺板显示了转化程序后的细胞生长;例如,所述程序本身不杀死细胞。无HRT的CRISPR质粒的转化应杀死细胞,因为DSB将不会修复;这将确认CRISPR质粒的成功功能,这意味着表达Cas9并且gRNA将Cas9靶向基因组。CRISPR质粒与HRT一起的转化应修复DSB并支持细胞生长。
质粒pCC-036_Chr6_2/Chr6_HRT和pCC-036_Euch_1/Euch-HRT是转化到酵母菌株S288c、Vermont和French Saison的DNA分子的各自组合。使用下列规程。
1.将酵母在5mL YPD中在30℃以200rpm生长过夜,然后将1mL预培养物转移到50mLYPD中并培育另外4小时(30℃,200rpm)。
2.然后,将酵母细胞培养物离心(以3000rpm离心3分钟),并将细胞在200μL 0.1M醋酸锂溶液中再混悬。
3.在室温下培育10分钟后,将50μL细胞培养物与500ng质粒(其中使用和不使用5至25μg(调整规程)HRT DNA克隆相应sgRNA)、300μL PLI(142M聚乙二醇、0.12M醋酸锂、0.01M Tris(pH 7.5)和0.001M EDTA)和5μL鲑鱼精液DNA(1mg.mL-1)混合。
4.在42℃培育30分钟。
5.将细胞离心(以3000rpm离心3分钟)并在新鲜YPD中再混悬,然后使细胞在30℃过夜培育一次进行恢复。
6.将200μL体积的酵母混悬液在含有300mg/L潮霉素的YPD上铺板,然后在30℃培育3-5天。
筛选转化体:
基因组DNA提取规程
1.将共转化平板重复铺板到YPD+G418(300mg/L)上)
2.将主平板切成每个切片4-8个集落。将集落刮到具有3mL YPD的无菌管中并在30℃振荡生长过夜
3.将2mL培养物在2mL螺旋封盖管中成粒
4.用1mL MQ水清洗一次
5.在200μL破碎缓冲液(2%TX-100、1%SDS、100mM NaCl、100mM Tris pH 7.5)中再混悬)
6.添加200μL玻璃珠和200μL苯酚/氯仿/异戊醇
7.高速涡旋3min
8.最大速度离心5min
9.将顶部水层转移至干净的微量离心管
10.添加1mL 100%EtOH并通过倒转混合
11.最大速度离心3min
12.倾倒乙醇,将颗粒干燥并在400μL 1×TE中再混悬
13.添加30μL 1mg/mL RNA酶A
14.在37℃培育5min
15.添加10μL 4M乙酸铵和1mL 100%EtOH。通过倒转混合
16.最大速度离心3min。在1mL 70%EtOH中清洗颗粒并使其干燥
17.在100μL水中再混悬
整合子的标识&转化体的PCR筛选:
使用结合侧接靶标整合位点的HRT的同源区域上游和下游的特定区域中的基因组DNA的引物,将如以上所描述的分离的gDNA用作PCR反应的模板(引物的详细信息参见附录A;在下表9&10中列出了反应组合物和条件)。对于Chr2上的常染色质靶标整合位点,使用引物Euch_Seq正向引物/R,并且对于Chr6亚端粒异染色质靶标整合位点,使用引物Chr6_Seq正向引物/R。这些引物从gDNA获得了~600bp的DNA片段,其在整合位点没有任何插入。通过整合,该片段尺寸将增至~970bp。对照包括没有任何gDNA模板的反应和分离自未转化株的gDNA(如S288c/BY4743)。使用GeneRuler 100bp Plus分子量标志物通过凝胶电泳分离PCR反应以确认所产生的DNA片段的尺寸。
一旦确认整合子,则用PCR引物证实正确整合,所述引物之一结合整合片段外部的基因组而另一个在转化片段内结合。如果在正确靶标位点发生整合,则这些引物获得DNA片段,并且如果不发生整合,则无DNA片段。
将通过整合确认和验证测定两者所产生的DNA片段测序以确认整合。
表9:DUID筛选PCR反应混合物
组分 量/20μL rxn
标准缓冲液 4μL
模板DNA ~100-400ng(1μL)
正向引物 1μL
反向引物 1μL
dNTP 0.4μL
OneTaq HotStart聚合酶 0.1μL
12.6μL
表10:DUID筛选PCR反应程序
步骤 温度 时间
初始变性 98 3min
*变性 98 30s
*退火 60 30s
*延伸 68 1min
最终延伸 68 10min
结束 12 保持
-*进行30个变性/退火/延伸循环
在PCR后,将10μL反应在1%琼脂糖凝胶(1XTAE,含有SYBR Safe核酸染色剂)上分离。
插入拷贝数和位置的确认:
我们对亲代和整合子实施WGS以确认插入拷贝数并标识任何脱靶整合事件的存在。我们将短-读序(Illumina)和长-读序(PacBio)测序数据合并以组成亲代和转化株两者的完整基因组。这两种方法的组合将提供整合子的整体基因组结构并因此标识是否发生多个插入或者是否存在任何脱靶整合事件。将通过如前所述(Preiss等人,2018)的Genome Québec(Montreal,Canada)对整合子和亲代株的完整基因组测序。简要地,将分离DNA并将其用作用于Illumina和PacBio应用的文库构建的模板。将使用FastQC(0.11.5版)(Andrews,2010)质量-分析测序读序并使用Trimmomatic(0.36版)(Bolger,Lohse,&Usadel,2014)修整并过滤。使用SpeedSeq(0.1.0),将读序与酿酒酵母(S.cerevisiae)S288c(R64-2-1)参考基因组比对(Chiang等人,2015)。将用QualiMap(2.2.1)评价比对质量(Garcia-Alcalde等人,2012)。将使用FreeBayes(1.1.0-46-g8d2b3a0l)对比对读序实施变体分析(Garrison&Marth,2012)。同时调用所有株中的变体(多样品)。在变体分析前,将通过SAMtools(1.2)将比对过滤至50的最小MAPQ(Li等人,2009)。将用SnpEff(1.2)实施变体的效果预测注释(Cingolani等人,2012)。将通过Control-FREEC(11.0)基于覆盖度估计染色体和基因的拷贝数变异(Boeva等人,2012)。将使用维尔克松秩和检验标识统计学显著的拷贝数变异(p<0.05)。将通过BEDTools(2.26.0)计算在10,000bp窗内的中值覆盖度和杂合SNP计数(Quinlan&Hall,2010)并在R中显象。
使用微滴式数字PCR确定整合子中DUID的表达:
我们将使用微滴式数字PCR(ddPCR),其允许对样品内分子的绝对数目进行定量。这具体地允许定量拷贝数或低表达基因。所述程序包括来自酵母的无gDNA RNA的分离、随后的cDNA合成以及最后具有和不具有pRS41K-Euch质粒的S288c的产生,并且将整合子株在YPD中生长,重复三次。将用常用的热酸性酚法(COLLART AND OLIVIERO 2001)提取RNA,并用NanoDrop 2000C分光光度计(NanoDrop Technologies Inc.)定量。将用RapidOut DNA除去试剂盒(Thermo Fisher)处理RNA样品,测试DNA污染并使用Agilent 2100生物分析仪评价质量。将使用大容量cDNA反转录试剂盒(Applied BioSystems),将RNA(1000ng/样品)用于产生cDNA。
这些样品以及稀释的pRS41K-Euch将提交至圭尔夫大学(University of Guelph)的基因组研究室(Genomics Facility)进行ddPCR分析。对所有反应以及DUID、GAT3(低表达子对照)和ACT1(高表达子对照)的qPCR引物使用ddPCR EvaGreen Supermix(使其乳化),这些样品以及“无模板对照”将用作ddPCR反应中的模板。在AutoDGTM仪(Bio-Rad)上产生纳升-尺寸的液滴,然后使用C1000 Touch热循环仪(Bio-Rad)进行PCR扩增。在PCR循环后,在来自Bio-Rad的QX200液滴读取仪上对ddPCR板读数,并使用QuantaSoft Analysis Pro软件1.0.596版(Bio-Rad Laboratories)分析数据。
LOD/LOQ分析规程:
使用用于插入筛选的gDNA分离规程所制备的gDNA。使用QiaQuick Miniprep试剂盒,从在存在氨苄西林的情况下生长的DH5αK12培养物制备载体。
标准PCR规程
引物:S288C DUID正向引物和反向引物
稀释系列:100ng、10ng、1ng、100pg、10pg、1pg、100fg、10fg、1fg、100ag
表11:在20μL反应中使用GoTaq聚合酶进行PCR反应
组分 量/20μL rxn
2X Green MM 10μL
模板DNA 每稀释系列
正向引物 1μL
反向引物 1μL
7μL
表12:PCR反应条件
Figure GDA0003801688640000551
Figure GDA0003801688640000561
*30个变性/退火/延伸循环
在PCR后,将10μL反应在1%琼脂糖凝胶(1XTAE,含有SYBR Safe核酸染色剂)上分离。
定量PCR(qPCR)规程:
使用SensiFAST Hi-ROX SYBR Master Mix,在StepOnePlus实时PCR系统中,通过圭尔夫大学(university of Guelph)AAC基因组研究室(AAC Genomics facility)进行qPCR反应。表12描述了qPCR循环条件。使用Applied Biosystems StepOnePlus软件完成分析。使用以上所描述的gDNA分离规程制备gDNA。使用QiaQuick Miniprep试剂盒,从在存在氨苄西林的情况下生长的DH5αK12培养物制备对照DUID载体。
使用下列引物和整个稀释系列,对质粒和YCp酵母gDNA样品两者进行扩增。
引物:S288C DUID qPCR正向引物和反向引物
稀释系列:100ng、10ng、1ng、100pg、10pg、1pg、100fg、10fg、1fg、100ag
结果&讨论
转化验证:
通过YCp载体,将DUID稳定转化至酵母菌株(BY4743)基因组。如以上所描述的,培养转化的酵母并提取基因组DNA。通过终点PCR(图15,B1-B3)和qPCR(图16)验证稳定整合(Cingolani P,Platts A,Wang le L,Coon M,Nguyen T,Wang L,Land SJ,Lu X,RudenDM.A program for annotating and predicting the effects of single nucleotidepolymorphisms,SnpEff:SNPs in the genome of Drosophila melanogaster fly strain(w1118;iso-2;iso-3,Austin.2012Apr-Jun;6(2):80-92.doi:10.4161/fly.19695.PMID:22728672;PMCID:PMC3679285.on)。使用侧接DUID构建体的DUID召回引物的PCR扩增的终点分析对YCp-DUID载体(图15A)和来自YCp-DUID载体转化的细胞的酵母基因组DNA提取(图15C)两者获得了阳性扩增。当将100pg-100ng的量的YCp-DUID载体用作模板(图15A泳道1-4)时,表示DUID扩增的370bp条带是非常明显的,而未转化的BY4743基因组DNA的任何输入DNA的量无可检测的扩增(图15B,泳道1-8)。使用分离自用YCp-DUID载体转化的细胞的总DNA的类似测定导致了1-100ng输入DNA的范围内的阳性扩增,其中来自100pg输入DNA的信号非常弱(图15C泳道1-4),这表示DUID以每个细胞1-2个拷贝存在,使用标准终点PCR程序可以容易地检测酵母gDNA分离物内反映染色体特征的拷贝数。
图15显示了通过终点PCR对酵母基因组DNA中YCp-DUID的检测。使用(A)YCp-DUID载体和(B)提取自BY4743的gDNA和(C)用DUID召回引物,用YCp-DUID载体作为模板转化的酵母菌株BY4743进行PCR扩增。使用(1)100ng、(2)10ng、(3)1ng、(4)100pg、(5)10pg、(6)1pg、(7)100fg和(8)10fg的输入量,使用系列稀释的DNA模板进行反应,并且使用GeneRulerTM100bp Plus Ready-to-use Ladder作为标准物在1%琼脂糖凝胶上分离。
LOD/LOQ分析:
使用纯化的YCp-DUID载体的10-倍系列稀释进行实时定量PCR(图16);在这些测定中,在所有测量浓度检测到DUID扩增,这表明可以在低至500ag的浓度下可靠标识DUID。使用MS Excel,通过将平均Cq值vs已知的DNA输入浓度作图产生标准曲线。基于该标准曲线,R2计算为0.9993,引物效率105.5%(使用Agilent QPCR Standard Curve to SlopeEfficiency计算器,https://www.chem.agilent.com/store/biocalculators/calcSlopeEfficiency.jsp?_requestid=1116919计算),这表明反应效率在高质量qPCR分析的接受标准内(https://www.gene-quantification.de/roche-rel-quant.pdf)。使用分离自用YCp-DUID转化的BY4743的DNA所实施的类似的qPCR测定表明可以在50ng的总酵母DNA内检测DUID,其中平均Cq值为29.02。将该Cq值对以上所描述的标准曲线作图(图3;橙色柱)。这些结果证实DUID召回方法可以扩增来自酵母细胞培养基质的DUID。
这些结果已证明:
1.可以成功设计DUID并将其稳定转化到酵母中
2.出于可追溯性的目的,可以通过标准终点PCR和qPCR技术两者从生物基质召回DUID。
图16显示了酵母总DNA提取物内DUID的检测。对范围在50ng-500ag的YCp载体的10-倍连续稀释实施实时定量PCR并用于使用MS Excel产生标准曲线(蓝线)。将使用来源于用YCp-DUID载体转化的BY4743的DNA的类似的qPCR实验结果作图(橙色柱)并与标准曲线值相比较以定量酵母生物质内DUID的检测。
附录A:用于产生线性化转化片段或召回DUID的引物
Figure GDA0003801688640000581
Figure GDA0003801688640000591
附录B:用于克隆gRNA或HRT中突变PAM位点的CRISPR引物
Figure GDA0003801688640000592
Figure GDA0003801688640000601
Figure GDA0003801688640000611
附录C:同源重组构建体
用于同源重组的包括同源臂的完整序列
酵母染色体整合位点
ChrII:809650..809799
左侧同源性:
ACACAAACTGGCGTAGAAGGGGAAACGGAAATAGGGTCTGACGAGGAAGATAGCATAGAGGACGAGGGAAGCAGC(SEQ ID NO:47)右侧同源性:
AGTGGAGGAAATAGTACGACAGAAAGACTAGTACCACACCAGCTGAGGGAACAAGCAGCCAGACATATAGGAAAA(SEQ ID NO:48)
ChrVI:261123..261272
左侧同源性:
TGGAGTTGCAAAAAACAAGGGAAAGGAAAATCAATCAAATTAGAATTAAGGTTTTTTTTGGACAGTGCAGCGTCA(SEQ ID NO:49)
右侧同源性:
ATGCGCACGTAATGGCTTCGAAGAAAAAAAGAAGGCAAATACAATGAAGCTGAGATCTTGTTTTATCATGAGGGG(SEQ ID NO:50)
ChrXIV:764201..764350
左侧同源性:
CAAATAAATTAGGCTCATAACCGTAATTTTATTCGAGACATTTTTGGTTACTTCAAAATATTGTTATTATATAAA(SEQ ID NO:51)
右侧同源性:
GATCATATAAAGTTCTTGGACAAGATTGGATACATTTAGTTTTATTTTTGAAAATCACAAAGATGAAACAAAATA(SEQ ID NO:52)
附录D:构建体的组成和长度
总尺寸 520b
左侧同源臂 75b
正向引物1 20b
ID1 210bp(包括在3'侧接的pam)
正向引物2 20b
ID1 80bp(包括在3'侧接的pam)
反向引物2 20b
反向引物1 20b
右侧同源臂 75b
S288c
ID1(PCR引物)
Figure GDA0003801688640000621
ID2(qPCR引物)
Figure GDA0003801688640000622
Figure GDA0003801688640000631
s288c—染色体2
ACACAAACTGGCGTAGAAGGGGAAACGGAAATAGGGTCTGACGAGGAAGATAGCATAGAGGACGAGGGAAGCAGCGCTGATGGTTTAGGCGTACACGAGATCCTGGTTCAACGCGCTGCAAACCTACCCTGCTCCAAACTGCTGTTCAACGCCACTCTAACTGGCAGGCAAATTATTAGTTTCTAAGTTCCCCAGGTGCTGAAGAGCAGTCATTCAACGCCCTCAGATCATCCCGGCAAGTTGGCTGGCGCGTTTGTCCGGAGGATCGTGTCGTACAACAACCATCTGACTATCAACCCTCCaggCGTATAGAGCGGGTCATCGATGCGCTCAGGGAACAACAACGATAGGCCTGCGGCTGGTCACCATCGGGAAGTTTTGCTGGAGATCTGCTGCTGTAGGaggTCTCTACAGCCAAACGACCAGACCAAGTGCATTTCCAGGGAGTGGAGGAAATAGTACGACAGAAAGACTAGTACCACACCAGCTGAGGGAACAAGCAGCCAGACATATAGGAAAA(SEQID NO:57)
s288c—染色体6
TGGAGTTGCAAAAAACAAGGGAAAGGAAAATCAATCAAATTAGAATTAAGGTTTTTTTTGGACAGTGCAGCGTCAGCTGATGGTTTAGGCGTACACGAGATCCTGGTTCAACGCGCTGCAAACCTACCCTGCTCCAAACTGCTGTTCAACGCCACTCTAACTGGCAGGCAAATTATTAGTTTCTAAGTTCCCCAGGTGCTGAAGAGCAGTCATTCAACGCCCTCAGATCATCCCGGCAAGTTGGCTGGCGCGTTTGTCCGGAGGATCGTGTCGTACAACAACCATCTGACTATCAACCCTCCaggCGTATAGAGCGGGTCATCGATGCGCTCAGGGAACAACAACGATAGGCCTGCGGCTGGTCACCATCGGGAAGTTTTGCTGGAGATCTGCTGCTGTAGGaggTCTCTACAGCCAAACGACCAGACCAAGTGCATTTCCAGGGATGCGCACGTAATGGCTTCGAAGAAAAAAAGAAGGCAAATACAATGAAGCTGAGATCTTGTTTTATCATGAGGGG(SEQID NO:58)
s288c—染色体14
CAAATAAATTAGGCTCATAACCGTAATTTTATTCGAGACATTTTTGGTTACTTCAAAATATTGTTATTATATAAAGCTGATGGTTTAGGCGTACACGAGATCCTGGTTCAACGCGCTGCAAACCTACCCTGCTCCAAACTGCTGTTCAACGCCACTCTAACTGGCAGGCAAATTATTAGTTTCTAAGTTCCCCAGGTGCTGAAGAGCAGTCATTCAACGCCCTCAGATCATCCCGGCAAGTTGGCTGGCGCGTTTGTCCGGAGGATCGTGTCGTACAACAACCATCTGACTATCAACCCTCCaggCGTATAGAGCGGGTCATCGATGCGCTCAGGGAACAACAACGATAGGCCTGCGGCTGGTCACCATCGGGAAGTTTTGCTGGAGATCTGCTGCTGTAGGaggTCTCTACAGCCAAACGACCAGACCAAGTGCATTTCCAGGGGATCATATAAAGTTCTTGGACAAGATTGGATACATTTAGTTTTATTTTTGAAAATCACAAAGATGAAACAAAATA(SEQID NO:59)
Vermont
ID1(PCR)
Figure GDA0003801688640000641
ID2(qPCR引物)
Figure GDA0003801688640000642
Figure GDA0003801688640000651
Vermont—染色体2
ACACAAACTGGCGTAGAAGGGGAAACGGAAATAGGGTCTGACGAGGAAGATAGCATAGAGGACGAGGGAAGCAGCACTCTCCCATTAGTCGGCAGCACGTTCGCCAGTAATTACCGGAGACAGAAAAATCTCGGAACAGTTTATCCGCAATTCTGAGGAAATCGTCGTCCGCAAGCTCCGTGCACAGCTAGTAGTAGTCTCCGGTGCGGGGGGGGGCGGAGTGGTCTCCCACGATACGACGTTGTCTAGATACGTACCCACCTCGCTGTGTGCTCTCTGGCTATCTGAACGTCCACTCCAGAaggGGCCCTATCAGTACAGCAGTCATAGCCGCACACAAGTCCAACGTCCCCCAAACCTCCTGACCACGCAGTCGCCACCGGCGCAGACACTATTTCTCGTaggTTCATTCTCTCGCCAGCACTTGTCGGAACAAAGCGGTCTTAGTGGAGGAAATAGTACGACAGAAAGACTAGTACCACACCAGCTGAGGGAACAAGCAGCCAGACATATAGGAAAA(SEQID NO:64)
Vermont—染色体6
TGGAGTTGCAAAAAACAAGGGAAAGGAAAATCAATCAAATTAGAATTAAGGTTTTTTTTGGACAGTGCAGCGTCAACTCTCCCATTAGTCGGCAGCACGTTCGCCAGTAATTACCGGAGACAGAAAAATCTCGGAACAGTTTATCCGCAATTCTGAGGAAATCGTCGTCCGCAAGCTCCGTGCACAGCTAGTAGTAGTCTCCGGTGCGGGGGGGGGCGGAGTGGTCTCCCACGATACGACGTTGTCTAGATACGTACCCACCTCGCTGTGTGCTCTCTGGCTATCTGAACGTCCACTCCAGAaggGGCCCTATCAGTACAGCAGTCATAGCCGCACACAAGTCCAACGTCCCCCAAACCTCCTGACCACGCAGTCGCCACCGGCGCAGACACTATTTCTCGTaggTTCATTCTCTCGCCAGCACTTGTCGGAACAAAGCGGTCTTATGCGCACGTAATGGCTTCGAAGAAAAAAAGAAGGCAAATACAATGAAGCTGAGATCTTGTTTTATCATGAGGGG(SEQID NO:65)
Vermont—染色体14
CAAATAAATTAGGCTCATAACCGTAATTTTATTCGAGACATTTTTGGTTACTTCAAAATATTGTTATTATATAAAACTCTCCCATTAGTCGGCAGCACGTTCGCCAGTAATTACCGGAGACAGAAAAATCTCGGAACAGTTTATCCGCAATTCTGAGGAAATCGTCGTCCGCAAGCTCCGTGCACAGCTAGTAGTAGTCTCCGGTGCGGGGGGGGGCGGAGTGGTCTCCCACGATACGACGTTGTCTAGATACGTACCCACCTCGCTGTGTGCTCTCTGGCTATCTGAACGTCCACTCCAGAaggGGCCCTATCAGTACAGCAGTCATAGCCGCACACAAGTCCAACGTCCCCCAAACCTCCTGACCACGCAGTCGCCACCGGCGCAGACACTATTTCTCGTaggTTCATTCTCTCGCCAGCACTTGTCGGAACAAAGCGGTCTTGATCATATAAAGTTCTTGGACAAGATTGGATACATTTAGTTTTATTTTTGAAAATCACAAAGATGAAACAAAATA(SEQID NO:66)
French Saison
ID1(PCR引物)
Figure GDA0003801688640000661
ID2(qPCR引物)
Figure GDA0003801688640000662
Figure GDA0003801688640000671
French—染色体2
ACACAAACTGGCGTAGAAGGGGAAACGGAAATAGGGTCTGACGAGGAAGATAGCATAGAGGACGAGGGAAGCAGCGCGTACAATGCCCTGAAGAATTACTTCCGTACTGGAAGCGGATAGCACCAGACTGTAAGCTAACGAACGCCTGTTTGAGGCTCAGTCTGCTAAATTGGAACCGCGTCGCTCCTAGGCATATTTTGGTGAAAGCACTCTGCCCAAAAGCCTGTAGAATTCCGGACCGACGCTCTCTTCACTCGAAGATTCCGGGTAAGAAGTTTCAGCCAGGGCTGTCTCCATTAGAAaggAGCGGGTCATCGAAAGGTTACGTTGGTTGTATCTGATTAGACGGTAGACATCCAGCTCATCTCTGATTACTAAAGTTCTCCGCCGCTCCATCGGGCGaggTACAGCCAAACGACCAAGTGCCAAGTGCATTTCCAGGGAGAGTGGAGGAAATAGTACGACAGAAAGACTAGTACCACACCAGCTGAGGGAACAAGCAGCCAGACATATAGGAAAA(SEQID NO:71)
French—染色体6
TGGAGTTGCAAAAAACAAGGGAAAGGAAAATCAATCAAATTAGAATTAAGGTTTTTTTTGGACAGTGCAGCGTCAGCGTACAATGCCCTGAAGAATTACTTCCGTACTGGAAGCGGATAGCACCAGACTGTAAGCTAACGAACGCCTGTTTGAGGCTCAGTCTGCTAAATTGGAACCGCGTCGCTCCTAGGCATATTTTGGTGAAAGCACTCTGCCCAAAAGCCTGTAGAATTCCGGACCGACGCTCTCTTCACTCGAAGATTCCGGGTAAGAAGTTTCAGCCAGGGCTGTCTCCATTAGAAaggAGCGGGTCATCGAAAGGTTACGTTGGTTGTATCTGATTAGACGGTAGACATCCAGCTCATCTCTGATTACTAAAGTTCTCCGCCGCTCCATCGGGCGaggTACAGCCAAACGACCAAGTGCCAAGTGCATTTCCAGGGAGATGCGCACGTAATGGCTTCGAAGAAAAAAAGAAGGCAAATACAATGAAGCTGAGATCTTGTTTTATCATGAGGGG(SEQID NO:72)
French—染色体14
CAAATAAATTAGGCTCATAACCGTAATTTTATTCGAGACATTTTTGGTTACTTCAAAATATTGTTATTATATAAAGCGTACAATGCCCTGAAGAATTACTTCCGTACTGGAAGCGGATAGCACCAGACTGTAAGCTAACGAACGCCTGTTTGAGGCTCAGTCTGCTAAATTGGAACCGCGTCGCTCCTAGGCATATTTTGGTGAAAGCACTCTGCCCAAAAGCCTGTAGAATTCCGGACCGACGCTCTCTTCACTCGAAGATTCCGGGTAAGAAGTTTCAGCCAGGGCTGTCTCCATTAGAAaggAGCGGGTCATCGAAAGGTTACGTTGGTTGTATCTGATTAGACGGTAGACATCCAGCTCATCTCTGATTACTAAAGTTCTCCGCCGCTCCATCGGGCGaggTACAGCCAAACGACCAAGTGCCAAGTGCATTTCCAGGGAGGATCATATAAAGTTCTTGGACAAGATTGGATACATTTAGTTTTATTTTTGAAAATCACAAAGATGAAACAAAATA(SEQID NO:73)
已通过举例说明描述了一种或多种说明性实施方式。本领域技术人员将理解可以在不背离如权利要求中所定义的本发明的范围的情况下做出一些改变和修改。
参考文献
FDA.(2019).Investigation Summary:Factors Potentially Contributing tothe Contamination of Romaine Lettuce Implicated in the Fall 2018Multi-StateOutbreak of E.coli O157:H7.Retrieved from https://www.fda.gov/media/120722/download Food and Drug Regulations C.R.C.c.870(2019).
GS1 US.(2013).Integrated Traceability in Fresh Foods:Ripe Opportunityfor Real Results.Retrieved from https://www.gs1us.org/DesktopModules/Bring2mind/DMX/Download.aspx?C ommand=Core_Download&EntryId=598.
Introduction of Organisms and Products Altered or Produced ThroughGenetic Engineering Which Are Plant Pests or Which There Is Reason to BelieveAre Plant Pests C.F.R.§340.1(2019).
WHO,Foodborne Disease Burden Epidemiology Reference Group.2015.WHOEstimates of the Global Burden of Foodborne Diseases.Retrieved from https://academicanswers.waldenu.edu/faq/73164.
System of centromeric,episomal,and integrative vectors based on drugresistance markers for Saccharomyces cerevisiae.Christof Taxis and MichaelKnop EMBL,Heidelberg,Germany.BioTechniques 40:73-78(January 2006)doi 10.2144/000112040
Krogerus,K.,
Figure GDA0003801688640000691
F.,Kuivanen,J.et al.A deletion in theSTA1promoter determines maltotriose and starch utilization in STA1+Saccharomyces cerevisiae strains.Appl Microbiol Biotechnol 103,7597–7615(2019).https://doi.org/10.1007/s00253-019-10021-y
Zheng L,Baumann U,Reymond JL.An efficient one-step site-directed andsite-saturation mutagenesis protocol.Nucleic Acids Res.2004;32(14):e115.Published 2004 Aug 10.doi:10.1093/nar/gnh110
Mertens S,Steensels J,G.B,V Kevin J.Rapid Screening Method forPhenolic Off-Flavor(POF)Production in Yeast.J Am Soc Brew Chem.2017;75(4):318–23
Mertens S,Gallone B,Steensels J,et al.Reducing phenolic off-flavorsthrough CRISPR-based gene editing of the FDC1 gene in Saccharomycescerevisiae x Saccharomyces eubayanus hybrid lager beer yeasts[publishedcorrection appears in PLoS One.2019 Oct 24;14(10):e0224525].PLoS One.2019;14(1):e0209124.Published 2019 Jan 9.doi:10.1371/journal.pone.0209124
Mertens S,Gallone B,Steensels J,et al.Correction:Reducing phenolicoff-flavors through CRISPR-based gene editing of the FDC1 gene inSaccharomyces cerevisiae x Saccharomyces eubayanus hybrid lager beeryeasts.PLoS One.2019;14(10):e0224525.Published 2019 Oct 24.doi:10.1371/journal.pone.0224525
Bolger AM,Lohse M,Usadel B.Trimmomatic:a flexible trimmer forIllumina sequence data.Bioinformatics.2014 Aug 1;30(15):2114-20.doi:10.1093/bioinformatics/btu170.Epub 2014 Apr 1.PMID:24695404;PMCID:PMC4103590.
Chiang C,Layer RM,Faust GG,Lindberg MR,Rose DB,Garrison EP,Marth GT,Quinlan AR,Hall IM.SpeedSeq:ultra-fast personal genome analysis andinterpretation.Nat Methods.2015 Oct;12(10):966-8.doi:10.1038/nmeth.3505.Epub2015 Aug 10.PMID:26258291;PMCID:PMC4589466.
García-Alcalde F,Okonechnikov K,Carbonell J,Cruz LM,
Figure GDA0003801688640000701
S,TarazonaS,Dopazo J,Meyer TF,Conesa A.Qualimap:evaluating next-generation sequencingalignment data.Bioinformatics.2012 Oct 15;28(20):2678-9.doi:10.1093/bioinformatics/bts503.Epub 2012 Aug 22.PMID:22914218.
Erik Garrison and Gabor Marth 2012.Haplotype-based variant detectionfrom short-read sequencing
Li H,Handsaker B,Wysoker A,Fennell T,Ruan J,Homer N,Marth G,AbecasisG,Durbin R;1000 Genome Project Data Processing Subgroup.The SequenceAlignment/Map format and SAMtools.Bioinformatics.2009 Aug15;25(16):2078-9.doi:10.1093/bioinformatics/btp352.Epub 2009 Jun 8.PMID:19505943;PMCID:PMC2723002
Cingolani P,Platts A,Wang le L,Coon M,Nguyen T,Wang L,Land SJ,Lu X,Ruden DM.A program for annotating and predicting the effects of singlenucleotide polymorphisms,SnpEff:SNPs in the genome of Drosophila melanogasterstrain w1118;iso-2;iso-3.Fly(Austin).2012Apr-Jun;6(2):80-92.doi:10.4161/fly.19695.PMID:22728672;PMCID:PMC3679285.
Boeva V,Popova T,Bleakley K,et al.Control-FREEC:a tool for assessingcopy number and allelic content using next-generation sequencingdata.Bioinformatics.2012;28(3):423-425.doi:10.1093/bioinformatics/btr670
Quinlan AR,Hall IM.BEDTools:a flexible suite of utilities forcomparing genomic features.Bioinformatics.2010 Mar 15;26(6):841-2.doi:10.1093/bioinformatics/btq033.Epub 2010 Jan 28.PMID:20110278;PMCID:PMC2832824
在本文中以及说明书中的其它处所引用的所有参考文献以其全部内容作为参考并入本文。
序列表
<110> 索引生物系统公股份有限司
<120> 用于提供生物材料的标识和/或可追溯性的方法和组合物
<130> 08942548WO
<140> PCT/CA2020/051622
<141> 2020-11-26
<150> US 62/940,587
<151> 2019-11-26
<160> 73
<170> SIPOSequenceListing 1.0
<210> 1
<211> 296
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Random DNA UID Sequence
<400> 1
cgcctaagct cctgtgacgg gagagagaac ggattcggtg gtagaactcg cccgtgcaga 60
cataattgcg gattctcggg ggcgtagatg cctaagaata cctcaacgct tctgcatgat 120
ggtactcact ctagttgttt aatttaccac gccagtagac tatgggcaag tcagcgcgca 180
agagacactc accgttgaat taacagcacc acccctttac tccacgcgaa aggcggatta 240
tcgtatcttt tttgtggcga atttatgtat ctctccttga ggaagcagag cagtcc 304
<210> 2
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DUID#1
<400> 2
acaacggtcg tatgtatgca ctaggtcaac aataggacat agccttgtag 50
<210> 3
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DUID#2
<400> 3
acaacggtcg ttgtgttccg acaggctagc atattatcct aaggcgttac 50
<210> 4
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DUID#3
<400> 4
acaacggtcg taccgtcgga tttgctatag cccctgaacg ctacatgtac 50
<210> 5
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_DUID
<400> 5
cattccgcct gacctggag 19
<210> 6
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_DUID F
<400> 6
cattccgcct gaccccttaa t 21
<210> 7
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, DUID_synth R
<400> 7
cactgagcct ccacctagc 19
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_Seq F
<400> 8
aagcgtaatt ccgaaaggca 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_Seq R
<400> 9
tgcatacgct tctctcgact 20
<210> 10
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_Seq F
<400> 10
cagaaatgga caaggagata tgtga 25
<210> 11
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_Seq R
<400> 11
ttgagtacct ggccaatgga g 21
<210> 12
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, S288C_recall F
<400> 12
gctgatggtt taggcgtac 19
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, S288C_recall R
<400> 13
ccctggaaat gcacttggtc 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, S288C_qPCR F
<400> 14
tggtcgtttg gctgtagaga 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, S288C_qPCR R
<400> 15
cgtatagagc gggtcatcga 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Verm_recall F
<400> 16
actctcccat tagtcggcag 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Verm_recall R
<400> 17
aagaccgctt tgttccgaca 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Verm_qPCR F
<400> 18
ggccctatca gtacagcagt 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Verm_qPCR R
<400> 19
agtgctggcg agagaatgaa 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, FrenSais_recall F
<400> 20
gcgtacaatg ccctgaagaa 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, FrenSais_recall R
<400> 21
ctccctggaa atgcacttgg 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, FrenSais_qPCR F
<400> 22
agcgggtcat cgaaaggtta 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, FrenSais_qPCR R
<400> 23
cacttggtcg tttggctgta 20
<210> 24
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_1 F
<400> 24
agttgcaaaa aacaagggaa gttttagagc tagaaatagc aagttaaaat aagg 54
<210> 25
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_1 R
<400> 25
tcccttgttt tttgcaactg atcatttatc tttcactgcg gag 43
<210> 26
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_2 F
<400> 26
gagatcttgt tttatcatga gttttagagc tagaaatagc aagttaaaat aagg 54
<210> 27
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_2 R
<400> 27
catgataaaa caagatctcg atcatttatc tttcactgcg gag 43
<210> 28
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_3 F
<400> 28
agatcttgtt ttatcatgag gttttagagc tagaaatagc aagttaaaat aagg 54
<210> 29
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_3 R
<400> 29
tcatgataaa acaagatctg atcatttatc tttcactgcg gag 43
<210> 30
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_1 F
<400> 30
atactaagtc aacatcaagg gttttagagc tagaaatagc aagttaaaat aagg 54
<210> 31
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_1 R
<400> 31
ccttgatgtt gacttagtat gatcatttat ctttcactgc ggag 44
<210> 32
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_2 F
<400> 32
gaaatactaa gtcaacatca gttttagagc tagaaatagc aagttaaaat aagg 54
<210> 33
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_2 R
<400> 33
tgatgttgac ttagtatttc gatcatttat ctttcactgc ggag 44
<210> 34
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_3 F
<400> 34
tcttggcttt tacaaccgag gttttagagc tagaaatagc aagttaaaat aagg 54
<210> 35
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_3 R
<400> 35
ctcggttgta aaagccaaga gatcatttat ctttcactgc ggag 44
<210> 36
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_1 mut
<400> 36
caagggaaac gaaaatcaat caaattag 28
<210> 37
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_1 mut R
<400> 37
gattgatttt cgtttccctt gttt 24
<210> 38
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_2_3 mut R
<400> 38
cctccaccta gcctccgctc atgataaa 28
<210> 39
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Chr6_Vector R
<400> 39
gctgcagccc ctcatgataa 20
<210> 40
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_1 mut F
<400> 40
gaggaaatac taagtcaaca tcaaggtcgc a 31
<210> 41
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_1 mut R
<400> 41
tgcgaccttg atgttgactt agtatttcct ctcgg 35
<210> 42
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_2 mut F
<400> 42
ctaagtcaac atcaacgtgg ca 22
<210> 43
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_2 mut R
<400> 43
tgccacgttg atgttgactt agtatttcc 29
<210> 44
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_3 mut F
<400> 44
tacaaccgag acgaaatact aagtcaacat c 31
<210> 45
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_3 mut R
<400> 45
cttagtattt cgtctcggtt gtaaaagcca 30
<210> 46
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Primer, Euch_Vector R
<400> 46
gggctgcagt cagcagat 18
<210> 47
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Yeast chromosomal integration Sites, ChrII:809650..809799, LeftHomology
<400> 47
acacaaactg gcgtagaagg ggaaacggaa atagggtctg acgaggaaga tagcatagag 60
gacgagggaa gcagc 77
<210> 48
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Yeast chromosomal integration Sites, ChrII:809650..809799, RightHomology
<400> 48
agtggaggaa atagtacgac agaaagacta gtaccacacc agctgaggga acaagcagcc 60
agacatatag gaaaa 77
<210> 49
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Yeast chromosomal integration Sites, ChrVI:261123..261272, LeftHomology
<400> 49
tggagttgca aaaaacaagg gaaaggaaaa tcaatcaaat tagaattaag gttttttttg 60
gacagtgcag cgtca 77
<210> 50
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Yeast chromosomal integration Sites, ChrVI:261123..261272, RightHomology
<400> 50
atgcgcacgt aatggcttcg aagaaaaaaa gaaggcaaat acaatgaagc tgagatcttg 60
ttttatcatg agggg 77
<210> 51
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Yeast chromosomal integration Sites, ChrXIV:764201..764350, LeftHomology
<400> 51
caaataaatt aggctcataa ccgtaatttt attcgagaca tttttggtta cttcaaaata 60
ttgttattat ataaa 77
<210> 52
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Yeast chromosomal integration Sites, ChrXIV:764201..764350, RightHomology
<400> 52
gatcatataa agttcttgga caagattgga tacatttagt tttatttttg aaaatcacaa 60
agatgaaaca aaata 77
<210> 53
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> S288c, ID1 (PCR Primers), Left Primer
<400> 53
gctgatggtt taggcgtaca 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> S288c, ID1 (PCR Primers), Right Primer
<400> 54
ccctggaaat gcacttggtc 20
<210> 55
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> S288c, ID2 (qPCR Primers), left primer
<400> 55
cgtatagagc gggtcatcg 19
<210> 56
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> S288c, ID2 (qPCR Primers), right primer
<400> 56
tggtcgtttg gctgtagaga 20
<210> 57
<211> 520
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> s288c - Chromosome 2
<400> 57
acacaaactg gcgtagaagg ggaaacggaa atagggtctg acgaggaaga tagcatagag 60
gacgagggaa gcagcgctga tggtttaggc gtacacgaga tcctggttca acgcgctgca 120
aacctaccct gctccaaact gctgttcaac gccactctaa ctggcaggca aattattagt 180
ttctaagttc cccaggtgct gaagagcagt cattcaacgc cctcagatca tcccggcaag 240
ttggctggcg cgtttgtccg gaggatcgtg tcgtacaaca accatctgac tatcaaccct 300
ccaggcgtat agagcgggtc atcgatgcgc tcagggaaca acaacgatag gcctgcggct 360
ggtcaccatc gggaagtttt gctggagatc tgctgctgta ggaggtctct acagccaaac 420
gaccagacca agtgcatttc cagggagtgg aggaaatagt acgacagaaa gactagtacc 480
acaccagctg agggaacaag cagccagaca tataggaaaa 536
<210> 58
<211> 520
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> s288c - Chromosome 6
<400> 58
tggagttgca aaaaacaagg gaaaggaaaa tcaatcaaat tagaattaag gttttttttg 60
gacagtgcag cgtcagctga tggtttaggc gtacacgaga tcctggttca acgcgctgca 120
aacctaccct gctccaaact gctgttcaac gccactctaa ctggcaggca aattattagt 180
ttctaagttc cccaggtgct gaagagcagt cattcaacgc cctcagatca tcccggcaag 240
ttggctggcg cgtttgtccg gaggatcgtg tcgtacaaca accatctgac tatcaaccct 300
ccaggcgtat agagcgggtc atcgatgcgc tcagggaaca acaacgatag gcctgcggct 360
ggtcaccatc gggaagtttt gctggagatc tgctgctgta ggaggtctct acagccaaac 420
gaccagacca agtgcatttc cagggatgcg cacgtaatgg cttcgaagaa aaaaagaagg 480
caaatacaat gaagctgaga tcttgtttta tcatgagggg 536
<210> 59
<211> 520
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> s288c - Chromosome 14
<400> 59
caaataaatt aggctcataa ccgtaatttt attcgagaca tttttggtta cttcaaaata 60
ttgttattat ataaagctga tggtttaggc gtacacgaga tcctggttca acgcgctgca 120
aacctaccct gctccaaact gctgttcaac gccactctaa ctggcaggca aattattagt 180
ttctaagttc cccaggtgct gaagagcagt cattcaacgc cctcagatca tcccggcaag 240
ttggctggcg cgtttgtccg gaggatcgtg tcgtacaaca accatctgac tatcaaccct 300
ccaggcgtat agagcgggtc atcgatgcgc tcagggaaca acaacgatag gcctgcggct 360
ggtcaccatc gggaagtttt gctggagatc tgctgctgta ggaggtctct acagccaaac 420
gaccagacca agtgcatttc caggggatca tataaagttc ttggacaaga ttggatacat 480
ttagttttat ttttgaaaat cacaaagatg aaacaaaata 536
<210> 60
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Vermont, ID1 (PCR), left primer
<400> 60
actctcccat tagtcggcag 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Vermont, ID1 (PCR), right primer
<400> 61
aagaccgctt tgttccgaca 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Vermont, ID2 (qPCR Primers), left primer
<400> 62
ggccctatca gtacagcagt 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Vermont, ID2 (qPCR Primers), right primer
<400> 63
agtgctggcg agagaatgaa 20
<210> 64
<211> 520
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Vermont - Chromosome 2
<400> 64
acacaaactg gcgtagaagg ggaaacggaa atagggtctg acgaggaaga tagcatagag 60
gacgagggaa gcagcactct cccattagtc ggcagcacgt tcgccagtaa ttaccggaga 120
cagaaaaatc tcggaacagt ttatccgcaa ttctgaggaa atcgtcgtcc gcaagctccg 180
tgcacagcta gtagtagtct ccggtgcggg ggggggcgga gtggtctccc acgatacgac 240
gttgtctaga tacgtaccca cctcgctgtg tgctctctgg ctatctgaac gtccactcca 300
gaaggggccc tatcagtaca gcagtcatag ccgcacacaa gtccaacgtc ccccaaacct 360
cctgaccacg cagtcgccac cggcgcagac actatttctc gtaggttcat tctctcgcca 420
gcacttgtcg gaacaaagcg gtcttagtgg aggaaatagt acgacagaaa gactagtacc 480
acaccagctg agggaacaag cagccagaca tataggaaaa 536
<210> 65
<211> 520
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Vermont - Chromosome 6
<400> 65
tggagttgca aaaaacaagg gaaaggaaaa tcaatcaaat tagaattaag gttttttttg 60
gacagtgcag cgtcaactct cccattagtc ggcagcacgt tcgccagtaa ttaccggaga 120
cagaaaaatc tcggaacagt ttatccgcaa ttctgaggaa atcgtcgtcc gcaagctccg 180
tgcacagcta gtagtagtct ccggtgcggg ggggggcgga gtggtctccc acgatacgac 240
gttgtctaga tacgtaccca cctcgctgtg tgctctctgg ctatctgaac gtccactcca 300
gaaggggccc tatcagtaca gcagtcatag ccgcacacaa gtccaacgtc ccccaaacct 360
cctgaccacg cagtcgccac cggcgcagac actatttctc gtaggttcat tctctcgcca 420
gcacttgtcg gaacaaagcg gtcttatgcg cacgtaatgg cttcgaagaa aaaaagaagg 480
caaatacaat gaagctgaga tcttgtttta tcatgagggg 536
<210> 66
<211> 520
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Vermont - Chromosome 14
<400> 66
caaataaatt aggctcataa ccgtaatttt attcgagaca tttttggtta cttcaaaata 60
ttgttattat ataaaactct cccattagtc ggcagcacgt tcgccagtaa ttaccggaga 120
cagaaaaatc tcggaacagt ttatccgcaa ttctgaggaa atcgtcgtcc gcaagctccg 180
tgcacagcta gtagtagtct ccggtgcggg ggggggcgga gtggtctccc acgatacgac 240
gttgtctaga tacgtaccca cctcgctgtg tgctctctgg ctatctgaac gtccactcca 300
gaaggggccc tatcagtaca gcagtcatag ccgcacacaa gtccaacgtc ccccaaacct 360
cctgaccacg cagtcgccac cggcgcagac actatttctc gtaggttcat tctctcgcca 420
gcacttgtcg gaacaaagcg gtcttgatca tataaagttc ttggacaaga ttggatacat 480
ttagttttat ttttgaaaat cacaaagatg aaacaaaata 536
<210> 67
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> French Saison, ID1 (PCR Primers), left primer
<400> 67
gcgtacaatg ccctgaagaa 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> French Saison, ID1 (PCR Primers), right primer
<400> 68
ctccctggaa atgcacttgg 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> French Saison, ID2 (qPCR Primers), left primer
<400> 69
agcgggtcat cgaaaggtta 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> French Saison, ID2 (qPCR Primers), right primer
<400> 70
cacttggtcg tttggctgta 20
<210> 71
<211> 520
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> French - Chromosome 2
<400> 71
acacaaactg gcgtagaagg ggaaacggaa atagggtctg acgaggaaga tagcatagag 60
gacgagggaa gcagcgcgta caatgccctg aagaattact tccgtactgg aagcggatag 120
caccagactg taagctaacg aacgcctgtt tgaggctcag tctgctaaat tggaaccgcg 180
tcgctcctag gcatattttg gtgaaagcac tctgcccaaa agcctgtaga attccggacc 240
gacgctctct tcactcgaag attccgggta agaagtttca gccagggctg tctccattag 300
aaaggagcgg gtcatcgaaa ggttacgttg gttgtatctg attagacggt agacatccag 360
ctcatctctg attactaaag ttctccgccg ctccatcggg cgaggtacag ccaaacgacc 420
aagtgccaag tgcatttcca gggagagtgg aggaaatagt acgacagaaa gactagtacc 480
acaccagctg agggaacaag cagccagaca tataggaaaa 536
<210> 72
<211> 520
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> French - Chromosome 6
<400> 72
tggagttgca aaaaacaagg gaaaggaaaa tcaatcaaat tagaattaag gttttttttg 60
gacagtgcag cgtcagcgta caatgccctg aagaattact tccgtactgg aagcggatag 120
caccagactg taagctaacg aacgcctgtt tgaggctcag tctgctaaat tggaaccgcg 180
tcgctcctag gcatattttg gtgaaagcac tctgcccaaa agcctgtaga attccggacc 240
gacgctctct tcactcgaag attccgggta agaagtttca gccagggctg tctccattag 300
aaaggagcgg gtcatcgaaa ggttacgttg gttgtatctg attagacggt agacatccag 360
ctcatctctg attactaaag ttctccgccg ctccatcggg cgaggtacag ccaaacgacc 420
aagtgccaag tgcatttcca gggagatgcg cacgtaatgg cttcgaagaa aaaaagaagg 480
caaatacaat gaagctgaga tcttgtttta tcatgagggg 536
<210> 73
<211> 520
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> French - Chromosome 14
<400> 73
caaataaatt aggctcataa ccgtaatttt attcgagaca tttttggtta cttcaaaata 60
ttgttattat ataaagcgta caatgccctg aagaattact tccgtactgg aagcggatag 120
caccagactg taagctaacg aacgcctgtt tgaggctcag tctgctaaat tggaaccgcg 180
tcgctcctag gcatattttg gtgaaagcac tctgcccaaa agcctgtaga attccggacc 240
gacgctctct tcactcgaag attccgggta agaagtttca gccagggctg tctccattag 300
aaaggagcgg gtcatcgaaa ggttacgttg gttgtatctg attagacggt agacatccag 360
ctcatctctg attactaaag ttctccgccg ctccatcggg cgaggtacag ccaaacgacc 420
aagtgccaag tgcatttcca gggaggatca tataaagttc ttggacaaga ttggatacat 480
ttagttttat ttttgaaaat cacaaagatg aaacaaaata 536

Claims (59)

1.一种用于标识生物材料的方法,所述方法包括:
接收或提供包含来自所述生物材料的基因组DNA的样品;
扩增来自所述生物材料的所述基因组DNA内的至少一种DNA独特标识符序列并对所述DNA独特标识符序列测序;和
在数据库中搜索所述DNA独特标识符序列并检索对应于所述DNA独特标识符序列的数据库条目,所述数据库条目提供所述生物材料的标识和/或追溯信息。
2.根据权利要求1所述的方法,其中所述生物材料包括植物基材料、真菌基材料、动物基材料、病毒基材料或者细菌基材料。
3.一种用于提供生物材料的可追溯性的方法,所述方法包括:
确定生物实体的所述基因组DNA内的至少一种DNA独特标识符序列的序列;
通过以下证实所述生物实体的鉴定:验证所述基因组DNA中所述DNA独特标识符序列的存在;和将所述DNA独特标识符序列的序列与数据库相比较以确认在所述数据库中尚未使用所述DNA独特标识符序列;
提供从所述生物实体产生生物材料的可接受性的指示,所述生物材料包含来自所述生物实体的基因组DNA;和
将所述至少一种DNA独特标识符序列的序列输入所述数据库的数据库条目中,并将所述DNA独特标识符序列与所述生物材料的标识和/或追溯信息相关联;
借此通过读取所述生物材料中的所述DNA独特标识符序列并检索提供所述生物材料的标识和/或追溯信息的相应数据库条目来提供所述生物材料的可追溯性。
4.根据权利要求3所述的方法,还包括在生物实体的所述基因组DNA内插入至少一种DNA独特标识符序列或者通过基因编辑修饰生物实体的所述基因组DNA内预先存在的标识符序列,从而在所述生物实体的所述基因组DNA内创建DNA独特标识符序列,借此提供它的标识。
5.根据权利要求4所述的方法,还包括提供用于插入在所述生物实体的所述基因组DNA内的至少一种DNA独特标识符序列。
6.根据权利要求3-5中任一项所述的方法,其中所述生物材料包括植物基材料、真菌基材料、动物基材料、病毒基材料或者细菌基材料。
7.根据权利要求3-6中任一项所述的方法,其中所述生物实体包括植物细胞、真菌细胞、动物细胞、病毒或细菌细胞。
8.根据权利要求3-7中任一项所述的方法,其中从所述生物实体产生生物材料包括增殖所述生物实体。
9.根据权利要求3-8中任一项所述的方法,其中所述DNA独特标识符序列来自DNA独特标识符序列的随机混合池。
10.根据权利要求3-9中任一项所述的方法,其中读取所述生物材料中的所述DNA独特标识符序列并检索相应数据库条目包括:
接收或提供包含来自所述生物材料的基因组DNA的样品;
扩增来自所述生物材料的所述基因组DNA内的至少一种DNA独特标识符序列并对所述DNA独特标识符序列测序;以及
将所述DNA独特标识符序列与所述数据库相比较,并检索与所述DNA独特标识符序列对应的所述数据库条目,所述数据库条目提供所述生物材料的标识和/或追溯信息。
11.根据权利要求1-10中任一项所述的方法,其中所述DNA独特标识符序列包括插入所述基因组DNA的基因间区中的独特核苷酸序列。
12.根据权利要求1-11中任一项所述的方法,其中所述DNA独特标识符序列包括长度多至约1500nt;长度多至约1000nt;长度约200nt至约600nt;长度约200nt至约400nt;或者长度约400nt至约600nt的序列。
13.根据权利要求1-12中任一项所述的方法,其中所述DNA独特标识符序列侧接一个或多个引物退火序列以用于所述DNA独特标识符序列的PCR扩增、所述DNA独特标识符序列的测序或两者。
14.根据权利要求1-13中任一项所述的方法,其中所述生物材料包括食品。
15.根据权利要求1-14中任一项所述的方法,其中所述数据库条目的所述标识和/或追溯信息包括所述生物材料的供应链信息。
16.根据权利要求1-15中任一项所述的方法,其中所述数据库条目的所述标识和/或追溯信息包括所述生物材料的来源信息。
17.根据权利要求1-16中任一项所述的方法,其中所述数据库条目的所述标识和/或追溯信息包括种植户、地区、批、批次、日期或其它相关供应链信息或它们的任意组合。
18.根据权利要求1-17中任一项所述的方法,其中将盒引入所述基因组DNA,其中所述盒包括侧接一个或多个引物退火序列以用于所述DNA独特标识符序列的PCR扩增、所述DNA独特标识符序列的测序或两者的所述DNA独特标识符序列。
19.根据权利要求1-18中任一项所述的方法,其中所述DNA独特标识符序列是来源于长度多至约1500nt;长度多至约1000nt;长度约200nt至约600nt;长度约200nt至约400nt;或者长度约400nt至约600nt的核酸序列的随机混合池的随机序列。
20.一种寡核苷酸,其包括侧接一个或多个引物退火序列以用于DNA独特标识符序列的PCR扩增、所述DNA独特标识符序列的测序或两者的DNA独特标识符序列。
21.根据权利要求20所述的寡核苷酸,其中所述DNA独特标识符序列包括长度多至约1500nt;长度多至约1000nt;长度约200nt至约600nt;长度约200nt至约400nt;或者长度约400nt至约600nt的随机序列。
22.一种盒,其包含根据权利要求20或21所述的寡核苷酸。
23.一种细胞或病毒,其包含引入所述细胞或病毒的基因组中的根据权利要求20或21所述的寡核苷酸或者根据权利要求22所述的盒。
24.一种细胞或病毒,其包含引入所述细胞或病毒的基因组的DNA独特标识符序列。
25.根据权利要求23或24所述的细胞或病毒,其中将所述DNA独特标识符序列引入所述细胞或病毒的所述基因组DNA的基因间区。
26.根据权利要求23-25中任一项所述的细胞或病毒,其中所述细胞是植物细胞、真菌细胞、动物细胞或者细菌细胞。
27.一种试剂盒,其包含以下中的任何一个或多个:
DNA独特标识符序列;
DNA独特标识符序列的随机混合池;
如权利要求20或21中所定义的寡核苷酸;
如权利要求22中所定义的盒;
用于DNA独特标识符序列的扩增和/或测序的一个或多个引物对;
缓冲液;
聚合酶;或
用于实施根据权利要求1-19中任一项所述的方法的说明书。
28.一种标识生物材料的方法,所述方法包括:
在计算装置处接收提取自已知生物材料的DNA独特标识符序列(DUID);
在所述计算装置处搜索储存与各个生物材料信息相关联的多个DUID的DUID数据库以用于匹配所接收的DUID;
如果所述DUID数据库的搜索不能提供与所接收的DUID的匹配,则在所述DUID数据库中储存与所述已知生物材料相关联的生物材料信息相关联的所接收的DUID;
在储存所接收的DUID并具有与所述DUID数据库中的所述已知生物材料相关联的信息之后,在所述计算装置处接收提取自未知生物材料的查询DUID;
在所述计算装置搜索所述DUID数据库中与所接收的查询DUID的匹配;以及
如果DUID的搜索提供了与所接收的查询DUID的匹配,则响应于所接收的查询DUID,返回关联于所述DUID匹配所述查询DUID所储存的生物信息。
29.根据权利要求28所述的方法,其中搜索所述DUID数据库中与所接收的DUID的匹配包括:
搜索所述DUID数据库中与所接收的DUID的完全匹配;以及
如果未找到完全匹配,则对所述DUID数据库中储存的与所接收的DUID密切匹配的多个DUID实施比对/同一性搜索。
30.根据权利要求28或29所述的方法,其中搜索所述DUID数据库中与所述查询DUID的匹配包括:
搜索所述DUID数据库中与所述查询DUID的完全匹配;以及
如果未找到完全匹配,则对所述DUID数据库中储存的与所述查询DUID密切匹配的多个DUID实施比对/同一性搜索。
31.根据权利要求30所述的方法,还包括:
如果所述搜索提供了与所述查询DUID的密切匹配,则储存与所述查询DUID密切匹配的DUID相关联的查询DUID。
32.一种用于标识生物材料的计算系统,所述系统包括:
能够执行指令的处理单元;和
存储指令的存储单元,当通过所述处理单元执行时,所述指令配置所述计算系统执行根据权利要求28-31中任一项所述的方法。
33.一种计算机可读存储器,其具有在其上存储的指令,当通过计算系统的处理单元执行时,所述指令配置所述系统执行根据权利要求28-31中任一项所述的方法。
34.一种用于标识生物材料的方法,所述方法包括:
接收或提供包含来自所述生物材料的基因组DNA的样品;
扩增来自所述生物材料的所述基因组DNA内的至少一种DNA独特标识符序列并对所述独特标识符序列测序;和
将所述DNA独特标识符序列中储存的所述生物材料的标识和/或追溯信息解码或解密。
35.一种用于提供生物材料的可追溯性的方法,所述方法包括:
确定生物实体的基因组DNA内的至少一种DNA独特标识符序列的序列;
通过以下证实所述生物实体的标识:验证所述基因组DNA中所述DNA独特标识符序列的存在;和将所述DNA独特标识符序列中储存的标识和/或追溯信息解码或解密以验证所述DNA独特标识符序列;和
提供从所述生物实体产生生物材料的可接受性的指示,所述生物材料包含来自所述生物实体的基因组DNA;
借此通过以下而提供生物材料的可追溯性:读取所述生物材料中的所述DNA独特标识符序列并对所述DNA独特标识符序列中储存的信息解码或解密,从而提供所述生物材料的标识和/或追溯信息。
36.一种标识生物材料的方法,所述方法包括:
在计算装置接收提取自未知生物材料的DNA独特标识符序列(DUID);和
将所述DNA独特标识符序列中储存的未知生物材料的标识和/或追溯信息解码或解密。
37.一种包含DNA独特标识符序列的盒,所述DNA独特标识符序列侧接至少一个5'引物退火序列和至少一个3'引物退火序列以用于所述DNA独特标识符序列的扩增、所述DNA独特标识符序列的测序或两者。
38.根据权利要求37所述的盒,其中所述DNA独特标识符序列侧接两个5'引物退火序列和两个3'引物退火序列以允许通过巢式PCR扩增所述DNA独特标识符序列。
39.根据权利要求38所述的盒,其中所述两个5'引物退火序列部分重叠;其中所述两个3'引物退火序列部分重叠;或两者。
40.根据权利要求37-39中任一项所述的盒,其中所述盒还包含位于所述DNA独特标识符序列5'端的测序引物退火序列以用于所述DNA独特标识符序列的测序。
41.根据权利要求40所述的盒,其中所述测序引物退火序列位于两个5'引物退火序列之间。
42.根据权利要求41所述的盒,其中所述测序引物退火序列与所述两个5'引物退火序列之一或两者至少部分重叠。
43.根据权利要求41所述的盒,其中所述两个5'引物退火序列部分重叠,并且其中所述测序引物退火序列的至少一部分位于所述重叠处。
44.根据权利要求37-43中任一项所述的盒,其中所述盒序列的长度多至约1500nt;长度多至约1000nt;长度为约200nt至约600nt;长度为约200nt至约400nt;或者长度为约400nt至约600nt。
45.根据权利要求37-44中任一项所述的盒,其中所述引物退火序列在靶标生物实体的基因组中不是天然存在的。
46.一种组合物,其包含多个如权利要求37-45中任一项所定义的盒,每个盒包含相同的引物退火序列,并且每个盒包含随机DNA独特标识符序列。
47.一种组合物,其包含多个如权利要求40-43中任一项所定义的盒,每个盒包含相同的引物退火序列和相同的测序引物退火序列,并且每个盒包含随机DNA独特标识符序列。
48.一种用于提供生物材料的可追溯性的方法,所述方法包括:
将至少一种DNA独特标识符序列插入生物实体的基因组DNA内以用于制备所述生物材料。
49.根据权利要求48所述的方法,其中将所述DNA独特标识符序列插入作为根据权利要求37-45中任一项所述的盒。
50.根据权利要求48或49所述的方法,还包括确定所述生物实体的所述基因组DNA内的至少一个DNA独特标识符序列的序列的步骤。
51.根据权利要求48-50中任一项所述的方法,还包括通过以下证实所述生物实体的标识的步骤:验证所述基因组DNA中所述DNA独特标识符序列的存在;并且将所述DNA独特标识符序列的序列与数据库相比较以确认尚未在所述数据库中使用所述DNA独特标识符序列。
52.根据权利要求48-51中任一项所述的方法,还包括以下步骤:
从所述生物实体产生所述生物材料,所述生物材料包含来自所述生物实体的基因组DNA;和/或
提供从所述生物实体产生所述生物材料的可接受性的指示,所述生物材料包含来自所述生物实体的基因组DNA。
53.根据权利要求48-52中任一项所述的方法,还包括以下步骤:将所述至少一种DNA独特标识符序列的序列输入到数据库条目,并且将所述DNA独特标识符序列与所述生物实体和/或生物材料的标识和/或追溯信息相关联。
54.根据权利要求53所述的方法,还包括以下步骤:
通过读取所述生物实体和/或生物材料中的所述DNA独特标识符序列并检索提供所述生物实体和/或生物材料的标识和/或追溯信息的相应数据库条目来提供所述生物实体和/或生物材料的可追溯性。
55.一种质粒或表达载体,其包含根据权利要求20-21中任一项所述的寡核苷酸或者根据权利要求22、37-44或45中任一项所述的盒。
56.一种用于提供感兴趣的产品的可追溯性的方法,所述方法包括:
接收或提供来自感兴趣的产品的样品,所述样品包含来自感兴趣的产品的生物材料部分,与感兴趣的产品混合或另外与感兴趣的产品相关联的基因组DNA;
扩增来自所述生物材料的基因组DNA内的至少一种DNA独特标识符序列并对所述DNA独特标识符序列测序;和
在数据库中搜索所述DNA独特标识符序列并检索对应于所述DNA独特标识符序列的数据库条目,所述数据库条目提供感兴趣的产品的标识和/或追溯信息。
57.根据权利要求56所述的方法,其中所述方法包括将所述生物材料引入或添加至所述感兴趣的产品,所述生物材料包含至少一种DNA独特标识符序列作为其基因组材料的一部分。
58.根据权利要求56或57所述的方法,其中所述数据库条目的标识和/或追溯信息包括所述感兴趣的产品的供应链信息。
59.根据权利要求56-58中任一项所述的方法,其中所述感兴趣的产品包括食品、农产品、药物、零售产品、纺织品、日用品、化学品或者另一种供应链物品。
CN202080093112.XA 2019-11-26 2020-11-26 用于提供生物材料的标识和/或可追溯性的方法和组合物 Pending CN115087748A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962940587P 2019-11-26 2019-11-26
US62/940,587 2019-11-26
PCT/CA2020/051622 WO2021102579A1 (en) 2019-11-26 2020-11-26 Methods and compositions for providing identification and/or traceability of biological material

Publications (1)

Publication Number Publication Date
CN115087748A true CN115087748A (zh) 2022-09-20

Family

ID=76128571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080093112.XA Pending CN115087748A (zh) 2019-11-26 2020-11-26 用于提供生物材料的标识和/或可追溯性的方法和组合物

Country Status (10)

Country Link
US (1) US20230002837A1 (zh)
EP (1) EP4065732A4 (zh)
JP (1) JP2023504582A (zh)
KR (1) KR20220121813A (zh)
CN (1) CN115087748A (zh)
AU (1) AU2020389794A1 (zh)
BR (1) BR112022010128A2 (zh)
CA (1) CA3159718A1 (zh)
MX (1) MX2022006245A (zh)
WO (1) WO2021102579A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230125457A1 (en) * 2021-10-26 2023-04-27 Microsoft Technology Licensing, Llc Synthetic molecular tags for supply chain tracking

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7056724B2 (en) * 2002-05-24 2006-06-06 Battelle Memorial Institute Storing data encoded DNA in living organisms
DK2494060T3 (en) * 2009-10-30 2016-08-01 Synthetic Genomics Inc Coding of text for nucleic acid sequences
US11763169B2 (en) * 2016-11-16 2023-09-19 Catalog Technologies, Inc. Systems for nucleic acid-based data storage
CA3090134A1 (en) * 2018-02-02 2019-08-08 Apdn (B.V.I.) Inc. Systems and methods for tracking the origin of cannabis products and cannabis derivative products

Also Published As

Publication number Publication date
EP4065732A1 (en) 2022-10-05
JP2023504582A (ja) 2023-02-03
KR20220121813A (ko) 2022-09-01
MX2022006245A (es) 2022-09-09
WO2021102579A1 (en) 2021-06-03
AU2020389794A1 (en) 2022-06-30
CA3159718A1 (en) 2021-06-03
EP4065732A4 (en) 2024-01-03
BR112022010128A2 (pt) 2022-09-06
US20230002837A1 (en) 2023-01-05

Similar Documents

Publication Publication Date Title
Liang et al. Genotyping genome‐edited mutations in plants using CRISPR ribonucleoprotein complexes
Makarova et al. Classification and nomenclature of CRISPR-Cas systems: where from here?
van der Maarel et al. Association of marine archaea with the digestive tracts of two marine fish species
Wensing et al. A CRISPR interference platform for efficient genetic repression in Candida albicans
Perez Rojo et al. CRISPR-Cas systems: ushering in the new genome editing era
Kinch et al. Identification of novel restriction endonuclease-like fold families among hypothetical proteins
CN108027849A (zh) 利用htp基因组工程平台对微生物菌株的改良
Leboldus et al. Genotype‐by‐sequencing of the plant‐pathogenic fungi P yrenophora teres and S phaerulina musiva utilizing I on T orrent sequence technology
Merker et al. Enhancing in planta gene targeting efficiencies in Arabidopsis using temperature‐tolerant CRISPR/LbCas12a
Kumwenda et al. Analysis of protein thermostability enhancing factors in industrially important thermus bacteria species
Chèneby et al. Role of plant residues in determining temporal patterns of the activity, size, and structure of nitrate reducer communities in soil
Fraiture et al. Nanopore sequencing technology: a new route for the fast detection of unauthorized GMO
Naranjo et al. Dissecting the genetic basis of a complex cis-regulatory adaptation
Marcon et al. Transcriptionally active LTR retrotransposons in Eucalyptus genus are differentially expressed and insertionally polymorphic
Gschloessl et al. Draft genome and reference transcriptomic resources for the urticating pine defoliator Thaumetopoea pityocampa (Lepidoptera: Notodontidae)
Aggarwal et al. First draft genome sequence of wheat spot blotch pathogen Bipolaris sorokiniana BS_112 from India, obtained using hybrid assembly
Schroeder et al. Development of a functional genomics platform for Sinorhizobium meliloti: construction of an ORFeome
Pesce et al. Sex in a test tube: testing the benefits of in vitro recombination
Hofstatter et al. Evolution of bacterial recombinase A (recA) in eukaryotes explained by addition of genomic data of key microbial lineages
CN115087748A (zh) 用于提供生物材料的标识和/或可追溯性的方法和组合物
Guo et al. Chloroplast DNA insertions into the nuclear genome of rice: the genes, sites and ages of insertion involved
Li et al. Genome-wide identification and analysis of highly specific CRISPR/Cas9 editing sites in pepper (Capsicum annuum L.)
Servinsky et al. Effect of a recD mutation on DNA damage resistance and transformation in Deinococcus radiodurans
Liu et al. Functional characterization of the active Mutator-like transposable element, Muta1 from the mosquito Aedes aegypti
Baker et al. UREASE GENE SEQUENCES FROM ALGAE AND HETEROTROPHIC BACTERIA IN AXENIC AND NONAXENIC PHYTOPLANKTON CULTURES 1

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination