CN115087750B - 基于全基因组分析的真核生物物种鉴定方法及应用 - Google Patents

基于全基因组分析的真核生物物种鉴定方法及应用 Download PDF

Info

Publication number
CN115087750B
CN115087750B CN202280002592.3A CN202280002592A CN115087750B CN 115087750 B CN115087750 B CN 115087750B CN 202280002592 A CN202280002592 A CN 202280002592A CN 115087750 B CN115087750 B CN 115087750B
Authority
CN
China
Prior art keywords
species
specific target
identified
library
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202280002592.3A
Other languages
English (en)
Other versions
CN115087750A (zh
Inventor
宋经元
齐桂红
许文杰
郝利军
甘雨桐
辛天怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Medicinal Plant Development of CAMS and PUMC
Original Assignee
Institute of Medicinal Plant Development of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Medicinal Plant Development of CAMS and PUMC filed Critical Institute of Medicinal Plant Development of CAMS and PUMC
Publication of CN115087750A publication Critical patent/CN115087750A/zh
Application granted granted Critical
Publication of CN115087750B publication Critical patent/CN115087750B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请公开了一种基于全基因组分析的真核生物样品的物种鉴定方法及其应用,其中,通过筛选得到的物种特异性靶标序列,实现了对待检测样品的物种鉴定。本发明的物种鉴定方法特异性强,灵敏度高,重复性好,可不需要依靠大型专业仪器来实现物种的快速鉴定,因此,具有广阔的应用前景。

Description

基于全基因组分析的真核生物物种鉴定方法及应用
技术领域
本申请涉及真核生物物种鉴定技术领域,具体涉及一种基于全基因组分析的真核生物物种鉴定方法及应用。
背景技术
物种鉴定伴随着整个人类的发展史,它与自然探索、社会发展和科学研究息息相关。虽然人类尚无法识别地球所有生命,但是鉴定方法的不断发展加强了我们对其他生命的认识与理解。一直以来,无数的科研工作者致力于对种类多样、分布广泛、复杂难辨的物种进行鉴定和分类。早期,物种鉴定主要根据物种形态特征、化学成分等表现型进行物种鉴定,但由于表现型受环境和生长阶段等因素的综合影响,无法反映物种间差异的根本原因。在这期间,DNA测序技术在读长、准确性的不断提升,促进了对物种全基因组层面的测序及分析。随着拥有全基因组数据的物种数量的爆发式增长,使得基于全基因组分析的物种鉴定策略成为可能。作为物种全部遗传信息的载体,全基因组揭示了物种区分其他物种表现特异性的根本原因,因此以全基因组为基础的新型鉴定方法也代表了物种鉴定未来发展方向。同时,生物信息学的快速发展和分子生物学的鉴定基础也为实现基于全基因组数据的物种鉴定提供了有力支撑。分子生物学鉴定方法如DNA条形码技术的不断发展,已经发现了在一定适用范围内可用的不同DNA条形码,同时随着测序技术不断迭代和计算机软硬件的发展也大大增强了基因组分析能力,两者为实现从全基因组层面进行物种鉴定提供了有力支撑。
基因编辑是用于对生物体基因组进行人为修饰的基因工程手段,该技术目前主要利用如下的核酸酶:锌指核酸酶(ZFNs)、转录激活样效应因子核酸酶(TALEN)和成簇的规律间隔短回文重复序列/CRISPR相关蛋白(Clustered regularly interspaced shortpalindromic repeats(CRISPR)/CRISPR-associated proteins(CRISPR/Cas))。其中,CRISPR/Cas系统作为新一代基因组编辑技术,该系统能够识别特异性序列从而达到定点编辑的目的。Jennifer A.Doudna、张锋和王金等人先后开发了DETECTR、SHERLOCK和HOLMES等方法并将其成功应用于病毒、细菌和真核生物的基因组编辑。例如,目前在植物生物技术领域,主要将基因编辑手段作为新的育种技术应用于对植物基因组进行工程化来开发具有新性能的植物品种(例如,参见如下的记载:Kangquan Yin等,Progress and prospects inplant genome editing,Nature Plants,3,17107(2017))。
目前,现有技术主要是在通过对特定基因功能区域筛选能够满足区分一定物种的序列,由于可供筛选的基因数据库较小,能够获得的靶标序列极其有限,导致靶标序列的特异性不足,容易发生脱靶等失误,不能很好地满足不同物种鉴定的需求。尤其是很难满足在特定区域内序列极其相似甚至相同的近缘物种鉴定的需求。全基因组包含着生物的全部遗传信息,是物种鉴定的理想数据库,通过全基因组比对筛选物种特异性序列并对该序列进行检测是物种鉴定的未来发展方向。
发明内容
为此,本申请提出一种基于全基因组分析的真核生物物种鉴定方法,本申请的方法(以下也称为GA法)以全基因组分析(Genome Analysis)为基础,寻找能够准确鉴定物种,尤其是满足区分待鉴定物种与近缘物种的特异性靶标序列库,并通过利用包括但不限于基因组编辑、测序等在内的多种检测手段对上述特异性序列进行精准识别,从而实现物种的准确鉴定。与现有技术相比,本申请的GA法通过生物信息分析学方法批量从物种全基因组中筛选得到仅存在于本物种的特异性靶标序列库,同时考虑脱靶等失误风险,提高物种鉴定的准确性,最终实现对待鉴定真核生物物种的准确判断。
本申请涉及一种基于全基因组分析的真核生物物种鉴定的方法,包括:
i)基于待鉴定物种的全基因组序列,构建小片段基因组文库;
ii)基于后续的检测的要求或根据全基因组注释文件和数据库收录的物种序列信息等,可选择性地对所述小片段基因组文库中的序列进行筛选,获得广泛候选靶标序列库;
iii)基于所述待鉴定物种的近缘物种的全基因组序列,将所述小片段基因组文库或所述广泛候选靶标序列库中的序列与所述近缘物种的全基因组序列进行比对,选择仅存在于所述待鉴定物种中的特异性序列来构建特异性靶标序列库;
iv)基于选定的特异性靶标序列对真核生物样品进行物种鉴定。获得待检测的真核生物样品的基因组DNA,对所述基因组DNA检测是否含有所述特异性靶标序列库中的序列,从而确定所述待检测样品与所述待鉴定物种的同一性。如果检测到所述特异性靶标序列库中的序列,则确定所述真核生物样品与所述待鉴定物种具有同一性,反之,则不具有同一性。
在一些优选的实施方式中,在i)中,将所述待鉴定物种的全基因组序列分成(L-K+1)个长度为K的片段以构建所述小片段基因组文库,并计算其中的每个片段的拷贝数,再通过将各片段与所述全基因组序列比对确定每个片段的基因组位置以便于更好地进行后续步骤的序列比对,其中L表示全基因组序列长度,K表示所述文库中的片段长度。
在一些优选的实施方式中,在i)中,所述待鉴定物种可以是真核生物中的任意物种。作为示例,所述待鉴定物种分别来自动物、植物、真菌等不同界生物。
在本文中,所述待鉴定物种的全基因组序列可获取自已知的公共数据库或者可通过常规方法进行全基因组测序获得。
在ii)中,对所述小片段基因组文库内的序列进行筛选,这就使得能够从待鉴定物种的全基因组范围内、而非局限于特定区域来提取广泛候选靶标序列,从而使得到的靶标序列分布程度广泛,有助于后续消除脱靶等风险。
在一些优选的实施方式中,在ii)中,对所述小片段基因组文库中的每一个片段检测PAM基序,并提取带有PAM的序列构建广泛候选靶标序列库。在本文中,PAM(前间隔序列临近基序)可由本领域技术人员根据后续对特异性序列检测所采用的基因组编辑系统来确定,例如采用CRISPR/Cas12a系统进行所述后续的检测时,可选择5'端带有TTTV(SEQ IDNO:10)或3'端带有VAAA(SEQ ID NO:11)的PAM。
在iii)中,优选地,在与近缘物种的全基因组序列进行比对前,可先将所述小片段基因组文库或所述广泛候选靶标序列库中的序列与待鉴定物种的多个(例如所有的)已知的基因组序列进行比对,从所述小片段基因组文库或所述广泛候选靶标序列中筛选能够与所述待鉴定物种的多个已知的基因组序列完全匹配的序列,构建待鉴定物种的初步候选靶标序列库。随后,将所述初步候选靶标序列库与近缘物种的全基因组序列进行比对,选择仅存在于所述待鉴定物种中的序列来构建特异性靶标序列库。
在iii)中,优选在种内保守性高且种间差异性大区域内选择仅存在于所述待鉴定物种中的序列来构建特异性靶标序列库。考虑脱靶效应,优选与所述近缘物种(例如混伪品)的全基因组序列存在至少n个碱基差异的序列,其中n大于等于3。优选地,可以通过增大n值以进一步提高靶标序列的特异性,或者可以通过调节n值,筛选得到预定数量范围内的靶标序列。
在本文中,在iii)中,优选地,可以通过选择仅存在于所述待鉴定物种中的多个不同的序列来构建所述特异性靶标序列库,以用于后续实验中确定待检测样品与待鉴定物种的同一性。
在本文中,所述待检测的真核生物样品可以是来自任何真核生物的样品,例如来自动物、植物或真菌的样品。作为示例,所述待检测的真核生物样品可以是来自冬虫夏草、药用大黄、马鹿、蛹虫草、掌叶大黄或驯鹿的样品。在一些实施方式中,所述待检测的真核生物生物样品是单一物种来源的样品或者是多种物种来源的样品的混合物。
在一些优选的实施方式中,所述待鉴定物种为真菌界的冬虫夏草,在iii)中,所述特异性靶标序列为如SEQ ID NO:1所示的核苷酸序列。
SEQ ID NO:1:TTTGGGAGTGGTGACTCGATAATGA。
在一些优选的实施方式中,所述待鉴定物种为植物界的药用大黄,在iii)中,所述特异性靶标序列为如SEQ ID NO:2所示的核苷酸序列。
SEQ ID NO:2:AATATGGTTATGTTATATTAATAAA。
在一些优选的实施方式中,所述待鉴定物种为动物界的马鹿,在iii)中,所述特异性靶标序列为如SEQ ID NO:3所示的核苷酸序列。
SEQ ID NO:3:TTTATGCACCTGATGATTTTCTACG。
在本文中,在iv)中,对于所述检测,可采用本领域已知的用于对特定序列进行识别的任何检测技术/手段进行。在一些优选的实施方式中,在iv)中,可采用基因编辑系统、测序等序列识别手段进行所述检测,从而确定所述待检测样品中是否存在所述特异性靶标序列。
在一些优选的实施方式中,在iv)中,为了检测更加简单、直接,且同时保持高的灵敏度,采用具有荧光信号分子的基因组编辑系统、优选CRISPR/Cas系统(例如CRISPR/Cas9系统、CRISPR/Cas12a系统、CRISPR/Cas12b系统、CRISPR/Cas13系统)进行所述检测。
在本文中,在iv)中,进行所述检测之前,基于对所述基因组DNA进行的序列检测所采用的不同的技术(包括但不限于基因编辑技术、测序技术等方法),预先构建与所述特异性靶标序列相匹配的工具库(例如crRNA库、引物库)。在进一步优选的实施方式中,在iv)中,采用基因组编辑系统进行所述检测,预先构建与所述特异性靶标序列相匹配的CRISPRRNA(crRNA)和任选的tracr RNA的工具库。在另外优选的实施方式中,在iv)中,采用测序进行所述检测,预先构建与所述特异性靶标序列相匹配的引物对的工具库。
在一些优选的实施方式中,所述待鉴定物种为冬虫夏草,在iv)中,采用如下引物对进行所述检测:
ITS4F:5'-GGAAGTAAAAGTCGTAACAAGG-3'(SEQ ID NO:4);
ITS5R:5'-TCCTCCGCTTATTGATATGC-3'(SEQ ID NO:5)。
在一些优选的实施方式中,所述待鉴定物种为药用大黄,在iv)中,采用如下引物对进行所述检测:
Ro_1F:5’-CCAAATTGCCCGAAGCCTATG-3’(SEQ ID NO:6);
Ro_1R:5’-ATCGCTTTCCGACCCACAAT-3’(SEQ ID NO:7)。
在一些优选的实施方式中,所述待鉴定物种为马鹿,在iv)中,采用如下引物对进行所述检测:
Ce_17F:5’-AGCAGAAGTGATGGTTGCTG-3’(SEQ ID NO:8);
Ce_17R:5’-AAGAATCCTAGGAAGAACTGGT-3’(SEQ ID NO:9)。
在进一步优选的实施方式中,可以选择对引物序列的两端进行硫代修饰,从而进一步提高扩增效率和检测灵敏度。
本公开中,作为示例,期望的基因组编辑系统至少包括室温扩增试剂、缓冲液、Cas蛋白、crRNA、无核酸酶水(nuclease-free water)和荧光信号分子(例如ssDNA荧光报告基因)。例如,以所述待检测的生物样品的基因组DNA作为底物,采用上述期望的基因组编辑系统来进行检测,如果识别到存在物种特异性靶标序列,则反应体系产生荧光,当测定的荧光值与空白对照存在显著差异时,确定所述待检测样品与待鉴定物种具有同一性,反之,所述待检测样品与待鉴定物种不具有同一性。
在本文中,室温扩增试剂可以由本领域技术人员根据实际情况选择任意已知的扩增试剂,缓冲液和Cas蛋白可根据所采用的基因组编辑系统确定。具体地,以CRISPR/Cas12a系统为例,可选择ERA扩增试剂、NEBuffer 2.1和Lba Cas12a(Cpf1),荧光信号分子选择Poly_C_FQ(5’-FAM-CCCCCCCCCC(SEQ ID NO:12)-BHQ-3’),向其中加入crRNA、无核酸酶水和待检测样品的基因组DNA后,扩增反应在管底进行,检测试剂(NEBuffer 2.1、LbaCas12a、crRNA和无核酸酶水)在管盖反应。作为示例,以如下表1中示出的反应体系采用CRISPR/Cas12a系统进行检测,将所述反应体系在40℃孵育20分钟后,通过短暂离心使管盖检测试剂沉降于底部,并将所有试剂充分混合,室温孵育10分钟。将4μL Poly_C_FQ(400nM)与上述体系混合,随后在37℃孵育并在0、3、6、9、12、15、25、35、45、60分钟时用酶标仪在λex483nm/λem 535nm(该波长可根据所选的荧光信号分子确定)分别检测荧光值。如检测结果与空白对照存在显著性差异(P<0.01)则可判定待检测的样品与待鉴定物种具有同一性,反之则与待鉴定物种不具有同一性。
表1采用CRISPR/Cas12a系统的示例性的反应体系
Figure BDA0003791626240000061
上文所述的方法可用于不同应用场景下的真核生物样品的物种鉴定,其包括:对于待鉴定物种执行上文所述的方法,根据所述荧光检测结果判定待检测样品与待鉴定物种的同一性。
在一个实施方式中,本申请涉及上文所述的物种鉴定方法在构建用于真核生物物种鉴定的靶标序列库方面的用途,其中,选择待鉴定物种,按照上文所述的物种鉴定方法筛选得到待鉴定物种的1个或多个特异性靶标序列;将所述待鉴定物种的1个或多个特异性的靶标序列组合,构建所述靶标序列库。
或者,本申请涉及一种构建用于真核生物物种鉴定的特异性靶标序列库的方法,包括:
a)选择待鉴定物种,按照上文所述的物种鉴定方法筛选得到待鉴定物种的1个或多个特异性靶标序列;
b)将所述待鉴定物种的1个或多个特异性靶标序列组合,构建所述特异性靶标序列库。
或者,本申请涉及一种构建用于对真核生物物种鉴定的特异性靶标序列进行检测的工具库的方法,包括:
A)选择待鉴定物种,按照上文所述的构建特异性靶标序列库的方法来构建所述靶标序列库;
B)基于用于所述检测的技术(根据序列检测方法的多样性,可包括但不限于基因编辑、测序技术等),构建与所述特异性靶标序列相匹配的工具库(包括但不限于crRNA库、引物库等)。
或者,本申请涉及一种区分中药材与其相应混伪品的方法,包括:
I)将所述中药材或混伪品用作待鉴定物种,按照上文所述的物种鉴定方法筛选得到特异性靶标序列;
II)获得待检测的药材样品的基因组DNA,并检测所述基因组DNA中是否含有所述特异性靶标序列,从而确定所述待检测的药材样品与所述中药材或混伪品的同一性。
或者,本申请涉及一种用于食品、药品或保健品的安全检测的方法,包括:
1)将食品用真核生物、药品用真核生物或保健品用真核生物用作待鉴定物种,按照上文所述的物种鉴定方法筛选得到特异性靶标序列;
2)获得待检测的食品、药品或保健品的基因组DNA,并检测所述基因组DNA中是否含有所述特异性靶标序列,从而确定所述真核生物样品与所述待鉴定物种的同一性。通过这一检测,可以发现假冒伪劣的生物物种来源的食品、药品及保健品,从而保证食品、药品及保健品安全。
本申请涉及一种物种特异性靶标序列,其为:
用于冬虫夏草的物种鉴定的物种特异性靶标序列,所述序列为如SEQ ID NO:1所示的核苷酸序列;
用于药用大黄的物种鉴定的物种特异性靶标序列,所述序列为如SEQ ID NO:2所示的核苷酸序列;或者
用于马鹿的物种鉴定的物种特异性靶标序列,所述序列为如SEQ ID NO:3所示的核苷酸序列。
本申请涉及一种用于对真核生物的物种特异性靶标序列进行扩增的引物对,包括:
所述真核生物为药用大黄,所述引物对为Ro_1F:5’-CCAAATTGCCCGAAGCCTATG-3’(SEQ ID NO:6)和Ro_1R:5’-ATCGCTTTCCGACCCACAAT-3’(SEQ ID NO:7);或者
所述真核生物为马鹿,所述引物对为Ce_17F:5’-AGCAGAAGTGATGGTTGCTG-3’(SEQID NO:8)和Ce_17R:5’-AAGAATCCTAGGAAGAACTGGT-3’(SEQ ID NO:9)。
采用本文所述的方法进行物种鉴定时,能够区分待鉴定物种与其近缘物种,从而准确实现真核生物在物种水平上的准确鉴定。该方法可以在包括中药材混伪品鉴定、食品安全、药品及保健品安全方面能够发挥出积极的作用。所述方法特异性强、灵敏度高、重复性好、可不需要依靠大型专业仪器来实现生物样品的物种的快速鉴定,因此可具有广阔的应用前景。
以下将结合附图对本申请的示例性方案进行进一步说明,以说明本申请的方案的目的、技术特征和技术效果,但是本申请的方案还可具有其它未描述的特征、优点等。
附图说明
为了更清楚地说明本公开或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,以下附图仅仅是本公开的示例,本申请的保护范围不限于此。
图1为示出了本公开的GA法的示例性的流程图。
图2为示出了来自真菌界、动物界、植物界的不同的待鉴定物种的候选靶标序列相关信息的表格。
图3示出了冬虫夏草、药用大黄、马鹿的特异性靶标序列以及各特异性靶标序列匹配的crRNA。
图4为待鉴定物种的特异性靶标序列的特异性分析图。
图5示出了冬虫夏草样品(子图A)、药用大黄样品(子图B)和马鹿样品(子图C)与其混伪品的荧光检测结果。
图6示出了马鹿与其混伪品驯鹿的测序检测结果。
具体实施方式
下面通过实施例对本申请进行详细描述,但并不意味着存在对本申请而言任何不利的限制。本文已经详细地描述了本申请,其中也公开了其具体实施例方式,对本领域的技术人员而言,在不脱离本申请精神和范围的情况下针对本申请具体实施方式进行各种变化和改进将是显而易见的。
除非另外定义,否则本文使用的技术和科学术语具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。参见如Singleton等,Dictionary of Microbiologyand Molecular Biology 2nd ed.,J.Wiley&Sons(New York,NY 1994);Sambrook等,Molecular Cloning,A Laboratory Manual,Cold Springs Harbor Press(Cold SpringsHarbor,NY 1989);Current Protocols in Molecular Biology or Current Protocolsin Immunology,John Wiley&Sons,New York,N.Y.(2009);Perbal,A Practical Guide toMolecular Cloning(1984)。
在本文中,除非上下文另有明确指示,术语“或”意在包括“和”,反之亦然。在本文中,除非另有说明,否则单数术语涵盖复数指代物,反之亦然。
在本文中,除非另有说明,术语“包含、包括和含有(comprise、comprises和comprising)”或其等同物(例如contain、containing、include、including)为开放式表述,应理解为“包括但不限于”,意味着除所列出的要素、组分和步骤外,还可涵盖其它未指明的要素、组分和步骤。
在本文中,除非另有说明,术语“全基因组”不仅涵盖生物的整个基因组序列,而且还涵盖了细胞器基因组(例如叶绿体基因组)。
实施例
图1示出本申请的GA法的示例性的流程图,下面结合冬虫夏草、药用大黄、马鹿的鉴定过程,通过实施例进一步阐述GA方法,但是本申请的范围不限于此。
下列实施例中未注明具体条件的实验方法,均按照常规条件实施。除非另外说明,下述实施例中所用试剂、材料或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
实施例1:构建冬虫夏草(Ophiocordyceos sinensis)的小片段基因组文库并从中获得广泛候选靶标序列
1.1构建冬虫夏草的小片段基因组文库
从NCBI数据库(https://www.ncbi.nlm.nih.gov)中下载用作待鉴定物种的冬虫夏草的全基因组数据(版本号:GCA_002077885.1),将冬虫夏草的全基因组序列用Jellyfish(v1.1.12)分成(L-25+1,L=全基因组序列长度)个长度为25bp的片段,构建冬虫夏草的小片段基因组文库。
1.2获取广泛候选靶标序列
从上述构建的冬虫夏草的小片段基因组文库中提取带有PAM的序列(所述PAM的5’端带有TTTV(SEQ ID NO:10)或3’端带有VAAA(SEQ ID NO:11))。其中,从冬虫夏草的全基因组序列中筛选到3,432,386个带有PAM的候选靶标序列,去重后获得1,385,096个带有PAM的广泛候选靶标序列。
实施例2:筛选用于物种鉴定的冬虫夏草的特异性靶标序列
2.1筛选特异性靶标序列
本文中,在待鉴定物种的基因组范围内筛选靶标序列,优先考虑在种内保守性高、种间差异性强的区域筛选靶标序列,所述靶标序列与近缘物种的对应序列存在3个及以上的碱基错配,如果同时存在满足前述条件的多个靶标序列,优先选择拷贝数更多的一条或多条靶标序列。
具体筛选步骤如下:(1)数据准备:从NCBI数据库(https://www.ncbi.nlm.nih.gov)下载所有已公布的冬虫夏草基因组序列及其混伪品蛹虫草的基因组序列;(2)冬虫夏草初步候选靶标序列筛选:使用Bowtie(v1.1.0)将实施例1中得到的广泛候选靶标序列与数据库下载的所有已公布的冬虫夏草基因组序列进行比对,从所述广泛候选靶标序列中筛选能够与所有已公布的冬虫夏草基因组序列完全匹配的序列,构建冬虫夏草初步候选靶标序列库;(3)冬虫夏草种间特异性候选靶标序列筛选:使用Bowtie(v1.1.0)将(2)中得到的初步候选靶标序列库与混伪品蛹虫草的基因组序列进行比对,从所述初步候选靶标序列库中筛选出与混伪品不存在3个以内碱基错配的一条序列作为特异性靶标序列。
将上述得到的特异性靶标序命名为Os_target(SEQ ID NO:1),如图3中所示。特异性靶标序列在混伪品中的特异性分析结果在图4中示出。
2.2设计与特异性靶标序列匹配的crRNA
根据后续实验采用的基因组编辑系统(CRISPR/Cas12a系统)以及crRNA设计原则,设计匹配Os_target的crRNA,命名为Os_crRNA(SEQ ID NO:13),如图3所示。
实施例3:GA鉴定冬虫夏草
为了确定实施例2筛选出的待鉴定物种的特异性靶标序列是否能够特异性地、准确地反映出待检测样品与待鉴定物种的同一性,接下来基于冬虫夏草样品和蛹虫草样品各自的基因组DNA以及二者的混合物进行样品的物种鉴定。
3.1冬虫夏草样品和蛹虫草样品的基因组DNA提取及扩增
取冬虫夏草样品(采集自北京),加入液氮充分研磨为粉末,然后分别按照TIANGEN公司提供的试剂盒使用说明书采用TIANamp Genomic DNA kit提取各样品的总DNA。通过0.8%琼脂糖凝胶电泳检测所得到的各样品总DNA的完整性,然后用Nanodrop 2000C分光光度计检测其纯度和浓度。
同时,按照上述步骤提取蛹虫草样品的基因组DNA,并通过0.8%琼脂糖凝胶电泳检测所得到的各样品总DNA的完整性。
因冬虫夏草靶标序列位于其基因组的ITS区域,采用该区域的通用引物进行实验;为了提高反应的稳定性,可以采取包括但不仅限于在引物两端进行硫代修饰的操作,具体序列信息如下:
ITS4F:5'-G*G*AAGTAAAAGTCGTAACAA*G*G-3'(SEQ ID NO:4);
ITS5R:5'-T*C*CTCCGCTTATTGATAT*G*C-3'(SEQ ID NO:5)。
3.2基于基因组编辑技术对待检测样品进行物种鉴定
分别设置Os组(冬虫夏草样品组)、Cm组(蛹虫草样品组)、Os+Cm组(冬虫夏草样品+蛹虫草样品组)和CK(空白对照)组。
在用于物种鉴定的如下的反应体系中,使用Os_crRNA作为crRNA,并且对于待检测的各样品组,以上述提取得到的各组中的样品(冬虫夏草、蛹虫草或二者的混合)的基因组DNA作为DNA底物。使用NEB公司的EnGen Lba Cas12a(Cpf1)进行实验,反应体系总体积为100μL:10μL 10×NEBuffer2.1、2μL Lba Cas12a(20nM)、3.3μL crRNA(300nM)、3μL DNA底物(10ng/μL)、47μL ERA扩增试剂、4μL Poly_C_FQ(400nM)和30.7μLnuclease-free H2O。
在1.5ml离心管管底先加入上述反应体系中的ERA扩增试剂和DNA底物;在管盖内侧加入NEBuffer 2.1、Lba Cas12a、Os_crRNA和nuclease-free H2O并在40℃下孵育20分钟,之后迅速通过简易离心或者重力作用将管盖中的试剂转移至管底,然后在37℃继续孵育10分钟;随后加入Poly_C_FQ,在37℃孵育并在0、3、6、9、12、15、25、35、45、60分钟时用酶标仪在λex 483nm/λem 535nm分别检测荧光。
图5中的子图A示出了上述各待检测的样品组的荧光测定结果。如子图A所示,Os组产生了荧光信号,荧光值在25分钟达到最大并保持,与CK组存在统计学上显著的差异(P<0.01)。而Cm组与CK组一致,都没有荧光信号产生,荧光值与CK组无显著性差异(P>0.01)。同时,混合样品组(即,Os+Cm组),由于包含冬虫夏草样品也能够产生较强的荧光信号,荧光值与CK组存在统计学上显著的差异(P<0.01)。由此可以看出,本发明所述的方法能够特异性地、准确地反映出待检测样品与待鉴定物种是否具有同一性。
实施例4:构建药用大黄(Rheum officinale)的小片段基因组文库并从中获得广泛候选靶标序列
4.1构建药用大黄的小片段基因组文库
从NCBI数据库中下载用作待鉴定物种的药用大黄的叶绿体基因组数据(版本号:MZ998517),将药用大黄的叶绿体基因组序列用Jellyfish(v1.1.12)分成(L-25+1,L=叶绿体基因组序列长度)个长度为25bp的片段,构建药用大黄的小片段基因组文库。
4.2获取广泛候选靶标序列
从上述构建的药用大黄的小片段基因组文库中提取带有PAM的序列(所述PAM的5’端带有TTTV(SEQ ID NO:10)或3’端带有VAAA(SEQ ID NO:11))。其中,从药用大黄的全基因组序列中筛选到7,995个带有PAM的候选靶标序列,去重后获得6,685个带有PAM的广泛候选靶标序列。
实施例5:筛选用于物种鉴定的药用大黄的特异性靶标序列
5.1筛选特异性靶标序列
(1)数据准备:从NCBI数据库下载所有已公布的药用大黄的叶绿体基因组序列及其混伪品掌叶大黄的叶绿体基因组序列;(2)药用大黄初步候选靶标序列筛选:使用Bowtie(v1.1.0)将实施例4中得到的广泛候选靶标序列与数据库下载的所有已公布的药用大黄的叶绿体基因组序列进行比对,从所述广泛候选靶标序列中筛选能够与所有已公布的药用大黄的叶绿体基因组序列完全匹配的序列,构建药用大黄初步候选靶标序列库;(3)药用大黄种间特异性候选靶标序列筛选:使用Bowtie(v1.1.0)将(2)中得到的初步候选靶标序列库与混伪品掌叶大黄的叶绿体基因组序列进行比对,从所述初步候选靶标序列库中筛选出与混伪品不存在3个以内碱基错配的一条序列作为特异性靶标序列。
将上述得到的特异性靶标序命名为Ro_target(SEQ ID NO:2),如图3中所示。特异性靶标序列在混伪品中的特异性分析结果在图4中所示。
5.2设计与特异性靶标序列匹配的crRNA
根据后续实验采用的基因组编辑系统(CRISPR/Cas12a系统)以及crRNA设计原则,设计匹配Ro_target的crRNA,命名为Ro_crRNA(SEQ ID NO:14),如图3所示。
实施例6:GA鉴定药用大黄
为了确定实施例5筛选出的待鉴定物种的特异性靶标序列是否能够特异性地、准确地反映出待检测样品与待鉴定物种的同一性,接下来基于药用大黄样品和掌叶大黄样品各自的基因组DNA以及二者的混合物进行样品的物种鉴定。
6.1药用大黄样品和掌叶大黄样品的基因组DNA提取
按照实施例3所述的方法,提取得到药用大黄样品(采集自四川冕宁)和掌叶大黄样品的基因组DNA。
基于实施例5获得的药用大黄的特异性靶标序列,设计特异性引物,具体序列信息如下:
Ro_1F:5’-CCAAATTGCCCGAAGCCTATG-3’(SEQ ID NO:6);
Ro_1R:5’-ATCGCTTTCCGACCCACAAT-3’(SEQ ID NO:7)。
6.2基于基因组编辑技术对待检测样品进行物种鉴定
分别设置Ro组(药用大黄样品组)、Rp组(掌叶大黄样品组)、Ro+Rp组(药用大黄样品+掌叶大黄样品组)和CK(空白对照)组。在用于物种鉴定的如下的反应体系中,使用Ro_crRNA作为crRNA,并且对于待检测的各样品组,以上述提取得到的各组中的样品(药用大黄样品、掌叶大黄样品或二者的混合)的基因组DNA作为DNA底物。
按照实施例3的“3.2基于基因组编辑技术对待检测样品进行物种鉴定”部分描述的操作步骤和反应条件进行上述样品的物种鉴定。
图5中的子图B示出了上述各待检测的样品组的荧光测定结果。如子图B所示,Ro组产生了荧光信号,荧光值在25分钟达到最大并保持,与CK组存在统计学上显著的差异(P<0.01)。而Rp组与CK组一致,都没有荧光信号产生,荧光值与CK组无显著性差异(P>0.01)。同时,混合样品组(即,Ro+Rp组),由于包含药用大黄样品也能够产生较强的荧光信号,荧光值与CK组存在统计学上显著的差异(P<0.01)。由此可以看出,本发明所述的方法能够特异性地、准确地反映出待检测样品与待鉴定物种是否具有同一性。
实施例7:构建马鹿(Cervus elaphus)的小片段基因组文库并从中获得广泛候选靶标序列
7.1构建马鹿的小片段基因组文库
从NCBI数据库中下载用作待鉴定物种的马鹿的全基因组数据(版本号:GCA_910594005.1),将马鹿的全基因组序列用Jellyfish(v1.1.12)分成(L-25+1,L=全基因组序列长度)个长度为25bp的片段,构建马鹿的小片段基因组文库。
7.2获取广泛候选靶标序列
从上述构建的马鹿的小片段基因组文库中提取带有PAM的序列(所述PAM的5’端带有TTTV(SEQ ID NO:10)或3’端带有VAAA(SEQ ID NO:11))。其中,从马鹿的全基因组序列中筛选到121,153,505个带有PAM的候选靶标序列,去重后获得94,378,541个带有PAM的广泛候选靶标序列。
实施例8:筛选用于物种鉴定的马鹿的特异性靶标序列
8.1筛选特异性靶标序列
(1)数据准备:从NCBI数据库下载所有已公布的马鹿基因组序列及其混伪品驯鹿的基因组序列;(2)马鹿初步候选靶标序列筛选:使用Bowtie(v1.1.0)将实施例7中得到的广泛候选靶标序列与数据库下载的所有已公布的马鹿基因组序列进行比对,从所述广泛候选靶标序列中筛选能够与所有已公布的马鹿基因组序列完全匹配的序列,构建马鹿初步候选靶标序列库;(3)马鹿种间特异性候选靶标序列筛选:使用Bowtie(v1.1.0)将(2)中得到的初步候选靶标序列与混伪品驯鹿的基因组序列进行比对,从所述初步候选靶标序列库中筛选出与混伪品不存在3个以内碱基错配的一条序列作为特异性靶标序列。
将上述得到的特异性靶标序命名为Ce_target(SEQ ID NO:3),如图3中所示。特异性靶标序列在混伪品中的特异性分析结果在图4中所示。
8.2设计与特异性靶标序列匹配的crRNA
根据后续实验采用的基因组编辑系统(CRISPR/Cas12a系统)以及crRNA设计原则,设计匹配Ce_target的crRNA,命名为Ce_crRNA(SEQ ID NO:15),如图3所示。
实施例9:GA鉴定马鹿
为了确定实施例8筛选出的待鉴定物种的特异性靶标序列是否能够特异性地、准确地反映出待检测样品与待鉴定物种的同一性,接下来基于马鹿样品和驯鹿样品各自的基因组DNA以及二者的混合物进行样品的物种鉴定。
9.1马鹿样品和驯鹿样品的基因组DNA提取
按照实施例3所述的方法,提取得到马鹿样品(马鹿肉,采集自辽宁抚顺)和驯鹿样品(驯鹿肉)的基因组DNA。
基于实施例8获得的马鹿的特异性靶标序列,设计特异性引物,为了提高反应的稳定性,可以采取包括但不仅限于在引物两端进行硫代修饰的操作,具体序列信息如下:
Ce_17F:5’-A*G*CAGAAGTGATGGTTGC*T*G-3’(SEQ ID NO:8);
Ce_17R:5’-A*A*GAATCCTAGGAAGAACTG*G*T-3’(SEQ ID NO:9)。
9.3采用基因组编辑技术基于特异性靶标序列进行样品的检测
分别设置Ce组(马鹿样品组)、Rt组(驯鹿样品组)、Ce+Rt组(马鹿样品+驯鹿样品组)和CK(空白对照)组。在用于物种鉴定的如下的反应体系中,使用Ce_crRNA作为crRNA,并且对于待检测的各样品组,以上述提取得到的各组中的样品(马鹿样品、驯鹿样品或二者的混合)的基因组DNA作为DNA底物。
按照实施例3的“3.2采用基因组编辑技术基于特异性靶标序列进行样品的检测”部分描述的操作步骤和反应条件进行上述样品的物种鉴定。
图5中的子图C示出了上述各待检测的样品组的荧光测定结果。如子图C所示,Ce组产生了荧光信号,荧光值在25分钟达到最大并保持,与CK组存在统计学上显著的差异(P<0.01)。而Rt组与CK组一致,都没有荧光信号产生,荧光值与CK组无显著性差异(P>0.01)。同时,混合样品组(即,Ce+Rt组),由于包含马鹿样品也能够产生较强的荧光信号,荧光值与CK组存在统计学上显著的差异(P<0.01)。由此可以看出,本发明所述的方法能够特异性地、准确地反映出待检测样品与待鉴定物种是否具有同一性。
实施例10:基于测序技术对马鹿和驯鹿样品进行物种鉴定
为了示例性地说明可以采用多种不同的序列检测技术手段对真核生物样品进行物种鉴定,基于实施例8得到的马鹿的特异性靶标序列,采用引物对Ce_17F和Ce_17R(SEQID NO:8和SEQ ID NO:9)对实施例9中得到的待检测的马鹿样品和驯鹿样品的基因组DNA进行特异性扩增,对扩增后产物进行测序。结果显示,当待检测样品与待鉴定物种一致时,可在测序结果中得到包含所述特异性靶标序列的序列,当待检测样品与待鉴定物种不一致时,则在扩增产物的测序结果中不能找到该特异性靶标序列,如图6所示。由此可以看出,本发明所述方法能够特异性地、准确地反映出待检测样品与待鉴定物种是否具有同一性。
根据上述实施例3、6、9和10的结果可知,本申请所述的方法能够准确地对含有冬虫夏草样品(真菌)、药用大黄样品(植物)和马鹿样品(动物)的各组样品进行物种鉴定,并能够用于将药材正品(即,冬虫夏草、药用大黄和马鹿)与其各自的常见混伪品(即,分别为蛹虫草、掌叶大黄和驯鹿)明确地区别开。
所属领域的普通技术人员应当理解,以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的保护范围被限于这些实施例;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本公开实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。本公开实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本公开实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
为了描述和公开的目的,以引用的方式将所有的专利、专利申请和其它出版物在此明确地并入本文。这些出版物仅因为它们的公开早于本申请的申请日而提供。所有关于这些文件的日期的声明或这些文件的内容的表述是基于申请者可得的信息,并且不构成任何关于这些文件的日期或这些文件的内容的正确性的承认。而且,在任何国家,在本中对这些出版物的任何引用并不构成关于该出版物成为本领域的公知常识的一部分的认可。
序列表
<110> 中国医学科学院药用植物研究所
<120> 基于全基因组分析的真核生物物种鉴定方法及应用
<130> SPIC228032
<160> 17
<170> PatentIn version 3.5
<210> 1
<211> 25
<212> DNA
<213> 冬虫夏草(Ophiocordyceos sinensis)
<400> 1
tttgggagtg gtgactcgat aatga 25
<210> 2
<211> 25
<212> DNA
<213> 药用大黄(Rheum officinale)
<400> 2
aatatggtta tgttatatta ataaa 25
<210> 3
<211> 25
<212> DNA
<213> 马鹿(Cervus elaphus)
<400> 3
tttatgcacc tgatgatttt ctacg 25
<210> 4
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 冬虫夏草的特异性靶标序列的正向扩增引物
<400> 4
ggaagtaaaa gtcgtaacaa gg 22
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 冬虫夏草的特异性靶标序列的反向扩增引物
<400> 5
tcctccgctt attgatatgc 20
<210> 6
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 药用大黄的特异性靶标序列的正向扩增引物
<400> 6
ccaaattgcc cgaagcctat g 21
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 药用大黄的特异性靶标序列的反向扩增引物
<400> 7
atcgctttcc gacccacaat 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 马鹿的特异性靶标序列的正向扩增引物
<400> 8
agcagaagtg atggttgctg 20
<210> 9
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 马鹿的特异性靶标序列的反向扩增引物
<400> 9
aagaatccta ggaagaactg gt 22
<210> 10
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PAM的5'端氨基酸序列
<400> 10
Thr Thr Thr Val
1
<210> 11
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PAM的3'端氨基酸序列
<400> 11
Val Ala Ala Ala
1
<210> 12
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Poly(C)
<400> 12
cccccccccc 10
<210> 13
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Os_crRNA
<400> 13
uaauuucuac uaaguguaga uggaguggug acucgauaau ga 42
<210> 14
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Ro_crRNA
<400> 14
uaauuucuac uaaguguaga uaauaaucga uucgaucaaa au 42
<210> 15
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Ce_crRNA
<400> 15
uaauuucuac uaaguguaga uugcaccuga ugauuuucua cg 42
<210> 16
<211> 371
<212> DNA
<213> 马鹿(Cervus elaphus)
<400> 16
gaagtgatgg ttgctgaggg cagattgaag tttacaggtg atatttagaa tctactgtca 60
aaacttgggg cgggctgggg ccaggattga caaggaagtt taaaacactt gccaactaga 120
attttaacat ctcaggagga ctgctaaatt agcagagaga tttttcaccc agatctcatt 180
accaggccta ttaaaacaat ccccgttgca cactgtacta cgcattacgt agaaaatcat 240
caggtgcata aaggtgtacc ttgtttcata attaggggga gatgcatagt ccagctacca 300
tgaaagagct aatggcatat ttctttgggg cttttcctca tctttaatta aagatactta 360
ccataataaa t 371
<210> 17
<211> 403
<212> DNA
<213> 驯鹿(Rangifer tarandus)
<400> 17
tagcagaagt gatggttgct gagggcagat tgaagtttac aggtgatatt tagaatcgac 60
tgtcagaact tggggcaggc tggggccagg attgacgagg aagtttaaaa cacttgccaa 120
ctagaatttt aacatctcag gaggactgct aaattagcag agagattttt cacccagatc 180
tcattaccag gcctgttaaa acaatccccg ttgcacactg tactatgcat tacctagaag 240
gttgtcaggt gcataaaggt gtaccgtgtt tcataattag ggggagatgc atcggccagc 300
taccatgaaa gagctgatgg catatttctt cggggctttt cctcatcttt aattaaaaat 360
acttaccata ataaatggga ccagttcttc ctaggattct taa 403

Claims (11)

1.一种基于全基因组分析的真核生物物种鉴定方法,包括:
i)基于待鉴定物种的全基因组序列,将所述待鉴定物种的全基因组序列分成L-K+1个长度为K的片段以构建小片段基因组文库,并计算其中的每个片段的拷贝数,再通过将各片段与所述全基因组序列比对确定每个片段的基因组位置,其中L表示全基因组序列长度,K表示所述文库中的片段长度;
ii)对所述小片段基因组文库中的每一个片段检测PAM基序,并提取带有PAM的序列构建所述广泛候选靶标序列库,获得广泛候选靶标序列库;其中,所述PAM是5'端带有如SEQID NO:10所示的氨基酸序列或3'端带有如SEQ ID NO:11所示的氨基酸序列的PAM;
iii)基于所述待鉴定物种的近缘物种的全基因组序列,将所述广泛候选靶标序列库中的序列与所述近缘物种的全基因组序列进行比对,在种内保守性高且种间差异性大区域内选择仅存在于所述待鉴定物种中的多个不同的序列来构建特异性靶标序列库;
iv)获得待检测的真核生物样品的基因组DNA并基于所述特异性靶标序列库中的序列对所述真核生物样品进行物种鉴定,采用CRISPR/Cas12a基因编辑系统对所述基因组DNA检测是否含有所述特异性靶标序列库中的序列,从而确定所述真核生物样品与所述待鉴定物种的同一性;其中,进行所述检测之前,基于所述CRISPR/Cas12a基因编辑系统,预先构建与所述特异性靶标序列相匹配的crRNA。
2.如权利要求1所述的方法,其特征在于,在i)和iv)中,所述待鉴定物种或所述待检测的真核生物样品来自动物、植物或真菌。
3.如权利要求1所述的方法,其特征在于,所述仅存在于所述待鉴定物种中的多个不同的序列为与所述近缘物种的全基因组序列存在至少n个碱基差异的候选靶标序列,其中n大于等于3。
4.如权利要求2所述的方法,其特征在于,所述待检测的真核生物生物样品是单一物种来源的样品或者是多种物种来源的样品的混合物。
5.如权利要求4所述的方法,其特征在于,所述待检测的真核生物样品是来自冬虫夏草、蛹虫草、药用大黄、掌叶大黄、马鹿或驯鹿的样品。
6.如权利要求1或2所述的方法,其特征在于,所述待鉴定物种为冬虫夏草,所述特异性靶标序列为如SEQ ID NO:1所示的核苷酸序列,与所述特异性靶标序列相匹配的crRNA如SEQ ID NO:13所示。
7.如权利要求1或2所述的方法,其特征在于,所述待鉴定物种为药用大黄,所述特异性靶标序列为如SEQ ID NO:2所示的核苷酸序列,与所述特异性靶标序列相匹配的crRNA如SEQ ID NO:14所示。
8.如权利要求1或2所述的方法,其特征在于,所述待鉴定物种为马鹿,所述特异性靶标序列为如SEQ ID NO:3所示的核苷酸序列,与所述特异性靶标序列相匹配的crRNA如SEQ IDNO:15所示。
9.一种构建用于真核生物物种鉴定的特异性靶标序列库的方法,包括:
a)选择待鉴定物种,按照权利要求1-5中任一项所述的物种鉴定方法筛选得到所述待鉴定物种的1个或多个特异性靶标序列;
b)将所述待鉴定物种的1个或多个特异性靶标序列组合,构建所述特异性靶标序列库。
10.一种构建用于对真核生物物种鉴定的特异性靶标序列进行检测的工具库的方法,包括:
A)选择待鉴定物种,按照权利要求9所述的方法构建特异性靶标序列库;
B)基于用于所述检测的技术,构建与所述特异性靶标序列相匹配的工具库;
其中,用于所述检测的技术为用CRISPR/Cas12a基因编辑,所述工具库为crRNA库。
11.一种区分中药材与其相应混伪品的方法,包括:
I)将所述中药材或混伪品用作待鉴定物种,按照权利要求1-5中任一项所述的方法筛选得到特异性靶标序列;
II)获得待检测的药材样品的基因组DNA,并基于CRISPR/Cas12a基因编辑系统检测所述基因组DNA中是否含有所述特异性靶标序列,从而确定所述待检测的药材样品与所述中药材或混伪品的同一性。
CN202280002592.3A 2022-03-30 2022-03-30 基于全基因组分析的真核生物物种鉴定方法及应用 Active CN115087750B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/083950 WO2023024508A1 (zh) 2022-03-30 2022-03-30 基于全基因组分析的真核生物物种鉴定方法及应用

Publications (2)

Publication Number Publication Date
CN115087750A CN115087750A (zh) 2022-09-20
CN115087750B true CN115087750B (zh) 2023-05-02

Family

ID=83243953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280002592.3A Active CN115087750B (zh) 2022-03-30 2022-03-30 基于全基因组分析的真核生物物种鉴定方法及应用

Country Status (4)

Country Link
KR (1) KR20240046529A (zh)
CN (1) CN115087750B (zh)
WO (1) WO2023024508A1 (zh)
ZA (1) ZA202306611B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117778586A (zh) * 2023-01-10 2024-03-29 中国医学科学院药用植物研究所 基于时珍法鉴定鹿科动物的物种特异性靶标序列、试剂盒及应用
CN116426671B (zh) * 2023-03-03 2024-05-10 中国医学科学院药用植物研究所 基于时珍法的中药鉴定方法及应用
CN116287416B (zh) * 2023-04-06 2024-03-15 中国医学科学院药用植物研究所 基于时珍法的真菌物种鉴定方法、靶标核苷酸、引物对、试剂盒及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108753994A (zh) * 2018-06-27 2018-11-06 四川农业大学 一种基于转录组的准确高效的真核生物基因鉴定方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2889381A1 (en) * 2013-12-27 2015-07-01 Universite De Liege Detection method for species specific identification of nucleic acid of interest
CN104946730B (zh) * 2014-03-28 2020-06-19 中国中医科学院中药研究所 鉴定鹿茸的pcr特异引物及其检测方法
CN104830970A (zh) * 2015-03-17 2015-08-12 中国医学科学院药用植物研究所 一种冬虫夏草分子身份证及鉴定方法
CN106446597B (zh) * 2016-09-06 2018-11-23 清华大学 多物种特征选择及鉴定未知基因的方法
CN109680053A (zh) * 2018-12-12 2019-04-26 广州普世利华科技有限公司 新型SsCas12a蛋白在核酸检测方面的应用
CN110982888B (zh) * 2019-12-31 2023-01-13 中国医学科学院药用植物研究所 一种基于全基因组测序技术的多种动物源性掺假鉴别方法
CN112080557B (zh) * 2020-08-25 2021-09-28 扬州大学 一种基于dna条形码的冬虫夏草产地鉴定方法
CN116411113A (zh) * 2021-04-09 2023-07-11 中国热带农业科学院三亚研究院 基于CRISPR Cas酶基因编辑技术的转基因成分检测方法
CN113897415B (zh) * 2021-10-21 2024-05-10 中国医学科学院药用植物研究所 一种鉴别大黄药材三个基原物种的方法与应用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108753994A (zh) * 2018-06-27 2018-11-06 四川农业大学 一种基于转录组的准确高效的真核生物基因鉴定方法

Also Published As

Publication number Publication date
KR20240046529A (ko) 2024-04-09
ZA202306611B (en) 2024-04-24
CN115087750A (zh) 2022-09-20
WO2023024508A1 (zh) 2023-03-02

Similar Documents

Publication Publication Date Title
CN115087750B (zh) 基于全基因组分析的真核生物物种鉴定方法及应用
AU2015263055B2 (en) Sequencing process
CN103725773A (zh) 鉴定宿主基因组中hbv基因整合位点和重复靶基因
CN108676920A (zh) 一种快速检测小鼠诺如病毒引物、试剂盒及其rt-rpa方法
CN113355459B (zh) 一种检测筛查新冠病毒n501y突变的方法及试剂盒
Matsumura et al. SuperSAGE: a modern platform for genome-wide quantitative transcript profiling
CN107475449A (zh) 一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法
CN108138244A (zh) 病毒组捕获测序平台、设计和构建方法以及使用方法
Peng et al. QitanTech nanopore long-read sequencing enables rapid resolution of complete genomes of multi-drug resistant pathogens
François et al. Increase in taxonomic assignment efficiency of viral reads in metagenomic studies
CN115843318B (zh) 基于全基因组分析与基因组编辑的植物物种鉴定方法与应用
CN107937567B (zh) 一组鉴定僵蚕的特异性引物及其鉴定方法
WO2012096016A1 (ja) 核酸情報処理装置およびその処理方法
CN111549107B (zh) 一种利用高通量测序进行基因分型的方法、试剂盒及应用
CN116083602B (zh) 基于时珍法鉴定鹿科动物的物种特异性靶标序列、试剂盒及应用
Hu et al. Accurate estimation of intrinsic biases for improved analysis of bulk and single-cell chromatin accessibility sequencing data using SELMA
Feschotte et al. Computational analysis and paleogenomics of interspersed repeats in eukaryotes
Qi et al. Identification of closely related species in Aspergillus through Analysis of Whole-Genome
CN106520945A (zh) 一种基于二代测序平台的无创的靶向线粒体测序方法
CN116287416B (zh) 基于时珍法的真菌物种鉴定方法、靶标核苷酸、引物对、试剂盒及其应用
CN112980974B (zh) 一种基于染色体特异探针的鼠疫耶尔森菌鉴定方法
CN115612743B (zh) Hpv整合基因组合及其在预测宫颈癌复发和转移中的用途
CN112980987B (zh) 一种乌头属分子身份证及其应用
CN107227375B (zh) 五指毛桃的rpa快速鉴定方法及鉴定用rpa引物
Binsarhan Revolutionizing Coral Research: The Power of Holo-Omics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40082773

Country of ref document: HK