KR20240046529A - 전체 게놈 분석을 기반으로 한 진핵생물의 종 식별 방법 및 이의 용도 - Google Patents

전체 게놈 분석을 기반으로 한 진핵생물의 종 식별 방법 및 이의 용도 Download PDF

Info

Publication number
KR20240046529A
KR20240046529A KR1020247007138A KR20247007138A KR20240046529A KR 20240046529 A KR20240046529 A KR 20240046529A KR 1020247007138 A KR1020247007138 A KR 1020247007138A KR 20247007138 A KR20247007138 A KR 20247007138A KR 20240046529 A KR20240046529 A KR 20240046529A
Authority
KR
South Korea
Prior art keywords
species
sequence
library
specific target
identified
Prior art date
Application number
KR1020247007138A
Other languages
English (en)
Inventor
징위안 송
구이홍 치
원지에 수
리준 하오
위통 간
티안이 신
Original Assignee
인스티튜트 오브 메디시날 플랜트 디벨롭먼트, 차이니즈 아카데미 오브 메디컬 사이언스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인스티튜트 오브 메디시날 플랜트 디벨롭먼트, 차이니즈 아카데미 오브 메디컬 사이언스 filed Critical 인스티튜트 오브 메디시날 플랜트 디벨롭먼트, 차이니즈 아카데미 오브 메디컬 사이언스
Publication of KR20240046529A publication Critical patent/KR20240046529A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 출원에서는 전체 게놈 분석을 기반으로 한 진핵생물 샘플의 종을 식별하는 방법 및 이의 용도를 개시하며, 스크리닝으로 얻은 종 특이적 표적 서열을 이용하여 검출 대상 샘플의 종 식별이 이루어진다. 본 발명의 종 식별 방법은 우수한 특이성, 고감도 및 양호한 반복성을 가지며, 대규모 전문 장비에 의존하지 않고도 신속한 종 식별을 달성할 수 있다.

Description

전체 게놈 분석을 기반으로 한 진핵생물의 종 식별 방법 및 이의 용도
본 출원은 진핵생물의 종 식별에 대한 기술분야에 관한 것으로, 구체적으로는 전체 게놈 분석에 기초한 진핵생물의 종 식별 방법 및 이의 용도에 관한 것이다.
종 식별은 인류 발달의 전체 역사에 동반하며 자연 탐사, 사회 발전 및 과학 연구와 밀접한 관련이 있다. 인류가 아직 지구상의 모든 생명체를 식별할 수는 없지만, 식별 방법의 지속적인 발전은 다른 생명체에 대한 이해와 인식을 강화시켰다. 수많은 과학 연구자들은 다양하고 널리 분포되어 있으며, 복잡하고 구별하기 어려운 종의 식별과 분류에 항상 전념해 왔다. 초기에는 형태적 특징, 화학적 조성 등과 같은 종의 표현형에 기반하여 종 식별이 주로 이루어졌으나, 표현형은 환경, 성장 단계 등의 요인에 의해 영향을 받기 때문에 종 간 차이가 발생하는 근본적인 이유를 반영하지 못한다. 이 기간 동안 지속적으로 개선된 DNA서열 분석 기술의 판독 및 정확성은 전체 게놈 수준에서 종의 서열 분석 및 분석을 용이하게 했다. 전체 게놈 데이터를 보유한 종의 수가 폭발적으로 증가함에 따라 전체 게놈 분석을 기반으로 한 종 식별 전략이 가능해졌다. 종의 모든 유전적 정보를 담고있는 전달체로서, 전체 게놈은 한 종이 다른 종과 구별되고 특이성을 나타내는 근본적인 이유를 밝혀준다. 따라서, 전체 게놈을 기반으로 한 신규 식별 방법은 종 식별에 대한 향후 발전 방향을 제시하기도 한다. 동시에 생물정보학의 급속한 발전과 분자생물학의 식별 기반은 전체 게놈 데이터를 기반으로 한 종 식별을 달성하는 데 강력한 지원를 제공해주었다. DNA 바코드 기술과 같은 분자생물학 식별 방법의 지속적인 발전으로 특정 적용 범위 내에서 사용할 수 있는 다양한 DNA 바코드가 발견되었다. 한편, 서열 분석 기술의 지속적인 반복과 컴퓨터 하드웨어 및 소프트웨어의 개발로 게놈 분석 능력도 크게 향상되었으며, 두 가지 모두 전체 게놈 수준에서 종 식별을 달성하는 데 강력한 지원을 제공한다.
유전자 편집은 생물체의 게놈을 인위적으로 변형하기 위해 사용되는 유전 공학 수단이다. 이 기술은 현재 아연 집게 뉴클레아제(zinc finger nucleases; ZFNs), 전사 활성화 인자 유사 이펙터 뉴클레아제(transcription activator-like effector nucleases; TALEN) 및 규칙적인 간격을 갖는 짧은 회문 구조 반복 단위의 배열(Clustered regularly interspaced short palindromic repeats; CRISPR)/CRISPR 연관 단백질(CRISPR/Cas)과 같은 뉴클레아제(nuclease)를 주로 사용한다. 여기서, CRISPR/Cas 시스템은 부위 특정 편집 목적을 달성하기 위해 특정 서열을 인식할 수 있는 차세대 게놈 편집 기술이다. Jennifer A. Doudna, Feng Zhang 및 Jin Wang 등은 DETECTR, SHERLOCK 및 HOLMES와 같은 방법을 연속적으로 개발하여 바이러스, 박테리아, 진핵생물의 게놈 편집에 성공적으로 적용했다. 예를 들어, 식물 생명공학 분야에서, 유전자 편집 수단은 새로운 특성을 지닌 식물 품종을 개발하기 위한 신규 육종 기술로서 식물 게놈을 조작하기 위해 주로 사용되어 왔다(예를 들어, Kangquan Yin et al., Progress and prospects in plant genome editing, Nature Plants, 3, 17107 (2017)의 기록 참고).
현재 종래 기술은 주로 특정 유전자의 기능 영역에서 특정 종을 구별할 수 있는 서열을 스크리닝하는 것이다. 스크리닝에 사용할 수 있는 유전자 데이터베이스가 작기 때문에 얻을 수 있는 표적 서열은 극히 유한하여 표적 서열의 특이성이 부족하고 오프타깃(off-target) 오류 등이 발생하기 쉬우므로 서로 다른 종의 식별을 위한 요구를 잘 충족시킬 수 없다. 특히, 특정 영역에서 극히 유사하거나 심지어 동일한 서열을 지닌 관련 종의 식별에 대한 요구를 충족시키기는 어렵다. 한 생물체의 모든 유전적 정보를 포함하는 전체 게놈은 종 식별을 위한 이상적인 데이터베이스이다. 전체 게놈 정렬을 통해 종 특이적 서열을 스크리닝하고 이를 검출하는 것은 종 식별의 향후 발전 방향이다.
이를 위해, 본 출원에서는 전체 게놈 분석을 기반으로 한 진핵생물의 종 식별 방법를 제안한다. 본 출원의 방법(이하 GA 방법이라고도 함)은 종을 정확하게 식별할 수 있는 특정 표적 서열 라이브러리를 찾기 위한 게놈 분석을 기반으로 하며, 특히 식별하려는 종과 관련 종 간의 구별을 충족시키며, 종의 정확한 식별을 달성하기 위해 게놈 편집, 서열 분석 등을 포함하되 이에 제한되지 않는 다양한 검출 수단을 사용하여 상기 특정 서열을 정확하게 식별한다. 종래 기술과 비교하여, 본 출원의 GA 방법은 생물정보학 분석 방법을 통해 대량으로 종의 전체 게놈으로부터 해당 종에만 존재하는 특정 표적 서열 라이브러리를 스크리닝하고 획득하며, 오프타깃과 같은 오류 위험성을 고려하고, 종 식별의 정확성을 개선하여 궁극적으로 진핵생물의 종 식별에 대한 정확한 판별을 달성하게 된다.
본 출원은 전체 게놈 분석을 기반으로 한 진핵생물 종 식별 방법에 관한 것으로,
i) 식별하려는 종의 전체 게놈 서열을 기반으로 한 작은 단편 게놈 라이브러리를 구축하는 단계;
ii) 상기 작은 단편 게놈 라이브러리에서 서열을 선택적으로 스크리닝하여 후속으로 검출할 필요에 기초하거나 전체 게놈 주석 파일 및 데이터베이스 등에 포함된 종 서열 정보에 따라 대규모 후보 표적 서열 라이브러리를 얻는 단계;
iii) 상기 작은 단편 게놈 라이브러리 또는 대규모 후보 표적 서열 라이브러리의 서열을 관련 종의 전체 게놈 서열과 정렬하고, 식별하려는 종에만 존재하는 서열을 선택하여 식별하려는 종의 관련 종의 전체 게놈 서열을 기반으로, 특정 표적 서열 라이브러리를 구축하는 단계;
iv) 선택된 특정 표적 서열을 기반으로 진핵생물 샘플의 종 식별을 수행하는 단계를 포함하는 방법이다. 검출 대상 진핵생물 샘플의 게놈 DNA를 획득하고, 해당 게놈 DNA가 특정 표적 서열 라이브러리의 서열을 포함하는지 여부를 검출함으로써 검출 대상 샘플과 식별하려는 종의 동일성을 결정한다. 특정 표적 서열 라이브러리의 서열이 검출된다면, 진핵생물 샘플이 식별되는 종과 동일성을 갖는 것으로 결정되며, 그 반대의 경우에는 진핵생물 샘플은 동일성이 없는 것으로 결정된다.
일부 바람직한 구현예에 있어서, i)에서는, 식별하려는 종의 전체 게놈 서열을 K길이를 갖는 (L-K+1) 단편으로 분할되어 작은 단편 게놈 라이브러리를 구축하고, 라이브러리 내 각 단편의 카피(copy) 수를 계산한 다음, 후속 단계에서 더 나은 서열 정렬을 용이하게 하기 위해 각 단편을 전체 게놈 서열과 정렬하여 각 단편의 게놈 위치를 결정하였고, 여기서 L은 전체 게놈 서열의 길이를 나타내며 K는 라이브러리 내 단편의 길이를 나타낸다.
일부 바람직한 구현예에 있어서, i)에서는, 식별하려는 종은 진핵생물의 임의의 종일 수 있다. 한 예로서, 식별하려는 종 은 각각 동물, 식물, 진균 등과 같은 다양한 생물체 계에서 파생된다.
본원에서 식별하려는 종의 전체 게놈 서열은 공지된 공개 데이터베이스로부터 또는 통상적인 방법을 통한 전체 게놈 서열 분석에 의해 얻을 수 있다.
ii)에서, 작은 단편 게놈 라이브러리의 서열을 스크리닝하여, 특정 영역에 제한되는 것이 아닌 식별하려는 종의 전체 게놈 범위에서 대규모 후보 표적 서열 추출이 가능하며, 얻어진 표적 서열이 널리 분포되어 있어 이후에 오프타깃과 같은 위험을 제거하는 데 기여한다.
일부 바람직한 구현예에 있어서, ii)에서는, 작은 단편 게놈 라이브러리의 각 단편에 대해 PAM 모티프를 검출하고, 대규모 후보 표적 서열 라이브러리를 구축하기 위해 PAM이 포함된 서열을 추출한다. 본원에서의 PAM(프로토스페이서 인접 모티프: protospacer adjacent motif)은 특정 서열의 후속 검출을 위해 사용되는 게놈 편집 시스템을 기반으로 통상의 기술자에 의해 결정될 수 있다. 예를 들어, 후속 검출을 위해 CRISPR/Cas12a 시스템을 사용하는 경우, 5' 말단의 TTTV(서열번호 10) 또는 3' 말단의 VAAA(서열번호 11)의 PAM이 선택될 수 있다.
iii)에서, 바람직하게는, 관련 종의 전체 게놈 서열과 정렬하기 전, 작은 단편 게놈 라이브러리 또는 대규모 후보 표적 서열 라이브러리의 서열은 식별하려는 종의 다수의(예를 들어, 모든) 공지된 게놈 서열과 정렬될 수 있다. 식별하려는 종의 다수 공지된 게놈 서열과 정확히 일치하는 서열은 작은 단편 게놈 라이브러리 또는 대규모 후보 표적 서열로부터 스크리닝되며, 식별하려는 종의 1차 후보 표적 서열 라이브러리가 구축된다. 이후, 1차 후보 표적 서열 라이브러리를 관련 종의 전체 게놈과 정렬하고, 특정 표적 서열 라이브러리를 구축하기 위해 식별하려는 종에만 존재하는 서열이 선별된다.
iii)에서, 종내 보존성이 높고 종간 차이가 큰 영역 내에서 식별하려는 종에만 존재하는 서열을 선택하여 특정 표적 서열 라이브러리를 구축하는 것이 바람직하다. 오프타깃 효과를 고려하면, 관련 종(예를 들어, 위화제(adulterant))의 전체 게놈 서열과 적어도 n 개의 염기 차이가 있는 서열을 선택하는 것이 바람직하며, 여기서 n≥3이다. 바람직하게는, n 값을 증가시킴으로써 표적 서열의 특이성을 더 개선시키거나 n 값을 조정함으로써 사전 정의된 개수 범위 내의 표적 서열이 스크리닝될 수 있다.
본 개시 내용에 있어서, iii)에서는, 바람직하게, 특정 표적 서열 라이브러리는 식별하려는 종에만 존재하는 다수의 서로 다른 서열을 선택하여 구축할 수 있으며, 검출 대상 샘플과 식별하려는 종의 동일성(identity)을 결정하기 위한 후속 실험에 사용된다.
본 개시 내용에 있어서, 검출 대상 진핵생물 샘플은 동물, 식물 또는 균 유래의 샘플과 같은 임의의 진핵생물 유래의 샘플일 수 있다. 한 예로, 검출 대상 진핵생물 샘플은Ophiocordyceos sinensis, Rheum officinale, Cervus elaphus, Cordyceps militaris, Rheum palmatum 또는 Rangifer tarandus 유래의 샘플일 수 있다. 일부 구현예에 있어서, 검출 대상 진핵생물 샘플은 단일 종 공급원으로부터 유래된 샘플 또는 다중 종 공급원으로부터 유래된 샘플의 혼합물이다.
일부 바람직한 구현예에 있어서, 식별하려는 종은 진균계의 Ophiocordyceos sinensis이며, iii)에서, 특정 표적 서열은 서열번호 1로 표시되는 뉴클레오티드 서열이다.
서열번호 1: TTTGGGAGTGGTGACTCGATAATGA.
일부 바람직한 구현예에 있어서, 식별하려는 종은 식물계의 Rheum officinale이며, iii)에서, 특정 표적 서열은 서열번호 2로 표시되는 뉴클레오티드 서열이다.
서열번호 2: AATATGGTTATGTTATATTAATAAA.
일부 바람직한 구현예에 있어서, 식별하려는 종은 동물계의 Cervus elaphus이며, iii)에서, 특정 표적 서열은 서열번호 3으로 표시되는 뉴클레오티드 서열이다.
서열번호 3: TTTATGCACCTGATGATTTTCTACG.
본 개시 내용에 있어서, iv)에서는, 검출과 관련하여, 특정 서열의 인식을 위해 당업계에 공지된 임의의 검출 기술/수단을 사용할 수 있다. 일부 바람직한 구현예에 있어서, iv)에서는, 검출 대상 샘플 내 특정 표적 서열이 존재하는지 여부를 결정하기 위한 검출에 유전자 편집 시스템 및 서열 분석과 같은 서열 인식 수단을 사용할 수 있다.
일부 바람직한 구현예에 있어서, iv)에서는, 검출을 더 간단하고 더 직접적으로 만들고 동시에 높은 감도를 유지하기 위해, 게놈 편집 시스템, 바람직하게는 형광 신호 분자를 포함하는CRISPR/Cas 시스템(예를 들어, CRISPR/Cas9 시스템, CRISPR/Cas12a 시스템, CRISPR/Cas12b 시스템 및 CRISPR/Cas13 시스템)이 검출에 사용된다.
본 개시 내용에 있어서, iv)에서는, 검출을 수행하기 전, 특정 표적 서열과 일치하는 툴(tool) 라이브러리(예를 들어, crRNA 라이브러리 및 프라이머 라이브러리)는 게놈 DNA의 서열 검출에 사용되는 다양한 기술(유전자 편집 기술, 서열 분석 기술 등을 포함하되 제한되지 않음)을 기반으로 하여 사전 제작되었다. 더욱 바람직한 일 구현예에 있어서, iv)에서는, 검출을 위해 게놈 편집 시스템이 사용되고, 특정 표적 서열과 일치하는 CRISPR RNA (crRNA)와 선택적 tracr RNA의 툴 라이브러리가 사전 제작되었다. 다른 바람직한 구현예에 있어서, iv)에서는, 검출을 위해 서열 분석이 사용되고, 특정 표적 서열과 일치하는 프라이머 쌍의 툴 라이브러리가 사전 제작되었다.
일부 바람직한 구현예에 있어서, 식별하려는 종은 Ophiocordyceos sinensis이며, iv)에서는, 검출을 위해 다음의 프라이머 쌍이 사용된다:
ITS4F: 5'-GGAAGTAAAAGTCGTAACAAGG-3' (서열번호 4);
ITS5R: 5'-TCCTCCGCTTATTGATATGC-3' (서열번호 5).
일부 바람직한 구현예에 있어서, 식별하려는 종은 Rheum officinale이며, iv)에서는, 검출을 위해 다음의 프라이머 쌍이 사용된다:
Ro_1F: 5'-CCAAATTGCCCGAAGCCTATG-3' (서열번호 6);
Ro_1R: 5'-ATCGCTTTCCGACCCACAAT-3' (서열번호 7).
일부 바람직한 구현예에 있어서, 식별하려는 종은 Cervus elaphus이며, iv)에서는, 검출을 위해 다음의 프라이머 쌍이 사용된다:
Ce_17F: 5'-AGCAGAAGTGATGGTTGCTG-3' (서열번호 8);
Ce_17R: 5'-AAGAATCCTAGGAAGAACTGGT-3' (서열번호 9).
더욱 바람직한 일 구현예에 있어서, 프라이머 서열의 양 말단에 티오(thio) 변형을 수행하도록 선택하여, 증폭 효율과 검출 감도를 더욱 향상시킬 수 있다.
본 개시 내용에 있어서, 한 예로서, 목표하는 게놈 편집 시스템은 적어도 상온 증폭 시약, 완충액, Cas 단백질, crRNA, 뉴클레아제가 없는 물 및 형광 신호 분자(예를 들어, ssDNA 형광 리포터 유전자)을 포함한다. 예를 들면, 검출 대상 생물학적 샘플의 게놈 DNA를 기질로 하여, 검출을 위해 상기 언급된 목표하는 게놈 편집 시스템이 사용된다. 종 특이적 표적 서열이 존재하는 것으로 식별되면 반응 시스템은 형광을 발생시킨다. 측정된 형광값과 대조군 사이에 유의미한 차이가 있는 경우, 검출 대상 샘플이 식별하려는 종과 동일성이 있는 것으로 판단하고, 그 반대의 경우, 검출 대상 샘플이 식별하려는 종과 동일성이 없는 것으로 판단한다.
본 개시 내용에 있어서, 상온 증폭 시약은 통상의 기술자가 실제 상황에 따라 선택하는 임의의 공지된 증폭 시약이면 모두 가능하며, 사용되는 게놈 편집 시스템에 따라 완충액과 Cas 단백질이 결정될 수 있다. 구체적으로, CRISPR/Cas12a 시스템을 예로 들면, ERA 증폭 시약, NEBuffer 2.1 및 Lba Cas12a (Cpf1)가 선택될 수 있으며, 형광 신호 분자 Poly_C_FQ (5'-FAM-CCCCCCCCCC(서열번호 12)-BHQ-3'가 선택될 수 있다. crRNA, 뉴클레아제가 없는 물과 검출 대상 샘플의 게놈 DNA를 첨가한 후, 튜브 바닥에서 증폭 반응을 진행하고, 튜브 캡에서는 검출 시약(NEBuffer 2.1, Lba Cas12a, crRNA 및 뉴클레아제가 없는 물)이 반응한다. 일례로, 하기 표 1에 나타낸 반응 시스템과 함께 CRISPR/Cas12a 시스템을 사용하여 검출이 수행된다. 반응 시스템을 40℃에서 20분 동안 인큐베이션한 후, 짧은 원심분리를 통해 튜브 캡의 검출 시약을 바닥에 가라앉히고, 모든 시약을 완전히 혼합하여 상온에서 10분 동안 인큐베이션한다. Poly_C_FQ (400nM) 4 μL를 상기 시스템과 혼합한 후, 37℃에서 인큐베이션하고, 마이크로플레이트 판독기를 사용하여 λex 483 nm/λem 535 nm에서 형광값을 각각 0, 3, 6, 9, 12, 15, 25, 35, 45, 60분에서 검출한다(이러한 파장은 선택된 형광 신호 분자에 따라 결정될 수 있음). 검출 결과와 대조군 사이에 유의미한 차이가 있는 경우(P<0.01), 검출 대상 샘플이 식별하려는 종과 동일성이 있는 것으로 판단할 수 있으며, 그 반대의 경우, 식별하려는 종과 동일성이 없는 것으로 판단할 수 있다.
CRISPR/Cas12a 시스템을 이용한 예시적 반응 시스템
조성 부피
ERA 증폭 시약 48μL
검출 대상 샘플의 게놈 DNA 2μL
10 Х NEBuffer 2.1 10μL
Lba Cas12a (Cpf1) 2μL(20 nM)
crRNA 3.3μL(300 nM)
뉴클레아제가 없는 물 30.7μL
Poly_C_FQ 4μL(400nM)
상기 기술된 방법은 다양한 적용 시나리오에서 진핵생물 샘플의 종 식별에 사용될 수 있으며, 이는 식별하려는 종에 대해 상기 기술된 방법을 수행하고, 형광 검출 결과를 기반으로 검출 대상 샘플과 식별하려는 종 사이의 동일성을 판단하는 것을 포함한다.
일 구현예에 있어서, 본 출원은 진핵생물 종 식별을 위한 표적 서열 라이브러리 구축에 있어서 상기 종 식별 방법의 사용에 관한 것이며, 여기서, 식별하려는 종이 선택되고, 식별하려는 종의 하나 이상의 특정 표적 서열은 상기 종 식별 방법에 따른 스크리닝에 의해 얻어지며; 표적 서열 라이브러리를 구축하기 위해 식별하려는 종의 하나 이상의 특정 표적 서열이 조합된다.
대안적으로, 본 출원은 진핵생물 종 식별을 위한 특정 표적 서열 라이브러리를 구축하는 방법에 관한 것으로,
a) 식별하려는 종을 선택하고, 상기 기술된 종 식별 방법에 따라 식별하려는 종의 하나 이상의 특정 표적 서열을 스크리닝하는 단계;
b) 식별하려는 종의 하나 이상의 특정 표적 서열을 조합하여 특정 표적 서열 라이브러리를 구축하는 단계를 포함한다.
대안적으로, 본 출원은 진핵생물 종 식별의 특정 표적 서열 검출을 위한 툴 라이브러리를 구축하는 방법에 관한 것으로,
A) 식별하려는 종을 선택하고, 상기 기술된 특정 표적 서열 라이브러리를 구축하는 방법에 따라 표적 서열 라이브러리를 구축하는 단계;
B) 검출을 위해 사용되는 기술(서열 검출 방법의 다양성에 따라, 유전자 편집, 서열 분석 기술 등이 포함될 수 있지만 이에 제한되지는 않음)을 기반으로, 특정 표적 서열(crRNA 라이브러리, 프라이드 라이브러리 등을 포함하나, 이에 제한되지는 않음)과 일치하는 툴 라이브러리를 구축하는 단계를 포함한다.
대안적으로, 본 출원은 중국 의약재를 그에 상응하는 위화제로부터 구별하는 방법에 관한 것으로,
I) 중국 의약재 또는 위화제를 식별하려는 종으로 사용하고, 상기 기술된 종 식별 방법에 따라 특정 표적 서열을 스크리닝하는 단계;
II) 검출 대상 의약 샘플의 게놈 DNA를 획득하고, 게놈 DNA가 특정 표적 서열을 포함하는지 여부를 검출하여, 검출 대상 의약 샘플이 중국 의약재 또는 위화제와 동일성이 있는지 결정하는 단계를 포함한다.
대안적으로, 본 출원은 식품, 의약품 또는 건강식품(health product)의 안전성 검출을 위한 방법에 관한 것으로,
1) 식품용 진핵생물, 의약품용 진핵생물 또는 건강식품용 진핵생물을 식별하려는 종으로 사용하고, 상기 기술된 종 식별 방법에 따라 특정 표적 서열을 스크리닝하는 단계;
2) 검출 대상 식품, 의약품 또는 건강식품의 게놈 DNA를 획득하고, 게놈 DNA가 특정 표적 서열을 포함하는지 여부를 검출하여 진핵생물 샘플과 식별하려는 종 사이의 동일성이 있는지 결정하는 단계를 포함한다. 이런 검출을 통해, 위조 및 열등 생물종에서 유래된 식품, 의약품 및 건강식품을 찾아낼 수 있으므로, 식품, 의약품 및 건강식품의 안전성이 보장될 수 있다.
본 출원은 종 특이적 표적 서열에 관한 것으로,
Ophiocordyceos sinensis의 종 식별을 위한 종 특이적 표적 서열로서, 서열번호 1에 표시된 뉴클레오티드 서열이고,
Rheum officinale의 종 식별을 위한 종 특이적 표적 서열로서, 서열번호 2에 표시된 뉴클레오티드 서열이며; 또는
Cervus elaphus의 종 식별을 위한 종 특이적 표적 서열로서, 서열번호 3에 표시된 뉴클레오티드 서열이다.
본 출원은 진핵생물의 종 특이적 표적 서열을 증폭시키기 위한 프라이머 쌍에 관한 것으로,
진핵생물이 Rheum officinale 인 경우 Ro_1F: 5'-CCAAATTGCCCGAAGCCTATG-3' (서열번호 6) 및 Ro_1R: 5'-ATCGCTTTCCGACCCACAAT-3' (서열번호 7)의 프라이머 쌍; 또는
진핵생물이 Cervus elaphus인 경우 Ce_17F: 5'-AGCAGAAGTGATGGTTGCTG-3' (서열번호 8) 및 Ce_17R: 5'-AAGAATCCTAGGAAGAACTGGT-3' (서열번호 9)의 프라이머 쌍을 포함한다.
종 식별을 위해 본원에 기술된 방법을 사용할 경우, 식별하려는 종을 관련 종으로부터 구별할 수 있어 종 수준에서 진핵생물의 정확한 식별을 정확하게 달성할 수 있다. 본 방법은 중국 의약재 위화제, 식품 안전과 의약품 및 건강 식품의 안전성의 식별에 긍정적인 역할을 할 수 있다. 본 방법은 강한 특이성, 높은 감도 및 우수한 재현성을 가지며 대규모 전문 장치에 의존하지 않고 생물학적 샘플의 신속한 종 식별을 달성할 수 있으므로 대규모 응용 전망이 있다.
이하, 본 출원의 해결방안의 목적, 기술적 특징 및 기술적 효과를 설명하기 위해 본 출원의 예시적인 구현예를 도면과 조합하여 추가로 설명하지만, 본 출원의 해결방안은 기술되지 않은 다른 특징, 장점 등을 가질 수도 있다.
본 개시 내용의 기술적 해결방안 또는 관련 기술을 보다 명확하게 설명하기 위해, 실시예나 관련 기술에 사용되는 데 필요한 도면에 대해서는 이하에서 간략하게 소개한다. 다음 도면은 본 개시 내용의 예시일 뿐이고, 본 출원의 보호 범위가 이에 한정되는 것은 아니다.
도 1은 본 개시 내용의 GA 방법을 나타내는 예시적인 흐름도이다.
도 2는 진균계, 동물계, 식물계로부터 식별되는 다양한 종의 후보 표적 서열에 관한 정보를 나타내는 표이다.
도 3은 Ophiocordyceos sinensis, Rheum officinale Cervus elaphus의 특정 표적 서열과 각 특정 표적 서열과 일치하는 crRNA를 나타낸다.
도 4는 식별하려는 종의 특정 표적 서열에 대한 특이성 분석을 나타내는 다이어그램이다.
도 5는 of Ophiocordyceos sinensis 샘플(판넬 A), Rheum officinale 샘플(판넬 B) 및 Cervus elaphus 샘플(판넬 C) 및 이들의 위화제의 형광 검출 결과를 나타낸다.
도 6은 Cervus elaphus 및 이의 위화제인 Rangifer tarandus의 서열 분석 결과를 나타낸다.
이하, 실시예를 통해 본 출원을 구체적으로 기술하나, 이는 본 출원이 불리하게 제한되는 것을 의미하지 않는다. 본 개시는 본 출원을 상세히 기술하고, 그 구체적인 구현예도 개시하였다. 통상의 기술자라면, 본 출원의 사상 및 범위를 벗어나지 않고 본 출원의 특정 구현예에 대해 다양한 변형 및 개선을 가할 수 있음이 명백할 것이다.
다르게 정의되지 않는 한, 본원에 사용된 기술 및 과학 용어는 본 개시 내용이 속하는 기술 분야의 통상의 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지며, 이는, 예를 들어, Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, NY 1994); Sambrook et al., Molecular Cloning, A Laboratory Manual, Cold Springs Harbor Press (Cold Springs Harbor, NY 1989); Current Protocols in Molecular Biology or Current Protocols in Immunology, John Wiley & Sons, New York, N.Y.(2009); Perbal, A Practical Guide to Molecular Cloning (1984)에서 볼 수 있다.
문맥상 달리 명확히 명시되지 않는 한, 본원의 "또는" 이라는 용어는 "및"을 포함하는 의미이며, 그 반대의 경우도 마찬가지이다. 달리 명시하지 않는 한, 본원에서 단수형 용어는 복수형을 포함하며, 그 반대도 마찬가지이다.
달리 명시하지 않는 한, 본원의 "포함하다(comprise, comprises)" 및 "포함하는(comprising)"이라는 용어 또는 그 등가어(예: "함유하다(contain)", "함유하는(containing)", "포함하다(include)" 및 "포함하는(including)")는 개방형 표현이며 "포함하지만 이에 제한되지 않는다"라고 이해되어야 한다. 이는 이미 나열된 것에 추가하여 특정되지 않은 다른 요소, 구성 및 단계가 포함될 수 있음을 의미한다.
달리 명시하지 않는 한, 본원에서 용어 "전체 게놈"은 생물체의 전체 게놈 서열뿐만 아니라 세포 소기관의 게놈(예: 엽록체 게놈)도 포함한다.
실시예
도 1은 본 출원의 GA 방법의 예시적인 흐름도를 나타낸다. GA 방법은 Ophiocordyceos sinensis, Rheum officinaleCervus elaphus의 식별 과정과 조합된 예를 통해 추가로 설명되지만, 본 출원의 범위는 이에 제한되지 않는다.
하기 실시예에서 특정 조건을 명시하지 않은 실험방법은 통상적인 조건에 따라 실시하였다. 달리 명시하지 않는 한, 다음 실시예에 사용되었고, 제조업체가 명시되지 않은 시약, 재료 또는 장치는 시판되는 통상적인 제품이다.
실시예 1: Ophiocordyceos sinensis의 작은 단편 게놈 라이브러리 구축 및 이로부터 대규모 후보 표적 서열 획득
1.1 Ophiocordyceos sinensis의 작은 단편 게놈 라이브러리 구축
식별하려는 종으로 사용된 Ophiocordyceos sinensis의 전체 게놈 데이터(assembly accession no.: GCA_002077885.1)는 NCBI 데이터베이스(https://www.ncbi.nlm.nih.gov)에서 다운로드하였으며, Ophiocordyceos sinensis의 작은 단편 게놈 라이브러리를 구축하기 위해 Ophiocordyceos sinensis의 전체 게놈 서열을 Jellyfish (v1.1.12)를 사용하여 25bp 길이의 단편(L-25+1, L= 전체 게놈 서열 길이)으로 분할했다.
1.2 대규모 후보 표적 서열 획득
상기 구축한 Ophiocordyceos sinensis의 작은 단편 게놈 라이브러리(PAM의 5' 말단에 TTTV(서열번호 10)가 있거나 3' 말단에 VAAA(서열번호 11)가 있음)에서 PAM이 포함된 서열을 추출했다. 여기서, Ophiocordyceos sinensis의 전체 게놈 서열로부터 PAM이 포함된 3,432,386개의 후보 표적 서열을 스크리닝했으며, 중복을 제거한 후 PAM이 포함된 1,385,096개의 대규모 후보 표적 서열을 획득했다.
실시예 2: 종 식별을 위한 Ophiocordyceos sinensis의 특정 표적 서열 스크리닝
2.1 특정 표적 서열의 스크리닝
본 개시 내용에 있어서, 식별하려는 종의 게놈 범위 내에서 표적 서열을 스크리닝했으며, 종내 보존성이 높고 종간 차이가 강한 영역에서 표적 서열을 스크리닝하는 것을 우선으로 했다. 표적 서열은 관련 종의 상응하는 서열과 3개 이상의 미스매치 염기를 가지고 있었다. 상기 언급된 조건을 동시에 만족하는 표적 서열이 여러 개인 경우, 카피수가 더 많은 하나 이상의 표적 서열이 주로 선택되었다.
구체적인 스크리닝 단계는 다음과 같다: (1) 데이터 준비: NCBI 데이터베이스(https://www.ncbi.nlm.nih.gov)로부터 공개된 모든 Ophiocordyceos sinensis의 게놈 서열과 이의 위화제인 Cordyceps militaris의 게놈 서열을 다운로드하는 단계; (2) Ophiocordyceos sinensis 1차 후보 표적 서열의 스크리닝: 실시예 1에서 얻은 대규모 후보 표적 서열을 Bowtie (v1.1.0)를 사용하여 데이터베이스에서 다운로드한 Ophiocordyceos sinensis의 공개된 모든 게놈 서열과 정렬하는 단계, 대규모 후보 표적 서열로부터 Ophiocordyceos sinensis의 공개된 모든 게놈 서열과 완전히 일치할 수 있는 서열을 스크리닝하는 단계, 및 Ophiocordyceos sinensis의 1차 후보 표적 서열 라이브러리를 구축하는 단계; (3) Ophiocordyceos sinensis의 종간 특이적 후보 서열을 스크리닝하는 단계: (2)에서 얻은 1차 후보 표적 서열 라이브러리를 Bowtie (v1.1.0)를 사용하여 위화제인Cordyceps militaris의 게놈 서열과 정렬하고, 1차 후보 표적 서열 라이브러리로부터 위화제와 3개 이하의 미스매치 염기가 없는 1개의 서열을 특정 표적 서열로 스크리닝한다.
도 3에 나타낸 바와 같이, 상기에서 얻은 특정 표적 서열을 Os_target (서열번호1)으로 명명했다. 위화제의 특정 표적 서열에 대한 구체적인 분석 결과를 도 4에 나타내었다.
2.2 특정 표적 서열과 일치하는 crRNA의 설계
후속 실험에 사용된 게놈 편집 시스템(CRISPR/Cas12a 시스템)과 crRNA 설계 원리에 따르면, 도 3에 나타낸 바와 같이, Os_target과 일치하는 crRNA를 설계하고 Os_crRNA (서열번호 13)로 명명했다.
실시예 3: GA를 통한 Ophiocordyceos sinensis의 식별
실시예 2에서 스크리닝한 식별하려는 종의 특정 표적 서열이 검출 대상 샘플과 식별하려는 종간의 동일성을 구체적이고 정확하게 반영하는지를 확인하기 위해, 각각의 Ophiocordyceos sinensisCordyceps militaris 와 이들의 혼합물의 게놈 DNA를 기반으로 샘플의 종 식별을 수행했다.
3.1 Ophiocordyceos sinensisCordyceps militaris 샘플의 게놈 DNA 추출과 증폭
Ophiocordyceos sinensis 샘플(베이징에서 수득함)을 채취하여, 액체 질소에 첨가하고 완전히 분쇄하여 분말로 만든 후 TIANamp Genomic DNA 키트를 사용하여 TIANGEN에서 제공하는 키트 설명서에 따라 각 샘플의 전체 DNA를 추출했다. 얻은 각 샘플의 전체 DNA의 무결성은 0.8% 아가로스 겔 전기영동으로 확인한 후 Nanodrop 2000C 분광 광도계를 사용하여 순도와 농도를 측정했다.
한편, 상기 단계에 따라 Cordyceps militaris 샘플의 게놈 DNA를 추출했으며, 0.8% 아가로스 겔 전기 영동을 통해 각 샘플의 전체 DNA의 무결성을 확인했다.
Ophiocordyceos sinensis의 표적 서열이 게놈의 ITS 영역에 위치하므로, 이 영역에 대한 범용 프라이머를 실험에 사용했다. 반응의 안정성을 향상시키기 위해, 프라이머 양쪽 말단에 티오(thio) 변형을 포함하되 이에 제한되지 않는 조작이 사용될 수 있으며, 이에 대한 구체적인 서열정보는 다음과 같다:
ITS4F: 5'-G*G*AAGTAAAAGTCGTAACAA*G*G-3' (서열번호 4);
ITS5R: 5'-T*C*CTCCGCTTATTGATAT*G*C-3' (서열번호 5).
3.2 게놈 편집 기술을 기반으로 한 검출 대상 샘플의 종 식별
Os군(Ophiocordyceos sinensis 샘플군), Cm군(Cordyceps militaris 샘플군), Os+Cm군(Ophiocordyceos sinensis + Cordyceps militaris 샘플군) 및 CK(대조군)을 각각 준비했다.
종 식별을 위한 다음 반응 시스템에서, crRNA로 Os_crRNA를 사용하였고, 검출 대상 각 샘플군에 대해서는, 상기에서 추출한 각 군의 샘플(Ophiocordyceos sinensis, Cordyceps militaris 또는 이들의 혼합물)의 게놈 DNA를 DNA 기질로 사용했다. 실험은 NEB의 EnGen Lba Cas12a (Cpf1)를 사용하여 수행했으며, 반응 시스템의 총 부피는 100 μL였다: 10 μL의10ХNEBuffer 2.1, 2 μL의 Lba Cas12a (20 nM), 3.3 μL의 crRNA (300 nM), 3 μL의 DNA기질(10 ng/μL), 47 μL의 ERA 증폭 시약, 4 μL의 Poly_C_FQ (400 nM) 및 30.7μL의 뉴클레아제가 없는H2O.
상기 반응 시스템의 ERA 증폭 시약과 DNA 기질을 먼저 1.5mL 원심분리 튜브 바닥에 첨가했다; NEBuffer 2.1, Lba Cas12a, Os_crRNA 및 뉴클레아제가 없는 H2O를 튜브 캡 안쪽에 첨가하고 40℃에서 20분 동안 인큐베이션한 후, 튜브 캡 안의 시약을 단순 원심분리나 중력에 의해 튜브 바닥으로 빠르게 이동시킨 후 37℃에서 10분 동안 계속 인큐베이션했다. 그런 다음, Poly_C_FQ를 첨가하고 37℃에서 인큐베이션한 후 0, 3, 6, 9, 12, 15, 25, 35, 45 및 60분에 마이크로플레이트 판독기를 사용하여 λex 483 nm/λem 535 nm에서 각각 형광을 검출했다.
도 5의 판넬 A는 검출 대상 각 샘플군의 형광 검출 결과를 나타낸다. 판넬 A에 나타낸 바와 같이, Os군은 형광 신호를 발생시켰고, 25분에 형광 값이 최대치에 도달하여 유지되었으며, 이는 CK군과 통계적으로 유의한 차이를 보였다(P<0.01). Cm군은 CK군과 일치하였으며, 두 군 모두 형광 신호를 생성하지 않았고, Cm군의 형광 값은 CK군과 유의한 차이가 없었다(P>0.01). 한편, 혼합 샘플군(즉, Os+Cm군) 역시 Ophiocordyceos sinensis 샘플을 포함하므로 강한 형광 신호를 발생시킬 수 있었으며, 이의 형광 값은 CK군과 통계적으로 유의한 차이를 보였다(P<0.01). 본 발명의 방법은 검출 대상 샘플이 식별하려는 종과의 동일성이 있는지 여부를 구체적이고 정확하게 반영할 수 있음을 알 수 있다.
실시예 4: Rheum officinale의 작은 단편 게놈 라이브러리 구축 및 이로부터 대규모 후보 표적 서열의 획득
4.1 Rheum officinale의 작은 단편 게놈 라이브러리 구축
식별하려는 종으로 사용된 Rheum officinale의 엽록체 게놈 데이터(assembly accession no.: MZ998517)는 NCBI 데이터베이스(https://www.ncbi.nlm.nih.gov)에서 다운로드하였으며, Rheum officinale의 작은 단편 게놈 라이브러리를 구축하기 위해 Rheum officinale의 엽록체 게놈 서열을 Jellyfish (v1.1.12)를 사용하여 25bp 길이의 단편(L-25+1, L= 엽록체 게놈 서열 길이)으로 분할했다.
4.2 대규모 후보 표적 서열 획득
상기 구축한 Rheum officinale의 작은 단편 게놈 라이브러리(PAM의 5' 말단에 TTTV(서열번호 10)가 있거나 3' 말단에 VAAA(서열번호 11)가 있음)에서 PAM이 포함된 서열을 추출했다. 여기서, Rheum officinale의 전체 게놈 서열로부터 PAM이 포함된 7,995개의 후보 표적 서열을 스크리닝했으며, 중복을 제거한 후 PAM이 포함된 6,685개의 대규모 후보 표적 서열을 획득했다.
실시예 5: 종 식별을 위한 Rheum officinale의 특정 표적 서열 스크리닝
5.1 특정 표적 서열의 스크리닝
(1) 데이터 준비: NCBI 데이터베이스(https://www.ncbi.nlm.nih.gov)로부터 공개된 모든 Rheum officinale의 엽록체 게놈 서열과 이의 위화제인 Rheum palmatum의 게놈 서열을 다운로드하는 단계; (2) Rheum officinale 1차 후보 표적 서열의 스크리닝: 실시예 4에서 얻은 대규모 후보 표적 서열을 Bowtie (v1.1.0)를 사용하여 데이터베이스에서 다운로드한 Rheum officinale의 공개된 모든 엽록체 게놈 서열과 정렬하는 단계, 대규모 후보 표적 서열로부터 Rheum officinale의 공개된 모든 엽록체 게놈 서열과 완전히 일치할 수 있는 서열을 스크리닝하는 단계, 및 Rheum officinale의 1차 후보 표적 서열 라이브러리를 구축하는 단계; (3) Rheum officinale의 종간 특이적 후보 서열을 스크리닝하는 단계: (2)에서 얻은 1차 후보 표적 서열 라이브러리를 Bowtie (v1.1.0)를 사용하여 위화제인 Rheum palmatum의 엽록체 게놈 서열과 정렬하고, 1차 후보 표적 서열 라이브러리로부터 위화제와 3개 이하의 미스매치 염기가 없는 1개의 서열을 특정 표적 서열로 스크리닝한다.
도 3에 나타낸 바와 같이, 상기에서 얻은 특정 표적 서열은 Ro_target (서열번호2)로 명명했다. 위화제의 특정 표적 서열에 대한 구체적인 분석 결과를 도 4에 나타내었다.
5.2 특정 표적 서열과 일치하는 crRNA의 설계
후속 실험에 사용된 게놈 편집 시스템(CRISPR/Cas12a 시스템)과 crRNA 설계 원리에 따르면, 도 3에 나타낸 바와 같이, Ro_target과 일치하는 crRNA를 설계하고 Ro_crRNA (서열번호 14)로 명명했다.
실시예 6: GA를 통한 Rheum officinale의 식별
실시예 5에서 스크리닝한 식별하려는 종의 특정 표적 서열이 검출 대상 샘플과 식별하려는 종간의 동일성을 구체적이고 정확하게 반영하는지를 확인하기 위해, 각각의 Rheum officinaleRheum palmatum과 이들의 혼합물의 게놈 DNA를 기반으로 샘플의 종 식별을 수행했다.
6.1 Rheum officinaleRheum palmatum 샘플의 게놈 DNA 추출
실시예 3에 기술된 방법에 따라, Rheum officinale 샘플(‘x닝 현, 쓰촨에서 채취)과 Rheum palmatum 샘플의 게놈 DNA를 추출했다.
실시예 5에서 얻은 Rheum officinale의 특정 표적 서열을 기반으로, 특정 프라이머를 설계했으며, 그 구체적인 서열 정보는 다음과 같다:
Ro_1F: 5'-CCAAATTGCCCGAAGCCTATG-3' (서열번호 6);
Ro_1R: 5'-ATCGCTTTCCGACCCACAAT-3' (서열번호 7).
6.2 게놈 편집 기술을 기반으로 한 검출 대상 샘플의 종 식별
Ro군(Rheum officinale샘플군), Rp군(Rheum palmatum샘플군), Ro+Rp군(Rheum officinale + Rheum palmatum 샘플군) 및 CK(대조군)을 각각 준비했다. 종 식별을 위한 다음 반응 시스템에서, crRNA로 Ro_crRNA를 사용하였고, 검출 대상 각 샘플군에 대해서는, 상기에서 추출한 각 군의 샘플(Rheum officinale 샘플, Rheum palmatum 샘플 또는 이들의 혼합물)의 게놈 DNA를 DNA 기질로 사용했다.
상기 샘플의 종 식별은 실시예 3의 "3.2 게놈 편집 기술을 기반으로 한 검출 대상 샘플의 종 식별” 항목에 기술된 조작 단계 및 반응 조건에 따라 수행했다.
도 5의 판넬 B는 검출 대상 각 샘플군의 형광 검출 결과를 나타낸다. 판넬 B에 나타낸 바와 같이, Ro군은 형광 신호를 발생시켰고, 25분에 형광 값이 최대치에 도달하여 유지되었으며, 이는 CK군과 통계적으로 유의한 차이를 보였다(P<0.01). Rp군은 CK군과 일치하였으며, 두 군 모두 형광 신호를 생성하지 않았고, Rp군의 형광 값은 CK군과 유의한 차이가 없었다(P>0.01). 한편, 혼합 샘플군(즉, Ro+Rp군) 역시 Rheum officinale 샘플을 포함하므로 강한 형광 신호를 발생시킬 수 있었으며, 이의 형광 값은 CK군과 통계적으로 유의한 차이를 보였다(P<0.01). 본 발명의 방법은 검출 대상 샘플이 식별하려는 종과의 동일성이 있는지 여부를 구체적이고 정확하게 반영할 수 있음을 알 수 있다.
실시예 7: Cervus elaphus의 작은 단편 게놈 라이브러리 구축 및 이로부터 대규모 후보 표적 서열의 획득
7.1 Cervus elaphus의 작은 단편 게놈 라이브러리 구축
식별하려는 종으로 사용된 Cervus elaphus의 전체 게놈 데이터(assembly accession no.: GCA_910594005.1)는 NCBI 데이터베이스(https://www.ncbi.nlm.nih.gov)에서 다운로드하였으며, Cervus elaphus의 작은 단편 게놈 라이브러리를 구축하기 위해 Cervus elaphus의 전체 게놈 서열을 Jellyfish (v1.1.12)를 사용하여 25bp 길이의 단편(L-25+1, L= 전체 게놈 서열 길이)으로 분할했다.
7.2 대규모 후보 표적 서열 획득
상기 구축한 Cervus elaphus의 작은 단편 게놈 라이브러리(PAM의 5' 말단에 TTTV(서열번호 10)가 있거나 3' 말단에 VAAA(서열번호 11)가 있음)에서 PAM이 포함된 서열을 추출했다. 여기서, Cervus elaphus의 전체 게놈 서열로부터 PAM이 포함된 121,153,505개의 후보 표적 서열을 스크리닝 했으며, 중복을 제거한 후 PAM이 포함된 94,378,541개의 대규모 후보 표적 서열을 획득했다.
실시예 8: 종 식별을 위한 Cervus elaphus의 특정 표적 서열 스크리닝
8.1 특정 표적 서열의 스크리닝
(1) 데이터 준비: NCBI 데이터베이스(https://www.ncbi.nlm.nih.gov)로부터 공개된 모든 Cervus elaphus의 전체 게놈 서열과 이의 위화제인 Rangifer tarandus의 게놈 서열을 다운로드하는 단계; (2) Cervus elaphus 1차 후보 표적 서열의 스크리닝: 실시예 7에서 얻은 대규모 후보 표적 서열을 Bowtie (v1.1.0)를 사용하여 데이터베이스에서 다운로드한 Cervus elaphus의 공개된 모든 전체 게놈 서열과 정렬하는 단계, 대규모 후보 표적 서열로부터 Cervus elaphus의 공개된 모든 전체 게놈 서열과 완전히 일치할 수 있는 서열을 스크리닝하는 단계, 및 Cervus elaphus의 1차 후보 표적 서열 라이브러리를 구축하는 단계; (3) Cervus elaphus의 종간 특이적 후보 서열을 스크리닝하는 단계: (2)에서 얻은 1차 후보 표적 서열 라이브러리를 Bowtie (v1.1.0)를 사용하여 위화제인 Rangifer tarandus 의 전체 게놈 서열과 정렬하고, 1차 후보 표적 서열 라이브러리로부터 위화제와 3개 이하의 미스매치 염기가 없는 1개의 서열을 특정 표적 서열로 스크리닝 한다.
도 3에 나타낸 바와 같이, 상기에서 얻은 특정 표적 서열은 Ce_target (서열번호3)로 명명했다. 위화제의 특정 표적 서열에 대한 구체적인 분석 결과를 도 4에 나타내었다.
8.2 특정 표적 서열과 일치하는 crRNA의 설계
후속 실험에 사용된 게놈 편집 시스템(CRISPR/Cas12a 시스템)과 crRNA 설계 원리에 따르면, 도 3에 나타낸 바와 같이, Ce_target과 일치하는 crRNA를 설계하고 Ce_crRNA (서열번호 15)로 명명했다.
실시예 9: GA를 통한 Cervus elaphus의 식별
실시예 8에서 스크리닝한 식별하려는 종의 특정 표적 서열이 검출 대상 샘플과 식별하려는 종간의 동일성을 구체적이고 정확하게 반영하는지를 확인하기 위해, 각각의 Cervus elaphusRangifer tarandus과 이들의 혼합물의 게놈 DNA를 기반으로 샘플의 종 식별을 수행했다.
9.1 Cervus elaphusRangifer tarandus샘플의 게놈 DNA 추출
실시예 3에 기술된 방법에 따라, Cervus elaphus샘플(리아오성 푸순에서 채취한 Cervus elaphus 육류)과 Rangifer tarandus 샘플(Rangifer tarandus 육류)의 게놈 DNA를 추출했다.
실시예 8에서 얻은 Cervus elaphus의 특정 표적 서열을 기반으로, 특정 프라이머를 설계했다. 반응의 안정성을 향상시키기 위해, 프라이머 양쪽 말단에 티오(thio) 변형을 포함하되 이에 제한되지 않는 조작을 사용할 수 있으며, 이에 대한 구체적인 서열정보는 다음과 같다:
Ce_17F: 5'-A*G*CAGAAGTGATGGTTGC*T*G-3' (서열번호 8);
Ce_17R: 5'-A*A*GAATCCTAGGAAGAACTG*G*T-3' (서열번호 9).
9.3 게놈 편집 기술을 사용한 특정 표적 서열 기반의 샘플 검출
Ce군(Cervus elaphus샘플군), Rt군(Rangifer tarandus샘플군), Ce+Rt군(Cervus elaphus + Rangifer tarandus 샘플군) 및 CK(대조군)을 각각 준비했다. 종 식별을 위한 다음 반응 시스템에서, crRNA로 Ce_crRNA를 사용하였고, 검출 대상 각 샘플군에 대해서는, 상기에서 추출한 각 군의 샘플(Cervus elaphus샘플, Rangifer tarandus샘플 또는 이들의 혼합물)의 게놈 DNA를 DNA 기질로 사용했다.
상기 샘플의 종 식별은 실시예 3의 "3.2 게놈 편집 기술을 기반으로 한 검출 대상 샘플의 종 식별” 항목에 기술된 조작 단계 및 반응 조건에 따라 수행했다.
도 5의 판넬 C는 검출 대상 각 샘플군의 형광 검출 결과를 나타낸다. 판넬 C에 나타낸 바와 같이, Ce군은 형광 신호를 발생시켰고, 25분에 형광 값이 최대치에 도달하여 유지되었으며, 이는 CK군과 통계적으로 유의한 차이를 보였다(P<0.01). Rt군은 CK군과 일치하여 두 군 모두 형광 신호를 생성하지 않았으며, Rt군의 형광 값은 CK군과 유의한 차이가 없었다(P>0.01). 한편, 혼합 샘플군(즉, Ce+Rt군) 역시 Cervus elaphus샘플을 포함하므로 강한 형광 신호를 발생시킬 수 있었으며, 이의 형광 값은 CK군과 통계적으로 유의한 차이를 보였다(P<0.01). 본 발명의 방법은 검출 대상 샘플이 식별하려는 종과의 동일성이 있는지 여부를 구체적이고 정확하게 반영할 수 있음을 알 수 있다.
실시예 10: 서열 분석 기술을 기반으로 한 Cervus elaphusRangifer tarandus 샘플의 종 식별
실시예 8에서 얻은 Cervus elaphus의 특정 표적 서열을 기반으로, 진핵생물 샘플의 종 식별에 다양한 서로 다른 서열 검출 기술이 사용될 수 있음을 예시적으로 설명하기 위해, 실시예 9에서 얻은 검출 대상 Cervus elaphus Rangifer tarandus 샘플의 게놈 DNA를 특이적으로 증폭시키기 위해 Ce_17F 및 Ce_17R(서열번호 8 및 서열번호 9)의 프라이머 쌍을 사용했으며, 증폭 산물에 대해 서열 분석을 했다. 도 6에 나타낸 바와 같이, 결과는 검출 대상 샘플이 식별하려는 종과 일치할 때 특정 표적 서열을 포함하는 서열을 서열 분석 결과에서 얻을 수 있음을 보여주었으며, 검출 대상 샘플이 식별하려는 종과 일치하지 않는 경우, 증폭 산물의 서열 분석 결과에서 특정 표적 서열을 발견할 수 없었다. 본 발명의 방법은 검출 대상 샘플이 식별하려는 종과의 동일성이 있는지 여부를 구체적이고 정확하게 반영할 수 있음을 알 수 있다.
상기 실시예 3, 6, 9 및 10의 결과에 따르면, 본 출원의 방법은 Ophiocordyceos sinensis 샘플(진균), Rheum officinale 샘플(식물) 및 Cervus elaphus 샘플(동물)을 포함하는 각 샘플군의 종을 정확히 식별할 수 있음을 알 수 있으며, 의약재(예: Ophiocordyceos sinensis, Rheum officinaleCervus elaphus)에 대한 양질의 제품을 일반적인 해당 위화제(예: Cordyceps militaris, Rheum palmatumRangifer tarandus)과 명확하게 구별하는 데 사용될 수 있다.
통상의 기술자는 상기 임의의 실시예에서의 논의는 단지 예시일 뿐이며 본 개시 내용의 보호 범위가 이들 실시예에 제한된다는 것을 의미하려는 의도가 아니라는 점을 이해해야 한다. 본 개시 내용의 개념 하에서, 상기 실시예 또는 다른 실시예의 기술적 특징은 조합될 수도 있고, 단계는 임의의 순서로 구현될 수 있으며, 상기 기술된 바와 같이 본 개시 내용의 실시예의 다른 측면에서 많은 다른 변경이 있을 수 있으며, 이는 단순화를 위해 자세히 제공되지 않았다. 본 출원의 실시예는 첨부된 청구범위의 넓은 범위 내에 속하는 모든 치환, 변경 및 변형을 포괄하도록 의도된 것이다. 그러므로, 본 개시 내용의 실시예의 사상과 원칙을 벗어나지 않는 범위에서 이루어지는 모든 생략, 변경, 균등 치환, 개량 등은 본 개시 내용의 보호 범위에 포함된다.
모든 특허, 특허 출원 및 기타 간행물은 설명 및 공개의 목적으로 참조로 본원에 명시적으로 포함된다. 이들 간행물은 본 출원의 출원일 이전 공개를 위해서만 제공된다. 이 문서의 내용에 대한 날짜 또는 표현에 대한 모든 진술은 출원인이 이용할 수 있는 정보를 기반으로 하며 이 문서의 날짜 또는 내용의 정확성을 인정하는 것으로 간주되지 않는다. 더 나아가, 어떤 국가에서든, 본원에서 이런 간행물이 참조된다고 해서 해당 간행물이 해당 기술 분야의 상식의 일부가 된다는 것을 보증하는 것은 아니다.
Sequence Listing <110> INSTITUTE OF MEDICINAL PLANT DEVELOPMENT, CHINESE ACADEMY OF MEDICAL SCIENCES <120> METHOD FOR IDENTIFYING SPECIES OF EUKARYOTE ON BASIS OF WHOLE GENOME ANALYSIS, AND USE THEREOF <130> SPIC228032 <160> 17 <170> PatentIn version 3.5 <210> 1 <211> 25 <212> DNA <213> Ophiocordyceos sinensis <400> 1 tttgggagtg gtgactcgat aatga 25 <210> 2 <211> 25 <212> DNA <213> Rheum officinale <400> 2 aatatggtta tgttatatta ataaa 25 <210> 3 <211> 25 <212> DNA <213> Cervus elaphus <400> 3 tttatgcacc tgatgatttt ctacg 25 <210> 4 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Forward amplification primer for the specific target sequence of Ophiocordyceos sinensis <400> 4 ggaagtaaaa gtcgtaacaa gg 22 <210> 5 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Reverse amplification primer for the specific target sequence of Ophiocordyceos sinensis <400> 5 tcctccgctt attgatatgc 20 <210> 6 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Forward amplification primer for the specific target sequence of Rheum officinale <400> 6 ccaaattgcc cgaagcctat g 21 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Reverse amplification primer for the specific target sequence of Rheum officinale <400> 7 atcgctttcc gacccacaat 20 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Forward amplification primer for the specific target sequence of Cervus elaphus <400> 8 agcagaagtg atggttgctg 20 <210> 9 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Reverse amplification primer for the specific target sequence of Cervus elaphus <400> 9 aagaatccta ggaagaactg gt 22 <210> 10 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> 5' end amino acid sequence of PAM <400> 10 Thr Thr Thr Val 1 <210> 11 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> 3' end amino acid sequence of PAM <400> 11 Val Ala Ala Ala 1 <210> 12 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Poly(C) <400> 12 cccccccccc 10 <210> 13 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Os_crRNA <400> 13 uaauuucuac uaaguguaga uggaguggug acucgauaau ga 42 <210> 14 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Ro_crRNA <400> 14 uaauuucuac uaaguguaga uaauaaucga uucgaucaaa au 42 <210> 15 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Ce_crRNA <400> 15 uaauuucuac uaaguguaga uugcaccuga ugauuuucua cg 42 <210> 16 <211> 371 <212> DNA <213> Cervus elaphus <400> 16 gaagtgatgg ttgctgaggg cagattgaag tttacaggtg atatttagaa tctactgtca 60 aaacttgggg cgggctgggg ccaggattga caaggaagtt taaaacactt gccaactaga 120 attttaacat ctcaggagga ctgctaaatt agcagagaga tttttcaccc agatctcatt 180 accaggccta ttaaaacaat ccccgttgca cactgtacta cgcattacgt agaaaatcat 240 caggtgcata aaggtgtacc ttgtttcata attaggggga gatgcatagt ccagctacca 300 tgaaagagct aatggcatat ttctttgggg cttttcctca tctttaatta aagatactta 360 ccataataaa t 371 <210> 17 <211> 403 <212> DNA <213> Rangifer tarandus <400> 17 tagcagaagt gatggttgct gagggcagat tgaagtttac aggtgatatt tagaatcgac 60 tgtcagaact tggggcaggc tggggccagg attgacgagg aagtttaaaa cacttgccaa 120 ctagaatttt aacatctcag gaggactgct aaattagcag agagattttt cacccagatc 180 tcattaccag gcctgttaaa acaatccccg ttgcacactg tactatgcat tacctagaag 240 gttgtcaggt gcataaaggt gtaccgtgtt tcataattag ggggagatgc atcggccagc 300 taccatgaaa gagctgatgg catatttctt cggggctttt cctcatcttt aattaaaaat 360 acttaccata ataaatggga ccagttcttc ctaggattct taa 403

Claims (30)

  1. 전체 게놈 분석을 기반으로 한 진핵생물 종 식별 방법으로서,
    i) 식별하려는 종의 전체 게놈 서열을 기반으로 작은 단편 게놈 라이브러리를 구축하는 단계;
    ii) 상기 작은 단편 게놈 라이브러리에서 서열을 선택적으로 스크리닝하여, iv)에서 검출할 필요에 기초하거나 전체 게놈 주석 파일 및 데이터베이스에 포함된 종 서열 정보에 따라 대규모 후보 표적 서열 라이브러리를 얻는 단계;
    iii) 상기 작은 단편 게놈 라이브러리 또는 대규모 후보 표적 서열 라이브러리의 서열을 관련 종의 전체 게놈 서열과 정렬하고, 식별하려는 종에만 존재하는 서열을 선택하여, 식별하려는 종의 관련 종의 전체 게놈 서열을 기반으로 특정 표적 서열 라이브러리를 구축하는 단계;
    iv) 검출 대상 진핵생물 샘플의 게놈 DNA를 획득하고, 특정 표적 서열 라이브러리의 서열을 기반으로 진핵생물 샘플의 종 식별을 수행하고, 게놈 DNA가 특정 표적 서열 라이브러리의 서열을 포함하는지 여부를 검출하여, 진핵생물 샘플과 식별하려는 종 사이의 동일성을 결정하는 단계를 포함하는, 방법.
  2. 제 1항에 있어서, i)에서, 식별하려는 종의 전체 게놈 서열은 K 길이의 L-K+1 단편으로 분할되어 작은 단편 게놈 라이브러리를 구축하고, 라이브러리 내 각 단편의 카피(copy) 수가 계산된 다음, 각 단편을 전체 게놈 서열과 정렬하여 각 단편의 게놈 위치를 결정하며, 여기서, L은 전체 게놈 서열의 길이를 나타내고, K는 라이브러리의 단편 길이를 나타내는, 방법.
  3. 제 1항 또는 제 2항에 있어서, i)에서, 식별하려는 종은 동물, 식물 또는 진균으로부터 유래되는, 방법.
  4. 제 1항 또는 제 2항에 있어서, ii)에서, 작은 단편 게놈 라이브러리의 각 단편에 대해 PAM 모티프(motif)를 검출하고, 대규모 후보 표적 서열 라이브러리를 구축하기 위해 PAM이 포함된 서열을 추출하는, 방법.
  5. 제 4항에 있어서, PAM은 5' 말단에 서열번호 10으로 표시되는 아미노산 서열 또는 3' 말단에 서열번호 11로 표시되는 아미노산 서열을 갖는 PAM인, 방법.
  6. 제 1항 또는 제 2항에 있어서, iii)에서, 식별하려는 종에만 존재하는 서열을 종간 보존성이 높고 종간 차이가 큰 영역 내에서 선택하여 특정 표적 서열 라이브러리를 구축하는, 방법.
  7. 제6항에 있어서, 식별하려는 종에만 존재하는 서열은 관련 종의 전체 게놈 서열과 적어도 n개의 염기 차이가 있는 후보 표적 서열이고, 여기서 n은 ≥ 3인, 방법.
  8. 제 1항 또는 제 2항에 있어서, iii)에서, 식별하려는 종에만 존재하는 다수의 서로 다른 서열을 선택하여 특정 표적 서열 라이브러리를 구축하는, 방법.
  9. 제 1항 또는 제 2항에 있어서, iv)에서, 검출 대상 진핵생물 샘플은 동물, 식물 또는 진균의 샘플인, 방법.
  10. 제 9항에 있어서, 검출 대상 진핵생물 샘플은 단일종으로부터 유래된 샘플 또는 다중종으로부터 유래된 샘플의 혼합물인, 방법.
  11. 제 10항에 있어서, 검출 대상 진핵생물 샘플은 Ophiocordyceos sinensis, Cordyceps militaris, Rheum officinale, Rheum palmatum, Cervus elaphus 또는 Rangifer tarandus 유래 샘플인, 방법.
  12. 제 1항 또는 제 2항에 있어서, iv)에서, 검출을 위해 유전자 편집 시스템 또는 서열 분석을 사용하는, 방법.
  13. 제 12항에 있어서, iv)에서, 검출을 위해 형광 신호 분자가 포함된 CRISPR/Cas 시스템을 사용하는, 방법.
  14. 제 12항에 있어서, iv)에서, 검출을 수행하기 전, 검출을 위해 사용된 기술을 기반으로 특정 표적 서열과 일치하는 툴(tool) 라이브러리가 사전 구축되는, 방법.
  15. 제 14항에 있어서, iv)에서, 검출을 위해 게놈 편집 시스템이 사용되며, 특정 표적 서열과 일치하는 crRNA의 툴(tool) 라이브러리 및 선택적 tracr RNA 가 사전 구축되는, 방법.
  16. 제 14항에 있어서, iv)에서, 검출을 위해 서열 분석이 사용되며, 특정 표적 서열과 일치하는 프라이머 쌍의 툴 라이브러리가 사전 구축되는, 방법.
  17. 제 1항 또는 제 2항에 있어서, 식별하려는 종은 Ophiocordyceos sinensis 이며, iii)에서, 특정 표적 서열은 서열번호 1로 표시되는 뉴클레오티드 서열인, 방법.
  18. 제 1항 또는 제 2항에 있어서, 식별하려는 종은 Rheum officinale이며, iii)에서, 특정 표적 서열은 서열번호 2로 표시되는 뉴클레오티드 서열인, 방법.
  19. 제 1항 또는 제 2항에 있어서, 식별하려는 종은 Cervus elaphus이며, iii)에서, 특정 표적 서열은 서열번호 3으로 표시되는 뉴클레오티드 서열인, 방법.
  20. 제 1항 또는 제 2항에 있어서, 식별하려는 종은 Ophiocordyceos sinensis이며, iv)에서, 검출을 위해 하기 프라이머 쌍이 사용되는, 방법:
    ITS4F: 5'-GGAAGTAAAAGTCGTAACAAGG-3' (서열번호 4);
    ITS5R: 5'-TCCTCCGCTTATTGATATGC-3' (서열번호 5).
  21. 제 1항 또는 제 2항에 있어서, 식별하려는 종은 Rheum officinale이며, iv)에서, 검출을 위해 하기 프라이머 쌍이 사용되는, 방법:
    Ro_1F: 5'-CCAAATTGCCCGAAGCCTATG-3' (서열번호 6);
    Ro_1R: 5'-ATCGCTTTCCGACCCACAAT-3' (서열번호 7).
  22. 제 1항 또는 제 2항에 있어서, 식별하려는 종은 Cervus elaphus이며, iv)에서, 검출을 위해 하기 프라이머 쌍이 사용되는, 방법:
    Ce_17F: 5'-A*G*CAGAAGTGATGGTTGCT*G*-3' (서열번호 8);
    Ce_17R: 5'-A*A*GAATCCTAGGAAGAACTGG*T*-3' (서열번호 9).
  23. 진핵생물 종 식별을 위한 특정 표적 서열 라이브러리를 구축하는 방법으로서,
    a) 식별하려는 종을 선택하고, 제1항 내지 제16항 중 어느 한 항의 종 식별 방법에 따라 식별하려는 종의 하나 이상의 특정 표적 서열을 스크리닝하는 단계;
    b) 식별하려는 종의 하나 이상의 특정 표적 서열을 조합하여 특정 표적 서열 라이브러리를 구축하는 단계를 포함하는, 방법.
  24. 진핵생물 종 식별의 특정 표적 서열 검출을 위한 툴 라이브러리를 구축하는 방법으로서,
    A) 식별하려는 종을 선택하고, 제23항의 방법에 따라 특정 표적 서열 라이브러리를 구축하는 단계;
    B) 검출에 사용된 기술을 기반으로 특정 표적 서열과 일치하는 툴 라이브러리를 구축하는 단계를 포함하는, 방법.
  25. 제 24항에 있어서, 검출에 사용된 기술은 유전자 편집 또는 서열 분석인, 방법.
  26. 제 25항에 있어서, 툴 라이브러리는 crRNA 라이브러리 또는 프라이머 라이브러리인, 방법.
  27. 중국 의약재와 이에 상응하는 위화제(adulterant)을 구별하는 방법으로서,
    I) 중국 의약재 또는 위화제를 식별하려는 종으로 사용하여 제 1항 내지 16항 중 어느 한 항의 방법에 따라 특정 표적 서열을 스크리닝하는 단계;
    II) 검출 대상 의약 샘플의 게놈 DNA를 획득하고, 게놈 DNA가 특정 표적 서열을 포함하는지 여부를 검출하여, 검출 대상 의약 샘플과 중국 의약재 또는 위화제 간의 동일성을 결정하는 단계를 포함하는, 방법.
  28. 식품, 의약품 또는 건강식품(health product)의 안전성 검출 방법으로서,
    1) 식별하려는 종으로서 식품용 진핵생물, 의약용 진핵생물 또는 건강식품용 진핵생물을 사용하고, 제1항 내지 제16항 중 어느 한 항의 방법에 따라 특정 표적 서열을 스크리닝하는 단계;
    2) 검출 대상 식품, 의약 또는 건강식품의 게놈 DNA를 획득하고, 게놈 DNA가 특정 표적 서열을 포함하는지 여부를 검출하여, 검출 대상 식품, 의약 또는 건강식품과 식별하려는 종 사이의 동일성을 결정하는 단계를 포함하는, 방법.
  29. 종 특이적 표적 서열로서,
    Ophiocordyceos sinensis의 종 식별을 위한 종 특이적 표적 서열로, 서열번호 1로 표시되는 뉴클레오티드 서열;
    Rheum officinale의 종 식별을 위한 종 특이적 표적 서열로 서열번호 2로 표시되는 뉴클레오티드 서열; 또는
    Cervus elaphus의 종 식별을 위한 종 특이적 표적 서열로 서열번호 3으로 표시되는 뉴클레오티드 서열인, 서열.
  30. 진핵생물의 종 특이적 표적 서열을 증폭시키기 위한 프라이머 쌍으로서,
    진핵생물이 Rheum officinale인 경우, Ro_1F: 5'-CCAAATTGCCCGAAGCCTATG-3' (서열번호 6) 및 Ro_1R: 5'-ATCGCTTTCCGACCCACAAT-3' (서열번호 7)의 프라이머 쌍; 또는
    진핵생물이 Cervus elaphus인 경우, Ce_17F: 5'-AGCAGAAGTGATGGTTGCTG-3' (서열번호 8) 및 Ce_17R: 5'-AAGAATCCTAGGAAGAACTGGT-3' (서열번호 9)의 프라이머 쌍을 포함하는, 프라이머 쌍.
KR1020247007138A 2022-03-30 2022-03-30 전체 게놈 분석을 기반으로 한 진핵생물의 종 식별 방법 및 이의 용도 KR20240046529A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/083950 WO2023024508A1 (zh) 2022-03-30 2022-03-30 基于全基因组分析的真核生物物种鉴定方法及应用

Publications (1)

Publication Number Publication Date
KR20240046529A true KR20240046529A (ko) 2024-04-09

Family

ID=83243953

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247007138A KR20240046529A (ko) 2022-03-30 2022-03-30 전체 게놈 분석을 기반으로 한 진핵생물의 종 식별 방법 및 이의 용도

Country Status (4)

Country Link
KR (1) KR20240046529A (ko)
CN (1) CN115087750B (ko)
WO (1) WO2023024508A1 (ko)
ZA (1) ZA202306611B (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116083602B (zh) * 2023-01-10 2023-10-24 中国医学科学院药用植物研究所 基于时珍法鉴定鹿科动物的物种特异性靶标序列、试剂盒及应用
CN116426671B (zh) * 2023-03-03 2024-05-10 中国医学科学院药用植物研究所 基于时珍法的中药鉴定方法及应用
CN116287416B (zh) * 2023-04-06 2024-03-15 中国医学科学院药用植物研究所 基于时珍法的真菌物种鉴定方法、靶标核苷酸、引物对、试剂盒及其应用

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2889381A1 (en) * 2013-12-27 2015-07-01 Universite De Liege Detection method for species specific identification of nucleic acid of interest
CN104946730B (zh) * 2014-03-28 2020-06-19 中国中医科学院中药研究所 鉴定鹿茸的pcr特异引物及其检测方法
CN104830970A (zh) * 2015-03-17 2015-08-12 中国医学科学院药用植物研究所 一种冬虫夏草分子身份证及鉴定方法
CN106446597B (zh) * 2016-09-06 2018-11-23 清华大学 多物种特征选择及鉴定未知基因的方法
CN108753994A (zh) * 2018-06-27 2018-11-06 四川农业大学 一种基于转录组的准确高效的真核生物基因鉴定方法
CN109680053A (zh) * 2018-12-12 2019-04-26 广州普世利华科技有限公司 新型SsCas12a蛋白在核酸检测方面的应用
CN110982888B (zh) * 2019-12-31 2023-01-13 中国医学科学院药用植物研究所 一种基于全基因组测序技术的多种动物源性掺假鉴别方法
CN112080557B (zh) * 2020-08-25 2021-09-28 扬州大学 一种基于dna条形码的冬虫夏草产地鉴定方法
CN116411113A (zh) * 2021-04-09 2023-07-11 中国热带农业科学院三亚研究院 基于CRISPR Cas酶基因编辑技术的转基因成分检测方法
CN113897415B (zh) * 2021-10-21 2024-05-10 中国医学科学院药用植物研究所 一种鉴别大黄药材三个基原物种的方法与应用

Also Published As

Publication number Publication date
WO2023024508A1 (zh) 2023-03-02
CN115087750B (zh) 2023-05-02
CN115087750A (zh) 2022-09-20
ZA202306611B (en) 2024-04-24

Similar Documents

Publication Publication Date Title
Stephenson et al. Direct detection of RNA modifications and structure using single-molecule nanopore sequencing
KR20240046529A (ko) 전체 게놈 분석을 기반으로 한 진핵생물의 종 식별 방법 및 이의 용도
Teichert et al. RNA editing during sexual development occurs in distantly related filamentous ascomycetes
Wessels et al. Efficient combinatorial targeting of RNA transcripts in single cells with Cas13 RNA Perturb-seq
Rodrigues et al. Analysis of a Marseillevirus transcriptome reveals temporal gene expression profile and host transcriptional shift
CN107475449A (zh) 一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法
Li et al. PacBio long-read sequencing, assembly, and Funannotate reannotation of the complete genome of Trichoderma reesei QM6a
Gopalakrishnan et al. Whole‐Genome Sequencing of Yeast Cells
Olexiouk et al. Identification of small novel coding sequences, a proteogenomics endeavor
Wood et al. Genetic evidence for sexuality in Cochliopodium (Amoebozoa)
François et al. Increase in taxonomic assignment efficiency of viral reads in metagenomic studies
Peng et al. QitanTech nanopore long-read sequencing enables rapid resolution of complete genomes of multi-drug resistant pathogens
US20230193301A1 (en) Method and use for identifying plant species based on whole genome analysis and genome editing
US11345959B2 (en) Method for exploring useful genetic resources through bulk metagenome analysis and use thereof
Wang et al. Further analyses on the evolutionary “key‐protist” Halteria (Protista, Ciliophora) based on transcriptomic data
Sperling et al. The complete mitochondrial genome of the verongid sponge Aplysina cauliformis: implications for DNA barcoding in demosponges
CN107365839A (zh) 一种用于鹿科动物鉴定的引物及其应用
Gupta et al. Collection of Mitochondrial tRNA Sequences and Anticodon Identification for Acheta domesticus
JP2002530119A (ja) 任意プライマーおよび低ストリンジェンシーを用いるヌクレオチド配列決定法
Dweh et al. Assessing the impact of meta-genomic tools on current cutting-edge genome engineering and technology
CN116218811A (zh) 利用pcr富集扩增法对抗逆性dna聚合酶的高通量筛选方法
Chalmel et al. Toward understanding the core meiotic transcriptome in mammals and its implications for somatic cancer
Feschotte et al. Computational analysis and paleogenomics of interspersed repeats in eukaryotes
Drugă et al. Molecular characterization of microcystin-producing cyanobacteria from Romanian fresh waters
Kim et al. Rapid Identification of Jasmine Virus H Infecting Ixora coccinea by Nanopore Metatranscriptomics

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination