KR20220092509A - 트립타민 발현을 조절하는 균류의 유전자 공학 - Google Patents

트립타민 발현을 조절하는 균류의 유전자 공학 Download PDF

Info

Publication number
KR20220092509A
KR20220092509A KR1020227014270A KR20227014270A KR20220092509A KR 20220092509 A KR20220092509 A KR 20220092509A KR 1020227014270 A KR1020227014270 A KR 1020227014270A KR 20227014270 A KR20227014270 A KR 20227014270A KR 20220092509 A KR20220092509 A KR 20220092509A
Authority
KR
South Korea
Prior art keywords
genetically modified
gene
organism
modified organism
seq
Prior art date
Application number
KR1020227014270A
Other languages
English (en)
Inventor
토마스 헨리
모다시르 초우드리
호세 페르난데즈-고메즈
Original Assignee
엠피리언 뉴로사이언스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엠피리언 뉴로사이언스, 인크. filed Critical 엠피리언 뉴로사이언스, 인크.
Publication of KR20220092509A publication Critical patent/KR20220092509A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0083Miscellaneous (1.14.99)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K36/00Medicinal preparations of undetermined constitution containing material from algae, lichens, fungi or plants, or derivatives thereof, e.g. traditional herbal medicines
    • A61K36/06Fungi, e.g. yeasts
    • A61K36/07Basidiomycota, e.g. Cryptococcus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D209/00Heterocyclic compounds containing five-membered rings, condensed with other rings, with one nitrogen atom as the only ring hetero atom
    • C07D209/02Heterocyclic compounds containing five-membered rings, condensed with other rings, with one nitrogen atom as the only ring hetero atom condensed with one carbocyclic ring
    • C07D209/04Indoles; Hydrogenated indoles
    • C07D209/10Indoles; Hydrogenated indoles with substituted hydrocarbon radicals attached to carbon atoms of the hetero ring
    • C07D209/14Radicals substituted by nitrogen atoms, not forming part of a nitro radical
    • C07D209/16Tryptamines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/99Miscellaneous (1.14.99)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y201/00Transferases transferring one-carbon groups (2.1)
    • C12Y201/01Methyltransferases (2.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/01Phosphotransferases with an alcohol group as acceptor (2.7.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Botany (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Virology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Alternative & Traditional Medicine (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

균류 또는 다른 유기체에서 실로시빈 생합성 경로를 조절하는 방법이 본 명세서에 제공된다. 또한 제공된 방법에 의해 생성된 실로시빈 및 실로신 및 실로시빈 및/또는 실로신 조성물의 유도 및/또는 증가된 발현을 갖는 유전적으로 변형된 균류 및 유기체가 제공된다.

Description

트립타민 발현을 조절하는 균류의 유전자 공학
관련출원에 대한 교차 참조
본 출원은 2019년 10월 1일자로 출원된 미국 가출원 번호 62/909,159의 이익을 주장하며, 이것은 그 전체로 본 명세서에 참고로 포함된다.
배경
균류 내 트립타민-유래된 물질, 예컨대 실로시빈, 실로신은 환각 및 기타 의약 효과가 알려진 천연 약물이다. 약리학적 효과는 변형된 트립타민에 의해 야기되며, 실로시빈은 이들 균류의 주요 화학 성분이다. 이 전구약물-유사 천연 생성물은 경구 섭취에 이어서 빠르게 탈인산화되어 실제 향정신성 제제인 실로신을 생성하며, 이는 또한 균류에 의해 소량 생성된다. 트립타민-유래된 물질은 임상 연구에서 진행된-단계 암 환자의 실존 불안의 치료 및 니코틴 중독에 대한 치료에서 긍정적인 경향을 보여 약학적 관심을 끌었다. 최근 우울증의 치료를 위한 실로시빈의 사용에 대한 연구가 진행되고 있다. 변형된 치료 성분(들) 프로파일을 갖는 균류는 트립타민-유래된 물질의 생산에 유용할 수 있고/있거나 원하는 약물 프로파일을 제공하는 유전적으로 변형된 균류의 생산에 또한 유용할 수 있다.
개요
유전적 변형을 갖지 않는 필적할만한 대조군 유기체에서의 동일한 화합물의 생산과 비교하여,
Figure pct00001
(화학식 I);
Figure pct00002
(화학식 II);
Figure pct00003
(화학식 III),
Figure pct00004
(화학식 IV), 이들의 유도체 또는 유사체로부터 선택된 화합물의 증가된 생산을 초래하는 유전적 변형을 포함하는 유전적으로 변형된 유기체 또는 그의 세포 또는 조직이 본 명세서에서 제공된다. 유전적 변형을 갖지 않는 필적할만한 대조군 유기체에서의 동일한 화합물의 양과 비교하여, 화합물
Figure pct00005
(화학식 IV), 이의 유도체 또는 유사체의 증가된 양을 초래하는 엔도뉴클레아제 매개된 유전적 변형을 포함하는, 유전적으로 변형된 유기체가 또한 본 명세서에 제공된다. 일부 경우에, 유기체는 균류, 효모, 박테리아, 동물 또는 곤충이다. 본 명세서에 기재된 실시형태에서, 화학식 I의 화합물은 디메틸트립타민(DMT)이고, 화학식 II의 화합물은 실로시빈이고, 화학식 III의 화합물은 실로신이고, 화학식 IV의 화합물은 트립타민이다.
유기체에서
Figure pct00006
(화학식 I, DMT),
Figure pct00007
(화학식 III, 실로신), 또는 이의 유도체 또는 유사체의 생산을 증가시키는 방법이 본 명세서에 제공되며, 상기 방법은 상기 유기체에 유전적 변형을 도입하는 것을 포함하고, 여기서 상기 유전적 변형은 상기 변형이 없는 필적할만한 대조군 유기체와 비교하여 동일한 화합물의 증가된 생산을 초래한다 . 유기체에서
Figure pct00008
(화학식 I, DMT),
Figure pct00009
(화학식 II, 실로시빈),
Figure pct00010
(화학식 III, 실로신),
Figure pct00011
(화학식 IV, 트립타민), 또는 이의 유도체 또는 유사체의 생산을 증가시키는 방법이 본 명세서에 제공되며, 상기 방법은 상기 유기체의 유전적 변형을 도입하는 것을 포함하고, 여기서 상기 유전적 변형은 상기 변형이 없는 필적할만한 대조군 유기체와 비교하여 동일한 화합물의 증가된 생산을 초래하며, 여기서 상기 유기체는 균류이고 균류은 담자균류 분열로부터의 것이다.
일부 경우에, 본 명세서에 기술된 유전적으로 변형된 유기체는 식물이다. 일부 경우에, 본 명세서에 기술된 유전적으로 변형된 유기체는 박테리아이다. 일부 경우에 박테리아는 아그로박테리움이다. 일부 경우에, 본 명세서에 제공된 유전적으로 변형된 유기체는 균류이다. 일부 경우에 균류는 담자균류이다. 일부 경우에 담자균류는 실로사이베, 코노사이베, 짐노필루스, 파나에올루스, 플루테우스스트로파리아로 구성된 군에서 선택될 수 있다. 일부 경우에 균류는 파나에올루스 시아네세센스이다. 일부 경우에 균류가 파나에올루스 쿠벤시스이다. 일부 경우에 균류는 플레우로투스 네브로덴시스이다.
일 양태에서, 본 명세서에 기재된 유전적으로 변형된 유기체는 유전자 또는 유전자의 프로모터 또는 인핸서에서 또는 이에 인접한 변경인 유전적 변형을 포함하고, 여기서 유전자는 PLP-비의존적 포스파티딜세린 데카르복실라제, 트립토판 데카르복실라제(TDC), 5-메틸티온리보스 패밀리 소분자 키나제, 4-하이드록시트립타민 키나제, 클래스 I 메틸트랜스퍼라제, 촉진자-유형 수송체 PsiT1 또는 촉진자-유형 수송체 PsiT2를 인코딩한다.
일 양태에서, 본 명세서에 기재된 유기체에서의 유전적 변형은: 유전적 변형이 없는 필적할만한 대조군 유기체와 비교하여 (a) 증가된 트립토판 탈카르복실화, (b) 증가된 트립타민 4-하이드록실화, (c) 증가된 4-하이드록시트립타인 O-인산화, 및 (d) 유전적으로 변형된 유기체에서 실로신 중간체의 감소된 발현으로 순차적 N-메틸화를 통해 증가된 실로시빈중 적어도 하나를 초래한다. 일부 경우에, 유전적 변형은 유전적 변형이 없는 필적할만한 대조군 유기체와 비교하여 (i) 트립토판 데카르복실라제 유전자, 실로시빈-관련된 하이드록실라제 유전자, 실로시빈-관련된 N-메틸트랜스퍼라제 유전자 또는 실로시빈-관련된 포스포트랜스퍼라제 유전자의 상향조절된 발현; (ii) 비-실로시빈 트립타민의 감소된 합성; 또는 (iii) 유전적으로 변형된 유기체에서 트립토판의 증가된 생산을 초래한다.
일 양태에서, 유전적 변형은 관심있는 유전자의 프로모터 또는 인핸서 영역에 있거나 관심있는 유전자와 연관될 수 있다. 일부 경우에 유전적 변형은 유전자의 상향조절된 발현을 초래한다. 일 양태에서, 본 명세서에 기재된 관심있는 유전자는 PLP-비의존적 포스파티딜세린 데카르복실라제, 트립토판 데카르복실라제(TDC), 5-메틸티온리보스 패밀리 소분자 키나제, 4-하이드록시트립타민 키나제, 또는 클래스 I 메틸트랜스퍼라제를 인코딩한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 1에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 2에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 3에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 클래스 I 메틸트랜스퍼라제를 인코딩한다. 일부 경우에, 클래스 I 메틸트랜스퍼라제는 로스만-폴드를 포함한다. 일부 경우에 클래스 I 메틸트랜스퍼라제는 노르바에오시스틴 메틸트랜스퍼라제일 수 있다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 4에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 5에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 6에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 7에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 8에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 9에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 10에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 11에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 12에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 13에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다. 일부 경우에, 본 명세서에 기재된 관심있는 유전자는 서열번호: 14에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함한다.
일부 경우에, 유전자는 PsiD 유전자, PsiM 유전자, PsiH 유전자, PsiK 유전자, PsiR 유전자, PsiT1 유전자, 또는 PsiT2 유전자, 또는 이들의 임의의 부분일 수 있다. 일부 경우에, 유전자의 발현은 유전적 변형이 없는 필적할만한 대조군 유기체와 비교되는 유전적적으로 변형된 유기체에서 적어도 1.1, 적어도 1.2, 적어도 1.5, 적어도 2, 적어도 2.5, 적어도 3, 적어도 3.5, 적어도 4, 또는 적어도 5배까지 상향조절된다. 일부 경우에, 본 명세서에 기재된 유전적으로 변형된 유기체에서의 유전적 변형은 인돌아민 2,3-디옥시게나제(IDO), 트립토판 2,3-디옥시게나제(TDO), 및 TrpM으로 구성된 군으로부터 선택된 유전자에서의 변경을 포함한다. 일부 경우에 유전적 변형은 유전자의 코딩 영역에 있을 수 있다. 일부 경우에, 유전적 변형은 포스포-2-데하이드로-3-데옥시헵토네이트 알돌라제, 3-데하이드로퀴네이트 신타제, 3-데하이드로퀴네이트 데하이드라타제, 시키메이트 데하이드로게나제, 3-포스포시키메이트 1-카르복시비닐트랜스퍼라제, 시키메이트 키나아제 1, 시키메이트 키나아제 2, 코리스메이트 신타제, 트립토판 신타제 알파 사슬, 트립토판 신타제 베타 사슬, 안트라닐레이트 포스포리보실트랜스퍼라제 및 안트라닐레이트 신타제로 구성된 군으로부터 선택된 유전자의 변경을 포함한다.
일 양태에서, 유전적 변형은 유전자의 프로모터 영역에 있을 수 있다. 일부 경우에, 유전적으로 변형된 유기체는 유전적 변형이 없는 필적할만한 대조군 유기체와 비교하여 건조 중량으로 측정시 25% 더 많은
Figure pct00012
(화학식 IV)를 포함한다. 일부 경우에, 유전적으로 변형된 유기체는 유전적 변형이 없는 필적할만한 대조군 유기체와 비교하여 건조 중량으로 측정시 25% 더 많은 실로시빈을 포함한다. 일부 경우에, 유전적으로 변형된 유기체는 유전적 변형이 없는 필적할만한 대조군 유기체와 비교하여 건조 중량으로 측정시 10% 더 많은 실로신을 포함한다.
일부 경우에, 유전적 변형은 유기체의 세포를 엔도뉴클레아제 시스템과 접촉시킴에 의해 수행될 수 있다. 일 양태에서, 엔도뉴클레아제 시스템은 CRISPR 효소, TALE-뉴클레아제, 트랜스포존-기반 뉴클레아제, 아연 핑거 뉴클레아제, 메가뉴클레아제, 아르고노트, 메가-TAL 또는 DNA 가이드된 뉴클레아제를 포함한다. 일 양태에서, DNA-가이드된 뉴클레아제는 아르고노트를 포함한다. 일부 경우에, 엔도뉴클레아제 시스템은 CRISPR 효소 및 유전자 또는 이와 연관된 프로모터 또는 인핸서 내에서 또는 이에 인접한 표적 서열과 혼성화하는 가이드 폴리뉴클레오티드를 포함한다. 일부 경우에, 표적 서열은 길이가 적어도 18개 뉴클레오티드, 적어도 19개 뉴클레오티드, 적어도 20개 뉴클레오티드, 적어도 21개 뉴클레오티드, 또는 적어도 22개 뉴클레오티드일 수 있다. 일부 경우에 표적 서열의 길이는 최대 17개 뉴클레오티드이다. 일부 경우에, 표적 서열은 서열번호: 1-14 또는 그의 상보체 중 적어도 하나와 혼성화할 수 있다. 일부 경우에 가이드 폴리뉴클레오티드는 화학적으로 변형될 수 있다. 일 양태에서, 가이드 폴리뉴클레오티드는 단일 가이드 RNA(sgRNA)이다. 일 양태에서, 가이드 폴리뉴클레오티드는 RNA 및 DNA를 포함하는 키메라 단일 가이드일 수 있다. 일부 경우에, 가이드 폴리뉴클레오티드는 서열번호: 1-14 또는 이의 상보체 중 적어도 하나와 혼성화할 수 있다.
일부 경우에, CRISPR 효소는 Cas 단백질 또는 이의 변이체 또는 유도체일 수 있다. 일부 경우에, Cas 단백질은 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5d, Cas5t, Cas5h, Cas5a, Cas6, Cas7, Cas8, Cas9, Cas10, Csy1 , Csy2, Csy3, Csy4, Cse1, Cse2, Cse3, Cse4, Cse5e, Csc1, Csc2, Csa5, Csn1, Csn2, Csm1, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx1S, Csf1, Csf2, CsO, Csf4, Csd1, Csd2, Cst1, Cst2, Csh1, Csh2, Csa1, Csa2, Csa3, Csa4, Csa5, C2c1, C2c2, C2c3, Cpf1, CARF, DinG, 이의 상동체 또는 이의 변형된 버전을 포함한다. 일부 경우에, Cas 단백질은 Cas9일 될 수 있다. 일부 경우에, Cas9는 규범적 PAM에 결합하는 변형된 Cas9이다. 일부 경우에, Cas9는 비-규범적 PAM을 인식한다. 일부 경우에, 가이드 폴리뉴클레오티드는 PAM으로부터의 표적 서열 3-10개 뉴클레오티드에 결합한다. 일부 경우에, 가이드 폴리뉴클레오티드와 커플링된 CRISPR 효소는 유전적으로 변형된 유기체 내에 RNP로 전달될 수 있다. 일부 경우에, 가이드 폴리뉴클레오티드와 커플링된 CRISPR 효소는 CRISPR 효소 및 가이드 폴리뉴클레오티드를 인코딩하는 mRNA에 의해 유전적으로 변형된 유기체 내로 전달될 수 있다.
일부 경우에, 가이드 폴리뉴클레오티드와 커플링된 CRISPR 효소는 CRISPR 효소 및 가이드 폴리뉴클레오티드를 코딩하는 핵산을 포함하는 벡터에 의해 유전적으로 변형된 유기체 내로 전달될 수 있다. 일 양태에서, 벡터는 이원 벡터 또는 Ti 플라스미드일 수 있다. 일 양태에서, 벡터는 선별 마커 또는 리포터 유전자를 추가로 포함한다. 일부 경우에, RNP, 복합체 또는 벡터는 전기천공, 미세주입, 기계적 세포 변형, 지질 나노입자, AAV, 렌티바이러스, 아그로박테리움 매개된 형질전환, 바이오리스틱 입자 충격 또는 원형질체 형질전환을 통해 전달될 수 있다. 일부 경우에, RNP, mRNA, 또는 벡터는 공여자 폴리뉴클레오티드 또는 공여자 폴리뉴클레오티드를 인코딩하는 핵산을 추가로 포함한다. 일 양태에서, 공여자 폴리뉴클레오티드는 표적 서열에 측접하는 서열에 대한 상동성을 포함한다. 일 양태에서, 공여자 폴리뉴클레오티드는 바코드, 리포터 유전자, 또는 선별 마커를 추가로 포함한다.
또 다른 양태에서, 유전적으로 변형된 유기체는 외인성 뉴클레오티드를 포함한다. 일부 경우에, 외인성 뉴클레오티드는 시스-작용 프로모터 서열을 포함한다. 일부 경우에, 외인성 뉴클레오티드는 상기 외인성 뉴클레오티드가 없는 필적할만한 대조군 유기체와 비교하여 증가된 트립토판 탈카르복실화, 트립타민 4-하이드록실화, 4-하이드록시트립타인 O-인산화, 또는 상기 유전적으로 변형된 유기체에서 실로신 중간체가 없는 순차적 N-메틸화를 통한 실로시빈 생산을 초래한다. 일부 경우에, 외인성 뉴클레오티드는 상기 외인성 뉴클레오티드가 없는 필적할만한 대조군 유기체와 비교하여 (i) 트립토판 데카르복실라제 유전자, 실로시빈-관련된 하이드록실라제 유전자, 실로시빈-관련된 N-메틸트랜스퍼라제 유전자 또는 실로시빈-관련된 포스포트랜스퍼라제 유전자의 상향조절된 발현; (ii) 비-실로시빈 트립타민의 감소된 합성; 또는 (iii) 상기 유전적으로 변형된 유기체에서 트립토판의 증가된 생산을 초래한다. 일부 경우에, 외인성 뉴클레오티드는 PLP-비의존적인 포스파티딜세린 데카르복실라제, 트립토판 데카르복실라제(TDC), 추정되는 모노옥시게나제, 5-메틸티온리보스 패밀리 소분자 키나제 또는 4-하이드록시트립타민 키나제를 인코딩한다.
일부 경우에 뉴클레오티드는 플라스미드에 통합된다. 일부 경우에, 플라스미드는 pGWB5 또는 pGHGWY이다. 일부 경우에, 플라스미드는 전기천공, 미세주입, 기계적 세포 변형, 지질 나노입자, AAV, 렌티바이러스, 아그로박테리움 매개된 형질전환, 바이오리스틱 입자 충격 또는 원형질체 형질전환을 통해 상기 유전적으로 변형된 유기체 내로 전달된다. 일부 경우에, 플라스미드는 바코드, 리포터 유전자 또는 선별 마커를 추가로 포함한다. 일부 경우에, 플라스미드는 프로모터를 추가로 포함한다. 일부 경우에, 프로모터는 35S, GPD, EF1a, 액틴 또는 CcDED1이다.
본 명세서에 기재된 실시형태에서, 유전적으로 변형된 유기체는 다세포 또는 단세포 유기체일 수 있다. 특정 실시형태에서, 유기체는 단일 식물 또는 균류 세포일 수 있다. 본 명세서에 기재된 실시형태는 또한 세포의 모집단, 예를 들어 본 명세서에 기재된 균류 종으로부터 세포의 모집단을 포함한다.
본 명세서에 제공된 조성물을 포함하는 게놈 편집용 키트가 본 명세서에 제공된다. 본 명세서에서 제공된 조성물을 포함하는 세포가 또한 본 명세서에서 제공된다. 세포는 식물 세포일 수 있다. 일부 경우에, 세포는 균류 세포이다. 일부 경우에, 세포는 박테리아 세포이다. 일부 경우에, 세포는 동물 세포이다. 일부 경우에, 세포는 곤충 세포이다. 유전적으로 변형된 유기체, 유전적으로 변형된 세포, 조성물 또는 세포의 추출물을 포함하는 약학적 조성물이 본 명세서에 제공된다. 일 양태에서, 약학적 조성물은 약학적으로 허용가능한 부형제, 희석제 또는 담체를 추가로 포함한다. 일부 경우에, 약학적으로 허용가능한 부형제는 지질이다.
유전적으로 변형된 유기체, 유전적으로 변형된 세포, 조성물 또는 세포의 추출물을 포함하는 기능식품 조성물이 본 명세서에서 제공된다. 유전적으로 변형된 유기체, 유전적으로 변형된 세포, 조성물, 또는 세포의 추출물을 포함하는 식품 보충제 조성물이 본 명세서에서 제공된다. 일 양태에서, 기능식품 조성물, 또는 식품 보충제는 경구 형태, 경피 형태, 오일 제형, 식용 식품, 식품 기질, 수성 분산액, 에멀젼, 용액, 현탁액, 엘릭서, 젤, 시럽, 에어로졸, 미스트, 분말, 정제, 로젠지, 젤, 로션, 페이스트, 제형화된 스틱, 밤, 크림 또는 연고일 수 있다.
약학적 조성물, 기능식품 조성물, 또는 식품 보충제를 대상체에게 투여하는 것을 포함하는 질환 또는 병태를 치료하는 방법이 본 명세서에서 제공된다. 일 양태에서, 질환 또는 병태는 우울증, 불안, 외상-후 스트레스 장애, 중독, 또는 중단 관련된 부작용, 심리적 고통, 및 정신 장애 및 병태로 구성된 군으로부터 선택된다.
특정 실시형태에서, 본 명세서에 기재된 바와 같은 유전적으로 변형된 유기체는 균류, 효모, 식물, 동물, 박테리아일 수 있다. 일부 경우에, 균류는 버섯이다. 일부 경우에, 버섯은: 디메틸트립타민(DMT), 실로시빈, 실로신 및/또는 이들의 조합 중 적어도 하나를 생산할 수 있다.
참고에 의한 통합
본 명세서에 언급된 모든 공보, 특허 및 특허 출원은 각각의 개별 공보, 특허 또는 특허 출원이 참고로 포함되는 것으로 구체적이고 개별적으로 표시된 것처럼 동일한 정도로 참고로 본 명세서에 포함된다.
발명의 신규한 특징은 첨부된 청구범위에서 특징적으로 제시된다. 본 발명의 특징 및 이점에 대한 더 나은 이해는 발명의 원리가 이용되는 예시적인 실시형태를 제시하는 다음의 상세한 설명 및 다음의 첨부 도면을 참고하여 얻어질 것이다:
도 1P. 쿠벤시스(I) 및 P. 시아네센스(II)에서 생합성을 위한 합성 유전자좌(Psi)의 개략도를 도시한다. 효소적 합성에 관여하는 유전자는 굵은 글꼴로 표지된다. 클러스터는 키나제(PsiK), 메틸트랜스퍼라제(PsiM), 트립토판 데카르복실라제(PsiD) 및 P450 모노옥시게나제(PsiH)에 대한 유전자를 포함한다. 부가적으로, 2개의 촉진자-유형 수송체(PsiT1PsiT2)와 추정 전사 조절자(PsiR)가 인코딩되고 도시된다. 가상의 유전자는 밝은 회색으로 도시된다. 인트론은 도시되지 않는다.
도 2는 시험관내 대표적인 실로시빈 생합성 경로를 묘사한다.
도 3은 35S 프로모터의 제어 하에 Psi 유전자를 과-발현하는, 본 명세서에 기재된 유전적으로 변형된 유기체 및 세포에 대한 대표적인 벡터 작제물을 예시한다: 도 3a는 35S 프로모터의 제어 하에 PsiD 유전자를 과-발현하는 대표적인 벡터를 도시하고; 도 3b는 35S 프로모터의 제어 하에 PsiH 유전자를 과-발현하는 대표적인 벡터를 도시하고; 도 3c는 35S 프로모터의 제어 하에 PsiK 유전자를 과-발현하는 대표적인 벡터를 도시하고; 도 3d는 35S 프로모터의 제어하에 PsiM 유전자를 과-발현하는 대표적인 벡터를 도시한다.
도 4는 균류 특이적 과-발현 프로모터의 제어 하에 유전자를 과-발현하는, 본 명세서에 기술된 유전적으로 변형된 유기체 및 세포에 대한 대표적인 벡터 작제물을 예시한다: 도 4a는 CcDED1 프로모터를 갖는 대표적인 벡터를 도시하고; 도 4b는 GPD 프로모터를 갖는 대표적인 벡터를 도시한다.
도 5슬리오사이베 쿠벤시스에서 Psi 유전자 과발현의 전략 및 작업흐름을 예시한다. 도 5a는 다양한 강도의 상이한 프로모터를 갖는 발현 벡터의 패널을 예시한다. 도 5b는 단리된 원형질체 및 추출물 아가미 조직을 예시한다. 도 5c는 플라스미드 DNA 또는 아그로박테리움 혼입으로 형질전환을 선택하는 것을 예시한다. 도 5d는 성체 버섯의 재생을 예시한다. 도 5e는 유전적으로 변형된 버섯의 실로시빈 함량을 분석하는 것을 예시한다.
도 6은 조직 추출 및 형질전환을 위한 실로사이베 쿠벤시스 성장을 도시한다: 실로사이베 쿠벤시스는 PDA 아가(도 6a 및 6b) 및 또한 보리-펄라이트 퇴비(도 6c)에서 실온에서 7일 동안 성장하였다.
명세서 및 청구범위에 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 문맥이 명백하게 달리 지시하지 않는 한 복수 참조를 포함한다. 예를 들어, 용어 "키메라 막횡단 수용체 폴리펩티드"는 복수의 키메라 막횡단 수용체 폴리펩티드를 포함한다.
용어 "약" 또는 "대략"은 해당 분야의 숙련자에 의해 결정된 특정 값에 대해 허용가능한 오차 범위 내를 의미하며, 이는 값이 측정 또는 결정될 수 있는 방법, 즉 측정 시스템의 한계에 부분적으로 의존할 수 있다. 예를 들어, "약"은 당업계의 관행에 따라 1 또는 1 초과의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 20%, 최대 10%, 최대 5%, 또는 최대 1%의 범위를 의미할 수 있다. 대안적으로, 특히 생물학적 시스템 또는 과정과 관련하여, 용어는 값의 10배 이내, 바람직하게는 5-배수 이내, 더욱 바람직하게는 2-배수 이내를 의미할 수 있다. 특정 값이 출원 및 청구범위에 기재된 경우, 달리 명시되지 않는 한, 용어 "약"은 특정 값에 대해 허용가능한 오차 범위 내를 의미하는 것으로 가정해야 한다.
본 명세서에 사용된 "세포"는 일반적으로 생물학적 세포를 지칭할 수 있다. 세포는 살아있는 유기체의 기본적인 구조적, 기능적 및/또는 생물학적 단위일 수 있다. 세포는 하나 이상의 세포를 갖는 임의의 유기체에서 유래할 수 있다. 일부 비-제한적인 예는: 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단-세포 진핵 유기체의 세포, 원생동물 세포, 식물로부터의 세포, 조류 세포, 해초, 균류 세포, 동물 세포, 무척추 동물로부터의 세포, 척추 동물로부터의 세포, 포유류로부터의 세포 등을 포함한다. 때때로 세포는 자연 유기체에서 유래하지 않는다(예를 들어, 세포는 합성으로 만들어질 수 있으며 때로는 인공 세포라고도 함).
본 명세서에 사용된 용어 "유전자"는 RNA 전사체를 인코딩하는 데 관련될 수 있는 핵산(예를 들어, 게놈 DNA 및 cDNA와 같은 DNA) 및 그의 상응하는 뉴클레오티드 서열을 지칭한다. 게놈 DNA와 관련하여 본 명세서에 사용된 용어는 조절 영역 뿐만 아니라 개재, 비-코딩 영역을 포함하고 5' 및 3' 말단을 포함할 수 있다. 일부 사용에서, 용어는 5' 및 3' 비번역 영역(5'-UTR 및 3'-UTR), 엑손 및 인트론을 포함하는 전사된 서열을 포괄한다. 일부 유전자에서, 전사된 영역은 폴리펩티드를 인코딩하는 "오픈 리딩 프레임"을 함유할 수 있다. 용어의 일부 사용에서, "유전자"는 폴리펩티드를 인코딩하는 데 필요한 인코딩 서열(예를 들어, "오픈 리딩 프레임" 또는 "코딩 영역")만을 포함한다. 일부 경우에, 유전자는 폴리펩티드, 예를 들어 리보솜 RNA 유전자(rRNA) 및 트랜스퍼 RNA(tRNA) 유전자를 인코딩하지 않는다. 일부 경우에, 용어 "유전자"는 전사된 서열을 포함할 뿐만 아니라, 부가하여 상류 및 하류 조절 영역, 인핸서 및 프로모터를 포함하는 비-전사된 영역도 포함한다. 유전자는 유기체의 게놈에서 자연적 위치에 있는 "내인성 유전자" 또는 천연 유전자를 지칭할 수 있다. 유전자는 "외인성 유전자" 또는 비-천연 유전자를 지칭할 수 있다. 비-천연 유전자는 일반적으로 숙주 유기체에서 발견되지 않지만 유전자 전달에 의해 숙주 유기체 내로 도입될 수 있는 유전자를 지칭할 수 있다. 비-천연 유전자는 또한 유기체의 게놈에서 자연적 위치에 있지 않은 유전자를 지칭할 수 있다. 비-천연 유전자는 또한 돌연변이, 삽입 및/또는 결실을 포함하는 자연적으로 발생하는 핵산 또는 폴리펩티드 서열(예를 들어, 비-천연 서열)을 지칭할 수 있다.
본 명세서에 사용된 용어 "뉴클레오티드"는 일반적으로 염기-당-포스페이트 조합을 지칭한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열의 단량체 단위일 수 있다(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA)). 용어 뉴클레오티드는 리보뉴클레오시드 트리포스페이트 아데노신 트리포스페이트(ATP), 우리딘 트리포스페이트(UTP), 시토신 트리포스페이트(CTP), 구아노신 트리포스페이트(GTP) 및 데옥시리보뉴클레오시드 트리포스페이트 예컨대 dATP, dCTP, dITP, dUTP, dGTP, dTTP, 또는 이의 유도체를 포함할 수 있다. 이러한 유도체는 예를 들어 [αS]dATP, 7-deaza-dGTP 및 7-deaza-dATP, 및 이들을 함유하는 핵산 분자에 뉴클레아제 내성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본 명세서에 사용된 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 트리포스페이트(ddNTP) 및 이의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 트리포스페이트의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP 및 ddTTP를 포함할 수 있지만 이에 제한되지는 않는다. 뉴클레오티드는 잘 알려진 기술에 의해 비표지되거나 검출가능하게 표지될 수 있다. 라벨링은 양자점으로도 수행될 수 있다. 검출가능한 표지는 예를 들어 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조) 벤조산(DABCYL), 캐스케이드 블루, 오레곤 그린, 텍사스 레드, 시아닌 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)을 포함할 수 있지만 이에 제한되지는 않는다. 형광으로 표지된 뉴클레오티드의 특정 예는 캘리포니아주 포스터 시티 소재의 Perkin Elmer로부터 이용가능한 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP; 일리노이주 알링턴 하이츠 소재의 Amersham으로부터 이용가능한 FluoroLink DeoxyNucleotides, FluoroLink Cy3-dCTP, FluoroLink Cy5-dCTP, FluoroLink Fluor X-dCTP, FluoroLink Cy3-dUTP, 및 FluoroLink Cy5-dUTP; 인디애나주 인디애나폴리스 소재의 Boehringer Mannheim으로부터 이용가능한 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP; 및 오리건주 유진 소재의 Molecular Probes로부터 이용가능한 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 케스케이드 블루-7-UTP, 케스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP, 및 텍사스 레드-12-dUTP를 포함할 수 있다. 뉴클레오티드는 또한 화학적 변형에 의해 표지되거나 표시될 수 있다. 화학적으로-변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오틴화된 dNTP의 일부 비-제한적 예는 비오틴-dATP(예를 들어, 비오-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예를 들어, 비오틴-11-dCTP, 비오틴-14-dCTP) 및 비오틴-dUTP(예를 들어, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP)를 포함할 수 있다.
2개의 뉴클레오티드 서열 사이의 백분율 서열 동일성에 대한 언급은 정렬될 때 뉴클레오티드의 백분율이 2개의 서열을 비교할 때 동일하다는 것을 의미한다. 이 정렬 및 퍼센트 상동성 또는 서열 동일성은 당업계에 공지된 소프트웨어 프로그램, 예를 들어 Current Protocols in Molecular Biology(F. M. Ausubel et al., eds., 1987) Supplement 30(참고로 통합됨)의 섹션 7.7.18에 기술된 것을 사용하여 결정할 수 있다. 바람직한 정렬은 12의 갭 개방 페널티 및 2의 갭 확장 페널티, 62의 BLOSUM 매트릭스를 갖는 아핀 갭 탐색을 사용하는 스미스-워터만 상동성 탐색 알고리즘에 의해 결정된다. 스미스-워터만(Smith-Waterman) 상동성 탐색 알고리즘은 Smith & Waterman (1981) Adv. Appl. Math. 2: 482-489(참고로 통합됨)에 개시되어 있다.
본 명세서에 사용된 용어 "식물"은 전체 식물 및 임의의 후손, 세포, 조직, 또는 식물의 일부를 포함한다. 본 개시내용에서 사용될 수 있는 식물의 부류는 일반적으로 속씨식물(단자엽 및 쌍자엽 식물), 겉씨식물, 양치류 및 다세포 조류를 포함하는 돌연변이유발이 가능한 고등 및 하등 식물의 부류만큼 광범위할 수 있다. 따라서, "식물"에는 쌍자엽 식물과 단자엽 식물이 포함된다. 용어 "식물 부분"은, 예를 들어: 종자(성숙 종자 및 미성숙 종자 포함); 식물 절단; 식물 세포; 식물 세포 배양물; 식물 기관(예를 들어, 꽃가루, 배아, 꽃, 과일, 새싹, 잎, 뿌리, 줄기 및 외식편)을 포함하지만 이에 제한되지 않는 식물의 임의의 부분(들)을 포함한다. 식물 조직 또는 식물 기관은 종자, 원형질체, 캘러스, 또는 구조적 또는 기능적 단위로 조직화될 수 있는 식물 세포의 임의의 다른 그룹일 수 있다. 식물 세포 또는 조직 배양물은 세포 또는 조직이 수득된 식물의 생리학적 및 형태학적 특징을 갖는 식물을 재생할 수 있고, 식물과 실질적으로 동일한 유전자형을 갖는 식물을 재생할 수 있다. 대조적으로, 일부 식물 세포는 식물을 생산하기 위해 재생될 수 없다. 식물 세포 또는 조직 배양물에서 재생가능한 세포는 배아, 원형질체, 분열 세포, 캘러스, 꽃가루, 잎, 꽃밥, 뿌리, 뿌리 선단, 실크, 꽃, 낟알, 귀, 속대, 껍질 또는 줄기일 수 있다.
본 명세서에 사용된 용어 "이식유전자"는 숙주 게놈 내로 통합되거나 숙주 세포에서 자율 복제할 수 있고 하나 이상의 코딩 서열의 발현을 야기할 수 있는 DNA의 단편을 지칭한다. 예시적인 이식유전자는 숙주 세포 또는 그로부터 재생된 식물에 상응하는 형질전환되지 않은 세포 또는 식물에 비해 신규한 표현형을 제공할 것이다. 이식유전자는 유전적 형질전환에 의해 식물 내에 직접적으로 도입될 수 있거나, 또는 DNA 세그먼트로 형질전환된 이전 세대의 식물로부터 유전될 수 있다. 일부 경우에 이식유전자는 바코드일 수 있다. 일부 경우에 이식유전자는 마커일 수 있다.
본 명세서에 사용된 바와 같이, 트랜스제닉 유기체는 일반적으로 유기체의 게놈 내의 원하는 DNA 서열 또는 유전적 유전자좌가 뉴클레오티드 서열의 삽입, 결실, 치환 또는 기타 조작에 의해 변형된 재조합 유기체를 지칭한다.
본 명세서에 사용된 용어 "트랜스제닉 식물"은 식물 또는 그의 자손의 DNA가 동일한 계통의 비-트랜스제닉 식물에 자연적으로 존재하지 않는 도입된 외인성 DNA 세그먼트를 함유하는 식물 또는 이로부터 유래된 임의의 후속 세대의 자손 식물을 지칭한다. 트랜스제닉 식물은 형질전환되는 식물에 고유한 서열을 추가로 함유할 수 있지만, 여기서 "외인성" 유전자는 예를 들어 하나 이상의 이종성 조절 또는 기타 요소에 의해 유전자의 발현의 수준 또는 패턴을 변경하도록 변경되었다.
벡터는 그것이 복제 및/또는 발현될 수 있는 세포 내로 유전 물질을 인공적으로 운반하기 위한 비히클로 사용되는 폴리뉴클레오티드(예를 들어, DNA 또는 RNA)일 수 있다. 일부 양태에서, 벡터는 이원 벡터 또는 Ti 플라스미드이다. 이러한 폴리뉴클레오티드는 예를 들어, 플라스미드, YAC, 코스미드, 파지미드, BAC, 바이러스 또는 선형 DNA(예를 들어, 선형 PCR 생성물)의 형태, 또는 폴리뉴클레오티드 서열을 다른 세포 내로 전달하는데 유용한 임의의 다른 유형의 작제물에 있을 수 있다. 벡터 (또는 이의 일부)는 표적 세포에 일시적으로 (즉, 게놈에 통합되지 않음) 또는 안정적으로 (즉, 게놈에 통합됨) 존재할 수 있다. 일부 양태에서, 벡터는 선별 마커 또는 리포터를 추가로 포함할 수 있다.
본 명세서에 개시된 일부 방법의 실행은 달리 명시되지 않는 한, 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 유전체학 및 재조합 DNA의 통상적인 기술을 이용하며, 이들은 당업계의 기술 내에 있다. 예를 들어 Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))를 참고한다.
본 개시내용은 실로시빈 및 실로신과 같은 트립타민-유래된 물질의 증가된 양을 생산하는 유전적으로 변형된 유기체, 뿐만 아니라 발현 카세트, 벡터, 조성물, 및 이를 생산하는 물질 및 방법을 제공한다. 또한 클러스터링된 규칙적으로 산재된 짧은 회문 반복(CRISPR), 아르고노트, 아연-핑거, TALEN 또는 기타 뉴클레아제 기반 기술 및 유전적으로 변형된 유기체를 생성하기 위한 시약을 이용하여 유전적으로 변형된 유기체를 만드는 방법이 본 명세서에 제공된다. 본 명세서에 제공된 조성물 및 방법은 트립타민-유래된 물질 생성이 증가된 균류 또는 식물의 생성에 이용될 수 있다. 본 명세서에서 제공되는 조성물은 치료적 용도, 예방적 용도, 고식적 용도, 및 레크리에이션 용도를 포함하나 이에 제한되지 않는 다양한 용도에 이용될 수 있다.
실로사이베 버섯은 실로시빈을 미량(0.1-1.7%)으로 함유한다(표 1). 실로시빈의 생산은 버섯의 희귀성과 고가의 합성 생산 공정으로 인해 고가이다. 실로시빈의 연구 가격은 그램당 $7,000~$10,000이다.
표 1. 실로시빈은 실로사이베 버섯에서 미량(0.1-1.7%)으로 발생한다.
Figure pct00013
a 평균 함량 및 환경적 조건에 기인하여 상이한 영역에서 다를 수 있음
실로시빈의 구조는 60년 동안 알려져 왔지만 최근에야 실로시빈 생합성 효소가 동정되었다. 이것은 실로시빈의 의학적 용도에서의 연구를 진보시키기 위해 버섯 내에서 이 향정신성 화합물의 생산을 이제 증진시킬 수 있는 기회를 촉진했다. 실로시빈 생산의 수율, 효능 및 효율성은 최첨단 식물 CRISPR 엔지니어링 플랫폼에 의해 향상될 수 있다. 버섯에서 실로시빈 생산이 1%에서 10%(건조 균사체 질량 %)로 입증된 10-배 증가는 업계에 상당한 가치가 있을 것이다.
유전자 변형 유기체
유기체에서 실로시빈 및 실로신의 생산을 증가시키기 위해 상기 유기체에서 생합성 경로를 변형하는 방법 및 조성물이 본 명세서에 제공된다. 본 명세서에 제공된 실시형태에서, 유전자 편집을 사용하여 트립타민 및 트립타민 유도체 예컨대 디메틸 트립타민과 같은 초기, 중간체 및/또는 후기 전구체 화합물의 생성을 증가시켜 실로시빈 및 실로신과 같은 원하는 최종 생성물을 생성한다.
부가적으로, 실로시빈 및 실로신과 같은 트립타민 및/또는 트립타민 관련된 기질의 발현 수준이 더 높은 유전적으로 변형된 유기체를 생성하기 위해 유전자 편집을 사용하여 트립토판 소비의 특정 경로를 차단하는 방법 및 조성물이 제공된다.
본 명세서에 기재된 바와 같은 유전적으로 변형된 유기체는 식물, 동물, 박테리아, 효모 또는 균류일 수 있다. 일부 경우에, 균류는 버섯이다. 실로사이베, 코노사이베, 짐노필루스, 파나에올루스, 플루테우스 및 스트로파리아 속의 특정 버섯은 향정신성으로 활성인 트립타민-유래된 물질, 예를 들어 본 명세서에 기재된 바와 같은 실로시빈 또는 실로신을 생산하며, 이의 생산은 본 명세서에 기재된 유전적 변형에 의해 증진된다. 일부 경우에, 본 명세서에 기술된 유전적으로 변형된 유기체는 파나에올루스 시아네세센스, 파나에올루스 쿠벤시스 및 플레우로투스 네브로덴시스에서 선택된 버섯이다.
본 명세서에 기재된 실시형태에서, L-트립토판 또는 4-하이드록시-L-트립토판의 트립타민으로의 전환을 증진시키는 유전적으로 변형된 세포 또는 유기체가 있다. 일부 경우에, 유전적으로 변형된 세포 또는 유기체는 4-하이드록시-L-트립토판 또는 트립토판의 대체 소비 경로를 억제하거나 최소화하여, 트립타민 및 선택적으로 실로시빈 및 실로신과 같은 트립타민의 하류 유도체의 형성을 증진하는 유전적 변형을 포함한다. 일부 경우에 이 증진은 트립토판 데카르복실라제 PsiD의 발현 또는 활성과 연관된 유전자를 도입하거나 상향조절함에 의해 달성된다.
일부 경우에는 트립타민의 4-하이드록시트립타민으로의 전환과 연관된 유전자, 예를 들어 P450 모노옥시게나제 PsiH를 도입하거나 상향조절함에 의해 실로신 또는 실로시빈의 생산에서 증강이 달성되는 유전적으로 변형된 세포 또는 유기체가 있다. 일부 경우에는, 트립타민, 트립토판 또는 4-하이드록시트립타민의 노르바에오시스틴으로의 전환과 연관된 유전자의 상향조절에 의해 노르바에오시스틴의 증강된 생성을 갖는 유전적으로 변형된 세포 또는 유기체가 있다. 일부 경우에, 이러한 상향조절은 유전자와 연관된 프로모터 또는 인핸서 서열을 변형하거나 유전자를 세포 또는 유기체 내에 녹-인함에 의해 4-하이드록시트립타민 키나제인, PsiK의 상향조절 또는 도입에 의해 달성된다.
일부 경우에는 실로신 또는 실로시빈의 생산에서 증강이 노르바에오시스틴에서 바에오시스틴으로의 전환과 연관된 유전자를 도입하거나 상향조절함에 의해, 또는 바에오시스틴의 생산을 증가시킴에 의해 달성되는 유전적으로 변형된 세포 또는 유기체가 있다. 일부 경우에 상향조절은 유전자와 연관된 프로모터 또는 인핸서 서열을 변형하거나 유전자를 세포 또는 유기체로 녹-인(knocking-in)함에 의해 노르바에오시스틴 메틸트랜스퍼라제 유전자의 합성을 증가시킴에 의해 달성된다.
특정 실시형태에서, 본 명세서에 기재된 바와 같은 트립토판 데카르복실라제 유전자는 PsiD일 수 있다(대표적인 mRNA 서열은 표 3에 제공됨). 일부 경우에, 트립토판 데카르복실라제를 인코딩하는 유전자는 서열번호: 1에 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 최대 약 100%의 서열 동일성을 포함할 수 있다. 효소 PsiD는 49.6 kDa 효소일 수 있고 PLP-비의존적 포스파티딜세린 데카르복실라제 패밀리에 속한다. 특정 실시형태에서, PsiD는 유전자 내 또는 유전자와 연관된 프로모터 또는 인핸서 서열을 유전적으로 편집함에 의해 세포 또는 유기체에서 상향조절된다. 특정 실시형태에서, PsiD는 본 명세서에 기재된 유전자 편집 기술을 사용하여 상기 세포 또는 유기체에 PsiD 유전자를 도입함에 의해 유전적으로 변형된 세포 또는 유기체에서 상향조절되거나 합성된다.
일부 경우에, 본 명세서에 기재된 유전적으로 변형된 세포 또는 유기체는 P450 모노옥시게나제 PsiH 유전자의 발현에서 상향조절을 포함한다(대표적인 mRNA 서열은 표 3에 제공됨). 일부 경우에, 모노옥시게나제를 인코딩하는 유전자는 서열번호: 2에 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 최대 약 약 100%의 서열 동일성을 포함할 수 있다. 특정 실시형태에서, PsiH는 유전자 내 또는 유전자와 연관된 프로모터 또는 인핸서 서열을 유전적으로 편집함에 의해 세포 또는 유기체에서 상향조절된다. 특정 실시형태에서, PsiH는 본 명세서에 기재된 유전자 편집 기술을 사용하여 상기 세포 또는 유기체에 PsiH 유전자를 도입함에 의해 유전적으로 변형된 세포 또는 유기체에서 상향조절되거나 합성된다.
일부 경우에, 본 명세서에 기재된 유전적으로 변형된 세포 또는 유기체는 4-하이드록시트립타민 키나제 PsiK 유전자의 발현에서 상향조절을 포함한다(대표적인 mRNA 서열은 표 3에 제공됨). 일부 경우에, 4-하이드록시트립타민 키나제를 인코딩하는 유전자는 서열번호: 3에 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 최대 약 100%의 서열 동일성을 포함할 수 있다. 특정 실시형태에서, PsiK는 유전자 내 또는 유전자와 연관된 프로모터 또는 인핸서 서열을 유전적으로 편집함에 의해 세포 또는 유기체에서 상향조절된다. 특정 실시형태에서, PsiKPsiK 유전자, 예를 들어 서열번호: 3의 유전자를 본 명세서에 기재된 유전자 편집 기술의 사용에 의해 상기 세포 또는 유기체에 도입함에 의해 유전적으로 변형된 세포 또는 유기체에서 상향조절되거나 합성된다.
일부 경우에 본 명세서에 기재된 유전적으로 변형된 세포 또는 유기체는 노르베오시스틴 메틸트랜스퍼라제 PsiM 유전자의 발현에서 상향조절을 포함한다(대표적인 mRNA 서열은 표 3에 제공됨). 일부 경우에, 메틸트랜스퍼라제를 인코딩하는 유전자는 서열번호: 4 중 임의의 하나에 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 최대 약 100%의 서열 동일성을 포함할 수 있다. 특정 실시형태에서, PsiM은 유전자 내 또는 유전자와 연관된 프로모터 또는 인핸서 서열을 유전적으로 편집함에 의해 세포 또는 유기체에서 상향조절된다. 특정 실시형태에서, PsiMPsiM 유전자, 예를 들어 서열번호: 4의 유전자를 본 명세서에 기재된 유전자 편집 기술을 사용하여 상기 세포 또는 유기체에 도입함에 의해 유전적으로 변형된 세포 또는 유기체에서 상향조절되거나 합성된다. 특정 경우에, 아미노 서열 GVDIGTGAS를 갖는 로스만-폴드를 포함하는 클래스 I 메틸트랜스퍼라제 유전자 또는 이의 유도체는 실로시빈 생산을 증가시키기 위해 세포 또는 유기체에 도입된다.
균류 또는 다른 유기체에서 생산된 실로시빈의 생산 및 축적에 영향을 미치는 다른 추정되는 전사 조절자 및 수송체는 본 명세서에 기재된 유기체 및 세포에서 변형될 수 있다. 일부 경우에, 추정되는 전사 조절자는 본 명세서에 기재된 메틸트랜스퍼라제, 하이드록실라제, 모노옥시게나제, 키나제 또는 데카르복실라제, 예를 들어 PsiD, PsiH, PsiK 또는 PsiM의 전사 또는 번역을 촉진할 수 있다. 일부 경우에, 추정되는 전사 조절자는 본 명세서에 기재된 메틸트랜스퍼라제, 하이드록실라제, 모노옥시게나제, 키나제 또는 탈카르복실라제, 예를 들어 PsiD, PsiH, PsiK 또는 PsiM과 같은 효소의 전사 또는 번역을 하향-조절하는 것을 촉진할 수 있다.
특정 실시형태에서, 본 명세서에 개시된 유전적 변형 기술은 유전자 내 또는 유전자와 연관된 프로모터 또는 인핸서 서열을 유전적으로 편집함에 의해, 또는 하나 이상의 상기 유전자 또는 이의 상동체의 추가 카피를 도입함에 의해 촉진자 패밀리 수송체(PsiT1PsiT2, 또는 나선-루프-나선(HLH)-도메인 전사 조절자(PsiR)의 발현을 증진시키는 데 사용될 수 있다. 그것은 합성된 실로시빈이 균류 및 기타 유기체에서 바르게 수송되고 국소화되는 것을 보장하는 역할을 할 수도 있다. 특정 실시형태에서 PsiR, PsiT1 또는 PsiT2는 유전자 내 또는 유전자와 연관된 프로모터 또는 인핸서 서열을 유전적으로 편집함에 의해 세포 또는 유기체에서 상향조절된다. 특정 실시형태에서 PsiR, PsiT1 또는 PsiT2는 본 명세서에 기술된 유전자 편집 기술을 사용하여 PsiR, PsiT1 또는 PsiT2 유전자, 예를 들어 서열번호: 5의 유전자를 상기 세포 또는 유기체에 도입함에 의해 유전적으로 변형된 세포 또는 유기체에서 상향조절되거나 합성된다.
PsiT2를 인코딩하는 유전자의 대표적인 서열은 표 3에 열거되어 있다. 일부 경우에, PsiT2를 인코딩하는 유전자는 서열번호: 5 중 임의의 하나에 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 최대 약 100%의 서열 동일성을 포함할 수 있다.
상기-언급된 유전자는 실로시빈 생합성 경로에 관여하는 효소, 추정 조절자 및 추정 수송체의 생산을 증가시키거나 본 명세서에 기재된 유전적으로 변형된 세포 또는 유기체에서 새로운 이러한 효소, 조절자 및 수송체를 생산하기 위해 본 명세서에 개시된 유전적 변형 기술에 의해 변형될 수 있다. 예를 들어, 실로시빈 생합성 경로를 따른 특정 효소의 발현 수준은 트립타민, 4-하이드록시트립타민, 바에오시스틴, 노르바에오시스틴 및 실로시빈 중 하나 이상의 생산을 증가시키기 위해 증가될 수 있다. 일부 경우에, 유전적 변형은 본 명세서에 기재된 하나 이상의 유전자의 또는 이와 연관된 프로모터 또는 인핸서 영역에 있다.
특정 실시형태에서, 트립토판 및/또는 4-하이드록시-L-트립토판을 또한 이용하는 경로와 연관된 유전자는 본 명세서에 기재된 유전적 변형 기술에 의해 변형되어 이들 유전자를 하향-조절하거나 녹아웃시켜, 이들 경로에 의한 트립토판 소비 및/또는 4-하이드록시-L-트립토판 소비를 감소시킨다. 하향조절되거나 녹-아웃된 유전자는 예를 들어 인돌아민 2,3-디옥시게나제(IDO), 트립토판 2,3-디옥시게나제(TDO) 및 TrpM을 포함할 수 있다. TrpM은 트립토판에 대해 모노- 및 디메틸화 활성을 갖지만 실로시빈 생합성 경로의 일부가 아닌 메틸트랜스퍼라제이다. 본 명세서에 기술된 유전적으로 변형된 유기체 또는 세포에서 IDO, TDO, TrpM과 같은 유전자의 하향조절 또는 녹-아웃은 실로시빈 생산을 위한 트립토판 및/또는 4-하이드록시-L-트립토판의 증가된 이용가능성을 초래한다.
특정 실시형태에서 트립토판 및/또는 4-하이드록시-L-트립토판의 증가된 생산을 초래하는 변형을 포함하는 유전적으로 변형된 세포 또는 유기체가 있다. 이들 변형은 포스포-2-데하이드로-3-데옥시헵토네이트 알돌라제, 3-데하이드로퀴네이트 신타제, 3-데하이드로퀴네이트 데하이드라타제, 시키메이트 데하이드로게나제, 3-포스포시키메이트 1-카르복시비닐트랜스퍼라제, 시키메이트 키나제 1, 시키메이트 키나제 2, 코리스메이트 신타제, 트립토판 신타제 알파 사슬, 트립토판 신타제 베타 사슬, 안트라닐레이트 포스포리보실트랜스퍼라제 또는 안트라닐레이트 신타제 성분을 인코딩하는 유전자에서의 상향조절을 포함한다. 이들 유전자의 상향조절은 유전자 내 또는 이와 연관된 프로모터 또는 인핸서를 변형함에 의해 또는 유기체 또는 세포에서 상기 유전자의 카피 수를 증가시킴에 의해 유전자의 생산을 증가시킴에 의해 달성된다.
이들 효소의 발현을 증가시킴에 의해, 더 많은 기질 트립토판 및/또는 4-하이드록시-L-트립토판이 생성되어, 실로시빈 및/또는 실로신 생성을 증가시킨다.
실로시빈 생합성 경로 및 효소를 특성화하기 위한 방법 및 조성물이 본 명세서에 제공된다. 본 명세서에 제공된 실시형태에서, 후보 실로시빈 유전자는 3개의 다양한 실로시빈 양성(PS+) 버섯 동형핵체 게놈인: Ps. 시아네센스, Pa.(= 코펠란디아) 시아네센스, Gy. 딜레피스를 시퀀싱함에 의해 식별된다. 특정 실시형태에서, 5개의 유전자가 모두 PS+ 게놈에 클러스터링되었다: 트립토판 데카르복실라제(PsiD); 실로시빈-관련된 N-메틸트랜스퍼라제(PsiM); 실로시빈-관련된 하이드록실라제(PsiH); 실로시빈-관련된 포스포트랜스퍼라제(PsiK); 실로시빈-관련된 수송체(PsiT). 특정 실시형태에서, 반응에서 첫 번째 수행 단계이고 약물-계획된 화합물을 생성하지 않는 유일한 것인 PsiD는 트립타민을 생성하는 트립토판에 대해 특이적 데카르복실라제 활성을 갖는다. 특정 실시형태에서, 클러스터 간의 유전자 복제는 유전적 변형을 위한 대안적 또는 망상의 경로에 관한 것이다.
본 명세서에 기재된 실시형태에서, PS+ 클러스터 내의 유전자의 코딩 서열은 본 명세서에 제공된 바와 같이 여러 버섯으로부터 식별되었다. 특정 실시형태에서, 이들 유전자의 인트론 또는 엑손의 구조에 대한 정보도 존재한다(유전자의 대표적인 목록은 표 2에 제공됨).
표 2: P. 큐벤시스P. 시아네센스에서 실로시빈 생합성 유전자의 길이 및 인트론 수. 세포에 2개의 값이 있는 경우, 첫 번째 값은 P. 큐벤시스의 해당 유전자를 나타내고 두 번째 값은 P. 시아네센스를 나타낸다. P. 시아네센스 유전자와 P. 큐벤시스PsiR, PsiT1PsiT2에 대한 값은 Augustus 알고리즘을 사용하여 예측된다.
Figure pct00014
표 3: 본 명세서에 기재된 유전적으로 변형된 세포 또는 유기체에서 발현이 증진된 유전자에 대한 유전자 서열. 발현은 유전자 내 또는 이와 연관된 프로모터 또는 인핸서의 변형에 의해, 또는 세포 또는 유기체에 유전자의 카피를 도입함에 의해 증진된다.
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
일부 경우에, 본 명세서에 기재된 임의의 핵산 전달 플랫폼을 사용하여, 세포를 포함하나 이에 제한되지 않는 균류 또는 임의의 다른 유기체의 게놈 파괴의 효율은 핵산 또는 단백질 분석으로 측정시 약 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.9%, 또는 최대 약 100%의 유전자 또는 그의 일부의 파괴를 초래할 수 있다.
일부 경우에, 유전적으로 변형된 균류 및 기타 유기체는 유전적 변형이 없는 필적할만한 대조군과 비교하여 균류의 건조 중량에 의해 측정된 약 10%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 125%, 150%, 175%, 200%, 및 최대 400% 퍼센트 이상의 화학식 I-IV 중 어느 하나의 화합물을 포함한다.
일부 경우에, 유전적으로 변형된 균류 및 기타 유기체는 유전적 변형이 없는 필적할만한 대조군과 비교하여 균류의 건조 중량에 의해 측정된 약 10%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 125%, 150%, 175%, 200%, 및 최대 400% 퍼센트 이상 디메틸트립타민(DMT)을 포함한다.
일부 경우에, 유전적으로 변형된 균류 및 기타 유기체는 유전적 변형이 없는 필적할만한 대조군과 비교하여 균류의 건조 중량에 의해 측정된 약 10%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 125%, 150%, 175%, 200%, 및 최대 400% 퍼센트 이상 실로시빈을 포함한다.
일부 경우에, 유전적으로 변형된 균류 및 기타 유기체는 유전적 변형이 없는 필적할만한 대조군과 비교하여 균류의 건조 중량에 의해 측정된 약 10%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 125%, 150%, 175%, 200%, 및 최대 400% 퍼센트 이상 실로신을 포함한다.
실로시빈 및/또는 실로신 생합성 경로에서 유전자 편집을 위한 잠재적인 표적을 식별하기 위해 다양한 방법이 이용될 수 있다. 일부 경우에, 생물정보학, gRNA 설계, CRISPR 시약 구성, 식물 형질전환, 식물 재생 및/또는 유전형분석 중 임의의 하나가 활용될 수 있다. 생물정보학은 유전자 매핑, 유전자 정렬 및 복제 수 분석, 유전자 주석을 포함할 수 있다. gRNA 디자인은 칸나비스 게놈 내의 표적 유전자 특이성 및 표적-외를 기반으로 하는 가이드의 의도된 기능, 순위 및 선택을 위한 가이드의 클러스터를 디자인하기 위한 gRNA 그룹화를 포함할 수 있다. CRISPR 시약 구성은 gRNA 및 칸나비스 코돈 최적화된 Cas9를 공동-전달하기 위한 감염-준비 AGRO 시약의 생성을 포함할 수 있다. 식물 형질전환 및 재생은 CRISPR AGRO(예를 들어, 캘러스)로 식물 조직을 감염시키는 것, 칸나비스 원형질체를 단리하고 RNP 시약을 형질전환시키는 기술, 및/또는 형질전환된 조직에서 성장하는 묘목을 얻는 기술의 개발을 포함할 수 있다. 유전형분석은 식물 DNA를 단리하고 표적 서열을 분석하는 것을 포함할 수 있다. 기능 분석은 식물 조직에서 칸나비노이드 함량을 분석하고 관련 칸나비노이드를 정량화하는 것을 포함할 수 있다.
상기 개시된 유전적 변형의 상이한 접근법은 실로시빈 및/또는 실로신의 최종 생성물을 생성하기 위해 상이한 식물, 대장균 및 기타 적합한 박테리아, 또는 효모와 같은 다른 유기체에 사용될 수 있다. 개시된 유전적으로 조작 균류 및 기타 유기체에서, 실로시빈 및/또는 실로신의 양은 이러한 공개된 유전적 변형이 없는 필적할만한 대조군 균류 또는 유기체와 비교하여 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 125%, 150%, 175%, 200%, 300% 또는 최대 400% 이상까지 증가된다.
유전 공학
게놈 공학의 시스템이 본 명세서에 제공될 수 있다. 게놈 공학의 시스템은 클러스터링된 규칙적으로 산재된 짧은 회문 반복(CRISPR) 효소, 전사 활성제-유사 효과기(TALE)-뉴클레아제, 트랜스포존-기반 뉴클레아제, 아연 핑거 뉴클레아제, 메가뉴클레아제, 아르고노트 또는 메가-TAL 중 임의의 하나를 포함할 수 있다. 일부 양태에서, 게놈 편집 시스템은 DNA, RNA, 또는 이들의 조합을 포함한 가이드하는 다중핵산을 이용할 수 있다. 일부 경우에, 가이드는 가이드 DNA 또는 가이드 RNA일 수 있다.
I. 클러스터링된 규칙적으로 산재된 짧은 회문 반복(CRISPR)
일부 경우에, 유전자 조작은 CRISPR 시스템 또는 이의 일부를 사용하여 수행될 수 있다. CRISPR 시스템은 가이드 폴리뉴클레오티드 또는 가이드 폴리뉴클레오티드를 인코딩하는 핵산 및 CRISPR 효소 또는 CRISPR 효소를 인코딩하는 핵산을 포함하는 다중성분 시스템일 수 있다. CRISPR 시스템은 또한 CRISPR 구성요소의 임의의 변형 또는 임의의 CRISPR 구성요소의 임의의 부분을 포함할 수 있다.
본 명세서에 기술된 방법은 CRISPR 시스템을 이용할 수 있다. 모두 가이드 RNA와 Cas 단백질을 통합하고 다중핵산을 인코딩하는 적어도 5가지 유형의 CRISPR 시스템이 있다. CRISPR 시스템의 일반적인 메커니즘과 최근의 발전은 Cong, L. et al., "Multiplex genome engineering using CRISPR systems", Science, 339(6121): 819-823 (2013); Fu, Y. et al., "High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells", Nature Biotechnology, 31, 822-826 (2013); Chu, VT et al. "Increasing the efficiency of homology-directed repair for CRISPR-Cas9-induced precise gene editing in mammalian cells", Nature Biotechnology 33, 543-548 (2015); Shmakov, S. et al., "Discovery and functional characterization of diverse Class 2 CRISPR-Cas systems", Molecular Cell, 60, 1-13 (2015); Makarova, KS et al., "An updated evolutionary classification of CRISPR-Cas systems", Nature Reviews Microbiology, 13, 1-15 (2015)에 기술되어 있다. 표적 DNA의 부위-특이적 절단은 1) 가이드 RNA와 표적 DNA(프로토스페이서로도 지칭됨) 사이의 염기-쌍 상보성과 2) 프로토스페이서 인접 모티브(PAM)라고 하는 표적 DNA에서 짧은 모티프 둘 모두에 의해 결정되는 위치에서 발생한다. PAM은 정규의 PAM 또는 비-정규의 PAM일 수 있다. 예를 들어, 식물 세포와 같은 조작된 세포는 CRISPR 시스템, 예를 들어 유형 II CRISPR 시스템을 사용하여 생성될 수 있다. 본 명세서에 개시된 방법에 사용되는 Cas 효소는 DNA 절단을 촉매하는 Cas9일 수 있다. 스트렙토코커스 피오게네스에서 유래된 Cas9 또는 임의의 밀접하게 관련된 Cas9에 의한 효소 작용은 가이드 서열의 약 20개 뉴클레오티드에 혼성화하고 표적 서열의 약 20개 뉴클레오티드가 이어지는 프로토스페이서-인접 모티브(PAM)을 갖는 표적 부위 서열에서 2배 표준 파괴를 발생할 수 있다. 일부 양태에서, 20개 미만의 뉴클레오티드가 혼성화될 수 있다. 일부 양태에서, 20개 초과의 뉴클레오티드가 혼성화될 수 있다. 칸나비스 및/또는 대마 식물 또는 이의 세포 안에 적어도 하나의 핵 국소화 신호를 포함하는 적어도 하나의 RNA-가이드된 엔도뉴클레아제 또는 적어도 하나의 핵 국소화 신호를 포함하는 적어도 하나의 RNA-가이드된 엔도뉴클레아제를 인코딩하는 핵산, 적어도 하나의 가이드 RNA를 인코딩하는 적어도 하나의 가이드하는 핵산을 도입하는 것을 포함하는 THCA 신타제의 게놈적으로 파괴하는 활성이 본 명세서에 제공될 수 있다. 일부 양태에서, 변형된 식물 또는 그의 일부가 배양될 수 있다.
클러스터링된 규칙적으로 산재된 짧은 회문 반복(CRISPR) 효소
CRISPR 효소는 Cas 효소를 포함할 수 있거나 Cas 효소일 수 있다. 일부 양태에서, Cas 단백질 또는 그의 일부를 인코딩하는 핵산이 본 명세서에 제공된 실시형태에서 이용될 수 있다. Cas 효소의 비-제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5d, Cas5t, Cas5h, Cas5a, Cas6, Cas7, Cas8, Cas9, Cas10, Csy1 , Csy2, Csy3, Csy4, Cse1, Cse2, Cse3, Cse4, Cse5e, Csc1, Csc2, Csa5, Csn1, Csn2, Csm1, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx1S, Csf1, Csf2, CsO, Csf4, Csd1, Csd2, Cst1, Cst2, Csh1, Csh2, Csa1, Csa2, Csa3, Csa4, Csa5, C2c1, C2c2, C2c3, Cpf1, CARF, DinG, 이의 상동체 또는 이의 변형된 버전을 포함할 수 있다. 일부 경우에 촉매적으로 사멸된 Cas 단백질, 예를 들어 dCas9가 사용될 수 있다. 비변형된 CRISPR 효소는 Cas9와 같은 DNA 절단 활성을 가질 수 있다. CRISPR 효소는 표적 서열 내 및/또는 표적 서열의 상보체 내와 같은 표적 서열에서 하나 또는 양 가닥의 절단을 지시할 수 있다. 일부 양태에서, 표적 서열은 길이가 적어도 약 18개 뉴클레오티드, 적어도 19개 뉴클레오티드, 적어도 20개 뉴클레오티드, 적어도 21개 뉴클레오티드, 또는 적어도 22개 뉴클레오티드이다. 일부 경우에 표적 서열의 길이가 최대 17개 뉴클레오티드이다. 일부 양태에서, 표적은 서열번호: 1 내지 서열번호: 7 중 임의의 하나에 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 최대 약 100%의 상동성을 포함하는 서열로부터 선택될 수 있다.
일부 양태에서, 표적 서열은 유전자의 인트론 또는 엑손 내에서 발견될 수 있다. 일부 경우에 CRISPR 시스템이 칸나비노이드 생합성 경로에 관여하는 유전자의 엑손을 표적화할 수 있다. 예를 들어, CRISPR 효소는 표적 서열의 첫 번째 또는 마지막 뉴클레오티드로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500, 또는 그 초과의 염기쌍 내에서 하나 또는 양 가닥의 절단을 지시할 수 있다. 예를 들어, CRISPR 효소는 PAM 서열로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500, 또는 그 초과의 염기쌍 내에서 하나 또는 양 가닥의 절단을 지시할 수 있다. 일부 경우에, 가이드 폴리뉴클레오티드는 PAM으로부터 3 내지 10개 뉴클레오티드의 표적 서열에 결합한다. 돌연변이된 CRISPR 효소가 표적 서열을 함유하는 표적 폴리뉴클레오티드의 하나 또는 양 가닥을 절단하는 능력을 결하도록 상응하는 야생형 효소에 대해 돌연변이된 CRISPR 효소를 인코딩하는 벡터가 사용될 수 있다. Cas 단백질은 Cas9HiFi와 같은 고-충실도 Cas 단백질일 수 있다. 일부 경우에 Cas 단백질이 변형될 수 있다. 예를 들어, Cas 단백질 변형은 N7-메틸-Gppp(2'-O-메틸-A)를 포함할 수 있다.
Cas9는 야생형 예시적인 Cas9 폴리펩티드(예를 들어, S. 피오게네스로부터의 Cas9)와 적어도 또는 적어도 약 50%, 60%, 70%, 80%, 90%, 100% 서열 동일성 및/또는 서열 유사성을 갖는 폴리펩티드를 지칭할 수 있다. Cas9는 야생형 예시적인 Cas9 폴리펩티드(예를 들어, S. 피오게네스로부터의 것)와 최대 또는 최대 약 50%, 60%, 70%, 80%, 90%, 100% 서열 동일성 및/또는 서열 유사성을 갖는 폴리펩티드를 지칭할 수 있다. Cas9는 결실, 삽입, 치환, 변이체, 돌연변이, 융합, 키메라, 또는 이의 임의의 조합과 같은 아미노산 변화를 포함할 수 있는 Cas9 단백질의 야생형 또는 변형된 형태를 지칭할 수 있다. 일부 경우에 Cas와 같은 CRISPR 효소는 식물에서의 발현을 위해 코돈 최적화될 수 있다.
엔도뉴클레아제를 인코딩하는 폴리뉴클레오티드(예를 들어, Cas9와 같은 Cas 단백질)는 식물 세포와 같은 특정 세포에서의 발현을 위해 코돈 최적화될 수 있다. 이 유형의 최적화는 동일한 단백질을 인코딩하면서 의도된 숙주 유기체 또는 세포의 코돈 선호도를 모방하기 위해 외래-유래된 (예를 들어, 재조합) DNA의 돌연변이를 수반할 수 있다.
엔도뉴클레아제는 야생형 예시적인 부위-지향적 폴리펩티드(예를 들어, S. 피오게네스로부터의 Cas9)의 뉴클레아제 도메인에 대해 적어도 또는 적어도 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
S. 피오게네스 Cas9(SpCas9)는 게놈 조작을 위한 CRISPR 엔도뉴클레아제로 사용될 수 있다. 일부 경우에 다른 엔도뉴클레아제가 특정 게놈 표적을 표적화하기 위해 사용될 수 있다. 일부 경우에 비-NGG PAM 서열을 가진 합성 SpCas9-유래된 변이체가 사용될 수 있다. 추가로, 다양한 종으로부터의 다른 Cas9 오르토로그가 식별되었고 이들 "비-SpCas9"는 또한 본 발명에 유용할 수 있는 다양한 PAM 서열에 결합한다. 예를 들어, SpCas9의 비교적 큰 크기(대략 4kb 코딩 서열)는 SpCas9 cDNA를 담지하는 플라스미드가 세포에서 효율적으로 발현되지 않을 수 있음을 의미한다. 반대로, 스트렙토코커스 아우레우스 Cas9(SaCas9)에 대한 코딩 서열은 SpCas9보다 대략 1 킬로베이스 더 짧아, 가능하기로는 세포에서 효율적으로 발현되도록 허용한다.
S. 피오게네스 Cas9에 대한 대안은 Cpf1 패밀리로부터의 RNA-가이드된 엔도뉴클레아제를 포함할 수 있다. Cas9 뉴클레아제와 달리 Cpf1-매개된 DNA 절단의 결과는 짧은 3' 돌출부가 있는 이중-가닥 파단이다. Cpf1의 엇갈린 절단 패턴은 전통적인 제한 효소 클로닝과 유사한 방향성 유전자 전달의 가능성을 열어 유전자 편집의 효율성을 증가시킬 수 있다. 상기에서 기술된 Cas9 변이체 및 오르토로그와 마찬가지로, Cpf1은 또한 CRISPR에 의해 표적화될 수 있는 부위의 수를 SpCas9에 의해 선호된 NGG PAM 부위를 결하는 AT-풍부 영역 또는 AT-풍부 게놈으로 확장될 수 있다.
일부 양태에서 Cas 서열은 핵 국소화 서열(NLS)을 함유할 수 있다. 핵 국소화 서열은 SV40으로부터의 것일 수 있다. NLS는 SV40, 뉴클레오플라스민, 임포틴 알파, C-myc, EGL-13, TUS, hnRNPA1, Mata2 또는 PY-NLS 중 적어도 하나로부터의 것일 수 있다. NLS는 Cas 단백질의 C-말단 또는 N-말단 상에 있을 수 있다. 일부 경우에 Cas 단백질은 1 내지 5개 NLS 서열을 함유할 수 있다. Cas 단백질은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 최대 10개 NLS 서열을 함유할 수 있다. Cas9와 같은 Cas 단백질은 2개 NLS 서열을 함유할 수 있다. Cas 단백질은 SV40 및 뉴셀로플라스민 NLS 서열을 함유할 수 있다. Cas 단백질은 또한 적어도 하나의 비번역된 영역을 함유할 수 있다.
일부 양태에서, CRISPR 효소를 인코딩하는 벡터는 핵 국소화 서열(NLS) 서열을 함유할 수 있다. 일부 경우에, 벡터는 하나 이상의 NLS를 포함할 수 있다. 일부 경우에 벡터는 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 NLS를 함유할 수 있다. 예를 들어, CRISPR 효소는 암모-말단에서 또는 근처에서 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 초과 NLS, 카르복실-말단에서 또는 그 근처에서 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 초과 NLS, 또는 이의 임의의 조합(예를 들어, 암모-말단에서 하나 이상의 NLS 및 카르복실 말단에서 하나 이상의 NLS)을 포함할 수 있다. 하나보다 많은 NLS가 존재할 때, 각각은 다른 것들과 독립적으로 선택될 수 있어, 단일 NLS가 하나 초과의 카피에 및/또는 하나 이상의 카피에 존재하는 하나 이상의 다른 NLS와 조합되어 존재할 수 있다.
NLS는 모노파타이트 또는 바이파타이트일 수 있다. 일부 경우에, 바이파타이트 NLS는 모노파타이트 NLS와 반대되는 스페이서 서열을 가질 수 있다. NLS는 SV40, 뉴클레오플라스민, 임포틴 알파, C-myc, EGL-13, TUS, hnRNPA1, Mata2 또는 PY-NLS 중 적어도 하나로부터의 것일 수 있다. NLS는 예를 들어 N- 또는 C-말단 근처인 폴리펩티드 사슬 내의 어느 곳에나 위치할 수 있다. 예를 들어, NLS는 N- 또는 C-말단으로부터 폴리펩티드 사슬을 따라 그 내에 또는 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50개 아미노산 내에 있을 수 있다. 때때로 NLS는 N- 또는 C-말단 내에 또는 이로부터 약 50개 아미노산 또는 그 이상, 예를 들어, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1000개 아미노산 내에 있을 수 있다.
Cas 단백질의 임의의 기능적 농도가 세포에 도입될 수 있다. 예를 들어, 15 마이크로그램의 Cas mRNA가 세포에 도입될 수 있다. 다른 경우에, Cas mRNA는 0.5 마이크로그램 내지 100 마이크로그램까지 도입될 수 있다. Cas mRNA는 0.5, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100 마이크로그램에서 도입될 수 있다.
일부 경우에, 이중 니카제 접근법은 이중 가닥 파단 또는 게놈 파단을 도입하기 위해 사용될 수 있다. Cas 단백질은 두 뉴클레아제 도메인 내의 알려진 아미노산에서 돌연변이될 수 있으며, 이에 의해 하나의 뉴클레아제 도메인의 활성이 결실되고 단일 가닥 파단을 생성할 수 있는 닉카아제 Cas 단백질이 생성된다. 반대 가닥을 표적화하는 2개 별도의 가이드 RNA와 함께 닉카제는 표적 부위 내에서 이중 가닥 파단(DSB)을 생성하는 데 이용될 수 있다(종종 "이중 닉" 또는 "이중 닉카제" CRISPR 시스템으로 지칭됨). 이 접근법은 표적 특이성을 극적으로 증가시킬 수 있으며, 이는 DSB를 유발할 만큼 충분히 근접한 범위 내에서 2개의 표적-외 닉이 생성될 가능성이 없기 때문이다.
Cas9와 같은 뉴클레아제는 사용 이전 동일성 및 효능에 대해 시험될 수 있다. 예를 들어, 분광광도 분석, RNA 아가로스 겔 분석, LC-MS, 내독소 분석 및 무균 시험 중 적어도 하나를 사용하여 동일성 및 효능을 결정할 수 있다. 일부 경우에 Cas9 서열과 같은 뉴클레아제 서열을 시퀀싱하여 그 동일성을 확인할 수 있다. 일부 경우에, Cas9 단백질과 같은 Cas 단백질은 임상적 또는 치료적 사용 이전에 시퀀싱될 수 있다. 예를 들어, 정제된 시험관내 전사 생성물은 폴리아크릴아미드 겔 전기영동에 의해 평가되어 Cas9 이외의 임상 생성물 내에 다른 mRNA 종이 존재하지 않거나 실질적으로 다른 mRNA 종이 존재하지 않음을 확인할 수 있다. 부가적으로, Cas9와 같은 Cas 단백질을 인코딩하는 정제된 mRNA는 역-전사에 의해 검증을 거치고 이어서 시쿼싱 단계를 거쳐 뉴클레오티드 수준에서 동일성을 확인할 수 있다. 정제된 시험관내 전사 생성물은 mRNA가 Cas9에 대해 예상되는 크기이고 임상 또는 치료 생성물 내에 실질적으로 다른 mRNA 종이 존재하지 않는지 확인하기 위해 폴리아크릴아미드 겔 전기영동(PAGE)에 의해 평가될 수 있다.
일부 경우에, Cas9와 같은 뉴클레아제의 내독소 수준이 결정될 수 있다. 임상적으로/치료적으로 허용가능한 내독소의 수준은 3 EU/mL 미만일 수 있다. 임상적으로/치료적으로 허용가능한 내독소의 수준은 2 EU/mL 미만일 수 있다. 임상적으로/치료적으로 허용가능한 내독소의 수준은 1 EU/mL 미만일 수 있다. 임상적으로/치료적으로 허용가능한 내독소의 수준은 0.5 EU/mL 미만일 수 있다.
일부 경우에, Cas9와 같은 뉴클레아제는 무균 시험을 겪을 수 있다. 임상적으로/치료적으로 허용가능한 무균 시험의 수준은 0이거나 배양물에서 성장이 없는 것으로 표시될 수 있다. 임상적으로/치료적으로 허용가능한 무균 시험의 수준은 0.5%, 0.3%, 0.1% 또는 0.05% 성장 미만일 수 있다.
가이드하는 다중핵산
가이드하는 다중핵산은 DNA 또는 RNA일 수 있다. 가이드하는 다중핵산은 단일 가닥 또는 이중 가닥일 수 있다. 일부 경우에, 가이드하는 다중핵산은 단일 가닥 영역 및 이중 가닥 영역의 부위를 함유할 수 있다. 가이드하는 다중핵산은 또한 2차 구조를 형성할 수 있다. 본 명세서에 사용된 바와 같이, 용어 "가이드 RNA(gRNA)" 및 그의 문법적 등가물은 표적 DNA에 대해 특이적일 수 있고 Cas 단백질과 복합체를 형성할 수 있는 RNA를 지칭할 수 있다. 가이드 RNA는 표적 부위를 특정하고 절단을 위해 특정된 표적 DNA로 RNA/Cas 복합체를 가이드하는 가이드 서열 또는 스페이서 서열을 포함할 수 있다. 예를 들어, 가이드 RNA는 CRISPR 복합체를 표적 유전자 또는 이의 일부로 표적화하고 표적화된 이중 가닥 파단을 수행할 수 있다. 표적 DNA의 부위-특이적 절단은 1) 가이드 RNA와 표적 DNA(프로토스페이서로도 지칭됨) 사이의 염기-쌍 상보성과 2) 프로토스페이서 인접 모티브(PAM)라고 하는 표적 DNA의 짧은 모티프 둘 모두에 의해 결정된 위치에서 발생한다. 일부 경우에 gRNA는 일반적으로 발현되는 전사체 내의 초기 엑손에 위치한 gRNA를 식별할 수 있는 알고리즘을 사용하여 설계될 수 있다.
일부 경우에, 가이드 폴리뉴클레오티드는 메틸트랜스퍼라제, 하이드록실라제, 모노옥시게나제, 키나제, 데카르복실라제, 전사 조절자, 수송체, 인돌아민 2,3-디옥시게나제(IDO), 트립토판 2,3-디옥시게나제(TDO), TrpM, 포스포-2-데하이드로-3-데옥시헵토네이트 알돌라제, 3-데하이드로퀴네이트 신타제, 3-데하이드로퀴네이트 데하이드로게나제, 시키메이트 데하이드로게나제, 3-포스포시키메이트 1-카르복시비닐트랜스퍼라제, 시키메이트 키나제 1, 시키메이트 키나제 2, 코리스메이트 신타제, 트립토판 신타제 알파 사슬, 트립토판 신타제 베타 사슬, 안트라닐레이트 포스포리보실트랜스퍼라제 및 안트라닐레이트 신타제 성분을 인코딩하는 유전자의 표적 서열에 상보적일 수 있다. 일부 경우에, gRNA 또는 gDNA는 서열번호: 1-5 또는 상기 언급된 임의의 유전자에 상동성이거나 상보적인 표적 서열에 결합할 수 있다.
기능적 유전자 카피, 유전자 변이체 및 유사유전자는 맵핑되고 정렬되어 CRISPR 디자인을 위한 서열 주형을 생성한다. 일부 경우에, THCA 신타제의 정렬된 카피에 걸쳐 보존된 서열을 표적화하는 다중 가이드 RNA는 초기 인코딩 서열을 파괴하고 프레임시프트 돌연변이 삽입결실과 같은 코딩 서열에 돌연변이를 도입하도록 설계된다. 일부 경우에, 칸나비스 및 대마 게놈의 다른 곳에서 표적-외 부위의 낮은 발생을 갖는 가이드 RNA가 선택될 수 있다.
일 양태에서, CRISPR gRNA 라이브러리가 생성되어 DNA 분석에 의해 변이 식물을 스크리닝하는데 이용될 수 있다. 다중 CRISPR 공학은 새로운 칸나비노이드-생산 칸나비스 식물의 다양한 유전자형을 생성할 수 있다. 일부 경우에, 이들 식물은 소량, 희귀 및/또는 제대로 연구되지 않은 칸나비노이드의 상승된 수준을 생성한다.
일부 경우에, gRNA는 칸나비노이드 생합성 경로에 관여하는 유전자의 엑손을 표적화하도록 설계될 수 있다. 일부 경우에, gRNA는 초기 코딩 서열을 방해하도록 설계될 수 있다. 일 양태에서, 대상 가이드 RNA는 2가지 범주로 클러스터링될 수 있다: 프레임시프트 돌연변이 삽입결실을 도입하기 위해 이들 유전자 내에 초기 위치를 갖는 코딩 서열을 표적화함에 의해 기능적 단백질의 생산을 방해하도록 의도된 것들(KO 가이드); 및 유전자 조절 영역 내에서 확산되는 서열을 표적화하는 것들(발현 조절 가이드). 부가적으로, 칸나비스 및 대마 게놈의 다른 곳에서 표적-외 부위의 가장 낮은 발생을 갖는 가이드 RNA가 선택될 수 있다.
일부 경우에, gRNA는 표적 유전자 안으로 삽입하는 삽입결실의 패턴에 기초하여 선택될 수 있다. 후보 gRNA는 다음을 고려할 수 있는 스코어링 시스템을 사용하여 표적-외 잠재력에 의해 순위지정될 수 있다: (a) gRNA 서열과 밀접하게 일치하는 게놈 서열 사이의 총 불일치의 수; (b) PAM 부위에 가깝게 떨어지는 불일치에 대한 활성에 대해 부정적인 영향과 상관관계가 있는 PAM 부위에 대한 불일치 위치(들); (c) 가이드-DNA 상호작용을 방해하는 인접 불일치의 누적 효과를 설명하기 위한 불일치 사이의 거리; 및 이들의 임의의 조합. 일부 경우에, gRNA와 게놈 표적 부위 간의 불일치가 많을수록 그 부위의 CRISPR-매개된 절단 가능성이 낮아질 수 있다. 일부 경우에, 불일치 위치는 PAM 부위에 직접적으로 인접한다. 다른 경우에, 불일치 위치는 PAM 부위에서 1 뉴클레오티드에서 최대 100 킬로베이스 떨어져 있을 수 있다. 불일치를 포함하는 후보 gRNA는 경우에 따라 PAM에 인접하지 않을 수 있다. 다른 경우에, 불일치를 포함하는 적어도 2개 후보 gRNA는 서로로부터 1 뉴클레오티드에서 최대 100 킬로베이스 떨어져 있는 게놈에 결합할 수 있다. 불일치는 뉴클레오티드의 치환일 수 있다. 예를 들어, 일부 경우에 G가 T로 치환될 것이다. gRNA와 게놈 사이의 불일치는 CRISPR 유전자 편집의 감소된 충실도를 허용할 수 있다. 일부 경우에, 양성 스코어링 gRNA는 길이가 약 110개 뉴클레오티드일 수 있고 상보적 게놈 서열에 대한 불일치를 함유하지 않을 수 있다. 다른 경우에, 양성 스코어링 gRNA는 길이가 약 110개 뉴클레오티드일 수 있고 상보적 게놈 서열에 대해 최대 3개의 불일치를 함유할 수 있다. 다른 경우에, 양성 스코어링 gRNA는 길이가 약 110개 뉴클레오티드일 수 있고 상보적 게놈 서열에 대해 최대 20개 불일치를 함유할 수 있다. 일부 경우에, 가이드하는 다중핵산은 포스포로티오에이트일 수 있는 뉴클레오티드간 연결을 함유할 수 있다. 임의의 수의 포스포로티오에이트가 존재할 수 있다. 예를 들어, 1 내지 약 100개의 포스포로티오에이트가 가이드하는 다중핵산 서열에 존재할 수 있다. 일부 경우에 1 내지 10개의 포스포로티오에이트가 존재한다. 일부 경우에 8개의 포스포로티오에이트가 가이드하는 다중핵산 서열에 존재한다.
일부 경우에, 최고 스코어링 gRNA가 설계 및 선택될 수 있고 각각의 표적-상 편집 효율이 식물 세포에서 실험적으로 평가될 수 있다. 일부 경우에 TiDE 분석에 의해 결정된 편집 효율성은 적어도 약 20%를 초과할 수 있다. 다른 경우에, 편집 효율은 약 20% 내지 약 50%, 약 50% 내지 약 80%, 약 80% 내지 약 100%일 수 있다. 일부 경우에, 시험 GMP 실행에서 삽입결실 퍼센트가 결정될 수 있다. 예를 들어, 최종 세포 생성물은 생거 시퀀싱 및 TIDE 분석에 의해 표적-상 삽입결실 형성에 대해 분석될 수 있다. 게놈 DNA는 대조군 및 실험 샘플 둘 모두로부터 약 1x106 세포에서 추출될 수 있고 칸나비노이드 생합성 경로에 관여하는 유전자와 같이 파괴된 유전자에 측접하는 프라이머를 사용하여 PCR을 수행할 수 있다. 생거 시퀀싱 크로마토그램은 대조군과 녹아웃 샘플의 비교에 의해 삽입결실 빈도와 삽입결실의 크기 분포를 정량화할 수 있는 TIDE 소프트웨어 프로그램을 사용하여 분석될 수 있다.
본 명세서에 개시된 방법은 또한 세포 또는 식물 배아에 적어도 하나의 가이드 RNA 또는 핵산, 예를 들어, 적어도 하나의 가이드 RNA를 인코딩하는 DNA를 도입하는 것을 포함할 수 있다. 가이드 RNA는 RNA-가이드된 엔도뉴클레아제와 상호작용하여 엔도뉴클레아제를 특정 표적 부위로 지향시킬 수 있으며, 이 부위에서 가이드 RNA 염기의 5' 말단은 염색체 서열에서 특정 프로토스페이서 서열과 쌍을 이룬다.
가이드 RNA는 2개 RNA, 예를 들어, CRISPR RNA(crRNA) 및 전사활성화 crRNA(tracrRNA)를 포함할 수 있다. 가이드 RNA는 때때로 crRNA 및 tracrRNA의 일부(예를 들어, 기능적 부분)의 융합에 의해 형성된 단일-가이드 RNA(sgRNA)를 포함할 수 있다. 가이드 RNA는 또한 crRNA 및 tracrRNA를 포함하는 이중 RNA일 수 있다. 가이드 RNA는 crRNA를 포함하고 tracrRNA를 결할 수 있다. 더욱이, crRNA는 표적 DNA 또는 프로토스페이서 서열과 혼성화할 수 있다.
상기 논의된 바와 같이, 가이드 RNA는 발현 생성물일 수 있다. 예를 들어, 가이드 RNA를 인코딩하는 DNA는 가이드 RNA를 인코딩하는 서열을 포함하는 벡터일 수 있다. 가이드 RNA는 가이드 RNA 및 프로모터를 코딩하는 서열을 포함하는 플라스미드 DNA 또는 단리된 가이드 RNA로 세포 또는 식물 배아를 형질감염시킴에 의해 세포 또는 유기체 내로 전달될 수 있다. 일부 양태에서, 프로모터는 잎-특이적 프로모터, 꽃-특이적 프로모터, THCA 신타제 프로모터, CaMV35S 프로모터, FMV35S 프로모터, 및 tCUP 프로모터로 구성된 군으로부터 선택될 수 있다. 가이드 RNA는 또한 입자 충격을 사용하는 것과 같은 다른 방식으로 세포 또는 식물 배아 내로 전달될 수 있다.
가이드 RNA는 단리될 수 있다. 예를 들어, 가이드 RNA는 단리된 RNA의 형태로 세포 또는 식물 배아 안으로 형질감염될 수 있다. 가이드 RNA는 임의의 시험관내 전사 시스템을 사용하여 시험관내 전사에 의해 제조될 수 있다. 가이드 RNA는 가이드 RNA에 대한 인코딩 서열을 포함하는 플라스미드 형태가 아니라 단리된 RNA의 형태로 세포에 전달될 수 있다.
가이드 RNA는 DNA-표적화 세그먼트 및 단백질 결합 세그먼트를 포함할 수 있다. DNA-표적화 세그먼트(또는 DNA-표적화 서열, 또는 스페이서 서열)은 표적 DNA(예를 들어, 프로토스페이서) 내의 특정 서열에 상보적일 수 있는 뉴클레오티드 서열을 포함한다. 단백질-결합 세그먼트(또는 단백질-결합 서열)는 부위-지향된 변형 폴리펩티드, 예를 들어 Cas 단백질과 같은 RNA-가이드된 엔도뉴클레아제와 상호작용할 수 있다. "세그먼트"는 분자의 세그먼트/섹션/영역, 예를 들어 RNA에서 뉴클레오티드의 인접 스트레치를 의미한다. 세그먼트은 또한 세그먼트가 하나 초과의 분자의 영역을 포함할 수 있도록 복합체의 영역/섹션을 의미할 수 있다. 예를 들어, 일부 경우에 DNA-표적화 RNA의 단백질-결합 세그먼트는 하나의 RNA 분자이고 따라서 단백질-결합 세그먼트는 그 RNA 분자의 영역을 포함한다. 다른 경우에, DNA-표적화 RNA의 단백질-결합 세그먼트는 상보성의 영역을 따라 혼성화되는 2개 별도의 분자를 포함한다.
가이드 RNA는 2개 별도의 RNA 분자 또는 단일 RNA 분자를 포함할 수 있다. 예시적인 단일 분자 가이드 RNA는 DNA-표적화 세그먼트 및 단백질-결합 세그먼트 둘 모두를 포함한다.
예시적인 두-분자 DNA-표적화 RNA는 crRNA-유사("CRISPR RNA" 또는 "표적자-RNA" 또는 "crRNA" 또는 "crRNA 반복") 분자 및 상응하는 tracrRNA-유사("트랜스- 작용 CRISPR RNA" 또는 "활성자-RNA" 또는 "tracrRNA") 분자를 포함할 수 있다. 제1 RNA 분자는 가이드 RNA의 단백질-결합 세그먼트를 포함하는 이중-가닥 RNA(dsRNA) 이중가닥의 절반을 형성할 수 있는 뉴클레오티드의 스트레치 및 DNA-표적화 세그먼트(예를 들어, 스페이서)를 포함할 수 있는 crRNA-유사 분자(표적자-RNA)일 수 있다. 제2 RNA 분자는 가이드 RNA의 단백질-결합 세그먼트의 dsRNA 이중가닥의 나머지 절반을 형성할 수 있는 뉴클레오티드의 스트레치를 포함할 수 있는 상응하는 tracrRNA-유사 분자(활성자-RNA)일 수 있다. 다시 말해서, crRNA-유사 분자의 뉴클레오티드의 스트레치는 가이드 RNA의 단백질-결합 도메인의 dsRNA 이중가닥을 형성하기 위해 tracrRNA-유사 분자의 뉴클레오티드 스트레치에 상보적일 수 있고 이와 혼성화할 수 있다. 이와 같이, 각각의 crRNA-유사 분자는 상응하는 tracrRNA-유사 분자를 갖는다고 말할 수 있다. crRNA-유사 분자는 추가로 단일 가닥 DNA-표적화 세그먼트 또는 스페이서 서열을 제공할 수 있다. 따라서, crRNA-유사 및 tracrRNA-유사 분자(상응하는 쌍으로서)는 혼성화하여 가이드 RNA를 형성할 수 있다. 대상 두-분자 가이드 RNA는 임의의 상응하는 crRNA 및 tracrRNA 쌍을 포함할 수 있다.
가이드 RNA의 DNA-표적화 세그먼트 또는 스페이서 서열은 가이드 RNA의 DNA-표적화 세그먼트가 표적 부위 또는 프로토스페이서와 염기쌍을 이룰 수 있도록 염색체 서열, 예를 들어 프로토스페이서 서열 내 표적 부위에서의 서열에 상보적일 수 있다. 일부 경우에, 가이드 RNA의 DNA-표적화 세그먼트는 약 10개 뉴클레오티드 내지 약 25개 뉴클레오티드 이상을 포함할 수 있다. 예를 들어, 가이드 RNA의 제1 영역과 염색체 서열 내 표적 부위 사이의 염기쌍의 영역은 길이가 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25 또는 25 초과의 뉴클레오티드일 수 있거나 일 수 있다. 때때로, 가이드 RNA의 제1 영역은 길이가 약 19, 20 또는 21개 뉴클레오티드일 수 있거나 일 수 있다.
가이드 RNA는 약 20개 뉴클레오티드의 핵산 서열을 표적화할 수 있다. 표적 핵산은 약 20개 미만 또는 그 미만의 뉴클레오티드일 수 있다. 표적 핵산은 적어도 또는 적어도 약 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30개 이상의 뉴클레오티드일 수 있다. 표적 핵산은 최대 또는 최대 약 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30개 이상의 뉴클레오티드일 수 있다. 표적 핵산 서열은 PAM의 첫 번째 뉴클레오티드의 5' 바로 옆의 약 20개 염기일 수 있거나 일 수 있다. 가이드 RNA는 칸나비노이드 생합성 경로에 관여하는 단백질을 인코딩하는 유전자의 핵산 서열을 표적화할 수 있다. 일부 경우에, 가이드 RNA와 같은 가이드하는 다중핵산은 PAM으로부터 약 1개 염기쌍 내지 약 20개 염기쌍 떨어진 게놈 영역에 결합할 수 있다. 가이드는 PAM으로부터 약 1, 2, 3, 4, 5 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 최대 약 20개 염기쌍 떨어진 게놈 영역에 결합할 수 있다.
가이드 핵산, 예를 들어 가이드 RNA는 다른 핵산, 예를 들어 세포의 게놈에서 표적 핵산 또는 프로토스페이서에 혼성화할 수 있는 핵산을 지칭할 수 있다. 가이드 핵산은 RNA일 수 있다. 가이드 핵산은 DNA일 수 있다. 가이드 핵산은 부위-특이적으로 핵산의 서열에 결합하도록 프로그래밍되거나 설계될 수 있다. 가이드 핵산은 폴리뉴클레오티드 사슬을 포함할 수 있고 단일 가이드 핵산으로 불릴 수 있다. 가이드 핵산은 2개의 폴리뉴클레오티드 사슬을 포함할 수 있고 이중 가이드 핵산으로 불릴 수 있다.
가이드 핵산은 새로운 또는 증진된 특징을 가진 핵산을 제공하기 위해 하나 이상의 변형을 포함할 수 있다. 가이드 핵산은 핵산 친화성 태그를 포함할 수 있다. 가이드 핵산은 합성 뉴클레오티드, 합성 뉴클레오티드 유사체, 뉴클레오티드 유도체, 및/또는 변형된 뉴클레오티드를 포함할 수 있다. 가이드 핵산은 표적 핵산(예를 들어, 프로토스페이서)에서의 서열에 혼성화할 수 있는, 예를 들어 5' 말단 또는 3' 말단에서 또는 그 부근에서 뉴클레오티드 서열(예를 들어, 스페이서)을 포함할 수 있다. 가이드 핵산의 스페이서는 혼성화(, 염기 쌍화)를 통해 서열-특이적 방식으로 표적 핵산과 상호작용할 수 있다. 스페이서 서열은 프로토스페이서 인접 모티프(PAM)의 5' 또는 3'에 위치한 표적 핵산에 혼성화할 수 있다. 스페이서 서열의 길이는 적어도 또는 적어도 약 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30 이상의 뉴클레오티드일 수 있다. 스페이서 서열의 길이는 최대 또는 최대 약 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30 이상의 뉴클레오티드일 수 있다.
가이드 RNA는 또한 2차 구조를 형성하는 dsRNA 이중가닥 영역을 포함할 수 있다. 예를 들어, 가이드 RNA에 의해 형성된 2차 구조는 줄기(또는 헤어핀) 및 루프를 포함할 수 있다. 루프와 줄기의 길이는 다를 수 있다. 예를 들어, 루프는 길이가 약 3 내지 약 10개 뉴클레오티드 범위일 수 있고, 줄기는 길이가 약 6 내지 약 20개 염기쌍 범위일 수 있다. 줄기는 1개 내지 약 10개 뉴클레오티드의 하나 이상의 융기부를 포함할 수 있다. 제2 영역의 전반적 길이는 길이가 약 16 내지 약 60개 뉴클레오티드의 범위일 수 있다. 예를 들어, 루프는 길이가 약 4개 뉴클레오티드일 수 있거나 일 수 있고 줄기는 약 12개 염기쌍일 수 있거나 일 수 있다. dsRNA 이중가닥 영역은 RNA-가이드된 엔도뉴클레아제, 예를 들어, Cas 단백질과 같은 RNA-결합 단백질과 복합체를 형성할 수 있는 단백질-결합 세그먼트를 포함할 수 있다.
가이드 RNA는 또한 본질적으로 단일-가닥일 수 있는 5' 또는 3' 말단에 꼬리 영역을 포함할 수 있다. 예를 들어, 꼬리 영역은 때로는 관심있는 세포에서 임의의 염색체 서열에 대해 상보성이 아니고 때로는 가이드 RNA의 나머지 부분에 대해 상보성이 아니다. 더욱이, 꼬리 영역의 길이는 다양할 수 있다. 꼬리 영역은 길이가 약 4개 초과 또는 그 초과 뉴클레오티드일 수 있다. 예를 들어, 꼬리 영역의 길이는 길이가 약 5 내지 약 60개 뉴클레오티드의 범위일 수 있다.
가이드 RNA는 RNA 분자로서 세포 또는 배아에 도입될 수 있다. 예를 들어, RNA 분자는 시험관내에서 전사될 수 있고/있거나 화학적으로 합성될 수 있다. 그런 다음 가이드 RNA는 RNA 분자로 세포나 배아에 도입될 수 있다. 가이드 RNA는 또한 비-RNA 핵산 분자, 예를 들어, DNA 분자의 형태로 세포 또는 배아에 도입될 수 있다. 예를 들어, 가이드 RNA를 인코딩하는 DNA는 관심있는 세포 또는 배아에서 가이드 RNA의 발현을 위한 프로모터 조절 서열에 작동가능하게 연결될 수 있다. RNA 코딩 서열은 RNA 폴리머라제 III(Pol III)에 의해 인식되는 프로모터 서열에 작동가능하게 연결될 수 있다.
가이드 RNA를 인코딩하는 DNA 분자는 또한 선형일 수 있다. 가이드 RNA를 인코딩하는 DNA 분자는 또한 원형일 수 있다. 가이드 RNA를 인코딩하는 DNA 서열은 또한 벡터의 일부일 수 있다. 벡터의 일부 예는 플라스미드 벡터, 파지미드, 코스미드, 인공/미니-염색체, 트랜스포존 및 바이러스 벡터를 포함할 수 있다. 예를 들어, RNA-가이드된 엔도뉴클레아제를 인코딩하는 DNA는 플라스미드 벡터에 존재한다. 적합한 플라스미드 벡터의 다른 비-제한적 예는 pUC, pBR322, pET, pBluescript 및 이들의 변이체를 포함한다. 더욱이, 벡터는 추가적인 발현 조절 서열(예를 들어, 인핸서 서열, Kozak 서열, 폴리아데닐화 서열, 전사 종결 서열 등), 선택가능한 마커 서열(예를 들어, 항생제 내성 유전자), 복제의 기점 등을 포함할 수 있다.
RNA-가이드된 엔도뉴클레아제 및 가이드 RNA 둘 모두가 DNA 분자로서 세포에 도입되는 경우, 각각은 별개의 분자의 일부(예를 들어, 융합 단백질 코딩 서열을 함유하는 하나의 벡터 및 가이드 RNA 코딩 서열을 함유하는 제2 벡터)일 수 있거나 또는 둘 모두 동일한 분자의 일부(예를 들어, 융합 단백질 및 가이드 RNA 둘 모두에 대한 코딩 (및 조절) 서열을 함유하는 하나의 벡터)일 수 있다.
Cas 단백질, 예컨대 Cas9 단백질 또는 이의 임의의 유도체는 가이드 RNA와 사전-복합체화되어 리보핵단백질(RNP) 복합체를 형성할 수 있다. RNP 복합체는 식물 세포에 도입될 수 있다. RNP 복합체의 도입은 시기적절할 수 있다. 세포는 세포 주기의 G1, S 및/또는 M 단계에서 다른 세포와 동기화될 수 있다. RNP 복합체는 HDR이 강화되도록 세포 단계에서 전달될 수 있다. RNP 복합체는 상동성 지향된 수선을 촉진할 수 있다.
가이드 RNA는 또한 변형될 수 있다. 변형은 화학적 변경, 합성 변형, 뉴클레오티드 부가 및/또는 뉴클레오티드 차감을 포함할 수 있다. 변형은 또한 CRISPR 게놈 공학을 증진시킬 수 있다. 변형은 gRNA의 키랄성을 변경할 수 있다. 일부 경우에 키랄성은 변형 후 균일하거나 입체적 순수할 수 있다. 가이드 RNA는 합성될 수 있다. 합성된 가이드 RNA는 CRISPR 게놈 엔지니어링을 증진시킬 수 있다. 가이드 RNA는 또한 절단될 수 있다. 절단은 원하지 않는 표적-외 돌연변이를 줄이는 데 사용될 수 있다. 절단은 임의의 수의 뉴클레오티드 결실을 포함할 수 있다. 예를 들어, 절단은 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 이상의 뉴클레오티드를 포함할 수 있다. 가이드 RNA는 임의의 길이의 표적 상보성 영역을 포함할 수 있다. 예를 들어, 표적 상보성 영역은 길이가 20 미만의 뉴클레오티드일 수 있다. 표적 상보성 영역은 길이가 20 초과의 뉴클레오티드일 수 있다. 표적 상보성 영역은 PAM 서열에 직접적으로 인접한 약 5bp 내지 약 20bp를 표적화할 수 있다. 표적 상보성 영역은 PAM 서열에 직접적으로 인접한 약 13bp를 표적화할 수 있다. 본 명세서에 기재된 바와 같은 다중핵산은 변형될 수 있다. 변형은 다중핵산의 임의의 위치에서 이루어질 수 있다. 단일 다중핵산에 대해 하나 초과의 변형이 이루어질 수 있다. 다중핵산은 변형 후 품질 관리를 받을 수 있다. 일부 경우에, 품질 관리에는 PAGE, HPLC, MS 또는 이들의 임의의 조합이 포함될 수 있다. 변형은 치환, 삽입, 결실, 화학적 변형, 물리적 변형, 안정화, 정제 또는 이들의 임의의 조합일 수 있다. 다중핵산은 또한 5' 아데닐레이트, 5' 구아노신-트리포스페이트 캡, 5'N7-메틸구아노신-트리포스페이트 캡, 5'트리포스페이트 캡, 3'포스페이트, 3'티오포스페이트, 5'포스페이트, 5'티오포스페이트, Cis-Syn 티미딘 이량체, 삼량체, C12 스페이서, C3 스페이서, C6 스페이서, dSpacer, PC 스페이서, rSpacer, 스페이서 18, 스페이서 9,3'-3' 변형, 5'-5' 변형, 비염기성, 아크리딘, 아조벤젠, 비오틴, 비오틴 BB, 비오틴 TEG, 콜레스테릴 TEG, 데스티오비오틴 TEG, DNP TEG, DNP-X, DOTA, dT-비오틴, 이중 비오틴, PC 비오틴, 소랄렌 C2, 소랄렌 C6, TINA, 3'DABCYL, 블랙홀 켄처 1, 블랙홀 켄처 2, DABCYL SE, dT-DABCYL, IRDye QC-1, QSY-21, QSY-35, QSY-7, QSY-9, 카르복실 링커, 티올 링커, 2'데옥시리보뉴클레오시드 유사체 퓨린, 2'데옥시리보뉴클레오시드 유사체 피리미딘, 리보뉴클레오시드 유사체, 2'-O-메틸 리보뉴클레오시드 유사체, 당 변형된 유사체, 워블/보편 염기, 형광 염료 표지, 2'플루오로 RNA, 2'O-메틸 RNA, 메틸포스포네이트, 포스포디에스테르 DNA, 포스포디에스테르 RNA, 포스포티오에이트 DNA, 포스포로티오에이트 RNA, UNA, 슈도우리딘-5'-트리포스페이트, 5-메틸시티딘-5'-트리포스페이트, 또는 이들의 임의의 조합에 의해 변형될 수 있다. 일부 경우에 변형은 영구적일 수 있다. 다른 경우에는 변형은 일시적일 수 있다. 일부 경우에, 다수의 변형이 다중핵산에 이루어진다. 다중핵산 변형은 그 형태, 극성, 소수성, 화학적 반응성, 염기-쌍화 상호작용 또는 이의 조합과 같은 뉴클레오티드의 물리-화학적 특성을 변경할 수 있다. 일부 양태에서 gRNA는 변형될 수 있다. 일부 경우에, 변형은 5' 말단, 3' 말단, 5' 말단에서 3' 말단으로, 단일 염기 변형, 2'-리보스 변형 또는 이의 임의의 조합 상에 있다. 변형은 염기 치환, 삽입, 결실, 화학적 변형, 물리적 변형, 안정화, 정제, 및 이의 임의의 조합으로 구성된 군으로부터 선택될 수 있다. 일부 경우에, 변형은 화학적 변형이다.
일부 경우에, 변형은 "m"으로 표시된 2-O-메틸 3 포스포로티오에이트 부가이다. 포스포티오에이트 골격은 "(ps)"로 표시될 수 있다. 2-O-메틸 3 포스포로티오에이트 부가는 1 염기로부터 150 염기까지 수행될 수 있다. 2-O-메틸 3 포스포로티오에이트 부가는 1 염기로부터 4 염기까지 수행될 수 있다. 2-O-메틸 3 포스포로티오에이트 부가는 2 염기에 수행될 수 있다. 2-O-메틸 3 포스포로티오에이트 부가는 4 염기에 수행될 수 있다. 변형은 또한 절단일 수 있다. 절단은 5-염기 절단일 수 있다. 일부 경우에, 변형은 C 말단 및 N 말단 뉴클레오티드에 있을 수 있다.
변형은 또한 포스포로티오에이트 치환일 수 있다. 일부 경우에 천연 포스포디에스테르 결합은 세포 뉴클레아제에 의한 빠른 분해에 민감성일 수 있고; 포스포로티오에이트(PS) 결합 치환을 사용한 뉴클레오티드간 연결의 변형은 세포 분해에 의한 가수분해에 대해 더 안정할 수 있다. 변형은 다중핵산에서 안정성을 증가시킬 수 있다. 변형은 또한 생물학적 활성을 증진시킬 수 있다. 일부 경우에, 포스포로티오에이트 강화된 RNA 다중핵산은 RNase A, RNase T1, 송아지 혈청 뉴클레아제, 또는 이의 임의의 조합을 억제할 수 있다. 이들 특성은 PS-RNA 다중핵산을 뉴클레아제에 대한 노출이 생체내 또는 시험관내에서 높은 확률로 발생하는 적용에서 사용되도록 허용할 수 있다. 예를 들어, 포스포로티오에이트(PS) 결합은 엑소뉴클레아제 분해를 억제할 수 있는 다중핵산의 5'- 또는 3'-말단에서 마지막 3-5 뉴클레오티드 사이에 도입될 수 있다. 일부 경우에 엔도뉴클레아제에 의한 공격을 줄이기 위해 전체 다중핵산 전반에 걸쳐 포스포로티오에이트 결합이 부가될 수 있다.
또 다른 실시형태에서, 유전적으로 변형된 균류는 디메틸트립타민, 실로시빈 또는 실로신과 같은 트립타민 유래된 기질을 증가시키는 균류 또는 그의 세포 내로 (i) 적어도 하나의 핵 국소화 신호를 포함하는 적어도 하나의 RNA-가이드된 엔도뉴클레아제 또는 적어도 하나의 핵 국소화 신호를 포함하는 적어도 하나의 RNA-가이드된 엔도뉴클레아제를 인코딩하는 핵산, (ii) 적어도 하나의 가이드 RNA를 인코딩하는 적어도 하나의 가이드 RNA 또는 DNA, 및 선택적으로 (iii) 적어도 하나의 공여자 폴리뉴클레오티드 예컨대 바코드를 도입하는 것; 및 각각의 가이드 RNA가 RNA-가이드된 엔도뉴클레아제가 표적화된 부위에 이중-가닥의 파단을 도입하고, 이중-가닥의 파단은 염색체 서열이 변형되도록 DNA 수선 과정에 의해 수선되는, 염색체 서열에서 표적화된 부위로 RNA-가이드된 엔도뉴클레아제를 지향하도록 균류 또는 그의 세포를 배양하는 것을 포함하며, 여기서 표적화된 부위는 메틸트랜스퍼라제, 하이드록실라제, 모노옥시게나제, 키나제, 데카르복실라제, 추정 전사 조절자 및 추정 트랜스포터를 인코딩하는 임의의 유전자에 위치되고 염색체 변형은 상기 유전자의 전사 및/또는 번역을 중단시키거나 방해한다.
일부 경우에, 조작된 가이드 RNA의 특이성을 결정하기 위해 GUIDE-Seq 분석이 수행될 수 있다. CRISPR 시스템 뉴클레아제에 의한 표적-외 절단의 GUIDE-Seq 프로파일링의 일반적인 메커니즘 및 프로토콜은 Tsai, S. et al., "GUIDE-Seq enables genome-wide profiling of off-target cleavage by CRISPR system nucleases," Nature, 33: 187-197 (2015)에 기술되어 있다. 차세대 시퀀싱에 의해 표적-외 빈도를 평가하기 위해 세포는 Cas9 mRNA 및 가이드하는 RNA로 형질감염될 수 있다. 게놈 DNA는 형질감염 후 약 72시간부터 형질감염된 세포로부터 단리되고 잠재적인 표적-외 부위에서 PCR 증폭될 수 있다. 잠재적인 표적-외 부위는 웰컴 트러스트 생거 인스티튜트 게놈 편집 데이터베이스(WGE) 알고리즘을 사용하여 예측될 수 있다. 후보 표적-외 부위는 표적-상 부위에 대한 서열 상동성을 기반으로 선택될 수 있다. 일부 경우에, gRNA와 게놈 표적 부위 사이에 약 4개 이하의 불일치가 있는 부위가 이용될 수 있다. 각 후보 표적-외 부위에 대해 2개의 프라이머 쌍을 설계할 수 있다. PCR 앰플리콘은 미처리(대조군) 및 Cas9/gRNA-처리된 세포 둘 모두에서 얻을 수 있다. PCR 앰플리콘을 풀링될 수 있다. NGS 라이브러리는 TruSeq Nano DNA 라이브러리 준비 키트(Illumina)를 사용하여 준비할 수 있다. 샘플은 250bp 쌍을 이룬-말단 작업흐름을 사용하여 Illumina HiSeq 기계에서 분석될 수 있다. 일부 경우에, gRNA 라이브러리당 약 4천만 개의 매핑가능한 NGS 판독을 얻을 수 있다. 이는 gRNA의 각 후보 표적-외 부위에 대해 평균 약 450,000개의 판독 수와 동일할 수 있다. 일부 경우에, CRISPR-매개된 파쇄의 검출은 임의의 게놈 유전자좌에서 0.1%만큼 낮은 빈도로 될 수 있다.
컴퓨터 예측은 표적화된 유전자에 대한 가장 안전한 선택일 가능성이 있는 후보 gRNA를 선택하는 데 사용될 수 있다. 그런 다음 후보 gRNA는 잠재적인 표적-외 부위의 컴퓨터 예측으로 조정되는 집중된 접근방식을 사용하여 경험적으로 시험될 수 있다. 일부 경우에, gRNA 표적-외 안전성의 평가는 차세대 심층 시퀀싱 접근방식을 이용하여 각 gRNA에 대한 CRISPR 설계 도구에 의해 예측된 잠재적 표적-외 부위를 분석할 수 있다. 일부 경우에 gRNA는 게놈에서 임의의 서열에 대해 3개 미만의 불일치로 선택될 수 있다(완벽하게 일치하는 의도된 표적 제외). 일부 경우에, gRNA는 게놈에서 임의의 서열에 대해 50, 40, 30, 20, 10, 5, 4, 3, 2 또는 1개 미만의 불일치(들)로 선택될 수 있다. 일부 경우에, 컴퓨터 시스템이나 소프트웨어를 이용하여 낮은 표적-외 가능성의 예측을 갖는 후보 gRNA의 권장을 제공할 수 있다.
일부 경우에, 잠재적 표적-외 부위는 GUIDE-Seq 및 표적화된 PCR 증폭, 및 차세대 시퀀싱 중 적어도 하나로 식별될 수 있다. 부가하여, Cas9/gRNA-처리된 세포와 같은 변형된 세포는 핵형분석을 통해 염색체 재-배열 또는 전위를 식별할 수 있다.
gRNA는 임의의 기능적 농도로 도입될 수 있다. 예를 들어, gRNA는 10 마이크로그램으로 세포에 도입될 수 있다. 다른 경우에, gRNA는 0.5 마이크로그램에서 100 마이크로그램까지 도입될 수 있다. gRNA는 0.5, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100 마이크로그램에서 도입될 수 있다.
가이드하는 다중핵산은 임의의 빈도의 염기를 가질 수 있다. 예를 들어, 가이드하는 다중핵산은 29개의 A, 17개의 C, 23개의 G, 23개의 U, 3개의 mG, 1개의 mC 및 4개의 mU를 가질 수 있다. 가이드하는 다중핵산은 약 1 내지 약 100개의 뉴클레오티드를 가질 수 있다. 가이드하는 다중핵산은 약 1 내지 30개의 단일 폴리뉴클레오티드를 가질 수 있다. 가이드하는 다중핵산은 약 1 내지 10, 10 내지 20, 또는 20 내지 30개의 단일 뉴클레오티드를 가질 수 있다.
가이드하는 다중핵산은 사용 전에 동일성 및 효능에 대해 시험될 수 있다. 예를 들어, 분광광도 분석, RNA 아가로스 겔 분석, LC-MS, 내독소 분석 및 무균 시험 중 적어도 하나를 사용하여 동일성 및 효능을 결정할 수 있다. 일부 경우에, 동일성 시험은 임상적/치료적 사용에 대해 허용가능한 수준을 결정할 수 있다. 예를 들어, 허용가능한 분광광도계 분석 결과는 5.0 ± 0.5mg/mL에서 14 ± 2μL/바이알일 수 있다. 허용가능한 분광광도계 분석 결과는 또한 5.0 ± 0.5mg/mL에서 약 10-20 ± 2 μL/바이알 또는 약 3.0 내지 7.0 ± 0.5mg/mL에서 약 10-20 ± 2μL/바이알일 수 있다. 가이드하는 다중핵산의 허용가능한 임상적/치료적 크기는 약 100개 염기일 수 있다. 가이드하는 다중핵산의 임상적/치료적 크기는 약 5개 염기 내지 약 150개 염기일 수 있다. 가이드하는 다중핵산의 임상적/치료적 크기는 약 20개 염기 내지 약 150개 염기일 수 있다. 가이드하는 다중핵산의 임상적/치료적 크기는 약 40개 염기 내지 약 150개 염기일 수 있다. 가이드하는 다중핵산의 임상적/치료적 크기는 약 60개 염기 내지 약 150개 염기일 수 있다. 가이드하는 다중핵산의 임상적/치료적 크기는 약 80개 염기 내지 약 150개 염기일 수 있다. 가이드하는 다중핵산의 임상적/치료적 크기는 약 100개 염기 내지 약 150개 염기일 수 있다. 가이드하는 다중핵산의 임상적/치료적 크기는 약 110개 염기 내지 약 150개 염기일 수 있다. 가이드하는 다중핵산의 임상적/치료적 크기는 약 120개 염기 내지 약 150개 염기일 수 있다.
일부 경우에, 가이드하는 다중핵산의 질량이 결정될 수 있다. 질량은 LC-MS 검정에 의해 결정될 수 있다. 질량은 약 32,461.0amu일 수 있다. 가이드하는 다중핵산은 약 30,000amu 내지 약 50,000amu의 질량을 가질 수 있다. 가이드하는 다중핵산은 약 30,000amu 내지 40,000amu, 약 40,000amu 내지 약 50,000amu의 질량을 가질 수 있다. 질량은 가이드하는 다중핵산의 나트륨염의 것일 수 있다.
일부 경우에, 가이드하는 다중핵산의 내독소 수준이 결정될 수 있다. 임상적으로/치료적으로 허용가능한 내독소 수준은 3EU/mL 미만일 수 있다. 임상적으로/치료적으로 허용가능한 내독소 수준은 2EU/mL 미만일 수 있다. 임상적으로/치료적으로 허용가능한 내독소 수준은 1EU/mL 미만일 수 있다. 임상적으로/치료적으로 허용가능한 내독소 수준은 0.5EU/mL 미만일 수 있다.
일부 경우에, 가이드하는 다중핵산은 무균 시험을 수행할 수 있다. 임상적으로/치료적으로 허용가능한 무균 시험의 수준은 0이거나 배양물 상에서 성장이 없는 것으로 표지될 수 있다. 임상적으로/치료적으로 허용가능한 무균 시험의 수준은 0.5% 미만의 성장일 수 있다.
가이드하는 다중핵산은 다양한 방법, 예를 들어 자동화된 고체-상 합성에 의해 조립될 수 있다. 다중핵산은 표준 고체-상 DNA/RNA 합성을 사용하여 구축될 수 있다. 다중핵산은 또한 합성 절차를 사용하여 구축될 수 있다. 다중핵산은 또한 수동으로 또는 완전히 자동화된 방식으로 합성될 수 있다. 일부 경우에, 합성 절차는 5'-하이드록실 올리고뉴클레오티드가 초기에 상응하는 5'-H-포스포네이트 모노 에스테르로 변형될 수 있고, 후속적으로 이미다졸의 존재 하에 활성화된 5'-포스포이미다졸리데이트로 산화되고, 최종적으로 고체 지지체 상에서 피로포스페이트와 반응할 수 있음을 포함할 수 있다. 이 절차는 PAGE, HPLC, MS 또는 이의 임의의 조합과 같은 합성 후 정제 단계를 포함할 수 있다.
공여자 서열
일부 경우에, 공여자 서열은 균류, 효모, 식물 또는 그의 일부의 게놈에 도입될 수 있다. 일부 경우에, 공여자는 게놈 파단에 삽입된다. 일부 양태에서, 공여자는 표적 서열을 측접하는 시퀀싱에 대한 상동성을 포함한다. 공여자 서열을 도입하는 방법은 당업자에게 알려져 있지만 상동성 아암의 사용을 포함할 수 있다. 예를 들어, 공여자 서열은 게놈 파단을 포함하는 게놈의 적어도 일부에 대한 상동성 아암을 포함할 수 있다. 일부 경우에, 공여자 서열은 칸나비스 또는 대마 식물 세포 게놈의 게놈 내에 무작위로 삽입된다.
일부 경우에, 공여자 서열은 상동성 재조합을 사용하여 부위 지향된 방식으로 도입될 수 있다. 상동성 재조합은 내인성 유전자에서 부위 특이적 변형을 허용하므로 유전되거나 후천적인 돌연변이가 수정될 수 있고/있거나 새로운 변경이 게놈 안으로 조작될 수 있다. 식물에서 상동성 재조합 및 부위-지향된 통합은 예를 들어 미국 특허 번호 5,451,513, 5,501,967 및 5,527,695에 기술되어 있다.
일부 양태에서, 공여자 서열은 프로모터 서열을 포함한다. 설계된 유전자 생성물의 발현을 증가시키는 것은 프로모터 영역을 조절하거나 원하는 유전자 서열의 상류에 더 강한 프로모터를 삽입함에 의해 발현을 합성적으로 증가시킴에 의해 달성될 수 있다. 일부 양태에서, 애기장대 및 기타 식물에서 고도로 기능성인 35s 및 Ubi10과 같은 프로모터가 도입될 수 있다. 일부 경우에, 칸나비스 및/또는 대마에서 고도로 기능성 프로모터가 도입된다.
일부 경우에, 바코드는 비-천연 서열을 포함할 수 있다. 일부 양태에서, 바코드는 천연 서열을 함유한다. 일부 양태에서, 바코드는 유전자분석을 통한 트랜스제닉 유기체의 식별을 가능하게 하는 데 이용될 수 있다. 일부 양태에서, 공여자 서열은 마커일 수 있다. 선택가능한 마커 유전자는, 예를 들어 광합성(atpB, tscA, psaA/B, petB, petA, ycf3, rpoA, rbcL), 항생제 내성(rrnS, rrnL, aadA, nptII, aphA-6), 제초제 내성(psbA, bar, AHAS (ALS), EPSPS, HPPD, sul) 및 대사(BADH, codA, ARG8, ASA2) 유전자를 포함할 수 있다. 박테리아로부터 sul 유전자는 제초성 설폰아마이드-비민감성 디하이드로프테로에이트 신타제 활성을 가지고, 단백질 생성물이 식물 미토콘드리아에 표적화된 경우 선별가능한 마커로 사용될 수 있다(미국 특허 번호 US 6121513). 일부 실시형태에서, 마커를 인코딩하는 서열은 유전적으로 변형된 세포 또는 유기체, 예를 들어 본 명세서에 기재된 균류, 효모 또는 식물 내로 통합될 수 있다. 일부 실시형태에서, 마커를 인코딩하는 통합된 서열은 후속적으로 형질전환된 게놈으로부터 제거될 수 있다. 마커를 인코딩하는 서열의 제거는 마커를 인코딩하는 영역 전후에 직접 반복의 존재에 의해 촉진될 수 있다. 마커를 인코딩하는 서열의 제거는 세포기관의 내인성 상동성 재조합 시스템을 통해 또는 cre-lox 또는 FLP/FRT와 같은 부위-특이적 재조합 시스템의 사용에 의해 발생할 수 있다.
일부 경우에, 마커는 예를 들어 방사성동위원소, 형광 화합물, 생물발광 화합물, 화학발광 화합물, 금속 킬레이터 또는 효소와 같은 검출이 가능한 표지를 지칭할 수 있다. 검출가능한 마커의 예는 다음을 포함하지만 이에 제한되지 않는다: 형광 표지(예를 들어, FITC, 로다민, 란타나이드 형광체), 효소 표지(예를 들어, 양고추냉이 퍼옥시다제, β-갈락토시다제, 루시페라제, 알칼리 포스파타제), 화학발광, 비오티닐기, 2차 리포터에 의해 인식되는 사전결정된 폴리펩티드 에피토프(예를 들어, 류신 지퍼 쌍 서열, 2차 항체에 대한 결합 부위, 금속 결합 도메인, 에피토프 태그).
선택가능하거나 검출가능한 마커는 일반적으로 세포 또는 관심있는 세포 내부에 "태그"로 마커된 분자가 종종 특정 조건 하에서 식별되도록 하는 DNA 세그먼트를 포함한다. 이러한 마커는 RNA, 펩티드, 또는 단백질의 생산으로부터 선택되지만 이에 제한되지 않는 활성을 인코딩할 수 있거나, 또는 마커는 RNA, 펩티드, 단백질, 무기 및 유기 화합물 또는 복합체 등에 대한 결합 부위를 제공할 수 있다. 예를 들어, 선택가능한 마커는 제한 효소 절단점을 포함하는 DNA 세그먼트, 형광 프로브를 포함하는 DNA 세그먼트, 항생제, 예를 들어 스펙티노마이신, 암피실린, 카나마이신, 테트라사이클린, BASTA, 네오마이신-포스포트랜스퍼라제 II(NEO) 및 하이그로마이신-포스포트랜스퍼라제(HPT)를 포함하는 다른 독성 화합물에 대한 내성을 제공하는 생성물을 인코딩하는 DNA 세그먼트, 관심있는 식물 표적 세포가 자연 조건 하에서는 갖지 않을 생성물을 인코딩하는 DNA 세그먼트, 예를 들어 tRNA 유전자, 영양요구성 마커 등, 쉽게 식별될 수 있는 생성물, 특히 광학적으로 관찰가능한 마커를 인코딩하는 DNA 세그먼트, 예를 들어 표현형 마커 예컨대 - 갈락토시다아제, GUS, 형광 단백질, 예를 들어 녹색 형광 단백질(GFP) 및 기타 형광 단백질, 예를 들어 청색(CFP), 황색(YFP) 또는 적색(RFP) 형광 단백질 및 표면 단백질로서, 여기서 높은 형광 강도를 나타내는 이들 형광 단백질이 특히 관심있는 것이며, 이는 단일 세포 대신에, 복잡한 식물 표적 구조 또는 식물 물질 또는 수많은 유형의 조직 또는 세포를 포함하는 식물이 분석되어 질 수 있는 경우 이들 단백질이 더 깊은 조직 층에서도 식별될 수 있기 때문임, PCR을 위한 새로운 프라이머 부위, 제한 엔도뉴클레아제 또는 기타 DNA 변형된 효소 또는 효과기 도메인에 의해 본 개시내용에 따라 변형될 수 없는 DNA 서열의 기록, 특정 변형, 예를 들어 후성유전적 변형, 예를 들어 메틸화에 사용되는 DNA 서열, 및 본 개시내용에 따른 적합한 CRISPR 시스템에 의해 식별될 수 있는 PAM 모티프를 담지하는 DNA 서열, 및 또한 내인성 식물 게놈에 자연적으로 존재할 수 있는 것과 같은 PAM 모티프를 갖지 않는 DNA 서열에 제한됨이 없이 이들을 포함한다.
일 실시형태에서, 공여자는 선택가능하거나, 선별가능하거나, 또는 채점가능한 마커 유전자 또는 그의 일부를 포함한다. 일부 경우에, 마커는 선택 또는 스크리닝 장치의 역할을 하여 재생가능한 유전적으로 변형된 유기체에서 기능하여 다른 독성 화합물에 대한 상기 유기체에서 조직 내성을 부여하는 화합물을 생성할 수 있다. 선택가능하거나, 선별가능하거나, 또는 채점가능한 마커로 사용하기 위한 관심있는 유전자는 gus, 녹색 형광 단백질(gfp), 루시퍼라제(lux), 카나마이신 같은 항생제에 대한 내성을 부여하는 유전자(Dekeyser et al., 1989) 또는 스펙티노마이신(예를 들어, 스펙티노마이신 아미노글리코사이드 아데닐트랜스퍼라제(aadA), 글리포세이트(예를 들어, 5-에놀피루빌시키메이트-3-포스페이트 신타제(EPSPS); 글리포세이트 산화환원효소(GOX); 글리포세이트 데카르복실라제; 글리포세이트 N-아세틸트랜스퍼라제(GAT) 같은 제초제에 내성을 제공하는 효소를 인코딩하는 유전자, 달라폰(예를 들어, 2,2-디클로로프로피온산에 대한 내성을 부여하는 2,2-디클로로프로피온산 데할로게나제를 인코딩하는 dehI, 브로목시닐에 대한 내성을 부여하기 위한 브로목시닐(할로아릴니트릴라제(Bxn), 설포닐 제초제(예를 들어, 아세토락테이트 신타제 억제제에 대한 내성을 부여하는 아세토하이드록시산 신타제 또는 아세토락테이트 신타제 예컨대 설포닐우레아, 이미다졸리논, 트리아졸로피리미딘, 피리미딜옥시벤조에이트 및 프탈라이드; ALS, GST-II를 인코딩함), 바이알라포스 또는 포스피노트리신 또는 유도체(예를 들어, 포스피노트리신 또는 글루포시네이트에 대한 내성을 부여하는 포스피노트리신 아세틸트랜스퍼라제(bar), 아트라진(GST-III을 인코딩함), 디캄바(디캄바 모노옥시게나제) 또는 세톡시딤(사이클로헥산디온(세톡시딤)에 대한 내성 부여를 위한 변형된 아세틸-코엔자임 A 카르복실라제 및 아릴옥시페녹시프로피오네이트(할록시포프) 등을 포함하지만 이에 제한되지 않는다. 양성 선택 메커니즘(예를 들어, 만노스의 존재에서 성장을 허용하는 대장균의 manA 유전자의 사용) 및 이중 선택(예를 들어, 75-100ppm 스펙티노마이신 및 3-10ppm 글루포시네이트, 또는 75ppm 스펙티노마이신 및 0.2-0.25ppm 디캄바를 동시적으로 사용함)을 포함한 다른 선택 절차가 또한 구현될 수 있다. 약 25-1000ppm, 예컨대 약 150ppm의 농도에서 스펙티노마이신의 사용이 또한 고려될 수 있다. 일 실시형태에서, 검출가능한 마커가 잠재적인 입체 장애를 줄이기 위해 다양한 길이의 스페이서 아암에 의해 부착될 수 있다.
일부 경우에, 공여자 폴리뉴클레오티드는 표적 서열에 측접하는 서열에 대한 상동성을 포함한다. 일부 경우에, 공여자 폴리뉴클레오티드는 예를 들어 비-실로시빈 트립타민의 합성을 차단하기 위해 본 명세서에 제공된 유전자 내에 정지 코돈을 도입한다. 일부 경우에, 공여자 폴리뉴클레오티드는 바코드, 리포터 또는 선별 마커를 포함한다.
형질전환
적절한 형질전환 기술은 다음을 포함할 수 있지만 이에 제한되지는 않는다: 균류 원형질체의 전기천공; 리포솜-매개된 형질전환; 폴리에틸렌 글리콜(PEG) 매개된 형질전환; 바이러스를 사용한 형질전환; 세포의 미세-주입; 세포의 미세-발사체 충격; 진공 침투; 및 아그로박테리움 투메피시엔스 매개된 형질전환. 형질전환은 뉴클레오티드 서열을 세포 내에 서열의 안정적 또는 일시적 발현을 야기하는 방식으로 도입하는 것을 의미한다.
형질전환에 이어서, 균류 또는 기타 유기체는 형질전환 벡터 내에 통합된 우성 선택가능한 마커를 사용하여 선택될 수 있다. 특정 실시형태에서, 이러한 마커는 형질전환된 균류 또는 기타 유기체에 항생제 또는 제초제 내성을 부여하고, 형질전환체의 선택은 균류 또는 기타 유기체를 적절한 농도의 항생제 또는 제초제에 노출시킴에 의해 달성될 수 있다. 형질전환된 균류 또는 기타 유기체를 선택하여 성숙기까지 성장시킨 후, 변형된 특성을 나타내는 이들 균류 또는 기타 유기체가 식별된다. 변형된 특성은 상기에서 기술된 특성 중 임의의 것일 수 있다. 추가로, 발명의 폴리펩티드 또는 폴리뉴클레오티드의 발현 수준 또는 활성은 노던 블롯, RT-PCR, RNA 서열 또는 마이크로어레이를 사용한 mRNA 발현, 또는 면역블롯 또는 웨스턴 블롯 또는 겔 이동 검정을 사용한 단백질 발현을 분석함에 의해 결정될 수 있다.
본 발명에 사용하기 위한 균류 또는 다른 세포의 형질전환을 위한 적합한 방법은 원형질체의 PEG-매개된 형질전환, 건조/억제-매개된 DNA 흡수, 전기천공, 탄화규소 섬유로 교반, 아그로박테리움-매개된 형질전환 및 DNA 코팅된 입자의 가속에 의한 것과 같은 DNA의 직접 전달에 의한 것과 같이 DNA가 세포 내로 도입될 수 있는 거의 모든 방법을 포함하는 것으로 여겨진다. 이와 같은 기술의 적용을 통해 거의 모든 균류 종의 세포가 안정적으로 형질전환될 수 있고 이들 세포는 트랜스제닉 균류 내로 전개될 수 있다.
아그로박테리움-매개된 형질전환
아그로박테리움-매개된 전달은 DNA가 전체 균류 조직 내에 도입될 수 있으므로 원형질체로부터 온전한 균류의 재생에 대한 필요성을 우회할 수 있기 때문에 유전자를 균류 세포 내에 도입하기 위한 널리 적용가능한 시스템이다. 예를 들어 CRISPR 시스템 또는 공여자 서열을 포함하는 DNA를 균류 세포 내에 도입하기 위한 아그로박테리움-매개된 균류 통합 벡터의 사용은 당업계에 잘 알려져 있다.
더욱이, 아그로박테리움-매개된 형질전환은 기타 유기체, 예컨대 쌍자엽 식물에서 효율적일 수 있으며 애기장대, 담배, 토마토, 자주개자리 및 감자를 포함한 쌍자엽의 형질전환에 사용될 수 있다. 실제로, 아그로박테리움-매개된 형질전환은 수년 동안 쌍자엽 식물에 일상적으로 사용되었다. 일부 경우에, 아그로박테리움-매개된 형질전환이 단자엽 식물에서 사용될 수 있다. 예를 들어, 아그로박테리움-매개된 형질전환 기술은 현재 쌀, 밀, 보리, 자주개자리 및 옥수수에 적용되었다.
현대의 아그로박테리움 형질전환 벡터는 대장균뿐만 아니라 아그로박테리움에서 복제할 수 있어 기술된 바와 같이 편리한 조작을 허용한다. 더욱이, 아그로박테리움-매개된 유전자 전달을 위한 벡터에서 최근 기술적 발전은 다양한 폴리펩티드 코딩 유전자를 발현할 수 있는 벡터의 구축을 용이하게 하기 위해 벡터에서 유전자의 배열 및 제한 부위를 개선하였다. 일부 양태에서, 벡터는 삽입된 폴리펩티드 코딩 유전자의 직접 발현을 위한 프로모터 및 폴리아데닐화 부위에 의해 측접된 편리한 다중-링커 영역을 가질 수 있고 본 명세서에 기재된 목적에 적합하다. 부가하여, 아암이 있는 및 아암이 없는 Ti 유전자 둘 모두를 함유하는 아그로박테리움이 형질전환에 사용될 수 있다.
전기천공
일부 양태에서, 균류, 효모, 식물 또는 그의 세포는 전기천공을 사용하여 변형될 수 있다. 전기천공에 의한 형질전환을 수행하기 위해, 세포 또는 배발생 캘러스의 현탁 배양과 같은 부서지기 쉬운 조직을 이용할 수 있거나 대안적으로 미성숙 배아 또는 기타 조직화된 조직을 직접적으로 형질전환할 수 있다. 이 기술에서는 선택된 세포의 세포벽을 펙틴-분해 효소(펙토리아제)에 노출시키거나 통제된 방식으로 기계적으로 상처를 입힘에 의해 세포벽을 부분적으로 분해한다.
임의의 형질감염 시스템이 이용될 수 있다. 일부 경우에, Neon 형질감염 시스템이 이용될 수 있다. Neon 시스템은 중앙 제어 모듈, 3-피트-길이의 전기 코드로 중앙 제어 모듈에 연결될 수 있는 전기천공 챔버 및 특수 피펫으로 구성된 3-성분 전기천공 장치일 수 있다. 일부 경우에, 특수 피펫에 교환가능 및/또는 일회용 멸균 팁을 장착할 수 있다. 일부 경우에, 전기천공 챔버에 교환가능/일회용 멸균 전기천공 큐벳을 장착할 수 있다. 일부 경우에 Neon 시스템과 같은 시스템 제조업체에서 제공하는 표준 전기천공 완충액을 GMP 적격 용액 및 완충액으로 교체할 수 있다. 일부 경우에, 표준 전기천공 완충액을 GMP 등급 인산염 완충 식염수(PBS)로 교체할 수 있다. Neon 시스템이 적절하게 작동하는지 확인하기 위해 샘플 전기천공을 시작하기 전에 제어 모듈에서 자가-진단 시스템 검사를 수행할 수 있다. 일부 경우에, cGMP 시설에서 클래스 10,000 클린룸 내 클래스 1,000 생물안전 캐비닛에서 형질감염을 수행할 수 있다. 일부 경우에, 전기천공 펄스 전압은 형질감염 효율 및/또는 세포 생존력을 최적화하기 위해 다양할 수 있다. 일부 경우에, 전기천공 펄스 폭은 형질감염 효율 및/또는 세포 생존력을 최적화하기 위해 다양할 수 있다. 일부 경우에, 전기천공 펄스의 수는 형질감염 효율 및/또는 세포 생존력을 최적화하기 위해 다양할 수 있다. 일부 경우에, 전기천공은 단일 펄스를 포함할 수 있다. 일부 경우에, 전기천공은 하나 초과의 펄스를 포함할 수 있다. 일부 경우에, 전기천공은 2개의 펄스, 3개의 펄스, 4개의 펄스, 5개의 펄스, 6개의 펄스, 7개의 펄스, 8개의 펄스, 9개의 펄스, 또는 10개 이상의 펄스를 포함할 수 있다.
일부 양태에서, 균류 및/또는 식물의 원형질체는 전기천공 형질전환에 사용될 수 있다.
미세발사체 충격
발명에 따라 형질전환 DNA 절편을 균류 세포 및 기타 유기체로부터 유래된 세포에 전달하는 또 다른 방법은 미세발사체 충격이다. 이 방법에서 입자는 핵산으로 코팅되고 추진력에 의해 세포 내로 전달될 수 있다. 예시적인 입자는 텅스텐, 백금, 및 바람직하게는 금으로 구성된 것들을 포함한다. 일부 경우에 금속 입자 상의 DNA 침전은 미세발사체 충격을 사용하여 수용체 세포로의 DNA 전달을 위해 필요하지 않을 것이라고 생각된다. 그러나, 입자는 DNA로 코팅되기 보다는 DNA를 함유할 수 있다고 생각된다. 일부 양태에서, DNA-코팅된 입자는 입자 충격을 통한 DNA 전달의 수준을 증가시킬 수 있다. 충격을 위해 현탁액에서 세포는 필터 또는 고체 배양 배지 상에 집중된다. 대안적으로, 미성숙 배아 또는 다른 표적 세포는 고체 배양 배지 상에 배열될 수 있다. 충격받을 세포는 거대발사체 정지판 아래 적절한 거리에 위치한다.
가속에 의해 균류 세포 내로 DNA를 전달하는 방법의 예시적인 실시형태는 DNA 또는 세포로 코팅된 입자를 스테인리스 스틸 또는 Nytex 스크린과 같은 스크린을 통해 현탁액에서 배양된 단자엽 식물 세포로 덮인 필터 표면 상으로 추진하는 데 사용될 수 있는 바이오리스틱스 입자 전달 시스템이다. 스크린은 입자를 분산시켜 큰 응집체로 수용체 세포에 전달되지 않도록 한다.
기타 형질전환 방법
추가적인 형질전환 방법은 인산칼슘 침전, 폴리에틸렌 글리콜 처리, 전기천공, 및 이들 처리의 조합을 포함하지만 이에 제한되지는 않는다.
원형질체로부터 성공적으로 재생될 수 없는 균류를 형질전환시키기 위해, DNA를 온전한 세포 또는 조직 내에 도입하는 다른 방법이 이용될 수 있다. 예를 들어, 미성숙 배아 또는 외식편으로부터 식물의 재생은 기술된 바와 같이 영향을 받을 수 있다. 또한, 탄화규소 섬유-매개된 형질전환은 원형질 유지와 함께 또는 없이 사용될 수 있다. 이 기술을 사용한 형질전환은 탄화규소 섬유를 DNA 용액에서 세포와 함께 교반함에 의해 수행될 수 있다. DNA는 세포가 천공됨에 따라 수동적으로 유입한다.
일부 경우에, 게놈 편집을 위한 시작 세포 밀도는 편집 효율 및/또는 세포 생존력을 최적화하기 위해 다양할 수 있다. 일부 경우에, 게놈 편집을 위한 시작 세포 밀도는 약 1x105 세포 미만일 수 있다. 일부 경우에, 전기천공을 위한 시작 세포 밀도는 적어도 약 1x105 세포, 적어도 약 2x105 세포, 적어도 약 3x105 세포, 적어도 약 4x105 세포, 적어도 약 5x105 세포, 적어도 약 6x105 세포, 적어도 약 7x105 세포, 적어도 약 8x105 세포, 적어도 약 9x105 세포, 적어도 약 1x106 세포, 적어도 약 1.5x106 세포, 적어도 약 2x106 세포, 적어도 약 2.5x106 세포, 적어도 약 3x106 세포, 적어도 약 3.5x106 세포, 적어도 약 4x106 세포, 적어도 약 4.5x106 세포, 적어도 약 5x106 세포, 적어도 약 5.5x106 세포, 적어도 약 6x106 세포, 적어도 약 6.5x106 세포, 적어도 약 7x106 세포, 적어도 약 7.5x106 세포, 적어도 약 8x106 세포, 적어도 약 8.5x106 세포, 적어도 약 9x106 세포, 적어도 약 9.5x106 세포, 적어도 약 1x107 세포, 적어도 약 1.2x107 세포, 적어도 약 1.4x107 세포, 적어도 약 1.6x107 세포, 적어도 약 1.8x107 세포, 적어도 약 2x107 세포, 적어도 약 2.2x107 세포, 적어도 약 2.4x107 세포, 적어도 약 2.6x107 세포, 적어도 약 2.8x107 세포, 적어도 약 3x107 세포, 적어도 약 3.2x107 세포, 적어도 약 3.4x107 세포, 적어도 약 3.6x107 세포, 적어도 약 3.8x107 세포, 적어도 약 4x107 세포, 적어도 약 4.2x107 세포, 적어도 약 4.4x107 세포, 적어도 약 4.6x107 세포, 적어도 약 4.8x107 세포, 또는 적어도 약 5x107 세포일 수 있다.
본 명세서에 기술된 임의의 핵산 전달 플랫폼을 사용하여 세포를 포함하나 이에 제한되지 않는 식물 또는 그의 임의의 부분의 게놈 파괴의 효율은 핵산 또는 단백질 분석으로 측정시 약 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.9%, 또는 최대 약 100%에서 유전자 또는 그의 일부의 파괴를 초래할 수 있다.
유기체 육종
일부 실시형태에서, 본 개시내용의 균류, 효모 또는 식물은 새로운 식물 품종을 생산하는 데 사용될 수 있다. 일부 실시형태에서, 식물은 원하는 표현형을 갖는 새롭고 독특하고 우수한 품종 또는 잡종을 개발하는 데 사용된다. 일부 실시형태에서, 선택 방법, 예를 들어 분자 마커 보조된 선택은 과정을 가속화하기 위해 육종 방법과 조합될 수 있다. 일부 실시형태에서, 방법은 (i) 공여자로서 발현 카세트를 포함하는 본 명세서에 제공된 임의의 유기체를 수용체 유기체 계통에 교배시켜 FI 모집단을 생성하는 것; (ii) 발현 카세트를 갖는 자손을 선택하는 것을 포함한다. 선택적으로, 관심있는 유전자의 발현을 시험함에 의하여 자손을 추가로 선택할 수 있다. 일부 실시형태에서, 공여자 유기체의 완전한 염색체가 전달된다. 예를 들어, 발현 카세트를 갖는 트랜스제닉 유기체는 공여자로부터 이식유전자를 수용함에 의해 발현 카세트를 갖는 자손을 생성함에 의해 자손을 생산하기 위한 교배 수분에서 수컷 또는 암컷 모체로서 작용할 수 있다. 발현 카세트를 갖는 유기체를 생산하는 방법에서, 원형질체 융합은 또한 공여자에서 수용체로의 이식유전자의 전달을 위해 사용될 수 있다. 원형질체 융합은 단일 이중- 또는 다중-유핵 세포를 생성하기 위해 둘 이상의 원형질체(세포벽이 효소 처리에 의해 제거된 세포) 사이의 체세포 혼성화와 같은 유도되거나 자발적인 합체이다. 자연에서 교배될 수 없는 종으로도 수득될 수 있는 융합된 세포는 특질의 바람직한 조합을 나타내는 잡종 유기체로 조직 배양된다. 보다 구체적으로, 제1 원형질체는 발현 카세트를 갖는 유기체로부터 수득될 수 있다. 제2 원형질체는 제2 유기체, 선택적으로는 또 다른 종 또는 변종의 것으로부터, 또는 동일한 종 또는 변종으로부터 수득될 수 있으며, 이는 비제한적으로 질환 저항성, 곤충 저항성 등과 같은 상업적으로 바람직한 특성을 포함한다. 그런 다음 원형질체는 교배를 생성하는 것으로 당업계에 공지된 전통적인 원형질체 융합 절차를 사용하여 융합된다. 대안적으로, 배아 구조는 공여자에서 수용체로 발현 카세트의 전이에 이용될 수 있다. 배아 구조는 배아와 그 조직 배양물을 단리하는 절차로 사용될 수 있다.
일부 경우에, 모집단 개선 방법이 이용될 수 있다. 모집단 개선 방법은 일반적으로 대량 선택이라고 하는 순수하게 표현형 선택을 기반으로 하는 것과 자손 시험으로의 선택을 기반으로 것인 두 그룹으로 자연스럽게 나뉜다. 모집단간 개선은 유전자가 한 모집단에서 다른 모집단으로 흐르도록 하는 것인; 개방 번식 모집단의 개념을 활용한다. 선택은 두 출처 모두에서 원하는 특질을 포함하는 식물을 단리하여 하나의 (또는 때로는 둘 모두) 모집단(들)을 개선하기 위해 적용될 수 있다.
다른 양태에서, 대량 선택이 이용될 수 있다. 대량 선택에서, 원하는 개별 식물을 선택하고 수확하고 자손 시험 없이 종자를 합성하여 다음 세대를 생산한다. 선택은 모계 부모만을 기반으로 하고 수분에 대한 통제가 없기 때문에, 대량 선택은 선택과 무작위 짝짓기하는 형태에 해당한다. 본 명세서에 언급된 바와 같이, 대량 선택의 목적은 모집단에서 우월한 유전자형의 비율을 증가시키는 것이다. 대량 선택이 때때로 사용되는 반면, 자손 시험은 그 조작의 간단성과 객체에 대한 명백한 관련성, 즉 합성에서 일반적인 조합 능력의 활용으로 인해 일반적으로 다중 교배에 선호된다.
일부 실시형태에서, 육종은 분자 마커를 이용할 수 있다. 분자 마커는 본 출원의 식물의 게놈에 기초하여 설계 및 제조된다. 일부 실시형태에서, 분자 마커는 동종효소 전기영동, 제한 단편 길이 다형성(RFLP), 무작위로-증폭된 다형성 DNA(RAPD), 임의적으로 프라이밍된 중합효소 연쇄 반응(AP-PCR), DNA 증폭 지문(DAF), 서열 특성화된 증폭 영역(SCAR). 증폭된 단편 길이 다형성(AFLP) 및 미세부수체로도 불리는 단순 서열 반복(SSR) 등으로부터 선택된다. 분자 마커 및 그의 적용을 개발하는 방법이 Avise (Molecular markers, natural history, and evolution, Publisher: Sinauer Associates, 2004, ISBN 0878930418, 9780878930418), Snvastava et al. (Plant biotechnology and molecular markers, Publisher: Springer, 2004, ISBN1402019114, 9781402019111), 및 Vienne (Molecular markers in plant genetics and biotechnology, Publisher: Science Publishers, 2003)에 의해 기술되어 있으며, 각각의 윈치는 모든 목적을 위해 그 전체가 참고로 포함된다. 분자 마커는 분자 마커 보조 육종에 사용될 수 있다.
트랜스제닉 균류를 생성하는 방법이 또한 본 명세서에 제공될 수 있다. 일부 양태에서, 본 명세서에 제공된 방법은 (a) 균류 세포를 엔도뉴클레아제 또는 엔도뉴클레아제를 인코딩하는 폴리펩티드와 접촉시키는 것을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 균류 세포의 게놈에 유전적 변형을 도입하여, 유전적 변형이 없는 필적할만한 대조군에서 동일한 화합물의 양과 비교하여, 화학식 I-IV 중 하나, 이의 유도체 또는 유사체의 증가된 양을 초래한다. 일부 양태에서, 방법은 트랜스제닉 균류를 생성하기 위해 이전에 기재된 바와 같이 유전적으로 변형된 균류 세포를 배양하는 것을 추가로 포함할 수 있다. 트랜스제닉 균류를 제조하는 방법은 전기천공법, 아그로박테리움 매개된 형질전환, 바이오리스틱 입자충격 또는 원형질체 형질전환을 포함할 수 있다. 일부 양태에서, 방법은 균류를 생성하기 위해 균류 세포를 배양하는 것을 추가로 포함할 수 있다.
일부 양태에서, 식물 세포를 엔도뉴클레아제 또는 엔도뉴클레아제를 인코딩하는 폴리펩티드와 접촉시키는 것을 포함하는 트랜스제닉 식물을 생성하는 방법이 또한 본 명세서에 제공될 수 있다. 엔도뉴클레아제는 유전적 변형을 결하는 필적할만한 대조군에서 동일한 화합물의 양과 비교하여 실로시빈, 실로신 또는 디메틸트립타민(DMT), 그의 유도체 또는 유사체의 양을 증가시키는 유전적 변형을 도입할 수 있다.
일부 양태에서, 동물 세포를 엔도뉴클레아제 또는 엔도뉴클레아제를 인코딩하는 폴리펩티드와 접촉시키는 것을 포함하는 트랜스제닉 동물을 생성하는 방법이 또한 본 명세서에 제공될 수 있다. 엔도뉴클레아제는 유전적 변형을 결하는 필적할만한 대조군에서 동일한 화합물의 양과 비교하여 실로시빈, 실로신 또는 디메틸트립타민(DMT), 그의 유도체 또는 유사체의 양을 증가시키는 유전적 변형을 도입할 수 있다.
일부 양태에서, 곤충 세포를 엔도뉴클레아제 또는 엔도뉴클레아제를 인코딩하는 폴리펩티드와 접촉시키는 것을 포함하는 트랜스제닉 곤충을 생성하는 방법이 또한 본 명세서에 제공될 수 있다. 엔도뉴클레아제는 유전적 변형을 결하는 필적할만한 대조군에서 동일한 화합물의 양과 비교하여 실로시빈, 실로신 또는 디메틸트립타민(DMT), 그의 유도체 또는 유사체의 양을 증가시키는 유전적 변형을 도입할 수 있다.
일부 양태에서, 효모 세포를 엔도뉴클레아제 또는 엔도뉴클레아제를 인코딩하는 폴리펩티드와 접촉시키는 것을 포함하는 트랜스제닉 효모를 생성하는 방법이 또한 본 명세서에 제공될 수 있다. 엔도뉴클레아제는 유전적 변형을 결하는 필적할만한 대조군에서 동일한 화합물의 양과 비교하여 실로시빈, 실로신 또는 디메틸트립타민(DMT), 그의 유도체 또는 유사체의 양을 증가시키는 유전적 변형을 도입할 수 있다.
일부 양태에서, 대장균을 엔도뉴클레아제 또는 엔도뉴클레아제를 인코딩하는 폴리펩티드와 접촉시키는 것을 포함하는 트랜스제닉 대장균을 생성하는 방법이 또한 본 명세서에 제공될 수 있다. 엔도뉴클레아제는 유전적 변형을 결하는 필적할만한 대조군에서 동일한 화합물의 양과 비교하여 실로시빈, 실로신 또는 디메틸트립타민(DMT), 그의 유도체 또는 유사체의 양을 증가시키는 유전적 변형을 도입할 수 있다.
균류 세포 게놈의 변형을 포함하는 방법은 유전적 변형이 없는 필적할만한 대조군과 비교하여 트랜스제닉 균류에서 건조 중량으로 측정시 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75% 또는 최대 약 80% 더 많은
Figure pct00023
(화학식 IV)을 초래할 수 있다. 추가로, 변형을 포함하는 방법은 또한 변형이 없는 필적할만한 대조군과 비교하여 트랜스제닉에서 건조 중량으로 측정시 약 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 80%, 90%, 100%, 또는 최대 약 200% 더 많은
Figure pct00024
(화학식 I)을 초래할 수 있다. 더욱이, 변형을 포함하는 방법은 또한 변형이 없는 필적할만한 대조군과 비교하여 트랜스제닉에서 건조 중량으로 측정시 약 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 80%, 90%, 100%, 또는 최대 약 200% 더 많은 실로시빈 또는 실로신을 초래할 수 있다.
상기 유전적 변형이 없는 필적할만한 대조군 세포에서 동일한 화합물의 양과 비교하여 증가된 양의 화합물
Figure pct00025
(화학식 IV), 이의 유도체 또는 유사체를 초래하는 유전자에서의 파괴를 포함하는 유전적으로 변형된 세포가 또한 본 명세서에 제공될 수 있다. 더욱이, 상기 유전적 변형이 없는 필적할만한 대조군 세포에서 동일한 화합물의 양과 비교하여 증가된 양의 화합물
Figure pct00026
(화학식 I), 이의 유도체 또는 유사체를 초래하는 유전자에서의 파괴를 포함하는 유전적으로 변형된 세포가 또한 본 명세서에 제공될 수 있다. 부가하여, 상기 유전적 변형이 없는 필적할만한 대조군 세포에서 동일한 화합물의 양과 비교하여 증가된 양의 실로시빈 및/또는 실로신, 그의 유도체 또는 유사체를 초래하는 유전자에서의 파괴를 포함하는 유전적으로 변형된 세포가 또한 본 명세서에 제공될 수 있다. 대안적으로, 유전적으로 변형된 세포는 식물 세포, 균류 세포, 박테리아 세포, 동물 세포 또는 곤충 세포이다.
부가적으로, 유전적 변형을 도입할 수 있는 엔도뉴클레아제 또는 상기 엔도뉴클레아제를 인코딩하는 폴리뉴클레오티드를 포함하는 조성물이 또한 본 명세서에 제공될 수 있으며, 여기서 상기 유전적 변형은 상기 유전적 변형이 없는 필적할만한 대조군 세포와 비교하여 실로시빈 또는 실로신, 이들의 유도체 또는 유사체의 양을 증가시킨다.
실로시빈 합성 유전자 이식유전자 방법 및 조성물
실로시빈 합성 유전자로 버섯을 형질전환시키는 방법이 본 명세서에 제공될 수 있다. 일부 실시형태에서, 4개의 주요 실로시빈 합성 유전자의 코딩 서열이 합성되고 35S 프로모터의 제어 하에 과발현 벡터 시스템 pGWB5 내로 클로닝된다. 일부 실시형태에서, 이들 유전자의 발현을 구동하는 상이한 프로모터를 갖는 추가 벡터가 또한 생성된다(Gpd, EF1a 및 액틴 포함).
일부 경우에, 담자균 균류는 형질전환 효율을 시험하고 프로토콜을 개발하기 위해 pGWB5를 사용하여 형질전환된다. 일부 경우에, 실로시빈 생산에서의 증가 가능성을 관찰하기 위한 상이한 Psi 유전자를 개별적으로 또는 조합하여 포함하는 형질전환. 일부 경우에, 폴리시스트론 벡터 내에서 병행하여 4개 Psi 유전자의 올-인-원 발현 벡터가 생성되고 테스트된다.
일부 실시형태에서, 실로사이베 쿠벤시스의 번식 및 성장은 성숙한 자실체 버섯 및 균사체 둘 모두를 생성하도록 상이한 기질 상에서 가능하게 된다. 일부 실시형태에서, 조직은 버섯 아가미로부터 추출되고 아그로박테리움-매개된 형질전환에 의해 Psi 유전자가 형질전환된다. 일부 실시형태에서, 원형질체는 균사체 및 균사체의 아그로박테리움-매개된 형질전환과 함께 Psi 유전자의 PEG-매개된 형질전환으로부터 생성된다. 일부 실시형태에서, 실로사이베 쿠벤시스는 PDA 아가 또는 보리-펄라이트 퇴비에서 실온에서 7일 동안 성장된다. 일부 경우에, 형질전환 이전에 조직 추출 및 세포 단리를 위해 균사체와 자실체가 수확된다.
일부 실시형태에서, Psi 유전자 과발현은 2개의 별개의 프로모터 유형인, 35S 프로모터, 널리 사용되는 식물 과-발현 프로모터 및 2개의 균류 특이적 과-발현 프로모터인, GPD 및 CcDED1의 제어 하에 있다(표 4, 도 3, 도 4).
표 4. 유전자 발현 벡터
Figure pct00027
일부 실시형태에서, PsiD 유전자 과-발현은 35S 프로모터의 제어 하에 PsiD 유전자를 발현하는 벡터를 포함한다(표 5: 서열번호: 18, 17,647bp; 도 3a). 일부 실시형태에서, PsiH 유전자 과-발현은 35S 프로모터의 제어 하에 PsiH 유전자를 발현하는 벡터를 포함한다(표 5: 서열번호: 17, 18,494bp; 도 3b). 일부 실시형태에서, PsiK 유전자 과발현은 35S 프로모터의 제어 하에 PsiK 유전자를 발현하는 벡터를 포함한다(표 5: 서열번호: 16, 17,420bp; 도 3c). 일부 실시형태에서, PsiM 유전자 과-발현은 35S 프로모터의 제어 하에 PsiM 유전자를 발현하는 벡터를 포함한다(표 5: 서열번호: 15, 17,267bp; 도 3d).
일부 실시형태에서, Psi 유전자 과-발현은 GcDED1 프로모터의 제어 하에 Psi 유전자를 발현하는 벡터를 포함한다(표 5: 서열번호: 19, 9,462bp; 도 4a). 일부 실시형태에서, Psi 유전자 과-발현은 GPD 프로모터의 제어 하에 Psi 유전자를 발현하는 벡터를 포함한다(표 5: 서열번호: 20, 8,067bp; 도 4b).
약학적 및 기능식품 조성물 및 방법
본 명세서에 기재된 유전적으로 변형된 세포, 유기체, 균류 또는 식물, 또는 이의 추출물, 유도체 또는 생성물을 포함하는 약학적 또는 기능식품 조성물이 본 명세서에 제공될 수 있다. 본 명세서에 기재된 유전적으로 변형된 세포, 유기체, 균류 또는 식물, 또는 이의 추출물 또는 생성물을 포함하는 약학적 또는 기능식품 시약, 이를 사용하는 방법, 및 약학적 또는 기능식품 조성물을 제조하는 방법이 또한 본 명세서에 제공될 수 있다. 본 명세서에 기재된 약학적으로 및 기능식품-적합한 세포, 유기체 또는 식물, 또는 이의 추출물, 유도체 또는 생성물이 또한 본 명세서에 제공된다.
일부 경우에, 본 명세서에 기재된 유전적으로 변형된 세포, 유기체, 진균 또는 식물 또는 이의 추출물 또는 생성물은 약학적 또는 기능식품 제제로서 사용될 수 있다. 일부 경우에, 이러한 약학적 또는 기능식품 제제를 포함하는 조성물은 우울증, 불안, 외상-후 스트레스, 중독 또는 금연과 같은 금연 관련 부작용, 및 암-관련된 심리적 고통을 포함한 심리적 고통과 같은 병태와 연관된 병태 또는 증상을 치료하거나 안정화시키기 위해 사용될 수 있다. 구체적으로 본 명세서에 기재된 유전적으로 변형된 세포, 유기체, 균류 또는 식물 또는 이의 추출물, 유도체 또는 생성물은 정신 장애 및 병태와 연관된 다양한 증상을 완화시키기 위해 사용될 수 있다.
일부 양태에서, 본 명세서에 기재된 세포, 유기체 또는 식물 또는 그의 추출물 또는 생성물은 특정 증상을 치료하는데 사용될 수 있다. 예를 들어, 통증, 메스꺼움, 체중 감소, 소모성, 다발성 경화증, 알레르기, 감염, 혈관수축제, 우울증, 편두통, 고혈압, 뇌졸중-후 신경 보호 뿐만 아니라 종양 성장의 억제, 혈관신생의 억제 및 전이의 억제, 항산화제 , 및 신경보호제. 일부 양태에서, 본 명세서에 기재된 세포, 유기체 또는 식물 또는 그의 추출물 또는 생성물은 추가 증상을 치료하기 위해 사용될 수 있다. 예를 들어, 다발성 경화증을 특징으로 하는 것을 포함하는 지속적인 근육 경련, 중증 관절염, 말초 신경병증, 난치성 통증, 편두통, 임종 치료가 필요한 말기 질환, 난치성 두통을 동반한 수두증, 난치성 두통 증후군, 신경병증성 안면 통증, 대상포진, 만성 비악성 통증, 인과통, 만성 염증성 탈수초성 다발신경병증, 방광 통증, 간대성 근경련, 뇌진탕-후 증후군, 나머지 사지 통증, 폐쇄성 수면 무호흡증, 외상성 뇌 손상(TBI), 안압 상승, 아편유사제 또는 아편제 금단증상 및/또는 식욕 상실.
일부 경우에, 본 명세서에 기재된 세포, 유기체 또는 식물 또는 그의 추출물 또는 생성물은 플라보노이드, 모노아민 산화효소 억제제 및 피토스테롤(예를 들어, 아피게닌, 케르세틴, 칸플라빈 A , 베타.-시토스테롤 등)를 포함한 다른 약학적으로 또는 기능식품적으로 관련 화합물 및 추출물을 포함할 수 있다.
일부에서 이의 추출물 또는 생성물은 실로시벤, 디메틸트립타민 또는 실로센을 보존하는 추출을 포함하는 방법의 대상이 될 수 있다. 본 개시내용의 추출물은 흡입(연소, 기화 및 분무를 통함), 구강 내 협측 흡수, 경구 투여 및 국소 적용 전달 방법을 통해 인간 또는 동물 소비를 위한 생성물을 생산하도록 설계된다. 본 개시내용은 건조 수확된 식물 또는 균류가 5, 10, 또는 15% 수분 중량에 도달한 시점에서 추출함에 의해 관심있는 화합물을 본 발명자들이 추출하는 최적화된 방법을 교시한다. 줄기는 전형적으로 증발이 일어나기 때문에 여전히 '차고' 그리고 '고무성'이다. 이 기간 (또는 이 시점에서 동결된 경우 공정)은 추출기가 증발로 인한 활성 제제 손실을 최소화하도록 한다. 차고/느림, -'건조 및 에센셜 오일의 보존 사이에는 직접적인 상관관계가 있다. 따라서, 너무 빨리 마르거나 너무 뜨거운 조건 또는 단순히 너무 많이 건조되는(<10% H2O) 꽃에서의 EO 손실과 직접적인 상관관계가 있다. 본 명세서에 기술된 세포, 유기체 또는 식물 또는 이들의 추출물 또는 생성물의 화학적 추출은 다양한 압력과 온도에서 극성 및 비-극성 용매를 이용하여 개별적으로 또는 생성물의 제형에 조합하여 사용하기 위한 향미, 향 또는 약리학적 가치가 있는 기타 화합물을 선택적으로 또는 종합적으로 추출하여 성취될 수 있다. 추출은 단일 또는 다중 용량 패키지, 예를 들어, 소량, 펠렛 및 장입으로 성형 및 형성될 수 있다. 본 발명자의 품종의 선택적 추출에 이용되는 용매는 물, 이산화탄소, 1,1,1,2-테트라플루오로에탄, 부탄, 프로판, 에탄올, 이소프로필 알코올, 헥산 및 리모넨을 조합하여 또는 시리즈로 포함할 수 있다. 본 개시내용의 추출물은 또한 추출물에 대한 관심있는 순수한 화합물, 예를 들어, 칸나비노이드 또는 테르펜과 조합되어 생성된 제형의 향, 풍미 또는 약리학을 더욱 증진시키거나 변형할 수 있다. 일부 실시형태에서, 추출은 추출 공정 동안 이들 화합물의 임의의 손실을 조정하기 위해 테르펜 또는 칸나비노이드로 보충된다.
일부 양태에서, 본 개시내용의 유전적으로 변형된 유기체, 유도체 또는 추출물은 기화, e-주스 또는 e-담배용 팅크의 생산, 또는 식용, 발삼, 또는 국소 스프레드와 같은 기타 소비가능한 생성물의 생산에 사용될 수 있다. 일 양태에서, 본 명세서에 제공된 변형된 조성물은 보충제, 예를 들어 식품 보충제로서 사용될 수 있다. 일부 실시형태에서, 본 명세서에 기재된 세포, 유기체 또는 식물, 또는 그의 추출물 또는 생성물을 사용하여 식용물을 제조할 수 있다. 식용물 조리법은 칸나비노이드와 테르펜의 추출로 시작할 수 있으며, 그 다음 다양한 식용물 조리법의 성분으로 사용된다. 식용물을 위한 추출 방법은 식용유, 우유, 크림, 발삼, 밀가루 및 버터로의 추출을 포함함다. 지질이 풍부한 추출 배지/식용물은 혈류로의 흡수를 촉진하는 것으로 여겨진다. 지질은 본 명세서에 제공된 다양한 조성물과 조합하여 부형제로서 이용될 수 있다. 다른 양태에서, 본 명세서에 제공된 조성물은 다음을 포함할 수 있다: 경구 형태, 경피 형태, 오일 제형, 식용 식품, 또는 식품 기질, 수성 분산액, 에멀젼, 용액, 현탁액, 엘릭서, 젤, 시럽, 에어로졸, 미스트, 분말, 정제, 로젠지, 젤, 로션, 페이스트, 제형화된 스틱, 발삼, 크림, 또는 연고.
본 명세서에 제공된 조성물을 포함하는 키트가 또한 본 명세서에 제공된다. 키트는 포장, 설명서 및 본 명세서에 제공된 다양한 성분을 포함할 수 있다. 일부 양태에서, 키트는 또한 화분, 토양, 비료, 물 및 재배 도구와 같은 본 명세서에 제공된 다양한 식물 및 식물의 일부를 생성하는 데 사용되는 추가 조성물을 함유할 수 있다.
본 개시내용의 바람직한 실시형태가 본 명세서에 도시되고 설명되었지만, 그러한 실시형태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 수많은 변형, 변경 및 대체가 이제 개시내용을 벗어나지 않고 당업자에게 발생할 것이다. 본 명세서에 기술된 개시내용의 실시형태에 대한 다양한 대안이 개시내용을 실시하는데 이용될 수 있음을 이해해야 한다. 다음 청구범위는 개시내용의 범주를 정의하고 이들 청구범위 및 그 균등물의 범주 내의 방법 및 구조는 이에 의해 포함되는 것으로 의도된다.
실시예
실시예 1: 실로사이베 쿠벤시스 에서 Psi 유전자를 과발현하는 전략
단계 1. 실로시빈 경로 발현 벡터를 구축한다.
다양한 강도의 상이한 프로모터를 갖는 발현 벡터의 패널이 구축되고 있다. 일부 프로모터는 버섯 특이적인 반면 다른 프로모터는 고발현 식물 시스템 등에서 유래한다(도 5a). 그런 다음 이들 발현 벡터로부터 아그로박테리움이 생성될 것이다.
단계 2. 형질전환을 위한 버섯 물질을 준비한다.
실시예 3-7에 예시된 바와 같이 형질전환을 위해 원형질체, 분생포자, 아가미 조직 및 균사체를 단리하였다. 적절한 프로토콜의 선택은 변환할 버섯에 따라 다르다. 여기서, 실시예 3-5 및 도 5b에 예시된 바와 같이 원형질체 및 추출물 아가미 조직을 단리하였다. 실시예 4에 예시된 바와 같이 원형질체를 균사체로부터 추출하였다. 아그로박테리움 공동-배양을 사용한 아가미 조직 형질전환 방법은 실시예 6에 예시되어 있다.
단계 3. 형질전환.
다양한 프로토콜을 사용하여 단계 2로부터 배양된 원형질체를 단계 1로부터의 플라스미드 DNA로 형질감염시켰다. 실시예 3-5 참고. 부가적으로, 다양한 프로토콜을 사용하여 2단계로부터 아가미 조직을 1단계로부터 아그로박테리움으로 형질전환했다. 실시예 6-7 참고. 플라스미드 DNA 또는 아그로박테리움 혼입을 갖는 형질전환체가 도 5c에 예시된 바와 같이 선별될 것이다.
단계 4. 재생.
단계 3의 형질전환체로부터의 성체 버섯은 도 5d에 도시된 바와 같이 재생될 것이다.
단계 5. 실로시빈 분석.
유전적으로 변형된 버섯의 실로시빈 함량은 도 5e에 도시된 바와 같이 가스 크로마토그래피/질량 분광법에 의해 분석될 것이다. 실로시빈은 비변형된 P. 쿠벤시스에서 건조 중량의 0.63%를 차지한다. 유전 공학의 목표는 실로시빈의 양을 >6%로 증가시키는 것이다.
실시예 2: Psi 유전자를 과발현하는 벡터 작제물
4개의 주요 실로시빈 합성 유전자(psiD/psiH/psiK/psiM)의 코딩 서열을 합성하고 35S 프로모터의 제어 하에 과발현 벡터 시스템(pGWB5)에 클로닝하였다. 35S 프로모터는 널리 사용되는 식물 과-발현 프로모터이다. 표 4 참고. 예를 들어, PsiD 유전자는 35S 프로모터의 제어 하에 PsiD 유전자를 발현하는 벡터에 클로닝되었고(표 5: 서열번호: 18, 17,647bp; 도 3a), PsiH 유전자는 35S 프로모터의 제어 하에 PsiH 유전자를 발현하는 벡터에 클로닝되었고(표 5: 서열번호: 17, 18,494bp; 도 3b), PsiK 유전자는 35S 프로모터의 제어 하에 PsiK 유전자를 발현하는 벡터에 클로닝되었고(표 5: 서열번호: 16, 17,420bp; 도 3c), PsiM 유전자는 35S 프로모터의 제어하에 PsiM 유전자를 발현하는 벡터에 클로닝하였다(표 5: 서열번호: 15, 17,267bp; 도 3d).
부가하여, 폴리시스트론 벡터 내에서 병형하여 4개의 Psi 유전자의 올-인-원 발현 벡터가 또한 생성되어 현재 시험 중에 있다.
상이한 프로모터(GPD, EF1a 및 액틴 포함)를 갖는 다른 벡터가 생성되었고, 4개의 주요 실로시빈 합성 유전자(psiD/psiH/psiK/psiM)가 이들 벡터에 클로닝될 것이다. 예를 들어, GPD 및 CcDED1 프로모터는 2개의 균류 특이적 과-발현 프로모터이다. 표 4 참고. Psi 유전자는 GcDED1 프로모터의 제어 하에 Psi 유전자를 발현하는 벡터에 클로닝되거나(벡터 골격 표 5: 서열번호: 19, 9,462bp; 도 4a), GPD 프로모터의 제어 하에 Psi 유전자를 발현하는 벡터에 클로닝될 것이다(표 5: 서열번호: 20, 8,067bp; 도 4b).
실시예 3: 원형질체의 벡터 매개된 형질감염: 프로토콜 A
물질
플레우로투스 네브로덴시스 균주를 PDSA 배지(20% 감자, 2% 덱스트로스, 0.3% KH2PO4, 0.15% MgSO4, 0.0005% 비타민 B1, 2% 아가) 상에서 25℃에서 성장시키고 4℃에서 유지하였다.
균사체의 식물 배양은 1주일 동안 25℃에서 PDSB 배지(아가가 없는 PDSA 배지)에서 수행하였다.
원형질체 추출.
나일론 메쉬를 통한 침투에 의해 7일 동안 PDSB 배지에서 성장하는 1gr의 균사체를 수집하였다.
0.6M의 MgSO4로 2회 세정하였다.
1.5% 라이월자임(Guangdong Institute of Micro-biology) 및 0.6M MgSO4를 함유하는 용리 완충액 3ml에 재현탁시킨 다음, 원형질체 방출을 위해 부드럽게 흔들면서 32℃에서 2.5시간 동안 인큐베이션하였다.
원형질체를 1mm의 느슨한 흡수성 면 층으로 유리 주입기를 통한 여과에 의해 정제하고 2000gf 또는 4℃에서 20분의 원심분리에 의해 수집하였다.
0.5M 만니톨 및 50mM 말레산 완충액(pH 5.5)을 함유하는 3ml MM 완충액으로 2회 세정하였다.
2-3ml의 MMC 완충액(0.5M 만니톨, pH 5.5를 갖는 50mM 말레산 완충액, 5mM CaCl2)에 108-109 원형질체 ml-1의 농도로 재현탁시켰다.
원형질체 형질전환
원하는 플라스미드 3ug, PTC 완충액(25% PEG4000, pH 7.5에서 10mM Tris-HCl, 25mM CaCl2) 12.5ul를 냉각된 원형질체 현탁액 50ul에 첨가하고 잘 혼합하였다.
혼합물을 20분 동안 얼음 위에 두었다.
혼합물에 PTC 완충액 0.5ml를 첨가하고 부드럽게 혼합한 후, 실온에서 5분 동안 인큐베이션하였다.
원형질체 혼합물은 재생 및 스크리닝 배지에 도말할 준비가 되었다.
원형질체 재생
원형질체 혼합물을 1ml STC 완충액(18.2% 소르비톨, pH 7.5에서 10mM Tris-HCl, 25mM CaCl2)으로 희석하고 25℃에서 24시간 동안 재생 배지(PDSA 플러스 1.0M 소르비톨)에 도말하였다.
25℃에서 24시간 동안 재생 배양한 후, 각 플레이트에 20ml 스크리닝 배지(PDSA 플러스 0.8M 소르비톨, 80ug/ml 하이그로마이신 B, 0.8% 아가)를 첨가하고 25℃에서 어둠에서 2주 동안 인큐베이션하였다.
스크리닝 배지에 나타난 추정 형질전환체는 안정한 형질전환체의 스크리닝을 위해 80ug/ml 하이그로마이신 B를 함유하는 PDSA 배지에서 추가로 5-회 계대배양하였다. 일부 재생 원형질체는 직경 1-2mm에서 성장을 멈춘다. 1-2mm 직경 크기를 통과한 것들만 추가 선별 라운드로 전송되었다.
평균 형질전환 효율은 플라스미드 pAN7-1 DNA의 마이크로그램당 약 3개 형질전환체이다.
DNA 추출 및 분석
게놈 DNA는 균류 DNA 추출(FDE) 방법에 의해 P. 네브로덴시스의 추정되는 안정한 형질전환체 및 비-형질전환된 대조군의 균사체로부터 단리되었다. 1 그램의 균사체를 액체 질소에서 분말로 분쇄하고 68℃에서 1시간 동안 10ml TESN 완충액(pH 7.5에서 50mM Tris-HCl, pH 8.0에서 100mM EDTA, 0.5% SDS, pH 5.2에서 300mM NaOAc)에 침지하였다. 3.5ml 3M NaOAc(pH 5.2)의 첨가 및 얼음 위에서 20분 동안 인큐베이션한 후, 침지 혼합물을 4℃에서 20분 동안 8000g에서 원심분리했다. 상층액의 DNA를 페놀/클로로포름 추출 방법으로 추출하였다.
실시예 4: 원형질체의 벡터 매개된 형질감염: 프로토콜 B
원형질체 추출 및 수집:
단계 1: 단핵구 균사체의 작은 블록을 CYM 배지(1% 말토스, 2% 글루코스, 0.2% 효모 추출물, 0.2% 트립톤, 0.05% MgSO47H2O, 0.46% KH2PO4)에 접종하고 5일 동안 25℃에서 230rpm에서 쉐이킹하면서 성장시켰다.
단계 2: 균사체를 원심분리에 의해 수확하고, 0.7M NaCl로 2회 세정하고, 효소 용액(1M MgSO4 및 0.6M 인산염 완충액, pH 6.0에서 트리코더마 하르지아눔[Sigma-Aldrich]으로부터의 용리 효소 50mg/ml)으로 25℃에서 2.0 내지 2.5시간 동안 처리했다.
단계 3: 인큐베이션 후, 원형질체를 멸균 Miracloth를 통한 여과에 의해 균사 잔해로부터 분리하고 3,000 × g에서 10분 동안 원심분리하여 수집하였다.
단계 4: 원형질체를 1M 소르비톨로 2회 세정하고, 원형질체 밀도를 동일한 것으로 108/ml로 조정하였다.
PEG-매개된 형질전환:
단계 1: 50 마이크로리터의 원형질체(108/ml)를 10μg의 각 플라스미드 DNA 및 12.5μl의 PEG 용액(40% PEG 4000, 10mM Tris-HCl, pH 8.0, 25mM CaCl2; 살균된 필터)과 혼합하였다.
단계 2: 원형질체를 얼음 위에서 20분 동안 인큐베이션하였다.
단계 3: 500 마이크로리터의 PEG 용액을 첨가하고, 부드럽게 혼합하고, 실온에서 5분 동안 인큐베이션하였다.
단계 4: 1 밀리리터의 빙냉 STC 완충액(1M 소르비톨, 10mM Tris-HCl, pH 8.0, 25mM CaCl2)을 첨가한 다음, 혼합물을 20ml PDAS 재생 아가 배지(PDA 플러스 0.6M 수크로스, pH 6.5)를 함유하는 플레이트 상에 분산시켰다.
단계 5: 플레이트를 25℃에서 48시간 동안 인큐베이션한 다음, 600μg/ml 하이그로마이신 B(Duchefa, The Netherlands), 600μg/ml 플레오마이신(Invitrogen), 또는 60μg/ml 카르복신(Duchefa, The Netherlands)을 함유하는 PDAS 배지 5ml를 오버레이로 첨가하고, 형질전환체가 나타날 때까지(5 내지 7일) 플레이트를 25℃에서 추가로 인큐베이션하였다.
원형질체 재생:
단계 1: 형질전환체를 50μg/ml 하이그로마이신, 50μg/ml 플레오마이신, 또는 5μg/ml 카르복신을 함유하는 신선한 PDA 플레이트 상에서 개별적으로 계대배양하였다.
단계 2: MMP 배지(1% 맥아 추출물, 0.5% 균학적 펩톤, 1.5% 아가) 상에서 각각의 선별 제제로 20 내지 22일 동안 25℃에서 배양한 후 실로사이베 쿠벤시스의 성숙한 자실체를 얻었다.
실시예 5: 원형질체의 아그로박테리움 매개된 형질전환.
물질: 아가미 조직
P. 에린기이(P. eryngii)의 자실체에서 연막을 절단하고 노출된 아가미 조직을 무균적으로 절제하고 1.0×0.5cm 조각으로 절개하였다.
아그로박테리움 제조
관심있는 플라스미드 벡터를 담지하는 GV3101을 카나마이신(50μg/ml)이 보충된 50ml LB 배지에서 28℃에서 2일 동안 600nm에서의 광학 밀도 1.6으로 성장시켰다. 4,000g에서 30분 동안 원심분리하여 박테리아를 수집한 다음 100mM MgCl2 및 100μM 아세토시린곤을 함유하는 50ml 세정 용액으로 1회 세정했다. 추가 30분 동안 4,000g에서 원심분리한 후, 박테리아의 펠릿을 600nm에서의 광학 밀도가 1.0이 되도록 세정 용액에 재현탁시켰다.
형질전환 (이 암 배양(dark culture) 방법은 균사체를 성장시키고 아그로박테리움을 제거하는데 매우 효과적이다).
이들 조각(##로부터의 것)을 10분 동안 2회 아그로박테리움 현탁 배양물에 진공 침윤시켰다.
비운 조직을 삼중 증류수로 세정하고 멸균 Whatman 여과지에서 무균 조건 하에서 10분 동안 건조시켰다.
조직을 그 다음 배지가 없는 멸균 페트리 디쉬로 옮기고 25℃에서 어두운 곳에서 7-14일 동안 인큐베이션하였다.
선별을 위해, 암-배양된 활성 조직을 50μg/ml 하이그로마이신 및 100μg/ml 세포탁심을 함유하는 PDA(감자 덱스트로스 아가 (Potato dextrose agar)) 배지(20% 감자 추출물, 2% 덱스트로스 및 1.5% 아가)로 옮기고 25℃의 어두운 곳에서 2-3주 동안 배양하였다.
그 다음 추정 형질전환체는 어두운 곳에서 1주일 동안 25℃에서 PDA 배지 상에서 계대-배양될 것이다. 마지막으로, 균사체는 25℃ 및 130g에서의 쉐이킹 인큐베이터에서 2주 동안 PDB(아가가 없는 PDA)를 함유하는 액체 배지 상에서 배양될 것이다.
그런 다음 균사체는 Whatman 여과지를 통한 여과에 의해 분리되고 추가 처리에 사용될 것이다.
DNA 추출: 균사체는 추정되는 형질전환 및 비형질전환된 버섯으로부터 수집되고 미리-냉각된 모르타르 및 유봉을 사용하여 액체 질소에 분쇄될 것이다. DNA는 세틸-트리메틸-암모늄 브로-마이드(CTAB)에 따라 균사체에서 분리될 것이다.
실시예 6: 균사체의 아그로박테리움 매개된 형질전환.
실로사이베 쿠벤시스 균사체를 25℃에서 감자 덱스트로스 아가(PDA) 상에서 일상적으로 유지하였다. 실로사이베 쿠벤시스의 성숙한 자실체는 25℃에서 20 내지 22일 동안 MMP 배지(1% 맥아 추출물, 0.5% 균학적 펩톤, 1.5% 아가)에서 배양한 후 얻어졌다.
원하는 발현 벡터를 함유하는 A. 투메파시엔스 균주 AGL1을 적절한 항생제가 보충된 LB 배지에서 24시간 동안 성장시켰다.
박테리아의 배양물은 후속적으로 200μM 아세토시린곤의 존재에서 아그로박테리움 유도 배지(AIM)(유도 배지(IM)[0.5%(w/v) 글리세롤, 0.2mM 아세토시린곤(AS), 40mM 2-(N-모르폴리노)에탄설폰산(MES)를 함유하는 MM, pH 5.3])를 사용하여 660nm에서 광학 밀도 0.15로 희석하고, 추가로 5 내지 6시간 동안 성장시켰다.
범용 성장 배지로부터 얻은 5-일령 실로사이베 쿠벤시스 균사체를 Ultra-Turrax 균질화기를 사용하여 균질화하고, 균사 단편을 신선한 범용 성장 배지에 옮기고 24시간 동안 성장시켜 균일한 균사체 슬러리를 얻었다.
100-μl 균사 현탁액을 100μl의 박테리아의 배양물과 혼합한 다음 셀로판 디스크에 분산하고 AIM 아가 플레이트에 오버레이하고 25℃에서 48시간 동안 인큐베이션하였다.
공배양 후, 셀로판 디스크를 잔류 아그로박테리움 세포를 죽이기 위해 200μg/ml 티멘틴을 함유하고 균류 형질전환체를 선별하기 위해 100μg/ml 하이그로마이신을 함유하는 PDA 배지로 옮겼다.
하이그로마이신-내성 콜로니가 나타날 때까지 이들을 25℃에서 인큐베이션하였다. 개별 콜로니를 후속적으로 50μg/ml 하이그로마이신을 함유하는 PDA 배지로 옮겼다.
실로사이베 쿠벤시스의 성숙한 자실체는 MMP 배지(1% 맥아 추출물, 0.5% 균학적 펩톤, 1.5% 아가)에서 25℃에서 각각의 선별 제제로 20 내지 22일 동안 배양한 후 얻어졌다.
실시예 7: 자실체의 아그로박테리움 매개된 형질전환.
P. 쿠벤시스는 25℃에서 감자 덱스트로스 아가(PDA) 상에서 일상적으로 유지되었다. P. 쿠벤시스의 성숙한 자실체는 MMP 배지(1% 맥아 추출물, 0.5% 균학적 펩톤, 1.5% 아가)에서 25℃에서 20 내지 22일 동안 배양한 후 얻어졌다.
원하는 발현 벡터를 포함하는 A. 투메파시엔스 균주 AGL-1을 적절한 항생제가 보충된 LB 배지에서 24시간 동안 성장시켰다.
박테리아의 배양물은 후속적으로 200μM 아세토시린곤의 존재에서 아그로박테리움 유도 배지(AIM)를 사용하여 660nm에서 광학 밀도 0.15로 희석하고, 추가로 5 내지 6시간 동안 성장시켰다.
해부용 메스를 사용하여 MMP 플레이트에서 성숙한 자실체(성숙하지만 아가미 노출 전)를 절제하고 작은 부분으로 깍둑썰기했다.
자실체 아가미 조직편을 유도된 A. 투메파시엔스 배양물과 혼합하고 더 이상 기포가 나오지 않을 때까지 진공 침윤시켰다.
침윤된 아가미 조각을 AIM 아가 플레이트 상에 오버레이된 셀룰로오스 디스크로 옮겼다. 형질전환체의 공배양 및 선별은 실시예 6에 기재된 바와 같이 수행하였다.
공배양 후, 셀로판 디스크를 잔류 아그로박테리움 세포를 죽이기 위해 200μg/ml 티멘틴을 함유하고 균류 형질전환체를 선별하기 위해 100μg/ml 하이그로마이신을 함유하는 PDA 배지로 옮겼다.
하이그로마이신-내성 콜로니가 나타날 때까지 이들을 25℃에서 인큐베이션하였다. 개별 콜로니를 후속적으로 50μg/ml 하이그로마이신을 함유하는 PDA 배지로 옮겼다.
P. 쿠벤시스의 성숙한 자실체는 25℃에서 각각의 선별 제제로 20 내지 22일 동안 MMP 배지(1% 맥아 추출물, 0.5% 균학적 펩톤, 1.5% 아가) 상에서 배양한 후 수득되었다.
실시예 8: 형질전환, 형질감염 및 재생
실로사이베 쿠벤시스는 도 6에 도시된 바와 같이 성숙한 자실체 버섯 및 균사체 둘 모두를 생성하기 위해 상이한 기질 상에서 증식 및 성장되었다. 실로사이베 쿠벤시스를 PDA 아가(도 6a 및 6b) 및 또한 보리-펄라이트 퇴비(도 6c)에서 실온에서 7일 동안 성장시켰다.
담자균 균류는 실시예 3-7을 통해 기재된 형질전환 또는 형질감염 프로토콜로 실시예 2에 기재된 pGWB5 벡터를 사용하여 형질전환된다. 형질전환은 상이한 Psi 유전자를 개별적으로 및 조합하여 포함한다(다수의 상이한 벡터 또는 다수의 Psi 유전자를 갖는 벡터 사용).
예를 들어, 버섯 아가미에서 조직을 추출하고 실시예 3-7에 기재된 아그로박테리움-매개된 형질전환에 의해 Psi 유전자를 형질전환시켰다.
원형질체를 균사체로부터 생성하고 PEG-매개된 형질감염으로 Psi 유전자를 형질전환시켰다. 균사체는 아그로박테리움-매개된 형질전환으로 형질전환되었다.
다수의 형질전환 균류의 재생 후, 유전자 통합을 확인하고 RNA 발현 수준을 결정하기 위해 폴리뉴클레오티드 분석이 수행될 것이다. 부가하여, 파괴된 유전자의 mRNA 및 단백질 수준이 결정될 것이다. 식물 조직에서 테르펜 또는 칸나비노이드와 같은 하나 이상의 생리활성 대사산물의 함량 또한 결정될 것이다. 예를 들어, 실로시빈 및/또는 실로신 중 하나 이상의 함량은 당업자에게 공지된 절차에 따라 결정될 것이다.
표 5. 실로시빈 발현 벡터 서열.
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
Figure pct00052
Figure pct00053
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
Figure pct00058
Figure pct00059
Figure pct00060
Figure pct00061
Figure pct00062
SEQUENCE LISTING <110> INTIMA BIOSCIENCE, INC. <120> GENETIC ENGINEERING OF FUNGI TO MODULATE TRYPTAMINE EXPRESSION <130> 47533-751.601 <140> PCT/US2020/053842 <141> 2020-10-01 <150> 62/909,159 <151> 2019-10-01 <160> 21 <170> PatentIn version 3.5 <210> 1 <211> 1320 <212> DNA <213> Psilocybe cubensis <400> 1 atgcaggtga tacccgcgtg caactcggca gcaataagat cactatgtcc tactcccgag 60 tcttttagaa acatgggatg gctctctgtc agcgatgcgg tctacagcga gttcatagga 120 gagttggcta cccgcgcttc caatcgaaat tactccaacg agttcggcct catgcaacct 180 atccaggaat tcaaggcttt cattgaaagc gacccggtgg tgcaccaaga atttattgac 240 atgttcgagg gcattcagga ctctccaagg aattatcagg aactatgtaa tatgttcaac 300 gatatctttc gcaaagctcc cgtctacgga gaccttggcc ctcccgttta tatgattatg 360 gccaaattaa tgaacacccg agcgggcttc tctgcattca cgagacaaag gttgaacctt 420 cacttcaaaa aacttttcga tacctgggga ttgttcctgt cttcgaaaga ttctcgaaat 480 gttcttgtgg ccgaccagtt cgacgacaga cattgcggct ggttgaacga gcgggccttg 540 tctgctatgg ttaaacatta caatggacgc gcatttgatg aagtcttcct ctgcgataaa 600 aatgccccat actacggctt caactcttac gacgacttct ttaatcgcag atttcgaaac 660 cgagatatcg accgacctgt agtcggtgga gttaacaaca ccaccctcat ttctgctgct 720 tgcgaatcac tttcctacaa cgtctcttat gacgtccagt ctctcgacac tttagttttc 780 aaaggagaga cttattcgct taagcatttg ctgaataatg accctttcac cccacaattc 840 gagcatggga gtattctaca aggattcttg aacgtcaccg cttaccaccg atggcacgca 900 cccgtcaatg ggacaatcgt caaaatcatc aacgttccag gtacctactt tgcgcaagcc 960 ccgagcacga ttggcgaccc tatcccggat aacgattacg acccacctcc ttaccttaag 1020 tctcttgtct acttctctaa tattgccgca aggcaaatta tgtttattga agccgacaac 1080 aaggaaattg gcctcatttt ccttgtgttc atcggcatga ccgaaatctc gacatgtgaa 1140 gccacggtgt ccgaaggtca acacgtcaat cgtggcgatg acttgggaat gttccatttc 1200 ggtggttctt cgttcgcgct tggtctgagg aaggattgca gggcagagat cgttgaaaag 1260 ttcaccgaac ccggaacagt gatcagaatc aacgaagtcg tcgctgctct aaaggcttag 1320 <210> 2 <211> 2155 <212> DNA <213> Psilocybe cubensis <400> 2 atgatcgctg tactattctc cttcgtcatt gcaggatgca tatactacat cgtttctcgt 60 agagtgaggc ggtcgcgctt gccaccaggg ccgcctggca ttcctattcc cttcattggg 120 aacatgtttg atatgcctga agaatctcca tggttaacat ttctacaatg gggacgggat 180 tacagtctgt cttgccgcgt tgacttctaa tatatgaaca gctaatatat tgtcagacac 240 cgatattctc tacgtggatg ctggagggac agaaatggtt attcttaaca cgttggagac 300 cattaccgat ctattagaaa agcgagggtc catttattct ggccggtgag ctgatgttga 360 gttttttgca attgaatttg tggtcacacg tttccagact tgagagtaca atggtcaacg 420 aacttatggg gtgggagttt gacttagggt tcatcacata cggcgacagg tggcgcgaag 480 aaaggcgcat gttcgccaag gagttcagtg agaagggcat caagcaattt cgccatgctc 540 aagtgaaagc tgcccatcag cttgtccaac agcttaccaa aacgccagac cgctgggcac 600 aacatattcg ccagtaagta ctacttgagg aaaatagcgt acgcttcgct gaccggtccg 660 tacatcaaag tcagatagcg gcaatgtcac tggatattgg ttatggaatt gatcttgcag 720 aagacgaccc ttggctggaa gcgacccatt tggctaatga aggcctcgcc atagcatcag 780 tgccgggcaa attttgggtc gattcgttcc cttctcgtga gcatccttct tctatgtagg 840 aagggaagga gtctaacaag tgttagtaaa ataccttcct gcttggttcc caggtgctgt 900 cttcaagcgc aaagcgaagg tctggcgaga agccgccgac catatggttg acatgcctta 960 tgaaactatg aggaaattag cagttagtca aatgcgttct ccccgtattt tttcaatact 1020 ctaacttcag ctcacagcct caaggattga ctcgtccgtc gtatgcttca gctcgtctgc 1080 aagccatgga tctcaacggt gaccttgagc atcaagaaca cgtaatcaag aacacagccg 1140 cagaggttaa tgtcggtaag tcaaaagcgt ccgtcggcaa ttcaaaattc aggcgctaaa 1200 gtgggtcttc tcaccaaggt ggaggcgata ctgtaaggat ttctcaatcg ttagagtata 1260 agtgttctaa tgcagtacat actccaccaa ccagactgtc tctgctatgt ctgcgttcat 1320 cttggccatg gtgaagtacc ctgaggtcca gcgaaaggtt caagcggagc ttgatgctct 1380 gaccaataac ggccaaattc ctgactatga cgaagaagat gactccttgc catacctcac 1440 cgcatgtatc aaggagcttt tccggtggaa tcaaatcgca cccctcgcta taccgcacaa 1500 attaatgaag gacgacgtgt accgcgggta tctgattccc aagaacactc tagtcttcgc 1560 aaacacctgg tgaggctgtc cattcattcc tagtacatcc gttgccccac taatagcatc 1620 ttgataacag ggcagtatta aacgatccag aagtctatcc agatccctct gtgttccgcc 1680 cagaaagata tcttggtcct gacgggaagc ctgataacac tgtacgcgac ccacgtaaag 1740 cggcatttgg ctatggacga cgaaattggt aagtgcgctt tcagaacccc cccttccgtt 1800 gactagtgcc atgcgcgcat acaatatcgc tattgatctg atataacttc cctgcggcat 1860 ttattttggc attcctttag tcccggaatt catctagcgc agtcgacggt ttggattgca 1920 ggggcaaccc tcttatcagc gttcaatatc gagcgacctg tcgatcagaa tgggaagccc 1980 attgacatac cggctgattt tactacagga ttcttcaggt agctaatttc cgtctttgtg 2040 tgcataatac ccctaacgac gcacgtttac ctttttgtaa agacacccag tgcctttcca 2100 gtgcaggttt gttcctcgaa cagagcaagt ctcacagtcg gtatccggac cctga 2155 <210> 3 <211> 1089 <212> DNA <213> Psilocybe cubensis <400> 3 atggcgttcg atctcaagac tgaagacggc ctcatcacat atctcactaa acatctttct 60 ttggacgtcg acacgagcgg agtgaagcgc cttagcggag gctttgtcaa tgtaacctgg 120 cgcattaagc tcaatgctcc ttatcaaggt catacgagca tcatcctgaa gcatgctcag 180 ccgcacatgt ctacggatga ggattttaag ataggtgtag aacgttcggt ttacgaatac 240 caggctatca agctcatgat ggccaatcgg gaggttctgg gaggcgtgga tggcatagtt 300 tctgtgccag aaggcctgaa ctacgactta gagaataatg cattgatcat gcaagatgtc 360 gggaagatga agaccctttt agattatgtc accgccaaac cgccacttgc gacggatata 420 gcccgccttg ttgggacaga aattgggggg ttcgttgcca gactccataa cataggccgc 480 gagaggcgag acgatcctga gttcaaattc ttctctggaa atattgtcgg aaggacgact 540 tcagaccagc tgtatcaaac catcataccc aacgcagcga aatatggcgt cgatgacccc 600 ttgctgccta ctgtggttaa ggaccttgtg gacgatgtca tgcacagcga agagaccctt 660 gtcatggcgg acctgtggag tggaaatatt cttctccagt tggaggaggg aaacccatcg 720 aagctgcaga agatatatat cctggattgg gaactttgca agtacggccc agcgtcgttg 780 gacctgggct atttcttggg tgactgctat ttgatatccc gctttcaaga cgagcaggtc 840 ggtacgacga tgcggcaagc ctacttgcaa agctatgcgc gtacgagcaa gcattcgatc 900 aactacgcca aagtcactgc aggtattgct gctcatattg tgatgtggac cgactttatg 960 cagtggggga gcgaggaaga aaggataaat tttgtgaaaa agggggtagc tgcctttcac 1020 gacgccaggg gcaacaacga caatggggaa attacgtcta ccttactgaa ggaatcatcc 1080 actgcgtaa 1089 <210> 4 <211> 930 <212> DNA <213> Psilocybe cubensis <400> 4 atgcatatca gaaatcctta ccgtacacca attgactatc aagcactttc agaggccttc 60 cctcccctca agccatttgt gtctgtcaat gcagatggta ccagttctgt tgacctcact 120 atcccagaag cccagagggc gttcacggcc gctcttcttc atcgtgactt cgggctcacc 180 atgaccatac cagaagaccg tctgtgccca acagtcccca ataggttgaa ctacgttctg 240 tggattgaag atattttcaa ctacacgaac aaaaccctcg gcctgtcgga tgaccgtcct 300 attaaaggcg ttgatattgg tacaggagcc tccgcaattt atcctatgct tgcctgtgct 360 cggttcaagg catggtctat ggttggaaca gaggtcgaga ggaagtgcat tgacacggcc 420 cgcctcaatg tcgtcgcgaa caatctccaa gaccgtctct cgatattaga gacatccatt 480 gatggtccta ttctcgtccc cattttcgag gcgactgaag aatacgaata cgagtttact 540 atgtgtaacc ctccattcta cgacggtgct gccgatatgc agacttcgga tgctgccaaa 600 ggatttggat ttggcgtggg cgctccccat tctggaacag tcatcgaaat gtcgactgag 660 ggaggtgaat cggctttcgt cgctcagatg gtccgtgaga gcttgaagct tcgaacacga 720 tgcagatggt acacgagtaa cttgggaaag ctgaaatcct tgaaagaaat agtggggctg 780 ctgaaagaac ttgagataag caactatgcc attaacgaat acgttcaggg gtccacacgt 840 cgttatgccg ttgcgtggtc tttcactgat attcaactgc ctgaggagct ttctcgtccc 900 tctaaccccg agctcagctc tcttttctag 930 <210> 5 <211> 1572 <212> DNA <213> Psilocybe cubensis <400> 5 atgtctctgg agcgctcaac aagtccaaat cctaccgagc gtacatctct tctatctgac 60 actgcgtcta ccatttcatc cagagatgac gttgaacagt caagtctgaa gcaaaggcgc 120 acgcctatac caactggaca acttggcggt aaggtctcaa tgcattcaat tattataaac 180 gctgagggtc atttatggcc ttatattaac cagtttgtga atgatatcgg cgtctctgat 240 gggaatccac gtaatgttgg gttctacagt gggttgatcg aaagtgtatt tgcttgcgga 300 gaagtttgct ctatcttcat gctgtcgagg ctttcagata gaataggtcg tcgaccggtg 360 ctactcccat ctgcactggg tattgcagtg tttactgctc tgtttggttt atcaagctcg 420 tttaccatga tgttgactct tcgagtttgc gctggtctct tagccggagc gacgcctata 480 gtacactcca ttgtcagcga acttactgat gataccaata atgcactcgt tgtaccatta 540 tatggcctca taactcccat cggatttgcc attgggcccc tgatcggggg aacccttgaa 600 cacgctgcaa ctaagtatcc caacgtcttt ggatatgagc tttttcgaaa gtacccctac 660 ttcttaccat cgtttgttcc atgctgcatg gctatcgtgg gcgtcacatt cggctacttc 720 tttttaaaag aaacgcttcc tagtttagtc aagtctaaaa aaagacttga acgtcaacgg 780 tcctcctctt ctatatcatc agagaactct actctatacg gtgccacaga gcatatcagg 840 gactcaacag aagaaaccgc ggcggacgag gaacccgatt ccaagccgaa gggtattact 900 gagttaattc gggatccttc tatacgggct ataatggctt ctggtacatt tttgatgttt 960 ctatacacga gttccgatgt gatattctca ctctactgct ttactgctgt tgaggatgga 1020 ggcgttggat tgcctcccga gaagatcggt tatgcattct ccgttgcagg cctcatagct 1080 atgctcatgc agctttgcat aacgccatgg gtgctccgta cttttgacaa ggctaaagta 1140 taccacttct gcatgtgctc gttccctctc gtgtttgcac tcatgggatg cctgaatccc 1200 ctcgctcaaa ctgggtacag tgaaattaac aaaacacttc atccgaccac tacgggactg 1260 ctctatgctg caatagccat cttgctcctt ctagcccgtg tctgcgttat ggcattccct 1320 atcagcatga tgctggttaa acaaacggcc gataagcatt cgcttgccac tgcgaatggc 1380 ctcgtgcaag tggccatgac ccttgcaaga gcattctgcc ctacaatctc aagctcggtg 1440 tttgcttatt ctactagcca taatatcctg ggtggacatt tctgggtggt agtgatggta 1500 ttcatttccc tggttggggt atggcaatct acgaaaattg ccagggtcac aaaaacaaaa 1560 gagcaattgt ga 1572 <210> 6 <211> 1416 <212> DNA <213> Psilocybe cubensis <400> 6 atgaatccta cgaccgccac cgatgctcat gaacgaacat cgctgttgtc tggaagaccg 60 caatctgctg caaattcgac ggctccatat gagcgacaag ttcaaccatc gcgaaaatcc 120 caatgcttta ctccagtgac cgtgatcacc ataattacgc tcatatatcg tctcgcgaca 180 acgatggtaa tcacgaccaa cattcgggtt ctccacacag ttgcatgcca gctttggtat 240 catgtcaacg atcccgacgt atttccaggg ggaaatatac cagaaaaata ttgtgcgcta 300 cctggtgtag acaagtatta tgctataatg gtgtctatga ccactgtcat agatggtctt 360 ggaggtatac ttgggaccgg catagccagc tacatgtcat ctcgttttgg cagaaagcct 420 gttctcatgt tcctgctttc ctgtaccatg atcgatcacc tcgccatcct gacagtccaa 480 aatgtatacg gatggaagca gttggtaaca tttgggttaa ttatgattgt tgaaaccatt 540 ggaaatgaga acaccacagt atttctggtg agcatgtacg tggttgatgt tactgaggct 600 gagagaagga ccgctgctct gagttcaatt actggctggc ttgttctcgg aggcgccctc 660 gcctattcaa taggcggatc tataacaact tttttacact ccaactctgc cgtatacatt 720 gtatcgttca gtgtcactgg catcgttcta acattcaccg cctttgttct ccctgaatca 780 ttccctgctg aaaaaagaga tctcttgcgg cttgaacgac tggcagaaac ccgtggacac 840 agccagtcct ggacccaaaa aatcaaagct gtggcaactg tcgcattgga acctatggaa 900 ttgctaaaac cgacatttaa ccccataacg gggaaggcaa attggcggct tgtatactgc 960 gccctccact cgtttattgt cactctagca gatgcgtatg ctcttcctgc catgttgata 1020 tttttcacta cccagtattc atatacaccc gctcagatgg gatatgttat gacgacgtac 1080 agtgtctcca gtgtgtttgt tttggcgata gccttacccc tgtttattcg atggttcaag 1140 cccctgtata ataatactca aacgaagtct gtcccagatg aaggggatgg actccgtgcg 1200 accgactctg gagaagcggg tgtgcacaca caagaggtcg ttgtttcgga aacctctgat 1260 cgcatggacg tccatatcac tgtcatatcc tggaccatag agtcattagc atacatagtt 1320 ctcggtactg tgggttcatt ttacgcacaa cttttaggtc ggccgttgcc tctattggct 1380 ttggatctgg acgcattcca ggaattcgaa gcctag 1416 <210> 7 <211> 1077 <212> DNA <213> Psilocybe cubensis <400> 7 atggcacccg caacacccgc aactcacgat cctgccttgt cccacggagc ccctcctgct 60 ccaggtgctc cagctcctgc aaatgctcct ccaaacgcct caggagacat tgctggaatg 120 cagctcagcg gactcgatca gtcccagatc atgaaccttc ttcgttcatt gcctggcatg 180 ttctcgggcg gtaaaatacc cgaccaaggc caaggcaaca aagaggatgc tgctcaaacg 240 ctgtccaacc ttgcccaagc tcaaccgtat ggacaacaat taccccttca ctaccaagct 300 ggcggcccag gaggtctgcc aggaattaac gacccaggcc cgtccacaca tccccgcggc 360 cctcccaacc ttggccaact gagtgctgtg gcaatgcaag ccgcccccgc tccaattcag 420 catccagacc agcaaacgaa ccgcaacgat ggcgagcagg ctggcaatgc gagtgcaagt 480 acctccggaa aggatggtga caatgcagaa ttcgttcccc cacctgctcc tgctcctaca 540 actggtcgcc gtggtggacg cagcgccacc atgggaagtg acgaatggag cagacagagg 600 aaggataatc ataaagaggt tgagcgtcga cgccgcggca atatcaacga gggcatcaac 660 gagcttggcc gcattgtacc cagtgggtct ggcgagaagg ccaaaggcgc catcctttct 720 cgagctgtgc agtacatcca tcatttgaaa gagaacgaag ctcgcaatat cgagaagtgg 780 acccttgaga agcttctcat ggaccaggcc atgggtgacc tgcaggcgca actcgaagag 840 gtcaagcgtc tgtgggaaga agagcgtatg gcgcgcacaa gactcgaggc cgagctcgaa 900 gtgttgagaa atatgaacgg cgtgaatgct ggctcggccc cggcctcgaa agatgagagt 960 gctgcaggta ctaagaggag gagtaccgat ggagcagagg ccgccaccgc cgccactgaa 1020 agcagcaccg ccaatgccga gggcgaacgc gacggcaagc gacaaagaac cgagtga 1077 <210> 8 <211> 1320 <212> DNA <213> Psilocybe cyanescens <400> 8 atgcaggtac tgcccgcgtg ccaatcttcc gcgcttaaaa cattgtgccc atcccccgag 60 gcctttcgaa agctcggttg gctccctact agcgacgagg tttacaacga attcatcgat 120 gacttgaccg gtcgcacgtg caatgaaaag tactccagcc aggttacact tttgaagcct 180 atccaagatt tcaagacatt catcgagaat gatcccatag tgtatcaaga atttatctct 240 atgtttgaag gaatcgagca gtctcccacc aactaccacg agctatgtaa catgttcaac 300 gacatctttc gcaaagcccc actctacggc gatcttggtc ctccggttta catgatcatg 360 gccagaataa tgaatacgca ggcgggtttc tctgcgttca caaaagagag cttgaacttc 420 catttcaaaa agctcttcga cacctggggg ctattccttt cctcgaaaaa ctctcgaaac 480 gtgcttgttg cagaccagtt tgacgataag cattacgggt ggttcagcga gcgagccaag 540 actgccatga tgattaatta tccagggcgt acattcgaga aagtcttcat ctgcgacgag 600 cacgttccat accatggctt cacttcctat gacgatttct tcaatcgcag gttcagggac 660 aaggatacag atcggcccgt agtcggtggg gttactgaca ccactttaat cggggctgcc 720 tgtgaatcgt tgtcatataa cgtctctcac aacgtccagt ctcttgacac gctagtcatc 780 aagggagagg cctattcact taaacatcta cttcataacg accccttcac accgcaattc 840 gaacatggga gcatcattca aggattccta aatgtcaccg cttaccaccg ctggcactcc 900 cccgtcaatg gcacgattgt gaagatcgtc aacgttccag gtacctactt cgctcaagct 960 ccatatacaa ttggatctcc tatccccgat aacgaccgcg acccgcctcc ttacctcaag 1020 tcactcgtat acttctccaa catcgctgca cggcaaatta tgttcatcga ggccgacaac 1080 aaagacatcg gcctcatttt cttggtcttc attggaatga ctgagatctc gacttgcgag 1140 gcgacggtgt gcgaaggtca gcatgtcaac cgcggtgacg atttgggcat gttccatttc 1200 ggtggttcat cttttgccct tggcttgcgg aaggactcga aggcgaagat tttggaaaag 1260 ttcgcgaaac cggggaccgt tattaggatc aacgagctag ttgcatctgt aaggaagtag 1320 <210> 9 <211> 1521 <212> DNA <213> Psilocybe cyanescens <400> 9 atgattgttc tattggtctc gctcgtcctt gcaggatgca tatactacgc caacgctcgt 60 agagtaaggc gctcgcgctt accaccgggc ccgcctggca taccactgcc cttcattggg 120 aatatgtttg atatgccttc agagtcaccg tggttaagat ttcttcaatg gggacgggac 180 tatcacactg atatccttta cttgaatgct ggcggaacgg aaataattat tctgaacaca 240 ctggatgcta taaccgactt gttggaaaag cgagggtcga tgtattcggg tcgactcgag 300 agcaccatgg tgaacgaact catggggtgg gagttcgact tgggattcat aacctatggt 360 gaaagatggc gcgaagaaag acgcatgttc gccaaggagt tcagcgaaaa aaacatcagg 420 caattccgcc acgcccaaat taaagctgcc aatcagcttg ttcggcagct gatcaaaacg 480 ccagatcgtt ggtcgcagca catccggcat cagatagcag ccatgtctct agacattggt 540 tatggaattg atctcgcaga ggatgacccc tggattgcag caacccagct agctaacgaa 600 gggctcgccg aagcttcagt accgggcagt ttctgggtcg actcattccc cgccctcaaa 660 taccttcctt catggcttcc tggtgcagga ttcaagcgca aagcaaaggt atggaaggaa 720 ggtgctgacc atatggtgaa catgccgtat gaaacgatga aaaaattgac tgttcaaggc 780 ttggcccgac cttcatatgc ctcagctcgt ctgcaggcca tggaccccga tggcgatctc 840 gagcatcagg aacacgtgat cagaaacaca gcgactgagg tcaatgtcgg cggaggtgat 900 acgactgttt ctgctgtgtc agcctttatt ttggccatgg tcaaatatcc agaagttcaa 960 cgccaagtcc aagcagaact ggatgcactc accagcaaag gagttgtccc aaactatgac 1020 gaagaagacg actccttgcc ataccttacg gcttgcgtca aggaaatctt tcgatggaac 1080 caaatagcac cccttgctat ccctcatcgg ctgatcaaag acgatgttta tcgtgggtat 1140 ctcataccaa agaatgcttt ggtctacgcc aactcatggg ctgtgttgaa tgacccagag 1200 gagtacccaa atccctctga gttccgacca gaacgatatt tgagctctga cggaaagccc 1260 gacccaacgg tccgtgatcc ccgcaaagca gcatttggct atggtcgacg caactgtccc 1320 ggaatccacc tggcacaatc gacggtatgg attgctggag ccactcttct ctcggtattc 1380 aatatcgaac gtcctgttga tgggaatgga aaacccatcg acatcccggc gacgttcact 1440 accggattct tcagacatcc cgagcctttc cagtgcagat ttgtccctcg cactcaggag 1500 attctaaaat ccgtttccgg t 1521 <210> 10 <211> 1086 <212> DNA <213> Psilocybe cyanescens <400> 10 atgactttcg atctcaagac tgaagaaggc ctgctctcat acctcacaaa gcacctatcg 60 ctggacgttg ctcccaacgg ggtgaaacgt cttagtggag gcttcgtcaa cgttacctgg 120 cgggtcgggc tcaatgcccc ttatcatggt cacacgagca ttattctgaa gcatgctcaa 180 ccgcacctgt cttcagacat agatttcaag ataggtgttg aacgatcggc gtacgagtat 240 caagcgctca aaatcgtgtc agccaatagc tcccttctag gcagcagcga tattcgggtc 300 tctgtaccag aaggtcttca ctacgacgtc gttaataacg cattgatcat gcaagatgtc 360 gggacaatga agaccctgtt ggactatgtc actgccaaac caccaatttc tgcagagatc 420 gccagtctcg taggcagtca aattggtgca tttatcgcta ggctgcacaa cctcggccgc 480 gagaataaag acaaggacga cttcaagttc ttctctggaa acatcgtcgg gagaacaacc 540 gcagaccagt tgtatcaaac catcatacct aatgccgcta aatacggtat cgacgatcca 600 attctcccaa ttgtggtaaa ggagttggtg gaggaggtca tgaatagtga agaaacgctt 660 atcatggcgg atttatggag tggcaatatt cttctccagt ttgatgaaaa ctcgacggaa 720 ttgacgagga tatggctggt agactgggag ttgtgcaaat atggtccacc gtctttggac 780 atggggtact tcttaggcga ctgtttcctg gtcgctcgat ttcaagatca gctcgtaggg 840 acatcaatgc gacaggccta cttgaagagc tacgcaagga atgtcaagga gccaatcaat 900 tatgcaaaag ccaccgcagg catcggcgcg catctcgtca tgtggactga tttcatgaag 960 tgggggaacg atgaagagag ggaagagttt gttaagaaag gcgtggaagc cttccatgaa 1020 gcaaatgagg acaatagaaa cggggagatt acgtctatac ttgtgaagga agcatcgcgc 1080 acttag 1086 <210> 11 <211> 930 <212> DNA <213> Psilocybe cyanescens <400> 11 atgcatatca ggaacccata ccgcgatggt gttgactacc aagcactcgc tgaagcattt 60 ccggctctca aaccacatgt cacagtaaat tcagacaata cgacctccat cgactttgct 120 gtgccagaag cccaaagact gtatacagct gcccttctac accgggattt cggtcttacg 180 atcacactcc cggaagaccg tctttgtccg acagtgccta atcggctcaa ctatgtcctt 240 tgggttgaag atatccttaa agtcacttct gatgctctcg gtcttccgga taatcgtcaa 300 gttaagggga tcgatatcgg aactggcgca tcagcgatat atcccatgct cgcatgctct 360 cgttttaaga catggtccat ggttgcaaca gaggtagacc agaagtgtat tgacactgct 420 cgtctcaacg tcattgccaa caacctccaa gaacgtctcg caattatagc cacctccgtc 480 gatggtccta tacttgtccc cctcttgcag gcgaattctg attttgagta cgattttacg 540 atgtgtaatc cgcccttcta cgatggggca tccgacatgc agacatcgga tgctgcgaag 600 gggtttggat tcggtgtgaa cgctccgcat accggcacgg tgctcgagat ggccaccgag 660 ggaggtgaat cggccttcgt agcccaaatg gtccgcgaaa gtttgaatct tcaaacacga 720 tgcaggtggt tcacgagtaa tttggggaaa ttgaagtcct tgtacgaaat tgtggggctg 780 ctgcgagaac atcagataag taactacgca atcaacgaat acgtccaagg agccactcgt 840 cgatatgcga ttgcatggtc gttcatcgat gttcgactgc ctgatcattt gtcccgtcca 900 tctaaccccg acctaagctc tcttttctag 930 <210> 12 <211> 1587 <212> DNA <213> Psilocybe cyanescens <400> 12 atgtcgccag agcgctcagc aagtcttgaa ccagatgagc attcgtctct gctctccgat 60 acggcctcct acatctcgag agatgactta gaagactcaa aagcgaagca aatcccgacg 120 cctataccaa agaaacaact tggagtttta ttttccatca gattcacaga acctataatt 180 tacagtcatt tgtggcctta tatcaaccaa ttcgttaatg atatcggggt cgccgacggg 240 aaccctcgct atgttggatt ttacagtggt ttgatcgaaa gtgtatttgc ttgtggagaa 300 gtgtgttcta tcttcatgtt atcgaggctg tcagacagaa taggtcgccg accagtgttg 360 ctcccgtctg ccctcggcgt agcattattt acagctttgt tcggtttatc gacctcgttt 420 actatgatgc tcgttctccg ggtttgtgct ggtcttttgg ccggggctac tcctatagtc 480 cattctgttg tgagtgagct cacggacgaa acgaataatg ccctcgtagt acccctttac 540 gggttaatta cacctattgg ctttgcgatt ggacctctga ttggtggaac tcttgagcac 600 gctgctacta aatatcccaa cgtatttggt tatgacttcc ttcgaaaata tccatacttt 660 ctaccatcct ttgttccatg ctgcctagct gtcgttggcg tcaccttcgg ctatttcttc 720 ttgcaagaga cgcttcccag tatagtacgg gccaagaaaa gacttgaacg acagaaatct 780 acttcgtcta tttcgtcaag aacctccacc ctatacggtg ctacagatga tcacaataga 840 gatgcatcag aatcaaccgc gttgtctccg gaggaagcgg aagatgaaat tgactctaag 900 cctcaaagca tcaaagcttt aatcgtagac ccttctatgc gggccatcat gggttctggt 960 acctttctga tgttcctcta cacgagttcc gatgttctgt tctcactcta ctgctttact 1020 gctgtcgagg acggaggcgt cggattacct cccgacgaaa tcggttacgc attctctgtt 1080 gccggcgtga tagctatgct tatgcagctt tgcataacac cttgggtcct acgtacattc 1140 gataaggcaa aagtatacaa gttctgcatg ttctcattcc cgcttgtatt tgccctcatg 1200 ggatgtctta atcccctcgc tcaaaccggg tataatgaag tctctaagac tatccaccct 1260 accacaacgg gacttcttta cgctgctatt gctgtgttgc tactgttggc acgggtctgc 1320 gtcatggcgt tcccgatcag catgatgttg attaagcaga atgccgataa aaactcactc 1380 gccactgcga acgggcttgt gcaagtgtcg atgaccattg ctagagcact ctgccccacg 1440 gtctctagtt cgctcttcgc ttattccacg agcaacaata ttctgggtgg tcatctctgg 1500 gtccttatta tggtgaccat atccctcgca ggcgtctggc agtcgatgag catcgcccgc 1560 gttaccaaaa gaaaggaaga gctataa 1587 <210> 13 <211> 1416 <212> DNA <213> Psilocybe cyanescens <400> 13 atgaatccta cgaccgccac cgatgctcat gaacgaacat cgctgttgtc tggaagaccg 60 caatctgctg caaattcgac ggctccatat gagcgacaag ttcaaccatc gcgaaaatcc 120 caatgcttta ctccagtgac cgtgatcacc ataattacgc tcatatatcg tctcgcgaca 180 acgatggtaa tcacgaccaa cattcgggtt ctccacacag ttgcatgcca gctttggtat 240 catgtcaacg atcccgacgt atttccaggg ggaaatatac cagaaaaata ttgtgcgcta 300 cctggtgtag acaagtatta tgctataatg gtgtctatga ccactgtcat agatggtctt 360 ggaggtatac ttgggaccgg catagccagc tacatgtcat ctcgttttgg cagaaagcct 420 gttctcatgt tcctgctttc ctgtaccatg atcgatcacc tcgccatcct gacagtccaa 480 aatgtatacg gatggaagca gttggtaaca tttgggttaa ttatgattgt tgaaaccatt 540 ggaaatgaga acaccacagt atttctggtg agcatgtacg tggttgatgt tactgaggct 600 gagagaagga ccgctgctct gagttcaatt actggctggc ttgttctcgg aggcgccctc 660 gcctattcaa taggcggatc tataacaact tttttacact ccaactctgc cgtatacatt 720 gtatcgttca gtgtcactgg catcgttcta acattcaccg cctttgttct ccctgaatca 780 ttccctgctg aaaaaagaga tctcttgcgg cttgaacgac tggcagaaac ccgtggacac 840 agccagtcct ggacccaaaa aatcaaagct gtggcaactg tcgcattgga acctatggaa 900 ttgctaaaac cgacatttaa ccccataacg gggaaggcaa attggcggct tgtatactgc 960 gccctccact cgtttattgt cactctagca gatgcgtatg ctcttcctgc catgttgata 1020 tttttcacta cccagtattc atatacaccc gctcagatgg gatatgttat gacgacgtac 1080 agtgtctcca gtgtgtttgt tttggcgata gccttacccc tgtttattcg atggttcaag 1140 cccctgtata ataatactca aacgaagtct gtcccagatg aaggggatgg actccgtgcg 1200 accgactctg gagaagcggg tgtgcacaca caagaggtcg ttgtttcgga aacctctgat 1260 cgcatggacg tccatatcac tgtcatatcc tggaccatag agtcattagc atacatagtt 1320 ctcggtactg tgggttcatt ttacgcacaa cttttaggtc ggccgttgcc tctattggct 1380 ttggatctgg acgcattcca ggaattcgaa gcctag 1416 <210> 14 <211> 1113 <212> DNA <213> Psilocybe cyanescens <400> 14 atggcaccca caacacccgc aactcacgat ccagccttgt cccacggagc tcctcctact 60 cagggctcgc aggcaccagc aaatgcggcc ccaaatctta ccccagccga catctctggc 120 atgcaactca acggcctcga tcagtcccag atcatgaacc ttctccgttc attgcccggc 180 atgttcacag gtgctaaaat accagatcaa ggacaaggca atcccaaaga ggatgctgcc 240 caaacactgt ccaacctcgc acaggcttca tcacccttcg gcggccaaca tttgcccatc 300 cactatcaaa ccggcgctgc tggtggtctt ccaggaatca acgacccagg cccgtcaact 360 cacccccgcg gccctcctaa cctcggccag ctgagtgctg tcgcgatgca agcggcccca 420 gcgacgatcc aacaccagga ccagcaacag tctgggcgcc aggaagacgg cgagcaggcc 480 ggaaatacga gcattgatag cccatctgcg aaagatggcg agaatggcac tggggagttt 540 aaccagacgt ctacgagcac tccttcggga ggccgtcggg gtgggcgcag tgccaccatg 600 ggcagcgacg aatggagcag gcagaggaag gataatcata aagaggttga gcgtcggcgc 660 cgcggaaata tcaacgaagg gattaacgag ctgggccgca tcgtaccgag cggatcaggc 720 gagaaagcca aaggcgccat cctctcgcgc gccgtgcagt acatccacca tttgaaagag 780 aatgaagctc ggaacatcga gaagtggacg cttgagaagc tacttatgga tcaggcgatg 840 ggcgacctgc aggcgcaact tgaggagatc aagcggctgt gggaggagga gcgcatggct 900 cgtacgaggc ttgaggctga gctcgaggtg ttgaggaata tgaatggtgt gagtactgcc 960 ggtgcgggtt cgggtgcggc gaaggatgaa agcgctgccg gcacgaagcg gaggagcacg 1020 gatggtgctg atgctgccgg cacaaatgtt gaaggtggta ataacgacaa cgctgaagga 1080 gagagggacg gaaaacgtca gagaactgag tga 1113 <210> 15 <211> 17267 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 15 tgagcgtcgc aaaggcgctc ggtcttgcct tgctcgtcgg tgatgtactt caccagctcc 60 gcgaagtcgc tcttcttgat ggagcgcatg gggacgtgct tggcaatcac gcgcaccccc 120 cggccgtttt agcggctaaa aaagtcatgg ctctgccctc gggcggacca cgcccatcat 180 gaccttgcca agctcgtcct gcttctcttc gatcttcgcc agcagggcga ggatcgtggc 240 atcaccgaac cgcgccgtgc gcgggtcgtc ggtgagccag agtttcagca ggccgcccag 300 gcggcccagg tcgccattga tgcgggccag ctcgcggacg tgctcatagt ccacgacgcc 360 cgtgattttg tagccctggc cgacggccag caggtaggcc gacaggctca tgccggccgc 420 cgccgccttt tcctcaatcg ctcttcgttc gtctggaagg cagtacacct tgataggtgg 480 gctgcccttc ctggttggct tggtttcatc agccatccgc ttgccctcat ctgttacgcc 540 ggcggtagcc ggccagcctc gcagagcagg attcccgttg agcaccgcca ggtgcgaata 600 agggacagtg aagaaggaac acccgctcgc gggtgggcct acttcaccta tcctgcccgg 660 ctgacgccgt tggatacacc aaggaaagtc tacacgaacc ctttggcaaa atcctgtata 720 tcgtgcgaaa aaggatggat ataccgaaaa aatcgctata atgaccccga agcagggtta 780 tgcagcggaa aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 840 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 900 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 960 gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1020 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1080 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1140 cagtgagcga ggaagcggaa gagcgccaga aggccgccag agaggccgag cgcggccgtg 1200 aggcttggac gctagggcag ggcatgaaaa agcccgtagc gggctgctac gggcgtctga 1260 cgcggtggaa agggggaggg gatgttgtct acatggctct gctgtagtga gtgggttgcg 1320 ctccggcagc ggtcctgatc aatcgtcacc ctttctcggt ccttcaacgt tcctgacaac 1380 gagcctcctt ttcgccaatc catcgacaat caccgcgagt ccctgctcga acgctgcgtc 1440 cggaccggct tcgtcgaagg cgtctatcgc ggcccgcaac agcggcgaga gcggagcctg 1500 ttcaacggtg ccgccgcgct cgccggcatc gctgtcgccg gcctgctcct caagcacggc 1560 cccaacagtg aagtagctga ttgtcatcag cgcattgacg gcgtccccgg ccgaaaaacc 1620 cgcctcgcag aggaagcgaa gctgcgcgtc ggccgtttcc atctgcggtg cgcccggtcg 1680 cgtgccggca tggatgcgcg cgccatcgcg gtaggcgagc agcgcctgcc tgaagctgcg 1740 ggcattcccg atcagaaatg agcgccagtc gtcgtcggct ctcggcaccg aatgcgtatg 1800 attctccgcc agcatggctt cggccagtgc gtcgagcagc gcccgcttgt tcctgaagtg 1860 ccagtaaagc gccggctgct gaacccccaa ccgttccgcc agtttgcgtg tcgtcagacc 1920 gtctacgccg acctcgttca acaggtccag ggcggcacgg atcactgtat tcggctgcaa 1980 ctttgtcatg cttgacactt tatcactgat aaacataata tgtccaccaa cttatcagtg 2040 ataaagaatc cgcgcgttca atcggaccag cggaggctgg tccggaggcc agacgtgaaa 2100 cccaacatac ccctgatcgt aattctgagc actgtcgcgc tcgacgctgt cggcatcggc 2160 ctgattatgc cggtgctgcc gggcctcctg cgcgatctgg ttcactcgaa cgacgtcacc 2220 gcccactatg gcattctgct ggcgctgtat gcgttggtgc aatttgcctg cgcacctgtg 2280 ctgggcgcgc tgtcggatcg tttcgggcgg cggccaatct tgctcgtctc gctggccggc 2340 gccagatctg gggaaccctg tggttggcat gcacatacaa atggacgaac ggataaacct 2400 tttcacgccc ttttaaatat ccgattattc taataaacgc tcttttctct taggtttacc 2460 cgccaatata tcctgtcaaa cactgatagt ttaaactgaa ggcgggaaac gacaatctga 2520 tcatgagcgg agaattaagg gagtcacgtt atgacccccg ccgatgacgc gggacaagcc 2580 gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactcagc cgcgggtttc 2640 tggagtttaa tgagctaagc acatacgtca gaaaccatta ttgcgcgttc aaaagtcgcc 2700 taaggtcact atcagctagc aaatatttct tgtcaaaaat gctccactga cgttccataa 2760 attcccctcg gtatccaatt agagtctcat attcactctc aatccaaata atctgcaccg 2820 gatctggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 2880 gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 2940 ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 3000 gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg 3060 ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 3120 gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 3180 tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 3240 accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 3300 aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 3360 aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca tggcgatgcc tgcttgccga 3420 atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 3480 cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 3540 aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 3600 ccttctatcg ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga 3660 ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag 3720 gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct 3780 catgctggag ttcttcgccc acgggatctc tgcggaacag gcggtcgaag gtgccgatat 3840 cattacgaca gcaacggccg acaagcacaa cgccacgatc ctgagcgaca atatgatcgg 3900 gcccggcgtc cacatcaacg gcgtcggcgg cgactgccca ggcaagaccg agatgcaccg 3960 cgatatcttg ctgcgttcgg atattttcgt ggagttcccg ccacagaccc ggatgatccc 4020 cgatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc 4080 gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg 4140 catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat acatttaata 4200 cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc 4260 tatgttacta gatcgggcct cctgtcaatg ctggcggcgg ctctggtggt ggttctggtg 4320 gcggctctga gggtggtggc tctgagggtg gcggttctga gggtggcggc tctgagggag 4380 gcggttccgg tggtggctct ggttccggtg attttgatta tgaaaagatg gcaaacgcta 4440 ataagggggc tatgaccgaa aatgccgatg aaaacgcgct acagtctgac gctaaaggca 4500 aacttgattc tgtcgctact gattacggtg ctgctatcga tggtttcatt ggtgacgttt 4560 ccggccttgc taatggtaat ggtgctactg gtgattttgc tggctctaat tcccaaatgg 4620 ctcaagtcgg tgacggtgat aattcacctt taatgaataa tttccgtcaa tatttacctt 4680 ccctccctca atcggttgaa tgtcgccctt ttgtctttgg cccaatacgc aaaccgcctc 4740 tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 4800 cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 4860 tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 4920 caggaaacag ctatgaccat gattacgcca agcttgcatg cctgcaggtc cccagattag 4980 ccttttcaat ttcagaaaga atgctaaccc acagatggtt agagaggctt acgcagcagg 5040 tctcatcaag acgatctacc cgagcaataa tctccaggaa atcaaatacc ttcccaagaa 5100 ggttaaagat gcagtcaaaa gattcaggac taactgcatc aagaacacag agaaagatat 5160 atttctcaag atcagaagta ctattccagt atggacgatt caaggcttgc ttcacaaacc 5220 aaggcaagta atagagattg gagtctctaa aaaggtagtt cccactgaat caaaggccat 5280 ggagtcaaag attcaaatag aggacctaac agaactcgcc gtaaagactg gcgaacagtt 5340 catacagagt ctcttacgac tcaatgacaa gaagaaaatc ttcgtcaaca tggtggagca 5400 cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 5460 tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 5520 ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 5580 cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 5640 cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 5700 ggattgatgt gatatctcca ctgacgtaag ggatgacgca caatcccact atccttcgca 5760 agacccttcc tctatataag gaagttcatt tcatttggag agaacacggg ggactctaat 5820 caaacaagtt tgtacaaaaa agctgaacga gaaacgtaaa atgatataaa tatcaaatgc 5880 atatcagaaa tccttaccgt acaccaattg actatcaagc actttcagag gccttccctc 5940 ccctcaagcc atttgtgtct gtcaatgcag atggtaccag ttctgttgac ctcactatcc 6000 cagaagccca gagggcgttc acggccgctc ttcttcatcg tgacttcggg ctcaccatga 6060 ccataccaga agaccgtctg tgcccaacag tccccaatag gttgaactac gttctgtgga 6120 ttgaagatat tttcaactac acgaacaaaa ccctcggcct gtcggatgac cgtcctatta 6180 aaggcgttga tattggtaca ggagcctccg caatttatcc tatgcttgcc tgtgctcggt 6240 tcaaggcatg gtctatggtt ggaacagagg tcgagaggaa gtgcattgac acggcccgcc 6300 tcaatgtcgt cgcgaacaat ctccaagacc gtctctcgat attagagaca tccattgatg 6360 gtcctattct cgtccccatt ttcgaggcga ctgaagaata cgaatacgag tttactatgt 6420 gtaaccctcc attctacgac ggtgctgccg atatgcagac ttcggatgct gccaaaggat 6480 ttggatttgg cgtgggcgct ccccattctg gaacagtcat cgaaatgtcg actgagggag 6540 gtgaatcggc tttcgtcgct cagatggtcc gtgagagctt gaagcttcga acacgatgca 6600 gatggtacac gagtaacttg ggaaagctga aatccttgaa agaaatagtg gggctgctga 6660 aagaacttga gataagcaac tatgccatta acgaatacgt tcaggggtcc acacgtcgtt 6720 atgccgttgc gtggtctttc actgatattc aactgcctga ggagctttct cgtccctcta 6780 accccgagct cagctctctt ttctagcatt ttacgtttct cgttcagctt tcttgtacaa 6840 agtggttcga tctagaggat ccatggtgag caagggcgag gagctgttca ccggggtggt 6900 gcccatcctg gtcgagctgg acggcgacgt gaacggccac aagttcagcg tgtccggcga 6960 gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa 7020 gctgcccgtg ccctggccca ccctcgtgac caccttcacc tacggcgtgc agtgcttcag 7080 ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta 7140 cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc gcgccgaggt 7200 gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg acttcaagga 7260 ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca acgtctatat 7320 catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc acaacatcga 7380 ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg gcgacggccc 7440 cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca aagaccccaa 7500 cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga tcactcacgg 7560 catggacgag ctgtacaagt aaagcggccc gagctcgaat ttccccgatc gttcaaacat 7620 ttggcaataa agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata 7680 atttctgttg aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat 7740 gagatgggtt tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa 7800 aatatagcgc gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagatcg 7860 ggaattagct tcatcaacgc aagacatgcg cacgaccgtc tgacaggaga ggaatttccg 7920 acgagcacag aaaggacttg ctcttggacg taggcctatt tctcaggcac atgtatcaag 7980 tgttcggacg tgggttttcg atggtgtatc agccgccgcc aactgggaga tgaggaggct 8040 ttcttggggg gcagtcagca gttcatttca caagacagag gaacttgtaa ggagatgcac 8100 tgatttatct tggcgcaaac cagcaggacg aattagtggg aatagcccgc gaatatctaa 8160 gttatgcctg tcggcatgag cagaaacttc caattcgaaa cagtttggag aggttgtttt 8220 tgggcatacc ttttgttagt cagcctctcg attgctcatc gtcattacac agtaccgaag 8280 tttgatcgat ctagtaacat agatgacacc gcgcgcgata atttatccta gtttgcgcgc 8340 tatattttgt tttctatcgc gtattaaatg tataattgcg ggactctaat cataaaaacc 8400 catctcataa ataacgtcat gcattacatg ttaattatta catgcttaac gtaattcaac 8460 agaaattata tgataatcat cgcaagaccg gcaacaggat tcaatcttaa gaaactttat 8520 tgccaaatgt ttgaacgatc tgcttcgacg cactccttct ttactccacc atctcgtcct 8580 tattgaaaac gtgggtagca ccaaaacgaa tcaagtcgct ggaactgaag ttaccaatca 8640 cgctggatga tttgccagtt ggattaatct tgcctttccc cgcatgaata atattgatga 8700 atgcatgcgt gaggggtatt tcgattttgg caatagctgc aattgccgcg acatcctcca 8760 acgagcataa ttcttcagaa aaatagcgat gttccatgtt gtcagggcat gcatgatgca 8820 cgttatgagg tgacggtgct aggcagtatt ccctcaaagt ttcatagtca gtatcatatt 8880 catcattgca ttcctgcaag agagaattga gacgcaatcc acacgctgcg gcaaccttcc 8940 ggcgttcgtg gtctatttgc tcttggacgt tgcaaacgta agtgttggat cccggtcggc 9000 atctactcta ttcctttgcc ctcggacgag tgctggggcg tcggtttcca ctatcggcga 9060 gtacttctac acagccatcg gtccagacgg ccgcgcttct gcgggcgatt tgtgtacgcc 9120 cgacagtccc ggctccggat cggacgattg cgtcgcatcg accctgcgcc caagctgcat 9180 catcgaaatt gccgtcaacc aagctctgat agagttggtc aagaccaatg cggagcatat 9240 acgcccggag ccgcggcgat cctgcaagct ccggatgcct ccgctcgaag tagcgcgtct 9300 gctgctccat acaagccaac cacggcctcc agaagaagat gttggcgacc tcgtattggg 9360 aatccccgaa catcgcctcg ctccagtcaa tgaccgctgt tatgcggcca ttgtccgtca 9420 ggacattgtt ggagccgaaa tccgcgtgca cgaggtgccg gacttcgggg cagtcctcgg 9480 cccaaagcat cagctcatcg agagcctgcg cgacggacgc actgacggtg tcgtccatca 9540 cagtttgcca gtgatacaca tggggatcag caatcgcgca tatgaaatca cgccatgtag 9600 tgtattgacc gattccttgc ggtccgaatg ggccgaaccc gctcgtctgg ctaagatcgg 9660 ccgcagcgat cgcatccatg gcctccgcga ccggctgcag aacagcgggc agttcggttt 9720 caggcaggtc ttgcaacgtg acaccctgtg cacggcggga gatgcaatag gtcaggctct 9780 cgctgaattc cccaatgtca agcacttccg gaatcgggag cgcggccgat gcaaagtgcc 9840 gataaacata acgatctttg tagaaaccat cggcgcagct atttacccgc aggacatatc 9900 cacgccctcc tacatcgaag ctgaaagcac gagattcttc gccctccgag agctgcatca 9960 ggtcggagac gctgtcgaac ttttcgatca gaaacttctc gacagacgtc gcggtgagtt 10020 caggcttttt catatcgggg tcgtcctctc caaatgaaat gaacttcctt atatagagga 10080 agggtcttgc gaaggatagt gggattgtgc gtcatccctt acgtcagtgg agatatcaca 10140 tcaatccact tgctttgaag acgtggttgg aacgtcttct ttttccacga tgctcctcgt 10200 gggtgggggt ccatctttgg gaccactgtc ggcagaggca tcttgaacga tagcctttcc 10260 tttatcgcaa tgatggcatt tgtaggtgcc accttccttt tctactgtcc ttttgatgaa 10320 gtgacagata gctgggcaat ggaatccgag gaggtttccc gatattaccc tttgttgaaa 10380 agtctcaata gccctttggt cttctgagac tgtatctttg atattcttgg agtagacgag 10440 agtgtcgtgc tccaccatgt tgacggatct ctaggacgcg tcctagaagc taattcactg 10500 gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 10560 gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 10620 tcccaacagt tgcgcagcct gaatggcgcc cgctcctttc gctttcttcc cttcctttct 10680 cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg 10740 atttagtgct ttacggcacc tcgaccccaa aaaacttgat ttgggtgatg gttcacgtag 10800 tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa 10860 tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcgggct attcttttga 10920 tttataaggg attttgccga tttcggaacc accatcaaac aggattttcg cctgctgggg 10980 caaaccagcg tggaccgctt gctgcaactc tctcagggcc aggcggtgaa gggcaatcag 11040 ctgttgcccg tctcactggt gaaaagaaaa accaccccag tacattaaaa acgtccgcaa 11100 tgtgttatta agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc 11160 cagccaacag ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc 11220 atcagtccgg gacggcgtca gcgggagagc cgttgtaagg cggcagactt tgctcatgtt 11280 accgatgcta ttcggaagaa cggcaactaa gctgccgggt ttgaaacacg gatgatctcg 11340 cggagggtag catgttgatt gtaacgatga cagagcgttg ctgcctgtga tcaaatatca 11400 tctccctcgc agagatccga attatcagcc ttcttattca tttctcgctt aaccgtgaca 11460 ggctgtcgat cttgagaact atgccgacat aataggaaat cgctggataa agccgctgag 11520 gaagctgagt ggcgctattt ctttagaagt gaacgttgac gatatcaact cccctatcca 11580 ttgctcaccg aatggtacag gtcggggacc cgaagttccg actgtcggcc tgatgcatcc 11640 ccggctgatc gaccccagat ctggggctga gaaagcccag taaggaaaca actgtaggtt 11700 cgagtcgcga gatcccccgg aaccaaagga agtaggttaa acccgctccg atcaggccga 11760 gccacgccag gccgagaaca ttggttcctg taggcatcgg gattggcgga tcaaacacta 11820 aagctactgg aacgagcaga agtcctccgg ccgccagttg ccaggcggta aaggtgagca 11880 gaggcacggg aggttgccac ttgcgggtca gcacggttcc gaacgccatg gaaaccgccc 11940 ccgccaggcc cgctgcgacg ccgacaggat ctagcgctgc gtttggtgtc aacaccaaca 12000 gcgccacgcc cgcagttccg caaatagccc ccaggaccgc catcaatcgt atcgggctac 12060 ctagcagagc ggcagagatg aacacgacca tcagcggctg cacagcgcct accgtcgccg 12120 cgaccccgcc cggcaggcgg tagaccgaaa taaacaacaa gctccagaat agcgaaatat 12180 taagtgcgcc gaggatgaag atgcgcatcc accagattcc cgttggaatc tgtcggacga 12240 tcatcacgag caataaaccc gccggcaacg cccgcagcag cataccggcg acccctcggc 12300 ctcgctgttc gggctccacg aaaacgccgg acagatgcgc cttgtgagcg tccttggggc 12360 cgtcctcctg tttgaagacc gacagcccaa tgatctcgcc gtcgatgtag gcgccgaatg 12420 ccacggcatc tcgcaaccgt tcagcgaacg cctccatggg ctttttctcc tcgtgctcgt 12480 aaacggaccc gaacatctct ggagctttct tcagggccga caatcggatc tcgcggaaat 12540 cctgcacgtc ggccgctcca agccgtcgaa tctgagcctt aatcacaatt gtcaatttta 12600 atcctctgtt tatcggcagt tcgtagagcg cgccgtgcgt cccgagcgat actgagcgaa 12660 gcaagtgcgt cgagcagtgc ccgcttgttc ctgaaatgcc agtaaagcgc tggctgctga 12720 acccccagcc ggaactgacc ccacaaggcc ctagcgtttg caatgcacca ggtcatcatt 12780 gacccaggcg tgttccacca ggccgctgcc tcgcaactct tcgcaggctt cgccgacctg 12840 ctcgcgccac ttcttcacgc gggtggaatc cgatccgcac atgaggcgga aggtttccag 12900 cttgagcggg tacggctccc ggtgcgagct gaaatagtcg aacatccgtc gggccgtcgg 12960 cgacagcttg cggtacttct cccatatgaa tttcgtgtag tggtcgccag caaacagcac 13020 gacgatttcc tcgtcgatca ggacctggca acgggacgtt ttcttgccac ggtccaggac 13080 gcggaagcgg tgcagcagcg acaccgattc caggtgccca acgcggtcgg acgtgaagcc 13140 catcgccgtc gcctgtaggc gcgacaggca ttcctcggcc ttcgtgtaat accggccatt 13200 gatcgaccag cccaggtcct ggcaaagctc gtagaacgtg aaggtgatcg gctcgccgat 13260 aggggtgcgc ttcgcgtact ccaacacctg ctgccacacc agttcgtcat cgtcggcccg 13320 cagctcgacg ccggtgtagg tgatcttcac gtccttgttg acgtggaaaa tgaccttgtt 13380 ttgcagcgcc tcgcgcggga ttttcttgtt gcgcgtggtg aacagggcag agcgggccgt 13440 gtcgtttggc atcgctcgca tcgtgtccgg ccacggcgca atatcgaaca aggaaagctg 13500 catttccttg atctgctgct tcgtgtgttt cagcaacgcg gcctgcttgg cctcgctgac 13560 ctgttttgcc aggtcctcgc cggcggtttt tcgcttcttg gtcgtcatag ttcctcgcgt 13620 gtcgatggtc atcgacttcg ccaaacctgc cgcctcctgt tcgagacgac gcgaacgctc 13680 cacggcggcc gatggcgcgg gcagggcagg gggagccagt tgcacgctgt cgcgctcgat 13740 cttggccgta gcttgctgga ccatcgagcc gacggactgg aaggtttcgc ggggcgcacg 13800 catgacggtg cggcttgcga tggtttcggc atcctcggcg gaaaaccccg cgtcgatcag 13860 ttcttgcctg tatgccttcc ggtcaaacgt ccgattcatt caccctcctt gcgggattgc 13920 cccgactcac gccggggcaa tgtgccctta ttcctgattt gacccgcctg gtgccttggt 13980 gtccagataa tccaccttat cggcaatgaa gtcggtcccg tagaccgtct ggccgtcctt 14040 ctcgtacttg gtattccgaa tcttgccctg cacgaatacc agcgacccct tgcccaaata 14100 cttgccgtgg gcctcggcct gagagccaaa acacttgatg cggaagaagt cggtgcgctc 14160 ctgcttgtcg ccggcatcgt tgcgccacat ctaggtacta aaacaattca tccagtaaaa 14220 tataatattt tattttctcc caatcaggct tgatccccag taagtcaaaa aatagctcga 14280 catactgttc ttccccgata tcctccctga tcgaccggac gcagaaggca atgtcatacc 14340 acttgtccgc cctgccgctt ctcccaagat caataaagcc acttactttg ccatctttca 14400 caaagatgtt gctgtctccc aggtcgccgt gggaaaagac aagttcctct tcgggctttt 14460 ccgtctttaa aaaatcatac agctcgcgcg gatctttaaa tggagtgtct tcttcccagt 14520 tttcgcaatc cacatcggcc agatcgttat tcagtaagta atccaattcg gctaagcggc 14580 tgtctaagct attcgtatag ggacaatccg atatgtcgat ggagtgaaag agcctgatgc 14640 actccgcata cagctcgata atcttttcag ggctttgttc atcttcatac tcttccgagc 14700 aaaggacgcc atcggcctca ctcatgagca gattgctcca gccatcatgc cgttcaaagt 14760 gcaggacctt tggaacaggc agctttcctt ccagccatag catcatgtcc ttttcccgtt 14820 ccacatcata ggtggtccct ttataccggc tgtccgtcat ttttaaatat aggttttcat 14880 tttctcccac cagcttatat accttagcag gagacattcc ttccgtatct tttacgcagc 14940 ggtatttttc gatcagtttt ttcaattccg gtgatattct cattttagcc atttattatt 15000 tccttcctct tttctacagt atttaaagat accccaagaa gctaattata acaagacgaa 15060 ctccaattca ctgttccttg cattctaaaa ccttaaatac cagaaaacag ctttttcaaa 15120 gttgttttca aagttggcgt ataacatagt atcgacggag ccgattttga aaccacaatt 15180 atgggtgatg ctgccaactt actgatttag tgtatgatgg tgtttttgag gtgctccagt 15240 ggcttctgtg tctatcagct gtccctcctg ttcagctact gacggggtgg tgcgtaacgg 15300 caaaagcacc gccggacatc agcgctatct ctgctctcac tgccgtaaaa catggcaact 15360 gcagttcact tacaccgctt ctcaacccgg tacgcaccag aaaatcattg atatggccat 15420 gaatggcgtt ggatgccggg caacagcccg cattatgggc gttggcctca acacgatttt 15480 acgtcactta aaaaactcag gccgcagtcg gtaacctcgc gcatacagcc gggcagtgac 15540 gtcatcgtct gcgcggaaat ggacgaacag tggggctatg tcggggctaa atcgcgccag 15600 cgctggctgt tttacgcgta tgacagtctc cggaagacgg ttgttgcgca cgtattcggt 15660 gaacgcacta tggcgacgct ggggcgtctt atgagcctgc tgtcaccctt tgacgtggtg 15720 atatggatga cggatggctg gccgctgtat gaatcccgcc tgaagggaaa gctgcacgta 15780 atcagcaagc gatatacgca gcgaattgag cggcataacc tgaatctgag gcagcacctg 15840 gcacggctgg gacggaagtc gctgtcgttc tcaaaatcgg tggagctgca tgacaaagtc 15900 atcgggcatt atctgaacat aaaacactat caataagttg gagtcattac ccaattatga 15960 tagaatttac aagctataag gttattgtcc tgggtttcaa gcattagtcc atgcaagttt 16020 ttatgctttg cccattctat agatatattg ataagcgcgc tgcctatgcc ttgccccctg 16080 aaatccttac atacggcgat atcttctata taaaagatat attatcttat cagtattgtc 16140 aatatattca aggcaatctg cctcctcatc ctcttcatcc tcttcgtctt ggtagctttt 16200 taaatatggc gcttcataga gtaattctgt aaaggtccaa ttctcgtttt catacctcgg 16260 tataatctta cctatcacct caaatggttc gctgggttta tcgcaccccc gaacacgagc 16320 acggcacccg cgaccactat gccaagaatg cccaaggtaa aaattgccgg ccccgccatg 16380 aagtccgtga atgccccgac ggccgaagtg aagggcaggc cgccacccag gccgccgccc 16440 tcactgcccg gcacctggtc gctgaatgtc gatgccagca cctgcggcac gtcaatgctt 16500 ccgggcgtcg cgctcgggct gatcgcccat cccgttactg ccccgatccc ggcaatggca 16560 aggactgcca gcgctgccat ttttggggtg aggccgttcg cggccgaggg gcgcagcccc 16620 tggggggatg ggaggcccgc gttagcgggc cgggagggtt cgagaagggg gggcaccccc 16680 cttcggcgtg cgcggtcacg cgcacagggc gcagccctgg ttaaaaacaa ggtttataaa 16740 tattggttta aaagcaggtt aaaagacagg ttagcggtgg ccgaaaaacg ggcggaaacc 16800 cttgcaaatg ctggattttc tgcctgtgga cagcccctca aatgtcaata ggtgcgcccc 16860 tcatctgtca gcactctgcc cctcaagtgt caaggatcgc gcccctcatc tgtcagtagt 16920 cgcgcccctc aagtgtcaat accgcagggc acttatcccc aggcttgtcc acatcatctg 16980 tgggaaactc gcgtaaaatc aggcgttttc gccgatttgc gaggctggcc agctccacgt 17040 cgccggccga aatcgagcct gcccctcatc tgtcaacgcc gcgccgggtg agtcggcccc 17100 tcaagtgtca acgtccgccc ctcatctgtc agtgagggcc aagttttccg cgaggtatcc 17160 acaacgccgg cggccgcggt gtctcgcaca cggcttcgac ggcgtttctg gcgcgtttgc 17220 agggccatag acggccgcca gcccagcggc gagggcaacc agcccgg 17267 <210> 16 <211> 17420 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 16 tgagcgtcgc aaaggcgctc ggtcttgcct tgctcgtcgg tgatgtactt caccagctcc 60 gcgaagtcgc tcttcttgat ggagcgcatg gggacgtgct tggcaatcac gcgcaccccc 120 cggccgtttt agcggctaaa aaagtcatgg ctctgccctc gggcggacca cgcccatcat 180 gaccttgcca agctcgtcct gcttctcttc gatcttcgcc agcagggcga ggatcgtggc 240 atcaccgaac cgcgccgtgc gcgggtcgtc ggtgagccag agtttcagca ggccgcccag 300 gcggcccagg tcgccattga tgcgggccag ctcgcggacg tgctcatagt ccacgacgcc 360 cgtgattttg tagccctggc cgacggccag caggtaggcc gacaggctca tgccggccgc 420 cgccgccttt tcctcaatcg ctcttcgttc gtctggaagg cagtacacct tgataggtgg 480 gctgcccttc ctggttggct tggtttcatc agccatccgc ttgccctcat ctgttacgcc 540 ggcggtagcc ggccagcctc gcagagcagg attcccgttg agcaccgcca ggtgcgaata 600 agggacagtg aagaaggaac acccgctcgc gggtgggcct acttcaccta tcctgcccgg 660 ctgacgccgt tggatacacc aaggaaagtc tacacgaacc ctttggcaaa atcctgtata 720 tcgtgcgaaa aaggatggat ataccgaaaa aatcgctata atgaccccga agcagggtta 780 tgcagcggaa aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 840 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 900 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 960 gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1020 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1080 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1140 cagtgagcga ggaagcggaa gagcgccaga aggccgccag agaggccgag cgcggccgtg 1200 aggcttggac gctagggcag ggcatgaaaa agcccgtagc gggctgctac gggcgtctga 1260 cgcggtggaa agggggaggg gatgttgtct acatggctct gctgtagtga gtgggttgcg 1320 ctccggcagc ggtcctgatc aatcgtcacc ctttctcggt ccttcaacgt tcctgacaac 1380 gagcctcctt ttcgccaatc catcgacaat caccgcgagt ccctgctcga acgctgcgtc 1440 cggaccggct tcgtcgaagg cgtctatcgc ggcccgcaac agcggcgaga gcggagcctg 1500 ttcaacggtg ccgccgcgct cgccggcatc gctgtcgccg gcctgctcct caagcacggc 1560 cccaacagtg aagtagctga ttgtcatcag cgcattgacg gcgtccccgg ccgaaaaacc 1620 cgcctcgcag aggaagcgaa gctgcgcgtc ggccgtttcc atctgcggtg cgcccggtcg 1680 cgtgccggca tggatgcgcg cgccatcgcg gtaggcgagc agcgcctgcc tgaagctgcg 1740 ggcattcccg atcagaaatg agcgccagtc gtcgtcggct ctcggcaccg aatgcgtatg 1800 attctccgcc agcatggctt cggccagtgc gtcgagcagc gcccgcttgt tcctgaagtg 1860 ccagtaaagc gccggctgct gaacccccaa ccgttccgcc agtttgcgtg tcgtcagacc 1920 gtctacgccg acctcgttca acaggtccag ggcggcacgg atcactgtat tcggctgcaa 1980 ctttgtcatg cttgacactt tatcactgat aaacataata tgtccaccaa cttatcagtg 2040 ataaagaatc cgcgcgttca atcggaccag cggaggctgg tccggaggcc agacgtgaaa 2100 cccaacatac ccctgatcgt aattctgagc actgtcgcgc tcgacgctgt cggcatcggc 2160 ctgattatgc cggtgctgcc gggcctcctg cgcgatctgg ttcactcgaa cgacgtcacc 2220 gcccactatg gcattctgct ggcgctgtat gcgttggtgc aatttgcctg cgcacctgtg 2280 ctgggcgcgc tgtcggatcg tttcgggcgg cggccaatct tgctcgtctc gctggccggc 2340 gccagatctg gggaaccctg tggttggcat gcacatacaa atggacgaac ggataaacct 2400 tttcacgccc ttttaaatat ccgattattc taataaacgc tcttttctct taggtttacc 2460 cgccaatata tcctgtcaaa cactgatagt ttaaactgaa ggcgggaaac gacaatctga 2520 tcatgagcgg agaattaagg gagtcacgtt atgacccccg ccgatgacgc gggacaagcc 2580 gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactcagc cgcgggtttc 2640 tggagtttaa tgagctaagc acatacgtca gaaaccatta ttgcgcgttc aaaagtcgcc 2700 taaggtcact atcagctagc aaatatttct tgtcaaaaat gctccactga cgttccataa 2760 attcccctcg gtatccaatt agagtctcat attcactctc aatccaaata atctgcaccg 2820 gatctggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 2880 gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 2940 ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 3000 gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg 3060 ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 3120 gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 3180 tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 3240 accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 3300 aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 3360 aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca tggcgatgcc tgcttgccga 3420 atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 3480 cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 3540 aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 3600 ccttctatcg ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga 3660 ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag 3720 gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct 3780 catgctggag ttcttcgccc acgggatctc tgcggaacag gcggtcgaag gtgccgatat 3840 cattacgaca gcaacggccg acaagcacaa cgccacgatc ctgagcgaca atatgatcgg 3900 gcccggcgtc cacatcaacg gcgtcggcgg cgactgccca ggcaagaccg agatgcaccg 3960 cgatatcttg ctgcgttcgg atattttcgt ggagttcccg ccacagaccc ggatgatccc 4020 cgatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc 4080 gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg 4140 catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat acatttaata 4200 cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc 4260 tatgttacta gatcgggcct cctgtcaatg ctggcggcgg ctctggtggt ggttctggtg 4320 gcggctctga gggtggtggc tctgagggtg gcggttctga gggtggcggc tctgagggag 4380 gcggttccgg tggtggctct ggttccggtg attttgatta tgaaaagatg gcaaacgcta 4440 ataagggggc tatgaccgaa aatgccgatg aaaacgcgct acagtctgac gctaaaggca 4500 aacttgattc tgtcgctact gattacggtg ctgctatcga tggtttcatt ggtgacgttt 4560 ccggccttgc taatggtaat ggtgctactg gtgattttgc tggctctaat tcccaaatgg 4620 ctcaagtcgg tgacggtgat aattcacctt taatgaataa tttccgtcaa tatttacctt 4680 ccctccctca atcggttgaa tgtcgccctt ttgtctttgg cccaatacgc aaaccgcctc 4740 tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 4800 cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 4860 tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 4920 caggaaacag ctatgaccat gattacgcca agcttgcatg cctgcaggtc cccagattag 4980 ccttttcaat ttcagaaaga atgctaaccc acagatggtt agagaggctt acgcagcagg 5040 tctcatcaag acgatctacc cgagcaataa tctccaggaa atcaaatacc ttcccaagaa 5100 ggttaaagat gcagtcaaaa gattcaggac taactgcatc aagaacacag agaaagatat 5160 atttctcaag atcagaagta ctattccagt atggacgatt caaggcttgc ttcacaaacc 5220 aaggcaagta atagagattg gagtctctaa aaaggtagtt cccactgaat caaaggccat 5280 ggagtcaaag attcaaatag aggacctaac agaactcgcc gtaaagactg gcgaacagtt 5340 catacagagt ctcttacgac tcaatgacaa gaagaaaatc ttcgtcaaca tggtggagca 5400 cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 5460 tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 5520 ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 5580 cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 5640 cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 5700 ggattgatgt gatatctcca ctgacgtaag ggatgacgca caatcccact atccttcgca 5760 agacccttcc tctatataag gaagttcatt tcatttggag agaacacggg ggactctaat 5820 caaacaagtt tgtacaaaaa agctgaacga gaaacgtaaa atgatataat ggcgttcgat 5880 ctcaagactg aagacggcct catcacatat ctcactaaac atctttcttt ggacgtcgac 5940 acgagcggag tgaagcgcct tagcggaggc tttgtcaatg taacctggcg cattaagctc 6000 aatgctcctt atcaaggtca tacgagcatc atcctgaagc atgctcagcc gcacatgtct 6060 acggatgagg attttaagat aggtgtagaa cgttcggttt acgaatacca ggctatcaag 6120 ctcatgatgg ccaatcggga ggttctggga ggcgtggatg gcatagtttc tgtgccagaa 6180 ggcctgaact acgacttaga gaataatgca ttgatcatgc aagatgtcgg gaagatgaag 6240 acccttttag attatgtcac cgccaaaccg ccacttgcga cggatatagc ccgccttgtt 6300 gggacagaaa ttggggggtt cgttgccaga ctccataaca taggccgcga gaggcgagac 6360 gatcctgagt tcaaattctt ctctggaaat attgtcggaa ggacgacttc agaccagctg 6420 tatcaaacca tcatacccaa cgcagcgaaa tatggcgtcg atgacccctt gctgcctact 6480 gtggttaagg accttgtgga cgatgtcatg cacagcgaag agacccttgt catggcggac 6540 ctgtggagtg gaaatattct tctccagttg gaggagggaa acccatcgaa gctgcagaag 6600 atatatatcc tggattggga actttgcaag tacggcccag cgtcgttgga cctgggctat 6660 ttcttgggtg actgctattt gatatcccgc tttcaagacg agcaggtcgg tacgacgatg 6720 cggcaagcct acttgcaaag ctatgcgcgt acgagcaagc attcgatcaa ctacgccaaa 6780 gtcactgcag gtattgctgc tcatattgtg atgtggaccg actttatgca gtgggggagc 6840 gaggaagaaa ggataaattt tgtgaaaaag ggggtagctg cctttcacga cgccaggggc 6900 aacaacgaca atggggaaat tacgtctacc ttactgaagg aatcatccac tgcgtaaatc 6960 attttacgtt tctcgttcag ctttcttgta caaagtggtt cgatctagag gatccatggt 7020 gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 7080 cgtgaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 7140 gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 7200 gaccaccttc acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 7260 cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 7320 ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 7380 ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 7440 ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 7500 caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 7560 ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 7620 gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 7680 ggagttcgtg accgccgccg ggatcactca cggcatggac gagctgtaca agtaaagcgg 7740 cccgagctcg aatttccccg atcgttcaaa catttggcaa taaagtttct taagattgaa 7800 tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg ttaagcatgt 7860 aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc 7920 gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt 7980 atcgcgcgcg gtgtcatcta tgttactaga tcgggaatta gcttcatcaa cgcaagacat 8040 gcgcacgacc gtctgacagg agaggaattt ccgacgagca cagaaaggac ttgctcttgg 8100 acgtaggcct atttctcagg cacatgtatc aagtgttcgg acgtgggttt tcgatggtgt 8160 atcagccgcc gccaactggg agatgaggag gctttcttgg ggggcagtca gcagttcatt 8220 tcacaagaca gaggaacttg taaggagatg cactgattta tcttggcgca aaccagcagg 8280 acgaattagt gggaatagcc cgcgaatatc taagttatgc ctgtcggcat gagcagaaac 8340 ttccaattcg aaacagtttg gagaggttgt ttttgggcat accttttgtt agtcagcctc 8400 tcgattgctc atcgtcatta cacagtaccg aagtttgatc gatctagtaa catagatgac 8460 accgcgcgcg ataatttatc ctagtttgcg cgctatattt tgttttctat cgcgtattaa 8520 atgtataatt gcgggactct aatcataaaa acccatctca taaataacgt catgcattac 8580 atgttaatta ttacatgctt aacgtaattc aacagaaatt atatgataat catcgcaaga 8640 ccggcaacag gattcaatct taagaaactt tattgccaaa tgtttgaacg atctgcttcg 8700 acgcactcct tctttactcc accatctcgt ccttattgaa aacgtgggta gcaccaaaac 8760 gaatcaagtc gctggaactg aagttaccaa tcacgctgga tgatttgcca gttggattaa 8820 tcttgccttt ccccgcatga ataatattga tgaatgcatg cgtgaggggt atttcgattt 8880 tggcaatagc tgcaattgcc gcgacatcct ccaacgagca taattcttca gaaaaatagc 8940 gatgttccat gttgtcaggg catgcatgat gcacgttatg aggtgacggt gctaggcagt 9000 attccctcaa agtttcatag tcagtatcat attcatcatt gcattcctgc aagagagaat 9060 tgagacgcaa tccacacgct gcggcaacct tccggcgttc gtggtctatt tgctcttgga 9120 cgttgcaaac gtaagtgttg gatcccggtc ggcatctact ctattccttt gccctcggac 9180 gagtgctggg gcgtcggttt ccactatcgg cgagtacttc tacacagcca tcggtccaga 9240 cggccgcgct tctgcgggcg atttgtgtac gcccgacagt cccggctccg gatcggacga 9300 ttgcgtcgca tcgaccctgc gcccaagctg catcatcgaa attgccgtca accaagctct 9360 gatagagttg gtcaagacca atgcggagca tatacgcccg gagccgcggc gatcctgcaa 9420 gctccggatg cctccgctcg aagtagcgcg tctgctgctc catacaagcc aaccacggcc 9480 tccagaagaa gatgttggcg acctcgtatt gggaatcccc gaacatcgcc tcgctccagt 9540 caatgaccgc tgttatgcgg ccattgtccg tcaggacatt gttggagccg aaatccgcgt 9600 gcacgaggtg ccggacttcg gggcagtcct cggcccaaag catcagctca tcgagagcct 9660 gcgcgacgga cgcactgacg gtgtcgtcca tcacagtttg ccagtgatac acatggggat 9720 cagcaatcgc gcatatgaaa tcacgccatg tagtgtattg accgattcct tgcggtccga 9780 atgggccgaa cccgctcgtc tggctaagat cggccgcagc gatcgcatcc atggcctccg 9840 cgaccggctg cagaacagcg ggcagttcgg tttcaggcag gtcttgcaac gtgacaccct 9900 gtgcacggcg ggagatgcaa taggtcaggc tctcgctgaa ttccccaatg tcaagcactt 9960 ccggaatcgg gagcgcggcc gatgcaaagt gccgataaac ataacgatct ttgtagaaac 10020 catcggcgca gctatttacc cgcaggacat atccacgccc tcctacatcg aagctgaaag 10080 cacgagattc ttcgccctcc gagagctgca tcaggtcgga gacgctgtcg aacttttcga 10140 tcagaaactt ctcgacagac gtcgcggtga gttcaggctt tttcatatcg gggtcgtcct 10200 ctccaaatga aatgaacttc cttatataga ggaagggtct tgcgaaggat agtgggattg 10260 tgcgtcatcc cttacgtcag tggagatatc acatcaatcc acttgctttg aagacgtggt 10320 tggaacgtct tctttttcca cgatgctcct cgtgggtggg ggtccatctt tgggaccact 10380 gtcggcagag gcatcttgaa cgatagcctt tcctttatcg caatgatggc atttgtaggt 10440 gccaccttcc ttttctactg tccttttgat gaagtgacag atagctgggc aatggaatcc 10500 gaggaggttt cccgatatta ccctttgttg aaaagtctca atagcccttt ggtcttctga 10560 gactgtatct ttgatattct tggagtagac gagagtgtcg tgctccacca tgttgacgga 10620 tctctaggac gcgtcctaga agctaattca ctggccgtcg ttttacaacg tcgtgactgg 10680 gaaaaccctg gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg 10740 cgtaatagcg aagaggcccg caccgatcgc ccttcccaac agttgcgcag cctgaatggc 10800 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 10860 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 10920 caaaaaactt gatttgggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 10980 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 11040 aacactcaac cctatctcgg gctattcttt tgatttataa gggattttgc cgatttcgga 11100 accaccatca aacaggattt tcgcctgctg gggcaaacca gcgtggaccg cttgctgcaa 11160 ctctctcagg gccaggcggt gaagggcaat cagctgttgc ccgtctcact ggtgaaaaga 11220 aaaaccaccc cagtacatta aaaacgtccg caatgtgtta ttaagttgtc taagcgtcaa 11280 tttgtttaca ccacaatata tcctgccacc agccagccaa cagctccccg accggcagct 11340 cggcacaaaa tcaccactcg atacaggcag cccatcagtc cgggacggcg tcagcgggag 11400 agccgttgta aggcggcaga ctttgctcat gttaccgatg ctattcggaa gaacggcaac 11460 taagctgccg ggtttgaaac acggatgatc tcgcggaggg tagcatgttg attgtaacga 11520 tgacagagcg ttgctgcctg tgatcaaata tcatctccct cgcagagatc cgaattatca 11580 gccttcttat tcatttctcg cttaaccgtg acaggctgtc gatcttgaga actatgccga 11640 cataatagga aatcgctgga taaagccgct gaggaagctg agtggcgcta tttctttaga 11700 agtgaacgtt gacgatatca actcccctat ccattgctca ccgaatggta caggtcgggg 11760 acccgaagtt ccgactgtcg gcctgatgca tccccggctg atcgacccca gatctggggc 11820 tgagaaagcc cagtaaggaa acaactgtag gttcgagtcg cgagatcccc cggaaccaaa 11880 ggaagtaggt taaacccgct ccgatcaggc cgagccacgc caggccgaga acattggttc 11940 ctgtaggcat cgggattggc ggatcaaaca ctaaagctac tggaacgagc agaagtcctc 12000 cggccgccag ttgccaggcg gtaaaggtga gcagaggcac gggaggttgc cacttgcggg 12060 tcagcacggt tccgaacgcc atggaaaccg cccccgccag gcccgctgcg acgccgacag 12120 gatctagcgc tgcgtttggt gtcaacacca acagcgccac gcccgcagtt ccgcaaatag 12180 cccccaggac cgccatcaat cgtatcgggc tacctagcag agcggcagag atgaacacga 12240 ccatcagcgg ctgcacagcg cctaccgtcg ccgcgacccc gcccggcagg cggtagaccg 12300 aaataaacaa caagctccag aatagcgaaa tattaagtgc gccgaggatg aagatgcgca 12360 tccaccagat tcccgttgga atctgtcgga cgatcatcac gagcaataaa cccgccggca 12420 acgcccgcag cagcataccg gcgacccctc ggcctcgctg ttcgggctcc acgaaaacgc 12480 cggacagatg cgccttgtga gcgtccttgg ggccgtcctc ctgtttgaag accgacagcc 12540 caatgatctc gccgtcgatg taggcgccga atgccacggc atctcgcaac cgttcagcga 12600 acgcctccat gggctttttc tcctcgtgct cgtaaacgga cccgaacatc tctggagctt 12660 tcttcagggc cgacaatcgg atctcgcgga aatcctgcac gtcggccgct ccaagccgtc 12720 gaatctgagc cttaatcaca attgtcaatt ttaatcctct gtttatcggc agttcgtaga 12780 gcgcgccgtg cgtcccgagc gatactgagc gaagcaagtg cgtcgagcag tgcccgcttg 12840 ttcctgaaat gccagtaaag cgctggctgc tgaaccccca gccggaactg accccacaag 12900 gccctagcgt ttgcaatgca ccaggtcatc attgacccag gcgtgttcca ccaggccgct 12960 gcctcgcaac tcttcgcagg cttcgccgac ctgctcgcgc cacttcttca cgcgggtgga 13020 atccgatccg cacatgaggc ggaaggtttc cagcttgagc gggtacggct cccggtgcga 13080 gctgaaatag tcgaacatcc gtcgggccgt cggcgacagc ttgcggtact tctcccatat 13140 gaatttcgtg tagtggtcgc cagcaaacag cacgacgatt tcctcgtcga tcaggacctg 13200 gcaacgggac gttttcttgc cacggtccag gacgcggaag cggtgcagca gcgacaccga 13260 ttccaggtgc ccaacgcggt cggacgtgaa gcccatcgcc gtcgcctgta ggcgcgacag 13320 gcattcctcg gccttcgtgt aataccggcc attgatcgac cagcccaggt cctggcaaag 13380 ctcgtagaac gtgaaggtga tcggctcgcc gataggggtg cgcttcgcgt actccaacac 13440 ctgctgccac accagttcgt catcgtcggc ccgcagctcg acgccggtgt aggtgatctt 13500 cacgtccttg ttgacgtgga aaatgacctt gttttgcagc gcctcgcgcg ggattttctt 13560 gttgcgcgtg gtgaacaggg cagagcgggc cgtgtcgttt ggcatcgctc gcatcgtgtc 13620 cggccacggc gcaatatcga acaaggaaag ctgcatttcc ttgatctgct gcttcgtgtg 13680 tttcagcaac gcggcctgct tggcctcgct gacctgtttt gccaggtcct cgccggcggt 13740 ttttcgcttc ttggtcgtca tagttcctcg cgtgtcgatg gtcatcgact tcgccaaacc 13800 tgccgcctcc tgttcgagac gacgcgaacg ctccacggcg gccgatggcg cgggcagggc 13860 agggggagcc agttgcacgc tgtcgcgctc gatcttggcc gtagcttgct ggaccatcga 13920 gccgacggac tggaaggttt cgcggggcgc acgcatgacg gtgcggcttg cgatggtttc 13980 ggcatcctcg gcggaaaacc ccgcgtcgat cagttcttgc ctgtatgcct tccggtcaaa 14040 cgtccgattc attcaccctc cttgcgggat tgccccgact cacgccgggg caatgtgccc 14100 ttattcctga tttgacccgc ctggtgcctt ggtgtccaga taatccacct tatcggcaat 14160 gaagtcggtc ccgtagaccg tctggccgtc cttctcgtac ttggtattcc gaatcttgcc 14220 ctgcacgaat accagcgacc ccttgcccaa atacttgccg tgggcctcgg cctgagagcc 14280 aaaacacttg atgcggaaga agtcggtgcg ctcctgcttg tcgccggcat cgttgcgcca 14340 catctaggta ctaaaacaat tcatccagta aaatataata ttttattttc tcccaatcag 14400 gcttgatccc cagtaagtca aaaaatagct cgacatactg ttcttccccg atatcctccc 14460 tgatcgaccg gacgcagaag gcaatgtcat accacttgtc cgccctgccg cttctcccaa 14520 gatcaataaa gccacttact ttgccatctt tcacaaagat gttgctgtct cccaggtcgc 14580 cgtgggaaaa gacaagttcc tcttcgggct tttccgtctt taaaaaatca tacagctcgc 14640 gcggatcttt aaatggagtg tcttcttccc agttttcgca atccacatcg gccagatcgt 14700 tattcagtaa gtaatccaat tcggctaagc ggctgtctaa gctattcgta tagggacaat 14760 ccgatatgtc gatggagtga aagagcctga tgcactccgc atacagctcg ataatctttt 14820 cagggctttg ttcatcttca tactcttccg agcaaaggac gccatcggcc tcactcatga 14880 gcagattgct ccagccatca tgccgttcaa agtgcaggac ctttggaaca ggcagctttc 14940 cttccagcca tagcatcatg tccttttccc gttccacatc ataggtggtc cctttatacc 15000 ggctgtccgt catttttaaa tataggtttt cattttctcc caccagctta tataccttag 15060 caggagacat tccttccgta tcttttacgc agcggtattt ttcgatcagt tttttcaatt 15120 ccggtgatat tctcatttta gccatttatt atttccttcc tcttttctac agtatttaaa 15180 gataccccaa gaagctaatt ataacaagac gaactccaat tcactgttcc ttgcattcta 15240 aaaccttaaa taccagaaaa cagctttttc aaagttgttt tcaaagttgg cgtataacat 15300 agtatcgacg gagccgattt tgaaaccaca attatgggtg atgctgccaa cttactgatt 15360 tagtgtatga tggtgttttt gaggtgctcc agtggcttct gtgtctatca gctgtccctc 15420 ctgttcagct actgacgggg tggtgcgtaa cggcaaaagc accgccggac atcagcgcta 15480 tctctgctct cactgccgta aaacatggca actgcagttc acttacaccg cttctcaacc 15540 cggtacgcac cagaaaatca ttgatatggc catgaatggc gttggatgcc gggcaacagc 15600 ccgcattatg ggcgttggcc tcaacacgat tttacgtcac ttaaaaaact caggccgcag 15660 tcggtaacct cgcgcataca gccgggcagt gacgtcatcg tctgcgcgga aatggacgaa 15720 cagtggggct atgtcggggc taaatcgcgc cagcgctggc tgttttacgc gtatgacagt 15780 ctccggaaga cggttgttgc gcacgtattc ggtgaacgca ctatggcgac gctggggcgt 15840 cttatgagcc tgctgtcacc ctttgacgtg gtgatatgga tgacggatgg ctggccgctg 15900 tatgaatccc gcctgaaggg aaagctgcac gtaatcagca agcgatatac gcagcgaatt 15960 gagcggcata acctgaatct gaggcagcac ctggcacggc tgggacggaa gtcgctgtcg 16020 ttctcaaaat cggtggagct gcatgacaaa gtcatcgggc attatctgaa cataaaacac 16080 tatcaataag ttggagtcat tacccaatta tgatagaatt tacaagctat aaggttattg 16140 tcctgggttt caagcattag tccatgcaag tttttatgct ttgcccattc tatagatata 16200 ttgataagcg cgctgcctat gccttgcccc ctgaaatcct tacatacggc gatatcttct 16260 atataaaaga tatattatct tatcagtatt gtcaatatat tcaaggcaat ctgcctcctc 16320 atcctcttca tcctcttcgt cttggtagct ttttaaatat ggcgcttcat agagtaattc 16380 tgtaaaggtc caattctcgt tttcatacct cggtataatc ttacctatca cctcaaatgg 16440 ttcgctgggt ttatcgcacc cccgaacacg agcacggcac ccgcgaccac tatgccaaga 16500 atgcccaagg taaaaattgc cggccccgcc atgaagtccg tgaatgcccc gacggccgaa 16560 gtgaagggca ggccgccacc caggccgccg ccctcactgc ccggcacctg gtcgctgaat 16620 gtcgatgcca gcacctgcgg cacgtcaatg cttccgggcg tcgcgctcgg gctgatcgcc 16680 catcccgtta ctgccccgat cccggcaatg gcaaggactg ccagcgctgc catttttggg 16740 gtgaggccgt tcgcggccga ggggcgcagc ccctgggggg atgggaggcc cgcgttagcg 16800 ggccgggagg gttcgagaag ggggggcacc ccccttcggc gtgcgcggtc acgcgcacag 16860 ggcgcagccc tggttaaaaa caaggtttat aaatattggt ttaaaagcag gttaaaagac 16920 aggttagcgg tggccgaaaa acgggcggaa acccttgcaa atgctggatt ttctgcctgt 16980 ggacagcccc tcaaatgtca ataggtgcgc ccctcatctg tcagcactct gcccctcaag 17040 tgtcaaggat cgcgcccctc atctgtcagt agtcgcgccc ctcaagtgtc aataccgcag 17100 ggcacttatc cccaggcttg tccacatcat ctgtgggaaa ctcgcgtaaa atcaggcgtt 17160 ttcgccgatt tgcgaggctg gccagctcca cgtcgccggc cgaaatcgag cctgcccctc 17220 atctgtcaac gccgcgccgg gtgagtcggc ccctcaagtg tcaacgtccg cccctcatct 17280 gtcagtgagg gccaagtttt ccgcgaggta tccacaacgc cggcggccgc ggtgtctcgc 17340 acacggcttc gacggcgttt ctggcgcgtt tgcagggcca tagacggccg ccagcccagc 17400 ggcgagggca accagcccgg 17420 <210> 17 <211> 18494 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 17 tgagcgtcgc aaaggcgctc ggtcttgcct tgctcgtcgg tgatgtactt caccagctcc 60 gcgaagtcgc tcttcttgat ggagcgcatg gggacgtgct tggcaatcac gcgcaccccc 120 cggccgtttt agcggctaaa aaagtcatgg ctctgccctc gggcggacca cgcccatcat 180 gaccttgcca agctcgtcct gcttctcttc gatcttcgcc agcagggcga ggatcgtggc 240 atcaccgaac cgcgccgtgc gcgggtcgtc ggtgagccag agtttcagca ggccgcccag 300 gcggcccagg tcgccattga tgcgggccag ctcgcggacg tgctcatagt ccacgacgcc 360 cgtgattttg tagccctggc cgacggccag caggtaggcc gacaggctca tgccggccgc 420 cgccgccttt tcctcaatcg ctcttcgttc gtctggaagg cagtacacct tgataggtgg 480 gctgcccttc ctggttggct tggtttcatc agccatccgc ttgccctcat ctgttacgcc 540 ggcggtagcc ggccagcctc gcagagcagg attcccgttg agcaccgcca ggtgcgaata 600 agggacagtg aagaaggaac acccgctcgc gggtgggcct acttcaccta tcctgcccgg 660 ctgacgccgt tggatacacc aaggaaagtc tacacgaacc ctttggcaaa atcctgtata 720 tcgtgcgaaa aaggatggat ataccgaaaa aatcgctata atgaccccga agcagggtta 780 tgcagcggaa aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 840 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 900 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 960 gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1020 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1080 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1140 cagtgagcga ggaagcggaa gagcgccaga aggccgccag agaggccgag cgcggccgtg 1200 aggcttggac gctagggcag ggcatgaaaa agcccgtagc gggctgctac gggcgtctga 1260 cgcggtggaa agggggaggg gatgttgtct acatggctct gctgtagtga gtgggttgcg 1320 ctccggcagc ggtcctgatc aatcgtcacc ctttctcggt ccttcaacgt tcctgacaac 1380 gagcctcctt ttcgccaatc catcgacaat caccgcgagt ccctgctcga acgctgcgtc 1440 cggaccggct tcgtcgaagg cgtctatcgc ggcccgcaac agcggcgaga gcggagcctg 1500 ttcaacggtg ccgccgcgct cgccggcatc gctgtcgccg gcctgctcct caagcacggc 1560 cccaacagtg aagtagctga ttgtcatcag cgcattgacg gcgtccccgg ccgaaaaacc 1620 cgcctcgcag aggaagcgaa gctgcgcgtc ggccgtttcc atctgcggtg cgcccggtcg 1680 cgtgccggca tggatgcgcg cgccatcgcg gtaggcgagc agcgcctgcc tgaagctgcg 1740 ggcattcccg atcagaaatg agcgccagtc gtcgtcggct ctcggcaccg aatgcgtatg 1800 attctccgcc agcatggctt cggccagtgc gtcgagcagc gcccgcttgt tcctgaagtg 1860 ccagtaaagc gccggctgct gaacccccaa ccgttccgcc agtttgcgtg tcgtcagacc 1920 gtctacgccg acctcgttca acaggtccag ggcggcacgg atcactgtat tcggctgcaa 1980 ctttgtcatg cttgacactt tatcactgat aaacataata tgtccaccaa cttatcagtg 2040 ataaagaatc cgcgcgttca atcggaccag cggaggctgg tccggaggcc agacgtgaaa 2100 cccaacatac ccctgatcgt aattctgagc actgtcgcgc tcgacgctgt cggcatcggc 2160 ctgattatgc cggtgctgcc gggcctcctg cgcgatctgg ttcactcgaa cgacgtcacc 2220 gcccactatg gcattctgct ggcgctgtat gcgttggtgc aatttgcctg cgcacctgtg 2280 ctgggcgcgc tgtcggatcg tttcgggcgg cggccaatct tgctcgtctc gctggccggc 2340 gccagatctg gggaaccctg tggttggcat gcacatacaa atggacgaac ggataaacct 2400 tttcacgccc ttttaaatat ccgattattc taataaacgc tcttttctct taggtttacc 2460 cgccaatata tcctgtcaaa cactgatagt ttaaactgaa ggcgggaaac gacaatctga 2520 tcatgagcgg agaattaagg gagtcacgtt atgacccccg ccgatgacgc gggacaagcc 2580 gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactcagc cgcgggtttc 2640 tggagtttaa tgagctaagc acatacgtca gaaaccatta ttgcgcgttc aaaagtcgcc 2700 taaggtcact atcagctagc aaatatttct tgtcaaaaat gctccactga cgttccataa 2760 attcccctcg gtatccaatt agagtctcat attcactctc aatccaaata atctgcaccg 2820 gatctggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 2880 gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 2940 ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 3000 gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg 3060 ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 3120 gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 3180 tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 3240 accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 3300 aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 3360 aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca tggcgatgcc tgcttgccga 3420 atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 3480 cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 3540 aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 3600 ccttctatcg ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga 3660 ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag 3720 gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct 3780 catgctggag ttcttcgccc acgggatctc tgcggaacag gcggtcgaag gtgccgatat 3840 cattacgaca gcaacggccg acaagcacaa cgccacgatc ctgagcgaca atatgatcgg 3900 gcccggcgtc cacatcaacg gcgtcggcgg cgactgccca ggcaagaccg agatgcaccg 3960 cgatatcttg ctgcgttcgg atattttcgt ggagttcccg ccacagaccc ggatgatccc 4020 cgatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc 4080 gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg 4140 catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat acatttaata 4200 cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc 4260 tatgttacta gatcgggcct cctgtcaatg ctggcggcgg ctctggtggt ggttctggtg 4320 gcggctctga gggtggtggc tctgagggtg gcggttctga gggtggcggc tctgagggag 4380 gcggttccgg tggtggctct ggttccggtg attttgatta tgaaaagatg gcaaacgcta 4440 ataagggggc tatgaccgaa aatgccgatg aaaacgcgct acagtctgac gctaaaggca 4500 aacttgattc tgtcgctact gattacggtg ctgctatcga tggtttcatt ggtgacgttt 4560 ccggccttgc taatggtaat ggtgctactg gtgattttgc tggctctaat tcccaaatgg 4620 ctcaagtcgg tgacggtgat aattcacctt taatgaataa tttccgtcaa tatttacctt 4680 ccctccctca atcggttgaa tgtcgccctt ttgtctttgg cccaatacgc aaaccgcctc 4740 tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 4800 cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 4860 tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 4920 caggaaacag ctatgaccat gattacgcca agcttgcatg cctgcaggtc cccagattag 4980 ccttttcaat ttcagaaaga atgctaaccc acagatggtt agagaggctt acgcagcagg 5040 tctcatcaag acgatctacc cgagcaataa tctccaggaa atcaaatacc ttcccaagaa 5100 ggttaaagat gcagtcaaaa gattcaggac taactgcatc aagaacacag agaaagatat 5160 atttctcaag atcagaagta ctattccagt atggacgatt caaggcttgc ttcacaaacc 5220 aaggcaagta atagagattg gagtctctaa aaaggtagtt cccactgaat caaaggccat 5280 ggagtcaaag attcaaatag aggacctaac agaactcgcc gtaaagactg gcgaacagtt 5340 catacagagt ctcttacgac tcaatgacaa gaagaaaatc ttcgtcaaca tggtggagca 5400 cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 5460 tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 5520 ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 5580 cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 5640 cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 5700 ggattgatgt gatatctcca ctgacgtaag ggatgacgca caatcccact atccttcgca 5760 agacccttcc tctatataag gaagttcatt tcatttggag agaacacggg ggactctaat 5820 caaacaagtt tgtacaaaaa agctgaacga gaaacgtaaa atgatataaa tatcatgatc 5880 gctgtactat tctccttcgt cattgcagga tgcatatact acatcgtttc tcgtagagtg 5940 aggcggtcgc gcttgccacc agggccgcct ggcattccta ttcccttcat tgggaacatg 6000 tttgatatgc ctgaagaatc tccatggtta acatttctac aatggggacg ggattacagt 6060 ctgtcttgcc gcgttgactt ctaatatatg aacagctaat atattgtcag acaccgatat 6120 tctctacgtg gatgctggag ggacagaaat ggttattctt aacacgttgg agaccattac 6180 cgatctatta gaaaagcgag ggtccattta ttctggccgg tgagctgatg ttgagttttt 6240 tgcaattgaa tttgtggtca cacgtttcca gacttgagag tacaatggtc aacgaactta 6300 tggggtggga gtttgactta gggttcatca catacggcga caggtggcgc gaagaaaggc 6360 gcatgttcgc caaggagttc agtgagaagg gcatcaagca atttcgccat gctcaagtga 6420 aagctgccca tcagcttgtc caacagctta ccaaaacgcc agaccgctgg gcacaacata 6480 ttcgccagta agtactactt gaggaaaata gcgtacgctt cgctgaccgg tccgtacatc 6540 aaagtcagat agcggcaatg tcactggata ttggttatgg aattgatctt gcagaagacg 6600 acccttggct ggaagcgacc catttggcta atgaaggcct cgccatagca tcagtgccgg 6660 gcaaattttg ggtcgattcg ttcccttctc gtgagcatcc ttcttctatg taggaaggga 6720 aggagtctaa caagtgttag taaaatacct tcctgcttgg ttcccaggtg ctgtcttcaa 6780 gcgcaaagcg aaggtctggc gagaagccgc cgaccatatg gttgacatgc cttatgaaac 6840 tatgaggaaa ttagcagtta gtcaaatgcg ttctccccgt attttttcaa tactctaact 6900 tcagctcaca gcctcaagga ttgactcgtc cgtcgtatgc ttcagctcgt ctgcaagcca 6960 tggatctcaa cggtgacctt gagcatcaag aacacgtaat caagaacaca gccgcagagg 7020 ttaatgtcgg taagtcaaaa gcgtccgtcg gcaattcaaa attcaggcgc taaagtgggt 7080 cttctcacca aggtggaggc gatactgtaa ggatttctca atcgttagag tataagtgtt 7140 ctaatgcagt acatactcca ccaaccagac tgtctctgct atgtctgcgt tcatcttggc 7200 catggtgaag taccctgagg tccagcgaaa ggttcaagcg gagcttgatg ctctgaccaa 7260 taacggccaa attcctgact atgacgaaga agatgactcc ttgccatacc tcaccgcatg 7320 tatcaaggag cttttccggt ggaatcaaat cgcacccctc gctataccgc acaaattaat 7380 gaaggacgac gtgtaccgcg ggtatctgat tcccaagaac actctagtct tcgcaaacac 7440 ctggtgaggc tgtccattca ttcctagtac atccgttgcc ccactaatag catcttgata 7500 acagggcagt attaaacgat ccagaagtct atccagatcc ctctgtgttc cgcccagaaa 7560 gatatcttgg tcctgacggg aagcctgata acactgtacg cgacccacgt aaagcggcat 7620 ttggctatgg acgacgaaat tggtaagtgc gctttcagaa cccccccttc cgttgactag 7680 tgccatgcgc gcatacaata tcgctattga tctgatataa cttccctgcg gcatttattt 7740 tggcattcct ttagtcccgg aattcatcta gcgcagtcga cggtttggat tgcaggggca 7800 accctcttat cagcgttcaa tatcgagcga cctgtcgatc agaatgggaa gcccattgac 7860 ataccggctg attttactac aggattcttc aggtagctaa tttccgtctt tgtgtgcata 7920 atacccctaa cgacgcacgt ttaccttttt gtaaagacac ccagtgcctt tccagtgcag 7980 gtttgttcct cgaacagagc aagtctcaca gtcggtatcc ggaccctgaa tatcatttta 8040 cgtttctcgt tcagctttct tgtacaaagt ggttcgatct agaggatcca tggtgagcaa 8100 gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtgaa 8160 cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac 8220 cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac 8280 cttcacctac ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt 8340 cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga 8400 cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat 8460 cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta 8520 caactacaac agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt 8580 gaacttcaag atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca 8640 gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac 8700 ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt 8760 cgtgaccgcc gccgggatca ctcacggcat ggacgagctg tacaagtaaa gcggcccgag 8820 ctcgaatttc cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt 8880 tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat 8940 taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt 9000 atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg 9060 cgcggtgtca tctatgttac tagatcggga attagcttca tcaacgcaag acatgcgcac 9120 gaccgtctga caggagagga atttccgacg agcacagaaa ggacttgctc ttggacgtag 9180 gcctatttct caggcacatg tatcaagtgt tcggacgtgg gttttcgatg gtgtatcagc 9240 cgccgccaac tgggagatga ggaggctttc ttggggggca gtcagcagtt catttcacaa 9300 gacagaggaa cttgtaagga gatgcactga tttatcttgg cgcaaaccag caggacgaat 9360 tagtgggaat agcccgcgaa tatctaagtt atgcctgtcg gcatgagcag aaacttccaa 9420 ttcgaaacag tttggagagg ttgtttttgg gcataccttt tgttagtcag cctctcgatt 9480 gctcatcgtc attacacagt accgaagttt gatcgatcta gtaacataga tgacaccgcg 9540 cgcgataatt tatcctagtt tgcgcgctat attttgtttt ctatcgcgta ttaaatgtat 9600 aattgcggga ctctaatcat aaaaacccat ctcataaata acgtcatgca ttacatgtta 9660 attattacat gcttaacgta attcaacaga aattatatga taatcatcgc aagaccggca 9720 acaggattca atcttaagaa actttattgc caaatgtttg aacgatctgc ttcgacgcac 9780 tccttcttta ctccaccatc tcgtccttat tgaaaacgtg ggtagcacca aaacgaatca 9840 agtcgctgga actgaagtta ccaatcacgc tggatgattt gccagttgga ttaatcttgc 9900 ctttccccgc atgaataata ttgatgaatg catgcgtgag gggtatttcg attttggcaa 9960 tagctgcaat tgccgcgaca tcctccaacg agcataattc ttcagaaaaa tagcgatgtt 10020 ccatgttgtc agggcatgca tgatgcacgt tatgaggtga cggtgctagg cagtattccc 10080 tcaaagtttc atagtcagta tcatattcat cattgcattc ctgcaagaga gaattgagac 10140 gcaatccaca cgctgcggca accttccggc gttcgtggtc tatttgctct tggacgttgc 10200 aaacgtaagt gttggatccc ggtcggcatc tactctattc ctttgccctc ggacgagtgc 10260 tggggcgtcg gtttccacta tcggcgagta cttctacaca gccatcggtc cagacggccg 10320 cgcttctgcg ggcgatttgt gtacgcccga cagtcccggc tccggatcgg acgattgcgt 10380 cgcatcgacc ctgcgcccaa gctgcatcat cgaaattgcc gtcaaccaag ctctgataga 10440 gttggtcaag accaatgcgg agcatatacg cccggagccg cggcgatcct gcaagctccg 10500 gatgcctccg ctcgaagtag cgcgtctgct gctccataca agccaaccac ggcctccaga 10560 agaagatgtt ggcgacctcg tattgggaat ccccgaacat cgcctcgctc cagtcaatga 10620 ccgctgttat gcggccattg tccgtcagga cattgttgga gccgaaatcc gcgtgcacga 10680 ggtgccggac ttcggggcag tcctcggccc aaagcatcag ctcatcgaga gcctgcgcga 10740 cggacgcact gacggtgtcg tccatcacag tttgccagtg atacacatgg ggatcagcaa 10800 tcgcgcatat gaaatcacgc catgtagtgt attgaccgat tccttgcggt ccgaatgggc 10860 cgaacccgct cgtctggcta agatcggccg cagcgatcgc atccatggcc tccgcgaccg 10920 gctgcagaac agcgggcagt tcggtttcag gcaggtcttg caacgtgaca ccctgtgcac 10980 ggcgggagat gcaataggtc aggctctcgc tgaattcccc aatgtcaagc acttccggaa 11040 tcgggagcgc ggccgatgca aagtgccgat aaacataacg atctttgtag aaaccatcgg 11100 cgcagctatt tacccgcagg acatatccac gccctcctac atcgaagctg aaagcacgag 11160 attcttcgcc ctccgagagc tgcatcaggt cggagacgct gtcgaacttt tcgatcagaa 11220 acttctcgac agacgtcgcg gtgagttcag gctttttcat atcggggtcg tcctctccaa 11280 atgaaatgaa cttccttata tagaggaagg gtcttgcgaa ggatagtggg attgtgcgtc 11340 atcccttacg tcagtggaga tatcacatca atccacttgc tttgaagacg tggttggaac 11400 gtcttctttt tccacgatgc tcctcgtggg tgggggtcca tctttgggac cactgtcggc 11460 agaggcatct tgaacgatag cctttccttt atcgcaatga tggcatttgt aggtgccacc 11520 ttccttttct actgtccttt tgatgaagtg acagatagct gggcaatgga atccgaggag 11580 gtttcccgat attacccttt gttgaaaagt ctcaatagcc ctttggtctt ctgagactgt 11640 atctttgata ttcttggagt agacgagagt gtcgtgctcc accatgttga cggatctcta 11700 ggacgcgtcc tagaagctaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 11760 cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 11820 agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgcccgc 11880 tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 11940 aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 12000 acttgatttg ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 12060 tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 12120 caaccctatc tcgggctatt cttttgattt ataagggatt ttgccgattt cggaaccacc 12180 atcaaacagg attttcgcct gctggggcaa accagcgtgg accgcttgct gcaactctct 12240 cagggccagg cggtgaaggg caatcagctg ttgcccgtct cactggtgaa aagaaaaacc 12300 accccagtac attaaaaacg tccgcaatgt gttattaagt tgtctaagcg tcaatttgtt 12360 tacaccacaa tatatcctgc caccagccag ccaacagctc cccgaccggc agctcggcac 12420 aaaatcacca ctcgatacag gcagcccatc agtccgggac ggcgtcagcg ggagagccgt 12480 tgtaaggcgg cagactttgc tcatgttacc gatgctattc ggaagaacgg caactaagct 12540 gccgggtttg aaacacggat gatctcgcgg agggtagcat gttgattgta acgatgacag 12600 agcgttgctg cctgtgatca aatatcatct ccctcgcaga gatccgaatt atcagccttc 12660 ttattcattt ctcgcttaac cgtgacaggc tgtcgatctt gagaactatg ccgacataat 12720 aggaaatcgc tggataaagc cgctgaggaa gctgagtggc gctatttctt tagaagtgaa 12780 cgttgacgat atcaactccc ctatccattg ctcaccgaat ggtacaggtc ggggacccga 12840 agttccgact gtcggcctga tgcatccccg gctgatcgac cccagatctg gggctgagaa 12900 agcccagtaa ggaaacaact gtaggttcga gtcgcgagat cccccggaac caaaggaagt 12960 aggttaaacc cgctccgatc aggccgagcc acgccaggcc gagaacattg gttcctgtag 13020 gcatcgggat tggcggatca aacactaaag ctactggaac gagcagaagt cctccggccg 13080 ccagttgcca ggcggtaaag gtgagcagag gcacgggagg ttgccacttg cgggtcagca 13140 cggttccgaa cgccatggaa accgcccccg ccaggcccgc tgcgacgccg acaggatcta 13200 gcgctgcgtt tggtgtcaac accaacagcg ccacgcccgc agttccgcaa atagccccca 13260 ggaccgccat caatcgtatc gggctaccta gcagagcggc agagatgaac acgaccatca 13320 gcggctgcac agcgcctacc gtcgccgcga ccccgcccgg caggcggtag accgaaataa 13380 acaacaagct ccagaatagc gaaatattaa gtgcgccgag gatgaagatg cgcatccacc 13440 agattcccgt tggaatctgt cggacgatca tcacgagcaa taaacccgcc ggcaacgccc 13500 gcagcagcat accggcgacc cctcggcctc gctgttcggg ctccacgaaa acgccggaca 13560 gatgcgcctt gtgagcgtcc ttggggccgt cctcctgttt gaagaccgac agcccaatga 13620 tctcgccgtc gatgtaggcg ccgaatgcca cggcatctcg caaccgttca gcgaacgcct 13680 ccatgggctt tttctcctcg tgctcgtaaa cggacccgaa catctctgga gctttcttca 13740 gggccgacaa tcggatctcg cggaaatcct gcacgtcggc cgctccaagc cgtcgaatct 13800 gagccttaat cacaattgtc aattttaatc ctctgtttat cggcagttcg tagagcgcgc 13860 cgtgcgtccc gagcgatact gagcgaagca agtgcgtcga gcagtgcccg cttgttcctg 13920 aaatgccagt aaagcgctgg ctgctgaacc cccagccgga actgacccca caaggcccta 13980 gcgtttgcaa tgcaccaggt catcattgac ccaggcgtgt tccaccaggc cgctgcctcg 14040 caactcttcg caggcttcgc cgacctgctc gcgccacttc ttcacgcggg tggaatccga 14100 tccgcacatg aggcggaagg tttccagctt gagcgggtac ggctcccggt gcgagctgaa 14160 atagtcgaac atccgtcggg ccgtcggcga cagcttgcgg tacttctccc atatgaattt 14220 cgtgtagtgg tcgccagcaa acagcacgac gatttcctcg tcgatcagga cctggcaacg 14280 ggacgttttc ttgccacggt ccaggacgcg gaagcggtgc agcagcgaca ccgattccag 14340 gtgcccaacg cggtcggacg tgaagcccat cgccgtcgcc tgtaggcgcg acaggcattc 14400 ctcggccttc gtgtaatacc ggccattgat cgaccagccc aggtcctggc aaagctcgta 14460 gaacgtgaag gtgatcggct cgccgatagg ggtgcgcttc gcgtactcca acacctgctg 14520 ccacaccagt tcgtcatcgt cggcccgcag ctcgacgccg gtgtaggtga tcttcacgtc 14580 cttgttgacg tggaaaatga ccttgttttg cagcgcctcg cgcgggattt tcttgttgcg 14640 cgtggtgaac agggcagagc gggccgtgtc gtttggcatc gctcgcatcg tgtccggcca 14700 cggcgcaata tcgaacaagg aaagctgcat ttccttgatc tgctgcttcg tgtgtttcag 14760 caacgcggcc tgcttggcct cgctgacctg ttttgccagg tcctcgccgg cggtttttcg 14820 cttcttggtc gtcatagttc ctcgcgtgtc gatggtcatc gacttcgcca aacctgccgc 14880 ctcctgttcg agacgacgcg aacgctccac ggcggccgat ggcgcgggca gggcaggggg 14940 agccagttgc acgctgtcgc gctcgatctt ggccgtagct tgctggacca tcgagccgac 15000 ggactggaag gtttcgcggg gcgcacgcat gacggtgcgg cttgcgatgg tttcggcatc 15060 ctcggcggaa aaccccgcgt cgatcagttc ttgcctgtat gccttccggt caaacgtccg 15120 attcattcac cctccttgcg ggattgcccc gactcacgcc ggggcaatgt gcccttattc 15180 ctgatttgac ccgcctggtg ccttggtgtc cagataatcc accttatcgg caatgaagtc 15240 ggtcccgtag accgtctggc cgtccttctc gtacttggta ttccgaatct tgccctgcac 15300 gaataccagc gaccccttgc ccaaatactt gccgtgggcc tcggcctgag agccaaaaca 15360 cttgatgcgg aagaagtcgg tgcgctcctg cttgtcgccg gcatcgttgc gccacatcta 15420 ggtactaaaa caattcatcc agtaaaatat aatattttat tttctcccaa tcaggcttga 15480 tccccagtaa gtcaaaaaat agctcgacat actgttcttc cccgatatcc tccctgatcg 15540 accggacgca gaaggcaatg tcataccact tgtccgccct gccgcttctc ccaagatcaa 15600 taaagccact tactttgcca tctttcacaa agatgttgct gtctcccagg tcgccgtggg 15660 aaaagacaag ttcctcttcg ggcttttccg tctttaaaaa atcatacagc tcgcgcggat 15720 ctttaaatgg agtgtcttct tcccagtttt cgcaatccac atcggccaga tcgttattca 15780 gtaagtaatc caattcggct aagcggctgt ctaagctatt cgtataggga caatccgata 15840 tgtcgatgga gtgaaagagc ctgatgcact ccgcatacag ctcgataatc ttttcagggc 15900 tttgttcatc ttcatactct tccgagcaaa ggacgccatc ggcctcactc atgagcagat 15960 tgctccagcc atcatgccgt tcaaagtgca ggacctttgg aacaggcagc tttccttcca 16020 gccatagcat catgtccttt tcccgttcca catcataggt ggtcccttta taccggctgt 16080 ccgtcatttt taaatatagg ttttcatttt ctcccaccag cttatatacc ttagcaggag 16140 acattccttc cgtatctttt acgcagcggt atttttcgat cagttttttc aattccggtg 16200 atattctcat tttagccatt tattatttcc ttcctctttt ctacagtatt taaagatacc 16260 ccaagaagct aattataaca agacgaactc caattcactg ttccttgcat tctaaaacct 16320 taaataccag aaaacagctt tttcaaagtt gttttcaaag ttggcgtata acatagtatc 16380 gacggagccg attttgaaac cacaattatg ggtgatgctg ccaacttact gatttagtgt 16440 atgatggtgt ttttgaggtg ctccagtggc ttctgtgtct atcagctgtc cctcctgttc 16500 agctactgac ggggtggtgc gtaacggcaa aagcaccgcc ggacatcagc gctatctctg 16560 ctctcactgc cgtaaaacat ggcaactgca gttcacttac accgcttctc aacccggtac 16620 gcaccagaaa atcattgata tggccatgaa tggcgttgga tgccgggcaa cagcccgcat 16680 tatgggcgtt ggcctcaaca cgattttacg tcacttaaaa aactcaggcc gcagtcggta 16740 acctcgcgca tacagccggg cagtgacgtc atcgtctgcg cggaaatgga cgaacagtgg 16800 ggctatgtcg gggctaaatc gcgccagcgc tggctgtttt acgcgtatga cagtctccgg 16860 aagacggttg ttgcgcacgt attcggtgaa cgcactatgg cgacgctggg gcgtcttatg 16920 agcctgctgt caccctttga cgtggtgata tggatgacgg atggctggcc gctgtatgaa 16980 tcccgcctga agggaaagct gcacgtaatc agcaagcgat atacgcagcg aattgagcgg 17040 cataacctga atctgaggca gcacctggca cggctgggac ggaagtcgct gtcgttctca 17100 aaatcggtgg agctgcatga caaagtcatc gggcattatc tgaacataaa acactatcaa 17160 taagttggag tcattaccca attatgatag aatttacaag ctataaggtt attgtcctgg 17220 gtttcaagca ttagtccatg caagttttta tgctttgccc attctataga tatattgata 17280 agcgcgctgc ctatgccttg ccccctgaaa tccttacata cggcgatatc ttctatataa 17340 aagatatatt atcttatcag tattgtcaat atattcaagg caatctgcct cctcatcctc 17400 ttcatcctct tcgtcttggt agctttttaa atatggcgct tcatagagta attctgtaaa 17460 ggtccaattc tcgttttcat acctcggtat aatcttacct atcacctcaa atggttcgct 17520 gggtttatcg cacccccgaa cacgagcacg gcacccgcga ccactatgcc aagaatgccc 17580 aaggtaaaaa ttgccggccc cgccatgaag tccgtgaatg ccccgacggc cgaagtgaag 17640 ggcaggccgc cacccaggcc gccgccctca ctgcccggca cctggtcgct gaatgtcgat 17700 gccagcacct gcggcacgtc aatgcttccg ggcgtcgcgc tcgggctgat cgcccatccc 17760 gttactgccc cgatcccggc aatggcaagg actgccagcg ctgccatttt tggggtgagg 17820 ccgttcgcgg ccgaggggcg cagcccctgg ggggatggga ggcccgcgtt agcgggccgg 17880 gagggttcga gaaggggggg cacccccctt cggcgtgcgc ggtcacgcgc acagggcgca 17940 gccctggtta aaaacaaggt ttataaatat tggtttaaaa gcaggttaaa agacaggtta 18000 gcggtggccg aaaaacgggc ggaaaccctt gcaaatgctg gattttctgc ctgtggacag 18060 cccctcaaat gtcaataggt gcgcccctca tctgtcagca ctctgcccct caagtgtcaa 18120 ggatcgcgcc cctcatctgt cagtagtcgc gcccctcaag tgtcaatacc gcagggcact 18180 tatccccagg cttgtccaca tcatctgtgg gaaactcgcg taaaatcagg cgttttcgcc 18240 gatttgcgag gctggccagc tccacgtcgc cggccgaaat cgagcctgcc cctcatctgt 18300 caacgccgcg ccgggtgagt cggcccctca agtgtcaacg tccgcccctc atctgtcagt 18360 gagggccaag ttttccgcga ggtatccaca acgccggcgg ccgcggtgtc tcgcacacgg 18420 cttcgacggc gtttctggcg cgtttgcagg gccatagacg gccgccagcc cagcggcgag 18480 ggcaaccagc ccgg 18494 <210> 18 <211> 17647 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 18 tgagcgtcgc aaaggcgctc ggtcttgcct tgctcgtcgg tgatgtactt caccagctcc 60 gcgaagtcgc tcttcttgat ggagcgcatg gggacgtgct tggcaatcac gcgcaccccc 120 cggccgtttt agcggctaaa aaagtcatgg ctctgccctc gggcggacca cgcccatcat 180 gaccttgcca agctcgtcct gcttctcttc gatcttcgcc agcagggcga ggatcgtggc 240 atcaccgaac cgcgccgtgc gcgggtcgtc ggtgagccag agtttcagca ggccgcccag 300 gcggcccagg tcgccattga tgcgggccag ctcgcggacg tgctcatagt ccacgacgcc 360 cgtgattttg tagccctggc cgacggccag caggtaggcc gacaggctca tgccggccgc 420 cgccgccttt tcctcaatcg ctcttcgttc gtctggaagg cagtacacct tgataggtgg 480 gctgcccttc ctggttggct tggtttcatc agccatccgc ttgccctcat ctgttacgcc 540 ggcggtagcc ggccagcctc gcagagcagg attcccgttg agcaccgcca ggtgcgaata 600 agggacagtg aagaaggaac acccgctcgc gggtgggcct acttcaccta tcctgcccgg 660 ctgacgccgt tggatacacc aaggaaagtc tacacgaacc ctttggcaaa atcctgtata 720 tcgtgcgaaa aaggatggat ataccgaaaa aatcgctata atgaccccga agcagggtta 780 tgcagcggaa aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 840 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 900 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 960 gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1020 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1080 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1140 cagtgagcga ggaagcggaa gagcgccaga aggccgccag agaggccgag cgcggccgtg 1200 aggcttggac gctagggcag ggcatgaaaa agcccgtagc gggctgctac gggcgtctga 1260 cgcggtggaa agggggaggg gatgttgtct acatggctct gctgtagtga gtgggttgcg 1320 ctccggcagc ggtcctgatc aatcgtcacc ctttctcggt ccttcaacgt tcctgacaac 1380 gagcctcctt ttcgccaatc catcgacaat caccgcgagt ccctgctcga acgctgcgtc 1440 cggaccggct tcgtcgaagg cgtctatcgc ggcccgcaac agcggcgaga gcggagcctg 1500 ttcaacggtg ccgccgcgct cgccggcatc gctgtcgccg gcctgctcct caagcacggc 1560 cccaacagtg aagtagctga ttgtcatcag cgcattgacg gcgtccccgg ccgaaaaacc 1620 cgcctcgcag aggaagcgaa gctgcgcgtc ggccgtttcc atctgcggtg cgcccggtcg 1680 cgtgccggca tggatgcgcg cgccatcgcg gtaggcgagc agcgcctgcc tgaagctgcg 1740 ggcattcccg atcagaaatg agcgccagtc gtcgtcggct ctcggcaccg aatgcgtatg 1800 attctccgcc agcatggctt cggccagtgc gtcgagcagc gcccgcttgt tcctgaagtg 1860 ccagtaaagc gccggctgct gaacccccaa ccgttccgcc agtttgcgtg tcgtcagacc 1920 gtctacgccg acctcgttca acaggtccag ggcggcacgg atcactgtat tcggctgcaa 1980 ctttgtcatg cttgacactt tatcactgat aaacataata tgtccaccaa cttatcagtg 2040 ataaagaatc cgcgcgttca atcggaccag cggaggctgg tccggaggcc agacgtgaaa 2100 cccaacatac ccctgatcgt aattctgagc actgtcgcgc tcgacgctgt cggcatcggc 2160 ctgattatgc cggtgctgcc gggcctcctg cgcgatctgg ttcactcgaa cgacgtcacc 2220 gcccactatg gcattctgct ggcgctgtat gcgttggtgc aatttgcctg cgcacctgtg 2280 ctgggcgcgc tgtcggatcg tttcgggcgg cggccaatct tgctcgtctc gctggccggc 2340 gccagatctg gggaaccctg tggttggcat gcacatacaa atggacgaac ggataaacct 2400 tttcacgccc ttttaaatat ccgattattc taataaacgc tcttttctct taggtttacc 2460 cgccaatata tcctgtcaaa cactgatagt ttaaactgaa ggcgggaaac gacaatctga 2520 tcatgagcgg agaattaagg gagtcacgtt atgacccccg ccgatgacgc gggacaagcc 2580 gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactcagc cgcgggtttc 2640 tggagtttaa tgagctaagc acatacgtca gaaaccatta ttgcgcgttc aaaagtcgcc 2700 taaggtcact atcagctagc aaatatttct tgtcaaaaat gctccactga cgttccataa 2760 attcccctcg gtatccaatt agagtctcat attcactctc aatccaaata atctgcaccg 2820 gatctggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 2880 gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 2940 ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 3000 gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg 3060 ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 3120 gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 3180 tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 3240 accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 3300 aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 3360 aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca tggcgatgcc tgcttgccga 3420 atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 3480 cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 3540 aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 3600 ccttctatcg ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga 3660 ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag 3720 gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct 3780 catgctggag ttcttcgccc acgggatctc tgcggaacag gcggtcgaag gtgccgatat 3840 cattacgaca gcaacggccg acaagcacaa cgccacgatc ctgagcgaca atatgatcgg 3900 gcccggcgtc cacatcaacg gcgtcggcgg cgactgccca ggcaagaccg agatgcaccg 3960 cgatatcttg ctgcgttcgg atattttcgt ggagttcccg ccacagaccc ggatgatccc 4020 cgatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc 4080 gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg 4140 catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat acatttaata 4200 cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc 4260 tatgttacta gatcgggcct cctgtcaatg ctggcggcgg ctctggtggt ggttctggtg 4320 gcggctctga gggtggtggc tctgagggtg gcggttctga gggtggcggc tctgagggag 4380 gcggttccgg tggtggctct ggttccggtg attttgatta tgaaaagatg gcaaacgcta 4440 ataagggggc tatgaccgaa aatgccgatg aaaacgcgct acagtctgac gctaaaggca 4500 aacttgattc tgtcgctact gattacggtg ctgctatcga tggtttcatt ggtgacgttt 4560 ccggccttgc taatggtaat ggtgctactg gtgattttgc tggctctaat tcccaaatgg 4620 ctcaagtcgg tgacggtgat aattcacctt taatgaataa tttccgtcaa tatttacctt 4680 ccctccctca atcggttgaa tgtcgccctt ttgtctttgg cccaatacgc aaaccgcctc 4740 tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 4800 cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 4860 tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 4920 caggaaacag ctatgaccat gattacgcca agcttgcatg cctgcaggtc cccagattag 4980 ccttttcaat ttcagaaaga atgctaaccc acagatggtt agagaggctt acgcagcagg 5040 tctcatcaag acgatctacc cgagcaataa tctccaggaa atcaaatacc ttcccaagaa 5100 ggttaaagat gcagtcaaaa gattcaggac taactgcatc aagaacacag agaaagatat 5160 atttctcaag atcagaagta ctattccagt atggacgatt caaggcttgc ttcacaaacc 5220 aaggcaagta atagagattg gagtctctaa aaaggtagtt cccactgaat caaaggccat 5280 ggagtcaaag attcaaatag aggacctaac agaactcgcc gtaaagactg gcgaacagtt 5340 catacagagt ctcttacgac tcaatgacaa gaagaaaatc ttcgtcaaca tggtggagca 5400 cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 5460 tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 5520 ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 5580 cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 5640 cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 5700 ggattgatgt gatatctcca ctgacgtaag ggatgacgca caatcccact atccttcgca 5760 agacccttcc tctatataag gaagttcatt tcatttggag agaacacggg ggactctaat 5820 caaacaagtt tgtacaaaaa agctgaacga gaaacgtaaa atgatataaa tatgcaggtg 5880 atacccgcgt gcaactcggc agcaataaga tcactatgtc ctactcccga gtcttttaga 5940 aacatgggat ggctctctgt cagcgatgcg gtctacagcg agttcatagg agagttggct 6000 acccgcgctt ccaatcgaaa ttactccaac gagttcggcc tcatgcaacc tatccaggaa 6060 ttcaaggctt tcattgaaag cgacccggtg gtgcaccaag aatttattga catgttcgag 6120 ggcattcagg actctccaag gaattatcag gaactatgta atatgttcaa cgatatcttt 6180 cgcaaagctc ccgtctacgg agaccttggc cctcccgttt atatgattat ggccaaatta 6240 atgaacaccc gagcgggctt ctctgcattc acgagacaaa ggttgaacct tcacttcaaa 6300 aaacttttcg atacctgggg attgttcctg tcttcgaaag attctcgaaa tgttcttgtg 6360 gccgaccagt tcgacgacag acattgcggc tggttgaacg agcgggcctt gtctgctatg 6420 gttaaacatt acaatggacg cgcatttgat gaagtcttcc tctgcgataa aaatgcccca 6480 tactacggct tcaactctta cgacgacttc tttaatcgca gatttcgaaa ccgagatatc 6540 gaccgacctg tagtcggtgg agttaacaac accaccctca tttctgctgc ttgcgaatca 6600 ctttcctaca acgtctctta tgacgtccag tctctcgaca ctttagtttt caaaggagag 6660 acttattcgc ttaagcattt gctgaataat gaccctttca ccccacaatt cgagcatggg 6720 agtattctac aaggattctt gaacgtcacc gcttaccacc gatggcacgc acccgtcaat 6780 gggacaatcg tcaaaatcat caacgttcca ggtacctact ttgcgcaagc cccgagcacg 6840 attggcgacc ctatcccgga taacgattac gacccacctc cttaccttaa gtctcttgtc 6900 tacttctcta atattgccgc aaggcaaatt atgtttattg aagccgacaa caaggaaatt 6960 ggcctcattt tccttgtgtt catcggcatg accgaaatct cgacatgtga agccacggtg 7020 tccgaaggtc aacacgtcaa tcgtggcgat gacttgggaa tgttccattt cggtggttct 7080 tcgttcgcgc ttggtctgag gaaggattgc agggcagaga tcgttgaaaa gttcaccgaa 7140 cccggaacag tgatcagaat caacgaagtc gtcgctgctc taaaggctta gtacgtttct 7200 cgttcagctt tcttgtacaa agtggttcga tctagaggat ccatggtgag caagggcgag 7260 gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt gaacggccac 7320 aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag 7380 ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccttcacc 7440 tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 7500 tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 7560 tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 7620 aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 7680 aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 7740 aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 7800 acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 7860 gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 7920 gccgccggga tcactcacgg catggacgag ctgtacaagt aaagcggccc gagctcgaat 7980 ttccccgatc gttcaaacat ttggcaataa agtttcttaa gattgaatcc tgttgccggt 8040 cttgcgatga ttatcatata atttctgttg aattacgtta agcatgtaat aattaacatg 8100 taatgcatga cgttatttat gagatgggtt tttatgatta gagtcccgca attatacatt 8160 taatacgcga tagaaaacaa aatatagcgc gcaaactagg ataaattatc gcgcgcggtg 8220 tcatctatgt tactagatcg ggaattagct tcatcaacgc aagacatgcg cacgaccgtc 8280 tgacaggaga ggaatttccg acgagcacag aaaggacttg ctcttggacg taggcctatt 8340 tctcaggcac atgtatcaag tgttcggacg tgggttttcg atggtgtatc agccgccgcc 8400 aactgggaga tgaggaggct ttcttggggg gcagtcagca gttcatttca caagacagag 8460 gaacttgtaa ggagatgcac tgatttatct tggcgcaaac cagcaggacg aattagtggg 8520 aatagcccgc gaatatctaa gttatgcctg tcggcatgag cagaaacttc caattcgaaa 8580 cagtttggag aggttgtttt tgggcatacc ttttgttagt cagcctctcg attgctcatc 8640 gtcattacac agtaccgaag tttgatcgat ctagtaacat agatgacacc gcgcgcgata 8700 atttatccta gtttgcgcgc tatattttgt tttctatcgc gtattaaatg tataattgcg 8760 ggactctaat cataaaaacc catctcataa ataacgtcat gcattacatg ttaattatta 8820 catgcttaac gtaattcaac agaaattata tgataatcat cgcaagaccg gcaacaggat 8880 tcaatcttaa gaaactttat tgccaaatgt ttgaacgatc tgcttcgacg cactccttct 8940 ttactccacc atctcgtcct tattgaaaac gtgggtagca ccaaaacgaa tcaagtcgct 9000 ggaactgaag ttaccaatca cgctggatga tttgccagtt ggattaatct tgcctttccc 9060 cgcatgaata atattgatga atgcatgcgt gaggggtatt tcgattttgg caatagctgc 9120 aattgccgcg acatcctcca acgagcataa ttcttcagaa aaatagcgat gttccatgtt 9180 gtcagggcat gcatgatgca cgttatgagg tgacggtgct aggcagtatt ccctcaaagt 9240 ttcatagtca gtatcatatt catcattgca ttcctgcaag agagaattga gacgcaatcc 9300 acacgctgcg gcaaccttcc ggcgttcgtg gtctatttgc tcttggacgt tgcaaacgta 9360 agtgttggat cccggtcggc atctactcta ttcctttgcc ctcggacgag tgctggggcg 9420 tcggtttcca ctatcggcga gtacttctac acagccatcg gtccagacgg ccgcgcttct 9480 gcgggcgatt tgtgtacgcc cgacagtccc ggctccggat cggacgattg cgtcgcatcg 9540 accctgcgcc caagctgcat catcgaaatt gccgtcaacc aagctctgat agagttggtc 9600 aagaccaatg cggagcatat acgcccggag ccgcggcgat cctgcaagct ccggatgcct 9660 ccgctcgaag tagcgcgtct gctgctccat acaagccaac cacggcctcc agaagaagat 9720 gttggcgacc tcgtattggg aatccccgaa catcgcctcg ctccagtcaa tgaccgctgt 9780 tatgcggcca ttgtccgtca ggacattgtt ggagccgaaa tccgcgtgca cgaggtgccg 9840 gacttcgggg cagtcctcgg cccaaagcat cagctcatcg agagcctgcg cgacggacgc 9900 actgacggtg tcgtccatca cagtttgcca gtgatacaca tggggatcag caatcgcgca 9960 tatgaaatca cgccatgtag tgtattgacc gattccttgc ggtccgaatg ggccgaaccc 10020 gctcgtctgg ctaagatcgg ccgcagcgat cgcatccatg gcctccgcga ccggctgcag 10080 aacagcgggc agttcggttt caggcaggtc ttgcaacgtg acaccctgtg cacggcggga 10140 gatgcaatag gtcaggctct cgctgaattc cccaatgtca agcacttccg gaatcgggag 10200 cgcggccgat gcaaagtgcc gataaacata acgatctttg tagaaaccat cggcgcagct 10260 atttacccgc aggacatatc cacgccctcc tacatcgaag ctgaaagcac gagattcttc 10320 gccctccgag agctgcatca ggtcggagac gctgtcgaac ttttcgatca gaaacttctc 10380 gacagacgtc gcggtgagtt caggcttttt catatcgggg tcgtcctctc caaatgaaat 10440 gaacttcctt atatagagga agggtcttgc gaaggatagt gggattgtgc gtcatccctt 10500 acgtcagtgg agatatcaca tcaatccact tgctttgaag acgtggttgg aacgtcttct 10560 ttttccacga tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca 10620 tcttgaacga tagcctttcc tttatcgcaa tgatggcatt tgtaggtgcc accttccttt 10680 tctactgtcc ttttgatgaa gtgacagata gctgggcaat ggaatccgag gaggtttccc 10740 gatattaccc tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg 10800 atattcttgg agtagacgag agtgtcgtgc tccaccatgt tgacggatct ctaggacgcg 10860 tcctagaagc taattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 10920 ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 10980 aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgcc cgctcctttc 11040 gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc tctaaatcgg 11100 gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa aaaacttgat 11160 ttgggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg ccctttgacg 11220 ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac actcaaccct 11280 atctcgggct attcttttga tttataaggg attttgccga tttcggaacc accatcaaac 11340 aggattttcg cctgctgggg caaaccagcg tggaccgctt gctgcaactc tctcagggcc 11400 aggcggtgaa gggcaatcag ctgttgcccg tctcactggt gaaaagaaaa accaccccag 11460 tacattaaaa acgtccgcaa tgtgttatta agttgtctaa gcgtcaattt gtttacacca 11520 caatatatcc tgccaccagc cagccaacag ctccccgacc ggcagctcgg cacaaaatca 11580 ccactcgata caggcagccc atcagtccgg gacggcgtca gcgggagagc cgttgtaagg 11640 cggcagactt tgctcatgtt accgatgcta ttcggaagaa cggcaactaa gctgccgggt 11700 ttgaaacacg gatgatctcg cggagggtag catgttgatt gtaacgatga cagagcgttg 11760 ctgcctgtga tcaaatatca tctccctcgc agagatccga attatcagcc ttcttattca 11820 tttctcgctt aaccgtgaca ggctgtcgat cttgagaact atgccgacat aataggaaat 11880 cgctggataa agccgctgag gaagctgagt ggcgctattt ctttagaagt gaacgttgac 11940 gatatcaact cccctatcca ttgctcaccg aatggtacag gtcggggacc cgaagttccg 12000 actgtcggcc tgatgcatcc ccggctgatc gaccccagat ctggggctga gaaagcccag 12060 taaggaaaca actgtaggtt cgagtcgcga gatcccccgg aaccaaagga agtaggttaa 12120 acccgctccg atcaggccga gccacgccag gccgagaaca ttggttcctg taggcatcgg 12180 gattggcgga tcaaacacta aagctactgg aacgagcaga agtcctccgg ccgccagttg 12240 ccaggcggta aaggtgagca gaggcacggg aggttgccac ttgcgggtca gcacggttcc 12300 gaacgccatg gaaaccgccc ccgccaggcc cgctgcgacg ccgacaggat ctagcgctgc 12360 gtttggtgtc aacaccaaca gcgccacgcc cgcagttccg caaatagccc ccaggaccgc 12420 catcaatcgt atcgggctac ctagcagagc ggcagagatg aacacgacca tcagcggctg 12480 cacagcgcct accgtcgccg cgaccccgcc cggcaggcgg tagaccgaaa taaacaacaa 12540 gctccagaat agcgaaatat taagtgcgcc gaggatgaag atgcgcatcc accagattcc 12600 cgttggaatc tgtcggacga tcatcacgag caataaaccc gccggcaacg cccgcagcag 12660 cataccggcg acccctcggc ctcgctgttc gggctccacg aaaacgccgg acagatgcgc 12720 cttgtgagcg tccttggggc cgtcctcctg tttgaagacc gacagcccaa tgatctcgcc 12780 gtcgatgtag gcgccgaatg ccacggcatc tcgcaaccgt tcagcgaacg cctccatggg 12840 ctttttctcc tcgtgctcgt aaacggaccc gaacatctct ggagctttct tcagggccga 12900 caatcggatc tcgcggaaat cctgcacgtc ggccgctcca agccgtcgaa tctgagcctt 12960 aatcacaatt gtcaatttta atcctctgtt tatcggcagt tcgtagagcg cgccgtgcgt 13020 cccgagcgat actgagcgaa gcaagtgcgt cgagcagtgc ccgcttgttc ctgaaatgcc 13080 agtaaagcgc tggctgctga acccccagcc ggaactgacc ccacaaggcc ctagcgtttg 13140 caatgcacca ggtcatcatt gacccaggcg tgttccacca ggccgctgcc tcgcaactct 13200 tcgcaggctt cgccgacctg ctcgcgccac ttcttcacgc gggtggaatc cgatccgcac 13260 atgaggcgga aggtttccag cttgagcggg tacggctccc ggtgcgagct gaaatagtcg 13320 aacatccgtc gggccgtcgg cgacagcttg cggtacttct cccatatgaa tttcgtgtag 13380 tggtcgccag caaacagcac gacgatttcc tcgtcgatca ggacctggca acgggacgtt 13440 ttcttgccac ggtccaggac gcggaagcgg tgcagcagcg acaccgattc caggtgccca 13500 acgcggtcgg acgtgaagcc catcgccgtc gcctgtaggc gcgacaggca ttcctcggcc 13560 ttcgtgtaat accggccatt gatcgaccag cccaggtcct ggcaaagctc gtagaacgtg 13620 aaggtgatcg gctcgccgat aggggtgcgc ttcgcgtact ccaacacctg ctgccacacc 13680 agttcgtcat cgtcggcccg cagctcgacg ccggtgtagg tgatcttcac gtccttgttg 13740 acgtggaaaa tgaccttgtt ttgcagcgcc tcgcgcggga ttttcttgtt gcgcgtggtg 13800 aacagggcag agcgggccgt gtcgtttggc atcgctcgca tcgtgtccgg ccacggcgca 13860 atatcgaaca aggaaagctg catttccttg atctgctgct tcgtgtgttt cagcaacgcg 13920 gcctgcttgg cctcgctgac ctgttttgcc aggtcctcgc cggcggtttt tcgcttcttg 13980 gtcgtcatag ttcctcgcgt gtcgatggtc atcgacttcg ccaaacctgc cgcctcctgt 14040 tcgagacgac gcgaacgctc cacggcggcc gatggcgcgg gcagggcagg gggagccagt 14100 tgcacgctgt cgcgctcgat cttggccgta gcttgctgga ccatcgagcc gacggactgg 14160 aaggtttcgc ggggcgcacg catgacggtg cggcttgcga tggtttcggc atcctcggcg 14220 gaaaaccccg cgtcgatcag ttcttgcctg tatgccttcc ggtcaaacgt ccgattcatt 14280 caccctcctt gcgggattgc cccgactcac gccggggcaa tgtgccctta ttcctgattt 14340 gacccgcctg gtgccttggt gtccagataa tccaccttat cggcaatgaa gtcggtcccg 14400 tagaccgtct ggccgtcctt ctcgtacttg gtattccgaa tcttgccctg cacgaatacc 14460 agcgacccct tgcccaaata cttgccgtgg gcctcggcct gagagccaaa acacttgatg 14520 cggaagaagt cggtgcgctc ctgcttgtcg ccggcatcgt tgcgccacat ctaggtacta 14580 aaacaattca tccagtaaaa tataatattt tattttctcc caatcaggct tgatccccag 14640 taagtcaaaa aatagctcga catactgttc ttccccgata tcctccctga tcgaccggac 14700 gcagaaggca atgtcatacc acttgtccgc cctgccgctt ctcccaagat caataaagcc 14760 acttactttg ccatctttca caaagatgtt gctgtctccc aggtcgccgt gggaaaagac 14820 aagttcctct tcgggctttt ccgtctttaa aaaatcatac agctcgcgcg gatctttaaa 14880 tggagtgtct tcttcccagt tttcgcaatc cacatcggcc agatcgttat tcagtaagta 14940 atccaattcg gctaagcggc tgtctaagct attcgtatag ggacaatccg atatgtcgat 15000 ggagtgaaag agcctgatgc actccgcata cagctcgata atcttttcag ggctttgttc 15060 atcttcatac tcttccgagc aaaggacgcc atcggcctca ctcatgagca gattgctcca 15120 gccatcatgc cgttcaaagt gcaggacctt tggaacaggc agctttcctt ccagccatag 15180 catcatgtcc ttttcccgtt ccacatcata ggtggtccct ttataccggc tgtccgtcat 15240 ttttaaatat aggttttcat tttctcccac cagcttatat accttagcag gagacattcc 15300 ttccgtatct tttacgcagc ggtatttttc gatcagtttt ttcaattccg gtgatattct 15360 cattttagcc atttattatt tccttcctct tttctacagt atttaaagat accccaagaa 15420 gctaattata acaagacgaa ctccaattca ctgttccttg cattctaaaa ccttaaatac 15480 cagaaaacag ctttttcaaa gttgttttca aagttggcgt ataacatagt atcgacggag 15540 ccgattttga aaccacaatt atgggtgatg ctgccaactt actgatttag tgtatgatgg 15600 tgtttttgag gtgctccagt ggcttctgtg tctatcagct gtccctcctg ttcagctact 15660 gacggggtgg tgcgtaacgg caaaagcacc gccggacatc agcgctatct ctgctctcac 15720 tgccgtaaaa catggcaact gcagttcact tacaccgctt ctcaacccgg tacgcaccag 15780 aaaatcattg atatggccat gaatggcgtt ggatgccggg caacagcccg cattatgggc 15840 gttggcctca acacgatttt acgtcactta aaaaactcag gccgcagtcg gtaacctcgc 15900 gcatacagcc gggcagtgac gtcatcgtct gcgcggaaat ggacgaacag tggggctatg 15960 tcggggctaa atcgcgccag cgctggctgt tttacgcgta tgacagtctc cggaagacgg 16020 ttgttgcgca cgtattcggt gaacgcacta tggcgacgct ggggcgtctt atgagcctgc 16080 tgtcaccctt tgacgtggtg atatggatga cggatggctg gccgctgtat gaatcccgcc 16140 tgaagggaaa gctgcacgta atcagcaagc gatatacgca gcgaattgag cggcataacc 16200 tgaatctgag gcagcacctg gcacggctgg gacggaagtc gctgtcgttc tcaaaatcgg 16260 tggagctgca tgacaaagtc atcgggcatt atctgaacat aaaacactat caataagttg 16320 gagtcattac ccaattatga tagaatttac aagctataag gttattgtcc tgggtttcaa 16380 gcattagtcc atgcaagttt ttatgctttg cccattctat agatatattg ataagcgcgc 16440 tgcctatgcc ttgccccctg aaatccttac atacggcgat atcttctata taaaagatat 16500 attatcttat cagtattgtc aatatattca aggcaatctg cctcctcatc ctcttcatcc 16560 tcttcgtctt ggtagctttt taaatatggc gcttcataga gtaattctgt aaaggtccaa 16620 ttctcgtttt catacctcgg tataatctta cctatcacct caaatggttc gctgggttta 16680 tcgcaccccc gaacacgagc acggcacccg cgaccactat gccaagaatg cccaaggtaa 16740 aaattgccgg ccccgccatg aagtccgtga atgccccgac ggccgaagtg aagggcaggc 16800 cgccacccag gccgccgccc tcactgcccg gcacctggtc gctgaatgtc gatgccagca 16860 cctgcggcac gtcaatgctt ccgggcgtcg cgctcgggct gatcgcccat cccgttactg 16920 ccccgatccc ggcaatggca aggactgcca gcgctgccat ttttggggtg aggccgttcg 16980 cggccgaggg gcgcagcccc tggggggatg ggaggcccgc gttagcgggc cgggagggtt 17040 cgagaagggg gggcaccccc cttcggcgtg cgcggtcacg cgcacagggc gcagccctgg 17100 ttaaaaacaa ggtttataaa tattggttta aaagcaggtt aaaagacagg ttagcggtgg 17160 ccgaaaaacg ggcggaaacc cttgcaaatg ctggattttc tgcctgtgga cagcccctca 17220 aatgtcaata ggtgcgcccc tcatctgtca gcactctgcc cctcaagtgt caaggatcgc 17280 gcccctcatc tgtcagtagt cgcgcccctc aagtgtcaat accgcagggc acttatcccc 17340 aggcttgtcc acatcatctg tgggaaactc gcgtaaaatc aggcgttttc gccgatttgc 17400 gaggctggcc agctccacgt cgccggccga aatcgagcct gcccctcatc tgtcaacgcc 17460 gcgccgggtg agtcggcccc tcaagtgtca acgtccgccc ctcatctgtc agtgagggcc 17520 aagttttccg cgaggtatcc acaacgccgg cggccgcggt gtctcgcaca cggcttcgac 17580 ggcgtttctg gcgcgtttgc agggccatag acggccgcca gcccagcggc gagggcaacc 17640 agcccgg 17647 <210> 19 <211> 9462 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 19 agatctctaa ttccggggat cggaaatcca gaagcccgag aggttgccgc ctttcgggct 60 ttttcttttt caaaaaaaaa aatttataaa acgatctgtt gcggccggcc gccgggttgt 120 gggcaaaggc gctggcgctc gacggtgggc aaccgcttgc ggttgtccac gggcggagcc 180 ggtgcgcgta gcgcattgtc cacaagccaa gggcgaccaa taattgatat atatattcat 240 aattgaaaag ctaattgaac atactacttg ctgtaactac ttgccggagc gaggggtgtt 300 tgcaagctgt tgatctgaaa gggctattag cgttctcacg tgcctttttg attagcgatt 360 tcacgtgacc ttattagcga tttcacgtac tccgattagc gatttcacgt accctgatta 420 gcgatttcac gtggatagtt tttggagcgg gccggaaagc cccgtgaatc aaggctttgc 480 ggggcattag cggtttcacg tggataacta ccctctatcc acaggcttcc ggggataaaa 540 aagcccgctc gacggcgggc tgttggatgg ggatcgcctg aatcgcccca tcatccagcc 600 agaaagtgag ggagccacgg ttgatgagag ctttgttgta ggtggaccag ttggtgattt 660 tgaacttttg ctttgccacg gaacggtctg cgttgtcggg aagatgcgtg atctgatcct 720 tcaactcagc aaaagttcga tttattcaac aaagccacgt tgtgtctcaa aatctctgat 780 gttacattgc acaagataaa aatatatcat catgaacaat aaaactgtct gcttacataa 840 acagtaatac aaggggtgtt atgagccata ttcaacggga aacgtcttgc tcaaggccgc 900 gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc gataatgtcg 960 ggcaatcagg tgcgacaatc taccgattgt atgggaagcc cgatgcgcca gagttgtttc 1020 tgaaacatgg caaaggtagc gttgccaatg ttgttacaga tgagatggtc agactaaact 1080 ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact cctgatgatg 1140 catggttact caccactgcg atcccaggga aaacagcatt ccaggtatta gaagaatatc 1200 ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga 1260 ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat 1320 cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt aatggctggc 1380 ctgttgaaca agtctggaaa gaaatgcata aacttttgcc attctcaccg gattcagtcg 1440 tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa ttaataggtt 1500 gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc atcctatgga 1560 actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa tatggtattg 1620 ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt ttctaatcac 1680 tagaccaatg ttacacatat atactttaga ttgatttaaa acttcatttt taatttaaaa 1740 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 1800 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 1860 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 1920 tgccggatca agagctacca actcttcttc cgaaggtaac tggcttcagc agagcgcaga 1980 taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 2040 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 2100 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 2160 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 2220 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 2280 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 2340 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 2400 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 2460 ggttcctggc cttttgctgg ccttttgctc acatgagatc tcaaacaaac acatacagcg 2520 acttagttta cccgccaata tatcctgtca aggatcgtac ccctactcca aaaatgtcaa 2580 agatacagtc tcagaagacc aaagggctat tgagactttt caacaaaggg taatttcggg 2640 aaacctcctc ggattccatt gcccagctat ctgtcacttc atcgaaagga cagtagaaaa 2700 ggaaggtggc tcctacaaat gccatcattg cgataaagga aaggctatca ttcaagatgc 2760 ctctgccgac agtggtccca aagatggacc cccacccacg aggagcatcg tggaaaaaga 2820 agacgttcca accacgtctt caaagcaagt ggattgatgt gacatctcca ctgacgtaag 2880 ggatgacgca caatcccact atccttcgca agacccttcc tctatataag gaagttcatt 2940 tcatttggag aggacagccc aagctgatcc ctatgaaaaa gcctgaactc accgcgacgt 3000 ctgtcgagaa gtttctgatc gaaaagttcg acagcgtctc cgacctgatg cagctctcgg 3060 agggcgaaga atctcgtgct ttcagcttcg atgtaggagg gcgtggatat gtcctgcggg 3120 taaatagctg cgccgatggt ttctacaaag atcgttatgt ttatcggcac tttgcatcgg 3180 ccgcgctccc gattccggaa gtgcttgaca ttggggagtt cagcgagagc ctgacctatt 3240 gcatctcccg ccgtgcacag ggtgtcacgt tgcaagacct gcctgaaacc gaactgcccg 3300 ctgttcttca gccggtcgcg gaggctatgg atgcgatcgc tgcggccgat cttagccaga 3360 cgagcgggtt cggcccattc ggaccgcaag gaatcggtca atacactaca tggcgtgatt 3420 tcatatgcgc gattgctgat ccccatgtgt atcactggca aactgtgatg gacgacaccg 3480 tcagtgcgtc cgtcgcgcag gctctcgatg agctgatgct ttgggccgag gactgccccg 3540 aagtccggca cctcgtgcac gcggatttcg gctccaacaa tgtcctgacg gacaatggcc 3600 gcataacagc ggtcattgac tggagcgagg cgatgttcgg ggattcccaa tacgaggtcg 3660 ccaacatctt cttctggagg ccgtggttgg cttgtatgga gcagcagacg cgctacttcg 3720 agcggaggca tccggagctt gcaggatcgc cacgcctccg ggcgtatatg ctccgcattg 3780 gtcttgacca actctatcag agcttggttg acggcaattt cgatgatgca gcttgggcgc 3840 agggtcgatg cgacgcaatc gtccgatccg gagccgggac tgtcgggcgt acacaaatcg 3900 cccgcagaag cgcggccgtc tggaccgatg gctgtgtaga agtactcgcc gatagtggaa 3960 accgacgccc cagcactcgt ccgagggcaa aggaatagag tagatgccga ccgaacaaga 4020 gctgatttcg agaacgcctc agccagcaac tcgcgcgagc ctagcaaggc aaatgcgaga 4080 gaacggcctt acgcttggtg gcacagttct cgtccacagt tcgctaagct cgctcggctg 4140 gtcgcgggag aattaattcg gtacgctgaa atcaccagtc tctctctaca aatctatctc 4200 tctctatttt ctccataaat aatgtgtgag tagtttcccg ataagggaaa ttagggttct 4260 tatagggttt cgctcatgtg ttgagcatat aagaaaccct tagtatgtat ttgtatttgt 4320 aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagta ctaaaatcca 4380 gatcgatcct tcatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc 4440 gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg 4500 agcgaggaag cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt 4560 cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca 4620 attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat gacttccggc 4680 tcgtatgttg tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacca 4740 tgattacgcc aagctcggaa ttaaccctca ctaaagggaa caaaagctgg agctctggtc 4800 ccgcaggggc ggcggctgaa acatctgcac aagctactgc cacggcgcag agtagtggac 4860 gggcgacgcc gcaggcgact gcgaacccct ctagtgcagc ttcgcaacaa tctgtcgctg 4920 ctgcggcagc gacgccatct tctgcgaggg cgagtccgat gcctgctatg cacgcccaac 4980 agaatcccac tcagtcgcaa caagcccagc aagcgaatgc ggccatactt caagctgcga 5040 ttcaacaaca acaactacag cgacaacagc aacaatacca gcgcacgttg acccccattc 5100 agccacagaa gacgaactct caaggagggc aggtgcagat gcaggttcag ccgcaattgg 5160 ccgcaaatgg acaatatacg ttcacgacgc cgttcaatgc tgccgcattg cgagccgcaa 5220 cgcccttgac cgctagtcag caagctgctg ctcaacggat ggctgctgcc caagcaaatg 5280 cagctaaaat gagcgcgggg acccctgcac agaatgcagg cagtaacatt cacgtacagc 5340 cgtcaccgca acaagcccag gctcaaatcc aggtacagca gcagcagacg cttcaggtcc 5400 cgcaacagca acaggcgagg acaccacaaa tgcaaacgca gcagctacgg acgcctcaaa 5460 ttcaggctca gcaattacgg acgccacaga tgcaaacgca acagcttcag cgaacgcctc 5520 agatgcagac gcaacaactt caaccgacgc cgcagatgca gcctcagcag ctccagtctc 5580 aaatggggca gatgcaacgc cagccgactc ctcagcaaca tacgcctcag caacaacatg 5640 ctcaacttca gcctgtgcag gctcagcagt tagcgatggc ccagcagcaa cagcaacagc 5700 agcaaatgca ggctcaaatt cagcagcaac aaccacaaca agcgcatctg actccgcaac 5760 agtatcagca gtatcagatg tatagcaatt attatcaagc tgcggcggca atgcaacaac 5820 acgggggaca gagactgact ccgcaacaac aacaggcaat ttggaacgcg cagttccagc 5880 gtgctgctgc tgctgctggt atgcaggggc agcatggcgg ggtacctatg aaccaggtac 5940 aacaggctgc gctggccgca cacatagcga aacagcagca acaacagcaa cagcatcaag 6000 gtcaaggtcc acggtgaatg ggtttagctt cgtagatagt gtattagtat tttgtaatgg 6060 acattgggat tgggtgaaga caaacccgag aacgtcatct ttgtggagtg tttgttcgga 6120 tttggtgtga ggccgtgcaa gcttagtcag cagttagtgg aaaaggtgga ggtagaaaga 6180 gggcaaggga agttttcgtc tcctttctga tctggtacca ccatcatcac cccagcaaaa 6240 ctctctactc tcttagacct tcactttatc cttcactttt attctttttc aactcttttc 6300 gtttctcaag ttctactccc aaagtcgctc gtttctttcg aatttcacga aagactgcac 6360 aaaaagacgt atctttgcta gccctgcaag catcgaccac cgatatccac agcgattcaa 6420 gaacgattcg agttcaacaa atcttcaact aatgtaattc tctttctttt gggataagtt 6480 gaaacccgaa cgaggaacta atctttcact cggtgtagaa gcttatcgat accgtcgacc 6540 tcgagggggg gcccggtacc caccggatcc acaagtttgt acaaaaaagc tgaacgagaa 6600 acgtaaaatg atataaatat caatatatta aattagattt tgcataaaaa acagactaca 6660 taatactgta aaacacaaca tatccagtca ctatggcggc cgcattaggc accccaggct 6720 ttacacttta tgcttccggc tcgtataatg tgtggatttt gagttaggat ccggcgagat 6780 tttcaggagc taaggaagct aaaatggaga aaaaaatcac tggatatacc accgttgata 6840 tatcccaatg gcatcgtaaa gaacattttg aggcatttca gtcagttgct caatgtacct 6900 ataaccagac cgttcagctg gatattacgg cctttttaaa gaccgtaaag aaaaataagc 6960 acaagtttta tccggccttt attcacattc ttgcccgcct gatgaatgct catccggaat 7020 tccgtatggc aatgaaagac ggtgagctgg tgatatggga tagtgttcac ccttgttaca 7080 ccgttttcca tgagcaaact gaaacgtttt catcgctctg gagtgaatac cacgacgatt 7140 tccggcagtt tctacacata tattcgcaag atgtggcgtg ttacggtgaa aacctggcct 7200 atttccctaa agggtttatt gagaatatgt ttttcgtctc agccaatccc tgggtgagtt 7260 tcaccagttt tgatttaaac gtggccaata tggacaactt cttcgccccc gttttcacca 7320 tgggcaaata ttatacgcaa ggcgacaagg tgctgatgcc gctggcgatt caggttcatc 7380 atgccgtctg tgatggcttc catgtcggca gaatgcttaa tgaattacaa cagtactgcg 7440 atgagtggca gggcggggcg taaacgcgtg gatccggctt actaaaagcc agataacagt 7500 atgcgtattt gcgcgctgat ttttgcggta taagaatata tactgatatg tatacccgaa 7560 gtatgtcaaa aagaggtgtg ctatgaagca gcgtattaca gtgacagttg acagcgacag 7620 ctatcagttg ctcaaggcat atatgatgtc aatatctccg gtctggtaag cacaaccatg 7680 cagaatgaag cccgtcgtct gcgtgccgaa cgctggaaag cggaaaatca ggaagggatg 7740 gctgaggtcg cccggtttat tgaaatgaac ggctcttttg ctgacgagaa cagggactgg 7800 tgaaatgcag tttaaggttt acacctataa aagagagagc cgttatcgtc tgtttgtgga 7860 tgtacagagt gatattattg acacgcccgg gcgacggatg gtgatccccc tggccagtgc 7920 acgtctgctg tcagataaag tctcccgtga actttacccg gtggtgcata tcggggatga 7980 aagctggcgc atgatgacca ccgatatggc cagtgtgccg gtctccgtta tcggggaaga 8040 agtggctgat ctcagccacc gcgaaaatga catcaaaaac gccattaacc tgatgttctg 8100 gggaatataa atgtcaggct cccttataca cagccagtct gcaggtcgac catagtgact 8160 ggatatgttg tgttttacag tattatgtag tctgtttttt atgcaaaatc taatttaata 8220 tattgatatt tatatcattt tacgtttctc gttcagcttt cttgtacaaa gtggtgctcg 8280 agatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg 8340 acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct 8400 acggcaagct gaccctgaag ctgatctgca ccaccggcaa gctgcccgtg ccctggccca 8460 ccctcgtgac caccctgggc tacggcctgc agtgcttcgc ccgctacccc gaccacatga 8520 agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct 8580 tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc 8640 tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc 8700 acaagctgga gtacaactac aacagccaca acgtctatat caccgccgac aagcagaaga 8760 acggcatcaa ggccaacttc aagatccgcc acaacatcga ggacggcggc gtgcagctcg 8820 ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc 8880 actacctgag ctaccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg 8940 tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt 9000 aagtcgacct gcaggcatgc gctgaaatca ccagtctctc tctacaaatc tatctctctc 9060 tataataatg tgtgagtagt tcccagataa gggaattagg gttcttatag ggtttcgctc 9120 atgtgttgag catataagaa acccttagta tgtatttgta tttgtaaaat acttctatca 9180 ataaaatttc taattcctaa aaccaaaatc cagtgggtac ccaattcgcc ctatagtgag 9240 tcgtattaca attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt 9300 acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag 9360 gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg gcgcgaaatt 9420 gtaaacgtta atgttaacgt tacaccacaa tatatcctgc ca 9462 <210> 20 <211> 8067 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 20 agatctctaa ttccggggat cggaaatcca gaagcccgag aggttgccgc ctttcgggct 60 ttttcttttt caaaaaaaaa aatttataaa acgatctgtt gcggccggcc gccgggttgt 120 gggcaaaggc gctggcgctc gacggtgggc aaccgcttgc ggttgtccac gggcggagcc 180 ggtgcgcgta gcgcattgtc cacaagccaa gggcgaccaa taattgatat atatattcat 240 aattgaaaag ctaattgaac atactacttg ctgtaactac ttgccggagc gaggggtgtt 300 tgcaagctgt tgatctgaaa gggctattag cgttctcacg tgcctttttg attagcgatt 360 tcacgtgacc ttattagcga tttcacgtac tccgattagc gatttcacgt accctgatta 420 gcgatttcac gtggatagtt tttggagcgg gccggaaagc cccgtgaatc aaggctttgc 480 ggggcattag cggtttcacg tggataacta ccctctatcc acaggcttcc ggggataaaa 540 aagcccgctc gacggcgggc tgttggatgg ggatcgcctg aatcgcccca tcatccagcc 600 agaaagtgag ggagccacgg ttgatgagag ctttgttgta ggtggaccag ttggtgattt 660 tgaacttttg ctttgccacg gaacggtctg cgttgtcggg aagatgcgtg atctgatcct 720 tcaactcagc aaaagttcga tttattcaac aaagccacgt tgtgtctcaa aatctctgat 780 gttacattgc acaagataaa aatatatcat catgaacaat aaaactgtct gcttacataa 840 acagtaatac aaggggtgtt atgagccata ttcaacggga aacgtcttgc tcaaggccgc 900 gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc gataatgtcg 960 ggcaatcagg tgcgacaatc taccgattgt atgggaagcc cgatgcgcca gagttgtttc 1020 tgaaacatgg caaaggtagc gttgccaatg ttgttacaga tgagatggtc agactaaact 1080 ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact cctgatgatg 1140 catggttact caccactgcg atcccaggga aaacagcatt ccaggtatta gaagaatatc 1200 ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga 1260 ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat 1320 cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt aatggctggc 1380 ctgttgaaca agtctggaaa gaaatgcata aacttttgcc attctcaccg gattcagtcg 1440 tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa ttaataggtt 1500 gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc atcctatgga 1560 actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa tatggtattg 1620 ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt ttctaatcac 1680 tagaccaatg ttacacatat atactttaga ttgatttaaa acttcatttt taatttaaaa 1740 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 1800 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 1860 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 1920 tgccggatca agagctacca actcttcttc cgaaggtaac tggcttcagc agagcgcaga 1980 taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 2040 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 2100 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 2160 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 2220 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 2280 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 2340 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 2400 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 2460 ggttcctggc cttttgctgg ccttttgctc acatgagatc tcaaacaaac acatacagcg 2520 acttagttta cccgccaata tatcctgtca aggatcgtac ccctactcca aaaatgtcaa 2580 agatacagtc tcagaagacc aaagggctat tgagactttt caacaaaggg taatttcggg 2640 aaacctcctc ggattccatt gcccagctat ctgtcacttc atcgaaagga cagtagaaaa 2700 ggaaggtggc tcctacaaat gccatcattg cgataaagga aaggctatca ttcaagatgc 2760 ctctgccgac agtggtccca aagatggacc cccacccacg aggagcatcg tggaaaaaga 2820 agacgttcca accacgtctt caaagcaagt ggattgatgt gacatctcca ctgacgtaag 2880 ggatgacgca caatcccact atccttcgca agacccttcc tctatataag gaagttcatt 2940 tcatttggag aggacagccc aagctgatcc ctatgaaaaa gcctgaactc accgcgacgt 3000 ctgtcgagaa gtttctgatc gaaaagttcg acagcgtctc cgacctgatg cagctctcgg 3060 agggcgaaga atctcgtgct ttcagcttcg atgtaggagg gcgtggatat gtcctgcggg 3120 taaatagctg cgccgatggt ttctacaaag atcgttatgt ttatcggcac tttgcatcgg 3180 ccgcgctccc gattccggaa gtgcttgaca ttggggagtt cagcgagagc ctgacctatt 3240 gcatctcccg ccgtgcacag ggtgtcacgt tgcaagacct gcctgaaacc gaactgcccg 3300 ctgttcttca gccggtcgcg gaggctatgg atgcgatcgc tgcggccgat cttagccaga 3360 cgagcgggtt cggcccattc ggaccgcaag gaatcggtca atacactaca tggcgtgatt 3420 tcatatgcgc gattgctgat ccccatgtgt atcactggca aactgtgatg gacgacaccg 3480 tcagtgcgtc cgtcgcgcag gctctcgatg agctgatgct ttgggccgag gactgccccg 3540 aagtccggca cctcgtgcac gcggatttcg gctccaacaa tgtcctgacg gacaatggcc 3600 gcataacagc ggtcattgac tggagcgagg cgatgttcgg ggattcccaa tacgaggtcg 3660 ccaacatctt cttctggagg ccgtggttgg cttgtatgga gcagcagacg cgctacttcg 3720 agcggaggca tccggagctt gcaggatcgc cacgcctccg ggcgtatatg ctccgcattg 3780 gtcttgacca actctatcag agcttggttg acggcaattt cgatgatgca gcttgggcgc 3840 agggtcgatg cgacgcaatc gtccgatccg gagccgggac tgtcgggcgt acacaaatcg 3900 cccgcagaag cgcggccgtc tggaccgatg gctgtgtaga agtactcgcc gatagtggaa 3960 accgacgccc cagcactcgt ccgagggcaa aggaatagag tagatgccga ccgaacaaga 4020 gctgatttcg agaacgcctc agccagcaac tcgcgcgagc ctagcaaggc aaatgcgaga 4080 gaacggcctt acgcttggtg gcacagttct cgtccacagt tcgctaagct cgctcggctg 4140 gtcgcgggag aattaattcg gtacgctgaa atcaccagtc tctctctaca aatctatctc 4200 tctctatttt ctccataaat aatgtgtgag tagtttcccg ataagggaaa ttagggttct 4260 tatagggttt cgctcatgtg ttgagcatat aagaaaccct tagtatgtat ttgtatttgt 4320 aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagta ctaaaatcca 4380 gatcgatcct tcatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc 4440 gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg 4500 agcgaggaag cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt 4560 cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca 4620 attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat gacttccggc 4680 tcgtatgttg tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacca 4740 tgattacgcc aagctcggaa ttaaccctca ctaaagggaa caaaagctgg agctcgaggt 4800 ccgcaagtag attgaaagtt cagtacgttt ttaacaatag agcattctcg aggcttgcgt 4860 cattctgtgt caggctagca gtttataagc gttgaggatc tagagctgct gtttccgcgt 4920 ctcgaatgtt ctcggtgttt aggggttagc aatctgatat gataataatt tgtgatgaca 4980 tcgatagtac aaaaacccca attccggtca catccacctc tccgttttct cccatctaca 5040 cacaacaagc ttatcgccgt aattctcttt cttttgggat aagttgaaac ccgaacgagg 5100 aactaatctt tcactcggtg tagaagctta tcgataccgt cgacctcgag ggggggcccg 5160 gtacccaccg gatccacaag tttgtacaaa aaagctgaac gagaaacgta aaatgatata 5220 aatatcaata tattaaatta gattttgcat aaaaaacaga ctacataata ctgtaaaaca 5280 caacatatcc agtcactatg gcggccgcat taggcacccc aggctttaca ctttatgctt 5340 ccggctcgta taatgtgtgg attttgagtt aggatccggc gagattttca ggagctaagg 5400 aagctaaaat ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc 5460 gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc 5520 agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg 5580 cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattccgt atggcaatga 5640 aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc 5700 aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac 5760 acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt 5820 ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt 5880 taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata 5940 cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtctgtgatg 6000 gcttccatgt cggcagaatg cttaatgaat tacaacagta ctgcgatgag tggcagggcg 6060 gggcgtaaac gcgtggatcc ggcttactaa aagccagata acagtatgcg tatttgcgcg 6120 ctgatttttg cggtataaga atatatactg atatgtatac ccgaagtatg tcaaaaagag 6180 gtgtgctatg aagcagcgta ttacagtgac agttgacagc gacagctatc agttgctcaa 6240 ggcatatatg atgtcaatat ctccggtctg gtaagcacaa ccatgcagaa tgaagcccgt 6300 cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag ggatggctga ggtcgcccgg 6360 tttattgaaa tgaacggctc ttttgctgac gagaacaggg actggtgaaa tgcagtttaa 6420 ggtttacacc tataaaagag agagccgtta tcgtctgttt gtggatgtac agagtgatat 6480 tattgacacg cccgggcgac ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga 6540 taaagtctcc cgtgaacttt acccggtggt gcatatcggg gatgaaagct ggcgcatgat 6600 gaccaccgat atggccagtg tgccggtctc cgttatcggg gaagaagtgg ctgatctcag 6660 ccaccgcgaa aatgacatca aaaacgccat taacctgatg ttctggggaa tataaatgtc 6720 aggctccctt atacacagcc agtctgcagg tcgaccatag tgactggata tgttgtgttt 6780 tacagtatta tgtagtctgt tttttatgca aaatctaatt taatatattg atatttatat 6840 cattttacgt ttctcgttca gctttcttgt acaaagtggt gctcgagatg gtgagcaagg 6900 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 6960 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 7020 tgaagctgat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 7080 tgggctacgg cctgcagtgc ttcgcccgct accccgacca catgaagcag cacgacttct 7140 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 7200 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 7260 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 7320 actacaacag ccacaacgtc tatatcaccg ccgacaagca gaagaacggc atcaaggcca 7380 acttcaagat ccgccacaac atcgaggacg gcggcgtgca gctcgccgac cactaccagc 7440 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagctacc 7500 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 7560 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaagtc gacctgcagg 7620 catgcgctga aatcaccagt ctctctctac aaatctatct ctctctataa taatgtgtga 7680 gtagttccca gataagggaa ttagggttct tatagggttt cgctcatgtg ttgagcatat 7740 aagaaaccct tagtatgtat ttgtatttgt aaaatacttc tatcaataaa atttctaatt 7800 cctaaaacca aaatccagtg ggtacccaat tcgccctata gtgagtcgta ttacaattca 7860 ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca acttaatcgc 7920 cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg caccgatcgc 7980 ccttcccaac agttgcgcag cctgaatggc gaatggcgcg aaattgtaaa cgttaatgtt 8040 aacgttacac cacaatatat cctgcca 8067 <210> 21 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 21 Gly Val Asp Ile Gly Thr Gly Ala Ser 1 5

Claims (107)

  1. 유전적으로 변형된 유기체로서, 유전적 변형이 없는 필적할만한 대조군 유기체에서 동일한 화합물의 생산과 비교하여,
    Figure pct00063
    (화학식 I, 디메틸트립타민(DMT)),
    Figure pct00064
    (화학식 III, 실로신)로부터 선택된 화합물, 및 이의 유도체 또는 유사체의 증가된 생산을 초래하는 유전적 변형을 포함하는, 유전적으로 변형된 유기체.
  2. 유전적으로 변형된 유기체로서, 유전적 변형이 없는 필적할만한 대조군 유기체에서 동일한 화합물의 생산과 비교하여,
    Figure pct00065
    (화학식 I, 디메틸트립타민(DMT)),
    Figure pct00066
    (화학식 II, 실로시빈),
    Figure pct00067
    (화학식 III, 실로신),
    Figure pct00068
    (화학식 IV, 트립타민)로부터 선택된 화합물, 및 이의 유도체 또는 유사체의 증가된 생산을 초래하되, 상기 유전적으로 변형된 유기체는 균류이고 상기 균류는 담자균 분열로부터 유래하는, 유전적으로 변형된 유기체.
  3. 제1항에 있어서, 상기 유기체는 균류인, 유전적으로 변형된 유기체.
  4. 제2항 또는 제3항에 있어서, 상기 균류는 실로사이베, 코노사이베, 짐노필루스, 파나에올루스, 플루테우스 및 스트로파리아로 구성된 군으로부터 선택되는, 유전적으로 변형된 유기체.
  5. 제4항에 있어서, 상기 균류는 파나에올루스 시아네세센스인, 유전적으로 변형된 유기체.
  6. 제4항에 있어서, 상기 균류는 파나에올루스 쿠벤시스인, 유전적으로 변형된 유기체.
  7. 제4항에 있어서, 상기 균류는 플레우로투스 네브로덴시스인, 유전적으로 변형된 유기체.
  8. 제1항 또는 제2항에 있어서, 상기 유전적 변형은 다음 중 적어도 하나를 초래하는, 유전적으로 변형된 유기체:
    a. 증가된 트립토판 탈카르복실화,
    b. 증가된 트립타민 4-하이드록실화,
    c. 증가된 4-하이드록시트립타인 O-인산화, 및
    d. 순차적 N-메틸화를 통한 증가된 실로시빈 생산.
  9. 제8항에 있어서, 상기 유전적 변형은 유전자의 상향조절된 발현을 초래하는, 유전적으로 변형된 유기체.
  10. 제9항에 있어서, 상기 유전자는 트립토판 데카르복실라제 유전자, 실로시빈-관련된 하이드록실라제 유전자, 실로시빈-관련된 N-메틸트랜스퍼라제 유전자 또는 실로시빈-관련된 포스포트랜스퍼라제 유전자인, 유전적으로 변형된 유기체.
  11. 제9항에 있어서, 상기 유전자는 PsiD, PsiM, PsiH 또는 PsiK인, 유전적으로 변형된 유기체.
  12. 제9항에 있어서, 상기 유전자는 서열번호: 1에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  13. 제9항에 있어서, 상기 유전자는 서열번호: 2에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  14. 제9항에 있어서, 상기 유전자는 서열번호: 3에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  15. 제9항에 있어서, 상기 유전자는 서열번호: 4에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  16. 제9항에 있어서, 상기 유전자는 서열번호: 5에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  17. 제9항에 있어서, 상기 유전자는 서열번호: 6에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  18. 제9항에 있어서, 상기 유전자는 서열번호: 7에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  19. 제9항에 있어서, 상기 유전자는 서열번호: 8에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  20. 제9항에 있어서, 상기 유전자는 서열번호: 9에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  21. 제9항에 있어서, 상기 유전자는 서열번호: 10에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  22. 제9항에 있어서, 상기 유전자는 서열번호: 11에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  23. 제9항에 있어서, 상기 유전자는 서열번호: 12에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  24. 제9항에 있어서, 상기 유전자는 서열번호: 13에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  25. 제9항에 있어서, 상기 유전자는 서열번호: 14에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 유전적으로 변형된 유기체.
  26. 제9항 내지 제25항 중 어느 한 항에 있어서, 상기 유전자의 발현은 상기 유전적 변형이 없는 필적할만한 대조군 유기체와 비교하여 상기 유전적으로 변형된 유기체에서 적어도 1.1, 적어도 1.2, 적어도 1.5, 적어도 2, 적어도 2.5, 적어도 3, 적어도 3.5, 적어도 4, 또는 적어도 5배까지 상향조절되는, 유전적으로 변형된 유기체.
  27. 제1항 또는 제2항에 있어서, 상기 유전적으로 변형된 유기체는 외인성 뉴클레오티드를 포함하는, 유전적으로 변형된 유기체.
  28. 제27항에 있어서, 상기 외인성 뉴클레오티드는 시스-작용 프로모터 서열을 포함하는, 유전적으로 변형된 유기체.
  29. 제27항에 있어서, 상기 외인성 뉴클레오티드는 상기 외인성 뉴클레오티드가 없는 필적할만한 대조군 유기체와 비교하여 상기 유전적으로 변형된 유기체에서 증가된 트립토판 탈카르복실화, 트립타민 4-하이드록실화, 4-하이드록시트립타인 O-인산화, 또는 실로신 중간체 없이 순차적 N-메틸화를 통한 실로시빈 생산을 초래하는, 유전적으로 변형된 유기체.
  30. 제27항에 있어서, 상기 외인성 뉴클레오티드는 상기 외인성 뉴클레오티드가 없는 필적할만한 대조군 유기체와 비교하여 상기 유전적으로 변형된 유기체에서 (i) 트립토판 데카르복실라제 유전자, 실로시빈-관련된 하이드록실라제 유전자, 실로시빈-관련된 N-메틸트랜스퍼라제 유전자, 또는 실로시빈-관련된 포스포트랜스퍼라제 유전자의 상향조절된 발현; (ii) 비-실로시빈 트립타민의 감소된 합성; 또는 (iii) 트립토판의 증가된 생산을 초래하는, 유전적으로 변형된 유기체.
  31. 제27항에 있어서, 상기 외인성 뉴클레오티드는 PLP-비의존적 포스파티딜세린 데카르복실라제, 트립토판 데카르복실라제(TDC), 추정 모노옥시게나제(putative monooxygenase), 5-메틸티온리보스 패밀리 소분자 키나제, 또는 4-하이드록시트립타민 키나제를 인코딩하는, 유전적으로 변형된 유기체.
  32. 제27항 내지 제31항 중 어느 한 항에 있어서, 상기 뉴클레오티드는 플라스미드에 합체되는, 유전적으로 변형된 유기체.
  33. 제32항에 있어서, 상기 플라스미드는 pGWB5 또는 pGHGWY인, 유전적으로 변형된 유기체.
  34. 제32항에 있어서, 상기 플라스미드는 전기천공, 미세주입, 기계적 세포 변형, 지질 나노입자, AAV, 렌티바이러스, 아그로박테리움 매개된 형질전환, 바이오리스틱 입자 충격 또는 원형질체 형질전환을 통해 상기 유전적으로 변형된 유기체 내로 전달되는, 유전적으로 변형된 유기체.
  35. 제32항에 있어서, 상기 플라스미드는 바코드, 리포터 유전자, 또는 선별 마커를 추가로 포함하는, 유전적으로 변형된 유기체.
  36. 제32항에 있어서, 상기 플라스미드는 프로모터를 추가로 포함하는, 유전적으로 변형된 유기체.
  37. 제36항에 있어서, 상기 프로모터는 35S, GPD, EF1a, 액틴 또는 CcDED1인, 유전적으로 변형된 유기체.
  38. 제1항 내지 제37항 중 어느 한 항의 유전적으로 변형된 유기체의 추출물을 포함하는 약학적 조성물.
  39. 제38항에 있어서, 약학적으로 허용가능한 부형제, 희석제 또는 담체를 추가로 포함하는, 약학적 조성물.
  40. 제1항 내지 제37항 중 어느 한 항의 유전적으로 변형된 유기체의 추출물을 포함하는 기능식품 조성물.
  41. 제1항 내지 제37항 중 어느 한 항의 유전적으로 변형된 유기체의 추출물을 포함하는 식품 보충제 조성물.
  42. 유기체에서
    Figure pct00069
    (화학식 I, DMT),
    Figure pct00070
    (화학식 III, 실로신), 또는 이의 유도체 또는 유사체의 생산을 증가시키는 방법으로서, 상기 방법은 상기 유기체에 유전적 변형을 도입하는 것을 포함하되, 상기 유전적 변형은 상기 변형이 없는 필적할만한 대조군 유기체와 비교하여 동일한 화합물의 증가된 생산을 초래하는, 방법.
  43. 유기체에서
    Figure pct00071
    (화학식 I, DMT),
    Figure pct00072
    (화학식 II, 실로시빈),
    Figure pct00073
    (화학식 III, 실로신),
    Figure pct00074
    (화학식 IV, 트립타민), 또는 이의 유도체 또는 유사체의 생산을 증가시키는 방법으로서, 상기 방법은 상기 유기체의 유전적 변형을 도입하는 것을 포함하고, 여기서 상기 유전적 변형은 상기 변형이 없는 필적할만한 대조군 유기체와 비교하여 동일한 화합물의 증가된 생산을 초래하고, 상기 유기체는 균류이고 균류는 담자균 분열로부터 유래하는, 방법.
  44. 제42항에 있어서, 상기 유기체는 균류인, 방법.
  45. 제43항 또는 제44항에 있어서, 상기 균류는 실로사이베, 코노사이베, 짐노필루스, 파나에올루스, 플루테우스 및 스트로파리아로 구성된 군으로부터 선택되는, 방법.
  46. 제45항에 있어서, 상기 균류는 파나에올루스 시아네세센스인, 방법.
  47. 제45항에 있어서, 상기 균류는 파나에올루스 쿠벤시스인, 방법.
  48. 제45항에 있어서, 상기 균류는 플레우로투스 네브로덴시스인, 방법.
  49. 제42항 또는 제43항에 있어서, 상기 유전적 변형은 다음 중 적어도 하나를 초래하는, 방법:
    a. 증가된 트립토판 탈카르복실화,
    b. 증가된 트립타민 4-하이드록실화,
    c. 증가된 4-하이드록시트립타인 O-인산화, 및
    d. 순차적 N-메틸화를 통한 증가된 실로시빈 생산.
  50. 제49항에 있어서, 상기 유전적 변형은 유전자의 상향조절된 발현을 초래하는, 방법.
  51. 제50항에 있어서, 상기 유전자는 트립토판 데카르복실라제 유전자, 실로시빈-관련된 하이드록실라제 유전자, 실로시빈-관련된 N-메틸트랜스퍼라제 유전자 또는 실로시빈-관련된 포스포트랜스퍼라제 유전자인, 방법.
  52. 제50항에 있어서, 상기 유전자는 PsiD, PsiM, PsiH, 또는 PsiK인, 방법.
  53. 제50항에 있어서, 상기 유전자는 서열번호: 1에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  54. 제50항에 있어서, 상기 유전자는 서열번호: 2에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  55. 제50항에 있어서, 상기 유전자는 서열번호: 3에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  56. 제50항에 있어서, 상기 유전자는 서열번호: 4에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  57. 제50항에 있어서, 상기 유전자는 서열번호: 5에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  58. 제50항에 있어서, 상기 유전자는 서열번호: 6에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  59. 제50항에 있어서, 상기 유전자는 서열번호: 7에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  60. 제50항에 있어서, 상기 유전자는 서열번호: 8에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  61. 제50항에 있어서, 상기 유전자는 서열번호: 9에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  62. 제50항에 있어서, 상기 유전자는 서열번호: 10에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  63. 제50항에 있어서, 상기 유전자는 서열번호: 11에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  64. 제50항에 있어서, 상기 유전자는 서열번호: 12에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  65. 제50항에 있어서, 상기 유전자는 서열번호: 13에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  66. 제50항에 있어서, 상기 유전자는 서열번호: 14에 대해 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일성을 포함하는, 방법.
  67. 제50항 내지 제66항 중 어느 한 항에 있어서, 상기 유전자의 발현은 상기 유전적 변형이 없는 필적할만한 대조군 유기체와 비교하여 상기 유전적으로 변형된 유기체에서 적어도 1.1, 적어도 1.2, 적어도 1.5, 적어도 2, 적어도 2.5, 적어도 3, 적어도 3.5, 적어도 4, 또는 적어도 5배까지 상향조절되는, 방법.
  68. 제42항 또는 제43항에 있어서, 상기 유전적 변형을 도입하는 단계는 외인성 뉴클레오티드를 도입하는 단계를 포함하는, 방법.
  69. 제68항에 있어서, 상기 외인성 뉴클레오티드는 시스-작용 프로모터 서열을 포함하는, 방법.
  70. 제68항에 있어서, 상기 외인성 뉴클레오티드는 상기 외인성 뉴클레오티드가 없는 필적할만한 대조군 유기체와 비교하여 상기 유전적으로 변형된 유기체에서 증가된 트립토판 탈카르복실화, 트립타민 4-하이드록실화, 4-하이드록시트립타인 O-인산화, 또는 실로신 중간체 없이 순차적 N-메틸화를 통한 실로시빈 생산을 초래하는, 방법.
  71. 제68항에 있어서, 상기 외인성 뉴클레오티드는 상기 외인성 뉴클레오티드가 없는 필적할만한 대조군 유기체와 비교하여 상기 유전적으로 변형된 유기체에서 (i) 트립토판 데카르복실라제 유전자, 실로시빈-관련된 하이드록실라제 유전자, 실로시빈-관련된 N-메틸트랜스퍼라제 유전자, 또는 실로시빈-관련된 포스포트랜스퍼라제 유전자의 상향조절된 발현; (ii) 비-실로시빈 트립타민의 감소된 합성; 또는 (iii) 트립토판의 증가된 생산을 초래하는, 방법.
  72. 제68항에 있어서, 상기 외인성 뉴클레오티드는 PLP-비의존적 포스파티딜세린 데카르복실라제, 트립토판 데카르복실라제(TDC), 추정 모노옥시게나제, 5-메틸티온리보스 패밀리 소분자 키나제, 또는 4-하이드록시트립타민 키나제를 인코딩하는, 방법.
  73. 제68항 내지 제72항 중 어느 한 항에 있어서, 상기 뉴클레오티드는 플라스미드 내로 통합되는, 방법.
  74. 제73항에 있어서, 상기 플라스미드는 pGWB5 또는 pGHGWY인, 방법.
  75. 제73항에 있어서, 상기 플라스미드는 전기천공, 미세주입, 기계적 세포 변형, 지질 나노입자, AAV, 렌티바이러스, 아그로박테리움 매개된 형질전환, 바이오리스틱 입자 충격 또는 원형질체 형질전환을 통해 상기 유전적으로 변형된 유기체 내로 전달되는, 방법.
  76. 제73항에 있어서, 상기 플라스미드는 바코드, 리포터 유전자, 또는 선별 마커를 추가로 포함하는, 방법.
  77. 제73항에 있어서, 상기 플라스미드는 프로모터를 추가로 포함하는, 방법.
  78. 제77항에 있어서, 상기 프로모터는 35S, GPD, EF1a, 액틴 또는 CcDED1인, 방법.
  79. 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 유전적 변형은 유기체의 세포를 엔도뉴클레아제 시스템과 접촉시킴에 의해 수행되는, 유전적으로 변형된 유기체.
  80. 제79항에 있어서, 상기 엔도뉴클레아제 시스템은 CRISPR 효소, TALE-뉴클레아제, 트랜스포존-기반 뉴클레아제, 아연 핑거 뉴클레아제, 메가뉴클레아제, 메가-TAL 또는 DNA 가이드된 뉴클레아제를 포함하는, 유전적으로 변형된 유기체.
  81. 제80항에 있어서, 상기 DNA-가이드된 뉴클레아제는 아르고노트를 포함하는, 유전적으로 변형된 유기체.
  82. 제79항에 있어서, 상기 엔도뉴클레아제 시스템은 CRISPR 효소 및 상기 유전자 또는 이와 연관된 상기 프로모터 또는 인핸서 내 또는 이에 인접하여 표적 서열과 혼성화하는 가이드 폴리뉴클레오티드를 포함하는, 유전적으로 변형된 유기체.
  83. 제82항에 있어서, 상기 표적 서열은 길이가 적어도 18개 뉴클레오티드, 적어도 19개 뉴클레오티드, 적어도 20개 뉴클레오티드, 적어도 21개 뉴클레오티드, 또는 적어도 22개 뉴클레오티드인, 유전적으로 변형된 유기체.
  84. 제82항에 있어서, 상기 표적 서열은 길이가 최대 17개 뉴클레오티드인, 유전적으로 변형된 유기체.
  85. 제82항 내지 제84항 중 어느 한 항에 있어서, 상기 표적 서열은 서열번호: 1 내지 14 중 적어도 하나 또는 이의 상보체와 혼성화할 수 있는, 유전적으로 변형된 유기체.
  86. 제82항 내지 제85항 중 어느 한 항에 있어서, 상기 가이드 폴리뉴클레오티드는 화학적으로 변형되는, 유전적으로 변형된 유기체.
  87. 제82항 내지 제85항 중 어느 한 항에 있어서, 상기 가이드 폴리뉴클레오티드는 단일 가이드 RNA(sgRNA)인, 유전적으로 변형된 유기체.
  88. 제82항 내지 제85항 중 어느 한 항에 있어서, 상기 가이드 폴리뉴클레오티드는 RNA 및 DNA를 포함하는 키메라 단일 가이드인, 유전적으로 변형된 유기체.
  89. 제82항 내지 제85항 중 어느 한 항에 있어서, 상기 가이드 폴리뉴클레오티드는 서열번호: 1 내지 14 중 적어도 하나 또는 이의 상보체와 혼성화할 수 있는, 유전적으로 변형된 유기체.
  90. 제82항 내지 제90항 중 어느 한 항에 있어서, 상기 CRISPR 효소는 Cas 단백질 또는 이의 변이체 또는 유도체인, 유전적으로 변형된 유기체.
  91. 제90항에 있어서, Cas 단백질은 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5d, Cas5t, Cas5h, Cas5a, Cas6, Cas7, Cas8, Cas9, Cas10, Csy1 , Csy2, Csy3, Csy4, Cse1, Cse2, Cse3, Cse4, Cse5e, Csc1, Csc2, Csa5, Csn1, Csn2, Csm1, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx1S, Csf1, Csf2, CsO, Csf4, Csd1, Csd2, Cst1, Cst2, Csh1, Csh2, Csa1, Csa2, Csa3, Csa4, Csa5, C2c1, C2c2, C2c3, Cpf1, CARF, DinG, 이의 상동체 또는 이의 변형된 버전을 포함하는, 유전적으로 변형된 유기체.
  92. 제90항 또는 제91항에 있어서, 상기 Cas 단백질은 Cas9인, 유전적으로 변형된 유기체.
  93. 제92항에 있어서, 상기 Cas9는 규범적 PAM에 결합하는 변형된 Cas9인, 유전적으로 변형된 유기체.
  94. 제92항에 있어서, 상기 Cas9는 비-규범적 PAM을 인식하는, 유전적으로 변형된 유기체.
  95. 제82항 내지 제94항 중 어느 한 항에 있어서, 상기 가이드 폴리뉴클레오티드는 PAM의 상기 표적 서열 3 내지 10개 뉴클레오티드에 결합하는, 유전적으로 변형된 유기체.
  96. 제95항에 있어서, 상기 가이드 폴리뉴클레오티드와 커플링된 상기 CRISPR 효소는 RNP에 의해 상기 유전적으로 변형된 유기체 내로 전달되는, 유전적으로 변형된 유기체.
  97. 제95항에 있어서, 상기 가이드 폴리뉴클레오티드와 커플링된 상기 CRISPR 효소는 상기 CRISPR 효소 및 상기 가이드 폴리뉴클레오티드를 인코딩하는 mRNA에 의해 상기 유전적으로 변형된 유기체 내로 전달되는, 유전적으로 변형된 유기체.
  98. 제95항에 있어서, 상기 가이드 폴리뉴클레오티드와 커플링된 상기 CRISPR 효소는 상기 CRISPR 효소 및 상기 가이드 폴리뉴클레오티드를 인코딩하는 핵산을 포함하는 벡터에 의해 상기 유전적으로 변형된 유기체 내로 전달되는, 유전적으로 변형된 유기체.
  99. 제98항에 있어서, 상기 벡터는 이원 벡터 또는 Ti 플라스미드인, 유전적으로 변형된 유기체.
  100. 제98항에 있어서, 상기 벡터는 선별 마커 또는 리포터 유전자를 추가로 포함하는, 유전적으로 변형된 유기체.
  101. 제96항 내지 제100항 중 어느 한 항에 있어서, 상기 RNP, 복합체, 또는 벡터가 전기천공, 미세주사, 기계적 세포 변형, 지질 나노입자, AAV, 렌티바이러스, 아그로박테리움 매개된 형질전환, 바이오리스틱 입자 충격, 또는 원형질체 형질전환을 통해 전달되는, 유전적으로 변형된 유기체.
  102. 제96항 내지 제100항 중 어느 한 항에 있어서, 상기 RNP, mRNA, 또는 벡터는 공여자 폴리뉴클레오티드 또는 공여자 폴리뉴클레오티드를 인코딩하는 핵산을 추가로 포함하는, 유전적으로 변형된 유기체.
  103. 제102항에 있어서, 상기 공여자 폴리뉴클레오티드는 상기 표적 서열에 측접하는 서열에 대한 상동성을 포함하는, 유전적으로 변형된 유기체.
  104. 제102항 또는 제103항에 있어서, 상기 공여자 폴리뉴클레오티드는 바코드, 리포터 유전자, 또는 선별 마커를 추가로 포함하는, 유전적으로 변형된 유기체.
  105. 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 유전적으로 변형된 유기체는 다세포 유기체인, 유전적으로 변형된 유기체로부터 단리된 세포.
  106. 유전적으로 변형된 담자균 균류 세포로서, 상기 유전적 변형이 없는 필적할만한 대조군 담자균 균류 세포에서 동일한 화합물의 생산과 비교하여,
    Figure pct00075
    (화학식 I, 디메틸트립타민(DMT)),
    Figure pct00076
    (화학식 II, 실로시빈),
    Figure pct00077
    (화학식 III, 실로신), 및
    Figure pct00078
    (화학식 IV, 트립타민)으로부터 선택된 화합물, 및 이의 유도체 또는 유사체의 증가된 생산을 초래하는 유전적 변형을 포함하는, 유전적으로 변형된 담자균 균류 세포.
  107. 제106항에 있어서, 상기 세포는 실로사이베, 코노사이베, 짐노필루스, 파나에올루스, 플루테우스 및 스트로파리아로 구성된 군으로부터 선택된 균류의 것인, 유전적으로 변형된 담자균 균류 세포.
KR1020227014270A 2019-10-01 2020-10-01 트립타민 발현을 조절하는 균류의 유전자 공학 KR20220092509A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962909159P 2019-10-01 2019-10-01
US62/909,159 2019-10-01
PCT/US2020/053842 WO2021067626A2 (en) 2019-10-01 2020-10-01 Genetic engineering of fungi to modulate tryptamine expression

Publications (1)

Publication Number Publication Date
KR20220092509A true KR20220092509A (ko) 2022-07-01

Family

ID=75337560

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227014270A KR20220092509A (ko) 2019-10-01 2020-10-01 트립타민 발현을 조절하는 균류의 유전자 공학

Country Status (9)

Country Link
US (2) US20220306997A1 (ko)
EP (1) EP4038192A4 (ko)
JP (1) JP2022550463A (ko)
KR (1) KR20220092509A (ko)
CN (1) CN114787363A (ko)
AU (1) AU2020358720A1 (ko)
CA (1) CA3152752A1 (ko)
IL (1) IL291839A (ko)
WO (1) WO2021067626A2 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2021276656A1 (en) 2020-05-19 2022-11-24 Cybin Irl Limited Deuterated tryptamine derivatives and methods of use
WO2023015279A1 (en) * 2021-08-05 2023-02-09 Miami University Methods for the production of methylated tryptamine derivatives, intermediates or side products
WO2023130075A2 (en) * 2021-12-31 2023-07-06 Empyrean Neuroscience, Inc. Genetically modified organisms for producing psychotropic alkaloids
WO2023164092A1 (en) * 2022-02-25 2023-08-31 Parow Entheobiosciences Llc Treatment of psychiatric disorders, brain injuries, and autism spectrum disorder

Family Cites Families (150)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
LU36879A1 (ko) 1958-02-21
DE60336934D1 (de) 2003-10-03 2011-06-09 Veijlen N V Verwendung von igf-1-serumspiegel-erhöhenden indolessigsäure-derivaten zur herstellung eines arzneimittels zur behandlung von verschiedenen krankheiten
US10183001B1 (en) 2007-05-22 2019-01-22 Pisgah Laboratories, Inc. Opioid and attention deficit hyperactivity disorder medications possessing abuse deterrent and anti-dose dumping safety features
ES2716407T3 (es) 2007-11-30 2019-06-12 Zynerba Pharmaceuticals Inc Profármacos de tetrahidrocannabinol, composiciones que comprenden profármacos de tetrahidrocannabinol y métodos para uso de los mismos
ES2620672T3 (es) 2008-01-09 2017-06-29 Charleston Laboratories, Inc. Comprimidos de doble capa que comprenden oxicodona y prometazina
MX351262B (es) 2008-06-19 2017-10-06 Lts Lohmann Therapie Systeme Ag Star Composicion para el transporte transdermico de agentes activos cationicos.
EP2258218A1 (en) 2009-06-02 2010-12-08 Nestec S.A. Nutritional Composition for Supporting Brain Development and Function of Toddlers
CL2009001747A1 (es) 2009-08-20 2010-09-10 Galvan Gonzalez Tomas Bernardo Composicion farmaceutica que comprende 0,05-0,3% de peroxido de hidrogeno, 0,001-0,03% de eugenol, 0,001-0,01% de alcanfor, 0,001-0,5% de una sal de zinc u otros metales pesados definidos, 1-1,2% de fluoruro de sodio, 2-7% de xilitol y excipientes; metodo de preparacion; uso para prevenir y/o tratar enfermedades orales.
NZ700181A (en) 2010-07-22 2016-06-24 Sun Pharmaceutical Ind Australia Pty Ltd Plant cytochrome p450
RU2630495C2 (ru) 2011-07-12 2017-09-11 Импоссибл Фудз Инк. Способы и композиции для предметов потребления
US10208293B2 (en) 2011-08-08 2019-02-19 International Flavors & Fragrances Inc. Compositions and methods for the biosynthesis of vanillan or vanillin beta-D-glucoside
CN106170582A (zh) 2012-07-03 2016-11-30 Sio2医药产品公司 药物包装的SiOx 阻隔物和涂布方法
EP2920273A1 (en) 2012-11-15 2015-09-23 BASF Corporation Mulch and potting soil compositions containing microorganisms and related methods
BR122021009029B1 (pt) 2013-01-11 2022-02-01 Impossible Foods Inc Método de fabricação de réplica de queijo não láctea compreendendo um coacervado e produto obtido a partir do mesmo
CN105142611B (zh) 2013-03-10 2019-06-04 佩丽泰克医药有限公司 外用组合物及治疗局部病症的方法
EP2810640A1 (de) 2013-06-03 2014-12-10 Basf Se Ester von Oligohydroxycarbonsäuren und deren Verwendung
KR102290214B1 (ko) 2013-11-21 2021-08-18 소마로직, 인크. 시티딘-5-카르복스아미드 변형된 뉴클레오티드 조성물 및 그와 관련된 방법들
WO2015136947A1 (en) 2014-03-14 2015-09-17 Raqualia Pharma Inc. Azaspiro derivatives as trpm8 antagonists
US9538418B2 (en) 2014-05-08 2017-01-03 Intel IP Corporation Apparatus, system and method of communicating wireless local area network (WLAN) offloading information between cellular managers
EA033420B1 (ru) 2014-06-26 2019-10-31 Hoffmann La Roche Производные индолин-2-она или пирролопиридин-2-она, обладающие антипсихотической активностью
KR20180025835A (ko) 2015-06-30 2018-03-09 다이이찌 산쿄 가부시키가이샤 남용 억제 특성을 갖는 의약 조성물
CN108349942B (zh) 2015-11-06 2021-03-30 豪夫迈·罗氏有限公司 用于治疗cns和相关疾病的二氢吲哚-2-酮衍生物
EP3371174B1 (en) 2015-11-06 2021-03-17 H. Hoffnabb-La Roche Ag Indolin-2-one derivatives
EP3371168B1 (en) 2015-11-06 2020-05-27 H. Hoffnabb-La Roche Ag Indolin-2-one derivatives
US20220079881A1 (en) 2016-03-03 2022-03-17 Ctt Pharma Inc. Orally Administrable Composition
US20210069170A1 (en) 2016-07-23 2021-03-11 Paul Edward Stamets Tryptamine compositions for enhancing neurite outgrowth
US20180021326A1 (en) 2016-07-23 2018-01-25 Paul Edward Stamets Compositions and methods for enhancing neuroregeneration and cognition by combining mushroom extracts containing active ingredients psilocin or psilocybin with erinacines or hericenones enhanced with niacin
US10596378B2 (en) 2016-10-18 2020-03-24 Joseph Rustick Method for treatment of depression using synaptic pathway training
WO2018112459A1 (en) 2016-12-16 2018-06-21 uBiome, Inc. Method and system for characterizing microorganism-related conditions
NL2018190B1 (en) 2017-01-18 2018-07-26 Procare Beheer B V Psilocybin or psilocin in combination with cannabinoid
US20210346346A1 (en) 2017-02-09 2021-11-11 Caamtech, Inc. Compositions comprising a serotonergic tryptamine compound
CN110740728A (zh) 2017-02-09 2020-01-31 卡马技术有限责任公司 包含裸头草碱衍生物的组合物和方法
US11974984B2 (en) 2017-02-09 2024-05-07 Caamtech, Inc. Compositions and methods comprising a combination of serotonergic drugs
GB2571696B (en) 2017-10-09 2020-05-27 Compass Pathways Ltd Large scale method for the preparation of Psilocybin and formulations of Psilocybin so produced
MX2020004946A (es) 2017-11-03 2020-09-25 Aclaris Therapeutics Inc Inhibidores jak de pirrolopiridina sustituidos y metodos para producir y utilizar los mismos.
EP3720506A4 (en) 2017-12-04 2021-09-29 Lecouteur, David COMPOSITIONS AND METHODS FOR MODULATING THE WINDOWS OF HEPATIC ENDOTHELIAL CELLS
US20200408425A1 (en) 2018-02-26 2020-12-31 Termotera Ltd Cooling, heating and humidity Stabilization Using Humidity Fluctuations
JP2021514682A (ja) * 2018-03-08 2021-06-17 ニュー アトラス バイオテクノロジーズ エルエルシー トリプタミンの生産方法
FI129102B (en) 2018-03-19 2021-07-15 Teknologian Tutkimuskeskus Vtt Oy Heterological production of psilosybin
EP3572078A1 (en) 2018-05-24 2019-11-27 ETH Zurich Tomm6-interacting extracts and compounds for use in the treatment and prophylaxis of nervous system diseases
CA3148256A1 (en) 2018-06-21 2019-12-26 Robert John Petcavich Method of inducing dendritic and synaptic genesis in neurodegenerative chronic diseases
WO2020023084A1 (en) 2018-07-26 2020-01-30 Applied Biology, Inc. Taar receptor agonists for the treatment of alopecia
MX2021001558A (es) 2018-08-10 2021-04-28 Aclaris Therapeutics Inc Inhibidores de itk de pirrolopirimidina.
WO2020041329A1 (en) 2018-08-20 2020-02-27 Yale University Combination therapy for treating or preventing depression or other mood diseases
KR20210134313A (ko) 2019-01-30 2021-11-09 다이아몬드 테라퓨틱스 인크. 심리적, 인지적, 행동적 및/또는 기분 장애의 치료를 위한 5ht 수용체 아고니스트를 포함하는 조성물 및 방법
JP2022520999A (ja) 2019-02-22 2022-04-04 エヴェロ バイオサイエンシズ,インコーポレーテッド 細菌の膜調製物
JP2022525036A (ja) 2019-03-07 2022-05-11 アーバーメンティス・エルエルシー 非サイケデリック/精神異常発現性の投与量及び製剤で投与される神経可塑性作用を有する物質を含む組成物並びに使用方法
WO2020212952A1 (en) 2019-04-17 2020-10-22 Compass Pathfinder Limited Treatment of depression and other various disorders with psilocybin
MX2021013224A (es) 2019-05-02 2022-01-06 Aclaris Therapeutics Inc Pirrolopiridinas sustituidas como inhibidores de jak.
US20200352206A1 (en) 2019-05-08 2020-11-12 Christine Wagner-Salvini Composition and method for mushroom mycelial compound and botanical mixture
WO2020255151A1 (en) 2019-06-18 2020-12-24 Neelima Anil Malik A lip posture corrector
CA3046911A1 (en) 2019-06-18 2020-12-18 Douglas A. Whyte Electronically-active cannabinoids
US20210015738A1 (en) 2019-07-17 2021-01-21 Concept Matrix Solutions Oral dissolvable film containing psychedelic compound
US11766445B2 (en) 2019-07-18 2023-09-26 Concept Matrix Solutions Oral soft gel capsule containing psychedelic compound
US20210023052A1 (en) 2019-07-23 2021-01-28 Caamtech Llc Compositions containing toad secretion compounds
CA3050553A1 (en) 2019-07-25 2021-01-25 Michael D. Forrest Therapeutic modifiers of the reverse mode of atp synthase
AU2019208238A1 (en) 2019-07-26 2021-02-11 Forrest, Michael David DR Therapeutic Modifiers of the Reverse Mode of ATP Synthase
WO2021052989A1 (en) 2019-09-16 2021-03-25 Danmarks Tekniske Universitet Yeast cells and methods for production of tryptophan derivatives
US20210113644A1 (en) 2019-10-16 2021-04-22 Caamtech Llc Compositions containing kratom compounds
CA3155976A1 (en) 2019-11-15 2021-05-20 Jacob Michael Vogan Biosynthetic production of psilocybin and related intermediates in recombinant organisms
CA3158059A1 (en) 2019-11-19 2021-05-27 Paul Edward Stamets Tryptamine compositions for enhancing neurite outgrowth
CN115297851A (zh) 2019-12-31 2022-11-04 Tf科技企业 口溶膜及其生产和使用方法
CA3166785A1 (en) 2020-02-05 2021-08-12 Yale University Psychedelic treatment for headache disorders
AU2021225947B2 (en) 2020-02-27 2023-05-11 Caamtech, Inc. Crystalline bis-miprocin fumarate
CA3168926A1 (en) 2020-02-28 2021-09-02 Matthias Emanuel LIECHTI Ketanserin for reducing acute effects of psychedelic drugs
WO2021178579A1 (en) 2020-03-03 2021-09-10 Alte Verde Llc Cannabis treatment of insomnia, pain, and skin conditions
US11801278B2 (en) 2020-03-05 2023-10-31 Cure Pharmaceutical, Inc. Method for obtaining an extract of a plant biomass
CA3172002A1 (en) 2020-03-19 2021-09-23 Andrew R. Chadeayne Crystalline norpsilocin compounds
US11753375B2 (en) 2020-03-19 2023-09-12 Caamtech, Inc. Crystalline psilacetin derivatives
US20230115209A1 (en) 2020-03-20 2023-04-13 Orthogonal Thinker, Inc. Psilocybin and psilocin containing compositions and methods of using and making the same
US11358934B2 (en) 2020-03-23 2022-06-14 Caamtech, Inc. Crystalline forms of psilacetin
WO2021202730A1 (en) 2020-04-01 2021-10-07 The Regents Of The University Of California Molecularly-initiated, experientially-delivered treatments and systems for practicing same
EP4132527A4 (en) 2020-04-07 2024-04-24 Caamtech Inc CRYSTALLINE 5-METHOXY-N,N-DIALLYLTRYPTAMINE COMPOUNDS
US20210392933A1 (en) 2020-04-10 2021-12-23 Daniel Lilly Medicinal food products and methods for producing said products
US11717517B2 (en) 2020-04-13 2023-08-08 Universitatsspital Basel LSD dose identification
US20210322447A1 (en) 2020-04-16 2021-10-21 Pike Therapeutics, Inc. Transdermal micro-dosing delivery of psychedelics derivatives
CA3175679A1 (en) 2020-04-17 2021-10-21 Fabio Andrea CHIANELLI Use of psilocybin in the treatment of neurological brain injury and migraines
US20230157981A1 (en) 2020-04-20 2023-05-25 Lobe Sciences Ltd. Methods, Compositions and Devices for Treating Mild Traumatic Brain Injury, Post Traumatic Stress Disorder and Mild Traumatic Brain Injury with Post Traumatic Stress Disorder
BR112022021831A2 (pt) 2020-05-01 2022-12-13 Emergex Usa Corp Dispositivos de liberação transdérmica de fármacos tendo micro projeções revestidas com psilocibina, dietilamida do ácido lisérgico ou 3,4-metilenodioximetanfetamina
CA3177850A1 (en) 2020-05-04 2021-11-11 Andrew R. Chadeayne Crystalline dimethyl tryptamine analogues
BR112022022331A2 (pt) 2020-05-05 2022-12-20 Univ Basel Método para melhorar efeitos terapêuticos positivos de um psicodélico, composição, e método para tratar um paciente
US11759452B2 (en) 2020-05-08 2023-09-19 Psilera Inc. Compositions of matter and pharmaceutical compositions
AU2021276656A1 (en) 2020-05-19 2022-11-24 Cybin Irl Limited Deuterated tryptamine derivatives and methods of use
WO2021236759A2 (en) 2020-05-20 2021-11-25 Caamtech, Inc. Crystalline 4-hydroxy-n,n-di-n-propyltryptammonium (4-ho-dpt) salts
WO2021237162A1 (en) 2020-05-21 2021-11-25 Chan Zuckerberg Biohub, Inc. High-complexity synthetic gut bacterial communities
WO2021243460A1 (en) 2020-06-03 2021-12-09 Neonmind Biosciences Inc. Method for weight loss with therapy
EP4162032A2 (en) 2020-06-06 2023-04-12 CB Therapeutics, Inc. Enzymes and regulatory proteins in tryptamine metabolism
AU2021286575A1 (en) 2020-06-10 2023-02-09 Delix Therapeutics, Inc. Isotryptamine psychoplastogens and uses thereof
WO2021250435A1 (en) 2020-06-12 2021-12-16 Beckley Psytech Limited Pharmaceutical composition comprising 5-methoxy-n,n-dimethyltryptamine
IL299448A (en) 2020-06-17 2023-02-01 Psilo Scient Ltd A process for obtaining a purified psychoactive alkaloid solution
CA3173030C (en) 2020-06-17 2024-05-14 Psilo Scientific Ltd. Predominantly phosphorylated psychoactive alkaloid extraction using alkali
CA3123908C (en) 2020-06-17 2022-03-22 Psilo Scientific Ltd. Ethanol extraction of psychoactive compounds from psilocybin fungus
WO2021262871A1 (en) 2020-06-25 2021-12-30 Greenway Dna Inc. Methods and systems for providing a personalized treatment regimen using cannabinoid or psychedelic compounds
AU2021302692A1 (en) 2020-06-30 2023-01-19 Reunion Neuroscience Canada Inc. Tryptamine prodrugs
WO2022011350A1 (en) 2020-07-10 2022-01-13 Eleusis Therapeutics Us, Inc. Method of treatment for psilocybin or psilocin infusion
WO2022018709A1 (en) 2020-07-21 2022-01-27 Ai Pharmaceuticals Jamaica Limited Compositions and methods for treatment of psychoses and psychotic disorders
WO2022023812A1 (en) 2020-07-29 2022-02-03 Diamond Therapeutics Inc. Extended release 5-ht receptor agonists for neurological conditions
WO2022031552A1 (en) 2020-08-03 2022-02-10 Silo Pharma, Inc. Central nervous system delivery of nonsteroidal anti-inflammatory drugs and psilocybin
WO2022031551A1 (en) 2020-08-03 2022-02-10 Silo Pharma, Inc. Central nervous system delivery of psilocybin
WO2022031907A1 (en) 2020-08-06 2022-02-10 Apollo Neuroscience, Inc. Systems and methods of transcutaneous vibration for sexual arousal
US20230295086A1 (en) 2020-08-21 2023-09-21 Compass Pathfinder Limited Novel psilocin derivatives having prodrug properties
WO2022040802A1 (en) 2020-08-26 2022-03-03 Magicmed Industries Inc. Glycosylated psilocybin derivatives and methods of using
EP4208445A1 (en) 2020-09-01 2023-07-12 Enveric Biosciences Canada Inc. Halogenated psilocybin derivatives and methods of using
WO2022047580A1 (en) 2020-09-01 2022-03-10 Magicmed Industries Inc. Hydroxylated psilocybin derivatives and methods of using
WO2022047583A1 (en) 2020-09-02 2022-03-10 Magicmed Industries Inc. Nitrated psilocybin derivatives and use thereof for modulating 5-ht2a receptor and for treating a psychiatric disorder
US20220062310A1 (en) 2020-09-03 2022-03-03 Yale University Psilocybin in patients with obsessive-compulsive disorder
WO2022061196A1 (en) 2020-09-18 2022-03-24 Mydecine Innovations Group Inc. Novel formulations of psilocybin and psilocin compounds as serotonin agonists in combination with 3,4 methylenedioxymethamphetamine (mdma)
US20230364115A1 (en) 2020-10-01 2023-11-16 Mydecine Innovations Group Inc. Novel psychedelic compositions, delivery systems and therapeutic uses thereof
AU2021354006A1 (en) 2020-10-02 2023-03-02 Cybin Irl Limited Methods for delivery of psychedelic medications by inhalation and systems for performing the methods
US11324762B2 (en) 2020-10-08 2022-05-10 Lennham Pharmaceuticals, Inc. Deuterated derivatives of psilocybin and uses thereof
US11000534B1 (en) 2020-10-08 2021-05-11 Lennham Pharmaceuticals, Inc. Deuterated derivatives of psilocybin and uses thereof
IL301656A (en) 2020-10-12 2023-05-01 Goodcap Pharmaceuticals Ltd Preparations to reduce inflammation to improve or maintain mental or physical health
US20230406824A1 (en) 2020-10-13 2023-12-21 Caamtech, Inc. Tryptamine derivatives and their therapeutic uses
WO2022082058A1 (en) 2020-10-16 2022-04-21 Eleusis Therapeutics Us, Inc. Method of treatment by tryptamine alkaloids
CA3193308A1 (en) 2020-10-21 2022-04-28 Compass Pathfinder Limited Use of benzodiazepines to increase sensitivity to psilocybin following a chronic ssri regimen
US20220127058A1 (en) 2020-10-24 2022-04-28 Michael Roth Food / beverage nootropic amendment apparatus and method of use thereof
US20220125755A1 (en) 2020-10-24 2022-04-28 Kevin Hazen Cannabis time release apparatus and method of manufacture thereof
US20220125091A1 (en) 2020-10-24 2022-04-28 Mason Cave Thc beverage preparation apparatus and method of use thereof
US20220125810A1 (en) 2020-10-24 2022-04-28 Mason Cave Thc container apparatus and method of use thereof
US20220211660A1 (en) 2020-10-24 2022-07-07 Mason Cave High viscosity thc product and method of manufacture thereof
WO2022094054A1 (en) 2020-10-28 2022-05-05 Mydecine Innovations Group Inc. Novel fungal compound formulations and their therapeutic methods of use
WO2022091051A1 (en) 2020-10-31 2022-05-05 Ai Pharmaceuticals Jamaica Limited Cannabis compositions and emulsions
WO2022091061A1 (en) 2020-11-01 2022-05-05 Ai Pharmaceuticals Jamaica Limited Cannabis compositions and nanoemulsions
US20220054402A1 (en) 2020-11-05 2022-02-24 Richard C Kaufman Compositions and methods for extracting, stabilizing, and manufacturing stable dosage forms of psilocin, psychedelic drugs, entheogens, and medicinal mushrooms as nano-dimensional drug delivery structures
US20230405026A1 (en) 2020-11-06 2023-12-21 Mynd Life Sciences Inc. A Method of Treating Depression by Immune Modulation
US20220151993A1 (en) 2020-11-16 2022-05-19 New York University Treatment of anxiety and depression
WO2022104475A1 (en) 2020-11-19 2022-05-27 Magicmed Industries Inc. Nitrilated psilocybin derivatives and methods of using
EP4251139A2 (en) 2020-11-30 2023-10-04 Wesana Health Inc. Compositions and methods for treating migraine
US11660289B2 (en) 2020-12-01 2023-05-30 Small Pharma Ltd. Deuterated or partially deuterated N,N-dimethyltryptamine compounds
WO2022115944A1 (en) 2020-12-01 2022-06-09 Magicmed Industries Inc. Carboxylated psilocybin derivatives and methods of using
WO2022117359A1 (en) 2020-12-01 2022-06-09 Small Pharma Ltd Deuterated or partially deuterated n,n-dimethyltryptamine compounds
US20240041860A1 (en) 2020-12-02 2024-02-08 The Johns Hopkins University Restoration of motor function post-neurological injury using psychedelics
CA3197923A1 (en) 2020-12-03 2022-06-09 Denton W. Hoyer Novel psilocin analog compositions and methods of synthesizing the same
WO2022115960A1 (en) 2020-12-04 2022-06-09 Magicmed Industries Inc. Aldehyde and ketone derivatives of psilocybin and methods of using
WO2022123232A1 (en) 2020-12-07 2022-06-16 Beckley Psytech Limited Pharmaceutical composition comprising psilocybin or its polymorphs
KR20230109765A (ko) 2020-12-09 2023-07-20 캄테크, 인크. 다이알킬 트립타민 및 이의 치료적 용도
US20240058469A1 (en) 2020-12-13 2024-02-22 Silo Pharma, Inc. Use of psilocybin in cancer treatment
CA3200255A1 (en) 2020-12-16 2022-06-23 Andrew R. Chadeayne Amanita muscaria compounds
CA3197443A1 (en) 2020-12-28 2022-06-28 Psilo Scientific Ltd. Processes for extracting psychoactive alkaloids and preparation thereof into transmucosal forms
WO2021205196A1 (en) 2020-12-30 2021-10-14 Muhammad Taliah Compositions and prevention and intervention methods for covid-19 with divine ayats' fitra30 covid-19 protocol
WO2022150840A1 (en) 2021-01-08 2022-07-14 Miami University Psilocybin and norbaeocystin compositions and methods of treatment
CN116963742A (zh) 2021-01-08 2023-10-27 纽约大学 用赛洛辛或赛洛西宾治疗自杀倾向
KR20230130664A (ko) 2021-01-08 2023-09-12 캄테크, 인크. 보호 알킬 트립타민 및 이의 치료적 용도
US20230416200A1 (en) 2021-01-11 2023-12-28 Caamtech, Inc. Quaternary tryptamines and their therapeutic uses
WO2022150854A1 (en) 2021-01-11 2022-07-14 Miami University Systems and methods for pharmaceutical production of psilocybin and intermediates or side products
JP2024503463A (ja) 2021-01-13 2024-01-25 ダイブ バイオサイエンシーズ,インク. 薬剤投与用の経皮浸透製剤
CN116981450A (zh) 2021-01-18 2023-10-31 安泰赛普生物风投二代有限责任公司 抗抑郁剂和和右美沙芬的组合用于治疗神经精神病症
WO2022155751A1 (en) 2021-01-22 2022-07-28 Magicmed Industries Inc. Prenylated psilocybin derivatives and methods of using
US11312684B1 (en) 2021-02-10 2022-04-26 Eleusis Therapeutics Us, Inc. Pharmaceutically acceptable salts of psilocin and uses thereof
US11344564B1 (en) 2021-08-20 2022-05-31 Lennham Pharmaceuticals, Inc. Method of treatment based on reduced monoamine oxidase a activity

Also Published As

Publication number Publication date
AU2020358720A1 (en) 2022-04-21
CA3152752A1 (en) 2021-04-08
US20220396780A1 (en) 2022-12-15
US11905535B2 (en) 2024-02-20
CN114787363A (zh) 2022-07-22
EP4038192A2 (en) 2022-08-10
EP4038192A4 (en) 2023-11-01
WO2021067626A3 (en) 2021-05-14
US20220306997A1 (en) 2022-09-29
IL291839A (en) 2022-06-01
JP2022550463A (ja) 2022-12-01
WO2021067626A2 (en) 2021-04-08

Similar Documents

Publication Publication Date Title
KR20220092509A (ko) 트립타민 발현을 조절하는 균류의 유전자 공학
CN109072207B (zh) 用于修饰靶核酸的改进方法
EP3110945B1 (en) Compositions and methods for site directed genomic modification
KR102127418B1 (ko) 부위-특이적인 뉴클레오티드 치환을 통해 글리포세이트-내성 벼를 수득하는 방법
US20160237451A1 (en) Conferring resistance to geminiviruses in plants using crispr/cas systems
AU2020202823A1 (en) Engineering plant genomes using CRISPR/Cas systems
AU757672B2 (en) A method for directional stable transformation of eukaryotic cells
AU2016350610A1 (en) Methods and compositions of improved plant transformation
US20190352653A1 (en) Conferring resistance to geminiviruses in plants in alternative manner to gene drive, using crispr/cas systems
CN113801891B (zh) 甜菜BvCENH3基因单倍体诱导系的构建方法与应用
KR20220091473A (ko) 유전자 변형 식물 및 이를 제조하는 방법
JP2022534381A (ja) ゲノム編集を使用してドミナントアレルを生成する方法及び組成物
AU2017329739A1 (en) Targeted genome optimization in plants
KR20220091472A (ko) 유전자 변형 식물 및 이를 제조하는 방법
CN106978438B (zh) 提高同源重组效率的方法
Mozo et al. Design of a novel system for the construction of vectors for Agrobacterium-mediated plant transformation
CA3102072A1 (en) Gene targeting
US9249422B2 (en) Protein production in plant cells and associated methods and compositions
WO2022101286A1 (en) Fusion protein for editing endogenous dna of a eukaryotic cell
US11932861B2 (en) Virus-based replicon for plant genome editing without inserting replicon into plant genome and uses thereof
Chen et al. A novel T-DNA vector design for selection of transgenic lines with simple transgene integration and stable transgene expression
CN109207510A (zh) 一种单子叶植物miRNA高效沉默载体的构建方法
US20160222395A1 (en) Agrobacterium-mediated genome modification without t-dna integration
WO2023111130A1 (en) Modified agrobacteria for editing plants
US20020168769A1 (en) RNA transformation vectors derived from a single-component RNA virus and contain an intervening sequence between the cap and the 5&#39; end