CN113151215B - 工程化的Cas12i核酸酶及其效应蛋白以及用途 - Google Patents

工程化的Cas12i核酸酶及其效应蛋白以及用途 Download PDF

Info

Publication number
CN113151215B
CN113151215B CN202110581290.3A CN202110581290A CN113151215B CN 113151215 B CN113151215 B CN 113151215B CN 202110581290 A CN202110581290 A CN 202110581290A CN 113151215 B CN113151215 B CN 113151215B
Authority
CN
China
Prior art keywords
cas12i
engineered
lys
leu
nuclease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110581290.3A
Other languages
English (en)
Other versions
CN113151215A (zh
Inventor
李伟
周琪
陈阳灿
胡艳萍
王鑫阁
陈逸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute Of Stem Cell And Regenerative Medicine
Institute of Zoology of CAS
Original Assignee
Beijing Institute Of Stem Cell And Regenerative Medicine
Institute of Zoology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute Of Stem Cell And Regenerative Medicine, Institute of Zoology of CAS filed Critical Beijing Institute Of Stem Cell And Regenerative Medicine
Priority to CN202110581290.3A priority Critical patent/CN113151215B/zh
Priority to CN202211325001.4A priority patent/CN115851665A/zh
Publication of CN113151215A publication Critical patent/CN113151215A/zh
Priority to PCT/CN2022/095072 priority patent/WO2022247873A1/zh
Priority to CN202280035920.XA priority patent/CN117337326A/zh
Priority to EP22810597.9A priority patent/EP4349979A1/en
Application granted granted Critical
Publication of CN113151215B publication Critical patent/CN113151215B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本申请提供了一种工程化的Cas12i核酸酶;其包含一种、两种、三种或四种以下基于参比Cas12i核酸酶的突变:(1)将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸;和/或(2)将参比Cas12i核酸酶中参与打开DNA双链的一个或多个氨基酸替换为带芳香环的氨基酸;和/或(3)将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和/或(4)将参比Cas12i核酸酶中与DNA‑RNA双螺旋相互作用的一个或多个氨基酸替换为带正电的氨基酸;尤其所述参比Cas12i核酸酶为天然Cas12i核酸酶,例如天然Cas12i2核酸酶,其氨基酸序列如SEQ ID NO.1所定义。

Description

工程化的Cas12i核酸酶及其效应蛋白以及用途
技术领域
本申请属于生物技术领域。更具体地说,本申请涉及具有提高的催化活性(例如基因编辑活性)的Cas12i核酸酶、效应蛋白及其用途。
背景技术
基因组编辑是在基因组研究中的重要且有用的技术。有多个系统可用于基因组编辑,包括成簇规律间隔短回文重复序列(CRISPR)-Cas系统、转录激活子样效应因子核酸酶(TALEN)系统以及锌指核酸酶(ZFN)系统。
CRISPR-Cas系统是一种高效且具有成本效益的基因组编辑技术,可广泛应用于从酵母、植物到斑马鱼和人类的一系列真核生物中(参见综述:Van der Oost 2013, Science339: 768-770,以及Charpentier and Doudna, 2013, Nature 495: 50-51)。CRISPR-Cas系统通过结合Cas12i效应蛋白和CRISPR RNA(crRNA)在古细菌和细菌中提供适应性免疫。迄今为止,基于该系统的突出的功能上和进化上的模块性,已经对包括六型(I–VI型)两类(第1类和第2类)的CRISPR-Cas系统进行了表征。在第2类CRISPR-Cas系统中,II型Cas9系统和V型-A/B/E/J Cas12a/Cas12b/Cas12e/Cas12j系统已被利用来进行基因组编辑,并为生物医学研究提供了广阔的前景。
但是,当前的CRISPR-Cas系统具有多种局限性,包括有限的基因编辑效率。因此,需要改进方法和系统以进行有效的跨多基因座的基因组编辑。
发明内容
本申请提供了下述技术方案:
1.一种工程化的Cas12i核酸酶;其包含一种,两种、三种或四种基于参比Cas12i核酸酶的突变,所述突变选自:
(1)将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸;和/或
(2)将参比Cas12i核酸酶中参与打开DNA双链的一个或多个氨基酸替换为带芳香环的氨基酸;和/或
(3)将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和/或
(4)将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸替换为带正电的氨基酸。
在一些实施方案中,所述参比Cas12i核酸酶为天然野生型Cas12i酶。在一些实施方案中,所述参比Cas12i核酸酶为Cas12i1、Cas12i2、或其同源核酸酶。在一些实施方案中,所述参比酶为为天然Cas12i2核酸酶,其氨基酸序列如SEQ ID NO.1所定义。在一些实施方案中,所述参比酶为天然Cas12i1酶,其氨基酸序列如SEQ ID NO.13所定义。在一些实施方案中,所述参比Cas12i核酸酶为工程化的Cas12i核酸酶。
2.如项1所述的工程化的Cas12i核酸酶,其中,所述与PAM相互作用的一个或多个氨基酸是与PAM在三维结构上距离在9埃以内的氨基酸。在一些实施方式中,所述与PAM相互作用的一个或多个氨基酸是下述位置的一个或多个氨基酸: 176、178、226、227、229、237、238、264、447和/或563。在一些实施方式中,所述与PAM相互作用的一个或多个氨基酸是下述一个或多个氨基酸: E176、E178、Y226、A227、N229、E237、K238、K264、T447和/或E563。在一些实施方式中,所述与PAM相互作用的一个或多个氨基酸是下述一个或多个氨基酸:E176、K238、T447和/或E563。其中,所述氨基酸位置编号如SEQ ID NO.1所定义。
3.如项2所述的工程化的Cas12i核酸酶,其中,所述带正电的氨基酸是R或K。在一些实施方式中,该带正电的氨基酸为R。
4.如项3所述的工程化的Cas12i核酸酶,其中,所述将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸是指如下替换中的一种或多种:E176R、K238R、T447R和/或E563R。在一些实施方式中,所述Cas12i核酸酶包含下述任何一种突变或突变组合: 1)E563R ;(2)E176R、T447R、E176R和E563R;(3)K238R和E563R;(4)E176R、K238R和T447R;(5)E176R、K238R和E563R;(6)E176R、T447R和E563R;和/或(7)E176R、K238R、 T447R和E563R。其中,所述氨基酸位置编号如SEQ ID NO.1所定义。
5. 如项1~4中任一项所述的工程化的Cas12i核酸酶,其中,所述参与打开DNA双链的一个或多个氨基酸是与PAM中相对于靶标链的3’端最后一个碱基对相互作用的氨基酸。在一些实施方式中,所述参与打开DNA双链的一个或多个氨基酸是下述位置的一个或多个氨基酸: 163和/或164。;在一些实施方式中,所述参与打开DNA双链的一个或多个氨基酸是下述一个或多个氨基酸: Q163和/或N164。在一些实施方式中,所述参与打开DNA双链的一个或多个氨基酸为N164。其中,所述氨基酸位置编号如SEQ ID NO.1所定义。
6. 如项5所述的工程化的Cas12i核酸酶,其中,所述参与打开DNA双链的一个或多个氨基酸替换为带芳香环的氨基酸,所述带芳香环的氨基酸是F、Y或W。在一些实施方式中,该氨基酸为F或Y。
7. 如项6所述的工程化的Cas12i核酸酶,其中,所述将参比Cas12i酶中参与打开DNA双链的一个或多个氨基酸的替换为带芳香环的氨基酸是指:Q163F、Q163Y、Q163W、N164F和/或N164Y。在一些实施方式中,所述Cas12i核酸酶包含N164Y或N164F突变,例如N164Y。
8.如项1~7中任一项所述的工程化的Cas12i核酸酶,其中,所述位于RuvC 结构域并与单链DNA底物相互作用的一个或多个氨基酸是在三维结构上与单链DNA底物距离在9埃以内的氨基酸。在一些实施方式中,所述位于RuvC 结构域并与单链DNA底物相互作用的一个或多个氨基酸是下述位置的一个或多个氨基酸: 323、362、425、925、926、390、391、392、751、755、840、848、851、856、885、897、929、932、327、355、359、360、361、414、421、650、652、705、708、709、752、928、388、393、417、418、424、653、696和/或1022。在一些实施方式中,所述位于RuvC 结构域并与单链DNA底物相互作用的一个或多个氨基酸是下述一个或多个氨基酸:E323、D362、Q425、N925、I926、N390、N391、F392、L751、E755、N840、N848、S851、A856、Q885、M897、G929、Y932、L327、V355、G359、G360、K361、Q414、K421、S650、E652、K705、K708、E709、S752、T928、L388、K393、L417、A418、Q424、G653、I696和/或A1022。在一些实施方式中,所述位于RuvC 结构域并与单链DNA底物相互作用的一个或多个氨基酸是是下述一个或多个氨基酸:E323、D362、Q425、N925、I926、N391、Q424和/或G929。其中,所述氨基酸位置编号如SEQ ID NO.1所定义。
9.如项8所述的工程化的Cas12i核酸酶,其中,将参比Cas12i核酸酶中参与双链DNA的切割的一个或多个氨基酸替换为带正电的氨基酸,所述带正电的氨基酸是R或K。在一些实施方式中,该氨基酸为R。
10. 如项9所述的工程化的Cas12i核酸酶,其中,将参比Cas12i核酸酶位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸是指包括如下替换中的一种或多种:E323R、D362R、N391R、Q424R、Q425R、N925R、I926R和/或G929R。在一些实施方式中,所述Cas12i核酸酶包含下述任何一种突变或突变组合:1)E323R;(2)D362R;(3)Q425R;(4)N925R;(5)I926R;(6)E323R和D362R;(7)E323R和Q425R;(8)E323R和I926R;(9)Q425R和I926R;(10)D362R和I926R;(11)N925R和I926R; (12) E323R、D362R和Q425R;(13)E323R、D362R和I926R;(14)E323R、Q425R和I926R;(15)D362R、N925R和I926R;和/或(16) E323R、D362R、Q425R和I926R。其中,所述氨基酸位置编号如SEQ ID NO.1所定义。
11. 如项1~10中任一项所述的工程化的Cas12i核酸酶,其中,所述与DNA-RNA双螺旋相互作用的一个或多个氨基酸是与DNA-RNA双螺旋在三维结构上距离在9埃以内的氨基酸。在一些实施方式中,所述与DNA-RNA双螺旋相互作用的一个或多个氨基酸是下述位置的一个或多个氨基酸:116、117、156、159、161、301、305、306、308、312、313、427、433、438、441、442、852、855、861、865、160、316、319、320、247、343、348、349、679、683、691、782、783、797、800、853、957、958、293、294和/或297。在一些实施方式中,所述与DNA-RNA双螺旋相互作用的一个或多个氨基酸是下述一个或多个氨基酸: G116、E117、A156、T159、S161、T301、I305、K306、T308、N312、F313、D427、K433、V438、N441、Q442、M852、L855、N861、Q865、E160、Q316、E319、Q320、E247、E343、E348、E349、N679、E683、E691、D782、E783、E797、E800、D853、S957、D958、G293、E294和/或N297。在一些实施方式中,所述与DNA-RNA双螺旋相互作用的一个或多个氨基酸是下述一个或多个氨基酸:G116、E117、T159、S161、E319、E343和/或D958。其中,所述氨基酸位置编号如SEQ ID NO.1所定义。
12.如项11所述的工程化的Cas12i核酸酶,其中,所述带正电的氨基酸是R或K。在一些实施方式中,所述带正电的氨基酸为R。
13.如项12所述的工程化的Cas12i核酸酶,其中,所述将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸替换为带正电的氨基酸是指如下替换中的一种或多种:G116R、E117R、T159R、S161R、E319R、E343R和/或D958R。在一些实施方式中,所述Cas12i核酸酶包含D958R。其中,所述氨基酸位置编号如SEQ ID NO.1所定义。
14. 如项1~13中任一项所述的工程化的Cas12i核酸酶,其包含一个或多个柔性区突变,所述突变增加了参比Cas12i核酸酶中的柔性区的柔性,所述柔性区选自对应于以下的区的组:氨基酸残基439-443或氨基酸残基925-929,其中所述氨基酸位置编号如SEQ IDNO.1所定义。在一些实施方式中,所述柔性区突变位于下述位置的一个或多个: 439和/或926。在一些实施方式中,所述柔性区突变是下述一个或多个氨基酸: L439和/或I926。
15.如项14所述的工程化的Cas12i核酸酶,其中,所述一个或多个柔性区突变为:将该氨基酸替换为G、和/或在其后插入一个或两个G。在一些实施方式中,所述一个或多个柔性区突变包含I926G。在一些实施方式中,所述一个或多个柔性区突变包含439G 或439GG。其中所述氨基酸位置编号如SEQ ID NO.1所定义。
16. 一种工程化的Cas12i核酸酶(如Cas12i2核酸酶),其氨基酸位置编号如SEQID NO.1所定义;所述工程化的Cas12i核酸酶包含以下任一组或多组(如2、3、4、5、6或更多组)突变:(1)E563R;(2)E176R和T447R;(3)E176R和 E563R; (4)K238R和E563R; (5)E176R、 K238R和 T447R; (6)E176R、 T447R和 E563R; (7) E176R、 K238R和 E563R; (8)E176R、 K238R、 T447R和 E563R; (9) N164Y; (10) N164F;(11) E323R;(12) D362R;(13)Q425R;(14) N925R; (15) I926R; (16) D958R; (17) E323R和 D362R; (18) E323R和Q425R;(19) E323R和 I926R; (20) Q425R和 I926R; (21) D362R和I926R;(22) N925R和I926R;(23) E323R、 D362R和 Q425R; (24) E323R、 D362R和 I926R; (25) E323R、 Q425R和 I926R; (26) D362R、 N925R和 I926R; (27) E323R、 D362R、 Q425R和 I926R; (28)D362R和 I926G; (29)N925R和 I926G; (30)D362R、 N925R和 I926G; (31)I926R和439G;(32)I926R和439GG; 和/或(33)E323R、 D362R和 I926G。在一些实施方式中,所述工程化的Cas12i核酸酶包含以下任一组或多组(如2、3、4、或5组)突变:(1)E176R、 K238R、 T447R和E563R; (2)N164Y; (3)I926R; (4) E323R和 D362R; (4) I926G;(5)I926R和439G;(6)I926R和439GG;和/或(7)D958R。在一些实施方式中,所述工程化的Cas12i核酸酶包含以下任一组突变:((1)E176R、K238R、T447R、E563R和N164Y;(2)E176R、K238R、T447R、E563R和I926R;(3)N164Y、E323R和D362R;(4)E176R、K238R、T447R、E563R、E323R和D362R;(5)N164Y和I926R;(6)E176R、K238R、T447R、E563R、N164Y和I926R;(7)E176R、K238R、T447R、E563R、N164Y、E323R和D362R;(8)E176R、K238R、T447R、E563R、N164Y、I926R、E323R和D362R;(9)E176R、K238R、T447R、E563R、N164Y、E323R、D362R和I926G;(10)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G和439GG;(11) E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G和439G; (12)E176R、K238R、T447R、E563R、N164Y和D958R;(13)E176R、K238R、T447R、E563R、I926R和D958R;(14) E176R、K238R、T447R、E563R、E323R、D362R和D958R;(15)N164Y、I926R和D958R;(16) N164Y、E323R、D362R和D958R;(17) E176R、K238R、T447R、E563R、N164Y、I926R和D958R;(18)E176R、K238R、T447R、E563R、N164Y、E323R、D362R和D958R;(19)E176R、K238R、T447R、E563R、N164Y、I926R、E323R、D362R和D958R;(20) E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G和D958R;(21)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、439GG和D958R;或(22)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、439G和D958R。在一些实施方式中,所述突变基于天然野生型Cas12i2核酸酶,其氨基酸序列为SEQ ID NO.1。
17.包含如SEQ ID NO.2~12中任一项所示氨基酸序列的工程化Cas12i核酸酶。在一些实施方式中,所述工程化的Cas12i核酸酶包含与SEQ ID NO.2~12中任一项所示的氨基酸序列具有至少85%(例如至少87%、89%、91%、93%、95%、97%、或99%)序列一致性的氨基酸序列。
18. 一种工程化的Cas12i效应蛋白,其包含项1~17中任一项所述的工程化的Cas12i核酸酶或其功能衍生物。在一些实施方案中,所述工程化的Cas12i核酸酶或其功能衍生物具有酶活性。在一些实施方案中,所述效应蛋白包含所述工程化的Cas12i核酸酶的酶失活突变体。
19. 如项18所述的工程化的Cas12i效应蛋白,其中所述效应蛋白能够诱导DNA分子中的双链断裂或单链断裂。
20. 如项18所述的工程化的Cas12i效应蛋白,其中所述工程化的Cas12i核酸酶的功能衍生物为酶失活突变体,例如含有D599A、E833A、S883A、H884A、D886A、R900A和/或D1019A的酶失活突变体。
21. 如项18~20所述的工程化的Cas12i效应蛋白,其还包含与所述工程化的Cas12i核酸酶融合的功能结构域。
22. 如项21所述的工程化的Cas12i效应蛋白,其中所述功能结构域选自下组:翻译起始结构域、转录阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域(例如,CBE或ABE结构域)、逆转录酶结构域、报告分子结构域(例如,荧光结构域)和核酸酶结构域。
23. 如项18~22所述的工程化的Cas12i效应蛋白,所述工程化的Cas效应蛋白包含:含有所述工程化的Cas12i核酸酶或其功能衍生物的N末端部分的第一多肽和含有所述工程化的Cas12i核酸酶或其功能衍生物的C末端部分的第二多肽,其中所述第一多肽和所述第二多肽能够在包含指导序列的指导RNA的存在下彼此缔合,以形成与靶核酸特异性结合的成簇规律间隔短回文重复序列(CRISPR)复合物,所述靶核酸包含与所述指导序列互补的靶序列。在一些实施方案中,所述第一多肽包含项1-17中任一项所述的工程化的Cas12i核酸酶的N末端部分氨基酸残基1至X,所述第二多肽包含项1-17中任一项所述的工程化的Cas12i核酸酶的氨基酸残基X+1至所述Cas12i核酸酶的C末端,其中所述第一多肽和所述第二多肽能够在包含指导序列的指导RNA的存在下彼此缔合,以形成与靶核酸特异性结合的成簇规律间隔短回文重复序列(CRISPR)复合物,该靶核酸包含与所述指导序列互补的靶序列。在一些实施方案中,所述第一多肽和所述第二多肽各自包含二聚化结构域。在一些实施方案中,所述第一二聚结构域和所述第二二聚结构域在诱导剂存在下彼此缔合。在一些实施方案中,所述第一多肽和所述第二多肽不包含二聚化结构域。
24. 一种工程化的CRISPR-Cas12i系统,包括:
(a)项18-23中任一项所述的工程化的Cas12i效应蛋白;以及
(b)包含与靶序列互补的指导序列的指导RNA,或编码所述指导RNA的一种或多种核酸,
其中所述工程化的Cas12i效应蛋白和所述指导RNA能够形成CRISPR复合物,所述CRISPR复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。在一些实施方案中,所述指导RNA是包含所述指导序列的crRNA。在一些实施方案中,所述系统包括编码多个crRNA的前体指导RNA阵列(array)。在一些实施方案中,其中所述工程化的Cas效应蛋白是主编辑器,所述指导RNA是pegRNA。
25. 如项24中所述的工程化的CRISPR-Cas12i系统,其包含一种或多种编码所述工程化的Cas12i效应蛋白的载体。在一些实施方案中,所述一种或多种载体选自下组:逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关的载体和单纯疱疹载体。在一些实施方案中,所述一种或多种载体是腺相关病毒(AAV)载体。在一些实施方案中,AAV载体还编码所述指导RNA(例如,crRNA、或前体指导RNA阵列)。
26. 一种检测样品中靶核酸的方法,包括:
(a)使样品与项24中的工程化的CRISPR-Cas12i系统以及加标签的检测核酸接触,该检测核酸为单链且不与所述指导RNA的指导序列杂交;以及
(b)测量通过所述工程化的Cas12i效应蛋白切割所述加标签的检测核酸而产生的可检测信号,从而检测所述靶核酸。
27. 一种修饰包含靶序列的靶核酸的方法,包括使所述靶核酸与项24中所述的工程化的CRISPR-Cas12i系统接触。在一些实施方案中,所述方法在体外进行。在一些实施方案中,所述靶核酸存在于细胞中。在一些实施方案中,所述细胞是细菌细胞、酵母细胞、哺乳动物细胞、植物细胞或动物细胞。在一些实施方案中,所述方法离体进行。在一些实施方案中,所述方法在体内进行。
在根据上述修饰靶核酸的方法中任一种的一些实施方案中,通过所述工程化的CRISPR-Cas12i系统切割所述靶核酸或改变所述靶核酸中的靶序列。在一些实施方案中,通过所述工程化的CRISPR-Cas12i系统改变靶核酸的表达。在一些实施方案中,所述靶核酸是基因组DNA。在一些实施方案中,所述靶序列与疾病或病况相关。
在根据上述修饰靶核酸的方法中任一种的一些实施方案中,所述工程化的CRISPR-Cas12i系统包括编码多个crRNA的前体指导RNA阵列,其中每个crRNA包含不同的指导序列。
28.如项 24所述的工程化的CRISPR-Cas12i系统在制备治疗与个体的细胞中靶核酸相关的疾病或病症的药物中的用途。在一些实施例中,所述疾病或病症选自下组:癌症、心血管疾病、遗传性疾病、自身免疫疾病、代谢性疾病、神经退行性疾病、眼病、细菌感染和病毒感染。
29.一种治疗与个体的细胞中的靶核酸相关的疾病或病症的方法; 所述方法包含采用使用项27所述工程化的CRISPR-Cas12i系统的方法中任一种来修饰所述个体的细胞中的靶核酸,从而治疗所述疾病或病症。在一些实施方案中,所述疾病或病症选自下组:癌症、心血管疾病、遗传性疾病、自身免疫疾病、代谢性疾病、神经退行性疾病、眼病、细菌感染和病毒感染。
30. 工程化的细胞,其包含经修饰的靶核酸,其中使用如项27中所述的方法修饰过所述靶核酸。
31. 工程化非人类动物,其包含一种或多种如项27所述的工程化细胞。
应理解为清楚起见,在单独实施方案的上下文中描述的本公开的某些特征,也可以在单个实施方案中组合提供。相反,为简洁起见,在单个实施方案的上下文中描述的本公开的各种特征,也可以单独地或以任何合适的子组合来提供。涉及特定方法步骤、试剂或条件或组合物组分的实施方案的所有组合被本公开明确地涵盖,并且在本文中公开,如同各自和每个组合均被单独地和明确地公开。
本申请的技术方案取得的有益效果
本申请工程化的Cas12i核酸酶及其效应蛋白具有更高的活性,如切割核酸底物的催化效率及细胞内的基因编辑效率。本申请中的工程化Cas12i核酸酶具有较现有常规Cas基因编辑工具更卓越的哺乳动物细胞(如人类细胞)内的基因编辑效率;例如本申请中的一些示例性Cas12i2核酸酶突变体在人类细胞中多个位点(如62个位点)测试基因编辑效率,发现有57个位点的基因编辑效率超过约60%,平均基因编辑效率接近70%。在一些实施例中,本申请工程化的Cas12i核酸酶及其效应蛋白还具有以下一个或多个优点:蛋白小(1,054aa),crRNA组分简单,PAM序列简单,并且蛋白自身能加工前体crRNA。这些优点使得本申请高效的工程化的Cas12i核酸酶及其效应蛋白非常适用于在体内进行基因编辑或者基因调控。
附图说明
图1a:将参比Cas12i核酸酶中与PAM相互作用的氨基酸替换为带正电的氨基酸,从而提高基因编辑效率。如图所示,E176R, K238R, T447R, E563R四种突变体能够显著地提高在人293T细胞中的基因编辑效率。
图1b:将图1a中能够显著提高基因编辑效率的氨基酸突变(E176R, K238R,T447R, E563R)进行组合,发现组合后的突变体能够展现在人293T细胞中更高的基因编辑效率。
图2:将参比Cas12i核酸酶中参与打开DNA双链的氨基酸替换为带芳香环的氨基酸从而提高基因编辑的效率。如图所示,Q163F、Q163Y、Q163W、N164F、N164Y这些突变体能够显著提高在人293T细胞中的基因编辑效率。
图3a、3b、3c:将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的氨基酸替换为带正电的氨基酸,从而提高基因编辑的效率。如图所示,E323R、L327R、V355R、G359R、G360R、D362R、N391R、Q424R、Q425R、N925R、I926R和G929R等突变体能够显著地提高在人293T细胞中的基因编辑效率。
图3d:将图3a、3b中提高效率的点突变进行组合,发现组合后的突变体能够展现在人293T细胞中更高的基因编辑效率。
图3e:将图3a、3b中提高效率的点突变以及根据分子柔性原理改造突变(439GG,I926G)进行组合,发现组合后的突变体能够展现在人293T细胞中更高的基因编辑效率。
图4:将参比Cas12i酶参比Cas12i核酸酶中与与DNA-RNA双螺旋相互作用的氨基酸替换为带正电的氨基酸,从而提高基因编辑效率。如图所示,G116R、E117R、T159R、S161R、E319R、E343R、D958R这些突变体能够明显地提高在人293T细胞中的基因编辑效率。其中,D958R最优。
图5:将图1a~图3e中三种改造策略得到的高效率突变体以及根据分子柔性原理改造突变(439GG、I926G)进行组合,发现组合后的突变体能够展现在人293T细胞中更高的基因编辑效率。组合后能够极大地提高基因编辑效率。选出基因编辑效果最佳的突变体并命名为CASXX供后续实验使用。
图6a:CasXX在62个人基因组位点的基因编辑效率汇总。PAM = NTTN。在此CasXX代表的是(基于氨基酸序列SEQ ID NO.1的参比Cas12i2)具有E176R+K238R+T447R+E563R+N164Y+E323R+D362R突变组合的工程酶。
图6b:CasXX与AsCas12a,BhCas12b v4基因编辑效率的比较。
图6c:CasXX与SpCas9,SaCas9,SaCas9-KKH基因编辑效率的比较。
图6d:CasXX在小鼠Hepa1-6细胞系的基因编辑效率统计,可以看到,CasXX在65个位点展示出强大的基因编辑能力,平均基因编辑效率超过60%。
图7:Cas12i2(SEQ ID NO.1)与Cas12i1(SEQ ID NO.13)的氨基酸序列的同源性比对。阴影标注的氨基酸代表2种Cas12i蛋白相同的氨基酸,用白色框标注的氨基酸代表2种Cas12i蛋白性质相似的氨基酸。
具体实施方式
需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明书的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。除非另有定义,本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同含义。
.术语
如本文所用,“效应蛋白”是指具有活性如位点特异性结合活性、单链DNA切割活性、双链DNA切割活性、单链RNA切割活性或转录调节活性的蛋白。
如本文所用,“指导RNA”和“gRNA”在本文中可互换使用,是指能够与Cas12i效应蛋白和靶核酸(例如,双链DNA)形成复合物的RNA。本文还考虑了可以被加工成多个crRNA的前体指导RNA阵列。“crRNA”或“CRISPR RNA”包含与靶核酸(例如,双链DNA)的靶序列具有足够互补性的指导序列,其指导CRISPR复合物与靶核酸的序列特异性结合。
术语“核酸”、“多核苷酸”和“核苷酸序列”可互换使用,是指任何长度的核苷酸的聚合形式,包括脱氧核糖核苷酸、核糖核苷酸、其组合及其类似物。“寡核苷酸”和“低聚核苷酸”可互换使用,是指具有不超过约50个核苷酸的短多核苷酸。
如本文所用,“互补性”是指核酸通过传统的沃森-克里克(Watson-Crick)碱基配对与另一核酸形成氢键的能力。互补性百分比表示可与第二种核酸形成氢键(即,沃森-克里克碱基配对)的核酸分子中的残基百分比(例如,10分之5、6、7、8、9、10,分别互补约50%、60%、70%、80%、90%和100%)。“完全互补”是指核酸序列的所有连续残基与第二核酸序列中相同数目的连续残基形成氢键。如本文所用,“基本上互补”是指在约40、50、60、70、80、100、150、200、250个或更多个核苷酸的区域上,互补程度为至少约70%、75%、80%、85%、90%、95%、97%、98%、99%或100中任一个,或指在严格条件下杂交的两种核酸。
如本文所用,用于杂交的“严格条件”是指与靶序列具有互补性的核酸主要与靶序列杂交,而基本上不与非靶序列杂交的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。通常,序列越长,序列与其靶序列特异性杂交的温度越高。严格条件的非限制性例子详细描述于Tijssen (1993), Laboratory Techniques In Biochemistry AndMolecular Biology- Hybridization With Nucleic Acid Probes,第一部分第二章"Overview of principles of hybridization and the strategy of nucleic acidprobe assay,” Elsevier, N,Y。
“杂交”是指一种或多种多核苷酸反应形成复合物的反应,所述复合物通过核苷酸残基的碱基之间的氢键而稳定化。氢键可通过沃森克里克碱基配对、霍格斯坦(Hoogstein)结合或以任何其他序列特异性方式发生。能够与给定序列杂交的序列称为所述给定序列的“互补体”。
针对核酸序列的“序列同一性百分比(%)”定义为,在通过允许空缺(gaps)来比对序列(如有必要)以实现最大的序列同一性百分比后,候选序列中与特定核酸序列中的核苷酸相同的核苷酸百分比。针对肽、多肽或蛋白质序列的“序列同一性百分比(%)”,是在通过允许空缺来比对序列(如有必要)以实现最大的序列同源性百分比后,候选序列中与特定肽或氨基酸序列中的氨基酸残基相同替换的氨基酸残基的百分比。为了确定氨基酸序列同一性百分比的目的,比对可以以本领域技术范围内的各种方式来实现,例如,使用诸如BLAST、BLAST-2、ALIGN或MEGALIGNTM (DNASTAR)软件之类的公众可获得的计算机软件。本领域技术人员可以确定用于测量比对的合适参数,包括在所比较序列的全长上实现最大比对所需的任何算法。
术语“多肽”和“肽”在本文可互换使用,是指任何长度的氨基酸的聚合物。所述聚合物可以是直链或支链的,它可以包含经修饰的氨基酸,并且可以被非氨基酸中断。蛋白质可以具有一个或多个多肽。该术语还涵盖已经过修饰的氨基酸聚合物;例如,二硫键的形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作(诸如与标记组分的缀合)。
如本文所用,“变体”解释为分别不同于参比多核苷酸或多肽但保留必要特性的多核苷酸或多肽。多核苷酸的典型变体与另一参比多核苷酸的核酸序列不同。变体核酸序列的变化可以改变或可以不改变参比多核苷酸编码的多肽的氨基酸序列。核苷酸变化可导致参比序列编码的多肽中的氨基酸替换、添加、缺失、融合和截短,如下所述。多肽的典型变体与另一参比多肽在氨基酸序列上不同。通常,差异是有限的,使得参比多肽和变体的序列总体上非常相似,并且在许多区域是相同的。变体和参比多肽的氨基酸序列可以通过一个或多个替换、添加、缺失的任何组合而不同。替换或插入的氨基酸残基可以是或可以不是遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的(诸如等位基因变体),或者可以是未知天然存在的变体。多核苷酸和多肽的非天然存在的变体可以通过诱变技术,通过直接合成,以及通过本领域技术人员已知的其他重组方法来制备。
如本文所用,术语“野生型”具有本领域技术人员通常理解的含义,意指当它存在于大自然中时,将其与突变体或变体区分开的、典型形式的生物体、菌株、基因或特征。它可以与自然界中的资源隔离开来,并没有被刻意修饰。
如本文所用,术语“非天然存在”或“工程化的”可互换使用,是指人工参与。当这些术语用于描述核酸分子或多肽时,是指所述核酸分子或多肽至少基本上不含其天然缔合的或天然存在的至少一种其他组分。
如本文所用,术语“直系同源物(orthologue/ ortholog)”具有本领域普通技术人员通常理解的含义。作为进一步的指导,本文所指的蛋白质的“直系同源物”是指属于不同物种的蛋白质,其执行与作为其直系同源物的蛋白质相同或相似的功能。
如本文所用,术语“同一性”用于表示两个多肽之间或两个核酸之间的序列匹配。当两个比较序列中的一个位置被相同的碱基或氨基酸单体亚基占据时(例如,两个DNA分子的每个中的一个位置都被腺嘌呤占据,或者两个多肽的每个中的一个位置被赖氨酸占据),那么在那个位置每个分子均相同。这两个序列之间的“同一性百分比”是两个序列共有的匹配位置数除以要比较的位置数 x 100的函数。例如,如果两个序列的10个位置中有6个匹配,则这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT具有50%的同一性(总共6个位置中有3个匹配)。通常,当两个序列进行比对以产生最大的同一性时,进行这种比较。这种比对可以通过例如Needleman et al. (1970) J. Mol. Biol. 48: 443-453中的方法来实现,所述方法可方便地通过计算机程序如比对(Align)程序(DNAstar,Inc.)来进行。也可以采用PAM 120权重残基表,使用E. Meyers和W. Miller的算法(Comput. ApplBiosci., 4: 11-17 (1988))集成到ALIGN程序(2.0版)中。空缺长度罚分12和空缺罚分4,用于确定两个氨基酸序列之间的同一性百分比。此外,可以使用集成到GCG软件包(可从www.gcg.com获得)的GAP程序中的Needleman和Wunsch(J MoI Biol. 48: 444-453(1970))算法,采用Blossum 62矩阵或PAM250矩阵,空缺权重为16、14、12、10、8、6或4,长度权重为1、2、3、4、5或6,以确定两个氨基酸序列之间的同一性百分比。
本文所用的“细胞”应理解为不仅指特定的单个细胞,而且指该细胞的后代或潜在后代。因为由于突变或环境影响,可能在后代中发生某些修饰,所以此类后代可能事实上与亲本细胞不同,但仍包括在本文术语的范围内。
如本文所用,术语“转导”和“转染”包括本领域已知的使用感染剂(如病毒)或其他方式将DNA引入细胞中以表达目的蛋白质或分子的方法。除了病毒或类似病毒的试剂外,还有基于化学的转染方法,如使用磷酸钙、树状聚合物,脂质体或阳离子聚合物(例如DEAE-葡聚糖或聚乙烯亚胺)的转染方法;非化学方法,如电穿孔、细胞挤压(cell squeezing)、声致穿孔(sonoporation)、光学转染、穿刺转染(impalefection)、原生质体融合、质粒递送或转座子;基于颗粒的方法,如使用基因枪、磁转染或磁体辅助转染、颗粒轰击;以及杂交方法(诸如核转染)。
如本文所用,术语“转染的”、“转化的”或“转导的”是指将外源核酸转移或引入宿主细胞的过程。“转染的”、“转化的”或“转导的”细胞是已经用外源核酸转染、转化或转导的细胞。
术语“体内”是指从其中获得细胞的该生物体内。“离体”或“体外”是指从其中获得细胞的该生物体外。
如本文所用,“治疗(treatment/treating)”是用于获得有益的或期望的结果(包括临床结果)的方法。为了本发明的目的,有益的或期望的临床结果包括但不限于以下的一种或多种:减轻由疾病引起的一种或多种症状,减轻疾病的程度,稳定疾病(例如预防或延缓疾病的恶化),预防或延缓疾病的扩散(例如转移),预防或延缓疾病的复发,降低疾病的复发率,延缓或减慢疾病的进展,改善疾病状态,提供疾病的(部分或全部)缓解,减少治疗该疾病所需的一种或多种其他药物的剂量,延缓疾病的进展,提高生活质量,和/或延长生存期。“治疗”还包括减少病症、病况或疾病的病理后果。本发明的方法考虑了这些治疗的方面中的任何一个或多个。
如本文所用,术语“有效量”是指足以治疗特定病症、病况或疾病(如改善、缓解、减轻和/或延迟其一种或多种症状)的化合物或组合物的量。如本领域中所理解的,“有效量”可以以一次或多次给药,即,可能需要单次给药或多此给药来达到期望的治疗终点。
“受试者”、“个体”或“患者”在本文中可互换使用,以达到治疗目的,是指任何归类为哺乳动物的动物,包括人类、家畜和农场动物,以及动物园、农场或宠物动物如狗、马、猫、牛等。在一些实施方案中,所述个体是人类个体。
应理解,本文所述的本发明的实施方案包括“由...组成”和/或“基本上由...组成”的实施方案。在本文中对“约”值或参数的提及包括(并描述了)针对该值或参数本身的变化。例如,提及“大约X”的描述,包括对“X”的描述。
如本文所用,对“不”值或参数的提及通常意指并描述了“除…外”值或参数。例如,所述方法不用于治疗X型癌症,意味着所述方法用于治疗除X型以外的癌症。
如本文所用,术语“大约X-Y”具有与“大约X至大约Y”相同的含义。
如本文和所附权利要求书中所使用的,单数形式“一个/一种(a/an)”和“所述”包括复数对象,除非上下文另外明确指出。还应注意,权利要求可以被撰写为排除任何可选的要素。因此此陈述旨在作为与权利要求要素的叙述结合使用诸如“只”、“仅”等排他性术语的先行基础,或使用“否”的限制。
如本文所用,术语“和/或”在词语诸如“A和/或B”中,旨在既包括A和B;A或B;A(单独);以及B(单独)。同样地,如本文所用,术语“和/或”在词语诸如“A、B和/或C”中,旨在包括以下每个实施方案:A、B和C;A、B或C;A或C;A或B;B或C;A和C;A和B;B和C;A(单独);B(单独);以及C(单独)。
核酸酶及效应蛋白
工程化的Cas12i核酸酶
在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含以下一种、两种、三种或四种基于参比Cas12i核酸酶的突变:
(1)将参比Cas12i核酸酶中与PAM相互作用的氨基酸替换为带正电的氨基酸;和/或
(2)将参比Cas12i核酸酶中参与打开DNA双链的氨基酸替换为带芳香环的氨基酸;和/或
(3)将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的氨基酸替换为带正电的氨基酸; 和/或
(4) 将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的氨基酸替换为带正电的氨基酸; 所述参比Cas12i核酸酶为天然Cas12i核酸酶或工程化的Cas12i核酸酶,例如天然Cas12i2核酸酶(比如其氨基酸序列如SEQ ID NO.1所定义)。
本申请提供了通过引入氨基酸突变来工程化改造酶的方法,所述氨基酸突变基于上述三种改造原理的任何一种或多种的组合,这导致体外和体内酶活性的增加。所述工程化Cas12i核酸酶含有一个或多个如以下1)-4)节中所描述的具体突变。在一些实施方式中,本申请中所述的任何一个或多个突变可以与现有的Cas12i突变组合(例如以下5)节中所描述的突变),以提供具有更高活性的工程化Cas12i核酸酶。
在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变。在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含将参比Cas12i核酸酶中参与打开DNA双链的一个或多个氨基酸替换为带芳香环的氨基酸。在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。
在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变;和2) 将参比Cas12i核酸酶中参与打开DNA双链的一个或多个氨基酸替换为带芳香环的氨基酸。在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变;和2) 将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中参与打开DNA双链的一个或多个氨基酸替换为带芳香环的氨基酸;和2) 将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸。
在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变;和2)将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中参与打开DNA双链的一个或多个氨基酸替换为带芳香环的氨基酸;和2)将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和2)将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。
在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变; 2) 将参比Cas12i核酸酶中参与打开DNA双链的一个或多个氨基酸替换为带芳香环的氨基酸;和3)将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变; 2) 将参比Cas12i核酸酶中参与打开DNA双链的一个或多个氨基酸替换为带芳香环的氨基酸;和3)将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变; 2)将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和3)将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸; 2) 将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和3)将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。
在一些实施方式中,提供了一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含: 1)将参比Cas12i核酸酶中与PAM相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变; 2) 将参比Cas12i核酸酶中参与打开DNA双链的一个或多个氨基酸替换为带芳香环的氨基酸; 3)将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和 4)将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。
1) 将参比Cas12i核酸酶中与PAM相互作用的氨基酸替换为带正电的氨基酸
在一些实施方式中,所述工程化的Cas12i核酸酶包含一个或多个基于参比Cas12i核酸酶(例如Cas12i2)的突变,所述突变为将参比Cas12i核酸酶中与PAM相互作用的氨基酸替换为带正电的氨基酸。在一些实施方式中, 所述工程化的Cas12i核酸酶包含一个、两个、三个、四个、五个、或六个所述氨基酸残基的替换。
在一些实施方式中, 所述与PAM相互作用的氨基酸是与PAM在三维结构上距离在9埃以内的氨基酸,例如可以为:与PAM在三维结构上距离在9埃以内的氨基酸、与PAM在三维结构上距离在8埃以内的氨基酸、与PAM在三维结构上距离在7埃以内的氨基酸、与PAM在三维结构上距离在6埃以内的氨基酸、与PAM在三维结构上距离在5埃以内的氨基酸、与PAM在三维结构上距离在4埃以内的氨基酸、或与PAM在三维结构上距离在3埃以内的氨基酸。
在一些实施方式中, 所述一个或多个基于参比Cas12i核酸酶的突变是在下述位置的一个或多个氨基酸: 176、178、226、227、229、237、238、264、447和563。在一些实施方式中, 所述一个或多个基于参比Cas12i核酸酶的突变是在下述一个或多个氨基酸: E176、E178、Y226、A227、N229、E237、K238、K264、T447、E563。在一些实施方式中, 所述一个或多个基于参比Cas12i核酸酶的突变是在下述一个或多个氨基酸:E176、K238、T447、E563。在一些实施方式中, 所述基于参比Cas12i核酸酶的突变位于563号氨基酸残基,例如E563。在一些实施方式中,所述氨基酸位置编号如SEQ ID NO.1所定义。
在本说明书的上下文中,E176的含义是;在所援引的氨基酸序列中,第176号氨基酸E(谷氨酸);在此,常见的氨基酸及其三字母和单字母缩写列举性地说明如下:
丙氨酸 Ala A; 精氨酸 Arg R; 天冬氨酸 Asp D; 半胱氨酸 Cys C; 谷氨酰胺Gln Q ; 谷氨酸 Glu E; 组氨酸 His H ; 异亮氨酸 Ile I; 甘氨酸 Gly G ; 天冬酰胺Asn N; 亮氨酸 Leu L ; 赖氨酸 Lys K; 甲硫氨酸 Met M ; 苯丙氨酸 Phe F;
脯氨酸 Pro P ; 丝氨酸 Ser S;苏氨酸 Thr T ; 色氨酸 Trp W;酪氨酸 Tyr Y; 缬氨酸 Val V。
如本文所用,“该氨基酸在X位置处, 其中所述氨基酸位置编号如SEQ ID NO.1所定义”的含义是:该氨基酸残基位于参比酶Cas12i的某位置处,其相当在SEQ ID NO: 1的X位置处, 而且参比酶 Cas12i 的氨基酸序列与 SEQ ID NO: 1 的氨基酸序列基于序列同源性相互对齐。例如,图7示出了CAS12i2(SEQ ID NO.1)与CAS12i1(SEQ ID NO.13)的氨基酸序列的同源性比对。本领域人员可以用本领域常用的软件,如Clustal Omega, 将任一参比Cas12i核酸酶的氨基酸序列与SEQ ID NO.1进行序列同一性比较和对齐(alignment),进而得到与本申请中所述基于SEQ ID NO.1所定义的氨基酸位点相对应的所述参比Cas12i核酸酶中的氨基酸位点。
在一些实施方式中, 所述基于参比Cas12i核酸酶的突变为将参比Cas12i核酸酶中相应的氨基酸残基替换为R或K。在一些实施方式中, 所述基于参比Cas12i核酸酶的突变为将参比Cas12i核酸酶中相应的氨基酸残基替换为R。
在一些实施方式中,所述工程化的Cas12i核酸酶包含以下一个或多个氨基酸残基:R176、R238、R447和R563, 其中,所述氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化的Cas12i核酸酶包含以下一个或多个基于参比Cas12i 核酸酶的突变:E176R、K238R、T447R和E563R;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化的Cas12i核酸酶包含E563R突变;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,为改善基因编辑效率的目的,也可以使用与上述经工程化的Cas12i核酸酶具有至少85%序列一致性的工程化酶;在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的工程化酶。
在本说明书的上下文中,E176R表示的含义是,在所援引的氨基酸序列中,将第176号氨基酸E(谷氨酸)替换为R(精氨酸)。
在一些实施方式中,所述工程化Cas12i核酸酶包含任一个在下述氨基酸残基位置的突变或突变组合: 176、238、264、447、563、176和238、176和447、176和563、238和447、238和563、447和563、176和238和447、176和238和563、176和447和563、238和447和563、176和238和 447和563;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述突变为将参比Cas12i核酸酶中相应的氨基酸残基替换为R或K,如R。在一些实施方式中,所述工程化Cas12i核酸酶包含任一个在下述氨基酸残基或组合: R176、R238、R264、R447、R563、R176+R238、R176+R447、R176+R563、R238+R447、R238+R563、R447+R563、R176+R238+R447、R176+R238+R563、R176+R447+R563、R238+R447+R563、R176+R238+R447+R563;其中,氨基酸位置编号如SEQ ID NO.1所定义。
在一些实施方式中,所述工程化Cas12i核酸酶包含下述突变/突变组合的任一个:E176R、K238R、E264R、T447R、E563R、E176R+K238R、E176R+T447R、E176R+E563R、K238R+T447R、K238R+E563R、T447R+E563R、E176R+K238R+T447R、E176R+K238R+ E563R、E176R+T447R+E563R、K238R+T447R+E563R、E176R+K238R+ T447R+E563R;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含下述突变/突变组合的任一个:E563R 、E176R+T447R、E176R+E563R、K238R+E563R、E176R+K238R+T447R、E176R+K238R+E563R、E176R+T447R+E563R、E176R+K238R+T447R+E563R;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R+K238R+T447R+E563R突变组合;其中,氨基酸位置编号如SEQ ID NO.1所定义。为改善基因编辑效率的目的,也可以使用与上述经工程化的Cas12i具有至少85%序列一致性的工程化酶;在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的工程化酶。
2) 将参比Cas12i 核酸 酶中参与打开DNA双链的氨基酸替换为带芳香环的氨基酸
在一些实施方式中,所述工程化的Cas12i核酸酶包含一个或多个基于参比Cas12i核酸酶(例如Cas12i2)的突变,所述突变为将参比Cas12i核酸酶中参与打开DNA双链的氨基酸替换为带芳香环的氨基酸。在一些实施方式中, 所述工程化的Cas12i核酸酶包含一个、两个、三个、四个、五个、或六个所述氨基酸残基的替换。
其中,所述参与打开DNA双链的一个或多个氨基酸是与PAM中相对于靶标链的3’端最后一个碱基对相互作用的氨基酸。例如,Cas12i2识别的PAM序列是5’-NTTN-3’碱基对,其中PAM序列中3’末端的N碱基与靶标链所形成的碱基对就是文本所述的“与PAM中相对于靶标链的3’端最后一个碱基对,”而该碱基对之后就是靶向位点的序列。
在一些实施方式中,所述一个或多个氨基酸位于下述位置: 163和/或164。在一些实施方式中,所述一个或多个氨基酸是下述一个或多个氨基酸: Q163、N164。在一些实施方式中,所述氨基酸为N164;其中氨基酸位置编号如SEQ ID NO.1所定义。
在一些实施方式中,所述参与打开DNA双链的氨基酸替换为F、Y或W。在一些实施方式中,所述参与打开DNA双链的氨基酸替换为F。在一些实施方式中,所述参与打开DNA双链的氨基酸替换为Y。
在一些实施方式中,所述工程化Cas12i核酸酶包含下述任一个或多个氨基酸残基:F163、Y163、W163、F164或Y164; 其中氨基酸位置编号如SEQ ID NO.1所定义。
在一些实施方式中,所述工程化Cas12i核酸酶包含下述任一个突变:Q163F、Q163Y、Q163W、N164F或N164Y。在一些实施方式中,其中氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含N164Y、或N164F突变。在一些实施方式中,所述工程化Cas12i核酸酶包含N164Y突变。在一些实施例中,为实现改善基因编辑效率的目的,也可以使用与上述工程化酶具有至少85%序列一致性的工程化酶;在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的酶。
3) 将参比Cas12i核酸酶中位于RuvC结构域并与单链DNA底物相互作用的氨基酸 替换为带正电的氨基酸
在一些实施方式中,所述工程化的Cas12i核酸酶包含一个或多个基于参比Cas12i核酸酶 (例如Cas12i2)的突变,所述突变为将参比Cas12i酶中位于RuvC结构域并与单链DNA底物相互作用的氨基酸替换为带正电的氨基酸。在一些实施方式中, 所述工程化的Cas12i酶包含一个、两个、三个、四个、五个、或六个所述氨基酸残基的替换。
其中,所述位于RuvC 结构域并与单链DNA底物相互作用的一个或多个氨基酸是在三维结构上与单链DNA底物距离在9埃以内的氨基酸,例如可以为:在三维结构上与单链DNA底物距离在8埃以内的氨基酸、在三维结构上与单链DNA底物距离在7埃以内的氨基酸、在三维结构上与单链DNA底物距离在6埃以内的氨基酸、在三维结构上与单链DNA底物距离在5埃以内的氨基酸、在三维结构上与单链DNA底物距离在4埃以内的氨基酸、在三维结构上与单链DNA底物距离在3埃以内的氨基酸。RuvC结构域是Cas12i蛋白中负责切割单链DNA或者双链DNA的酶活结构域。在蛋白质的一级序列中,Cas12i的RuvC结构域被分为3个部分:RuvC-1, RuvC-2以及RuvC-3。这3个部分在三维结构中相邻近,一同组成具有酶切活性的催化口袋。Cas12i2的三维晶体结构,其结构域组成,及与DNA底物相互作用的描述见Huang X. et al., Nature Communications, 11, Article number: 5241 (2020)。Cas12i1的三维晶体结构,其结构域组成,及与DNA底物相互作用的描述见Zhang H. et al. Nature Structural & Molecular Biology 27, 1069-1076(2020)。可以通过同源结构比较和建模(homology modeling)通过已知的Cas12i三维晶体结构,得到参比Cas12i和底物相互作用的三维结构模型。实施例3中描述了一种建模方式以得到Cas12i2中位于RuvC 结构域并与单链DNA底物距离在9埃以内的氨基酸。
在一些实施方式中,所述一个或多个氨基酸是下述位置的一个或多个氨基酸:323、362、425、925、926、390、391、392、751、755、840、848、851、856、885、897、929、932、327、355、359、360、361、414、421、650、652、705、708、709、752、928、388、393、417、418、424、653、696、1022。在一些实施方式中,所述一个或多个氨基酸是下述一个或多个氨基酸:E323、D362、Q425、N925、I926、N390、N391、F392、L751、E755、N840、N848、S851、A856、Q885、M897、G929、Y932、L327、V355、G359、G360、K361、Q414、K421、S650、E652、K705、K708、E709、S752、T928、L388、K393、L417、A418、Q424、G653、I696、A1022。在一些实施方式中,所述一个或多个氨基酸是下述一个或多个氨基酸:E323、D362、Q425、N925、I926、N391、Q424、G929、L388、L417。在一些实施方式中,所述氨基酸位置编号如SEQ ID NO.1所定义。
在一些实施方式中,所述工程化的Cas12i核酸酶包含将参比Cas12i核酸酶中参与双链DNA的切割的一个或多个氨基酸替换为R或K的突变。在一些实施方式中,所述工程化的Cas12i核酸酶包含将参比Cas12i核酸酶中参与双链DNA的切割的一个或多个氨基酸替换为为R的突变。
在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述氨基酸残基位置的突变或突变组合: 323、362、425、925、926和929;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述氨基酸残基位置的突变或突变组合: 323、362、425、925、926、323和362、323和425、323和926、362和425、362和926、425和926、925和926、323和362和425、323和362和926、323和 425和926、362和925和926、362和425和 926;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述突变为将所述位置氨基酸残基替换为R或K(如R)的突变。在一些实施方式中,所述工程化Cas12i核酸酶包含下述任何一个氨基酸或氨基酸组合:R323、R362、R425、R925、R926、R323+R362、R323+R425、R323+R926、R362+R425、R362+R926、R425+R926、R925+R926、R323+R362+R425、R323+R362+R926、R323+R425+R926、R362+R925+R926、 R362+R425+R926;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述突变或突变组合:E323R、D362R、Q424R、Q425R、N925R、I926R和G929R;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述突变或突变组合:E323R、D362R、Q425R、N925R、I926R、E323R+D362R、E323R+Q425R、E323R+I926R、Q425R+I926R、D362R+I926R、N925R+I926R、E323R+D362R+Q425R、E323R+D362R+I926R、E323R+Q425R+I926R、D362R+N925R+I926R、 E323R+D362R+Q425R+I926R;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含I926R突变;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含E323R+D362R突变;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施例中,为实现改善基因编辑效率的目的,也可以使用与上述工程化酶具有至少85%序列一致性的工程化酶。在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的酶。
4) 将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸替换 为带正电的氨基酸
在一些实施方式中,所述工程化的Cas12i核酸酶包含一个或多个基于参比Cas12i核酸酶 (例如Cas12i2)的突变,所述突变为将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸替换为带正电的氨基酸。在一些实施方式中, 所述工程化的Cas12i酶包含一个、两个、三个、四个、五个、或六个所述氨基酸残基的替换。
其中,所述与DNA-RNA双螺旋相互作用的一个或多个氨基酸是在三维结构上与DNA-RNA双螺旋距离在9埃以内的氨基酸,例如可以为:在三维结构上与DNA-RNA双螺旋距离在8埃以内的氨基酸、在三维结构上与DNA-RNA双螺旋距离在7埃以内的氨基酸、在三维结构上与DNA-RNA双螺旋距离在6埃以内的氨基酸、在三维结构上与DNA-RNA双螺旋距离在5埃以内的氨基酸、在三维结构上与DNA-RNA双螺旋距离在4埃以内的氨基酸、或在三维结构上与DNA-RNA双螺旋距离在3埃以内的氨基酸。某些Cas核酸酶的工作原理如下:Cas与指导RNA(如crRNA)形成复合体,其中crRNA和靶向DNA相互配对形成的DNA-RNA双螺旋,并与Cas核酸酶相互作用,打开双链靶向DNA,并形成R-loop,得以使Cas的酶切活性位点完成对dsDNA的切割。 Cas12i2的三维晶体结构,其结构域组成,及与DNA-RNA双螺旋相互作用的描述见Huang X. et al., Nature Communications, 11, Article number: 5241 (2020)。
在一些实施方式中,所述一个或多个氨基酸是下述位置的一个或多个氨基酸:116、117、156、159、161、301、305、306、308、312、313、427、433、438、441、442、852、855、861、865、160、316、319、320、247、343、348、349、679、683、691、782、783、797、800、853、957、958、293、294、或297。在一些实施方式中,所述一个或多个氨基酸是下述一个或多个氨基酸:G116、E117、A156、T159、S161、T301、I305、K306、T308、N312、F313、D427、K433、V438、N441、Q442、M852、L855、N861、Q865、E160、Q316、E319、Q320、E247、E343、E348、E349、N679、E683、E691、D782、E783、E797、E800、D853、S957、D958、G293、E294、或N297。在一些实施方式中,所述一个或多个氨基酸是下述一个或多个氨基酸:G116、E117、T159、S161、E319、E343、或D958。在一些实施方式中,所述一个或多个氨基酸是D958。在一些实施方式中,所述一个或多个氨基酸是在一些实施方式中,所述氨基酸位置编号如SEQ ID NO.1所定义。
在一些实施方式中,所述工程化的Cas12i核酸酶包含将参比Cas12i核酸酶中与DNA-RNA双螺旋相互作用的一个或多个氨基酸替换为R或K的突变。在一些实施方式中,所述工程化的Cas12i核酸酶包含将参比Cas12i核酸酶中参与DNA-RNA双螺旋相互作用的一个或多个氨基酸替换为为R的突变。
在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述氨基酸残基位置的突变或突变组合: 116、117、159、161、319、343、或958;其中,氨基酸位置编号如SEQ IDNO.1所定义。在一些实施方式中,所述突变为将所述位置氨基酸残基替换为R或K(如R)的突变。在一些实施方式中,所述工程化Cas12i核酸酶包含下述任何一个氨基酸或氨基酸组合:R116、R117、R159、R161、R319、R343、或R958;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述突变或突变组合:E323R、D362R、Q424R、Q425R、N925R、I926R和G929R;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述突变或突变组合:G116R、E117R、T159R、S161R、E319R、E343R、或D958R;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含I926R突变;其中,氨基酸位置编号如SEQID NO.1所定义。在一些实施方式中,所述工程化Cas12i核酸酶包含D958R突变;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施例中,为实现改善基因编辑效率的目的,也可以使用与上述工程化酶具有至少85%序列一致性的工程化酶。在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的酶。
5) 其它突变
在1)至4)节中描述的任一个或者多个突变可以结合任一个或多个增加Cas12i活性的已知突变,例如靶标结合、双链切割活性、切口酶活性和/或基因编辑活性。示例行的突变例如可见于下述文献 PCT/CN2020/0134249 和 CN 112195164 A , 这些文献通过整体引用而并入本文。
在一些实施方式中,所述工程化的Cas12i核酸酶还包含一个或多个柔性区突变,所述突变增加了参比Cas12i核酸酶中的柔性区的柔性(flexibility)。所述参比Cas12i核酸酶中的柔性区可以使用本领域中已知的任何方法来确定。在一些实施方案中,仅基于所述参比酶的氨基酸序列确定多个柔性区。在一些实施方案中,基于所述参比酶的结构信息确定多个柔性区,包括例如二级结构、晶体结构、NMR结构等。
此处所述的工程化改造Cas12i核酸酶柔性区的方法包括:(a)获得多种工程化的Cas12i核酸酶,每种工程化的Cas12i核酸酶包含一个或多个突变,所述突变增加了参比Cas12i核酸酶的多个柔性区中的柔性区柔性;以及(b)从所述多种工程化的Cas12i核酸酶中选择一种或多种工程化的Cas12i核酸酶,其中所述一种或多种工程化的Cas12i核酸酶与所述参比Cas12i核酸酶相比具有增加的活性。在一些实施方案中,所述方法还包括确定所述参比Cas12i核酸酶中的多个柔性区。在一些实施方案中,在真核细胞诸如哺乳动物细胞(例如人细胞)中测量活性。
在一些实施方案中,使用选自下组的程序确定多个柔性区:PredyFlexy、FoldUnfold、PROFbval、Flexserv、FlexPred、DynaMine和Disomine。在一些实施方案中,所述多个柔性区位于无规卷曲处。在一些实施方案中,所述多个柔性区在参比Cas12i核酸酶的与DNA和/或RNA相互作用的结构域中。在一些实施方案中,所述柔性区的长度为至少约5个(例如5个)氨基酸。
在一些实施方案中,所述一个或多个突变包括在柔性区中插入一个或多个(例如2个)甘氨酸(G)残基。在一些实施方案中,所述一个或多个G残基插入在柔性区中的柔性氨基酸残基的N末端,其中所述柔性氨基酸残基选自下组:G、丝氨酸(S)、天冬酰胺( N)、天冬氨酸(D)、组氨酸(H)、蛋氨酸(M)、苏氨酸(T)、谷氨酸(E)、谷氨酰胺(Q)、赖氨酸(K)、精氨酸(R)、丙氨酸(A)和脯氨酸(P)。在一些实施方案中,根据以下优先级选择所述柔性氨基酸残基:G>S>N>D>H>M>T>E>Q>K>R>A>P。在一些实施方案中,所述一个或多个突变包括用一个或多个G残基替换一个或多个非G残基。
在一些实施方案中,所述一个或多个突变包括用G残基替换柔性区中的疏水氨基酸残基,其中所述疏水氨基酸残基选自下组:亮氨酸(L)、异亮氨酸(I)、缬氨酸(V)、半胱氨酸(C)、酪氨酸(Y)、苯丙氨酸(F)和色氨酸(W)。
在一些实施方案中,所述活性是位点特异性核酸酶活性。在一些实施方案中,所述活性是真核细胞(例如人细胞)中的基因编辑活性。在一些实施方案中,所述基因编辑效率是使用如下方法来测量的:T7核酸内切酶1 (T7E1)测定、靶DNA的测序、由分解追踪插入缺失(TIDE)测定或通过扩增子分析进行插入缺失检测(IDAA)测定。
在一些实施方案中,所述工程化Cas12i核酸酶包含一个或多个突变,所述突变增加了参比Cas12i核酸酶(如Cas12i2核酸酶)中柔性区的柔性,所述柔性区选自对应于以下的区的组:氨基酸残基228-232、氨基酸残基439-443、氨基酸残基478-482、氨基酸残基500-504、氨基酸残基775-779和氨基酸残基925-929,其中所述氨基酸残基编号基于SEQ ID NO:1。在一些实施方案中,所述柔性区对应于氨基酸残基439-443或氨基酸残基925-929,其中所述氨基酸残基编号基于SEQ ID NO: 1。在一些实施方案中,所述参比Cas12i酶是Cas12i2。在一些实施方案中,所述一个或多个突变包括在所述柔性区中插入一个或多个(例如2个) G残基。在一些实施方案中,所述一个或多个G残基插入在所述柔性区中柔性氨基酸残基的N末端,其中所述柔性氨基酸残基选自下组:G、S、N、D、H、M、T、E、Q、K、R、A和P。在一些实施方案中,根据以下优先级选择所述柔性氨基酸残基:G>S>N>D>H>M>T>E>Q>K> R>A>P。在一些实施方案中,所述一个或多个突变包括用G残基替换柔性区中的疏水氨基酸残基,其中所述疏水氨基酸残基选自下组:L、I、V、C、Y、F和W。
在一些实施方式中,所述柔性区突变位于下述位置的一个或多个: 439、926。在一些实施方式中,它们是下述一个或多个氨基酸: L439、I926。
在一些实施方案中,所述工程化的Cas12i核酸酶包含氨基酸残基G926 和/或G439, 所述氨基酸残基编号基于SEQ ID NO: 1。在一些实施方案中,所述工程化的Cas12i核酸酶包含一个或多个下列柔性区突变:I926G;和/或439G或439GG。在一些实施方案中,所述工程化的Cas12i核酸酶包含I926G突变。在一些实施方案中,所述工程化的Cas12i核酸酶包含439G突变。在一些实施方案中,所述工程化的Cas12i核酸酶包含439GG突变。
在本说明书的上下文中,439G的含义是,在所援引的氨基酸序列中,在第439号氨基酸后插入一个甘氨酸(G)。而439GG的含义是,在所援引的氨基酸序列中,在第439号氨基酸后插入两个甘氨酸(GG)。
在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述氨基酸残基位置的突变或突变组合: 926、439、925和926、326和925和926、926和439、323和 362和926;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述位于氨基酸位置323、362、925或926的突变为将所述位置氨基酸残基替换为R或K(如R)的突变。在一些实施方式中,所述位于氨基酸位置439或926的突变为将所述位置氨基酸残基替换为G或在所述氨基酸残基后插入G或GG的突变。
在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述氨基酸残基或氨基酸残基组合: G926、439GG、R925+G926、R326+R925+G926、R926+439GG、或R323+R362+G926;其中,氨基酸位置编号如SEQ ID NO.1所定义。
在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述突变或突变组合:I926G、439GG、I926R+439GG、N925R+I926G、D362R+N925R+ I926G、E323R+D362R+I926G;其中氨基酸位置编号如SEQ ID NO.1所定义。
在一些实施方案中,为实现改善基因编辑效率的目的,也可以使用与上述工程化酶具有至少85%序列一致性的工程化酶。在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的酶。
6) 组合突变
利用根据本说明书中1)-5)节所描述的突变以及表1至表5中的多个氨基酸替换/插入的组合而得到的工程化酶都在本申请的请求保护范围之下。
在一些实施方案中,所述工程化的Cas12i核酸酶包含任一个下述氨基酸残基位置的突变或突变组合: 176、238、447、563、164、926、323、362、439、958、176和238和447和563、323和362、176和238和447和563和164、176和238和447和563和926、176和238和447和563和323和362、164和926、164和323和362、176和238和447和563和164和926、176和238和447和563和164和323和362、176和238和447和563和164和926和323和362、176和238和447和563和164和323和362和926和439;其中,氨基酸位置编号如SEQ ID NO.1所定义。在一些实施方式中,所述位于氨基酸位置176、238、447、563、926、323、 362或958的突变为将所述位置氨基酸残基替换为R或K(如R)的突变。在一些实施方式中,所述位于氨基酸位置164的突变为将所述位置氨基酸残基替换为Y或F(如Y)的突变。在一些实施方式中,所述位于氨基酸位置439或926的突变为将所述位置氨基酸残基替换为G或在所述氨基酸残基后插入G或GG的突变。
在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述氨基酸残基或氨基酸残基组合: R176、R238、R447、R563、Y164、R926、G926、R958、R323、R362、439G、439GG、R176+R238+R447+R563、R323+R362、R176+R238+R447+R563+Y164、R176+R238+R447+R563+R926、R176+R238+R447+R563+R323+R362、Y164+R926、Y164+R323+R362、R176+R238+R447+R563+Y164+R926、R176+R238+R447+R563+Y164+R323+R362、R176+R238+R447+R563+Y164+R926+R323+R362、R176+R238+R447+R563+Y164+R323+R362+G926、R176+R238+R447+R563+ Y164+R323+R362+G926+439G、R176+R238+R447+R563+ Y164+R323+R362+G926+439GG;
R176+R238+R447+R563+Y164+R958;
R176+R238+R447+R563+R926+R958;
R176+R238+R447+R563+R323+R362+R958;
Y164Y+R926+R958;
Y164+R323+R362+R958;
R176+R238+R447+R563+Y164+R958;
R176+R238+R447+R563+Y164+R926+R958;
R176+R238+R447+R563+Y164+R323+R362+R958;
R176+R238+R447+R563+Y164+R926+R323+R362+R958;
R176+R238+R447+R563+Y164+R323+R362+G926+R958;
R176+R238+R447+R563+Y164+R323+R362+G926+439GG+R958;或
R176+R238+R447+R563+Y164+R323+R362+G926+439G+R958;
其中,氨基酸位置编号如SEQ ID NO.1所定义。
在一些实施方式中,所述工程化Cas12i核酸酶包含任一个下述突变或突变组合:E176R+K238R+T447R+E563R、N164Y、I926R 、E323R+D362R、E176R+K238R+T447R+E563R+N164Y、E176R+K238R+T447R+E563R+I926R、N164Y+E323R+D362R 、E176R+K238R+T447R+E563R+E323R+D362R、N164Y+I926R、E176R+K238R+T447R+E563R+N164Y+I926R、E176R+K238R+T447R+E563R+N164Y+E323R+D362、E176R+K238R+T447R+E563R+N164Y+I926R+E323R+D362R、E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G、E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+439GG、E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+439G、E176R+K238R+T447R+E563R+N164Y+D958R、
E176R+K238R+T447R+E563R+I926R+D958R、
E176R+K238R+T447R+E563R+E323R+D362R+D958R、N164Y+I926R+D958R、N164Y+E323R+D362R+D958R、E176R+K238R+T447R+E563R+N164Y+D958R、E176R+K238R+T447R+E563R+N164Y+I926R+D958R、
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+D958R、
E176R+K238R+T447R+E563R+N164Y+I926R+E323R+D362R+D958R、
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+D958R、
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+439GG+D958R、或E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+ 439G+D958R;其中,氨基酸位置编号如SEQ ID NO.1所定义。
在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、E323R、和D362R突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、和I926R突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、E323R、和D362R突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、E323R、D362R、和I926G突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、和439GG突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、和439G突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、和D958R突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、I926R、和D958R突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、E323R、D362R、和D958R突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、I926R、E323R、D362R、和D958R突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、和D958R突变。在一些实施方式中,所述工程化Cas12i核酸酶包含E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、439GG、和D958R突变。
在一些实施方案中,为实现改善基因编辑效率的目的,也可以使用与上述工程化酶具有至少85%序列一致性的工程化酶;在一些实施方式中可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的酶。
在一些实施方案中,提供了一种工程化的Cas12i核酸酶,其包含如SEQ ID NO. 1~12中所示的任一氨基酸序列,或具有与SEQ ID NO. 1~12中所示的任一氨基酸序列具有至少85%(例如至少87%、89%、91%、93%、95%、97%、或99%)序列一致性的氨基酸序列。
6)参比Cas12i核酸酶
在一些实施方案中,所述参比Cas12i核酸酶为Cas12i1、Cas12i2,或其直系同源物。在一些实施方案中,所述参比Cas12i核酸酶为天然Cas12i1。在一些实施方案中,所述参比Cas12i核酸酶为天然Cas12i2。在一些实施方案中,所述参比Cas12i核酸酶为经过工程改造后的Cas12i核酸酶。
V-I型CRISPR-Cas12i已被鉴定为RNA-指导的DNA核酸内切酶系统。与诸如Cas12b或Cas9的CRISPR-Cas系统不同,基于Cas12i的CRISPR系统不需要tracrRNA序列。在一些实施方案中,所述RNA指导序列包括crRNA。通常,本文所述的crRNA包括直接重复序列和间隔区序列。在某些实施方案中,所述crRNA包括与指导序列或间隔区序列连接的直接重复序列、基本由或由其组成。在一些实施方案中,所述crRNA包括直接重复序列、间隔区序列和直接重复序列(DR-间隔区-DR),其是其他CRISPR系统中的前体crRNA (pre- crRNA)构型的典型特征。在一些实施方案中,所述crRNA包括截短的直接重复序列和间隔区序列,其是经加工的或成熟的crRNA的典型特征。在一些实施方案中,所述CRISPR-Cas12i效应蛋白与RNA指导序列形成复合物,并且所述间隔区序列将复合物引导至与靶核酸的序列特异性结合,所述靶核酸与间隔区序列互补。
在一些实施方案中,本申请的工程化的Cas12i是核酸内切酶,其结合靶序列的特定位点并在指导RNA的指导下切割,并且具有DNA和RNA内切核酸酶活性。在一些实施方案中,所述Cas12i能够通过加工前体crRNA阵列来进行自主的crRNA生物发生。自主的前体crRNA处理可促进Cas12i的递送,从而实现双切口应用,因为可以由单个crRNA转录物靶向两个单独的基因组位点。然后,Cas12i蛋白将CRISPR阵列加工成两个同源的crRNA,从而形成配对的切口复合物。V-I型(Cas12i)效应蛋白的复用(Multiplexing)是利用所述效应蛋白的前体crRNA处理能力完成的,其中可以针对具有不同序列的多个靶标在单个RNA指导序列上编程。这样,可以同时操纵多个基因或DNA靶标以用于治疗应用。在一些实施方案中,所述指导RNA包含由CRISPR阵列表达的前体crRNA,所述CRISPR阵列由与未加工的DR序列交错的靶序列组成,通过所述效应蛋白的内在前体crRNA加工而重复以使得能够同时靶向一个、两个或多个位点。
在一些实施方案中,VI型CRISPR-Cas12i效应蛋白能够识别原间隔区相邻基序(PAM),并且所述靶核酸包括PAM或由其组成,PAM包括核酸序列5'-TTN-3'、5'-TTH-3'、5'-TTY-3'或5'-TTC-3',或者由其组成。
来自多种生物体的Cas12i核酸酶可以用作所述参比Cas12i核酸酶,以提供本申请的工程化的Cas12i核酸酶及效应蛋白。示例性Cas12i核酸酶已经描述于例如WO2019/201331A1和US2020/0063126A1中,其通过整体引用而并入本文。在一些实施方案中,所述参比Cas12i核酸酶具有酶活性。在一些实施方案中,所述参比Cas12i是核酸酶,即切割靶双螺旋核酸(例如,双螺旋DNA)的两条链。在一些实施方案中,所述参比Cas12i是切口酶,即切割靶双螺旋核酸(例如,双螺旋DNA)的单链。在一些实施方案中,所述参比Cas12i核酸酶是酶失活的。在一些实施方案中,所述参比Cas12i酶是Cas12i1、Cas12i2或Cas12i-Phi。与Cas12i或其功能衍生物具有一定序列同一性(例如至少约60%、70%、80%、85%、90%、95%、98%或更多中任一个)的直系同源物可以用作设计本申请的工程化的Cas12i核酸酶或效应蛋白的基础。
在一些实施方案中,所述工程化的Cas12i核酸酶基于天然存在的Cas12i核酸酶的功能变体。在一些实施方案中,所述功能变体具有一个或多个突变,如氨基酸替换、插入和缺失。举例来说,与野生型天然存在的Cas12i核酸酶相比,所述功能变体可包含1、2、3、4、5、6、7、8、9、10个或更多个氨基酸替换中的任一个。在一些实施方案中,所述一个或多个替换是保守替换。在一些实施方案中,所述功能变体具有天然存在的Cas12i核酸酶的所有结构域。在一些实施方案中,所述功能变体不具有天然存在的Cas12i核酸酶的一个或多个结构域。
还提供了基于本文所述工程化的Cas12i2核酸酶中任一种的工程化的Cas12i效应蛋白。在一些实施方案中,所述工程化的Cas12i效应蛋白具有酶活性。在一些实施方案中,所述工程化的Cas12i效应蛋白是切割靶双螺旋核酸(例如,双螺旋DNA)的两条链的核酸酶。在一些实施方案中,所述工程化的Cas12i效应蛋白是切口酶,即切割靶双螺旋核酸(例如,双螺旋DNA)的单链。在一些实施方案中,所述工程化的Cas12i效应蛋白包含所述工程化的Cas12i核酸酶的酶失活突变体。Cas12i核酸酶活性位点中一个或多个氨基酸残基的突变会导致失去酶活的Cas12i。在一些实施方案中,本文提供的工程化的Cas12i酶可以被修饰以具有减少的核酸酶活性,例如,核酸酶与野生型Cas12i酶相比失活至少50%、至少60%、至少70%、至少80%、至少90%、至少95%,至少97%或100%。所述核酸酶活性可以通过几种方法来降低,例如,将突变引入所述核酸酶或Cas12i酶的PAM相互作用结构域中。在一些实施方案中,鉴定了核酸酶活性的催化残基,并且这些氨基酸残基可以被不同的氨基酸残基(例如,甘氨酸或丙氨酸)替换以降低所述核酸酶活性。Cas12i1的此类突变的实例包括D647A、E894A或D948A。Cas12i2的此类突变的实例包括D599A、E833A、S883A、H884A、 D886A、R900A和/或D1019A。
7)工程化的Cas12i核酸酶的活性
所述工程化的Cas12i核酸酶与所述参比Cas12i核酸酶相比具有增加的活性。在一些实施方案中,所述活性是靶DNA结合活性。在一些实施方案中,所述活性是位点特异性核酸酶活性。在一些实施方案中,所述活性是双链DNA切割活性。在一些实施方案中,所述活性是单链DNA切割活性,包括例如位点特异性DNA切割活性或非特异性DNA切割活性。在一些实施方案中,所述活性是单链RNA切割活性,例如位点特异性RNA切割活性或非特异性RNA切割活性。在一些实施方案中,所述活性是在体外测量的。在一些实施方案中,所述活性是在细胞如细菌细胞、植物细胞或真核细胞中测量的。在一些实施方案中,所述活性是在哺乳动物细胞如啮齿动物细胞或人细胞中测量的。在一些实施方案中,所述活性是在人细胞诸如293T细胞中测量的。在一些实施方案中,所述活性是在小鼠细胞,例如Hepa1-6细胞中测量的。在一些实施方案中,所述工程化的Cas12i核酸酶具有与参比Cas12i核酸酶相比增加至少约20%、30%、40%、60%、70%、80%、90%、1.5倍、2倍、3倍、4倍、5倍、10倍或更多中任一个的位点特异性核酸酶活性。所述工程化的Cas12i核酸酶的位点特异性核酸酶活性可以使用本领域中已知的方法来测量,包括例如,凝胶迁移测定, 如本文提供的实施例中所述的基于琼脂糖凝胶电泳的体外切割测定。
在一些实施方案中,所述活性是细胞中的基因编辑活性。在一些实施方案中,所述细胞是细菌细胞、植物细胞或真核细胞。在一些实施方案中,所述细胞是哺乳动物细胞如啮齿动物细胞或人细胞。在一些实施方案中,所述细胞是293T细胞。在一些实施方案中,所述活性是在小鼠细胞,例如Hepa1-6细胞中测量的。在一些实施方案中,所述活性是在细胞中靶基因组位点的插入缺失形成活性,例如通过所述工程化的Cas12i核酸酶对靶核酸进行位点特异性切割和通过非同源末端连接(NHEJ)机制进行DNA修复。在一些实施方案中,所述活性是在细胞中靶基因组位点插入外源核酸序列,例如通过所述工程化的Cas12i核酸酶对靶核酸进行位点特异性切割和通过同源重组(HR)机制进行DNA修复。在一些实施方案中,所述工程化的Cas12i核酸酶与参比Cas12i核酸酶相比在细胞(例如人细胞如293T细胞或小鼠Hepa1-6细胞)的基因组位点处增加至少约20%、30%、40%、60%、70%、80%、90%、1.5倍、2倍、3倍、4倍、5倍、10倍或更多中任一个的基因编辑(例如,插入缺失形成)活性。在一些实施方案中,所述工程化的Cas12i核酸酶与参比Cas12i2核酸酶相比在细胞(例如人细胞如293T细胞或小鼠Hepa1-6细胞)的多个(例如2、3、4、5、6、7、8、9、10个或更多个)基因组位点处增加至少约20%、30%、40%、60%、70%、80%、90%、1.5倍、2倍、3倍、4倍、5倍、10倍或更多中任一个的基因编辑(例如,插入缺失形成)活性。在一些实施方案中,所述工程化的Cas12i核酸酶与所述参比Cas12i核酸酶相比,能够编辑更多数目的基因组位点。在一些实施方案中,所述工程化的Cas12i核酸酶的共有PAM序列与所述参比Cas12i核酸酶相同。
可使用本领域已知的方法确定细胞中工程化的Cas12i核酸酶的基因编辑效率,包括例如T7核酸内切酶1 (T7E1)测定、靶DNA的测序(包括例如,Sanger序列,以及二代测序)、由分解追踪插入缺失(TIDE)测定或通过扩增子分析进行插入缺失检测(IDAA)测定。参见例如Sentmanat MF et al., “A survey of validation strategies for CRISPR-Cas9editing,”Scientific Reports, 2018, 8,文章编号888,其通过整体引用而并入本文。在一些实施方案中,例如,如本文实施例中所述,使用靶向的二代测序(NGS)来测量细胞中所述工程化的Cas12i核酸酶的基因编辑效率。用于确定所述工程化的Cas12i核酸酶的基因编辑效率的示例性基因组位点包括但不限于CCR5、AAVS、CD34、RNF2和EMX1。在一些实施方案中,所述工程化的Cas12i核酸酶的基因编辑效率为所述工程化的Cas12i核酸酶在至少5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个或更多位点(入人类细胞基因组位点)的平均基因编辑效率。在一些实施方案中,所述工程化的Cas12i核酸酶的基因编辑效率(例如插入缺失率)达到至少20%、30%、40%、45%、50%、55%、 60%、65%、 70%、75%、 80%、 85%或更高。
工程化的Cas12i效应蛋白
本申请提供了工程化的Cas12i(如Cas12i2)效应蛋白,其具有改善的活性,例如靶标结合、双链切割活性、切口酶活性和/或基因编辑活性。在一些实施方案中,提供了工程化的Cas12i效应蛋白(例如,Cas12i核酸酶、Cas12i切口酶、Cas12i融合效应蛋白或分割型(split) Cas12i效应蛋白),其包含本文所述工程化的Cas12i核酸酶或其功能衍生物中的任一种。
变体
本申请提供了工程化的Cas12i效应蛋白,其包含本文所述工程化的Cas12i核酸酶的功能变体。在一些实施方案中,当与相应的工程化的Cas12i核酸酶的氨基酸序列相比时,功能变体的氨基酸序列具有至少一个氨基酸残基的不同(例如,具有缺失、插入、替换和/或融合)。在一些实施方案中,所述功能变体具有一个或多个突变,如氨基酸替换、插入和/或缺失。举例来说,与工程化的Cas12i核酸酶相比,功能变体可包含1、2、3、4、5、6、7、8、9、10个或更多个氨基酸中任一个替换。在一些实施方案中,所述一个或多个替换是保守替换。在一些实施方案中,所述功能变体具有工程化的Cas12i核酸酶的所有结构域。在一些实施方案中,所述功能变体不具有工程化的Cas12i核酸酶的一个或多个结构域。
对于本文所述Cas12i变体蛋白(例如,切口酶Cas12i蛋白、失活或催化失活的Cas12i (dCas12i)、融合Cas12i)中任一种,所述Cas12i变体可包括具有上述相同参数(例如,存在的结构域、同一性百分比等)的Cas12i蛋白序列。
催化活性
在一些实施方案中,所述功能变体与其工程化的Cas12i核酸酶的非突变形式相比,具有不同的催化活性。在一些实施方案中,所述突变(例如,氨基酸替换、插入和/或缺失)在Cas12i效应蛋白的催化结构域(例如,RuvC结构域)中。在一些实施方案中,所述变体包含多个催化结构域中的突变。切割双链靶核酸的一条链而不切割另一条链的Cas12i效应蛋白,在本文中被称为“切口酶”(例如“Cas12i切口酶”)。在本文中,基本上不具有核酸酶活性的Cas12i蛋白称为失活Cas12i蛋白(“dCas12i”)(声明:在融合Cas12i效应蛋白的情况下,异源多肽(融合伴侣)可以提供核酸酶活性,将在下面进行详细说明)。在一些实施方案中,相对于其非突变形式而言,当突变酶的DNA切割活性小于约25%、10%、5%、1%、0.1%、0.01%或更低时,认为Cas12i效应蛋白基本上缺乏所有的DNA切割活性。
分割型Cas12i效应蛋白
本申请还提供了基于本文所述工程化的Cas12i效应蛋白中任一种的分割型Cas12i效应蛋白。分割型Cas12i效应蛋白对于递送可能是有利的。在一些实施方案中,所述工程化的Cas12i效应蛋白被分割成酶的两个部分,可以将它们重构在一起以提供基本起作用的Cas12i效应蛋白。可利用已知方法提供Cas效应蛋白,例如,Cas12和Cas9蛋白的分割形式已描述于例如WO2016/112242、WO2016/205749和PCT/CN 2020 /111057,其通过整体引用而并入本文。
在一些实施方案中,提供了分割型Cas12i效应蛋白,其包含第一多肽和第二多肽,所述第一多肽包含本文所述工程化的Cas12i核酸酶中任一种或其功能衍生物的N末端部分,所述第二多肽包含所述工程化的Cas12i核酸酶或其功能衍生物的C末端部分,其中所述第一多肽和第二多肽能够在包含指导序列的指导RNA存在下彼此缔合,以形成与靶核酸特异性结合的CRISPR复合物,所述靶核酸包含与所述指导序列互补的靶序列。在一些实施方案中,所述第一多肽和第二多肽各自包含二聚化结构域。在一些实施方案中,所述第一二聚化结构域和第二二聚化结构域在诱导剂(例如雷帕霉素)存在下彼此缔合。在一些实施方案中,所述第一多肽和第二多肽不包含二聚化结构域。在一些实施方案中,所述分割型Cas12i效应蛋白是自诱导的。
可以以不影响催化结构域的方式进行分割。Cas12i效应蛋白可以用作核酸酶(包括切口酶)或可以是灭活的酶,其本质上是具有很少或没有催化活性(例如由于其催化结构域中的突变)的RNA指导的DNA结合蛋白。
在一些实施方案中,Cas12i蛋白的核酸酶叶和α-螺旋叶表达为分开的多肽。尽管所述叶不自行相互作用,但RNA指导序列将它们募集到一个复合物中,所述复合物概括了全长Cas12i酶的活性并催化位点特异性的DNA切割。在一些实施方案中,经修饰的RNA指导序列可以用于通过防止二聚化而消除分割型酶的活性,从而允许诱导型二聚化系统的发展。所述分割型酶描述于例如,Wright, Addison V., et al. “Rational design of asplit-Cas9 enzyme complex,” Proc. Nat'l. Acad. Sci., 112.10 (2015): 2984-2989,其通过整体引用并入本文。
本文所述分割型Cas12i效应蛋白部分可设计为通过将参比工程化的Cas12i效应蛋白(例如全长工程化的Cas12i)在一个分割位置处分开(即,分割)成两半,所述位置是所述参比Cas12i效应蛋白的N端部分与C端部分分开的点。在一些实施方案中,所述N末端部分包含氨基酸残基1至X,而所述C末端部分包含氨基酸残基X+1至所述参比Cas12i效应蛋白的C末端。在该实例中,编号是连续的,但这并非必需的,因为还考虑了氨基酸(或编码它们的核苷酸)可以从分割的末端和/或突变(例如,插入、删除和替换)中任一个在所述多肽链的内部区域修剪而来,条件是重构的Cas12i效应蛋白保留了足够的DNA结合活性(如果需要)、DNA切口酶或切割活性,例如与所述参比Cas12i效应蛋白相比,具有至少40%、50%、60%、70%、80%、90%或95%活性。
可以通过计算机(in silico)设计分割点并将其克隆到构建体中。在此过程中,可以将突变引入分割型Cas12i效应蛋白,并且可以去除非功能结构域。在一些实施方案中,所述分割型Cas12i效应蛋白的两个部分或片段(即,N末端和C末端片段)可以形成完整的Cas12i效应蛋白,其包含例如完整Cas12i效应蛋白序列的至少70%、至少80%、至少90%、至少95%或至少99%。
所述分割型Cas12i效应蛋白可各自包含一个或多个二聚化结构域。在一些实施方案中,所述第一多肽包含与第一分割型Cas12i效应蛋白部分融合的第一二聚结构域,并且所述第二多肽包含与第二分割型Cas12i效应蛋白部分融合的第二二聚结构域。可通过肽接头(例如,柔性肽接头如GS接头)或化学键将所述二聚化结构域融合至所述分割型Cas12i效应蛋白部分。在一些实施方案中,所述二聚化结构域与所述分割型Cas12i效应蛋白部分的N末端融合。在一些实施方案中,所述二聚化结构域与所述分割型Cas12i效应蛋白部分的C末端融合。
在一些实施方案中该分割型Cas12i效应蛋白不包含任何二聚化结构域。
在一些实施方案中,所述二聚化结构域促进两个分割型Cas12i效应蛋白部分的缔合。在一些实施方案中,所述分割型Cas12i效应蛋白部分被诱导剂诱导而缔合或二聚化为功能性Cas12i效应蛋白。在一些实施方案中,所述分割型Cas12i效应蛋白包含可诱导的二聚化结构域。在一些实施方案中,所述二聚化结构域不是可诱导的二聚化结构域,即,所述二聚化结构域在诱导剂不存在下进行二聚化。
诱导剂可以是除指导RNA(例如sgRNA)以外的诱导能量源或诱导分子。所述诱导剂通过诱导的二聚化结构域的二聚化将两个分割型Cas12i效应蛋白部分重构为功能性Cas12i效应蛋白。在一些实施方案中,所述诱导剂通过可诱导的二聚化结构域的诱导缔合的作用将两个分割型Cas12i效应蛋白部分聚集在一起。在一些实施方案中,在没有诱导剂的情况下,两个分割型Cas12i效应蛋白部分不彼此缔合以重构为功能性Cas12i效应蛋白。在一些实施方案中,在没有诱导剂的情况下,两个分开的Cas12i效应蛋白部分可以在指导RNA(例如crRNA)存在下彼此缔合以重构为功能性Cas12i效应蛋白。
本申请的诱导剂可以是热、超声、电磁能或化合物。在一些实施方案中,所述诱导剂是抗生素、小分子、激素、激素衍生物、类固醇或类固醇衍生物。在一些实施方案中,所述诱导剂是脱落酸(ABA)、多西霉素(DOX)、异丙基苯甲酸(cumate)、雷帕霉素、4-羟基他莫昔芬(4OHT)、雌激素或蜕皮激素。在一些实施方案中,所述分割型Cas12i效应系统是选自下组的诱导剂控制的系统:基于抗生素的诱导系统、基于电磁能的诱导系统、基于小分子的诱导系统、基于核受体的诱导系统和基于激素的诱导系统。在一些实施方案中,所述分割型Cas12i效应系统是选自下组的诱导剂控制的系统:四环素(Tet)/DOX诱导系统、光诱导系统、ABA诱导系统、异丙基苯甲酸(cumate)阻遏物/操纵子系统、4OHT/雌激素诱导系统、基于蜕皮激素的诱导系统和FKBP12/FRAP (FKBP12-雷帕霉素复合物)诱导系统。这样的诱导剂也讨论于本文和PCT/US2013/051418,其通过整体引用而并入本文。FRB/FKBP/雷帕霉素系统已描述于Paulmurugan and Gambhir, Cancer Res, August 15, 2005 65; 7413,以及Crabtree et al., Chemistry & Biology 13, 99-107, Jan 2006,其通过整体引用而并入本文。
在一些实施方案中,成对的分割型Cas12i效应蛋白是分开的并且是无活性的,直到诱导了所述二聚化结构域的二聚化(例如,FRB和FKBP),该二聚化导致功能性Cas12i效应蛋白核酸酶的再组装。在一些实施方案中,包含诱导型二聚体(例如FRB)的第一半部分的第一分割型Cas12i效应蛋白被分开递送,和/或处在与包含诱导型二聚体(例如FKBP)的第二半部分的第二分割型Cas12i效应蛋白分开的位置。
可用于本文所述的诱导剂控制的分割型Cas12i效应系统中的其他示例性的基于FKBP的诱导系统包括但不限于:在FK506存在下与钙调神经磷酸酶(CNA)进行二聚化的FKBP;在FKCsA存在下与CyP-Fas进行二聚化的FKBP;在雷帕霉素存在下与FRB进行二聚化的FKBP;在香豆霉素存在下与GryB进行二聚化的GyrB;在赤霉素存在下与GID1进行二聚化的GAI;或在HaXS存在下与HaloTag进行二聚化的Snap-tag。
也考虑了FKBP家族本身内的替代方案。例如,在FK1012存在下FKBP进行均二聚(即,一个FKBP与另一种FKBP进行二聚化)。
在一些实施方案中,所述二聚化结构域是FKBP,而诱导剂是FK1012。在一些实施方案中,所述二聚化结构域是GryB,而诱导剂是香豆霉素。在一些实施方案中,所述二聚化结构域是ABA,而诱导剂是赤霉素。
在一些实施方案中,可以在不存在诱导剂的情况下自动诱导(即,自动激活或自诱导)所述分割型Cas12i效应蛋白部分以缔合/二聚化为功能性Cas12i效应蛋白。不受任何理论或假设的束缚,可以通过与指导RNA如crRNA结合来介导所述分割型Cas12i效应蛋白部分的自动诱导。在一些实施方案中,所述第一多肽和第二多肽不包含二聚化结构域。在一些实施方案中,所述第一多肽和第二多肽包含二聚化结构域。
在一些实施方案中,本文所述分割型Cas12i效应系统(包括诱导剂控制的和自动诱导的系统)的重构的Cas12i效应蛋白,相对于参比Cas12i效应蛋白编辑效率,具有至少70% (如至少约70%、75%、80%、85%、90%、95%、98%、99%或更多效率或100%效率中任一种)的编辑效率。
在一些实施方案中,本文所述诱导剂控制的分割型Cas12i效应系统的重构的Cas12i效应蛋白,在没有诱导剂存在下(即由于自动诱导),相对于参比Cas12i效应蛋白编辑效率,其具有不超过50%(如不超过约50%、45%、40%、35%、30%、25%、20%、15%、10%、5%或更低效率,或0%效率中任一个)的编辑效率。
融合Cas12i效应蛋白
本申请还提供了工程化的Cas12i效应蛋白,其包含另外的蛋白结构域和/或组分,如接头、核定位/输出序列、功能结构域和/或报告蛋白。
在一些实施方案中,所述工程化的Cas12i效应蛋白是包含一个或多个异源蛋白结构域(例如,约或大于约1、2、3、4、5、6、7、8、9、10个或更多个结构域)以及所述工程化的Cas12i核酸酶的核酸靶向结构域或其功能衍生物的蛋白复合物。在一些实施方案中,所述工程化的Cas12i效应蛋白是包含与所述工程化的Cas12i核酸酶融合的一个或多个异源蛋白结构域(例如约或多于约1、2、3、4、5、6、7、8、9、10个或更多个结构域)的融合蛋白。
在一些实施方案中,本申请的工程化的Cas12i效应蛋白可包含(例如,通过融合蛋白,如通过一个或多个肽接头,例如GS肽接头等) 一个或多个功能结构域或缔合(例如,通过多种蛋白的共表达)于它。在一些实施方案中,所述一个或多个功能结构域是酶结构域。这些功能结构域可以具有多种活性,例如DNA和/或RNA甲基化酶活性、脱甲基酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性和开关活性(例如,光诱导的)。在一些实施方案中,所述一个或多个功能结构域是转录激活结构域(即,反式激活结构域)或阻遏物结构域。在一些实施方案中,所述一个或多个功能结构域是组蛋白修饰结构域。在一些实施方案中,所述一个或多个功能结构域是转座酶结构域、HR(同源重组)机构结构域、重组酶结构域和/或整合酶结构域。在一些实施方案中,所述功能结构域是Krüppel相关盒(KRAB)、VP64、VP16、Fok1、P65、HSF1、MyoD1、生物素-APEX、APOBEC1、AID、PmCDA1、Tad1和M-MLV逆转录酶。在一些实施方案中,所述功能结构域选自下组:翻译起始结构域、转录阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域(例如,CBE或ABE结构域)、逆转录酶结构域、报告分子结构域(例如,荧光结构域)和核酸酶结构域。
在一些实施方案中,所述工程化的Cas12i效应蛋白中一个或多个功能结构域的定位允许功能结构域的正确空间定向以影响具有所赋予功能作用的靶标。例如,如果所述功能结构域是转录激活子(例如,VP16、VP64或p65),则将所述转录激活子放置在使其能够影响靶标转录的空间取向上。同样地,定位转录阻遏物以影响靶标的转录,并且将核酸酶(例如,Fok1)定位以切割或部分切割所述靶标。在一些实施方案中,所述功能结构域位于所述工程化的Cas12i效应蛋白的N末端。在一些实施方案中,所述功能结构域位于工程化的Cas12i效应蛋白的C末端。在一些实施方案中,所述工程化的Cas12i效应蛋白在N末端包含第一功能结构域,并在C末端包含第二功能结构域。在一些实施方案中,所述工程化Cas12i效应蛋白包含与一个或多个功能结构域融合的本文所述工程化的Cas12i核酸酶中任一种的催化失活突变体。
在一些实施方案中,所述工程化的Cas12i效应蛋白是转录激活子。在一些实施方案中,所述工程化的Cas12i效应蛋白包含与反式激活结构域融合的本文所述工程化的Cas12i核酸酶中任一种的酶失活变体。在一些实施方案中,所述反式激活域选自下组:VP64、p65、HSF1、VP16、MyoD1、HSF1、RTA、SET7/9及其组合。在一些实施方案中,所述反式激活结构域包含VP64、p65和HSF1。在一些实施方案中,所述工程化的Cas12i效应蛋白包含两个分割型Cas12i效应多肽,每个都与反式激活结构域融合。
在一些实施方案中,所述工程化的Cas12i效应蛋白是转录阻遏物。在一些实施方案中,所述工程化的Cas12i效应蛋白包含与转录阻遏结构域融合的本文所述工程化的Cas12i核酸酶中任一种的酶失活变体。在一些实施方案中,所述转录阻遏物结构域选自下组:Krüppel相关盒(KRAB)、EnR、NuE、NcoR、SID、SID4X及其组合。在一些实施方案中,所述工程化的Cas12i效应蛋白包含两个分割型Cas12i效应多肽,每个都与转录阻遏结构域融合。
在一些实施方案中,所述工程化的Cas12i效应蛋白是碱基编辑器,如胞嘧啶编辑器或腺苷编辑器。在一些实施方案中,所述工程化的Cas12i效应蛋白包含与核碱基编辑结构域融合的本文所述任何工程化的Cas12i核酸酶中任一种的酶失活变体,所述核碱基编辑结构域诸如为胞嘧啶碱基编辑(CBE)结构域或腺苷碱基编辑(ABE)域。在一些实施方案中,所述核碱基编辑结构域是DNA编辑结构域。在一些实施方案中,所述核碱基编辑结构域具有脱氨酶活性。在一些实施方案中,所述核碱基编辑结构域是胞嘧啶脱氨酶结构域。在一些实施方案中,所述核碱基编辑结构域是腺苷脱氨酶结构域。基于Cas核酸酶的示例性碱基编辑器描述于例如,WO2018/165629A1和WO2019/226953A1,其通过整体引用而并入本文。示例性CBE结构域包括但不限于:活化诱导的胞苷脱氨酶或AID (例如hAID)、载脂蛋白B mRNA编辑复合物或APOBEC(例如大鼠APOBEC1、hAPOBEC3 A/B/C/D/E/F/G)和PmCDA1。示例性ABE结构域包括但不限于:TadA、ABE8及其变体(参见例如Gaudelli et al., 2017, Nature 551:464-471; and Richter et al., 2020, Nature Biotechnology 38: 883-891)。在一些实施方案中,所述功能性结构域是APOBEC1结构域,例如大鼠APOBEC1结构域。在一些实施方案中,所述功能性结构域是TadA结构域,例如大肠杆菌(E. coli) TadA结构域。在一些实施方案中所述工程化的Cas12i效应蛋白还包含一个或多个核定位序列。
在一些实施方案中,所述工程化的Cas12i效应蛋白是主编辑器。基于Cas9的主编辑器描述于例如,A. Anzalone et al., Nature, 2019, 576 (7785): 149-157,其通过整体引用而并入本文。在一些实施方案中,所述工程化的Cas12i效应蛋白包含与逆转录酶结构域融合的本文所述工程化的Cas12i核酸酶中任一种的切口酶变体。在一些实施方案中,所述功能结构域是逆转录酶结构域。在一些实施方案中,所述逆转录酶结构域是M-MLV逆转录酶或其变体,例如具有D200N、T306K、W313F、T330P和L603W的一个或多个突变的M-MLV逆转录酶。在一些实施方案中,提供了包含所述主编辑器的工程化CRISPR/Cas12i系统。在一些实施方案中,所述工程化的CRISPR/Cas12i系统还包含第二Cas12i切口酶,例如基于与主编辑器的相同的工程化的Cas12i核酸酶。在一些实施方案中,所述工程化的CRISPR/Cas12i系统包含主编辑器指导RNA (pegRNA),其包含引物结合位点和逆转录酶(RT)模板序列。
在一些实施方案中,本申请提供了具有与分割型Cas12i效应蛋白部分之一或两者缔合(即,结合或融合)的一个或多个(例如,1、2、3、4、5、6个或更多个)功能结构域的分割型Cas12i效应系统。所述功能结构域可以作为所第一和/或第二分割型Cas12i效应蛋白的一部分提供,作为该构建体内的融合物。所述功能结构域通常通过肽接头(诸如GS接头)与分割型Cas12i效应蛋白中其他部分融合(例如,分割型Cas12i效应蛋白部分)。这些功能结构域可用于基于催化失活Cas12i效应蛋白重新改换该分割型Cas12i效应系统的功能。
在一些实施方案中,所述工程化的Cas12i效应蛋白包含一个或多个核定位序列(NLS)和/或一个或多个核输出序列(NES)。示例性的NLS序列包括例如PKKKRKVPG和ASPKKKRKV。NLS和/或NES可以可操作地连接至所述工程化的Cas12i效应蛋白的N末端和/或C末端或所述工程化的Cas12i效应蛋白中的多肽链。
在一些实施方案中,所述工程化的Cas12i效应蛋白可以编码另外的组分,例如报告蛋白。在一些实施方案中,所述工程化的Cas12i效应蛋白包含荧光蛋白,例如GFP。这样的系统可以允许对基因组位点进行成像(例如,参见“Dynamic Imaging of Genomic Loci inLiving Human Cells by an Optimized CRISPR/Cas System” Chen B et al. Cell2013)。在一些实施方案中所述工程化的Cas12i效应蛋白是可用于对基因组位点成像的可诱导分割型Cas12i效应系统。
在又一具体实施方案中,提供了一种工程化的Cas12i效应蛋白,其中所述效应蛋白能够诱导DNA分子中的双链断裂或单链断裂。
在再一具体实施方案中,提供了一种工程化的Cas12i效应蛋白,其中所述工程化的Cas12i核酸酶的功能衍生物为酶失活突变体,例如含有D599A、E833A、S883A、H884A、D886A、R900A和/或D1019A的Cas12i2核酸酶失活突变体,和含有D647A、E894A和/或D948A的Cas12i1核酸酶失活突变体。已知的Cas12i2核酸酶的酶失活突变体,如在US10808245B2和Huang X. et al., Nature Communications, 11, Article number: 5241 (2020)中描述的Cas12i2核酸酶的任何酶失活突变体都可以和本申请中的突变体组合在一起以提供工程化的Cas12i核酸酶的功能衍生物及其相应的效应蛋白。
在又一具体实施方案中,提供了一种工程化的Cas12i效应蛋白,其还包含与所述工程化的Cas12i核酸酶融合的功能结构域。
在再一具体实施方案中,提供了一种工程化的Cas12i效应蛋白,其中所述功能结构域选自下组:翻译起始结构域、转录阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域。
工程化的CRISPR-Cas12i系统
在一些实施方式中,提供了一种工程化的CRISPR-Cas12i系统,包括:(a)本申请所述的任一种工程化的Cas12i效应蛋白(如工程化Cas12i核酸酶);以及(b)包含与靶序列互补的指导序列的指导RNA,或编码所述指导RNA的一种或多种核酸,
其中所述工程化的Cas12i效应蛋白和所述指导RNA能够形成CRISPR复合物,所述CRISPR复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。
在一些实施方式中,所述工程化的CRISPR-Cas12i系统包括:(a)本文所述工程化的Cas12i效应蛋白中任一种(例如,工程化的Cas12i核酸酶、切口酶、分割型Cas12i、转录阻遏物、转录激活子、碱基编辑器或主编辑器);以及(b)包含与靶序列互补的指导序列的指导RNA,或编码所述指导RNA的一种或多种核酸,其中所述工程化的Cas12i效应蛋白和所述指导RNA能够形成CRISPR复合物,所述CRISPR复合物特异性结合于包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。在一些实施方案中,所述工程化的CRISPR-Cas12i系统包含编码所述工程化的Cas12i效应蛋白和/或所述指导RNA的一种或多种核酸。在一些实施方案中,所述工程化的CRISPR-Cas12i系统包含前体指导RNA阵列,其可以例如通过所述工程化的Cas12i效应蛋白加工成多个crRNA。在一些实施方案中,所述工程化的CRISPR-Cas12i系统包含一种或多种编码所述工程化的Cas12i效应蛋白和/或所述指导RNA的载体。在一些实施方案中,所述工程化的CRISPR-Cas12i系统包含核糖核蛋白(RNP)复合物,其包含结合至所述指导RNA的所述工程化的Cas12i效应蛋白。
本申请的工程化的CRISPR-Cas12i系统可包含任何合适的指导RNA。指导RNA(gRNA)可以包含能够与目标靶核酸(诸如细胞中的目标基因组位点)中的靶序列杂交的指导序列。在一些实施方案中,所述gRNA包含含有所述指导序列的CRISPR RNA(crRNA)序列。
通常,本文所述的crRNA包括直接重复序列和间隔区序列。在某些实施方案中,所述crRNA包括与指导序列或间隔区序列连接的直接重复序列、基本由或由它组成。在一些实施方案中,所述crRNA包括直接重复序列、间隔区序列和直接重复序列(DR-间隔区序列-DR),其是前体crRNA (pre-crRNA)构型的典型特征。在一些实施方案中,所述crRNA包括截短的直接重复序列和间隔区序列,其是经加工的或成熟的crRNA的典型特征。在一些实施方案中,所述CRISPR-Cas12i效应蛋白与RNA指导序列形成复合物,并且所述间隔区序列将所述复合物引导至与靶核酸进行序列特异性结合,所述靶核酸与间隔区序列互补。
在一些实施方案中,所述指导RNA是包含指导序列的crRNA。在一些实施方案中,所述工程化的CRISPR-Cas12i系统包含编码多个crRNA的前体指导RNA阵列。在一些实施方案中,所述Cas12i效应蛋白切割所述前体指导RNA阵列以产生多个crRNA。在一些实施方案中,所述工程化的CRISPR-Cas12i系统包含编码多个crRNA的前体指导RNA阵列,其中每个crRNA包含不同的指导序列。
所述指导序列可以具有合适的长度。在一些实施方案中,所述指导序列在约18至约35个核苷酸之间,包括例如18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。所述指导序列可以与靶核酸的靶序列具有至少约70%、75%、80%、85%、90%、95%、98%、99%或100%的互补性。
构建体和载体
本文还提供了编码本文所述工程化的Cas12i效应蛋白(例如工程化Cas12i核酸酶)中任一种的构建体、载体和表达系统。在一些实施方案中,所述构建体、载体或表达系统还包含一种或多种gRNA或crRNA阵列。
“载体”是包含分离的核酸并且可以用于将所述分离的核酸递送至细胞内部的物质组合物。许多载体是本领域已知的,包括但不限于:线性多核苷酸、与离子或两亲性化合物缔合的多核苷酸、质粒和病毒。通常,合适的载体包含在至少一种生物中起作用的复制起点、启动子序列、方便的限制性核酸内切酶位点和一种或多种选择性标记物。术语“载体”也应被解释为包括非质粒和非病毒化合物,其促进核酸转移到细胞中,诸如例如,聚赖氨酸化合物、脂质体等。
在一些实施方案中,所述载体是病毒载体。病毒载体的实例包括但不限于:腺病毒载体、腺相关病毒载体、慢病毒载体、逆转录病毒载体、牛痘载体、单纯疱疹病毒载体及其衍生物。在一些实施方案中,所述载体是噬菌体载体。病毒载体技术是本领域众所周知的,并且例如描述于Sambrook等人(2001, Molecular Cloning: A Laboratory Manual, ColdSpring Harbor Laboratory, New York),以及其他病毒学和分子生物学手册。
已经开发了许多基于病毒的系统,用于将基因转移到哺乳动物细胞中。例如,逆转录病毒为基因递送系统提供了便利的平台。可以使用本领域已知的技术将异源核酸插入载体,并包装在逆转录病毒颗粒中。然后可以分离重组病毒,并在体外或离体递送至所述工程化的哺乳动物细胞。许多逆转录病毒系统是本领域已知的。在一些实施方案中,使用腺病毒载体。许多腺病毒载体是本领域已知的。在一些实施方案中,使用慢病毒载体。在一些实施方案中,使用自灭活的慢病毒载体。
在某些实施方案中,所述载体是腺相关病毒(AAV)载体,例如AAV2、AAV8或AAV9,其可以按包含至少1×105个颗粒(也称为颗粒单位,pu)的单次给药施用腺病毒或腺相关病毒。在一些实施方案中,所述给药量是至少约1×106个颗粒,至少约1×107个颗粒,至少约1×108个颗粒,或至少约1×109个颗粒的腺相关病毒。递送方法和给药量描述于例如WO2016205764和美国专利No.8,454,972,其通过整体引用而并入本文。
在一些实施方案中,所述载体是重组腺相关病毒(rAAV)载体。例如,在一些实施方案中,可以使用经修饰的AAV载体递送。经修饰的AAV载体可以基于几种衣壳类型中的一种或多种,包括AAV1、AV2、AAV5、AAV6、AAV8、AAV8.2、AAV9、AAV rh10,经修饰的AAV载体(例如经修饰的AAV2,经修饰的AAV3,经修饰的AAV6)和假型AAV(例如AAV2/8,AAV2/5和AAV2/6)。可用于产生rAAV颗粒的示例性AAV载体和技术是本领域已知的(参见例如Aponte-Ubilluset al. (2018) Appl. Microbiol. Biotechnol. 102(3): 1045-54;Zhong et al.(2012) J. Genet. Syndr. Gene Ther. S1: 008;West et al. (1987) Virology 160:38-47 (1987);Tratschin et al. (1985) Mol. Cell. Biol. 5: 3251-60;美国专利Nos.4,797,368和5,173,414;国际公开第WO2015/054653号和第WO93/24641号,其各自通过引用并入本文)。
用于递送Cas9和其他Cas蛋白的任何已知的AAV载体都可以用于递送本申请的工程化的Cas12i系统。
将载体引入哺乳动物细胞的方法是本领域已知的。可以通过物理、化学或生物学方法将载体转移到宿主细胞中。
用于将载体引入宿主细胞的物理方法包括:磷酸钙沉淀、脂质转染、粒子轰击、显微注射、电穿孔等。产生包含载体和/或外源核酸的细胞的方法是本领域众所周知的。参见,例如Sambrook et al. (2001) Molecular Cloning: A Laboratory Manual, ColdSpring Harbor Laboratory, New York。在一些实施方案中,通过电穿孔将所述载体引入所述细胞。
用于将异源核酸引入宿主细胞的生物学方法包括使用DNA和RNA载体。病毒载体已成为将基因插入哺乳动物例如人细胞的最广泛使用的方法。
用于将载体引入宿主细胞的化学方法包括胶体分散系统如大分子复合物、纳米胶囊、微球、珠子和基于脂质的系统,所述基于脂质的系统包括水包油乳液、胶束、混合胶束和脂质体。用作体外递送载体的示例性胶体系统是脂质体(例如,人工膜囊泡)。在一些实施方案中,所述工程化的CRISPR-Cas12i系统以RNP的形式在纳米颗粒中递送。
在一些实施方案中,编码所述CRISPR-Cas12i系统或其组分的载体或表达系统包含一种或多种可选择或可检测的标记物,该标记物提供了分离或有效选择含有和/或已被CRISPR-Cas12i系统(例如在早期和大规模)修饰的细胞的手段。
报告基因可用于鉴定潜在转染的细胞和评估调节序列的功能。通常,报告基因是在受体生物体或组织中不存在或不表达的基因,其编码的多肽的表达是通过某些易于检测的性质(例如酶活性)来证明。在将DNA引入受体细胞后的合适时间测定报告基因的表达。合适的报告基因可以包括编码荧光素酶、β-半乳糖苷酶、氯霉素乙酰转移酶、分泌的碱性磷酸酶的基因或绿色荧光蛋白基因(例如Ui-Tei et al. FEBS Letters 479: 79-82 (2000))。
确认宿主细胞中异源核酸的存在的其他方法包括例如本领域技术人员众所周知的分子生物学测定,诸如Southern和Northern印迹、RT-PCR和PCR;生化测定,例如通过免疫学方法(如ELISA和Western印迹)检测特定肽的存在或不存在。
在一些实施方案中,编码所述工程化的Cas12i效应蛋白和/或所述指导RNA的核酸 序列与启动子可操作地连接。在一些实施方案中,所述启动子是相对于使用所述工程化的 CRISPR-Cas12i系统进行工程化改造的细胞的内源启动子。例如,可以使用本领域已知的任 何方法将编码所述工程化的Cas12i效应蛋白的核酸敲入工程化的哺乳动物细胞的基因组 中位于内源性启动子下游处。在一些实施方案中,所述内源启动子是丰富蛋白(如β-肌动蛋 白)的启动子。在一些实施方案中,所述内源启动子是可诱导的启动子,例如,可通过工程化 的哺乳动物细胞的内源激活信号来诱导。在一些实施方案中,其中所述工程化的哺乳动物 细胞是T细胞,所述启动子是T细胞活化依赖性启动子(诸如IL-2启动子、NFAT启动子或NF
Figure 271389DEST_PATH_IMAGE001
B启动子)。
在一些实施方案中,所述启动子是相对于使用所述工程化的CRISPR-Cas12i系统进行工程化改造的细胞的异源启动子。已经探索了多种启动子以在哺乳动物细胞中表达基因,并且本领域中已知的任何启动子都可以用于本申请中。启动子可大致分为组成型启动子或受调节的启动子,例如诱导型启动子。
在一些实施方案中,编码所述工程化的Cas12i效应蛋白和/或所述指导RNA的核酸序列与组成型启动子可操作地连接。组成型启动子允许异源基因(也称为转基因)在宿主细胞中组成型表达。本文考虑的示例性组成型启动子包括但不限于:巨细胞病毒(CMV)启动子、人延伸因子-1α (hEF1α)、泛素C启动子(UbiC)、磷酸甘油激酶启动子(PGK)、猿猴病毒40早期启动子(SV40)以及鸡β-肌动蛋白启动子与CMV早期增强子(CAG)耦联。在一些实施方案中,所述启动子是CAG启动子,其包含巨细胞病毒(CMV)早期增强子元件、启动子、鸡β-肌动蛋白基因的第一外显子和第一内含子,以及兔β-珠蛋白基因的剪接受体。
在一些实施方案中,编码所述工程化的CRISPR-Cas12i效应蛋白和/或所述指导RNA的核酸序列可操作地连接至诱导型启动子。诱导型启动子属于受调控的启动子类型。所述诱导型启动子可以通过一种或多种条件如物理条件、微环境或宿主细胞的生理状态、诱导物(即,诱导剂)或其组合来诱导。在一些实施方案中,所述诱导条件选自下组:诱导剂、辐照(如电离辐射、光)、温度(如热)、氧化还原状态、肿瘤环境和待通过工程化的CRISPR-Cas12i系统进行工程化改造的细胞的活化状态。在一些实施方案中,所述启动子可被小分子诱导剂诸如化合物诱导。在一些实施方案中,所述小分子选自下组:强力霉素、四环素、醇、金属或类固醇。化学诱导的启动子已被最广泛地研究。这样的启动子包括其转录活性受小分子化学物质例如强力霉素、四环素、醇、类固醇、金属和其他化合物的存在或不存在调节的启动子。具有逆四环素受控反式激活因子(rtTA)和四环素响应元件启动子(TRE)的强力霉素诱导系统是目前最成熟的系统。WO9429442描述了通过四环素响应性启动子严格控制真核细胞中基因表达。WO9601313公开了四环素调节的转录调节剂。另外,诸如Tet-on系统之类的Tet技术已描述于例如TetSystems.com网站。在本申请中,任何已知的化学调节的启动子均可用于驱动编码所述工程化的CRISPR-Cas12i蛋白和/或所述指导RNA的表达。
在一些实施方案中,编码所述工程化的Cas12i效应蛋白的核酸序列是经过密码子优化的。
在一些实施方案中,提供了表达构建体,其包含经密码子优化的序列,编码所述工程化的Cas12i效应蛋白的该序列连接到BPK2104-ccdB载体上。在一些实施方案中,所述表达构建体编码与所述工程化的Cas12i效应蛋白的C末端可操作连接的标签(例如10xHis标签)。
在一些实施方案中,每种工程化的分割型Cas12i构建体编码荧光蛋白诸如GFP或RFP。所述报告蛋白可以用于评估所述工程化的Cas12i蛋白的共定位和/或二聚化,例如使用显微镜。可以使用编码自切割肽诸如T2A、P2A、E2A或F2A肽的序列,将编码工程化的Cas12i效应蛋白的核酸序列与编码另外的组分的核酸序列融合。
在一些实施方案中,提供了用于哺乳动物细胞(例如人细胞)的表达构建体,所述构建体包含编码所述工程化的Cas12i效应蛋白的核酸序列。在一些实施方案中,所述表达构建体包含经密码子优化的序列,所述序列编码插入pCAG-2A-eGFP载体中的所述工程化的Cas12i效应蛋白,从而使Cas12i蛋白可操作地连接至eGFP。在一些实施方案中,提供第二载体用于在哺乳动物细胞(例如人细胞)中表达指导RNA(例如crRNA或前体crRNA阵列)。在一些实施方案中,编码所述指导RNA的序列在pUC19-U6-i2-cr RNA载体主链中表达。
III. 使用方法
本申请提供了使用本文所述工程化的Cas12i效应蛋白或CRISPR-Cas12i系统中任一种在体外、离体或体内检测靶核酸或修饰核酸的方法,以及使用所述工程化的Cas12i效应蛋白或CRISPR-Cas12i系统进行治疗或诊断的方法。还提供了本文所述工程化的Cas12i效应蛋白或CRISPR-Cas12i系统用于检测或修饰细胞中的核酸,以及用于治疗或诊断受试者的疾病或病况的用途;以及包含所述工程化的Cas12i效应蛋白中任一种或所述工程化的CRISPR-Cas12i系统的一种或多种组分的组合物在制备用于检测或修饰细胞中的核酸以及用于治疗或诊断受试者的疾病或病况的药物中的用途。
检测样品中靶核酸的方法
本申请还提供了使用具有改善的活性的所述工程化的Cas12i效应蛋白或CRISPR-Cas12i系统中任一种来检测靶核酸的方法。使用Cas12i效应蛋白作为检测试剂可利用以下发现:一旦通过检测到靶DNA而被激活,V型CRISPR/Cas蛋白(例如, Cas12i)可混杂地切割非靶向单链DNA(ssDNA或RNA,即指导RNA的指导序列不与之杂交的单链核酸)。因此,当样品中存在靶DNA(双链或单链)时(例如,在某些情况下超过阈值量),结果是样品中单链核酸的切割,这可使用任何方便的检测方法进行检测(例如,使用加标签的单链检测核酸如DNA或RNA)。Cas12i可以切割ssDNA和ssRNA。例如使用Cas蛋白作为检测试剂的方法描述于US10253365和WO2020/056924,其通过整体引用而并入本文。
在一些实施方案中,提供了检测样品中的靶DNA(例如,双链或单链)的方法,其包括:(a)使所述样品与以下项接触:(i)本文所述工程化的Cas12i效应蛋白中任一种;(ii)指导RNA,其包含与所述靶DNA杂交的指导序列;和(iii)检测核酸,其为单链的(即“单链检测核酸”)并且不与所述指导RNA的指导序列杂交;以及(b)测量通过所述工程化的Cas12i效应蛋白切割所述单链检测核酸而产生的可检测信号。在某些情况下,所述单链检测核酸包括发射荧光的染料对(例如,发射荧光的染料对是荧光共振能量转移(FRET)对、猝灭剂/荧光对)。在某些情况下,所述靶DNA是病毒DNA (例如,乳头状病毒、肝DNA病毒、疱疹病毒、腺病毒、痘病毒、细小病毒等)。在一些实施方案中,所述单链检测核酸是DNA。在一些实施方案中,所述单链检测核酸是RNA。
本公开的用于检测样品中的靶DNA(单链或双链)的方法,可以以高灵敏度检测靶DNA。在一些情况下,本公开的方法可以用于检测存在于包含多个DNA(包括所述靶DNA和多个非靶DNA)的样品中的靶DNA,其中所述靶DNA以每107个非靶DNA中的一个或更多个拷贝存在(例如,每106个非靶DNA中的一个或更多个拷贝,每105个非靶DNA中的一个或更多个拷贝,每104个非靶DNA中的一个或更多个拷贝,每103个非靶DNA中的一个或更多个拷贝,每102个非靶DNA中的一个或更多个拷贝,每50个非靶DNA中的一个或更多个拷贝,每20个非靶DNA中的一个或更多个拷贝,每10个非靶DNA中的一个或更多个拷贝或每5个非靶DNA中的一个或更多个拷贝)。在一些实施方案中,与所述参比Cas12i核酸酶相比,本文所述工程化的Cas12i效应蛋白可以以更高的灵敏度检测靶DNA。在一些实施方案中,与所述参比Cas12i核酸酶相比,所述工程化的Cas12i效应蛋白可以以10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%或更高的灵敏度检测靶DNA。
修饰的方法
在一些实施方案中,本申请提供了修饰包含靶序列的靶核酸的方法,所述方法包括使所述靶核酸与本文所述工程化的CRISPR-Cas12i系统中任一种接触。在一些实施方案中,所述方法在体外进行。在一些实施方案中,所述靶核酸存在于细胞中。在一些实施方案中,所述细胞是细菌细胞、酵母细胞、哺乳动物细胞、植物细胞或动物细胞。在一些实施方案中,所述方法离体进行。在一些实施方案中,所述方法在体内进行。
在一些实施方案中,通过所述工程化的CRISPR-Cas12i系统切割所述靶核酸或改变所述靶核酸中的靶序列。在一些实施方案中,通过所述工程化的CRISPR-Cas12i系统改变所述靶核酸的表达。在一些实施方案中,所述靶核酸是基因组DNA。在一些实施方案中,所述靶序列与疾病或病况相关。在一些实施方案中,所述工程化的CRISPR-Cas12i系统包含编码多个crRNA的前体指导RNA阵列,其中每个crRNA包含不同的指导序列。
在一些实施方案中,本申请提供了处理与个体细胞中的靶核酸相关的疾病或病况的方法,其包括使用本文所述方法中任一种来修饰所述个体细胞中的所述靶核酸,从而处理所述疾病或病况。在一些实施方案中,所述疾病或病况选自下组:癌症、心血管疾病、遗传性疾病、自身免疫疾病、代谢性疾病、神经退行性疾病、眼病、细菌感染和病毒感染。
本文所述工程化的CRISPR-Cas12i系统可以用多种方式修饰细胞中的靶核酸,这取决于所述CRISPR-Cas12i系统中工程化的Cas12i效应蛋白的类型。在一些实施方案中,所述方法诱导靶核酸中的位点特异性切割。在一些实施方案中,所述方法在细胞如细菌细胞、植物细胞或动物细胞(例如哺乳动物细胞)中切割基因组DNA。在一些实施方案中,所述方法通过切割细胞中的基因组DNA来杀死细胞。在一些实施方案中所述方法在细胞中切割病毒核酸。
在一些实施方案中,所述方法改变(如增加或减少)细胞中所述靶核酸的表达水平。在一些实施方案中,所述方法例如基于融合至反式激活结构域的无酶活性的Cas12i蛋白,使用工程化的Cas12i效应蛋白来提高细胞中所述靶核酸的表达水平。在一些实施方案中,所述方法例如基于融合至转录阻遏结构域的无酶活性的Cas12i蛋白,使用工程化的Cas12i效应蛋白来降低细胞中所述靶核酸的表达水平。在一些实施方案中,所述方法例如基于融合至表观遗传修饰结构域的无酶活性的Cas12i蛋白,使用工程化的Cas12i效应蛋白将表观遗传修饰引入细胞中的所述靶核酸。本文所述工程化的Cas12i系统可用于将其他修饰引入所述靶核酸,这取决于所述工程化的Cas12i效应蛋白所包含的功能结构域。
在一些实施方案中,所述方法改变细胞中所述靶核酸中的靶序列。在一些实施方案中,所述方法将突变引入细胞中的所述靶核酸。在一些实施方案中,所述方法使用一种或多种内源性DNA修复途径,如非同源末端连接(NHEJ)或同源定向重组(HDR),在细胞中修复靶DNA中诱导的双链断裂,作为由CRISPR复合物进行序列特异性切割的结果。示例性的突变包括但不限于:插入、缺失、替换和移码。在一些实施方案中,所述方法在靶位点处插入供体DNA。在一些实施方案中,供体DNA的插入导致将选择性标记物或报告蛋白引入所述细胞。在一些实施方案中,供体DNA的插入导致基因的敲入。在一些实施方案中,供体DNA的插入导致敲除突变。在一些实施方案中,供体DNA的插入导致替换突变诸如单核苷酸替换。在一些实施方案中,所述方法诱导细胞的表型变化。
在一些实施方案中,所述工程化的CRISPR-Cas12i系统用于基因电路(geneticcircuit)的一部分,或用于将基因电路插入细胞的基因组DNA中。本文所述的诱导剂控制的工程化的分割型Cas12i效应蛋白尤其可用作基因电路的组分。基因电路可用于基因疗法。设计和使用基因电路的方法和技术是本领域已知的。可以进一步参考例如Brophy,Jennifer AN, and Christopher A. Voigt. "Principles of genetic circuitdesign." Nature methods 11.5 (2014): 508。
本文所述工程化的CRISPR-Cas12i系统可用于修饰多种靶核酸。在一些实施方案中,所述靶核酸在细胞中。在一些实施方案中,所述靶核酸是基因组DNA。在一些实施方案中,所述靶核酸是染色体外DNA。在一些实施方案中,所述靶核酸对于细胞是外源的。在一些实施方案中,所述靶核酸是病毒核酸诸如病毒DNA。在一些实施方案中,所述靶核酸是细胞中的质粒。在一些实施方案中,所述靶核酸是经水平转移(horizontally transferred)的质粒。在一些实施方案中,所述靶核酸是RNA。
在一些实施方案中,所述靶核酸是经分离的核酸诸如经分离的DNA。在一些实施方案中,所述靶核酸存在于无细胞的环境中。在一些实施方案中,所述靶核酸是经分离的载体诸如质粒。在一些实施方案中,所述靶核酸是经分离的线性DNA片段。
本文描述的方法适用于任何合适的细胞类型。在一些实施方案中,所述细胞是细菌、酵母细胞、真菌细胞、藻类细胞、植物细胞或动物细胞(例如,哺乳动物细胞,如人细胞)。在一些实施方案中,所述细胞是自然来源的诸如由组织活检分离出的细胞。在一些实施方案中,所述细胞是从体外培养的细胞系分离的细胞。在一些实施方案中,所述细胞来自原代细胞系。在一些实施方案中,所述细胞来自永生化细胞系。在一些实施方案中,所述细胞是基因工程化的细胞。
在一些实施方案中,所述细胞是选自下组的生物的动物细胞:牛、绵羊、山羊、马、猪、鹿、鸡、鸭、鹅、兔和鱼。
在一些实施方案中,所述细胞是选自下组的生物的植物细胞:玉米、小麦、大麦、燕麦、水稻、大豆、油棕、红花、芝麻、烟草、亚麻、棉花、向日葵、珍珠小米、粟米、高粱、油菜、大麻、蔬菜作物、饲料作物、工业作物、木本作物和生物质作物。
在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述细胞是人细胞。在一些实施方案中,所述人细胞是人胚胎肾293T (HEK293T或293T)细胞或HeLa细胞。在一些实施方案中,所述细胞是人胚肾(HEK293T)细胞。在一些实施方案中,所述细胞是小鼠Hepa1-6细胞。在一些实施方案中,所述哺乳动物细胞选自下组:免疫细胞、肝细胞、肿瘤细胞、干细胞、合子、肌肉细胞和皮肤细胞。
在一些实施方案中,所述细胞是选自下组的免疫细胞:细胞毒性T细胞、辅助T细 胞、天然杀伤(NK)T细胞、iNK-T细胞、NK-T样细胞、
Figure 188530DEST_PATH_IMAGE002
T细胞、肿瘤浸润性T细胞和树突状细胞 (DC)激活的T细胞。在一些实施方案中,所述方法产生经修饰的免疫细胞,诸如CAR-T细胞或 TCR-T细胞。
在一些实施方案中,所述细胞是胚胎干(ES)细胞、诱导性多能干(iPS)细胞、配子的祖细胞、配子、合子或胚胎中的细胞。
本文所述的方法可以用于在体内、离体或体外修饰靶细胞,并且可以用改变所述细胞的方式进行,以使得一旦被修饰,所述经修饰的细胞的后代或细胞系就保留经改变的表型。所述经修饰的细胞和后代可以是多细胞生物的一部分,诸如具有离体或体内应用(如基因组编辑和基因疗法)的植物或动物。
在一些实施方案中,所述方法离体进行。在一些实施方案中,将所述工程化的CRISPR-Cas12i系统引入细胞后,所述经修饰的细胞(例如,哺乳动物细胞)离体繁殖。在一些实施方案中,将所述经修饰的细胞培养以繁殖至少约1天、2天、3天、4天、5天、6天、7天、10天、12天或14天中任一个。在一些实施方案中,将所述经修饰的细胞培养不超过约1天、2天、3天、4天、5天、6天、7天、10天、12天或14天中任一个。在一些实施方案中,进一步评价或筛选所述经修饰的细胞以选择具有一种或多种所需表型或特性的细胞。
在一些实施方案中,所述靶序列是与疾病或病况相关的序列。示例性的疾病或病况包括但不限于:癌症、心血管疾病、遗传性疾病、自身免疫性疾病、代谢性疾病、神经退行性疾病、眼病、细菌感染和病毒感染。在一些实施方案中,所述疾病或病况是遗传疾病。在一些实施方案中,所述疾病或病况是单基因疾病或病况。在一些实施方案中,所述疾病或病况是多基因疾病或病况。
在一些实施方案中,与野生型序列相比,所述靶序列具有突变。在一些实施方案中,所述靶序列具有与疾病或病况相关的单核苷酸多态性(SNP)。
在一些实施方案中,插入所述靶核酸中的供体DNA编码选自下组的生物产物:报告蛋白、抗原特异性受体、治疗性蛋白、抗生素抗性蛋白、RNAi分子、细胞因子、激酶、抗原、抗原特异性受体、细胞因子受体和自杀多肽。在一些实施方案中,所述供体DNA编码治疗性蛋白。在一些实施方案中,所述供体DNA编码可用于基因疗法的治疗性蛋白。在一些实施方案中,所述供体DNA编码治疗性抗体。在一些实施方案中,所述供体DNA编码工程化的受体,诸如嵌合抗原受体(CAR)或工程化的TCR。在一些实施方案中,所述供体DNA编码治疗性RNA,诸如小RNA(例如,siRNA、shRNA或miRNA)或长的非编码RNA (lincRNA)。
本文所述的方法可以用于在两个或更多个(例如2、3、4、5、6、8、10个或更多)不同的靶位点处进行多重基因编辑或调节。在一些实施方案中,所述方法检测或修饰多个靶核酸或靶核酸序列。在一些实施方案中,所述方法包括使靶核酸与包含多个(例如2、3、4、5、6、8、10个或更多) crRNA序列的指导RNA接触,其中每个crRNA均包含不同的靶序列。
还提供了包含经修饰的靶核酸的工程化的细胞,所述细胞使用本文所述方法中任一种来产生。所述工程化的细胞可以用于细胞疗法。可以使用本文所述用于细胞疗法的方法将自体或同种异体细胞用于制备工程化的细胞。
本文所述的方法还可用于生成细胞(例如哺乳动物细胞)的等基因系以研究遗传变体。
还提供了包含本文所述工程化的细胞的工程化非人类动物。在一些实施方案中,所述工程化的非人类动物是经过基因组编辑的非人类动物。所述工程化的非人类动物可以用作疾病模型。
产生非人类基因组编辑或转基因动物的技术是本领域众所周知的,包括但不限于:原核显微注射、病毒感染、对胚胎干细胞和诱导性多能干(iPS)细胞的转化。可以使用的详细方法包括但不限于Sundberg和Ichiki描述的方法(2006, Genetically EngineeredMice Handbook, CRC Press)和Gibson描述的方法(2004, A Primer Of Genome Science2nd ed. Sunderland, Mass.: Sinauer)。
所述工程化的动物可以是任何合适的物种,包括但不限于:牛、马、羊、犬、鹿、猫科动物,山羊、猪、灵长类,以及了解较少的哺乳动物诸如大象、鹿、斑马或骆驼。
治疗方法
在一些实施方式中,提供了前述工程化的CRISPR-Cas12i系统在制备治疗与个体的细胞中靶核酸相关的疾病或病症的药物中的用途。
进一步提供了使用根据本文所述的修饰细胞中的靶核酸的方法中的任一种的治疗方法。在一些实施方案中,本申请提供了治疗与个体细胞中的靶核酸相关的疾病或病况的方法,其包括使所述靶核酸与本文所述工程化的CRISPR-Cas12i系统中任一种接触,其中所述指导RNA的指导序列与所述靶核酸的靶序列互补,其中所述工程化的Cas12i效应蛋白和所述指导RNA彼此缔合以结合至所述靶核酸以修饰所述靶核酸,从而使所述疾病或病况得到治疗。在一些实施方案中,将突变(例如,敲除或敲入突变)引入所述靶核酸。在一些实施方案中,所述靶核酸的表达被增强。在一些实施方案中,所述靶核酸的表达被抑制。在一些实施方案中,本申请提供了治疗个体的疾病或病况的方法,其包括向所述个体施用有效量的本文所述工程化的CRISPR-Cas12i系统中任一种以及编码治疗剂的供体DNA,其中所述指导RNA的指导序列与所述个体的靶核酸的靶序列互补,其中所述工程化的Cas12i效应蛋白和所述指导RNA彼此结合以结合至所述靶核酸并将供体DNA插入所述靶序列中,从而使所述疾病或病况得到治疗。
在一些实施方案中,本申请提供了治疗个体的疾病或病况的方法,其包括向所述个体施用有效量的包含经修饰的靶核酸的工程化的细胞,其中所述工程化的细胞是通过使所述细胞与本文所述工程化的CRISPR-Cas12i系统中任一种接触而制备的,其中所述指导RNA的指导序列与所述靶核酸的靶序列互补,其中所述工程化的Cas12i效应蛋白和所述指导RNA相互缔合以结合至靶核酸以修饰所述靶核酸。在一些实施方案中,所述工程化的细胞是免疫细胞。在一些实施方案中,所述个体是人。在一些实施方案中,所述个体是动物,例如模型动物诸如啮齿动物、宠物或农场动物。在一些实施方案中,所述个体是哺乳动物。
在一些实施方案中,所述疾病或病况选自下组:癌症、心血管疾病、遗传性疾病、自身免疫性疾病、代谢性疾病、神经退行性疾病、眼病、细菌感染和病毒感染。在一些实施方案中,所述靶核酸是PCSK9。在一些实施方案中,所述疾病或病况是心血管疾病。在一些实施方案中,所述疾病或病况是冠状动脉疾病。在一些实施方案中,所述方法降低个体的胆固醇水平。在一些实施方案中,所述方法治疗个体的糖尿病。
递送方法
在一些实施方案中,本文所述工程化的CRISPR-Cas12i系统或其组分、其核酸分子、或编码或提供其组分的核酸分子可通过多种递送系统诸如质粒或病毒递送至宿主细胞(例如,上面“构建体和载体”小节中描述的载体中的任一种)。在一些实施方案或方法中,所述工程化的CRISPR-Cas12i系统可以通过其他方法递送,如由所述工程化的Cas12i效应蛋白及其一个或多个同源RNA指导序列组成的核糖核蛋白复合物的核转染或电穿孔。
在一些实施方案中,通过纳米颗粒或外泌体来递送。
在一些实施方案中,成对的Cas12i切口酶复合物可以使用纳米颗粒或其他直接蛋白递送方法直接递送,使得包含两个成对的crRNA元件的复合物被共同递送。此外,蛋白可以通过病毒载体或直接地递送至细胞,然后直接递送包含针对双切口的两个成对间隔区的CRISPR阵列。在某些情况下,对于直接RNA递送,可以将RNA缀合于至少一个糖部分诸如N-乙酰基半乳糖胺(GalNAc)(特别是三触角GalNAc)。
试剂盒和制品
还提供了包含本文所述工程化的Cas12i核酸酶、工程化的Cas12i效应蛋白或工程化的CRISPR-Cas12i系统中任一种的一种或多种组分的组合物、试剂盒、单位药剂和制品。
在一些实施方案中,提供了试剂盒,其包含:一个或多个AAV载体,其编码本文所述工程化的Cas12i核酸酶、工程化Cas12i效应蛋白或工程化CRISPR-Cas12i系统中任一种。在一些实施方案中,所述试剂盒还包含一种或多种指导RNA。在一些实施方案中,所述试剂盒还包含供体DNA。在一些实施方案中,所述试剂盒还包含细胞诸如人细胞。
所述试剂盒可包含一种或多种额外组分,诸如容器、试剂、培养基、细胞因子、缓冲液、抗体等,以允许工程化的细胞的繁殖。所述试剂盒还可包含用于施用组合物的装置。
所述试剂盒还可包含使用本文所述工程化的CRISPR-Cas12i系统的说明书,诸如检测或修饰靶核酸的方法。在一些实施方案中,所述试剂盒包含用于处理或诊断疾病或病况的说明书。与所述试剂盒组分使用有关的说明书通常包括针对该刻意处理的给药量、给药时间表和给药途径的信息。所述容器可以是单位剂量、散装包装(例如多剂量包装)或亚单位剂量。例如,可以提供这样的试剂盒(其包含足够剂量的本文所公开的组合物)以在延长的时期内提供对个体的有效处理。试剂盒还可以包括多个单位剂量的组合物和使用说明书,其包装数量足以在药房(例如医院药房和复方药房)中存储和使用。
本发明的试剂盒处于合适的包装中。合适的包装包括但不限于:小瓶、瓶子、广口瓶、软包装(例如密封的聚酯薄膜或塑料袋)等。试剂盒可以任选地提供额外的组分,如缓冲液和解释性信息。因此,本申请还提供了一种制品,其包括小瓶(如密封的小瓶)、瓶子、广口瓶、柔性包装等。
所述制品可以包括容器以及在容器上或与容器粘合的标签或包装插页。合适的容器包括例如瓶子、小瓶、注射器等。所述容器可以由多种材料(诸如玻璃或塑料)形成。通常,所述容器容纳有效处理本文所述的疾病或病症的组合物,并且可以具有无菌进入口(例如,容器可以是静脉注射溶液袋或具有可通过皮下注射针刺穿的塞子的小瓶)。所述标签或包装插页表明该组合物用于处理个体中的特定病况。所述标签或包装插页将进一步包括用于将组合物向个体施用的说明书。
包装插页是指通常包含在治疗产品的商业包装中的说明,所述说明包含关于使用此类治疗产品的适应症、用法、给药量、施用、禁忌症和/或警告的信息。
此外,所述制品还可包括第二容器,其包含药学上可接受的缓冲液,如抑菌注射用水(BWFI)、磷酸盐缓冲盐水、林格氏溶液和葡萄糖溶液。从商业和用户的角度来看,它还可以包括其他材料,包括其他缓冲液、稀释剂、过滤器、针头和注射器。
实施例部分
下面将参照附图更详细地描述本发明的具体实施例。虽然附图中显示了本发明的具体实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
实施例1:将参比Cas12i2酶中与PAM相互作用的氨基酸替换为带正电的氨基酸,并验证其基因编辑效率。
质粒构建
Cas12i2的编码序列经过密码子优化(人类)并合成。通过基于PCR的定点诱变产生Cas蛋白的变体。具体的方法是以突变的位点为中心将Cas12i2蛋白的DNA序列设计分成两部分,设计两对引物分别扩增这两部分DNA序列,同时引物上引入需要突变的序列,最后通过Gibson克隆的方式将两个片段装载到pCAG-2A- eGFP载体上。突变体的组合则通过将Cas12i2蛋白的DNA拆分成多段,使用PCR、Gibson clone实现构建。突变体的位置确定使用本领域常用的蛋白质结构可视化软件(例如PyMol、Chimera等软件都可以选用)分析Cas12i2的结构信息而获得的。Cas12i2的结构信息参照PDB: 6LTU, 6LTR, 6LU0, 6LTP)。Cas12i2效应蛋白通过pCAG-2A-eGFP载体在人293T细胞中表达。将编码Cas12i2蛋白的DNA插入XmaI和NheI之间。通过将含有靶序列的退火寡核苷酸连接到BasI消化的pUC19-U6-i2-crRNA骨架中构建了在293T中表达Cas12i2的crRNA的载体。
细胞培养、转染以及荧光激活细胞分选法(FACS)
将HEK293T细胞在含1%青霉素-链霉素(Gibco)和10%胎牛血清(Gibco)的DMEM(Gibco)中培养。将细胞接种在24-细胞培养皿(Corning)中16小时,直到融合度达到70%。通过使用Lipofectamine 3000 (Invitrogen),将600ng编码Cas12i2蛋白的质粒和3000ng编码crRNA的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-EDTA (0 .05%)(Gibco)消化荧光激活细胞分选(FACS) 的HEK293T细胞。使用具有GFP信号的MoFlo XDP(Beckman Coulter) 进行细胞分选。
靶向深度测序分析以进行基因组修饰
将FACS分选的GFP-阳性293FT细胞用缓冲液L裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsDNA片段进行PCR扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)PCR直接扩增靶位点。纯化PCR产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用CRISPResso2软件分析插入缺失的频率(%)。在本申请中,统一使用插入缺失的频率(%)这一指标来进行基因编辑效率的对比和分析。数量少于完整读取的0 .05%的读取被废弃。
实施例1-A 选出了四个具有单个氨基酸替换的工程化Cas12i2
按照实施例1描述的方法分别表达氨基酸序列具有单个突变的工程化Cas12i2酶,优选的氨基酸替换方式及其相应的基因编辑效率的见于图1和表1。在图1中,我们首先选取了Cas12i2距离PAM DNA 9Å以内的10个氨基酸:E176、E178、Y226、A227、N229、E237、K238、K264、T447、E563,进行精氨酸(R)的点突变测试。通过在293T细胞中比较这些突变体与野生型Cas12i2在2个基因组位点:CCR5-3、 RNF2-7的基因编辑效率,我们发现,带有下述氨基酸替换的突变体:E176R、K238R、T447R和E563R能够有效地提高基因编辑效率(图1中显示,有四种氨基酸替换都获得了高于约10%(此为针对CCR5-3的参比酶的基因编辑效率)以及高于约12%(此为针对RNF2-7的参比酶的基因编辑效率)插入缺失率,明显优于其他的单个氨基酸替换方案),其余6种突变体则对基因编辑效率的提高没有帮助,甚至有严重的负面影响。
实施例1-B 比较同时具有多个优选的氨基酸替换的工程化Cas12i2
按照实施例1描述的方法分别表达其氨基酸序列同时具有两个以上优选的氨基酸替换的工程化Cas12i2酶,其组合方式及其基因编辑效率的对比见于表1和图2。图2显示,我们将由实施例1-A筛选得到的E176R、K238R、T447R和E563R这4个能够提高效率的突变体中的点突变进行组合。通过在293T细胞中比较这些突变体与野生型Cas12i2在3个基因组位点:CCR5-3, CCR5-5,、RNF2-7的基因编辑效率,我们发现点突变组合之后能够获得效率更进一步提升的突变体。尤其是当把4种突变组合到一起(E176R+K238R+ T447R+E563R)时能够获得效率最优的组合突变。
实施例1的实验结果总结
Figure 968267DEST_PATH_IMAGE004
表1 实施例1的结果(基因编辑效率)总结
实施例2:将参比Cas12i2酶中参与打开 DNA双链的氨基酸替换为带芳香环的氨基酸,并分别验证它们的基因编辑的效率
质粒构建
通过基于PCR的定点诱变产生Cas12i2蛋白的变体,具体的方法是以突变的位点为中心将Cas12i2蛋白的DNA序列设计分成两部分,设计两对引物分别扩增这两部分DNA序列,同时引物上引入需要突变的序列,最后通过Gibson clone的方式将两个片段装载到pCAG-2A-eGFP载体上。氨基酸替换位置的确定可以使用常见的蛋白质结构可视化软件(例如,可以采用PyMol、Chimera等软件)分析Cas12i2的结构信息得到。Cas12i2的结构信息参照PDB:6LTU, 6LTR, 6LU0, 6LTP)。Cas12i2效应蛋白通过pCAG-2A-eGFP载体在人293T细胞中表达。将编码Cas12i2蛋白的DNA插入XmaI和NheI之间。通过将含有靶序列的退火寡核苷酸连接到BasI消化的pUC19-U6-i2-crRNA骨架中构建了在293T中表达Cas12i2 crRNA的载体。
细胞培养、转染以及荧光激活细胞分选法(FACS)
将HEK293T细胞在含1%青霉素-链霉素(Gibco)和10%胎牛血清(Gibco)的DMEM(Gibco)中培养。将细胞接种在24-细胞培养皿(Corning)中16小时,直到融合度达到70%。通过使用Lipofectamine 3000 (Invitrogen),将600ng编码Cas12i2蛋白的质粒和3000ng编码crRNA的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-EDTA (0 .05%)(Gibco)消化荧光激活细胞分选(FACS) 的HEK293T细胞。使用具有GFP信号的MoFlo XDP(Beckman Coulter) 进行细胞分选。
靶向深度测序分析以进行基因组修饰
将FACS分选的GFP-阳性293FT细胞用缓冲液L裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsDNA片段进行PCR扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)PCR直接扩增靶位点。纯化PCR产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用CRISPResso2软件分析插入缺失的频率(%)。数量少于完整读取的0 .05%的读取被废弃。
从图2可以看出,首先我们选取了Cas12i2酶中参与打开 DNA双链的氨基酸:Q163和N164进行带有芳香环的氨基酸(Y, F, W)的点突变测试。通过在293T细胞中比较这些突变体与野生型Cas12i2在3个基因组位点:CCR5-3, CCR5-5, RNF2-7的基因编辑效率,我们发现,有5个突变体:Q163W, Q163Y, Q163F, N164Y, N164F能够有效地提高基因编辑效率(至少在一个基因组位点)。可以得出结论: N164Y以及 N164F在3个基因组位点都展示了极佳的基因编辑效率;而N164W相比于参比酶无任何改善基因编辑效率的效果。
实施例2的实验结果总结
Figure 363476DEST_PATH_IMAGE006
表2 实施例2的结果(基因编辑效率)总结
实施例3:将参比Cas12i2酶中位于RuvC结构域并与单链DNA底物相互作用的氨基酸替换为带正电的氨基酸,并验证其基因编辑的效率
质粒构建
通过基于PCR的定点诱变产生Cas12i2蛋白的变体,具体的方法是以突变的位点为中心将Cas12i2蛋白的DNA序列设计分成两部分,设计两对引物分别扩增这两部分DNA序列,同时引物上引入需要突变的序列,最后通过Gibson clone的方式将两个片段装载到pCAG-2A-eGFP载体上。突变体的组合则通过将Cas12i2蛋白的DNA拆分成多段,使用PCR、Gibsonclone实现构建。突变体的位置确定是用常用的蛋白质结构可视化软件(例如,PyMol、Chimera等软件均可采用)分析Cas12i2的结构信息得到的。Cas12i2的结构信息参照PDBID: 6LTU, 6LTR, 6LU0, 6LTP。这些Cas12i2结构中显示的ssDNA底物只有5nt。为了得到更长的ssDNA与Cas12i2相互作用的信息,我们将Cas12i1的结构(PDB ID: 6W5C, 6W62和6W64; Zhang H. et al. Nature Structural & Molecular Biology 27, 1069-1076(2020)) 与Cas12i2的结构做了同源比对,以便将该Cas12i1结构中的ssDNA底物(9nt)放入了Cas12i2的RuvC催化口袋,通过该模型进一步寻找9A之内的氨基酸。Cas12i2效应蛋白通过pCAG-2A-eGFP载体在人293T细胞中表达。将编码Cas12i2蛋白的DNA插入XmaI和NheI之间。通过将含有靶序列的退火寡核苷酸连接到BasI消化的pUC19-U6-i2-crRNA骨架中构建了在293T中表达Cas12i2 crRNA的载体。
细胞培养、转染以及荧光激活细胞分选法(FACS)
将HEK293T细胞在含1%青霉素-链霉素(Gibco)和10%胎牛血清(Gibco)的DMEM(Gibco)中培养。将细胞接种在24-细胞培养皿(Corning)中16小时,直到融合度达到70%。通过使用Lipofectamine 3000 (Invitrogen),将600ng编码Cas12i2蛋白的质粒和3000ng编码crRNA的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-EDTA (0 .05%)(Gibco)消化荧光激活细胞分选(FACS) 的HEK293T细胞。使用具有GFP信号的MoFlo XDP(Beckman Coulter) 进行细胞分选。
靶向深度测序分析以进行基因组修饰
将FACS分选的GFP-阳性293FT细胞用缓冲液L裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsDNA片段进行PCR扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)PCR直接扩增靶位点。纯化PCR产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用CRISPResso2软件分析插入缺失的频率(%)。数量少于完整读取的0 .05%的读取被废弃。
在图3a中,我们将参比Cas12i2酶中位于RuvC结构域并与单链DNA底物相互作用的氨基酸替换为带正电的氨基酸。通过在293T细胞中比较这些突变体与野生型Cas12i2在2个基因组位点:CCR5-3、RNF2-7的基因编辑效率,我们发现,有3个突变体:N391R、I926R、G929R能够有效地提高基因编辑效率(至少在一个基因组位点)。其中 I926R在2个基因组位点都展示了极佳的基因编辑效率。
在图3b、3c中,我们通过进一步将参比Cas12i2酶中位于RuvC结构域并与单链DNA底物相互作用的氨基酸替换为带正电的氨基酸。通过在293T细胞中比较这些突变体与野生型Cas12i2在2个基因组位点:CCR5-3、RNF2-7的基因编辑效率,我们发现,有许多突变体能够有效地提高基因编辑效率(至少在一个基因组位点)。其中基因编辑效率提高的单个氨基酸替换方案的排名为:D362R>E323R>Q425R>N925R>其他效率提高的突变体。
在图3d中,我们将图3a、3b、3c筛选得到的E323R、D362R、Q425R和I926R这4个能够提高效率的突变体中的点突变进行组合。通过在293T细胞中比较这些突变体与野生型Cas12i2在2个基因组位点:CCR5-3, RNF2-7的基因编辑效率,我们发现点突变组合之后能够获得效率更进一步提升的突变体。
在图3e中,我们将图3a、3b、3c筛选得到的部分能够提高效率的突变体中的点突变与I926G, 439GG进行组合。通过在293T细胞中比较这些突变体与野生型Cas12i2在2个基因组位点:CCR5-3, RNF2-7的基因编辑效率,我们发现点突变组合之后能够获得效率更进一步提升的突变体。
实施例3的实验结果总结
Figure 177848DEST_PATH_IMAGE007
Figure 62628DEST_PATH_IMAGE008
表3 实施例3的结果(基因编辑效率)总结。 *439GG的含义是,在439号氨基酸后插入两个甘氨酸。
实施例4:将参比Cas12i2酶中与DNA-RNA双螺旋相互作用的氨基酸替换为带正电的氨基酸,并验证其基因编辑的效率
质粒构建
通过基于PCR的定点诱变产生Cas12i2蛋白的变体,具体的方法是以突变的位点为中心将Cas12i2蛋白的DNA序列设计分成两部分,设计两对引物分别扩增这两部分DNA序列,同时引物上引入需要突变的序列,最后通过Gibson clone的方式将两个片段装载到pCAG-2A-eGFP载体上。突变体的组合则通过将Cas12i2蛋白的DNA拆分成多段,使用PCR、Gibsonclone实现构建。突变体的位置确定是用常用的蛋白质结构可视化软件(例如,PyMol、Chimera等软件均可采用)分析Cas12i2的结构信息得到的。Cas12i2的结构信息参照PDB:6LTU, 6LTR, 6LU0, 6LTP)。Cas12i2效应蛋白通过pCAG-2A-eGFP载体在人293T细胞中表达。将编码Cas12i2蛋白的DNA插入XmaI和NheI之间。通过将含有靶序列的退火寡核苷酸连接到BasI消化的pUC19-U6-i2-crRNA骨架中构建了在293T中表达Cas12i2 crRNA的载体。
细胞培养、转染以及荧光激活细胞分选法(FACS)
将HEK293T细胞在含1%青霉素-链霉素(Gibco)和10%胎牛血清(Gibco)的DMEM(Gibco)中培养。将细胞接种在24-细胞培养皿(Corning)中16小时,直到融合度达到70%。通过使用Lipofectamine 3000 (Invitrogen),将600ng编码Cas12i2蛋白的质粒和3000ng编码crRNA的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-EDTA (0 .05%)(Gibco)消化荧光激活细胞分选(FACS) 的HEK293T细胞。使用具有GFP信号的MoFlo XDP(Beckman Coulter) 进行细胞分选。
靶向深度测序分析以进行基因组修饰
将FACS分选的GFP-阳性293FT细胞用缓冲液L裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsDNA片段进行PCR扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)PCR直接扩增靶位点。纯化PCR产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用CRISPResso2软件分析插入缺失的频率(%)。数量少于完整读取的0 .05%的读取被废弃。
图4和表4总结了在293T细胞中比较本实施例中的Cas12i2突变体与野生型Cas12i2在2个基因组位点:CCR5-3、RNF2-7的基因编辑效率。我们发现,有7个突变体:G116R、E117R、T159R、S161R、E319R、E343R、和D958R能够有效地提高基因编辑效率(至少在一个基因组位点)。其中 D958R在2个基因组位点都展示了极佳的基因编辑效率。
实施例4的实验结果总结
Figure 329661DEST_PATH_IMAGE009
Figure 528561DEST_PATH_IMAGE010
表4 实施例4的结果(基因编辑效率)总结。
实施例5:将实施例1-4中筛选得到的部分提高基因编辑效率Cas12i2工程化改造氨基酸突变进行组合,并验证它们的基因编辑的效率。
质粒构建
突变体的组合则通过将Cas12i2蛋白的DNA拆分成多段,使用PCR、Gibson clone实现构建。突变体的位置确定是使用常用蛋白质结构可视化软件(例如,PyMol、Chimera等软件都可以采用)分析Cas12i2的结构信息得到的。Cas12i2的结构信息参照PDB: 6LTU,6LTR, 6LU0, 6LTP)。Cas12i2效应蛋白通过pCAG-2A-eGFP载体在人293T细胞中表达。将编码Cas12i2蛋白的DNA插入XmaI和NheI之间。通过将含有靶序列的退火寡核苷酸连接到BasI消化的pUC19-U6-i2-crRNA骨架中构建了在293T中表达Cas12i2 crRNA的载体。
细胞培养、转染以及荧光激活细胞分选法(FACS)
将HEK293T细胞在含1%青霉素-链霉素(Gibco)和10%胎牛血清(Gibco)的DMEM(Gibco)中培养。将细胞接种在24-细胞培养皿(Corning)中16小时,直到融合度达到70%。通过使用Lipofectamine 3000 (Invitrogen),将600ng编码Cas12i2蛋白的质粒和3000ng编码crRNA的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-EDTA (0 .05%)(Gibco)消化荧光激活细胞分选(FACS) 的HEK293T细胞。使用具有GFP信号的MoFlo XDP(Beckman Coulter) 进行细胞分选。
靶向深度测序分析以进行基因组修饰
将FACS分选的GFP-阳性293FT细胞用缓冲液L裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsDNA片段进行PCR扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)PCR直接扩增靶位点。纯化PCR产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用CRISPResso2软件分析插入缺失的频率(%)。数量少于完整读取的0 .05%的读取被废弃。
在图5中,我们将实施例1、2、3中筛选得到的氨基酸突变或者氨基酸突变组合:E176R+K238R+T447R+E563R, N164Y, E323R+D362R, I926R, E323R+D362R+I926R, E323R+D362R+I926G, E323R+D362R+I926G+439G, E323R+D362R+I926G+439GG进行进一步的组合。通过在293T细胞中比较这些突变体与野生型Cas12i 作用于5个基因组位点:CCR5-3,CCR5-5, CD34-8, CD34-9, RNF2-14的基因编辑效率,我们发现点突变组合之后能够获得效率更进一步提升的突变体。同时,将我们认为效率最优的突变体(E176R+K238R+T447R+E563R+N164Y+E323R+D362R)命名为CasXX。
实施例5的结果总结(仅以RNF2-14处体现的基因编辑效率数据为例)
Figure 197440DEST_PATH_IMAGE011
表5 实施例5的结果(基因编辑效率)总结
*439G的含义是,在439号氨基酸后插入一个甘氨酸。
此外,我们通过T7核酸内切酶1 (T7E1)测定和靶向深度测序检测以下突变组合的基因编辑效率:E176R+K238R+T447R+E563R+N164Y+D958R;
E176R+K238R+T447R+E563R+I926R+D958R;
E176R+K238R+T447R+E563R+E323R+D362R+D958R;
N164Y+I926R+D958R; N164Y+E323R+D362R+D958R;
E176R+K238R+T447R+E563R+N164Y+I926R+D958R;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+D958R;
E176R+K238R+T447R+E563R+N164Y+I926R+E323R+D362R+D958R;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+D958R;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+439GG+D958R;和E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+439G +D958R
实施例6:CasXX与常规基因编辑工具的比较验证其基因编辑效率。
质粒构建
AsCas12a, BhCas12b v4, SpCas9, SaCas9, SaCas9-KKH的编码序列经过密码子优化(人类)并合成。Cas效应蛋白通过pCAG-2A-eGFP载体在人293T细胞中表达。将编码Cas蛋白的DNA插入XmaI和NheI之间。通过将含有靶序列的退火寡核苷酸连接到BasI消化的pUC19-U6-i2-crRNA骨架中,构建了在293T中表达AsCas12a, BhCas12b v4, SpCas9,SaCas9, SaCas9-KKH和Cas12i2的sgRNA或crRNA的载体。
细胞培养、转染以及荧光激活细胞分选法(FACS)
将HEK293T细胞在含1%青霉素-链霉素(Gibco)和10%胎牛血清(Gibco)的DMEM(Gibco)中培养。将细胞接种在24-细胞培养皿(Corning)中16小时,直到融合度达到70%。通过使用Lipofectamine 3000 (Invitrogen),将600ng编码Cas蛋白的质粒和3000ng编码crRNA的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-EDTA (0 .05%)(Gibco)消化荧光激活细胞分选(FACS) 的HEK293T细胞。使用具有GFP信号的MoFlo XDP(Beckman Coulter) 进行细胞分选。
靶向深度测序分析以进行基因组修饰
将FACS分选的GFP-阳性293FT细胞用缓冲液L裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsDNA片段进行PCR扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)PCR直接扩增靶位点。纯化PCR产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用CRISPResso2软件分析插入缺失的频率(%)。数量少于完整读取的0 .05%的读取被废弃。
在图6a中,我们首先测试了CasXX在62个人基因组位点的基因编辑效率。CasXX展现了极其强大的基因编辑能力,平均基因编辑效率超过60%,并且几乎在测试的所有位点的基因编辑效率都超过了50%。并且,对于任意的NTTN PAM(N=A, T, G, C)都展现了很高的基因编辑效率。这是野生型Cas12i无法做到的。
在图6b中,为了进一步展示我们工程化改造的CasXX的基因编辑能力,我们将CasXX与AsCas12a在TTTN PAM位点进行比较。我们的CasXX展现了更高的平均基因编辑效率。同时,与BhCas12b v4在TTN PAM位点进行比较,我们的CasXX展现了更高的平均基因编辑效率。
在图6c中,为了进一步展示我们工程化改造的CasXX的基因编辑能力,我们将CasXX与SpCas9在相同位点进行比较。我们的CasXX展现了更高的平均基因编辑效率。同时,与SaCas9、SaCas9-KKH在相同位点进行比较,我们的CasXX展现了更高的平均基因编辑效率。
在图6d中,我们发现,CasXX在小鼠Hepa1-6细胞系的基因编辑效率统计,可以看到,CasXX在65个位点展示出强大的基因编辑能力,平均基因编辑效率超过60%。
尽管以上结合附图对本发明的实施方案进行了描述,但本发明并不局限于上述的具体实施方案和应用领域,上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本发明保护之列。
序列表
Figure 190804DEST_PATH_IMAGE012
Figure 945133DEST_PATH_IMAGE013
Figure 682145DEST_PATH_IMAGE014
Figure 267847DEST_PATH_IMAGE015
Figure 697691DEST_PATH_IMAGE016
Figure 939317DEST_PATH_IMAGE017
Figure 214440DEST_PATH_IMAGE018
Figure 857911DEST_PATH_IMAGE019
Figure 193078DEST_PATH_IMAGE020
序列表
<110> 中国科学院动物研究所
北京干细胞与再生医学研究院
<120> 工程化的Cas12i核酸酶及其效应蛋白以及用途
<160> 13
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1054
<212> PRT
<213> Artificial Sequence
<400> 1
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1010 1015 1020
Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1025 1030 1035 1040
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050
<210> 2
<211> 1054
<212> PRT
<213> Artificial Sequence
<400> 2
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Tyr Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Arg
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Arg Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Arg Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Arg Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1010 1015 1020
Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1025 1030 1035 1040
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050
<210> 3
<211> 1054
<212> PRT
<213> Artificial Sequence
<400> 3
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Arg
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Arg Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Arg Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Arg Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1010 1015 1020
Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1025 1030 1035 1040
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050
<210> 4
<211> 1054
<212> PRT
<213> Artificial Sequence
<400> 4
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Arg
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Arg Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Arg Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Arg Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Arg Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Arg Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1010 1015 1020
Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1025 1030 1035 1040
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050
<210> 5
<211> 1054
<212> PRT
<213> Artificial Sequence
<400> 5
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Tyr Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1010 1015 1020
Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1025 1030 1035 1040
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050
<210> 6
<211> 1054
<212> PRT
<213> Artificial Sequence
<400> 6
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Tyr Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Arg Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Arg Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1010 1015 1020
Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1025 1030 1035 1040
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050
<210> 7
<211> 1054
<212> PRT
<213> Artificial Sequence
<400> 7
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Tyr Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Arg
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Arg Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Arg Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Arg Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1010 1015 1020
Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1025 1030 1035 1040
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050
<210> 8
<211> 1054
<212> PRT
<213> Artificial Sequence
<400> 8
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Tyr Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Arg
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Arg Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Arg Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Arg Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Arg Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Arg Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1010 1015 1020
Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1025 1030 1035 1040
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050
<210> 9
<211> 1054
<212> PRT
<213> Artificial Sequence
<400> 9
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Tyr Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Arg
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Arg Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Arg Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Arg Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Arg Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Arg Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1010 1015 1020
Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1025 1030 1035 1040
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050
<210> 10
<211> 1054
<212> PRT
<213> Artificial Sequence
<400> 10
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Tyr Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Arg
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Arg Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Arg Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Arg Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Arg Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Arg Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Gly Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1010 1015 1020
Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1025 1030 1035 1040
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050
<210> 11
<211> 1056
<212> PRT
<213> Artificial Sequence
<400> 11
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Tyr Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Arg
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Arg Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Arg Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Arg Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Gly Gly Asn Gln Gly Phe Thr Trp
435 440 445
Arg Asn Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro
450 455 460
Asn Ser Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro
465 470 475 480
Asp Gly Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe
485 490 495
Phe Gln Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln
500 505 510
Phe Arg Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln
515 520 525
Thr Ala Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu
530 535 540
Ala Arg Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn
545 550 555 560
Leu Lys Ile Thr Arg Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val
565 570 575
Arg Ile Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln
580 585 590
Ile Gly Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His
595 600 605
Ala Tyr Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu
610 615 620
Leu Gly Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile
625 630 635 640
Thr Glu Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu
645 650 655
Ala Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val
660 665 670
Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr
675 680 685
Val Glu Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg
690 695 700
Leu Tyr Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val
705 710 715 720
Arg Gly Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe
725 730 735
Arg Phe Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser
740 745 750
Leu Ser Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser
755 760 765
Tyr Phe Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp
770 775 780
Glu Gln Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys
785 790 795 800
Leu Glu Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile
805 810 815
Ala Asn Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile
820 825 830
Arg Gly Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys
835 840 845
Ala Asn Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys
850 855 860
Ile Arg Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly
865 870 875 880
Ser Leu Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp
885 890 895
Lys Ala Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly
900 905 910
Asp Trp Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Gly
915 920 925
Gly Thr Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His
930 935 940
Tyr Glu Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp
945 950 955 960
Arg Lys Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu
965 970 975
Lys Leu Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly
980 985 990
Arg Ile Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile
995 1000 1005
Val Phe Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala
1010 1015 1020
Ala Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035 1040
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050 1055
<210> 12
<211> 1055
<212> PRT
<213> Artificial Sequence
<400> 12
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Tyr Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Arg
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Arg Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Arg Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Arg Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Gly Asn Gln Gly Phe Thr Trp Arg
435 440 445
Asn Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn
450 455 460
Ser Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp
465 470 475 480
Gly Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe
485 490 495
Gln Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe
500 505 510
Arg Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr
515 520 525
Ala Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala
530 535 540
Arg Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu
545 550 555 560
Lys Ile Thr Arg Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg
565 570 575
Ile Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile
580 585 590
Gly Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala
595 600 605
Tyr Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu
610 615 620
Gly Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr
625 630 635 640
Glu Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala
645 650 655
Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser
660 665 670
Leu Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val
675 680 685
Glu Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu
690 695 700
Tyr Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg
705 710 715 720
Gly Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg
725 730 735
Phe Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu
740 745 750
Ser Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr
755 760 765
Phe Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu
770 775 780
Gln Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu
785 790 795 800
Glu Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala
805 810 815
Asn Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg
820 825 830
Gly Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala
835 840 845
Asn Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile
850 855 860
Arg Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser
865 870 875 880
Leu Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys
885 890 895
Ala Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp
900 905 910
Trp Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Gly Gly
915 920 925
Thr Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr
930 935 940
Glu Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg
945 950 955 960
Lys Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys
965 970 975
Leu Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg
980 985 990
Ile Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val
995 1000 1005
Phe Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser Asp
1025 1030 1035 1040
Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1045 1050 1055
<210> 13
<211> 1093
<212> PRT
<213> Artificial Sequence
<400> 13
Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr
1 5 10 15
Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn
20 25 30
Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp
35 40 45
Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala
50 55 60
Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe
65 70 75 80
Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn
85 90 95
Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln
100 105 110
Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp
115 120 125
Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu
130 135 140
Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys
145 150 155 160
Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met
165 170 175
Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr
180 185 190
Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val
195 200 205
Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr
210 215 220
Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile
225 230 235 240
Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu
245 250 255
Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg
260 265 270
Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe
275 280 285
Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met
290 295 300
Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys
305 310 315 320
Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu
325 330 335
Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr
340 345 350
Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile
355 360 365
Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His
370 375 380
Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu
385 390 395 400
Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr
405 410 415
Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu
420 425 430
Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile
435 440 445
Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln
450 455 460
Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn
465 470 475 480
Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys
485 490 495
His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile
500 505 510
Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His
515 520 525
Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala
530 535 540
Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys
545 550 555 560
Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu
565 570 575
Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln
580 585 590
Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr
595 600 605
Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe
610 615 620
Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr
625 630 635 640
Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr
645 650 655
Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn
660 665 670
Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser
675 680 685
Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys
690 695 700
Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu
705 710 715 720
Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln
725 730 735
Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser
740 745 750
Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile
755 760 765
Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu
770 775 780
Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser
785 790 795 800
Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr
805 810 815
Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val
820 825 830
Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu
835 840 845
Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val
850 855 860
Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu
865 870 875 880
Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile
885 890 895
Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu
900 905 910
Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val
915 920 925
Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr
930 935 940
Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg
945 950 955 960
Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg
965 970 975
Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr
980 985 990
Asn Ala Tyr Tyr Asn Glu Gly Ala Met Ala Phe Leu Ala Thr Tyr Gly
995 1000 1005
Leu Lys Lys Asn Asp Val Leu Gly Val Ser Leu Glu Lys Phe Lys Gln
1010 1015 1020
Ile Met Ala Asn Ile Leu His Gln Arg Ser Glu Asp Gln Leu Leu Phe
1025 1030 1035 1040
Pro Ser Arg Gly Gly Met Phe Tyr Leu Ala Thr Tyr Lys Leu Asp Ala
1045 1050 1055
Asp Ala Thr Ser Val Asn Trp Asn Gly Lys Gln Phe Trp Val Cys Asn
1060 1065 1070
Ala Asp Leu Val Ala Ala Tyr Asn Val Gly Leu Val Asp Ile Gln Lys
1075 1080 1085
Asp Phe Lys Lys Lys
1090

Claims (19)

1.一种工程化的Cas12i核酸酶;其包含如下氨基酸替换:
将参比Cas12i核酸酶中与PAM相互作用的氨基酸替换为带正电的氨基酸,其中,SEQ IDNO.1为进行上述工程化改造所基于的参比Cas12i核酸酶的氨基酸序列;
其中,所述与PAM相互作用的氨基酸为第563位的氨基酸;其中,所述氨基酸位置编号如SEQ ID NO.1所定义,所述带正电的氨基酸是R。
2.根据权利要求1所述的Cas12i核酸酶,其中,所述与PAM相互作用的氨基酸还进一步选自第176、第238、或第447位的氨基酸。
3.如权利要求1所述的工程化的Cas12i核酸酶,其中,所述Cas12i核酸酶包含下述任何一种突变或突变组合:(1)E563R;(2)E176R、T447R、和E563R;(3)K238R和E563R;(4)E176R、K238R和E563R;或(5)E176R、K238R、T447R和E563R。
4.如权利要求1所述的工程化的Cas12i核酸酶,其中,将参比Cas12i核酸酶中参与打开DNA双链的一个或多个氨基酸的替换为带芳香环的氨基酸是指:Q163F、Q163Y、Q163W、和/或N164F或N164Y。
5.如权利要求1所述的工程化的Cas12i核酸酶,其进一步包括:将位于RuvC 结构域并与单链DNA底物相互作用的一个或多个氨基酸的替换,所述氨基酸选自下述位置的一个或多个: 323、362、425、925、926、391、424和929;其中,将上述参与双链DNA的切割的一个或多个氨基酸替换为带正电的氨基酸,所述带正电的氨基酸是R。
6.如权利要求1~5中任一项所述的工程化的Cas12i核酸酶,其进一步有包含一个或多个柔性区突变,所述柔性区突变位于下述位置的一个或多个:439和/或926,其中,所述一个或多个柔性区突变为:I926G;和/或在439位氨基酸之后插入G 或在439位氨基酸之后插入GG。
7.一种工程化的Cas12i核酸酶;所述工程化的Cas12i核酸酶包含以下任一组或多组突变:(1)E563R;(2)E176R和 E563R;(3)K238R和E563R; (4)E176R、T447R和 E563R; (5)E176R、K238R和 E563R; (6) E176R、K238R、T447R和 E563R;其中所述氨基酸位置编号如SEQ ID NO.1所定义,SEQ ID NO.1为进行上述工程化改造所基于的参比Cas12i核酸酶的氨基酸序列。
8.一种工程化的Cas12i核酸酶,所述工程化的Cas12i核酸酶包含以下任一组突变:(1)E176R、K238R、T447R、E563R和N164Y;(2)E176R、K238R、T447R、E563R和I926R;(3)E176R、K238R、T447R、E563R、E323R和D362R;(4)E176R、K238R、T447R、E563R、N164Y和I926R;(5)E176R、K238R、T447R、E563R、N164Y、E323R和D362R;(6)E176R、K238R、T447R、E563R、N164Y、I926R、E323R和D362R;(7)E176R、K238R、T447R、E563R、N164Y、E323R、D362R和I926G;(8)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G和439位氨基酸之后插入GG;(9)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G和在439位氨基酸之后插入G; (10)E176R、K238R、T447R、E563R、N164Y和D958R;(11)E176R、K238R、T447R、E563R、I926R和D958R;(12) E176R、K238R、T447R、E563R、E323R、D362R和D958R; (13) E176R、K238R、T447R、E563R、N164Y、I926R和D958R;(14)E176R、K238R、T447R、E563R、N164Y、E323R、D362R和D958R;(15)E176R、K238R、T447R、E563R、N164Y、I926R、E323R、D362R和D958R;(16)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G和D958R; (17)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、在439位氨基酸之后插入GG和D958R; 或(18)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、在439在氨基酸之后插入G和D958R; 其中,所述氨基酸位置编号如SEQ ID NO.1所定义,SEQ ID NO.1为进行上述工程化改造所基于的参比Cas12i核酸酶的氨基酸序列。
9.氨基酸序列如SEQ ID NO.1~6中任一项所示的工程化Cas12i核酸酶。
10.一种工程化的Cas12i效应蛋白,其包含权利要求1~9中任一项所述的工程化的Cas12i核酸酶。
11.如权利要求10所述的工程化的Cas12i效应蛋白,其中所述效应蛋白能够诱导DNA分子中的双链断裂或单链断裂。
12.如权利要求10所述的工程化的Cas12i效应蛋白,其中所述工程化的Cas12i核酸酶为有D599A、E833A、S883A、H884A、R900A和/或D1019A的酶失活突变体。
13.如权利要求10所述的工程化的Cas12i效应蛋白,其还包含与所述工程化的Cas12i核酸酶融合的功能结构域。
14.如权利要求13所述的工程化的Cas12i效应蛋白,其中所述功能结构域选自下组:翻译起始结构域、转录阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域。
15.如权利要求14所述的工程化的Cas12i效应蛋白,其包含第一多肽和第二多肽,第一多肽包含权利要求1-9中任一项所述的工程化的Cas12i核酸酶的N末端部分氨基酸残基1至X,第二多肽包含权利要求1-9中任一项所述的工程化的Cas12i核酸酶的氨基酸残基X+1至所述Cas12i核酸酶的C末端,其中所述第一多肽和所述第二多肽能够在包含指导序列的指导RNA的存在下彼此缔合,以形成与靶核酸特异性结合的成簇规律间隔短回文重复序列(CRISPR)复合物,该靶核酸包含与所述指导序列互补的靶序列。
16.一种工程化的CRISPR-Cas12i系统,包括:
(a)权利要求10-15中任一项所述的工程化的Cas12i效应蛋白;以及
(b)包含与靶序列互补的指导序列的指导RNA,或编码所述指导RNA的一种或多种核酸,
其中所述工程化的Cas12i效应蛋白和所述指导RNA能够形成CRISPR复合物,所述CRISPR复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。
17.一种体外检测样品中靶核酸的方法,包括:
(a)使样品与权利要求16所述的工程化的CRISPR-Cas12i系统以及加标签的检测核酸接触,该检测核酸为单链且不与所述指导RNA的指导序列杂交;以及
(b)测量通过所述工程化的Cas12i效应蛋白切割所述加标签的检测核酸而产生的可检测信号,从而检测所述靶核酸。
18.如权利要求16所述的工程化的CRISPR-Cas12i系统在制备治疗与个体的细胞中靶核酸相关的疾病或病症的药物中的用途。
19.一种体外修饰包含靶序列的靶核酸的方法,包括使所述靶核酸与权利要求16所述的工程化的CRISPR-Cas12i系统接触。
CN202110581290.3A 2021-05-27 2021-05-27 工程化的Cas12i核酸酶及其效应蛋白以及用途 Active CN113151215B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202110581290.3A CN113151215B (zh) 2021-05-27 2021-05-27 工程化的Cas12i核酸酶及其效应蛋白以及用途
CN202211325001.4A CN115851665A (zh) 2021-05-27 2021-05-27 工程化的Cas12i核酸酶及其效应蛋白以及用途
PCT/CN2022/095072 WO2022247873A1 (zh) 2021-05-27 2022-05-25 工程化的Cas12i核酸酶、效应蛋白及其用途
CN202280035920.XA CN117337326A (zh) 2021-05-27 2022-05-25 工程化的Cas12i核酸酶、效应蛋白及其用途
EP22810597.9A EP4349979A1 (en) 2021-05-27 2022-05-25 Engineered cas12i nuclease, effector protein and use thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110581290.3A CN113151215B (zh) 2021-05-27 2021-05-27 工程化的Cas12i核酸酶及其效应蛋白以及用途

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211325001.4A Division CN115851665A (zh) 2021-05-27 2021-05-27 工程化的Cas12i核酸酶及其效应蛋白以及用途

Publications (2)

Publication Number Publication Date
CN113151215A CN113151215A (zh) 2021-07-23
CN113151215B true CN113151215B (zh) 2022-11-18

Family

ID=76877801

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211325001.4A Pending CN115851665A (zh) 2021-05-27 2021-05-27 工程化的Cas12i核酸酶及其效应蛋白以及用途
CN202110581290.3A Active CN113151215B (zh) 2021-05-27 2021-05-27 工程化的Cas12i核酸酶及其效应蛋白以及用途

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211325001.4A Pending CN115851665A (zh) 2021-05-27 2021-05-27 工程化的Cas12i核酸酶及其效应蛋白以及用途

Country Status (1)

Country Link
CN (2) CN115851665A (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112877314B (zh) * 2021-03-08 2023-06-13 四川大学 一种诱导型碱基编辑系统及其应用
EP4349979A1 (en) * 2021-05-27 2024-04-10 Institute Of Zoology, Chinese Academy Of Sciences Engineered cas12i nuclease, effector protein and use thereof
WO2023018856A1 (en) * 2021-08-11 2023-02-16 Arbor Biotechnologies, Inc. Gene editing systems comprising an rna guide targeting polypyrimidine tract binding protein 1 (ptbp1) and uses thereof
US20230203539A1 (en) * 2021-08-11 2023-06-29 Arbor Biotechnologies, Inc. Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof
WO2023034475A1 (en) * 2021-09-01 2023-03-09 Arbor Biotechnologies, Inc. Cells modified by a cas12i polypeptide
CN114015674A (zh) 2021-11-02 2022-02-08 辉二(上海)生物科技有限公司 新型CRISPR-Cas12i系统
AU2022382751A1 (en) * 2021-11-02 2024-05-23 Huidagene Therapeutics (Singapore) Pte. Ltd. Novel crispr-cas12i systems and uses thereof
CN114085873A (zh) * 2021-11-16 2022-02-25 珠海中科先进技术研究院有限公司 一种癌细胞状态辨识基因电路组及其制备方法
CN116254246A (zh) * 2021-12-09 2023-06-13 北京干细胞与再生医学研究院 工程化cas12b效应蛋白及其使用方法
CN116497002A (zh) * 2022-01-19 2023-07-28 中国科学院动物研究所 工程化的CasX核酸酶、效应蛋白及其用途
WO2023138685A1 (en) * 2022-01-24 2023-07-27 Huidagene Therapeutics Co., Ltd. Novel crispr-cas12i systems and uses thereof
WO2023208003A1 (en) * 2022-04-25 2023-11-02 Huidagene Therapeutics Co., Ltd. Novel crispr-cas12i systems and uses thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016094872A1 (en) * 2014-12-12 2016-06-16 The Broad Institute Inc. Dead guides for crispr transcription factors
EP3615552A1 (en) * 2017-04-24 2020-03-04 DuPont Nutrition Biosciences ApS Methods and compositions of anti-crispr proteins for use in plants
HRP20230828T1 (hr) * 2018-03-14 2023-11-10 Arbor Biotechnologies, Inc. Novi sustavi i enzimi koji ciljaju na crispr dna
CN113308451B (zh) * 2020-12-07 2023-07-25 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法

Also Published As

Publication number Publication date
CN115851665A (zh) 2023-03-28
CN113151215A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN113151215B (zh) 工程化的Cas12i核酸酶及其效应蛋白以及用途
CN112195164B (zh) 工程化的Cas效应蛋白及其使用方法
US10676735B2 (en) High-throughput screening of regulatory element function with epigenome editing technologies
KR102494449B1 (ko) 진핵 게놈 변형을 위한 조작된 cas9 시스템
US11760983B2 (en) Enhanced hAT family transposon-mediated gene transfer and associated compositions, systems, and methods
CA3047313A1 (en) Enhanced hat family transposon-mediated gene transfer and associated compositions, systems, and methods
JP6965466B2 (ja) 操作されたカスケード構成要素およびカスケード複合体
TWI609960B (zh) 轉位子系統、套組及其用途
WO2022247873A1 (zh) 工程化的Cas12i核酸酶、效应蛋白及其用途
CN113711046B (zh) 用于揭示与Tau聚集相关的基因脆弱性的CRISPR/Cas脱落筛选平台
US20200323902A1 (en) ENHANCED hAT FAMILY TRANSPOSON-MEDIATED GENE TRANSFER AND ASSOCIATED COMPOSITIONS, SYSTEMS, AND METHODS
WO2022042557A1 (en) Split cas12 systems and methods of use thereof
WO2020069029A1 (en) Novel crispr nucleases
WO2022120520A1 (en) Engineered cas effector proteins and methods of use thereof
WO2023138617A1 (zh) 工程化的CasX核酸酶、效应蛋白及其用途
WO2023104185A1 (en) Engineered cas12b effector proteins and methods of use thereof
US20230272355A1 (en) ENHANCED hAT FAMILY MEMBER SPIN TRANSPOSON-MEDIATED GENE TRANSFER AND ASSOCIATED COMPOSITIONS, SYSTEMS, AND METHODS
WO2023122663A2 (en) Effector proteins and methods of use
WO2024042165A2 (en) Novel rna-guided nucleases and nucleic acid targeting systems comprising such rna-guided nucleases
WO2022104344A2 (en) Knock-in of large dna for long-term high genomic expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40054104

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant