TW202313971A - 包含crispr核酸酶的基因編輯系統及其用途 - Google Patents

包含crispr核酸酶的基因編輯系統及其用途 Download PDF

Info

Publication number
TW202313971A
TW202313971A TW111120437A TW111120437A TW202313971A TW 202313971 A TW202313971 A TW 202313971A TW 111120437 A TW111120437 A TW 111120437A TW 111120437 A TW111120437 A TW 111120437A TW 202313971 A TW202313971 A TW 202313971A
Authority
TW
Taiwan
Prior art keywords
nucleotides
sequence
gene editing
rna
polypeptide
Prior art date
Application number
TW111120437A
Other languages
English (en)
Inventor
大衛 A 史卡特
諾亞 邁克爾 賈基莫
普拉秋沙 漢紐維爾
富凱 謝
Original Assignee
美商喬木生物技術公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商喬木生物技術公司 filed Critical 美商喬木生物技術公司
Publication of TW202313971A publication Critical patent/TW202313971A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Abstract

揭露了一種基因編輯系統,其包含:(a) V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的第一核酸;(b) 反轉錄酶(RT)多肽或編碼該RT多肽的第二核酸;(c) 指導RNA(gRNA)或編碼該gRNA的第三核酸,其中該gRNA包含可被該V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點)和對目的基因組位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰;以及 (d) 反轉錄供體RNA(RT供體RNA)或編碼該RT供體RNA的第四核酸,其中該RT供體RNA包含引物結合位點(PBS)和模板序列。

Description

包含CRISPR核酸酶的基因編輯系統及其用途
相關申請的交叉引用。本申請根據35 U.S.C. § 119(e) 要求2021年6月1日提交的美國臨時申請案號63/195,621、2021年8月23日提交的美國臨時申請案號63/236,047、2021年10月28日提交的美國臨時申請案號63/272,937和2022年1月14日提交的美國臨時申請案號63/299,695的權益,將每一篇文獻的內容藉由引用以其全文併入本文。
序列表。本申請含有一份已經以ASCII格式電子提交的序列表並且將該序列表藉由引用以其全文特此併入。創建於2022年5月30日的所述ASCII副本名為116928-0042-0001WO00_SEQ.txt且大小為385,353位元組。
本發明關於一種包含CRISPR核酸酶的基因編輯系統及其用途。
規律間隔重複短迴文序列簇(CRISPR)和CRISPR相關(Cas)基因(統稱為CRISPR-Cas或CRISPR/Cas系統)係古細菌和細菌中針對外來遺傳元件而防禦特定物種的適應性免疫系統。
本揭露至少部分基於基因編輯系統的開發,該基因編輯系統涉及V型CRISPR核酸酶多肽(例如,Cas12i2多肽)和反轉錄酶以及介導由CRISPR核酸酶多肽在目的遺傳位點處進行切割的指導RNA(gRNA)和介導被摻入到目的基因組位點的所希望序列的合成的反轉錄供體RNA。如本文所報導的,本文揭露的基因編輯系統已經在多個基因組位點處以高編輯效率和準確性實現了成功的基因編輯。不受理論束縛,本文揭露的基因編輯系統表現出以下有利特徵中的至少一個: 1. 本文所述之許多編輯模板RNA(例如對Cas12i多肽具有特異性的那些)不需要反式激活CRISPR RNA(tracrRNA)組分,並因此比先導編輯指導RNA(pegRNA)更小。此外,本文所述之許多CRISPR核酸酶-反轉錄酶融合物(例如Cas12i多肽-反轉錄酶融合物)比Cas9-反轉錄酶融合物更小。就遞送和合成成本而言,這兩個方面都是較佳的。 2. 本文所述之編輯模板RNA可以被設計為具有比pegRNA的PBS更長的引物結合位點(PBS)。該特徵可以提高編輯摻入到靶核酸的效率。 3. 如本文所述,與先導編輯系統相比,包含編輯模板RNA的基因編輯系統能夠在更寬的視窗上摻入編輯,其中將該編輯模板RNA設計用於僅結合非PAM股(即PAM模體所在股的互補股;本文也描述為靶股)。特別是,Cas12i多肽-反轉錄酶系統能夠重寫Cas12i多肽和RNA指導物的完整識別序列。因此,該等基因編輯系統可以更有效地避免CRISPR核酸酶-反轉錄酶融合物和編輯模板RNA對靶核酸的重新靶向。
因此,本文提供了基因編輯系統、包含該等基因編輯系統的藥物組成物或套組(kit)、使用該基因編輯系統產生經基因修飾的細胞之方法,以及由此產生的所得細胞。
在一些方面,本揭露的特徵在於基因編輯系統,其包含:(a) V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的第一核酸;(b) 反轉錄酶(RT)多肽或編碼該RT多肽的第二核酸;(c) 指導RNA(gRNA)或編碼該gRNA的第三核酸,其中該gRNA包含可被該V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點)和對目的基因組位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰;以及 (d) 反轉錄供體RNA(RT供體RNA)或編碼該RT供體RNA的第四核酸,其中該RT供體RNA包含引物結合位點(PBS)和模板序列。
在一些實施方式中,本文揭露的任何基因編輯系統中的V型CRISPR核酸酶多肽係Cas12多肽。在一些實例中,Cas12多肽係Cas12i多肽,例如Cas12i2多肽。在一些情況下,Cas12i多肽係Cas12i2多肽,該Cas12i2多肽包含與SEQ ID NO: 2具有至少95%同一性的胺基酸序列。
在一些情況下,Cas12i2多肽在SEQ ID NO: 2的位置D581、G624、F626、P868、I926、V1030、E1035和/或S1046處包含一或多個突變。例如,一或多個突變係胺基酸取代,該等胺基酸取代視需要是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其組合。在一個實例中,Cas12i2多肽在位置D581、D911、I926和V1030處包含突變(例如,D581R、D911R、I926R和V1030G的胺基酸取代)。在另一個實例中,Cas12i2多肽在位置D581、I926和V1030處包含突變(例如,D581R、I926R和V1030G的胺基酸取代)。在又另一個實例中,Cas12i2多肽在位置D581、I926、V1030和S1046處包含突變(例如,D581R、I926R、V1030G和S1046G的胺基酸取代)。在仍另一個實例中,Cas12i2多肽在位置D581、G624、F626、I926、V1030、E1035和S1046處包含突變(例如,D581R、G624R、F626R、I926R、V1030G、E1035R和S1046G的胺基酸取代)。在另一個實例中,Cas12i2多肽在位置D581、G624、F626、P868、I926、V1030、E1035和S1046處包含突變(例如,D581R、G624R、F626R、P868T、I926R、V1030G、E1035R和S1046G的胺基酸取代)。用於在本文揭露的任何基因編輯系統中使用的示例性Cas12i2多肽可以包含SEQ ID NO: 3-7中任一個的胺基酸序列。在一些實例中,示例性Cas12i2多肽可以包含SEQ ID NO: 4的胺基酸序列。在其他實例中,示例性Cas12i2多肽可以包含SEQ ID NO: 7的胺基酸序列。
在其他情況下,Cas12i多肽具有降低的crRNA加工活性,視需要其中該Cas12i多肽在SEQ ID NO: 2的位置H485和/或位置H486處包含突變。
在一些實施方式中,本文揭露的任何基因編輯系統可以包含V型CRISPR核酸酶多肽。可替代地,基因編輯系統可以包含編碼V型CRISPR核酸酶多肽的第一核酸。在一些情況下,第一核酸位於第一載體(例如,病毒載體,如腺相關病毒載體或AAV載體)中。在其他情況下,第一核酸係第一信使RNA(mRNA)。
在本文揭露的任何基因編輯系統中,RT多肽可為莫洛尼鼠白血病病毒(MMLV)-RT、小鼠乳腺腫瘤病毒(MMTV)-RT、Marathon-RT或RTx-RT(例如,MMLV RT,其可以包含SEQ ID NO: 29的胺基酸序列)。在一些情況下,基因編輯系統包含RT多肽。可替代地,該系統包含編碼RT多肽的第二核酸。在一些情況下,第二核酸位於第二載體(例如,病毒載體,如腺相關病毒載體或AAV載體)中。在一個實例中,基因編輯系統包含載體(例如,病毒載體),該載體包含編碼V型CRISPR多肽的第一核酸和編碼RT多肽的第二核酸兩者。在其他實例中,編碼RT的第二核酸係第二mRNA。在一個實例中,基因編輯系統包含單個RNA分子,該單個RNA分子包含編碼V型CRISPR多肽的第一mRNA和編碼RT的第二mRNA兩者。
在一些實施方式中,本文揭露的基因編輯系統包含融合多肽,該融合多肽包含V型CRISPR核酸酶多肽和RT多肽,或編碼該融合多肽的核酸(例如,載體,如病毒載體)。可替代地,基因編輯系統包含V型CRISPR核酸酶多肽和RT多肽作為兩種單獨的多肽。
在本文揭露的任何基因編輯系統中,間隔子的長度可為20-30個核苷酸。在一些實例中,間隔子的長度為20個核苷酸。
在一些實施方式中,PAM包含5’-TTN-3’的模體。在一些情況下(例如,與Cas12i2多肽結合),PAM可以位於靶序列的5’。
在一些實施方式中,一或多個CRISPR核酸酶結合位點係一或多個同向重複序列。在一些情況下,每個同向重複序列的長度為23-36個核苷酸。在一個實例中,同向重複序列的長度為23個核苷酸。在一些實例中,同向重複序列與SEQ ID NO: 15-17和241-247中的任一個(例如,SEQ ID NO: 17)或其長度為至少23個核苷酸的片段具有至少90%同一性。在特定實例中,同向重複序列係SEQ ID NO: 15-17和241-247中的任一個(例如,SEQ ID NO: 17),或其長度為至少23個核苷酸的片段。
在一些實施方式中,本文揭露的基因編輯系統包含gRNA。可替代地,基因編輯系統包含編碼gRNA的第三核酸。在一些實例中,第三核酸位於第三載體中,該第三載體視需要是病毒載體。在一些實例中,基因編輯系統可以包含載體(例如病毒載體),該載體包含編碼gRNA的第三核酸和編碼V型CRISPR核酸酶多肽和/或RT多肽的第一和/或第二核酸。
在一些實施方式中,本文揭露的任何基因編輯系統的RT供體RNA中的PBS的長度可為5-100個核苷酸。在一些實例中,PBS的長度為10-60個核苷酸。在特定實例中,PBS的長度為10-30個核苷酸。在一些情況下,PBS結合與靶序列的互補區相鄰的PBS靶向位點。PBS靶向位點位於靶序列互補區的上游。例如,PBS靶向位點可為靶序列互補區上游的3-10個核苷酸(例如,4-10個核苷酸)。可替代地,PBS靶向位點可以與靶序列的互補區重疊。在其他情況下,PBS靶向位點與靶序列相鄰或重疊。
在一些實施方式中,本文揭露的任何基因編輯系統的RT供體RNA中的模板序列的長度可為5-100個核苷酸。例如,模板序列的長度可為30-50個核苷酸。在一些情況下,模板序列可以與目的基因組位點同源並且包含相對於該目的基因組位點的一或多個核苷酸變化。在一些實例中,至少一個核苷酸變化位於靶序列內。可替代地或另外地,至少一個核苷酸變化位於PAM內。
在一些實施方式中,本文揭露的任何基因編輯系統包含RT供體RNA。可替代地,基因編輯系統包含編碼RT供體RNA的第四核酸。在一些實例中,第四核酸位於第四載體中,該第四載體視需要是第四病毒載體。在一些情況下,基因編輯系統包含載體(例如病毒載體),該載體包含編碼RT供體RNA的核酸,以及編碼指導RNA、V型CRISPR核酸酶多肽和RT多肽的一或多種另外的核酸。
在一些實施方式中,本文揭露的基因編輯系統包含單個RNA分子,該單個RNA分子包含gRNA和RT供體RNA。這樣的單個RNA包含CRISPR核酸酶結合位點、間隔子序列、PBS和模板序列,它們可以以任何合適的順序排列。在一些實例中,單個RNA分子進一步包含gRNA和RT供體RNA之間的連接子。這樣的連接子可以包含髮夾結構。在一個實例中,單個RNA分子從5’到3’包含:CRISPR核酸酶結合位點、間隔子序列、模板序列和PBS。在另一個實例中,單個RNA分子從5’到3’包含:CRISPR核酸酶結合位點、間隔子序列、連接子、模板序列和PBS。在又另一個實例中,單個RNA分子從5’到3’包含:模板序列、PBS、CRISPR核酸酶結合位點和間隔子序列。在又另一個實例中,單個RNA分子從5’到3’包含:模板序列、PBS、連接子、CRISPR核酸酶結合位點和間隔子序列。
在一些情況下,本文揭露的任何單個RNA分子可以進一步包含5’末端保護片段、3’末端保護片段或兩者。5’末端保護片段和3’末端保護片段中的每一個可以形成二級結構,例如髮夾、假結或三鏈體結構。在一些實例中,5’末端保護片段和/或3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。在特定實例中,5’末端保護片段、3’末端保護片段或兩者可以包含CRISPR核酸酶結合位點中的一或多個。5’末端保護片段、3’末端保護片段或兩者可以進一步包含與任何人序列不同源(不能經由鹼基配對與任何人序列結合)的一或多個區段。
在一些實施方式中,本文揭露的基因編輯系統包含該等gRNA中的任一個和該等RT供體RNA中的任一個作為兩種單獨的RNA分子。在一些實例中,gRNA、RT供體RNA或兩者可以進一步包含5’末端保護片段和/或3’末端保護片段。保護片段中的每一個可以形成二級結構,例如髮夾、假結或三鏈體結構。在一些實例中,5’末端保護片段和/或3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。在其他實例中,5’末端保護片段和/或3’末端保護片段包含CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
本文揭露的基因編輯系統中的任一個可以包含一或多種脂質奈米顆粒(LNP),該一或多種脂質奈米顆粒包括V型CRISPR核酸酶多肽或編碼核酸、RT多肽或編碼核酸、指導RNA或編碼核酸、RT供體RNA或編碼核酸,或其任何組合。可替代地,基因編輯系統可以包含 (i) 一或多種脂質奈米顆粒(LNP),該一或多種脂質奈米顆粒集合地包括選自V型CRISPR核酸酶多肽或編碼核酸、RT多肽或編碼核酸、指導RNA或編碼核酸、RT供體RNA或編碼核酸的多達三種組分;和 (ii) 編碼基因編輯系統中其餘組分的一或多種載體。在一些情況下,一或多種載體可為一或多種病毒載體,例如一或多種腺相關病毒(AAV)載體。
在一些實例中,本文揭露的基因編輯系統包含V型CRISPR核酸酶多肽、RT多肽、gRNA和RT供體RNA。在一些情況下,V型CRISPR核酸酶多肽和/或RT多肽與gRNA和/或RT供體RNA形成複合物(例如,核糖核蛋白(RNP)複合物)。
在一些方面,本揭露還提供了包含本文揭露的基因編輯系統中任一個和藥學上可接受的載劑的藥物組成物,以及包含該基因編輯系統的組分的套組。
在其他方面,本揭露的特徵還在於用於基因編輯細胞之方法,該方法包括使宿主細胞與本文揭露的基因編輯系統中任一個或包含該基因編輯系統的藥物組成物接觸以對該宿主細胞進行基因編輯。在一些實例中,宿主細胞在體外培養。在其他實例中,接觸步驟藉由向包含宿主細胞的受試者投與基因編輯系統來進行。
同樣在本揭露之範圍內的係可以藉由本文揭露的基因編輯系統產生的經基因修飾的細胞群。在一些實例中,經基因修飾的細胞可以包含不能被基因編輯系統編輯的細胞,例如,在PAM、靶序列或兩者中包含一或多個修飾。
在又其他方面,本揭露的特徵在於基因編輯RNA分子,其包含:(i) 可被V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點);(ii) 對遺傳位點內的靶序列具有特異性的間隔子,該靶序列與原間隔子相鄰模體(PAM)相鄰;(iii) 引物結合位點(PBS);和 (iv) 模板序列。在一些實施方式中,基因編輯RNA分子可以進一步包含一或多個連接子,例如本文揭露的那些。
在一些實例中,RNA分子從5’到3’包含:CRISPR核酸酶結合位點、間隔子序列、模板序列和PBS。在其他實例中,RNA分子從5’到3’包含:CRISPR核酸酶結合位點、間隔子序列、連接子、模板序列和PBS。在又其他實例中,RNA分子從5’到3’包含:模板序列、PBS、CRISPR核酸酶結合位點和間隔子序列。在仍其他實例中,RNA分子從5’到3’包含:模板序列、PBS、連接子、CRISPR核酸酶結合位點和間隔子序列。
本文揭露的基因編輯RNA分子中任一個可以進一步包含5’末端保護片段、3’末端保護片段或兩者。保護片段中的每一個可以形成二級結構,例如髮夾、假結或三鏈體結構。在一些實例中,5’末端保護片段和/或3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。在其他實例中,5’末端保護片段和/或3’末端保護片段包含CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
另外地,本揭露的特徵在於基因編輯RNA分子組(兩種單獨的RNA分子),其包含:(i) 指導RNA,其包含可被V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點),和對遺傳位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰;以及 (ii) 反轉錄供體RNA(RT供體RNA)或編碼該RT供體RNA的第四核酸,其中該RT供體RNA包含引物結合位點(PBS)和模板序列。在一些實例中,gRNA、RT供體RNA或兩者進一步包含5’末端保護片段和/或3’末端保護片段。保護片段中的每一個可以形成二級結構,例如髮夾、假結或三鏈體結構。在一些實例中,5’末端保護片段和/或3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。在其他實例中,5’末端保護片段和/或3’末端保護片段包含CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
本文還提供了編碼如本文揭露的基因編輯RNA分子或基因編輯RNA分子組的DNA分子或DNA分子組。在一些實例中,如請求項76所述之DNA分子或DNA分子組,其包括在載體或載體組中,視需要其中該載體或載體組係病毒載體。
另外地,本文提供了包含CRISPR核酸酶和反轉錄酶的融合多肽。在一些實施方式中,CRISPR核酸酶係V型CRISPR核酸酶,例如Cas12i多肽。在一些實例中,Cas12i多肽係Cas12i2多肽,例如,本文揭露的那些。在特定實例中,融合多肽可以包含25-26和219-223的胺基酸序列。編碼該等CRISPR核酸酶-RT融合多肽中任一個的該等核酸(包括載體,例如表現載體(例如,病毒載體))中任一個也在本揭露之範圍內。
在下面的描述中闡述了本發明之一或多個實施方式的細節。根據以下附圖和幾個實施方式的詳細說明以及從所附請求項,本發明之其他特徵或優點將顯而易見。
本揭露關於基因編輯系統,其包含V型核酸酶或編碼該V型核酸酶的核酸、RNA指導物或編碼該RNA指導物的核酸、反轉錄酶或編碼該反轉錄酶的核酸、以及RT供體RNA或編碼該RT供體RNA的核酸。本文還提供了包含本文揭露的任一基因編輯系統的藥物組成物和套組、使用本文揭露的任一基因編輯系統對細胞進行基因編輯之方法、由此產生的經基因工程改造的細胞和參與基因編輯系統的基因編輯RNA分子或RNA分子組,以及用於產生此類基因編輯RNA分子或RNA分子組的一或多個DNA分子。 定義
本揭露將針對特定實施方式並參考某些附圖進行描述,但是本揭露不限於此,而是僅由請求項來限定。除非另有說明,否則下文陳述的術語通常應以其常見意義來理解。
如本文所用,術語「活性」係指生物活性。在一些實施方式中,活性係指效應子活性。在一些實施方式中,活性包括酶活性,例如效應子的催化能力。例如,活性可以包括核酸酶活性。在另一個實例中,活性係指酶從RNA生成DNA或將編輯引入到靶序列的能力。
如本文所用,術語「相鄰」係指一個核苷酸或胺基酸序列緊鄰另一個核苷酸或胺基酸序列。在一些實施方式中,如果沒有核苷酸將一個核苷酸序列與另一個核苷酸序列分開,則這兩個序列相鄰(即,緊鄰)。在一些實施方式中,如果少量核苷酸(例如,約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個核苷酸)將一個核苷酸序列與另一個核苷酸序列分開,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔約5、6、7、8、9、10、11、12、13、14或15個核苷酸,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔多達2個核苷酸、多達5個核苷酸、多達8個核苷酸、多達10個核苷酸、多達12個核苷酸或多達15個核苷酸,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔2-5個核苷酸、4-6個核苷酸、4-8個核苷酸、4-10個核苷酸、6-8個核苷酸、6-10個核苷酸、6-12個核苷酸、8-10個核苷酸、8-12個核苷酸、10-12個核苷酸、10-15個核苷酸或12-15個核苷酸,則這兩個序列相鄰。
如本文所用,術語「CRISPR核酸酶」係指能夠結合核酸並引入單股斷裂或雙股斷裂的RNA指導的效應子。在一些實施方式中,CRISPR核酸酶係II型CRISPR核酸酶或V型CRISPR核酸酶。在一些實施方式中,CRISPR核酸酶係如Makarova等人的「Classification and Nomenclature of CRISPR-Cas Systems: Where from Here? [CRISPR-Cas系統的分類和命名:從何而來?]」 CRISPRJ. 1(5):325-36 (2018) 中所述之效應子。
如本文所用,術語「II型」和「II型核酸酶」係指包含RuvC結構域和HNH結構域的核酸酶。II型核酸酶可為II-A型核酸酶、II-B型核酸酶或II-C型核酸酶。在一些實施方式中,II型核酸酶需要tracrRNA。在一些實施方式中,II型核酸酶係Cas9多肽。Cas9多肽可以切割雙股DNA靶標或作為切口酶。
如本文所用,術語「V型」和「V型核酸酶」係指RNA指導的具有RuvC結構域的CRISPR核酸酶。在一些實施方式中,V型核酸酶不需要tracrRNA。在一些實施方式中,V型核酸酶需要tracrRNA。在一些實施方式中,V型核酸酶係Cas12多肽,例如Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)多肽。
如本文所用,術語「Cas12i多肽」(本文也稱為Cas12i)係指與RNA指導物指定的靶核酸上的靶序列結合的多肽,其中該多肽與野生型Cas12i多肽具有至少一些胺基酸序列同源性。在一些實施方式中,Cas12i多肽與美國專利案號10,808,245之SEQ ID NO: 1-5和11-18中任一項包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性,出於本文引用的主題和目的,將該文獻藉由引用併入。在一些實施方式中,Cas12i多肽與本申請的SEQ ID NO: 8、2、11和9中任一項包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,本揭露的Cas12i多肽係如 WO/2021/202800中所述之Cas12i2多肽,出於本文引用的主題和目的,將該文獻的相關揭露藉由引用併入。在一些實施方式中,Cas12i多肽切割靶核酸(例如,作為切口或雙股斷裂)。
使用Karlin和Altschul Proc. Natl. Acad. Sci.USA [美國國家科學院院刊] 87:2264-68, 1990的演算法,按Karlin和Altschul Proc. Natl. Acad. Sci. USA [美國國家科學院院刊] 90:5873-77, 1993所改良的,確定兩個核酸或兩個胺基酸序列的「同一性百分比」(又稱為序列同一性)。這種演算法併入Altschul等人, J. Mol. Biol.[分子生物學雜誌] 215:403-10, 1990的NBLAST和XBLAST程式(2.0版)中。BLAST核苷酸搜索可以用NBLAST程式進行,得分 = 100,字長為-12,以獲得與本發明之核酸分子同源的核苷酸序列。可以用XBLAST程式(得分 = 50,字長 = 3)來進行BLAST蛋白質搜索,以獲得與本發明之蛋白質分子同源的胺基酸序列。在兩個序列之間存在空位的情況下,可以利用如Altschul等人, Nucleic Acids Res[核酸研究] 25(17): 3389-3402, 1997中描述的空位BLAST。當利用BLAST程式和空位BLAST程式時,可以使用相應程式(例如,XBLAST和NBLAST)的缺省參數。
如本文所用,術語「複合物」係指兩個或更多個分子的組化。在一些實施方式中,複合物包含彼此相互作用(例如,結合、接觸、黏附)的多肽和核酸分子。在一些實施方式中,術語「複合物」用於指CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)與反轉錄酶多肽的結合。例如,CRISPR核酸酶(例如,本文揭露的Cas12i2多肽)和反轉錄酶多肽的複合物可為這兩種多肽的異二聚體,例如,經由二聚化結構域(例如,白胺酸拉鍊)、抗體、奈米抗體或適配體。在一些實施方式中,術語「複合物」用於指RNA指導物與RT供體RNA的結合。在一些實施方式中,術語「複合物」用於指CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)、反轉錄酶多肽、RNA指導物和RT供體RNA的結合。在一些實施方式中,術語「複合物」用於指反轉錄酶多肽與RT供體RNA的結合。
如本文所用,術語「可被核酸酶識別的結合位點」或「核酸酶結合序列」係指能夠與CRISPR核酸酶結合的序列。在一些實施方式中,核酸酶結合序列係RNA序列。在一些實施方式中,核酸酶結合序列係同向重複序列。在一些實施方式中,核酸酶結合序列能夠與II型CRISPR核酸酶或V型CRISPR核酸酶(例如,可被II型CRISPR核酸酶識別的結合位點,或可被V型CRISPR核酸酶識別的結合位點)結合。
如本文所用,術語「缺失」係指相對於參考序列,核酸序列中的一或多個核苷酸的丟失。在如何製備包含缺失的序列中沒有暗指特定的過程。例如,可以從單個核苷酸直接合成包含缺失的序列。在其他實施方式中,藉由提供參考序列然後改變參考序列來產生缺失。核酸序列可以在生物體的基因組中。核酸序列可以在細胞中。核酸序列可為DNA序列。缺失可為框移突變或非框移突變。本文所述之缺失係指插入多達數個千鹼基。
如本文所用,術語「編輯」係指將一或多個修飾引入到靶核酸中的核苷酸序列中,例如目的基因組位點。編輯可以發生在如本文所定義的靶序列內。可替代地,編輯可以發生在靶序列之外(例如,與靶序列相鄰)。編輯可為一或多個取代、一或多個插入、一或多個缺失或其組合。
如本文所用,術語「融合」和「融合的」係指連接至少兩個核苷酸或蛋白質分子。例如,「融合」和「融合的」可以指連接由自然界中單獨的基因(例如,V型核酸酶和反轉錄酶多肽)編碼的至少兩個多肽結構域。融合可為N-末端融合、C-末端融合或分子內融合。在一些方面,將該等結構域轉錄和翻譯以產生單一多肽。還如本文所用,術語「融合」和「融合的」用於指連接兩個核酸分子,例如兩個RNA分子(例如,RNA指導物和RT供體RNA)。融合可為5’融合、3’融合或分子內融合。
如本文所用,術語「插入」係指相對於參考序列,核酸序列中的一或多個核苷酸的增加。在如何製備包含插入的序列中沒有暗指特定的過程。例如,可以從單個核苷酸直接合成包含插入的序列。在其他實施方式中,藉由提供參考序列然後改變參考序列來產生插入。核酸序列可以在生物體的基因組中。核酸序列可以在細胞中。核酸序列可為DNA序列。插入可為框移突變或非框移突變。本文所述之插入係指插入多達數個千鹼基。
如本文所用,術語「原間隔子相鄰模體」或「PAM序列」係指與靶序列相鄰的DNA序列。在一些實施方式中,PAM序列係酶活性所需的。在雙股DNA分子中,含有PAM模體的股稱為「PAM股」,互補股稱為「非PAM股」。RNA指導物結合至與本文揭露的靶序列互補的非PAM股中的位點,並且如本文所述之PAM序列存在於PAM股中。
如本文所用,術語「PAM股」係指包含PAM模體的靶核酸(雙股)的股。在一些實施方式中,PAM股係編碼(例如,有義)股。在其他實施方式中,PAM股係非編碼股(例如,反義股)。術語「非PAM股」係指PAM股的互補股。由於gRNA經由鹼基配對結合非PAM股,因此非PAM股也稱為靶股,而PAM股也稱為非靶股。
如本文所用,術語「靶序列」係指與PAM模體(在PAM股上)相鄰的DNA片段。靶序列的互補區位於非PAM股上。靶序列可以緊鄰PAM模體。可替代地,靶序列和PAM可以由小的序列區段(例如,多達5個核苷酸,例如多達4、3、2或1個核苷酸)分開。靶序列可以位於PAM模體的3’末端或PAM模體的5’末端,這取決於識別該PAM模體的CRISPR核酸酶,這係本領域已知的。例如,對於Cas12i多肽(例如,Cas12i2多肽,例如本文揭露的那些)而言,靶序列位於PAM模體的3’末端。
如本文所用,術語「RNA指導物」或「RNA指導序列」係指促進本文所述之CRISPR核酸酶靶向目的基因組位點的RNA分子或經修飾的RNA分子。例如,RNA指導物可為識別(例如,結合)與PAM股中的靶序列互補(例如,被設計為與特定核酸序列互補)的非PAM股中的位點的分子。RNA指導物包含間隔子和核酸酶結合序列(例如,同向重複(DR)序列)。術語CRISPR RNA(crRNA)、pre-crRNA和成熟crRNA在本文中也用於指RNA指導物。RNA指導物的5’末端或3’末端可以與如本文揭露的RT供體RNA融合。在一些情況下,RNA指導物可為經修飾的RNA分子,該經修飾的RNA分子例如在包含在RNA指導物中的DNA結合序列(其結合靶序列)中包含一或多個去氧核糖核苷酸。在一些實例中,DNA結合序列可以含有DNA序列或DNA/RNA雜合序列。
如本文所用,術語「間隔子」和「間隔子序列」(也稱為DNA結合序列)係RNA指導物中的一部分,該RNA指導物係靶序列(DNA序列)的RNA等價物。間隔子含有能夠經由鹼基配對在與靶序列互補的位點處(在PAM股中)與非PAM股結合的序列。這樣的間隔子也稱為對靶序列具有特異性。在一些情況下,除RNA-DNA序列差異以外,間隔子可以與靶序列具有至少75%同一性(例如,至少80%、至少85%、至少90%、至少95%、至少98%或至少99%)。在一些情況下,除RNA-DNA序列差異外,間隔子可以與靶序列具有100%同一性。
如本文所用,術語「互補的」係指與第二多核苷酸(例如,靶序列的互補序列)具有一定水平互補性的第一多核苷酸(例如,RNA指導物的間隔子序列),使得該第一和第二多核苷酸可以經由鹼基配對形成雙股複合物,以允許與第一多核苷酸複合的效應多肽(例如,Cas12i2多肽、Cas12i2-反轉錄酶融合多肽或其變體)作用於(例如,切割)第二多核苷酸。在一些實施方式中,第一多核苷酸可以與第二多核苷酸基本上互補,即與第二多核苷酸具有至少約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%互補性。在一些實施方式中,第一多核苷酸與第二多核苷酸完全互補,即與第二多核苷酸具有100%互補性。
如本文所用,術語「反轉錄酶」和「RT」係指典型地具有三種酶活性(包括RNA和DNA依賴性DNA聚合活性和催化RNA-DNA雜合體中RNA的切割的RNA酶H活性)的多功能酶。反轉錄酶可以從RNA模板生成DNA。
如本文所用,術語「反轉錄供體RNA」和「RT供體RNA」係指包含反轉錄模板序列(模板序列)和引物結合位點(PBS)的RNA分子。RT供體RNA可以在RNA指導物的5’末端或3’末端與該RNA指導物融合。
如本文所用,術語「PBS靶向位點」係指PBS結合的區域。PBS靶向位點可以與非PAM股的與靶序列互補的區域相鄰(例如,其上游)。例如,PBS靶向位點可為與靶序列互補的區域上游的3-10個核苷酸(例如,3個核苷酸或4個核苷酸)。在一些情況下,PBS靶向位點可以緊鄰非PAM鏈的與靶序列互補的區域。在其他實例中,PBS靶向位點可以與非PAM股的與靶序列互補的區域重疊。可替代地,PBS靶向位點可以與PAM股上的靶序列相鄰、位於其上游或與其重疊。
如本文所用,術語「反轉錄模板序列」或「模板序列」係指作為藉由反轉錄酶進行DNA合成的模板的RNA分子或RT供體RNA片段。在一些實施方式中,反轉錄模板序列包含將被摻入到需要基因編輯的基因組位點的編輯。在一些情況下,由RT供體RNA中的反轉錄模板序列介導的編輯會破壞或去除PAM序列、靶序列或兩者。
如本文所用,術語「編輯模板RNA」或「基因編輯RNA」(本文可互換使用)係指RNA分子或RNA分子組,該RNA分子或RNA分子組包含RNA指導物(包含間隔子和可被CRISPR核酸酶識別的一或多個結合位點,例如本文揭露的那些)和RT供體RNA(包含PBS和反轉錄模板序列)。基因編輯RNA能夠介導CRISPR核酸酶在目的基因組位點內的靶序列處的切割以及從基於基因編輯RNA中的模板序列的CRISPR核酸酶切割產生的游離DNA股的游離3’末端進行的DNA片段的合成。在一些實施方式中,編輯模板RNA或基因編輯RNA係包含與RT供體RNA連接(例如,融合)的RNA指導物的單個RNA分子。在一些實施方式中,編輯模板RNA從5’到3’包含可被CRISPR核酸酶識別的一或多個結合位點、間隔子序列、PBS和RT供體RNA。在一些實施方式中,編輯模板RNA或基因編輯RNA從5’到3’包含可被CRISPR核酸酶識別的一或多個結合位點、間隔子、模板序列和PBS。在一些實施方式中,編輯模板RNA或基因編輯RNA從5’到3’包含模板序列、PBS、可被CRISPR核酸酶識別的一或多個結合位點和間隔子序列。在一些實施方式中,編輯模板RNA進一步包含連接子。例如,在一些實施方式中,編輯模板RNA包含在可被CRISPR核酸酶識別的一或多個結合位點與PBS之間或在間隔子序列與RT供體RNA之間的連接子。
如本文所用,術語「取代」係指相對於參考序列,不同的一或多個核苷酸對一或多個核苷酸的取代。在如何製備包含取代的序列中沒有暗指特定的過程。例如,可以從單個核苷酸直接合成包含取代的序列。在其他實施方式中,藉由提供參考序列然後改變參考序列來產生取代。核酸序列可以在生物體的基因組中。核酸序列可以在細胞中。核酸序列可為DNA序列。本文所述之取代係指取代多達數個千鹼基。
如本文所用,術語「上游」和「下游」係指單個核酸(例如,DNA)序列內的相對位置。「上游」和「下游」分別指RNA轉錄發生的5’到3’方向。當第一序列的3’末端出現在第二序列的5’末端之前時,第一序列位於第二序列的上游。當第一序列的5’末端出現在第二序列的3’末端之後時,第一序列位於第二序列的下游。在一些實施方式中,參考非PAM股使用術語「上游」和「下游」。例如,在一些實施方式中,PBS與靶序列上游的非PAM股序列互補。因此,在一些實施方式中,PBS與間隔子序列結合的序列上游的序列結合,並且該間隔子序列結合PBS結合的序列的下游。 I. 基因編輯系統
先導編輯被開發用於將取代、小插入或小缺失引入到靶序列。先導編輯方法依賴於與反轉錄酶融合的Cas9切口酶和先導編輯指導RNA(pegRNA)。pegRNA包含能夠與靶基因座的非PAM股(與PAM序列相對的股)結合的間隔子序列、能夠與靶基因座的PAM股(包含PAM序列的股)結合的引物結合位點(PBS)和包含編輯的反轉錄模板序列。pegRNA的間隔子序列與非PAM股上的靶序列結合,切口酶Cas9在PAM股上產生切口。這暴露了可以與PBS雜交的靶基因座的PAM股上的3’ flap。然後反轉錄酶複製反轉錄模板,從而延伸3’ flap。參見例如 19A。通過DNA修復機制,將編輯摻入到靶基因座中。
在一些方面,本文提供了基因編輯系統,其能夠編輯靶核酸(例如,在目的基因組位點處),例如,在基因組位點處引入添加、缺失、取代或其組合。編輯可以發生在靶核酸的任一條股上。本文揭露的基因編輯系統包含至少一種蛋白質組分或編碼該蛋白質組分的核苷酸序列,以及至少一種RNA組分或編碼該RNA組分的核苷酸序列。蛋白質組分具有由RNA組分指導在所希望位點處切割靶核酸的活性和合成新DNA序列的活性,該合成從由於切割產生的DNA股的游離3’末端開始,使用部分RNA組分作為模板。然後可以經由例如宿主細胞中的DNA修復機制將新合成的DNA片段摻入到靶核酸中,從而對該靶核酸進行基因編輯。
本文揭露的基因編輯系統中的蛋白質組分可以包含CRISPR核酸酶(例如,V型核酸酶,如變體Cas12i多肽)和反轉錄酶(RT)多肽。在一些實例中,CRISPR核酸酶和RT多肽係兩種單獨的多肽。在其他實例中,CRISPR核酸酶和RT多肽係融合多肽的一部分。
本文揭露的基因編輯系統中的RNA組分可以包含指導RNA(gRNA)(在本文中也描述為RNA指導物,其介導如設計的靶核酸中特定位點處的CRISPR核酸酶切割)和反轉錄供體RNA(RT供體RNA,其藉由RT多肽介導反轉錄,並為反轉錄提供模板序列)。在一些實例中,gRNA和RT供體RNA係兩種單獨的RNA分子。在其他實例中,gRNA和RT供體RNA係單個RNA分子的一部分。
如本文所示且不受理論束縛,本文所述之基因編輯系統提供了優於本領域的幾個優點。例如,尚未證明用V型CRISPR核酸酶(例如Cas12i CRISPR核酸酶)進行的RNA模板化編輯。有大量小於Cas9核酸酶的V型核酸酶。例如,Cas12i2的長度為1,054個胺基酸,而釀膿鏈球菌( S. pyogenes)Cas9(SpCas9)的長度為1,368個胺基酸,嗜熱鏈球菌Cas9(StCas9)的長度為1,128個胺基酸,FnCpf1的長度為1,300個胺基酸,AsCpf1的長度為1,307個胺基酸,以及LbCpf1的長度為1,246個胺基酸。此外,V型核酸酶利用不需要反式激活CRISPR RNA(tracrRNA)的RNA指導物,並因此比Cas9 RNA指導物小。較小的Cas12i多肽和RNA指導物大小有益於遞送。此外,尚未用任何CRISPR核酸酶利用單個編輯模板RNA證明RNA模板化編輯,該編輯模板RNA結合靶基因座的單股,例如靶股(非PAM股)。如本文所示,與包含SpCas9多肽的基因編輯系統相比,包含Cas12i多肽的基因編輯系統還表現出降低的脫靶活性。參見PCT/US 2021/025257,將其藉由引用以其全文併入。 A.CRISPR 核酸酶
本文揭露的基因編輯系統中任一個可以包含CRISPR核酸酶。在一些實施方式中,CRISPR核酸酶能夠結合和/或結合至如本文其他地方所述之核酸酶結合序列。在一些實施方式中,CRISPR核酸酶在靶序列處切割DNA。在一些實施方式中,經由本文其他地方所述之特異性識別和/或結合靶序列的DNA結合序列將CRISPR核酸酶募集至靶序列。在一些實施方式中,CRISPR核酸酶在靶序列處切割一條或兩條DNA股。在一些實施方式中,將多於一種CRISPR核酸酶募集至靶序列,並且一或多種CRISPR核酸酶在靶序列處或靶序列附近切割一條或兩條DNA股。在此類實施方式中,CRISPR核酸酶可以具有或能夠具有核酸酶活性。在一些實施方式中,CRISPR核酸酶可以具有降低的或有限的核酸酶活性。在一些實施方式中,如本文其他地方所述之CRISPR核酸酶-反轉錄酶融合多肽能夠結合並結合至如本文其他地方所述之編輯模板RNA中的至少一個核酸酶結合序列。在一些實施方式中,CRISPR核酸酶-反轉錄酶融合物能夠結合並通過編輯模板RNA中的至少一個DNA結合序列結合至靶序列。在此類實施方式中,藉由與核酸酶結合序列和編輯模板RNA的DNA結合序列結合,將CRISPR核酸酶募集至靶序列或使其靠近靶序列。此外,在此類實施方式中,反轉錄酶能夠轉錄並將如本文其他地方所述之反轉錄模板序列轉錄成DNA。
在一些實施方式中,CRISPR核酸酶-反轉錄酶融合多肽將反轉錄模板序列轉錄成靶核酸的非PAM股。在一些實施方式中,CRISPR核酸酶-反轉錄酶融合多肽將反轉錄模板序列轉錄成靶核酸的PAM股。在一些實施方式中,CRISPR核酸酶-反轉錄酶融合多肽從PBS(例如,PBS的5’或3’末端)開始自5’到3’轉錄反轉錄模板序列。在一些實施方式中,在PBS與靶核酸的非PAM股的游離3’末端雜交後,CRISPR核酸酶-反轉錄酶融合物從非PAM的3’末端轉錄反轉錄模板序列。在一些實施方式中,在PBS與靶核酸的PAM股的游離3’末端雜交後,CRISPR核酸酶-反轉錄酶融合物從PAM的3’末端轉錄反轉錄模板序列。
在一些實施方式中,CRISPR核酸酶係RNA指導的CRISPR核酸酶。在一些實施方式中,CRISPR核酸酶係DNA靶向核酸酶。
在一些實施方式中,CRISPR核酸酶係Cas9(例如,Cas9和nCas9)、Casl2a/Cpf1、Cas12b/C2c1、Casl2c/C2c3、Casl2d/CasY、Casl2e/CasX、Casl2g、Casl2h、Casl2i、和Casl2j/CasPhi)。Cas酶之非限制性實例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(也稱為Csn1或Csxl2)、Cas10、Cas10d、Casl2a/Cpfl、Casl2b/C2cl、Casl2c/C2c3、Casl2d/CasY、Casl2e/CasX、Casl2g、Casl2h、Casl2i、Casl2j/CasΦ、Cpf1、Csy1、Csy2、Csy3、Csy4、Csel、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csnl、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csxl6、CsaX、Csx3、Csx1、CsxlS、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csal、Csa2、Csa3、Csa4、Csa5、II型CRISPR核酸酶、V型CRISPR核酸酶、VI型CRISPR核酸酶、CARF、DinG,其同源物或其經修飾或經工程改造的版本。其他CRISPR核酸酶也在本揭露之範圍內,儘管它們可能未在本揭露中特別列出。參見例如,Makarova等人的「Classification and Nomenclature of CRISPR-Cas Systems: Where from Here? [CRISPR-Cas系統的分類和命名:從何而來?]」 CRISPRJ. 1(5):325-36 (2018)。
在一些實施方式中,CRISPR核酸酶係以下文獻中揭露的核酸酶:WO 2021055874、WO 2020206036、WO 2020191102、WO 2020186213、WO 2020028555、WO 2020033601、WO 2019126762、WO 2019126774、WO 2019071048、WO 2019018423、WO 2019005866、WO 2018191388、WO 2018170333、WO 2018035388、WO 2018035387、WO 2017219027、WO 2017189308、WO 2017184768、WO 2017106657、WO 2016205749、WO 2017070605、WO 2016205764、WO 2016205711、WO 2016028682、WO 2015089473、WO 2014093595、WO 2015089427、WO 2014204725、WO 2015070083、WO 2014093655、WO 2014093694、WO 2014093712、WO 2014093635、WO 2021133829、WO 2021007177、WO 2020197934、WO 2020181102、WO 2020181101、WO 2020041456、WO 2020023529、WO 2020005980、WO 2019104058、WO 2019089820、WO 2019089808、WO 2019089804、WO 2019089796、WO 2019036185、WO 2018226855、WO 2018213351、WO 2018089664、WO 2018064371、WO 2018064352、WO 2017106569、WO 2017048969、WO 2016196655、WO 2016106239、WO 2016036754、WO 2015103153、WO 2015089277、WO 2014150624、WO 2013176772、WO 2021119563、WO 2021118626、WO 2020247883、WO 2020247882、WO 2020223634、WO 2020142754、WO 2020086475、WO 2020028729、WO 2019241452、WO 2019173248、WO 2018236548、WO 2018183403、WO 2017027423、WO 2018106727、WO 2018071672、WO 2017096328、WO 2017070598、WO 2016201155、WO 2014150624、WO 2013098244、WO 2021113522、WO 2021050534、WO 2021046442、WO 2021041569、WO 2021007563、WO 2020252378、WO 2020180699、WO 2020018142、WO 2019222555、WO 2019178428、WO 2019178427或WO 2019006471,出於本文引用的主題和目的,將該等文獻藉由引用併入。
在一些實施方式中,本發明之組成物包含V型CRISPR核酸酶(例如,V型核酸酶)。在一些實施方式中,V型核酸酶係Cas12 CRISPR核酸酶。在一些實施方式中,V型核酸酶係Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)CRISPR核酸酶。在一些實施方式中,V型核酸酶係Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)CRISPR核酸酶的變體(例如,功能性變體)。在一些實施方式中,V型核酸酶包含與野生型V型核酸酶序列(例如,Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)的野生型胺基酸序列)具有至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的胺基酸序列。
在一些實施方式中,本發明之V型核酸酶係Cas12i CRISPR核酸酶。在一些實施方式中,Cas12i CRISPR核酸酶係包含核苷酸序列(例如SEQ ID NO: 1)的Cas12i2 CRISPR核酸酶或由包含胺基酸序列(例如SEQ ID NO: 2)的多肽編碼。在一些實施方式中,本發明之CRISPR核酸酶係野生型CRISPR核酸酶的變體,其中該野生型包含核苷酸序列(例如SEQ ID NO: 1)或由包含胺基酸序列(例如SEQ ID NO: 2)的多肽編碼。參見表1。
在一些實施方式中,本發明之II型核酸酶係Cas9 CRISPR核酸酶。在一些實施方式中,Cas9 CRISPR核酸酶係包含胺基酸序列(例如SEQ ID NO: 120)的SpCas9 CRISPR核酸酶。在一些實施方式中,Cas9 CRISPR核酸酶係切口酶,例如包含胺基酸序列(例如SEQ ID NO: 121)的nSpCas9。在一些實施方式中,本發明之CRISPR核酸酶係不同種類的Cas9 CRISPR核酸酶。在一些實施方式中,Cas9 CRISPR核酸酶係包含胺基酸序列(例如SEQ ID NO: 122)的SaCas9 CRISPR核酸酶。參見表1。 [ 1] .Cas12i Cas9 序列 .
SEQ ID NO 序列 描述
1 ATGAGCAGCGCGATCAAAAGCTACAAGAGCGTTCTGCGTCCGAACGAGCGTAAGAACCAACTGCTGAAAAGCACCATTCAGTGCCTGGAAGACGGTAGCGCGTTCTTTTTCAAGATGCTGCAAGGCCTGTTTGGTGGCATCACCCCGGAGATTGTTCGTTTCAGCACCGAACAGGAGAAACAGCAACAGGATATCGCGCTGTGGTGCGCGGTTAACTGGTTCCGTCCGGTGAGCCAAGACAGCCTGACCCACACCATTGCGAGCGATAACCTGGTGGAGAAGTTTGAGGAATACTATGGTGGCACCGCGAGCGACGCGATCAAACAGTACTTCAGCGCGAGCATTGGCGAAAGCTACTATTGGAACGACTGCCGTCAACAGTACTATGATCTGTGCCGTGAGCTGGGTGTTGAGGTGAGCGACCTGACCCATGATCTGGAGATCCTGTGCCGTGAAAAGTGCCTGGCGGTTGCGACCGAGAGCAACCAGAACAACAGCATCATTAGCGTTCTGTTTGGCACCGGCGAAAAAGAGGACCGTAGCGTGAAACTGCGTATCACCAAGAAAATTCTGGAGGCGATCAGCAACCTGAAAGAAATCCCGAAGAACGTTGCGCCGATTCAAGAGATCATTCTGAACGTGGCGAAAGCGACCAAGGAAACCTTCCGTCAGGTGTATGCGGGTAACCTGGGTGCGCCGAGCACCCTGGAGAAATTTATCGCGAAGGACGGCCAAAAAGAGTTCGATCTGAAGAAACTGCAGACCGACCTGAAGAAAGTTATTCGTGGTAAAAGCAAGGAGCGTGATTGGTGCTGCCAGGAAGAGCTGCGTAGCTACGTGGAGCAAAACACCATCCAGTATGACCTGTGGGCGTGGGGCGAAATGTTCAACAAAGCGCACACCGCGCTGAAAATCAAGAGCACCCGTAACTACAACTTTGCGAAGCAACGTCTGGAACAGTTCAAAGAGATTCAGAGCCTGAACAACCTGCTGGTTGTGAAGAAGCTGAACGACTTTTTCGATAGCGAATTTTTCAGCGGCGAGGAAACCTACACCATCTGCGTTCACCATCTGGGTGGCAAGGACCTGAGCAAACTGTATAAGGCGTGGGAGGATGATCCGGCGGACCCGGAAAACGCGATTGTGGTTCTGTGCGACGATCTGAAAAACAACTTTAAGAAAGAGCCGATCCGTAACATTCTGCGTTACATCTTCACCATTCGTCAAGAATGCAGCGCGCAGGACATCCTGGCGGCGGCGAAGTACAACCAACAGCTGGATCGTTATAAAAGCCAAAAGGCGAACCCGAGCGTTCTGGGTAACCAGGGCTTTACCTGGACCAACGCGGTGATCCTGCCGGAGAAGGCGCAGCGTAACGACCGTCCGAACAGCCTGGATCTGCGTATTTGGCTGTACCTGAAACTGCGTCACCCGGACGGTCGTTGGAAGAAACACCATATCCCGTTCTACGATACCCGTTTCTTCCAAGAAATTTATGCGGCGGGCAACAGCCCGGTTGACACCTGCCAGTTTCGTACCCCGCGTTTCGGTTATCACCTGCCGAAACTGACCGATCAGACCGCGATCCGTGTTAACAAGAAACATGTGAAAGCGGCGAAGACCGAGGCGCGTATTCGTCTGGCGATCCAACAGGGCACCCTGCCGGTGAGCAACCTGAAGATCACCGAAATTAGCGCGACCATCAACAGCAAAGGTCAAGTGCGTATTCCGGTTAAGTTTGACGTGGGTCGTCAAAAAGGCACCCTGCAGATCGGTGACCGTTTCTGCGGCTACGATCAAAACCAGACCGCGAGCCACGCGTATAGCCTGTGGGAAGTGGTTAAAGAGGGTCAATACCATAAAGAGCTGGGCTGCTTTGTTCGTTTCATCAGCAGCGGTGACATCGTGAGCATTACCGAGAACCGTGGCAACCAATTTGATCAGCTGAGCTATGAAGGTCTGGCGTACCCGCAATATGCGGACTGGCGTAAGAAAGCGAGCAAGTTCGTGAGCCTGTGGCAGATCACCAAGAAAAACAAGAAAAAGGAAATCGTGACCGTTGAAGCGAAAGAGAAGTTTGACGCGATCTGCAAGTACCAGCCGCGTCTGTATAAATTCAACAAGGAGTACGCGTATCTGCTGCGTGATATTGTTCGTGGCAAAAGCCTGGTGGAACTGCAACAGATTCGTCAAGAGATCTTTCGTTTCATTGAACAGGACTGCGGTGTTACCCGTCTGGGCAGCCTGAGCCTGAGCACCCTGGAAACCGTGAAAGCGGTTAAGGGTATCATTTACAGCTATTTTAGCACCGCGCTGAACGCGAGCAAGAACAACCCGATCAGCGACGAACAGCGTAAAGAGTTTGATCCGGAACTGTTCGCGCTGCTGGAAAAGCTGGAGCTGATTCGTACCCGTAAAAAGAAACAAAAAGTGGAACGTATCGCGAACAGCCTGATTCAGACCTGCCTGGAGAACAACATCAAGTTCATTCGTGGTGAAGGCGACCTGAGCACCACCAACAACGCGACCAAGAAAAAGGCGAACAGCCGTAGCATGGATTGGTTGGCGCGTGGTGTTTTTAACAAAATCCGTCAACTGGCGCCGATGCACAACATTACCCTGTTCGGTTGCGGCAGCCTGTACACCAGCCACCAGGACCCGCTGGTGCATCGTAACCCGGATAAAGCGATGAAGTGCCGTTGGGCGGCGATCCCGGTTAAGGACATTGGCGATTGGGTGCTGCGTAAGCTGAGCCAAAACCTGCGTGCGAAAAACATCGGCACCGGCGAGTACTATCACCAAGGTGTTAAAGAGTTCCTGAGCCATTATGAACTGCAGGACCTGGAGGAAGAGCTGCTGAAGTGGCGTAGCGATCGTAAAAGCAACATTCCGTGCTGGGTGCTGCAGAACCGTCTGGCGGAGAAGCTGGGCAACAAAGAAGCGGTGGTTTACATCCCGGTTCGTGGTGGCCGTATTTATTTTGCGACCCACAAGGTGGCGACCGGTGCGGTGAGCATCGTTTTCGACCAAAAACAAGTGTGGGTTTGCAACGCGGATCATGTTGCGGCGGCGAACATCGCGCTGACCGTGAAGGGTATTGGCGAACAAAGCAGCGACGAAGAGAACCCGGATGGTAGCCGTATCAAACTGCAGCTGACCAGC 編碼Cas12i2的核苷酸序列
2 MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS Cas12i2胺基酸序列
3 MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGRWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTS PCT/US 2021/025257的SEQ ID NO: 3的變體Cas12i2
4 MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTS PCT/US 2021/025257的SEQ ID NO: 4的變體Cas12i2
5 MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGGRIKLQLTS PCT/US 2021/025257的SEQ ID NO:5的變體Cas12i2
6 MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELRCRVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGRQSSDEENPDGGRIKLQLTS PCT/US 2021/025257的SEQ ID NO: 495的變體Cas12i2
7 MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELRCRVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLATMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGRQSSDEENPDGGRIKLQLTS PCT/US 2021/025257的SEQ ID NO: 496的變體Cas12i2
8 MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK Cas12i1(美國專利案號10,808,245之SEQ ID NO: 3)
9 MASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLEAELHYDGKKAKHHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTGVDKTTNCSFMIKRENDEYKLVINRKISVDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNEEQDDIPLITKKAESKSPPKDRKRSKTSQLPQK Cas12i4(美國專利案號10,808,245之SEQ ID NO: 16)
10 MASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLRAELHYDGKKAKHHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTRVDKTTNCSFMIKRENDEYKLVINRKISRDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNREQDDIPLITKKAESKSPPKDRKRSKTSQLPQK 變體Cas12i4
11 MSISNNNILPYNPKLLPDDRKHKMLVDTFNQLDLIRNNLHDMIIALYGALKYDNIKQFASKEKPHISADALCSINWFRLVKTNERKPAIESNQIISKFIQYSGHTPDKYALSHITGNHEPSHKWIDCREYAINYARIMHLSFSQFQDLATACLNCKILILNGTLTSSWAWGANSALFGGSDKENFSVKAKILNSFIENLKDEMNTTKFQVVEKVCQQIGSSDAADLFDLYRSTVKDGNRGPATGRNPKVMNLFSQDGEISSEQREDFIESFQKVMQEKNSKQIIPHLDKLKYHLVKQSGLYDIYSWAAAIKNANSTIVASNSSNLNTILNKTEKQQTFEELRKDEKIVACSKILLSVNDTLPEDLHYNPSTSNLGKNLDVFFDLLNENSVHTIENKEEKNKIVKECVNQYMEECKGLNKPPMPVLLTFISDYAHKHQAQDFLSAAKMNFIDLKIKSIKVVPTVHGSSPYTWISNLSKKNKDGKMIRTPNSSLIGWIIPPEEIHDQKFAGQNPIIWAVLRVYCNNKWEMHHFPFSDSRFFTEVYAYKPNLPYLPGGENRSKRFGYRHSTNLSNESRQILLDKSKYAKANKSVLRCMENMTHNVVFDPKTSLNIRIKTDKNNSPVLDDKGRITFVMQINHRILEKYNNTKIEIGDRILAYDQNQSENHTYAILQRTEEGSHAHQFNGWYVRVLETGKVTSIVQGLSGPIDQLNYDGMPVTSHKFNCWQADRSAFVSQFASLKISETETFDEAYQAINAQGAYTWNLFYLRILRKALRVCHMENINQFREEILAISKNRLSPMSLGSLSQNSLKMIRAFKSIINCYMSRMSFVDELQKKEGDLELHTIMRLTDNKLNDKRVEKINRASSFLTNKAHSMGCKMIVGESDLPVADSKTSKKQNVDRMDWCARALSHKVEYACKLMGLAYRGIPAYMSSHQDPLVHLVESKRSVLRPRFVVADKSDVKQHHLDNLRRMLNSKTKVGTAVYYREAVELMCEELGIHKTDMAKGKVSLSDFVDKFIGEKAIFPQRGGRFYMSTKRLTTGAKLICYSGSDVWLSDADEIAAINIGMFVVCDQTGAFKKKKKEKLDDEECDILPFRPM Cas12i3(美國專利案號10,808,245之SEQ ID NO: 14)
120 MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SpCas9
121 MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD nSpCas9
122 MKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG SaCas9
編碼本文所述之CRISPR核酸酶的核酸序列可以與參考核酸序列(例如,SEQ ID NO: 1)基本上相同。在一些實施方式中,CRISPR核酸酶由以下核酸編碼,該核酸包含與參考核酸序列(例如,編碼野生型多肽的核酸序列,如SEQ ID NO: 1)具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列同一性的序列。可以藉由檢查兩個最佳比對的核酸序列或藉由使用軟體程式或演算法(例如,BLAST、ALIGN、CLUSTAL)使用標準參數手動確定兩個此類核酸之間的同一性百分比。兩個核酸序列基本上相同的一個指示係核酸分子在嚴格條件下(例如,在中等至高度嚴格的範圍內)與另一個核酸分子的互補序列雜交。
在一些實施方式中,CRISPR核酸酶由以下核酸序列編碼,該核酸序列與參考核酸序列(例如,編碼CRISPR核酸酶的核酸序列,如SEQ ID NO: 1)具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或更高序列同一性、但非100%序列同一性。
在一些實施方式中,本發明之CRISPR核酸酶包含與SEQ ID NO: 2具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些實施方式中,本發明之CRISPR核酸酶包含與SEQ ID NO: 2具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%、但非100%同一性的序列。
在一些實施方式中,本發明描述了CRISPR核酸酶,該CRISPR核酸酶與一或多種參考多肽(例如,野生型多肽)具有特定程度的胺基酸序列同一性,例如與SEQ ID NO: 2的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%、但非100%序列同一性。同源性或同一性可以藉由胺基酸序列比對確定,例如使用如本文所述之程式如BLAST、ALIGN或CLUSTAL。
在一些實施方式中,CRISPR核酸酶係WO/2021/202800中所述之變體Cas12i2多肽,出於本文引用的主題和目的,將該文獻的相關揭露藉由引用併入。在一些實施方式中,變體Cas12i2多肽包含WO/2021/202800的表2中列出的胺基酸取代中的一或多個。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與PCT/US 2021/025257的SEQ ID NO: 3中胺基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與PCT/US 2021/025257的SEQ ID NO: 4中胺基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與PCT/US 2021/025257的SEQ ID NO: 5中胺基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與PCT/US 2021/025257的SEQ ID NO: 495中胺基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與PCT/US 2021/025257的SEQ ID NO: 496中胺基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與WO/2021/202800(將該文獻藉由引用併入)的SEQ ID NO: 3-146和495-512中任一項具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
在一些實施方式中,CRISPR核酸酶係Cas12i多肽。在一些實施方式中,CRISPR核酸酶係Cas12i1多肽。在一些實施方式中,Cas12i1多肽係變體Cas12i1多肽。在一些實施方式中,本發明之變體Cas12i1多肽包含與SEQ ID NO: 8具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些實施方式中,本發明之變體Cas12i1多肽包含與SEQ ID NO: 8具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些實施方式中,CRISPR核酸酶與一或多種參考多肽(例如,野生型Casi1多肽)具有特定程度的胺基酸序列同一性,例如,與SEQ ID NO: 8的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以藉由胺基酸序列比對確定,例如使用如本文所述之程式如BLAST、ALIGN或CLUSTAL。
在一些實施方式中,編碼如本文所述之變體Cas12i1多肽的核酸編碼與SEQ ID NO: 8具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的胺基酸序列。在一些實施方式中,變體Cas12i1多肽具有與SEQ ID NO: 8具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些實施方式中,當使用任一先前所述之比對方法進行比對時,本文所述之具有酶活性(例如,核酸酶或核酸內切酶活性)的變體Cas12i1多肽包含與CRISPR核酸酶和SEQ ID NO: 8中任一者的胺基酸序列差異100、95、90、85、80、75、70、65、60、55、50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個胺基酸殘基的胺基酸序列。
在一些實施方式中,Cas12i多肽係Cas12i3多肽。在一些實施方式中,本發明之Cas12i3多肽包含與SEQ ID NO: 11具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些實施方式中,本發明之Cas12i3多肽包含與SEQ ID NO: 11具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些實施方式中,Cas12i3多肽係變體Cas12i3多肽。在一些實施方式中,變體Cas12i3多肽與一或多種參考多肽(例如,野生型多肽)具有特定程度的胺基酸序列同一性,例如,與SEQ ID NO: 11的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以藉由胺基酸序列比對確定,例如使用如本文所述之程式如BLAST、ALIGN或CLUSTAL。
在一些實施方式中,編碼如本文所述之變體Cas12i3多肽的核酸編碼與SEQ ID NO: 11具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的胺基酸序列。在一些實施方式中,變體Cas12i3多肽具有與SEQ ID NO: 11具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些實施方式中,當使用任一先前所述之比對方法進行比對時,本文所述之具有酶活性(例如,核酸酶或核酸內切酶活性)的變體Cas12i3多肽包含與CRISPR核酸酶和SEQ ID NO: 11中任一者的胺基酸序列差異100、95、90、85、80、75、70、65、60、55、50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個胺基酸殘基的胺基酸序列。
在一些實施方式中,Cas12i多肽係Cas12i4多肽。在一些實施方式中,本發明之Cas12i4多肽包含與SEQ ID NO: 9或SEQ ID NO: 10具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些實施方式中,本發明之Cas12i4多肽包含與SEQ ID NO: 9或SEQ ID NO: 10具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些實施方式中,Cas12i4多肽係變體Cas12i4多肽。在一些實施方式中,變體Cas12i4多肽與一或多種參考多肽(例如,野生型多肽)具有特定程度的胺基酸序列同一性,例如,與SEQ ID NO: 9或SEQ ID NO: 10的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以藉由胺基酸序列比對確定,例如使用如本文所述之程式如BLAST、ALIGN或CLUSTAL。
在一些實施方式中,編碼如本文所述之變體Cas12i4多肽的核酸編碼與SEQ ID NO: 9或SEQ ID NO: 10具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的胺基酸序列。在一些實施方式中,變體Cas12i4多肽具有與SEQ ID NO: 9或SEQ ID NO: 10具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些實施方式中,當使用任一先前所述之比對方法進行比對時,本文所述之具有酶活性(例如,核酸酶或核酸內切酶活性)的變體Cas12i4多肽包含與CRISPR核酸酶和SEQ ID NO: 9或SEQ ID NO: 10中任一者的胺基酸序列差異100、95、90、85、80、75、70、65、60、55、50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個胺基酸殘基的胺基酸序列。
在一些實施方式中,CRISPR核酸酶係II型CRISPR核酸酶,例如,Cas9核酸酶。在一些實施方式中,Cas9核酸酶係來自釀膿鏈球菌或金黃色葡萄球菌( S. aureus)的Cas9或其變體。參見例如U.S. 20190136248,將其藉由引用以其全文併入。在一些實施方式中,Cas9多肽係切口酶。
在一些實施方式中,本發明之Cas9多肽包含與SEQ ID NO: 120-122中任一項具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些實施方式中,本發明之Cas9多肽包含與SEQ ID NO: 120-122中任一項具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些實施方式中,Cas9多肽係變體Cas9多肽。在一些實施方式中,變體Cas9多肽與一或多種參考多肽(例如,野生型多肽)具有特定程度的胺基酸序列同一性,例如,與SEQ ID NO: 120-122中任一項的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以藉由胺基酸序列比對確定,例如使用如本文所述之程式如BLAST、ALIGN或CLUSTAL。
在一些實施方式中,編碼如本文所述之變體Cas9多肽的核酸編碼與SEQ ID NO: 120-122中任一項具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的胺基酸序列。在一些實施方式中,變體Cas9多肽具有與SEQ ID NO: 120-122中任一項具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些實施方式中,當使用任一先前所述之比對方法進行比對時,本文所述之具有酶活性(例如,核酸酶或核酸內切酶活性)的變體Cas9多肽包含與CRISPR核酸酶和SEQ ID NO: 120或SEQ ID NO: 121中任一者的胺基酸序列差異100、95、90、85、80、75、70、65、60、55、50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個胺基酸殘基的胺基酸序列。
在一些實施方式中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽或II型核酸酶)在野生型多肽的一或多個(例如,幾個)胺基酸處包含改變,其中至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200或更多個胺基酸被改變。
在一些實施方式中,如本文所述之任一實施方式中的CRISPR核酸酶包含crRNA加工活性。在一些實施方式中,V型核酸酶(例如,Cas12i多肽)係缺乏crRNA加工活性的變體。例如,在其中V型核酸酶係變體Cas12i2多肽的一些實施方式中,變體Cas12i2多肽包含H485或H486取代。在一些實施方式中,與SEQ ID NO: 2-7中任一項具有至少90%同一性(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的變體Cas12i2多肽進一步包含H485或H486突變。在一些實施方式中,包含H485或H486突變的變體Cas12i2多肽包含降低的crRNA加工活性或缺乏crRNA加工活性。
在一些實施方式中,編碼本文所述之CRISPR核酸酶的核苷酸序列可以經密碼子優化用於在特定的宿主細胞或生物體中使用。例如,核酸可以經密碼子優化以用於任何非人真核生物(包括小鼠、大鼠、兔、狗、家畜或非人靈長類動物)。密碼子使用表係易於獲得的,例如在www.kazusa.orjp/codon/上可獲得的「密碼子使用數據庫(Codon Usage Database)」中,並且該等表可以按多種方式進行改編。參見Nakamura等人 Nucl. Acids Res.[核酸研究] 28:292 (2000),將其藉由引用以其全文併入本文。用於密碼子優化特定序列以在特定宿主細胞中表現的電腦演算法也是可得的,諸如基因製造(Gene Forge)(Aptagen公司;賓夕法尼亞州雅各斯(Jacobus, PA))。
儘管本文所述之改變可為一或多個胺基酸改變,但CRISPR核酸酶的改變也可為結構性或實質性的,例如作為胺基和/或羧基末端延伸的多肽融合。例如,CRISPR核酸酶可以含有另外的肽,例如一或多種肽。另外的肽之實例可以包括用於標記的表位肽,例如多組胺酸標籤(His-標籤)、Myc和FLAG。在一些實施方式中,可以將本文所述之CRISPR核酸酶與可檢測部分如螢光蛋白(例如綠色螢光蛋白(GFP)或黃色螢光蛋白(YFP))融合。
在一些實施方式中,如本文所述之任一實施方式中的CRISPR核酸酶包含至少一個(例如,兩個、三個、四個、五個、六個或更多個)核定位訊號(NLS)。在一些實施方式中,CRISPR核酸酶包含至少一個(例如,兩個、三個、四個、五個、六個或更多個)出核訊號(NES)。在一些實施方式中,CRISPR核酸酶包含至少一個(例如,兩種、三個、四個、五個、六個或更多個)NLS和至少一個(例如,兩個、三個、四個、五個、六個或更多個)NES。
在一些實施方式中,CRISPR核酸酶至少包含RuvC結構域但少於整個CRISPR核酸酶。在一些實施方式中,CRISPR核酸酶係相對於野生型CRISPR核酸酶截短的CRISPR核酸酶。在一些實施方式中,截短的CRISPR核酸酶包含RuvC結構域。在一些實施方式中,CRISPR核酸酶包含整個CRISPR核酸酶的至少一個功能性結構域。在一些實施方式中,CRISPR核酸酶包含至少兩個RuvC結構域或至少兩個RuvC模體。在一些實施方式中,CRISPR核酸酶包含至少三個RuvC結構域或至少三個RuvC模體。在一些實施方式中,CRISPR核酸酶包含至少一個催化死亡型RuvC結構域和至少一個催化活性型RuvC結構域。在一些實施方式中,CRISPR核酸酶包含來自一或多個V型或II型核酸酶的兩個RuvC結構域。在一些實施方式中,CRISPR核酸酶至少包含RuvC結構域和二聚化結構域。
在一些實施方式中,如本文所述之任一實施方式中的CRISPR核酸酶與聚合酶融合。在一些實施方式中,如前述實施方式中任一項所述之CRISPR核酸酶與反轉錄酶多肽融合。在一些實施方式中,CRISPR核酸酶包含N-末端反轉錄酶多肽。在一些實施方式中,CRISPR核酸酶包含C-末端反轉錄酶多肽。在一些實施方式中,CRISPR核酸酶在CRISPR核酸酶內的分子內位置處包含反轉錄酶多肽(例如,反轉錄酶在該CRISPR核酸酶的環內)。
在一些實施方式中,如本文所述之任一實施方式中的CRISPR核酸酶與反轉錄酶多肽相互作用(例如,通過靜電相互作用)。在一些實施方式中,CRISPR核酸酶包含二聚化結構域。如本文所用,術語「二聚化結構域」係指能夠特異性結合單獨且相容的多肽結構域(例如,第二相容的二聚化結構域)的多肽結構域。在一些實施方式中,二聚體藉由第一二聚化結構域和第二相容二聚化結構域之間的非共價鍵形成。在一些實施方式中,二聚化結構域係白胺酸拉鍊、奈米抗體或抗體。在一些實施方式中,二聚化結構域募集反轉錄酶多肽。在一些實施方式中,CRISPR核酸酶和反轉錄酶多肽通過捲曲螺旋肽異二聚體相互作用。
在一些實施方式中,如本文所述之任一實施方式中的CRISPR核酸酶與連接酶、整合酶和/或重組酶相互作用。在一些實施方式中,將如本文所述之任一實施方式中的CRISPR核酸酶與連接酶、整合酶和/或重組酶融合。在一些實施方式中,將連接酶、整合酶和/或重組酶與CRISPR核酸酶的N-末端或C-末端融合。在一些實施方式中,將連接酶、整合酶和/或重組酶在內部與CRISPR核酸酶融合。在一些實施方式中,整合酶係絲胺酸整合酶。在一些實施方式中,整合酶係Bxb1、TP901或PhiBT1整合酶。在一些實施方式中,重組酶係絲胺酸重組酶或酪胺酸重組酶。在一些實施方式中,重組酶係CRE重組酶。在一些實施方式中,與連接酶、整合酶和/或重組酶相互作用或融合的CRISPR核酸酶進一步與反轉錄酶相互作用或融合。 B. 反轉錄酶
在各個實施方式中,本文揭露的組成物包括聚合酶(例如,DNA依賴性DNA聚合酶或RNA依賴性DNA聚合酶)或其變體,其可以作為與CRISPR核酸酶的融合物提供。聚合酶可為野生型聚合酶、功能性片段、變體、截短的變體等。聚合酶可以包括來自真核、原核、古細菌或病毒生物的野生型聚合酶,和/或聚合酶可以藉由基因工程、誘變、基於定向進化的過程進行修飾。
該等CRISPR核酸酶-RT融合多肽(例如本文揭露的那些(例如,表7和17中所示的那些))中任一個、它們的編碼核酸、包含其的載體和其製備方法也在本揭露之範圍內。
在一些實施方式中,聚合酶係反轉錄酶。在一些實施方式中,反轉錄酶多肽係從任何天然存在的生物體或病毒獲得的或從商業或非商業來源獲得的任何野生型反轉錄酶。反轉錄酶多肽也可為變體反轉錄酶多肽。
反轉錄酶多肽可以從多種不同的來源獲得。例如,基因可以從被反轉錄病毒感染的真核細胞或從包含部分或整個反轉錄病毒基因組的質體中獲得。另外地,包含反轉錄酶基因的RNA可以從反轉錄病毒中獲得。在一些實施方式中,反轉錄酶作為單獨組分表現或以其他方式提供,即,不作為與CRISPR核酸酶(例如,Cas12i)多肽的融合蛋白。
熟悉該項技術者將認識到反轉錄酶係本領域已知的,包括但不限於莫洛尼鼠白血病病毒(MMLV)反轉錄酶、人類免疫缺陷病毒(HIV)反轉錄酶和禽肉瘤-白血病病毒(ASLV)反轉錄酶,其包括但不限於勞斯氏肉瘤病毒(RSV)反轉錄酶、禽成髓細胞瘤病毒(AMV)反轉錄酶、禽骨髓成紅血細胞增多症病毒(AEV)輔助病毒MCAV反轉錄酶、禽骨髓細胞瘤病毒MC29輔助病毒MCAV反轉錄酶、家禽網狀內皮症病毒(REV-T)輔助病毒REV-A反轉錄酶、禽肉瘤病毒UR2輔助病毒UR2AV反轉錄酶、禽肉瘤病毒Y73輔助病毒YAV反轉錄酶、勞斯氏(Rous)相關病毒(RAV)反轉錄酶和成髓細胞血症相關病毒(MAV)反轉錄酶,它們可以適當地用於本文所述之組成物中。
在一些實施方式中,反轉錄酶係MMLV-RT,來自直腸真桿菌( Eubacterium rectale)的MarathonRT,或RTX反轉錄酶,或MMLV-RT、MarathonRT或RTX反轉錄酶的變體。在一些實施方式中,反轉錄酶係表2中所示的序列、其變體或其直系同源物。 [ 2] . 反轉錄酶序列 .
反轉錄酶 序列
MMLV-RT MTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP(SEQ ID NO: 29)
MMLV-RT_2 MTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFDEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGTAGFCRLWIPGFAEMAAPLYPLTKTGTLFNWGPDQQKAYQEILQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDL(SEQ ID NO: 230)
MMTV-RT MLQLGHLEESNSPWNTPVFVIKKKSGKWRLLQDLRAVNATMHDMGALQPGLPSPVAVPKGWEIIIIDLQDCFFNIKLHPEDCKRFAFSVPSPNFKRPYQRFQWKVLPQGMKNSPTLCQKFVDKAILTVRDKYQDSYIVHYMDDILLAHPSRSIVDEILTSMIQALNKHGLVVSTEKIQKYDNLKYLGTHIQGDSVSYQKLQIRTDKLRTLNDFQKLLGNINWIRPFLKLTT(SEQ ID NO: 231)
MarathonRT MDTSNLMEQILSSDNLNRAYLQVVRNKGAEGVDGMKYTELKEHLAKNGETIKGQLRTRKYKPQPARRVEIPKPDGGVRNLGVPTVTDRFIQQAIAQVLTPIYEEQFHDHSYGFRPNRCAQQAILTALNIMNDGNDWIVDIDLEKFFDTVNHDKLMTLIGRTIKDGDVISIVRKYLVSGIMIDDEYEDSIVGTPQGGNLSPLLANIMLNELDKEMEKRGLNFVRYADDCIIMVGSEMSANRVMRNISRFIEEKLGLKVNMTKSKVDRPSGLKYLGFGFYFDPRAHQFKAKPHAKSVAKFKKRMKELTCRSWGVSNSYKVEKLNQLIRGWINYFKIGSMKTLCKELDSRIRYRLRMCIWKQWKTPQNQEKNLVKLGIDRNTARRVAYTGKRIAYVCNKGAVNVAISNKRLASFGLISMLDYYIEKCVTC(SEQ ID NO: 232)
RTX反轉錄酶 MILDTDYITEDGKPVIRIFKKENGEFKIEYDRTFEPYLYALLKDDSAIEEVKKITAERHGTVVTVKRVEKVQKKFLGRPVEVWKLYFTHPQDVPAIMDKIREHPAVIDIYEYDIPFAIRYLIDKGLVPMEGDEELKLLAFDIETLYHEGEEFAEGPILMISYADEEGARVITWKNVDLPYVDVVSTEREMIKRFLRVVKEKDPDVLITYNGDNFDFAYLKKRCEKLGINFALGRDGSEPKIQRMGDRFAVEVKGRIHFDLYPVIRRTINLPTYTLEAVYEAVFGQPKEKVYAEEITTAWETGENLERVARYSMEDAKVTYELGKEFLPMEAQLSRLIGQSLWDVSRSSTGNLVEWFLLRKAYERNELAPNKPDEKELARRHQSHEGGYIKEPERGLWENIVYLDFRSLYPSIIITHNVSPDTLNREGCKEYDVAPQVGHRFCKDFPGFIPSLLGDLLEERQKIKKRMKATIDPIERKLLDYRQRAIKILANSLYGYYGYARARWYCKECAESVIAWGREYLTMTIKEIEEKYGFKVIYSDTDGFFATIPGADAETVKKKAMEFLKYINAKLPGALELEYEGFYKRGLFVTKKKYAVIDEEGKITTRGLEIVRRDWSEIAKETQARVLEALLKDGDVEKAVRIVKEVTEKLSKYEVPPEKLVIHKQITRDLKDYKATGPHVAVAKRLAARGVKIRPGTVISYIVLKGSGRIVDRAIPFDEFDPTKHKYDAEYYIEKQVLPAVERILRAFGYRKEDLRYQKTRQVGLSARLKPKGT(SEQ ID NO: 233)
RTX-exoMinus MILDTDYITEDGKPVIRIFKKENGEFKIEYDRTFEPYLYALLKDDSAIEEVKKITAERHGTVVTVKRVEKVQKKFLGRPVEVWKLYFTHPQDVPAIMDKIREHPAVIDIYEYDIPFAIRYLIDKGLVPMEGDEELKLLAFDIETLYHEGEEFAEGPILMISYADEEGARVITWKNVDLPYVDVVSTEREMIKRFLRVVKEKDPDVLITYDGDNFDFAYLKKRCEKLGINFALGRDGSEPKIQRMGDRFAVEVKGRIHFDLYPVIRRTINLPTYTLEAVYEAVFGQPKEKVYAEEITTAWETGENLERVARYSMEDAKVTYELGKEFLPMEAQLSRLIGQSLWDVSRSSTGNLVEWFLLRKAYERNELAPNKPDEKELARRHQSHEGGYIKEPERGLWENIVYLDFRSLYPSIIITHNVSPDTLNREGCKEYDVAPQVGHRFCKDFPGFIPSLLGDLLEERQKIKKRMKATIDPIERKLLDYRQRAIKILANSLYGYYGYARARWYCKECAESVIAWGREYLTMTIKEIEEKYGFKVIYSDTDGFFATIPGADAETVKKKAMEFLKYINAKLPGALELEYEGFYKRGLFVTKKKYAVIDEEGKITTRGLEIVRRDWSEIAKETQARVLEALLKDGDVEKAVRIVKEVTEKLSKYEVPPEKLVIHKQITRDLKDYKATGPHVAVAKRLAARGVKIRPGTVISYIVLKGSGRIVDRAIPFDEFDPTKHKYDAEYYIEKQVLPAVERILRAFGYRKEDLRYQKTRQVGLSARLKPKGT(SEQ ID NO: 234)
B11 RT MILDTDYITEDGKPVIRIFKKENGEFKIEYDRTFEPYLYALLKDDSAIEEVKKITAERHSTVVTVKRVEKVQKKFLGRSVEVWKLYFTHPQDVPAIMDKIREHPAVIDIYEYDIPFAIRYLIDKGLVPMEGDEELKLLALDIGTPCHEGEVFAEGPILMISYADEEGTRVITWRNVDLPYVDVLSTEREMIQRFLRVVKEKDPDVLITYNGDNFDFAYLKKRCEKLGINFTLGREGSEPKIQRMGDRFAVEVKGRIHFDLYPVIRRTVNLPIYTLEAVYEAVFGQPKEKVYAEEITTAWETGENLERVARYSMEDAKVTYELGKEFMPMEAQLSRLIGQSLWDVSRSSTGNLVEWFLLRKAYERNELAPNKPDEKELARRHQSHEGGYIKEPERGLWENIVYLDFRSLYPSIIITHNVSPDTLNREGCKEYDVAPQVGHRFCKDFPGFIPSLLGDLLEERQKIKKRMKATIDPIERKLLDYRQRAIKILANSLYGYYGYARARWYCKECAESVIAWGREYITMTIKEIEEKYGFKLIYSDTDGFFATIPGAEAETVKKKAMEFLKYINAKLPGALELEYEGFYKRGLFVTKKKYAVIDEEGKITTRGLEIVRRDWSEIAKETQARVLEALLKDGDVEKAVRIVKEVTEKLSKYEVPPEKLVIHKQITRDLKDYKATGPHVAVAKRLAARGVKIRPGTVISYIVLKGSGRIVDRAIPFDEFDPTKHKYDAEYYIENQVLPAVERILRAYGYRKEDLWYQKTRQVGLSARLKPKGT(SEQ ID NO: 235)
RT CaMV MDHLLLKTQTQTEQVMNVTNPNSIYIKGRLYFKGYKKIELHCFVDTGASLCIASKFVIPEEHWVNAERPIMVKIADGSSITISKVCKDIDLIIAGEIFRIPTVYQQESGIDFIIGNNFCQLYEPFIQFTDRVIFTKNKSYPVHIAKLTRAVRVGTEGFLESMKKRSKTQQPEPVNISTNKIENPLEEIAILSEGRRLSEEKLFITQQRMQKIEELLEKVCSENPLDPNKTKQWMKASIKLSDPSKAIKVKPMKYSPMDREEFDKQIKELLDLKVIKPSKSPHMAPAFLVNNEAEKRRGKKRMVVNYKAMNKATVGDAYNLPNKDELLTLIRGKKIFSSFDCKSGFWQVLLDQESRPLTAFTCPQGHYEWNVVPFGLKQAPSIFQRHMDEAFRVFRKFCCVYVDDILVFSNNEEDHLLHVAMILQKCNQHGIILSKKKAQLFKKKINFLGLEIDEGTHKPQGHILEHINKFPDTLEDKKQLQRFLGILTYASDYIPKLAQIRKPLQAKLKENVPWRWTKEDTLYMQKVKKNLQGFPPLHHPLPEEKLIIETDASDDYWGGMLKAIKINEGTNTELICRYASGSFKAAEKNYHSNDKETLAVINTIKKFSIYLTPVHFLIRTDNTHFKSFVNLNYKGDSKLGRNIRWQAWLSHYSFDVEHIKGTDNHFADFLSREFNKVNSSGGS(SEQ ID NO: 236)
RT反轉錄子 MGIHGVPAAMKSAEYLNTFRLRNLGLPVMNNLHDMSKATRISVETLRLLIYTADFRYRIYTVEKKGPEKRMRTIYQPSRELKALQGWVLRNILDKLSSSPFSIGFEKHQSILNNATPHIGANFILNIDLEDFFPSLTANKVFGVFHSLGYNRLISSVLTKICCYKNLLPQGAPSSPKLANLICSKLDYRIQGYAGSRGLIYTRYADDLTLSAQSMKKVVKARDFLFSIIPSEGLVINSKKTCISGPRSQRKVTGLVISQEKVGIGREKYKEIRAKIHHIFCGKSSEIEHVRGWLSFILSVDSKSHRRLITYISKLEKKYGKNPLNKAKT(SEQ ID NO: 237)
HIV2 MEKEGQLEEAPPTNPYNTPTFAIKKKDKNKWRMLIDFRELNKVTQDFTEIQLGIPHPAGLAKKRRITVLDVGDAYFSIPLHEDFRPYTAFTLPSVNNAEPGKRYIYKVLPQGWKGSPAIFQHTMRQVLEPFRKANKDVIIIQYMDDILIASDRTDLEHDRVVLQLKELLNGLGFSTPDEKFQKDPPIHWMGYELWPTKWKLQKIQLPQKEIWTVNDIQKLVGVLNWAAQLYPGIK(SEQ ID NO: 238)
HIV1 MEEEGKISKIGPENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRKYTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRIKNPEIVIYQYMDDLYVGSDLEIGQHRTKIEELRAHLLSWGFTTPDKKHQKEPPFLWMGYELHPDRWTVQPIDLPEKDSWTVNDIQKLVGKLNWASQIYAGIK(SEQ ID NO: 239)
HIV-1 RT p51 MPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDEDFRKYTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLRWGLTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYPGIKVRQLCKLLRGTKALTEVIPLTEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTEAVQKITTESIVIWGKTPKFKLPIQKETWETWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETF(SEQ ID NO: 240)
缺乏RNA酶H結構域的MMLV RT STLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLP(SEQ ID NO: 224)
在一些實施方式中,反轉錄酶多肽與本文所述之任一實施方式中的CRISPR核酸酶融合。在一些實施方式中,反轉錄酶多肽包含N-末端CRISPR核酸酶。在一些實施方式中,反轉錄酶多肽包含C-末端CRISPR核酸酶。在一些實施方式中,反轉錄酶多肽在反轉錄酶多肽內的分子內位置處包含CRISPR核酸酶(例如,CRISPR核酸酶在反轉錄酶多肽的環內)。
在一些實施方式中,反轉錄酶多肽包含二聚化結構域。在一些實施方式中,二聚化結構域係白胺酸拉鍊、奈米抗體或抗體。在一些實施方式中,二聚化結構域募集CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)。
在一些實施方式中,反轉錄酶多肽係「易錯」反轉錄酶變體。可以使用本領域已知和/或可獲得的易錯反轉錄酶。應當理解,反轉錄酶天然不具有任何校對功能;因此,反轉錄酶的錯誤率通常高於具有校對活性的DNA聚合酶。在一些實施方式中,如果反轉錄酶在合成的約15,000個核苷酸中具有小於一個錯誤的錯誤率,則認為該反轉錄酶係「易錯」的。
在一些實施方式中,反轉錄酶多肽在RNA酶H結構域中具有一或多個突變。在一些實施方式中,反轉錄酶多肽不包含RNA酶H結構域(例如,RNA酶H結構域已從反轉錄酶多肽中去除)。在一些實施方式中,RNA酶H結構域在反轉錄酶多肽中被截短。在一些實施方式中,反轉錄酶多肽在RNA依賴性DNA聚合酶結構域中具有一或多個突變。在一些實施方式中,反轉錄酶多肽係具有改變的熱穩定性特徵的變體。反轉錄酶耐受高溫的能力係cDNA合成的重要方面。升高的反應溫度有助於使具有強二級結構和/或高GC含量的RNA變性,從而允許反轉錄酶讀通整個序列。因此,在較高溫度下進行反轉錄能夠實現全長cDNA合成和更高的產量。野生型M-MLV反轉錄酶的最佳溫度典型地在37°C-48°C的範圍內;然而,可能會引入在超過48°C的更高溫度下允許反轉錄活性的突變,更高的溫度包括49°C、50°C、51°C、52°C、53°C、54°C、55°C、56°C、57°C、58°C、59°C、60°C、61°C、62°C、63°C、64°C、65°C、66°C或更高。
本文使用的變體反轉錄酶多肽可以與任何參考反轉錄酶多肽(包括任何野生型反轉錄酶、突變反轉錄酶或反轉錄酶的片段,或本文揭露或預期的或本領域已知的其他反轉錄酶變體)具有至少約20%同一性、至少約25%同一性、至少約30%同一性、至少約35%同一性、至少約40%同一性、至少約45%同一性、至少約50%同一性、至少約55%同一性、至少約60%同一性、至少約65%同一性、至少約70%同一性、至少約75%同一性、至少約80%同一性、至少約85%同一性、至少約90%同一性、至少約95%同一性、至少約96%同一性、至少約97%同一性、至少約98%同一性、至少約99%同一性、至少約99.5%同一性或至少約99.9%同一性。在一些實施方式中,與參考反轉錄酶相比,反轉錄酶變體可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或多達100或多達200或多達300或多達400或多達500或更多個胺基酸變化。在一些實施方式中,反轉錄酶變體包含參考反轉錄酶的片段,使得該片段與該參考反轉錄酶的相應片段具有至少約20%同一性、至少約25%同一性、至少約30%同一性、至少約35%同一性、至少約40%同一性、至少約45%同一性、至少約50%同一性、至少約55%同一性、至少約60%同一性、至少約65%同一性、至少約70%同一性、至少約75%同一性、至少約80%同一性、至少約85%同一性、至少約90%同一性、至少約95%同一性、至少約96%同一性、至少約97%同一性、至少約98%同一性、至少約99%同一性、至少約99.5%同一性或至少約99.9%同一性。
變體反轉錄酶(包括易錯反轉錄酶、熱穩定反轉錄酶和具有增加的持續合成能力的反轉錄酶)可以藉由各種常規策略(包括誘變或進化過程)進行工程改造。在一些情況下,可以藉由引入單個突變來產生變體。在其他情況下,變體可能需要多於一個突變。對於包含多於一個突變的那些突變體,可以藉由定點誘變將鑒定的突變引入野生型基因來評估給定突變的作用,該給定突變與特定突變體攜帶的其他突變分離。然後,如此產生的單個突變體的篩選測定將允許確定該單獨突變的作用。
在一些實施方式中,反轉錄酶多肽包含或融合至結構域以提高該反轉錄酶的延伸率和/或效率。在一些實施方式中,反轉錄酶多肽融合至Sso7d多肽,例如來自硫磺礦硫化葉菌( Sulfolobus solfataricus)的Sso7d多肽。參見例如,Wang等人, Nucleic Acids Res.[核酸研究] 32(3): 1197-207 (2004)。
在一些實施方式中,如本文其他地方所述之CRISPR核酸酶-反轉錄酶融合多肽能夠結合並結合至編輯模板RNA中的至少一個核酸酶結合序列。在一些實施方式中,CRISPR核酸酶-反轉錄酶融合多肽能夠結合並通過編輯模板RNA中的至少一個DNA結合序列結合至靶序列。在此類實施方式中,通過經由核酸酶結合序列和編輯模板RNA的DNA結合序列結合CRISPR核酸酶,CRISPR核酸酶-反轉錄酶融合多肽募集至靶序列或使其靠近靶序列。
在一些實施方式中,反轉錄酶將反轉錄模板序列從PBS的5’末端開始轉錄成靶核酸的非PAM股。在一些實施方式中,反轉錄酶將反轉錄模板序列從PBS的3’末端開始轉錄成靶核酸的非PAM股。在一些實施方式中,反轉錄酶將反轉錄模板序列從PBS的5’末端開始轉錄成靶核酸的PAM股。在一些實施方式中,反轉錄酶將反轉錄模板序列從PBS的3’末端開始轉錄成靶核酸的PAM股。在一些實施方式中,在PBS與靶核酸的非PAM股結合後,反轉錄酶從非PAM股的游離3’末端轉錄反轉錄模板序列。在一些實施方式中,在PBS與靶核酸的PAM股雜交後,反轉錄酶從PAM股的游離3’末端轉錄反轉錄模板序列。
在一些實施方式中,如本文所述之任一實施方式中的反轉錄酶與連接酶、整合酶和/或重組酶相互作用。在一些實施方式中,將如本文所述之任一實施方式中的反轉錄酶與連接酶、整合酶和/或重組酶融合。在一些實施方式中,將連接酶、整合酶和/或重組酶與反轉錄酶的N-末端或C-末端融合。在一些實施方式中,將連接酶、整合酶和/或重組酶在反轉錄酶的內部融合。在一些實施方式中,整合酶係絲胺酸整合酶。在一些實施方式中,整合酶係Bxb1、TP901或PhiBT1整合酶。在一些實施方式中,重組酶係絲胺酸重組酶或酪胺酸重組酶。在一些實施方式中,重組酶係CRE重組酶。在一些實施方式中,與連接酶、整合酶和/或重組酶相互作用或融合的反轉錄酶進一步與CRISPR核酸酶相互作用或融合。 C. 基因編輯 RNA 分子
本文揭露的任一基因編輯系統可以包含一或多個編輯模板RNA(基因編輯RNA),該一或多個編輯模板RNA包含RNA指導物和RNA反轉錄酶(RT)供體(RT供體RNA)。該一或多個編輯模板RNA有助於編輯靶核酸中的序列,例如所希望的基因組位點。在一些實施方式中,編輯模板RNA可為包含RNA指導物(例如,包含核酸酶結合序列和DNA結合序列)和RT供體RNA兩者的單個RNA分子。在其他實施方式中,編輯模板RNA包含RNA指導物和RT供體RNA作為單獨的RNA分子。
在一些實施方式中,編輯模板RNA或其任何部分在載體中編碼。在一些實施方式中,載體包含Pol II啟動子或Pol III啟動子。 i.RNA 指導物
在本文揭露的任一基因編輯系統中,編輯模板RNA包含RNA指導物,該RNA指導物經由也包含在基因編輯系統中的CRISPR核酸酶介導靶核酸的切割。RNA指導物(或gRNA)包含核酸酶結合序列和DNA結合序列(間隔子)。核酸酶結合序列可以包含一或多個可以被CRISPR核酸酶識別用於結合的結合位點。在一些情況下,gRNA係包含核酸酶結合序列和間隔子序列兩者的單個RNA分子。可替代地,gRNA可以包含核酸酶結合序列和間隔子作為兩種單獨的RNA分子。
在一些實施方式中,RNA指導物在RNA指導物的5’末端、在RNA指導物的3’末端或在RNA指導物內的分子內位置處包含RNA延伸。在各個實施方式中,RNA延伸的長度為至少5個核苷酸、至少6個核苷酸、至少7個核苷酸、至少8個核苷酸、至少9個核苷酸、至少10個核苷酸、至少11個核苷酸、至少12個核苷酸、至少13個核苷酸、至少14個核苷酸、至少15個核苷酸、至少16個核苷酸、至少17個核苷酸、至少18個核苷酸、至少19個核苷酸、至少20個核苷酸、至少21個核苷酸、至少22個核苷酸、至少23個核苷酸、至少24個核苷酸、至少25個核苷酸、至少26個核苷酸、至少27個核苷酸、至少28個核苷酸、至少29個核苷酸、至少30個核苷酸、至少31個核苷酸、至少32個核苷酸、至少33個核苷酸、至少34個核苷酸、至少35個核苷酸、至少36個核苷酸、至少37個核苷酸、至少38個核苷酸、至少39個核苷酸、至少40個核苷酸、至少41個核苷酸、至少42個核苷酸、至少43個核苷酸、至少44個核苷酸、至少45個核苷酸、至少46個核苷酸、至少47個核苷酸、至少48個核苷酸、至少49個核苷酸或至少50個核苷酸。在一些實施方式中,RNA延伸係反轉錄供體RNA(「RT供體RNA」)(例如,RNA指導物與RT供體RNA融合)。在一些實施方式中,RT供體RNA包含如本文所述之引物結合位點(PBS)和反轉錄模板序列。 核酸酶結合序列
在一些實施方式中,如本文所述之組成物包含核酸酶結合序列。在一些實施方式中,核酸酶結合序列係CRISPR核酸酶結合序列(例如,核酸酶結合序列能夠結合V型核酸酶或II型核酸酶)。在一些實施方式中,核酸酶結合序列進一步是核酸結合序列(例如,DNA結合序列)。
在一些實施方式中,核酸酶結合序列包含RNA指導物。RNA指導物可以以特異性結合親和力結合本文所述之任何一種CRISPR核酸酶(例如,V型核酸酶或II型核酸酶)。在一些實施方式中,RNA指導物進一步包含對靶序列的特異性結合親和力。在一些實施方式中,本文所述之組成物包含兩個或更多個RNA指導物(例如,2、3、4、5、6、7、8、9或更多個)。在一些實施方式中,在載體中編碼核酸酶結合序列。在一些實施方式中,載體包含Pol II啟動子或Pol III啟動子。
在一些實施方式中,核酸酶結合序列包含同向重複序列。在某些實施方式中,核酸酶結合序列包括與DNA結合序列(例如,DNA靶向序列或間隔子)連接的同向重複序列。在一些實施方式中,核酸酶結合序列包括同向重複序列和DNA結合序列或同向重複-DNA結合序列-同向重複序列。在一些實施方式中,核酸酶結合序列包括截短的同向重複序列和DNA結合序列,這係經加工或成熟crRNA的典型特徵。
在一些實施方式中,核酸酶結合序列(例如,同向重複序列)能夠結合Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)多肽。在一些實施方式中,同向重複序列能夠結合Cas9多肽。
在其中核酸酶結合序列係針對可公開獲得的CRISPR核酸酶的同向重複序列的實施方式中,那些同向重複序列係本領域已知的。在一些實施方式中,能夠結合CRISPR核酸酶的同向重複序列係以下文獻中揭露的那些中的任一個:WO 2021055874、WO 2020206036、WO 2020191102、WO 2020186213、WO 2020028555、WO 2020033601、WO 2019126762、WO 2019126774、WO 2019071048、WO 2019018423、WO 2019005866、WO 2018191388、WO 2018170333、WO 2018035388、WO 2018035387、WO 2017219027、WO 2017189308、WO 2017184768、WO 2017106657、WO 2016205749、WO 2017070605、WO 2016205764、WO 2016205711、WO 2016028682、WO 2015089473、WO 2014093595、WO 2015089427、WO 2014204725、WO 2015070083、WO 2014093655、WO 2014093694、WO 2014093712、WO 2014093635、WO 2021133829、WO 2021007177、WO 2020197934、WO 2020181102、WO 2020181101、WO 2020041456、WO 2020023529、WO 2020005980、WO 2019104058、WO 2019089820、WO 2019089808、WO 2019089804、WO 2019089796、WO 2019036185、WO 2018226855、WO 2018213351、WO 2018089664、WO 2018064371、WO 2018064352、WO 2017106569、WO 2017048969、WO 2016196655、WO 2016106239、WO 2016036754、WO 2015103153、WO 2015089277、WO 2014150624、WO 2013176772、WO 2021119563、WO 2021118626、WO 2020247883、WO 2020247882、WO 2020223634、WO 2020142754、WO 2020086475、WO 2020028729、WO 2019241452、WO 2019173248、WO 2018236548、WO 2018183403、WO 2017027423、WO 2018106727、WO 2018071672、WO 2017096328、WO 2017070598、WO 2016201155、WO 2014150624、WO 2013098244、WO 2021113522、WO 2021050534、WO 2021046442、WO 2021041569、WO 2021007563、WO 2020252378、WO 2020180699、WO 2020018142、WO 2019222555、WO 2019178428、WO 2019178427或WO 2019006471,出於本文引用的主題和目的,將該等文獻的相關揭露藉由引用併入。
在其中CRISPR核酸酶係Cas12i多肽的一些實施方式中,同向重複序列與SEQ ID NO: 12-24中任一項包含至少90%同一性。在其中CRISPR核酸酶係Cas12i多肽的一些實施方式中,同向重複序列與SEQ ID NO: 12-24中任一項包含至少95%同一性。在其中CRISPR核酸酶係Cas12i多肽的一些實施方式中,同向重複序列包含SEQ ID NO: 12-24中的任一項。在一些實施方式中,同向重複序列包含SEQ ID NO: 12-24中任一項的一部分。 [ 3] . 同向重複序列 .
序列識別字 同向重複序列 Cas12i 描述
SEQ ID NO: 12 GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC Cas12i1(本申請之SEQ ID NO: 8)
SEQ ID NO: 13 AAUUUUUGUGCCCAUCGUUGGCAC Cas12i1(本申請之SEQ ID NO: 8)
SEQ ID NO: 14 AUUUUUGUGCCCAUCGUUGGCAC Cas12i1(本申請之SEQ ID NO: 8)
SEQ ID NO: 15 GUUGCAAAACCCAAGAAAUCCGUCUUUCAUUGACGG Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7)
SEQ ID NO: 16 GCAACACCUAAGAAAUCCGUCUUUCAUUGACGGG Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7)
SEQ ID NO: 17 AGAAAUCCGUCUUUCAUUGACGG Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7)
SEQ ID NO: 18 CUAGCAAUGACCUAAUAGUGUGUCCUUAGUUGACAU Cas12i3(美國專利案號10,808,245之SEQ ID NO: 14或本申請之SEQ ID NO: 11)
SEQ ID NO: 19 CCUACAAUACCUAAGAAAUCCGUCCUAAGUUGACGG Cas12i3(美國專利案號10,808,245之SEQ ID NO: 14或本申請之SEQ ID NO: 11)
SEQ ID NO: 20 AUAGUGUGUCCUUAGUUGACAU Cas12i3(美國專利案號10,808,245之SEQ ID NO: 14或本申請之SEQ ID NO: 11)
SEQ ID NO: 21 GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC Cas12i4(美國專利案號10,808,245之SEQ ID NO: 16,本申請之SEQ ID NO: 9或10)
SEQ ID NO: 22 CCCACAAUACCUGAGAAAUCCGUCCUACGUUGACGG Cas12i4(美國專利案號10,808,245之SEQ ID NO: 16,本申請之SEQ ID NO: 9或10)
SEQ ID NO: 23 UCUCAACGAUAGUCAGACAUGUGUCCUCAGUGACAC Cas12i4(美國專利案號10,808,245之SEQ ID NO: 16,本申請之SEQ ID NO: 9或10)
SEQ ID NO: 24 AGACAUGUGUCCUCAGUGACAC Cas12i4(美國專利案號10,808,245之SEQ ID NO: 16,本申請之SEQ ID NO: 9或10)
SEQ ID NO: 241 AAUAGCGGCCCUAAGAAAUCCGUCUUUCAUUGACGG Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7)
SEQ ID NO: 242 AUUGGAACUGGCGAGAAAUCCGUCUUUCAUUGACGG Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7)
SEQ ID NO: 243 CCAGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7)
SEQ ID NO: 244 CGGCGCUCGAAUAGGAAAUCCGUCUUUCAUUGACGG Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7)
SEQ ID NO: 245 GUGGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7)
SEQ ID NO: 246 GUUGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7)
SEQ ID NO: 247 GUUGCAAUGCCUAAGAAAUCCGUCUUUCAUUGACGG Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7)
其他CRISPR核酸酶(如其他V型CRISPR核酸酶)的核酸酶結合序列係本領域已知的和/或者在下 4-6中提供。 DNA結合序列
RNA指導物也可以包含DNA結合序列。在一些實施方式中,DNA結合序列係DNA靶向序列(例如,間隔子)。間隔子的長度可以為從約7個核苷酸至約100個核苷酸。例如,間隔子的長度可以為從約7個核苷酸至約80個核苷酸、從約7個核苷酸至約50個核苷酸、從約7個核苷酸至約40個核苷酸、從約7個核苷酸至約30個核苷酸、從約7個核苷酸至約25個核苷酸、從約7個核苷酸至約20個核苷酸或從約7個核苷酸至約19個核苷酸。例如,間隔子的長度可以為從約7個核苷酸至約20個核苷酸、從約7個核苷酸至約25個核苷酸、從約7個核苷酸至約30個核苷酸、從約7個核苷酸至約35個核苷酸、從約7個核苷酸至約40個核苷酸、從約7個核苷酸至約45個核苷酸、從約7個核苷酸至約50個核苷酸、從約7個核苷酸至約60個核苷酸、從約7個核苷酸至約70個核苷酸、從約7個核苷酸至約80個核苷酸、從約7個核苷酸至約90個核苷酸、從約7個核苷酸至約100個核苷酸、從約10個核苷酸至約25個核苷酸、從約10個核苷酸至約30個核苷酸、從約10個核苷酸至約35個核苷酸、從約10個核苷酸至約40個核苷酸、從約10個核苷酸至約45個核苷酸、從約10個核苷酸至約50個核苷酸、從約10個核苷酸至約60個核苷酸、從約10個核苷酸至約70個核苷酸、從約10個核苷酸至約80個核苷酸、從約10個核苷酸至約90個核苷酸或從約10個核苷酸至約100個核苷酸。
在一些實施方式中,通常將RNA指導物中的間隔子設計為長度係7和50個核苷酸之間或15和35個核苷酸之間(例如,7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個核苷酸)並且與特定靶序列互補。在一些實施方式中,可以設計RNA指導物的長度為18-22個核苷酸。
在一些實施方式中,DNA結合序列與如本文所述之靶序列具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列同一性,並能夠經由鹼基配對與靶序列的互補區結合。
在一些實施方式中,DNA結合序列僅包含RNA鹼基。在一些實施方式中,DNA結合序列包含DNA鹼基(例如,間隔子包含至少一個胸腺嘧啶)。在一些實施方式中,DNA結合序列包含RNA鹼基和DNA鹼基(例如,DNA結合序列包含至少一個胸腺嘧啶和至少一個尿嘧啶)。
在一些情況下,本文揭露的RNA指導物可以進一步包含連接子序列、5’末端和/或3’末端保護片段(參見本文揭露內容)或其組合。
本文揭露的任一RNA指導物中的間隔子可以對靶序列具有特異性,即,能夠經由鹼基配對與靶序列的互補區結合。在一些情況下,靶序列可能在目的基因組位點內,例如,在需要基因編輯的地方。
在一些實施方式中,靶序列與PAM序列相鄰。PAM序列係本領域已知的。在一些實施方式中,能夠被CRISPR核酸酶識別的PAM序列揭露於WO 2021055874、WO 2020206036、WO 2020191102、WO 2020186213、WO 2020028555、WO 2020033601、WO 2019126762、WO 2019126774、WO 2019071048、WO 2019018423、WO 2019005866、WO 2018191388、WO 2018170333、WO 2018035388、WO 2018035387、WO 2017219027、WO 2017189308、WO 2017184768、WO 2017106657、WO 2016205749、WO 2017070605、WO 2016205764、WO 2016205711、WO 2016028682、WO 2015089473、WO 2014093595、WO 2015089427、WO 2014204725、WO 2015070083、WO 2014093655、WO 2014093694、WO 2014093712、WO 2014093635、WO 2021133829、WO 2021007177、WO 2020197934、WO 2020181102、WO 2020181101、WO 2020041456、WO 2020023529、WO 2020005980、WO 2019104058、WO 2019089820、WO 2019089808、WO 2019089804、WO 2019089796、WO 2019036185、WO 2018226855、WO 2018213351、WO 2018089664、WO 2018064371、WO 2018064352、WO 2017106569、WO 2017048969、WO 2016196655、WO 2016106239、WO 2016036754、WO 2015103153、WO 2015089277、WO 2014150624、WO 2013176772、WO 2021119563、WO 2021118626、WO 2020247883、WO 2020247882、WO 2020223634、WO 2020142754、WO 2020086475、WO 2020028729、WO 2019241452、WO 2019173248、WO 2018236548、WO 2018183403、WO 2017027423、WO 2018106727、WO 2018071672、WO 2017096328、WO 2017070598、WO 2016201155、WO 2014150624、WO 2013098244、WO 2021113522、WO 2021050534、WO 2021046442、WO 2021041569、WO 2021007563、WO 2020252378、WO 2020180699、WO 2020018142、WO 2019222555、WO 2019178428、WO 2019178427或WO 2019006471,出於本文引用的主題和目的,將每篇文獻中的相關揭露內容併入。
當基因編輯系統包含Cas12i多肽時,PAM序列包含5’-NTTN-3’(或5’-TTN-3’),其中N係任何核苷酸(例如,A、G、T或C)。PAM序列位於靶序列的上游。與其他CRISPR核酸酶相關聯的PAM序列可以包含序列5’-TTY-3’或5’-TTB-3’,其中Y係C或T,並且B係G、T或C。PAM序列可以緊鄰靶序列,或例如在靶序列的少量(例如,1、2、3、4或5個)核苷酸內。
4-6提供了示例性V型CRISPR核酸酶及其相應的核酸酶結合序列和如本領域已知的PAM序列。該等序列允許熟悉該項技術者用另一種V型CRISPR核酸酶設計如本文所述之編輯模板RNA。 [ 4] . 示例性 V CRISPR 核酸酶的 PAM 序列
亞型 蛋白質名稱 通常關聯的 PAM* Tracr 要求 參考 a
A Cas12a(Cpf1) (T)TTV Zetsche等人, Cell [細胞], 163:759-771; 2015
B Cas12b TTN Shmakov等人, Mol. Cell [分子細胞] 60, 385-397; 2015
C Cas12c TG或TN Yan等人, Science [科學] 363, 88-91; 2019; Harrington等人, Mol. Cell [分子細胞] 79, 416-424 e415; 2020
D Cas12d TA或TG Chen L. X.等人, Front. Microbiol. [微生物學前沿] 10:928; 2019; Harrington等人, 2020
E Cas12e TTCN Liu J. J.等人, Nature [自然] 566, 218-223; 2019
F Cas14(Cas12f) -- 是(Cas14a) 否(Cas14b和Cas14c) Harrington等人, Science [科學] 362, 839-842; 2018
G Cas12g na Yan等人, Science [科學] 363, 88-91; 2019; PCT/US 2019/022376
H Cas12h RTR Yan等人, 2019; PCT/US 2020/063125
I Cas12i TTN Yan等人, 2019; PCT/US 2021/025257
CRISPR-Casɸ Cas12j TBN Pausch等人 Science [科學] 369, 333-337; 2020
a:出於本文引用的主題和目的,將該等引用文獻的相關揭露藉由引用併入。 *:V代表A、C或G;R代表A或G;B代表C、G或T;(T)視需要的;na代表沒有PAM [ 5] .Cas12 家族蛋白的同向重複序列
Cpf1 蛋白 SEQ ID NO: 同向重複
FnCpf1 93 UAAUUUCUACUGUUGUAGAU
Lb3Cpf1 94 AGAAAUGCAUGGUUCUCAUGC
BpCpf1 101 AAAAUUACCUAGUAAUUAGGU
PeCpf1 102 GGAUUUCUACUUUUGUAGAU
PbCpf1 103 AAAUUUCUACUUUUGUAGAU
SsCpf1 104 CGCGCCCACGCGGGGCGCGAC
AsCpf1 105 UAAUUUCUACUCUUGUAGAU
Lb2Cpf1 106 GAAUUUCUACUAUUGUAGAU
CMtCpf1 107 GAAUCUCUACUCUUUGUAGAU
EeCpf1 108 UAAUUUCUACUUUGUAGAU
MbCpf1 109 AAAUUUCUACUGUUUGUAGAU
LiCpf1 111 GAAUUUCUACUUUUGUAGAU
LbCpf1 113 UAAUUUCUACUAAGUGUAGAU
PcCpf1 115 UAAUUUCUACUAUUGUAGAU
PdCpf1 117 UAAUUUCUACUUCGGUAGAU
PmCpf1 119 UAAUUUCUACUAUUGUAGAU
還參見Zetsche等人, Cell [細胞] 163:759-771 (2015),出於本文引用的主題和目的,將該文獻的相關揭露藉由引用併入。
下表6提供了如本領域已知的另外的V型CRISPR核酸酶的資訊。 [ 6] . 另外的 V CRISPR 核酸酶
亞型 蛋白質名稱 參考 a
B Cas12b Shmakov等人, 2015
C Cas12c Yan等人, 2019; Harrington等人, 2020
D Cas12d Harrington等人, 2020
E Cas12e Liu J. J. 等人, 2019
F Cas14(cas12f) Harrington等人, 2018
a:出於本文引用的主題和目的,將該等引用文獻的相關揭露藉由引用併入。 ii.RNA 反轉錄酶供體或 RT 供體 RNA
本文揭露的任一基因編輯系統中的編輯模板RNA還可以包含RNA反轉錄酶(RT)供體(RT供體RNA)。RT供體RNA可以包含:(i) 引物結合位點(PBS),和 (ii) 反轉錄模板序列。在一些情況下,RT供體RNA可以進一步包含:(iii) 核苷酸連接子序列,(iv) 5’末端和/或3’末端保護片段(參見本文揭露內容)或其組合。在一些實施方式中,編輯模板RNA包含一或多個RT供體RNA。在一些實施方式中,編輯模板RNA包含一或多個PBS、一或多個反轉錄模板序列、和/或一或多個核苷酸連接子序列。在一些實施方式中,第一編輯模板RNA包含一或多個PBS,並且第二編輯模板RNA包含一或多個反轉錄模板序列。
在一些實施方式中,RT供體RNA包含適配體。在一些實施方式中,適配體募集反轉錄酶多肽。 引物結合位點(PBS)
在一些實施方式中,如本文揭露的RT供體RNA中的PBS係能夠經由鹼基配對與DNA股結合的RNA序列。DNA股已經或可以被CRISPR核酸酶產生切口或切割。在一些實施方式中,PBS包含能夠經由鹼基配對與DNA股(PBS靶向位點)結合的RNA序列。DNA股可以具有游離的3’游離末端,或者可以經由同一基因編輯系統中包含的CRISPR核酸酶的切割產生3’游離末端。在一些實例中,PBS靶向位點可以位於與PAM序列相同的DNA股(PAM股)上。在一些實例中,PBS靶向位點可以位於PAM股的互補股(非PAM股)上。
在一些實施方式中,PBS的長度為至少3個核苷酸、至少4個核苷酸、至少5個核苷酸、至少6個核苷酸、至少7個核苷酸、至少8個核苷酸、至少9個核苷酸、至少10個核苷酸、至少11個核苷酸、至少12個核苷酸、至少13個核苷酸、至少14個核苷酸、至少15個核苷酸、至少16個核苷酸、至少17個核苷酸、至少18個核苷酸、至少19個核苷酸、至少20個核苷酸、至少30個核苷酸、至少40個核苷酸、至少50個核苷酸、至少60個核苷酸、至少70個核苷酸、至少80個核苷酸、至少90個核苷酸、至少100個核苷酸、至少200個核苷酸、至少300個核苷酸、至少400個核苷酸或至少500個核苷酸。在一些實施方式中,PBS的長度為約3個核苷酸至約200個核苷酸(例如,約3個核苷酸、5個核苷酸、8個核苷酸、10個核苷酸、13個核苷酸、15個核苷酸、20個核苷酸、30個核苷酸、40個核苷酸、50個核苷酸、60個核苷酸、70個核苷酸、80個核苷酸、90個核苷酸、100個核苷酸、110個核苷酸、120個核苷酸、130個核苷酸、140個核苷酸、150個核苷酸、160個核苷酸、170個核苷酸、180個核苷酸、190個核苷酸、200個核苷酸或之間的任何長度)。在一些實施方式中,PBS的長度為約3個核苷酸至約100個核苷酸(例如,約3個核苷酸、5個核苷酸、8個核苷酸、10個核苷酸、13個核苷酸、15個核苷酸、20個核苷酸、30個核苷酸、40個核苷酸、50個核苷酸、60個核苷酸、70個核苷酸、80個核苷酸、90個核苷酸或100個核苷酸或之間的任何長度)。
在一些實施方式中,PBS的長度為約10個核苷酸至約50個核苷酸。在一些實施方式中,PBS的長度為約10個核苷酸至約40個核苷酸。在一些實施方式中,PBS的長度為約10個核苷酸至約30個核苷酸。在一些實施方式中,PBS的長度為約10個核苷酸至約20個核苷酸。在一些實施方式中,PBS的長度為約10個核苷酸至約15個核苷酸。在一些實施方式中,PBS的長度為約11個核苷酸。在一些實施方式中,PBS的長度為約12個核苷酸。在一些實施方式中,PBS的長度為約13個核苷酸。在一些實施方式中,PBS的長度為約14個核苷酸。在一些實施方式中,PBS的長度為約30個核苷酸。
在包含Cas12i多肽(例如,如本文所揭露的那些Cas12i2多肽)的基因編輯系統中,RT供體RNA中的PBS可以與非PAM股上的區域(PBS靶向位點)結合。在一些情況下,PBS靶向位點可以位於靶序列互補區的上游。例如,PBS靶向位點可為互補區上游的多達20個核苷酸,例如,多達15個核苷酸、多達10個核苷酸或多達5個核苷酸。在特定實例中,PBS靶向位點可為互補區上游的約3個核苷酸至約10個核苷酸。在特定實例中,PBS靶向位點可為互補區上游的1個核苷酸、1-2個核苷酸、1-3個核苷酸、1-4個核苷酸、1-5個核苷酸、1-6個核苷酸、1-7個核苷酸、1-8個核苷酸、1-9個核苷酸、1-10個核苷酸、2-3個核苷酸、2-4個核苷酸、2-5個核苷酸、2-6個核苷酸、2-7個核苷酸、2-8個核苷酸、2-9個核苷酸、2-10個核苷酸、3-4個核苷酸、3-5個核苷酸、3-6個核苷酸、3-7個核苷酸、3-8個核苷酸、3-9個核苷酸、3-10個核苷酸、4-5個核苷酸、4-6個核苷酸、4-7個核苷酸、4-8個核苷酸、4-9個核苷酸、4-10個核苷酸、5-6個核苷酸、5-7個核苷酸、5-8個核苷酸、5-9個核苷酸、5-10個核苷酸、6-7個核苷酸、6-8個核苷酸、6-9個核苷酸、6-10個核苷酸、7-8個核苷酸、7-9個核苷酸、7-10個核苷酸、8-9個核苷酸、8-10個核苷酸、9-10個核苷酸或10個核苷酸。在其他情況下,PBS靶向位點可以與互補區重疊。當基因編輯系統中的Cas12i多肽在靶序列和互補區內或附近產生游離的3’末端時,在互補區上游或與其重疊的位點與非PAM股結合的PBS可以有效地促進基因編輯系統中RT多肽進行DNA合成,該合成從非PAM股中產生的游離3’末端開始。 12A 12B中提供了示例性說明。 反轉錄模板序列
反轉錄模板序列(模板序列)作為由本文所揭露的基因編輯系統中的RT多肽介導的反轉錄模板。在一些實施方式中,反轉錄模板序列包含具有至少一個經編碼的編輯的序列。在一些實施方式中,反轉錄模板序列包含與靶序列或其具有至少一個經編碼的編輯的互補區的序列同源性。在一些實施方式中,反轉錄模板序列的長度為至少3個核苷酸、至少4個核苷酸、至少5個核苷酸、至少6個核苷酸、至少7個核苷酸、至少8個核苷酸、至少9個核苷酸、至少10個核苷酸、至少11個核苷酸、至少12個核苷酸、至少13個核苷酸、至少14個核苷酸、至少15個核苷酸、至少16個核苷酸、至少17個核苷酸、至少18個核苷酸、至少19個核苷酸、至少20個核苷酸、至少30個核苷酸、至少40個核苷酸、至少50個核苷酸、至少60個核苷酸、至少70個核苷酸、至少80個核苷酸、至少90個核苷酸、至少100個核苷酸、至少200個核苷酸、至少300個核苷酸、至少400個核苷酸或至少500個核苷酸。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸、20個核苷酸、30個核苷酸、40個核苷酸、50個核苷酸、60個核苷酸、70個核苷酸、80個核苷酸、90個核苷酸、100個核苷酸、110個核苷酸或120個核苷酸或之間的任何長度。
在一些實施方式中,反轉錄模板序列為約25個核苷酸。在一些實施方式中,反轉錄模板序列為約26個核苷酸。在一些實施方式中,反轉錄模板序列為約27個核苷酸。在一些實施方式中,反轉錄模板序列為約28個核苷酸。在一些實施方式中,反轉錄模板序列為約29個核苷酸。在一些實施方式中,反轉錄模板序列為約30個核苷酸。在一些實施方式中,反轉錄模板序列為約31個核苷酸。在一些實施方式中,反轉錄模板序列為約32個核苷酸。在一些實施方式中,反轉錄模板序列為約33個核苷酸。在一些實施方式中,反轉錄模板序列為約34個核苷酸。在一些實施方式中,反轉錄模板序列為約35個核苷酸。在一些實施方式中,反轉錄模板序列為約36個核苷酸。在一些實施方式中,反轉錄模板序列為約37個核苷酸。在一些實施方式中,反轉錄模板序列為約38個核苷酸。在一些實施方式中,反轉錄模板序列為約39個核苷酸。在一些實施方式中,反轉錄模板序列為約40個核苷酸。在一些實施方式中,反轉錄模板序列為約41個核苷酸。在一些實施方式中,反轉錄模板序列為約42個核苷酸。在一些實施方式中,反轉錄模板序列為約43個核苷酸。在一些實施方式中,反轉錄模板序列為約44個核苷酸。在一些實施方式中,反轉錄模板序列為約45個核苷酸。在一些實施方式中,反轉錄模板序列為約46個核苷酸。在一些實施方式中,反轉錄模板序列為約47個核苷酸。在一些實施方式中,反轉錄模板序列為約48個核苷酸。在一些實施方式中,反轉錄模板序列為約49個核苷酸。在一些實施方式中,反轉錄模板序列為約50個核苷酸。
在一些實施方式中,反轉錄模板序列包含相對於靶序列的至少一個經編碼的編輯。在其他實施方式中,反轉錄模板序列包含相對於靶序列互補區的至少一個經編碼的編輯。在一些實施方式中,至少一個經編碼的編輯包含至少一個取代、插入、和/或缺失。在一些實施方式中,靶序列中的編輯包含相對於靶序列的序列的取代、插入、和/或缺失。在一些實施方式中,反轉錄模板序列包含至少一個LoxP位點。
在一些實施方式中,編輯可為單或多核苷酸取代,例如G到T取代、G到A取代、G到C取代、T到G取代、T到A取代、T到C取代、C到G取代、C到T取代、C到A取代、A到T取代、A到G取代或A到C取代。在一些實施方式中,序列的變化可以進行以下鹼基對的轉化:G:C鹼基對到T:A鹼基對、G:C鹼基對到A:T鹼基對、G:C鹼基對到C:G鹼基對、T:A鹼基對到G:C鹼基對、T:A鹼基對到A:T鹼基對、T:A鹼基對到C:G鹼基對、C:G鹼基對到G:C鹼基對、C:G鹼基對到T:A鹼基對、C:G鹼基對到A:T鹼基對、A:T鹼基對到T:A鹼基對、A:T鹼基對到G:C鹼基對或A:T鹼基對到C:G鹼基對。
在一些實施方式中,單或多核苷酸取代的長度為至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400或至少500個核苷酸。在一些實施方式中,取代的長度為從1個核苷酸至約200個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸或從195個核苷酸至200個核苷酸。在一些實施方式中,取代的長度為從1個核苷酸至約300個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸、從195個核苷酸至200個核苷酸、從200個核苷酸至210個核苷酸、從210個核苷酸至220個核苷酸、從220個核苷酸至230個核苷酸、從230個核苷酸至240個核苷酸、從240個核苷酸至250個核苷酸、從250個核苷酸至260個核苷酸、從260個核苷酸至270個核苷酸、從270個核苷酸至280個核苷酸、從280個核苷酸至290個核苷酸或從290個核苷酸至300個核苷酸。在一些實施方式中,取代的長度為多達約10,000個鹼基(10 kb)。例如,在一些實施方式中,取代的長度為1個鹼基、約10個鹼基、約20個鹼基、約30個鹼基、約40個鹼基、約50個鹼基、約60個鹼基、約70個鹼基、約80個鹼基、約90個鹼基、約100個鹼基、約200個鹼基、約300個鹼基、約400個鹼基、約500個鹼基、約600個鹼基、約700個鹼基、約800個鹼基、約900個鹼基、約1 kb、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb或10 kb。
在一些實施方式中,編輯包含單或多核苷酸插入,該單或多核苷酸插入的長度為至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400或至少500個核苷酸。在一些實施方式中,單或多核苷酸插入的長度為從1個核苷酸至約200個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸或從195個核苷酸至200個核苷酸。在一些實施方式中,單或多核苷酸插入的長度為從1個核苷酸至約300個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸、從195個核苷酸至200個核苷酸、從200個核苷酸至210個核苷酸、從210個核苷酸至220個核苷酸、從220個核苷酸至230個核苷酸、從230個核苷酸至240個核苷酸、從240個核苷酸至250個核苷酸、從250個核苷酸至260個核苷酸、從260個核苷酸至270個核苷酸、從270個核苷酸至280個核苷酸、從280個核苷酸至290個核苷酸或從290個核苷酸至300個核苷酸。在一些實施方式中,單或多核苷酸插入的長度為多達約10,000個鹼基(10 kb)。例如,在一些實施方式中,插入的長度為1個鹼基、約10個鹼基、約20個鹼基、約30個鹼基、約40個鹼基、約50個鹼基、約60個鹼基、約70個鹼基、約80個鹼基、約90個鹼基、約100個鹼基、約200個鹼基、約300個鹼基、約400個鹼基、約500個鹼基、約600個鹼基、約700個鹼基、約800個鹼基、約900個鹼基、約1 kb、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb或10 kb。
在一些實施方式中,編輯包含單或多核苷酸缺失,該單或多核苷酸缺失的長度為至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400或至少500個核苷酸。在一些實施方式中,單或多核苷酸缺失的長度為從1個核苷酸至約200個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸或從195個核苷酸至200個核苷酸。在一些實施方式中,單或多核苷酸缺失的長度為從1個核苷酸至約300個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸、從195個核苷酸至200個核苷酸、從200個核苷酸至210個核苷酸、從210個核苷酸至220個核苷酸、從220個核苷酸至230個核苷酸、從230個核苷酸至240個核苷酸、從240個核苷酸至250個核苷酸、從250個核苷酸至260個核苷酸、從260個核苷酸至270個核苷酸、從270個核苷酸至280個核苷酸、從280個核苷酸至290個核苷酸或從290個核苷酸至300個核苷酸。在一些實施方式中,缺失的長度為多達約10,000個鹼基(10 kb)。例如,在一些實施方式中,缺失的長度為1個鹼基、約10個鹼基、約20個鹼基、約30個鹼基、約40個鹼基、約50個鹼基、約60個鹼基、約70個鹼基、約80個鹼基、約90個鹼基、約100個鹼基、約200個鹼基、約300個鹼基、約400個鹼基、約500個鹼基、約600個鹼基、約700個鹼基、約800個鹼基、約900個鹼基、約1 kb、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb或10 kb。
在一些實施方式中,反轉錄模板序列包含至少一個經編碼的編輯並且長度為從約5個核苷酸至約10,000個核苷酸,例如,長度為從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸、從195個核苷酸至200個核苷酸、從200個核苷酸至210個核苷酸、從210個核苷酸至220個核苷酸、從220個核苷酸至230個核苷酸、從230個核苷酸至240個核苷酸、從240個核苷酸至250個核苷酸、從250個核苷酸至260個核苷酸、從260個核苷酸至270個核苷酸、從270個核苷酸至280個核苷酸、從280個核苷酸至290個核苷酸或從290個核苷酸至300個核苷酸或約1千鹼基(kb)、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb或10 kb。
反轉錄模板序列可以藉由本文所述之基因編輯系統的反轉錄酶轉錄成DNA。在一些實施方式中,反轉錄模板序列從5’到3’轉錄成PAM股的DNA。在一些實施方式中,反轉錄模板序列從5’到3’轉錄成非PAM股的DNA。在一些實施方式中,反轉錄模板序列從5’到3’轉錄成PAM股的DNA。在一些實施方式中,反轉錄模板序列從5’到3’轉錄成非PAM股的DNA。在一些實施方式中,反轉錄模板序列係PBS的5’。在一些實施方式中,反轉錄模板序列係PBS的3’。在一些實施方式中,反轉錄模板序列通過從PBS的3’延伸轉錄成PAM股的DNA。在一些實施方式中,反轉錄模板序列通過從PBS的3’延伸轉錄成非PAM股的DNA。 iii. 另外的元件
在一些實施方式中,編輯模板RNA可以包含一或多種另外的元件。例如,編輯模板RNA或其gRNA和/或RT供體RNA可以在RNA分子的一端或兩端包含一或多個保護片段。可替代地或另外地,編輯模板RNA或其gRNA和/或RT供體RNA可以包含RNA分子內部另外的元件(例如,在編輯模板RNA中的一或多個序列之間,例如,在PBS和反轉錄模板序列之間,例如連接子)。在一些實施方式中,編輯模板RNA在該編輯模板RNA的一或多個序列之間包含另外的元件,例如像RNA指導物(核酸酶結合序列或DNA結合序列)或RT供體RNA(PBS或反轉錄模板序列)。
在一些實施方式中,編輯模板RNA在一或多個末端處包含另外的元件,例如同向重複序列。在一些實施方式中,同向重複序列可以募集CRISPR核酸酶(例如,V型核酸酶,例如變體Cas12i2多肽或變體Cas12i2-反轉錄酶融合多肽)。
在一些實施方式中,另外的元件的長度可以為至少3個核苷酸、至少4個核苷酸、至少5個核苷酸、至少6個核苷酸、至少7個核苷酸、至少8個核苷酸、至少9個核苷酸、至少10個核苷酸、至少11個核苷酸、至少12個核苷酸、至少13個核苷酸、至少14個核苷酸、至少15個核苷酸、至少16個核苷酸、至少17個核苷酸、至少18個核苷酸、至少19個核苷酸、至少20個核苷酸、至少30個核苷酸、至少40個核苷酸、至少50個核苷酸、至少60個核苷酸、至少70個核苷酸、至少80個核苷酸、至少90個核苷酸、至少100個核苷酸、至少200個核苷酸、至少300個核苷酸、至少400個核苷酸或至少500個核苷酸。
在一些實例中,編輯模板RNA可以包含視需要的核苷酸連接子。這樣視需要的核苷酸連接子序列的長度可以為至少3個核苷酸、至少4個核苷酸、至少5個核苷酸、至少6個核苷酸、至少7個核苷酸、至少8個核苷酸、至少9個核苷酸、至少10個核苷酸、至少11個核苷酸、至少12個核苷酸、至少13個核苷酸、至少14個核苷酸、至少15個核苷酸、至少16個核苷酸、至少17個核苷酸、至少18個核苷酸、至少19個核苷酸、至少20個核苷酸、至少30個核苷酸、至少40個核苷酸、至少50個核苷酸、至少60個核苷酸、至少70個核苷酸、至少80個核苷酸、至少90個核苷酸、至少100個核苷酸、至少200個核苷酸、至少300個核苷酸、至少400個核苷酸或至少500個核苷酸。在一些實施方式中,視需要的核苷酸連接子位於核酸酶結合序列、DNA結合序列、PBS和/或反轉錄模板序列中的任一個之間。
在一些實例中,編輯模板RNA或其gRNA和/或RT供體RNA的5’末端和/或3’末端可以含有保護片段,該保護片段可增強RNA分子對核酸外切酶活性的抗性。參見例如 11。在一些情況下,末端保護片段可以包含能夠形成二級結構(例如髮夾、假結或三鏈體結構)的核苷酸序列。在其他情況下,末端保護片段可以包含外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA的序列。在一些實施方式中,修飾係寨卡樣(Zika-like)假結、鼠白血病病毒假結(MLV-PK)序列、紅三葉草(red clover)壞死鑲嵌病毒(RCNMV)序列、甜三葉草(sweet clover)壞死鑲嵌病毒(SCNMV)序列、康乃馨輪點病毒(CRSV)序列、preQ序列或RNA噬菌體MS2序列。在特定實例中,末端保護片段可以包含一或多個CRISPR核酸酶結合位點(例如,Cas12i多肽如Cas12i2多肽的結合位點),以及視需要與任何人序列不具有同源性的一或多個區段(例如,間隔子)。在一些情況下,一或多個區段結合至與人基因組的任何序列不超過85%同一性的序列。參見 10 、圖 11 12A 12B。這樣的末端保護片段可以募集包含在同一基因編輯系統中的CRISPR核酸酶以抑制外切核糖核酸酶的活性,而不會誘導脫靶基因編輯。
在一些實施方式中,本文揭露的基因編輯系統包含至少一個編輯模板RNA(例如,基因編輯RNA)或編碼其的核苷酸序列。在一些實例中,至少一個編輯模板RNA能夠與CRISPR核酸酶(例如,V型CRISPR核酸酶)結合。在一些實例中,至少一個編輯模板RNA進一步能夠與核酸(例如,DNA或靶核酸)結合。在一些實例中,至少一個編輯模板RNA包含核酸酶結合序列(例如,可被CRISPR核酸酶識別的一或多個結合位點)和DNA結合序列(例如,間隔子)。在一些情況下,至少一個編輯模板RNA包含gRNA(包含核酸酶結合序列和間隔子)和RT供體RNA。在一些實施方式中,編輯模板RNA包含與RT供體RNA連接的RNA指導物。參見例如, 19Biv. 核酸的修飾
如本文揭露的基因編輯系統中的任一種RNA組分,例如編輯模板RNA、RNA指導物、RT供體RNA,可以包括一或多個修飾。
示例性修飾可以包括對糖、核鹼基、核苷間連接(例如,對連接的磷酸酯/對磷酸二酯連接/對磷酸二酯主鏈)及其任何組合的任何修飾。以下詳細描述了本文提供的一些示例性修飾。
RNA指導物或編碼組成物組分的任一核酸序列可以包括任何有用的修飾,例如對糖、核鹼基或核苷間連接(例如,對連接的磷酸酯/對磷酸二酯連接/對磷酸二酯主鏈)的修飾。嘧啶核鹼基的一或多個原子可以被視需要取代的胺基、視需要取代的硫醇、視需要取代的烷基(例如甲基或乙基)或鹵代(例如氯代或氟代)替代或取代。在某些實施方式中,在糖和核苷間連接中的每一個中存在修飾(例如,一或多個修飾)。修飾可為對核糖核酸(RNA)到去氧核糖核酸(DNA)、蘇糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA)或其雜交體的修飾。本文描述了另外的修飾。
在一些實施方式中,修飾可以包括化學或細胞誘導的修飾。例如,細胞內RNA修飾的一些非限制性實例由Lewis和Pan在「RNA modifications and structures cooperate to guide RNA-protein interactions [RNA修飾和結構協作指導RNA-蛋白質相互作用]」, Nat Reviews Mol Cell Biol [自然評論:分子細胞生物學], 2017, 18:202-210中所描述。
不同的糖修飾、核苷酸修飾和/或核苷間連接(例如,主鏈結構)可以存在於序列中的不同位置。熟悉該項技術者將理解,核苷酸類似物或其他一或多個修飾可以位於序列的任何一或多個位置,使得該序列的功能基本上不降低。序列可以包括從約1%至約100%的經修飾核苷酸(相對於總核苷酸含量,或相對於一或多種類型的核苷酸,即A、G、U或C中的任何一或多種)或任何中間百分比(例如,從1%至20%>、從1%至25%、從1%至50%、從1%至60%、從1%至70%、從1%至80%、從1%至90%、從1%至95%、從10%至20%、從10%至25%、從10%至50%、從10%至60%、從10%至70%、從10%至80%、從10%至90%、從10%至95%、從10%至100%、從20%至25%、從20%至50%、從20%至60%、從20%至70%、從20%至80%、從20%至90%、從20%至95%、從20%至100%、從50%至60%、從50%至70%、從50%至80%、從50%至90%、從50%至95%、從50%至100%、從70%至80%、從70%至90%、從70%至95%、從70%至100%、從80%至90%、從80%至95%、從80%至100%、從90%至95%、從90%至100%和從95%至100%)。
在一些實施方式中,序列的一或多個核糖核苷酸的糖修飾(例如在2'位置或4'位置)或糖替代以及主鏈修飾可以包括磷酸二酯連接的修飾或替代。序列之特定實例包括但不限於包括經修飾的主鏈或非天然核苷間連接(例如核苷間修飾,包括磷酸二酯連接的修飾或替代)的序列。具有經修飾的主鏈的序列尤其包括在主鏈中不具有磷原子的那些。出於本申請之目的,並且如本領域中有時提及的,在其核苷間主鏈中不具有磷原子的經修飾的RNA也可以被認為是寡核苷。在特定的實施方式中,序列將包括在其核苷間主鏈中具有磷原子的核糖核苷酸。
經修飾的序列主鏈可以包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、胺基烷基磷酸三酯、甲基和其他烷基膦酸酯(如3’-伸烷基膦酸酯和手性膦酸酯)、亞膦酸酯、胺基磷酸酯(如3’-胺基胺基磷酸酯和胺基烷基胺基磷酸酯)、硫羰胺基磷酸酯(thionophosphoramidate)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯、和具有正常3'-5’連接的硼烷磷酸酯、該等酯的2’-5’連接的類似物,以及具有相反極性的那些,其中相鄰的核苷單元對3’-5’連接至5’-3’或2’-5’連接至5'-2’。也包括各種鹽、混合鹽和游離酸形式。在一些實施方式中,序列可以帶負電荷或帶正電荷。
可在核苷間連接(例如磷酸酯主鏈)上修飾可摻入序列中的經修飾的核苷酸。在本文中,在多核苷酸主鏈之上下文中,短語「磷酸酯」和「磷酸二酯」可互換使用。可以藉由用不同的取代基替代一或多個氧原子來修飾主鏈磷酸酯基團。此外,經修飾的核苷和核苷酸可以包括用如本文所述之另一個核苷間連接進行的對未修飾的磷酸酯部分的整體替代。經修飾的磷酸酯基團之實例包括但不限於硫代磷酸酯、亞磷酸硒酸酯、硼酸磷酸酯、硼酸磷酸酯、氫膦酸酯、胺基磷酸酯、二胺基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的兩個非連接氧都被硫替代。也可以藉由用氮(橋連的胺基磷酸酯)、硫(橋連的硫代磷酸酯)和碳(橋連的亞甲基膦酸酯)替代連接氧來修飾磷酸酯連接子。
提供α-硫代取代的磷酸酯部分以通過非天然硫代磷酸酯主鏈連接賦予RNA和DNA聚合物穩定性。硫代磷酸酯DNA和RNA具有增強的核酸酶抗性,並因此在細胞環境中具有更長的半衰期。
在特定的實施方式中,經修飾的核苷包括α-硫代-核苷(例如5’ -O-(1-硫代磷酸)-腺苷、5’- O-(1-硫代磷酸)-胞苷(α-硫代胞苷)、5’- O-(1-硫代磷酸)-鳥苷、5’- O-(1-硫代磷酸)-尿苷或5’- O-(1-硫代磷酸)-假尿苷)。
本文描述了可根據本發明使用的其他核苷間連接,包括不含磷原子的核苷間連接。
在一些實施方式中,序列可以包括一或多個細胞毒性核苷。例如,可以將細胞毒性核苷摻入序列中,如雙官能修飾。細胞毒性核苷可以包括但不限於阿糖腺苷、5-氮雜胞苷、4'-硫代阿糖胞苷、環戊烯基胞嘧啶、克拉屈濱、氯法拉濱、阿糖胞苷、胞嘧啶阿拉伯糖苷、1-(2-C-氰基-2-去氧-β-D-阿拉伯-戊呋喃糖基)-胞嘧啶、地西他濱、5-氟尿嘧啶、氟達拉濱、氟尿苷、吉西他濱、替加氟和尿嘧啶的組合、替加氟((RS)-5-氟-1-(四氫呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他濱、替紮西他濱、2'-去氧-2'-亞甲基胞苷(DMDC)和6-巰基嘌呤。其他實例包括氟達拉濱磷酸酯、N4-山崳醯基-1-β-D-阿拉伯呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-阿拉伯呋喃糖基胞嘧啶、N4-棕櫚醯基-1-(2-C-氰基-2-去氧-β-D-阿拉伯-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5’-反油酸酯)。
在一些實施方式中,序列包括一或多個轉錄後修飾(例如,加帽、切割、聚腺苷酸化、剪接、聚A序列、甲基化、醯化、磷酸化、離胺酸和精胺酸殘基的甲基化、乙醯化、以及硫醇基團和酪胺酸殘基的亞硝基化等)。該一或多個轉錄後修飾可為任何轉錄後修飾,諸如已經在RNA中鑒定出的多於一百種不同的核苷修飾中的任一種(Rozenski, J, Crain, P和McCloskey, J. (1999).The RNA Modification Database: 1999 update. [RNA修飾資料庫:1999年更新]Nucl Acids Res [核酸研究] 27: 196-197)。在一些實施方式中,第一分離核酸包含信使RNA(mRNA)。在一些實施方式中,mRNA包含至少一種選自以下群組的核苷,該群組由以下組成:吡啶-4-酮核糖核苷、5-氮雜-尿苷、2-硫代-5-氮雜-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羥基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基-假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、2-硫代-二氫尿苷、2-硫代-二氫假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些實施方式中,mRNA包含至少一種選自以下群組的核苷,該群組由以下組成:5-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基胞苷、5-甲醯基胞苷、N4-甲基胞苷、5-羥基甲基胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假異胞苷、4-硫代-1-甲基-假異胞苷、4-硫代-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、折布拉林(zebularine)、5-氮雜-折布拉林、5-甲基-折布拉林、5-氮雜-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷和4-甲氧基-1-甲基-假異胞苷。在一些實施方式中,mRNA包含至少一種選自以下群組的核苷,該群組由以下組成:2-胺基嘌呤、2,6-二胺基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基嘌呤、7-去氮-8-氮雜-2-胺基嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-異戊烯基腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫代-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基腺苷、N6-蘇胺醯胺甲醯基腺苷、2-甲基硫代-N6-蘇胺醯胺甲醯基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些實施方式中,mRNA包含至少一種選自以下群組的核苷,該群組由以下組成:1-甲基-肌苷、懷俄苷、懷丁苷、7-去氮-鳥苷、7-去氮-8-氮雜-鳥苷、6-硫代-鳥苷、6-硫代-7-去氮-鳥苷、6-硫代-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫代-7-甲基-鳥苷、7-甲基肌苷、6-甲氧基-鳥苷、1-甲基鳥苷、N2-甲基鳥苷、N2,N2-二甲基鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫代-鳥苷、N2-甲基-6-硫代-鳥苷、和N2,N2-二甲基-6-硫代-鳥苷。
序列沿著分子的整個長度可以被或者可以不被均一地修飾。例如,一或多種或所有類型的核苷酸(例如,天然存在的核苷酸、嘌呤或嘧啶,或A、G、U、C、I、pU中的任一或多種或全部)在序列中,或在其給定的預定序列區域中可以被或可以不被均一地修飾。在一些實施方式中,序列包括假尿苷。在一些實施方式中,序列包括肌苷,該肌苷可以説明免疫系統將序列相對於病毒RNA表徵為內源性。肌苷的摻入還可以介導改善的RNA穩定性/減少降解。參見例如,Yu, Z.等人, (2015) RNA editing by ADAR1 marks dsRNA as 「self」. [藉由ADAR1進行的RNA編輯將dsRNA標記為「自身」]Cell Res. [細胞研究] 25, 1283-1284,將該文獻藉由引用以其全文併入。
在一些實施方式中,本文所述之任何RNA序列(例如編輯模板RNA)可以包含末端修飾(例如,5’末端修飾或3’末端修飾)。在一些實施方式中,末端修飾係化學修飾。在一些實施方式中,末端修飾係結構修飾。參見本文揭露內容。
當本文揭露的基因編輯系統包含編碼CRISPR核酸酶和/或RT多肽的核酸時,在適用的情況下,此類核酸分子可以含有本文揭露的任一修飾。 D. 示例性基因編輯系統
本文所述之示例性基因編輯系統僅旨在是說明性的。
在一些實施方式中,示例性基因編輯系統描繪於 1A 1B中。在該等示例性設計中,RNA指導物可以包含3’融合配偶體,該3’融合配偶體可以包含RT供體RNA(包含PBS和反轉錄模板序列)、本文揭露的任一另外的元件或其組合。在一些情況下,PBS的長度為約3至約24個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24個核苷酸)。可替代地或另外地,PBS可以與可能位於PAM股上的相應PBS靶向位點具有至少約75%的互補性。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸至約100個核苷酸(例如,約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個核苷酸)。在一些實施方式中,連接子存在於RNA指導物中的DNA結合序列(間隔子)和反轉錄模板序列之間。在一些實例中,連接子包含一或多個髮夾。例如,髮夾可以減少PBS和DNA結合序列之間的退火。
在一些情況下,示例性基因編輯系統中的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)可以包含N-末端或C-末端融合配偶體。在一些實施方式中,N-末端或C-末端融合配偶體包含反轉錄酶多肽。
在其他實施方式中,如本文揭露的示例性基因編輯系統描繪於 2中。在該等示例性設計中,RNA指導物可以包含5’融合配偶體,該5’融合配偶體可以包含RT供體RNA(包含PBS和反轉錄模板序列)、一或多種另外的元件或其組合。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸至約100個核苷酸(例如,約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個核苷酸)。在一些實施方式中,PBS的長度為約3個核苷酸至約24個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24個核苷酸)。可替代地或另外地,PBS與可能位於PAM股上的相應PBS靶向位點具有至少約75%的互補性。在一些實施方式中,連接子存在於RNA指導物的DNA結合序列和PBS之間。在一些實例中,連接子包含一或多個髮夾。例如,髮夾可以減少PBS和DNA結合序列之間的退火。
在一些情況下,示例性基因編輯系統中的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)可以包含N-末端或C-末端融合配偶體。在一些實施方式中,N-末端或C-末端融合配偶體包含反轉錄酶多肽。
1A 1B 2中描繪的示例性基因編輯系統可用於編輯靶核酸(例如,目的基因組位點)的PAM股。不希望受理論束縛,使用該等示例性基因編輯系統 1A 1B 2,在被CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)切割期間,PAM股的游離3’末端可以與PBS鹼基配對,使用反轉錄模板序列作為模板進行延伸,並且進行股交換回到與互補基因組股的鹼基配對,從而導致編輯摻入。
在又其他實施方式中,本文揭露的示例性基因編輯系統描繪於 3中。這樣的示例性基因編輯系統包含兩種RNA分子:包含核酸酶結合序列和DNA結合序列(間隔子)的RNA指導物、以及RT供體RNA。RT供體RNA可以包含PBS和反轉錄模板序列。在一些實例中,反轉錄模板序列不編碼編輯。在其他實例中,RT供體RNA包含PBS和編碼編輯的反轉錄模板序列。在一些實施方式中,反轉錄模板序列或其一部分可以經由鹼基配對與靶核酸結合。
在一些情況下,PBS的長度為多達約100個核苷酸。在一些實施方式中,PBS的長度為約3個核苷酸至約100個核苷酸。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸至約100個核苷酸。在一些實施方式中,RT供體RNA的反轉錄模板序列在5’末端包含適配體。在一些實施方式中,適配體募集反轉錄酶多肽。在一些實施方式中,RT供體RNA的PBS不與編輯模板RNA的任何其他部分(例如,核酸酶結合序列和/或DNA結合序列)互補。
3中描繪的示例性基因編輯系統可以包含一種或兩種蛋白質組分。例如,示例性基因編輯系統可以包含具有N-末端或C-末端融合配偶體的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),該融合配偶體可以包含反轉錄酶多肽。可替代地,基因編輯系統可以包含CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和反轉錄酶多肽作為兩種單獨的多肽。
3中描繪的示例性基因編輯系統可用於編輯靶核酸(例如,目的基因組位點)的PAM股或非PAM股。不希望受理論束縛,使用這樣的示例性基因編輯系統,在從靶核酸釋放CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)之後,PAM股或者非PAM股的游離3’末端可以與PBS進行鹼基配對,使用反轉錄模板序列作為模板進行延伸,並且進行股交換回到與互補基因組股雜交,從而導致摻入來自RT供體RNA的編輯。示例性基因編輯系統可用於在靶核酸的PAM遠端區域進行編輯。
在仍其他實施方式中,本文揭露的示例性基因編輯系統描繪於 4中。這樣的示例性基因編輯系統可以包含兩種RNA分子:RNA指導物和RT供體RNA作為兩種單獨的RNA分子。示例性基因編輯系統可以包含如本文揭露的一種或兩種蛋白質組分。例如,示例性基因編輯系統可以包含具有N-末端或C-末端融合配偶體的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),該融合配偶體可以包含反轉錄酶多肽。可替代地,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和反轉錄酶多肽不彼此融合(係兩種單獨的多肽)。
4中描繪的示例性基因編輯系統可用於編輯PAM股或非PAM股。不希望受理論束縛,使用示例性基因編輯系統,PAM股或非PAM股的游離3’末端可以與同一基因編輯系統中的RT供體RNA的PBS鹼基配對,使用反轉錄模板序列作為模板進行延伸,並且進行股交換回到與互補基因組股雜交,從而導致摻入來自RT供體RNA的編輯。
在一些實施方式中,本文揭露的示例性基因編輯系統描繪於 5中。在這樣的示例性基因編輯系統中,RNA指導物可以包含3’融合配偶體,該3’融合配偶體可以包含RT供體RNA(包含反轉錄模板序列和PBS)。在一些情況下,PBS結合靶序列互補區上游的非PAM股上的位點。
在一些實例中,PBS的長度為約3個核苷酸至約100個核苷酸(例如,約3、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個核苷酸)。在一些實施方式中,DNA結合序列(間隔子)的長度為約20個核苷酸至約25個核苷酸。在一些實施方式中,DNA結合序列包含摻入來自PAM序列的約10個核苷酸至約25個核苷酸的至少一個編輯。
在一些實例中,示例性基因編輯系統可以包含CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),該CRISPR核酸酶包含5’融合配偶體或3’融合配偶體。5’融合配偶體或3’融合配偶體可以包含反轉錄酶多肽。在一些實施方式中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)缺乏crRNA加工活性。
5中描繪的示例性基因編輯系統可用於編輯靶核酸(例如,目的基因組位點)的非PAM股。不希望受理論束縛,使用這樣的示例性基因編輯系統,在被CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)切割期間,非PAM股的游離3’末端可以與PBS鹼基配對,並且使用DNA結合序列作為模板進行延伸。非PAM股上的RT延伸交換回到與互補基因組股鹼基配對,從而導致摻入來自RT供體RNA的編輯。
在一些實施方式中,示例性基因編輯系統描繪於 6A 6B中。在這樣的示例性基因編輯系統中,RNA指導物可以包含3’融合配偶體,該3’融合配偶體可以包含RT供體RNA(包含反轉錄模板序列和PBS)。在一些實施方式中,PBS與非PAM股中的區域互補,該區域位於PAM股上靶序列的互補區上游。在一些實例中,髮夾存在於RNA指導物的DNA結合序列和反轉錄模板序列之間。在一些實施方式中,髮夾存在於反轉錄模板序列內。在一些實施方式中,模板序列中的編輯可以在其中摻入編輯的靶核酸中創建髮夾。
在一些實例中,示例性基因編輯系統可以包含CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),該CRISPR核酸酶包含N-末端或C-末端融合配偶體。N-末端或C-末端融合配偶體可以包含反轉錄酶多肽。
在一些實施方式中,示例性基因編輯系統描繪於 7中。在這樣的示例性基因編輯系統中,RNA指導物可以包含5’融合配偶體,該5’融合配偶體可以包含RT供體RNA(包含PBS和反轉錄模板序列)。在一些實施方式中,PBS的長度為約5至約20個核苷酸(例如,約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個核苷酸)。可替代地或另外地,PBS與非PAM股上的區域(相應的PBS靶向位點)具有至少約75%的互補性。在一些情況下,連接子存在於RNA指導物的核酸酶結合序列和RT供體RNA的PBS之間。可替代地或另外地,髮夾可以存在於RNA指導物的DNA結合序列和RT供體RNA的反轉錄模板序列之間。在一些實施方式中,髮夾存在於反轉錄模板序列內。在一些實施方式中,模板序列中的編輯可以在其中摻入編輯的靶核酸中創建髮夾。
在一些情況下,示例性基因編輯系統中的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)可以包含N-末端或C-末端融合配偶體,該融合配偶體可以包含反轉錄酶多肽。在一些實施方式中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)缺乏crRNA加工活性(例如,本文揭露的那些)。
6A 6B 7中描繪的示例性基因編輯系統可用於編輯靶核酸(例如,目的基因組位點)的非PAM股。不希望受理論束縛,使用示例性基因編輯系統,在被CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)切割期間,非PAM股的游離3’末端可以與PBS鹼基配對,並且使用反轉錄模板序列作為模板進行延伸。非PAM股上的RT延伸交換回到與互補基因組股鹼基配對,從而導致摻入來自RT供體RNA的至少一個編輯。
本文揭露的示例性基因編輯系統(例如 6A 6B 7中描繪的那些)可用於在非PAM股上與PAM股上的靶序列互補的區域內摻入至少一個PAM近端編輯。在一些實例中,示例性基因編輯系統可用於修飾PAM序列和/或PAM序列上游的序列(例如,經由在與PAM序列和/或上游序列互補的區域中引入變化)。此類示例性基因編輯系統可用於防止所得經修飾的遺傳基因座被相同的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)重新靶向。
在一些實施方式中,本文揭露的示例性基因編輯系統描繪於 10中。在這樣的示例性基因編輯系統中,RNA指導物可以包含3’融合配偶體,該3’融合配偶體可以包含RT供體RNA(包含PBS和反轉錄模板序列)。可替代地,RNA指導物可以包含5’融合配偶體,該5’融合配偶體可以包含RT供體RNA(包含反轉錄模板序列和PBS)。PBS的長度係可變的。例如,PBS的長度可以為約3個核苷酸至約16個核苷酸。在一些實例中,PBS能夠與靶核酸的PAM股上的區域,例如,與靶序列重疊的區域(例如,目的基因組位點)結合。在一些實例中,髮夾存在於RNA指導物的DNA結合序列和RT供體RNA的反轉錄模板序列之間。RNA指導物-反轉錄模板序列的一端或兩端可包括保護片段(例如本文揭露的那些)以防止核酸外切酶或核酸內切酶活性。
示例性基因編輯系統可以包含CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),該CRISPR核酸酶可以包含N-末端或C-末端融合配偶體。在一些實例中,N-末端或C-末端融合配偶體包含反轉錄酶多肽。在一些實例中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)缺乏crRNA加工活性。在一些實例中,CRISPR核酸酶係切口酶。在一些實例中,使用 10中描繪的示例性基因編輯系統將編輯摻入靶核酸的PAM股中。
1- 7 、圖 8A- 8C 和圖 10中描繪的示例性編輯模板RNA(其包含與RNA指導序列的3’末端融合的RT供體RNA序列或與RNA指導序列的5’末端融合的RT供體RNA序列)可以代替包含與RNA指導序列的內部位置融合的RT供體RNA序列,或反之亦然。例如,RT供體RNA可以與RNA指導物、sgRNA或RNA指導物-tracrRNA(例如,sgRNA)的內部位置融合。
延伸的RNA指導物末端(例如,通過使用RT供體RNA進行的5’延伸或3’延伸)可能容易受到核酸外切酶和/或核酸內切酶活性的影響,這會降低反轉錄模板序列濃度以及編輯摻入的效率。在一些實施方式中,RNA指導物-RT供體RNA融合物進一步包含添加的二級結構以抑制或防止核酸外切酶活性。在一些實施方式中,添加的二級結構係三鏈體結構、假結、xrRNA、環狀RNA、tRNA或截短的tRNA。在一些實施方式中,添加的二級結構係寨卡樣假結、鼠白血病病毒假結(MLV-PK)序列、紅三葉草壞死鑲嵌病毒(RCNMV)序列、甜三葉草壞死鑲嵌病毒(SCNMV)序列、康乃馨輪點病毒(CRSV)序列、preQ序列或RNA噬菌體MS2序列。在一些實施方式中,添加的二級結構係通過鹼基堆疊或3’末端鹼基配對。在其他實施方式中,添加的二級結構係核酸酶結合序列或核酸酶結合序列和DNA結合序列。參見 10 、圖 11 12A 12B。在一些實施方式中,添加的DNA結合序列針對非哺乳動物靶標。在一些實施方式中,添加的DNA結合序列針對非人靶標。在一些實施方式中,在人基因組中未發現添加的DNA結合序列。在一些實施方式中,添加的DNA結合序列與人基因組的任何序列具有不超過85%同一性。參見實例2。
不希望受理論束縛,添加核酸酶結合序列和DNA結合序列可以募集CRISPR核酸酶或CRISPR核酸酶-反轉錄酶融合物。通過蛋白質-RNA相互作用,結合的CRISPR核酸酶可以提供對內源性核酸外切酶和核酸內切酶的抗性。在一些實施方式中,另外的核酸酶結合序列和DNA結合序列募集缺乏RNA加工活性的CRISPR核酸酶。在一些實施方式中,二級結構係適配體(例如,RNA適配體),並且組成物進一步包含與該適配體相互作用的蛋白質。在一些實施方式中,包含適配體和適配體相互作用蛋白質的組成物抑制內源性核酸外切酶和/或核酸內切酶活性。
下文提供了另外的如本文揭露的示例性基因編輯系統,僅用於說明目的。
在一些實施方式中,如本文揭露的基因編輯系統包含至少一個RNA指導物(或指導RNA,它們在本文可互換使用)和至少一個RT供體RNA。在一些實例中,至少一個RNA指導物包含核酸酶結合序列和DNA結合序列(間隔子)。RNA指導物可能能夠與CRISPR核酸酶(例如,V型CRISPR核酸酶)結合。在一些實例中,至少一個RNA指導物進一步能夠例如經由間隔子區域與靶核酸結合。在一些實例中,RT供體RNA包含至少一個引物結合位點(PBS)和至少一個反轉錄模板序列。PBS能夠與靶核酸的一條股結合,該股可為有義股或反義股。PBS結合的區域在本文中被描述為PBS靶向位點。至少一個反轉錄模板序列可以包含相對於靶核酸的相應序列具有至少一個核苷酸變化(經編碼的編輯)的序列。在一些情況下,至少一個經編碼的編輯係插入、取代和/或缺失。
在一些實施方式中,本文揭露的基因編輯系統包含至少一個RNA指導物、至少一個RT供體RNA和至少一個其他序列。在一些實施方式中,至少一個RNA指導物包含核酸酶結合序列和DNA結合序列。在一些實施方式中,RNA指導物能夠與CRISPR核酸酶(例如,V型CRISPR核酸酶)結合。在一些實施方式中,至少一個RNA指導物進一步能夠與靶核酸結合。在一些實施方式中,至少一個RT供體RNA的PBS能夠與靶核酸的非PAM股結合。在一些實施方式中,至少一個RT供體RNA的PBS能夠與靶核酸的PAM股結合。
在一些實施方式中,本文揭露的基因編輯系統可以包含CRISPR核酸酶、反轉錄酶和編輯模板RNA中的至少一種,該編輯模板RNA可以包含RNA指導物和RT供體RNA。在一些實例中,CRISPR核酸酶、反轉錄酶和編輯模板RNA中的至少一種在單獨的組成物中提供。在一些實施方式中,CRISPR核酸酶、反轉錄酶、RNA指導物和RT供體RNA中的至少一種在單獨的組成物中提供。在一些實施方式中,CRISPR核酸酶、反轉錄酶和編輯模板RNA中的至少一種中的一或多個在分開的組成物中提供。在一些實施方式中,包含CRISPR核酸酶和反轉錄酶的組成物與包含編輯模板RNA的組成物分開提供。在一些實施方式中,CRISPR核酸酶、反轉錄酶、RNA指導物和RT供體RNA中的至少一種中的一或多個在分開的組成物中提供。在一些實施方式中,包含CRISPR核酸酶和反轉錄酶的組成物與包含RNA指導物和RT供體RNA的組成物分開提供。
在一些實施方式中,本文提供的基因編輯系統可能能夠與靶核酸結合,該靶核酸可為需要基因編輯的基因組位點。在一些實施方式中,組成物的一或多種組分(例如,編輯模板RNA)結合靶核酸。在一些實施方式中,組成物的一或多種組分(例如,RNA指導物和RT供體RNA)結合靶核酸。在一些實施方式中,靶核酸係DNA。在一些實施方式中,本發明之組成物修飾或能夠修飾靶核酸。在一些實施方式中,組成物的一或多種組分(例如,CRISPR核酸酶和反轉錄酶)修飾靶核酸。在一些實施方式中,本發明之組成物將取代、插入或缺失引入到靶核酸中。在一些實施方式中,本發明之組成物能夠將取代、插入或缺失引入到靶核酸的非PAM股中。在一些實施方式中,如本文揭露的基因編輯系統能夠將取代、插入或缺失引入到靶核酸的PAM股中。
在一些實施方式中,本文揭露的基因編輯系統可以包含CRISPR核酸酶、RT多肽或兩者的蛋白質組分。可替代地,基因編輯系統可以包含編碼蛋白質組分的一或多種核酸(例如,載體,如病毒載體)。在一些實例中,基因編輯系統可以包含編碼CRISPR核酸酶和編碼RT多肽兩者的一種載體。可替代地或另外地,如本文所揭露的基因編輯系統可以包含基因編輯RNA、指導RNA或兩者的RNA組分。可替代地,基因編輯系統可以包含編碼RNA組分的一或多種核酸(載體)。例如,基因編輯系統可以包含編碼基因編輯RNA和RNA指導物兩者的一種載體(例如,病毒載體,如AAV載體)。
在一些實例中,如本文揭露的基因編輯系統可以包含CRISPR核酸酶、RT多肽或兩者的蛋白質組分,以及基因編輯RNA和RNA指導物的RNA組分。在其他實例中,如本文揭露的基因編輯系統可以包含CRISPR核酸酶、RT多肽或兩者的蛋白質組分,以及編碼基因編輯RNA和RNA指導物的RNA組分的一或多種核酸。在又其他實例中,如本文揭露的基因編輯系統可以包含一或多種核酸,該一或多種核酸編碼CRISPR核酸酶、RT多肽或兩者的蛋白質組分,以及基因編輯RNA和RNA指導物的RNA組分。可替代地,如本文揭露的基因編輯系統可以包含編碼CRISPR核酸酶、RT多肽或兩者的蛋白質組分的一或多種核酸,以及編碼基因編輯RNA和RNA指導物的RNA組分的一或多種核酸。在一些情況下,基因編輯系統可以包含一種載體,該載體編碼基因編輯系統的多個組分。
在一些實施方式中,本文揭露的基因編輯系統包含一或多種脂質奈米顆粒(LNP),該一或多種脂質奈米顆粒包含基因編輯系統的一或多種蛋白質組分和/或RNA組分,或其編碼核酸。在其他實施方式中,基因編輯系統可以包含一或多種LNP,該一或多種LNP包含部分組分和編碼剩餘組分的一或多種載體。 II. 基因編輯系統組分的製備
可以藉由本文揭露的方法中的常規方法製備蛋白質組分、RNA組分或其編碼核酸。
在一些實施方式中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)、反轉錄酶或CRISPR核酸酶-反轉錄酶融合物可以藉由以下來製備:(a) 培養能夠產生蛋白質的宿主細胞(例如,細菌細胞或哺乳動物細胞),分離由此產生的蛋白質,並且視需要純化蛋白質。如此製備的CRISPR核酸酶、反轉錄酶或融合蛋白可以與編輯模板RNA複合。
CRISPR核酸酶和反轉錄酶也可以藉由 (b) 已知的基因工程技術製備,特別地,藉由從細菌中分離編碼本發明之CRISPR核酸酶和反轉錄酶的基因,構建重組表現載體,然後將載體轉移到合適的宿主細胞中,該宿主細胞表現編輯模板RNA,用於在宿主細胞中表現與編輯模板RNA複合的重組蛋白。可替代地,CRISPR核酸酶和反轉錄酶可以藉由 (c) 體外偶合的轉錄-翻譯系統來製備然後與編輯模板RNA複合。可用於製備本發明之CRISPR核酸酶和反轉錄酶的細菌沒有特別限制,只要它們可以產生本發明之CRISPR核酸酶和反轉錄酶即可。細菌的一些非限制性實例包括本文所述之大腸桿菌細胞。
除非另有說明,否則本文提供的所有組成物和複合物和多肽係參照該組成物或複合物或多肽的活性水平而製備的,並且不包括雜質,例如可能存在於市售來源中的殘留溶劑或副產物。酶組分重量基於總活性蛋白質。除非另外指明,否則所有百分比和比率均按重量進行計算。除非另外指明,否則所有百分比和比率均基於總組成物計算。在示例性組成物中,酶水平以總組成物的重量計按純酶表示,除非另有說明,否則成分以總組成物的重量表示。 A. 載體
本揭露提供了用於表現本文所述之CRISPR核酸酶、反轉錄酶或其融合多肽的一或多種載體,或者可將編碼本文所述組分的核酸摻入載體中。在一些實施方式中,本文揭露的載體包括編碼CRISPR核酸酶、反轉錄酶或融合多肽的核苷酸序列。本揭露還提供了編碼編輯模板RNA或其任何部分(例如,RNA指導物或RT供體RNA)的一或多種載體。在一些實施方式中,載體包含Pol II啟動子或Pol III啟動子。
天然或合成的多核苷酸的表現典型地藉由以下實現:將編碼目的基因的多核苷酸(例如,編碼CRISPR核酸酶、反轉錄酶或融合多肽和/或編輯模板RNA的核苷酸序列)可操作地連接至啟動子,並且將構建體併入表現載體中。表現載體沒有特別的限制,只要它包含編碼本發明之CRISPR核酸酶和反轉錄酶和/或編輯模板RNA的多核苷酸,並且可以適合於在真核細胞中複製和整合。
典型的表現載體包括可用於表現所希望多核苷酸的轉錄和翻譯終止子、起始序列和啟動子。例如,可使用攜帶RNA聚合酶識別序列的質體載體(pSP64、pBluescript等)。包括來源於反轉錄病毒如慢病毒的那些載體係實現長期基因轉移的合適工具,因為它們允許轉基因的長期穩定整合及其在子細胞中的繁殖。載體之實例包括表現載體、複製載體、探針產生載體、和定序載體。可以按病毒載體的形式,將表現載體提供給細胞。
病毒載體技術係本領域眾所周知的,並且描述於多種病理學和分子生物學手冊。可用作載體的病毒包括但不限於噬菌體病毒、反轉錄病毒、腺病毒、腺相關病毒、皰疹病毒和慢病毒。通常,合適的載體含有在至少一種生物體中有複製功能的起點、啟動子序列、方便的限制性內切酶位點、和一或多種選擇性標誌物。
載體的種類沒有特別限制,可以適當地選擇可以在宿主細胞中表現的載體。更特別地,根據宿主細胞的種類,適當地選擇啟動子序列以確保從多核苷酸表現一或多種多肽,並將該啟動子序列和多核苷酸插入各種質體等的任一種中,用於製備表現載體。
另外的啟動子元件(例如,增強序列)調節轉錄起始的頻率。典型地,該等元件位於起始位點上游30-110 bp的區域中,儘管最近已經顯示許多啟動子也含有起始位點下游的功能元件。取決於啟動子,似乎單個元件可以共同地或獨立地發揮功能,以激活轉錄。
此外,本揭露不應限於使用組成型啟動子。誘導型啟動子也被考慮作為本揭露的一部分。誘導型啟動子的使用提供了分子開關,該分子開關能夠當需要該啟動子可操作地連接的多核苷酸序列的表現時啟動這種表現,或者當不需要表現時關閉表現。誘導型啟動子之實例包括但不限於金屬硫蛋白啟動子、糖皮質激素啟動子、孕酮啟動子、和四環素啟動子。
待引入的表現載體還可以含有選擇性標誌物基因或報告基因或二者,從而便於從尋求通過病毒載體轉染或感染的細胞的群體中,鑒定和選擇表現性細胞。在其他方面,選擇性標誌物可以在一段單獨的DNA上進行,並且用於共轉染程序。選擇性標誌物和報告基因二者側翼可為適當的轉錄控制序列,以使得能夠在宿主細胞中表現。這種標誌物之實例包括用於真核細胞培養的二氫葉酸還原酶基因和新黴素抗性基因;以及用於大腸桿菌和其他細菌培養的四環素抗性基因和胺苄青黴素抗性基因。藉由使用這樣的選擇標誌物,可以確認編碼本發明之一或多種多肽的多核苷酸是否已被轉移到宿主細胞中,然後定被成功表現。
重組表現載體的製備方法沒有特別限制,其實例包括使用質體、噬菌體或黏質體的方法。 B. 表現方法
本揭露包括用於蛋白質表現之方法,該方法包括翻譯CRISPR核酸酶和反轉錄酶,並且表現本文所述之編輯模板RNA。
在一些實施方式中,本文所述之宿主細胞用於表現CRISPR核酸酶和反轉錄酶和/或編輯模板RNA。宿主細胞沒有特別限制,並且可以較佳的是使用各種已知的細胞。宿主細胞之特定實例包括細菌,例如大腸桿菌、酵母(出芽酵母(budding yeast)、釀酒酵母( Saccharomyces cerevisiae)和裂殖酵母(fission yeast)、粟酒裂殖酵母( Schizosaccharomyces pombe))、線蟲(秀麗隱桿線蟲( Caenorhabditis elegans))、非洲爪蟾( Xenopus laevis)卵母細胞和動物細胞(例如,CHO細胞、COS細胞和HEK293細胞)。用於將上述表現載體轉移到宿主細胞中之方法(即轉化方法)沒有特別限制,並且可以使用已知的方法,例如電穿孔、磷酸鈣法、脂質體法和DEAE葡聚糖法。
在用表現載體轉化宿主後,可以培養、培育或繁殖宿主細胞,用於產生CRISPR核酸酶、反轉錄酶和/或編輯模板RNA。CRISPR核酸酶、反轉錄酶和/或編輯模板RNA表現後,可以收集宿主細胞,並根據常規方法(例如,過濾、離心、細胞破碎、凝膠過濾層析、離子交換層析等)從培養物等中純化CRISPR核酸酶、反轉錄酶和/或編輯模板RNA。
在一些實施方式中,用於CRISPR核酸酶和反轉錄酶表現之方法包括翻譯一或多種多肽的至少5個胺基酸、至少10個胺基酸、至少15個胺基酸、至少20個胺基酸、至少50個胺基酸、至少100個胺基酸、至少150個胺基酸、至少200個胺基酸、至少250個胺基酸、至少300個胺基酸、至少400個胺基酸、至少500個胺基酸、至少600個胺基酸、至少700個胺基酸、至少800個胺基酸、至少900個胺基酸、或至少1000個胺基酸。在一些實施方式中,用於蛋白質表現之方法包括翻譯CRISPR核酸酶和反轉錄酶的約5個胺基酸、約10個胺基酸、約15個胺基酸、約20個胺基酸、約50個胺基酸、約100個胺基酸、約150個胺基酸、約200個胺基酸、約250個胺基酸、約300個胺基酸、約400個胺基酸、約500個胺基酸、約600個胺基酸、約700個胺基酸、約800個胺基酸、約900個胺基酸、約1000個胺基酸或更多個胺基酸。
可以使用多種方法以確定宿主細胞中成熟CRISPR核酸酶、反轉錄酶和/或編輯模板RNA的產生水平。此類方法包括但不限於例如利用對蛋白質特異的多株或單株抗體或如本文其他地方所述之標記標籤的方法。示例性方法包括但不限於酶聯免疫吸附測定(ELISA)、放射免疫測定(MA)、螢光免疫測定(FIA)和螢光激活細胞分選術(FACS)。該等和其他測定法係本領域熟知的(參見例如,Maddox等人, J. Exp. Med.[實驗醫學雜誌] 158:1211 [1983])。
本揭露提供了在細胞中體內表現CRISPR核酸酶和反轉錄酶和/或編輯模板RNA之方法,該等方法包括向宿主細胞提供編碼CRISPR核酸酶、反轉錄酶和/或編輯模板RNA的多核糖核苷酸(其中多核糖核苷酸編碼CRISPR核酸酶、反轉錄酶和/或編輯模板RNA),在細胞中表現CRISPR核酸酶、反轉錄酶和/或編輯模板RNA,並且從細胞中獲得CRISPR核酸酶、反轉錄酶和/或編輯模板RNA。 III. 基因編輯方法
可以使用該等基因編輯系統中任一個以對靶核酸(該靶核酸可為目的基因位點,例如需要基因編輯的基因位點)進行基因修飾(編輯),例如以修復基因突變,以引入保護性突變,以引入修飾用於調節基因的表現等。
本文揭露的基因編輯系統和組成物適合用於進行編輯並將編輯引入到多種靶序列。在一些實施方式中,靶序列係DNA分子,例如DNA基因座(在本文中稱為靶序列或中靶序列)。在一些實施方式中,靶序列係RNA,例如RNA基因座或mRNA。在一些實施方式中,靶序列係單股的(例如,單股DNA)。在一些實施方式中,靶序列係雙股的(例如,雙股DNA)。在一些實施方式中,靶序列包含單股區域和雙股區域。在一些實施方式中,靶序列係線性的。在一些實施方式中,靶序列係環狀的。在一些實施方式中,靶序列包含一或多種經修飾的核苷酸,例如甲基化核苷酸、受損核苷酸或核苷酸類似物。在一些實施方式中,靶序列未經修飾。在一些實施方式中,單股靶序列不需要PAM序列。
靶序列可以具有任何長度,例如約至少100 bp、200 bp、500 bp、1000 bp、2000 bp、5000 bp、10 kb、20 kb、50 kb、100 kb、200 kb、 500 kb、1 Mb之一或更長。靶序列還可以包含任何序列。在一些實施方式中,靶序列富含GC,例如具有至少約40%、45%、50%、55%、60%、65%之一或更高的GC含量。在一些實施方式中,靶序列具有至少約70%、80%或更多的GC含量。在一些實施方式中,靶序列係非富含GC的靶序列中的富含GC的片段。在一些實施方式中,靶序列不是富含GC的。在一些實施方式中,靶序列具有一或多種二級結構或更高級結構。在一些實施方式中,靶序列不處於使核糖核蛋白不能接近靶序列的縮合狀態,例如處在染色質中。
在一些實施方式中,靶核酸係細胞中的基因組位點。在一些情況下,將發生遺傳編輯的靶核酸可以位於蛋白質編碼區中。可替代地,靶核酸可以位於調節區,例如啟動子、強化子、5’或3’非翻譯區。在其他情況下,靶核酸可以位於非編碼基因中,例如轉座子、miRNA、tRNA、核糖體RNA、核酶或lincRNA。 A. 用於基因編輯的示例性基因
可以使用本文揭露的基因編輯系統中任一個以編輯目的靶基因,例如涉及疾病(例如,遺傳性疾病)的基因。在一些實施方式中,靶基因可為參與受試者免疫反應的基因。例如,靶基因可為免疫檢查點基因。
示例性靶基因包括但不限於 BCL11A內含子紅系強化子、CD3、β-2微球蛋白(B2M)、T細胞受體α恆定區(TRAC)、計劃性細胞死亡1(PDCD1)、T細胞受體α、T細胞受體β,B細胞淋巴瘤/白血病11A(BCL11A),細胞毒性T淋巴球抗原4(CTLA-4),趨化因子(C-C模體)受體5(基因/假基因)(CCR5),CXCR4基因,CD160分子(CD160)、腺苷A2a受體(ADORA)、CD276、B7-H3、B7-H4、BTLA、菸鹼醯胺腺嘌呤二核苷酸磷酸NADPH氧化酶異構物2(NOX2)、T細胞活化的V結構域Ig抑制因子(VISTA)、唾液酸-結合免疫球蛋白型凝集素7(SIGLEC7)、唾液酸結合免疫球蛋白型凝集素9(SIGLEC9)、SIGLEC10、含有T細胞活化抑制劑的V組結構域1(VTCN1)、B和T淋巴球相關(BTLA)、吲哚胺2,3-雙加氧酶(IDO)、吲哚胺2,3-雙加氧酶1(IDO1)、殺手細胞免疫球蛋白樣受體(KIR)、殺手細胞免疫球蛋白樣受體三個結構域長胞質尾1(KIR3DL1)、淋巴球激活基因3(LAG3)、T細胞免疫球蛋白結構域和黏蛋白結構域3(TIM3)、甲型肝炎病毒細胞受體2(HAVCR2)、自然殺手細胞受體2B4(CD244)、次黃嘌呤磷酸核糖基轉移酶1(HPRT)、具有Ig和ITIM結構域的T細胞免疫受體(TIGIT)、CD96分子(CD96)、細胞毒性和調節性T細胞分子(CRTAM)、白血球相關免疫球蛋白樣受體1(LAIR1)、腺相關病毒整合位點1(AAVS1)、AAVS 2、AAVS3、AAVS4、AAVS5、AAVS6、AAVS7、AAVS8、轉化生長因子β受體II(TGFBRII)、轉化生長因子β受體I(TGFBR1)、SMAD家族成員2(SMAD2)、SMAD家族成員3(SMAD3)、SMAD家族成員4(SMAD4)、SKI原癌基因(SKI)、SKI樣原癌基因(SKIL)、egl-9家族缺氧誘導因子1(EGLN1)、egl-9家族缺氧誘導因子2(EGLN2)、egl-9家族缺氧誘導因子3(EGLN3)、蛋白磷酸酶1調節亞基12C(PPP1R12C)、TGFB誘導因子同源框1(TGIF1)、腫瘤壞死因子受體超家族成員、腫瘤壞死因子受體超家族成員10b(TNFRSF10B)、腫瘤壞死因子受體超家族成員10a(TNFRSF10A)、BY55、B7H5、半胱天冬酶8(CASP8)、半胱天冬酶10(CASP10)、半胱天冬酶3(CASP3)、半胱天冬酶6(CASP6)、半胱天冬酶7(CASP7)、經由死亡結構域相關的Fas(FADD)、Fas細胞表面死亡受體(FAS)、介白素10受體亞基α(IL10RA)、介白素10受體亞基β(IL10RB)、血基質加氧酶2(HMOX2)、介白素6受體(IL6R)、介白素6信號轉導子(IL6ST)、c-src酪胺酸激酶(CSK)、磷蛋白膜錨鞘糖脂微結構域1(PAG1)、鳥苷酸環化酶1(可溶性)β3(GUCY1B3)、傳訊閾值調節跨膜適配體1(SIT1)、叉頭框P3(FOXP3)、PR結構域1(PRDM1)、鹼性白胺酸拉鍊轉錄因子(ATF樣)(BATF)、鳥苷酸環化酶1(可溶性)α2(GUCY1A2)、鳥苷酸環化酶1(可溶性)α3(GUCY1A3)、鳥苷酸環化酶1(可溶性)β2(GUCY1B2)、脯胺醯羥化酶結構域(PHD1、PHD2、PHD3)蛋白質家族、CD27、CD28、CD40、CD122、CD137、OX40、GITR和ICOS。在一些實施方式中,經修飾的基因係計畫性死亡配體1(PD-L1)、II類主要組織相容性複合物反式激活因子(CIITA)、檸蘋醯輔酶A裂解酶(CLYBL)、運甲狀腺素蛋白(TTR)、乳酸脫氫酶-A(LDHA)、羥基酸氧化酶1(HAO1)、丙胺酸-乙醛酸酯和絲胺酸-丙酮酸酯胺基轉移酶(AGXT)、乙醛酸酯還原酶/羥基丙酮酸酯還原酶(GRHPR)、4-羥基-2-氧戊二酸酯醛縮酶(HOGA)、聚嘧啶串結合蛋白1(PTBP1)、微管解聚蛋白(stathmin)2(STMN2)或肌動蛋白β(ACTB)。
本揭露提供了使用如本文還揭露的基因編輯系統對如本文揭露的任何靶基因進行基因編輯之方法。 B. 編輯
在一些方面,本文提供了使用本文所述之基因編輯系統將至少一個編輯引入靶核酸(例如,如本文揭露的任何靶基因中的目的基因組位點)之方法。在一些實施方式中,編輯可以包括將取代、插入、缺失或其組合引入到靶核酸。在一些實例中,編輯可為單核苷酸取代,例如,G到T取代、G到A取代、G到C取代、T到G取代、T到A取代、T到C取代、C到G取代、C到T取代、C到A取代、A到T取代、A到G取代或A到C取代。在一些實例中,編輯可以進行以下鹼基對的轉化:G:C鹼基對到T:A鹼基對、G:C鹼基對到A:T鹼基對、G:C鹼基對到C:G鹼基對、T:A鹼基對到G:C鹼基對、T:A鹼基對到A:T鹼基對、T:A鹼基對到C:G鹼基對、C:G鹼基對到G:C鹼基對、C:G鹼基對到T:A鹼基對、C:G鹼基對到A:T鹼基對、A:T鹼基對到T:A鹼基對、A:T鹼基對到G:C鹼基對或A:T鹼基對到C:G鹼基對。
在一些實施方式中,描述了用於將至少一個編輯引入到靶核酸之方法,其中該編輯係至少一個取代、至少一個插入和/或至少一個缺失。在一些實施方式中,編輯包含至少一個取代、插入或缺失。在一些實施方式中,取代、插入或缺失的長度為至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400或至少500個核苷酸。在一些實施方式中,取代、插入或缺失的長度為從1個核苷酸至約200個核苷酸,例如,1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸或從195個核苷酸至200個核苷酸。在一些實施方式中,取代、插入或缺失的長度為從1個核苷酸至約300個核苷酸,例如,1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸、從195個核苷酸至200個核苷酸、從200個核苷酸至210個核苷酸、從210個核苷酸至220個核苷酸、從220個核苷酸至230個核苷酸、從230個核苷酸至240個核苷酸、從240個核苷酸至250個核苷酸、從250個核苷酸至260個核苷酸、從260個核苷酸至270個核苷酸、從270個核苷酸至280個核苷酸、從280個核苷酸至290個核苷酸或從290個核苷酸至300個核苷酸。在一些實施方式中,取代、插入或缺失的長度為多達約10,000個鹼基對(10 kb)。例如,在一些實施方式中,取代、插入或缺失的長度為1個鹼基對、約10個鹼基對、約20個鹼基對、約30個鹼基對、約40個鹼基對、約50個鹼基對、約60個鹼基對、約70個鹼基對、約80個鹼基對、約90個鹼基對、約100個鹼基對、約200個鹼基對、約300個鹼基對、約400個鹼基對、約500個鹼基對、約600個鹼基對、約700個鹼基對、約800個鹼基對、約900個鹼基對、約1 kb、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb或10 kb。
在一些實施方式中,插入係髮夾或包含髮夾。例如,反轉錄酶可以轉錄髮夾,該髮夾可以被摻入到靶核酸中。在其他實施方式中,反轉錄模板序列包括髮夾結構,並且反轉錄酶在髮夾處停止轉錄反轉錄模板序列。
在一些實施方式中,編輯發生於II型PAM序列(例如,對於SpCas9的5’-NGG-3’)或V型PAM序列(例如,對於Cas12i多肽的5’-NTTN-3’)的約500個核苷酸內。在一些實施方式中,編輯鄰近PAM序列發生,例如在PAM序列上游或下游的約500個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約400個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約400個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約300個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約300個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約200個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約200個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約100個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約100個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約50個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約50個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約30個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約30個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約20個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約20個核苷酸內。
在一些實施方式中,編輯起始於PAM序列上游的約300個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約290個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約280個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約270個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約260個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約250個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約240個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約230個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約2020個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約210個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約200個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約190個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約180個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約170個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約160個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約150個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約140個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約130個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約120個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約110個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約100個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約90個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約80個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約70個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約60個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約50個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約40個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約30個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約20個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約10個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約9個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約8個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約7個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約6個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約5個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約4個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約3個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約2個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約1個核苷酸內。
在一些實施方式中,編輯起始於PAM序列。在一些實施方式中,編輯起始於PAM序列下游的約1個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約2個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約3個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約4個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約5個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約6個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約7個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約8個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約9個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約10個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約11個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約12個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約13個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約14個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約15個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約16個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約17個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約18個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約19個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約20個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約21個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約22個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約23個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約24個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約25個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約26個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約27個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約28個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約29個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約30個核苷酸內。
在一些實施方式中,編輯結束於PAM序列上游的約300個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約290個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約280個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約270個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約260個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約250個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約240個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約230個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約2020個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約210個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約200個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約190個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約180個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約170個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約160個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約150個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約140個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約130個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約120個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約110個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約100個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約90個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約80個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約70個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約60個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約50個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約40個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約30個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約20個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約10個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約9個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約8個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約7個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約6個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約5個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約4個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約3個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約2個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約1個核苷酸內。
在一些實施方式中,編輯結束於PAM序列。在一些實施方式中,編輯結束於PAM下游的約1個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約2個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約3個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約4個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約5個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約6個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約7個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約8個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約9個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約10個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約11個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約12個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約13個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約14個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約15個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約16個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約17個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約18個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約19個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約20個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約21個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約22個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約23個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約24個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約25個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約26個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約27個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約28個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約29個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約30個核苷酸內。 C. PAM 股編輯
在一些實施方式中,本文提供了使用如本文揭露的合適的基因編輯系統,例如 5 6A 6B 7 8A 12A 12B中所示的那些,將至少一個編輯引入到靶核酸的非PAM股之方法。最初可以使用包含在基因編輯系統中的反轉錄模板序列將至少一個編輯引入到非PAM股。經由細胞DNA修復機制,最終將至少一個編輯引入到靶核酸的兩條股中。基因編輯系統可以包含靶向非PAM股的編輯模板RNA,該編輯模板RNA包含 (a) CRISPR核酸酶結合序列,(b) DNA結合序列,和 (c) RT供體RNA。在一些實施方式中,RT供體RNA包含PBS和反轉錄模板序列。
在一些實施方式中,描述了用於通過RT供體RNA的反轉錄模板序列的5’至3’轉錄將至少一個編輯引入到靶核酸的非PAM股之方法和基因編輯系統或組成物。在一些實施方式中,描述了用於通過反轉錄模板序列的5’至3’轉錄將至少一個編輯引入到靶核酸的非PAM股之方法和組成物。
在一些實施方式中,RT供體RNA(例如,編輯模板RNA的RT供體RNA)的PBS與非PAM股上的區域(PBS靶向位點)結合。反轉錄模板序列包含待摻入到非PAM股的編輯。在一些實例中,反轉錄模板包含與PAM股的序列相似性。在一些實例中,反轉錄模板包含相對於PAM股的序列的編輯。在一些實施方式中,非PAM股經由鹼基配對結合RT供體RNA的PBS,並且反轉錄酶(例如,CRISPR核酸酶-反轉錄酶融合物)複製反轉錄模板序列。在股交換回到與互補基因組股的鹼基配對之後,編輯被摻入到靶核酸中。
在一些實施方式中,靶向非PAM股的編輯模板RNA從5’到3’包含以下組分:CRISPR核酸酶結合序列、DNA結合序列、反轉錄模板序列和PBS(參見例如, 5 6A 6B 8A 12A)。在一些實施方式中,靶向非PAM股的編輯模板RNA從5’到3’包含以下組分:反轉錄模板序列、PBS、CRISPR核酸酶結合序列和DNA結合序列(間隔子),或從5’到3’包含以下組分:反轉錄模板序列、PBS、連接子、CRISPR核酸酶結合序列和DNA結合序列( 7 12B)。
在一些實施方式中,CRISPR核酸酶結合序列與DNA結合序列相鄰。在一些實施方式中,CRISPR核酸酶結合序列係DNA結合序列的5’延伸( 5 6A 6B 8A 12A)。在一些實施方式中,CRISPR核酸酶結合序列與DNA結合序列和PBS相鄰。在一些實施方式中,CRISPR核酸酶結合序列係PBS的3’延伸( 7 12B)。在一些實施方式中,CRISPR核酸酶結合序列與II型CRISPR核酸酶結合。在一些實施方式中,CRISPR核酸酶結合序列與V型CRISPR核酸酶(例如,Cas12i多肽,如Cas12i1、Cas12i2、Cas12i3或Cas12i4多肽)結合。在一些實施方式中,CRISPR核酸酶結合序列與缺乏crRNA加工活性的CRISPR核酸酶結合。在一些實施方式中,CRISPR核酸酶結合序列係同向重複序列(例如,Cas9同向重複序列或Cas12i同向重複序列)。
在一些實施方式中,DNA結合序列與CRISPR核酸酶結合序列和PBS相鄰。在一些實施方式中,DNA結合序列係CRISPR核酸酶結合序列的3’延伸( 5 6A 6B 7 8A 12A 12B)。在一些實施方式中,DNA結合序列可以包含RNA序列、DNA序列或RNA/DNA雜合序列。在一些實施方式中,DNA結合序列的長度為約10個核苷酸至約50個核苷酸。在一些實施方式中,DNA結合序列的長度為約15個核苷酸至約35個核苷酸。
在一些實施方式中,PBS與反轉錄模板序列相鄰。在一些實施方式中,PBS係反轉錄模板序列的3’延伸( 5 6A 6B 7 8A 12A 12B)。在一些實施方式中,PBS與反轉錄模板序列和CRISPR核酸酶結合序列相鄰。在一些實施方式中,PBS的長度在約3個核苷酸和約200個核苷酸之間。在一些實施方式中,PBS的長度為約3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105或110個核苷酸。在一些實施方式中,DNA結合序列和PBS與靶核酸的同一條股(例如,非PAM股)結合。
在一些實施方式中,反轉錄模板序列與PBS和DNA結合序列相鄰。在一些實施方式中,反轉錄模板序列係PBS的5’延伸( 5 6A 6B 8A 12A)。在一些實施方式中,反轉錄模板序列係DNA靶向序列的3’延伸( 5 6A 6B 8A 12A)。在一些實施方式中,反轉錄模板序列係PBS的5’延伸( 7 12B)。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸至約300個核苷酸。在一些實施方式中,反轉錄模板序列的長度為約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115或120個核苷酸。
在一些實施方式中,當DNA結合序列和PBS與靶核酸結合時,靶向非PAM股的編輯模板RNA包含未配對的核苷酸環。參見 6A 6B 8A 12A。在一些實施方式中,靶向非PAM股的編輯模板RNA包含與PBS相鄰的環。參見 7 12B。在一些實施方式中,環包含反轉錄模板序列並且其後係PBS。在一些實施方式中,PBS包含與靶核酸的非PAM股的互補性。在一些實施方式中,環的序列包含與PAM股的序列相似性。在一些實施方式中,環包含相對於PAM股的序列的編輯。在一些實施方式中,編輯係取代、插入或缺失。在一些實施方式中,環包含髮夾。 D. PAM 股編輯
在一些實施方式中,本文提供了使用本文揭露的合適的基因編輯系統(例如, 1A 1B 、圖 2 3 4 10中描述的那些)將至少一個編輯引入到靶核酸(例如,目的基因組位點)的PAM股之方法。這樣的方法可以涉及使用靶向PAM股的編輯模板RNA,該編輯模板RNA可以包含 (a) CRISPR核酸酶結合序列,(b) DNA結合序列,和 (c) RT供體RNA( 1A 1B 、圖 2 10)。在一些實例中,靶向PAM股的組成物包含RNA指導物和RT供體RNA( 3 4)。在一些實例中,RT供體RNA包含PBS和反轉錄模板序列。
在一些實施方式中,描述了用於通過反轉錄模板序列的5’至3’轉錄將至少一個編輯引入到靶核酸的PAM股之方法和組成物。在一些實施方式中,描述了用於通過反轉錄模板序列的5’至3’轉錄將至少一個編輯引入到靶核酸的PAM股之方法和組成物。
在一些情況下,RT供體RNA(例如,編輯模板RNA的RT供體RNA)的PBS與PAM股結合。RT供體RNA的反轉錄模板序列包含待摻入PAM股的編輯。在一些實例中,反轉錄模板包含與非PAM股的序列相似性。在一些實施方式中,反轉錄模板包含相對於非PAM股的序列的編輯。在一些實施方式中,PAM股可以經由鹼基配對與RT供體RNA的PBS結合,並且反轉錄酶(例如,CRISPR核酸酶-反轉錄酶融合物)複製反轉錄模板序列。在股交換回到與互補基因組股的鹼基配對之後,編輯被摻入到靶核酸中。
在一些實施方式中,靶向PAM股的編輯模板RNA從5’到3’包含以下組分:CRISPR核酸酶結合序列、DNA結合序列、反轉錄模板序列和PBS( 1A 1B 10)。在一些實施方式中,靶向PAM股的編輯模板RNA從5’到3’包含以下組分:反轉錄模板序列、PBS、CRISPR核酸酶結合序列、DNA結合序列,或從5’到3’包含以下組分:反轉錄模板序列、PBS、連接子、CRISPR核酸酶結合序列和DNA結合序列( 2)。
在一些實施方式中,CRISPR核酸酶結合序列與DNA結合序列相鄰。在一些實施方式中,DNA結合序列係CRISPR核酸酶結合序列的3’延伸( 1A 1B 、圖 2 10)。在一些實施方式中,CRISPR核酸酶結合序列與DNA結合序列和PBS相鄰( 2)。在一些實施方式中,DNA結合序列係PBS的3’延伸( 2)。在一些實施方式中,CRISPR核酸酶結合序列與II型CRISPR核酸酶結合。在一些實施方式中,CRISPR核酸酶結合序列與V型CRISPR核酸酶(例如,Cas12i多肽,如Cas12i1、Cas12i2、Cas12i3或Cas12i4多肽)結合。在一些實施方式中,CRISPR核酸酶結合序列與缺乏crRNA加工活性的CRISPR核酸酶結合。在一些實施方式中,CRISPR核酸酶結合序列係同向重複序列(例如,Cas9同向重複序列或Cas12i同向重複序列)。
在一些實施方式中,DNA結合序列與CRISPR核酸酶結合序列相鄰。在一些實施方式中,DNA結合序列係CRISPR核酸酶結合序列的3’延伸( 1A 1B 、圖 2 10)。在一些實施方式中,DNA結合序列與CRISPR核酸酶結合序列和反轉錄模板序列相鄰。在一些實施方式中,反轉錄模板序列係DNA結合序列的3’延伸( 10)。在一些實施方式中,DNA結合序列係RNA序列、DNA序列或RNA/DNA雜合序列。在一些實施方式中,DNA結合序列的長度為約10個核苷酸至約50個核苷酸。在一些實施方式中,DNA結合序列的長度為約15個核苷酸至約35個核苷酸。在一些實施方式中,DNA結合序列係間隔子序列。
在一些實施方式中,PBS與反轉錄模板序列相鄰。在一些實施方式中,PBS係反轉錄模板序列的3’延伸( 1A 2 、圖 1B 10)。在一些實施方式中,PBS與CRISPR核酸酶結合序列相鄰。在一些實施方式中,CRISPR核酸酶結合序列係PBS的3’延伸( 2)。在一些實施方式中,PBS的長度在約3個核苷酸和約200個核苷酸之間。在一些實施方式中,PBS的長度為約3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105或110個核苷酸。在一些實施方式中,DNA結合序列和PBS與靶核酸的不同股結合(例如,DNA結合序列與靶股結合,而PBS與PAM股結合)。
在一些實施方式中,反轉錄模板序列與DNA結合序列相鄰。在一些實施方式中,反轉錄模板序列係DNA結合序列的3’延伸( 1A 1B 10)。在一些實施方式中,反轉錄模板序列與PBS相鄰。在一些實施方式中,反轉錄模板序列係PBS的5’延伸( 1A 1B 2)。在一些實施方式中,PBS係反轉錄模板序列的3’延伸( 10)。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸至約300個核苷酸。在一些實施方式中,反轉錄模板序列的長度為約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115或120個核苷酸。 E. 細胞中的基因編輯
在一些方面,本文提供了使用同樣如本文揭露的合適基因編輯系統在細胞中編輯目的基因組位點(例如,如本文揭露的靶基因)之方法。為了執行這種方法,可以將基因編輯系統遞送至或引入到細胞群。在一些情況下,可以收集包含所希望的基因編輯的細胞,並視需要對其進行體外培養和擴增。
本文所述之細胞可為多種細胞。在一些實施方式中,細胞係分離的細胞。在一些實施方式中,細胞在細胞培養物或兩種或更多種細胞類型的共培養物中。在一些實施方式中,細胞係離體的。在一些實施方式中,細胞獲得自活生物體,並維持在細胞培養物中。在一些實施方式中,細胞係單細胞生物體。
在一些實施方式中,細胞係原核細胞。在一些實施方式中,細胞係細菌細胞或源自細菌細胞。在一些實施方式中,細胞係古細菌細胞或來源於古細菌細胞。
在一些實施方式中,細胞係真核細胞。在一些實施方式中,細胞係植物細胞或源自植物細胞。在一些實施方式中,細胞係真菌細胞或源自真菌細胞。在一些實施方式中,細胞係動物細胞或源自動物細胞。在一些實施方式中,細胞係無脊椎動物細胞或源自無脊椎動物細胞。在一些實施方式中,細胞係脊椎動物細胞或源自脊椎動物細胞。在一些實施方式中,細胞係哺乳動物細胞或源自哺乳動物細胞。在一些實施方式中,細胞係人細胞。在一些實施方式中,細胞係斑馬魚細胞。在一些實施方式中,細胞係靈長類細胞。在一些實施方式中,細胞係齧齒動物細胞。在一些實施方式中,細胞係合成製備的,有時稱為人工細胞。
在一些實施方式中,細胞來源於細胞系。用於組織培養的多種多樣的細胞系係本領域已知的。細胞系之實例包括但不限於293T、MF7、K562、HeLa、CHO及其轉基因品種。細胞系可從熟悉該項技術者已知的多種來源獲得(例如,參見美國典型培養物保藏中心(ATCC)(維吉尼亞州馬納薩斯(Manassas, Va.)))。在一些實施方式中,細胞係永生或永生化細胞。在一些實施方式中,細胞係幹細胞,諸如全能幹細胞(例如,萬能)、富潛能幹細胞、多潛能幹細胞、寡潛能幹細胞或單潛能幹細胞。在一些實施方式中,細胞係誘導富潛能幹細胞(iPSC)或來源於iPSC。在一些實施方式中,細胞係間葉幹細胞。在一些實施方式中,細胞係胚幹細胞。在一些實施方式中,細胞係造血幹細胞。在一些實施方式中,細胞係分化細胞。例如,在一些實施方式中,分化細胞係肌肉細胞(例如,肌細胞)、脂肪細胞(例如,脂細胞(adipocyte))、骨細胞(bone cell)(例如,成骨細胞、骨細胞(osteocyte)、破骨細胞)、血球(例如,單核細胞、淋巴球、嗜中性球、嗜酸性球、嗜鹼性球、巨噬細胞、紅血球或血小板)、神經細胞(例如,神經元)、上皮細胞、免疫細胞(例如,淋巴球、嗜中性球、單核細胞或巨噬細胞)、肝臟細胞(例如,肝細胞)、成纖維細胞或性細胞。在一些實施方式中,細胞係終末分化細胞。例如,在一些實施方式中,終末分化細胞係神經元細胞、脂細胞、心肌細胞、骨骼肌細胞、表皮細胞或腸道細胞。在一些實施方式中,細胞係神經膠質細胞。在一些實施方式中,細胞係胰島細胞,包括α細胞、β細胞、δ細胞或腸親鉻細胞。在一些實施方式中,細胞係免疫細胞。在一些實施方式中,免疫細胞係T細胞。在一些實施方式中,免疫細胞係B細胞。在一些實施方式中,免疫細胞係自然殺手(NK)細胞。在一些實施方式中,免疫細胞係腫瘤浸潤淋巴球(TIL)。在一些實施方式中,細胞係哺乳動物細胞,例如人細胞或靈長類動物細胞或鼠類細胞。在一些實施方式中,鼠類細胞來源於野生型小鼠、免疫抑制小鼠或疾病特異性小鼠模型。在一些實施方式中,細胞係活組織、器官或生物體內的細胞。
在一些實施方式中,細胞係原代細胞。例如,原代細胞的培養物可以傳代0次、1次、2次、4次、5次、10次、15次或更多。在一些實施方式中,藉由任何已知方法從個體收穫原代細胞。例如,可藉由分離術、白血球分離術、密度梯度分離等收穫白血球。可藉由活組織檢查收穫來自諸如皮膚、肌肉、骨髓、脾、肝、胰臟、肺、腸、胃等組織的細胞。可以使用合適的溶液來分散或懸浮收穫的細胞。這樣的溶液通常可為平衡鹽溶液(例如生理鹽水,磷酸鹽緩衝鹽水(PBS),漢克平衡鹽溶液等),方便地補充有胎牛血清或其他自然發生的因子,與可接受的低濃度緩衝液結合。緩衝液可以包括HEPES、磷酸鹽緩衝液、乳酸緩衝液,等。細胞可以立即使用,也可以儲存(例如,藉由冷凍)。冷凍的細胞可以解凍並且能夠重複使用。細胞可以在DMSO、血清、培養基緩衝液(例如10% DMSO、50%血清、40%緩衝培養基)和/或其他一些這樣的用於在冷凍溫度下保存細胞的常用溶液中冷凍。
在其中將本文揭露的基因編輯系統引入到多個細胞的實施方式中,至少約0.5%的細胞包含所希望的編輯。在一些實施方式中,至少約1%的細胞包含所希望的編輯。在一些實施方式中,至少約2%的細胞包含所希望的編輯。在一些實施方式中,至少約3%的細胞包含所希望的編輯。在一些實施方式中,至少約4%的細胞包含所希望的編輯。在一些實施方式中,至少約5%的細胞包含所希望的編輯。在一些實施方式中,至少約10%的細胞包含所希望的編輯。在一些實施方式中,至少約20%的細胞包含所希望的編輯。在一些實施方式中,至少約30%的細胞包含所希望的編輯。在一些實施方式中,至少約40%的細胞包含所希望的編輯。在一些實施方式中,至少約50%的細胞包含所希望的編輯。
攜帶所希望的基因編輯(例如,藉由本文揭露的方法使用本文也揭露的任何基因編輯系統產生)的細胞也在本揭露之範圍內。在一些情況下,由如本文所述之CRISPR核酸酶、反轉錄酶和編輯模板RNA修飾的細胞可以用作製造生物分子的表現系統。例如,經修飾的細胞可以用於產生生物分子,例如蛋白質(例如,細胞介素、抗體、基於抗體的分子)、肽、脂質、碳水化合物、核酸、胺基酸和維生素。在其他實施方式中,經修飾的細胞可以用於產生病毒載體,例如慢病毒、腺病毒、腺相關病毒和溶瘤病毒載體。在一些實施方式中,經修飾的細胞可以用於細胞毒性研究。在一些實施方式中,經修飾的細胞可以用作疾病模型。在一些實施方式中,經修飾的細胞可以用於疫苗生產。在一些實施方式中,經修飾的細胞可以用於治療。例如,在一些實施方式中,經修飾的細胞可以用於細胞療法,例如輸血和移植。
在一些實施方式中,由如本文所述之CRISPR核酸酶、反轉錄酶和編輯模板RNA修飾的細胞可以用於建立包含經修飾的基因組序列的新細胞系。在一些實施方式中,本揭露的經修飾細胞係經修飾的幹細胞(例如,經修飾的全能/萬能幹細胞、經修飾的多潛能幹細胞、經修飾的富潛能幹細胞、經修飾的寡潛能幹細胞或經修飾的單潛能幹細胞),該等經修飾的幹細胞分化成一或多種細胞譜系,包含缺失經修飾的幹細胞。本揭露進一步提供了包含或由本揭露的經修飾的細胞產生的生物體(例如,動物、植物或真菌)。 F. 基因編輯系統向細胞中的遞送
在一些實施方式中,可以配製任何基因編輯系統或其組分,例如,包括載劑,如載劑和/或聚合物載劑,例如脂質體或脂質奈米顆粒,並藉由已知方法將其遞送至細胞(例如,原核、真核、植物、哺乳動物等)。此類方法包括但不限於轉染(例如,脂質介導的陽離子聚合物、磷酸鈣、樹狀聚合物);電穿孔或其他破壞膜的方法(例如,核轉染)、病毒遞送(例如,慢病毒、反轉錄病毒、腺病毒、AAV)、顯微注射、微粒轟擊(「基因槍」)、fugene、直接聲波載入、細胞擠壓、光轉染、原生質體融合、刺穿感染、磁轉染、胞泌體介導的轉移、脂質奈米顆粒介導的轉移、及其任何組合。
在一些實施方式中,該方法包括向細胞遞送一或多種核酸(例如,編碼CRISPR核酸酶、反轉錄酶、編輯模板RNA(例如,RNA指導物和RT供體RNA)等的核酸)、其一或多種轉錄物,和/或預先形成的核糖核蛋白。示例性細胞內遞送方法包括但不限於:病毒或病毒樣藥劑;基於化學的轉染方法,例如使用磷酸鈣、樹枝狀大分子、脂質體或陽離子聚合物(例如,DEAE-葡聚糖或聚乙烯亞胺)的轉染方法;非化學方法,例如顯微注射、電穿孔、細胞擠壓、聲孔效應、光轉染、刺穿感染、原生質體融合、細菌軛合、質體或轉座子的遞送;基於顆粒的方法,例如使用基因槍、磁轉染或磁輔助轉染、粒子轟擊;和雜合方法,例如核轉染。在一些實施方式中,本申請進一步提供了藉由此類方法產生的細胞,以及包含此類細胞的或由此類細胞產生的生物體(例如,動物、植物或真菌)。在一些實施方式中,本發明之組成物進一步與影響DNA修復或DNA修復機制的藥劑(例如,化合物、分子或生物分子)一起遞送。在一些實施方式中,本發明之組成物進一步與影響細胞週期的藥劑(例如,化合物、分子或生物分子)一起遞送。
在一些實施方式中,將包含CRISPR核酸酶或CRISPR核酸酶與反轉錄酶(例如,CRISPR核酸酶-反轉錄酶融合物)的第一組成物遞送至細胞。在一些實施方式中,將包含RNA指導物或RNA指導物與RT供體RNA(例如,編輯模板RNA)的第二組成物遞送至細胞。在一些實施方式中,在使第二組成物與細胞接觸之前,使第一組成物與細胞接觸。在一些實施方式中,在使第二組成物與細胞接觸的同時,使第一組成物與細胞接觸。在一些實施方式中,在使第二組成物與細胞接觸之後,使第一組成物與細胞接觸。在一些實施方式中,將第一組成物藉由第一遞送方法遞送,並且經第二組成物藉由第二遞送方法遞送。在一些實施方式中,第一遞送方法與第二遞送方法相同。例如,在一些實施方式中,將第一組成物和第二組成物經由病毒遞送進行遞送。在一些實施方式中,第一遞送方法不同於第二遞送方法。例如,在一些實施方式中,將第一組成物藉由病毒遞送進行遞送並且將第二組成物藉由脂質奈米顆粒介導的轉移進行遞送並且將第二組成物藉由病毒遞送進行遞送,或者將第一組成物藉由脂質奈米顆粒介導的轉移進行遞送並且將第二組成物藉由病毒遞送進行遞送。 IV. 治療性應用
使用如本文揭露的這樣的基因編輯系統產生的任何基因編輯系統或經修飾的細胞可以用於治療可能受益於藉由基因編輯系統引入或由經修飾的細胞攜帶的基因編輯的疾病。例如,該疾病可能是遺傳性疾病,並且基因編輯修復了與該遺傳性疾病相關的基因突變。可替代地,該疾病可能與基因的異常表現有關,並且基因編輯可挽救這種異常表現。
在一些實施方式中,本文提供了用於治療疾病之方法,該方法包括向需要治療的受試者(例如,人患者)投與本文揭露的任一基因編輯系統。可以將基因編輯系統遞送至需要基因編輯的特定組織或特定類型的細胞。基因編輯系統可以包含含有該等組分中的一或多種的LNP、編碼該等組分中的一或多種的一或多種載體(例如,病毒載體)或其組合。可以配製基因編輯系統的組分以形成藥物組成物,該藥物組成物可以進一步包含一或多種藥學上可接受的載劑。
在一些實施方式中,可以將使用本文揭露的任一基因編輯系統產生的經修飾細胞投與於需要治療的受試者(例如,人患者)。經修飾的細胞可以包含本文所述之取代、插入和/或缺失。在一些實例中,經修飾的細胞可以包括由CRISPR核酸酶、反轉錄酶多肽和編輯模板RNA(例如,RNA指導物和RT供體RNA)修飾的細胞系。在一些情況下,經修飾的細胞可為包含具有不同類型基因編輯的細胞的異質群體。可替代地,經修飾的細胞可以包含含有一種特定基因編輯的基本上同質的細胞群(例如,整個群體中至少80%的細胞)。在一些實例中,可以使細胞懸浮於合適的培養基中。
在一些實施方式中,本文提供了包含基因編輯系統或其組分或經修飾的細胞的組成物。這樣的組成物可為藥物組成物。可以將有用的藥物組成物以適合於口服、直腸、陰道、腸胃外、局部、肺、鼻內、病灶內、口腔、眼部、靜脈內、器官內或另一途徑投與的配製物製備、包裝或銷售。本揭露的藥物組成物可以作為單一單位劑量或作為多個單一單位劑量進行批量製備、包裝或出售。如本文所用,「單位劑量」係包含預定量的細胞的藥物組成物的離散量。細胞的量通常等於將投與於受試者的細胞的劑量或這種劑量的方便分數,例如像這種劑量的二分之一或三分之一。
適合於腸胃外投與的藥物組成物的配製物可以包含與藥學上可接受的載劑(例如,無菌水或無菌等滲鹽水)組合的活性劑(例如,基因編輯系統或其組分或經修飾的細胞)。這樣的配製物能以適合於推注投與或連續投與的形式來製備、包裝或出售。一些可注射配製物能以單位劑型來製備、包裝或出售,例如在安瓿或含有防腐劑的多劑量容器中。一些用於腸胃外投與的配製物包括但不限於懸浮液、溶液、油性或水性媒介物中的乳液、糊劑以及可植入的持續釋放或生物可降解配製物。該等配製物可以進一步包含一或多種另外的成分,包括但不限於懸浮劑、穩定劑或分散劑。
藥物組成物可以呈無菌可注射水性或油性懸浮液或溶液的形式。這種懸浮液或溶液可以根據已知技術來配製,並且除了細胞之外還可以包含其他成分,例如本文所述之分散劑、潤濕劑或懸浮劑。這種無菌可注射配製物可以使用無毒的腸胃外可接受的稀釋劑或溶劑(例如,水或鹽水)來製備。其他可接受的稀釋劑以及溶劑包括但不限於林格溶液、等滲氯化鈉溶液以及固定油諸如合成的甘油單酯或甘油二酯。其他有用的腸胃外投與的配製物包括以下配製物,該等配製物可以包含在脂質體配製物或作為生物可降解聚合物系統的組分的呈包裝形式的細胞。一些用於持續釋放或植入的組成物可以包含藥學上可接受的聚合物或疏水材料,例如乳液、離子交換樹脂、微溶聚合物或微溶鹽。 V. 套組及其用途
本揭露還提供了可用於例如執行本文所述方法的套組或系統。在一些實施方式中,套組或系統包括CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和反轉錄酶。在一些實施方式中,套組或系統包括編碼CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和反轉錄酶的多核苷酸,並且視需要該多核苷酸包含在載體中,例如,如本文所述。在一些實施方式中,套組或系統包括V型核酸酶-反轉錄酶融合多肽(例如,Cas12i-反轉錄酶融合多肽)。套組或系統還可以包括如本文所述之反轉錄酶和編輯模板RNA(例如,RNA指導物和RT供體RNA)。可以將本發明之套組或系統的RNA指導物和/或RT供體RNA設計為靶向目的序列。CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)、反轉錄酶和編輯模板RNA(例如,RNA指導物和RT供體RNA)可以包裝在套組或系統內的相同小瓶或其他容器中,或可以包裝在單獨的小瓶或其他容器中,其中的內容物可以在使用前混合。另外地,套組或系統可以視需要包括緩衝液和/或使用CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和反轉錄酶以及編輯模板RNA(例如,RNA指導物和RT供體RNA)的說明書。
在一些實施方式中,套組包含第一組成物,該第一組成物包含CRISPR核酸酶或CRISPR核酸酶與反轉錄酶(例如,CRISPR核酸酶-反轉錄酶融合物)。在一些實施方式中,套組包含第二組成物,該第二組成物包含RNA指導物或RNA指導物與RT供體RNA(例如,編輯模板RNA)。在一些實施方式中,第一組成物和第二組成物包裝在同一小瓶內。在一些實施方式中,第一組成物和第二組成物包裝在不同的小瓶中。
在一些實施方式中,套組可用於研究目的。例如,在一些實施方式中,套組可用於研究基因功能。
將本文引用的所有文獻和出版物藉由引用特此併入。 另外的實施方式
下文提供了另外的實施方式,該等實施方式也在本揭露之範圍內。
實施方式1:一種組成物,其包含: (a)   V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸,該V型CRISPR核酸酶多肽視需要是Cas12多肽; (b)   RNA指導物或編碼該RNA指導物的核酸,其中該RNA指導物包含V型核酸酶結合序列(例如,同向重複序列)和DNA結合序列(例如,間隔子序列); (c)    反轉錄酶多肽或編碼該反轉錄酶多肽的核酸;以及 (d)   包含引物結合的反轉錄供體RNA(RT供體RNA)
在實施方式1中,該V型CRISPR核酸酶可為Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)多肽。在一些實例中,該V型CRISPR核酸酶多肽係Cas12i多肽,該Cas12i多肽視需要包含Cas12i1多肽或變體Cas12i1多肽、Cas12i2多肽或變體Cas12i2多肽、Cas12i3多肽或變體Cas12i3多肽或Cas12i4多肽或變體Cas12i4多肽。
實施方式2:如實施方式1所述之組成物可以包含Cas12i多肽,該Cas12i多肽可為以下之一: (a)   Cas12i1多肽包含與SEQ ID NO: 8具有至少80%同一性、視需要與SEQ ID NO: 8具有至少95%同一性的胺基酸序列; (b)   Cas12i2多肽包含與SEQ ID NO: 2-7中任一項具有至少80%同一性、視需要與SEQ ID NO: 2-7中任一項具有至少95%同一性的胺基酸序列; (c)    Cas12i3多肽包含與SEQ ID NO: 11具有至少80%同一性、視需要與SEQ ID NO: 11具有至少95%同一性的胺基酸序列;以及 (d)   Cas12i4多肽包含與SEQ ID NO: 9具有至少80%同一性或與SEQ ID NO: 10具有至少80%同一性、視需要與SEQ ID NO: 9具有至少95%同一性或與SEQ ID NO: 10具有至少95%同一性的胺基酸序列。
在特定實例中,如實施方式2所述之組成物包含以下之一: (a)   Cas12i1多肽包含SEQ ID NO: 8所示的胺基酸序列; (b)   Cas12i2多肽包含SEQ ID NO: 2-7中任一項所示的胺基酸序列; (c)    Cas12i3多肽包含SEQ ID NO: 11所示的胺基酸序列;以及 (d)   Cas12i4多肽包含SEQ ID NO: 9或SEQ ID NO: 10所示的胺基酸序列。
本文揭露的如實施方式2所述之任一組成物可以包含具有降低的crRNA加工活性或缺乏crRNA加工活性的V型CRISPR核酸酶多肽。例如,該V型CRISPR核酸酶多肽係Cas12i2多肽,並且其中該Cas12i2多肽在位置H485或H486處包含取代。在一些情況下,該Cas12i2多肽與SEQ ID NO: 2-7中任一項具有至少80%同一性,並且其中該Cas12i2多肽在位置H485或H486處包含取代。在一些實例中,該Cas12i2多肽與SEQ ID NO: 2-7中任一項具有至少95%同一性,並且其中該Cas12i2多肽在位置H485或H486處包含取代。
本文揭露的如實施方式2所述之任一組成物可以包含V型CRISPR核酸酶多肽,該V型CRISPR核酸酶多肽包含以下中的至少一種:表位肽、核定位訊號和出核訊號。
在一些實例中,如實施方式2所述之組成物包含以下之一: (a)   Cas12i1多肽包含與SEQ ID NO: 8具有至少80%(例如,至少95%)同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 12-14中任一項具有至少90%同一性的核苷酸序列; (b)   Cas12i2多肽包含與SEQ ID NO: 2-7中任一項具有至少80%(例如,至少95%)同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 15-17中任一項具有至少90%同一性的核苷酸序列; (c)    Cas12i3多肽包含與SEQ ID NO: 11具有至少80%(例如,至少95%)同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 18-20中任一項具有至少90%同一性的核苷酸序列;以及 (d)   Cas12i4多肽包含與SEQ ID NO: 9或SEQ ID NO: 10具有至少80%(例如,至少95%)同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 21-24中任一項具有至少90%同一性的核苷酸序列。
在一些實例中,如實施方式2所述之組成物包含以下之一: (a)   Cas12i1多肽包含與SEQ ID NO: 8具有至少95%同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 12-14中任一項具有至少95%同一性的核苷酸序列; (b)   Cas12i2多肽包含與SEQ ID NO: 2-7中任一項具有至少95%同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 15-17中任一項具有至少95%同一性的核苷酸序列; (c)    Cas12i3多肽包含與SEQ ID NO: 11具有至少95%同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 18-20中任一項具有至少95%同一性的核苷酸序列;以及 (d)   Cas12i4多肽包含與SEQ ID NO: 9或SEQ ID NO: 10具有至少95%同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 21-24中任一項具有至少95%同一性的核苷酸序列。
實施方式3:本文揭露的如實施方式1或實施方式2所述之任一組成物的間隔子序列的長度為從約10個核苷酸至約50個核苷酸。在一些實例中,間隔子序列的長度為從約15個核苷酸至約35個核苷酸。在一些實例中,間隔子序列與靶核酸的靶序列基本上互補。在一些實例中,靶序列與原間隔子相鄰模體(PAM)序列相鄰。
實施方式4:如實施方式1、2或3所述之任一組成物可以包含V型核酸酶,該V型核酸酶係Cas12i多肽,並且其中該PAM序列包含如5’-NTTN-3’所示的序列,其中N係任何核苷酸。
實施方式5:在如任何前述實施方式所述之任一組成物中,該反轉錄酶多肽包含MMLV-RT、MMTV-RT、Marathon-RT或RTX反轉錄酶。
實施方式6:在如實施方式1-5中任一項所述之任一組成物中,該反轉錄酶多肽與該V型CRISPR核酸酶多肽融合。在一些實例中,該反轉錄酶多肽與該V型CRISPR核酸酶多肽的N-末端融合。在其他實例中,該反轉錄酶多肽與該V型CRISPR核酸酶多肽的C-末端融合。在又其他實例中,該反轉錄酶多肽插入該V型CRISPR核酸酶多肽的環內。
實施方式7:在如實施方式1-5中任一項所述之任一組成物中,該反轉錄酶多肽和該V型CRISPR核酸酶多肽通過白胺酸拉鍊、奈米抗體、抗體或捲曲螺旋結構域形成複合物。
實施方式8:在如實施方式1-7中任一項所述之任一組成物中,該RT供體RNA可以與該RNA指導物融合。在一些實例中,該RT供體RNA與該RNA指導物的5’末端融合。在其他實例中,該RT供體RNA與該RNA指導物的3’末端融合。在一些情況下,該RNA指導物的間隔子序列與該RT供體RNA中的反轉錄模板序列相鄰。可替代地,該RNA指導物的間隔子序列與該RT供體RNA中的PBS相鄰。在其他情況下,該RNA指導物的同向重複序列與該RT RNA供體中的反轉錄模板序列相鄰。可替代地,該RNA指導物的同向重複序列與該RT供體RNA中的PBS相鄰。
在一些實例中,該RT供體RNA-RNA指導物融合物多核苷酸可以進一步包含連接子。在一些情況下,該連接子位於該同向重複序列和該PBS之間。在其他情況下,該連接子位於該間隔子序列和該反轉錄模板序列之間。該連接子的長度可以在約1個核苷酸和約200個核苷酸之間。在一些實例中,該連接子包含髮夾。
實施方式9:在如實施方式1-8中任一項所述之任一組成物中,該PBS的長度可以在約3個核苷酸和約200個核苷酸之間。例如,該PBS的長度為約3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105或110個核苷酸。在一些情況下,該PBS與該非靶股(PAM股)的游離3’末端雜交(經由鹼基配對結合)。在其他情況下,該PBS與該靶股(非PAM股)的游離3’末端雜交。
實施方式10:在如實施方式1-9中任一項所述之任一組成物中,該反轉錄模板序列的長度在約10個核苷酸和約300個核苷酸之間。例如,該反轉錄模板序列的長度為約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115或120個核苷酸。
實施方式11:在如實施方式1-10中任一項所述之任一組成物中,該PBS與該靶核酸(其係雙股的)的靶股或非靶股具有基本互補性。例如,該PBS與該靶核酸的靶股或非靶股具有至少約75%的互補性。在其他實例中,該PBS與該靶核酸的靶股或非靶股具有至少約85%的互補性。在其他實例中,該PBS與該靶核酸的靶股或非靶股具有至少約95%的互補性。
實施方式12:在如實施方式1-11中任一項所述之任一組成物中,該反轉錄模板序列包含適配體。在一些情況下,該適配體募集該反轉錄酶多肽。
實施方式13:在如實施方式1-11中任一項所述之任一組成物中,該反轉錄模板例如在5’末端或3’末端包含修飾。在一些實例中,該修飾係化學修飾。在其他實例中,該修飾係包含二級結構的核酸序列。在特定實例中,該修飾係髮夾、假結、三鏈體結構、外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。在其他特定實例中,該修飾包含核酸酶結合序列(例如,一或多個同向重複序列)或核酸酶結合序列與DNA結合序列(間隔子)。
如實施方式1-13中任一項所述之任一組成物可以將編輯引入到該靶股或該非靶股中。在一些實例中,該編輯係取代、插入或缺失。在一些情況下,該編輯係1個核苷酸至約200個核苷酸的取代。在一些情況下,該編輯係1個核苷酸至約120個核苷酸的取代。在一些情況下,該編輯係1個核苷酸至約20個核苷酸的取代。在其他情況下,該編輯係1個核苷酸至約200個核苷酸的插入,例如,1個核苷酸至約120個核苷酸的插入,1個核苷酸至約20個核苷酸的插入。在一些實例中,該插入包含髮夾。在又其他情況下,該編輯係1個核苷酸至約100個核苷酸的缺失。例如,該編輯係1個核苷酸至約120個核苷酸的缺失,或1個核苷酸至約20個核苷酸的缺失。
在一些實例中,該編輯發生於該PAM序列的約200個核苷酸內。在一個實例中,該編輯發生於該PAM序列的約100個核苷酸內。在另一個實例中,該編輯發生於該PAM序列的約50個核苷酸內。在又另一個實例中,該編輯發生於該PAM序列的約30個核苷酸內。在仍另一個實例中,該編輯發生於該PAM序列的約20個核苷酸內。
在一些實例中,該編輯起始和/或結束於該PAM序列上游的約200個核苷酸內,例如,起始和/或結束於該PAM序列上游的約100個核苷酸內、起始和/或結束於該PAM序列上游的約50個核苷酸內、起始和/或結束於該PAM序列上游的約30個核苷酸內、起始和/或結束於該PAM序列上游的約20個核苷酸內、起始和/或結束於該PAM序列上游的約10個核苷酸內、起始和/或結束於該PAM序列上游的約5個核苷酸內或起始和/或結束於該PAM序列下游的約5個核苷酸內。
在其他實例中,該編輯起始和/或結束於該PAM序列下游的約10個核苷酸內,例如,起始和/或結束於該PAM序列下游的約25個核苷酸內。
在一些實例中,該編輯去除或改變PAM序列。在一些實例中,該編輯防止V型CRISPR核酸酶多肽重新靶向(例如,防止V型CRISPR核酸酶與靶序列結合)。
實施方式14:在如實施方式1-13所述之任一組成物中,該靶序列存在於細胞中。
實施方式15:如實施方式1-14所述之任一組成物可以被配製用於遞送至細胞。在一些實例中,該細胞係哺乳動物細胞,例如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
在一些實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、該RNA指導物或編碼該RNA指導物的核酸、該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸、以及該RT供體RNA在單一遞送媒介物中配製。
在其他實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、該RNA指導物或編碼該RNA指導物的核酸、該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸、以及該RT供體RNA在兩種或更多種遞送媒介物中配製。
在又其他實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、和該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在單一遞送媒介物中配製。
在一些實例中,該RNA指導物和該RT供體RNA在單一遞送媒介物中配製。在一些實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、和該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在第一遞送媒介物中配製,並且該RNA指導物和該RT供體RNA在第二遞送媒介物中配製。
實施方式16:在如實施方式1-15中任一項所述之任一組成物中,在適用的情況下,該V型CRISPR核酸酶多肽、反轉錄酶多肽、RNA指導物和/或RT供體RNA在一或多種載體(例如,一或多種表現載體)中編碼。
實施方式17:一種載體,其包含編碼如實施方式1-16中任一項所述之組成物的V型CRISPR核酸酶多肽、反轉錄酶多肽、RNA指導物和/或RT供體RNA的序列。
實施方式18:一種細胞,其包含如實施方式1-16中任一項所述之組成物或如實施方式17所述之載體。在一些實例中,該細胞係哺乳動物細胞,例如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
實施方式19:一種表現如實施方式17所述之載體之方法。
實施方式20:一種產生如實施方式1-17中任一項所述之組成物之方法。
實施方式21:一種遞送如實施方式1-16中任一項所述之組成物之方法。
在一些實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、該RNA指導物或編碼該RNA指導物的核酸、該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸、以及該RT供體RNA在單一遞送媒介物中遞送。
在其他實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、該RNA指導物或編碼該RNA指導物的核酸、該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸、以及該RT供體RNA在兩種或更多種遞送媒介物中遞送。
在又其他實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、和該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在單一遞送媒介物中遞送。
在一些情況下,該RNA指導物和該RT供體RNA在單一遞送媒介物中遞送。
在特定實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、和該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在第一遞送媒介物中遞送,並且該RNA指導物和該RT供體RNA在第二遞送媒介物中遞送。
實施方式22:一種將如實施方式1-16中任一項所述之組成物與靶核酸結合之方法。在一些實例中,該靶核酸存在於細胞中,例如哺乳動物細胞,如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
實施方式23:一種將編輯引入到靶核酸中之方法,該方法包括使該靶核酸與如實施方式1-16中任一項所述之組成物接觸。在一些實例中,該組成物將編輯引入到該靶核酸的靶股或非靶股中。在一些情況下,該編輯係取代、插入或缺失。
在特定實例中,該編輯係1個核苷酸至約200個核苷酸的取代,例如,1個核苷酸至約120個核苷酸的取代,或1個核苷酸至約20個核苷酸的取代。在其他特定實例中,該編輯係1個核苷酸至約200個核苷酸的插入,例如,1個核苷酸至約120個核苷酸的插入,或1個核苷酸至約20個核苷酸的插入。在一些情況下,該插入包含髮夾。在又其他特定實例中,該編輯係1個核苷酸至約100個核苷酸的缺失,例如,1個核苷酸至約120個核苷酸的缺失或1個核苷酸至約20個核苷酸的缺失。
在一些情況下,該編輯發生於該PAM序列的約200個核苷酸內,例如,發生於該PAM序列的約100個核苷酸內、發生於該PAM序列的約50個核苷酸內、發生於該PAM序列的約30個核苷酸內或發生於該PAM序列的約20個核苷酸內。
在一些情況下,該編輯起始和/或結束於該PAM序列上游的約200個核苷酸內,例如,起始和/或結束於該PAM序列上游的約100個核苷酸內、起始和/或結束於該PAM序列上游的約50個核苷酸內、起始和/或結束於該PAM序列上游的約30個核苷酸內、起始和/或結束於該PAM序列上游的約20個核苷酸內、起始和/或結束於該PAM序列上游的約10個核苷酸內或起始和/或結束於該PAM序列上游的約5個核苷酸內。
可替代地,該編輯起始和/或結束於該PAM序列下游的約25個核苷酸內,例如,起始和/或結束於該PAM序列下游的約10個核苷酸內或起始和/或結束於該PAM序列下游的約5個核苷酸內。
在一些實例中,該編輯去除或改變PAM序列。
實施方式24:一種編輯模板RNA,其包含: (a)   CRISPR核酸酶結合序列; (b)   與包含靶股和非靶股的靶核酸的靶序列互補的DNA結合序列,其中該靶序列與原間隔子相鄰模體(PAM)序列相鄰;以及 (c)    反轉錄供體RNA(RT供體RNA),其包含引物結合位點(PBS)和反轉錄模板序列,其中該PBS與相鄰於該靶序列的序列基本上互補,並且其中該反轉錄模板序列包含相對於該靶核酸的至少一個經編碼的編輯,並且 其中該DNA結合序列和該PBS與該靶核酸的同一條股結合。
實施方式25:在如實施方式24所述之編輯模板RNA中,該DNA結合序列和該PBS與該靶核酸的靶股(非PAM股)結合。
實施方式26:在如實施方式24所述之編輯模板RNA中,至少一個經編碼的編輯係相對於該靶核酸的非靶股(PAM股)。
實施方式27:如實施方式24-26中任一項所述之編輯模板RNA當與該靶核酸結合時包含未配對核苷酸區域。例如,該未配對核苷酸區域與該DNA結合序列相鄰。可替代地或另外地,該未配對核苷酸區域與該PBS相鄰。在一些情況下,該未配對核苷酸區域包含反轉錄模板序列。
實施方式28:在如實施方式24-27中任一項所述之任一編輯模板RNA中,該CRISPR核酸酶結合序列、PBS和反轉錄模板序列係RNA序列。
實施方式29:在如實施方式24-28中任一項所述之任一編輯模板RNA中,該CRISPR核酸酶結合序列與II型CRISPR核酸酶結合。
實施方式30:在如實施方式24-28中任一項所述之任一編輯模板RNA中,該CRISPR核酸酶結合序列與V型CRISPR核酸酶結合。在一些實例中,該CRISPR核酸酶結合序列與Cas12i多肽或變體Cas12i多肽結合。在一些情況下,該CRISPR核酸酶結合序列與多肽結合,該多肽與SEQ ID NO: 2-11中任一項具有至少80%同一性。在一個實例中,該CRISPR核酸酶結合序列與多肽結合,該多肽與SEQ ID NO: 2-11中任一項具有至少95%同一性。在另一個實例中,該CRISPR核酸酶結合序列與包含SEQ ID NO: 2-11中任一項的胺基酸序列的多肽結合。
實施方式31:在如實施方式24-30中任一項所述之任一編輯模板RNA中,該CRISPR核酸酶結合序列與具有降低的crRNA加工活性或缺乏crRNA加工活性的CRISPR核酸酶結合。
實施方式32:在如實施方式24-31中任一項所述之任一編輯模板RNA中,在適用的情況下,該CRISPR核酸酶結合序列係同向重複序列。在一些實例中,該CRISPR核酸酶結合序列係Cas9同向重複序列。在其他實例中,該CRISPR核酸酶結合序列係Cas12i同向重複序列。在一些情況下,該CRISPR核酸酶結合序列包含與SEQ ID NO: 12-24中任一項具有至少90%同一性的核苷酸序列。例如,該CRISPR核酸酶結合序列包含與SEQ ID NO: 12-24中任一項具有至少95%同一性的核苷酸序列。在一個實例中,該CRISPR核酸酶結合序列包含SEQ ID NO: 12-24中任一項所示的核苷酸序列。
實施方式33:在如實施方式24-32中任一項所述之任一編輯模板RNA中,該CRISPR核酸酶結合序列與該DNA結合序列相鄰。例如,該DNA結合序列係該CRISPR核酸酶結合序列的3’延伸。
實施方式34:在如實施方式24-33中任一項所述之任一編輯模板RNA中,該DNA結合序列係RNA序列、DNA序列或RNA/DNA雜合序列。
實施方式35,在如實施方式24-34中任一項所述之任一編輯模板RNA中,該DNA結合序列(例如,間隔子序列)的長度為約10個核苷酸至約50個核苷酸。在一些實例中,該DNA結合序列的長度為約15個核苷酸至約35個核苷酸。
實施方式36,在如實施方式24-35中任一項所述之任一編輯模板RNA中, 該DNA結合序列與該PBS相鄰。在一些實例中,該PBS係DNA結合序列的3’延伸。
實施方式37:在如實施方式24-36中任一項所述之任一編輯模板RNA中,該PBS的長度在約3個核苷酸和約200個核苷酸之間。例如,該PBS的長度為約3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105或110個核苷酸。
實施方式38:在如實施方式24-37中任一項所述之任一編輯模板RNA中,該PBS與該反轉錄模板序列相鄰。在一些實例中,該反轉錄模板序列係PBS的3’延伸。
實施方式39:在如實施方式24-38中任一項所述之任一編輯模板RNA中,該反轉錄模板序列的長度為約10個核苷酸至約300個核苷酸。在一些實例中,該反轉錄模板序列的長度為約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115或120個核苷酸。
實施方式40:如實施方式24-39中任一項所述之任一編輯模板RNA從5’至3’可以包含核酸酶結合序列、DNA結合序列、反轉錄模板和PBS。
實施方式41:如實施方式24-39中任一項所述之任一編輯模板RNA從5’至3’可以包含反轉錄模板、PBS、核酸酶結合序列和DNA結合序列。
實施方式42:在如實施方式24-41中任一項所述之任一編輯模板中,該PBS的3’末端包含修飾。
實施方式43:在如實施方式24-42中任一項所述之任一編輯模板RNA中,該反轉錄模板的5’末端包含修飾。
實施方式44:在如實施方式42或43所述之編輯模板RNA中,該修飾係化學修飾。
實施方式45:在如實施方式42或43所述之編輯模板RNA中,該修飾係包含二級結構的核酸序列。例如,該修飾係髮夾、假結、三鏈體結構、xrRNA、tRNA或截短的tRNA。
實施方式46:在如實施方式42或43所述之編輯模板RNA中,該修飾包含核酸酶結合序列或核酸酶結合序列與DNA結合序列。
實施方式47:如實施方式24-47中任一項所述之任一編輯模板RNA可以引起編輯,該編輯可為取代、插入或缺失。在一些實例中,該編輯係1個核苷酸至約200個核苷酸的取代,例如,1個核苷酸至約120個核苷酸的取代,或1個核苷酸至約20個核苷酸的取代。在其他實例中,該編輯係1個核苷酸至約200個核苷酸的插入,例如,1個核苷酸至約120個核苷酸的插入,或1個核苷酸至約20個核苷酸的插入。在一些情況下,該插入包含髮夾。在又其他實例中,該編輯係1個核苷酸至約100個核苷酸的缺失,例如,1個核苷酸至約120個核苷酸的缺失,或1個核苷酸至約20個核苷酸的缺失。
在一些實例中,該編輯在該PAM序列的約200個核苷酸內,例如,該PAM序列的約100個核苷酸內、該PAM序列的約50個核苷酸內、該PAM序列的約30個核苷酸內或該PAM序列的約20個核苷酸內。
在一些實例中,該編輯起始和/或結束於該PAM序列上游的約200個核苷酸內,例如,起始和/或結束於該PAM序列上游的約100個核苷酸內、起始和/或結束於該PAM序列上游的約50個核苷酸內、起始和/或結束於該PAM序列上游的約30個核苷酸內、起始和/或結束於該PAM序列上游的約20個核苷酸內、起始和/或結束於該PAM序列上游的約10個核苷酸內或起始和/或結束於該PAM序列上游的約5個核苷酸內。
在其他實例中,該編輯起始和/或結束於該PAM序列下游的約5個核苷酸內。在一個實例中,該編輯起始和/或結束於該PAM序列下游的約10個核苷酸內。在另一個實例中,該編輯起始和/或結束於該PAM序列下游的約25個核苷酸內。
在一些實例中,該編輯去除或改變PAM序列。可替代地或另外地,該編輯防止V型CRISPR核酸酶多肽重新靶向(例如,防止V型CRISPR核酸酶與靶序列結合)。
實施方式48:如實施方式24-47中任一項所述之編輯模板RNA存在於細胞中,例如哺乳動物細胞,如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
實施方式49:如實施方式24-47中任一項所述之編輯模板RNA被配製用於遞送至細胞,例如哺乳動物細胞,如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。在一些實例中,該編輯模板RNA與CRISPR核酸酶或編碼該CRISPR核酸酶的核酸在單一遞送媒介物中一起配製。在其他實例中,該編輯模板RNA與CRISPR核酸酶多肽或編碼該CRISPR核酸酶多肽的核酸和反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在單一遞送媒介物中一起配製。
實施方式50:在適用的情況下,如實施方式24-49中任一項所述之編輯模板RNA在載體中編碼。
實施方式51:一種載體,其包含編碼如實施方式24-50中任一項所述之編輯模板RNA的序列。
實施方式52:一種複合物,其包含如實施方式24-50中任一項所述之編輯模板RNA。在一些實例中,該複合物包含CRISPR核酸酶。在其他實例中,該複合物包含靶序列或靶核酸。在又其他實例中,該複合物包含CRISPR核酸酶和靶序列或靶核酸。
在一些實例中,該CRISPR核酸酶係切口酶。在其他實例中,該CRISPR核酸酶切割DNA雙股體的兩條股。在又其他實例中,該CRISPR核酸酶係平末端切割核酸酶。可替代地,該CRISPR核酸酶係交錯切割核酸酶。
實施方式53:一種細胞,其包含如實施方式24-52中任一項所述之編輯模板RNA、載體或複合物。在一些情況下,該細胞係哺乳動物細胞,例如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
實施方式54:一種表現如實施方式31所述之載體之方法。
實施方式55:一種產生如實施方式24-50中任一項所述之編輯模板RNA之方法。
實施方式56:一種遞送如實施方式24-50中任一項所述之編輯模板RNA之方法。在一些情況下,該編輯模板RNA與CRISPR核酸酶或編碼該CRISPR核酸酶的核酸在單一遞送媒介物中一起配製。在其他實例中,該編輯模板RNA與CRISPR核酸酶多肽或編碼該CRISPR核酸酶多肽的核酸和反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在單一遞送媒介物中一起配製。
實施方式57:一種將如實施方式24-50中任一項所述之編輯模板RNA與CRISPR核酸酶結合之方法。
實施方式58:一種將如實施方式24-50中任一項所述之編輯模板RNA與靶序列或靶核酸結合之方法。
實施方式59:一種將如實施方式24-50中任一項所述之編輯模板RNA與CRISPR核酸酶和靶序列或靶核酸結合之方法。
實施方式60:一種將編輯引入到靶核酸之方法,該方法包括使該靶核酸與如實施方式24-50中任一項所述之編輯模板RNA和CRISPR核酸酶接觸。在一些情況下,該CRISPR核酸酶係II型CRISPR核酸酶。在其他情況下,該CRISPR係V型CRISPR核酸酶。例如,該CRISPR核酸酶係Cas12i多肽或變體Cas12i多肽。在特定實例中,該CRISPR核酸酶係與SEQ ID NO: 2-11中任一項具有至少80%同一性、例如與SEQ ID NO: 2-11中任一項具有至少95%同一性的多肽。在一個實例中,該CRISPR核酸酶係包含SEQ ID NO: 2-11中任一項的胺基酸序列的多肽。
在一些實例中,該CRISPR核酸酶係包含降低的crRNA加工活性或缺乏crRNA加工活性的CRISPR核酸酶。
在一些實例中,該CRISPR核酸酶係切口酶。可替代地,該CRISPR核酸酶切割DNA雙股體的兩條股。在一些情況下,該CRISPR核酸酶係平末端切割核酸酶。可替代地,該CRISPR核酸酶係交錯切割核酸酶。
實施方式61:在如實施方式60所述之方法中,該編輯模板RNA將編輯引入到該靶核酸的靶股中。在一些實例中,該編輯係取代、插入或缺失。例如,該編輯可為1個核苷酸至約200個核苷酸的取代,例如,1個核苷酸至約120個核苷酸的取代,或1個核苷酸至約20個核苷酸的取代。可替代地,該編輯可為1個核苷酸至約200個核苷酸的插入,例如,1個核苷酸至約120個核苷酸的插入,或1個核苷酸至約20個核苷酸的插入。在一些情況下,該插入包含髮夾。在其他實例中,該編輯可為1個核苷酸至約100個核苷酸的缺失,例如,1個核苷酸至約120個核苷酸的缺失,或1個核苷酸至約20個核苷酸的缺失。
在一些實例中,該編輯在該PAM序列的約200個核苷酸內,例如,該PAM序列的約100個核苷酸內、該PAM序列的約50個核苷酸內、該PAM序列的約30個核苷酸內或該PAM序列的約20個核苷酸內。
在一些實例中,該編輯起始和/或結束於該PAM序列上游的約200個核苷酸內,例如,起始和/或結束於該PAM序列上游的約100個核苷酸內、起始和/或結束於該PAM序列上游的約50個核苷酸內、起始和/或結束於該PAM序列上游的約30個核苷酸內、起始和/或結束於該PAM序列上游的約20個核苷酸內、起始和/或結束於該PAM序列上游的約10個核苷酸內或起始和/或結束於該PAM序列上游的約5個核苷酸內。
在其他實例中,該編輯起始和/或結束於該PAM序列下游的約5個核苷酸內。在一個實例中,該編輯起始和/或結束於該PAM序列下游的約10個核苷酸內。在另一個實例中,該編輯起始和/或結束於該PAM序列下游的約25個核苷酸內。
在一些實例中,該編輯去除或改變PAM序列。可替代地或另外地,該編輯防止V型CRISPR核酸酶多肽重新靶向(例如,防止V型CRISPR核酸酶與靶序列結合)。
在一些實例中,該靶核酸存在於細胞中,例如哺乳動物細胞,如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。 一般技術
除非另有說明,否則本揭露之實踐將使用分子生物學(包括重組技術)、微生物學、細胞生物學、生物化學和免疫學的常規技術,其在本領域的技術範圍內。在文獻中充分解釋了這樣的技術,該等文獻係例如 Molecular Cloning: A Laboratory Manual[分子選殖:實驗室手冊], 第二版(Sambrook等人, 1989) Cold Spring Harbor Press [冷泉港出版社]; Oligonucleotide Synthesis[寡核苷酸合成](M. J. Gait編輯 1984); Methods in Molecular Biology[分子生物學方法], Humana Press [胡瑪納出版社]; Cell Biology: A Laboratory Notebook[細胞生物學:實驗室筆記本](J. E. Cellis編輯, 1989) Academic Press [學術出版社];Animal Cell Culture [動物細胞培養](R. I. Freshney編輯 1987);Introduction to Cell and Tissue Culture [細胞和組織培養介紹](J. P. Mather和P. E. Roberts, 1998)Plenum Press [普萊紐姆出版社];Cell and Tissue Culture: Laboratory Procedures [細胞和組織培養:實驗室程序](A. Doyle, J. B. Griffiths和D. G. Newell編輯 1993-8)J. Wiley and Sons [約翰·威利父子出版社];Methods in Enzymology [酶學方法](Academic Press, Inc. [學術出版公司]);Handbook of Experimental Immunology [實驗免疫學手冊](D. M. Weir和C. C. Blackwell編輯): Gene Transfer Vectors for Mammalian Cells [用於哺乳動物細胞的基因轉移載體](J. M. Miller和M. P. Calos編輯, 1987);Current Protocols in Molecular Biology [分子生物學現代方案](F. M. Ausubel等人編輯 1987);PCR: The Polymerase Chain Reaction [PCR:聚合酶鏈反應](Mullis等人編輯 1994);Current Protocols in Immunology [免疫學現代方法](J. E. Coligan等人編輯, 1991);Short Protocols in Molecular Biology [分子生物學中的短程式](Wiley and Son [約翰·威利父子出版社], 1999);Immunobiology [免疫生物學](C. A. Janeway和P. Travers, 1997);Antibodies [抗體](P. Finch, 1997);Antibodies: a practice approach [抗體:實用方法](D. Catty.編輯, IRL Press [IRL出版社], 1988-1989);Monoclonal antibodies: a practical approach [單株抗體:實用方法](P. Shepherd和C. Dean編輯, Oxford University Press [牛津大學出版社], 2000);Using antibodies: a laboratory manual [使用抗體:實驗室手冊](E. Harlow和D. Lane, Cold Spring Harbor Laboratory Press [冷泉港實驗室出版社], 1999);The Antibodies [抗體](M. Zanetti和J. D. Capra編輯 Harwood Academic Publishers [哈伍德學術出版社], 1995); DNA Cloning: A practical Approach[DNA選殖:實用方法], 第I和II卷(D.N. Glover編輯 1985); Nucleic Acid Hybridization[核酸雜交](B.D. Hames & S.J. Higgins編輯 (1985)); Transcription and Translation[轉錄和翻譯](B.D. Hames & S.J. Higgins編輯 (1984)); Animal Cell Culture[動物細胞培養](R.I. Freshney編輯 (1986)); Immobilized Cells and Enzymes[固定化細胞和酶](lRL Press [lRL出版社], (1986));以及B. Perbal, A practical Guide To Molecular Cloning[分子選殖的實踐指南] (1984);F.M. Ausubel等人 (編輯)。
在沒有進一步詳細描述的情況下,據信熟悉該項技術者基於以上描述可以最大程度地利用本發明。因此,以下特定實施方式應解釋為僅是說明性的,而不以任何方式限制本揭露的其餘部分。出於本文引用的目的或主題,將本文引用的所有出版物藉由引用併入。 實例
提供以下實例以進一步說明本發明之一些實施方式但並非旨在限制本發明之範圍;藉由它們的示例性性質將理解,可以可替代地使用熟悉該項技術者已知的其他程序、方法或技術。 實例 1 - 哺乳動物細胞中靶股的 RNA 模板化編輯
本實例描述了哺乳動物基因的靶股編輯。
將變體Cas12i2(SEQ ID NO: 4)與SEQ ID NO: 29的突變MMLV反轉錄酶的融合物選殖到pcda3.1主鏈(英傑公司(Invitrogen))中。表7中示出了變體Cas12i2的N-末端和C-末端RT融合物的構造。在水中製備用於表現與變體Cas12i2的RT融合物的質體的工作溶液(變體Cas12i2-RT融合工作溶液)。 [ 7] .CAS-RT 融合設計和序列
詳細描述 簡要描述 序列
Cas12i2變體(H485A) - NLS - 2xSGGS - XTEN(16aa) - 2xSGGS - mutMMLVRT- NLS C_MMLV_Cas12i2變體 MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTSKRPAATKKAGQAKKKKSGGSSGGSSGSETPGTSESATPESSGGSSGGSTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPMKRTADGSEFESPKKKRKV(SEQ ID NO: 25)
NLS - mutMMLVRT- 2xSGGS - XTEN(16aa) - 2xSGGS - Cas12i2變體(H485A) - NLS N_MMLV_Cas12i2變體 MKRTADGSEFESPKKKRKVTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPSGGSSGGSSGSETPGTSESATPESSGGSSGGSMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTSKRPAATKKAGQAKKKK(SEQ ID NO: 26)
MMLV MMLV MTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP(SEQ ID NO: 29)
測試了各種RNA指導物-RT供體RNA融合物構造,如表8所示和 8A所描繪的。將反轉錄模板序列和PBS與RNA指導物的3’末端融合。反轉錄模板序列設計用於將取代、插入、缺失或髮夾引入到AAVS1_T7靶標或VEGFA_T5靶標。RNA指導物-RT供體RNA融合物的序列示出於表9中並且部分描繪於 8B中。在表9和 8B中,「S」係指取代,「I」係指插入,「D」係指缺失,並且「H」係指髮夾,並且括弧內為PBS長度。僅用作對照的RNA指導物的序列示出於表10中。將RNA指導物-RT供體RNA融合物或RNA指導物選殖到具有U6啟動子的質體主鏈中並進行大量製備。在水中製備表現每種RNA指導物的質體/RT供體RNA質體(或RNA指導物)的工作溶液(編輯模板RNA工作溶液)。 [ 8] .RNA 指導物 -RT 供體 RNA 融合物設計 .
構造 核酸酶 描述
DR - 間隔子 - 反轉錄模板序列 - PBS Cas12i2變體 反轉錄模板序列:34個核苷酸 PBS:13、30或60個核苷酸 髮夾:視需要的
DR - 間隔子 Cas12i2變體 對照(無RT供體RNA)
[ 9] .RNA 指導物 -RT 供體融合序列 .
靶標 Cas-RT融合物 RNA指導物-RT供體RNA描述 RNA指導物-RT供體RNA序列
AAVS1_T6 GTAGCCTCTCCCGCTCTGGT (SEQ ID NO: 30) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGACAUUCUUUGUAGCCUCUCCCCGAGUGGUUCAGGGCCCAGCUAGGGAUCCAGAUCUGGGUGAUUUAGGCUCCCUCUGUCUGGAUCAGUCCUCC(SEQ ID NO: 40)
AAVS1_T6 (SEQ ID NO: 30) N_MMLV_變體Cas12i2 或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGACAUUCUUUGUAGCCUCUCCCCGAGUGGUUCAGGGCCCAGCUAGGGAUCCAGAUCUGGGUGAU(SEQ ID NO: 41)
AAVS1_T6 (SEQ ID NO: 30) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(H) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGCACCCCCAUAAGGGGGGACAUUCUUUGUAGCCUCUCCCCGAGUGGUUCAGGGCCCAGCUAGGG(SEQ ID NO: 42)
AAVS1_T6 (SEQ ID NO: 30) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGACAUUCUUUGUAGCCUCUCCCCGAGUGGUUCAGGGCCCAGCUAGGG(SEQ ID NO: 43)
AAVS1_T6 (SEQ ID NO: 30) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(I) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGACAUUCUUUGUAGCCUCUCCCAGCGGCUCUGGUUCAGGGCCCAGCUAGGG(SEQ ID NO: 44)
AAVS1_T6 (SEQ ID NO: 30) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(D) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGACAUUCUUUGUAGCCUCUCCCUGGUUCAGGGCCCAGCUAGGG(SEQ ID NO: 45)  
AAVS1_T7 GGGAAGTGGTTGGTCAGCAT (SEQ ID NO: 32) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCGAGGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGA(SEQ ID NO: 54)
AAVS1_T7 (SEQ ID NO: 32) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCGAGGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUU(SEQ ID NO: 55)
AAVS1_T7 (SEQ ID NO: 32) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(H) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUGCACCCCCAUAAGGGGGCAGCUACUUUGGGAAGUGGUUGCGAGGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 56)
AAVS1_T7 (SEQ ID NO: 32) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCGAGGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 57)
AAVS1_T7 (SEQ ID NO: 32) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(I) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGAGCGGUCAGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 58)
AAVS1_T7 (SEQ ID NO: 32) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(D) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 59)
EMX1_T6 GAGCCAGTGTTGCTAGTCAA (SEQ ID NO: 34) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGCGAGUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGAC(SEQ ID NO: 68)
EMX1_T6 (SEQ ID NO: 34) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGCGAGUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCA(SEQ ID NO: 69)
EMX1_T6 (SEQ ID NO: 34) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(H) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAGCACCCCCAUAAGGGGGUUCCUUCUUUGAGCCAGUGUUGCGAGUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 70)
EMX1_T6 (SEQ ID NO: 34) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGCGAGUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 71)
EMX1_T6 (SEQ ID NO: 34) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(I) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGAGCGCUAGUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 72)
EMX1_T6 (SEQ ID NO: 34) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(D) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 73)
VEGFA_T2 AATCCTCCACCAGTCATGGT (SEQ ID NO: 36) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUUUAAUCCUCCACCACGAGUGGUGACAACCCCAAGCAGCCCACACAUUUUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUG(SEQ ID NO: 81)
VEGFA_T2 (SEQ ID NO: 36) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUUUAAUCCUCCACCACGAGUGGUGACAACCCCAAGCAGCCCACACAUUUUCAAGUGC(SEQ ID NO: 82)
VEGFA_T2 (SEQ ID NO: 36) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(H) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUGCACCCCCAUAAGGGGGAGAUACCUUUAAUCCUCCACCACGAGUGGUGACAACCCCAAGCAGCC(SEQ ID NO: 83)
VEGFA_T2 (SEQ ID NO: 36) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUUUAAUCCUCCACCACGAGUGGUGACAACCCCAAGCAGCC(SEQ ID NO: 84)
VEGFA_T2 (SEQ ID NO: 36) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(I) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUUUAAUCCUCCACCAAGCGGUCAUGGUGACAACCCCAAGCAGCC(SEQ ID NO: 85)
VEGFA_T2 (SEQ ID NO: 36) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(D) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUUUAAUCCUCCACCAUGGUGACAACCCCAAGCAGCC(SEQ ID NO: 86)
VEGFA_T5 TTAAACTCTCCATGGACCAG (SEQ ID NO: 38) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUUUUAAACUCUCCACGAGCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGA(SEQ ID NO: 95)  
VEGFA_T5 (SEQ ID NO: 38) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUUUUAAACUCUCCACGAGCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAA(SEQ ID NO: 96)  
VEGFA_T5 (SEQ ID NO: 38) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(H) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGGCACCCCCAUAAGGGGGAAAAGACUUUUUAAACUCUCCACGAGCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 97)
VEGFA_T5 (SEQ ID NO: 38) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUGUUUAAACUCUCCACGAGCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 98)
VEGFA_T5 (SEQ ID NO: 38) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(I) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUGUUUAAACUCUCCAAGCGUGGACCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 99)
VEGFA_T5 (SEQ ID NO: 38) N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(D) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUGUUUAAACUCUCCACCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 100)
[ 10] .RNA 指導物對照序列 .
靶標 Cas或Cas-RT融合物 RNA指導序列
AAVS1_T6 變體Cas12i2,N_MMLV_變體Cas12i2,和C_MMLV_變體Cas12i2 AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGU(SEQ ID NO: 110)
AAVS1_T7 Cas12i2變體,N_MMLV_Cas12i2變體,和C_MMLV_Cas12i2變體 AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 112)
EMX1-T6 變體Cas12i2,N_MMLV_變體Cas12i2,和C_MMLV_變體Cas12i2 AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 114)
VEGFA_T2 變體Cas12i2,N_MMLV_變體Cas12i2,和C_MMLV_變體Cas12i2 AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 116)
VEGFA_T5 Cas12i2變體,N_MMLV_Cas12i2變體,和C_MMLV_Cas12i2變體 AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 118)
在轉染前大約16小時,將在DMEM/10%FBS+青黴素/鏈黴素中的25,000個HEK293T細胞鋪板至96孔板的每個孔中。在轉染的當天,細胞係70%-90%匯合的。對於待轉染的每個孔,製備Lipofectamine™ 2000(賽默飛世爾公司(Themo Fisher))和Opti-MEM™培養基(賽默飛世爾公司)的混合物,然後在室溫下孵育5-20分鐘(溶液1)。孵育後,將Lipofectamine™:OptiMEM™混合物添加到含有變體Cas12i2-RT融合物工作溶液、RNA工作溶液和OptiMEM™培養基的單獨混合物中(溶液2)。將溶液1和溶液2混合物藉由向上和向下吸移進行混合,且然後在室溫下孵育25分鐘。孵育後,將溶液1和溶液2混合物逐滴添加到含有細胞的96孔板的每個孔中。轉染後72小時,藉由向每個孔的中心添加TrypLE™(賽默飛世爾公司)對細胞進行胰蛋白酶化並孵育大約5分鐘。然後將生長培養基添加到每個孔中並且混合以重懸細胞。然後將細胞以400 g旋轉沈降10分鐘,並且棄去上清液。將QuickExtract™緩衝液(盧西根公司(Lucigen))添加至原始細胞懸浮液體積的量的1/5。將細胞在65°C下孵育15分鐘,在68°C下孵育15分鐘,並且在98°C下孵育10分鐘。
藉由兩輪PCR製備用於下一代定序的樣本。使用第一輪(PCR1)來擴增根據靶標的特定基因組區域。藉由柱純化對PCR1產物進行純化。進行第2輪PCR(PCR2)以添加依諾米那銜接子和索引。然後將反應物池化並且藉由柱純化進行純化。用150次循環NextSeq v2.5中等或高輸出套組進行定序運行。
9A 9B示出了變體Cas12i2對AAVS1_T6的活性, 9C 9D示出了變體Cas12i2對AAVS1_T7的活性, 9E 9F示出了變體Cas12i2對EMX1_T6的活性, 9G 9H示出了變體Cas12i2對VEGFA_T2的活性,以及 9I 9J示出了變體Cas12i2對VEGFA_T5的活性。編輯比率(包含所希望編輯的讀段相對於讀段總數的百分比)示出於y軸上,總編輯以淺灰色示出,而經編碼的編輯以深灰色示出。顯示的數據係兩個生物重複的平均值,各自具有三個技術重複。如 9A 、圖 9C 9E 9G 9I所示,在靶向AAVS1_T6、AAVS1_T7、EMX1_T6、VEGFA_T2或VEGFA_T5的RNA指導物的存在的情況下,變體Cas12i2和變體Cas12i2-RT融合物係活性核酸酶。
9B 、圖 9D 9F 9H 9J所示,在RNA指導物-RT供體RNA融合物序列存在的情況下,變體Cas12i2-RT融合物能夠將經編碼的取代、插入和缺失引入到AAVS1_T6、AAVS1_T7、EMX1_T6、VEGFA_T2或VEGFA_T5。PBS長度為13、30和60個核苷酸的情況下觀察到活性。C-末端MMLV RT融合物的編輯超過了與變體Cas12i2的N-末端MMLV RT融合物的編輯。用變體Cas12i2進行編輯的範圍為約1%-5%。
本實例示出了使用編輯模板RNA和Cas12i2-RT融合物將特定編輯摻入到所選的哺乳動物基因組位點。 實例 2 - 使用末端保護的編輯模板 RNA 編輯哺乳動物細胞中的靶股
本實例描述了哺乳動物基因的靶股編輯。
將SEQ ID NO: 4的變體Cas12i2和SEQ ID NO: 25的變體Cas12i2-RT融合物各自選殖到pcda3.1主鏈(英傑公司)中。在水中製備用於表現與變體Cas12i2的RT融合物的質體的工作溶液(變體Cas12i2-RT融合工作溶液)。
測試了各種RNA指導物-RT供體RNA融合物構造,如表11所示以及 12A 12B所描繪的。將反轉錄模板序列和PBS與RNA指導物的5’末端或3’末端融合。在5’或3’末端添加另外的DR-間隔子序列。用於末端保護的間隔子序列係非人靶向的(即,它不靶向人基因組中的任何序列)。RNA指導物-RT供體RNA融合物的序列示出於表12中;在RT供體中編碼的所希望的編輯以小寫字母示出。僅用作對照的RNA指導物的序列示出於表13中。將RNA指導物-RT供體RNA融合物或RNA指導物選殖到具有U6啟動子的質體主鏈中並進行大量製備。在水中製備表現RNA指導物的每種質體/RT供體RNA質體(或RNA指導物)的工作溶液(編輯模板RNA工作溶液)。 [ 11] .RNA 指導物 -RT 供體 RNA 融合物設計
構造 描述
DR - 間隔子 - 反轉錄模板序列 - PBS 反轉錄模板序列:34個核苷酸 PBS:13、30或60個核苷酸
DR - 間隔子 - 反轉錄模板序列 - PBS - 末端保護 反轉錄模板序列:34個核苷酸 PBS:13、30或60個核苷酸 末端保護:DR-間隔子(非人)
反轉錄模板序列 - PBS - DR - 間隔子 反轉錄模板序列:34個核苷酸 PBS:13、30或60個核苷酸
末端保護- 反轉錄模板序列 - PBS - DR - 間隔子 末端保護:DR-間隔子(非人) 反轉錄模板序列:34或40個核苷酸 PBS:13、30或60個核苷酸
DR - 間隔子 對照(無RT供體RNA)
[ 12] .RNA 指導物 -RT 供體融合序列
靶標 RNA指導物-RT供體RNA描述 RNA指導物-RT供體RNA序列
AAVS1_T7 GGGAAGTGGTTGGTCAGCAT (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 123)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUU(SEQ ID NO: 124)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGA(SEQ ID NO: 125)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 126)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 127)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGAAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 128)
AAVS1_T7 (SEQ ID NO: 32) 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 CAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 129)
AAVS1_T7 (SEQ ID NO: 32) 反轉錄模板序列(34 nt) - PBS(30 nt) -核酸酶結合序列 - DNA結合序列 CAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 130)
AAVS1_T7 (SEQ ID NO: 32) 反轉錄模板序列(34 nt) - PBS(60 nt) -核酸酶結合序列 - DNA結合序列 CAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGAAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 131)
AAVS1_T7 (SEQ ID NO: 32) 末端保護 - 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 132)
AAVS1_T7 (SEQ ID NO: 32) 末端保護 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 133)
AAVS1_T7 (SEQ ID NO: 32) 末端保護 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGAAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 134)
AAVS1_T7 (SEQ ID NO: 32) 末端保護 - 反轉錄模板序列(40 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUGAUUCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 135)
AAVS1_T7 (SEQ ID NO: 32) 末端保護 - 反轉錄模板序列(40 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUGAUUCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 136)
AAVS1_T7 (SEQ ID NO: 32) 末端保護 - 反轉錄模板序列(40 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUGAUUCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGAAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 137)
EMX1_T6 GAGCCAGTGTTGCTAGTCAA (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 138)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCA(SEQ ID NO: 139)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGAC(SEQ ID NO: 140)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 141)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 142)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGACAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 143)
EMX1_T6 (SEQ ID NO: 34) 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 UUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 144)
EMX1_T6 (SEQ ID NO: 34) 反轉錄模板序列(34 nt) - PBS(30 nt) -核酸酶結合序列 - DNA結合序列 UUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 145)
EMX1_T6 (SEQ ID NO: 34) 反轉錄模板序列(34 nt) - PBS(60 nt) -核酸酶結合序列 - DNA結合序列 UUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGACAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 146)
EMX1_T6 (SEQ ID NO: 34) 末端保護 - 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 147)
EMX1_T6 (SEQ ID NO: 34) 末端保護 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 148)
EMX1_T6 (SEQ ID NO: 34) 末端保護 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGACAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 149)
EMX1_T6 (SEQ ID NO: 34) 末端保護 - 反轉錄模板序列(40 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAGCUUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 150)
EMX1_T6 (SEQ ID NO: 34) 末端保護 - 反轉錄模板序列(40 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAGCUUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 151)
EMX1_T6 (SEQ ID NO: 34) 末端保護 - 反轉錄模板序列(40 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAGCUUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGACAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 152)
VEGFA_T2 AATCCTCCACCAGTCATGGT (SEQ ID NO: 36) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCC(SEQ ID NO: 153)
VEGFA_T2 (SEQ ID NO: 36) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGC(SEQ ID NO: 154)
VEGFA_T2 (SEQ ID NO: 36) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUG(SEQ ID NO: 155)
VEGFA_T2 (SEQ ID NO: 36) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 156)
VEGFA_T2 (SEQ ID NO: 36) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 157)
VEGFA_T2 (SEQ ID NO: 36) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUGAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 158)
VEGFA_T2 (SEQ ID NO: 36) 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 AGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 159)
VEGFA_T2 (SEQ ID NO: 36) 反轉錄模板序列(34 nt) - PBS(30 nt) -核酸酶結合序列 - DNA結合序列 AGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 160)
VEGFA_T2 (SEQ ID NO: 36) 反轉錄模板序列(34 nt) - PBS(60 nt) -核酸酶結合序列 - DNA結合序列 AGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUGAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 161)
VEGFA_T2 (SEQ ID NO: 36) 末端保護 - 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 162)
VEGFA_T2 (SEQ ID NO: 36) 末端保護 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 163)
VEGFA_T2 (SEQ ID NO: 36) 末端保護 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUGAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 164)
VEGFA_T2 (SEQ ID NO: 36) 末端保護 - 反轉錄模板序列(40 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAUACUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 165)
VEGFA_T2 (SEQ ID NO: 36) 末端保護 - 反轉錄模板序列(40 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAUACUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 166)
VEGFA_T2 (SEQ ID NO: 36) 末端保護 - 反轉錄模板序列(40 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAUACUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUGAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 167)
VEGFA_T5 TTAAACTCTCCATGGACCAG (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 168)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAA(SEQ ID NO: 169)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGA(SEQ ID NO: 170)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 171)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 172)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 末端保護 AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGAAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 173)
VEGFA_T5 (SEQ ID NO: 38) 反轉錄模板序列(34 nt) - PBS(13 nt) - 核酸酶結合序列 - DNA結合序列 AAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 174)
VEGFA_T5 (SEQ ID NO: 38) 反轉錄模板序列(34 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 AAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 175)
VEGFA_T5 (SEQ ID NO: 38) 反轉錄模板序列(34 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 AAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 176)
VEGFA_T5 (SEQ ID NO: 38) 末端保護 - 反轉錄模板序列(34 nt) - PBS(13 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 177)
VEGFA_T5 (SEQ ID NO: 38) 末端保護 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 178)
VEGFA_T5 (SEQ ID NO: 38) 末端保護 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 179)
VEGFA_T5 (SEQ ID NO: 38) 末端保護 - 反轉錄模板序列(40 nt) - PBS(13 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAACACCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 180)
VEGFA_T5 (SEQ ID NO: 38) 末端保護 - 反轉錄模板序列(40 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAACACCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 181)
VEGFA_T5 (SEQ ID NO: 38) 末端保護 - 反轉錄模板序列(40 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAACACCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 182)
[ 13] .RNA 指導物對照序列
靶標 RNA指導序列
AAVS1_T7 (SEQ ID NO: 32) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 112)
EMX1-T6 (SEQ ID NO: 34) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 114)
VEGFA_T2 (SEQ ID NO: 36) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 116)
VEGFA_T5 (SEQ ID NO: 38) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 118)
轉染前大約16小時,將DMEM/10%FBS+青黴素/鏈黴素中的25,000個HEK293T細胞
鋪板到96孔板的每個孔中。在轉染的當天,細胞係70%-90%匯合的。對於待轉染的每個孔,製備Lipofectamine™ 2000(賽默飛世爾公司)和Opti-MEM™(賽默飛世爾公司)的混合物,然後在室溫下孵育5-20分鐘(溶液1)。孵育後,將Lipofectamine™:OptiMEM™混合物添加到含有變體Cas12i2-RT融合物工作溶液、RNA工作溶液和OptiMEM™培養基的單獨混合物中(溶液2)。將溶液1和溶液2混合物藉由向上和向下吸移進行混合,且然後在室溫下孵育25分鐘。孵育後,將溶液1和溶液2混合物逐滴添加到含有細胞的96孔板的每個孔中。轉染後72小時,藉由向每個孔的中心添加TrypLE™(賽默飛世爾公司)對細胞進行胰蛋白酶化並孵育大約5分鐘。然後將生長培養基添加到每個孔中並且混合以重懸細胞。然後將細胞以400 g旋轉沈降10分鐘,並且棄去上清液。將QuickExtract™緩衝液(盧西根公司(Lucigen))添加至原始細胞懸浮液體積的量的1/5。將細胞在65°C下孵育15分鐘,在68°C下孵育15分鐘,並且在98°C下孵育10分鐘。
藉由兩輪PCR製備用於下一代定序的樣本。使用第一輪(PCR1)來擴增根據靶標的特定基因組區域。藉由柱純化對PCR1產物進行純化。進行第2輪PCR(PCR2)以添加依諾米那銜接子和索引。然後將反應物池化並且藉由柱純化進行純化。用150次循環NextSeq v2.5(依諾米那公司(Illumina))中等或高輸出套組進行定序運行。
13A示出了對AAVS1_T7的活性, 13B示出了對EMX1_T6的活性, 13C示出了對VEGFA_T2的活性,以及 13D示出了對VEGFA_T5的活性。讀段百分比示出於y軸上。數據係三個技術重複的平均值。
13A 13B 13C 13D所示,在靶向AAVS1_T7、EMX1_T6、VEGFA_T2或VEGFA_T5(參見gRNA樣本)的RNA指導物存在的情況下,SEQ ID NO: 4的變體Cas12i2和SEQ ID NO: 25的變體Cas12i2-RT融合物係活性核酸酶。僅在RT(SEQ ID NO: 25的變體Cas12i2-RT融合物)存在下才觀察到所希望的編輯。在SEQ ID NO: 25的變體Cas12i2-RT融合物的情況下對於測試的編輯模板RNA中的每一種,觀察到插入缺失和經編碼的編輯。與沒有末端保護的5’延伸編輯模板RNA(反轉錄模板序列 - PBS -核酸酶結合序列 - DNA結合序列)相比,具有末端保護的5’延伸編輯模板RNA(末端保護- 反轉錄模板序列 - PBS -核酸酶結合序列 - DNA結合序列)展示出具有所希望編輯的更多數量的讀段。
本實例示出了使用編輯模板RNA和Cas12i2-RT融合物的多種構造將特定編輯摻入到所選的哺乳動物基因組位點。 實例 3 - Cas12i2 的體外切割模式的確定
在本實例中,確定了具有RNA指導物的變體Cas12i2的體外切割模式。確定Cas12i2在雙股DNA靶標上產生的切割位點使得設計編輯模板RNA的PBS組分成為可能。
用於確定切割模式的測定的示意圖示出於 14A- 14C中。首先設計了含有靶序列的寡核苷酸用於切割位點分析。寡核苷酸包含在靶標兩端具有12個核苷酸側翼序列的靶序列、內部條碼和允許靶向擴增的引發位點( 14A 。如 14B所示,將所有切割產物分成兩半,其中一半用綠豆核酸酶(MBN)處理,綠豆核酸酶使5’和3’突出端平端化(平端化處理),而對另一半反應物進行末端修復(部分NEBNext DNA文庫製備,新英格蘭生物實驗室(New England Biolabs)),其中5’突出端被填充(填充處理)。然後對這兩半進行NGS文庫製備和半靶向擴增。已示出V型CRISPR核酸酶產生交錯切割,其中5’突出端如灰色箭頭所示。該等切割位點藉由填充處理被捕獲以填充任何5’突出端。因此,該等產物的5’和3’定序表明靶股和非靶股上的切割位點。近期用Cpf1開展的工作指示了另外的切割位點,特別是在藉由填充方法未捕獲的非靶股上。為了捕獲該等切割位點,平端化方法導致所有5’和3’突出端的平端化。因此,平端化方法中的5’切割產物表示非靶股上的任何另外的切割位點,而3’切割產物表示靶股上的另外切割位點。NEBNext銜接子連接後的半靶向擴增允許5’和3’切割產物的特異性擴增;池化擴增的產物並藉由NGS分析( 14C)。
分別使用經IR800和IR700標記的正向和反向引物藉由PCR擴增產生DNA底物,從而產生具有經IR800標記的靶股和經IR700標記的非靶股的dsDNA靶標。使用CleanNGS SPRI珠以珠比PCR產物為1.8倍比率對PCR產物進行清理。將純化的Cas12i2與crRNA在NEBuffer 3(10 mM Tris-HCl,pH 7.9,150 mM NaCl,10 mM MgCl 2,1 mM DTT)中在37°C下一起預孵育10 min以形成RNP。在37°C下,使包含與在NEBuffer 3中連續稀釋的RNP混合的dsDNA底物的體外切割反應進行1小時。將反應用EDTA淬滅。將反應物用RNA酶混合物處理(37°C持續15 min),隨後進行蛋白酶K處理(37°C持續15 min)。使用15% TBE-尿素凝膠藉由變性凝膠電泳分析反應物,並在Odyssey CLx(LI-COR)成像儀上成像。DNA底物和RNA指導序列示出於表14中;靶序列呈粗體。 [ 14] . 切割測定序列
靶標 dsDNA底物 crRNA
AAVS1_T2 TCCATGTCTCGTTATACGCTGTGGTTCGCCAACAACACTAGTACTACTGATAAATTACCC CCCAAGTCCCTCACCTCTCCAAAGCTGCCCATACTACTACACTAGTTTGACAGCTAGCTCAGTCCTAGGTATAATGCTAGC(SEQ ID NO: 213) AGAAATCCGTCTTTCATTGACGG GGAGAGGTGAGGGACTTGGG(SEQ ID NO: 216)
EMX1_T6 TCCATGTCTCGTTATACGCTGTGGTTCGCCAACATATAGTTCACTACTAGCATGCTGCCC TTGACTAGCAACACTGGCTCAAAGAAGGAAAGACTACTTATAGTTCTTGACAGCTAGCTCAGTCCTAGGTATAATGCTAGC(SEQ ID NO: 214) AGAAATCCGTCTTTCATTGACGG GAGCCAGTGTTGCTAGTCAA(SEQ ID NO: 217)
VEGFA_T5 TCCATGTCTCGTTATACGCTGTGGTTCGCCAACGCAGGAACGACACTACTAGCTGGATGAGC CTGGTCCATGGAGAGTTTAAAAAGTCTTTTGGACTACTGGAACGACTTGACAGCTAGCTCAGTCCTAGGTATAATGCTAGC(SEQ ID NO: 215) AGAAATCCGTCTTTCATTGACGG TTAAACTCTCCATGGACCAG(SEQ ID NO: 218)
對於用於確定切割位置的體外切割片段分析,使用SPRI珠和異丙醇(IPA SPRI)純化反應產物。將純化的反應物分成兩半部分。一半用綠豆核酸酶(新英格蘭生物實驗室)在30°C下處理30分鐘,以去除所有5’和3’突出端以產生平末端,隨後用IPA SPRI純化。然後使用NEBNext Ultra-II DNA文庫製備型套組(新英格蘭生物實驗室)按照製造商的說明準備綠豆核酸酶處理的和未經處理的兩半部分用於定序。使用半靶向擴增以分別擴增每個樣本的5’和3’切割產物。在定序前將所有擴增物池化並進行凝膠提取。對於每個樣本,將針對綠豆核酸酶和非綠豆核酸酶處理樣本的5’和3’切割產物獲得的讀段長度繪製為長條圖並映射到靶序列。
為了獲得完整的切割模式,獲取來自所有四個長條圖的數據並將其在R環圖上進行視覺化,如 15A- 15E 和圖 16所示。 15B- 15E示出了從AAVS1_T2的5’和3’切割產物的半靶向擴增獲得的讀段長度的長條圖。 15B 15D分別示出了填充和平端化處理的5’切割產物的讀段長度長條圖。 15C 和圖 15E分別示出了填充和平端化處理的3’切割產物的讀段長度長條圖。將每個讀段長度長條圖映射到x軸上示出的靶序列。還指示了PAM序列(5’-NTTT-3’)。從長條圖獲得的切割位點在 15A的R環圖中用三角形表示。 16比較了對於包含Cas12i2(SEQ ID NO: 2)或變體Cas12i2(SEQ ID NO: 4)的RNP而言AAVS1_T2和EMX1_T6上的切割位點。比例尺(右)代表如藉由定序讀段的數量測量的切割頻率。
對於所有靶標,在靶股和非靶股上均觀察到多個頻率不同的切割位點。在非靶股上,觀察到廣泛的切割譜,其中在間隔子區域(即,RNA指導物結合區)內以及該間隔子區域外部檢測到幾個切割位點。這表明在與Cas12i2結合後,雙股DNA可能會被從間隔子區域(即,RNA指導物結合區)解旋幾個鹼基對並以單股DNA存在,從而使其易於被Cas12i2切割。在間隔子區域外(即,RNA指導物結合區之外)始終觀察到靶股上的切割位點。對於AAVS1_T2,在距PAM序列22至24個核苷酸的位置處觀察到靶股切割位點。對於VEGFA_T5和EMX1_T6,在距PAM序列22至23個核苷酸的位置處觀察到靶股切割位點。因此,這表明設計用於靶向靶股的編輯模板RNA應該包含距PAM序列22到24個核苷酸的位置處開始的PBS。 實例 4 - 使用具有各種 PBS 和反轉錄模板序列長度的編輯模板 RNA 編輯哺乳動物細胞中的靶股
本實例描述了使用編輯模板RNA進行的哺乳動物基因的靶股編輯,該編輯模板RNA具有PBS(長度為3至60個核苷酸)和反轉錄模板序列(長度為14到54個核苷酸)。
在水中製備包含SEQ ID NO: 25的變體Cas12i2-RT融合物的質體的工作溶液(變體Cas12i2-RT融合物工作溶液)。編輯模板RNA序列示出於表15中。在一組條件中,反轉錄模板序列的長度為34個核苷酸,且PBS的長度為3、8、13、30或60個核苷酸。在第二組條件中,PBS的長度為13個核苷酸,且反轉錄模板序列的長度為14、24、34、44或54個核苷酸。將每種編輯模板RNA選殖到具有U6啟動子的質體主鏈中並進行大量製備。在水中製備表現每種編輯模板RNA的質體的工作溶液(編輯模板RNA工作溶液)。 [ 15] . 編輯模板 RNA 序列
靶標 編輯模板RNA描述 編輯模板RNA序列
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(3 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAU(SEQ ID NO: 183)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(8 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCG(SEQ ID NO: 184)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 185)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUU(SEQ ID NO: 186)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGA(SEQ ID NO: 187)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(14 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 188)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(24 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 189)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 190)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(44 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUGUGAUGAUUCCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 191)
AAVS1_T7 (SEQ ID NO: 32) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(54 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUGGUGGGAAAGGUGAUGAUUCCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 192)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(3 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGC(SEQ ID NO: 193)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(8 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCU(SEQ ID NO: 194)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 195)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCA(SEQ ID NO: 196)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGAC(SEQ ID NO: 197)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(14 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 198)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(24 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 199)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 200)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(44 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAAUCCAAAGCUUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 201)
EMX1_T6 (SEQ ID NO: 34) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(54 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUGAAGUCGCCAUCCAAAGCUUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 202)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(3 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUC(SEQ ID NO: 203)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(8 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCU(SEQ ID NO: 204)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 205)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAA(SEQ ID NO: 206)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGA(SEQ ID NO: 207)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(14 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 208)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(24 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 209)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 210)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(44 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAGGUAACACCAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 211)
VEGFA_T5 (SEQ ID NO: 38) 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(54 nt) - PBS(13 nt) AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGCCCCAUUACCAGGUAACACCAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 212)
如實例2所述,轉染並分析細胞。 17A示出了SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 183-187的編輯模板RNA對AAVS1_T7的活性、SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 193-197的編輯模板RNA對EMX1_T6的活性、以及SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 203-207的編輯模板RNA對VEGFA_T5的活性。 17B示出了SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 188-192的編輯模板RNA對AAVS1_T7的活性、SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 198-202的編輯模板RNA對EMX1_T6的活性、以及SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 208-212的編輯模板RNA對VEGFA_T5的活性。經編碼的編輯與總插入缺失的比率示出於 17A 17B的y軸上。
17A所示,測試的PBS長度的每一個導致存在經編碼的編輯。使用長度為13、30和60個核苷酸的PBS導致經編碼的編輯比總插入缺失的比率最高。如 17B所示,測試的長度為24、34、44和54個核苷酸的反轉錄模板序列導致存在經編碼的編輯。對於EMX1_T6,經編碼的編輯占使用編輯模板RNA進行的總編輯的約30%,該等編輯模板RNA具有PBS(長度為13個核苷酸)和反轉錄模板序列(長度為34或44個核苷酸)。因此,本實例表明,具有各種PBS和反轉錄模板序列長度的編輯模板RNA將經編碼的編輯引入到哺乳動物細胞中的靶序列中。 實例 5 - U2OS 細胞中靶股的 RNA 模板化編輯
本實例描述了U2OS細胞中哺乳動物基因的靶股編輯。
在水中製備包含SEQ ID NO: 25的變體Cas12i2-RT融合物的質體的工作溶液。將每種編輯模板RNA選殖到具有U6啟動子的質體主鏈中並進行大量製備。在水中製備包含每種編輯模板RNA的質體的工作溶液。編輯模板RNA序列示出於表16中。將另外的DR-間隔子序列添加到3’末端,其中該另外的間隔子序列係非人靶向的(即,它不靶向人基因組中的任何序列)。在RT供體中編碼的所希望的編輯在表16中以小寫字母示出。 [ 16] . 編輯模板 RNA 序列
靶標 編輯模板RNA序列
AAVS1_T7 GGGAAGTGGTTGGTCAGCAT(SEQ ID NO: 32) AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUGAUUCCAGCUACUaUGGGAAGUGGUUGcaguGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 136)
EMX1_T6 GAGCCAGTGTTGCTAGTCAA(SEQ ID NO: 34) AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAGCUUUCCUUCUaUGAGCCAGUGUUGgaucUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 151)
U2OS細胞由美國典型培養物保藏中心提供,並在補充有10% FBS(康寧公司(Corning))和100 U/mL青黴素-鏈黴素(HyClone™)的McCoy's-5A培養基(賽默飛世爾公司)中保持低於90%的融合度。使用TrypLE™ Express(賽默飛世爾公司)對細胞進行胰蛋白酶消化、重懸和計數。使用SF細胞系核轉染套組(龍沙公司(Lonza))按照製造商預設的DN-100程式用800 ng的Cas12i2-RT融合物質體和200 ng的每種編輯模板RNA質體的混合物對具有400,000個細胞的群體進行核轉染。然後將細胞重懸並且重新鋪板在含有預熱生長培養基的96孔板中(40,000個細胞/孔)。將核轉染的細胞培養72 h並收穫。
如實例2所述,藉由NGS對編輯進行分析。如 18所示,在約5%-8%的NGS讀段中鑒定到由每個反轉錄模板序列編碼的編輯。經編碼的編輯總計大約占總插入缺失的20%(對於AAVS1_T7),以及大約占總插入缺失的10%(對於EMX1_T6)。因此,本實例和前述實例表明經編碼的編輯能夠被引入到多個細胞系的基因中。 實例 6 - Cas12i2-RT 融合物對靶股進行 RNA 模板化編輯
本實例描述了使用與MMLV RT(SEQ ID NO: 29)、缺乏RNA酶H結構域的SEQ ID NO: 29的MMLV RT變體(SEQ ID NO: 224)或Marathon RT(SEQ ID NO: 232)融合的Cas12i2變體對哺乳動物基因進行靶股編輯。
將表14的Cas12i2-RT融合物序列選殖到pcDNA3.1主鏈(英傑公司)中。C-末端RT融合物在Cas12i2的N-末端包含His標籤,並且在Cas12i2的C-末端包含二分核質蛋白NLS(npNLS)。緊隨npNLS的係GS-XTEN-GS連接子。在RT的C-末端係二分SV40 NLS標籤。N-末端RT融合物在N-末端包含二分SV40 NLS標籤,並且在RT的C-末端包含GS-XTEN-GS連接子,隨後是Cas12i2。在Cas12i2的C-末端係二分核質蛋白NLS(bpNLS)。在水中製備Cas12i2-RT質體的工作溶液。 [ 17] .CAS-RT 融合物序列
描述 序列
在C-末端與MMLV RT融合的SEQ ID NO: 4的變體Cas12i2 MKIEEGKGHHHHHHMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTSKRPAATKKAGQAKKKKSGGSSGGSSGSETPGTSESATPESSGGSSGGSTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPMKRTADGSEFESPKKKRKV(SEQ ID NO: 219)
在C-末端與具有RNA酶H缺失的MMLV融合的SEQ ID NO: 7的變體Cas12i2 MKIEEGKGHHHHHHMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELRCRVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLATMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGRQSSDEENPDGGRIKLQLTSKRPAATKKAGQAKKKKSGGSSGGSSGSETPGTSESATPESSGGSSGGSTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPMKRTADGSEFESPKKKRKV(SEQ ID NO: 220)
在C-末端與Marathon RT融合的SEQ ID NO: 7的變體Cas12i2 MKIEEGKGHHHHHHMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELRCRVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLATMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGRQSSDEENPDGGRIKLQLTSKRPAATKKAGQAKKKKSGGSSGGSSGSETPGTSESATPESSGGSSGGSMDTSNLMEQILSSDNLNRAYLQVVRNKGAEGVDGMKYTELKEHLAKNGETIKGQLRTRKYKPQPARRVEIPKPDGGVRNLGVPTVTDRFIQQAIAQVLTPIYEEQFHDHSYGFRPNRCAQQAILTALNIMNDGNDWIVDIDLEKFFDTVNHDKLMTLIGRTIKDGDVISIVRKYLVSGIMIDDEYEDSIVGTPQGGNLSPLLANIMLNELDKEMEKRGLNFVRYADDCIIMVGSEMSANRVMRNISRFIEEKLGLKVNMTKSKVDRPSGLKYLGFGFYFDPRAHQFKAKPHAKSVAKFKKRMKELTCRSWGVSNSYKVEKLNQLIRGWINYFKIGSMKTLCKELDSRIRYRLRMCIWKQWKTPQNQEKNLVKLGIDRNTARRVAYTGKRIAYVCNKGAVNVAISNKRLASFGLISMLDYYIEKCVTCMKRTADGSEFESPKKKRKV(SEQ ID NO: 221)
在N-末端與Marathon RT融合的SEQ ID NO: 4的變體Cas12i2 MKRTADGSEFESPKKKRKVMDTSNLMEQILSSDNLNRAYLQVVRNKGAEGVDGMKYTELKEHLAKNGETIKGQLRTRKYKPQPARRVEIPKPDGGVRNLGVPTVTDRFIQQAIAQVLTPIYEEQFHDHSYGFRPNRCAQQAILTALNIMNDGNDWIVDIDLEKFFDTVNHDKLMTLIGRTIKDGDVISIVRKYLVSGIMIDDEYEDSIVGTPQGGNLSPLLANIMLNELDKEMEKRGLNFVRYADDCIIMVGSEMSANRVMRNISRFIEEKLGLKVNMTKSKVDRPSGLKYLGFGFYFDPRAHQFKAKPHAKSVAKFKKRMKELTCRSWGVSNSYKVEKLNQLIRGWINYFKIGSMKTLCKELDSRIRYRLRMCIWKQWKTPQNQEKNLVKLGIDRNTARRVAYTGKRIAYVCNKGAVNVAISNKRLASFGLISMLDYYIEKCVTCSGGSSGGSSGSETPGTSESATPESSGGSSGGSMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTSKRPAATKKAGQAKKKK(SEQ ID NO: 222)
在N-末端與Marathon RT融合的SEQ ID NO: 7的變體Cas12i2 MKRTADGSEFESPKKKRKVMDTSNLMEQILSSDNLNRAYLQVVRNKGAEGVDGMKYTELKEHLAKNGETIKGQLRTRKYKPQPARRVEIPKPDGGVRNLGVPTVTDRFIQQAIAQVLTPIYEEQFHDHSYGFRPNRCAQQAILTALNIMNDGNDWIVDIDLEKFFDTVNHDKLMTLIGRTIKDGDVISIVRKYLVSGIMIDDEYEDSIVGTPQGGNLSPLLANIMLNELDKEMEKRGLNFVRYADDCIIMVGSEMSANRVMRNISRFIEEKLGLKVNMTKSKVDRPSGLKYLGFGFYFDPRAHQFKAKPHAKSVAKFKKRMKELTCRSWGVSNSYKVEKLNQLIRGWINYFKIGSMKTLCKELDSRIRYRLRMCIWKQWKTPQNQEKNLVKLGIDRNTARRVAYTGKRIAYVCNKGAVNVAISNKRLASFGLISMLDYYIEKCVTCSGGSSGGSSGSETPGTSESATPESSGGSSGGSMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELRCRVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLATMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGRQSSDEENPDGGRIKLQLTSKRPAATKKAGQAKKKK(SEQ ID NO: 223)
靶標和相應的編輯模板RNA序列示出於表18中。RT模板的長度為40個核苷酸,而PBS的長度為13個核苷酸。經編碼的編輯係4-核苷酸取代以及單鹼基取代以去除PAM序列。用另外的同向重複序列和非靶向間隔子序列進一步對編輯模板RNA進行末端保護。將編輯模板RNA選殖到具有U6啟動子的質體主鏈中並進行大量製備,並在水中製備每種編輯模板RNA質體的工作溶液。 [ 18] . 編輯模板 RNA 序列
靶標 編輯模板RNA序列
AAVS1_T7 GGGAAGTGGTTGGTCAGCAT (SEQ ID NO: 32) AGAAAUCCGUCUUUCAUUGACGGGCACAC-GACGAUGUAAUCGCUGAUUCCAGCUAC-UAUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGCAGAAAUCCGUCUUUCAU-UGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 135)
EMX1_T6 GAGCCAGTGTTGCTAGTCAA (SEQ ID NO: 34) AGAAAUCCGUCUUUCAUUGACGGGCACAC-GACGAUGUAAUCGCAAA-GCUUUCCUUCUAUGAGCCAGUGUUGGAUCUCAAGGGCAG-CAUGCUGGGCCAGAAAUCCGUCUUUCAU-UGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 150)
VEGFA_T5 TTAAACTCTCCATGGACCAG (SEQ ID NO: 38) AGAAAUCCGUCUUUCAUUGACGGGCACAC-GACGAUGUAAUCGCAACACCAAAAGACUAC-U-UAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCAAGAAAUCCGUCUUUCAUUGAC-GGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 180)
HEK293T細胞由美國典型培養物保藏中心提供,並在以下D10培養基中保持低於90%的融合度:DMEM(賽默飛世爾公司)加GlutaMAX TM(賽默飛世爾公司)和丙酮酸鹽(賽默飛世爾公司),補充有10% FBS(康寧公司)和100 U/mL青黴素-鏈黴素(HyClone TM)。在轉導之前,將HEK293T細胞以25,000個細胞/孔鋪板在經組織培養物處理的96孔板中。15-18 h後,轉染細胞。將每個Cas12i2-RT融合物質體和編輯模板RNA質體在Opti-MEM TM培養基(賽默飛世爾公司)中稀釋,然後與在Opti-MEM TM中稀釋的Lipofectamine TM2000(賽默飛世爾公司)混合。將Lipofectamine TM2000溶液逐滴添加到孔中,並將轉染的細胞培養72 h後收穫。
藉由兩輪PCR製備用於下一代定序的樣本。使用第一輪(PCR1)來擴增根據靶標的特定基因組區域。藉由柱純化對PCR1產物進行純化。進行第2輪PCR(PCR2)以添加依諾米那銜接子和索引。然後將反應物池化並且藉由柱純化進行純化。用150次循環NextSeq v2.5中等或高輸出套組進行定序運行。
20A 20B 20C分別示出了表19的Cas12i2-RT融合物對AAVS1_T7、EMX1_T6和VEGFA_T5的活性。插入缺失編輯(包含在靶序列內或鄰近靶序列的插入或缺失的總NGS讀段的百分比)和精確編輯(包含由編輯模板RNA編碼的編輯的總NGS讀段的百分比)示出於y軸上。插入缺失編輯示出為白色柱,而經編碼的編輯示出為灰色柱。顯示的數據係兩個生物重複的平均值。如 20A 20B 20C所示,在編輯模板RNA存在下,Cas12i2-RT融合物係活性核酸酶。此外,Cas12i2-RT融合物中的每一個將由編輯模板RNA編碼的編輯引入到靶序列中。對於用SEQ ID NO: 220的Cas12i2-RT融合物編輯的三個靶標中的每一個,大約15%的NGS讀段包含由編輯模板RNA編碼的編輯。因此,MMLV的RNA酶H結構域的缺失似乎對Cas12i2-RT融合物將插入缺失和精確編輯引入到哺乳動物基因組中的能力沒有顯著影響。此外,包含Marathon RT的Cas12i2-RT融合物能夠將經編碼的編輯引入到靶序列中( 20A 20B 20C)。
因此,本實例表明使用多個RT序列和Cas12i2-RT融合物使經編碼的編輯能夠被摻入到哺乳動物基因的靶股中。 實例 7 - 使用經化學修飾的編輯模板 RNA 進行 RNA 模板化編輯
本實例描述了使用質體編碼的SEQ ID NO: 219的Cas12i2-RT融合物和包含末端硫代磷酸酯主股連接和/或2'O-甲基核苷酸的編輯模板RNA,進行哺乳動物基因VEGFA的靶股編輯。靶序列係TTAAACTCTCCATGGACCAG(SEQ ID NO: 38)。 [ 19] .RNA 指導物和編輯模板 RNA 序列 .
RNA 構建體 RNA 序列
未經修飾的RNA指導物 rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArG(SEQ ID NO: 27)
PS修飾的RNA指導物 rA*rG*rA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArC*rC*rA*rG(SEQ ID NO: 28)
2’-O-Me修飾的RNA指導物 mAmGmArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrAmCmCmArG(SEQ ID NO: (SEQ ID NO: 31)
PS-2’-O-Me修飾的RNA指導物 mA*mG*mA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrAmC*mC*mA*rG(SEQ ID NO: 33)
未經修飾的編輯模板RNA(PBS 13 nt) rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrCrCrCrA(SEQ ID NO: 35)
PS修飾的編輯模板RNA(PBS 13 nt) rA*rG*rA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrC*rC*rC*rA(SEQ ID NO: 37)
2’-O-Me修飾的編輯模板RNA(PBS 13 nt) mAmGmArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUmCmCmCrA(SEQ ID NO: 39)
PS-2’-O-Me編輯模板RNA(PBS 13 nt) mA*mG*mA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUmC*mC*mC*rA(SEQ ID NO: 46)
未經修飾的編輯模板RNA(PBS 30 nt) rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrCrCrCrArArArCrArArArGrCrCrCrCrCrArArGrArA(SEQ ID NO: 47)
PS修飾的編輯模板RNA(PBS 30 nt) rA*rG*rA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrCrCrCrArArArCrArArArGrCrCrCrCrCrArA*rG*rA*rA(SEQ ID NO: 48)
2’-O-Me修飾的編輯模板RNA(PBS 30 nt) mAmGmArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrCrCrCrArArArCrArArArGrCrCrCrCrCrAmAmGmArA(SEQ ID NO: 49)
PS-2’-O-Me編輯模板RNA(PBS 30 nt) mA*mG*mA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrCrCrCrArArArCrArArArGrCrCrCrCrCrAmA*mG*mA*rA(SEQ ID NO: 50)
將SEQ ID NO: 4的變體Cas12i2和SEQ ID NO: 219的Cas12i2-RT融合物分別選殖到pcDNA3.1主鏈(英傑公司)中。由IDT合成RNA指導物和編輯模板RNA序列。HEK293T細胞由美國典型培養物保藏中心提供,並在以下D10培養基中保持低於90%的融合度:DMEM(賽默飛世爾公司)加GlutaMAX TM(賽默飛世爾公司)和丙酮酸鹽(賽默飛世爾公司),補充有10% FBS(康寧公司)和100 U/mL青黴素-鏈黴素(HyClone TM)。在轉導之前,將HEK293T細胞以25,000個細胞/孔鋪板在經組織培養物處理的96孔板中的D10中。15-18 h後,藉由TransIT-X2®(米納斯生物公司(Mirus Bio))轉染細胞。然後將DNA和轉染試劑溶液逐滴添加到細胞孔中。將100 ng的Cas12i2或Cas12i2-RT質體DNA和9 pmol的合成RNA指導物(IDT)的混合物在Opti-MEM TM培養基(賽默飛世爾公司)中稀釋,然後按照製造商的說明與在Opti-MEM TM中稀釋的Lipofectamine TM2000混合。將轉染的細胞培養72 h然後收穫。
如前述實例所述,藉由NGS對編輯進行分析。如 21所示,檢測到VEGFA-T5靶位點處的用每種編輯模板RNA和SEQ ID NO: 219的Cas12i2-RT融合物進行的經編碼的編輯。在對照(gRNA和編輯模板RNA + Cas12i2)樣本中未檢測到經編碼的編輯。與未經修飾的編輯模板RNA相比,使用經修飾的編輯模板RNA在更高百分比的NGS讀段中檢測到經編碼的編輯。使用PS-2'-O-Me修飾導致包含經編碼的編輯的NGS讀段百分比最高。
因此,本實例表明,目的基因組位點能夠藉由化學修飾的編輯模板RNA和Cas12i2-RT融合物被編輯。 實例 8 - 使用 Cas12i4-RT 融合物進行 RNA 模板化編輯
本實例描述了使用與MMLV RT(SEQ ID NO: 29)融合的Cas12i4變體對AAVS1的靶股編輯。
將表20的Cas12i4-RT融合物序列選殖到pcDNA3.1主鏈(英傑公司)中。C-末端RT融合物在Cas12i4的N-末端包含His標籤,並且在Cas12i4的C-末端包含核質蛋白NLS。緊隨NLS的係Flex XTEN連接子。在RT的C-末端係二分SV40 NLS標籤。N-末端RT融合物在N-末端包含二分SV40 NLS標籤,並且在RT的C-末端包含Flex XTEN連接子,隨後是Cas12i4。在Cas12i4的C-末端係核質蛋白NLS。在水中製備Cas12i4-RT質體的工作溶液。 [ 20] 變體 CAS12I4 和變體 CAS12I4-RT 融合物序列
描述 序列
變體Cas12i4 MASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLRAELHYDGKKAKAHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTRVDKTTNCSFMIKRENDEYKLVINRKISRDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNREQDDIPLITKKAESKSPPKDRKRSKTSQLPQK(SEQ ID NO: 51)
在C-末端與MMLV RT融合的變體Cas12i4 MKIEEGKGHHHHHHMASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLRAELHYDGKKAKAHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTRVDKTTNCSFMIKRENDEYKLVINRKISRDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNREQDDIPLITKKAESKSPPKDRKRSKTSQLPQKKRPAATKKAGQAKKKKSGGSSGGSSGSETPGTSESATPESSGGSSGGSTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPMKRTADGSEFESPKKKRKV(SEQ ID NO: 52)
在N-末端與MMLV RT融合的變體Cas12i4 MKRTADGSEFESPKKKRKVTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPSGGSSGGSSGSETPGTSESATPESSGGSSGGSMASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLRAELHYDGKKAKAHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTRVDKTTNCSFMIKRENDEYKLVINRKISRDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNREQDDIPLITKKAESKSPPKDRKRSKTSQLPQKKRPAATKKAGQAKKKK(SEQ ID NO: 53)
靶標、RNA指導物和編輯模板RNA序列示出於表21中。RT模板的長度為46個核苷酸,而PBS的長度為13個核苷酸。經編碼的編輯係4-核苷酸取代以及單鹼基取代以去除PAM序列。將編輯模板RNA和RNA指導物分別選殖到具有U6啟動子的質體主鏈中並進行大量製備,並在水中製備每種RNA指導物或編輯模板RNA質體的工作溶液。 [ 21] . 靶標和 RNA 序列 .
描述 序列
AAVS1_T7靶標 GGGAAGTGGTTGGTCAGCAT(SEQ ID NO: 32)
Cas12i4 RNA指導物 AGACAUGUGUCCUCAGUGACACGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 60)
Cas12i4編輯模板RNA AGACAUGUGUCCUCAGUGACACGGGAAGUGGUUGGUCAGCAUUGAUUCCAGCUACUcUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 61)
如實例6所述,轉染並收穫HEK293T細胞。如前述實例所述,進一步進行NGS。如 22所示,檢測到AAVS1_T7靶位點處的用編輯模板RNA和任一Cas12i4-RT融合物進行的經編碼的編輯。在對照(gRNA和編輯模板RNA + Cas12i4)樣本中未檢測到經編碼的編輯。與MMLV跟變體Cas12i4的N-末端融合物相比,使用MMLV跟變體Cas12i4的C-末端融合物在更高百分比的NGS讀段中檢測到經編碼的編輯。
因此,本實例表明,目的基因組位點能夠藉由編輯模板RNA和Cas12i4-RT融合物被編輯。 實例 9 - 使用 Cas12i2-RT 融合物、 RNA 指導物和 RT 供體 RNA 進行 RNA 模板化編輯
本實例描述了使用Cas12i2-RT融合物、RNA指導物和RT供體RNA對哺乳動物基因進行靶股編輯。
將SEQ ID NO: 219的Cas12i2-RT融合物選殖到pcDNA3.1主鏈(英傑公司)中。在水中製備Cas12i2-RT質體的工作溶液。將表22的RNA指導物和RT供體RNA分別選殖到具有U6啟動子的質體主鏈中並進行大量製備,並在水中製備每種RNA指導物或RT供體RNA質體的工作溶液。RT供體RNA以從5’到3’的順序包含以下組分:同向重複 - 非靶向間隔子 - RT模板 - PBS - 同向重複 - 非靶向間隔子。RT模板和PBS側翼的同向重複序列和間隔子序列用作末端保護。 [ 22] . 靶標、 RNA 指導物和 RT 供體 RNA 序列
靶標 RNA 指導序列 RT 供體 RNA 序列
AAVS1_T7 (SEQ ID NO: 32) AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 112) AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGACGCUACUAUAGCUGCAC(SEQ ID NO: 62)
EMX1_T6(SEQ ID NO: 34) AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 114) AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGACGCUACUAUAGCUGCAC(SEQ ID NO: 63)
VEGFA_T2(SEQ ID NO: 36) AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 116) AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCAGAAAUCCGUCUUUCAUUGACGGGACGCUACUAUAGCUGCAC(SEQ ID NO: 64)
HEK293T細胞由美國典型培養物保藏中心提供,並在以下D10培養基中保持低於90%的融合度:DMEM(賽默飛世爾公司)加GlutaMAX TM(賽默飛世爾公司)和丙酮酸鹽(賽默飛世爾公司),補充有10% FBS(康寧公司)和100 U/mL青黴素-鏈黴素(HyClone TM)。在轉導之前,將HEK293T細胞以25,000個細胞/孔鋪板在經組織培養物處理的96孔板中。15-18 h後,轉染細胞。將每個Cas12i2-RT融合物質體、RNA指導物質體和RT供體RNA質體在Opti-MEM TM培養基(賽默飛世爾公司)中稀釋,然後與在Opti-MEM TM中稀釋的Lipofectamine TM2000(賽默飛世爾公司)混合。將Lipofectamine TM2000溶液逐滴添加到孔中,並將轉染的細胞培養72 h後收穫。
如前述實例所述,進一步進行NGS。如 23所示,在用Cas12i2-RT融合物、各自的RNA指導物和各自的RT供體RNA轉染後,檢測到每個靶位點處的經編碼的編輯。在對照(Cas12i2)樣本中未檢測到經編碼的編輯。因此,本實例表明,目的基因組位點能夠藉由Cas12i2-RT融合物和兩種RNA組分(RNA指導物和RT供體RNA)被編輯。不需要使RNA指導物與RT供體RNA融合以將經編碼的編輯摻入到目的基因組位點。
申請檔含有至少一幅彩色附圖。
[ 1A- 1B]包括顯示本文揭露的示例性基因編輯系統之示意圖。 1A係顯示基因編輯系統之示意圖,該基因編輯系統包含與反轉錄酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA指導物的3’末端與RT供體RNA融合的RNA指導物。RT供體RNA包含反轉錄模板序列和PBS。PBS包含與靶核酸的PAM股(也稱為非靶股)的基本互補性。 1B示出了與反轉錄酶融合的Cas9切口酶(左)和與反轉錄酶融合的Cas12i切口酶(右)。使用與RNA指導物的3’末端融合的RT供體RNA,將編輯摻入到靶核酸的PAM股中。
[ 2]係顯示示例性基因編輯系統的示意圖,該基因編輯系統包含與反轉錄酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA指導物的5’末端與RT供體RNA融合的RNA指導物。RT供體RNA包含PBS和反轉錄模板序列。PBS包含與靶核酸的PAM股的互補性。
[ 3]係顯示CRISPR核酸酶(例如,Cas12i多肽)、反轉錄酶多肽、RNA指導物和RT供體RNA之示意圖。RT供體RNA包含反轉錄模板序列和PBS。藉由CRISPR核酸酶切割後,編輯被摻入到基因組中。
[ 4]係顯示CRISPR核酸酶(例如,Cas12i多肽)、反轉錄酶多肽、RNA指導物和RNA反轉錄模板序列之示意圖。RT供體RNA包含PBS和反轉錄模板序列。在CRISPR核酸酶存在的情況下,編輯被摻入到基因組中。
[ 5]係顯示示例性基因編輯系統之示意圖,該基因編輯系統包含與反轉錄酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和含有與靶核酸錯配的、在RNA指導物的3’末端與RT供體RNA融合的RNA指導物。RT供體RNA包含PBS。PBS包含與靶核酸的非PAM股(也稱為靶股或TS)的互補性。
[ 6A- 6B]包括顯示本文揭露的示例性基因編輯系統之示意圖。 6A係顯示示例性基因編輯系統之示意圖,該基因編輯系統包含與反轉錄酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA指導物的3’末端與RT供體RNA融合的RNA指導物。RT供體RNA包含反轉錄模板序列和PBS。當RNA指導物的間隔子序列和PBS與靶核酸結合時,反轉錄模板序列形成未配對核苷酸的環。PBS包含與靶核酸的非PAM股的互補性。PAM股和非PAM股中的變體Cas12i2切割位點由三角形表示。使用與RNA指導物的3’末端融合的RT供體RNA,將編輯摻入到靶核酸的非PAM股中。 6B示出了編輯、反轉錄模板序列和PBS的定位,其中該反轉錄模板序列和PBS的長度可以變化。
[ 7]係顯示示例性基因編輯系統之示意圖,該基因編輯系統包含與反轉錄酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA指導物的5’末端與RT供體RNA融合的RNA指導物。RT供體RNA包含PBS和反轉錄模板序列。PBS包含與靶核酸的非PAM股的互補性。
[ 8A- 8C]包括顯示示例性Cas12i2 RNA指導物-RT供體RNA融合物之示意圖。 8A係與RT供體RNA融合的變體Cas12i2 RNA指導物之示意圖,在實例1中對其進行了測試。RNA指導物的間隔子結合至與5’-TTT-3’PAM相鄰的非PAM股。RT供體RNA包含反轉錄模板序列和PBS。當間隔子序列和PBS與靶核酸結合時,反轉錄模板序列形成未配對核苷酸的環。PBS包含與靶核酸的非PAM股的互補性。在此示意圖中,PBS的長度為13個核苷酸,反轉錄模板序列的長度為34個核苷酸。設計PBS使得與非PAM股的互補性始於切割位點(三角形)。 8B示出了靶向AAVS1_T7基因組位點的示例性RNA指導物-RT供體RNA融合物,如實例1中所測試的。測試了各種PBS長度(13、30和60個核苷酸)。設計RNA指導物-RT供體RNA融合物以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入靶序列。 8C示出了引入到AAVS1_T7基因組位點(上圖)、EMX1_T6基因組位點(中圖)和VEGFA_T5基因組位點(下圖)中的經編碼的編輯(取代、插入和缺失),如實例1中所述。 8A中的序列從上到下係SEQ ID NO: 65-67。 8B中的序列從上到下係SEQ ID NO: 74-80和87-89。
[ 9A- 9J]包括顯示由本文揭露的示例性基因編輯系統產生的基因編輯效率之圖。 9A示出了就由SEQ ID NO: 4的變體Cas12i2以及SEQ ID NO: 25和SEQ ID NO: 26與靶向AAVS1_T6基因組位點的RNA指導物的C-末端和N-末端Cas12i2-MMLV RT融合物誘導的插入缺失和經編碼的編輯方面而言,分析的具有編輯的序列數目與所分析的序列總數目之比率。 9B示出了就由SEQ ID NO: 26和SEQ ID NO: 25以及靶向AAVS1_T6基因組位點的RNA指導物-RT供體RNA融合物的N-末端和C-末端Cas12i2-MMLV RT融合物誘導的插入缺失和編輯方面而言,分析的具有經編碼的編輯的序列數目與所分析的序列總數目之比率。RNA指導物-RT供體RNA融合物具有長度為13、30或60個核苷酸的PBS,並且被設計以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入AAVS1_T6基因組位點中。 9C示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 4的變體Cas12i2以及SEQ ID NO: 25和SEQ ID NO: 26與靶向AAVS1_T7基因組位點的RNA指導物的C-末端和N-末端Cas12i2-MMLV RT融合物誘導。 9D示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 26和SEQ ID NO: 25以及靶向AAVS1_T7基因組位點的RNA指導物-RT供體RNA融合物的N-末端和C-末端Cas12i2-MMLV RT融合物誘導。RNA指導物-RT供體RNA融合物具有長度為13、30或60個核苷酸的PBS,並且被設計以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入AAVS1_T7基因組位點中。 9E示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 4的變體Cas12i2以及SEQ ID NO: 25和SEQ ID NO: 26與靶向EMX1_T6基因組位點的RNA指導物的C-末端和N-末端Cas12i2-MMLV RT融合物誘導。 9F示出了分析的具有插入缺失和編輯的序列之百分比,該等插入缺失和編輯由SEQ ID NO: 26和SEQ ID NO: 25以及靶向EMX1_T6基因組位點的RNA指導物-RT供體RNA融合物的N-末端和C-末端Cas12i2-MMLV RT融合物誘導。RNA指導物-RT供體RNA融合物具有長度為13、30或60個核苷酸的PBS,並且被設計以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入EMX1_T6基因組位點中。 9G示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 4的變體Cas12i2以及SEQ ID NO: 25和SEQ ID NO: 26與靶向VEGFA_T2基因組位點的RNA指導物的C-末端和N-末端Cas12i2-MMLV RT融合物誘導。 9H示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 26和SEQ ID NO: 25以及靶向VEGFA_T2基因組位點的RNA指導物-RT供體RNA融合物的N-末端和C-末端Cas12i2-MMLV RT融合物誘導。RNA指導物-RT供體RNA融合物具有長度為13、30或60個核苷酸的PBS,並且被設計以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入VEGFA_T2基因組位點中。 9I示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 4的變體Cas12i2以及SEQ ID NO: 25和SEQ ID NO: 26與靶向VEGFA_T5基因組位點的RNA指導物的C-末端和N-末端Cas12i2-MMLV RT融合物誘導。 9J示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 26和SEQ ID NO: 25以及靶向VEGFA_T5基因組位點的RNA指導物-RT供體RNA融合物的N-末端和C-末端Cas12i2-MMLV RT融合物誘導。RNA指導物-RT供體RNA融合物具有長度為13、30或60個核苷酸的PBS,並且被設計以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入VEGFA_T5基因組位點中。
[ 10]係顯示與反轉錄酶融合的Cas12i多肽(例如,Cas12i2切口酶)之示意圖。使用與RNA指導物的5’末端或3’末端融合的RT供體RNA,將經編碼的編輯摻入到靶核酸的PAM股中。可以保護RNA指導物-RT供體RNA的末端以防止核酸外切酶或核酸內切酶活性。PBS長度可以在約3-100個核苷酸之間變化並且包含與PAM股的基本互補性。可以在間隔子和反轉錄模板序列之間引入結構化RNA,例如髮夾。
[ 11]係顯示進一步與第二同向重複(DR)-間隔子序列融合的RNA指導物-RT供體RNA之示意圖。另外的DR-間隔子抑制核酸外切酶活性。
[ 12A- 12B]包括顯示編輯模板RNA(基因編輯RNA)的示例性設計之示意圖。 12A係描繪進一步包含3’末端保護的編輯模板RNA(5’-核酸酶結合序列-DNA結合序列-反轉錄模板-PBS-3’)之示意圖。3’末端保護可為化學末端保護(圖的頂部)或髮夾(圖的底部)。髮夾可為核酸酶結合序列,例如同向重複序列。 12B係描繪具有和不具有5’末端保護的編輯模板RNA(5’-反轉錄模板-PBS核酸酶結合序列-DNA結合序列-3’)之示意圖。5’末端保護可為髮夾(例如,核酸酶結合序列,如同向重複序列),如圖底部所示。
[ 13A- 13D]包括顯示由本文揭露的示例性基因編輯系統產生的基因編輯效率之圖。 13A示出了具有SEQ ID NO: 112的RNA指導物或SEQ ID NO: 123-137的編輯模板RNA的Cas12i2(SEQ ID NO: 4)和Cas12i2-RT(SEQ ID NO: 25)在AAVS1_T7基因組位點(SEQ ID NO: 30)處的活性。白色柱(對於Cas12i2)和灰色柱(對於Cas12i2-RT)示出了分析為具有插入缺失的讀段%。網格柱(對於Cas12i2)和黑色柱(對於Cas12i2-RT)中示出了分析為具有經編碼的編輯的讀段%。 13B示出了具有SEQ ID NO: 114的RNA指導物或SEQ ID NO: 138-152的編輯模板RNA的Cas12i2(SEQ ID NO: 4)和Cas12i2-RT(SEQ ID NO: 25)在EMX1_T6基因組位點(SEQ ID NO: 34)處的活性。白色柱(對於Cas12i2)和灰色柱(對於Cas12i2-RT)示出了分析為具有插入缺失的讀段%。網格柱(對於Cas12i2)和黑色柱(對於Cas12i2-RT)中示出了分析為具有經編碼的編輯的讀段%。 13C示出了具有SEQ ID NO: 116的RNA指導物或SEQ ID NO: 153-167的編輯模板RNA的Cas12i2(SEQ ID NO: 4)和Cas12i2-RT(SEQ ID NO: 25)在VEGFA_T2(SEQ ID NO: 36)處的活性。白色柱(對於Cas12i2)和灰色柱(對於Cas12i2-RT)示出了分析為具有插入缺失的讀段%。網格柱(對於Cas12i2)和黑色柱(對於Cas12i2-RT)中示出了分析為具有經編碼的編輯的讀段%。 13D示出了具有SEQ ID NO: 118的RNA指導物或SEQ ID NO: 168-182的編輯模板RNA的Cas12i2(SEQ ID NO: 4)和Cas12i2-RT(SEQ ID NO: 25)在VEGFA_T5基因組位點(SEQ ID NO: 38)處的活性。白色柱(對於Cas12i2)和灰色柱(對於Cas12i2-RT)示出了分析為具有插入缺失的讀段%。網格柱(對於Cas12i2)和黑色柱(對於Cas12i2-RT)中示出了分析為具有經編碼的編輯的讀段%。
[ 14A- 14C]包括描繪用於鑒定具有RNA指導物或編輯模板RNA的Cas12i2的切割模式的測定步驟之示意圖。 14A示出了包含靶序列和條碼的寡核苷酸構造。 14B示出了對切割產物的處理以平端化5’和3’突出端或末端修復以填充5’突出端。 14C示出了切割產物的擴增。
[ 15A- 15E]包括顯示使用本文揭露的示例性基因編輯系統進行基因編輯之圖。 15A係描繪在AAVS1_T2基因組位點的PAM股和非PAM股上由SEQ ID NO: 2的Cas12i2誘導的體外切割位點(三角形)之示意圖。 15B係在填充處理後從5’切割產物的擴增獲得的讀段長度之長條圖。 15C係在填充處理後從3’切割產物的擴增獲得的讀段長度之長條圖。 15D係在平端化處理後從5’切割產物的擴增獲得的讀段長度之長條圖。 15E係在平端化處理後從3’切割產物的擴增獲得的讀段長度之長條圖。將每個讀段長度長條圖映射到靶序列,如 15B- 15E的x軸所示。
[ 16A- 16B]示出了在EMX1_T6基因組位點( 16A)和VEGFA_T5基因組位點( 16B)的PAM股或非PAM股上由SEQ ID NO: 2的Cas12i2或SEQ ID NO: 4的變體Cas12i2誘導的體外切割位點(三角形)。比例尺(右)代表如藉由定序讀段的數量測量的切割頻率。
[ 17A- 17B]包括顯示示例性基因組大小的基因編輯結果之圖。 17A示出了藉由編輯模板RNA將4-核苷酸插入引入到AAVS1_T7基因組位點(SEQ ID NO: 30)、EMX1_T6基因組位點(SEQ ID NO: 34)或VEGFA_T5基因組位點(SEQ ID NO: 38)的活性。編輯模板RNA包含34-核苷酸反轉錄模板序列和3、8、13、30或60-核苷酸PBS。經編碼的編輯與總編輯的比率顯示在y軸上。 17B示出了藉由編輯模板RNA將4-核苷酸插入引入到AAVS1_T7基因組位點(SEQ ID NO: 30)、EMX1_T6基因組位點(SEQ ID NO: 34)或VEGFA_T5基因組位點(SEQ ID NO: 38)的活性。編輯模板RNA包含13-核苷酸PBS和14、24、34、44或54-核苷酸反轉錄模板序列。經編碼的編輯與總編輯的比率顯示在y軸上。 17A中的序列從上到下係SEQ ID NO: 90-92。 17B中的序列從上到下係SEQ ID NO: 90-92。
[ 18]示出了摻入到U2OS細胞中的AAVS1_T7基因組位點(SEQ ID NO: 32)和EMX1_T6基因組位點(SEQ ID NO: 34)的經編碼的編輯。
[ 19A- 19B]包括說明使用本文揭露的示例性基因編輯系統的基因編輯程序之示意圖。 19A係描繪包含與反轉錄酶和pegRNA融合的Cas9的Cas9先導編輯器之示意圖。在Cas9切割PAM股後,生成在靶DNA上的引物。引物與pegRNA的雜交啟動反轉錄。 19B係描繪與反轉錄酶和編輯模板RNA融合的V型CRISPR核酸酶之示意圖。在V型CRISPR核酸酶切割非PAM股後,生成在靶DNA上的引物。引物與編輯模板RNA的雜交啟動反轉錄。
[ 20A- 20C]包括顯示在多個基因組位點處用所指示的Cas12i2-RT融合多肽進行的編輯之圖。 20A係顯示在AAVS1基因組位點處包含由SEQ ID NO: 219-223的變體Cas12i2-RT融合物引入的插入缺失編輯(白色柱)或經編碼的編輯(灰色柱)的NGS讀段%之圖。 20B係顯示在EMX1基因組位點處包含由SEQ ID NO: 219-223的變體Cas12i2-RT融合物引入的插入缺失編輯(白色柱)或經編碼的編輯(灰色柱)的NGS讀段%之圖。 20C係顯示在VEGFA基因組位點處包含由SEQ ID NO: 219-223的變體Cas12i2-RT融合物引入的插入缺失編輯(白色柱)或經編碼的編輯(灰色柱)的NGS讀段%之圖。
[ 21]係顯示包含由變體Cas12i2(SEQ ID NO: 4)或變體Cas12i2-RT融合物(SEQ ID NO: 219)和RNA指導物或編輯模板引入的插入缺失編輯或經編碼的編輯的NGS讀段%之圖。RNA指導物和編輯模板RNA未經修飾,或包含末端硫代磷酸酯主鏈連接和/或2'O-甲基核苷酸。
[ 22]係顯示在AAVS1基因組位點處包含由變體Cas12i4-RT融合物引入的插入缺失編輯(白色柱)或經編碼的編輯(灰色柱)的NGS讀段%之圖。
[ 23]係顯示在AAVS1、EMX1或VEGFA基因組位點處包含由變體Cas12i2或變體Cas12i2-RT融合物、RNA指導物和RT供體RNA引入的插入缺失編輯(白色柱)或經編碼的編輯(灰色柱)的NGS讀段%之圖。
                         序列表
          <![CDATA[<110>  美商喬木生物技術公司(Arbor Biotechnologies)]]>
          <![CDATA[<120>  包含CRISPR核酸酶的組合物及其用途]]>
          <![CDATA[<140>  111120437]]>
          <![CDATA[<141>  2022-06-01]]>
          <![CDATA[<150>  US 63/299,695]]>
          <![CDATA[<151>  2022-01-14]]>
          <![CDATA[<150>  US 63/272,937]]>
          <![CDATA[<151>  2021-10-28]]>
          <![CDATA[<150>  US 63/236,047]]>
          <![CDATA[<151>  2021-08-23]]>
          <![CDATA[<150>  US 63/195,621]]>
          <![CDATA[<151>  2021-06-01]]>
          <![CDATA[<160>  247   ]]>
          <![CDATA[<170>  PatentIn 3.5版]]>
          <![CDATA[<210>  1]]>
          <![CDATA[<211>  3162]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  1]]>
          atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa       60
          ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg      120
          caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa      180
          cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac      240
          agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt      300
          ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat      360
          tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc      420
          gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag      480
          agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt      540
          agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc      600
          ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa      660
          accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc      720
          gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt      780
          attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg      840
          gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac      900
          accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag      960
          ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc     1020
          gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc     1080
          aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg     1140
          attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt     1200
          ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg     1260
          aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt     1320
          aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac     1380
          cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt     1440
          cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg     1500
          gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg     1560
          ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag     1620
          accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag     1680
          atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt     1740
          gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa     1800
          aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat     1860
          aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag     1920
          aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg     1980
          gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag     2040
          aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag     2100
          ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc     2160
          aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac     2220
          tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt     2280
          aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc     2340
          agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag     2400
          ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag     2460
          acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac     2520
          aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt     2580
          aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg     2640
          tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt     2700
          tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac     2760
          ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg     2820
          agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa     2880
          agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa     2940
          gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg     3000
          accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat     3060
          gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa     3120
          gagaacccgg atggtagccg tatcaaactg cagctgacca gc                        3162
          <![CDATA[<210>  2]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  2]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 
              610                 615                 620                 
          Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Val  Lys Gly Ile Gly Glu  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Ser Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  3]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  3]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 
              610                 615                 620                 
          Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Arg Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Glu  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Ser Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  4]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  4]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 
              610                 615                 620                 
          Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Glu  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Ser Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  5]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  5]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 
              610                 615                 620                 
          Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Glu  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Gly Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  6]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  6]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg 
              610                 615                 620                 
          Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Arg  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Gly Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  7]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  7]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg 
              610                 615                 620                 
          Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Arg  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Gly Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  8]]>
          <![CDATA[<211>  1093]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  8]]>
          Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr 
          1               5                   10                  15      
          Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn 
                      20                  25                  30          
          Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp 
                  35                  40                  45              
          Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala 
              50                  55                  60                  
          Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe 
          65                  70                  75                  80  
          Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn 
                          85                  90                  95      
          Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln 
                      100                 105                 110         
          Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp 
                  115                 120                 125             
          Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu 
              130                 135                 140                 
          Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys 
          145                 150                 155                 160 
          Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met 
                          165                 170                 175     
          Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr 
                      180                 185                 190         
          Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val 
                  195                 200                 205             
          Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr 
              210                 215                 220                 
          Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile 
          225                 230                 235                 240 
          Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu 
                          245                 250                 255     
          Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg 
                      260                 265                 270         
          Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe 
                  275                 280                 285             
          Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met 
              290                 295                 300                 
          Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys 
          305                 310                 315                 320 
          Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu 
                          325                 330                 335     
          Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr 
                      340                 345                 350         
          Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile 
                  355                 360                 365             
          Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His 
              370                 375                 380                 
          Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu 
          385                 390                 395                 400 
          Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr 
                          405                 410                 415     
          Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu 
                      420                 425                 430         
          Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile 
                  435                 440                 445             
          Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln 
              450                 455                 460                 
          Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn 
          465                 470                 475                 480 
          Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys 
                          485                 490                 495     
          His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile 
                      500                 505                 510         
          Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His 
                  515                 520                 525             
          Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala 
              530                 535                 540                 
          Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys 
          545                 550                 555                 560 
          Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu 
                          565                 570                 575     
          Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln 
                      580                 585                 590         
          Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr 
                  595                 600                 605             
          Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe 
              610                 615                 620                 
          Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr 
          625                 630                 635                 640 
          Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr 
                          645                 650                 655     
          Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn 
                      660                 665                 670         
          Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser 
                  675                 680                 685             
          Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys 
              690                 695                 700                 
          Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu 
          705                 710                 715                 720 
          Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln 
                          725                 730                 735     
          Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser 
                      740                 745                 750         
          Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile 
                  755                 760                 765             
          Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu 
              770                 775                 780                 
          Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser 
          785                 790                 795                 800 
          Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr 
                          805                 810                 815     
          Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val 
                      820                 825                 830         
          Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu 
                  835                 840                 845             
          Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val 
              850                 855                 860                 
          Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu 
          865                 870                 875                 880 
          Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile 
                          885                 890                 895     
          Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu 
                      900                 905                 910         
          Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val 
                  915                 920                 925             
          Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr 
              930                 935                 940                 
          Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg 
          945                 950                 955                 960 
          Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg 
                          965                 970                 975     
          Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr 
                      980                 985                 990         
          Asn Ala Tyr Tyr Asn Glu Gly Ala  Met Ala Phe Leu Ala  Thr Tyr Gly 
                  995                 1000                 1005             
          Leu Lys  Lys Asn Asp Val Leu  Gly Val Ser Leu Glu  Lys Phe Lys 
              1010                 1015                 1020             
          Gln Ile  Met Ala Asn Ile Leu  His Gln Arg Ser Glu  Asp Gln Leu 
              1025                 1030                 1035             
          Leu Phe  Pro Ser Arg Gly Gly  Met Phe Tyr Leu Ala  Thr Tyr Lys 
              1040                 1045                 1050             
          Leu Asp  Ala Asp Ala Thr Ser  Val Asn Trp Asn Gly  Lys Gln Phe 
              1055                 1060                 1065             
          Trp Val  Cys Asn Ala Asp Leu  Val Ala Ala Tyr Asn  Val Gly Leu 
              1070                 1075                 1080             
          Val Asp  Ile Gln Lys Asp Phe  Lys Lys Lys 
              1085                 1090             
          <![CDATA[<210>  9]]>
          <![CDATA[<211>  1074]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  9]]>
          Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 
          1               5                   10                  15      
          Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 
                      20                  25                  30          
          Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 
                  35                  40                  45              
          Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 
              50                  55                  60                  
          Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 
          65                  70                  75                  80  
          Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 
                          85                  90                  95      
          Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 
                      100                 105                 110         
          Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 
                  115                 120                 125             
          Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 
              130                 135                 140                 
          Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 
          145                 150                 155                 160 
          Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 
                          165                 170                 175     
          Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 
                      180                 185                 190         
          Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 
                  195                 200                 205             
          Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 
              210                 215                 220                 
          Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 
          225                 230                 235                 240 
          Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 
                          245                 250                 255     
          Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 
                      260                 265                 270         
          Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 
                  275                 280                 285             
          Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 
              290                 295                 300                 
          Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 
          305                 310                 315                 320 
          Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 
                          325                 330                 335     
          Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 
                      340                 345                 350         
          Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 
                  355                 360                 365             
          Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 
              370                 375                 380                 
          Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 
          385                 390                 395                 400 
          Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 
                          405                 410                 415     
          Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 
                      420                 425                 430         
          Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 
                  435                 440                 445             
          Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 
              450                 455                 460                 
          Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu 
          465                 470                 475                 480 
          Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 
                          485                 490                 495     
          Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 
                      500                 505                 510         
          Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 
                  515                 520                 525             
          Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 
              530                 535                 540                 
          Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 
          545                 550                 555                 560 
          Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 
                          565                 570                 575     
          Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Val 
                      580                 585                 590         
          Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 
                  595                 600                 605             
          Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 
              610                 615                 620                 
          Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 
          625                 630                 635                 640 
          Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 
                          645                 650                 655     
          Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 
                      660                 665                 670         
          Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 
                  675                 680                 685             
          Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 
              690                 695                 700                 
          Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 
          705                 710                 715                 720 
          Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 
                          725                 730                 735     
          Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 
                      740                 745                 750         
          Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 
                  755                 760                 765             
          Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 
              770                 775                 780                 
          Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 
          785                 790                 795                 800 
          Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 
                          805                 810                 815     
          Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 
                      820                 825                 830         
          Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 
                  835                 840                 845             
          Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 
              850                 855                 860                 
          Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 
          865                 870                 875                 880 
          His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 
                          885                 890                 895     
          Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 
                      900                 905                 910         
          Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 
                  915                 920                 925             
          Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 
              930                 935                 940                 
          Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 
          945                 950                 955                 960 
          Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 
                          965                 970                 975     
          Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 
                      980                 985                 990         
          Gly Arg Ile Tyr Met Ala Thr Asn  Pro Val Thr Ser Asp  Ser Thr Pro 
                  995                 1000                 1005             
          Ile Thr  Tyr Ala Gly Lys Thr  Tyr Asn Arg Cys Asn  Ala Asp Glu 
              1010                 1015                 1020             
          Val Ala  Ala Ala Asn Ile Val  Ile Ser Val Leu Ala  Pro Arg Ser 
              1025                 1030                 1035             
          Lys Lys  Asn Glu Glu Gln Asp  Asp Ile Pro Leu Ile  Thr Lys Lys 
              1040                 1045                 1050             
          Ala Glu  Ser Lys Ser Pro Pro  Lys Asp Arg Lys Arg  Ser Lys Thr 
              1055                 1060                 1065             
          Ser Gln  Leu Pro Gln Lys 
              1070                 
          <![CDATA[<210>  10]]>
          <![CDATA[<211>  1074]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  ]]>合成的
          <![CDATA[<400>  10]]>
          Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 
          1               5                   10                  15      
          Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 
                      20                  25                  30          
          Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 
                  35                  40                  45              
          Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 
              50                  55                  60                  
          Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 
          65                  70                  75                  80  
          Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 
                          85                  90                  95      
          Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 
                      100                 105                 110         
          Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 
                  115                 120                 125             
          Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 
              130                 135                 140                 
          Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 
          145                 150                 155                 160 
          Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 
                          165                 170                 175     
          Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 
                      180                 185                 190         
          Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 
                  195                 200                 205             
          Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 
              210                 215                 220                 
          Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 
          225                 230                 235                 240 
          Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 
                          245                 250                 255     
          Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 
                      260                 265                 270         
          Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 
                  275                 280                 285             
          Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 
              290                 295                 300                 
          Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 
          305                 310                 315                 320 
          Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 
                          325                 330                 335     
          Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 
                      340                 345                 350         
          Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 
                  355                 360                 365             
          Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 
              370                 375                 380                 
          Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 
          385                 390                 395                 400 
          Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 
                          405                 410                 415     
          Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 
                      420                 425                 430         
          Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 
                  435                 440                 445             
          Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 
              450                 455                 460                 
          Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg 
          465                 470                 475                 480 
          Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 
                          485                 490                 495     
          Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 
                      500                 505                 510         
          Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 
                  515                 520                 525             
          Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 
              530                 535                 540                 
          Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 
          545                 550                 555                 560 
          Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 
                          565                 570                 575     
          Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg 
                      580                 585                 590         
          Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 
                  595                 600                 605             
          Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 
              610                 615                 620                 
          Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 
          625                 630                 635                 640 
          Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 
                          645                 650                 655     
          Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 
                      660                 665                 670         
          Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 
                  675                 680                 685             
          Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 
              690                 695                 700                 
          Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 
          705                 710                 715                 720 
          Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 
                          725                 730                 735     
          Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 
                      740                 745                 750         
          Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 
                  755                 760                 765             
          Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 
              770                 775                 780                 
          Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 
          785                 790                 795                 800 
          Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 
                          805                 810                 815     
          Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 
                      820                 825                 830         
          Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 
                  835                 840                 845             
          Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 
              850                 855                 860                 
          Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 
          865                 870                 875                 880 
          His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 
                          885                 890                 895     
          Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 
                      900                 905                 910         
          Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 
                  915                 920                 925             
          Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 
              930                 935                 940                 
          Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 
          945                 950                 955                 960 
          Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 
                          965                 970                 975     
          Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 
                      980                 985                 990         
          Gly Arg Ile Tyr Met Ala Thr Asn  Pro Val Thr Ser Asp  Ser Thr Pro 
                  995                 1000                 1005             
          Ile Thr  Tyr Ala Gly Lys Thr  Tyr Asn Arg Cys Asn  Ala Asp Glu 
              1010                 1015                 1020             
          Val Ala  Ala Ala Asn Ile Val  Ile Ser Val Leu Ala  Pro Arg Ser 
              1025                 1030                 1035             
          Lys Lys  Asn Arg Glu Gln Asp  Asp Ile Pro Leu Ile  Thr Lys Lys 
              1040                 1045                 1050             
          Ala Glu  Ser Lys Ser Pro Pro  Lys Asp Arg Lys Arg  Ser Lys Thr 
              1055                 1060                 1065             
          Ser Gln  Leu Pro Gln Lys 
              1070                 
          <![CDATA[<210>  11]]>
          <![CDATA[<211>  1098]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  11]]>
          Met Ser Ile Ser Asn Asn Asn Ile Leu Pro Tyr Asn Pro Lys Leu Leu 
          1               5                   10                  15      
          Pro Asp Asp Arg Lys His Lys Met Leu Val Asp Thr Phe Asn Gln Leu 
                      20                  25                  30          
          Asp Leu Ile Arg Asn Asn Leu His Asp Met Ile Ile Ala Leu Tyr Gly 
                  35                  40                  45              
          Ala Leu Lys Tyr Asp Asn Ile Lys Gln Phe Ala Ser Lys Glu Lys Pro 
              50                  55                  60                  
          His Ile Ser Ala Asp Ala Leu Cys Ser Ile Asn Trp Phe Arg Leu Val 
          65                  70                  75                  80  
          Lys Thr Asn Glu Arg Lys Pro Ala Ile Glu Ser Asn Gln Ile Ile Ser 
                          85                  90                  95      
          Lys Phe Ile Gln Tyr Ser Gly His Thr Pro Asp Lys Tyr Ala Leu Ser 
                      100                 105                 110         
          His Ile Thr Gly Asn His Glu Pro Ser His Lys Trp Ile Asp Cys Arg 
                  115                 120                 125             
          Glu Tyr Ala Ile Asn Tyr Ala Arg Ile Met His Leu Ser Phe Ser Gln 
              130                 135                 140                 
          Phe Gln Asp Leu Ala Thr Ala Cys Leu Asn Cys Lys Ile Leu Ile Leu 
          145                 150                 155                 160 
          Asn Gly Thr Leu Thr Ser Ser Trp Ala Trp Gly Ala Asn Ser Ala Leu 
                          165                 170                 175     
          Phe Gly Gly Ser Asp Lys Glu Asn Phe Ser Val Lys Ala Lys Ile Leu 
                      180                 185                 190         
          Asn Ser Phe Ile Glu Asn Leu Lys Asp Glu Met Asn Thr Thr Lys Phe 
                  195                 200                 205             
          Gln Val Val Glu Lys Val Cys Gln Gln Ile Gly Ser Ser Asp Ala Ala 
              210                 215                 220                 
          Asp Leu Phe Asp Leu Tyr Arg Ser Thr Val Lys Asp Gly Asn Arg Gly 
          225                 230                 235                 240 
          Pro Ala Thr Gly Arg Asn Pro Lys Val Met Asn Leu Phe Ser Gln Asp 
                          245                 250                 255     
          Gly Glu Ile Ser Ser Glu Gln Arg Glu Asp Phe Ile Glu Ser Phe Gln 
                      260                 265                 270         
          Lys Val Met Gln Glu Lys Asn Ser Lys Gln Ile Ile Pro His Leu Asp 
                  275                 280                 285             
          Lys Leu Lys Tyr His Leu Val Lys Gln Ser Gly Leu Tyr Asp Ile Tyr 
              290                 295                 300                 
          Ser Trp Ala Ala Ala Ile Lys Asn Ala Asn Ser Thr Ile Val Ala Ser 
          305                 310                 315                 320 
          Asn Ser Ser Asn Leu Asn Thr Ile Leu Asn Lys Thr Glu Lys Gln Gln 
                          325                 330                 335     
          Thr Phe Glu Glu Leu Arg Lys Asp Glu Lys Ile Val Ala Cys Ser Lys 
                      340                 345                 350         
          Ile Leu Leu Ser Val Asn Asp Thr Leu Pro Glu Asp Leu His Tyr Asn 
                  355                 360                 365             
          Pro Ser Thr Ser Asn Leu Gly Lys Asn Leu Asp Val Phe Phe Asp Leu 
              370                 375                 380                 
          Leu Asn Glu Asn Ser Val His Thr Ile Glu Asn Lys Glu Glu Lys Asn 
          385                 390                 395                 400 
          Lys Ile Val Lys Glu Cys Val Asn Gln Tyr Met Glu Glu Cys Lys Gly 
                          405                 410                 415     
          Leu Asn Lys Pro Pro Met Pro Val Leu Leu Thr Phe Ile Ser Asp Tyr 
                      420                 425                 430         
          Ala His Lys His Gln Ala Gln Asp Phe Leu Ser Ala Ala Lys Met Asn 
                  435                 440                 445             
          Phe Ile Asp Leu Lys Ile Lys Ser Ile Lys Val Val Pro Thr Val His 
              450                 455                 460                 
          Gly Ser Ser Pro Tyr Thr Trp Ile Ser Asn Leu Ser Lys Lys Asn Lys 
          465                 470                 475                 480 
          Asp Gly Lys Met Ile Arg Thr Pro Asn Ser Ser Leu Ile Gly Trp Ile 
                          485                 490                 495     
          Ile Pro Pro Glu Glu Ile His Asp Gln Lys Phe Ala Gly Gln Asn Pro 
                      500                 505                 510         
          Ile Ile Trp Ala Val Leu Arg Val Tyr Cys Asn Asn Lys Trp Glu Met 
                  515                 520                 525             
          His His Phe Pro Phe Ser Asp Ser Arg Phe Phe Thr Glu Val Tyr Ala 
              530                 535                 540                 
          Tyr Lys Pro Asn Leu Pro Tyr Leu Pro Gly Gly Glu Asn Arg Ser Lys 
          545                 550                 555                 560 
          Arg Phe Gly Tyr Arg His Ser Thr Asn Leu Ser Asn Glu Ser Arg Gln 
                          565                 570                 575     
          Ile Leu Leu Asp Lys Ser Lys Tyr Ala Lys Ala Asn Lys Ser Val Leu 
                      580                 585                 590         
          Arg Cys Met Glu Asn Met Thr His Asn Val Val Phe Asp Pro Lys Thr 
                  595                 600                 605             
          Ser Leu Asn Ile Arg Ile Lys Thr Asp Lys Asn Asn Ser Pro Val Leu 
              610                 615                 620                 
          Asp Asp Lys Gly Arg Ile Thr Phe Val Met Gln Ile Asn His Arg Ile 
          625                 630                 635                 640 
          Leu Glu Lys Tyr Asn Asn Thr Lys Ile Glu Ile Gly Asp Arg Ile Leu 
                          645                 650                 655     
          Ala Tyr Asp Gln Asn Gln Ser Glu Asn His Thr Tyr Ala Ile Leu Gln 
                      660                 665                 670         
          Arg Thr Glu Glu Gly Ser His Ala His Gln Phe Asn Gly Trp Tyr Val 
                  675                 680                 685             
          Arg Val Leu Glu Thr Gly Lys Val Thr Ser Ile Val Gln Gly Leu Ser 
              690                 695                 700                 
          Gly Pro Ile Asp Gln Leu Asn Tyr Asp Gly Met Pro Val Thr Ser His 
          705                 710                 715                 720 
          Lys Phe Asn Cys Trp Gln Ala Asp Arg Ser Ala Phe Val Ser Gln Phe 
                          725                 730                 735     
          Ala Ser Leu Lys Ile Ser Glu Thr Glu Thr Phe Asp Glu Ala Tyr Gln 
                      740                 745                 750         
          Ala Ile Asn Ala Gln Gly Ala Tyr Thr Trp Asn Leu Phe Tyr Leu Arg 
                  755                 760                 765             
          Ile Leu Arg Lys Ala Leu Arg Val Cys His Met Glu Asn Ile Asn Gln 
              770                 775                 780                 
          Phe Arg Glu Glu Ile Leu Ala Ile Ser Lys Asn Arg Leu Ser Pro Met 
          785                 790                 795                 800 
          Ser Leu Gly Ser Leu Ser Gln Asn Ser Leu Lys Met Ile Arg Ala Phe 
                          805                 810                 815     
          Lys Ser Ile Ile Asn Cys Tyr Met Ser Arg Met Ser Phe Val Asp Glu 
                      820                 825                 830         
          Leu Gln Lys Lys Glu Gly Asp Leu Glu Leu His Thr Ile Met Arg Leu 
                  835                 840                 845             
          Thr Asp Asn Lys Leu Asn Asp Lys Arg Val Glu Lys Ile Asn Arg Ala 
              850                 855                 860                 
          Ser Ser Phe Leu Thr Asn Lys Ala His Ser Met Gly Cys Lys Met Ile 
          865                 870                 875                 880 
          Val Gly Glu Ser Asp Leu Pro Val Ala Asp Ser Lys Thr Ser Lys Lys 
                          885                 890                 895     
          Gln Asn Val Asp Arg Met Asp Trp Cys Ala Arg Ala Leu Ser His Lys 
                      900                 905                 910         
          Val Glu Tyr Ala Cys Lys Leu Met Gly Leu Ala Tyr Arg Gly Ile Pro 
                  915                 920                 925             
          Ala Tyr Met Ser Ser His Gln Asp Pro Leu Val His Leu Val Glu Ser 
              930                 935                 940                 
          Lys Arg Ser Val Leu Arg Pro Arg Phe Val Val Ala Asp Lys Ser Asp 
          945                 950                 955                 960 
          Val Lys Gln His His Leu Asp Asn Leu Arg Arg Met Leu Asn Ser Lys 
                          965                 970                 975     
          Thr Lys Val Gly Thr Ala Val Tyr Tyr Arg Glu Ala Val Glu Leu Met 
                      980                 985                 990         
          Cys Glu Glu Leu Gly Ile His Lys  Thr Asp Met Ala Lys  Gly Lys Val 
                  995                 1000                 1005             
          Ser Leu  Ser Asp Phe Val Asp  Lys Phe Ile Gly Glu  Lys Ala Ile 
              1010                 1015                 1020             
          Phe Pro  Gln Arg Gly Gly Arg  Phe Tyr Met Ser Thr  Lys Arg Leu 
              1025                 1030                 1035             
          Thr Thr  Gly Ala Lys Leu Ile  Cys Tyr Ser Gly Ser  Asp Val Trp 
              1040                 1045                 1050             
          Leu Ser  Asp Ala Asp Glu Ile  Ala Ala Ile Asn Ile  Gly Met Phe 
              1055                 1060                 1065             
          Val Val  Cys Asp Gln Thr Gly  Ala Phe Lys Lys Lys  Lys Lys Glu 
              1070                 1075                 1080             
          Lys Leu  Asp Asp Glu Glu Cys  Asp Ile Leu Pro Phe  Arg Pro Met 
              1085                 1090                 1095             
          <![CDATA[<210>  12]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  12]]>
          guuggaauga cuaauuuuug ugcccaccgu uggcac                                 36
          <![CDATA[<210>  13]]>
          <![CDATA[<211>  24]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  13]]>
          aauuuuugug cccaucguug gcac                                              24
          <![CDATA[<210>  14]]>
          <![CDATA[<211>  23]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  14]]>
          auuuuugugc ccaucguugg cac                                               23
          <![CDATA[<210>  15]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  15]]>
          guugcaaaac ccaagaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  16]]>
          <![CDATA[<211>  34]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  16]]>
          gcaacaccua agaaauccgu cuuucauuga cggg                                   34
          <![CDATA[<210>  17]]>
          <![CDATA[<211>  23]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  17]]>
          agaaauccgu cuuucauuga cgg                                               23
          <![CDATA[<210>  18]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  18]]>
          cuagcaauga ccuaauagug uguccuuagu ugacau                                 36
          <![CDATA[<210>  19]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  19]]>
          ccuacaauac cuaagaaauc cguccuaagu ugacgg                                 36
          <![CDATA[<210>  20]]>
          <![CDATA[<211>  22]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  20]]>
          auaguguguc cuuaguugac au                                                22
          <![CDATA[<210>  21]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  21]]>
          guuggaauga cuaauuuuug ugcccaccgu uggcac                                 36
          <![CDATA[<210>  22]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  22]]>
          cccacaauac cugagaaauc cguccuacgu ugacgg                                 36
          <![CDATA[<210>  23]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  23]]>
          ucucaacgau agucagacau guguccucag ugacac                                 36
          <![CDATA[<210>  24]]>
          <![CDATA[<211>  22]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  24]]>
          agacaugugu ccucagugac ac                                                22
          <![CDATA[<210>  25]]>
          <![CDATA[<211>  1798]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  25]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 
              610                 615                 620                 
          Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Glu  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Ser Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser Lys  Arg Pro Ala Ala Thr  Lys Lys Ala Gly Gln  Ala Lys Lys 
              1055                 1060                 1065             
          Lys Lys  Ser Gly Gly Ser Ser  Gly Gly Ser Ser Gly  Ser Glu Thr 
              1070                 1075                 1080             
          Pro Gly  Thr Ser Glu Ser Ala  Thr Pro Glu Ser Ser  Gly Gly Ser 
              1085                 1090                 1095             
          Ser Gly  Gly Ser Thr Leu Asn  Ile Glu Asp Glu Tyr  Arg Leu His 
              1100                 1105                 1110             
          Glu Thr  Ser Lys Glu Pro Asp  Val Ser Leu Gly Ser  Thr Trp Leu 
              1115                 1120                 1125             
          Ser Asp  Phe Pro Gln Ala Trp  Ala Glu Thr Gly Gly  Met Gly Leu 
              1130                 1135                 1140             
          Ala Val  Arg Gln Ala Pro Leu  Ile Ile Pro Leu Lys  Ala Thr Ser 
              1145                 1150                 1155             
          Thr Pro  Val Ser Ile Lys Gln  Tyr Pro Met Ser Gln  Glu Ala Arg 
              1160                 1165                 1170             
          Leu Gly  Ile Lys Pro His Ile  Gln Arg Leu Leu Asp  Gln Gly Ile 
              1175                 1180                 1185             
          Leu Val  Pro Cys Gln Ser Pro  Trp Asn Thr Pro Leu  Leu Pro Val 
              1190                 1195                 1200             
          Lys Lys  Pro Gly Thr Asn Asp  Tyr Arg Pro Val Gln  Asp Leu Arg 
              1205                 1210                 1215             
          Glu Val  Asn Lys Arg Val Glu  Asp Ile His Pro Thr  Val Pro Asn 
              1220                 1225                 1230             
          Pro Tyr  Asn Leu Leu Ser Gly  Leu Pro Pro Ser His  Gln Trp Tyr 
              1235                 1240                 1245             
          Thr Val  Leu Asp Leu Lys Asp  Ala Phe Phe Cys Leu  Arg Leu His 
              1250                 1255                 1260             
          Pro Thr  Ser Gln Pro Leu Phe  Ala Phe Glu Trp Arg  Asp Pro Glu 
              1265                 1270                 1275             
          Met Gly  Ile Ser Gly Gln Leu  Thr Trp Thr Arg Leu  Pro Gln Gly 
              1280                 1285                 1290             
          Phe Lys  Asn Ser Pro Thr Leu  Phe Asn Glu Ala Leu  His Arg Asp 
              1295                 1300                 1305             
          Leu Ala  Asp Phe Arg Ile Gln  His Pro Asp Leu Ile  Leu Leu Gln 
              1310                 1315                 1320             
          Tyr Val  Asp Asp Leu Leu Leu  Ala Ala Thr Ser Glu  Leu Asp Cys 
              1325                 1330                 1335             
          Gln Gln  Gly Thr Arg Ala Leu  Leu Gln Thr Leu Gly  Asn Leu Gly 
              1340                 1345                 1350             
          Tyr Arg  Ala Ser Ala Lys Lys  Ala Gln Ile Cys Gln  Lys Gln Val 
              1355                 1360                 1365             
          Lys Tyr  Leu Gly Tyr Leu Leu  Lys Glu Gly Gln Arg  Trp Leu Thr 
              1370                 1375                 1380             
          Glu Ala  Arg Lys Glu Thr Val  Met Gly Gln Pro Thr  Pro Lys Thr 
              1385                 1390                 1395             
          Pro Arg  Gln Leu Arg Glu Phe  Leu Gly Lys Ala Gly  Phe Cys Arg 
              1400                 1405                 1410             
          Leu Phe  Ile Pro Gly Phe Ala  Glu Met Ala Ala Pro  Leu Tyr Pro 
              1415                 1420                 1425             
          Leu Thr  Lys Pro Gly Thr Leu  Phe Asn Trp Gly Pro  Asp Gln Gln 
              1430                 1435                 1440             
          Lys Ala  Tyr Gln Glu Ile Lys  Gln Ala Leu Leu Thr  Ala Pro Ala 
              1445                 1450                 1455             
          Leu Gly  Leu Pro Asp Leu Thr  Lys Pro Phe Glu Leu  Phe Val Asp 
              1460                 1465                 1470             
          Glu Lys  Gln Gly Tyr Ala Lys  Gly Val Leu Thr Gln  Lys Leu Gly 
              1475                 1480                 1485             
          Pro Trp  Arg Arg Pro Val Ala  Tyr Leu Ser Lys Lys  Leu Asp Pro 
              1490                 1495                 1500             
          Val Ala  Ala Gly Trp Pro Pro  Cys Leu Arg Met Val  Ala Ala Ile 
              1505                 1510                 1515             
          Ala Val  Leu Thr Lys Asp Ala  Gly Lys Leu Thr Met  Gly Gln Pro 
              1520                 1525                 1530             
          Leu Val  Ile Leu Ala Pro His  Ala Val Glu Ala Leu  Val Lys Gln 
              1535                 1540                 1545             
          Pro Pro  Asp Arg Trp Leu Ser  Asn Ala Arg Met Thr  His Tyr Gln 
              1550                 1555                 1560             
          Ala Leu  Leu Leu Asp Thr Asp  Arg Val Gln Phe Gly  Pro Val Val 
              1565                 1570                 1575             
          Ala Leu  Asn Pro Ala Thr Leu  Leu Pro Leu Pro Glu  Glu Gly Leu 
              1580                 1585                 1590             
          Gln His  Asn Cys Leu Asp Ile  Leu Ala Glu Ala His  Gly Thr Arg 
              1595                 1600                 1605             
          Pro Asp  Leu Thr Asp Gln Pro  Leu Pro Asp Ala Asp  His Thr Trp 
              1610                 1615                 1620             
          Tyr Thr  Asp Gly Ser Ser Leu  Leu Gln Glu Gly Gln  Arg Lys Ala 
              1625                 1630                 1635             
          Gly Ala  Ala Val Thr Thr Glu  Thr Glu Val Ile Trp  Ala Lys Ala 
              1640                 1645                 1650             
          Leu Pro  Ala Gly Thr Ser Ala  Gln Arg Ala Glu Leu  Ile Ala Leu 
              1655                 1660                 1665             
          Thr Gln  Ala Leu Lys Met Ala  Glu Gly Lys Lys Leu  Asn Val Tyr 
              1670                 1675                 1680             
          Thr Asp  Ser Arg Tyr Ala Phe  Ala Thr Ala His Ile  His Gly Glu 
              1685                 1690                 1695             
          Ile Tyr  Arg Arg Arg Gly Trp  Leu Thr Ser Glu Gly  Lys Glu Ile 
              1700                 1705                 1710             
          Lys Asn  Lys Asp Glu Ile Leu  Ala Leu Leu Lys Ala  Leu Phe Leu 
              1715                 1720                 1725             
          Pro Lys  Arg Leu Ser Ile Ile  His Cys Pro Gly His  Gln Lys Gly 
              1730                 1735                 1740             
          His Ser  Ala Glu Ala Arg Gly  Asn Arg Met Ala Asp  Gln Ala Ala 
              1745                 1750                 1755             
          Arg Lys  Ala Ala Ile Thr Glu  Thr Pro Asp Thr Ser  Thr Leu Leu 
              1760                 1765                 1770             
          Ile Glu  Asn Ser Ser Pro Met  Lys Arg Thr Ala Asp  Gly Ser Glu 
              1775                 1780                 1785             
          Phe Glu  Ser Pro Lys Lys Lys  Arg Lys Val 
              1790                 1795             
          <![CDATA[<210>  26]]>
          <![CDATA[<211>  1798]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  26]]>
          Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 
          1               5                   10                  15      
          Arg Lys Val Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr 
                      20                  25                  30          
          Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe 
                  35                  40                  45              
          Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln 
              50                  55                  60                  
          Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile 
          65                  70                  75                  80  
          Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His 
                          85                  90                  95      
          Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro 
                      100                 105                 110         
          Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr 
                  115                 120                 125             
          Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile 
              130                 135                 140                 
          His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro 
          145                 150                 155                 160 
          Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys 
                          165                 170                 175     
          Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg 
                      180                 185                 190         
          Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro 
                  195                 200                 205             
          Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg 
              210                 215                 220                 
          Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln 
          225                 230                 235                 240 
          Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln 
                          245                 250                 255     
          Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg 
                      260                 265                 270         
          Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu 
                  275                 280                 285             
          Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys 
              290                 295                 300                 
          Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg 
          305                 310                 315                 320 
          Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe 
                          325                 330                 335     
          Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu 
                      340                 345                 350         
          Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln 
                  355                 360                 365             
          Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro 
              370                 375                 380                 
          Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu 
          385                 390                 395                 400 
          Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys 
                          405                 410                 415     
          Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val 
                      420                 425                 430         
          Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly 
                  435                 440                 445             
          Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys 
              450                 455                 460                 
          Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln 
          465                 470                 475                 480 
          Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala 
                          485                 490                 495     
          Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His 
                      500                 505                 510         
          Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu 
                  515                 520                 525             
          Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly 
              530                 535                 540                 
          Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr 
          545                 550                 555                 560 
          Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser 
                          565                 570                 575     
          Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala 
                      580                 585                 590         
          Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala 
                  595                 600                 605             
          Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr 
              610                 615                 620                 
          Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu 
          625                 630                 635                 640 
          Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly 
                          645                 650                 655     
          His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp 
                      660                 665                 670         
          Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr 
                  675                 680                 685             
          Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Ser Gly Gly Ser 
              690                 695                 700                 
          Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 
          705                 710                 715                 720 
          Ser Gly Gly Ser Ser Gly Gly Ser Met Ser Ser Ala Ile Lys Ser Tyr 
                          725                 730                 735     
          Lys Ser Val Leu Arg Pro Asn Glu Arg Lys Asn Gln Leu Leu Lys Ser 
                      740                 745                 750         
          Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala Phe Phe Phe Lys Met Leu 
                  755                 760                 765             
          Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu Ile Val Arg Phe Ser Thr 
              770                 775                 780                 
          Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala Leu Trp Cys Ala Val Asn 
          785                 790                 795                 800 
          Trp Phe Arg Pro Val Ser Gln Asp Ser Leu Thr His Thr Ile Ala Ser 
                          805                 810                 815     
          Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr Tyr Gly Gly Thr Ala Ser 
                      820                 825                 830         
          Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser Ile Gly Glu Ser Tyr Tyr 
                  835                 840                 845             
          Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp Leu Cys Arg Glu Leu Gly 
              850                 855                 860                 
          Val Glu Val Ser Asp Leu Thr His Asp Leu Glu Ile Leu Cys Arg Glu 
          865                 870                 875                 880 
          Lys Cys Leu Ala Val Ala Thr Glu Ser Asn Gln Asn Asn Ser Ile Ile 
                          885                 890                 895     
          Ser Val Leu Phe Gly Thr Gly Glu Lys Glu Asp Arg Ser Val Lys Leu 
                      900                 905                 910         
          Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile Ser Asn Leu Lys Glu Ile 
                  915                 920                 925             
          Pro Lys Asn Val Ala Pro Ile Gln Glu Ile Ile Leu Asn Val Ala Lys 
              930                 935                 940                 
          Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr Ala Gly Asn Leu Gly Ala 
          945                 950                 955                 960 
          Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys Asp Gly Gln Lys Glu Phe 
                          965                 970                 975     
          Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys Lys Val Ile Arg Gly Lys 
                      980                 985                 990         
          Ser Lys Glu Arg Asp Trp Cys Cys  Gln Glu Glu Leu Arg  Ser Tyr Val 
                  995                 1000                 1005             
          Glu Gln  Asn Thr Ile Gln Tyr  Asp Leu Trp Ala Trp  Gly Glu Met 
              1010                 1015                 1020             
          Phe Asn  Lys Ala His Thr Ala  Leu Lys Ile Lys Ser  Thr Arg Asn 
              1025                 1030                 1035             
          Tyr Asn  Phe Ala Lys Gln Arg  Leu Glu Gln Phe Lys  Glu Ile Gln 
              1040                 1045                 1050             
          Ser Leu  Asn Asn Leu Leu Val  Val Lys Lys Leu Asn  Asp Phe Phe 
              1055                 1060                 1065             
          Asp Ser  Glu Phe Phe Ser Gly  Glu Glu Thr Tyr Thr  Ile Cys Val 
              1070                 1075                 1080             
          His His  Leu Gly Gly Lys Asp  Leu Ser Lys Leu Tyr  Lys Ala Trp 
              1085                 1090                 1095             
          Glu Asp  Asp Pro Ala Asp Pro  Glu Asn Ala Ile Val  Val Leu Cys 
              1100                 1105                 1110             
          Asp Asp  Leu Lys Asn Asn Phe  Lys Lys Glu Pro Ile  Arg Asn Ile 
              1115                 1120                 1125             
          Leu Arg  Tyr Ile Phe Thr Ile  Arg Gln Glu Cys Ser  Ala Gln Asp 
              1130                 1135                 1140             
          Ile Leu  Ala Ala Ala Lys Tyr  Asn Gln Gln Leu Asp  Arg Tyr Lys 
              1145                 1150                 1155             
          Ser Gln  Lys Ala Asn Pro Ser  Val Leu Gly Asn Gln  Gly Phe Thr 
              1160                 1165                 1170             
          Trp Thr  Asn Ala Val Ile Leu  Pro Glu Lys Ala Gln  Arg Asn Asp 
              1175                 1180                 1185             
          Arg Pro  Asn Ser Leu Asp Leu  Arg Ile Trp Leu Tyr  Leu Lys Leu 
              1190                 1195                 1200             
          Arg His  Pro Asp Gly Arg Trp  Lys Lys Ala His Ile  Pro Phe Tyr 
              1205                 1210                 1215             
          Asp Thr  Arg Phe Phe Gln Glu  Ile Tyr Ala Ala Gly  Asn Ser Pro 
              1220                 1225                 1230             
          Val Asp  Thr Cys Gln Phe Arg  Thr Pro Arg Phe Gly  Tyr His Leu 
              1235                 1240                 1245             
          Pro Lys  Leu Thr Asp Gln Thr  Ala Ile Arg Val Asn  Lys Lys His 
              1250                 1255                 1260             
          Val Lys  Ala Ala Lys Thr Glu  Ala Arg Ile Arg Leu  Ala Ile Gln 
              1265                 1270                 1275             
          Gln Gly  Thr Leu Pro Val Ser  Asn Leu Lys Ile Thr  Glu Ile Ser 
              1280                 1285                 1290             
          Ala Thr  Ile Asn Ser Lys Gly  Gln Val Arg Ile Pro  Val Lys Phe 
              1295                 1300                 1305             
          Arg Val  Gly Arg Gln Lys Gly  Thr Leu Gln Ile Gly  Asp Arg Phe 
              1310                 1315                 1320             
          Cys Gly  Tyr Asp Gln Asn Gln  Thr Ala Ser His Ala  Tyr Ser Leu 
              1325                 1330                 1335             
          Trp Glu  Val Val Lys Glu Gly  Gln Tyr His Lys Glu  Leu Gly Cys 
              1340                 1345                 1350             
          Phe Val  Arg Phe Ile Ser Ser  Gly Asp Ile Val Ser  Ile Thr Glu 
              1355                 1360                 1365             
          Asn Arg  Gly Asn Gln Phe Asp  Gln Leu Ser Tyr Glu  Gly Leu Ala 
              1370                 1375                 1380             
          Tyr Pro  Gln Tyr Ala Asp Trp  Arg Lys Lys Ala Ser  Lys Phe Val 
              1385                 1390                 1395             
          Ser Leu  Trp Gln Ile Thr Lys  Lys Asn Lys Lys Lys  Glu Ile Val 
              1400                 1405                 1410             
          Thr Val  Glu Ala Lys Glu Lys  Phe Asp Ala Ile Cys  Lys Tyr Gln 
              1415                 1420                 1425             
          Pro Arg  Leu Tyr Lys Phe Asn  Lys Glu Tyr Ala Tyr  Leu Leu Arg 
              1430                 1435                 1440             
          Asp Ile  Val Arg Gly Lys Ser  Leu Val Glu Leu Gln  Gln Ile Arg 
              1445                 1450                 1455             
          Gln Glu  Ile Phe Arg Phe Ile  Glu Gln Asp Cys Gly  Val Thr Arg 
              1460                 1465                 1470             
          Leu Gly  Ser Leu Ser Leu Ser  Thr Leu Glu Thr Val  Lys Ala Val 
              1475                 1480                 1485             
          Lys Gly  Ile Ile Tyr Ser Tyr  Phe Ser Thr Ala Leu  Asn Ala Ser 
              1490                 1495                 1500             
          Lys Asn  Asn Pro Ile Ser Asp  Glu Gln Arg Lys Glu  Phe Asp Pro 
              1505                 1510                 1515             
          Glu Leu  Phe Ala Leu Leu Glu  Lys Leu Glu Leu Ile  Arg Thr Arg 
              1520                 1525                 1530             
          Lys Lys  Lys Gln Lys Val Glu  Arg Ile Ala Asn Ser  Leu Ile Gln 
              1535                 1540                 1545             
          Thr Cys  Leu Glu Asn Asn Ile  Lys Phe Ile Arg Gly  Glu Gly Asp 
              1550                 1555                 1560             
          Leu Ser  Thr Thr Asn Asn Ala  Thr Lys Lys Lys Ala  Asn Ser Arg 
              1565                 1570                 1575             
          Ser Met  Asp Trp Leu Ala Arg  Gly Val Phe Asn Lys  Ile Arg Gln 
              1580                 1585                 1590             
          Leu Ala  Pro Met His Asn Ile  Thr Leu Phe Gly Cys  Gly Ser Leu 
              1595                 1600                 1605             
          Tyr Thr  Ser His Gln Asp Pro  Leu Val His Arg Asn  Pro Asp Lys 
              1610                 1615                 1620             
          Ala Met  Lys Cys Arg Trp Ala  Ala Ile Pro Val Lys  Asp Ile Gly 
              1625                 1630                 1635             
          Asp Trp  Val Leu Arg Lys Leu  Ser Gln Asn Leu Arg  Ala Lys Asn 
              1640                 1645                 1650             
          Arg Gly  Thr Gly Glu Tyr Tyr  His Gln Gly Val Lys  Glu Phe Leu 
              1655                 1660                 1665             
          Ser His  Tyr Glu Leu Gln Asp  Leu Glu Glu Glu Leu  Leu Lys Trp 
              1670                 1675                 1680             
          Arg Ser  Asp Arg Lys Ser Asn  Ile Pro Cys Trp Val  Leu Gln Asn 
              1685                 1690                 1695             
          Arg Leu  Ala Glu Lys Leu Gly  Asn Lys Glu Ala Val  Val Tyr Ile 
              1700                 1705                 1710             
          Pro Val  Arg Gly Gly Arg Ile  Tyr Phe Ala Thr His  Lys Val Ala 
              1715                 1720                 1725             
          Thr Gly  Ala Val Ser Ile Val  Phe Asp Gln Lys Gln  Val Trp Val 
              1730                 1735                 1740             
          Cys Asn  Ala Asp His Val Ala  Ala Ala Asn Ile Ala  Leu Thr Gly 
              1745                 1750                 1755             
          Lys Gly  Ile Gly Glu Gln Ser  Ser Asp Glu Glu Asn  Pro Asp Gly 
              1760                 1765                 1770             
          Ser Arg  Ile Lys Leu Gln Leu  Thr Ser Lys Arg Pro  Ala Ala Thr 
              1775                 1780                 1785             
          Lys Lys  Ala Gly Gln Ala Lys  Lys Lys Lys 
              1790                 1795             
          <![CDATA[<210>  27]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  27]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag                         43
          <![CDATA[<210>  28]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(4)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (40)..(43)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<400>  28]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag                         43
          <![CDATA[<210>  29]]>
          <![CDATA[<211>  678]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  29]]>
          Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 
          1               5                   10                  15      
          Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 
                      20                  25                  30          
          Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 
                  35                  40                  45              
          Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 
              50                  55                  60                  
          Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 
          65                  70                  75                  80  
          Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 
                          85                  90                  95      
          Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 
                      100                 105                 110         
          Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 
                  115                 120                 125             
          Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 
              130                 135                 140                 
          Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 
          145                 150                 155                 160 
          Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 
                          165                 170                 175     
          Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 
                      180                 185                 190         
          Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 
                  195                 200                 205             
          Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 
              210                 215                 220                 
          Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 
          225                 230                 235                 240 
          Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 
                          245                 250                 255     
          Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 
                      260                 265                 270         
          Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 
                  275                 280                 285             
          Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 
              290                 295                 300                 
          Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 
          305                 310                 315                 320 
          Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 
                          325                 330                 335     
          Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 
                      340                 345                 350         
          Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 
                  355                 360                 365             
          Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 
              370                 375                 380                 
          Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 
          385                 390                 395                 400 
          Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 
                          405                 410                 415     
          Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 
                      420                 425                 430         
          Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 
                  435                 440                 445             
          Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 
              450                 455                 460                 
          Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 
          465                 470                 475                 480 
          Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 
                          485                 490                 495     
          Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 
                      500                 505                 510         
          Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 
                  515                 520                 525             
          Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 
              530                 535                 540                 
          Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 
          545                 550                 555                 560 
          Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 
                          565                 570                 575     
          Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 
                      580                 585                 590         
          His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 
                  595                 600                 605             
          Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 
              610                 615                 620                 
          Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 
          625                 630                 635                 640 
          Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 
                          645                 650                 655     
          Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 
                      660                 665                 670         
          Ile Glu Asn Ser Ser Pro 
                  675             
          <![CDATA[<210>  30]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  30]]>
          gtagcctctc ccgctctggt                                                   20
          <![CDATA[<210>  31]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(3)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (40)..(42)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<400>  31]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag                         43
          <![CDATA[<210>  32]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  32]]>
          gggaagtggt tggtcagcat                                                   20
          <![CDATA[<210>  33]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(4)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(3)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (40)..(42)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (40)..(43)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<400>  33]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag                         43
          <![CDATA[<210>  34]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  34]]>
          gagccagtgt tgctagtcaa                                                   20
          <![CDATA[<210>  35]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  35]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca                                        90
          <![CDATA[<210>  36]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  36]]>
          aatcctccac cagtcatggt                                                   20
          <![CDATA[<210>  37]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(4)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (87)..(90)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<400>  37]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca                                        90
          <![CDATA[<210>  38]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213> ]]> 人工序列
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  38]]>
          ttaaactctc catggaccag                                                   20
          <![CDATA[<210>  39]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(3)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (87)..(89)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<400>  39]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca                                        90
          <![CDATA[<210>  40]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  40]]>
          agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu       60
          cuccccgagu gguucagggc ccagcuaggg auccagaucu gggugauuua ggcucccucu      120
          gucuggauca guccucc                                                     137
          <![CDATA[<210>  41]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  41]]>
          agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu       60
          cuccccgagu gguucagggc ccagcuaggg auccagaucu gggugau                    107
          <![CDATA[<210>  42]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  42]]>
          agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugcacccc cauaaggggg       60
          gacauucuuu guagccucuc cccgaguggu ucagggccca gcuaggg                    107
          <![CDATA[<210>  43]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  43]]>
          agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu       60
          cuccccgagu gguucagggc ccagcuaggg                                        90
          <![CDATA[<210>  44]]>
          <![CDATA[<211>  94]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  44]]>
          agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu       60
          cucccagcgg cucugguuca gggcccagcu aggg                                   94
          <![CDATA[<210>  45]]>
          <![CDATA[<211>  86]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  45]]>
          agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu       60
          cucccugguu cagggcccag cuaggg                                            86
          <![CDATA[<210>  46]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(4)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(3)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (87)..(89)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (87)..(90)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<400>  46]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca                                        90
          <![CDATA[<210>  47]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  47]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa                    107
          <![CDATA[<210>  48]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(4)]]>
          <![CDATA[<223>  用硫]]>代磷酸酯修飾的
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (104)..(107)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<400>  48]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa                    107
          <![CDATA[<210>  49]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(3)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (104)..(106)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<400>  49]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa                    107
          <![CDATA[<210>  50]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(4)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (1)..(3)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (104)..(106)]]>
          <![CDATA[<223>  用2'-O-甲基化修飾的]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  尚未歸類的特徵]]>
          <![CDATA[<222>  (104)..(107)]]>
          <![CDATA[<223>  用硫代磷酸酯修飾的]]>
          <![CDATA[<400>  50]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa                    107
          <![CDATA[<210>  51]]>
          <![CDATA[<211>  1074]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  51]]>
          Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 
          1               5                   10                  15      
          Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 
                      20                  25                  30          
          Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 
                  35                  40                  45              
          Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 
              50                  55                  60                  
          Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 
          65                  70                  75                  80  
          Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 
                          85                  90                  95      
          Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 
                      100                 105                 110         
          Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 
                  115                 120                 125             
          Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 
              130                 135                 140                 
          Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 
          145                 150                 155                 160 
          Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 
                          165                 170                 175     
          Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 
                      180                 185                 190         
          Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 
                  195                 200                 205             
          Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 
              210                 215                 220                 
          Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 
          225                 230                 235                 240 
          Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 
                          245                 250                 255     
          Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 
                      260                 265                 270         
          Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 
                  275                 280                 285             
          Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 
              290                 295                 300                 
          Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 
          305                 310                 315                 320 
          Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 
                          325                 330                 335     
          Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 
                      340                 345                 350         
          Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 
                  355                 360                 365             
          Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 
              370                 375                 380                 
          Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 
          385                 390                 395                 400 
          Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 
                          405                 410                 415     
          Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 
                      420                 425                 430         
          Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 
                  435                 440                 445             
          Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 
              450                 455                 460                 
          Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg 
          465                 470                 475                 480 
          Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys Ala His Leu Pro Phe 
                          485                 490                 495     
          Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 
                      500                 505                 510         
          Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 
                  515                 520                 525             
          Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 
              530                 535                 540                 
          Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 
          545                 550                 555                 560 
          Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 
                          565                 570                 575     
          Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg 
                      580                 585                 590         
          Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 
                  595                 600                 605             
          Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 
              610                 615                 620                 
          Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 
          625                 630                 635                 640 
          Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 
                          645                 650                 655     
          Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 
                      660                 665                 670         
          Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 
                  675                 680                 685             
          Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 
              690                 695                 700                 
          Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 
          705                 710                 715                 720 
          Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 
                          725                 730                 735     
          Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 
                      740                 745                 750         
          Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 
                  755                 760                 765             
          Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 
              770                 775                 780                 
          Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 
          785                 790                 795                 800 
          Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 
                          805                 810                 815     
          Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 
                      820                 825                 830         
          Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 
                  835                 840                 845             
          Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 
              850                 855                 860                 
          Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 
          865                 870                 875                 880 
          His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 
                          885                 890                 895     
          Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 
                      900                 905                 910         
          Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 
                  915                 920                 925             
          Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 
              930                 935                 940                 
          Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 
          945                 950                 955                 960 
          Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 
                          965                 970                 975     
          Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 
                      980                 985                 990         
          Gly Arg Ile Tyr Met Ala Thr Asn  Pro Val Thr Ser Asp  Ser Thr Pro 
                  995                 1000                 1005             
          Ile Thr  Tyr Ala Gly Lys Thr  Tyr Asn Arg Cys Asn  Ala Asp Glu 
              1010                 1015                 1020             
          Val Ala  Ala Ala Asn Ile Val  Ile Ser Val Leu Ala  Pro Arg Ser 
              1025                 1030                 1035             
          Lys Lys  Asn Arg Glu Gln Asp  Asp Ile Pro Leu Ile  Thr Lys Lys 
              1040                 1045                 1050             
          Ala Glu  Ser Lys Ser Pro Pro  Lys Asp Arg Lys Arg  Ser Lys Thr 
              1055                 1060                 1065             
          Ser Gln  Leu Pro Gln Lys 
              1070                 
          <![CDATA[<210>  52]]>
          <![CDATA[<211>  1832]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  52]]>
          Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ala 
          1               5                   10                  15      
          Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala Arg Lys 
                      20                  25                  30          
          Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly Gln Arg 
                  35                  40                  45              
          Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr Leu Glu 
              50                  55                  60                  
          Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val Cys Ala 
          65                  70                  75                  80  
          Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys Asp Gly 
                          85                  90                  95      
          Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser Gly Lys 
                      100                 105                 110         
          Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser Ser Asp 
                  115                 120                 125             
          Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe Gln Arg 
              130                 135                 140                 
          Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met Leu Phe 
          145                 150                 155                 160 
          Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr Ala Ala 
                          165                 170                 175     
          Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser Lys Lys 
                      180                 185                 190         
          Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn Glu Asn 
                  195                 200                 205             
          Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu Asn Ala 
              210                 215                 220                 
          Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala Gly Gly 
          225                 230                 235                 240 
          Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met Val Ser 
                          245                 250                 255     
          Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val Leu Lys 
                      260                 265                 270         
          Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu Lys Gln 
                  275                 280                 285             
          Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val Tyr Ser 
              290                 295                 300                 
          Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr Thr Arg 
          305                 310                 315                 320 
          Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu Leu Lys 
                          325                 330                 335     
          Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val Leu Asn 
                      340                 345                 350         
          Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe Asn Ile 
                  355                 360                 365             
          Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser Lys Leu 
              370                 375                 380                 
          Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly Ile Gln 
          385                 390                 395                 400 
          Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro Ile Arg 
                          405                 410                 415     
          Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser Ala Glu 
                      420                 425                 430         
          Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys Ile Ser 
                  435                 440                 445             
          Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp Ala Phe 
              450                 455                 460                 
          Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys Arg His 
          465                 470                 475                 480 
          Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg Ala Glu 
                          485                 490                 495     
          Leu His Tyr Asp Gly Lys Lys Ala Lys Ala His Leu Pro Phe Tyr Asn 
                      500                 505                 510         
          Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val Ala Glu 
                  515                 520                 525             
          Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly Lys Asp 
              530                 535                 540                 
          Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr Lys Lys 
          545                 550                 555                 560 
          Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala Asn Thr 
                          565                 570                 575     
          Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys Arg Glu 
                      580                 585                 590         
          Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg Asp Arg 
                  595                 600                 605             
          Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp Arg Asn 
              610                 615                 620                 
          Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro Pro Gly 
          625                 630                 635                 640 
          Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr Ile Lys 
                          645                 650                 655     
          Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser Thr Thr 
                      660                 665                 670         
          Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg Phe Lys 
                  675                 680                 685             
          Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile Arg Gln 
              690                 695                 700                 
          Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile Pro Glu 
          705                 710                 715                 720 
          Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val Phe Asn 
                          725                 730                 735     
          Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala Lys Lys 
                      740                 745                 750         
          Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser Lys Asp 
                  755                 760                 765             
          Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp Ala Ser 
              770                 775                 780                 
          Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr Phe Asn 
          785                 790                 795                 800 
          Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn Pro Val 
                          805                 810                 815     
          Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn Lys Arg 
                      820                 825                 830         
          Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu Ala Leu 
                  835                 840                 845             
          Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly Glu Val 
              850                 855                 860                 
          Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp Trp Cys 
          865                 870                 875                 880 
          Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe His Gly 
                          885                 890                 895     
          Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln Asp Pro 
                      900                 905                 910         
          Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala Arg Phe 
                  915                 920                 925             
          Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg Asn Phe 
              930                 935                 940                 
          Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr Lys Gln 
          945                 950                 955                 960 
          Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His Ala Glu 
                          965                 970                 975     
          Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys Ile Leu 
                      980                 985                 990         
          Glu Asp Lys Asn Leu Thr Ser Val  Ile Ile Pro Lys Arg  Gly Gly Arg 
                  995                 1000                 1005             
          Ile Tyr  Met Ala Thr Asn Pro  Val Thr Ser Asp Ser  Thr Pro Ile 
              1010                 1015                 1020             
          Thr Tyr  Ala Gly Lys Thr Tyr  Asn Arg Cys Asn Ala  Asp Glu Val 
              1025                 1030                 1035             
          Ala Ala  Ala Asn Ile Val Ile  Ser Val Leu Ala Pro  Arg Ser Lys 
              1040                 1045                 1050             
          Lys Asn  Arg Glu Gln Asp Asp  Ile Pro Leu Ile Thr  Lys Lys Ala 
              1055                 1060                 1065             
          Glu Ser  Lys Ser Pro Pro Lys  Asp Arg Lys Arg Ser  Lys Thr Ser 
              1070                 1075                 1080             
          Gln Leu  Pro Gln Lys Lys Arg  Pro Ala Ala Thr Lys  Lys Ala Gly 
              1085                 1090                 1095             
          Gln Ala  Lys Lys Lys Lys Ser  Gly Gly Ser Ser Gly  Gly Ser Ser 
              1100                 1105                 1110             
          Gly Ser  Glu Thr Pro Gly Thr  Ser Glu Ser Ala Thr  Pro Glu Ser 
              1115                 1120                 1125             
          Ser Gly  Gly Ser Ser Gly Gly  Ser Thr Leu Asn Ile  Glu Asp Glu 
              1130                 1135                 1140             
          Tyr Arg  Leu His Glu Thr Ser  Lys Glu Pro Asp Val  Ser Leu Gly 
              1145                 1150                 1155             
          Ser Thr  Trp Leu Ser Asp Phe  Pro Gln Ala Trp Ala  Glu Thr Gly 
              1160                 1165                 1170             
          Gly Met  Gly Leu Ala Val Arg  Gln Ala Pro Leu Ile  Ile Pro Leu 
              1175                 1180                 1185             
          Lys Ala  Thr Ser Thr Pro Val  Ser Ile Lys Gln Tyr  Pro Met Ser 
              1190                 1195                 1200             
          Gln Glu  Ala Arg Leu Gly Ile  Lys Pro His Ile Gln  Arg Leu Leu 
              1205                 1210                 1215             
          Asp Gln  Gly Ile Leu Val Pro  Cys Gln Ser Pro Trp  Asn Thr Pro 
              1220                 1225                 1230             
          Leu Leu  Pro Val Lys Lys Pro  Gly Thr Asn Asp Tyr  Arg Pro Val 
              1235                 1240                 1245             
          Gln Asp  Leu Arg Glu Val Asn  Lys Arg Val Glu Asp  Ile His Pro 
              1250                 1255                 1260             
          Thr Val  Pro Asn Pro Tyr Asn  Leu Leu Ser Gly Leu  Pro Pro Ser 
              1265                 1270                 1275             
          His Gln  Trp Tyr Thr Val Leu  Asp Leu Lys Asp Ala  Phe Phe Cys 
              1280                 1285                 1290             
          Leu Arg  Leu His Pro Thr Ser  Gln Pro Leu Phe Ala  Phe Glu Trp 
              1295                 1300                 1305             
          Arg Asp  Pro Glu Met Gly Ile  Ser Gly Gln Leu Thr  Trp Thr Arg 
              1310                 1315                 1320             
          Leu Pro  Gln Gly Phe Lys Asn  Ser Pro Thr Leu Phe  Asn Glu Ala 
              1325                 1330                 1335             
          Leu His  Arg Asp Leu Ala Asp  Phe Arg Ile Gln His  Pro Asp Leu 
              1340                 1345                 1350             
          Ile Leu  Leu Gln Tyr Val Asp  Asp Leu Leu Leu Ala  Ala Thr Ser 
              1355                 1360                 1365             
          Glu Leu  Asp Cys Gln Gln Gly  Thr Arg Ala Leu Leu  Gln Thr Leu 
              1370                 1375                 1380             
          Gly Asn  Leu Gly Tyr Arg Ala  Ser Ala Lys Lys Ala  Gln Ile Cys 
              1385                 1390                 1395             
          Gln Lys  Gln Val Lys Tyr Leu  Gly Tyr Leu Leu Lys  Glu Gly Gln 
              1400                 1405                 1410             
          Arg Trp  Leu Thr Glu Ala Arg  Lys Glu Thr Val Met  Gly Gln Pro 
              1415                 1420                 1425             
          Thr Pro  Lys Thr Pro Arg Gln  Leu Arg Glu Phe Leu  Gly Lys Ala 
              1430                 1435                 1440             
          Gly Phe  Cys Arg Leu Phe Ile  Pro Gly Phe Ala Glu  Met Ala Ala 
              1445                 1450                 1455             
          Pro Leu  Tyr Pro Leu Thr Lys  Pro Gly Thr Leu Phe  Asn Trp Gly 
              1460                 1465                 1470             
          Pro Asp  Gln Gln Lys Ala Tyr  Gln Glu Ile Lys Gln  Ala Leu Leu 
              1475                 1480                 1485             
          Thr Ala  Pro Ala Leu Gly Leu  Pro Asp Leu Thr Lys  Pro Phe Glu 
              1490                 1495                 1500             
          Leu Phe  Val Asp Glu Lys Gln  Gly Tyr Ala Lys Gly  Val Leu Thr 
              1505                 1510                 1515             
          Gln Lys  Leu Gly Pro Trp Arg  Arg Pro Val Ala Tyr  Leu Ser Lys 
              1520                 1525                 1530             
          Lys Leu  Asp Pro Val Ala Ala  Gly Trp Pro Pro Cys  Leu Arg Met 
              1535                 1540                 1545             
          Val Ala  Ala Ile Ala Val Leu  Thr Lys Asp Ala Gly  Lys Leu Thr 
              1550                 1555                 1560             
          Met Gly  Gln Pro Leu Val Ile  Leu Ala Pro His Ala  Val Glu Ala 
              1565                 1570                 1575             
          Leu Val  Lys Gln Pro Pro Asp  Arg Trp Leu Ser Asn  Ala Arg Met 
              1580                 1585                 1590             
          Thr His  Tyr Gln Ala Leu Leu  Leu Asp Thr Asp Arg  Val Gln Phe 
              1595                 1600                 1605             
          Gly Pro  Val Val Ala Leu Asn  Pro Ala Thr Leu Leu  Pro Leu Pro 
              1610                 1615                 1620             
          Glu Glu  Gly Leu Gln His Asn  Cys Leu Asp Ile Leu  Ala Glu Ala 
              1625                 1630                 1635             
          His Gly  Thr Arg Pro Asp Leu  Thr Asp Gln Pro Leu  Pro Asp Ala 
              1640                 1645                 1650             
          Asp His  Thr Trp Tyr Thr Asp  Gly Ser Ser Leu Leu  Gln Glu Gly 
              1655                 1660                 1665             
          Gln Arg  Lys Ala Gly Ala Ala  Val Thr Thr Glu Thr  Glu Val Ile 
              1670                 1675                 1680             
          Trp Ala  Lys Ala Leu Pro Ala  Gly Thr Ser Ala Gln  Arg Ala Glu 
              1685                 1690                 1695             
          Leu Ile  Ala Leu Thr Gln Ala  Leu Lys Met Ala Glu  Gly Lys Lys 
              1700                 1705                 1710             
          Leu Asn  Val Tyr Thr Asp Ser  Arg Tyr Ala Phe Ala  Thr Ala His 
              1715                 1720                 1725             
          Ile His  Gly Glu Ile Tyr Arg  Arg Arg Gly Trp Leu  Thr Ser Glu 
              1730                 1735                 1740             
          Gly Lys  Glu Ile Lys Asn Lys  Asp Glu Ile Leu Ala  Leu Leu Lys 
              1745                 1750                 1755             
          Ala Leu  Phe Leu Pro Lys Arg  Leu Ser Ile Ile His  Cys Pro Gly 
              1760                 1765                 1770             
          His Gln  Lys Gly His Ser Ala  Glu Ala Arg Gly Asn  Arg Met Ala 
              1775                 1780                 1785             
          Asp Gln  Ala Ala Arg Lys Ala  Ala Ile Thr Glu Thr  Pro Asp Thr 
              1790                 1795                 1800             
          Ser Thr  Leu Leu Ile Glu Asn  Ser Ser Pro Met Lys  Arg Thr Ala 
              1805                 1810                 1815             
          Asp Gly  Ser Glu Phe Glu Ser  Pro Lys Lys Lys Arg  Lys Val 
              1820                 1825                 1830         
          <![CDATA[<210>  53]]>
          <![CDATA[<211>  1818]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  53]]>
          Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 
          1               5                   10                  15      
          Arg Lys Val Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr 
                      20                  25                  30          
          Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe 
                  35                  40                  45              
          Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln 
              50                  55                  60                  
          Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile 
          65                  70                  75                  80  
          Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His 
                          85                  90                  95      
          Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro 
                      100                 105                 110         
          Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr 
                  115                 120                 125             
          Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile 
              130                 135                 140                 
          His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro 
          145                 150                 155                 160 
          Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys 
                          165                 170                 175     
          Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg 
                      180                 185                 190         
          Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro 
                  195                 200                 205             
          Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg 
              210                 215                 220                 
          Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln 
          225                 230                 235                 240 
          Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln 
                          245                 250                 255     
          Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg 
                      260                 265                 270         
          Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu 
                  275                 280                 285             
          Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys 
              290                 295                 300                 
          Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg 
          305                 310                 315                 320 
          Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe 
                          325                 330                 335     
          Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu 
                      340                 345                 350         
          Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln 
                  355                 360                 365             
          Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro 
              370                 375                 380                 
          Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu 
          385                 390                 395                 400 
          Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys 
                          405                 410                 415     
          Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val 
                      420                 425                 430         
          Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly 
                  435                 440                 445             
          Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys 
              450                 455                 460                 
          Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln 
          465                 470                 475                 480 
          Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala 
                          485                 490                 495     
          Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His 
                      500                 505                 510         
          Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu 
                  515                 520                 525             
          Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly 
              530                 535                 540                 
          Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr 
          545                 550                 555                 560 
          Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser 
                          565                 570                 575     
          Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala 
                      580                 585                 590         
          Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala 
                  595                 600                 605             
          Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr 
              610                 615                 620                 
          Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu 
          625                 630                 635                 640 
          Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly 
                          645                 650                 655     
          His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp 
                      660                 665                 670         
          Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr 
                  675                 680                 685             
          Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Ser Gly Gly Ser 
              690                 695                 700                 
          Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 
          705                 710                 715                 720 
          Ser Gly Gly Ser Ser Gly Gly Ser Met Ala Ser Ile Ser Arg Pro Tyr 
                          725                 730                 735     
          Gly Thr Lys Leu Arg Pro Asp Ala Arg Lys Lys Glu Met Leu Asp Lys 
                      740                 745                 750         
          Phe Phe Asn Thr Leu Thr Lys Gly Gln Arg Val Phe Ala Asp Leu Ala 
                  755                 760                 765             
          Leu Cys Ile Tyr Gly Ser Leu Thr Leu Glu Met Ala Lys Ser Leu Glu 
              770                 775                 780                 
          Pro Glu Ser Asp Ser Glu Leu Val Cys Ala Ile Gly Trp Phe Arg Leu 
          785                 790                 795                 800 
          Val Asp Lys Thr Ile Trp Ser Lys Asp Gly Ile Lys Gln Glu Asn Leu 
                          805                 810                 815     
          Val Lys Gln Tyr Glu Ala Tyr Ser Gly Lys Glu Ala Ser Glu Val Val 
                      820                 825                 830         
          Lys Thr Tyr Leu Asn Ser Pro Ser Ser Asp Lys Tyr Val Trp Ile Asp 
                  835                 840                 845             
          Cys Arg Gln Lys Phe Leu Arg Phe Gln Arg Glu Leu Gly Thr Arg Asn 
              850                 855                 860                 
          Leu Ser Glu Asp Phe Glu Cys Met Leu Phe Glu Gln Tyr Ile Arg Leu 
          865                 870                 875                 880 
          Thr Lys Gly Glu Ile Glu Gly Tyr Ala Ala Ile Ser Asn Met Phe Gly 
                          885                 890                 895     
          Asn Gly Glu Lys Glu Asp Arg Ser Lys Lys Arg Met Tyr Ala Thr Arg 
                      900                 905                 910         
          Met Lys Asp Trp Leu Glu Ala Asn Glu Asn Ile Thr Trp Glu Gln Tyr 
                  915                 920                 925             
          Arg Glu Ala Leu Lys Asn Gln Leu Asn Ala Lys Asn Leu Glu Gln Val 
              930                 935                 940                 
          Val Ala Asn Tyr Lys Gly Asn Ala Gly Gly Ala Asp Pro Phe Phe Lys 
          945                 950                 955                 960 
          Tyr Ser Phe Ser Lys Glu Gly Met Val Ser Lys Lys Glu His Ala Gln 
                          965                 970                 975     
          Gln Leu Asp Lys Phe Lys Thr Val Leu Lys Asn Lys Ala Arg Asp Leu 
                      980                 985                 990         
          Asn Phe Pro Asn Lys Glu Lys Leu  Lys Gln Tyr Leu Glu  Ala Glu Ile 
                  995                 1000                 1005             
          Gly Ile  Pro Val Asp Ala Asn  Val Tyr Ser Gln Met  Phe Ser Asn 
              1010                 1015                 1020             
          Gly Val  Ser Glu Val Gln Pro  Lys Thr Thr Arg Asn  Met Ser Phe 
              1025                 1030                 1035             
          Ser Asn  Glu Lys Leu Asp Leu  Leu Thr Glu Leu Lys  Asp Leu Asn 
              1040                 1045                 1050             
          Lys Gly  Asp Gly Phe Glu Tyr  Ala Arg Glu Val Leu  Asn Gly Phe 
              1055                 1060                 1065             
          Phe Asp  Ser Glu Leu His Thr  Thr Glu Asp Lys Phe  Asn Ile Thr 
              1070                 1075                 1080             
          Ser Arg  Tyr Leu Gly Gly Asp  Lys Ser Asn Arg Leu  Ser Lys Leu 
              1085                 1090                 1095             
          Tyr Lys  Ile Trp Lys Lys Glu  Gly Val Asp Cys Glu  Glu Gly Ile 
              1100                 1105                 1110             
          Gln Gln  Phe Cys Glu Ala Val  Lys Asp Lys Met Gly  Gln Ile Pro 
              1115                 1120                 1125             
          Ile Arg  Asn Val Leu Lys Tyr  Leu Trp Gln Phe Arg  Glu Thr Val 
              1130                 1135                 1140             
          Ser Ala  Glu Asp Phe Glu Ala  Ala Ala Lys Ala Asn  His Leu Glu 
              1145                 1150                 1155             
          Glu Lys  Ile Ser Arg Val Lys  Ala His Pro Ile Val  Ile Ser Asn 
              1160                 1165                 1170             
          Arg Tyr  Trp Ala Phe Gly Thr  Ser Ala Leu Val Gly  Asn Ile Met 
              1175                 1180                 1185             
          Pro Ala  Asp Lys Arg His Gln  Gly Glu Tyr Ala Gly  Gln Asn Phe 
              1190                 1195                 1200             
          Lys Met  Trp Leu Arg Ala Glu  Leu His Tyr Asp Gly  Lys Lys Ala 
              1205                 1210                 1215             
          Lys Ala  His Leu Pro Phe Tyr  Asn Ala Arg Phe Phe  Glu Glu Val 
              1220                 1225                 1230             
          Tyr Cys  Tyr His Pro Ser Val  Ala Glu Ile Thr Pro  Phe Lys Thr 
              1235                 1240                 1245             
          Lys Gln  Phe Gly Cys Glu Ile  Gly Lys Asp Ile Pro  Asp Tyr Val 
              1250                 1255                 1260             
          Ser Val  Ala Leu Lys Asp Asn  Pro Tyr Lys Lys Ala  Thr Lys Arg 
              1265                 1270                 1275             
          Ile Leu  Arg Ala Ile Tyr Asn  Pro Val Ala Asn Thr  Thr Arg Val 
              1280                 1285                 1290             
          Asp Lys  Thr Thr Asn Cys Ser  Phe Met Ile Lys Arg  Glu Asn Asp 
              1295                 1300                 1305             
          Glu Tyr  Lys Leu Val Ile Asn  Arg Lys Ile Ser Arg  Asp Arg Pro 
              1310                 1315                 1320             
          Lys Arg  Ile Glu Val Gly Arg  Thr Ile Met Gly Tyr  Asp Arg Asn 
              1325                 1330                 1335             
          Gln Thr  Ala Ser Asp Thr Tyr  Trp Ile Gly Arg Leu  Val Pro Pro 
              1340                 1345                 1350             
          Gly Thr  Arg Gly Ala Tyr Arg  Ile Gly Glu Trp Ser  Val Gln Tyr 
              1355                 1360                 1365             
          Ile Lys  Ser Gly Pro Val Leu  Ser Ser Thr Gln Gly  Val Asn Asn 
              1370                 1375                 1380             
          Ser Thr  Thr Asp Gln Leu Val  Tyr Asn Gly Met Pro  Ser Ser Ser 
              1385                 1390                 1395             
          Glu Arg  Phe Lys Ala Trp Lys  Lys Ala Arg Met Ala  Phe Ile Arg 
              1400                 1405                 1410             
          Lys Leu  Ile Arg Gln Leu Asn  Asp Glu Gly Leu Glu  Ser Lys Gly 
              1415                 1420                 1425             
          Gln Asp  Tyr Ile Pro Glu Asn  Pro Ser Ser Phe Asp  Val Arg Gly 
              1430                 1435                 1440             
          Glu Thr  Leu Tyr Val Phe Asn  Ser Asn Tyr Leu Lys  Ala Leu Val 
              1445                 1450                 1455             
          Ser Lys  His Arg Lys Ala Lys  Lys Pro Val Glu Gly  Ile Leu Asp 
              1460                 1465                 1470             
          Glu Ile  Glu Ala Trp Thr Ser  Lys Asp Lys Asp Ser  Cys Ser Leu 
              1475                 1480                 1485             
          Met Arg  Leu Ser Ser Leu Ser  Asp Ala Ser Met Gln  Gly Ile Ala 
              1490                 1495                 1500             
          Ser Leu  Lys Ser Leu Ile Asn  Ser Tyr Phe Asn Lys  Asn Gly Cys 
              1505                 1510                 1515             
          Lys Thr  Ile Glu Asp Lys Glu  Lys Phe Asn Pro Val  Leu Tyr Ala 
              1520                 1525                 1530             
          Lys Leu  Val Glu Val Glu Gln  Arg Arg Thr Asn Lys  Arg Ser Glu 
              1535                 1540                 1545             
          Lys Val  Gly Arg Ile Ala Gly  Ser Leu Glu Gln Leu  Ala Leu Leu 
              1550                 1555                 1560             
          Asn Gly  Val Glu Val Val Ile  Gly Glu Ala Asp Leu  Gly Glu Val 
              1565                 1570                 1575             
          Glu Lys  Gly Lys Ser Lys Lys  Gln Asn Ser Arg Asn  Met Asp Trp 
              1580                 1585                 1590             
          Cys Ala  Lys Gln Val Ala Gln  Arg Leu Glu Tyr Lys  Leu Ala Phe 
              1595                 1600                 1605             
          His Gly  Ile Gly Tyr Phe Gly  Val Asn Pro Met Tyr  Thr Ser His 
              1610                 1615                 1620             
          Gln Asp  Pro Phe Glu His Arg  Arg Val Ala Asp His  Ile Val Met 
              1625                 1630                 1635             
          Arg Ala  Arg Phe Glu Glu Val  Asn Val Glu Asn Ile  Ala Glu Trp 
              1640                 1645                 1650             
          His Val  Arg Asn Phe Ser Asn  Tyr Leu Arg Ala Asp  Ser Gly Thr 
              1655                 1660                 1665             
          Gly Leu  Tyr Tyr Lys Gln Ala  Thr Met Asp Phe Leu  Lys His Tyr 
              1670                 1675                 1680             
          Gly Leu  Glu Glu His Ala Glu  Gly Leu Glu Asn Lys  Lys Ile Lys 
              1685                 1690                 1695             
          Phe Tyr  Asp Phe Arg Lys Ile  Leu Glu Asp Lys Asn  Leu Thr Ser 
              1700                 1705                 1710             
          Val Ile  Ile Pro Lys Arg Gly  Gly Arg Ile Tyr Met  Ala Thr Asn 
              1715                 1720                 1725             
          Pro Val  Thr Ser Asp Ser Thr  Pro Ile Thr Tyr Ala  Gly Lys Thr 
              1730                 1735                 1740             
          Tyr Asn  Arg Cys Asn Ala Asp  Glu Val Ala Ala Ala  Asn Ile Val 
              1745                 1750                 1755             
          Ile Ser  Val Leu Ala Pro Arg  Ser Lys Lys Asn Arg  Glu Gln Asp 
              1760                 1765                 1770             
          Asp Ile  Pro Leu Ile Thr Lys  Lys Ala Glu Ser Lys  Ser Pro Pro 
              1775                 1780                 1785             
          Lys Asp  Arg Lys Arg Ser Lys  Thr Ser Gln Leu Pro  Gln Lys Lys 
              1790                 1795                 1800             
          Arg Pro  Ala Ala Thr Lys Lys  Ala Gly Gln Ala Lys  Lys Lys Lys 
              1805                 1810                 1815             
          <![CDATA[<210>  54]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  54]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcgagg cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac      120
          uccugggcag cccgaga                                                     137
          <![CDATA[<210>  55]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  55]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcgagg cauggauuau agccgaaggc cccagcuuug ccuuguu                    107
          <![CDATA[<210>  56]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  56]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caugcacccc cauaaggggg       60
          cagcuacuuu gggaaguggu ugcgaggcau ggauuauagc cgaaggc                    107
          <![CDATA[<210>  57]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  57]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcgagg cauggauuau agccgaaggc                                        90
          <![CDATA[<210>  58]]>
          <![CDATA[<211> ]]> 94
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  58]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugagcgg ucagcaugga uuauagccga aggc                                   94
          <![CDATA[<210>  59]]>
          <![CDATA[<211>  86]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  59]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguuggcaug gauuauagcc gaaggc                                            86
          <![CDATA[<210>  60]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  60]]>
          agacaugugu ccucagugac acgggaagug guuggucagc au                          42
          <![CDATA[<210>  61]]>
          <![CDATA[<211>  95]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  61]]>
          agacaugugu ccucagugac acgggaagug guuggucagc auugauucca gcuacucugg       60
          gaagugguug cagugcaugg auuauagccg aaggc                                  95
          <![CDATA[<210>  62]]>
          <![CDATA[<211>  149]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  62]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu       60
          gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu      120
          ucauugacgg gacgcuacua uagcugcac                                        149
          <![CDATA[<210>  63]]>
          <![CDATA[<211>  149]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  63]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag       60
          uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu      120
          ucauugacgg gacgcuacua uagcugcac                                        149
          <![CDATA[<210>  64]]>
          <![CDATA[<211>  149]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  64]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc       60
          caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu      120
          ucauugacgg gacgcuacua uagcugcac                                        149
          <![CDATA[<210>  65]]>
          <![CDATA[<211>  57]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  65]]>
          gattccagct actttgggaa gtggttggtc agcatggatt atagccgaag gccccag          57
          <![CDATA[<210>  66]]>
          <![CDATA[<211>  57]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  66]]>
          ctaaggtcga tgaaaccctt caccaaccag tcgtacctaa tatcggcttc cggggtc          57
          <![CDATA[<210>  67]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  67]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguuggucag cauggauuau agccgaaggc                                        90
          <![CDATA[<210>  68]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  68]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguugcgagu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag      120
          ucuccuuccu gaaggac                                                     137
          <![CDATA[<210>  69]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  69]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguugcgagu caagggcagc augcugggcc cgucccacua caggcca                    107
          <![CDATA[<210>  70]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  70]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caagcacccc cauaaggggg       60
          uuccuucuuu gagccagugu ugcgagucaa gggcagcaug cugggcc                    107
          <![CDATA[<210>  71]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  71]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguugcgagu caagggcagc augcugggcc                                        90
          <![CDATA[<210>  72]]>
          <![CDATA[<211>  94]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  72]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguugagcgc uagucaaggg cagcaugcug ggcc                                   94
          <![CDATA[<210>  73]]>
          <![CDATA[<211>  86]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  73]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguugucaag ggcagcaugc ugggcc                                            86
          <![CDATA[<210>  74]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  74]]>
          gggaagtggt tggtcagcat                                                   20
          <![CDATA[<210>  75]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  75]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguuggucag cauggauuau agccgaaggc                                        90
          <![CDATA[<210>  76]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  76]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcgagg cauggauuau agccgaaggc                                        90
          <![CDATA[<210>  77]]>
          <![CDATA[<211>  94]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  77]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugagcgg ucagcaugga uuauagccga aggc                                   94
          <![CDATA[<210>  78]]>
          <![CDATA[<211>  86]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  78]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguuggcaug gauuauagcc gaaggc                                            86
          <![CDATA[<210>  79]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  79]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caugcacccc cauaaggggg       60
          cagcuacuuu gggaaguggu ugcgaggcau ggauuauagc cgaaggc                    107
          <![CDATA[<210>  80]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  80]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcgagg cauggauuau agccgaaggc                                        90
          <![CDATA[<210>  81]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  81]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc       60
          caccacgagu ggugacaacc ccaagcagcc cacacauuuu caagugcccc caggaugcgu      120
          ggagggaggg gucugug                                                     137
          <![CDATA[<210>  82]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  82]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc       60
          caccacgagu ggugacaacc ccaagcagcc cacacauuuu caagugc                    107
          <![CDATA[<210>  83]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  83]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau ggugcacccc cauaaggggg       60
          agauaccuuu aauccuccac cacgaguggu gacaacccca agcagcc                    107
          <![CDATA[<210>  84]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  84]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc       60
          caccacgagu ggugacaacc ccaagcagcc                                        90
          <![CDATA[<210]]>>  85]]&gt;
          <br/>&lt;![CDATA[&lt;211&gt;  94]]&gt;
          <br/>&lt;![CDATA[&lt;212&gt;  RNA]]&gt;
          <br/>&lt;![CDATA[&lt;213&gt;  人工序列]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;220&gt;]]&gt;
          <br/>&lt;![CDATA[&lt;223&gt;  合成的]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;400&gt;  85]]&gt;
          <br/><![CDATA[agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc       60
          caccaagcgg ucauggugac aaccccaagc agcc                                   94
          <![CDATA[<210>  86]]>
          <![CDATA[<211>  86]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  86]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc       60
          caccauggug acaaccccaa gcagcc                                            86
          <![CDATA[<210>  87]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  87]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcgagg cauggauuau agccgaaggc                                        90
          <![CDATA[<210>  88]]>
          <![CDATA[<211>  96]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  88]]>
          ugggaagugg uuggucagca gttttagagc tagaaatagc aagttaaaat aaggctagtc       60
          cgttatcaac ttgaaaaagt ggcaccgagt cggtgc                                 96
          <![CDATA[<210>  89]]>
          <![CDATA[<211>  29]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  89]]>
          ggcuauaauc caugcaagug accaaccac                                         29
          <![CDATA[<210>  90]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  90]]>
          gggaagtggt tgcagtgcat                                                   20
          <![CDATA[<210>  91]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  91]]>
          gagccagtgt tggatctcaa                                                   20
          <![CDATA[<210>  92]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  92]]>
          ttaaactctc caacctccag                                                   20
          <![CDATA[<210>  93]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  93]]>
          uaauuucuac uguuguagau                                                   20
          <![CDATA[<210>  94]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  94]]>
          agaaaugcau gguucucaug c                                                 21
          <![CDATA[<210>  95]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  95]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu       60
          cuccacgagc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca      120
          ggacucucuc caagaga                                                     137
          <![CDATA[<210>  96]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  96]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu       60
          cuccacgagc caggcucauc cagcuuccca aacaaagccc ccaagaa                    107
          <![CDATA[<210>  97]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  97]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac caggcacccc cauaaggggg       60
          aaaagacuuu uuaaacucuc cacgagccag gcucauccag cuuccca                    107
          <![CDATA[<210>  98]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  98]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu       60
          cuccacgagc caggcucauc cagcuuccca                                        90
          <![CDATA[<21]]>0>  99]]&gt;
          <br/>&lt;![CDATA[&lt;211&gt;  94]]&gt;
          <br/>&lt;![CDATA[&lt;212&gt;  RNA]]&gt;
          <br/>&lt;![CDATA[&lt;213&gt;  人工序列]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;220&gt;]]&gt;
          <br/>&lt;![CDATA[&lt;223&gt;  合成的]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;400&gt;  99]]&gt;
          <br/><![CDATA[agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu       60
          cuccaagcgu ggaccaggcu cauccagcuu ccca                                   94
          <![CDATA[<210>  100]]>
          <![CDATA[<211>  86]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  100]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu       60
          cuccaccagg cucauccagc uuccca                                            86
          <![CDATA[<210>  101]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  101]]>
          aaaauuaccu aguaauuagg u                                                 21
          <![CDATA[<210>  102]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  102]]>
          ggauuucuac uuuuguagau                                                   20
          <![CDATA[<210>  103]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  103]]>
          aaauuucuac uuuuguagau                                                   20
          <![CDATA[<210>  104]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  104]]>
          cgcgcccacg cggggcgcga c                                                 21
          <![CDATA[<210>  105]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  1]]>05
          uaauuucuac ucuuguagau                                                   20
          <![CDATA[<210>  106]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  106]]>
          gaauuucuac uauuguagau                                                   20
          <![CDATA[<210>  107]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  107]]>
          gaaucucuac ucuuuguaga u                                                 21
          <![CDATA[<210>  108]]>
          <![CDATA[<211>  19]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  108]]>
          uaauuucuac uuuguagau                                                    19
          <![CDATA[<210>  109]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  109]]>
          aaauuucuac uguuuguaga u                                                 21
          <![CDATA[<210>  110]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  110]]>
          agaaauccgu cuuucauuga cggguagccu cucccgcucu ggu                         43
          <![CDATA[<210>  111]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  111]]>
          gaauuucuac uuuuguagau                                                   20
          <![CDATA[<210>  112]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  112]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag cau                         43
          <![CDATA[<210>  113]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  113]]>
          uaauuucuac uaaguguaga u                                                 21
          <![CDATA[<210>  114]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  114]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caa                         43
          <![CDATA[<210>  115]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  115]]>
          uaauuucuac uauuguagau                                                   20
          <![CDATA[<210>  116]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  116]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau ggu                         43
          <![CDATA[<210>  117]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  117]]>
          uaauuucuac uucgguagau                                                   20
          <![CDATA[<210>  118]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  118]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag                         43
          <![CDATA[<210>  119]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  119]]>
          uaauuucuac uauuguagau                                                   20
          <![CDATA[<210>  120]]>
          <![CDATA[<211>  1368]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  120]]>
          Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 
          1               5                   10                  15      
          Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 
                      20                  25                  30          
          Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 
                  35                  40                  45              
          Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 
              50                  55                  60                  
          Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 
          65                  70                  75                  80  
          Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 
                          85                  90                  95      
          Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 
                      100                 105                 110         
          His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 
                  115                 120                 125             
          His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 
              130                 135                 140                 
          Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 
          145                 150                 155                 160 
          Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 
                          165                 170                 175     
          Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 
                      180                 185                 190         
          Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 
                  195                 200                 205             
          Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 
              210                 215                 220                 
          Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 
          225                 230                 235                 240 
          Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 
                          245                 250                 255     
          Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 
                      260                 265                 270         
          Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 
                  275                 280                 285             
          Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 
              290                 295                 300                 
          Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 
          305                 310                 315                 320 
          Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 
                          325                 330                 335     
          Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 
                      340                 345                 350         
          Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 
                  355                 360                 365             
          Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 
              370                 375                 380                 
          Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 
          385                 390                 395                 400 
          Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 
                          405                 410                 415     
          Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 
                      420                 425                 430         
          Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 
                  435                 440                 445             
          Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 
              450                 455                 460                 
          Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 
          465                 470                 475                 480 
          Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 
                          485                 490                 495     
          Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 
                      500                 505                 510         
          Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 
                  515                 520                 525             
          Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 
              530                 535                 540                 
          Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 
          545                 550                 555                 560 
          Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 
                          565                 570                 575     
          Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 
                      580                 585                 590         
          Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 
                  595                 600                 605             
          Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 
              610                 615                 620                 
          Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 
          625                 630                 635                 640 
          His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 
                          645                 650                 655     
          Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 
                      660                 665                 670         
          Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 
                  675                 680                 685             
          Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 
              690                 695                 700                 
          Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 
          705                 710                 715                 720 
          His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 
                          725                 730                 735     
          Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 
                      740                 745                 750         
          Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 
                  755                 760                 765             
          Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 
              770                 775                 780                 
          Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 
          785                 790                 795                 800 
          Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 
                          805                 810                 815     
          Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 
                      820                 825                 830         
          Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 
                  835                 840                 845             
          Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 
              850                 855                 860                 
          Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 
          865                 870                 875                 880 
          Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 
                          885                 890                 895     
          Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 
                      900                 905                 910         
          Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 
                  915                 920                 925             
          Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 
              930                 935                 940                 
          Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 
          945                 950                 955                 960 
          Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 
                          965                 970                 975     
          Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 
                      980                 985                 990         
          Val Gly Thr Ala Leu Ile Lys Lys  Tyr Pro Lys Leu Glu  Ser Glu Phe 
                  995                 1000                 1005             
          Val Tyr  Gly Asp Tyr Lys Val  Tyr Asp Val Arg Lys  Met Ile Ala 
              1010                 1015                 1020             
          Lys Ser  Glu Gln Glu Ile Gly  Lys Ala Thr Ala Lys  Tyr Phe Phe 
              1025                 1030                 1035             
          Tyr Ser  Asn Ile Met Asn Phe  Phe Lys Thr Glu Ile  Thr Leu Ala 
              1040                 1045                 1050             
          Asn Gly  Glu Ile Arg Lys Arg  Pro Leu Ile Glu Thr  Asn Gly Glu 
              1055                 1060                 1065             
          Thr Gly  Glu Ile Val Trp Asp  Lys Gly Arg Asp Phe  Ala Thr Val 
              1070                 1075                 1080             
          Arg Lys  Val Leu Ser Met Pro  Gln Val Asn Ile Val  Lys Lys Thr 
              1085                 1090                 1095             
          Glu Val  Gln Thr Gly Gly Phe  Ser Lys Glu Ser Ile  Leu Pro Lys 
              1100                 1105                 1110             
          Arg Asn  Ser Asp Lys Leu Ile  Ala Arg Lys Lys Asp  Trp Asp Pro 
              1115                 1120                 1125             
          Lys Lys  Tyr Gly Gly Phe Asp  Ser Pro Thr Val Ala  Tyr Ser Val 
              1130                 1135                 1140             
          Leu Val  Val Ala Lys Val Glu  Lys Gly Lys Ser Lys  Lys Leu Lys 
              1145                 1150                 1155             
          Ser Val  Lys Glu Leu Leu Gly  Ile Thr Ile Met Glu  Arg Ser Ser 
              1160                 1165                 1170             
          Phe Glu  Lys Asn Pro Ile Asp  Phe Leu Glu Ala Lys  Gly Tyr Lys 
              1175                 1180                 1185             
          Glu Val  Lys Lys Asp Leu Ile  Ile Lys Leu Pro Lys  Tyr Ser Leu 
              1190                 1195                 1200             
          Phe Glu  Leu Glu Asn Gly Arg  Lys Arg Met Leu Ala  Ser Ala Gly 
              1205                 1210                 1215             
          Glu Leu  Gln Lys Gly Asn Glu  Leu Ala Leu Pro Ser  Lys Tyr Val 
              1220                 1225                 1230             
          Asn Phe  Leu Tyr Leu Ala Ser  His Tyr Glu Lys Leu  Lys Gly Ser 
              1235                 1240                 1245             
          Pro Glu  Asp Asn Glu Gln Lys  Gln Leu Phe Val Glu  Gln His Lys 
              1250                 1255                 1260             
          His Tyr  Leu Asp Glu Ile Ile  Glu Gln Ile Ser Glu  Phe Ser Lys 
              1265                 1270                 1275             
          Arg Val  Ile Leu Ala Asp Ala  Asn Leu Asp Lys Val  Leu Ser Ala 
              1280                 1285                 1290             
          Tyr Asn  Lys His Arg Asp Lys  Pro Ile Arg Glu Gln  Ala Glu Asn 
              1295                 1300                 1305             
          Ile Ile  His Leu Phe Thr Leu  Thr Asn Leu Gly Ala  Pro Ala Ala 
              1310                 1315                 1320             
          Phe Lys  Tyr Phe Asp Thr Thr  Ile Asp Arg Lys Arg  Tyr Thr Ser 
              1325                 1330                 1335             
          Thr Lys  Glu Val Leu Asp Ala  Thr Leu Ile His Gln  Ser Ile Thr 
              1340                 1345                 1350             
          Gly Leu  Tyr Glu Thr Arg Ile  Asp Leu Ser Gln Leu  Gly Gly Asp 
              1355                 1360                 1365             
          <![CDATA[<210>  121]]>
          <![CDATA[<211>  1368]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  121]]>
          Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 
          1               5                   10                  15      
          Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 
                      20                  25                  30          
          Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 
                  35                  40                  45              
          Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 
              50                  55                  60                  
          Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 
          65                  70                  75                  80  
          Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 
                          85                  90                  95      
          Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 
                      100                 105                 110         
          His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 
                  115                 120                 125             
          His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 
              130                 135                 140                 
          Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 
          145                 150                 155                 160 
          Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 
                          165                 170                 175     
          Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 
                      180                 185                 190         
          Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 
                  195                 200                 205             
          Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 
              210                 215                 220                 
          Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 
          225                 230                 235                 240 
          Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 
                          245                 250                 255     
          Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 
                      260                 265                 270         
          Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 
                  275                 280                 285             
          Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 
              290                 295                 300                 
          Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 
          305                 310                 315                 320 
          Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 
                          325                 330                 335     
          Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 
                      340                 345                 350         
          Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 
                  355                 360                 365             
          Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 
              370                 375                 380                 
          Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 
          385                 390                 395                 400 
          Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 
                          405                 410                 415     
          Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 
                      420                 425                 430         
          Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 
                  435                 440                 445             
          Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 
              450                 455                 460                 
          Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 
          465                 470                 475                 480 
          Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 
                          485                 490                 495     
          Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 
                      500                 505                 510         
          Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 
                  515                 520                 525             
          Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 
              530                 535                 540                 
          Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 
          545                 550                 555                 560 
          Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 
                          565                 570                 575     
          Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 
                      580                 585                 590         
          Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 
                  595                 600                 605             
          Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 
              610                 615                 620                 
          Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 
          625                 630                 635                 640 
          His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 
                          645                 650                 655     
          Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 
                      660                 665                 670         
          Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 
                  675                 680                 685             
          Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 
              690                 695                 700                 
          Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 
          705                 710                 715                 720 
          His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 
                          725                 730                 735     
          Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 
                      740                 745                 750         
          Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 
                  755                 760                 765             
          Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 
              770                 775                 780                 
          Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 
          785                 790                 795                 800 
          Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 
                          805                 810                 815     
          Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 
                      820                 825                 830         
          Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 
                  835                 840                 845             
          Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 
              850                 855                 860                 
          Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 
          865                 870                 875                 880 
          Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 
                          885                 890                 895     
          Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 
                      900                 905                 910         
          Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 
                  915                 920                 925             
          Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 
              930                 935                 940                 
          Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 
          945                 950                 955                 960 
          Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 
                          965                 970                 975     
          Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 
                      980                 985                 990         
          Val Gly Thr Ala Leu Ile Lys Lys  Tyr Pro Lys Leu Glu  Ser Glu Phe 
                  995                 1000                 1005             
          Val Tyr  Gly Asp Tyr Lys Val  Tyr Asp Val Arg Lys  Met Ile Ala 
              1010                 1015                 1020             
          Lys Ser  Glu Gln Glu Ile Gly  Lys Ala Thr Ala Lys  Tyr Phe Phe 
              1025                 1030                 1035             
          Tyr Ser  Asn Ile Met Asn Phe  Phe Lys Thr Glu Ile  Thr Leu Ala 
              1040                 1045                 1050             
          Asn Gly  Glu Ile Arg Lys Arg  Pro Leu Ile Glu Thr  Asn Gly Glu 
              1055                 1060                 1065             
          Thr Gly  Glu Ile Val Trp Asp  Lys Gly Arg Asp Phe  Ala Thr Val 
              1070                 1075                 1080             
          Arg Lys  Val Leu Ser Met Pro  Gln Val Asn Ile Val  Lys Lys Thr 
              1085                 1090                 1095             
          Glu Val  Gln Thr Gly Gly Phe  Ser Lys Glu Ser Ile  Leu Pro Lys 
              1100                 1105                 1110             
          Arg Asn  Ser Asp Lys Leu Ile  Ala Arg Lys Lys Asp  Trp Asp Pro 
              1115                 1120                 1125             
          Lys Lys  Tyr Gly Gly Phe Asp  Ser Pro Thr Val Ala  Tyr Ser Val 
              1130                 1135                 1140             
          Leu Val  Val Ala Lys Val Glu  Lys Gly Lys Ser Lys  Lys Leu Lys 
              1145                 1150                 1155             
          Ser Val  Lys Glu Leu Leu Gly  Ile Thr Ile Met Glu  Arg Ser Ser 
              1160                 1165                 1170             
          Phe Glu  Lys Asn Pro Ile Asp  Phe Leu Glu Ala Lys  Gly Tyr Lys 
              1175                 1180                 1185             
          Glu Val  Lys Lys Asp Leu Ile  Ile Lys Leu Pro Lys  Tyr Ser Leu 
              1190                 1195                 1200             
          Phe Glu  Leu Glu Asn Gly Arg  Lys Arg Met Leu Ala  Ser Ala Gly 
              1205                 1210                 1215             
          Glu Leu  Gln Lys Gly Asn Glu  Leu Ala Leu Pro Ser  Lys Tyr Val 
              1220                 1225                 1230             
          Asn Phe  Leu Tyr Leu Ala Ser  His Tyr Glu Lys Leu  Lys Gly Ser 
              1235                 1240                 1245             
          Pro Glu  Asp Asn Glu Gln Lys  Gln Leu Phe Val Glu  Gln His Lys 
              1250                 1255                 1260             
          His Tyr  Leu Asp Glu Ile Ile  Glu Gln Ile Ser Glu  Phe Ser Lys 
              1265                 1270                 1275             
          Arg Val  Ile Leu Ala Asp Ala  Asn Leu Asp Lys Val  Leu Ser Ala 
              1280                 1285                 1290             
          Tyr Asn  Lys His Arg Asp Lys  Pro Ile Arg Glu Gln  Ala Glu Asn 
              1295                 1300                 1305             
          Ile Ile  His Leu Phe Thr Leu  Thr Asn Leu Gly Ala  Pro Ala Ala 
              1310                 1315                 1320             
          Phe Lys  Tyr Phe Asp Thr Thr  Ile Asp Arg Lys Arg  Tyr Thr Ser 
              1325                 1330                 1335             
          Thr Lys  Glu Val Leu Asp Ala  Thr Leu Ile His Gln  Ser Ile Thr 
              1340                 1345                 1350             
          Gly Leu  Tyr Glu Thr Arg Ile  Asp Leu Ser Gln Leu  Gly Gly Asp 
              1355                 1360                 1365             
          <![CDATA[<210>  122]]>
          <![CDATA[<211>  1053]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  122]]>
          Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val 
          1               5                   10                  15      
          Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 
                      20                  25                  30          
          Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 
                  35                  40                  45              
          Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 
              50                  55                  60                  
          Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 
          65                  70                  75                  80  
          Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 
                          85                  90                  95      
          Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 
                      100                 105                 110         
          Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 
                  115                 120                 125             
          Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 
              130                 135                 140                 
          Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 
          145                 150                 155                 160 
          Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 
                          165                 170                 175     
          Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 
                      180                 185                 190         
          Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 
                  195                 200                 205             
          Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 
              210                 215                 220                 
          Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 
          225                 230                 235                 240 
          Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 
                          245                 250                 255     
          Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 
                      260                 265                 270         
          Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 
                  275                 280                 285             
          Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 
              290                 295                 300                 
          Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 
          305                 310                 315                 320 
          Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 
                          325                 330                 335     
          Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 
                      340                 345                 350         
          Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 
                  355                 360                 365             
          Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 
              370                 375                 380                 
          Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 
          385                 390                 395                 400 
          Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 
                          405                 410                 415     
          Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 
                      420                 425                 430         
          Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 
                  435                 440                 445             
          Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 
              450                 455                 460                 
          Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 
          465                 470                 475                 480 
          Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 
                          485                 490                 495     
          Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 
                      500                 505                 510         
          Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 
                  515                 520                 525             
          Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 
              530                 535                 540                 
          Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 
          545                 550                 555                 560 
          Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 
                          565                 570                 575     
          Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 
                      580                 585                 590         
          Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 
                  595                 600                 605             
          Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 
              610                 615                 620                 
          Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 
          625                 630                 635                 640 
          Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 
                          645                 650                 655     
          Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 
                      660                 665                 670         
          Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 
                  675                 680                 685             
          Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 
              690                 695                 700                 
          Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 
          705                 710                 715                 720 
          Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 
                          725                 730                 735     
          Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 
                      740                 745                 750         
          Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 
                  755                 760                 765             
          Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 
              770                 775                 780                 
          Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 
          785                 790                 795                 800 
          Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 
                          805                 810                 815     
          Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 
                      820                 825                 830         
          Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 
                  835                 840                 845             
          Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 
              850                 855                 860                 
          Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 
          865                 870                 875                 880 
          Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 
                          885                 890                 895     
          Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 
                      900                 905                 910         
          Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 
                  915                 920                 925             
          Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 
              930                 935                 940                 
          Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 
          945                 950                 955                 960 
          Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 
                          965                 970                 975     
          Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 
                      980                 985                 990         
          Glu Val Asn Met Ile Asp Ile Thr  Tyr Arg Glu Tyr Leu  Glu Asn Met 
                  995                 1000                 1005             
          Asn Asp  Lys Arg Pro Pro Arg  Ile Ile Lys Thr Ile  Ala Ser Lys 
              1010                 1015                 1020             
          Thr Gln  Ser Ile Lys Lys Tyr  Ser Thr Asp Ile Leu  Gly Asn Leu 
              1025                 1030                 1035             
          Tyr Glu  Val Lys Ser Lys Lys  His Pro Gln Ile Ile  Lys Lys Gly 
              1040                 1045                 1050             
          <![CDATA[<210>  123]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  123]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu       60
          gguugcagug cauggauuau agccgaaggc                                        90
          <![CDATA[<210>  124]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  124]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu       60
          gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguu                    107
          <![CDATA[<210>  125]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400> ]]> 125
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu       60
          gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac      120
          uccugggcag cccgaga                                                     137
          <![CDATA[<210>  126]]>
          <![CDATA[<211>  133]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  126]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu       60
          gguugcagug cauggauuau agccgaaggc agaaauccgu cuuucauuga cgggcacacg      120
          acgauguaau cgc                                                         133
          <![CDATA[<210>  127]]>
          <![CDATA[<211>  150]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  127]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu       60
          gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu      120
          ucauugacgg gcacacgacg auguaaucgc                                       150
          <![CDATA[<210>  128]]>
          <![CDATA[<211>  180]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  128]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu       60
          gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac      120
          uccugggcag cccgagaaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc      180
          <![CDATA[<210>  129]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  129]]>
          cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcaga aauccgucuu       60
          ucauugacgg gggaaguggu uggucagcau                                        90
          <![CDATA[<210>  130]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  130]]>
          cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcccc agcuuugccu       60
          uguuagaaau ccgucuuuca uugacggggg aagugguugg ucagcau                    107
          <![CDATA[<210>  131]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  131]]>
          cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcccc agcuuugccu       60
          uguucuagca guuccacucc ugggcagccc gagaagaaau ccgucuuuca uugacggggg      120
          aagugguugg ucagcau                                                     137
          <![CDATA[<210>  132]]>
          <![CDATA[<211>  133]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  132]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu       60
          gguugcagug cauggauuau agccgaaggc agaaauccgu cuuucauuga cgggggaagu      120
          gguuggucag cau                                                         133
          <![CDATA[<210>  133]]>
          <![CDATA[<211>  150]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  133]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu       60
          gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu      120
          ucauugacgg gggaaguggu uggucagcau                                       150
          <![CDATA[<210>  134]]>
          <![CDATA[<211>  180]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  134]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu       60
          gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac      120
          uccugggcag cccgagaaga aauccgucuu ucauugacgg gggaaguggu uggucagcau      180
          <![CDATA[<210>  135]]>
          <![CDATA[<211>  139]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  135]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug       60
          ggaagugguu gcagugcaug gauuauagcc gaaggcagaa auccgucuuu cauugacggg      120
          ggaagugguu ggucagcau                                                   139
          <![CDATA[<210>  136]]>
          <![CDATA[<211>  156]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  136]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug       60
          ggaagugguu gcagugcaug gauuauagcc gaaggcccca gcuuugccuu guuagaaauc      120
          cgucuuucau ugacggggga agugguuggu cagcau                                156
          <![CDATA[<210>  137]]>
          <![CDATA[<211>  186]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  137]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug       60
          ggaagugguu gcagugcaug gauuauagcc gaaggcccca gcuuugccuu guucuagcag      120
          uuccacuccu gggcagcccg agaagaaauc cgucuuucau ugacggggga agugguuggu      180
          cagcau                                                                 186
          <![CDATA[<210>  138]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  138]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag       60
          uguuggaucu caagggcagc augcugggcc                                        90
          <![CDATA[<210>  139]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  139]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag       60
          uguuggaucu caagggcagc augcugggcc cgucccacua caggcca                    107
          <![CDATA[<210>  140]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  140]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag       60
          uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag      120
          ucuccuuccu gaaggac                                                     137
          <![CDATA[<210>  141]]>
          <![CDATA[<211>  133]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  141]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag       60
          uguuggaucu caagggcagc augcugggcc agaaauccgu cuuucauuga cgggcacacg      120
          acgauguaau cgc                                                         133
          <![CDATA[<210>  142]]>
          <![CDATA[<211>  150]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  142]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag       60
          uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu      120
          ucauugacgg gcacacgacg auguaaucgc                                       150
          <![CDATA[<210> ]]> 143
          <![CDATA[<211>  180]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  143]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag       60
          uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag      120
          ucuccuuccu gaaggacaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc      180
          <![CDATA[<210>  144]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  144]]>
          uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggccaga aauccgucuu       60
          ucauugacgg gagccagugu ugcuagucaa                                        90
          <![CDATA[<210>  145]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  145]]>
          uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggcccgu cccacuacag       60
          gccaagaaau ccgucuuuca uugacgggag ccaguguugc uagucaa                    107
          <![CDATA[<210>  146]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  146]]>
          uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggcccgu cccacuacag       60
          gccaauguga ccgucagucu ccuuccugaa ggacagaaau ccgucuuuca uugacgggag      120
          ccaguguugc uagucaa                                                     137
          <![CDATA[<210>  147]]>
          <![CDATA[<211>  133]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  147]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag       60
          uguuggaucu caagggcagc augcugggcc agaaauccgu cuuucauuga cgggagccag      120
          uguugcuagu caa                                                         133
          <![CDATA[<210>  148]]>
          <![CDATA[<211>  150]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  148]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag       60
          uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu      120
          ucauugacgg gagccagugu ugcuagucaa                                       150
          <![CDATA[<210>  149]]>
          <![CDATA[<211>  180]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  149]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag       60
          uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag      120
          ucuccuuccu gaaggacaga aauccgucuu ucauugacgg gagccagugu ugcuagucaa      180
          <![CDATA[<210>  150]]>
          <![CDATA[<211>  139]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  150]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug       60
          agccaguguu ggaucucaag ggcagcaugc ugggccagaa auccgucuuu cauugacggg      120
          agccaguguu gcuagucaa                                                   139
          <![CDATA[<210>  151]]>
          <![CDATA[<211>  156]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  151]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug       60
          agccaguguu ggaucucaag ggcagcaugc ugggcccguc ccacuacagg ccaagaaauc      120
          cgucuuucau ugacgggagc caguguugcu agucaa                                156
          <![CDATA[<210>  152]]>
          <![CDATA[<211>  186]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  152]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug       60
          agccaguguu ggaucucaag ggcagcaugc ugggcccguc ccacuacagg ccaaugugac      120
          cgucagucuc cuuccugaag gacagaaauc cgucuuucau ugacgggagc caguguugcu      180
          agucaa                                                                 186
          <![CDATA[<210>  153]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  153]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc       60
          caccacaguu ggugacaacc ccaagcagcc                                        90
          <![CDATA[<210>  154]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  154]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc       60
          caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugc                    107
          <![CDATA[<210>  155]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  155]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc       60
          caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu      120
          ggagggaggg gucugug                                                     137
          <![CDATA[<210>  156]]>
          <![CDATA[<211>  133]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  156]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc       60
          caccacaguu ggugacaacc ccaagcagcc agaaauccgu cuuucauuga cgggcacacg      120
          acgauguaau cgc                                                         133
          <![CDATA[<210>  157]]>
          <![CDATA[<211>  150]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  157]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc       60
          caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu      120
          ucauugacgg gcacacgacg auguaaucgc                                       150
          <![CDATA[<210>  158]]>
          <![CDATA[<211>  180]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  158]]>
          agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc       60
          caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu      120
          ggagggaggg gucugugaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc      180
          <![CDATA[<210>  159]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  159]]>
          agauaccuau aauccuccac cacaguuggu gacaacccca agcagccaga aauccgucuu       60
          ucauugacgg aauccuccac cagucauggu                                        90
          <![CDATA[<210>  160]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  160]]>
          agauaccuau aauccuccac cacaguuggu gacaacccca agcagcccac acauucucaa       60
          gugcagaaau ccgucuuuca uugacggaau ccuccaccag ucauggu                    107
          <![CDATA[<210>  161]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  161]]>
          agauaccuau aauccuccac cacaguuggu gacaacccca agcagcccac acauucucaa       60
          gugcccccag gaugcgugga gggagggguc ugugagaaau ccgucuuuca uugacggaau      120
          ccuccaccag ucauggu                                                     137
          <![CDATA[<210>  162]]>
          <![CDATA[<211>  133]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  162]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc       60
          caccacaguu ggugacaacc ccaagcagcc agaaauccgu cuuucauuga cggaauccuc      120
          caccagucau ggu                                                         133
          <![CDATA[<210>  163]]>
          <![CDATA[<211>  150]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  163]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc       60
          caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu      120
          ucauugacgg aauccuccac cagucauggu                                       150
          <![CDATA[<210>  164]]>
          <![CDATA[<211>  180]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  164]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc       60
          caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu      120
          ggagggaggg gucugugaga aauccgucuu ucauugacgg aauccuccac cagucauggu      180
          <![CDATA[<210>  165]]>
          <![CDATA[<211>  139]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  165]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua       60
          auccuccacc acaguuggug acaaccccaa gcagccagaa auccgucuuu cauugacgga      120
          auccuccacc agucauggu                                                   139
          <![CDATA[<210>  166]]>
          <![CDATA[<211>  156]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  166]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua       60
          auccuccacc acaguuggug acaaccccaa gcagcccaca cauucucaag ugcagaaauc      120
          cgucuuucau ugacggaauc cuccaccagu cauggu                                156
          <![CDATA[<210>  167]]>
          <![CDATA[<211>  186]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  167]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua       60
          auccuccacc acaguuggug acaaccccaa gcagcccaca cauucucaag ugcccccagg      120
          augcguggag ggaggggucu gugagaaauc cgucuuucau ugacggaauc cuccaccagu      180
          cauggu                                                                 186
          <![CDATA[<210>  168]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  168]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca                                        90
          <![CDATA[<210>  169]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  169]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa                    107
          <![CDATA[<210>  17]]>0
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  170]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca      120
          ggacucucuc caagaga                                                     137
          <![CDATA[<210>  171]]>
          <![CDATA[<211>  133]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  171]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca agaaauccgu cuuucauuga cgggcacacg      120
          acgauguaau cgc                                                         133
          <![CDATA[<210>  172]]>
          <![CDATA[<211>  150]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  172]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaaga aauccgucuu      120
          ucauugacgg gcacacgacg auguaaucgc                                       150
          <![CDATA[<210>  173]]>
          <![CDATA[<211>  180]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  173]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca      120
          ggacucucuc caagagaaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc      180
          <![CDATA[<210>  174]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  174]]>
          aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaga aauccgucuu       60
          ucauugacgg uuaaacucuc cauggaccag                                        90
          <![CDATA[<210>  175]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  175]]>
          aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaac aaagccccca       60
          agaaagaaau ccgucuuuca uugacgguua aacucuccau ggaccag                    107
          <![CDATA[<210>  176]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  176]]>
          aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaac aaagccccca       60
          agaagggggg gcacucagga cucucuccaa gagaagaaau ccgucuuuca uugacgguua      120
          aacucuccau ggaccag                                                     137
          <![CDATA[<210>  177]]>
          <![CDATA[<211>  133]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  177]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca agaaauccgu cuuucauuga cgguuaaacu      120
          cuccauggac cag                                                         133
          <![CDATA[<210>  178]]>
          <![CDATA[<211>  150]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<22]]>3>  合成的]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;400&gt;  178]]&gt;
          <br/><![CDATA[agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaaga aauccgucuu      120
          ucauugacgg uuaaacucuc cauggaccag                                       150
          <![CDATA[<210>  179]]>
          <![CDATA[<211>  180]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  179]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca      120
          ggacucucuc caagagaaga aauccgucuu ucauugacgg uuaaacucuc cauggaccag      180
          <![CDATA[<210>  180]]>
          <![CDATA[<211>  139]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  180]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu       60
          uaaacucucc aaccuccagg cucauccagc uucccaagaa auccgucuuu cauugacggu      120
          uaaacucucc auggaccag                                                   139
          <![CDATA[<210>  181]]>
          <![CDATA[<211>  156]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  181]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu       60
          uaaacucucc aaccuccagg cucauccagc uucccaaaca aagcccccaa gaaagaaauc      120
          cgucuuucau ugacgguuaa acucuccaug gaccag                                156
          <![CDATA[<210>  182]]>
          <![CDATA[<211>  186]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  182]]>
          agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu       60
          uaaacucucc aaccuccagg cucauccagc uucccaaaca aagcccccaa gaaggggggg      120
          cacucaggac ucucuccaag agaagaaauc cgucuuucau ugacgguuaa acucuccaug      180
          gaccag                                                                 186
          <![CDATA[<210>  183]]>
          <![CDATA[<211>  80]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  183]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcagug cauggauuau                                                   80
          <![CDATA[<210>  184]]>
          <![CDATA[<211>  85]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  184]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcagug cauggauuau agccg                                             85
          <![CDATA[<210>  185]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  185]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcagug cauggauuau agccgaaggc                                        90
          <![CDATA[<210>  186]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  186]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguu                    107
          <![CDATA[<210>  187]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  187]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac      120
          uccugggcag cccgaga                                                     137
          <![CDATA[<210>  188]]>
          <![CDATA[<211>  70]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  188]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag cauugcagug cauggauuau       60
          agccgaaggc                                                              70
          <![CDATA[<210>  189]]>
          <![CDATA[<211>  80]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  189]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caugggaagu gguugcagug       60
          cauggauuau agccgaaggc                                                   80
          <![CDATA[<210>  190]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  190]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu       60
          gguugcagug cauggauuau agccgaaggc                                        90
          <![CDATA[<210>  191]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  191]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caugugauga uuccagcuac       60
          uuugggaagu gguugcagug cauggauuau agccgaaggc                            100
          <![CDATA[<210>  192]]>
          <![CDATA[<211>  110]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  192]]>
          agaaauccgu cuuucauuga cgggggaagu gguuggucag caugguggga aaggugauga       60
          uuccagcuac uuugggaagu gguugcagug cauggauuau agccgaaggc                 110
          <![CDATA[<210>  193]]>
          <![CDATA[<211>  80]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  193]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguuggaucu caagggcagc                                                   80
          <![CDATA[<210>  194]]>
          <![CDATA[<211>  85]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  194]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguuggaucu caagggcagc augcu                                             85
          <![CDATA[<210>  195]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  195]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguuggaucu caagggcagc augcugggcc                                        90
          <![CDATA[<210>  196]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  196]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguuggaucu caagggcagc augcugggcc cgucccacua caggcca                    107
          <![CDATA[<210>  197]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  197]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag      120
          ucuccuuccu gaaggac                                                     137
          <![CDATA[<210>  198]]>
          <![CDATA[<211>  70]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  198]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauggaucu caagggcagc       60
          augcugggcc                                                              70
          <![CDATA[<210>  199]]>
          <![CDATA[<211>  ]]>80
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  199]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caagagccag uguuggaucu       60
          caagggcagc augcugggcc                                                   80
          <![CDATA[<210>  200]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  200]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag       60
          uguuggaucu caagggcagc augcugggcc                                        90
          <![CDATA[<210>  201]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  201]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caaauccaaa gcuuuccuuc       60
          uuugagccag uguuggaucu caagggcagc augcugggcc                            100
          <![CDATA[<210>  202]]>
          <![CDATA[<211>  110]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  202]]>
          agaaauccgu cuuucauuga cgggagccag uguugcuagu caaugaaguc gccauccaaa       60
          gcuuuccuuc uuugagccag uguuggaucu caagggcagc augcugggcc                 110
          <![CDATA[<210>  203]]>
          <![CDATA[<211>  80]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  203]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu       60
          cuccaaccuc caggcucauc                                                   80
          <![CDATA[<210>  204]]>
          <![CDATA[<211>  85]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  204]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu       60
          cuccaaccuc caggcucauc cagcu                                             85
          <![CDATA[<210>  205]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  205]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca                                        90
          <![CDATA[<210>  206]]>
          <![CDATA[<211>  107]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  206]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa                    107
          <![CDATA[<210>  207]]>
          <![CDATA[<211>  137]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  207]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca      120
          ggacucucuc caagaga                                                     137
          <![CDATA[<210>  208]]>
          <![CDATA[<211>  70]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  208]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagcaaccuc caggcucauc       60
          cagcuuccca                                                              70
          <![CDATA[<210>  209]]>
          <![CDATA[<211>  80]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  209]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac caguuaaacu cuccaaccuc       60
          caggcucauc cagcuuccca                                                   80
          <![CDATA[<210>  210]]>
          <![CDATA[<211>  90]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  210]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu       60
          cuccaaccuc caggcucauc cagcuuccca                                        90
          <![CDATA[<210>  211]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  211]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagagguaac accaaaagac       60
          uucuuaaacu cuccaaccuc caggcucauc cagcuuccca                            100
          <![CDATA[<210>  212]]>
          <![CDATA[<211>  110]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  212]]>
          agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagccccauu accagguaac       60
          accaaaagac uucuuaaacu cuccaaccuc caggcucauc cagcuuccca                 110
          <![CDATA[<210>  213]]>
          <![CDATA[<211>  141]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  213]]>
          tccatgtctc gttatacgct gtggttcgcc aacaacacta gtactactga taaattaccc       60
          cccaagtccc tcacctctcc aaagctgccc atactactac actagtttga cagctagctc      120
          agtcctaggt ataatgctag c                                                141
          <![CDATA[<210>  214]]>
          <![CDATA[<211>  141]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  214]]>
          tccatgtctc gttatacgct gtggttcgcc aacatatagt tcactactag catgctgccc       60
          ttgactagca acactggctc aaagaaggaa agactactta tagttcttga cagctagctc      120
          agtcctaggt ataatgctag c                                                141
          <![CDATA[<210>  215]]>
          <![CDATA[<211>  143]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  215]]>
          tccatgtctc gttatacgct gtggttcgcc aacgcaggaa cgacactact agctggatga       60
          gcctggtcca tggagagttt aaaaagtctt ttggactact ggaacgactt gacagctagc      120
          tcagtcctag gtataatgct agc                                              143
          <![CDATA[<210>  216]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  216]]>
          agaaatccgt ctttcattga cggggagagg tgagggactt ggg                         43
          <![CDATA[<210>  217]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  217]]>
          agaaatccgt ctttcattga cgggagccag tgttgctagt caa                         43
          <![CDATA[<210>  218]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  218]]>
          agaaatccgt ctttcattga cggttaaact ctccatggac cag                         43
          <![CDATA[<210> ]]> 219
          <![CDATA[<211>  1812]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  219]]>
          Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser 
          1               5                   10                  15      
          Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 
                      20                  25                  30          
          Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 
                  35                  40                  45              
          Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 
              50                  55                  60                  
          Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 
          65                  70                  75                  80  
          Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 
                          85                  90                  95      
          Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 
                      100                 105                 110         
          Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 
                  115                 120                 125             
          Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 
              130                 135                 140                 
          Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 
          145                 150                 155                 160 
          Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 
                          165                 170                 175     
          Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 
                      180                 185                 190         
          Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 
                  195                 200                 205             
          Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 
              210                 215                 220                 
          Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 
          225                 230                 235                 240 
          Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 
                          245                 250                 255     
          Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 
                      260                 265                 270         
          Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 
                  275                 280                 285             
          Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 
              290                 295                 300                 
          Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 
          305                 310                 315                 320 
          Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 
                          325                 330                 335     
          Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 
                      340                 345                 350         
          Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 
                  355                 360                 365             
          Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 
              370                 375                 380                 
          Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 
          385                 390                 395                 400 
          Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 
                          405                 410                 415     
          Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 
                      420                 425                 430         
          Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 
                  435                 440                 445             
          Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 
              450                 455                 460                 
          Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 
          465                 470                 475                 480 
          Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 
                          485                 490                 495     
          Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 
                      500                 505                 510         
          Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 
                  515                 520                 525             
          Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 
              530                 535                 540                 
          Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg 
          545                 550                 555                 560 
          Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr 
                          565                 570                 575     
          Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val 
                      580                 585                 590         
          Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg 
                  595                 600                 605             
          Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 
              610                 615                 620                 
          Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly Cys Phe 
          625                 630                 635                 640 
          Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg 
                          645                 650                 655     
          Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln 
                      660                 665                 670         
          Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln 
                  675                 680                 685             
          Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys 
              690                 695                 700                 
          Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe 
          705                 710                 715                 720 
          Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser 
                          725                 730                 735     
          Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu 
                      740                 745                 750         
          Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu 
                  755                 760                 765             
          Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 
              770                 775                 780                 
          Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys 
          785                 790                 795                 800 
          Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile 
                          805                 810                 815     
          Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu 
                      820                 825                 830         
          Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly 
                  835                 840                 845             
          Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 
              850                 855                 860                 
          Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu 
          865                 870                 875                 880 
          Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr 
                          885                 890                 895     
          Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys 
                      900                 905                 910         
          Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu 
                  915                 920                 925             
          Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu 
              930                 935                 940                 
          Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln 
          945                 950                 955                 960 
          Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn 
                          965                 970                 975     
          Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn 
                      980                 985                 990         
          Lys Glu Ala Val Val Tyr Ile Pro  Val Arg Gly Gly Arg  Ile Tyr Phe 
                  995                 1000                 1005             
          Ala Thr  His Lys Val Ala Thr  Gly Ala Val Ser Ile  Val Phe Asp 
              1010                 1015                 1020             
          Gln Lys  Gln Val Trp Val Cys  Asn Ala Asp His Val  Ala Ala Ala 
              1025                 1030                 1035             
          Asn Ile  Ala Leu Thr Gly Lys  Gly Ile Gly Glu Gln  Ser Ser Asp 
              1040                 1045                 1050             
          Glu Glu  Asn Pro Asp Gly Ser  Arg Ile Lys Leu Gln  Leu Thr Ser 
              1055                 1060                 1065             
          Lys Arg  Pro Ala Ala Thr Lys  Lys Ala Gly Gln Ala  Lys Lys Lys 
              1070                 1075                 1080             
          Lys Ser  Gly Gly Ser Ser Gly  Gly Ser Ser Gly Ser  Glu Thr Pro 
              1085                 1090                 1095             
          Gly Thr  Ser Glu Ser Ala Thr  Pro Glu Ser Ser Gly  Gly Ser Ser 
              1100                 1105                 1110             
          Gly Gly  Ser Thr Leu Asn Ile  Glu Asp Glu Tyr Arg  Leu His Glu 
              1115                 1120                 1125             
          Thr Ser  Lys Glu Pro Asp Val  Ser Leu Gly Ser Thr  Trp Leu Ser 
              1130                 1135                 1140             
          Asp Phe  Pro Gln Ala Trp Ala  Glu Thr Gly Gly Met  Gly Leu Ala 
              1145                 1150                 1155             
          Val Arg  Gln Ala Pro Leu Ile  Ile Pro Leu Lys Ala  Thr Ser Thr 
              1160                 1165                 1170             
          Pro Val  Ser Ile Lys Gln Tyr  Pro Met Ser Gln Glu  Ala Arg Leu 
              1175                 1180                 1185             
          Gly Ile  Lys Pro His Ile Gln  Arg Leu Leu Asp Gln  Gly Ile Leu 
              1190                 1195                 1200             
          Val Pro  Cys Gln Ser Pro Trp  Asn Thr Pro Leu Leu  Pro Val Lys 
              1205                 1210                 1215             
          Lys Pro  Gly Thr Asn Asp Tyr  Arg Pro Val Gln Asp  Leu Arg Glu 
              1220                 1225                 1230             
          Val Asn  Lys Arg Val Glu Asp  Ile His Pro Thr Val  Pro Asn Pro 
              1235                 1240                 1245             
          Tyr Asn  Leu Leu Ser Gly Leu  Pro Pro Ser His Gln  Trp Tyr Thr 
              1250                 1255                 1260             
          Val Leu  Asp Leu Lys Asp Ala  Phe Phe Cys Leu Arg  Leu His Pro 
              1265                 1270                 1275             
          Thr Ser  Gln Pro Leu Phe Ala  Phe Glu Trp Arg Asp  Pro Glu Met 
              1280                 1285                 1290             
          Gly Ile  Ser Gly Gln Leu Thr  Trp Thr Arg Leu Pro  Gln Gly Phe 
              1295                 1300                 1305             
          Lys Asn  Ser Pro Thr Leu Phe  Asn Glu Ala Leu His  Arg Asp Leu 
              1310                 1315                 1320             
          Ala Asp  Phe Arg Ile Gln His  Pro Asp Leu Ile Leu  Leu Gln Tyr 
              1325                 1330                 1335             
          Val Asp  Asp Leu Leu Leu Ala  Ala Thr Ser Glu Leu  Asp Cys Gln 
              1340                 1345                 1350             
          Gln Gly  Thr Arg Ala Leu Leu  Gln Thr Leu Gly Asn  Leu Gly Tyr 
              1355                 1360                 1365             
          Arg Ala  Ser Ala Lys Lys Ala  Gln Ile Cys Gln Lys  Gln Val Lys 
              1370                 1375                 1380             
          Tyr Leu  Gly Tyr Leu Leu Lys  Glu Gly Gln Arg Trp  Leu Thr Glu 
              1385                 1390                 1395             
          Ala Arg  Lys Glu Thr Val Met  Gly Gln Pro Thr Pro  Lys Thr Pro 
              1400                 1405                 1410             
          Arg Gln  Leu Arg Glu Phe Leu  Gly Lys Ala Gly Phe  Cys Arg Leu 
              1415                 1420                 1425             
          Phe Ile  Pro Gly Phe Ala Glu  Met Ala Ala Pro Leu  Tyr Pro Leu 
              1430                 1435                 1440             
          Thr Lys  Pro Gly Thr Leu Phe  Asn Trp Gly Pro Asp  Gln Gln Lys 
              1445                 1450                 1455             
          Ala Tyr  Gln Glu Ile Lys Gln  Ala Leu Leu Thr Ala  Pro Ala Leu 
              1460                 1465                 1470             
          Gly Leu  Pro Asp Leu Thr Lys  Pro Phe Glu Leu Phe  Val Asp Glu 
              1475                 1480                 1485             
          Lys Gln  Gly Tyr Ala Lys Gly  Val Leu Thr Gln Lys  Leu Gly Pro 
              1490                 1495                 1500             
          Trp Arg  Arg Pro Val Ala Tyr  Leu Ser Lys Lys Leu  Asp Pro Val 
              1505                 1510                 1515             
          Ala Ala  Gly Trp Pro Pro Cys  Leu Arg Met Val Ala  Ala Ile Ala 
              1520                 1525                 1530             
          Val Leu  Thr Lys Asp Ala Gly  Lys Leu Thr Met Gly  Gln Pro Leu 
              1535                 1540                 1545             
          Val Ile  Leu Ala Pro His Ala  Val Glu Ala Leu Val  Lys Gln Pro 
              1550                 1555                 1560             
          Pro Asp  Arg Trp Leu Ser Asn  Ala Arg Met Thr His  Tyr Gln Ala 
              1565                 1570                 1575             
          Leu Leu  Leu Asp Thr Asp Arg  Val Gln Phe Gly Pro  Val Val Ala 
              1580                 1585                 1590             
          Leu Asn  Pro Ala Thr Leu Leu  Pro Leu Pro Glu Glu  Gly Leu Gln 
              1595                 1600                 1605             
          His Asn  Cys Leu Asp Ile Leu  Ala Glu Ala His Gly  Thr Arg Pro 
              1610                 1615                 1620             
          Asp Leu  Thr Asp Gln Pro Leu  Pro Asp Ala Asp His  Thr Trp Tyr 
              1625                 1630                 1635             
          Thr Asp  Gly Ser Ser Leu Leu  Gln Glu Gly Gln Arg  Lys Ala Gly 
              1640                 1645                 1650             
          Ala Ala  Val Thr Thr Glu Thr  Glu Val Ile Trp Ala  Lys Ala Leu 
              1655                 1660                 1665             
          Pro Ala  Gly Thr Ser Ala Gln  Arg Ala Glu Leu Ile  Ala Leu Thr 
              1670                 1675                 1680             
          Gln Ala  Leu Lys Met Ala Glu  Gly Lys Lys Leu Asn  Val Tyr Thr 
              1685                 1690                 1695             
          Asp Ser  Arg Tyr Ala Phe Ala  Thr Ala His Ile His  Gly Glu Ile 
              1700                 1705                 1710             
          Tyr Arg  Arg Arg Gly Trp Leu  Thr Ser Glu Gly Lys  Glu Ile Lys 
              1715                 1720                 1725             
          Asn Lys  Asp Glu Ile Leu Ala  Leu Leu Lys Ala Leu  Phe Leu Pro 
              1730                 1735                 1740             
          Lys Arg  Leu Ser Ile Ile His  Cys Pro Gly His Gln  Lys Gly His 
              1745                 1750                 1755             
          Ser Ala  Glu Ala Arg Gly Asn  Arg Met Ala Asp Gln  Ala Ala Arg 
              1760                 1765                 1770             
          Lys Ala  Ala Ile Thr Glu Thr  Pro Asp Thr Ser Thr  Leu Leu Ile 
              1775                 1780                 1785             
          Glu Asn  Ser Ser Pro Met Lys  Arg Thr Ala Asp Gly  Ser Glu Phe 
              1790                 1795                 1800             
          Glu Ser  Pro Lys Lys Lys Arg  Lys Val 
              1805                 1810         
          <![CDATA[<210>  220]]>
          <![CDATA[<211>  1620]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  220]]>
          Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser 
          1               5                   10                  15      
          Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 
                      20                  25                  30          
          Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 
                  35                  40                  45              
          Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 
              50                  55                  60                  
          Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 
          65                  70                  75                  80  
          Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 
                          85                  90                  95      
          Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 
                      100                 105                 110         
          Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 
                  115                 120                 125             
          Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 
              130                 135                 140                 
          Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 
          145                 150                 155                 160 
          Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 
                          165                 170                 175     
          Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 
                      180                 185                 190         
          Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 
                  195                 200                 205             
          Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 
              210                 215                 220                 
          Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 
          225                 230                 235                 240 
          Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 
                          245                 250                 255     
          Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 
                      260                 265                 270         
          Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 
                  275                 280                 285             
          Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 
              290                 295                 300                 
          Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 
          305                 310                 315                 320 
          Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 
                          325                 330                 335     
          Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 
                      340                 345                 350         
          Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 
                  355                 360                 365             
          Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 
              370                 375                 380                 
          Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 
          385                 390                 395                 400 
          Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 
                          405                 410                 415     
          Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 
                      420                 425                 430         
          Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 
                  435                 440                 445             
          Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 
              450                 455                 460                 
          Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 
          465                 470                 475                 480 
          Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 
                          485                 490                 495     
          Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 
                      500                 505                 510         
          Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 
                  515                 520                 525             
          Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 
              530                 535                 540                 
          Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg 
          545                 550                 555                 560 
          Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr 
                          565                 570                 575     
          Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val 
                      580                 585                 590         
          Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg 
                  595                 600                 605             
          Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 
              610                 615                 620                 
          Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg Cys Arg 
          625                 630                 635                 640 
          Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg 
                          645                 650                 655     
          Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln 
                      660                 665                 670         
          Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln 
                  675                 680                 685             
          Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys 
              690                 695                 700                 
          Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe 
          705                 710                 715                 720 
          Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser 
                          725                 730                 735     
          Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu 
                      740                 745                 750         
          Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu 
                  755                 760                 765             
          Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 
              770                 775                 780                 
          Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys 
          785                 790                 795                 800 
          Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile 
                          805                 810                 815     
          Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu 
                      820                 825                 830         
          Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly 
                  835                 840                 845             
          Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 
              850                 855                 860                 
          Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu 
          865                 870                 875                 880 
          Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr 
                          885                 890                 895     
          Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys 
                      900                 905                 910         
          Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu 
                  915                 920                 925             
          Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu 
              930                 935                 940                 
          Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln 
          945                 950                 955                 960 
          Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn 
                          965                 970                 975     
          Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn 
                      980                 985                 990         
          Lys Glu Ala Val Val Tyr Ile Pro  Val Arg Gly Gly Arg  Ile Tyr Phe 
                  995                 1000                 1005             
          Ala Thr  His Lys Val Ala Thr  Gly Ala Val Ser Ile  Val Phe Asp 
              1010                 1015                 1020             
          Gln Lys  Gln Val Trp Val Cys  Asn Ala Asp His Val  Ala Ala Ala 
              1025                 1030                 1035             
          Asn Ile  Ala Leu Thr Gly Lys  Gly Ile Gly Arg Gln  Ser Ser Asp 
              1040                 1045                 1050             
          Glu Glu  Asn Pro Asp Gly Gly  Arg Ile Lys Leu Gln  Leu Thr Ser 
              1055                 1060                 1065             
          Lys Arg  Pro Ala Ala Thr Lys  Lys Ala Gly Gln Ala  Lys Lys Lys 
              1070                 1075                 1080             
          Lys Ser  Gly Gly Ser Ser Gly  Gly Ser Ser Gly Ser  Glu Thr Pro 
              1085                 1090                 1095             
          Gly Thr  Ser Glu Ser Ala Thr  Pro Glu Ser Ser Gly  Gly Ser Ser 
              1100                 1105                 1110             
          Gly Gly  Ser Thr Leu Asn Ile  Glu Asp Glu Tyr Arg  Leu His Glu 
              1115                 1120                 1125             
          Thr Ser  Lys Glu Pro Asp Val  Ser Leu Gly Ser Thr  Trp Leu Ser 
              1130                 1135                 1140             
          Asp Phe  Pro Gln Ala Trp Ala  Glu Thr Gly Gly Met  Gly Leu Ala 
              1145                 1150                 1155             
          Val Arg  Gln Ala Pro Leu Ile  Ile Pro Leu Lys Ala  Thr Ser Thr 
              1160                 1165                 1170             
          Pro Val  Ser Ile Lys Gln Tyr  Pro Met Ser Gln Glu  Ala Arg Leu 
              1175                 1180                 1185             
          Gly Ile  Lys Pro His Ile Gln  Arg Leu Leu Asp Gln  Gly Ile Leu 
              1190                 1195                 1200             
          Val Pro  Cys Gln Ser Pro Trp  Asn Thr Pro Leu Leu  Pro Val Lys 
              1205                 1210                 1215             
          Lys Pro  Gly Thr Asn Asp Tyr  Arg Pro Val Gln Asp  Leu Arg Glu 
              1220                 1225                 1230             
          Val Asn  Lys Arg Val Glu Asp  Ile His Pro Thr Val  Pro Asn Pro 
              1235                 1240                 1245             
          Tyr Asn  Leu Leu Ser Gly Leu  Pro Pro Ser His Gln  Trp Tyr Thr 
              1250                 1255                 1260             
          Val Leu  Asp Leu Lys Asp Ala  Phe Phe Cys Leu Arg  Leu His Pro 
              1265                 1270                 1275             
          Thr Ser  Gln Pro Leu Phe Ala  Phe Glu Trp Arg Asp  Pro Glu Met 
              1280                 1285                 1290             
          Gly Ile  Ser Gly Gln Leu Thr  Trp Thr Arg Leu Pro  Gln Gly Phe 
              1295                 1300                 1305             
          Lys Asn  Ser Pro Thr Leu Phe  Asn Glu Ala Leu His  Arg Asp Leu 
              1310                 1315                 1320             
          Ala Asp  Phe Arg Ile Gln His  Pro Asp Leu Ile Leu  Leu Gln Tyr 
              1325                 1330                 1335             
          Val Asp  Asp Leu Leu Leu Ala  Ala Thr Ser Glu Leu  Asp Cys Gln 
              1340                 1345                 1350             
          Gln Gly  Thr Arg Ala Leu Leu  Gln Thr Leu Gly Asn  Leu Gly Tyr 
              1355                 1360                 1365             
          Arg Ala  Ser Ala Lys Lys Ala  Gln Ile Cys Gln Lys  Gln Val Lys 
              1370                 1375                 1380             
          Tyr Leu  Gly Tyr Leu Leu Lys  Glu Gly Gln Arg Trp  Leu Thr Glu 
              1385                 1390                 1395             
          Ala Arg  Lys Glu Thr Val Met  Gly Gln Pro Thr Pro  Lys Thr Pro 
              1400                 1405                 1410             
          Arg Gln  Leu Arg Glu Phe Leu  Gly Lys Ala Gly Phe  Cys Arg Leu 
              1415                 1420                 1425             
          Phe Ile  Pro Gly Phe Ala Glu  Met Ala Ala Pro Leu  Tyr Pro Leu 
              1430                 1435                 1440             
          Thr Lys  Pro Gly Thr Leu Phe  Asn Trp Gly Pro Asp  Gln Gln Lys 
              1445                 1450                 1455             
          Ala Tyr  Gln Glu Ile Lys Gln  Ala Leu Leu Thr Ala  Pro Ala Leu 
              1460                 1465                 1470             
          Gly Leu  Pro Asp Leu Thr Lys  Pro Phe Glu Leu Phe  Val Asp Glu 
              1475                 1480                 1485             
          Lys Gln  Gly Tyr Ala Lys Gly  Val Leu Thr Gln Lys  Leu Gly Pro 
              1490                 1495                 1500             
          Trp Arg  Arg Pro Val Ala Tyr  Leu Ser Lys Lys Leu  Asp Pro Val 
              1505                 1510                 1515             
          Ala Ala  Gly Trp Pro Pro Cys  Leu Arg Met Val Ala  Ala Ile Ala 
              1520                 1525                 1530             
          Val Leu  Thr Lys Asp Ala Gly  Lys Leu Thr Met Gly  Gln Pro Leu 
              1535                 1540                 1545             
          Val Ile  Leu Ala Pro His Ala  Val Glu Ala Leu Val  Lys Gln Pro 
              1550                 1555                 1560             
          Pro Asp  Arg Trp Leu Ser Asn  Ala Arg Met Thr His  Tyr Gln Ala 
              1565                 1570                 1575             
          Leu Leu  Leu Asp Thr Asp Arg  Val Gln Phe Gly Pro  Val Val Ala 
              1580                 1585                 1590             
          Leu Asn  Pro Ala Thr Leu Leu  Pro Met Lys Arg Thr  Ala Asp Gly 
              1595                 1600                 1605             
          Ser Glu  Phe Glu Ser Pro Lys  Lys Lys Arg Lys Val  
              1610                 1615                 1620 
          <![CDATA[<210>  221]]>
          <![CDATA[<211>  1562]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<22]]>0>]]&gt;
          <br/>&lt;![CDATA[&lt;223&gt;  合成的]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;400&gt;  221]]&gt;
          <br/>
          <br/><![CDATA[Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser 
          1               5                   10                  15      
          Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 
                      20                  25                  30          
          Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 
                  35                  40                  45              
          Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 
              50                  55                  60                  
          Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 
          65                  70                  75                  80  
          Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 
                          85                  90                  95      
          Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 
                      100                 105                 110         
          Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 
                  115                 120                 125             
          Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 
              130                 135                 140                 
          Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 
          145                 150                 155                 160 
          Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 
                          165                 170                 175     
          Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 
                      180                 185                 190         
          Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 
                  195                 200                 205             
          Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 
              210                 215                 220                 
          Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 
          225                 230                 235                 240 
          Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 
                          245                 250                 255     
          Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 
                      260                 265                 270         
          Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 
                  275                 280                 285             
          Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 
              290                 295                 300                 
          Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 
          305                 310                 315                 320 
          Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 
                          325                 330                 335     
          Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 
                      340                 345                 350         
          Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 
                  355                 360                 365             
          Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 
              370                 375                 380                 
          Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 
          385                 390                 395                 400 
          Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 
                          405                 410                 415     
          Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 
                      420                 425                 430         
          Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 
                  435                 440                 445             
          Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 
              450                 455                 460                 
          Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 
          465                 470                 475                 480 
          Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 
                          485                 490                 495     
          Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 
                      500                 505                 510         
          Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 
                  515                 520                 525             
          Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 
              530                 535                 540                 
          Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg 
          545                 550                 555                 560 
          Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr 
                          565                 570                 575     
          Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val 
                      580                 585                 590         
          Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg 
                  595                 600                 605             
          Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 
              610                 615                 620                 
          Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg Cys Arg 
          625                 630                 635                 640 
          Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg 
                          645                 650                 655     
          Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln 
                      660                 665                 670         
          Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln 
                  675                 680                 685             
          Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys 
              690                 695                 700                 
          Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe 
          705                 710                 715                 720 
          Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser 
                          725                 730                 735     
          Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu 
                      740                 745                 750         
          Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu 
                  755                 760                 765             
          Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 
              770                 775                 780                 
          Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys 
          785                 790                 795                 800 
          Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile 
                          805                 810                 815     
          Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu 
                      820                 825                 830         
          Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly 
                  835                 840                 845             
          Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 
              850                 855                 860                 
          Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu 
          865                 870                 875                 880 
          Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr 
                          885                 890                 895     
          Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys 
                      900                 905                 910         
          Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu 
                  915                 920                 925             
          Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu 
              930                 935                 940                 
          Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln 
          945                 950                 955                 960 
          Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn 
                          965                 970                 975     
          Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn 
                      980                 985                 990         
          Lys Glu Ala Val Val Tyr Ile Pro  Val Arg Gly Gly Arg  Ile Tyr Phe 
                  995                 1000                 1005             
          Ala Thr  His Lys Val Ala Thr  Gly Ala Val Ser Ile  Val Phe Asp 
              1010                 1015                 1020             
          Gln Lys  Gln Val Trp Val Cys  Asn Ala Asp His Val  Ala Ala Ala 
              1025                 1030                 1035             
          Asn Ile  Ala Leu Thr Gly Lys  Gly Ile Gly Arg Gln  Ser Ser Asp 
              1040                 1045                 1050             
          Glu Glu  Asn Pro Asp Gly Gly  Arg Ile Lys Leu Gln  Leu Thr Ser 
              1055                 1060                 1065             
          Lys Arg  Pro Ala Ala Thr Lys  Lys Ala Gly Gln Ala  Lys Lys Lys 
              1070                 1075                 1080             
          Lys Ser  Gly Gly Ser Ser Gly  Gly Ser Ser Gly Ser  Glu Thr Pro 
              1085                 1090                 1095             
          Gly Thr  Ser Glu Ser Ala Thr  Pro Glu Ser Ser Gly  Gly Ser Ser 
              1100                 1105                 1110             
          Gly Gly  Ser Met Asp Thr Ser  Asn Leu Met Glu Gln  Ile Leu Ser 
              1115                 1120                 1125             
          Ser Asp  Asn Leu Asn Arg Ala  Tyr Leu Gln Val Val  Arg Asn Lys 
              1130                 1135                 1140             
          Gly Ala  Glu Gly Val Asp Gly  Met Lys Tyr Thr Glu  Leu Lys Glu 
              1145                 1150                 1155             
          His Leu  Ala Lys Asn Gly Glu  Thr Ile Lys Gly Gln  Leu Arg Thr 
              1160                 1165                 1170             
          Arg Lys  Tyr Lys Pro Gln Pro  Ala Arg Arg Val Glu  Ile Pro Lys 
              1175                 1180                 1185             
          Pro Asp  Gly Gly Val Arg Asn  Leu Gly Val Pro Thr  Val Thr Asp 
              1190                 1195                 1200             
          Arg Phe  Ile Gln Gln Ala Ile  Ala Gln Val Leu Thr  Pro Ile Tyr 
              1205                 1210                 1215             
          Glu Glu  Gln Phe His Asp His  Ser Tyr Gly Phe Arg  Pro Asn Arg 
              1220                 1225                 1230             
          Cys Ala  Gln Gln Ala Ile Leu  Thr Ala Leu Asn Ile  Met Asn Asp 
              1235                 1240                 1245             
          Gly Asn  Asp Trp Ile Val Asp  Ile Asp Leu Glu Lys  Phe Phe Asp 
              1250                 1255                 1260             
          Thr Val  Asn His Asp Lys Leu  Met Thr Leu Ile Gly  Arg Thr Ile 
              1265                 1270                 1275             
          Lys Asp  Gly Asp Val Ile Ser  Ile Val Arg Lys Tyr  Leu Val Ser 
              1280                 1285                 1290             
          Gly Ile  Met Ile Asp Asp Glu  Tyr Glu Asp Ser Ile  Val Gly Thr 
              1295                 1300                 1305             
          Pro Gln  Gly Gly Asn Leu Ser  Pro Leu Leu Ala Asn  Ile Met Leu 
              1310                 1315                 1320             
          Asn Glu  Leu Asp Lys Glu Met  Glu Lys Arg Gly Leu  Asn Phe Val 
              1325                 1330                 1335             
          Arg Tyr  Ala Asp Asp Cys Ile  Ile Met Val Gly Ser  Glu Met Ser 
              1340                 1345                 1350             
          Ala Asn  Arg Val Met Arg Asn  Ile Ser Arg Phe Ile  Glu Glu Lys 
              1355                 1360                 1365             
          Leu Gly  Leu Lys Val Asn Met  Thr Lys Ser Lys Val  Asp Arg Pro 
              1370                 1375                 1380             
          Ser Gly  Leu Lys Tyr Leu Gly  Phe Gly Phe Tyr Phe  Asp Pro Arg 
              1385                 1390                 1395             
          Ala His  Gln Phe Lys Ala Lys  Pro His Ala Lys Ser  Val Ala Lys 
              1400                 1405                 1410             
          Phe Lys  Lys Arg Met Lys Glu  Leu Thr Cys Arg Ser  Trp Gly Val 
              1415                 1420                 1425             
          Ser Asn  Ser Tyr Lys Val Glu  Lys Leu Asn Gln Leu  Ile Arg Gly 
              1430                 1435                 1440             
          Trp Ile  Asn Tyr Phe Lys Ile  Gly Ser Met Lys Thr  Leu Cys Lys 
              1445                 1450                 1455             
          Glu Leu  Asp Ser Arg Ile Arg  Tyr Arg Leu Arg Met  Cys Ile Trp 
              1460                 1465                 1470             
          Lys Gln  Trp Lys Thr Pro Gln  Asn Gln Glu Lys Asn  Leu Val Lys 
              1475                 1480                 1485             
          Leu Gly  Ile Asp Arg Asn Thr  Ala Arg Arg Val Ala  Tyr Thr Gly 
              1490                 1495                 1500             
          Lys Arg  Ile Ala Tyr Val Cys  Asn Lys Gly Ala Val  Asn Val Ala 
              1505                 1510                 1515             
          Ile Ser  Asn Lys Arg Leu Ala  Ser Phe Gly Leu Ile  Ser Met Leu 
              1520                 1525                 1530             
          Asp Tyr  Tyr Ile Glu Lys Cys  Val Thr Cys Met Lys  Arg Thr Ala 
              1535                 1540                 1545             
          Asp Gly  Ser Glu Phe Glu Ser  Pro Lys Lys Lys Arg  Lys Val 
              1550                 1555                 1560         
          <![CDATA[<210>  222]]>
          <![CDATA[<211>  1548]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  222]]>
          Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 
          1               5                   10                  15      
          Arg Lys Val Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser 
                      20                  25                  30          
          Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala 
                  35                  40                  45              
          Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala 
              50                  55                  60                  
          Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys 
          65                  70                  75                  80  
          Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val 
                          85                  90                  95      
          Arg Asn Leu Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala 
                      100                 105                 110         
          Ile Ala Gln Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His 
                  115                 120                 125             
          Ser Tyr Gly Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr 
              130                 135                 140                 
          Ala Leu Asn Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp 
          145                 150                 155                 160 
          Leu Glu Lys Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu 
                          165                 170                 175     
          Ile Gly Arg Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys 
                      180                 185                 190         
          Tyr Leu Val Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile 
                  195                 200                 205             
          Val Gly Thr Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile 
              210                 215                 220                 
          Met Leu Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe 
          225                 230                 235                 240 
          Val Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser 
                          245                 250                 255     
          Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu 
                      260                 265                 270         
          Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly 
                  275                 280                 285             
          Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln 
              290                 295                 300                 
          Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg 
          305                 310                 315                 320 
          Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys 
                          325                 330                 335     
          Val Glu Lys Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys 
                      340                 345                 350         
          Ile Gly Ser Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg 
                  355                 360                 365             
          Tyr Arg Leu Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn 
              370                 375                 380                 
          Gln Glu Lys Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg 
          385                 390                 395                 400 
          Arg Val Ala Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly 
                          405                 410                 415     
          Ala Val Asn Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu 
                      420                 425                 430         
          Ile Ser Met Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Ser Gly 
                  435                 440                 445             
          Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu 
              450                 455                 460                 
          Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ser 
          465                 470                 475                 480 
          Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 
                          485                 490                 495     
          Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 
                      500                 505                 510         
          Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 
                  515                 520                 525             
          Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 
              530                 535                 540                 
          Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 
          545                 550                 555                 560 
          Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 
                          565                 570                 575     
          Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 
                      580                 585                 590         
          Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 
                  595                 600                 605             
          Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 
              610                 615                 620                 
          Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 
          625                 630                 635                 640 
          Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 
                          645                 650                 655     
          Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 
                      660                 665                 670         
          Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 
                  675                 680                 685             
          Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 
              690                 695                 700                 
          Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 
          705                 710                 715                 720 
          Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 
                          725                 730                 735     
          Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 
                      740                 745                 750         
          Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 
                  755                 760                 765             
          Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 
              770                 775                 780                 
          Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 
          785                 790                 795                 800 
          Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 
                          805                 810                 815     
          Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 
                      820                 825                 830         
          Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 
                  835                 840                 845             
          Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 
              850                 855                 860                 
          Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 
          865                 870                 875                 880 
          Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 
                          885                 890                 895     
          Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 
                      900                 905                 910         
          Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 
                  915                 920                 925             
          Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 
              930                 935                 940                 
          Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 
          945                 950                 955                 960 
          Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 
                          965                 970                 975     
          Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 
                      980                 985                 990         
          Arg Phe Gly Tyr His Leu Pro Lys  Leu Thr Asp Gln Thr  Ala Ile Arg 
                  995                 1000                 1005             
          Val Asn  Lys Lys His Val Lys  Ala Ala Lys Thr Glu  Ala Arg Ile 
              1010                 1015                 1020             
          Arg Leu  Ala Ile Gln Gln Gly  Thr Leu Pro Val Ser  Asn Leu Lys 
              1025                 1030                 1035             
          Ile Thr  Glu Ile Ser Ala Thr  Ile Asn Ser Lys Gly  Gln Val Arg 
              1040                 1045                 1050             
          Ile Pro  Val Lys Phe Arg Val  Gly Arg Gln Lys Gly  Thr Leu Gln 
              1055                 1060                 1065             
          Ile Gly  Asp Arg Phe Cys Gly  Tyr Asp Gln Asn Gln  Thr Ala Ser 
              1070                 1075                 1080             
          His Ala  Tyr Ser Leu Trp Glu  Val Val Lys Glu Gly  Gln Tyr His 
              1085                 1090                 1095             
          Lys Glu  Leu Gly Cys Phe Val  Arg Phe Ile Ser Ser  Gly Asp Ile 
              1100                 1105                 1110             
          Val Ser  Ile Thr Glu Asn Arg  Gly Asn Gln Phe Asp  Gln Leu Ser 
              1115                 1120                 1125             
          Tyr Glu  Gly Leu Ala Tyr Pro  Gln Tyr Ala Asp Trp  Arg Lys Lys 
              1130                 1135                 1140             
          Ala Ser  Lys Phe Val Ser Leu  Trp Gln Ile Thr Lys  Lys Asn Lys 
              1145                 1150                 1155             
          Lys Lys  Glu Ile Val Thr Val  Glu Ala Lys Glu Lys  Phe Asp Ala 
              1160                 1165                 1170             
          Ile Cys  Lys Tyr Gln Pro Arg  Leu Tyr Lys Phe Asn  Lys Glu Tyr 
              1175                 1180                 1185             
          Ala Tyr  Leu Leu Arg Asp Ile  Val Arg Gly Lys Ser  Leu Val Glu 
              1190                 1195                 1200             
          Leu Gln  Gln Ile Arg Gln Glu  Ile Phe Arg Phe Ile  Glu Gln Asp 
              1205                 1210                 1215             
          Cys Gly  Val Thr Arg Leu Gly  Ser Leu Ser Leu Ser  Thr Leu Glu 
              1220                 1225                 1230             
          Thr Val  Lys Ala Val Lys Gly  Ile Ile Tyr Ser Tyr  Phe Ser Thr 
              1235                 1240                 1245             
          Ala Leu  Asn Ala Ser Lys Asn  Asn Pro Ile Ser Asp  Glu Gln Arg 
              1250                 1255                 1260             
          Lys Glu  Phe Asp Pro Glu Leu  Phe Ala Leu Leu Glu  Lys Leu Glu 
              1265                 1270                 1275             
          Leu Ile  Arg Thr Arg Lys Lys  Lys Gln Lys Val Glu  Arg Ile Ala 
              1280                 1285                 1290             
          Asn Ser  Leu Ile Gln Thr Cys  Leu Glu Asn Asn Ile  Lys Phe Ile 
              1295                 1300                 1305             
          Arg Gly  Glu Gly Asp Leu Ser  Thr Thr Asn Asn Ala  Thr Lys Lys 
              1310                 1315                 1320             
          Lys Ala  Asn Ser Arg Ser Met  Asp Trp Leu Ala Arg  Gly Val Phe 
              1325                 1330                 1335             
          Asn Lys  Ile Arg Gln Leu Ala  Pro Met His Asn Ile  Thr Leu Phe 
              1340                 1345                 1350             
          Gly Cys  Gly Ser Leu Tyr Thr  Ser His Gln Asp Pro  Leu Val His 
              1355                 1360                 1365             
          Arg Asn  Pro Asp Lys Ala Met  Lys Cys Arg Trp Ala  Ala Ile Pro 
              1370                 1375                 1380             
          Val Lys  Asp Ile Gly Asp Trp  Val Leu Arg Lys Leu  Ser Gln Asn 
              1385                 1390                 1395             
          Leu Arg  Ala Lys Asn Arg Gly  Thr Gly Glu Tyr Tyr  His Gln Gly 
              1400                 1405                 1410             
          Val Lys  Glu Phe Leu Ser His  Tyr Glu Leu Gln Asp  Leu Glu Glu 
              1415                 1420                 1425             
          Glu Leu  Leu Lys Trp Arg Ser  Asp Arg Lys Ser Asn  Ile Pro Cys 
              1430                 1435                 1440             
          Trp Val  Leu Gln Asn Arg Leu  Ala Glu Lys Leu Gly  Asn Lys Glu 
              1445                 1450                 1455             
          Ala Val  Val Tyr Ile Pro Val  Arg Gly Gly Arg Ile  Tyr Phe Ala 
              1460                 1465                 1470             
          Thr His  Lys Val Ala Thr Gly  Ala Val Ser Ile Val  Phe Asp Gln 
              1475                 1480                 1485             
          Lys Gln  Val Trp Val Cys Asn  Ala Asp His Val Ala  Ala Ala Asn 
              1490                 1495                 1500             
          Ile Ala  Leu Thr Gly Lys Gly  Ile Gly Glu Gln Ser  Ser Asp Glu 
              1505                 1510                 1515             
          Glu Asn  Pro Asp Gly Ser Arg  Ile Lys Leu Gln Leu  Thr Ser Lys 
              1520                 1525                 1530             
          Arg Pro  Ala Ala Thr Lys Lys  Ala Gly Gln Ala Lys  Lys Lys Lys 
              1535                 1540                 1545             
          <![CDATA[<210>  223]]>
          <![CDATA[<211>  1548]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  223]]>
          Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 
          1               5                   10                  15      
          Arg Lys Val Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser 
                      20                  25                  30          
          Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala 
                  35                  40                  45              
          Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala 
              50                  55                  60                  
          Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys 
          65                  70                  75                  80  
          Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val 
                          85                  90                  95      
          Arg Asn Leu Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala 
                      100                 105                 110         
          Ile Ala Gln Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His 
                  115                 120                 125             
          Ser Tyr Gly Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr 
              130                 135                 140                 
          Ala Leu Asn Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp 
          145                 150                 155                 160 
          Leu Glu Lys Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu 
                          165                 170                 175     
          Ile Gly Arg Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys 
                      180                 185                 190         
          Tyr Leu Val Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile 
                  195                 200                 205             
          Val Gly Thr Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile 
              210                 215                 220                 
          Met Leu Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe 
          225                 230                 235                 240 
          Val Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser 
                          245                 250                 255     
          Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu 
                      260                 265                 270         
          Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly 
                  275                 280                 285             
          Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln 
              290                 295                 300                 
          Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg 
          305                 310                 315                 320 
          Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys 
                          325                 330                 335     
          Val Glu Lys Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys 
                      340                 345                 350         
          Ile Gly Ser Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg 
                  355                 360                 365             
          Tyr Arg Leu Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn 
              370                 375                 380                 
          Gln Glu Lys Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg 
          385                 390                 395                 400 
          Arg Val Ala Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly 
                          405                 410                 415     
          Ala Val Asn Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu 
                      420                 425                 430         
          Ile Ser Met Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Ser Gly 
                  435                 440                 445             
          Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu 
              450                 455                 460                 
          Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ser 
          465                 470                 475                 480 
          Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 
                          485                 490                 495     
          Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 
                      500                 505                 510         
          Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 
                  515                 520                 525             
          Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 
              530                 535                 540                 
          Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 
          545                 550                 555                 560 
          Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 
                          565                 570                 575     
          Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 
                      580                 585                 590         
          Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 
                  595                 600                 605             
          Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 
              610                 615                 620                 
          Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 
          625                 630                 635                 640 
          Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 
                          645                 650                 655     
          Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 
                      660                 665                 670         
          Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 
                  675                 680                 685             
          Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 
              690                 695                 700                 
          Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 
          705                 710                 715                 720 
          Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 
                          725                 730                 735     
          Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 
                      740                 745                 750         
          Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 
                  755                 760                 765             
          Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 
              770                 775                 780                 
          Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 
          785                 790                 795                 800 
          Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 
                          805                 810                 815     
          Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 
                      820                 825                 830         
          Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 
                  835                 840                 845             
          Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 
              850                 855                 860                 
          Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 
          865                 870                 875                 880 
          Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 
                          885                 890                 895     
          Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 
                      900                 905                 910         
          Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 
                  915                 920                 925             
          Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 
              930                 935                 940                 
          Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 
          945                 950                 955                 960 
          Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 
                          965                 970                 975     
          Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 
                      980                 985                 990         
          Arg Phe Gly Tyr His Leu Pro Lys  Leu Thr Asp Gln Thr  Ala Ile Arg 
                  995                 1000                 1005             
          Val Asn  Lys Lys His Val Lys  Ala Ala Lys Thr Glu  Ala Arg Ile 
              1010                 1015                 1020             
          Arg Leu  Ala Ile Gln Gln Gly  Thr Leu Pro Val Ser  Asn Leu Lys 
              1025                 1030                 1035             
          Ile Thr  Glu Ile Ser Ala Thr  Ile Asn Ser Lys Gly  Gln Val Arg 
              1040                 1045                 1050             
          Ile Pro  Val Lys Phe Arg Val  Gly Arg Gln Lys Gly  Thr Leu Gln 
              1055                 1060                 1065             
          Ile Gly  Asp Arg Phe Cys Gly  Tyr Asp Gln Asn Gln  Thr Ala Ser 
              1070                 1075                 1080             
          His Ala  Tyr Ser Leu Trp Glu  Val Val Lys Glu Gly  Gln Tyr His 
              1085                 1090                 1095             
          Lys Glu  Leu Arg Cys Arg Val  Arg Phe Ile Ser Ser  Gly Asp Ile 
              1100                 1105                 1110             
          Val Ser  Ile Thr Glu Asn Arg  Gly Asn Gln Phe Asp  Gln Leu Ser 
              1115                 1120                 1125             
          Tyr Glu  Gly Leu Ala Tyr Pro  Gln Tyr Ala Asp Trp  Arg Lys Lys 
              1130                 1135                 1140             
          Ala Ser  Lys Phe Val Ser Leu  Trp Gln Ile Thr Lys  Lys Asn Lys 
              1145                 1150                 1155             
          Lys Lys  Glu Ile Val Thr Val  Glu Ala Lys Glu Lys  Phe Asp Ala 
              1160                 1165                 1170             
          Ile Cys  Lys Tyr Gln Pro Arg  Leu Tyr Lys Phe Asn  Lys Glu Tyr 
              1175                 1180                 1185             
          Ala Tyr  Leu Leu Arg Asp Ile  Val Arg Gly Lys Ser  Leu Val Glu 
              1190                 1195                 1200             
          Leu Gln  Gln Ile Arg Gln Glu  Ile Phe Arg Phe Ile  Glu Gln Asp 
              1205                 1210                 1215             
          Cys Gly  Val Thr Arg Leu Gly  Ser Leu Ser Leu Ser  Thr Leu Glu 
              1220                 1225                 1230             
          Thr Val  Lys Ala Val Lys Gly  Ile Ile Tyr Ser Tyr  Phe Ser Thr 
              1235                 1240                 1245             
          Ala Leu  Asn Ala Ser Lys Asn  Asn Pro Ile Ser Asp  Glu Gln Arg 
              1250                 1255                 1260             
          Lys Glu  Phe Asp Pro Glu Leu  Phe Ala Leu Leu Glu  Lys Leu Glu 
              1265                 1270                 1275             
          Leu Ile  Arg Thr Arg Lys Lys  Lys Gln Lys Val Glu  Arg Ile Ala 
              1280                 1285                 1290             
          Asn Ser  Leu Ile Gln Thr Cys  Leu Glu Asn Asn Ile  Lys Phe Ile 
              1295                 1300                 1305             
          Arg Gly  Glu Gly Asp Leu Ser  Thr Thr Asn Asn Ala  Thr Lys Lys 
              1310                 1315                 1320             
          Lys Ala  Asn Ser Arg Ser Met  Asp Trp Leu Ala Arg  Gly Val Phe 
              1325                 1330                 1335             
          Asn Lys  Ile Arg Gln Leu Ala  Thr Met His Asn Ile  Thr Leu Phe 
              1340                 1345                 1350             
          Gly Cys  Gly Ser Leu Tyr Thr  Ser His Gln Asp Pro  Leu Val His 
              1355                 1360                 1365             
          Arg Asn  Pro Asp Lys Ala Met  Lys Cys Arg Trp Ala  Ala Ile Pro 
              1370                 1375                 1380             
          Val Lys  Asp Ile Gly Asp Trp  Val Leu Arg Lys Leu  Ser Gln Asn 
              1385                 1390                 1395             
          Leu Arg  Ala Lys Asn Arg Gly  Thr Gly Glu Tyr Tyr  His Gln Gly 
              1400                 1405                 1410             
          Val Lys  Glu Phe Leu Ser His  Tyr Glu Leu Gln Asp  Leu Glu Glu 
              1415                 1420                 1425             
          Glu Leu  Leu Lys Trp Arg Ser  Asp Arg Lys Ser Asn  Ile Pro Cys 
              1430                 1435                 1440             
          Trp Val  Leu Gln Asn Arg Leu  Ala Glu Lys Leu Gly  Asn Lys Glu 
              1445                 1450                 1455             
          Ala Val  Val Tyr Ile Pro Val  Arg Gly Gly Arg Ile  Tyr Phe Ala 
              1460                 1465                 1470             
          Thr His  Lys Val Ala Thr Gly  Ala Val Ser Ile Val  Phe Asp Gln 
              1475                 1480                 1485             
          Lys Gln  Val Trp Val Cys Asn  Ala Asp His Val Ala  Ala Ala Asn 
              1490                 1495                 1500             
          Ile Ala  Leu Thr Gly Lys Gly  Ile Gly Arg Gln Ser  Ser Asp Glu 
              1505                 1510                 1515             
          Glu Asn  Pro Asp Gly Gly Arg  Ile Lys Leu Gln Leu  Thr Ser Lys 
              1520                 1525                 1530             
          Arg Pro  Ala Ala Thr Lys Lys  Ala Gly Gln Ala Lys  Lys Lys Lys 
              1535                 1540                 1545             
          <![CDATA[<210>  224]]>
          <![CDATA[<211>  486]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  224]]>
          Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 
          1               5                   10                  15      
          Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 
                      20                  25                  30          
          Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 
                  35                  40                  45              
          Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 
              50                  55                  60                  
          Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 
          65                  70                  75                  80  
          Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 
                          85                  90                  95      
          Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 
                      100                 105                 110         
          Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 
                  115                 120                 125             
          Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 
              130                 135                 140                 
          Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 
          145                 150                 155                 160 
          Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 
                          165                 170                 175     
          Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 
                      180                 185                 190         
          Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 
                  195                 200                 205             
          Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 
              210                 215                 220                 
          Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 
          225                 230                 235                 240 
          Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 
                          245                 250                 255     
          Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 
                      260                 265                 270         
          Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 
                  275                 280                 285             
          Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 
              290                 295                 300                 
          Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 
          305                 310                 315                 320 
          Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 
                          325                 330                 335     
          Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 
                      340                 345                 350         
          Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 
                  355                 360                 365             
          Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 
              370                 375                 380                 
          Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 
          385                 390                 395                 400 
          Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 
                          405                 410                 415     
          Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 
                      420                 425                 430         
          Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 
                  435                 440                 445             
          Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 
              450                 455                 460                 
          Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 
          465                 470                 475                 480 
          Pro Ala Thr Leu Leu Pro 
                          485     
          <![CDATA[<210>  225]]>
          <![CDATA[<400>  225]]>
          000
          <![CDATA[<210>  226]]>
          <![CDATA[<400>  226]]>
          000
          <![CDATA[<210>  227]]>
          <![CDATA[<400>  227]]>
          000
          <![CDATA[<210>  228]]>
          <![CDATA[<400>  228]]>
          000
          <![CDATA[<210>  229]]>
          <![CDATA[<400>  229]]>
          000
          <![CDATA[<210>  230]]>
          <![CDATA[<211>  487]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  230]]>
          Met Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly 
          1               5                   10                  15      
          Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala 
                      20                  25                  30          
          Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala 
                  35                  40                  45              
          Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile 
              50                  55                  60                  
          Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys 
          65                  70                  75                  80  
          Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val 
                          85                  90                  95      
          Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn 
                      100                 105                 110         
          Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp 
                  115                 120                 125             
          Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro 
              130                 135                 140                 
          Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln 
          145                 150                 155                 160 
          Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu 
                          165                 170                 175     
          Phe Asp Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His 
                      180                 185                 190         
          Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala 
                  195                 200                 205             
          Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr 
              210                 215                 220                 
          Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys 
          225                 230                 235                 240 
          Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg 
                          245                 250                 255     
          Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro 
                      260                 265                 270         
          Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Thr Ala Gly Phe Cys 
                  275                 280                 285             
          Arg Leu Trp Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro 
              290                 295                 300                 
          Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys 
          305                 310                 315                 320 
          Ala Tyr Gln Glu Ile Leu Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly 
                          325                 330                 335     
          Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln 
                      340                 345                 350         
          Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg 
                  355                 360                 365             
          Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp 
              370                 375                 380                 
          Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp 
          385                 390                 395                 400 
          Ala Gly Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His 
                          405                 410                 415     
          Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn 
                      420                 425                 430         
          Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val 
                  435                 440                 445             
          Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu 
              450                 455                 460                 
          Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala 
          465                 470                 475                 480 
          His Gly Thr Arg Pro Asp Leu 
                          485         
          <![CDATA[<210>  231]]>
          <![CDATA[<211>  231]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  231]]>
          Met Leu Gln Leu Gly His Leu Glu Glu Ser Asn Ser Pro Trp Asn Thr 
          1               5                   10                  15      
          Pro Val Phe Val Ile Lys Lys Lys Ser Gly Lys Trp Arg Leu Leu Gln 
                      20                  25                  30          
          Asp Leu Arg Ala Val Asn Ala Thr Met His Asp Met Gly Ala Leu Gln 
                  35                  40                  45              
          Pro Gly Leu Pro Ser Pro Val Ala Val Pro Lys Gly Trp Glu Ile Ile 
              50                  55                  60                  
          Ile Ile Asp Leu Gln Asp Cys Phe Phe Asn Ile Lys Leu His Pro Glu 
          65                  70                  75                  80  
          Asp Cys Lys Arg Phe Ala Phe Ser Val Pro Ser Pro Asn Phe Lys Arg 
                          85                  90                  95      
          Pro Tyr Gln Arg Phe Gln Trp Lys Val Leu Pro Gln Gly Met Lys Asn 
                      100                 105                 110         
          Ser Pro Thr Leu Cys Gln Lys Phe Val Asp Lys Ala Ile Leu Thr Val 
                  115                 120                 125             
          Arg Asp Lys Tyr Gln Asp Ser Tyr Ile Val His Tyr Met Asp Asp Ile 
              130                 135                 140                 
          Leu Leu Ala His Pro Ser Arg Ser Ile Val Asp Glu Ile Leu Thr Ser 
          145                 150                 155                 160 
          Met Ile Gln Ala Leu Asn Lys His Gly Leu Val Val Ser Thr Glu Lys 
                          165                 170                 175     
          Ile Gln Lys Tyr Asp Asn Leu Lys Tyr Leu Gly Thr His Ile Gln Gly 
                      180                 185                 190         
          Asp Ser Val Ser Tyr Gln Lys Leu Gln Ile Arg Thr Asp Lys Leu Arg 
                  195                 200                 205             
          Thr Leu Asn Asp Phe Gln Lys Leu Leu Gly Asn Ile Asn Trp Ile Arg 
              210                 215                 220                 
          Pro Phe Leu Lys Leu Thr Thr 
          225                 230     
          <![CDATA[<210>  232]]>
          <![CDATA[<211>  427]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  232]]>
          Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu 
          1               5                   10                  15      
          Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val 
                      20                  25                  30          
          Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly 
                  35                  40                  45              
          Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys Pro Gln Pro 
              50                  55                  60                  
          Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu 
          65                  70                  75                  80  
          Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln 
                          85                  90                  95      
          Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly 
                      100                 105                 110         
          Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn 
                  115                 120                 125             
          Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys 
              130                 135                 140                 
          Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg 
          145                 150                 155                 160 
          Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val 
                          165                 170                 175     
          Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr 
                      180                 185                 190         
          Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn 
                  195                 200                 205             
          Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val Arg Tyr 
              210                 215                 220                 
          Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg 
          225                 230                 235                 240 
          Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys 
                          245                 250                 255     
          Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr 
                      260                 265                 270         
          Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala 
                  275                 280                 285             
          Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu 
              290                 295                 300                 
          Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys 
          305                 310                 315                 320 
          Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser 
                          325                 330                 335     
          Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu 
                      340                 345                 350         
          Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys 
                  355                 360                 365             
          Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala 
              370                 375                 380                 
          Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn 
          385                 390                 395                 400 
          Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met 
                          405                 410                 415     
          Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys 
                      420                 425         
          <![CDATA[<210>  233]]>
          <![CDATA[<211>  774]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  233]]>
          Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile 
          1               5                   10                  15      
          Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg 
                      20                  25                  30          
          Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile 
                  35                  40                  45              
          Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr 
              50                  55                  60                  
          Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val 
          65                  70                  75                  80  
          Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile 
                          85                  90                  95      
          Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr 
                      100                 105                 110         
          Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro 
                  115                 120                 125             
          Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Phe Asp Ile Glu Thr 
              130                 135                 140                 
          Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile 
          145                 150                 155                 160 
          Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val 
                          165                 170                 175     
          Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys 
                      180                 185                 190         
          Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr 
                  195                 200                 205             
          Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu 
              210                 215                 220                 
          Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys 
          225                 230                 235                 240 
          Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile 
                          245                 250                 255     
          His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr 
                      260                 265                 270         
          Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu 
                  275                 280                 285             
          Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn 
              290                 295                 300                 
          Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 
          305                 310                 315                 320 
          Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu 
                          325                 330                 335     
          Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 
                      340                 345                 350         
          Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 
                  355                 360                 365             
          Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His 
              370                 375                 380                 
          Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile 
          385                 390                 395                 400 
          Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His 
                          405                 410                 415     
          Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp 
                      420                 425                 430         
          Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 
                  435                 440                 445             
          Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys 
              450                 455                 460                 
          Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp 
          465                 470                 475                 480 
          Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr 
                          485                 490                 495     
          Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 
                      500                 505                 510         
          Val Ile Ala Trp Gly Arg Glu Tyr Leu Thr Met Thr Ile Lys Glu Ile 
                  515                 520                 525             
          Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe 
              530                 535                 540                 
          Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala 
          545                 550                 555                 560 
          Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu 
                          565                 570                 575     
          Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys 
                      580                 585                 590         
          Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu 
                  595                 600                 605             
          Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala 
              610                 615                 620                 
          Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val 
          625                 630                 635                 640 
          Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 
                          645                 650                 655     
          Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp 
                      660                 665                 670         
          Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala 
                  675                 680                 685             
          Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu 
              690                 695                 700                 
          Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe 
          705                 710                 715                 720 
          Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Lys Gln 
                          725                 730                 735     
          Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys 
                      740                 745                 750         
          Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg 
                  755                 760                 765             
          Leu Lys Pro Lys Gly Thr 
              770                 
          <![CDATA[<210>  234]]>
          <![CDATA[<211>  774]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223]]>>  合成的]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;400&gt;  234]]&gt;
          <br/>
          <br/><![CDATA[Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile 
          1               5                   10                  15      
          Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg 
                      20                  25                  30          
          Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile 
                  35                  40                  45              
          Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr 
              50                  55                  60                  
          Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val 
          65                  70                  75                  80  
          Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile 
                          85                  90                  95      
          Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr 
                      100                 105                 110         
          Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro 
                  115                 120                 125             
          Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Phe Asp Ile Glu Thr 
              130                 135                 140                 
          Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile 
          145                 150                 155                 160 
          Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val 
                          165                 170                 175     
          Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys 
                      180                 185                 190         
          Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr 
                  195                 200                 205             
          Tyr Asp Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu 
              210                 215                 220                 
          Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys 
          225                 230                 235                 240 
          Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile 
                          245                 250                 255     
          His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr 
                      260                 265                 270         
          Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu 
                  275                 280                 285             
          Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn 
              290                 295                 300                 
          Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 
          305                 310                 315                 320 
          Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu 
                          325                 330                 335     
          Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 
                      340                 345                 350         
          Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 
                  355                 360                 365             
          Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His 
              370                 375                 380                 
          Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile 
          385                 390                 395                 400 
          Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His 
                          405                 410                 415     
          Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp 
                      420                 425                 430         
          Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 
                  435                 440                 445             
          Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys 
              450                 455                 460                 
          Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp 
          465                 470                 475                 480 
          Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr 
                          485                 490                 495     
          Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 
                      500                 505                 510         
          Val Ile Ala Trp Gly Arg Glu Tyr Leu Thr Met Thr Ile Lys Glu Ile 
                  515                 520                 525             
          Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe 
              530                 535                 540                 
          Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala 
          545                 550                 555                 560 
          Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu 
                          565                 570                 575     
          Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys 
                      580                 585                 590         
          Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu 
                  595                 600                 605             
          Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala 
              610                 615                 620                 
          Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val 
          625                 630                 635                 640 
          Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 
                          645                 650                 655     
          Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp 
                      660                 665                 670         
          Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala 
                  675                 680                 685             
          Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu 
              690                 695                 700                 
          Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe 
          705                 710                 715                 720 
          Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Lys Gln 
                          725                 730                 735     
          Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys 
                      740                 745                 750         
          Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg 
                  755                 760                 765             
          Leu Lys Pro Lys Gly Thr 
              770                 
          <![CDATA[<210>  235]]>
          <![CDATA[<211>  774]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  235]]>
          Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile 
          1               5                   10                  15      
          Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg 
                      20                  25                  30          
          Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile 
                  35                  40                  45              
          Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Ser Thr Val Val Thr 
              50                  55                  60                  
          Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Ser Val 
          65                  70                  75                  80  
          Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile 
                          85                  90                  95      
          Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr 
                      100                 105                 110         
          Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro 
                  115                 120                 125             
          Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Leu Asp Ile Gly Thr 
              130                 135                 140                 
          Pro Cys His Glu Gly Glu Val Phe Ala Glu Gly Pro Ile Leu Met Ile 
          145                 150                 155                 160 
          Ser Tyr Ala Asp Glu Glu Gly Thr Arg Val Ile Thr Trp Arg Asn Val 
                          165                 170                 175     
          Asp Leu Pro Tyr Val Asp Val Leu Ser Thr Glu Arg Glu Met Ile Gln 
                      180                 185                 190         
          Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr 
                  195                 200                 205             
          Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu 
              210                 215                 220                 
          Lys Leu Gly Ile Asn Phe Thr Leu Gly Arg Glu Gly Ser Glu Pro Lys 
          225                 230                 235                 240 
          Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile 
                          245                 250                 255     
          His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Val Asn Leu Pro Ile 
                      260                 265                 270         
          Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu 
                  275                 280                 285             
          Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn 
              290                 295                 300                 
          Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 
          305                 310                 315                 320 
          Glu Leu Gly Lys Glu Phe Met Pro Met Glu Ala Gln Leu Ser Arg Leu 
                          325                 330                 335     
          Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 
                      340                 345                 350         
          Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 
                  355                 360                 365             
          Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His 
              370                 375                 380                 
          Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile 
          385                 390                 395                 400 
          Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His 
                          405                 410                 415     
          Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp 
                      420                 425                 430         
          Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 
                  435                 440                 445             
          Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys 
              450                 455                 460                 
          Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp 
          465                 470                 475                 480 
          Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr 
                          485                 490                 495     
          Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 
                      500                 505                 510         
          Val Ile Ala Trp Gly Arg Glu Tyr Ile Thr Met Thr Ile Lys Glu Ile 
                  515                 520                 525             
          Glu Glu Lys Tyr Gly Phe Lys Leu Ile Tyr Ser Asp Thr Asp Gly Phe 
              530                 535                 540                 
          Phe Ala Thr Ile Pro Gly Ala Glu Ala Glu Thr Val Lys Lys Lys Ala 
          545                 550                 555                 560 
          Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu 
                          565                 570                 575     
          Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys 
                      580                 585                 590         
          Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu 
                  595                 600                 605             
          Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala 
              610                 615                 620                 
          Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val 
          625                 630                 635                 640 
          Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 
                          645                 650                 655     
          Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp 
                      660                 665                 670         
          Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala 
                  675                 680                 685             
          Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu 
              690                 695                 700                 
          Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe 
          705                 710                 715                 720 
          Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln 
                          725                 730                 735     
          Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Tyr Gly Tyr Arg Lys 
                      740                 745                 750         
          Glu Asp Leu Trp Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg 
                  755                 760                 765             
          Leu Lys Pro Lys Gly Thr 
              770                 
          <![CDATA[<210>  236]]>
          <![CDATA[<211>  683]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  236]]>
          Met Asp His Leu Leu Leu Lys Thr Gln Thr Gln Thr Glu Gln Val Met 
          1               5                   10                  15      
          Asn Val Thr Asn Pro Asn Ser Ile Tyr Ile Lys Gly Arg Leu Tyr Phe 
                      20                  25                  30          
          Lys Gly Tyr Lys Lys Ile Glu Leu His Cys Phe Val Asp Thr Gly Ala 
                  35                  40                  45              
          Ser Leu Cys Ile Ala Ser Lys Phe Val Ile Pro Glu Glu His Trp Val 
              50                  55                  60                  
          Asn Ala Glu Arg Pro Ile Met Val Lys Ile Ala Asp Gly Ser Ser Ile 
          65                  70                  75                  80  
          Thr Ile Ser Lys Val Cys Lys Asp Ile Asp Leu Ile Ile Ala Gly Glu 
                          85                  90                  95      
          Ile Phe Arg Ile Pro Thr Val Tyr Gln Gln Glu Ser Gly Ile Asp Phe 
                      100                 105                 110         
          Ile Ile Gly Asn Asn Phe Cys Gln Leu Tyr Glu Pro Phe Ile Gln Phe 
                  115                 120                 125             
          Thr Asp Arg Val Ile Phe Thr Lys Asn Lys Ser Tyr Pro Val His Ile 
              130                 135                 140                 
          Ala Lys Leu Thr Arg Ala Val Arg Val Gly Thr Glu Gly Phe Leu Glu 
          145                 150                 155                 160 
          Ser Met Lys Lys Arg Ser Lys Thr Gln Gln Pro Glu Pro Val Asn Ile 
                          165                 170                 175     
          Ser Thr Asn Lys Ile Glu Asn Pro Leu Glu Glu Ile Ala Ile Leu Ser 
                      180                 185                 190         
          Glu Gly Arg Arg Leu Ser Glu Glu Lys Leu Phe Ile Thr Gln Gln Arg 
                  195                 200                 205             
          Met Gln Lys Ile Glu Glu Leu Leu Glu Lys Val Cys Ser Glu Asn Pro 
              210                 215                 220                 
          Leu Asp Pro Asn Lys Thr Lys Gln Trp Met Lys Ala Ser Ile Lys Leu 
          225                 230                 235                 240 
          Ser Asp Pro Ser Lys Ala Ile Lys Val Lys Pro Met Lys Tyr Ser Pro 
                          245                 250                 255     
          Met Asp Arg Glu Glu Phe Asp Lys Gln Ile Lys Glu Leu Leu Asp Leu 
                      260                 265                 270         
          Lys Val Ile Lys Pro Ser Lys Ser Pro His Met Ala Pro Ala Phe Leu 
                  275                 280                 285             
          Val Asn Asn Glu Ala Glu Lys Arg Arg Gly Lys Lys Arg Met Val Val 
              290                 295                 300                 
          Asn Tyr Lys Ala Met Asn Lys Ala Thr Val Gly Asp Ala Tyr Asn Leu 
          305                 310                 315                 320 
          Pro Asn Lys Asp Glu Leu Leu Thr Leu Ile Arg Gly Lys Lys Ile Phe 
                          325                 330                 335     
          Ser Ser Phe Asp Cys Lys Ser Gly Phe Trp Gln Val Leu Leu Asp Gln 
                      340                 345                 350         
          Glu Ser Arg Pro Leu Thr Ala Phe Thr Cys Pro Gln Gly His Tyr Glu 
                  355                 360                 365             
          Trp Asn Val Val Pro Phe Gly Leu Lys Gln Ala Pro Ser Ile Phe Gln 
              370                 375                 380                 
          Arg His Met Asp Glu Ala Phe Arg Val Phe Arg Lys Phe Cys Cys Val 
          385                 390                 395                 400 
          Tyr Val Asp Asp Ile Leu Val Phe Ser Asn Asn Glu Glu Asp His Leu 
                          405                 410                 415     
          Leu His Val Ala Met Ile Leu Gln Lys Cys Asn Gln His Gly Ile Ile 
                      420                 425                 430         
          Leu Ser Lys Lys Lys Ala Gln Leu Phe Lys Lys Lys Ile Asn Phe Leu 
                  435                 440                 445             
          Gly Leu Glu Ile Asp Glu Gly Thr His Lys Pro Gln Gly His Ile Leu 
              450                 455                 460                 
          Glu His Ile Asn Lys Phe Pro Asp Thr Leu Glu Asp Lys Lys Gln Leu 
          465                 470                 475                 480 
          Gln Arg Phe Leu Gly Ile Leu Thr Tyr Ala Ser Asp Tyr Ile Pro Lys 
                          485                 490                 495     
          Leu Ala Gln Ile Arg Lys Pro Leu Gln Ala Lys Leu Lys Glu Asn Val 
                      500                 505                 510         
          Pro Trp Arg Trp Thr Lys Glu Asp Thr Leu Tyr Met Gln Lys Val Lys 
                  515                 520                 525             
          Lys Asn Leu Gln Gly Phe Pro Pro Leu His His Pro Leu Pro Glu Glu 
              530                 535                 540                 
          Lys Leu Ile Ile Glu Thr Asp Ala Ser Asp Asp Tyr Trp Gly Gly Met 
          545                 550                 555                 560 
          Leu Lys Ala Ile Lys Ile Asn Glu Gly Thr Asn Thr Glu Leu Ile Cys 
                          565                 570                 575     
          Arg Tyr Ala Ser Gly Ser Phe Lys Ala Ala Glu Lys Asn Tyr His Ser 
                      580                 585                 590         
          Asn Asp Lys Glu Thr Leu Ala Val Ile Asn Thr Ile Lys Lys Phe Ser 
                  595                 600                 605             
          Ile Tyr Leu Thr Pro Val His Phe Leu Ile Arg Thr Asp Asn Thr His 
              610                 615                 620                 
          Phe Lys Ser Phe Val Asn Leu Asn Tyr Lys Gly Asp Ser Lys Leu Gly 
          625                 630                 635                 640 
          Arg Asn Ile Arg Trp Gln Ala Trp Leu Ser His Tyr Ser Phe Asp Val 
                          645                 650                 655     
          Glu His Ile Lys Gly Thr Asp Asn His Phe Ala Asp Phe Leu Ser Arg 
                      660                 665                 670         
          Glu Phe Asn Lys Val Asn Ser Ser Gly Gly Ser 
                  675                 680             
          <![CDATA[<210>  237]]>
          <![CDATA[<211>  329]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  237]]>
          Met Gly Ile His Gly Val Pro Ala Ala Met Lys Ser Ala Glu Tyr Leu 
          1               5                   10                  15      
          Asn Thr Phe Arg Leu Arg Asn Leu Gly Leu Pro Val Met Asn Asn Leu 
                      20                  25                  30          
          His Asp Met Ser Lys Ala Thr Arg Ile Ser Val Glu Thr Leu Arg Leu 
                  35                  40                  45              
          Leu Ile Tyr Thr Ala Asp Phe Arg Tyr Arg Ile Tyr Thr Val Glu Lys 
              50                  55                  60                  
          Lys Gly Pro Glu Lys Arg Met Arg Thr Ile Tyr Gln Pro Ser Arg Glu 
          65                  70                  75                  80  
          Leu Lys Ala Leu Gln Gly Trp Val Leu Arg Asn Ile Leu Asp Lys Leu 
                          85                  90                  95      
          Ser Ser Ser Pro Phe Ser Ile Gly Phe Glu Lys His Gln Ser Ile Leu 
                      100                 105                 110         
          Asn Asn Ala Thr Pro His Ile Gly Ala Asn Phe Ile Leu Asn Ile Asp 
                  115                 120                 125             
          Leu Glu Asp Phe Phe Pro Ser Leu Thr Ala Asn Lys Val Phe Gly Val 
              130                 135                 140                 
          Phe His Ser Leu Gly Tyr Asn Arg Leu Ile Ser Ser Val Leu Thr Lys 
          145                 150                 155                 160 
          Ile Cys Cys Tyr Lys Asn Leu Leu Pro Gln Gly Ala Pro Ser Ser Pro 
                          165                 170                 175     
          Lys Leu Ala Asn Leu Ile Cys Ser Lys Leu Asp Tyr Arg Ile Gln Gly 
                      180                 185                 190         
          Tyr Ala Gly Ser Arg Gly Leu Ile Tyr Thr Arg Tyr Ala Asp Asp Leu 
                  195                 200                 205             
          Thr Leu Ser Ala Gln Ser Met Lys Lys Val Val Lys Ala Arg Asp Phe 
              210                 215                 220                 
          Leu Phe Ser Ile Ile Pro Ser Glu Gly Leu Val Ile Asn Ser Lys Lys 
          225                 230                 235                 240 
          Thr Cys Ile Ser Gly Pro Arg Ser Gln Arg Lys Val Thr Gly Leu Val 
                          245                 250                 255     
          Ile Ser Gln Glu Lys Val Gly Ile Gly Arg Glu Lys Tyr Lys Glu Ile 
                      260                 265                 270         
          Arg Ala Lys Ile His His Ile Phe Cys Gly Lys Ser Ser Glu Ile Glu 
                  275                 280                 285             
          His Val Arg Gly Trp Leu Ser Phe Ile Leu Ser Val Asp Ser Lys Ser 
              290                 295                 300                 
          His Arg Arg Leu Ile Thr Tyr Ile Ser Lys Leu Glu Lys Lys Tyr Gly 
          305                 310                 315                 320 
          Lys Asn Pro Leu Asn Lys Ala Lys Thr 
                          325                 
          <![CDATA[<210>  238]]>
          <![CDATA[<211>  235]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  238]]>
          Met Glu Lys Glu Gly Gln Leu Glu Glu Ala Pro Pro Thr Asn Pro Tyr 
          1               5                   10                  15      
          Asn Thr Pro Thr Phe Ala Ile Lys Lys Lys Asp Lys Asn Lys Trp Arg 
                      20                  25                  30          
          Met Leu Ile Asp Phe Arg Glu Leu Asn Lys Val Thr Gln Asp Phe Thr 
                  35                  40                  45              
          Glu Ile Gln Leu Gly Ile Pro His Pro Ala Gly Leu Ala Lys Lys Arg 
              50                  55                  60                  
          Arg Ile Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Ile Pro Leu 
          65                  70                  75                  80  
          His Glu Asp Phe Arg Pro Tyr Thr Ala Phe Thr Leu Pro Ser Val Asn 
                          85                  90                  95      
          Asn Ala Glu Pro Gly Lys Arg Tyr Ile Tyr Lys Val Leu Pro Gln Gly 
                      100                 105                 110         
          Trp Lys Gly Ser Pro Ala Ile Phe Gln His Thr Met Arg Gln Val Leu 
                  115                 120                 125             
          Glu Pro Phe Arg Lys Ala Asn Lys Asp Val Ile Ile Ile Gln Tyr Met 
              130                 135                 140                 
          Asp Asp Ile Leu Ile Ala Ser Asp Arg Thr Asp Leu Glu His Asp Arg 
          145                 150                 155                 160 
          Val Val Leu Gln Leu Lys Glu Leu Leu Asn Gly Leu Gly Phe Ser Thr 
                          165                 170                 175     
          Pro Asp Glu Lys Phe Gln Lys Asp Pro Pro Ile His Trp Met Gly Tyr 
                      180                 185                 190         
          Glu Leu Trp Pro Thr Lys Trp Lys Leu Gln Lys Ile Gln Leu Pro Gln 
                  195                 200                 205             
          Lys Glu Ile Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Val Leu 
              210                 215                 220                 
          Asn Trp Ala Ala Gln Leu Tyr Pro Gly Ile Lys 
          225                 230                 235 
          <![CDATA[<210>  239]]>
          <![CDATA[<211>  235]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  239]]>
          Met Glu Glu Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu Asn Pro Tyr 
          1               5                   10                  15      
          Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg 
                      20                  25                  30          
          Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp 
                  35                  40                  45              
          Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys Lys Lys 
              50                  55                  60                  
          Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro Leu 
          65                  70                  75                  80  
          Asp Glu Ser Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile Asn 
                          85                  90                  95      
          Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly 
                      100                 105                 110         
          Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu 
                  115                 120                 125             
          Glu Pro Phe Arg Ile Lys Asn Pro Glu Ile Val Ile Tyr Gln Tyr Met 
              130                 135                 140                 
          Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg Thr 
          145                 150                 155                 160 
          Lys Ile Glu Glu Leu Arg Ala His Leu Leu Ser Trp Gly Phe Thr Thr 
                          165                 170                 175     
          Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr 
                      180                 185                 190         
          Glu Leu His Pro Asp Arg Trp Thr Val Gln Pro Ile Asp Leu Pro Glu 
                  195                 200                 205             
          Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Lys Leu 
              210                 215                 220                 
          Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys 
          225                 230                 235 
          <![CDATA[<210>  240]]>
          <![CDATA[<211>  441]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  240]]>
          Met Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly 
          1               5                   10                  15      
          Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile 
                      20                  25                  30          
          Lys Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile 
                  35                  40                  45              
          Ser Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile 
              50                  55                  60                  
          Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu 
          65                  70                  75                  80  
          Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro 
                          85                  90                  95      
          His Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val 
                      100                 105                 110         
          Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr 
                  115                 120                 125             
          Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg 
              130                 135                 140                 
          Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile 
          145                 150                 155                 160 
          Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn 
                          165                 170                 175     
          Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser 
                      180                 185                 190         
          Asp Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln 
                  195                 200                 205             
          His Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys 
              210                 215                 220                 
          Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp 
          225                 230                 235                 240 
          Thr Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn 
                          245                 250                 255     
          Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr 
                      260                 265                 270         
          Pro Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys 
                  275                 280                 285             
          Ala Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu 
              290                 295                 300                 
          Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr 
          305                 310                 315                 320 
          Asp Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly 
                          325                 330                 335     
          Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr 
                      340                 345                 350         
          Gly Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln 
                  355                 360                 365             
          Leu Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp 
              370                 375                 380                 
          Gly Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu 
          385                 390                 395                 400 
          Thr Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu 
                          405                 410                 415     
          Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys 
                      420                 425                 430         
          Glu Pro Ile Val Gly Ala Glu Thr Phe 
                  435                 440     
          <![CDATA[<210>  241]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  241]]>
          aauagcggcc cuaagaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  242]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  242]]>
          auuggaacug gcgagaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  243]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  243]]>
          ccagcaacac cuaagaaauc cgucuuucau ugacgg                                 36
          
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
Figure 12_A0101_SEQ_0013
Figure 12_A0101_SEQ_0014
Figure 12_A0101_SEQ_0015
Figure 12_A0101_SEQ_0016
Figure 12_A0101_SEQ_0017
Figure 12_A0101_SEQ_0018
Figure 12_A0101_SEQ_0019
Figure 12_A0101_SEQ_0020
Figure 12_A0101_SEQ_0021
Figure 12_A0101_SEQ_0022
Figure 12_A0101_SEQ_0023
Figure 12_A0101_SEQ_0024
Figure 12_A0101_SEQ_0025
Figure 12_A0101_SEQ_0026
Figure 12_A0101_SEQ_0027
Figure 12_A0101_SEQ_0028
Figure 12_A0101_SEQ_0029
Figure 12_A0101_SEQ_0030
Figure 12_A0101_SEQ_0031
Figure 12_A0101_SEQ_0032
Figure 12_A0101_SEQ_0033
Figure 12_A0101_SEQ_0034
Figure 12_A0101_SEQ_0035
Figure 12_A0101_SEQ_0036
Figure 12_A0101_SEQ_0037
Figure 12_A0101_SEQ_0038
Figure 12_A0101_SEQ_0039
Figure 12_A0101_SEQ_0040
Figure 12_A0101_SEQ_0041
Figure 12_A0101_SEQ_0042
Figure 12_A0101_SEQ_0043
Figure 12_A0101_SEQ_0044
Figure 12_A0101_SEQ_0045
Figure 12_A0101_SEQ_0046
Figure 12_A0101_SEQ_0047
Figure 12_A0101_SEQ_0048
Figure 12_A0101_SEQ_0049
Figure 12_A0101_SEQ_0050
Figure 12_A0101_SEQ_0051
Figure 12_A0101_SEQ_0052
Figure 12_A0101_SEQ_0053
Figure 12_A0101_SEQ_0054
Figure 12_A0101_SEQ_0055
Figure 12_A0101_SEQ_0056
Figure 12_A0101_SEQ_0057
Figure 12_A0101_SEQ_0058
Figure 12_A0101_SEQ_0059
Figure 12_A0101_SEQ_0060
Figure 12_A0101_SEQ_0061
Figure 12_A0101_SEQ_0062
Figure 12_A0101_SEQ_0063
Figure 12_A0101_SEQ_0064
Figure 12_A0101_SEQ_0065
Figure 12_A0101_SEQ_0066
Figure 12_A0101_SEQ_0067
Figure 12_A0101_SEQ_0068
Figure 12_A0101_SEQ_0069
Figure 12_A0101_SEQ_0070
Figure 12_A0101_SEQ_0071
Figure 12_A0101_SEQ_0072
Figure 12_A0101_SEQ_0073
Figure 12_A0101_SEQ_0074
Figure 12_A0101_SEQ_0075
Figure 12_A0101_SEQ_0076
Figure 12_A0101_SEQ_0077
Figure 12_A0101_SEQ_0078
Figure 12_A0101_SEQ_0079
Figure 12_A0101_SEQ_0080
Figure 12_A0101_SEQ_0081
Figure 12_A0101_SEQ_0082
Figure 12_A0101_SEQ_0083
Figure 12_A0101_SEQ_0084
Figure 12_A0101_SEQ_0085
Figure 12_A0101_SEQ_0086
Figure 12_A0101_SEQ_0087
Figure 12_A0101_SEQ_0088
Figure 12_A0101_SEQ_0089
Figure 12_A0101_SEQ_0090
Figure 12_A0101_SEQ_0091
Figure 12_A0101_SEQ_0092
Figure 12_A0101_SEQ_0093
Figure 12_A0101_SEQ_0094
Figure 12_A0101_SEQ_0095
Figure 12_A0101_SEQ_0096
Figure 12_A0101_SEQ_0097
Figure 12_A0101_SEQ_0098
Figure 12_A0101_SEQ_0099
Figure 12_A0101_SEQ_0100
Figure 12_A0101_SEQ_0101
Figure 12_A0101_SEQ_0102
Figure 12_A0101_SEQ_0103
Figure 12_A0101_SEQ_0104
Figure 12_A0101_SEQ_0105
Figure 12_A0101_SEQ_0106
Figure 12_A0101_SEQ_0107
Figure 12_A0101_SEQ_0108
Figure 12_A0101_SEQ_0109
Figure 12_A0101_SEQ_0110
Figure 12_A0101_SEQ_0111
Figure 12_A0101_SEQ_0112
Figure 12_A0101_SEQ_0113
Figure 12_A0101_SEQ_0114
Figure 12_A0101_SEQ_0115
Figure 12_A0101_SEQ_0116
Figure 12_A0101_SEQ_0117
Figure 12_A0101_SEQ_0118
Figure 12_A0101_SEQ_0119
Figure 12_A0101_SEQ_0120
Figure 12_A0101_SEQ_0121
Figure 12_A0101_SEQ_0122
Figure 12_A0101_SEQ_0123
Figure 12_A0101_SEQ_0124
Figure 12_A0101_SEQ_0125
Figure 12_A0101_SEQ_0126
Figure 12_A0101_SEQ_0127
Figure 12_A0101_SEQ_0128
Figure 12_A0101_SEQ_0129
Figure 12_A0101_SEQ_0130
Figure 12_A0101_SEQ_0131
Figure 12_A0101_SEQ_0132
Figure 12_A0101_SEQ_0133
Figure 12_A0101_SEQ_0134
Figure 12_A0101_SEQ_0135
Figure 12_A0101_SEQ_0136
Figure 12_A0101_SEQ_0137
Figure 12_A0101_SEQ_0138
Figure 12_A0101_SEQ_0139
Figure 12_A0101_SEQ_0140
Figure 12_A0101_SEQ_0141
Figure 12_A0101_SEQ_0142
Figure 12_A0101_SEQ_0143
Figure 12_A0101_SEQ_0144
Figure 12_A0101_SEQ_0145
Figure 12_A0101_SEQ_0146
Figure 12_A0101_SEQ_0147
Figure 12_A0101_SEQ_0148
Figure 12_A0101_SEQ_0149
Figure 12_A0101_SEQ_0150
Figure 12_A0101_SEQ_0151
Figure 12_A0101_SEQ_0152
Figure 12_A0101_SEQ_0153
Figure 12_A0101_SEQ_0154
Figure 12_A0101_SEQ_0155
Figure 12_A0101_SEQ_0156
Figure 12_A0101_SEQ_0157
Figure 12_A0101_SEQ_0158
Figure 12_A0101_SEQ_0159
Figure 12_A0101_SEQ_0160
Figure 12_A0101_SEQ_0161
Figure 12_A0101_SEQ_0162
Figure 12_A0101_SEQ_0163
Figure 12_A0101_SEQ_0164
Figure 12_A0101_SEQ_0165
Figure 12_A0101_SEQ_0166
Figure 12_A0101_SEQ_0167
Figure 12_A0101_SEQ_0168
Figure 12_A0101_SEQ_0169
Figure 12_A0101_SEQ_0170
Figure 12_A0101_SEQ_0171
Figure 12_A0101_SEQ_0172
Figure 12_A0101_SEQ_0173
Figure 12_A0101_SEQ_0174
Figure 12_A0101_SEQ_0175
Figure 12_A0101_SEQ_0176
Figure 12_A0101_SEQ_0177
Figure 12_A0101_SEQ_0178
Figure 12_A0101_SEQ_0179
Figure 12_A0101_SEQ_0180
Figure 12_A0101_SEQ_0181
Figure 12_A0101_SEQ_0182
Figure 12_A0101_SEQ_0183
Figure 12_A0101_SEQ_0184
Figure 12_A0101_SEQ_0185
Figure 12_A0101_SEQ_0186
Figure 12_A0101_SEQ_0187
Figure 12_A0101_SEQ_0188
Figure 12_A0101_SEQ_0189
Figure 12_A0101_SEQ_0190
Figure 12_A0101_SEQ_0191
Figure 12_A0101_SEQ_0192
Figure 12_A0101_SEQ_0193
Figure 12_A0101_SEQ_0194
Figure 12_A0101_SEQ_0195
Figure 12_A0101_SEQ_0196
Figure 12_A0101_SEQ_0197
Figure 12_A0101_SEQ_0198
Figure 12_A0101_SEQ_0199
Figure 12_A0101_SEQ_0200
Figure 12_A0101_SEQ_0201
Figure 12_A0101_SEQ_0202
Figure 12_A0101_SEQ_0203
Figure 12_A0101_SEQ_0204
Figure 12_A0101_SEQ_0205
Figure 12_A0101_SEQ_0206
Figure 12_A0101_SEQ_0207
Figure 12_A0101_SEQ_0208
Figure 12_A0101_SEQ_0209
Figure 12_A0101_SEQ_0210
Figure 12_A0101_SEQ_0211
Figure 12_A0101_SEQ_0212
Figure 12_A0101_SEQ_0213
Figure 12_A0101_SEQ_0214
Figure 12_A0101_SEQ_0215
Figure 12_A0101_SEQ_0216
Figure 12_A0101_SEQ_0217
Figure 12_A0101_SEQ_0218
Figure 12_A0101_SEQ_0219
Figure 12_A0101_SEQ_0220
Figure 12_A0101_SEQ_0221
Figure 12_A0101_SEQ_0222
Figure 12_A0101_SEQ_0223
Figure 12_A0101_SEQ_0224
Figure 12_A0101_SEQ_0225
Figure 12_A0101_SEQ_0226
Figure 12_A0101_SEQ_0227
Figure 12_A0101_SEQ_0228
Figure 12_A0101_SEQ_0229
Figure 12_A0101_SEQ_0230
Figure 12_A0101_SEQ_0231
Figure 12_A0101_SEQ_0232
Figure 12_A0101_SEQ_0233
Figure 12_A0101_SEQ_0234
Figure 12_A0101_SEQ_0235
Figure 12_A0101_SEQ_0236
Figure 12_A0101_SEQ_0237
Figure 12_A0101_SEQ_0238
Figure 12_A0101_SEQ_0239
Figure 12_A0101_SEQ_0240
Figure 12_A0101_SEQ_0241
Figure 12_A0101_SEQ_0242
Figure 12_A0101_SEQ_0243
Figure 12_A0101_SEQ_0244
Figure 12_A0101_SEQ_0245
Figure 12_A0101_SEQ_0246
Figure 12_A0101_SEQ_0247
Figure 12_A0101_SEQ_0248
Figure 12_A0101_SEQ_0249
Figure 12_A0101_SEQ_0250
Figure 12_A0101_SEQ_0251
Figure 12_A0101_SEQ_0252
Figure 12_A0101_SEQ_0253
Figure 12_A0101_SEQ_0254
Figure 12_A0101_SEQ_0255
Figure 12_A0101_SEQ_0256
Figure 12_A0101_SEQ_0257
Figure 12_A0101_SEQ_0258
Figure 12_A0101_SEQ_0259
Figure 12_A0101_SEQ_0260
Figure 12_A0101_SEQ_0261

Claims (88)

  1. 一種基因編輯系統,其包含: (a) V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的第一核酸; (b) 反轉錄酶(RT)多肽或編碼該RT多肽的第二核酸; (c) 指導RNA(gRNA)或編碼該gRNA的第三核酸,其中該gRNA包含可被該V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點)和對目的基因組位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰;以及 (d) 反轉錄供體RNA(RT供體RNA)或編碼該RT供體RNA的第四核酸,其中該RT供體RNA包含引物結合位點(PBS)和模板序列。
  2. 如請求項1所述之基因編輯系統,其中該V型CRISPR核酸酶多肽係Cas12多肽。
  3. 如請求項2所述之基因編輯系統,其中該Cas12多肽係Cas12i多肽,該Cas12i多肽視需要是Cas12i2多肽。
  4. 如請求項3所述之基因編輯系統,其中該Cas12i多肽係Cas12i2多肽,該Cas12i2多肽包含與SEQ ID NO: 2具有至少95%同一性的胺基酸序列。
  5. 如請求項4所述之基因編輯系統,其中該Cas12i2多肽在SEQ ID NO: 2的位置D581、G624、F626、P868、I926、V1030、E1035和/或S1046處包含一或多個突變。
  6. 如請求項5所述之基因編輯系統,其中該一或多個突變係胺基酸取代,該等胺基酸取代視需要是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其組合。
  7. 如請求項5所述之基因編輯系統,其中該Cas12i2多肽包含: (i) 在位置D581、D911、I926和V1030處的突變,該等突變視需要是胺基酸取代D581R、D911R、I926R和V1030G; (ii) 在位置D581、I926和V1030處的突變,該等突變視需要是胺基酸取代D581R、I926R和V1030G; (iii) 在位置D581、I926、V1030和S1046處的突變,該等突變視需要是胺基酸取代D581R、I926R、V1030G和S1046G; (iv) 在位置D581、G624、F626、I926、V1030、E1035和S1046處的突變,該等突變視需要是胺基酸取代D581R、G624R、F626R、I926R、V1030G、E1035R和S1046G;或者 (v) 在位置D581、G624、F626、P868、I926、V1030、E1035和S1046處的突變,該等突變視需要是胺基酸取代D581R、G624R、F626R、P868T、I926R、V1030G、E1035R和S1046G。
  8. 如請求項7所述之基因編輯系統,其中該Cas12i2多肽包含以下的胺基酸序列:SEQ ID NO: 3-7中任一個,視需要SEQ ID NO:4或SEQ ID NO: 7。
  9. 如請求項4或請求項5所述之基因編輯系統,其中該Cas12i多肽具有降低的crRNA加工活性,視需要其中該Cas12i多肽在SEQ ID NO: 2的位置H485和/或位置H486處包含突變。
  10. 如請求項1-9中任一項所述之基因編輯系統,其中該系統包含該V型CRISPR核酸酶多肽。
  11. 如請求項1-10中任一項所述之基因編輯系統,其中該系統包含編碼該V型CRISPR核酸酶多肽的第一核酸。
  12. 如請求項11所述之基因編輯系統,其中該第一核酸位於第一載體中,該第一載體視需要是第一病毒載體。
  13. 如請求項11所述之基因編輯系統,其中該第一核酸係第一信使RNA(mRNA)。
  14. 如請求項1-13中任一項所述之基因編輯系統,其中該RT多肽係莫洛尼鼠白血病病毒(MMLV)-RT、小鼠乳腺腫瘤病毒(MMTV)-RT、Marathon-RT或RTx-RT。
  15. 如請求項1-14中任一項所述之基因編輯系統,其中該系統包含該RT多肽。
  16. 如請求項1-14中任一項所述之基因編輯系統,其中該系統包含編碼該RT多肽的該第二核酸。
  17. 如請求項16所述之基因編輯系統,其中該第二核酸位於第二載體中,該第二載體視需要是第二病毒載體。
  18. 如請求項17所述之基因編輯系統,其中該第二載體與該第一載體相同。
  19. 如請求項16所述之基因編輯系統,其中該第二核酸係第二mRNA。
  20. 如請求項17所述之基因編輯系統,其中該第一mRNA和該第二mRNA位於單個RNA分子上。
  21. 如請求項1-15中任一項所述之基因編輯系統,其中該基因編輯系統包含融合多肽,該融合多肽包含該V型CRISPR核酸酶多肽和該RT多肽。
  22. 如請求項1-15中任一項所述之基因編輯系統,其中該V型CRISPR核酸酶多肽和該RT多肽係單獨的多肽。
  23. 如請求項1-22中任一項所述之基因編輯系統,其中該間隔子的長度為20-30個核苷酸,視需要長度為20個核苷酸。
  24. 如請求項3-23中任一項所述之基因編輯系統,其中該PAM包含5’-TTN-3’的模體,該模體視需要位於該靶序列的5’。
  25. 如請求項3-24中任一項所述之基因編輯系統,其中該一或多個CRISPR核酸酶結合位點係一或多個同向重複序列。
  26. 如請求項25所述之基因編輯系統,其中每個同向重複序列的長度為23-36個核苷酸,視需要長度為23個核苷酸。
  27. 如請求項26所述之基因編輯系統,其中該同向重複序列與SEQ ID NO: 15-17和241-247中的任一個或其長度為至少23個核苷酸的片段具有至少90%同一性。
  28. 如請求項27所述之基因編輯系統,其中該同向重複序列係SEQ ID NO: 15-17和241-247中的任一個,或其長度為至少23個核苷酸的片段;視需要其中該同向重複序列係SEQ ID NO: 17。
  29. 如請求項1-28中任一項所述之基因編輯系統,其中該系統包含該gRNA。
  30. 如請求項1-28中任一項所述之基因編輯系統,其中該系統包含編碼該gRNA的該第三核酸。
  31. 如請求項30所述之基因編輯系統,其中該第三核酸位於第三載體中,該第三載體視需要是病毒載體。
  32. 如請求項31所述之基因編輯系統,其中該第三載體與該第一載體和/或該第二載體相同。
  33. 如請求項1-32中任一項所述之基因編輯系統,其中該PBS的長度為5-100個核苷酸,視需要長度為10-60個核苷酸,較佳的是長度為10-30個核苷酸。
  34. 如請求項1-33中任一項所述之基因編輯系統,其中該PBS結合與該靶序列的互補區相鄰的PBS靶向位點,並且其中該PBS靶向位點位於該靶序列的互補區的上游。
  35. 如請求項34所述之基因編輯系統,其中該PBS靶向位點係該靶序列的互補區上游的3-10個核苷酸。
  36. 如請求項1-33中任一項所述之基因編輯系統,其中該PBS靶向位點與該靶序列的互補區重疊。
  37. 如請求項1-33中任一項所述之基因編輯系統,其中該PBS靶向位點與該靶序列相鄰或重疊。
  38. 如請求項1-37中任一項所述之基因編輯系統,其中該模板序列的長度為5-100個核苷酸,視需要長度為30-50個核苷酸。
  39. 如請求項1-38中任一項所述之基因編輯系統,其中該模板序列與該目的基因組位點同源並且包含相對於該目的基因組位點的一或多個核苷酸變化。
  40. 如請求項39所述之基因編輯系統,其中至少一個核苷酸變化位於該靶序列內。
  41. 如請求項39或請求項40所述之基因編輯系統,其中至少一個核苷酸變化位於該PAM內。
  42. 如請求項1-41中任一項所述之基因編輯系統,其中該系統包含該RT供體RNA。
  43. 如請求項1-41中任一項所述之基因編輯系統,其中該系統包含編碼該RT供體RNA的該第四核酸。
  44. 如請求項43所述之基因編輯系統,其中該第四核酸位於第四載體中,該第四載體視需要是第四病毒載體。
  45. 如請求項44所述之基因編輯系統,其中該第四載體與該第一載體、該第二載體和/或該第三載體相同。
  46. 如請求項1-45中任一項所述之基因編輯系統,其中該gRNA和該RT供體RNA位於單個RNA分子上,該單個RNA分子包含該CRISPR核酸酶結合位點、該間隔子序列、該PBS和該模板序列。
  47. 如請求項46所述之基因編輯系統,其中該單個RNA分子進一步包含該gRNA和該RT供體RNA之間的連接子。
  48. 如請求項47所述之基因編輯系統,其中該連接子包含髮夾。
  49. 如請求項46-48中任一項所述之基因編輯系統,其中該單個RNA分子從5’到3’包含: (i) 該CRISPR核酸酶結合位點、該間隔子序列、該模板序列和該PBS; (ii) 該CRISPR核酸酶結合位點、該間隔子序列、該連接子、該模板序列和該PBS; (iii) 該模板序列、該PBS、該CRISPR核酸酶結合位點和該間隔子序列;或者 (iv) 該模板序列、該PBS、該連接子、該CRISPR核酸酶結合位點和該間隔子序列。
  50. 如請求項46-49中任一項所述之基因編輯系統,其中該單個RNA分子進一步包含5’末端保護片段、3’末端保護片段或兩者,該5’末端保護片段和該3’末端保護片段中的每一個形成二級結構,該二級結構視需要是髮夾、假結或三鏈體結構。
  51. 如請求項50所述之基因編輯系統,其中該5’末端保護片段和/或該3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。
  52. 如請求項50所述之基因編輯系統,其中該5’末端保護片段和/或該3’末端保護片段包含該CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
  53. 如請求項1-45中任一項所述之基因編輯系統,其中該gRNA和該RT供體RNA係兩種單獨的RNA分子。
  54. 如請求項53所述之基因編輯系統,其中該gRNA、該RT供體RNA或兩者進一步包含5’末端保護片段和/或3’末端保護片段。
  55. 如請求項54所述之基因編輯系統,其中該5’末端保護片段和/或該3’末端保護片段形成二級結構,該二級結構視需要是髮夾、假結或三鏈體結構,或其中該5’末端保護片段和/或該3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。
  56. 如請求項54所述之基因編輯系統,其中該5’末端保護片段和/或該3’末端保護片段包含該CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
  57. 如請求項1-56中任一項所述之基因編輯系統,其中該系統包含一或多種脂質奈米顆粒(LNP),該一或多種脂質奈米顆粒包括元件 (a)、(b)、(c)、(d) 或其任何組合。
  58. 如請求項1-57中任一項所述之基因編輯系統,其中該系統包含 (i) 一或多種脂質奈米顆粒(LNP),該一或多種脂質奈米顆粒集合地包括 (a)-(d) 中的多達三種元件,以及 (ii) 一或多種載體。
  59. 如請求項58所述之基因編輯系統,其中該一或多種載體係一或多種病毒載體,該一或多種病毒載體視需要是腺相關病毒(AAV)載體。
  60. 如請求項1-56中任一項所述之基因編輯系統,其中該系統包含該V型CRISPR核酸酶多肽、該RT多肽、該gRNA和該RT供體RNA。
  61. 如請求項60所述之基因編輯系統,其中該V型CRISPR核酸酶多肽和/或該RT多肽與該gRNA和/或該RT供體RNA形成複合物。
  62. 一種藥物組成物,其包含如請求項1-61中任一項所述之系統。
  63. 一種套組,其包含如請求項1-61中任一項所示的系統的 (a)-(d) 的元件。
  64. 一種對細胞進行基因編輯之方法,該方法包括使宿主細胞與如請求項1-61中任一項所述之基因編輯系統或如請求項62所述之藥物組成物接觸以對該宿主細胞進行基因編輯。
  65. 如請求項64所述之方法,其中該宿主細胞在體外培養。
  66. 如請求項65所述之方法,其中該接觸步驟藉由向包含該宿主細胞的受試者投與該基因編輯系統來進行。
  67. 一種經基因修飾的細胞的群體,該群體藉由如請求項1-61中任一項所述之基因編輯系統產生。
  68. 如請求項67所述之經基因修飾的細胞的群體,該群體包含不能被該基因編輯系統編輯的經基因修飾的細胞。
  69. 如請求項68所述之經基因修飾的細胞的群體,其中該等經基因修飾的細胞在該PAM、該靶序列或兩者中包含一或多個修飾。
  70. 一種基因編輯RNA分子,其包含: (i) 可被V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點); (ii) 對遺傳位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰; (iii) 引物結合位點(PBS);以及 (iv) 模板序列。
  71. 如請求項70所述之基因編輯RNA分子,其進一步包含一或多個連接子。
  72. 如請求項70或請求項71所述之基因編輯RNA分子,其中該RNA分子從5’到3’包含: (i) 該CRISPR核酸酶結合位點、該間隔子序列、該模板序列和該PBS; (ii) 該CRISPR核酸酶結合位點、該間隔子序列、該連接子、該模板序列和該PBS; (iii) 該模板序列、該PBS、該CRISPR核酸酶結合位點和該間隔子序列;或者 (iv) 該模板序列、該PBS、該連接子、該CRISPR核酸酶結合位點和該間隔子序列。
  73. 如請求項70-72中任一項所述之基因編輯RNA分子,其進一步包含5’末端保護片段、3’末端保護片段或兩者。
  74. 如請求項73所述之基因編輯RNA分子,其中該5’末端保護片段和/或該3’末端保護片段形成二級結構,該二級結構視需要是髮夾、假結或三鏈體結構,或其中該5’末端保護片段和/或該3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。
  75. 如請求項73所述之基因編輯RNA分子,其中該5’末端保護片段和/或該3’末端保護片段包含該CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
  76. 一種基因編輯RNA分子組,其包含: (i) 指導RNA,該指導RNA包含可被V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點),和對遺傳位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰;以及 (ii) 反轉錄供體RNA(RT供體RNA)或編碼該RT供體RNA的第四核酸,其中該RT供體RNA包含引物結合位點(PBS)和模板序列。
  77. 如請求項76所述之基因編輯RNA分子組,其中該gRNA、該RT供體RNA或兩者進一步包含5’末端保護片段和/或3’末端保護片段。
  78. 如請求項77所述之基因編輯RNA分子組,其中該5’末端保護片段和/或該3’末端保護片段形成二級結構,該二級結構視需要是髮夾、假結或三鏈體結構,或其中該5’末端保護片段和/或該3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。
  79. 如請求項77所述之基因編輯RNA分子組,其中該5’末端保護片段和/或該3’末端保護片段包含該CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
  80. 如請求項70-75中任一項所述之基因編輯RNA分子或如請求項76-79中任一項所述之基因編輯RNA分子組,其中: (i) 該V型CRISPR核酸酶結合位點如請求項25-28中的任一項中所述; (ii) 該間隔子如請求項23-24中的任一項中所述; (iii) 該PBS如請求項33-37中的任一項中所述;和/或 (iv) 該模板序列如請求項38-41中的任一項中所述。
  81. 一種DNA分子或DNA分子組,其編碼如請求項70-80中任一項所示的基因編輯RNA分子或基因編輯RNA分子組。
  82. 如請求項81所述之DNA分子或DNA分子組,其包括在載體或載體組中,視需要其中該載體或載體組係病毒載體。
  83. 一種融合多肽,其包含CRISPR核酸酶和反轉錄酶。
  84. 如請求項83所述之融合多肽,其中該CRISPR核酸酶係V型CRISPR核酸酶,該V型CRISPR核酸酶視需要是Cas12i多肽。
  85. 如請求項84所述之融合多肽,其中該Cas12i多肽係Cas12i2多肽,該Cas12i2多肽視需要如請求項4-9中的任一項中所述。
  86. 如請求項85所述之融合多肽,其包含SEQ ID NO: 25-26和219-223中任一個的胺基酸序列。
  87. 一種核酸,其包含編碼如請求項83-86中任一項所述之融合多肽的核苷酸序列。
  88. 如請求項87所述之核酸,其係載體,視需要表現載體。
TW111120437A 2021-06-01 2022-06-01 包含crispr核酸酶的基因編輯系統及其用途 TW202313971A (zh)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US202163195621P 2021-06-01 2021-06-01
US63/195,621 2021-06-01
US202163236047P 2021-08-23 2021-08-23
US63/236,047 2021-08-23
US202163272937P 2021-10-28 2021-10-28
US63/272,937 2021-10-28
US202263299695P 2022-01-14 2022-01-14
US63/299,695 2022-01-14

Publications (1)

Publication Number Publication Date
TW202313971A true TW202313971A (zh) 2023-04-01

Family

ID=82492907

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111120437A TW202313971A (zh) 2021-06-01 2022-06-01 包含crispr核酸酶的基因編輯系統及其用途

Country Status (9)

Country Link
US (2) US20240102007A1 (zh)
EP (1) EP4347818A2 (zh)
KR (1) KR20240031238A (zh)
AU (1) AU2022284804A1 (zh)
BR (1) BR112023024985A2 (zh)
CA (1) CA3222023A1 (zh)
IL (1) IL308806A (zh)
TW (1) TW202313971A (zh)
WO (1) WO2022256440A2 (zh)

Family Cites Families (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
LT2800811T (lt) 2012-05-25 2017-09-11 The Regents Of The University Of California Būdai ir kompozicijos, skirti tikslinės dnr modifikavimui, panaudojant adresuotą rnr, ir transkripcijos moduliavimui, panaudojant adresuotą rnr
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
EP3825401A1 (en) 2012-12-12 2021-05-26 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
KR20150105634A (ko) 2012-12-12 2015-09-17 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작을 위한 개선된 시스템, 방법 및 효소 조성물의 유전자 조작 및 최적화
PT2784162E (pt) 2012-12-12 2015-08-27 Broad Inst Inc Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
PL2931898T3 (pl) 2012-12-12 2016-09-30 Le Cong Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi
JP2016519652A (ja) 2013-03-14 2016-07-07 カリブー・バイオサイエンシーズ・インコーポレイテッド 核酸ターゲティング核酸の組成物および方法
CN105492611A (zh) 2013-06-17 2016-04-13 布罗德研究所有限公司 用于序列操纵的优化的crispr-cas双切口酶系统、方法以及组合物
LT3066201T (lt) 2013-11-07 2018-08-10 Editas Medicine, Inc. Su crispr susiję būdai ir kompozicijos su valdančiomis grnr
WO2015089427A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
US9994831B2 (en) 2013-12-12 2018-06-12 The Regents Of The University Of California Methods and compositions for modifying a single stranded target nucleic acid
EP4219699A1 (en) 2013-12-12 2023-08-02 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
US9963689B2 (en) 2013-12-31 2018-05-08 The Regents Of The University Of California Cas9 crystals and methods of use thereof
EP3180426B1 (en) 2014-08-17 2019-12-25 The Broad Institute, Inc. Genome editing using cas9 nickases
WO2016036754A1 (en) 2014-09-02 2016-03-10 The Regents Of The University Of California Methods and compositions for rna-directed target dna modification
WO2016106239A1 (en) 2014-12-23 2016-06-30 The Regents Of The University Of California Methods and compositions for nucleic acid integration
BR112017024534A2 (pt) 2015-05-15 2018-07-24 Pioneer Hi Bred Int sistemas de rna-guia/endonuclease cas9 inovadores
US10392607B2 (en) 2015-06-03 2019-08-27 The Regents Of The University Of California Cas9 variants and methods of use thereof
US20160362667A1 (en) 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
EP3436575A1 (en) 2015-06-18 2019-02-06 The Broad Institute Inc. Novel crispr enzymes and systems
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3666895A1 (en) 2015-06-18 2020-06-17 The Broad Institute, Inc. Novel crispr enzymes and systems
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
EP3350203A4 (en) 2015-09-17 2019-06-26 The Regents of The University of California CAS9 VARIANTS POLYPEPTIDES COMPRISING INTERNAL INSERTIONS
KR20180133374A (ko) 2015-10-22 2018-12-14 더 브로드 인스티튜트, 인코퍼레이티드 타입 vi-b crispr 효소 및 시스템
WO2017070598A1 (en) 2015-10-23 2017-04-27 Caribou Biosciences, Inc. Engineered crispr class 2 cross-type nucleic-acid targeting nucleic acids
SG11201803593QA (en) 2015-12-04 2018-06-28 Caribou Biosciences Inc Engineered nucleic-acid targeting nucleic acids
WO2017106657A1 (en) 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
WO2017106569A1 (en) 2015-12-18 2017-06-22 The Regents Of The University Of California Modified site-directed modifying polypeptides and methods of use thereof
CA3026055A1 (en) 2016-04-19 2017-10-26 The Broad Institute, Inc. Novel crispr enzymes and systems
CA3026110A1 (en) 2016-04-19 2017-11-02 The Broad Institute, Inc. Novel crispr enzymes and systems
CA3028158A1 (en) 2016-06-17 2017-12-21 The Broad Institute, Inc. Type vi crispr orthologs and systems
US11352647B2 (en) 2016-08-17 2022-06-07 The Broad Institute, Inc. Crispr enzymes and systems
WO2018035387A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
US11873504B2 (en) 2016-09-30 2024-01-16 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
MX2019003678A (es) 2016-09-30 2020-08-13 Univ California Enzimas modificadoras de ácido nucleico guiadas por arn y métodos de uso de estas.
WO2018071672A1 (en) 2016-10-12 2018-04-19 The Regents Of The University Of Colorado Novel engineered and chimeric nucleases
US11180778B2 (en) 2016-11-11 2021-11-23 The Regents Of The University Of California Variant RNA-guided polypeptides and methods of use
US9816093B1 (en) 2016-12-06 2017-11-14 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
EP4361261A2 (en) 2017-03-15 2024-05-01 The Broad Institute Inc. Novel cas13b orthologues crispr enzymes and systems
CA3084252A1 (en) 2017-03-28 2018-10-04 Caribou Biosciences, Inc. Crispr-associated (cas) protein
US11840711B2 (en) 2017-04-12 2023-12-12 The Broad Institute, Inc. Type VI CRISPR orthologs and systems
US11692184B2 (en) 2017-05-16 2023-07-04 The Regents Of The University Of California Thermostable RNA-guided endonucleases and methods of use thereof
WO2018226855A1 (en) 2017-06-06 2018-12-13 The General Hospital Corporation Engineered crispr-cas9 nucleases
RU2022103603A (ru) 2017-06-23 2022-03-11 Инскрипта, Инк. Направляемые нуклеиновыми кислотами нуклеазы
EP3645728A4 (en) 2017-06-26 2021-03-24 The Broad Institute, Inc. NEW CRISPR TYPE VI ORTHOLOGISTS AND RELATED SYSTEMS
US10392616B2 (en) 2017-06-30 2019-08-27 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
EP3655530A4 (en) 2017-07-17 2021-07-28 The Broad Institute, Inc. NEW TYPE VI CRISPR ORTHOLOGIST AND SYSTEMS
WO2019036185A1 (en) 2017-08-15 2019-02-21 The Regents Of The University Of California COMPOSITIONS AND METHODS FOR IMPROVING GENOMIC SEQUENCE CORRECTION
EP3692145A4 (en) 2017-10-04 2021-11-24 The Broad Institute, Inc. NUCLEIC ACID TARGETED EDITING SYSTEMS, METHODS AND COMPOSITIONS
WO2019089804A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Casy compositions and methods of use
WO2019089808A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Class 2 crispr/cas compositions and methods of use
CA3080493A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Casz compositions and methods of use
GB2582100B (en) 2017-11-01 2023-05-17 Univ California CAS12C Compositions and methods of use
US10253365B1 (en) 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
EP3728588A4 (en) 2017-12-22 2022-03-09 The Broad Institute, Inc. CAS12A SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED RNA BASE EDITING
WO2019126774A1 (en) 2017-12-22 2019-06-27 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2019173248A1 (en) 2018-03-07 2019-09-12 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
PT3765615T (pt) 2018-03-14 2023-08-28 Arbor Biotechnologies Inc Novas enzimas e sistemas de direcionamento de dna crispr
FI3765616T3 (fi) 2018-03-14 2023-08-29 Arbor Biotechnologies Inc Uusia CRISPR-DNA- ja RNA-kohdennusentsyymejä ja -järjestelmiä
US20210198664A1 (en) 2018-05-16 2021-07-01 Arbor Biotechnologies, Inc. Novel crispr-associated systems and components
AU2019284926C1 (en) 2018-06-13 2023-04-27 Caribou Biosciences, Inc. Engineered cascade components and cascade complexes
EP3814488A4 (en) 2018-06-26 2022-06-22 The Regents of The University of California RNA-GUIDED EFFECTIVE PROTEINS AND METHODS OF USE THEREOF
US20210301288A1 (en) 2018-07-16 2021-09-30 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
US20210284981A1 (en) 2018-07-24 2021-09-16 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
WO2020028555A2 (en) 2018-07-31 2020-02-06 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
AU2019318079A1 (en) 2018-08-07 2021-01-28 Massachusetts Institute Of Technology Novel Cas12b enzymes and systems
EP3841205A4 (en) 2018-08-22 2022-08-17 The Regents of The University of California VARIANT TYPE CRISPR/CAS V EFFECTIVE POLYPEPTIDES AND METHODS OF USE THEREOF
CN113227368B (zh) 2018-10-22 2023-07-07 因思科瑞普特公司 工程化酶
WO2020142754A2 (en) 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
US20220049273A1 (en) 2019-03-01 2022-02-17 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
WO2020181102A1 (en) 2019-03-07 2020-09-10 The Regents Of The University Of California Crispr-cas effector polypeptides and methods of use thereof
DE212020000516U1 (de) 2019-03-07 2022-01-17 The Regents of the University of California CRISPR-CAS-Effektorpolypeptide
WO2020186213A1 (en) 2019-03-14 2020-09-17 The Broad Institute, Inc. Novel nucleic acid modifiers
US20220177863A1 (en) 2019-03-18 2022-06-09 The Broad Institute, Inc. Type vii crispr proteins and systems
AU2020242032A1 (en) * 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
EP3941927A4 (en) 2019-03-22 2023-07-19 The Regents of The University of California COMPOSITIONS AND METHODS FOR MODIFICATION OF TARGET MOLECULES
WO2020206036A1 (en) 2019-04-01 2020-10-08 The Broad Institute, Inc. Novel nucleic acid modifier
AU2020265256A1 (en) 2019-05-01 2021-12-23 Mammoth Biosciences, Inc. Programmable nucleases and methods of use
EP3980533A1 (en) 2019-06-07 2022-04-13 Scribe Therapeutics Inc. Engineered casx systems
WO2020247883A2 (en) 2019-06-07 2020-12-10 Scribe Therapeutics Inc. Deep mutational evolution of biomolecules
JP2022538789A (ja) 2019-06-14 2022-09-06 アーバー バイオテクノロジーズ, インコーポレイテッド 新規crispr dnaターゲティング酵素及びシステム
WO2021007177A1 (en) 2019-07-08 2021-01-14 The Regents Of The University Of California Variant type v crispr/cas effector polypeptides and methods of use thereof
EP3996738A4 (en) 2019-07-11 2023-07-26 Arbor Biotechnologies, Inc. NOVEL ENZYMES AND SYSTEMS TARGETING CRISPR DNA
WO2021041569A1 (en) 2019-08-27 2021-03-04 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
EP4025588A4 (en) 2019-09-05 2023-09-06 Arbor Biotechnologies, Inc. NOVEL CRISPR DNA TARGETING ENZYMES AND SYSTEMS
MX2022002872A (es) 2019-09-09 2022-08-04 Arbor Biotechnologies Inc Nuevas sistemas y enzimas de crispr dirigidos a adn.
WO2021055874A1 (en) 2019-09-20 2021-03-25 The Broad Institute, Inc. Novel type vi crispr enzymes and systems
AU2020380319A1 (en) * 2019-11-05 2022-05-12 Pairwise Plants Services, Inc. Compositions and methods for RNA-encoded DNA-replacement of alleles
EP4069850A4 (en) 2019-12-04 2024-03-27 Arbor Biotechnologies Inc COMPOSITIONS COMPRISING A NUCLEASE AND THEIR USES
CN114787347A (zh) 2019-12-10 2022-07-22 因思科瑞普特公司 新颖的mad核酸酶
US10704033B1 (en) 2019-12-13 2020-07-07 Inscripta, Inc. Nucleic acid-guided nucleases
MX2022007858A (es) 2019-12-23 2022-09-19 Univ California Polipeptidos efectores crispr-cas y metodos de uso de estos.
MX2022012189A (es) 2020-03-31 2023-01-05 Arbor Biotechnologies Inc Composiciones que comprenden una variante del polipéptido cas12i2 y usos de las mismas.

Also Published As

Publication number Publication date
AU2022284804A9 (en) 2023-12-14
BR112023024985A2 (pt) 2024-02-20
WO2022256440A2 (en) 2022-12-08
KR20240031238A (ko) 2024-03-07
IL308806A (en) 2024-01-01
US20240102007A1 (en) 2024-03-28
US20230023791A1 (en) 2023-01-26
WO2022256440A3 (en) 2023-02-09
AU2022284804A1 (en) 2023-12-07
EP4347818A2 (en) 2024-04-10
CA3222023A1 (en) 2022-12-08

Similar Documents

Publication Publication Date Title
CN115698278A (zh) 包含Cas12i2变体多肽的组合物及其用途
TW202237836A (zh) 工程化之第2類第v型crispr系統
US20230083383A1 (en) Compositions and methods for targeting, editing or modifying human genes
US20230287456A1 (en) Compositions comprising a cas12i polypeptide and uses thereof
US20240016934A1 (en) Compositions and Methods for Reducing MHC Class II in a Cell
KR20240052763A (ko) 스타스민 2 (stmn2)를 표적화하는 rna 가이드를 포함하는 유전자 편집 시스템 및 이의 용도
JP2023549084A (ja) Pdcd1を標的とするrnaガイドを含む組成物及びその使用
TW202313971A (zh) 包含crispr核酸酶的基因編輯系統及其用途
JP2023543108A (ja) Rna足場
CN117813379A (zh) 包括crispr核酸酶的基因编辑系统和其用途
US20230399639A1 (en) Compositions comprising an rna guide targeting b2m and uses thereof
US20230193243A1 (en) Compositions comprising a cas12i2 polypeptide and uses thereof
JP2023548588A (ja) Tracを標的とするrnaガイドを含む組成物及びその使用
JP2023549080A (ja) Bcl11aを標的とするrnaガイドを含む組成物及びその使用
WO2023081377A2 (en) Compositions comprising an rna guide targeting ciita and uses thereof
CN117136233A (zh) 包含变体Cas12i4多肽的组合物及其用途
TW202321447A (zh) 包含crispr核酸酶之組成物及其用途
WO2023137451A1 (en) Compositions comprising an rna guide targeting cd38 and uses thereof
CN118019846A (zh) 包含crispr核酸酶的组合物及其用途
WO2022266538A2 (en) Compositions and methods for targeting, editing or modifying human genes
WO2024081383A2 (en) Compositions and methods for targeting, editing, or modifying genes
WO2023225035A2 (en) Compositions and methods for engineering cells
CN117813382A (zh) 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途
WO2022256448A2 (en) Compositions and methods for targeting, editing, or modifying genes
TW202408595A (zh) 用於對細胞進行遺傳修飾之方法及組合物