CN116670282A - 靶向xbp1的寡核苷酸 - Google Patents

靶向xbp1的寡核苷酸 Download PDF

Info

Publication number
CN116670282A
CN116670282A CN202180086765.XA CN202180086765A CN116670282A CN 116670282 A CN116670282 A CN 116670282A CN 202180086765 A CN202180086765 A CN 202180086765A CN 116670282 A CN116670282 A CN 116670282A
Authority
CN
China
Prior art keywords
seq
xbp1
cells
antisense oligonucleotide
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180086765.XA
Other languages
English (en)
Inventor
S·图纳维蒂
J·维克萨
S-H·钟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Roche Innovation Center Copenhagen AS
Original Assignee
F Hoffmann La Roche AG
Roche Innovation Center Copenhagen AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG, Roche Innovation Center Copenhagen AS filed Critical F Hoffmann La Roche AG
Publication of CN116670282A publication Critical patent/CN116670282A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/06Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies from serum
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/31Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/35Valency
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/323Chemical structure of the sugar modified ring structure
    • C12N2310/3231Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/33Alteration of splicing

Abstract

本发明涉及改变XBP1前体mRNA的剪接的反义寡核苷酸。所述反义寡核苷酸在增强细胞中和哺乳动物蛋白质表达系统,诸如异源蛋白质表达系统中的蛋白质表达的水平和/或质量,诸如增强CHO细胞中的抗体表达中具有应用。所述反义寡核苷酸也在诸如用于治疗或预防蛋白质病理学疾病的疗法中具有应用。

Description

靶向XBP1的寡核苷酸
技术领域
本发明涉及诱导XBP1剪接变体表达的寡核苷酸。此类寡核苷酸可增强细胞中蛋白质表达的水平和/或质量,并在哺乳动物蛋白质表达系统(诸如异源蛋白质表达系统)中具有效用。寡核苷酸还具有治疗效用,包括治疗或预防蛋白质病理学疾病(proteopathological disease)。
背景技术
XBP1(X-框结合蛋白1)是通过诱导参与蛋白质折叠和质量控制的基因来介导对ER应激的适应性的转录因子。
XBP1转录本以不同的剪接形式存在,包括其表达受IRE1α(肌醇需要酶1α)调节的剪接变体。在哺乳动物细胞中,IRE1α在内质网(ER)应激下从XBP1 mRNA中切除26个核苷酸的片段以生成编码功能活性XBP1s蛋白的剪接变体。
切除26个核苷酸的片段导致产生+2框外事件,从而导致活性XBP1转录因子(XBP-1S)的表达。26个核苷酸的片段存在于XBP1成熟mRNA的外显子4中。
Cain等人,(Biotechnol Prog 2013;29(3):697-706)报道了经工程化以表达X-框结合蛋白(XBP-1S)和内质网氧化还原酶(ERO1-Lα)(CHOS-XE.CHOS-XE细胞)二者的中国仓鼠卵巢(CHO)细胞,其提供了与CHOS细胞相比增加的抗体产量(5.3-6.2倍)。
Tong等人,(Neurochem.2012年十一月;123(3):406–416)报道了突变体TDP-43在转基因大鼠中的过度表达,这导致泛素显著聚集和高尔基复合体碎片丢失,然后导致神经元丢失。值得注意的是,在泛素的聚集和高尔基复合体碎片的丢失之前还有XBP1的耗尽和未折叠蛋白响应(UPR)的失活。这表明在与异常蛋白质折叠相关的疾病(蛋白质病理学疾病)中需要恢复或上调XBP1介导的UPR,该疾病诸如神经退行性疾病,包括TDP-43病理学,例如额颞叶变性(FTLD)和ALS。
在WO 2003/89622中,公开了用于调节未折叠蛋白响应的新基因、组合物和方法。
在WO 2019/004939中,公开了用于调节t细胞功能的反义寡核苷酸。
在WO 2008/016356中,公开了与银屑病相关的人类基因的基因图。
发明目的
发明人出人意料地确定,活性XBP1剪接变体应用于蛋白质生产方法以及治疗方法中,主要涉及蛋白质病理学疾病的治疗。
发明人出人意料地确定,可以使用与XBP1前体mRNA转录本的一部分互补(诸如完全互补)的反义寡核苷酸来生产活性XBP1剪接变体。该XPB1剪接变体可能是XBP1Δ4剪接变体(外显子4缺失的XBP1剪接变体)。XBP1外显子4包含在体内被IRE1α切除的26个核苷酸的片段,并且与在体内IRE1α切除26个核苷酸的事件一样,外显子4的跳跃引入了+2框外事件。
本发明至少部分基于以下发现:重组哺乳动物细胞中XBP1Δ4变体的生成或表达使得异源表达的蛋白质(诸如单克隆抗体,特别是以其他方式难以表达的异源表达的蛋白质)的表达提高。可以通过XBP1Δ4变体的表达获得在哺乳动物细胞中的质量提高的蛋白质表达。
本发明至少部分地基于以下发现:在哺乳动物细胞中诱导XBP1Δ4的生成或表达的化合物(诸如反义寡核苷酸)可用于增强异源表达的蛋白质在哺乳动物细胞中的重组表达。特别地,在哺乳动物细胞中诱导XBP1Δ4的表达的化合物(诸如反义寡核苷酸)可用于增强正确折叠的异源表达的蛋白质在哺乳动物细胞中的重组表达。
本发明至少部分基于以下发现:在哺乳动物细胞中诱导XBP1Δ4表达的反义寡核苷酸可用于治疗蛋白质病理学疾病。
发明内容
根据一个方面,本发明提供了一种用于在表达XBP1的细胞中生成或表达XBP1剪接变体的反义寡核苷酸,其中该反义寡核苷酸的长度为8个至40个核苷酸,并且包含长度为8个至40个核苷酸的与哺乳动物XBP1前体mRNA转录本互补的连续核苷酸序列。
XBP1剪接变体可以是XBP1Δ4变体。
连续核苷酸序列可以与仓鼠XBP1前体mRNA转录本(SEQ ID NO 1)的至少10个连续核苷酸互补,诸如来自SEQ ID NO 1的核苷酸2960至核苷酸3113的至少10个连续核苷酸或来自SEQ ID NO 1的核苷酸2986至核苷酸3018的至少10个连续核苷酸。
连续核苷酸序列可以与选自由以下项组成的组的序列互补:SEQ ID NO 299、SEQID NO 301、SEQ ID NO 302、SEQ ID NO 304、SEQ ID NO 305、SEQ ID NO 306、SEQ ID NO307、SEQ ID NO 308、SEQ ID NO 309、SEQ ID NO 310、SEQ ID NO 314、SEQ ID NO 316、SEQID NO 317、SEQ ID NO 318、SEQ ID NO 319、SEQ ID NO 323、SEQ ID NO 325、SEQ ID NO327、SEQ ID NO 328、SEQ ID NO 330、SEQ ID NO 331、SEQ ID NO 332、SEQ ID NO 333、SEQID NO 334、SEQ ID NO 336、SEQ ID NO 337、SEQ ID NO 385、SEQ ID NO 386、SEQ ID NO387、SEQ ID NO 388、SEQ ID NO 390、SEQ ID NO 391、SEQ ID NO 392、SEQ ID NO 393、SEQID NO 394、SEQ ID NO 395、SEQ ID NO 396397、SEQ ID NO 398、SEQ ID NO 399、SEQ IDNO 401、SEQ ID NO 402、SEQ ID NO 419、SEQ ID NO 431、SEQ ID NO、SEQ ID NO 432、SEQID NO 433、SEQ ID NO 434、SEQ ID NO 438、SEQ ID NO 439、SEQ ID NO 440、SEQ ID NO441、SEQ ID NO 442、SEQ ID NO 449、SEQ ID NO 484、SEQ ID NO 485、SEQ ID NO 486、SEQID NO 487、SEQ ID NO 488、SEQ ID NO 489、SEQ ID NO 490、SEQ ID NO 491、SEQ ID NO492、SEQ ID NO 493、SEQ ID NO 494、SEQ ID NO 495、SEQ ID NO 496、SEQ ID NO 497、SEQID NO 498、SEQ ID NO 499、SEQ ID NO 500、SEQ ID NO 501、SEQ ID NO 502、SEQ ID NO503、SEQ ID NO 505、SEQ ID NO 506、SEQ ID NO 507、SEQ ID NO 508、SEQ ID NO 509、SEQID NO 510、SEQ ID NO 511、SEQ ID NO 512、SEQ ID NO513、SEQ ID NO 515、SEQ ID NO517、SEQ ID NO 520、SEQ ID NO 572、SEQ ID NO 573、SEQ ID NO 576、SEQ ID NO 577、SEQID NO 588和SEQ ID NO 589。
连续核苷酸序列可以选自由以下项组成的组:SEQ ID NO 8、SEQ ID NO 10、SEQID NO 11、SEQ ID NO 13、SEQ ID NO 14、SEQ ID NO 15、SEQ ID NO 16、SEQ ID NO 17、SEQID NO 18、SEQ ID NO 19、SEQ ID NO 23、SEQ ID NO 24、SEQ ID NO 25、SEQ ID NO 26、SEQID NO 27、SEQ ID NO 28、SEQ ID NO 32、SEQ ID NO 34、SEQ ID NO 36、SEQ ID NO 37、SEQID NO 39、SEQ ID NO 40、SEQ ID NO 41、SEQ ID NO 42、SEQ ID NO 43、SEQ ID NO 45、SEQID NO 46、SEQ ID NO 94、SEQ ID NO 95、SEQ ID NO 96、SEQ ID NO 97、SEQ ID NO 99、SEQID NO 100、SEQ ID NO 101、SEQ ID NO 102、SEQ ID NO 103、SEQ ID NO 104、SEQ ID NO105、SEQ ID NO 106、SEQ ID NO 107、SEQ ID NO 108、SEQ ID NO 110、SEQ ID NO 111、SEQID NO 128、SEQ ID NO 140、SEQ ID NO 141、SEQ ID NO 142、SEQ ID NO 143、SEQ ID NO147、SEQ ID NO 148、SEQ ID NO 149、SEQ ID NO 150、SEQ ID NO 151、SEQ ID NO 158、SEQID NO 193、SEQ ID NO 194、SEQ ID NO 195、SEQ ID NO 196、SEQ ID NO 197、SEQ ID NO198、SEQ ID NO 199、SEQ ID NO 200、SEQ ID NO 201、SEQ ID NO 202、SEQ ID NO 203、SEQID NO 204、SEQ ID NO 205、SEQ ID NO 206、SEQ ID NO 207、SEQ ID NO 208、SEQ ID NO209、SEQ ID NO 210、SEQ ID NO 211、SEQ ID NO 212、SEQ ID NO 214、SEQ ID NO 215、SEQID NO 216、SEQ ID NO 217、SEQ ID NO 218、SEQ ID NO 219、SEQ ID NO 220、SEQ ID NO221、SEQ ID NO 222、SEQ ID NO 224、SEQ ID NO 226、SEQ ID NO 229、SEQ ID NO 281、SEQID NO 282、SEQ ID NO 285、SEQ ID NO 286、SEQ ID NO 297和SEQ ID NO 298。
连续核苷酸序列可以与小鼠XBP1前体mRNA转录本(SEQ ID NO 590)的至少10个连续核苷酸互补。
连续核苷酸序列可以与选自由以下项组成的组的序列互补:SEQ ID NO 699、SEQID NO 700、SEQ ID NO 703、SEQ ID NO 710、SEQ ID NO713、SEQ ID NO 724、SEQ ID NO729、SEQ ID NO 739、SEQ ID NO 743、SEQ ID NO 744、SEQ ID NO 745、SEQ ID NO 749、SEQID NO 750、SEQ ID NO 751、SEQ ID NO 752、SEQ ID NO 753、SEQ ID NO 754、SEQ ID NO755、SEQ ID NO 756、SEQ ID NO 757、SEQ ID NO 758、SEQ ID NO 759、SEQ ID NO 760、SEQID NO 761、SEQ ID NO 762、SEQ ID NO 763、SEQ ID NO 773、SEQ ID NO 776、SEQ ID NO778、SEQ ID NO 781、SEQ ID NO 783、SEQ ID NO 784、SEQ ID NO 785、SEQ ID NO 787、SEQID NO 789、SEQ ID NO 790、SEQ ID NO 791、SEQ ID NO 792、SEQ ID NO 793、SEQ ID NO794、SEQ ID NO 795、SEQ ID NO 796、SEQ ID NO 797、SEQ ID NO 798、SEQ ID NO 799和SEQ ID NO 800。
连续核苷酸序列可以选自由以下项组成的组:SEQ ID NO 597、SEQ ID NO 598、SEQ ID NO 601、SEQ ID NO 608、SEQ ID NO 611、SEQ ID NO 622、SEQ ID NO 627、SEQ IDNO 637、SEQ ID NO 641、SEQ ID NO 642、SEQ ID NO 643、SEQ ID NO 647、SEQ ID NO 648、SEQ ID NO 649、SEQ ID NO 650、SEQ ID NO 651、SEQ ID NO 652、SEQ ID NO 653、SEQ IDNO 654、SEQ ID NO 655、SEQ ID NO 656、SEQ ID NO 657、SEQ ID NO 658、SEQ ID NO 659、SEQ ID NO 660、SEQ ID NO 661、SEQ ID NO 671、SEQ ID NO 674、SEQ ID NO 676、SEQ IDNO 679、SEQ ID NO 681、SEQ ID NO 682、SEQ ID NO 683、SEQ ID NO 685、SEQ ID NO 687、SEQ ID NO 688、SEQ ID NO 689、SEQ ID NO 690、SEQ ID NO 691、SEQ ID NO 692、SEQ IDNO 693、SEQ ID NO 694、SEQ ID NO 695、SEQ ID NO 696、SEQ ID NO 697和SEQ ID NO697。
连续核苷酸序列可以与人XBP1前体mRNA转录本(SEQ ID NO 801)的至少10个连续核苷酸互补。
连续核苷酸序列可以与选自由以下项组成的组的序列互补:SEQ ID NO 947、SEQID NO 948、SEQ ID NO 949、SEQ ID NO 950、SEQ ID NO 951和SEQ ID NO 988。
连续核苷酸序列可以选自由以下项组成的组:SEQ ID NO 854、SEQ ID NO 855、SEQ ID NO 856、SEQ ID NO 857、SEQ ID NO 858和SEQ ID NO 895。
反义寡核苷酸或其连续核苷酸序列可以与哺乳动物XBP1前体mRNA转录本完全互补。
连续核苷酸序列与反义寡核苷酸的长度可以相同。
可以分离、纯化或制造反义寡核苷酸。
反义寡核苷酸或其连续核苷酸序列可以包含一个或多个经修饰的核苷酸或一个或多个经修饰的核苷。
反义寡核苷酸或其连续核苷酸序列可以是或包含反义寡核苷酸混聚物或全聚物。
本发明包括本发明的反义寡核苷酸的缀合物和药用盐以及包含本发明的反义寡核苷酸的组合物和药物组合物。
在另一方面,本发明提供了一种分离的XBP1Δ4蛋白。
本发明的分离的XBP1Δ4蛋白可包含SEQ ID NO:7、SEQ ID NO:596或SEQ ID NO807的序列。
在另一方面,本发明提供了编码本发明的XBP1Δ4蛋白的分离的mRNA。
本发明的分离的mRNA可以包含SEQ ID NO:7、SEQ ID NO:595或SEQ ID NO:806的序列。
在另一方面,本发明提供了一种用于生产多肽的方法,其包括以下步骤:
a)培养表达XBP1以及包含编码多肽的一个或多个核酸的哺乳动物细胞;以及
b)从细胞或培养基中回收多肽;
其特征在于培养是在本发明的反义寡核苷酸、组合物、药物组合物、蛋白质或mRNA的存在下。
在本发明中,该方法可以包括以下步骤:
a1)在包含根据本发明的反义寡核苷酸的培养基中,繁殖表达XBP1以及包含编码多肽的一个或多个核酸的哺乳动物细胞以获得第一细胞群;
a2)将第一细胞群的等分试样与任选包含反义寡核苷酸的培养基混合以获得第二细胞群;
a3)培养第二细胞群以获得第三细胞群;以及
b)从第三次细胞培养的细胞和/或培养基中回收多肽。
在本发明的方法中,可以添加反义寡核苷酸至终浓度为25μM或更高。
在本发明的方法中,可以以0.5*10E6个细胞/mL至4*10E6个细胞/mL的起始细胞密度培养产生第一细胞群的细胞。
在本发明的方法中,第二细胞群可具有0.5*10E6个细胞/mL至10*10E6个细胞/mL的细胞密度。
在本发明的方法中,哺乳动物细胞可以是CHO细胞。
在本发明的方法中,多肽可以是抗体。
本发明的一个方面是一种用于重组生产多聚体多肽的方法,其包括以下步骤:
a)在根据本发明的核酸的存在下培养包含编码多聚体多肽的一个或多个核酸以及表达XBP1的哺乳动物细胞,该根据本发明的核酸诱导XBP1变体的形成,在一个优选的实施例中XBP1变体是XBP1Δ4;和
b)从细胞或培养基中回收多聚体多肽。
本发明的另一方面是一种用于重组生产多聚体多肽的方法,其包括以下步骤:
a)在根据本发明的核酸的存在下培养包含编码多聚体多肽的一个或多个核酸以及表达XBP1的哺乳动物细胞,该根据本发明的核酸诱导XBP1mRNA中外显子4的跳跃,由此引入+2框外事件;和
b)从细胞或培养基中回收多聚体多肽。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,该方法包括以下步骤:
a1)在包含根据本发明的核酸的培养基中,繁殖表达XBP1以及包含编码多肽的一个或多个核酸的哺乳动物细胞以获得第一细胞群,该繁殖诱导XBP1变体的形成,在一个优选实施例中,XBP1变体是XBP1Δ4;
a2)将第一细胞群的等分试样与任选包含根据本发明的相同或不同核酸的培养基混合以获得第二细胞群,该根据本发明的核酸诱导XBP1变体XBP1Δ4的形成;
a3)培养所述第二细胞群以获得第三细胞群;以及
b)从第三次细胞培养的细胞和/或培养基中回收多聚体多肽。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,该方法包括以下步骤:
a1)在包含根据本发明的核酸的培养基中,繁殖表达XBP1以及包含编码多肽的一个或多个核酸的哺乳动物细胞以获得第一细胞群,该根据本发明的核酸诱导XBP1 mRNA中外显子4的跳跃,由此引入+2框外事件;
a2)将第一细胞群的等分试样与任选包含根据本发明的相同或不同核酸的培养基混合以获得第二细胞群,该根据本发明的核酸诱导XBP1 mRNA中外显子4的跳跃,由此引入+2框外事件;
a3)培养所述第二细胞群以获得第三细胞群;以及
b)从第三次细胞培养的细胞和/或培养基中回收多聚体多肽。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,根据本发明的核酸是反义寡核苷酸。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,根据本发明的核酸与仓鼠XBP1前体mRNA转录本(SEQ ID NO 1)的至少10个连续核苷酸互补,诸如来自SEQ ID NO 1的核苷酸2960至核苷酸3113的至少10个连续核苷酸或来自SEQ ID NO 1的核苷酸2986至核苷酸3018的至少10个连续核苷酸。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,根据本发明的核酸与人XBP1前体mRNA转录本(SEQ ID NO 801)的至少10个连续核苷酸互补。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,根据本发明的核酸与选自由SEQ ID NO 23或SEQ ID NO 24组成的组的序列互补。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,根据本发明的核酸与选自由以下项组成的组的序列互补:SEQ ID NO947、SEQ ID NO 948、SEQ IDNO 949、SEQ ID NO 950、SEQ ID NO 951和SEQ ID NO 988。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,根据本发明的核酸选自由以下项组成的组:SEQ ID NO 854、SEQ ID NO 855、SEQ ID NO 856、SEQID NO 857、SEQ ID NO 858和SEQ ID NO 895。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,XBP1变体包含SEQ ID NO:7、SEQ ID NO:596或SEQ ID NO 807的序列。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,XBP1变体由SEQ ID NO:7、SEQ ID NO:595或SEQ ID NO:806的序列编码。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,添加根据本发明的核酸至25μM或更高的终浓度。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,以0.5*10E6个细胞/mL至4*10E6个细胞/mL的起始细胞密度培养产生第一细胞群的细胞。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,第二细胞群具有0.5*10E6个细胞/mL至10*10E6细胞/mL的起始细胞密度。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,哺乳动物细胞是CHO细胞。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,哺乳动物细胞是HEK细胞。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,哺乳动物细胞是SP2/0细胞。
在用于重组生产多聚体多肽的方法的所有方面和实施例的某些实施例中,多聚体多肽是抗体。在某些实施方案中,抗体为双特异性抗体。在某些实施例中,双特异性抗体是具有结构域交换的全长抗体或抗体多聚体融合体。在某些实施例中,双特异性抗体为三价双特异性抗体。在某些实施例中,双特异性三价抗体是具有结构域交换和额外的重链C末端结合位点的全长抗体或具有含结构域交换的额外的重链C末端结合位点的全长抗体或T-细胞双特异性抗体。在某些实施例中,抗体为二价或三价抗体。
本发明的一个方面是根据本发明的核酸用于例如在抗体诸如单克隆抗体的制造中提高由重组蛋白表达系统生产的多聚体多肽的产量或质量的用途。
在根据本发明的核酸的用途的所有方面和实施例的某些实施例中,根据本发明的核酸是反义寡核苷酸。
在根据本发明的核酸的用途的所有方面和实施例的某些实施例中,根据本发明的核酸与仓鼠XBP1前体mRNA转录本(SEQ ID NO 1)的至少10个连续核苷酸互补,诸如来自SEQID NO 1的核苷酸2960-3113的至少10个连续核苷酸或来自SEQ ID NO 1的核苷酸2986至核苷酸3018的至少10个连续核苷酸。
在根据本发明的核酸的用途的所有方面和实施例的某些实施例中,根据本发明的核酸与人XBP1前体mRNA转录本(SEQ ID NO 801)的至少10个连续核苷酸互补。
在根据本发明的核酸的用途的所有方面和实施例的某些实施例中,根据本发明的核酸与选自由以下项组成的组的序列互补:SEQ ID NO 947、SEQ ID NO 948、SEQ ID NO949、SEQ ID NO 950、SEQ ID NO 951和SEQ ID NO 988。
在根据本发明的核酸的用途的所有方面和实施例的某些实施例中,根据本发明的核酸选自由以下项组成的组:SEQ ID NO 854、SEQ ID NO 855、SEQ ID NO 856、SEQ ID NO857、SEQ ID NO 858和SEQ ID NO 895。
本发明的另一方面是从XBP1 mRNA获得的XBP1变体的用途,其中跳过外显子4并引入+2框外事件以例如在抗体诸如单克隆抗体的制造中提高重组蛋白表达系统生产的多聚体多肽的产量或质量。
本发明的另一方面是包含SEQ ID NO:7、SEQ ID NO:596或SEQ ID NO 807的序列的XBP1变体用于例如在抗体诸如单克隆抗体的制造中提高由重组蛋白表达系统生产的多聚体多肽的产量或质量的用途。
在前述用途的所有方面和实施例的某些实施例中,根据本发明的核酸以25μM或更高的终浓度使用。
在另一方面,本发明提供了本发明的反义寡核苷酸、组合物、药物组合物、蛋白质和/或分离的mRNA的治疗应用。
在一方面,本发明提供了用于药物或治疗的本发明的反义寡核苷酸、组合物、药物组合物、蛋白质和/或分离的mRNA。
在另一方面,本发明提供本发明的反义寡核苷酸、组合物、药物组合物、蛋白质和/或分离的mRNA在制备用于治疗蛋白质病理学疾病的药物中的用途。
在另一方面,本发明提供了一种治疗蛋白质病理学疾病的方法,该方法包括施用本发明的反义寡核苷酸、组合物、药物组合物、蛋白质和/或分离的mRNA。
在本发明的整个治疗应用中,蛋白质病理学疾病可以是TDP-43病理学,诸如运动神经元疾病或额颞叶变性。
附图说明
图1:人XBP1转录本XBP1-207中IRE1介导的剪接事件的图示。
图2:IRE1介导的可变剪接事件的拟议机制的图示。
图3:IRE1介导的XBP1前体mRNA剪接事件的结果图示,该剪接事件产生编码扩展的C末端结构域的mRNA XBP1s。
图4:由XBP1u、XBP1s和XBP1Δ4变体编码的蛋白质的比对,说明去除外显子4会导致保留IRE1介导的剪接事件中发现的大部分C末端氨基酸序列(XBP1s)。
图5:XBP1外显子4跳跃的筛选测定设计。
图6:靶向SEQ ID NO 1的核苷酸2960至核苷酸3113的反义寡核苷酸的初始文库筛选,该文库筛选鉴定了有效介导外显子4跳跃的化合物。
图7:有效的外显子4剪接转换化合物(例如SEQ ID NO 23和24)增加了表达难以表达的mAb的CHO细胞的滴度。
图8:寡核苷酸的活性相对于它们沿SEQ ID 2的外显子4的位置显示。
图9:XBP1s的跨关键物种(SEQ ID NO 5、594和805)比对,突出显示了外显子4序列中的保守性。
图10:XBPΔ4的跨关键物种(SEQ ID NO 7、596和807)比对,突出显示了外显子4序列中的保守性。
图11:人XBP1s(SEQ ID NO 805)和XBPΔ4(SEQ ID NO 807)的比对。
定义
常规
可用于实施本发明的方法和技术描述于:例如Ausubel,F.M.(编辑),CurrentProtocols in Molecular Biology,第I卷至第III卷(1997);Glover,N.D.和Hames,B.D.编辑,DNA Cloning:A Practical Approach,第I卷和第II卷(1985),Oxford UniversityPress;Freshney,R.I.(编辑),Animal Cell Culture–a practical approach,IRL PressLimited(1986);Watson,J.D.等人,Recombinant DNA,第二版,CHSL Press(1992);Winnacker,E.L.,From Genes to Clones;N.Y.,VCH Publishers(1987);Celis,J.编辑,Cell Biology,第二版,Academic Press(1998);Freshney,R.I.,Culture of AnimalCells:A Manual of Basic Technique,第二版,Alan R.Liss,Inc.,N.Y.(1987)。
使用重组DNA技术能够产生核酸的衍生物。此类衍生物可例如在一个或几个核苷酸位置处通过取代、改变、交换、缺失或插入来修饰。修饰或衍生化可以例如借助定点诱变来进行。此类修饰可以由本领域技术人员容易地进行(参见例如,Sambrook,J.等人,Molecular Cloning:A laboratory manual(1999)Cold Spring Harbor LaboratoryPress,New York,USA;Hames,B.D.和Higgins,S.G.,Nucleic acid hybridization–apractical approach(1985)IRL Press,Oxford,England)。
必须注意的是,如本文和所附权利要求书中所用,单数形式“一个”、“一种”和“该/所述”包括复数指代,除非上下文另外明确规定。因此,例如,提及“一个细胞”包括多个此类细胞和本领域技术人员已知的其等同物,诸如此类。同样,术语“一个/一种”、“一个或多个/一种或多种”和“至少一个/至少一种”在本文中可以互换使用。还应当注意的是,术语“包含”、“包括”和“具有”可以互换使用。
术语“约”表示其后所跟随的数值的+/-20%范围。在一个实施例中,术语“约”表示其后所跟随的数值的+/-10%范围。在一个实施例中,术语“约”表示其后所跟随的数值的+/-5%范围。
术语“包括”还涵盖术语“包含……”。
化合物
本文中,在本发明化合物的上下文中,术语“化合物”是指能够调节XBP1的表达或活性的任何分子,特别是能够调节XBP1前体mRNA的剪接以增加XBP1(XBP1剪接变体,诸如缺失XBP1外显子4的mRNA)的表达水平的任何分子。本发明的特别化合物是核酸分子(诸如反义寡核苷酸)和包含此类核酸分子的缀合物。
重组哺乳动物细胞
如本文所用,术语“重组哺乳动物细胞”表示包含能够表达多肽的外源核苷酸序列的哺乳动物细胞。此类多肽可以是所述哺乳动物细胞的内源或异源(外源的)多肽。此类重组哺乳动物细胞是已引入一种或多种外源核酸的细胞,包括此类细胞的后代。因此,术语“包含编码异源多肽的核酸的哺乳动物细胞”表示包含整合到哺乳动物细胞基因组中并且能够表达异源多肽的外源核苷酸序列的细胞。在一个实施例中,包含外源核苷酸序列的哺乳动物细胞是包含整合在宿主细胞基因组的基因座内的单个位点处的外源核苷酸序列的细胞,其中所述外源核苷酸序列包含侧接至少一个第一选择标志物的第一重组识别序列和第二重组识别序列,以及位于第一重组识别序列与第二重组识别序列之间的第三重组识别序列,并且所有重组识别序列都不同。
此类“重组哺乳动物细胞”可用于以任何规模生产所述同源或异源目的多肽。
转化细胞
包含外源核苷酸序列的哺乳动物细胞是“转化细胞”。该术语包括原代转化细胞以及由其衍生的子代,而不考虑传代次数。子代可能例如不与亲本细胞的核酸内容物完全一致,而是可能含有突变。涵盖了具有与在最初转化的细胞中筛选或选择的功能或生物活性相同的功能或生物活性的突变体子代。
分离的
“分离的”组合物是已从其自然环境的组分中分离的组合物。在一些实施例中,将组合物纯化至大于95%或99%的纯度,如通过例如电泳(例如,SDS-PAGE、等电聚焦(IEF)、毛细管电泳、CE-SDS)或色谱(例如,尺寸排阻色谱或离子交换或反相HPLC)方法确定的。关于用于评估例如抗体纯度的方法的综述,参见Flatman,S.等人,J.Chrom.B 848(2007)79-87。
“分离的”核酸是指已从其自然环境的组分中分离的核酸分子。经分离的核酸包括这样的核酸分子,其包含在通常含有核酸分子的细胞中,但其中该核酸分子存在于染色体外或与其天然染色体位置不同的染色体位置处。
“分离的”多肽或抗体是指已经与其天然环境的组分分离的多肽分子或抗体分子。
整合位点
术语“整合位点”表示细胞基因组内的已向其中插入外源核苷酸序列的核酸序列。在某些实施例中,整合位点在细胞基因组中的两个相邻核苷酸之间。在某些实施例中,整合位点包括一段核苷酸序列。在某些实施例中,整合位点位于哺乳动物细胞的基因组的特定基因座内。在某些实施例中,整合位点在哺乳动物细胞的内源基因内。
如本文所用,术语“载体”或“质粒”(可以互换使用)是指能够载运与其相连的另一核酸的核酸分子。该术语包括作为自我复制核酸结构的载体,以及并入其已被引入的宿主细胞的基因组中的载体。某些载体能够指导与其可操作地连接的核酸的表达。此类载体在本文中称为“表达载体”。
选择标志物
如本文所用,术语“选择标志物”表示这样的基因:其允许在相应的选择性试剂的存在下特异性选择或排除携带该基因的细胞。例如,但不作为限制,选择标志物可以允许在相应选择性试剂(选择性培养条件)的存在下正选择用该选择标志物基因转化的宿主细胞;未转化的宿主细胞将不能在该选择性培养条件下生长或存活。选择标志物可为阳性标志物、阴性标志物或双功能标志物。阳性选择标志物可允许选择携带该标志物的细胞,而阴性选择标志物可允许选择性消除携带该标志物的细胞。选择标志物可赋予对药物的抗性,或补偿宿主细胞中的代谢或分解代谢缺陷。在原核细胞中,可使用赋予对氨苄青霉素、四环素、卡那霉素或氯霉素抗性的基因。抗性基因可用作真核细胞中的选择标志物,这些基因包括但不限于针对氨基糖苷磷酸转移酶(APH)(例如,潮霉素磷酸转移酶(HYG)、新霉素和G418APH)、二氢叶酸还原酶(DHFR)、胸苷激酶(TK)、谷氨酰胺合成酶(GS)、天冬酰胺合成酶、色氨酸合成酶(吲哚)、组氨醇脱氢酶(组氨醇D)的基因以及编码产生对嘌呤霉素、杀稻瘟菌素、博来霉素、腐草霉素、氯霉素、Zeocin和霉酚酸的抗性的基因。其他标志物基因描述于WO92/08796和WO 94/28143中。
除有助于在存在相应选择性试剂的情况下进行选择之外,选择标志物还可以替代性地为通常不存在于细胞中的分子,例如绿色荧光蛋白质(GFP)、增强的GFP(eGFP)、合成的GFP、黄色荧光蛋白质(YFP)、增强的YFP(eYFP)、青色荧光蛋白质(CFP)、mPlum、mCherry、tdTomato、mStrawberry、J-red、DsRed单体、mOrange、mKO、mCitrine、Venus、YPet、Emerald、CyPet、mCFPm、Cerulean和T-Sapphire。可以例如分别通过检测到编码的多肽所发出的荧光或不存在这种荧光,来将表达这种分子的细胞与不含该基因的细胞区分开来。
可操作地连接
如本文所用,术语“可操作地连接”是指两种或更多种组分的并置,其中这些组分的关系允许它们以预期的方式发挥作用。例如,如果启动子和/或增强子用于调节编码序列的转录,则启动子和/或增强子可操作地连接至编码序列。在某些实施例中,“可操作连接”的DNA序列在单个染色体上相连并且相邻。在某些实施例中,例如,当需要连接两个蛋白质编码区(诸如分泌前导和多肽)时,这些序列是相连、相邻的,并且在同一阅读框中。在某些实施例中,可操作连接的启动子位于编码序列的上游并且可与该编码序列相邻。在某些实施例中,例如,关于调节编码序列表达的增强子序列,这两种组分可操作地连接,但并不相邻。如果增强子增加了编码序列的转录,则该增强子可操作地连接至编码序列。可操作地连接的增强子可以位于编码序列的上游、内部或下游,并且可以位于与编码序列的启动子距离相当远的位置。可操作的连接可通过本领域中已知的重组方法完成,例如使用PCR方法和/或通过在方便的限制位点连接来完成。如果不存在方便的限制位点,则可以根据常规做法使用合成然后寡核苷酸衔接子或接头。内部核糖体进入位点(IRES)可操作地连接至开放阅读框(ORF),如果它允许在内部位置以独立于5'末端的方式启动ORF的翻译。
外源
如本文所用,术语“外源”是指核苷酸序列并非来源于特异性细胞,而是通过DNA递送方法(例如,通过转染方法、电穿孔方法或转化方法)引入所述细胞中。因此,外源核苷酸序列是人工序列,其中人工性可以源自例如不同来源的子序列的组合(例如,具有SV40启动子的重组酶识别序列与绿色荧光蛋白质的编码序列的组合是人工核酸)或源自序列(例如仅编码膜结合受体的细胞外结构域或cDNA的序列)的部分的缺失,或者核碱基突变。术语“内源”是指来源于细胞的核苷酸序列。“外源”核苷酸序列可以部分具有碱基组成相同的“内源”对应物,但其中“外源”序列例如经由重组DNA技术被引入细胞中。
异源
如本文所用,术语“异源”是指多肽并非来源于特异性细胞,而是通过DNA递送方法(例如,通过转染方法、电穿孔方法或转化方法),已将相应的编码核酸引入所述细胞中。因此,异源多肽是对表达它的细胞而言是人工的多肽,由此这与该多肽是源自不同细胞/生物体的天然存在的多肽还是人造多肽无关。
寡核苷酸
如本文所用,术语“寡核苷酸”如本领域技术人员通常理解的那样被定义为包含两个或更多个共价连接的核苷的分子。此类共价结合的核苷也可被称为核酸分子或寡聚物。寡核苷酸通常是在实验室中制作,先经固相化学合成后再加以纯化和分离。当提及寡核苷酸的序列时,提及的是共价联接的核苷酸或核苷的核碱基部分或其修饰的序列或顺序。在一些实施例中,本发明的寡核苷酸是人造的,并且是化学合成的,并且通常是纯化或分离的。本发明的寡核苷酸可包含一个或多个经修饰的核苷,也称为核苷类似物,诸如2'糖修饰的核苷。本发明的寡核苷酸可包含一个或多个经修饰的核苷间键合,诸如一个或多个硫代磷酸酯核苷间键合。
反义寡核苷酸
如本文所用,术语“反义寡核苷酸”或“ASO”定义为能够通过与靶核酸,特别是与靶核酸上的连续序列杂交来调节靶基因的表达的寡核苷酸。反义寡核苷酸基本上不是双链的,因此不是siRNA或shRNA。在一些实施例中,本发明的反义寡核苷酸可以为单链的。应当理解,只要序列内或序列间自身互补性的程度低于跨寡核苷酸全长的大约50%,本发明的单链寡核苷酸便可形成发夹或分子间双链体结构(同一寡核苷酸的两个分子之间的双链体)。在一些实施例中,本发明的单链反义寡核苷酸不含RNA核苷。如本公开在别处所述的,在一些实施例中,本公开的反义寡核苷酸包含一个或多个经修饰的核苷或核苷酸,诸如2'糖修饰的核苷。在某些实施例中,本文公开的反义寡核苷酸的未修饰核苷是DNA核苷。
在某些情况下,本发明的反义寡核苷酸可称为寡核苷酸。
连续核苷酸序列
术语“连续核苷酸序列”是指与靶核酸互补的反义寡核苷酸的区域。该术语在本文中与术语“连续核碱基序列”和术语寡核苷酸“序列基序”可互换使用。如本文所用,术语“序列基序”代表核碱基的序列,与核苷糖化学和/或设计无关。在一些实施例中,核碱基A、T、C和G可以经修饰,例如,大写字母C可以是5-甲基胞嘧啶β-D-氧基LNA核苷,并且在RNA序列中,T可以是U。在一些实施例中,反义寡核苷酸的所有核苷构成连续核苷酸序列。连续核苷酸序列是反义寡核苷酸中核苷酸的序列,其与靶核酸或靶序列互补,并且在一些情况下完全互补。
如本文所述,在一些实施例中,反义寡核苷酸包含连续核苷酸序列,并且可任选地包含其他一个或多个核苷酸,例如可用于将官能团(例如,缀合物基团)连接至连续核苷酸序列的核苷酸接头区域。在一些实施例中,核苷酸接头区域可以与靶核酸互补。在一些实施例中,核苷酸接头区域不与靶核酸互补。应理解的是,反义寡核苷酸的连续核苷酸序列不能比反义寡核苷酸本身更长,并且反义寡核苷酸不能比连续核苷酸序列更短。
核酸
术语“核酸”或“核苷酸”旨在涵盖复数个核酸。在一些实施例中,术语“核酸”或“核苷酸”指靶序列,例如体内或体外的前体mRNA、mRNA或DNA。
当该术语指靶序列中的核酸或核苷酸时,核酸或核苷酸可以是细胞内天然存在的序列。在一些实施例中,“核酸”或“核苷酸”是指本发明的反义寡核苷酸中的序列。当该术语是指反义寡核苷酸中的序列时,核酸或核苷酸不是天然存在的,即,是化学合成的、酶促生产的、重组生产的或其任何组合。在一些实施例中,反义寡核苷酸中的核酸或核苷酸是合成或重组生产的,但不是天然存在的序列或其片段。在一些实施例中,反义寡核苷酸中的核酸或核苷酸不是天然存在的,因为它们含有至少一种本质上非天然存在的核苷酸类似物。
术语“核酸”或“核苷酸”是指以分离形式或存在于多核苷酸中的单一核酸区段,例如,DNA、RNA或其类似物。“核酸”或“核苷酸”包括天然存在的核酸或非天然存在的核酸。在一些实施例中,术语“核苷酸”、“单元”和“单体”可互换使用。应当认识到,当提及核苷酸或单体序列时,所指的是碱基序列,诸如A、T、G、C或U及其类似物。
当该术语指编码多肽或蛋白质的一个或多个核酸时,核酸或核苷酸可以是细胞内天然存在的序列或人工序列。在一些实施例中,核酸是合成或重组生产的。
核苷酸
如本文所用,术语“核苷酸”是指包含糖部分、碱基部分和共价连接基团(键合基团,诸如磷酸酯或硫代磷酸酯核苷酸间键合基团)的糖苷,并且涵盖天然存在的核苷酸(诸如DNA或RNA)以及包含修饰的糖和/或碱基部分的非天然存在的核苷酸,其在本文中也称为“核苷酸类似物”。在本文中,单一核苷酸(单元)也可称为单体或核酸单元。在某些实施例中,术语“核苷酸类似物”是指具有修饰的糖部分的核苷酸。具有修饰的糖部分的核苷酸(例如,LNA)的非限制性实例在本文别处公开。在一些实施例中,术语“核苷酸类似物”是指具有修饰的核碱基部分的核苷酸。具有修饰的核碱基部分的核苷酸包括但不限于5-甲基-胞嘧啶、异胞嘧啶、5-噻唑-胞嘧啶、5-丙炔基-胞嘧啶、假异胞嘧啶、5-溴尿嘧啶、5-丙炔基-尿嘧啶、噻唑-尿嘧啶、2-硫代-尿嘧啶、2-硫代胸腺嘧啶、6-氨基嘌呤、2-氨基嘌呤、肌苷、二氨基嘌呤、2,6-二氨基嘌呤和2-氯-6-氨基嘌呤。如本领域普通技术人员将认识到的,寡核苷酸(例如,本文公开的反义寡核苷酸)的5'末端核苷酸不包含5'核苷酸间键合基团,尽管它可以包含5'末端基团。
核苷
如本文所用,术语“核苷”用于指包含糖部分和碱基部分的糖苷,并且因此可在指核苷酸单元时使用,所述核苷酸单元通过反义寡核苷酸的核苷酸之间的核苷酸间键合共价连接。在生物技术领域,术语“核苷酸”通常用于指核酸单体或单元。在反义寡核苷酸的上下文中,术语“核苷酸”可以指单独的碱基,即包含胞嘧啶(DNA和RNA)、鸟嘌呤(DNA和RNA)、腺嘌呤(DNA和RNA)、胸腺嘧啶(DNA)和尿嘧啶(RNA)的核碱基序列,其中糖骨架和核苷酸间键合的存在是隐含的。同样,特别是在其中核苷酸间键合基团中的一者或多者经修饰的寡核苷酸的情况下,术语“核苷酸”可以指“核苷”。例如,可以使用术语“核苷酸”,即使在指定核苷之间键合的存在或性质时也可以使用该术语。
核苷酸长度
如本文所用,术语“核苷酸长度”或反义寡核苷酸或其连续核苷酸序列的“长度”是指给定序列中核苷酸(单体)的总数。核苷酸和核苷是寡核苷酸和多核苷酸的结构单元,并且出于本公开的目的,包括天然存在的和非天然存在的核苷酸和核苷(核苷酸/核苷类似物)。在自然界中,核苷酸,诸如DNA和RNA核苷酸包含核糖糖部分、核碱基部分和一个或多个磷酸酯基团(其不存在于核苷中)。核苷和核苷酸也可以可互换地称为“单元”或“单体”。
修饰的核苷
如本文所用,术语“修饰的核苷”或“核苷修饰”或“核苷类似物”是指与等同的DNA或RNA核苷相比,通过引入糖部分或(核)碱基部分的一种或多种修饰而被修饰的核苷。在一些实施例中,本发明的反义寡核苷酸的一个或多个经修饰的核苷包含经修饰的糖部分。术语修饰的核苷在本文中还可与术语“核苷类似物”或修饰的“单元”或修饰的“单体”互换使用。具有未修饰的DNA或RNA糖部分的核苷在本文中被称为DNA或RNA核苷。在一些实施例中,在DNA或RNA核苷的碱基区域中具有修饰的核苷如果允许沃森克里克(Watson Crick)碱基配对,则通常仍称为DNA或RNA。可以在本发明的反义寡核苷酸中使用的经修饰的核苷的非限制性实例包括LNA、2'-O-MOE和吗啉代核苷类似物。其他经修饰的核苷的实例在本公开的别处提供。
高亲和力修饰的核苷
如本文所用,“高亲和力修饰的核苷”是修饰的核苷酸,其在掺入到寡核苷酸中时,增强了寡核苷酸对其互补靶标的亲和力,例如如通过解链温度(Tm)测量的。本公开的高亲和力修饰的核苷可引起每个经修饰的核苷的解链温度增加介于+0.5℃至+12℃之间,在一些情况下介于+1.5℃至+10℃之间,并且在其他情况下介于+3℃至+8℃之间。许多高亲和力修饰的核苷是本领域已知的,并且包括例如许多2'取代的核苷以及锁定的核酸(LNA)(参见例如Freier&Altmann;Nucl.Acid Res.,1997,25,4429-4443和Uhlmann;Curr.Opinion inDrug Development,2000,3(2),203-213)。
修饰的核苷间键合
如技术人员通常所理解的,术语“修饰的核苷间键合”定义为除磷酸二酯(PO)键合以外的键合,其将两个核苷共价偶联在一起。因此,在一些实施例中,本发明的寡核苷酸可包含一个或多个经修饰的核苷间键合,诸如一个或多个硫代磷酸酯核苷间键合。
在一些实施例中,至少约50%的反义寡核苷酸(例如,本文公开的反义寡核苷酸)或其连续核苷酸序列的核苷间键合是硫代磷酸酯,诸如至少约60%、至少约70%、至少约75%、至少约80%、至少约90%或更多的反义寡核苷酸或其连续核苷酸序列的核苷间键合是硫代磷酸酯。在一些实施例中,反义寡核苷酸或其连续核苷酸序列的全部核苷间键合均为硫代磷酸酯。
在一些实施例中,寡核苷酸的连续核苷酸序列的所有核苷间键合均为硫代磷酸酯,或反义寡核苷酸的所有核苷间键合均为硫代磷酸酯键。
核碱基
术语“核碱基”包括存在于核苷和核苷酸中的嘌呤(例如腺嘌呤和鸟嘌呤)和嘧啶(例如尿嘧啶、胸腺嘧啶和胞嘧啶)部分,它们在核酸杂交中形成氢键。在本发明的上下文中,术语“核碱基”还包括经修饰的核碱基,其可以不同于天然存在的核碱基,但在核酸杂交过程中为功能性的。在此上下文中,“核碱基”是指天然存在的核碱基,诸如腺嘌呤、鸟嘌呤、胞嘧啶、胸苷、尿嘧啶、黄嘌呤和次黄嘌呤,以及非天然存在的变体。此类变体例如描述于Hirao等人(2012),Accounts of Chemical Research,第45卷第2055页和Bergstrom(2009)Current Protocols in Nucleic Acid Chemistry,增刊37 1.4.1中。
在一些实施例中,通过以下方式修饰核碱基部分:将嘌呤或嘧啶改变为修饰的嘌呤或嘧啶,诸如取代的嘌呤或取代的嘧啶,诸如选自异胞嘧啶、假异胞嘧啶、5-甲基胞嘧啶、5-噻唑-胞嘧啶、5-丙炔基-胞嘧啶、5-丙炔基-尿嘧啶、5-溴尿嘧啶、5-噻唑-尿嘧啶、2-硫代-尿嘧啶、2'-硫代-胸腺嘧啶、肌苷、二氨基嘌呤、6-氨基嘌呤、2-氨基嘌呤、2,6-二氨基嘌呤和2-氯-6-氨基嘌呤的核碱基。
核碱基部分可由每个相应核碱基的字母代码来表示,例如A、T、G、C或U,其中每个字母可任选地包括具有同等功能的修饰的核碱基。例如,在某些实施例中,本文公开的反义寡核苷酸的核碱基部分选自A、T、G、C和5-甲基胞嘧啶。任选地,对于LNA间隔聚体,可使用5-甲基胞嘧啶LNA核苷。
修饰的寡核苷酸
如本文所用,术语“修饰的寡核苷酸”描述了包含一个或多个经修饰的核苷(例如,糖修饰的核苷)和/或修饰的核苷间键合的寡核苷酸(例如,反义寡核苷酸)。术语“嵌合”寡核苷酸是已在文献中用于描述包含修饰的核苷(例如,糖修饰的核苷)和DNA核苷的寡核苷酸的术语。在一些实施例中,本公开的ASO是嵌合寡核苷酸。
烷基
如本文所用,术语“烷基”单独或组合表示具有1至8个碳原子(C1-8)的直链或支链烷基、特别是具有1至6个碳原子(C1-6)的直链或支链烷基并且更特别是具有1至4个碳原子(C1-4)的直链或支链烷基。直链和支链C1-C8烷基的示例为甲基、乙基、丙基、异丙基、丁基、异丁基、叔丁基、异构戊基、异构己基、异构庚基和异构辛基,特别地为甲基、乙基、丙基、丁基和戊基。烷基的特别实例是甲基。烷基的其他实例是单、二或三氟甲基、乙基或丙基,诸如环丙基(cPr),或单、二或三氟环丙基。
烷氧基
术语“烷氧基”单独或结合表示式烷基-O-的基团,其中术语“烷基”具有先前给出的含义,诸如甲氧基,乙氧基,正丙氧基,异丙氧基,正丁氧基,异丁氧基,仲丁氧基和叔丁氧基。特别的“烷氧基”是甲氧基。
双环糖
如本文所用,术语“双环糖”是指包含4至7元环的修饰糖部分,其包含连接4至7元环的两个原子以形成第二环的桥,从而产生双环结构。在一些实施例中,桥连接核苷的核糖糖环的C2'和C4'(即,2'-4'桥),如在LNA核苷中所观察到的。
外显子
如本文所用,可在本文中互换使用的术语“外显子”或“外显子区域”或“外显子序列”是指含有核苷酸序列的核酸分子,该核苷酸序列被转录成RNA并在剪接和其他RNA加工后以RNA的成熟形式呈现,诸如mRNA(信使RNA)。mRNA含有一个或多个可操作连接的外显子。在一些实施例中,外显子可以编码多肽或多肽的一部分。在一些实施例中,外显子可含有非翻译序列,例如翻译调节序列。
内含子
可互换使用的术语“内含子”或“内含子区域”或“内含子序列”是指含有核苷酸序列的核酸分子,该核苷酸序列被转录成RNA,然后通常通过剪接从RNA中去除以产生RNA的成熟形式,例如mRNA。在一些实施例中,内含子的核苷酸序列不被掺入成熟RNA中,内含子序列或其部分也不被翻译和掺入多肽。剪接信号序列(诸如剪接供体和受体)通过细胞的剪接机制用于从RNA中去除内含子。在一些实施例中,一个剪接变体中的内含子可以是另一个变体中的外显子(即,存在于剪接的转录本中)。因此,编码内含子融合蛋白的剪接mRNA可包括外显子和内含子。
剪接
如本文所用,术语“剪接”是指RNA成熟的过程,其中前体mRNA中的内含子被去除并且外显子可操作地连接以产生信使RNA(mRNA)。
可变剪接
如本文所用,术语“可变剪接”是指从一个基因生产多个mRNA的过程。在一些实施例中,可变剪接可以包括可操作地连接少于基因的所有外显子,和/或可操作地连接一个或多个不存在于所有源自基因的转录本中的可变外显子。
剪接调节
如本文所用,术语“剪接调节”是指可用于纠正隐蔽剪接、调节可变剪接、恢复开放阅读框和诱导蛋白质敲低的过程。在本发明的上下文中,剪接调节可用于调节XBP1前体mRNA的可变剪接以生成剪接变体。例如,剪接调节可用于调节XBP1前体mRNA的可变剪接以生成XBP1Δ4mRNA,从而提高XBP1Δ4蛋白的表达。可以通过RNA测序(RNA-Seq)来测定剪接调节,该测序允许对前体mRNA的不同剪接产物进行定量评估。在本发明的一些实施例中,反义寡核苷酸调节XBP1前体mRNA的剪接以降低包含外显子4的成熟XBP1 mRNA(mRNA)的水平,并且增加缺失外显子4的成熟XBP1 mRNA(XBP1Δ4mRNA)的表达水平。
编码区
如本文所用,可互换使用的“编码区”或“编码序列”是多核苷酸的由可翻译成氨基酸的密码子组成的一部分。尽管“终止密码子”(TAG、TGA或TAA)通常未被翻译成氨基酸,但其可被认为是编码区的一部分,而任何侧翼序列,例如启动子、核糖体结合位点、转录终止子、内含子、非翻译区(“UTR”)等不是编码区的一部分。编码区的边界通常由5'末端的编码所得多肽的氨基末端的起始密码子和3'末端的编码所得多肽的羧基末端的翻译终止密码子决定。
非编码区
如本文所用,术语“非编码区”是指不是编码区的核苷酸序列。非编码区的实例包括但不限于启动子、核糖体结合位点、转录终止子、内含子、非翻译区(“UTR”)、非编码外显子等。一些外显子可以是每个转录本的5'非翻译区(5'UTR)或3'非翻译区(3'UTR)的全部或一部分。非翻译区对于转录本的有效翻译以及控制翻译速率和转录本的半衰期是重要的。
区域
当在核苷酸序列的上下文中使用时,术语“区域”是指该序列的一部分。例如,短语“核苷酸序列内的区域”或“核苷酸序列的互补物内的区域”是指短于核苷酸序列,但长于位于特定核苷酸序列或核苷酸序列的互补物内的至少10个核苷酸的序列。术语“子-序列”或“子序列”也可以指核苷酸序列的区域。
下游和上游
当提及核苷酸序列时,术语“下游”是指核酸或核苷酸序列位于参考核苷酸序列的3'。在某些实施例中,下游核苷酸序列涉及转录起点之后的序列。例如,基因的翻译起始密码子位于转录起始位点的下游。
术语“上游”是指位于参考核苷酸序列5'的核苷酸序列。在某些实施例中,上游核苷酸序列涉及转录起点之前的序列。例如,基因的启动子序列位于转录起始位点的上游。
调节区
如本文所用,术语“调节区”是指位于编码区上游(5'非编码序列)、内部或下游(3'非编码序列)并且影响相关编码区的转录、RNA加工、稳定性或翻译的核苷酸序列。调节区可以包括启动子、翻译前导序列、内含子、多聚腺苷酸化识别序列、RNA加工位点、效应子结合位点、UTR和茎环结构。如果编码区旨在用于在真核细胞中表达,则多聚腺苷酸化信号和转录终止序列通常位于编码序列的3'。
靶序列
如本文所用,术语“靶序列”是指存在于靶核酸中的核苷酸序列,其包含与本发明的反义寡核苷酸互补的核碱基序列,即在本发明的上下文中,哺乳动物XBP1前体mRNA序列为靶核酸,并且靶序列为靶核酸中可被有效靶向以调节外显子4剪接的区域,并且包括例如XBP1外显子4和与XBP1前体mRNA转录本的外显子4的5'和/或3'相邻的区域。
例如,对于本发明,靶核酸可以是仓鼠XBP1前体mRNA(SEQ ID NO 1,并且特别是SEQ ID NO 1的核苷酸2960-3113)、小鼠XBP1前体mRNA(SEQ ID NO 590)或人XBP1前体mRNA(SEQ ID NO 801)。
在一些实施例中,靶序列由靶核酸上具有与本发明反义寡核苷酸的连续核苷酸序列互补的核碱基序列的区域组成。靶核酸的这一区域可以互换地称为靶标核苷酸序列、靶序列或靶标区域。在一些实施例中,靶序列比单个寡核苷酸的互补序列更长,并且可以例如代表靶核酸的优选区域,其可以被本发明的几种寡核苷酸靶向。
细胞或靶细胞
如本文所用,术语“靶细胞”是指表达靶核酸的细胞。在一些实施例中,靶细胞包含哺乳动物细胞,诸如啮齿动物细胞,诸如小鼠细胞或大鼠细胞或仓鼠细胞,诸如CHO细胞,或灵长类动物细胞,诸如猴子细胞或人类细胞。在一些实施例中,靶细胞为表达XBP1靶核酸的转基因哺乳动物细胞。在一些实施例中,细胞是例如经由异源表达来表达XBP1Δ4mRNA的转基因动物细胞。
由于其在异源蛋白质表达中的普遍用途,用于蛋白质表达方法的优选细胞是仓鼠细胞,诸如中国仓鼠卵巢细胞(CHO细胞),尤其优选的是在悬浮液中生长的CHO-K1细胞。
由于本发明的反义寡核苷酸在神经退行性病症中的治疗应用,靶细胞可以是神经元细胞。
通常,本发明的靶细胞表达XBP1前体mRNA,其在细胞中加工成成熟的XBP1 mRNA,导致XBP1-E4蛋白(也称为XBPu)和XBP1Δ4转录本变体二者的表达。如本文所述,在一些实施例中,本发明的化合物调节XBP1前体mRNA的剪接以增加缺失XBP1外显子4的XBP1 mRNA的比例。适当地,与XBP1-E4转录本变体相比,XBP1Δ4转录本变体的表达因此可以增加。
互补性
本文可互换使用的术语“互补性”或“核碱基互补性”描述了核苷/核苷酸的沃森-克里克碱基配对能力。沃森克里克碱基对为鸟嘌呤(G)-胞嘧啶(C)和腺嘌呤(A)-胸腺嘧啶(T)/尿嘧啶(U)。
应当理解,寡核苷酸可包含具有修饰的核碱基的核苷,例如经常使用5-甲基胞嘧啶代替胞嘧啶,因此,术语互补性涵盖未修饰的核碱基和修饰的核碱基之间的沃森克里克碱基配对(参见例如Hirao等人(2012)Accounts of Chemical Research,第45卷第2055页和Bergstrom(2009)Current Protocols in Nucleic Acid Chemistry,增刊37 1.4.1)。
如本文所用,术语“互补性百分比”是指核酸分子(例如寡核苷酸)中连续核苷酸序列的与参考序列(例如靶序列或序列基序)互补的核苷酸比例(以百分比表示),该核酸分子跨连续核苷酸序列。因此,通过计数两个序列之间(当与靶序列5'-3'和3'-5'的寡核苷酸序列比对时)互补(形成Watson Crick碱基对)的对准的核碱基数,将其除以寡核苷酸中核苷酸的总数,然后乘以100,来计算互补性的百分比。在这种比较中,未对齐(形成碱基对)的核碱基/核苷酸被称为错配。在计算连续核苷酸序列的互补性百分比时,不允许插入和删除。应当理解的是,在确定互补性时,只要保留了形成Watson Crick碱基配对的核碱基的功能能力,就不考虑核碱基的化学修饰(例如,在计算互补性百分比时,认为5'-甲基胞嘧啶与胞嘧啶相同)。
在本发明内,术语“互补”要求反义寡核苷酸与XBP1前体mRNA转录本至少约80%互补或至少约90%互补。在一些实施例中,反义寡核苷酸可以与仓鼠(SEQ ID NO 1)、小鼠(SEQ ID NO 590)或人(SEQ ID NO 801)XBP1前体mRNA转录本至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%互补。换句话讲,对于一些实施例,本发明的反义寡核苷酸可包括一个、二个、三个或更多个错配,其中错配为本发明的反义寡核苷酸内不与其靶标碱基配对的核苷酸。
术语“完全互补”是指100%互补性。
互补物
如本文所用,术语“互补物”表示与参考序列互补的序列。众所周知,互补性是DNA复制和转录的基本原则(沃森克里克碱基配对),因为它是两个DNA或RNA序列之间共享的特性,使得当它们彼此反平行比对时,序列中每个位置的核苷酸碱基都是互补的,就像在镜子中看到和观察到的事物的反面一样。因此,例如,5'-ATGC-3'序列的互补物可以写成3'-TACG-5'或5'-GCAT-3'。如本文所用的术语“反向互补物”、“反向互补”和“反向互补性”可与术语“互补物”、“互补”和“互补性”互换。
同一性
如本文所用的术语“同一性”是指核酸分子(例如寡核苷酸)中连续核苷酸序列的与参考序列(例如序列基序)相同的核苷酸比例(以百分比表示),该核酸分子跨连续核苷酸序列。
因此,通过计数两个序列(在本发明的化合物的连续核苷酸序列中和在参考序列中)相同(匹配)的对准核碱基数,将该数除以寡核苷酸的核苷酸总数再乘以100,来计算同一性百分比。因此,同一性百分比=(匹配数x 100)/比对区域的长度(例如,连续核苷酸序列)。在计算连续核苷酸序列的同一性百分比时,不允许插入和删除。应当理解的是,在确定同一性时,只要保留了形成Watson Crick碱基配对的核碱基的功能能力,就不考虑核碱基的化学修饰(例如,在计算同一性百分比时,认为5-甲基胞嘧啶与胞嘧啶相同)。
如本文所用,术语“同源”和“同源性”可与术语“同一性”和“同一”互换。
天然存在的变体
术语“其天然存在的变体”是指XBP1多肽序列或XBP1核酸序列(例如,转录本)的变体,其在定义的分类群(诸如哺乳动物,诸如小鼠、大鼠、中国仓鼠、猴、和人)中天然存在。通常,当提及多核苷酸的“天然存在的变体”时,该术语还可以涵盖通过染色体易位或复制产生的编码XBP1的基因组DNA的任何等位基因变体,以及从其衍生的RNA,诸如mRNA。“天然存在的变体”还可以包括衍生自XBP1 mRNA的可变剪接的变体。当提及特定的多肽序列(例如XBP1)时,该术语还包括蛋白质的天然存在形式,因此可以通过例如共翻译或翻译后修饰对其进行加工,诸如信号肽切割、蛋白水解切割、糖基化等。在一些实施例中,天然存在的变体与哺乳动物XBP1靶核酸(诸如列于SEQ ID NO:1(仓鼠)、SEQ ID NO 590(小鼠)或SEQ ID NO801(人)中)具有至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多同源性。在一些实施例中,天然存在的变体与SEQ ID NO:1的仓鼠XBP1靶核酸具有至少99%的同源性。在一些实施例中,天然存在的变体与SEQ ID NO:590的小鼠XBP1靶核酸具有至少99%的同源性。在一些实施例中,天然存在的变体与SEQ ID NO:801的人XBP1靶核酸具有至少99%的同源性。
对应
在提及两个单独的核酸或核苷酸序列时,在本文中可互换使用的术语“对应于”和“与...对应”可用于阐明基于同源性和/或功能彼此对应或相似的序列区域,尽管特定序列的核苷酸可以不同编号。例如,基因转录本的不同同种型可以具有相似或保守的核苷酸序列部分,其编号可以基于可变剪接和/或其他修饰而在各个同种型中有所不同。此外,认识到在表征核酸或核苷酸序列时可以采用不同的编号系统(例如,基因转录本以及是否从翻译起始密码子开始编号序列或是否包括5'UTR)。此外,认识到基因或基因转录本的不同变体的核酸或核苷酸序列可以不同。然而,如本文所用,共享核酸或核苷酸序列同源性和/或功能的变体区域被认为彼此“对应”。例如,对应于SEQ ID NO:1的核苷酸X至Y的XBP1转录本的核苷酸序列(“参考序列”)是指具有与SEQ ID NO:1的核苷酸X至Y相同的序列或相似的序列的XBP1转录本序列(例如,XBP1前体mRNA或mRNA),其中X是起始位点且Y是终止位点。本领域普通技术人员可以通过将XBP1转录本序列与SEQ ID NO:1进行比对来鉴定XBP1转录本序列中对应的X和Y残基。
杂交
如本文所用的术语“杂交”(hybridizing/hybridizes)应当理解为两条核酸链(例如反义寡核苷酸和靶核酸)在相反链上的碱基对之间形成氢键,从而形成双链体。两条核酸链之间结合的亲和力为杂交的强度。它通常用解链温度(Tm)来描述,解链温度(Tm)定义为一半寡核苷酸与靶核酸形成双链体的温度。在生理条件下,Tm与亲和力并非严格成正比(Mergny和Lacroix,2003,Oligonucleotides 13:515–537)。标准状态吉布斯自由能ΔG°是结合亲和力的更精确的表述并且与反应的解离常数(Kd)通过ΔG°=-RTln(Kd)相关,其中R是气体常数并且T是绝对温度。因此,寡核苷酸与靶核酸之间反应的非常低的ΔG°反映了寡核苷酸和靶核酸之间强力杂交。ΔG°是与其中水浓度为1M、pH为7并且温度为37℃的反应相关的能量。寡核苷酸与靶核酸杂交是自发反应,并且对于自发反应,ΔG°小于零。ΔG°可以通过实验测量,例如,通过利用如Hansen等人,1965,Chem.Comm.36–38及Holdgate等人2005年在Drug Discov Today中所描述的等温滴定量热(ITC)法测量。本领域的技术人员将知道商业设备可用于测量ΔG°。ΔG°也可以通过使用如SantaLucia,1998,Proc Natl Acad SciUSA.95:1460–1465所述的最近相邻模型,适当使用Sugimoto等人,1995,Biochemistry 34:11211–11216和McTigue等人,2004,Biochemistry 43:5388–5405描述的推导的热力学参数在数值上进行估计。
在一些实施例中,对于长度为10个至30个核苷酸的寡核苷酸,本发明的反义寡核苷酸以低于-10kcal的ΔG°估值与靶核酸杂交。
在一些实施例中,杂交的程度或强度通过标准状态吉布斯自由能ΔG°测量。对于长度为8-30个核苷酸的寡核苷酸,寡核苷酸可与靶核酸以低于-10kcal,诸如低于-15kcal、诸如低于-20kcal和诸如低于-25kcal的ΔG°估值杂交。在一些实施例中,寡核苷酸以-10kcal至-60kcal诸如-12kcal至-40kcal诸如-15kcal至-30kcal或-16kcal至-27kcal诸如-18kcal至-25kcal的ΔG°估值与靶核酸杂交。
转录本
如本文所用,术语“转录本”可指通过DNA转录合成并在加工后成为信使RNA(mRNA)的初级转录本,即,前体信使RNA(前体mRNA)以及经加工的mRNA本身。术语“转录本”可与“前体mRNA”和“mRNA”互换使用。在DNA链转录为初级转录本后,会以多种方式对新合成的初级转录本进行修饰,以转化为其成熟的功能形式,从而生产不同的蛋白质和RNA,诸如mRNA、tRNA、rRNA、lncRNA、miRNA等。因此,术语“转录本”可以包括外显子、内含子、5'-UTR和3'-UTR。
表达
如本文所用,术语“表达”是指多核苷酸生产基因产物例如RNA或多肽的过程。它包括但不限于将多核苷酸转录成信使RNA(mRNA)以及将mRNA翻译成多肽。表达生产“基因产物”。如本文所用,基因产物或者可以是核酸,例如,通过基因转录生产的信使RNA,或者可以是从转录本翻译的多肽。本文所述的基因产物进一步包括具有转录后修饰(例如,多聚腺苷酸化或剪接)的核酸,或具有翻译后修饰(例如,甲基化、糖基化、添加脂质、与其他蛋白质亚基结合或蛋白水解切割)的多肽。
化合物编号
如本文所用,术语“化合物编号(Compound Number或Comp No.)”是指赋予具有组分的详细化学结构的核苷酸序列的唯一编号,例如,核苷(例如,DNA)、核苷类似物(例如,LNA,例如,β-D-氧基-LNA)、核碱基(例如,A、T、G、C、U或MC)和骨架结构(例如,硫代磷酸酯或磷酸二酯)。
提及SEQ ID编号包括特定的核酸序列,但不包括任何设计或完整的化学结构。此外,本文实例中公开的反义寡核苷酸序列显示了代表性设计,但不限于所示的特定设计,除非另有说明。
受试者
“受试者”或“个体”或“动物”或“患者”或“哺乳动物”是指需要诊断、预后或治疗的任何受试者,特别是哺乳动物受试者。哺乳动物受试者包括人、家畜、农场动物、运动动物和动物园动物,包括例如人、非人灵长类动物、狗、猫、豚鼠、兔、大鼠、小鼠、马、牛、熊等。在一些实施例中,受试者是人。
在一些实施例中,受试者是患有蛋白质病理学疾病或处于发展蛋白质病理学疾病风险中的人。
药物组合物
术语“药物组合物”是指处于允许活性成分的生物活性有效的形式,并且不含对于将被施用组合物的受试者具有不可接受的毒性的另外组分的制备物。此类组合物可以是无菌的。
蛋白质病理学疾病
蛋白质病理学疾病(也称为蛋白质构象病、蛋白质病、蛋白质构象病症或蛋白质错误折叠疾病)包括诸如以下的疾病:朊病毒疾病,例如克雅氏病;Tau蛋白病,诸如阿尔茨海默病;突触核蛋白病,诸如帕金森病;淀粉样变性、多系统萎缩;和TDP-43病理学,诸如肌萎缩侧索硬化症(ALS)额颞叶变性(FTLD);CAG重复序列适应症,诸如脊髓小脑共济失调,诸如脊髓小脑共济失调1型、脊髓小脑共济失调2型(SCA2)和脊髓小脑共济失调3型(SCA3,马查多-约瑟夫病)。
有效量
本文公开的组合物(例如,包含诸如反义寡核苷酸或其缀合物或盐的化合物的组合物)的“有效量”是指足以实现具体规定的目的的量。相对于所述目的,可以凭经验并且以常规方式确定“有效量”。
治疗
诸如“治疗(treating或treatment或to treat)”或“缓解(alleviating或toalleviate)”的术语是指(1)治愈已诊断病理状况或病症、减缓已诊断病理状况或病症、减轻已诊断病理状况或病症的症状和/或阻止已诊断病理状况或病症的进展的治疗性措施和(2)预防和/或减缓目标病理状况或病症(诸如蛋白质病理学疾病)发展的防止性或预防性措施。因此,需要治疗的那些包括已经患有病症的那些,易于患病症的那些或待预防病症的那些。在某些实施例中,如果患者表现出例如完全、部分或暂时缓解或消除与疾病或病症相关的症状,则根据本文提供的方法成功地“治疗”了受试者的本文别处公开的疾病或病况。
抗体
关于人免疫球蛋白轻链和重链的核苷酸序列的一般信息给出于:Kabat,E.A.等人,Sequences of Proteins of Immunological Interest,第5版,Public HealthService,National Institutes of Health,Bethesda,MD(1991)中。
如本文所用,重链和轻链的所有恒定区和结构域的氨基酸位置是根据Kabat等人,Sequences of Proteins of Immunological Interest,第5版,Public Health Service,National Institutes of Health,Bethesda,MD(1991)中描述的Kabat编号系统编号的,并且在本文中被称为“根据Kabat编号”。具体地,将Kabat编号系统(参见Kabat等人,Sequences of Proteins of Immunological Interest,第5版,Public Health Service,National Institutes of Health,Bethesda,MD(1991)的第647-660页)用于κ和λ同种型的轻链恒定结构域CL,并且将Kabat EU索引编号系统(参见Kabat等人,Sequences ofProteins of Immunological Interest,第5版,Public Health Service,NationalInstitutes of Health,Bethesda,MD(1991)的第661-723页)用于恒定重链结构域(CH1、铰链、CH2和CH3,这在本文中通过在此情况下称为“根据Kabat的EU索引编号”而进一步分类)。
本文的术语“抗体”以最广泛的含义使用,并且包括各种抗体结构,包括但不限于全长抗体、单克隆抗体、多特异性抗体(例如,双特异性抗体)和抗体-抗体片段-融合物,以及其组合物。
天然抗体
术语“天然抗体”表示具有不同结构的天然存在的免疫球蛋白分子。例如,天然IgG抗体为约150,000道尔顿的异四聚体糖蛋白,由经二硫键键合的两条相同轻链和两条相同重链组成。从N末端到C末端,每条重链具有重链可变区(VH),接着是三个重链恒定结构域(CH1、CH2和CH3),借此,铰链区定位在第一重链恒定结构域与第二重链恒定结构域之间。类似地,从N末端到C末端,每条轻链都有一个轻链可变区(VL),后跟一个轻链恒定结构域(CL)。抗体的轻链基于其恒定结构域的氨基酸序列,可以归属于两种类型中的一种,该两种类型称为卡帕(κ)和兰姆达(λ)。
全长抗体
术语“全长抗体”表示具有与天然抗体的结构大体上相似的结构的抗体。全长抗体包含两条全长抗体轻链以及两条全长抗体重链,每条全长抗体轻链在N末端到C末端方向上包含轻链可变区和轻链恒定结构域,每条全长抗体重链在N末端到C末端方向上包含重链可变区、第一重链恒定结构域、铰链区、第二重链恒定结构域和第三重链恒定结构域。与天然抗体相反,全长抗体可包含另外的免疫球蛋白结构域,诸如例如缀合至全长抗体不同链的一个或多个末端的一个或多个额外的scFv、或重链或轻链Fab片段、或scFab,但每个末端仅缀合单个片段。这些缀合物也由术语全长抗体涵盖。
抗体结合位点
术语“抗体结合位点”表示一对重链可变结构域和轻链可变结构域。为了确保与抗原的正确结合,这些可变结构域是同源可变结构域,即属于一起。结合位点的抗体包含至少三个HVR(例如在VHH的情况下)或三到六个HVR(例如在天然存在的情况下,即具有VH/VL对的常规抗体)。通常,负责抗原结合的抗体的氨基酸残基形成结合位点。这些残基通常包含在一对抗体重链可变结构域和相应的抗体轻链可变结构域中。抗体的抗原结合位点包含来自“高变区”或“HVR”的氨基酸残基。“框架”或“FR”区是除本文定义的高变区残基以外的那些可变结构域区域。因此,抗体的轻链可变结构域和重链可变结构域包含从N末端至C末端的区域FR1、HVR1、FR2、HVR2、FR3、HVR3和FR4。尤其是,重链可变结构域的HVR3区域是最有助于抗原结合并且定义抗体结合特异性的区域。“功能性结合位点”能够与其靶标特异性结合。术语“特异性结合于”表示,在结合测定的一个实施例中结合位点在体外测定中与其靶标的结合。这种结合测定可以是任何测定,只要可以检测到结合事件。例如,一种测定,其中抗体与表面结合,并且抗原与抗体的结合通过表面等离子体共振(SPR)来测量。可替代地,可以使用桥接ELISA。
高变区
如本文所用,术语“高变区”或“HVR”是指以下项中的每一种:包含氨基酸残基延伸体的抗体可变结构域的在序列中高变(“互补决定区”或“CDR”)和/或形成结构上限定的环(“高变环”)和/或含有抗原接触残基(“抗原接触点”)的区域。通常,抗体包含六个HVR;三个在重链可变结构域VH中(H1、H2、H3),并且三个在轻链可变结构域VL中(L1、L2、L3)。
HVR包括
(a)存在于氨基酸残基26-32(L1)、50-52(L2)、91-96(L3)、26-32(H1)、53-55(H2)和96-101(H3)处的高变环(Chothia,C和Lesk,A.M.,J.Mol.Biol.196(1987)901-917);
(b)存在于氨基酸残基24-34(L1)、50-56(L2)、89-97(L3)、31-35b(H1)、50-65(H2)和95-102(H3)处的CDR(Kabat,E.A.等人,Sequences of Proteins of ImmunologicalInterest,第5版,PublicHealth Service,National Institutes of Health,Bethesda,MD(1991),NIH Publication 91-3242);
(c)存在于氨基酸残基27c-36(L1)、46-55(L2)、89-96(L3)、30-35b(H1)、47-58(H2)和93-101(H3)处的抗原接触点(MacCallum等人,J.Mol.Biol.262:732-745(1996));以及
(d)(a)、(b)和/或(c)的组合,包括氨基酸残基46-56(L2)、47-56(L2)、48-56(L2)、49-56(L2)、26-35(H1)、26-35b(H1)、49-65(H2)、93-102(H3)和94-102(H3)。
除非另外指明,否则可变结构域中的HVR残基和其他残基(例如,FR残基)在本文中根据Kabat等人,出处同上编号。
抗体类别
抗体的“类别”是指抗体的重链所具有的恒定结构域或恒定区优选地Fc区域的类型。存在五大类抗体:IgA、IgD、IgE、IgG和IgM,并且它们中的一些可以进一步分为亚类(同型),例如,IgG1、IgG2、IgG3、IgG4、IgA1和IgA2。对应于不同类别的免疫球蛋白的重链恒定结构域分别称为α、δ、ε、γ和μ。
重链恒定区
术语“重链恒定区”表示免疫球蛋白重链中含有恒定结构域的区域,即CH1结构、铰链区、CH2结构域和CH3结构域。在一个实施例中,人IgG恒定区从Ala118延伸至重链的羧基末端(根据Kabat EU索引编号)。然而,恒定区的C末端赖氨酸(Lys447)可以存在或不存在(根据Kabat EU索引编号)。术语“恒定区”表示包含两个重链恒定区的二聚体,它们可以经由铰链区半胱氨酸残基彼此共价连接,形成链间二硫键。
重链Fc区
术语“重链Fc区”表示免疫球蛋白重链的C末端区域,其含有铰链区(中和下铰链区)、CH2结构域和CH3结构域的至少一部分。在一个实施例中,人IgG重链Fc区从Asp221或从Cys226或从Pro230延伸至重链的羧基末端(根据Kabat EU索引编号)。因此,Fc区比恒定区小但在C末端部分与其相同。然而,重链Fc区的C末端赖氨酸(Lys447)可能存在或者可能不存在(根据Kabat EU索引编号)。术语“Fc区”表示包含两个重链Fc区的二聚体,它们可以经由铰链区半胱氨酸残基彼此共价连接,形成链间二硫键。
抗体的恒定区,更准确地说是Fc区(以及同样的恒定区)直接参与补体激活、C1q结合、C3激活和Fc受体结合。虽然抗体对补体系统的影响取决于某些条件,但与C1q的结合由Fc区中限定的结合位点引起。此类结合位点是现有技术中已知的并且描述于例如以下文献中:Lukas,T.J.等人,J.Immunol.127(1981)2555-2560;Brunhouse,R.,和Cebra,J.J.,Mol.Immunol.16(1979)907-917;Burton,D.R.等人,Nature 288(1980)338-344;Thommesen,J.E.等人,Mol.Immunol.37(2000)995-1004;Idusogie,E.E.等人,J.Immunol.164(2000)4178-4184;Hezareh,M.等人,J.Virol.75(2001)12161-12168;Morgan,A.等人,Immunology 86(1995)319-324;和EP 0 307 434。此类结合位点为例如L234、L235、D270、N297、E318、K320、K322、P331和P329(根据Kabat EU索引编号)。亚类IgG1、IgG2和IgG3的抗体通常表现出补体活化、C1q结合和C3活化作用,而IgG4则不激活补体系统、不结合C1q并且不激活C3。“抗体的Fc区”是技术人员所熟知的术语,并且基于木瓜蛋白酶对抗体的切割来定义。
单克隆抗体
如本文所用的术语“单克隆抗体”是指从基本上同质的抗体群体获得的抗体,即,除了可能的变异抗体(例如,含有天然存在的突变或在单克隆抗体制剂的生产过程中产生,此类变体通常以少量形式呈递)之外,包含该群体的各个抗体是相同的和/或结合相同的表位。与通常包括针对不同决定簇(表位)的不同抗体的多克隆抗体制剂相反,单克隆抗体制剂中的每种单克隆抗体针对抗原上的单一决定簇。因此,修饰语“单克隆”表示抗体的特征是从基本上同质的抗体群体获得的,并且不应解释为需要通过任何特定方法生产抗体。例如,单克隆抗体可以通过多种技术制备,包括但不限于杂交瘤方法、重组DNA方法、噬菌体展示方法,以及利用包含全部或部分人免疫球蛋白基因座的转基因动物的方法。
如在本申请中所用的术语“价”表示抗体中存在指定数目的结合位点。因此,术语“二价”“四价”和“六价”分别表示抗体中存在两个结合位点、四个结合位点和六个结合位点。
单特异性抗体
“单特异性抗体”表示具有单个结合特异性即特异性结合一个抗原的抗体。单特异性抗体可制备为全长抗体或抗体片段(例如,F(ab')2)或它们的组合(例如,全长抗体加上额外的scFv或Fab片段)。单特异性抗体不需要是单价的,即单特异性抗体可以包含多于一个与一个抗原特异性结合的结合位点。例如,天然抗体是单特异性但二价的。
多特异性抗体
“多特异性抗体”表示具有关于同一抗原上至少两个不同表位或两个不同抗原的结合特异性。多特异性抗体可制备为全长抗体或抗体片段(例如,F(ab')2双特异性抗体)或它们的组合(例如,全长抗体加上额外的scFv或Fab片段)。多特异性抗体至少是二价的,即包含两个抗原结合位点。此外,多特异性抗体至少是双特异性的。因此,二价双特异性抗体是多特异性抗体的最简单形式。具有两个、三个或更多个(例如,四个)功能性抗原结合位点的工程化抗体也已有报告(参见,例如,US 2002/0004587)。
在某些实施例中,抗体是多特异性抗体,例如至少双特异性抗体。多特异性抗体是对至少两种不同的抗原或表位具有结合特异性的单克隆抗体。在某些实施例中,结合特异性中的一个针对第一抗原,而另一个针对不同的第二抗原。在某些实施例中,多特异性抗体可以与同一抗原的两个不同的表位结合。多特异性抗体还可用于将细胞毒性剂定位到表达抗原的细胞。
多特异性抗体可以制备为全长抗体或抗体-抗体片段融合。
用于制备多特异性抗体的技术包括但不限于具有不同特异性的两个免疫球蛋白重链-轻链对的重组共表达(参见Milstein,C.和Cuello,A.C.,Nature 305(1983)537-540,WO 93/08829,以及Traunecker,A.等人,EMBO J.10(1991)3655-3659)和“杵臼结构”工程化(参见例如US 5,731,168)。多特异性抗体还可以通过以下方式来制备:工程化用于制备抗体Fc-异二聚体分子的静电操纵效应(参见例如,WO 2009/089004);使两个或更多个抗体或片段交联(参见例如,US 4,676,980,以及Brennan,M.等人,Science,229(1985)81-83);使用亮氨酸拉链来生产双特异性抗体(参见例如,Kostelny,S.A.等人,J.Immunol.148(1992)1547-1553);使用用于避免轻链错配问题的普通轻链技术(参见例如,WO 98/50431);使用用于制备双特异性抗体片段的具体技术(参见例如Holliger,P.等人,Proc.Natl.Acad.Sci.USA 90(1993)6444-6448);以及如Tutt,A.等人,J.Immunol.147(1991)60-69中所述制备三特异性抗体。
本文还包括具有三个或更多个抗原结合位点的工程化抗体,包括例如“章鱼抗体”或者DVD-Ig(参见例如,WO 2001/77342和WO 2008/024715)。具有三个或更多个抗原结合位点的多特异性抗体的其他示例可以在WO 2010/115589、WO 2010/112193、WO 2010/136172、WO 2010/145792和WO 2013/026831中找到。双特异性抗体或其抗原结合片段还包括“双作用Fab”或“DAF”(参见例如US 2008/0069820和WO 2015/095539)。
多特异性抗体也可以以不对称形式提供,其中在具有相同抗原特异性的一个或多个结合臂中有结构域互换,即通过交换VH/VL结构域(参见例如,WO 2009/080252和WO2015/150447)、CH1/CL结构域(参见例如,WO 2009/080253)或完整的Fab臂(参见例如,WO2009/080251、WO 2016/016299,还参见Schaefer等人,Proc.Natl.Acad.Sci.USA 108(2011)1187-1191,以及Klein等人,MAbs 8(2016)1010-1020)。在一方面,多特异性抗体包含交叉Fab片段。术语“交叉Fab片段”或“xFab片段”或“交换型Fab片段”是指这样的Fab片段,其中重链和轻链的可变区或恒定区被交换。交叉Fab片段包含由轻链可变区(VL)和重链恒定区1(CH1)组成的多肽链,以及由重链可变区(VH)和轻链恒定区(CL)组成的多肽链。还可以通过将荷电或非荷电的氨基酸突变引入结构域界面以指导正确的Fab配对,以对不对称Fab臂进行工程化。参见例如WO 2016/172485。
抗体或片段也可以是多特异性抗体,如WO 2009/080254、WO 2010/112193、WO2010/115589、WO 2010/136172、WO 2010/145792、或WO 2010/145793中所述。
其抗体或片段也可以是如WO 2012/163520中公开的多特异性抗体。
多特异性抗体的各种其他分子形式是在本领域中已知的并且包括在本文中(参见例如Spiess等人,Mol.Immunol.67(2015)95-106)。
双特异性抗体通常是与同一抗原上的两个不同的、不重叠的表位或与不同抗原上的两个表位特异性结合的抗体分子。
复杂(多特异性)抗体是
-具有结构域交换的全长抗体:
包含第一Fab片段和第二Fab片段的多特异性IgG抗体,其中在第一Fab片段中
a)仅CH1结构域和CL结构域相互替换(即第一Fab片段的轻链包含VL结构域和CH1结构域,且第一Fab片段的重链包含VH结构域和CL结构域);b)仅VH结构域和VL结构域相互替换(即第一Fab片段的轻链包含VH结构域和CL结构域,且第一Fab片段的重链包含VL结构域和CH1结构域);或者
c)CH1和CL结构域相互替换并且VH和VL结构域相互替换(即第一Fab片段的轻链包含VH和CH1结构域,并且第一Fab片段的重链包含VL和CL结构域);并且
其中第二Fab片段包含轻链和重链,该轻链包含VL和CL结构域,该重链包含VH和CH1结构域;
具有结构域交换的全长抗体可包含包括CH3结构域的第一重链和包括CH3结构域的第二重链,其中两个CH3结构域通过各自的氨基酸取代以互补方式工程化,以便支持第一重链与经修饰的第二重链的异二聚化,例如,如WO 96/27011、WO 98/050431、EP 1870459、WO 2007/110205、WO 2007/147901、WO 2009/089004、WO 2010/129304、WO 2011/90754、WO2011/143545、WO 2012/058768、WO 2013/157954或WO 2013/096291(通过引用并入本文)中所公开;
-具有结构域交换和额外的重链C末端结合位点的全长抗体:
一种多特异性IgG抗体,包括
a)一种全长抗体,其包含各有全长抗体轻链和全长抗体重链的两个对,其中由全长重链和全长轻链对中的每个对形成的结合位点特异性结合至第一抗原,以及
b)一个额外的Fab片段,其中额外的Fab片段与全长抗体的一条重链的C末端融合,其中额外的Fab片段的结合位点与第二抗原特异性结合,
其中与第二抗原特异性结合的额外的Fab片段i)包含结构域交叉,使得a)轻链可变结构域(VL)和重链可变结构域(VH)被彼此替换,或b)轻链恒定结构域(CL)和重链恒定结构域(CH1)被彼此替换,或ii)是单链Fab片段;
-单臂单链形式(=单臂单链抗体):
包含第一结合位点和第二结合位点的抗体,第一结合位点与第一表位或抗原特异性结合,第二结合位点与第二表位或抗原特异性结合,由此各个链如下
-轻链(可变轻链结构域+轻链κ恒定结构域)
-组合轻链/重链(可变轻链结构域+轻链恒定结构域+肽接头+可变重链结构域+CH1+铰链+CH2+具有杵突变的CH3)
-重链(可变重链结构域+CH1+铰链+CH2+具有臼突变的CH3);
-双臂单链抗体:
包含第一结合位点和第二结合位点的抗体,第一结合位点与第一表位或抗原特异性结合,第二结合位点与第二表位或抗原特异性结合,由此各个链如下
-组合轻链/重链1(可变轻链结构域+轻链恒定结构域+肽接头+可变重链结构域+CH1+铰链+CH2+具有臼突变的CH3)
-组合轻链/重链2(可变轻链结构域+轻链恒定结构域+肽接头+可变重链结构域+CH1+铰链+CH2+具有杵突变的CH3);
-常见的轻链双特异性抗体:
包含第一结合位点和第二结合位点的抗体,第一结合位点与第一表位或抗原特异性结合,第二结合位点与第二表位或抗原特异性结合,由此各个链如下
-轻链(可变轻链结构域+轻链恒定结构域)
-重链1(可变重链结构域+CH1+铰链+CH2+具有臼突变的CH3)
-重链2(可变重链结构域+CH1+铰链+CH2+带有杵突变的CH3)
-T细胞双特异性抗体
一种全长抗体,其具有:具有结构域交换的额外的重链N末端结合位点,包括
-第一Fab片段和第二Fab片段,其中第一Fab片段和第二Fab片段的每个结合位点与第一抗原特异性结合,
-第三Fab片段,其中第三Fab片段的结合位点与第二抗原特异性结合,并且其中第三Fab片段包含结构域交叉,使得可变轻链结构域(VL)和可变重链结构域(VH)被彼此替换,以及
-包含第一Fc区多肽和第二Fc区多肽的Fc区,
其中第一Fab片段和第二Fab片段各自包含重链片段和全长轻链,
其中第一Fab片段的重链片段的C-末端与第一Fc区多肽的N-末端融合,
其中第二Fab片段的重链片段的C末端与第三Fab片段的可变轻链结构域的N末端融合,并且第三Fab片段的CH1结构域的C末端与第二Fc区多肽的N末端融合;
-抗体-多聚体融合体,其包含
(a)抗体重链和抗体轻链,以及
(b)第一融合体多肽,其在N末端至C末端方向上包含非抗体多聚体多肽的第一部分、抗体重链CH1结构域或抗体轻链恒定结构域、抗体铰链区、抗体重链CH2结构域和抗体重链CH3结构域;以及第二融合体多肽,其在N末端至C末端方向上包含该非抗体多聚体多肽的第二部分以及在第一多肽包含抗体重链CH1结构域的情况下的抗体轻链恒定结构域或在第一多肽包含抗体轻链恒定结构域的情况下的抗体重链CH1结构域,
其中
(i)(a)的抗体重链和(b)的第一融合体多肽,(ii)(a)的抗体重链和(a)的抗体轻链,以及(iii)(b)的第一融合体多肽和(b)的第二融合体多肽各自独立地通过至少一个二硫键彼此共价连接,
其中
抗体重链和抗体轻链的可变结构域形成与抗原特异性结合的结合位点。
“杵臼结构”二聚模块及其在抗体工程化中的用途在Carter P.、Ridgway J.B.B.、Presta L.G.:Immunotechnology,1996年2月第2卷第1期,第73-73(1)页中有所描述。
抗体重链中的CH3结构域可通过“杵臼结构(knob-into-holes)”技术改变,这一技术在例如WO 96/027011、Ridgway,J.B.等人,Protein Eng.9(1996)617-621和Merchant,A.M.等人,Nat.Biotechnol.16(1998)677-681中以若干实例详细描述。在这一方法中,改变两个CH3结构域的相互作用表面以增加这两个CH3结构域的异源二聚化,从而增加包含它们的多肽的异源二聚化。(两个重链的)两个CH3结构域中的一个可为“杵(knob)”而另一个为“臼(hole)”。二硫键的引入进一步稳定化异二聚体(Merchant,A.M.等人,NatureBiotech.16(1998)677-681;Atwell,S.等人,J.Mol.Biol.270(1997)26-35)并增加产率。
(抗体重链的)CH3结构域中的突变T366W表示为“杵突变”或“突变杵”,而(抗体重链的)CH3结构域中的突变T366S、L368A、Y407V表示为“臼突变”或“突变臼”(根据Kabat EU索引编号)。例如通过将S354C突变引入具有“杵突变”(表示为“杵-cys-突变”或“突变杵-cys”)的重链的CH3结构域中或通过将Y349C突变引入具有“臼突变”(表示为“臼-cys-突变”或“突变臼-cys”)的重链的CH3结构域(根据Kabat EU索引编号)中,也可使用位于CH3结构域之间的额外的链间二硫键(Merchant,A.M.等人,Nature Biotech.16(1998)677-681)。
结构域交叉
如本文所用,术语“结构域交叉”表示在抗体重链VH-CH1片段及其相应的同源抗体轻链对中,即在抗体Fab(片段抗原结合)中,结构域序列偏离天然抗体中的序列是因为至少一个重链结构域由其相应的轻链结构域取代,反之亦然。结构域交换有三种常见类型:(i)CH1和CL结构域的交叉,其由轻链结构域交换轻链导致VL-CH1结构域序列,由重链片段结构域交换导致VH-CL结构域序列的(或具有VH-CL-铰链-CH2-CH3结构域序列的全长抗体重链);(ii)VH和VL结构域的结构域交换,其由轻链结构域交换导致VH-CL结构域序列,由重链片段结构域交换导致VL-CH1结构域序列;以及(iii)完整轻链(VL-CL)和完整VH-CH1重链片段的结构域交换(“Fab交叉”),其通过结构域交换导致具有VH-CH1结构域序列的轻链并通过结构域交换导致具有VL-CL结构域序列的重链片段(所有上述结构域序列均以N末端至C末端方向表示)。
彼此替换
如本文所用,关于相应重链结构域和轻链结构域的术语“彼此替换”是指前述结构域交换。因此,当CH1结构域和CL结构域“彼此替换”时,是指项目(i)下提及的结构域交换以及所得重链和轻链结构域序列。因此,当VH和VL“彼此替换”时,是指在第(ii)项中提到的结构域交换;以及当CH1和CL结构域“彼此取代”并且VH和VL结构域“彼此取代”时,是指在第(iii)项中提到的结构域交换。例如,在WO 2009/080251、WO 2009/080252、WO 2009/080253、WO 2009/080254和Schaefer、W.等人,Proc.Natl.Acad.Sci USA 108(2011)11187-11192中报告了包括结构域交换的双特异性抗体。此类抗体通常称为CrossMab。
在一个实施例中,多特异性抗体还包含至少一个Fab片段,其包括如上文第(i)项所述的CH1和CL结构域的结构域交换,或如第(ii)项所述的VH和VL结构域的结构域交换,或如上文第(iii)项所述的VH-CH1和VL-VL结构域的结构域交换。在具有结构域交换的多特异性抗体的情况下,特异性结合相同抗原的Fab被构建为具有相同结构域序列。因此,在多特异性抗体中包含多个具有结构域交换的Fab的情况下,所述Fab与相同抗原特异性结合。
人源化
“人源化”抗体是指包含来自非人HVR的氨基酸残基和来自人FR的氨基酸残基的抗体。在某些实施例中,人源化抗体将基本上包含所有中的至少一个可变结构域,通常是两个可变结构域,其中所有或基本上所有HVR(例如CDR)对应于非人抗体的HVR,并且所有或基本上所有的FR对应于人抗体的FR。人源化抗体任选地可以包含来源于人抗体的抗体恒定区的至少一部分。“人源化形式”的抗体,例如非人抗体,是指已经进行过人源化的抗体。
重组抗体
如本文所用,术语“重组抗体”表示所有通过重组手段诸如重组细胞制备、表达、创造或分离的抗体(嵌合抗体、人源化抗体和人类抗体)。这包括从重组细胞(诸如NS0、HEK、BHK、羊水细胞或CHO细胞)中分离的抗体。
抗体片段
如本文所用,术语“抗体片段”是指除了完整抗体以外的分子,其包括完整抗体的部分,该部分结合完整抗体结合的抗原,即它是功能性片段。抗体片段的实例包括但不限于Fv、Fab、Fab'、Fab'-SH、F(ab')2、双特异性Fab、双体抗体、线性抗体、单链抗体分子(例如scFv或scFab)。
重组方法
可以使用重组方法和组合物来产生抗体,例如,如在US 4,816,567中所述。对于这些方法,提供了编码抗体的一种或多种分离的一种或多种核酸。
在一方面,提供了一种制备抗体的方法,其中该方法包括在适于表达抗体的条件下培养包括如上提供的编码抗体的核酸的宿主细胞,以及任选地从宿主细胞(或宿主细胞培养基)中回收抗体,其中至少一个培养步骤是在根据本发明的化合物的存在下。
对于抗体重组生产,将编码抗体的核酸(例如,如上所述)分离并插入至一个或多个载体中以用于在宿主细胞中进一步克隆和/或表达。可以使用常规程序来容易地对此类核酸进行分离和测序(例如,通过使用能够与编码抗体的重链和轻链的基因特异性结合的寡核苷酸探针),或通过重组方法产生或通过化学合成获得此类核酸。
重组哺乳动物细胞
一般来讲,对于目标多肽(诸如例如治疗性抗体)的重组大规模生产,需要稳定地表达和分泌所述多肽的细胞。
这种细胞被称为“重组哺乳动物细胞”或“重组生产细胞”,用于生成这种细胞的过程被称为“细胞系开发”。在细胞系开发过程的第一步中,合适的宿主细胞(诸如例如CHO细胞)用适于表达所述目标多肽的核酸序列转染。在第二步中,基于已经用编码目的多肽的核酸共转染的选择标志物的共表达,选择稳定表达目的多肽的细胞。
编码多肽的核酸(即编码序列)表示为结构基因。这样的结构基因为纯编码信息。因此,需要额外的调控元件用于其表达。因此,结构基因通常整合在所谓的表达盒中。表达盒在哺乳动物细胞中起作用所需的最少调控元件是在所述哺乳动物细胞中起作用的启动子,其位于结构基因的上游,即5',以及在所述哺乳动物细胞中起作用的多聚腺苷酸化信号序列,其位于结构基因的下游,即3'。启动子、结构基因和多聚腺苷酸化信号序列以可操作连接的形式排列。
在目标多肽是由不同(单体)多肽构成的异源多聚体多肽(诸如例如抗体或复杂抗体形式)的情况下,需要的不仅是单个表达盒,而是在所含结构基因上不同的多个表达盒,即,对于该异源多聚体多肽的不同(单体)多肽中的每一者需要至少一个表达盒。例如,全长抗体是包含轻链的两个拷贝以及重链的两个拷贝的异源多聚体多肽。因此,全长抗体由两种不同的多肽构成。因此,全长抗体的表达需要两个表达盒,一个用于轻链,另一个用于重链。例如,如果全长抗体是双特异性抗体,即抗体包含与两种不同抗原特异性结合的两个不同结合位点,则两个轻链和两个重链也彼此不同。因此,这种双特异性全长抗体由四种不同的多肽构成,并且因此需要四个表达盒。
表达载体
目标多肽的表达盒一般整合到一个或多个所谓的“表达载体”中。“表达载体”是提供用于在细菌细胞中扩增所述载体以及在哺乳动物细胞中表达所包含的结构基因的所有必需元件的核酸。通常,表达载体包含原核质粒增殖单元,例如用于大肠杆菌的原核质粒增殖单元,其包含复制起点和原核选择标志物,以及真核选择标志物,以及表达目标结构基因所需的表达盒。“表达载体”是用于将表达盒引入哺乳动物细胞的转运工具。
待表达的多肽越复杂,所需的不同表达盒的数量也越高。固有地随着表达盒的数量增加,整合到宿主细胞基因组中的核酸的大小也增加。表达载体的大小也随之增加。然而,载体大小的实际上限在约15kbp的范围内,超过该范围,处理和加工效率显著下降。该问题可以通过使用两个或更多个表达载体来解决。因此,表达盒可以在不同的表达载体之间拆分,每个表达载体仅包含其中一些表达盒,导致尺寸减小。
细胞系开发
用于产生表达异源多肽(诸如例如多特异性抗体)的重组细胞的细胞系开发(CLD),采用随机整合(RI)或靶向整合(TI)的核酸,该核酸包含表达和生产目的异源多肽所需的相应表达盒。
使用RI,一般来说,若干个载体或其片段在相同或不同的基因座处整合到细胞的基因组中。
通常,使用TI,将包含不同表达盒的转基因的单拷贝整合到宿主细胞基因组中的预定“热点”。
与RI CLD不同,靶向整合(TI)CLD在细胞基因组中的预定“热点”处引入包含不同表达盒的转基因。而且,该引入采用了表达盒的限定比率。因此,不受该理论的束缚,异源多聚体多肽的所有不同多肽都以相同(或至少相当且仅略有不同)的速率和适当的比率表达。
另外,考虑到限定的拷贝数和限定的整合位点,通过TI获得的重组细胞与通过RI获得的细胞相比应当具有更好的稳定性。此外,由于选择标志物仅用于选择具有适当TI的细胞,而不用于选择具有高水平转基因表达的细胞,所以可以应用诱变性较低的标志物,以使产生序列变体(SV)的可能性最小化,这些序列变体的产生部分是由于甲氨蝶呤(MTX)或蛋氨酸亚砜亚胺(MSX)等选择性试剂的致突变性。
用于表达(糖基化)抗体的合适宿主细胞通常来源于多细胞生物(诸如例如脊椎动物)。
宿主细胞
任何适合悬浮生长的哺乳动物细胞系均可用于根据本发明的方法中。此外,独立于整合方法,即对于RI和TI,可以使用任何哺乳动物宿主细胞。
有用的哺乳动物宿主细胞系的实例是人羊水细胞(例如,如在Woelfel,J.等人,BMC Proc.5(2011)P133中所述的CAP-T细胞);由SV40转化的猴肾CV1系(COS-7);人胚肾细胞系(如在例如Graham,F.L.等人,J.Gen Virol.36(1977)59-74中所述的HEK293或HEK293T细胞);小仓鼠肾细胞(BHK);小鼠塞尔托利氏细胞(例如在Mather,J.P.,Biol.Reprod.23(1980)243-252中描述的TM4细胞);猴肾细胞(CV1);非洲绿猴肾细胞(VERO-76);人宫颈癌细胞(HELA);犬肾细胞(MDCK);布法罗大鼠肝细胞(BRL 3A);人肺细胞(W138);人肝细胞(Hep G2);小鼠乳腺肿瘤(MMT 060562);TRI细胞(如例如在Mather,J.P.等人,AnnalsN.Y.Acad.Sci.383(1982)44-68中所述);MRC 5细胞;以及FS4细胞。其他有用的哺乳动物宿主细胞系包括中国仓鼠卵巢(CHO)细胞,包括DHFR-CHO细胞(Urlaub,G.等人,Proc.Natl.Acad.Sci.USA 77(1980)4216-4220);以及骨髓瘤细胞系,诸如Y0、NS0和Sp2/0。
关于适用于抗体产生的某些哺乳动物宿主细胞系的综述,参见例如Yazaki,P.和Wu,A.M.,Methods in Molecular Biology,第248卷,Lo,B.K.C.(编辑),Humana Press,Totowa,NJ(2004),第255-268页。
在一个实施例中,哺乳动物宿主细胞是例如中国仓鼠卵巢(CHO)细胞(例如CHOK1、CHO DG44等)、人胚肾(HEK)细胞、淋巴样细胞(例如Y0、NS0、Sp2/0细胞)或人类羊水细胞(例如CAP-T等)。在一个优选实施例中,所述哺乳动物(宿主)细胞为CHO细胞。
靶向整合允许将外源核苷酸序列整合到哺乳动物细胞基因组的预定位点中。在某些实施例中,靶向整合由识别一种或多种重组识别序列(RRS)的重组酶介导,该重组识别序列存在于基因组中和待整合的外源核苷酸序列中。在某些实施例中,靶向整合由同源重组介导。
重组识别序列
“重组识别序列”(RRS)是由重组酶识别的核苷酸序列,并且是重组酶介导的重组事件所必需和充足的。RRS可用于定义核苷酸序列中将发生重组事件的位置。
在某些实施例中,RRS可由Cre重组酶识别。在某些实施例中,RRS可由FLP重组酶识别。在某些实施例中,RRS可由Bxb1整合酶识别。在某些实施例中,RRS可由整合酶识别。
在某些实施例中,当RRS为LoxP位点时,该细胞需要Cre重组酶来执行重组。在某些实施例中,当RRS为FRT位点时,该细胞需要FLP重组酶来执行重组。在某些实施例中,当RRS为Bxb1 attP或Bxb1 attB位点时,该细胞需要Bxb1整合酶来执行重组。在某些实施例中,当RRS为attP或/>attB位点时,所述细胞需要/>整合酶来执行重组。重组酶可以使用包含酶或作为蛋白的编码序列或mRNA的表达载体来引入细胞中。
关于TI,包含整合在基因组基因座内的单个位点上的如本文所述的着陆位点的任何已知的或未来的适用于TI的哺乳动物宿主细胞均可用于本发明。这种细胞被称为哺乳动物TI宿主细胞。在某些实施例中,哺乳动物TI宿主细胞为包含如本文所述的着陆位点的仓鼠细胞、人细胞、大鼠细胞或小鼠细胞。在一个优选实施例中,哺乳动物TI宿主细胞为CHO细胞。在某些实施例中,哺乳动物TI宿主细胞为包含整合在基因组基因座内的单个位点上的如本文所述的着陆位点的中国仓鼠卵巢(CHO)细胞、CHO K1细胞、CHO K1SV细胞、CHO DG44细胞、CHO DUKXB-11细胞、CHO K1S细胞或CHO K1M细胞。
在某些实施例中,哺乳动物TI宿主细胞包含整合的着陆位点,其中着陆位点包含一个或多个重组识别序列(RRS)。RRS可以由重组酶(例如,Cre重组酶、FLP重组酶、Bxb1整合酶或整合酶)识别。RRS可以彼此独立地选自由以下项组成的组:LoxP序列、LoxP L3序列、LoxP 2L序列、LoxFas序列、Lox511序列、Lox2272序列、Lox2372序列、Lox5171序列、Loxm2序列、Lox71序列、Lox66序列、FRT序列、Bxb1 attP序列、Bxb1 attB序列、/>attP序列和/>attB序列。如果必须存在多个RRS,则对这些序列中的每一者的选择取决于在选择不同RRS的限度内的另一个序列。
在某些实施例中,着陆位点包含一个或多个重组识别序列(RRS),其中该RRS可以由重组酶识别。在某些实施例中,整合的着陆位点包含至少两个RRS。在某些实施例中,整合的着陆位点包含三个RRS,其中第三RRS位于第一RRS与第二RRS之间。在某些优选实施例中,所有三个RRS不同。在某些实施例中,着陆位点包含第一RRS、第二RRS和第三RRS,以及位于第一RRS与第二RRS之间的至少一个选择标志物,并且第三RRS不同于第一RRS和/或第二RRS。在某些实施例中,着陆位点还包含第二选择标志物,并且第一选择标志物和第二选择标志物是不同的。在某些实施例中,着陆位点还包含第三选择标志物和内部核糖体进入位点(IRES),其中IRES可操作地连接至第三选择标志物。第三选择标志物可不同于第一选择标志物或第二选择标志物。
尽管在下文中以CHO细胞举例说明本发明,但这仅是为了举例说明本发明而不应以任何方式解释为限制。本发明的真实范畴在权利要求书中阐述。
适用于根据本发明的方法的示例性哺乳动物TI宿主细胞是CHO细胞,其具有整合在其基因组基因座内的单个位点的着陆位点,其中该着陆位点包含三个用于Cre重组酶介导的DNA重组的异种特异性loxP位点。
在该实例中,该异种特异性loxP位点为L3、LoxFas和2L(参见例如,Lanza等人,Biotechnol.J.7(2012)898-908;Wong等人,Nucleic Acids Res.33(2005)e147),由此L3和2L分别在5’端和3’端处侧接着陆位点,并且LoxFas位于L3位点与2L位点之间。着陆位点还包含双顺反子单元,其经由IRES将选择标志物的表达与荧光GFP蛋白的表达联系起来,从而允许经由正选择稳定着陆位点,以及选择在转染和Cre重组后不存在该位点(负选择)。绿色荧光蛋白质(GFP)用于监测RMCE反应。
如前一段中所概述的着陆位点的这种配置允许同时整合两个载体,例如携带L3和LoxFas位点的所谓前载体,以及包含LoxFas和2L位点的后载体。与着陆位点中存在的选择标志物基因不同的选择标志物基因的功能性元件可以分布在两个载体之间:启动子和起始密码子可以位于前载体上,而编码区和多聚A信号位于后载体上。只有来自两个载体的所述核酸的正确的重组酶介导整合才诱导针对相应选择性试剂的抗性。
一般来讲,哺乳动物TI宿主细胞为包含整合在哺乳动物细胞基因组的基因座内的单个位点处的着陆位点的哺乳动物细胞,其中该着陆位点包含侧接至少一个第一选择标志物的第一重组识别序列和第二重组识别序列,以及位于第一重组识别序列与第二重组识别序列之间的第三重组识别序列,并且所有重组识别序列都不同。
选择标志物可以选自包含以下项的组:氨基糖苷磷酸转移酶(APH)(例如,潮霉素磷酸转移酶(HYG)、新霉素和G418 APH)、二氢叶酸还原酶(DHFR)、胸苷激酶(TK)、谷氨酰胺合成酶(GS)、天冬酰胺合成酶、色氨酸合成酶(吲哚)、组氨醇脱氢酶(组氨醇D),以及编码对嘌呤霉素、杀稻瘟菌素、博来霉素、腐草霉素、氯霉素、Zeocin和霉酚酸的抗性的基因。选择标志物也可以是选自包含以下项的组的荧光蛋白质:绿色荧光蛋白质(GFP)、增强的GFP(eGFP)、合成的GFP、黄色荧光蛋白质(YFP)、增强的YFP(eYFP)、青色荧光蛋白质(CFP)、mPlum、mCherry、tdTomato、mStrawberry、J-red、DsRed单体、mOrange、mKO、mCitrine、Venus、YPet、Emerald6、CyPet、mCFPm、Cerulean和T-Sapphire。
外源核苷酸序列是并非来源于特异性细胞,而是可以通过DNA递送方法(诸如,通过转染方法、电穿孔方法或转化方法)引入所述细胞中的核苷酸序列。在某些实施例中,哺乳动物TI宿主细胞包含整合在哺乳动物细胞基因组中的一个或多个整合位点处的至少一种着陆位点。在某些实施例中,着陆位点整合在哺乳动物细胞基因组的特异性基因座内的一个或多个整合位点处。
在某些实施例中,整合的着陆位点包含至少一个选择标志物。在某些实施例中,整合的着陆位点包含第一RRS、第二RRS和第三RRS,以及至少一个选择标志物。在某些实施例中,选择标志物位于第一RRS与第二RRS之间。在某些实施例中,两个RRS侧接至少一个选择标志物,即,第一RRS位于该选择标志物的5'(上游)并且第二RRS位于该选择标志物的3'(下游)。在某些实施例中,第一RRS与该选择标志物的5'端相邻,并且第二RRS与该选择标志物的3'端相邻。在某些实施例中,着陆位点包含第一RRS、第二RRS和第三RRS,以及位于第一RRS与第三RRS之间的至少一个选择标志物。
在某些实施例中,选择标志物位于第一RRS与第二RRS之间,并且这两个侧接RRS是不同的。在某些优选的实施例中,第一侧接RRS为LoxP L3序列,并且第二侧接RRS为LoxP 2L序列。在某些实施例中,LoxP L3序列位于选择标志物的5'端,并且LoxP 2L序列位于选择标志物的3'端。在某些实施例中,第一侧接RRS为野生型FRT序列,并且第二侧接RRS为突变体FRT序列。在某些实施例中,第一侧接RRS为Bxb1attP序列,并且第二侧接RRS为Bxb1 attB序列。在某些实施例中,第一侧接RRS为attP序列,并且第二侧接RRS为/>attB序列。在某些实施例中,两个RRS定位在同一取向上。在某些实施例中,两个RRS均处于正向或反向取向上。在某些实施例中,两个RRS定位在相反的取向上。
在某些实施例中,整合的着陆位点包含侧接两个RRS的第一选择标志物和第二选择标志物,其中第一选择标志物不同于第二选择标志物。在某些实施例中,这两个选择标志物均彼此独立地选自包含以下项的组:谷氨酰胺合成酶选择标志物、胸苷激酶选择标志物、HYG选择标志物和嘌呤霉素抗性选择标志物。在某些实施例中,整合的着陆位点包含胸苷激酶选择标志物和HYG选择标志物。在某些实施例中,第一选择标志物选自包含以下项的组:氨基糖苷磷酸转移酶(APH)(例如,潮霉素磷酸转移酶(HYG)、新霉素和G418 APH)、二氢叶酸还原酶(DHFR)、胸苷激酶(TK)、谷氨酰胺合成酶(GS)、天冬酰胺合成酶、色氨酸合成酶(吲哚)、组氨醇脱氢酶(组氨醇D),以及编码对嘌呤霉素、杀稻瘟菌素、博来霉素、腐草霉素、氯霉素、Zeocin和霉酚酸的抗性的基因,并且第二选择标志物选自包含以下项的组:GFP、eGFP、合成的GFP、YFP、eYFP、CFP、mPlum、mCherry、tdTomato、mStrawberry、J-red、DsRed单体、mOrange、mKO、mCitrine、Venus、YPet、Emerald、CyPet、mCFPm、Cerulean和T-Sapphire荧光蛋白质。在某些实施例中,第一选择标志物为谷氨酰胺合成酶选择标志物,并且第二选择标志物为GFP荧光蛋白质。在某些实施例中,侧接两个选择标志物的两个RRS不同。
在某些实施例中,选择标志物可操作地连接至启动子序列。在某些实施例中,选择标志物可操作地连接至SV40启动子。在某些实施例中,选择标志物可操作地连接至人巨细胞病毒(CMV)启动子。
靶向整合
用于产生根据本发明的重组哺乳动物细胞的一种方法是靶向整合(TI)。
在靶向整合中,将位点特异性重组用于将外源核酸引入哺乳动物TI宿主细胞基因组中的特定基因座中。这是一种酶促过程,其中基因组中整合位点处的序列被交换为外源核酸。用于实现此类核酸交换的一种系统是Cre-lox系统。催化交换的酶是Cre重组酶。要交换的序列由基因组和外源核酸中两个lox(P)位点的位置定义。这些lox(P)位点被Cre重组酶识别。不需要更多,即不需要ATP等。最初在噬菌体P1中发现了Cre-lox系统。
Cre-lox系统在不同的细胞类型中运行,如哺乳动物、植物、细菌和酵母。
在一个实施例中,编码异源多肽的外源核酸已通过单重组酶或双重组酶介导的盒交换(RMCE)整合到哺乳动物TI宿主细胞中。从而获得重组哺乳动物细胞,例如重组CHO细胞,其中确定的和特定的表达盒序列已整合到基因组的单个基因座中,进而导致异源多肽的有效表达和生产。
Cre-LoxP位点特异性重组系统已广泛应用于许多生物实验系统中。Cre重组酶为38-kDa位点特异性DNA重组酶,其识别34bp LoxP序列。Cre重组酶来源于噬菌体P1并且属于酪氨酸家族位点特异性重组酶。Cre重组酶可介导LoxP序列之间的分子内和分子间重组。LoxP序列由8bp非回文核心区及其侧接的两个13bp反向重复序列构成。Cre重组酶与13bp重复序列结合,从而介导8bp核心区内的重组。Cre-LoxP介导的重组以高效率发生,并且无需任何其他宿主因子。如果两个LoxP序列以相同的取向被置于同一核苷酸序列中,则Cre重组酶介导的重组将切除位于两个LoxP序列之间的DNA序列,成为共价闭环。如果两个LoxP序列以颠倒的位置被置于同一核苷酸序列中,则Cre重组酶介导的重组将反转位于这两个序列之间的DNA序列的取向。如果两个LoxP序列在两个不同的DNA分子上,并且如果一个DNA分子为环状分子,则Cre重组酶介导的重组将导致环状DNA序列的整合。
匹配RRS
术语“匹配RRS”表示在两个RRS之间发生了重组。在某些实施例中,两个匹配RRS相同。在某些实施例中,两个RRS均为野生型LoxP序列。在某些实施例中,两个RRS均为突变体LoxP序列。在某些实施例中,两个RRS均为野生型FRT序列。在某些实施例中,两个RRS均为突变体FRT序列。在某些实施例中,两个RRS为不同的序列,但是可由同一重组酶识别。在某些实施例中,第一匹配RRS为Bxb1 attP序列,并且第二匹配RRS为Bxb1 attB序列。在某些实施例中,第一匹配RRS为attB序列,并且第二匹配RRS为/>attB序列。
双质粒RMCE
当使用双载体组合时,在根据本发明的方法中采用“双质粒RMCE”策略或“双RMCE”。例如,但不作为限制,整合的着陆位点可以包含三个RRS,例如以下排列:其中第三RRS(“RRS3”)存在于第一RRS(“RRS1”)与第二RRS(“RRS2”)之间,而第一载体包含与该整合的外源核苷酸序列上的第一RRS和第三RRS相匹配的两个RRS,并且第二载体包含与该整合的外源核苷酸序列上的第三RRS和第二RRS相匹配的两个RRS。
双质粒RMCE策略涉及使用三个RRS位点来同时实施两个独立的RMCE。因此,在使用双质粒RMCE策略的哺乳动物TI宿主细胞中的着陆位点包括第三RRS位点(RRS3),其与第一RRS位点(RRS1)或第二RRS位点(RRS2)没有交叉活性。两个待靶向的质粒需要相同的侧接RRS位点才能高效靶向,其中一个质粒(前)侧接有RRS1和RRS3,另一个表达质粒(后)侧接有RRS3和RRS2。在该双质粒RMCE中还需要两个选择标志物。一个选择标志物表达盒被分成两部分。前质粒将包含启动子,随后是起始密码子和RRS3序列。后质粒将具有与选择标志物编码区的减去了起始密码子(ATG)的N末端融合的RRS3序列。可能需要在RRS3位点与选择标志物序列之间插入额外的核苷酸,以确保融合体蛋白质发生框架内翻译(即可操作的连接)。仅当两个质粒均正确插入时,选择标志物的完整表达盒才将被组装,并因此使细胞对相应的选择性试剂具有抗性。
双质粒RMCE涉及靶标基因组基因座内的两个异种特异性RRS与供体DNA分子之间的双重组交叉事件,这些事件由重组酶催化。双质粒RMCE被设计成将来自组合的前载体和后载体的DNA序列的拷贝引入哺乳动物TI宿主细胞基因组的预定基因座中。RMCE可以实现为使得原核载体序列不被引入哺乳动物TI宿主细胞的基因组中,从而减少和/或防止不必要的触发宿主免疫或防御机制。RMCE过程可以用多个DNA序列重复。
在某些实施例中,靶向整合通过两次RMCE实现,其中两种不同的DNA序列均整合到RRS匹配的哺乳动物TI宿主细胞的基因组的预定位点中,其中每种DNA序列均包含至少一个编码异源多聚体多肽的一部分的表达盒和/或至少一个侧接两个异种特异性RRS的选择标志物或其部分。在某些实施例中,靶向整合通过多次RMCE实现,其中来自多个载体的DNA序列全部整合到哺乳动物TI宿主细胞的基因组的预定位点中,其中每种DNA序列均包含至少一个编码异源多聚体多肽的一部分的表达盒和/或至少一个侧接两个异种特异性RRS的选择标志物或其部分。在某些实施例中,该选择标志物可以在第一载体上部分编码并且在第二载体上部分编码,使得只有通过双RMCE正确整合两者才能够表达该选择标志物。
在某些实施例中,经由重组酶介导的重组进行的靶向整合导致多聚体多肽的选择标志物和/或不同的表达盒整合到不含来自原核载体的序列的宿主细胞基因组的一个或多个预定整合位点中。
必须指出,如在一个实施例中,敲除可以在引入编码异源多肽的外源核酸之前或之后进行。
具体实施方式
XBP1外显子4包含26个核苷酸的片段,该片段在体内被IRE1α切除以引入+2框外事件并生产XBP1s。本发明人已确定外显子4的跳跃也引入了+2框外事件并生产了功能性蛋白质。可以使用本发明的反义寡核苷酸完成外显子4的跳跃。根据本发明,通过跳过外显子4,从前体mRNA中去除了一个比IRE1α切除的26个核苷酸的片段更大的146bp的核苷酸片段。因此,根据本发明的XBP1Δ4不等于在体内剪接的XBP1。
本发明人还确定了哺乳动物细胞中XBP1Δ4变体的生成或表达导致异源表达的蛋白质(诸如单克隆抗体,特别是以其他方式难以表达的异源表达的蛋白质)的重组表达提高。这表明XBP1Δ4变体的生成或表达导致哺乳动物细胞中蛋白质表达质量的提高。
本发明公开并利用特异性反义寡核苷酸,其与XBP1前体mRNA转录本的一部分互补,诸如完全互补。本发明的反义寡核苷酸能够减少XBP1转录本中XBP1外显子4的包含(增强切除)。本发明的反义寡核苷酸由此导致XBP1Δ4变体的表达或该变体的表达提高。
发明人已经确定了哺乳动物细胞中XBP1Δ4变体的生成或表达导致蛋白质表达提高。因此,本发明的反义寡核苷酸可用于提高例如在抗体诸如单克隆抗体的制造中从异源蛋白质表达系统生产的蛋白质的产量或质量。
本发明的反义寡核苷酸在蛋白质病理学疾病的治疗和预防中也具有治疗效用。
反义寡核苷酸
在一方面,本发明涉及一种用于在表达XBP1的细胞中表达XBP1剪接变体的反义寡核苷酸,其中该反义寡核苷酸的长度为8个至40个核苷酸,并且包含长度为8个至40个核苷酸的与哺乳动物XBP1前体mRNA转录本互补的连续核苷酸序列。
在本发明的某些实施例中,XBP1剪接变体具有+2框外事件。
在某些实施例中,XBP1剪接变体是XBP1Δ4。
本发明提供了一种反义寡核苷酸,其中该反义寡核苷酸的长度为8个至40个核苷酸并且包含长度为至少12个核苷酸的连续核苷酸序列,该连续核苷酸序列与哺乳动物XBP1前体mRNA转录本互补,诸如完全互补。
本发明提供了一种反义寡核苷酸,其中该反义寡核苷酸的长度为8个至40个核苷酸并且包含长度为12个至16个核苷酸的连续核苷酸序列,该连续核苷酸序列与哺乳动物XBP1前体mRNA转录本互补,诸如完全互补。
本发明提供了一种反义寡核苷酸,其中该反义寡核苷酸的长度为12个至16个核苷酸并且包含长度为12个至16个核苷酸的连续核苷酸序列,该连续核苷酸序列与哺乳动物XBP1前体mRNA转录本互补,诸如完全互补。
本发明提供了一种反义寡核苷酸,其中该反义寡核苷酸的长度为8个至40个核苷酸并且包含长度为12个至18个核苷酸的连续核苷酸序列,该连续核苷酸序列与哺乳动物XBP1前体mRNA转录本互补,诸如完全互补。
反义寡核苷酸的长度可以为8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸。
在一些实施例中,反义寡核苷酸的长度为8个至40个核苷酸、12个至40个核苷酸、12个至20个核苷酸、10个至20个核苷酸、14个至18个核苷酸、12个至18个核苷酸或16个至18个核苷酸。
连续核苷酸序列的长度可以为8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸。在一些实施例中,连续核苷酸序列的长度为至少12个核苷酸,诸如长度为12个至16个核苷酸或12个至18个核苷酸。
在一些实施例中,连续核苷酸序列与反义寡核苷酸具有相同的长度。
在一些实施例中,反义寡核苷酸由连续核苷酸序列组成。
在一些实施例中,反义寡核苷酸为连续核苷酸序列。
在一些实施例中,反义寡核苷酸包含长度为8个至40个核苷酸的连续序列,其与靶核酸或靶序列的区域的互补性为至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多。换句话讲,在一些实施例中,本发明的反义寡核苷酸颗粒蛋白前体激动剂可包括一个、二个、三个或更多个错配,其中错配为反义寡核苷酸颗粒蛋白前体激动剂内不与其靶标碱基配对的核苷酸。
如果寡核苷酸或其连续核苷酸序列与靶序列的区域完全互补(100%互补),则这是有利的。
在一些实施例中,反义寡核苷酸是分离的、纯化的或制造的。
在一些实施例中,反义寡核苷酸包含一个或多个经修饰的核苷酸或一个或多个经修饰的核苷。
在一些实施例中,反义寡核苷酸为吗啉代修饰的反义寡核苷酸。
在一些实施例中,反义寡核苷酸包含一个或多个经修饰的核苷,诸如独立地选自由以下项组成的组的一个或多个经修饰的核苷酸:2'-O-烷基-RNA;2'-O-甲基RNA(2'-OMe);2'-烷氧基-RNA;2'-O-甲氧基乙基-RNA(2'-MOE);2'-氨基-DNA;2'-氟-RNA;2'-氟-DNA;阿糖核酸(ANA);2'-氟-ANA;双环核苷类似物(LNA);或它们的任何组合。
在一些实施例中,一个或多个经修饰的核苷是糖修饰的核苷。
在一些实施例中,一个或多个经修饰的核苷包含双环糖。
在一些实施例中,一个或多个经修饰的核苷是亲和力增强的2'糖修饰的核苷。
在一些实施例中,一个或多个经修饰的核苷是LNA核苷。
在一些实施例中,反义寡核苷酸或其连续核苷酸序列包含一个或多个5'-甲基-胞嘧啶核碱基。
在一些实施例中,反义寡核苷酸的连续核苷酸序列内的核苷间键合中的一者或多者是经修饰的。
在一些实施例中,一个或多个经修饰的核苷间键合包含硫代磷酸酯键合。
在一些实施例中,反义寡核苷酸或其连续核苷酸序列的至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%的核苷间键合经修饰。
在一些实施例中,反义寡核苷酸或其连续核苷酸序列的至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%的核苷间键合是硫代磷酸酯核苷间键合。
在一些实施例中,本发明的反义寡核苷酸呈固体粉末的形式,诸如呈冻干粉末的形式。
在整个本公开中提供了关于上述反义寡核苷酸的额外公开。
靶标
如本文所述,本发明的反义寡核苷酸靶向XBP1 mRNA序列以引起XBP1剪接变体诸如XBP1Δ4变体的表达。
如本文所用,术语“XBP1Δ4”是指缺失外显子4的XBP1转录本(XBP1Δ4变体),或缺失由XBP1外显子4编码的氨基酸的XBP1蛋白。XBP1Δ4变体的一个关键特征是XBP1编码序列中发生外显子4的缺失和+2移码的引入,这导致XBP1Δ4变体的表达,其C末端区域与XBP1的XBP1s变体(由IRE1诱导)的C末端区域同源。
在某些实施例中,XBP1Δ4蛋白缺失全部或基本上全部由XBP1外显子4编码的肽序列。
如本文所用,术语“靶标”用于指本发明的反义寡核苷酸特异性杂交/结合的基因的转录本(即,“XBP1”)。
XBP1也称为X-框结合蛋白1、TREB-5、TREB5、XBP-1和XBP2。
本发明寡核苷酸的靶标是XBP1前体mRNA转录本。XBP1前体mRNA转录本优选是哺乳动物XBP1前体mRNA转录本
在一些实施例中,哺乳动物XBP1前体mRNA转录本是仓鼠XBP1前体mRNA转录本。
仓鼠XBP1前体mRNA序列如SEQ ID NO 1所示。
在某些实施例中,连续核苷酸序列与仓鼠XBP1前体mRNA转录本(SEQ ID NO 1)的至少10个连续核苷酸互补。
在某些实施例中,连续核苷酸序列可以与SEQ ID NO 1的核苷酸2960至核苷酸3113的至少10个连续核苷酸互补。
在前体实施例中,连续核苷酸序列可以与SEQ ID NO 1的核苷酸2986至核苷酸3018的至少10个连续核苷酸互补。
在一些实施例中,连续核苷酸序列与仓鼠XBP1前体mRNA转录本(SEQ ID NO 1)的至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个或至少17个连续核苷酸互补。
在其他实施例中,连续核苷酸序列可以与选自由以下项组成的组的核苷酸序列互补:SEQ ID NO 299、SEQ ID NO 301、SEQ ID NO 302、SEQ ID NO 304、SEQ ID NO 305、SEQID NO 306、SEQ ID NO 307、SEQ ID NO 308、SEQ ID NO 309、SEQ ID NO 310、SEQ ID NO314、SEQ ID NO 316、SEQ ID NO 317、SEQ ID NO 318、SEQ ID NO 319、SEQ ID NO 323、SEQID NO 325、SEQ ID NO 327、SEQ ID NO 328、SEQ ID NO 330、SEQ ID NO 331、SEQ ID NO332、SEQ ID NO 333、SEQ ID NO 334、SEQ ID NO 336、SEQ ID NO 337、SEQ ID NO 385、SEQID NO 386、SEQ ID NO 387、SEQ ID NO 388、SEQ ID NO 390、SEQ ID NO 391、SEQ ID NO392、SEQ ID NO 393、SEQ ID NO 394、SEQ ID NO 395、SEQ ID NO 396 397、SEQ ID NO398、SEQ ID NO 399、SEQ ID NO 401、SEQ ID NO 402、SEQ ID NO 419、SEQ ID NO 431、SEQID NO、SEQ ID NO 432、SEQ ID NO 433、SEQ ID NO 434、SEQ ID NO 438、SEQ ID NO 439、SEQ ID NO 440、SEQ ID NO 441、SEQ ID NO 442、SEQ ID NO 449、SEQ ID NO 484、SEQ IDNO 485、SEQ ID NO 486、SEQ ID NO 487、SEQ ID NO 488、SEQ ID NO 489、SEQ ID NO 490、SEQ ID NO 491、SEQ ID NO 492、SEQ ID NO 493、SEQ ID NO 494、SEQ ID NO 495、SEQ IDNO 496、SEQ ID NO 497、SEQ ID NO 498、SEQ ID NO 499、SEQ ID NO 500、SEQ ID NO 501、SEQ ID NO 502、SEQ ID NO 503、SEQ ID NO 505、SEQ ID NO 506、SEQ ID NO 507、SEQ IDNO 508、SEQ ID NO 509、SEQ ID NO 510、SEQ ID NO 511、SEQ ID NO512、SEQ ID NO 513、SEQ ID NO 515、SEQ ID NO 517、SEQ ID NO 520、SEQ ID NO 572、SEQ ID NO 573、SEQ IDNO 576、SEQ ID NO 577、SEQ ID NO 588和SEQ ID NO 589。
在其他实施例中,连续核苷酸序列可以与选自由以下项组成的组的核苷酸序列互补:SEQ ID NO 305、SEQ ID NO 307、SEQ ID NO 314、SEQ ID NO 315、SEQ ID NO 316、SEQID NO 317、SEQ ID NO 319、SEQ ID NO 331、SEQ ID NO 332、SEQ ID NO 392、SEQ ID NO394、SEQ ID NO 395、SEQ ID NO 440、SEQ ID NO 492、SEQ ID NO 497、SEQ ID NO 498、SEQID NO 499、SEQ ID NO 500、SEQ ID NO 501、SEQ ID NO 502、SEQ ID NO 513和SEQ ID NO576。
在其他实施例中,连续核苷酸序列可以与SEQ ID NO 314或SEQ ID NO 315互补。
在一些实施例中,哺乳动物XBP1前体mRNA转录本是小鼠XBP1前体mRNA转录本。
小鼠XBP1前体mRNA如SEQ ID NO 590所示。
在某些实施例中,连续核苷酸序列与小鼠XBP1前体mRNA转录本(SEQ ID NO 590)的至少10个连续核苷酸互补。
在某些实施例中,连续核苷酸序列可以与SEQ ID NO 590的核苷酸3560至核苷酸3783的至少10个连续核苷酸互补。
在一些实施例中,连续核苷酸序列与小鼠XBP1前体mRNA转录本(SEQ ID NO 590)的至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个或至少17个连续核苷酸互补。
在其他实施例中,连续核苷酸序列可以与选自由以下项组成的组的核苷酸序列互补:SEQ ID NO 699、SEQ ID NO 700、SEQ ID NO 703、SEQ ID NO 710、SEQ ID NO 713、SEQID NO 724、SEQ ID NO 729、SEQ ID NO 739、SEQ ID NO 743、SEQ ID NO 744、SEQ ID NO745、SEQ ID NO 749、SEQ ID NO 750、SEQ ID NO 751、SEQ ID NO 752、SEQ ID NO 753、SEQID NO 754、SEQ ID NO 755、SEQ ID NO 756、SEQ ID NO 757、SEQ ID NO 758、SEQ ID NO759、SEQ ID NO 760、SEQ ID NO 761、SEQ ID NO 762、SEQ ID NO 763、SEQ ID NO 773、SEQID NO776、SEQ ID NO 778、SEQ ID NO 781、SEQ ID NO 783、SEQ ID NO 784、SEQ ID NO785、SEQ ID NO 787、SEQ ID NO 789、SEQ ID NO 790、SEQ ID NO 791、SEQ ID NO 792、SEQID NO 793、SEQ ID NO 794、SEQ ID NO 795、SEQ ID NO 796、SEQ ID NO 797、SEQ ID NO798、SEQ ID NO 799和SEQ ID NO 800。
在其他实施例中,连续核苷酸序列可以与选自由以下项组成的组的核苷酸序列互补:SEQ ID NO 710、SEQ ID NO 754、SEQ ID NO 756、SEQ ID NO 757、SEQ ID NO 758、SEQID NO 759、SEQ ID NO 760、SEQ ID NO 791、SEQ ID NO 792、SEQ ID NO 794、SEQ ID NO795和SEQ ID NO 797。
在一些实施例中,哺乳动物XBP1前体mRNA转录本是人XBP1前体mRNA转录本。
人XBP1前体mRNA如SEQ ID NO 801所示。
在某些实施例中,连续核苷酸序列与人XBP1前体mRNA转录本(SEQ ID NO 801)的至少10个连续核苷酸互补。
在某些实施例中,连续核苷酸序列可以与SEQ ID NO 801的核苷酸4338至核苷酸4563的至少10个连续核苷酸互补
在一些实施例中,连续核苷酸序列与人XBP1前体mRNA转录本(SEQ ID NO 801)的至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个或至少17个连续核苷酸互补。
在其他实施例中,连续核苷酸序列可以与选自由以下项组成的组的核苷酸序列互补:SEQ ID NO 947、SEQ ID NO 948、SEQ ID NO 949、SEQ ID NO 950、SEQ ID NO 951和SEQID NO 988。
在其他实施例中,连续核苷酸序列可以与SEQ ID NO 951互补。
反义寡核苷酸序列
连续核苷酸序列可以与仓鼠XBP1前体mRNA转录本(SEQ ID NO 1)的一部分互补。
在某些实施例中,连续核苷酸序列可以选自由以下项组成的组:SEQ ID NO 8、SEQID NO 10、SEQ ID NO 11、SEQ ID NO 13、SEQ ID NO 14、SEQ ID NO 15、SEQ ID NO 16、SEQID NO 17、SEQ ID NO 18、SEQ ID NO 19、SEQ ID NO 23、SEQ ID NO 24、SEQ ID NO 25、SEQID NO 26、SEQ ID NO 27、SEQ ID NO 28、SEQ ID NO 32、SEQ ID NO 34、SEQ ID NO 36、SEQID NO 37、SEQ ID NO 39、SEQ ID NO 40、SEQ ID NO 41、SEQ ID NO 42、SEQ ID NO 43、SEQID NO 45、SEQ ID NO 46、SEQ ID NO 94、SEQ ID NO 95、SEQ ID NO 96、SEQ ID NO 97、SEQID NO 99、SEQ ID NO 100、SEQ ID NO 101、SEQ ID NO 102、SEQ ID NO 103、SEQ ID NO104、SEQ ID NO 105、SEQ ID NO 106、SEQ ID NO 107、SEQ ID NO 108、SEQ ID NO 110、SEQID NO 111、SEQ ID NO 128、SEQ ID NO 140、SEQ ID NO 141、SEQ ID NO 142、SEQ ID NO143、SEQ ID NO 147、SEQ ID NO 148、SEQ ID NO 149、SEQ ID NO 150、SEQ ID NO 151、SEQID NO 158、SEQ ID NO 193、SEQ ID NO 194、SEQ ID NO 195、SEQ ID NO 196、SEQ ID NO197、SEQ ID NO 198、SEQ ID NO 199、SEQ ID NO 200、SEQ ID NO 201、SEQ ID NO 202、SEQID NO 203、SEQ ID NO 204、SEQ ID NO 205、SEQ ID NO 206、SEQ ID NO 207、SEQ ID NO208、SEQ ID NO 209、SEQ ID NO 210、SEQ ID NO 211、SEQ ID NO 212、SEQ ID NO 214、SEQID NO 215、SEQ ID NO 216、SEQ ID NO 217、SEQ ID NO 218、SEQ ID NO 219、SEQ ID NO220、SEQ ID NO 221、SEQ ID NO 222、SEQ ID NO 224、SEQ ID NO 226、SEQ ID NO 229、SEQID NO 281、SEQ ID NO 282、SEQ ID NO 285、SEQ ID NO 286、SEQ ID NO 297和SEQ ID NO298。
在某些实施例中,连续核苷酸序列可以选自由以下项组成的组:SEQ ID NO 14、SEQ ID NO 16、SEQ ID NO 23、SEQ ID NO 24、SEQ ID NO 25、SEQ ID NO 26、SEQ ID NO28、SEQ ID NO 40、SEQ ID NO 41、SEQ ID NO 101、SEQ ID NO 103、SEQ ID NO 104、SEQ IDNO 149、SEQ ID NO 201、SEQ ID NO 206、SEQ ID NO 207、SEQ ID NO 208、SEQ ID NO 209、SEQ ID NO 210、SEQ ID NO 211、SEQ ID NO 222和SEQ ID NO 285。
在某些实施例中,连续核苷酸序列可以为SEQ ID NO 23或SEQ ID NO 24。
连续核苷酸序列可以与小鼠XBP1前体mRNA转录本(SEQ ID NO 590)的一部分互补。
在某些实施例中,连续核苷酸序列可以选自由以下项组成的组:SEQ ID NO 597、SEQ ID NO 598、SEQ ID NO 601、SEQ ID NO 608、SEQ ID NO 611、SEQ ID NO 622、SEQ IDNO 627、SEQ ID NO 637、SEQ ID NO 641、SEQ ID NO 642、SEQ ID NO 643、SEQ ID NO 647、SEQ ID NO 648、SEQ ID NO 649、SEQ ID NO 650、SEQ ID NO 651、SEQ ID NO 652、SEQ IDNO 653、SEQ ID NO 654、SEQ ID NO 655、SEQ ID NO 656、SEQ ID NO 657、SEQ ID NO 658、SEQ ID NO 659、SEQ ID NO 660、SEQ ID NO 661、SEQ ID NO 671、SEQ ID NO 674、SEQ IDNO 676、SEQ ID NO 679、SEQ ID NO 681、SEQ ID NO 682、SEQ ID NO 683、SEQ ID NO 685、SEQ ID NO 687、SEQ ID NO 688、SEQ ID NO 689、SEQ ID NO 690、SEQ ID NO 691、SEQ IDNO 692、SEQ ID NO 693、SEQ ID NO 694、SEQ ID NO 695、SEQ ID NO 696、SEQ ID NO 697和SEQ ID NO 698。
在某些实施例中,连续核苷酸序列可以选自由以下项组成的组:SEQ ID NO 608、SEQ ID NO 652、SEQ ID NO 654、SEQ ID NO 655、SEQ ID NO 656、SEQ ID NO 657、SEQ IDNO 658、SEQ ID NO 689、SEQ ID NO 690、SEQ ID NO 692、SEQ ID NO 693和SEQ ID NO695。
连续核苷酸序列可以与人XBP1前体mRNA转录本(SEQ ID NO 801)的一部分互补。
在某些实施例中,连续核苷酸序列可以选自由以下项组成的组:SEQ ID NO 854、SEQ ID NO 855、SEQ ID NO 856、SEQ ID NO 857、SEQ ID NO 858和SEQ ID NO 895。
在某些实施例中,连续核苷酸序列可以为SEQ ID NO 858。
在一些实施例中,连续核苷酸序列与反义寡核苷酸具有相同的长度。
在一些实施例中,反义寡核苷酸由连续核苷酸序列组成。
在一些实施例中,反义寡核苷酸为连续核苷酸序列。
本发明还设想到了连续核苷酸序列的片段,包括其至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个或至少17个连续核苷酸的片段。
反义寡核苷酸活性
在一些实施例中,本发明的反义寡核苷酸调节哺乳动物XBP1前体mRNA转录本的剪接,诸如本文所述的。在一些实施例中,调节哺乳动物XBP1前体mRNA转录本的剪接可以调节某些XBP1变体的表达和/或活性。
不希望受理论束缚,剪接调节寡核苷酸通常经由基于占据的机制而不是经由降解机制(例如RNA酶H或RISC介导的抑制)运行。
在一些实施例中,本发明的反义寡核苷酸能够减少或抑制细胞中包含外显子4的XBP1 mRNA转录本的表达(例如,数量)。在本文中,包含外显子4的XBP1 mRNA转录本称为XBP1-E4。
如本文所用,术语“减少”或“抑制”转录本的表达应理解为反义寡核苷酸抑制或减少XBP1-E4蛋白在靶细胞中的量或活性(例如,通过减少或抑制XBP1-E4 mRNA的表达,从而减少XBP1-E4蛋白的表达)的能力的总称。
活性的抑制可以通过测量XBP1-E4 mRNA的水平(例如,数量),或通过测量细胞中XBP1-E4蛋白的水平(例如,数量)或活性来确定。因此,可以在体外或在体内确定表达的抑制。应当理解,剪接调节可以导致XBP1-E4转录本(例如,mRNA)或其编码的蛋白质在细胞中的表达(例如,数量)的抑制。在某些实施例中,与未暴露于反义寡核苷酸的对应细胞相比,XBP1-E4转录本(例如,mRNA)的表达(例如,数量)减少至少约1%、至少约2%、至少约3%、至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%或更多。
如本文所用,术语“未暴露于反义寡核苷酸的对应细胞”可指在用本发明的反义寡核苷酸处理之前的相同细胞,或指相同的细胞类型(但不是相同的细胞)。
因此,在一些实施例中,用本发明的反义寡核苷酸处理细胞减少了(例如,至少约10%或至少约20%)XBP1-E4转录本(例如,mRNA)在细胞中的表达,与在反义寡核苷酸处理之前XBP1-E4转录本(例如mRNA)在相同细胞中的表达相比。
在其他实施例中,用本发明的反义寡核苷酸处理细胞减少了(例如,至少约10%或至少约20%)XBP1-E4转录本(例如,mRNA)在细胞中的表达,与XBP1-E4转录本(例如mRNA)在未经历反义寡核苷酸处理的相同细胞类型中的表达相比。
在一些实施例中,本发明的反义寡核苷酸能够增加或增强缺失外显子4的XBP1mRNA转录本在细胞中的表达(例如,数量)。在本文中,缺失外显子4的XBP1 mRNA转录本称为XBP1Δ4。
如本文所用,术语“增加”转录本的表达应理解为反义寡核苷酸增加或提高XBP1Δ4蛋白在靶细胞中的量或活性(例如,通过增加XBP1Δ4mRNA的表达,从而增加XBP1Δ4蛋白的表达)的能力的总称。
活性的增加可以通过测量XBP1Δ4mRNA的水平(例如,数量),或通过测量细胞中XBP1Δ4蛋白的水平(例如,数量)或活性来确定。因此,可以在体外或在体内确定表达的增加。应当理解,剪接调节可以导致XBP1Δ4转录本(例如,mRNA)或其编码的蛋白质在细胞中的表达(例如,数量)的增加。在某些实施例中,与未暴露于反义寡核苷酸的对应细胞相比,XBP1Δ4转录本(例如,mRNA)的表达(例如,数量)增加或提高至少约1%、至少约2%、至少约3%、至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%或更多。优选地,与未暴露于反义寡核苷酸的对应细胞相比,XBP1Δ4转录本(例如,mRNA)的表达(例如,数量)增加或提高至少约1%或至少约5%。
如本文所用,术语“未暴露于反义寡核苷酸的对应细胞”可指在用本发明的反义寡核苷酸处理之前的相同细胞,或指相同的细胞类型(但不是相同的细胞)。
因此,在一些实施例中,用本发明的反义寡核苷酸处理细胞增加或提高了(例如,至少约10%或至少约20%)XBP1Δ4转录本(例如,mRNA)在细胞中的表达,与在反义寡核苷酸处理之前XBP1Δ4转录本(例如mRNA)在相同细胞中的表达相比。
在其他实施例中,用本发明的反义寡核苷酸处理细胞增加或提高了(例如,至少约10%或至少约20%)XBP1Δ4转录本(例如,mRNA)在细胞中的表达,与XBP1Δ4转录本(例如mRNA)在未经历反义寡核苷酸处理的相同细胞类型中的表达相比。
在一些实施例中,本发明的反义寡核苷酸可以改变细胞中表达的可变XBP1剪接变体的比例。例如,增加或提高XBP1Δ4的表达将导致XBP1Δ4/XBP1E4转录本的表达比率增加。
因此,在一些实施例中,与未暴露于本发明的反义寡核苷酸的细胞的对应比率相比,本文公开的反义寡核苷酸可以增加XBP1Δ4/XBP1E4mRNA转录本的表达比率。在某些实施例中,与未暴露于本发明的反义寡核苷酸的细胞的对应比例相比,XBP1Δ4mRNA转录本的表达与XBP1-E4mRNA转录本的表达的比率增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约10倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍或更多
在一些实施例中,与未暴露于本发明的反义寡核苷酸的细胞的对应比率相比,本文公开的反义寡核苷酸可以增加XBP1Δ4/XBP1E4蛋白的表达比率。在某些实施例中,与未暴露于本发明的反义寡核苷酸的细胞的对应比例相比,XBP1Δ4蛋白的表达与XBP1-E4蛋白的表达的比率增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约10倍、至少约20倍、至少约25倍或更多
在一些实施例中,本发明的反义寡核苷酸能够i)增加靶细胞中XBP1Δ4mRNA或XBP1Δ4蛋白的量和ii)减少靶细胞中XBP1-E4 mRNA和XBP1-E4蛋白的量两者。
可以通过比较mRNA水平或相应蛋白质产物的水平来测量不同转录本产物(例如XBP1-E4相对于XBP1Δ4)的比率变化。可用于测定XBP1-E4和XBP1Δ4的蛋白质水平的抗XBP1抗体包括针对XBP1产生的单克隆或多克隆抗体。
寡核苷酸设计
本发明的反义寡核苷酸可以包含包含核苷和核苷类似物二者的核苷酸序列,并且可以呈间隔聚体、嵌段聚物、混聚物、头聚物、尾聚物或全聚物的形式。
在一实施例中,反义寡核苷酸包含至少1个经修饰的核苷,诸如至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少16个、至少16个或至少17个经修饰的核苷。
如本文所用,术语“间隔聚体”是指一种反义寡核苷酸,其包含RNA酶H募集寡核苷酸(缺口)的区域,该区域在5'端和3'端侧接有一个或多个亲和力增强修饰核苷(侧翼)的区域。术语“尾聚物”和“头聚物”是能够募集RNA酶H的寡核苷酸,其中侧翼之一缺失,即该寡核苷酸仅有一个末端包含亲和力增强修饰核苷。头聚物缺失3'侧翼(即5'侧翼包含亲和力增强修饰核苷),尾聚物则缺失5'侧翼(即3'侧翼包含亲和力增强修饰核苷)。术语LNA间隔聚体是指一种间隔聚体寡核苷酸,其中亲和力增强修饰核苷中的至少一个为LNA核苷。术语“混合翼间隔聚体”是指这样的LNA间隔聚体,其中侧翼区域包含至少一个LNA核苷和至少一个DNA核苷或非LNA修饰的核苷,诸如至少一个2'取代的修饰的核苷,诸如例如一个或多个2'-O-烷基-RNA、2'-O-甲基-RNA、2'-烷氧基-RNA、2'-O-甲氧基乙基-RNA(MOE)、2'-氨基-DNA、2'-氟-RNA、2'-氟-DNA、阿糖核酸(ANA)和2'-氟-ANA核苷。
其他“嵌合”反义寡核苷酸,称为“混聚物”,由以下的可变组合物组成:(i)可被RNA酶识别和切割的DNA单体或核苷类似物单体,和(ii)非RNA酶募集核苷类似物单体。
“全聚物”是仅包含非天然存在的核苷酸或核苷酸类似物的单链ASO。
高亲和力修饰的核苷
高亲和力修饰的核苷是修饰的核苷酸,其在掺入到寡核苷酸中时,增强了寡核苷酸对其互补靶标的亲和力,例如通过解链温度(Tm)测量。本发明的高亲和力修饰的核苷优选地使每一个修饰的核苷的解链温度增加介于+0.5℃至+12℃之间,更优选地介于+1.5℃至+10℃之间并且最优选地介于+3℃至+8℃之间。许多高亲和力修饰的核苷是本领域已知的,并且包括例如许多2'取代的核苷以及锁定的核酸(LNA)(参见例如Freier&Altmann;Nucl.Acid Res.,1997,25,4429-4443和Uhlmann;Curr.Opinion in Drug Development,2000,3(2),203-213)。
糖修饰
与DNA和RNA中发现的核糖部分相比时,本发明的反义寡核苷酸可包含一个或多个具有经修饰的糖部分(即,糖部分的修饰)的核苷。
已经制备了许多具有核糖糖部分的修饰的核苷,主要目的为改善寡核苷酸的某些特性,诸如亲和力和/或核酸酶抗性。
这样的修饰包括其中核糖环结构被修饰的那些修饰,例如,通过用己糖环(HNA)或双环替换核糖环结构来实现,其通常在核糖环(LNA)的C2和C4碳原子之间具有双基桥,或通常在C2和C3之间缺乏键的未连接核糖环(例如UNA)。其他糖修饰的核苷包括,例如,双环己糖核酸(WO2011/017521)或三环核酸(WO2013/154798)。修饰的核苷还包括其中糖部分被非糖部分替换的核苷,例如在肽核酸(PNA)或吗啉代核酸的情况下。
糖修饰还包括通过将核糖环上的取代基改变为除氢以外的基团或DNA和RNA核苷中天然存在的2'-OH基团而进行的修饰。例如,可以在2'、3'、4'或5'位置引入取代基。
2'糖修饰的核苷
2'糖修饰的核苷是一种核苷,其在2'位置具有除H或-OH以外的取代基(2'取代的核苷)或包含能够在2'碳与核糖环中的第二个碳原子之间形成桥的2'连接双基,诸如LNA(2'-4'双基桥连)核苷。
事实上,人们已花费很多精力开发2'糖取代的核苷,并且发现许多2'取代的核苷掺入寡核苷酸后具有有益的特性。例如,2'修饰的糖可提供对寡核苷酸的增强的结合亲和力和/或增加的核酸酶抗性。2'取代的修饰的核苷的实例是2'-O-烷基-RNA、2'-O-甲基-RNA、2'-烷氧基-RNA、2'-O-甲氧基乙基-RNA(MOE)、2'-氨基-DNA、2'-氟-RNA和2'-F-ANA核苷。有关进一步的实例,请参见例如Freier&Altmann;Nucl.Acid Res.,1997,25,4429-4443和Uhlmann;Curr.Opinion in Drug Development,2000,3(2),203-213以及Deleavey和Damha,Chemistry and Biology 2012,19,937。下面为一些2'取代的修饰的核苷的示意图。
关于本发明,2'取代的糖修饰的核苷不包括像LNA那样的2'桥连的核苷。
锁定的核酸核苷(LNA核苷)
“LNA核苷”是一种2'-修饰的核苷,其包含连接所述核苷的核糖环的C2'和C4'的双基(也称为“2'-4'桥”),其限制或锁定核糖环的构象。这些核苷在文献中也被称为桥连核酸或双环核酸(BNA)。当将LNA掺入互补RNA或DNA分子的寡核苷酸中时,核糖构象的锁定与杂交亲和力的增强(双链体稳定化)相关。这可通过测量寡核苷酸/互补双链体的解链温度来常规确定。
非限制性的示例性LNA核苷公开于WO 99/014226、WO 00/66604、WO 98/039352、WO2004/046160、WO 00/047599、WO 2007/134181、WO 2010/077578、WO 2010/036698、WO2007/090071、WO 2009/006478、WO 2011/156202、WO 2008/154401、WO 2009/067647、WO2008/150729、Morita等人,Bioorganic&Med.Chem.Lett.12,73-76;Seth等人,J.Org.Chem.2010,Vol 75(5)pp.1569-81和Mitsuoka等人,Nucleic Acids Research2009,37(4),1225-1238和Wan和Seth,J.Medical Chemistry 2016,59,9645-9667中。
其他非限制性的示例性LNA核苷公开于方案1中。
方案1:
/>
特定的LNA核苷是β-D-氧基-LNA、6'-甲基-β-D-氧基LNA诸如(S)-6'-甲基-β-D-氧基-LNA(ScET)和ENA。
一种特别有利的LNA是β-D-氧基-LNA。
吗啉代寡核苷酸
在一些实施例中,本发明的反义寡核苷酸包含吗啉代核苷或由吗啉代核苷组成(即,是吗啉代寡聚物和作为磷酸二氨基酯吗啉代寡聚物(PMO))。剪接调节吗啉代寡核苷酸已被批准用于临床-参见例如依特普森(eteplirsen),靶向DMD中框移突变的30nt吗啉代寡核苷酸,用于治疗杜氏肌营养不良。吗啉代寡核苷酸具有附着在六元吗啉环上而不是核糖上的核碱基,诸如通过磷酸二氨基酯基团连接的亚甲基吗啉环,例如由以下4个连续的吗啉代核苷酸所说明:
在一些实施例中,本发明的吗啉代寡核苷酸的长度可以是例如20-40个吗啉代核苷酸,诸如长度为25-35个吗啉代核苷酸。
RNA酶H活性和募集
反义寡核苷酸的RNA酶H活性是指其与互补RNA分子形成双链体时募集RNA酶H的能力。WO01/23613提供了用于确定RNA酶H活性的体外方法,其可以用于确定募集RNA酶H的能力。如果寡核苷酸在提供有互补靶核酸序列的情况下具有的初始速率是使用WO01/23613(通过引用并入本文)的实例91至95提供的方法测量的(以pmol/l/min计)具有与所测试修饰的寡核苷酸相同的碱基序列但仅包含在寡核苷酸中所有单体之间均具有硫代磷酸酯键合DNA单体的寡核苷酸的初始速率的至少5%诸如至少10%、至少20%或多于20%,则一般认为该寡核苷酸能够募集RNA酶H。为了用于确定RHA酶H活性,可从Lubio Science GmbH(Lucerne,Switzerland)获得重组RNA酶H1。
已知DNA寡核苷酸可有效募集RNA酶H,间隔聚体寡核苷酸也是如此,其包含DNA核苷区域(通常至少5个或6个连续DNA核苷),其5'和3'侧接包含2'糖修饰的核苷(通常高亲和力2'糖修饰的核苷,诸如2-O-MOE和/或LNA)的区域。对于剪接的有效调节,前体mRNA的降解是非所需的,并且因此优选地,避免靶标的RNA酶H降解。因此,本发明的反义寡核苷酸并非RNA酶H募集间隔聚体寡核苷酸。
可以通过限制寡核苷酸中连续DNA核苷酸的数量来避免RNA酶H募集,因此可以使用混聚物和全聚物设计。有利地,本发明的反义寡核苷酸或其连续核苷酸序列不包含多于3个连续DNA核苷。进一步,有利地,本发明的反义寡核苷酸或其连续核苷酸序列不包含多于4个连续DNA核苷。进一步有利地,本发明的反义寡核苷酸或其连续核苷酸序列不包含多于2个连续DNA核苷。
混聚物和全聚物
对于剪接调节,通常有利的是使用不募集RNA酶H的反义寡核苷酸。由于RNA酶H活性需要DNA核苷酸的连续序列,因此反义寡核苷酸的RNA酶H活性可通过设计不包含多于3个或多于4个的连续DNA核苷的区域的反义寡核苷酸来实现。这可以通过使用具有混聚物设计的反义寡核苷酸或其连续核苷区域(其包含糖修饰的核苷,诸如2'糖修饰的核苷)以及短的DNA核苷区(诸如1个、2个或3个DNA核苷)来实现。混聚物在本文中通过“每两个”设计(其中核苷在1个LNA与1个DNA核苷之间交替,例如LDLDLDLDLDLDLDLL,具有5'端和3'端LNA核苷)和“每三个”设计(诸如LDDLDDLDDLDDLDDL,其中每三个核苷为LNA核苷)来举例说明。
全聚物为不包含DNA或RNA核苷的反义寡核苷酸或其连续核苷酸序列,并且可以例如仅包含2'-O-MOE核苷,诸如完全MOE硫代磷酸酯,例如MMMMMMMMMMMMMMMMMMMM,其中M=2'-O-MOE,其被报告为用于治疗用途的有效剪接调节剂。
替代性地,混聚物可包含经修饰的核苷的混合物,诸如MLMLMLMLMLMLMLMLMLML,其中L=LNA并且M=2'-O-MOE核苷。
有利地,混聚物和全聚物中的核苷间核苷或混聚物中的大部分核苷键合可以为硫代磷酸酯。混聚物和全聚物可包含其他核苷间键合,诸如磷酸二酯或硫代磷酸酯(作为示例)。
寡核苷酸中的区域D'或D”
在一些实施例中,本发明的反义寡核苷酸可包含寡核苷酸的连续核苷酸序列以及其他5'和/或3'核苷或由其组成,该寡核苷酸的连续核苷酸序列与靶核酸(诸如混聚物或全聚物区域)互补。所述其他5'和/或3'核苷可以与靶核酸互补或可以不互补(诸如完全互补)。此类其他的5’和/或3’核苷本文中可称为区域D’和D”。
出于将连续核苷酸序列(诸如混聚物或全聚物)与缀合物部分或另一个官能团接合的目的,可以使用添加区域D'或D”。当用于将连续核苷酸序列与缀合物部分接合时,其可用作可生物裂解的接头。另选地,其可用于提供核酸外切酶保护或促进合成或制造。
区域D’或D'’可以独立地包含1个、2个、3个、4个或5个另外的核苷酸或由其组成,它们可以与靶核酸互补或不互补。与F或F'区域相邻的核苷酸不是糖修饰的核苷酸,诸如DNA或RNA或这些的碱基修饰形式。D’或D'’区域可用作核酸酶敏感的可生物裂解的接头(参见接头的定义)。在一些实施例中,另外的5'和/或3'端核苷酸与磷酸二酯键联接,并且是DNA或RNA。WO2014/076195中公开了适合用作区域D'或D”的基于核苷酸的可生物裂解的接头,其包括例如磷酸二酯连接的DNA二核苷酸。WO2015/113922中公开了在聚寡核苷酸构建体中可生物裂解的接头的用途,其中它们被用于在单个寡核苷酸内连接多个反义构建体。
在一个实施例中,本发明的反义寡核苷酸除构成混聚物或全聚物的连续核苷酸序列外还包含区域D'和/或D”。
在一些实施例中,位于区域D'或D”与混聚物或全聚物区域之间的核苷间键合为磷酸二酯键合。
缀合
本发明涵盖一种反义寡核苷酸,其共价连接至至少一个缀合物部分。在一些实施例中,它可以称为本发明的缀合物。
如本文所用,术语“缀合物”是指与非核苷酸部分(缀合物部分或区域C或第三区域)共价连接的反义寡核苷酸。缀合物部分可以与反义寡核苷酸共价连接,任选地经由接头(诸如区域D'或D”)基团。
寡核苷酸缀合物及其合成也在Manoharan于Antisense Drug Technology,Principles,Strategies,and Applications,S.T.Crooke,ed.,Ch.16,Marcel Dekker,Inc.,2001and Manoharan,Antisense and Nucleic Acid Drug Development,2002,12,103)。
在一些实施例中,缀合物部分可包含蛋白质、脂肪酸链、糖残基、糖蛋白、聚合物或其任何组合。
在一些实施例中,非核苷酸部分(缀合物部分)选自由以下项组成的组:碳水化合物(例如GalNAc)、细胞表面受体配体、原料药、激素、亲脂物质、聚合物、蛋白质、肽、毒素(例如细菌毒素)、维生素、病毒蛋白(例如衣壳)或它们的组合。
在一些实施例中,本发明的反义寡核苷酸缀合物是前药。在此处,一旦前药被递送到作用位点(例如,靶细胞),缀合物部分就可以从核酸分子上切割下来。
接头
键合或接头是两个原子之间的连接,其经由一个或多个共价键将一个目标化学基团或区段与另一个目标化学基团或区段联接。缀合物部分可直接或通过连接部分(例如接头或系链)连接到反义寡核苷酸。接头用于将第三区域诸如缀合物部分(区域C)与第一区域共价连接,该第一区域例如与靶核酸互补的寡核苷酸或连续核苷酸序列(区域A)。
在本发明的一些实施例中,本发明的缀合物或反义寡核苷酸缀合物可以任选地包含位于与靶核酸互补的寡核苷酸或连续核苷酸序列(区域A或第一区域)和缀合物部分(区域C或第三区域)之间的接头区域(第二区域或区域B和/或区域Y)。
区域B是指包含生理上不稳定的键或由其组成的可生物裂解的接头,该键在哺乳动物体内通常遇到的条件下或与之相似的条件下可裂解。生理上不稳定的接头经历化学转化(例如裂解)的条件包括化学条件,诸如pH、温度、氧化或还原条件或试剂,以及在哺乳动物细胞中遇到的盐浓度或与之相似的盐浓度。哺乳动物细胞内条件还包括通常存在于哺乳动物细胞中的酶活性,诸如来自蛋白水解酶或水解酶或核酸酶的酶活性。在一个实施例中,可生物切割的接头对S1核酸酶切割敏感。在一些实施例中,核酸酶敏感接头包含1个至5个核苷,诸如一个或多个包含至少两个连续磷酸二酯键合的DNA核苷。包含可生物裂解的接头的磷酸二酯的详细说明请参阅WO 2014/076195。
区域Y是指不必为可生物裂解的但主要用于将缀合物部分(区域C或第三区域)共价连接至寡核苷酸(区域A或第一区域)的接头。区域Y接头可以包含重复单元诸如乙二醇、氨基酸单元或氨基烷基的链结构或寡聚物。本发明的反义寡核苷酸缀合物可以由以下区域性元件A-C、A-B-C、A-B-Y-C、A-Y-B-C或A-Y-C构成。在一些实施例中,接头(区域Y)为氨基烷基诸如C2-C36氨基烷基基团,包括例如C6至C12氨基烷基基团。在一些实施例中,接头(区域Y)为C6氨基烷基基团。
药用盐
本发明提供了一种根据本发明的反义寡核苷酸,其中该反义寡核苷酸呈药用盐的形式。术语“药用盐”是指保留本发明的反义寡核苷酸的生物学有效性和特性的常规酸加成盐或碱加成盐。
在一些实施例中,药用盐可为钠盐、钾盐或铵盐。
本发明提供了根据本发明的反义寡核苷酸的药用钠盐,或根据本发明的缀合物。
本发明提供了根据本发明的反义寡核苷酸的药用钾盐,或根据本发明的缀合物。
本发明提供了根据本发明的反义寡核苷酸的药用铵盐,或根据本发明的缀合物。
药物组合物
本发明提供了药物组合物,该药物组合物包含本发明的反义寡核苷酸或本发明的缀合物、或本发明的盐,以及药用稀释剂、溶剂、载体、盐和/或佐剂。
药用稀释剂包括磷酸盐缓冲盐水(PBS),而药用盐包括但不限于钠盐和钾盐。在一些实施例中,药用稀释剂是无菌磷酸盐缓冲盐水。在一些实施例中,核酸分子以50μM至300μM溶液的浓度在药用稀释剂中使用。
用于本发明的合适的制剂可见于《雷明顿药物科学(第十七版)》(Remington'sPharmaceutical Sciences,Mack Publishing Company,Philadelphia,Pa.,第17版,1985)中。对于药物递送方法的简要综述,参见例如Langer(Science 249:1527-1533,1990)。WO2007/031091(通过引用并入本文)提供了药用稀释剂、载体和佐剂的其他合适的和优选的实例。WO2007/031091中也提供了合适的剂量、制剂、施用途径、组合物、剂型、与其他治疗剂的组合、前药制剂。
本发明提供了一种药物组合物,其包含本发明的反义寡核苷酸或本发明的缀合物以及药用盐。例如,盐可以包含金属阳离子,诸如钠盐、钾盐或铵盐。
本发明提供了一种根据本发明的药物组合物,其中该药物组合物包含本发明的反义寡核苷酸或本发明的缀合物,或本发明的药用盐;和水性稀释剂或溶剂。
在一些实施例中,本发明的反义寡核苷酸、本发明的缀合物或其药用盐呈固体形式,诸如粉末、诸如冻干粉末。
本发明的反义寡核苷酸或、本发明的缀合物或本发明的盐可与药用活性或惰性物质混合,用以制备药物组合物或制剂。药物组合物的组成和配制方法取决于许多标准,包括但不限于施用途径、疾病程度或施用剂量。
这些组合物可以通过常规的灭菌技术进行灭菌,或者可以进行无菌过滤。所得的水溶液可以包装后直接使用或冻干,在施用前将冻干的制剂与无菌水性运载体混合。制剂的pH通常为介于3至11之间,更优选地介于5和9之间或介于6和8之间,并且最优选地介于7和8之间,诸如7至7.5。可以将固体形式的所得组合物包装在多个单剂量单元中,每一个单元包含固定量的一种或多种上述试剂,诸如在片剂或胶囊的密封包装中。固体形式的组合物也可以灵活的量包装在容器中,诸如在设计用于局部适用的乳膏或软膏的可挤压管中。
组成
在一方面,本发明提供了一种组合物,其包含根据本发明的反义寡核苷酸、或根据本发明的缀合物、或根据本发明的盐;以及稀释剂、溶剂、载体、盐和/或佐剂。
该组合物可以是药物组合物。
根据本发明的寡核苷酸的制造方法
在另一方面,本发明提供了用于制造本发明的寡核苷酸的方法,该方法包括使核苷酸单元反应并由此形成包含在寡核苷酸中的共价连接的连续核苷酸单元。优选地,该方法使用亚磷酰胺化学方法(参见例如Caruthers等人,1987,Methods in Enzymology,第154卷,第287-313页)。
在另一个实施例中,该方法进一步包括使连续核苷酸序列与缀合物部分(配体)反应以将缀合物部分共价连接至寡核苷酸。
在另一个实施例中,提供了一种用于制备本发明的组合物的方法,该方法包括将本发明的寡核苷酸或缀合寡核苷酸与药用稀释剂、溶剂、载体、盐和/或佐剂混合。
XBP1Δ4蛋白
在一方面,本发明包括分离的XBP1Δ4蛋白。
分离的XBP1Δ4蛋白可以是哺乳动物蛋白。在一些实施例中,XBP1Δ4蛋白可以是仓鼠、小鼠或人蛋白。
在某些实施例中,分离的XBP1Δ4蛋白是仓鼠蛋白并由SEQ ID NO 7编码。
在某些实施例中,分离的XBP1Δ4蛋白是小鼠蛋白并由SEQ ID NO 596编码。
在某些实施例中,分离的XBP1Δ4蛋白是人蛋白并由SEQ ID NO 807编码。
本发明还考虑了分离的XBP1Δ4蛋白的片段。
XBP1Δ4mRNA
在一方面,本发明包括编码本发明的分离的XBP1Δ4蛋白的分离的mRNA。
分离的XBP1Δ4mRNA可以是哺乳动物蛋白。在一些实施例中,XBP1Δ4mRNA可以是仓鼠、小鼠或人mRNA。
在某些实施例中,分离的XBP1Δ4mRNA是仓鼠mRNA并且由SEQ ID NO 6编码。
在某些实施例中,分离的XBP1Δ4mRNA是小鼠mRNA并由SEQ ID NO 595编码。
在某些实施例中,分离的XBP1Δ4mRNA是人mRNA并由SEQ ID NO 806编码。
本发明还考虑了分离的XBP1Δ4mRNA的片段。
使用根据本发明的化合物生产多肽的方法
本发明人已经确定在哺乳动物细胞中诱导XBP1Δ4表达的化合物可用于增强异源表达的蛋白质(尤其是多聚体多肽,诸如抗体)在哺乳动物细胞中的重组表达。
如上所述,XBP1s是一种功能活性蛋白质,其功能是提高正确的蛋白质折叠。本发明人令人惊讶地确定了XBP1剪接变体(诸如XBP1Δ4)可以在重组多肽生产方法中提高正确折叠的蛋白质的生产。
在一方面,本发明提供了一种用于(重组)生产多肽的方法,其包括以下步骤:
a)培养表达XBP1以及包含编码多肽的一个或多个核酸的哺乳动物细胞;以及
b)从细胞或培养基中回收多肽;
其特征在于该培养至少部分地是在本发明的反义寡核苷酸、组合物、药物组合物、蛋白质或mRNA的存在下。
在一个优选的实施例中,培养包括预培养步骤和主培养步骤,其中至少预培养步骤在本发明的寡核苷酸的存在下进行。
在某些实施例中,该方法包括以下步骤:
a1)在包含根据本发明的反义寡核苷酸的培养基中,繁殖表达XBP1以及包含编码多肽的一个或多个核酸的哺乳动物细胞以获得第一细胞群;
a2)将第一细胞群的等分试样与培养基混合以获得第二细胞群,任选地其中该培养基包含根据本发明的反义寡核苷酸;
a3)培养所述第二细胞群以获得第三细胞群;以及
b)从第三次细胞培养的所述细胞和/或所述培养基中回收所述多肽。
在某些实施例中,添加反义寡核苷酸至终浓度为至少约5μM、至少约10μM、至少约15μM、至少约20μM、至少约25μM、至少约30μM、至少约35μM、至少约40μM、至少约45μM、至少约50μM或更多。在一个优选的实施例中,添加反义寡核苷酸至终浓度为约25μM。
在某些实施例中,哺乳动物细胞的繁殖在至少约0.5*10E6个细胞/mL、至少约1*10E6个细胞/mL、至少约2*10E6个细胞/mL、至少约3*10E6个细胞/mL、至少约4*10E6个细胞/mL、至少约5*10E6个细胞/mL或更多的起始细胞密度下进行。在某些实施例中,培养以1*10E6个细胞/mL至2*10E6个细胞/mL的起始细胞密度进行。
在某些实施例中,第二细胞群的培养以至少约0.5*10E6个细胞/mL、至少约1*10E6个细胞/mL、至少约2*10E6个细胞/mL、至少约3*10E6个细胞/mL、至少约4*10E6个细胞/mL、至少约5*10E6个细胞/mL、至少约10*10E6个细胞/mL或更多的起始细胞密度进行。在某些实施例中,培养以1*10E6个细胞/mL至2*10E6个细胞/mL的起始细胞密度进行。
在某些实施例中,细胞为哺乳动物细胞。
在某些实施例中,细胞为仓鼠细胞。
在某些实施例中,细胞为CHO细胞,诸如CHO-K1细胞。中国仓鼠卵巢(CHO)细胞是源自中国仓鼠卵巢的上皮细胞系,通常用于生物学和医学研究,并在商业上用于生产治疗性蛋白质,诸如单克隆抗体。
在一些实施例中,细胞可为人细胞。
在一些实施例中,细胞可为神经元细胞或脑细胞。
在一些实施例中,靶细胞可以是体外的。体外细胞例如可以是iPSC细胞。
在某些实施例中,多肽是Fab,优选双特异性Fab、包含融合多肽的Fc区、人治疗性多肽或细胞因子。
在某些实施方案中,多肽为抗体。在此处,抗体可以采取任何形式,如本文提供的“抗体”的定义中所讨论的。
在某些实施例中,本发明的方法使蛋白质产量增加至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%,至少约70%,至少约80%,至少约90%,至少约1000%,至少约200%,至少约300%,至少约400%,至少约500%或更多,相对于在不存在本发明的反义寡核苷酸的情况下获得的蛋白质产量。
在某些实施例中,产量的增加代表多肽绝对量的增加。在其他实施例中,产量的增加代表正确折叠的多肽量的增加。在本文中,可以通过查看多肽的结构或通过确定多肽的活性来将多肽定义为正确折叠。
治疗
本文所用的术语“治疗”是指既存疾病(例如本文所指的疾病或疾患)的治疗或疾病的阻止,即预防。因此将认识到,在一些实施例中,本文所指的治疗可以是预防性的。
在一方面,本发明涉及用于医学或治疗的本发明的反义寡核苷酸、组合物或药物组合物。
在一些实施例中,治疗涉及蛋白质病理学疾病的治疗或预防。
在另一方面,本发明涉及本发明的反义寡核苷酸、组合物或药物组合物在制备用于治疗蛋白质病理学疾病的药物中的用途。
在另一方面,本发明涉及一种用于治疗患者蛋白质病理学疾病的方法,该方法包括向患者施用本发明的反义寡核苷酸、组合物或药物组合物。
蛋白质病理学疾病
在某些实施例中,本发明涉及蛋白质病理学疾病的治疗或预防。蛋白质病理学疾病也称为蛋白质构象病、蛋白质病、蛋白质构象病症或蛋白质错误折叠疾病。
在某些实施例中,蛋白质病理学疾病可选自朊病毒疾病、Tau蛋白病、突触核蛋白病、淀粉样变性、多系统萎缩、TDP-43病理学和CAG重复序列适应症。
在某些实施例中,蛋白质病理学疾病可选自肌萎缩侧索硬化症(ALS)、额颞叶变性(FTLD)、阿尔茨海默病、帕金森病、自闭症、海马硬化性痴呆、唐氏综合征、亨廷顿病、多聚谷氨酰胺疾病(诸如脊髓小脑共济失调3)、肌病和慢性创伤性脑病。
在某些实施例中,朊病毒疾病可以是克雅氏病。
在某些实施例中,Tau蛋白病可以是阿尔茨海默病。
在某些实施例中,突触核蛋白病可以是帕金森病。
在某些实施例中,TDP-43病理学可以是肌萎缩侧索硬化症(ALS)额颞叶变性(FTLD)。
在某些实施例中,CAG重复序列适应症可以是脊髓小脑共济失调,包括脊髓小脑共济失调1型、脊髓小脑共济失调2型(SCA2)和脊髓小脑共济失调3型(SCA3,马查多-约瑟夫病)。
施用
本发明的化合物、反义寡核苷酸、组合物、药物组合物、蛋白质或核酸可以局部施用或肠内施用或肠胃外(诸如静脉内、皮下或肌肉内)施用。
在某些实施例中,施用反义核酸或药物组合物以用于治疗。
在一个优选的实施例中,本发明的反义寡核苷酸或药物组合物通过肠胃外途径施用,包括静脉内、动脉内、皮下、腹膜内或肌肉内注射或输注。
在一个实施例中,静脉内施用反义核酸或药物组合物。
在另一个实施例中,皮下施用反义核酸或药物组合物。
在一些实施例中,本发明的反义核酸或药物组合物以0.1mg/kg至15mg/kg,诸如0.2mg/kg至10mg/kg、诸如0.25mg/kg至5mg/kg的剂量施用。施用可以是每周一次、每二周一次、每三周一次或甚至每月一次。
本发明的编号实施例
1.一种用于在表达XBP1的细胞中表达XBP1剪接变体的反义寡核苷酸,其中所述反义寡核苷酸的长度为8个至40个核苷酸,并且包含长度为8个至40个核苷酸的与哺乳动物XBP1前体mRNA转录本互补的连续核苷酸序列。
2.根据实施例1所述的反义寡核苷酸,其中所述XBP1剪接变异体为XBP1Δ4变体。
3.根据实施例1或实施例2所述的反义寡核苷酸,其中所述连续核苷酸序列与仓鼠XBP1前体mRNA转录本(SEQ ID NO 1)的至少10个连续核苷酸互补。
4.根据实施例3所述的反义寡核苷酸颗粒,其中所述连续核苷酸序列与SEQ ID NO1的核苷酸2960至核苷酸3113的至少10个连续核苷酸互补。
5.根据实施例4所述的反义寡核苷酸颗粒,其中所述连续核苷酸序列与SEQ ID NO1的核苷酸2986至核苷酸3018的至少10个连续核苷酸互补。
6.根据实施例3所述的反义寡核苷酸,其中所述连续核苷酸序列与选自由以下项组成的组的序列互补:SEQ ID NO 299、SEQ ID NO 301、SEQ ID NO 302、SEQ ID NO 304、SEQ ID NO 305、SEQ ID NO 306、SEQ ID NO 307、SEQ ID NO 308、SEQ ID NO 309、SEQ IDNO 310、SEQ ID NO 314、SEQ ID NO 316、SEQ ID NO 317、SEQ ID NO 318、SEQ ID NO 319、SEQ ID NO 323、SEQ ID NO 325、SEQ ID NO 327、SEQ ID NO 328、SEQ ID NO 330、SEQ IDNO 331、SEQ ID NO 332、SEQ ID NO 333、SEQ ID NO 334、SEQ ID NO 336、SEQ ID NO 337、SEQ ID NO 385、SEQ ID NO 386、SEQ ID NO 387、SEQ ID NO 388、SEQ ID NO 390、SEQ IDNO 391、SEQ ID NO 392、SEQ ID NO 393、SEQ ID NO 394、SEQ ID NO 395、SEQ ID NO 396397、SEQ ID NO 398、SEQ ID NO 399、SEQ ID NO 401、SEQ ID NO 402、SEQ ID NO 419、SEQID NO 431、SEQ ID NO、SEQ ID NO 432、SEQ ID NO 433、SEQ ID NO 434、SEQ ID NO 438、SEQ ID NO 439、SEQ ID NO 440、SEQ ID NO 441、SEQ ID NO 442、SEQ ID NO 449、SEQ IDNO 484、SEQ ID NO 485、SEQ ID NO 486、SEQ ID NO 487、SEQ ID NO 488、SEQ ID NO 489、SEQ ID NO 490、SEQ ID NO 491、SEQ ID NO 492、SEQ ID NO 493、SEQ ID NO 494、SEQ IDNO 495、SEQ ID NO 496、SEQ ID NO 497、SEQ ID NO 498、SEQ ID NO 499、SEQ ID NO 500、SEQ ID NO 501、SEQ ID NO 502、SEQ ID NO 503、SEQ ID NO 505、SEQ ID NO 506、SEQ IDNO 507、SEQ ID NO 508、SEQ ID NO 509、SEQ ID NO 510、SEQ ID NO 511、SEQ ID NO 512、SEQ ID NO 513、SEQ ID NO 515、SEQ ID NO 517、SEQ ID NO 520、SEQ ID NO 572、SEQ IDNO 573、SEQ ID NO 576、SEQ ID NO 577、SEQ ID NO 588和SEQ ID NO 589。
7.根据实施例6所述的反义寡核苷酸,其中所述连续核苷酸序列选自由以下项组成的组:SEQ ID NO 8、SEQ ID NO 10、SEQ ID NO 11、SEQ ID NO 13、SEQ ID NO 14、SEQ IDNO 15、SEQ ID NO 16、SEQ ID NO 17、SEQ ID NO 18、SEQ ID NO 19、SEQ ID NO 23、SEQ IDNO 24、SEQ ID NO 25、SEQ ID NO 26、SEQ ID NO 27、SEQ ID NO 28、SEQ ID NO 32、SEQ IDNO 34、SEQ ID NO 36、SEQ ID NO 37、SEQ ID NO 39、SEQ ID NO 40、SEQ ID NO 41、SEQ IDNO 42、SEQ ID NO 43、SEQ ID NO 45、SEQ ID NO 46、SEQ ID NO 94、SEQ ID NO 95、SEQ IDNO 96、SEQ ID NO 97、SEQ ID NO 99、SEQ ID NO 100、SEQ ID NO 101、SEQ ID NO 102、SEQID NO 103、SEQ ID NO 104、SEQ ID NO 105、SEQ ID NO 106、SEQ ID NO 107、SEQ ID NO108、SEQ ID NO 110、SEQ ID NO 111、SEQ ID NO 128、SEQ ID NO 140、SEQ ID NO 141、SEQID NO 142、SEQ ID NO 143、SEQ ID NO 147、SEQ ID NO 148、SEQ ID NO 149、SEQ ID NO150、SEQ ID NO 151、SEQ ID NO 158、SEQ ID NO 193、SEQ ID NO 194、SEQ ID NO 195、SEQID NO 196、SEQ ID NO 197、SEQ ID NO 198、SEQ ID NO 199、SEQ ID NO 200、SEQ ID NO201、SEQ ID NO 202、SEQ ID NO 203、SEQ ID NO 204、SEQ ID NO 205、SEQ ID NO 206、SEQID NO 207、SEQ ID NO 208、SEQ ID NO 209、SEQ ID NO 210、SEQ ID NO 211、SEQ ID NO212、SEQ ID NO 214、SEQ ID NO 215、SEQ ID NO 216、SEQ ID NO 217、SEQ ID NO 218、SEQID NO 219、SEQ ID NO 220、SEQ ID NO 221、SEQ ID NO 222、SEQ ID NO 224、SEQ ID NO226、SEQ ID NO 229、SEQ ID NO 281、SEQ ID NO 282、SEQ ID NO 285、SEQ ID NO 286、SEQID NO 297和SEQ ID NO 298。
8.根据实施例3所述的反义寡核苷酸,其中所述连续核苷酸序列与选自由以下项组成的组的序列互补:SEQ ID NO 305、SEQ ID NO 307、SEQ ID NO 314、SEQ ID NO 315、SEQ ID NO 316、SEQ ID NO 317、SEQ ID NO 319、SEQ ID NO 331、SEQ ID NO 332、SEQ IDNO 392、SEQ ID NO 394、SEQ ID NO 395、SEQ ID NO 440、SEQ ID NO 492、SEQ ID NO497、SEQ ID NO 498、SEQ ID NO 499、SEQ ID NO 500、SEQ ID NO 501、SEQ ID NO 502、SEQ IDNO 513和SEQ ID NO 576。
9.根据实施例8所述的反义寡核苷酸,其中所述连续核苷酸序列选自由以下项组成的组:SEQ ID NO 14、SEQ ID NO 16、SEQ ID NO 23、SEQ ID NO 24、SEQ ID NO 25、SEQID NO 26、SEQ ID NO 28、SEQ ID NO 40、SEQ ID NO 41、SEQ ID NO 101、SEQ ID NO 103、SEQ ID NO 104、SEQ ID NO 149、SEQ ID NO 201、SEQ ID NO 206、SEQ ID NO 207、SEQ IDNO 208、SEQ ID NO 209、SEQ ID NO 210、SEQ ID NO 211、SEQ ID NO 222和SEQ ID NO285。
10.根据实施例3所述的反义寡核苷酸,其中所述连续核苷酸序列与SEQ ID NO314或SEQ ID NO 315互补。
11.根据实施例10所述的反义寡核苷酸,其中所述连续核苷酸序列是SEQ ID 23或SEQ ID 24。
12.根据实施例1或实施例2所述的反义寡核苷酸,其中所述连续核苷酸序列与来自小鼠XBP1前体mRNA转录本(SEQ ID NO 590)的至少10个连续核苷酸互补。
13.根据实施例12所述的反义寡核苷酸颗粒,其中所述连续核苷酸序列与SEQ IDNO 590的核苷酸3560至核苷酸3783的至少10个连续核苷酸互补。
14.根据实施例12所述的反义寡核苷酸,其中所述连续核苷酸序列与选自由以下项组成的组的序列互补:SEQ ID NO 699、SEQ ID NO 700、SEQ ID NO 703、SEQ ID NO 710、SEQ ID NO 713、SEQ ID NO 724、SEQ ID NO 729、SEQ ID NO 739、SEQ ID NO 743、SEQ IDNO 744、SEQ ID NO 745、SEQ ID NO 749、SEQ ID NO 750、SEQ ID NO 751、SEQ ID NO 752、SEQ ID NO 753、SEQ ID NO 754、SEQ ID NO 755、SEQ ID NO 756、SEQ ID NO 757、SEQ IDNO 758、SEQ ID NO 759、SEQ ID NO 760、SEQ ID NO 761、SEQ ID NO 762、SEQ ID NO 763、SEQ ID NO 773、SEQ ID NO 776、SEQ ID NO 778、SEQ ID NO 781、SEQ ID NO 783、SEQ IDNO 784、SEQ ID NO 785、SEQ ID NO 787、SEQ ID NO 789、SEQ ID NO 790、SEQ ID NO 791、SEQ ID NO 792、SEQ ID NO793、SEQ ID NO 794、SEQ ID NO 795、SEQ ID NO 796、SEQ IDNO 797、SEQ ID NO 798、SEQ ID NO 799和SEQ ID NO 800。
15.根据实施例14所述的反义寡核苷酸,其中所述连续核苷酸序列选自由以下项组成的组:SEQ ID NO 597、SEQ ID NO 598、SEQ ID NO 601、SEQ ID NO 608、SEQ ID NO611、SEQ ID NO 622、SEQ ID NO 627、SEQ ID NO 637、SEQ ID NO 641、SEQ ID NO 642、SEQID NO 643、SEQ ID NO 647、SEQ ID NO 648、SEQ ID NO 649、SEQ ID NO 650、SEQ ID NO651、SEQ ID NO 652、SEQ ID NO 653、SEQ ID NO 654、SEQ ID NO 655、SEQ ID NO 656、SEQID NO 657、SEQ ID NO 658、SEQ ID NO 659、SEQ ID NO 660、SEQ ID NO 661、SEQ ID NO671、SEQ ID NO 674、SEQ ID NO 676、SEQ ID NO 679、SEQ ID NO 681、SEQ ID NO 682、SEQID NO 683、SEQ ID NO 685、SEQ ID NO 687、SEQ ID NO 688、SEQ ID NO 689、SEQ ID NO690、SEQ ID NO 691、SEQ ID NO 692、SEQ ID NO 693、SEQ ID NO 694、SEQ ID NO 695、SEQID NO 696、SEQ ID NO 697和SEQ ID NO 698。
16.根据实施例12所述的反义寡核苷酸,其中所述连续核苷酸序列与选自由以下项组成的组的序列互补:SEQ ID NO 710、SEQ ID NO 754、SEQ ID NO 756、SEQ ID NO 757、SEQ ID NO 758、SEQ ID NO 759、SEQ ID NO 760、SEQ ID NO 791、SEQ ID NO 792、SEQ IDNO 794、SEQ ID NO 795和SEQ ID NO 797。
17.根据实施例16所述的反义寡核苷酸,其中所述连续核苷酸序列选自由以下项组成的组:SEQ ID NO 608、SEQ ID NO 652、SEQ ID NO 654、SEQ ID NO 655、SEQ ID NO656、SEQ ID NO 657、SEQ ID NO 658、SEQ ID NO 689、SEQ ID NO 690、SEQ ID NO 692、SEQID NO 693和SEQ ID NO 695。
18.根据实施例1或实施例2所述的反义寡核苷酸,其中所述连续核苷酸序列与人XBP1前体mRNA转录本(SEQ ID NO 801)的至少10个连续核苷酸互补。
19.根据实施例18所述的反义寡核苷酸颗粒,其中所述连续核苷酸序列与SEQ IDNO 801的核苷酸4338至核苷酸4563的至少10个连续核苷酸互补。
20.根据实施例18所述的反义寡核苷酸,其中所述连续核苷酸序列与选自由以下项组成的组的序列互补:SEQ ID NO 947、SEQ ID NO 948、SEQ ID NO 949、SEQ ID NO 950、SEQ ID NO 951和SEQ ID NO 988。
21.根据实施例21所述的反义寡核苷酸,其中所述连续核苷酸序列选自由以下项组成的组:SEQ ID NO 854、SEQ ID NO 855、SEQ ID NO 856、SEQ ID NO 857、SEQ ID NO858和SEQ ID NO 895。
22.根据实施例18所述的反义寡核苷酸,其中所述连续核苷酸序列与SEQ ID NO:951互补。
23.根据实施例22所述的反义寡核苷酸,其中所述连续核苷酸序列是SEQ ID NO:858。
24.根据前述实施例中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸或其连续核苷酸序列与哺乳动物XBP1前体mRNA转录本完全互补。
25.根据前述实施例中任一项所述的反义寡核苷酸,其中所述连续核苷酸序列的长度为至少12个核苷酸。
26.根据实施例25所述的反义寡核苷酸,其中所述连续核苷酸序列的长度为12个至16个核苷酸或12个至18个核苷酸。
27.根据实施例25所述的反义寡核苷酸,其中所述连续核苷酸序列的长度为12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸。
28.根据前述实施例中任一项所述的反义寡核苷酸,其中所述连续核苷酸序列与所述反义寡核苷酸具有相同的长度。
29.根据前述实施例中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸是分离的、纯化的或制造的。
30.根据前述实施例中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸或其连续核苷酸序列包含一个或多个经修饰的核苷酸或一个或多个经修饰的核苷。
31.根据前述实施例中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸或其连续核苷酸序列包含一个或多个经修饰的核苷,诸如独立地选自由以下项组成的组的一个或多个经修饰的核苷酸:2'-O-烷基-RNA;2'-O-甲基RNA(2'-OMe);2'-烷氧基-RNA;2'-O-甲氧基乙基-RNA(2'-MOE);2'-氨基-DNA;2'-氟-RNA;2'-氟-DNA;阿糖核酸(ANA);2'-氟-ANA;双环核苷类似物(LNA);或它们的任何组合。
32.根据实施例30或实施例31所述的反义寡核苷酸,其中所述一个或多个经修饰的核苷为糖修饰的核苷。
33.根据实施例30至32中任一项所述的反义寡核苷酸,其中一个或多个经修饰的核苷包含双环糖。
34.根据实施例30至32中任一项所述的反义寡核苷酸,其中一个或多个经修饰的核苷是亲和力增强的2'糖修饰的核苷。
35.根据实施例30至34中任一项所述的反义寡核苷酸,其中一个或多个经修饰的核苷是LNA核苷,诸如一个或多个β-D-氧基LNA核苷。
36.根据前述实施例中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸或其连续核苷酸序列包含一个或多个5'-甲基-胞嘧啶核碱基。
37.根据前述实施例中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸的连续核苷酸序列内的核苷间键合中的一者或多者是经修饰的。
38.根据实施例37所述的反义寡核苷酸,其中至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%的核苷间键合是经修饰的。
39.根据实施例37或实施例38所述的反义寡核苷酸,其中一个或多个经修饰的核苷间键合包含硫代磷酸酯键合。
40.根据前述实施例中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸是吗啉代修饰的反义寡核苷酸。
41.根据前述实施例中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸或其连续核苷酸序列为或包含反义寡核苷酸混聚物或全聚物。
42.根据前述实施例中任一项所述的反义寡核苷酸,其共价连接至至少一个缀合物部分。
43.根据实施例42所述的反义寡核苷酸,其中所述缀合物部分包含蛋白质、脂肪酸链、糖残基、糖蛋白、聚合物或其任何组合。
44.根据前述实施例中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸呈药用盐的形式。
45.根据实施例44所述的反义寡核苷酸,其中所述盐为钠盐、钾盐或铵盐。
46.一种组合物,其包含根据前述实施例中任一项所述的反义寡核苷酸。
47.一种药物组合物,其包含根据实施例1至45中任一项所述的反义寡核苷酸以及药用稀释剂、溶剂、载体、盐和/或佐剂。
48.根据实施例47所述的药物组合物,其中所述药物组合物包含水性稀释剂或溶剂,诸如磷酸盐缓冲盐水。
49.一种分离的XBP1Δ4蛋白。
50.根据实施例49所述的分离的XBP1Δ4蛋白,其中所述蛋白包含SEQ ID NO:7、SEQ ID NO:596或SEQ ID NO 807的序列。
51.一种分离的mRNA,其编码根据实施例49或实施例50所述的XBP1Δ4蛋白
52.根据实施例51所述的分离的mRNA,其包含SEQ ID NO:6、SEQ ID NO:595或SEQID NO:806的序列。
53.一种用于生产多肽的方法,所述方法包括以下步骤:
a)培养表达XBP1以及包含编码多肽的一个或多个核酸的哺乳动物细胞;以及
b)从所述细胞或所述培养基中回收所述多肽,
其特征在于所述培养是在根据实施例1至45中任一项所述的反义寡核苷酸、根据实施例46所述的组合物、根据实施例47或实施例48所述的药物组合物、根据实施例49或50所述的蛋白质或根据实施例51或52所述的mRNA的存在下。
54.根据实施例53所述的方法,其包括以下步骤:
a1)在包含根据实施例1至45中任一项所述的反义寡核苷酸的培养基中,繁殖表达XBP1以及包含编码所述多肽的一个或多个核酸的哺乳动物细胞以获得第一细胞群;
a2)将所述第一细胞群的等分试样与培养基混合以获得第二细胞群,其中所述培养基任选地包含根据实施例1至45中任一项所述的反义寡核苷酸;a3)培养所述第二细胞群以获得第三细胞群;以及
b)从第三次细胞培养的所述细胞和/或所述培养基中回收所述多肽。
55.根据实施例53或54所述的方法,其中添加所述反义寡核苷酸至终浓度为25μM或更高。
56.根据实施例53至55中任一项所述的方法,其中所述繁殖和/或所述培养使用1*10E6个细胞/mL至2*10E6个细胞/mL的起始细胞密度。
57.根据实施例56所述的方法,其中所述起始细胞密度为约2*10E6个细胞/mL。
58.根据实施例53至57中任一项所述的方法,其中所述哺乳动物细胞为CHO细胞。
59.根据实施例53至58中任一项所述的方法,其中所述多肽为抗体。
60.根据实施例1至45中任一项所述的反义寡核苷酸、根据实施例46所述的组合物或根据实施例47或实施例48所述的药物组合物,其用于药物。
61.根据实施例1至45中任一项所述的反义寡核苷酸、根据实施例46所述的组合物或根据实施例47或实施例48所述的药物组合物,其用于治疗患有蛋白质病理学疾病的患者。
62.根据实施例61所述使用的反义寡核苷酸,其中所述蛋白质病理学疾病具有TDP-43病理学。
63.根据实施例61或实施例62所述使用的反义寡核苷酸,其中所述蛋白质病理学疾病是运动神经元疾病或额颞叶变性。
64.根据实施例1至45中任一项所述的反义寡核苷酸、根据实施例46所述的组合物或根据实施例47或实施例48所述的药物组合物在制备用于治疗蛋白质病理学疾病的药物中的用途。
65.根据实施例64所述的用途,其中所述疾病具有TDP-43病理学。
66.根据实施例64或65所述的用途,其中所述疾病是运动神经元疾病或额颞叶变性。
67.一种用于治疗患者的蛋白质病理学疾病的方法,所述方法包括向所述患者施用根据实施例1至45中任一项所述的反义寡核苷酸、根据实施例46所述的组合物或根据实施例47或实施例48所述的药物组合物。
68.根据实施例67所述的方法,其中所述疾病具有TDP-43病理学。
69.根据实施例67或68所述的方法,其中所述疾病是运动神经元病或额颞叶变性。
实例
一般技术
重组DNA技术
使用标准方法来操纵DNA,如描述于Sambrook等人,Molecular Cloning:ALaboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y,(1989)。根据制造商的说明来使用分子生物学试剂。
基因合成
在Geneart GmbH(Regensburg,德国)通过化学合成制备所需的基因片段。将合成的基因片段克隆到大肠杆菌质粒中进行繁殖/扩增。通过DNA测序来验证亚克隆基因片段的DNA序列。可替代地,通过对化学合成的寡核苷酸进行退火或经由PCR来组装短的合成DNA片段。各个寡核苷酸由metabion GmbH(Planegg-Martinsried,德国)制备。
DNA序列测定
通过在MediGenomix GmbH(Martinsried,德国)或SequiServe GmbH(Vaterstetten,德国)处执行的双链测序来确定DNA序列。
DNA和蛋白质序列分析及序列数据管理
EMBOSS(欧洲分子生物学开放软件套件)软件包和Invitrogen的Vector NTI 11.5版或Geneious prime用于序列创建、映射、分析、注释和图示。
试剂
如果没有另外说明,所有商业化学品、抗体和试剂盒均按照制造商的方案使用。
蛋白质测定
通过使用根据Pace等人,Protein Science 4(1995)2411-1423的基于氨基酸序列计算的摩尔消光系数测定280nm处的光密度(OD),来确定纯化的抗体和衍生物的蛋白质浓度。
上清液中的抗体浓度测定
通过用蛋白A琼脂糖珠粒(Roche Diagnostics GmbH,Mannheim,德国)进行免疫沉淀来估计细胞培养物上清液中抗体的浓度。因此,将60μL蛋白A琼脂糖珠粒在TBS-NP40(50mM Tris缓冲液,pH 7.5,补充有150mM NaCl和1%Nonidet-P40)中洗涤三次。随后,将1-15mL的细胞培养上清液施加至在TBS-NP40中预平衡的蛋白A琼脂糖珠粒。在室温下孵育1小时后,将珠粒在Ultrafree-MC-过滤器柱(Amicon)上用0.5mL TBS-NP40洗涤一次,用0.5mL2x磷酸盐缓冲盐水(2xPBS,Roche Diagnostics GmbH,Mannheim,德国)洗涤两次,并用0.5mL 100mM柠檬酸钠缓冲液(pH 5.0)短暂洗涤四次。通过添加35μl的LDS样品缓冲液(Invitrogen)来洗脱结合的抗体。将一半样品分别与/>样品还原剂混合或保持不还原,并在70℃下加热10分钟。由此,将5-30μl施加至4-12%/>Bis-Tris SDS-PAGE(Invitrogen)(使用MOPS缓冲液进行非还原SDS-PAGE,并使用具有抗氧化剂电泳缓冲液添加剂(Invitrogen)的MES缓冲液进行还原SDS-PAGE),并用考马斯蓝染色。
通过亲和HPLC色谱法定量地测量细胞培养上清液中的抗体的浓度。简而言之,将含有与蛋白A结合的抗体的细胞培养物上清液施加至200mM KH2PO4、100mM柠檬酸钠,pH7.4中的Applied Biosystems Poros A/20柱,并在Agilent HPLC 1100系统上用200mMNaCl、100mM柠檬酸,pH 2.5洗脱。通过UV吸光度和峰面积积分来定量洗脱的抗体。将纯化的标准IgG1抗体用作标准品。
或者,通过Sandwich-IgG-ELISA测量细胞培养物上清液中抗体和衍生物的浓度。简而言之,将StreptaWell High Bind Streptavidin A-96孔微量滴定板(RocheDiagnostics GmbH,Mannheim,德国)用100μL/孔的0.1μg/mL的生物素化的抗人IgG捕获分子F(ab’)2<h-Fcγ>BI(Dianova)在室温下包被1小时或在4℃下包被过夜,随后用200μL/孔的PBS、0.05%的吐温(PBST,Sigma)洗涤三次。此后,将100μL/孔的含有相应抗体的PBS(Sigma)稀释系列的细胞培养上清液加入到孔中,并在室温下在振荡器上孵育1-2小时。将孔用200μL/孔的PBST洗涤三次,并用100μl 0.1μg/mL的F(ab’)2<hFcγ>POD(Dianova)作为检测抗体,在室温下在振荡器上孵育1-2小时来检测结合的抗体。用200μL/孔PBST洗涤3次,去除未结合的检测抗体。通过添加100μL ABTS/孔然后孵育来检测结合的检测抗体。在Tecan Fluor光谱仪上,在405nm的测量波长(参考波长为492nm)下执行吸光度测定。
CHO宿主细胞系的培养
CHO宿主细胞在37℃下在湿度为85%和5%CO2的加湿培养箱中培养。它们在含有300μg/ml潮霉素B和4μg/ml第二选择标志物的专有DMEM/F12培养基中培养。每3天或4天以总体积为30ml的0.3x10E6个细胞/ml的浓度,对细胞进行分离。对于培养,使用了125ml无挡板锥形摇瓶。以150rpm的速度以5cm的振荡幅度振荡细胞。细胞计数用Cedex HiRes CellCounter(Roche)测定。将细胞保持在培养物中直到它们达到60天的年龄。
转化10-β感受态大肠杆菌细胞
为了转化,将10-β感受态大肠杆菌细胞在冰上解冻。之后,将2μl质粒DNA直接移入细胞悬浮液中。轻弹试管并置于冰上30分钟。此后,将细胞放入42℃温暖的热块中并热激恰好30秒。紧接着,将细胞在冰上冷却2分钟。将950μl NEB 10-β生长培养基加入细胞悬液中。将细胞在37℃振荡孵育一小时。然后,将50-100μL移取到预热(37℃)的LB-Amp琼脂平板上并用一次性抹刀铺板。将板在37℃孵育过夜。只有成功掺入携带氨苄青霉素抗性基因的质粒的细菌才能在这些平板上生长。次日挑取单菌落并在LB-Amp培养基中培养用于随后的质粒制备。
细菌培养
大肠杆菌的培养在LB培养基(Luria Bertani的缩写)中进行,该培养基中刺入1ml/L的100mg/ml的氨苄青霉素,使得氨苄青霉素浓度为0.1mg/ml。对于不同的质粒制备量,用单个细菌菌落接种以下量。
表1:大肠杆菌培养体积
数量质粒制备 体积LB-Amp培养基[ml] 孵育时间[h]
Mini-Prep 96-孔(EpMotion) 1.5 23
Mini-Prep 15ml-管 3.6 23
Maxi-Prep 200 16
对于Mini-Prep,96孔2ml深孔板,每孔填充1.5ml LB-Amp培养基。挑取菌落并将牙签塞入培养基中。挑取所有菌落后,用粘性空气多孔膜将板封闭。将板在200rpm振荡速度下于37℃孵育箱孵育23小时。
对于Mini-Prep,在15ml管(带通风盖)中填充3.6ml LB-Amp培养基并同样接种细菌菌落。在孵育过程中,牙签没有被移除,而是留在管中。与96孔板一样,管在37℃、200rpm下孵育23小时。
对于大量制备,将200ml的LB-Amp培养基填充到高压灭菌的1LErlenmeyer玻璃锥形烧瓶中,并接种1ml细菌日间培养物,大约是在5小时后。锥形瓶用纸塞封闭并在37℃、200rpm下孵育16小时。
质粒制备
对于Mini-Prep,将50μl细菌悬浮液转移到1ml深孔板中。之后,将细菌细胞在板中以3000rpm、4℃离心5min。去除上清液,将带有细菌颗粒的板置于EpMotion中。在大约90分钟之后,完成运行,并且可以从EpMotion中取出洗脱的质粒DNA以进一步使用。
对于小量制备,从孵育器中取出15ml的管,并将3.6ml的细菌培养物分装到两个2ml的Eppendorf管中。在室温,在台式微量离心机中以6,800xg将管离心3分钟。之后,根据制造商的说明使用Qiagen QIAprep Spin Miniprep Kit进行Mini-Prep。用Nanodrop测量质粒DNA浓度。
Maxi-Prep是根据制造商的说明使用Macherey-NagelXtra MaxiEF试剂盒进行的。用Nanodrop测量DNA浓度。
乙醇沉淀
将一定体积的DNA溶液与2.5倍体积的100%乙醇混合。混合物在-20℃孵育10min。然后以14,000转/分钟,4℃将DNA离心30min。小心去除上清液,用70%乙醇洗涤沉淀。再次以14,000转/分钟,4℃将管离心5min。通过移液小心除去上清液并干燥沉淀。待乙醇蒸发后,加入适量的无内毒素水。给予DNA时间在4℃下重新溶解在水中过夜。取一小部分并用Nanodrop装置测量DNA浓度。
制备型抗体纯化
参照标准方案从过滤的细胞培养物上清液中纯化抗体。简言之,将抗体施加至蛋白A琼脂糖柱(GE healthcare)并用PBS洗涤。在pH 2.8下实现抗体的洗脱,之后立即进行中和。通过尺寸排阻色谱法(Superdex 200,GE Healthcare)在PBS中或在20mM组氨酸缓冲液(包含150mM NaCl)(pH 6.0)中将聚集蛋白质与单体抗体分离。将单体抗体级分合并,使用例如MILLIPORE Amicon Ultra(30MWCO)离心浓缩器浓缩(若需要),冷冻并储存在-20℃或-80℃下。提供样品的部分以例如通过SDS-PAGE、尺寸排阻色谱(SEC)或质谱法来进行后续的蛋白质分析和分析表征。
SDS-PAGE
根据制造商的说明使用预制凝胶系统(Invitrogen)。特别地,使用10%或4-12%/>Bis-TRIS预制凝胶(pH 6.4)和/>MES(还原凝胶,具有/>抗氧化剂电泳缓冲添加剂)或MOPS(非还原凝胶)电泳缓冲液。
CE-SDS
使用微流体Labchip技术(PerkinElmer,美国)通过CE-SDS分析纯度和抗体完整性。因此,使用HT Protein Express试剂盒根据制造商的说明制备5μl抗体溶液用于CE-SDS分析,并使用HT Protein Express芯片在Labchip GXII系统上进行分析。使用Labchip GX软件分析数据。
分析型尺寸排阻色谱法
通过HPLC色谱法执行用于测定抗体的聚集和寡聚状态的尺寸排阻色谱法(SEC)。简而言之,将蛋白A纯化的抗体施加至Dionex系统(Thermo FischerScientific)上的300mM NaCl、50mM KH2PO4/K2HPO4缓冲液(pH 7.5)中的Tosoh TSKgelG3000SW柱,或施加至Dionex HPLC系统上的2x PBS中的Superdex 200柱(GE Healthcare)。通过UV吸光度和峰面积积分来定量洗脱的抗体。将BioRad凝胶过滤标准品151-1901用作标准品。
质谱法
本节描述了对双特异性的表征,重点在于其正确装配。通过对脱糖基化的完整抗体以及在脱糖基化/限制性LysC消化抗体的特定情况下进行电喷雾电离质谱(ESI-MS)来分析预期的一级结构。
在37℃下以1mg/ml的蛋白质浓度将抗体用磷酸盐或Tris缓冲液中的N-糖苷酶F脱糖基化至多17h。限制性LysC(Roche Diagnostics GmbH,Mannheim,德国)消化用Tris缓冲液(pH 8)中的100μg脱糖基化的抗体分别在室温执行120小时或在37℃执行40min。在质谱法之前,将样品经由HPLC在Sephadex G25柱(GE Healthcare)上脱盐。在配备有TriVersaNanoMate源(Advion)的maXis 4G UHR-QTOF MS系统(Bruker Daltonik)上经由ESI-MS来测定总质量。
实例1:鉴定诱导仓鼠XBP1 mRNA中外显子的剪接跳跃,使XBP1蛋白模拟物以类似于自然加工的XBP1蛋白的方式运行的寡核苷酸。
CHOK1细胞获自ATCC细胞库,并根据ATCC指南进行生长和维持。测试了与XBP1mRNA NM_001244047.1的外显子4的周围区域互补的40个ASO诱导外显子4进行外显子跳跃的能力。
将5000个细胞(CHOK1细胞)接种在96孔板中,6小时后,将ASO以5μM和25μM的终浓度直接添加到细胞培养基中。6天后培养和收获细胞,并使用来自Qiagen的RNeasy 96孔试剂盒根据制造商的说明分离总RNA。
使用来自Biorad的用于RT-qPCR的iScriptTM高级cDNA合成试剂盒生成cDNA。使用来自Biorad的QX200 ddPCR系统以及来自Biorad的自动液滴发生器AutoDG,通过液滴数字PCR测量相对mRNA表达。
使用来自Biorad的ddPCR探针超混物(无UTP)根据制造商的说明进行PCR。
以下引物和探针用于测量含外显子4的外显子跳跃的mRNA量(XBP1Δ4测定)和含外显子4和5的正常连接的mRNA量(XBP1WT)均购自IDT technologies。XBP1 WT测定检测到IRE-1处理和未处理的mRNA二者。
XBP1WT测定:
引物2(GTTCCTCCAGATTGGCAG)
引物1(CCAGGAGTTAAGAACTCGC)
探针/HEX/CGGAGTCCA/ZEN/AGGGAAATGGAGTA/3IABkFQ/
XBP1Δ4测定:
引物2(GTTCCTCCAGATTGGCAG)
引物1(CCAGGAGTTAAGAACTCGC)
/56-FAM/CGGAGTCCA/ZEN/AGTCTGATATCCTTTTG/3IABkFQ/
使用来自biorad的QuantaSoft Analysis Pro软件分析数据。含有外显子4跳跃的mRNA的百分位数通过(concΔ4/(concΔ4+concWT))*100计算。含外显子4跳跃的mRNA的正常百分位数根据仅用PBS处理的14个对照孔的平均值计算。PBS孔的平均值为0.6%。数据如表2所示。
表2:含外显子4跳跃的Xbp1 mRNA百分比。
/>
实例2:鉴定诱导仓鼠XBP1 mRNA中外显子的剪接跳跃,使XBP1蛋白模拟物以类似于自然加工的XBP1蛋白的方式运行,现在具有覆盖外显子4附近的更多序列的扩展文库的ASO。
CHOK1细胞获自ATCC细胞库,并根据ATCC指南进行生长和维持。测试了与XBP1mRNA NM_001244047.1的外显子4的周围区域互补的251个ASO诱导外显子4进行外显子跳跃的能力。
将3000个细胞(CHOK1细胞)接种在96孔板中,24小时后,将ASO以5μM和25μM的终浓度直接添加到细胞培养基中。6天后收获细胞,并使用来自Qiagen的RNeasy 96孔试剂盒根据制造商的说明分离总RNA。
使用来自Biorad的用于RT-qPCR的iScriptTM高级cDNA合成试剂盒生成cDNA。使用来自Biorad的QX200 ddPCR系统以及来自Biorad的自动液滴发生器AutoDG,通过液滴数字PCR测量相对mRNA表达。
使用来自Biorad的ddPCR探针超混物(无UTP)根据制造商的说明进行PCR。
以下引物和探针用于测量含外显子4的外显子跳跃的mRNA量(XBP1Δ4测定)和含外显子4和5的正常连接的mRNA量(XBP1 WT)均购自IDT technologies。XBP1 WT测定检测到IRE-1处理和未处理的mRNA二者。
XBP1 WT测定:
引物2(GTTCCTCCAGATTGGCAG)
引物1(CCAGGAGTTAAGAACTCGC)
探针/HEX/CGGAGTCCA/ZEN/AGGGAAATGGAGTA/3IABkFQ/
XBP1Δ4测定:
引物2(GTTCCTCCAGATTGGCAG)
引物1(CCAGGAGTTAAGAACTCGC),
/56-FAM/CGGAGTCCA/ZEN/AGTCTGATATCCTTTTG/3IABkFQ/
使用来自Biorad的QuantaSoft Analysis Pro软件分析数据。含有外显子4跳跃的mRNA的百分位数通过(concΔ4/(concΔ4+concWT))*100计算。含外显子4跳跃的mRNA的正常百分位数根据仅用PBS处理的170个对照孔的平均值计算。PBS孔的平均值为0.1%。数据如表3所示。
表3:2文库的含外显子4跳跃的Xbp1 mRNA百分比。
/>
/>
/>
/>
/>
/>
/>
实例3-鉴定诱导小鼠XBP1 mRNA中外显子的剪接跳跃,使XBP1蛋白模拟物以类似于自然加工的XBP1蛋白的方式运行的ASO。
Ltk-11(CRL-10422TM)细胞获自ATCC细胞库,并根据ATCC指南生长和维持。测试了与XBP1 mRNA NM_013842.3(SeqID 2)的外显子4的周围区域互补的102个ASO诱导外显子4进行外显子跳跃的能力。
将2000个细胞(LTK细胞)接种在96孔板中,24小时后,将ASO以5uM和25uM的终浓度直接添加到细胞培养基中。3天后收获细胞,并使用来自Qiagen的RNeasy 96孔试剂盒根据制造商的说明分离总RNA。
使用来自Biorad的用于RT-qPCR的iScriptTM高级cDNA合成试剂盒生成cDNA。使用来自Biorad的QX200 ddPCR系统以及来自Biorad的自动液滴发生器AutoDG,通过液滴数字PCR测量相对mRNA表达。使用来自biorad的ddPCR探针超混物(无UTP)根据制造商的说明进行PCR。
以下引物和探针用于测量含外显子4的外显子跳跃的mRNA量(XBP1Δ4测定)和含外显子4和5的正常连接的mRNA量(XBP1 WT)均购自IDT technologies。XBP1 WT测定检测到IRE-1处理和未处理的mRNA二者。
XBP1 WT测定:
引物2(AGG GTC CAA CTT GTC C)
引物1(CTG GAT CCT GAC GAG GTT C)
探针/5HEX/CTT ACT CCA/ZEN/CTC CCC TTG GCC TCC A/3IABkFQ/
XBP1Δ4测定:
引物2(AGG GTC CAA CTT GTC C)
引物1(CTG GAT CCT GAC GAG GTT C)
/56-FAM/CCC AAA AGG/ZEN/ATA TCA GAC TTG GCC TCC A/3IABkFQ/
使用来自biorad的QuantaSoft Analysis Pro软件分析数据。含有外显子4跳跃的mRNA的百分位数通过(concΔ4/(concΔ4+concWT))*100计算。含外显子4跳跃的mRNA的正常百分位数根据仅用PBS处理的61个对照孔的平均值计算。PBS孔的平均值是0.37%,标准偏差是0.17。数据如表4所示。
表4:XBP1外显子4剪接跳跃百分比
/>
/>
/>
实例4:鉴定诱导人XBP1 mRNA中外显子的剪接跳跃,使XBP1蛋白模拟物以类似于自然加工的XBP1蛋白的方式运行的ASO。
A459细胞获自ATCC细胞库,并根据ATCC指南进行生长和维持。测试了与XBP1 mRNANM_005080.4(SeqID 2)的外显子4的周围区域互补的100个ASO诱导外显子4进行外显子跳跃的能力。
将4000个A549细胞接种在96孔板中,24小时后,将ASO以25μM的终浓度直接添加到细胞培养基中。3天后收获细胞,并使用来自Qiagen的RNeasy 96孔试剂盒根据制造商的说明分离总RNA。
使用来自Biorad的用于RT-qPCR的iScriptTM高级cDNA合成试剂盒生成cDNA。使用来自Biorad的QX200 ddPCR系统以及来自Biorad的自动液滴发生器AutoDG,通过液滴数字PCR测量相对mRNA表达。
使用来自biorad的ddPCR探针超混物(无UTP)根据制造商的说明进行PCR。
以下引物和探针用于测量含外显子4的外显子跳跃的mRNA量(XBP14测定)和含外显子4和5的正常连接的mRNA量(XBP1 WT)均购自IDT technologies。XBP1 WT测定检测到IRE-1处理和未处理的mRNA二者。
XBP1WT测定:
引物2(CTG GGT CCA AGT TGT CCA GA)
引物1(ATG CCC TGG TTG CTG AAG)
探针/5HEX/TCA CTT CAT/ZEN/TCC CCT TGG CTT CCG C/3IABkFQ/
XBP1Δ4测定:
引物2(CTG GGT CCA AGT TGT CCA GA)
引物1(ATG CCC TGG TTG CTG AAG)
/56-FAM/CCA ACA GGA/ZEN/TAT CAG ACT TGG CTT CCG C/3IABkFQ/
使用来自biorad的QuantaSoft Analysis Pro软件分析数据。含有外显子4跳跃的mRNA的百分位数通过(concΔ4/(concΔ4+concWT))*100计算。含外显子4跳跃的mRNA的正常百分位数根据仅用PBS处理的40个对照孔的平均值计算。PBS孔的平均值是0.03%,标准偏差是0.05。数据如表5所示。
表5:XBP1外显子4跳跃百分比
/>
/>
实例5:用于靶向整合的质粒产生
通常,为了构建用于RMCE的质粒,将抗体轻链和重链的相应表达盒克隆到侧翼是L3和LoxFas序列的第一载体骨架和侧翼是LoxFas和2L序列且还进一步包括选择标志物的第二载体骨架中。将Cre重组酶质粒(参见例如Wong,E.T.等人,Nucl.Acids Res.33(2005)e147;O'Gorman,S.等人,Proc.Natl.Acad.Sci.USA 94(1997)14602-14607)用于所有RMCE过程。
通过基因合成(Geneart,生命技术有限公司)产生编码相应的多肽的cDNA。在37℃下用HindIII-HF和EcoRI-HF(NEB)将合成cDNA和骨架载体消化1小时,并且通过琼脂糖凝胶电泳分离。从琼脂糖凝胶切下分别包含插入物和骨架的DNA片段的段,并且通过QIAquick凝胶提取试剂盒(Qiagen)提取。经纯化的插入物片段和骨架片段经由快速连接试剂盒(RocheDiagnostics GmbH,Mannheim,德国),按照制造商的方案以3:1的插入物/骨架比率连接。然后经由热激将连接方法转化到感受态大肠杆菌DH5α中,并且在37℃下温育1小时。之后将细胞铺板在含有氨苄青霉素的琼脂平板上以供选择。在37℃下将平板温育过夜。
第二天,挑取克隆并且在37℃下振荡温育过夜,以进行最小量制备或最大量制备,这两种制备分别是用5075(Eppendorf)或QIAprep Spin Mini-Prep试剂盒(Qiagen)/NucleoBond Xtra Maxi EF试剂盒(Macherey&Nagel)来进行的。对所有构建体进行测序以确保序列的正确性。
在第二个克隆步骤中,用KpnI-HF/SalI-HF和SalI-HF/MfeI-HF消化生成的载体,条件与上面的描述相同。用KpnI-HF和MfeI-HF消化相应的RMCE(TI)骨架载体。如上进行分离和提取。按照制造方案,使用T4 DNA连接酶(NEB)以1:1:1的插入物/插入物/骨架比在4℃下过夜,来将经纯化的插入物和骨架连接。之后在65℃下灭活连接酶10min。如上进行以下步骤。
实例6:通过靶向整合产生稳定的细胞系
在TI着陆位点包含GFP表达盒的CHO TI宿主细胞在标准加湿条件(95%rH、37℃和5%CO2)下以150rpm的恒定搅拌速率下,在DMEM/F12基础培养基中,在一次性125ml通风摇瓶中繁殖。每3-4天将细胞以3x10E5个细胞/ml的浓度接种在含有有效浓度的选择标志物1和选择标志物2的化学成分确定的培养基中。用Cedex HiRes细胞计数器(F.Hoffmann-LaRoche Ltd,Basel,Switzerland)测量培养物的密度和活力。
为了稳定转染,将等摩尔量的根据实例5生成的第一和第二载体混合。每5μg的混合物添加1μg编码Cre的核酸,即将5μg Cre表达质粒或Cre mRNA添加到25μg的载体混合物中。
转染前两天将TI宿主细胞以约4x10E5个细胞/ml的密度接种在新鲜培养基中。根据制造商的方案,使用Nucleofector Kit V(Lonza,Switzerland)通过Nucleofector装置进行转染。用总共30μg核酸混合物(即用30μg质粒(5μg Cre质粒和25μg载体混合物))转染3x10E7个细胞。转染后将细胞接种在不含选择剂的30ml的培养基中。
接种后第5天,将细胞离心并以6x10E5个细胞/ml的细胞密度转移到80mL化学成分确定的培养基中,该培养基含有用于选择重组细胞的有效浓度的选择剂1和选择剂2。从这一天开始,将细胞在37℃、150rpm、5%CO2和85%湿度下温育,没有分裂。定期监测培养物的细胞密度和活力。当培养物的活力再次开始增加时,选择剂1和2的浓度减少到之前使用量的大约一半。更详细地说,为了促进细胞的回收,如果活力>40%并且活细胞密度(VCD)>0.5×10E6细胞/mL,则降低选择压力。因此,将4x10E5个细胞/ml离心并且重悬在40ml选择性培养基II(化学成分确定的培养基,1/2选择标志物1和2)中。将细胞在与之前相同的条件下温育,并且也不分裂。
开始选择后十天,通过流式细胞术测量细胞内GFP和与细胞表面粘附的细胞外异源多肽的表达,检查RMCE是否成功。针对人抗体轻链和重链的APC抗体(别藻蓝蛋白标记的F(ab’)2片段山羊抗人IgG)用于FACS染色。使用BD FACS Canto II流式细胞仪(BD,Heidelberg,德国)进行流式细胞术。测量了每个样品的一万个事件。在前向散射(FSC)对侧向散射(SSC)图中对活细胞进行门控。活细胞门由未转染的TI宿主细胞定义,并通过使用FlowJo 7.6.5EN软件(TreeStar,Olten,Switzerland)应用于所有样品。在FITC通道中量化GFP的荧光(488nm激发,530nm检测)。在APC通道中测量抗体(645nm激发,660nm检测)。将亲本CHO细胞,即用于生成TI宿主细胞的那些细胞,用作关于GFP和抗体表达的阴性对照。选择开始后十四天,活力超过90%,视为选择完成。
实例7:FACS筛选
进行FACS分析以检查转染和RMCE效率。将转染方法的4×10E5个细胞离心(1200rpm,4min),并且用1mL PBS洗涤两次。在用PBS进行的洗涤步骤之后,将沉淀物重悬于400μL PBS中并且转移到FACS管(带细胞滤网帽的圆底试管;Corning)中。使用FACS Canto II进行测量,并且通过软件FlowJo分析数据。
实例8:添加LNA的补料分批培养
所有补料分批培养均在含有相同的专有无血清、化学成分确定的培养基的摇瓶或Ambr15容器(Sartorius Stedim)中并且在相同的培养和补料条件下进行。
本实例中使用的重组哺乳动物细胞根据实例6中描述的程序获得并表达异源抗体(蛋白质1:抗体多聚体融合体)。
细胞培养过程由以下组成:种子序列培养,接着是接种培养(N-2和N-1培养;预发酵)和主发酵(N)。Ambr15的种子和接种序列在摇瓶中进行,每3或4天进行一次细胞分裂。
由于在初始研究中用这些反义寡核苷酸观察到高水平的外显子4跳跃,因此选择SEQ ID NO 23和SEQ ID NO 24的反义寡核苷酸作为LNA(参见实例1)。
以在13ml的总体积中约2*10E6个细胞/ml的起始细胞密度进行在Ambr15中的(主)培养(N)。控制培养温度,N2加气速率设定为恒定,经由PID控制器调节供氧以保持恒定的DO,搅拌速率设定为1200rpm至1400rpm(下搅拌),pH设定为pH 7.0。通过添加1M的碳酸钠溶液或将CO2喷入生物反应器来进行PH控制。每隔一天使用Ambr15的集成分析模块重新校准生物反应器的pH点。接种前一天和培养期间每天添加消泡剂。在14天的补料分批过程中培养细胞,其中在预先确定的时间点以团注形式添加葡萄糖对照和两种不同的补料。使用Cedex HiRes(Roche Diagnostics GmbH,Mannheim,Germany)近线进行细胞计数和活力测量。使用Cedex Bio HT分析仪(Roche Diagnostics GmbH)测量产物和代谢物浓度。
在N-1预培养开始时(N-1)、接种日(d0)或接种后三天(d3)的LNA添加由Ambr15的液体处理系统添加确定体积的高浓度LNA储备溶液进行。
在分批补料开始后14天,通过离心(10min,1000rpm,以及10min,4000rpm)收获上清液,并且通过过滤(0.22μm)使其澄清。第14天的滴度使用具有UV检测的蛋白A亲和色谱确定。产品质量由Caliper的Labchip(Caliper Life Sciences)测量。
看起来似乎任何效率的LNA外显子4跳跃都足以生成增加重组滴度的效果。
表6:Ambr15中14天的补料分批培养结果;N-1=在预发酵开始时添加LNA;d0=在第0天添加LNA,即在主发酵开始时添加LNA;d3=在主发酵的第3天添加LNA。
实例9:具有稳定XBP1Δ4表达的补料分批培养——比较例
所有补料分批培养均在含有相同的专有无血清、化学成分确定的培养基的摇瓶或Ambr15容器(Sartorius Stedim)中进行。
细胞培养过程由以下组成:种子序列培养,接着是接种培养(N-2和N-1培养;预发酵)和主发酵(N)。Ambr15的种子和接种序列在摇瓶中进行,每3或4天进行一次细胞分裂。
本实例中使用的重组哺乳动物细胞根据实例6中描述的程序获得并稳定表达异源抗体以及具有如SEQ ID NO:7所示的氨基酸序列的XBP1剪接变体XBP1Δ4。
以在13ml的总体积中约2*10E6个细胞/ml的起始细胞密度进行在Ambr15中的(主)培养(N)。控制培养温度,N2加气速率设定为恒定,经由PID控制器调节供氧以保持恒定的DO,搅拌速率设定为1200rpm至1400rpm(下搅拌),pH设定为pH 7.0。通过添加1M的碳酸钠溶液或将CO2喷入生物反应器来进行PH控制。每隔一天使用Ambr15的集成分析模块重新校准生物反应器的pH点。接种前一天和培养期间每天添加消泡剂。在14天的补料分批过程中培养细胞,其中在预先确定的时间点以团注形式添加葡萄糖对照和两种不同的补料。使用Cedex HiRes(Roche Diagnostics GmbH,Mannheim,Germany)近线进行细胞计数和活力测量。使用Cedex Bio HT分析仪(Roche Diagnostics GmbH)测量产物和代谢物浓度。
在分批补料开始后14天,通过离心(10min,1000rpm,以及10min,4000rpm)收获上清液,并且通过过滤(0.22μm)使其澄清。第14天的滴度使用具有UV检测的蛋白A亲和色谱确定。产品质量由Caliper的Labchip(Caliper Life Sciences)测量。
表7:用抗体(蛋白质1:抗体多聚体融合体)和编码XBP1Δ4变体的核酸稳定转染的重组哺乳动物CHO细胞在Ambr15中14天的补料分批培养的结果。exp.=实验编号,eff.titer=有效滴度(通过毛细管电泳或SEC确定的滴度和主峰的乘积),rel.eff.titer=相对有效滴度(标准化至exp.1的相对滴度)
实例10:添加LNA的补料分批培养
本文也使用与上述实例8中所述相同的补料分批培养条件。当前的实例10与实例8的唯一区别在于表达的蛋白质和LNA的添加时间。
同样,本实例中使用的重组CHO细胞用根据实例6的方法获得。
蛋白质1:抗体多聚体融合体
池数据:
单克隆数据
蛋白质2:双特异性三价抗体,其包含与人A-β蛋白结合的全长抗体和具有与人转铁蛋白受体结合的结构域交换的额外重链C末端Fab片段(参见WO 2017/055540)
单克隆数据
蛋白质3:具有结构域交换的四价双特异性抗体
单克隆数据
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
序列
仓鼠
SEQ ID 1:仓鼠XBP1基因
ATGGTGGTGGTGGCAGCGTCGCCGAGCGCGGCCACGGCGGCCCCGAAAGTACTGCTTCTATCGGGCCAGCCCGCCGCGGACGGCCGGGCGCTGCCACTCATGGTTCCAGGCTCGCGGGCAGCAGGGTCCGAGGCGAACGGGGCGCCACAGGCTCGCAAGCGGCAGCGCCTCACGCACCTGAGCCCGGAGGAGAAGGCGCTGCGGAGgtgggctcggcgggcggggcggcaaggccgggcatgggaccctttctcgtgtggcggtcgggagggctctgtggggtggcgtagatgagcctctagtacctatttctggagggaggcacggagctgaggtgacagcccctccgaaggtctgcttagtctgtgtcggggagtctaacacttgtcagacgggacctgacgctcagccctctgtgaatgcttgctcttcttggaggacccatggcagggtccgctctggctgttgttgcagccgcttgggaacttaacactgggatccgagtcaccatcctccggcagcccgagttgagcttggggagggacggttggtagcgcccccgccgccttcacggagcctgttggacagaatcggaactagaaagccgcgggggaggagggaagatgcttatgacgcaacgggaatgtgtgtcagcccggtggtaaaataagactcgagtggacagcaacatgggagagaatcgagcaagtcttcaaggcccacgggcagaaaagctgtggtttttgtctttttgagaggaggagcctcagaatgtgtttaccactgtttagtcttattctgtaaagtcagcgaaagcaccagctggccacatttacaaatgaagatacaggaaagctgaagatgactcggttcgttatgtgccctgtcttccttcagGAAACTGAAAAACAGAGTAGCAGCGCAGACTGCCCGAGATCGAAAGAAAGCCCGGATGAGCGAGCTGGAACAGCAAGTGGTGGATTTGGAAGAAGAGgtaaagggatttaaggccatgctttcttctctgcccattctaagctgctgcagccctttagaatacaactaaagtgccatttaaagtttaactagcttagcagataggtggtgaaggcagacatgactcactcctgacagctagatactatcgatagaagttgctcagagattagccaggtcagatagatcctggcttaaccttcagtactcttgctcttgccaaaggctcactagaattgccttccttctagggttctcttgttatctaatctgagcaagggctattgttttaaaagttttaatcatcagctggttcttagaagaaatgtgggtcatatcagtagcagtttaaaaaaaatattttgttaggtatagcccaccattcccactttgtttttatactcagcatacagagtattaggacattttcaaacagcgtgttttagttaattgattcttcctgccattttccctacacccccagtatccttttaccttctcttggacttctagttgttttttaaggccttacacacatttacatccattcatatgcattcacactctcacacacagtaaggtctacatatgcaagaaactcttggttctgtttgggccacctcacttaaaatatttaacaaatctacacatcttcctgccaacttctattttctttatagccgagtaacattcttctgtgcacatgtaccatattttcatctgtttcattggtgtctcccaattgctggtgttacaggcatgagccacccatgctagttttatgtagagctggaggctgaacccagggcttcatgtgtagtagggcaagcactcttaccaactgatctacaccattagccaccagtgttgcaacagttatgaacgactgcatatgcacagaatttatcagttcaatgaggaaaccaactgtaacaaatcacg
ttttaatagcctcttctggattttcttacagAACCAAAAACTTCTGTTAGAAAATCAGCTTT
TGAGAGAGAAAACTCATGGCCTTGTAATTGAGAACCAGGAGTTAAGA
ACTCGCTTGGGAATGGATGTGCTGACTACTGAAGAGGCTCCAGAGAC
GGAGTCCAAGgtaaatcttatgagacttggttgtgacatgaacggattgtatttgtgatcccaacctctatcaa
gccttccttttctcttttccttcttttgagacagggtcttaatttcttaattttggatggtcttgaaattgtatcagttttatggcct
ctgcctccaaagtaatggaactagacatgtgccaccatgcctagctgatcagtcttgaaaatttctccacatttccaaca
gacctgttcagtcttcagtgactcattcttcaagtgtgtaatgaagtgttactaagccctaataatcctaataatttacatag
ctctctcagaataagtgctaacaccagtagccagcaagctataccatgcaggcatcaaatagaatgagactgtaagg
gctagtcagatttgggagattttgatcttgttttgagacagagtctctgtatataattaacccaggttggctttggactcatc
ctctggccatagcctcccaggtgctgggattttaggcactacaattggcttgtttcctggacttttgacagccctcatgtg
gcctaggttggtcttaaacttgatatgttagctgataattctgtctctgctttccaagtgttaagatacgggcacatactact
ttatctggcggagttatgtaggcatggtgtttgtgtacatgagtatcttactaaatctggagctaggctggtggctagca
aatcctggtgatcctcttgtctctgtctccctcagtgttggggttatacaggcacaactgtcatgctccaaattttacattg
atgcttgcctaacaagcaggcttatgctctgagccacctcccatagcctggtgtgcatttccttggagtgttccctcactt
tggtctttccttccagGGAAATGGAGTAAGGCCGGTGGCCGGGTCTGCTGAGTC
CGCAGcactcagactacgtgcacctctgcagCAGGTGCAGGCCCAGTTGTCACCTCCC
CAGAACATCTTCCCATGGATTCTGACACTGTTGACTCTTCAGACTCCG
AGgtagagcttgtttgccttactaaagcactgtgtaagattggctcattctgtagtatatatatgatgtgtgacatgccta
gccaggcaaatggagaaagaagttagtattggtagggttaggggtaagcagtcactttcttaatttccagtggtttagg
tcatggagtcgggagaagctgttctgatgggtgtgtccttcgatctgacagcataaggcctaactgacattgtggaact
cagtactaagtgtttctggtagaccatcacattctaatagtgaactttttttgtcttacctcttgcagTCTGATATC
CTTTTGGGCATTCTGGACAAGTTGGACCCTGTCATGTTTTTCAAATGTC
CATCCCCAGAGTCTGCCAATCTGGAGGAACTCCCAGAGGTCTACCCAG
GACCTAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACCTCATC
AGCCAAGCTGGAAGCCATTAATGAACTCATTCGCTTTGACCATGTATA
CACCAAGCCTCTAGTCTTAGAGATCCCTTCTGAGACAGAGAGTCAAAC
TAATGTGGTAGTGAAAATTGAGGAAGCACCTCTCAGCTCTTCAGAGGA
GGATCACCCTGAATTCATTGTCTCAGTGAAGAAAGAACCTTTGGAAGA
AGACTTCATTCCAGAGCCGGGCATCTCAAACCTGCTTTCATCCAGCCA
CTGTCTGAAACCATCTTCCTGCCTGCTGGATGCTTATAGTGACTGTGGATATGAGGGCTCCCCTTCTCCCTTCAGTGACATGTCTTCTCCACTTGGTATAGACCATTCTTGGGAGGACACTTTTGCCAATGAACTCTTTCCCCAGCTAATTAGTGTCTAA
SEQ ID 2:仓鼠Xbp1-202(Xbp-1u)
ATGGTGGTGGTGGCAGCGGCGCCGAGCGCGGCCACGGCGGCCCCGAAAGTACTGCTTCTATCGGGCCAGCCCGCCGCGGACGGCCGGGCGCTGCCACTCATGGTTCCAGGCTCGCGGGCAGCAGGGTCCGAGGCGAACGGGGCGCCACAGGCTCGCAAGCGGCAGCGCCTCACGCACCTGAGCCCGGAGGAGAAGGCGCTGCGGAGGAAACTGAAAAACAGAGTAGCAGCGCAGACTGCCCGAGATCGAAAGAAAGCCCGGATGAGCGAGCTGGAACAGCAAGTGGTGGATTTGGAAGAAGAGAACCAAAAACTTCTGTTAGAAAATCAGCTTTTGAGAGAGAAAACTCATGGCCTTGTAATTGAGAACCAGGAGTTAAGAACTCGCTTGGGAATGGATGTGCTGACTACTGAAGAGGCTCCAGAGACGGAGTCCAAGGGAAATGGAGTAAGGCCGGTGGCCGGGTCTGCTGAGTCCGCAGCACTCAGACTACGTGCACCTCTGCAGCAGGTGCAGGCCCAGTTGTCACCTCCCCAGAACATCTTCCCATGGATTCTGACACTGTTGACTCTTCAGACTCCGAGTCTGATATCCTTTTGGGCATTCTGGACAAGTTGGACCCTGTCATGTTTTTCAAATGTCCATCCCCAGAGTCTGCCAATCTGGAGGAACTCCCAGAGGTCTACCCAGGACCTAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACCTCATCAGCCAAGCTGGAAGCCATTAATGAACTCATTCGCTTTGACCATGTATACACCAAGCCTCTAGTCTTAGAGATCCCTTCTGAGACAGAGAGTCAAACTAATGTGGTAGTGAAAATTGAGGAAGCACCTCTCAGCTCTTCAGAGGAGGATCACCCTGAATTCATTGTCTCAGTGAAGAAAGAACCTTTGGAAGAAGACTTCATTCCAGAGCCGGGCATCTCAAACCTGCTTTCATCCAGCCACTGTCTGAAACCATCTTCCTGCCTGCTGGATGCTTATAGTGACTGTGGATATGAGGGCTCCCCTTCTCCCTTCAGTGACATGTCTTCTCCACTTGGTATAGACCATTCTTGGGAGGACACTTTTGCCAATGAACTCTTTCCCCAGCTAATTAGTGTCTAA
SEQ ID 3:来自SEQ ID 2的仓鼠预测蛋白
MVVVAAAPSAATAAPKVLLLSGQPAADGRALPLMVPGSRAAGSEANGAPQARKRQRLTHLSPEEKALRRKLKNRVAAQTARDRKKARMSELEQQVVDLEEENQKLLLENQLLREKTHGLVIENQELRTRLGMDVLTTEEAPETESKGNGVRPVAGSAESAALRLRAPLQQVQAQLSPPQNIFPWILTLLTLQTPSLISFWAFWTSWTLSCFSNVHPQSLPIWRNSQRSTQDLVPYQPPFLCQWGPHQPSWKPLMNSFALTMYTPSL
SEQ ID 4:仓鼠Xbp1-201(Xbp-1s)
ATGGTGGTGGTGGCAGCGTCGCCGAGCGCGGCCACGGCGGCCCCGAAAGTACTGCTTCTATCGGGCCAGCCCGCCGCGGACGGCCGGGCGCTGCCACTCATGGTTCCAGGCTCGCGGGCAGCAGGGTCCGAGGCGAACGGGGCGCCACAGGCTCGCAAGCGGCAGCGCCTCACGCACCTGAGCCCGGAGGAGAAGGCGCTGCGGAGGAAACTGAAAAACAGAGTAGCAGCGCAGACTGCCCGAGATCGAAAGAAAGCCCGGATGAGCGAGCTGGAACAGCAAGTGGTGGATTTGGAAGAAGAGAACCAAAAACTTCTGTTAGAAAATCAGCTTTTGAGAGAGAAAACTCATGGCCTTGTAATTGAGAACCAGGAGTTAAGAACTCGCTTGGGAATGGATGTGCTGACTACTGAAGAGGCTCCAGAGACGGAGTCCAAGGGAAATGGAGTAAGGCCGGTGGCCGGGTCTGCTGAGTCCGCAGCAGGTGCAGGCCCAGTTGTCACCTCCCCAGAACATCTTCCCATGGATTCTGACACTGTTGACTCTTCAGACTCCGAGTCTGATATCCTTTTGGGCATTCTGGACAAGTTGGACCCTGTCATGTTTTTCAAATGTCCATCCCCAGAGTCTGCCAATCTGGAGGAACTCCCAGAGGTCTACCCAGGACCTAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACCTCATCAGCCAAGCTGGAAGCCATTAATGAACTCATTCGCTTTGACCATGTATACACCAAGCCTCTAGTCTTAGAGATCCCTTCTGAGACAGAGAGTCAAACTAATGTGGTAGTGAAAATTGAGGAAGCACCTCTCAGCTCTTCAGAGGAGGATCACCCTGAATTCATTGTCTCAGTGAAGAAAGAACCTTTGGAAGAAGACTTCATTCCAGAGCCGGGCATCTCAAACCTGCTTTCATCCAGCCACTGTCTGAAACCATCTTCCTGCCTGCTGGATGCTTATAGTGACTGTGGATATGAGGGCTCCCCTTCTCCCTTCAGTGACATGTCTTCTCCACTTGGTATAGACCATTCTTGGGAGGACACTTTTGCCAATGAACTCTTTCCCCAGCTGATTAGTGTCTAA
SEQ ID 5:来自SEQ ID 4的仓鼠预测蛋白
MVVVAASPSAATAAPKVLLLSGQPAADGRALPLMVPGSRAAGSEANGAPQARKRQRLTHLSPEEKALRRKLKNRVAAQTARDRKKARMSELEQQVVDLEEENQKLLLENQLLREKTHGLVIENQELRTRLGMDVLTTEEAPETESKGNGVRPVAGSAESAAGAGPVVTSPEHLPMDSDTVDSSDSESDILLGILDKLDPVMFFKCPSPESANLEELPEVYPGPSSLPASLSLSVGTSSAKLEAINELIRFDHVYTKPLVLEIPSETESQTNVVVKIEEAPLSSSEEDHPEFIVSVKKEPLEEDFIPEPGISNLLSSSHCLKPSSCLLDAYSDCGYEGSPSPFSDMSSPLGIDHSWEDTFANELFPQLISV
SEQ ID 6:仓鼠XBP1Δ4
ATGGTGGTGGTGGCAGCGGCGCCGAGCGCGGCCACGGCGGCCCCGAAAGTACTGCTTCTATCGGGCCAGCCCGCCGCGGACGGCCGGGCGCTGCCACTCATGGTTCCAGGCTCGCGGGCAGCAGGGTCCGAGGCGAACGGGGCGCCACAGGCTCGCAAGCGGCAGCGCCTCACGCACCTGAGCCCGGAGGAGAAGGCGCTGCGGAGGAAACTGAAAAACAGAGTAGCAGCGCAGACTGCCCGAGATCGAAAGAAAGCCCGGATGAGCGAGCTGGAACAGCAAGTGGTGGATTTGGAAGAAGAGAACCAAAAACTTCTGTTAGAAAATCAGCTTTTGAGAGAGAAAACTCATGGCCTTGTAATTGAGAACCAGGAGTTAAGAACTCGCTTGGGAATGGATGTGCTGACTACTGAAGAGGCTCCAGAGACGGAGTCCAAGTCTGATATCCTTTTGGGCATTCTGGACAAGTTGGACCCTGTCATGTTTTTCAAATGTCCATCCCCAGAGTCTGCCAATCTGGAGGAACTCCCAGAGGTCTACCCAGGACCTAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACCTCATCAGCCAAGCTGGAAGCCATTAATGAACTCATTCGCTTTGACCATGTATACACCAAGCCTCTAGTCTTAGAGATCCCTTCTGAGACAGAGAGTCAAACTAATGTGGTAGTGAAAATTGAGGAAGCACCTCTCAGCTCTTCAGAGGAGGATCACCCTGAATTCATTGTCTCAGTGAAGAAAGAACCTTTGGAAGAAGACTTCATTCCAGAGCCGGGCATCTCAAACCTGCTTTCATCCAGCCACTGTCTGAAACCATCTTCCTGCCTGCTGGATGCTTATAGTGACTGTGGATATGAGGGCTCCCCTTCTCCCTTCAGTGACATGTCTTCTCCACTTGGTATAGACCATTCTTGGGAGGACACTTTTGCCAATGAACTCTTTCCCCAGCTAATTAGTGTCTAA
SEQ ID 7:来自SEQ ID 6的仓鼠预测蛋白
MVVVAAAPSAATAAPKVLLLSGQPAADGRALPLMVPGSRAAGSEANGAPQARKRQRLTHLSPEEKALRRKLKNRVAAQTARDRKKARMSELEQQVVDLEEENQKLLLENQLLREKTHGLVIENQELRTRLGMDVLTTEEAPETESKSDILLGILDKLDPVMFFKCPSPESANLEELPEVYPGPSSLPASLSLSVGTSSAKLEAINELIRFDHVYTKPLVLEIPSETESQTNVVVKIEEAPLSSSEEDHPEFIVSVKKEPLEEDFIPEPGISNLLSSSHCLKPSSCLLDAYSDCGYEGSPSPFSDMSSPLGIDHSWEDTFANELFPQLISV
小鼠
SEQ ID 590:小鼠XBP1基因
CTAGGGTAAAACCGTGAGACTCGGTCTGGAAATCTGGCCTGAGAGGACAGCCTGGCAATCCTCAGCCGGGGTGGGGACGTCTGCCGAAGATCCTTGGACTCCAGCAACCAGTGGTCGCCACCGTCCATCCACCCTAAGGCCCAGTTTGCACGGCGGAGAACAGCTGTGCAGCCACGCTGGACACTCACCCCGCCCGAGTTGAGCCCGCCCCCGGGACTACAGGACCAATAAGTGATGAATATACCCGCGCGTCACGGAGCACCGGCCAATCGCGGACGGCCACGACCCTAGAAAGGCTGGGCGCGGCAGGAGGCCACGGGGCGGTGGCGGCGCTGGCGTAGACGTTTCCTGGCTATGGTGGTGGTGGCAGCGGCGCCGAGCGCGGCCACGGCGGCCCCCAAAGTGCTACTCTTATCTGGCCAGCCCGCCTCCGGCGGCCGGGCGCTGCCGCTCATGGTACCCGGTCCGCGGGCAGCAGGGTCGGAGGCGAGCGGGACACCGCAGGCTCGCAAGCGGCAGCGGCTCACGCACCTGAGCCCGGAGGAGAAAGCGCTGCGGAGGTGGGCCCGGCGGGCAAGGCTGGGGCGCGGGGCGGCAGGACTGGGATTGGGACTCTCTCGTGTGTGCCAGCTGGTGGGCTCCGTACGGTGGGTTAGATTCACCTCTAGTGTCTAACCTGGGAAGCGGAGCTGAGGGGGATGCCCCTCCGAAGGTCTGCGTCGGGGGTGTGTGCAGGAGCTCCCGACACAGGCACAGAAGAAGGTGCCCGACGCCCAGTCCTCTGTAAATGCTCGCTCTTTGTGGT
CGTAGGGTAGGAACCGCTCCAGCTGTCATTGCAGCCACTTGGGAACCC
CACCCTGGGAACCGAGTCCACAGCGTCCGGCATCCCGAGAGTTTGGCT
TGGGGAGGGACAGTTGGTAGCGTCCCCGCCGCCTTCACGGATATCGCT
CTAGCAAGGAGCCTGTGGGACGGAATTGGACCCAGAAAGTAGCGGGG
GAGGAGGGAAGAAGCATATGACGCAACGGGAATGTATCAGCCCGGTG
GTAAAATGAGATCCGGGTGGACAGCCGCACGGGAGAGAATCAAGCAA
GTCTTCAAGGCCTGTGGATAGAAAGCAGCGTGTGTATGCGTGTGCGTG
TGCGTTTTGATAGGAGCTTTAAGCGTGTTTACTTGCTAAGCCTTATTCT
GTAAAGTCAACGAAAGCACCAGCTGGCCACGTCTACAAATGAAGACA
CATGAAAGCTGGAGATGACTCAGTTATGTTCCCTGTCTCCTCCCCAAG
GAAACTGAAAAACAGAGTAGCAGCGCAGACTGCTCGAGATAGAAAG
AAAGCCCGGATGAGCGAGCTGGAGCAGCAAGTGGTGGATTTGGAAGA
AGAGGTAAAGGGACTTCAGGCCATGCTTTCATCCCATCCATATCAGGG
CCCATCCTAAACTGCTTCAGCCCTTTAGAATACAACCCAAAGTGCCAT
TTAAAGTTTAACCAGCCTAGCAGATAGGCCGTGAAAGCAGACGTGAC
TCACCCTGGCCTGCCCTCCCCTCGGAGATTAGCCAGGTTGGATAGATC
ATTGGTTGCTTAAGCTGTAGCGCCGCCTGTCTTTGCCAAAGGCTCACT
AACGCTGCCCTTCCTTCTGGGATCCCCCCCCCCCCGCGCGCCCCCAAT
CCTCCCACCCTCTGTATCCTTTCTGCTGTCAGTGCCCTTTTGTGCCCCTC
CACCCCGGCATCCTTTTACCCTTTGGGGAGTTATTTTAGTTTCTAAGTT
AAGTTTAGTTAACTTTAGCTATTTCTAGCGTTTCTAGGCATTGCCACAT
TTACGTCCATTTATATGCGCACGTGCGCCCTGGTTTGAGTTTGGGTCAC
CTCACTTTGTAATACACTTTCCAAATTTATACATTTTCCCTGCTAGTTT
CCTTTCTCTATACAGGCGAGTGGTACCTCACTGTGTGTGCACCCCACTT
TCACGGTTCTCTGGGCATCTGTGCTCAGCATCTAGGCTGCCACCATTTC
TTTGCCATTGGACCACTACCACTTGCACCAACACTTGCCATTTCAAGA
CAGGATGGTGAATTATTTAAAGATTATTTTTAGATAGGGTCTTAGGTT
GGCCTGTAACTCATGGCATGCCTCCTGTTTTACCATGCTGACATTACA
GGCAGTGAACCACCTTGCCATACTTTTTTTTTTTAAAGGTAGTGTATTA
ACACAACTGTAAATTCAAGCTGCAAGTGACCTTTTTTTTTGGCTGAAATCTGCGAGTAGTACTTGTAGGCATTATGTTGTTTCTGTCACCATTGAAAACACTTTTGTTTTCTTCAGAGATTGGCCTTGAATAAACTTGCTTCTCCCGCCTCAGCCTGCTTGAGTGTTCAATGGCATTTTTGGGGGGACAGCTTGATGTCTCCCAGGCTGTGCTCTAACTTGCTGTGTAGCCAAAGATGACCCCAAATTTGTTTCTCTTGCTGCTATGTCCCAGGTGCTGGGATTACAGTTTATGCAGAGCTGAAGATGGAGCCCAGGGCTGCAAGCCTGGGAGGGCAGGCCTTCTCCCAACTCCTCTGTCCCATTAGCCACCGGTGACAGAATGGCTGTGACCCGCACCAGCAGGGAAACAGCTGGAGCAGAACTTGCAGTGGATTCTTTAGTGACGGAACCACACGGTCTAACCGCACGGCCTCTTATGTGATTCCTTACAGAACCACAAACTCCAGCTAGAAAATCAGCTTTTACGGGAGAAAACTCACGGCCTTGTGGTTGAGAACCAGGAGTTAAGAACACGCTTGGGAATGGACACGCTGGATCCTGACGAGGTTCCAGAGGTGGAGGCCAAGGTAAGTATTGGGAGACCTGGCTGCAGCACTACCTGGCTGCAGGTTTGTGTTCTGGACCTCCAATCAAATCCTTTTCTCTTTTCCTTTATGAGACAAGGTCTTAATGTCTAATTTTGGCTGGTCTTGAACTTGTGTCAGTTCTTTTGCTTCTAAGTAGTAGGACTATAAGCACCTGCCCCTGTGCCTAGCTGAGGAATCCTGAATTTTCCCTGTTTCCTTGAACTAAACTTATGATCTTCTTGCCTTAGCCTTCCAAGCGCTGGAATTACATGCATGAACAAGTGGTTTGTTTCTTGGCTTTTTTGGGGGATAGGGTGTCATGTAGTCCAGGTTGGCCTCAAACTTGCTCTGTAGCTGATAATCCTACCTCCACCTTCCAGATGTTACCATTACAGGCAGATGTTCCTTTGTGTGGTTATGTAGGTGTGTATGTGTACATGGGTGTGGGTTTATACACATCTCTGCTTACGTACAGAGGCCTAAGGAGCATATAGATGTCTTGCCCTAGCACTGTCCACCCTGCTCCTCTGCAGCAGAGTGTCTCACTGAATCTGGGGCTAGGCAGGTGGACAGCAAGCCCTGGTGAACTTCCTGTTTCTGCCTCCCTTGATGCTGAGGATTTGAACTTGGGTCTTCAGGATTGTACAGCAAGCACATTATATTCAGAGCCACCTCCCCAGTTCCTTTCGAGCCCTTTGAGGAGCAGAGACTCACAGCTACCCAGCATGTATATCCTTGGCAACTTTTACTCACTGTGGTCTTTCCTTCCAGGGGAGTGGAGTAAGGCTGGTGGCCGGGTCTGCTGAGTCCGCAGCACTCAGACTATG TGCACCTCTGCAGCAGGTGCAGGCCCAGTTGTCACCTCCCCAGAACATCTTCCCATGGACTCTGACACTGTTGCCTC TTCAGATTCTGAGGTAGAGCTTATTCTGTAGCCTAAGTGGCGTGTGACACGCTTAGCCAGGCAAACGGAGAAGTTAGTATTGGTGGGGTTAGGATTAAGCACTTTCCTAGTCTGCTTAAGTGGATGGAGTAGGGGGAAACTGTTCCGTGGGTGGGTCCTATGATCTGAGAGCATAAGTCTGGTGGATGGCTGGGTCCTGTGATCTGAGAGTGTAAGCCCTAAGTAACATTGTGGAACCCAGTACTAAAAGTATTTCTGGTAGACTGTCACATTCATTCTAATAGTGAACTCTTTTGTGTTTTGCCTCTTGTAGTCTGATATCCTTTTGGGCATTCTGGACAAGTTGGACCCTGTCATGTTTTTCAAATGTCCTTCCCCAGAGTCTGCTAGTCTGGAGGAACTCCCAGAGGTCTACCCAGAAGGACCTAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACCTCATCAGCCAAGCTGGAAGCCATTAATGAACTCATTCGTTTTGACCATGTATACACCAAGCCTCTAGTTTTAGAGATCCCCTCTGAGACAGAGAGTCAAACTAACGTGGTAGTGAAAATTGAGGAAGCACCTCTAAGCTCTTCAGAAGAGGATCACCCTGAATTCATTGTCTCAGTGAAGAAAGAGCCTTTGGAAGATGACTTCATCCCAGAGCTGGGCATCTCAAACCTGCTTTCATCCAGCCATTGTCTGAGACCACCTTCTTGCCTGCTGGACGCTCACAGTGACTGTGGATATGAGGGCTCCCCTTCTCCCTTCAGTGACATGTCTTCTCCACTTGGTACAGACCACTCCTGGGAGGATACTTTTGCCAATGAACTTTTCCCCCAGCTGATTAGTGTCTAAAGAGCCACATAACACTGGGCCCCTTTCCCTGACCATCACATTGCCTAGAGGATAGCATAGGCCTGTCTCTTTCGTTAAAAGCCAAAGTAGAGGCTGTCTGGCCTTAGAAGAATTCCTCTAAAGTATTTCAAATCTCATAGATGACTTCCAAGTATTGTCGTTTGACACTCAGCTGTCTAAGGTATTCAAAGGTATTCCAGTACTACAGCTTTTGAGATTCTAGTTTATCTTAAAGGTGGTAGTATACTCTAAATCGCAGGGAGGGTCATTTGACAGTTTTTTCCCAGCCTGGCTTCAAACTATGTAGCCGAGGCTAGGCAGAAACTTCTGACCCTCTTGACCCCACCTCCCAAGTGCTGGGCTTCACCAGGTGTGCACCTCCACACCTGCCCCCCCGACATGTCAGGTGGACATGGGATTCATGAATGGCCCTTAGCATTTCTTTCTCCACTCTCTGCTTCCCAGGTTTCGTAACCTGAGGGGGCTTGTTTTCCCTTATGTGCATTTTAAATGAAGATCAAGAATCTTTGTAAAATGATGAAAATTTACTATGTAAATGCTTGATGGATCTTCTTGCTAGTGTAGCTTCTAGAAGGTGCTTTCTCCATTTATTTAAAACTACCCTTGCAATTAAAAAAAAAGCAACACAGCGTCCTGTTCTGTGATTTCTAGGGCTGTTGTAATTTCTCTTTATTGTTGGCTAAAGGAGTAATTTATCCAACTAAAGTGAGCATACCACTTTTTAAAGTCA
SEQ ID 591:小鼠Xbp1,转录本变体1,(未经IRE1处理的mRNA)
CTAGGGTAAAACCGTGAGACTCGGTCTGGAAATCTGGCCTGAGAGGACAGCCTGGCAATCCTCAGCCGGGGTGGGGACGTCTGCCGAAGATCCTTGGACTCCAGCAACCAGTGGTCGCCACCGTCCATCCACCCTAAGGCCCAGTTTGCACGGCGGAGAACAGCTGTGCAGCCACGCTGGACACTCACCCCGCCCGAGTTGAGCCCGCCCCCGGGACTACAGGACCAATAAGTGATGAATATACCCGCGCGTCACGGAGCACCGGCCAATCGCGGACGGCCACGACCCTAGAAAGGCTGGGCGCGGCAGGAGGCCACGGGGCGGTGGCGGCGCTGGCGTAGACGTTTCCTGGCTATGGTGGTGGTGGCAGCGGCGCCGAGCGCGGCCACGGCGGCCCCCAAAGTGCTACTCTTATCTGGCCAGCCCGCCTCCGGCGGCCGGGCGCTGCCGCTCATGGTACCCGGTCCGCGGGCAGCAGGGTCGGAGGCGAGCGGGACACCGCAGGCTCGCAAGCGGCAGCGGCTCACGCACCTGAGCCCGGAGGAGAAAGCGCTGCGGAGGAAACTGAAAAACAGAGTAGCAGCGCAGACTGCTCGAGATAGAAAGAAAGCCCGGATGAGCGAGCTGGAGCAGCAAGTGGTGGATTTGGAAGAAGAGAACCACAAACTCCAGCTAGAAAATCAGCTTTTACGGGAGAAAACTCACGGCCTTGTGGTTGAGAACCAGGAGTTAAGAACACGCTTGGGAATGGACACGCTGGATCCTGACGAGGTTCCAGAGGTGGAGGCCAAGGGGAGTGGAGTAAGGCTGGTGGCCGGGTCTGCTGAGTCCGCAGCACTCAGACTATGTGCACCTCTGCAGCAGGTGCAGGCCCAGTTGTCACCTCCCCAGAACATCTTCCCATGGACTCTGACACTGTTGCCTCTTCAGATTCTGAGTCTGATATCCTTTTGGGCATTCTGGACAAGTTGGACCCTGTCATGTTTTTCAAATGTCCTTCCCCAGAGTCTGCTAGTCTGGAGGAACTCCCAGAGGTCTACCCAGAAGGACCTAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACCTCATCAGCCAAGCTGGAAGCCATTAATGAACTCATTCGTTTTGACCATGTATACACCAAGCCTCTAGTTTTAGAGATCCCCTCTGAGACAGAGAGTCAAACTAACGTGGTAGTGAAAATTGAGGAAGCACCTCTAAGCTCTTCAGAAGAGGATCACCCTGAATTCATTGTCTCAGTGAAGAAAGAGCCTTTGGAAGATGACTTCATCCCAGAGCTGGGCATCTCAAACCTGCTTTCATCCAGCCATTGTCTGAGACCACCTTCTTGCCTGCTGGACGCTCACAGTGACTGTGGATATGAGGGCTCCCCTTCTCCCTTCAGTGACATGTCTTCTCCACTTGGTACAGACCACTCCTGGGAGGATACTTTTGCCAATGAACTTTTCCCCCAGCTGATTAGTGTCTAAAGAGCCACATAACACTGGGCCCCTTTCCCTGACCATCACATTGCCTAGAGGATAGCATAGGCCTGTCTCTTTCGTTAAAAGCCAAAGTAGAGGCTGTCTGGCCTTAGAAGAATTCCTCTAAAGTATTTCAAATCTCATAGATGACTTCCAAGTATTGTCGTTTGACACTCAGCTGTCTAAGGTATTCAAAGGTATTCCAGTACTACAGCTTTTGAGATTCTAGTTTATCTTAAAGGTGGTAGTATACTCTAAATCGCAGGGAGGGTCATTTGACAGTTTTTTCCCAGCCTGGCTTCAAACTATGTAGCCGAGGCTAGGCAGAAACTTCTGACCCTCTTGACCCCACCTCCCAAGTGCTGGGCTTCACCAGGTGTGCACCTCCACACCTGCCCCCCCGACATGTCAGGTGGACATGGGATTCATGAATGGCCCTTAGCATTTCTTTCTCCACTCTCTGCTTCCCAGGTTTCGTAACCTGAGGGGGCTTGTTTTCCCTTATGTGCATTTTAAATGAAGATCAAGAATCTTTGTAAAATGATGAAAATTTACTATGTAAATGCTTGATGGATCTTCTTGCTAGTGTAGCTTCTAGAAGGTGCTTTCTCCATTTATTTAAAACTACCCTTGCAATTAAAAAAAAAGCAACACAGCGTCCTGTTCTGTGATTTCTAGGGCTGTTGTAATTTCTCTTTATTGTTGGCTAAAGGAGTAATTTATCCAACTAAAGTGAGCATACCACTTTTTAAAGTCAAAAAAAAAAAAAAAAAA
SEQ ID 592:小鼠X-框结合蛋白1同种型XBP1(U)
MVVVAAAPSAATAAPKVLLLSGQPASGGRALPLMVPGPRAAGSEASGTPQARKRQRLTHLSPEEKALRRKLKNRVAAQTARDRKKARMSELEQQVVDLEEENHKLQLENQLLREKTHGLVVENQELRTRLGMDTLDPDEVPEVEAKGSGVRLVAGSAESAALRLCAPLQQVQAQLSPPQNIFPWTLTLLPLQILSLI
SFWAFWTSWTLSCFSNVLPQSLLVWRNSQRSTQKDLVPYQPPFLCQWGP
HQPSWKPLMNSFVLTMYTPSL
SEQ ID 593:小鼠X-框结合蛋白1(Xbp1),转录本变体2,mRNA CTAGGGTAAAACCGTGAGACTCGGTCTGGAAATCTGGCCTGAGAGGACAGCCTGGCAATCCTCAGCCGGGGTGGGGACGTCTGCCGAAGATCCTTGGACTCCAGCAACCAGTGGTCGCCACCGTCCATCCACCCTAAGGCCCAGTTTGCACGGCGGAGAACAGCTGTGCAGCCACGCTGGACACTCACCCCGCCCGAGTTGAGCCCGCCCCCGGGACTACAGGACCAATAAGTGATGAATATACCCGCGCGTCACGGAGCACCGGCCAATCGCGGACGGCCACGACCCTAGAAAGGCTGGGCGCGGCAGGAGGCCACGGGGCGGTGGCGGCGCTGGCGTAGACGTTTCCTGGCTATGGTGGTGGTGGCAGCGGCGCCGAGCGCGGCCACGGCGGCCCCCAAAGTGCTACTCTTATCTGGCCAGCCCGCCTCCGGCGGCCGGGCGCTGCCGCTCATGGTACCCGGTCCGCGGGCAGCAGGGTCGGAGGCGAGCGGGACACCGCAGGCTCGCAAGCGGCAGCGGCTCACGCACCTGAGCCCGGAGGAGAAAGCGCTGCGGAGGAAACTGAAAAACAGAGTAGCAGCGCAGACTGCTCGAGATAGAAAGAAAGCCCGGATGAGCGAGCTGGAGCAGCAAGTGGTGGATTTGGAAGAAGAGAACCACAAACTCCAGCTAGAAAATCAGCTTTTACGGGAGAAAACTCACGGCCTTGTGGTTGAGAACCAGGAGTTAAGAACACGCTTGGGAATGGACACGCTGGATCCTGACGAGGTTCCAGAGGTGGAGGCCAAGGGGAGTGGAGTAAGGCTGGTGGCCGGGTCTGCTGAGTCCGCAGCAGGTGCAGGCCCAGTTGTCACCTCCCCAGAACATCTTCCCATGGACTCTGACACTGTTGCCTCTTCAGATTCTGAGTCTGATATCCTTTTGGGCATTCTGGACAAGTTGGACCCTGTCATGTTTTTCAAATGTCCTTCCCCAGAGTCTGCTAGTCTGGAGGAACTCCCAGAGGTCTACCCAGAAGGACCTAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACCTCATCAGCCAAGCTGGAAGCCATTAATGAACTCATTCGTTTTGACCATGTATACACCAAGCCTCTAGTTTTAGAGATCCCCTCTGAGACAGAGAGTCAAACTAACGTGGTAGTGAAAATTGAGGAAGCACCTCTAAGCTCTTCAGAAGAGGATCACCCTGAATTCATTGTCTCAGTGAAGAAAGAGCCTTTGGAAGATGACTTCATCCCAGAGCTGGGCATCTCAAACCTGCTTTCATCCAGCCATTGTCTGAGACCACCTTCTTGCCTGCTGGACGCTCACAGTGACTGTGGATATGAGGGCTCCCCTTCTCCCTTCAGTGACATGTCTTCTCCACTTGGTACAGACCACTCCTGGGAGGATACTTTTGCCAATGAACTTTTCCCCCAGCTGATTAGTGTCTAAAGAGCCACATAACACTGGGCCCCTTTCCCTGACCATCACATTGCCTAGAGGATAGCATAGGCCTGTCTCTTTCGTTAAAAGCCAAAGTAGAGGCTGTCTGGCCTTAGAAGAATTCCTCTAAAGTATTTCAAATCTCATAGATGACTTCCAAGTATTGTCGTTTGACACTCAGCTGTCTAAGGTATTCAAAGGTATTCCAGTACTACAGCTTTTGAGATTCTAGTTTATCTTAAAGGTGGTAGTATACTCTAAATCGCAGGGAGGGTCATTTGACAGTTTTTTCCCAGCCTGGCTTCAAACTATGTAGCCGAGGCTAGGCAGAAACTTCTGACCCTCTTGACCCCACCTCCCAAGTGCTGGGCTTCACCAGGTGTGCACCTCCACACCTGCCCCCCCGACATGTCAGGTGGACATGGGATTCATGAATGGCCCTTAGCATTTCTTTCTCCACTCTCTGCTTCCCAGGTTTCGTAACCTGAGGGGGCTTGTTTTCCCTTATGTGCATTTTAAATGAAGATCAAGAATCTTTGTAAAATGATGAAAATTTACTATGTAAATGCTTGATGGATCTTCTTGCTAGTGTAGCTTCTAGAAGGTGCTTTCTCCATTTATTTAAAACTACCCTTGCAATTAAAAAAAAAGCAACACAGCGTCCTGTTCTGTGATTTCTAGGGCTGTTGTAATTTCTCTTTATTGTTGGCTAAAGGAGTAATTTATCCAACTAAAGTGAGCATACCACTTTTTAAAGTCAAAAAAAAAAAAAAAAAA
SEQ ID 594:X-框结合蛋白1同种型XBP1(S)
MVVVAAAPSAATAAPKVLLLSGQPASGGRALPLMVPGPRAAGSEASGTPQARKRQRLTHLSPEEKALRRKLKNRVAAQTARDRKKARMSELEQQVVDLEEENHKLQLENQLLREKTHGLVVENQELRTRLGMDTLDPDEVPEVEAKGSGVRLVAGSAESAAGAGPVVTSPEHLPMDSDTVASSDSESDILLGILDKLDPVMFFKCPSPESASLEELPEVYPEGPSSLPASLSLSVGTSSAKLEAINELIRFDHVYTKPLVLEIPSETESQTNVVVKIEEAPLSSSEEDHPEFIVSVKKEPLEDDFIPELGISNLLSSSHCLRPPSCLLDAHSDCGYEGSPSPFSDMSSPLGTDHSWEDTFANELFPQLISV
SEQ ID 595:小鼠XBP1Δ4mRNA
CTAGGGTAAAACCGTGAGACTCGGTCTGGAAATCTGGCCTGAGAGGACAGCCTGGCAATCCTCAGCCGGGGTGGGGACGTCTGCCGAAGATCCTTGGACTCCAGCAACCAGTGGTCGCCACCGTCCATCCACCCTAAGGCCCAGTTTGCACGGCGGAGAACAGCTGTGCAGCCACGCTGGACACTCACCCCGCCCGAGTTGAGCCCGCCCCCGGGACTACAGGACCAATAAGTGATGAATATACCCGCGCGTCACGGAGCACCGGCCAATCGCGGACGGCCACGACCCTAGAAAGGCTGGGCGCGGCAGGAGGCCACGGGGCGGTGGCGGCGCTGGCGTAGACGTTTCCTGGCTATGGTGGTGGTGGCAGCGGCGCCGAGCGCGGCCACGGCGGCCCCCAAAGTGCTACTCTTATCTGGCCAGCCCGCCTCCGGCGGCCGGGCGCTGCCGCTCATGGTACCCGGTCCGCGGGCAGCAGGGTCGGAGGCGAGCGGGACACCGCAGGCTCGCAAGCGGCAGCGGCTCACGCACCTGAGCCCGGAGGAGAAAGCGCTGCGGAGGAAACTGAAAAACAGAGTAGCAGCGCAGACTGCTCGAGATAGAAAGAAAGCCCGGATGAGCGAGCTGGAGCAGCAAGTGGTGGATTTGGAAGAAGAGAACCACAAACTCCAGCTAGAAAATCAGCTTTTACGGGAGAAAACTCACGGCCTTGTGGTTGAGAACCAGGAGTTAAGAACACGCTTGGGAATGGACACGCTGGATCCTGACGAGGTTCCAGAGGTGGAGGCCAAGTCTGATATCCTTTTGGGCATTCTGGACAAGTTGGACCCTGTCATGTTTTTCAAATGTCCTTCCCCAGAGTCTGCTAGTCTGGAGGAACTCCCAGAGGTCTACCCAGAAGGACCTAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACCTCATCAGCCAAGCTGGAAGCCATTAATGAACTCATTCGTTTTGACCATGTATACACCAAGCCTCTAGTTTTAGAGATCCCCTCTGAGACAGAGAGTCAAACTAACGTGGTAGTGAAAATTGAGGAAGCACCTCTAAGCTCTTCAGAAGAGGATCACCCTGAATTCATTGTCTCAGTGAAGAAAGAGCCTTTGGAAGATGACTTCATCCCAGAGCTGGGCATCTCAAACCTGCTTTCATCCAGCCATTGTCTGAGACCACCTTCTTGCCTGCTGGACGCTCACAGTGACTGTGGATATGAGGGCTCCCCTTCTCCCTTCAGTGACATGTCTTCTCCACTTGGTACAGACCACTCCTGGGAGGATACTTTTGCCAATGAACTTTTCCCCCAGCTGATTAGTGTCTAAAGAGCCACATAACACTGGGCCCCTTTCCCTGACCATCACATTGCCTAGAGGATAGCATAGGCCTGTCTCTTTCGTTAAAAGCCAAAGTAGAGGCTGTCTGGCCTTAGAAGAATTCCTCTAAAGTATTTCAAATCTCATAGATGACTTCCAAGTATTGTCGTTTGACACTCAGCTGTCTAAGGTATTCAAAGGTATTCCAGTACTACAGCTTTTGAGATTCTAGTTTATCTTAAAGGTGGTAGTATACTCTAAATCGCAGGGAGGGTCATTTGACAGTTTTTTCCCAGCCTGGCTTCAAACTATGTAGCCGAGGCTAGGCAGAAACTTCTGACCCTCTTGACCCCACCTCCCAAGTGCTGGGCTTCACCAGGTGTGCACCTCCACACCTGCCCCCCCGACATGTCAGGTGGACATGGGATTCATGAATGGCCCTTAGCATTTCTTTCTCCACTCTCTGCTTCCCAGGTTTCGTAACCTGAGGGGGCTTGTTTTCCCTTATGTGCATTTTAAATGAAGATCAAGAATCTTTGTAAAATGATGAAAATTTACTATGTAAATGCTTGATGGATCTTCTTGCTAGTGTAGCTTCTAGAAGGTGCTTTCTCCATTTATTTAAAACTACCCTTGCAATTAAAAAAAAAGCAACACAGCGTCCTGTTCTGTGATTTCTAGGGCTGTTGTAATTTCTCTTTATTGTTGGCTAAAGGAGTAATTTATCCAACTAAAGTGAGCATACCACTTTTTAAAGTCAAAAAAAAAAAAAAAAAA
SEQ ID 596:预测由XBP1Δ4mRNA生产的蛋白质
MVVVAAAPSAATAAPKVLLLSGQPASGGRALPLMVPGPRAAGSEASGTPQARKRQRLTHLSPEEKALRRKLKNRVAAQTARDRKKARMSELEQQVVDLEEENHKLQLENQLLREKTHGLVVENQELRTRLGMDTLDPDEVPEVEAKSDILLGILDKLDPVMFFKCPSPESASLEELPEVYPEGPSSLPASLSLSVGTSSAKLEAINELIRFDHVYTKPLVLEIPSETESQTNVVVKIEEAPLSSSEEDHPEFIVSVKKEPLEDDFIPELGISNLLSSSHCLRPPSCLLDAHSDCGYEGSPSPFSDMSSPLGTDHSWEDTFANELFPQLISV
人类
SEQ ID 801:人XBP1基因
GCTGGGCGGCTGCGGCGCGCGGTGCGCGGTGCGTAGTCTGGAGCTATGGTGGTGGTGGCAGCCGCGCCGAACCCGGCCGACGGGACCCCTAAAGTTCTGCTTCTGTCGGGGCAGCCCGCCTCCGCCGCCGGAGCCCCGGCCGGCCAGGCCCTGCCGCTCATGGTGCCAGCCCAGAGAGGGGCCAGCCCGGAGGCAGCGAGCGGGGGGCTGCCCCAGGCGCGCAAGCGACAGCGCCTCACGCACCTGAGCCCCGAGGAGAAGGCGCTGAGGAGGTGGGCGAGGGGCCGGGGTCTGGGGCCAGATCTGAAGCCGGGACTAGGGACAGGGGCAGGGGCAGGGGCTGGGAGCGGGGACCCAGCACTGGCCGCCCCGCAGGGCTCCGTCGCCTTTGGCCTGGCGGGTCGGTGCCAGCGTGGCGCGGGGCGGGGCAGGAAGCCCGGACTGACCGGATCCGCCACGCTGGGAACCTAGGGCGGCCCAGGGCTCTTTTCTGTACTTTTTAACTCTCTCGTTAGAGATGACCAGAGCTGGGGATGCGGGCACCTGTCTTCCAGGCCCTCTTGCTGTGTGGCCGCAGACTGGTGGTTCAGCCTCTTAACTCGGACATGAGGTCGAATAATCTGTTTTGGTTTACTGCTATTTCTGGAGAGGCGCGGAGCTGAAATAACAGAGCTGTTGAAAGGGCTGGGAATTCTGCGAGGCTCACTGGTCTAGCTCAGTATCTGCGTTCTTAAAATGGAACCTACTTCATGAGGTCTTTGGGGAGATTGAGACTTGGATATAATGTGCCTAGCACTTAGTCCTCCGTAAATGTTCACTCTTTTGTGATCATTGTGCCTTCTGTGATTTATGAAGTGTCTCTTCTGAGTTAATTCTTTTAAAAAAAAAAGTGTCTCCTCCAACAGACACGGACCCATCAGCAGGTCACTGCCTAGGATCTCAACACTAGAGATCAGGGAGTGGCATCAGCCTCTCCCTTTTCTAAATTGGACTGGGGGACGGAGGGTTGATGTCATAGCAAGATTGCAGCCTTCACTAGATTAATGAGGCCAGGTTGGATCCTGTTTAAGAGAACTGGAGACAGGAAGCAGCGGGGGAATAGATGGGGAAAGAGGAAAGTTCCTTATGATGCAAGATGAATAGTGTGTGTGTCCAGCCCCAGTGCTGTGACGGGGATGAGTCTGAGGTGGACGGATGATGCAATATAGGAGAGAATAAAGCAGGTCTTCGAGCTAGATTGACAGAAGACTGTATTTTTTATTTTGTTTTATTGAGGGGAGGAGCCTGAAGTGTATTTTATCATTAGTCTGTCTTATACTGTAAATAAAAATGAAAGCACCAGCTGGTAAAGTTTTCAAATAAAGACATAAATAAGGTTTGATATGACTCAGTGTGGTATGTTCCTTCTCTTCCTAGGAAACTGAAAAACAGAGTAGCAGCTCAGACTGCCAGAGATCGAAAGAAGGCTCGAATGAGTGAGCTGGAACAGCAAGTGGTAGATTTAGAAGAAGAGGTAAAACTACTTAAGGTCAAACTCTTTTATCCATTGTATACCCTTCCTTGGTGAATGTTCTGATATTTGCTTCCCATCCCAAGTTGTTTCAGCCCCTATTAGAATACAATTGAATATATGATTAAAAGTTAAACTAGGCTGGGCATGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGCCTGAGTTGGGCAGATCACTTGAAGCCAGCAGTTTGAGACCAGCCTAGCCAACATGGTAAAATCCCGTCTCTACCCAAAAATATACCAAAAAAAAAAAAAAAAAAAAGGCCAAGCGTGAGTGCCTGTAGTCCCAGCTACTCGGGAGGTTGAGGTGGGAGGATTGTTTGAACCTGGGAGAGGGAGGTTGCAGTGAGCTGAGATCGCACCACTGCACTCCAGCCTGGGCAACAGAGTGAGACTCTGTCTCAAGAAAAAAAAAAAAAGTTTGCTGGGCACCGGGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGTAGATAACTTGAGATCAGGAGTTCGAGACCAGCCTGACCAACGTGGTGAAACCCCATCTCTATTAAAAATACAAAAATTAGCCGGGTGTCGTGGCAGGCACCTGTAATCCCAGCTGCTCCGGAGGCTGACGCAGGAGAATCACTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCTGAGATCACGAGATCATGCCACTGCACTCCAGTCTGGGCGACAGAGCAAAAACCCTGTCTCAAAAAAAAAAAAAAAGTTAATCTAAGTTAGGACAGAGAGTTGGTGAAGTGGTGAAGCTTGTTGAGGGCAGAAGTGATTGACTTTGTGGCATTTGGTGCTAGATGTATCTCAAAGTAGATGGATTTAACAATGTTTATTGAGTTTGTAGTAAGAAATTAGCAAGGGCTAATAGGAAATAATTGCTTAAACTTTACATTCTTCCTGGCATGGCCAGAAATTCACTAAAGGTTCCTTTCCCCCTCTAGGGTCCACCTGTTAATCAATCTTAAATTGTTGCCAATTACACATCTTGAATACATAGAGATTATTTATATTGTTTTTTTAACCCCTTGGTCAATTTGCATATATTGAGCTTTTTAAAGTTTTAATCATTAGTTGGTTCTTCTAAGAATCATGAGTCAGGAGCAGGGATTTTTTTTAACTTATTTTGGATTTATAGTCACCACTACCACTTTTATTATTACCTGCCAGTTCAAGATAGTTATTTATTTTTATTTTATATTATTATTATTATTATTATCATCATCATTATTTTGAGATGGAGTCTCACTCTGTTGCCCAGGCTGGAGTGCAGTGGTGCAATCTCGGCTCACTGCAACCTCTGCCTCCCAGGTTCAAGCAATTCTCCCTGCTTCAGCCTCCAGATTAGCTGGGATTACAGGCACCCCTCACCACATCCAGCTAATTTTTGGATTTTTTAGTAGAGATGGGGGTTTGCCATGTTGGCCAGGCTGGTTTTGAACTCTTGACCTCAGGTGATCCACCTGCCTTGGCCTCCCAAAGTGTTAGGATTACAAGTGTGAGCCACCGAGCCTGGCCAAGATAGTTTAAAAAAAAAATTATATCTACATTAAAGCCACAAGTCACCCTTTGCTGAAGTCAGTATTAGTAGTTGGAAGCAGTGTGTTATTCTTGACCCCATGAAGTGGCACTTATTAAGTAGCTTGCTTTTCCATAATTATGGCCTAGCTTTTTAAAACCTACTATGAACACCACAAGCATAGAGTTTTCCAAAAGTTCAAGAAGGAAAGGAAACCAATTATACTGAATCAGGTAGATTCTTAACTGAAATAATTAGATGTTTTAATAGCCTCTTATGAACTTTCTTCCAGAACCAAAAACTTTTGCTAGAAAATCAGCTTTTACGAGAGAAAACTCATGGCCTTGTAGTTGAGAACCAGGAGTTAAGACAGCGCTTGGGGATGGATGCCCTGGTTGCTGAAGAGGAGGCGGAAGCCAAGGTAAATCATCTCCTTTATTTGGTGCCTCATGTGAGTACTGGTTCCAAGTGACATGACCCAGCGATTATGTTTACAGTCTGGACTTCTGATCAAGAGCGTTCTTGAAATTTTCCTTCAGTTTTAAGACATTTTCATGCAGGCAGAGTGTTCTTCCCCTAAAGGCACTTGACACTCATTTTTTAAGTGTGTAGTGAACAGTACTAAGATCTAATAATGAAAACAAGTTACATGGCTCCCTAAGAACAAGTACTAACAAATGCAGTAGCCAACAAGATTACCATGCAATCATTAAGGAGAACCAAAGTAAGAGAGCCACTCAAACCAGATTTTGAACGCTACTAAAATTAAAGTAGTTCTTTGATGAATATGAATGAGTAGGGAAAGGATTCTTTGTAATAGTGATACCTCTGTGGTAAGAGAAGGGTGGTATGTGAGTTTTAGTCTACAGATTATGGCAAATTCAGTGACAACAATCAAATGGTCTAAGATTGACAGTAGCACAGTTTTACTCTGTGAAGGTAATGTTCAGGACAAATTTCAAGAAAACTAGAAAACCATTCTTTACAGCTGAAATCTTTCCCTAACCATTGTTATTTCCACTTTTAAGTCCTCAAGAGATGAGAAAAGGGAGGTAAGGCTTCCTTATACATTTCCTGCACAATGAAACATTTTTCCTCCTCCAGGCAAAGATTCAAGCAGAACTGGCAAATATCTTATCTTGCTCTTCTCAATAATAATAATGTTGTTAGATAATAAAGTTCTATAGCAATTTAACCCTAGAATCTTTTTGAAAAGTAATTCTTTAAAGTTGAGAATCACAGCTGTCTAGCAAGCATTTCCTTGGGCACTTGAAGCTGTTTATTCACTTTGGTCTTTCCTCCCAGGGGA ATGAAGTGAGGCCAGTGGCCGGGTCTGCTGAGTCCGCAGCACTCAGACTACGTGCACCTCTGCAGCAGGTGCAGGCC CAGTTGTCACCCCTCCAGAACATCTCCCCATGGATTCTGGCGGTATTGACTCTTCAGATTCAGAGGTAGGGATCATTCTGACTTATTAAAGAGCTATATAACCAGTTAATTCCATCTGTTTGATGCTTGACATCCCTAACTAGACAGATGAGGGTTGAAGTTAGTTTTTGGTGGGGTTGGAGGTGAACATCAACTACCTTCCTAGTTCCAGGTAATATAGAACATGGAGTGAAGTGTAGATAAATGGGTCTGGTGGGTCCCGAGGTCATCTTATCACATAATGACTAATTTACATTATGGAACCCAGTACAAAGTGTTCCAGTTAGATTTTCCATTGTATTCTGACAGTTGTACTTCATTTAATTTTTGCCTCTTACAGTCTGATATCCTGTTGGGCATTCTGGACAACTTGGACCCAGTCATGTTCTTCAAATGCCCTTCCCCAGAGCCTGCCAGCCTGGAGGAGCTCCCAGAGGTCTACCCAGAAGGACCCAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACGTCATCAGCCAAGCTGGAAGCCATTAATGAACTAATTCGTTTTGACCACATATATACCAAGCCCCTAGTCTTAGAGATACCCTCTGAGACAGAGAGCCAAGCTAATGTGGTAGTGAAAATCGAGGAAGCACCTCTCAGCCCCTCAGAGAATGATCACCCTGAATTCATTGTCTCAGTGAAGGAAGAACCTGTAGAAGATGACCTCGTTCCGGAGCTGGGTATCTCAAATCTGCTTTCATCCAGCCACTGCCCAAAGCCATCTTCCTGCCTACTGGATGCTTACAGTGACTGTGGATACGGGGGTTCCCTTTCCCCATTCAGTGACATGTCCTCTCTGCTTGGTGTAAACCATTCTTGGGAGGACACTTTTGCCAATGAACTCTTTCCCCAGCTGATTAGTGTCTAAGGAATGATCCAATACTGTTGCCCTTTTCCTTGACTATTACACTGCCTGGAGGATAGCAGAGAAGCCTGTCTGTACTTCATTCAAAAAGCCAAAATAGAGAGTATACAGTCCTAGAGAATTCCTCTATTTGTTCAGATCTCATAGATGACCCCCAGGTATTGTCTTTTGACATCCAGCAGTCCAAGGTATTGAGACATATTACTGGAAGTAAGAAATATTACTATAATTGAGAACTACAGCTTTTAAGATTGTACTTTTATCTTAAAAGGGTGGTAGTTTTCCCTAAAATACTTATTATGTAAGGGTCATTAGACAAATGTCTTGAAGTAGACATGGAATTTATGAATGGTTCTTTATCATTTCTCTTCCCCCTTTTTGGCATCCTGGCTTGCCTCCAGTTTTAGGTCCTTTAGTTTGCTTCTGTAAGCAACGGGAACACCTGCTGAGGGGGCTCTTTCCCTCATGTATACTTCAAGTAAGATCAAGAATCTTTTGTGAAATTATAGAAATTTACTATGTAAATGCTTGATGGAATTTTTTCCTGCTAGTGTAGCTTCTGAAAGGTGCTTTCTCCATTTATTTAAAACTACCCATGCAATTAAAAGGTACAATGCA
SEQ ID 802:人X-框结合蛋白1(XBP1),转录本变体1,mRNA(未经IRE1处理)
GCTGGGCGGCTGCGGCGCGCGGTGCGCGGTGCGTAGTCTGGAGCTATGGTGGTGGTGGCAGCCGCGCCGAACCCGGCCGACGGGACCCCTAAAGTTCTGCTTCTGTCGGGGCAGCCCGCCTCCGCCGCCGGAGCCCCGGCCGGCCAGGCCCTGCCGCTCATGGTGCCAGCCCAGAGAGGGGCCAGCCCGGAGGCAGCGAGCGGGGGGCTGCCCCAGGCGCGCAAGCGACAGCGCCTCACGCACCTGAGCCCCGAGGAGAAGGCGCTGAGGAGGAAACTGAAAAACAGAGTAGCAGCTCAGACTGCCAGAGATCGAAAGAAGGCTCGAATGAGTGAGCTGGAACAGCAAGTGGTAGATTTAGAAGAAGAGAACCAAAAACTTTTGCTAGAAAATCAGCTTTTACGAGAGAAAACTCATGGCCTTGTAGTTGAGAACCAGGAGTTAAGACAGCGCTTGGGGATGGATGCCCTGGTTGCTGAAGAGGAGGCGGAAGCCAAGGGGAATGAAGTGAGGCCAGTGGCCGGGTCTGCTGAGTCCGCAGCACTCAGACTACGTGCACCTCTGCAGCAGGTGCAGGCCCAGTTGTCACCCCTCCAGAACATCTCCCCATGGATTCTGGCGGTATTGACTCTTCAGATTCAGAGTCTGATATCCTGTTGGGCATTCTGGACAACTTGGACCCAGTCATGTTCTTCAAATGCCCTTCCCCAGAGCCTGCCAGCCTGGAGGAGCTCCCAGAGGTCTACCCAGAAGGACCCAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACGTCATCAGCCAAGCTGGAAGCCATTAATGAACTAATTCGTTTTGACCACATATATACCAAGCCCCTAGTCTTAGAGATACCCTCTGAGACAGAGAGCCAAGCTAATGTGGTAGTGAAAATCGAGGAAGCACCTCTCAGCCCCTCAGAGAATGATCACCCTGAATTCATTGTCTCAGTGAAGGAAGAACCTGTAGAAGATGACCTCGTTCCGGAGCTGGGTATCTCAAATCTGCTTTCATCCAGCCACTGCCCAAAGCCATCTTCCTGCCTACTGGATGCTTACAGTGACTGTGGATACGGGGGTTCCCTTTCCCCATTCAGTGACATGTCCTCTCTGCTTGGTGTAAACCATTCTTGGGAGGACACTTTTGCCAATGAACTCTTTCCCCAGCTGATTAGTGTCTAAGGAATGATCCAATACTGTTGCCCTTTTCCTTGACTATTACACTGCCTGGAGGATAGCAGAGAAGCCTGTCTGTACTTCATTCAAAAAGCCAAAATAGAGAGTATACAGTCCTAGAGAATTCCTCTATTTGTTCAGATCTCATAGATGACCCCCAGGTATTGTCTTTTGACATCCAGCAGTCCAAGGTATTGAGACATATTACTGGAAGTAAGAAATATTACTATAATTGAGAACTACAGCTTTTAAGATTGTACTTTTATCTTAAAAGGGTGGTAGTTTTCCCTAAAATACTTATTATGTAAGGGTCATTAGACAAATGTCTTGAAGTAGACATGGAATTTATGAATGGTTCTTTATCATTTCTCTTCCCCCTTTTTGGCATCCTGGCTTGCCTCCAGTTTTAGGTCCTTTAGTTTGCTTCTGTAAGCAACGGGAACACCTGCTGAGGGGGCTCTTTCCCTCATGTATACTTCAAGTAAGATCAAGAATCTTTTGTGAAATTATAGAAATTTACTATGTAAATGCTTGATGGAATTTTTTCCTGCTAGTGTAGCTTCTGAAAGGTGCTTTCTCCATTTATTTAAAACTACCCATGCAATTAAAAGGTACAATGCA
SEQ ID 803:人X-框结合蛋白1同种型XBP1(U)
MVVVAAAPNPADGTPKVLLLSGQPASAAGAPAGQALPLMVPAQRGASPEAASGGLPQARKRQRLTHLSPEEKALRRKLKNRVAAQTARDRKKARMSELEQQVVDLEEENQKLLLENQLLREKTHGLVVENQELRQRLGMDALVAEEEAEAKGNEVRPVAGSAESAALRLRAPLQQVQAQLSPLQNISPWILAVLTLQIQSLISCWAFWTTWTQSCSSNALPQSLPAWRSSQRSTQKDPVPYQPPFLCQWGRHQPSWKPLMN
SEQ ID 804:人X-框结合蛋白1(XBP1),转录本变体2,mRNA(未经IRE1处理)
GCTGGGCGGCTGCGGCGCGCGGTGCGCGGTGCGTAGTCTGGAGCTATGGTGGTGGTGGCAGCCGCGCCGAACCCGGCCGACGGGACCCCTAAAGTTCTGCTTCTGTCGGGGCAGCCCGCCTCCGCCGCCGGAGCCCCGGCCGGCCAGGCCCTGCCGCTCATGGTGCCAGCCCAGAGAGGGGCCAGCCCGGAGGCAGCGAGCGGGGGGCTGCCCCAGGCGCGCAAGCGACAGCGCCTCACGCACCTGAGCCCCGAGGAGAAGGCGCTGAGGAGGAAACTGAAAAACAGAGTAGCAGCTCAGACTGCCAGAGATCGAAAGAAGGCTCGAATGAGTGAGCTGGAACAGCAAGTGGTAGATTTAGAAGAAGAGAACCAAAAACTTTTGCTAGAAAATCAGCTTTTACGAGAGAAAACTCATGGCCTTGTAGTTGAGAACCAGGAGTTAAGACAGCGCTTGGGGATGGATGCCCTGGTTGCTGAAGAGGAGGCGGAAGCCAAGGGGAATGAAGTGAGGCCAGTGGCCGGGTCTGCTGAGTCCGCAGCAGGTGCAGGCCCAGTTGTCACCCCTCCAGAACATCTCCCCATGGATTCTGGCGGTATTGACTCTTCAGATTCAGAGTCTGATATCCTGTTGGGCATTCTGGACAACTTGGACCCAGTCATGTTCTTCAAATGCCCTTCCCCAGAGCCTGCCAGCCTGGAGGAGCTCCCAGAGGTCTACCCAGAAGGACCCAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACGTCATCAGCCAAGCTGGAAGCCATTAATGAACTAATTCGTTTTGACCACATATATACCAAGCCCCTAGTCTTAGAGATACCCTCTGAGACAGAGAGCCAAGCTAATGTGGTAGTGAAAATCGAGGAAGCACCTCTCAGCCCCTCAGAGAATGATCACCCTGAATTCATTGTCTCAGTGAAGGAAGAACCTGTAGAAGATGACCTCGTTCCGGAGCTGGGTATCTCAAATCTGCTTTCATCCAGCCACTGCCCAAAGCCATCTTCCTGCCTACTGGATGCTTACAGTGACTGTGGATACGGGGGTTCCCTTTCCCCATTCAGTGACATGTCCTCTCTGCTTGGTGTAAACCATTCTTGGGAGGACACTTTTGCCAATGAACTCTTTCCCCAGCTGATTAGTGTCTAAGGAATGATCCAATACTGTTGCCCTTTTCCTTGACTATTACACTGCCTGGAGGATAGCAGAGAAGCCTGTCTGTACTTCATTCAAAAAGCCAAAATAGAGAGTATACAGTCCTAGAGAATTCCTCTATTTGTTCAGATCTCATAGATGACCCCCAGGTATTGTCTTTTGACATCCAGCAGTCCAAGGTATTGAGACATATTACTGGAAGTAAGAAATATTACTATAATTGAGAACTACAGCTTTTAAGATTGTACTTTTATCTTAAAAGGGTGGTAGTTTTCCCTAAAATACTTATTATGTAAGGGTCATTAGACAAATGTCTTGAAGTAGACATGGAATTTATGAATGGTTCTTTATCATTTCTCTTCCCCCTTTTTGGCATCCTGGCTTGCCTCCAGTTTTAGGTCCTTTAGTTTGCTTCTGTAAGCAACGGGAACACCTGCTGAGGGGGCTCTTTCCCTCATGTATACTTCAAGTAAGATCAAGAATCTTTTGTGAAATTATAGAAATTTACTATGTAAATGCTTGATGGAATTTTTTCCTGCTAGTGTAGCTTCTGAAAGGTGCTTTCTCCATTTATTTAAAACTACCCATGCAATTAAAAGGTACAATGCA
SEQ ID 805:人X-框结合蛋白1同种型XBP1(S)
MVVVAAAPNPADGTPKVLLLSGQPASAAGAPAGQALPLMVPAQRGASPEAASGGLPQARKRQRLTHLSPEEKALRRKLKNRVAAQTARDRKKARMSELEQQVVDLEEENQKLLLENQLLREKTHGLVVENQELRQRLGMDALVAEEEAEAKGNEVRPVAGSAESAAGAGPVVTPPEHLPMDSGGIDSSDSESDILLGILDNLDPVMFFKCPSPEPASLEELPEVYPEGPSSLPASLSLSVGTSSAKLEAINELIRFDHIYTKPLVLEIPSETESQANVVVKIEEAPLSPSENDHPEFIVSVKEEPVEDDLVPELGISNLLSSSHCPKPSSCLLDAYSDCGYGGSLSPFSDMSSLLGVNHSWEDTFANELFPQLISV
SEQ ID 806:人X-框结合蛋白1(XBP1)Δ4变体
GCTGGGCGGCTGCGGCGCGCGGTGCGCGGTGCGTAGTCTGGAGCTATGGTGGTGGTGGCAGCCGCGCCGAACCCGGCCGACGGGACCCCTAAAGTTCTGCTTCTGTCGGGGCAGCCCGCCTCCGCCGCCGGAGCCCCGGCCGGCCAGGCCCTGCCGCTCATGGTGCCAGCCCAGAGAGGGGCCAGCCCGGAGGCAGCGAGCGGGGGGCTGCCCCAGGCGCGCAAGCGACAGCGCCTCACGCACCTGAGCCCCGAGGAGAAGGCGCTGAGGAGGAAACTGAAAAACAGAGTAGCAGCTCAGACTGCCAGAGATCGAAAGAAGGCTCGAATGAGTGAGCTGGAACAGCAAGTGGTAGATTTAGAAGAAGAGAACCAAAAACTTTTGCTAGAAAATCAGCTTTTACGAGAGAAAACTCATGGCCTTGTAGTTGAGAACCAGGAGTTAAGACAGCGCTTGGGGATGGATGCCCTGGTTGCTGAAGAGGAGGCGGAAGCCAAGTCTGATATCCTGTTGGGCATTCTGGACAACTTGGACCCAGTCATGTTCTTCAAATGCCCTTCCCCAGAGCCTGCCAGCCTGGAGGAGCTCCCAGAGGTCTACCCAGAAGGACCCAGTTCCTTACCAGCCTCCCTTTCTCTGTCAGTGGGGACGTCATCAGCCAAGCTGGAAGCCATTAATGAACTAATTCGTTTTGACCACATATATACCAAGCCCCTAGTCTTAGAGATACCCTCTGAGACAGAGAGCCAAGCTAATGTGGTAGTGAAAATCGAGGAAGCACCTCTCAGCCCCTCAGAGAATGATCACCCTGAATTCATTGTCTCAGTGAAGGAAGAACCTGTAGAAGATGACCTCGTTCCGGAGCTGGGTATCTCAAATCTGCTTTCATCCAGCCACTGCCCAAAGCCATCTTCCTGCCTACTGGATGCTTACAGTGACTGTGGATACGGGGGTTCCCTTTCCCCATTCAGTGACATGTCCTCTCTGCTTGGTGTAAACCATTCTTGGGAGGACACTTTTGCCAATGAACTCTTTCCCCAGCTGATTAGTGTCTAAGGAATGATCCAATACTGTTGCCCTTTTCCTTGACTATTACACTGCCTGGAGGATAGCAGAGAAGCCTGTCTGTACTTCATTCAAAAAGCCAAAATAGAGAGTATACAGTCCTAGAGAATTCCTCTATTTGTTCAGATCTCATAGATGACCCCCAGGTATTGTCTTTTGACATCCAGCAGTCCAAGGTATTGAGACATATTACTGGAAGTAAGAAATATTACTATAATTGAGAACTACAGCTTTTAAGATTGTACTTTTATCTTAAAAGGGTGGTAGTTTTCCCTAAAATACTTATTATGTAAGGGTCATTAGACAAATGTCTTGAAGTAGACATGGAATTTATGAATGGTTCTTTATCATTTCTCTTCCCCCTTTTTGGCATCCTGGCTTGCCTCCAGTTTTAGGTCCTTTAGTTTGCTTCTGTAAGCAACGGGAACACCTGCTGAGGGGGCTCTTTCCCTCATGTATACTTCAAGTAAGATCAAGAATCTTTTGTGAAATTATAGAAATTTACTATGTAAATGCTTGATGGAATTTTTTCCTGCTAGTGTAGCTTCTGAAAGGTGCTTTCTCCATTTATTTAAAACTACCCATGCAATTAAAAGGTACAATGCA
SEQ ID 807:来自XBP1Δ4mRNA转录本的人类预测氨基酸序列(SEQ ID 562)
MVVVAAAPNPADGTPKVLLLSGQPASAAGAPAGQALPLMVPAQRGASPEAASGGLPQARKRQRLTHLSPEEKALRRKLKNRVAAQTARDRKKARMSELEQQVVDLEEENQKLLLENQLLREKTHGLVVENQELRQRLGMDALVAEEEAEAKSDILLGILDNLDPVMFFKCPSPEPASLEELPEVYPEGPSSLPASLSLSVGTSSAKLEAINELIRFDHIYTKPLVLEIPSETESQANVVVKIEEAPLSPSENDHPEFIVSVKEEPVEDDLVPELGISNLLSSSHCPKPSSCLLDAYSDCGYGGSLSPFSDMSSLLGVNHSWEDTFANELFPQLISV
序列表
<110> F. Hoffmann-La Roche AG
罗氏公司 (Hoffmann-La Roche Inc)
<120> 靶向 XBP1 的寡核苷酸
<130> P121437PCT
<140> EP 20216690.6
<141> 2020-12-22
<160> 1010
<170> PatentIn 版本 3.5
<210> 1
<211> 4008
<212> DNA
<213> 灰仓鼠
<400> 1
atggtggtgg tggcagcgtc gccgagcgcg gccacggcgg ccccgaaagt actgcttcta 60
tcgggccagc ccgccgcgga cggccgggcg ctgccactca tggttccagg ctcgcgggca 120
gcagggtccg aggcgaacgg ggcgccacag gctcgcaagc ggcagcgcct cacgcacctg 180
agcccggagg agaaggcgct gcggaggtgg gctcggcggg cggggcggca aggccgggca 240
tgggaccctt tctcgtgtgg cggtcgggag ggctctgtgg ggtggcgtag atgagcctct 300
agtacctatt tctggaggga ggcacggagc tgaggtgaca gcccctccga aggtctgctt 360
agtctgtgtc ggggagtcta acacttgtca gacgggacct gacgctcagc cctctgtgaa 420
tgcttgctct tcttggagga cccatggcag ggtccgctct ggctgttgtt gcagccgctt 480
gggaacttaa cactgggatc cgagtcacca tcctccggca gcccgagttg agcttgggga 540
gggacggttg gtagcgcccc cgccgccttc acggagcctg ttggacagaa tcggaactag 600
aaagccgcgg gggaggaggg aagatgctta tgacgcaacg ggaatgtgtg tcagcccggt 660
ggtaaaataa gactcgagtg gacagcaaca tgggagagaa tcgagcaagt cttcaaggcc 720
cacgggcaga aaagctgtgg tttttgtctt tttgagagga ggagcctcag aatgtgttta 780
ccactgttta gtcttattct gtaaagtcag cgaaagcacc agctggccac atttacaaat 840
gaagatacag gaaagctgaa gatgactcgg ttcgttatgt gccctgtctt ccttcaggaa 900
actgaaaaac agagtagcag cgcagactgc ccgagatcga aagaaagccc ggatgagcga 960
gctggaacag caagtggtgg atttggaaga agaggtaaag ggatttaagg ccatgctttc 1020
ttctctgccc attctaagct gctgcagccc tttagaatac aactaaagtg ccatttaaag 1080
tttaactagc ttagcagata ggtggtgaag gcagacatga ctcactcctg acagctagat 1140
actatcgata gaagttgctc agagattagc caggtcagat agatcctggc ttaaccttca 1200
gtactcttgc tcttgccaaa ggctcactag aattgccttc cttctagggt tctcttgtta 1260
tctaatctga gcaagggcta ttgttttaaa agttttaatc atcagctggt tcttagaaga 1320
aatgtgggtc atatcagtag cagtttaaaa aaaatatttt gttaggtata gcccaccatt 1380
cccactttgt ttttatactc agcatacaga gtattaggac attttcaaac agcgtgtttt 1440
agttaattga ttcttcctgc cattttccct acacccccag tatcctttta ccttctcttg 1500
gacttctagt tgttttttaa ggccttacac acatttacat ccattcatat gcattcacac 1560
tctcacacac agtaaggtct acatatgcaa gaaactcttg gttctgtttg ggccacctca 1620
cttaaaatat ttaacaaatc tacacatctt cctgccaact tctattttct ttatagccga 1680
gtaacattct tctgtgcaca tgtaccatat tttcatctgt ttcattggtg tctcccaatt 1740
gctggtgtta caggcatgag ccacccatgc tagttttatg tagagctgga ggctgaaccc 1800
agggcttcat gtgtagtagg gcaagcactc ttaccaactg atctacacca ttagccacca 1860
gtgttgcaac agttatgaac gactgcatat gcacagaatt tatcagttca atgaggaaac 1920
caactgtaac aaatcacgtt ttaatagcct cttctggatt ttcttacaga accaaaaact 1980
tctgttagaa aatcagcttt tgagagagaa aactcatggc cttgtaattg agaaccagga 2040
gttaagaact cgcttgggaa tggatgtgct gactactgaa gaggctccag agacggagtc 2100
caaggtaaat cttatgagac ttggttgtga catgaacgga ttgtatttgt gatcccaacc 2160
tctatcaagc cttccttttc tcttttcctt cttttgagac agggtcttaa tttcttaatt 2220
ttggatggtc ttgaaattgt atcagtttta tggcctctgc ctccaaagta atggaactag 2280
acatgtgcca ccatgcctag ctgatcagtc ttgaaaattt ctccacattt ccaacagacc 2340
tgttcagtct tcagtgactc attcttcaag tgtgtaatga agtgttacta agccctaata 2400
atcctaataa tttacatagc tctctcagaa taagtgctaa caccagtagc cagcaagcta 2460
taccatgcag gcatcaaata gaatgagact gtaagggcta gtcagatttg ggagattttg 2520
atcttgtttt gagacagagt ctctgtatat aattaaccca ggttggcttt ggactcatcc 2580
tctggccata gcctcccagg tgctgggatt ttaggcacta caattggctt gtttcctgga 2640
cttttgacag ccctcatgtg gcctaggttg gtcttaaact tgatatgtta gctgataatt 2700
ctgtctctgc tttccaagtg ttaagatacg ggcacatact actttatctg gcggagttat 2760
gtaggcatgg tgtttgtgta catgagtatc ttactaaatc tggagctagg ctggtggcta 2820
gcaaatcctg gtgatcctct tgtctctgtc tccctcagtg ttggggttat acaggcacaa 2880
ctgtcatgct ccaaatttta cattgatgct tgcctaacaa gcaggcttat gctctgagcc 2940
acctcccata gcctggtgtg catttccttg gagtgttccc tcactttggt ctttccttcc 3000
agggaaatgg agtaaggccg gtggccgggt ctgctgagtc cgcagcactc agactacgtg 3060
cacctctgca gcaggtgcag gcccagttgt cacctcccca gaacatcttc ccatggattc 3120
tgacactgtt gactcttcag actccgaggt agagcttgtt tgccttacta aagcactgtg 3180
taagattggc tcattctgta gtatatatat gatgtgtgac atgcctagcc aggcaaatgg 3240
agaaagaagt tagtattggt agggttaggg gtaagcagtc actttcttaa tttccagtgg 3300
tttaggtcat ggagtcggga gaagctgttc tgatgggtgt gtccttcgat ctgacagcat 3360
aaggcctaac tgacattgtg gaactcagta ctaagtgttt ctggtagacc atcacattct 3420
aatagtgaac tttttttgtc ttacctcttg cagtctgata tccttttggg cattctggac 3480
aagttggacc ctgtcatgtt tttcaaatgt ccatccccag agtctgccaa tctggaggaa 3540
ctcccagagg tctacccagg acctagttcc ttaccagcct ccctttctct gtcagtgggg 3600
acctcatcag ccaagctgga agccattaat gaactcattc gctttgacca tgtatacacc 3660
aagcctctag tcttagagat cccttctgag acagagagtc aaactaatgt ggtagtgaaa 3720
attgaggaag cacctctcag ctcttcagag gaggatcacc ctgaattcat tgtctcagtg 3780
aagaaagaac ctttggaaga agacttcatt ccagagccgg gcatctcaaa cctgctttca 3840
tccagccact gtctgaaacc atcttcctgc ctgctggatg cttatagtga ctgtggatat 3900
gagggctccc cttctccctt cagtgacatg tcttctccac ttggtataga ccattcttgg 3960
gaggacactt ttgccaatga actctttccc cagctaatta gtgtctaa 4008
<210> 2
<211> 1139
<212> DNA
<213> 灰仓鼠
<400> 2
atggtggtgg tggcagcggc gccgagcgcg gccacggcgg ccccgaaagt actgcttcta 60
tcgggccagc ccgccgcgga cggccgggcg ctgccactca tggttccagg ctcgcgggca 120
gcagggtccg aggcgaacgg ggcgccacag gctcgcaagc ggcagcgcct cacgcacctg 180
agcccggagg agaaggcgct gcggaggaaa ctgaaaaaca gagtagcagc gcagactgcc 240
cgagatcgaa agaaagcccg gatgagcgag ctggaacagc aagtggtgga tttggaagaa 300
gagaaccaaa aacttctgtt agaaaatcag cttttgagag agaaaactca tggccttgta 360
attgagaacc aggagttaag aactcgcttg ggaatggatg tgctgactac tgaagaggct 420
ccagagacgg agtccaaggg aaatggagta aggccggtgg ccgggtctgc tgagtccgca 480
gcactcagac tacgtgcacc tctgcagcag gtgcaggccc agttgtcacc tccccagaac 540
atcttcccat ggattctgac actgttgact cttcagactc cgagtctgat atccttttgg 600
gcattctgga caagttggac cctgtcatgt ttttcaaatg tccatcccca gagtctgcca 660
atctggagga actcccagag gtctacccag gacctagttc cttaccagcc tccctttctc 720
tgtcagtggg gacctcatca gccaagctgg aagccattaa tgaactcatt cgctttgacc 780
atgtatacac caagcctcta gtcttagaga tcccttctga gacagagagt caaactaatg 840
tggtagtgaa aattgaggaa gcacctctca gctcttcaga ggaggatcac cctgaattca 900
ttgtctcagt gaagaaagaa cctttggaag aagacttcat tccagagccg ggcatctcaa 960
acctgctttc atccagccac tgtctgaaac catcttcctg cctgctggat gcttatagtg 1020
actgtggata tgagggctcc ccttctccct tcagtgacat gtcttctcca cttggtatag 1080
accattcttg ggaggacact tttgccaatg aactctttcc ccagctaatt agtgtctaa 1139
<210> 3
<211> 266
<212> PRT
<213> 灰仓鼠
<400> 3
Met Val Val Val Ala Ala Ala Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ala Asp Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Ser Arg Ala Ala Gly Ser Glu Ala Asn Gly Ala
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu
130 135 140
Ser Lys Gly Asn Gly Val Arg Pro Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Leu Arg Leu Arg Ala Pro Leu Gln Gln Val Gln Ala Gln Leu Ser
165 170 175
Pro Pro Gln Asn Ile Phe Pro Trp Ile Leu Thr Leu Leu Thr Leu Gln
180 185 190
Thr Pro Ser Leu Ile Ser Phe Trp Ala Phe Trp Thr Ser Trp Thr Leu
195 200 205
Ser Cys Phe Ser Asn Val His Pro Gln Ser Leu Pro Ile Trp Arg Asn
210 215 220
Ser Gln Arg Ser Thr Gln Asp Leu Val Pro Tyr Gln Pro Pro Phe Leu
225 230 235 240
Cys Gln Trp Gly Pro His Gln Pro Ser Trp Lys Pro Leu Met Asn Ser
245 250 255
Phe Ala Leu Thr Met Tyr Thr Pro Ser Leu
260 265
<210> 4
<211> 1113
<212> DNA
<213> 灰仓鼠
<400> 4
atggtggtgg tggcagcgtc gccgagcgcg gccacggcgg ccccgaaagt actgcttcta 60
tcgggccagc ccgccgcgga cggccgggcg ctgccactca tggttccagg ctcgcgggca 120
gcagggtccg aggcgaacgg ggcgccacag gctcgcaagc ggcagcgcct cacgcacctg 180
agcccggagg agaaggcgct gcggaggaaa ctgaaaaaca gagtagcagc gcagactgcc 240
cgagatcgaa agaaagcccg gatgagcgag ctggaacagc aagtggtgga tttggaagaa 300
gagaaccaaa aacttctgtt agaaaatcag cttttgagag agaaaactca tggccttgta 360
attgagaacc aggagttaag aactcgcttg ggaatggatg tgctgactac tgaagaggct 420
ccagagacgg agtccaaggg aaatggagta aggccggtgg ccgggtctgc tgagtccgca 480
gcaggtgcag gcccagttgt cacctcccca gaacatcttc ccatggattc tgacactgtt 540
gactcttcag actccgagtc tgatatcctt ttgggcattc tggacaagtt ggaccctgtc 600
atgtttttca aatgtccatc cccagagtct gccaatctgg aggaactccc agaggtctac 660
ccaggaccta gttccttacc agcctccctt tctctgtcag tggggacctc atcagccaag 720
ctggaagcca ttaatgaact cattcgcttt gaccatgtat acaccaagcc tctagtctta 780
gagatccctt ctgagacaga gagtcaaact aatgtggtag tgaaaattga ggaagcacct 840
ctcagctctt cagaggagga tcaccctgaa ttcattgtct cagtgaagaa agaacctttg 900
gaagaagact tcattccaga gccgggcatc tcaaacctgc tttcatccag ccactgtctg 960
aaaccatctt cctgcctgct ggatgcttat agtgactgtg gatatgaggg ctccccttct 1020
cccttcagtg acatgtcttc tccacttggt atagaccatt cttgggagga cacttttgcc 1080
aatgaactct ttccccagct gattagtgtc taa 1113
<210> 5
<211> 370
<212> PRT
<213> 灰仓鼠
<400> 5
Met Val Val Val Ala Ala Ser Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ala Asp Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Ser Arg Ala Ala Gly Ser Glu Ala Asn Gly Ala
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu
130 135 140
Ser Lys Gly Asn Gly Val Arg Pro Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp
165 170 175
Ser Asp Thr Val Asp Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Ser Ala Asn Leu Glu Glu Leu Pro Glu Val Tyr Pro Gly Pro Ser
210 215 220
Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala Lys
225 230 235 240
Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr Lys
245 250 255
Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn Val
260 265 270
Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp His
275 280 285
Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Leu Glu Glu Asp Phe
290 295 300
Ile Pro Glu Pro Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys Leu
305 310 315 320
Lys Pro Ser Ser Cys Leu Leu Asp Ala Tyr Ser Asp Cys Gly Tyr Glu
325 330 335
Gly Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Ile Asp
340 345 350
His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu Ile
355 360 365
Ser Val
370
<210> 6
<211> 993
<212> DNA
<213> 灰仓鼠
<400> 6
atggtggtgg tggcagcggc gccgagcgcg gccacggcgg ccccgaaagt actgcttcta 60
tcgggccagc ccgccgcgga cggccgggcg ctgccactca tggttccagg ctcgcgggca 120
gcagggtccg aggcgaacgg ggcgccacag gctcgcaagc ggcagcgcct cacgcacctg 180
agcccggagg agaaggcgct gcggaggaaa ctgaaaaaca gagtagcagc gcagactgcc 240
cgagatcgaa agaaagcccg gatgagcgag ctggaacagc aagtggtgga tttggaagaa 300
gagaaccaaa aacttctgtt agaaaatcag cttttgagag agaaaactca tggccttgta 360
attgagaacc aggagttaag aactcgcttg ggaatggatg tgctgactac tgaagaggct 420
ccagagacgg agtccaagtc tgatatcctt ttgggcattc tggacaagtt ggaccctgtc 480
atgtttttca aatgtccatc cccagagtct gccaatctgg aggaactccc agaggtctac 540
ccaggaccta gttccttacc agcctccctt tctctgtcag tggggacctc atcagccaag 600
ctggaagcca ttaatgaact cattcgcttt gaccatgtat acaccaagcc tctagtctta 660
gagatccctt ctgagacaga gagtcaaact aatgtggtag tgaaaattga ggaagcacct 720
ctcagctctt cagaggagga tcaccctgaa ttcattgtct cagtgaagaa agaacctttg 780
gaagaagact tcattccaga gccgggcatc tcaaacctgc tttcatccag ccactgtctg 840
aaaccatctt cctgcctgct ggatgcttat agtgactgtg gatatgaggg ctccccttct 900
cccttcagtg acatgtcttc tccacttggt atagaccatt cttgggagga cacttttgcc 960
aatgaactct ttccccagct aattagtgtc taa 993
<210> 7
<211> 330
<212> PRT
<213> 灰仓鼠
<400> 7
Met Val Val Val Ala Ala Ala Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ala Asp Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Ser Arg Ala Ala Gly Ser Glu Ala Asn Gly Ala
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu
130 135 140
Ser Lys Ser Asp Ile Leu Leu Gly Ile Leu Asp Lys Leu Asp Pro Val
145 150 155 160
Met Phe Phe Lys Cys Pro Ser Pro Glu Ser Ala Asn Leu Glu Glu Leu
165 170 175
Pro Glu Val Tyr Pro Gly Pro Ser Ser Leu Pro Ala Ser Leu Ser Leu
180 185 190
Ser Val Gly Thr Ser Ser Ala Lys Leu Glu Ala Ile Asn Glu Leu Ile
195 200 205
Arg Phe Asp His Val Tyr Thr Lys Pro Leu Val Leu Glu Ile Pro Ser
210 215 220
Glu Thr Glu Ser Gln Thr Asn Val Val Val Lys Ile Glu Glu Ala Pro
225 230 235 240
Leu Ser Ser Ser Glu Glu Asp His Pro Glu Phe Ile Val Ser Val Lys
245 250 255
Lys Glu Pro Leu Glu Glu Asp Phe Ile Pro Glu Pro Gly Ile Ser Asn
260 265 270
Leu Leu Ser Ser Ser His Cys Leu Lys Pro Ser Ser Cys Leu Leu Asp
275 280 285
Ala Tyr Ser Asp Cys Gly Tyr Glu Gly Ser Pro Ser Pro Phe Ser Asp
290 295 300
Met Ser Ser Pro Leu Gly Ile Asp His Ser Trp Glu Asp Thr Phe Ala
305 310 315 320
Asn Glu Leu Phe Pro Gln Leu Ile Ser Val
325 330
<210> 8
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 8
ccctggaagg aaag 14
<210> 9
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 9
ttccctggaa ggaa 14
<210> 10
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 10
tttccctgga agga 14
<210> 11
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 11
atttccctgg aagg 14
<210> 12
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 12
catttccctg gaag 14
<210> 13
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 13
ccatttccct ggaa 14
<210> 14
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 14
tccatttccc tgga 14
<210> 15
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 15
ctccatttcc ctgg 14
<210> 16
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 16
actccatttc cctg 14
<210> 17
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 17
tactccattt ccct 14
<210> 18
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 18
ttactccatt tccc 14
<210> 19
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 19
cttactccat ttcc 14
<210> 20
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 20
ccttactcca tttc 14
<210> 21
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 21
gccttactcc attt 14
<210> 22
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 22
ggccttactc catt 14
<210> 23
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 23
gaaagaccaa agtg 14
<210> 24
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 24
aggaaagacc aaag 14
<210> 25
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 25
gaaggaaaga ccaa 14
<210> 26
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 26
ggaaggaaag acca 14
<210> 27
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 27
tggaaggaaa gacc 14
<210> 28
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 28
ctggaaggaa agac 14
<210> 29
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 29
cctggaagga aaga 14
<210> 30
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 30
ccctggaagg aaag 14
<210> 31
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 31
tccctggaag gaaa 14
<210> 32
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 32
ttccctggaa ggaa 14
<210> 33
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 33
tttccctgga agga 14
<210> 34
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 34
atttccctgg aagg 14
<210> 35
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 35
catttccctg gaag 14
<210> 36
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 36
ccatttccct ggaa 14
<210> 37
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 37
tccatttccc tgga 14
<210> 38
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 38
ctccatttcc ctgg 14
<210> 39
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 39
actccatttc cctg 14
<210> 40
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 40
tactccattt ccct 14
<210> 41
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 41
ttactccatt tccc 14
<210> 42
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 42
cttactccat ttcc 14
<210> 43
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 43
ccttactcca tttc 14
<210> 44
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 44
gccttactcc attt 14
<210> 45
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 45
ggccttactc catt 14
<210> 46
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 46
ccggccttac tcca 14
<210> 47
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 47
caccggcctt actc 14
<210> 48
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 48
ccactggaaa ttaagaaa 18
<210> 49
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 49
ctggaaatta agaaagtg 18
<210> 50
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 50
gaaattaaga aagtgact 18
<210> 51
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 51
attaagaaag tgactgct 18
<210> 52
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 52
aagaaagtga ctgcttac 18
<210> 53
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 53
aaagtgactg cttacccc 18
<210> 54
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 54
gtgactgctt acccctaa 18
<210> 55
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 55
actgcttacc cctaaccc 18
<210> 56
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 56
gcttacccct aaccctac 18
<210> 57
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 57
tacccctaac cctaccaa 18
<210> 58
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 58
ccctaaccct accaatac 18
<210> 59
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 59
taaccctacc aatactaa 18
<210> 60
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 60
ccctaccaat actaactt 18
<210> 61
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 61
taccaatact aacttctt 18
<210> 62
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 62
caatactaac ttctttct 18
<210> 63
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 63
tactaacttc tttctcca 18
<210> 64
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 64
taacttcttt ctccattt 18
<210> 65
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 65
cttctttctc catttgcc 18
<210> 66
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 66
ctttctccat ttgcctgg 18
<210> 67
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 67
tctccatttg cctggcta 18
<210> 68
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 68
ccatttgcct ggctaggc 18
<210> 69
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 69
tttgcctggc taggcatg 18
<210> 70
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 70
gcctggctag gcatgtca 18
<210> 71
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 71
tggctaggca tgtcacac 18
<210> 72
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 72
ctaggcatgt cacacatc 18
<210> 73
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 73
ggcatgtcac acatcata 18
<210> 74
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 74
atgtcacaca tcatatat 18
<210> 75
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 75
tcacacatca tatatata 18
<210> 76
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 76
cacatcatat atatacta 18
<210> 77
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 77
atcatatata tactacag 18
<210> 78
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 78
atatatatac tacagaat 18
<210> 79
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 79
tatatactac agaatgag 18
<210> 80
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 80
atactacaga atgagcca 18
<210> 81
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 81
ctacagaatg agccaatc 18
<210> 82
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 82
cagaatgagc caatctta 18
<210> 83
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 83
aatgagccaa tcttacac 18
<210> 84
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 84
gagccaatct tacacagt 18
<210> 85
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 85
ccaatcttac acagtgct 18
<210> 86
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 86
atcttacaca gtgcttta 18
<210> 87
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 87
ttacacagtg ctttagta 18
<210> 88
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 88
cacagtgctt tagtaagg 18
<210> 89
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 89
agtgctttag taaggcaa 18
<210> 90
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 90
gctttagtaa ggcaaaca 18
<210> 91
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 91
ttagtaaggc aaacaagc 18
<210> 92
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 92
gtaaggcaaa caagctct 18
<210> 93
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 93
aggcaaacaa gctctacc 18
<210> 94
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 94
caaacaagct ctacctcg 18
<210> 95
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 95
acaagctcta cctcggag 18
<210> 96
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 96
agctctacct cggagtct 18
<210> 97
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 97
tctacctcgg agtctgaa 18
<210> 98
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 98
acctcggagt ctgaagag 18
<210> 99
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 99
tcggagtctg aagagtca 18
<210> 100
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 100
gagtctgaag agtcaaca 18
<210> 101
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 101
tctgaagagt caacagtg 18
<210> 102
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 102
gaagagtcaa cagtgtca 18
<210> 103
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 103
gagtcaacag tgtcagaa 18
<210> 104
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 104
tcaacagtgt cagaatcc 18
<210> 105
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 105
acagtgtcag aatccatg 18
<210> 106
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 106
gtgtcagaat ccatggga 18
<210> 107
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 107
tcagaatcca tgggaaga 18
<210> 108
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 108
gaatccatgg gaagatgt 18
<210> 109
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 109
tccatgggaa gatgttct 18
<210> 110
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 110
atgggaagat gttctggg 18
<210> 111
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 111
ggaagatgtt ctggggag 18
<210> 112
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 112
agatgttctg gggaggtg 18
<210> 113
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 113
tgttctgggg aggtgaca 18
<210> 114
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 114
tctggggagg tgacaact 18
<210> 115
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 115
ggggaggtga caactggg 18
<210> 116
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 116
gaggtgacaa ctgggcct 18
<210> 117
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 117
gtgacaactg ggcctgca 18
<210> 118
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 118
acaactgggc ctgcacct 18
<210> 119
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 119
actgggcctg cacctgct 18
<210> 120
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 120
gggcctgcac ctgctgca 18
<210> 121
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 121
cctgcacctg ctgcagag 18
<210> 122
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 122
gcacctgctg cagaggtg 18
<210> 123
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 123
cctgctgcag aggtgcac 18
<210> 124
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 124
gctgcagagg tgcacgta 18
<210> 125
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 125
gcagaggtgc acgtagtc 18
<210> 126
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 126
gaggtgcacg tagtctga 18
<210> 127
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 127
gtgcacgtag tctgagtg 18
<210> 128
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 128
cacgtagtct gagtgctg 18
<210> 129
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 129
gtagtctgag tgctgcgg 18
<210> 130
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 130
gtctgagtgc tgcggact 18
<210> 131
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 131
tgagtgctgc ggactcag 18
<210> 132
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 132
gtgctgcgga ctcagcag 18
<210> 133
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 133
ctgcggactc agcagacc 18
<210> 134
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 134
cggactcagc agacccgg 18
<210> 135
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 135
actcagcaga cccggcca 18
<210> 136
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 136
cagcagaccc ggccaccg 18
<210> 137
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 137
cagacccggc caccggcc 18
<210> 138
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 138
acccggccac cggcctta 18
<210> 139
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 139
cggccaccgg ccttactc 18
<210> 140
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 140
ccaccggcct tactccat 18
<210> 141
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 141
ccggccttac tccatttc 18
<210> 142
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 142
gccttactcc atttccct 18
<210> 143
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 143
ttactccatt tccctgga 18
<210> 144
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 144
ctccatttcc ctggaagg 18
<210> 145
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 145
catttccctg gaaggaaa 18
<210> 146
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 146
ttccctggaa ggaaagac 18
<210> 147
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 147
cctggaagga aagaccaa 18
<210> 148
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 148
ggaaggaaag accaaagt 18
<210> 149
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 149
aggaaagacc aaagtgag 18
<210> 150
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 150
aaagaccaaa gtgaggga 18
<210> 151
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 151
gaccaaagtg agggaaca 18
<210> 152
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 152
caaagtgagg gaacactc 18
<210> 153
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 153
agtgagggaa cactccaa 18
<210> 154
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 154
gagggaacac tccaagga 18
<210> 155
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 155
ggaacactcc aaggaaat 18
<210> 156
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 156
acactccaag gaaatgca 18
<210> 157
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 157
ctccaaggaa atgcacac 18
<210> 158
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 158
caaggaaatg cacaccag 18
<210> 159
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 159
ggaaatgcac accaggct 18
<210> 160
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 160
aatgcacacc aggctatg 18
<210> 161
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 161
gcacaccagg ctatggga 18
<210> 162
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 162
caccaggcta tgggaggt 18
<210> 163
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 163
caggctatgg gaggtggc 18
<210> 164
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 164
gctatgggag gtggctca 18
<210> 165
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 165
atgggaggtg gctcagag 18
<210> 166
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 166
ggaggtggct cagagcat 18
<210> 167
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 167
ggtggctcag agcataag 18
<210> 168
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 168
ggctcagagc ataagcct 18
<210> 169
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 169
tcagagcata agcctgct 18
<210> 170
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 170
gagcataagc ctgcttgt 18
<210> 171
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 171
cataagcctg cttgttag 18
<210> 172
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 172
aagcctgctt gttaggca 18
<210> 173
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 173
cctgcttgtt aggcaagc 18
<210> 174
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 174
gcttgttagg caagcatc 18
<210> 175
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 175
tgttaggcaa gcatcaat 18
<210> 176
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 176
taggcaagca tcaatgta 18
<210> 177
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 177
gcaagcatca atgtaaaa 18
<210> 178
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 178
agcatcaatg taaaattt 18
<210> 179
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 179
atcaatgtaa aatttgga 18
<210> 180
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 180
aatgtaaaat ttggagca 18
<210> 181
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 181
gtaaaatttg gagcatga 18
<210> 182
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 182
aaatttggag catgacag 18
<210> 183
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 183
tttggagcat gacagttg 18
<210> 184
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 184
ggagcatgac agttgtgc 18
<210> 185
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 185
gcatgacagt tgtgcctg 18
<210> 186
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 186
tgacagttgt gcctgtat 18
<210> 187
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 187
cagttgtgcc tgtataac 18
<210> 188
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 188
ttgtgcctgt ataacccc 18
<210> 189
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 189
tgcctgtata accccaac 18
<210> 190
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 190
ctgtataacc ccaacact 18
<210> 191
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 191
tataacccca acactgag 18
<210> 192
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 192
aaccccaaca ctgaggga 18
<210> 193
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 193
caagctctac ctcggagt 18
<210> 194
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 194
aagctctacc tcggagtc 18
<210> 195
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 195
gctctacctc ggagtctg 18
<210> 196
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 196
ctctacctcg gagtctga 18
<210> 197
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 197
ctacctcgga gtctgaag 18
<210> 198
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 198
tacctcggag tctgaaga 18
<210> 199
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 199
cctcggagtc tgaagagt 18
<210> 200
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 200
ctcggagtct gaagagtc 18
<210> 201
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 201
cggagtctga agagtcaa 18
<210> 202
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 202
ggagtctgaa gagtcaac 18
<210> 203
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 203
agtctgaaga gtcaacag 18
<210> 204
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 204
gtctgaagag tcaacagt 18
<210> 205
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 205
ctgaagagtc aacagtgt 18
<210> 206
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 206
tgaagagtca acagtgtc 18
<210> 207
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 207
aagagtcaac agtgtcag 18
<210> 208
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 208
agagtcaaca gtgtcaga 18
<210> 209
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 209
agtcaacagt gtcagaat 18
<210> 210
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 210
gtcaacagtg tcagaatc 18
<210> 211
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 211
caacagtgtc agaatcca 18
<210> 212
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 212
aacagtgtca gaatccat 18
<210> 213
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 213
cagtgtcaga atccatgg 18
<210> 214
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 214
agtgtcagaa tccatggg 18
<210> 215
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 215
tgtcagaatc catgggaa 18
<210> 216
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 216
gtcagaatcc atgggaag 18
<210> 217
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 217
cagaatccat gggaagat 18
<210> 218
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 218
agaatccatg ggaagatg 18
<210> 219
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 219
aatccatggg aagatgtt 18
<210> 220
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 220
atccatggga agatgttc 18
<210> 221
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 221
ccatgggaag atgttctg 18
<210> 222
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 222
catgggaaga tgttctgg 18
<210> 223
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 223
tgggaagatg ttctgggg 18
<210> 224
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 224
gggaagatgt tctgggga 18
<210> 225
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 225
gaagatgttc tggggagg 18
<210> 226
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 226
aagatgttct ggggaggt 18
<210> 227
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 227
gatgttctgg ggaggtga 18
<210> 228
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 228
atgttctggg gaggtgac 18
<210> 229
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 229
gttctgggga ggtgacaa 18
<210> 230
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 230
ttctggggag gtgacaac 18
<210> 231
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 231
ctggggaggt gacaactg 18
<210> 232
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 232
tggggaggtg acaactgg 18
<210> 233
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 233
gggaggtgac aactgggc 18
<210> 234
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 234
ggaggtgaca actgggcc 18
<210> 235
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 235
aggtgacaac tgggcctg 18
<210> 236
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 236
ggtgacaact gggcctgc 18
<210> 237
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 237
tgacaactgg gcctgcac 18
<210> 238
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 238
gacaactggg cctgcacc 18
<210> 239
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 239
caactgggcc tgcacctg 18
<210> 240
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 240
aactgggcct gcacctgc 18
<210> 241
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 241
ctgggcctgc acctgctg 18
<210> 242
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 242
tgggcctgca cctgctgc 18
<210> 243
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 243
ggcctgcacc tgctgcag 18
<210> 244
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 244
gcctgcacct gctgcaga 18
<210> 245
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 245
ctgcacctgc tgcagagg 18
<210> 246
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 246
tgcacctgct gcagaggt 18
<210> 247
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 247
cacctgctgc agaggtgc 18
<210> 248
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 248
acctgctgca gaggtgca 18
<210> 249
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 249
ctgctgcaga ggtgcacg 18
<210> 250
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 250
tgctgcagag gtgcacgt 18
<210> 251
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 251
ctgcagaggt gcacgtag 18
<210> 252
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 252
tgcagaggtg cacgtagt 18
<210> 253
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 253
cagaggtgca cgtagtct 18
<210> 254
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 254
agaggtgcac gtagtctg 18
<210> 255
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 255
aggtgcacgt agtctgag 18
<210> 256
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 256
ggtgcacgta gtctgagt 18
<210> 257
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 257
tgcacgtagt ctgagtgc 18
<210> 258
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 258
gcacgtagtc tgagtgct 18
<210> 259
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 259
acgtagtctg agtgctgc 18
<210> 260
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 260
cgtagtctga gtgctgcg 18
<210> 261
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 261
tagtctgagt gctgcgga 18
<210> 262
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 262
agtctgagtg ctgcggac 18
<210> 263
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 263
tctgagtgct gcggactc 18
<210> 264
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 264
ctgagtgctg cggactca 18
<210> 265
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 265
gagtgctgcg gactcagc 18
<210> 266
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 266
agtgctgcgg actcagca 18
<210> 267
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 267
tgctgcggac tcagcaga 18
<210> 268
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 268
gctgcggact cagcagac 18
<210> 269
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 269
tgcggactca gcagaccc 18
<210> 270
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 270
gcggactcag cagacccg 18
<210> 271
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 271
ggactcagca gacccggc 18
<210> 272
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 272
gactcagcag acccggcc 18
<210> 273
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 273
ctcagcagac ccggccac 18
<210> 274
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 274
tcagcagacc cggccacc 18
<210> 275
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 275
agcagacccg gccaccgg 18
<210> 276
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 276
gcagacccgg ccaccggc 18
<210> 277
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 277
agacccggcc accggcct 18
<210> 278
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 278
gacccggcca ccggcctt 18
<210> 279
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 279
cccggccacc ggccttac 18
<210> 280
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 280
ccggccaccg gccttact 18
<210> 281
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 281
ggccaccggc cttactcc 18
<210> 282
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 282
gccaccggcc ttactcca 18
<210> 283
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 283
caccggcctt actccatt 18
<210> 284
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 284
accggcctta ctccattt 18
<210> 285
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 285
cggccttact ccatttcc 18
<210> 286
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 286
ggccttactc catttccc 18
<210> 287
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 287
ccttactcca tttccctg 18
<210> 288
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 288
cttactccat ttccctgg 18
<210> 289
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 289
tactccattt ccctggaa 18
<210> 290
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 290
actccatttc cctggaag 18
<210> 291
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 291
tccatttccc tggaagga 18
<210> 292
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 292
ccatttccct ggaaggaa 18
<210> 293
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 293
atttccctgg aaggaaag 18
<210> 294
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 294
tttccctgga aggaaaga 18
<210> 295
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 295
tccctggaag gaaagacc 18
<210> 296
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 296
ccctggaagg aaagacca 18
<210> 297
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 297
ctggaaggaa agaccaaa 18
<210> 298
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 298
tggaaggaaa gaccaaag 18
<210> 299
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 299
ctttccttcc aggg 14
<210> 300
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 300
ttccttccag ggaa 14
<210> 301
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 301
tccttccagg gaaa 14
<210> 302
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 302
ccttccaggg aaat 14
<210> 303
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 303
cttccaggga aatg 14
<210> 304
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 304
ttccagggaa atgg 14
<210> 305
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 305
tccagggaaa tgga 14
<210> 306
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 306
ccagggaaat ggag 14
<210> 307
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 307
cagggaaatg gagt 14
<210> 308
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 308
agggaaatgg agta 14
<210> 309
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 309
gggaaatgga gtaa 14
<210> 310
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 310
ggaaatggag taag 14
<210> 311
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 311
gaaatggagt aagg 14
<210> 312
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 312
aaatggagta aggc 14
<210> 313
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 313
aatggagtaa ggcc 14
<210> 314
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 314
cactttggtc tttc 14
<210> 315
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 315
ctttggtctt tcct 14
<210> 316
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 316
ttggtctttc cttc 14
<210> 317
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 317
tggtctttcc ttcc 14
<210> 318
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 318
ggtctttcct tcca 14
<210> 319
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 319
gtctttcctt ccag 14
<210> 320
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 320
tctttccttc cagg 14
<210> 321
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 321
ctttccttcc aggg 14
<210> 322
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 322
tttccttcca ggga 14
<210> 323
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 323
ttccttccag ggaa 14
<210> 324
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 324
tccttccagg gaaa 14
<210> 325
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 325
ccttccaggg aaat 14
<210> 326
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 326
cttccaggga aatg 14
<210> 327
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 327
ttccagggaa atgg 14
<210> 328
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 328
tccagggaaa tgga 14
<210> 329
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 329
ccagggaaat ggag 14
<210> 330
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 330
cagggaaatg gagt 14
<210> 331
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 331
agggaaatgg agta 14
<210> 332
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 332
gggaaatgga gtaa 14
<210> 333
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 333
ggaaatggag taag 14
<210> 334
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 334
gaaatggagt aagg 14
<210> 335
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 335
aaatggagta aggc 14
<210> 336
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 336
aatggagtaa ggcc 14
<210> 337
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 337
tggagtaagg ccgg 14
<210> 338
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 338
gagtaaggcc ggtg 14
<210> 339
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 339
tttcttaatt tccagtgg 18
<210> 340
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 340
cactttctta atttccag 18
<210> 341
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 341
agtcactttc ttaatttc 18
<210> 342
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 342
agcagtcact ttcttaat 18
<210> 343
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 343
gtaagcagtc actttctt 18
<210> 344
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 344
ggggtaagca gtcacttt 18
<210> 345
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 345
ttaggggtaa gcagtcac 18
<210> 346
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 346
gggttagggg taagcagt 18
<210> 347
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 347
gtagggttag gggtaagc 18
<210> 348
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 348
ttggtagggt taggggta 18
<210> 349
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 349
gtattggtag ggttaggg 18
<210> 350
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 350
ttagtattgg tagggtta 18
<210> 351
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 351
aagttagtat tggtaggg 18
<210> 352
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 352
aagaagttag tattggta 18
<210> 353
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 353
agaaagaagt tagtattg 18
<210> 354
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 354
tggagaaaga agttagta 18
<210> 355
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 355
aaatggagaa agaagtta 18
<210> 356
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 356
ggcaaatgga gaaagaag 18
<210> 357
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 357
ccaggcaaat ggagaaag 18
<210> 358
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 358
tagccaggca aatggaga 18
<210> 359
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 359
gcctagccag gcaaatgg 18
<210> 360
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 360
catgcctagc caggcaaa 18
<210> 361
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 361
tgacatgcct agccaggc 18
<210> 362
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 362
gtgtgacatg cctagcca 18
<210> 363
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 363
gatgtgtgac atgcctag 18
<210> 364
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 364
tatgatgtgt gacatgcc 18
<210> 365
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 365
atatatgatg tgtgacat 18
<210> 366
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 366
tatatatatg atgtgtga 18
<210> 367
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 367
tagtatatat atgatgtg 18
<210> 368
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 368
ctgtagtata tatatgat 18
<210> 369
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 369
attctgtagt atatatat 18
<210> 370
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 370
ctcattctgt agtatata 18
<210> 371
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 371
tggctcattc tgtagtat 18
<210> 372
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 372
gattggctca ttctgtag 18
<210> 373
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 373
taagattggc tcattctg 18
<210> 374
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 374
gtgtaagatt ggctcatt 18
<210> 375
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 375
actgtgtaag attggctc 18
<210> 376
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 376
agcactgtgt aagattgg 18
<210> 377
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 377
taaagcactg tgtaagat 18
<210> 378
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 378
tactaaagca ctgtgtaa 18
<210> 379
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 379
ccttactaaa gcactgtg 18
<210> 380
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 380
ttgccttact aaagcact 18
<210> 381
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 381
tgtttgcctt actaaagc 18
<210> 382
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 382
gcttgtttgc cttactaa 18
<210> 383
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 383
agagcttgtt tgccttac 18
<210> 384
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 384
ggtagagctt gtttgcct 18
<210> 385
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 385
cgaggtagag cttgtttg 18
<210> 386
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 386
ctccgaggta gagcttgt 18
<210> 387
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 387
agactccgag gtagagct 18
<210> 388
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 388
ttcagactcc gaggtaga 18
<210> 389
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 389
ctcttcagac tccgaggt 18
<210> 390
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 390
tgactcttca gactccga 18
<210> 391
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 391
tgttgactct tcagactc 18
<210> 392
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 392
cactgttgac tcttcaga 18
<210> 393
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 393
tgacactgtt gactcttc 18
<210> 394
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 394
ttctgacact gttgactc 18
<210> 395
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 395
ggattctgac actgttga 18
<210> 396
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 396
catggattct gacactgt 18
<210> 397
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 397
tcccatggat tctgacac 18
<210> 398
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 398
tcttcccatg gattctga 18
<210> 399
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 399
acatcttccc atggattc 18
<210> 400
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 400
agaacatctt cccatgga 18
<210> 401
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 401
cccagaacat cttcccat 18
<210> 402
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 402
ctccccagaa catcttcc 18
<210> 403
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 403
cacctcccca gaacatct 18
<210> 404
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 404
tgtcacctcc ccagaaca 18
<210> 405
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 405
agttgtcacc tccccaga 18
<210> 406
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 406
cccagttgtc acctcccc 18
<210> 407
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 407
aggcccagtt gtcacctc 18
<210> 408
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 408
tgcaggccca gttgtcac 18
<210> 409
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 409
aggtgcaggc ccagttgt 18
<210> 410
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 410
agcaggtgca ggcccagt 18
<210> 411
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 411
tgcagcaggt gcaggccc 18
<210> 412
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 412
ctctgcagca ggtgcagg 18
<210> 413
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 413
cacctctgca gcaggtgc 18
<210> 414
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 414
gtgcacctct gcagcagg 18
<210> 415
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 415
tacgtgcacc tctgcagc 18
<210> 416
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 416
gactacgtgc acctctgc 18
<210> 417
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 417
tcagactacg tgcacctc 18
<210> 418
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 418
cactcagact acgtgcac 18
<210> 419
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 419
cagcactcag actacgtg 18
<210> 420
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 420
ccgcagcact cagactac 18
<210> 421
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 421
agtccgcagc actcagac 18
<210> 422
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 422
ctgagtccgc agcactca 18
<210> 423
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 423
ctgctgagtc cgcagcac 18
<210> 424
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 424
ggtctgctga gtccgcag 18
<210> 425
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 425
ccgggtctgc tgagtccg 18
<210> 426
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 426
tggccgggtc tgctgagt 18
<210> 427
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 427
cggtggccgg gtctgctg 18
<210> 428
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 428
ggccggtggc cgggtctg 18
<210> 429
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 429
taaggccggt ggccgggt 18
<210> 430
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 430
gagtaaggcc ggtggccg 18
<210> 431
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 431
atggagtaag gccggtgg 18
<210> 432
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 432
gaaatggagt aaggccgg 18
<210> 433
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 433
agggaaatgg agtaaggc 18
<210> 434
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 434
tccagggaaa tggagtaa 18
<210> 435
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 435
ccttccaggg aaatggag 18
<210> 436
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 436
tttccttcca gggaaatg 18
<210> 437
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 437
gtctttcctt ccagggaa 18
<210> 438
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 438
ttggtctttc cttccagg 18
<210> 439
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 439
actttggtct ttccttcc 18
<210> 440
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 440
ctcactttgg tctttcct 18
<210> 441
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 441
tccctcactt tggtcttt 18
<210> 442
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 442
tgttccctca ctttggtc 18
<210> 443
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 443
gagtgttccc tcactttg 18
<210> 444
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 444
ttggagtgtt ccctcact 18
<210> 445
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 445
tccttggagt gttccctc 18
<210> 446
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 446
atttccttgg agtgttcc 18
<210> 447
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 447
tgcatttcct tggagtgt 18
<210> 448
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 448
gtgtgcattt ccttggag 18
<210> 449
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 449
ctggtgtgca tttccttg 18
<210> 450
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 450
agcctggtgt gcatttcc 18
<210> 451
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 451
catagcctgg tgtgcatt 18
<210> 452
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 452
tcccatagcc tggtgtgc 18
<210> 453
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 453
acctcccata gcctggtg 18
<210> 454
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 454
gccacctccc atagcctg 18
<210> 455
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 455
tgagccacct cccatagc 18
<210> 456
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 456
ctctgagcca cctcccat 18
<210> 457
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 457
atgctctgag ccacctcc 18
<210> 458
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 458
cttatgctct gagccacc 18
<210> 459
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 459
aggcttatgc tctgagcc 18
<210> 460
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 460
agcaggctta tgctctga 18
<210> 461
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 461
acaagcaggc ttatgctc 18
<210> 462
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 462
ctaacaagca ggcttatg 18
<210> 463
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 463
tgcctaacaa gcaggctt 18
<210> 464
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 464
gcttgcctaa caagcagg 18
<210> 465
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 465
gatgcttgcc taacaagc 18
<210> 466
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 466
attgatgctt gcctaaca 18
<210> 467
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 467
tacattgatg cttgccta 18
<210> 468
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 468
ttttacattg atgcttgc 18
<210> 469
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 469
aaattttaca ttgatgct 18
<210> 470
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 470
tccaaatttt acattgat 18
<210> 471
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 471
tgctccaaat tttacatt 18
<210> 472
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 472
tcatgctcca aattttac 18
<210> 473
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 473
ctgtcatgct ccaaattt 18
<210> 474
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 474
caactgtcat gctccaaa 18
<210> 475
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 475
gcacaactgt catgctcc 18
<210> 476
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 476
caggcacaac tgtcatgc 18
<210> 477
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 477
atacaggcac aactgtca 18
<210> 478
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 478
gttatacagg cacaactg 18
<210> 479
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 479
ggggttatac aggcacaa 18
<210> 480
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 480
gttggggtta tacaggca 18
<210> 481
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 481
agtgttgggg ttatacag 18
<210> 482
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 482
ctcagtgttg gggttata 18
<210> 483
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 483
tccctcagtg ttggggtt 18
<210> 484
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 484
actccgaggt agagcttg 18
<210> 485
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 485
gactccgagg tagagctt 18
<210> 486
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 486
cagactccga ggtagagc 18
<210> 487
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 487
tcagactccg aggtagag 18
<210> 488
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 488
cttcagactc cgaggtag 18
<210> 489
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 489
tcttcagact ccgaggta 18
<210> 490
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 490
actcttcaga ctccgagg 18
<210> 491
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 491
gactcttcag actccgag 18
<210> 492
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 492
ttgactcttc agactccg 18
<210> 493
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 493
gttgactctt cagactcc 18
<210> 494
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 494
ctgttgactc ttcagact 18
<210> 495
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 495
actgttgact cttcagac 18
<210> 496
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 496
acactgttga ctcttcag 18
<210> 497
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 497
gacactgttg actcttca 18
<210> 498
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 498
ctgacactgt tgactctt 18
<210> 499
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 499
tctgacactg ttgactct 18
<210> 500
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 500
attctgacac tgttgact 18
<210> 501
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 501
gattctgaca ctgttgac 18
<210> 502
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 502
tggattctga cactgttg 18
<210> 503
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 503
atggattctg acactgtt 18
<210> 504
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 504
ccatggattc tgacactg 18
<210> 505
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 505
cccatggatt ctgacact 18
<210> 506
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 506
ttcccatgga ttctgaca 18
<210> 507
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 507
cttcccatgg attctgac 18
<210> 508
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 508
atcttcccat ggattctg 18
<210> 509
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 509
catcttccca tggattct 18
<210> 510
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 510
aacatcttcc catggatt 18
<210> 511
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 511
gaacatcttc ccatggat 18
<210> 512
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 512
cagaacatct tcccatgg 18
<210> 513
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 513
ccagaacatc ttcccatg 18
<210> 514
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 514
ccccagaaca tcttccca 18
<210> 515
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 515
tccccagaac atcttccc 18
<210> 516
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 516
cctccccaga acatcttc 18
<210> 517
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 517
acctccccag aacatctt 18
<210> 518
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 518
tcacctcccc agaacatc 18
<210> 519
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 519
gtcacctccc cagaacat 18
<210> 520
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 520
ttgtcacctc cccagaac 18
<210> 521
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 521
gttgtcacct ccccagaa 18
<210> 522
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 522
cagttgtcac ctccccag 18
<210> 523
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 523
ccagttgtca cctcccca 18
<210> 524
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 524
gcccagttgt cacctccc 18
<210> 525
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 525
ggcccagttg tcacctcc 18
<210> 526
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 526
caggcccagt tgtcacct 18
<210> 527
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 527
gcaggcccag ttgtcacc 18
<210> 528
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 528
gtgcaggccc agttgtca 18
<210> 529
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 529
ggtgcaggcc cagttgtc 18
<210> 530
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 530
caggtgcagg cccagttg 18
<210> 531
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 531
gcaggtgcag gcccagtt 18
<210> 532
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 532
cagcaggtgc aggcccag 18
<210> 533
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 533
gcagcaggtg caggccca 18
<210> 534
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 534
ctgcagcagg tgcaggcc 18
<210> 535
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 535
tctgcagcag gtgcaggc 18
<210> 536
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 536
cctctgcagc aggtgcag 18
<210> 537
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 537
acctctgcag caggtgca 18
<210> 538
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 538
gcacctctgc agcaggtg 18
<210> 539
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 539
tgcacctctg cagcaggt 18
<210> 540
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 540
cgtgcacctc tgcagcag 18
<210> 541
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 541
acgtgcacct ctgcagca 18
<210> 542
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 542
ctacgtgcac ctctgcag 18
<210> 543
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 543
actacgtgca cctctgca 18
<210> 544
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 544
agactacgtg cacctctg 18
<210> 545
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 545
cagactacgt gcacctct 18
<210> 546
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 546
ctcagactac gtgcacct 18
<210> 547
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 547
actcagacta cgtgcacc 18
<210> 548
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 548
gcactcagac tacgtgca 18
<210> 549
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 549
agcactcaga ctacgtgc 18
<210> 550
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 550
gcagcactca gactacgt 18
<210> 551
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 551
cgcagcactc agactacg 18
<210> 552
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 552
tccgcagcac tcagacta 18
<210> 553
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 553
gtccgcagca ctcagact 18
<210> 554
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 554
gagtccgcag cactcaga 18
<210> 555
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 555
tgagtccgca gcactcag 18
<210> 556
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 556
gctgagtccg cagcactc 18
<210> 557
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 557
tgctgagtcc gcagcact 18
<210> 558
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 558
tctgctgagt ccgcagca 18
<210> 559
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 559
gtctgctgag tccgcagc 18
<210> 560
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 560
gggtctgctg agtccgca 18
<210> 561
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 561
cgggtctgct gagtccgc 18
<210> 562
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 562
gccgggtctg ctgagtcc 18
<210> 563
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 563
ggccgggtct gctgagtc 18
<210> 564
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 564
gtggccgggt ctgctgag 18
<210> 565
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 565
ggtggccggg tctgctga 18
<210> 566
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 566
ccggtggccg ggtctgct 18
<210> 567
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 567
gccggtggcc gggtctgc 18
<210> 568
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 568
aggccggtgg ccgggtct 18
<210> 569
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 569
aaggccggtg gccgggtc 18
<210> 570
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 570
gtaaggccgg tggccggg 18
<210> 571
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 571
agtaaggccg gtggccgg 18
<210> 572
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 572
ggagtaaggc cggtggcc 18
<210> 573
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 573
tggagtaagg ccggtggc 18
<210> 574
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 574
aatggagtaa ggccggtg 18
<210> 575
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 575
aaatggagta aggccggt 18
<210> 576
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 576
ggaaatggag taaggccg 18
<210> 577
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 577
gggaaatgga gtaaggcc 18
<210> 578
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 578
cagggaaatg gagtaagg 18
<210> 579
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 579
ccagggaaat ggagtaag 18
<210> 580
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 580
ttccagggaa atggagta 18
<210> 581
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 581
cttccaggga aatggagt 18
<210> 582
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 582
tccttccagg gaaatgga 18
<210> 583
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 583
ttccttccag ggaaatgg 18
<210> 584
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 584
ctttccttcc agggaaat 18
<210> 585
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 585
tctttccttc cagggaaa 18
<210> 586
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 586
ggtctttcct tccaggga 18
<210> 587
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 587
tggtctttcc ttccaggg 18
<210> 588
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 588
tttggtcttt ccttccag 18
<210> 589
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 589
ctttggtctt tccttcca 18
<210> 590
<211> 5353
<212> DNA
<213> 小家鼠
<400> 590
ctagggtaaa accgtgagac tcggtctgga aatctggcct gagaggacag cctggcaatc 60
ctcagccggg gtggggacgt ctgccgaaga tccttggact ccagcaacca gtggtcgcca 120
ccgtccatcc accctaaggc ccagtttgca cggcggagaa cagctgtgca gccacgctgg 180
acactcaccc cgcccgagtt gagcccgccc ccgggactac aggaccaata agtgatgaat 240
atacccgcgc gtcacggagc accggccaat cgcggacggc cacgacccta gaaaggctgg 300
gcgcggcagg aggccacggg gcggtggcgg cgctggcgta gacgtttcct ggctatggtg 360
gtggtggcag cggcgccgag cgcggccacg gcggccccca aagtgctact cttatctggc 420
cagcccgcct ccggcggccg ggcgctgccg ctcatggtac ccggtccgcg ggcagcaggg 480
tcggaggcga gcgggacacc gcaggctcgc aagcggcagc ggctcacgca cctgagcccg 540
gaggagaaag cgctgcggag gtgggcccgg cgggcaaggc tggggcgcgg ggcggcagga 600
ctgggattgg gactctctcg tgtgtgccag ctggtgggct ccgtacggtg ggttagattc 660
acctctagtg tctaacctgg gaagcggagc tgagggggat gcccctccga aggtctgcgt 720
cgggggtgtg tgcaggagct cccgacacag gcacagaaga aggtgcccga cgcccagtcc 780
tctgtaaatg ctcgctcttt gtggtcgtag ggtaggaacc gctccagctg tcattgcagc 840
cacttgggaa ccccaccctg ggaaccgagt ccacagcgtc cggcatcccg agagtttggc 900
ttggggaggg acagttggta gcgtccccgc cgccttcacg gatatcgctc tagcaaggag 960
cctgtgggac ggaattggac ccagaaagta gcgggggagg agggaagaag catatgacgc 1020
aacgggaatg tatcagcccg gtggtaaaat gagatccggg tggacagccg cacgggagag 1080
aatcaagcaa gtcttcaagg cctgtggata gaaagcagcg tgtgtatgcg tgtgcgtgtg 1140
cgttttgata ggagctttaa gcgtgtttac ttgctaagcc ttattctgta aagtcaacga 1200
aagcaccagc tggccacgtc tacaaatgaa gacacatgaa agctggagat gactcagtta 1260
tgttccctgt ctcctcccca aggaaactga aaaacagagt agcagcgcag actgctcgag 1320
atagaaagaa agcccggatg agcgagctgg agcagcaagt ggtggatttg gaagaagagg 1380
taaagggact tcaggccatg ctttcatccc atccatatca gggcccatcc taaactgctt 1440
cagcccttta gaatacaacc caaagtgcca tttaaagttt aaccagccta gcagataggc 1500
cgtgaaagca gacgtgactc accctggcct gccctcccct cggagattag ccaggttgga 1560
tagatcattg gttgcttaag ctgtagcgcc gcctgtcttt gccaaaggct cactaacgct 1620
gcccttcctt ctgggatccc cccccccccg cgcgccccca atcctcccac cctctgtatc 1680
ctttctgctg tcagtgccct tttgtgcccc tccaccccgg catcctttta ccctttgggg 1740
agttatttta gtttctaagt taagtttagt taactttagc tatttctagc gtttctaggc 1800
attgccacat ttacgtccat ttatatgcgc acgtgcgccc tggtttgagt ttgggtcacc 1860
tcactttgta atacactttc caaatttata cattttccct gctagtttcc tttctctata 1920
caggcgagtg gtacctcact gtgtgtgcac cccactttca cggttctctg ggcatctgtg 1980
ctcagcatct aggctgccac catttctttg ccattggacc actaccactt gcaccaacac 2040
ttgccatttc aagacaggat ggtgaattat ttaaagatta tttttagata gggtcttagg 2100
ttggcctgta actcatggca tgcctcctgt tttaccatgc tgacattaca ggcagtgaac 2160
caccttgcca tacttttttt ttttaaaggt agtgtattaa cacaactgta aattcaagct 2220
gcaagtgacc tttttttttg gctgaaatct gcgagtagta cttgtaggca ttatgttgtt 2280
tctgtcacca ttgaaaacac ttttgttttc ttcagagatt ggccttgaat aaacttgctt 2340
ctcccgcctc agcctgcttg agtgttcaat ggcatttttg gggggacagc ttgatgtctc 2400
ccaggctgtg ctctaacttg ctgtgtagcc aaagatgacc ccaaatttgt ttctcttgct 2460
gctatgtccc aggtgctggg attacagttt atgcagagct gaagatggag cccagggctg 2520
caagcctggg agggcaggcc ttctcccaac tcctctgtcc cattagccac cggtgacaga 2580
atggctgtga cccgcaccag cagggaaaca gctggagcag aacttgcagt ggattcttta 2640
gtgacggaac cacacggtct aaccgcacgg cctcttatgt gattccttac agaaccacaa 2700
actccagcta gaaaatcagc ttttacggga gaaaactcac ggccttgtgg ttgagaacca 2760
ggagttaaga acacgcttgg gaatggacac gctggatcct gacgaggttc cagaggtgga 2820
ggccaaggta agtattggga gacctggctg cagcactacc tggctgcagg tttgtgttct 2880
ggacctccaa tcaaatcctt ttctcttttc ctttatgaga caaggtctta atgtctaatt 2940
ttggctggtc ttgaacttgt gtcagttctt ttgcttctaa gtagtaggac tataagcacc 3000
tgcccctgtg cctagctgag gaatcctgaa ttttccctgt ttccttgaac taaacttatg 3060
atcttcttgc cttagccttc caagcgctgg aattacatgc atgaacaagt ggtttgtttc 3120
ttggcttttt tgggggatag ggtgtcatgt agtccaggtt ggcctcaaac ttgctctgta 3180
gctgataatc ctacctccac cttccagatg ttaccattac aggcagatgt tcctttgtgt 3240
ggttatgtag gtgtgtatgt gtacatgggt gtgggtttat acacatctct gcttacgtac 3300
agaggcctaa ggagcatata gatgtcttgc cctagcactg tccaccctgc tcctctgcag 3360
cagagtgtct cactgaatct ggggctaggc aggtggacag caagccctgg tgaacttcct 3420
gtttctgcct cccttgatgc tgaggatttg aacttgggtc ttcaggattg tacagcaagc 3480
acattatatt cagagccacc tccccagttc ctttcgagcc ctttgaggag cagagactca 3540
cagctaccca gcatgtatat ccttggcaac ttttactcac tgtggtcttt ccttccaggg 3600
gagtggagta aggctggtgg ccgggtctgc tgagtccgca gcactcagac tatgtgcacc 3660
tctgcagcag gtgcaggccc agttgtcacc tccccagaac atcttcccat ggactctgac 3720
actgttgcct cttcagattc tgaggtagag cttattctgt agcctaagtg gcgtgtgaca 3780
cgcttagcca ggcaaacgga gaagttagta ttggtggggt taggattaag cactttccta 3840
gtctgcttaa gtggatggag tagggggaaa ctgttccgtg ggtgggtcct atgatctgag 3900
agcataagtc tggtggatgg ctgggtcctg tgatctgaga gtgtaagccc taagtaacat 3960
tgtggaaccc agtactaaaa gtatttctgg tagactgtca cattcattct aatagtgaac 4020
tcttttgtgt tttgcctctt gtagtctgat atccttttgg gcattctgga caagttggac 4080
cctgtcatgt ttttcaaatg tccttcccca gagtctgcta gtctggagga actcccagag 4140
gtctacccag aaggacctag ttccttacca gcctcccttt ctctgtcagt ggggacctca 4200
tcagccaagc tggaagccat taatgaactc attcgttttg accatgtata caccaagcct 4260
ctagttttag agatcccctc tgagacagag agtcaaacta acgtggtagt gaaaattgag 4320
gaagcacctc taagctcttc agaagaggat caccctgaat tcattgtctc agtgaagaaa 4380
gagcctttgg aagatgactt catcccagag ctgggcatct caaacctgct ttcatccagc 4440
cattgtctga gaccaccttc ttgcctgctg gacgctcaca gtgactgtgg atatgagggc 4500
tccccttctc ccttcagtga catgtcttct ccacttggta cagaccactc ctgggaggat 4560
acttttgcca atgaactttt cccccagctg attagtgtct aaagagccac ataacactgg 4620
gcccctttcc ctgaccatca cattgcctag aggatagcat aggcctgtct ctttcgttaa 4680
aagccaaagt agaggctgtc tggccttaga agaattcctc taaagtattt caaatctcat 4740
agatgacttc caagtattgt cgtttgacac tcagctgtct aaggtattca aaggtattcc 4800
agtactacag cttttgagat tctagtttat cttaaaggtg gtagtatact ctaaatcgca 4860
gggagggtca tttgacagtt ttttcccagc ctggcttcaa actatgtagc cgaggctagg 4920
cagaaacttc tgaccctctt gaccccacct cccaagtgct gggcttcacc aggtgtgcac 4980
ctccacacct gcccccccga catgtcaggt ggacatggga ttcatgaatg gcccttagca 5040
tttctttctc cactctctgc ttcccaggtt tcgtaacctg agggggcttg ttttccctta 5100
tgtgcatttt aaatgaagat caagaatctt tgtaaaatga tgaaaattta ctatgtaaat 5160
gcttgatgga tcttcttgct agtgtagctt ctagaaggtg ctttctccat ttatttaaaa 5220
ctacccttgc aattaaaaaa aaagcaacac agcgtcctgt tctgtgattt ctagggctgt 5280
tgtaatttct ctttattgtt ggctaaagga gtaatttatc caactaaagt gagcatacca 5340
ctttttaaag tca 5353
<210> 591
<211> 2264
<212> DNA
<213> 小家鼠
<400> 591
ctagggtaaa accgtgagac tcggtctgga aatctggcct gagaggacag cctggcaatc 60
ctcagccggg gtggggacgt ctgccgaaga tccttggact ccagcaacca gtggtcgcca 120
ccgtccatcc accctaaggc ccagtttgca cggcggagaa cagctgtgca gccacgctgg 180
acactcaccc cgcccgagtt gagcccgccc ccgggactac aggaccaata agtgatgaat 240
atacccgcgc gtcacggagc accggccaat cgcggacggc cacgacccta gaaaggctgg 300
gcgcggcagg aggccacggg gcggtggcgg cgctggcgta gacgtttcct ggctatggtg 360
gtggtggcag cggcgccgag cgcggccacg gcggccccca aagtgctact cttatctggc 420
cagcccgcct ccggcggccg ggcgctgccg ctcatggtac ccggtccgcg ggcagcaggg 480
tcggaggcga gcgggacacc gcaggctcgc aagcggcagc ggctcacgca cctgagcccg 540
gaggagaaag cgctgcggag gaaactgaaa aacagagtag cagcgcagac tgctcgagat 600
agaaagaaag cccggatgag cgagctggag cagcaagtgg tggatttgga agaagagaac 660
cacaaactcc agctagaaaa tcagctttta cgggagaaaa ctcacggcct tgtggttgag 720
aaccaggagt taagaacacg cttgggaatg gacacgctgg atcctgacga ggttccagag 780
gtggaggcca aggggagtgg agtaaggctg gtggccgggt ctgctgagtc cgcagcactc 840
agactatgtg cacctctgca gcaggtgcag gcccagttgt cacctcccca gaacatcttc 900
ccatggactc tgacactgtt gcctcttcag attctgagtc tgatatcctt ttgggcattc 960
tggacaagtt ggaccctgtc atgtttttca aatgtccttc cccagagtct gctagtctgg 1020
aggaactccc agaggtctac ccagaaggac ctagttcctt accagcctcc ctttctctgt 1080
cagtggggac ctcatcagcc aagctggaag ccattaatga actcattcgt tttgaccatg 1140
tatacaccaa gcctctagtt ttagagatcc cctctgagac agagagtcaa actaacgtgg 1200
tagtgaaaat tgaggaagca cctctaagct cttcagaaga ggatcaccct gaattcattg 1260
tctcagtgaa gaaagagcct ttggaagatg acttcatccc agagctgggc atctcaaacc 1320
tgctttcatc cagccattgt ctgagaccac cttcttgcct gctggacgct cacagtgact 1380
gtggatatga gggctcccct tctcccttca gtgacatgtc ttctccactt ggtacagacc 1440
actcctggga ggatactttt gccaatgaac ttttccccca gctgattagt gtctaaagag 1500
ccacataaca ctgggcccct ttccctgacc atcacattgc ctagaggata gcataggcct 1560
gtctctttcg ttaaaagcca aagtagaggc tgtctggcct tagaagaatt cctctaaagt 1620
atttcaaatc tcatagatga cttccaagta ttgtcgtttg acactcagct gtctaaggta 1680
ttcaaaggta ttccagtact acagcttttg agattctagt ttatcttaaa ggtggtagta 1740
tactctaaat cgcagggagg gtcatttgac agttttttcc cagcctggct tcaaactatg 1800
tagccgaggc taggcagaaa cttctgaccc tcttgacccc acctcccaag tgctgggctt 1860
caccaggtgt gcacctccac acctgccccc ccgacatgtc aggtggacat gggattcatg 1920
aatggccctt agcatttctt tctccactct ctgcttccca ggtttcgtaa cctgaggggg 1980
cttgttttcc cttatgtgca ttttaaatga agatcaagaa tctttgtaaa atgatgaaaa 2040
tttactatgt aaatgcttga tggatcttct tgctagtgta gcttctagaa ggtgctttct 2100
ccatttattt aaaactaccc ttgcaattaa aaaaaaagca acacagcgtc ctgttctgtg 2160
atttctaggg ctgttgtaat ttctctttat tgttggctaa aggagtaatt tatccaacta 2220
aagtgagcat accacttttt aaagtcaaaa aaaaaaaaaa aaaa 2264
<210> 592
<211> 267
<212> PRT
<213> 小家鼠
<400> 592
Met Val Val Val Ala Ala Ala Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Gly Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Pro Arg Ala Ala Gly Ser Glu Ala Ser Gly Thr
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn His Lys Leu Gln Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Val Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Thr Leu Asp Pro Asp Glu Val Pro Glu Val Glu
130 135 140
Ala Lys Gly Ser Gly Val Arg Leu Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Leu Arg Leu Cys Ala Pro Leu Gln Gln Val Gln Ala Gln Leu Ser
165 170 175
Pro Pro Gln Asn Ile Phe Pro Trp Thr Leu Thr Leu Leu Pro Leu Gln
180 185 190
Ile Leu Ser Leu Ile Ser Phe Trp Ala Phe Trp Thr Ser Trp Thr Leu
195 200 205
Ser Cys Phe Ser Asn Val Leu Pro Gln Ser Leu Leu Val Trp Arg Asn
210 215 220
Ser Gln Arg Ser Thr Gln Lys Asp Leu Val Pro Tyr Gln Pro Pro Phe
225 230 235 240
Leu Cys Gln Trp Gly Pro His Gln Pro Ser Trp Lys Pro Leu Met Asn
245 250 255
Ser Phe Val Leu Thr Met Tyr Thr Pro Ser Leu
260 265
<210> 593
<211> 2238
<212> DNA
<213> 小家鼠
<400> 593
ctagggtaaa accgtgagac tcggtctgga aatctggcct gagaggacag cctggcaatc 60
ctcagccggg gtggggacgt ctgccgaaga tccttggact ccagcaacca gtggtcgcca 120
ccgtccatcc accctaaggc ccagtttgca cggcggagaa cagctgtgca gccacgctgg 180
acactcaccc cgcccgagtt gagcccgccc ccgggactac aggaccaata agtgatgaat 240
atacccgcgc gtcacggagc accggccaat cgcggacggc cacgacccta gaaaggctgg 300
gcgcggcagg aggccacggg gcggtggcgg cgctggcgta gacgtttcct ggctatggtg 360
gtggtggcag cggcgccgag cgcggccacg gcggccccca aagtgctact cttatctggc 420
cagcccgcct ccggcggccg ggcgctgccg ctcatggtac ccggtccgcg ggcagcaggg 480
tcggaggcga gcgggacacc gcaggctcgc aagcggcagc ggctcacgca cctgagcccg 540
gaggagaaag cgctgcggag gaaactgaaa aacagagtag cagcgcagac tgctcgagat 600
agaaagaaag cccggatgag cgagctggag cagcaagtgg tggatttgga agaagagaac 660
cacaaactcc agctagaaaa tcagctttta cgggagaaaa ctcacggcct tgtggttgag 720
aaccaggagt taagaacacg cttgggaatg gacacgctgg atcctgacga ggttccagag 780
gtggaggcca aggggagtgg agtaaggctg gtggccgggt ctgctgagtc cgcagcaggt 840
gcaggcccag ttgtcacctc cccagaacat cttcccatgg actctgacac tgttgcctct 900
tcagattctg agtctgatat ccttttgggc attctggaca agttggaccc tgtcatgttt 960
ttcaaatgtc cttccccaga gtctgctagt ctggaggaac tcccagaggt ctacccagaa 1020
ggacctagtt ccttaccagc ctccctttct ctgtcagtgg ggacctcatc agccaagctg 1080
gaagccatta atgaactcat tcgttttgac catgtataca ccaagcctct agttttagag 1140
atcccctctg agacagagag tcaaactaac gtggtagtga aaattgagga agcacctcta 1200
agctcttcag aagaggatca ccctgaattc attgtctcag tgaagaaaga gcctttggaa 1260
gatgacttca tcccagagct gggcatctca aacctgcttt catccagcca ttgtctgaga 1320
ccaccttctt gcctgctgga cgctcacagt gactgtggat atgagggctc cccttctccc 1380
ttcagtgaca tgtcttctcc acttggtaca gaccactcct gggaggatac ttttgccaat 1440
gaacttttcc cccagctgat tagtgtctaa agagccacat aacactgggc ccctttccct 1500
gaccatcaca ttgcctagag gatagcatag gcctgtctct ttcgttaaaa gccaaagtag 1560
aggctgtctg gccttagaag aattcctcta aagtatttca aatctcatag atgacttcca 1620
agtattgtcg tttgacactc agctgtctaa ggtattcaaa ggtattccag tactacagct 1680
tttgagattc tagtttatct taaaggtggt agtatactct aaatcgcagg gagggtcatt 1740
tgacagtttt ttcccagcct ggcttcaaac tatgtagccg aggctaggca gaaacttctg 1800
accctcttga ccccacctcc caagtgctgg gcttcaccag gtgtgcacct ccacacctgc 1860
ccccccgaca tgtcaggtgg acatgggatt catgaatggc ccttagcatt tctttctcca 1920
ctctctgctt cccaggtttc gtaacctgag ggggcttgtt ttcccttatg tgcattttaa 1980
atgaagatca agaatctttg taaaatgatg aaaatttact atgtaaatgc ttgatggatc 2040
ttcttgctag tgtagcttct agaaggtgct ttctccattt atttaaaact acccttgcaa 2100
ttaaaaaaaa agcaacacag cgtcctgttc tgtgatttct agggctgttg taatttctct 2160
ttattgttgg ctaaaggagt aatttatcca actaaagtga gcataccact ttttaaagtc 2220
aaaaaaaaaa aaaaaaaa 2238
<210> 594
<211> 371
<212> PRT
<213> 小家鼠
<400> 594
Met Val Val Val Ala Ala Ala Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Gly Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Pro Arg Ala Ala Gly Ser Glu Ala Ser Gly Thr
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn His Lys Leu Gln Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Val Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Thr Leu Asp Pro Asp Glu Val Pro Glu Val Glu
130 135 140
Ala Lys Gly Ser Gly Val Arg Leu Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp
165 170 175
Ser Asp Thr Val Ala Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Ser Ala Ser Leu Glu Glu Leu Pro Glu Val Tyr Pro Glu Gly Pro
210 215 220
Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala
225 230 235 240
Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr
245 250 255
Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn
260 265 270
Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp
275 280 285
His Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Leu Glu Asp Asp
290 295 300
Phe Ile Pro Glu Leu Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys
305 310 315 320
Leu Arg Pro Pro Ser Cys Leu Leu Asp Ala His Ser Asp Cys Gly Tyr
325 330 335
Glu Gly Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Thr
340 345 350
Asp His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu
355 360 365
Ile Ser Val
370
<210> 595
<211> 2118
<212> DNA
<213> 小家鼠
<400> 595
ctagggtaaa accgtgagac tcggtctgga aatctggcct gagaggacag cctggcaatc 60
ctcagccggg gtggggacgt ctgccgaaga tccttggact ccagcaacca gtggtcgcca 120
ccgtccatcc accctaaggc ccagtttgca cggcggagaa cagctgtgca gccacgctgg 180
acactcaccc cgcccgagtt gagcccgccc ccgggactac aggaccaata agtgatgaat 240
atacccgcgc gtcacggagc accggccaat cgcggacggc cacgacccta gaaaggctgg 300
gcgcggcagg aggccacggg gcggtggcgg cgctggcgta gacgtttcct ggctatggtg 360
gtggtggcag cggcgccgag cgcggccacg gcggccccca aagtgctact cttatctggc 420
cagcccgcct ccggcggccg ggcgctgccg ctcatggtac ccggtccgcg ggcagcaggg 480
tcggaggcga gcgggacacc gcaggctcgc aagcggcagc ggctcacgca cctgagcccg 540
gaggagaaag cgctgcggag gaaactgaaa aacagagtag cagcgcagac tgctcgagat 600
agaaagaaag cccggatgag cgagctggag cagcaagtgg tggatttgga agaagagaac 660
cacaaactcc agctagaaaa tcagctttta cgggagaaaa ctcacggcct tgtggttgag 720
aaccaggagt taagaacacg cttgggaatg gacacgctgg atcctgacga ggttccagag 780
gtggaggcca agtctgatat ccttttgggc attctggaca agttggaccc tgtcatgttt 840
ttcaaatgtc cttccccaga gtctgctagt ctggaggaac tcccagaggt ctacccagaa 900
ggacctagtt ccttaccagc ctccctttct ctgtcagtgg ggacctcatc agccaagctg 960
gaagccatta atgaactcat tcgttttgac catgtataca ccaagcctct agttttagag 1020
atcccctctg agacagagag tcaaactaac gtggtagtga aaattgagga agcacctcta 1080
agctcttcag aagaggatca ccctgaattc attgtctcag tgaagaaaga gcctttggaa 1140
gatgacttca tcccagagct gggcatctca aacctgcttt catccagcca ttgtctgaga 1200
ccaccttctt gcctgctgga cgctcacagt gactgtggat atgagggctc cccttctccc 1260
ttcagtgaca tgtcttctcc acttggtaca gaccactcct gggaggatac ttttgccaat 1320
gaacttttcc cccagctgat tagtgtctaa agagccacat aacactgggc ccctttccct 1380
gaccatcaca ttgcctagag gatagcatag gcctgtctct ttcgttaaaa gccaaagtag 1440
aggctgtctg gccttagaag aattcctcta aagtatttca aatctcatag atgacttcca 1500
agtattgtcg tttgacactc agctgtctaa ggtattcaaa ggtattccag tactacagct 1560
tttgagattc tagtttatct taaaggtggt agtatactct aaatcgcagg gagggtcatt 1620
tgacagtttt ttcccagcct ggcttcaaac tatgtagccg aggctaggca gaaacttctg 1680
accctcttga ccccacctcc caagtgctgg gcttcaccag gtgtgcacct ccacacctgc 1740
ccccccgaca tgtcaggtgg acatgggatt catgaatggc ccttagcatt tctttctcca 1800
ctctctgctt cccaggtttc gtaacctgag ggggcttgtt ttcccttatg tgcattttaa 1860
atgaagatca agaatctttg taaaatgatg aaaatttact atgtaaatgc ttgatggatc 1920
ttcttgctag tgtagcttct agaaggtgct ttctccattt atttaaaact acccttgcaa 1980
ttaaaaaaaa agcaacacag cgtcctgttc tgtgatttct agggctgttg taatttctct 2040
ttattgttgg ctaaaggagt aatttatcca actaaagtga gcataccact ttttaaagtc 2100
aaaaaaaaaa aaaaaaaa 2118
<210> 596
<211> 331
<212> PRT
<213> 小家鼠
<400> 596
Met Val Val Val Ala Ala Ala Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Gly Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Pro Arg Ala Ala Gly Ser Glu Ala Ser Gly Thr
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn His Lys Leu Gln Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Val Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Thr Leu Asp Pro Asp Glu Val Pro Glu Val Glu
130 135 140
Ala Lys Ser Asp Ile Leu Leu Gly Ile Leu Asp Lys Leu Asp Pro Val
145 150 155 160
Met Phe Phe Lys Cys Pro Ser Pro Glu Ser Ala Ser Leu Glu Glu Leu
165 170 175
Pro Glu Val Tyr Pro Glu Gly Pro Ser Ser Leu Pro Ala Ser Leu Ser
180 185 190
Leu Ser Val Gly Thr Ser Ser Ala Lys Leu Glu Ala Ile Asn Glu Leu
195 200 205
Ile Arg Phe Asp His Val Tyr Thr Lys Pro Leu Val Leu Glu Ile Pro
210 215 220
Ser Glu Thr Glu Ser Gln Thr Asn Val Val Val Lys Ile Glu Glu Ala
225 230 235 240
Pro Leu Ser Ser Ser Glu Glu Asp His Pro Glu Phe Ile Val Ser Val
245 250 255
Lys Lys Glu Pro Leu Glu Asp Asp Phe Ile Pro Glu Leu Gly Ile Ser
260 265 270
Asn Leu Leu Ser Ser Ser His Cys Leu Arg Pro Pro Ser Cys Leu Leu
275 280 285
Asp Ala His Ser Asp Cys Gly Tyr Glu Gly Ser Pro Ser Pro Phe Ser
290 295 300
Asp Met Ser Ser Pro Leu Gly Thr Asp His Ser Trp Glu Asp Thr Phe
305 310 315 320
Ala Asn Glu Leu Phe Pro Gln Leu Ile Ser Val
325 330
<210> 597
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 597
tccatgggaa gatgttct 18
<210> 598
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 598
ggaagatgtt ctggggag 18
<210> 599
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 599
tgttctgggg aggtgaca 18
<210> 600
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 600
ggggaggtga caactggg 18
<210> 601
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 601
gtgacaactg ggcctgca 18
<210> 602
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 602
actgggcctg cacctgct 18
<210> 603
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 603
cctgcacctg ctgcagag 18
<210> 604
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 604
cctgctgcag aggtgcac 18
<210> 605
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 605
tgagtgctgc ggactcag 18
<210> 606
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 606
ctgcggactc agcagacc 18
<210> 607
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 607
actcagcaga cccggcca 18
<210> 608
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 608
catgggaaga tgttctgg 18
<210> 609
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 609
tgggaagatg ttctgggg 18
<210> 610
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 610
aagatgttct ggggaggt 18
<210> 611
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 611
gatgttctgg ggaggtga 18
<210> 612
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 612
ttctggggag gtgacaac 18
<210> 613
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 613
ctggggaggt gacaactg 18
<210> 614
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 614
ggaggtgaca actgggcc 18
<210> 615
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 615
aggtgacaac tgggcctg 18
<210> 616
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 616
gacaactggg cctgcacc 18
<210> 617
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 617
caactgggcc tgcacctg 18
<210> 618
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 618
tgggcctgca cctgctgc 18
<210> 619
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 619
ggcctgcacc tgctgcag 18
<210> 620
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 620
cacctgctgc agaggtgc 18
<210> 621
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 621
agtctgagtg ctgcggac 18
<210> 622
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 622
tctgagtgct gcggactc 18
<210> 623
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 623
agtgctgcgg actcagca 18
<210> 624
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 624
tgctgcggac tcagcaga 18
<210> 625
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 625
gcggactcag cagacccg 18
<210> 626
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 626
ggactcagca gacccggc 18
<210> 627
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 627
tcagcagacc cggccacc 18
<210> 628
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 628
gtgtcacacg ccacttag 18
<210> 629
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 629
gtcacacgcc acttaggc 18
<210> 630
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 630
cacacgccac ttaggcta 18
<210> 631
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 631
cacgccactt aggctaca 18
<210> 632
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 632
cgccacttag gctacaga 18
<210> 633
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 633
ccacttaggc tacagaat 18
<210> 634
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 634
acttaggcta cagaataa 18
<210> 635
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 635
ttaggctaca gaataagc 18
<210> 636
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 636
aggctacaga ataagctc 18
<210> 637
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 637
gctacagaat aagctcta 18
<210> 638
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 638
tacagaataa gctctacc 18
<210> 639
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 639
cagaataagc tctacctc 18
<210> 640
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 640
gaataagctc tacctcag 18
<210> 641
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 641
ataagctcta cctcagaa 18
<210> 642
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 642
aagctctacc tcagaatc 18
<210> 643
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 643
gctctacctc agaatctg 18
<210> 644
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 644
tctacctcag aatctgaa 18
<210> 645
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 645
tacctcagaa tctgaaga 18
<210> 646
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 646
cctcagaatc tgaagagg 18
<210> 647
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 647
tcagaatctg aagaggca 18
<210> 648
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 648
agaatctgaa gaggcaac 18
<210> 649
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 649
aatctgaaga ggcaacag 18
<210> 650
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 650
tctgaagagg caacagtg 18
<210> 651
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 651
tgaagaggca acagtgtc 18
<210> 652
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 652
aagaggcaac agtgtcag 18
<210> 653
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 653
gaggcaacag tgtcagag 18
<210> 654
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 654
ggcaacagtg tcagagtc 18
<210> 655
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 655
caacagtgtc agagtcca 18
<210> 656
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 656
acagtgtcag agtccatg 18
<210> 657
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 657
agtgtcagag tccatggg 18
<210> 658
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 658
tgtcagagtc catgggaa 18
<210> 659
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 659
tcagagtcca tgggaaga 18
<210> 660
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 660
agagtccatg ggaagatg 18
<210> 661
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 661
agtccatggg aagatgtt 18
<210> 662
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 662
tgctgcagag gtgcacat 18
<210> 663
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 663
ctgcagaggt gcacatag 18
<210> 664
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 664
gcagaggtgc acatagtc 18
<210> 665
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 665
agaggtgcac atagtctg 18
<210> 666
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 666
aggtgcacat agtctgag 18
<210> 667
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 667
gtgcacatag tctgagtg 18
<210> 668
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 668
gcacatagtc tgagtgct 18
<210> 669
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 669
acatagtctg agtgctgc 18
<210> 670
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 670
atagtctgag tgctgcgg 18
<210> 671
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 671
agcagacccg gccaccag 18
<210> 672
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 672
cagacccggc caccagcc 18
<210> 673
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 673
gacccggcca ccagcctt 18
<210> 674
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 674
cccggccacc agccttac 18
<210> 675
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 675
cggccaccag ccttactc 18
<210> 676
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 676
gccaccagcc ttactcca 18
<210> 677
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 677
caccagcctt actccact 18
<210> 678
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 678
ccagccttac tccactcc 18
<210> 679
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 679
agccttactc cactcccc 18
<210> 680
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 680
ccttactcca ctcccctg 18
<210> 681
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 681
ttactccact cccctgga 18
<210> 682
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 682
actccactcc cctggaag 18
<210> 683
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 683
tccactcccc tggaagga 18
<210> 684
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 684
cactcccctg gaaggaaa 18
<210> 685
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 685
ctcccctgga aggaaaga 18
<210> 686
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 686
cccctggaag gaaagacc 18
<210> 687
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 687
cctggaagga aagaccac 18
<210> 688
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 688
tggaaggaaa gaccacag 18
<210> 689
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 689
gaaggaaaga ccacagtg 18
<210> 690
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 690
aggaaagacc acagtgag 18
<210> 691
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 691
gaaagaccac agtgagta 18
<210> 692
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 692
aagaccacag tgagtaaa 18
<210> 693
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 693
gaccacagtg agtaaaag 18
<210> 694
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 694
ccacagtgag taaaagtt 18
<210> 695
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 695
acagtgagta aaagttgc 18
<210> 696
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 696
agtgagtaaa agttgcca 18
<210> 697
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 697
tgagtaaaag ttgccaag 18
<210> 698
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 698
agtaaaagtt gccaagga 18
<210> 699
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 699
agaacatctt cccatgga 18
<210> 700
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 700
ctccccagaa catcttcc 18
<210> 701
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 701
tgtcacctcc ccagaaca 18
<210> 702
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 702
cccagttgtc acctcccc 18
<210> 703
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 703
tgcaggccca gttgtcac 18
<210> 704
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 704
agcaggtgca ggcccagt 18
<210> 705
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 705
ctctgcagca ggtgcagg 18
<210> 706
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 706
gtgcacctct gcagcagg 18
<210> 707
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 707
ctgagtccgc agcactca 18
<210> 708
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 708
ggtctgctga gtccgcag 18
<210> 709
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 709
tggccgggtc tgctgagt 18
<210> 710
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 710
ccagaacatc ttcccatg 18
<210> 711
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 711
ccccagaaca tcttccca 18
<210> 712
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 712
acctccccag aacatctt 18
<210> 713
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 713
tcacctcccc agaacatc 18
<210> 714
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 714
gttgtcacct ccccagaa 18
<210> 715
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 715
cagttgtcac ctccccag 18
<210> 716
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 716
ggcccagttg tcacctcc 18
<210> 717
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 717
caggcccagt tgtcacct 18
<210> 718
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 718
ggtgcaggcc cagttgtc 18
<210> 719
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 719
caggtgcagg cccagttg 18
<210> 720
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 720
gcagcaggtg caggccca 18
<210> 721
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 721
ctgcagcagg tgcaggcc 18
<210> 722
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 722
gcacctctgc agcaggtg 18
<210> 723
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 723
gtccgcagca ctcagact 18
<210> 724
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 724
gagtccgcag cactcaga 18
<210> 725
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 725
tgctgagtcc gcagcact 18
<210> 726
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 726
tctgctgagt ccgcagca 18
<210> 727
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 727
cgggtctgct gagtccgc 18
<210> 728
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 728
gccgggtctg ctgagtcc 18
<210> 729
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 729
ggtggccggg tctgctga 18
<210> 730
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 730
ctaagtggcg tgtgacac 18
<210> 731
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 731
gcctaagtgg cgtgtgac 18
<210> 732
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 732
tagcctaagt ggcgtgtg 18
<210> 733
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 733
tgtagcctaa gtggcgtg 18
<210> 734
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 734
tctgtagcct aagtggcg 18
<210> 735
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 735
attctgtagc ctaagtgg 18
<210> 736
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 736
ttattctgta gcctaagt 18
<210> 737
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 737
gcttattctg tagcctaa 18
<210> 738
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 738
gagcttattc tgtagcct 18
<210> 739
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 739
tagagcttat tctgtagc 18
<210> 740
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 740
ggtagagctt attctgta 18
<210> 741
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 741
gaggtagagc ttattctg 18
<210> 742
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 742
ctgaggtaga gcttattc 18
<210> 743
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 743
ttctgaggta gagcttat 18
<210> 744
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 744
gattctgagg tagagctt 18
<210> 745
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 745
cagattctga ggtagagc 18
<210> 746
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 746
ttcagattct gaggtaga 18
<210> 747
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 747
tcttcagatt ctgaggta 18
<210> 748
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 748
cctcttcaga ttctgagg 18
<210> 749
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 749
tgcctcttca gattctga 18
<210> 750
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 750
gttgcctctt cagattct 18
<210> 751
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 751
ctgttgcctc ttcagatt 18
<210> 752
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 752
cactgttgcc tcttcaga 18
<210> 753
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 753
gacactgttg cctcttca 18
<210> 754
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 754
ctgacactgt tgcctctt 18
<210> 755
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 755
ctctgacact gttgcctc 18
<210> 756
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 756
gactctgaca ctgttgcc 18
<210> 757
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 757
tggactctga cactgttg 18
<210> 758
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 758
catggactct gacactgt 18
<210> 759
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 759
cccatggact ctgacact 18
<210> 760
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 760
ttcccatgga ctctgaca 18
<210> 761
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 761
tcttcccatg gactctga 18
<210> 762
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 762
catcttccca tggactct 18
<210> 763
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 763
aacatcttcc catggact 18
<210> 764
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 764
atgtgcacct ctgcagca 18
<210> 765
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 765
ctatgtgcac ctctgcag 18
<210> 766
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 766
gactatgtgc acctctgc 18
<210> 767
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 767
cagactatgt gcacctct 18
<210> 768
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 768
ctcagactat gtgcacct 18
<210> 769
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 769
cactcagact atgtgcac 18
<210> 770
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 770
agcactcaga ctatgtgc 18
<210> 771
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 771
gcagcactca gactatgt 18
<210> 772
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 772
ccgcagcact cagactat 18
<210> 773
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 773
ctggtggccg ggtctgct 18
<210> 774
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 774
ggctggtggc cgggtctg 18
<210> 775
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 775
aaggctggtg gccgggtc 18
<210> 776
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 776
gtaaggctgg tggccggg 18
<210> 777
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 777
gagtaaggct ggtggccg 18
<210> 778
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 778
tggagtaagg ctggtggc 18
<210> 779
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 779
agtggagtaa ggctggtg 18
<210> 780
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 780
ggagtggagt aaggctgg 18
<210> 781
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 781
ggggagtgga gtaaggct 18
<210> 782
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 782
caggggagtg gagtaagg 18
<210> 783
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 783
tccaggggag tggagtaa 18
<210> 784
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 784
cttccagggg agtggagt 18
<210> 785
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 785
tccttccagg ggagtgga 18
<210> 786
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 786
tttccttcca ggggagtg 18
<210> 787
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 787
tctttccttc caggggag 18
<210> 788
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 788
ggtctttcct tccagggg 18
<210> 789
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 789
gtggtctttc cttccagg 18
<210> 790
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 790
ctgtggtctt tccttcca 18
<210> 791
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 791
cactgtggtc tttccttc 18
<210> 792
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 792
ctcactgtgg tctttcct 18
<210> 793
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 793
tactcactgt ggtctttc 18
<210> 794
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 794
tttactcact gtggtctt 18
<210> 795
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 795
cttttactca ctgtggtc 18
<210> 796
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 796
aacttttact cactgtgg 18
<210> 797
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 797
gcaactttta ctcactgt 18
<210> 798
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 798
tggcaacttt tactcact 18
<210> 799
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 799
cttggcaact tttactca 18
<210> 800
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 800
tccttggcaa cttttact 18
<210> 801
<211> 6010
<212> DNA
<213> 智人
<400> 801
gctgggcggc tgcggcgcgc ggtgcgcggt gcgtagtctg gagctatggt ggtggtggca 60
gccgcgccga acccggccga cgggacccct aaagttctgc ttctgtcggg gcagcccgcc 120
tccgccgccg gagccccggc cggccaggcc ctgccgctca tggtgccagc ccagagaggg 180
gccagcccgg aggcagcgag cggggggctg ccccaggcgc gcaagcgaca gcgcctcacg 240
cacctgagcc ccgaggagaa ggcgctgagg aggtgggcga ggggccgggg tctggggcca 300
gatctgaagc cgggactagg gacaggggca ggggcagggg ctgggagcgg ggacccagca 360
ctggccgccc cgcagggctc cgtcgccttt ggcctggcgg gtcggtgcca gcgtggcgcg 420
gggcggggca ggaagcccgg actgaccgga tccgccacgc tgggaaccta gggcggccca 480
gggctctttt ctgtactttt taactctctc gttagagatg accagagctg gggatgcggg 540
cacctgtctt ccaggccctc ttgctgtgtg gccgcagact ggtggttcag cctcttaact 600
cggacatgag gtcgaataat ctgttttggt ttactgctat ttctggagag gcgcggagct 660
gaaataacag agctgttgaa agggctggga attctgcgag gctcactggt ctagctcagt 720
atctgcgttc ttaaaatgga acctacttca tgaggtcttt ggggagattg agacttggat 780
ataatgtgcc tagcacttag tcctccgtaa atgttcactc ttttgtgatc attgtgcctt 840
ctgtgattta tgaagtgtct cttctgagtt aattctttta aaaaaaaaag tgtctcctcc 900
aacagacacg gacccatcag caggtcactg cctaggatct caacactaga gatcagggag 960
tggcatcagc ctctcccttt tctaaattgg actgggggac ggagggttga tgtcatagca 1020
agattgcagc cttcactaga ttaatgaggc caggttggat cctgtttaag agaactggag 1080
acaggaagca gcgggggaat agatggggaa agaggaaagt tccttatgat gcaagatgaa 1140
tagtgtgtgt gtccagcccc agtgctgtga cggggatgag tctgaggtgg acggatgatg 1200
caatatagga gagaataaag caggtcttcg agctagattg acagaagact gtatttttta 1260
ttttgtttta ttgaggggag gagcctgaag tgtattttat cattagtctg tcttatactg 1320
taaataaaaa tgaaagcacc agctggtaaa gttttcaaat aaagacataa ataaggtttg 1380
atatgactca gtgtggtatg ttccttctct tcctaggaaa ctgaaaaaca gagtagcagc 1440
tcagactgcc agagatcgaa agaaggctcg aatgagtgag ctggaacagc aagtggtaga 1500
tttagaagaa gaggtaaaac tacttaaggt caaactcttt tatccattgt atacccttcc 1560
ttggtgaatg ttctgatatt tgcttcccat cccaagttgt ttcagcccct attagaatac 1620
aattgaatat atgattaaaa gttaaactag gctgggcatg gtggctcatg cctgtaatcc 1680
cagcactttg ggagcctgag ttgggcagat cacttgaagc cagcagtttg agaccagcct 1740
agccaacatg gtaaaatccc gtctctaccc aaaaatatac caaaaaaaaa aaaaaaaaaa 1800
aggccaagcg tgagtgcctg tagtcccagc tactcgggag gttgaggtgg gaggattgtt 1860
tgaacctggg agagggaggt tgcagtgagc tgagatcgca ccactgcact ccagcctggg 1920
caacagagtg agactctgtc tcaagaaaaa aaaaaaaagt ttgctgggca ccggggctca 1980
cacctgtaat cccagcactt tgggaggcca aggtgggtag ataacttgag atcaggagtt 2040
cgagaccagc ctgaccaacg tggtgaaacc ccatctctat taaaaataca aaaattagcc 2100
gggtgtcgtg gcaggcacct gtaatcccag ctgctccgga ggctgacgca ggagaatcac 2160
ttgaacccag gaggcggagg ttgcagtgag ctgagatcac gagatcatgc cactgcactc 2220
cagtctgggc gacagagcaa aaaccctgtc tcaaaaaaaa aaaaaaagtt aatctaagtt 2280
aggacagaga gttggtgaag tggtgaagct tgttgagggc agaagtgatt gactttgtgg 2340
catttggtgc tagatgtatc tcaaagtaga tggatttaac aatgtttatt gagtttgtag 2400
taagaaatta gcaagggcta ataggaaata attgcttaaa ctttacattc ttcctggcat 2460
ggccagaaat tcactaaagg ttcctttccc cctctagggt ccacctgtta atcaatctta 2520
aattgttgcc aattacacat cttgaataca tagagattat ttatattgtt tttttaaccc 2580
cttggtcaat ttgcatatat tgagcttttt aaagttttaa tcattagttg gttcttctaa 2640
gaatcatgag tcaggagcag ggattttttt taacttattt tggatttata gtcaccacta 2700
ccacttttat tattacctgc cagttcaaga tagttattta tttttatttt atattattat 2760
tattattatt atcatcatca ttattttgag atggagtctc actctgttgc ccaggctgga 2820
gtgcagtggt gcaatctcgg ctcactgcaa cctctgcctc ccaggttcaa gcaattctcc 2880
ctgcttcagc ctccagatta gctgggatta caggcacccc tcaccacatc cagctaattt 2940
ttggattttt tagtagagat gggggtttgc catgttggcc aggctggttt tgaactcttg 3000
acctcaggtg atccacctgc cttggcctcc caaagtgtta ggattacaag tgtgagccac 3060
cgagcctggc caagatagtt taaaaaaaaa attatatcta cattaaagcc acaagtcacc 3120
ctttgctgaa gtcagtatta gtagttggaa gcagtgtgtt attcttgacc ccatgaagtg 3180
gcacttatta agtagcttgc ttttccataa ttatggccta gctttttaaa acctactatg 3240
aacaccacaa gcatagagtt ttccaaaagt tcaagaagga aaggaaacca attatactga 3300
atcaggtaga ttcttaactg aaataattag atgttttaat agcctcttat gaactttctt 3360
ccagaaccaa aaacttttgc tagaaaatca gcttttacga gagaaaactc atggccttgt 3420
agttgagaac caggagttaa gacagcgctt ggggatggat gccctggttg ctgaagagga 3480
ggcggaagcc aaggtaaatc atctccttta tttggtgcct catgtgagta ctggttccaa 3540
gtgacatgac ccagcgatta tgtttacagt ctggacttct gatcaagagc gttcttgaaa 3600
ttttccttca gttttaagac attttcatgc aggcagagtg ttcttcccct aaaggcactt 3660
gacactcatt ttttaagtgt gtagtgaaca gtactaagat ctaataatga aaacaagtta 3720
catggctccc taagaacaag tactaacaaa tgcagtagcc aacaagatta ccatgcaatc 3780
attaaggaga accaaagtaa gagagccact caaaccagat tttgaacgct actaaaatta 3840
aagtagttct ttgatgaata tgaatgagta gggaaaggat tctttgtaat agtgatacct 3900
ctgtggtaag agaagggtgg tatgtgagtt ttagtctaca gattatggca aattcagtga 3960
caacaatcaa atggtctaag attgacagta gcacagtttt actctgtgaa ggtaatgttc 4020
aggacaaatt tcaagaaaac tagaaaacca ttctttacag ctgaaatctt tccctaacca 4080
ttgttatttc cacttttaag tcctcaagag atgagaaaag ggaggtaagg cttccttata 4140
catttcctgc acaatgaaac atttttcctc ctccaggcaa agattcaagc agaactggca 4200
aatatcttat cttgctcttc tcaataataa taatgttgtt agataataaa gttctatagc 4260
aatttaaccc tagaatcttt ttgaaaagta attctttaaa gttgagaatc acagctgtct 4320
agcaagcatt tccttgggca cttgaagctg tttattcact ttggtctttc ctcccagggg 4380
aatgaagtga ggccagtggc cgggtctgct gagtccgcag cactcagact acgtgcacct 4440
ctgcagcagg tgcaggccca gttgtcaccc ctccagaaca tctccccatg gattctggcg 4500
gtattgactc ttcagattca gaggtaggga tcattctgac ttattaaaga gctatataac 4560
cagttaattc catctgtttg atgcttgaca tccctaacta gacagatgag ggttgaagtt 4620
agtttttggt ggggttggag gtgaacatca actaccttcc tagttccagg taatatagaa 4680
catggagtga agtgtagata aatgggtctg gtgggtcccg aggtcatctt atcacataat 4740
gactaattta cattatggaa cccagtacaa agtgttccag ttagattttc cattgtattc 4800
tgacagttgt acttcattta atttttgcct cttacagtct gatatcctgt tgggcattct 4860
ggacaacttg gacccagtca tgttcttcaa atgcccttcc ccagagcctg ccagcctgga 4920
ggagctccca gaggtctacc cagaaggacc cagttcctta ccagcctccc tttctctgtc 4980
agtggggacg tcatcagcca agctggaagc cattaatgaa ctaattcgtt ttgaccacat 5040
atataccaag cccctagtct tagagatacc ctctgagaca gagagccaag ctaatgtggt 5100
agtgaaaatc gaggaagcac ctctcagccc ctcagagaat gatcaccctg aattcattgt 5160
ctcagtgaag gaagaacctg tagaagatga cctcgttccg gagctgggta tctcaaatct 5220
gctttcatcc agccactgcc caaagccatc ttcctgccta ctggatgctt acagtgactg 5280
tggatacggg ggttcccttt ccccattcag tgacatgtcc tctctgcttg gtgtaaacca 5340
ttcttgggag gacacttttg ccaatgaact ctttccccag ctgattagtg tctaaggaat 5400
gatccaatac tgttgccctt ttccttgact attacactgc ctggaggata gcagagaagc 5460
ctgtctgtac ttcattcaaa aagccaaaat agagagtata cagtcctaga gaattcctct 5520
atttgttcag atctcataga tgacccccag gtattgtctt ttgacatcca gcagtccaag 5580
gtattgagac atattactgg aagtaagaaa tattactata attgagaact acagctttta 5640
agattgtact tttatcttaa aagggtggta gttttcccta aaatacttat tatgtaaggg 5700
tcattagaca aatgtcttga agtagacatg gaatttatga atggttcttt atcatttctc 5760
ttcccccttt ttggcatcct ggcttgcctc cagttttagg tcctttagtt tgcttctgta 5820
agcaacggga acacctgctg agggggctct ttccctcatg tatacttcaa gtaagatcaa 5880
gaatcttttg tgaaattata gaaatttact atgtaaatgc ttgatggaat tttttcctgc 5940
tagtgtagct tctgaaaggt gctttctcca tttatttaaa actacccatg caattaaaag 6000
gtacaatgca 6010
<210> 802
<211> 1817
<212> DNA
<213> 智人
<400> 802
gctgggcggc tgcggcgcgc ggtgcgcggt gcgtagtctg gagctatggt ggtggtggca 60
gccgcgccga acccggccga cgggacccct aaagttctgc ttctgtcggg gcagcccgcc 120
tccgccgccg gagccccggc cggccaggcc ctgccgctca tggtgccagc ccagagaggg 180
gccagcccgg aggcagcgag cggggggctg ccccaggcgc gcaagcgaca gcgcctcacg 240
cacctgagcc ccgaggagaa ggcgctgagg aggaaactga aaaacagagt agcagctcag 300
actgccagag atcgaaagaa ggctcgaatg agtgagctgg aacagcaagt ggtagattta 360
gaagaagaga accaaaaact tttgctagaa aatcagcttt tacgagagaa aactcatggc 420
cttgtagttg agaaccagga gttaagacag cgcttgggga tggatgccct ggttgctgaa 480
gaggaggcgg aagccaaggg gaatgaagtg aggccagtgg ccgggtctgc tgagtccgca 540
gcactcagac tacgtgcacc tctgcagcag gtgcaggccc agttgtcacc cctccagaac 600
atctccccat ggattctggc ggtattgact cttcagattc agagtctgat atcctgttgg 660
gcattctgga caacttggac ccagtcatgt tcttcaaatg cccttcccca gagcctgcca 720
gcctggagga gctcccagag gtctacccag aaggacccag ttccttacca gcctcccttt 780
ctctgtcagt ggggacgtca tcagccaagc tggaagccat taatgaacta attcgttttg 840
accacatata taccaagccc ctagtcttag agataccctc tgagacagag agccaagcta 900
atgtggtagt gaaaatcgag gaagcacctc tcagcccctc agagaatgat caccctgaat 960
tcattgtctc agtgaaggaa gaacctgtag aagatgacct cgttccggag ctgggtatct 1020
caaatctgct ttcatccagc cactgcccaa agccatcttc ctgcctactg gatgcttaca 1080
gtgactgtgg atacgggggt tccctttccc cattcagtga catgtcctct ctgcttggtg 1140
taaaccattc ttgggaggac acttttgcca atgaactctt tccccagctg attagtgtct 1200
aaggaatgat ccaatactgt tgcccttttc cttgactatt acactgcctg gaggatagca 1260
gagaagcctg tctgtacttc attcaaaaag ccaaaataga gagtatacag tcctagagaa 1320
ttcctctatt tgttcagatc tcatagatga cccccaggta ttgtcttttg acatccagca 1380
gtccaaggta ttgagacata ttactggaag taagaaatat tactataatt gagaactaca 1440
gcttttaaga ttgtactttt atcttaaaag ggtggtagtt ttccctaaaa tacttattat 1500
gtaagggtca ttagacaaat gtcttgaagt agacatggaa tttatgaatg gttctttatc 1560
atttctcttc cccctttttg gcatcctggc ttgcctccag ttttaggtcc tttagtttgc 1620
ttctgtaagc aacgggaaca cctgctgagg gggctctttc cctcatgtat acttcaagta 1680
agatcaagaa tcttttgtga aattatagaa atttactatg taaatgcttg atggaatttt 1740
ttcctgctag tgtagcttct gaaaggtgct ttctccattt atttaaaact acccatgcaa 1800
ttaaaaggta caatgca 1817
<210> 803
<211> 261
<212> PRT
<213> 智人
<400> 803
Met Val Val Val Ala Ala Ala Pro Asn Pro Ala Asp Gly Thr Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Ala Ala Gly Ala Pro Ala
20 25 30
Gly Gln Ala Leu Pro Leu Met Val Pro Ala Gln Arg Gly Ala Ser Pro
35 40 45
Glu Ala Ala Ser Gly Gly Leu Pro Gln Ala Arg Lys Arg Gln Arg Leu
50 55 60
Thr His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn
65 70 75 80
Arg Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Arg Met Ser
85 90 95
Glu Leu Glu Gln Gln Val Val Asp Leu Glu Glu Glu Asn Gln Lys Leu
100 105 110
Leu Leu Glu Asn Gln Leu Leu Arg Glu Lys Thr His Gly Leu Val Val
115 120 125
Glu Asn Gln Glu Leu Arg Gln Arg Leu Gly Met Asp Ala Leu Val Ala
130 135 140
Glu Glu Glu Ala Glu Ala Lys Gly Asn Glu Val Arg Pro Val Ala Gly
145 150 155 160
Ser Ala Glu Ser Ala Ala Leu Arg Leu Arg Ala Pro Leu Gln Gln Val
165 170 175
Gln Ala Gln Leu Ser Pro Leu Gln Asn Ile Ser Pro Trp Ile Leu Ala
180 185 190
Val Leu Thr Leu Gln Ile Gln Ser Leu Ile Ser Cys Trp Ala Phe Trp
195 200 205
Thr Thr Trp Thr Gln Ser Cys Ser Ser Asn Ala Leu Pro Gln Ser Leu
210 215 220
Pro Ala Trp Arg Ser Ser Gln Arg Ser Thr Gln Lys Asp Pro Val Pro
225 230 235 240
Tyr Gln Pro Pro Phe Leu Cys Gln Trp Gly Arg His Gln Pro Ser Trp
245 250 255
Lys Pro Leu Met Asn
260
<210> 804
<211> 1791
<212> DNA
<213> 智人
<400> 804
gctgggcggc tgcggcgcgc ggtgcgcggt gcgtagtctg gagctatggt ggtggtggca 60
gccgcgccga acccggccga cgggacccct aaagttctgc ttctgtcggg gcagcccgcc 120
tccgccgccg gagccccggc cggccaggcc ctgccgctca tggtgccagc ccagagaggg 180
gccagcccgg aggcagcgag cggggggctg ccccaggcgc gcaagcgaca gcgcctcacg 240
cacctgagcc ccgaggagaa ggcgctgagg aggaaactga aaaacagagt agcagctcag 300
actgccagag atcgaaagaa ggctcgaatg agtgagctgg aacagcaagt ggtagattta 360
gaagaagaga accaaaaact tttgctagaa aatcagcttt tacgagagaa aactcatggc 420
cttgtagttg agaaccagga gttaagacag cgcttgggga tggatgccct ggttgctgaa 480
gaggaggcgg aagccaaggg gaatgaagtg aggccagtgg ccgggtctgc tgagtccgca 540
gcaggtgcag gcccagttgt cacccctcca gaacatctcc ccatggattc tggcggtatt 600
gactcttcag attcagagtc tgatatcctg ttgggcattc tggacaactt ggacccagtc 660
atgttcttca aatgcccttc cccagagcct gccagcctgg aggagctccc agaggtctac 720
ccagaaggac ccagttcctt accagcctcc ctttctctgt cagtggggac gtcatcagcc 780
aagctggaag ccattaatga actaattcgt tttgaccaca tatataccaa gcccctagtc 840
ttagagatac cctctgagac agagagccaa gctaatgtgg tagtgaaaat cgaggaagca 900
cctctcagcc cctcagagaa tgatcaccct gaattcattg tctcagtgaa ggaagaacct 960
gtagaagatg acctcgttcc ggagctgggt atctcaaatc tgctttcatc cagccactgc 1020
ccaaagccat cttcctgcct actggatgct tacagtgact gtggatacgg gggttccctt 1080
tccccattca gtgacatgtc ctctctgctt ggtgtaaacc attcttggga ggacactttt 1140
gccaatgaac tctttcccca gctgattagt gtctaaggaa tgatccaata ctgttgccct 1200
tttccttgac tattacactg cctggaggat agcagagaag cctgtctgta cttcattcaa 1260
aaagccaaaa tagagagtat acagtcctag agaattcctc tatttgttca gatctcatag 1320
atgaccccca ggtattgtct tttgacatcc agcagtccaa ggtattgaga catattactg 1380
gaagtaagaa atattactat aattgagaac tacagctttt aagattgtac ttttatctta 1440
aaagggtggt agttttccct aaaatactta ttatgtaagg gtcattagac aaatgtcttg 1500
aagtagacat ggaatttatg aatggttctt tatcatttct cttccccctt tttggcatcc 1560
tggcttgcct ccagttttag gtcctttagt ttgcttctgt aagcaacggg aacacctgct 1620
gagggggctc tttccctcat gtatacttca agtaagatca agaatctttt gtgaaattat 1680
agaaatttac tatgtaaatg cttgatggaa ttttttcctg ctagtgtagc ttctgaaagg 1740
tgctttctcc atttatttaa aactacccat gcaattaaaa ggtacaatgc a 1791
<210> 805
<211> 376
<212> PRT
<213> 智人
<400> 805
Met Val Val Val Ala Ala Ala Pro Asn Pro Ala Asp Gly Thr Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Ala Ala Gly Ala Pro Ala
20 25 30
Gly Gln Ala Leu Pro Leu Met Val Pro Ala Gln Arg Gly Ala Ser Pro
35 40 45
Glu Ala Ala Ser Gly Gly Leu Pro Gln Ala Arg Lys Arg Gln Arg Leu
50 55 60
Thr His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn
65 70 75 80
Arg Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Arg Met Ser
85 90 95
Glu Leu Glu Gln Gln Val Val Asp Leu Glu Glu Glu Asn Gln Lys Leu
100 105 110
Leu Leu Glu Asn Gln Leu Leu Arg Glu Lys Thr His Gly Leu Val Val
115 120 125
Glu Asn Gln Glu Leu Arg Gln Arg Leu Gly Met Asp Ala Leu Val Ala
130 135 140
Glu Glu Glu Ala Glu Ala Lys Gly Asn Glu Val Arg Pro Val Ala Gly
145 150 155 160
Ser Ala Glu Ser Ala Ala Gly Ala Gly Pro Val Val Thr Pro Pro Glu
165 170 175
His Leu Pro Met Asp Ser Gly Gly Ile Asp Ser Ser Asp Ser Glu Ser
180 185 190
Asp Ile Leu Leu Gly Ile Leu Asp Asn Leu Asp Pro Val Met Phe Phe
195 200 205
Lys Cys Pro Ser Pro Glu Pro Ala Ser Leu Glu Glu Leu Pro Glu Val
210 215 220
Tyr Pro Glu Gly Pro Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val
225 230 235 240
Gly Thr Ser Ser Ala Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe
245 250 255
Asp His Ile Tyr Thr Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr
260 265 270
Glu Ser Gln Ala Asn Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser
275 280 285
Pro Ser Glu Asn Asp His Pro Glu Phe Ile Val Ser Val Lys Glu Glu
290 295 300
Pro Val Glu Asp Asp Leu Val Pro Glu Leu Gly Ile Ser Asn Leu Leu
305 310 315 320
Ser Ser Ser His Cys Pro Lys Pro Ser Ser Cys Leu Leu Asp Ala Tyr
325 330 335
Ser Asp Cys Gly Tyr Gly Gly Ser Leu Ser Pro Phe Ser Asp Met Ser
340 345 350
Ser Leu Leu Gly Val Asn His Ser Trp Glu Asp Thr Phe Ala Asn Glu
355 360 365
Leu Phe Pro Gln Leu Ile Ser Val
370 375
<210> 806
<211> 1671
<212> DNA
<213> 智人
<400> 806
gctgggcggc tgcggcgcgc ggtgcgcggt gcgtagtctg gagctatggt ggtggtggca 60
gccgcgccga acccggccga cgggacccct aaagttctgc ttctgtcggg gcagcccgcc 120
tccgccgccg gagccccggc cggccaggcc ctgccgctca tggtgccagc ccagagaggg 180
gccagcccgg aggcagcgag cggggggctg ccccaggcgc gcaagcgaca gcgcctcacg 240
cacctgagcc ccgaggagaa ggcgctgagg aggaaactga aaaacagagt agcagctcag 300
actgccagag atcgaaagaa ggctcgaatg agtgagctgg aacagcaagt ggtagattta 360
gaagaagaga accaaaaact tttgctagaa aatcagcttt tacgagagaa aactcatggc 420
cttgtagttg agaaccagga gttaagacag cgcttgggga tggatgccct ggttgctgaa 480
gaggaggcgg aagccaagtc tgatatcctg ttgggcattc tggacaactt ggacccagtc 540
atgttcttca aatgcccttc cccagagcct gccagcctgg aggagctccc agaggtctac 600
ccagaaggac ccagttcctt accagcctcc ctttctctgt cagtggggac gtcatcagcc 660
aagctggaag ccattaatga actaattcgt tttgaccaca tatataccaa gcccctagtc 720
ttagagatac cctctgagac agagagccaa gctaatgtgg tagtgaaaat cgaggaagca 780
cctctcagcc cctcagagaa tgatcaccct gaattcattg tctcagtgaa ggaagaacct 840
gtagaagatg acctcgttcc ggagctgggt atctcaaatc tgctttcatc cagccactgc 900
ccaaagccat cttcctgcct actggatgct tacagtgact gtggatacgg gggttccctt 960
tccccattca gtgacatgtc ctctctgctt ggtgtaaacc attcttggga ggacactttt 1020
gccaatgaac tctttcccca gctgattagt gtctaaggaa tgatccaata ctgttgccct 1080
tttccttgac tattacactg cctggaggat agcagagaag cctgtctgta cttcattcaa 1140
aaagccaaaa tagagagtat acagtcctag agaattcctc tatttgttca gatctcatag 1200
atgaccccca ggtattgtct tttgacatcc agcagtccaa ggtattgaga catattactg 1260
gaagtaagaa atattactat aattgagaac tacagctttt aagattgtac ttttatctta 1320
aaagggtggt agttttccct aaaatactta ttatgtaagg gtcattagac aaatgtcttg 1380
aagtagacat ggaatttatg aatggttctt tatcatttct cttccccctt tttggcatcc 1440
tggcttgcct ccagttttag gtcctttagt ttgcttctgt aagcaacggg aacacctgct 1500
gagggggctc tttccctcat gtatacttca agtaagatca agaatctttt gtgaaattat 1560
agaaatttac tatgtaaatg cttgatggaa ttttttcctg ctagtgtagc ttctgaaagg 1620
tgctttctcc atttatttaa aactacccat gcaattaaaa ggtacaatgc a 1671
<210> 807
<211> 336
<212> PRT
<213> 智人
<400> 807
Met Val Val Val Ala Ala Ala Pro Asn Pro Ala Asp Gly Thr Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Ala Ala Gly Ala Pro Ala
20 25 30
Gly Gln Ala Leu Pro Leu Met Val Pro Ala Gln Arg Gly Ala Ser Pro
35 40 45
Glu Ala Ala Ser Gly Gly Leu Pro Gln Ala Arg Lys Arg Gln Arg Leu
50 55 60
Thr His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn
65 70 75 80
Arg Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Arg Met Ser
85 90 95
Glu Leu Glu Gln Gln Val Val Asp Leu Glu Glu Glu Asn Gln Lys Leu
100 105 110
Leu Leu Glu Asn Gln Leu Leu Arg Glu Lys Thr His Gly Leu Val Val
115 120 125
Glu Asn Gln Glu Leu Arg Gln Arg Leu Gly Met Asp Ala Leu Val Ala
130 135 140
Glu Glu Glu Ala Glu Ala Lys Ser Asp Ile Leu Leu Gly Ile Leu Asp
145 150 155 160
Asn Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro Glu Pro Ala
165 170 175
Ser Leu Glu Glu Leu Pro Glu Val Tyr Pro Glu Gly Pro Ser Ser Leu
180 185 190
Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala Lys Leu Glu
195 200 205
Ala Ile Asn Glu Leu Ile Arg Phe Asp His Ile Tyr Thr Lys Pro Leu
210 215 220
Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Ala Asn Val Val Val
225 230 235 240
Lys Ile Glu Glu Ala Pro Leu Ser Pro Ser Glu Asn Asp His Pro Glu
245 250 255
Phe Ile Val Ser Val Lys Glu Glu Pro Val Glu Asp Asp Leu Val Pro
260 265 270
Glu Leu Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys Pro Lys Pro
275 280 285
Ser Ser Cys Leu Leu Asp Ala Tyr Ser Asp Cys Gly Tyr Gly Gly Ser
290 295 300
Leu Ser Pro Phe Ser Asp Met Ser Ser Leu Leu Gly Val Asn His Ser
305 310 315 320
Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu Ile Ser Val
325 330 335
<210> 808
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 808
acaactgggc ctgcacct 18
<210> 809
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 809
gggcctgcac ctgctgca 18
<210> 810
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 810
gcacctgctg cagaggtg 18
<210> 811
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 811
gaggtgcacg tagtctga 18
<210> 812
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 812
cacgtagtct gagtgctg 18
<210> 813
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 813
gtctgagtgc tgcggact 18
<210> 814
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 814
gtgctgcgga ctcagcag 18
<210> 815
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 815
cggactcagc agacccgg 18
<210> 816
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 816
ggtgacaact gggcctgc 18
<210> 817
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 817
aactgggcct gcacctgc 18
<210> 818
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 818
ctgcacctgc tgcagagg 18
<210> 819
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 819
ctgctgcaga ggtgcacg 18
<210> 820
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 820
tgcagaggtg cacgtagt 18
<210> 821
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 821
cagaggtgca cgtagtct 18
<210> 822
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 822
ggtgcacgta gtctgagt 18
<210> 823
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 823
tgcacgtagt ctgagtgc 18
<210> 824
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 824
cgtagtctga gtgctgcg 18
<210> 825
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 825
tagtctgagt gctgcgga 18
<210> 826
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 826
ctgagtgctg cggactca 18
<210> 827
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 827
gagtgctgcg gactcagc 18
<210> 828
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 828
gctgcggact cagcagac 18
<210> 829
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 829
tgcggactca gcagaccc 18
<210> 830
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 830
gactcagcag acccggcc 18
<210> 831
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 831
ctcagcagac ccggccac 18
<210> 832
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 832
ctggttatat agctcttt 18
<210> 833
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 833
ggttatatag ctctttaa 18
<210> 834
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 834
ttatatagct ctttaata 18
<210> 835
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 835
atatagctct ttaataag 18
<210> 836
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 836
atagctcttt aataagtc 18
<210> 837
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 837
agctctttaa taagtcag 18
<210> 838
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 838
ctctttaata agtcagaa 18
<210> 839
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 839
ctttaataag tcagaatg 18
<210> 840
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 840
ttaataagtc agaatgat 18
<210> 841
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 841
aataagtcag aatgatcc 18
<210> 842
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 842
taagtcagaa tgatccct 18
<210> 843
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 843
agtcagaatg atccctac 18
<210> 844
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 844
tcagaatgat ccctacct 18
<210> 845
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 845
agaatgatcc ctacctct 18
<210> 846
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 846
aatgatccct acctctga 18
<210> 847
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 847
atccctacct ctgaatct 18
<210> 848
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 848
ccctacctct gaatctga 18
<210> 849
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 849
ctacctctga atctgaag 18
<210> 850
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 850
acctctgaat ctgaagag 18
<210> 851
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 851
ctctgaatct gaagagtc 18
<210> 852
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 852
ctgaatctga agagtcaa 18
<210> 853
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 853
atctgaagag tcaatacc 18
<210> 854
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 854
ctgaagagtc aataccgc 18
<210> 855
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 855
gaagagtcaa taccgcca 18
<210> 856
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 856
agagtcaata ccgccaga 18
<210> 857
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 857
agtcaatacc gccagaat 18
<210> 858
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 858
tcaataccgc cagaatcc 18
<210> 859
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 859
taccgccaga atccatgg 18
<210> 860
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 860
ccgccagaat ccatgggg 18
<210> 861
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 861
cagaatccat ggggagat 18
<210> 862
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 862
gaatccatgg ggagatgt 18
<210> 863
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 863
atccatgggg agatgttc 18
<210> 864
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 864
atggggagat gttctgga 18
<210> 865
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 865
ggggagatgt tctggagg 18
<210> 866
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 866
ggagatgttc tggagggg 18
<210> 867
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 867
agatgttctg gaggggtg 18
<210> 868
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 868
atgttctgga ggggtgac 18
<210> 869
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 869
gttctggagg ggtgacaa 18
<210> 870
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 870
tctggagggg tgacaact 18
<210> 871
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 871
gaggggtgac aactgggc 18
<210> 872
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 872
ggggtgacaa ctgggcct 18
<210> 873
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 873
cagcagaccc ggccactg 18
<210> 874
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 874
gcagacccgg ccactggc 18
<210> 875
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 875
agacccggcc actggcct 18
<210> 876
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 876
acccggccac tggcctca 18
<210> 877
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 877
ccggccactg gcctcact 18
<210> 878
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 878
ggccactggc ctcacttc 18
<210> 879
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 879
ccactggcct cacttcat 18
<210> 880
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 880
actggcctca cttcattc 18
<210> 881
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 881
tggcctcact tcattccc 18
<210> 882
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 882
gcctcacttc attcccct 18
<210> 883
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 883
ctcacttcat tcccctgg 18
<210> 884
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 884
cacttcattc ccctggga 18
<210> 885
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 885
cttcattccc ctgggagg 18
<210> 886
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 886
tcattcccct gggaggaa 18
<210> 887
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 887
attcccctgg gaggaaag 18
<210> 888
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 888
tcccctggga ggaaagac 18
<210> 889
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 889
ccctgggagg aaagacca 18
<210> 890
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 890
ctgggaggaa agaccaaa 18
<210> 891
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 891
gggaggaaag accaaagt 18
<210> 892
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 892
gaggaaagac caaagtga 18
<210> 893
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 893
ggaaagacca aagtgaat 18
<210> 894
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 894
aaagaccaaa gtgaataa 18
<210> 895
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 895
agaccaaagt gaataaac 18
<210> 896
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 896
caaagtgaat aaacagct 18
<210> 897
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 897
aagtgaataa acagcttc 18
<210> 898
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 898
gtgaataaac agcttcaa 18
<210> 899
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 899
gaataaacag cttcaagt 18
<210> 900
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 基序序列
<400> 900
ataaacagct tcaagtgc 18
<210> 901
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 901
aggtgcaggc ccagttgt 18
<210> 902
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 902
tgcagcaggt gcaggccc 18
<210> 903
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 903
cacctctgca gcaggtgc 18
<210> 904
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 904
tcagactacg tgcacctc 18
<210> 905
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 905
cagcactcag actacgtg 18
<210> 906
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 906
agtccgcagc actcagac 18
<210> 907
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 907
ctgctgagtc cgcagcac 18
<210> 908
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 908
ccgggtctgc tgagtccg 18
<210> 909
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 909
gcaggcccag ttgtcacc 18
<210> 910
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 910
gcaggtgcag gcccagtt 18
<210> 911
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 911
cctctgcagc aggtgcag 18
<210> 912
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 912
cgtgcacctc tgcagcag 18
<210> 913
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 913
actacgtgca cctctgca 18
<210> 914
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 914
agactacgtg cacctctg 18
<210> 915
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 915
actcagacta cgtgcacc 18
<210> 916
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 916
gcactcagac tacgtgca 18
<210> 917
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 917
cgcagcactc agactacg 18
<210> 918
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 918
tccgcagcac tcagacta 18
<210> 919
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 919
tgagtccgca gcactcag 18
<210> 920
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 920
gctgagtccg cagcactc 18
<210> 921
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 921
gtctgctgag tccgcagc 18
<210> 922
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 922
gggtctgctg agtccgca 18
<210> 923
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 923
ggccgggtct gctgagtc 18
<210> 924
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 924
gtggccgggt ctgctgag 18
<210> 925
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 925
aaagagctat ataaccag 18
<210> 926
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 926
ttaaagagct atataacc 18
<210> 927
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 927
tattaaagag ctatataa 18
<210> 928
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 928
cttattaaag agctatat 18
<210> 929
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 929
gacttattaa agagctat 18
<210> 930
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 930
ctgacttatt aaagagct 18
<210> 931
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 931
ttctgactta ttaaagag 18
<210> 932
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 932
cattctgact tattaaag 18
<210> 933
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 933
atcattctga cttattaa 18
<210> 934
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 934
ggatcattct gacttatt 18
<210> 935
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 935
agggatcatt ctgactta 18
<210> 936
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 936
gtagggatca ttctgact 18
<210> 937
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 937
aggtagggat cattctga 18
<210> 938
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 938
agaggtaggg atcattct 18
<210> 939
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 939
tcagaggtag ggatcatt 18
<210> 940
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 940
agattcagag gtagggat 18
<210> 941
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 941
tcagattcag aggtaggg 18
<210> 942
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 942
cttcagattc agaggtag 18
<210> 943
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 943
ctcttcagat tcagaggt 18
<210> 944
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 944
gactcttcag attcagag 18
<210> 945
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 945
ttgactcttc agattcag 18
<210> 946
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 946
ggtattgact cttcagat 18
<210> 947
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 947
gcggtattga ctcttcag 18
<210> 948
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 948
tggcggtatt gactcttc 18
<210> 949
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 949
tctggcggta ttgactct 18
<210> 950
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 950
attctggcgg tattgact 18
<210> 951
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 951
ggattctggc ggtattga 18
<210> 952
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 952
ccatggattc tggcggta 18
<210> 953
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 953
ccccatggat tctggcgg 18
<210> 954
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 954
atctccccat ggattctg 18
<210> 955
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 955
acatctcccc atggattc 18
<210> 956
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 956
gaacatctcc ccatggat 18
<210> 957
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 957
tccagaacat ctccccat 18
<210> 958
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 958
cctccagaac atctcccc 18
<210> 959
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 959
cccctccaga acatctcc 18
<210> 960
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 960
cacccctcca gaacatct 18
<210> 961
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 961
gtcacccctc cagaacat 18
<210> 962
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 962
ttgtcacccc tccagaac 18
<210> 963
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 963
agttgtcacc cctccaga 18
<210> 964
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 964
gcccagttgt cacccctc 18
<210> 965
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 965
aggcccagtt gtcacccc 18
<210> 966
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 966
cagtggccgg gtctgctg 18
<210> 967
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 967
gccagtggcc gggtctgc 18
<210> 968
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 968
aggccagtgg ccgggtct 18
<210> 969
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 969
tgaggccagt ggccgggt 18
<210> 970
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 970
agtgaggcca gtggccgg 18
<210> 971
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 971
gaagtgaggc cagtggcc 18
<210> 972
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 972
atgaagtgag gccagtgg 18
<210> 973
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 973
gaatgaagtg aggccagt 18
<210> 974
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 974
gggaatgaag tgaggcca 18
<210> 975
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 975
aggggaatga agtgaggc 18
<210> 976
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 976
ccaggggaat gaagtgag 18
<210> 977
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 977
tcccagggga atgaagtg 18
<210> 978
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 978
cctcccaggg gaatgaag 18
<210> 979
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 979
ttcctcccag gggaatga 18
<210> 980
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 980
ctttcctccc aggggaat 18
<210> 981
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 981
gtctttcctc ccagggga 18
<210> 982
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 982
tggtctttcc tcccaggg 18
<210> 983
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 983
tttggtcttt cctcccag 18
<210> 984
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 984
actttggtct ttcctccc 18
<210> 985
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 985
tcactttggt ctttcctc 18
<210> 986
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 986
attcactttg gtctttcc 18
<210> 987
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 987
ttattcactt tggtcttt 18
<210> 988
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 988
gtttattcac tttggtct 18
<210> 989
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 989
agctgtttat tcactttg 18
<210> 990
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 990
gaagctgttt attcactt 18
<210> 991
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 991
ttgaagctgt ttattcac 18
<210> 992
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 992
acttgaagct gtttattc 18
<210> 993
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 993
gcacttgaag ctgtttat 18
<210> 994
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物 2(XBP1 WT 和 XBP1Δ4 测定)
<400> 994
gttcctccag attggcag 18
<210> 995
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物 1(XBP1 WT 和 XBP1Δ4 测定)
<400> 995
ccaggagtta agaactcgc 19
<210> 996
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 探针(XBP1 WT 测定)
<220>
<221> misc_feature
<222> (9)..(10)
<223> 核苷酸 9 与 10 之间的内部 ZEN 猝灭剂
<400> 996
cggagtccaa gggaaatgga gta 23
<210> 997
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 探针(XBP1Δ4 测定)
<220>
<221> misc_feature
<222> (9)..(10)
<223> 核苷酸 9 与 10 之间的内部 ZEN 猝灭剂
<400> 997
cggagtccaa gtctgatatc cttttg 26
<210> 998
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 引物 2(XBP1 WT 和 XBP1Δ4 测定)
<400> 998
agggtccaac ttgtcc 16
<210> 999
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物 1(XBP1 WT 和 XBP1Δ4 测定)
<400> 999
ctggatcctg acgaggttc 19
<210> 1000
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 探针(XBP1 WT 测定)
<220>
<221> misc_feature
<222> (9)..(10)
<223> 核苷酸 9 与 10 之间的内部 ZEN 猝灭剂
<400> 1000
cttactccac tccccttggc ctcca 25
<210> 1001
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 探针(XBP1Δ4 测定)
<220>
<221> misc_feature
<222> (9)..(10)
<223> 核苷酸 9 与 10 之间的内部 ZEN 猝灭剂
<400> 1001
cccaaaagga tatcagactt ggcctcca 28
<210> 1002
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 2(XBP1 WT 和 XBP1Δ4 测定)
<400> 1002
ctgggtccaa gttgtccaga 20
<210> 1003
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物 1(XBP1 WT 和 XBP1Δ4 测定)
<400> 1003
atgccctggt tgctgaag 18
<210> 1004
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 探针(XBP1 WT 测定)
<220>
<221> misc_feature
<222> (9)..(10)
<223> 核苷酸 9 与 10 之间的内部 ZEN 猝灭剂
<400> 1004
tcacttcatt ccccttggct tccgc 25
<210> 1005
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 探针(XBP1Δ4 测定)
<220>
<221> misc_feature
<222> (9)..(10)
<223> 核苷酸 9 与 10 之间的内部 ZEN 猝灭剂
<400> 1005
ccaacaggat atcagacttg gcttccgc 28
<210> 1006
<211> 62
<212> RNA
<213> 人工序列
<220>
<223> 参与 IRE1 介导的可变剪接事件的序列
<400> 1006
ccgggucugc ugaguccgca gcacucagac uacgugcacc ucugcagcag gugcaggccc 60
ag 62
<210> 1007
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 参与 IRE1 介导的可变剪接事件的序列
<400> 1007
ccgggucugc ugaguccgca gcaggugcag gcccag 36
<210> 1008
<211> 216
<212> PRT
<213> 灰仓鼠
<400> 1008
Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu Lys Ala
1 5 10 15
Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala Arg Asp
20 25 30
Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val Asp Leu
35 40 45
Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu Arg Glu
50 55 60
Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr Arg Leu
65 70 75 80
Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu Ser Lys
85 90 95
Gly Asn Gly Val Arg Pro Val Ala Gly Ser Ala Glu Ser Ala Ala Leu
100 105 110
Arg Leu Arg Ala Pro Leu Gln Gln Val Gln Ala Gln Leu Ser Pro Pro
115 120 125
Gln Asn Ile Phe Pro Trp Ile Leu Thr Leu Leu Thr Leu Gln Thr Pro
130 135 140
Ser Leu Ile Ser Phe Trp Ala Phe Trp Thr Ser Trp Thr Leu Ser Cys
145 150 155 160
Phe Ser Asn Val His Pro Gln Ser Leu Pro Ile Trp Arg Asn Ser Gln
165 170 175
Arg Ser Thr Gln Asp Leu Val Pro Tyr Gln Pro Pro Phe Leu Cys Gln
180 185 190
Trp Gly Pro His Gln Pro Ser Trp Lys Pro Leu Met Asn Ser Phe Ala
195 200 205
Leu Thr Met Tyr Thr Pro Ser Leu
210 215
<210> 1009
<211> 320
<212> PRT
<213> 灰仓鼠
<400> 1009
Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu Lys Ala
1 5 10 15
Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala Arg Asp
20 25 30
Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val Asp Leu
35 40 45
Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu Arg Glu
50 55 60
Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr Arg Leu
65 70 75 80
Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu Ser Lys
85 90 95
Gly Asn Gly Val Arg Pro Val Ala Gly Ser Ala Glu Ser Ala Ala Gly
100 105 110
Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp Ser Asp
115 120 125
Thr Val Asp Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly Ile Leu
130 135 140
Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro Glu Ser
145 150 155 160
Ala Asn Leu Glu Glu Leu Pro Glu Val Tyr Pro Gly Pro Ser Ser Leu
165 170 175
Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala Lys Leu Glu
180 185 190
Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr Lys Pro Leu
195 200 205
Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn Val Val Val
210 215 220
Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp His Pro Glu
225 230 235 240
Phe Ile Val Ser Val Lys Lys Glu Pro Leu Glu Glu Asp Phe Ile Pro
245 250 255
Glu Pro Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys Leu Lys Pro
260 265 270
Ser Ser Cys Leu Leu Asp Ala Tyr Ser Asp Cys Gly Tyr Glu Gly Ser
275 280 285
Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Ile Asp His Ser
290 295 300
Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu Ile Ser Val
305 310 315 320
<210> 1010
<211> 280
<212> PRT
<213> 人工序列
<220>
<223> 由 XBP1Δ4 变体编码的蛋白质序列
<400> 1010
Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu Lys Ala
1 5 10 15
Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala Arg Asp
20 25 30
Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val Asp Leu
35 40 45
Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu Arg Glu
50 55 60
Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr Arg Leu
65 70 75 80
Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu Ser Lys
85 90 95
Ser Asp Ile Leu Leu Gly Ile Leu Asp Lys Leu Asp Pro Val Met Phe
100 105 110
Phe Lys Cys Pro Ser Pro Glu Ser Ala Asn Leu Glu Glu Leu Pro Glu
115 120 125
Val Tyr Pro Gly Pro Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val
130 135 140
Gly Thr Ser Ser Ala Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe
145 150 155 160
Asp His Val Tyr Thr Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr
165 170 175
Glu Ser Gln Thr Asn Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser
180 185 190
Ser Ser Glu Glu Asp His Pro Glu Phe Ile Val Ser Val Lys Lys Glu
195 200 205
Pro Leu Glu Glu Asp Phe Ile Pro Glu Pro Gly Ile Ser Asn Leu Leu
210 215 220
Ser Ser Ser His Cys Leu Lys Pro Ser Ser Cys Leu Leu Asp Ala Tyr
225 230 235 240
Ser Asp Cys Gly Tyr Glu Gly Ser Pro Ser Pro Phe Ser Asp Met Ser
245 250 255
Ser Pro Leu Gly Ile Asp His Ser Trp Glu Asp Thr Phe Ala Asn Glu
260 265 270
Leu Phe Pro Gln Leu Ile Ser Val
275 280

Claims (15)

1.一种用于重组生产多聚体多肽的方法,所述方法包括以下步骤:
a)培养表达XBP1以及包含编码所述多聚体多肽的一个或多个核酸的哺乳动物细胞;以及
b)从所述细胞或培养基中回收所述多聚体多肽,
其特征在于所述培养是在诱导形成XBP1变体XBP1Δ4的反义寡核苷酸的存在下。
2.根据权利要求1所述的方法,其包括以下步骤:
a1)在包含诱导形成所述XBP1变体XBP1Δ4的反义寡核苷酸的培养基中,繁殖表达XBP1以及包含编码所述多肽的一个或多个核酸的哺乳动物细胞以获得第一细胞群;
a2)将所述第一细胞群的等分试样与培养基混合以获得第二细胞群,其中所述培养基任选地包含诱导形成所述XBP1变体XBP1Δ4的所述反义寡核苷酸;
a3)培养所述第二细胞群以获得第三细胞群;以及
b)从第三次细胞培养的所述细胞和/或所述培养基中回收所述多肽。
3.根据权利要求1至2中任一项所述的方法,其特征在于所述反义寡核苷酸的长度为8个至40个核苷酸,并且包含长度为8个至40个核苷酸的与哺乳动物XBP1前体mRNA转录本互补的连续核苷酸序列。
4.根据权利要求3所述的方法,其特征在于所述连续核苷酸序列与仓鼠XBP1前体mRNA转录本(SEQ ID NO 1)的至少10个连续核苷酸互补。
5.根据权利要求1至4中任一项所述的方法,其特征在于所述反义寡核苷酸选自由以下项组成的组:SEQ ID NO 8、SEQ ID NO 10、SEQID NO 11、SEQ ID NO 13、SEQ ID NO 14、SEQID NO 15、SEQ ID NO 16、SEQ ID NO 17、SEQ ID NO 18、SEQ ID NO 19、SEQ ID NO 23、SEQID NO 24、SEQ ID NO 25、SEQ ID NO 26、SEQ IDNO 27、SEQ ID NO 28、SEQ ID NO 32、SEQID NO 34、SEQ ID NO 36、SEQ ID NO 37、SEQ ID NO 39、SEQ ID NO 40、SEQ ID NO 41、SEQID NO 42、SEQ ID NO 43、SEQ ID NO 45、SEQ ID NO 46、SEQ ID NO 94、SEQ ID NO 95、SEQID NO 96、SEQ ID NO 97、SEQ ID NO 99、SEQ ID NO 100、SEQ ID NO 101、SEQ ID NO 102、SEQ ID NO 103、SEQ ID NO 104、SEQ ID NO 105、SEQID NO 106、SEQ ID NO 107、SEQ IDNO 108、SEQ ID NO 110、SEQ ID NO 111、SEQ ID NO 128、SEQ ID NO 140、SEQ ID NO 141、SEQ ID NO 142、SEQ ID NO 143、SEQ ID NO 147、SEQ ID NO 148、SEQ ID NO 149、SEQ IDNO 150、SEQ ID NO 151、SEQID NO 158、SEQ ID NO 193、SEQ ID NO 194、SEQ ID NO 195、SEQ ID NO 196、SEQ ID NO 197、SEQ ID NO 198、SEQ ID NO 199、SEQ ID NO 200、SEQ IDNO 201、SEQ ID NO 202、SEQ ID NO 203、SEQ ID NO 204、SEQ ID NO 205、SEQ ID NO 206、SEQID NO 207、SEQ ID NO 208、SEQ ID NO 209、SEQ ID NO 210、SEQ ID NO 211、SEQ IDNO 212、SEQ ID NO 214、SEQ ID NO 215、SEQ ID NO 216、SEQ ID NO 217、SEQ ID NO 218、SEQ ID NO 219、SEQ ID NO 220、SEQ ID NO 221、SEQ ID NO 222、SEQID NO 224、SEQ IDNO 226、SEQ ID NO 229、SEQ ID NO 281、SEQ ID NO 282、SEQ ID NO 285、SEQ ID NO 286、SEQ ID NO 297和SEQ ID NO 298。
6.根据权利要求1至5中任一项所述的方法,其特征在于所述连续核苷酸序列与所述反义寡核苷酸具有相同的长度。
7.根据权利要求1至6中任一项所述的方法,其特征在于所述反义寡核苷酸或其连续核苷酸序列包含一个或多个经修饰的核苷酸或一个或多个经修饰的核苷。
8.根据权利要求1至7中任一项所述的方法,其特征在于所述反义寡核苷酸或其连续核苷酸序列包含一个或多个经修饰的核苷,诸如独立地选自由以下项组成的组的一个或多个经修饰的核苷酸:2'-O-烷基-RNA;2'-O-甲基RNA(2'-OMe);2'-烷氧基-RNA;2'-O-甲氧基乙基-RNA(2'-MOE);2'-氨基-DNA;2'-氟-RNA;2'-氟-DNA;阿糖核酸(ANA);2'-氟-ANA;双环核苷类似物(LNA);或它们的任何组合。
9.根据权利要求1至8中任一项所述的方法,其特征在于所述反义寡核苷酸的所述连续核苷酸序列内的核苷间键合中的一者或多者是经修饰的。
10.根据权利要求9所述的方法,其特征在于所述反义寡核苷酸内至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%的所述核苷间键合是经修饰的。
11.根据权利要求1至10中的一项所述的方法,其特征在于添加所述反义寡核苷酸至最终浓度为25μM或更高。
12.根据权利要求1至11中的一项所述的方法,其特征在于所述培养使用1*10E6至2*10E6个细胞/mL的起始细胞密度。
13.根据权利要求12所述的方法,其特征在于所述起始细胞密度为约2*10E6个细胞/mL。
14.根据权利要求1至13中任一项所述的方法,其特征在于所述哺乳动物细胞为CHO细胞。
15.根据权利要求1至14中任一项所述的方法,其特征在于所述多聚体多肽为抗体。
CN202180086765.XA 2020-12-22 2021-12-17 靶向xbp1的寡核苷酸 Pending CN116670282A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20216690.6 2020-12-22
EP20216690 2020-12-22
PCT/EP2021/086382 WO2022136140A1 (en) 2020-12-22 2021-12-17 Oligonucleotides targeting xbp1

Publications (1)

Publication Number Publication Date
CN116670282A true CN116670282A (zh) 2023-08-29

Family

ID=73856912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180086765.XA Pending CN116670282A (zh) 2020-12-22 2021-12-17 靶向xbp1的寡核苷酸

Country Status (5)

Country Link
US (1) US20230323421A1 (zh)
EP (1) EP4267734A1 (zh)
JP (1) JP2024501662A (zh)
CN (1) CN116670282A (zh)
WO (1) WO2022136140A1 (zh)

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
US4676980A (en) 1985-09-23 1987-06-30 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Target specific cross-linked heteroantibodies
DE3883899T3 (de) 1987-03-18 1999-04-22 Sb2 Inc Geänderte antikörper.
DE69128037T2 (de) 1990-11-13 1998-05-07 Immunex Corp Bifunktionelle wählbare fusionsgene
WO1993008829A1 (en) 1991-11-04 1993-05-13 The Regents Of The University Of California Compositions that mediate killing of hiv-infected cells
EP0804590A1 (en) 1993-05-21 1997-11-05 Targeted Genetics Corporation Bifunctional selectable fusion genes based on the cytosine deaminase (cd) gene
US5731168A (en) 1995-03-01 1998-03-24 Genentech, Inc. Method for making heteromultimeric polypeptides
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
AU751659B2 (en) 1997-05-02 2002-08-22 Genentech Inc. A method for making multispecific antibodies having heteromultimeric and common components
NZ503765A (en) 1997-09-12 2002-04-26 Exiqon As Bi-cyclic and tri-cyclic nucleotide analogues
BRPI0008131B8 (pt) 1999-02-12 2021-05-25 Daiichi Sankyo Co Ltd composto ou um sal deste, análogo de oligonucleotídeo, composição farmacêutica, sonda para um gene,iniciador para começar a amplificação, uso de um análogo de oligonucleotídeo ou de um sal deste farmacologicamente aceitável, agente antisentido, e, agente antígeno
CA2372085C (en) 1999-05-04 2009-10-27 Exiqon A/S L-ribo-lna analogues
US6617442B1 (en) 1999-09-30 2003-09-09 Isis Pharmaceuticals, Inc. Human Rnase H1 and oligonucleotide compositions thereof
JP2003531588A (ja) 2000-04-11 2003-10-28 ジェネンテック・インコーポレーテッド 多価抗体とその用途
AU2003234198A1 (en) 2002-04-22 2003-11-03 University Of Michigan Novel genes, compositions, and methods for modulating the unfolded protein response
CA2994089A1 (en) 2002-11-18 2004-06-03 Roche Innovation Center Copenhagen A/S Antisense gapmer oligonucleotides
JP2007500016A (ja) * 2003-06-11 2007-01-11 バイオジェン・アイデック・エムエイ・インコーポレイテッド 培養においてタンパク質生成を増大させるための方法
EP2316955B1 (en) * 2004-09-02 2017-10-04 Wyeth LLC Systems and methods for protein production
WO2006106905A1 (ja) 2005-03-31 2006-10-12 Chugai Seiyaku Kabushiki Kaisha 会合制御によるポリペプチド製造方法
WO2007031091A2 (en) 2005-09-15 2007-03-22 Santaris Pharma A/S Rna antagonist compounds for the modulation of p21 ras expression
EP1984381B1 (en) 2006-01-27 2010-09-29 Isis Pharmaceuticals, Inc. 6-modified bicyclic nucleic acid analogs
PL1999154T3 (pl) 2006-03-24 2013-03-29 Merck Patent Gmbh Skonstruowane metodami inżynierii heterodimeryczne domeny białkowe
ES2389737T3 (es) 2006-05-11 2012-10-31 Isis Pharmaceuticals, Inc. Análogos de ácidos nucleicos bicíclicos modificados en 5'
US7666854B2 (en) 2006-05-11 2010-02-23 Isis Pharmaceuticals, Inc. Bis-modified bicyclic nucleic acid analogs
WO2007147901A1 (en) 2006-06-22 2007-12-27 Novo Nordisk A/S Production of bispecific antibodies
WO2008016356A2 (en) 2006-08-02 2008-02-07 Genizon Biosciences Genemap of the human genes associated with psoriasis
US20080044455A1 (en) 2006-08-21 2008-02-21 Chaim Welczer Tonsillitus Treatment
DK2059533T3 (da) 2006-08-30 2013-02-25 Genentech Inc Multispecifikke antistoffer
CA2688321A1 (en) 2007-05-30 2008-12-11 Isis Pharmaceuticals, Inc. N-substituted-aminomethylene bridged bicyclic nucleic acid analogs
WO2008154401A2 (en) 2007-06-08 2008-12-18 Isis Pharmaceuticals, Inc. Carbocyclic bicyclic nucleic acid analogs
ATE538127T1 (de) 2007-07-05 2012-01-15 Isis Pharmaceuticals Inc 6-disubstituierte bicyclische nukleinsäureanaloga
WO2009067647A1 (en) 2007-11-21 2009-05-28 Isis Pharmaceuticals, Inc. Carbocyclic alpha-l-bicyclic nucleic acid analogs
US8242247B2 (en) 2007-12-21 2012-08-14 Hoffmann-La Roche Inc. Bivalent, bispecific antibodies
US9266967B2 (en) 2007-12-21 2016-02-23 Hoffmann-La Roche, Inc. Bivalent, bispecific antibodies
US8227577B2 (en) 2007-12-21 2012-07-24 Hoffman-La Roche Inc. Bivalent, bispecific antibodies
US20090162359A1 (en) 2007-12-21 2009-06-25 Christian Klein Bivalent, bispecific antibodies
CA2709847C (en) 2008-01-07 2018-07-10 Amgen Inc. Method for making antibody fc-heterodimeric molecules using electrostatic steering effects
WO2010008860A1 (en) * 2008-06-23 2010-01-21 President And Fellows Of Harvard College Modulation of neurodegenerative disease by modulating xbp-1 activity
EP2356129B1 (en) 2008-09-24 2013-04-03 Isis Pharmaceuticals, Inc. Substituted alpha-l-bicyclic nucleosides
WO2010112193A1 (en) 2009-04-02 2010-10-07 Roche Glycart Ag Multispecific antibodies comprising full length antibodies and single chain fab fragments
JP5616428B2 (ja) 2009-04-07 2014-10-29 ロシュ グリクアート アクチェンゲゼルシャフト 三価の二重特異性抗体
JP2012525149A (ja) 2009-04-27 2012-10-22 オンコメッド ファーマシューティカルズ インコーポレイテッド ヘテロ多量体分子を作製するための方法
PE20120540A1 (es) 2009-05-27 2012-05-09 Hoffmann La Roche Anticuerpos triespecificos o tetraespecificos
US9676845B2 (en) 2009-06-16 2017-06-13 Hoffmann-La Roche, Inc. Bispecific antigen binding proteins
US8703132B2 (en) 2009-06-18 2014-04-22 Hoffmann-La Roche, Inc. Bispecific, tetravalent antigen binding proteins
EP2462153B1 (en) 2009-08-06 2015-07-29 Isis Pharmaceuticals, Inc. Bicyclic cyclohexose nucleic acid analogs
CN105693861A (zh) 2009-12-29 2016-06-22 新兴产品开发西雅图有限公司 异二聚体结合蛋白及其应用
WO2011143545A1 (en) 2010-05-14 2011-11-17 Rinat Neuroscience Corporation Heterodimeric proteins and methods for producing and purifying them
EP2580228B1 (en) 2010-06-08 2016-03-23 Ionis Pharmaceuticals, Inc. Substituted 2'-amino and 2'-thio-bicyclic nucleosides and oligomeric compounds prepared therefrom
PL2635607T3 (pl) 2010-11-05 2020-05-18 Zymeworks Inc. Projekt stabilnego przeciwciała heterodimerowego z mutacjami w domenie FC
CA2853383C (en) 2011-05-27 2021-04-06 Dutalys Gmbh Bispecific antibodies comprising two paratopes in one complementary vh-vl pair
CA2844538C (en) 2011-08-23 2020-09-22 Roche Glycart Ag Bispecific antigen binding molecules
EP2794905B1 (en) 2011-12-20 2020-04-01 MedImmune, LLC Modified polypeptides for bispecific antibody scaffolds
EP2850092B1 (en) 2012-04-09 2017-03-01 Ionis Pharmaceuticals, Inc. Tricyclic nucleic acid analogs
SG10201913376XA (en) 2012-04-20 2020-02-27 Merus Nv Methods and means for the production of ig-like molecules
CA2889596C (en) 2012-11-15 2022-08-23 Roche Innovation Center Copenhagen A/S Oligonucleotide conjugates
KR102597804B1 (ko) 2013-12-20 2023-11-07 제넨테크, 인크. 이중 특이적 항체
CA2935426C (en) 2014-01-30 2023-07-25 F. Hoffmann-La Roche Ag Polyoligomer compound with biocleavable conjugates for reducing or inhibiting expression of a nucleic acid target
UA117289C2 (uk) 2014-04-02 2018-07-10 Ф. Хоффманн-Ля Рош Аг Мультиспецифічне антитіло
CN106573986A (zh) 2014-07-29 2017-04-19 豪夫迈·罗氏有限公司 多特异性抗体
EP3286227A2 (en) 2015-04-24 2018-02-28 F. Hoffmann-La Roche AG Multispecific antigen-binding proteins
AR106189A1 (es) 2015-10-02 2017-12-20 Hoffmann La Roche ANTICUERPOS BIESPECÍFICOS CONTRA EL A-b HUMANO Y EL RECEPTOR DE TRANSFERRINA HUMANO Y MÉTODOS DE USO
SG10201705285SA (en) 2017-06-27 2019-01-30 Agency Science Tech & Res Antisense oligonucleotides

Also Published As

Publication number Publication date
WO2022136140A1 (en) 2022-06-30
JP2024501662A (ja) 2024-01-15
US20230323421A1 (en) 2023-10-12
EP4267734A1 (en) 2023-11-01

Similar Documents

Publication Publication Date Title
AU2023214349A1 (en) CD19 compositions and methods for immunotherapy
KR101637533B1 (ko) 제조 방법
KR102474757B1 (ko) 발현 강화 유전자좌의 사용에 기초하여 항체를 만들기 위한 조성물 및 방법
JP2012235782A (ja) Sorf構築物並びにポリタンパク質、プロタンパク質及びタンパク質分解による方法を含む複数の遺伝子発現
WO2000058499A1 (fr) Procede pour la production d&#39;anticorps monoclonal
CN115427059A (zh) 抗转铁蛋白受体(tfr)抗体及其用途
JP2007529223A (ja) 選択的スプライシングを用いて真核細胞においてポリペプチドマルチマーを発現するための方法および構築物
KR20180134893A (ko) 발현 강화 유전자좌의 사용에 기초하여 항체를 만들기 위한 조성물 및 방법
KR20230128314A (ko) 근육 표적화 복합체 및 안면견갑상완 근육 이영양증을치료하기 위한 그의 용도
CN104884467A (zh) 在遗传修饰的哺乳动物细胞中生产治疗性蛋白质
KR20210149734A (ko) Rna-가이드된 엔도뉴클레아제를 사용한 dna 작제물의 통합을 위한 개선된 방법
US20220220509A1 (en) Mammalian cell lines with sirt-1 gene knockout
US20230338477A1 (en) Anti-tfr:gaa and anti-cd63:gaa insertion for treatment of pompe disease
EP2427557B1 (en) Cho/cert cell lines
KR102115236B1 (ko) 췌장 또는 담관계암 치료를 위한 키메라 항원 수용체
TW202223092A (zh) 具有基因剔除的哺乳動物細胞株
JP6025745B2 (ja) ヒト遺伝子由来プロモーター
CN116670282A (zh) 靶向xbp1的寡核苷酸
CN116490608A (zh) 靶向cd70的抗原结合蛋白及其应用
JP7446342B2 (ja) 所定の構成の複数の発現カセットの標的化組込みによって三価の抗体を発現する細胞を生成するための方法
JP2010536345A (ja) 新規な方法および細胞系
WO2024068995A1 (en) Novel transposase system
EP4148067A1 (en) Method for the expression of an antibody-multimer-fusion
CN111936625A (zh) 调节哺乳动物细胞中的生乳活性
JP2022537202A (ja) 所定の構成の複数の発現カセットの標的指向性組込みによって多価二重特異性抗体発現細胞を作製するための方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40091308

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination