TW202305127A - 用於改良磷酸轉移酶之材料及方法 - Google Patents

用於改良磷酸轉移酶之材料及方法 Download PDF

Info

Publication number
TW202305127A
TW202305127A TW111114949A TW111114949A TW202305127A TW 202305127 A TW202305127 A TW 202305127A TW 111114949 A TW111114949 A TW 111114949A TW 111114949 A TW111114949 A TW 111114949A TW 202305127 A TW202305127 A TW 202305127A
Authority
TW
Taiwan
Prior art keywords
amino acid
seq
npt
cells
nucleic acid
Prior art date
Application number
TW111114949A
Other languages
English (en)
Inventor
威廉 勞埃德 三世 佩利
Original Assignee
美商健生生物科技公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商健生生物科技公司 filed Critical 美商健生生物科技公司
Publication of TW202305127A publication Critical patent/TW202305127A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/01Phosphotransferases with an alcohol group as acceptor (2.7.1)
    • C12Y207/01095Kanamycin kinase (2.7.1.95), i.e. neomycin-kanamycin phosphotransferase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本文中描述非天然存在的新黴素磷酸轉移酶(NPT)蛋白及編碼此類NPT蛋白之核酸序列。在一具體實施例中,非天然存在的NPT蛋白相對於野生型NPT具有降低之活性。本文中所提供之非天然存在的NPT蛋白可用作篩選轉形或轉染細胞之可選擇標記。本文中亦提供包含編碼非天然存在的NPT蛋白之核酸序列的載體及套組,及產生表現非天然存在的NPT蛋白及所關注之蛋白或所關注之非編碼RNA序列的細胞之方法。

Description

用於改良磷酸轉移酶之材料及方法
本文中提供非天然存在的新黴素磷酸轉移酶(neomycin phosphotransferase, NPT)蛋白及編碼此類NPT蛋白之核酸序列。在一具體實施例中,非天然存在的NPT蛋白相對於野生型NPT具有降低之活性。本文中所提供之非天然存在的NPT蛋白可用作篩選轉形或轉染細胞之可選擇標記。本文中亦提供包含編碼非天然存在的NPT蛋白之核酸序列的載體及套組,及產生表現非天然存在的NPT蛋白及所關注之蛋白或所關注之非編碼RNA序列的細胞之方法。
雖然在一些情況下生成攜帶穩定地整合至基因體中之外源性轉殖基因的哺乳動物細胞系已變得沒有那麼困難,但識別以高水準表現蛋白產物及/或具有高轉殖基因拷貝數的殖株系仍係有挑戰性的,因為例如低效率及耗時等。在轉殖基因整合部位處之序列可對轉殖基因表現具有重大影響(Lee et al., Trends Biotechnol., 37(9): 931-942 (2019)),其導致在不同植株中顯著不同的表現。DNA調控元件當置於轉殖基因與宿主DNA之間時可用以屏蔽轉殖基因免受染色體位置影響(綜述於Gupta et al., Biotechnol. Adv. 37(8): 107415 (2019))中。雖然此方法可增加表現及表現穩定性,但仍可能需要大量的篩選以識別高表現之殖株。對於發展病毒生產者細胞系而言,生成具有許多待包裝之病毒酬載拷貝之系可能比具有高轉殖基因表現之系更重要。一種選擇多重拷貝轉殖基因之方式將使細胞系發展更有效率。
問題之一者係用以生成穩定細胞系的許多建構體含有非常有效的選擇標記,即使當以極低水準表現時,該選擇標記亦賦予對轉形細胞之選擇性優勢。因此,無法直接選擇高標記基因表現或多重拷貝轉殖基因。已描述數種降低選擇標記表現或轉譯效率之方法。這些包括使用弱啟動子來驅動表現(Niwa et al., Gene 108(2): 193-199 (1991); Fan et al., J Biotechnol 168(4): 652-658 (2013); Zhou et al, BMC Biotechnol. 13: 29 (2013))、自交替密碼子起始轉譯(例如GTG或TTG而非ATG)(van Blokland et al., J Biotechnol 128(2): 237-245 (2007); Cairns et al,, Biotechnol Bioeng 108(11): 2611-2622 (2011))、及使用內部核糖體進入部位(internal ribosome entry site, IRES)起始轉譯(Gurtu et al., Biochem Biophys Res Commun 229(1): 295-298 (1996); Kwaks et al., Nat Biotechnol 21(5): 553-558 (2003); Ho et al., J Biotechnol 157(1): 130-139 (2012))。
減少選擇標記效率之另一種方法係使用具有降低之活性的突變蛋白。已使用麩醯胺酸合成酶(glutamine synthetase, GS)基因之突變來增加CHO細胞中之選擇嚴格性(Lin et al., MAbs 11(5): 965-976 (2019))。來自Tn5(胺基糖苷磷酸轉移酶3’-IIa)之新黴素磷酸轉移酶(NPT)係最常用之選擇標記中之一者。其藉由磷酸化這些抗生素而賦予細菌對新黴素及康黴素之抗性及賦予哺乳動物及植物細胞對G418之抗性(Shaw et al., Microbiol Rev 57(1): 138-163 (1993))。誘變研究(Blazquez et al., Mol.Microbiol. 5(6): 1511-1518 (1991); Kocabiyik et al., SAAS Bull Biochem Biotechnol 5: 58-63 (1992); Kocabiyik and Perlin, Biochem Biophys Res Commun 185(3): 925-931 (1992); Kocabivik and Perlin, Int J Biochem 26(1): 61-66 (1994))及自發突變之發現(Yenofsky et al.Proc Natl Acad Sci U S A 87(9): 3435-3439 (1990)),已識別出減少但不會消除賦予細菌抗生素抗性之能力的關鍵殘基。當突變體NPT基因經併入到用於在CHO細胞中選擇穩定產生抗體之細胞系的載體時,相對於使用野生型NPT基因,增加之選擇嚴格性導致更高的抗體表現及生產力(Sautter and Enenkel, Biotechnol Bioeng 89(5): 530-538 (2005); Ho et al., J Biotechnol 157(1): 130-139 (2012))。使用2載體系統,具有2至16%酶活性的NPT突變體相對於用野生型NPT基因選擇的池,特異性抗體生產力增加5至10倍(Sautter and Enenkel 2005)。當在單一三順反子載體(tricistronic vector)中使用具有3%活性的突變體NPT基因時,相對於使用野生型NPT基因,特異性生產力增加17倍(Ho et al. 2012)。然而,這些方法係有限制。
本發明認識並解決具有顯著降低之活性的NPT突變體之識別,該NPT突變體將使轉形細胞之選擇更嚴格,並從而減少識別及產生表現高水準的所關注之轉殖基因的細胞系所需的篩選。在一個態樣中,本文中提供具有新黴素磷酸轉移酶活性之非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含在野生型NPT中之一、二或更多個胺基取代(例如,表1或表2中所揭示之胺基酸取代中之一、二或更多者,或其組合)。在某些實施例中,本文中提供具有新黴素磷酸轉移酶活性之非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的胺基酸取代的野生型新黴素磷酸轉移酶之胺基酸序列:(a)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(b)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(c)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(d)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(e)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(f)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。
在一些實施例中,非天然存在的NPT包含具有下列的胺基酸取代的SEQ ID NO:1之胺基酸序列:(a)在SEQ ID NO:1之位置36及210處,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置210處的胺基酸取代係取代成丙胺酸;(b)在SEQ ID NO:1之位置36及182處,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置182處的胺基酸取代係取代成天冬胺酸;(c)在SEQ ID NO:1之位置36及218處,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的胺基酸取代係取代成苯丙胺酸;(d)在SEQ ID NO:1之位置216及261處的胺基酸取代,其中在SEQ ID NO:1之位置216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之位置261處的胺基酸取代係取代成天冬醯胺酸;(e)在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的胺基酸取代係取代成絲胺酸;或(f)在SEQ ID NO:1之位置36及216處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置216處的胺基酸取代係取代成甘胺酸。
在一些實施例中,相較於野生型NPT,非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。
在一些實施例中,野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。在一些實施例中,野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。
在一些實施例中,相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。
在一些實施例中,如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。在一些實施例中,細菌細胞係大腸桿菌。在一些實施例中,野生型NPT包含SEQ ID NO:1之胺基酸序列。
在一些實施例中,如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(geneticin) (G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成。在一些實施例中,哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。在一些實施例中,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在0.001%至75%之頻率範圍產生。在某些實施例中,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在5.5%至0.004%之頻率範圍產生。在一些實施例中,野生型NPT包含SEQ ID NO:1之胺基酸序列。在一些實施例中,哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。
在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸。
在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸。
在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸。
在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸。
在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸。
在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。
在一些實施例中,非天然存在的NPT包含SEQ ID NO:38之胺基酸序列。在一些實施例中,非天然存在的NPT包含SEQ ID NO:39之胺基酸序列。在一些實施例中,非天然存在的NPT包含SEQ ID NO:40之胺基酸序列。在一些實施例中,非天然存在的NPT包含SEQ ID NO:41之胺基酸序列。在一些實施例中,非天然存在的NPT包含SEQ ID NO:42之胺基酸序列。在一些實施例中,非天然存在的NPT包含SEQ ID NO:43之胺基酸序列。
在另一態樣中,本文中提供一種核酸,其包含編碼如本文中所述之非天然存在的NPT之第一核苷酸序列。在一些實施例中,第一核苷酸序列包含SEQ ID NO:20、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:36、或SEQ ID NO:37之核苷酸序列。
在一些實施例中,核酸序列進一步包含編碼第二蛋白或非編碼RNA之第二核苷酸序列。在一些實施例中,第二核苷酸序列編碼第二蛋白且其中第二蛋白係治療性蛋白。
在另一態樣中,本文中提供載體,其包含如本文中所述之核酸序列。
在另一態樣中,本文中提供體外或離體宿主細胞,其包含非天然存在的NPT。在一些實施例中,宿主細胞包含核酸,其包含編碼非天然存在的NPT之第一核苷酸序列。在一些實施例中,宿主細胞包含核酸,其包含SEQ ID NO:20、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:36、或SEQ ID NO:37之核苷酸序列。在一些實施例中,核酸序列係穩定地整合至宿主細胞之基因體中。在一些實施例中,宿主細胞包含載體。在某些實施例中,宿主細胞係細菌、酵母細胞、哺乳動物細胞、或植物細胞。在某些實施例中,宿主細胞係來自人類細胞系。
在另一態樣中,本文中提供表現非天然存在的NPT的體外或離體宿主細胞,其中該非天然存在的NPT相對於野生型新黴素磷酸轉移酶經減弱,且其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(a)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(b)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(c)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(d)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(e)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(f)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。
在一些實施例中,體外或離體宿主細胞表現相對於野生型新黴素磷酸轉移酶具有減弱之活性的非天然存在的NPT,且其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序:(a)在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的胺基酸取代係取代成丙胺酸;(b)在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的胺基酸取代係取代成天冬胺酸;(c)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成苯丙胺酸;(d)在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的胺基酸取代係取代成天冬醯胺酸;(e)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218的胺基酸取代係取代成絲胺酸;或(f)在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸。
在本文中所述之體外或離體宿主細胞之一些實施例中,野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。在一些實施例中,野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。在一些實施例中,相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。
在本文中所述之體外或離體宿主細胞之一些實施例中,如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。在一些實施例中,野生型NPT包含SEQ ID NO:1之胺基酸序列。在一些實施例中,細菌細胞係大腸桿菌。
在本文中所述之體外或離體宿主細胞之一些實施例中,如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成。在一些實施例中,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在0.001%至75%之頻率範圍產生。在某些實施例中,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在5.5%至0.004%之頻率範圍產生。在一些實施例中,野生型NPT包含SEQ ID NO:1之胺基酸序列。在一些實施例中,哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。
在本文中所述之體外或離體宿主細胞之一些實施例中,表現之非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。在一些實施例中,非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。在本文中所述之體外或離體宿主細胞之一些實施例中,表現之非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。在本文中所述之體外或離體宿主細胞之一些實施例中,表現之非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。在本文中所述之體外或離體宿主細胞之一些實施例中,表現之非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。在本文中所述之體外或離體宿主細胞之一些實施例中,表現之非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。
在一些實施例中,體外或離體宿主細胞進一步包含編碼第二蛋白或非編碼RNA之第二核酸序列。在一些實施例中,第二核酸序列編碼第二蛋白且其中第二蛋白係治療性蛋白。在一些實施例中,第二核酸序列編碼非編碼RNA,且其中該非編碼RNA係shRNA、miRNA、反義RNA、用於Crispr核酸酶之引導RNA、催化RNA、核糖體RNA、或tRNA。在某些實施例中,宿主細胞係細菌、酵母細胞、哺乳動物細胞、或植物細胞。
在另一態樣中,本文中提供用於自其中引入轉殖基因的宿主細胞群中選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法,該方法包含:a)將包含核酸序列之宿主細胞群引入,該核酸序列包含:(i)第一核苷酸序列,其編碼本文中所述具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT);及(ii)第二核苷酸序列,其包含轉殖基因;及b)自其中引入核酸序列的宿主細胞群中選擇在新黴素磷酸轉移酶受質存在下生長的細胞。
在一個實施例中,本文中提供用於自其中引入轉殖基因的宿主細胞群中選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法,該方法包含:a)將核酸序列引入至宿主細胞群中,該核酸序列包含:(i)第一核苷酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT);及(ii)第二核苷酸序列,其包含轉殖基因,其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;及b)自其中引入核酸序列的宿主細胞群中選擇在新黴素磷酸轉移酶受質存在下生長的細胞。
在某些實施例中,用於自其中引入轉殖基因的宿主細胞群中選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法,該方法包含:a)將第一核酸序列引入至宿主細胞群中,該第一核酸序列包含:(i)第一核苷酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT);及(ii)第二核苷酸序列,其包含轉殖基因,其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列:(1)在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的胺基酸取代係取代成丙胺酸;(2)在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的胺基酸取代係取代成天冬胺酸;(3)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成苯丙胺酸;(4)在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的胺基酸取代係取代成天冬醯胺酸;(5)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218的胺基酸取代係取代成絲胺酸;或(6)在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸;及b)自其中引入核酸序列的宿主細胞群中選擇在新黴素磷酸轉移酶受質存在下生長的細胞。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,相較於野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,轉殖基因之高拷貝數係比當使用編碼野生型NPT之核苷酸序列替代非天然存在的NPT或突變體NPT所達到的拷貝數高5至10倍、5至15倍、2至5倍、2至10倍、2至15倍、或10至20倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或2至1000倍。在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,高的轉殖基因之表現水準係比當使用編碼野生型NPT之核苷酸序列替代非天然存在的NPT或突變體NPT所達到的表現水準高5至25倍、10至25倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或5至1000倍。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,野生型NPT包括與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,野生型NPT包括與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。在一些實施例中,細菌細胞係大腸桿菌。在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成。在某些實施例中,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在0.001%至75%之頻率範圍產生。在一些實施例中,哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。在某些實施例中,如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼包含SEQ ID NO:1之胺基酸序列的野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。在一些實施例中,細菌細胞係大腸桿菌。在某些實施例中,如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。在某些實施例中,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在5.5%至0.004%之頻率範圍產生,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。在一些實施例中,哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。
在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸。在某些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸。在某些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸。在某些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。
在某些實施例中,非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。在一些實施例中,非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。在某些實施例中,非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。在一些實施例中,非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。在某些實施例中,非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。在一些實施例中,非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,宿主細胞係細菌、酵母、哺乳動物、或植物細胞。在一些實施例中,宿主細胞係人類細胞。在某些實施例中,宿主細胞係來自哺乳動物細胞系(例如,人類細胞系)。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,核酸序列係穩定地整合至所選之細胞之基因體中。在一些實施例中,所選之細胞已將5至100個拷貝的轉殖基因整合至其基因體DNA中。在某些實施例中,所選之細胞已將1至5個拷貝的轉殖基因整合至其基因體DNA中。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,所選之細胞具有高的轉殖基因之拷貝數。在一些實施例中,轉殖基因之高拷貝數係比當使用編碼野生型NPT之核苷酸序列替代NPT突變體或非天然存在的NPT所達到之拷貝數高5至10倍、5至15倍、2至5倍、2至10倍、2至15倍、或10至20倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或2至1000倍。在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,所選之細胞具有高的轉殖基因之表現水準。在一些實施例中,高的轉殖基因之表現水準係比當使用編碼野生型NPT之核苷酸序列替代非天然存在的NPT或突變體NPT所達到的表現水準高5至25倍、10至25倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或5至1000倍。在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,所選之細胞具有高的轉殖基因之拷貝數及高的轉殖基因之表現水準。在一些實施例中,轉殖基因之高拷貝數係比當使用編碼野生型NPT之核苷酸序列替代NPT突變體或非天然存在的NPT所達到之拷貝數高5至10倍、5至15倍、2至5倍、2至10倍、2至15倍、或10至20倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或2至1000倍。在一些實施例中,高的轉殖基因之表現水準係比當使用編碼野生型NPT之核苷酸序列替代非天然存在的NPT或突變體NPT所達到的表現水準高5至25倍、10至25倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或5至1000倍。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,轉殖基因包含病毒基因。在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,轉殖基因包含人類生長因子基因。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,新黴素磷酸轉移酶受質係新黴素、康黴素、或G418。
在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之轉殖基因之拷貝數,所選之細胞包含10至1000倍更高的轉殖基因之拷貝數,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之轉殖基因之拷貝數,所選之細胞包含100至1000倍更高的轉殖基因之拷貝數,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之轉殖基因之拷貝數,所選之細胞包含500至1000倍更高的轉殖基因之拷貝數,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之轉殖基因之拷貝數,所選之細胞包含750至1000倍更高的轉殖基因之拷貝數,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之轉殖基因之拷貝數,所選之細胞包含100至500倍更高的轉殖基因之拷貝數,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之轉殖基因之拷貝數,所選之細胞包含10至100倍更高的轉殖基因之拷貝數,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之轉殖基因之拷貝數,所選之細胞包含10至50倍更高的轉殖基因之拷貝數,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之轉殖基因之拷貝數,所選之細胞包含10至25倍更高的轉殖基因之拷貝數,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之轉殖基因之拷貝數,所選之細胞包含2至10倍更高的轉殖基因之拷貝數,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。
在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組的轉殖基因之表現水準,所選之細胞達到10至1000倍更高的轉殖基因之表現水準,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組的轉殖基因之表現水準,所選之細胞達到100至1000倍更高的轉殖基因之表現水準,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組的轉殖基因之表現水準,所選之細胞達到500至1000倍更高的轉殖基因之表現水準,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組的轉殖基因之表現水準,所選之細胞達到750至1000倍更高的轉殖基因之表現水準,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組的轉殖基因之表現水準,所選之細胞達到10至100倍更高的轉殖基因之表現水準,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組的轉殖基因之表現水準,所選之細胞達到10至50倍更高的轉殖基因之表現水準,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,相較於藉由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組的轉殖基因之表現水準,所選之細胞達到5至25倍更高的轉殖基因之表現水準,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,藉由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組,所選之細胞達到5至10倍更高的轉殖基因之表現水準,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之一些實施例中,藉由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組,所選之細胞達到2至10倍更高的轉殖基因之表現水準,其中第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及轉殖基因的核酸序列轉染或轉形。在具體實施例中,宿主細胞群相同且所使用之條件相同。
在用於選擇具有高的轉殖基因之拷貝數及/或高的轉殖基因之表現水準的細胞之方法之某些實施例中,轉殖基因編碼蛋白或非編碼RNA。在一些實施例中,非編碼RNA係選自由下列所組成之群組:反義RNA、miRNA、shRNA、長非編碼RNA、催化RNA、核糖體RNA、tRNA、或用於CRISPR核酸酶之引導RNA。在某些實施例中,蛋白係治療性蛋白或抗原。治療性蛋白或抗原可為本文中所述者或所屬技術領域中具有通常知識者已知者。在某些實施例中,蛋白係病毒蛋白。病毒蛋白可為本文中所述者或所屬技術領域中具有通常知識者已知者。
在一些實施例中,使用本文中所述之非天然存在的NPT將篩選用轉殖基因轉染或轉形的細胞的需求降低7,500至10,000倍。在一些實施例中,使用本文中所述之非天然存在的NPT將篩選用轉殖基因轉染或轉形的細胞的需求降低5,000至10,000倍。在一些實施例中,使用本文中所述之非天然存在的NPT將篩選用轉殖基因轉染或轉形的細胞的需求降低2,500至10,000倍。在一些實施例中,使用本文中所述之非天然存在的NPT將篩選用轉殖基因轉染或轉形的細胞的需求降低1,000至10,000倍。在一些實施例中,使用本文中所述之非天然存在的NPT將篩選用轉殖基因轉染或轉形的細胞的需求降低5,000至7,500倍。在一些實施例中,使用本文中所述之非天然存在的NPT將篩選用轉殖基因轉染或轉形的細胞的需求降低1,000至5,000倍。在一些實施例中,使用本文中所述之非天然存在的NPT將篩選用轉殖基因轉染或轉形的細胞的需求降低500至1,000倍。
在另一態樣中,本文中提供使用質體或轉位子之方法,該質體或轉位子包含編碼相較於野生型NPT具有減弱之新黴素磷酸轉移酶活性的本文中所述之非天然存在的NPT之核酸序列作為可選擇標記,該方法包含:a)將包含該核酸序列之質體或轉位子引入至宿主細胞中;及(b)在新黴素磷酸轉移酶受質存在下生長細胞。在一些實施例中,該方法進一步包含選擇在新黴素磷酸轉移酶受質存在下生長的宿主細胞。
在一個實施例中,本文中提供使用質體或轉位子之方法,該質體或轉位子包含編碼相較於野生型NPT具有減弱之新黴素磷酸轉移酶活性的非天然存在的NPT之核酸序列作為可選擇標記,該方法包含:a)將包含編碼非天然存在的NPT之核酸序列的質體或轉位子引入至宿主細胞中,其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;及b)在新黴素磷酸轉移酶受質存在下生長細胞。在一些實施例中,該方法進一步包含選擇在新黴素磷酸轉移酶受質存在下生長的宿主細胞。
在一些實施例中,本文中提供使用質體或轉位子之方法,該質體或轉位子包含編碼相較於野生型NPT具有減弱之新黴素磷酸轉移酶活性的非天然存在的NPT之核酸序列作為可選擇標記,該方法包含:a)將包含編碼非天然存在的NPT之核酸序列的質體或轉位子引入至宿主細胞中,其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列:(1)在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的胺基酸取代係取代成丙胺酸;(2)在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的胺基酸取代係取代成天冬胺酸;(3)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成苯丙胺酸;(4)在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的胺基酸取代係取代成天冬醯胺酸;(5)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成絲胺酸;或(6)在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸;及b)在新黴素磷酸轉移酶受質存在下生長細胞。在一些實施例中,該方法進一步包含選擇在新黴素磷酸轉移酶受質存在下生長的宿主細胞。
在使用質體或轉位子之方法之一些實施例中,野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。在使用質體或轉位子之方法之某些實施例中,野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。
在使用質體或轉位子之方法之某些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸。在使用質體或轉位子之方法之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸。在使用質體或轉位子之方法之某些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸。在使用質體或轉位子之方法之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸。在使用質體或轉位子之方法之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸。在使用質體或轉位子之方法之某些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。
在使用質體或轉位子之方法之某些實施例中,非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。在使用質體或轉位子之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。在使用質體或轉位子之方法之某些實施例中,非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。在使用質體或轉位子之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。在使用質體或轉位子之方法之某些實施例中,非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。在使用質體或轉位子之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。
在使用質體或轉位子之方法之某些實施例中,宿主細胞係細菌、酵母、哺乳動物、或植物細胞。在一些實施例中,宿主細胞係人類細胞。
在使用質體或轉位子之方法之某些實施例中,其中質體或轉位子進一步包含編碼蛋白或非編碼RNA之第二核苷酸序列。在一些實施例中,蛋白係病毒蛋白。在某些實施例中,蛋白係治療性蛋白。
在使用質體或轉位子之方法之某些實施例中,新黴素磷酸轉移酶受質係新黴素、康黴素、或G418。
在另一態樣中,本文中提供製作宿主細胞之方法,其包含a)將第一核酸序列引入至宿主細胞群中,該第一核酸序列包含(i)第一核苷酸序列,其編碼本文中所述之非天然存在的NPT、及(ii)第二核苷酸序列,其包含編碼第二蛋白或非編碼RNA之轉殖基因;b)在新黴素磷酸轉移酶受質存在下使宿主細胞群生長以產生群落;及c)選擇在新黴素磷酸轉移酶受質存在下生長的細胞群落。在一些實施例中,該方法進一步包含培養所選之細胞群落。
在一個實施例中,本文中提供製作包含第二核苷酸序列之宿主細胞之方法,其包含:a)用第一核酸序列引入宿主細胞群,該第一核酸序列包含(i)第一核苷酸序列,其編碼非天然存在的NPT、及(ii)第二核苷酸序列,其包含編碼第二蛋白或非編碼RNA之轉殖基因,其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;b)在新黴素磷酸轉移酶受質存在下使宿主細胞群生長以產生群落;及(c)選擇在新黴素磷酸轉移酶受質存在下生長的細胞群落。
在另一態樣中,本文中提供製作包含第二核苷酸序列之宿主細胞之方法,其包含a)將(i)第一核酸序列及(ii)第二核酸序列共引入(co-introducing)至宿主細胞群中,該第一核酸序列包含編碼本文中所述之非天然存在的NPT之第一核苷酸序列,該二核酸序列包含編碼第二蛋白或非編碼RNA之轉殖基因;b)在新黴素磷酸轉移酶受質存在下使宿主細胞群生長以產生群落;及c)選擇在新黴素磷酸轉移酶受質存在下生長的細胞群落。在一些實施例中,該方法進一步包含培養所選之細胞群落。
在一些實施例中,本文中提供製作包含第二核苷酸序列之宿主細胞之方法,其包含:a)將(i)第一核酸序列及(ii)第二核酸序列共引入至宿主細胞群中,該第一核酸序列包含編碼本文中所述之非天然存在的NPT之第一核苷酸序列,該第二核酸序列包含編碼第二蛋白或非編碼RNA之轉殖基因,其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;b)在新黴素磷酸轉移酶受質存在下使宿主細胞群生長以產生群落;及c)選擇在新黴素磷酸轉移酶受質存在下生長的細胞群落。
在一些實施例中,本文中提供製作包含第二核苷酸序列之宿主細胞之方法,其包含:a)將(i)第一核酸序列及(ii)第二核酸序列共引入至宿主細胞群中,該第一核酸序列包含編碼非天然存在的NPT之第一核苷酸序列,該第二核酸序列包含編碼第二蛋白或非編碼RNA之轉殖基因,其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列:(1)在SEQ ID NO:1之位置36及210處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置210處的胺基酸取代係取代成丙胺酸;(2)在SEQ ID NO:1之位置36及182處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置182處的胺基酸取代係取代成天冬胺酸;(3)在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的胺基酸取代係取代成苯丙胺酸;(4)在SEQ ID NO:1之位置216及261處的胺基酸取代,其中在SEQ ID NO:1之位置216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之位置261處的胺基酸取代係取代成天冬醯胺酸;(5)在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的胺基酸取代係取代成絲胺酸;或(6)在SEQ ID NO:1之位置36及216處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置216處的胺基酸取代係取代成甘胺酸;b)在新黴素磷酸轉移酶受質存在下使宿主細胞群生長以產生群落;及c)選擇在新黴素磷酸轉移酶受質存在下生長的細胞群落。
在另一態樣中,本文中提供製作包含第二核苷酸序列之宿主細胞之方法,其包含:a)在新黴素磷酸轉移酶受質存在下使宿主細胞群生長以產生群落,其中該宿主細胞群包含第一核酸序列,其包含(i)第一核苷酸序列,其編碼本文中所述之非天然存在的NPT、及(ii)第二核酸序列NPT其包含編碼第二蛋白或非編碼RNA之轉殖基因;及b)選擇在新黴素磷酸轉移酶受質存在下生長的細胞群落。在一些實施例中,該方法進一步包含培養所選之細胞群落。
在一個實施例中,本文中提供製作包含第二核苷酸序列之宿主細胞之方法,其包含:a)在用於新黴素磷酸轉移酶之受質存在下使宿主細胞群生長以產生群落,其中該宿主細胞群包含第一核酸序列,其包含(i)編碼非天然存在的NPT之第一核苷酸序列、及(ii)包含編碼第二蛋白或非編碼RNA之轉殖基因之第二核酸序列,其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;及b)選擇在新黴素磷酸轉移酶受質存在下生長的細胞群落。在一些實施例中,該方法進一步包含培養所選之細胞群落。
在一些實施例中,製作包含第二核苷酸序列之宿主細胞之方法包含:a)在用於新黴素磷酸轉移酶之受質存在下使宿主細胞群生長以產生群落,其中該宿主細胞群包含(i)第一核酸序列,其包含編碼非天然存在的NPT之第一核苷酸序列、及(ii)第二核酸序列,其包含編碼第二蛋白或非編碼RNA之轉殖基因;其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列:(1)在SEQ ID NO:1之位置36及210處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置210處的胺基酸取代係取代成丙胺酸;(2)在SEQ ID NO:1之位置36及182處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置182處的胺基酸取代係取代成天冬胺酸;(3)在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的胺基酸取代係取代成苯丙胺酸;(4)在SEQ ID NO:1之位置216及261處的胺基酸取代,其中在SEQ ID NO:1之位置216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之位置261處的胺基酸取代係取代成天冬醯胺酸;(5)在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的胺基酸取代係取代成絲胺酸;或(6)在SEQ ID NO:1之位置36及216處的胺基酸取代,其中在SEQ ID NO:1之位置36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置216處的胺基酸取代係取代成甘胺酸;及b)選擇在新黴素磷酸轉移酶受質存在下生長的細胞群落。在一些實施例中,該方法進一步包含培養所選之細胞群落。
在另一態樣中,本文中提供宿主細胞,其包含藉由本文中所述之方法所產生之第二核苷酸序列。
在另一態樣中,本文中提供用於製造表現治療性蛋白或酶的穩定細胞系之方法,其包含:a)將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼本文中所述具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT);b)自步驟(a)之細胞群中選擇在G418存在下生長的細胞;及c)培養所選之細胞以產生表現治療性蛋白或酶的穩定細胞系。
在一個實施例中,本文中提供用於製造表現治療性蛋白或酶的穩定細胞系之方法,其包含:a)將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼治療性蛋白或酶;b)自步驟(a)之細胞群中選擇在G418存在下生長的細胞;及c)培養所選之細胞以產生表現治療性蛋白或酶的穩定細胞系。
在一些實施但中,本文中提供用於製造表現治療性蛋白或酶的穩定細胞系之方法,其包含:a)將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列:(1)在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的胺基酸取代係取代成丙胺酸;(2)在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的胺基酸取代係取代成天冬胺酸;(3)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成苯丙胺酸;(4)在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的胺基酸取代係取代成天冬醯胺酸;(5)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成絲胺酸;或(6)在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼治療性蛋白或酶;b)自步驟(a)之細胞群中選擇在G418存在下生長的細胞;及c)培養所選之細胞以產生表現治療性蛋白或酶的穩定細胞系。
在本文中所提供之方法之一些實施例中,穩定細胞系係哺乳動物細胞系。在本文中所提供之方法之一些實施例中,穩定細胞系係人類細胞系。在一些實施例中,穩定細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。在本文中所提供之方法之一些實施例中,穩定細胞表現治療性蛋白。在本文中所提供之方法之一些實施例中,治療性蛋白係或抗體片段。在一些實施例中,穩定細胞系表現酶。
在另一態樣中,本文中提供穩定細胞系,其藉由本文中所述之方法產生。在一些實施例中,細胞系之穩定性可藉由定量方法(諸如例如qPCR或雜交)藉由測量轉殖基因之拷貝數來判定。
在本文中所提供之方法之一些實施例中,相較於野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
在本文中所提供之方法之一些實施例中,野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。在所提供之方法之一些實施例中,野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。
在本文中所提供之方法之一些實施例中,相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
在本文中所提供之方法之一些實施例中,如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。在一些實施例中,細菌細胞係大腸桿菌。
在本文中所提供之方法之一些實施例中,如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成。在一些實施例中,哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。
在本文中所提供之方法之一些實施例中,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在0.001%至75%之頻率範圍產生。在一些實施例中,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在5.5%至0.004%之頻率範圍產生。在一些實施例中,哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。
在本文中所提供之方法之一些實施例中,如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼包含野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。
在本文中所提供之方法之一些實施例中,如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。在一些實施例中,用包含編碼非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在5.5%至0.004%之頻率範圍產生,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。在一些實施例中,哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。
在本文中所提供之方法之一些實施例中,其中宿主細胞群經轉染或轉形,該等宿主細胞宿主細胞群產生比用第二核酸序列轉染或轉形並在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群更少的群落,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。
宿主細胞可係例如哺乳動物細胞。在一些實施例中,哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。在一些實施例中,細胞係人類細胞。
在本文中所提供之方法之一些實施例中,新黴素磷酸轉移酶受質係新黴素、康黴素,或G418。
在本文中所提供之方法之一些實施例中,蛋白係治療性蛋白或抗原。
在本文中所提供之方法之一些實施例中,非編碼RNA係shRNA、miRNA、反義RNA、用於Crispr核酸酶之引導RNA、催化RNA、核糖體RNA、或tRNA。
在另一態樣中,本文中提供製作病毒生產者細胞系之方法,其包含:a)將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼本文中所述具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT);b)自在新黴素磷酸轉移酶受質存在下生長的細胞群中選擇細胞;及c)繁殖該所選之細胞以產生病毒生產者細胞系。病毒生產者細胞系可用以產生用於例如基因療法或癌症療法之病毒。
在一個實施例中,本文中提供製作病毒生產者細胞系之方法,其包含:a)將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼一或多種病毒蛋白;b)自在新黴素磷酸轉移酶受質存在下生長的細胞群中選擇細胞;及c)繁殖該所選之細胞以產生病毒生產者細胞系。在一些實施例中,一或多種病毒蛋白包括殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合。
在一些實施例中,製作病毒生產者細胞系之方法包含:a)將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列:(1)在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的胺基酸取代係取代成丙胺酸;(2)在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的胺基酸取代係取代成天冬胺酸;(3)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成苯丙胺酸;(4)在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的胺基酸取代係取代成天冬醯胺酸;(5)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成絲胺酸;或(6)在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼一或多種病毒蛋白;b)自在新黴素磷酸轉移酶受質存在下生長的細胞群中選擇細胞;及c)繁殖該所選之細胞以產生病毒生產者細胞系。在一些實施例中,一或多種病毒蛋白包括殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合。
在本文中所提供之方法之一些實施例中,相較於野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
在本文中所提供之方法之一些實施例中,野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。在所提供之方法之一些實施例中,野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。
在本文中所提供之方法之一些實施例中,相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。
在本文中所提供之方法之一些實施例中,細胞系係哺乳動物細胞系。在本文中所提供之方法之一些實施例中,細胞系係人類細胞系。在本文中所提供之方法之一些實施例中,細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。
在本文中所提供之方法之一些實施例中,一或多種病毒蛋白包括AAV殼體蛋白。
在本文中所提供之方法之一些實施例中,一或多種病毒蛋白包括AAV殼體蛋白及AAV rep蛋白。
在本文中所提供之方法之一些實施例中,一或多種病毒蛋白包括套膜蛋白。
在本文中所提供之方法之一些實施例中,一或多種病毒蛋白包括腺病毒複製所需之腺病毒E1區蛋白。
在本文中所提供之方法之一些實施例中,一或多種病毒蛋白包括反轉錄病毒套膜蛋白。
在本文中所提供之方法之一些實施例中,一或多種病毒蛋白包括反轉錄病毒gag蛋白。
在本文中所提供之方法之一些實施例中,一或多種病毒蛋白包括反轉錄病毒反轉錄酶。
在本文中所提供之方法之一些實施例中,一或多種病毒蛋白包括反轉錄病毒套膜蛋白、gag蛋白、及反轉錄酶。
在另一態樣中,本文中提供病毒生產者細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼本文中所述具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),及(ii)第二核酸序列,其編碼一或多種病毒蛋白。在一些實施例中,一或多種病毒蛋白包括殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合。
在一個實施例中,本文中提供病毒生產者細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼一或多種病毒蛋白。在一些實施例中,一或多種病毒蛋白包括殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合。
在一些實施例中,本文中提供病毒生產者細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列:(1)在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的胺基酸取代係取代成丙胺酸;(2)在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的胺基酸取代係取代成天冬胺酸;(3)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成苯丙胺酸;(4)在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的胺基酸取代係取代成天冬醯胺酸;(5)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成絲胺酸;或(6)在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼一或多種病毒蛋白。在一些實施例中,一或多種病毒蛋白包括殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合。
在病毒生產者細胞系之一些實施例中,相較於野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
在病毒生產者細胞系之一些實施例中,野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。在病毒生產者細胞系之一些實施例中,野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。在病毒生產者細胞系之一些實施例中,相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸。在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸。在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸。在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸。在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸。在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。
在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。在病毒生產者細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。
在病毒生產者細胞系之一些實施例中,該細胞系係哺乳動物細胞系。在病毒生產者細胞系之一些實施例中,該細胞系係人類細胞系。在病毒生產者細胞系之一些實施例中,該細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。
在病毒生產者細胞系之一些實施例中,一或多種病毒蛋白包括AAV殼體蛋白。在病毒生產者細胞系之一些實施例中,一或多種病毒蛋白包括AAV殼體蛋白及AAV rep蛋白。在病毒生產者細胞系之一些實施例中,一或多種病毒蛋白包括套膜蛋白。在病毒生產者細胞系之一些實施例中,一或多種病毒蛋白包括腺病毒複製所需之腺病毒E1區蛋白。在病毒生產者細胞系之一些實施例中,一或多種病毒蛋白包括反轉錄病毒套膜蛋白。在病毒生產者細胞系之一些實施例中,一或多種病毒蛋白包括反轉錄病毒gag蛋白。在病毒生產者細胞系之一些實施例中,一或多種病毒蛋白包括反轉錄病毒反轉錄酶。在病毒生物細胞系之一些實施例中,一或多種病毒蛋白包含反轉錄病毒套膜蛋白、gag蛋白、及反轉錄酶。
在一個態樣中,本文中提供用於製造表現抗原的哺乳動物細胞系之方法,其包含:a)將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼本文中所述具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),及(ii)第二核酸序列,其編碼抗原;b)自步驟(a)之細胞群中選擇在G418存在下生長的細胞;及c)培養該所選之細胞以產生表現抗原的細胞系。在一些實施例中,抗原係用以免疫哺乳動物對象(例如,人類)或誘導哺乳動物對象(例如,人類)中之免疫反應。亦可體外或離體使用抗原。
在一個實施例中,本文中提供用於製造表現抗原的哺乳動物細胞系之方法,其包含:a)將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的新黴素NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼抗原;b)自步驟(a)之細胞群中選擇在G418存在下生長的細胞;及c)培養該所選之細胞以產生表現抗原的細胞系。
在一些實施例中,本文中提供用於製造表現抗原的哺乳動物細胞系之方法,其包含:a)將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中非天然存在的新黴素NPT包含具有下列的SEQ ID NO:1之胺基酸序列:(1)在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的胺基酸取代係取代成丙胺酸;(2)在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的胺基酸取代係取代成天冬胺酸;(3)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成苯丙胺酸;(4)在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的胺基酸取代係取代成天冬醯胺酸;(5)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成絲胺酸;或(6)在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼抗原;b)自步驟(a)之細胞群中選擇在G418存在下生長的細胞;及c)培養該所選之細胞以產生表現抗原的細胞系。
在本文中所提供之方法之一些實施例中,相較於野生型NPT,非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。
在本文中所提供之方法之一些實施例中,野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。在本文中所提供之方法之一些實施例中,野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。
在本文中所提供之方法之一些實施例中,相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸。在一些實施例中,非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。
在本文中所提供之方法之一些實施例中,非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。
在用於製造哺乳動物細胞系之方法之一些實施例中,該細胞系係哺乳動物細胞系。在用於製造哺乳動物細胞系之方法之一些實施例中,該細胞系係人類細胞系。在用於製造哺乳動物細胞系之方法之一些實施例中,該細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。
在用於製造哺乳動物細胞系之方法之一些實施例中,抗原係病毒抗原、細菌抗原、或真菌抗原。在用於製造哺乳動物細胞系之方法之一些實施例中,抗原係癌症抗原。
在另一態樣中,本文中提供包含一或多種核酸序列之抗原產生細胞系,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼本文中所述具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT);及(ii)第二核酸序列,其編碼一或多種抗原。
在另一態樣中,本文中提供抗原產生細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼一或多種抗原。
在一些實施例中,本文中提供抗原產生細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列:(1)在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的胺基酸取代係取代成丙胺酸;(2)在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的胺基酸取代係取代成天冬胺酸;(3)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成苯丙胺酸;(4)在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的胺基酸取代係取代成天冬醯胺酸;(5)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的胺基酸取代係取代成絲胺酸;或(6)在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼一或多種抗原。
在本文中所提供之抗原產生細胞系之一些實施例中,相較於野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
在本文中所提供之抗原產生細胞系之一些實施例中,野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。
在本文中所提供之抗原產生細胞系之一些實施例中,野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少65%同一的胺基酸序列。
在本文中所提供之抗原產生細胞系之一些實施例中,相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
在一些實施例中,NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸。在一些實施例中,NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸。在一些實施例中,NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸。在一些實施例中,NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸。在一些實施例中,NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸。在一些實施例中,NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。
在本文中所提供之抗原產生細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。在一些實施例中,非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。在本文中所提供之抗原產生細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。在本文中所提供之抗原產生細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。在本文中所提供之抗原產生細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。在本文中所提供之抗原產生細胞系之一些實施例中,非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。
在本文中所提供之抗原產生細胞系之一些實施例中,該細胞系係哺乳動物細胞系。在本文中所提供之抗原產生細胞系之一些實施例中,該細胞系係人類細胞系。在本文中所提供之抗原產生細胞系之一些實施例中,該細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。
在本文中所提供之抗原產生細胞系之一些實施例中,該一或多種抗原係病毒抗原、細菌抗原、或真菌抗原。在本文中所提供之抗原產生細胞系之一些實施例中,該一或多種抗原係癌症抗原。
在另一態樣中,本文中提供用於當引入至細菌細胞中時賦予對康黴素之抗性、及當引入至哺乳動物細胞中時賦予對G418之抗性的可選擇標記構件。在一些實施例中,可選擇標記構件包含SEQ ID NO:20之核酸序列。在一些實施例中,可選擇標記構件包含SEQ ID NO:32之核酸序列;在一些實施例中,可選擇標記構件包含SEQ ID NO:33之核酸序列;在一些實施例中,可選擇標記構件包含SEQ ID NO:34之核酸序列。在一些實施例中,可選擇標記構件包含SEQ ID NO:36之核酸序列;在一些實施例中,可選擇標記構件包含SEQ ID NO:37之核酸序列;
在另一態樣中,本文中提供用於製造生產者細胞系之方法,其包含:a)將細菌或哺乳動物細胞用表現載體轉形以製作轉形細胞,該表現載體包含編碼一或多種病毒蛋白之核酸序列及若經轉形之該細胞係細菌細胞則用於在康黴素存在下生長的構件及若經轉形之該細胞係哺乳動物細胞則用於在G418存在下生長的構件;b)在康黴素或G418存在下培養經轉形之該細胞以獲得生產者細胞系,其中該生產者細胞系表現一或多種來自AAV、腺病毒、反轉錄病毒、慢病毒、單純疱疹病毒、痘瘡病毒、或桿狀病毒的病毒蛋白。
在另一態樣中,本文中提供用於選擇具有外源性核酸序列之穩定染色體整合的細胞之方法,其包含:a)將真核細胞群用包含用於在G418存在下生長的構件之外源性核酸序列轉形;b)在G418存在下培養轉形細胞群,以產生能夠在G418存在下生長的轉形細胞群落;及c)自步驟(b)中所產生之群落中選擇細胞以獲得具有該外源性核酸之穩定染色體整合的細胞。
在一些實施例中,外源性核酸序列進一步包含轉殖基因,且所選之細胞表現該轉殖基因。
在一些實施例中,外源性核酸序列破壞對所選之細胞為內源性的基因之表現。
在另一態樣中,本文中提供用於選擇具有穩定的游離基因體的哺乳動物細胞之方法,其包含:a)將哺乳動物細胞群用包含用於在G418存在下生長的構件之質體轉形;b)在G418存在下培養轉形細胞群,以產生能夠在G418存在下生長的轉形細胞群落;及c)自步驟(b)中所產生之群落中選擇細胞以獲得具有包含該質體之穩定游離基因體的細胞。
在一些實施例中,質體進一步包含EBNA1 OriP核酸序列且所選之細胞表現EBNA1。
在一個態樣中,本文中提供用於選擇暫時表現轉殖基因的哺乳動物細胞之方法,其包含:a)將編碼轉殖基因之核酸及用於在G418存在下生長的構件引入至哺乳動物細胞群中;b)在G418存在下培養哺乳動物細胞群48至72小時;及c)自在G418存在下生長的所培養之哺乳動物細胞群中選擇哺乳動物細胞,其中所選之哺乳動物細胞暫時表現轉殖基因。
在一些實施例中,轉殖基因包含編碼Crispr核酸內切酶或Crispr引導RNA之核酸序列。
在一些實施例中,構件係編碼包含選自SEQ ID NO:38、39、40、41、42、或43之群組的胺基酸序列之非天然存在的新黴素磷酸轉移酶之核苷酸序列。
本揭露部分基於對具有特定胺基酸取代的NPT相較於野生型NPT具有顯著降低之磷酸轉移酶活性之驚人發現。使用如本文中所描述之編碼NPT之核酸序列提供作為用於選擇及產生轉形細胞系之可選擇製造者的實質優點,該轉形細胞系除了所關注之基因之外,還表現突變之NPT,其使轉形細胞比非轉形細胞更具有選擇性優勢。
本文及附加之申請專利範圍中所使用之單數形式「一(a/an)」及「該(the)」皆包括複數指稱,除非上下文另有明確說明。
在二或更多個核酸或多肽序列之上下文中,用語「同一(identical)」或「同一性(identity)」百分比係指當進行比較及比對以達最大對應性時,如使用下列序列比較演算法之一者或藉由目視檢查測量,二或更多個序列或子序列係相同的、或具有指定百分比的相同胺基酸殘基或核苷酸。
為進行序列比較,一般將一個序列當作參考序列,並使測試序列與其比較。當使用序列比較演算法時,將測試及參考序列輸入電腦中,指定子序列座標(若有需要),並指定序列演算法程式參數。序列比較演算法接著基於指定程式參數,計算(多個)測試序列相對於參考序列之序列同一性百分比。
序列比較之最佳比對可例如藉由以下進行:局部同源性演算法(Smith & Waterman, Adv. Appl. Math. 2:482 (1981))、藉由同源性比對演算法(Needleman & Wunsch, J. Mol. Biol. 48:443 (1970))、藉由搜尋相似性方法(Pearson & Lipman, Proc. Nat’l. Acad. Sci. USA 85:2444 (1988))、藉由這些演算法的電腦化實施(Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI中之GAP、BESTFIT、FASTA、及TFASTA)、或藉由目視檢查(大致參見Current Protocols in Molecular Biology, F.M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (1995 Supplement) (Ausubel))進行。
適合用於判定序列同一性及序列相似性百分比之演算法實例為BLAST及BLAST 2.0演算法,彼等分別描述於Altschul et al.,J. Mol. (1990) J. Mol. Biol. 215: 403-410及Altschul et al.(1997) Nucleic Acids Res. 25: 3389-3402。執行BLAST分析之軟體由美國國家生物技術資訊中心(National Center for Biotechnology Information)供大眾使用。此演算法涉及首先藉由在查詢序列中識別長度為W之短字組而識別高分序列對(HSP),其在與資料庫序列中具有相同長度之字組比對時匹配或滿足某個正值臨限評分T。T係指鄰近字組評分臨限(neighborhood word score threshold)(Altschul et al.,如前述)。將此等初始鄰近命中字組(initial neighborhood word hit)用作起始搜尋的種子以找出含有其等之更長的HSP。接著,將命中字組(word hit)沿著各序列向兩個方向延伸,只要可增加累積比對評分便繼續進行。
針對核苷酸序列,累積評分係使用參數M(匹配殘基對之獎勵評分(reward score);總是> 0)及N(錯配殘基之懲罰評分(penalty score);總是< 0)來計算。針對胺基酸序列,使用評分矩陣(scoring matrix)以計算累積評分。當在以下情況下時,命中字組向各方向之延伸停止:累積比對評分自其最大達成值下降數量X時;累積評分因為累積一或多個負評分殘基比對而變成零或以下時;或達到任一序列之末端時。BLAST演算法參數W、T、及X判定比對之敏感度及速度。BLASTN程式(針對核苷酸序列)使用以下作為預設值:字組長度(W)為11、期望值(E)為10、M=5、N=-4、及兩股之比較。針對胺基酸序列,BLASTP程式使用以下作為預設值:字組長度(W)為3、期望值(E)為10、及BLOSUM62評分矩陣(參見Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 (1989))。
除了計算序列同一性百分比之外,BLAST演算法亦執行兩序列之間的相似性之統計分析(參見例如,Karlin & Altschul, Proc. Nat’l. Acad. Sci. USA 90:5873-5787 (1993))。一種由BLAST演算法所提供之相似性量度係最小總和機率(smallest sum probability, P(N)),其提供兩核苷酸或胺基酸序列之間隨機發生匹配之機率的指標。例如,若在測試核酸與參考核酸之比較中,最小總和機率小於約0.1、更佳地小於約0.01、且最佳地小於約0.001,則該核酸被視為與參考序列相似。
二個核酸序列或多肽係實質上同一的進一步指示在於第一核酸編碼之多肽及第二核酸編碼之多肽具有如下所述之免疫交叉反應性。因此,例如當二個肽只有保守性取代之差異時,多肽一般係實質上與第二多肽同一。二個核酸序列係實質上同一的另一個指示在於二個分子在嚴謹條件下彼此雜交。
用語「野生型NPT (wild-type NPT)」及「野生型新黴素磷酸轉移酶(wild-type neomycin phosphotransferase)」在本文中可互換使用且由所屬技術領域中具有通常知識者所理解。一般而言,野生型NPT係指新黴素磷酸轉移酶,其優勝於自然界之生物體。在一些實施例中,野生型NPT係胺基糖苷磷酸轉移酶3’-II。在某些實施例中,野生型NPT係胺基糖苷磷酸轉移酶3’-IIa。在一些實施例中,野生型NPT係來自Tn5(胺基糖苷磷酸轉移酶3’-IIa)之新黴素磷酸轉移酶。在一具體實施例中,野生型NPT包含SEQ ID NO:1之胺基酸序列。在另一具體實施例中,野生型NPT包含SEQ ID NO:44之胺基酸序列。在其他實施例中,野生型NPT包含具有除SEQ ID NO:1或SEQ ID NO:44之外的胺基酸序列。
本文中所述之NPT中之胺基酸取代位置之描述係相對於SEQ ID NO:1之胺基酸位置。舉例而言,野生型NPT在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代係指在比對中,野生型NPT在該野生型NPT對應於SEQ ID NO:1之胺基酸殘基36及210之胺基酸殘基處具有胺基酸取代,諸如於圖6A至圖6B中所提供。在圖6A至圖6B中,APH(3’)-IIa之序列係參考序列(亦即,對應於SEQ ID NO:1的胺基酸序)並且與其他野生型NPT相比。編碼SEQ ID NO:1之胺基酸序列的例示性核酸序列提供為SEQ ID NO:6。
如本文所使用,詞組「可選擇標記構件(selectable marker means)」係指本文中所述之NPT突變體或非天然存在的NPT,或編碼本文中所述之NPT突變體或非天然存在的NPT之核苷酸序列,其允許宿主細胞在新黴素磷酸轉移酶受質(例如,新黴素、康黴素、或G418、或其衍生物)存在下生長。
如本文中所使用,詞組「用於在新黴素磷酸轉移酶受質存在下生長的構件(means for growing in the presence of a neomycin phosphotransferase substrate)」(該新黴素磷酸轉移酶受質例如,新黴素、康黴素、或G418、或其衍生物)係指本文中所述之NPT突變體或非天然存在的NPT,或編碼本文所述之NPT突變體或非天然存在的NPT之核苷酸序列,其允許宿主細胞在新黴素磷酸轉移酶受質存在下生長。 5.1 新黴素磷酸轉移酶(NPT) 蛋白
在一個態樣中,本文中提供不同於野生型NPT之胺基酸序列的NPT突變體,且相較於野生型NPT具有改變之酸轉移酶活性(例如,降低之磷酸轉移酶活性)。在一個實施例中,NPT突變體包含在野生型NPT中本文中所述之一個、兩個、或更多個胺基酸取代(例如,在表1或表2中)、或其組合。在具體實施例中,本文中所提供之NPT突變體係非天然存在的NPT蛋白。在某些實施例中,本文中所提供之NPT突變體係經單離NPT蛋白。在一具體實施例中,相較於野生型NPT,本文中所提供之NPT突變體具有作為可選擇標記之減弱之活性。在一特定實施例中,在本文中所述或所屬技術領域中具有通常知識者已知的檢定中,相較於對應的野生型NPT,NPT突變體具有降低之酶活性。舉例而言,NPT之酶活性可在體外激酶檢定中測量,諸如於Kocabiyik and Perlin, Biochem Biophys Res Commun 185(3): 925-931 (1992)中所述。NPT突變體之酶活性係在相同條件下與對應的野生型NPT相比。替代地或額外地,酶活性NPT可藉由評估用編碼NPT突變體之(多個)質體轉染的細菌(例如,大腸桿菌)在含有一定量的康黴素(例如,25 µg/ml、75 µg/ml、或100 µg/ml)及適合細菌生長之營養物之盤上以及適當細菌生長之條件(例如,溫度等)下一段時間(例如36小時、48小時、72小時、或更多)後的群落形成來間接測量。將用編碼NPT突變體之核苷酸序列轉形的細菌之群落形成與用編碼對應的野生型NPT之核苷酸序列轉形的相同細菌物種在與用編碼NPT突變體之核苷酸序列轉形的該細菌相同的生長條件下生長之群落形成相比,其中由用編碼NPT突變體之核苷酸序列轉形的細菌所形成之群落相對由用編碼野生型NPT之(多個)質體轉形的細菌所形成之群落更少及/或更小,指示NPT突變體之酶活性及/或蛋白穩定性減弱。評估酶活性NPT突變體之間接檢定之另一實例涉及比較由用編碼NPT突變體蛋白之DNA轉染或轉形的哺乳動物細胞的群落形成與由用編碼對應的野生型NPT之DNA轉染的哺乳動物細胞的群落形成,其中將兩種哺乳動物細胞群在含有生長所需之培養基及一定濃度的G418(例如,500 µg/ml)之盤或另一適當容器類型上在相同條件(例如,相同溫度、CO 2等)下生長一段時間(例如,2週、2.5週、3週、或更久),其中相較於由用野生型NPT轉染的哺乳動物細胞的群落形成,由用NPT突變體轉染的哺乳動物細胞的群落形成之降低指示NPT突變體具有減弱之酶活性。
評估NPT基因之酶活性之間接檢定之另一實例涉及測量用哺乳動物表現建構體轉染的細胞比例,該建構體穩定地將建構體整合至宿主染色體中並當稀釋及接種在含有選擇性劑之培養基中之組織培養皿中時形成群落。舉例而言,將用設計成表現野生型或突變體NPT異構體之質體轉染的HEK293細胞以2E6個細胞或更少的細胞接種到於DMEM培養基(含有10%胎牛血清及600 µg/ml之G418)中之150 mm組織培養皿中並在37℃及8% CO 2下培養2週。移除培養基並將細胞用10 ml 0.4%亞甲基藍於50%甲醇中藉由在室溫下培育10 min進行染色。將色斑取出,將細胞用100%甲醇洗滌、空氣乾燥並拍照。群落比例之降低:相對於野生型NPT表現建構體,使用突變體NPT表現建構體所接種之細胞數目指示該突變體具有減弱之酶活性。
在某些實施例中,相較於野生型NPT,具有降低之活性的NPT突變體展現出野生型NPT(例如,SEQ ID NO:1或SEQ ID NO:44)之磷酸轉移酶活性之0.001%至10%,如於合適的檢定中所判定。在一些實施例中,相較於野生型NPT,具有降低之活性的NPT突變體展現出野生型NPT(例如,SEQ ID NO:1或SEQ ID NO:44)之磷酸轉移酶活性之0.001%至8%,如於合適的檢定中所測定。在某些實施例中,相較於野生型NPT,具有降低之活性的NPT突變體展現出野生型NPT(例如,SEQ ID NO:1或SEQ ID NO:44)之磷酸轉移酶活性之0.01%至6%,如於合適的檢定中所測定。NPT磷酸轉移酶活性可使用所屬技術領域中已知(參見例如,Kocabiyik and Perlin, Biochem Biophys Res Commun 185(3): 925-931 (1992)及其中引用用於檢定磷酸轉移酶活性之例示性方法的參考文獻)或本文中所述(例如,群落形成)之任何檢定來測量。在某些實施例中,NPT突變體在野生型NPT之胺基酸序列中具有一或兩個胺基酸取代,其中野生型NPT之胺基酸殘基處的胺基酸取代對應於表1或表2中所列出之SEQ ID NO:1之胺基酸殘基中之一或二者。在一些實施例中,NPT突變體在野生型NPT之胺基酸序列中具有一個胺基酸取代,其中胺基酸取代係在野生型NPT之胺基酸殘基對應於表1或表2中所列出之SEQ ID NO:1之胺基酸殘基中之一者處。在具體實施例中,NPT突變體具有降低之活性,如由所屬技術領域中具有通常知識者已知或本文中所述之技術評估。在某些實施例中,NPT突變體在野生型NPT之胺基酸序列中具有二個胺基酸取代,其中該胺基酸取代係在野生型NPT之胺基酸殘基對應於表1或表2中所列出之SEQ ID NO:1之胺基酸殘基中之二者處。在具體實施例中,NPT突變體具有降低之活性,如由所屬技術領域中具有通常知識者已知或本文中所述之技術評估。
在某些實施例中,NPT突變體在具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之胺基酸序列中具有一或二個胺基酸取代,其中該等胺基酸取代在變體之胺基酸殘基對應於表1或表2中所列出之SEQ ID NO:1之胺基酸殘基中之一或二者處。在一些實施例中,NPT突變體在具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之胺基酸序列中具有一個胺基酸取代,其中該胺基酸取代係在變體之胺基酸殘基對應於表1或表2中所列出之SEQ ID NO:1之胺基酸殘基中之一者處。在具體實施例中,NPT突變體具有降低之活性,如由所屬技術領域中具有通常知識者已知或本文中所述之技術評估。在某些實施例中,NPT突變體在具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之胺基酸序列中具有二個胺基酸取代,其中該等胺基酸取代在變體之胺基酸殘基對應於表1或表2中所列出之SEQ ID NO:1之胺基酸殘基中之二者處。在具體實施例中,NPT突變體具有降低之活性,如由所屬技術領域中具有通常知識者已知或本文中所述之技術評估。
在某些實施例中,本文中所提供之NPT突變體不同於野生型NPT在於其在對應於SEQ ID NO:1之位置36處的胺基酸的位置處具有甲硫胺酸,及在對應於SEQ ID NO:1之位置210處的胺基酸的位置處具有丙胺酸。在某些實施例中,NPT突變體不同於野生型NPT在於其在對應於SEQ ID NO:1之位置36處的胺基酸的位置處具有甲硫胺酸,及在對應於SEQ ID NO:1之位置182處的胺基酸的位置處具有天冬胺酸。在某些實施例中,NPT突變體不同於野生型NPT在於其在對應於SEQ ID NO:1之位置36處的胺基酸的位置處具有甲硫胺酸,及在對應於SEQ ID NO:1之位置218處的胺基酸的位置處具有苯丙胺酸。在某些實施例中,NPT突變體不同於野生型NPT在於其在對應於SEQ ID NO:1之位置216處的胺基酸的位置處具有甘胺酸,及在對應於SEQ ID NO:1之位置261處的胺基酸的位置處具有天冬醯胺酸。在某些實施例中,NPT突變體不同於野生型NPT在於其在對應於SEQ ID NO:1之位置36處的胺基酸的位置處具有甲硫胺酸,及在對應於SEQ ID NO:1之位置218處的胺基酸的位置處具有絲胺酸。在某些實施例中,NPT突變體不同於野生型NPT在於其在對應於SEQ ID NO:1之位置36處的胺基酸的位置處具有甲硫胺酸,及在對應於SEQ ID NO:1之位置216處的胺基酸的位置處具有甘胺酸。在具體實施例中,NPT突變體具有降低之活性,如由所屬技術領域中具有通常知識者已知或本文中所述之技術評估。
在某些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代的野生型新黴素磷酸轉移酶之胺基酸序列,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸。在一些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代的野生型新黴素磷酸轉移酶之胺基酸序列,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸。在某些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代的野生型新黴素磷酸轉移酶之胺基酸序列,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸。在一些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代的野生型新黴素磷酸轉移酶之胺基酸序列,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸。在某些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代的野生型新黴素磷酸轉移酶之胺基酸序列,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸。在一些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代的野生型新黴素磷酸轉移酶之胺基酸序列,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。在具體實施例中,非天然存在的NPT具有降低之活性,如由所屬技術領域中具有通常知識者已知或本文中所述之技術評估。
在一些實施例中,野生型NPT包含與SEQ ID NO:1或SEQ ID NO:44至少50%、至少55%、或至少60%同一的胺基酸序列。在一些實施例中,野生型NPT包含與SEQ ID NO:1或SEQ ID NO:44至少65%、至少70%、或至少75%同一的胺基酸序列。在一些實施例中,野生型NPT包含與SEQ ID NO:1或SEQ ID NO:44至少80%、至少90%、或至少98%同一的胺基酸序列。在某些實施例中,野生型NPT包含與SEQ ID NO:1或SEQ ID NO:44 50%至75%、50%至80%、50%至60%、75%至95%、或85%至95%同一的胺基酸序列。在一些實施例中,野生型序列之模體1、模體2、或模體3分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、或模體3同一。在某些實施例中,野生型序列之模體1、模體2、及模體3分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、及模體3同一。在一些實施例中,野生型序列之模體1、模體2、及模體3之組合分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、及模體3之組合同一。在一些實施例中,野生型序列之模體1、模體2、或模體3分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、或模體3至少85%、至少90%、或至少95%同一。在某些實施例中,野生型序列之模體1、模體2、及模體3分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、及模體3至少85%、至少90%、或至少95%同一。在一些實施例中,野生型序列之模體1、模體2、及模體3之組合分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、及模體3之組合至少85%、至少90%、或至少95%同一。在一些實施例中,野生型序列之模體1、模體2、及模體3之組合分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、及模體3之組合至少98%、或至少99%同一。
在某些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之胺基酸序列,該非天然存在的NPT在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處具有胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸。在一些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之胺基酸序列,該非天然存在的NPT在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處具有胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸。在某些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之胺基酸序列,該非天然存在的NPT在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處具有胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸。在一些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之胺基酸序列,該非天然存在的NPT在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處具有胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸。在某些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之胺基酸序列,該非天然存在的NPT在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處具有胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸。在一些實施例中,本文中提供具有新黴素磷酸轉移酶活性的非天然存在的NPT,其中該非天然存在的NPT包含具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之胺基酸序列,該非天然存在的NPT在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處具有胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸。在具體實施例中,非天然存在的NPT突變體具有降低之活性,如由所屬技術領域中具有通常知識者已知或本文中所述之技術評估。
在某些實施例中,具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體包含與SEQ ID NO:1或SEQ ID NO:44至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。在某些實施例中,具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體包含與SEQ ID NO:1或SEQ ID NO:44至少80%、至少90、或至少98%同一的胺基酸序列。在一些實施例中,具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之模體1、模體2、或模體3分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、或模體3同一。在某些實施例中,具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之模體1、模體2、及模體3分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、及模體3同一。參見例如,圖6A至圖6B胺基糖苷磷酸轉移酶之模體1、2、及3之位置。在一些實施例中,具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之模體1、模體2、及模體3之組合分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、及模體3之組合同一。在一些實施例中,具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之模體1、模體2、或模體3分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、或模體3至少85%、至少90%、或至少95%同一。在某些實施例中,具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之模體1、模體2、及模體3分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、及模體3至少85%、至少90%、或至少95%同一。在一些實施例中,具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之模體1、模體2、及模體3之組合分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、及模體3之組合至少85%、至少90%、或至少95%同一。在一些實施例中,具有野生型新黴素磷酸轉移酶活性的新黴素磷酸轉移酶變體之模體1、模體2、及模體3之組合分別與SEQ ID NO:1或SEQ ID NO:44之模體1、模體2、及模體3之組合至少98%、或至少99%同一。
在某些實施例中,NPT突變體包含具有一或二個胺基酸取代的SEQ ID NO:1之胺基酸序列。在具體實施例中,NPT突變體係本文中所提供之表1所列之NPT突變體中之任一者。在另一具體實施例中,NPT突變體係本文中所提供之表2所列之NPT突變體中之任一者。
在某些實施例中,本文中所提供之NPT突變體不同於SEQ ID NO:1或SEQ ID NO:44在於其在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置36處具有甲硫胺酸,及在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置210處具有丙胺酸。在某些實施例中,NPT突變體不同於SEQ ID NO:1或SEQ ID NO:44在於其在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置36處具有甲硫胺酸,及在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置182處具有天冬胺酸。在某些實施例中,NPT突變體不同於SEQ ID NO:1或SEQ ID NO:44在於其在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置36處具有甲硫胺酸,及在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置218處具有苯丙胺酸。在某些實施例中,NPT突變體不同於SEQ ID NO:1或SEQ ID NO:44在於其在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置216處具有甘胺酸,及在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置261處具有天冬醯胺酸。在某些實施例中,NPT突變體不同於SEQ ID NO:1或SEQ ID NO:44在於其在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置36處具有甲硫胺酸,及在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置218處具有絲胺酸。在某些實施例中,NPT突變體不同於SEQ ID NO:1或SEQ ID NO:44在於其在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置36處具有甲硫胺酸,及在SEQ ID NO:1或SEQ ID NO:44之胺基酸位置216處具有甘胺酸。在某些實施例中,本文所提供之NPT突變體係SEQ ID NO:1之雙點NPT突變體。舉例而言,在一些實施例中,NPT突變體包含SEQ ID NO:38之胺基酸序列。在某些實施例中,NPT突變體包含SEQ ID NO:39之胺基酸序列。在一些實施例中,NPT突變體包含SEQ ID NO:40之胺基酸序列。在某些實施例中,NPT突變體包含SEQ ID NO:41之胺基酸序列。在一些實施例中,NPT突變體包含SEQ ID NO:42之胺基酸序列。在其他實施例中,NPT突變體包含SEQ ID NO:43之胺基酸序列。
在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:12之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:13之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:14之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:15之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:16之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:17之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:18之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:19之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:21之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:22之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:23之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:24之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:25之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:26之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:27之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:28之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:29之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:30之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:31之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:35之核苷酸序列編碼之胺基酸序列。
在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:20之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:32之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:33之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:34之核苷酸序列編碼之胺基酸序列。在某些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:36之核苷酸序列編碼之胺基酸序列。在一些實施例中,本文中所提供之NPT突變體包含由SEQ ID NO:37之核苷酸序列編碼之胺基酸序列。
在某些實施例中,如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼如本文中所提供之NPT突變體之核苷酸序列轉染或轉形的細菌細胞相對於用編碼對應的野生型NPT(例如,SEQ ID NO:1)之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。「降低之群落形成(reduced colony formation)」可例如相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞之康黴素抗性群落降低0.001%至75%的群落。在一些實施例中,降低之群落形成相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞之康黴素抗性群落降低0.001%至10%。在某些實施例中,降低之群落形成相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞之康黴素抗性群落降低0.01%至6%。
在一些實施例中,如藉由在含有500 µg/mL遺傳黴素(G418)之組織培養盤上生長2週後的群落形成檢定所評估,用編碼如本文中所提供之NPT突變體之核苷酸序列轉染或轉形的哺乳動物細胞相對於用編碼野生型NPT(例如,SEQ ID NO:1)之核苷酸序列轉染或轉形的哺乳動物細胞展現降低之群落形成。「降低之群落形成(reduced colony formation)」可例如相對於用編碼野生型NPT之核苷酸序列轉染或轉形的哺乳動物細胞之G418抗性群落降低0.001%至75%的群落。在一些實施例中,降低之群落形成相對於用野生型NPT轉染的哺乳動物細胞之G418抗性群落降低0.001%至10%。在某些實施例中,降低之群落形成相對於用編碼野生型NPT之核苷酸序列轉染的哺乳動物細胞之G418抗性群落降低0.01%至6%。
本文中所述之NPT突變體或非天然存在的NPT賦予對某些抗生素(例如,新黴素、康黴素、G418、或任何前述之衍生物)之抗性。在一具體實施例中,由細胞表現本文中所述之NPT突變體或非天然存在的NPT使該細胞能夠在新黴素磷酸轉移酶受質(例如,新黴素、康黴素、G418、或任何前述之衍生物)存在下生長。在一些實施例中,突變體NPT或非天然存在的NPT包含在下文第6節中所述之胺基酸序列。 5.2 核酸序列
在一個態樣中,本文中提供核酸,其編碼本文中所述之NPT突變體。在一具體實施例中,本文中提供核酸序列,其包含編碼本文中所述之NPT突變體之核苷酸序列。在另一具體實施例中,本文中提供核酸序列,其包含編碼本文中所述之非天然存在的NPT之核苷酸序列。由於密碼之簡併性,所以編碼NPT突變體或非天然存在的NPT的任何核苷酸序列均由本揭露涵蓋。在某些實施例中,編碼NPT突變體或非天然存在的NPT之核苷酸序列經密碼子最佳化(例如,為在特定對象或來自特定對象的(多個)細胞中之表現而經密碼子最佳化)。可使用所屬技術領域中已知之技術以將編碼NPT突變體或非天然存在的NPT之核苷酸序列密碼子最佳化。核酸序列或核苷酸序列可進一步包含一或多種調控元件(例如,啟動子、增強子等)。在一些實施例中,核酸序列或核苷酸序列可進一步包含下列中之一、二或更多者、或全部:啟動子、增強子、內含子、及多A序列。在一些實施例中,核酸序列或核苷酸序列可進一步包含啟動子及複製序列之起點。
在具體實施例中,核酸序列或核苷酸序列係單離自其中其係在自然中發現的核酸序列。在某些實施例中,核酸序列或核苷酸序列係單離自其中其係在自然中發現的生物體。此外,「單離之(isolated)」核酸序列,諸如cDNA分子,當藉由重組技術產生時可實質上不含其他細胞材料或培養基,或當化學合成時可實質上不含化學前驅物或其他化學物。舉例而言,措辭「實質上不含(substantially free)」包括具有少於約15%、10%、5%、2%、1%、0.5%、或0.1%)(特別是少於約10%)的其他材料(例如,細胞材料、培養基、其他核酸分子、化學前軀物、及/或其他化學物)之多核苷酸或核酸分子之製備。
如本文中所使用,用語「核酸(nucleic acid)」及「核苷酸(nucleotide)」包括去氧核糖核苷酸、去氧核糖核酸、核糖核苷酸、及核糖核酸、及其聚合形式,並包括單股或雙股形式。在某些實施例中,用語「核酸(nucleic acid)」及「核苷酸(nucleotide)」包括天然核苷酸之已知類似物,例如,肽核酸(「PNA」),其具有與參考核酸相似的結合性質。在一些實施例中,用語「核酸(nucleic acid)」及「核苷酸(nucleotide)」係指去氧核醣核酸(例如,cDNA或DNA)。在一些實施例中,用語「核酸(nucleic acid)」及「核苷酸(nucleotide)」係指核醣核酸(例如,mRNA或RNA)。
在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:12之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:13之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:14之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:15之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:16之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:17之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:18之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:19之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:21之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:22之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:23之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:24之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:25之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:26之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:27之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:28之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:29之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:30之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:31之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:35之核苷酸序列。
在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:20之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:32之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:33之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:34之核苷酸序列。在某些實施例中,本文中提供核酸序列,其包含SEQ ID NO:36之核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含SEQ ID NO:37之核苷酸序列。
在某些實施例中,本文中提供核酸序列,其包含編碼本文中所述之NPT突變體或非天然存在的NPT之第一核苷酸序列及第二核苷酸序列。第二核苷酸序列可編碼所關注之蛋白或非編碼RNA,或可包含破壞宿主細胞中之內源性基因的核苷酸序列。在一些實施例中,本文中提供核酸序列,其包含編碼本文中所述之NPT突變體或非天然存在的NPT之第一核苷酸序列及編碼所關注之蛋白或非編碼RNA之第二核苷酸序列。在某些實施例中,核酸序列可進一步包含額外的核苷酸序列(例如,轉位子元件)。核酸序列可進一步包含一或多種調控元件(例如,啟動子、增強子等)、複製起點、及/或多A序列。在某些實施例中,第一及第二核苷酸序列係可操作地連接至相同啟動子。在其他實施例中,第一及第二核苷酸序列係可操作地連接至不同啟動子。
在某些實施例中,本文中提供核酸序列,其包含編碼本文中所述之NPT突變體或非天然存在的NPT之第一核苷酸序列、所關注之基因之第一片段之第二核苷酸序列、及所關注之基因之第二片段之第三核苷酸序列,其中第二核苷酸序列在第一核苷酸序列的5’端側面而第三核苷酸序列在第一核苷酸序列的3’端側面,其中第一及第二片段促進所關注之基因之重組及破壞。在一些實施例中,核酸序列進一步包含在第二核苷酸序列之上游的loxP核苷酸序列及在第三核苷酸序列之下游的loxP核苷酸序列。參見例如,Güldener et al., Nucleic Acids Research 24 (13): 2519–2524 (1996)之如何產生並使用此類核酸序列。核酸序列可進一步包含一或多種調控元件(例如,啟動子、增強子等)、多A序列等。
在某些實施例中,本文中提供核酸序列,其包含編碼本文中所述之NPT突變體或非天然存在的NPT之第一核苷酸序列、編碼所關注之蛋白之第二核苷酸序列、包含第一轉位酶序列之第三核苷酸序列、及包含第二轉位酶序列之第四核苷酸序列,其中第三核苷酸序列係在第一及第二核苷酸序列之上游,且其中第四核苷酸序列在第一及第二核苷酸序列之下游。在一些實施例中,第一轉位酶序列係Leap-In左轉位酶而第二轉位酶係Leap-In轉位酶。核酸序列可進一步包含一或多種調控元件(例如,啟動子、增強子等)、複製起點、及/或多A序列。
在一具體實施例中,核酸序列係下文第6節中所述者。
在具體實施例中,本文中提供核酸序列,其包含編碼本文中所述之NPT突變體或非天然存在的NPT之第一核苷酸序列及轉殖基因。轉殖基因可係天然基因序列,或其可經修飾,例如,包括密碼子最佳化以用於調適在特定宿主細胞中之表現。轉殖基因可包含編碼所關注之蛋白或非編碼RNA之核苷酸序列。在具體實施例中,轉殖基因係可操作地連接至一或多種調控元件(例如,啟動子、增強子等)。
所關注之蛋白可例如係治療性蛋白或可偵測的標記。在某些實施例中,所關注之蛋白係荷爾蒙、生長因子、抗體、病毒蛋白、酶、細胞介素、或其片段。在某些實施例中,片段係長度為至少8個、至少9個、至少10個、至少11個、或至少12個胺基酸。在一些實施例中,所關注之蛋白係抗原(例如,病毒、細菌、真菌、或癌症抗原)。在某些實施例中,所關注之蛋白係病毒蛋白,諸如殼體蛋白、套膜蛋白、或病毒複製所需之蛋白。病毒蛋白可係腺相關之病毒(AAV)、腺病毒、反轉錄病毒、慢病毒、單純疱疹病毒、痘瘡病毒、或桿狀病毒蛋白。在一些實施例中,所關注之蛋白係肽或多肽,其可用作治療性或用於診斷性檢定中。
非編碼RNA可例如係反義RNA、微RNA (miRNA)、短髮夾RNA (shRNA)、長非編碼RNA、催化RNA(包括例如,核酶)、核糖體RNA、tRNA、或用於CRISPR核酸酶之引導RNA。
在本文中所提供之核酸序列之一些實施例中,該核酸序列進一步包含編碼可選擇標記而非NPT蛋白之核苷酸序列。可選擇標記當引入細胞中時賦予適於人工選擇之特質。可選擇標記可例如賦予對抗生素之抗性,或其可編碼在某些培養條件下用於真核細胞生長所需之酶。可選擇標記係所屬技術領域中眾所週知。在某些實施例中,可選擇標記係賦予安比西林抗性之β-內醯胺酶。在一些實施例中,可選擇標記係螢光蛋白。在一些實施例中,用語「選擇性標記(selectivity marker)」係與「可選擇標記(selectable marker)」互換使用。
可使用的選擇標記包括但不限於單純疱疹病毒胸腺嘧啶激酶(Wigler et al, Cell 11 :223 (1977))、次黃嘌呤鳥嘌呤磷酸核糖基轉移酶(Szybalska & Szybalski, Proc. Natl. Acad. Sci. USA 48:202 (1992)、及腺嘌呤磷酸核糖基轉移酶(Lowy et al, Cell 22:8-17 (1980))基因,其等可分別用於tk-、hgprt-、或aprt-細胞中。此外可使用抗代謝物抗性作為選擇下列基因之基礎:dhfr,其賦予對胺甲喋呤之抗性(Wigler et al, Proc. Natl. Acad. Sci. USA 77:357 (1980);O'Hare et al., Proc. Natl. Acad. Sci. USA 78: 1527 (1981));gpt,其賦予對黴酚酸之抗性(Mulligan & Berg, Proc. Natl. Acad. Sci. USA 78:2072 (1981));md hygro,其賦予對潮黴素之抗性(Santerre et al, Gene 30: 147 (1984))。 5.3 載體
在另一態樣中,本文中提供載體,其包含核酸序列,該核酸序列包含編碼本文中所述之NPT突變體或非天然存在的NPT之核苷酸序列。在具體實施例中,本文中提供載體,其包括本文中所述之核酸序列或核苷酸序列(例如,第5.2節或第6節中)。在一些實施例中,本文中提供載體,其包含編碼本文中所述之NPT突變體或非天然存在的NPT之第一核苷酸序列及編碼所關注之蛋白或非編碼RNA之第二核苷酸序列。在某些實施例中,本文中提供載體,其包含編碼本文中所述之NPT突變體或非天然存在的NPT之第一核苷酸序列、所關注之基因之第一片段之第二核苷酸序列、及所關注之基因之第二片段之第三核苷酸序列,其中第二核苷酸序列在第一核苷酸序列的5’端側面且第三核苷酸序列在第一核苷酸序列的3’端側面,且其中第一及第二片段促進所關注之基因之重組及破壞。在一些實施例中,載體進一步包含在第二核苷酸序列之上游的loxP核苷酸序列及在第三核苷酸序列之下游的loxP核苷酸序列。
在一具體實施例中,載體係下文第6節中所述者。
鑒於本揭露,可使用所屬技術領域中具有通常知識者已知之任何載體,諸如質體、黏質體、噬菌體載體、或病毒載體。在一些實施例中,載體是重組表現載體,諸如質體。該載體可包括建立表現載體之習知功能的任何元件,例如啟動子、核糖體結合元件、終止子、增強子、篩選標記、及複製起點。啟動子可以是組成型、誘導型、或阻抑型啟動子。許多能夠將核酸遞送至細胞之表現載體係所屬技術領域中已知且可在本文中用於在細胞中產生蛋白或非編碼RNA。習知選殖技術或人工基因合成可用於生成根據本文中所提供之實施例的重組表現載體。鑒於本揭露,此類技術對於所屬技術領域中具有通常知識者而言是熟知的。
在某些實施例中,載體係包含編碼NPT突變體之核酸的選殖載體。選殖載體可例如係質體、噬菌體、病毒、黏質體、游離基因體、或細菌人工染色體。對於本文中所涵蓋之載體(包括表現載體)亦參見第5.4節。 5.4 用於NPT 突變體之表現之方法
在一個態樣中,本文中提供用於產生本文中所述之NPT突變體或非天然存在的NPT及可任選地一或多個額外蛋白或非編碼RNA之方法。
在某些態樣中,本文中提供表現(例如,重組表現)本文中所述之NPT突變體或非天然存在的NPT及一或多個額外蛋白、或一或多個非編碼RNA、或兩者可任選地。在另一態樣中,本文中提供包含核酸序列之載體(例如,表現載體),其中該核酸序列包含編碼本文中所述之NPT突變體或非天然存在的NPT之核苷酸序列及可任選地一或多個編碼一或多個額外蛋白或非編碼RNA、或兩者之核苷酸序列,其用於在宿主細胞(例如,哺乳動物細胞)中重組表現。本文中亦提供包含核酸序列之宿主細胞,該核酸序列包含編碼本文中所述之NPT突變體或非天然存在的NPT之核苷酸及可任選地一或多個編碼一或多個額外蛋白或非編碼RNA、或兩者之核苷酸序列。在一具體實施例中,本文中提供包含兩個載體之宿主細胞,其中第一載體包含核酸序列,其包含編碼NPT突變體或非天然存在的NPT之核苷酸序列、且第二載體包含核酸序列,其包含一或多個編碼一或多個額外蛋白或一或多個非編碼RNA、或兩者之核苷酸序列。
可使用的細胞之實例包括本節中及下文之第5.5節及第6節中所述者。細胞可係初代細胞或細胞系。在一特定實施例中,宿主細胞係單離自其他細胞。在另一實施例中,宿主細胞未在對象體內發現。在細胞或身體之上下文中之用語「對象(subject)」係指任何生物體(例如,細菌、或哺乳動物)。對象可係人類或非人類哺乳動物。
NPT突變體或非天然存在的NPT、及可任選地一或多個額外蛋白或一或多個非編碼RNA或兩者,可藉由所屬技術領域中已知之任何方法產生,諸如例如,藉由化學合成或藉由重組表現技術。除非另有指示,否則本文中所述之方法採用分子生物學、微生物學、遺傳分析、重組DNA、有機化學、生物化學、PCR、寡核苷酸合成及修飾、核酸雜交、及在所屬技術領域之技術範圍內的相關領域中之習知技術。此等技術描述於本文中所引用之參考文獻中並在文獻中充分解釋。參見例如,Maniatis et al.(1982) Molecular Cloning: A Laboratory Manual Cold Spring Harbor Laboratory Press;Sambrook et al. (1989), Molecular Cloning: A Laboratory Manual Second Edition, Cold Spring Harbor Laboratory Press;Sambrook et al. (2001) Molecular Cloning: A Laboratory Manual Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY;Ausubel et al, Current Protocols in Molecular Biology, John Wiley & Sons (1987 and annual updates);Current Protocols in Immunology, John Wiley & Sons (1987 and annual updates) Gait (ed.) (1984) Oligonucleotide Synthesis: A Practical Approach, IRL Press;Eckstein (ed.) (1991) Oligonucleotides and Analogues: A Practical Approach, IRL Press;Birren et al. (eds.) (1999) Genome Analysis: A Laboratory Manual Cold Spring Harbor Laboratory Press。
蛋白(例如,NPT突變體或非天然存在的NPT、及可任選地所關注之蛋白)可使用所屬技術領域中已知之各式各樣的技術,包括重組及噬菌體展示技術、或其組合來製備。噬菌體展示方法之實例包括揭示於下列中者:Brinkman et al, 1995, J. Immunol. Methods 182:41-50;Ames et al, 1995, J. Immunol. Methods 184: 177-186;Kettleborough et al, 1994, Eur. J. Immunol. 24:952-958;Persic et al, 1997, Gene 187:9-18;Burton et al, 1994, Advances in Immunology 57: 191-280;PCT申請案第PCT/GB91/01 134號;國際公開案第WO 90/02809號、第WO 91/10737號、第WO 92/01047號、第WO 92/18619號、第WO 93/1 1236號、第WO 95/15982號、第WO 95/20401號、及第W097/13844號;及美國專利第5,698,426號、第5,223,409號、第5,403,484號、第5,580,717號、第5,427,908號、第5,750,753號、第5,821,047號、第5,571,698號、第5,427,908號、第5,516,637號、第5,780,225號、第5,658,727號、第5,733,743號、及第5,969,108號。
表現載體可藉由習知技術轉移至細胞(例如,宿主細胞),且接著所得細胞可藉由習知技術培養以產生可被純化或單離之NPT突變體或非天然存在的NPT、及可任選地所關注之蛋白或非編碼RNA。載體(例如,表現載體)或核酸序列或核苷酸序列可藉由例如電穿孔、轉染、感染、熱休克、顯微注射、染色體轉移、或所屬技術領域中具有通常知識者已知的任何或技術引入至細胞(例如,宿主細胞)中。
可利用各種宿主表現載體系統來表現NPT突變體或非天然存在的NPT、及可任選地所關注之蛋白或非編碼RNA。此類宿主表現系統不僅代表可藉以產生並隨後純化所關注之編碼序列之媒劑,亦代表當用適當核苷酸編碼序列轉形或轉染時可原位表現本文中所述之蛋白的細胞。這些包括但不限於微生物,諸如細菌(例如,大腸桿菌及枯草桿菌( B. subtilis)),其用重組噬菌體DNA、質體DNA、或黏質體DNA表現載體轉形;酵母(例如,酵母菌屬、畢赤酵母菌屬),其用重組酵母表現載體轉形;昆蟲細胞系統,其用重組病毒表現載體(例如,桿狀病毒)感染;植物細胞系統(例如,綠藻諸如萊氏單胞綠藻( Chlamydomonas reinhardtii)、或菸草植物),其用重組病毒表現載體(例如,花菜嵌紋病毒(cauliflower mosaic virus),CaMV;菸草嵌紋病毒(tobacco mosaic virus),TMV)感染或用重組質體表現載體(例如,Ti質體)轉形;或哺乳動物細胞系統(例如,COS、CHO, BHK、MDCK、HEK 293、NSO、PER.C6、VERO、CRL7030、HsS78Bst、HeLa、及NIH 3T3細胞),其帶有重組表現建構體,該建構體含有衍生自哺乳動物細胞之基因體的啟動子(例如,金屬硫蛋白啟動子)或衍生自哺乳動物病毒的啟動子(例如,腺病毒晚期啟動子;痘瘡病毒7.5K啟動子)。
在細菌系統中,取決於所表現之非編碼RNA之所關注之蛋白之預期用途,可有利地選擇數種表現載體。在昆蟲系統中,可使用加州苜蓿夜蛾核多角體病毒(Autographa californica nuclear polyhedrosis virus, AcNPV)作為載體來表現外來基因。該病毒生長於草地貪夜蛾( Spodoptera frugiperda)細胞中。在哺乳動物宿主細胞中,可利用多種基於病毒之表現系統。在其中使用腺病毒作為表現載體之情況下,可將所關注之蛋白連接至腺病毒轉錄/轉譯控制複合物,例如晚期啟動子及三聯前導序列(tripartite leader sequence)。此嵌合基因可接著藉由體外或體內重組插入腺病毒基因體中。插入病毒基因體之非必需區域(例如,El或E3區域)將導致可在受感染之宿主中存活且能夠表現所關注之蛋白的重組病毒(例如參見,Logan & Shenk, 1984, Proc. Natl. Acad. Sci. USA 8 1 :355-359)。為了有效率的轉譯經插入之編碼序列,亦可能需要特定起始信號。這些信號包括ATG起始密碼子及相鄰序列。此外,起始密碼子必需與所欲之編碼序列之閱讀框同相,以確保整個插入物之轉譯。此等外源轉譯控制信號及起始密碼子可具有天然或合成兩者之各種來源。表現效率可藉由包括適當轉錄增強子元件、轉錄終止子等來增強。(參見例如,Bittner et al, 1987, Methods in Enzymol. 153 :51-544)。
如本文中所使用,用語「宿主細胞(host cell)」係指任何類型的細胞,例如初代細胞、或來自細胞系之細胞。宿主細胞可係初代細胞,諸如纖維母細胞、淋巴球(例如,B或T細胞)、上皮細胞、內皮細胞、神經元細胞、星狀細胞、肝細胞、肌細胞、軟骨細胞、脂肪細胞、或幹細胞(例如,胚胎幹細胞)。替代地,宿主細胞可係永生化細胞。在具體實施例中,用語「宿主細胞(host cell)」係指細胞經轉染、感染、微注射、或轉形核酸序列或核苷酸序列,或以其他方式經工程改造以含有核酸序列或核苷酸序列及此類細胞之後代或潛在後代。此類細胞之後代可能因為在後繼世代或核酸序列或核苷酸序列整合至宿主細胞基因體時可能發生的突變或環境影響,而不與經核酸序列或核苷酸序列轉染之親代細胞同一。
此外,可選擇宿主細胞菌株,其調節插入序列之表現或以所欲之特定方式修飾及加工基因產物。蛋白產物之此類修飾(例如,糖基化)及加工(例如,裂解)可能對蛋白之功能係重要的。不同宿主細胞對於蛋白及基因產物之轉譯後加工及修飾具有特徵及特定機制。可選擇適當的細胞系或宿主系統以確保所表現之外來蛋白之正確修飾及加工。為此,可使用真核宿主細胞,其擁有使初級轉錄物適當加工、基因產物之醣基化、及磷酸化的細胞機制。此類哺乳動物宿主細胞包括但不限於CHO、VERO、BHK、Hela、COS、MDCK、HEK 293、NIH 3T3、W138、BT483、Hs578T、HTB2、BT20及T47D、NS0(鼠類骨髓瘤細胞系)、CRL7030、及HsS78Bst細胞。
為了使重組蛋白長期、高產率的生產,穩定的表現係較佳的。宿主細胞可用由適當表現控制元件(例如,啟動子、增強子、序列、轉錄終止子、多腺苷酸化部位等)所控制之核酸序列(例如,DNA)及可選擇標記(例如,NPT突變體或非天然存在的NPT)轉形,而非使用含有病毒複製起點的表現載體。在引入外源DNA後,可使經工程改造之細胞在豐富培養基中生長一定時間段(例如,1至2天),且接著轉換至選擇性培養基(例如,在NPT突變體或非天然存在的NPT之情況下含有抗生素,諸如新黴素、康黴素、或G418之培養基)中。重組質體中之可選擇標記賦予對選擇之抗性(例如,在NPT突變體或非天然存在的NPT之情況下之新黴素、康黴素、或G418),且允許細胞將質體穩定整合至其染色體中並生長以形成細胞群落(foci),其轉而可經選殖且擴增成細胞系。此方法可有利地用以工程化表現蛋白之細胞系。
在某些實施例中,本文中提供用於產生包含第二核苷酸序列之宿主細胞之方法,該方法包含(a)引入具有第一核酸序列之第一宿主細胞群,該第一核酸序列包含(i)編碼NPT突變體或非天然存在的NPT之第一核苷酸序列,及(ii)第二核苷酸序列(例如,編碼第二蛋白或非編碼RNA之第二核苷酸序列);(b)在康黴素、新黴素、或G418、或其衍生物存在下生長第一宿主細胞群以產生群落;及(c)選擇在康黴素、新黴素、或G418存在下生長的細胞群落。在一些實施例中,本文中提供用於產生包含第二核苷酸序列之宿主細胞之方法,該方法包含(a)在康黴素、新黴素、或G418、或其衍生物存在下生長第一宿主細胞群以產生群落,其中將第一核酸序列引入至第一宿主細胞群中,且其中第一核酸序列包含(i)編碼NPT突變體或非天然存在的NPT之第一核苷酸序列,及(ii)第二核苷酸序列(例如,編碼第二蛋白或非編碼RNA之第二核苷酸序列);及(b)選擇在康黴素、新黴素、或G418存在下生長的細胞群落。在具體實施例中,第一宿主細胞群比用第二核酸序列轉染或轉形並在康黴素、新黴素、或G418存在下生長的第二宿主細胞群產生更少的群落及/或更小的群落,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在某些實施例中,第一宿主細胞群比用第二核酸序列轉染或轉形並在康黴素、新黴素、或G418存在下生長的第二宿主細胞群產生少50至100、100至1,000、1,000至5,000、5,000至10,000、1,000至10,000、10,000至15,000、5,000至15,000、15,000至25,000、10,000至25,000倍的群落,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在具體實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,第一宿主細胞群包含較高的第一核酸序列之拷貝數,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在某些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,第一宿主細胞群包含5至10倍、5至15倍、2至5倍、2至10倍、2至15倍、或10至20倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或2至1000倍更高的第一核酸序列之拷貝數,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在一些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,第一宿主細胞群包含至少2倍、至少5倍、至少10倍、至少15倍、至少20倍更高的第一核酸序列之拷貝數,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在具體實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,第一宿主細胞群達到較高的第二核苷酸序列之表現水準,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在某些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,第一宿主細胞群達到5至25倍、10至25倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或5至1000倍更高的第二核苷酸序列之表現水準,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在一些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,第一宿主細胞群達到至少5倍、至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍、或至少1,000倍更高的第二核苷酸序列之表現水準,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。可使用所屬技術領域中已知之任何技術來判定拷貝數(例如,拷貝數可使用數位液滴式PCR測量,以測量在宿主細胞之基因體中第二核苷酸序列相對於單拷貝的內源性基因之豐度)。第二核苷酸序列之表現可以藉由定量反轉錄PCR (qPCR)之RNA水準或以藉由免疫分析(例如,西方墨點法或免疫細胞化學法)之蛋白水準來評估。此外,對於由第二核苷酸序列所編碼之一些蛋白,可評估該蛋白之活性(例如,酶活性)。
在某些實施例中,本文中提供用於產生包含轉殖基因之宿主細胞之方法,其包含(a)引入具有第一核酸序列之第一宿主細胞群,該第一核酸序列包含(i)編碼NPT突變體或非天然存在的NPT之第一核苷酸序列,及(ii)轉殖基因;(b)在康黴素、新黴素、或G418、或其衍生物存在下生長第一宿主細胞群以產生群落;及(c)選擇在康黴素、新黴素、或G418存在下生長的細胞群落。在一些實施例中,本文中提供用於產生包含轉殖基因之宿主細胞之方法,該方法包含(a)在康黴素、新黴素、或G418、或其衍生物存在下生長第一宿主細胞群以產生群落,其中將第一核酸序列引入至第一宿主細胞群中,且其中第一核酸序列包含(i)編碼NPT突變體或非天然存在的NPT之第一核苷酸序列,及(ii)轉殖基因;及(b)選擇在康黴素、新黴素、或G418存在下生長的細胞群落。在具體實施例中,第一宿主細胞群比用第二核酸序列轉染或轉形並在康黴素、新黴素、或G418存在下生長的第二宿主細胞群產生更少的群落及/或更小的群落,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在某些實施例中,第一宿主細胞群比用第二核酸序列轉染或轉形並在康黴素、新黴素、或G418存在下生長的第二宿主細胞群產生少10至100、100至1,000、1,000至5,000、5,000至10,000、1,000至10,000、10,000至15,000、5,000至15,000、15,000至25,000、10,000至25,000倍的群落,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在具體實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,第一宿主細胞群包含更高的第一核酸序列之拷貝數,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在某些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,第一宿主細胞群包含5至10倍、5至15倍、2至5倍、2至10倍、2至15倍、或10至20倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或2至1000倍更高的第一核酸序列之拷貝數,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在一些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,第一宿主細胞群包含至少2倍、至少5倍、至少10倍、至少15倍、至少20倍更高的第一核酸序列之拷貝數,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在具體實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,第一宿主細胞群達到較高的第二核苷酸序列之表現水準,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在某些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,第一宿主細胞群達到5至25倍、10至25倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或5至1000倍更高的第二核苷酸序列之表現水準,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在一些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之轉殖基因之表現水準,第一宿主細胞群達到至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍、或至少1,000倍更高的轉殖基因之表現水準,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。可使用所屬技術領域中已知之任何技術來判定拷貝數(例如,拷貝數可使用數位液滴式PCR測量,以測量在宿主細胞之基因體中轉殖基因相對於單拷貝的內源性基因之豐度)。轉殖基因之表現可以藉由定量反轉錄PCR (qPCR)之RNA水準或以藉由免疫分析(例如,西方墨點法或免疫細胞化學法)之蛋白水準來評估。此外,對於由轉殖基因所編碼之一些蛋白,可評估該蛋白之活性(例如,酶活性)。
在某些實施例中,本文中提供用於產生包含第二核苷酸序列之宿主細胞之方法,該方法包含(a)引入具有下列的第一宿主細胞群:(1)第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列,及(2)第二核酸序列,其包含第二核苷酸序列(例如,編碼第二蛋白或非編碼RNA之第二核苷酸序列);(b)在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長第一宿主細胞群以產生群落;及(c)選擇在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長的細胞群落。在一些實施例中,本文中提供用於產生包含第二核苷酸序列之宿主細胞之方法,該方法包含(a)在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長第一宿主細胞群以產生群落,其中將第一核酸序列及第二核酸序列引入至第一宿主細胞群中,且其中第一核酸序列包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列,且第二核酸序列包含第二核苷酸序列(例如,編碼第二蛋白或非編碼RNA之第二核苷酸序列);及(b)選擇在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長的細胞群落。在具體實施例中,第一宿主細胞群比用第三核酸序列及第四核酸序列轉染或轉形,並在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長的第二宿主細胞群產生更少的群落及/或更小的群落,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含第二核苷酸序列。在某些實施例中,第一宿主細胞群比用第三核酸序列及第四核酸序列轉染或轉形,並在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長的第二宿主細胞群產生少50至100、100至1,000、1,000至5,000、5,000至10,000、1,000至10,000、10,000至15,000、5,000至15,000、15,000至25,000、10,000至25,000倍的群落,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含第二核苷酸序列。在具體實施例中,相較於藉由用第三及第四核酸序列轉染或轉形的第二宿主細胞群所達到之第三核酸序列及/或第四核酸序列之拷貝數,第一宿主細胞群包含更高的第一核酸序列及/或第二核酸序列之拷貝數,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含第二核苷酸序列。在某些實施例中,相較於藉由用第三及第四核酸序列轉染或轉形的第二宿主細胞群所達到之第三核酸序列及/或第四核酸序列之拷貝數,第一宿主細胞群包含5至10倍、5至15倍、2至5倍、2至10倍、2至15倍、或10至20倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或2至1000倍更高的第一核酸序列及/或第二核酸序列之拷貝數,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含第二核苷酸序列。在一些實施例中,相較於藉由用第三及第四核酸序列轉染或轉形的第二宿主細胞群所達到之第三核酸序列及/或第四核酸序列之拷貝數,第一宿主細胞群包含至少2倍、至少5倍、至少10倍、至少15倍、或至少20倍、至少50倍、至少100倍、至少200倍、至少500倍、或至少1000倍更高的第一核酸序列及/或第二核酸序列之拷貝數,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含第二核苷酸序列。在具體實施例中,相較於藉由用第三核酸序列及第四核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,第一宿主細胞群達到較高的第二核苷酸序列之表現水準,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含第二核苷酸序列。在某些實施例中,相較於藉由用第三核酸序列及第四核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,第一宿主細胞群達到5至25倍、10至25倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或5至1000倍更高的第二核苷酸序列之表現水準,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含第二核苷酸序列。在一些實施例中,相較於藉由用第三核酸序列及第四核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,第一宿主細胞群達到至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍、或至少1,000倍更高的第二核苷酸序列之表現水準,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含第二核苷酸序列。可使用所屬技術領域中已知之任何技術來判定拷貝數(例如,拷貝數可使用數位液滴式PCR測量,以測量在宿主細胞之基因體中第二核苷酸序列相對於單拷貝的內源性基因之豐度)。第二核苷酸序列之表現可以藉由定量反轉錄PCR (qPCR)之RNA水準或以藉由免疫分析(例如,西方墨點法或免疫細胞化學法)之蛋白水準來評估。此外,對於由第二核苷酸序列所編碼之一些蛋白,可評估該蛋白之活性(例如,酶活性)。
在某些實施例中,本文中提供用於產生包含轉殖基因之宿主細胞之方法,該方法包含(a)引入具有下列的第一宿主細胞群:(1)第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列,及(2)第二核酸序列,其包含轉殖基因(例如,編碼第二蛋白或非編碼RNA之轉殖基因);(b)在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長第一宿主細胞群以產生群落;及(c)選擇在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長的細胞群落。在一些實施例中,本文中提供用於產生包含轉殖基因之宿主細胞之方法,該方法包含(a)在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長第一宿主細胞群以產生群落,其中將第一核酸序列及第二核酸序列引入至第一宿主細胞群中,且其中第一核酸序列包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列,及第二核酸序列包含轉殖基因(例如,編碼第二蛋白或非編碼RNA之轉殖基因);及(b)選擇在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長的細胞群落。在具體實施例中,第一宿主細胞群比用第三核酸序列及第四核酸序列轉染或轉形,並在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長的第二宿主細胞群產生更少的群落,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含轉殖基因。在某些實施例中,第一宿主細胞群比用第三核酸序列及第四核酸序列轉染或轉形,並在新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)存在下生長的第二宿主細胞群產生少100至1,000、1,000至5,000、5,000至10,000、1,000至10,000、10,000至15,000、5,000至15,000、15,000至25,000、10,000至25,000倍的群落,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含轉殖基因。在具體實施例中,相較於藉由用第三及第四核酸序列轉染或轉形的第二宿主細胞群所達到之第三核酸序列及/或第四核酸序列之拷貝數,第一宿主細胞群包含更高的第一核酸序列及/或第二核酸序列之拷貝數,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含轉殖基因。在某些實施例中,相較於藉由用第三及第四核酸序列轉染或轉形的第二宿主細胞群所達到之第三核酸序列及/或第四核酸序列之拷貝數,第一宿主細胞群包含5至10倍、5至15倍、2至5倍、2至10倍、2至15倍、或10至20倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或2至1000倍更高的第一核酸序列及/或第二核酸序列之拷貝數,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含轉殖基因。在一些實施例中,相較於藉由用第三及第四核酸序列轉染或轉形的第二宿主細胞群所達到之第三核酸序列及/或第四核酸序列之拷貝數,第一宿主細胞群包含至少2倍、至少5倍、至少10倍、至少15倍、或至少20倍、至少50倍、至少100倍、至少200倍、至少500倍、或至少1000倍更高的第一核酸序列及/或第二核酸序列之拷貝數,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含轉殖基因。在具體實施例中,相較於藉由用第三核酸序列及第四核酸序列轉染或轉形的第二細胞群所達到之轉殖基因之表現水準,第一宿主細胞群達到更高的轉殖基因之表現水準,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含轉殖基因。在某些實施例中,相較於藉由用第三核酸序列及第四核酸序列轉染或轉形的第二細胞群所達到之轉殖基因之表現水準,第一宿主細胞群達到5至25倍、10至25倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或5至1000倍更高的轉殖基因之表現水準,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含轉殖基因。在一些實施例中,相較於藉由用第三核酸序列及第四核酸序列轉染或轉形的第二細胞群所達到之轉殖基因之表現水準,第一宿主細胞群達到至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍、或至少1,000倍更高的轉殖基因之表現水準,其中第三核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列,且其中第四核酸序列包含轉殖基因。可使用所屬技術領域中已知之任何技術來判定拷貝數(例如,拷貝數可使用數位液滴式PCR測量,以測量在宿主細胞之基因體中轉殖基因相對於單拷貝的內源性基因之豐度)。轉殖基因之表現可以藉由定量反轉錄PCR (qPCR)之RNA水準或以藉由免疫分析(例如,西方墨點法或免疫細胞化學法)之蛋白水準來評估。此外,對於由轉殖基因所編碼之一些蛋白,可評估該蛋白之活性(例如,酶活性)。
在具體實施例中,NPT突變體或非天然存在的NPT係第5.1節或第6節中所述者。在一些實施例中,轉殖基因係第5.2節中所述者。
在重組DNA技術領域中普遍已知之方法可例行應用於選擇所欲之重組殖株,且此類方法係描述於例如Ausubel, et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, NY (1993);Kriegler, Gene Transfer and Expression, A Laboratory Manual, Stockton Press, NY (1990);及Dracopoli, et al. (eds.), Current Protocols in Human Genetics, John Wiley & Sons, NY (1994)第12及13章;Colberre-Garapin et al, 1981, J. Mol. Biol. 150: 1,其全文係以引用的方式併入本文中。
宿主細胞可與本文中所述之二或更多種表現載體共轉染。兩種載體可含有相同的可選擇標記(例如,NPT突變體或非天然存在的NPT),其能夠同等表現所關注之蛋白或非編碼RNA。宿主細胞可用不同量的二或更多種表現載體共轉染。舉例而言,宿主細胞可用第一表現載體及第二表現載體之下列比率中之任一者轉染:1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:12、1:15、1:20、1:25、1:30、1:35、1:40、1:45、或1:50。
替代地,可使用編碼且能夠表現本文中所述之NPT突變體或非天然存在的NPT及所關注之蛋白或非編碼RNA的單一載體。表現載體可係單順反子或多順反子。多順反子核酸建構體可編碼2、3、4、5、6、7、8、9、10、或更多個、或在2至5、5至10、或10至20個之範圍內的基因/核苷酸序列。舉例而言,雙順反子核酸建構體可按下列順序包含啟動子、第一基因(例如NPT突變體或非天然存在的NPT)、及第二基因(例如,所關注之蛋白或非編碼RNA)。在此類表現載體中,兩種基因之轉錄可由啟動子驅使,而來自第一基因之mRNA之轉譯可藉由帽依賴性掃描機制(cap-dependent scanning mechanism)且來自第二基因之mRNA之轉譯可藉由帽依賴性機制,例如藉由IRES。
一旦本文所述之所關注之蛋白已藉由重組表現生產,即可藉由所屬技術領域中已知用於純化蛋白之任何方法純化,例如藉由層析法(例如,離子交換、親和力(特別是在蛋白質A後藉由對特定抗原之親和力)、及粒徑篩析管柱層析法)、離心、差異溶解度、或藉由任何其他用於純化蛋白質之標準技術。此外,所關注之蛋白可經融合至所屬技術領域中所已知之異源多肽序列(例如,Flag標籤或His標籤)以促進純化。
在具體實施例中,本文中所述之蛋白(例如,NPT突變體或非天然存在的NPT或所關注之蛋白)經單離或純化。一般而言,單離之蛋白係實質上不含除該單離之蛋白之外的其他蛋白者。舉例而言,在特定實施例中,本文中所述之蛋白之製備實質上不含細胞材料及/或化學前驅物。措辭「實質上不含細胞材料(substantially free of cellular material)」包括其中蛋白與經單離或經重組產生出該蛋白的細胞之細胞組分分離的本文中所述之蛋白之製備。因此,本文中所述之實質上不含細胞材料的蛋白包括具有小於約30%、20%、10%、5%、2%、1%、0.5%、或0.1%(以乾燥重量計)的異源性蛋白(在本文中亦稱為「污染蛋白(contaminating protein)」)及/或蛋白之變體(例如,蛋白之不同轉譯後修飾之形式)或蛋白之其他不同版本之蛋白製備。當該蛋白重組生產時,其亦通常實質上不含培養基,亦即,培養基佔蛋白製備之體積小於約20%、10%、2%、1%、0.5%、或0.1%。當蛋白係藉由化學合成產生時,其通常實質上不含化學前驅物或其他化學物,亦即,其係與涉及蛋白合成的化學前驅物或其他化學物分離。因此,此類蛋白之製劑除了所關注之蛋白之外,具有少於約30%、20%、10%、或5%(以乾燥重量計)的化學前驅物或化合物。在一具體實施例中,本文所述之蛋白經單離或純化。 5.5 細胞
在另一態樣中,在本文中提供宿主細胞。在某些實施例中,宿主細胞包含載體,其包含編碼NPT突變體或非天然存在的NPT之核苷酸序列。在一些實施例中,宿主細胞包含本文中所述之核酸序列或核苷酸序列(例如,第5.2節或第6節中)。在一具體實施例中,宿主細胞包含包含SEQ ID NO:20之核酸序列。在另一具體實施例中,宿主細胞包含包含SEQ ID NO:32之核酸序列。在另一具體實施例中,宿主細胞包含包含SEQ ID NO:33之核酸序列。在另一具體實施例中,宿主細胞包含包含SEQ ID NO:34之核酸序列。在另一具體實施例中,宿主細胞包含包含SEQ ID NO:36之核酸序列。在另一具體實施例中,宿主細胞包含包含SEQ ID NO:37之核酸序列。
在一些實施例中,宿主細胞包含本文所述之NPT突變體或非天然存在的NPT(例如,第5.1節或第6節)。在某些實施例中,宿主細胞表現本文所述之NPT突變體或非天然存在的NPT(例如,第5.1節或第6節中)。
鑒於本揭露,可將本文中所述(例如,第5.4節或第6節)或所屬技術領域中具有通常知識者已知之任何宿主細胞用於本文中所述之NPT突變體或非天然存在的NPT之重組表現(例如,第5.1節或第6節)。舉例而言,當將編碼NPT突變體或非天然存在的NPT及轉殖基因引入至細胞中時,可培養此類宿主細胞並使其共表現NPT突變體或非天然存在的NPT及轉殖基因。參見例如,第5.4節或第6節針對宿主細胞之實例。
在某些實施例中,細胞(例如,宿主細胞)係體外或離體細胞。在某些實施例中,宿主細胞係自未被編碼NPT突變體或非天然存在的NPT之核苷酸序列轉染或轉形的細胞中單離。宿主細胞可係本文中所述或所屬技術領域中已知之任何類型的細胞。
在一些實施例中,宿主細胞係細菌或真核細胞。在某些實施例中,宿主細胞係酵母、昆蟲、哺乳動物、或植物細胞。在其中宿主細胞係細菌細胞之實施例中,細胞係大腸桿菌細胞。例示性大腸桿菌細胞可係例如大腸桿菌TG1或BL21細胞,但不限於此。
在一些實施例中,宿主細胞係哺乳動物細胞。在某些實施例中,宿主細胞係來自人類細胞系。合適的哺乳動物細胞包括例如,CHO及HEK239細胞及其變體(例如,CHO-DG44或CHO-K1細胞)。
在某些實施例中,宿主細胞係永生化細胞系。在一些實施例中,宿主細胞係HEK293、CHO、PER.C6、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。
在具體實施例中,宿主細胞係初代細胞,諸如例如但不限於,纖維母細胞或血液細胞(例如,B細胞或T細胞)。在一些實施例中,宿主細胞係胚胎幹細胞。
在一些實施例中,宿主細胞係昆蟲細胞。在某些實施例中,宿主細胞係植物細胞。
培養之永生化細胞可用編碼NPT突變體或非天然存在的NPT的核酸轉染以進行短期(暫時)、或長期(穩定)表現,其取決於引入至細胞中之核酸是否整合至宿主細胞基因體中。暫時DNA表現一般持續24至72小時,而穩定DNA表現可能允許蛋白永久過表現。
根據特定實施例,藉由習知方法(諸如化學轉染、熱休克、或電穿孔)將重組表現載體引入至宿主細胞中,使得重組核酸序列有效地表現。
在某些實施例中,將編碼本文中所述之NPT突變體或非天然存在的NPT之核酸序列或核苷酸序列穩定地整合至細胞(例如,宿主細胞)之基因體中。可將核酸序列或核苷酸序列隨機整合至細胞(例如,宿主細胞)之基因體中。替代地,可將核酸序列或核苷酸序列在特定位置整合至細胞(例如,宿主細胞)之基因體中。可將核酸序列或核苷酸序列之多個拷貝整合至細胞之基因體中。(例如,宿主細胞)。舉例而言,宿主細胞可含有整合至其基因體中之核酸序列或核苷酸序列之5、10、15、20、25、或更多個拷貝。在一些實施例中,轉殖基因係本文中所述者(例如,第5.2節中)。
在一些實施例中,宿主細胞係哺乳動物細胞,且編碼NPT突變體或非天然存在的NPT之核酸序列或核苷酸序列及可任選地轉殖基因係藉由轉染、轉導、感染、微注射、或染色體轉移引入至細胞中。
在一些實施例中,第二核苷酸序列編碼本文中所描述之所關注之蛋白或非編碼RNA(例如,第5.2節)。
在具體實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,用第一核酸序列轉形或轉染的第一宿主細胞群包含更高的第一核酸序列之拷貝數,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及第二核苷酸序列(例如,編碼所關注之蛋白或非編碼RNA之第二核苷酸序列),且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在一些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,用第一核酸序列轉形或轉染的第一宿主細胞群包含至少2倍、至少5倍、至少10倍、至少15倍、或至少20倍、至少50倍、至少100倍、至少200倍、至少500倍、或至少1000倍更高的第一核酸序列之拷貝數,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及第二核苷酸序列(例如,編碼所關注之蛋白或非編碼RNA之第二核苷酸序列),且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在一些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,用第一核酸序列轉形或轉染第一宿主細胞群包含2至20倍、2至100倍、2至500倍、2至1000倍、50至100倍、50至500倍、50至1000倍、或500至1000倍更高的第一核酸序列之拷貝數,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及第二核苷酸序列(例如,編碼所關注之蛋白或非編碼RNA之第二核苷酸序列),且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在具體實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,用第一核酸序列轉形或轉染的第一宿主細胞群達到更高的第二核苷酸序列之表現水準,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及第二核苷酸序列(例如,編碼所關注之蛋白或非編碼RNA之第二核苷酸序列),且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在某些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,用第一核酸序列轉形或轉染的第一宿主細胞群達到5至少25倍、10至25倍、10至50倍、10至100倍、50或至100倍、50至200倍、50至500倍、100至500倍、100至1,000倍、500至1,000倍、或5至1000倍更高的第二核苷酸序列之表現水準,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及第二核苷酸序列(例如,編碼所關注之蛋白或非編碼RNA之第二核苷酸序列),且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。在一些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之第二核苷酸序列之表現水準,用第一核酸序列轉形或轉染的第一宿主細胞群達到至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍、或至少1000倍更高的第二核苷酸序列之表現水準,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及第二核苷酸序列(例如,編碼所關注之蛋白或非編碼RNA之第二核苷酸序列),且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及第二核苷酸序列。可使用所屬技術領域中已知之任何技術來判定拷貝數(例如,拷貝數可使用數位液滴式PCR測量,以測量在宿主細胞之基因體中第二核苷酸序列相對於單拷貝的內源性基因之豐度)。第二核苷酸序列之表現可以藉由定量反轉錄PCR (qPCR)之RNA水準或以藉由免疫分析(例如,西方墨點法或免疫細胞化學法)之蛋白水準來評估。此外,對於由第二核苷酸序列所編碼之一些蛋白,可評估該蛋白之活性(例如,酶活性)。
在具體實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,用第一核酸序列轉形或轉染第一宿主細胞群包含更高的第一核酸序列之拷貝數,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及轉殖基因,且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在一些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,用第一核酸序列轉形或轉染的第一宿主細胞群包含至少2倍、至少5倍、至少10倍、至少15倍、或至少20倍、至少50倍、至少100倍、至少200倍、至少500倍、或至少1000倍更高的第一核酸序列之拷貝數,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及轉殖基因,且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在一些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二宿主細胞群所達到之第二核酸序列之拷貝數,用第一核酸序列轉形或轉染的第一宿主細胞群包含2至20倍、2至100倍、2至500倍、2至1000倍、50至100倍、50至500倍、50至1000倍、或500至1000倍更高的第一核酸序列之拷貝數,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及轉殖基因,且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在具體實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達成之轉殖基因之表現水準,用第一核酸序列轉形或轉染的第一宿主細胞群達到更高的轉殖基因之表現水準,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及轉殖基因,且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在某些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之轉殖基因之表現水準,用第一核酸序列轉形或轉染的第一宿主細胞群達到5至25倍、10至25倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或5至1000倍更高的轉殖基因之表現水準,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及轉殖基因,且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。在一些實施例中,相較於藉由用第二核酸序列轉染或轉形的第二細胞群所達到之轉殖基因之表現水準,用第一核酸序列轉形或轉染的第一宿主細胞群達到至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍、或至少1000倍更高的轉殖基因之表現水準,其中第一細胞群包含第一核酸序列,其包含編碼NPT突變體或非天然存在的NPT之第一核苷酸序列及轉殖基因,且其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及轉殖基因。可使用所屬技術領域中已知之任何技術來判定拷貝數(例如,拷貝數可使用數位液滴式PCR測量,以測量在宿主細胞之基因體中轉殖基因相對於單拷貝的內源性基因之豐度)。轉殖基因之表現可以藉由定量反轉錄PCR (qPCR)之RNA水準或以藉由免疫分析(例如,西方墨點法或免疫細胞化學法)之蛋白水準來評估。此外,對於由轉殖基因所編碼之一些蛋白,可評估該蛋白之活性(例如,酶活性)。
在一些實施例中,轉殖基因係本文中所述者(例如,第5.2節中)。在一些實施例中,NPT突變體或非天然存在的NPT係本文中所述者(例如,第5.1節或第6節中)。
在某些實施例中,宿主細胞係病毒細胞生產者細胞系,其含有編碼本文中所述之NPT突變體或非天然存在的NPT之核酸序列或核苷酸序列。病毒生產者細胞系可表現殼體蛋白或其他表面蛋白(例如、套膜蛋白)、複製所需之蛋白、或兩者。合適的病毒生產者細胞系可用於AAV、腺病毒、反轉錄病毒、慢病毒、單純疱疹病毒、痘瘡病毒、或桿狀病毒。病毒生產者細胞系可用以產生用於例如基因療法或疫苗接種目的之病毒。
在一具體實施例中,本文中提供病毒生產者細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼一或多種病毒蛋白,其中該一或多種病毒蛋白係殼體蛋白或套膜蛋白、複製所需之病毒蛋白、或兩者;
在一些實施例中,病毒產生者細胞系包含SEQ ID NO:20、32、33、34、36、或37中任一者之NPT突變體核酸序列。
在本文中所提供之病毒產生者細胞系之某些實施例中,編碼之一或多種病毒蛋白可係例如AAV殼體蛋白、AAV rep蛋白、腺病毒複製所需之腺病毒E1區蛋白、反轉錄病毒套膜蛋白、反轉錄病毒gag蛋白、或反轉錄病毒反轉錄酶、或其組合。例如,一或多種病毒蛋白可係反轉錄病毒套膜蛋白、gag蛋白、及反轉錄酶。
在另一實施例中,本文中提供抗原產生細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列:(1)在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的胺基酸殘基處的胺基酸取代係取代成丙胺酸;(2)在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的胺基酸殘基處的胺基酸取代係取代成天冬胺酸;(3)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成苯丙胺酸;(4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的胺基酸殘基處的胺基酸取代係取代成天冬醯胺酸;(5)在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的胺基酸殘基處的胺基酸取代係取代成絲胺酸;或(6)在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的胺基酸殘基處的胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的胺基酸殘基處的胺基酸取代係取代成甘胺酸;及(ii)第二核酸序列,其編碼一或多種抗原。
在一些實施例中,抗原產生細胞系包含SEQ ID NO:20、32、33、34、36、或37中任一者之NPT突變體核酸序列。
在某些實施例中,抗原產生細胞系包含編碼病毒抗原、細菌抗原、或真菌抗原之核酸序列。在某些實施例中,抗原產生細胞系包含編碼癌症抗原之核酸序列。
在某些實施例中,本文中提供表現非天然存在的NPT的體外或離體細胞,其中非天然存在的NPT相對於野生型新黴素磷酸轉移酶經減弱,且其中該非天然存在的NPT包含SEQ ID NO:38、39、40、41、42、及43中任一者之胺基酸序列。
在其中宿主細胞係用編碼如本文中所提供之NPT突變體或非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞之某些實施例中,如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,該細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。
在其中宿主細胞係用編碼如本文中所提供之NPT突變體或非天然存在的NPT之核苷酸序列轉染的哺乳動物細胞之某些實施例中,如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,該哺乳動物細胞相對於用編碼野生型NPT之核苷酸序列轉染的哺乳動物細胞展現降低之群落形成。
在某些實施例中,宿主細胞包含編碼NPT突變體或非天然存在的NPT之第一核酸序列、及編碼第二蛋白或非編碼RNA之第二核酸序列。
在一些實施例中,第二蛋白或非編碼RNA係本文中所述者(例如,第5.2節中)。在一些實施例中,宿主細胞或宿主細胞群係藉由本文中所述之方法產生(例如,第5.4節或第6節中)。 5.6 使用之方法
在一具體實施例中,本文中所述之NPT突變體或非天然存在的NPT、或編碼本文所述之NPT突變體或非天然存在的NPT之核苷酸序列係以所屬技術領域中具有通常知識者將使用野生型NPT之任何方式使用。在具體實施例中,本文中所述之NPT突變體或非天然存在的NPT、或編碼本文所述之NPT突變體或非天然存在的NPT之核苷酸序列係以所屬技術領域中具有通常知識者將使用可選擇標記之任何方式使用。在某些實施例中,本文中所述之NPT突變體或非天然存在的NPT、或編碼NPT突變體或非天然存在的NPT之核苷酸序列係如本文中所述使用。
在具體實施例中,新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)係用以選擇用包含編碼本文中所述之NPT突變體或非天然存在的NPT之核苷酸序列及(多種)外源性序列的核酸序列轉形或轉染的宿主細胞(例如,哺乳動物宿主細胞),該宿主細胞具有穩定整合至染色體中之(多種)外源性序列。轉染、轉導、感染、微注射、或染色體轉移可用以將核酸序列引入至宿主細胞中。此方法可用以表現所關注之蛋白或用以藉由插入式誘變來破壞基因(例如,藉由插入DNA,其係藉由同源重組或藉由轉位子插入)。
在具體的實施例中,可使用例如,新黴素、康黴素、或G418選擇大量攜帶穩定游離基因體(複製的非整合之質體,諸如含有EBNA1 OriP序列並表現EBNA1及本文中所述之NPT突變體或非天然存在的NPT的質體)的宿主細胞。在一些實施例中,高拷貝數係比當使用編碼野生型NPT之核苷酸序列替代NPT突變體或非天然存在的NPT所達到的拷貝數高5至10倍、5至15倍、2至5倍、2至10倍、2至15倍、或10至20倍、10至50倍、10至100倍、50至100倍、50至200倍、50至500倍、100至500倍、100至1000倍、500至1000倍、或2至1000倍。
在具體實施例中,將宿主細胞(例如,哺乳動物細胞)與新黴素磷酸轉移酶受質(例如,康黴素、新黴素、或G418、或其衍生物)之短期培養可用以富集已接受表現本文中所述之NPT突變體或非天然存在的NPT以及其他共轉染之編碼蛋白或非編碼RNA之核酸序列(例如,DNA或RNA)的建構體的細胞,其中表現NPT突變體或非天然存在的NPT的該建構體未經整合。舉例而言,一些細胞難以被轉染且富集接受及表現NPT基因的細胞亦可富集接受共轉染之Crispr建構體的細胞,因此減少識別具有所欲修飾(例如,基因剔除)的細胞之篩選需要。
在具體實施例中,經工程改造以表現本文中所述之NPT突變體或非天然存在的NPT之宿主細胞可用以使用例如,新黴素、康黴素、或G418、或其衍生物選擇已進行基因擴增之那些宿主細胞。舉例而言,DHFR之抑制劑可以此方式使用以「擴增(amplify)」宿主細胞(例如,哺乳動物細胞,諸如CHO細胞)中含有整合轉殖基因的染色體區。
在具體實施例中,當藉由諸如在創建人類倉鼠雜交(Human Hamster Hybrid)中之染色體轉移或藉由細胞融合在細胞之間的染色體之轉移來創建細胞系時,編碼本文中所述之NPT突變體或非天然存在的NPT之核苷酸序列可用作選擇基因。
在具體實施例中,胚胎幹細胞經工程改造成含有編碼本文中所述之NPT突變體或非天然存在的NPT之核苷酸序列,並在胚胎幹細胞中之同源重組期間將npt基因引入至染色體中(產生異質插入(heterozygous insertion)),可使用更高濃度的G418以便選擇藉由染色體不分離(nondisjunction)而具有遺傳2個剔除染色體的稀有細胞。此將允許藉由體外或體內細胞之表徵來對該剔除表型進行一些分析,而無需先將細胞引入至小鼠中,然後飼養小鼠來生成同型合子。
在具體實施例中,可使用經位於剪接受體之下游的啟動子不足之(promoter-less) NPT突變體核苷酸基因或非天然存在的NPT基因工程改造的轉位子藉由全基因體篩選來識別宿主細胞中之高度活性基因啟動子。使用適當水準的新黴素磷酸轉移酶受質(例如,新黴素、康黴素、或G418、或其衍生物)可選擇插入至具有活化NPT表現的高活性啟動子的基因中的轉位子。相關基因及啟動子之識別可隨後藉由表徵存活細胞中之轉位子插入部位來識別。
在具體實施例中,用編碼NPT突變體或非天然存在的NPT的第一核苷酸序列及一或多種共價連接之額外核苷酸序列轉形的宿主細胞(例如,細菌)可藉由用適當新黴素磷酸轉移酶受質(例如,新黴素、康黴素、或G418、或其衍生物)培養細胞來選擇。編碼NPT基因之核苷酸序列可存在於選殖載體、病毒、或於宿主細胞中之基因體插入中。
在具體實施例中,包括編碼僅在細菌中表現的NPT突變體或非天然存在的NPT之核苷酸序列的質體可用以產生基因療法產物,包括例如慢病毒或AAV。由於基因活性低得多,NPT突變體或非天然存在的NPT之高度減弱特性使編碼NPT突變體或非天然存在的NPT之核苷酸序列之任何異常包裝及遞送至患者皆更加安全。
在具體實施例中,可創建DNA之串聯體,諸如藉由將含有所關注之基因之線性片段及編碼NPT突變體或非天然存在的NPT之核苷酸序列連接至具有細菌複製起點的片段,轉形宿主細胞並使用例如,新黴素、康黴素、或G418、或其衍生物選擇存活的細胞,該等存活的細胞具有該連接在一起的基因之多個拷貝。此可用以生成頭對尾(head-to-tail)基因陣列,其可經遞送至哺乳動物宿主細胞並可導致更高頻率的多重拷貝插入至宿主染色體中。
在具體實施例中,編碼NPT突變體或非天然存在的NPT之核苷酸序列可用於其中G418及其他NPT受質對細胞(例如,酵母、細菌、昆蟲細胞、動物細胞、植物及彼等生物體之任何病原體)具有毒性之任何地方。
在一些實施例中,如第6節中所述使用編碼NPT突變體或非天然存在的NPT之核苷酸序列。 5.7 套組
在另一態樣中,本文中提供套組。在一個實施例中,本文中所提供之套組於容器中包含核酸序列,其包含編碼NPT突變體或非天然存在的NPT之核苷酸序列。在另一實施例中,本文中所提供之套組於容器中包含載體(例如,表現載體),其包含編碼NPT突變體或非天然存在的NPT之核酸序列或核苷酸序列。在另一實施例中,套組於容器中包含cDNA或基因體庫或個別殖株,其含有編碼NPT突變體或非天然存在的NPT之核酸序列或核苷酸序列。在一些實施例中,NPT突變體核酸序列係於第5.2節或第6節中所述者。在某些具體實施例中,NPT突變體核酸序列係選自由下列所組成之群組:SEQ ID NO:20、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:36、及SEQ ID NO:37。在一些實施例中,套組於容器中進一步包含新黴素、康黴素、或G418、或任何前述之衍生物。在某些實施例中,套組於容器中包含細胞(例如,宿主細胞),其中可引入包含編碼NPT突變體或非天然存在的NPT之核苷酸序列之核酸序列;或包含編碼NPT突變體或非天然存在的NPT之核酸序列或核苷酸序列之載體(例如,表現載體)。在一些實施例中,套組進一步於容器中包含細胞(例如,宿主細胞),其中已引入包含編碼NPT突變體或非天然存在的NPT之核苷酸序列之核酸序列;或包含編碼NPT突變體或非天然存在的NPT之核酸序列或核苷酸序列之載體(例如,表現載體)。
在某些實施例中,本文中提供一種套組,其於容器中包含:包含核酸序列之載體,其中核酸序列包含編碼NPT突變體或非天然存在的NPT之核苷酸序列。載體可係質體、相、病毒、黏質體、或細菌人工染色體。在一些實施例中,本文中提供一種套組,其於容器中包含基因體序列、cDNA序列、基因體庫、或包含核酸序列之個別殖株,其中核酸序列包含編碼NPT突變體或非天然存在的NPT之核苷酸序列。在一些實施例中,套組於容器中進一步包含新黴素、康黴素、或G418、或任何前述之衍生物。
在一些實施例中,套組於容器中包含合成DNA片段或不在活細胞中繁殖的片段,該等活細胞編碼本文中所述之NPT突變體或非天然NPT之片段。在載體中NPT突變體或非天然NPT之二或更多個互補片段可呈單獨片段之形式,且NPT突變體基因或非天然NPT當引入至宿主細胞中時,由該等單獨片段重構。
在一些實施例中,本文中提供一種套組,其於容器中包含本文中所述之宿主細胞。 5.8 相關申請案之交互參照
本申請案主張於2021年4月21日提出申請的美國案序號第63/177,739號;於2021年4月21日提出申請的美國案序號第63/177,744號;於2021年4月21日提出申請的美國案序號第63/177,746號;於2021年4月21日提出申請的美國案序號第63/177,749號、於2021年4月21日提出申請的美國案序號第63/177,753號;於2021年4月21日提出申請的美國案序號第63/177,759號;於2021年4月21日提出申請的美國案序號第63/177,764號;及於2021年4月21日提出申請的美國案序號第63/177,767號之優先權,其等之各者之揭露全文係以引用方式併入本文中。 5.9 序列表
本申請案含有序列表,該序列表已以ASCII格式序列表經由EFS-Web電子提交,檔案名稱為「14620-686-228_SL.txt」,創建日期為2022年4月9日,且檔案大小為118,113位元組。經由EFS-Web提交之序列表係本說明書之一部分,其全文以引用方式併入本文中。 6. 實例 6.1 實例1 :識別具有降低之活性的NPT 突變體
此實例描述如何製作NPT突變體並針對降低之磷酸轉移酶活性進行篩選。 質體表現載體之建構
建構質體載體P313(圖1,SEQ ID NO:2)。其編碼mCherry螢光蛋白表現匣,該表現匣包含人類延伸因子α啟動子及第一內含子(SEQ ID NO:3)、mCherry編碼區(SEQ ID NO:4)及SV40多腺苷酸化信號(SEQ ID NO:5)。P313編碼衍生自轉位子Tn5(胺基糖苷磷酸轉移酶3’-IIa)的新黴素磷酸轉移酶(NPT)蛋白(SEQ ID NO:1;包含SEQ ID NO:6之核苷酸序列),該蛋白由用於哺乳動物細胞中表現的小鼠磷酸甘油酯激酶啟動子(SEQ ID NO: 7)及由用於細菌中表現的大腸桿菌 laczya啟動子(SEQ ID NO: 8)所驅動。在哺乳動物細胞中藉由單純疱疹病毒胸腺嘧啶激酶多腺苷酸化信號(SEQ ID NO:9)來終止NPT轉錄。質體亦編碼安比西林抗性基因(SEQ ID NO:10)及pUC57質體複製起點(SEQ ID NO:11)。
含有NPT基因突變之質體係藉由用由基因合成(Integrated DNA Technologies, Coralville IA)所生成之DNA片段置換NPT開放閱讀框之部分所創建。質體P313係用具有獨特部位(包括 Bsp E1Tth111 IRsr II、及 Avr II)的適當限制性核酸內切酶對消化以產生接受者載體。選殖混合物含有5 µl 2x HiFi選殖混合物、50 ng合成DNA、及509 ng的消化載體。將混合物在50℃下培育15 min,然後冷卻至4℃。將2 µl轉形到Top10勝任細胞(Invitrogen)或Stellar勝任細胞(Clontech)中,接種在LB-卡本西林盤上,並在37℃下培育。將單個群落接種至5 ml LB-卡本西林培養物中並在37℃下於搖動培育箱中生長過夜。DNA係使用Qiagen旋轉迷你製備套組(Qiagen)純化。質體序列係藉由DNA定序(GENEWIZ, Plainfield, NJ)驗證。在含有濃度為25 µg/mL (KAN25)、50 µg/mL (KAN50)、75 µg/mL (KAN75)、及100 µg/mL (KAN100)之康黴素的盤上篩選NPT活性。 篩選細菌中之NPT 突變體
將在LB-卡本西林中生長之過夜培養物用PBS連續稀釋並接種在LB-卡本西林、LB-KAN25、及LB-KAN100盤上並培育24小時。計數群落,允許在37℃下培育額外的24小時,然後再次計數。相對於KAN25及卡本西林盤,將其中在KAN100盤上群落數顯著降低但並非無的質體再次接種到卡本西林、KAN25、KAN50、KAN75、及KAN100上並如上文培育及計數。表1中顯示來自四十八小時培育所得之群落數。 表1 :在表現突變體NPT 的細胞中所觀查到之群落數 48小時後的結果;「 n.d.」意指未判定;用於突變體 NPT核酸序列之開放閱讀框(「 Neo ORF」)係藉由序列識別號來識別。
建構體 質體 殖株 Neo ORF 突變 Carb KAN25 KAN50 KAN75 KAN100 宿主菌株
A P614 P614-1 SEQ ID NO:12 H188L 183 214 n.d. n.d. 201 Top 10
B P615 P615-1 SEQ ID NO:13 R211G 116 115 133 131 94 Top 10
C P616 P616-1 SEQ ID NO:14 D261N 153 74 61 64 0 Top 10
D P641 P641-16 SEQ ID NO:21 G205E 132 0 n.d. n.d. 0 Top 10
E P642 P642-21 SEQ ID NO:22 D208G 51 0 n.d. n.d. 0 Top 10
F P643 P643-26 SEQ ID NO:23 D216G 100 116 126 117 106 Top 10
G P679 P679-1 SEQ ID NO:28 G210A 59 60 n.d. n.d. 59 Top 10
H P680 P680-2 SEQ ID NO:29 Y218A 133 190 n.d. n.d. 156 Top 10
I P681 P681-2 SEQ ID NO:30 Y218F 129 89 n.d. n.d. 140 Top 10
J P682 P682-1 SEQ ID NO:31 V36M 49 75 67 66 72 Top 10
K P623 P623-4 SEQ ID NO:15 H188L、D261N 210 38 43 32 13 Top 10
L P624 P624-33 SEQ ID NO:16 R211G、D261N 126 0 n.d. n.d. 0 Top 10
M P626 P626-1 SEQ ID NO:17 D190G、D261N 251 0 n.d. n.d. 0 Top 10
N P629 P629-11 SEQ ID NO:20 D216G、D261N 74 78 0 0 0 Top 10
O P675 P675-3 SEQ ID NO:24 D227G、D261N 62 64 n.d. n.d. 0 Top 10
P P676 P676-4 SEQ ID NO:25 Y218D、D261N 240 0 n.d. n.d. 0 Top 10
Q P677 P677-14 SEQ ID NO:26 H188S、D261N 180 0 n.d. n.d. 0 Top 10
R P678 P678-11 SEQ ID NO:27 E182D、D261N 320 7 n.d. n.d. 0 Top 10
S P683 P683-6 SEQ ID NO:32 V36M、G210A 76 41 0 0 0 Stellar
T P684 P684-1 SEQ ID NO:33 V36M、Y218S 96 43 0 0 0 Stellar
U P685 P685-1 SEQ ID NO:34 V36M、Y218F 170 168 206 170 1 Stellar
V P686 P686-2 SEQ ID NO:35 V36M、H188S 142 0 0 0 0 Stellar
W P687 P687-2 SEQ ID NO:36 V36M、E182D 47 44 23 72 0 Stellar
X P688 P688-9 SEQ ID NO:37 V36M、D216G 72 36 0 0 0 Stellar
結果
在此檢定中,二個單一部位點突變體導致活性完全喪失(G205E及D208G)。在此檢定中,其餘8個突變體中僅有二個顯示減少之活性。突變體R211G在KAN100盤上生長亦慢得多,即使總群落數與較低KAN濃度下之生長相似。D261N不能夠在KAN100盤上生長,且在其他KAN盤上僅產生約一半之群落。先前已有報導,在吾等檢定中顯示完全活性的四種突變體(G210A、Y218S、Y218F、及V36M)賦予對康黴素減少之抗性(Blazquez (1991) Mol. Microbiol. 5:1511-1518;Kocabiyik (1992) Biochem. Biophys. Res. Commun. 185: 925-931;Kocabiyik (1992) FEMS Microbiol Lett 93: 199-202)。通過使用高拷貝質體及/或更強的細菌啟動子,這些NPT突變體可能以比先前的研究更高的水準表現。
建構具有D261N的雙重突變體以識別具有更低活性者。四種D261N雙重突變體係完全不良(completely deficient),而一個(E182D; D261N)係極度不良(在KAN25上之群落相對於卡本西林盤為2百分比,且在其他康黴素濃度下沒有生長)。有二種殖株僅在KAN25盤上產生群落但群落數與在卡本西林盤上之群落數相似(亦即,殖株N,(D216G; D261N)及殖株O (D227G; D261N)。一種突變似乎部分地補充D261N突變,允許在KAN100盤上之生長,縱然相對於在卡本西林盤上之生長(殖株K (H188L, D261N)效率降低。
四種殖株(S、T、U、及V)結合二種突變,該等殖株獨立地具有上述全部活性,但先前已有報導該等殖株具有降低之活性(Blazquez (1991) Mol. Microbiol. 5:1511-1518;Kocabiyik (1992) Biochem. Biophys. Res. Commun. 185: 925-931;Kocabiyik (1992) FEMS Microbiol Lett 93: 199-202)。兩種額外殖株結合V36M與上述未測試的突變。據報導,突變H188S降低對康黴素之抗性(Blazquez (1991) Mol. Microbiol. 5:1511-1518)同時據報導,突變E182D降低對G418而非康黴素之抗性(Yenofsky (1990) Proc. Natl. Acad. Sci. USA 87:3435-3439)。含有V36M;H188S突變之殖株係完全不良。三種殖株僅在KAN25盤上保留生長之能力,而兩種剩餘殖株僅在KAN100盤上顯示生長不良(殖株U (V36M; Y218F)及W(V36M及E182D)分別為1及0個群落)。這些結果表明,結合某些個別對NPT活性具有弱或沒有影響的突變令人驚訝地產生具有適用於多種應用之活性的雙重突變體NPT。 6.2 實例2 :突變體NPT 蛋白作為HEK293 細胞中之選擇標記
為了證明含有減弱之NPT基因匣之質體仍可賦予人類細胞對G418之抗性,將上述所建構之數種質體轉染到HEK293細胞中並經受群落形成檢定。依照製造商之說明,使用Qiagen’s HiSpeed maxiprep套組自含有卡本西林之200 ml LB-培養物中純化DNA。
對於轉染,將2E7 HEK293細胞接種到八個T-75燒瓶之40 ml生長培養基(DMEM+ 10% FBS+ 1xPenStrep)中並在37℃下培育。轉染係在15 ml Corning管中組裝並含有22 µg DNA+ 3 ml的OptiMEM(在37℃下)+ 66 µl Fugene-6轉染試劑。將轉染混合物短暫渦旋並在37℃之CO 2培育箱中培育15分鐘。添加生長培養基(2 ml)並將整個混合物添加至較早接種之HEK293細胞之燒瓶中。將燒瓶在37℃下培育。48小時後,所有燒瓶皆具有亮紅色螢光之細胞。將燒瓶用10 ml PBS、及1 ml TryPLE洗滌並在37℃下培育5分鐘。將細胞用10 ml生長培養基自燒瓶中洗滌出並隨後再接種到T150燒瓶之25 ml培養基中並在37℃下培育48小時。接著,像以前一樣從生長表面回收細胞並使用Countess細胞計數器使用重複讀數判定細胞密度。將連續稀釋液接種到重複150 mm盤中,其等具有Nuclon Delta表面於50 ml的選擇性生長培養基(DMEM+ 10% FBS+ 1xPenStrep+ 500 µg/ml遺傳黴素)中。將盤培育18天並將具有轉染質體P313、C、及S之盤染色及拍照。將來自其他轉染的盤另外培育13天,然後染色及拍照。對於染色,藉由移液小心移除培養基。將細胞用10 ml染色溶液(0.4%亞甲基藍於50%甲醇中)覆蓋並在室溫下培育10分鐘。藉由移液移除染色溶液並將細胞用5 ml 100%甲醇洗滌及空氣乾燥。使用Bio-Rad成像站對盤拍照。 結果
群落形成檢定之結果示於表2中。四種突變建構體以對具有野生型NPT基因之建構體P313所測量之頻率之5.5%至0.004%之頻率範圍產生G418抗性群落。
在此檢定中,群落形成頻率係NPT蛋白活性之間接測量。相較於轉染細胞群中之其他細胞,當在G418存在下生長時,表現更多的突變體NPT的細胞(無論是由於表現匣之更多的多重拷貝整合及/或由於匣之更有利的基因體整合位置)皆能夠存活以形成群落。此實例之結果證明,使用具有降低之活性的NPT突變體作為選擇標記可用以降低必需為穩定整合、高的轉殖基因表現之細胞而篩選多個群落之時間及精力。
在細菌中具有最減弱之表型的三個突變體建構體無法自所接種之1E7個細胞中產生G418抗性群落。雖然這些突變體蛋白可能在哺乳動物細胞中完全無活性,但表現足夠高水準之細胞亦可能會在選擇中存活。此類標記可與更有效地生成高拷貝數整合的方法(諸如反轉錄病毒感染或轉位)組合使用。 表2 :用突變體NPT 表現匣轉染的HEK 細胞之群落形成頻率
Figure 02_image001
6.3 實例3 :藉由轉位酶引入轉殖基因
此實例展示使用轉位酶活性將mCherry及NPT表現匣整合至人類細胞中。在此實例中使用如本文中所述之NPT突變體。
產生具有圖2中所繪描示之組態的三種不同建構體。該等建構體彼此不同之處在於其含有編碼野生型新黴素磷酸轉移酶、突變體1 (P725)新黴素磷酸轉移酶(V36M; G210A)、或突變體2 (P726)新黴素磷酸轉移酶(E182D; D261N)之核酸序列。在有或沒有Leap-In轉位酶RNA (ATUM Design, Newark, CA)之情況下將建構體電穿孔至人類VPC細胞(HEK293變體)中。將細胞接種在150 mm盤上,並在在新黴素選擇下培養2週。接著將細胞染色並測量群落形成。選擇來自未染色的不同盤中之8至12個群落並測量相對於內源性麩醯胺酸合成酶基因液滴式數位PCR (droplet digital PCR, ddPCR)的mCherry拷貝數。 結果
群落形成檢定之結果顯示於圖3中,其顯示NPT突變體藉由表現建構體之隨機整合而非藉由轉位來顯著減少群落形成之效率。圖4係用轉位酶產生的細胞穩定池之圖片,其中當相較於缺乏顏色的未轉形細胞時,藉由mCherry表現所產生之顏色在正常白光照明下很明顯。
圖5中顯示在所選之殖株中mCherry拷貝數之測量的結果。結果表明,相對於具有野生型NPT者,含有NPT突變體之細胞具有一致更高的連接mCherry轉殖基因之平均拷貝數。由具有野生型NPT的建構體之隨機整合所生成之大部分殖株幾乎沒有任何螢光,而由兩種突變體NPT基因之隨機整合所衍生之大部分殖株係發螢光的。這可解釋為意指突變體NPT基因必須以高於野生型NPT基因的水準表現才能在G418選擇期間存活,無論是通過拷貝數增加或通過在有利的基因體位置中之整合,且此導致mCherry轉殖基因之表現增加。
藉由轉位將轉殖基因酶整合至宿主染色體中比隨機整合更加有效,且即使使用野生型NPT基因亦導致更高的平均拷貝數。相對於使用野生型NPT基因,突變體NPT基因亦使拷貝數增加,其將在基因遞送或轉位效率差之情況(諸如在大的建構體之情況下)下提供優勢。 7. 實施例
本發明提供以下非限制性實施例。
在一組實施例中,所提供者係: A1.   一種具有新黴素磷酸轉移酶活性之非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶的胺基酸序列: (a)    在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (b)   在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (c)    在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (d)   在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (e)    在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (f)    在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 A2.   一種具有新黴素磷酸轉移酶活性之非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的SEQ ID NO:1的胺基酸序列: (a)    在SEQ ID NO:1之位置36及210處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置210處的該胺基酸取代係取代成丙胺酸; (b)   在SEQ ID NO:1之位置36及182處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置182處的該胺基酸取代係取代成天冬胺酸; (c)    在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的該胺基酸取代係取代成苯丙胺酸; (d)   在SEQ ID NO:1之位置216及261處的胺基酸取代,其中在SEQ ID NO:1之位置216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之位置261處的該胺基酸取代係取代成天冬醯胺酸; (e)    在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的該胺基酸取代係取代成絲胺酸;或 (f)    在SEQ ID NO:1之位置36及216處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置216處的該胺基酸取代係取代成甘胺酸。 A3.   如實施例A1所述之NPT,其中相較於野生型NPT,該非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。 A4.   如實施例A1或A3所述之NPT,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。 A5.   如實施例A1或A3所述之NPT,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。 A6.   如實施例A2所述之NPT,其中相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,該非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。 A7.   如實施例A1、A3、A4、或A5所述之NPT,其中如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼該非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。 A8.   如實施例A7所述之NPT,其中該細菌細胞係大腸桿菌。 A9.   如實施例A1、A3、A4、或A5所述之NPT,其中如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成。 A10. 如實施例A9所述之NPT,其中該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。 A11. 如實施例A1、A3、A4、或A5所述之NPT,其中用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在0.001%至75%之頻率範圍產生。 A12. 如實施例A2所述之NPT,其中如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼該非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼包含SEQ ID NO:1之胺基酸序列的野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。 A13. 如實施例A12所述之NPT,其中該細菌細胞係大腸桿菌。 A14. 如實施例A2所述之NPT,其中如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。 A15. 如實施例A14所述之NPT,其中該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。 A16. 如實施例A2所述之NPT,其中用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在5.5%至0.004%之頻率範圍產生,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。 A17. 如實施例A1、A3、A4、A5、或A7至A11中任一者所述之NPT,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸。 A18. 如實施例A1、A3、A4、A5、或A7至A11中任一者所述之NPT,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸。 A19. 如實施例A1、A3、A4、A5、或A7至A11中任一者所述之NPT,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸。 A20. 如實施例A1、A3、A4、A5、或A7至A11中任一者所述之NPT,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸。 A21. 如實施例A1、A3、A4、A5、或A7至A11中任一者所述之NPT,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸。 A22. 如實施例A1、A3、A4、A5、或A7至A11中任一者所述之NPT,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 A23. 如實施例A2或A12至A16中任一者所述之NPT,其中該非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。 A24. 如實施例A2或A12至A16中任一者所述之NPT,其中該非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。 A25. 如實施例A2或A12至A16中任一者所述之NPT,其中該非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。 A26. 如實施例A2或A12至A16中任一者所述之NPT,其中該非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。 A27. 如實施例A2或A12至A16中任一者所述之NPT,其中該非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。 A28. 如實施例A2或A12至A16中任一者所述之NPT,其中該非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。 A29. 一種核酸序列,其包含編碼如實施例A1至A28中任一者之非天然存在的NPT之第一核苷酸序列。 A30. 如實施例A29所述之核酸序列,其中該核酸序列進一步包含編碼第二蛋白或非編碼RNA之第二核苷酸序列。 A31. 如實施例A30所述之核酸序列,其中該第二核苷酸序列編碼第二蛋白且其中該第二蛋白係治療性蛋白。 A32. 如實施例A29至A31中任一者所述之核酸序列,其中該第一核苷酸序列包含SEQ ID NO:20、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:36、或SEQ ID NO:37之核苷酸序列。 A33. 一種載體,其包含如實施例A29至A32中任一者所述之核酸序列。 A34. 一種體外或離體宿主細胞,其包含如實施例A1至A28中任一者所述之非天然存在的NPT。 A35. 一種體外或離體宿主細胞,其包含如實施例A29至A32中任一者所述之核酸序列。 A36. 如實施例A35所述之細胞,其中該核酸序列係穩定地整合至該宿主細胞之該基因體中。 A37. 一種體外或離體宿主細胞,其包含如實施例A33所述之載體。 A38. 如實施例A34至A37中任一者所述之宿主細胞,其中該宿主細胞係細菌、酵母細胞、哺乳動物細胞、或植物細胞。 A39. 如實施例A34至A37中任一者所述之宿主細胞,其中該宿主細胞係來自人類細胞系。
在第二組的實施例中,所提供者係: B1.   一種體外或離體表現非天然存在的NPT之宿主細胞,其中該非天然存在的NPT相對於野生型新黴素磷酸轉移酶經減弱,且其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列: (a)    在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (b)   在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (c)    在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (d)   在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (e)    在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (f)    在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 B2.   一種體外或離體表現具有新黴素磷酸轉移酶活性的非天然存在的NPT之宿主細胞,其中該非天然存在的NPT相對於野生型新黴素磷酸轉移酶經減弱,且其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列: (a)    在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的該胺基酸取代係取代成丙胺酸; (b)   在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的該胺基酸取代係取代成天冬胺酸; (c)    在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成苯丙胺酸; (d)   在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的該胺基酸取代係取代成天冬醯胺酸; (e)    在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成絲胺酸;或 (f)    在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸。 B3.   如實施例B1所述之細胞,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。 B4.   如實施例B1所述之細胞,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%或、或至少75%同一的胺基酸序列。 B5.   如實施例B2所述之細胞,其中相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,該非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。 B6.   如實施例B1、B3、或B4所述之細胞,其中如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼該非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。 B7.   如實施例B6所述之細胞,其中該細菌細胞係大腸桿菌。 B8.   如實施例B1、B3、或B4所述之細胞,其中如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成。 B9.   如實施例B8所述之細胞,其中該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。 B10. 如實施例B1、B3、或B4所述之細胞,其中用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在0.001%至75%之頻率範圍產生。 B11. 如實施例B2或B5所述之細胞,如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼該非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼包含SEQ ID NO:1之胺基酸序列的野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。 B12. 如實施例B11所述之細胞,其中該細菌細胞係大腸桿菌。 B13. 如實施例B2或B5所述之細胞,其中如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。 B14. 如實施例B13所述之細胞,其中該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。 B15. 如實施例B2或B5所述之細胞,其中用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在5.5%至0.004%之頻率範圍產生,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。 B16. 如實施例B1、B3、B4、或B6至B10中任一者所述之細胞,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸。 B17. 如實施例B1、B3、B4、或B6至B10中任一者所述之細胞,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸。 B18. 如實施例B1、B3、B4、或B6至B10中任一者所述之細胞,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸。 B19. 如實施例B1、B3、B4、或B6至B10中任一者所述之細胞,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸。 B20. 如實施例B1、B3、B4、或B6至B10中任一者所述之細胞,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸。 B21. 如實施例B1、B3、B4、或B6至B10中任一者所述之細胞,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 B22. 如實施例B2、B5、或B11至B15中任一者所述之細胞,其中該非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。 B23. 如實施例B2、B5、或B11至B15中任一者所述之細胞,其中該非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。 B24. 如實施例B2、B5、或B11至B15中任一者所述之細胞,其中該非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。 B25. 如實施例B2、B5、或B11至B15中任一者所述之細胞,其中該非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。 B26. 如實施例B2、B5、或B11至B15中任一者所述之細胞,其中該非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。 B27. 如實施例B2、B5、或B11至B15中任一者所述之細胞,其中該非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。 B28. 如實施例B1至B27中任一者所述之細胞,其中該細胞進一步包含編碼第二蛋白或非編碼RNA之第二核酸序列。 B29. 如實施例B28所述之細胞,其中該第二核苷酸序列編碼第二蛋白且其中該第二蛋白係治療性蛋白。 B30. 如實施例B28所述之細胞,其中該第二核酸序列編碼非編碼RNA,且其中該非編碼RNA係shRNA、miRNA、反義RNA、用於Crispr核酸酶之引導RNA、催化RNA、核糖體RNA、或tRNA。 B31. 如實施例B1至B30中任一者所述之細胞,其中該宿主細胞係細菌、酵母細胞、哺乳動物細胞、植物細胞。
在第三組實施例中,所提供者係: C1.   一種用於自其中引入轉殖基因的宿主細胞群中選擇具有高的該轉殖基因之拷貝數及/或高的該轉殖基因之表現水準的細胞之方法,該方法包含: a) 將核酸序列引入至宿主細胞群中,該核酸序列包含: (i)第一核苷酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT);及 (ii)第二核苷酸序列,其包含該轉殖基因, 其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列: (1)  在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (2)  在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (3)  在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (4)  在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (5)  在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (6)  在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸;及 b) 自其中引入該核酸序列的該宿主細胞群中選擇在新黴素磷酸轉移酶受質存在下生長的細胞。 C2.   一種用於自其中引入轉殖基因的宿主細胞群中選擇具有高的該轉殖基因之拷貝數及/或高的該轉殖基因之表現水準的細胞之方法,該方法包含: a) 將核酸序列引入至宿主細胞群中,該核酸序列包含: (i)第一核苷酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT);及 (ii)第二核苷酸序列,其包含該轉殖基因, 其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列: (1) 在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的該胺基酸取代係取代成丙胺酸; (2) 在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的該胺基酸取代係取代成天冬胺酸; (3) 在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成苯丙胺酸; (4) 在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的該胺基酸取代係取代成天冬醯胺酸; (5) 在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218的該胺基酸取代係取代成絲胺酸;或 (6) 在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸;及 b) 自其中引入該核酸序列的該宿主細胞群中選擇在新黴素磷酸轉移酶受質存在下生長的細胞。 C3.   如實施例C1所述之方法,其中相較於野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。 C4.   如實施例C1或C3所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。 C5.   如實施例C1所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%或、或至少75%同一的胺基酸序列。 C6.   如實施例C2所述之方法,其中相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。 C7.   如實施例C1、C3、C4、或C5所述之方法,其中如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼該非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。 C8.   如實施例C7所述之方法,其中該細菌細胞係大腸桿菌。 C9.   如實施例C1、C3、C4、或C5所述之方法,其中如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成。 C10. 如實施例C9所述之方法,其中該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。 C11. 如實施例C1、C3、C4、或C5所述之方法,其中用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在0.001%至75%之頻率範圍產生。 C12. 如實施例C2或C6所述之方法,其中如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼該非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼包含SEQ ID NO:1之胺基酸序列的野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。 C13. 如實施例C12所述之方法,其中該細菌細胞係大腸桿菌。 C14. 如實施例C2或C6所述之方法,其中如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。 C15. 如實施例C14所述之方法,其中該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。 C16. 如實施例C2或C6所述之方法,其中用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在5.5%至0.004%之頻率範圍產生,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。 C17. 如實施例C1、C3、C4、C5、或C7至C11中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸。 C18. 如實施例C1、C3、C4、C5、或C7至C11中任一者所述之方法,其中該NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸。 C19. 如實施例C1、C3、C4、C5、或C7至C11中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸。 C20. 如實施例C1、C3、C4、C5、或C7至C11中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸。 C21. 如實施例C1、C3、C4、C5、或C7至C11中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸。 C22. 如實施例C1、C3、C4、C5、或C7至C11中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 C23. 如實施例C2或C6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。 C24. 如實施例C2或C6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。 C25. 如實施例C2或C6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。 C26. 如實施例C2或C6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。 C27. 如實施例C2或C6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。 C28. 如實施例C2或C6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。 C29. 如實施例C1至C28中任一者所述之方法,其中: (a)   相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之該轉殖基因之該拷貝數,所選之該等細胞包含2至1000倍更高的該轉殖基因之拷貝數,其中該第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及該轉殖基因的核酸序列轉染或轉形;及/或 (b)   相較於由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組的該轉殖基因之該表現水準,所選之該等細胞達到10至1000倍更高的該轉殖基因之表現水準,其中該第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及該轉殖基因的核酸序列轉染或轉形。 C30. 如實施例C1至C29中任一者所述之方法,其中該宿主細胞係細菌、酵母、哺乳動物、或植物細胞。 C31. 如實施例C1至C29中任一者所述之方法,其中該宿主細胞係人類細胞。 C32. 如實施例C1至C31中任一者所述之方法,其中該核酸序列係穩定地整合至所選之該細胞的該基因體中。 C33. 如實施例C1至C32中任一者所述之方法,其中所選之該細胞具有高的該轉殖基因之拷貝數。 C34. 如實施例C1至C33中任一者所述之方法,其中所選之該等細胞具有高的該轉殖基因之表現水準。 C35. 如實施例C1至C34中任一者所述之方法,其中所選之該等細胞已將5至100個拷貝的該轉殖基因整合至其基因體DNA中。 C36. 如實施例C1至C35中任一者所述之方法,其中所選之該等細胞已將1至5個拷貝的該轉殖基因整合至其基因體DNA中。 C37. 如實施例C1至C36中任一者所述之方法,其中該轉殖基因包含病毒基因。 C38. 如實施例C1至C36中任一者所述之方法,其中該轉殖基因包含人類生長因子基因。 C39. 如實施例C1至C38中任一者所述之方法,其中該新黴素磷酸轉移酶受質係新黴素、康黴素、或G418。 C40. 一種使用質體或轉位子之方法,該質體或轉位子包含編碼相較於野生型NPT具有減弱之新黴素磷酸轉移酶活性的非天然存在的NPT之核酸序列作為可選擇標記,該方法包含: a)  將包含編碼該非天然存在的NPT之該核酸序列的該質體或轉位子引入至宿主細胞中,其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列: (1) 在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (2) 在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (3) 在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (4) 在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (5) 在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (6) 在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸;及 b) 在新黴素磷酸轉移酶受質存在下使該細胞生長。 C41. 一種使用質體或轉位子之方法,該質體或轉位子包含編碼相較於野生型NPT具有減弱之新黴素磷酸轉移酶活性的非天然存在的NPT之核酸序列作為可選擇標記,該方法包含: a)  將包含編碼該非天然存在的NPT之該核酸序列的該質體或轉位子引入至宿主細胞中,其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列: (1) 在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的該胺基酸取代係取代成丙胺酸; (2) 在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的該胺基酸取代係取代成天冬胺酸; (3) 在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成苯丙胺酸; (4) 在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的該胺基酸取代係取代成天冬醯胺酸; (5) 在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成絲胺酸;或 (6) 在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸;及 b) 在新黴素磷酸轉移酶受質存在下使該細胞生長。 C42. 如實施例C40所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。 C43. 如實施例C40所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、最少70%、或至少75%同一的胺基酸序列。 C44. 如實施例C40、C42、或C43所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸。 C45. 如實施例C40、C42、或C43所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸。 C46. 如實施例C40、C42、或C43所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸。 C47. 如實施例C40、C42、或C43所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸。 C48. 如實施例C40、C42、或C43所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸。 C49. 如實施例C40、C42、或C43所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 C50. 如實施C41所述之方法,其中該非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。 C51. 如實施C41所述之方法,其中該非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。 C52. 如實施C41所述之方法,其中該非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。 C53. 如實施C41所述之方法,其中該非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。 C54. 如實施C41所述之方法,其中該非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。 C55. 如實施C41所述之方法,其中該非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。 C56. 如實施例C40至C55中任一者所述之方法,其中該宿主細胞係細菌、酵母、哺乳動物、或植物細胞。 C57. 如實施例C40至C55中任一者所述之方法,其中該宿主細胞係人類細胞。 C58. 如實施例C40至C55中任一者所述之方法,其中該質體或轉位子進一步包含編碼蛋白或非編碼RNA之第二核苷酸序列。 C59. 如實施例C58所述之方法,其中該蛋白係病毒蛋白。 C60. 如實施例C58所述之方法,其中該蛋白係治療性蛋白。 C61. 如實施例C40至C60中任一者所述之方法,其中該新黴素磷酸轉移酶受質係新黴素、康黴素、或G418。 C62. 如實施例C1至C39中任一者所述之方法,其中該轉殖基因編碼蛋白或非編碼RNA。 C63. 如實施例C62所述之方法,其中該轉殖基因編碼選自由下列所組成之群組的非編碼RNA:反義RNA、miRNA、shRNA、長非編碼RNA、催化RNA、核糖體RNA、tRNA、或用於CRISPR核酸酶之引導RNA。 C64. 如實施例C62所述之方法,其中該轉殖基因編碼蛋白且該蛋白係治療性蛋白或抗原。
在第四組實施例中,所提供者係: D1.   一種製作包含第二核苷酸序列之宿主細胞之方法,其包含: a)    將第一核酸序列引入至宿主細胞群中,該第一核酸序列包含(i)第一核苷酸序列,其編碼該非天然存在的NPT、及(ii)第二核苷酸序列,其包含編碼第二蛋白或非編碼RNA之轉殖基因,其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列: (1) 在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (2) 在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (3) 在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (4) 在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (5) 在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (6) 在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸; b)    在新黴素磷酸轉移酶受質存在下使該宿主細胞群生長以產生群落;及 c)    選擇在該新黴素磷酸轉移酶受質存在下生長的細胞群落。 D2.   一種製作包含第二核苷酸序列之宿主細胞之方法,其包含: a)    將(i)第一核酸序列及(ii)第二核酸序列共引入至宿主細胞群中,該第一核酸序列包含編碼該非天然存在的NPT之第一核苷酸序列,該第二核酸序列包含編碼第二蛋白或非編碼RNA之轉殖基因,其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列: (1) 在SEQ ID NO:1之位置36及210處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置210處的該胺基酸取代係取代成丙胺酸; (2) 在SEQ ID NO:1之位置36及182處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置182處的該胺基酸取代係取代成天冬胺酸; (3) 在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的該胺基酸取代係取代成苯丙胺酸; (4) 在SEQ ID NO:1之位置216及261處的胺基酸取代,其中在SEQ ID NO:1之位置216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之位置261處的該胺基酸取代係取代成天冬醯胺酸; (5) 在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的該胺基酸取代係取代成絲胺酸;或 (6) 在SEQ ID NO:1之位置36及216處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置216處的該胺基酸取代係取代成甘胺酸; b)    在新黴素磷酸轉移酶受質存在下使該宿主細胞群生長以產生群落;及 c)    選擇在該新黴素磷酸轉移酶受質存在下生長的細胞群落。 D3.   一種製作包含第二核苷酸序列之宿主細胞之方法,其包含: a)    在新黴素磷酸轉移酶受質存在下使宿主細胞群生長,其中該宿主細胞群包含第一核酸序列,其包含(i)第一核苷酸序列,其編碼該非天然存在的NPT、及(ii)第二核苷酸序列,其包含編碼第二蛋白或非編碼RNA之轉殖基因,其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶之胺基酸序列: (1) 在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (2) 在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (3) 在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (4) 在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (5) 在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (6) 在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸;及 b)    選擇在該新黴素磷酸轉移酶受質存在下生長的細胞群落。 D4.   一種製作包含第二核苷酸序列之宿主細胞之方法,其包含: a)    在該新黴素磷酸轉移酶受質存在下使宿主細胞群生長以產生群落,其中該宿主細胞群包含(i)第一核酸序列,其包含編碼該非天然存在的NPT之第一核苷酸序列、及(ii)第二核酸序列,其包含編碼第二蛋白或非編碼RNA之轉殖基因;其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列: (1) 在SEQ ID NO:1之位置36及210處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置210處的該胺基酸取代係取代成丙胺酸; (2) 在SEQ ID NO:1之位置36及182處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置182處的該胺基酸取代係取代成天冬胺酸; (3) 在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的該胺基酸取代係取代成苯丙胺酸; (4) 在SEQ ID NO:1之位置216及261處的胺基酸取代,其中在SEQ ID NO:1之位置216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之位置261處的該胺基酸取代係取代成天冬醯胺酸; (5) 在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的該胺基酸取代係取代成絲胺酸;或 (6) 在SEQ ID NO:1之位置36及216處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置216處的該胺基酸取代係取代成甘胺酸;及 b)    選擇在該新黴素磷酸轉移酶受質存在下生長的細胞群落。 D5.   如實施例D1或D3所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。 D6.   如實施例D1或D3所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。 D7.   如實施例D2所述之方法,其中相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。 D8.   如實施例D1、D3、D4、D5、或D6所述之方法,其中如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼該非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成。 D9.   如實施例D8所述之方法,其中該細菌細胞係大腸桿菌。 D10. 如實施例D1、D3、D4、D5、或D6所述之方法,其中如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成。 D11. 如實施例D10所述之方法,其中該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。 D12. 如實施例D1、D3、D4、D5、或D6所述之方法,其中用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在0.001%至75%之頻率範圍產生。 D13. 如實施例D2或D7所述之方法,其中如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼該非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。 D14. 如實施例D13所述之方法,其中該細菌細胞係大腸桿菌。 D15. 如實施例D2或D7所述之方法,其中如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。 D16. 如實施例D15所述之方法,其中該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。 D17. 如實施例D2或D7所述之方法,其中用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在5.5%至0.004%之頻率範圍產生,其中該野生型NPT包含SEQ ID NO:1之胺基酸序列。 D18. 如實施例D1、D3、D4、D5、D6、或D8至D12中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸。 D19. 如實施例D1、D3、D4、D5、D6、或D8至D12中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸。 D20. 如實施例D1、D3、D4、D5、D6、或D8至D12中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸。 D21. 如實施例D1、D3、D4、D5、D6、或D8至D12中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸。 D22. 如實施例D1、D3、D4、D5、D6、或D8至D12中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸。 D23. 如實施例D1、D3、D4、D5、D6、或D8至D12中任一者所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 D24. 如實施例D2、D7、或D13至D17中任一者所述之方法,其中該非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。 D25. 如實施例D2、D7、或D13至D17中任一者所述之方法,其中該非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。 D26. 如實施例D2、D7、或D13至D17中任一者所述之方法,其中該非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。 D27. 如實施例D2、D7、或D13至D17中任一者所述之方法,其中該非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。 D28. 如實施例D2、D7、或D13至D17中任一者所述之方法,其中該非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。 D29. 如實施例D2、D7、或D13至D17中任一者所述之方法,其中該非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。 D30. 如實施例D1至D29中任一者所述之方法,其中該宿主細胞群產生比用第二核酸序列轉染或轉形並在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群更少的群落,其中第二核酸序列包含編碼野生型NPT蛋白之第三核苷酸序列及該第二核苷酸序列。 D31. 如實施例D1至D30中任一者所述之方法,其中該宿主細胞係哺乳動物細胞。 D32. 如實施例D31所述之方法,其中該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。 D33. 如實施例D1至D29中任一者所述之方法,其中該等細胞係人類細胞。 D34. 如實施例D1至D33中任一者所述之方法,其進一步包含培養所選之該細胞群落。 D35. 如實施例D1至D34中任一者所述之方法,其中該新黴素磷酸轉移酶受質係新黴素、康黴素、或G418。 D36. 如實施例D1至D35中任一者所述之方法,其中該蛋白係治療性蛋白或抗原。 D37. 如實施例D1至D35中任一者所述之方法,其中該非編碼RNA係shRNA、miRNA、反義RNA、用於Crispr核酸酶之引導RNA、催化RNA、核糖體RNA、或tRNA。 D38. 一種宿主細胞,其藉由如實施例D1至D37中任一者所述之方法產生。
在第五組實施例中,所提供者係: E1.   一種用於製造表現治療性蛋白或酶的穩定細胞系之方法,其包含: a)  將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含: (i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶的胺基酸序列: (1)   在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (2)   在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (3)   在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (4)   在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (5)   在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (6)   在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸;及 (ii)第二核酸序列,其編碼治療性蛋白或酶; b) 自步驟(a)之該細胞群中選擇在G418存在下生長的細胞;及 c)  培養所選之該細胞以產生表現治療性蛋白或酶的穩定細胞系。 E2.   一種用於製造表現治療性蛋白或酶的穩定細胞系之方法,其包含: a)  將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含: (i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列: (1)   在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的該胺基酸取代係取代成丙胺酸; (2)   在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的該胺基酸取代係取代成天冬胺酸; (3)   在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成苯丙胺酸; (4)   在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的該胺基酸取代係取代成天冬醯胺酸; (5)   在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成絲胺酸;或 (6)   在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸;及 (ii)第二核酸序列,其編碼治療性蛋白或酶; b)   自步驟(a)之該細胞群中選擇在G418存在下生長的細胞;及 c)   培養所選之該細胞以產生表現治療性蛋白或酶的穩定細胞系。 E3.   如實施例E1所述之方法,其中相較於野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。 E4.   如實施例E1或E3所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。 E5.   如實施例E1或E3所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。 E6.   如實施例E2所述之方法,其中相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。 E7.   如實施例E1、E3、E4、或E5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸。 E8.   如實施例E1、E3、E4、或E5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸。 E9.   如實施例E1,E3、E4、或E5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸。 E10. 如實施例E1、E3、E4、或E5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸。 E11. 如實施例E1、E3、E4、或E5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸。 E12. 如實施例E1、E3、E4、或E5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 E13. 如實施例E2或E6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。 E14. 如實施例E2或E6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。 E15. 如實施例E2或E6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。 E16. 如實施例E2或E6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。 E17. 如實施例E2或E6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。 E18. 如實施例E2或E6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。 E19. 如實施例E1至E18中任一者所述之方法,其中該穩定細胞系係哺乳動物細胞系。 E20. 如實施例E1至E18中任一者所述之方法,其中該穩定細胞係人類細胞系。 E21. 如實施例E1至E18中任一者所述之方法,其中該穩定細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。 E22. 如實施例E1至E21中任一者所述之方法,其中該穩定細胞系表現該治療性蛋白。 E23. 如實施例E22所述之方法,其中該治療性蛋白係抗體或抗體片段。 E24. 如實施例E1至E21中任一者所述之方法,其中該穩定細胞表現該酶。 E25. 一種穩定細胞系,其藉由如實施例E1至E24中任一者所述之方法產生。
在第六組實施例中,所提供者係: F1.   一種製作病毒生產者細胞系之方法,其包含: a)  將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含: (i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶的胺基酸序列: (1)   在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (2)   在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (3)   在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (4)   在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (5)   在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (6)   在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸;及 (ii)第二核酸序列,其編碼一或多種病毒蛋白,其中該一或多種病毒蛋白包含殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合; b) 自在新黴素磷酸轉移酶受質存在下生長的該細胞群中選擇細胞;及 c)  繁殖所選之該細胞以產生病毒生產者細胞系。 F2.   一種製作病毒生產者細胞系之方法,其包含: a)  將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含: (i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列: (1)   在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的該胺基酸取代係取代成丙胺酸; (2)   在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的該胺基酸取代係取代成天冬胺酸; (3)   在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成苯丙胺酸; (4)在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的該胺基酸取代係取代成天冬醯胺酸; (5)在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成絲胺酸;或 (6)   在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸;及 (ii)第二核酸序列,其編碼一或多種病毒蛋白,其中該一或多種病毒蛋白包含殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合; b) 自在新黴素磷酸轉移酶受質存在下生長的該細胞群中選擇細胞;及 c)  繁殖所選之該細胞以產生病毒生產者細胞系。 F3.   如實施例F1所述之方法,其中相較於野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。 F4.   如實施例F1或F3所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。 F5.   如實施例F1或F3所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。 F6.   如實施例F2所述之方法,其中相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。 F7.   如實施例F1、F3、F4、或F5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸。 F8.   如實施例F1、F3、F4、或F5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸。 F9.   如實施例F1,F3、F4、或F5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸。 F10.  如實施例F1、F3、F4、或F5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸。 F11.  如實施例F1、F3、F4、或F5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸。 F12.  如實施例F1、F3、F4、或F5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 F13.  如實施例F2或F6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。 F14.  如實施例F2或F6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。 F15.  如實施例F2或F6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。 F16.  如實施例F2或F6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。 F17.  如實施例F2或F6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。 F18.  如實施例F2或F6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。 F19.  如實施例F1至F18中任一者所述之方法,其中該細胞系係哺乳動物細胞系。 F20.  如實施例F1至F18中任一者所述之方法,其中該細胞系係人類細胞系。 F21.  如實施例F1至F18中任一者所述之方法,其中該細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。 F22.  如實施例F1至F21中任一者所述之方法,其中該一或多種病毒蛋白包括AAV殼體蛋白。 F23.  如實施例F1至F21中任一者所述之方法,其中該一或多種病毒蛋白包括AAV殼體蛋白及AAV rep蛋白。 F24.  如實施例F1至F21中任一者所述之方法,其中該一或多種病毒蛋白包括套膜蛋白。 F25.  如實施例F1至F21中任一者所述之方法,其中該一或多種病毒蛋白包括腺病毒複製所需之腺病毒E1區蛋白。 F26.  如實施例F1至F21中任一者所述之方法,其中該一或多種病毒蛋白包括反轉錄病毒套膜蛋白。 F27.  如實施例F1至F21中任一者所述之方法,其中該一或多種病毒蛋白包括反轉錄病毒gag蛋白。 F28.  如實施例F1至F21中任一者所述之方法,其中該一或多種病毒蛋白包括反轉錄病毒反轉錄酶。 F29.  如實施例F1至F21中任一者所述之方法,其中該一或多種病毒蛋白包括反轉錄病毒套膜蛋白、gag蛋白、及反轉錄酶。 F30.  一種病毒生產者細胞系,其由如實施例F1至F29中任一者所述之方法所製作。 F31.  一種病毒生產者細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含: (i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶的胺基酸序列: (1) 在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (2) 在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (3) 在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (4) 在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (5) 在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (6) 在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸;及 (ii)第二核酸序列,其編碼一或多種病毒蛋白,其中該一或多種病毒蛋白包含殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合。 F32.  一種病毒生產者細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含: (i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列: (1) 在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的該胺基酸取代係取代成丙胺酸; (2) 在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的該胺基酸取代係取代成天冬胺酸; (3) 在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成苯丙胺酸; (4) 在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的該胺基酸取代係取代成天冬醯胺酸; (5) 在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成絲胺酸;或 (6) 在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸;及 (ii)第二核酸序列,其編碼一或多種病毒蛋白,其中該一或多種病毒蛋白包含殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合。 F33.  如實施例F31所述之病毒生產者細胞系,其中相較於野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。 F34.  如實施例F31或F33所述之病毒生產者細胞系,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。 F35.  如實施例F31或F33所述之病毒生產者細胞系,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。 F36.  如實施例F32所述之病毒生產者細胞系,其中相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。 F37.  如實施例F31、F33、F34、或F35所述之病毒生產者細胞系,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸。 F38.  如實施例F31、F33、F34、或F35所述之病毒生產者細胞系,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸。 F39.  如實施例F31、F33、F34、或F35所述之病毒生產者細胞系,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸。 F40.  如實施例F31、F33、F34、或F35所述之病毒生產者細胞系,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸。 F41.  如實施例F31、F33、F34、或F35所述之病毒生產者細胞系,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸。 F42.  如實施例F31、F33、F34、或F35所述之病毒生產者細胞系,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 F43.  如實施例F32或F36所述之病毒生產者細胞系,其中該非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。 F44.  如實施例F32或F36所述之病毒生產者細胞系,其中該非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。 F45.  如實施例F32或F36所述之病毒生產者細胞系,其中該非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。 F46.  如實施例F32或F36所述之病毒生產者細胞系,其中該非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。 F47.  如實施例F32或F36所述之病毒生產者細胞系,其中該非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。 F48.  如實施例F32或F36所述之病毒生產者細胞系,其中該非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。 F49.  如實施例F31至F48中任一者所述之病毒生產者細胞系,其中該細胞系係哺乳動物細胞系。 F50.  如實施例F31至F48中任一者所述之病毒生產者細胞系,其中該細胞系係人類細胞系。 F51.  如實施例F31至F48中任一者所述之病毒產生者細胞系,其中該細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。 F52.  如實施例F31至F51中任一者所述之病毒產生者細胞系,其中該一或多種病毒蛋白包括AAV殼體蛋白。 F53.  如實施例F31至F51中任一者所述之病毒生產者細胞系,其中該一或多種病毒蛋白包括AAV殼體蛋白及AAV rep蛋白。 F54.  如實施例F31至F51中任一者所述之病毒生產者細胞系,其中該一或多種病毒蛋白包括套膜蛋白。 F55.  如實施例F31至F51中任一者所述之病毒生產者細胞系,其中該一或多種病毒蛋白包括腺病毒複製所需之腺病毒E1區蛋白。 F56.  如實施例F31至F51中任一者所述之病毒產生者細胞系,其中該一或多種病毒蛋白包括反轉錄病毒套膜蛋白。 F57.  如實施例F31至F51中任一者所述之病毒產生者細胞系,其中該一或多種病毒蛋白包括反轉錄病毒gag蛋白。 F58.  如實施例F31至F51中任一者所述之病毒生產者細胞系,其中該一或多種病毒蛋白包括反轉錄病毒反轉錄酶。 F59.  如實施例F31至F51中任一者所述之病毒生產者細胞系,其中該一或多種病毒蛋白包括反轉錄病毒套膜蛋白、gag蛋白、及反轉錄酶。
在第七組實施例中,所提供者係: G1.   一種用於製造表現抗原的細胞系之方法,其包含: a)  將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含: (i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的新黴素NPT包含具有下列的野生型新黴素磷酸轉移酶的胺基酸序列: (1)   在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (2)   在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (3)   在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (4)   在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (5)   在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (6)   在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸;及 (ii)第二核酸序列,其編碼抗原; b) 自步驟(a)之該細胞群中選擇在G418存在下生長的細胞;及 c)  培養所選之該細胞以產生表現該抗原的細胞系。 G2.   一種用於製造表現抗原的細胞系之方法,其包含: a)  將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含: (i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的新黴素NPT包含具有下列的SEQ ID NO:1之胺基酸序列: (1)   在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的該胺基酸取代係取代成丙胺酸; (2)   在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的該胺基酸取代係取代成天冬胺酸; (3)   在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成苯丙胺酸; (4)   在SEQ ID NO:1之胺基酸殘基216及261處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的該胺基酸取代係取代成天冬醯胺酸; (5)   在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成絲胺酸;或 (6)   在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸;及 (ii)第二核酸序列,其編碼抗原; b) 自步驟(a)之該細胞群中選擇在G418存在下生長的細胞;及 c)  培養所選之該細胞以產生表現該抗原的細胞系。 G3.   如實施例G1所述之方法,其中相較於野生型NPT,該非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。 G4.   如實施例G1或G3所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。 G5.   如實施例G1所述之方法,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%或、或至少75%同一的胺基酸序列。 G6.   如實施例G2所述之方法,其中相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,該非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。 G7.   如實施例G1、G3、G4、或G5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸。 G8.   如實施例G1、G3、G4、或G5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸。 G9.   如實施例G1、G3、G4、或G5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸。 G10. 如實施例G1、G3、G4、或G5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸。 G11. 如實施例G1、G3、G4、或G5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸。 G12. 如實施例G1、G3、G4、或G5所述之方法,其中該非天然存在的NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 G13. 如實施例G2或G6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。 G14. 如實施例G2或G6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。 G15. 如實施例G2或G6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。 G16. 如實施例G2或G6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。 G17. 如實施例G2或G6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。 G18. 如實施例G2或G6所述之方法,其中該非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。 G19. 如實施例G1至G18中任一者所述之方法,其中該細胞系係哺乳動物細胞系。 G20. 如實施例G1至G18中任一者所述之方法,其中該細胞系係人類細胞系。 G21. 如實施例G1至G18中任一者所述之方法,其中該細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。 G22. 如實施例G1至G21中任一者所述之方法,其中該抗原係病毒抗原、細菌抗原、或真菌抗原。 G23. 如實施例G1至G21中任一者所述之方法,其中該抗原係癌症抗原。 G24. 一種抗原產生細胞系,其藉由如實施例G1至G23中任一者所述之方法所製作。 G25. 一種抗原產生細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含: (i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶的胺基酸序列: (1) 在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (2) 在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (3) 在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (4) 在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (5) 在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (6) 在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸;及 (ii)第二核酸序列,其編碼一或多種抗原。 G26. 一種抗原產生細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含: (i)第一核酸序列,其編碼具有新黴素磷酸轉移酶活性的非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的SEQ ID NO:1之胺基酸序列: (1) 在SEQ ID NO:1之胺基酸殘基36及210處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基210處的該胺基酸取代係取代成丙胺酸; (2) 在SEQ ID NO:1之胺基酸殘基36及182處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基182處的該胺基酸取代係取代成天冬胺酸; (3) 在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成苯丙胺酸; (4) 在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之胺基酸殘基261處的該胺基酸取代係取代成天冬醯胺酸; (5) 在SEQ ID NO:1之胺基酸殘基36及218處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基218處的該胺基酸取代係取代成絲胺酸;或 (6) 在SEQ ID NO:1之胺基酸殘基36及216處的胺基酸取代,其中在SEQ ID NO:1之胺基酸殘基36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之胺基酸殘基216處的該胺基酸取代係取代成甘胺酸;及 (ii)第二核酸序列,其編碼一或多種抗原。 G27. 如實施例G25所述之抗原產生細胞系,其中相較於野生型NPT,該非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。 G28. 如實施例G25或G27所述之抗原產生細胞系,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。 G29. 如實施例G25或G27所述之抗原產生細胞系,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少65%同一的胺基酸序列。 G30. 如實施例G26所述之抗原產生細胞系,其中相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,該非天然存在的NPT具有作為選擇性標記之減弱之新黴素磷酸轉移酶活性。 G31. 如實施例G25、G27、G28、或G29所述之抗原產生細胞系,其中該NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸。 G32. 如實施例G25、G27、G28、或G29所述之抗原產生細胞系,其中該NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸。 G33. 如實施例G25、G27、G28、或G29所述之抗原產生細胞系,其中該NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸。 G34. 如實施例G25、G27、G28、或G29所述之抗原產生細胞系,其中該NPT包含在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸。 G35. 如實施例G25、G27、G28、或G29所述之抗原產生細胞系,其中該NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸。 G36. 如實施例G25、G27、G28、或G29所述之抗原產生細胞系,其中該NPT包含在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。 G37. 如實施例G26或G30所述之抗原產生細胞系,其中該非天然存在的NPT包含SEQ ID NO:38之胺基酸序列(V36M, G210A)。 G38. 如實施例G26或G30所述之抗原產生細胞系,其中該非天然存在的NPT包含SEQ ID NO:39之胺基酸序列(V36M, E182D)。 G39. 如實施例G26或G30所述之抗原產生細胞系,其中該非天然存在的NPT包含SEQ ID NO:40之胺基酸序列(V36M, Y218F)。 G40. 如實施例G26或G30所述之抗原產生細胞系,其中該非天然存在的NPT包含SEQ ID NO:41之胺基酸序列(D216G, D261N)。 G41. 如實施例G26或G30所述之抗原產生細胞系,其中該非天然存在的NPT包含SEQ ID NO:42之胺基酸序列(V36M, Y218S)。 G42. 如實施例G26或G30所述之抗原產生細胞系,其中該非天然存在的NPT包含SEQ ID NO:43之胺基酸序列(V36M, D216G)。 G43. 如實施例G25至G42中任一者所述之抗原產生細胞系,其中該細胞系係哺乳動物細胞系。 G44. 如實施例G25至G42中任一者所述之抗原產生細胞系,其中該細胞系係人類細胞系。 G45. 如實施例G25至G42中任一者所述之抗原產生細胞系,其中該細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。 G46. 如實施例G25至G45中任一者所述之抗原產生細胞系,其中該一或多種抗原係病毒抗原、細菌抗原、或真菌抗原。 G47. 如實施例G25至G45中任一者所述之抗原產生細胞系,其中該一或多種抗原係癌症抗原。
在第八組實施例中,所提供者係: H1.   一種可選擇標記構件,當引入至細菌細胞中時用於賦予對康黴素之抗性、及當引入至哺乳動物細胞中時用於賦予對G418之抗性。 H2.   如實施例H1所述之可選擇標記構件,其包含SEQ ID NO:20之核酸序列。 H3.   如實施例H1所述之可選擇標記構件,其包含SEQ ID NO:32之核酸序列。 H4.   如實施例H1所述之可選擇標記構件,其包含SEQ ID NO:33之核酸序列。 H5.   如實施例H1所述之可選擇標記構件,其包含SEQ ID NO:34之核酸序列。 H6.   如實施例H1所述之可選擇標記構件,其包含SEQ ID NO:36之核酸序列。 H7.   如實施例H1所述之可選擇標記構件,其包含SEQ ID NO:37之核酸序列。 H8.   一種用於製造生產者細胞系之方法,其包含: a)  將細菌或哺乳動物細胞用表現載體轉形以製作轉形細胞,該表現載體包含編碼一或多種病毒蛋白之核酸序列及若該轉形細胞係細菌細胞則用於在康黴素存在下生長的構件及若該轉形細胞係哺乳動物細胞則用於在G418存在下生長的構件;及 b) 在康黴素或G418存在下培養該轉形細胞以獲得生產者細胞系,其中該生產者細胞系表現一或多種來自AAV、腺病毒、反轉錄病毒、慢病毒、單純疱疹病毒、痘瘡病毒、或桿狀病毒的病毒蛋白。 H9.   一種用於選擇具有外源性核酸序列之穩定染色體整合的細胞之方法,其包含: a)  將真核細胞群用外源性核酸序列轉形,該外源性核酸序列包含用於在G418存在下生長的構件; b) 在G418存在下培養經轉形之該細胞群,以產生能夠在G418存在下生長的經轉形細胞群落;及 c)  自步驟(b)中所產生之群落中選擇細胞以獲得具有該外源性核酸之穩定染色體整合的細胞。 H10. 如實施例H9所述之方法,其中該外源性核酸序列進一步包含轉殖基因,且所選之該細胞表現該轉殖基因。 H11. 如實施例H9所述之方法,其中該外源性核酸序列破壞對所選之該細胞為內源性的基因之表現。 H12. 一種用於選擇具有穩定游離基因體的哺乳動物細胞之方法,其包含: a)  將哺乳動物細胞用質體轉形,該質體包含用於在G418存在下生長的構件; b) 在G418存在下培養經轉形之該細胞群,以產生能夠在G418存在下生長的經轉形細胞群落;及 c)  自步驟(b)中所產生之群落中選擇細胞以獲得具有包含該質體之穩定游離基因體的細胞。 H13. 如實施例H12之方法,其中該質體進一步包含EBNA1 OriP核酸序列且所選之該細胞表現EBNA1。 H14. 一種用於選擇暫時表現轉殖基因之哺乳動物細胞之方法,其包含: a)  將編碼轉殖基因之核酸及用於在G418存在下生長的構件引入至哺乳動物細胞群中; b) 在G418存在下培養該哺乳動物細胞群48至72小時;及 c)  自在G418存在下生長的經培養之該哺乳動物細胞群中選擇哺乳動物細胞,其中所選之該哺乳動物細胞暫時表現該轉殖基因。 H15. 如實施例H14之方法,其中該轉殖基因包含編碼Crispr核酸內切酶或Crispr引導RNA之核酸序列。 H16. 如實施例H8至H15所述之方法,其中該構件係編碼非天然存在的新黴素磷酸轉移酶之核苷酸序列,該非天然存在的新黴素磷酸轉移酶包含選自SEQ ID NO:38、39、40、41、42、或43之群組的胺基酸序列。 8. 本文中所揭示之序列
下表提供指派至本文中所述之序列之序列識別號之總結:
SEQ ID NO 序列類型 描述
1 胺基酸 野生型型式新黴素磷酸轉移酶(胺基糖苷磷酸轉移酶3’-IIa)
2 核酸 P313 WT載體
3 核酸 人類延長因子α啟動子
4 核酸 mCherry編碼區
5 核酸 SV40多腺苷酸化信號
6 核酸 野生型新黴素磷酸轉移酶
7 核酸 小鼠磷酸甘油酯激酶啟動子
8 核酸 大腸桿菌laczya啟動子
9 核酸 單純疱疹病毒多腺苷酸化信號
10 核酸 安比西林抗性基因
11 核酸 pUC57質體複製起點
12 核酸 P614 Neo ORF
13 核酸 P615 Neo ORF
14 核酸 P616 Neo ORF
15 核酸 P623 Neo ORF
16 核酸 P624 Neo ORF
17 核酸 P626 Neo ORF
18 胺基酸 圖6A至圖6B中所描繪之APH(6)-Ia
19 胺基酸 圖6A至圖6B中所描繪之APH(6)-Ib
20 核酸 P629 Neo ORF (D216G D261N) NPT
21 核酸 P641 Neo ORF
22 核酸 P642 Neo ORF
23 核酸 P643 Neo ORF
24 核酸 P675 Neo ORF
25 核酸 P676 Neo ORF
26 核酸 P677 Neo ORF
27 核酸 P678 Neo ORF
28 核酸 P679 Neo ORF
29 核酸 P680 Neo ORF
30 核酸 P681 Neo ORF
31 核酸 P682 Neo ORF
32 核酸 P683 Neo ORF, (V36M G210A) NPT
33 核酸 P684 Neo ORF, (V36M Y218S) NPT
34 核酸 P685 Neo ORF, (V36M Y218F) NPT
35 核酸 P686 Neo ORF
36 核酸 P687 Neo ORF, (V36M E182D) NPT
37 核酸 P688 Neo ORF, (V36M D216G) NPT
38 胺基酸 P683 (V36M G210A) NPT
39 胺基酸 P687 (V36M E182D) NPT
40 胺基酸 P685 (V36M Y218F) NPT
41 胺基酸 P629 (D216G D261N) NPT
42 胺基酸 P684 (V36M Y218S) NPT
43 胺基酸 P688 (V36M D216G) NPT
44 胺基酸 野生型NPT (GenBank No. U00004)
45 胺基酸 圖6A至圖6B中所描繪之APH(6)-Ic
46 胺基酸 圖6A至圖6B中所描繪之APH(6)-Id
47 胺基酸 圖6A至圖6B中所描繪之APH(3’)-IIIa
48 胺基酸 圖6A至圖6B中所描繪之APH(3’)-VIIa
49 胺基酸 圖6A至圖6B中所描繪之APH(3’)-VIa
50 胺基酸 圖6A至圖6B中所描繪之APH(3’)-IVa
51 胺基酸 圖6A至圖6B中所描繪之APH(3’)-Ia
52 胺基酸 圖6A至圖6B中所描繪之APH(3’)-Ic
53 胺基酸 圖6A至圖6B中所描繪之APH(3’)-Ib
54 胺基酸 圖6A至圖6B中所描繪之APH(3’)-IIa
55 胺基酸 圖6A至圖6B中所描繪之APH(3’)-Vb
56 胺基酸 圖6A至圖6B中所描繪之APH(3’)-Va
57 胺基酸 圖6A至圖6B中所描繪之APH(3’)-Vc
58 胺基酸 圖6A至圖6B中所描繪之APH(3”)-Ia
59 胺基酸 圖6A至圖6B中所描繪之APH(3”)-Ib
60 胺基酸 圖6A至圖6B中所描繪之APH(2”)-Ia
61 胺基酸 圖6A至圖6B中所描繪之APH(4)-Ib
62 胺基酸 圖6A至圖6B中所描繪之APH(4)-Ia
>SEQ ID NO:1,野生型新黴素磷酸轉移酶蛋白之蛋白序列 MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAVFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVADRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF >SEQ ID NO:2,P313 WT載體 taactataacggtcctaaggtagcgaacctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctgcggccaattcagtcgataactataacggtcctaaggtagcgatttaaatacgcgctctcttaaggtagccgtgaggctccggtgcccgtcagtgggcagagcgcacatcgcccacagtccccgagaagttggggggaggggtcggcaattgaaccggtgcctagagaaggtggcgcggggtaaactgggaaagtgatgtcgtgtactggctccgcctttttcccgagggtgggggagaaccgtatataagtgcagtagtcgccgtgaacgttctttttcgcaacgggtttgccgccagaacacaggtaagtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgccttgaattacttccacgcccctggctgcagtacgtgattcttgatcccgagcttcgggttggaagtgggtgggagagttcgaggccttgcgcttaaggagccccttcgcctcgtgcttgagttgaggcctggcctgggcgctggggccgccgcgtgcgaatctggtggcaccttcgcgcctgtctcgctgctttcgataagtctctagccatttaaaatttttgatgacctgctgcgacgctttttttctggcaagatagtcttgtaaatgcgggccaagatctgcacactggtatttcggtttttggggccgcgggcggcgacggggcccgtgcgtcccagcgctcatgttcggcgaggcggggcctgcgagcgcggccaccgagaatcggacgggggtagtctcaagctggccggcctgctctggtgcctggcctcgcgccgccgtgtatcgccccgccctgggcggcaaggctggcccggtcggcaccagttgcgtgagcggaaagatggccgcttcccggccctgctgcagggagctcaaaatggaggacgcggcgctcgggagagcgggcgggtgagtcacccacacaaaggaaaagggcctttccgtcctcagccgtcgcttcatgtgactccacggagtaccgggcgccgtccaggcacctcgattagttctcgagcttttggagtacgtcgtctttaggttggggggaggggttttatgcgatggagtttccccacactgagtgggtggagactgaagttaggccagcttggcacttgatgtaattctccttggaatttgccctttttgagtttggatcttggttcattctcaagcctcagacagtggttcaaagtttttttcttccatttcaggtgtcgtgaggcgcgccgccaccatggtgagcaagggcgaggaggataacatggccatcatcaaggagttcatgcgcttcaaggtgcacatggagggctccgtgaacggccacgagttcgagatcgagggcgagggcgagggccgcccctacgagggcacccagaccgccaagctgaaggtgaccaagggtggccccctgcccttcgcctgggacatcctgtcccctcagttcatgtacggctccaaggcctacgtgaagcaccccgccgacatccccgactacttgaagctgtccttccccgagggcttcaagtgggagcgcgtgatgaacttcgaggacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcgagttcatctacaaggtgaagctgcgcggcaccaacttcccctccgacggccccgtaatgcagaagaagaccatgggctgggaggcctcctccgagcggatgtaccccgaggacggcgccctgaagggcgagatcaagcagaggctgaagctgaaggacggcggccactacgacgctgaggtcaagaccacctacaaggccaagaagcccgtgcagctgcccggcgcctacaacgtcaacatcaagttggacatcacctcccacaacgaggactacaccatcgtggaacagtacgaacgcgccgagggccgccactccaccggcggcatggacgagctgtacaagtagtctagagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtatggctgattatgatcgcggccgcattctaccgggtaggggaggcgcttttcccaaggcagtctggagcatgcgctttagcagccccgctgggcacttggcgctacacaagtggcctctggcctcgcacacattccacatccaccggtaggcgccaaccggctccgttctttggtggccccttcgcgccaccttctactcctcccctagtcaggaagttcccccccgccccgcagctcgcgtcgtgcaggacgtgacaaatggaagtagcacgtctcactagtctcgtgcagatggacagcaccgctgagcaatggaagcgggtaggcctttggggcagcggccaatagcagctttgctccttcgctttctgggctcagaggctgggaaggggtgggtccgggggcgggctcaggggcgggctcaggggcggggcgggcgcccgaaggtcctccggaggcccggcattctgcacgcttcaaaagcgcacgtctgccgcgctgttctcctcttcctcatctccgggcctttcgacctagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctgccaccatgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctgagggggaggctaactgaaacacggaaggagacaataccggaaggaacccgcgctatgacggcaataaaaagacagaataaaacgcacggtgttgggtcgtttgttcataaacgcggggttcggtcccagggctggcactctgtcgataccccaccgagaccccattggggccaatacgcccgcgtttcttccttttccccaccccaccccccaagttcgggtgaaggcccagggctcgcagccaacgtcggggcggcaggccctgccatagcctagggataacagggtaatggcgcgggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcaggtggcaaacagctattatgggtattatgggtgacgtcaagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccctttcgtctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacgacggccagtgaattcacatgt >SEQ ID NO:3,人類延長因子α啟動子 cgtgaggctccggtgcccgtcagtgggcagagcgcacatcgcccacagtccccgagaagttggggggaggggtcggcaattgaaccggtgcctagagaaggtggcgcggggtaaactgggaaagtgatgtcgtgtactggctccgcctttttcccgagggtgggggagaaccgtatataagtgcagtagtcgccgtgaacgttctttttcgcaacgggtttgccgccagaacacaggtaagtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgccttgaattacttccacgcccctggctgcagtacgtgattcttgatcccgagcttcgggttggaagtgggtgggagagttcgaggccttgcgcttaaggagccccttcgcctcgtgcttgagttgaggcctggcctgggcgctggggccgccgcgtgcgaatctggtggcaccttcgcgcctgtctcgctgctttcgataagtctctagccatttaaaatttttgatgacctgctgcgacgctttttttctggcaagatagtcttgtaaatgcgggccaagatctgcacactggtatttcggtttttggggccgcgggcggcgacggggcccgtgcgtcccagcgctcatgttcggcgaggcggggcctgcgagcgcggccaccgagaatcggacgggggtagtctcaagctggccggcctgctctggtgcctggcctcgcgccgccgtgtatcgccccgccctgggcggcaaggctggcccggtcggcaccagttgcgtgagcggaaagatggccgcttcccggccctgctgcagggagctcaaaatggaggacgcggcgctcgggagagcgggcgggtgagtcacccacacaaaggaaaagggcctttccgtcctcagccgtcgcttcatgtgactccacggagtaccgggcgccgtccaggcacctcgattagttctcgagcttttggagtacgtcgtctttaggttggggggaggggttttatgcgatggagtttccccacactgagtgggtggagactgaagttaggccagcttggcacttgatgtaattctccttggaatttgccctttttgagtttggatcttggttcattctcaagcctcagacagtggttcaaagtttttttcttccatttcaggtgtcgtga >SEQ ID NO:4,mCherry編碼區 Atggtgagcaagggcgaggaggataacatggccatcatcaaggagttcatgcgcttcaaggtgcacatggagggctccgtgaacggccacgagttcgagatcgagggcgagggcgagggccgcccctacgagggcacccagaccgccaagctgaaggtgaccaagggtggccccctgcccttcgcctgggacatcctgtcccctcagttcatgtacggctccaaggcctacgtgaagcaccccgccgacatccccgactacttgaagctgtccttccccgagggcttcaagtgggagcgcgtgatgaacttcgaggacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcgagttcatctacaaggtgaagctgcgcggcaccaacttcccctccgacggccccgtaatgcagaagaagaccatgggctgggaggcctcctccgagcggatgtaccccgaggacggcgccctgaagggcgagatcaagcagaggctgaagctgaaggacggcggccactacgacgctgaggtcaagaccacctacaaggccaagaagcccgtgcagctgcccggcgcctacaacgtcaacatcaagttggacatcacctcccacaacgaggactacaccatcgtggaacagtacgaacgcgccgagggccgccactccaccggcggcatggacgagctgtacaagtag >SEQ ID NO:5,SV40多腺苷酸化信號 Gatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtatggctgattatgatc >SEQ ID NO:6,編碼野生型新黴素磷酸轉移酶蛋白之DNA Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:7,小鼠磷酸甘油酯激酶啟動子 Attctaccgggtaggggaggcgcttttcccaaggcagtctggagcatgcgctttagcagccccgctgggcacttggcgctacacaagtggcctctggcctcgcacacattccacatccaccggtaggcgccaaccggctccgttctttggtggccccttcgcgccaccttctactcctcccctagtcaggaagttcccccccgccccgcagctcgcgtcgtgcaggacgtgacaaatggaagtagcacgtctcactagtctcgtgcagatggacagcaccgctgagcaatggaagcgggtaggcctttggggcagcggccaatagcagctttgctccttcgctttctgggctcagaggctgggaaggggtgggtccgggggcgggctcaggggcgggctc >SEQ ID NO:8,大腸桿菌laczya啟動子 Agcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtgg >SEQ ID NO:9,單純疱疹病毒多腺苷酸化信號 Gggggaggctaactgaaacacggaaggagacaataccggaaggaacccgcgctatgacggcaataaaaagacagaataaaacgcacggtgttgggtcgtttgttcataaacgcggggttcggtcccagggctggcactctgtcgataccccaccgagaccccattggggccaatacgcccgcgtttcttccttttccccaccccaccccccaagttcgggtgaaggcccagggctcgcagccaacgtcggggcggcaggccctgccatagcc >SEQ ID NO:10,安比西林抗性基因 ACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATC >SEQ ID NO:11,pUC57質體複製起點 Cgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatccttt >SEQ ID NO:12, P614 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgaccctgggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:13, P615 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggcggcctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:14, P616 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga >SEQ ID NO:15, P623 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgaccctgggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga >SEQ ID NO:16, P624 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggcggcctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga >SEQ ID NO:17, P626 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcggcgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga >SEQ ID NO:18,APH(6)-Ia胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) >SEQ ID NO:19,APH(6)-Ib胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) >SEQ ID NO:20, P629 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcgggccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga >SEQ ID NO:21, P641 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctgagttcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:22, P642 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcggctgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:23, P643 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcgggccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:24, P675 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtggcattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga >SEQ ID NO:25, P676 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgcgatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga >SEQ ID NO:26, P677 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgaccagcggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga >SEQ ID NO:27, P678 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgatgatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga >SEQ ID NO:28, P679 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtgcccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:29, P680 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgcagccaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:30, P681 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctttcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:31, P682 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:32, P683 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtgcccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:33, P684 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgcagccaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:34, P685 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctttcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:35, P686 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgaccagcggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:36, P687 Neo ORF Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgatgatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:37, P688 Neo ORF atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcgggccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga >SEQ ID NO:38, P683 (V36M G210A) MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAMFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCARLGVADRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF > SEQ ID NO:39, P687 (V36M E182D) MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAMFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGDDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVADRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF >SEQ ID NO:40, P685 (V36M Y218F) MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAMFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVADRFQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF > SEQ ID NO:41, P629 (D216G D261N) MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAVFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVAGRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLNEFF > SEQ ID NO:42, P684 (V36M Y218S) MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAMFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVADRSQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF >SEQ ID NO:43, P688 (V36M D216G) MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAMFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVAGRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF >SEQ ID NO:44 MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAVFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKARMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVADRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF >SEQ ID NO:45,APH(6)-Ic胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) >SEQ ID NO:46,APH(6)-Id胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) >SEQ ID NO:47,APH(3’)-IIIa胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:48,APH(3’)-VIIa胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:49,APH(3’)-VIa胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:50,APH(3’)-IVa胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:51,APH(3’)-Ia胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:52,APH(3’)-Ic胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:53,APH(3’)-Ib胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:54,APH(3’)-IIa胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:55,APH(3’)-Vb胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:56,APH(3’)-Va胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:57,APH(3’)-Vc胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:58,APH(3”)-Ia胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:59,APH(3”)-Ib胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:60,APH(2”)-Ia胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:61,APH(4)-Ib胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列) SEQ ID NO:62,APH(4)-Ib胺基酸序列 (參見圖 6A至圖 6B之胺基酸序列)
本發明之特定實施例係描述於本文中。在閱讀前述說明時,所揭示實施例之變化對於所屬技術領域中具有通常知識者而言可變得顯而易見,且預期該等技術領域中具有通常知識者可視情況採用此類變化。因此,本發明意欲以除本文中具體描述以外之方式實施本發明,且本發明包括適用法律允許之所附申請專利範圍中所記載之標的之所有修改及等效物。此外,除非本文中另有指示或以其他方式與上下文明顯矛盾,否則呈其所有可能變型之上述元件之任何組合均由本發明所涵蓋。已經描述本發明之數個實施例。儘管如此,將理解的是,在不偏離本發明之精神及範圍下,可做出各種修改。因此,實例章節中之描述旨在說明但不限制申請專利範圍中所述之發明範圍。
本文中所引用之所有參考文獻以全文引用方式及為所有目的併入本文中,以達到如同為所有目的而將具體並個別指示的各個別出版物或專利或專利申請案以引用方式全文併入之相同的程度。
前述發明內容,以及下文中本申請案之具體實施例的實施方式當結合隨附圖式閱讀時可更有利理解。然而應理解的是,本申請案並不受限於圖式中所示確切實施例。 圖1 繪示如本文中所述之代表性表現載體(質體P313)。 圖2 描繪建構體,其包括轉位子元件(「Leapin left」及「Leapin Right」)、人類延長因子α啟動子(「EF1α」)、具有多腺苷酸化信號之mCherry編碼區(「pA」)、NPT編碼區(「Kan/NEO」)、及複製起點(「pMB1 Ori」)。 圖3 描繪本文中所述之群落形成檢定的結果。 圖4 展示相較於不具顏色的未轉形細胞(最左邊的管子),在用表現mCherry及NPT蛋白(標示「NEO」)的建構體轉形的穩定HEK293細胞池中之mCherry表現。 圖5 顯示用編碼野生型NPT之建構體P724、編碼NPT突變#1 (V36M; G210A)之P725、或編碼NPT突變體#2 (V36M; E182D)之P726轉形的HEK293細胞中之轉殖基因(mCherry)拷貝數之圖表,且其中該建構體包括(+)或不包括(-)轉位酶元件。 圖6A 圖6B 顯示調適自Shaw et al., Microbiological Reviews 57: 138-163 (1993)之胺基糖苷磷酸轉移酶之比對。 6A 至圖6B中所描繪之序列已被指派為SEQ ID NO:18、19及45至62。
<![CDATA[<110> 美商健生生物科技公司(JANSSEN BIOTECH, INC.)]]>
          <![CDATA[<120> 用於改良磷酸轉移酶之材料及方法]]>
          <![CDATA[<130> 14620-686-228/JBI6523WOPCT1]]>
          <![CDATA[<140> TW 111114949]]>
          <![CDATA[<141> 2022-04-20]]>
          <![CDATA[<150> 63/177]]>,739 
          <![CDATA[<151> 2021-04-21]]>
          <![CDATA[<150> 63/177,744 ]]>
          <![CDATA[<151> 2021-04-21]]>
          <![CDATA[<150> 63/177,746 ]]>
          <![CDATA[<151> 2021-04-21]]>
          <![CDATA[<150> 63/177,749 ]]>
          <![CDATA[<151> 2021-04-21]]>
          <![CDATA[<150> 63/177,753]]>
          <![CDATA[<151> 2021-04-21]]>
          <![CDATA[<150> 63/177,759 ]]>
          <![CDATA[<151> 2021-04-21]]>
          <![CDATA[<150> 63/177,764 ]]>
          <![CDATA[<151> 2021-04-21]]>
          <![CDATA[<150> 63/177,767 ]]>
          <![CDATA[<151> 2021-04-21]]>
          <![CDATA[<160> 62    ]]>
          <![CDATA[<170> PatentIn第3.5版]]>
          <![CDATA[<210> 1]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                新黴素磷酸轉移酶蛋白序列
          <![CDATA[<400> 1]]>
          Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 
          1               5                   10                  15      
          Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 
                      20                  25                  30          
          Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 
                  35                  40                  45              
          Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 
              50                  55                  60                  
          Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 
          65                  70                  75                  80  
          Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 
                          85                  90                  95      
          Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 
                      100                 105                 110         
          Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 
                  115                 120                 125             
          Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 
              130                 135                 140                 
          Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 
          145                 150                 155                 160 
          Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 
                          165                 170                 175     
          Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 
          225                 230                 235                 240 
          Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 
                          245                 250                 255     
          Tyr Arg Leu Leu Asp Glu Phe Phe 
                      260                 
          <![CDATA[<210> 2]]>
          <![CDATA[<211> 6963]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 2]]>
          taactataac ggtcctaagg tagcgaacct gcaggcagct gcgcgctcgc tcgctcactg       60
          aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg tcgcccggcc tcagtgagcg      120
          agcgagcgcg cagagaggga gtggccaact ccatcactag gggttcctgc ggccaattca      180
          gtcgataact ataacggtcc taaggtagcg atttaaatac gcgctctctt aaggtagccg      240
          tgaggctccg gtgcccgtca gtgggcagag cgcacatcgc ccacagtccc cgagaagttg      300
          gggggagggg tcggcaattg aaccggtgcc tagagaaggt ggcgcggggt aaactgggaa      360
          agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggggagaacc gtatataagt      420
          gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac acaggtaagt      480
          gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt atggcccttg cgtgccttga      540
          attacttcca cgcccctggc tgcagtacgt gattcttgat cccgagcttc gggttggaag      600
          tgggtgggag agttcgaggc cttgcgctta aggagcccct tcgcctcgtg cttgagttga      660
          ggcctggcct gggcgctggg gccgccgcgt gcgaatctgg tggcaccttc gcgcctgtct      720
          cgctgctttc gataagtctc tagccattta aaatttttga tgacctgctg cgacgctttt      780
          tttctggcaa gatagtcttg taaatgcggg ccaagatctg cacactggta tttcggtttt      840
          tggggccgcg ggcggcgacg gggcccgtgc gtcccagcgc tcatgttcgg cgaggcgggg      900
          cctgcgagcg cggccaccga gaatcggacg ggggtagtct caagctggcc ggcctgctct      960
          ggtgcctggc ctcgcgccgc cgtgtatcgc cccgccctgg gcggcaaggc tggcccggtc     1020
          ggcaccagtt gcgtgagcgg aaagatggcc gcttcccggc cctgctgcag ggagctcaaa     1080
          atggaggacg cggcgctcgg gagagcgggc gggtgagtca cccacacaaa ggaaaagggc     1140
          ctttccgtcc tcagccgtcg cttcatgtga ctccacggag taccgggcgc cgtccaggca     1200
          cctcgattag ttctcgagct tttggagtac gtcgtcttta ggttgggggg aggggtttta     1260
          tgcgatggag tttccccaca ctgagtgggt ggagactgaa gttaggccag cttggcactt     1320
          gatgtaattc tccttggaat ttgccctttt tgagtttgga tcttggttca ttctcaagcc     1380
          tcagacagtg gttcaaagtt tttttcttcc atttcaggtg tcgtgaggcg cgccgccacc     1440
          atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag     1500
          gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc     1560
          cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc     1620
          ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac     1680
          cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc     1740
          gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac     1800
          ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta     1860
          atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc     1920
          gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct     1980
          gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc     2040
          aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa     2100
          cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta gtctagagat     2160
          acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg     2220
          aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca     2280
          acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa     2340
          gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tcgcggccgc attctaccgg     2400
          gtaggggagg cgcttttccc aaggcagtct ggagcatgcg ctttagcagc cccgctgggc     2460
          acttggcgct acacaagtgg cctctggcct cgcacacatt ccacatccac cggtaggcgc     2520
          caaccggctc cgttctttgg tggccccttc gcgccacctt ctactcctcc cctagtcagg     2580
          aagttccccc ccgccccgca gctcgcgtcg tgcaggacgt gacaaatgga agtagcacgt     2640
          ctcactagtc tcgtgcagat ggacagcacc gctgagcaat ggaagcgggt aggcctttgg     2700
          ggcagcggcc aatagcagct ttgctccttc gctttctggg ctcagaggct gggaaggggt     2760
          gggtccgggg gcgggctcag gggcgggctc aggggcgggg cgggcgcccg aaggtcctcc     2820
          ggaggcccgg cattctgcac gcttcaaaag cgcacgtctg ccgcgctgtt ctcctcttcc     2880
          tcatctccgg gcctttcgac ctagcgggca gtgagcgcaa cgcaattaat gtgagttagc     2940
          tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa     3000
          ttgtgagcgg ataacaattt cacacaggaa acagctgcca ccatgattga acaagatgga     3060
          ttgcacgcag gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa     3120
          cagacaatcg gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt     3180
          ctttttgtca agaccgacct gtccggtgcc ctgaatgaac tgcaagacga ggcagcgcgg     3240
          ctatcgtggc tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa     3300
          gcgggaaggg actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac     3360
          cttgctcctg ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt     3420
          gatccggcta cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact     3480
          cggatggaag ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg     3540
          ccagccgaac tgttcgccag gctcaaggcg agcatgcccg acggcgagga tctcgtcgtg     3600
          acccatggcg atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc     3660
          atcgactgtg gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt     3720
          gatattgctg aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc     3780
          gccgctcccg attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgaggg     3840
          ggaggctaac tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa     3900
          taaaaagaca gaataaaacg cacggtgttg ggtcgtttgt tcataaacgc ggggttcggt     3960
          cccagggctg gcactctgtc gataccccac cgagacccca ttggggccaa tacgcccgcg     4020
          tttcttcctt ttccccaccc caccccccaa gttcgggtga aggcccaggg ctcgcagcca     4080
          acgtcggggc ggcaggccct gccatagcct agggataaca gggtaatggc gcgggccgca     4140
          ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc     4200
          cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg     4260
          agcgcgcagc tgcctgcagg tggcaaacag ctattatggg tattatgggt gacgtcaagc     4320
          ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca     4380
          cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa     4440
          ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag     4500
          ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc     4560
          gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct     4620
          cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg     4680
          tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc     4740
          cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga     4800
          aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct     4860
          cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg     4920
          gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag     4980
          ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat     5040
          cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac     5100
          aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac     5160
          tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc     5220
          ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt     5280
          tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc     5340
          ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg     5400
          agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca     5460
          atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca     5520
          cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag     5580
          ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac     5640
          ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc     5700
          agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct     5760
          agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc     5820
          gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg     5880
          cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc     5940
          gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat     6000
          tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag     6060
          tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat     6120
          aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg     6180
          cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca     6240
          cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga     6300
          aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc     6360
          ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata     6420
          tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg     6480
          ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc     6540
          acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag     6600
          ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag     6660
          ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc atcagagcag     6720
          attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa     6780
          taccgcatca ggcgccattc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg     6840
          cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt     6900
          tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcaca     6960
          tgt                                                                   6963
          <![CDATA[<210> 3]]>
          <![CDATA[<211> 1188]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 3]]>
          cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt       60
          tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg      120
          aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa      180
          gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa      240
          gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt      300
          gaattacttc cacgcccctg gctgcagtac gtgattcttg atcccgagct tcgggttgga      360
          agtgggtggg agagttcgag gccttgcgct taaggagccc cttcgcctcg tgcttgagtt      420
          gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt      480
          ctcgctgctt tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt      540
          tttttctggc aagatagtct tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt      600
          tttggggccg cgggcggcga cggggcccgt gcgtcccagc gctcatgttc ggcgaggcgg      660
          ggcctgcgag cgcggccacc gagaatcgga cgggggtagt ctcaagctgg ccggcctgct      720
          ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg      780
          tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagctca      840
          aaatggagga cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg      900
          gcctttccgt cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg      960
          cacctcgatt agttctcgag cttttggagt acgtcgtctt taggttgggg ggaggggttt     1020
          tatgcgatgg agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac     1080
          ttgatgtaat tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag     1140
          cctcagacag tggttcaaag tttttttctt ccatttcagg tgtcgtga                  1188
          <![CDATA[<210> 4]]>
          <![CDATA[<211> 711]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 4]]>
          atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag       60
          gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc      120
          cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc      180
          ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac      240
          cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc      300
          gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac      360
          ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta      420
          atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc      480
          gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct      540
          gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc      600
          aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa      660
          cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta g               711
          <![CDATA[<210> 5]]>
          <![CDATA[<211> 225]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 5]]>
          gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt       60
          gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta      120
          acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt      180
          aaagcaagta aaacctctac aaatgtggta tggctgatta tgatc                      225
          <![CDATA[<21]]>0> 6]]&gt;
          <br/>&lt;![CDATA[&lt;211&gt; 795]]&gt;
          <br/>&lt;![CDATA[&lt;212&gt; DNA]]&gt;
          <br/>&lt;![CDATA[&lt;213&gt; 未知]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;220&gt;]]&gt;
          <br/>&lt;![CDATA[&lt;223&gt; 未知之描述:]]&gt;
          <br/><![CDATA[      新黴素磷酸轉移酶DNA序列
          <![CDATA[<400> 6]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 7]]>
          <![CDATA[<211]]>> 400]]&gt;
          <br/>&lt;![CDATA[&lt;212&gt; DNA]]&gt;
          <br/>&lt;![CDATA[&lt;213&gt; 人工]]&gt;<![CDATA[序列(Artificial Sequence)
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 7]]>
          attctaccgg gtaggggagg cgcttttccc aaggcagtct ggagcatgcg ctttagcagc       60
          cccgctgggc acttggcgct acacaagtgg cctctggcct cgcacacatt ccacatccac      120
          cggtaggcgc caaccggctc cgttctttgg tggccccttc gcgccacctt ctactcctcc      180
          cctagtcagg aagttccccc ccgccccgca gctcgcgtcg tgcaggacgt gacaaatgga      240
          agtagcacgt ctcactagtc tcgtgcagat ggacagcacc gctgagcaat ggaagcgggt      300
          aggcctttgg ggcagcggcc aatagcagct ttgctccttc gctttctggg ctcagaggct      360
          gggaaggggt gggtccgggg gcgggctcag gggcgggctc                            400
          <![CDATA[<210> 8]]>
          <![CDATA[<211> 96]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                寡核苷酸
          <![CDATA[<400> 8]]>
          agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg caccccaggc       60
          tttacacttt atgcttccgg ctcgtatgtt gtgtgg                                 96
          <![CDATA[<210> 9]]>
          <![CDATA[<211> 272]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 9]]>
          gggggaggct aactgaaaca cggaaggaga caataccgga aggaacccgc gctatgacgg       60
          caataaaaag acagaataaa acgcacggtg ttgggtcgtt tgttcataaa cgcggggttc      120
          ggtcccaggg ctggcactct gtcgataccc caccgagacc ccattggggc caatacgccc      180
          gcgtttcttc cttttcccca ccccaccccc caagttcggg tgaaggccca gggctcgcag      240
          ccaacgtcgg ggcggcaggc cctgccatag cc                                    272
          <![CDATA[<210> 10]]>
          <![CDATA[<211> 1119]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 10]]>
          acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa       60
          ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt      120
          gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg      180
          ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg      240
          gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg      300
          agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag      360
          caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca      420
          gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg      480
          agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc      540
          gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg      600
          aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg      660
          ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac      720
          tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg      780
          tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg      840
          gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact      900
          atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa      960
          ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt     1020
          aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag     1080
          ttttcgttcc actgagcgtc agaccccgta gaaaagatc                            1119
          <![CDATA[<210> 11]]>
          <![CDATA[<211> 615]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 11]]>
          cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg       60
          ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg      120
          aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt      180
          tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt      240
          gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg      300
          cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact      360
          ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt      420
          cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct      480
          gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac      540
          cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc      600
          tcaagaagat ccttt                                                       615
          <![CDATA[<210> 12]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 12]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac cctgggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 13]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 13]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc ggcctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 14]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 14]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          aacgagttct tctga                                                       795
          <![CDATA[<210> 15]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 15]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac cctgggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          aacgagttct tctga                                                       795
          <![CDATA[<210> 16]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 16]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc ggcctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          aacgagttct tctga                                                       795
          <![CDATA[<210> 17]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 17]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcggc gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          aacgagttct tctga                                                       795
          <![CDATA[<210> 18]]>
          <![CDATA[<211> 307]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(6)-Ia胺基酸序列
          <![CDATA[<400> 18]]>
          Met Ser Ser Ser Asp His Ile His Val Pro Asp Gly Leu Ala Glu Ser 
          1               5                   10                  15      
          Tyr Ser Arg Ser Gly Gly Glu Glu Gly Arg Ala Trp Ile Ala Gly Leu 
                      20                  25                  30          
          Pro Ala Leu Val Ala Arg Cys Val Asp Arg Trp Glu Leu Lys Arg Asp 
                  35                  40                  45              
          Gly Gly Val Arg Ser Gly Glu Ala Ser Leu Val Val Pro Val Leu Arg 
              50                  55                  60                  
          Ala Asp Gly Thr Arg Ala Ala Leu Lys Leu Gln Met Pro Arg Glu Glu 
          65                  70                  75                  80  
          Thr Thr Ala Ala Leu Ile Gly Leu Arg Ala Trp Gly Gly Asp Gly Met 
                          85                  90                  95      
          Val Arg Leu Leu Asp His Asp Glu Glu Ser Ser Thr Met Leu Leu Glu 
                      100                 105                 110         
          Arg Leu Asp Gly Ser Arg Thr Leu Ala Ser Val Glu Asp Asp Asp Glu 
                  115                 120                 125             
          Ala Met Gly Val Leu Ala Gly Leu Leu Asn Arg Leu His Ser Val Pro 
              130                 135                 140                 
          Ala Pro Pro Gly Leu Arg Gly Leu Gly Glu Ile Ala Gly Ala Met Val 
          145                 150                 155                 160 
          Glu Glu Val Pro Ser Ala Val Asp Ser Leu Ala Asp Pro Glu Asp Arg 
                          165                 170                 175     
          Ser Arg Leu Arg Gly Trp Ala Ser Ala Val Ala Glu Leu Val Gly Glu 
                      180                 185                 190         
          Pro Gly Asp Arg Val Leu His Trp Asp Leu His Tyr Glu Asn Val Leu 
                  195                 200                 205             
          Ala Ala Glu Arg Glu Pro Trp Leu Ala Ile Asp Pro Glu Pro Leu Val 
              210                 215                 220                 
          Gly Asp Pro Gly Phe Asp Leu Trp Pro Ala Leu Asp Thr Gly Trp Glu 
          225                 230                 235                 240 
          Arg Ile Glu Ala Thr Gly Asp Ala Arg Arg Val Val Arg Arg Arg Phe 
                          245                 250                 255     
          Asp Leu Leu Thr Glu Ser Leu Glu Leu Asp Arg Gly Arg Ala Ala Gly 
                      260                 265                 270         
          Trp Thr Leu Ala Arg Leu Leu Gln Asn Thr Leu Trp Asp Ile Glu Asp 
                  275                 280                 285             
          Gly Leu Thr Ala Ile Ala Pro Ser Gln Ile Ala Val Ala Glu Ala Leu 
              290                 295                 300                 
          Ala Lys Pro 
          305         
          <![CDATA[<210> 19]]>
          <![CDATA[<211> 307]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(6)-Ib胺基酸序列
          <![CDATA[<400> 19]]>
          Met Ser Thr Ser Lys Leu Val Glu Ile Pro Glu Pro Leu Ala Ala Ser 
          1               5                   10                  15      
          Tyr Ala Arg Ala Phe Gly Glu Glu Gly Gln Ala Trp Ile Ala Ala Leu 
                      20                  25                  30          
          Pro Ala Leu Val Glu Glu Leu Leu Asp Arg Trp Glu Leu Thr Ala Asp 
                  35                  40                  45              
          Gly Ala Ser Ala Ser Gly Glu Ala Ser Leu Val Leu Pro Val Leu Arg 
              50                  55                  60                  
          Thr Asp Gly Thr Arg Ala Val Leu Lys Leu Gln Leu Pro Arg Glu Glu 
          65                  70                  75                  80  
          Thr Ser Ala Ala Ile Thr Gly Leu Arg Thr Trp Asn Gly His Gly Val 
                          85                  90                  95      
          Val Arg Leu Leu Asp His Asp Pro Arg Ser Ser Thr Met Leu Leu Glu 
                      100                 105                 110         
          Arg Leu Asp Ala Ser Arg Thr Leu Ala Ser Val Glu Asp Asp Asp Ala 
                  115                 120                 125             
          Ala Met Gly Val Leu Ala Gly Leu Leu Ala Arg Leu Val Ser Val Pro 
              130                 135                 140                 
          Ala Pro Arg Gly Leu Arg Gly Leu Gly Asp Ile Ala Gly Ala Met Leu 
          145                 150                 155                 160 
          Glu Glu Val Pro Arg Ala Val Ala Ala Leu Ala Asp Pro Ala Asp Arg 
                          165                 170                 175     
          Arg Leu Leu Asn Asp Trp Ala Ser Ala Val Ala Glu Leu Val Gly Glu 
                      180                 185                 190         
          Pro Gly Asp Arg Met Leu His Trp Asp Leu His Tyr Gly Asn Val Leu 
                  195                 200                 205             
          Ala Ala Glu Arg Glu Pro Trp Leu Ala Ile Asp Pro Glu Pro Leu Ala 
              210                 215                 220                 
          Gly Asp Pro Gly Phe Asp Leu Trp Pro Ala Leu Asp Ser Arg Trp Asp 
          225                 230                 235                 240 
          Asp Ile Val Ala Gln Arg Asp Val Val Arg Val Val Arg Arg Arg Phe 
                          245                 250                 255     
          Asp Leu Leu Thr Glu Val Leu Gly Leu Asp Arg Ala Arg Ala Ala Gly 
                      260                 265                 270         
          Trp Thr Tyr Gly Arg Leu Leu Gln Asn Ala Leu Trp Asp Ile Glu Asp 
                  275                 280                 285             
          Gly Ser Ala Ala Leu Asp Pro Ala Ala Val Thr Leu Ala Gln Ala Leu 
              290                 295                 300                 
          Arg Gly His 
          305         
          <![CDATA[<210> 20]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 20]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcgggccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          aacgagttct tctga                                                       795
          <![CDATA[<210> 21]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 21]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctgagttcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 22]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 22]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cggctgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 23]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 23]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcgggccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 24]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 24]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtgg cattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          aacgagttct tctga                                                       795
          <![CDATA[<210> 25]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 25]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg cgatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          aacgagttct tctga                                                       795
          <![CDATA[<210> 26]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 26]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac cagcggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          aacgagttct tctga                                                       795
          <![CDATA[<210> 27]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 27]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgatgatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          aacgagttct tctga                                                       795
          <![CDATA[<210> 28]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 28]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtgcc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 29]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 29]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg cagccaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 30]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 30]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctttcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 31]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 31]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 32]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 32]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtgcc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 33]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 33]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg cagccaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 34]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 34]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctttcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 35]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 35]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac cagcggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 36]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 36]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgatgatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 37]]>
          <![CDATA[<211> 795]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>(Artificial Sequence)
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多核苷酸
          <![CDATA[<400> 37]]>
          atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc       60
          ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca      120
          gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg      180
          caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg      240
          ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag      300
          gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg      360
          cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc      420
          atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa      480
          gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac      540
          ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat      600
          ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcgggccg ctatcaggac      660
          atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc      720
          ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt      780
          gacgagttct tctga                                                       795
          <![CDATA[<210> 38]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多肽
          <![CDATA[<400> 38]]>
          Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 
          1               5                   10                  15      
          Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 
                      20                  25                  30          
          Asp Ala Ala Met Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 
                  35                  40                  45              
          Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 
              50                  55                  60                  
          Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 
          65                  70                  75                  80  
          Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 
                          85                  90                  95      
          Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 
                      100                 105                 110         
          Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 
                  115                 120                 125             
          Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 
              130                 135                 140                 
          Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 
          145                 150                 155                 160 
          Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 
                          165                 170                 175     
          Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Cys Ala Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 
          225                 230                 235                 240 
          Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 
                          245                 250                 255     
          Tyr Arg Leu Leu Asp Glu Phe Phe 
                      260                 
          <![CDATA[<210> 39]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多肽
          <![CDATA[<400> 39]]>
          Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 
          1               5                   10                  15      
          Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 
                      20                  25                  30          
          Asp Ala Ala Met Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 
                  35                  40                  45              
          Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 
              50                  55                  60                  
          Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 
          65                  70                  75                  80  
          Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 
                          85                  90                  95      
          Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 
                      100                 105                 110         
          Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 
                  115                 120                 125             
          Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 
              130                 135                 140                 
          Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 
          145                 150                 155                 160 
          Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 
                          165                 170                 175     
          Ser Met Pro Asp Gly Asp Asp Leu Val Val Thr His Gly Asp Ala Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 
          225                 230                 235                 240 
          Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 
                          245                 250                 255     
          Tyr Arg Leu Leu Asp Glu Phe Phe 
                      260                 
          <![CDATA[<210> 40]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多肽
          <![CDATA[<400> 40]]>
          Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 
          1               5                   10                  15      
          Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 
                      20                  25                  30          
          Asp Ala Ala Met Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 
                  35                  40                  45              
          Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 
              50                  55                  60                  
          Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 
          65                  70                  75                  80  
          Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 
                          85                  90                  95      
          Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 
                      100                 105                 110         
          Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 
                  115                 120                 125             
          Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 
              130                 135                 140                 
          Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 
          145                 150                 155                 160 
          Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 
                          165                 170                 175     
          Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Cys Gly Arg Leu Gly Val Ala Asp Arg Phe Gln Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 
          225                 230                 235                 240 
          Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 
                          245                 250                 255     
          Tyr Arg Leu Leu Asp Glu Phe Phe 
                      260                 
          <![CDATA[<210> 41]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多肽
          <![CDATA[<400> 41]]>
          Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 
          1               5                   10                  15      
          Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 
                      20                  25                  30          
          Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 
                  35                  40                  45              
          Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 
              50                  55                  60                  
          Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 
          65                  70                  75                  80  
          Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 
                          85                  90                  95      
          Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 
                      100                 105                 110         
          Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 
                  115                 120                 125             
          Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 
              130                 135                 140                 
          Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 
          145                 150                 155                 160 
          Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 
                          165                 170                 175     
          Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Cys Gly Arg Leu Gly Val Ala Gly Arg Tyr Gln Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 
          225                 230                 235                 240 
          Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 
                          245                 250                 255     
          Tyr Arg Leu Leu Asn Glu Phe Phe 
                      260                 
          <![CDATA[<210> 42]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多肽
          <![CDATA[<400> 42]]>
          Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 
          1               5                   10                  15      
          Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 
                      20                  25                  30          
          Asp Ala Ala Met Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 
                  35                  40                  45              
          Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 
              50                  55                  60                  
          Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 
          65                  70                  75                  80  
          Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 
                          85                  90                  95      
          Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 
                      100                 105                 110         
          Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 
                  115                 120                 125             
          Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 
              130                 135                 140                 
          Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 
          145                 150                 155                 160 
          Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 
                          165                 170                 175     
          Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Cys Gly Arg Leu Gly Val Ala Asp Arg Ser Gln Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 
          225                 230                 235                 240 
          Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 
                          245                 250                 255     
          Tyr Arg Leu Leu Asp Glu Phe Phe 
                      260                 
          <![CDATA[<210> 43]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列(Artificial Sequence)]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列說明:合成]]>
                多肽
          <![CDATA[<400> 43]]>
          Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 
          1               5                   10                  15      
          Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 
                      20                  25                  30          
          Asp Ala Ala Met Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 
                  35                  40                  45              
          Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 
              50                  55                  60                  
          Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 
          65                  70                  75                  80  
          Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 
                          85                  90                  95      
          Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 
                      100                 105                 110         
          Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 
                  115                 120                 125             
          Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 
              130                 135                 140                 
          Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 
          145                 150                 155                 160 
          Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 
                          165                 170                 175     
          Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Cys Gly Arg Leu Gly Val Ala Gly Arg Tyr Gln Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 
          225                 230                 235                 240 
          Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 
                          245                 250                 255     
          Tyr Arg Leu Leu Asp Glu Phe Phe 
                      260                 
          <![CDATA[<210> 44]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                新黴素磷酸轉移酶胺基酸序列
          <![CDATA[<400> 44]]>
          Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 
          1               5                   10                  15      
          Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 
                      20                  25                  30          
          Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 
                  35                  40                  45              
          Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 
              50                  55                  60                  
          Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 
          65                  70                  75                  80  
          Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 
                          85                  90                  95      
          Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 
                      100                 105                 110         
          Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 
                  115                 120                 125             
          Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 
              130                 135                 140                 
          Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 
          145                 150                 155                 160 
          Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 
                          165                 170                 175     
          Arg Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 
          225                 230                 235                 240 
          Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 
                          245                 250                 255     
          Tyr Arg Leu Leu Asp Glu Phe Phe 
                      260                 
          <![CDATA[<210> 45]]>
          <![CDATA[<211> 266]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(6)-Ic胺基酸序列
          <![CDATA[<400> 45]]>
          Met Glu Arg Trp Arg Leu Leu Arg Asp Gly Glu Leu Leu Thr Thr His 
          1               5                   10                  15      
          Ser Ser Trp Ile Leu Pro Val Arg Gln Gly Asp Met Pro Ala Met Leu 
                      20                  25                  30          
          Lys Val Ala Arg Ile Pro Asp Glu Glu Ala Gly Tyr Arg Leu Leu Thr 
                  35                  40                  45              
          Trp Trp Asp Gly Gln Gly Ala Ala Arg Val Phe Ala Ser Ala Ala Gly 
              50                  55                  60                  
          Ala Leu Leu Met Glu Arg Ala Ser Gly Ala Gly Asp Leu Ala Gln Ile 
          65                  70                  75                  80  
          Ala Trp Ser Gly Gln Asp Asp Glu Ala Cys Arg Ile Leu Cys Asp Thr 
                          85                  90                  95      
          Ala Ala Arg Leu His Ala Pro Arg Ser Gly Pro Pro Pro Asp Leu His 
                      100                 105                 110         
          Pro Leu Gln Glu Trp Phe Gln Pro Leu Phe Arg Leu Ala Ala Glu His 
                  115                 120                 125             
          Ala Ala Leu Ala Pro Ala Ala Ser Val Ala Arg Gln Leu Leu Ala Ala 
              130                 135                 140                 
          Pro Arg Glu Val Cys Pro Leu His Gly Asp Leu His His Glu Asn Val 
          145                 150                 155                 160 
          Leu Asp Phe Gly Asp Arg Gly Trp Leu Ala Ile Asp Pro His Gly Leu 
                          165                 170                 175     
          Leu Gly Glu Arg Thr Phe Asp Tyr Ala Asn Ile Phe Thr Asn Pro Asp 
                      180                 185                 190         
          Leu Ser Asp Pro Gly Arg Pro Leu Ala Ile Leu Pro Gly Arg Leu Glu 
                  195                 200                 205             
          Ala Arg Leu Ser Ile Val Val Ala Thr Thr Gly Phe Glu Pro Glu Arg 
              210                 215                 220                 
          Leu Leu Arg Trp Ile Ile Ala Trp Thr Gly Leu Ser Ala Ala Trp Phe 
          225                 230                 235                 240 
          Ile Gly Asp Gly Asp Gly Glu Gly Glu Gly Ala Ala Ile Asp Leu Ala 
                          245                 250                 255     
          Val Asn Ala Met Ala Arg Arg Leu Leu Asp 
                      260                 265     
          <![CDATA[<210> 46]]>
          <![CDATA[<211> 277]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(6)-Id胺基酸序列
          <![CDATA[<400> 46]]>
          Met Phe Met Pro Pro Val Phe Pro Ala His Trp His Val Ser Gln Pro 
          1               5                   10                  15      
          Val Leu Ile Ala Asp Thr Phe Ser Ser Leu Val Trp Lys Val Ser Leu 
                      20                  25                  30          
          Pro Asp Gly Thr Pro Ala Ile Val Lys Gly Leu Lys Pro Ile Glu Asp 
                  35                  40                  45              
          Ile Ala Asp Glu Leu Arg Gly Ala Asp Tyr Leu Val Trp Arg Asn Gly 
              50                  55                  60                  
          Arg Gly Ala Val Arg Leu Leu Gly Arg Glu Asn Asn Leu Met Leu Leu 
          65                  70                  75                  80  
          Glu Tyr Ala Gly Glu Arg Met Leu Ser His Ile Val Ala Glu His Gly 
                          85                  90                  95      
          Asp Tyr Gln Ala Thr Glu Ile Ala Ala Glu Leu Met Ala Lys Leu Tyr 
                      100                 105                 110         
          Ala Ala Ser Glu Glu Pro Leu Pro Ser Ala Leu Leu Pro Ile Arg Asp 
                  115                 120                 125             
          Arg Phe Ala Ala Leu Phe Gln Arg Ala Arg Asp Asp Gln Asn Ala Gly 
              130                 135                 140                 
          Cys Gln Thr Asp Tyr Val His Ala Ala Ile Ile Ala Asp Gln Met Met 
          145                 150                 155                 160 
          Ser Asn Ala Ser Glu Leu Arg Gly Leu His Gly Asp Leu His His Glu 
                          165                 170                 175     
          Asn Ile Met Phe Ser Ser Arg Gly Trp Leu Val Ile Asp Pro Val Gly 
                      180                 185                 190         
          Leu Val Gly Glu Val Gly Phe Gly Ala Ala Asn Met Phe Tyr Asp Pro 
                  195                 200                 205             
          Ala Asp Arg Asp Asp Leu Cys Leu Asp Pro Arg Arg Ile Ala Gln Met 
              210                 215                 220                 
          Ala Asp Ala Phe Ser Arg Ala Leu Asp Val Asp Pro Arg Arg Leu Leu 
          225                 230                 235                 240 
          Asp Gln Ala Tyr Ala Tyr Gly Cys Leu Ser Ala Ala Trp Asn Ala Asp 
                          245                 250                 255     
          Gly Glu Glu Glu Gln Arg Asp Leu Ala Ile Ala Ala Ala Ile Lys Gln 
                      260                 265                 270         
          Val Arg Gln Thr Ser 
                  275         
          <![CDATA[<210> 47]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-IIIa胺基酸序列
          <![CDATA[<400> 47]]>
          Met Ala Lys Met Arg Ile Ser Pro Glu Leu Lys Lys Leu Ile Glu Lys 
          1               5                   10                  15      
          Tyr Arg Cys Val Lys Asp Thr Glu Gly Met Ser Pro Ala Lys Val Tyr 
                      20                  25                  30          
          Lys Leu Val Gly Glu Asn Glu Asn Leu Tyr Leu Lys Met Thr Asp Ser 
                  35                  40                  45              
          Arg Tyr Lys Gly Thr Thr Tyr Asp Val Glu Arg Glu Lys Asp Met Met 
              50                  55                  60                  
          Leu Trp Leu Glu Gly Lys Leu Pro Val Pro Lys Val Leu His Phe Glu 
          65                  70                  75                  80  
          Arg His Asp Gly Trp Ser Asn Leu Leu Met Ser Glu Ala Asp Gly Val 
                          85                  90                  95      
          Leu Cys Ser Glu Glu Tyr Glu Asp Glu Gln Ser Pro Glu Lys Ile Ile 
                      100                 105                 110         
          Glu Leu Tyr Ala Glu Cys Ile Arg Leu Phe His Ser Ile Asp Ile Ser 
                  115                 120                 125             
          Asp Cys Pro Tyr Thr Asn Ser Leu Asp Ser Arg Leu Ala Glu Leu Asp 
              130                 135                 140                 
          Tyr Leu Leu Asn Asn Asp Leu Ala Asp Val Asp Cys Glu Asn Trp Glu 
          145                 150                 155                 160 
          Glu Asp Thr Pro Phe Lys Asp Pro Arg Glu Leu Tyr Asp Phe Leu Lys 
                          165                 170                 175     
          Thr Glu Lys Pro Glu Glu Glu Leu Val Phe Ser His Gly Asp Leu Gly 
                      180                 185                 190         
          Asp Ser Asn Ile Phe Val Lys Asp Gly Lys Val Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Leu Gly Arg Ser Gly Arg Ala Asp Lys Trp Tyr Asp Ile Ala Phe Cys 
              210                 215                 220                 
          Val Arg Ser Ile Arg Glu Asp Ile Gly Glu Glu Gln Tyr Val Glu Leu 
          225                 230                 235                 240 
          Phe Phe Asp Leu Leu Gly Ile Lys Pro Asp Trp Glu Lys Ile Lys Tyr 
                          245                 250                 255     
          Tyr Ile Leu Leu Asp Glu Leu Phe 
                      260                 
          <![CDATA[<210> 48]]>
          <![CDATA[<211> 250]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-VIIa胺基酸序列
          <![CDATA[<400> 48]]>
          Met Lys Tyr Ile Asp Glu Ile Gln Ile Leu Gly Lys Cys Ser Glu Gly 
          1               5                   10                  15      
          Met Ser Pro Ala Glu Val Tyr Lys Cys Gln Leu Lys Asn Thr Val Cys 
                      20                  25                  30          
          Tyr Leu Lys Lys Ile Asp Asp Ile Phe Ser Lys Thr Thr Tyr Ser Val 
                  35                  40                  45              
          Lys Arg Glu Ala Glu Met Met Met Trp Leu Ser Asp Lys Leu Lys Val 
              50                  55                  60                  
          Pro Asp Val Ile Glu Tyr Gly Val Arg Glu His Ser Glu Tyr Leu Ile 
          65                  70                  75                  80  
          Met Ser Glu Leu Arg Gly Lys His Ile Asp Cys Phe Ile Asp His Pro 
                          85                  90                  95      
          Ile Lys Tyr Ile Glu Cys Leu Val Asn Ala Leu His Gln Leu Gln Ala 
                      100                 105                 110         
          Ile Asp Ile Arg Asn Cys Pro Phe Ser Ser Lys Ile Asp Val Arg Leu 
                  115                 120                 125             
          Lys Glu Leu Lys Tyr Leu Leu Asp Asn Arg Ile Ala Asp Ile Asp Val 
              130                 135                 140                 
          Ser Asn Trp Glu Asp Thr Thr Glu Phe Asp Asp Pro Met Thr Leu Tyr 
          145                 150                 155                 160 
          Gln Trp Leu Cys Glu Asn Gln Pro Gln Glu Glu Leu Cys Leu Ser His 
                          165                 170                 175     
          Gly Asp Met Ser Ala Asn Phe Phe Val Ser His Asp Gly Ile Tyr Phe 
                      180                 185                 190         
          Tyr Asp Leu Ala Arg Cys Gly Val Ala Asp Lys Trp Leu Asp Ile Ala 
                  195                 200                 205             
          Phe Cys Val Arg Glu Ile Arg Glu Tyr Tyr Pro Asp Ser Asp Tyr Glu 
              210                 215                 220                 
          Lys Phe Phe Phe Asn Met Leu Gly Leu Glu Pro Asp Tyr Lys Lys Ile 
          225                 230                 235                 240 
          Asn Tyr Tyr Ile Leu Leu Asp Glu Met Phe 
                          245                 250 
          <![CDATA[<210> 49]]>
          <![CDATA[<211> 259]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-VIa胺基酸序列
          <![CDATA[<400> 49]]>
          Met Glu Leu Pro Asn Ile Ile Gln Gln Phe Ile Gly Asn Ser Val Leu 
          1               5                   10                  15      
          Glu Pro Asn Lys Ile Gly Gln Ser Pro Ser Asp Val Tyr Ser Phe Asn 
                      20                  25                  30          
          Arg Asn Asn Glu Thr Phe Phe Leu Lys Arg Ser Ser Thr Leu Tyr Thr 
                  35                  40                  45              
          Glu Thr Thr Tyr Ser Val Ser Arg Glu Ala Lys Met Leu Ser Trp Leu 
              50                  55                  60                  
          Ser Glu Lys Leu Lys Val Pro Glu Leu Ile Met Thr Phe Gln Asp Glu 
          65                  70                  75                  80  
          Gln Phe Glu Phe Met Ile Thr Lys Ala Ile Asn Ala Lys Pro Ile Ser 
                          85                  90                  95      
          Ala Leu Phe Leu Thr Asp Gln Glu Leu Leu Ala Ile Tyr Lys Glu Ala 
                      100                 105                 110         
          Leu Asn Leu Leu Asn Ser Ile Ala Ile Ile Asp Cys Pro Phe Ile Ser 
                  115                 120                 125             
          Asn Ile Asp His Arg Leu Lys Glu Ser Lys Phe Phe Ile Asp Asn Gln 
              130                 135                 140                 
          Leu Leu Asp Asp Ile Asp Gln Asp Asp Phe Asp Thr Glu Leu Trp Gly 
          145                 150                 155                 160 
          Asp His Lys Thr Tyr Leu Ser Leu Trp Asn Glu Leu Thr Glu Thr Arg 
                          165                 170                 175     
          Val Glu Glu Arg Leu Val Phe Ser His Gly Asp Ile Thr Asp Ser Asn 
                      180                 185                 190         
          Ile Phe Ile Asp Lys Phe Asn Glu Ile Tyr Phe Leu Asp Leu Gly Arg 
                  195                 200                 205             
          Ala Gly Leu Ala Asp Glu Phe Val Asp Ile Ser Phe Val Glu Arg Cys 
              210                 215                 220                 
          Leu Arg Glu Asp Ala Ser Glu Glu Thr Ala Lys Ile Phe Leu Lys His 
          225                 230                 235                 240 
          Leu Lys Asn Asp Arg Pro Asp Lys Arg Asn Tyr Phe Leu Lys Leu Asp 
                          245                 250                 255     
          Glu Leu Asn 
          <![CDATA[<210> 50]]>
          <![CDATA[<211> 262]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-IVa胺基酸序列
          <![CDATA[<400> 50]]>
          Met Asn Glu Ser Thr Arg Asn Trp Pro Glu Glu Leu Leu Glu Leu Leu 
          1               5                   10                  15      
          Gly Gln Thr Glu Leu Thr Val Asn Lys Ile Gly Tyr Ser Gly Asp His 
                      20                  25                  30          
          Val Tyr His Val Lys Glu Tyr Arg Gly Thr Pro Ala Phe Leu Lys Ile 
                  35                  40                  45              
          Ala Pro Ser Val Trp Trp Arg Thr Leu Arg Pro Glu Ile Glu Ala Leu 
              50                  55                  60                  
          Ala Trp Leu Asp Gly Lys Leu Pro Val Pro Lys Ile Leu Tyr Thr Ala 
          65                  70                  75                  80  
          Glu His Gly Gly Met Asp Tyr Leu Leu Met Glu Ala Leu Gly Gly Lys 
                          85                  90                  95      
          Asp Gly Ser His Glu Thr Ile Gln Ala Lys Arg Lys Leu Phe Val Lys 
                      100                 105                 110         
          Leu Tyr Ala Glu Gly Leu Arg Ser Val His Gly Leu Asp Ile Arg Glu 
                  115                 120                 125             
          Cys Pro Leu Ser Asn Gly Leu Glu Lys Lys Leu Arg Asp Ala Lys Arg 
              130                 135                 140                 
          Ile Val Asp Glu Ser Leu Val Asp Pro Ala Asp Ile Lys Glu Glu Tyr 
          145                 150                 155                 160 
          Asp Cys Thr Pro Glu Glu Leu Tyr Gly Leu Leu Leu Glu Ser Lys Pro 
                          165                 170                 175     
          Val Thr Glu Asp Leu Val Phe Ala His Gly Asp Tyr Cys Ala Pro Asn 
                      180                 185                 190         
          Leu Ile Ile Asp Gly Glu Lys Leu Ser Gly Phe Ile Asp Leu Gly Arg 
                  195                 200                 205             
          Ala Gly Val Ala Asp Arg Tyr Gln Asp Ile Ser Leu Ala Ile Arg Ser 
              210                 215                 220                 
          Leu Arg His Asp Tyr Gly Asp Asp Arg Tyr Lys Ala Leu Phe Leu Glu 
          225                 230                 235                 240 
          Leu Tyr Gly Leu Asp Gly Leu Asp Glu Asp Lys Val Arg Tyr Tyr Ile 
                          245                 250                 255     
          Arg Leu Asp Glu Phe Phe 
                      260         
          <![CDATA[<210> 51]]>
          <![CDATA[<211> 271]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-Ia胺基酸序列
          <![CDATA[<400> 51]]>
          Met Ser His Ile Gln Arg Glu Thr Ser Cys Ser Arg Pro Arg Leu Asn 
          1               5                   10                  15      
          Ser Asn Met Asp Ala Asp Leu Tyr Gly Tyr Lys Trp Ala Arg Asp Asn 
                      20                  25                  30          
          Val Gly Gln Ser Gly Ala Thr Ile Tyr Arg Leu Tyr Gly Lys Pro Asp 
                  35                  40                  45              
          Ala Pro Glu Leu Phe Leu Lys His Gly Lys Gly Ser Val Ala Asn Asp 
              50                  55                  60                  
          Val Thr Asp Glu Met Val Arg Leu Asn Trp Leu Thr Glu Phe Met Pro 
          65                  70                  75                  80  
          Leu Pro Thr Ile Lys His Phe Ile Arg Thr Pro Asp Asp Ala Trp Leu 
                          85                  90                  95      
          Leu Thr Thr Ala Ile Pro Gly Lys Thr Ala Phe Gln Val Leu Glu Glu 
                      100                 105                 110         
          Tyr Pro Asp Ser Gly Glu Asn Ile Val Asp Ala Leu Ala Val Phe Leu 
                  115                 120                 125             
          Arg Arg Leu His Ser Ile Pro Val Cys Asn Cys Pro Phe Asn Ser Asp 
              130                 135                 140                 
          Arg Val Phe Arg Leu Ala Gln Ala Gln Ser Arg Met Asn Asn Gly Leu 
          145                 150                 155                 160 
          Val Asp Ala Ser Asp Phe Asp Asp Glu Arg Asn Gly Trp Pro Val Glu 
                          165                 170                 175     
          Gln Val Trp Lys Glu Met His Lys Leu Leu Pro Phe Ser Pro Asp Ser 
                      180                 185                 190         
          Val Val Thr His Gly Asp Phe Ser Leu Asp Asn Leu Ile Phe Asp Glu 
                  195                 200                 205             
          Gly Lys Leu Ile Gly Cys Ile Asp Val Gly Arg Val Gly Ile Ala Asp 
              210                 215                 220                 
          Arg Tyr Gln Asp Leu Ala Ile Leu Trp Asn Cys Leu Gly Glu Phe Ser 
          225                 230                 235                 240 
          Pro Ser Leu Gln Lys Arg Leu Phe Gln Lys Tyr Gly Ile Asp Asn Pro 
                          245                 250                 255     
          Asp Met Asn Lys Leu Gln Phe His Leu Met Leu Asp Glu Phe Phe 
                      260                 265                 270     
          <![CDATA[<210> 52]]>
          <![CDATA[<211> 271]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-Ic胺基酸序列
          <![CDATA[<400> 52]]>
          Met Ser His Ile Gln Arg Glu Thr Ser Cys Ser Arg Pro Arg Leu Asn 
          1               5                   10                  15      
          Ser Asn Leu Asp Ala Asp Leu Tyr Gly Tyr Arg Trp Ala Arg Asp Asn 
                      20                  25                  30          
          Val Gly Gln Ser Gly Ala Thr Ile Tyr Arg Leu Tyr Gly Lys Pro Asn 
                  35                  40                  45              
          Ala Pro Glu Leu Phe Leu Lys His Gly Lys Gly Ser Val Ala Asn Asp 
              50                  55                  60                  
          Val Thr Asp Glu Met Val Arg Leu Asn Trp Leu Thr Ala Phe Met Pro 
          65                  70                  75                  80  
          Leu Pro Thr Ile Lys His Phe Ile Arg Thr Pro Asp Asp Ala Trp Leu 
                          85                  90                  95      
          Leu Thr Thr Ala Ile Pro Gly Lys Thr Ala Phe Gln Val Leu Glu Glu 
                      100                 105                 110         
          Tyr Pro Asp Ser Gly Glu Asn Ile Val Asp Ala Leu Ala Val Phe Leu 
                  115                 120                 125             
          Arg Arg Leu His Ser Ile Pro Val Cys Asn Cys Pro Phe Asn Ser Asp 
              130                 135                 140                 
          Arg Val Phe Arg Leu Ala Gln Ala Gln Ser Arg Met Asn Asn Gly Leu 
          145                 150                 155                 160 
          Val Asp Ala Ser Asp Phe Asp Asp Glu Arg Asn Gly Trp Pro Val Glu 
                          165                 170                 175     
          Gln Val Trp Lys Glu Met His Lys Leu Leu Pro Phe Ser Pro Asp Ser 
                      180                 185                 190         
          Val Val Thr His Gly Asp Phe Ser Leu Asp Asn Leu Ile Phe Asp Glu 
                  195                 200                 205             
          Gly Lys Leu Ile Gly Cys Ile Asp Val Gly Arg Val Gly Ile Ala Asp 
              210                 215                 220                 
          Arg Tyr Gln Asp Leu Ala Ile Leu Trp Asn Cys Leu Gly Glu Phe Ser 
          225                 230                 235                 240 
          Pro Ser Leu Gln Lys Arg Leu Phe Gln Lys Tyr Gly Ile Asp Asn Pro 
                          245                 250                 255     
          Asp Met Asn Lys Leu Gln Phe His Leu Met Leu Asp Glu Phe Phe 
                      260                 265                 270     
          <![CDATA[<210> 53]]>
          <![CDATA[<211> 269]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-Ib胺基酸序列
          <![CDATA[<400> 53]]>
          Met Asn Asp Ile Asp Arg Glu Glu Pro Cys Ala Ala Ala Ala Val Pro 
          1               5                   10                  15      
          Glu Ser Met Ala Ala His Val Met Gly Tyr Lys Trp Ala Arg Asp Lys 
                      20                  25                  30          
          Val Gly Gln Ser Gly Cys Ala Val Tyr Arg Leu His Ser Lys Ser Gly 
                  35                  40                  45              
          Gly Ser Asp Leu Phe Leu Lys His Gly Lys Asp Ala Ala Asp Asp Val 
              50                  55                  60                  
          Thr Asp Glu Met Val Arg Leu Arg Trp Leu Ala Gly His Ile Ser Val 
          65                  70                  75                  80  
          Pro Ser Val Val Ser Phe Val Arg Thr Pro Asn Gln Ala Trp Leu Leu 
                          85                  90                  95      
          Thr Thr Ala Ile His Gly Lys Thr Ala Phe Gln Val Leu Glu Glu Tyr 
                      100                 105                 110         
          Pro Asp Ser Gly Glu Asn Ile Val Asp Ala Ala Val Phe Leu Arg Arg 
                  115                 120                 125             
          Leu His Ser Ile Pro Val Cys Asn Cys Pro Phe Asn Ser Asp Arg Val 
              130                 135                 140                 
          Phe Arg Leu Ala Gln Ala Gln Ser Arg Met Asn Asn Gly Leu Val Asp 
          145                 150                 155                 160 
          Val Asp Asp Phe Asp Lys Glu Arg Glu Gly Trp Thr Ala Glu Gln Val 
                          165                 170                 175     
          Trp Glu Ala Met His Arg Leu Leu Pro Leu Ala Pro Asp Pro Val Val 
                      180                 185                 190         
          Thr His Gly Asp Phe Ser Leu Asp Asn Leu Leu Ile Val Glu Gly Lys 
                  195                 200                 205             
          Val Val Gly Cys Ile Asp Val Gly Arg Ala Gly Ile Ala Asp Arg Tyr 
              210                 215                 220                 
          Gln Asp Leu Ala Val Leu Trp Asn Cys Leu Glu Glu Phe Glu Pro Ser 
          225                 230                 235                 240 
          Leu Gln Glu Arg Leu Val Ala Gln Tyr Gly Ile Ala Asp Pro Asp Arg 
                          245                 250                 255     
          Arg Lys Leu Gln Phe His Leu Leu Leu Asp Glu Leu Phe 
                      260                 265                 
          <![CDATA[<210> 54]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-IIa胺基酸序列
          <![CDATA[<400> 54]]>
          Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 
          1               5                   10                  15      
          Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 
                      20                  25                  30          
          Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 
                  35                  40                  45              
          Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 
              50                  55                  60                  
          Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 
          65                  70                  75                  80  
          Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 
                          85                  90                  95      
          Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 
                      100                 105                 110         
          Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 
                  115                 120                 125             
          Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 
              130                 135                 140                 
          Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 
          145                 150                 155                 160 
          Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 
                          165                 170                 175     
          Arg Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 
                  195                 200                 205             
          Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 
          225                 230                 235                 240 
          Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 
                          245                 250                 255     
          Tyr Arg Leu Leu Asp Glu Phe Phe 
                      260                 
          <![CDATA[<210> 55]]>
          <![CDATA[<211> 263]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-Vb胺基酸序列
          <![CDATA[<400> 55]]>
          Met Glu Ser Thr Leu Arg Arg Thr Tyr Pro His His Thr Trp His Leu 
          1               5                   10                  15      
          Val Asn Glu Gly Asp Ser Gly Ala Phe Val Tyr Arg Leu Thr Gly His 
                      20                  25                  30          
          Gly Pro Glu Leu Tyr Ala Lys Ile Ala Pro Arg Thr Pro Glu Asn Ser 
                  35                  40                  45              
          Ala Phe His Leu Asp Gly Glu Ala Asp Arg Leu Asp Trp Leu Ala Arg 
              50                  55                  60                  
          His Gly Ile Ser Val Pro Arg Val Val Glu Arg Gly Ala Asp Asp Thr 
          65                  70                  75                  80  
          Thr Ala Trp Leu Val Thr Glu Ala Val Pro Gly Ala Ala Ser Ala Glu 
                          85                  90                  95      
          Glu Trp Pro Glu Asp Glu Arg Ala Ala Val Val Asp Ala Ile Ala Glu 
                      100                 105                 110         
          Met Ala Arg Thr Leu His Glu Leu Pro Val Ser Glu Cys Pro Phe Asp 
                  115                 120                 125             
          Arg Arg Leu Asp Val Thr Gly Glu Ala Arg His Asn Val Arg Glu Gly 
              130                 135                 140                 
          Leu Val Asp Leu Asp Asp Leu Gln Glu Glu Pro Ala Gly Trp Thr Gly 
          145                 150                 155                 160 
          Asp Gln Leu Leu Ala Glu Leu Asp Leu Thr Arg Pro Glu Lys Glu Asp 
                          165                 170                 175     
          Leu Val Val Cys His Gly Asp Leu Cys Pro Asn Asn Val Leu Leu Asp 
                      180                 185                 190         
          Pro Glu Thr His Arg Val Thr Gly Leu Ile Asp Val Gly Arg Leu Arg 
                  195                 200                 205             
          Leu Ala Thr Cys His Ala Asp Ile Ala Leu Ala Ala Arg Glu Leu Ala 
              210                 215                 220                 
          Ile Asp Glu Asp Pro Trp Phe Gly Pro Ala Tyr Ala Glu Arg Phe Leu 
          225                 230                 235                 240 
          Glu Arg Tyr Gly Ala His His Val Asp Gln Glu Lys Met Ala Phe Tyr 
                          245                 250                 255     
          Gln Leu Leu Asp Glu Phe Phe 
                      260             
          <![CDATA[<210> 56]]>
          <![CDATA[<211> 268]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-Va胺基酸序列
          <![CDATA[<400> 56]]>
          Met Asp Asp Ser Thr Leu Arg Arg Lys Tyr Pro His His Glu Trp His 
          1               5                   10                  15      
          Ala Val Asn Glu Gly Asp Ser Gly Ala Phe Val Tyr Gln Leu Thr Gly 
                      20                  25                  30          
          Gly Pro Glu Pro Gln Pro Glu Leu Tyr Ala Lys Ile Ala Pro Arg Ala 
                  35                  40                  45              
          Pro Glu Asn Ser Ala Phe Asp Leu Ser Gly Glu Ala Asp Arg Leu Glu 
              50                  55                  60                  
          Trp Leu His Arg His Gly Ile Pro Val Pro Arg Val Val Glu Arg Gly 
          65                  70                  75                  80  
          Ala Asp Asp Thr Ala Ala Trp Leu Val Thr Glu Ala Val Pro Gly Val 
                          85                  90                  95      
          Ala Ala Ala Glu Glu Trp Pro Glu His Gln Arg Phe Ala Val Val Glu 
                      100                 105                 110         
          Ala Met Ala Glu Leu Ala Arg Ala Leu His Glu Leu Pro Val Glu Asp 
                  115                 120                 125             
          Cys Pro Ser Asp Arg Arg Leu Asp Ala Ala Val Ala Glu Ala Arg Arg 
              130                 135                 140                 
          Asn Val Ala Glu Gly Leu Val Asp Leu Asp Asp Leu Gln Glu Glu Arg 
          145                 150                 155                 160 
          Ala Gly Trp Thr Gly Asp Gln Leu Leu Ala Glu Leu Asp Arg Thr Arg 
                          165                 170                 175     
          Pro Glu Lys Glu Asp Leu Val Val Cys His Gly Asp Leu Cys Pro Asn 
                      180                 185                 190         
          Asn Val Leu Leu Asp Pro Gly Thr Cys Arg Val Thr Gly Val Ile Asp 
                  195                 200                 205             
          Val Gly Arg Leu Gly Val Ala Asp Arg His Ala Asp Ile Ala Leu Ala 
              210                 215                 220                 
          Ala Arg Glu Leu Glu Ile Asp Glu Asp Pro Trp Phe Gly Pro Ala Tyr 
          225                 230                 235                 240 
          Ala Glu Arg Phe Leu Glu Arg Tyr Gly Ala His Arg Val Asp Lys Glu 
                          245                 250                 255     
          Lys Leu Ala Phe Tyr Gln Leu Leu Asp Glu Phe Phe 
                      260                 265             
          <![CDATA[<210> 57]]>
          <![CDATA[<211> 264]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3')-Vc胺基酸序列
          <![CDATA[<400> 57]]>
          Met Tyr Ala Met Leu Arg Arg Lys Tyr Gln His Tyr Glu Trp Thr Ser 
          1               5                   10                  15      
          Val Asn Glu Gly Asp Ser Gly Ala Ser Val Tyr Arg Leu Ala Gly Gln 
                      20                  25                  30          
          Gln Pro Glu Leu Tyr Val Lys Phe Ala Pro Arg Glu Pro Glu Asn Ser 
                  35                  40                  45              
          Ala Phe Asp Leu Ala Gly Glu Ala Asp Arg Leu Thr Trp Leu Thr Arg 
              50                  55                  60                  
          His Gly Ile Pro Val Pro Cys Ile Val Glu Cys Gly Gly Asp Asp Thr 
          65                  70                  75                  80  
          Ser Val Phe Leu Val Thr Glu Ala Val Thr Gly Val Ala Ala Ala Glu 
                          85                  90                  95      
          Glu Trp Pro Glu His Gln Arg Phe Ala Val Val Glu Ala Met Ala Asp 
                      100                 105                 110         
          Leu Ala Arg Thr Leu His Glu Leu Pro Val Gly Gly Cys Pro Phe Asp 
                  115                 120                 125             
          Arg Ser Leu Ala Val Thr Val Ala Glu Ala Arg His Asn Leu Arg Glu 
              130                 135                 140                 
          Gly Leu Val Asp Leu Asp Asp Leu Gln Glu Glu His Ala Asn Trp Ser 
          145                 150                 155                 160 
          Gly Asp Gln Leu Leu Ala Glu Leu Asp Arg Thr Arg Pro Glu Lys Glu 
                          165                 170                 175     
          Asp Leu Val Val Cys His Gly Asp Leu Cys Pro Asn Asn Val Leu Leu 
                      180                 185                 190         
          Asp Pro Glu Thr Cys Arg Val Thr Gly Met Ile Asp Val Gly Arg Leu 
                  195                 200                 205             
          Gly Arg Ala Asp Arg His Ala Asp Ile Ala Leu Ala Ala Arg Glu Leu 
              210                 215                 220                 
          Glu Ile Asp Glu Asp Pro Trp Phe Gly Pro Glu Tyr Ala Gln Arg Phe 
          225                 230                 235                 240 
          Leu Glu Arg Tyr Gly Ala His His Val Asp Glu Asn Lys Met Ala Phe 
                          245                 250                 255     
          Tyr Gln Leu Leu Asp Glu Phe Phe 
                      260                 
          <![CDATA[<210> 58]]>
          <![CDATA[<211> 272]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3")-Ia胺基酸序列
          <![CDATA[<400> 58]]>
          Met Ser Asp His Pro Gly Pro Gly Ala Val Thr Pro Glu Leu Phe Gly 
          1               5                   10                  15      
          Val Gly Gly Asp Trp Leu Ala Val Thr Ala Gly Glu Ser Gly Ala Ser 
                      20                  25                  30          
          Val Phe Arg Ala Ala Asp Ala Thr Arg Tyr Ala Lys Cys Val Pro Ala 
                  35                  40                  45              
          Ala Asp Ala Ala Gly Leu Glu Ala Glu Arg Asp Arg Ile Ala Trp Leu 
              50                  55                  60                  
          Ser Gly Gln Gly Val Pro Gly Pro Arg Val Leu Asp Trp Tyr Ala Gly 
          65                  70                  75                  80  
          Asp Ala Gly Ala Cys Leu Val Thr Arg Ala Val Pro Gly Val Pro Ala 
                          85                  90                  95      
          Asp Arg Val Gly Ala Asp Asp Leu Arg Thr Ala Trp Gly Ala Val Ala 
                      100                 105                 110         
          Asp Ala Val Arg Arg Leu His Glu Val Pro Val Ala Ser Cys Pro Phe 
                  115                 120                 125             
          Arg Arg Gly Leu Asp Ser Val Val Asp Ala Ala Arg Asp Val Val Ala 
              130                 135                 140                 
          Arg Gly Ala Val His Pro Glu Phe Leu Pro Val Glu Gln Arg Leu Val 
          145                 150                 155                 160 
          Pro Pro Ala Glu Leu Leu Ala Arg Leu Thr Gly Glu Leu Ala Arg Arg 
                          165                 170                 175     
          Arg Asp Gln Glu Ala Ala Asp Thr Val Val Cys His Gly Asp Leu Cys 
                      180                 185                 190         
          Leu Pro Asn Ile Val Leu His Pro Glu Thr Leu Glu Val Ser Gly Phe 
                  195                 200                 205             
          Ile Asp Leu Gly Arg Leu Gly Ala Ala Asp Arg His Ala Asp Leu Ala 
              210                 215                 220                 
          Leu Leu Leu Ala Asn Ala Arg Glu Thr Trp Val Asp Glu Glu Arg Ala 
          225                 230                 235                 240 
          Arg Phe Ala Asp Ala Ala Phe Ala Glu Arg Tyr Gly Ile Ala Pro Asp 
                          245                 250                 255     
          Pro Glu Arg Leu Arg Phe Tyr Leu His Leu Asp Pro Leu Thr Trp Gly 
                      260                 265                 270         
          <![CDATA[<210> 59]]>
          <![CDATA[<211> 267]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(3")-Ib胺基酸序列
          <![CDATA[<400> 59]]>
          Leu Asn Arg Thr Asn Ile Phe Phe Gly Glu Ser His Ser Asp Trp Leu 
          1               5                   10                  15      
          Pro Val Arg Gly Gly Glu Ser Gly Asp Phe Val Phe Arg Arg Gly Asp 
                      20                  25                  30          
          Gly His Ala Phe Ala Lys Ile Ala Pro Ala Ser Arg Arg Gly Glu Leu 
                  35                  40                  45              
          Ala Gly Glu Arg Asp Arg Leu Ile Trp Leu Lys Gly Arg Gly Val Ala 
              50                  55                  60                  
          Cys Pro Glu Val Ile Asn Trp Gln Glu Glu Gln Glu Gly Ala Cys Leu 
          65                  70                  75                  80  
          Val Ile Thr Ala Ile Pro Gly Val Pro Ala Ala Asp Leu Ser Gly Ala 
                          85                  90                  95      
          Asp Leu Leu Lys Ala Trp Pro Ser Met Gly Gln Gln Leu Gly Ala Val 
                      100                 105                 110         
          His Ser Leu Ser Val Asp Gln Cys Pro Phe Glu Arg Arg Leu Ser Arg 
                  115                 120                 125             
          Met Phe Gly Arg Ala Val Asp Val Val Ser Arg Asn Ala Val Asn Pro 
              130                 135                 140                 
          Asp Phe Leu Pro Asp Glu Asp Lys Ser Thr Pro Leu His Asp Leu Leu 
          145                 150                 155                 160 
          Ala Arg Val Glu Arg Glu Leu Pro Val Arg Leu Asp Gln Glu Arg Thr 
                          165                 170                 175     
          Asp Met Val Val Cys His Gly Asp Pro Cys Met Pro Asn Phe Met Val 
                      180                 185                 190         
          Asp Pro Lys Thr Leu Gln Cys Thr Gly Leu Ile Asp Leu Gly Arg Leu 
                  195                 200                 205             
          Gly Thr Ala Asp Arg Tyr Ala Asp Leu Ala Leu Met Ile Ala Asn Ala 
              210                 215                 220                 
          Glu Glu Asn Trp Ala Ala Pro Asp Glu Ala Glu Arg Ala Phe Ala Val 
          225                 230                 235                 240 
          Leu Phe Asn Val Leu Gly Ile Glu Ala Pro Asp Arg Glu Arg Leu Ala 
                          245                 250                 255     
          Phe Tyr Leu Arg Leu Asp Pro Leu Thr Trp Gly 
                      260                 265         
          <![CDATA[<210> 60]]>
          <![CDATA[<211> 319]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(2")-Ia胺基酸序列
          <![CDATA[<400> 60]]>
          Glu His Glu Leu His Glu Gly Lys Lys Glu Asp Cys Tyr Leu Met Glu 
          1               5                   10                  15      
          Tyr Arg Tyr Asp Asp Asn Ala Thr Asn Val Lys Ala Met Lys Tyr Leu 
                      20                  25                  30          
          Ile Glu His Tyr Phe Asp Asn Phe Lys Val Asp Ser Ile Glu Ile Ile 
                  35                  40                  45              
          Gly Ser Gly Tyr Asp Ser Val Ala Tyr Leu Val Asn Asn Glu Tyr Ile 
              50                  55                  60                  
          Phe Lys Thr Lys Phe Ser Thr Asn Lys Lys Lys Gly Tyr Ala Lys Glu 
          65                  70                  75                  80  
          Lys Ala Ile Tyr Asn Phe Leu Asn Thr Asn Leu Glu Thr Asn Val Lys 
                          85                  90                  95      
          Ile Pro Asn Ile Glu Tyr Ser Tyr Ile Ser Asp Glu Leu Ser Ile Leu 
                      100                 105                 110         
          Gly Tyr Lys Glu Ile Lys Gly Thr Phe Leu Thr Pro Glu Ile Tyr Ser 
                  115                 120                 125             
          Thr Met Ser Glu Glu Glu Gln Asn Leu Leu Lys Arg Asp Ile Ala Ser 
              130                 135                 140                 
          Phe Leu Arg Gln Met His Gly Leu Asp Tyr Thr Asp Ile Ser Glu Cys 
          145                 150                 155                 160 
          Thr Ile Asp Asn Lys Gln Asn Val Leu Glu Glu Tyr Ile Leu Leu Arg 
                          165                 170                 175     
          Glu Thr Ile Tyr Asn Asp Leu Thr Asp Ile Glu Lys Asp Tyr Ile Glu 
                      180                 185                 190         
          Ser Phe Met Glu Arg Leu Asn Ala Thr Thr Val Phe Glu Gly Lys Lys 
                  195                 200                 205             
          Cys Leu Cys His Asn Asp Phe Ser Cys Asn His Leu Leu Leu Asp Gly 
              210                 215                 220                 
          Asn Asn Arg Leu Thr Gly Ile Ile Asp Phe Gly Asp Ser Gly Ile Ile 
          225                 230                 235                 240 
          Asp Glu Tyr Cys Asp Phe Ile Tyr Leu Leu Glu Asp Ser Glu Glu Glu 
                          245                 250                 255     
          Ile Gly Thr Asn Phe Gly Glu Asp Ile Leu Arg Met Tyr Gly Asn Ile 
                      260                 265                 270         
          Asp Ile Glu Lys Ala Lys Glu Tyr Gln Asp Ile Val Glu Glu Tyr Tyr 
                  275                 280                 285             
          Pro Ile Glu Thr Ile Val Tyr Gly Ile Lys Asn Ile Lys Gln Glu Phe 
              290                 295                 300                 
          Ile Glu Asn Gly Arg Lys Glu Ile Tyr Lys Arg Thr Tyr Lys Asp 
          305                 310                 315                 
          <![CDATA[<210> 61]]>
          <![CDATA[<211> 332]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(4)-Ib胺基酸序列
          <![CDATA[<400> 61]]>
          Met Thr Gln Glu Ser Leu Leu Leu Leu Asp Arg Ile Asp Ser Asp Asp 
          1               5                   10                  15      
          Ser Tyr Ala Ser Leu Arg Asn Asp Gln Glu Phe Trp Glu Pro Leu Ala 
                      20                  25                  30          
          Arg Arg Ala Leu Glu Glu Leu Gly Leu Pro Val Pro Pro Val Leu Arg 
                  35                  40                  45              
          Val Pro Gly Glu Ser Thr Asn Pro Val Leu Val Gly Glu Pro Asp Pro 
              50                  55                  60                  
          Val Ile Lys Leu Phe Gly Glu His Trp Cys Gly Pro Glu Ser Leu Ala 
          65                  70                  75                  80  
          Ser Glu Ser Glu Ala Tyr Ala Val Leu Ala Asp Ala Pro Val Pro Val 
                          85                  90                  95      
          Pro Arg Leu Leu Gly Arg Gly Glu Leu Arg Pro Gly Thr Gly Ala Trp 
                      100                 105                 110         
          Pro Trp Pro Tyr Leu Val Met Ser Arg Met Thr Gly Thr Thr Trp Arg 
                  115                 120                 125             
          Ser Ala Met Asp Gly Thr Thr Asp Arg Asn Ala Leu Leu Ala Leu Ala 
              130                 135                 140                 
          Arg Glu Leu Gly Arg Val Leu Gly Arg Leu His Arg Val Pro Leu Thr 
          145                 150                 155                 160 
          Gly Asn Thr Val Leu Thr Pro His Ser Glu Val Phe Pro Glu Leu Leu 
                          165                 170                 175     
          Arg Glu Arg Arg Ala Ala Thr Val Glu Asp His Arg Gly Trp Gly Tyr 
                      180                 185                 190         
          Leu Ser Pro Arg Leu Leu Asp Arg Leu Glu Asp Trp Leu Pro Asp Val 
                  195                 200                 205             
          Asp Thr Leu Leu Ala Gly Arg Glu Pro Arg Phe Val His Gly Asp Leu 
              210                 215                 220                 
          His Gly Thr Asn Ile Phe Val Asp Leu Ala Ala Thr Glu Val Thr Gly 
          225                 230                 235                 240 
          Ile Val Asp Phe Thr Asp Val Tyr Ala Gly Asp Ser Arg Tyr Ser Leu 
                          245                 250                 255     
          Tyr Gln Leu His Leu Asn Ala Phe Arg Gly Asp Arg Glu Ile Leu Ala 
                      260                 265                 270         
          Ala Leu Leu Asp Gly Ala Gln Trp Lys Arg Thr Glu Asp Phe Ala Arg 
                  275                 280                 285             
          Glu Leu Leu Ala Phe Thr Phe Leu His Asp Phe Glu Val Phe Glu Glu 
              290                 295                 300                 
          Thr Pro Leu Asp Leu Ser Gly Phe Thr Asp Pro Glu Glu Leu Ala Gln 
          305                 310                 315                 320 
          Phe Leu Trp Gly Pro Pro Asp Thr Ala Pro Gly Ala 
                          325                 330         
          <![CDATA[<210> 62]]>
          <![CDATA[<211> 341]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知之描述:]]>
                APH(4)-Ia胺基酸序列
          <![CDATA[<400> 62]]>
          Met Lys Lys Pro Glu Leu Thr Ala Thr Ser Val Glu Lys Phe Leu Ile 
          1               5                   10                  15      
          Glu Lys Phe Asp Ser Val Ser Asp Leu Met Gln Leu Ser Glu Gly Glu 
                      20                  25                  30          
          Glu Ser Arg Ala Phe Ser Phe Asp Val Gly Gly Arg Gly Tyr Val Leu 
                  35                  40                  45              
          Arg Val Asn Ser Cys Ala Asp Gly Phe Tyr Lys Asp Arg Tyr Val Tyr 
              50                  55                  60                  
          Arg His Phe Ala Ser Ala Ala Leu Pro Ile Pro Glu Val Leu Asp Ile 
          65                  70                  75                  80  
          Gly Glu Phe Ser Glu Ser Leu Thr Tyr Cys Ile Ser Arg Arg Ala Gln 
                          85                  90                  95      
          Gly Val Thr Leu Gln Asp Leu Pro Glu Thr Glu Leu Pro Ala Val Leu 
                      100                 105                 110         
          Gln Pro Val Ala Glu Ala Met Asp Ala Ile Ala Ala Ala Asp Leu Ser 
                  115                 120                 125             
          Gln Thr Ser Gly Phe Gly Pro Phe Gly Pro Gln Gly Ile Gly Gln Tyr 
              130                 135                 140                 
          Thr Thr Trp Arg Asp Phe Ile Cys Ala Ile Ala Asp Pro His Val Tyr 
          145                 150                 155                 160 
          His Trp Gln Thr Val Met Asp Asp Thr Val Ser Ala Ser Val Ala Gln 
                          165                 170                 175     
          Ala Leu Asp Glu Leu Met Leu Trp Ala Glu Asp Cys Pro Glu Val Arg 
                      180                 185                 190         
          His Leu Val His Ala Asp Phe Gly Ser Asn Asn Val Leu Thr Asp Asn 
                  195                 200                 205             
          Gly Arg Ile Thr Ala Val Ile Asp Trp Ser Glu Ala Met Phe Gly Asp 
              210                 215                 220                 
          Ser Gln Tyr Glu Val Ala Asn Ile Phe Phe Trp Arg Pro Trp Leu Ala 
          225                 230                 235                 240 
          Cys Met Glu Gln Gln Thr Arg Tyr Phe Glu Arg Arg His Pro Glu Leu 
                          245                 250                 255     
          Ala Gly Ser Pro Arg Leu Arg Ala Tyr Met Leu Arg Ile Gly Leu Asp 
                      260                 265                 270         
          Gln Leu Tyr Gln Ser Leu Val Asp Gly Asn Phe Asp Asp Ala Ala Trp 
                  275                 280                 285             
          Ala Gln Gly Arg Cys Asp Ala Ile Val Arg Ser Gly Ala Gly Thr Val 
              290                 295                 300                 
          Gly Arg Thr Gln Ile Ala Arg Arg Ser Ala Ala Val Trp Thr Asp Gly 
          305                 310                 315                 320 
          Cys Val Glu Val Leu Ala Asp Ser Gly Asn Arg Arg Pro Ser Thr Arg 
                          325                 330                 335     
          Pro Arg Ala Lys Glu 
                      340     
          
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
Figure 12_A0101_SEQ_0013
Figure 12_A0101_SEQ_0014
Figure 12_A0101_SEQ_0015
Figure 12_A0101_SEQ_0016
Figure 12_A0101_SEQ_0017
Figure 12_A0101_SEQ_0018
Figure 12_A0101_SEQ_0019
Figure 12_A0101_SEQ_0020
Figure 12_A0101_SEQ_0021
Figure 12_A0101_SEQ_0022
Figure 12_A0101_SEQ_0023
Figure 12_A0101_SEQ_0024
Figure 12_A0101_SEQ_0025
Figure 12_A0101_SEQ_0026
Figure 12_A0101_SEQ_0027
Figure 12_A0101_SEQ_0028
Figure 12_A0101_SEQ_0029
Figure 12_A0101_SEQ_0030
Figure 12_A0101_SEQ_0031
Figure 12_A0101_SEQ_0032
Figure 12_A0101_SEQ_0033
Figure 12_A0101_SEQ_0034
Figure 12_A0101_SEQ_0035
Figure 12_A0101_SEQ_0036
Figure 12_A0101_SEQ_0037
Figure 12_A0101_SEQ_0038
Figure 12_A0101_SEQ_0039
Figure 12_A0101_SEQ_0040
Figure 12_A0101_SEQ_0041
Figure 12_A0101_SEQ_0042
Figure 12_A0101_SEQ_0043
Figure 12_A0101_SEQ_0044
Figure 12_A0101_SEQ_0045
Figure 12_A0101_SEQ_0046
Figure 12_A0101_SEQ_0047
Figure 12_A0101_SEQ_0048
Figure 12_A0101_SEQ_0049
Figure 12_A0101_SEQ_0050
Figure 12_A0101_SEQ_0051
Figure 12_A0101_SEQ_0052
Figure 12_A0101_SEQ_0053
Figure 12_A0101_SEQ_0054
Figure 12_A0101_SEQ_0055
Figure 12_A0101_SEQ_0056
Figure 12_A0101_SEQ_0057
Figure 12_A0101_SEQ_0058
Figure 12_A0101_SEQ_0059
Figure 12_A0101_SEQ_0060
Figure 12_A0101_SEQ_0061
Figure 12_A0101_SEQ_0062
Figure 12_A0101_SEQ_0063
Figure 12_A0101_SEQ_0064
Figure 12_A0101_SEQ_0065
Figure 12_A0101_SEQ_0066
Figure 12_A0101_SEQ_0067
Figure 12_A0101_SEQ_0068
Figure 12_A0101_SEQ_0069
Figure 12_A0101_SEQ_0070
Figure 12_A0101_SEQ_0071
Figure 12_A0101_SEQ_0072
Figure 12_A0101_SEQ_0073
Figure 12_A0101_SEQ_0074
Figure 12_A0101_SEQ_0075
Figure 12_A0101_SEQ_0076

Claims (63)

  1. 一種具有新黴素磷酸轉移酶活性之非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的野生型新黴素磷酸轉移酶的胺基酸序列: (a)    在對應於SEQ ID NO:1之胺基酸殘基36及210的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基210的該胺基酸殘基處的該胺基酸取代係取代成丙胺酸; (b)   在對應於SEQ ID NO:1之胺基酸殘基36及182的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基182的該胺基酸殘基處的該胺基酸取代係取代成天冬胺酸; (c)    在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成苯丙胺酸; (d)   在對應於SEQ ID NO:1之胺基酸殘基216及261的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸而在對應於SEQ ID NO:1之胺基酸殘基261的該胺基酸殘基處的該胺基酸取代係取代成天冬醯胺酸; (e)    在對應於SEQ ID NO:1之胺基酸殘基36及218的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基218的該胺基酸殘基處的該胺基酸取代係取代成絲胺酸;或 (f)    在對應於SEQ ID NO:1之胺基酸殘基36及216的胺基酸殘基處的胺基酸取代,其中在對應於SEQ ID NO:1之胺基酸殘基36的該胺基酸殘基處的該胺基酸取代係取代成甲硫胺酸而在對應於SEQ ID NO:1之胺基酸殘基216的該胺基酸殘基處的該胺基酸取代係取代成甘胺酸。
  2. 一種具有新黴素磷酸轉移酶活性之非天然存在的新黴素磷酸轉移酶(NPT),其中該非天然存在的NPT包含具有下列的SEQ ID NO:1的胺基酸序列: (a)    在SEQ ID NO:1之位置36及210處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置210處的該胺基酸取代係取代成丙胺酸; (b)   在SEQ ID NO:1之位置36及182處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置182處的該胺基酸取代係取代成天冬胺酸; (c)    在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的該胺基酸取代係取代成苯丙胺酸; (d)   在SEQ ID NO:1之位置216及261處的胺基酸取代,其中在SEQ ID NO:1之位置216處的該胺基酸取代係取代成甘胺酸而在SEQ ID NO:1之位置261處的該胺基酸取代係取代成天冬醯胺酸; (e)    在SEQ ID NO:1之位置36及218處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置218處的該胺基酸取代係取代成絲胺酸;或 (f)    在SEQ ID NO:1之位置36及216處的胺基酸取代,其中在SEQ ID NO:1之位置36處的該胺基酸取代係取代成甲硫胺酸而在SEQ ID NO:1之位置216處的該胺基酸取代係取代成甘胺酸。
  3. 如請求項1之NPT,其中相較於野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
  4. 如請求項1或3之NPT,其中該野生型NPT包含與SEQ ID NO:1至少80%、至少90%、或至少98%同一的胺基酸序列。
  5. 如請求項1或3之NPT,其中該野生型NPT包含與SEQ ID NO:1至少60%、至少65%、至少70%、或至少75%同一的胺基酸序列。
  6. 如請求項2之NPT,其中相較於包含SEQ ID NO:1之胺基酸序列的野生型NPT,該非天然存在的NPT具有作為可選擇標記之減弱之新黴素磷酸轉移酶活性。
  7. 如請求項1至6中任一項之NPT,其中如藉由在含有25 µg/mL、75 µg/mL、或100 µg/mL康黴素之盤上生長48小時後的群落形成檢定所評估,用編碼該非天然存在的NPT之核苷酸序列轉染或轉形的細菌細胞相對於用編碼野生型NPT之核苷酸序列轉染或轉形的細菌細胞展現降低之群落形成;且其中可任選地,該等細菌細胞係大腸桿菌。
  8. 如請求項1至6中任一項之NPT,其中如藉由在組織培養盤上於含有500 µg/mL遺傳黴素(G418)之培養基中生長2週後的群落形成檢定所評估,用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞展現降低之群落形成;且其中可任選地,該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。
  9. 如請求項1至6中任一項之NPT,其中用包含編碼該非天然存在的NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落相對於用相同但包含編碼野生型NPT之核苷酸序列的表現載體轉染的哺乳動物細胞之G418抗性群落係以在0.001%至75%之頻率範圍產生。
  10. 如請求項2之NPT,其中該非天然存在的NPT包含SEQ ID NO:38 (V36M, G210A)、SEQ ID NO:39 (V36M, E182D)、SEQ ID NO:40 (V36M, Y218F)、SEQ ID NO:41 (D216G, D261N)、SEQ ID NO:42 (V36M, Y218S)、或SEQ ID NO:43 (V36M, D216G)之胺基酸序列。
  11. 一種核酸序列,其包含編碼如請求項1至10中任一項之非天然存在的NPT之第一核苷酸序列。
  12. 如請求項11之核酸序列,其中該核酸序列進一步包含編碼第二蛋白或非編碼RNA之第二核苷酸序列;且其中可任選地,該第二蛋白係治療性蛋白。
  13. 如請求項11或12之核酸序列,其中該第一核苷酸序列包含SEQ ID NO:20、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:36、或SEQ ID NO:37之核苷酸序列。
  14. 一種載體,其包含如請求項11至13中任一項之核酸序列。
  15. 一種體外或離體宿主細胞,其包含如請求項1至10中任一項之非天然存在的NPT。
  16. 一種體外或離體宿主細胞,其包含如請求項11至13中任一項之核酸序列、或如請求項14之載體。
  17. 如請求項16之細胞,其中該核酸序列係穩定地整合至該宿主細胞之該基因體中。
  18. 如請求項15至17中任一項之細胞,其中該宿主細胞進一步包含編碼第二蛋白或非編碼RNA之第二核酸序列,且其中該第二蛋白係可任選地治療性蛋白;或其中可任選地,該第二核酸序列編碼非編碼RNA;且其中可任選地,該非編碼RNA係shRNA、miRNA、反義RNA、用於Crispr核酸酶之引導RNA、催化RNA、核糖體RNA、或tRNA。
  19. 如請求項15至18中任一項之細胞,其中該宿主細胞係細菌、酵母細胞、哺乳動物細胞、植物細胞;可任選地其中該哺乳動物細胞係人類細胞。
  20. 一種用於自其中引入轉殖基因的宿主細胞群中選擇具有高的該轉殖基因之拷貝數及/或高的該轉殖基因之表現水準的細胞之方法,該方法包含: (a)    將核酸序列引入至宿主細胞群中,該核酸序列包含: (i)第一核苷酸序列,其編碼如請求項1至10中任一項之非天然存在的新黴素磷酸轉移酶(NPT);及 (ii)第二核苷酸序列,其包含該轉殖基因;及 (b)    自其中引入該核酸序列的該宿主細胞群中選擇在新黴素磷酸轉移酶受質存在下生長的細胞。
  21. 如請求項20之方法,其中: (a)    相較於在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組中之該轉殖基因之該拷貝數,所選之該等細胞包含2至1000倍更高的該轉殖基因之拷貝數,其中該第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及該轉殖基因的核酸序列轉染或轉形;及/或 (b)   相較於由在新黴素磷酸轉移酶受質存在下生長的第二宿主細胞群之選擇後的第二細胞組的該轉殖基因之該表現水準,所選之該等細胞達到10至1000倍更高的該轉殖基因之表現水準,其中該第二宿主細胞群係用包含編碼野生型NPT蛋白之核苷酸序列及該轉殖基因的核酸序列轉染或轉形。
  22. 如請求項20或21之方法,其中該等宿主細胞係細菌細胞、酵母細胞、哺乳動物細胞、植物細胞;可任選地其中該等哺乳動物細胞係人類細胞。
  23. 如請求項20、21、或22之方法,其中該核酸序列係穩定地整合至所選之該等細胞的該基因體中。
  24. 如請求項20至23中任一項之方法,其中所選之該等細胞具有高的該轉殖基因之拷貝數。
  25. 如請求項20至24中任一項之方法,其中所選之該等細胞具有高的該轉殖基因之表現水準。
  26. 如請求項20至25中任一項之方法,其中所選之該等細胞已將5至100個拷貝的該轉殖基因整合至其基因體DNA中。
  27. 如請求項20至25中任一項之方法,其中所選之該等細胞已將1至5個拷貝的該轉殖基因整合至其基因體DNA中。
  28. 如請求項20至27中任一項之方法,其中該轉殖基因包含病毒基因或生長因子基因、或該轉殖基因編碼蛋白或非編碼RNA;其中可任選地,該非編碼RNA係選自由下列所組成之群組:反義RNA、miRNA、shRNA、長非編碼RNA、催化RNA、核糖體RNA、tRNA、或用於CRISPR核酸酶之引導RNA;且其中可任選地,該蛋白係治療性蛋白或抗原。
  29. 如請求項20至28中任一項之方法,其中該新黴素磷酸轉移酶受質係新黴素、康黴素、或G418。
  30. 一種使用質體或轉位子之方法,該質體或轉位子包含編碼如請求項1至10中任一項之非天然存在的NPT之核酸序列作為可選擇標記,該方法包含: (a)    將包含編碼該非天然存在的NPT之該核酸序列的該質體或轉位子引入至宿主細胞中;及 (b)   在新黴素磷酸轉移酶受質存在下使該細胞生長。
  31. 如請求項30之方法,其中該宿主細胞係細菌、酵母細胞、哺乳動物細胞、植物細胞;可任選地其中該哺乳動物細胞係人類細胞。
  32. 如請求項30或31之方法,其中該質體或轉位子進一步包含編碼蛋白或非編碼RNA之第二核苷酸序列;其中可任選地,該蛋白係病毒蛋白或治療性蛋白;且其中可任選地,該非編碼RNA係shRNA、miRNA、反義RNA、用於Crispr核酸酶之引導RNA、催化RNA、核糖體RNA、或tRNA。
  33. 如請求項30至32中任一項之方法,其中該新黴素磷酸轉移酶受質係新黴素、康黴素、或G418。
  34. 一種製作包含第二核苷酸序列之宿主細胞之方法,其包含: (a)將第一核酸序列引入至宿主細胞群中,該第一核酸序列包含(i)第一核苷酸序列,其編碼如請求項1至10中任一項之非天然存在的NPT、及(ii)第二核苷酸序列,其包含編碼第二蛋白或非編碼RNA之轉殖基因;其中可任選地,該第二蛋白係治療性蛋白或抗原,或可任選地該非編碼區係shRNA、miRNA、反義RNA、用於Crispr核酸酶之引導RNA、催化RNA、核糖體RNA、或tRNA; (b)   在新黴素磷酸轉移酶受質存在下使該宿主細胞群生長以產生群落;及 (c)    選擇在該新黴素磷酸轉移酶受質存在下生長的細胞群落。
  35. 一種製作包含第二核苷酸序列之宿主細胞之方法,其包含: (a)    將(i)第一核酸序列及(ii)第二核酸序列共引入至宿主細胞群中,該第一核酸序列包含編碼如請求項1至10中任一項之非天然存在的NPT之第一核苷酸序列,該第二核酸序列包含編碼第二蛋白或非編碼RNA之轉殖基因;其中可任選地,該第二蛋白係治療性蛋白或抗原,或可任選地該非編碼區係shRNA、miRNA、反義RNA、用於Crispr核酸酶之引導RNA、催化RNA、核糖體RNA、或tRNA; (b)   在新黴素磷酸轉移酶受質存在下使該宿主細胞群生長以產生群落;及 (c)    選擇在該新黴素磷酸轉移酶受質存在下生長的細胞群落。
  36. 一種製作包含第二核苷酸序列之宿主細胞之方法,其包含: (a)    在新黴素磷酸轉移酶受質存在下使宿主細胞群生長以產生群落,其中該宿主細胞群包含(i)第一核酸序列,其包含編碼如請求項1至10中任一項之非天然存在的NPT之第一核苷酸序列、及(ii)第二核酸序列,其包含編碼第二蛋白或非編碼RNA之轉殖基因;其中可任選地,該第二蛋白係治療性蛋白或抗原,或可任選地該非編碼區係shRNA、miRNA、反義RNA、用於Crispr核酸酶之引導RNA、催化RNA、核糖體RNA、或tRNA;及 (b)   選擇在該新黴素磷酸轉移酶受質存在下生長的細胞群落。
  37. 一種製作包含第二核苷酸序列之宿主細胞之方法,其包含: (a)    在新黴素磷酸轉移酶受質存在下使宿主細胞群生長以產生群落,其中該宿主細胞群包含(i)第一核酸序列,其包含編碼如請求項1至10中任一項之非天然存在的NPT之第一核苷酸序列、及(ii)第二核酸序列,其包含編碼第二蛋白或非編碼RNA之轉殖基因;其中可任選地,該第二蛋白係治療性蛋白或抗原,或可任選地該非編碼區係shRNA、miRNA、反義RNA、用於Crispr核酸酶之引導RNA、催化RNA、核糖體RNA、或tRNA;及 (b)   選擇在該新黴素磷酸轉移酶受質存在下生長的細胞群落。
  38. 如請求項34至37中任一項之方法,其中該等宿主細胞係哺乳動物細胞;可任選地其中該等哺乳動物細胞係人類細胞。
  39. 如請求項38之方法,其中該等哺乳動物細胞係HEK293細胞、CHO細胞、PER.C6細胞、鼠類NS0細胞、纖維肉瘤HT-1080細胞、鼠類Sp2/0細胞、BHK細胞、或鼠類C127細胞。
  40. 如請求項34至39中任一項之方法,其進一步包含培養所選之該細胞群落。
  41. 如請求項34至39中任一項之方法,其中該新黴素磷酸轉移酶受質係新黴素、康黴素、或G418。
  42. 一種宿主細胞,其藉由如請求項34至41中任一項之方法產生。
  43. 一種用於製造表現治療性蛋白或酶的穩定細胞系之方法,其包含: (a)    將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼如請求項1至10中任一項之非天然存在的新黴素磷酸轉移酶(NPT);及(ii)第二核酸序列,其編碼該治療性蛋白或酶; (b)   自步驟(a)之該細胞群中選擇在G418存在下生長的細胞;及 (c)    培養所選之該細胞以產生表現該治療性蛋白或酶的穩定細胞系。
  44. 如請求項43之方法,其中該穩定細胞系表現該治療性蛋白或酶,可任選地其中該治療性蛋白係抗體或抗體片段。
  45. 一種穩定細胞系,其藉由如請求項43或44之方法所產生。
  46. 一種製作病毒生產者細胞系之方法,其包含: (a)    將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼如請求項1至10中任一項之非天然存在的新黴素磷酸轉移酶(NPT);及(ii)第二核酸序列,其編碼一或多種病毒蛋白,其中該一或多種病毒蛋白包括殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合; (b)   自在新黴素磷酸轉移酶受質存在下生長的該細胞群中選擇細胞;及 (c)    繁殖所選之該細胞以產生病毒生產者細胞系。
  47. 如請求項46之方法,其中該一或多種病毒蛋白包括AAV殼體蛋白;AAV殼體蛋白及AAV rep蛋白;套膜蛋白;腺病毒複製所需之腺病毒E1區蛋白;反轉錄病毒套膜蛋白;反轉錄病毒gag蛋白;反轉錄病毒反轉錄酶;或反轉錄病毒套膜蛋白、gag蛋白、及反轉錄酶。
  48. 一種病毒生產者細胞系,其藉由如請求項46或47之方法製作。
  49. 一種病毒生產者細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含: (a)第一核酸序列,其編碼如請求項1至10中任一項之非天然存在的新黴素磷酸轉移酶(NPT);及 (b)第二核酸序列,其編碼一或多種病毒蛋白,其中該一或多種病毒蛋白包括殼體蛋白、套膜蛋白、複製所需之病毒蛋白、或其組合。
  50. 如請求項49之病毒生產者細胞系,其中該一或多種病毒蛋白包括AAV殼體蛋白;AAV殼體蛋白及AAV rep蛋白;套膜蛋白;腺病毒複製所需之腺病毒E1區蛋白;反轉錄病毒套膜蛋白;反轉錄病毒gag蛋白;反轉錄病毒反轉錄酶;或反轉錄病毒套膜蛋白、gag蛋白、及反轉錄酶。
  51. 一種用於製造表現抗原的細胞系之方法,其包含: (a)    將一或多種核酸序列引入至宿主細胞群中,其中該一或多種核酸序列包含:(i)第一核酸序列,其編碼如請求項1至10中任一項之非天然存在的新黴素磷酸轉移酶(NPT);及(ii)第二核酸序列,其編碼抗原;其中可任選地,該抗原係病毒抗原、細菌抗原、真菌抗原、或癌症抗原; (b)   自步驟(a)之該細胞群中選擇在G418存在下生長的細胞;及 (c)    培養所選之該細胞以產生表現該抗原的細胞系。
  52. 一種抗原產生細胞系,其藉由如請求項51之方法製作。
  53. 如請求項43、44、46、47、或51之方法,其中該細胞系係哺乳動物細胞系;可任選地其中該哺乳動物細胞系係人類細胞系。
  54. 如請求項43、44、46、47、或51之方法,其中該細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。
  55. 一種抗原產生細胞系,其包含一或多種核酸序列,其中該一或多種核酸序列包含: (a)第一核酸序列,其編碼如請求項1至10中任一項之非天然存在的新黴素磷酸轉移酶(NPT);及 (b)第二核酸序列,其編碼一或多種抗原;其中可任選地,該一或多種抗原係病毒抗原、細菌抗原、真菌抗原、或癌症抗原。
  56. 如請求項45、48、49、50、52、或55之細胞系,其中該細胞系係哺乳動物細胞系;可任選地其中該哺乳動物細胞系係人類細胞系。
  57. 如請求項45、48、49、50、52、或55之細胞系,其中該細胞系係CHO、PER.C6、鼠類NS0、HEK293、纖維肉瘤HT-1080、鼠類Sp2/0、BHK、或鼠類C127細胞系。
  58. 一種可選擇標記構件,當引入至細菌細胞中時用於賦予對康黴素之抗性、及當引入至哺乳動物細胞中時用於賦予對G418之抗性;其中可任選地,該可選擇標記構件包含SEQ ID NO:20之核酸序列;SEQ ID NO:32之核酸序列;SEQ ID NO:33之核酸序列;SEQ ID NO:34之核酸序列;SEQ ID NO:36之核酸序列;或SEQ ID NO:37之核酸序列。
  59. 一種用於製造生產者細胞系之方法,其包含: (a)    將細菌或哺乳動物細胞用表現載體轉形以製作轉形細胞,該表現載體包含編碼一或多種病毒蛋白之核酸序列及若該轉形細胞係細菌細胞則用於在康黴素存在下生長的構件及若該轉形細胞係哺乳動物細胞則用於在G418存在下生長的構件;及 (b)   在康黴素或G418存在下培養該轉形細胞以獲得生產者細胞系,其中該生產者細胞系表現一或多種來自AAV、腺病毒、反轉錄病毒、慢病毒、單純疱疹病毒、痘瘡病毒、或桿狀病毒的病毒蛋白。
  60. 一種用於選擇具有外源性核酸序列之穩定染色體整合的細胞之方法,其包含: (a)    將真核細胞群用外源性核酸序列轉形,該外源性核酸序列包含用於在G418存在下生長的構件; (b)   在G418存在下培養經轉形之該細胞群,以產生能夠在G418存在下生長的經轉形細胞群落;及 (c)    自步驟(b)中產生的群落中選擇細胞以獲得具有該外源性核酸之穩定染色體整合的細胞;其中可任選地,該外源性核酸序列進一步包含轉殖基因,且所選之該細胞表現該轉殖基因;或該外源性核酸序列破壞對所選之該細胞為內源性的基因表現。
  61. 一種用於選擇具有穩定游離基因體的哺乳動物細胞之方法,其包含: (a)    將哺乳動物細胞群用質體轉形,該質體包含用於在G418存在下生長的構件; (b)   在G418存在下培養經轉形之該細胞群,以產生能夠在G418存在下生長的經轉形細胞群落;及 (c)    自步驟(b)中產生的群落中選擇細胞以獲得具有包含該質體之穩定游離基因體的細胞;其中可任選地,該質體進一步包含EBNA1 OriP核酸序列且所選之該細胞表現EBNA1。
  62. 一種用於選擇暫時表現轉殖基因之哺乳動物細胞之方法,其包含: (a)    將編碼轉殖基因之核酸及用於在G418存在下生長的構件引入至哺乳動物細胞群中; (b)   在G418存在下培養該哺乳動物細胞群48至72小時;及 (c)    自在G418存在下生長的經培養之該哺乳動物細胞群中選擇哺乳動物細胞,其中所選之該哺乳動物細胞暫時表現該轉殖基因;其中可任選地,該轉殖基因包含編碼Crispr核酸內切酶或Crispr引導RNA之核酸序列。
  63. 如請求項59至62之方法,其中該構件係編碼包含選自SEQ ID NO: 38、39、40、41、42、及43之群組的胺基酸序列的非天然存在的新黴素磷酸轉移酶之核苷酸序列。
TW111114949A 2021-04-21 2022-04-20 用於改良磷酸轉移酶之材料及方法 TW202305127A (zh)

Applications Claiming Priority (16)

Application Number Priority Date Filing Date Title
US202163177744P 2021-04-21 2021-04-21
US202163177746P 2021-04-21 2021-04-21
US202163177749P 2021-04-21 2021-04-21
US202163177759P 2021-04-21 2021-04-21
US202163177767P 2021-04-21 2021-04-21
US202163177764P 2021-04-21 2021-04-21
US202163177739P 2021-04-21 2021-04-21
US202163177753P 2021-04-21 2021-04-21
US63/177,764 2021-04-21
US63/177,759 2021-04-21
US63/177,746 2021-04-21
US63/177,739 2021-04-21
US63/177,767 2021-04-21
US63/177,753 2021-04-21
US63/177,749 2021-04-21
US63/177,744 2021-04-21

Publications (1)

Publication Number Publication Date
TW202305127A true TW202305127A (zh) 2023-02-01

Family

ID=83722653

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111114949A TW202305127A (zh) 2021-04-21 2022-04-20 用於改良磷酸轉移酶之材料及方法

Country Status (9)

Country Link
EP (1) EP4326747A1 (zh)
JP (1) JP2024516153A (zh)
KR (1) KR20230173159A (zh)
AU (1) AU2022261882A1 (zh)
BR (1) BR112023021960A2 (zh)
CA (1) CA3217224A1 (zh)
IL (1) IL307870A (zh)
TW (1) TW202305127A (zh)
WO (1) WO2022226005A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7344886B2 (en) * 2002-11-29 2008-03-18 Boehringer Ingelheim Pharma Gmbh & Co., Kg Neomycin-phosphotransferase-genes and methods for the selection of recombinant cells producing high levels of a desired gene product
US20080124760A1 (en) * 2006-07-26 2008-05-29 Barbara Enenkel Regulatory Nucleic Acid Elements
EP1975228A1 (en) * 2007-03-28 2008-10-01 Fachhochschule Mannheim Polynucleotides for enhancing expression of a polynucleotide of interest
US11389531B2 (en) * 2017-12-19 2022-07-19 Janssen Sciences Ireland Unlimited Company Methods and apparatus for the delivery of hepatitis B virus (HBV) vaccines

Also Published As

Publication number Publication date
JP2024516153A (ja) 2024-04-12
CA3217224A1 (en) 2022-10-27
IL307870A (en) 2023-12-01
WO2022226005A1 (en) 2022-10-27
AU2022261882A1 (en) 2023-12-07
KR20230173159A (ko) 2023-12-26
EP4326747A1 (en) 2024-02-28
BR112023021960A2 (pt) 2023-12-26
AU2022261882A9 (en) 2023-12-14

Similar Documents

Publication Publication Date Title
CN107502618B (zh) 可控载体消除方法及易用型CRISPR-Cas9工具
CN111909958B (zh) 血管平滑肌细胞条件性敲除Yap1基因小鼠模型的构建
JP2022130714A (ja) 複製可能ウイルスの存在または非存在を評価するための方法
KR20180056772A (ko) 세포내 유전자 변형 및 증가된 상동 재조합을 위한 보호 dna 주형 및 이용 방법
CN111918972A (zh) 评估存在或不存在有复制能力的病毒的方法和试剂
CN111836825A (zh) 优化的植物crispr/cpf1系统
CN112746083B (zh) 一种通过单碱基编辑靶基因启动子失活基因的方法
KR101755965B1 (ko) Il33 n―말단 도메인 결실을 갖는 염증의 쥣과 모델
CN110343698B (zh) 构建B2m定点敲入人B2M cDNA小鼠模型的方法
CN113906134A (zh) Tau蛋白病模型
US9085767B2 (en) Enhancer-containing gene trap vectors for random and targeted gene trapping
CN112680477A (zh) 一种基于无缝克隆技术的h9n2亚型禽流感病毒的拯救方法
TW202305127A (zh) 用於改良磷酸轉移酶之材料及方法
US6586208B2 (en) Use of suppressor tRNA&#39;s to regulate cytotoxicity during the production of recombinant gene products
CN117561273A (zh) 用于经改善的磷酸转移酶的材料和方法
BRPI0619665A2 (pt) método para melhorar a expressão de um transgene em uma célula hospedeira, cassete de expressão em mamìfero, vetor, célula hospedeira, vacina de dna e composição farmacêutica
CA2743775A1 (en) .beta.gi-igg intron for enhanced anti-igf1r expression
US6730481B2 (en) Primers-attached vector elongation (PAVE): a 5′-directed cDNA cloning strategy
CN112342216B (zh) 用于提高CHO细胞的表达效率的CRISPR-Cas13d系统以及重组CHO细胞
CN111378626A (zh) 一种cho细胞系、构建方法、重组蛋白表达系统、应用
US6699657B2 (en) In vitro system for replication of RNA-dependent RNA polymerase (RDRP) viruses
CN111378677A (zh) 一种dna组装的方法及其应用
KR101825844B1 (ko) 색소를 발현하는 바실러스 속 균주 및 이의 제조 방법
NZ506478A (en) Trans-somatics with gene transfer into mammary epithelial cells
CN115029347B (zh) 识别和调控肝肾细胞纤维化的分子监测序列、重组质粒、抑制病毒