TWI345587B - Methods for the production of insulin in plants - Google Patents

Methods for the production of insulin in plants Download PDF

Info

Publication number
TWI345587B
TWI345587B TW093117421A TW93117421A TWI345587B TW I345587 B TWI345587 B TW I345587B TW 093117421 A TW093117421 A TW 093117421A TW 93117421 A TW93117421 A TW 93117421A TW I345587 B TWI345587 B TW I345587B
Authority
TW
Taiwan
Prior art keywords
leu
gly
ala
gin
glu
Prior art date
Application number
TW093117421A
Other languages
English (en)
Other versions
TW200510529A (en
Inventor
Maurice M Moloney
Joseph Boothe
Richard Keon
Cory Nykiforuk
Gijs Van Rooijen
Original Assignee
Sembiosys Genetics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sembiosys Genetics Inc filed Critical Sembiosys Genetics Inc
Publication of TW200510529A publication Critical patent/TW200510529A/zh
Application granted granted Critical
Publication of TWI345587B publication Critical patent/TWI345587B/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/62Insulins
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Endocrinology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Diabetes (AREA)
  • Microbiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

發明所屬之拮術領诚 本發明係關於植物基因工程方法,及胰 具體言之,本發明係關於胰島素在植物種籽内之生產方 法。 先前技術 於內動物’包含人類’㊉其他脊椎動物 體内血液=萄糖體内環境恆定所需之重要肽荷爾蒙。在健 ΐ的= 去萄糖水準上,,會刺激胰臟U細 胞,刀泌胰島素。胰島素多肽即結合於肌肉、肝臟、脂肪 組織内的特殊受體,以致此等目標組織的葡萄糖攝取量増 加,提高新陳代謝,降低肝臟葡萄糖生產。此等反應的累 積效果,保持血液葡萄糖濃度在一定水準。 … 、 罹患糖尿病的個人,胰島素濃度異常低,本身呈現慢 性高血糖症。慢性高血糖症的臨床徵象多樣,包含目盲^ 腎衰竭,如不治療,終究病死。估計在工業化國家,糖尿 病在死亡排行榜上排第三位’僅次於心臟血管疾病和癌症 (H.C. Barfoed, 1987, Chem· Eng. Pr〇g. 83:49_54)。 為使血液葡萄糖被細胞有效攝取和新陳代謝,糖展病落者 可以例行投服騰島素治療。世界人口大約〇. 7 %罹串、騰島 素依賴性糖尿病(第一型糖尿病)(J. Winter等人,2000 J. of Biotechnol,84:175-185)。此外,估計過去 25 年 來診斷出糖尿病的患者,倍增至約3億人口(T. Kjeldsen 等人,2001,Biotechnol. Gen. Eng. Rev. 18: 89-121) 。因此,亟需有能力以成本有效性方式大量製造人體胰島
五、發明說明(2) 素,以滿足預見成長中的全球胰島素需要。 體内人類胰島素多肽,是利用胰臟石-細胞生產,形 成單一 110種胺基酸多肽鏈前體,即前胰島素原,包含N -末端位置的24種胺基酸預序列,在鏈生物合成完全時立刻 裂解(D.F. Steiner, 2 0 0 0,J. Ped. Endocrinol. Metab, 13:229-239)。遺留的是成熟的人體胰島素,51種胺基酸 蛋白質,由二種多肽鏈組成A(長度為21種胺基酸)和B(長 度為3 0種胺基酸),利用二個鏈間二硫化物鍵連結。此外 ,八鏈包括一個鍵内二硫化物鍵。 人體胰島素曾經使用各種不同的方法製造。通常使用 微生物,例如大腸桿菌(Frank等人,1981,〈肽:第七屆 美國肽化學研討會論文集〉(Rich & Gross合編),Pierce 化學公司,Rockford, 111. 729-739頁;Chan等人,1981 ,Proc. Natl. Acad. Sci. USA 78:540卜5404)、啤酒釀 母菌(Thim等人,1986, Proc. Natl· Acad. Sci. USA 83 :6766-6770),以重組方式製造胰島素。Wang等人 (Biotechnol,Bioeng, 2001, 73:74-79)已表示真菌,諸 如巴斯德畢赤酵母,亦可適用於胰島素生產。另類製法選 項包含,在非人類的哺乳動物細胞線内生產(M. Yanagi ta 等人,1992,FEBS Lett 311:55-59),從人體胰臟單離、 肽合成,或由豬和牛胰島素半合成轉化成人體胰島素。然 而,凡此種種方法均產率低,成本高,不合需要。 使用植物為生物反應體,以大量生產重組蛋白質,已 屬公知,並已生產過多種蛋白質,包含人體治療用蛋白質
第8頁 五、發明說明(3) 。例如美國專利 4, 956, 282 ; 5, 550, 038和 5, 629, 1 75 號揭 示在植物内生產T-干涉病毒蛋白質;美國專利5,650, 307 ;5,716,802和5,763,748號揭示在植物内生產人體血清蛋 白;而美國專利 5,202,422:5,639,947和5,959,177號係 關於在植物内生產抗體。利用植物基礎重組蛋白質生產體 系提供重大優點之一是,提高植物成長的土地面積,蛋白 質生產可廉價大規模到提供大量蛋白質❶反之,醱酵和細 胞培養體系需要大空間、設備和能量需求,使大規模生產 的成本高。然而,儘管事實上使用植物為生物反應體,文 獻良多’且儘管上述預知龐大增加需要大量胰島素,但先 前技術只能提供有限數目的方法,可證明在植物内生產騰 島素的成果(參見Arakawa等人,Nature Biotech,1998 16:934-938 ; PCT 01/72959)。 ’ ’
Arakawa等人揭示融合蛋白質之生產,包括在轉基因 馬鈐薯植物的塊莖内生產胰島素。然而,胰島素僅代 基因塊莖内存在的總可溶性蛋白質含量的〇〇5 %而已。, ,=性蛋白質的〇. 〇5%水準,有眾多生物量必然受到 白質卒取’致使與使用馬鈴薯相關之生產經濟不利。此= ^ )rakawa等人不涉及從馬鈴薯塊莖組織單離胰島素,但 倡議利用弓丨發免疫耐力,涉及透過餵轉基因馬鈴薯塊一 口服膜島素’以防止第一型糖尿病發作。 PCT專利申請案W0 01 /72959號揭示融合蛋白質之生 妙3 ί,轉基因於草的葉綠質小粒内之騰島素,然而,ϋ ”、、'據柄人體蛋白質在植物組織内的累積水準有缺陷,但w〇
五、發明說明(4) 01/72959所繫發明僅限於生產葉綠質小粒,造成在綠色組 織(主要是菸葉)内累積胰島素。由於綠色組織的含水量較 高’必須處理眾多生物量。此外,生產胰島素需在收别時 立即從生物量萃取,因為葉材儲存時很快變質。 因此’鑑於先前技術所提供在植物内重組生產胰島素 相關方法之短缺’目前尚未明瞭利用植物達成在植物内商 業化生產胰島素之合成能力究竟如何。技術上亟需改進在 植物内商業化生產胰島素之方法。 發明内容 本發明係關於联島素在植物内之改進生產方法。尤指 胰島素在種籽内之生產方法。 因此’本發明提供胰島素在植物内之表達方法,包 括: (a) 提供嵌合核酸構造物,在5,至3,轉錄方向包括下 列’做為操作上聯結成份: (1 )可控制在植物種籽細胞内表達之核酸序列; (i i )把胰島素多肽加以編碼之核酸序列; (b) 把嵌合核酸構造物引進植物細胞内;以及 (c) 令植物細胞成長為成熟植物,可結籽,由種軒 達姨島素。 在本,明較佳具體例中,可控制在植物種籽細胞内表 現的核酸序列,是種籽偏好的啟動子,諸如腰豆蛋白啟動 在另一較佳具體例中,本發明提供胰島素在植物内之
第10頁 五、發明說明(5) 表達方法,包括: (a) ^供嵌合核酸構造^,在5’至3,轉 包括下 列,做為操作上聯結成份: (i)可控制在植物種籽細胞内表達之列; :1)把姨島素多胜加以編碼之核酸 可保持在膜包細胞内區室裡 ’把多肽加以編碼之核酸序 (b) 把嵌合核酸構造物引進植物細胞 (c) 令植物細胞成長為成熟植物,’以 達胰島素》 可結籽,由種籽表 在本發明又一具體例内,膜包細胞内 θ (ER)或ER衍生之儲泡。因此,本發明提物 之表達方法,包括: 奴供胰島素在植物内 (1供構造物’在5,至3,轉錄方向包括下 列’做為操作上聯結成份: (U可控制在植物種籽細胞内表達之核酸序列; (1 1 )把胰島素多肽加以編碼之核酸序列; (1 1 1 )可將騰島素多肽保持在ER或ER衍生之儲泡 内,把夕肽加以編碼之核酸序列; b把嵌合核酸構造物弓丨進植物細胞内;以及 C V植物細胞成長為成熟植物,可結籽,由種籽表 達胰島素》 入找f i:2佳具體例巾,在核基因組整合狀況下,把嵌 5核酸構每物引進植物細胞内。纟如此狀況下,嵌合核酸
五、發明說明(6) 序列穩定整合於植物基因組内。 於再—較佳具體例中’把胰島素編碼之核酸序列,供 植物授符碼用途最適宜,炎將連接肽(〇肽)加以編碼的^ 酸序列縮短《本發明所用較佳核酸序列,把人、牛或緒^ 島素加以編碼。按照本發明’使用將胰島素原序列加以編 碼之核酸序列,其中胰島素原經修飾,把c_肽長度缩短: 在另一要旨中,本發明提供包括胰島素在内的植物種 籽之回收方法。因此,按照本發明,獲得包括胰島素 的植物種籽之方法,包括: (a) 提供嵌合核酸構造物,在5,至3,轉錄方向包括下 列’做為操作上聯結成份: (i )可控制在植物種籽細胞内表達之核酸序列; 和 (1 1 )把胰島素多肽加以編碼之核酸序列; (b) 把嵌合核酸構造物引進植物細胞内; (1令植物細胞成長為成熟植物,可結籽;以及 物故穫種軒,其十種軒包括有姨島素。 素。 存在的全部種籽蛋白質最好至少10%為胰島 籽可用來獲得傳衍植物的族群,各包括表達胰島素 <野多種狩。 佳且亦包括可結籽表達胰島素之植物。在本發明較 Ϊ錄;:U軒之植物包括嵌合核酸序列,在 第12頁 五、發明說明(7) (a) 可控制在植物種籽細胞内表達之第一核酸序列, 在操作上加以聯結; (b) 把胰島素多肽加以編碼之第二核酸序列,其中種 籽含有胰島素。 在較佳具體例中,嵌合核酸序列整合於植物核基因組 内。 在本發明更佳具體例中,使用植物為紅花,一種亞麻 植物或阿拉伯芥(Arabidopsis)植物。 在又一要旨甲,本發明提供包括有胰島素之植物種籽 。在本發明較佳具體例中,植物種籽包括嵌合核酸序列, 在5’至3’轉錄方向包括下列: (a)可控制在植物種籽細胞内表達之第一核酸序列, 在操作上加以聯結; (b )把胰島素多肽加以編碼之第二核酸序列。 種籽内存在的全部種籽蛋白質最好至少10%是胰島素 。種籽是利用種籽細胞合成的所需胰島素多肽之來源,可 經萃取,而胰島素可用來治療糖尿病患者。 本發明其他特點和優點,由下列詳述即可容易明白。 然而,須知表示本發明較佳具體例之詳細說明和特定實施 例,僅供說明之用,因為在本發明精神和範圍内之各種變 化和修飾,凡精於此道之士均可從此詳細說明中較易明 白。 實施方式 如上所述,本發明係關於胰島素在轉基因植物中之改
第13頁 五、發明說明(8) 進生產方法。本發明人等意外發現,在植物種籽内以重組 方式生產胰島素,可在植物内達成胰島素累積水準超過全 部細胞蛋白質0.1%。此等表達水準比前此所達成者高至 少10倍,使胰島素在植物内的商業化生產成為可行。在種 籽内生產提供把胰島素做為原物料儲藏和運輸之可行性, 因為胰島素保有從儲藏種籽萃取時之活性。此外,需經萃 取的生物量數量有限,因植物種籽内存在的水量較低。 因此,按照本發明提供胰島素在種籽内之表達方法, 包括: (a) 提供嵌合核酸構造物,在5’至3’轉錄方向包括下 列,做為操作上聯結成份: (i )可控制在植物種籽細胞内表達的核酸序列; 和 (i i )把胰島素多肽加以編碼的核酸序列; (b) 把嵌合核酸構造物引進植物細胞内;以及 (c )令植物細胞成長為成熟植物,可結籽,其中種籽 表達胰島素。 按照本發明,意外發現,如果胰島素多肽在種籽細胞 内,是膜包細胞内區室加以區室化,使胰島素以此方式在 種籽内表達,則胰島素在植物種籽内累積的水準為前所未 見。因此,按照本發明提供胰島素在植物内之較佳表達方 法,包括: (a)提供嵌合核酸構造物,在5’至3’轉錄方向包括下 列,做為操作上聯結成份:
第14頁 五、發明說明(9) (i )可控制在植物種籽細胞内表達之啟動子; (i i )把胰島素多肽加以編碼之核酸序列;和 (i i i )可將胰島素多肽保持在膜包細胞内區室裡 ,把多肽加以編碼之核酸序列; (b) 把嵌合核酸構造物引進植物細胞内;以及 (c) 令植物細胞成長為成熟植物,可結軒,其中種耔 表達胰島素。 術語和定義 除非另有載明,本文所用全部技術和科學術語,應具 有本發明所屬技術的行家通常所知之同樣意義。如果容許 ,凡專利、專利申請案、專利公告,及其他出版物,含有 來自GenBank、SwissPro及本案内容提及資料庫之核酸和 多肽序列,均全部在此列入參考。 本文所用「核酸序列」術語,指核苷或核苷酸單體序 列,由天然發生的鹼基、糖或内糖(骨架)鍵組成。此術語 亦包含修飾或被取代序列,包括非天然發生單體或其一部 份。本發明核酸序列可為去氧核糖核酸序列(DN A)或核糖 核酸(RNA),並可含有天然發生鹼基,包含腺嘌呤、鳥嘌 吟、胺經喷咬、胸腺喷咬去氧核和尿鳴咬。序列亦可含有 修飾之鹼基,該修飾鹼基例包含氮雜和脫氮腺嘌呤、鳥嘌 吟、胺經嘴咬、胸腺哺咬去氧核和尿嘴咬,以及黃嗓吟和 次黃嗓吟。 「把胰島素加以編碼之核酸序列」和「把胰島素多肽 加以編碼之核酸序列」在此可以互換使用,指可把胰島素
第15頁 五、發明說明(11)
Appl. Math., 1981,2:482),故二序列間可得最高階匹 配,而二序列間決定一致的胺基酸數。二胺基酸序列間百 分比一致之其他算法,係一般技術所知,包含例如 Carillo和Lipton所述(SIAM J. Applied Math., 1988, 48:1073),以及在Lesk所編紐約牛津大學出版社1988年< 生物計算法:資訊學和基因組計劃》中之〈計算分子生物 學〉。一般而言,此等計算採用電腦程式。在此方面可用 之電腦程式,包含但不限於GCG(Devereux等人,Nucleic Acids Res., 1984, 12:387) BLASTP, BLASTN和FASTA (Altschul 等人,J. Molec. Biol., 1 990,2 1 5:403 )。 「至少中度嚴緊雜交條件」指促進二相輔核酸序列間 在溶液内選擇性雜交所選擇條件。雜交可發生於核酸序列 分子全部或一部份❶雜交部份典型上長度至少1 5 (例如2 〇, 25, 30, 40或50)核苷酸。凡此道專家均知核酸雙成物,或 混合物’是利用Tm決定,在含鈉緩衝液内是鈉離子濃度和 溫度之函數(Tn = 81.5 t-16.6( Logl〇〔Na+〕+〇.41(%(G + C) -600/1),或類似方程式因此’在洗液條件内決定雜交 定性的參數,是鈉離子濃度和溫度。為檢定與已知核 酸分子類似但非一致分子,可假設1%誤配,如果找尋核 酸分^ ’在1會降約rc,有>95% —致’最後洗濯溫度會 降f 5c。基於如此考量,此道專家能夠輕易選擇適當的 f父條件。在較佳具體例中,選用嚴緊雜交條件。舉例而 吕_可採用下列條件達成嚴緊雜交:根據上述方程式,在 C,於5 X氣化鈉/檸檬酸鈉(SSC) / 5 x Denhardt氏
第17貢 五、發明說明(12) 溶液/ 1. 0% SDS雜交,接著在6(PC,利用〇 2 x ssc / 〇」 % SDS洗液。中度嚴緊雜交條件包含在42它的3 χ ssc洗濯 須知使用另類緩衝液、肽類和溫度,可達成 相等的嚴緊,有關雜交條件之其他入門可參見《分子生物 學〉(John Wiley & Sons,無約,1 989 ) 6. 3· 1-6. 3. 6之 〈現有議題〉,以及Sambrook等人的《分子複製,實驗室 手冊 > (Cold Spring Harbor Ub0ratory Press, 1989) 第3卷。 胰島素」和「胰島素多肽」可互換使用,指含有表 1内所列胰島素多肽(序列編號7至145)之任何和全部胰島 ,多肽,以及包括胺基酸殘基序列的多肽分子,該胺基酸 序列係(1)與構成上述任何胰島素多肽的胺基酸序列實質 上一致,或(ii)在至少中度嚴緊條件下能夠雜交於上述任 何核酸序列編碼胰島素,或在至少中度嚴緊條件下能夠雜 交於上述任何核酸序列編碼胰島素,但用於同義密碼子之 =酸序列所編碼者。胰島素和胰島素多肽包含前胰島素多 、和微型胰島素多肽。胰島素多肽以人體、豬或牛來源者 「可保持胰島素多肽於膜包細胞内區室裡之多肽」, 聯結於胰島素多肽之任何多肽,可將胰島素多肽在 膜匕圍的次細胞結構内區室化’並位於植物細胞之細胞内 空間裡’由植物細胞漿膜所界定。 :可保持胰島素多肽於ER或ER衍生儲泡内之多肽」, 用來指聯結於胰島素多肽時可將胰島素多肽於内質網裡,
五、發明說明(13) 或在内質網所衍生儲存區室,諸如植物細胞内之油體,能 夠加以區室化之任何多肽。 在核酸序列脈絡内所用「嵌合J術語,指非天然聯結 之至少二聯結核睃序列。嵌合核酸序列包含不同天然源的 聯結核酸序列。例如構成聯結於把人體胰島素編碼的核酸 之植物啟動子的核酸序列,可視為嵌合。嵌合核酸序列亦 可包括同樣天然源之核酸序列,惟係非天然聯結者。例如 ’構成由特殊細胞類所得啟動子之核酸序列,可聯結於將 同樣細胞類所得多肽加以编碼的核酸序列,但通常係聯結 於構成啟動子之核酸序列。嵌合核酸序列亦包含凡包括天 然發生核酸序列聯結於任何非天然發生核酸序列之核酸序 列。 息-持將t島素编瑀的嵌合核酸序列和可控制在植物種 籽胞内表達的啟動早之重組表達載體製造 本發明方法和組成物可用的把胰島素編碼之核酸序列 ,可為把胰島素多肽加以編碼之任何核酸序列,包含任何 胰島素原和前胰島素原。 把胰島素加以編碼的核酸序列之例’在技術上業已公 知,一般從各種哺乳類可輕易取得,包含人(G.I. Be 11等 人,1980, Nature 284:26-32)、豬(R.E. Chance等人, 1968, Science 161:165-167)、牛(J.D’ Agostino等人, 1 987, Mol. Endocrinol,1:327-331 )、羊(J.D.
Peterson等人,1972, Biol. Chem. 247:4866-4871)等, 以及植物源(A.E.A. Oliveira 等人,1999,Protein
第19頁 五、發明說明(14) " 一 ' 絲Lett. 6 ··丨5 — 21)。可用的胰島素編碼序列,包含將 鏈加ί碼者,諸如序列編號7至145。把騰島素多肽 .^的各相對應核酸序列’可經由表1所提供Swiss 別號碼輕易識別。使用此等核酸序列,把核酸 姑I 4Γ ^編碼的其他新穎胰島素,即可使用此道專家所知 &,1 ^易^別。例如文庫,像表現文庫、CDNA和基因組文 ,可~可筛選’而包含來自序列計劃的序列資訊之資料庫 丄°、以查尋類似序列。可使用另類方法,將把胰島素多肽 以編碼的另外核酸序列單離,並按照本發明發現和使用 新額序列。在較佳具體例中,把胰島素加以編碼的核酸序 列係人、豬' 牛的胰島素。 技術上已知許多胰島素類似物(例如參見美國專利第 5’461’ 031 ; 5, 474, 978; 5, 164, 366 和 5, 008, 241號),可 按照本發明使用。於此可用的類似物包含人體胰島素分子 ’其中B-鏈的胺基酸殘基28 (B28),以從其天然脯胺酸殘 基改變成門冬胺酸塩 '賴胺酸或異白胺酸。另一具體例中 ’在B29的賴胺酸殘基經修飾成脯胺酸。此外,A21的門冬 酿胺可改變為丙胺酸、谷醯胺、谷胺酸蜢、甘胺酸、組胺 酸、異白胺酸、白胺酸、蛋胺酸、絲胺酸、蘇胺酸、色胺 酸、酪胺酸、纈胺酸。在B3的門冬醯胺亦可修飾為賴胺酸 。於此可用的胰島素類物其他例包含··缺乏B30殘基的人 體胰島素’通常亦稱為"desB30"或"BC1-29)";缺乏最後3 個胺基酸殘基的胰島素"B(l-27)”,·在B1缺乏苯基丙胺酸 殘基之胰島素分子;以及其中A鏈或B鏈具有N-末端或C -末
第20頁 五、發明說明(15) 端延伸體之類似物,例如B鏈可為N-圭—> 延長。 不端添加二精胺酸而 =佳具It射,;^把胰島素編瑪 胰島素在又一較佳具體例中,所用把胰島編碼 的1酸序列分子,其中C-肽已相對於其天然修飾過。 C-肚内的胺基酸殘基可被取代,而^肽可加長或縮短。因 此,此處「微型胰島素」指經修飾的胰島素多肽,故卜肽 長i = K型為短。較佳具趙例中,微型姨島素 。微型姨島素分子之C-S太以比20個胺基酸殘基短為佳,更 好是比15個胺基酸殘基短,最好比9個胺基酸殘基短,例 如7、5或3個殘基。一如天然胰島素分子情形,微型胰島 素C肽宜在其C -和N -末端包括裂解部份。此項裂解部份可 為技術上已知之任何方便部份’例如蛋胺酸可被溴化氰裂 解,單一鹼基殘基或一對鹼基殘基,可利用胰蛋白酵素或 類似之蛋白酵素’或羧基肽酵素裂解。例如c_肽可包括c_ 末端賴胺酸’例如Ala-Ala-Lys(序列編號146),或緊接 Gly A1殘基則的二元處理部份’例如Asn_LyS-Arg(序列編 號147)或人以4”-1^3-6111-1^8 41(序列編號148),或緊 接G1 y A1殘基前之四7〇處理部份,例如Arg_Arg_Lys_Arg (序列編號149)。因此,本發明可用之微型胰島素分子包 含: Β( 1 -29/30 )-Χ1-Χ2-Χ3-γ1-Α(1-21) 其中,乂!為任何胺基酸; X2為任何胺基酸;
第21頁
五、發明說明(16) X3為 Lys 或 Arg ;
Yi為胺鍵或卜17胺基酸殘基; B(i-29/30)為含有胺基酸殘基卜29或1-30的人體胰 島素B鍵之B鏈; AC1-21)為含胺基酸殘基卜21的人體胰島素A鏈之A 鍵。 在較佳具體例内’X,為鹼基胺基酸殘基(Lys或Arg), Yi為肽鍵或卜17胺基酸殘基,其中C-末端殘基為鹼基胺基 酸殘基(Lys或Arg)。 此外’於此可用之微型胰島素分子,包括下式可代表 者:
B(l-27)-X2-X3-X1-Y-A(l-21) 其中’Xi為卜18胺基酸殘基之肽,包括至少一芳香族胺基 酸殘基; X2為在B鏈28位的Pro, Asp, Lys或lie之一; X3為在 B鍵 29 位的 Pro, Lys,Ala, Arg 或 Pro-Thr之一; Yi 為 Ly s 或 Arg ; B(l-27)為含胺基酸殘基卜27的人體胰島素B鏈之B 鏈; AC1-21)為含胺基酸殘基卜21的人體胰島素A鏈之A 鍵0
本發明所用把微型胰島素多肽加以編碼的核酸分子另 外例,包含Markussen等人,Walter de Gruyter & C0. 1987车《肽類》1 89- 1 94頁;Thim等人1 989在《遺傳學和
第22頁 五、發明說明(17) 工業微生物的分子生物學》,美國微生物學學會,3 2 2- 328頁;以及美國專利4, 916, 212; 5, 324,641 及 6, 521,738 號所載。把胰島素加以編碼以製造胰島素類似物的核酸序 列變更例,可用技術專家所知各種核酸修飾技術製得,包 含例如定點誘變、定向突變、隨機突變、添加有機溶劑、 基因改組,或其組合,以及此道專家所知之其他技術 (Shraishi等人,1988, Arch. Biochem Biophys, 358: 104-115 ; Galkin等人,1997, Protein Eng. 10:687-690 ;Carugo等人,1997, Proteins 28:10-28; Hurley等人, 1996, Biochem, 35:5670-5678 ; Holmberg等人,1999, Protein Eng. 12: 85卜856 )。 按照本發明,意外發現若胰島素在種籽内的表達方式 是,將種籽細胞内之胰島素多肽在膜包細胞内區室裡區室 化’則胰島素在植物種籽可累積到前所未有的水準.^在本 發明較佳具體例中’胰島素多肽是在ER或ER衍生的儲泡内 區室化。為達成在ER或ER衍生儲泡内如此累積,按照本發 明’將把胰島素加以編碼的多肽連結至多肽,造成胰島素 要保持在ER或ER衍生的儲存胞器内,而非從ER送出,例如 送到質外體。在本發明較佳具體例中,能夠保持胰島素多 肽之多肽’含有C -末端ER存留模體。此等C -末端ER存留模 趙例有KDEL、HDEL、DDEL、ADEL和SDEL序列(序列編號分 別為150至154)。其他例包含HDEF(序列編號155)(Lehmann 等人 ’ 200 1,Piant-PhySi〇i 1 27( 2):436-49),或靠近位 於2和3、3和4或4和5位置的二精胺酸(植物生理學摘要 第23頁 五、發明說明(18) --- 2001目錄,2001年7月,providence,美國洛德島)。把〇_ 末端ER存留模體加以編碼的核酸序列,宜連結到把胰島素 多肽編碼的核酸序列,其方式為,把能夠將胰島素保持於 ER内的多肽’連結到胰島素多肽的c_末端尾。 在又一較佳具體例中,胰島素多肽是連結到能夠將胰 島素多肽保持在ER衍生儲存胞器内之多肽。在較佳具體例 中’ E R衍生儲存胞器係油體,而胰島素多肽連結到油體蛋 白質。在此方面可用之油體蛋白質,包含天然與油體相關 之任何蛋白質。特佳油體蛋白質為油質蛋白。例如玉米油 質蛋白(Bowman-Vance等人,1987, J. Biol. Chem. 262 :11275-11279 ;Qu等人,1990, J. Biol. Chem. 265: 2238-2243 或甘藍(Lee等人,1991,Plant Physiol, 96: 1395-1397)’角結合蛋白,參見例如Genbank登記號 AF067857),以及steroleosins(Lin等人,2002, Plant Physiol, 128(4):1200-11) »在又一較佳具體例中,油體 蛋白質是植物油質蛋白,且與其他植物油質蛋白,諸如從 Arabidopsis thaliana(序列編號 156)或 Brassica napus (序列編號1 5 7 )單離之油質蛋白,共有序列相似性。在另 一具體例中,油質蛋白是取自植物、真菌或其他來源的鈣 結合蛋白,與其他植物的鈣結合蛋白,諸如自 Arabidopsis thaliana(序列編號158和159)單離之約結合 蛋白,共有序列同系。又一具體例中,油體蛋白質為 steroleosin(序列編號160) ’是一種因醇結合去氫酵素 (Lin L-J等人,2002, Plant Physiol 128:1200-1211)。
第24頁 五、發明說明(19) 能夠把胰島素保持在ER或ER衍生儲存胞器之多肽類, 典型上是不會裂解,而胰島素可以融合蛋白質的形式累積 ’典型例有使用KDEL住留訊號來保持多肽於ER内,或使用 油體蛋白質來保持多肽於ER所衍生儲存胞器内之情況。 嵌合核酸序列可另含把核酸序列目標定在内膜系統之 核酸序列(「訊號肽」在本發明使用能夠把多肽保持於 ER内之序列’諸如KDEL、HDEL或SDEL多肽,把胰島素多肽 保持在ER内之具體例中,特別需含有把訊號肽加以編碼之 核酸序列。此處可用之訊號肽例,包含菸草病原相關蛋白 質(PR-S)訊號系列(序列編號i61)(Si jmons等人,1 990 ,
Bi 〇/technology,8:217-221),凝集素序列(Boehn等人, 2000, Transgenic Res. 9(6):477-86),來自Phaseolus vulgaris富羥基脯胺酸的糖蛋白之訊號序列(γ3η等人, 1 9 97,Plant Phyiol,115(3):915-24,和Corbin等人, 1987,Mol Cell Biol 7(12):4337_44),馬铃著patatin 訊號序列(G. Iturriaga 等人,1989, Plant Cell 1:38 卜 390,和 Bevan等人,1986, Nuc. Acids Res. 41:4625- 4638 ),以及大麥a -澱粉酵素訊號序列(Rasmussen和
Johansson, 1992, Plant Mol. Biol. 18(2):423-7)。此 種目標訊號可在體内從騰島素序列裂解,典型上例如使用 質外體目標訊號情況’諸如菸草病原有關之蛋白質-S(PR- S)訊號序列(Sijmons 等人,1990,Bio/technology,8: 217-221)。其他訊號肽’使用SignalP全球網路伺候機可 以預計〇11:七?://*\^.(^3.(11;11.(11^/861^1。65/81居1131?),預
第25頁 五、發明說明(20) _ 計胺基酸序列中訊號肽從不同微生物裂解部位 。一般而言,主要胺基酸序列少許保守, 子在和位置 學性質保守到若干程度。訊號肽類之概括结;;般生理化 胺基末端「η區」,含帶正電荷殘基,中 構有3 短 大小範圍在7至15個胺基酸,而羧基末端「、c區 ^區」 基酸,以及由膜結合訊號肽醒酵素可辨識的‘ =二胺
Nakai, 2000, Advances in Protein Chem 54-277-^44^ 。按照此處亦可使用的目標訊號,包含天然胰島 列(以人趙序列而言,長度為24個胺基酸)。在其、二且 例中’使用N末端位置的質外體目標序列,諸如'上 序列,與C末端位置的ER住留序列,諸如K〇EL序列組 在又一較佳具體例中,把酵母因子前導序 的核酸序列,連結到把胰島素編碼的核酸序列Ν 於 此可用的酵母前導序列或從酵母前導序列衍生之 / 含序列編號162至171所列(Kjeldsen等人,2〇〇ι《生物 科技和遺傳工程評論》18:89_121)β此等前導’ 2 Γίΐ導Ϊ列^的核酸c末端,和把姨島素編碼的序 列N末端之區隔肽。按照此處所述該區隔序並 Ϊ 2號酸:。f此,例如可用區隔序列的序列 :程評論”8:89-12。。在本發明使用酵母前導技广傳 =例中,把胰島素多肽編碼的核酸序列,以 玄 肚為佳。按照此’在特佳具趙例中,使用把===
五、發明說明(21) 的核酸序列,連結到把酵母分泌前導肽編碼的核酸序列, 詳述於實施例1。 嵌合核酸序列亦可包括造成N和/或C末端穩定蛋白質 伸展之多肽類。此種伸展可用來穩定和/或有助於胰島素 多肽鏈之折疊。可用於此的多肽伸展包含例如:把單鏈抗 體編碼之核酸序列、把Affibody®分子(Affibody AB)編碼 之核酸、把霍亂毒素的無毒B亞基編碼(CTB)之核酸序列 (T. Arakawa等人,1998, Nat. Biotechnol, 16:938), 或該多肽類之組合。在特佳具體例中,胰島素多肽保持於 ER内,係使用例如上述KDEL序列,與諸如從植物細胞回收 胰島素多肽會發生植物細胞整體性斷裂時,使胰島素多肽 與油體相關之穩定多肽組合。此種多肽之例為單鏈抗體, 具有供油體用之特異性。本發明此具體例詳見實施例 在又一較佳具體例中,單鏈抗體具有胰島素用之特異性。 在又一具體例中’裂解部位可位於胰島素的N末端上 游和C末端下游,使胰島素多肽可從融合同伴裂解,而得 單離胰島素。如此裂解部位可見於wo 98/49326(融合蛋白 之裂解方法)和相關專利申請案,以及LaVal 1 ie等人 (1994)〈融合蛋白之酵素方式和化學方式裂解〉,收入《 分子生物學中之當前議題》第16.45_16417頁,j〇hn Wi ley & Sons, lnc·,New York NY。在較佳具體例中, 裂解部位是四元接頭(例如Arg_Arg_Lys_Arg,序 149)’可利用胰蛋白酵素裂解。在又一具體例中裂解部 位為KLIP 8(序列編號174),可利用包含凝乳酵素的門冬
五、發明說明(22) 胺酸蛋白酵素裂解。 本發明又提供從宿主細跑成份分離異種蛋白質之方法 ,係將油體部份分配,隨後經由異種蛋白質_油體蛋白質 融合之特殊裂解,釋出異種蛋白質。裂解部位可視需要位 在異種多肽的N末端上游和^^末端下游’使融合多肽裂解, 並可利用相分離分為成份肽類。 利用核酸序列按照為姨島素多肽表達所選用特殊植物 細胞類之較佳密碼子用法最適化,或利用改變去穩定 mRNAs所知模體,可以改變把胰鳥素編碼之核酸序列,進 一步改進表達水準(例如參見:PCT專利申請案97/02352) 。把胰島素多肽編碼的核酸序列密妈子用法,與植物細胞 型的密碼子用法加以比較’得以識別會變化的密碼子。藉 改變密碼子用法以構造合成基因,載於例如PCT專利申請 案 93/07278 號。 在較佳具趙例中,把所用胰島素編碼之核酸序列,以 序列編號1、3、5或195號代表。 按照此,把胰島素編碼的核酸序列,係聯結於能夠控 制胰島素多肽在植物種籽細胞内表達之啟動子。因此,本 發明亦提供聯結於能夠控制在植物種籽細胞内表達的啟動 子之把胰島素編碼的核酸序列。在此可用之啟動子為一般 技術認知,包含任何植物衍生的啟動,能夠控制多肽類在 植物内之表達。一般而言,按照此選用雙子葉植物時,可 用雙子葉植物品種所得啟動子,而選用單子葉植物品種時 ’可用單子葉植物啟動子。可用之組成型啟動子,包含例 HI Ι»ϋΙ
五'發明說明(23) 如35S花椰众鎮嵌病毒(CaMV)啟動子(Rothstein等人, 1987,〈基因> 53:153-161),稻米肌動蛋白啟動子 (McElroy等人,1990, <植物細胞>2:163-171;美國專 利第6,429,357號),泛蛋白啟動子,諸如玉米泛蛋白啟動 子(美國專利第5,879, 903和5, 273, 894號),以及香芹泛蛋 白啟動子(P. Kawalleck 等人,1 9 9 3, Plant Mol. Biol. 21:673-684)。 在較佳具體例中,所用啟動子是胰島素多肽和種籽組 織優先表達結果之啟動子。在此方面「種籽偏好啟動子」 係控制重組蛋白質(即胰島素)表達之啟動子,故成熟植物 内呈現的重組蛋白質總量宜至少80%呈現在種籽内。更好 是成熟植物内呈現的重組蛋白質總量至少90%呈現在種籽 内。最好是成熟植物内呈現的重組蛋白質總量至少95%呈 現在種籽内。在此方面可用之種籽偏好啟動子,包含例如 菜豆蛋白啟動子(Sengupta-Gopalan 等人,1 985, Proc. Natl. Acad. Sci. USA 82:3320-3 324);阿拉伯芥 18 kDa 油質蛋白啟動子(美國專利5, 792, 922號),或亞麻油質蛋 白啟動子(W0 01/16340);亞麻豆蛋白般的種籽儲存蛋白 (linin)啟動子(W0 0 1/1 6340);亞麻2S儲存蛋白啟動子 (WO 01/16340);胚乳偏好之啟動子广諸如Amy32b啟動子 (Rogers & Milliman, J. Biol. Chem., 1984, 259: 12234-12240)、Amy6-4啟動子(Kursheed & Rogers 等人, J. Biol. Chem., 1988, 263:18953-18960),或Aleurain 啟動子(Whittier等人,1987, Nucleic Acids Res., 15:
第29頁 五、發明說明(24) 251 5-2535),或 arcelin豆啟動子(GD Jaeger 等人 2〇〇2 Nat· Biotechnol,Dec; 20:1265-8)。各種植物中’可用’ 新啟動子持續不斷發現。許多植物啟動子的例可杳 之
Ohamuro等人(Biochem,of Plants.,1 989,15.1:82) 在此可用某些能夠增進胰島素多肽表達的遠蚤。 此等元素包含來自某些病毒的非轉譯前導序列, ' 前導序列(Jobling 和 Gehrke,1 987,Nature, 325.62k 625) , 以及與玉米 泛蛋白 啟動子 關聯的 内含子 (美國 5’504,200號)》—般而言,可製備嵌合核酸序列、,國故 =5表Ϊ的遺傳元素’可位於離把胰島素多肽編碼的核酸 按照本發明,包括能夠控制在植物 達核酸㈡= -,本發明包含ΐ:表:=種:;::5之至良3好=、因 括下列做為操作上聯結成份:㈣的5至3方向,包 (1)能夠控制在植物種籽細胞内 (⑴把姨島素多肽編碼之核酸序表達之核酸序列,和 其中表達載體適於在種籽细胞内表 内表遠,音沪舌野細胞円表達°適於在種籽細胞 結到達成在種籽細胞内表这 嵌。核酸序列、聯 瑪之-素’含有轉錄終止區、把標諸基因編 體例中,表達栽體又句杯知被麻―=眾起點等。在較佳具 包括把載艎或其一部份整合入植物細 五、發明說明(25) 胞核基因組内所需之遣傳元素,例如T-DNA左、右邊際序 列’在本發明使用草原桿菌素將植物細胞轉型的具體例中 ,方便整合於植物核基因组内。 一如前述,重組表達載體一般包括轉錄终止子,除了 用做轉錄终止的訊號外’又可做為能夠伸展mRNA半衰期的 保護元素(Guarneros 等人,1 982,Proc. Natl. Acad.
Sci. USA,79:238-242)。轉錄终止子一般從約200核苷酸 到約1000核苷酸’並製備表達載體,故轉錄终止子位在把 胰島素編瑪的核酸序列3’處。於此可用之终止序列,包含 例如胭脂鹼终止區(Bevan等人,1 983,Nucl. Acids.
Res. 11:369-385)、菜豆驗終止子(van der Geest 等人, 1 994,Plant J· 6:41 3-423)、arcelin 終止子(GD Jaeger 等人,2002,Nat. Biotechnol,Dec; 20:1 265-8),根癌 農桿菌的章魚鹼合酶基因用之終止子,或其他類似·之功能 元素。轉錄终止子可按An所述獲得(An, 1987, Methods i η E n z y m. 1 5 3 : 2 9 2 ) 〇 按照本發明,表達載體還可含有標誌基因。本發明可 用之標諸基因包含可將轉型細胞與非轉型細胞分辨之所有 基因’包括所有可選擇和可篩檢之標誌基因。標誌基因可 為抗性標誌,諸如抗生素抗性標誌,例如對抗卡那黴素 (美國專利6, 174, 724號)、胺苄青擻素、G4 18、薄萃擻素 、潮擻素’得以利用化學手段或對抗化學劑的耐受性標誌 ’諸如通常植物毒性甘露糖(Negrotto等人,2000,Plant Cell Rep. 19:798-803)選擇特性。於此可用之其他方便 五、發明說明(26) 標誌’包含能夠輪送對抗除草劑的抗性之標誌,諸如 glypho sate(美國專利 4, 940, 935 和 5, 188, 642號)、 口11〇3?11111〇1;111^(^11(美國專利 5,879,903號),或磺醯基脲 (美國專利5, 633, 437號)。抗性標誌聯結於把胰島素多肽 編碼之核酸序列附近’可用來維持對尚未失去把胰島素多 肽編碼的核酸序列之植物細胞或植物族群的選擇壓力。可 用來透過目視檢查檢定轉型體的可筛檢標誌,包含葡 糖苷酸酶(GUS)(美國專利第5, 268, 463和5, 599,670號), 以及綠色螢光蛋白(GFP)(Niedz等人,1 995,Plant Cell Rep., 14:403)。 適合把核酸序列引進植物内的重組載體,包含土壤桿 菌屬和根瘤菌屬基礎之載體,諸如Ti和Ri質粒,包含例如 pBINl9(Bevan, Nucl. Acid. Res., 1984, 22:8711-8721 ),pGKB5(Bouchez等人,1993, C R Acad. Sci. Paris, 《生命科學》,316:1188-1193),pCGN系列雙載體 (McBride和Summerfelt, 1990, Plant Mol. Biol. 14: 269-276),以及其他雙載體(例如美國專利4, 940, 838號 )° 本發明重組表達載體可按照分子生物學專家所知方法 製造。此等製法典型上涉及大腸桿菌的菌種,以及中間選 殖宿主《大腸桿菌載體和植物轉型載體的製法,可用通常 已知技術完成,諸如限制消化、連接作用、凝膠電泳、 DNA定序、聚合酵素鍵反應(PCR),及其他方法。有各種選 殖載體可進行製備重組表達載體所需必要步驟。在大腸桿
五、發明說明(27) 菌内具有複製系統功能之載體當中,有諸如PBR322 pUC系列載體、M13mp系列載體、pBlUescript等。典 ,此等選殖載體含有標誌,得以選擇轉型細胞。核酸 可引進於此等載趙内’而載趙可引進於在適當培養基内 長的大勝桿菌内。重組表達載體在細胞採集和溶胞時,可 輕易從細胞回收。再者,關於重組載體製造之導覽,可例 如參見Sambrook等人(分子選殖〉實驗室手冊,c〇ld
Spring Harbor實驗室出版社,1989,第3卷。 製備包括能夠表達换島素的種軒之姑搞
按照本發明’嵌合核酸序列引進植物細胞内,而細胞 成長為可結籽之成熟樹,其中種籽表達胰島素多肽。
依此’可選擇任何植物品種或植物細胞。於此使用之 特殊細胞包含由阿拉伯芥(Arabidopsis thaliana)、巴西 堅果(Betholettia excelsa)、萬麻子(Riccinus communis)、椰子(Cocus nucifera)、胡荽(Coriandrum sativum)、棉花(Gossypium spp.)、花生(Arachis Hypogaea)、加州希蒙得木(Simmondsia chinensis)、亞 麻(Linum us i tati ss i mum) ' 玉米(Zea mays)、芥菜 (Brassica spp.和 Sinapis alba)、油棕(Elaeis guineeis)、撖视(Olea eurpaea)、油菜軒(Brassica spp.) ' 稻(Oryza sativa) ' 紅花(Carthamus t i nc tor i us )、大豆(Glycine max)、南瓜(Cucurbita maxima)、大麥 (Hordeum vulgare)、小麥(Traet i cum aestivum)、向曰 葵(Helianthus annuus)取得之細胞。
第33頁
五、發明說明(28) 按照較佳具趙例,使用取自油軒植物之植物品種或植 物細胞。此處可用之油軒植物包含花生(Arachis hypogaea)、芬菜(Brassica spp.和Sinapis alba)、油菜 籽(Brassica spp·)、小藜豆(Cicer arietinum)、大豆 (G 1 y c i n e m a x )、棉(G o s s y p i u m h i r s u t u m )、向曰葵 (Hel ianthus annuus)、(Lent i 1 Lens culinaris)、亞麻 (Linum usitatissimum)、白苜蓿(Trifo1ium repens)、 撤挽(Olea eurpaea)、油棕(Elaeis guineeis)、紅花 (Carthamus tinctorius),和narbon豆(Vicia narbonensis) ° 於此按照特佳具體例,使用紅花、阿拉伯芥或亞麻。 把植物重組表達載體引進植物細胞内之方法,於此稱 為「轉型」,在技術上已公知,典型上視選擇的植物細胞 而定。把重組表達載體引進細胞内之一般技術,包含電穿 孔、化學中介技術,例如CaCl2中介核酸攝取;顆粒撞擊 (biolistics);使用天然感染核酸序列,例如以病毒方式 衍生的核酸序列,或以土壤桿菌屬或根瘤菌屬衍生序列、 聚乙二醇(PEG)中介核酸攝取,微量注射,以及使用碳化 矽晶鬚。 在較佳具體例中,選用轉型方法,使嵌合核酸序列可 整合入植物細胞基因組内,以植物細胞核基因組為佳。依 此’視為特別需要使用此方法,在有性生殖時,得以把嵌 合核酸序列傳送至後代植物。在此方面可用之轉型方法, 包含biolistics和土壤桿菌屬中介方法。 第34頁 五、發明說明(29) 雙子葉植物品種之轉型方法已屬公知,一般而言,使 用土壤桿菌屬轉型,因其效率高,而且即使不是全部,也 是許多雙子葉植物品種通常有感受性。土壤桿菌屬轉型一 般涉及雙載趙’諸如上述雙載想的傳送,包括本發明喪合 核酸序列從大腸桿菌到適當土壌桿菌屬菌株(例如EHA1〇1 和LBA44 04) ’例如利用與攜帶重組雙載體的大腸桿菌菌株 以及攜帶能夠動用雙載體的輔助質粒,至目標土壤桿菌屬 菌株的大腸桿菌菌株之三親株交配,或是土壤桿菌屬菌株 之DNA轉型(Hofgen等人,Nucl. Acids. Res., 1988, 16: 9877)。可用來轉型雙子葉植物細胞的其他技術,包含 biolistics(Sanford, 1988, Trends in Biotechn, 6: 299-302);電穿孔(Fromm等人,1985, Proc. Natl.
Acad. Sci· USA., 82:5824-5828) ; PEG 中介 DNA 攝取 (Potrykus等人,1985, Mol. Gen. Genetics’ 199:169-177);微量注射(Reich 等人,Bio/Techn., 1 986, 4:1 001 -1 004);以及碳化矽晶類(Kaeppler等人,1 990, Plant Cell Rep., 9:415-418),或例如使用在浸汲法的植物體 内轉型(Clough 和 Bent, 1 998, Plant J.,1 6:735-743 )。 單子葉植物品種可用各種方法轉型,包含顆粒撞擊 (Christou等人,1991, Biotechn, 9:957-962 ; Weeks等 人,Plant Physiol., 1993, 102:1077-1084 ; Gordon-Kamm等人,Plant Cell, 1990, 2:5603-618); PEG中介 DNA攝取(歐洲專利0292 435和0392 225號),或土壤桿菌 屬中桿轉型(Goto-Fumiyuki 等人,1 999,Nature-Biotech
第35頁
,17:282-286)。 正確植物轉型方法稍因選做轉型用細胞目標之植物品 種和植物細胞類型(例如幼苗衍生細胞型,諸如胚軸和子 葉,胚組織)而異。上述特佳具體例中,使用紅花、阿拉 伯芥或亞麻。獲得紅花轉型之方法,可查Baker* Dyer (Plant Cell Rep.,1 996,ι6:1〇6_11〇)β 其他植物品種 特殊轉型提案’可查《農林生物技術> 46種(轉基因農》 物〉第 1冊(Y.P.S. Bajaj編),Springer-Verlag,紐約 (1 99 9),以及《農林生物技術〉47種(轉基因農作物、 2冊(Y.P.S. Bajaj編),Springer-Verlag,紐約(2〇〇1)。 轉型之後,植物細胞成長,出現微分組織,諸如 ^ 根’再生成熟植物。典型上再生複數植物。植物再生 視一般相ί物品種和細胞類型而定,為此道專家所知。法 植物組織培養基的進一步導讀可參見例如(植物細 關 織培養基 >,1 994,Vasil 和 Thorpe編,Kluwer 學術 Α Β 知' 社,以及《植物細胞培養基報告書 >(分子生物學,版 111 種),1 9 9 9,Ha 11 編,Humana 出版社。 法第 在一要旨中’本發明提供包括胰島素的植物 收方法。因此’本發明提供包括胰島素的植物種=之回 法,包括: 时取得方 (a)提供嵌合核酸構造物,在轉錄的g,至3,方 下列,做為操作上聯結成份: 向包括 (i)能夠控制在植物種籽細胞内表達之 ;和 _序列
第36頁 五、發明說明(31) (ii)把胰島素多肽編碼之核酸序列; (b) 把嵌合核酸構造物引進植物細胞内; (c) 令植物細胞成長為能夠結籽之成熟植物;和 (d) 從該植物取得種籽,其中種籽包括胰島素。 在較佳具體例中’得複數轉型植物、成長、筛檢所需 喪合核酸序列存在,可利用例如在選擇性培養基上使用除 草劑抗性標誌,藉除草劑直接施於植物,或利用南方氏 印跡法成長’以測試其以假想轉型體存在。如檢知嵌 合核酸序列存在,可選擇轉型植物以發生後代和最終成熟 f物’包括複數種籽,内有所需嵌合核睃序列。此等種籽 可用來單離姨島素,或經種植以發生二代或更多後代。一 $需將複數基因種籽種植,以獲得轉基因植物族群,各包 含有把姨島素編碼的丧合核酸序列之種籽。此外,一般 f確保在植物内的純合性,以確保重組多肽的連續傳續。 二植物之選擇方法為此道專家所熟知,可用之純合植物 生_£方法,包含將單倍細胞或組織的製備和轉型,接著再 處倍植物苗,隨後例如以秋水仙鹼或其他微管型破裂劑 長,,轉變成二倍植物。植物可依其他習知農業實務成 植物在ill,本發明亦提供能夠結軒表達联島素的 核Σ序:具趙例中,㈣結杆的植物包括丧合 硬序列,在5至3,轉錄方向包括: (a)能夠控制在操作上聯結的植物種籽細 第一種核酸序列; 肥門衣運的 第37頁 五、發明說明(32) (b)把胰島素多肽編碼的第二種核酸序列其中種籽 含有姨島素。 基因^佳具體例中,嵌合核酸序列係穩定整合於植物核 在又一要旨中,本發明提供表達胰島素之 在本發明較佳具體例中’植物種籽包括 ,籽: 5至3,轉錄方向包括: 极毁序列,在 (a) 能夠控制在操作上聯結的植 第一種核酸序列; 裡杼細胞内表達的 (b) 把胰島素多肽編碼的第二核酸序 按照本發明,所得種籽内存在的總 為姨島素。在本發明又一具趙例/&蛋白質宜至 存在的總可溶性蛋白質至少0.2%、〇 3 所得種籽内 為胰島素。联島素多肽可以各種不同型 姓5%或1·〇% 驻例如包含下胚軸和胚#’包含在胚根;胚:籽2存在 葉植物,則包含榖類和玉米,用於胚乳組茶。若為單子 一旦已獲得植物種籽,即可使用技藝,二 白質精製方法,從種籽精製胰島素蛋白 5知的任何蛋 發明,提供從植物種籽精製胰島素之方法i $此’按照本 (a)提供後合核酸構造物在5’至3,垃奴 列,做為操作上聯結成份: '方向包括下 (i) 能夠控制在植物種籽細胞内矣 ;和 衣運之核酸序列 (ii) 把胰島素多肽編碼之核酸序列. 五、發明說明(33) (b) =铁合核酸構造物引進植物細 (c) 令植物細胞成長*可社 胞内, 表達姨島; 籽之成熟植物,其中種舒 (d) 獲得表達胰島素的種籽;以及 (e) 從種籽精製該胰島素。 植物種籽可用任何粉碎過程磨粉, 胞壁實質碎裂。乾法和濕法研磨條=軒美細胞膜和細 S* 971> 8^5^33 1 977> J* A- :·磨mi :面適當之研磨設備包含膠磨機 、圓磨機、ΙΚΑ磨機、工業級勻化器等。選用研磨設備視
種籽類型和產量要求而定。固體種籽内容物’諸如籽殼、 纖維質材料、不溶性醣類、蛋白質及其他水不溶性雜質, 可用例如基於粒程分級方法’諸如過濾,或基於重力方法 ,諸如離心,從種籽部份除去。在較佳具體例中,.避免使 用油萃取中常用的有機溶劑’諸如已烷,因為此類溶劑有 損姨島素多肽。從種籽可回收實質純胰島素,可用各種附 加精製方法’諸如基於離心之技術;基於粒徑分級的方法 ’包含例如隔膜超濾和交越超濾’以及色譜技術,包含例 如離子交換色譜法、粒徑分級色譜法、親和性色譜法、高 效能液趙色譜法(HPLC)、快速蛋白質液艘色譜法(fplc)、 疏水性互動色譜法等》—般而言’可用此等技術之組合以
獲得實質純胰島素。 製藥上联島素配方可由精製狹島素配製,此等配方可 用來處理糖尿病。一般而言,精製騰島素可與製藥上可接 第39頁 五、發明說明(34) 受載體或稀釋劑混合’其量足以對治療患者實施治療上有 用之效果,無不良副作用。為配製胰島素組成物,將重量 分率之胰島素溶解、懸浮、分散,或其他方式混合於選用 的載趙或稀釋劑内’達有效濃度’使治療狀況獲得改善。 製藥上胰島素配方宜配製供單劑量服用。人 胃外注入的治療有效劑量,為技術上所公知。使用胰 類似物或使用其他注入模式,其治療上有效劑量於 此道之士使用已知測試報告或利用體内或體外測 ^ 插法’即可輕易靠經驗決定。然而,須知濃度 =卜 照嚴重性之減緩狀況而異。又須知對任何特殊 $置了按 投服或監督投服配方的人員個別判斷,隨時調^賊可按 量療法調節之。 %吁間調知特殊劑 製藥液劑或懸浮劑可含有例如無菌稀釋 乳糖、廉糖、鱗酸二約或叛甲基織維素。可 水、 、食塩水、右旋糖水溶液、甘油、己二醇類、戰趙包含水 此形成液劑或懸浮劑。如有需要,製藥組 醇等,由 毒性輔助物質,諸如T醇和甲基parabens; γ ί可含有無 如抗壞血酸和亞硫酸氫鈉;螯合劑,諸如乙二氧化劑,諸 (EDTA) ; pH緩衝剤,諸如乙酸塩、檸檬酸=乙酸 劑;及其組合物》 4鱗酸塩緩衝 肤島素製劑之最後配方,一般視胰島 。按照本發明製成之胰島素,可以任何所需^模式而定 而’腸外、口服、經肺、經頰、經鼻之注入,注入;然 容易使用的注入模式。腸外製劑可容納在 工’視為最 你女瓿、用完即棄 第40頁
五、發明說明(35) 的注射器、玻璃、塑膠或其他適當材料製之單劑量或多劑 量的小瓶内。 茲提供下列實施例以供說明,而非限制。 實施例1 复造胰島素蛋白以具有胰蛋白酵素可裂j性肽原之微 型胰島素(MI)的融合蛋白表遠 、 PSBS440 4 : PRS-D9scFv-Kl ip2 7-MI-KDRT^ 合蛋白之構 所研究的融合蛋白之一,以於草病原相關的序列 (PRS)開始(Sijmons等人,1990, Bio/technol〇gy, 8:217
-221)開始,作為訊號肽,以共轉譯方式目標表達於er。 緊接下游為對單鏈Fv抗體(scFv)編瑪之序列,由D9scFv所 示阿拉伯芬(Arabidopsis thaliana對18 kDa油質蛋白具 有品種特殊親和性,接著是衍自酵母的TA5 7肽原之胰蛋白 酵素裂解性肽原(KLIP27)(Kjeldsen等人,200 1,(生物 技術和遺傳工程評論> 18:89-121) ^此接著是微型胰島素 (MI),如Kjeldsen等人(2001)所述,在肽原的C末端尾添 加KDEL ER住留訊號。 此質粒的主鏈PSBS4055係基於植物雙載體pPZP200,
如Hajdukiewicz等人所述(《植物分子生物學〉,1994, 25:989-994)。所述多重選殖部位,改用對宿主植物賦予 phosphinothricine抗性之 pat 基因(Wohlleben 等人,1988 ,《基因 > 70:25-37),以取自 Petroselinum crispum的泛 蛋白啟動子/終止子驅動(Kawalleck等人,1993,Plant. 第41頁 五、發明說明(36)
Mol. Bio.,21:673-684),插於左、右邊界序列之間。除 此序列盒外,取自菜豆(phaseolus vulgaris)的/5-菜豆 蛋白啟動子/终止子(Slightom等人,1983,Proc. Natl. Acad. Sc. USA 80: 1 89 7- 1 90 1 )驅動 PRS,經次選殖。使用 標準PCR( Horton等人,1989,(基因〉77:6卜68),把具有 所附Sphl/Hindm限制内切核酸酵素部份之合成PRS-編碼 序列,融合於菜豆蛋白啟動子的3’端,產生pSBS4011。利 用 D9scFv cDNA殖系的 PCR放大,發生SphI-D9scFv-XhoI, Swal,HindDI 插入序列(Sean Hemmingsen 實驗,未出版), 具有引物1325(GCATGCTGACATTG TGATGACACAGTC)-序列編 號175號,和引物1326(AAGCTTGCATTTAAATACTCGAGACTGTGA GAGTGGTGCCTTG)-序列編號176號。此片段隨後在pSBS4011 的Sphl/Hindm部份連接作用,得質粒PSBS4055 » K1 ip2 7-MI序列係由四種部份重疊的寡核苷酸合成, 加阿拉伯芥密碼子用法,以提高基於植物的表達系統之有 轉譯成功。寡核普酸 1 324(GAAGAAGGAGAGCCTAAGTTTGTTAAT CAACATCTTTGTGGATCTCATCTTGTTGAGGCTCTCTACCTTG)-序列 編號177,和 1 323(CCTTAGGAGTGTAGAAAAATCCTCTTTCTCCACA CACAAGGTAGAGAGCCTCAACA)-序列編號178號,在其互補20 種核苷酸重疊處退火,伸展形成Klip27-MI融合的5’端, 同此,募核苷酸1 322CCTAAGGCTGCTAAGGGAATTG)-序列編號 179,和 1321UAGCTTCAGTTGCAATAGTTCTCCAATTGGTAAAGTGA GCAAATAGAAGTGCAACATTGTTCAACAATTCCCTTAGCAGCCTT)-序 列編號180,形成3’端。在限制消化後,以Bsu361將二半
第42頁 五、發明說明(37) 連接’產生完整的Klip27-MI寫碼序列。此基因之PCR使用
引物 1364(CTCGAGTCAACCAATTGATGACACTGAATC)-序列編號 181 ,和 1334(AAGCTTCAAAGTTCATCCTTGTTGCAATAGTTCTCCAA TTG)-序列編號182融附於5’ Xhol限制内切核睃酵素裂解部 位,和3’ KDEL DNA序列,加上HindDI裂解部位,供隨後 連接入 XhoI/HindDI 切口 pSBS4055。結果為質粒 PSBS4404: 把PRS-D9scFv-Klip27-MI-KDEL融合蛋白編碼之DNA序列, 係在菜豆蛋白啟動子/终止子的表達控制下,置於雙載艘 内。菜豆蛋白啟動子是在種籽發育期間,控制轉基因的特 殊時間上和組織特異性表達。4404姨島素融合蛋白(prs-D9scFv-Klip27-MI-KDEL)的完整核酸序列(序列編號1)和 胺基酸序列(序列編號2),如第1圊中所示。 B_gBS4405:OLEO-Klip8-KliD27-MI 融合蚤白之槿成 =研究的第二種融合蛋白,以18 kDa油質蛋白,從阿 拉伯芥開始’框内接著是凝乳酵素裂解性肽原(ΚΠρ8)_ 列編號175。緊接著下游是,衍自酵母的TA57肽原之胰蛋 白酵素裂解性肽原(KliP27)之編號序列,一如上述 (Kjeldsen等人,2001,《生物技術和遺傳工程評論〉18. 。此融合於上述微型騰島素(MI)(Kjeldsen等人, 20 0 1 )。此融合蛋白的表達目標在胚發育當中形成的 油體。 ^質粒主鏈PSBS4055係基於植物雙載體pPZp2〇〇,如 所述(< 植物分子生物學〉,1 994, 25: ) 述多重選殖部位,改用賦予宿主植物
五、發明說明(38) phosphinothricine抗性之 pat基因(Wohlleben等人,1988, < 基因〉70:25—37),矛1J 用取自 Petroselinum crispum的 泛蛋白啟動子/终止子驅動(Kawal leek等人,1993, Plant. Mol. Bio.,21:673-684),插入於左、右邊界序 列之間。除此序列盒外,來自菜豆的/9 -菜豆蛋白啟動子 / 終止子(Slightom 等人,1983,Proc. Natl. Acad. Sc. USA 80:1 897- 1 90 1 )驅動阿拉伯芥18 kDa油質蛋白基因組 序列Klip8融合,經次選殖。使用標準PCR(Horton等人, 1989,《基因> 77:6卜68),把具有所附Xphl/HindlE限制 内切核酸酵素之油質蛋白基因Klip8序列,融合於菜豆蛋 白啟動子的3’端,生成pSBS4010。
Klip27-MI序列由四種部份重疊的募核苷酸合成,加 上阿拉伯芥(Arabidopsis thaliana)密瑪子用法,提高植 物為基礎的表達系統内有效轉譯的成功。寡核苷酸1324 (GAAGAAGGAGAGCCTAAGTTTGTTAATCAACATCTTTGTGGATCTCATC TTGTTGAGGCTCTCTACCTTG)-序列編號 177,和 1 323CCCTTAGG AGTGTAGAAAAATCCTCTTTCTCCACACACAAGGTAGAGAGCCTCAACA) -序列編號178在其互補20種核苷酸重疊處退火,並伸展形 成Klip27-MI融合之5’端,同樣進行募核苷酸1322 (CTAAGGCTGCTAAGGGAATTG)-序列編號 179,和 1321 (AAGCTTCAGTTGAAATAGTTCTCCAATTGGTAAAGTGAGCAAATAGAAG TGCAACATTGTTCAACAATTCCCTTAGCAGCCTT)-序列編號 180 形 成3’端。限制消化之後,二半以Bsu361連接,形成全Klip 27-MI選殖序列。此基因的PCR使用引物1364 第44頁 五、發明說明(39) (CTCGAGTCAACCAATTGATGACACTGAATC)-序列編號181,和 1 329 (AAGCTTCAGTTGCAATAGTTC)-序列編號183 融合,分另 附著於5’ Xhol限制内切核酸酵素裂解部位和3’Hind ΙΠ裂解 部位’供隨後連接於XhoI/HindDI切〇pSBS4010。結果為 質粒PSBS4405 :把油質蛋白Klip8-Klip27-MI融合蛋白編 碼的DNA序列,係在菜豆蛋白啟動子/终止子的表達控制 下,置入雙載體内。菜豆蛋白啟動子在種籽發育期間控制 轉基因的特殊時間上和組織特異性表達。4405胰島素融合 蛋白(OLEO-Klip8-Klip27-MI)的完整核酸序列(序列編號3 號)和胺基酸序列(序列編號4號),如第2圊所示。 p„gBS4414:PRS-MI -四元接頭- D9scFv-〇EL 融合I 白夕 構成 '— 所研究另一融合蛋白,以菸草病原相關序列(pRS)開 始(Sijmons等人,1990, Bio/technology, 8:217-221), 用做對目標表達之訊號肽,以共轉譯方式至ER。緊接下游 是把微型胰島素(mi)編碼之序列,如Kj.eldsen等人(2〇〇1) 所述,惟微型c肽原區(AAK-序列編號146號),改為間插b3〇 =胺f四鹼基部位(B^-rrKr)序列(序列編號149),在人 3 f 3素=B(卜w鏈和A(卜⑴鏈之間。緊接對第二個四驗基接 μ 1« lcif=,接著單鏈趴抗體(scFv),對來自阿拉伯芥 質蛋白有品種特殊親和性,標為D9scFv。在多 肽的L末端尾,添加Kdel ER住留訊號。 如ha t質粒的主鏈1^“4055係基於植物雙載體ppzp200, 如Hajduklewicz等人所述(〈植物分子生物學〉,Μ",
五、發明說明(40) 25:989-994)。上述多重選殖部位,改用賦予宿主植物 phosphinothricine抗性之 pat 基因(Wohlleben 等人,1988 ,〈基因 > 70:25-37),利用取自Petroselinum crispum的 泛蛋白啟動子/終止子驅動(Kawalleck等人,1993, Plant. Mol. Bio·, 21:673-684),插入左、右邊界序列 之間。除此序列盒外,來自菜豆的/9 -菜豆蛋白啟動子/ 終止子(Slightom 等人,1983,Proc. Natl. Acad. Sc. USA 80 : 1 897- 1 90 1 )驅動PRS,經次選殖。使用標準PCR (Horton等人,1989,(基因〉77:6卜68),把具有所附 Sphl/Hindm限制内切核酸酵素部份序列編碼的合成PRS, 融合於菜豆蛋白啟動子的3’端,產生pSBS4011。
Klip27-MI序列由四種部份重疊的赛核苷酸合成,加 阿拉伯芥密碼子用法,以提高植物為基礎的表達系統内有 效轉譯之成功。寡核苷酸1 324(GAAGAAGGAGAGCCTAAGTTTGT TAATCAACATCTTTGTGGATCTCATCTTGTTGAGGCTCTCTACCTTG)序 列编號177 ,和1323CCCTTAGGAGTGTAGAAAAATCCTCTTTCTCCA CACACAAGGTAGAGAGCCTCAACA)序列編號178號,在其互補 20 種核苷酸重疊處退火,並伸展形成Klip2 7-MI融合之5’端 ,同樣進行募核苷酸1 322CCTAAGGCTGCTAAGGGAATTG)序列 編號179 ,和1321(AAGCTTCAGTTGCAATAGTTCTCCAATTGGTAAA GTGAGCAAATAGAAGTGCAACATTGTTCAACAATTCCCTTAGCAGCCTT) 序列編號180,形成3’端。限制消化後,二半以Bsu361連 接,生成全Klip27-MI選殖序列。此基因之PCR使用引物 1 3 63(60儿丁〇(:(^六八(^及人1^6及丁6儿0人(^〇序列編號184,和 第46頁 五、發明說明(41) 1 3 34(AAGCTTCAAAGTTCATCCTTGTTGCAATAGTTCTCCAATTG)序 列編號182融合,附著5’SphI限制内切核酸酵素裂解部位 和3’ KDEL DNA序列,加上Hindi!裂解部位,供隨後連接 於 Sphl/Hindm 切口 pSBS4011。結果為質粒 PSBS4402 :把 PRS-Klip27-MI-KDEL融合蛋白編碼之DNA序列,係在菜豆 蛋白啟動子/終止子表達控制下,置入雙載體内。菜豆蛋 白啟動子在種籽發育期間,控制轉基因的特殊時間上和組 織特殊性表達。植物表逹栽體PSBS4402用做模板,在胰島 素的B和A鏈間,以及MI和D9scFv間,引進四鹼基部位。 間插四鹼基(B3QT-RRKR)部位,科用PCR置於人體胰島 素真正Bu_29)鏈和A(卜21)鏈之間,使用引物1515 (GCATGCATGCCTTTGTTAATCAACATCTTTGTGG)序列編號 185, 和 1518(ACATTGTTCAACAATTCCTCTCTTTCTTCTAGTCTTAGGAGTG TAGAAAAATCC)序列編號186使用pSBS4402為模板。所得124 bp 片段與引物 151UGCATAAGCTTCAAAGCTCATCCTTTGAGC)序 列編號187號組合使用,使用pSBS3400為模板。須知 PSBS34 00為質粒,含D9scFv-KDEL片段,有Hindi!限制部 位。此PCR反應生成955 bp生成物,把四驗基(1?1?1(1〇-D9scFv_KDEL-HindIE 引進到 124 bp Sphl-MI 片段上。再將 955 bp片段接連和次選殖於pGEM-T(Promega),得 PSBS3403。全部 Sphl-MI (連用 B30T-RRKR修飾之 C肽原)-RRKR_D9scFv-KDEL-HindDI 片段,插入預切口(Sphl/Hind m )pSBS4402内,產生pSBS4414。4414胰島素融合蛋白 (PRS-MI-四鹼基接頭-D9scFv-KDEL)之完整核酸序列(序列 第47頁 五、發明說明(42) 編號5)和胺基酸序列(序列編號6),如第3圓所示。 重.組大腸桿菌和土壤桿菌屬2PSBS4404. DSBS44flfS或 PSBS4414轉型和成县 〆 利用序列分析破認為融合蛋白的cDNA編碼之整趙性後 ,把質粒pSBS4404,pSBS4405和pSBS4414轉型入大腸桿菌 菌株DH5a内,得以高水準表達。單離之質粒j)NA(l〇〇ng) 在冰上與100//1的DH5a勝任細胞混合20分鐘。細胞再於 42°C熱震45秒,回到冰上經2分鐘》然後加!毫升s〇c培養 基’細胞在LB壯觀擻素平板(1〇 g/L胰睐、5 g/L酵母萃取 物、5 g/L NaCl、15 g/L瓊脂)上平板接種轉型細胞之前 ,在37°C於225 rpm的enviro搖瓶上培育1小時,並在37°c 培育過夜。使用單一菌落接種5毫升LB-壯觀擻素液體培養 基°此等培養基在37C成長過夜。按照QlAprep®Spin Mini prep Kit (Qiagen),從1毫升過夜培養基單離重組質 粒。再用單離質粒’利用電穿孔(25#F, 2.5kV, 200Ω) ’把勝任土壤桿菌菌株EH101轉型(Hood等人,1986; J. Bacteriol, 1 44:732-743)。重組土壤桿菌屬平板接種在 AB壯觀擻素/卡那擻素(20x AB塩,2M葡萄糖,〇.25mg/ml FeS04 · 7H20,1M MgS04 ’ 1M CaCI2)上,使用單一菌落接種 5毫升AB壯觀擻素/卡那擻素液體培養基。此等培養基在 2 8 °C成長過夜。再使用重組土壌桿菌屬,利用在浸泡法, 把菜豆植物轉型(Clough 等人,1 998,Plant J., 1 6:735-743),阿拉伯芥(Arabidopsi s thaliana cv.)(C24)用於 全部實驗。把種籽種植在4吋缽内土壤混合物(三分之二
第48頁 五、發明說明(43)
Redi 土、三分之一真珠岩,pH = 6. 7),或由Lehle種籽公司 供應的阿拉伯芥土壌混合物(真珠岩、經石、泥媒、綠土, pH = 5.5)的表面。容許幼苗成長至6-8葉的簇生階段,直徑 大約2. 5 cm。缽在4。(:的拱頂下放置4天供冷處理,隨即移 至24 °C成長室,以約150#E —定光照,相對濕度60-70% 。植物每隔2-3天洗水’每星期以i%peters 20-19-18施 肥。各妹含5-6株植物。植物高達約2公分,把第一次 bo Its剪斷,促使第二、第三bo lts成長。剪斷第一次 bo Its後4-5天,植物準備感染土壤桿菌屬。把缽連阿拉伯 芥植物倒置’讓阿拉伯芥植物感染含有用植物轉型載體的 過夜土壤桿菌培養基之再懸浮液5〇〇毫升歷20秒。重要的 疋土壤杯菌培養基含5%簾糖和〇. 05%表面活性劑Silwet L-7 7 (Lehle種籽公司)》缽隨後覆蓋透明塑膠拱頂歷24小 時’以維持較高潮度。讓植物成長至成熟,收穫未轉型和 已轉型的種籽混合物。為選擇轉基因線,假想已轉型種籽 以70%乙醇快洗滅菌,再用20%商用漂白劑洗15分鐘,然 後以ddH20淋洗至少4次。約1000粒滅菌過種籽,與0.6%熔 化的頂級瓊脂混合,均勻分佈於含有0.3%蔗糖和80μΜ除 草劑phosphionthricin(PPT)DL之半強度MS平板上 (Murashige和 Skoog, 1962, Physiologia Plantarum 15: 4 7 3 - 4 9 7 )。平板再置於2 4 °C成長室内,照明計劃為8小時 暗、16小時亮。7-10天後,假想轉基因幼苗已成綠,而未 轉型幼苗蒼白。長根後,假想轉基因幼苗個別移到缽(個 別植物每隔三天洗水,每隔七天以l%Peter 20-19-18施
第49頁 五、發明說明(44) 肥)’讓其成長成熟。缽覆蓋透明塑膠拱頂三天,以保護 敏感性幼苗。七天後’幼苗覆蓋Lehle種籽公司的種籽收 集器系統,以防種籽因散佈而損失,個別收穫此等轉基因 植物的種籽,預備分析之用。 實施例2 胰島素在阿拉伯芥内之丧達水準 在第二實施例中,融合蛋白D9scfv-KLIP27-MI-KDEL (4404),0LE0-KLIP8-KLIP27-M1(4405)和 PRS-MI-RRKR- D9scfv-KDEL(4414)的表達水準,在成熟阿拉伯芥成熟種 籽内決定。所示轉基因生成物,呈現於成熟種籽的細胞萃 取物内,大約40顆轉基因阿拉伯種籽以研缽和研样加以研 磨,加50以1的50mM Tris-HCl pH 8.0。於漿液中加還原 SDS-PAGE樣品緩衝劑(6x SDS樣品緩衝劑,〇.35»«!'1^8-HC1 pH 6.8,30%甘油,10% SDS, 0.012% 溴酚藍,5% /3 -氫硫基乙醇),短暫渦動加以混合。再將樣品簡短離心 ,在99 °C放置10分鐘。在冰上冷卻2分鐘後,把樣品簡短 離心。在還原狀況下加載樣品(10//1等於大約七顆種 籽)。 對於製備油體的樣品,取轉基因的野生型種籽(2 〇mg) ,在250从1油體萃取緩衝劑(〇· 4M蔗糖,〇. 5M NaCl,50mM Tris_HCl pH 8.0)内研磨。樣品在l〇〇〇Og離心分鐘。以 26 G 5/8的1毫升注射器除去水溶性分部,脂肪墊片再度 懸浮於100yl磷酸塩緩衝劑内,補充塩(2〇mM Na2HP04 pH 8. 0, 〇· 5M NaCl),再懸浮的脂肪墊片移至清潔離心管,
五、發明說明(45) 再於lOOOOg離心1〇分鐘。再重複此程序三次,脂肪墊片最 後再懸浮於1〇〇#1不加塩的磷酸塩緩衝劑(20 mM Na2HP〇4 pH 8.0)。在不加塩的磷酸塩緩衝劑進行另洗二次,中間 離心步驟按上述。最後,將脂肪丸粒再懸浮於l〇Al碟酸 塩缓衝劑(20mM Na2HP04 pH 8.0)内。取出5#1份量,在 l/10(v/v) 50mM Tris-HCl pH 8.0加2% SDS内煮沸,將 油體蛋白溶解。樣品在冰上冷卻2分鐘,在1 0 0 00g離心5分 鐘。底層的蛋白質含量以BCA蛋白質檢定法測量(PierCe, Rockford, IL)。為供考馬斯染色凝膠和蛋白質印跡分析 ,使:用SDS-PAGE樣品緩衝劑,在還原狀態下,於15% -PAGE凝膠上分離2〇eg總蛋白β 樣品加載於不連續的15% SDS-PAGE凝廉,在150伏特 分離約1 · 5小時。凝膠再經考馬斯染色或轉潰到PVDF膜 (Immobi lon-P,Mi 11 ipore公司,麻州里德福特市),以供 蛋白質印跡分析。轉潰樣品以針對胰島素的單株抗體探測 (Clone E2-E3 ; Roth 等人,1992),購自 Abe am(英國劍橋) 。联島素帶使用次要Sheep X鼠IgG F(at)’)2 AP共輛檢測 (Chemicon International, Temecula, CA),使用 NBT- BCIP 在 GARAP 緩衝劑(Tris-HCl ph 9.5,100 mM NaCl, 5 mM MgC 12)内展開。免疫反應性帶相當於多肽帶,以融合 蛋白的預.計分子量移動,如第4A-4F倒所示。第4A-4F调表 胰島素融合蛋白在轉型阿拉伯芥線(4404-2,-17,- 20,44 05 -4,4414-19和4414-20)内的重組表達,根璩考馬撕染色 SDS-PAGE和蛋白質邱跡分析。箭頭指移動中38. 5 kDa、
第51頁 五、發明說明(46)
34.2 kDa 和 34.2 kDa 融合多肽,卩1^-09(5〇&)-1(11?27-MIw/KDEL(4404),OLEO-KLIP8-KLIP27-MI(4405:^PRS-MI -RRKR-D9scfv-KDEL(4414)的位置,分別在還原狀態下。 須知4414融合蛋白有預期的分子量34.2 kDa,但在SDS-PAGE凝膠上的表現分子量較高。第4A圈(考馬斯染色凝膠) 和第4B圊(相當於以抗胰島素E2E3探測之蛋白質印跡),表 示由野生型製成的總種籽蛋白(wt),以及表達4404和4405 構造物之轉基因種籽線。第4C圊(考馬斯染色凝膠)和第4D 圓(相當於以抗胰島素E2E3探測之蛋白質印跡),表示由野 生型製成的油體蛋白,以及表達同樣4404和4405構造物之 轉基因種籽。第4£圓(考馬斯染色凝膠)和第4F圖(相當於 以抗狹島素E2E3探測之蛋白質印跡),表示由野生型製成 的油體蛋白’以及表達同樣4414構造物的轉基因種籽。分 子量標誌(M)為 10, 15, 20, 25, 37, 50, 75, 100, 150, 250kDa。 對照組包含hIN(重組人體胰島素標準)和hProIN(重組人體 胰島素原標準),在非還原狀況下分離。表達水準不同是 轉型體當中殖系變異的結果。轉基因和MI表達的大約蛋白 水準,見第5圈。表達水準使用18kDa油質蛋白帶做為内部 標準(等於1.5%總種籽蛋白),利用轉基因帶的光密度計 測法測定。對於PRS-D9(scfv)-KLIP27-MIw/KDEL(4404), OLEO-KLIP8-KLIP27-MI(4405)和PRS-MI_RRKR-D9Scfv-KDEL(4414)構造物的平均表達水準,分別為0.21%總種籽 蛋白、0.12%總種籽蛋白和0.79%總種籽蛋白。 實施例3
IHH
五、發明說明(47) PSBS4404的IS!解和HPLC純化 從油體洗脫 在第3實施例中,取1克轉基因種籽在12毫升萃取緩衝 劑(0.4M蔗糖,0.5M NaCl, 50mM Tris-HCl pH 8.0)内句 化’並以l〇〇〇〇g離心l〇分鐘,除去脂肪塾片,置於1毫升 20mM Na2HP04、0.5M NaCl内,按上述再離心。重複二次, 然後洗濯,把脂肪墊片在750/zl 20mM Na2HP04内離心二 次。最後脂肪塾片在750# 1 20mM甲酸pH 4.1内洗濯5次, 從油體洗脫4404融合蛋白進入下層液内,每次洗濯之間, 介入1 0000g離心步驟。收集洗脫分部(下層液)庫存,以2N NaOH中和至pH 8.0。全部溶液置放在-80 °c冷凍,冷减乾 燥過夜’以濃缩融合蛋白。冷凍乾燥樣品再懸浮於5〇〇#ι
50mM Tris-HCl pH 8.0。然後將再懸浮4404融合蛋白在 NAP-5管柱(瑞典烏普蘇拉市的Amersham Pharmacia Biotech Ab)上脫塩,再以緩衝劑(5〇mM Tris-HCl pH 8.0)交換。脫塩分部再度冰凍,冷凍乾燥過夜加以濃縮β 最後濃縮樣品再懸浮於最後容量的1〇5私1雙重蒸餾η20。洗 脫結果如第6囷所示。第6圓係考馬斯染色SDS-PAGEC15% ) 分析洗脫前的油體預製物(-0Β),用甲酸洗脫後的油體預 製物(-OB’),以及濃縮的洗脫材料(_ε)。箭頭指移動融合 多肽的位置。野生型控制基本上在洗脫後無任何主要蛋白 質’而濃縮4404材料含有融合蛋白,若干截短生成物(可 能是水解融合蛋白),以及可能有共同洗脫的若干清蛋 白0 ΙΗΗΙΗΒ 第53頁 五、發明說明(48) 4逹4404的阿拉伯t種籽之裂蘑和HPLC分析 濃縮樣品再懸浮於1 〇 5 // 1雙重蒸餾水内,蛋白含量利 用BCA蛋白檢定法,按照製法檢定(Pierce_R〇ckf〇rd, IL, USA)。樣品再以胰蛋白酵素裂解(胰蛋白酵素:總蛋白比 1 : 300 ’在50mM Tris pH 8.0内,於冰上90分鐘)。以10倍 莫耳過量TLCK(N-對曱苯磺醯-L-賴胺酸氣甲基甲酮)停止 反應。全部反應經0.2//Π1渡器(Aerodisc® 13mm注射渡器 ,有0. 2 // m Supof®膜,Pall公司,美國密蘇里州安亞博 市)過波,使用C18管柱(Zorbax 30 0SB-C18,德國 Waldbronn市的Agilen科技公司)以逆相(rp)-hPLC分析。 樣品加載於管柱,使用5-50%(v/v)乙腈在〇.l%(v/v)TFA 内之19分鐘線型梯度,以1.0 ml/min洗脫。此項分析得色 譜如第7圓所示。痕跡透示由4404融合蛋白被胰蛋白酵素 裂解的生成物’在管柱上與人體胰島素標準幾近一致的性 能(住留時間分別17. 011分鐘和17. 179分鐘)。從17. 0-17.5分鐘收集HPLC分部,利用PSDMALDI/T0F質譜分析法 ,使用Voyager-DE STR質譜儀(應用生物系統公司)分析。 MS分析是利用加拿大莎省莎士卡通市的NRC植物生物科技 公司提供的生物分析光譜學服務進行。上述利用HPLC純化 的裂解4404生成物解析見第8B圓,與第8A圓所示人體胰島 素標準比較。以胰蛋白酵素裂解的4404融合蛋白之觀察質 量為6191. 51 Da。人體胰島素標準(第8A圖)與裂解4404生 成物(第8B圖)間之差異,相當於KDEL訊號保持在裂解生成 物A鏈上的Des-B3(l胰島素(Des-B3()胰島素-KDEL)。
五、發明說明(49) 實施例4 DSBS4405之裂解和HPLC純化 油體製備 融合蛋白(01^0-1^1?8-1(1>1?27-犲1)藉進行下述油趙製 備即可部份純化。大約取1克轉基因種籽,在12毫升萃取 緩衝劑(0.4M 蔗糖,0,5M NaCl,50mM Tris-HCl pH 8.0) 内勻化’並以lOOOOg離心10分鐘。除去脂肪墊片,置入i 毫升的 50mM Tris-HCl pH 8.0,0.5M NaCl 内,按上述再 離心。此重複二次,洗濯後’脂肪墊片在750 # 1 50mM Tr i s-HCl pH 8. 0内離心二次。除去大部份背景蛋白質, 得油體製劑。從表達4405構造物的轉基因阿拉伯芥種籽所 得油體製劑的典型蛋白質如第9囷所示。 表達4405的阿拉伯芥種籽之裂解和HPLC分析 再懸浮油體之總蛋白含量,係利用一部份製劑.(5^1) 在 2% SDS,50mM Tris-HCl pH 8.0 内稀釋 1〇 倍,煮沸 5 分 鐘,在1 0000g離心3分鐘加以溶解而檢定。然後,蛋白含 量是利用BCA蛋白質檢定法,按照製法測定(pierce_ Rockford, IL,USA)。然後,樣品以胰蛋白酵素(姨蛋白 酵素:總蛋白質比1 :300,在50mM Tris pH 8. 〇,於冰上 90分鐘)裂解,從融合蛋白釋出Klip2 7-MI片段。以^倍莫 耳過量TLCK(N-對甲苯項醯-L-賴胺酸氣曱基曱綱)停止反 應。樣品以10000g離心10分鐘,全部反應的下層液經〇 2
Am濾器(Aerodisc® 13mm注射濾器,有〇.2私m Sup〇f®膜 ’ Pa 11公司’美國密蘇里州安亞博市)過濾。第9圊表示全
笫55頁
五、發明說明(50)
部可萃取種籽蛋白和由表達4405的線製成油體(OB)蛋白以 考馬斯染色SDS-PAGEC15% )分析,與野生型(非重組)種籽 比較。箭頭指移動融合多肽之位置。下層液使用C18管柱 (Zorbax 300SB-C18,德國Waldbronn 市的 Agilen科技公司 )以逆相(RP)-HPLC進一步分析》樣品加載於管柱上,使用 5-50% (v/v)乙腈在0. 1% (v/v)TFA内之19 -分鐘線型梯度 ,以1.0 ml/min洗脫。此分析得色譜見第10囫。痕跡透示 從4405融合蛋白以胰蛋白酵素裂解之生成物,在管柱上性 能與人體胰島素標準幾近一致(住留時間分別為1 7. 220分 鐘和17. 179分鐘)。從17.0-17.5分鐘收集HPLC分部,使用 Voyager-DE STR質譜儀(應用生物系統公司),利用PSD MALDI/T0F質譜分析法分析。MS分析利用加拿大莎省莎士 卡通市的NRC植物生物科技公司提供的生物分析光譜學服 務進行。如第11圊所示,以胰蛋白酵素裂解的4405融合蛋 白所觀察質量為5706.30 Da。人體胰島素標準(第8A圊)與 裂解4405生成物(第11圖)間之差異,相當於Des-B3。胰島素 生成物〇)68-83())。1)6 8-83〇联島素為44 05融合的正確胰蛋白 酵素成熟所預期之生成物。 實施例5
使用AKTA探查劑(FPLC)純化胰番白酵素裂解的MI 從4405裂解MI的純化,也是在AKTA探查器(Amersham Pharmacia)上,利用陽離子交換(Mono Q FF lmL,
Amersham Pharmacia),由加大規模的裂解反應加以部份 純化。裂解反應是在4405油體上進行,已如上述,由達30
第56頁
五、發明說明(51) 克轉基因種籽製備。裂解反應的下層液經〇.2//m濾材過濾 ’或利用冷床乾燥在Savant Speed Vac上濃缩。過遽樣品 反應可直接應用於管柱,但濃缩樣品需除去塩,才能有效 結合管柱。濃縮樣品之脫塩,可令裂解材料通過PD_l〇管 柱(Amersham Pharmacia),經透析,或稀釋到塩濃度等於 或低於5〇15/^11為之。脫塩樣品以2〇11^1'1^5-11(:1?116.5平 衡。樣品可用0-40% NaCl,以1 ml/min流量,使用步称 梯度分離"檢測是在214nm進行(在280nm檢測較差,因為 胰島素内芳香族胺基酸含量低)。A溶劑是2〇mM Tris-HCl pH 6.5,而 B溶劑是 20mM Tris-HCl pH 6.5,1.0M NaCl。 在Roche胰島素標準的同樣導電率,於7-35 ms/cm間洗脫 的分部(1 ml),加以收集(參見第12囷第12圖表示胰蛋 白酵素裂解4405油體製劑(虚線)與人體胰島素標準(實線) 相較之層析圊譜〃收集的分部利用HPLC、ELISA或蛋白質 印跡(資料未示),證明胰島素存在。所集樣品再利用冷凍 乾燥濃縮,用於實施例6所述胰島素生物檢定。 實施例6 廒素耐量試驗:對C57BI/6CB6)雄窟份生物檢定 進行生物檢定’以決定從胰蛋白酵素裂解4405所衍生 重組植物岛趙内效應,與人體胰島素比較。B6鼠體内血漿 葡萄糖水準,在胰島素標準、免對照、SBS胰島素腹膜内 注射之前和之後测定。從Jackson實驗室(Bar Harbor, ME)購買約2月大的15隻C57B1/6(B6)雄鼠。以自動葡糖計 (One Touch Ultra, Lifescan,Johnson & Johnson)測量
WIW 第57頁
五、發明說明(52) 血漿葡萄糖水準,正對照包含HumulinR®(Eli Lilly)和酵 母重組人體胰島素標準’ Roche供應。生理食塩水溶液用 做安慰劑。包含之負對照代表由野生型(非組合)阿拉伯芬 種籽,與重組440 5胰蛋白酵素裂解油體製劑同樣處理,經 純化之胰蛋白酵素裂解油體。 B6鼠關在籠内’按12小時暗-光循環,隨意進食於狭 島素耐量試驗,對鼠腹膜注射(IP)胰島素(1 U/kg體重), 使用自動葡糖計,在〇, 15, 30, 60分鐘測量葡萄糖水準。所 有胰島素耐量試驗均同樣以每天(9:00上午)間距進行。胰 島素耐量試驗的進行,是在次一試驗投服之間穿插至少二 次》腺島素对量試驗結果’描綠在第13圊裡。從4405種籽 衍生的SBS Des B3〇姨島素(實趙菱形),與Humulin R® (空 白方形)和Roche胰島素(空白三角形)標準,在注射後的研 究過程中,行為幾乎一致(統計上並無不同,p<〇.〇5)。 所測試的全部胰島素,與生理食塩水安慰劑(空白圓形)和 胰蛋白酵素裂解的野生型阿拉伯芥油體(實體圓形)(負對 照)比較’大大降低血漿葡萄糖水準(p<0. 05)。 實施例7 卩5884401:?1^-1(11卩27~^1-融厶蛋白之椹成 所研究的融合蛋白之一,以菸草病原相關序列(PRS) 開始(Sijmons等人,1990, Bio/technology, 8:217-221) ’以共轉譯方式用於對ER目標表達之訊號肽。緊接下游的 是從酵母的TA57肽原衍生的胰蛋白酵素裂解性肽原 (KLIP27)(Kjeldsen等人,2001,《生物技術和遺傳工程
第58頁 五、發明說明(53) 評論> 18:89-121)。此接著是Kjeldsen等人(200 1 )所述微 型胰島素(MI)。 此質粒的主鍵pSBS4055基於Hajdukiewicz等人所述的 植物雙載體PPZP2 0 0,((植物分子生物學>,1994,25: 989-994)。所述多重選殖部位,改用賦予宿主植物 phosphinothricine抗性之 pat 基因(Wohlleben 等人,1988 ,(基因 > 70:25-37),利用取自Petroselinum crispum的 泛蛋白啟動子/终止子驅動(Kawal leek等人,1 993, Plant. Mol. Bio.,21:673-684),插入左、右邊界序列 之間。除此序列盒外,取自菜豆(phaseolus vulgaris)的 /5-菜豆蛋白啟動子/终止子(Slight om等人,1983,
Proc. Natl. Acad. Sc· USA 80:1 897- 1 90 1 )驅動 PRS,經 次選殖。使用標準PCR(Horton等人,1 989,(基因> 77: 61-68),把具有所附Sphl/Hindm限制内切核酸酵素部位 之合成PRS-編碼序列,融合於菜豆蛋白啟動子的3’端。
Klip27-MI序列係由四種部份重疊的寡核苷酸合成, 加上阿拉伯芥密碼子用法,以提高植物基礎的表達系統内 有效轉譯的成功。寡核苷酸1 324(GAAGAAGGAGAGCCTAAGTTT GTTAATCAACATCTTTGTGGATCTCATCTTGTTGAGGCTCTCTACCTTG) -序列編號 177,和 1 323CCCTTAGGAGTGTAGAAAAATCCTCTTTCT CCACACACAAGGTAGAGAGCCTCAACA)-序列編號178號,在其互 補20種核苷酸重疊處退火,並伸展形成Klip2 7-MI融合的 5’ 端,同樣進行募核苷酸 1 322CCTAAGGCTGCTAAGGGAATTG) 序列編號 179,和 132UAAGCTTCAGTTGCAATAGTTCTCCAATTGG 第59頁
五'發明說明(54)
TAAAGTGAGCAAATAGAAGTGCAACATTGTTCAACAATTCCCTTAGCAGC CTT) -序列編號180,以形成3’端。在限制消化後,二半以 Bsu361連接’生成全Klip27-MI寫碼序列。此基因的pcr使 用引物 1 363(GCATGCCCAACCAATTGATGACACTG)-序列編號 184 ,和引物 1 329 (AAGCTTCAGTTGCAATAGTTC)-序列編號 183, 附於5’ Sphl/HindlE切口 pSBS4011( —如上述)。結果為質 粒PSBS4401:把PRS-Klip27-MI融合蛋白(序列編號189)編 碼的DNA序列(序列編號188)。在菜豆蛋白啟動子/終止子 的表達控制下,置於雙載體内。菜豆蛋白啟動子在種籽發 育期間,控制轉基因的特殊時間上和組織特殊性表達。 重組大腸桿菌和土壌桿菌屬以DSBS440 1棘却釦成1 利用序列分析確認用於融合蛋白編碼的CDNA整體性後 ’質粒pSBS4401轉型為大腸桿菌菌株DH5a ,得以高水準 表達。單離的質粒DNA(lOOng)在冰上與ι〇〇#ι的DH5a勝 任細胞混合20分鐘。再將細胞於42 °C熱震45秒,回到冰上 2分鐘。然後’添加S0C培養基’令細胞在225 rpm的 enviro搖瓶上,於37°C培育1小時,再將轉型細胞平板接 種於LB壯觀黴素平板(10 g/L騰腺、5 g/L酵母萃取物、5 g/L NaCl、15 g/L瓊脂),並在37°C培育過夜。使用單一 菌落接種於5毫升LB壯觀擻素液體培養基。此等培養基在 37°C成長過夜。按照Qiagen微型預製物,從1毫升過夜培 養基單離重組質粒。單離質粒再用來利用電穿孔(25#F, 2.5 kV, 200Ω)’把勝任土壤桿菌菌株EH1〇1轉型(h〇0(j等 人,1 986; J. Bacteriol, 1 44:732-743)。重組土瓖桿菌
五、發明說明(55) 屬平板接種於AB壯觀黴素/卡那黴素(2〇χ AB塩,2M葡萄 糖 ’ 0· 25ing/nil FeS04 . 7M ’ 1M MgS04,1M CaCl2),使用 單一菌落接種5毫升AB壯觀徽素/卡那擻素液體培養基β 此等培養基在28 °C成長過夜。再使用重組土壤桿菌屬,利 用如實施例1所述在浸泡法(Clough等人,1998,Plant J., 16:735-743),把阿拉伯芥植物轉型。 阿拉伯芥内之胰息素袅i幸皮準 使用上述實施例程序大要’在轉基因阿拉伯芥成熟種 籽内’測定融合蛋白KLIP27-MI(4401)的表達水準。在成 熟種籽的細胞萃取物内未見有轉基因生成物存在。 實施例8
&1BS440 9:OLEO人體胰島素原(〇LR〇-hPim融合香白之 構成 此融合蛋白以取自阿拉伯芥的1 8 kDa油質蛋白開始, 接著是框内利用人趙騰島素原(hPIN)編碼用基因。此融合 蛋白的表達目標在胚發育期間形成的初生油體。 此質粒主魅BS4008基於Hajdukiewicz等人所述植物雙 載體pPZP200(《植物分子生物學>,199 4,25:989-994)。 上述多重選殖部位,改用賦予宿主植物
phosphinothricine的pat基因(Wohlleben等人,1988, 《基因 > 70:25-37) ’ 利用取自 Petroselinum crispum的 泛蛋白啟動子/終止子媒動(Kawalleck等人,1993,
Plant. Mol. Bio.,21:673-684),插入左、右邊界序列 之間。除此序列盒外,取自菜豆的/3 -菜豆蛋白啟動子/
第61頁 五、發明說明(56) 終止子(Slightom等人,1983, Proc. Natl. Acad. Sc. USA 80:1 897-1 90 1 )驅動阿拉伯芥18 kDa油質蛋白基因組 序列,經次選殖。使用標準PCR(Horton等人,1989,(基 因〉77:61-68),把具有附帶NcoI/HindDI限制内切核酸酵 素部位的油質蛋白基因序列(負終止密碼子),融合於菜豆 蛋白啟動子的3’端,生成PSBS4 00 8。
Ncol -人趙前胰島素原基因-HindDI,使用較佳植物密 碼子用法,以Aptagen合成為單件335 bp。隨即連接於 NcoI/HindDI 切口 pSBS4008,在質粒 pSBS4400 中所得:把 油質蛋白人體前胰島素原融合蛋白編碼之DNA序列,在菜 豆蛋白啟動子/終止子表達控制下,置於雙載趙内。 PSBS4400質粒用做模板,利用標準PCR發生人體联島素原 (hPIN),使用pfu DNA聚合酵素,具有引物針對5,端(1457 寡 TTCGTGAACCAACACTTG-序列編號 190),和 3’ 端(1458 寡 AAGCTT TCAGTTACAGTAGT-序列編號191),含有載體現有姨 島素原區之Hind部位。第二片段使用pfu DNA聚合酵素放 大,有引物針對可行的SphI部位(寡1455 GCATGC ATGT(i TTGAGC-序列編號192),至pSBS440 0載體内的阿拉伯芬油 質蛋白基因(寡1456 GGTAGTGTGCTGGCCA-序列編號193) PCR之後,生成物在瓊脂糖凝膠上分離,相當於267 bp (hPIN-Hindm)和 360 bp(SphI-0LE0(3’ 端))片段之帶,使 用凝膠萃取用具(Qi agen)進行凝膠純化。利用第二回pCR 放大把二片段融合,使用Taq DNA聚合酵素,有引物1455
五、發明說明(57) (序列編號192)和1458(序列編號193),與0.001//M的重叠 橋接 PCR引物(寡 1459 GGTGGCCAGCACACTACCTTCGTGAACCAAC ACTTGTG-序列編號194)組合,以58°C退火溫度二次循環, 接著在52°C31次循環,以放大627 bp SphI-0LE0(3’端)-hPIN-Hindffl 片段。再將 627 bp SphI-0LE0(3’ 端)-hPIN-1111^111片段連接到pGEMT Easy Vector SystemTM(Promega) 的T/A突出部,並用來把DH5a細菌轉型,得pSBS34 0 9 (pGEMT-SphI-0LE0(3’ 端)-hPIN-Hindm )。 取自 PSBS34 09 的 Sphl/Hindm 片段,與取自 pSBS4400 的Sphl/Hindm片段交換。對pSBS3409和pSBS4404的標準 限制消化’使用 SphI/HindDI(New England Biolabs)進 行。片段在1.5%瓊脂糖凝膠上分離,使用凝膠萃取用具 (Diagen)純化。從 pSBS3409 釋出的 617 bp Sphl/HindHI 片 段,再使用T4 DNA連接酵素在1 5 °C過夜,連接到預·切口 pSBS4400(除去内部Sphl/Hindm片段)載艎主鏈内的SphI/
HindlH接受蛋白部位。 結果是質粒PSBS4409 :把〇LEOSIN-hPIN融合蛋白(序列 編號196)編碼之DNA序列(序列編號195),在菜豆蛋白啟動 子/終止子的表達控制下,置於雙載體内。菜豆蛋白啟動 子在種籽發育期間控制轉基因的特殊時間上和組織特殊性 表達。 重大腸桿菌和土 1桿菌眉以DSBS4409棘型和成長 利用序列分析確認用於融合蛋白編碼的cDNA整體性後 ’質粒PSBS4409轉型為大腸桿菌菌株DH5a ,得以高水準 第63頁 五、發明說明(58) 表逹。單離的質粒DNA(lOOng)在冰上與100// 1的DH5a勝 任細胞混合2 0分鐘。再將細胞於4 2 °C熱震4 5秒,回到冰上 2分鐘。然後’添加S0C培養基,令細胞在225 rpm的 enviro搖瓶上,於37它培育1小時,再將轉型細胞平板接 種於LB壯觀黴素平板(10 g/L胰睐、5 g/L酵母萃取物、5 g/L NaCl、1 5 g/L瓊脂),並在37 °C培育過夜。使用單一 菌落接種於5毫升LB壯觀黴素液體培養基。此等培養基在 3 7 °C成長過夜。按照Qiagen微型預製物,從1毫升過夜培 養基單離重組質粒。單離質粒再用來利用電穿孔(25#F, 2.5 kV, 200Ω),把勝任土壤桿菌菌株EH101轉型(Hood等 人,1986; J· Bacteriol, 144:732-743)。重組土 壤桿菌 屬平板接種於AB壯觀擻素/卡那擻素(2〇x AB塩,2M葡萄 糖,0. 25mg/ml FeS04 · 7H20,1M MgS04,1M CaCl2),使用 單一菌落接種5毫升AB壯觀擻素/卡那黴素液體培養基。 此等培養基在28 °C成長過夜。再使用重組土壌桿菌屬,利 用如實施例1所述在浸泡法(Cl0ugh等人,1 998,piant J·, 16:7 3 5-743),把阿拉伯芥植物轉型。 拉伯芥内之胰島音夹遠皮準 使用ΐ述實施例程序大要,在轉基因阿拉伯芥成熟種 籽内,測定融合蛋白〇LE〇-hPIN(4409)的表達水準。取自 2 Ϊ (哲4i〇9:6和4409 一 8)的油體蛋白之考馬斯染色凝膠 辕If 合蛋白(如黑箭頭所示)移動至非 第14圖)。此水準計算如上,超過同樣 刀 ,/蛋白在構成總種籽蛋白約0.04%的非轉型種
五、發明說明(59) 籽(wt)的共同移動。 實施例9 紅花轉型 此轉型議題類似T.K. Orlilcowska等人的綱要({植 物細胞、組織和器官培養基>(1995),40:85-91),但對 轉型S-317和使用phosphinothricin做為可選擇標諸。有 所變化和改進。取自S-317加州變種紅花的去雜種籽,無 損、無破、無病害,在0.1% HC1内12分鐘,再用無菌蒸餾 水淋洗4-5次。在1%簾糖和0.25% Gelrite的MS培養基 (T. Murashige和F Skoog (1962), Phsiol, Piant, 15: 473-497),暗中發芽的無菌種籽,先是把取自冷束的甘油 庫存的土壤桿菌屬培養基,放在具有抗生素選擇的5毫升 AB最少液體培養基裡,在28 °C成長48小時。此培養基全份 在5毫升Luria液體培養基内成長過夜,選供轉型„.6_8毫 升細菌細胞以AB培養基洗二次,並補充到最後細胞密度為 0.4-0.5(0D600) » 從發芽幼苗摘除長兩天的子葉,浸於製備的土壤桿菌 屬細胞,平板接種於3%蔑糖、4//M N-6节基腺嗓呤(BA) 和0.8// Μ蔡乙酸(NAA)之MS培養基。把平板暗中於21 °c培 育。三天後,移到具有300mg/L timentin的同樣培養基。 再四天後,全部培養物移到見光。三天後,把外植體放在 加有0.5mg/L phosphinothricin的選擇培養基上。為使芽 繼續伸長,每週把外植艘移到無植物激素但有兩倍量kn〇3 的MS培養基上。從初始外植體剪掉伸長到i〇mm以上的芽,
第65頁 五、發明說明(60) 分別在選擇培養基上成長《為使生根,把代表假想轉基因 組織之綠葉,放到有2 %蔗糖、1 9仁Μ吲哚丁酸和0. 5以Μ ΝΑΑ之MS培養基上。把生根的芽移到排水良好的較少土壤 混合物,在高濕度和1 2小時光照下成長。 實施例1 0 亞麻棘剞諶顆 此轉型程序類似 J. Dong 和 A. McHughen (Plant Cell
Reports (1991) 10:555-560), J. Dong和A. McHughen (Plant Sciences (1993) 88:61-71)以及Mlynarova等人 (Plant Cell Reports (1994) 13:282-285)的綱要。無 損、無破、無病害的去雜亞麻種籽,放入7〇%乙醇溶液内 5-7分鐘’接著在加Tween 20(每100毫升3-4滴)的50%漂 白液内25分鐘。種籽用無菌蒸餾水淋洗5_7次,去雜種籽 放在Magenta甕内2%蔗糖和〇· 3% Gel rite®的MS培養基上 (T. Murashige和F Skoog (1962), Phsiol, Plant, 15: 4 73-497),於光中發芽。為了轉型,土壌桿菌培養物在AB 液趙培養基内成長過夜,加適量抗生素供選擇。將過夜細 胞6-8毫升洗兩次,再懸浮於5毫升^液體培養基内;取此 庫存2毫升’加於98毫升的誘導培養基(MS基礎培養基), 加3%廉糖、5私μ 6-T基胺基嘌呤(BA)和0·25αΜ α-萘 乙酸(ΝΑΑ),調節成0D6。。為1. 0。 、 切割胚轴外植體,在製備的土壌桿菌屬細胞溶液内接 種約4小時(在此期間,徐徐攪拌平板1 -2次)。感染期間後 ’從液趙接種培養基除去外植體,轉清在無菌濾紙上。在
第66頁 五、發明說明(61) 組織培養物平板内,於〇 7%瓊脂凝固誘導培養基上有平 板15-20外植體。用塑膠包把平板密封,在光照(23_24。(:) 下共同栽培外植物48小時《兩天後,把綠色分生組織的外 植趙’移到含30〇mg/L Timentin(預選培養基)的同樣培養 基内’並用塑膠包加以包紮。三天後,把培養物移到含1〇 mg/L DL PPT(選擇I)的上述培養基。用Parafilm®包紮平 板’在24 °C光照情況下培育❶每兩星期移動培養物,並保 持於此培養基一個月。為供芽伸長,每二星期把培養物移 到Magenta喪内的選擇培養*n(MS基礎培養基,含2%蔗
糖 ' 50 0mg/L· MES緩衝液、300mg/L Timentin和 10mg/L DL PPT)。假想轉型芽,存活的選擇,呈深綠色,個別植於選 擇Π培養基上時,7-10天内根旺盛β把生根的芽移到小缽 内的滅菌溫室土壤混合物’幼苗用清潔塑膠杯覆蓋,以供 馴化。為供成熟,把生機蓬勃的植物移到1加侖缽,有排 水良好的土壌混合物,在溫室條件下成長。 雖然本發明已就目前視為較佳具體例加以說明,須知 本發明不限於所揭實施例。反之,本發明旨在涵蓋包含在 所附申請專利範圍的精神和範圍内之各種修飾以及等效配 置。 全部出版物、專利和專利申請案在此全份列入參考者 ,其程度視同個別出版物、專利和專利申請 指明其全份列入參考。 π π π
第67頁 五、發明說明(62) 表1巳知胰島素序列例 序列编號 胰島素模《1 (胺基酸序列識別符) 丨核酸序列識別蒋1 人Λ天然胰惠素 - |(Ρ01308)人體前胰島素原{包括基因 V00565, Μ10039, J00265, Χ70508, |L 15440, BC005255 和 AJ009655 1 非人《天然胰島素 哺乳動物 8 (AAB25818)狭島素原C-狀Equus przewalskii(馬,斑馬,犀牛和貘 (Perissodactyla) 9 (P01310)前狹島素原 Equus caballus(馬) 10 (P01311)前胰島素原{包括基因 U03610 和 M61153 } Oryctolagus cuniculus(家兔) 11 (P01312)换島去 Balaenoptera physalus(脊鮪餘) 12 (P01314)狭島素 Balaenoptera borealis(sei 錄) 13 (P01315)前胰息紊康{包括基因 AF064555 和 AY044828} Sus scrofai豬) 14 (P01316)狭島音 Elephas maximus(亞洲象) 15 (P01317)前胰島素原{墓因 M54979} Bostaurus(牛) 16 (P01318>前胰島素原{基因U00659丨Ovis aries(羊) 17 (P01320)肤島音 Camelus dromedarius(阿拉伯路轮) 18 (P01321)前胰島素原 ί 篡因 V00179} Canis sp.(犬) 19 (P01328)换島紊 Hvstrix cristatai 冠毛豪豬) 20 (P10604)前狹島音原{基因 j〇2989} Aotustrivirgatus(douroucouli)技狼 21 (P30406)前狹島素肩j基因j〇〇336} Macaca fascicularis(含蟹短尼狼) 22 (P30407)前狭島素原{基因 X61092} Cercopithecus aethiops (非洲錄狼) 23 (P30410)前胰島素康{臬因 χ6ΐ〇89ί Pan troglodytes (黑猩猩) 24 (Q9TQY7)联島素 Ornithorhvnchus anatinus ( rt 嘴獸) 25 (AAM76641)狭島棄{基因 AY092024} Pongopygmaeus (獲獲) 26 (AAN06935)前胰島素原{基因:AH011815 (含AY137498, AY137499 和 AY137500)} Gorilla eorilla (大猩猩) 27 (1NMKSQ)狹島素 Saimiri sciureus (普通松鼠狼) 28 (P01313)前胰島素原{某因 M26328 丨 Cricetulus longicaudatus (長尾倉鼠) 29 (P01322)胰島素 1 前體{包括基因 V01242, V01242 和 M25584} Rattus norvegicus (挪威齓) 30 (P01323)胰岛素 2 前艎{包括基因 V01243, J00748, M25583 和 M25585} Rattus norvegicus (椰威 g ) 31 [P01324)狹島素 Acomys cahirinus (埃及針氣) imi 第68頁
五、發明說明(63) 32 賊馬素 1 前體{包括基因 Χ04725 和 ΑΚ007482} Musmusculus 33 01326)^^^. 2 前想{基因 x〇4724 } Mus musculus (家鼠) 34 (P01327)^J>素 Chinchi丨la brevicaudata (栗鼠) 35 =g29)前胰島素原{包括基因 K02233 和 M11713 } Caviaporcellus (天 36 (P17715)m 1 島素原{基因 M57671 } Octodon degus (degu) 37 (Ρ18109>%1>素 Didelphis virginiana (北美負鼠) 38 fRodendasn.l- 39 40 (Q62587)~Ui島素原 i 某因 X98241 } Psammomysobesus (肥沙鼠) 素原{基因 AY〇386〇4} Spermophilus tridecemlineatus (十 41 (740063A)^^ 素 C peptide Cavia Dorcellus (天尽宣) _________ 惠類 42 ㈣1於2贿胰島素原{包括基因AHO〇2454 (含J00872, J00873和J00874 ), V00416,V〇〇418 和 X58993} Gallusgallus (難) 43 44 騰島责原 Anas ρ丨atyrhynchos (烏瑞) (P07454)姨島素 Anser anser anser (西方灰雁) 45 ^1*51463)前胰島素原{基因:AH006925(含 S66611 和 S66612)}Se丨asphorus rufiis (赤揭蜂鳥) ρ· --. 魚類 46 (U7J727)前胰島素原{某因:AF036326} Daniorerio (斑馬备) 47 (Ρ013$5)煎騰島素原{基因:χ〇〇989} Cyprinus caroio (普诵射 A、 48 (FII1W7)騰島素 Batrachoididae gen. sp·(轉魚) 49 (P01339)騰島素 Thunnus thynnus (藍錄箱魚) 50 (PU1340)騰島素 Katsuwonus pelamis (飛箱魚) 51 (P01341)前騰島素原丨基因:v〇〇634} Lophiuspiscatorius (择晉 4 ) 52 (P01342)前騰島素原|基因:v〇〇649 i Myxine glutinosa (大西洋故备) 53 (r〇4667)前胰島素原{包括基因:χ00148, J00936, K01655 ‘ X13559} Oncorhynchus keta (鮭魚) 54 (P07453)Myox〇ceDhalus scorpius (杜父阿魚) 55 (P09476)狹島素 lJepisosteus spatula (硬鱗魚) 56 (P09477)胰島素 Platichthvs flesus (歐洲比目魚) 一 57 (P09536)胰島素 Hvdrolagus colliei (斑點銀较) 58 (P12704)狹島素 Squalus acanthias (尖裴魚) 59 (P12705)前騰島素原Torpedo marmorata (石斑電魟备) 60 (P13190)胰&素原 ί 基因:U82395 } Callorhinchusmilii f 金备、 61 (P14806)换島素 Petromyzon marinus (目短) 62 (P23187)换島素 Oncorhynchus gorbuscha (小娃魚) ΙΙΙΙΙ·ΙΙ 第69頁
五、發明說明(64) 63 (P29335)^島素Amia calva (北美淡水魚) 64 嫉島素 Anguilla rostrate (美洲St) 65 ^”^25)明联島素原{基因:AF038123 } Oreochromisniloticus (尼羅河羅 非魚) 66 (P81423)騰島素 Acipenser gueldenstaedtii (俄羅斯铸魚) 67 (1>81881)联島素1>丨啦(:加11165〇口〇加1丨(:115(卩狀11) 68 (<j9W7R2>前騰島素原{基因AB029318 } Veraspermoseri (條韓比目鱼、 69 (1603204A)騰島素 C fl女 Anguilla anpiiilla (歐洲辑) —----兩棲鳗 70 (Fl27Ufe)騰島素1前想{基因:M24443 } Xenopus laevis (非洲爪桂) 71 (Ρ127ϋ7)联島素2前號f基因:M24442 } Xenopus丨aevis (非洲爪娃) -爬蟲類 _ 72 (P31887)騰島素 Trachemysscripta (紅耳滑条) 73 (P12703)膜島素 Alligator mississippiensis (美洲鳄) __ 74 (P12708)騰島素 Za〇cys dhumnades (蛇) _ 75 (P01334)肤島素Crotalus atrox (西方赛形背摩尾蛇) ;程胰A紊 --- 人類 —76 (AAA72172)合成前肤島素原{某因:j〇2547 } 77 (AAA72916)合成胰岛素〇鏈3’端{基因:AH003171或M38610} 78 (AAA72917)合成胰島素石鏈3’端{某因:AH003171或M38611} 79 (CAA00712)合成胰島素{基因:A07755 } 80 (CAA00713>合成胰島素{基因:A07758} 81 (CAA00714)合成胰島素{基因:A07761 } 82 (CAA00715)未命名蛋白生成物{某因:a〇7764 } 83 (CAA00736)合成胰島素原{基因:A08012} (EP0367163-A) __ 84 (CAA00783)合成胰島素{基因:A08468 } (EP 0376156-A) 85 (CAA01581)改質胰島素前體{基因:A21951 } (WO9011299) 86 (CAA01254)合成胰島素{基因:A15938} (EP0214826-A)_ 87 (CAA01799)Asp(B 1 ),Asp(B4),Asp(B 1 O^spCB 16),Glu(B27)胰島素合成構 造物{基因:A26317} —88 (CAA01798)Glu(B9),Glu(A12)騰島素前體合成構造物{基因:A26314 } -___89 (CAA23424)合成胰島素原{基因:V〇〇〇82 } 90 (CAA24707)合成胰島素C鏈丨某因:V01461 } 91 (CAA25151)合成胰島素B鏈彳某因:χ〇〇462 } 92 (CAD60056)未命名合成蛋白生成物{基因:ΑΧ573757} (Pat.WO 02/079250)
1__11 第70頁 五、發明說明(65) 93 (棊合成人體胰島素B和微型C鏈傕用失活矽凝膊層拆法 94 (1BZVA)鏈 A〔 d-Alab26〕-Des(B27-B30)-胰島素-B26-结胺-A-超效單一取 代狭島素類似物 95 (ΙΒΖγΒ)鏈 B〔d-Alab26〕-Des(B27-B3〇)-胰島素-·Β26-醢胺-A-超效單-取 代胰島素類似物 96 联島素突變體(B1,B10,B16,B27) elu.Des-B30,Nmr 97 鍵 B 胰島素突變趙 CBKB10,B16,B27) elu, Des-B30. Nmr 98 (1HLSA)鏈A人體胰氟音突變想·His (B16) 99 (1HLSB)鏈B人體胰皂音突變體-His (Β16;) 100 具有增效活性的不穩定胰島素類物之非標準設計 101 具有增效活性的不穩定胰恚素類物之非標準設計 102 (WgAC)丝具有增效活性的不穩定胰島素類物之非標準設計 103 (L^>P)^p·具有增效活性的不穩定胰島素類物之非標準設計 104 (1J73A)鏈A具有天然活性的不移.定胰島素類似物 105 (1J73B)鍵13具有天然活性的不親定肤焦音镅似物 106 有天然活性的不鞔定胰島素類似物 107 (1J73D)鍵D具有天然活性的不接定肫島素類似物 108 (1KMFA)鏈Α人體胰島素突變型丨丨e_A2_A丨丨〇_丨丨e H丨S_B丨〇_Α Pro~B28-Lys,Lys,B29-Pro 109 (1KMFB)鏈β人體胰島素突變型丨丨6_^_八丨丨〇_丨丨e, His-B1〇-Asp, Pro-B28-Lys, Lys-B29-Pro 110 (1K3MA)鏈 A 人體胰島素突變型丨丨His-BH)_Asp Pr〇_B28_LyS, Lys-B29-Pro 111 B 人體胰島素突變型 lle-M-Ala^His-B 10-Asp,Pro-B28-Lys, 112 (1LW8A)緯A Aiio-iiea2-胰島素.非活性對掌類似物 113 鏈B Alb-llea2-胰島素.非活性斛堂類似物 114 (lLW8QM_^Il〇-nea2-騰島素.非活性對掌類似物 115 (1LW8D)健p Alio-丨lea2-胰島素.非活性對掌類似物 116 A入妞胰岛京哭變體丨丨Va丨·A3_G丨y His_B10-Asp, Pro-B28-Lys, Lys-B29-Pro 117 (1LKQB)鏈 B 人體胰島去突變體 Val_A3_Gly His_B10_Asp Pro-B28-Lys, Lys-B29-Pro 118 ilMHIA)鏈 AB9(Asp)突-¾ '" 119 (1MHIB)鏈 B B9(Asp)突崁艚 120 (1MHJA)鏈 A B25(phe)突蠻》 121 ilMHJB)鏈 B B25(phe)突猙雜 122 (1VKTA)鏈A,人體胰島素二個二硫化物楛枣 … - 123 (1VKTB)鏈B,人體胰島素二個二硫化物楛型 ΙΗΗΙ
非人類 -1 124 (AAG59607)合成 albebetin 胰 ι---- 125 rAAr^o/rn/r^ i, nihj-fjirrLn ^ .^l^g^AY〇17185 }_ (AAG59606) 口成dlbcferon肤島佥彳某阳· ΑνΛ】7〗丨 --) 胰ft常融合蛋白 —--- 人類---— 126 (ΑΑΒ27046)έί 1 2·缺島A融合卷白之n古嫂 — 127 128 |^'爾2)表忠生長因子/De^-Bjgj鏈人體胰务音前艚融合蛋白 - 非人類 129 (AAA"72177)大腸桴諸青黴素酶/鼠騰島素ι融合蛋白5,端{基 因:ΑΗ003149 或 J02553 } 130 (ΑΑΑ72178)大腸桿菌青街:素薛/鼠胰島素ι融合蛋白3,端{基 因:AH003149 或 J02554 丨 π ι 131 鼠胰島素訊號序列/大腸桿菌/3 -半乳糖脊酶融合蛋白{基 132 (ΑΑΑ72181)猿猴病毒40(SV40)/鼠前肫Α去疮I融合蛋白{某因:顧so i 微型胰島素 --1 人類 _ 133 (1EFEA)鏈Λ,活性微型胰島素原,M2h 134 (1JCAA)鏈A,具有增進活性的不穩定胰島素類似物之非標準設計 135 (1JCAB)鏈B,具有增進活性的不穩定胰息棄類似物之非標準設計 136 (1JCAC)鏈C,具有增進活性的不穩定胰島素類似物之非標準設計 137 (1JCAD)鏈D,具有增進活性的不穩定胰島素類似物之非標準設計 138 (1JK8C)鏈C,人體胰惠素flic-H丨a-Dq8複合物 139 (1J73A)鍵A,具有天然活性之不穩定换島素類似物 140 (1J73B)鏈B,具有天然活性之不穩定胰島素類似物 141 (1J73C)鏈C,具有天然活性之不穩定胰島素類似物 142 (1J73D)鏈D,具有天然活性之不穩定腺島素類似物 143 (1SJTA)鏈A,微型胰島素原,二键胰島素類似物突變體:Des B30, His(B10)asp, Pr〇CB28)asp 144 (1SJTB)鏈B,微型胰島素原,二鏈胰島素類似物突變體:DesB30, His(B10)asp, Pro(B28)aso 145 (1SJU)微型胰島素原,單鏈胰島素類似物突變體:DesB30,His(B10)asp, Pro(B28)asp 以及 Lvs B29 和 Glv A1 間之肽鍵
第72頁 五、發明說明(67) 序列綜述 序列編號1和2,分別規定質粒PSBS4404内PRS-D9scFv -KLIP2 7-MI-KDEL耦合蛋白的核苷酸序列和推衍的胺基酸 序列。 序列編號3和4,分別規定質粒PSBS4405力01e〇-KLIP8 -KLIP2 7-MI耦合蛋白的核苷酸序列和推衍的胺基酸序列。 序列編號5和6,分別規定質粒PSBS4414内PRS-MI-四 鹼基接頭-D9Scfv-KDEL耦合蛋白的核苷酸序列和推衍的胺 基酸序列。 序列编號7和145,規定表1内所述已知胰島素序列。 序列编號146至148,規定胰島素C肽片段之胺基酸序 列。 序列編號149,規定四鹼基處理肽之胺基酸序列。 序列编號150至155,規定能夠將胰島素多肽保持於ER 的多肽類之胺基酸序列。 序列編號156至160,規定能夠將胰島素多肽保持於ER 衍生儲存胞器的多肽類之胺基酸序列。 序列編號1 6 1,規定PRS訊號序列之胺基酸序列。 序列編號162至171,規定酵母前導序列之胺基酸序 列,及由此衍生之序列》 序列編號1 72至1 73,規定間隔肽的胺基酸序列。 序列编號174,規定KLIP8序列之胺基酸序列。 序列編號175,規定正向引物1 325之核苷酸序列,係 與D 9 Sc Fv cDN A殖物的5’區互補,設計來對方便隨後連接
第73頁
五、發明說明(68) 的5 區’添加sphl部位。 序列編號176,規定反向引物1 326之核苷酸序列,與 D9ScFv cDNA殖物的3’區互補,設計來對方便隨後連接的 3’區,添加Xhol部位。 序列編號177,規定正向引物1 324之核苷酸序列,與 反向引物1323的20核苷酸區互補,設計來形成Klip27-MI 融合之5’端。 序列編號178,規定反向引物1323之核苷酸序列,與 正向引物1324的20核苷酸區互補,設計來形成Klip27-MI 融合之5’端。
序列編號179,規定正向引物1 322之核苷酸序列,與 反向引物1321的19核苷酸區互補,設計來形成Klip27-MI 融合之3’端》 序列編號180,規定反向引物1321之核苷酸序列,與 正向引物1322的19核苷酸區互補,設計來形成Klip27-MI 融合之3’端。 序列編號181,規定正向引物1 364之核苷酸序列,與 K1 ip27-MI序列的5’區互補,設計來對方便隨後連接之5’ 區’添加Xhol部位。
序列編號182,規定反向引物1 334之核苷酸序列,與 Klip27-MI序列的3’區互補,設計來對方便隨後連接之3’ 區和3’ KDEL序列,添加Hindm部位。 序列編號183,規定反向引物1329之核苷酸序列’與 Klip27-MI序列的3’區互補,設計來對方便隨後連接之3’
第74頁 五、發明說明(69) 區,添加Hindltt部位。 序列編號184,規定正向引物1363之核苷酸序列,與 Klip27-MI序列之5’區互補,設計來對方便隨後連接的5’ 區,添加SphI部位》 序列編號185,規定正向引物1515之核苷酸序列,與 胰島素B鏈序列之5’區互補,設計來與反向引物1518聯合 把間插四鹼基部份插入人體胰島素的真實A和B鏈之間。 序列編號186,規定反向引物151 8之核苷酸序列,與 胰島素B鏈序列的3’區以及胰島素A鏈的5’區互補,有間插 四鹼基微型C肽序列,設計來把間插四鹼基部位插入於人 體胰島素的真實A和B鏈之間。 序列編號187,規定反向引物1517之核苷酸序列,與 D9scFv/KDEL序列之3’區互補,設計來放大整個MI四鹼基 接頭D9Scfv-KDEL,以產生pSBS4414插入片段。 序列編號188至189,分別規定質粒PSBS4401内 PRS-K1 ip2 7-MI融合蛋白之核苷酸序列及衍生之胺基酸序 列。 序列編號190,規定正向引物1457之核苷酸序列,與 胰島素B鏈序列的5’區互補,設計來與反向引物1591聯合 ,發生人體胰島素原(hR IN)片段。 序列編號191,規定反向引物1 458之核苷酸序列,與 人體胰島素(hP IN)互補,設計來發生人體胰島素(hP IN) 原,並添加3’ HindlE選殖部位β 序列編號192,規定正向引物1 455之核苷酸序列,與 第75頁 五、發明說明(70) PSBS44 04的SphI部位之5,區互補,設計來與反向引物1456 聯合放大阿拉伯^油質蛋白美因。 序列編號193 ’規定反向引物1456之核苷酸序列,與 阿拉伯芥油質蛋白基因之3,區互補,設計來與正向引物 1455聯合放大阿拉伯芥油質蛋白基因。 序列編號1 94 ’規定重疊橋接PCR引物之核苷酸序列’ ,阿拉伯芬油質蛋白基因之3,區以及人體胰島素原基因的 5端互補’設計來與正向引物1455及反向引物丨456聯合產 生PSBS4409插入片段》 序列編號195至196,分別規定質粒PSBS440 9内OLEO-hPIN融合蛋白之核苷酸序列和推衍之胺基酸序列。
第76頁
五、發明說明(71) 序列編號i atgaacttccttaagtctttcccttrctacgctttcctttgtttcggtcaatacttc gttgctgttacgcatgctgacattgtgatgacacagtctccatcctccctggctatg tcagtgggacagcgggtcactatgcgctgcaagtccagtcagagccttttaaaaagt accaatcaaaagaactatttggcctggtaccagcagaaaccaggacagtctcctaaa cttctggtatactttgcatccactagggaatctggggtccctgatcgcttcataggc agtggatctgggacagatttcactcttaccatcagcagtgtgcaggctgaagacctg gcagattacttctgtcagcaacattataacactcctcccacgttcggtgctgggacc aagctggagcttaagcggtctccgaacggtgcttctcatagcggttctgcaccaggc actagctctgcatctggatctcaggtgcacctgcagcagtctggagctgagctgatg aagcctggggcctcaatgaagatatcctgcaaggctactggctacacattcagtagc tactggatagagtgggtaaagcagaggcctggacatggccttgagtggattggagag attttacctggcagtggtagtactacctacaatgagaagttcaagggcaaggccaca ttcactgcagatacatcctccaacacagcctacatgcaactcagcagcctgacatct gaggactctgccgtctattactgtgcaagattggatgttgactcctggggccaaggc accactctcacagtctcgagtcaaccaattgatgacactgaatcccagaccacgtca gtgaacctcatggccgatgatactgagagcgcgtttgctacacaaacaaattcggga ggtcttgacgttgtcggattgatctccatggctaagagagaagaaggagagcctaag
tttgttaatcaacatctttgtggatctcatcttgttgaggctctctaccttgtgtgt ggagaaagaggatttttctacactcctaaggctgctaagggaattgttgaacaatgt tgcacttctatttgctcactttaccaattggagaactattgcaacaaggatgaactt tga 序列編號2
MNFLKSFPFYAFLCFGQYFVAVTHADIVMTQSPSSLAMSVGQRVTHRCKSSQSLLKS
TNQKNYLAWYQQKPGQSPKLLVYFASTRESGVPDRFIGSGSGTDFTLTISSVQAEDL
ADYFCQQHYNTPPTFGAGTKLELKRSPNGASHSGSAPGTSSASGSQVHLQQSGAELM
KPGASMKISCKATGYTFSSYWIEWVKQRPGHGLEWIGEILPGSGSTTYNEKE'KGKAT
FTADTSSNTAYMQLSSLTSEDSAVYYCARLDVDSWGQGTTLTVSSQPIDDTESQTTS
VNLMADDTESAFATQTNSGGLDVVGLISMAKREEGEPKFVNQHLCGSHLVEALYLVC
GERGFFYTPKAAKGIVEQCCTSICSLYQLENYCNKDEL 序列編號3 atggcggatacagctagaggaacccatcacgatatcatcggcagagaccagtacccgatg atgggccgagaccgagaccagtaccagatgtccggacgaggatctgactactccaagtct aggcagattgctaaagctgcaactgctgtcacagctggtggttccctccttgttctctcc agccttacccttgttggaactgtcatagctttgactgttgcaacacctctgctcgttatc ttcagcccaatccttgtcccggctctcatcacagttgcactcctcatcaccggttttctt
tcctctggagggtttggcattgccgctataaccgttttctcttggatttacgcaacggga gagcacccacagggatcagacaagttggacagtgcaaggatgaagttgggaagcaaagct caggatctgaaagacagagctcagtactacggacagcaacatactggtggggaacatgac cgtgaccgtactcgtggtggccagcacactaccatggctgagatcacccgcattcctctc tacaaaggtaagtctctccgtaaggcgctgaaggaacatggacttctagaagacttcttg cagaaacaacagtatggcatctcgagcaagttccaaccaattgatgacactgaatcccag accacgtcagtgaacctcatggccgatgatactgagagcgcgtttgctacacaaacaaat tcgggaggtcttgacgttgtcggattgatctccatggctaagagagaagaaggagagcct aagtttgttaatcaacatctttgtggatctcatcttgttgaggctctctaccttgtgtgt ggagaaagaggatttttctacactcctaaggctgctaagggaattgttgaacaatgttgc acttctatttgctcactttaccaattggagaactattgcaactga mm\ 第77頁
五、發明說明(72) 序列編號^
MADTARGTHHDIXGRDQYPMMGRDRDQYQMSGRGSDYSKSRQIAKAATAVTAGGSLLVLSSLTLVGTVI
ALTVATPLLVIFSPILVPALITVALLITGFLSSGGrGIAAITVFSWIYATG EHPQGSDKLDSARMKLGSKAQDLKDRAQYYGQQHTGGEHDRDRTRGGQHTTKAEITRIPLYKGKSLRKA. LKEHGLLEDE'LQKQQYGISSKFQPIDDTESQTTSVNLMADDTESAF'ATQTi: SGGLDWGLISMAKREH:G£PKFVNQHi_C:GSHIJVH:AI/fLVCG£RGi'rfTPKAAK-GIVE:ii:::::SICSLYQL·
ENVCN 序列編號:5 atgaacttccttaagtctttccctttctacgctttcctttgtttcggtcaatacttcgctgctgtcacg catgcctttgttaatcaaeatctttgtggatctcatcttgttgaggctctctaccttgtgrgrggagaa agaggacttttctacactcctaagactagaagaaagaaaggaattgttgaacaatgttgcacttctatt tgctcaccttaccaattggagaactattgcaacagaagaaagagagacattgtgatgacacagcctcca tcctccctggctatgtcagtgggacagcgggtcactatgcgctgcaagtccagtcagagccttttaaaa agtaccaatcaaaagaactatttggcctggtaccagcagaaaccaggacagtctcctaaacttctggta tactttgcatccactagggaatctggggtccctgatcgcttcataggcagtggatctgggacagatttc actcttaccatcagcagtgtgcaggctgaagacctggcagattacttctgtcagcaacattataaoact cctcccacgttcggtgctgggaccaagttggagcttaagcggtctccgaacggtgcctctcatagcggt tctgcaccaggcactagctctgcatctggatctcaggtgcacctgcagcagtctggagctgagctgatg aagcctggggcctcaatgaagatatcctgcaaggctactggctacacattcagtagctactggatagag tgggtaaagcagaggcctggacatggcctcgagtggattggagagattttacctggcagtggtagtact acctacaatgagaagttcaagggcaaggccacattcactgcagatacatcctccaacacagcctacatg
caactcagcagcccgacatctgaggactctgccgtctattactgT:gcaagattggacgttgactcctgg ggccaaggcaccactctcacagtgagctcaaaggatgagctttga 序列編號:6
MNFLKSFPFYAFLCFGQYFVAVTHAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRRKRGIVEQCCTSI
CSLYQLENYCNRRKRDIVMTQSPSSLAKSVGQRVTMRCKSSQSLLKSTMQKNYLAWYQQKPGQSPKLLV
YFASTRESGVPDRFIGSGSGTDFTLTISSVQAEDLADYFCQQHYNTPPTFGAGTKLELKRSPNGASHSG
SAPGTSSASGSQVHLQQSGAELMKPGASMKISCKATGYTFSSYWIEWVKQRPGHGLEWIGEILPGSGST
TYNEKFKGKATFTADTSSNTAYMQLSSLTSSDSAVYYCARLDVDSWGQGTTLTVSSKDEL 序列編號:7
MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRRE
AEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN 序列編號:8
EAEDPQVGEVELGGGPGLGGLQPLALAGPQQ 序列編號:9
FVNQHLCGSHLVEALYLVCGERGFFYTPKAXXEAEDPQVGEVELGGGPGLGGLQPLALAGPQQXXGIVE
QCCTGICSLYQLENYCN
序列編號:10
MASLAALLPLLALLVLCRLDPAQAFVNQHLCGSHLVSALYLVCGERGFFYTPKSRREVEELQVGQAELG
GGPGAGGLQPSALELALQKRGIVEQCCTSICSLYQLENYCN 序列編號:11
GIVEQCCTSICSLYQLENYCN 序列編號:12
GIVEQCCASTCSLYQLENYCN imii 第78頁
五、發明說明(73) 序列編號:13
MALWTRLLPLLALLALWAPAPAQAFVNQHLCGSHLVEALYLVCGERGFFYTPKARRE AEN PQAGA VELGGGLGGLQALALEG ? PQKRGIVEQCCT SIC S LYQL EN YCN 序列編號:14
GIVEQCCTGVCSLYQLENYCN 序列編號:15
MALWTRLRPLLALLALWPPPPARAFVNQHLCGSHLVEALYLVCGERGFFYTPKARRE
VEGPQVGALELAGGPGAGGLEGPPQKRGIVEQCCASVCSLYQLENYCN 序列編號:16
MALWTRLVPLLALLALWAPAPAHAFVNQHLCGSHLVEALYLVCGERGFFYTPKARRE
VEGPQVGALELAGGPGAGGLEGPPQKRGIVEQCCAGVCSLYQLENYCN 序列編號:17
GIVEQCCASVCSLYQLENYCN
序列編號:18
MALWMRLLPLLALLALWAPAPTRAFVNQHLCGSHLVEALYLVCGERGFFYTPKARRE
VEDLQVRDVELAGAPGEGGLQPLALEGALQKRGIVEQCCTSICSLYQLENYCN 序列編號:19
GIVDQCCTGVCSLYQLQNYCN 序列編號:20
MALWMHLLPLLALLALWGPEPAPAFVNQHLCGPHLVEALYLVCGERGFFYAPKTRRE
AEDLQVGQVELGGGSITGSLPPLEGPMQKRGVVDQCCTSICSLYQLQNYCN 序列編號:21
MALWMRLLPLLALLALWGPDPAPAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRRE
AEDPQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN 序列編號:22
MALWMRLLPLLALLALWGPDPVPAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRRE
AEDPQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN
序列編號:23
MALWMRLLPLLVLLALWGPDPASAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRRE
AEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN 序列編號:24
GIVEECCKGVCSMYQLENYCN 序列編號:25
第79頁 1345587 五'發明說明(74)
CGSHLVEALYLVCGERGFFYTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQ KRGIVEQ: 序列編號:2 6
MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRRE
AEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN 序列編號:27
FVNQHLCGPHLVEALYLVCGERGFFYAPKTGVVDQCCTSICSLYQLQNYCN 序列編號:28
MTLWMRLLPLLTLLVLWEPNPAQAFVNQHLCGSHLVEALYLVCGERGFFYTPKSRRG
VEDPQVAQLELGGGPGADDLQTLALEVAQQKRGIVDQCCTSICSLYQLENYCN
序列編號:2S
MALWMRFLPLLALLVLWEPKPAQAFVKQHLCGPHLVEALYLVCGERGFFYTPKSRRE
VEDPQVPQLELGGGPEAGDLQTLALEVARQKRGIVDQCCTSICSLYQLENYCN
序列編號:30
MALWIRFLPLLALLILWEPRPAQAFVKQHLCGSHLVEALYLVCGERGFFYTPMSRRE
VEDPQVAQLELGGGPGAGDLQTLALEVARQKRGIVDQCCTSICSLYQLENYCN 序列編號:31
GIVDQCCTSICSLYQLENYCN 序列編號:32 MALLVHFLPLLALLALWEPKPTQAFVKQHLCGPHLVEALYLVCGERGFFYTPKSRRE VEDPQVEQLELGGSPGDLQTLALEVARQKRGIVDQCCTSICSLYQLENYCN , 序列編號:33
MALWMRFLPLLALLFLWESHPTQAFVKQHLCGSHLVEALYLVCGERGFFYTPMSRRE
VEDPQVAQLELGGGPGAGDLQTLALEVAQQKRGIVDQCCTSICSLYQLENYCN 序列編號:34
GIVDQCCTSICTLYQLENYCN
序列編號:35
MALWMHLLTVLALLALWGPMTGQAFVSRHLCGSNLVETLYSVCQDDGFFYIPKDRRE
LEDPQVEQTELGMGLGAGGLQPLALEMALQKRGIVDQCCTGTCTRHQLQSYCN 序列編號:36
MAPWMHLLTVLALLALWGPNSVQAYSSQHLCGSNLVEALYMTCGRSGFYRPHDRREL
EDLQVEQAELGLEAGGLQPSALEMILQKRGIVDQCCNKICTFNQLQNYCNVP 序列編號:37
GIVEQCCNSICSLYQLETYCN rami 第80頁 五、發明說明(75)
序列編號:3S
/.ALWILLPLLALLILWGPDPAQAFVNQHLCGSHLVEALYILVCGERGFFYTPMSRRL
VEDPQVGQVELGAGPGAGSEQTLALEVARQARIVQQCTSGICSLYQENYCN 序列編號:39
MALWMRLLPLLAFLILWEPSPAHAEVNQHLCGSHLVEALyLVCGERGFFYTPKFRRG
VDDPQMPQLELGGSPGAGDLRALALEVARQKRGIVEQCCTGICSLYQLENYCN 序列編號:4 0
MALWTRLLPLLALLALLGPDPAQAFVNQHLCGSHLVEALYLVCGERGFFYTPKSRRE
VEEQQGGQVELGGGPGAGLPQPLALEMALQKRGIVEQCCTSICSLYQLENYCN 序列編號:41 ELEDPQVEQTELGMGLGAGGLQPLQGALQ 序列編號:42
MALWIRSLPLLALLVFSGPGTSYAAANQHLCGSHLVEALYLVCGERGFFYSPKARRD
VEQPLVSSPLRGEAGVLPFQQEEYEKVKRGIVEQCCHNTCSLYQLENYCN 序列編號:43
AANQHLCGSHLVEALYLVCGERGFFYSPKTXXDVEQPLVNGPLHGEVGELPFQHEEY
QXXGIVEQCCENPCSLYQLENYCN
序列編號:44 GIVEQCCENPCSLYQLENYCN 序列編號:45
IQSLPLLALLALSGPGTSHAAVNQHLCGSHLVEALYLVCGERGFFYSPKARRDAEHP
LVNGPLHGEVGDLPFQQEEFEKVKRGIVEQCCHNTCSLYQLENYCN 序列編號:46
MAVWLQAGALLVLLVVSSVSTNPGTPQHLCGSHLVDALYLVCGPTGFFYNPKRDVEP
LLGFLPPKSAQETEVADFAFKDHAELIRKRGIVEQCCHKPCSIFELQNYCN 序列編號:47
MAVWIQAGALLFLLAVSSVNANAGAPQKLCGSHLVDALYLVCGPTGFFYNPKRDVDP
PLGFLPPKSAQETEVADFAFKDHAEVIRKRGIVEQCCHKPCSIFELQNYCN 序列編號·. 48
GIVEQCCHRPCDIFDLQSYCN 序列編號
GIVEQCCHKPCNIFDLQNYCN
序列編號:50 GIHZZCCHKPCBIFZLZBYCN
第81頁
B45WF
五、發明說明(76) 序列編號:5_
MAALWLQSFSLLVLLVVSWPGSQAVAPAQHLCGSHLVDALYLVCGDRGFFYNPKRDV
DQLLGFLPPKSGGAAAAGADNEVAEFAFKDQMEMMVKRGIVEQCCHRPCNIFDLQNY
CN 序列編號:52
MALSPFLAAVIPLVLLLSRAPPSADTRTTGHLCGKDLVNALYIACGVRGFFYDPTKM
KRDTGALAAFLPLAYAEDNESQDDESIGINEVLKSKRGIVEQCCHKRCSIYDLENYC
N 序列編號:53
MAFWLQAASLLVLLALSPGVDAAAAQHLCGSHLVDALYLVCGEKGFFYTPKRDVDPL
IGFLSPKSAKENEEYPFKEXJTEMMVKRGIVEQCCHKPCNIFDLQNYCN 序列編號:54
GIVEQCCHRPCNIRVLENYCN
序列編號:55
GIVEQCCHKPCTIYELENYCN 序列編號:56
GIVEQCCHKPCNIFDLQNYCN 序列編號:57
GIVEQCCHNTCSLANLEGYCN 序列編號:58
GIVEHCCHNTCSLYDLEGYCNQ 序列編號|:59
GIVEHCCHNTCSLFDLEGYCN 序列編號:60
VPTQRLCGSHLVDALYFVCGERGFFYSPKQIRDVGPLSAFRDLEPPLDTEMEDRFPY
RQQLAGSKMKRGIVEQCCHNTCSLVNLEGYCN
序列編號:61
GIVEQCCHRKCSIYDMENYCN 序列編號:62
GIVEQCCHKPCNIFDLQNYCN 序列編號:63
GIVEQCCLKPCTIYEMEKYCN limi 第82頁 五、發明說明(77) 序列編號:64
7:VEQCCHKPCSIFDLQNYCN 序列編號:65
MAALWLQAFSLLVLMMVSWPGSQAVGGPQHLCGSHLVDALYLVCGDRGFFYNPRRDV
DPLLGFLPPKAGGAVVQGGENEVTFKDQMEMMVKRGIVEECCHKPCTIFDLQNYCN 序列編號
GIVEQCCHSPCSLYDLENYCN
序列編號:67 GIVEQCCHKPCSIFDLQNYCN 序列編號:68
MAALWLQSVSLLVLMLVSWSGSQAVLPPQHLCGAHLVDALYLVCGERGFFYTPKRDV
DPLLGFLPAKSGGAAAGGENEVASFAFKDQMEMMVKRGIVEQCCHKPCNIFDLQNYC
N 序列編號:69 DVEPLLGFLSPKSGQENEVDDFPYKGQGEL 序列編號:70
MALWMQCLPLVLVLFFSTPNTEALVNQHLCGSHLVEALYLVCGDRGFFYYPKVKRDM
EQALVSGPQDNELDGMQLQPQEYQKMKRGIVEQCCHSTCSLFQLESYCN 序列編號:71
MALWMQCLPLVLVLLFSTPNTEALANQHLCGSHLVEALYLVCGDRGFFYYPKIKRDI
EQAQVNGPQDNELDGMQFQPQEYQKMKRGIVEQCCHSTCSLFQLENYCN
序列編號:72 GIVEQCCHNTCSLYQLENYCN 序列編號:73
GIVEQCCHNTCSLYQLENYCN 序列編號:74
GIVEQCCENTCSLYELENYCN 序列編號:75
GIVEQCCENTCSLYQLENYCN 序列編號:76
MGLWIRLLPLIALLILWGPDPAAAEFRMFVNQHLCGSHLVEALYLVCGERGFFYTPK
TRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN 序列編號:77
GIVEQCCTSICSLYQLENYCN ΙΙΗΙΙΙ 第83頁 I3453BT^ 五、發明說明(78) 序列編號:79 FVNOHLCGSHLVEALYLVCC-ERGFFYTPK: 序列編號:79
FVDQHLCGSHLVEALYLVCGSRGFFYTPKAAKGIVEQCCTSICSLYELEDYCN 序列編號:80
FVEQHLCGSDLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLEEYCN 序列編號:81
FVQQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLENYCG 序列編號:82
FVTQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLEHYCS 序列編號:83
NSNGKFVNQHLCGSHLVEALYLVCGERGFFYTPKTKGIVEQCCTSICSLYQLENYCN 序列編號:84
NSNGKFVNQHLCGSHLVEALYLVCGERGFE'YTPKTKRGIVEQCCTSICSLYQLENYC
N 序列編號:85
FVNQHLCGSHLVEALYLVCGERGFFYTPKGIVEQCCTSICSLYQLENYCN 序列編號:86
RFVNQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLENYCN 序列編號:87
KETLTITCAVPTWLKLWTWFAVKEVSSTNLRLLRVLSNNAVPPSAPCTNWKTTATRR
SPQA 序列編號:88
KDSLTNTCAVSTWLKLCTWFAVKEVSSTLLRLLRVLSNNAVPPSANYTNWKTTATRR
SPQA 序列編號:89
MFVNQHLCGSHLVEALYLVCGERGFFYTPKTxRREAEDLQVGQVELGGGPGAGSLQPL
ALEGSLQKRGIVEQCCTSICSLYQLENYCN 序列編號:90
RREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKR 序列編號:91
GPETLCGAELVDALQFVCGDRGF
第84頁 m5S87^ 五、發明說明(79) 序列編號:91
MKLKTVRSAVLSSLFASQVLGQPIDDTESQTTSVNLMADDTESAFATQTNSGGLDVV
GLISMAKREEGEPKFVNQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSIC
SLYQLENYCN 序列編號:93 tttgtcaatcagcacctttgtggttctcecctggtggaggctctgtacctggtgtgt qgggaacgtggtttcttctacacacccaagacccgtcgtaagcttaagcgtggcatt gtggagcagtgctgcaccagcatctgctccctctaccaactggagaactactgcaac 序列編號:94
GIVEQCCTSICSLYQLENYCN 序列編號:95
FVNQHLCGSHLVEALYLVCGERGFFX 序列編號:96
GIVEQCCTSICSLYQLENYCN 序列編··號:97
EVNQHLCGSELVEALELVCGERGFFYEPK 序列編號:98
GIVEQCCTSICSLYQLENYCN 序列編號:99
FVNQHLCGSHLVEALHLVCGERGFFYTPKT 序列編號:100
GIVEQCCKSICSLYQLENYCN 序列編號:101
FVNQHLCGSHLVEALYLVCGERGFFYTPKT 序列編號:1〇2
GIVEQCCKSICSLYQLENYCN 序列編號:103
FVNQHLCGSHLVEALYLVCGERGFFYTPKT 序列編號:104
GIVEQCCXSICSLYQLENYCN 序列編號:1〇5
FVNQHLCGSHLVEALYLVCGERGFFYTPKT 序列編號:1〇6 mm 第85頁 «. jc^si=:1345587 五、發明說明(80)
GIVEQCCXSICSLYQLENYCK 序列編號:107
r'/NQHLCGSHLVEALYLVCG£RGFFYTPKT 序列編號:108
GXVEQCCTSICSLYQLENYCN 序列編號:1〇9
FVNQHLCGSDLVEALYLVCGERGFFYTKPT .序列編號:110
GAVEQCCTSICSLYQLENYCN 序列編號:111
FVNQHLCGSDLVEALYLVCGERGFFYTKPT 序列編號:112
GXVEQCCTSICSLYQLENYCN 序列編號:113
FVNQHLCGSHLVEALYLVCGERGFFYTPKT 序列編號:114
GXVEQCCTSICSLYQLENYCN 序列編號:115
FVNQHLCGSHLVEALYLVCGERGFFYTPKT 序列編號:116
GGGEQCCTSICSLYQLENYCN 序列編號_:117
FVNQHLCGSDLVEALYLVCGERGFFYTKPT 序列編號:118
XIVEQCCTSICSLYQLENYCN 序列編號:119
XVNQHLCGDHLVEALYLVCGERGFFYTPKT 序列編號:120
GIVEQCCTSICSLYQLENYCN 序列編號.:121
FVNQHLCGSHLVEALYLVCGERGFYTPKT
第86頁 五、發明說明(81) 序列編號:122 GIVEQSCTSISSLYOLENYCI: 序列編號:123
FVNQHLCGSDLVEALYLVCGERGFFYTKPT 序列編號:124
MDPGDPECLEQLLRRLGGSVEV£VTGGTVHVEVSPEDPGDPECLEQLLRRLGGSVEV
EVTGGTVHVEVSPGERGFFYCN 序列編號:125
MLKEKKYSPDPGDPECLEQLLRRLGGSVEVEVTGGTVHVEVSPEDPGDPECLEQLLR
RLGGSVEVEVTGGTVHVEVSPGERGFFYCN 序列編號:126
MATSXSTKKTQLQLEHLXLDLQM 序列編號:127
TMITDSLAVVLQRXDWXPGVTQL 序列編號:128
NSVLASALALTVAPMAFANSDSESPLSHDGYSLHDGVSMYIEALDKFVNQHLCGSHL
VEALYLVCGERGFFYTPKGIVEQCCTSICSLYQLENYCN 序列編號:129
DTTMPAGGGGGGQHLCGPHLVEALY 序列編號:130
LENYCN 序列編號:131
MTMITDSLEFQAWGGGGGWMRF 序列編號:132
MVLRFLPLLALLVLWEPKPAQA 序列編號^:133
FVNQHLCGSHLVEALYLVCGERGFFYTPKTRRYPGDVKRGIVEQCCTSICSLYQLEN
YCN 序列編號:134 *
GIVEQCCKSICSLYQLENYCN 序列編號:135
FVNQHLCGSHLVEALYLVCGERGFFYTPKT 序列編號:136
IHHI 第87頁 fM5587" 五、發明說明(82)
GIVEQCCKSICSLYQLENYCN 序列編號:137
7VNQHLCGSHLVEALYLVCGERGFFYTPKT 序列編號:138
LVEALYLVCGERGG 序列編號:139
GIVEQCCXSICSLYQLENYCN 序列編號:140
FVNQHLCGSHLVEALYLVCGERGFFYTPKT 序列編號:141
GIVEQCCXSICSLYQLENYCN 序列編號:142
FVNQHLCGSHLVEALYLVCGERGFFYTPKT 序列編號:143
GIVEQCCTSICSLYQLENYCN 序列編號:144
FVNQHLCGSDLVEALYLVCGERGFFYTDK 序列編號:145
FVNQHLCGSDLVEALYLVCGERGFFYTDKGIVEQCCTSICSLYQLENYCN 序列編號:146
AAK 序列編號:147
NKR 序列編號:148
RRKQKR
序列編號:149
RRKR 序列編號:150
KDEL 序列編號:151
HDEL 序列編號:152
第88頁 I3455S7 五、發明說明(83)
DDCL 序列編號:153
ADEL 序列編號:154
SDEL 序列編號:155
HDEF 序列編號:156
Met Ala Asp Thr Ala Arg Gly Thr His His Asp lie lie Gly Arg Asp 1 5 10 15 Gin Tyr Pro Met Met Gly Arg Asp Arg Asp Gin Tyr Gin Met Ser Gly 20 25 30 Arg Gly Ser Asp Tyr Ser Lys Ser Arg Gin lie Ala Lys Ala Ala Thr 35 40 45 Ala Val Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Ser Leu Thr Leu 50 55 60 Val Gly Thr Val lie Ala Leu Thr Val Ala Thr Pro Leu Leu Val He 65 70 75 80 Phe Ser Pro lie Leu Val Pro Ala Leu He Thr Val Ala Leu Leu lie 85 90 95 Thr Gly Phe Leu Ser Ser Gly Gly Phe Gly lie Ala Ala lie Thr val 100 105 110 Phe Ser Trp lie Tyr Lys 115 序列編號 :157 Met Ala Asp Thr Ala Arg Thr His His Asp Val Thr Ser Arg Asp Gin 1 5 10 15 Tyr Pro Arg Asp Arg Asp Gin Tyr Ser Met He Gly Arg Asp Arg Asp 20 25 30 Gin Tyr Ser Met Met Gly Arg Asp Arg Asp Gin Tyr Asn Met Tyr Gly 35 40 45 Arg Asp Tyr Ser Lys Ser hcq Gin lie Ala Lys Ala val Thr Ala Val 50 55 60 ΙΙΗϋΙΙ 第89頁 五、發明說明(84)
Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Ser Leu Thr Leu Val Gly
65 70 75 8C
Thr Val lie Ala Leu Thr Val Ala Thr Pro Leu Leu Val lie Phe Ser 35 90 95
Pro lie Leu Val Pro Ala Leu lie Thr Val Ala Leu Leu lie Thr Gly 100 105 110
Phe Leu Ser Ser Gly Gly Phe Ala lie Ala Ala lie Thr val Phe Ser 115 120 125
Trp lie Tyr Lys Tyr Ala Thr Gly Glu His Pro Gin Gly Ser Asp Lys 130 135 140
Leu Asp Ser Ala Arg Met Lys Leu Gly Thr Lys Ala Gin Asp lie Lys 145 150 155 160
Asp Axq Ala Gin Tyr Tyr Gly Gin Gin His Thr Gly GXy Glu His Asp " 165 170 175
Arg Asp Arg Thr Arg Gly GXy Gin His Thr Thr 180 185 序列編號:158 taccatgggg tcaaagacgg agatgatgga gagagacgca atggctacgg tggctcccta 60 tgcgccggtc acttaccatc gccgtgctcg tgttgacttg gatgatagac ttcctaaacc 120 ttatatgcca agagcattgc aagcaccaga cagagaacac ccgtacggaa ctccaggcca 180 taagaattac ggacttagtg ttcttcaaca gcatgtctcc ttcttcgata tcgatgataa 240 tggcatcatt tacccttggg agacctactc tggactgcga atgcttggtt tcaatatcat 300 tgggtcgctt ataatagccg ctgttatcaa cctgaccctt agctatgcca ctcttccggg 360 gtggttacct tcacctttct tccctatata catacacaac atacacaagt caaagcatgg 420 aagtgattca aaaacatatg acaatgaagg aaggtttatg ccggtgaatc ttgagttgat 480 atttagcaaa tatgcgaaaa ccttgccaga caagttgagt cttggagaac tatgggagat 540 gacagaagga aaccgtgacg cttgggacat ttttggatgg atcgcaggca aaatagagtg 600 gggactgttg tacttgctag caagggatga agaagggttt ttgtcaaaag aagctattag 660 gcggtgtttc gatggaagct tgttcgagta ctgtgccaaa atctacgctg gtatcagtga 720 agacaagaca gcatactacg ccatggat 748 序列編號:159
第90頁
五、發明說明(85) atogggtcaa agacggagat gatggagaga gacgcaatgg ctacggtggc tccctatgcg 60 ccggtcactt accaccgccg rgctcgtgtt gacttggatg atagacttcc taaaccttat 120
atgccaagag cattgcaagc accagacaga gaacacccgt acggaactcc aggccataag 18C aattacggac ttagtgttct tcaacagcat gtctccttct tcgatatcga tgataatggc 240 atcatttacc cttgggagac ctactctgga ctgcgaatgc ttggtttcaa tatcattggg 300 tcgcttataa tagccgctgt tatcaacctg acccttagct atgccactct tccggggtgg 360 ttaccttcac ctttcttccc tatatacata cacaacatac acaagtcaaa gcatggaagt 420 gattcaaaaa catatgacaa tgaaggaagg tttatgccgg tgaatcttga gttgatattt 480 agcaaatatg cgaaaacctt gccagacaag ttgagtcttg gagaactatg ggagatgaca 540 gaaggaaacc gtgacgcttg ggacattttt ggatggatcg caggcaaaat agagtgggga 600 ctgttgtact tgctagcaag ggatgaagaa gggtttttgt caaaagaagc tattaggcgg 660 tgtttcgatg gaagcttgtt cgagtactgt gccaaaatct acgctggtat cagtgaagac 720 aagacagcat actactaa 738
序列編號:160
ATGGATCTAATCCACACTTTCCTCAACTTAATAGCTCCCCCTTTCACCTTCTTCTTC
CTTCTCTTTTTCTTGCCACCCTTCCAGATTTTCAAGTTCTTCCTTTCAATCTTGGGC
ACCCTTTTCAGCGAGGATGTCGCTGGAAAAGTCGTCGTCATCACCGGCGCCTCCTCC
GGCATCGGCGAAAGTCTTGCTTACGAGTATGCTAAGAGAGGGGCGTGCTTGGTGCTT
GCTGCAAGAAGGGAAAGGAGTCTTCAAGAAGTGGCCGAAAGGGCGCGCGATTTGGGG
TCGCCGGACGTCGTGGTGGTCCGGGCCGATGTTTCGAAGGCGGAGGACTGCAGGAAG
GTTGTTGATCAGACTATGAATCGCTTTGGAAGATTGGATCACCTGGTCAATAACGCT
GGAATTATGTCAGTTTCAATGCTGGAAGAAGTTGAAGATATTACTGGTTACAGAGAA
ACTATGGATATCAACTTCTGGGGCTATGTGTATATGACCCGATTTGCCGCCCCATAC
CTTAGGAATAGCAGAGGCCGAATTGTTGTACTTTCTTCATCCAGTTCTTGGATGCCT
ACTCCGAGGATGAGTTTTTACAATGCAAGCAAAGCGGCGATTTCACAATTTTTTGAG
ACACTGCGGGTGGAATTCGGCCCCGATATAGGCATAACCCTTGTGACTCCAGGATTC
ATAGAATCTGAACTTACCCAAGGCAAATTCTACAATGCTGGCGAACGTGTAATTGAT
CAGGACATGAGAGATGTACAAGTGAGCACGACTCCAATCCTGAGGGTGGAAAGTGCG
GCAAGGTCAATCGTGAGGAGCGCGATCCGTGGAGAAAGATACGTGACAGAGCCGGCC
TGGTTTAGGGTTACTTATTGGTGGAAGCTATTCTGCCCTGAGGTGATGGAGTGGGTA
TTTAGACTGATGTACTTGGCCAGCCCGGGTGAGCCGGAGAAGGAAACGTTTGGCAAG
AAGGTTTTGGATTACACAGGAGTGAAGTCCTTGCTTTACCCGGAAACCGTGCAAGTT
CCGGAGCCCAAGAATGATTAA 序列編號:161
MNFLKSFPFYAFLCFGQYFVAVTHA 序列編號:162
APVNTTEDETAQAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFIBTTIASIAAKEEG
VSLMAKR limi 第91頁 13435^7 五、發明說明(86) 序列編號:163 apvnttedetaqaeavigysdlegdfdvavlpfsnstnngllfibttiasiaakeec-
VSMAKR 序列編號:164
QPIDEDNDTSSMAKR 序列編號
QPIDDTESNTTSVNLMADDTEDRFATNTTLALDVVNLISMAKR 序列編號:166
QPIDDTESQTTSVNLMADDTEDRFATQTTLALDVVNLISMAKR 序列編號:167
QPIDDTESQTTSVNLMADDTEDRFATQTTLALDWNLISMAAA 序列編號:168
QPIDDTESNTTSVNLMADDTEDRFATNTTLALDVVNLISMAAA 序列編號:169
QPIDDTESNTTSVNLMADDTEDRFATNTTLAGGLDVVNLISMAKR 序列編號:170
QPIDDTESQTTSVNLMADDTESAFATQTNSGGLDWGLISMAKR 序列編號:171
QPIDDTESQTTSVNLMADDTESAFATQTNSGGLDWGLISMAAA 序列編號:172
EEAEAEAEPK 序列編號:173
EEGEPK 序列編號:174
MAEITRIPLYKGKSLRKALKEHGLLEDFLQKQQYGISSKF 序列編號:175
GCATGCTGACATTGTGATGACACAGTC 序列編號:176
AAGCTTGCATTTAAATACTCGAGACTGTGAGAGTGGTGCCTTG 序列編號:177
GAAGAAGGAGAGCCTAAGTTTGTTAATCAACATCTTTGTGGATCTCATCTTGTTGAG
GCTCTCTACCTTG
第92頁 1345587 五、發明說明(87) 序列編號:178 CCTTAGGAGTGTAGAAAAATCCTCTTTCTCCACACACAAGGTAGAGAGCCTCAAC.-. 序列編號:179
CTAAGGCTGCTAAGGGAATTG 序列編號:180
AAGCTTCAGTTGCAATAGTTCTCCAATTGGTAAAGTGAGCAAATAGAAGTGCAACAT
TGTTCAACAATTCCCTTAGCAGCCTT 序列編號:181
CTCGAGTCAACCAATTGATGACACTGAATC 序列編號:182
AAGCTTCAAAGTTCATCCTTGTTGCAATAGTTCTCCAATTG 序列編號:183
AAGCTTCAGTTGCAATAGTTC 序列編號:184
GCATGCCCAACCAATTGATGACACTG 序列編號:185
GCATGCATGCCTTTGTTAATCAACATCTTTGTGG 序列編號:186
ACATTGTTCAACAATTCCTCTCTTTCTTCTAGTCTTAGGAGTGTAGAAAAATCC 序列編號:187
GCATAAGCTTCAAAGCTCATCCTTTGAGC 序列編號188
ATGAACTTCCTTAAGTCTTl'CCCTTTCTACGCTTTCCTTTGITTCGGTCAATACTTCGTTGCT
GTTACGCATGCCCAACCAATTGATGACACTGAATCCCAGACCACGTCAGTGAACCTCATG
GCCGATGATACTGAGAGCGCGTTTGCTACACAAACAAATTCGGGAGGTCTTGACGTTGTC
GGATrGATCTCCATGGCTAAGAGAGAAGAAGGAGAGCCTAAGTTTGTrAATCAACATCTT
TGTGGATCTCATCTTGTTGAGGCrCTCrACCTTGTGTGTGGAGAAAGAGGATl-nTCTACA
CTCCTAAGGCTGCTAAGGGAATTGTTGAACAATGTrGCACrTCrATTTGCTCACTTTACCA
ATTGGAGAACTATTGCAACrGA 序列編號]89
MNFLKSFPFYAFLCFGQYFVAVTHAQPIDDTESQTTSVNLMADDTESAFATQTNSGGLDVVGL
ISMAKREEGEPKFVNQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLENY
CN 序列編號190
TTCGTGAACCAACACTTG
第93頁 五、發明說明(88) 序列編號191 AAGCTITCAGTTACAGTAGT 序列編號192 GCATGCATGTGTTGAGC 序列編號193 GGTAGTGTGCTGGCCA 序列編號194 GGTGGCCAGCACACTACC1TCGTGAACCAACACTTGTG 序列編號195
ATGGCGGATACAGCTAGAGGAACCCATCACGATATCATCGGCAGAGACCAGTACCCGATG
ATGGGCCGAGACCGAGACCAGTACCAGATGTCCGGACGAGGATCrGACTACTCCAAGTCT
AGGCAGATTGCTAAAGCTGCAACTGCTGTCACAGCTGGTGGTTCCCrCCrTGTTCrcrCCA
GCCnTACCCTTGTTGGAACrGTCATAGCTTTGACTGTTGCAACACCTCTGCTCGTrATCTrC
AGCCCAATCCTTGTCCCGGCrCTCATCACAGTTGCACTCCTCATCACCGGTTTTCTTTCCTC
TGGAGGGTTTGGCATrGCCGCTATAACCGTTTTCTCTTGGATTTACAAGTAAGCACACATT
TATCATCTTACTTCATAATnTGTGCAATATGTGCATGCATGTGTTGAGCCAGTAGCTTTGG
ATCAATTTTTTTGGTAGAATAACAAATGTAACAATAAGAAATrGCAAATTCTAGGGAACA TTTGGTTAACrAAATACGAAATTTGACCTAGCTAGCTTGAATGTGTCTGTGTATATCATCr
ATATAGGTAAAATGCTTGGTATGATACCTAfTGATTGTGAATAGGTACGCAACGGGAGAG
CACCCACAGGGATCAGACAAGTTGGACAGTGCAAGGATGAAGTTGGGAAGCAAAGCTCA
GGATCTGAAAGACAGAGCrCAGTACTACGGACAGCAACATACTGGTGGGGAACATGACC
GTGACCGTACTCGTGGTGGCCAGCACACTACCTTCGTGAACCAACACTTGTGTGGATCTCA
TCTCGTTGAAGCTCTCrACTTGGTTTGTGGTGAGAGAGGATTCTTCrACACrCCTAAGACC agaagggaagctgaggacttgcaggtgggacaagttgagttgggtggaggtcctggagc
AGGATCTTTGCAACCTCl'CGCTTTGGAAGGTTCTTTGCAGAAGAGAGGAATCGTTGAACA
ATGnOCACTTCAATCTGTTCTITGTATCAGTTGGAGAACTACTGTAACTGA 序列編號】96
MADTARGTHHDIIGRDQYPMMGRDRDQYQMSGRGSDYSKSRQIAKAATAVTAGGSLLVLSS
LTLVGTV1ALTVATPLLVIFSPILVPALITVALLITGFLSSGGFGIAAITVFSW1YATGEHPQGSDK
LDSARMKLGSKAQDLKDRAQYYGQQHTGGEHDRDRTRGGQHITWNQHLCGSHLVEALYL
VCGERGFFYTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSiCSLYQ
LENYCN
第94頁 1345587 圓式簡單說明 , 第1圖表示PSBS4404的胰島素融合蛋白(PRS-D9scFv- K1 ip27-MI-KDEL)之核苷酸序列(序列編號1)和推衍之胺基
酸序列(序列編號2) β預期胺基酸序列如單字碼所示。PRS 單肽之推衍胺基酸序列用斜體字,而D9scFv的推衍胺基酸 序列用黑體字。KLIP27序列的推衍胺基酸序列劃線,微型 胰島素序列之推衍胺基酸序列用斜體字’最後KDEL序列用 黑體又劃線。
第2圊表示PSBS4405的胰島素融合蛋白質(0LE0-KLIP8 -KLIP27-MI )之核苷酸序列(序列編號3)和推衍之胺基酸序 列(序列編號4 )。預期胺基酸序列如單字碼所示。阿拉伯 芥18kDa油質蛋白的推衍胺基酸系列用斜體字,KLIP8枣列 的推衍胺基酸序列用黑體,KLIP2 7序列之推衍胺基酸序列 劃線,而微型胰島素的推衍胺基酸序列用斜體和黑體。 第3圊表示4414胰島素融合蛋白(PRS-MI-四鹼基接頭-D9Scfv-KDEL)的完整核酸序列(序列編號5)和胺基酸序列 (序列編號6)。預期胺基酸序列以單字碼所示,PRS單肽的 推衍胺基酸序列用斜體,微型胰島素(B30四鹼基)之推衍 胺基酸序列用黑體,四鹼基接頭序列的推衍胺基酸序列劃 線,D9Scfv的推衍胺基酸序列用斜體和黑體,最後KDEL序 列用黑體和劃線。
第4A-4D圖表示胰島素融合蛋白根據考馬斯染色sdS-PAGE和蛋白質印跡分析,在轉型阿拉伯芥線(4404-2,-17, -20和4405-4)之重組表達。箭頭分別指在還原條件了,移 動 38.5 kDa 和 34.2 kDa融合多肽、PRS-D9(scfv)-KLIP27-
第95頁 1345587
圓式簡單說明 MIw/KDEL 和 0LE0-KLIP8-KLIP27-MI 的位置。第4A 圖(考馬 斯染色凝膠)和第4B圖(相當於以抗胰島素E 2 E3探測之蛋白 質印跡),表示來自野生型(wt)的總種籽蛋白質,以及表 達44 04和44 05構造物的轉基因種籽線。第4C囷(考馬斯染 色凝膠)和第4D圓(相當於以抗胰島素E2E3探測的蛋白質印 跡)’表示由野生型製備之油體蛋白質,以及表達同樣 4404和4405構造物之轉基因種籽。第4£圈和第4F圈表示联 島素根據考馬斯染色SDS-PAGE和蛋白質印跡分析,在轉型 阿拉伯芬線(4419-9和4414-20)之重組表達。分子量標諸 (M)為 1〇,1 5,25,37,50,75,100,150 1^3,對照組包含111^| (重組人體騰島素標準)和hProIN(重組人體膜島素原標準) ’在非還原條件下分開。 第5囷表示在可得T3種籽線(440 4-2,-17,-2 0, 4405-4, -13,-19)和T2種籽線(4414-9和-20)的測定表達水準。轉 基因水準和%莫耳MI表達,根據光密度測法測定。 第6圓表示考馬斯染色SDS-PAGEC15% )分析洗脫前之 油趙預製物(-0B)、用曱酸洗脫後之〇B預製物(-〇B,),以 及淡縮的洗脫材料(-E)。箭頭指移動融合多狀之位置。野 生型控制基本上在洗脫後免於任何主要蛋白質,而漢縮 4404材料含有融合蛋白,某些截短生成物(可能水解之融 合蛋白)’以及可能有共同洗脫之若干清蛋白。 第7圓表示層析圊譜’顯示人體胰島素標準的特性住 留時間,與在C18管柱上胰蛋白酵素裂解洗脫4404融合蛋 白°hIN標準係重組人趙膜島素標準(〇5#g)。
1345587 圊式簡單說明 第8圊表示人體胰島素栌 -17. 5分鐘所集騰島素蛋白(A)的質”曰分析,與從Η. 〇 部比較。 龙曰酵素裂解和HPLC純化4404(b)分 第9圏表示總萃取性種缸疋丄# mm «据i 籽蛋白質和從4405表達線的油 H 質考馬斯染色sds-page(15%)分析,與 « 1 Π ^ 箭頭指移動融合多肽之位置。 第10圓表不層析圊譜,顧 , L^t 顯不人體肤島素標準的特性住 留時間,與C18管柱上利用Rp_HpLC的胰蛋白酵素裂 〇5 0B製劑比較。h_IN標準係重組人體胰島素標準(〇 5私g) ^ 第11囷表示人體胰島素標準(A)的質譜分析,與從 17.0-17.5分鐘收集的胰蛋白酵素裂解和HpLC純化44〇 分部之比較。 第12囷表示胰蛋白酵素裂解44〇5油體製劑(虛線)的 析囫譜,與人體胰島素標準(實線)比較。在7_35 mS/cn^^ 收集洗脫裂解胰島素分部’並利用冷凍乾燥濃縮,以 島素生物檢定。 ' 第13圊表示B6雄鼠在注射負對照(空白圓形=生理食塩 水安慰劑,實心圓形=胰蛋白酵素裂解的野生型油體),正 對照(空白方形=Humulin R,空白三角形=Roche hIN)後之 血漿葡萄糖水準變化,與從4405油體(實心菱形=SBS hIN DesB3())製成的植物衍生胰島素比較。 第14圓表示從二代表線(4409-6和4409-8)的油體蛋白 質之考馬斯染色凝膠’比較油質蛋白-hPINs合蛋白(黑色 箭頭所示)與非轉型(wt)阿拉伯芥之移動。表達水準是由 第97頁 1345587
第98頁
1/100 序列一覽表 <110> SemBioSys Genetics Inc.
Moloney, Maurice M.
Boothe, Joseph Keon, Richard Nykiforuk, Cory Van Rooijen, Gijs <120> 胰島素在植物內之生產方法 <130> 9369-299 <150> 60/478,818 <151> 2003-06-17 <150> 60/549,539 <151> 2004-03-04 <160> 196 <170> Patentln version 3.1 . <210> 1 <211> 1143
<212> DNA <213> Artificial Sequence <220> <223> Insulin fusion protein nucleic acid sequence 1345587 2/100 <400> 1 atgaacttcc ttaagtcttt ccctttctac gctttccttt gtttcggtca atacttcgtt 60 gctgttacgc atgctgacat tgtgatgaca cagtctccat cctccctggc tatgtcagtg 120 ggacagcggg tcactatgcg ctgcaagtcc agtcagagcc ttttaaaaag taccaatcaa 180 aagaactatt tggcctggta ccagcagaaa ccaggacagt ctcctaaact tctggtatac 240 tttgcatcca ctagggaatc tggggtccct gatcgcttca taggcagtgg atctgggaca 300 gatttcactc ttaccatcag cagtgtgcag gctgaagacc tggcagatta cttctgtcag 360 caacattata acactcctcc cacgttcggt gctgggacca agctggagct taagcggtct 420 ccgaacggtg cttctcatag cggttctgca ccaggcacta gctctgcatc tggatctcag 480 gtgcacctgc agcagtctgg agctgagctg atgaagcctg gggcctcaat gaagatatcc 540 tgcaaggcta ctggctacac attcagtagc tactggatag agtgggtaaa gcagaggcct 600 ggacatggcc ttgagtggat tggagagatt ttacctggca gtggtagtac tacctacaat 660 gagaagttca agggcaaggc cacattcact gcagatacat cctccaacac agcctacatg 720 caactcagca gcctgacatc tgaggactct gccgtctatt actgtgcaag attggatgtt 780 gactcctggg gccaaggcac cactctcaca gtctcgagtc aaccaattga tgacactgaa 840 tcccagacca cgtcagtgaa cctcatggcc gatgatactg agagcgcgtt tgctacacaa 900 acaaattcgg gaggtcttga cgttgtcgga ttgatctcca tggctaagag agaagaagga 960 gagcctaagt ttgttaatca acatctttgt ggatctcatc ttgttgaggc tctetacctt 1020 gtgtgtggag aaagaggatt tttctacact cctaaggctg ctaagggaat tgttgaacaa 1080 tgttgcactt ctatttgctc actttaccaa ttggagaact attgcaacaa ggatgaactt 1140 tga 1143 <210> 2 <211> 380
<212> PRT <213> Artificial Sequence <220> <223> Insulin fusion protein 2 <400> 3/100
Met Asn Phe Leu Lys Ser Phe Pro Phe Tyr Ala Phe Leu Cys Phe Gly 15 10 15
Gin Tyr Phe Val Ala Val Thr His Ala Asp lie Val Met Thr Gin Ser 20 25 30
Pro Ser Ser Leu Ala Met Ser Val Gly Gin Arg Val Thr Met Arg Cys 35 40 45
Lys Ser Ser Gin Ser Leu Leu Lys Ser Thr Asn Gin Lys Asn Tyr Leu 50 55 60
Ala Trp Tyr Gin Gin Lys Pro Gly Gin Ser Pro Lys Leu Leu Val Tyr 65 70 75 80
Phe Ala Ser Thr Arg Glu Ser Gly Val Pro Asp Arg Phe lie Gly Ser 85 90 95
Gly Ser Gly Thr Asp Phe Thr Leu Thr lie Ser Ser Val Gin Ala Glu 100 105 110
Asp Leu Ala Asp Tyr Phe Cys Gin Gin His Tyr Asn Thr Pro Pro Thr 115 120 125
Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys Arg Ser Pro Asn Gly Ala 130 135 140
Ser His Ser Gly Ser Ala Pro Gly Thr Ser Ser Ala Ser Gly Ser Gin 145 150 155 160
Val His Leu Gin Gin Ser Gly Ala Glu Leu Met Lys Pro Gly Ala Ser 165 170 175
Met Lys lie Ser Cys Lys Ala Thr Gly Tyr Thr Phe Ser Ser Tyr Trp 180 185 190 lie Glu Trp Val Lys Gin Arg Pro Gly His Gly Leu Glu Trp lie Gly 195 200 205
Glu lie Leu Pro Gly Ser Gly Ser Thr Thr Tyr Asn Glu Lys Phe Lys 210 215 220
Gly Lys Ala Thr Phe Thr Ala Asp Thr Ser Ser Asn Thr Ala Tyr Met 225 230 235 240 1345587 4/100
Gin Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys Ala 245 250 255
Arg Leu Asp Val Asp Ser Trp Gly Gin Gly Thr Thr Leu Thr Val Ser 260 265 270
Ser Gin Pro lie Asp Asp Thr Glu Ser Gin Thr Thr Ser Val Asn Leu 275 280 285
Met Ala Asp Asp Thr Glu Ser Ala Phe Ala Thr Gin Thr Asn Ser Gly 290 295 300
Gly Leu Asp Val Val Gly Leu lie Ser Met Ala Lys Arg Glu Glu Gly 305 310 315 320
Glu Pro Lys Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu 325 330 335
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys 340 345 350
Ala Ala Lys Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu 355 360 365
Tyr Gin Leu Glu Asn Tyr Cys Asn Lys Asp Glu Leu • 370 375 380 <2X0> 3 <211> 945 <212> DNA <213> Artificial Sequence
<220> <223> insulin fusion protein nucleic acid sequence <400> 3 atggcggata cagctagagg aacccatcac gatatcatcg gcagagacca gtacccgatg 60 atgggccgag accgagacca gtaccagatg tccggacgag gatctgacta ctccaagtct 120 aggcagattg ctaaagctgc aactgctgtc acagctggtg gttccctcct tgttctctcc 180 agccttaccc ttgttggaac tgtcatagct ttgactgttg caacacctct gctcgttatc 240 1345587 5/100 ttcagcccaa tccttgtccc ggctctcatc acagttgcac tcctcatcac cggttttctt 300 tcctctggag ggtttggcat tgccgctata accgttttct cttggattta cgcaacggga 360 gagcacccac agggatcaga caagttggac agtgcaagga tgaagttggg aagcaaagct 420 caggatctga aagacagagc tcagtactac ggacagcaac atactggtgg ggaacatgac 480 cgtgaccgta ctcgtggtgg ccagcacact accatggctg agatcacccg cattcctctc 540 tacaaaggta agtctctccg taaggcgctg aaggaacatg gacttctaga agacttcttg 600 cagaaacaac agtatggcat ctcgagcaag ttccaaccaa ttgatgacac tgaatcccag 660 accacgtcag tgaacctcat ggccgatgat actgagagcg cgtttgctac acaaacaaat 720 tcgggaggtc ttgacgttgt cggattgatc tccatggcta agagagaaga aggagagcct 780 aagtttgtta atcaacatct ttgtggatct catcttgttg aggctctcta ccttgtgtgt 840 ggagaaagag gatttttcta cactcctaag gctgctaagg gaattgttga acaatgttgc 900 acttctattt gctcacttta ccaattggag aactattgca actga 945 <210> 4 <211> 314
<212> PRT <213> Artificial Sequence <220> <223> Insulin fusion protein <400> 4
Met Ala Asp Thr Ala Arg Gly Thr His His Asp lie lie Gly Arg Asp 15 10 15
Gin Tyr Pro Met Met Gly Arg Asp Arg Asp Gin Tyr Gin Met Ser Gly 20 25 30
Arg Gly Ser Asp Tyr Ser Lys Ser Arg Gin lie Ala Lys Ala Ala Thr 35 40 45
Ala Val Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Ser Leu Thr Leu 50 55 60
Val Gly Thr Val lie Ala Leu Thr Val Ala Thr Pro Leu Leu Val lie 1345587 6/100 65 70 75 80
Phe Ser Pro He Leu Val Pro Ala Leu lie Thr Val Ala Leu Leu lie 85 90 95
Thr Gly Phe Leu Ser Ser Gly Gly Phe Gly lie Ala Ala lie Thr Val 100 105 110
Phe Ser Trp lie Tyr Ala Thr Gly Glu His Pro Gin Gly Ser Asp Lys 115 120 125
Leu Asp Ser Ala Arg Met Lys Leu Gly Ser Lys Ala Gin Asp Leu Lys 130 135 140
Asp Arg Ala Gin Tyr Tyr Gly Gin Gin His Thr Gly Gly Glu His Asp 145 150 155 160
Arg Asp Arg Thr Arg Gly Gly Gin His Thr Thr Met Ala Glu lie Thr 165 170 175
Arg lie Pro Leu Tyr Lys Gly Lys Ser Leu Arg Lys Ala Leu Lys Glu 180 185 190
His Gly Leu Leu Glu Asp Phe Leu Gin Lys Gin Gin Tyr Gly lie Ser 195 200 205
Ser Lys Phe Gin Pro lie Asp Asp Thr Glu Ser Gin Thr Thr Ser Val 210 215 220
Asn Leu Met Ala Asp Asp Thr Glu Ser Ala Phe Ala Thr Gin Thr Asn 225 230 235 240
Ser Gly Gly Leu Asp Val Val Gly Leu lie Ser Met Ala Lys Arg Glu 245 250 255
Glu Gly Glu Pro Lys Phe Val Asn Gin His Leu Cys Gly Ser His Leu 260 265 270
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr 275 280 285
Pro Lys Ala Ala Lys Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys 290 295 300 ι 7/100
Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 305 310 <210> 5 <211> 1011 <212> DNA <213> Artificial Sequence <220> <223> Insulin fusion protein nucleic acid sequence <400> 5 atgaacttcc ttaagtcttt ccctttctac gctttccttt gtttcggtca atacttcgtt 60 gctgttacgc atgcctttgt taatcaacat ctttgtggat ctcatcttgt tgaggctctc 120 taccttgtgt gtggagaaag aggatttttc tacactccta agactagaag aaagagagga 180 attgttgaac aatgttgcac ttctatttgc tcactttacc aattggagaa ctattgcaac 240 agaagaaaga gagacattgt gatgacacag tctccatcct ccctggctat gtcagtggga 300 cagcgggtca ctatgcgctg caagtccagt cagagccttt taaaaagtac caatcaaaag 360 aactatttgg cctggtacca gcagaaacca ggacagtctc ctaaacttct ggtatacttt 420 gcatccacta gggaatctgg ggtccctgat cgcttcatag gcagtggatc tgggacagat 480 ttcactctta ccatcagcag tgtgcaggct gaagacctgg cagattactt ctgtcagcaa 540 cattataaca ctcctcccac gttcggtgct gggaccaagt tggagcttaa gcggtctccg 600 aacggtgctt ctcatagcgg ttctgcacca ggcactagct ctgcatctgg atctcaggtg 660 cacctgcagc agtctggagc tgagctgatg aagcctgggg cctcaatgaa gatatcctgc 720 aaggctactg gctacacatt cagtagctac tggatagagt gggtaaagca gaggcctgga 780 catggccttg agtggattgg agagatttta cctggcagtg gtagtactac ctacaatgag 840 aagttcaagg gcaaggccac attcactgca gatacatcct ccaacacagc ctacatgcaa 900 ctcagcagcc tgacatctga ggactctgcc gtctattact gtgcaagatt ggatgttgac 960 tcctggggcc aaggcaccac tctcacagtg agctcaaagg atgagctttg a 1011 <210> 6 <211> 336
<212> PRT 8/100 <213> Artificial Sequence <220> <223> Insulin fusion protein <400> 6
Met Asn Phe Leu Lys Ser Phe Pro Phe Tyr Ala Phe Leu Cys Phe Gly 15 10 15
Gin Tyr Phe Val Ala Val Thr His Ala Phe Val Asn Gin His Leu Cys 20 25 30
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly 35 40 45
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Lys Arg Gly lie Val Glu Gin 50 55 60
Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 65 70 75 80
Arg Arg Lys Arg Asp lie Val Met Thr Gin Ser Pro Ser Ser Leu Ala 85 90 95
Met Ser Val Gly Gin Arg Val Thr Met Arg Cys Lys Ser Ser Gin Ser 100 105 110
Leu Leu Lys Ser Thr Asn Gin Lys Asn Tyr Leu Ala Trp Tyr Gin Gin 115 120 125
Lys Pro Gly Gin Ser Pro Lys Leu Leu Val Tyr Phe Ala Ser Thr Arg 130 135 140
Glu Ser Gly Val Pro Asp Arg Phe He Gly Ser Gly Ser Gly Thr Asp 145 150 155 160
Phe Thr Leu Thr lie Ser Ser Val Gin Ala Glu Asp Leu Ala Asp Tyr 165 170 175
Phe Cys Gin Gin His Tyr Asn Thr Pro Pro Thr Phe Gly Ala Gly Thr 180 185 190 1345587 9/100
Lys Leu Glu Leu Lys Arg Ser Pro Asn Gly Ala Ser His Ser Gly Ser 195 200 205
Ala Pro Gly Thr Ser Ser Ala Ser Gly Ser Gin Val His Leu Gin Gin 210 215 220
Ser Gly Ala Glu Leu Met Lys Pro Gly Ala Ser Met Lys lie Ser Cys 225 230 235 240
Lys Ala Thr Gly Tyr Thr Phe Ser Ser Tyr Trp lie Glu Trp Val Lys 245 250 255
Gin Arg Pro Gly His Gly Leu Glu Trp lie Gly Glu lie Leu Pro Gly 260 265 270
Ser Gly Ser Thr Thr Tyr Asn Glu Lys Phe Lys Gly Lys Ala Thr Phe 275 280 285
Thr Ala Asp Thr Ser Ser Asn Thr Ala Tyr Met Gin Leu Ser Ser Leu 290 295 300
Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys Ala Arg Leu Asp Val Asp 305 310 315 320
Ser Trp Gly Gin Gly Thr Thr Leu Thr Val Ser Ser Lys Asp Glu Leu 325 330 335 <210> 7 <211> 110 <212> PRT <213> Homo sapiens <400> 7
Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 15 10 15
Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gin His Leu Cys Gly 20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45 1345587 t 10/100
Phe Tyr Thr Pro Lys Thr Arg Arg Glu 50 55 Gin Val Glu Leu Gly Gly Gly Pro Gly 65 70 Ala Leu Glu Gly Ser Leu Gin 85 Lys Arg Thr Ser lie Cys Ser Leu Tyr Gin Leu 100 105 <210> 8 <211> 31 <212> PRT <213> Equus przewalskii <400> 8 Glu Ala Glu Asp Pro Gin Val Gly Glu 1 5 Gly Leu ,Gly Gly Leu Gin Pro Leu Ala 20 25 <210> 9 <211> 86 <212> PRT <213> Equus caballus <220> <221> MISC_FEATURE <222> (31)··(32) <223> X = any amino acid 90 10 75 60 95 110 15 30 80
<220> 1345587 11/100 <221> MISC_FEATURE <222> (64) . . (65) <223> X = any amino acid <400> 9
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Xaa Xaa 20 25 30
Glu Ala Glu Asp Pro Gin Val Gly Glu Val Glu Leu Gly Gly Gly Pro 35 40 45
Gly Leu Gly Gly Leu Gin Pro Leu Ala Leu Ala Gly Pro Gin Gin Xaa 50 55 60
Xaa Gly lie Val Glu Gin Cys Cys Thr Gly lie Cys Ser Leu Tyr Gin 65 70 75 80
Leu Glu Asn Tyr Cys Asn <210> 10 85 <211> 110 <212> PRT <213> Oryctolagus cuniculus <400> 10
Met Ala Ser Leu Ala Ala Leu Leu Pro Leu Leu Ala Leu Leu Val Leu 15 10 15
Cys Arg Leu Asp Pro Ala Gin Ala Phe Val Asn Gin His Leu Cys Gly 20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Thr Pro Lys Ser Arg Arg Glu Val Glu Glu Leu Gin Val Gly 1345587 12/100 50 55 60
Gin Ala Glu Leu Gly Gly Gly Pro Gly Ala Gly Gly Leu Gin Pro Ser 65 70 75 80
Ala Leu Glu Leu Ala Leu Gin Lys Arg Gly lie Val Glu Gin Cys Cys 85 90 95
Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 no <210> 11 <211> 21 <212> PRT <213> Balaenoptera physalus <400> 11
Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 12 <211> 21 <212> PRT <213> Balaenoptera borealis <400> 12
Gly lie Val Glu Gin Cys Cys Ala Ser Thr Cys Ser Leu Tyr Gin Leu 1 5 10 15
Glu Asn Tyr Cys Asn 20 <210> 13 108
<211> 1345587 13/100 <212> PRT <213> Sus scrofa <400> 13
Met Ala Leu Trp Thr Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 1 5 10 15
Trp Ala Pro Ala Pro Ala Gin Ala Phe Val Asn Gin His Leu Cys Gly 20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Thr Pro Lys Ala Arg Arg Glu Ala Glu Asn Pro Gin Ala Gly 50 55 60
Ala Val Glu Leu Gly Gly Gly Leu Gly Gly Leu Gin Ala Leu Ala Leu 65 70 75 80
Glu Gly Pro Pro Gin Lys Arg Gly lie Val Glu Gin Cys Cys Thr Ser 85 90 95 lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 <210> 14 <211> 21 <212> PRT <213> Elephas maximus <400> 14
Gly lie Val Glu Gin Cys Cys Thr Gly Val Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 15 105
<211> 1345587 14/100 <212> PRT <213> Bos 1 taurus <400> 15 Met Ala Leu Trp Thr Arg Leu Arg Pro Leu 1 5 10 Trp Pro Pro Pro Pro Ala Arg Ala Phe Val 20 25 Ser His Leu Val Glu Ala Leu Tyr Leu Val 35 40 Phe Tyr Thr Pro Lys Ala Arg Arg Glu Val 50 55 Ala Leu Glu Leu Ala Gly Gly Pro Gly Ala 65 70 Pro Gin Lys Arg Gly lie Val Glu Gin Cys 85 90 Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 <210> 16 <211> 105 <212> PRT <213> 彳 Ovis aries <400> 16 Met Ala Leu Trp Thr Arg Leu Val Pro Leu 1 5 10 Trp Ala Pro Ala Pro Ala His Ala Phe Val 20 25 Ser His Leu Val Glu Ala Leu Tyr Leu Val 35 40 75 15 30 45
60 95 80
45 30 15 1345587 15/100
Phe Tyr Thr Pro Lys Ala Arg Arg Glu Val Glu Gly Pro Gin Val Gly 50 55 60
Ala Leu Glu Leu Ala Gly Gly Pro Gly Ala Gly Gly Leu Glu Gly Pro 65 70 75 80
Pro Gin Lys Arg Gly lie Val Glu Gin Cys Cys Ala Gly Val Cys Ser 85 90 95
Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 <210> 17 <211> 21 <212> PRT <213> Camelus dromedaries <400> 17
Gly lie Val Glu Gin Cys Cys Ala Ser Val Cys Ser Leu Tyr Gin Leu 1 5 10 15
Glu Asn Tyr Cys Asn 20 <210> 18 <211> 110 <212> PRT <213> Canis sp <400> 18
Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 15 10 15
Trp Ala Pro Ala Pro Thr Arg Ala Phe Val Asn Gin His Leu Cys Gly 20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 1345587 16/100 35 40 45
Phe Tyr Thr Pro Lys Ala Arg Arg Glu Val Glu Asp Leu Gin Val Arg 50 55 60
Asp Val Glu Leu Ala Gly Ala Pro Gly Glu Gly Gly Leu Gin Pro Leu 65 70 75 80
Ala Leu Glu Gly Ala Leu Gin Lys Arg Gly lie Val Glu Gin Cys Cys 85 90 95
Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 110 <210> 19 <211> 21 <212> PRT <213> Hystrix cristata <400> 19 Gly He :Val Asp Gin Cys Cys Thr Gly Val Cys Ser Leu Tyr Gin Leu 1 5 10 15 Gin Asn Tyr Cys Asn 20 <210> 20 <211> 108 <212> PRT <213> Aotus trivirgatus <400> 20
Met Ala Leu Trp Met His Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 15 10 15
Trp Gly Pro Glu Pro Ala Pro Ala Phe Val Asn Gin His Leu Cys Gly 20 25 30 1345587 17/100
Pro His Leu Val Glu Ala Leu l*yr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Ala Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gin Val Gly 50 55 60
Gin Val Glu Leu Gly Gly Gly Ser lie Thr Gly Ser Leu Pro Pro Leu 65 70 75 80
Glu Gly Pro Met Gin Lys Arg Gly Val Val Asp Gin Cys Cys Thr Ser 85 90 95 lie Cys Ser Leu Tyr Gin Leu Gin Asn Tyr Cys Asn 100 105 <210> 21 <211> 110 <212> PRT <213> Macaca fasicularis <400> 21
Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 1 5 10 15
Trp Gly Pro Asp Pro Ala Pro Ala Phe Val Asn Gin His Leu Cys Gly 20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Pro Gin Val Gly 50 55 60
Gin Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gin Pro Leu 65 70 75 80
Ala Leu Glu Gly Ser Leu Gin Lys Arg Gly He Val Glu Gin Cys Cys 85 90 95
Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 110
1345587 18/100 <210> 22 <211> 110 <212> PRT <213> Cercopithecus aethiops <400> 22 Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu 1 5 10 Trp Gly Pro Asp Pro Val Pro Ala Phe Val Asn Gin His Leu 20 25 30 Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg 35 40 45 Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Pro Gin 50 55 60 Gin Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gin 65 70 75 Ala Leu Glu Gly Ser Leu Gin Lys Arg Gly lie Val Glu Gin 85 90 Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 110 <210> 23 <211> 110 <212> PRT <213> Pan troglodytes <400> 23 Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Val Leu Leu 1 5 10 Trp Gly Pro Asp Pro Ala Ser Ala Phe Val Asn Gin His Leu 20 25 30 15 95 80 15 1345587 19/100
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 4S
Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gin Val Gly 50 55 60
Gin Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gin Pro Leu 65 70 75 80
Ala Leu Glu Gly Ser Leu Gin Lys Arg Gly lie Val Glu Gin Cys Cys 85 90 95
Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 110 <210> 24 <211> 21 <212> PRT <213> Ornithorhynchus anatinus <400> 24 10 15
Gly lie Val Glu Glu Cys Cys Lys Gly Val Cys Ser Met Tyr Gin Leu 1 5
Glu Asn Tyr Cys Asn 20 <210> 25 <211> 65 <212> PRT <213> Pongo pygmaeus <400> 25
Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg 15 10 15
Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gin 1345587 20/100 20 25 30
Val Gly Gin Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gin 35 40 45
Pro Leu Ala Leu Glu Gly Ser Leu Gin Lys Arg Gly lie Val Glu Gin 50 55 60
Cys 65 <210> 26 <211> 110 <212> PRT <213> Gorilla gorilla <400> 26
Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 15 10 15
Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gin His Leu Cys Gly 20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gin Val Gly 50 55 60
Gin Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gin Pro Leu 65 70 75 80
Ala Leu Glu Gly Ser Leu Gin Lys Arg Gly lie Val Glu Gin Cys Cys 85 90 95
Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 l〇5 110 <210> 27 51 <211> 1345587 21/100
<212> PRT <213> Saimiri sciureus <400> 27
Phe Val Asn Gin His Leu Cys Gly Pro His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Ala Pro Lys Thr Gly Val 20 25 30
Val Asp Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu Gin Asn 35 40 45
Tyr Cys Asn 50
<210> 28 <211> 110 <212> PRT <213> Cricetulus longicaudatus <400> 28
Met Thr Leu Trp Met Arg Leu Leu Pro Leu Leu Thr Leu Leu Val Leu 1 5 10 15
Trp Glu Pro Asn Pro Ala Gin Ala Phe Val Asn Gin His Leu Cys Gly 20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Thr Pro Lys Ser Arg Arg Gly Val Glu Asp Pro Gin Val Ala 50 55 60
Gin Leu Glu Leu Gly Gly Gly Pro Gly Ala Asp Asp Leu Gin Thr Leu 65 70 75 80
Ala Leu Glu Val Ala Gin Gin Lys Arg Gly lie Val Asp Gin Cys Cys 85 90 95 1345587 22/100
Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 <210> 29 <211> 110 <212> PRT <213> Rattus norvegicus 105 110 <400> 29
Met Ala Leu Trp Met Arg Phe Leu Pro Leu Leu Ala Leu Leu Val Leu 15 10 15
Trp Glu Pro Lys Pro Ala Gin Ala Phe Val Lys Gin His Leu Cys Gly 20 25 30
Pro His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Thr Pro Lys Ser Arg Arg Glu Val Glu Asp Pro Gin Val Pro 50 55 60
Gin Leu Glu Leu Gly Gly Gly Pro Glu Ala Gly Asp Leu Gin Thr Leu 65 70 75 80
Ala Leu Glu Val Ala Arg Gin Lys Arg Gly lie Val Asp Gin Cys Cys 85 90 95
Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 <210> 30 <211> 110 <212> PRT <213> Rattus norvegicus 105 110 <400> 30
Met Ala Leu Trp lie Arg Phe Leu Pro Leu Leu Ala Leu Leu lie Leu 15 10 15 1345587 23/100
Trp Glu Pro Arg Pro Ala Gin Ala 20 Ser His Leu Val Glu Ala Leu Tyr 35 40 Phe Tyr Thr Pro Met Ser Arg Arg 50 55 Gin Leu Glu Leu Gly Gly Gly Pro 65 70 Ala Leu Glu Val Ala Arg Gin Lys 85
Phe Val Lys Gin His Leu Cys Gly 25 30
Leu Val Cys Gly Glu.Arg Gly Phe 45
Glu Val Glu Asp Pro Gin Val Ala 60
Gly Ala Gly Asp Leu Gin Thr Leu 75 80
Arg Gly lie Val Asp Gin Cys Cys 90 95
Thr Ser lie Cys Ser Leu Tyr Gin 100 <210> 31 <211> 21 <212> PRT <213> Acomys cahirinus <400> 31
Leu Glu Asn Tyr Cys Asn 105 110
Gly lie Val Asp Gin Cys Cys Thr 1 5
Ser lie Cys Ser Leu Tyr Gin Leu 10 15
Glu Asn Tyr Cys Asn <210> 32 20 <211> 108 <212> PRT <213> Mus musculus <400> 32
Met Ala Leu Leu Val His Phe Leu
Pro Leu Leu Ala Leu Leu Ala Leu 1345587 24/100 15 10 15
Trp Glu Pro Lys Pro Thr Gin Ala Phe Val Lys Gin His Leu Cys Gly 20 25 30
Pro His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Thr Pro Lys Ser Arg Arg Glu Val Glu Asp Pro Gin Val Glu 50 55 60
Gin Leu Glu Leu Gly Gly Ser Pro Gly Asp Leu Gin Thr Leu Ala Leu 65 70 75 80
Glu Val Ala Arg Gin Lys Arg Gly lie Val Asp Gin Cys Cys Thr Ser 85 90 95 lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 <210> 33 <211> 110 <212> PRT <213> Mus musculus <400> 33
Met Ala Leu Trp Met Arg Phe Leu Pro Leu Leu Ala Leu Leu Phe Leu 1 5 10 15
Trp Glu Ser His Pro Thr Gin Ala Phe Val Lys Gin His Leu Cys Gly 20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Thr Pro Met Ser Arg Arg Glu Val Glu Asp Pro Gin Val Ala 50 55 60
Gin Leu Glu Leu Gly Gly Gly Pro Gly Ala Gly Asp Leu Gin Thr Leu 65 70 75 80 1345587 25/100
Ala Leu Glu Val Ala Gin Gin Lys Arg Gly lie Val Asp Gin Cys Cys 85 90 95
Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 110 <210> 34 <211> 21 <212> PRT <213> Chinchilla brevicaudata
<400> 34
Gly lie Val Asp Gin Cys Cys Thr Ser lie Cys Thr Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 35 <211> 110 <212> PRT <213> Cavia porcellus <400> 35
Met Ala Leu Trp Met His Leu Leu Thr Val Leu Ala Leu Leu Ala Leu 15 10 15
Trp Gly Pro Asn Thr Gly Gin Ala Phe Val Ser Arg His Leu Cys Gly 20 25 30
Ser Asn Leu Val Glu Thr Leu Tyr Ser Val Cys Gin Asp Asp Gly Phe 35 40 45
Phe Tyr lie Pro Lys Asp Arg Arg Glu Leu Glu Asp Pro Gin Val Glu 50 55 60
Gin Thr Glu Leu Gly Met Gly Leu Gly Ala Gly Gly Leu Gin Pro Leu 65 70 75 Θ0 951345587 26/100
Ala Leu Glu Met Ala 85 Leu Gin Lys Arg Gly 90 Thr Gly Thr Cys 100 Thr Arg His Gin Leu 105 Gin <210> 36 <211> 109 <212> PRT <213> Octodon degus <400> 36 Met 1 Ala Pro Trp Met 5 His Leu Leu Thr Val 10 Trp Gly Pro Asn 20 Ser Val Gin Ala Tyr 25 Ser Ser Asn Leu 35 Val Glu Ala Leu Tyr 40 Met Thr Tyr Arg 50 Pro His Asp Arg Arg 55 Glu Leu Glu Ala 65 Glu Leu Gly Leu Glu 70 Ala Gly Gly Leu Met lie Leu Gin Lys 85 Arg Gly lie Val Asp 90 Cys Thr Phe Asn 100 Gin Leu Gin Asn Tyr 105 Cys 75 110 15 30 45 60 95 80 <210> 37 <211> 21 <212> PRT <213>
Didelphis virginiana • 151345587 27/100 <400> 37 Gly lie Val Glu Gin Cys Cys Asn Ser lie 1 5 10 Glu Thr Tyr Cys Asn 20 <210> 38 <211> 108 <212> PRT <213> Rodentia sp. <400> 38 Met Ala Leu Trp lie Leu Leu Pro Leu Leu 1 5 10 Gly Pro Asp Pro Ala Gin Ala Phe Val Asn 20 25 His Leu Val Glu Ala Leu Tyr lie Leu Val 35 40 Phe Tyr Thr Pro Met Ser Arg Arg Glu Val 50 55 Gin Val Glu Leu Gly Ala Gly Pro Gly Ala 65 70 Ala Leu Glu Val Ala Arg Gin Ala Arg lie 85 90 Gly lie Cys Ser Leu Tyr Gin Glu Asn Tyr 100 105 75 15 60 45 30 80 95 <210> 39 <211> 110 <212> PRT <213>
Psammomys obesus 1345587 28/100 <400> 39
Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Phe Leu lie Leu 1 5 10 15
Trp Glu Pro Ser Pro Ala His Ala Phe Val Asn Gin His Leu Cys Gly 20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Thr Pro Lys Phe Arg Arg Gly Val Asp Asp Pro Gin Met Pro 50 55 60
Gin Leu Glu Leu Gly Gly Ser Pro Gly Ala Gly Asp Leu Arg Ala Leu 65 . 70 75 80
Ala Leu Glu Val Ala Arg Gin Lys Arg Gly lie Val Glu Gin Cys Cys 85 90 95
Thr Gly lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 110 <210> 40
<211> 110 <212> PRT <213> Spermophilus tridecemlineatus
<400> 40
Met Ala Leu Trp Thr Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 15 10 15
Leu Gly Pro Asp Pro Ala Gin Ala Phe Val Asn Gin His Leu Cys Gly 20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45
Phe Tyr Thr Pro Lys Ser Arg Arg Glu Val Glu Glu Gin Gin Gly Gly 50 55 60 801345587 29/100
Gin Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Leu Pro Gin Pro 65 70 75 Ala Leu Glu Met Ala Leu Gin Lys Arg Gly lie Val Glu Gin Cys 85 90 95 Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 110 <210> 41 <211> 29 <212> PRT <213> Cavia porcellus <400> 41 Glu Leu Glu Asp Pro Gin Val Glu Gin Thr Glu Leu Gly Met Gly 1 5 10 15 Gly Ala Gly Gly Leu Gin Pro Leu Gin Gly Ala Leu Gin 20 25 <210> 42 <211> 107 <212> PRT <213> Ballus gallus <400> 42 Met Ala Leu Trp lie Arg Ser Leu Pro Leu Leu Ala Leu Leu Val 1 5 10 15 Ser Gly Pro Gly Thr Ser Tyr Ala Ala Ala Asn Gin His Leu Cys 20 25 30 Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly 35 40 45 Phe Tyr Ser Pro Lys Ala Arg Arg Asp Val Glu Gin Pro Leu Val 50 55 60 1345587 30/100
Ser Pro Leu Arg Gly Glu Ala Gly Val Leu Pro Phe Gin Gin Glu Glu 65 70 75 80
Tyr Glu Lys Val Lys Arg Gly lie Val Glu Gin Cys Cys His Asn Thr 85 90 95
Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 100 105 <210> 43 <211> 81 <212> PRT <213> Anas platyrhynchos <220> <221> MISC 一 FEATURE <222> (31) ..(32) <223> X = any amino acid <220> <221> MISC —FEATURE <222> (59) ..(60) <223> X = any amino acid
<400> 43
Ala Ala Asn Gin His Leu Cys Gly Seir His Leu Val Glu Ala Leu Tyr 1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Ser Pro Lys Thr Xaa Xaa 20 25 30
Asp Val Glu Gin Pro Leu Val Asn Gly Pro Leu His Gly Glu Val Gly 35 40 45
Glu Leu Pro Phe Gin His Glu Glu Tyr Gin Xaa Xaa Gly lie Val Glu 50 55 60 1345587 31/100
Gin Cys Cys Glu Asn Pro Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys 65 70 75 80
Asn <210> 44 <211> 21
<212> PRT <213> Anser anser
<400> 44
Gly lie Val Glu Gin Cys Cys Glu Asn Pro Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 45 <211> 103 <212> PRT <213> Selasphorus rufus <400> 45
lie Gin Ser Leu Pro Leu Leu Ala Leu Leu Ala Leu Ser Gly Pro Gly 1 5 10 15
Thr Ser His Ala Ala Val Asn Gin His Leu Cys Gly Ser His Leu Val 20 25 30
Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Ser Pro 35 40 45
Lys Ala Arg Arg Asp Ala Glu His Pro Leu Val Asn Gly Pro Leu His 50 55 60
Gly Glu Val Gly Asp Leu Pro Phe Gin Gin Glu Glu Phe Glu Lys Val 1345587 32/100 65 70 75 80
Lys Arg Gly lie Val Glu Gin Cys Cys His Asn Thr Cys Ser Leu Tyr 85 90 95
Gin Leu Glu Asn Tyr Cys Asn 100 <210> 46 <211> 108 <212> PRT <213> Danio rerio <400> 46
Met Ala Val Trp Leu Gin Ala Gly Ala Leu Leu Val Leu Leu Val Val 15 10 15
Ser Ser Val Ser Thr Asn Pro Gly Thr Pro Gin His Leu Cys Gly Ser 20 25 30
His Leu Val Asp Ala Leu Tyr Leu Val Cys Gly Pro Thr Gly Phe Phe 35 40 45
Tyr Asn Pro Lys Arg Asp Val Glu Pro Leu Leu Gly Phe Leu Pro Pro 50 55 60
Lys Ser Ala Gin Glu Thr Glu Val Ala Asp Phe Ala Phe Lys Asp His 65 70 75 80
Ala Glu Leu lie Arg Lys Arg Gly lie Val Glu Gin Cys Cys His Lys 85 90 95
Pro Cys Ser lie Phe Glu Leu Gin Asn Tyr Cys Asn 100 <210> 47 <211> 108 <212> PRT <213> Cyprinus carpio 105 1345587 33/100 <400> 47
Met Ala Val Trp lie Gin Ala Gly Ala Leu Leu Phe Leu Leu Ala Val 1 5 10 15
Ser Ser Val Asn Ala Asn Ala Gly Ala Pro Gin His Leu Cys Gly Ser 20 25 30
His Leu Val Asp Ala Leu Tyr Leu Val Cys Gly Pro Thr Gly Phe Phe 35 40 45
Tyr Asn Pro Lys Arg Asp Val Asp Pro Pro Leu Gly Phe Leu Pro Pro 50 55 60
Lys Ser Ala Gin Glu Thr Glu Val Ala Asp Phe Ala Phe Lys Asp His 65 70 75 80
Ala Glu Val lie Arg Lys Arg Gly lie Val Glu Gin Cys Cys His Lys 85 90 95
Pro Cys Ser lie Phe Glu Leu Gin Asn Tyr Cys Asn 100 105 <210> 48 <211> 21 <212> PRT <213> Batrachoididae gen. sp <400> 48
Gly lie Val Glu Gin Cys Cys His Arg Pro Cys Asp lie Phe Asp Leu 15 10 15
Gin Ser Tyr Cys Asn 20 <210> 49 <211> 21 <212> PRT <213> Thunnus thynnus 1345587 34/100 <400> 49
Gly lie Val Glu Gin Cys Cys His Lys Pro Cys Asn lie Phe Asp Leu 15 10 15
Gin Asn Tyr Cys Asn 20 <210> 50
<211> 21 <212> PRT <213> Katsuwonus pelamis <400> 50
Gly lie His Glx Glx Cys Cys His Lys Pro Cys Asx lie Phe Glx Leu 15 10 15
Glx Asx Tyr Cys Asn 20 <210> 51
<211> 116 <212> PRT <213> Lophius piscatorius <400> 51
Met Ala Ala Leu Trp Leu Gin Ser Phe Ser Leu Leu Val Leu Leu Val 15 10 15
Val Ser Trp Pro Gly Ser Gin Ala Val Ala Pro Ala Gin His Leu Cys 20 25 30
Gly Ser His Leu Val Asp Ala Leu Tyr Leu Val Cys Gly Asp Arg Gly 35 40 45
Phe Phe Ύγΐ Asn Pro Lys Arg Asp Val Asp Gin Leu Leu Gly Phe Leu 50 55 60 1345587 35/100
Pro Pro Lys Ser Gly Gly Ala Ala Ala Ala Gly Ala Asp Asn Glu Val 65 70 75 80
Ala Glu Phe Ala Phe Lys Asp Gin Met Glu Met Met Val Lys Arg Gly 85 90 95 lie Val Glu Gin Cys Cys His Arg Pro Cys Asn lie Phe Asp Leu Gin 100 105 110
Asn Tyr Cys Asn 115 <210> 52 <211> 115 <212> PRT <213> Myxine glutinosa <400> 52
Met Ala Leu Ser Pro Phe Leu Ala Ala Val lie Pro Leu Val Leu Leu 15 10 15
Leu Ser Arg Ala Pro Pro Ser Ala Asp Thr Arg Thr Thr Gly His Leu 20 25 30
Cys Gly Lys Asp Leu Val Asn Ala Leu Tyr lie Ala Cys Gly Val Arg 35 40 45
Gly Phe Phe Tyr Asp Pro Thr Lys Met Lys Arg Asp Thr Gly Ala Leu 50 55 60
Ala Ala Phe Leu Pro Leu Ala Tyr Ala Glu Asp Asn Glu Ser Gin Asp 65 70 75 80
Asp Glu Ser lie Gly lie Asn Glu Val Leu Lys Ser Lys Arg Gly lie 85 90 95
Val Glu Gin Cys Cys His Lys Arg Cys Ser lie Tyr Asp Leu Glu Asn 100 105 110
Tyr Cys Asn 1345587 36/100 115 <210> 53 <211> 105 <212 > PRT <213> Oncorhynchus keta <400> 53
Met Ala Phe Trp Leu Gin Ala Ala Ser Leu Leu Val Leu Leu Ala Leu 15 10 15
Ser Pro Gly Val Asp Ala Ala Ala Ala Gin His Leu Cys Gly Ser His 20 25 30
Leu Val Asp Ala Leu Tyr Leu Val Cys Gly Glu Lys Gly Phe Phe Tyr 35 40 45
Thr Pro Lys Arg Asp Val Asp Pro Leu lie Gly Phe Leu Ser Pro Lys 50 55 60
Ser Ala Lys Glu Asn Glu Glu Tyr Pro Phe Lys Asp Gin Thr Glu Met 65 70 75 80
Met Val Lys Arg Gly lie Val Glu Gin Cys Cys His Lys Pro Cys Asn 85 90 95 lie Phe Asp Leu Gin Asn Tyr Cys Asn 100 105 <210> 54 <211> 21 <212> PRT <213> Myoxocephalus scorpius <400> 54
Gly lie Val Glu Gin Cys Cys His Arg Pro Cys Asn lie Arg Val Leu 15 10 15 1345587 37/100
Glu Asn Tyr Cys Asn 20 <210> 55
<211> 21 <212> PRT <213> Lepisosteus spatula <400> 55
Gly lie Val Glu Gin Cys Cys His Lys Pro Cys Thr lie Tyr Glu Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 56
<211> 21 <212> PRT <213> Platichthys flesus <400> 56 -
Gly lie Val Glu Gin Cys Cys His Lys Pro Cys Asn lie Phe Asp Leu
1 5 10 15
Gin Asn Tyr Cys Asn 20 <210> 57 <21X> 21
<212> PRT <213> Hydrolagus colliei <400> 57
Gly lie Val Glu Gin Cys Cys His Asn Thr Cys Ser Leu Ala Asn Leu 15 10 15 1345587 38/100
Glu Gly Tyr Cys Asn 20 <210> 58
<211> 22 <212> PRT <213> Squalus acanthias <400> 58
Gly lie Val Glu His Cys Cys His Asn Thr Cys Ser Leu Tyr Asp Leu 15 10 15
Glu Gly Tyr Cys Asn Gin 20 <210> 59
<211> 21 <212> PRT <213> Torpedo marmorata <400> 59
Gly lie Val Glu His Cys Cys His Asn Thr Cys Ser Leu Phe Asp Leu 15 10 15
Glu Gly Tyr Cys Asn 20 <210> 60 <211> 89
<212> PRT <213> Callorhinchus milii <400> 60
Val Pro Thr Gin Arg Leu Cys Gly Ser His Leu Val Asp Ala Leu Tyr 15 10 15 1345587 39/100
Phe Val Cys Gly Glu Arg Gly Phe Phe Tyr Ser Pro Lys Gin lie Arg 20 25 30
Asp Val Gly Pro Leu Ser Ala Phe Arg Asp Leu Glu Pro Pro Leu Asp 35 40 45
Thr Glu Met Glu Asp Arg Phe Pro Tyr Arg Gin Gin Leu Ala Gly Ser 50 55 60
Lys Met Lys Arg Gly lie Val Glu Gin Cys Cys His Asn Thr Cys Ser 65 70 75 80
Leu Val Asn Leu Glu Gly Tyr Cys Asn 85
<210> 61 <211> 21 <212> PRT <213> Petromyzon marinus <400> 61
Gly lie Val Glu Gin Cys Cys His Arg Lys Cys Ser lie Tyr Asp Met 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 62 <211> 21 <212> PRT <213> Oncorhynchus gorbuscha <400> 62
Gly lie Val Glu Gin Cys Cys His Lys Pro Cys Asn lie Phe Asp Leu 15 10 15
Gin Asn Tyr Cys Asn 1345587 40/100 20 <210> 63 · <211> 21 <212> PRT <213> Amia calva <400> 63
Gly lie Val Glu Gin Cys Cys Leu Lys Pro Cys Thr lie Tyr Glu Met 15 10 15
Glu Lys Tyr Cys Asn 20 <210> 64 <211> 21 <212> PRT <213> Anguilla rostrata <400> 64
Gly lie Val Glu Gin Cys Cys His Lys Pro Cys Ser lie Phe Asp Leu 15 10 15
Gin Asn Tyr Cys Asn 20 <210> 65 <211> 113 <212> PRT <213> Oreochromis niloticus <400> 65
Met Ala Ala Leu Trp Leu Gin Ala Phe Ser Leu Leu Val Leu Met Met 15 10 15 1345587 41/100
Val Ser Trp Pro Gly Ser Gin Ala Val Gly Gly Pro Gin His Leu Cys 20 25 30
Gly Ser His Leu Val Asp Ala Leu Tyr Leu Val Cys Gly Asp Arg Gly 35 40 45
Phe Phe Tyr Asn Pro Arg Arg Asp Val Asp Pro Leu Leu Gly Phe Leu 50 55 60
Pro Pro Lys Ala Gly Gly Ala Val Val Gin Gly Gly Glu Asn Glu Val 65 70 75 80
Thr Phe Lys Asp Gin Met Glu Met Met Val Lys Arg Gly lie Val Glu 85 90 95
Glu Cys Cys His Lys Pro Cys Thr lie Phe Asp Leu Gin Asn Tyr Cys 100 105 110
Asn
<210> 66 <211> 21 <212> PRT <213> Acipenser gueldenstaedti <400> 66
Gly lie Val Glu Gin Cys Cys His Ser Pro Cys Ser Leu Tyr Asp Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 67 <211> 21 <212> PRT <213> Piaractus mesopotamicus 67 <400> 1345587 42/100
Gly lie Val Glu Gin Cys Cys His Lys Pro Cys Ser lie Phe Asp Leu 15 10 15
Gin Asn Tyr Cys Asn 20 <210> 68 <211> 115
<212> PRT <213> Verasper moseri <400> 68
Met Ala Ala Leu Trp Leu Gin Ser Val Ser Leu Leu Val Leu Met Leu 15 10 15
Val Ser Trp Ser Gly Ser Gin Ala Val Leu Pro Pro Gin His Leu Cys 20 25 30
Gly Ala His Leu Val Asp Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly 35 40 45
Phe Phe Tyr Thr Pro Lys Arg Asp Val Asp Pro Leu Leu Gly Phe Leu 50 55 60
Pro Ala Lys Ser Gly Gly Ala Ala Ala Gly Gly Glu Asn Glu Val Ala 65 70 75 80
Glu Phe Ala Phe Lys Asp Gin Met Glu Met Met Val Lys Arg Gly lie 85 90 95
Val Glu Gin Cys Cys His Lys Pro Cys Asn lie Phe Asp Leu Gin Asn 100 105 110
Tyr Cys Asn 115 <210> 69 <211> 30
PRT <212> 1345587 43/100 <213> Anquilla anguilla <400> 69
Asp Val Glu Pro Leu Leu Gly Phe Leu Ser Pro Lys Ser Gly Gin Glu 15 10 15
Asn Glu Val Asp Asp Phe Pro Tyr Lys Gly Gin Gly Glu Leu 20 25 30 <210> 70 <211> 106 <212> PRT <2X3> Xenopus laevis <400> 70
Met Ala Leu Trp Met Gin Cys Leu Pro Leu Val Leu Val Leu Phe Phe 15 10 15
Ser Thr Pro Asn Thr Glu Ala Leu Val Asn Gin His Leu Cys Gly Ser 20 25 30
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Asp Arg Gly Phe Phe 35 40 45
Tyr Tyr Pro Lys Val Lys Arg Asp Met Glu Gin Ala Leu Val Ser Gly 50 55 60
Pro Gin Asp Asn Glu Leu Asp Gly Met Gin Leu Gin Pro Gin Glu Tyr 65 70 75 80
Gin Lys Met Lys Arg Gly lie Val Glu Gin Cys Cys His Ser Thr Cys 85 90 95
Ser Leu Phe Gin Leu Glu Ser Tyr Cys Asn 100 105 <210> 71 <211> 106 <212>
PRT 1345587 44/100 <213> Xenopus laevis <400> 71
Met Ala Leu Trp Met Gin Cys Leu Pro Leu Val Leu Val Leu Leu Phe 1 5 10 15
Ser Thr Pro Asn Thr Glu Ala Leu Ala Asn Gin His Leu Cys Gly Ser 20 25 30
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Asp Arg Gly Phe Phe 35 40 45
Tyr Tyr Pro Lys lie Lys Arg Asp lie Glu Gin Ala Gin Val Asn Gly 50 55 60
Pro Gin Asp Asn Glu Leu Asp Gly Met Gin Phe Gin Pro Gin Glu Tyr 65 70 75 80
Gin Lys Met Lys Arg Gly lie Val Glu Gin Cys Cys His Ser Thr Cys 85 90 95
Ser Leu Phe Gin Leu Glu Asn Tyr Cys Asn 100 <210> 72 <211> 21 <212> PRT <213> Trachemys scripta <400> 72
Gly lie Val Glu Gin Cys Cys His Asn Thr Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 73 <211> 21 1345587 45/100
<212> PRT <213> Alligator mississippiensis <400> 73
Gly lie Val Glu Gin Cys Cys His Asn Thr Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 74
<211> 21 <212> PRT <213> Zaocys dhumnades <400> 74
Gly lie Val Glu Gin Cys Cys Glu Asn Thr Cys Ser Leu Tyr Glu Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 75
<211> 21 <212> PRT <213> Crotalus atrox <400> 75
Gly lie Val Glu Gin Cys Cys Glu Asn Thr Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 76 <211> 114 1345587 46/100
<212> PRT <213> Artificial Sequence <220> <223> Preproinsulin <400> 76
Met Gly Leu Trp lie Arg Leu Leu Pro Leu lie Ala Leu Leu lie Leu 15 10 15
Trp Gly Pro Asp Pro Ala Ala Ala Glu Phe Arg Met Phe Val Asn Gin 20 25 30
His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly 35 40 45
Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp 50 55 60
Leu Gin Val Gly Gin Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser 65 70 75 80
Leu Gin Pro Leu Ala Leu Glu Gly Ser Leu Gin Lys Arg Gly lie Val 85 90 95
Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr 100 105 HO
Cys Asn <210> 77 <211> 21 <212> PRT <213> Artificial Sequence <220> <223>
Insulin 1345587 47/100 <400> 77
Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <21〇> 78 <211> 30
<212> PRT
<213> Artificial Sequence <220> <223> Insulin <400> 78
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr IS 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Ί*γχ Thr Pro Lys Thr 20 25 30 <210> 79 <211> 53 <212> PRT <213> Artificial Sequence
<220> <223> Insulin <400> 79
Phe Val Asp Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys 20 25 30
Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Glu Leu 1345587 48/100 35 40
Glu Asp Tyr Cys Asn 50 <210> 80 <211> 53
<212> PRT <213> Artificial Sequence <220> <223> Insulin <400> 80 Phe Val Glu Gin His Leu Cys Gly 1 5 Leu Val Cys Gly Glu Arg Gly Phe 20 Gly lie Val Glu Gin Cys Cys Thr 35 40
Glu Glu Tyr Cys Asn 50
Ser Asp Leu Val Glu Ala Leu Tyr 10 15
Phe Tyr Thr Pro Lys Ala Ala Lys 25 30
Ser lie Cys Ser Leu Tyr Gin Leu 45 <210> 81 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> Insulin <400> 81 Phe Val ,Gin Gin His Leu Cys Gly 1 5
Ser His Leu Val Glu Ala Leu Tyr 10 15 1345587 49/100
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys 20 25 30
Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 35 40 45
Glu Asn Tyr Cys Gly 50 <210> 82 <211> 53
<212> PRT <213> Artificial Sequence <220> <223> Unnamed protein product with insulin homology <400> 82
Phe Val Thr Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys 20 25 30
Gly He Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 35 40 45
Glu His Tyr Cys Ser 50 <210> 83 <211> 57
<212> PRT <213> Artificial Sequence <220> <223> Proinsulin 83
<400> 1345587 50/100
Asn Ser Asn Gly Lys Phe Val Asn Gin His Leu Cys Gly Ser His Leu 15 10 15
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr 20 25 30
Pro Lys Thr Lys Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser 35 40 45
Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 50 55 <210> 84 <211> 58 <212> PRT <213> Artificial Sequence <220> <223> Insulin <400> 84
Asn Ser Asn Gly Lys Phe Val Asn Gin His Leu Cys Gly Ser His Leu 1 5 10 15
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr 20 25 30
Pro Lys Thr Lys Arg Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys 35 40 45
Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 50 55
<210> 85 <211> 50 <212> PRT <213>
Artificial Sequence <220>1345587 51/100 <223> Insulin <400> 85
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Gly lie Val 20 25 30
Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr 35 40 45
Cys Asn 50 <210> 86 <211> 54
<212> PRT <213> Artificial Sequence <220> <223> Insulin # <400> 86 Arg Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu 1 5 10 15 Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala 20 25 30 Lys Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin 35 40 45 Leu Glu Asn Tyr Cys Asn 50 <210> 87 <211> 61
PRT
<212> 1345587 52/100 <213> Artificial Sequence <220> <223> Insulin <400> 87
Lys Glu Thr Leu Thr lie Thr Cys Ala Val Pro Thr Trp Leu Lys Leu 15 10 15
Trp Thr Trp Phe Ala Val Lys Glu Val Ser Ser Thr Asn Leu Arg Leu 20 25 30
Leu Arg Val Leu Ser Asn Asn Ala Val Pro Pro Ser Ala Pro Cys Thr 35 40 45
Asn Trp Lys Thr Thr Ala Thr Arg Arg 50 55 <210> 88 <211> 61 <212> PRT <213> Artificial Sequence
Ser Pro Gin Ala 60 <22 0> <223> Preproinsulin <400> 88
Lys Asp Ser Leu Thr Asn Thr Cys Ala Val Ser Thr Trp Leu Lys Leu 15 10 15
Cys Thr Trp Phe Ala Val Lys Glu Val Ser Ser Thr Leu Leu Arg Leu 20 25 30
Leu Arg Val Leu Ser Asn Asn Ala Val Pro Pro Ser Ala Asn Tyr Thr 35 40 45
Asn Trp Lys Thr Thr Ala Thr Arg Arg Ser Pro Gin Ala 50 55 60 1345587 53/100 <210> 89 <211> 87
<212> PRT <213> Artificial Sequence <220> <223> Proinsulin <400> 89
Met Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu 15 10 15
Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg 20 25 30
Arg Glu Ala Glu Asp Leu Gin Val Gly Gin Val Glu Leu Gly Gly Gly 35 40 45
Pro Gly Ala Gly Ser Leu Gin Pro Leu Ala Leu Glu Gly Ser Leu Gin 50 55 60
Lys Arg Gly He Val Glu Gin Cys Cys Thr Ser He Cys Ser Leu Tyr 65 70 75 80
Gin Leu Glu Asn Tyr Cys Asn 85 <210> 90 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> Insulin <400> 90 Arg Arg [Glu Ala Glu Asp Leu Gin Val Gly Gin Val Glu Leu Gly Gly 1 5 10 15 1345587 54/100
Gly Pro Gly Ala Gly Ser Leu Gin Pro Leu Ala Leu Glu Gly Ser Leu 20 25 30
Gin Lys Arg
35 <210> 91 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Insulin <400> 91
Gly Pro Glu Thr Leu Cys Gly Ala Glu Leu Val Asp Ala Leu Gin Phe 15 10 15
Val Cys Gly Asp Arg Gly Phe 20 <210> 92 <211> 124 <212> PRT <213> Artificial Sequence <220> <223> Insulin <400> 92
Met Lys Leu Lys Thr Val Arg Ser Ala Val Leu Ser Ser Leu Phe Ala 15 10 15
Ser Gin Val Leu Gly Gin Pro lie Asp Asp Thr Glu Ser Gin Thr Thr 20 25 30
Ser Val Asn Leu Met Ala Asp Asp Thr Glu Ser Ala Phe Ala Thr Gin 35 40 45 1345587 55/100
Thr Asn Ser Gly Gly Leu Asp Val Val Gly Leu lie Ser Met Ala Lys 50 55 60
Arg Glu Glu Gly Glu Pro Lys Phe Val Asn Gin His Leu Cys Gly Ser 65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe 85 90 95
Tyr Thr Pro Lys Ala Ala Lys Gly lie Val Glu Gin Cys Cys Thr Ser 100 105 110 lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 115 120 <210> 93 <211> 171
<212> DNA <213> Artificial Sequence <220> <223> Insulin <400> 93 tttgtcaatc agcacctttg tggttctcac ctggtggagg ctctgtacct ggtgtgtggg gaacgtggtt tcttctacac acccaagacc cgtcgtaagc ttaagcgtgg cattgtggag cagtgctgca ccagcatctg ctccctctac caactggaga actactgcaa c <210> 94
<211> 21 <212> PRT <213> Artificial Sequence <220> <223> Insulin analogue 94 60 120 171 <400> 1345587 56/100
Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 95
<211> 26 <212> PRT
<213> Artificial Sequence <22 0 > <223> Insulin analogue <220> <2 21> MISC_FEATURE <222? (26) . . (26) <223> X = any amino acid <400> 95
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Xaa 20 25 <210> 96 <211> 21
<212> PRT <213> Homo sapiens <400> 96
Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15 1345587 57/100
Glu Asn Tyr Cys Asn
20 <210> 97 <211> 29 <212> PRT <213> Homo sapiens <400> 97
Glu Val Asn Gin His Leu Cys Gly Ser Glu Leu Val Glu Ala Leu Glu 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Glu Pro Lys 20 25 <210> 98 <211> 21 <212> PRT <213> Homo sapiens <400> 98
Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 99 <211> 30 <212> PRT <213> Homo sapiens <400> 99
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu His 15 10 15 1345587 58/100
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 <210> 100 <211> 21 <212> PRT <213> Homo sapiens <400> 100
Gly lie Val Glu Gin Cys Cys Lys Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 101 <211> 30 <212> PRT <213> Homo sapiens <400> 101
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 <210> 102 <211> 21 <212 > PRT <213> Homo sapiens <400> 102
Gly lie Val Glu Gin Cys Cys Lys Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15 1345587 59/100
Glu Asn Tyr Cys Asn 20 <210> 103 <211> 30
<212> PRT <213> Homo sapiens <400> 103
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 <210> 104 <211> 21 <212> PRT <213> Homo sapiens <220>
< 2 21 > MISC_FEATURE <222> (8) _.(8) <223> X = any amino acid <400> 104
Gly lie Val Glu Gin Cys Cys Xaa Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 105 <211> 30 1345587 60/100
<212> PRT <213> Homo sapiens <400> 105
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 <210> 106 <211> 21
<212> PRT <213> Homo sapiens <220> <221> MISC_FEATURE <222> (8) . . (8) <223> X = any amino acid <400> 106
Gly lie Val Glu Gin Cys Cys Xaa Ser lie Cys Ser Leu Tyr Gin Leu 1 5 10 15
Glu Asn Tyr Cys Asn 20 <210> 107 <211> 30
<212> PRT <213> Homo sapiens 107
<400> 1345587 61/100
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 <210> 108 <211> 21 <212> PRT <213> Homo sapiens <220> <221> MISC_FEATURE <222> ⑵·.(2) <223> X = any amino acids <400> 108
Gly Xaa Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 1 5 10 15
Glu Asn Tyr Cys Asn 20 <210> 109 <211> 30 <212> PRT <213> Homo sapiens <400> 109
Phe Val Asn Gin His Leu Cys Gly Ser Asp Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Lys Pro Thr 20 25 30 <210> 110 1345587 62/100 <211> 21
<212> PRT <213> Homo sapiens <400> 110
Gly Ala Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20
<210> 111 <211> 30
<212> PRT <213> Homo sapiens <400> 111
Phe Val Asn Gin His Leu Cys Gly Ser Asp Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Lys Pro Thr 20 25 30
<210> 112 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Insulin analogue <220> < 2 21 > MI SC—FEATURE <222> (2) · . (2) 1345587 63/100 <223> X = any amino acid <400> 112
Gly Xaa Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 113 <211> 30
<212> PRT <213> Artificial Sequence <220> <223> Insulin analogue <400> 113
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30
<210> 114
<211> 21 <212> PRT <213> Artificial Sequence <220> <223> Insulin analogue <220> <221> MISC—FEATURE <222> (2) . . (2) <223> X = any amino acid 1345587 64/100 <400> 114
Gly Xaa Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 115 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Insulin analogue <400> 115
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 ~25 30 <210> 116 <211> 21 <212> PRT <213> Homo sapiens <400> 116
Gly Gly Gly Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 117 1345587 65/100 <211> 30
<212> PRT <213> Homo sapiens <400> 117
Phe Val Asn Gin His Leu Cys Gly Ser Asp Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Lys Pro Thr 20 25 30 <210> 118 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> <220> Homo sapiens insulin mutant <221> MISC_FEATURE <222> ⑴·.⑴ <223> X = any amino acid <400> 118
Xaa lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 1 5 10 15
Glu Asn Tyr Cys Asn
20 <210> 119 <211> 30 <212> PRT <213> Artificial Sequence 1345587 66/100 <220> <223> Homo sapiens insulin mutant <220> <221> MISC 一FEATURE <222> (1) . . (1) <223> X = any amino acid <400> 119
Xaa Val Asn Gin His Leu Cys Gly Asp His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30
<210> 120 <211> 21 <212> PRT <213> Artificial Sequence <220>
<223> Homo sapiens insulin mutant <400> 120
Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 121 <211> 29 <212> PRT <213> Artificial Sequence <220>1345587 67/100 <223> Homo sapiens insulin mutant <400> 121
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Tyr Thr Pro Lys Thr 20 25 <210> 122 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Homo sapiens insulin <400> 122
Gly lie Val Glu Gin Ser Cys Thr Ser lie Ser Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 123 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Homo sapiens insulin <400> 123
Phe Val Asn Gin His Leu Cys Gly Ser Asp Leu Val Glu Ala Leu Tyr 15 10 15 1345587 68/100
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Lys Pro Thr 20 25 30 <210> 124 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> Insulin <400> 124
Met Asp Pro Gly Asp Pro Glu Cys Leu Glu Gin Leu Leu Arg Arg Leu 15 10 15
Gly Gly Ser Val Glu Val Glu Val Thr Gly Gly Thr Val His Val Glu 20 25 30
Val Ser Pro Glu Asp Pro Gly Asp Pro Glu Cys Leu Glu Gin Leu Leu 35 40 45
Arg Arg Leu Gly Gly Ser Val Glu Val Glu Val Thr Gly Gly Thr Val 50 55 60
His Val Glu Val Ser Pro Gly Glu Arg Gly Phe Phe Tyr Cys Asn 65 70 75 <210> 125 <211> 87 <212> PRT <213> Artificial Sequence <220> <223> Insulin <400> 125
Met Leu Lys Glu Lys Lys Tyr Ser Pro Asp Pro Gly Asp Pro Glu Cys 15 10 15 1345587 69/100
Leu Glu Gin Leu Leu Arg Arg Leu Gly Gly Ser Val Glu Val Glu Val 20 25 30
Thr Gly Gly Thr Val His Val Glu Val Ser Pro Glu Asp Pro Gly Asp 35 40 45
Pro Glu Cys Leu Glu Gin Leu Leu Arg Arg Leu Gly Gly Ser Val Glu 50 55 60
Val Glu Val Thr Gly Gly Thr Val His Val Glu Val Ser Pro Gly Glu 65 70 75 80
Arg Gly Phe Phe Tyr Cys Asn 85 <210> 126 <211> 23
<212> PRT <213> Artificial Sequence <220> <22-3> Insulin fusion protein <220> <221> MISC_FEATURE <222> ⑸…(5) <223> X = any amino acid <220> <221> MI SC一 FEATURE <222> (18)..(18) <223> X = any amino acid <400> 126
Met Ala Thr Ser Xaa Ser Thr Lys Lys Thr Gin Leu Gin Leu Glu His 1345587 70/100 15 10 15
Leu Xaa Leu Asp Leu Gin Met 20 <210> 127 <211> 23
<212> PRT
<213> Escherichia coli <220> <221> MI SC一FEATURE <222> (14)..(14) <223> X = any amino acid <220> <221> MISC_FEATURE <222> (17)..(17) <223> X - any amino acid <400> 127
Thr Met lie Thr Asp Ser Leu Ala Val Val Leu Gin Arg Xaa Asp Trp 15 10 15
Xaa Pro Gly Val Thr Gin Leu 20 <210> 128 <211> 96
<212> PRT <213> Brevibacillus brevis <400> 128 1345587 71/100
Asn Ser Val Leu Ala Ser Ala Leu Ala Leu Thr Val Ala Pro Met Ala 15 10 15
Phe Ala Asn Ser Asp Ser Glu Ser Pro Leu Ser His Asp Gly Tyr Ser 20 25 30
Leu His Asp Gly Val Ser Met Tyr lie Glu Ala Leu Asp Lys Phe Val 35 40 45
Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val 50 55 60
Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Gly lie Val Glu Gin 65 70 75 80
Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 85 90 95 <210> 129 <211> 25 <212> PRT <213> Artificial Sequence <220> « . <223> Insulin fusion protein <400> 129 Asp Thr Thr Met 1 Pro Ala Gly Gly Gly Gly Gly Gly Gin His Leu Cys 5 10 15
Gly Pro His Leu Val Glu Ala Leu Tyr 20 25 <210> 130 <211> 6 <212> PRT <213> Artificial Sequence <220> 1345587 72/100 <223> Insulin fusion protein <400> 130 Leu Glu Asn Tyr Cys Asn 1 5 <210> 131 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Insulin fusion protein <400> 131
Met Thr Met lie Thr Asp Ser Leu Glu Phe Gin Ala Trp Gly Gly Gly 1 5 10 15
Gly Gly Trp Met Arg Phe 20 <210> 132
<211> 22 <212> PRT
<213> Artificial Sequence <220> <223> Insulin fusion protein <400> 132
Met Val Leu Arg Phe Leu Pro Leu Leu Ala Leu Leu Val Leu Trp Glu
1 5 10 IB
Pro Lys Pro Ala Gin Ala 20 <210> 133
1345587 73/100
<211> 60 <212> PRT <213> Artificial Sequence <220> <223> Mini-proinsulin <400> 133
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg 20 25 30
Tyr Pro Gly Asp Val Lys Arg Gly lie Val Glu Gin Cys Cys Thr Ser 35 40 45 lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 50 55 60 <210> 134 <211> 21
<212> PRT <213> Homo sapiens <400> 134
Gly lie Val Glu Gin Cys Cys Lys Ser He Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 135 <211> 30 <212> PRT <213> Homo sapiens 1345587 74/100 <400> 135 Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 1 5 10 15 Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 <210> 136 <211> 21 <212> PRT <213> Homo sapiens <400> 136
Gly lie Val Glu Gin Cys Cys Lys Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 137 <211> 30
<212> PRT
<213> Homo sapiens <400> 137
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 <210> 138 <211> 14 <212> PRT <213> Artificial Sequence <220>1345587 75/100 <223> Homo sapiens insulin <400> 138
Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Gly 1 5 10 <210> 139 <211> 21 <212> PRT <213> Homo sapiens <220> <221> MISC_FEATURE <222> (8)..⑻ <223> X = any amino acid <400> 139
Gly lie Val Glu Gin Cys Cys Xaa Ser lie Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 <210> 140 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Homo sapiens insulin <400> 140
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 1345587 76/100 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 <210> 141 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> <220> Homo sapiens insulin <221> MISC—FEATURE <222> (8) . . (8) <223> X = any amino acid <400> 141
Gly lie Val Glu Gin Cys Cys Xaa Ser lie Cys Ser Leu Tyr Gin Leu 1 5 10 15 *
Glu Asn Tyr Cys Asn 20 <210> 142 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Homo sapiens insulin <400> 142
Phe Val Asn Gin His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 15 10 15 1345587 77/100
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 <210> 143 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Mini-proinsulin mutant <400> 143
Gly lie Val Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu 1 5 10 15
Glu Asn Tyr Cys Asn 20 <210> 144 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> Mini-proinsulin mutant <400> 144
Phe Val Asn Gin His Leu Cys Gly Ser Asp Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Asp Lys 20 25 <210> 145 <211> 50
<212> PRT 1345587 78/100 <213> Artificial Sequence <220> <223> Mini-proinsulin mutant <400> 145
Phe Val Asn Gin His Leu Cys Gly Ser Asp Leu Val Glu Ala Leu Tyr 15 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Asp Lys Gly lie Val 20 25 30
Glu Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr 35 40 45
Cys Asn 50 <210> 146 <211> 3
<212> PRT <213> Artificial Sequence <220> <223> Insulin C-peptide <400> 146
Ala Ala Lys 1 <210> 147 <;211> 3
<212> PRT <213> Artificial Sequence <220> 1345587 79/100 <223> Insulin C-peptide <400> 147 Asn Lys 1 Arg <210> 148 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Insulin C-peptide <400> 148 Arg Arg Lys Gin 1 Lys Arg 5 <210> 149 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Cleavage site <400> 149 Arg Arg Lys Arg 1 <210> 150 <211> 4 <212> PRT <213> Artificial Sequence <220> 1345587 80/100 <223> ER retention sequence <400> 150
Lys Asp Glu Leu 1 <210> 151 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> ER retention sequence <400> 151
His Asp Glu Leu 1 <210> 152 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> ER retention sequence <400> 152
Asp Asp Glu Leu 1
<210> 153 <211> 4 <212> PRT <213>
Artificial Sequence <220> <220>1345587 81/100 <223> ER retention sequence <400> 153
Ala Asp Glu Leu 1 <210> 154 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> ER retention sequence <400> 154
Ser Asp Glu Leu 1 <210> 155 <211> 4 <212> PRT <213> Lycopersicon esculentum Mill. <400> 155
His Asp Glu Phe 1
Met Ala Asp Thr Ala Arg Gly Thr His His Asp He He Gly Arg Asp <210> 156 <211> 118 <212> PRT <213> Arabidopsis thaliana <400> 156 1345587 82/100 15 10 15
Gin Tyr Pro Met Met Gly Arg Asp Arg Asp Gin Tyr Gin Met Ser Gly 20 25 30
Arg Gly Ser Asp Tyr Ser Lys Ser Arg Gin lie Ala Lys Ala Ala Thr 35 40 45
Ala Val Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Ser Leu Thr Leu 50 55 60
Val Gly Thr Val He Ala Leu Thr Val Ala Thr Pro Leu Leu Val lie 65 70 75 80
Phe Ser Pro He Leu Val Pro Ala Leu lie Thr Val Ala Leu Leu lie 85 90 95
Thr Gly Phe Leu Ser Ser Gly Gly Phe Gly He Ala Ala He Thr Val 100 105 110
Phe Ser Trp lie Tyr Lys 115 <210> 157 <211> 187 <212> PRT <213> Brassica napus <400> 157
Met Ala Asp Thr Ala Arg Thr His His Asp Val Thr Ser Arg Asp Gin 1 5 10 15
Tyr Pro Arg Asp Arg Asp Gin Tyr Ser Met He Gly Arg Asp Arg Asp 20 25 30
Gin Tyr Ser Met Met Gly Arg Asp Arg Asp Gin Tyr Asn Met Tyr Gly 35 40 45
Arg Asp Tyr Ser Lys Ser Arg Gin lie Ala Lys Ala Val Thr Ala Val 50 55 60 1345587 83/100
Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Ser Leu Thr Leu Val Gly 65 70 75 80
Thr Val lie Ala Leu Thr Val Ala Thr Pro Leu Leu Val lie Phe Ser 85 90 95
Pro lie Leu Val Pro Ala Leu lie Thr Val Ala Leu Leu lie Thr Gly 100 105 110
Phe Leu Ser Ser Gly Gly Phe Ala lie Ala Ala lie Thr Val Phe Ser 115 120 125
Trp lie Tyr Lys Tyr Ala Thr Gly Glu His Pro Gin Gly Ser Asp Lys 130 135 140
Leu Asp Ser Ala Arg Met Lys Leu Gly Thr Lys Ala Gin Asp lie Lys 145 150 155 160
Asp Arg Ala Gin Tyr Tyr Gly Gin Gin His Thr Gly Gly Glu His Asp 165 170 175
Arg Asp Arg Thr Arg Gly Gly Gin His Thr Thr 180 185 <210> 158 <211> 748
<212> DNA <213> Arabidopsis thaliana <400> 158 60 120 180 240 300 360 420 taccatgggg tcaaagacgg agatgatgga gagagacgca atggctacgg tggctcccta tgcgccggtc acttaccatc gccgtgctcg tgttgacttg gatgatagac ttcctaaacc ttatatgcca agagcattgc aagcaccaga cagagaacac ccgtacggaa ctccaggcca taagaattac ggacttagtg ttcttcaaca gcatgtctcc ttcttcgata tcgatgataa tggcatcatt tacccttggg agacctactc tggactgcga atgcttggtt tcaatatcat tgggtcgctt ataatagccg ctgttatcaa cctgaccctt agctatgcca ctcttccggg gtggttacct tcacctttct tccctatata catacacaac atacacaagt caaagcatgg aagtgattca aaaacatatg acaatgaagg aaggtttatg ccggtgaatc ttgagttgat 480 1345587 84/100 atttagcaaa tatgcgaaaa ccttgccaga caagttgagt cttggagaac tatgggagat 540 gacagaagga aaccgtgacg cttgggacat ttttggatgg atcgcaggca aaatagagtg 600 gggactgttg tacttgctag caagggatga agaagggttt ttgtcaaaag aagctattag 660 gcggtgtttc gatggaagct tgttcgagta ctgtgccaaa atctacgctg gtatcagtga 720 agacaagaca gcatactacg ccatggat 748 <210> 159 <211> 738 <212> DNA <213> Arabidopsis thaliana <400> 159 atggggtcaa agacggagat gatggagaga gacgcaatgg ctacggtggc tccctatgcg 60 ccggtcactt accaccgccg tgctcgtgtt gacttggatg atagacttcc taaaccttat 120 atgccaagag cattgcaagc accagacaga gaacacccgt acggaactcc aggccataag 180 aattacggac ttagtgttct tcaacagcat gtctccttct tcgatatcga tgataatggc 240 atcatttacc cttgggagac ctactctgga ctgcgaatgc ttggtttcaa tatcattggg 300 tcgcttataa tagccgctgt tatcaacctg acccttagct atgccactct tccggggtgg 360 ttaccttcac ctttcttccc tatatacata cacaacatac acaagtcaaa gcatggaagt 420 gattcaaaaa catatgacaa tgaaggaagg tttatgccgg tgaatcttga gttgatattt 480 agcaaatatg cgaaaacctt gccagacaag ttgagtcttg gagaactatg ggagatgaca 540 gaaggaaacc gtgacgcttg ggacattttt ggatggatcg caggcaaaat agagtgggga 600 ctgttgtact tgctagcaag ggatgaagaa gggtttttgt caaaagaagc tattaggcgg 660 tgtttcgatg gaagcttgtt cgagtactgt gccaaaatct acgctggtat cagtgaagac 720 aagacagcat actactaa 738 <210> 160 <211> 1047 <212> DNA <213 > Sesamum indicum 1345587 85/100 <400> 160 atggatctaa tccacacttt cctcaactta atagctcccc ctttcacctt cttcttcctt 60 ctctttttct tgccaccctt ccagattttc aagttcttcc tttcaatctt gggcaccctt 120 ttcagcgagg atgtcgctgg aaaagtcgtc gtcatcaccg gcgcctcctc cggcatcggc 180 gaaagtcttg cttacgagta tgctaagaga ggggcgtgct tggtgcttgc tgcaagaagg 240 gaaaggagtc ttcaagaagt ggccgaaagg gcgcgcgatt tggggtcgcc ggacgtcgtg 300 gtggtccggg ccgatgtttc gaaggcggag gactgcagga aggttgttga tcagactatg 360 aatcgctttg gaagattgga tcacctggtc aataacgctg gaattatgtc agtttcaatg 420 ctggaagaag ttgaagatat tactggttac agagaaacta tggatatcaa cttctggggc 480 tatgtgtata tgacccgatt tgccgcccca taccttagga atagcagagg ccgaattgtt 540 gtactttctt catccagttc ttggatgcct actccgagga tgagttttta caatgcaagc 600 aaagcggcga tttcacaatt ttttgagaca ctgcgggtgg aattcggccc cgatataggc 660 ataacccttg tgactccagg attcatagaa tctgaactta cccaaggcaa attctacaat 720 gctggcgaac gtgtaattga tcaggacatg agagatgtac aagtgagcac gactccaatc 780 ctgagggtgg aaagtgcggc aaggtcaatc gtgaggagcg cgatccgtgg agaaagatac 840 gtgacagagc cggcctggtt tagggttact tattggtgga agctattctg ccctgaggtg 900 atggagtggg tatttagact gatgtacttg gccagcccgg gtgagccgga gaaggaaacg 960 tttggcaaga aggttttgga ttacacagga gtgaagtcct tgctttaccc ggaaaccgtg 1020 caagttccgg agcccaagaa tgattaa 1047 <210> 161 <211> 25
<212> PRT <213> Tobacco, pathogensis related protein (PR-S) signal sequence <400> 161
Met Asn Phe Leu Lys Ser Phe Pro Phe Tyr Ala Phe Leu Cys Phe Gly 15 10 15
Gin Tyr Phe Val Ala Val Thr His Ala 20 25 <210> 162 1345587 86/100 <211> 64 <212> PRT <213> Artificial Sequence <220> <223> Alpha factor leader seqence <400> 162
Ala Pro Val Asn Thr Thr Glu Asp Glu Thr Ala Gin Ala Glu Ala Val 1 5 10 15 工le Gly Tyr Ser Asp Leu Glu Gly Asp Phe Asp Val Ala Val Leu Pro 20 25 30
Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe lie Asx Thr Thr lie 35 40 45
Ala Ser lie Ala Ala Lys Glu Glu Gly Val Ser Leu Met Ala Lys Arg 50 55 60 <210> 163 <211> 63 <212> PRT <213> Artificial Sequence <220> <223> Alpha factor leader sequence <400> 163
Ala Pro Val Asn Thr Thr Glu Asp Glu Thr Ala Gin Ala Glu Ala Val 15 10 15 lie Gly Tyr Ser Asp Leu Glu Gly Asp Phe Asp Val Ala Val Leu Pro 20 25 30
Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe He Asx Thr Thr lie 35 40 45 1345587 87/100
Ala Ser lie Ala Ala Lys Glu Glu Gly Val Ser Met Ala Lys Arg 50 55 60 <210> 164 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Alpha factor leader sequence <400> 164
Gin Pro lie Asp Glu Asp Asn Asp Thr Ser Ser Met Ala Lys Arg 1 5 10 15 <210> 165 <211> 43 <212> PRT <213> Artificial Sequence <220> <223> Alpha factor leader sequence <400> 165
Gin Pro lie Asp Asp Thr Glu Ser Asn Thr Thr Ser Val Asn Leu Met 1 5 . 10 15
Ala Asp Asp Thr Glu Asp Arg Phe Ala Thr Asn Thr Thr Leu Ala Leu 20 25 30
Asp Val Val Asn Leu lie Ser Met Ala Lys Arg
35 40 <210> 166 <211> 43 <212> PRT <213> Artificial Sequence <220>1345587 88/100 <223> Alpha factor leader : sequence <400> 166 Gin Pro lie Asp Asp Thr Glu Ser Gin Thr Thr Ser Val Asn Leu Met 1 5 10 15 Ala Asp Asp Thr Glu Asp Arg Phe Ala Thr Gin Thr Thr Leu Ala Leu 20 25 30 Asp Val Val Asn Leu lie Ser Met Ala Lys Arg 35 40 <210> 167 <211> 43 <212> PRT <213> Artificial Sequence <220> <223> Alpha factor leader i sequence <400> 167 Gin Pro lie Asp Asp Thr Glu Ser Gin Thr Thr Ser Val Asn Leu Met 1 5 10 15 Ala Asp Asp Thr Glu Asp Arg Phe Ala Thr Gin Thr Thr Leu Ala Leu 20 25 30 Asp Val Val Asn Leu lie Ser Met Ala Ala Ala 35 40 <210> 168 <211> 43 <212> PRT <213> Artificial Sequence <220>1345587 89/100 <223> Alpha factor leader sequence <400> 168
Gin Pro lie Asp Asp Thr Glu Ser Asn Thr Thr Ser Val Asn Leu Met 15 10 15
Ala Asp Asp Thr Glu Asp Arg Phe Ala Thr Asn Thr Thr Leu Ala Leu 20 25 30
Asp Val Val Asn Leu lie Ser Met Ala Ala Ala 35 40 <210> 169 <211> 45 <212> PRT <213> Artificial Sequence
<220> <223> Alpha factor leader sequence <400> 169
Gin Pro lie Asp Asp Thr Glu Ser Asn Thr Thr Ser Val Asn Leu Met 1 5 10 15
Ala Asp Asp Thr Glu Asp Arg Phe Ala Thr Asn Thr Thr Leu Ala Gly 20 25 30
Gly Leu Asp Val Val Asn Leu lie Ser Met Ala Lys Arg 35 40 45 <210> 170 <211> 44 <212> PRT <213> Artificial Sequence <220> <223> Alpha factor leader sequence 1345587 90/100 <400> 170
Gin Pro lie Asp Asp Thr Glu Ser Gin Thr Thr Ser Val Asn Leu Met 15 10 15
Ala Asp Asp Thr Glu Ser Ala Phe Ala Thr Gin Thr Asn Ser Gly Gly 20 25 30
Leu Asp Val Val Gly Leu lie Ser Met Ala Lys Arg 35 40 <210> 171 <211> 44 <212> PRT <213> Artificial Sequence <220> <223> Alpha factor leader sequence <400> 171 Gin Pro lie Asp Asp Thr Glu Ser Gin 1 5
Thr Thr Ser Val Asn Leu Met 10 15
Ala Asp Asp Thr Glu Ser Ala Phe Ala Thr Gin Thr Asn Ser Gly Gly 20 25 30
Leu Asp Val Val Gly Leu lie Ser Met Ala Ala Ala 35 40 <210> 172 <211> 10 <212> PRT <213> Spacer peptide <400> 172
Glu Glu Ala Glu Ala Glu Ala Glu Pro Lys 15 10 1345587 91/100 <210> 173 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Spacer peptide ^ <400> 173
Glu Glu Gly Glu Pro Lys 1 5 <210> 174 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Cleavage site <400> 174
Met Ala Glu lie Thr Arg lie Pro Leu Tyr Lys Gly Lys Ser Leu Arg 15 10 15
Lys Ala Leu Lys Glu His Gly Leu Leu Glu Asp Phe Leu Gin Lys Gin 20 25 30
Gin Tyr Gly lie Ser Ser Lys Phe 35 40 <210> 175 <211> 27 <212> DNA <213> Artificial Sequence <220> 1345587 92/100 <223> Primer <400> 175 gcatgctgac attgtgatga cacagtc <210> 176 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 176 aagcttgcat ttaaatactc gagactgtga gagtggtgcc ttg <210> 177 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 177 gaagaaggag agcctaagtt tgttaatcaa catctttgtg gatctcatct tgttgaggct ctctaccttg <210> 178 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer 561345587 93/100 <400> 178 ccttaggagt gtagaaaaat cctctttctc cacacacaag gtagagagcc tcaaca <210> 179
<211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 179 21 ctaaggctgc taagggaatt g <210> 180 <211> 83
<212> DNA <213> Artificial Sequence <220> <223> Primer <400> 180 60 83 aagcttcagt tgcaatagtt ctccaattgg taaagtgagc aaatagaagt gcaacattgt tcaacaattc ccttagcagc ctt <210> 181 <211> 30
<212> DNA <213> Artificial Sequence <220> <223> Primer <400> 181 ctcgagtcaa ccaattgatg acactgaatc 30 1345587 94/100 <210> 182 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 182 aagcttcaaa gttcatcctt gttgcaatag ttctccaatt <210> 183 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 1B2 aagcttcagt tgcaatagtt c <210> 184 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 184 gcatgcccaa ccaattgatg acactg <210> 185 <211> 34 1345587 95/100 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 185 gcatgcatgc ctttgttaat caacatcttt gtgg <210> 186 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 186 acattgttca acaattcctc tctttcttct agtcttagga gtgtagaaaa <210> 187 <211> 29 ' <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 187 gcataagctt caaagctcat cctttgagc <210> 188 <211> 387 <212> DNA <213> Artificial Sequence 1345587
96/100 <220> <223> Insulin fusion protein nucleic acid sequence <400> 188 atgaacttcc ttaagtcttt ccctttctac gctttccttt gtttcggtca atacttcgtt 60 gctgttacgc atgcccaacc aattgatgac actgaatccc agaccacgtc agtgaacctc 120 atggccgatg atactgagag cgcgtttgct acacaaacaa attcgggagg tcttgacgtt 180 gtcggattga tctccatggc taagagagaa gaaggagagc ctaagtttgt taatcaacat 240 ctttgtggat ctcatcttgt tgaggctctc taccttgtgt gtggagaaag aggatttttc 300 tacactccta aggctgctaa gggaattgtt gaacaatgtt gcacttctat ttgctcactt 360 taccaattgg agaactattg caactga 387
<210> 189
<211> 128 <212> PRT <213> Artificial Sequence <220> <223> Insulin factor protein <400> 189
Met Asn Phe Leu Lys Ser Phe Pro Phe Tyr Ala Phe Leu Cys Phe Gly 15 10 15
Gin Tyr Phe Val Ala Val Thr His Ala Gin Pro lie Asp Asp Thr Glu 20 25 30
Ser Gin Thr Thr Ser Val Asn Leu Met Ala Asp Asp Thr Glu Ser Ala 35 40 45
Phe Ala Thr Gin Thr Asn Ser Gly Gly Leu Asp Val Val Gly Leu lie 50 55 60
Ser Met Ala Lys Arg Glu Glu Gly Glu Pro Lys Phe Val Asn Gin His 65 70 75 80
Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu 85 90 95 1345587 97/100
Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys Gly lie Val Glu Gin 100 105 110
Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 115 120 125 <210> 190 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 190 ttcgtgaacc aacacttg <210> 191 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 191 aagctttcag ttacagtagt <210> 192 <211> 17 <212> DNA <213> Artificial Sequence <220> <223>
Primer 1345587 98/100 <400> 192 gcatgcatgt gttgagc <210> 193 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 193 ggtagtgtgc tggcca <210> 194 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 194 ggtggccagc acactacctt cgtgaaccaa cacttgtg <210> 195 <211> 1020 <212> DNA <213> Artificial Sequence <220> <223> Insulin fusion protein nucleic acid sequence <400> 195 cagctagagg aacccatcac gatatcatcg gcagagacca gtacccgatg atgggccgag accgagacca gtaccagatg tccggacgag gatctgacta ctccaagtct 1345587 99/100 aggcagattg agccttaccc ttcagcccaa tcctctggag cacatttatc agctttggat agggaacatt atatcatcta acgggagagc aaagctcagg catgaccgtg ggatctcatc cctaagacca cctggagcag gttgaacaat ctaaagctgc ttgttggaac tccttgtccc ggtttggcat atcttacttc caattttttt tggttaacta tataggtaaa acccacaggg atctgaaaga accgtactcg tcgttgaagc gaagggaagc gatctttgca gttgcacttc aactgctgtc tgtcatagct ggctctcatc tgccgctata ataattttgt ggtagaataa aatacgaaat atgcttggta atcagacaag cagagctcag tggtggccag tctctacttg tgaggacttg acctctcgct aatctgttct acagctggtg ttgactgttg acagttgcac accgttttct gcaatatgtg caaatgtaac ttgacctagc tgatacctat ttggacagtg tactacggac cacactacct gtttgtggtg caggtgggac ttggaaggtt ttgtatcagt gttccctcct caacacctct tcctcatcac cttggattta catgcatgtg aataagaaat tagcttgaat tgattgtgaa caaggatgaa agcaacatac tcgtgaacca agagaggatt aagttgagtt ctttgcagaa tggagaacta tgttctctcc gctcgttatc cggttttctt caagtaagca ttgagccagt tgcaaattct gtgtctgtgt taggtacgca gttgggaagc tggtggggaa acacttgtgt cttctacact gggtggaggt gagaggaatc ctgtaactga 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 <210> 196 <211> 257 *
<212> PRT <213> Artificial Sequence <220> <223> Insulin fusion protein <400> 196
Met Ala Asp Thr Ala Arg Gly Thr His His Asp lie lie Gly Arg Asp 15 10 15
Gin Tyr Pro Met Met Gly Arg Asp Arg Asp Gin Tyr Gin Met Ser Gly 20 25 30
Arg Gly Ser Asp Tyr Ser Lys Ser Arg Gin lie Ala Lys Ala Ala Thr 35 40 45 1345587 j*. 100/100
Ala Val Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Ser Leu Thr Leu 50 55 60
Val Gly Thr Val lie Ala Leu Thr Val Ala Thr Pro Leu Leu Val lie 65 70 75 80
Phe Ser Pro lie Leu Val Pro Ala Leu lie Thr Val Ala Leu Leu lie 85 90 95
Thr Gly Phe Leu Ser Ser Gly Gly Phe Gly lie Ala Ala lie Thr Val 100 105 110
Phe Ser Trp lie Tyr Ala Thr Gly Glu His Pro Gin Gly Ser Asp Lys 115 120 125
Leu Asp Ser Ala Arg Met Lys Leu Gly Ser Lys Ala Gin Asp Leu Lys 130 135 140
Asp Arg Ala Gin Tyr Tyr Gly Gin Gin His Thr Gly Gly Glu His Asp 145 150 155 160
Arg Asp Arg Thr Arg Gly Gly Gin His Thr Thr Phe Val Asn Gin His 165 170 175
Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu 180 185 190
Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu 195 200 205
Gin Val Gly Gin Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu 210 215 220
Gin Pro Leu Ala Leu Glu Gly Ser Leu Gin Lys Arg Gly lie Val Glu 225 230 235 240
Gin Cys Cys Thr Ser lie Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys 245 250 255
Asn

Claims (1)

  1. (<P年3月d!修(吏)正本
    申請專利範圍 1 · 叫5587 公告本 一種胰島素在植物種籽内之表現方法, 1供嵌合核酸構造物,在轉錄之5,至3,方向包 括下列’做為操作上連結成份: (1)能夠控制在植物種籽細胞内表現之種籽優拳 啟動子;和 ’ (i i )編碼胰島素多肽之核酸序列; (1 1 1 )編碼在讀碼框架内融合於編碼胰島素之核 酸序列的穩定蛋白質之核酸序列;
    (i v ) ”爲碼此夠保持騰島素多肽於内質網(e R )或 ER衍生儲存胞器内的多肽之核酸序列; (b) 把嵌合核酸構造物引進入種籽細胞内;以及 (c) 令植物細胞成長為成熟植物,能夠結籽,其中 種杆表現姨島素’胰島素多肽累積在植物細胞 内的内質網(ER)或ER衍生儲存胞器内,又其中 存在於種軒内總種籽蛋白質之至少〇1%為胰島 素。 2. 如申請專利範圍第1項之方法,其中把胰島素多肽 呆持於ER内之該多肽,係選自包含KDEL、HDEL、DDEL、 ADEL和SDEL群組。 3. 如申請專利範圍第i項之方法,其中該胰島素多肽 另包括編碼訊號狀之核酸序列。 4. 如申請專利範圍第3項之方法,其中該訊號肽係菸 草病原相關之蛋白質(PR-S)訊號序列。 5. 如申請專利範圍第3項之方法,其中該訊號肽係序
    第1頁 1345587 修正 月 曰 案號 931174W 六、申請專利範圍 列編號161。 6. 如申請專利範圍第1項之方法,其中該ER衍生儲存 胞器係油體。 7. 如申請專利範圍第丨項之方法其中把胰島素多肽 :保持於ER衍生儲存胞器内之該多肽係油體蛋白質。、 8. 如申清專利範圍第7項之方法其中該油體蛋白質 係選自包含油質蛋白、鈣油質蛋白和固醇蛋白群組。 H二tI ί專利範圍第7項之方法’其中該油體蛋白質 係選自包含序列編號156、157群組。 八10.如申請專利範圍第i項之方法其中該嵌合核酸另 編碼胰島素之ϋ 核酸序列’係在讀碼框架内融合於 其中該訊號肽係 其中該訊號肽係 其中編碼該穩定蛋 11. 如申請專利範圍第1〇項之方法 菸草病原相關蛋白質(PR_S)訊號序列。 12. 如申請專利範圍第n項之 序列編號1 6 1。 1 3 .如申請專利範圍第〗項 白之該核酸,在種籽收 、 法’具中編碼該穩定蛋 體相連結。 籽收叫和研磨時’可使胰島素多狀與油 14. 如申請專利範圍第丨 碼對油體具有特異性之s μ 1 万法,其中該穩定蛋白編 率鏈抗體。 15. 如申請專利範圍第丨項之 架内融合於編碼胰島素的核 ’其中編媽在讀碼框 ’係選自包含單鏈抗體^ f列之穩定蛋白的核酸序列 霍亂毒素B亞單位群組。 1345587
    ,其中編碼胰島素的 豬膝島素和牛胰島素 ’其中編碼騰島素之 18.如申請專利範圍第1項之方法 核酸序列,係選自包含人體胰島素、 核酸序列。 19.如申凊專利範圍第1項之方法 核酸係微型胰島素。 20. 如申請專利範圍第i項之方法,其中編碼胰島素之 核酸,係最適於植物密碼子使用。 21. —種植物種籽獲得方法,包括: (a) 提供嵌合核酸構造物’在轉錄之5’至3,方向包 括下列’做為操作上聯結成份: (1 )能夠控制在植物種籽細胞内表現之種籽優 勢啟動子; (1 i )編碼胰島素多肽之核酸序列; (1 1 1 )編碼在讀碼框架内融合於編碼胰島素之 核酸序列的穩定蛋白質之核酸序列; (1 v )編碼能夠保持胰島素多肽於内質網(ER )或 ER衍生儲存胞器内的多肽之核酸序列; (b) 把嵌合核酸構造物引進入種籽細胞内; (c )令植物細胞成長為能夠結軒之成熟植物;以及 (d)從該植物採收種籽’其中種籽表現胰島素,胰
    1345587
    島素多狀累積在植物胎& u 抖4紗六的《 物、屈胞内的内質網(ER)或ER 何生儲存胞益内,又盆φ左 定人讲 · 八甲存在於種籽内總種籽 蛋白質之至少0. 1%為胰島素。 22. —種核酸序列’編碼連結於一核酸序列之胰島 素,其中該核酸序列包括能夠控制在植物種籽細胞内表現 之種籽優勢啟動子’其中該種籽優勢啟動子連結於編碼在 讀碼框架内融合於編碼胰島素的核酸序列之穩定蛋白質的 核酸,以及連結於編碼能夠保持胰島素多肽於内質網(ER) 或ER衍生儲存胞器内的多肽之核酸序列。 2 3 .如申請專利範圍第2 2項之核酸序列,其中該種軒 優勢啟動子係菜豆蛋白啟動子。 ^ 24. —種根據如申請專利範圍第1項之方法所得到之植 物種籽之使用,其係用於獲得實質上純的胰島素。
    第4頁 1345587
    圖 99年10月14曰修正 1 atgaacttccttaagtctttccctttctacgctttcctttgtttcggtcaatacttcgtt 60 1 MNFLKSFPFYAFLCFGQYFV 20 61 gctgttacgcatgctgacattgtgatgacacagtctccatcctccctggctatgtcagtg 120 21 AVTHADIVMTQSPSSLAMSV 40 121 ggacagcgggtcactatgcgctgcaagtccagtcagagccttttaaaaagtaccaatcaa 180 41 GQRVTMRCKSSQSLLKSTNQ 60 181 aagaactatttggcctggtaccagcagaaaccaggacagtctcctaaacttctggtatac 240 61 KNYLAWYQQKPGQSPKLLVY 80 241 tttgcatccactagggaatctggggtccctgatcgcttcataggcagtggatctgggaca 300 81 FASTRESGVPDRFIGSGSGT 100
    301 gatttcactcttaccatcagcagtgtgcaggctgaagacctggcagattacttctgtcag 360 101 DFTLTISSVQAEDLADYFCQ 120 361 caacattataacactcctcccacgttcggtgctgggaccaagctggagcttaagcggtct 420 121 QHYNTPPTFGAGTKLELKRS 140 421 ccgaacggtgcttctcatagcggttctgcaccaggcactagctctgcatctggatctcag 480 141 PNGASHSGSAPGTSSASGSQ 160 481 gtgcacctgcagcagtctggagctgagctgatgaagcctggggcctcaatgaagatatcc 540 161 VHLQQSGAELMKPGASMKIS 180 541 tgcaaggctactggctacacattcagtagctactggatagagtgggtaaagcagaggcct 600 181 CKATGYTFSSYWIEWVKQRP 200 601 ggacatggccttgagtggattggagagattttacctggcagtggtagtactacctacaat 660 201 GHGLEWIGEILPGSGSTTYN 220 661 gagaagttcaagggcaaggccacattcactgcagatacatcctccaacacagcctacatg 720 221 EKFKGKATFTADTSSNTAYM 240
    721 caactcagcagcctgacatctgaggactctgccgtctattactgtgcaagattggatgtt 780 241 QLSSLTSEDSAVYYCARLDV 260 781 gactcctggggccaaggcaccactctcacagtctcgagtcaaccaattgatgacactgaa 840 261 DSWGQGTTLTVSSQPIDDTE 280 841 tcccagaccacgtcagtgaacctcatggccgatgatactgagagcgcgtttgctacacaa 900 281 SQTTSVNLMADDTESAFATQ 300 901 acaaattcgggaggtcttgacgttgtcggattgatctccatggctaagagagaagaagga 960 301 TNSGGLDVVGLISMAKREEG 320 961 gagcctaagtttgttaatcaacatctttgtggatctcatcttgttgaggctctctacctt 1020 321 EPKFVNQHLCGSHLVEALYL 340 1021 gtgtgtggagaaagaggatttttctacactcctaaggctgctaagggaattgttgaacaa 1080 341 VCGERGFFYTPKAAKGIVEQ 360 1081 tgttgcacttctatttgctcactttaccaattggagaactattgcaacaaggatgaactt 1040 361 CCTSICSLYQLENYCNKDEL380 1041 tga 1345587 量4A
    K V» M Wt 4404-2 4404-17 4404-20 4405-4 hIN hProlN Βι
    圖4B
    M Wt 4404-2 4404-17 4404-20 4405-4 hIN hProlN
    1345587 量1 4C
    -錐
    M Wt 4404-2 4404-17 4404-20 4405-4 hIN hProlN 圖4D
    M Wt 4404-2 4404-17 4404-20 4405-4 hIN hProlN
    1345587 圖·4Ε Ε,
    圖4F >
    Μ Wt 4414-9 4414-20 Wt 4414-9 4414-20 ^345587
    J3
    〆 〆
    2C 3C 60 * oa5 4
TW093117421A 2003-06-17 2004-06-17 Methods for the production of insulin in plants TWI345587B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US47881803P 2003-06-17 2003-06-17
US54953904P 2004-03-04 2004-03-04

Publications (2)

Publication Number Publication Date
TW200510529A TW200510529A (en) 2005-03-16
TWI345587B true TWI345587B (en) 2011-07-21

Family

ID=33555509

Family Applications (1)

Application Number Title Priority Date Filing Date
TW093117421A TWI345587B (en) 2003-06-17 2004-06-17 Methods for the production of insulin in plants

Country Status (24)

Country Link
US (2) US7547821B2 (zh)
EP (2) EP1633876B1 (zh)
JP (2) JP4864701B2 (zh)
KR (1) KR101216762B1 (zh)
CN (1) CN1836047B (zh)
AR (1) AR044803A1 (zh)
AT (1) ATE405660T1 (zh)
AU (1) AU2004247762B2 (zh)
BR (1) BRPI0411479A (zh)
CA (1) CA2528741A1 (zh)
CY (1) CY1108477T1 (zh)
DE (1) DE602004015980D1 (zh)
DK (1) DK1633876T3 (zh)
EA (1) EA014887B1 (zh)
ES (1) ES2313018T3 (zh)
HK (1) HK1088037A1 (zh)
IL (1) IL172469A (zh)
MX (1) MXPA05013723A (zh)
NO (1) NO20055885L (zh)
NZ (1) NZ544522A (zh)
PL (1) PL1633876T3 (zh)
PT (1) PT1633876E (zh)
TW (1) TWI345587B (zh)
WO (1) WO2004111244A2 (zh)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7393998B2 (en) 2002-03-08 2008-07-01 Prodigene, Inc. Commercial production of insulin and insulin-like proteins in plants
US9453251B2 (en) 2002-10-08 2016-09-27 Pfenex Inc. Expression of mammalian proteins in Pseudomonas fluorescens
WO2004044206A1 (en) * 2002-11-12 2004-05-27 Ckd Bio Corp. Plasmids expressing human insulin and the preparation method for human insuling thereby
US20040173547A1 (en) * 2003-03-06 2004-09-09 Roth Michael Carl Bolt on attachment to facilitate hanging of pneumatic tool
AR044803A1 (es) * 2003-06-17 2005-10-05 Sembiosys Genetics Inc Metodos para la produccion de insulina
CA2528845A1 (en) * 2003-06-20 2004-12-29 Sembiosys Genetics Inc. Modified oleosins
TW200526778A (en) * 2003-11-14 2005-08-16 Sembiosys Genetics Inc Methods for the production of apolipoproteins in transgenic plants
CA2574953A1 (en) 2004-07-26 2006-02-09 Dow Global Technolgies Inc. Process for improved protein expression by strain engineering
CA2609367C (en) 2005-05-23 2014-08-19 Arcadia Biosciences, Inc. Safflower with elevated gamma-linolenic acid
EP2261364A3 (en) * 2005-05-27 2011-03-30 The University of Central Florida, Chloroplasts engineered to express pharmaceutical proteins
EP2189532A1 (en) * 2005-07-01 2010-05-26 Nestec S.A. Promoters from coffee
US8343914B2 (en) * 2006-01-06 2013-01-01 Case Western Reserve University Fibrillation resistant proteins
ATE497008T1 (de) 2006-08-31 2011-02-15 Monsanto Technology Llc Verfahren zur herstellung transgener pflanzen
WO2008043033A2 (en) 2006-10-04 2008-04-10 Case Western Reserve University Fibrillation-resistant insulin and insulin analogues
US9580719B2 (en) 2007-04-27 2017-02-28 Pfenex, Inc. Method for rapidly screening microbial hosts to identify certain strains with improved yield and/or quality in the expression of heterologous proteins
WO2008134461A2 (en) 2007-04-27 2008-11-06 Dow Global Technologies, Inc. Method for rapidly screening microbial hosts to identify certain strains with improved yield and/or quality in the expression of heterologous proteins
WO2009115469A1 (en) * 2008-03-18 2009-09-24 Novo Nordisk A/S Protease stabilized, acylated insulin analogues
US8993516B2 (en) * 2008-04-14 2015-03-31 Case Western Reserve University Meal-time insulin analogues of enhanced stability
WO2009132129A2 (en) * 2008-04-22 2009-10-29 Case Western Reserve University Isoform-specific insulin analogues
PL219335B1 (pl) * 2008-07-04 2015-04-30 Inst Biotechnologii I Antybiotyków Pochodna insuliny lub jej farmaceutycznie dopuszczalna sól, jej zastosowanie oraz zawierająca ją kompozycja farmaceutyczna
KR20120129875A (ko) 2008-07-31 2012-11-28 케이스 웨스턴 리저브 유니버시티 염소화 아미노산을 갖는 인슐린 유사체
US9200053B2 (en) 2008-07-31 2015-12-01 Case Western Reserve University Insulin analogues containing penta-fluoro-Phenylalanine at position B24
CN101736029B (zh) * 2008-11-21 2013-01-02 复旦大学 一种利用植物油体蛋白表达系统生产人胰岛素样生长因子-i的方法
US8399407B2 (en) * 2009-09-17 2013-03-19 Case Western Reserve University Non-standard insulin analogues
MX2012006568A (es) 2009-12-11 2012-12-17 Univ Case Western Reserve Analogos de insulina con aminoacidos clorados.
CN102268451B (zh) * 2010-06-01 2014-03-12 安胜军 一种含有人胰岛素基因的表达载体及其构建方法与应用
WO2011158242A2 (en) 2010-06-16 2011-12-22 Futuragene Israel Ltd. Pest -resistant plants containing a combination of a spider toxin and a chitinase
US20130164288A1 (en) 2010-09-07 2013-06-27 Protalix Ltd. Readthrough acetylcholinesterase (ache-r) for treating or preventing parkinson's disease
US9006176B2 (en) * 2011-10-18 2015-04-14 AmideBio LLC Chemically and thermodynamically stable insulin analogues and improved methods for their production
US9352456B2 (en) 2011-10-26 2016-05-31 Black & Decker Inc. Power tool with force sensing electronic clutch
US9481721B2 (en) 2012-04-11 2016-11-01 Novo Nordisk A/S Insulin formulations
EP2986315A4 (en) 2013-04-17 2017-03-01 AmideBio LLC Chemically and thermodynamically stable insulin analogues and improved methods for their production
KR101625746B1 (ko) 2013-09-23 2016-05-31 순천대학교 산학협력단 프로미니인슐린 재조합 단백질이 발현된 형질전환 식물 및 이의 제조방법
JP6829928B2 (ja) 2014-10-06 2021-02-17 ケース ウェスタン リザーブ ユニバーシティCase Western Reserve University 二相性単鎖インスリン類似体
CN115154591B (zh) 2016-12-16 2023-04-14 诺和诺德股份有限公司 含胰岛素的药物组合物
KR102642178B1 (ko) * 2017-08-08 2024-02-29 중앙대학교 산학협력단 돌연변이에 의해, 혈중 반감기 및 공수병 바이러스 중화 효능이 증대된 공수병 바이러스 중화 항체
KR20200119237A (ko) * 2018-02-09 2020-10-19 지앙수 헨그루이 메디슨 컴퍼니 리미티드 인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자
CN114144426A (zh) * 2019-04-19 2022-03-04 印地安纳大学理事会 餐时或基础胰岛素类似物通过内部二硒桥的稳定化
CN115151273A (zh) * 2019-12-06 2022-10-04 美商玛丽莫里斯博士联合有限责任公司 用于治疗和预防1型糖尿病的方法和组合物
CA3174156A1 (en) * 2020-07-03 2022-01-06 Nachi GUPTA Modified insulin and glucokinase nucleic acids for treating diabetes
EP4190905A1 (en) 2021-12-01 2023-06-07 Core Biogenesis Method for the purification of recombinant proteins using oil body proteins

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3971856A (en) 1975-03-03 1976-07-27 Archer Daniels Midland Company Process for preparing soy protein concentrate
US6174724B1 (en) 1983-01-17 2001-01-16 Monsanto Company Chimeric genes suitable for expression in plant cells
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
US5504200A (en) 1983-04-15 1996-04-02 Mycogen Plant Science, Inc. Plant gene expression
DK58285D0 (da) 1984-05-30 1985-02-08 Novo Industri As Peptider samt fremstilling og anvendelse deraf
US5008241A (en) 1985-03-12 1991-04-16 Novo Nordisk A/S Novel insulin peptides
US4956282A (en) * 1985-07-29 1990-09-11 Calgene, Inc. Mammalian peptide expression in plant cells
DK175922B1 (da) 1985-08-07 2005-07-04 Monsanto Technology Llc Glyphosat-resistente planter
US5273894A (en) 1986-08-23 1993-12-28 Hoechst Aktiengesellschaft Phosphinothricin-resistance gene, and its use
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
EP0513849B1 (en) 1987-05-20 1998-08-19 Novartis AG Method of preparing transgenic Zea mays plants regenerated from protoplasts or protoplast-derived cells
DK336188D0 (da) 1988-06-20 1988-06-20 Nordisk Gentofte Propeptider
CA1341467C (en) 1988-07-29 2004-12-07 John C. Rogers Producing commercially valuable polypeptides with genetically transformed endosperm tissue
HUT56857A (en) 1988-12-23 1991-10-28 Novo Nordisk As Human insulin analogues
ES2199931T3 (es) 1989-03-24 2004-03-01 Syngenta Participations Ag Plantas transgenicas resistentes a enfermedades.
NL8901932A (nl) * 1989-07-26 1991-02-18 Mogen Int Produktie van heterologe eiwitten in planten of plantecellen.
US4940935A (en) 1989-08-28 1990-07-10 Ried Ashman Manufacturing Automatic SMD tester
US5202422A (en) * 1989-10-27 1993-04-13 The Scripps Research Institute Compositions containing plant-produced glycopolypeptide multimers, multimeric proteins and method of their use
US5959177A (en) * 1989-10-27 1999-09-28 The Scripps Research Institute Transgenic plants expressing assembled secretory antibodies
KR910014790A (ko) 1990-01-10 1991-08-31 한태희 랩탑 컴퓨터의 기능선택방법 및 인터페이스회로
WO1991013993A1 (en) * 1990-03-05 1991-09-19 The Upjohn Company Protein expression via seed specific regulatory sequences
US5650554A (en) 1991-02-22 1997-07-22 Sembiosys Genetics Inc. Oil-body proteins as carriers of high-value peptides in plants
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
JP3660354B2 (ja) 1992-04-02 2005-06-15 セムバイオシス ジェネティクス インコーポレイテッド 調節シグナルとしてのオイルボディタンパク質シスエレメント
ES2191028T3 (es) * 1992-12-28 2003-09-01 Stichting Scheikundig Onderzoe Metodo para obtener plantas transgenicas que presentan un patron de fructano modificado.
US5461031A (en) 1994-06-16 1995-10-24 Eli Lilly And Company Monomeric insulin analog formulations
US5474978A (en) 1994-06-16 1995-12-12 Eli Lilly And Company Insulin analog formulations
US5633437A (en) 1994-10-11 1997-05-27 Sandoz Ltd. Gene exhibiting resistance to acetolactate synthase inhibitor herbicides
US6040496A (en) 1995-06-30 2000-03-21 Novartis Finance Corporation Use of translationally altered RNA to confer resistance to maize dwarf mosaic virus and other monocotyledonous plant viruses
US5577474A (en) * 1995-11-29 1996-11-26 General Motors Corporation Torque estimation for engine speed control
CA2246242A1 (en) * 1996-02-08 1997-08-14 Institut Fur Pflanzengenetik Und Kulturpflanzenforschung Cassettes for the expression of storable proteins in plants
US5856452A (en) * 1996-12-16 1999-01-05 Sembiosys Genetics Inc. Oil bodies and associated proteins as affinity matrices
AU742794B2 (en) 1997-04-25 2002-01-10 Sembiosys Genetics Inc. Method for cleavage of fusion proteins
ATE346944T1 (de) * 1997-09-30 2006-12-15 Univ California Herstellung von proteinen in pflanzensamen
AU3868199A (en) * 1998-04-27 1999-11-16 Demegen, Inc. A method for increasing the protein content of plants
WO2001072959A2 (en) * 2000-03-01 2001-10-04 Auburn University Plastid transformation vectors for expressing human proteins in plants
US6429357B1 (en) 1999-05-14 2002-08-06 Dekalb Genetics Corp. Rice actin 2 promoter and intron and methods for use thereof
CN1376204B (zh) 1999-08-27 2010-05-05 塞姆柏奥希斯遗传学公司 亚麻种子特异性启动子
US6521738B2 (en) 1999-12-29 2003-02-18 Novo Nordisk A/S Method for making insulin precursors and insulin precursor analogs
CN1295129A (zh) * 2000-08-25 2001-05-16 林忠平 利用转基因番茄生产人胰岛素的方法
US20090197337A1 (en) * 2000-12-19 2009-08-06 Van Rooijen Gijs Methods for the production of multimeric proteins and related compositions
US6650554B2 (en) 2001-05-22 2003-11-18 Powersine Ltd. Power factor corrector with efficient ripple attenuator
US7393998B2 (en) * 2002-03-08 2008-07-01 Prodigene, Inc. Commercial production of insulin and insulin-like proteins in plants
CN1382734A (zh) * 2002-03-15 2002-12-04 林忠平 利用转基因生菜生产人胰岛素的方法
AR044803A1 (es) * 2003-06-17 2005-10-05 Sembiosys Genetics Inc Metodos para la produccion de insulina

Also Published As

Publication number Publication date
EP1633876B1 (en) 2008-08-20
WO2004111244A2 (en) 2004-12-23
AR044803A1 (es) 2005-10-05
US7547821B2 (en) 2009-06-16
NZ544522A (en) 2008-03-28
DK1633876T3 (da) 2008-12-08
CA2528741A1 (en) 2004-12-23
CY1108477T1 (el) 2014-04-09
CN1836047A (zh) 2006-09-20
JP2011200251A (ja) 2011-10-13
KR20060052705A (ko) 2006-05-19
NO20055885L (no) 2006-01-17
WO2004111244A3 (en) 2005-02-03
AU2004247762A1 (en) 2004-12-23
IL172469A0 (en) 2006-04-10
KR101216762B1 (ko) 2013-01-02
HK1088037A1 (en) 2006-10-27
TW200510529A (en) 2005-03-16
DE602004015980D1 (de) 2008-10-02
ES2313018T3 (es) 2009-03-01
AU2004247762B2 (en) 2010-05-27
PL1633876T3 (pl) 2009-01-30
EA200600050A1 (ru) 2006-06-30
JP2007523611A (ja) 2007-08-23
EP1959017A1 (en) 2008-08-20
IL172469A (en) 2011-08-31
US20050039235A1 (en) 2005-02-17
ATE405660T1 (de) 2008-09-15
EP1633876A2 (en) 2006-03-15
BRPI0411479A (pt) 2006-07-25
JP4864701B2 (ja) 2012-02-01
MXPA05013723A (es) 2006-03-13
US20090282583A1 (en) 2009-11-12
PT1633876E (pt) 2008-11-03
EA014887B1 (ru) 2011-02-28
CN1836047B (zh) 2010-12-22

Similar Documents

Publication Publication Date Title
TWI345587B (en) Methods for the production of insulin in plants
EP1523558B1 (en) Production of peptides and proteins by accumulation in plant endoplasmic reticulum-derived protein bodies
EP0871749A1 (en) Oil body proteins as carriers of high value proteins
CA2544239A1 (en) Methods for the production of apolipoproteins in transgenic plants
US20080104725A1 (en) Methods For The Modulation of Oleosin Expression In Plants
US20070006343A1 (en) Modified oleosins

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees