CN111065740A

CN111065740A - 2-o-硫酸化酶突变体和3-o-硫酸化酶突变体及其使用方法

Info

Publication number: CN111065740A
Application number: CN201880057336.8A
Authority: CN
Inventors: 辻千寻; 清水朋子; 田上宇乃; 三原康博; 杉木正之; 中野祥吾; 本山智晴; 伊藤创平
Original assignee: Ajinomoto Co Inc
Current assignee: Ajinomoto Co Inc
Priority date: 2017-09-05
Filing date: 2018-09-05
Publication date: 2020-04-24
Anticipated expiration: 2038-09-05
Also published as: US20200181588A1; WO2019050051A1; US20230105158A1; JP2020532278A; CN117417912A; EP3679147B1; JP7456466B2; US11851688B2; EP4050036A1; EP3679147C0; JP7200948B2; EP3679147A1; JP2022169789A; CN111065740B

Abstract

本发明提供了表现出高活性的2‑OST突变体。具体地，本发明提供了2‑O‑硫酸化酶突变体，其在以下的任何一种氨基酸序列中具有由碱性氨基酸残基对位置321处的亮氨酸残基的取代：(a)SEQ ID NO:2的氨基酸序列；(b)氨基酸序列，其在SEQ ID NO:2的氨基酸序列中包含一个或几个氨基酸取代、缺失、插入或添加；或(c)氨基酸序列，其与SEQ ID NO:2的氨基酸序列具有90％或更多的同一性；或(d)氨基酸序列，其由SEQ ID NO:2的氨基酸序列中位置69至356处的氨基酸残基组成；(e)氨基酸序列，其在由SEQ ID NO:2的氨基酸序列中位置69至356处的氨基酸残基组成的氨基酸序列中包含一个或几个氨基酸取代、缺失、插入或添加；或(f)氨基酸序列，其与由SEQ ID NO:2的氨基酸序列中位置69至356处的氨基酸残基组成的氨基酸序列具有90％或更多的同一性；并且具有2‑O‑硫酸转移活性。

Description

2-O-硫酸化酶突变体和3-O-硫酸化酶突变体及其使用方法

技术领域

本发明涉及2-O-硫酸化酶突变体和3-O-硫酸化酶突变体及其使用方法。

背景技术

肝素是一种硫酸乙酰肝素并且是具有抗凝血活性的化合物。动物来源的肝素在质量控制方面存在问题。并且已经研究了质量受控的非动物来源肝素的制造开发。作为生产非动物来源的肝素的方法，例如有通过对使用微生物生产的肝素前体(heparosan)进行诸如硫酸化和异构化等的反应来生产肝素的方法(参见专利文献1和2，以及非专利文献1至3)。

已知肝素前体是制造肝素的优选原料。肝素前体是由β-D-葡糖醛酸(GlcA)残基和N-乙酰-α-D-葡糖胺(GlcNAc)残基组成的重复的二糖单元[→4)-β-D-GlcA-(1→4)-α-D-GlcNAc-(1→]构成的多糖。

作为从肝素前体生产肝素的方法，已知存在需要一系列相互可互换的反应的方法，所述反应包括(1)α-D-葡糖胺残基的N-去乙酰化，(2)解聚，(3)α-D-葡糖胺残基的N-硫酸化，(4)己糖醛酸残基的C5-差向异构化(即β-D-葡糖醛酸残基异构化为α-L-艾杜糖醛酸残基)，(5)己糖醛酸残基(优选α-L-艾杜糖醛酸残基)的2-O-硫酸化，(6)α-D-葡糖胺残基的6-O-硫酸化，和(7)α-D-葡糖胺残基的3-O-硫酸化(参见专利文献1和3至5)。

在这些反应中，关于催化2-O-硫酸化反应的酶(2-OST)，报道了一些发现。例如，在使用鸡来源的2-OST进行的分析中，据报道三聚体是活性形式；纯化的酶中存在聚集的聚合物(非三聚体)；并且位置332处缬氨酸的突变降低了三聚体比率(激活物率)(非专利文献4)。但是，关于2-OST，既没有报道三聚体比率的改善，也没有报道其活性由此得到改善的突变体。

另外，关于催化3-O-硫酸化反应的酶(3-OST)，也报道了一些发现。例如，关于3-OST-1作为小鼠来源的3-OST的同等型，报道了晶体结构(非专利文献5)、E90Q突变体和R276A突变体(非专利文献6)，以及各种突变体，如E76A突变体、E76Q突变体、K123A突变体、Q163A突变体、H271突变体等(非专利文献7)。然而，关于3-OST，基本上没有报道具有改善的活性的突变体。例如，在非专利文献7中，仅记载了与野生型酶相比，仅H271A突变体的比活性略高，为109％。

现有技术参考文献

专利文献

专利文献1：美国专利号8,227,449

专利文献2：美国专利申请公开号2012/0322114

专利文献3：WO 2017/115674

专利文献4：WO 2017/115675

专利文献5：美国专利申请公开号2012/0322114

非专利文献

非专利文献1：Lindahl U,et al.,(2005)J Med Chem,48(2):349-352

非专利文献2：Zhang Z.,et al.,(2008)Journal of the American ChemicalSociety,130(39):12998-13007

非专利文献3：Chen J,et al.,(2005)J Biol Chem.,280(52):42817-25

非专利文献4：Bethea HN,et al.,(2008)Proc Natl Acad Sci USA,105(48):18724-9

非专利文献5：Moon,et al.,(2012)Proc Natl Acad Sci USA,109(14):5265-70

非专利文献6：Munoz,et al.,(2006)Biochemistry,45:5122-28

非专利文献7：Edavettal,et al.,(2004)J BIOL CHEM.,279(24):25789-97

发明概述

本发明要解决的问题

本发明的第一个目的是提供表现出高活性的2-OST突变体，以及使用2-OST突变体进行2-O-硫酸化的方法。

本发明的第二个目的是提供表现出高活性的3-OST突变体，以及使用3-OST突变体进行3-O-硫酸化的方法。

本发明的第三个目的是提供利用上述硫酸化方法生产硫酸乙酰肝素如肝素的方法。

解决问题的手段

作为广泛和深入研究的结果，本发明人发现，由于三聚体比率的改善，具有由碱性氨基酸残基对位置321处的亮氨酸残基的取代的2-OST突变体表现出高活性。本发明人还发现，具有由特定氨基酸残基对位置77、位置125或位置164处的氨基酸残基的取代的3-OST-1突变体表现出高活性。结果，本发明人成功地提供了2-O-和3-O-硫酸化的有效方法，以及利用此类硫酸化方法生产硫酸乙酰肝素的方法，从而完成了本发明。

具体而言，本发明如下。

[1]2-O-硫酸化酶突变体，其在以下的任何一种氨基酸序列中具有由碱性氨基酸残基对位置321处的亮氨酸残基的取代：

(a)SEQ ID NO:2的氨基酸序列；

(b)氨基酸序列，其在SEQ ID NO:2的氨基酸序列中包含一个或几个氨基酸取代、缺失、插入或添加；或

(c)氨基酸序列，其与SEQ ID NO:2的氨基酸序列具有90％或更多的同一性；或

(d)氨基酸序列，其由SEQ ID NO:2的氨基酸序列中位置69至356处的氨基酸残基组成；

(e)氨基酸序列，其在由SEQ ID NO:2的氨基酸序列中位置69至356处的氨基酸残基组成的氨基酸序列中包含一个或几个氨基酸取代、缺失、插入或添加；或

(f)氨基酸序列，其与由SEQ ID NO:2的氨基酸序列中位置69至356处的氨基酸残基组成的氨基酸序列具有90％或更多的同一性；并且

具有2-O-硫酸转移活性。

[2][1]的2-O-硫酸化酶突变体，其中所述碱性氨基酸残基是精氨酸残基或赖氨酸残基。

[3]生产己糖醛酸残基的2位处的羟基被硫酸化的经修饰的肝素前体(heparosan)化合物的方法，所述方法包括在存在2-O-硫酸化酶突变体的情况下将肝素前体化合物转化为己糖醛酸残基的2位处的羟基被硫酸化的经修饰的肝素前体化合物，

其中所述2-O-硫酸化酶突变体是在以下的任何一种氨基酸序列中具有由碱性氨基酸残基对位置321处的亮氨酸残基的取代的2-O-硫酸化酶突变体：

(a)SEQ ID NO:2的氨基酸序列；

具有2-O-硫酸转移活性。

[4][3]的方法，其中所述肝素前体化合物是N-硫酸化的肝素前体、N-硫酸化的差向异构化的肝素前体、N-硫酸化的解聚的肝素前体或N-硫酸化的差向异构化的解聚的肝素前体。

[5][3]或[4]的方法，其中在存在生产所述2-O-硫酸化酶突变体的经转化的微生物或其提取物的情况下，生产所述己糖醛酸残基的2位处的羟基被硫酸化的肝素前体化合物。

[6][5]的方法，其中所述经转化的微生物是属于埃希氏菌属的细菌。

[7][6]的方法，其中所述属于埃希氏菌属的细菌是大肠杆菌。

[8]3-O-硫酸化酶突变体，其中在以下的任何一种氨基酸序列中：

(a’)SEQ ID NO:8的氨基酸序列；

(b’)氨基酸序列，其在SEQ ID NO:8的氨基酸序列中包含一个或几个氨基酸取代、缺失、插入或添加；或

(c’)氨基酸序列，其与SEQ ID NO:8的氨基酸序列具有90％或更多的同一性；或

(d’)氨基酸序列，其由SEQ ID NO:8的氨基酸序列中位置48至311处的氨基酸残基组成；

(e’)氨基酸序列，其在由SEQ ID NO:8的氨基酸序列中位置48至311处的氨基酸残基组成的氨基酸序列中包含一个或几个氨基酸取代、缺失、插入或添加；或

(f’)氨基酸序列，其与由SEQ ID NO:8的氨基酸序列中位置48至311处的氨基酸残基组成的氨基酸序列具有90％或更多的同一性；

(i)位置77处的甲硫氨酸残基由赖氨酸残基取代；

(ii)位置96处的色氨酸残基由苯丙氨酸残基取代；

(iii)位置125处的脯氨酸残基由丙氨酸残基取代；

(iv)位置164处的缬氨酸残基由异亮氨酸残基取代；

(v)位置167处的天冬酰胺残基由组氨酸残基取代；

(vi)位置171处的赖氨酸残基由谷氨酰胺残基取代；或

(vii)位置259处的酪氨酸残基由苯丙氨酸残基取代；并且

其中所述3-O-硫酸化酶突变体具有3-O-硫酸转移活性。

[9]生产α-D-葡糖胺残基的3位处的羟基被硫酸化的经修饰的肝素前体化合物的方法，所述方法包括在存在3-O-硫酸化酶突变体的情况下将肝素前体化合物转化为α-D-葡糖胺残基的3位处的羟基被硫酸化的经修饰的肝素前体化合物，

其中所述3-O-硫酸化酶突变体是3-O-硫酸化酶突变体，其中在以下的任何一种氨基酸序列中：

(a’)SEQ ID NO:8的氨基酸序列；

(i)位置77处的甲硫氨酸残基由赖氨酸残基取代；

(ii)位置96处的色氨酸残基由苯丙氨酸残基取代；

(iii)位置125处的脯氨酸残基由丙氨酸残基取代；

(iv)位置164处的缬氨酸残基由异亮氨酸残基取代；

(v)位置167处的天冬酰胺残基由组氨酸残基取代；

(vi)位置171处的赖氨酸残基由谷氨酰胺残基取代；或

(vii)位置259处的酪氨酸残基由苯丙氨酸残基取代；并且

其中所述3-O-硫酸化酶突变体具有3-O-硫酸转移活性。

[10][9]的方法，其中所述肝素前体化合物是N-硫酸化的6-O-硫酸化的肝素前体、N-硫酸化的6-O-硫酸化的差向异构化的肝素前体、N-硫酸化的2-O-硫酸化的6-O-硫酸化的肝素前体、N-硫酸化的2-O-硫酸化的6-O-硫酸化的差向异构化的解聚的肝素前体、N-硫酸化的6-O-硫酸化的解聚的肝素前体、N-硫酸化的6-O-硫酸化的差向异构化的解聚的肝素前体、N-硫酸化的2-O-硫酸化的6-O-硫酸化的解聚的肝素前体或N-硫酸化的2-O-硫酸化的6-O-硫酸化的差向异构化的解聚的肝素前体。

[11][9]或[10]的方法，其中在存在生产所述3-O-硫酸化酶突变体的经转化的微生物或其提取物的情况下，生产所述α-D-葡糖胺残基的3位处的羟基被硫酸化的经修饰的肝素前体化合物。

[12][11]的方法，其中所述经转化的微生物是属于埃希氏菌属的细菌。

[13][12]的方法，其中所述属于埃希氏菌属的细菌是大肠杆菌。

[14]生产硫酸乙酰肝素的方法，其包括对肝素前体进行处理以生产硫酸乙酰肝素，所述处理包括(1)α-D-葡糖胺残基的N-去乙酰化，(2)解聚，(3)α-D-葡糖胺残基的N-硫酸化，(4)己糖醛酸残基的C5-差向异构化，(5)己糖醛酸残基的2-O-硫酸化，(6)α-D-葡糖胺残基的6-O-硫酸化，和(7)α-D-葡糖胺残基的3-O-硫酸化，

其中：

(I)在存在2-O-硫酸化酶突变体的情况下进行所述己糖醛酸残基的2-O-硫酸化，所述2-O-硫酸化酶突变体在以下的任何一种氨基酸序列中具有由碱性氨基酸残基对位置321处的亮氨酸残基的取代：

(a)SEQ ID NO:2的氨基酸序列；

具有2-O-硫酸转移活性；或者

(II)在存在3-O-硫酸化酶突变体的情况下进行所述α-D-葡糖胺残基的3-O-硫酸化，其中在以下的任何一种氨基酸序列中：

(a’)SEQ ID NO:8的氨基酸序列；

(i)位置77处的甲硫氨酸残基由赖氨酸残基取代；

(ii)位置96处的色氨酸残基由苯丙氨酸残基取代；

(iii)位置125处的脯氨酸残基由丙氨酸残基取代；

(iv)位置164处的缬氨酸残基由异亮氨酸残基取代；

(v)位置167处的天冬酰胺残基由组氨酸残基取代；

(vi)位置171处的赖氨酸残基由谷氨酰胺残基取代；或

(vii)位置259处的酪氨酸残基由苯丙氨酸残基取代；并且

其中所述3-O-硫酸化酶突变体具有3-O-硫酸转移活性。

发明效果

考虑到本发明的2-O-硫酸化酶突变体和3-O-硫酸化酶突变体表现出高活性的事实，它们可以适当地改编以用于生产目标物质的过程。

根据使用本发明的突变体的本发明的方法，可以有效地生产目标物质。

附图简述

图1是显示从肝素前体生产肝素的方法的优选实例的视图(例如，WO/2017/115674A，WO/2017/115675A)。肝素前体是由重复的二糖单元构成的多糖，该二糖单元由D-葡糖醛酸(GlcA)残基和N-乙酰-D-葡糖胺(GlcNAc)残基组成[→4)-β-D-GlcA-(1→4)-α-D-GlcNAc-(1→]。(1)α-D-葡糖胺残基的N-去乙酰化是使肝素前体中α-D-葡糖胺残基的N-乙酰基团经受N-去乙酰化(例如，部分N-去乙酰化)以产生氨基的反应。(2)解聚是分解肝素前体以产生具有较低分子量的肝素前体的反应。(3)α-D-葡糖胺残基的N-硫酸化是使肝素前体中α-D-葡糖胺残基的氨基硫酸化的反应。(4)己糖醛酸残基的C5-差向异构化是将肝素前体中的β-D-葡糖醛酸残基异构化为作为差向异构体的α-L-艾杜糖醛酸(IdoA)残基的反应。(5)己糖醛酸残基的2-O-硫酸化是将肝素前体中己糖醛酸残基(优选α-L-艾杜糖醛酸残基)的2位处的羟基硫酸化的反应。(6)α-D-葡糖胺残基的6-O-硫酸化是将肝素前体中α-D-葡糖胺残基的6位处的羟基硫酸化的反应。(7)α-D-葡糖胺残基的3-O-硫酸化是将肝素前体中α-D-葡糖胺残基的3位处的羟基硫酸化的反应。

发明详述

1.突变体

(1-1)2-O-硫酸化酶突变体：

本发明提供了2-O-硫酸化酶突变体，其在以下(a)至(f)的任何一种氨基酸序列中具有由碱性氨基酸残基对位置321处的亮氨酸残基的取代：

(a)SEQ ID NO:2的氨基酸序列；

具有2-O-硫酸转移活性。

(a)至(c)由对应于中国仓鼠来源的2-O-硫酸化酶(2-OST)的全长氨基酸序列的SEQ ID NO:2指定。(d)至(f)由中国仓鼠来源的2-OST的催化位点(SEQ ID NO:2中的Asp69-Asn356)指定。

将亮氨酸残基321取代的碱性氨基酸残基为精氨酸残基、赖氨酸残基或组氨酸残基。精氨酸残基或赖氨酸残基是优选的。精氨酸残基是更优选的。

(b)、(c)、(e)和(f)可以在预定位点中进一步具有期望的突变。例如，据报道，对于2-OST，当SEQ ID NO:2的氨基酸序列中的酪氨酸残基94由丙氨酸残基、异亮氨酸残基、甘氨酸残基、苯丙氨酸残基或谷氨酸残基取代时，与β-D-葡糖醛酸残基(己糖醛酸残基)相比，α-L-艾杜糖醛酸残基(己糖醛酸残基)的2位处的羟基更优先得以硫酸化(即底物特异性的改变)(Li K.,et al.,(2010)J Biol Chem,285(15):11106-11113)。将亮氨酸残基321取代为碱性氨基酸残基是由于三聚体比率的改善而改善活性的取代，并且是不影响底物特异性的突变。因此，除了将亮氨酸残基321取代成碱性氨基酸残基外，本发明的2-O-硫酸化酶突变体优选进一步具有此类突变。

术语“2-O-硫酸转移活性”是指将硫酸基团从硫酸基团供体(例如3’-磷酸腺苷-5’-磷酰硫酸(PAPS))向己糖醛酸残基的2位处的羟基转移，从而在己糖醛酸残基的2位处产生“-O-硫酸基团”的结构的活性。己糖醛酸残基的实例包括α-L-艾杜糖醛酸残基和β-D-艾杜糖醛酸残基。α-L-艾杜糖醛酸残基是优选的。

可以适当地进行2-O硫酸转移活性的评估。例如，如实施例部分中所述，可以通过测量2-O-硫酸转移活性并随后通过二糖组成分析确定2-O-硫酸化率来进行2-O-硫酸转移活性的评估。更具体地，2-O-硫酸转移活性的测量可以通过如下进行：将1.9％的含突变体的液体添加到反应液(2mg/mL的肝素前体化合物(底物)、0.6mM的PAPS(硫酸基团供体)和50mM的MES(pH：7.0))中，于37℃进行反应30分钟，与两倍量的2.0M柠檬酸水溶液混合，然后于95℃热处理混合物15分钟，从而终止反应。作为含突变体的液体，例如，可以利用经纯化的酶液体或无细胞提取物。作为肝素前体化合物(底物)，可以使用后面所述的那些。N-硫酸化的肝素前体、差向异构化的肝素前体或N-硫酸化的差向异构化的肝素前体是优选的。可以解聚此类肝素前体。肝素前体化合物(底物)也可以是N-硫酸化的差向异构化的解聚的肝素前体。

(1-2)3-O-硫酸化酶突变体：

本发明提供了3-O-硫酸化酶突变体，其中在(a’)至(f’)的任何一种氨基酸序列中，

(i)位置77处的甲硫氨酸残基由赖氨酸残基取代；

(ii)位置96处的色氨酸残基由苯丙氨酸残基取代；

(iii)位置125处的脯氨酸残基由丙氨酸残基取代；

(iv)位置164处的缬氨酸残基由异亮氨酸残基取代；

(v)位置167处的天冬酰胺残基由组氨酸残基取代；

(vi)位置171处的赖氨酸残基由谷氨酰胺残基取代；或

(vii)位置259处的酪氨酸残基由苯丙氨酸残基取代；并且

其中所述3-O-硫酸化酶突变体具有3-O-硫酸转移活性：

(a’)SEQ ID NO:8的氨基酸序列；

(f’)氨基酸序列，其与由SEQ ID NO:8的氨基酸序列中位置48至311处的氨基酸残基组成的氨基酸序列具有90％或更多的同一性。

(a’)至(c’)由对应于小鼠来源的3-OST的同等型(3-OST-1)的全长氨基酸序列的SEQ ID NO:8指定。(d’)至(f’)由小鼠来源的3-OST-1的催化位点(SEQ ID NO:8中的Gly48-His311)指定。

术语“3-O-硫酸转移活性”是指将硫酸基团从硫酸基团供体(例如PAPS)向α-D-葡糖胺残基的3位处的羟基转移，从而在α-D-葡糖胺残基的3位处产生“-O-硫酸基团”的结构的活性。

可以适当地进行3-O硫酸转移活性的评估。例如，如实施例部分中所述，可以通过测量3-O-硫酸转移活性并随后通过二糖组成分析确定3-O-硫酸化率来进行3-O-硫酸转移活性的评估。更具体地，3-O-硫酸转移活性的测量可以通过如下进行：将20μL的含突变体的液体添加到80μL的1g/L的肝素前体化合物(底物)、1.25mM的PAPS(硫酸基团供体)和50mM的HEPES(pH：7.5)的混合液体(预先在37℃的水浴中保温)中以开始于37℃的酶促反应，且过去一小时后，于100℃加热反应混合物3分钟，从而使酶失活。作为含突变体的液体，例如，可以利用经纯化的酶液体或无细胞提取物。作为肝素前体化合物(底物)，可以使用后面所述的那些。N-硫酸化的肝素前体、6-O-硫酸化的肝素前体或N-硫酸化的6-O-硫酸化的肝素前体是优选的。可以解聚此类肝素前体。肝素前体化合物(底物)也可以是N-硫酸化的6-O-硫酸化的解聚的肝素前体。

(1-3)关于突变体的生成解释：

在(b)、(e)、(b’)或(e’)的氨基酸序列中，一个或几个氨基酸残基可以由1、2、3或4个选自下组的突变修饰：氨基酸残基的缺失、取代、插入和添加。氨基酸残基的突变可以引入到氨基酸序列中的一个区域中，或者可以引入到多个不同的区域中。术语“一个或几个”是指很大程度上不损害蛋白质性活性的区域的数量。由术语“一个或几个”指代的数量是例如1至100，优选地1至80，更优选地1至50，仍更优选地1至40，并且特别优选地1至30、1至20、1至10或1至5(例如1、2、3、4或5)。

与(c)、(f)、(c’)或(f’)的氨基酸序列的同一性百分比为90％或更多。优选地，同一性可以是91％或更多、92％或更多、93％或更多、94％或更多、95％或更多、96％或更多、97％或更多、98％或更多或99％或更多。多肽(蛋白质)同一性百分比的计算可以通过blastp算法进行。更具体地，多肽的同一性百分比的计算可以通过由国家生物技术信息中心(NCBI)提供的blastp算法以评分参数的默认设置(矩阵：BLOSUM62；空位成本：存在＝11延伸＝1；组成调整：条件组成得分矩阵调整)进行。多核苷酸(基因)的同一性百分比的计算可以通过blastn算法进行。更具体地，多核苷酸的同一性百分比的计算可以通过由NCBI提供的blastn算法以评分参数的默认设置(匹配/错配得分＝1，-2；空位成本＝线性)进行。

对应于(b)、(c)、(e)、(f)、(b’)、(c’)、(e’)或(f’)的突变体具有使得其在目标物质的产生方面优异的特征。例如，在指定的测定条件下测量活性的情况下，优选对应于(b)和(c)的突变体具有以下活性：对应于作为基础的(a)的突变体的活性的70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、94％或更多、96％或更多、98％或更多，或者等于或大于对应于作为基础的(a)的突变体的活性。在指定的测定条件下测量活性的情况下，优选对应于(e)和(f)的突变体具有以下活性：对应于作为基础的(d)的突变体的活性的70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、94％或更多、96％或更多、98％或更多，或者等于或大于对应于作为基础的(d)的突变体的活性。在指定的测定条件下测量活性的情况下，优选对应于(b’)和(c’)的突变体具有以下活性：对应于作为基础的(a’)的突变体的活性的70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、94％或更多、96％或更多、98％或更多，或者等于或大于对应于作为基础的(a’)的突变体的活性。在指定的测定条件下测量活性的情况下，优选对应于(e’)和(f’)的突变体具有以下活性：对应于作为基础的(d’)的突变体的活性的70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、94％或更多、96％或更多、98％或更多，或者等于或大于对应于作为基础的(d’)的突变体的活性。作为此类指定的测量方法，可以利用上述条件。

在(b)、(c)、(e)、(f)、(b’)、(c’)、(e’)或(f’)的氨基酸序列中，只要可以保持目标特征，可以将突变引入到催化结构域中的位点和催化结构域之外的位点中。对于本领域技术人员而言，可以保持目标特征并且可以在其中引入突变的氨基酸残基的位置是显而易见的。具体而言，本领域技术人员可以(1)比较具有相同种类特征的蛋白质的多个氨基酸序列，(2)明晰相对保守的区域和相对不保守的区域，并随后(3)分别从相对保守的区域和相对不保守的区域估计可以在功能中实现重要作用的区域和不能在功能中实现重要作用的区域，并因此可以识别结构和功能之间的任何关联。结果，本领域技术人员能够指定氨基酸序列中可以引入突变的氨基酸残基的位置。

在氨基酸残基通过取代突变的情况下，氨基酸残基的取代可以是保守取代。术语“保守取代”是指用具有类似侧链的氨基酸残基取代预定的氨基酸残基的情况。具有类似侧链的氨基酸残基的家族是本领域熟知的。此类家族的实例可以包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)，具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)，具有不带电荷的极性侧链的氨基酸(例如天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)，具有非极性侧链的氨基酸(例如甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)，具有β位处分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)，具有芳香侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)，具有含羟基(例如醇和酚)侧链的氨基酸(例如丝氨酸、苏氨酸、酪氨酸)，和具有含硫侧链的氨基酸(例如半胱氨酸、甲硫氨酸)。优选地，氨基酸的保守取代可以是天冬氨酸和谷氨酸之间的取代，精氨酸、赖氨酸和组氨酸之间的取代，色氨酸和苯丙氨酸之间的取代，苯丙氨酸和缬氨酸之间的取代，亮氨酸、异亮氨酸和丙氨酸之间的取代，或甘氨酸和丙氨酸之间的取代。

本发明中使用的突变体可以是经由肽键与异源部分连接的融合蛋白。此类异源部分的实例包括促进目标蛋白质(突变体)纯化的肽组分(例如，标签部分如组氨酸标签、Strep标签II等；以及用于纯化目标蛋白质的蛋白质，如谷胱甘肽-S-转移酶、麦芽糖结合蛋白及其突变体类型等)，能够改善目标蛋白质的溶解度的肽组分(例如，Nus-标签)，作为伴侣蛋白起作用的肽组分(例如，触发因子)，具有其他功能的肽组分(例如，全长蛋白质或其部分)和接头。

氨基酸序列(a)至(f)和(a’)至(f’)的实例包括天然蛋白质及其天然存在的同源物的氨基酸序列，以及人工产生的突变体蛋白质。例如，突变体蛋白质可以通过将突变引入到能够编码目标蛋白质的DNA中并通过使用获得的突变体蛋白质产生突变体蛋白质来获得。诱变方法的实例包括定点诱变和随机突变处理(例如，用诱变剂和紫外线照射处理)。

2.使用突变体的目标物质的制造方法(2-1)肝素前体化合物

根据本发明的制造方法，可以通过使用肝素前体化合物作为起始材料来生产预定的目标物质。

本发明中，术语“肝素前体化合物”意指肝素前体或肝素前体衍生物。

肝素前体是由β-D-葡糖醛酸(GlcA)残基和N-乙酰-α-D-葡糖胺(GlcNAc)残基组成的重复的二糖单元[→4)-β-D-GlcA-(1→4)-α-D-GlcNAc-(1→]构成的多糖。例如，肝素前体可以通过利用具有肝素前体产生能力的微生物的发酵方法来制备(例如，WO/2015/050184A)。

在本发明中，术语“肝素衍生物”是指具有选自由以下(1)至(7)组成的组的至少一种修饰(例如，1、2、3、4、5、6或7种)的肝素前体：

(1)α-D-葡糖胺残基的N-去乙酰化；

(2)解聚；

(3)α-D-葡糖胺残基的N-硫酸化；

(4)己糖醛酸残基的C5-差向异构化；

(5)己糖醛酸残基的2-O-硫酸化；

(6)α-D-葡糖胺残基的6-O-硫酸化；或

(7)α-D-葡糖胺残基的3-O-硫酸化。

这些修饰模式的详细信息是“附图简述”部分中所述的。此类肝素衍生物可以通过后面所述的处理来制备。

在本发明中，术语“己糖醛酸”(HexA)意指β-D-葡糖醛酸(GlcA)或α-L-艾杜糖醛酸(IdoA)。(4)的“己糖醛酸残基的C5-差向异构化”中的“己糖醛酸残基”优选为β-D-葡糖醛酸。因此，在(4)的C5-差向异构化中，优选通过β-D-葡糖醛酸的异构化来产生α-L-艾杜糖醛酸。另外，(5)的“己糖醛酸残基的2-O-硫酸化”中的“己糖醛酸残基”优选为α-L-艾杜糖醛酸。因此，在(5)的2-O-硫酸化中，优选将作为己糖醛酸残基的α-L-艾杜糖醛酸的2位处的羟基硫酸化。

(2-2)生产己糖醛酸残基的2位处的羟基被硫酸化的经修饰的肝素前体化合物的方法：

本发明提供了生产己糖醛酸残基的2位处的羟基被硫酸化的经修饰的肝素前体化合物的方法。本方法包括在存在上述2-O-硫酸化酶突变体的情况下，将肝素前体化合物转化为己糖醛酸残基的2位处的羟基被硫酸化的经修饰的肝素前体化合物。

在一个实施方案中，作为起始材料的肝素前体化合物也可以是N-硫酸化的肝素前体化合物。术语“N-硫酸化的”意指N-乙酰-D-葡糖胺残基的氨基被硫酸化。N-硫酸化的肝素前体化合物可以通过对肝素前体进行以上(1)和(3)的两种处理而获得。N-硫酸化的肝素前体化合物可以进一步具有选自由以上(2)、(4)、(6)和(7)组成的组的至少一种修饰(例如1、2、3或4种)。

在另一个实施方案中，作为起始材料的肝素前体化合物也可以是差向异构化的肝素前体化合物。术语“差向异构化的”意指关于己糖醛酸残基，β-D-葡糖醛酸残基被转化为α-L-艾杜糖醛酸残基。差向异构化的肝素前体化合物可以通过对肝素前体进行以上(4)的处理而获得。差向异构化的肝素前体化合物可以进一步具有选自由以上(1)至(3)、(6)和(7)组成的组的至少一种修饰(例如1、2、3、4或5种)。

在又一个实施方案中，作为起始材料的肝素前体化合物也可以是解聚的肝素前体化合物。术语“解聚的”意指对肝素前体化合物进行处理以使其分子量变低。例如，就通过GPC基于普鲁兰多糖(pullulan)测量的值而言，“解聚的”肝素前体化合物具有1,000至150,000，且优选8,000至60,000的数均分子量(Mn)以及2,000至300,000，且优选10,000至100,000的重均分子量(Mw)。解聚的肝素前体化合物可以通过对肝素前体进行以上(2)的处理而获得。解聚的肝素前体化合物可以进一步具有选自由以上(1)、(3)、(4)、(6)和(7)组成的组的至少一种修饰(例如1、2、3、4或5种)。

在指定的实施方案中，作为起始材料的肝素前体化合物也可以是N-硫酸化的、差向异构化的且解聚的肝素前体化合物。在N-硫酸化的、差向异构化的且解聚的肝素前体化合物中的“N-硫酸化的”、“差向异构化的”和“解聚的”是如上所述的那些。N-硫酸化的、差向异构化的且解聚的肝素前体化合物可以通过对肝素前体进行以上(1)至(4)的处理而获得。N-硫酸化的差向异构化的解聚的肝素前体化合物可以进一步具有选自由以上(6)和(7)组成的组的至少一种修饰(例如1或2种)。

在一个优选的实施方案中，作为起始材料的肝素前体化合物也可以是N-硫酸化的差向异构化的解聚的肝素前体(参见实施例5(1))。在N-硫酸化的差向异构化的解聚的肝素前体中的“N-硫酸化的”、“差向异构化的”和“解聚的”是如上所述的那些。N-硫酸化的差向异构化的解聚的肝素前体可以通过对肝素前体进行以上(1)至(4)的处理而获得。N-硫酸化的差向异构化的解聚的肝素前体不具有选自由以上(6)和(7)组成的组的至少一种修饰(例如1或2种)。

(2-3)生产α-D-葡糖胺残基的3位处的羟基被硫酸化的经修饰的肝素前体化合物的方法：

本发明提供了生产α-D-葡糖胺残基的3位处的羟基被硫酸化的经修饰的肝素前体化合物的方法。本方法包括在存在上述3-O-硫酸化酶突变体的情况下，将肝素前体化合物转化为α-D-葡糖胺残基的3位处的羟基被硫酸化的经修饰的肝素前体化合物。

在一个实施方案中，作为起始材料的肝素前体化合物可以是上述N-硫酸化的肝素前体化合物。N-硫酸化的肝素前体化合物可以进一步具有选自由以上(2)和(4)至(6)组成的组的至少一种修饰(例如1、2、3或4种)。

在另一个实施方案中，作为起始材料的肝素前体化合物也可以是上述差向异构化的肝素前体化合物。差向异构化的肝素前体化合物可以进一步具有选自由以上(1)至(3)、(5)和(6)组成的组的至少一种修饰(例如1、2、3、4或5种)。

在又一个实施方案中，作为起始材料的肝素前体化合物也可以是上述解聚的肝素前体化合物。解聚的肝素前体化合物可以进一步具有选自由以上(1)、(3)和(4)至(6)组成的组的至少一种修饰(例如1、2、3、4或5种)。

在又一个实施方案中，作为起始材料的肝素前体化合物也可以是2-O-硫酸化的肝素前体化合物。术语“2-O-硫酸化的”意指己糖醛酸残基(优选α-L-艾杜糖醛酸残基)的2位处的羟基被硫酸化。2-O-硫酸化的肝素前体化合物可以通过对肝素前体进行以上(5)的处理而获得。2-O-硫酸化的肝素前体化合物可以进一步具有选自由以上(1)至(4)和(6)组成的组的至少一种修饰(例如1、2、3、4或5种)。

在又一个实施方案中，作为起始材料的肝素前体化合物也可以是6-O-硫酸化的肝素前体化合物。术语“6-O-硫酸化的”意指N-乙酰-D-葡糖胺残基的6位处的羟基被硫酸化。6-O-硫酸化的肝素前体化合物可以通过对肝素前体进行以上(6)的处理而获得。6-O-硫酸化的肝素前体化合物可以进一步具有选自由以上(1)至(5)组成的组的至少一种修饰(例如1、2、3、4或5种)。

在指定的实施方案中，作为起始材料的肝素前体化合物也可以是N-硫酸化的、6-O-硫酸化的且解聚的肝素前体化合物。在N-硫酸化的、6-O-硫酸化的且解聚的肝素前体化合物中的“N-硫酸化的”、“6-O-硫酸化的”和“解聚的”是如上所述的那些。N-硫酸化的、6-O-硫酸化的且解聚的肝素前体化合物可以通过对肝素前体进行以上(1)至(3)和(6)的处理而获得。N-硫酸化的、6-O-硫酸化的且解聚的肝素前体化合物可以进一步具有选自由以上(4)和(5)组成的组的至少一种修饰(例如1或2种)。

在一个优选的实施方案中，作为起始材料的肝素前体化合物也可以是N-硫酸化的、6-O-硫酸化的且解聚的肝素前体(参见实施例9(1))。在N-硫酸化的、6-O-硫酸化的且解聚的肝素前体中的“N-硫酸化的”、“6-O-硫酸化的”和“解聚的”是如上所述的那些。N-硫酸化的、6-O-硫酸化的且解聚的肝素前体可以通过对肝素前体进行以上(1)至(3)和(6)的处理而获得。N-硫酸化的、6-O-硫酸化的且解聚的肝素前体不具有选自由以上(4)和(5)组成的组的至少一种修饰(例如1或2种)。

在另一个优选的实施方案中，作为起始材料的肝素前体化合物也可以是N-硫酸化的2-O-硫酸化的6-O-硫酸化的差向异构化的解聚的肝素前体。在N-硫酸化的2-O-硫酸化的6-O-硫酸化的差向异构化的解聚的肝素前体中的“N-硫酸化的”、“2-O-硫酸化的”、“6-O-硫酸化的”、“差向异构化的”和“解聚的”是如上所述的那些。N-硫酸化的2-O-硫酸化的6-O-硫酸化的差向异构化的解聚的肝素前体可以通过对肝素前体进行以上(1)至(6)的处理而获得。众所周知，在3-O-硫酸化酶中，可以将N-硫酸化的2-O-硫酸化的6-O-硫酸化的差向异构化的解聚的肝素前体用作底物(例如，WO/2017/115674A、WO/2017/115675A)。结果，在本发明的3-O-硫酸化酶突变体中，可以将N-硫酸化的2-O-硫酸化的6-O-硫酸化的差向异构化的解聚肝素前体用作底物。

(2-4)生产硫酸乙酰肝素的方法：

本发明提供了生产硫酸乙酰肝素(优选肝素)的方法。本方法包括对肝素前体进行包括以下项的处理：(1)α-D-葡糖胺残基的N-去乙酰化，(2)解聚，(3)α-D-葡糖胺残基的N-硫酸化，(4)己糖醛酸残基的C5-差向异构化，(5)己糖醛酸残基的2-O-硫酸化，(6)α-D-葡糖胺残基的6-O-硫酸化，和(7)α-D-葡糖胺残基的3-O-硫酸化，从而产生硫酸乙酰肝素，其中

(I)在存在上述2-O-硫酸化酶突变体的情况下进行己糖醛酸残基的2-O-硫酸化，或者

(II)在存在上述3-O-硫酸化酶突变体的情况下进行所述α-D-葡糖胺残基的3-O-硫酸化。

在生产硫酸乙酰肝素的方法中，根据上述(1)至(7)的肝素前体的处理可以通过本领域熟知的上述方法(例如WO 2017/115674 A；WO 2017/115675 A；美国专利号8,227,449；美国专利申请公开号2012/0322114；Lindahl U,et al.,(2005)J Med Chem,48(2):349-352；Zhang Z.,et al.,(2008)Journal of the American Chemical Society,130(39):12998-13007；和Chen J,et al.,J Biol Chem.,2005Dec 30,280(52):42817-25)进行。

(1)α-D-葡糖胺残基的N-去乙酰化可以例如利用去乙酰化剂以化学方式进行。去乙酰化剂的实例包括碱性物质，如碱金属盐、碱土金属盐和肼等。碱金属盐的实例包括氢氧化钠、氢氧化钾、氢氧化锂、氢氧化铷和氢氧化铯。碱土金属盐的实例包括氢氧化铍、氢氧化镁、氢氧化钙、氢氧化锶和氢氧化钡。

N-去乙酰化优选是部分N-去乙酰化。可以例如进行N-去乙酰化，使得N-乙酰基团的残留率变为如下文所述的值。也就是说，例如，N-乙酰基团的残留率可以是1％或更多、1.5％或更多、3％或更多、5％或更多、7％或更多、9％或更多或11％或更多，且它可以是50％或更少、45％或更少、40％或更少、35％或更少、33％或更少、30％或更少、25％或更少、20％或更少或17％或更少或者它可以是其组合。具体地，例如，N-乙酰基团的残留率可以是1％至33％、7％至33％、7％至30％或11％至17％。例如，7％至30％的N-乙酰基团的残留率大约对应于N-乙酰基团以每6至28个糖残基为1的比率存在的情况(就二糖单元而言，3至14个单元中一个)。另外，例如，11％至17％的N-乙酰基团的残留率一般对应于N-乙酰基团以每12至18个糖残基为1的比率存在的情况(就二糖单元而言，6至9个单元中一个)。可以例如通过二糖分析证实N-去乙酰化的程度(即N-乙酰基团的残留率)。也就是说，当对多糖进行二糖分析时，N-乙酰基团的残留率可以就具有N-乙酰基团的二糖单元的量与二糖单元的总量的比率(摩尔比率)而言计算。

关于利用氢氧化钠的部分N-去乙酰化的条件，例如，可以参考先前报道的条件(Kuberan B.,et al.,(2003)J Biol Chem.,278(52):52613-52621；和美国专利申请公开号2011/0281820)。关于利用肼的部分N-去乙酰化的条件，例如，可以参考先前报道的条件(Glycobiology,10(2000)159-171；Carbohydrate Research,290(1996)87-96；和Biochem.J.,217(1984)187-197)。

(2)可以使用肝素酶以酶促方式进行解聚。肝素酶的实例包括肝素酶I、肝素酶II和肝素酶III。肝素酶III是优选的。解聚没有特别限制，只要处理肝素前体使得解聚后的肝素前体的分子量小于解聚前肝素前体的分子量。可以进行解聚，使得就通过GPC基于普鲁兰多糖测量的值而言，解聚后肝素前体具有1,000至150,000，且优选8,000至60,000的数均分子量(Mn)以及2,000至300,000，且优选10,000至100,000的重均分子量(Mw)。

优选地，使用肝素酶III进行解聚。“肝素酶III”是指切割糖胺聚糖如肝素前体的N-硫酸化的或N-去乙酰化的葡糖胺残基的位点的酶(典型地为EC4.2.2.8)。在本发明中使用的肝素酶III没有特别限制，只要其能够优先切割N-去乙酰化的肝素前体中具有N-乙酰基团的葡糖胺残基的位点。

(3)α-D-葡糖胺残基的N-硫酸化是将肝素前体中α-D-葡糖胺残基的氨基硫酸化的过程。可以使用硫酸化剂以化学方式进行N-硫酸化。硫酸化剂的实例包括三氧化硫复合物如三氧化硫吡啶复合物(PySO₃)、三氧化硫三甲胺复合物(TMASO₃)等。

(4)己糖醛酸残基的C5-差向异构化是通过肝素前体中的β-D-葡糖醛酸残基的异构化而产生α-L-艾杜糖醛酸残基的过程。可以使用C5-差向异构酶进行C5-差向异构化。作为C5-差向异构酶，可以使用各种哺乳动物或细菌来源的C5-差向异构酶(美国专利号8,227,449；美国专利申请公开号2012/0322114；WO 02/046379A；Lindahl U,et al.,(2005)JMed Chem,48(2):349-352；Zhang Z.,et al.,(2008)Journal of the American ChemicalSociety,130(39):12998-13007；Chen J,et al.,J Biol Chem.,2005Dec.30；280(52):42817-25；和John R.,et al.,J.Biol Chem,2013,Aug.23；288(34):24332-9)。

(5)己糖醛酸残基的2-O-硫酸化是将肝素前体中己糖醛酸残基(优选α-L-艾杜糖醛酸残基)的2位处的羟基硫酸化的过程。可以例如利用2-O-硫酸化酶(2-OST)以酶促方式进行2-O-硫酸化(例如，参见背景技术中列出的文献)。

(6)α-D-葡糖胺残基的6-O-硫酸化是将肝素前体中α-D-葡糖胺残基的6位处的羟基硫酸化的过程。可以例如利用6-O-硫酸化酶(6-OST)以酶促方式进行6-O-硫酸化。6-OST的实例包括6-OST-1、6-OST-2和6-OST-3。也可以例如利用硫酸化剂以化学方式进行6-O-硫酸化。硫酸化剂的实例包括三氧化硫复合物如三氧化硫吡啶复合物(PySO₃)、三氧化硫三甲胺复合物(TMASO₃)等。

(7)α-D-葡糖胺残基的3-O-硫酸化是将肝素前体中α-D-葡糖胺残基的3位处的羟基硫酸化的过程。可以例如利用3-O-硫酸化酶(3-OST)以酶促方式进行3-O-硫酸化。3-OST的实例包括3-OST-1、3-OST-2、3-OST-3、3-OST-4和3-OST-5(例如，参见背景技术中列出的文献)。

可以以任意顺序进行上述处理。例如，解聚(2)可以在以上(1)和(3)至(7)的之前或之后或途中进行。可以在以上(1)之后和以上(3)之前进行。另外，可以以任意顺序进行以上(5)至(7)的处理。通常，可以以2-O-硫酸化、3-O-硫酸化和6-O-硫酸化的顺序，或者以2-O-硫酸化、6-O-硫酸化和3-O-硫酸化的顺序进行处理。也可以按数字顺序进行上述处理(图1)。可以同时或分别进行两个或更多个上述处理。

各过程的产物可以以原样地包含在各过程的反应液中的状态下进行接下来的过程，或者也可以在从反应液中回收产物之后进行接下来的过程。从反应液中回收各产物的手段没有特别限制。回收各产物的手段的实例包括用于化合物的分离和纯化的已知方法，如膜处理方法、沉淀方法等。各过程的产物可以适当地进行处理，如纯化、稀释、浓缩、干燥、溶解、酶失活等，然后进行接下来的过程。纯化可以以期望的程度进行。这些处理可以单独地或适当组合使用。

(2-5)以上(2-2)至(2-4)的方法的实现方式：

以上(2-2)至(2-4)的方法中的每个反应可以在适当的系统(例如，缓冲系统、发酵系统)中适当地进行。作为此类反应的条件，可以采用先前报道的条件(例如，参见上述文献)或实施例部分中所述的条件。例如，(2-2)和(2-3)的方法可以通过在含有0.1至50g/L的肝素前体化合物和0.05至10mM的PAPS，并在适当的温度(例如25到42℃)下具有适当的pH(例如5.0至9.0)的缓冲液(例如MES，HEPES)中反应期望的时间(例如10分钟到48小时)来进行。

在一个实施方案中，本发明的方法可以使用本发明的突变体(以下根据需要称为“蛋白质”等)自身来进行。例如，在使用重组蛋白作为本发明的突变体的情况下，可以通过使用无细胞系统载体从能够产生本发明的突变体的转化的微生物获得重组蛋白。本发明的突变体可以作为未纯化的、粗制的或纯化的蛋白质使用。此类蛋白质也可以在反应中以固定化蛋白质(其意味着固相中固定化的蛋白质)使用。

用于培养转化的微生物的培养基是已知的，并且例如可以使用通过将碳源、氮源、维生素源等添加到营养培养基如LB培养基等，或基本培养基如M9培养基等中获得的培养基。根据宿主，转化的微生物通常在16至42℃，优选25至37℃下培养5至168小时，且优选8至72小时。可以根据宿主进行振荡培养和静置培养的任一种。根据需要可以进行搅拌或可以进行通风。在选择放线菌作为表达宿主的情况下，可以适当地使用可以用于产生蛋白质的目的的条件。另外，在使用诱导型启动子用于表达蛋白质的目的的情况下，也可以通过将启动子诱导剂添加到培养基中进行培养。

可以通过已知的沉淀方法，如盐析、等电沉淀、溶剂沉淀等，从转化的微生物的提取物中纯化和分离产生的蛋白质；利用分子量差异的方法，如透析、超滤、凝胶过滤等；利用特异性亲和力的方法，如离子交换色谱法等；利用疏水性差异的方法，如疏水色谱法、反相色谱法等；其他亲和色谱法、SDS聚丙烯酰胺电泳、等电电泳等，或其组合。当分泌表达目标蛋白质时，可以通过离心等从通过培养转化的微生物得到的培养液中除去细菌细胞，从而得到含有蛋白质的培养上清液。也可以从该培养上清液中纯化和分离蛋白质。

在另一个实施方案中，本发明的方法可以在存在能够产生本发明的突变体的转化的微生物或其提取物的情况下进行。

作为能够产生本发明的突变体的微生物的提取物，可以使用通过任意方法处理的含目标蛋白质的处理液。作为此类处理，可以采用如上所述的用于分离和纯化的方法和可以杀伤微生物的杀微生物处理方法。作为杀微生物处理方法，可以使用可以杀伤微生物的任意方法。其实例包括热处理、酸处理、碱处理、表面活性剂处理和有机溶剂处理。

在一个优选的实施方案中，转化的微生物是含有编码本发明的突变体的核苷酸序列的多核苷酸和含有包含与其可操作地连接的启动子的表达单元的宿主细胞。

术语“表达单元”是指如下的最小单位，其含有待表达为蛋白质的预定多核苷酸和与其可操作连接的启动子，其使得可以实现多核苷酸的转移，进而产生要由多核苷酸编码的蛋白质。表达单元可以进一步含有元件如终止子、核糖体结合位点和耐药基因等。表达单元可以是DNA或RNA，并优选是DNA。

表达单元对于宿主细胞可以是同源的(即固有的)或异源的(即非固有的)。其优选是异源表达单元。术语“异源表达单元”意指表达单元对于宿主细胞是异源的。因此，在本发明中，构成表达单元的至少一种元件对于宿主细胞是异源的。对于宿主细胞异源的构成表达单元的元件的实例包括上述元件。优选地，构成异源表达单元的编码目标蛋白质的多核苷酸和启动子之一或两者对于宿主细胞是异源的。因此，在本发明中，编码目标蛋白质的多核苷酸和启动子之一或两者是源于宿主细胞以外的生物体(例如，原核生物和真核生物，或微生物、昆虫、植物和动物如哺乳动物等)或病毒的多核苷酸或者是人工合成的材料。或者，编码目标蛋白质的多核苷酸对于宿主细胞可以是异源的。优选地，目标蛋白质对于宿主细胞是异源的。

构成异源表达单元的启动子没有特别限制，只要在宿主细胞中其能够表达由与其下游连接的多核苷酸编码的蛋白质。例如，启动子对于宿主细胞可以是同源的或异源的。例如，可以使用通常用于生产重组蛋白质的组成型或诱导型启动子。此类启动子的实例包括PhoA启动子、PhoC启动子、T7启动子、T5启动子、T3启动子、lac启动子、trp启动子、trc启动子、tac启动子、PR启动子、PL启动子、SP6启动子、阿拉伯糖诱导型启动子、冷激启动子和四环素诱导型启动子。优选地，可以使用在宿主细胞中具有强转移活性的启动子。在宿主细胞中具有强转移活性的启动子的实例包括在宿主细胞中高表达的基因的启动子和病毒来源的启动子。

在本发明中，用作转化的微生物的宿主细胞的实例包括各种微生物，包括属于埃希氏菌属的细菌(例如大肠杆菌)、放线菌和棒状细菌。在本发明中，用作宿主细胞的大肠杆菌中，包括经常用于一般克隆或表达异源蛋白质的菌株，例如HB101、MC1061、JM109、CJ236和MV1184。在本发明中，用作宿主细胞的放线菌中，包括通常频繁用于表达异源蛋白质的蛋白质的菌株，例如浅青紫链霉菌(S.lividans)TK24和天蓝色链霉菌A3(2)。在本发明中，用作宿主细胞的棒状杆菌属(Corynebacterium)的细菌是需氧革兰氏阳性杆菌且迄今已分类为短杆菌属(Brevibacterium)；然而，目前，其包括合并到棒状杆菌属中的细菌(Int.J.Syst.Bacteriol.,41,255(1981))以及与棒状杆菌属非常密切相关的属于短杆菌属的细菌。使用棒状细菌的优点包括，与通常用于分泌生产蛋白质的真菌、酵母，芽孢杆菌细菌等相比，它们固有地向细菌细胞的外部分泌极少量的蛋白质，并因此在分泌产生目标蛋白质的情况下，可以简化或省去纯化过程；在用以分泌方式产生的酶进行酶促反应的情况下，培养上清液可以用作酶源，并因此可以减少由于细菌细胞组分、污染酶等引起的杂质和副反应；棒状细菌可以在含有糖、氨、无机盐等的简单培养基中良好生长，并因此，从培养基成本、培养方法和培养生产力的角度来看，它们是优异的。例如，通过利用Tat系统分泌途径，还可能有效地分泌作为工业上有用的蛋白质的蛋白质，其在传统上已知的Sec系统分泌途径中难以分泌产生，如异麦芽糖葡聚糖酶和蛋白质谷氨酰胺酶等(WO 2005/103278 A)。此外，也可以使用WO 01/023491 A、WO 02/081694 A、WO 01/023491 A等中公开的谷氨酸棒杆菌(Corynebacterium glutamicum)。

优选地，转化的微生物是属于埃希氏菌属的细菌。属于埃希氏菌属的细菌优选是大肠杆菌。

本发明中使用的转化的微生物可以通过本领域已知的任意方法制备。例如，此类表达单元以其中它掺入到宿主细胞的基因组DNA中的形态或以其中它未掺入到宿主细胞的基因组DNA中的形态(例如，表达载体的状态)包含在宿主细胞中。含有表达单元的宿主细胞可以通过本领域已知的任意方法(例如，感受态细胞方法、电穿孔方法)用表达载体转化宿主细胞来获得。在表达载体是引起与宿主细胞的基因组DNA的同源重组的整合载体的情况下，可以通过转化将表达单元掺入到宿主细胞的基因组DNA中。同时，在表达载体是不引起与宿主细胞的基因组DNA的同源重组的非整合载体的情况下，表达载体不通过转化掺入到宿主细胞的基因组DNA中，但因为其独立于基因组DNA可以以表达载体的状态存在于宿主细胞中。或者，可以通过基因组编辑技术(例如，CRISPR/Cas系统、转录激活因子样效应核酸酶(TALEN))将表达单元掺入到宿主细胞的基因组DNA中。

除了上述作为表达单元的最小单元之外，本发明中使用的表达载体可以进一步含有在宿主细胞中起作用的元件如终止子、核糖体结合位点和耐药基因等。耐药基因的实例包括针对药物如四环素、氨苄青霉素、卡那霉素、潮霉素和膦丝菌素等的耐药基因。

表达载体可以进一步含有可以实现与宿主细胞的基因组同源重组以与宿主细胞的基因组DNA同源重组的区域。例如，表达载体可以经设计使得其中含有的表达单元位于一对同源区域(例如，与宿主细胞的基因组中的指定序列同源的同源臂，loxP、FRT)之间。待引入表达单元的宿主细胞的基因组区域(同源区域的靶标)没有特别限制，但也可以是在宿主细胞中表达量大的基因的基因座。

表达载体可以是质粒、病毒载体、噬菌体或人工染色体。表达载体也可以是整合载体或非整合载体。整合载体可以是整个掺入到宿主细胞的基因组中的类型的载体。或者，整合载体也可以是仅其部分(例如表达单元)掺入到宿主细胞的基因组中的类型的载体。表达载体可以进一步是DNA载体或RNA载体(例如，逆转录病毒)。作为表达载体，可以使用通常使用的表达载体。此类表达载体的实例包括pUC(例如pUC19、pUC18)、pSTV、pBR(例如pBR322)、pHSG(例如pHSG299、pHSG298、pHSG399、pHSG398)、RSF(例如RSF1010)、pACYC(例如pACYC177、pACYC184)、pMW(例如pMW119、pMW118、pMW219和pMW218)、pQE(例如pQE30)及其衍生物。另外，在选择棒状细菌如谷氨酸棒杆菌作为宿主细胞的情况下，可以适合地利用作为高拷贝载体的pPK4等。

实施例

通过参考实施例更详细地描述本发明，但其不应解释为本发明限于以下实施例。

实施例1：N-硫酸化的差向异构化的解聚的肝素前体的制备

(1)肝素前体发酵

根据如WO 2015/050184 A的实施例1中所述的肝素前体生产细菌(大肠杆菌BL21(DE3)/pVK9-kfiABCD菌株)和培养条件获得含有肝素前体的培养液。

(2)肝素前体的纯化

通过离心从培养液回收培养上清液。为了去除培养基组分，通过使用UF膜用milliQ水洗涤1mL的培养上清液，并浓缩至250μL。将500μL的100％乙醇添加到250μL的经UF膜浓缩的液体中，并通过离心沉淀肝素前体。将所得的沉淀物风干以获得肝素前体。从剩余的培养上清液中，通过相同的规程纯化肝素前体，从而获得总共10g的肝素前体。

(3)肝素前体的N-去乙酰化

首先，将61mL的肼·H₂O和4.7mL的1N硫酸添加到1.22g的肝素前体中，并在用氮气吹扫气相后，将内容物加热至100℃并允许相互反应4.75小时。

随后，通过冰冷却终止反应，然后添加61mL的16％NaCl水溶液和610mL的MeOH，并将内容物离心以去除上清液。将所得的沉淀物在50mL的H₂O中溶解，然后使用Amicon UF膜(3kDa)脱盐并浓缩。

随后，将两倍量的H₂O和等量的1M NaHCO₃添加到所得的浓缩溶液中，然后滴加0.2MI₂/0.4M KI溶液直至混合物呈黄色。其后，滴加肼·H₂O；过多的碘还原为碘离子；再次使用Amicon UF膜(3kDa)脱盐并浓缩所得物；对浓缩物在减压下进行蒸发至干燥，从而获得N-去乙酰化的肝素前体。在获得的N-去乙酰化的肝素前体中N-乙酰基团的残留率为14.9％(如稍后所述)。

(4)N-去乙酰化的肝素前体的解聚

(4-1)肝素酶III的制备

<源于肝素黄杆菌(Flavobacterium heparinum)的hepC基因的表达质粒的构建>

将来自肝素黄杆菌(ATCC13125)的编码肝素酶III的hepC基因克隆到pMIV-Pnlp0载体(美国专利申请公开号2005/0196846)中以构建hepC基因表达质粒pMIV-Pnlp0-hepC。将强nlp0启动子(Pnlp0)和rrnB终止子掺入到pMIV-Pnlp0-ter中，并且当靶基因插入到其中时终止子可以作为靶标基因的表达单元发挥作用。“Pnlp0”表示源自大肠杆菌K-12的nlpD基因的野生型启动子。

表达质粒的构建的细节如下所示。通过使用大肠杆菌MG1655的染色体DNA作为模板，以及引物P1(SEQ ID NO:11)和引物P2(SEQ ID NO:12)的PCR获得含有约300bp的nlpD基因的启动子区域(Pnlp0)的DNA片段。在各个引物的5’末端区域中设计了限制酶SalI和PaeI的位点。PCR循环由以下组成：95℃ 3分钟，然后2个循环的95℃ 60秒、50℃ 30秒和72℃ 40秒，25个循环的94℃ 20秒、55℃ 20秒和72℃ 15秒，以及72℃ 5分钟作为最终循环。用SalI和PaeI处理获得的片段，并将其于SalI-PaeI位点处插入到pMIV-5JS(日本专利申请公开号2008-99668)中以获得质粒pMIV-Pnlp0。插入到该pMIV-Pnlp0质粒中的Pnlp0启动子的PaeI-SalI片段的核苷酸序列如SEQ ID NO:13所示。

随后，通过使用MG1655的染色体DNA作为模板，以及引物P3(SEQ ID NO:14)和引物P4(SEQ ID NO:15)的PCR获得含有约300bp的rrnB基因的终止子区域的DNA片段(SEQ IDNO:16)。在各个引物的5’末端区域中设计了限制酶XbaI和BamHI的位点。PCR循环由以下组成：95℃ 3分钟，然后2个循环的95℃ 60秒、50℃ 30秒和72℃ 40秒，25个循环的94℃ 20秒、59℃ 20秒和72℃15秒，以及72℃ 5分钟作为最终循环。用XbaI和BamHI处理获得的片段，并将其于XbaI-BamHI位点处插入到pMIV-Pnlp0中以获得质粒pMIV-Pnlp0-ter。

随后，人工合成含有源自肝素黄杆菌(ATCC13125)的hepC基因的ORF的DNA链(SuH.,et al.,Appl.Environ.Microbiol.,1996,62:2723-2734)。通过使用该DNA链作为模板，以及引物P5(SEQ ID NO:17)和引物P6(SEQ ID NO:18)作为引物的PCR扩增hepC基因的DNA片段。将PrimeStar聚合酶(TaKaRa)用于PCR，并且以所附方案中描述的反应组成进行PCR。PCR循环由以下组成：94℃ 5分钟，然后30个循环的98℃ 5秒、55℃ 10秒和72℃ 8分钟，并且最终维持在4℃。另外，通过使用pMIV-Pnlp0作为模板DNA，以及引物7(SEQ ID NO:19)和引物8(SEQ ID NO:20)的寡核苷酸作为引物的PCR获得pMIV-Pnlp0的DNA片段。将PrimeStar聚合酶用于PCR，并且以所附方案中描述的反应组成进行PCR。PCR循环由以下组成：94℃ 5分钟，然后30个循环的98℃ 5秒、55℃ 10秒和72℃ 6分钟，并且最终维持在4℃。通过使用In-Fusion(注册商标)HD克隆试剂盒(由Clontech制造)将获得的两个DNA片段彼此连接以构建hepC基因表达质粒pMIV-Pnlp0-hepC。含有克隆的hepC基因的核苷酸序列如SEQ IDNO:21所示，并且由其编码的肝素酶III(HepC)的氨基酸序列如SEQ ID NO:22所示。

<大肠杆菌BL21(DE3)菌株的hepC基因表达菌株的构建和肝素酶III酶液体的制备>

通过电穿孔(细胞：80μL，200Ω，25μF，1.8kV，比色皿：0.1mL)将hepC基因表达质粒pMIV-Pnlp0-hepC引入到大肠杆菌BL21(DE3)菌株(Life Technologies)中以获得大肠杆菌BL21(DE3)/pMIV-Pnlp0-hepC菌株作为肝素酶III生产菌株。该菌株在其中添加25μg/mL的氯霉素的LB培养基上涂抹并于37℃预培养过夜。其后，将培养液接种到Sakaguchi烧瓶中包含的300mL的LB培养基中，使得最终浓度为2％v/v。在37℃进行振荡培养4小时，然后完成培养。离心后，用0.85％NaCl洗涤细菌细胞两次，并在30mL的50mM HEPES缓冲液(pH：7.0)中悬浮。对悬浮液进行超声处理以破坏细菌细胞。将细胞经破坏的液体离心以制备肝素酶III酶液体作为上清液(无细胞提取物)。

(4-2)通过肝素酶III反应的解聚

将1g的以上(3)中获得的具有14.9％的N-乙酰基团残留率的N-去乙酰化的肝素前体和2mL的31.3mIU/μL肝素酶III溶液溶解于100mL的含有100mM的NaCl和1.5mM的CaCl₂的Tris缓冲溶液(pH：8.0)中，并且允许内容物在37℃彼此反应5.3小时。将反应液添加到100mL的16％NaCl水溶液和900mL的EtOH中并混合，并且将混合物离心以去除上清液，从而获得解聚的、N-硫酸化的且去乙酰化的肝素前体。通过GPC基于普鲁兰多糖测量在用肝素酶III解聚后的分子量。结果，数均分子量(Mn)为9.860，并且重均分子量(Mw)为15,430。(5)解聚的且N-去乙酰化的肝素前体的N-硫酸化

首先，将1g的以上(4)中获得的解聚的、N-去乙酰化的肝素前体溶解于50mL的milliQ水中，然后将50mL的20mg/mL的NaHCO₃和20mg/mL的三甲胺·SO₃的水溶液添加到其中，并且允许内容物在55℃彼此反应过夜。

随后，添加1L的EtOH并混合，然后将混合物离心去除上清液，从而获得N-硫酸化的且解聚的肝素前体。

随后，将获得的N-硫酸化的且解聚的肝素前体溶解于milliQ水中至500μL，并对溶液进行二糖分析以确定相对于N-去乙酰化的肝素前体的产率。规程如下所示。

<二糖分析>

根据先前报道的条件(T.Imanari,et al.,"High-performance liquidchromatographic analysis of glycosaminoglycan-derived oligosaccharides",J.O.Chromato.A,720,275-293(1996))进行N-硫酸化的且解聚的肝素前体的二糖分析。也就是说，通过使用肝素酶II和III将N-硫酸化的解聚的肝素前体分解成不饱和二糖并通过HPLC分析分解产物，从而定量各成分二糖的量。

类似地，进行N-去乙酰化的肝素前体的二糖分析。在将N-去乙酰化的肝素前体N-硫酸化后进行N-去乙酰化的肝素前体的二糖分析。也就是说，通过将N-去乙酰化的肝素前体N-硫酸化，通过使用肝素酶II和肝素酶III将所得物分解成不饱和二糖并通过HPLC分析分解产物来定量各成分二糖的量。以与解聚的N-去乙酰化的肝素前体的N-硫酸化相同的方式进行N-去乙酰化的肝素前体的N-硫酸化。

通过以下规程具体进行二糖分析。

(a)将0.2U的肝素酶II(Sigma)、0.02至0.03mIU的肝素酶III、5μg的多糖样品和10μL的用于酶促消化的缓冲液(100mM的CH₃COONa和10mM的(CH₃COO)₂Ca，pH：7.0)混合并用milliQ水稀释至100μL，从而制备反应溶液。

(b)允许反应溶液在37℃反应16小时或更长，然后在100℃煮沸2分钟从而终止反应。

(c)指定用0.45μm过滤器去除不可溶物质的溶液作为二糖分析的样品。

(d)以以下方式进行分析。柱：Inertsil ODS-3 150mm×2.1mm，粒径：5μm，温度：50℃，流速：0.25mL/分钟，检测波长：230nm，洗脱溶液(溶液A)：4％乙腈和1.2mM的三丁胺，洗脱溶液(溶液B)：4％乙腈和0.1M CsCl，梯度条件：1至90％的溶液B。

从各多糖样品产生的成分糖的量的总和计算产率。也就是说，产率计算为从N-硫酸化的且解聚的肝素前体产生的二糖的总量相对于从N-去乙酰化的肝素前体产生的二糖的总量的比率(摩尔比率)。另外，此时，证实了在获得的N-硫酸化的且解聚的肝素前体中，N-乙酰化生成的99％或更多的氨基被N-硫酸化。

另外，基于从N-去乙酰化的肝素前体产生的各成分糖的量计算N-去乙酰化的肝素前体中N-乙酰基团的残留率。也就是说，乙酰基团的残留率计算为具有N-乙酰基团的二糖的量相对于二糖的总量的比率(摩尔比率)。乙酰基团的残留率为14.9％。

(6)N-硫酸化的、差向异构化的且解聚的肝素前体的制备

(6-1)纯化的D-葡糖醛酸基C5-差向异构酶(Dlce)的制备

<斑马鱼来源的Dlce表达菌株的构建>

通过使用pMAL-c2x(SEQ ID NO:23，New England BioLabs)作为模板DNA，以及SEQID NO:24和25作为引物的PCR反应，获得了突变型麦芽糖结合蛋白(MBP*)的C末端区域DNA片段。在上述PCR反应中，将限制酶BglII的识别位点添加到5’末端，并将限制酶HindIII、BamHI、SacI、XhoI和NotI的识别位点添加到3’末端。用BglII和HindⅢ切割pMAL-c2x质粒DNA和MBP*的C末端区域DNA片段，然后进行连接反应以获得pMAL-MBP*质粒。pMAL-MBP*质粒的核苷酸序列如SEQ ID NO:26所示。

通过使用pMAL-MBP*作为模板DNA以及PrimeStar聚合酶(TaKaRa)作为聚合酶，根据制造商的方案进行PCR，从而获得pMAL-MBP*的DNA片段。SEQ ID NO:27和28的组合用作引物。

斑马鱼来源的Dlce的cDNA是通过人工基因合成(Thermo Fisher ScientificK.K.)制备的。通过使用cDNA作为模板以及SEQ ID NO:29和30作为引物的PCR反应，获得了含有编码斑马鱼来源的Dlce的催化位点(G70-Asn585)的核苷酸序列的DNA片段。通过使用In-Fusion(注册商标)HD克隆试剂盒(由Clontech制造)，将获得的DNA片段和pMAL-MBP*的DNA片段彼此连接。用反应液转化大肠杆菌JM109菌株，从而获得pMAL-MBP*-dreDlce(G70)。用获得的质粒转化大肠杆菌Origami B(DE3)，并命名为大肠杆菌Origami B(DE3)/pMAL-MBP*-dreDlce(G70)。插入片段的核苷酸序列和由此编码的氨基酸序列分别如SEQ ID NO:31和32所示。

<D-葡糖醛酸基C5-差向异构酶(Dlce)的制备>

将大肠杆菌Origami B(DE3)/pMAL-MBP*-dreDlce(G70)接种在其中添加100μg/mL的氨苄青霉素的LB培养基中，并在37℃下预培养过夜。其后，将培养液接种到500mL体积的Sakaguchi烧瓶中包含的其中添加了100μg/mL氨苄青霉素的100mL的(LB+甘油)培养基(95％(v/v)的LB培养基、1.0％(v/v)甘油、5mM的MOPS-KOH(pH：7.0))中，使得最终浓度为1％。在37℃进行振荡培养，直到OD660变为0.5至0.7。其中，添加异丙基-β-D-硫代吡喃半乳糖苷(IPTG)(Nacalai Tesque,Inc.)，使得最终浓度为0.5mM，并在22℃下进一步培养所得物过夜。

将培养液离心后，回收细菌细胞，用缓冲液-1(20mM的Tris-HCl(pH：7.5)和200mM的NaCl)洗涤一次，然后将其悬浮。将悬浮液用超声仪201M(Kubota Corporation)进行超声处理，并在以14,000rpm离心20分钟后，获得上清液作为无细胞提取物。随后，将无细胞的提取物提供给用20mM的Tris(pH：7.5)和200mM的NaCl平衡的5ml MBPTrap HP(GEHealthcare)。用缓冲液-1洗涤未吸附的蛋白质，然后用其中添加了10mM麦芽糖的缓冲液-1洗脱，从而获得纯化的MBP*-dreDlce(G70)。

(6-2)用Dlce进行C5-差向异构化

对以上(4)中获得的N-硫酸化的解聚的肝素前体进行C5-差向异构化反应。将8mU/mL的纯化MBP*-dreDlce(G70)添加到4g/L的N-硫酸化的解聚的肝素前体、50mM的MES(pH：7.0)和1mM的氯化钙中，并且允许内容物在37℃下彼此反应过夜。通过在95℃下热处理15分钟终止反应，并通过使用Amicon Ultra-15 3K(Merck Millipore)用超纯水对反应终止液进行液体置换。(6-3)C5-差向异构化率的定量

通过亚硝酸降解的二糖组成分析进行C5-差向异构化率的定量。结果，C5-差向异构化率为26.7％。

<试剂>

NaNO₂(CAS No.：7632-00-0，MW:69.01)

柠檬酸(CAS No.：77-92-9，MW:192.1)

2,4-二硝基苯肼(CAS No.：119-26-6，MW:198.1)，含有50％的水(缩写:DNPH)

<试验液体>

NaNO₂水溶液：49.5mg的试剂溶解于1mL的H₂O中的溶液

柠檬酸水溶液：384.2mg的试剂溶解于1mL的H₂O中的溶液

DNPH水溶液：20.4mg的试剂(含有50％的水)溶解于1mL的乙腈中的溶液<分析规程>

1.5mL微管(Eppendorf)中，依次添加10μL的反应液、20μL的柠檬酸缓冲液和10μL的NaNO₂水溶液，并在65℃搅拌(以1,000rpm)混合溶液2小时，从而获得亚硝酸降解液体。将20μL的DNPH溶液添加到40μL的获得的亚硝酸降解液中，并在45℃搅拌(以1,000rpm)内容物2小时，从而获得衍生化液体。在以下条件下通过HPLC分析获得的衍生化液体的组成。

<HPLC分析条件>

柱：ODS Z-CLUE 3μm(由Sumika Chemical Analysis Service,Ltd.制造)2.0mm×250mm

柱箱温度：50℃

洗脱溶液的流速：0.3mL/分钟

检测：UV 365nm

注射量：5μL

洗脱溶液的组成：

溶液A：50mM-HCOONH₄(pH：4.5)

溶液B：MeCN

表1：HPLC的梯度条件

时间(分钟)	溶液A(％)	溶液B(％)
			0.0	90	10
13.0	80	20
			27.0	20	80
27.1	90	10
			40.0	90	10

表2

实施例2：2-O-硫酸化酶(2-OST)表达菌株的构建

(1)pC2-1的构建

作为2-O-硫酸化酶(2-OST)，利用了中国仓鼠来源的2-OST的第94位处的酪氨酸残基转化为丙氨酸而得到的突变体的催化位点(Asp69-Asn356)和麦芽糖结合蛋白MBP的融合蛋白(MBP**-2-OST)。

表达质粒的构建细节如下所示。通过使用pMAL-c2x质粒作为模板DNA以及PrimeStar聚合酶(TaKaRa)作为聚合酶，根据制造商的方案进行PCR，从而获得pMAL-MBP**的DNA片段。SEQ ID NO:33和34的组合用作引物。

参考Kobayashi等人的报道(Kobayashi M.,et al.,Jour.Biol.Chem.,1997,272:13980-13985)通过人工基因合成(Thermo Fisher Scientific K.K.)制备了来自将中国仓鼠来源的2-OST的酪氨酸残基94转化为异亮氨酸的突变体的cDNA(根据大肠杆菌的密码子使用进行了优化)(关于核苷酸序列和氨基酸序列，参见SEQ ID NO:5和6)。通过使用上述cDNA作为模板和SEQ ID NO:35和36的寡核苷酸作为引物的PCR反应，获得了含有编码中国仓鼠来源的2-OST的催化位点(Asp69-Asn356)的核苷酸序列的DNA片段2-OST(Y64A)。通过使用In-Fusion(注册商标)HD克隆试剂盒(由Clontech制造)，将获得的DNA片段和pMAL-MBP**的DNA片段彼此连接。用反应液转化大肠杆菌JM109菌株，并将其施加到含有100μg/mL的氨苄青霉素的LB琼脂培养基中，随后在37℃培养过夜。根据已知方法从生长的转化的微生物的菌落中提取质粒。用3100基因分析仪(由Applied Biosystems制造)确认核苷酸序列，并将具有目的结构的质粒称为“pC2-1”。

(2)突变型2-OST表达质粒的构建

为了构建突变型2-OST表达质粒，通过使用对应于各种突变型的引物(SEQ ID NO:37至64)，使用pMAL-MBP**-2-OST(Y94A)作为模板进行PCR。每种突变与引物之间的关系显示于表3中。用DpnI消化获得的PCR产物后，用反应液转化大肠杆菌JM109菌株，并将其施加到含有100μg/mL的氨苄青霉素的LB琼脂培养基中，随后在37℃培养过夜。根据已知方法从生长的转化的微生物的菌落中提取质粒。用3100基因分析仪(由Applied Biosystems制造)确认核苷酸序列，从而获得各自具有目的结构的质粒pC2-2、3、4、5、6、7、8、10、11和12。以pC2-3作为模板，以相同的方式进行PCR，从而构建pC2-22、25、26、27和28。每种突变、引物和质粒之间的关系显示于表3中。

表3

(3)表达菌株的构建

用伴侣蛋白表达质粒pGro7(TaKaRa)转化大肠杆菌Origami B(DE3)菌株(Novagen)，从而构建大肠杆菌Origami B(DE3)/pGro7。如以上(1)和(2)中所述，分别用质粒pC-1、2、3、4、5、6、7、8、10、11、20、21、22、23、24、25、26、27和28转化，从而获得菌株C2-1、2、3、4、5、6、7、8、10、11、20、21、22、23、24、25、26、27和28。

实施例3：2-OST的表达和无细胞提取物的制备

将实施例2中获得的菌株接种到其中添加了100μg/mL的氨苄青霉素和25μg/mL的氯霉素的LB培养基中，并在37℃下预培养过夜。其后，将培养液接种到500mL体积的Sakaguchi烧瓶中包含的其中添加了100μg/mL氨苄青霉素和25μg/mL的氯霉素的100mL的(LB+甘油)培养基中，使得最终浓度为1％。在37℃进行振荡培养，直到OD660变为0.5至0.7。其后，添加最终浓度为0.5mM的IPTG(Nacalai Tesque,Inc.)和最终浓度为0.2％的L-阿拉伯糖(Wako Pure Chemical Industries,Ltd.)，并将所得物进一步在22℃培养过夜。

将培养液离心后，回收细菌细胞，用缓冲液-2(20mM的Tris-HCl(pH：7.5)，200mM的NaCl和15％的甘油)洗涤一次，然后将其在以1/10的培养液的量的缓冲液-2中悬浮。随后，用Bioruptor(Sonic Bio Co.,Ltd.)对细菌细胞进行超声处理，并在14,000rpm下离心20分钟后，获得上清液作为无细胞提取物。

实施例4：通过分子量分级进行激活物(三聚体)比率的高阶结构分析和测量

将0.5mL的实施例3中获得的无细胞提取物注射到预先用缓冲液-2平衡的Superose 6increase 10/300柱(GE Healthcare)中，并以0.25mL/分钟的流速进行分子量分级。将柱体积的0.2倍体积后的渗透液以每孔0.4mL收集到98孔板中。作为分子量标准品，使用凝胶过滤标准(Bio-Rad,#151-1901)和分子量标志物(HPLC)(Oriental Yeast Co.,Ltd.,#46804000)。

将2μL的样品缓冲液(用于SDS-PAGE，6倍浓缩，含有还原剂)(Nacalai Tesque,Inc.)添加到10μL的每个级分中，然后将内容物在95℃下热变性5分钟。使用4至20％的Criterion(注册商标)，TGX(注册商标)预制凝胶对全部量进行SDS-PAGE，并用Bullet CBBStain One(即用)(Nacalai Tesque,Inc.)对凝胶进行染色。最初，2-OST形成三聚体作为激活物，并且三聚体在级分的第29(C3级分)附近洗脱；然而，据估计，一批2-OST也在具有比三聚体更大的估计分子量截留值的级分中洗脱，以形成聚合物。然后，在Amersham Imager600(GE Healthcare)上捕获凝胶的染色成像剂，并用Image QuantTL(GE Healthcare)分析级分的第9(A9)(该级份处显示聚合物的分子量的2-OST为截留值)中的2-OST和级分的第29个级份(C3)(该级份处显示三聚体的分子量的2-OST为截留值)中的2-OST的条带强度。从各条带强度的分析结果计算[(C3级分的条带强度)/(A9级分的条带强度)×100]，并将其定义为表示包含激活物的部分的指标。

从各种突变体表达菌株制备的无细胞提取物的激活物比率的计算结果显示于表4中。显然，通过L321R的突变引入，激活物比率的指标得以改善。

表4：激活物比率的指标

菌株	突变	激活物比率(C3/A9级分×100)
			C2-1	Y94A	32.3
C2-2	Y94A/L321K	38.1
			C2-3	Y94A/L321R	66.4
C2-4	Y94A/I341E	16.3
			C2-5	Y94A/I341D	25.4
C2-7	Y94A/V323K	16.0
			C2-8	Y94A/I301E	13.2
C2-10	Y94A/W310A	20.2
			C2-11	Y94A/W310N	4.5
C2-12	Y94A/Y317A	7.1
			C2-22	Y94A/L321R/D208E	65.7
C2-25	Y94A/L321R/T254L	67.0

实施例5：无细胞提取物的2-O-硫酸化反应

(1)2-O-硫酸化反应

使用实施例1中制备的N-硫酸化的差向异构化的解聚的肝素前体作为底物进行反应。将1.9％的每种无细胞提取物添加到反应液(2mg/mL的N-硫酸化的差向异构化的解聚的肝素前体，0.6mM的3’-磷酸腺苷-5’-磷酰硫酸和50mM的MES(pH 7.0))，在37℃下进行反应30分钟，然后将所得物与两倍量的2.0M柠檬酸水溶液混合，随后在95℃进行热处理15分钟，从而终止反应。作为阴性对照，在将缓冲液-2代替无细胞提取物添加至反应液的条件下进行酶促反应。

通过二糖组成分析定量2-O-硫酸化率。如通过HPLC分析确定，从IdoA-GlcN(NS)和IdoA2S-GlcN(NS)的比率来计算2-O-硫酸化率，并将通过从各个2-O-硫酸化率中减去阴性对照的2-O-硫酸化率而获得的值确定为在2-O-硫酸化反应中转化的比例。从作为二糖单元的IdoA-G1cNS的分子量415.8计算出物质的转化量。酶单位(U)定义为在上述条件下，1分钟产生1μmol的IdoA(2S)-Glc(NS)的酶量。在实施例4中，尽管由于引入了L321R突变，无细胞提取物中的激活物(三聚体)的比率改善了约两倍，并且如从激活物比率估计，预期活性改善，但是由于L321R的突变引入，2-O-硫酸化活性从135U/mL大大提高到330U/mL(表5)。

表5：L321R突变体的2-O-硫酸化活性

菌株	突变	比活性(U/mL)
			C2-1	Y94A	135
C2-3	Y94A/L321R	330

(2)转化率的定量(二糖组成分析)

通过亚硝酸降解的二糖组成分析进行转化率(2-O-硫酸化率和3-O-硫酸化率)的定量。

<试剂>

NaNO₂(CAS No.：7632-00-0，MW:69.01)

柠檬酸(CAS No.：77-92-9，MW:192.1)

肝素(由Aldrich制造)

<试验液体>

肝素标准溶液：1mg/mL

NaNO₂水溶液：49.5mg的试剂溶解于1mL的H₂O中的溶液

柠檬酸水溶液：384.2mg的试剂溶解于1mL的H₂O中的溶液

DNPH水溶液：20.4mg的试剂(含有50％的水)溶解于1mL的乙腈中的溶液

<LC-MS分析条件>

<LC条件>

柱箱温度：50℃

洗脱溶液的流速：0.3mL/分钟

检测：UV 365nm

注射量：5μL

洗脱溶液的组成：

溶液A：50mM-HCOONH₄(pH：4.5)

溶液B：MeCN

表6：LC的梯度条件

<MS条件>

电离方法：电喷雾电离(ESI(+/-))

DL温度：250℃

加热块：250℃

雾化器气体流速：1.5L/分钟

干燥气体流速：15L/分钟

表7：有关MS的信息

<分析规程和结果>

1.5mL微管(Eppendorf)中，依次添加10μL的肝素标准溶液或试验溶液、20μL的柠檬酸缓冲水溶液和10μL的NaNO₂水溶液，并在65℃搅拌(以1,000rpm)混合溶液2小时，从而获得亚硝酸降解液体。将20μL的DNPH溶液添加到40μL的获得的亚硝酸降解液中，并在45℃搅拌(以1,000rpm)内容物2小时，从而获得衍生化液体。通过LC-MS分析所获得的衍生化液体的组成。从通过分析肝素标准溶液获得的IdoA(2S)-GlcN(NS6S)的峰计算出转化系数((1mg×IdoA(2S)-GlcN(NS6S)的面积纯度)/(IdoA(2S)-GlcN(NS6S)的面积值)，并从其面积值确定试验溶液中的各二糖衍生物的浓度。经计算的二糖结构及其比例显示于表3中。在表中，省略了关于认为含有具有N-乙酰基团的二糖衍生物等的未鉴定峰的任何数据，并且将GlcA(2S)-GlcN(NS)、IdoA(2S)-GlcN(NS)、GlcA-GlcN(NS)和IdoA-GlcN(NS)的总量定义为100％。

实施例6：N-硫酸化的、6-O-硫酸化的且解聚的肝素前体的制备

(1)N-硫酸化的且解聚的肝素前体的6-O-硫酸化

<反应前的纯化>

将实施例1(5)中获得的30mL的N-硫酸化的且解聚的肝素前体离心(以7000G 30分钟)，其上清液用0.45μm过滤器过滤。将27.3g的滤液装入15g的弱阴离子交换树脂(DIAION，WA-30，由Mitsubishi Chemical Corporation制造；预先用25.6mM的NaH₂PO₄调整至pH 5.5)中，并将其填充在Pharmacia柱(型号：XK26)中以吸附多糖组分，并使480mL的洗涤液(0.5MNaCl+25.6mM NaH₂PO₄(pH 5.5))从中通过(流速：6.4mL/分钟)。随后，使230mL的洗脱溶液(2M的NaCl+25.6mM的NaH₂PO₄(pH 5.5))通过所得物(流速：6.4mL/分钟)，从而获得含有多糖组分的洗脱溶液。将获得的洗脱溶液装入Amicon-3K(由Merck Millipore制造)中并离心(以4,000G)。将100mL的水进一步添加至所获得的浓缩液体中，并再次进行离心。进行3次该洗涤操作，从而获得11g的经洗涤的浓缩液。

<离子交换>

使11g的经洗涤的浓缩液通过3mL的强阳离子交换树脂(DIAION，UBK550，由Mitsubishi Chemical Corporation制造；预先用1M盐酸转化为H型)(pH 2.25)，然后加入1.8mL的2.36mg的三丁胺和10μL的乙醇的混合液进行中和(pH 8.36)。将获得的中和液冷冻干燥。

<6-O-硫酸化反应>

在氩气流下，将1.92mL的DMF和76.4mg(0.48mmol)的三氧化硫吡啶加合物添加到全部量的经冷冻干燥的材料中，并将其内容物在-10℃下搅拌48小时。将2.8mL的5M乙酸钠水溶液和31mL的水添加到反应液中，并将内容物在室温下搅拌1小时，从而终止反应。用0.2μm的过滤器过滤反应终止液，将滤液装入Amicon-3K(由Merck Millipore制造)中，并离心(以4,000G)。将20mL的水进一步添加至所获得的浓缩液体中，并再次进行离心。进行两次该洗涤操作，从而获得3.92g的经洗涤的浓缩液。以与实施例1中相同的规程，对所获得的经洗涤的浓缩液进行取样并通过亚硝酸降解进行二糖组成分析。结果，证实了就二糖单元的量而言，3.92g的经洗涤的浓缩液中含有76.5mg的反应产物，即N-硫酸化的、6-O-硫酸化的且解聚的肝素前体。

实施例7：3-O-硫酸化酶(3-OST-1)表达菌株的构建

(1)pETDuet-3-OST-1的构建

小鼠来源的3-OST-1的氨基酸序列(NCBI-蛋白质ID：NP_034604；SEQ ID NO:8)是从KEGG(基因和基因组京都百科全书(Kyoto Encyclopedia of Genes and Genomes))的数据库中获得的。通过参考先前的报道(Edavettal S.C.,et al.,J Bio Chem.,2004；279(24)25789-97)合成含有编码根据大肠杆菌的密码子使用而优化的3-OST-1的催化位点(Gly48-His311；SEQ ID NO:10)的碱基序列(SEQ ID NO:9)的DNA片段。将获得的DNA片段插入pETDuet-1载体(Novagen)的EcoRI-SalI位点，从而构建3-OST-1表达质粒pETDuet-3-OST-1。根据该表达质粒，表达了在其N-末端侧添加了His标签的3-OST-1，并因此，可以通过His标签来纯化3-OST-1。

(2)突变型3-OST-1表达质粒的构建

为了构建突变型3-OST-1表达质粒，通过使用对应于各种突变型的引物(SEQ IDNO:65至138)，使用pETDuet-3-OST-1为模板进行PCR。每种突变与引物之间的关系显示于表6中。用DpnI消化获得的PCR产物后，用反应液转化大肠杆菌JM109菌株，并将其施加于含有100μg/mL的氨苄青霉素的LB琼脂培养基中，随后在37℃下过夜培养。根据已知方法从生长的转化的微生物的菌落中提取质粒。用3100基因分析仪(由Applied Biosystems制造)确认核苷酸序列，从而获得质粒pET3OST#1、3、4、5、6、7、8、9、10、11、12、13、14、16、17、18、19、20、21、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39和40，其每个都具有目标结构。每种突变、引物和质粒之间的关系显示于表8-1和8-2中。

表8-1

表8-2

(3)3-OST-1表达菌株的构建

以与实施例1(5)中相同的方法，将具有野生型3-OST-1的表达质粒pETDuet-3-OST-1和37种具有突变型3-OST-1的表达质粒pET3OST引入大肠杆菌BL21(DE3)，从而获得野生型3-OST-1表达菌株pETDuet-3-OST-1/BL21(DE3)菌株(3OS-WT)和37种突变型3-OST-1表达菌株。

实施例8：3-OST的表达和无细胞提取物的制备

将实施例7中获得的菌株接种到3mL的含有100μg/mL的氨苄青霉素的LB培养基(1.0％(w/v)的蛋白胨，0.5％(w/v)的酵母提取物，1.0％(w/v)的NaCl和1.5％(w/v)的琼脂)中，并在37℃下预培养过夜。由1.2％(w/v)的胰蛋白胨(由BD制造)、2.4％(w/v)的酵母提取物(由BD制造)、0.5％(w/v)的甘油(由Junsei Chemical Co.,Ltd.制造)和水组成的溶液A通过在高压灭菌器中于120℃处理20分钟来制备。由2.3％(w/v)的磷酸二氢钾(由Junsei Chemical Co.,Ltd.制造)、12.5％(w/v)的磷酸氢二钾(由Junsei Chemical Co.,Ltd.制造)和水组成的溶液B通过用0.45μm过滤器(由Merck制造)过滤来制备。在无菌环境中以9/1的A/B比混合上述溶液A和溶液B，从而制备TB培养基。将预培养的培养液添加到试管中包含的3mL的TB培养基(含有100μg/mL的氨苄青霉素)中，是的最终浓度为1％，并在37℃且以每分钟120次往复进行摇动培养直到OD660达到0.5至0.7。然后，添加IPTG(NacalaiTesque,Inc.)使得最终浓度为0.2mM，并将内容物进一步进行摇动培养24至26小时。通过离心(在4℃和15,000rpm下5分钟)收集1mL的培养液。将以沉淀形式获得的细菌细胞悬浮于1mL的平衡缓冲液(50mM磷酸钠和300mM的NaCl，pH：7.0)中，并再次离心(在4℃和8,000rpm下5分钟)，从而洗涤细菌细胞。重复两次洗涤操作后，将以沉淀形式获得的细菌细胞再次悬浮于400μL的平衡缓冲液中，并用Bioruptor(Sonic Bio Co.,Ltd.)进行超声处理，同时用冷水冷却至4℃。将有经破坏的液体离心(在4℃和15,000rpm下20分钟)，并将获得的上清液定义为无细胞提取物。

实施例9：与无细胞提取物的3-O-硫酸化反应

(1)GlcN残基的3-O-硫酸化反应

使用实施例6中制备的N-硫酸化的、6-O-硫酸化的且解聚的肝素前体作为底物进行反应。制备80μL的1g/L的N-硫酸化的、6-O-硫酸化的且解聚的肝素前体，1.25mM的PAPS和50mM的HEPES(pH 7.5)的混合液作为反应液。向预先在水浴中保温在37℃的混合液中添加20μL的实施例8中制备的无细胞提取物以开始酶促反应。反应在37℃下进行，并且经过1小时后，将反应混合物在100℃下加热3分钟，从而使酶失活。

(2)GlcN残基的3-O硫酸化率的定量

以与实施例5(2)相同的规程通过亚硝酸降解进行反应产物的二糖组成分析。通过亚硝酸降解对反应终止液进行二糖组成分析，从而计算3-O-硫酸化率。根据式(I)进行3-O-硫酸化率的计算方法。

(3)突变型3-OST-1的活性评估

基于实施例9(2)中确定的3-O-硫酸化率计算3-OST活性。将用于一分钟产生1μmol的3-O-硫酸化二糖单元GlcA-GlcNS3S6S(分子量593)的酶的量定义为1U。当将野生型3-OST-1的酶活性定义为1时，突变型3-OST相对活性显示于表9中。作为活性评估的结果，已经清楚的是，通过突变引入M77K、P125A和V164I的每一种，3-OST活性均得以提高。

表9

序列表自由文本

SEQ ID No:1显示编码中国仓鼠来源的2-O-硫酸化酶(2-OST)的全长核苷酸序列。

SEQ ID No:2显示中国仓鼠来源的2-O-硫酸化酶(2-OST)的全长氨基酸序列。

SEQ ID No:3显示中国仓鼠来源的2-O-硫酸化酶(2-OST)的催化位点(Asp69-Asn356)的氨基酸序列。

SEQ ID No:4显示具有Y94A突变的中国仓鼠来源的2-O-硫酸化酶(2-OST)的全长氨基酸序列。

SEQ ID No:5显示编码具有Y94A突变的中国仓鼠来源的2-O-硫酸化酶(2-OST)的催化位点(Asp69-Asn356)的核苷酸序列，该序列根据大肠杆菌中的密码子使用进行了优化。

SEQ ID No:6显示具有Y94A突变的中国仓鼠来源的2-O-硫酸化酶(2-OST)的催化位点(Asp69-Asn356)的氨基酸序列。

SEQ ID No:7显示编码小鼠来源的3-O-硫酸化酶(3-OST-1)的全长核苷酸序列。

SEQ ID No:8显示小鼠来源的3-O-硫酸化酶(3-OST-1)的全长氨基酸序列。

SEQ ID No:9显示编码小鼠来源的3-O-硫酸化酶(3-OST-1)的催化位点(Gly48-His311)的核苷酸序列，该序列根据大肠杆菌中的密码子使用进行了优化。

SEQ ID No:10显示小鼠来源的3-O-硫酸化酶(3-OST-1)的催化位点(Gly48-His311)的氨基酸序列。

SEQ ID No:11显示引物P1的核苷酸序列。

SEQ ID No:12显示引物P2的核苷酸序列。

SEQ ID No:13显示PnlpO启动子的PaeI-SalI片段的核苷酸序列。

SEQ ID No:14显示引物P3的核苷酸序列。

SEQ ID No:15显示引物P4的核苷酸序列。

SEQ ID No:16显示含有约300bp的rrnB基因的终止子区域的DNA片段的核苷酸序列。

SEQ ID No:17显示引物P5的核苷酸序列。

SEQ ID No:18显示引物P6的核苷酸序列。

SEQ ID No:19显示引物P7的核苷酸序列。

SEQ ID No:20显示引物P8的核苷酸序列。

SEQ ID No:21显示实施例1中克隆的hepC基因的核苷酸序列。

SEQ ID No:22显示编码SEQ ID:NO 21的核苷酸的肝素酶III(HepC)的氨基酸序列。

SEQ ID No:23显示pMAL-c2x质粒的核苷酸序列。

SEQ ID NO:24和25显示用于制备实施例1中MBP*的引物的核苷酸序列。

SEQ ID No:26显示pMAL-MBP*质粒的核苷酸序列。

SEQ ID NO:27和28显示用于获得实施例1中pMAL-MBP*的DNA片段的引物的核苷酸序列。

SEQ ID NO:29和30显示用于获得实施例1中斑马鱼来源的D-葡糖醛酸基C5-差向异构酶的片段的引物的核苷酸序列。

SEQ ID NO:31显示编码斑马鱼来源的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Gly70-Asn585)的经密码子优化的核苷酸序列。

SEQ ID NO:32显示斑马鱼来源的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Gly70-Asn585)。

SEQ ID NO:33至138显示引物的核苷酸序列。

序列表

<110> 味之素株式会社

<120> 2-O-硫酸化酶突变体和3-O-硫酸化酶突变体及其使用方法

<130> PAMA-19702

<150> JP 2017-170637

<151> 2017-09-05

<160> 138

<170> PatentIn version 3.5

<210> 1

<211> 1068

<212> DNA

<213> 黑线仓鼠(Cricetulus barabensis)

<400> 1

atggggctcc tcaggatcat gatgccgccc aagttgcagc tgctggcggt ggtggccttc 60

gccgtggcga tgctcttctt ggagaaccag atccagaagc tggaggagtc ccgggcgaag 120

ctagaaaggg caatcgcaag acatgaagtc cgggaaattg aacagcggca tacaatggat 180

ggccctcggc aagatgcggc tgtagatgaa gaagaagata tagtcatcat ttataacaga 240

gttcccaaaa ctgcaagcac ctcgtttacc aatatcgcct atgacttgtg tgcgaagaat 300

agataccatg ttcttcacat caacactacc aaaaacaacc cagtgatgtc attgcaagat 360

caggtacgct ttgtaaagaa tataaccact tggaacgaga tgaaaccagg gttttatcat 420

ggacacattt cttatctgga ttttgcaaaa ttcggtgtga agaagaagcc catttacatt 480

aatgtcatca gggaccctat cgagaggctt gtttcctact attactttct gaggtttggg 540

gatgattaca gaccaggatt aaggagacgg aaacaaggag acaaaaagac ctttgatgaa 600

tgtgtggctg agggcggctc agactgtgct ccggagaagc tctggctcca gatcccattt 660

ttctgtggcc acagctcaga atgctggaat gtgggaagca gatgggctat ggatcaagct 720

aagtataacc tcattaacga gtactttctg gtgggagtta ctgaggagct ggaagacttc 780

atcatgctac tcgaggcagc tttgccccgg tttttccggg gtgctacaga cctctatcgt 840

acaggaaaga aatcccacct gaggaaaacc acagagaaga aacttcccac caagcaaacc 900

atcgcgaagc tgcagcagtc tgacatttgg aaaatggaaa atgagttcta cgagtttgca 960

ctagagcagt tccagttcat cagagcccac gctgtccgtg agaaagatgg agacctctac 1020

atcctggccc agaacttttt ctatgaaaag atttacccga agtcgaac 1068

<210> 2

<211> 356

<212> PRT

<213> 黑线仓鼠

<400> 2

Met Gly Leu Leu Arg Ile Met Met Pro Pro Lys Leu Gln Leu Leu Ala

1 5 10 15

Val Val Ala Phe Ala Val Ala Met Leu Phe Leu Asx Asn Gln Ile Gln

20 25 30

Lys Leu Glu Glu Ser Arg Ala Lys Leu Glu Arg Ala Ile Ala Arg His

35 40 45

Glu Val Arg Glu Ile Glu Gln Arg His Thr Met Asp Gly Pro Arg Gln

50 55 60

Asp Ala Ala Val Asp Glu Glu Glu Asp Ile Val Ile Ile Tyr Asn Arg

65 70 75 80

Val Pro Lys Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu

85 90 95

Cys Ala Lys Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn

100 105 110

Asn Pro Val Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Ile

115 120 125

Thr Thr Trp Asn Glu Met Lys Pro Gly Phe Tyr His Gly His Ile Ser

130 135 140

Tyr Leu Asp Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile

145 150 155 160

Asn Val Ile Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe

165 170 175

Leu Arg Phe Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln

180 185 190

Gly Asp Lys Lys Thr Phe Asp Glu Cys Val Ala Glu Gly Gly Ser Asp

195 200 205

Cys Ala Pro Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His

210 215 220

Ser Ser Glu Cys Trp Asn Val Gly Ser Arg Trp Ala Met Asp Gln Ala

225 230 235 240

Lys Tyr Asn Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu

245 250 255

Leu Glu Asp Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe

260 265 270

Arg Gly Ala Thr Asp Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg

275 280 285

Lys Thr Thr Glu Lys Lys Leu Pro Thr Lys Gln Thr Ile Ala Lys Leu

290 295 300

Gln Gln Ser Asp Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala

305 310 315 320

Leu Glu Gln Phe Gln Phe Ile Arg Ala His Ala Val Arg Glu Lys Asp

325 330 335

Gly Asp Leu Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr

340 345 350

Pro Lys Ser Asn

355

<210> 3

<211> 288

<212> PRT

<213> 人工序列

<220>

<223> 中国仓鼠来源的2-O-硫酸化酶(2-OST)的催化位点(Asp69-Asn356)的氨基酸序列

<400> 3

Asp Glu Glu Glu Asp Ile Val Ile Ile Tyr Asn Arg Val Pro Lys Thr

1 5 10 15

Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys Asn

20 25 30

Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val Met

35 40 45

Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Ile Thr Thr Trp Asn

50 55 60

Glu Met Lys Pro Gly Phe Tyr His Gly His Ile Ser Tyr Leu Asp Phe

65 70 75 80

Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile Arg

85 90 95

Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe Gly

100 105 110

Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys Lys

115 120 125

Thr Phe Asp Glu Cys Val Ala Glu Gly Gly Ser Asp Cys Ala Pro Glu

130 135 140

Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu Cys

145 150 155 160

Trp Asn Val Gly Ser Arg Trp Ala Met Asp Gln Ala Lys Tyr Asn Leu

165 170 175

Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp Phe

180 185 190

Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala Thr

195 200 205

Asp Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr Thr Glu

210 215 220

Lys Lys Leu Pro Thr Lys Gln Thr Ile Ala Lys Leu Gln Gln Ser Asp

225 230 235 240

Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln Phe

245 250 255

Gln Phe Ile Arg Ala His Ala Val Arg Glu Lys Asp Gly Asp Leu Tyr

260 265 270

Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser Asn

275 280 285

<210> 4

<211> 356

<212> PRT

<213> 人工序列

<220>

<223> 具有Y94A突变的中国仓鼠来源的2-O-磺基转移酶(2-OST)的氨基酸序列

<400> 4

Met Gly Leu Leu Arg Ile Met Met Pro Pro Lys Leu Gln Leu Leu Ala

1 5 10 15

Val Val Ala Phe Ala Val Ala Met Leu Phe Leu Asx Asn Gln Ile Gln

20 25 30

Lys Leu Glu Glu Ser Arg Ala Lys Leu Glu Arg Ala Ile Ala Arg His

35 40 45

Glu Val Arg Glu Ile Glu Gln Arg His Thr Met Asp Gly Pro Arg Gln

50 55 60

Asp Ala Ala Val Asp Glu Glu Glu Asp Ile Val Ile Ile Tyr Asn Arg

65 70 75 80

Val Pro Lys Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Ala Asp Leu

85 90 95

Cys Ala Lys Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn

100 105 110

Asn Pro Val Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Ile

115 120 125

Thr Thr Trp Asn Glu Met Lys Pro Gly Phe Tyr His Gly His Ile Ser

130 135 140

Tyr Leu Asp Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile

145 150 155 160

Asn Val Ile Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe

165 170 175

Leu Arg Phe Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln

180 185 190

Gly Asp Lys Lys Thr Phe Asp Glu Cys Val Ala Glu Gly Gly Ser Asp

195 200 205

Cys Ala Pro Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His

210 215 220

Ser Ser Glu Cys Trp Asn Val Gly Ser Arg Trp Ala Met Asp Gln Ala

225 230 235 240

Lys Tyr Asn Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu

245 250 255

Leu Glu Asp Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe

260 265 270

Arg Gly Ala Thr Asp Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg

275 280 285

Lys Thr Thr Glu Lys Lys Leu Pro Thr Lys Gln Thr Ile Ala Lys Leu

290 295 300

Gln Gln Ser Asp Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala

305 310 315 320

Leu Glu Gln Phe Gln Phe Ile Arg Ala His Ala Val Arg Glu Lys Asp

325 330 335

Gly Asp Leu Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr

340 345 350

Pro Lys Ser Asn

355

<210> 5

<211> 864

<212> DNA

<213> 人工序列

<220>

<223> 编码具有Y94A突变的中国仓鼠来源的2-O-磺基转移酶(2-OST)的催化位点(Asp69-Asn356)的核苷酸序列，

其针对大肠杆菌中的密码子选择进行了优化

<400> 5

gatgaagaag aagatatcgt cattatctat aaccgtgttc cgaaaaccgc aagcaccagc 60

tttaccaata ttgcagcaga tctgtgcgcc aaaaatcgct atcatgtgct gcatattaac 120

accaccaaaa ataacccggt tatgagcctg caggatcagg ttcgttttgt taaaaacatt 180

accacctgga acgaaatgaa accgggtttt tatcatggcc atatcagcta tctggatttt 240

gcgaaatttg gcgtgaaaaa aaaaccgatc tacatcaacg ttattcgcga tccgattgaa 300

cgtctggtta gctattatta ctttctgcgc ttcggtgatg attatcgtcc gggtctgcgt 360

cgtcgtaaac agggcgacaa aaaaaccttt gatgaatgtg ttgccgaagg tggtagcgat 420

tgtgcaccgg aaaaactgtg gctgcagatt ccgttttttt gcggtcatag cagcgaatgt 480

tggaatgttg gtagccgttg ggcaatggat caggccaaat ataacctgat caacgaatat 540

tttctggtgg gtgtgaccga agaactggaa gatttcatta tgctgctgga agcagcactg 600

cctcgttttt ttcgtggtgc aaccgatctg tatcgtaccg gtaaaaaaag ccatctgcgt 660

aaaacgacgg aaaaaaaact gccgaccaaa cagaccattg caaaactgca gcagagcgat 720

atttggaaaa tggaaaacga gttttatgaa tttgccctgg aacagtttca gtttattcgt 780

gcacatgcag ttcgtgaaaa agatggtgat ctgtatattc tggcccagaa cttcttctac 840

gaaaaaatct atccgaaaag caat 864

<210> 6

<211> 288

<212> PRT

<213> 人工序列

<220>

<223> 具有Y94A突变的中国仓鼠来源的2-O-磺基转移酶(2-OST)的催化位点(Asp69-Asn356)的氨基酸序列

<400> 6

Asp Glu Glu Glu Asp Ile Val Ile Ile Tyr Asn Arg Val Pro Lys Thr

1 5 10 15

Ala Ser Thr Ser Phe Thr Asn Ile Ala Ala Asp Leu Cys Ala Lys Asn

20 25 30

Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val Met

35 40 45

Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Ile Thr Thr Trp Asn

50 55 60

Glu Met Lys Pro Gly Phe Tyr His Gly His Ile Ser Tyr Leu Asp Phe

65 70 75 80

Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile Arg

85 90 95

Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe Gly

100 105 110

Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys Lys

115 120 125

Thr Phe Asp Glu Cys Val Ala Glu Gly Gly Ser Asp Cys Ala Pro Glu

130 135 140

Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu Cys

145 150 155 160

Trp Asn Val Gly Ser Arg Trp Ala Met Asp Gln Ala Lys Tyr Asn Leu

165 170 175

Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp Phe

180 185 190

Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala Thr

195 200 205

Asp Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr Thr Glu

210 215 220

Lys Lys Leu Pro Thr Lys Gln Thr Ile Ala Lys Leu Gln Gln Ser Asp

225 230 235 240

Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln Phe

245 250 255

Gln Phe Ile Arg Ala His Ala Val Arg Glu Lys Asp Gly Asp Leu Tyr

260 265 270

Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser Asn

275 280 285

<210> 7

<211> 936

<212> DNA

<213> 小鼠

<400> 7

atgaccttgc tgctcctggg tgcggtgctg ctggtggccc agccccagct tgtgcattcc 60

cacccggctg ctcctggccc ggggctcaaa cagcaggagc ttctgaggaa ggtgattatt 120

ctcccagagg acaccggaga aggcacagca tccaatggtt ccacacagca gctgccacag 180

accatcatca ttggggtgcg caagggtggt acccgagccc tgctagagat gctcagcctg 240

catcctgatg ttgctgcagc tgaaaacgag gtccatttct ttgactggga ggagcattac 300

agccaaggcc tgggctggta cctcacccag atgcccttct cctcccctca ccagctcacc 360

gtggagaaga cacccgccta tttcacttcg cccaaagtgc ctgagagaat ccacagcatg 420

aaccccacca tccgcctgct gcttatcctg agggacccat cagagcgcgt gctgtccgac 480

tacacccagg tgttgtacaa ccaccttcag aagcacaagc cctatccacc cattgaggac 540

ctcctaatgc gggacggtcg gctgaacctg gactacaagg ctctcaaccg cagcctgtac 600

catgcacaca tgctgaactg gctgcgtttt ttcccgttgg gccacatcca cattgtggat 660

ggcgaccgcc tcatcagaga ccctttccct gagatccaga aggtcgaaag attcctgaag 720

ctttctccac agatcaacgc ctcgaacttc tactttaaca aaaccaaggg cttctactgc 780

ctgcgggaca gtggcaagga ccgctgctta cacgagtcca aaggccgggc gcacccccag 840

gtggatccca aactacttga taaactgcac gaatactttc atgagccaaa taagaaattt 900

ttcaagctcg tgggcagaac attcgactgg cactga 936

<210> 8

<211> 311

<212> PRT

<213> 小鼠

<400> 8

Met Thr Leu Leu Leu Leu Gly Ala Val Leu Leu Val Ala Gln Pro Gln

1 5 10 15

Leu Val His Ser His Pro Ala Ala Pro Gly Pro Gly Leu Lys Gln Gln

20 25 30

Glu Leu Leu Arg Lys Val Ile Ile Leu Pro Glu Asp Thr Gly Glu Gly

35 40 45

Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile Ile Ile

50 55 60

Gly Val Arg Lys Gly Gly Thr Arg Ala Leu Leu Glu Met Leu Ser Leu

65 70 75 80

His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe Asp Trp

85 90 95

Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln Met Pro

100 105 110

Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr Pro Ala Tyr Phe

115 120 125

Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro Thr Ile

130 135 140

Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu Ser Asp

145 150 155 160

Tyr Thr Gln Val Leu Tyr Asn His Leu Gln Lys His Lys Pro Tyr Pro

165 170 175

Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu Asp Tyr

180 185 190

Lys Ala Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn Trp Leu

195 200 205

Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp Arg Leu

210 215 220

Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe Leu Lys

225 230 235 240

Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys Thr Lys

245 250 255

Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu His Glu

260 265 270

Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu Asp Lys

275 280 285

Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys Leu Val

290 295 300

Gly Arg Thr Phe Asp Trp His

305 310

<210> 9

<211> 792

<212> DNA

<213> 人工序列

<220>

<223> 编码小鼠来源的3-O-磺基转移酶(3-OST)的催化位点(Gly48-His311)的核苷酸序列，其针对大肠杆菌中的密码子选择进行了优化

<400> 9

ggcaccgcaa gcaatggtag cacccagcag ctgccgcaga ccattattat cggtgttcgt 60

aaaggtggca cccgtgcact gctggaaatg ctgagcctgc atcctgatgt tgcagcagca 120

gaaaatgaag tgcatttttt tgattgggag gaacattata gccagggtct gggttggtat 180

ctgacccaga tgccgtttag cagtccgcat cagctgaccg ttgaaaaaac accggcatat 240

ttcaccagcc cgaaagtgcc ggaacgtatt catagcatga atccgaccat tcgcctgctg 300

ctgattctgc gtgatccgag cgaacgtgtt ctgagcgatt atacccaggt tctgtataat 360

catctgcaga aacataaacc gtatccgcct attgaagatc tgctgatgcg tgatggtcgt 420

ctgaatctgg attataaagc actgaatcgt agcctgtatc atgcccatat gctgaattgg 480

ctgcgttttt ttccgctggg tcatattcat attgttgatg gtgatcgtct gattcgtgat 540

ccgtttcctg aaattcagaa agtggaacgt tttctgaaac tgagtccgca gattaatgcc 600

agcaacttct attttaacaa aaccaaaggc ttctattgcc tgcgtgatag cggtaaagat 660

cgttgtctgc atgaaagcaa aggtcgtgca catccgcagg ttgatccgaa actgctggat 720

aaactgcatg aatattttca tgaaccgaac aaaaaattct ttaaactggt gggtcgtacc 780

ttcgattggc at 792

<210> 10

<211> 264

<212> PRT

<213> 人工序列

<220>

<223> 小鼠来源的3-O-磺基转移酶(3-OST)的催化位点(Gly48-His311)的氨基酸序列

<400> 10

Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile Ile

1 5 10 15

Ile Gly Val Arg Lys Gly Gly Thr Arg Ala Leu Leu Glu Met Leu Ser

20 25 30

Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe Asp

35 40 45

Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln Met

50 55 60

Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr Pro Ala Tyr

65 70 75 80

Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro Thr

85 90 95

Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu Ser

100 105 110

Asp Tyr Thr Gln Val Leu Tyr Asn His Leu Gln Lys His Lys Pro Tyr

115 120 125

Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu Asp

130 135 140

Tyr Lys Ala Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn Trp

145 150 155 160

Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp Arg

165 170 175

Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe Leu

180 185 190

Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys Thr

195 200 205

Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu His

210 215 220

Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu Asp

225 230 235 240

Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys Leu

245 250 255

Val Gly Arg Thr Phe Asp Trp His

260

<210> 11

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 11

agctgagtcg acccccagga aaaattggtt aataac 36

<210> 12

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 12

agctgagcat gcttccaact gcgctaatga cgc 33

<210> 13

<211> 313

<212> DNA

<213> 人工序列

<220>

<223> 片段

<400> 13

gcatgcttcc aactgcgcta atgacgcagc tggacgaagg cgggattctc gtcttacccg 60

taggggagga gcaccagtat ttgaaacggg tgcgtcgtcg gggaggcgaa tttattatcg 120

ataccgtgga ggccgtgcgc tttgtccctt tagtgaaggg tgagctggct taaaacgtga 180

ggaaatacct ggatttttcc tggttatttt gccgcaggtc agcgtatcgt gaacatcttt 240

tccagtgttc agtagggtgc cttgcacggt aattatgtca ctggttatta accaattttt 300

cctgggggtc gac 313

<210> 14

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 14

agctgatcta gaaaacagaa tttgcctggc ggc 33

<210> 15

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 15

agctgaggat ccaggaagag tttgtagaaa cgc 33

<210> 16

<211> 369

<212> DNA

<213> 人工序列

<220>

<223> 片段

<400> 16

tctagaaaca gaatttgcct ggcggcagta gcgcggtggt cccacctgac cccatgccga 60

actcagaagt gaaacgccgt agcgccgatg gtagtgtggg gtctccccat gcgagagtag 120

ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt 180

atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa atccgccggg agcggatttg 240

aacgttgcga agcaacggcc cggagggtgg cgggcaggac gcccgccata aactgccagg 300

catcaaatta agcagaaggc catcctgacg gatggccttt ttgcgtttct acaaactctt 360

cctggatcc 369

<210> 17

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 17

ttcctggggg tcgacatgac tacgaaaatt tttaa 35

<210> 18

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 18

attctgtttt ctagactaag gaaccaacac aagct 35

<210> 19

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 19

gtcgaccccc aggaaaaatt ggttaataac 30

<210> 20

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 20

tctagaaaac agaatttgcc tggcggcagt 30

<210> 21

<211> 1980

<212> DNA

<213> 肝素黄杆菌

<400> 21

atgactacga aaatttttaa aaggatcatt gtatttgctg taattgccct atcgtcggga 60

aatatacttg cacaaagctc ttccattacc aggaaagatt ttgaccacat caaccttgag 120

tattccggac tggaaaaggt taataaagca gttgctgccg gcaactatga cgatgcggcc 180

aaagcattac tggcatacta cagggaaaaa agtaaggcca gggaacctga tttcagtaat 240

gcagaaaagc ctgccgatat acgccagccc atagataagg ttacgcgtga aatggccgac 300

aaggctttgg tccaccagtt tcaaccgcac aaaggctacg gctattttga ttatggtaaa 360

gacatcaact ggcagatgtg gccggtaaaa gacaatgaag tacgctggca gttgcaccgt 420

gtaaaatggt ggcaggctat ggccctggtt tatcacgcta cgggcgatga aaaatatgca 480

agagaatggg tatatcagta cagcgattgg gccagaaaaa acccattggg cctgtcgcag 540

gataatgata aatttgtgtg gcggcccctt gaagtgtcgg acagggtaca aagtcttccc 600

ccaaccttca gcttatttgt aaactcgcca gcctttaccc cagccttttt aatggaattt 660

ttaaacagtt accaccaaca ggccgattat ttatctacgc attatgccga acagggaaac 720

caccgtttat ttgaagccca acgcaacttg tttgcagggg tatctttccc tgaatttaaa 780

gattcaccaa gatggaggca aaccggcata tcggtgctga acaccgagat caaaaaacag 840

gtttatgccg atgggatgca gtttgaactt tcaccaattt accatgtagc tgccatcgat 900

atcttcttaa aggcctatgg ttctgcaaaa cgagttaacc ttgaaaaaga atttccgcaa 960

tcttatgtac aaactgtaga aaatatgatt atggcgctga tcagtatttc actgccagat 1020

tataacaccc ctatgtttgg agattcatgg attacagata aaaatttcag gatggcacag 1080

tttgccagct gggcccgggt tttcccggca aaccaggcca taaaatattt tgctacagat 1140

ggcaaacaag gtaaggcgcc taacttttta tccaaagcat tgagcaatgc aggcttttat 1200

acgtttagaa gcggatggga taaaaatgca accgttatgg tattaaaagc cagtcctccc 1260

ggagaatttc atgcccagcc ggataacggg acttttgaac tttttataaa gggcagaaac 1320

tttaccccag acgccggggt atttgtgtat agcggcgacg aagccatcat gaaactgcgg 1380

aactggtacc gtcaaacccg catacacagc acgcttacac tcgacaatca aaatatggtc 1440

attaccaaag cccggcaaaa caaatgggaa acaggaaata accttgatgt gcttacctat 1500

accaacccaa gctatccgaa tctggaccat cagcgcagtg tacttttcat caacaaaaaa 1560

tactttctgg tcatcgatag ggcaataggc gaagctaccg gaaacctggg cgtacactgg 1620

cagcttaaag aagacagcaa ccctgttttc gataagacaa agaaccgggt ttacaccact 1680

tacagagatg gtaacaacct gatgatccaa tcgttgaatg cggacaggac cagcctcaat 1740

gaagaagaag gaaaggtatc ttatgtttac aataaggagc tgaaaagacc tgctttcgta 1800

tttgaaaagc ctaaaaagaa tgccggcaca caaaattttg tcagtatagt ttatccatac 1860

gacggccaga aggctccaga gatcagcata cgggaaaaca agggcaatga ttttgagaaa 1920

ggcaagctta atctaaccct taccattaac ggaaaacaac agcttgtgtt ggttccttag 1980

<210> 22

<211> 659

<212> PRT

<213> 肝素黄杆菌

<400> 22

Met Thr Thr Lys Ile Phe Lys Arg Ile Ile Val Phe Ala Val Ile Ala

1 5 10 15

Leu Ser Ser Gly Asn Ile Leu Ala Gln Ser Ser Ser Ile Thr Arg Lys

20 25 30

Asp Phe Asp His Ile Asn Leu Glu Tyr Ser Gly Leu Glu Lys Val Asn

35 40 45

Lys Ala Val Ala Ala Gly Asn Tyr Asp Asp Ala Ala Lys Ala Leu Leu

50 55 60

Ala Tyr Tyr Arg Glu Lys Ser Lys Ala Arg Glu Pro Asp Phe Ser Asn

65 70 75 80

Ala Glu Lys Pro Ala Asp Ile Arg Gln Pro Ile Asp Lys Val Thr Arg

85 90 95

Glu Met Ala Asp Lys Ala Leu Val His Gln Phe Gln Pro His Lys Gly

100 105 110

Tyr Gly Tyr Phe Asp Tyr Gly Lys Asp Ile Asn Trp Gln Met Trp Pro

115 120 125

Val Lys Asp Asn Glu Val Arg Trp Gln Leu His Arg Val Lys Trp Trp

130 135 140

Gln Ala Met Ala Leu Val Tyr His Ala Thr Gly Asp Glu Lys Tyr Ala

145 150 155 160

Arg Glu Trp Val Tyr Gln Tyr Ser Asp Trp Ala Arg Lys Asn Pro Leu

165 170 175

Gly Leu Ser Gln Asp Asn Asp Lys Phe Val Trp Arg Pro Leu Glu Val

180 185 190

Ser Asp Arg Val Gln Ser Leu Pro Pro Thr Phe Ser Leu Phe Val Asn

195 200 205

Ser Pro Ala Phe Thr Pro Ala Phe Leu Met Glu Phe Leu Asn Ser Tyr

210 215 220

His Gln Gln Ala Asp Tyr Leu Ser Thr His Tyr Ala Glu Gln Gly Asn

225 230 235 240

His Arg Leu Phe Glu Ala Gln Arg Asn Leu Phe Ala Gly Val Ser Phe

245 250 255

Pro Glu Phe Lys Asp Ser Pro Arg Trp Arg Gln Thr Gly Ile Ser Val

260 265 270

Leu Asn Thr Glu Ile Lys Lys Gln Val Tyr Ala Asp Gly Met Gln Phe

275 280 285

Glu Leu Ser Pro Ile Tyr His Val Ala Ala Ile Asp Ile Phe Leu Lys

290 295 300

Ala Tyr Gly Ser Ala Lys Arg Val Asn Leu Glu Lys Glu Phe Pro Gln

305 310 315 320

Ser Tyr Val Gln Thr Val Glu Asn Met Ile Met Ala Leu Ile Ser Ile

325 330 335

Ser Leu Pro Asp Tyr Asn Thr Pro Met Phe Gly Asp Ser Trp Ile Thr

340 345 350

Asp Lys Asn Phe Arg Met Ala Gln Phe Ala Ser Trp Ala Arg Val Phe

355 360 365

Pro Ala Asn Gln Ala Ile Lys Tyr Phe Ala Thr Asp Gly Lys Gln Gly

370 375 380

Lys Ala Pro Asn Phe Leu Ser Lys Ala Leu Ser Asn Ala Gly Phe Tyr

385 390 395 400

Thr Phe Arg Ser Gly Trp Asp Lys Asn Ala Thr Val Met Val Leu Lys

405 410 415

Ala Ser Pro Pro Gly Glu Phe His Ala Gln Pro Asp Asn Gly Thr Phe

420 425 430

Glu Leu Phe Ile Lys Gly Arg Asn Phe Thr Pro Asp Ala Gly Val Phe

435 440 445

Val Tyr Ser Gly Asp Glu Ala Ile Met Lys Leu Arg Asn Trp Tyr Arg

450 455 460

Gln Thr Arg Ile His Ser Thr Leu Thr Leu Asp Asn Gln Asn Met Val

465 470 475 480

Ile Thr Lys Ala Arg Gln Asn Lys Trp Glu Thr Gly Asn Asn Leu Asp

485 490 495

Val Leu Thr Tyr Thr Asn Pro Ser Tyr Pro Asn Leu Asp His Gln Arg

500 505 510

Ser Val Leu Phe Ile Asn Lys Lys Tyr Phe Leu Val Ile Asp Arg Ala

515 520 525

Ile Gly Glu Ala Thr Gly Asn Leu Gly Val His Trp Gln Leu Lys Glu

530 535 540

Asp Ser Asn Pro Val Phe Asp Lys Thr Lys Asn Arg Val Tyr Thr Thr

545 550 555 560

Tyr Arg Asp Gly Asn Asn Leu Met Ile Gln Ser Leu Asn Ala Asp Arg

565 570 575

Thr Ser Leu Asn Glu Glu Glu Gly Lys Val Ser Tyr Val Tyr Asn Lys

580 585 590

Glu Leu Lys Arg Pro Ala Phe Val Phe Glu Lys Pro Lys Lys Asn Ala

595 600 605

Gly Thr Gln Asn Phe Val Ser Ile Val Tyr Pro Tyr Asp Gly Gln Lys

610 615 620

Ala Pro Glu Ile Ser Ile Arg Glu Asn Lys Gly Asn Asp Phe Glu Lys

625 630 635 640

Gly Lys Leu Asn Leu Thr Leu Thr Ile Asn Gly Lys Gln Gln Leu Val

645 650 655

Leu Val Pro

<210> 23

<211> 6646

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 23

ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga 60

gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg 120

gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa 180

cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac 240

aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc 300

acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg 360

tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc 420

ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca 480

ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga 540

cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc 600

tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg 660

cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag 720

cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga 780

atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa 840

tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg 900

acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc 960

gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga 1020

agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata 1080

cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 1140

cccgactgga aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag 1200

gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 1260

tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 1320

tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 1380

ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga 1440

attgtgagcg gataacaatt tcacacagga aacagccagt ccgtttaggt gttttcacga 1500

gcacttcacc aacaaggacc atagcatatg aaaatcgaag aaggtaaact ggtaatctgg 1560

attaacggcg ataaaggcta taacggtctc gctgaagtcg gtaagaaatt cgagaaagat 1620

accggaatta aagtcaccgt tgagcatccg gataaactgg aagagaaatt cccacaggtt 1680

gcggcaactg gcgatggccc tgacattatc ttctgggcac acgaccgctt tggtggctac 1740

gctcaatctg gcctgttggc tgaaatcacc ccggacaaag cgttccagga caagctgtat 1800

ccgtttacct gggatgccgt acgttacaac ggcaagctga ttgcttaccc gatcgctgtt 1860

gaagcgttat cgctgattta taacaaagat ctgctgccga acccgccaaa aacctgggaa 1920

gagatcccgg cgctggataa agaactgaaa gcgaaaggta agagcgcgct gatgttcaac 1980

ctgcaagaac cgtacttcac ctggccgctg attgctgctg acgggggtta tgcgttcaag 2040

tatgaaaacg gcaagtacga cattaaagac gtgggcgtgg ataacgctgg cgcgaaagcg 2100

ggtctgacct tcctggttga cctgattaaa aacaaacaca tgaatgcaga caccgattac 2160

tccatcgcag aagctgcctt taataaaggc gaaacagcga tgaccatcaa cggcccgtgg 2220

gcatggtcca acatcgacac cagcaaagtg aattatggtg taacggtact gccgaccttc 2280

aagggtcaac catccaaacc gttcgttggc gtgctgagcg caggtattaa cgccgccagt 2340

ccgaacaaag agctggcaaa agagttcctc gaaaactatc tgctgactga tgaaggtctg 2400

gaagcggtta ataaagacaa accgctgggt gccgtagcgc tgaagtctta cgaggaagag 2460

ttggcgaaag atccacgtat tgccgccact atggaaaacg cccagaaagg tgaaatcatg 2520

ccgaacatcc cgcagatgtc cgctttctgg tatgccgtgc gtactgcggt gatcaacgcc 2580

gccagcggtc gtcagactgt cgatgaagcc ctgaaagacg cgcagactaa ttcgagctcg 2640

aacaacaaca acaataacaa taacaacaac ctcgggatcg agggaaggat ttcagaattc 2700

ggatcctcta gagtcgacct gcaggcaagc ttggcactgg ccgtcgtttt acaacgtcgt 2760

gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 2820

agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 2880

aatggcgaat ggcagcttgg ctgttttggc ggatgagata agattttcag cctgatacag 2940

attaaatcag aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg 3000

gtggtcccac ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt 3060

gtggggtctc cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca 3120

gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag 3180

gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa cggcccggag ggtggcgggc 3240

aggacgcccg ccataaactg ccaggcatca aattaagcag aaggccatcc tgacggatgg 3300

cctttttgcg tttctacaaa ctctttttgt ttatttttct aaatacattc aaatatgtat 3360

ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 3420

agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 3480

tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 3540

gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 3600

gaacgttctc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 3660

gttgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 3720

gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 3780

agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 3840

ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 3900

cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 3960

gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 4020

cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 4080

gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 4140

ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 4200

acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 4260

ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 4320

ccccggttga taatcagaaa agccccaaaa acaggaagat tgtataagca aatatttaaa 4380

ttgtaaacgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt 4440

ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 4500

ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg 4560

tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcacccaaat 4620

caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc 4680

gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga 4740

aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 4800

ccgccgcgct taatgcgccg ctacagggcg cgtaaaagga tctaggtgaa gatccttttt 4860

gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 4920

gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 4980

caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 5040

ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg 5100

tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 5160

ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 5220

tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 5280

cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 5340

gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 5400

ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 5460

gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 5520

agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 5580

tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 5640

tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 5700

gaggaagcgg aagagcgcct gatgcggtat tttctcctta cgcatctgtg cggtatttca 5760

caccgcatat atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt 5820

atacactccg ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc 5880

cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5940

cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca 6000

gctgcggtaa agctcatcag cgtggtcgtg cagcgattca cagatgtctg cctgttcatc 6060

cgcgtccagc tcgttgagtt tctccagaag cgttaatgtc tggcttctga taaagcgggc 6120

catgttaagg gcggtttttt cctgtttggt cactgatgcc tccgtgtaag ggggatttct 6180

gttcatgggg gtaatgatac cgatgaaacg agagaggatg ctcacgatac gggttactga 6240

tgatgaacat gcccggttac tggaacgttg tgagggtaaa caactggcgg tatggatgcg 6300

gcgggaccag agaaaaatca ctcagggtca atgccagcgc ttcgttaata cagatgtagg 6360

tgttccacag ggtagccagc agcatcctgc gatgcagatc cggaacataa tggtgcaggg 6420

cgctgacttc cgcgtttcca gactttacga aacacggaaa ccgaagacca ttcatgttgt 6480

tgctcaggtc gcagacgttt tgcagcagca gtcgcttcac gttcgctcgc gtatcggtga 6540

ttcattctgc taaccagtaa ggcaaccccg ccagcctagc cgggtcctca acgacaggag 6600

cacgatcatg cgcacccgtg gccaggaccc aacgctgccc gaaatt 6646

<210> 24

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 24

aagcttggca ctggccgtcg ttttacaacg tcgtg 35

<210> 25

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 25

ggatccgaat tctgaaatcc ttccctcgat cccga 35

<210> 26

<211> 6556

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 26

ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga 60

gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg 120

gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa 180

cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac 240

aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc 300

acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg 360

tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc 420

ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca 480

ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga 540

cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc 600

tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg 660

cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag 720

cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga 780

atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa 840

tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg 900

acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc 960

gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga 1020

agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata 1080

cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 1140

cccgactgga aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag 1200

gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 1260

tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 1320

tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 1380

ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga 1440

attgtgagcg gataacaatt tcacacagga aacagccagt ccgtttaggt gttttcacga 1500

gcacttcacc aacaaggacc atagcatatg aaaatcgaag aaggtaaact ggtaatctgg 1560

attaacggcg ataaaggcta taacggtctc gctgaagtcg gtaagaaatt cgagaaagat 1620

accggaatta aagtcaccgt tgagcatccg gataaactgg aagagaaatt cccacaggtt 1680

gcggcaactg gcgatggccc tgacattatc ttctgggcac acgaccgctt tggtggctac 1740

gctcaatctg gcctgttggc tgaaatcacc ccggacaaag cgttccagga caagctgtat 1800

ccgtttacct gggatgccgt acgttacaac ggcaagctga ttgcttaccc gatcgctgtt 1860

gaagcgttat cgctgattta taacaaagat ctgctgccga acccgccaaa aacctgggaa 1920

gagatcccgg cgctggataa agaactgaaa gcgaaaggta agagcgcgct gatgttcaac 1980

ctgcaagaac cgtacttcac ctggccgctg attgctgctg acgggggtta tgcgttcaag 2040

tatgaaaacg gcaagtacga cattaaagac gtgggcgtgg ataacgctgg cgcgaaagcg 2100

ggtctgacct tcctggttga cctgattaaa aacaaacaca tgaatgcaga caccgattac 2160

tccatcgcag aagctgcctt taataaaggc gaaacagcga tgaccatcaa cggcccgtgg 2220

gcatggtcca acatcgacac cagcaaagtg aattatggtg taacggtact gccgaccttc 2280

aagggtcaac catccaaacc gttcgttggc gtgctgagcg caggtattaa cgccgccagt 2340

ccgaacaaag agctggcaaa agagttcctc gaaaactatc tgctgactga tgaaggtctg 2400

gaagcggtta ataaagacaa accgctgggt gccgtagcgc tgaagtctta cgaggaagag 2460

ttggcgaaag atccacgtat tgccgccact atggaaaacg cccagaaagg tgaaatcatg 2520

ccgaacatcc cgcagatgtc cgctttctgg tatgccgtgc gtactgcggt gatcaacgcc 2580

gccagcggtc gtcagactgt cgatgcagcc ctggcggccg cctcgagctc ggatccaagc 2640

ttggcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt 2700

aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc 2760

gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcagcttgg ctgttttggc 2820

ggatgagata agattttcag cctgatacag attaaatcag aacgcagaag cggtctgata 2880

aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca 2940

gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac 3000

tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg 3060

ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt 3120

tgcgaagcaa cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggcatca 3180

aattaagcag aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctctttttgt 3240

ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg 3300

cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt 3360

cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta 3420

aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc 3480

ggtaagatcc ttgagagttt tcgccccgaa gaacgttctc caatgatgag cacttttaaa 3540

gttctgctat gtggcgcggt attatcccgt gttgacgccg ggcaagagca actcggtcgc 3600

cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga aaagcatctt 3660

acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag tgataacact 3720

gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc ttttttgcac 3780

aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa tgaagccata 3840

ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta 3900

ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg gatggaggcg 3960

gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgctgat 4020

aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg gccagatggt 4080

aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat ggatgaacga 4140

aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact gtcagaccaa 4200

gtttactcat atatacttta gattgattta ccccggttga taatcagaaa agccccaaaa 4260

acaggaagat tgtataagca aatatttaaa ttgtaaacgt taatattttg ttaaaattcg 4320

cgttaaattt ttgttaaatc agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc 4380

cttataaatc aaaagaatag accgagatag ggttgagtgt tgttccagtt tggaacaaga 4440

gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg 4500

atggcccact acgtgaacca tcacccaaat caagtttttt ggggtcgagg tgccgtaaag 4560

cactaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga aagccggcga 4620

acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctagggcg ctggcaagtg 4680

tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg ctacagggcg 4740

cgtaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 4800

gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 4860

cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 4920

gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 4980

gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 5040

tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 5100

ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 5160

cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 5220

gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 5280

gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 5340

gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 5400

cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 5460

tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 5520

cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 5580

cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat 5640

tttctcctta cgcatctgtg cggtatttca caccgcatat atggtgcact ctcagtacaa 5700

tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 5760

catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 5820

cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 5880

ttcaccgtca tcaccgaaac gcgcgaggca gctgcggtaa agctcatcag cgtggtcgtg 5940

cagcgattca cagatgtctg cctgttcatc cgcgtccagc tcgttgagtt tctccagaag 6000

cgttaatgtc tggcttctga taaagcgggc catgttaagg gcggtttttt cctgtttggt 6060

cactgatgcc tccgtgtaag ggggatttct gttcatgggg gtaatgatac cgatgaaacg 6120

agagaggatg ctcacgatac gggttactga tgatgaacat gcccggttac tggaacgttg 6180

tgagggtaaa caactggcgg tatggatgcg gcgggaccag agaaaaatca ctcagggtca 6240

atgccagcgc ttcgttaata cagatgtagg tgttccacag ggtagccagc agcatcctgc 6300

gatgcagatc cggaacataa tggtgcaggg cgctgacttc cgcgtttcca gactttacga 6360

aacacggaaa ccgaagacca ttcatgttgt tgctcaggtc gcagacgttt tgcagcagca 6420

gtcgcttcac gttcgctcgc gtatcggtga ttcattctgc taaccagtaa ggcaaccccg 6480

ccagcctagc cgggtcctca acgacaggag cacgatcatg cgcacccgtg gccaggaccc 6540

aacgctgccc gaaatt 6556

<210> 27

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 27

tccagaagac gcggccgc 18

<210> 28

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 28

ctcgagctcg gatccaagct tg 22

<210> 29

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 29

gccgcgtctt ctggaggcgt tcggtatgaa gaaatc 36

<210> 30

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 30

ggatccgagc tcgagttaat tatgctttgc gcgaccg 37

<210> 31

<211> 1551

<212> DNA

<213> 斑马鱼

<400> 31

ggcgttcggt atgaagaaat cgactgcttg attaacgacg atgcaaccat caaagggcgc 60

cgcgaaggct ctgaggtgta catgccgttt agctggatgg aaaagtattt cgaagtgtac 120

ggcaaagttg tgcaatacga tggctatgat cgctttgaat tctctcattc atacagcaaa 180

gtgtatgcgc agcgcgagca gtatcatccg aatggtgtct ttatgagctt tgaggggtat 240

aacgtagaag tgcgcgatcg tgtcaaatgt atctccggtg ttgaaggtgt tccgcttagc 300

acccagtggg gtccacaggg ctacttttat gcgattcaga ttgcccagta cggtctgtcg 360

cactattcga agaacttaac cgaacgtccg ccgcatgtgg aggtgtatga tacggcggaa 420

gaacgcgaca gtcgtagttc tgcctggacc gttccaaaag gatgctcact gacccgcgtt 480

tacgacaaaa cccgcgcgac aagcgtccgc gaatttagcg ctccggaaaa tagcgaagga 540

gttagcttac cacttggtaa caccaaagat ttcattatct cctttgacct gaaattcaca 600

agtaatgggt cagtctctgt gattttggag actactgaaa agggaccgcc gtttgtgatc 660

cactatgtca ccacgacgca gttgatcctt ctgaaagatc gtgacattac ctacgggatt 720

ggtccacgca cgacctggac aactgtaacc cgggatctgc tgacggactt acgcaaaggt 780

atcggcctta gcaacacgaa ggcagtaaaa gcaaccaaaa ccatgccgcg ccgtgtggta 840

aaactggtcg tacatggcac gggtaccatt gacaacatca ccattagcac cacgtcccat 900

atggccgcct tttatgccgc gtctgattgg ttggtgcgca atcaggatga acgtggtggc 960

tggccgatta tggtcacccg caaattaggc gagggcttcc gtgccttgga accgggctgg 1020

tattccgcga tggcgcaggg ccaagcgatg tccactctgg tgcgtgccta tctcatgacg 1080

aaagacgatc gttatctgaa agcggcgctg cgtgcaactg gcccttttaa gctgccgtca 1140

gaacagcacg gagtgaaagc ggtgtttatg aacaaatacg attggtacga agagtatccg 1200

acaatcccta gttcctttgt cctgaacggt ttcatctatt cacttattgg cctgtttgat 1260

ctggcacaga ctgctggcga gaaactgggc cgtgatgcgg gtcagctcta cagcaagggg 1320

atggagtctc tgaaagttat gttaccgctc tacgatacag ggtcggggac catctatgat 1380

ctccgccact tcattctggg aacagctccc aatctggcac gttgggatta ccacaccacg 1440

catattaatc agctgcaact gctgggtact atcgataata gtccgatttt ccgcgactcg 1500

gtcaaacgct ggaaatcgta cctgaaaggc ggtcgcgcaa agcataatta a 1551

<210> 32

<211> 4

<212> PRT

<213> 斑马鱼

<220>

<221> misc_feature

<222> (1)..(4)

<223> Xaa可以是任何天然存在的氨基酸

<400> 32

Xaa Xaa Xaa Xaa

1

<210> 33

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 33

taactcgagc tcggatccaa g 21

<210> 34

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 34

cgctgctgca ttagtctgcg 20

<210> 35

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 35

actaatgcag cagcggatga agaagaagat atcgtcatta tctataac 48

<210> 36

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 36

tccgagctcg agttaattgc ttttcggata gattttttcg tag 43

<210> 37

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 37

gttttatgaa tttgccaaag aacagtttca g 31

<210> 38

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 38

ctgaaactgt tctttggcaa attcataaaa c 31

<210> 39

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 39

gttttatgaa tttgcccgtg aacagtttca g 31

<210> 40

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 40

ctgaaactgt tcacgggcaa attcataaaa c 31

<210> 41

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 41

gatggtgatc tgtatgaact ggcccagaac ttc 33

<210> 42

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 42

gaagttctgg gccagttcat acagatcacc atc 33

<210> 43

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 43

gatggtgatc tgtatgatct ggcccagaac ttc 33

<210> 44

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 44

gaagttctgg gccagatcat acagatcacc atc 33

<210> 45

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 45

cgtgcacatg caaaacgtga aaaagatgg 29

<210> 46

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 46

ccatcttttt cacgttttgc atgtgcacg 29

<210> 47

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 47

cgaccaaaca gaccgaagca aaactgcagc ag 32

<210> 48

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 48

ctgctgcagt tttgcttcgg tctgtttggt cg 32

<210> 49

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 49

cagcagagcg atattgcgaa aatggaaaac gag 33

<210> 50

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 50

ctcgttttcc attttcgcaa tatcgctctg ctg 33

<210> 51

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 51

cagcagagcg atattaacaa aatggaaaac gag 33

<210> 52

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 52

ctcgttttcc attttgttaa tatcgctctg ctg 33

<210> 53

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 53

aatggaaaac gagtttgctg aatttgccc 29

<210> 54

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 54

gggcaaattc agcaaactcg ttttccatt 29

<210> 55

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 55

ccgaaggtgg tagcgaatgt gcaccggaaa aac 33

<210> 56

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 56

gtttttccgg tgcacattcg ctaccacctt cgg 33

<210> 57

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 57

ctggtgggtg tgctggaaga actggaag 28

<210> 58

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 58

cttccagttc ttccagcaca cccaccag 28

<210> 59

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 59

gatatttgga aaatggaata cgagttttat gaatttg 37

<210> 60

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 60

caaattcata aaactcgtat tccattttcc aaatatc 37

<210> 61

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 61

gatatttgga aaatggaacg cgagttttat gaatttg 37

<210> 62

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 62

caaattcata aaactcgcgt tccattttcc aaatatc 37

<210> 63

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 63

gatatttgga aaatggaaaa agagttttat gaatttg 37

<210> 64

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 64

caaattcata aaactctttt tccattttcc aaatatc 37

<210> 65

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 65

cggtgttcgt aaacatggca cccgtgcact g 31

<210> 66

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 66

cagtgcacgg gtgccatgtt tacgaacacc g 31

<210> 67

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 67

gtgcactgct ggaaaaactg agcctgcatc c 31

<210> 68

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 68

ggatgcaggc tcagtttttc cagcagtgca c 31

<210> 69

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 69

gtgcactgct ggaatacctg agcctgcatc c 31

<210> 70

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 70

ggatgcaggc tcaggtattc cagcagtgca c 31

<210> 71

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 71

ctgaccgttg aaaaacgtcc ggcatatttc ac 32

<210> 72

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 72

gtgaaatatg ccggacgttt ttcaacggtc ag 32

<210> 73

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 73

ctgaccgttg aaaaacaccc ggcatatttc ac 32

<210> 74

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 74

gtgaaatatg ccgggtgttt ttcaacggtc ag 32

<210> 75

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 75

ctgaccgttg aaaaaaaacc ggcatatttc ac 32

<210> 76

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 76

gtgaaatatg ccggtttttt ttcaacggtc ag 32

<210> 77

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 77

gcgattatac ccagcgtctg tataatcatc tg 32

<210> 78

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 78

cagatgatta tacagacgct gggtataatc gc 32

<210> 79

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 79

cccaggttct gtatcatcat ctgcagaaac 30

<210> 80

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 80

gtttctgcag atgatgatac agaacctggg 30

<210> 81

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 81

ccgttgaaaa aacagcggca tatttcacca g 31

<210> 82

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 82

ctggtgaaat atgccgctgt tttttcaacg g 31

<210> 83

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 83

cccaggttct gtataaacat ctgcagaaac 30

<210> 84

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 84

gtttctgcag atgtttatac agaacctggg 30

<210> 85

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 85

cccgtgcact gctgcagatg ctgagcctgc 30

<210> 86

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 86

gcaggctcag catctgcagc agtgcacggg 30

<210> 87

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 87

cccgtgcact gctgaacatg ctgagcctgc 30

<210> 88

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 88

gcaggctcag catgttcagc agtgcacggg 30

<210> 89

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 89

gttgcagcag cagaacatga agtgcatttt tttg 34

<210> 90

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 90

caaaaaaatg cacttcatgt tctgctgctg caac 34

<210> 91

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 91

gtgcattttt ttgatttcga ggaacattat ag 32

<210> 92

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 92

ctataatgtt cctcgaaatc aaaaaaatgc ac 32

<210> 93

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 93

gtataatcat ctgcagcagc ataaaccgta tcc 33

<210> 94

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 94

ggatacggtt tatgctgctg cagatgatta tac 33

<210> 95

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 95

gtataatcat ctgcagaacc ataaaccgta tcc 33

<210> 96

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 96

ggatacggtt tatggttctg cagatgatta tac 33

<210> 97

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 97

caaaaccaaa ggcttctttt gcctgcgtga tag 33

<210> 98

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 98

ctatcacgca ggcaaaagaa gcctttggtt ttg 33

<210> 99

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 99

gcgattatac ccagattctg tataatcatc tg 32

<210> 100

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 100

cagatgatta tacagaatct gggtataatc gc 32

<210> 101

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 101

gatggtgatc gtctggttcg tgatccgttt cc 32

<210> 102

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 102

ggaaacggat cacgaaccag acgatcacca tc 32

<210> 103

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 103

gtctgaatct ggattttaaa gcactgaatc g 31

<210> 104

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 104

cgattcagtg ctttaaaatc cagattcaga c 31

<210> 105

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 105

ccattattat cggtattcgt aaaggtggca c 31

<210> 106

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 106

gtgccacctt tacgaatacc gataataatg g 31

<210> 107

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 107

cattcgcctg ctgctggttc tgcgtgatcc gag 33

<210> 108

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 108

ctcggatcac gcagaaccag cagcaggcga atg 33

<210> 109

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 109

cagaaacata aaccgtttcc gcctattgaa g 31

<210> 110

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 110

cttcaatagg cggaaacggt ttatgtttct g 31

<210> 111

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 111

gattataccc aggttctgtt taatcatctg cagaaac 37

<210> 112

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 112

gtttctgcag atgattaaac agaacctggg tataatc 37

<210> 113

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 113

gaaaaaacac cggcattttt caccagcccg aaag 34

<210> 114

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 114

ctttcgggct ggtgaaaaat gccggtgttt tttc 34

<210> 115

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 115

gtgttctgag cgattttacc caggttctg 29

<210> 116

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 116

cagaacctgg gtaaaatcgc tcagaacac 29

<210> 117

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 117

gattaatgcc agcaactact attttaacaa aac 33

<210> 118

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 118

gttttgttaa aatagtagtt gctggcatta atc 33

<210> 119

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 119

gtgcactgct ggaactgctg agcctgcatc c 31

<210> 120

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 120

ggatgcaggc tcagcagttc cagcagtgca c 31

<210> 121

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 121

ctattttaac aaaacccgtg gcttctattg cctg 34

<210> 122

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 122

caggcaatag aagccacggg ttttgttaaa atag 34

<210> 123

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 123

gatggtgatc gtctgctgcg tgatccgttt cc 32

<210> 124

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 124

ggaaacggat cacgcagcag acgatcacca tc 32

<210> 125

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 125

ctgaatctgg attatcgtgc actgaatcgt ag 32

<210> 126

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 126

ctacgattca gtgcacgata atccagattc ag 32

<210> 127

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 127

cattcgcctg ctgctgctgc tgcgtgatcc gag 33

<210> 128

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 128

ctcggatcac gcagcagcag cagcaggcga atg 33

<210> 129

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 129

gaacgtgttc tgagcgaata tacccaggtt ctg 33

<210> 130

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 130

cagaacctgg gtatattcgc tcagaacacg ttc 33

<210> 131

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 131

gatgttgcag cagcagacaa tgaagtgcat tttttt 36

<210> 132

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 132

aaaaaaatgc acttcattgt ctgctgctgc aacatc 36

<210> 133

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 133

ctgcgtgatc cgagcgaccg tgttctgagc g 31

<210> 134

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 134

cgctcagaac acggtcgctc ggatcacgca g 31

<210> 135

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 135

gatcgttgtc tgcatgacag caaaggtcgt gc 32

<210> 136

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 136

gcacgacctt tgctgtcatg cagacaacga tc 32

<210> 137

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 137

cccgtgcact gctggacatg ctgagcctgc 30

<210> 138

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 138

gcaggctcag catgtccagc agtgcacggg 30

Claims

1.2-O-硫酸化酶突变体，其在以下的任何一种氨基酸序列中具有由碱性氨基酸残基对位置321处的亮氨酸残基的取代：

(a)SEQ ID NO:2的氨基酸序列；

具有2-O-硫酸转移活性。

2.根据权利要求1的2-O-硫酸化酶突变体，其中所述碱性氨基酸残基是精氨酸残基或赖氨酸残基。

3.生产己糖醛酸残基的2位处的羟基被硫酸化的经修饰的肝素前体(heparosan)化合物的方法，所述方法包括在存在2-O-硫酸化酶突变体的情况下将肝素前体化合物转化为己糖醛酸残基的2位处的羟基被硫酸化的经修饰的肝素前体化合物，

(a)SEQ ID NO:2的氨基酸序列；

具有2-O-硫酸转移活性。

4.根据权利要求3的方法，其中所述肝素前体化合物是N-硫酸化的肝素前体、N-硫酸化的差向异构化的肝素前体、N-硫酸化的解聚的肝素前体或N-硫酸化的差向异构化的解聚的肝素前体。

5.根据权利要求3或4的方法，其中在存在生产所述2-O-硫酸化酶突变体的经转化的微生物或其提取物的情况下，生产所述己糖醛酸残基的2位处的羟基被硫酸化的肝素前体化合物。

6.根据权利要求5的方法，其中所述经转化的微生物是属于埃希氏菌属的细菌。

7.根据权利要求6的方法，其中所述属于埃希氏菌属的细菌是大肠杆菌。

8.3-O-硫酸化酶突变体，其中在以下的任何一种氨基酸序列中：

(a’)SEQ ID NO:8的氨基酸序列；

(i)位置77处的甲硫氨酸残基由赖氨酸残基取代；

(ii)位置96处的色氨酸残基由苯丙氨酸残基取代；

(iii)位置125处的脯氨酸残基由丙氨酸残基取代；

(iv)位置164处的缬氨酸残基由异亮氨酸残基取代；

(v)位置167处的天冬酰胺残基由组氨酸残基取代；

(vi)位置171处的赖氨酸残基由谷氨酰胺残基取代；或

(vii)位置259处的酪氨酸残基由苯丙氨酸残基取代；并且

其中所述3-O-硫酸化酶突变体具有3-O-硫酸转移活性。

9.生产α-D-葡糖胺残基的3位处的羟基被硫酸化的经修饰的肝素前体化合物的方法，所述方法包括在存在3-O-硫酸化酶突变体的情况下将肝素前体化合物转化为α-D-葡糖胺残基的3位处的羟基被硫酸化的经修饰的肝素前体化合物，

(a’)SEQ ID NO:8的氨基酸序列；

(i)位置77处的甲硫氨酸残基由赖氨酸残基取代；

(ii)位置96处的色氨酸残基由苯丙氨酸残基取代；

(iii)位置125处的脯氨酸残基由丙氨酸残基取代；

(iv)位置164处的缬氨酸残基由异亮氨酸残基取代；

(v)位置167处的天冬酰胺残基由组氨酸残基取代；

(vi)位置171处的赖氨酸残基由谷氨酰胺残基取代；或

(vii)位置259处的酪氨酸残基由苯丙氨酸残基取代；并且

其中所述3-O-硫酸化酶突变体具有3-O-硫酸转移活性。

10.根据权利要求9的方法，其中所述肝素前体化合物是N-硫酸化的6-O-硫酸化的肝素前体、N-硫酸化的6-O-硫酸化的差向异构化的肝素前体、N-硫酸化的2-O-硫酸化的6-O-硫酸化的肝素前体、N-硫酸化的2-O-硫酸化的6-O-硫酸化的差向异构化的解聚的肝素前体、N-硫酸化的6-O-硫酸化的解聚的肝素前体、N-硫酸化的6-O-硫酸化的差向异构化的解聚的肝素前体、N-硫酸化的2-O-硫酸化的6-O-硫酸化的解聚的肝素前体或N-硫酸化的2-O-硫酸化的6-O-硫酸化的差向异构化的解聚的肝素前体。

11.根据权利要求9或10的方法，其中在存在生产所述3-O-硫酸化酶突变体的经转化的微生物或其提取物的情况下，生产所述α-D-葡糖胺残基的3位处的羟基被硫酸化的经修饰的肝素前体化合物。

12.根据权利要求11的方法，其中所述经转化的微生物是属于埃希氏菌属的细菌。

13.根据权利要求12的方法，其中所述属于埃希氏菌属的细菌是大肠杆菌。

14.生产硫酸乙酰肝素的方法，其包括对肝素前体进行处理以生产硫酸乙酰肝素，所述处理包括(1)α-D-葡糖胺残基的N-去乙酰化，(2)解聚，(3)α-D-葡糖胺残基的N-硫酸化，(4)己糖醛酸残基的C5-差向异构化，(5)己糖醛酸残基的2-O-硫酸化，(6)α-D-葡糖胺残基的6-O-硫酸化，和(7)α-D-葡糖胺残基的3-O-硫酸化，

其中：

(a)SEQ ID NO:2的氨基酸序列；

具有2-O-硫酸转移活性；或者

(a’)SEQ ID NO:8的氨基酸序列；

(i)位置77处的甲硫氨酸残基由赖氨酸残基取代；

(ii)位置96处的色氨酸残基由苯丙氨酸残基取代；

(iii)位置125处的脯氨酸残基由丙氨酸残基取代；

(iv)位置164处的缬氨酸残基由异亮氨酸残基取代；

(v)位置167处的天冬酰胺残基由组氨酸残基取代；

(vi)位置171处的赖氨酸残基由谷氨酰胺残基取代；或

(vii)位置259处的酪氨酸残基由苯丙氨酸残基取代；并且

其中所述3-O-硫酸化酶突变体具有3-O-硫酸转移活性。